Izvilkt tekstu no PDF failiem

Strādājot ar PDF vai Portable Document Format failiem, reizēm jūs varētu vēlēties iegūt visu tekstu no PDF faila . Šajā rokasgrāmatā mēs parādīsim, kā jūs varat viegli izvilkt tekstu no PDF failiem vai konvertēt PDF failus uz teksta failiem sistēmā Windows, izmantojot tiešsaistes rīkus vai bez tiem.

Vienkāršākais un ātrākais veids, kā iegūt tekstu no PDF failiem, ir izmantot bezmaksas tiešsaistes pakalpojumus. Šie tiešsaistes pakalpojumi neprasa nekādu papildu programmatūru, kas nozīmē, ka jūs varat veikt savu darbu bez nepieciešamības instalēt datorā papildu programmatūru.

Ja tālāk minētie tiešsaistes pakalpojumi nesniedz vēlamos rezultātus vai vēlaties iegūt tekstu no sensitīvas, kuru nevēlaties augšupielādēt tālvadības serverī, varat pārbaudīt bezmaksas Windows programmatūru, kas minēta 3. līdz 5. metodē. mūsu 6 veidi, kā saspiest PDF failu rokasgrāmatu.

1. metode no 6

ExtractPDF

ExtractPDF ir bezmaksas tiešsaistes pakalpojums, lai pilnībā aizpildītu tekstu un attēlus no PDF failiem. Pakalpojums piedāvā viegli saprotamu izkārtojumu. Atverot ExtractPDF lapu savā tīmekļa pārlūkprogrammā, noklikšķiniet uz pogas Pārlūkot, lai atlasītu PDF failu, noklikšķiniet uz pogas Augšupielādēt, lai augšupielādētu izvēlēto failu uz ExtractPDF serveri un sāktu iegūšanu.

Kad darbs ir paveikts, jūs redzēsiet iespējas lejupielādēt tekstu kontekstu, fontus un attēlus no augšupielādētā PDF faila. Lai lejupielādētu iegūto tekstu kā .txt failu (lai atvērtu Notepad vai Word), pārslēdzieties uz cilni Teksts un pēc tam noklikšķiniet uz Lejupielādēt rezultātu kā faila pogu.

Kā redzams iepriekš attēlā, pakalpojums neatbalsta failus, kas lielāki par 12 MB. Šim ierobežojumam nevajadzētu būt programmai, jo lielākā daļa PDF failu būs mazāk nekā 12 MB.

Pārbaudes laikā mēs pamanījām, ka dažiem PDF failiem pakalpojums nedod vēlamo rezultātu. Ja jums rodas kādas problēmas ar šo pakalpojumu, pārbaudiet nākamo.

2. metode no 6

Tiešsaistes OCR

Tiešsaistes OCR ir tiešsaistes rīks, kas palīdz iegūt tekstu no PDF failiem, kas ir mazāki par 5 MB. Pakalpojums pārvērš PDF failus rediģējamos Microsoft Word (.docx) vai teksta (.txt) failos.

3. metode no 6

STDU skatītājs

Būtībā STDU Viewer ir bezmaksas programmatūra, kas paredzēta, lai atvērtu un apskatītu vairākus failu formātus. Bez tam STDU Viewer bezmaksas versija atbalsta teksta satura eksportēšanu no PDF failiem.

Lai eksportētu PDF faila saturu, atveriet PDF failu ar STDU skatītāju, noklikšķiniet uz izvēlnes Fails, uz Eksportēt, uz Teksts, izvēlieties vietu, kur saglabāt jauno teksta failu, un pēc tam noklikšķiniet uz pogas Labi.

Eksporta opcija ļauj izvilkt tekstu no vienas, vairākām vai visām lapām. STDU Viewer lejupielādes lielums ir mazāks par 3 MB. STDU Viewer bezmaksas versija ir paredzēta tikai personiskai un nekomerciālai lietošanai.

4. metode no 6

PDF2Text Pilot

PDF2Text Pilot ir bezmaksas programmatūra, lai Windows konvertētu PDF failus uz teksta failiem ar peles klikšķi. Pēc programmatūras instalēšanas un palaišanas jums vienkārši jāizvēlas PDF fails (-i), ko vēlaties redzēt kā teksta failus, un pēc tam noklikšķiniet uz pogas Konvertēt. Jūsu konvertētie faili būs gatavi pēc pāris sekundēm.

PDF2Text Pilot stiprums ir tā vienkāršais interfeiss un spēja pārvērst vairākus PDF failus uzreiz.

5. metode no 6

PDF teksta nosūcējs

PDF teksta nosūcējs ir vēl viena Windows programmatūra, kas paredzēta, lai iegūtu tekstu no PDF failiem. Programmatūra ir pilnīgi bezmaksas gan personīgai, gan komerciālai lietošanai.

Pēc A-PDF teksta nosūcēja instalēšanas (uzstādītāja lielums ir mazāks par 1 MB), palaidiet A-PDF teksta nosūcēju. Noklikšķiniet uz pogas Atvērt, lai atvērtu PDF failu, un pēc tam noklikšķiniet uz pogas Ekstrakts, lai sāktu izvilkt tekstu no tā.

6. metode no 6

Gaaiho PDF lasītājs

Gaaiho PDF Reader ir lieliska programmatūra, kas paredzēta, lai risinātu PDF failus. Šī bezmaksas programmatūra piedāvā daudzas funkcijas, kuras nevar atrast citu bezmaksas PDF lasītāju programmatūru. Viena no iezīmēm ir spēja viegli izvilkt tekstu no PDF failiem.

Lai PDF failu saglabātu kā teksta failu, pēc PDF faila atvēršanas Gaaiho Reader noklikšķiniet uz izvēlnes Fails, noklikšķiniet uz Saglabāt kā un pēc tam nolaižamajā izvēlnē blakus Saglabāt kā tipu izvēlieties PDF uz Teksts.

Ko jūs domājat par šiem instrumentiem? Vai jūs zināt par labāku bezmaksas rīku vienam un tam pašam darbam? Informējiet mūs komentāros.