Ar turite PDF dokumentą, iš kurio norėtumėte ištraukti visą tekstą? O kaip su nuskaityto dokumento, kurį norite konvertuoti į redaguojamą tekstą, vaizdo failais? Tai yra dažniausios problemos, kurias mačiau darbo vietoje dirbdamas su failais.

Šiame straipsnyje papasakosiu apie kelis skirtingus būdus, kaip galite bandyti išgauti tekstą iš PDF rinkmenos ar vaizdo. Ištraukimo rezultatai skirsis priklausomai nuo teksto tipo ir kokybės PDF rinkmenoje ar paveikslėlyje. Rezultatai taip pat skirsis atsižvelgiant į naudojamą įrankį, todėl geriau išbandyti kuo daugiau iš žemiau pateiktų variantų, kad gautumėte geriausius rezultatus.

Ištraukite tekstą iš paveikslėlio ar PDF

Paprasčiausias ir greičiausias būdas pradėti yra išbandyti internetinę PDF teksto ištraukimo paslaugą. Paprastai jie yra nemokami ir gali suteikti jums būtent tai, ko ieškote, nieko neįrengdami savo kompiuteryje. Štai du, kuriuos panaudojau nuo labai gerų iki puikių rezultatų:

„ExtractPDF“

ekstraktaspdf

„ExtractPDF“ yra nemokama priemonė vaizdams, tekstui ir šriftams paimti iš PDF failo. Vienintelis apribojimas yra tai, kad maksimalus PDF failo dydis yra 10 MB. Tai šiek tiek maža; taigi, jei turite didesnį failą, išbandykite kitus toliau pateiktus metodus. Pasirinkite failą ir spustelėkite mygtuką Siųsti failą. Rezultatai paprastai būna labai greiti ir jūs turėtumėte pamatyti teksto peržiūrą, kai spustelėsite skirtuką Tekstas.

atsisiųsti tekstą

Tai taip pat puikus privalumas, kad iš PDF failų taip pat ištraukiami vaizdai, tik tuo atveju, jei jums jų reikia! Apskritai internetinis įrankis veikia puikiai, tačiau aš turėjau keletą PDF dokumentų, kurie man pateikia juokingą rezultatą. Tekstas išgaunamas gerai, bet dėl ​​tam tikrų priežasčių tekste trūks eilutės po kiekvieno žodžio! Ne didžiulė trumpo PDF failo problema, bet tikrai failai, kuriuose yra daug teksto. Jei taip atsitiks jums, išbandykite kitą įrankį.

Internetinis OCR

Internetinė OCR paprastai buvo naudojama tiems dokumentams, kurie nebuvo tinkamai konvertuojami naudojant „ExtractPDF“, todėl verta išbandyti abi paslaugas, kad pamatytumėte, kurios iš jų suteikia geresnį išvestį. Internetinis OCR taip pat turi keletą gražesnių funkcijų, kurios gali būti naudingos visiems, turintiems didelį PDF failą, kuriam reikia konvertuoti tik kelių puslapių tekstą, o ne visą dokumentą.

Pirmas dalykas, kurį norite padaryti, tai eiti į priekį ir susikurti nemokamą sąskaitą. Tai šiek tiek erzina, bet jei nesukursite nemokamos paskyros, tai tik iš dalies konvertuos jūsų PDF, o ne visą dokumentą. Be to, užuot tik galėję įkelti tik 5 MB dokumentą, galite įkelti iki 100 MB kiekviename faile su paskyra.

internetinis okr

Pirmiausia pasirinkite kalbą ir tada pasirinkite norimus konvertuojamo failo išvesties formatus. Turite keletą variantų ir, jei norite, galite pasirinkti daugiau nei vieną. Skiltyje Kelių puslapių dokumentas galite pasirinkti Puslapių numeriai ir pasirinkti tik tuos puslapius, kuriuos norite konvertuoti. Tada pasirenkate failą ir spustelėkite Konvertuoti!

internetiniai ocr dokumentai

Po konvertavimo būsite nukreipti į skyrių Dokumentai (jei esate prisijungę), kur galite pamatyti, kiek liko laisvų puslapių, ir nuorodas atsisiųsti konvertuotus failus. Panašu, kad per dieną nemokamai turite tik 25 puslapius, taigi, jei jums reikia daugiau, turėsite arba šiek tiek palaukti, arba nusipirkti daugiau puslapių.

Internetinis OCR atliko puikų darbą konvertuodamas mano PDF failus, nes sugebėjo išlaikyti faktinį teksto išdėstymą. Atlikdamas testą pasirinkau „Word doc“, kuriame buvo naudojamos kulkos, skirtingi šriftų dydžiai ir pan., Ir konvertavau į PDF. Tada aš panaudojau internetinį OCR, kad galėčiau jį konvertuoti į „Word“ formatą ir jis maždaug 95% sutapo su originalu. Man tai gana įspūdinga.

Be to, jei norite konvertuoti vaizdą į tekstą, tada internetinis OCR tai gali padaryti taip pat lengvai, kaip ištraukdamas tekstą iš PDF failų.

Nemokamas internetinis OCR

Kadangi buvo kalbama apie atvaizdą teksto OCR, leiskite paminėti dar vieną gerą svetainę, kuri tikrai gerai veikia vaizdus. Nemokamas internetinis OCR buvo labai geras ir tikslus, kai buvo paimamas tekstas iš mano bandomųjų vaizdų. Aš padariau keletą nuotraukų iš „iPhone“ puslapių iš knygų, brošiūrų ir kt., Nustebau, kaip gerai pavyko konvertuoti tekstą.

nemokama internetinė ocr

Pasirinkite failą ir spustelėkite mygtuką Įkelti. Kitame ekrane yra keletas parinkčių ir vaizdo peržiūra. Galite apkarpyti, jei nenorite viso vaizdo OCR. Tada tiesiog spustelėkite mygtuką OCR ir konvertuotas tekstas pasirodys po vaizdo peržiūra. Jis taip pat neturi jokių apribojimų, o tai tikrai malonu.

Be internetinių paslaugų, yra ir du nemokamos programinės įrangos PDF keitikliai, kuriuos norėčiau paminėti tuo atveju, jei jums reikia programinės įrangos, paleistos vietoje jūsų kompiuterio, kad būtų galima atlikti konversijas. Naudodamiesi internetinėmis paslaugomis jums visada reikės interneto ryšio ir tai gali būti neįmanoma visiems. Tačiau pastebėjau, kad nemokamų programų konversijų kokybė buvo žymiai prastesnė nei svetainių.

PDF teksto ištraukiklis

PDF teksto ištraukiklis yra nemokama programa, kuri gana gerai išgauna tekstą iš PDF failų. Atsisiuntę ir įdiegę, spustelėkite mygtuką Atidaryti, kad pasirinktumėte savo PDF failą. Tada spustelėkite Ištraukti tekstą, kad pradėtumėte procesą.

apdf ekstraktorius

Ji paprašys jūsų vietos teksto išvesties failui saugoti ir tada pradės išgauti. Taip pat galite spustelėti mygtuką Parinktis, kuris leidžia pasirinkti tik tam tikrus ištraukiamus puslapius ir ištraukimo tipą. Antrasis variantas yra įdomus, nes jis ištraukia tekstą skirtingais išdėstymais ir verta pabandyti visus tris pamatyti, kuris iš jų suteikia geriausią išvestį.

PDF2Text Pilot

„PDF2Text Pilot“ tinkamai atlieka tekstą. Jis neturi jokių galimybių; jūs tiesiog pridedate failus ar aplankus, konvertuokite ir tikimės geriausio. Tai gerai veikė kai kuriuose PDF rinkmenose, tačiau daugumai jų iškilo daugybė klausimų.

pdf2text

Tiesiog spustelėkite Pridėti failus, tada spustelėkite Konvertuoti. Baigę konvertavimą spustelėkite mygtuką Naršyti, kad atidarytumėte failą. Naudodami šią programą ridos rodikliai skirsis, todėl nesitikėkite daug.

Taip pat verta paminėti, kad jei esate verslo aplinkoje arba galite susitvarkyti „Adobe Acrobat“ kopiją iš darbo, tuomet galite pasiekti daug geresnių rezultatų. Akivaizdu, kad „Acrobat“ nėra nemokama, tačiau joje yra parinkčių konvertuoti PDF į „Word“, „Excel“ ir HTML formatus. Tai taip pat daro geriausią darbą išlaikant originalaus dokumento struktūrą ir konvertuojant sudėtingą tekstą.