Ar turite PDF dokumentą ar paveikslėlį, kurį norėtumėte konvertuoti į tekstą? Neseniai man kažkas paštu atsiuntė dokumentą, kurį turėjau redaguoti ir išsiųsti su pataisymais. Asmuo negalėjo rasti skaitmeninės kopijos, todėl man buvo pavesta visą šį tekstą perkelti į skaitmeninį formatą.

Nebegalėjau valandų valandas praleisti įrašant viską atgal, todėl galiausiai padariau gražų aukštos kokybės dokumento vaizdą ir perdegiau daugybę internetinių OCR paslaugų, kad pamačiau, kuris iš jų man duos geriausią. rezultatai.

Šiame straipsnyje apžvelgsiu kelias mano mėgstamas OCR svetaines, kurios yra nemokamos. Verta paminėti, kad dauguma šių svetainių teikia pagrindinę nemokamą paslaugą ir tada turi mokamų variantų, jei norite papildomų funkcijų, tokių kaip didesni vaizdai, kelių puslapių PDF dokumentai, skirtingos įvesties kalbos ir kt.

Taip pat pravartu iš anksto žinoti, kad dauguma šių paslaugų nesugebės suderinti jūsų originalaus dokumento formato. Tai daugiausia skirta tekstui išgauti ir viskas. Jei jums reikia, kad viskas būtų tam tikro išdėstymo ar formato, turėsite tai padaryti rankiniu būdu, kai gausite visą tekstą iš OCR.

Be to, geriausius rezultatus gaunant tekstą gaus dokumentai, turintys 200–400 DPI skiriamąją gebą. Jei turite žemą DPI vaizdą, rezultatai nebus tokie geri.

Galiausiai buvo daugybė mano išbandytų svetainių, kurios tiesiog neveikė. Jei „Google“ naudojate nemokamą OCR, pamatysite daugybę svetainių, tačiau kelios iš 10 geriausių rezultatų svetainių net nepabaigė konversijos. Kai kurie praleis laiką, kiti padarys klaidų, o kiti tiesiog įstrigo „konvertuojančio“ puslapyje, todėl net nesivarginau minėti tų svetainių.

Kiekvienoje svetainėje aš išbandžiau du dokumentus, norėdamas pamatyti, koks bus išvesties efektyvumas. Savo bandymams aš tiesiog panaudojau savo „iPhone 5S“, norėdamas nufotografuoti abu dokumentus, tada įkeliau juos tiesiai į svetaines, kad būtų galima atlikti konvertavimą.

Jei norite pamatyti, kaip atrodė vaizdai, kuriuos naudojau savo testui, juos pridėjau čia: Test1 ir Test2. Atminkite, kad tai nėra visos raiškos vaizdų, padarytų iš telefono, versijos. Įkeldamas į svetaines naudojau visos skiriamosios gebos vaizdą.

OnlineOCR

„OnlineOCR.net“ yra švari ir paprasta svetainė, kurios testas davė labai gerų rezultatų. Pagrindinis dalykas, kuris man patinka, yra tas, kad jame nėra daugybės skelbimų visur, kas dažniausiai nutinka tokiose nišinėse paslaugų svetainėse.

nemokama internetinė ocr

Norėdami pradėti, pasirinkite failą ir palaukite, kol jis baigs nusiųsti. Maksimalus šios svetainės įkėlimo dydis yra 100 MB. Jei prisiregistruojate į nemokamą sąskaitą, gausite keletą papildomų funkcijų, tokių kaip didesnis įkėlimo dydis, kelių puslapių PDF failai, skirtingos įvesties kalbos, daugiau konversijų per valandą ir t.

Tada pasirinkite įvesties kalbą ir išvesties formatą. Galite pasirinkti iš „Word“, „Excel“ arba paprasto teksto. Spustelėkite mygtuką Konvertuoti ir pamatysite langelio apačioje pateiktą tekstą kartu su atsisiuntimo nuoroda.

ocr išvestis

Jei norite tik teksto, tiesiog nukopijuokite ir įklijuokite jį iš dėžutės. Tačiau aš siūlau atsisiųsti „Word“ dokumentą, nes tai daro stebėtinai didelį darbą išlaikant originalaus dokumento išdėstymą.

Pvz., Atidaręs „Word“ dokumentą savo antrajam bandymui, nustebau, kad dokumente, kaip ir paveikslėlyje, yra lentelė su trimis stulpeliais.

internetinė ocr išvestis

Iš visų svetainių ši buvo geriausia iki šiol. Visiškai verta registruotis, jei reikia atlikti daug konversijų.

Taip pat norėčiau pateikti nuorodą į kiekvienos tarnybos sukurtus išvesties failus, kad galėtumėte pamatyti rezultatus patys. Čia pateikiami „OnlineOCR“ rezultatai: „Test1 Doc“ ir „Test2 Doc“.

Atminkite, kad atidarę šiuos „Word“ dokumentus savo kompiuteryje, „Word“ gausite pranešimą, kad jis yra iš interneto ir redagavimas yra išjungtas. Tai visiškai gerai, nes „Word“ nepasitiki dokumentais iš interneto ir jums tikrai nereikia įjungti redagavimo, jei norite tik peržiūrėti dokumentą.

„i2OCR“

Kita svetainė, kuri davė gana gerų rezultatų, buvo „i2OCR“. Procesas yra labai panašus: pasirinkite kalbą, failą ir paspauskite Extract Text.

i2ocr

Čia turėsite palaukti minutę ar dvi, nes ši svetainė užtrunka šiek tiek ilgiau. Be to, atlikdami 2 veiksmą, įsitikinkite, kad jūsų vaizdas peržiūroje rodomas dešine puse į viršų, kitaip išvesties metu gausite daugybę įžūlumo. Dėl tam tikrų priežasčių mano „iPhone“ vaizdai buvo rodomi portreto režimu kompiuteryje, bet peizažas, kai įkeliau į šią svetainę.

i2ocr išvestis

Turėjau rankiniu būdu atverti vaizdą nuotraukų redagavimo programoje, pasukti jį 90 laipsnių kampu, tada pasukti atgal į portretą ir vėl išsaugoti. Baigę slinkite žemyn ir parodysite teksto peržiūrą kartu su atsisiuntimo mygtuku.

Ši svetainė gana gerai susidorojo su pirmojo bandymo išvestimi, tačiau nepadarė taip gerai su antruoju bandymu, kuriame buvo stulpelio išdėstymas. Čia pateikiami „i2OCR“ rezultatai: „Test1 Doc“ ir „Test2 Doc“.

„FreeOCR“

„Free-OCR.com“ paims jūsų vaizdus ir pavers juos paprastu tekstu. Jis neturi galimybės eksportuoti į „Word“ formatą. Pasirinkite failą, pasirinkite kalbą ir spustelėkite Pradėti.

Svetainė yra greita, o rezultatus gausite gana greitai. Norėdami atsisiųsti teksto failą į savo kompiuterį, tiesiog spustelėkite nuorodą.

freeocr

Kaip ir toliau paminėtame „NewOCR“, šioje svetainėje rašomos didžiosios raidės dokumente. Net neįsivaizduoju, kodėl ji tai darytų, bet dėl ​​tam tikrų keistų priežasčių ši svetainė ir NewOCR padarė tai. Tai nėra didelis dalykas, norint tai pakeisti, tačiau tai varginantis procesas, kurio tikrai neturėtumėte daryti.

Čia yra „FreeOCR“ rezultatai: „Test1 Doc“ ir „Test2 Doc“.

„ABBYY FineReader Online“

Norėdami naudotis „FineReader Online“, turite prisiregistruoti, kad gautumėte 15 dienų nemokamą OCR bandymą iki 10 puslapių. Jei jums tereikia atlikti vienkartinį OCR už porą puslapių, galite naudoti šią paslaugą. Po registracijos įsitikinkite, kad spustelėjote patvirtinimo el. Laiške pateiktą patvirtinimo nuorodą.

barstytuvas internete

Spustelėkite „Atpažinti“ viršuje, tada spustelėkite Įkelti, kad pasirinktumėte failą. Pasirinkite kalbą, išvesties formatą ir spustelėkite apačioje mygtuką Atpažinti. Ši svetainė turi švarią sąsają ir joje nėra jokių skelbimų.

Atliekant mano bandymus, ši svetainė sugebėjo paimti pirmojo bandomojo dokumento tekstą, tačiau tai buvo be galo milžiniška, kai atidariau „Word doc“, todėl galų gale dariau tai dar kartą ir pasirinkau paprastą tekstą kaip išvesties formatą.

Antrajam testui su stulpeliais „Word“ dokumentas buvo tuščias ir net neradau teksto. Nežinote, kas ten nutiko, bet panašu, kad jis nesugebės tvarkyti nieko, išskyrus paprastas pastraipas. Čia pateikiami „FineReader“ rezultatai: „Test1 Doc“ ir „Test2 Doc“.

NewOCR

Kita svetainė, NewOCR.com, buvo gera, tačiau ne tokia gera kaip pirmoji svetainė. Pirmiausia, tai skelbimai, bet laimei, ne viena tona. Pirmiausia pasirenkate failą, tada spustelėkite mygtuką Peržiūra.

įkelti paveikslėlį

Tada galite pasukti vaizdą ir sureguliuoti sritį, kurioje norite nuskaityti tekstą. Tai labai panašu į tai, kaip nuskaitymo procesas veikia kompiuteryje su pridedamu skaitytuvu.

ocr vaizdas

Jei dokumente yra keli stulpeliai, galite patikrinti mygtuką Puslapio išdėstymo analizė ir jis bandys padalinti tekstą į stulpelius. Spustelėkite OCR mygtuką, palaukite kelias sekundes, kol jis baigsis, tada slinkite žemyn į apačią, kai puslapis atnaujinamas.

Pirmajame bandyme jis teisingai gavo visą tekstą, bet dėl ​​tam tikrų priežasčių rašomas didžiosiomis raidėmis dokumente T! Nežinia, kodėl tai padarys, bet padarė. Antrame bandyme su įjungta puslapių analize ji gavo didžiąją dalį teksto, tačiau išdėstymas buvo visiškai išjungtas.

Čia yra „NewOCR“ rezultatai: „Test1 Doc“ ir „Test2 Doc“.

Išvada

Kaip matote, nemokama dažniausiai, deja, neduoda labai gerų rezultatų. Pirma paminėta svetainė yra pati geriausia iki šiol, nes ji ne tik padarė didelį darbą atpažindama visą tekstą, bet ir sugebėjo išlaikyti originalaus dokumento formatą.

Vis dėlto, jei jums tiesiog reikia teksto, dauguma aukščiau nurodytų svetainių turėtų galėti tai padaryti už jus. Jei turite klausimų, nedvejodami komentuokite. Mėgautis!