4 bezplatné online nástroje OCR podrobené konečnému testu

4 bezplatné online nástroje OCR podrobené konečnému testu

Pokud chcete převést jakýkoli tištěný text na digitální text, který můžete kopírovat, vkládat, upravovat a vyhledávat, budete muset použít skenery OCR (Optical Character Recognition).





Pokud se rozhodnete naskenovat nebo vyfotit dokument, bude dokument uložen ve formátu JPEG nebo PDF. OCR software pak dokáže rozpoznat písmena a čísla v těchto dokumentech a převést je do prohledávatelného PDF nebo do souboru, který můžete upravovat v programech, jako je Microsoft Word.





Problém je v tom, že některé skenery OCR fungují mnohem lépe než jiné, přičemž ty nejlepší jsou na peněženku dost těžké.





Například Omnipage18 stojí 150 USD, ale je zvláště dobrý v rozpoznávání různých jazyků. Adobe Acrobat Pro DC stojí 400 dolarů, ale má neuvěřitelnou přesnost. ABBYY FineReader stojí 150 $, ale je fantastický při převodu dokumentů, jako jsou časopisy a brožury, na prohledávatelný text. Online nabídku společnosti ABBYY budeme testovat později v tomto článku.

Pokud však hledáte bezplatné alternativy, můžete stažení a používat v systému Windows nebo OS X, měli byste vyzkoušet tyto nástroje OCR. Ale pokud byste raději použili bezplatný online Nástroj OCR, pokračujte ve čtení, protože jsme vyzkoušeli několik nejlepších, s výsledky níže.



Test

Zdá se, že většina lidí nyní používá pro skenování své smartphony, rozhodl jsem se použít Skenovatelná aplikace Evernote (Zdarma pro iOS a Android). Naskenoval jsem první stránku Richarda Dawkina Horolezecká hora nepravděpodobná , abychom zjistili, jakých výsledků bychom mohli dosáhnout při velmi základním formátování. Také jsem naskenoval stránku Tima Ferrisse Čtyřhodinový kuchař vyzkoušet skenery s trochu komplikovanějším formátováním. Každý z těchto souborů jsem uložil jako PDF.

Tyto dokumenty byly poté spuštěny prostřednictvím některých údajně nejlepších online nástrojů OCR, aby se zjistilo, jak dobře si vedly.





Online OCR zdarma [již není k dispozici]

Naštěstí není k používání online OCR zdarma nutná žádná registrace. A dvojnásobně na mě zapůsobilo, když jsem viděl jejich požadavek zachovat formátování a rozvržení mého dokumentu.

Tato stránka tvrdí, že může jako vstup podporovat formáty PDF, GIF, BMP, JPEG, TIFF a PNG. Výstupy mohou být buď DOC, textový dokument PDF, RTF a TXT. Bohužel se mi nepodařilo zjistit, zda mají limit velikosti souboru.





Základní dokument do PDF

Převedeno naprosto perfektně. Není toho moc co říct! Jedeme do a velmi dobrý začátek.

Základní dokument do DOC

Zdá se, že skutečná slova se bezchybně převedla, kromě „ount“ z „Mount Rushmore“ se jaksi stalo AWOL. Formátování je však jiný příběh. Mnoho čárek bylo nahrazeno podtržítky a do bodů v celém dokumentu byly vloženy náhodné mezery. Když později uvidíte, jak si v tomto testu vedl prémiový software, není to špatné úsilí vůbec .

Složitý dokument do PDF

Složitý dokument do DOC

Převod tentokrát trval pouze 10 sekund, přičemž text byl znovu převeden s přesností přibližně 95%. Došlo k podivným problémům s mezerami a software měl potíže s převodem písma v pravém horním rohu dokumentu a sem tam vynechal několik znaků.

Výrok

i2OCR

i2OCR uvádí několik působivých tvrzení. Tento nástroj rozpozná více než 60 jazyků, zvládne rozložení ve více sloupcích (odstraněním formátování), nemá žádná omezení velikosti souborů, dokáže převádět nahrané soubory a z adres URL. A k používání tohoto nástroje se nemusíte ani registrovat.

Tato služba funguje tak, že jednoduše extrahuje text z vašeho obrázku a poté vytvoří neformátovaný text. Chyby v zobrazení vedle sebe, před kopírováním textu do jiných programů nebo před stažením ve formátu DOC, PDF nebo HTML, můžete rychle opravit.

Poznámka: Když jsem se pokoušel nahrát své dokumenty PDF, tyto byly odmítnuty i2OCR, takže jsem je potřeboval převést do formátu JPEG (pořízením jejich snímku obrazovky a odesláním souborů).

Základní dokument pro prostý text

Složitý dokument na prostý text

Většina textu byla převedena bez příliš mnoha chyb, kromě názvu a receptu vpravo nahoře, který byl pro tento nástroj nečitelný. Způsob, jakým byly sloupce převedeny na prostý text, nebyl zdaleka ideální. Pokud chcete, aby tato konverze fungovala, bylo by zapotřebí hodně času na uspořádání řádků do souvislých vět.

Výrok

Online OCR

Online OCR v současné době podporuje 46 různých jazyků a dokáže převádět PDF, JPG, BMP, TIFF a GIF do formátu Word, Excel nebo prostý text. Stránka tvrdí, že „převedené dokumenty vypadají přesně jako originál - tabulky, sloupce a grafika“.

Verze, kterou můžete použít bez registrace, vám umožňuje převést až 15 obrázků za hodinu (limit 5 MB). Pokud se zaregistrujete k účtu, můžete k tomuto limitu zakoupit další stránky a současně můžete převádět vícestránkové dokumenty a archivy ZIP.

Základní dokument do DOC

Základní dokument byl bez římských číslic bezchybně převeden nebýt vyzvednut. Jak stránka slibovala, formátování bylo přesně takové, jaké bylo v knize. Sláva tomuto nástroji.

Složitý dokument do DOC

Poté, co jsem byl zklamán předchozími nástroji OCR při převodu složitého dokumentu, na mě Online OCR ohromně zapůsobil. Rozložení bylo téměř dokonalé, jak vidíte výše. Opět však nebyl recept příliš dobře vychytán, ale jakékoli další drobné chyby byly zanedbatelné.

Výrok

Naprosto fantastické výsledky z online OCR. Jediné mínus vidím v tom, že neexistuje způsob, jak stahovat převedené dokumenty ve formátu PDF, protože uvedené výstupní formáty zahrnují pouze DOCX, XLSX a TXT.

ABBYY FineReader Online (10stránková zkušební verze)

Jak již bylo zmíněno dříve, ABBYY je jedním z lídrů na trhu softwaru OCR, jehož plný program ke stažení stojí přibližně 150 USD. Nabízejí a 10stránková bezplatná zkušební verze pro jejich online nástroj (nutná registrace). Za předplatné 5 $ vám jejich online nástroj umožní převést 200 stránek každý měsíc.

Přijaté soubory mohou mít až 100 MB v libovolném z těchto formátů: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP a PNG. ABBYY také rozpoznává téměř 200 jazyků. Obzvláště působivé jsou výstupy s možností volby mezi DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 a EPUB.

Během zkušební doby si můžete dokonce vyzkoušet několik funkcí BETA. První je možnost přeložit dokument do jiného jazyka. Druhým je export převedeného dokumentu do účtu cloudového úložiště, ať už jde o Dropbox, Disk Google, Evernote, Microsoft OneDrive nebo Box.

Základní dokument do DOCX

Složitý dokument do DOCX

Po převedení bylo v textu dokumentu jen velmi málo chyb (kromě toho, že se OCR znovu potýká s písmem tohoto receptu!), Ale formátování zanechalo mnoho požadavků.

Tyto tři sloupce nějak zabraly dvě stránky, přičemž střední sloupec pouze se objeví na druhé stránce. Pokud bys vlastně chtěl dělat cokoli s tímto převedeným dokumentem, nakonec byste si vytrhali vlasy.

Základní dokument do PDF

Složitý dokument do PDF

Výrok

Konečný výsledek

Pokud jako většina lidí hledáte pouze naskenování několika článků z časopisu a některých účtů za domácnost, nebudete muset tyto dokumenty upravovat. Přímý převod do formátu PDF pro vás bude proto vhodný, protože v těchto dokumentech budete stále moci vyhledávat. Z tohoto důvodu byl Free Online OCR rozhodně nejlepší bezplatný nástroj, který jsme testovali. To je řečeno, pokud jste ochotni platit 5 $ měsíčně za téměř dokonalost, FineReader online od ABBYY bylo o něco přesnější.

Pokud jde o převod dokumentů do DOC, nepodařilo se nám najít žádné dokonalé řešení, ale zdaleka nejlepší výsledky byly z Online OCR . Konverze nebyla dokonalá, ale integrita formátování byla do značné míry zachována a chyby byly zanedbatelné. Když tyto výsledky porovnáme s „prémiovou“ nabídkou od společnosti ABBYY, nemůžete si pomoci, ale budete ohromně ohromeni.

Do tohoto příspěvku jsme nezahrnuli možnosti OCR Disku Google; trochu pro všudypřítomnost Google, ale spíše pro skutečnost, že jsme chtěli vyzkoušet několik dalších bezplatných online služeb OCR.

Ještě k vám: Které další online nástroje OCR byste doporučili našim čtenářům? A které jste vyzkoušeli, že už nikdy nepoužijete?

Podíl Podíl tweet E-mailem Průvodce pro začátečníky k animované řeči

Animační řeč může být výzva. Pokud jste připraveni začít s přidáváním dialogu do svého projektu, proces za vás rozdělíme.

tipy a triky pro úkryt proti spadnutí
Číst dále Související témata
  • Internet
  • Produktivita
  • Převod souboru
  • OCR
O autorovi Rob Nightingale(272 publikovaných článků)

Rob Nightingale vystudoval filozofii na University of York, UK. Pracoval jako manažer sociálních médií a konzultant více než pět let a pořádal workshopy v několika zemích. Poslední dva roky je Rob také technologickým spisovatelem a je manažerem sociálních médií MakeUseOf a redaktorem zpravodaje. Obvykle ho najdete, když cestuje po světě, učí se stříhat video a experimentuje s fotografií.

Více od Roba Nightingala

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné elektronické knihy a exkluzivní nabídky!

Kliknutím sem se přihlásíte k odběru