Kaip išsirinkti geriausią OCR programinę įrangą?

Optinio simbolių atpažinimo (OCR) programinė įranga yra programinė įranga, skirta teksto vaizdams paversti tikru tekstu, kurį gali skaityti kompiuteris. Paprastai jis naudojamas po to, kai vaizdas nuskaitomas į kompiuterį, nors gali būti naudojamos ir kitos įvesties formos. OCR programinė įranga geriausiai veikia su jau įvestu tekstu, kai pametate originalų spaudinį arba nuskaitydami lapus, įvestus rašomąja mašinėle. Tačiau gera programinė įranga taip pat gali išversti ranka rašytą tekstą, nors tokio tipo konvertavimo klaidų lygis yra daug didesnis.

Tikrasis OCR programinės įrangos terminas yra šiek tiek klaidinantis, nes dauguma šiuolaikinių versijų iš tikrųjų nenaudoja optinio simbolių atpažinimo, o iš tikrųjų naudoja skaitmeninį simbolių atpažinimą. Taip yra todėl, kad prieš kelerius metus laukai veiksmingai susijungė ir abu laukai priėmė patrauklesnį terminą optinis simbolių atpažinimas. OCR programinė įranga pastaraisiais metais labai pažengė į priekį, o šiuolaikinės programos žymiai geriau atpažįsta tekstą nei jų pirmtakai.

Tiesą sakant, ankstyvajai OCR programinei įrangai reikėjo išmokyti programą naudoti konkretų šriftą, kad būtų galima tiksliai įvesti. Panašiai, įvedant rašyseną, programa turėtų būti apmokyta, o tai gali užtrukti nepaprastai daug laiko. Tačiau metodai patobulėjo, o pažangesnės sistemos dabar yra norma. Šiuo metu naudojami metodai yra gana statiški, tik šiek tiek tiriama siekiant sukurti visiškai naujus metodus, o didžioji dalis tyrimų skirta tobulinti esamas procedūras, kad jos būtų dar tikslesnės. Ankstyvosios programinės įrangos versijos buvo naudojamos įvairiose programose: šeštajame dešimtmetyje didžiosios korporacijos naudojo jas kredito kortelių antspaudams nuskaityti, o Jungtinių Valstijų pašto tarnyba jas naudojo paštui rūšiuoti nuo septintojo dešimtmečio vidurio.

Prieš dešimt metų buvo sunku pasirinkti OCR programinę įrangą, nes daugelis programų tam tikroms užduotims buvo gana prastos, o kitos – pakankamai geros. Tačiau šiomis dienomis laukas iš esmės išlygintas. Bet kurios geros programinės įrangos, skirtos lotyniškiems rašmenims išversti, tikslumo rodikliai viršija 99%. Tačiau kalbant apie rašysenos arba sudėtingesnių šriftų įvedimą, OCR programinė įranga vis dar turi gana didelį diapazoną.

OCR programinės įrangos kaina taip pat labai svyruoja, dažnai atsižvelgiant į tikslumo rodiklius, kuriais ji gali pasigirti. Galima rasti nemažai nemokamos programinės įrangos, tinkamos spausdinti medžiagai įvesti, ir kai kurios, kuri gana gerai aptinka rašyseną, ypač pasimokius. Brangesni programinės įrangos rinkiniai, tokie kaip „OmniPage“ rinkinys, kurio namų versija kainuoja apie 100 USD (USD), o profesionali versija – apie 450 USD, gali pasigirti įspūdingais funkcijų rinkiniais ir apskritai didesniu sėkmės rodikliu.
Deja, vis dar nėra tokio dalyko kaip tobula OCR programinė įranga, todėl programos pasirinkimas vis tiek gali būti varginantis procesas. Net geriausioms programoms tikriausiai bus sunku rašyti ranka, o klaidų neišvengiamai atsiras net ir esant žemam lygiui. Dažniausiai pasirenkant perkamą programą reikia papildomų funkcijų: kelių kalbų palaikymas, nuskaitymo ir konvertavimo integravimas vienu paspaudimu, automatinis PDF konvertavimas ir viso žodžio atpažinimas įvairiose specializuotose srityse, pavyzdžiui, teisės ir medicinos srityse.