OCR (Optical Character Recognition)



optiline tekstituvastus, optiline tärgituvastus Paberile trükitud teksti pildistamisel skänneri või digikaamera abil salvestatakse see arvutisse pildina. Tekstituvastusprogrammid suudavad pildina salvestatud tähemärke ära tunda ja neid ASCII koodiks teisendada. Selliselt kodeeritud tekst võtab mälus palju vähem ruumi kui pildina salvestatud tekst ning seda saab tekstitöötlusprogrammide abil toimetada.

On olemas ka selliseid tekstituvastusprogramme, mis suudavad lugeda käsitsi kirjutatud teksti. Tekstituvastusprogrammid töötavad hästi arvuti või kirjutusmasinaga kirjutatud tekstide puhul, kuigi ka siin esineb vigu, kui dokument on vana ja määritud või tähemärgid on liiga väikesed. Käsitsi kirjutatud tähemärkide äratundmine on palju keerulisem ja vigu esineb siin rohkem. Igal juhul tuleb tekstituvastusprogrammi abil saadud tekst üle kontrollida