OCR, 'optisk tegngjenkjenning', metode der et datasystem leser tegn på papir og gjør dem om til digitalt lagret tekst, altså ikke bare et bilde av arket, men selve teksten som tegnene formidler. Ved hjelp av OCR kan papirdokumenter konverteres til digitale dokumenter, med alt det innebærer av søkbarhet og plassbesparelser.

Tidlige OCR-systemer kunne bare lese tegn utformet etter spesielle standarder. Siden tidlig i 1990-årene har det vært levert OCR-programvare for vanlige PC-er som kan lese vanlig avis- og bokskrift. Slik programvare leveres ofte sammen med skannere.

OCR brukes også i forbrukerutstyr, for eksempel digitale ordbøker formet som penner der man fører tuppen over ordet man ikke forstår, og får oversettelsen eller definisjonen på en liten skjerm på pennen. I skjemabehandling finnes ordninger som kombinerer spesielt og nesten usynlig merket papir med en tilpasset penn. Her registrerer et OCR-program i pennen ordene og tallene mens de skrives, samtidig med at pennen bruker den svakt synlige merkingen på papiret til å registrere hvilket skjema, hvilken side på skjemaet og hvilket felt som fylles ut. Den strukturerte informasjonen som lagres i pennen overføres til datasystemet som skal behandle den, for eksempel over en trådløs forbindelse via mobiltelefon.

Jf. optisk lesing.

Foreslå endringer i tekst

Foreslå bilder til artikkelen

Kommentarer

Har du spørsmål om eller kommentarer til artikkelen?

Kommentaren din vil bli publisert under artikkelen, og fagansvarlig eller redaktør vil svare når de har mulighet.

Du må være logget inn for å kommentere.