OCR - IT

OCR, 'optisk tegngjenkjenning', metode der et datasystem leser tegn på papir og gjør dem om til digitalt lagret tekst, altså ikke bare et bilde av arket, men selve teksten som tegnene formidler. Ved hjelp av OCR kan papirdokumenter konverteres til digitale dokumenter, med alt det innebærer av søkbarhet og plassbesparelser.

Faktaboks

Også kjent som
fork. for eng. Optical Character Recognition

Tidlige OCR-systemer kunne bare lese tegn utformet etter spesielle standarder. Siden tidlig i 1990-årene har det vært levert OCR-programvare for vanlige PC-er som kan lese vanlig avis- og bokskrift. Slik programvare leveres ofte sammen med skannere.

OCR brukes også i forbrukerutstyr, for eksempel digitale ordbøker formet som penner der man fører tuppen over ordet man ikke forstår, og får oversettelsen eller definisjonen på en liten skjerm på pennen. I skjemabehandling finnes ordninger som kombinerer spesielt og nesten usynlig merket papir med en tilpasset penn. Her registrerer et OCR-program i pennen ordene og tallene mens de skrives, samtidig med at pennen bruker den svakt synlige merkingen på papiret til å registrere hvilket skjema, hvilken side på skjemaet og hvilket felt som fylles ut. Den strukturerte informasjonen som lagres i pennen overføres til datasystemet som skal behandle den, for eksempel over en trådløs forbindelse via mobiltelefon.

Jf. optisk lesing.

Kommentarer

Kommentaren din publiseres her. Fagansvarlig eller redaktør svarer når de kan.

Du må være logget inn for å kommentere.

eller registrer deg