Tekstsøking, gjenfinning av dokumenter eller tekstavsnitt ved å søke etter ett eller flere ord i teksten. Systemer for tekstsøk har vært tilgjengelige helt siden man i 1960-årene begynte å lagre dokumenter i digitalt format. Alle tekstbehandlingssystemer gir anledning til å søke etter ord i et åpent dokument, og de fleste filsystemer gir anledning til å søke gjennom digitale mapper for å finne bestemte ord i tekstdokumentene i mappen.

Digitale dokumentarkiv har systemer for å finne igjen dokumenter etter både innhold (gjennom søk etter ord og vendinger i selve teksten), og etter metadata (strukturerte data med oversikt over tittel, forfatter, emne, publiseringsdato og så videre). Slike systemer har vært i bruk og under stadig utvikling siden 1970-årene. I Norge utviklet Statens Datasentral en løsning kalt SIFT («søking i fri tekst») som også en stund ble brukt i EU.

Fremveksten av Internett gjorde uante mengder digitale dokumenter umiddelbart tilgjengelige, og det oppstod midt i 1990-årene søketjenester som gjorde det enklere å finne frem til det man er interessert i. Google er blitt den dominerende søketjenesten, og har vokst til et stort børsnotert selskap.

Overfor bedrifter og organisasjoner er det et omfattende marked for hensiktsmessige søketjenester, både eksternt og internt mot egne medarbeidere. Søketeknologi spiller en stor rolle innen løsninger for informasjonsforvaltning, der målet er å kunne tilby rask tilgang til dokumenter og personer som besitter kunnskap man er på jakt etter. Det norske selskapet Fast Search & Transfer har vokst til å bli en betydelig internasjonal leverandør av teknologi for tekstsøking.

Teknologisk sett dreier søk i digitale dokumenter seg om å finne frem til bestemte sekvenser av sifrene 0 og 1, dog ikke slavisk, slik at man for eksempel identifiserer sideformer og bøyde former av ordet man taster inn. Noen leverandører har utviklet teknologi som er så språkuavhengig at den enkelt kan overføres fra et språk til et annet, mens andre lager løsninger for «semantisk søk», der systemet prøver å «forstå» mer av hva søkeren er ute etter. Avanserte utgaver av begge typer løsninger kan brukes til å skille mellom treff når et ord har to eller flere betydninger, og gruppere treffene etter betydning.

Foreslå endringer i tekst

Foreslå bilder til artikkelen

Kommentarer

Har du spørsmål om artikkelen? Skriv her, så får du svar fra fagansvarlig eller redaktør.

Du må være logget inn for å kommentere.