Den semantiske veven er en del av internett med koplede datasett som er lesbare for datamaskiner, ofte omtalt som en verdensvev av data. Datasettene, som er organiserte samlinger av data, består av enkle påstander som er forståelige for maskiner. Den semantiske veven består ikke bare av datasett, men også av lenker mellom disse datasettene, slik at man får en samling koplede datasett.

Koplede datasett handler ofte om å gjøre åpne data tilgjengelige for datamaskiner på en standardisert måte. Dette gjør at dataprogrammer kan samle informasjon fra ulike kilder, rekombinere og utføre handlinger på grunnlag av dataene. Eksempel kan være et søkeprogram som kan lage en liste over bøker om et emne, som er til salgs i bokhandlere i Norden, og med opplysninger om pris. Deretter kan programmet bestille den billigste.

Metadata i den semantiske veven uttrykkes i korte setninger som kalles tripler. Dette er enkle påstander som lages ut fra den åpne standarden Resource Description Framework (RDF), og består av tre elementer: subjekt, predikat og objekt.

  1. Subjektet er det utsagnet sier noe om
  2. Predikatet er en egenskap ved subjektet
  3. Objektet utfyller predikatet ved å angi hva denne egenskapen er

Eksempel: Boka «Sult» (subjekt) –  har forfatter (predikat) –  Knut Hamsun (objekt)

Predikatene velges ut fra vokabularer. For å sikre entydighet, slik at datamaskinene kan behandle informasjonen med sikkerhet, brukes URI-er (Uniform Resource Identifier) i utsagnene. Dette er korte tekststrenger som identifiserer ressurser på verdensveven, og gjør dem tilgjengelige ved hjelp av et enkelt klikk.

RDF-tripler forstås ofte som et nettverk (betegnet som en ‘graf’ innen grafteori) der subjekter og objekter er noder (punkter) som forbindes ved hjelp av predikatet, som blir grafens kant (linje). Tim Berners-Lee forestiller seg lenkede data som et ‘gigantisk globalt nettverk’, der programmer hopper fra node til node for å innhente relevante deler fra grafen etter behov. Hvert element i nettverket kan brukes som startpunkt for å finne mer informasjon. Bruken av standarder gjør det enklere å utvikle nye programmer, som kan bruke data på nye måter.

I Linked Open Data-skyen (LOD-skyen) finnes datasett fra både næringsliv og ikke-kommersielle organisasjoner.

Biblioteker over hele verden har begynt å utforske hvilke muligheter den semantiske veven gir. Svenske LIBRIS, samkatalog for svenske fag- og forskningsbibliotek, var den første bibliotekkatalog som ble publisert som lenkede data. I Norge har blant andre Nasjonalbiblioteket, Bibsys og Deichmanske bibliotek kommet med bidrag. Dette gir et viktig grunnlag for å forbedre bibliotekenes tjenester, og skape nye. Med lenkede data kan bibliotekene

  • dele sine metadata med aktører både innenfor, men også utenfor biblioteksektoren
  • gjøre egne metadata gjenfinnbare også i søkemotorer, som for eksempel Google
  • muliggjøre avanserte søk i bibliotekkataloger, og få presise resultater i retur
  • lenke synonymer, for eksempel forskjellige navneformer på personnavn, og derved bidra til mer fullstendige trefflister i bibliotekkataloger
  • gjøre metadata semantisk rikere
  • tilrettelegge for utvikling av nye dataprogrammer som kan innhente data fra ulike datasett, rekombinere og handle på grunnlag av dem

Ideen om den semantiske veven ble popularisert i en artikkel i Scientific American i 2001. Tim Berners-Lee, James Hendler og Ora Lassila skrev her om en utvidelse av internett, der innholdet var forståelig for maskiner. De så for seg at intelligente dataprogrammer kunne utføre oppgaver for mennesker: «Den viktigste evnen til den semantiske veven blir realisert når mennesker utvikler mange programmer som samler webinnhold fra ulike kilder, behandler informasjonen og utveksler resultatet med andre programmer».

  • Heath, T. & Bizer, C .(2011). Linked data: evolving the web into a global data space. San Rafael: Morgan & Claypool
  •  Wood, D., Zaidman, M., Ruth, I. & Hausenblas, M. (2014). Linked data: structured data on the web. Shelter Island: Manning

Foreslå endringer i tekst

Foreslå bilder til artikkelen

Kommentarer

Har du spørsmål om artikkelen? Skriv her, så får du svar fra fagansvarlig eller redaktør.

Du må være logget inn for å kommentere.