Dyplæring er en læreprosess som brukes innenfor maskinlæring, og som går ut på å «trene opp» såkalte «dype kunstige nevrale nettverk» (også kjent som «nevrale nettverk»). Dette er en sentral metode innen maskinlæringhvor det er et prinsipp at datamaskiner skal tilegne seg kunnskap (lære) om noe den ikke vet eller kan fra før.

Faktaboks

Etymologi
fra engelsk deep learning
Også kjent som

dyp læring, dyp strukturert læring, hierarkisk læring

På samme måte som et menneske er i stand til å resonnere seg fram til løsninger på nye problemer basert på kunnskap vi har fra før, er læremekanismen i dyplæring intuitiv. Maskinen må gjennomgå mange eksempler på det den skal forstå. Det er i hovedsak mennesker som allerede har definert hva som er «riktig svar» på de forskjellige oppgavene maskinen løser.

Dyplæring har stått for de største gjennombruddene de siste årene innen maskinlæring når det gjelder maskinell forståelse av bilder, tekst og sekvenser.

Nevrale nettverk og dyplæring

Innen kunstig intelligens brukes nevrale nettverk om en datastruktur inspirert av den menneskelige hjernen. Språkbruken er også inspirert av fysiologiske begrep. Nettverket består av prosesseringsenheter, kalt nevroner som er knyttet sammen via synapser.

Betegnelsen dyp læring brukes når det arbeides med mange «lag» av nevroner og synapser. De første nevrale nettverkene som ble utforsket, hadde bare ett lag. Et slik nevralt nettverk kan man tenke på som et hus, med en første etasje, en øvre etasje og et tak. Et dypt nettverk er mer som en skyskraper, der hver etasje tilsvarer et lag i nettverket.

Virkemåte

Hvert enkelt nevron har en veldig enkel prosesseringskraft. Nevroner påvirker andre nevroner via synapser. Hvor sterkt et nevron påvirker et annet nevron avhenger av synapsen, dette kalles den synaptiske vekten. Læreprosessen består av å bestemme disse synaptiske vektene. Dette oppnås ved å sende store datamengder gjennom det nevrale nettverket, og justere vektene underveis.

Et klassisk eksempel er å si hva som er i et bilde. La oss si at du presenterer et bilde av en hund til nettverket, samtidig som du sier til nettverket «dette er en hund». Hvis nettverket responderer at «dette er en katt», så justerer man vektene ørlite grann, slik at nettverket etter hvert sier «hund». Gjennom å vise tusenvis av bilder av både hunder og katter klarer nettverket etter hvert å skille mellom hund og katt.

Til slutt verifiserer man at nettverket har lært å generalisere hva en katt og hva en hund er. Dette gjøres ved å presentere nye bilder av katter og hunder som nettverket ikke har sett før. Dette er som en «eksamen» for nettverket. Hvis den gjør det dårlig på eksamen, altså ikke klarer å gjenkjenne et ukjent bilde av en hund, så har den ikke lært noe.

Dype nevrale nettverk trenger mye data for å trenes opp. Hvis ikke begynner de bare å «memorisere», og ikke «forstå» hvordan en hund ser ut. Dette kan sammenlignes med å pugge en tekst uten å forstå innholdet, og da kommer ikke studenten til å gjøre det bra på eksamen.

Historikk

Dyplæring som prinsipp har vært kjent i mange tiår. De første kunstige nevrale nettverkene ble utforsket allerede på 1940-tallet. På 1980-tallet begynte man å utforske nevrale nettverk med flere lag. Selv om man oppnådde interessante resultater også da, så var man svært begrenset av to faktorer: mengden av data og datakraft. Disse to faktorene har utviklet seg mye siden den gang, og i løpet av det tidlige 2000-tallet begynte dyplæring å komme i vanlig bruk både innen forskning, vitenskap og i industriell sammenheng.

Det store gjennombruddet for den nye bølgen av kunstig intelligens kom i 2012. Da ble det satt en ny rekord i en bildegjenkjenningskonkurranse kalt ImageNet. Den består i å klassifisere et bilde i en av 1000 kategorier. Den nye løsningen bestod av et dypt nevralt nettverk. Denne modellen hadde en feilrate på kun 16 prosent (de andre lå på rundt 25 prosent). I løpet av noen få år hadde feilraten sunket til noen få prosent, alle basert på varianter av dette dype nevrale nettverket.

Denne formen for å forstå store datamengder er nå ledende innen maskinell forståelse av bilder, tekst og lyd. Dette gjør seg først og fremst til kjenne gjennom forskjellige digitale tjenester, som for eksempel digitale assistenter som er en del av smarttelefoner.

Les mer i Store norske leksikon

Eksterne lenker

Litteratur

  • Jim Tørresen. Hva er kunstig intelligens. Oslo: Universitetsforlaget, 2013

Kommentarer

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

eller registrer deg