dyp læring

Dyp læring er en læreprosess som går ut på å «trene opp» såkalte «dype kunstige nevrale nettverk» (også kjent som «nevrale nettverk»). Dette er en sentral metode innen maskinlæring – hvor det er et prinsipp at datamaskiner skal tilegne seg kunnskap (lære) om noe den ikke vet eller kan fra før.

Faktaboks

Etymologi
fra engelsk deep learning
Også kjent som

dyp strukturert læring, hierarkisk læring

På samme måte som et menneske er i stand til å resonnere seg fram til løsninger på nye problemer basert på kunnskap vi har fra før, er læremekanismen i dyp læring intuitiv. Maskinen må gjennomgå mange eksempler på det den skal forstå. Det er i hovedsak mennesker som allerede har definert hva som er «riktig svar» på de forskjellige oppgavene maskinen løser.

Det er dyp læring som har stått for de største gjennombruddene de siste årene innen maskinlæring når det gjelder maskinell forståelse av bilder, tekst og sekvenser.

Nevrale nettverk og dyp læring

Innen kunstig intelligens brukes nevrale nettverk om en datastruktur inspirert av den menneskelige hjernen. Språkbruken er også inspirert av fysiologiske begrep. Nettverket består av prosesseringsenheter, kalt «nevroner» som er knyttet sammen via «synapser».

Betegnelsen dyp læring brukes når det arbeides med mange «lag» av nevroner og synapser. De første nevrale nettverkene som ble utforsket hadde bare ett lag. Et slik nevralt nettverk kan man tenke på som et hus, med en første etasje, en øvre etasje og et tak. Et dypt nettverk er mer som en skyskraper, der hver etasje tilsvarer et lag i nettverket.

Virkemåte

Hvert enkelt nevron har en veldig enkel prosesseringskraft. Nevroner påvirker andre nevroner via synapser. Hvor sterkt et nevron påvirker et annet nevron avhenger av synapsen, dette kalles den synaptiske vekten. Læreprosessen består av å bestemme disse synaptiske vektene. Dette oppnås ved å sende store datamengder gjennom det nevrale nettverket, og justere vektene underveis.

Et klassisk eksempel er å si hva som er i et bilde. La oss si at du presenterer et bilde av en hund til nettverket, samtidig som du sier til nettverket «dette er en hund». Hvis nettverket responderer at «dette er en katt», så justerer man vektene ørlite grann, slik at nettverket etterhvert sier «hund». Gjennom å vise tusenvis av bilder av både hunder og katter, klarer nettverket etterhvert å skille mellom hund og katt.

Til slutt verifiserer man at nettverket har lært å generalisere hva en katt og hva en hund er. Dette gjøres ved å presentere nye bilder av katter og hunder som nettverket ikke har sett før. Dette er som en «eksamen» for nettverket. Hvis den gjør det dårlig på eksamen, altså ikke klarer å gjenkjenne et ukjent bilde av en hund, så har den ikke lært noe.

Dype nevrale nettverk trenger mye data for å trenes opp. Hvis ikke begynner de bare å «memorisere», og ikke «forstå» hvordan en hund «ser ut». Dette er det samme som å pugge en tekst uten å forstå innholdet, og da kommer du ikke til å gjøre det bra på eksamen.

Historikk

Dyp læring som prinsipp har vært kjent i mange tiår. De første kunstige nevrale nettverkene ble utforsket allerede på 1940-tallet. På 1980-tallet begynte man å utforske nevrale nettverk med flere lag. Selv om man oppnådde interessante resultater også da, så var man svært begrenset av to faktorer: mengden av data, og datakraft. Disse to faktorene har utviklet seg mye siden den gang, og i løpet av det tidlige 2000-tallet begynte dyp læring å komme i vanlig bruk både innen forskning, vitenskap og i industriell sammenheng.

Det store gjennombruddet for den nye bølgen av kunstig intelligens kom i 2012. Da ble det satt en ny rekord i en bildegjenkjennings-konkurranse kalt ImageNet. Den består i å klassifisere et bilde i en av 1000 kategorier. Den nye løsningen besto av et dypt nevralt nettverk. Denne modellen knuste de andre med en feilrate på kun 16 prosent (de andre lå på rundt 25 prosent). I løpet av noen få år hadde feilraten sunket til noen få prosent, alle basert på varianter av dette dype nevrale nettverket.

Denne formen for å forstå store datamengder er nå ledende innen maskinell forståelse av bilder, tekst og lyd. Dette gjør seg først og fremst til kjenne gjennom forskjellige digitale tjenester, som for eksempel digitale assistenter som er en del av smarttelefoner.

Les mer i Store norske leksikon

Eksterne lenker

Litteratur

  • Jim Tørresen. Hva er kunstig intelligens. Oslo: Universitetsforlaget, 2013

Kommentarer

Kommentaren din publiseres her. Fagansvarlig eller redaktør svarer når de kan.

Du må være logget inn for å kommentere.

eller registrer deg