Maskinlæring er en spesialisering innen kunstig intelligens hvor man bruker statistiske metoder for å la datamaskiner finne mønstre i store datamengder. Vi sier at maskinen «lærer» i stedet for å bli programmert.

Det å lære kalles også å trene opp en modell. For å «trene», behøver man data. Man deler datasettet typisk opp i et treningssett og et testsett. Man trener opp modellen på treningssettet, og så undersøker man om modellen har lært noe ved å teste det på testsettet. Dette er data modellen ikke har sett før, og det vil avsløre hvorvidt den har «lært» det den skal. Har modellen bare memorisert dataene, det samme som å pugge en tekst uten å forstå den, vil den ikke gjøre det bra når den testes.

Maskinlæring blir i dag brukt i alt fra selvdrevne biler, forbedret websøk, epost-filtreringer, bildegjenkjenning, språkgjenkjenning, forbedrede kompilatorer og en utvidet forståelse av menneskets genom.

Maskinlæring kan deles opp i tre hovedkategorier: Veiledet læring, ikke-veiledet læring, og forsterket læring.

Maskinen finner en ukjent funksjon fra eksempler. Den lærer å forstå at inngangsverdiene forutsier utgangsverdiene.

Et enkelt eksempel vil være å skille hunder fra fugler. Hunder har fire ben, mens fugler har bare to. I tillegg har fuglene vinger. Når modellen ser ett dyr med fire ben, så kan den være sikker på at det er en hund. Likeledes, har dyret to ben og to vinger, er det mest sannsynlig en fugl. Dette kalles klassifisering. Hvis man i stedet prøver å forutsi lengden på dyret, altså et tall, kalles det regresjon.

Denne typen maskinlæring har hatt stor suksess de siste årene, og i enkelte tilfeller, som bildegjenkjenning, gjør modellene det bedre enn mennesker.

I dette tilfellet har maskinen ikke tilgang til utgangsverdier for gitte inngangsverdier. I stedet forsøker algoritmen selv å finne strukturen i inngangsverdiene, ved for eksempel å gruppere dem i klynger. Vi mennesker er ekstremt gode på dette, og på dette feltet har maskinlæring langt igjen for å nå menneskelig ytelse.

I forsterket læring interagerer modellen direkte med et miljø som gir straff eller belønning. Hvis du vil lære opp en hund til å løse en oppgave, kan du gi hunden en kjeks hver gang den gjør noe riktig, og noe den ikke liker, som en sitron, når den tar feil. Slik forsterkes den ønskede oppførselen, uten at man må spesifisere hvordan det skal løses. Det er styrken til forsterket læring – det kan anvendes i scenarioer hvor det er mange veier til målet, og det ikke er gitt hvilken som er den beste.

Denne metoden brukes ofte til å trene opp modeller som er gode i spill. Det mest kjente eksempelet er Googles system AlphaGo som nå er verdens beste spiller i Go.

Maskinlæring er en underart av kunstig intelligens, selv om begrepene ofte brukes om hverandre. Kunstig intelligens omfatter alle intelligente systemer. Et grovt skille er mellom regelbaserte og datadrevne modeller. Regelbaserte modeller forstår begreper gjennom regler, som ofte er programmerte før modellen brukes. Dette er ikke maskinlæring.

Datadrevne modeller har ingen regler som er programmert inn på forhånd, i stedet lærer modellen slike regler på egen hånd. Forskjellen er at disse reglene ofte ikke er forståelige for mennesker, og derfor kalles modellene ofte for svarte bokser.

De siste årene snakker man gjerne om dyp læring når man mener maskinlæring.

  • AlphaGo: verdens beste spiller i Go.

Foreslå endringer i tekst

Foreslå bilder til artikkelen

Kommentarer

14. januar skrev Viggo Wivestad

Foreslår å endre oversettelsen "supervised/unsupervised learning" fra "overvåket/uovervåket læring" til "veiledet/ikke veiledet læring", ettersom det den mest allmenn aksepterte oversettelsen, og etter min mening også er bedre dekkende navn på metodene.

14. januar svarte Axel Tidemann

Hei Viggo, takk for innspill. Har du noen referanser til bruk av "veiledet/ikke veiledet" læring, f.eks. om det brukes i noen universitetsfag eller liknende?

15. januar svarte Viggo Wivestad

Hei igjen. Kom over oversettelsen første gang da jeg leste meg opp på GDPR fra datatilsynets rapport [1]. Et raskt google-søk gir meg også forelesningsnotater fra UiO [2] og NTNU [3]. Kan også legge til at søkekombinasjonen "veiledet læring" "kunstig intelligens" gir 1720 treff på google, mens søkekombinasjonen "overvåket læring" "kunstig intelligens"kun gir 132 treff.

[1] https://www.datatilsynet.no/globalassets/global/om-personvern/rapporter/rapport-om-ki-og-personvern.pdf
[2] https://www.uio.no/studier/emner/matnat/ifi/nedlagte-emner/ITSLP1100/v08/undervisningsmateriale/2008_04_15.pdf
[3] http://www.idi.ntnu.no/~agnar/it272/f9/f9-99.ppt

15. januar svarte Axel Tidemann

Takk for gode eksempler. Jeg er enig, og har endret teksten.

Har du spørsmål om eller kommentarer til artikkelen?

Kommentaren din vil bli publisert under artikkelen, og fagansvarlig eller redaktør vil svare når de har mulighet.

Du må være logget inn for å kommentere.