korrelasjon

Korrelasjon er et statistisk mål på hvor mye to målbare størrelser henger sammen med hverandre. For eksempel betyr en positiv korrelasjon mellom høyde og vekt at høye folk ofte er tyngre enn lave folk.

Faktaboks

Uttale
korrelasjˈon
Etymologi

av kon- og relasjon

Også kjent som

samvariasjon

Korrelasjon kalles også samvariasjon. I dagligtale kan man ofte bruke sammenheng eller statistisk sammenheng.

Korrelasjon mellom to størrelser trenger ikke å bety at den ene størrelsen er årsak til den andre.

Positiv og negativ korrelasjon

Positiv korrelasjon betyr at høye verdier av den ene størrelsen ofte vil finnes sammen med høye verdier av den andre størrelsen. Noen eksempler på størrelser som har positiv korrelasjon er røyking og lungekreftrisiko, matinntak og fedme, lungevolum og oksygenopptak, og antall studietimer og karakterene man får.

Negativ korrelasjon er det når høye verdier av den ene størrelsen generelt finnes sammen med lave verdier av den andre. Det er for eksempel negativ korrelasjon mellom verdien på en bil og hvor gammel bilen er. Eldre biler er generelt billigere enn nye biler.

Korrelasjonskoeffisienter

Eksempler på sammenhenger mellom målte størrelser og tilhørende korrelasjonskoeffisienter. De horisontale og vertikale aksene i hvert plott (ofte kalt x-akse og y-akse) er to forskjellige måleskalaer. For eksempel kan høyde måles langs x-aksen og vekt langs y-aksen. De svarte prikkene er målingene som er gjort, og tallet inne i plottet er den tilhørende korrelasjonskoeffisienten. I det øverste plottet til venstre er det perfekt, lineær sammenheng mellom målingene (alle prikkene ligger på en rett linje), slik vi for eksempel vil se hvis vi hadde plottet høyde målt i cm mot høyde målt i m. Det andre plottet øverst fra venstre viser målinger der det er svært godt samsvar mellom to målinger, for eksempel tid på 100 m sprint målt av to ulike personer med stoppeklokke. Alle plottene i øverste rekke viser hvordan størrelsen på korrelasjonskoeffisienten varierer etter hvordan observasjonene ser ut, i ulike situasjoner med utvalg på 10 (10 personer, 10 land, 10 dager o.l.). Den nederste rekken viser det samme for et større utvalg på 100.
Korrelasjonskoeffisienter
Lisens: CC BY SA 3.0

Styrken av korrelasjonen gis ved korrelasjonskoeffisienten. En korrelasjonskoeffisient er et tall mellom −1 og 1 som oppsummerer graden av samsvar. Et positivt tall betyr at det er positiv korrelasjon, og et negativt tall betyr at det er negativ korrelasjon. For eksempel fant man i en undersøkelse en korrelasjon på 0,37 mellom høyde og vekt for 7000 voksne kvinner.

Jo nærmere 1 eller −1 tallet er, jo sterkere er sammenhengen mellom de to størrelsene. I en gruppe med 67 voksne kvinner og menn var det for eksempel en korrelasjon på 0,94 mellom den høyden man ble målt til å ha og den høyden man trodde man hadde.

Korrelasjonskoeffisienter påvirkes ikke av måleenheten. Det betyr at du får samme tall for korrelasjonen hvis du måler høyde og vekt i meter og kilo, som du får hvis du måler det i cm og gram.

Uavhengige størrelser

Flere eksempler på korrelasjonskoeffisienter. Den øverste rekken viser hvordan korrelasjonskoeffisienten varierer i ulike situasjoner der punktene ligger mer eller mindre langs en rett linje. Den midterste rekken viser at når punktene ligger på en stigende rett linje, så er korrelasjonskoeffisienten alltid 1, og når punktene ligger på en synkende rett linje, er korrelasjonskoeffisienten alltid -1. Midt-kolonnen i figuren viser eksempler på at når det ikke er noen sammenheng mellom de to størrelsene, så er korrelasjonskoeffisienten 0. Den nederste rekken viser at selv om korrelasjonskoeffisienten er 0, kan det være klare (men ikke-lineære) sammenhenger mellom de to størrelsene.

Dersom de to målbare størrelsene er uavhengige, er korrelasjonskoeffisienten 0 eller nær 0. For eksempel vil det være uavhengighet og null korrelasjon mellom høydemålinger som gjøres på en helsestasjon og temperaturen utendørs den dagen målingene blir gjort. Uavhengighet betyr i denne sammenhengen at kunnskap om den ene størrelsen ikke forteller oss noe om verdiene til den andre størrelsen: Ute-temperaturen gir oss ingen hint om hva høydemålingene vil være, og høydemålingene kan ikke brukes til å si noe om temperaturen utenfor huset.

En korrelasjonskoeffisient på 0 betyr imidlertid ikke nødvendigvis at de to størrelsene er uavhengige. Hvis det er en annen sammenheng mellom de to målbare størrelsene enn en rett linje, kan korrelasjonskoeffisienten allikevel bli 0. For å unngå å trekke feil konklusjon, må man derfor alltid tegne opp målingene i et diagram.

Korrelasjon og årsakssammenheng

Korrelasjon mellom størrelser betyr ikke nødvendigvis at det er en årsakssammenheng (også kalt en kausal sammenheng) mellom dem.

Anta for eksempel at man i en befolkning finner en positiv korrelasjon mellom bruk av lesebriller og det å ha hjerte- og karsykdommer. Da kan man ikke uten videre konkludere med at brillene øker sjansen for hjertesykdommer, eller at hjertesykdom fører til at folk trenger briller. En annen forklaring på den positive korrelasjonen kan være at både brillebruk og hjertesykdommer skyldes økende alder, og at brillebruk og hjertesykdommer derfor ofte forekommer sammen. I dette tilfellet skyldes altså korrelasjonen at begge egenskapene har kausal sammenheng med en tredje egenskap, nemlig høy alder.

Kommentarer

Kommentaren din publiseres her. Fagansvarlig eller redaktør svarer når de kan.

Du må være logget inn for å kommentere.

eller registrer deg