median

Median er i statistikk den midterste verdien i et tallmateriale, og den brukes til å oppsummere hva som er en vanlig verdi i en samling av tall.

Faktaboks

Uttale
mediˈan
Etymologi
av latin ‘som befinner seg i midten’

Medianverdien deler tallmaterialet i to: Den ene halvparten av tallene har lavere verdi enn medianen, og den andre halvparten av tallene har høyere verdi enn medianen.

Medianen kan også kalles andre kvartil eller 50%-persentilen i tallmaterialet.

Beregning og tolkning av median

Medianverdien finnes ved å sortere alle tallene i stigende rekkefølge og deretter plukke ut tallet midt i rekken.

Eksempel

Skjermtid i løpet av en dag målt i minutter (min) for elleve pensjonister over 60 år.

Tallmateriale: 40 min, 110 min, 72 min, 46 min, 53 min, 58 min, 280 min, 65 min, 105 min, 68 min, 390 min. Tallmateriale i stigende rekkefølge og dets midterste verdi: 40 min, 46 min, 53 min, 58 min, 65 min, 68 min, 72 min, 105 min, 110 min, 280 min, 390 min.

I eksempelet er medianen 68 min. Dette kan tolkes som at 68 minutter en vanlig skjermtid hos pensjonister over 60 år. Halvparten av pensjonistene i undersøkelsen hadde en daglig skjermtid på mindre enn 68 minutter, mens de andre pensjonistene brukte mer enn 68 minutter foran skjermen per dag.

Hvis antall observasjoner er et partall, er medianen gjennomsnittet av de to midterste tallene.

Eksempel

Skjermtid i løpet av en dag målt i minutter (min) for ti pensjonister over 60 år.

Tallmateriale: 110 min, 72 min, 46 min, 53 min, 58 min, 280 min, 65 min, 105 min, 68 min, 390 min.

Tallmateriale i stigende rekkefølge og dets midterste verdi: 40 min, 46 min, 53 min, 58 min, 65 min, 68 min, 72 min, 105 min, 110 min, 280 min, 390 min.

I eksempelet er medianen \(\frac{68 \mbox{ min } + 72 \mbox{ min}}{2}\) = 70 min.

Dette kan tolkes som at 70 minutter en vanlig skjermtid hos pensjonister over 60 år. Halvparten av pensjonistene i undersøkelsen hadde en daglig skjermtid på mindre enn 70 minutter, mens de andre pensjonistene brukte mer enn 70 minutter foran skjermen per dag.

Median eller gjennomsnitt?

God bruk av statistikk handler om å beskrive data så riktig som mulig. Velger vi feil tall for å oppsummere det vi har studert, kan vi risikere å gi et villedende inntrykk av virkeligheten.

Både medianen og gjennomsnittet er statistiske oppsummeringstallfor det typiske ved et tallmateriale, men de har hver sine bruksområder. Kort sagt brukes gjennomsnittet for å oppsummere symmetriske data, og medianen for skjevfordelte data.

I symmetriske datasett med en topp på midten og få ekstremverdier er medianverdien og gjennomsnittsverdien ofte ganske like. Da spiller det strengt tatt ingen rolle hvilken vi velger for å beskrive det typiske. Begge deler er like riktig, og begge deler gir en god oppsummering av hva som er en vanlig verdi. Det er allikevel gjennomsnittet som oftest foretrekkes.

I andre datasett kan medianen og gjennomsnittet være ganske ulike. Dette gjelder spesielt skjevfordelte data, eller datasett med ekstremverdier.

I et datasett som er skjevt med topp til venstre og lang hale til høyre vil skjevheten og ekstremverdiene forskyve gjennomsnittet til en høyere verdi enn der de fleste datapunktene ligger. Dermed vil det ofte være mange flere observasjoner på den ene enn den andre siden av gjennomsnittet, og dermed blir gjennomsnittet verken representativt for de mange lave verdiene, eller de få høye verdiene. Tilsvarende, hvis fordelingen er skjev med hale og ekstremverdier til venstre, blir gjennomsnittet trukket nedover. Medianen har derimot alltid like mange observasjoner på hver side, og er på den måten i senteret av observasjonene.

Høyde for 17-årige gutter
Høydefordelingen for 1257 norske, 17-årige gutter (simulerte data, basert på percentilskjema for vekst). Gjennomsnittshøyden er 177,9 cm, og den finner du der den hvite, stiplede linjen treffer x-aksen. Medianhøyden er 177,7 cm, og den finner du der den røde, heltrukne linjen treffer x-aksen. Figuren viser et eksempel på at gjennomsnittsverdien og medianverdien kan være ganske like i symmetriske fordelinger.
Høyde for 17-årige gutter
Lisens: CC BY SA 3.0
Responstider Oppdal 2019
Responstiden for ambulanser i Oppdal kommune i 2019. Responstiden er tiden det tar fra en telefon mottas på en nødsentral, til ambulansen er fremme hos den som trenger hjelp. Fordelingen er skjev, med en topp til venstre og en hale til høyre. Gjennomsnittlig responstid er 16 minutter og 3 sekunder, og den finner du der den hvite, stiplede linjen treffer x-aksen. Median responstid er 11 minutter og 2 sekunder, og den finner du der den røde, heltrukne linjen treffer x-aksen. Figuren viser et eksempel på at gjennomsnittsverdien og medianverdien vanligvis er ganske forskjellige i skjeve fordelinger.
Responstider Oppdal 2019
Lisens: CC BY SA 3.0

Median og kvartiler

For å oppsummere et datasett er det ikke nok å oppgi et tall for det typiske. Det bør også oppgis tall for variasjon.

Median bør alltid oppgis sammen med kvartiler, mens gjennomsnitt bør oppgis sammen med standardavvik.

Les mer i Store norske leksikon

Kommentarer (2)

skrev Kim Ulriksen

Jeg forstår ikke hvorfor det så sjelden presiseres, for det står verken lærebøker, i hvertfall for grunnskolen hvor jeg underviser, eller her i leksikon:Når antall observasjoner er like, og det skjer jo ofte, vil det være TO observasjoner i midten av det statistiske materialet, og da kan de to være forskjellige tall. Dersom man ikke vet det, eller havner i en diskusjon om hvordan det løses, er det faktisk vanskelig å finne svar på hva som er median i slike tilfeller. Sjøl regner jeg med at median i slike tilfeller er aritmetisk gjennomsnitt av de to midterste observasjonene, men det er fordi jeg er usikker jeg gikk hit...

svarte Jan Bjørnstad

Du har rett. Teksten er nå rettet opp

Kommentaren din publiseres her. Fagansvarlig eller redaktør svarer når de kan.

Du må være logget inn for å kommentere.

eller registrer deg