Man skiller mellom observerte statistiske fordelinger (frekvens- eller hyppighetsfordelinger) og teoretiske fordelinger (sannsynlighetsfordelinger).

I et statistisk materiale der det for hvert individ (hver observert enhet) er observert ett eller flere kjennetegn, som alder, inntekt el.l., kan man f.eks. finne fordelingen av individene etter alder. Man deler inn materialet i aldersklasser og teller hvor mange individer det er i hver klasse. I Statistisk årbok 2003 finnes i tabell 53 fordelingen av norske innbyggere per 01.01.2003 etter alder. Fra denne tabellen kan fordelingen i 10 års aldersintervaller sette opp (se tabell).

Fordelingen kan angis i absolutte tall, relative tall (andel) eller prosent. Det kan også settes opp en toveisfordeling etter f.eks. alder og kjønn, en treveisfordeling etter tre kjennetegn, osv.

En fordeling kan karakteriseres ved ulike statistiske mål: et gjennomsnitt kan angi hvor tyngdepunktet eller kanskje den mest typiske verdi i fordelingen ligger, mens et spredningsmål antyder hvor tett eller spredt observasjonene ligger rundt gjennomsnittet. Vanlige gjennomsnittsmål er det aritmetiske middeltall, som er summen av observasjonene dividert med antallet, og medianeneller midttallet, som ligger midt i det observerte materialet; det er den midterste verdien når vi ordner observasjonene etter stigende verdi. Blant spredningsmålene er standardavviket (eng. standard deviation) det vanligste. Kvadratet av standardavviket kalles variansen. Denne finner man ved å ta differensen mellom observert verdi og gjennomsnitt for alle observasjonene, kvadrere disse differensene og dividere summen av dem med antall individer.

For et materiale ordnet i en klasseinndelt fordeling som ovenfor, kan man finne tilnærmede verdier av disse målene. Ved å henføre antallene til midtpunktene i klasseintervallene, er det aritmetiske gjennomsnittet av personenes alder tilnærmet lik

[(601 119 · 5) + (581 289 · 15) + (579 679 · 25) + (697 355 · 35) + (634 556 · 45) + (585 481 · 55) + 361 907 · 65) + (305 803 · 75) + (205 063 · 85)]/4 552 252 = 38,5 år.

Medianen, den midterste verdien når personene ordnes etter alder, ligger i klasseintervallet 30−39 år, nær 37 år. Variansen blir tilnærmet lik

[601 119 · (5 − 38,5)2 + 581 289 · (15 − 38,5)2 + ... + 205 063 · (85 − 38,5)2]/4 552 252 = 527,4.

Standardavviket blir dermed 23 år.

I statistisk metodelære definerer man teoretiske fordelinger som angir sannsynligheter for de forskjellige verdiene (eller intervaller av verdier) av en stokastisk variabel; for eksempel sannsynligheten for at alderen til en tilfeldig valgt person skal falle i bestemte intervaller på skalaen. Eksempler er den binomiske fordelingen og normalfordelingen; se også målefeil. Det defineres også teoretiske statistiske mål på fordelingers midtpunkt og spredning; forventningsverdien, som tilsvarer det aritmetiske gjennomsnittet (se statistisk forventning), og det teoretiske standardavviket.

Alder Antall Relative tall (andel) Prosent
0 – 9 år 601 119 0,132 13,2
10 – 19 år 581 289 0,128 12,8
20 – 29 år 579 679 0,127 12,7
30 – 39 år 697 355 0,153 15,3
40 – 49 år 634 556 0,139 13,9
50 – 59 år 585 481 0,129 12,9
60 – 69 år 361 907 0,080 8,0
70 – 79 år 305 803 0,067 6,7
80 – 205 063 0,045 4,5
Til sammen 4 552 252 1,000 100

Foreslå endringer i tekst

Foreslå bilder til artikkelen

Kommentarer

23. april 2009 skrev siv camilla michaelsen

Hei hei:) Jeg har en oppgave på skolen, og i den forbinnelse trenger jeg å få vite innbyggertallet på gutter i sarpsborg i alders gruppen 13-19år og fra 20-30år.



Og hvis det er noen der ute som virkelig er flinke til å finne ut sånne ting, så lurer jeg også på hvor mange mannlige fotballspillere det er i sarpsborg, i aldersgruppen 16-20år???



Kan noen hjelpe meg med det?? evnt hvor jeg kan finne ut det??

Jeg har søkt og søkt på nettet, men finner ikke svaret!!!



Mvh en uerfaren nettsurfer:) hihi

Har du spørsmål til artikkelen? Skriv her, så får du svar fra fagansvarlig eller redaktør.

Du må være logget inn for å kommentere.