Fordeling er en oversikt over frekvensene for alle verdiene på en variabel. Man skiller mellom observerte statistiske fordelinger (frekvens- eller hyppighetsfordelinger) og teoretiske fordelinger (sannsynlighetsfordelinger).

Faktaboks

Uttale
fordˈeling

I et statistisk materiale der det for hvert individ (hver observert enhet) er observert ett eller flere kjennetegn, som alder, inntekt eller lignende, kan man for eksempel finne fordelingen av individene etter alder. Man deler inn materialet i aldersklasser og teller hvor mange individer det er i hver klasse.

Fordelingen kan angis i absolutte tall, relative tall (andel) eller prosent. Det kan også settes opp en toveisfordeling etter for eksempel alder og kjønn, en treveisfordeling etter tre kjennetegn, og så videre.

Statistiske mål

En fordeling kan karakteriseres ved ulike statistiske mål:

  • et gjennomsnitt kan angi hvor tyngdepunktet eller kanskje den mest typiske verdi i fordelingen ligger
  • et spredningsmål antyder hvor tett eller spredt observasjonene ligger rundt gjennomsnittet.

Vanlige gjennomsnittsmål er det aritmetiske middeltall, som er summen av observasjonene delt på antallet, og medianen eller midttallet, som ligger midt i det observerte materialet. Medianen er altså den midterste verdien når vi ordner observasjonene etter stigende verdi.

Blant spredningsmålene er standardavviket (engelsk standard deviation) det vanligste. Kvadratet av standardavviket kalles variansen. Denne finner man ved å ta differensen mellom observert verdi og gjennomsnitt for alle observasjonene, kvadrere disse differensene og dele summen av dem med antall individer.

Eksempel

Følgende tabell viser fordelingen av alder blant innbyggerne i Norge i 2003:

Alder Antall Relative tall (andel) Prosent
0–9 år 601 119 0,132 13,2
10–19 år 581 289 0,128 12,8
20–29 år 579 679 0,127 12,7
30–39 år 697 355 0,153 15,3
40–49 år 634 556 0,139 13,9
50–59 år 585 481 0,129 12,9
60–69 år 361 907 0,080 8,0
70–79 år 305 803 0,067 6,7
over 80 år 205 063 0,045 4,5
Til sammen 4 552 252 1,000 100

For et slikt materiale ordnet i en klasser, kan man finne tilnærmede verdier av disse målene. Ved å henføre antallene til midtpunktene i klasseintervallene, er det aritmetiske gjennomsnittet av personenes alder tilnærmet lik

[(601 119 × 5) + (581 289 × 15) + (579 679 × 25) + (697 355 × 35) + (634 556 × 45) + (585 481 × 55) + 361 907 × 65) + (305 803 × 75) + (205 063 × 85)]/4 552 252 = 38,5 år.

Medianen, den midterste verdien når personene ordnes etter alder, ligger i klasseintervallet 30−39 år, nær 37 år. Variansen blir tilnærmet lik

[601 119 × (5 − 38,5)² + 581 289 × (15 − 38,5)² + ... + 205 063 × (85 − 38,5)²]/4 552 252 = 527,4.

Standardavviket blir dermed 23 år.

I statistisk metodelære definerer man teoretiske fordelinger som angir sannsynligheter for de forskjellige verdiene (eller intervaller av verdier) av en stokastisk variabel. For eksempel sannsynligheten for at alderen til en tilfeldig valgt person skal falle i bestemte intervaller på skalaen. Eksempler er den binomiske fordelingen og normalfordelingen. Se også målefeil.

Det defineres også teoretiske statistiske mål på fordelingers midtpunkt og spredning; forventningsverdien, som tilsvarer det aritmetiske gjennomsnittet (se statistisk forventning), og det teoretiske standardavviket.

Les mer i Store norske leksikon

Litteratur

  • Lillestøl, Jostein: Sannsynlighetsregning og statistikk, 5. utg., 1997
  • Sverdrup, Erling: Lov og tilfeldighet, b. 1, 2. utg., 1973

Kommentarer (1)

skrev siv camilla michaelsen

Hei hei:) Jeg har en oppgave på skolen, og i den forbinnelse trenger jeg å få vite innbyggertallet på gutter i sarpsborg i alders gruppen 13-19år og fra 20-30år.Og hvis det er noen der ute som virkelig er flinke til å finne ut sånne ting, så lurer jeg også på hvor mange mannlige fotballspillere det er i sarpsborg, i aldersgruppen 16-20år??? Kan noen hjelpe meg med det?? evnt hvor jeg kan finne ut det?? Jeg har søkt og søkt på nettet, men finner ikke svaret!!!Mvh en uerfaren nettsurfer:) hihi

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

eller registrer deg