Utvalgsskjevhet innebærer at et utvalg av enheter som undersøkes, ikke er representativt for hele universet (eller populasjonen) av enheter som undersøkelsen skal belyse.

Begrepet er særlig relevant i forbindelse med kvantitative studier basert på sannsynlighetsutvalg av store univers, for eksempel et tilfeldig utvalg på 1500 personer fra den voksne norske befolkningen. Utvalgsskjevhet kan da skyldes både tilfeldige og systematiske avvik mellom utvalget og universet.

Tilfeldig utvalgsskjevhet i sannsynlighetsutvalg

Det vil alltid være tilfeldige avvik mellom et sannsynlighetsutvalg og universet. Basert på statistiske lovmessigheter og ved hjelp av statistiske metoder kan det avklares hvor store tilfeldige avvik en må regne med. Slike avvik, som gjerne kalles feilmarginer, oppgis med referanse til et bestemt signifikansnivå eller sikkerhetsnivå, vanligvis p<0.05, p<0,01 eller p<0,001. Disse nivåene angir sannsynligheten for at avviket mellom utvalget og universet likevel er større enn feilmarginen. Feilmarginen er mindre jo større denne sannsynligheten er. Slik er feilmarginen mindre om signifikansnivået er p<0,05 enn om nivået er p<0,001. Feilmarginen er dessuten mindre jo større utvalget er. For eksempel kan feilmarginen halveres hvis utvalgsstørrelsen firedobles.

Hvis en meningsmåling med et sannsynlighetsutvalg på 1500 personer av den norske befolkningen viser at 45 prosent er tilhengere av et norsk EU-medlemskap, vil feilmarginen på signifikansnivået p<0,05 være ±2,5 prosent. Det betyr at den reelle oppslutningen om EU-medlemskap i befolkningen kan antas å ligge mellom 42,5 prosent og 47,5 prosent. Dette kalles konfidensintervallet. Alle variasjoner innenfor dette intervallet kan skyldes tilfeldige utvalgsskjevheter.

Systematisk utvalgsskjevhet

I tillegg til slike tilfeldige avvik mellom utvalget og universet kan utvalget være preget av systematiske skjevheter. Det betyr at noen enheter i universet har større sannsynlighet enn andre enheter til å komme med i utvalget. Det kan skyldes at forutsetningene for sannsynlighetsutvelging ikke er oppfylt, for eksempel at det ikke finnes god nok oversikt over enhetene i universet, eller at det ikke har vært mulig å finne fram til alle enhetene i utvalget.

Systematiske skjevheter kan også oppstå hvis det endelige datamaterialet ikke inneholder data om alle enhetene i utvalget, for eksempel fordi respondenter i en spørreundersøkelse ikke kan eller vil delta i undersøkelsen. Det kan føre til systematiske skjevheter i det endelige utvalget (nettoutvalget), selv om det opprinnelige utvalget (bruttoutvalget) ikke er systematisk skjevt.

Bortfall av enheter under datainnsamlingen kan være skjevt fordelt i utvalget, for eksempel ved at yngre er mer motvillige enn eldre til å delta i en intervjuundersøkelse. De yngre blir da underrepresentert og de eldre overrepresentert i utvalget. Omfanget av slike systematiske utvalgsskjevheter kan ikke beregnes på samme måten som tilfeldige utvalgsskjevheter. Hvis utvalget er systematisk skjevt, kan det også være lite meningsfullt å bruke signifikanstesting for å avklare tilfeldige utvalgsskjevheter.

Avklaring og vekting under analysen

I noen grad kan omfanget av systematiske skjevheter i et utvalg avklares ved å sammenlikne fordelinger i utvalget med de tilsvarende fordelingene i universet. For eksempel kan kjønnsfordelingen eller aldersfordelingen i et utvalg av befolkningen sammenliknes med disse fordelingene i hele befolkningen, som er kjent fra offentlig statistikk.

I analysen kan en så kompensere for disse skjevhetene ved at data om enheter som er underrepresentert i utvalget, tillegges større vekt enn data om enheter som er overrepresentert. Slike avklaringer og vektinger kan imidlertid foretas bare for de fordelingene i universet som det finnes informasjon om. For alle andre fordelinger vil omfanget av systematiske skjevheter være ukjent.

Konsekvenser av systematisk utvalgsskjevhet

Konsekvensen av systematisk utvalgsskjevhet er at analyseresultatene kan bli upålitelige og lite representative for det universet som skal studeres. Hvis svarprosenten i en meningsmåling er på 30, kan det ikke utelukkes at den store andelen av det opprinnelige utvalget som ikke har deltatt i undersøkelsen (70 prosent), har andre meninger eller holdninger enn de som har svart. Analyseresultatene vil i så fall ikke gi et representativt bilde av meningene eller holdningene i befolkningen som helhet.

Ved slike systematiske utvalgsskjevheter vil det heller ikke være grunnlag for å bruke signifikanstesting for å beregne om resultatene er holdbare. Slik testing vil bare avklare hvor store de tilfeldige forskjellene mellom universet og hele det opprinnelige sannsynlighetsutvalget kan antas å være.

Utvalgsskjevhet i kvalitative studier

Utvalgsskjevhet kan også være et problem i kvalitative studier basert på strategiske utvalg. Da betyr utvalgsskjevhet at utvalget ikke inkluderer alle typer av enheter som er relevante for undersøkelsens problemstilling.

Hvis hensikten for eksempel er å studere hvilke argumenter som brukes i debatten om norsk medlemskap i EU, basert på innholdsanalyse av avisartikler, bør utvalget inkludere innlegg fra både tilhengere og motstandere av EU-medlemskap. Utvalget blir skjevt hvis det omfatter artikler fra bare tilhengere eller bare motstandere.

Les mer i Store norske leksikon

Kommentarer

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

eller registrer deg