Innholdsanalyse er en samfunnsvitenskapelig metode for analyse av innhold i skriftlige eller muntlige tekster, samt bilder, videoer eller filmer. Metoden anvendes særlig for å analysere tekster i ulike typer av tradisjonelle eller sosiale medier. Innholdsanalyse kan være både kvalitativ og kvantitativ.

Enkelt sagt dreier kvalitativ innholdsanalyse seg om å fortolke hvilken betydning eller mening som knytter seg til ulke typer av innhold, mens kvantitativ innholdsanalyse går ut på å få fram omfanget av ulike innholdstyper.

Kvalitativ innholdsanalyse

Kvalitativ innholdsanalyse kan omfatte ulike typer av kildekritiske metoder eller andre dokumentstudier som er vanlige blant historikere. Metoden er også en viktig framgangsmåte i diskursanalyse.

Generelt innebærer kvalitativ innholdsanalyse å systematisere utvalgte tekstsitater, bilder eller andre typer dokumentariske kilder som er relevante for å belyse spesifikke problemstillinger. Slike kilder kan identifiseres både før og under datainnsamlingen og brukes etter hvert som de viser seg å være relevante for problemstillingen. Under gjennomgangen av materialet genereres gjerne ulike kategorier av innholdet.

Dette kan for eksempel dreies seg om å få innsikt i hvilke fortellinger, meninger, argumenter, holdninger eller verdier som er sentrale i ulike tekster. I denne sammenhengen blir de systematiserte innholdselementene fortolket i lys av større kontekster, så vel større deler av den teksten som analyseres, som den samfunnsmessige sammenhengen som denne teksten inngår i.

Kvantitativ innholdsanalyse

Kvantitativ innholdsanalyse går også ut på å systematisere de delene av innholdet i tekster, bilder eller andre kilder som er relevante for spesifikke problemstillinger. I tillegg foretas en opptelling av de ulike innholdstypene. Alle tekster som skal analyseres, velges ut før datainnsamlingen starter.

Systematiseringen av innholdet foretas ved hjelp av et strukturert kodeskjema, som er utviklet før datainnsamlingen starter. Skjemaet består av variabler, som for eksempel tema, argumenter, verdier, holdninger eller standpunkter. For hver variabel kan man registrere ulike kategorier av omtale i tekster som analyseres, for eksempel kategoriene positiv, negativ eller nøytral holdning på variabelen holdning til innvandrere.

Skjemaet kan brukes for å registrere innholdet i for eksempel lederartiklene i utvalgte aviser i en gitt periode. Ett kodeskjema brukes for hver analyseenhet, som i dette eksemplet kan være hver enkelt lederartikkel. For hver kodeenhet, for eksempel hver setning i artikkelen, vurderes om teksten inneholder relevant omtale i forhold til variablene og kategoriene i kodeskjemaet. For å avgjøre dette, sees gjerne innholdet i setningen i lys av en større kontekstenhet, for eksempel det avsnittet den aktuelle setningen inngår i. Denne kodingen av tekstene foretas gjerne av ulike kodere. Ved å sammenlikne kodernes vurderinger av de samme tekstene kan en beregne reliabiliteten av datainnsamlingen.

I analysen kan man telle opp hvor mange artikler som inneholder omtale av de ulike variablene, og hvordan disse fordeler seg på de ulike kategoriene på hver variabel. Slik kan vi for eksempel vise frekvensene av positiv, negativ og nøytral omtale av innvandrere i de utvalgte artiklene. Dermed kan vi avklare hvor stor vekt ulike holdninger tillegges i artiklene.

Automatisert innholdsanalyse

Kvantitativ innholdsanalyse som gjennomføres ved hjelp av kodere, kalles manuell innholdsanalyse. Gjennomgangen og kodingen av tekstene kan også foretas ved hjelp av datamaskiner. Dette kalles automatisert innholdsanalyse. Istedenfor kodeskjema brukes da ofte en ordliste som spesifiserer hvilke ord og synonymer som skal identifiseres i teksten ved hjelp av et bestemt dataprogram. Alternativt kan dataprogrammet baseres på ulike algoritmer for en mer åpen gjennomgang av tekstene med sikte på kategorisering av tekstinnholdet. Med et engelskspråklig faguttrykk omtales denne framgangsmåten som text mining.

Automatisert innholdsanalyse gjør det mulig å gjennomgå, kategorisere og gi en kvantitativ oversikt over innholdet i store tekstmengder. Dataprogrammene kan identifisere og telle opp forekomster av bestemte ord, men problemet er at de ikke kan tolke om ett og samme ord brukes i ulike betydninger i forskjellige sammenhenger. Slik kan dataprogrammer være effektive med tanke på å fram teksters manifeste innhold, men de har store begrensninger med hensyn til tekstenes latente innhold.

Les mer i Store norske leksikon

Kommentarer

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

eller registrer deg