Metodene tar utgangspunkt i parallelltekster, det vil si tekster som er oversatt til flere språk, for eksempel bøker, offentlige dokumenter og lignende.
I tillegg til tekster, kan man benytte crowdsourcing hvor deltakere som behersker flere språk blir invitert til å bidra med nye oversettelser, påpeke feil og så videre.
Ved å sammenligne ordsekvenser som befinner seg på samme sted i slike tekster, kan man bygge opp en oversikt over enkeltord, fraser og setninger som sannsynligvis har samme betydning i forskjellige språk.
Tabellen nedenfor illustrerer hvordan en slik oversikt kan se ut. Den angir forekomster av fraser på norsk og engelsk som er funnet på samme sted i ulike parallelltekster. For eksempel er det 15 tilfeller hvor frasen «jeg elsker deg» har samsvart med «I love you», mens frasene «Jeg elsker deg» og «I adore you» har blitt funnet på samme sted seks ganger.
Antall |
Norsk |
Engelsk |
15 |
jeg elsker deg |
I love you |
6 |
jeg elsker deg |
I adore you |
4 |
jeg elsker deg |
I am fond of you |
7 |
jeg er glad i deg |
I love you |
10 |
jeg er glad i deg |
I adore you |
14 |
jeg er glad i deg |
I am fond of you |
7 |
jeg liker deg |
I love you |
12 |
jeg liker deg |
I adore you |
13 |
jeg liker deg |
I am fond of you |
Oversettingen gjennomføres ved at man velger alle par som inneholder ordsekvensen man skal oversette fra i tabellen. Så henter man oversettelsen fra det paret som forekommer flest ganger blant disse.
Ut fra forekomstene i tabellen ovenfor vil for eksempel setningen «jeg liker deg» bli oversatt til «I am fond of you» (13 av totalt 32 forekomster), mens «I am fond of you» vil bli oversatt til «Jeg er glad i deg» (14 av 31 forekomster).
Kommentarer
Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.
Du må være logget inn for å kommentere.