Språkteknologi er en fellesbetegnelse på datateknologi som brukes til å analysere, gjengi eller endre språkdata og til å styre andre applikasjoner ved hjelp av språklige inndata.

Noen eksempler på bruk av språkteknologi er automatisk stavekontroll, chatbots, dialogsystemer, syntetisk tale og talestyring av utstyr eller applikasjoner.

Typer

Språkteknologi kan grovt sett deles inn i tekstteknologi og taleteknologi.

Tekstteknologi omfatter systemer som analyserer og bearbeider tekst, for eksempel maskinoversettelse, stavekontroll, chatbots og automatisk tekstsammendrag.

Taleteknologi omfatter systemer for gjenkjenning og produksjon av taledata. Ved talegjenkjenning kan et system gjenkjenne språklyder og omgjøre disse til tekst (tale-til-tekst-systemer), mens talesyntese (tekst-til-tale-systemer) omformer en tekst til et digitalt lydspor med kunstig tale. Dette må ikke forveksles med språkgjenkjenning, som betegner metoder for å tolke hvilket språk som blir snakket eller skrevet.

Bruk

Språkteknologi er i bruk til en lang rekke praktiske formål, som stemmestyring av mobiltelefoner eller smarthøyttalere, syntetisk tale for talehemmede, automatisk oversettelse, automatisk teksting av TV-sendinger, grammatikk- og stavekontroll i skriveprogrammer, og så videre. De siste årene har også utviklingen av språkmodeller blitt en sentral del av feltet. Disse har blitt spesielt viktige for systemer som krever tekstgenerering, som for eksempel i chatbots.

Det kreves vanligvis store mengder tekst- eller taledata for å utvikle språkteknologi. Dataene brukes som grunnlag for beregning av statistiske modeller som gir datamaskinen kunnskap om det naturlige språkets egenskaper. Språkteknologien tar i bruk metoder for dataklassifikasjon og -annotering som er utviklet innen de nært tilknyttede fagområdene datalingvistikk og korpuslingvistikk. I økende grad bruker utviklere av språkteknologi verktøy og metoder som er hentet fra utviklingsfeltene stordata og kunstig intelligens.

Talegjenkjenning kan også kombineres med stemmegjenkjenning, som er et biometrisk metode for å kjenne igjen personen som snakker. Taleteknologi forventes å ha en stor betydning for utviklingen av tingenes internett.

Les mer i Store norske leksikon

Kommentarer

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

eller registrer deg