Talekoding er å omforme et analogt talesignal til sekvenser av binære tall (0 og 1). Strømmen av disse bit blir et digitalt signal som kan overføres over moderne digitale telenett som ADSL, 4G, 5G eller Internett.

Det digitale signalet genereres med en analog-digital-omformer, der det analoge talesignalet blir målt med jevne mellomrom. En viktig del av talekodingsprosessen er å redusere antall bit, slik at det er tilpasset kapasiteten til den aktuelle overføringskanalen.

På mottakersiden omformes signalet tilbake til analog form ved hjelp av en digital-analog-omformer. Siden målingene av det originale talesignalet nødvendigvis må ha en begrenset nøyaktighet, vil det gjenskapte talesignalet avvike fra originalen. Differansen kalles kvantiseringsstøy. Talekodere har som mål å minimere kvantifiseringsstøyen. For noen talekodere gjøres dette ved å benytte grovere målenøyaktighet for de sterkeste signalene enn for de svakeste.

Den første talekoderen som ble standardisert er PCM (pulskodemodulasjon).

Senere er det standardisert en rekke talekodingsalgoritmer som reduserer kravet til overføringskapasitet. Grovt kan disse algoritmene deles inn i to grupper:

  • Punktprøvebasert, der hvert enkelt måletall (punktprøve) kodes.
  • Rammebasert, der et antall påfølgende måletall samles og kodes under ett.

Punktprøvebaserte kodere

PCM-talekoderen er punktprøvebasert.

I stedet for å overføre informasjon for hver enkelt punktprøve, kan bitraten redusere ved å sende informasjon om differensen i størrelse til forrige punktprøve, såkalt Differensiell PCM (DPCM). Det er også mulig å legge til adaptiv tilpasning av kvantisering-trinnene (skala for måleverdier).

En annen metode er å dele opp frekvensbåndet for talen i to eller flere delbånd som kodes hvert for seg. Et eksempel er en SB-ADPCM talekoder (Delbånd Adaptiv Differensiell PCM) med HD-tale gitt i ITU-T rekommandasjon G.722.

Rammebaserte kodere

Rammebaserte kodere er de mest effektive. I stedet for å overføre talens bølgeform opprettes en modell for generering av tale, og modellens parametre og talens pitch overfører. Et eksempel på dette er EFR koderen som benyttes i GSM. Den reduserer bitraten til 12,2 kbit/s og har tilnærmet samme talekvalitet som PCM. Mellom ulike kodere er variasjonen i bitrater ganske stor. For de laveste bitratene er talekvaliteten dårligere enn PCM. For krypterte telefonsignaler i militære systemer kan bitraten være helt ned til 2,4 kbit/s.

Rammebaserte kodere er mer kompliserte og krever mer prosessering enn punktprøvebaserte kodere. Mange utstyrsprodusenter foretrekker derfor punktprøvebaserte kodere. Det er også utviklet talekodere som kan tilpasse bitraten til kapasiteten for overføringskanalen. Et eksempel er AMR-koderen (AMR – Adaptive Multi Rate) standardisert for UMTS. Denne koderen har 8 ulike overføringshastigheter fra 4,75 kbit/s til 12,2 kbit/s.

Det fins også talekodere der båndbredden for tale kan varieres (multimodus koding). Ett eksempel er talekoderen SILK som Skype benytter.

Talekommunikasjon over et IP-nett innebærer risiko for at enkelte datapakker tapes underveis. Det er defor innebygd feilkorrigeringsmekanismer i en del talekodere. Disse bidrar til at reduksjonen i talekvalitet forårsaket av pakketap blir minimalisert.

Les mer i Store norske leksikon

Kommentarer

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

eller registrer deg