Talekoding er å omforme et analogt signal som representerer tale  til sekvenser av binære tall (0 og 1). Strømmen av disse bit blir et digitalt signal som  kan overføres over moderne telenett som ISDN, GSM/UMTS eller Internett

Det digitale signalet genereres med en analog-digital-omformer, der det analoge talesignalet blir målt med jevne mellomrom. En viktig del av talekodingsprosessen er å redusere antall bit, slik at det er tilpasset kapasiteten til den aktuelle overføringskanalen.

På mottakersiden omformes signalet tilbake til analog form ved hjelp av en digital-analog-omformer. Siden målingene av det originale talesignalet nødvendigvis må ha en begrenset nøyaktighet, vil det gjenskapte talesignalet avvike litt fra originalen. Differansen kalles kvantiseringsstøy og skal holdes minst mulig i forhold til styrken på talesignalet. For noen talekodere gjøres dette ved å nytte grovere målenøyaktighet for de sterkeste signalene enn for de svakeste.

Den første talekoderen som ble standardisert er PCM (pulskodemodulasjon), som har to alternative bit-reduserende  kvantisering-løsninger kalt A-lov og µ-lov spesifisert i rekommandasjon G.711 fra ITU-T. Disse gir redusert bitrate fra 96 kbit/s til 64 kbit/s. Første utgave av denne standarden ble godkjent i 1972.

Senere er det standardisert en rekke talekodingsalgoritmer som redurserer kravet til overføringskapasitet. Grovt kan disse algoritmene deles inn i to grupper:

  • Punktprøvebasert, der hvert enkelt måletall (punktprøve) kodes.
  • Rammebasert, der et antall  påfølgende måletall samles og kodes under ett.

PCM-talekoderen er punktprøvebasert.

I stedet for å overføre informasjon for hver enkelt punktprøve, kan  bitraten redusere  ved å sende informasjon om differensen i størrelse til forrige punktprøve, såkalt Differensiell PCM  (DPCM). Det er også mulig å legge til adaptiv tilpasning av kvantisering-trinnene (skala for måleverdier).

En annen metode er å dele opp frekvensbåndet for talen i to eller flere delbånd som kodes hvert for seg. Et eksempel er en SB-ADPCM talekoder ( Delbånd Adaptiv Differensiell PCM)  med HD-tale gitt i ITU-T rekommandasjon G.722.

Rammebaserte kodere er de mest effektive. I stedet for å overføre talens bølgeform opprettes en modell for generering av tale, og modellens parametre og talens pitch overfører. Et eksempel på dette er EFR koderen som benyttes i GSM. Den reduserer bitraten til 12,2 kbit/s og har tilnærmet samme talekvalitet som PCM. Mellom ulike kodere er variasjonen i bitrater ganske stor. For de laveste bitratene er talekvaliteten dårligere enn PCM. For krypterte telefonsignaler i  militære systemer kan bitraten være helt ned til 2,4 kbit/s.

Rammebaserte kodere er mer kompliserte og krever større prosessorkapasitet enn punktprøvebaserte kodere. Mange utstyrsprodusenter foretrekker derfor punktprøvebaserte kodere. Det er også utviklet talekodere som kan tilpasse bitraten til kapasiteten for overføringskanalen. Et eksempel er AMR-koderen (AMR - Adaptive Multi Rate) standardisert  for UMTS. Denne koderen har 8 ulike overføringshastigheter fra 4,75 kbit/s til 12,2 kbit/s.

Det fins også talekodere der båndbredden for tale kan varieres (multimodus koding). Ett eksempel er talekoderen SILK som Skype benytter.

Talekommunikasjon over et IP-nett innebærer risiko for at enkelte datapakker tapes underveis. Det er defor innebygd feilkorrigeringsmekanismer i en del talekodere. Disse bidrar til at reduksjonen i talekvalitet forårsaket av pakketap blir minimalisert.

Foreslå endringer i tekst

Foreslå bilder til artikkelen

Kommentarer

Har du spørsmål om eller kommentarer til artikkelen?

Kommentaren din vil bli publisert under artikkelen, og fagansvarlig eller redaktør vil svare når de har mulighet.

Du må være logget inn for å kommentere.