Pulskodemodulering - Pulse-code modulation

Pulskodemodulering
Filnavn forlengelse
.L16, .WAV, .AIFF, .AU, .PCM
Internett -medietype
lyd/L16, lyd/L8, lyd/L20, lyd/L24
Skriv inn kode "AIFF" for L16, ingen
Magisk nummer Varierer
Type format Ukomprimert lyd
Inneholdt av Lyd -CD , AES3 , WAV , AIFF , AU , M2TS , VOB og mange andre

Pulskodemodulering ( PCM ) er en metode som brukes til digitalt å representere samplede analoge signaler . Det er standardformen for digital lyd i datamaskiner, CD -plater , digital telefoni og andre digitale lydapplikasjoner. I et PCM -strøm , at amplituden blir til det analoge signalet samples regelmessig med jevne mellomrom, og hver prøve blir kvantisert til nærmeste verdi innenfor et område av digitale trinn.

Lineær pulskodemodulering ( LPCM ) er en spesifikk type PCM der kvantiseringsnivåene er lineært uniform. Dette er i motsetning til PCM-kodinger der kvantiseringsnivåer varierer som en funksjon av amplitude (som med A-lov algoritmen eller μ-lov algoritmen ). Selv om PCM er et mer generelt begrep, brukes det ofte for å beskrive data som er kodet som LPCM.

En PCM -strøm har to grunnleggende egenskaper som bestemmer strømmenes troskap til det originale analoge signalet: samplingshastigheten , som er antall ganger i sekundet som prøvene tas; og bitdybden , som bestemmer antall mulige digitale verdier som kan brukes til å representere hver prøve.

Historie

Tidlig elektrisk kommunikasjon begynte å samle signaler for å multiplekse prøver fra flere telegrafi -kilder og overføre dem over en enkelt telegrafkabel. Den amerikanske oppfinneren Moses G. Farmer formidlet telegraf -tidsdelingsmultipleksering (TDM) allerede i 1853. Elektroingeniør WM Miner brukte i 1903 en elektromekanisk kommutator for tidsdelingsmultipleksering av flere telegrafsignaler; han brukte også denne teknologien til telefoni . Han fikk forståelig tale fra kanaler samplet med en hastighet over 3500–4300 Hz; lavere priser viste seg å være utilfredsstillende.

I 1920 brukte Bartlane kabelbildeoverføringssystem telegrafsignalering av tegn som ble stanset i papirbånd for å sende prøver av bilder kvantisert til 5 nivåer. I 1926 patenterte Paul M. Rainey fra Western Electric en faksmaskin som overførte signalet ved hjelp av 5-biters PCM, kodet av en opto-mekanisk analog-til-digital-omformer . Maskinen kom ikke i produksjon.

Den britiske ingeniøren Alec Reeves , uvitende om tidligere arbeid, tenkte bruk av PCM for talekommunikasjon i 1937 mens han jobbet for International Telephone and Telegraph i Frankrike. Han beskrev teorien og dens fordeler, men ingen praktisk anvendelse resulterte. Reeves søkte om et fransk patent i 1938, og hans amerikanske patent ble gitt i 1943. På dette tidspunktet hadde Reeves begynt å jobbe ved Telecommunications Research Establishment .

Den første taleoverføringen med digitale teknikker, SIGSALY- krypteringsutstyret, formidlet alliert kommunikasjon på høyt nivå under andre verdenskrig . I 1943 ble Bell Labs -forskerne som designet SIGSALY -systemet klar over bruken av PCM -binær koding som allerede foreslått av Reeves. I 1949, for Canadian Navy's DATAR -system, bygde Ferranti Canada et fungerende PCM -radiosystem som var i stand til å overføre digitaliserte radardata over lange avstander.

PCM på 1940-tallet og tidlig på 1950-tallet anvendt en katode-stråle -kodende rør med en plateelektrode som har koder for perforeringer. Som i et oscilloskop ble strålen feid horisontalt med samplingshastigheten mens den vertikale avbøyningen ble kontrollert av det analoge inngangssignalet, noe som fikk strålen til å passere gjennom høyere eller lavere deler av den perforerte platen. Platen samlet eller passerte strålen, og produserte nåværende variasjoner i binær kode, en bit om gangen. I stedet for naturlig binær ble rutenettet til Goodalls senere rør perforert for å produsere en feilfri grå kode og produserte alle biter samtidig ved å bruke en viftebjelke i stedet for en skannestråle.

I USA har National Inventors Hall of Fame hedret Bernard M. Oliver og Claude Shannon som oppfinnerne av PCM, som beskrevet i "Communication System Employing Pulse Code Modulation", US Patent 2,801,281 arkivert i 1946 og 1952, gitt i 1956 Et annet patent med samme tittel ble innlevert av John R. Pierce i 1945, og utstedt i 1948: US Patent 2,437,707 . De tre publiserte "The Philosophy of PCM" i 1948.

Den T-bærersystemet, som ble innført i 1961, har to tvunnede overføringslinjer for å bære 24 PCM telefonsamtaler samplet ved 8 kHz og 8-bits oppløsning. Denne utviklingen forbedret kapasiteten og samtalekvaliteten sammenlignet med de tidligere frekvensdelte multipleksingsordningene .

I 1973 ble adaptiv differensial pulskodemodulering (ADPCM) utviklet av P. Cummiskey, Nikil Jayant og James L. Flanagan .

Digitale lydopptak

I 1967 ble den første PCM -opptakeren utviklet av NHKs forskningsanlegg i Japan. 30 kHz 12-bits enheten brukte en kompander (ligner DBX støyreduksjon ) for å utvide det dynamiske området, og lagret signalene på en videobåndopptaker . I 1969 utvidet NHK systemets muligheter til 2-kanals stereo og 32 kHz 13-biters oppløsning. I januar 1971, ved bruk av NHKs PCM -opptakssystem, spilte ingeniører ved Denon inn de første kommersielle digitale opptakene.

I 1972 avduket Denon den første 8-kanals digitale opptakeren, DN-023R, som brukte en 4-hodet åpen rullesending videobåndopptaker for å ta opp i 47,25 kHz, 13-biters PCM-lyd. I 1977 utviklet Denon det bærbare PCM-opptakssystemet, DN-034R. I likhet med DN-023R spilte den inn 8 kanaler ved 47,25 kHz, men den brukte 14-bits "med vekt , noe som tilsvarer 15,5 bits."

I 1979 ble det første digitale popalbumet, Bop till You Drop , spilt inn. Den ble spilt inn i 50 kHz, 16-biters lineær PCM ved hjelp av en 3M digital båndopptaker.

Den kompaktplater (CD) bringes PCM til forbruker lydprogrammer med introduksjonen i 1982. CD benytter en 44.100 Hz samplingsfrekvens, og 16-bits oppløsning og lagrer opptil 80 minutter med stereolyd per plate.

Digital telefoni

Den raske utviklingen og den brede adopsjonen av PCM digital telefoni ble muliggjort av metall -oksid -halvleder (MOS) koblet kondensator (SC) kretsteknologi, utviklet på begynnelsen av 1970 -tallet. Dette førte til utviklingen av PCM-kodek-filterbrikker på slutten av 1970-tallet. De silisium-gate CMOS (utfyllende MOS) PCM codec-filter chip, utviklet av David A. Hodges og WC svart i 1980, har siden vært en standard for digital telefoni. I 1990-årene telekommunikasjonsnett , slik som det offentlige telefonnettet (PSTN) var blitt i stor grad digitalisert med meget-stor-skala integrasjon (VLSI) CMOS PCM-kodek-filtre, mye brukt i elektroniske koblingssystemer for telefonsentraler , bruker-end modemer og et bredt spekter av digitale overføringsapplikasjoner som det integrerte digitale nettverket (ISDN), trådløse telefoner og mobiltelefoner .

Implementeringer

PCM er metoden for koding som vanligvis brukes for ukomprimert digital lyd.

  • Den 4ESS bryteren innførte tidsdelt svitsjing i det amerikanske telefonsystemet i 1976, basert på middels skala integrert kretsteknikk.
  • LPCM brukes til tapsfri koding av lyddata i Compact disc Red Book -standarden (uformelt også kjent som Audio CD ), introdusert i 1982.
  • AES3 (spesifisert i 1985, som S/PDIF er basert på) er et bestemt format som bruker LPCM.
  • LaserDiscs med digital lyd har et LPCM -spor på den digitale kanalen.
  • På PCer refererer PCM og LPCM ofte til formatet som brukes i WAV (definert i 1991) og AIFF lydbeholderformater (definert i 1988). LPCM data kan også lagres i andre formater, for eksempel AU , rå audioformat (header-mindre fil) og ulike multimedia container formater .
  • LPCM har blitt definert som en del av DVD (siden 1995) og Blu-ray (siden 2006) standarder. Det er også definert som en del av forskjellige digitale video- og lydlagringsformater (f.eks. DV siden 1995, AVCHD siden 2006).
  • LPCM brukes av HDMI (definert i 2002), et enkeltkabels digitalt audio/videokontaktgrensesnitt for overføring av ukomprimerte digitale data.
  • RF64- beholderformat (definert i 2007) bruker LPCM og tillater også bitstrømlagring som ikke er PCM: forskjellige komprimeringsformater som finnes i RF64-filen som dataserier (Dolby E, Dolby AC3, DTS, MPEG-1/MPEG-2 Audio) kan "forkledd" som lineær PCM.

Modulasjon

Prøvetaking og kvantisering av et signal (rødt) for 4-bits LPCM

I diagrammet er en sinusbølge (rød kurve) samplet og kvantisert for PCM. Sinusbølgen samples med jevne mellomrom, vist som vertikale linjer. For hver prøve velges en av de tilgjengelige verdiene (på y-aksen). PCM-prosessen implementeres vanligvis på en enkelt integrert krets som kalles en analog-til-digital-omformer (ADC). Dette gir en fullstendig diskret representasjon av inngangssignalet (blå punkter) som enkelt kan kodes som digitale data for lagring eller manipulasjon. Flere PCM -strømmer kan også multiplexeres til en større samlet datastrøm , vanligvis for overføring av flere strømmer over en enkelt fysisk kobling. En teknikk kalles time-division multiplexing (TDM) og er mye brukt, særlig i det moderne offentlige telefonsystemet.

Demodulasjon

Elektronikken som er involvert i å produsere et nøyaktig analogt signal fra de diskrete dataene ligner på det som brukes for å generere det digitale signalet. Disse enhetene er digital-til-analoge omformere (DAC). De produserer en spenning eller strøm (avhengig av type) som representerer verdien som presenteres på deres digitale innganger. Denne utgangen vil da generelt bli filtrert og forsterket for bruk.

For å gjenopprette det originale signalet fra de samplede dataene, kan en demodulator anvende prosedyren for modulering i revers. Etter hver samplingsperiode leser demodulatoren den neste verdien og overfører utgangssignalet til den nye verdien. Som et resultat av disse overgangene beholder signalet en betydelig mengde høyfrekvent energi på grunn av bildebehandlingseffekter. For å fjerne disse uønskede frekvensene, sender demodulatoren signalet gjennom et rekonstruksjonsfilter som undertrykker energi utenfor det forventede frekvensområdet (større enn Nyquist -frekvensen ).

Standard prøvetaking presisjon og hastigheter

Vanlige prøvedybder for LPCM er 8, 16, 20 eller 24 bits per prøve .

LPCM koder for en enkelt lydkanal. Støtte for flerkanalslyd avhenger av filformat og er avhengig av synkronisering av flere LPCM -strømmer. Selv om to kanaler (stereo) er det vanligste formatet, kan systemer støtte opptil 8 lydkanaler (7.1 surround) eller mer.

Vanlige samplingsfrekvenser er 48 kHz som brukt med DVD -formatvideoer, eller 44,1 kHz som brukt på CDer. Samplingsfrekvenser på 96 kHz eller 192 kHz kan brukes på noe utstyr, men fordelene har blitt diskutert.

Begrensninger

De Nyquist-Shannon samplingsteoremet viser PCM-enheter kan operere uten å introdusere forvrengninger i sine utformet frekvensbånd hvis de gir en samplingsfrekvens på minst det dobbelte av den høyeste frekvens som finnes i inngangssignalet. For eksempel, innen telefoni , varierer det brukbare stemmefrekvensbåndet fra omtrent 300  Hz til 3400 Hz. For effektiv rekonstruksjon av stemmesignalet bruker telefoniopplikasjoner derfor vanligvis en samplingsfrekvens på 8000 Hz, som er mer enn dobbelt så høy som den brukbare stemmefrekvensen.

Uansett er det potensielle kilder til svekkelse implisitt i ethvert PCM -system:

  • Å velge en diskret verdi som er nær, men ikke akkurat på det analoge signalnivået for hver prøve, fører til kvantiseringsfeil .
  • Mellom prøvene utføres ingen måling av signalet; samplingssetningen garanterer ikke-tvetydig representasjon og gjenoppretting av signalet bare hvis det ikke har energi ved frekvens f s /2 eller høyere (halvparten av samplingsfrekvensen, kjent som Nyquist-frekvensen ); høyere frekvenser vil ikke bli korrekt representert eller gjenopprettet og legge til aliasing -forvrengning til signalet under Nyquist -frekvensen.
  • Siden prøver er avhengige av tid, kreves en nøyaktig klokke for nøyaktig reproduksjon. Hvis enten klokke- eller dekodingsklokken ikke er stabil, vil disse feilene direkte påvirke enhetens utskriftskvalitet.

Behandling og koding

Noen former for PCM kombinerer signalbehandling med koding. Eldre versjoner av disse systemene brukte behandlingen i det analoge domenet som en del av den analog-til-digitale prosessen; nyere implementeringer gjør det i det digitale domenet. Disse enkle teknikkene har i stor grad blitt foreldet av moderne transformbaserte lydkomprimeringsteknikker , for eksempel modifisert diskret cosinus transform (MDCT) koding.

  • Lineær PCM (LPCM) er PCM med lineær kvantisering.
  • Differensiell PCM (DPCM) koder PCM -verdiene som forskjeller mellom gjeldende og forutsagt verdi. En algoritme forutsier den neste prøven basert på de tidligere prøvene, og koderen lagrer bare forskjellen mellom denne prediksjonen og den faktiske verdien. Hvis prediksjonen er rimelig, kan færre biter brukes til å representere den samme informasjonen. For lyd reduserer denne typen koding antall biter som kreves per prøve med omtrent 25% sammenlignet med PCM.
  • Adaptiv differensialpuls-kodemodulering (ADPCM) er en variant av DPCM som varierer størrelsen på kvantiseringstrinnet, for å tillate ytterligere reduksjon av den nødvendige båndbredden for et gitt signal-støy-forhold .
  • Delta modulering er en form for DPCM som bruker en bit per prøve for å indikere om signalet øker eller synker sammenlignet med forrige prøve.

I telefoni er et standard lydsignal for et enkelt telefonsamtale kodet som 8000 prøver per sekund , på 8 bits hver, noe som gir et digitalt signal på 64 kbit/s kjent som DS0 . Standardsignalkomprimering koding på en DS0 er enten μ-lov (mu-law) PCM (Nord-Amerika og Japan) eller A-lov PCM (Europa og det meste av resten av verden). Dette er logaritmiske komprimeringssystemer der et 12- eller 13-biters lineært PCM-prøvetall blir kartlagt til en 8-bits verdi. Dette systemet er beskrevet av internasjonal standard G.711 .

Der kretskostnadene er høye og tap av stemmekvalitet er akseptabelt, er det noen ganger fornuftig å komprimere stemmesignalet ytterligere. En ADPCM-algoritme brukes til å kartlegge en serie med 8-bits μ-law eller A-law PCM-prøver til en serie med 4-biters ADPCM-prøver. På denne måten dobles kapasiteten til linjen. Teknikken er detaljert i G.726 -standarden.

Lydkodingsformater og lydkodeker er utviklet for å oppnå ytterligere komprimering. Noen av disse teknikkene har blitt standardisert og patentert. Avanserte komprimeringsteknikker, som MDCT og lineær prediktiv koding (LPC), er nå mye brukt i mobiltelefoner , voice over IP (VoIP) og streamingmedier .

Koding for seriell overføring

PCM kan enten være retur-til-null (RZ) eller ikke-retur-til-null (NRZ). For at et NRZ-system skal synkroniseres ved hjelp av informasjon i bånd, må det ikke være lange sekvenser av identiske symboler, for eksempel ens eller nuller. For binære PCM-systemer kalles tettheten til 1-symboler ens-tetthet .

Tettheten blir ofte kontrollert ved hjelp av forkodingsteknikker som begrenset koding av løpslengde , der PCM-koden utvides til en litt lengre kode med en garantert bundet på ens-tetthet før modulering inn i kanalen. I andre tilfeller blir ekstra rammebiter lagt til i strømmen, noe som garanterer minst sporadiske symboloverganger.

En annen teknikk som brukes til å kontrollere ens-tettheten er bruk av en scrambler på dataene, som vil ha en tendens til å gjøre datastrømmen til en strøm som ser pseudo-tilfeldig ut , men hvor dataene kan gjenopprettes nøyaktig med en komplementær descrambler. I dette tilfellet er lange serier med nuller eller ener fortsatt mulig på utgangen, men anses usannsynlig nok til å tillate pålitelig synkronisering.

I andre tilfeller er den langsiktige DC -verdien til det modulerte signalet viktig, ettersom det å bygge opp en DC -forspenning vil ha en tendens til å flytte kommunikasjonskretser ut av driftsområdet. I dette tilfellet iverksettes det spesielle tiltak for å holde tellingen av den kumulative DC -skjevheten og for å endre kodene om nødvendig for å få DC -forspenningen alltid til å gå tilbake til null.

Mange av disse kodene er bipolare koder , der pulser kan være positive, negative eller fraværende. I den typiske alternative merkeinversjonskoden veksler ikke-nullpulser mellom å være positiv og negativ. Disse reglene kan brytes for å generere spesielle symboler som brukes til innramming eller andre spesielle formål.

Nomenklatur

Ordet puls i begrepet pulskodemodulering refererer til pulser som finnes i overføringslinjen. Dette er kanskje en naturlig konsekvens av at denne teknikken har utviklet seg sammen med to analoge metoder, pulsbreddemodulering og pulsposisjonsmodulering , der informasjonen som skal kodes representeres av diskrete signalpulser med henholdsvis varierende bredde eller posisjon. I denne forbindelse ligner PCM lite på disse andre former for signalkoding, bortsett fra at alle kan brukes i tidsdelingsmultipleksering, og tallene til PCM-kodene er representert som elektriske pulser.

Se også

Merknader

Referanser

Videre lesning

Eksterne linker