Wykład 8: Kwantyzacja i kompresja PCM, ADPCM, filtry adaptacyjne, kodowanie sygnałów mowy

Wykład 8: Kwantyzacja i kompresja PCM, ADPCM, filtry adaptacyjne, kodowanie sygnałów mowy PG – Katedra Systemów Mikroelektronicznych ZASTOSOWANIE PROCESORÓW SYGNAŁOWYCH Marek Wroński

Błędy kwantyzacji w przetwornikach A/D e(n)=x(n)-xQ(n) Sym: ak=- a-k oraz bk=- b-k Dla kwabtyzatora liniowego |e|<D/2 (2M+1) poziomów gdzie M=2(B-1)-1 Punkt krytyczny: aM+1=V oraz D=V/ 2(B-1) Dla liniowej gęstości prawdopodobieństwa pe(e)=1/ D dla |e|<D/2 (są też mid-rised) Dla +3dBm0 (max mocy) więc dla X<3:

SNR rozkładu Gausowskiego Maska dla szumowego sygnału testowego (dla sin maska –45dB-0 max 33dB)

Kwantyzacja z minimalnymi zniekształceniami Szum kwantyzacji: Wartości optymalne:

Nierównomierny rozkład gęstościprawdopodobieństwa, np. eksponencjalny Dla nierównomiernego rozkładu gęstości prawdop:(ucho czulsze na szum kwantyzacji, gdy szum dużyw stosunku do sygnału) transformacja h=g(x)

Maksymalizacja nie SNR lecz zakresu mocy sygnału w którym SNR jest większe od zadanego Kodeki (koder+dekoder) z kompresją sygnałów wg.zasady m i A Companding=compression+expanding m-Law (amerykański PCM): A-Law (europejski PCM):

Kompresuje 13-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej Koder typu m (m-Law PCM)

Wartości końca przedziałów {xi}: Algorytm m-Law PCM Na koniec inwersja bitów

Kompresuje 14-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej Koder typu A (A-Law PCM)

Wartości końca przedziałów {xi}: Algorytm A-Law PCM Na koniec inwersja bitów

Sprawność koderów PCM (m-i A-typu) SNR rozkładu Gausowskiego:

Gdy oczekiwana max moc s2 wtedy nasycenie ch-ki kwantyzacji dla K1s (zwykle K1=4) K1 jest mierzone jako stosunek: pik-pik do rms. Estymacja szumu kwantyzacji (dla N bitów): gdzie K2 zależy od kształtu gęstości prawdop. Dlatego wystarczy N-1 bitów dla takiej samej mocy szumu kwantyz. gdy moc sygn.zredukować 1/4.Niech {Rxx(k)} autokorelacja {x(n)} Kodowanie predykcyjne 1-rzędu (do przodu) Min wariancji dla a=rxx(1) Wtedy N1bits

Kodowanie różnicowe DPCM (Differential Pulse code Modulation)

Ponieważ mowa jest krótkoterminowo (100ms) prawie stacjonarna rxx(1) jest dobrze Zdefiniowany dlatego współczynnik a dobrze śledzi za zmianami statystyki sygnału i może być okeślony z min. błędu {e(n)}co daje dla kodera z otwartą pętlą: Kodowanie adaptacyjne dla kodera z zamkniętą pętlą: Dla stabilności i uproszczenia algorytmu ADPCM: Ponieważ {e(n)} nie jest z natury stacjonarne dlatego kwantyzator Q powinien być adaptacyjny. Posiada on kilka poziomów i gdy sygnał konsekwentnie (kilka razy) jest zbyt mały jest traktowany jako mały i inaczej skalowany. To samo dotyczy Powtarzających się „dużych” sygnałów (następuje zmiana kroków wg. optymalnej decyzji)

Adaptive Differential Pulse Code Modulation (ADPCM) - Encoder Wykorzystuje on adaptacyjny predyktor dla redukcji liczby bitów z 8- (PCM) do 4. Filtr rekonstrukcyjny jest typu IIR z 2 biegunami i 6 zerami. ADPCM nie używa do transmisji próbek sygnału a różnicę z wartością przewidy- waną. Sam kwantyzator rozdzielono na 2 sekcje: adaptacyjne bitowe kodowanie i adaptacyjne bitowe dekodowanie (w dekoderze tylko jedna sekcja) · {s1(n)} sygn. liniowy

Adaptacyjny kwantyzator i predyktor 7-,15-,lub 31-poz. nieliniowy (log2(d(n)) kwantyzator dla sygn. różnicowego {d(n)}, co odpowiada 3,4lub 5 bitom na próbkę. Adaptacje poprzez skalowanie log2(d(n)) przez mnożnik y(n) przeliczany z każdą próbką. Predyktor estymuje sygnał jako: Syg.rekonstrukcyjny: wsp. met. gradientów: Dla stabilności IIR:

Opis Kodeka ADPCM (ITU-T G.726)

ADPCM - Decoder

Szumy kwantyzacji ADPCM

Używane dla szerokiego pasma np. dla wideokonferncji(50-7000Hz) dzielonego na 2 podpasma (0-4000 i 4000-8000Hz) do których stosowana jest oddzielnie ADPCM 2-pasmowa (Sub-Band) ADPCM FIR 24-parametrowy z odpow.impuls.=fun.opóżnienia

Higher and Lower Sub-Band Encoder

Higher and Lower Sub-Band Decoder

Metody kompresji stratnej sygnałów mowy

1. Częstotliwość próbkowania fs = 8 kHz 2. Podział na bloki 30 ms, w których zakłada się quasi-stacjonarność 3. Okno o długości 240 próbki przesuwane co 180 próbek 4. Estymacja i przesyłanie współczynników modelu generacyjnego sygnału mowy Model generacji sygnału mowy Kodowanie predykcyjne – wokoder LPC-10

Filtry adaptacyjne • Wygładzanienie (smoothing)wg. danych zebranych także po chwili t (dokładniejsze) • Predykcja tj.określenie informacji o procesie, który będzie miał miejsce w przyszłości • filtracja, która oznacza estymację informacji w chwili t na podstawie zebranych danych

Podstawowe układy aplikacyjne filtrów adaptacyjnych

Wykład 8: Kwantyzacja i kompresja PCM, ADPCM, filtry adaptacyjne, kodowanie sygnałów mowy