260 likes | 582 Views
Wykład 8: Kwantyzacja i kompresja PCM, ADPCM, filtry adaptacyjne, kodowanie sygnałów mowy. PG – Katedra Systemów Mikroelektronicznych ZASTOSOWANIE PROCESORÓW SYGNAŁOWYCH Marek Wroński. Błędy kwantyzacji w przetwornikach A/D. e(n)=x(n)-x Q (n). Sym: a k =- a -k oraz b k =- b -k
E N D
Wykład 8: Kwantyzacja i kompresja PCM, ADPCM, filtry adaptacyjne, kodowanie sygnałów mowy PG – Katedra Systemów Mikroelektronicznych ZASTOSOWANIE PROCESORÓW SYGNAŁOWYCH Marek Wroński
Błędy kwantyzacji w przetwornikach A/D e(n)=x(n)-xQ(n) Sym: ak=- a-k oraz bk=- b-k Dla kwabtyzatora liniowego |e|<D/2 (2M+1) poziomów gdzie M=2(B-1)-1 Punkt krytyczny: aM+1=V oraz D=V/ 2(B-1) Dla liniowej gęstości prawdopodobieństwa pe(e)=1/ D dla |e|<D/2 (są też mid-rised) Dla +3dBm0 (max mocy) więc dla X<3:
SNR rozkładu Gausowskiego Maska dla szumowego sygnału testowego (dla sin maska –45dB-0 max 33dB)
Kwantyzacja z minimalnymi zniekształceniami Szum kwantyzacji: Wartości optymalne:
Nierównomierny rozkład gęstościprawdopodobieństwa, np. eksponencjalny Dla nierównomiernego rozkładu gęstości prawdop:(ucho czulsze na szum kwantyzacji, gdy szum dużyw stosunku do sygnału) transformacja h=g(x)
Maksymalizacja nie SNR lecz zakresu mocy sygnału w którym SNR jest większe od zadanego Kodeki (koder+dekoder) z kompresją sygnałów wg.zasady m i A Companding=compression+expanding m-Law (amerykański PCM): A-Law (europejski PCM):
Kompresuje 13-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej Koder typu m (m-Law PCM)
Wartości końca przedziałów {xi}: Algorytm m-Law PCM Na koniec inwersja bitów
Kompresuje 14-bitowy zakres dynamiczny do 8-bitowej wartości cyfrowej Koder typu A (A-Law PCM)
Wartości końca przedziałów {xi}: Algorytm A-Law PCM Na koniec inwersja bitów
Sprawność koderów PCM (m-i A-typu) SNR rozkładu Gausowskiego:
Gdy oczekiwana max moc s2 wtedy nasycenie ch-ki kwantyzacji dla K1s (zwykle K1=4) K1 jest mierzone jako stosunek: pik-pik do rms. Estymacja szumu kwantyzacji (dla N bitów): gdzie K2 zależy od kształtu gęstości prawdop. Dlatego wystarczy N-1 bitów dla takiej samej mocy szumu kwantyz. gdy moc sygn.zredukować 1/4.Niech {Rxx(k)} autokorelacja {x(n)} Kodowanie predykcyjne 1-rzędu (do przodu) Min wariancji dla a=rxx(1) Wtedy N1bits
Kodowanie różnicowe DPCM (Differential Pulse code Modulation)
Ponieważ mowa jest krótkoterminowo (100ms) prawie stacjonarna rxx(1) jest dobrze Zdefiniowany dlatego współczynnik a dobrze śledzi za zmianami statystyki sygnału i może być okeślony z min. błędu {e(n)}co daje dla kodera z otwartą pętlą: Kodowanie adaptacyjne dla kodera z zamkniętą pętlą: Dla stabilności i uproszczenia algorytmu ADPCM: Ponieważ {e(n)} nie jest z natury stacjonarne dlatego kwantyzator Q powinien być adaptacyjny. Posiada on kilka poziomów i gdy sygnał konsekwentnie (kilka razy) jest zbyt mały jest traktowany jako mały i inaczej skalowany. To samo dotyczy Powtarzających się „dużych” sygnałów (następuje zmiana kroków wg. optymalnej decyzji)
Adaptive Differential Pulse Code Modulation (ADPCM) - Encoder Wykorzystuje on adaptacyjny predyktor dla redukcji liczby bitów z 8- (PCM) do 4. Filtr rekonstrukcyjny jest typu IIR z 2 biegunami i 6 zerami. ADPCM nie używa do transmisji próbek sygnału a różnicę z wartością przewidy- waną. Sam kwantyzator rozdzielono na 2 sekcje: adaptacyjne bitowe kodowanie i adaptacyjne bitowe dekodowanie (w dekoderze tylko jedna sekcja) · {s1(n)} sygn. liniowy
Adaptacyjny kwantyzator i predyktor 7-,15-,lub 31-poz. nieliniowy (log2(d(n)) kwantyzator dla sygn. różnicowego {d(n)}, co odpowiada 3,4lub 5 bitom na próbkę. Adaptacje poprzez skalowanie log2(d(n)) przez mnożnik y(n) przeliczany z każdą próbką. Predyktor estymuje sygnał jako: Syg.rekonstrukcyjny: wsp. met. gradientów: Dla stabilności IIR:
Używane dla szerokiego pasma np. dla wideokonferncji(50-7000Hz) dzielonego na 2 podpasma (0-4000 i 4000-8000Hz) do których stosowana jest oddzielnie ADPCM 2-pasmowa (Sub-Band) ADPCM FIR 24-parametrowy z odpow.impuls.=fun.opóżnienia
1. Częstotliwość próbkowania fs = 8 kHz 2. Podział na bloki 30 ms, w których zakłada się quasi-stacjonarność 3. Okno o długości 240 próbki przesuwane co 180 próbek 4. Estymacja i przesyłanie współczynników modelu generacyjnego sygnału mowy Model generacji sygnału mowy Kodowanie predykcyjne – wokoder LPC-10
Filtry adaptacyjne • Wygładzanienie (smoothing)wg. danych zebranych także po chwili t (dokładniejsze) • Predykcja tj.określenie informacji o procesie, który będzie miał miejsce w przyszłości • filtracja, która oznacza estymację informacji w chwili t na podstawie zebranych danych