200 likes | 381 Views
5. ANALIZA SPECTRALĂ A SEMNALULUI VOCAL. urechea realizează o analiză spectrală a undei acustice recepţionate. Metodele de analiză spectrală au ca obiective : analiza spectrală continuă a semnalului vocal (necesară în procesul recunoaşterii vorbirii sau a vorbitorului);
E N D
5. ANALIZA SPECTRALĂ A SEMNALULUI VOCAL • urechea realizează o analiză spectrală a undei acustice recepţionate
Metodele de analiză spectrală au ca obiective: • analiza spectrală continuă a semnalului vocal • (necesară în procesul recunoaşterii vorbirii sau a vorbitorului); • utilizarea rezultatelor analizei spectrale în tehnicile de sinteză a • semnalului vocal (bazate pe prelucrarea în domeniul frecvenţă). Principalele metode de analiză spectrală: • analiza cu ajutorul densităţii spectrale pe termen scurt, • pornind de la definirea transformatei Fourier pe termen scurt; • analiza spectrală cu ajutorul bancului de filtre; • analiza parametrică – parametrizarea semnalului vocal • pe baza modelării autoregresive (codarea prin predicţie liniară) • si a analizei cepstrale (homomorfice).
Analiza homomorfică (cepstrală) a semnalului vocal • semnalul x analizat provine din convoluţia a două semnale. • semnalului vocal x[n] se obţine ca o convoluţie între excitaţia • la nivel glotal, e[n] şi funcţia pondere a tractului vocal, h[n]. • separarea celor două semnale nu este posibilă prin filtrare • deoarece ele ocupă în general aceeaşi bandă de frecvenţă. • analiza homomorfică, ce are la bază noţiunea de cepstru, • permite în anumite condiţii separarea celor două semnale. • se realizează deconvoluţiasemnalului x[n]. • cepstrum(engleză), reprezintă anagrama cuvântului spectrum.
Schema bloc de realizare a unei prelucrări homomorfice Bloc de prelucrare liniară (“lifter”-engl.) * x[n] X(z) Z{} ln{} Z-1{} {} h[n] * H(z) Z{} exp{} Z-1{} -1{} • în cazul în care prelucrarea liniară este realizată în domeniul • frecvenţă, blocurile marcate cu `*` lipsesc.
1. 2. Proprietăţile cepstrului complex
3. Dacă funcţia X(z) este stabilă şi de fază minimă atunci cepstrul va fi cauzal
4. Cepstrul unei succesiuni de impulsuri Dirac periodice (de perioadă N şi amplitudine C):
pt. x2[n] pt. x1[n] Cepstrele corespunzătoare celor două secvenţe din exemplu
Evaluarea cepstrului real cu ajutorul DFT x[n] DFT X[k] ln{|●|} ln|X[k]| DFT-1 Cepstrul real
- pentru o transa sonora de semnal vocal: Utilizarea analizei cepstrale în prelucrarea semnalului vocal - e[n] = excitaţia idealizată formată din impulsuri unitate cu perioada P; - g[n] = funcţia pondere a filtrului trece jos (FTJ) ce simulează forma impulsurilor glotale; - ht[n] = funcţia pondere a tractului vocal; - r[n] = răspunsul la impuls al filtrului ce modelează regiunea buzelor; - w[n] = fereastră de ponderare.
atunci când o metodă de determinare nu furnizează o valoare • plauzibilă pentru perioada fundamentală P • se decide că tranşa respectivă este nesonoră. Estimarea frecvenţei fundamentale • estimarea frecvenţei fundamentale este legată de tranşele sonore. • perioada T0 este în general cuprinsă între limitele 2 ms – 17 ms; • frecvenţa fundamentală F0 variază între: • - 60 Hz – 250 Hz pentru voci masculine; • - 150 Hz – 500 Hz pentru voci feminine.
1. Metoda autocorelaţiei - evaluarea funcţiei de autocorelaţie pentru tranşa de N eşantioane ce acoperă mai multe perioade ale fundamentalei: - nu este necesară evaluarea funcţiei de autocorelaţie pentru toate valorile lui k, ci doar pentru un interval: - se caută maximul cel mai pronunţat al funcţiei de autocorelaţie cuprins în acest interval.
Exemplu: - o reducere a timpului de calcul se poate realiza dacă reţinem din fiecare eşantion x[n] doar partea care depăşeşte un anumit prag L:
- o altă posibilitate constă în a substitui toate eşantioanele ce depăşesc pragul L prin eşantioane de valoare fixă (de exemplu egale cu +/-1)
2. Metoda AMDF Average Magnitude Difference Function = metoda funcţiei medie a diferenţei modulelor - estimarea frecvenţei fundamentale se face prin găsirea indicelui k = P din intervalul menţionat, pentru care D[k] este minim posibil.
Semnalul original Eroarea de predicţie Filtrul invers x[n] H(z) = Ap(z) 3. Metoda filtrului invers - pentru o tranşă sonoră, acest filtru produce eroarea de predicţie, ce reprezintă excitaţia cvasiperiodică aplicată tractului vocal (multiplicată cu o constantă). - “perioada” P a poate fi determinată direct în domeniul timp. - rezultatele se îmbunătăţesc dacă se aplică metoda autocorelaţiei, considerând în locul semnalului x[n] secvenţa de eroare de la ieşirea filtrului invers.
pentru care = max. 4. Metoda cepstrală