1 / 20

5. ANALIZA SPECTRALĂ A SEMNALULUI VOCAL

5. ANALIZA SPECTRALĂ A SEMNALULUI VOCAL. urechea realizează o analiză spectrală a undei acustice recepţionate. Metodele de analiză spectrală au ca obiective : analiza spectrală continuă a semnalului vocal (necesară în procesul recunoaşterii vorbirii sau a vorbitorului);

judah
Download Presentation

5. ANALIZA SPECTRALĂ A SEMNALULUI VOCAL

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 5. ANALIZA SPECTRALĂ A SEMNALULUI VOCAL • urechea realizează o analiză spectrală a undei acustice recepţionate

  2. Metodele de analiză spectrală au ca obiective: • analiza spectrală continuă a semnalului vocal • (necesară în procesul recunoaşterii vorbirii sau a vorbitorului); • utilizarea rezultatelor analizei spectrale în tehnicile de sinteză a • semnalului vocal (bazate pe prelucrarea în domeniul frecvenţă). Principalele metode de analiză spectrală: • analiza cu ajutorul densităţii spectrale pe termen scurt, • pornind de la definirea transformatei Fourier pe termen scurt; • analiza spectrală cu ajutorul bancului de filtre; • analiza parametrică – parametrizarea semnalului vocal • pe baza modelării autoregresive (codarea prin predicţie liniară) • si a analizei cepstrale (homomorfice).

  3. Analiza homomorfică (cepstrală) a semnalului vocal • semnalul x analizat provine din convoluţia a două semnale. • semnalului vocal x[n] se obţine ca o convoluţie între excitaţia • la nivel glotal, e[n] şi funcţia pondere a tractului vocal, h[n]. • separarea celor două semnale nu este posibilă prin filtrare • deoarece ele ocupă în general aceeaşi bandă de frecvenţă. • analiza homomorfică, ce are la bază noţiunea de cepstru, • permite în anumite condiţii separarea celor două semnale. • se realizează deconvoluţiasemnalului x[n]. • cepstrum(engleză), reprezintă anagrama cuvântului spectrum.

  4. Transformare homomorfică

  5. Schema bloc de realizare a unei prelucrări homomorfice Bloc de prelucrare liniară (“lifter”-engl.) * x[n] X(z) Z{} ln{} Z-1{} {} h[n] * H(z) Z{} exp{} Z-1{} -1{} • în cazul în care prelucrarea liniară este realizată în domeniul • frecvenţă, blocurile marcate cu `*` lipsesc.

  6. 1. 2. Proprietăţile cepstrului complex

  7. 3. Dacă funcţia X(z) este stabilă şi de fază minimă atunci cepstrul va fi cauzal

  8. 4. Cepstrul unei succesiuni de impulsuri Dirac periodice (de perioadă N şi amplitudine C):

  9. Exemplu:

  10. pt. x2[n] pt. x1[n] Cepstrele corespunzătoare celor două secvenţe din exemplu

  11. Evaluarea cepstrului real cu ajutorul DFT x[n] DFT X[k] ln{|●|} ln|X[k]| DFT-1 Cepstrul real

  12. - pentru o transa sonora de semnal vocal: Utilizarea analizei cepstrale în prelucrarea semnalului vocal - e[n] = excitaţia idealizată formată din impulsuri unitate cu perioada P; - g[n] = funcţia pondere a filtrului trece jos (FTJ) ce simulează forma impulsurilor glotale; - ht[n] = funcţia pondere a tractului vocal; - r[n] = răspunsul la impuls al filtrului ce modelează regiunea buzelor; - w[n] = fereastră de ponderare.

  13. atunci când o metodă de determinare nu furnizează o valoare • plauzibilă pentru perioada fundamentală P • se decide că tranşa respectivă este nesonoră. Estimarea frecvenţei fundamentale • estimarea frecvenţei fundamentale este legată de tranşele sonore. • perioada T0 este în general cuprinsă între limitele 2 ms – 17 ms; • frecvenţa fundamentală F0 variază între: • - 60 Hz – 250 Hz pentru voci masculine; • - 150 Hz – 500 Hz pentru voci feminine.

  14. 1. Metoda autocorelaţiei - evaluarea funcţiei de autocorelaţie pentru tranşa de N eşantioane ce acoperă mai multe perioade ale fundamentalei: - nu este necesară evaluarea funcţiei de autocorelaţie pentru toate valorile lui k, ci doar pentru un interval: - se caută maximul cel mai pronunţat al funcţiei de autocorelaţie cuprins în acest interval.

  15. Exemplu: - o reducere a timpului de calcul se poate realiza dacă reţinem din fiecare eşantion x[n] doar partea care depăşeşte un anumit prag L:

  16. - o altă posibilitate constă în a substitui toate eşantioanele ce depăşesc pragul L prin eşantioane de valoare fixă (de exemplu egale cu +/-1)

  17. 2. Metoda AMDF Average Magnitude Difference Function = metoda funcţiei medie a diferenţei modulelor - estimarea frecvenţei fundamentale se face prin găsirea indicelui k = P din intervalul menţionat, pentru care D[k] este minim posibil.

  18. Semnalul original Eroarea de predicţie Filtrul invers x[n] H(z) = Ap(z) 3. Metoda filtrului invers - pentru o tranşă sonoră, acest filtru produce eroarea de predicţie, ce reprezintă excitaţia cvasiperiodică aplicată tractului vocal (multiplicată cu o constantă). - “perioada” P a poate fi determinată direct în domeniul timp. - rezultatele se îmbunătăţesc dacă se aplică metoda autocorelaţiei, considerând în locul semnalului x[n] secvenţa de eroare de la ieşirea filtrului invers.

  19. pentru care = max. 4. Metoda cepstrală

More Related