1 / 18

Intitulé de la thèse : Débruitage de la parole et ses applications

Intitulé de la thèse : Débruitage de la parole et ses applications. Débruitage perceptuel de la parole. Asmaa Amehraye Sous l’encadrement de : Dominique Pastor. Journées doctorales du département SC. Plan de la présentation. 2/18. Introduction Points durs

jonco
Download Presentation

Intitulé de la thèse : Débruitage de la parole et ses applications

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Intitulé de la thèse: Débruitage de la parole et ses applications Débruitage perceptuel de la parole Asmaa Amehraye Sous l’encadrement de:Dominique Pastor Journées doctorales du département SC

  2. Plan de la présentation 2/18 Introduction Points durs La perception auditive Le débruitage perceptuel de la parole Résultats Conclusion et perspectives 1 2 3 4 5 6

  3. Objectifs du débruitage de la parole 3/18 • Restituer le signal de parole dans les environnement bruités • Améliorer l’intelligibilité de la parole • Le confort d’écoute de l’auditeur Processus du débruitage Applications: Reconnaissance de la parole Téléphonie mobile Téléphonie main libre…

  4. Les méthodes usuelles 4/18 Soustraction spectrale Filtrage de Kalman Méthodes à sous-espaces Processus du débruitage Ondelettes Filtrage de Wiener .........etc

  5. Système mono capteur 5/18 Hypothèses: 1- Bruit additif 2- Décorrélation entre bruit b(n) et parole propre s(n). s(n) y(n) + b(n)

  6. Points durs 6/18 • Estimation du bruit. • Détection de l’activité vocale (DAV). • Artéfacts: Bruit musical et Distorsions du signal après débruitage.

  7. Bruit musical? 7/18 Bruit musical Gênant à la perception humaine Solution: Tenir compte des propriétés du système auditif humain.

  8. Système auditif 8/18 Coupe générale de l’oreille

  9. L’effet de masquage? 9/18 On parle de masquage quand un son est rendu inaudible par un autre. Le masqueur élève localement le seuil d’audition, le son cible nécessite alors plus d’énergie pour être perçu.

  10. Le débruitage perceptuel de la parole 10/18 Contexte: Prise en compte des propriétés de l’audition humaine via la modélisation de certaines de ces propriétés déterminantes. Astuces : Distinction entre ce qui est audible et ce qu’il ne l’est pas. Outil : Modélisation du phénomène de masquage par le calcul de la courbe de masquage. Objectif: Diminuer les artéfacts (distorsions, bruit musical,…)

  11. 11/18 Puissance du signal Courbe de masquage Portions inaudibles

  12. Deux cas limite de l’estimée de la courbe de masquage: 12/18 dB dB DSP du signal bruité Courbe de masquage idéale f(Hz) f(Hz) Le bruit résiduel augmente Les distorsions du signal augmentent Besoin d’un compromis 15

  13. Exemples dans la littérature 13/18

  14. Contribution 14/19

  15. Evaluation objective 15/19 MBSD (Modified Bark Spectral Distorsion) SSNR (Segmental Signal to Noise Ratio)

  16. Evaluation subjective 16/18 Tests audio: She had your dark suit in greasy wash water all year. Don't ask me to carry an oily rag like that

  17. Conclusion et perspectives 17/18 • L’apport de la psycho-acoustique est net. • Pour la reconnaissance de la parole, on veut montrer que ce n’est pas juste une question de SNR. • L'application de ces approches pour l'amélioration de l'intelligibilité audio et la reconnaissance automatique de la parole pour des applications de téléphonie mobile et de téléphonie main libre.

  18. Bibliographie 18/18 [1] E Zwicker, R. Feldtkeller, Psychoacoustique:L’oreille, récepteur d’information”, Masson, Paris, 1981. [2] Y. Hu and P. Loizou, “Incorporating a psychoacoustic model in frequency domain speech enhancement”, IEEE Signal Processing Letters, 11(2), 2004, pp. 270-273. [3] A.Ben Aicha and S. Ben Jebara, “Utilisation de la courbe de masquage pour la détection des tonales musicales artificielles dans un signal de parole débruité par approche spectrales ”, ISIVC2006, Tunisie. [4] L. Lin,W. H. Holmes and E. Ambikairajah,“Speech denoising using perceptual modification of Wiener filtering”, IEEE Electronic Letters, vol. 38, no. 23, November 2002, pp. 1486-1487. [5] T.Haulik, K.Linhard and P.Schrogmeier, “Residual noise suppression using psychoacoustic criteria”, Eurospeech 1997, pp 1395. Merci pour votre attention

More Related