100 likes | 317 Views
Comparaison entre les fonctions d’importance pour la parole dérivées en utilisant des rapports signal/bruit internes et externes Gaëtan Gilbert (1) et Christophe Micheyl (2).
E N D
Comparaison entre les fonctions d’importance pour la parole dérivées en utilisant des rapports signal/bruit internes et externesGaëtan Gilbert(1) et Christophe Micheyl(2) (1) UMR CNRS 5020 Neurosciences & Systèmes SensorielsUniversité Claude Bernard Lyon I50, avenue Tony Garnier 69366 LYON cedex 07, France (2) Research Laboratory of Electronics, Bldg. 36-797 Massachusetts Institute of Technology Cambridge, MA 02139-4307, USA
Pour estimer les fonctions d’importance pour la parole nous avons utilisé une méthode psychophysique La Méthode corrélationnelle dont l’application aux signaux de parole a été mise au point par Doherty et Turner [1996]
Amplitude Fréquence (Hz) 100 250 750 1750 3750 7750 Méthode corrélationnelle: Principes (1) Découpage fréquentiel
Méthode corrélationnelle: Principes (2) Ajout de bruit Identification 0 1 0
Méthode corrélationnelle: Principes (3) Poids d’une bande fréquentielle: • Le poids (ou l’importance) d’une bande fréquentielle est déterminé directement à partir du degré de corrélation entre les scores d’identification et les rapports signal/bruit (RSB) externes . Score binaire de reconnaissance 1 0 RSB externe
Critique sur l’utilisation du RSB externe • Cette étude a été motivé par le fait que les RSB externes ne rendent pas compte des traitements cochléaires dont dépendent certains phénomènes perceptifs comme le masquage ascendant (upward spread of masking) • En conséquence de quoi les RSB externes nous apparaissent être de pauvres indicateurs de l’information réelle dont dispose le système nerveux central pour comprendre les signaux de parole
Solution: Estimer le RSB interne • Une solution consiste à estimer un RSB interne sur la base de simulations des patterns d’excitations (PE)[Glasberg et Moore, 1990] RSB interne=fonction[PE(bruit+signal)/PE(bruit)] • Comme le modèle des patterns d’excitation ne s’applique que sur des signaux stationnaires nous sommes contraint d’estimer le RSB interne à partir de représentations temps/ fréquences.
Représentation T/F du rapport PE(signal+bruit)/PE(bruit) • Exemple d’un spectrogramme auditif pour le mot/ana/: • Les RSB externes sont: • bande 1: –12 dB • bande 2: -4 dB • bande 3: 12 dB • bande 4: 10 dB • bande 5: -8 dB
Estimation du RSB interne (1) moyenne arithmétique temporelle
Estimation du RSB interne (2) sommation logarithmique