580 likes | 689 Views
Hauteur et indexation (contribution digestive). Alain de Cheveigné CNRS - Ecole Normale Sup é rieure. Plan. Intro Hauteur, hauteur multiples Mod è les de perception M é thodes d'estimation Indexation. Intro. percepts. son. Intro. son. espace des signaux: dimensionalit é infinie.
E N D
Hauteuretindexation(contribution digestive) Alain de Cheveigné CNRS - Ecole Normale Supérieure
Plan • Intro • Hauteur, hauteur multiples • Modèles de perception • Méthodes d'estimation • Indexation
Intro percepts son
Intro son espace des signaux: dimensionalité infinie
Intro percept son espace des signaux: dimensionalité infinie espace (?) des états mentaux: dimensionalité infinie
Fechner (1880): quantification des états mentaux durée perçue hauteur son sonie timbre "dimensions perceptives"
Fechner (1880): quantification des états mentaux durée perçue durée physique hauteur période sonie intensité timbre centroide spectral, temps d'attaque, etc. "dimensions physiques" "dimensions perceptives" --> psychophysique
vision réductrice: • "états mentaux" ≠ espace vectoriel • sonie, hauteur, etc.: description incomplète • produit de la méthodologie? (e.g. MDS) • néglige: contexte, dynamique, particularités individuelles, etc.
vision réductrice: • "états mentaux" ≠ espace vectoriel • sonie, hauteur, etc.: description incomplète • produit de la méthodologie? (e.g. MDS) • néglige: contexte, dynamique, particularités individuelles, etc. • néanmoins: • utile comme approximation du rapport entre son et percept • --> pouvoir prédictif • --> descripteurs psychoacoustiques utiles pour l'indexation
Intro durée perçue durée physique hauteur période sonie intensité timbre centroide spectral, temps d'attaque, etc. "dimensions physiques" "dimensions perceptives" psychophysique
Hauteur AFNOR (1977): "le caractère de la sensation auditive liéà la fréquence d'un son périodique, qui fait dire que le son est aigu ou grave selon que cette fréquence est plus ou moins élevée"
Hauteur AFNOR (1977): "le caractère de la sensation auditive liéà la fréquence d'un son périodique, qui fait dire que le son est aigu ou grave selon que cette fréquence est plus ou moins élevée" --> spécifique d'une classe particulière de signaux
hauteur = classe d'équivalence (abstraction) hauteur: unidimensionnel son: multidimensionnel
hauteur = classe d'équivalence (abstraction) ~= classe des sons de même période T période hauteur: unidimensionnel son: multidimensionnel
exceptions: • son périodique mais pas de hauteur musicale si: • F0 < ~30 Hz (Pressnitzer et al. 2001) • F0 > ~4000 Hz (Semal & Demany 1990) • partiels tous de rang > ~15 • partiels tous de fréquence > ~5000 Hz
exceptions: • son périodique mais pas de hauteur musicale si: • F0 < ~30 Hz (Pressnitzer et al. 2001) • F0 > ~4000 Hz (Semal & Demany 1990) • partiels tous de rang > ~15 • partiels tous de fréquence > ~5000 Hz • son non périodique mais évoque une hauteur: • certains sons inharmoniques • bruits modulés en amplitude • Huggins pitch (binaural)
high thresholds low thresholds Bernstein & Oxenham (2003)
autres complications: • dépend du mode d'écoute: • analytique (Helmholtz): hauteurs de partiels • synthétique: • hauteur liée à la période • hauteur liée au centre de gravité spectrale • différences inter-individuelles! • aspects complexes: • dynamique (--> mélodie) • harmonie, tonalité, etc. • relative vs absolue
Hauteur fondamentale vs spectrale periodiciy pitch F0 Flocus spectral locus pitch --> fortes différences interindividuelles
tone height periodiciy pitch F0 Flocus chroma spectral locus pitch --> nature pluridimensionnelle
Modèles de perception de hauteur • controverse depuis Hemholtz... • version classique: • spectral vs • temporel • version moderne: • pattern-matching vs • autocorrélation • version post moderne: • unitaire vs 2 mécanismes... http://cognition.ens.fr/Audition/ps/2005_pitch_SHAR.pdf
Licklider from cochlea
Licklider: interaction excitatrice E soma: integration E Annulation harmonique: interaction inhibitrice soma: integration
modèle "annulation" de perception de hauteur (de Cheveigné 1998) période --> hauteur
Hauteurs multiples hauteur 1 hauteur 2 hauteur 3
2 modes de perception: • holistique: • timbre de l'accord • analytique: • perception des hauteurs élémentaires ...difficiles à départager
facteurs de l'écoute analytique: • nombre de notes: • plus facile si peu de notes • enveloppes spectrales: • plus facile si différentes • enveloppes temporelles: • plus facile si différentes • familiarité avec l'instrument • différences interindividuelles! peu d'études contrôlées...
Modèles de hauteurs multiples • domaine fréquence: • calcul d'un spectre d'excitation cochléaire, peigne harmonique • résolution souvent insuffisante... • domaine spectrotemporel: • sélection de canaux, autocorrélation • fonctionne si enveloppes spectrales ≠ • domaine temporel: • annulation harmonique par filtre neuronal • fonctionne dans tous les cas, mais... • ...prédit performance supérieure à celle observée
channel selection: autocorrelation array
multiple pitch perception stochastic spike train
Estimation de F0 • --> voir exposé de Klapuri • plusieurs méthodes issues de modèles perceptifs • exemple: algorithmes YIN et MMM
YIN signal model: T=period
property: true if T=period
to find T... ...search for minimum of d(t) t
MMM: signal model: sum of two periodic signals
MMM: property: true if s is sum of two periodic signals with periods T, U
MMM: if T,U unknown, form: search for minimum of d(t,u)
MMM: u t
MMM: u T t U
Indexation de la hauteur • objectif: • description de documents sonores • applications: recherche documents, navigation • pertinence perceptive • tout son peut avoir une hauteur • pertinence musicale • liens avec indexation symbolique (partition)
Indexation de la hauteur • problèmes spécifiques: • gestion du temps • quantification, structure chroma / hauteur • polyphonie • scalabilité des descripteurs • traduction représentations symboliques
gestion du temps: • hauteur (F0) varie en fonction du temps • quantification (notes) • intervalles sans hauteur (mesure de confiance)