180 likes | 330 Views
Codificación bidimensional de patrones vocales mediante un esquema de reducción dimensional basado en redes neuronales. Alejandro Bassi A. Universidad de Chile Departamento de Ciencias de la Computación abassi@dcc.uchile.cl. Caracterización fonética del timbre.
E N D
Codificación bidimensional de patrones vocales mediante un esquema de reducción dimensional basado en redes neuronales Alejandro Bassi A. Universidad de Chile Departamento de Ciencias de la Computación abassi@dcc.uchile.cl
Caracterización fonética del timbre • oído interno descompone en frecuencias • escala no lineal • lo importante es la envolvente del espectro
Caracterización articulatoria del habla • bastan dos dimensiones
Relación articulación/timbre • posición de "formantes"
Codificación de la envolvente del espectro • cepstrum • reducción dimensional: • lineal (componentes principales) • no lineal (redes neuronales) • calidad de la reconstrucción
Reducción dimensional con redes neuronales • estructura codificador/decodificador • entrenamiento autoasociativo • decodificador basado en composición gausiana
Conclusiones • buena reconstrucción (visualización) • reducción dimensional / seguimiento formantescontexto general / contexto local • Reconocimiento de patrones (TDW, HMM) • ¿varios hablantes? • normalización del "triángulo"