410 likes | 552 Views
TRABAJO FIN DE CARRERA. Generación de Máscaras Soft para Compensación de Características en Reconocimiento Robusto del Habla. I v á n L ó p e z E s p e j o. SUMARIO. Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano Modelado del proceso de ruido
E N D
TRABAJO FIN DE CARRERA Generación de Máscaras Soft para Compensación de Características en Reconocimiento Robusto del Habla I v á n L ó p e z E s p e j o
SUMARIO • Introduccióny Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
1. INTRODUCCIÓN Y MOTIVACIÓN • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
1. INTRODUCCIÓN Y MOTIVACIÓN • Acto de hablar: Usualmente en entornos acústicos ruidosos • Alta capacidad de reconocimiento en el ser humano • Necesidad de adaptación de los sistemas ASR • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
1. INTRODUCCIÓN Y MOTIVACIÓN • Acto de hablar: Usualmente en entornos acústicos ruidosos • Alta capacidad de reconocimiento en el ser humano • Necesidad de adaptación de los sistemas ASR • Algunas técnicas para mejorar el matching: • Adaptación de los modelos • Descomposición de HMMs • Realce de las características de voz • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
1. INTRODUCCIÓN Y MOTIVACIÓN • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
1. INTRODUCCIÓN Y MOTIVACIÓN • Motivaciones • Mejora del rendimiento de un sistema ASR • Ventajas de la metodología de realce • Aplicaciones: • Búsqueda de información • Ejecución de transacciones • Control de sistemas (entornos industriales) • … • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
2. FUNDAMENTOS DEL SEGUIMIENTO • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
2. FUNDAMENTOS DEL SEGUIMIENTO • Seguimiento:Estimación de la secuencia de estados de un sistema a partir de sus observaciones • Modelo compuesto de dos procesos • Proceso de estados • Proceso observado • Solución MMSE Seguimiento Bayesiano • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
2. FUNDAMENTOS DEL SEGUIMIENTO • Justificación del filtro de partículas • Evaluación compleja: • Solución: modelado markoviano • Aproximación numérica: (muestreo y remuestreo de importancia + integración de Monte Carlo) • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3. DISEÑO DEL FILTRO BAYESIANO • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3. DISEÑO DEL FILTRO BAYESIANO • Seguimiento de ruido en el domino log Mel • Ruido (estado del sistema) • Voz limpia (ruido que contamina la observación) • Voz ruidosa (observación) • Definición del espacio de estados dinámico • Proceso de ruido, • Proceso observado, • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.1 Modelado del proceso de ruido • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.1 Modelado del proceso de ruido • Codificación de la previsibilidad del ruido: proceso AR en el dominio log Mel Minimizar • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.1 Modelado del proceso de ruido • Definición implícita de una distribución gaussiana para el ruido: • Selección de orden unidad para el modelo AR • Distribución a priori modelada como una gaussiana: • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.2 Relación entre estados y observaciones • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.2 Relación entre estados y observaciones • Se parte de la aproximación: • ¿Cuál es la relación entre las observaciones y el ruido? • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.2 Relación entre estados y observaciones • ¿Cuál es la relación entre las observaciones y el ruido? • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.2 Relación entre estados y observaciones • ¿Cuál es la relación entre las observaciones y el ruido? • Distribución para la voz limpia: • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.2 Relación entre estados y observaciones • Imponemos • Se aplica la ley fundamental de transformación de probabilidades • De esta forma, • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.3 Filtro SIR aplicado • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.3 Filtro SIR aplicado • Generación de N partículas • Cálculo de pesos normalizados • Remuestreo sobre las partículas • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.3 Filtro SIR aplicado • Existencia de problemas en la práctica • Si no se cumple para ningún j DROPOUT • SOLUCIÓN: • Evolución independiente de la observación Pérdida de la trayectoria de seguimiento • SOLUCIÓN: Procedimiento de reinicialización del filtro ¡NUEVO PROBLEMA! • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.3 Filtro SIR aplicado • Existencia de problemas en la práctica • Modos de reinicialización • Generación de nuevas hipótesis sobre la distribución a priori de ruido • Inferir partículas de ruido a partir de muestrear un GMM • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.3 Filtro SIR aplicado • Existencia de problemas en la práctica • Pobre modelado de ruido Subestimación de hipótesis • SOLUCIÓN: Se incentiva una futura reinicialización si • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.3 Filtro SIR aplicado • Existencia de problemas en la práctica • Mitigación de dropouts TEST DE ACEPTACIÓN RÁPIDA • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
3.3 Filtro SIR aplicado • Modos de inicialización • Uso de las l primeras tramas • Empleo de la distribución a priori de ruido • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
4. GENERACIÓN DE MÁSCARAS SOFT • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
4. GENERACIÓN DE MÁSCARAS SOFT 1 2 3 4 1 2 3 4 • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
5. TÉCNICA DE REALCE MULTIPLICATIVO • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
5. TÉCNICA DE REALCE MULTIPLICATIVO • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
6. TEST Y RESULTADOS • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
6. TEST Y RESULTADOS • Uso de la base de datos Aurora-2 • Empleo del conjunto de test A: • 1001 grabaciones con secuencias de dígitos • Ruidos: metro, multitud conversando, coche y sala de exposiciones • SNRs: -5dB, 0dB, 5dB, 10dB, 15dB, 20dB y caso limpio • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
6. TEST Y RESULTADOS • Test de reconocimiento del habla • Aparente independencia del número de partículas • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
6. TEST Y RESULTADOS • Test de reconocimiento del habla • Aparente independencia del número de partículas • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
6. TEST Y RESULTADOS • Test de reconocimiento del habla • Aparente independencia del número de partículas • WAcc = 1 - WER 16.43% 26.53% 11.71% • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
7. CONCLUSIONES • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
7. CONCLUSIONES • Verificación experimental de la utilidad de una técnica de realce • Preferible, por el momento, uso de ruido estimado mediante promediado espectral: • Mayor rendimiento del sistema ASR • Menor coste computacional • Necesidad de mejorar la calidad de las estimaciones resultantes del filtro de partículas • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
8. TRABAJO FUTURO • Introducción y Motivación • Fundamentos del Seguimiento • Diseño del Filtro Bayesiano • Modelado del proceso de ruido • Relación entre estados y observaciones • Filtro SIR aplicado • Generación de Máscaras Soft • Técnica de Realce Multiplicativo • Test y Resultados • Conclusiones • Trabajo Futuro • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
8. TRABAJO FUTURO • Solventar usuales pérdidas del seguimiento en el filtro de partículas • Nuevo modelo de ruido a priori • Inclusión del término de fase relativa (FAT innecesario) • Optimización de la implementación • Experimentación con otros conjuntos de test • Actualización del modelo AR de ruido y de la distribución a priori • Uso de un detector de actividad de voz • Experimentar con un filtro RPF • TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo
Generación de Máscaras Soft para Compensación de Características en Reconocimiento Robusto del Habla • GRACIAS