310 likes | 502 Views
Mejora de la interfaz vocal de control de un robot autónomo móvil. Adaptación acústica y generación supervisada de mapas. Autor: Nuria Pérez Magariños Tutor: Juan Manuel Montero Martínez. Índice. Objetivos Proyecto ROBINT Técnicas empleadas Configuración del sistema Adaptación
E N D
Mejora de la interfaz vocal de control de un robot autónomo móvil. Adaptación acústica y generación supervisada de mapas Autor: Nuria Pérez Magariños Tutor: Juan Manuel Montero Martínez
Índice • Objetivos • Proyecto ROBINT • Técnicas empleadas • Configuración del sistema • Adaptación • Evaluación y pruebas • Conclusiones y líneas futuras
Objetivos • Adaptación de los modelos acústicos • Guiado del robot • Aprendizaje automático
Proyecto ROBINT • Robots guía • Interacción hombre-robot • Generación de mapas
Guiado del robot • Fase de aprendizaje • Fase de verificación • Propuesta inicial de frases • Relación con el guía • Movimiento • Grafo • Confirmación • Visita
Técnicas empleadas • Adaptación a tarea o a locutor • Máximo a posteriori (MAP) • HTK
Configuración del sistema • Ficheros de configuración • Detector.ini • Entorno.ini • Tade.ini • Voz.ini • Reco_cfg_generico.ini • Prb_htk_generico_Speechdat.ini
Configuración del sistema • Ficheros de configuración • Urbano.ini
Adaptación • Interfaz Gráfica • CRobintDialog • Caracteristicas_modelo • Adaptacion • Thread principal • Threads_ROBINT
Adaptación MCC =Micrófono con cable MSC = Micrófono sin cable Ruido = Entorno ruidoso noRuido = Entorno no ruidoso
.dic .data Modelos adaptados Adaptación MAP Adaptación MLLR Modelos adaptados Adaptación Formateo para HTK Adaptación diccionarios Generación de ficheros de etiquetas Parametrización ficheros de audio Normalización
Evaluación y pruebas • Evaluación de los modelos genéricos
Evaluación y pruebas • Evaluación de los modelos genéricos • Experimentos de adaptación • Experimento 1: Emplear para cada emoción las mismas 90 frases de entrenamiento y 10 frases de test siempre. • Experimento 2: Dividir las frases en 10 grupos de manera que se prueben todas las frases, haciendo un promedio de los resultados.
Evaluación y pruebas • Determinación de laτóptima
Evaluación y pruebas • Determinación de laτóptima • Proporción entre entrenamiento y test
Evaluación y pruebas • Determinación de laτóptima • Proporción entre entrenamiento y test • Reconocimiento cruzado Reconocimiento cruzado en el hombre
Evaluación y pruebas • Determinación de laτóptima • Proporción entre entrenamiento y test • Reconocimiento cruzado Reconocimiento cruzado en la mujer
Evaluación y pruebas • Determinación de laτóptima • Proporción entre entrenamiento y test • Reconocimiento cruzado
Evaluación y pruebas • Determinación de laτóptima • Proporción entre entrenamiento y test • Reconocimiento cruzado • Entrenamiento con varias emociones
Conclusiones • Se han mejorado y simplificado la portabilidad y configuración del sistema • Se ha añadido la posibilidad de que el locutor realice una adaptación de los modelos al sistema • Interfaz gráfica • Script de Windows • Primera aproximación al guiado del robot • En la adaptación de habla emocionada son mucho más efectivos los valores bajos de τ para dar más peso a los datos de adaptación • El habla neutra no es la que mejor reconoce a las demás emociones • Entrenar con más emociones no significa reconocer mejor
Líneas futuras de investigación • Llevar a cabo la implementación del prototipo para el sistema de guiado del robot • Estudiar la mejora en el reconocimiento con emociones empleando la técnica MLLR