1 / 42

Agenda

Agenda. Introducción S eñales de Voz S istema Monoacústico S istema Estéreo S istema Hí brido M ono /E stéreo D etectores de doble C onversación. Introducción. Objetivos Exponer los conceptos básicos de un problema actual Características inherentes a la voz humana

cady
Download Presentation

Agenda

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Agenda • Introducción • Señales de Voz • Sistema Monoacústico • Sistema Estéreo • Sistema Híbrido Mono/Estéreo • Detectoresde doble Conversación

  2. Introducción • Objetivos • Exponer los conceptos básicos de un problema actual • Características inherentes a la voz humana • Características inherentes a la percepción humana • Casos de estudio en la generación de eco • Aplicación de las herramientas de tratamiento estadístico de señales • Aspectos reales a tener en cuenta en el modelo teórico

  3. Introducción • Referencia histórica • Problema clásico del procesamiento de señales • Nuevo impulso en la década del 90 • Retardos de Sistemas Digitales • Nuevas aplicaciones • Manos Libres • Teleconferencias • Telefonía IP • Localización Espacial

  4. Señales de Voz • Principales aspectos a considerar • Ancho de banda • Concentración de la energía • Estacionalidad • Percepción humana

  5. Espectro de la señal de voz • Espectro de Potencia de la señal de voz • Análisis Tiempo-Frecuencia

  6. Generación de eco en las redes • Red Telefónica tradicional • Desbalance intrínseco del sistema a dos hilos • Significa problema en transmisiones con retardos mayores a 45ms • Redes de Paquetes

  7. Generación de eco en las redes • Redes de Paquetes • Nuevas aplicaciones de voz • Retardos en el procesamiento • Necesidad de Buffers • Paquetización • Retardos variables: Jitter

  8. Requisitos del Cancelador de Eco • De acuerdo a las recomendaciones de ITU-T G.168 • Rápida Convergencia Inicial • Bajo nivel de eco de retorno en conversación simple • Baja divergencia en doble conversación • Detección de doble conversación • Operación en transmisiones fax/modem

  9. Criterios de Optimización • Queremos obtener una réplica de la respuesta al impulso h • El camino para esto es encontrar un filtro que haga mínimo el error en términos de: • Media Cuadrática • - Mínimos Cuadrados Ponderados

  10. Escenarios de Estudio • Sistemas Mono-Acústicos • Sistemas Multicanal • Principales características • Diferencias fundamentales

  11. Canceladores de Eco Mono-Acústico

  12. Máxima Atenuación • Estimamos la señal de eco mediante un filtro de orden N • El valor de N se elige de acuerdo al tiempo de reverberación • Si los valores de filtro se ajustan perfectamente a los primeros N coeficientes de la respuesta al impulso,

  13. Atenuación Según N • Para obtener una atenuación de 45dB N1600 • Se requiere alta potencia de cómputo

  14. Algoritmos • Entre los algoritmos más utilizados encontramos: • NLMS (Normalized Least Mean Square) • Baja Complejidad • Convergencia lenta • APA (Affine Projection Algorithm) • Solución intermedia respecto a complejidad y velocidad de convergencia • RLS (Recursive Least Square) • Alta complejidad y requerimiento de cálculo • Convergencia rápida • Problemas de estabilidad

  15. Algoritmos: comparación

  16. Algoritmo NLMS • Frecuentemente elegido por la baja complejidad (2L operaciones por iteración) • Método de máxima pendiente • Estimación del gradiente muy ruidosa • Paso de adaptación  Convergencia Vs Precisión

  17. Algoritmo NLMS • Formulación del filtro adaptivo: • Estimamos el valor del gradiente en cada iteración por medio de los valores instantáneos

  18. Algoritmo RLS • Orden del filtro O(L^2) • Optimización respecto a cada realización • Ecuación normal determinística

  19. Algoritmo RLS • Formulación del filtro adaptivo: • Ecuación de Actualización se calcula en forma recursiva

  20. Algoritmo APA • Se definen error a priori y error a posteriori, respectivamente como: y son vectores que contienen las p últimas muestras de y(n) y e(n)

  21. Algoritmo APA • Aplicando la restricción: Obtenemos la formulación del algoritmo • Método de error forzado a cero (Zero Forcing Algorithm) • Orden del filtro O(L)

  22. Simulaciones: Algoritmo NLMS

  23. Algoritmo NLMS

  24. Algoritmo NLMS: Performance

  25. Canceladores de Eco Multicanal • Sistema Estéreo • Sistemas con requerimientos de localización espacial • Problemas Fundamentales • Unicidad de la solución • La solución a la ecuación normal puede estar indefinida • Correlación cruzada entre canales • La matriz de correlación con número de condición alto • Seguimiento de caminos de eco • La aplicación de técnicas del caso monofónico no dan buenos resultados

  26. Cancelador de Eco de dos Canales • Requiere de alta velocidad de convergencia ante: • Cambios en el recinto de recepción • Cambios de locutor en el lugar de transmisión • x1(n) y x2(n) fuertemente correlacionadas

  27. Unicidad de la Solución Las dos señales de entrada del filtro están vinculadas por:  Siendo la estimación de los filtros reales: La minimización de J(n) resulta en la ecuación normal:

  28. Unicidad de la Solución M = Largo de la respuesta al impulso en el lugar de transmisción N = Largo de la respuesta al impulso en el lugar de recepción L = Largo del filtro utilizado Si considero L> M y el vector: Se puede ver que es un vector propio de R con valor propio nulo, y por lo tanto no tenemos solución única a la ecuación normal

  29. Consecuencias de la no unicidad de la solución • La solución a la que llegue el sistema depende de los parámetros del lugar de transmisión • No se considera una solución adecuada • Si cambia la persona que está hablando debe reconverger

  30. Desajustes • En los casos reales vamos a tener L < M • La inversa de la matriz de correlación existe pero va a estar mal condicionada • Definiendo el desajuste como la relación entre la solución buscada y la obtenida: • La solución es única pero el desajuste va a ser importante debido a la correlación cruzada entre las señales de entrada

  31. Efecto Tail • Se refiere al efecto que produce modelar los filtros con L<N • Es equivalente a truncar la respuesta al impulso del sistema a estimar • El residuo hace posible que se tenga solución única • Potencialmente se tiene gran desajuste aunque sea posible tener buena cancelación de eco • Degradación de la cancelación ante cambios en la transmisión

  32. Efecto Tail • Reducción del desajuste • Aumentando el largo de los filtros • Costoso en términos de memoria y procesamiento • Procesamiento lento • Aplicando técnicas de reducción de la correlación cruzada • Transformaciones no-lineales • Factorización apropiada

  33. Correlación Cruzada • Función de Coherencia: • Los valores propios de la matriz de correlación son de la forma: • Si , la matriz R es singular • Esto ocurre cuando las señales están relacionadas en forma lineal

  34. Método de Transformación no-lineal • Rectificador de media onda • Es preferido por su baja complejidad y por que da buenos resultados • Se debe cumplir que la distorsión no sea perceptible por el oído humano • Buenos resultados para valores de menores a 0.5

  35. Diseño de Filtros Adaptivos • Para el caso multicanal deben tener en cuenta la correlación intercanal • Transformación no-lineal • Procesos de inter-innovación

  36. Método de Transformación no-lineal Sin aplicación Con aplicación

  37. Sistema Híbrido Mono/Estéreo • Es un caso particular de procesamiento en sub-bandas • Reducción del peso de cómputo al sub-muestrear • Aplicación de distintas técnicas según la banda de frecuencia • El efecto estereofónico es predominante en frecuencias por debajo de 1KHz • La concentración de la energía de la voz está en las frecuencias bajas

  38. Sistema Híbrido Mono/Estéreo

  39. Detectores de doble Conversación • Es un elemento importante que aparece en los sistemas de cancelación de Eco • Se utiliza como protección contra divergencias de los filtros adaptivos • Señales de audio en el lugar de recepción • Ruidos distorsionantes • La alta convergencia de los algoritmos adaptivos es acompañada de alta divergencia ante doble-conversación

  40. Detector de Geigel (Geigel DTD) • Es un sistema de aplicación comercial • Se comparan las señales de transmisión y recepción • Si se detecta doble-conversación los coeficientes del filtro quedan “congelados” • Tiempo de hangover es el tiempo mínimo en que el algoritmo está inhibido Condición de doble conversación

  41. Comentarios y conclusiones • La cancelación de Eco es un requisito en muchas aplicaciones actuales • Las técnicas a utilizar varían según el campo de aplicación y el costo de la solución • En sistemas multi-canal la correlación entre las señales de entrada juega un rol central • Otros desarrollos de interés • Filtros adaptivos en sub-bandas • Filtrado en el dominio de frecuencias

More Related