420 likes | 570 Views
Agenda. Introducción S eñales de Voz S istema Monoacústico S istema Estéreo S istema Hí brido M ono /E stéreo D etectores de doble C onversación. Introducción. Objetivos Exponer los conceptos básicos de un problema actual Características inherentes a la voz humana
E N D
Agenda • Introducción • Señales de Voz • Sistema Monoacústico • Sistema Estéreo • Sistema Híbrido Mono/Estéreo • Detectoresde doble Conversación
Introducción • Objetivos • Exponer los conceptos básicos de un problema actual • Características inherentes a la voz humana • Características inherentes a la percepción humana • Casos de estudio en la generación de eco • Aplicación de las herramientas de tratamiento estadístico de señales • Aspectos reales a tener en cuenta en el modelo teórico
Introducción • Referencia histórica • Problema clásico del procesamiento de señales • Nuevo impulso en la década del 90 • Retardos de Sistemas Digitales • Nuevas aplicaciones • Manos Libres • Teleconferencias • Telefonía IP • Localización Espacial
Señales de Voz • Principales aspectos a considerar • Ancho de banda • Concentración de la energía • Estacionalidad • Percepción humana
Espectro de la señal de voz • Espectro de Potencia de la señal de voz • Análisis Tiempo-Frecuencia
Generación de eco en las redes • Red Telefónica tradicional • Desbalance intrínseco del sistema a dos hilos • Significa problema en transmisiones con retardos mayores a 45ms • Redes de Paquetes
Generación de eco en las redes • Redes de Paquetes • Nuevas aplicaciones de voz • Retardos en el procesamiento • Necesidad de Buffers • Paquetización • Retardos variables: Jitter
Requisitos del Cancelador de Eco • De acuerdo a las recomendaciones de ITU-T G.168 • Rápida Convergencia Inicial • Bajo nivel de eco de retorno en conversación simple • Baja divergencia en doble conversación • Detección de doble conversación • Operación en transmisiones fax/modem
Criterios de Optimización • Queremos obtener una réplica de la respuesta al impulso h • El camino para esto es encontrar un filtro que haga mínimo el error en términos de: • Media Cuadrática • - Mínimos Cuadrados Ponderados
Escenarios de Estudio • Sistemas Mono-Acústicos • Sistemas Multicanal • Principales características • Diferencias fundamentales
Máxima Atenuación • Estimamos la señal de eco mediante un filtro de orden N • El valor de N se elige de acuerdo al tiempo de reverberación • Si los valores de filtro se ajustan perfectamente a los primeros N coeficientes de la respuesta al impulso,
Atenuación Según N • Para obtener una atenuación de 45dB N1600 • Se requiere alta potencia de cómputo
Algoritmos • Entre los algoritmos más utilizados encontramos: • NLMS (Normalized Least Mean Square) • Baja Complejidad • Convergencia lenta • APA (Affine Projection Algorithm) • Solución intermedia respecto a complejidad y velocidad de convergencia • RLS (Recursive Least Square) • Alta complejidad y requerimiento de cálculo • Convergencia rápida • Problemas de estabilidad
Algoritmo NLMS • Frecuentemente elegido por la baja complejidad (2L operaciones por iteración) • Método de máxima pendiente • Estimación del gradiente muy ruidosa • Paso de adaptación Convergencia Vs Precisión
Algoritmo NLMS • Formulación del filtro adaptivo: • Estimamos el valor del gradiente en cada iteración por medio de los valores instantáneos
Algoritmo RLS • Orden del filtro O(L^2) • Optimización respecto a cada realización • Ecuación normal determinística
Algoritmo RLS • Formulación del filtro adaptivo: • Ecuación de Actualización se calcula en forma recursiva
Algoritmo APA • Se definen error a priori y error a posteriori, respectivamente como: y son vectores que contienen las p últimas muestras de y(n) y e(n)
Algoritmo APA • Aplicando la restricción: Obtenemos la formulación del algoritmo • Método de error forzado a cero (Zero Forcing Algorithm) • Orden del filtro O(L)
Canceladores de Eco Multicanal • Sistema Estéreo • Sistemas con requerimientos de localización espacial • Problemas Fundamentales • Unicidad de la solución • La solución a la ecuación normal puede estar indefinida • Correlación cruzada entre canales • La matriz de correlación con número de condición alto • Seguimiento de caminos de eco • La aplicación de técnicas del caso monofónico no dan buenos resultados
Cancelador de Eco de dos Canales • Requiere de alta velocidad de convergencia ante: • Cambios en el recinto de recepción • Cambios de locutor en el lugar de transmisión • x1(n) y x2(n) fuertemente correlacionadas
Unicidad de la Solución Las dos señales de entrada del filtro están vinculadas por: Siendo la estimación de los filtros reales: La minimización de J(n) resulta en la ecuación normal:
Unicidad de la Solución M = Largo de la respuesta al impulso en el lugar de transmisción N = Largo de la respuesta al impulso en el lugar de recepción L = Largo del filtro utilizado Si considero L> M y el vector: Se puede ver que es un vector propio de R con valor propio nulo, y por lo tanto no tenemos solución única a la ecuación normal
Consecuencias de la no unicidad de la solución • La solución a la que llegue el sistema depende de los parámetros del lugar de transmisión • No se considera una solución adecuada • Si cambia la persona que está hablando debe reconverger
Desajustes • En los casos reales vamos a tener L < M • La inversa de la matriz de correlación existe pero va a estar mal condicionada • Definiendo el desajuste como la relación entre la solución buscada y la obtenida: • La solución es única pero el desajuste va a ser importante debido a la correlación cruzada entre las señales de entrada
Efecto Tail • Se refiere al efecto que produce modelar los filtros con L<N • Es equivalente a truncar la respuesta al impulso del sistema a estimar • El residuo hace posible que se tenga solución única • Potencialmente se tiene gran desajuste aunque sea posible tener buena cancelación de eco • Degradación de la cancelación ante cambios en la transmisión
Efecto Tail • Reducción del desajuste • Aumentando el largo de los filtros • Costoso en términos de memoria y procesamiento • Procesamiento lento • Aplicando técnicas de reducción de la correlación cruzada • Transformaciones no-lineales • Factorización apropiada
Correlación Cruzada • Función de Coherencia: • Los valores propios de la matriz de correlación son de la forma: • Si , la matriz R es singular • Esto ocurre cuando las señales están relacionadas en forma lineal
Método de Transformación no-lineal • Rectificador de media onda • Es preferido por su baja complejidad y por que da buenos resultados • Se debe cumplir que la distorsión no sea perceptible por el oído humano • Buenos resultados para valores de menores a 0.5
Diseño de Filtros Adaptivos • Para el caso multicanal deben tener en cuenta la correlación intercanal • Transformación no-lineal • Procesos de inter-innovación
Método de Transformación no-lineal Sin aplicación Con aplicación
Sistema Híbrido Mono/Estéreo • Es un caso particular de procesamiento en sub-bandas • Reducción del peso de cómputo al sub-muestrear • Aplicación de distintas técnicas según la banda de frecuencia • El efecto estereofónico es predominante en frecuencias por debajo de 1KHz • La concentración de la energía de la voz está en las frecuencias bajas
Detectores de doble Conversación • Es un elemento importante que aparece en los sistemas de cancelación de Eco • Se utiliza como protección contra divergencias de los filtros adaptivos • Señales de audio en el lugar de recepción • Ruidos distorsionantes • La alta convergencia de los algoritmos adaptivos es acompañada de alta divergencia ante doble-conversación
Detector de Geigel (Geigel DTD) • Es un sistema de aplicación comercial • Se comparan las señales de transmisión y recepción • Si se detecta doble-conversación los coeficientes del filtro quedan “congelados” • Tiempo de hangover es el tiempo mínimo en que el algoritmo está inhibido Condición de doble conversación
Comentarios y conclusiones • La cancelación de Eco es un requisito en muchas aplicaciones actuales • Las técnicas a utilizar varían según el campo de aplicación y el costo de la solución • En sistemas multi-canal la correlación entre las señales de entrada juega un rol central • Otros desarrollos de interés • Filtros adaptivos en sub-bandas • Filtrado en el dominio de frecuencias