620 likes | 984 Views
Análisis y modelado de sistemas. Predicción lineal. Mecanismos de producción de la voz Análisis LPC. Teoría de producción de la voz Estudio científico Modelo ingenieril Análisis LPC Predecir una muestra a partir de las anteriores Calcular la mejor Combinación Lineal Predictora
E N D
Análisis y modelado de sistemas. Predicción lineal. Mecanismos de producción de la voz Análisis LPC Hizketaren inguruko oinarrizko kontzeptuak
Teoría de producción de la voz • Estudio científico • Modelo ingenieril • Análisis LPC • Predecir una muestra a partir de las anteriores • Calcular la mejor Combinación Lineal Predictora • Invertir=Síntesis desde señal error sin información • Parámetros equivalentes
Producción de voz Voz Es la onda acustica radiada cuando una constricción del tracto vocal perturba el flujo de aire expulsado por los pulmones
Teoría de la producción de voz • Sonidos sonoros: • El flujo de aire procedente de los pulmones es periódicamente interrumpido por la apertura y cierre de las cuerdas vocales. • Flujo periódico, frecuencia fundamental F0 -> pitch • Sonidos sordos: • No vibran las cuerdas vocales • El flujo de aire encuentra un • Estrechamiento toma gran velocidad forma turbulencias • Tracto vocal + Tracto nasal: • Actúan como cavidades resonantes • Frecuencias de resonancia Formantes • Los formantes dependen de la forma y dimensiones del TV El espectro de la voz varía con el tiempo al varíar el TV
Excitación Cavidad resonante Radiación en los labios Teoría de la producción de voz Pulso de Rosenberg g(t) G(f)
Teoría de la producción de voz • Modelo de Fuente y Tracto vocal: • Separa las características de la fuente y del tracto vocal. • Funciona mejor con parametros que varían lentamente. • Filtro V(z) todo polos: solo tiene resonancias no, modela las nasales. • Separa fuente sonora y sorda • no vale para todos los sonidos • Cambio repentino de tipo de fuente: no es realista
A(x) A(x) Glotis Glotis Labios Labios Ak(x) A(x) x=0 x=l x=0 x=l Teoría de la producción de voz • Tracto vocal tubo de sección variante y no uniforme • Aproximación: concatenación de tubos de secciones Ak constantes
Teoría de la producción de voz • Longitud de onda mayor que la longitud del tubo: • f≤5000Hz l≥340m/s/5000Hz=6’8cm • Aproximación de onda plana aceptable • Además se supone: • No hay pérdidas por rozamiento ni por conducción de calor • Las secciones Ak no cambión con el tiempo
Teoría de la producción de voz • Con estas suposiciones, las ondas en el tubo cumplen estas ecuaciones: • Puesto que el área en una sección es constante: p=p(x,t) Variación de la presion u=u(x,t) Variación del flujo de aire r: Densidad del aire c: Velocidad del sonido A=A(x,t) Función de área
v: tensión p: presión i: corriente u: velocidad L: inductancia r/A: inductancia acústica C: capacidad A/rc2: capacidad acústica Teoría de la producción de voz • Analogía electrica: línea de transmisión uniforme y sin pérdidas
A1 A2 A3 An-1 An An+1 Onda que avanza Onda que retrocede x=0 x=lk Teoría de la producción de voz • Solución de las ecuaciones diferenciales:
Retardo tk+1 Retardo tk 1+rk -rk rk tubo (k+1)ésimo tubo késimo + Retardo tk Retardo tk+1 + 1-rk Teoría de la producción de voz Tiempo de recorrido de una sección Condiciones de continuidad: lk lk+1 Se obtienen las ecuaciones: Coeficiente de reflexión |rk|<1 Diagrama de flujo que corresponde a estas ecuaciones:
Teoría de la producción de voz • Condiciones de contorno: • En los labios • En la glotis • Para modelar los labios: • Pantalla acústica esférica • Difícil de modelar • Pantalla acústica plana
Retardo tN 1+rL -rL tubo Nsimo Retardo tN + Teoría de la producción de voz • Condiciones de contorno en los labios: • Velocidad de partícula, en los labios: • Diagrama de flujo que corresponde a esta ecuación: rL coeficiente de reflexión en los labios ZL impedancia de radiación en los labios
Retardo t1 rG 1er tubo Retardo t1 + Teoría de la producción de voz • Condiciones de contorno en la glotis: • Diagrama de flujo que corresponde a esta ecuación : rG coeficiente de reflexión en la glotis ZG impedancia de la glotis
Retardo t1 Retardo t2 Retardo t3 + + + 1+r1 1+r2 1+rL rG 1er tubo -r1 r1 -r2 r2 -rL 2º tubo 3er tubo Retardo t1 Retardo t2 Retardo t3 + + + 1-r1 1-r2 Teoría de la producción de voz • Modelo de tubo sin pérdidas completo:
Retardo t1 Retardo t2 Retardo t3 + + + 1+r1 1+r2 1+rL rG 1er tubo -r1 r1 -r2 r2 -rL 2º tubo 3er tubo Retardo t1 Retardo t2 Retardo t3 + + + 1-r1 1-r2 Teoría de la producción de voz • Modelo de tubo sin pérdidas completo:
Retardo t1 Retardo t2 Retardo t3 + + + 1+r1 1+r2 1+rL rG 1er tubo -r1 r1 -r2 r2 -rL 2º tubo 3er tubo l Retardo t1 Retardo t2 Retardo t3 + + + 1-r1 1-r2 A1 A2 A3 A4 A5 A6 A7 A8 Dx Dx Dx Dx Dx Dx Dx Dx Teoría de la producción de voz • Modelo de tubo sin pérdidas completo: • Todos los tubos de igual longitud: Dx Longitud de los tubos N Número de tubos l Longitud del tracto vocal t Retardo en un tubo
z-1 z-1 z-1 z-1/2 z-1/2 z-1/2 + + + + + + 1+r1 1+r1 1+r2 1+r2 1+rL (1+rL) z3/2 rG rG -r1 r1 -r1 -r2 r1 r2 -r2 -rL r2 -rL + + + + + + 1-r1 1-r1 1-r2 1-r2 z-1/2 z-1/2 z-1/2 Teoría de la producción de voz • Sistema discreto equivalente: • Sistema discreto equivalente con retardos enteros:
Teoría de la producción de voz Línea continua: terminación en cortocircuito
Modelo de tubo sin pérdidas uL(n) uG(n) Sistema lineal V(z) Función de área (coeficientes de reflexión) parámetros uL(n) uG(n) Teoría de la producción de voz
Modelo de tubo sin pérdidas uL(n) uG(n) G uG(n) uL(n) + Sistema lineal V(z) Función de área (coeficientes de reflexión) parámetros uL(n) uG(n) z-1 plano Z a1 GM G1 G2 uG(n) uL(n) + + + + aN-1 z-1 z-1 z-1 + 2|z1|cosJ1 2|z2|cosJ2 2|zM|cosJM + + + x z-1 |z|k z-1 z-1 z-1 Jk -|z2|2 -|zM|2 -|z1|2 z-1 a2 x + aN + Teoría de la producción de voz
Análisis LPC • Análisis por Predicción Lineal (Linear Predictive Analysis) • Técnica eficaz para analizar la voz • Estima el espectro de la voz de forma • Precisa • Eficiente • Idea básica: una combinación lineal de muestras de voz pasadas es buena aproximación de la muestra siguiente
Análisis LPC • El análisis LPC (Linear Predictive Coding): • Predice los polos que modelan el tracto vocal • Mediante pocos párametros • Obtenidos por cálculos sencillos
Análisis LPC • Sean {s(n)} las muestras de voz tomadas cada Ts seg. • Ts<1/2m, m: frecuencia máxima de la señal s(n) s(n-p) P+1 Formamos una combinación lineal de P muestras: a1·s(n-1)+a2·s(n-2)+…+ap·s(n-p)= ŝ(n) e(n) = s(n) - ŝ(n)
Análisis LPC • Si {e(n)} es una variable estadística incorrelada (media 0 y varianza s2)
Análisis LPC • Si {e(n)} es una variable estadística incorrelada (media 0 y varianza s2) ŝ(n) es una buena aproximación de s(n)
Análisis LPC • Si {e(n)} es una variable estadística incorrelada (media 0 y varianza s2) • Error cometido en la predicción, residuo: ŝ(n) es una buena aproximación de s(n)
P(z) ˆ = S ( z ) P ( z ) S ( z ) Análisis LPC • P(z) filtro predictor Transformada Z
A(z) Análisis LPC + + _ Error de predicción P(z) transformada Z A(z)
Análisis LPC • Sintesis LPC H(z)=1/A(z) + P(z) H(z): modela la respuesta del tracto vocal e(n): es la excitación, la fuente de sonido
Análisis LPC: ejemplos E Segmento de una e, enventanado hamming FFT de la señal y espectro LPC de orden 14 Error de predicción Espectro del error
Análisis LPC: ejemplos S Segmento de una s, enventanado hamming FFT de la señal y espectro LPC de orden 14 Error de predicción Espectro del error
Cálculo de los coeficientes LPC • Criterio para calcular los coeficientes del filtro predictor P(z) : • Minimizar el error cuadrático medio mínimo
Cálculo de los coeficientes LPC • Para calcular la solución en el intervalo [n0 n1] son necesarias la muestras de la señal del intervalo [n0-p n1] • Basandose en un conjunto de N muestras se han investigado dos métodos de resolución: • Método de las autocorrelaciones • Método de las covarianzas Sistema de ecuaciones linealesp ecuacionesp incógnitas
Muestras usadas s(m+i-j) s(m) i-j E minimo en [n0 n1] Cálculo de los coeficientes LPC • Método de las autocorrelaciones: • El error se minimiza en el intervalo [-∞ ∞] • Se supone señal nula en n<0 y n>N-1
Autocorrelación de s(n) n-i=m Cálculo de los coeficientes LPC • Método de las autocorrelaciones: • El error se minimiza en el intervalo [-∞ ∞] • Se supone señal nula en n<0 y n>N-1 Muestras usadas s(m+i-j) s(m) i-j E minimo en [n0 n1]
Cálculo de los coeficientes LPC • Método de las autocorrelaciones: R(k) es par Las ecuaciones a resolver son Ecuaciones deYule-Walker [R]
Cálculo de los coeficientes LPC • La matriz [R] es Toepliz: • Simétrica • Los elementos en las diagonales paralelas a la diagonal principal son iguales • El método de Durbinaprovecha estas propiedades de la matriz [R] • Como s(n)=0 para n<0 y n>N-1, e(n) será grande en 0<n<p pues la predicción se basa en muestras que han sido puestas a cero. • Ocurre lo mismo en el intervalo final N<n<N+p-1 • Para reducir este efecto se enventana la señal
LPC koefizienteak • Para obtener la solución: algoritmo de Levison-Durbin ki
Muestras usadas s(m+i-j) s(m) i-j E minimo en [n0 n1] Cálculo de los coeficientes LPC • Método de las covarianzas: • Se minimiza el error en el intervalo [p, N-1] • Se utilizan todas las muestras de la señal
n-i=m Muestras usadas s(m+i-j) s(m) i-j E minimo en [n0 n1] Cálculo de los coeficientes LPC • Método de las covarianzas: • Se minimiza el error en el intervalo [p, N-1] • Se utilizan todas las muestras de la señal
Cálculo de los coeficientes LPC • Método de las covarianzas: • La matrizf : • Es definida positiva • Se puede resolver por métodos eficientes (descomposición de Cholesky) Las ecuaciones a resolver
Análisis LPC • Sonido del residuo A(z) + + _ P(z)
Residuo de un segmento sonoro Análisis LPC
Residuo de un segmento sordo Análisis LPC
Señal original Análisis LPC
Residuo Análisis LPC
Análisis LPC …{ak,Gi}i{ak,Gi}i +1… Análisis LPC: ejemplos Ruido blanco, G=100% Ruido blanco, G=50% + x Tren de deltas G=100% Gi P(z) Tren de deltas G=50%