190 likes | 399 Views
Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema1b.ppt. Dpto. Señales, Sistemas y Radiocomunicaciones. Fonética Acústica: Técnicas de Análisis. Transformación o Filtrado (Tracto Vocal). Excitación Periódica. Segmento Sonoro.
E N D
Tratamiento Digital de VozProf. Luis A. Hernández Gómezftp.gaps.ssr.upm.es/pub/TDV/DOC/Tema1b.ppt Dpto. Señales, Sistemas y Radiocomunicaciones
Fonética Acústica: Técnicas de Análisis Transformación o Filtrado (Tracto Vocal) Excitación Periódica Segmento Sonoro
Fonética Acústica: Técnicas de Análisis Propiedades acústicas de “segmentos sonoros”: Los sonidos tienen las siguientes propiedades acústicas, que se relacionan con las propiedades físicas: TONO (F. Fundamental) INTENSIDAD Propiedades acústicas: TIMBRE DURACIÓN www.auburn.edu/forlang/Spanish/FLSP0301mats/slides/fonesp-21.ppt
Fonética Acústica: Técnicas de Análisis Tono (altura), Frecuencia Fundamental, Pitch: • Frecuencia Fundamental (F0): frecuencia de vibración de las cuerdasvocales. • En la voz humana, el tono depende del grosor y la elasticidad de las cuerdas vocales. • Rango de variación entre 50 Hz y 400 Hz (mujeres: 220 Hz varones: 120 Hz. • Variación para un mismo locutor en habla “normal”: 1 octava. • Pitch: relacionado con la percepciónde F0 (Ejemplo voz y ancho de banda telefónico)
Fonética Acústica: Técnicas de Análisis Intensidad: • Amplitud o energía de los sonidos (vocales mayor energía “en general”: considerar casos como relajación al final de las locuciones) Duración: • Duración del sonido. • Lenguas como el alemán, el italiano, el latín y algunas variedades del inglés (Received Pronunciation) distinguen entre sonidos largos y breves (p. ej., kin vs. keen). • En español las vocales tónicas son un poco más largas que las vocales átonas, pero esta diferencia no es importante. • En el inglés de EE. UU., las vocales tónicas son considerablemente más largas que las vocales átonas (p. ej., California).
Fonética Acústica: Técnicas de Análisis Timbre: • El timbre está formado por el fundamental y los armónicos. El timbre depende del tamaño, la forma y la composición de las cavidades supraglóticas. • Timbre: relación con respuesta en frecuencia del tracto vocal : permite distinguir los diferentes sonidos (Reconocimiento de Habla)
Segmentos sonoros:(@ J. Ortega EUITT) Vibración de las cuerdas vocales:frecuencia fundamental y armónicos 3-4 Formantes (resonancias del tracto) bien definidos:diferenciación entre sonidos Estructura fina (armónicos) y formantes Estructura periódica, alta energía 0 0.5 -10 0.4 0.3 -20 0.2 0.1 -30 0 Amplitud(dB) -40 -0.1 -0.2 -50 -0.3 -0.4 -60 -0.5 -70 0 1 2 3 4 5 6 7 8 0 5 10 15 20 25 30 35 40 45 Frecuencia(KHz) Tiempo(ms) Fonética Acústica: Técnicas de Análisis
0 -10 -20 -30 Relación envolvente/frecuencia fundamental Mismo sonido(Misma envolvente espectral) Distinta frecuencia fundamental(Espaciamiento de armónicos) (@ J. Ortega EUITT) Amplitud(dB) -40 -50 Frecuencia fundamental: 196 Hz. Frecuencia fundamental: 122 Hz. -60 0 -70 0 1 2 3 4 5 6 7 8 -10 Frecuencia(KHz) -20 -30 Amplitud(dB) -40 -50 -60 -70 0 1 2 3 4 5 6 7 8 Frecuencia(KHz) Fonética Acústica: Técnicas de Análisis
Fonética Acústica: Técnicas de Análisis Sonido [i]: primer formante 250 Hz - segundo 2000 Hz (aprox.) Sonido [u] : primer formante 250 Hz - segundo 600 Hz (aprox.)
SP 301 Introducción a laFonética y FonologíaEspañolas www.auburn.edu/forlang/Spanish/FLSP0301mats/slides/fonesp-02.ppt Capítulo 2
Clasificación de las vocales (1) a) Localización anterior-posterior • Vocales anteriores:El dorso de la lengua se levanta hacia el paladar duro. • Vocales centrales:El dorso de la lengua se levanta hacia un punto intermedio entre el paladar duro y el velo del paladar. • Vocales posteriores:El dorso de la lengua se levanta hacia el velo del paladar.
Clasificación de las vocales (2) b) Altura: • Vocales altas:El dorso de la lengua se levanta a una altura máxima. • Vocales medias:El dorso de la lengua se levanta a una altura media. • Vocales bajas:El dorso de la lengua se levanta a una altura mínima.
Clasificación de las vocales (3) Triángulo vocálico:Si unimos los puntos más altos que alcanza la lengua en la articulación de las vocales obtenemos una figura llamada“triángulo vocálico” Descripción de las vocales:[i] vocal anterior alta[e] vocal anterior media[a] vocal central baja[o] vocal posterior media[u] vocal posterior alta Redondeamiento: • Las vocales posteriores sonredondeadas(se pronuncian con los labios redondeados). • Las vocales anteriores sonlabializadas(se pronuncian con los labios estirados).
Alta (Cerrada) Baja (Abierta) Posterior Anterior Fonética Acústica: Técnicas de Análisis Carta de Formantes (aproximada)
Fonética Acústica: Técnicas de Análisis Segmento fricativo /s/ Transformación o Filtrado (Tracto Vocal) Excitación Ruidosa Segmento fricativo
0 0.5 -10 0.4 0.3 -20 0.2 0.1 -30 Amplitud(dB) 0 -40 -0.1 -0.2 -50 -0.3 -0.4 Estructura aleatoria de alta frecuencia Aspecto ruidoso, baja energía -60 -0.5 -70 0 0 5 1 10 2 15 3 20 25 4 30 5 35 6 40 7 45 8 Frecuencia(KHz) Tiempo(ms) Fonética Acústica: Técnicas de Análisis Sonidos sordos: • Constricción tracto sin vibración cuerdas vocales • Formantes (1-2) de alta frecuencia (@ J. Ortega EUITT)
Fonética Acústica: Técnicas de Análisis Modelo simplificado de Producción de Voz (VOCODER) T ; 1/T = Frecuencia Fundamental Filtro IIR (Todo Polos) Tracto Vocal Excitación Sonora Voz Excitación Ruidosa ENERGÍA
Fonética Acústica: Técnicas de Análisis Modelo DINÁMICO • ENERGÍA:garantiza que la energía de la señal sintetizada = energía de la voz original • DURACIÓN:pone de manifiesto el carácter dinámico del modelo. Ritmo, pausas, … • FRECUENCIA FUNDAMENTAL: entonación y acentuación. • INFORMACIÓN PROSÓDICA • (PROSODIA)