420 likes | 667 Views
Procesamiento Digital de Imágenes. Compresión de Señales de Audio con MPEG-1. Mtro. Jorge Arturo Pardiñas Mir. Contenido. Compresión de Señales de Audio por MPEG. Digitalización de una señal analógica Compresión de señales de audio Compresión MPEG Codificación Perceptiva
E N D
Procesamiento Digital de Imágenes Compresión de Señales de Audio con MPEG-1 Mtro. Jorge Arturo Pardiñas Mir
Contenido Compresión de Señales de Audio por MPEG • Digitalización de una señal analógica • Compresión de señales de audio • Compresión MPEG • Codificación Perceptiva • Codificación en el Dominio de la Frecuencia • Conmutación de Ventana • Asignación Dinámica de Bits • MPEG-1 Layer I • MPEG-1 Layer II • MPEG-1 Layer III
Digitalización de una Señal Analógica f(t) t d(t) t Compresión de Señales de Audio por MPEG información digital binaria d(t) señal analógica f(t) MUESTREO CUANTIZACIÓN CODIFICACIÓN frecuencia de muestreo
Muestreo f(t) fm(t) t 0.586528 0.645823 0.601263 ° ° ° 0.326483 0.294302 ° ° t -0.120152 ° -0.156337 ° Compresión de Señales de Audio por MPEG señal muestreada (infinito número de valores posibles de las muestras) señal analógica f(t) MUESTREO frecuencia de muestreo
Frecuencia de Muestreo Compresión de Señales de Audio por MPEG fmuestreo > 2 fmax
Cuantización fm(t) 0.586528 0.645823 0.601263 ° ° ° 0.326483 0.294302 ° ° t -0.120152 ° -0.156337 ° fm(t) .7 .6 .5 .4 .3 .2 .1 -.1 -.2 Compresión de Señales de Audio por MPEG fm(t) señal muestreada (infinito número de valores posibles de las muestras) señal cuantizada (n valores posibles) CUANTIZACIÓN
Niveles de Cuantización Compresión de Señales de Audio por MPEG n = 2m n valores m bits
Codificación d(t) t Compresión de Señales de Audio por MPEG código digital de m bits ( n = 2 m ) fm(t) 0111 0110 0101 0100 0011 0010 0001 0000 1001 1010 .7 .6 .5 .4 .3 .2 .1 -.1 -.2 información digital binaria d(t) (cada muestra representada con m bits) señal cuantizada (n valores posibles) CODIFICACIÓN
Velocidad y Almacenamiento Compresión de Señales de Audio por MPEG
Compresión de Señales de Audio Compresión de Señales de Audio por MPEG Menor velocidad de transmisión de la señal digital resultante. Menor cantidad de bits para su almacenamiento.
Degradación en la Compresión Compresión de Señales de Audio por MPEG • Eliminación de información redundante. • Eliminación de información irrelevante. SIN PÉRDIDAS CON PÉRDIDAS
Compresión de Señales de Audio por MPEG Algunos Estándares de Compresión de Señales de Audio • ITU G.711 • ITU G.721 • ITU G.722 • ITU G.728 • LPC-10E • IS-54 • MPEG-1 Voz telefónica. 64 kbps Voz telefónica. 32 kbps Voz de banda ancha. 64 kbps Voz de banda ancha. 16 kbps Voz telefónica. 2.4 kbps Voz radio celular digital. 8 kbps Audio de Banda Ancha. Monofónico: 32 y 192 kbps. Estereofónico: 128-384 kbps
Compresión MPEG Compresión de Señales de Audio por MPEG Estándar de la Organización Internacional de Estandarización (ISO) Generado por el grupo de trabajo Moving Pictures Experts Group (MPEG) Objetivo: Codificación de video y audio para medios digitales de almacenamiento hasta cerca de 1.5 Mb/s Fases: MPEG-1, MPEG-2, MPEG-4, MPEG-7
Estándar MPEG-1 Compresión de Señales de Audio por MPEG • MPEG-1 es la primera fase del trabajo del grupo MPEG, cuyo producto es el estandar ISO/IEC 11172 adoptado a finales de 1992. • MPEG-1 se divide en 5 partes: • 1: Sistemas • 2: Video • 3: Audio • 4: Especificación de Pruebas • 5: Implementación en Software
Compresión MPEG-1 para Audio Compresión de Señales de Audio por MPEG ISO/IEC 11172-3 Señales de audio monofónicas y estereofónicas. Basado en un modelo psicoacústico que considera las características auditivas del ser humano. Tres modos de operación (Layers):
Principios de Operación de MPEG-1 Compresión de Señales de Audio por MPEG Codificación Perceptiva Codificación en el Dominio de la Frecuencia Conmutación de Ventana Asignación Dinámica de Bits
Codificación Perceptiva y Enmascaramiento de Sonidos Compresión de Señales de Audio por MPEG El oído humano se comporta como si tuviera filtros internos pasa-banda (bandas críticas) Fenómeno de enmascaramiento: un sonido deja de ser escuchado (percibido) en presencia de otro de mayor intensidad. Sonido enmascarador: inhibidor. Sonido enmascarado: inhibido El enmascaramiento es más notorio cuando los sonidos simultáneos pertenecen a una misma banda crítica. También se presenta enmascaramiento cuando los sonidos se producen en un intervalo de tiempo pequeño.
Bandas Críticas del Sistema Auditivo Humano Compresión de Señales de Audio por MPEG
Percepción Auditiva y Enmascaramiento Compresión de Señales de Audio por MPEG Respuesta en frecuencia del oído en función de la intensidad del sonido UMBRAL ABSOLUTO DE PERCEPCIÓN Cambios en el umbral absoluto de percepción ante la presencia de un sonido enmascarador
Características del Enmascaramiento Compresión de Señales de Audio por MPEG • El umbral de percepción cambia en el • tiempo • El efecto de enmascaramiento depende • de la presión de sonido, la frecuencia del • enmascarador y de características de • este y del sonido enmascarado • Tiene mayor poder enmascarador un • sonido de ruido que un sonido puro (una • sola frecuencia)
Enmascaramiento en el Tiempo Compresión de Señales de Audio por MPEG • El enmascarador puede enmascarar un sonido • aún antes de producirse el primero. • Se enmascara un sonido si este se genera dentro • de cierto tiempo después de la generación del • enmascarador
Codificador Perceptivo UMBRAL ENMASCARADOR CODIFIC. BUFFER DECOD FFT ASIGNACIÓN DINÁMICA DE PARÁMETROS ASIGNACIÓN DINÁMICA DE PARÁMETROS DEMUX MUX Compresión de Señales de Audio por MPEG C A N A L D I G I T A L información digital binaria d(t) información digital binaria d(t)
Codificación en el Dominio de la Frecuencia Compresión de Señales de Audio por MPEG Se identifica y elimina la información redundante e irrelevante en el dominio de la frecuencia. La señal fuente se divide en bandas de frecuencia y estas señales son cuantizadas independientemente. La señal fuente es transformada y los coeficientes resultantes son cuantizados y transmitidos, en lugar de la señal en el tiempo.
Codificador por Subbandas de Frecuencia Compresión de Señales de Audio por MPEG CODIFICADOR DECODIFICADOR banco de filtros de síntesis banco de filtros de análisis canal de comunicación decodificadores codificadores y1´(t) y1(t) x1(t) D/A A/D D E M U L T I P L E X O R y2´(t) y2(t) x2(t) M U L T I P L E X O R D/A A/D y3´(t) x3(t) y3(t) x(t) y(t) + A/D D/A . . . . . . yn´(t) xn(t) A/D D/A yn(t) ANALISIS ANALISIS
Descomposición en Señal de Subbandas Compresión de Señales de Audio por MPEG x1(t) A/D x2(t) A/D x3(t) x(t) A/D . . . xn(t) A/D ANALISIS
Codificador por Transformada información digital binaria d(t) C A N A L D I G I T A L información digital binaria d(t) Compresión de Señales de Audio por MPEG
Conmutación de Ventana Compresión de Señales de Audio por MPEG La codificación se realiza analizando bloques de la señal fuente correspondientes a cierto tiempo o número de muestras (ventana). El tamaño de los bloques favorece de diferente forma a las operaciones que se realizan en el proceso de codificación. La elección del tamaño de un bloque o ventana, de manera que este pueda variarse dependiendo de las características de la señal que se analiza, proporciona mayor eficiencia al proceso.
Asignación Dinámica de Bits Compresión de Señales de Audio por MPEG Se asignan los bits necesarios para la codificación de acuerdo a la resolución requerida dependiendo de las características particulares de la señal que se cuantiza en ese momento. Más bits menor ruido de cuantización Menos bits mayor ruido de cuantización
Asignación Dinámica de Bits fm(t) .7 .6 .5 .4 .3 .2 .1 -.1 -.2 Compresión de Señales de Audio por MPEG fm(t) .7 .6 .5 .4 .3 .2 .1 -.1 -.2 La señal varía entre 8 niveles de cuantización La señal varía entre 2 niveles de cuantización se requieren 3 bits se requiere 1 bit
Características Generales de MPEG-1 para Audio Compresión de Señales de Audio por MPEG Frecuencias de Muestreo de 32, 44.1 y 48 KHz Subdivisión de la señal en 32 subbandas igualmente espaciadas a través de un banco de filtros. Filtros de subbanda FIR de 512 coeficientes Ancho de banda de cada subbanda: fmuestreo/64
MPEG-1 Layer I Compresión de Señales de Audio por MPEG Velocidad de 32 kbps (mono) a 448 kbps (stereo) Análisis frecuencial con FFT de 512 puntos Cada señal de subbanda es de una longitud de 12 muestras La cuantización se realiza en base a la velocidad deseada, fija.
MPEG-1 Layer II Compresión de Señales de Audio por MPEG Velocidad de 32 kbps (mono) a 384 kbps (stereo) Análisis frecuencial con FFT de 1024 puntos Cada señal de subbanda es de una longitud de 36 muestras La cuantización se realiza en base a la velocidad deseada, fija.
Estructura de MPEG-1 Layers I y II Compresión de Señales de Audio por MPEG información digital binaria d(t) C A N A L D I G I T A L información digital binaria d(t)
MPEG-1 Layer III Compresión de Señales de Audio por MPEG Velocidad de 32 kbps (mono) a 320 kbps (stereo) Análisis frecuencial con FFT de 1024 puntos Se aplica la transformada de coseno discreto modificada (MDCT) de 6 u 8 puntos a cada señal de subbanda, obteniéndose el equivalente de hasta 576 componentes de frecuencia Se codifica la información de los coeficientes de la MDCT con Codificación Huffman. Codificación con velocidad variable
Estructura de MPEG-1 Layer III Lazo de Control de Velocidad y Distorsión C A N A L D I G I T A L información digital binaria d(t) Compresión de Señales de Audio por MPEG
Referencias Bibliográficas Compresión de Señales de Audio por MPEG • INTERNATIONAL ORGANISATION FOR STANDARDISATION (ORGANISATION INTERNATIONALE DE NORMALISATION) • http://www.iso.ch • ISO/IEC JTC1/SC29/WG11 / CODING OF MOVING PICTURES AND AUDIO • http://drogo.cselt.stet.it/mpeg/standards/mpeg-1/mpeg-1.htm • Peter Noll, “MPEG Digital Audio Coding”, IEEE Signal Proccesing Mag., vol. 14, no. 5, pp. 59-81, Sep. 1997. • Peter Noll, “Wideband Speech and Audio Coding”, IEEE Communications Mag., vol. 31, no. 11, pp. 34-44, Nov, 1993. • Allen Gersho, “Advances in Speech and Audio Compression”, Proceedings of the IEEE, vol. 82, no. 6, pp. 900-918, June 1994. • Karlheinz Brandenburg, “MP3 and AAC Explained”, AES 17th International Conference on High Quality Audio Coding. (http://www.aes.org) • Fraunhofer Institute for Integrated Circuits/ Audio and Multimedia http://www.iis.fhg.de/amm/index.html • Marco Joel Gracían Cisneros, “Análisis de algoritmos de compresión de audio MPEG-I e implementación del decodificador MPEG-I Layer I en tiempo real usando un DSP”, Tesis de Maestría en Electrónica Industrial, Guadalajara, México : edición de autor, 1998. • Jorge Arturo Pardiñas Mir, “Codificador / Decodificador de voz utilizando la técnica de filtraje por sub bandas”, Tesis de Maestría en Electrónica Industrial, Guadalajara, México : edición de autor, 1998.
Procesamiento Digital de Imágenes Compresión de Señales de Audio con MPEG-1 FIN Mtro. Jorge Arturo Pardiñas Mir