200 likes | 451 Views
CODIFICACION DE AUDIO: SISTEMA MPEG. INTRODUCCION CODIFICACION PERCEPTUAL: ENMASCARAMIENTO CODIFICACION POR SUBBANDAS MPEG-1 LAYER I Y II MPEG-1 LAYER III MPEG-2 y MPEG-4. La Necesidad. Las Aplicaciones. DAB (Digital Audio Broadcasting)
E N D
CODIFICACION DE AUDIO: SISTEMA MPEG • INTRODUCCION • CODIFICACION PERCEPTUAL: ENMASCARAMIENTO • CODIFICACION POR SUBBANDAS • MPEG-1 LAYER I Y II • MPEG-1 LAYER III • MPEG-2 y MPEG-4
Las Aplicaciones • DAB (Digital Audio Broadcasting) • Grabaciones Digitales … DCC (Digital Compact Cassette) • Transmisión de Audio por RDSI (Enlace emisoras FM) • Transmisión de Audio por Internet • Multimedia … DVD Los Requerimientos • Eficiencia de Compresión • Calidad máxima alcanzable • Complejidad • Cálculo • Memoria • codificador vs decodificador • Retardo • Editabilidad • Robustez a errores de transmisión
Codificación de Fuente vs Codificación Perceptual • Voz …… modelo de producción • vocoder LPC • RELP • CELP • …. Música ….. No hay un modelo predefinido de generación • Codificación Perceptual….. • Eliminar las señales que son irrelevantes para el sistema auditivo • Minimizar el ruido audible
Codificadores Perceptuales: • Enmascaramiento Simultaneo Umbral de enmascaramiento: SPL por debajo del cual una señal no es audible Umbral de silencio: SPL mínimo para que un sonido sea audible sin señal enmascarante
Codificadores Perceptuales: • Enmascaramiento Simultaneo SNR(m)… Relación señal a ruido de cuantificación con m bits SMR …… Relación señal a umbral de enmascaramiento NMR(m) . Relación ruido a umbral de enmascaramiento con m bits
Codificadores Perceptuales: • Enmascaramiento Temporal
Codificadores Perceptuales: Diagrama de bloques Entrada PCM MUX Buffer Codificador Canal Digital FFT Umbrales enmascaramiento Asignación dinámica de parámetros y codificación Salida PCM DE- MUX Decodificador Decodificador parámetros dinámicos
Buffer y pre-echos Volver
International Organization of Standarization Moving Pictures Expert Group ISO/MPEG-1 • Basado en dos codificadores perceptuales MUSICAM y ASPEC • Se han definido tres niveles (Layer I, II, III) con complejidades • Bit Rates para calidad CD • Layer I --------- 384 kbps estereo • Layer II -------- 256 a 192 kbps estereo • Layer III ------- 128 a 112 kbps estereo
ISO/MPEG-1 • Modos de Trabajo • Mono • Estereo • Dual (programación bilingüe) • Estereo Conjunto • En Layer III Mono/Estereo (L+R / L-R) • Frecuencias de Muestreo • 32 kHz • 44.1 kHz • 48 kHz • Modelos Psicoacústicos • Modelo I Layer I … FFT 512 Layer II, III … FFT 1024 • Cálculo simplificado • Clasificación en componentes tonales y no tonales • Modelos II Layer II, III … FFT 1024 • Cálculo complejo, actúa contra pre-echos
Banco de Filtros 32 filtros paso-banda equiespaciados de orden 511 con atenuación de 93 dB en la banda atenuada
Banco de Filtros Layer I ….. 12 muestras de cada canal ….. 384 muestras de audio Layer II …. 36 muestras de cada canal ….. 1152 muestras de audio
Layer I Cuantificación y Escalado • Factor de escala: • valor absoluto máximo de 12 muestras de cada subbanda • codificación con 6 bits x 32 canales = 192 bits (máximo) • se transmite si se asigna un número de bits > 0 a la banda • Asignación de bits: • A partir del SMR para cada banda • Se selecciona un cuantificador de los 15 disponibles • de acuerdo con el bit-rate y el SMR. --- 4 bits /subbanda • Se minimiza el NMR para cada banda de forma iterativa • Rango dinámico > 120 dB (combinación del factor de escala • y la asignación de bits)
Layer II Cuantificación y Escalado • Factor de escala: • 3 grupos de 12 muestras por cada canal ….. 3 factores de escalado • Codificación conjunta de los 3 factores de escalado …. 6 bits/factor • Determinación de los factores a transmitir (SCFSI) • 00 se transmiten los tres • 01 se transmiten 2. El primero para el 1 y 2 grupo y el segundo • para el 3 grupo • 10 se transmite solo un factor valido para los tres grupos • 11 se transmiten 2. El primero para el 1 grupo y el segundo • para el 2 y 3 grupo. • Asignación de bits • 18 cuantificadores • Codificadores sucesivos con 3,5 y 9 niveles -> un solo codeword.
Las tramas Layer II # entero de slots (1 byte) # slots N = 144 *kbps/Frec. Mues (kHz)