480 likes | 980 Views
Sonido. Son compresiones y descompresiones alternativas que se propagan a través de un medio elástico (por ejemplo el aire). Sonido. El espectro de frecuencias audibles por el ser humano oscila entre 20 Hz y 20 KHz. El lenguaje humano utiliza el rango de 4 KHz. Sonido.
E N D
Sonido • Son compresiones y descompresiones alternativas que se propagan a través de un medio elástico (por ejemplo el aire).
Sonido • El espectro de frecuencias audibles por el ser humano oscila entre 20 Hz y 20 KHz. • El lenguaje humano utiliza el rango de 4 KHz
Sonido • El lenguaje humano utiliza el rango de 4 KHz
Sonido • O decibeles constituye el sonido de menor intensidad audible por el ser humano y 120 decibeles es el máximo sonido tolerable.
Codificación Perceptual El sonido se produce por la interacción de un objeto que vibra, un medio de transmisión y un receptor. Para que el sonido sea percibido por el ser humano, el objeto debe vibrar con una frecuencia de entre 20 Hz. y 20 KHz. La vibración produce una compresión y rarefacción alternativa del aire que se transmite en forma de ondas sonoras. Estas ondas llegan al oído, donde se producen unos estímulos eléctricos que el cerebro interpreta como sonidos. Las ondas sonoras se atenúan con la distancia y pueden ser absorbidas o reflejadas por los obstáculos que encuentran a su paso.
Características del sonido Un sonido se puede describir mediante su tono, timbre, intensidad y duración. El tono de un sonido está directamente relacionado con la frecuencia, aunque no son sinónimos. La frecuencia es una magnitud física asociada a todo sonido, mientras que el tono (agudo o grave) es una característica perceptiva que solo captamos en los sonidos periódicos: los que tienen una frecuencia más o menos constante.
Codificación Perceptual La percepción acústica humana tiene lugar en dos dimensiones: frecuencia e intensidad. En el dominio de la frecuencia, el oído humano es capaz de percibir frecuencias en el rango de los 20 hasta los 20.000 Hz En cuanto a la intensidad, los humanos perciben un rango dinámico en torno a los 120 dB. Sonidos de intensidad superior a los 90 dB. pueden provocar daños irreversibles.
Características del sonido Desde el punto de vista musical, al duplicar la frecuencia de un sonido, se pasa a la octava siguiente. Por ejemplo, el La de la octava central del piano tiene una frecuencia de 440 Hz., y el La de la siguiente octava (más agudo), 880 Hz. En la música occidental, la octava se divide en 12 semitonos (las doce teclas que hay en cada octava de un piano). Para obtener la frecuencia de un semitono a partir de la frecuencia del anterior, hay que multiplicar por raíz doceava de 2, o lo que es lo mismo: 1,05946.
Características del sonido El timbre es la “personalidad” de un sonido y permite distinguir, por ejemplo, el sonido de un piano y de una trompeta con igual duración, intensidad y tono. Gráficamente, el timbre se caracteriza por la forma de la onda. Las ondas sinusoidales puras sólo se obtienen electrónicamente, pero en la naturaleza, los sonidos son más complejos. La frecuencia de vibración más grave (frecuencia base) es la que determina el periodo y la amplitud. Las restantes frecuencias, que suelen ser múltiplos de la frecuencia base, son los armónicos.
Características del sonido La intensidad de un sonido depende de la amplitud de onda. Las intensidades de los sonidos que podemos percibir tienen un rango de más de 15 órdenes de magnitud por lo que para su medición se usa una escala logarítmica (decibelios) donde a es la amplitud de onda del sonido que se está midiendo, y aref es la amplitud de referencia (la del sonido con el cual se compara).
Características del sonido Así los decibelios son una relación entre dos amplitudes de onda. Si se toma como amplitud de referencia el umbral de audición, la siguiente tabla muestra la intensidad en dB de algunos sonidos representativos:
Características del sonido Relacionado con la intensidad está el concepto de rango dinámico, que es la diferencia en decibelios entre el sonido más fuerte y más débil que un sistema puede producir. En un aparato de sonido, este valor indica la diferencia entre el volumen máximo y el ruido de fondo que se emite cuando no hay señal. En los equipos de sonido de cierta calidad el rango dinámico oscila entre los 80 dB y los 95 dB
Formato de archivos • AU. Formato audio estándar de Sun. Poca calidad pero son muy comunes en Internet. • AIFF (Audio Interchange File Format), comunes en Mac. Hay una versión con muestras comprimidas, AIFF-C. • QuickTime también tiene formato de audio, sincronizable e integrable con otros medios. • WAV (Waveform) es el formato de Windows. • MP3
MP3 Las siglas MP3 responden a una abreviación de MPEG 1 layer 3. Es un algoritmo de codificación perceptual desarrollado por el consorcio MPEG (Moving Picture Expert Group) junto con el Instituto Tecnológico Fraunhofer que finalmente se ha estandarizado como norma ISO-MPEG Audio Layer 3 (IS 11172-3 y IS 13818-3) y que viene a ser un avance importante sobre los anteriores desarrollos (Layer 1 y Layer 2).
MP3 Dentro de los estándares de vídeo MPEG hay también creados estándares de compresión de audio. Como se permiten distintas calidades existen tres "capas" con distintos esquemas de compresión: la capa 1, la 2 y la 3 (de forma que la complejidad es progresiva, un decodificador de capa 3 funciona también con las capas anteriores), y esta última se conoce por MP3 o MPEG Audio Layer-3.
MP3 El MP3 permite comprimir en un factor aproximado de 12 la información original muestreada (unos 128 Kbits por segundo, es decir, más o menos 1 Mb por minuto) sin perder calidad de sonido de forma apreciable (por un oído no entrenado... y de hecho los estudios de percepción de calidad de mp3 se han hecho con oyentes humanos opinando sobre las diferencias). El formato mp3 utiliza unos cuantos trucos para comprimir el sonido, fundamentalmente técnicas de codificación de percepción que aprovechan la manera en la que el oído humano percibe el sonido. Algunas de las claves son:
MP3 Umbral mínimo de audición El umbral mínimo de audición humano (minimal audition threshold) no es lineal. Cualquier sonido situado fuera de unos ciertos límites y niveles puede no codificarse, ya que no será percibido de cualquier modo.
MP3 Efecto máscara Hay una serie de propiedades de ocultación (masking effect) del oído humano. De la misma forma que al mirar a un objeto muy brillante se anula la percepción de otros objetos que puedan cruzarlo, en audio los sonidos fuertes no dejan oír a los débiles. Para conseguir aprovechar esta característica mp3 usa un modelo psicoacústico del comportamiento del oído humano, que filtra los sonidos más débiles cuando hay sonidos muy fuertes a la vez.
Oído externo • Compuesto por el pabellón auricular y el conducto auditivo externo. • La superficie corrugada de la oreja permite capturar el sonido y dirigirlo hacia el conducto auditivo externo.
Oído medio • La cadena de huesecillos (martillo, yunque y estribo) se extienden desde el tímpano hasta la ventana oval. • Permite transmitir y amplificar el sonido.
Cóclea • Transforma la energía sonora (onda mecánica) en señales eléctricas. • Es capaz de discriminar la frecuencia e intensidad de los tonos que constituyen el espectro audible. • Constituye el primer paso en el proceso de discriminación auditiva.
Cóclea • La cóclea es un tubo enrollado helicoidalmente, adoptando la forma de un caracol. • En su interior tiene tres subdivisiones, denominados de arriba hacia abajo: • Rampa vestibular • Conducto coclear • Rampa timpánica
Cóclea • La membrana vestibular separa la rampa vestibular del conducto coclear. • La membrana vestibular separa la rampa timpánica del conducto coclear. • La rampa vestibular y timpánica se unen en el ápex de la cóclea (helicotrema).
Cóclea • El estribo actúa como un pistón que desplaza la membrana oval y genera ondas de presión hidráulica. • Las ondas de presión viajan a través de la rampa vestibular y en el helicotrema pasan hacia la rampa timpánica. • La presión es eliminada a través de la ventana redonda.
Cóclea • Al pasar por la membrana basilar estimula los receptores auditivos en el órgano de Corti. • Las propiedades elásticas de la membrana basilar cambian a lo largo de su trayecto. Por esa razón, cada frecuencia del espectro audible genera una zona circunscrita de máxima oscilación. • Dicha propiedad permite determinar el tono del sonido.
Órgano de Corti • Es el transductor que transforma las ondas mecánicas en señales eléctricas. • Las unidades sensoriales están representadas por las células pilosas, cuyo extremo apical (estereocilios) entra en contacto con la membrana tectoria. • Cuando la membrana basilar vibra arrastra consigo el órgano de Corti y la membrana tectoria.
Órgano de Corti • Los movimientos descritos producen deflexión de los estereocilios. • Dicha deflexión evoca un potencial eléctrico en la célula pilosa. • Cada célula pilosa está sintonizada con un rango estrecho de frecuencias sonoras.
Células pilosas • Poseen una superficie apical donde se destacan los estereocilios (estructuras rígidas que contienen filamentos de actina y fibrina). • La superficie basal entra en contacto con el axón proximal de las neuronas del ganglio espiral.
Células pilosas • La deflexión de las estereocilias abre canales iónicos mecanosensibles. • A través de ellos penetran iones K+ (el catión más abundante de la endolinfa), que despolarizan la célula. • Así son activados canales de calcio dependientes de voltaje. La entrada de este ión permite la exocitosis de neurotransmisores.
Células pilosas • La configuración específica de las estereocilias (variación en longitud y viscosidad), les permite responder de manera selectiva a determinado tono sonoro (tal como lo haría un diapasón). • Podrían existir también resonadores eléctricos. • Esto explica en parte los mapas tonotópicos de la cóclea (la otra explicación radica en las propiedades mecánicas de la membrana basilar)
Ganglio espiral • Las neuronas sensitivas presentes en el ganglio espiral establecen contacto principalmente con las células pilosas internas. • Cada axón inerva una sola célula pilosa. • A cada célula pilosa llegan aproximadamente 10 axones.
Nervio coclear • El nervio coclear envía información codificada de tono e intensidad hacia el cerebro. • Cada axón presente en el nervio coclear responde a un tono y volumen específico (sistema de canales paralelos).
Núcleos cocleares • Están tonotópicamente organizados. • Las células localizadas en el núcleo coclear dorsal ayudan a discriminar la fuente de origen del estímulo sonoro en sentido vertical. • Las neuronas cocleares permiten suprimir el efecto de eco.
Vías ascendentes • Las células del grupo ventral anterior envía proyecciones hacia el complejo olivar superior por medio del cuerpo trapezoide. • En este sitio se realiza la discriminación de la fuente sonora en sentido horizontal (basado en latencia e intensidad).
Integración central • Las neuronas del cuerpo geniculado medial envían fibras a la región superior y dorsal del lóbulo temporal (giro transverso de Heschl, primer giro temporal), que constituyen la corteza auditiva primaria. • La corteza auditiva primaria está organizada en microcolumnas de distribución tonotópica.
Corteza cerebral • Discrimina los sonidos en todas sus cualidades. • Permite descomponer sonidos complejos como los del lenguaje o la música.
Corteza cerebral • Discrimina los sonidos en todas sus cualidades. • Permite descomponer sonidos complejos como los del lenguaje o la música.