1 / 54

Armazenamento de Sinais de Áudio

Armazenamento de Sinais de Áudio. Geber Ramalho (glr@di.ufpe.br) Jeferson Valadares (jlfv@di.ufpe.br) Ulisses Montenegro (urma@di.ufpe.br). Gravação/Armazenamento. Definição Meio pelo qual o som pode ser capturado permanentemente e, eventualmente, re-trabalhado

zia
Download Presentation

Armazenamento de Sinais de Áudio

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Armazenamento de Sinais de Áudio Geber Ramalho (glr@di.ufpe.br) Jeferson Valadares (jlfv@di.ufpe.br) Ulisses Montenegro (urma@di.ufpe.br)

  2. Gravação/Armazenamento • Definição • Meio pelo qual o som pode ser capturado permanentemente e, eventualmente, re-trabalhado • é baseada na conversão de sinais elétricos em • sinais magnéticos • padrões mecânicos • padrões óticos • sinais eletrônicos (chips) • Plano de aula • Fita magnética e toca discos • Gravadores analógicos • Gravadores digitais e CD • Arquivos de som para computador

  3. N S N S N S N S N S N S Fitas magnéticas: contituição • Base de poliéster • função mecânica • espessura  25 a 40m • Material magnético • Óxido de ferro Fe2O3 • Dióxido de cromo: CrO2 • Ferro puro (metal): Fe • Material adesivo • resina • Solvente

  4. IMÂ Fabricação de fitas: etapas 1) Moagem • Mistura adesivo, óxido (partículas magnéticas ) e solvente para forma uma pasta fluida • aplica a pasta sobre a base 2) Orientação • as partículas são orientadas

  5. Fabricação de fitas: etapas 3) Secagem • Evaporação do solvente • Túnel de secagem 4) Enrolamento 5) Polimento 6) Corte • no cassete • comprimento 45, 60, 90 e 120 minutos • largura 3,8 mm 7) Embalagem

  6. Princípio de funcionamento • Ciclo de histerese • uma partícula (ponto 0) exposta a uma força magnética H é magnetizada até a saturação (ponto 1) • Quando a força é “desligada”, um certo fluxo magnético permanece (ponto 2) • Submetida a uma força magnética negativa, o nível zero de magnetização é obtido (ponto 3) • o ciclo continua...

  7. Característica de transferência • A função de transferência não é linear • as variações no sinal elétrico não são reproduzidas fielmente pela magnetização • implica em distorção saída entrada

  8. Polarização (bias) • Solução: polarização • idéia: forçar o sinal a “trabalhar” na zona linear somando-se outro sinal a ele • onda de alta freqüência (AM) que pode ser filtrada depois

  9. Gravadores • 3 componentes • cabeças • eletrônica • mecânica

  10. Cabeça de gravação • Idéia: • a variação de corrente na bobina induz fluxo magnético correspondente no núcleo • pelo fato de existir um gap no núcleo, o fluxo magnético é forçado a atravessar a fita orientando as suas partículas • Ao cessar o campo, pela propriedade da remanência, o campo magnético permanece

  11. Cabeça de apagamento • Idéia: • mesmo princípio da cabeça de gravação, porém • introduz um sinal de alta freqüência de forma a “bagunçar” o alinhamento dos domínios (partículas) • O gap • deve ser grande: aprox. 20 m • para poder mudar, por exemplo, pelo menos 10 vezes cada domínio (partícula) no curto período de tempo em que a fita passa pela cabeça

  12. Cabeça de reprodução • Princípio inverso da gravação • a passagem da fita magnetizada, implica em uma variação de fluxo magnético no núcleo, induzindo uma corrente correspondente • deve ter alta permeabilidade (sensível às variações de fluxo da fita) • Gap • basicamente da mesma ordem do da cabeça de gravação • largura do gap < comprimento de onda • se for maior, não conseguirá captar nas extremidades do núcleo a variação de fluxo magnético

  13. Cabeças • Fazer ajustes • Zenite • Azimute • E de vez em quando desmagnetizar... • Magnetismo => ruído • Usar desmagnetizador (ponta de prova gerando 60 Hz)

  14. Cabeças • 3 cabeças é melhor do que 2 • cada uma pode ser projetada otimamente

  15. Velocidade • Quanto maior a velocidade melhor a qualidade! • Velocidade • cassete: 4,75 cm/s (1 7/8 ips) • rolo: 9,5 cm/s (3 3/4 ips) • rolo: 19 cm/s (7 1/2 ips) • rolo: 38 cm/s (15 ips) • Exemplo • gravar freqüência de 10kHz • como  = v/f • cassete:  = 4,75/10000 = 0,5 m • rolo:  = 19/10000 = 3,8 m

  16. cabeça fita cabeça cabeça fita fita 1 esq dir 2 Pistas (tracks) • Completa monofônica • Meia pista monofônica • Meia pista estéreo (Revox) • Quatro pistas mono fita cabeça 1 2 3 4

  17. fita cabeça esq dir dir esq Pistas • Quatro pistas estéreo • cassete • N pistas mono (estúdio) • 8 • 16 • 24 • 32 • crosstalk • informação de uma pista vaza para a outra fita cabeça 1 1 2 3 4 5 6 7 8

  18. Limitações • Analogia entre fita e amostragem • largura do gap  taxa de amostragem • Largura física da fita  quantificação • Faixa dinâmica reduzida • Saturação: não pode-se usar níveis muito elevados de sinal, senão distorce • Ruído branco: o ruído de fundo (hiss) impede que se use níveis de sinal muito baixos sem serem mascarados • Solução • Tipo de fita: Metal melhor • Velocidade de gravação: mais rápido melhor • Largura de fita: mais larga melhor

  19. Limitações das fitas • Resposta em freqüência • fraca nas baixas e altas freqüências • Polarização causa cancelamentos nas altas freqüências • Tamanho do Gap passa a ser crítico • Soluções • Pré-equalização para corrigir a resposta • Velocidade de gravação: mais rápido melhor • Tipo de fita: Metal

  20. Limitações das fitas • Ruído • Existe muito ruído de fundo (hiss) • a situação é crítica nas altas freqüências onde a energia da música é mais fraca • a relação sinal ruído deveria ser de pelo menos 60dB

  21. Redutores de ruído • Solução • utilizar redutores de ruído • idéia • dar ênfase em certas freqüências na gravação e e atenuá-las na reprodução • Sistemas • Dolby • dbx

  22. freq ruído ruído música amp amp freq freq freq freq música freq atenuação freq freq ilustração NORMAL Gravação  = Ênfase Gravação  = reprodução

  23. Redutores de ruído • Sistema dbx • enfatiza altas freqüências (taxa de 2:1) e depois atenua com a mesma curva • trabalha então em uma única banda • reduz ruído em 30dB e aumenta headroom (faixa dinâmica) em 10dB • Dolby A • divide o espectro em 4 bandas de freqüências que são comprimidas e expandidas independentemente • Além disto, Dolby só opera em passagens de baixa energia (abaixo de -10 VU) • consegue redução de 10dB abaixo de 5kHz e 15dB acima de 15kHz

  24. Redutores de ruído • Dolby B • sistema mais barato para cassetes • só opera nas altas freqüências reduzindo hiss em 10dB • Dolby C • trabalha em um espectro mais largo e reduz 20dB • Dolby SR • melhor dos sistemas Dolby • atua em regiões onde o sinal tem nível baixo a médio • redução de mais de 25dB em grande parte do espectro audível • ex. em 15 ips (38 m/s) é possível obter uma relação sinal ruído de 105dB

  25. sinal esquerdo induzido sinal direito induzido agulha disco Toca-disco vinil: só curiosidades... • Disco • material: vinil • velocidade: 78, 45 ou 33 rpm • Reprodução: agulha + capsula • Sulcos e codificação mono direito esquerdo d+e (em fase) d+e (em contrafase)

  26. Toca-disco vinil • Controle motor da rotação • Correia • Polia • Tração direta • Rastreio • para evitar erro: braço inclinado • J, S, reto com capsula em anglo, etc. • para compensar pressão: anti-skating • Reposta em freqüência • Para corrigir a fraca reprodução nas altas e nas baixas: equalização RIAA

  27. analógico digital Sinal magnético Sinal lido Sinal reconstituído Gravação Digital em Fita • Idéia • grava-se a informação digital (binária, PCM), em vez do próprio sinal • não é necessário polarizar • Reprodução detecta mudanças de orientação

  28. Sinal escrito Sinal lido Sinal reconstruído Largura de banda • Definição • resolução (distância física mínima entre os picos) do sinal • Influencia no espectro em que se pode gravar e pode provocar erros • Interferência • deturpações nas mudanças dos picos

  29. Largura de banda • Caso digital • 50 vezes maior do que a de um gravador analógico • 44,1 KHz x 16 bits = 705 Kbps • somando-se dados para sincronização e correção de erros, seria preciso 1Mbps para a máxima freqüência • o problema piora para gravadores multipista • O grande desafio • maximizar densidade sem provocar erros!!! • Métodos • usar gravação vertical em vez de longitudinal • não se está limitado ao tamanho das partículas magnéticas • difícil de ser operacionalizado

  30. 2 Tipos de Cabeças • Estacionárias • DASH (digital audio stationary head) • Rotativas • duas cabeças giram deixando, por causa do movimento da fita, um rastro diagonal • truque que aumenta o “tamanho útil”da fita Exemplo do vídeo cassete

  31. Balanço • Vantagens da cabeça rotativa • maior largura de banda • maior densidade de gravação (gasta menos fita) • mais fácil de sincronizar com sinais de vídeo • etc. • Vantagens da cabeça rotativa • em algumas aplicações particulares, difícil de fazer edições muito precisas • melhor usar memória - chips • mais difícil fazer overdubbing ou puch-in e punch-out devido a multiplexação • menos simples de projetar e mais caras

  32. Armazenamento Digital de Áudio Digital Audio Tape (DAT) Compact Disc (CD) Arquivo wave (.wav) Arquivo de áudio da Sun (.au) Codificação Sonora Perceptual (MPEG e MP3) Outros formatos

  33. DAT • Início das pesquisas em 1981 • Em 1983, dois padrões foram propostos: • S-DAT • R-DAT • R-DAT foi definido como padrão em 1986, e desde então o formato é conhecido simplesmente como DAT • Fita DAT: • padronizada exclusivamente para o formato DAT • dimensões: 73x54x10.5 mm • capacidade de aproximadamente duas a seis horas de áudio • só começa a se deteriorar a partir da 200ª reprodução

  34. DAT • O formato suporta três freqüências de amostragem: • 32, 44.1 e 48 kHz • Dois níveis de bits de quantização • 12 bits não-lineares ou 16 bits lineares • Extensões ao padrão DAT, criadas por fabricantes • 12 bits a 96KHz • 24 bits a 48KHz • Gravadores DAT apresentam entradas e saídas digitais • cópias digitais de alta qualidade

  35. DAT

  36. DAT Formato da Trilha 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

  37. Sync 8 bits ID code (PCM block or subcode block) 8 bits Block address (and subcode ID) 8 bits Parity 8 bits Data (PCM data and parity or subcode data and parity) 256 bits (32 symbols) DAT W1 W2 P Paridade: P = W1 W2 ( = Mod 2) Block address: corresponds to PCM or subcode data block, the MSB indicates an ID bit (PCM or subcode data)

  38. DAT

  39. DAT

  40. Compact Disc • Armazenamento de bits baseado em princípios óticos • Tecnologia levou cerca de 10 anos desde concepção ate introdução no mercado • 1972 • Phillips introduziu o conceito de armazenamento ótico de áudio em discos de tamanho limitado • Sony desenvolveu técnicas de correção de erros para discos óticos de grandes dimensões • 1980 • padrão de Compact Disc Digital Audio foi criado e aprovado pelo Digital Audio Disc Commitee, um grupo representando mais de 25 empresas

  41. Compact Disc • Tamanho da palavra e freqüência de amostragem fixas • 16 bits • 44.1 kHz • dois canais (estéreo) • total de 1,41 milhões de bits por segundo de áudio • Dados adicionais de controle • correção de erro • sincronização • modulação • Taxa total de transferência chega a 4.3218 Mbps

  42. Compact Disc • CD-DA define tamanho máximo em 6.3109 bits • capacidade para 74 minutos e 33 segundos de áudio • Capacidade foi definida por sugestão de Herbert von Karajan • coincide com a duração de uma execução ininterrupta da 9a Sinfonia de Beethoven • Variações nos parâmetros físicos permitem durações superiores a 80 minutos de áudio • CD players de qualidade exibem resposta de freqüência de 5Hz a 20kHz com desvio de ±0.2dB • taxa de signal-to-noise acima dos 100dB • distorção harmônica a 1kHZ abaixo de 0.002%

  43. 1,6 mm 0,6 m Compact Disc 0.163mm 1 frame (1/7.35 ms) Sync (27 bits) Sub Code Data (96 bits) Parity (32 bits) Data (96 bits) Parity (32 bits) 8 bits P,Q,R,S,T,U,V,W

  44. Arquivos Wave Tamanho Descrição 4 bytes “RIFF” 4 bytes Tamanho do arquivo (subtraído de 4) 4 bytes “WAVE” 4 bytes “fmt “ 4 bytes Tamanho da descrição do arquivo 2 bytes Flag para mono (0x01) ou estéreo (0x02) 4 bytes Taxa de amostragem 4 bytes Bytes/sample 2 bytes Alinhamento do bloco 2 bytes Bits/sample 4 bytes “data” 4 bytes Tamanho do segmento de dados (n bytes) Dados Little-Endian Word Esquerdo (MSB) | Direito (LSB)

  45. Arquivos Wave • Taxa de amostragem é dada em Hz • e.g., 44.100Hz • Bytes/sample é calculado como(taxa de amostragem  alinhamento de bloco) • Alinhamento de bloco é calculado como(canais  bits por sample)/8 • Bits por sample podem assumir apenas os valores 8 ou 16 • Para arquivos em estéreo, o bloco de dados do canal esquerdo é imediatamente seguido do bloco do canal direito, em seqüência até o final do arquivo

  46. Arquivo de áudio da Sun (.au) • Definido pela Sun em 1992 • Várias codificações (ISDN u-law, PCM linear, ponto flutuante IEEE), de 8 a 64 bits • Várias taxas de amostragem (8000, 11025, 16000, 22050, 32000, 44100 e 48000 amostras/s) • Funções para manipulação incluídas nos sistemas operacionais da Sun e em Java

  47. Formato .au Offset Tamanho Descrição 0 4 bytes ".snd" 4 4 bytes <Header size (h)> 8 4 bytes <Sample data size (s)> 12 4 bytes <Audio file encoding> 16 4 bytes <Sample rate> 20 4 bytes <Number of channels> 24 (h-24)bytes <Comment> (h) (s)bytes <Sample data> Big-Endian Word Esquerdo (LSB) | Direito (MSB)

  48. Codificação Sonora Perceptual • Antes da compressão de áudio, um minuto de música estéreo (qualidade de CD) ocupava 10 MB! • 44.100 amostras/s * 2 canais * 2 bytes/amostra * 60 s/min • Caso um arquivo destes fosse transmitido pela internet através de um modem padrão (28.8 Kbps) a transferência de 1 minuto levaria 49 minutos! • 10.000.000 bytes * 8 bits/byte / (28.800 bits/s * 60 s/min) • Codificação sonora explora as propriedades do ouvido humano para conseguir uma redução de tamanho com pouca ou nenhuma perda perceptível na qualidade

  49. Codificação Sonora Perceptual - MPEG • Eficiência atingida através de algoritmos que exploram redundância em sinais e as não-relevâncias (mascaramento) no domínio de freqüência baseado em um modelo do sistema auditivo humano • sinais redundantes e irrelevantes são perdidos na codificação • Ideal para ambientes que precisam de alta qualidade com um baixo bitrate: trilhas sonoras de jogos em CD-ROM, áudio para internet, sistemas de transmissão de áudio digital, etc.

  50. MPEG Audio Layer-3 (MP3) • Início do desenvolvimento em 1987 pelo IIS • Sinais digitais sem compressão: • 16bits, 44.1KHz - 1.400 Mbit para 1s de música estéreo • Através de codificação MPEG: • redução do tamanho por um fator de 4-24 através de técnicas de codificação sonora perceptual • Layer 3: reduções de 10-12 vezes sem perda de qualidade • Padronizado pela ISO e recomendado pela ITU-R para aplicações de broadcast que necessitem de um bitrate de 60 kbps/s por canal

More Related