540 likes | 663 Views
Armazenamento de Sinais de Áudio. Geber Ramalho (glr@di.ufpe.br) Jeferson Valadares (jlfv@di.ufpe.br) Ulisses Montenegro (urma@di.ufpe.br). Gravação/Armazenamento. Definição Meio pelo qual o som pode ser capturado permanentemente e, eventualmente, re-trabalhado
E N D
Armazenamento de Sinais de Áudio Geber Ramalho (glr@di.ufpe.br) Jeferson Valadares (jlfv@di.ufpe.br) Ulisses Montenegro (urma@di.ufpe.br)
Gravação/Armazenamento • Definição • Meio pelo qual o som pode ser capturado permanentemente e, eventualmente, re-trabalhado • é baseada na conversão de sinais elétricos em • sinais magnéticos • padrões mecânicos • padrões óticos • sinais eletrônicos (chips) • Plano de aula • Fita magnética e toca discos • Gravadores analógicos • Gravadores digitais e CD • Arquivos de som para computador
N S N S N S N S N S N S Fitas magnéticas: contituição • Base de poliéster • função mecânica • espessura 25 a 40m • Material magnético • Óxido de ferro Fe2O3 • Dióxido de cromo: CrO2 • Ferro puro (metal): Fe • Material adesivo • resina • Solvente
IMÂ Fabricação de fitas: etapas 1) Moagem • Mistura adesivo, óxido (partículas magnéticas ) e solvente para forma uma pasta fluida • aplica a pasta sobre a base 2) Orientação • as partículas são orientadas
Fabricação de fitas: etapas 3) Secagem • Evaporação do solvente • Túnel de secagem 4) Enrolamento 5) Polimento 6) Corte • no cassete • comprimento 45, 60, 90 e 120 minutos • largura 3,8 mm 7) Embalagem
Princípio de funcionamento • Ciclo de histerese • uma partícula (ponto 0) exposta a uma força magnética H é magnetizada até a saturação (ponto 1) • Quando a força é “desligada”, um certo fluxo magnético permanece (ponto 2) • Submetida a uma força magnética negativa, o nível zero de magnetização é obtido (ponto 3) • o ciclo continua...
Característica de transferência • A função de transferência não é linear • as variações no sinal elétrico não são reproduzidas fielmente pela magnetização • implica em distorção saída entrada
Polarização (bias) • Solução: polarização • idéia: forçar o sinal a “trabalhar” na zona linear somando-se outro sinal a ele • onda de alta freqüência (AM) que pode ser filtrada depois
Gravadores • 3 componentes • cabeças • eletrônica • mecânica
Cabeça de gravação • Idéia: • a variação de corrente na bobina induz fluxo magnético correspondente no núcleo • pelo fato de existir um gap no núcleo, o fluxo magnético é forçado a atravessar a fita orientando as suas partículas • Ao cessar o campo, pela propriedade da remanência, o campo magnético permanece
Cabeça de apagamento • Idéia: • mesmo princípio da cabeça de gravação, porém • introduz um sinal de alta freqüência de forma a “bagunçar” o alinhamento dos domínios (partículas) • O gap • deve ser grande: aprox. 20 m • para poder mudar, por exemplo, pelo menos 10 vezes cada domínio (partícula) no curto período de tempo em que a fita passa pela cabeça
Cabeça de reprodução • Princípio inverso da gravação • a passagem da fita magnetizada, implica em uma variação de fluxo magnético no núcleo, induzindo uma corrente correspondente • deve ter alta permeabilidade (sensível às variações de fluxo da fita) • Gap • basicamente da mesma ordem do da cabeça de gravação • largura do gap < comprimento de onda • se for maior, não conseguirá captar nas extremidades do núcleo a variação de fluxo magnético
Cabeças • Fazer ajustes • Zenite • Azimute • E de vez em quando desmagnetizar... • Magnetismo => ruído • Usar desmagnetizador (ponta de prova gerando 60 Hz)
Cabeças • 3 cabeças é melhor do que 2 • cada uma pode ser projetada otimamente
Velocidade • Quanto maior a velocidade melhor a qualidade! • Velocidade • cassete: 4,75 cm/s (1 7/8 ips) • rolo: 9,5 cm/s (3 3/4 ips) • rolo: 19 cm/s (7 1/2 ips) • rolo: 38 cm/s (15 ips) • Exemplo • gravar freqüência de 10kHz • como = v/f • cassete: = 4,75/10000 = 0,5 m • rolo: = 19/10000 = 3,8 m
cabeça fita cabeça cabeça fita fita 1 esq dir 2 Pistas (tracks) • Completa monofônica • Meia pista monofônica • Meia pista estéreo (Revox) • Quatro pistas mono fita cabeça 1 2 3 4
fita cabeça esq dir dir esq Pistas • Quatro pistas estéreo • cassete • N pistas mono (estúdio) • 8 • 16 • 24 • 32 • crosstalk • informação de uma pista vaza para a outra fita cabeça 1 1 2 3 4 5 6 7 8
Limitações • Analogia entre fita e amostragem • largura do gap taxa de amostragem • Largura física da fita quantificação • Faixa dinâmica reduzida • Saturação: não pode-se usar níveis muito elevados de sinal, senão distorce • Ruído branco: o ruído de fundo (hiss) impede que se use níveis de sinal muito baixos sem serem mascarados • Solução • Tipo de fita: Metal melhor • Velocidade de gravação: mais rápido melhor • Largura de fita: mais larga melhor
Limitações das fitas • Resposta em freqüência • fraca nas baixas e altas freqüências • Polarização causa cancelamentos nas altas freqüências • Tamanho do Gap passa a ser crítico • Soluções • Pré-equalização para corrigir a resposta • Velocidade de gravação: mais rápido melhor • Tipo de fita: Metal
Limitações das fitas • Ruído • Existe muito ruído de fundo (hiss) • a situação é crítica nas altas freqüências onde a energia da música é mais fraca • a relação sinal ruído deveria ser de pelo menos 60dB
Redutores de ruído • Solução • utilizar redutores de ruído • idéia • dar ênfase em certas freqüências na gravação e e atenuá-las na reprodução • Sistemas • Dolby • dbx
freq ruído ruído música amp amp freq freq freq freq música freq atenuação freq freq ilustração NORMAL Gravação = Ênfase Gravação = reprodução
Redutores de ruído • Sistema dbx • enfatiza altas freqüências (taxa de 2:1) e depois atenua com a mesma curva • trabalha então em uma única banda • reduz ruído em 30dB e aumenta headroom (faixa dinâmica) em 10dB • Dolby A • divide o espectro em 4 bandas de freqüências que são comprimidas e expandidas independentemente • Além disto, Dolby só opera em passagens de baixa energia (abaixo de -10 VU) • consegue redução de 10dB abaixo de 5kHz e 15dB acima de 15kHz
Redutores de ruído • Dolby B • sistema mais barato para cassetes • só opera nas altas freqüências reduzindo hiss em 10dB • Dolby C • trabalha em um espectro mais largo e reduz 20dB • Dolby SR • melhor dos sistemas Dolby • atua em regiões onde o sinal tem nível baixo a médio • redução de mais de 25dB em grande parte do espectro audível • ex. em 15 ips (38 m/s) é possível obter uma relação sinal ruído de 105dB
sinal esquerdo induzido sinal direito induzido agulha disco Toca-disco vinil: só curiosidades... • Disco • material: vinil • velocidade: 78, 45 ou 33 rpm • Reprodução: agulha + capsula • Sulcos e codificação mono direito esquerdo d+e (em fase) d+e (em contrafase)
Toca-disco vinil • Controle motor da rotação • Correia • Polia • Tração direta • Rastreio • para evitar erro: braço inclinado • J, S, reto com capsula em anglo, etc. • para compensar pressão: anti-skating • Reposta em freqüência • Para corrigir a fraca reprodução nas altas e nas baixas: equalização RIAA
analógico digital Sinal magnético Sinal lido Sinal reconstituído Gravação Digital em Fita • Idéia • grava-se a informação digital (binária, PCM), em vez do próprio sinal • não é necessário polarizar • Reprodução detecta mudanças de orientação
Sinal escrito Sinal lido Sinal reconstruído Largura de banda • Definição • resolução (distância física mínima entre os picos) do sinal • Influencia no espectro em que se pode gravar e pode provocar erros • Interferência • deturpações nas mudanças dos picos
Largura de banda • Caso digital • 50 vezes maior do que a de um gravador analógico • 44,1 KHz x 16 bits = 705 Kbps • somando-se dados para sincronização e correção de erros, seria preciso 1Mbps para a máxima freqüência • o problema piora para gravadores multipista • O grande desafio • maximizar densidade sem provocar erros!!! • Métodos • usar gravação vertical em vez de longitudinal • não se está limitado ao tamanho das partículas magnéticas • difícil de ser operacionalizado
2 Tipos de Cabeças • Estacionárias • DASH (digital audio stationary head) • Rotativas • duas cabeças giram deixando, por causa do movimento da fita, um rastro diagonal • truque que aumenta o “tamanho útil”da fita Exemplo do vídeo cassete
Balanço • Vantagens da cabeça rotativa • maior largura de banda • maior densidade de gravação (gasta menos fita) • mais fácil de sincronizar com sinais de vídeo • etc. • Vantagens da cabeça rotativa • em algumas aplicações particulares, difícil de fazer edições muito precisas • melhor usar memória - chips • mais difícil fazer overdubbing ou puch-in e punch-out devido a multiplexação • menos simples de projetar e mais caras
Armazenamento Digital de Áudio Digital Audio Tape (DAT) Compact Disc (CD) Arquivo wave (.wav) Arquivo de áudio da Sun (.au) Codificação Sonora Perceptual (MPEG e MP3) Outros formatos
DAT • Início das pesquisas em 1981 • Em 1983, dois padrões foram propostos: • S-DAT • R-DAT • R-DAT foi definido como padrão em 1986, e desde então o formato é conhecido simplesmente como DAT • Fita DAT: • padronizada exclusivamente para o formato DAT • dimensões: 73x54x10.5 mm • capacidade de aproximadamente duas a seis horas de áudio • só começa a se deteriorar a partir da 200ª reprodução
DAT • O formato suporta três freqüências de amostragem: • 32, 44.1 e 48 kHz • Dois níveis de bits de quantização • 12 bits não-lineares ou 16 bits lineares • Extensões ao padrão DAT, criadas por fabricantes • 12 bits a 96KHz • 24 bits a 48KHz • Gravadores DAT apresentam entradas e saídas digitais • cópias digitais de alta qualidade
DAT Formato da Trilha 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Sync 8 bits ID code (PCM block or subcode block) 8 bits Block address (and subcode ID) 8 bits Parity 8 bits Data (PCM data and parity or subcode data and parity) 256 bits (32 symbols) DAT W1 W2 P Paridade: P = W1 W2 ( = Mod 2) Block address: corresponds to PCM or subcode data block, the MSB indicates an ID bit (PCM or subcode data)
Compact Disc • Armazenamento de bits baseado em princípios óticos • Tecnologia levou cerca de 10 anos desde concepção ate introdução no mercado • 1972 • Phillips introduziu o conceito de armazenamento ótico de áudio em discos de tamanho limitado • Sony desenvolveu técnicas de correção de erros para discos óticos de grandes dimensões • 1980 • padrão de Compact Disc Digital Audio foi criado e aprovado pelo Digital Audio Disc Commitee, um grupo representando mais de 25 empresas
Compact Disc • Tamanho da palavra e freqüência de amostragem fixas • 16 bits • 44.1 kHz • dois canais (estéreo) • total de 1,41 milhões de bits por segundo de áudio • Dados adicionais de controle • correção de erro • sincronização • modulação • Taxa total de transferência chega a 4.3218 Mbps
Compact Disc • CD-DA define tamanho máximo em 6.3109 bits • capacidade para 74 minutos e 33 segundos de áudio • Capacidade foi definida por sugestão de Herbert von Karajan • coincide com a duração de uma execução ininterrupta da 9a Sinfonia de Beethoven • Variações nos parâmetros físicos permitem durações superiores a 80 minutos de áudio • CD players de qualidade exibem resposta de freqüência de 5Hz a 20kHz com desvio de ±0.2dB • taxa de signal-to-noise acima dos 100dB • distorção harmônica a 1kHZ abaixo de 0.002%
1,6 mm 0,6 m Compact Disc 0.163mm 1 frame (1/7.35 ms) Sync (27 bits) Sub Code Data (96 bits) Parity (32 bits) Data (96 bits) Parity (32 bits) 8 bits P,Q,R,S,T,U,V,W
Arquivos Wave Tamanho Descrição 4 bytes “RIFF” 4 bytes Tamanho do arquivo (subtraído de 4) 4 bytes “WAVE” 4 bytes “fmt “ 4 bytes Tamanho da descrição do arquivo 2 bytes Flag para mono (0x01) ou estéreo (0x02) 4 bytes Taxa de amostragem 4 bytes Bytes/sample 2 bytes Alinhamento do bloco 2 bytes Bits/sample 4 bytes “data” 4 bytes Tamanho do segmento de dados (n bytes) Dados Little-Endian Word Esquerdo (MSB) | Direito (LSB)
Arquivos Wave • Taxa de amostragem é dada em Hz • e.g., 44.100Hz • Bytes/sample é calculado como(taxa de amostragem alinhamento de bloco) • Alinhamento de bloco é calculado como(canais bits por sample)/8 • Bits por sample podem assumir apenas os valores 8 ou 16 • Para arquivos em estéreo, o bloco de dados do canal esquerdo é imediatamente seguido do bloco do canal direito, em seqüência até o final do arquivo
Arquivo de áudio da Sun (.au) • Definido pela Sun em 1992 • Várias codificações (ISDN u-law, PCM linear, ponto flutuante IEEE), de 8 a 64 bits • Várias taxas de amostragem (8000, 11025, 16000, 22050, 32000, 44100 e 48000 amostras/s) • Funções para manipulação incluídas nos sistemas operacionais da Sun e em Java
Formato .au Offset Tamanho Descrição 0 4 bytes ".snd" 4 4 bytes <Header size (h)> 8 4 bytes <Sample data size (s)> 12 4 bytes <Audio file encoding> 16 4 bytes <Sample rate> 20 4 bytes <Number of channels> 24 (h-24)bytes <Comment> (h) (s)bytes <Sample data> Big-Endian Word Esquerdo (LSB) | Direito (MSB)
Codificação Sonora Perceptual • Antes da compressão de áudio, um minuto de música estéreo (qualidade de CD) ocupava 10 MB! • 44.100 amostras/s * 2 canais * 2 bytes/amostra * 60 s/min • Caso um arquivo destes fosse transmitido pela internet através de um modem padrão (28.8 Kbps) a transferência de 1 minuto levaria 49 minutos! • 10.000.000 bytes * 8 bits/byte / (28.800 bits/s * 60 s/min) • Codificação sonora explora as propriedades do ouvido humano para conseguir uma redução de tamanho com pouca ou nenhuma perda perceptível na qualidade
Codificação Sonora Perceptual - MPEG • Eficiência atingida através de algoritmos que exploram redundância em sinais e as não-relevâncias (mascaramento) no domínio de freqüência baseado em um modelo do sistema auditivo humano • sinais redundantes e irrelevantes são perdidos na codificação • Ideal para ambientes que precisam de alta qualidade com um baixo bitrate: trilhas sonoras de jogos em CD-ROM, áudio para internet, sistemas de transmissão de áudio digital, etc.
MPEG Audio Layer-3 (MP3) • Início do desenvolvimento em 1987 pelo IIS • Sinais digitais sem compressão: • 16bits, 44.1KHz - 1.400 Mbit para 1s de música estéreo • Através de codificação MPEG: • redução do tamanho por um fator de 4-24 através de técnicas de codificação sonora perceptual • Layer 3: reduções de 10-12 vezes sem perda de qualidade • Padronizado pela ISO e recomendado pela ITU-R para aplicações de broadcast que necessitem de um bitrate de 60 kbps/s por canal