850 likes | 1.06k Views
Conceitos Básicos em Codificação com Perdas. Em codificação sem perdas : Limite da taxa de compressão atingível (em bits/símbolo) é dado pela entropia da fonte. de acordo com a Teoria da Informação de Shannon. Em codificação com perdas :
E N D
Em codificação sem perdas: Limite da taxa de compressão atingível (em bits/símbolo) é dado pela entropia da fonte de acordo com a Teoria da Informação de Shannon. Em codificação com perdas: Há um compromisso entre a taxa de compressão e a qualidade do sinal reconstruído. TE073 – Processamento Digital de Sinais II
Codificação com perdas: Maior distorção possível: Perda total do sinal Taxa de compressão máxima! Isto é, não necessita enviar dado nenhum. Menor distorção possível: Codificação sem perdas Taxa de compressão dada pela entropia da fonte. Teoria da Distorção pela Taxa (Rate Distortion Theory) TE073 – Processamento Digital de Sinais II
Otimizar um codificador: Obter a menor distorção possível para uma dada taxa de compressão. (imposição do meio de armazenamento ou canal de comunicação) Como medir a distorção?? TE073 – Processamento Digital de Sinais II
7.3. Critérios de Distorção O que é a distorção?? É uma medida de quanto o sinal reconstruído se diferencia do sinal original. A fidelidade da reconstrução depende do usuário final. Medidas subjetivas: O usuário final define, subjetivamente, a qualidade da reconstrução. Geralmente feito através de uma pesquisa de opinião com um grande número de pessoas para não recair em particularismos. Ex.: Avaliação de uma pintura e avaliação de um rascunho de uma casa. Avaliação de um trecho de música clássica e de um discurso político. TE073 – Processamento Digital de Sinais II
Medidas subjetivas da distorção: O usuário final define, subjetivamente, a qualidade da reconstrução. Geralmente feito através de uma pesquisa de opinião com um grande número de pessoas para não recair em particularismos. Ex.: Avaliação de uma pintura e avaliação de um rascunho de uma casa. Avaliação de um trecho de música clássica e de um discurso político. Baseado em escores: Excelente, ótimo, bom, aceitável, ruim, péssimo, inaceitável, horroroso, pior que isso não poderia ser, etc. TE073 – Processamento Digital de Sinais II
Problemas com este tipo de medida: Difícil de se computar, pois depende muito de pessoa para pessoa. Para se obter uma medida independente de “gostos”, deve-se trabalhar com um número muito grande de pessoas. O que torna a medida muito complicada e trabalhosa de ser realizada. Logo: definição de medidas objetivas da distorção facilita muito o projeto dos codificadores. TE073 – Processamento Digital de Sinais II
Medidas objetivas da distorção: Geralmente baseadas em erros entre o sinal original e o reconstruído: Onde: É a distorção de ordem p entre o sinal original x e o sinal reconstruído y. N é o número de componentes (dimensões) dos sinais. TE073 – Processamento Digital de Sinais II
Medidas mais comuns: Média das diferenças absolutas Erro médio quadrático (EMQ) Mean Squared Error (MSE) Distância Euclidiana ao quadrado .... Erro máximo. Usado em casos onde o erro só é percebido Acima de um determinado limiar (threshold) TE073 – Processamento Digital de Sinais II
Considerando que a distorção imposta ao sinal original como sendo um ruído de codificação: Podemos ter medidas baseadas na relação Sinal-Ruído Energia do Sinal Energia do Ruído (d2,EMQ,MSE) Medida em dB Relação sinal ruído de pico Muito usado em imagem: x2max=2552 TE073 – Processamento Digital de Sinais II
Vimos 2 formas de medidas da fidelidade da reconstrução: Medidas Subjetivas: Medidas precisas da fidelidade baseada nos aspectos e limitações humanas. São matematicamente difíceis de se manusear e usar no projeto de codificadores. Medidas Objetivas: Matematicamente tratáveis. Não incorpora os aspectos da fidelidade perceptível do ponto de vista humano. TE073 – Processamento Digital de Sinais II
Medida ótima? Aquela que modela matematicamente as limitações humanas. Porém essas limitações (de ordem biológica) são difíceis de se determinar matematicamente, logo usa-se aproximações e modelos. Ex.: Sistema Visual: modelo do olho e percepção de imagens e vídeo Sistema passa baixas com persistência temporal. Razão de Weber: Sistema Auditivo: modelo do ouvido e percepção de sons. Limitação 20Hz a 20KHz com resolução de 1000:1 1kHz a 20dB percepção semelhante a 50Hz a 50dB Mascaramento de nível sonoro e mascaramento espectral TE073 – Processamento Digital de Sinais II
7.5. Teoria da Distorção pela Taxa Ex.: 2 se cruzando (MPEG1 e MPEG2) TE073 – Processamento Digital de Sinais II
Problema: Como calcular a função Distorção(Taxa) R(D) ? - Resultado depende do modelo usado Ex.: Fonte Gaussiana e distorção medida pelo erro médio quadrático: TE073 – Processamento Digital de Sinais II
A função R(D) da distribuição Gaussiana possui a propriedade de ser a maior função R(D) para qualquer outra distribuição que possua a mesma variância (2). Logo pode ser vista como um limite superior. Shannon demonstrou em seu artigo de 1948 que o limite inferior da função R(D) para uma variável aleatória contínua medida pelo erro médio quadrático, é dada por: Onde h(X) é a entropia diferencial da variável X TE073 – Processamento Digital de Sinais II
Problema: Para sinais reais é difícil definir sua função distribuição de probabilidade e assim calcular h(X). Para distribuição Gaussiana: Prova-se que h(X) da distribuição gaussiana é maior que qualquer outra h(X) para a mesma variância (2). TE073 – Processamento Digital de Sinais II
7.6. Modelos 7.6.1. Modelos Probabilísticos Distribuição Uniforme: modelo da ignorância Distribuição Gaussiana: Mais usada Mais centrada em zero, Ex.: voz, dif. imagem Distribuição Laplaciana: Mais centrada ainda em zero, menos tratável Distribuição Gamma: TE073 – Processamento Digital de Sinais II
7.6.2. Modelos baseados em Sistemas Lineares Uma grande classes de processos podem ser modelados pela Equação de Diferenças: Onde xn são as amostras do processo que desejamos modelar e n é uma sequência de ruído branco. Em DSP nada mais é que um filtro digital com N pólos e M zeros. Em estatística é chamado um modelo média móvel autoregressivo (ARMA – Autoregressive Moving Average) ARMA(N,M) TE073 – Processamento Digital de Sinais II
Se todos os bj forem zero. Fica apenas a componente autoregressiva. Que é um filtro IIR com apenas pólos (all-pole) e também chamado modelo autoregressivo de ordem N, AR(N), muito usado em compressão de voz. Como a amostra atual depende apenas das N amostras anteriores: Isto significa que um AR(N) é um processo de Markov de ordem N. Ver exemplos no livro. TE073 – Processamento Digital de Sinais II
7.6.3. Modelos Físicos Modelos baseados na física da fonte do sinal. Geralmente complicados e não bem tratáveis matematicamente. Uma exceção é a geração de voz que será vista em detalhes oportunamente. TE073 – Processamento Digital de Sinais II
Quantização Escalar • Definição: Representar uma infinidade de valores em um conjunto limitado de códigos; ou seja, poucos códigos de saída para muitos valores de entrada; • Mais simples métodos de compressão com perdas; Ex: Valores de amostras entre -10 e 10: TE073 – Processamento Digital de Sinais II
Quantização Escalar • Esquema do quantizador: Representar o valor de cada entrada em uma saída com o valor do numero inteiro mais próximo: -2,47 -2,0 3,14159... 3,0 4,5 4,0 ou 5,0 (aleatoriamente). TE073 – Processamento Digital de Sinais II
Quantização Escalar • Para os infinitos valores entre -10 a 10, o alfabeto de saída se reduz a apenas 21 valores: {-10,.....,0,.....,10} Quando um valor de saída é “3”, qual foi a sua entrada? 2.95 ? 3.1415 ? 2,51 ? TE073 – Processamento Digital de Sinais II
O Problema da Quantização • O compressor divide a faixa de entradas em intervalos, {-10,.....,0,.....,10}; • Intervalo = palavra de código; • Como vários valores de entrada podem cair em um mesmo intervalo, • o código somente informa que a amostra pertence aquele intervalo. 8,01 código x1 8 8,20 código x2 8 7,51 código x3 8 TE073 – Processamento Digital de Sinais II
O Problema da Quantização • Esta perda de informação é irrecuperável; • Também chamado de “Ruído de Quantização”. • Como o código representa um intervalo, então o decodificador gera um valor que melhor represente os valores do intervalo. TE073 – Processamento Digital de Sinais II
Quantização Escalar Quando as entradas são analógicas, o processo é também conhecido como “conversão analógico-digital” A/D. A reconstituição do código em valor analógico se chama “conversão digital-analógico” D/A. Aplicação mais conhecida: Digitalização de áudio, PCM30 (telefonia) TE073 – Processamento Digital de Sinais II
Quantização Escalar Códigos Saída 000 -3,5 001 -2,5 010 -1,5 011 -0,5 100 0,5 101 1,5 110 2,5 111 3,5 Definição dos intervalos de entrada e os respectivos códigos. Valores de saída para os códigos (níveis de reconstrução). TE073 – Processamento Digital de Sinais II
Quantização Escalar Ex: f(t) = 4.cos(2t), com amostras a cada 0,05 s TE073 – Processamento Digital de Sinais II
Ruído de Quantização Definição: q2 = msqe: é a média quadrada da diferença entre a entrada [x] e a saída [y = Q(x)] do quantizador. onde: fX(x) = função probabilidade da entrada M = número de intervalos msqe = mean squared quantization error. TE073 – Processamento Digital de Sinais II
Taxa do Quantizador Para palavras código fixas, o próprio comprimento do código especifica a taxa do quantizador. Se o número de saídas do quantizador é M então a taxa é dada por: R = log2M Em códigos de tamanhos variáveis, a taxa é função da probabilidade de ocorrência de cada código, e do seu respectivo comprimento[ li]: TE073 – Processamento Digital de Sinais II
Quantizador Uniforme • Intervalos igualmente espaçados (entrada e saída) • Idem para os limites de decisão e valores de reconstrução. • Espaço = • Quantizador Midrise • Não possui o nível “0” • Número de saídas pares • Quantizador Midtread • Possui o nível “0” • Número de saídas impares TE073 – Processamento Digital de Sinais II
Quantizador Uniforme e Fonte Uniforme • Fonte uniformemente distribuída pelo intervalo. • Intervalo [ -Xmax , Xmax] dividido em M partes iguais () • Ruído de quantização para fonte uniforme: q = x - Q(x) TE073 – Processamento Digital de Sinais II
Quantizador Uniforme e Fonte Uniforme O ruído de quantização se torna: Assumindo que a variância dos valores de entrada no intervalo [ -Xmax , Xmax]é: TE073 – Processamento Digital de Sinais II
Quantizador Uniforme e Fonte Uniforme SNR: Signal Noise Ratio ou Razão Sinal Ruído: • SNR = 6,02.n [dB] • A cada bit adicionado (n) no quantizador, ocorre um aumento de 6,02 dB na razão sinal ruído. • A cada bit retirado do esquema do quantizador, o ruído inserido é 4 vezes maior que o esquema anterior. TE073 – Processamento Digital de Sinais II
Compressão de Imagens • Modelo de probabilidade para imagens: quase impossível • Aproximação Pixels distribuídos entre: 0 e 2b-1, onde b é o número de bits por pixel. Assume-se que os valores dos pixels variam de 0 a 255. • 1 bit/pixel dividir [0, 255] em [0, 127] e [128, 255]; com • limites de decisão [0, 128, 255] e valores de reconstrução • {64, 196}. • 2 bit/pixel limites de decisão [0, 64, 128, 196, 155] e valores • de reconstrução {32, 96, 160, 224}. TE073 – Processamento Digital de Sinais II
Imagem Original 1 bit/pixel 3 bits/pixel 2 bits/pixel TE073 – Processamento Digital de Sinais II
Nota-se que para distribuições não uniformes, a divisão das entradas e saídas em partes igualmente separadas não é satisfatória. TE073 – Processamento Digital de Sinais II
{ Modelos de distribuição ideal Parâmetros da distribuição Erros de Combinação • Diferenças entre os modelos escolhidos e os modelos reais. • 1º caso: Variância assumida Variância real. • 2º caso: Modelo de distribuição Tipo do quantizador. TE073 – Processamento Digital de Sinais II
Erros de Combinação Variância assumida Variância real. Quantizador uniforme com distribuição Gaussiana TE073 – Processamento Digital de Sinais II
Erros de Combinação Modelo do quantizador não casa com o modelo da distribuição TE073 – Processamento Digital de Sinais II
Quantização Adaptativa • Eliminar problemas de erros de combinação • Adaptar o quantizador () em relação à estatística da fonte. • Método I: Forward Adaptive Quantization • Método II: Backward Adaptive Quantization TE073 – Processamento Digital de Sinais II
Forward Adaptive Quantization • Passos: • Fonte dividida em blocos de dados, • Parâmetros analisados e ajustados antes da quantização, • Dados + ajustes enviados. • Desvantagens: • Atraso por processamento dos blocos, • Envio de informação lateral. • Ponto ótimo entre: • Blocos pequenos Muita informação lateral • Blocos extensos Demora no processamento TE073 – Processamento Digital de Sinais II
Exemplo 8.5.1: Palavra “test”, digitalizada com 8000 amostras/s e 16 bits/amostra. • Comprimida com quantização de 6 níveis (3 bits). Quantização uniforme. Perda de resolução na amplitude. TE073 – Processamento Digital de Sinais II
Blocos de 128 amostras • Obtenção do desvio padrão dos blocos e quantizado com 8 bits. • Amostras normalizadas com o desvio padrão. TE073 – Processamento Digital de Sinais II
Exemplo 8.5.2: Blocos de 8 x 8 pixels, • 3 bit Forward Adaptive Uniform Quantization, • Informação lateral: Valores máximos e mínimos dos bloco (8x8) = 8 bits. 3 bits/pixel TE073 – Processamento Digital de Sinais II
Backward Adaptive Quantization • Análise de amostras quantizadas antigas. • Como obter informação de erro somente com a saída do • quantizador, e sem conhecer o valor da amostra original? • A noção do erro na distribuição das saídas se dá por uma • extensa análise da própria saída do quantizador. TE073 – Processamento Digital de Sinais II
Backward Adaptive Quantization • Quando a distribuição de entrada combina com o quantizador, • tem-se o ideal. Caso contrário, varia-se o tamanho de . • Se < ideal, a maioria das amostras incidirão nos níveis mais • elevados do quantizador, . • Se > ideal, a maioria das amostras incidirão nos níveis mais • baixos do quantizador, . • Outros: Ex.: Quantizador de Jayant TE073 – Processamento Digital de Sinais II
Quantização Não Uniforme • Distribuição concentrada próximo à origem • Vantagem: • Reduz a distorção onde a distribuição é mais densa • (mais informação). • Desvantagem: • Erros maiores na região de baixa probabilidade de amostras. TE073 – Processamento Digital de Sinais II