200 likes | 285 Views
Identificação de Voz. Marcelo Lucena André Palhares. Roteiro. Problema Hidden Markov Models (HMMs) Sistema de identificação de voz Resultados Conclusão. Problema. Controlar o acesso a um determinado sistema a partir do teste biométrico de voz. Controlar o acesso a lugares restritos.
E N D
Identificação de Voz Marcelo Lucena André Palhares
Roteiro • Problema • Hidden Markov Models (HMMs) • Sistema de identificação de voz • Resultados • Conclusão
Problema • Controlar o acesso a um determinado sistema a partir do teste biométrico de voz. • Controlar o acesso a lugares restritos. • Identificar pessoas em um ambiente.
Problema • Não confundir identificação com reconhecimento de voz • Reconhecimento: apenas verificar se o sinal de entrada do sistema pertence a uma pessoa (no caso, já se sabe a qual pessoa da base de dados comparar) • Identificação: descobrir qual das pessoas da base de dados foi responsável por emitir o sinal de entrada do sistema
Problema • Identificação dependente de texto • Para se dar acesso a pessoa, ela tem que dizer a frase correta • No caso, o seu próprio nome • Assim, deve ser rejeitada qualquer pessoa que disser algo diferente do seu próprio nome (se for usuária do sistema)
Hidden Markov Models • Modelos probabilísticos de sinais • Geralmente utilizados na modelagem de sinais que variam durante o tempo • Voz, escrita, gestos, etc. • Quando se usa HMM para aprendizagem, o principal trabalho é estimar seus parâmetros • probabilidades de transição, distribuições de observações, etc.
Hidden Markov Models • Consistem de N estados e probabilidades de transição de um estado para o outro • Cada estado possui uma distribuição de probabilidade das M observações de saída do sistema (HMM discreta) • Além disto, temos a distribuição de probabilidade inicial para a HMM
Hidden Markov Models • Problema das moedas • Não se sabe quantas moedas foram lançadas, apenas o resultado dos lançamentos • Pode ser modelado com HMMs supondo apenas 1 moeda, 2 moedas, 3 moedas, etc.
Hidden Markov Models • Tipos de HMMs • Ergódico • Todos os estados são ligados a qualquer outro estado • Esquerda-direita • Utilizados em problemas cujos sinais são variáveis temporais (voz, por exemplo) • Misto • Mais versátil
Sistema de identificação de voz • Arquitetura
Sistema de identificação de voz • Conjunto de treinamento • Amostras coletadas • Análise Espectral
Sistema de identificação de voz • Vector quantization • Como são utilizadas HMMs discretas, devemos discretizar os vetores de características • Um vetor pertencerá a classe que lhe é mais próxima, baseado na distância euclidiana • HMMs • Foi utilizado o modelo esquerda-direita com variação de 5 a 15 estados • O número de iterações do algoritmo Baum-Welch variou entre 10 e 30.
Sistema de identificação de voz • Seletor • Responsável por definir o limiar de aquele sinal ter sido emitido ou não pela mesma pessoa da HMM que está sendo comparado • O limiar é diferente para cada HMM, definido através log da probabilidade do conjunto de treinamento somado ao dobro do desvio padrão
Resultados • Cenário 1 • 2 pessoas cadastradas no sistema (2 HMMs) • 21 amostras de entrada • 5 amostras de pessoas cadastradas • 16 amostras aleatórias • Cenário 2 • 3 pessoas cadastradas no sistema (3HMMs) • 30 amostras de entrada • 8 amostras de pessoas cadastradas • 22 amostras aleatórias
Conclusão e Trabalhos Futuros • HMM dá bons resultados também para identificação de voz. • Um estudo sobre qual a melhor característica espectral para as observações pode melhorar o desempenho. • Melhorar a quantização dos vetores.