1 / 22

Avaliação estatística dos mecanismos de codificação desenvolvidos

Avaliação estatística dos mecanismos de codificação desenvolvidos. Eliana Zandonade elianazandonade@uol.com.br E equipe (Lúcia, Regiane e Franciane). Sumário. Teste de comparação de duas proporções pareadas Análise de correlação entre duas variáveis Teste de comparação de duas médias.

wren
Download Presentation

Avaliação estatística dos mecanismos de codificação desenvolvidos

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Avaliação estatística dos mecanismos de codificação desenvolvidos Eliana Zandonade elianazandonade@uol.com.br E equipe (Lúcia, Regiane e Franciane)

  2. Sumário • Teste de comparação de duas proporções pareadas • Análise de correlação entre duas variáveis • Teste de comparação de duas médias

  3. ÍNDICE KAPPA K= 2(AD – BC) N1N4 + N2N3

  4. Teste Mc Nemar • Comparar se a discordância tem sentido: • Compara B com C (discordâncias)

  5. Correlação

  6. Covariância A covariância é uma medida que resume a tendência e a força da relação linear entre duas variáveis. Covariância entre X e Y: Covar(X,Y) 1/(n-1) *{ Soma [(X - média(X))*(Y - média(Y))]}

  7. Coeficiente de Correlação Para facilitar a relação entre duas variáveis e evitar a unidade de medida da covariância, foi definido o coeficiente de correlação corr(X,Y) ou r(X,Y) como: r(X,Y) = covar(X,Y) / [DP(X)*DP(Y)]

  8. Comparação de duas médias: comparação dos modelos dois a dois O teste de duas médias é realizado para se comparar as médias de duas populações a partir da análise das médias de suas amostras. Em geral faz-se os testes sobre a diferença entre duas médias populacionais: sendo na maioria dos casos , o que significa que testa-se a igualdade entre as médias

  9. As Hipóteses Nula e Alternativa do teste são as seguintes: • Teste bilateral: • Teste unilateral à esquerda: • Teste unilateral à direita:

  10. OBS.: No presente estudo, na comparação dos modelos será considerado o teste bilateral. Na comparação das médias considera-se dois casos: dados emparelhados (populações correlacionadas) e dados não emparelhados (populações não correlacionadas). Neste caso, será considerada a comparação de dados emparelhados, uma vez que, os modelos propostos serão testados com o mesmo conjunto de documentos.

  11. Duas médias pareadas: teste t Faz-se testes de comparações de médias para dados emparelhados quando o resultado de duas amostras são relacionados dois a dois, de acordo com algum critério que fornece uma influência entre os vários pares e sobre os valores de cada par. Para cada par definido, o valor da primeira amostra está associado ao valor da segunda amostra.

  12. Dadas duas amostras X1, X2, ..., Xn e Y1, Y2, ..., Yn, sendo as observações pareadas,ou seja, uma amostra de pares, (X1, Y1), (X2, Y2), ..., (Xn, Yn). Definindo-se a v.a. D=X-Y, tem-se a amostra D1, D2, ..., Dn, resultante das diferenças entre os valores de cada par. Para a aplicação do teste deve-se supor que ambas as amostras são provenientes de populações com distribuição normal, assim, a variável D, supostamente, também tem distribuição normal .

  13. terá distribuição Daí pode-se deduzir que

  14. Considere Então a estatística de teste será dada por: onde onde t tem distribuição t-Student com n-1 graus de liberdade.

  15. A regra do teste (teste bilateral) é então rejeitar H0 se onde é obtido da tabela da distribuição t-student, considerando (n-1) graus de liberdade e tomando como o nível de significância do teste.

  16. Outra maneira de tomar a decisão final sobre a hipótese nula é comparando o valor-p com um valor pré-fixado (nível de significância), usualmente 0,05. Quando o valor-p é menor que este ponto de corte, o resultado é chamado estatisticamente significante e caso contrário é dito não significante. O valor-p (ou valor de probabilidade) é a probabilidade de obter um valor da estatística amostral de teste no mínimo tão extremo como o que resulta dos dados amostrais, na suposição da hipótese nula ser verdadeira.

  17. No caso do teste bilateral o valo-p é a duas vezes a área da estatística de teste. Exemplo: Suponha que deseja-se comparar os modelos 1 e 2 e que a métrica utilizada tenha sido Hamming Loss (hlossj).A tabela a seguir ilustra algumas situações de aplicação de tais modelos.

  18. Sendo • dj: j-ésimo documento; • Cj: conjunto de códigos apropriados para o j-ésimo documento; • Pj (Modelo 1): conjunto de códigos preditos pelo Modelo 1 para o j-ésimo documento; • Pj (Modelo 2): conjunto de códigos preditos pelo Modelo 2 para o j-ésimo documento; • Xj: resultado da métrica obtida para Modelo 1; • Yj: resultado da métrica obtida pelo Modelo 2; • Dj: diferença entre Xj e Yj.

  19. Para o exemplo as hipóteses a serem testadas são: Suponha que:

  20. Assim, Como t > t49; 0,025 rejeita-se H0, isto é, rejeita-se a hipótese que os modelos são iguais.

  21. Considerando a decisão através do valor-p tem-se: Como o valor-p < 0,05 então rejeita-se H0.

  22. REFERÊNCIAS • BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 5ª edição, Editora Saraiva, 2002. • MORETTIN, L. G. Estatística Básica – Volume 2 – Inferência. Editora Makron Books, 2000. • TRIOLA, M. F. Introdução à Estatística. 7ª edição, Editora LTC, 1999.

More Related