110 likes | 415 Views
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010. Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/. mínimo =. máximo =. Matriz de Confusão. 0. Exatidão Total =. 1 (ou 100%). Matriz de Confusão. Exatidão Total =. Matriz de Confusão.
E N D
Estatística: Aplicação ao Sensoriamento RemotoANO 2010 Camilo DalelesRennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/
mínimo = máximo = Matriz de Confusão 0 Exatidão Total = 1 (ou 100%)
Matriz de Confusão Exatidão Total =
Matriz de Confusão Se a classificação e a verdade fossem independentes entre si: Exatidão Total =
mínimo = máximo = Matriz de Confusão Índice Kappa () – medida de concordância exatidão total < 0 exatidão total (se independência) 1
Índice Kappa Índice Kappa () – medida de concordância Será que este valor é significativamente superior a zero? Teste de hipótese
Índice Kappa classificação referência Conclusão: rejeita-se H0 com 5% de significância, ou seja, há concordância entre a classificação e a referência
Índice Kappa classificação 1 referência Importante: amostragens independentes!!! classificação 2 referência Conclusão: rejeita-se H0 com 5% de significância, ou seja, a concordância entre a classificação e a referência é maior para o classificador 2 (ver kappa10cond.xls)
Considerações importantes • Dados de referência (“verdade”) • os erros nos pontos de referência quase sempre são desconhecidos ou ignorados durante a avaliação e portanto são considerados como “100% corretos”; • os pontos de referência devem representar a célula de resolução do mapa avaliado; • a referência deve ter exatidão melhor do que o mapa avaliado. • Estratégia de classificação • classes excludentes (cada ponto pertence a apenas uma classe); • todos os pontos dentro da área avaliada devem pertencer a alguma classe, ou seja, o classificador não pode considerar a classe “não classificado”; • atenção a classes muito semelhantes (as chamadas subclasses) pois podem induzir a um excesso de erros que certamente diminuirão a exatidão; • as matrizes de confusão não consideram o ordenamento de classes. Isso pode trazer problemas em classificações do tipo fatiamento pois os limites das classes quase sempre são definidos arbitrariamente. • em classificadores por região (ou orientado a objetos), o ponto avaliado pode representar um polígonos. Nesse caso, muita atenção na interpretação dos resultados pois os polígonos possuem diferentes tamanhos.
Considerações importantes • Autocorrelação espacial • muito comum em dados de sensoriamento remoto; • afeta diretamente a suposição de independência entre os pontos amostrados; • nunca deve usar a tabulação cruzada como matriz de confusão, ou seja, nunca faça a comparação completa entre mapas. Isso induz a falsa ideia de uma amostra grande. • Tamanho da amostra • tamanhos ideais de amostras podem ser calculados com base na distribuição binomial, considerando-se os erros do tipo I e/ou II. Essas abordagens desconsideram as confusões entre classes; • Congalton (1991) sugere no mínimo 50 pontos para cada classe num caso geral, e 100 pontos caso a área avaliada seja muito grande ou o número de classes seja maior do que 12. • Tipo de amostragem • há relação direta entre o tipo de amostragem e a interpretação da matriz de confusão; • Congalton (1991) sugere as amostragens aleatória simples e estratificada como as mais promissoras. *Congalton, R. G. A Review of Assessing the Accuracy of Classifications of Remotely Sensed Data. Remote Sens. Environ., 37(1):35-46, 1991