1 / 31

Análise Discriminante

ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS. Análise Discriminante. Carlos A. A. Varella. Análise Discriminante.

stu
Download Presentation

Análise Discriminante

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS Análise Discriminante Carlos A. A. Varella

  2. Análise Discriminante Segundo KHATTREE & NAIK (2000) é uma técnica da estatística multivariada que estuda a separação de objetos de uma população em duas ou mais classes.

  3. Discriminação • A discriminação ou separação é a primeira etapa, sendo a parte exploratória da análise e consiste em se procurar características capazes de serem utilizadas para alocar objetos em diferentes grupos previamente definidos.

  4. Classificação • A classificação ou alocação pode ser definida como um conjunto de regras que serão usadas para alocar novos objetos (JOHNSON & WICHERN, 1999).

  5. Confusão • A função que separa objetos pode também servir para alocar, e, o inverso, regras que alocam objetos podem ser usadas para separar. • Normalmente, discriminação e classificação se sobrepõem na análise, e a distinção entre separação e alocação é confusa.

  6. Fisher, 1936 • Segundo REGAZZI (2000), o problema da discriminação entre dois ou mais grupos, visando posterior classificação, foi inicialmente abordado por Fisher (1936). • Funções matemáticas capazes de classificar um indivíduo X em uma de várias populações i; • Com base em medidas de um número p de características, buscando minimizar a probabilidade de má classificação, isto é, minimizar a probabilidade de classificar erroneamente um indivíduo em uma população i, quando realmente pertence a população j.

  7. Regiões de alocação • Regiões de alocação são conjunto de valores separados por uma fronteira definida por uma função discriminante qualquer. Função Quadrática Função Linear

  8. Funções discriminantes • Funções discriminantes podem ser modelos estatísticos, de redes neurais ou lógica fuzzy. • Os parâmetros são ajustados a partir de amostras de treinamento. • O modelo de Fisher é estatístico.

  9. Regras de classificação • Uma boa regra de classificação deve resultar em pequenos erros; • Deve haver pouca probabilidade de má classificação; • Segundo JOHNSON & WICHERN (1999) para que isso ocorra a regra de classificação deve considerar as probabilidades a priori e os custos de má classificação.

  10. Regras de classificação • As regras de classificação devem considerar se as variâncias das populações são iguais ou não; • Quando as variâncias são iguais as funções discriminantes são lineares; • Quando são diferentes as funções discriminantes são quadráticas; • Redes neurais e lógica fuzzy geram planos não-lineares de separação.

  11. Função discriminante linear de Fisher • É uma combinação linear de características originais que se caracteriza por produzir separação máxima entre duas populações

  12. Função discriminante linear de Fisher • Demonstra-se que a função linear do vetor aleatório X que produz separação máxima entre duas populações é dada por:

  13. Função discriminante linear de Fisher • O valor da função discriminante de Fisher para uma dada observação é: • O ponto médio entre as duas médias populacionais univariadas µ1 e µ1 é:

  14. [ ] ' ( ) = m - m × S × ³ x D x - 1 x m p Alocar em se 1 1 2 o o o ( ) [ ] ' = m - m × S × < x D x - 1 x m p Alocar em se 2 1 2 o o o Função discriminante linear de Fisher • A regra de classificação baseada na função discriminante de Fisher é:

  15. Matriz comum de covariâncias Sc • Assumimos que as populações 1 e 2 têm a mesma matriz de covariâncias .

  16. A função discriminante linear amostral de Fisher • É obtida substituindo-se os parâmetros µ1, µ2 e  pelas respectivas quantidades amostrais:

  17. Exemplo de aplicação • Vamos considerar os dados de duas raças de insetos (Quadro 1), apresentados por HOEL (1966) e citado por REGAZZI (2000).

  18. Exemplo de aplicação Número médio de cerdas primordiais (X1) e número médio de cerdas distais (X2) em duas raças de insetos

  19. Estimativa das médias das raças A e B • Raça A, características 1 e 2 • Raça B, características 1 e 2

  20. Estimativa das variâncias das raças A e B • Raça A • Raça B

  21. Matriz comum de covariâncias Sc • Assumindo-se que:

  22. A inversa de Sc • A matriz inversa é calculada com MATLAB • Função: inv(sc)

  23. Vetor discriminante • O vetor discriminante é dado por:

  24. Vetor discriminante

  25. Função discriminante

  26. Classificação de novos indivíduos • Ponto médio da Raça A

  27. Classificação de novos indivíduos • Ponto médio da Raça B

  28. Classificação de novos indivíduos • Ponto médio das populações

  29. Regra de classificação • Tendo-se um novo indivíduo Xo. • Alocar em Raça A se • Alocar em Raça B se

  30. Opção pool=no|test|yesProcedimento PROCDISCRIM • Determina se será usada a matriz comum ou não na análise discriminante. Se for pool=yes, o SAS usa a matriz comum para calcular as distâncias entre grupos e o resultado é uma função discriminante linear. Se pool=no, o SAS usa as matrizes de covariância de cada grupo individualmente para o cálculo das distâncias. Neste caso obtemos funções discriminantes quadráticas. O padrão do SAS é POOL=YES.

  31. Prática: resolver o exercício anterior usando o SAShttp://v8doc.sas.com/sashtml/

More Related