1 / 10

Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas

Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas. Programa de Pós-graduação em Biociências Área de Concentração “ Caracterização e Aplicação da Diversidade Biológica ”. Análise de Agrupamentos para Reconhecimento de

idania
Download Presentation

Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração “Caracterização e Aplicação da Diversidade Biológica” Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Dr. Fernando Frei

  2. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas Tópicos Relacionados Colinearidade e Multicolinearidade A “multicolinearidade” pode ser definida como o grau de dependência linear existente entre as variáveis independentes. A multicolinearidade pode alterar os padrões de agrupamento, pelo fato das variáveis colineares serem implicitamente ponderadas com maior peso V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 multicolinearidade colinearidade 4 vezes mais chances de afetar a medida de similaridade O segundo grupo terá menos influência Dr. Fernando Frei

  3. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas Técnica para detectar a presença de multicolinearidade. A mais utilizada é: os fatores de inflação da variância, VIF (variance inflation factors) Onde corresponde ao coeficiente de determinação da regressão linear que tem a variável de agrupamento xk como função das demais. Quanto maior for o VIF, mais severa é a multicolinearidade. Uma regra prática aceitável é a de que, se VIF(k) > 10, a colinearidade existente entre a variável “k” e as demais é significativa Dr. Fernando Frei

  4. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas A situação ideal para todo pesquisador seria ter diversas variáveis independentes altamente correlacionadas com a variável dependente, mas com pouca correlação entre elas próprias Providências Combinar variáveis – Análise Fatorial Excluir variáveis Dr. Fernando Frei

  5. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas Outliers Outliers podem ser consideradas como objetos com baixa conectividade em oposição à maior conectividade na região intracluster. As observações que apresentam um grande afastamento das restantes. Métodos de identificação Gráfico de Box Z-scores Dr. Fernando Frei

  6. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas • O gráfico de Box é construído da seguinte forma: • Calcula-se a mediana, o quartil inferior (Q1) e o quartil superior (Q3); • Subtrai-se o quartil superior do quartil inferior = (L) • 3) Os valores que estiverem no intervalo de Q3+1,5L e Q3+3L e no intervalo • Q1-1,5L e Q1-3L, serão considerados outliers podendo, portanto ser aceitos • na população com alguma suspeita; • 4) Os valores que forem maiores que Q3+3L e menores que Q1-3L devem • ser considerados suspeitos de pertencer à população, devendo ser • Investigada a origem da dispersão. Estes pontos são chamados de extremos. Dr. Fernando Frei

  7. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei

  8. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas • Z-Scores • Calcular os z-scores, isto é, os valores z-standardizados dos dados. • 2) Se o conjunto dos dados é pequeno (inferior a 50), valores que tenham • Zscores inferiores a -2.5 ou superiores a 2.5 devem ser considerados • outliers. • 3) Se o conjunto dos dados é grande, valores que tenham z-socres • inferiores a -3.3 ou superiores a 3.3 são tipicamente considerados outliers. • 4) Se o conjunto dos dados é muito grande (1000 ou mais), também valores • mais extremos do que +-3.3 podem ser considerados dados normais e não • outliers. Dr. Fernando Frei

  9. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas Providências As aplicações da Análise de Agrupamento são diversas Qual o objetivo? Detecção de pontos aberrantes! Qual o objetivo? Obtenção de grupos! Outliers são retirados da análise. São caracterizados como grupo ou grupos. Dr. Fernando Frei

  10. Análise de Agrupamentos para Reconhecimento de Padrões em Saúde e Ecologia. Universidade Estadual Paulista “Júlio de Mesquita Filho”FCLassis – Depto de Ciências Biológicas Dr. Fernando Frei

More Related