1 / 47

Medidas de posição e de dispersão

Medidas de posição e de dispersão. Profª Andréa H Dâmaso. Bioestatística e D elineamento Experimental - 2011. Tópicos da aula. Medidas de tendência central e dispersão Variáveis contínuas: distribuição normal Amostra Variabilidade amostral. Relembrando... tipos de variáveis. Numéricas

poppy
Download Presentation

Medidas de posição e de dispersão

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Medidas de posição e de dispersão Profª Andréa H Dâmaso Bioestatística e Delineamento Experimental - 2011

  2. Tópicos da aula • Medidas de tendência central e dispersão • Variáveis contínuas: distribuição normal • Amostra • Variabilidade amostral

  3. Relembrando... tipos de variáveis Numéricas (ou quantitativas) Categóricas (ou qualitativas) “CONTAGENS” Nº filhos, anos de estudo... “MEDIDAS” Peso, altura, pressão. Renda familiar (R$) Dicotômicas Discretas (números inteiros) Politômicas Contínuas (aceitam decimais) Sexo, raça, estado civil, religião... Nominais (ordem não importa) NSE, IMC categ, avaliação qualitativa... Ordinais (tem uma ordem lógica)

  4. Estatística descritiva Numérica (ou quantitativa) Categórica (ou qualitativa) • Medidas de ocorrência • FREQUÊNCIA ou PORCENTAGEM • Incidência • Prevalência • Odds • Medida de precisão • INTERVALO DE CONFIANÇA • Medidas tendência central • MODA • MÉDIA • MEDIANA • Medidas de dispersão • AMPLITUDE • VARIÂNCIA • DESVIO PADRÃO • ERRO PADRÃO

  5. Distribuição de frequência • Descrição de uma variável qualitativas ou categóricas • Dicotômicas ou binárias • Politômicas • Cálculo de proporções • Divisão de um número por outro, onde o numerador está contido (é subconjunto) no denominador • Exemplo: Desnutrição: sim /não • Em 100 crianças, 20 estão desnutridas (20%)

  6. Como apresentar as informações? Dados da coorte de nascimentos de 2004. Pelotas, RS (n=6000)

  7. Distribuição de frequência • Descrição de uma variável numérica • Tabela que mostra um número de observações ou valores dentro de certos intervalos

  8. Distribuição de frequência: variável “discreta” Número de gravidezes das mães da coorte de 2004. Pelotas, RS (n=6000)

  9. Distribuição de frequência: variável “discreta” Número de gravidez das mães da coorte de 2004. Pelotas, RS (n=6000)

  10. Distribuição de frequência: variável “contínua” Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555)

  11. ... • ... mas para variáveis contínuas queremos descrever os dados de forma ainda mais sucinta! • Medidas de tendência central • Medidas de posição • Medidas de dispersão

  12. Descrição de variáveis contínuas MEDIDAS DE TENDÊNCIA CENTRAL MÉDIA MEDIANA MODA MEDIDAS DE POSIÇÃO MEDIDAS DE POSIÇÃO MEDIDAS DE DISPERSÃO TERCIL QUARTIL QUINTIL DECIL PERCENTIL AMPLITUDE INTERVALO INTERQUARTIL VARIÂNCIA DESVIO PADRÃO

  13. Medidas de tendência central, de posição e de variabilidade ou dispersão • Utilizadas para variáveis: • Quantitativas ou numéricas • Discreta • Contínua • São valores calculados com o objetivo de descrever os dados de forma ainda mais resumida do que usando uma tabela

  14. Medidas de tendência central • Média • Moda • Mediana

  15. Medidas de tendência central • Média • xi: valor de cada indivíduo • ∑: somatória • n: total de indivíduos Vantagem: Utiliza TODOS os valores da distribuição Desvantagem: É influenciada por valores extremos

  16. Medidas de tendência central • Moda • Valor que mais se repete na amostra (na distribuição) 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9 • Moda: 2 • Quando mais de um valor se repete o mesmo número de vezes  BIMODAL

  17. Medidas de tendência central • Mediana • Valor que divide a distribuição ao meio • 1º passo: ordenar os dados de menor a maior • 2º passo: ver qual valor ocupa o “meio” da distribuição • Se... • Número ímpar de dados: valor do meio 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9 • Número par de dados: média dos dois do meio 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 8, 9, 9 Fórmula: (n + 1)/2

  18. Média x Mediana • Semelhantes para distribuições simétricas: Peso ao nascer • Média: 3131 g • Mediana: 3180 g • Distantes para distribuições assimétricas: Renda familiar • Média: R$ 791 • Mediana: R$ 500

  19. Então... • Qual medida de tendência central usar? • MÉDIA ou MEDIANA?

  20. Mediana x Média: peso ao nascer • Distribuição simétrica Média Média: 3131 gramas; Mediana: 3180 gramas

  21. Mediana x Média: renda familiar • Distribuição assimétrica Mediana Média: R$ 791; Mediana: R$ 500

  22. Medidas de posição • Percentis (dividem os dados em 100 partes iguais) • Percentil 10, percentil 50, percentil 99... • Quartis • Primeiro, segundo, terceiro, quarto quartil • Quintil • Primeiro, segundo, terceiro, quarto, quinto quintil

  23. Percentis de peso ao nascer . su peson,d peso ao nascer em gramas ------------------------------------------------------------- Percentiles Smallest 1% 1950 1100 5% 2340 1490 10% 2570 1550 Obs 962 25% 2870 1570 Sum of Wgt. 962 50% 3180 Mean 3200.639 Largest Std. Dev. 511.0475 75% 3510 4690 90% 3830 4700 Variance 261169.5 95% 4050 4700 Skewness -.1061833 99% 4450 4880 Kurtosis 3.579037

  24. Medidas de dispersão (variabilidade) • Várias maneiras de medir a dispersão • Amplitude (maior - menor) • Amplitude interquartil (p75 - p25) • Variância • Desvio padrão

  25. Medidas de dispersão (variabilidade) • Amplitude • Valor maior – valor menor • Apenas considera os valores extremos • Ex: 5 medidas de glicemia em mmol/l • 80; 85; 88; 90; 500 • Amplitude: 500-80=480 • Medidas que se distanciam muito das demais influenciam muito a amplitude

  26. Medidas de dispersão (variabilidade) • Amplitude interquartil • Percentil 75 – percentil 25 • Considera apenas a parte central dos valores de um conjunto de dados • Joga fora os valores mais altos e os mais baixos • Não influenciada pelos valores discrepantes

  27. Medidas de dispersão (variabilidade) • Variância (S2) • Boas propriedades estatísticas • Usa todas as observações • É uma medida dos “desvios” (ao quadrado) de cada observação em relação à média • Pq ao quadrado? • Unidade de medida ao quadrado  difícil interpretação

  28. Medidas de dispersão (variabilidade) • Desvio padrão (S) • É a raiz quadrada da variância • Quanto mais próximos os valores individuais estiverem de sua média, < a dispersão e < o desvio-padrão • Muito útil para distribuições dos dados aproximadamente normais

  29. Distribuição normal • Ou Gaussiana • Simétrica • Forma de “sino” • É uma distribuição contínua • Descreve bem fenômenos biológicos

  30. Distribuição normal padrão (propriedades) • 1. Qualquer variável com distribuição simétrica (normal) pode ser relacionada com uma distribuição normal padrão • Média: zero; DP: 1 • Posso estimar entre quais valores está x% dos meus dados

  31. Distribuição normal padrão (propriedades) • 2. Área abaixo da curva • A área abaixo de toda a curva normal = 1, ou seja, a probabilidade de que uma observação fique em algum lugar abaixo da curva é 100% • 3. A probabilidade de se estimar a localização exata de um indivíduo em específico é “zero” • Não posso estimar a posição de um valor específico, mas posso calcular: • Proporção de indivíduos abaixo ou acima de certo valor • Proporção de indivíduos entre certos valores

  32. Distribuição normal padrão (propriedades) • Exemplo • Qual a probabilidade de uma criança ter peso ao nascer igual a 4000 gramas? • Não tenho como calcular esta probabilidade exata, mas posso calcular... • Qual é a proporção de crianças com peso ao nascer maior de 4000 gramas?

  33. Área abaixo da curva Média = 3230 DP = 610 Crianças com peso ao nascer > 4000 gramas

  34. Área abaixo da curva • Distribuição normal padrão • (x - média)/desvio padrão • (4000 - 3230)/610 = 1,26 = z • Olhando as tabelas de distribuição normal... • z = 0,1038, ou seja, 10,4% das crianças tem peso ao nascer maior do que 4000 gramas

  35. ... Uso de amostras • O que seria uma amostra? Não é melhor avaliar toda a população ?

  36. Amostra • Quero conhecer um atributo de uma população (alvo) • Estado nutricional das crianças brasileiras menores de 5 anos • Escolho um grupo para estudar • Crianças menores de 5 anos da cidade de Pelotas • Deste grupo tiro uma amostra

  37. Definição da população UNIVERSO ou POPULAÇÃO TOTAL POPULAÇÃO ALVO AMOSTRA

  38. Amostra: características • 1. Representar a população • Equiprobabilidade = representatividade • Todos os indivíduos da população alvo têm a mesma chance de participar do estudo (de serem sorteados) POPULAÇÃO ALVO POPULAÇÃO ALVO

  39. Amostra: características • 2. Precisão • Amostra de tamanho adequado • Garantir o mínimo de precisão • Garantir a chance de demonstrar uma diferença entre dois grupos • PODER: probabilidade de encontrar uma diferença qdo ela realmente existe • Quanto maior a amostra, maior o poder • Estudos com baixo poder (amostra pequena) para testar associações são um desperdício de tempo e dinheiro

  40. Amostra: características • 3. Variabilidade amostral • Cada amostra dá um resultado • Repetir o processo de amostragem e estudar a distribuição dos resultados • Como será que a distribuição das amostras se compara com a distribuição em toda população? • Se coletarmos muitas amostras independentes, do mesmo tamanho, de uma mesma população e calcularmos a média de cada amostra... • Distribuição das médias amostrais

  41. Então, a amostra... • Tem importância pelo que nos conta sobre a população que representa • A média e o desvio padrão da amostra são usados para estimar a média e o desvio padrão da população amostra população

  42. Distribuição das médias amostrais • A média da distribuição das médias amostrais é a média da população (isso eu já sei!!!) • E como é a variabilidade da média da população? • O desvio padrão da distribuição das amostras se denomina ERRO PADRÃO

  43. Distribuição das médias amostrais • Enquanto o desvio padrão mede a variabilidade dos indivíduos da amostra • ... o erro padrão mede a variabilidade da média das amostras • E indica com que precisão a média da população pode ser estimada pela média amostral

  44. Distribuição das médias amostrais • Erro padrão Desvio padrão da população Tamanho da amostra

  45. Distribuição das médias amostrais • Dificilmente nós conhecemos o desvio padrão da população () • Então se usa o desvio padrão da amostra (s)para estimar o erro padrão Desvio padrão da amostra Tamanho da amostra

  46. E o que eu faço com o erro padrão? • Serve para calcular o Intervalo de Confiança • Intervalo de Confiança: intervalo de valores que contém o parâmetro de interesse • Valores dentro dos quais existe uma certa probabilidade de estar incluída a real média da população • Usado para comparar se existem diferenças entre dois ou mais grupos • Testes de hipóteses • Isso será visto nas próximas aulas...

  47. Referências bibliográficas • Massad E, Menezes R, Silveira P, Ortega N. Métodos Quantitativos em Medicina. SP: Manole, 2004 • Kirkwood B and Sterne J. Essential of medical statistics. Blackwell Science, 2003

More Related