1 / 18

Estatística e Probabilidade

Estatística e Probabilidade. Medidas de tendência central e medidas de dispersão. Média, mediana e moda. Propriedades da curva normal Exercícios. 1. MEDIDAS ESTATÍSTICAS Amostras com variáveis quantitativas devem ser estudadas de acordo com os seus descritores e distribuição.

Download Presentation

Estatística e Probabilidade

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estatística e Probabilidade Medidas de tendência central e medidas de dispersão. Média, mediana e moda. Propriedades da curva normal Exercícios.

  2. 1. MEDIDAS ESTATÍSTICAS • Amostras com variáveis quantitativas devem ser estudadas de acordo com os seus descritores e distribuição. • Os descritores ou medidas são basicamente: • -Medidas de tendência central e medidas de dispersão. • 1.1 Medidas de tendência central ou de posição. • As medidas de tendência central mostram um valor ou dado em torno do qual os dados da amostra agrupam-se: • São a média, a mediana e a moda.

  3. 2. MEDIDAS DE TENDÊNCIA CENTRAL • Média aritmética simples ou simplesmente média • A média aritmética simples de um conjunto de valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. É denotada (leia-se “x barra”) • Observar que com dados agrupados deve-se usar a multiplicação dos valores pela frequência ou seja: fx sobre o somatório das frequências. • E nos dados agrupados por intervalos de classe, xi e fisão os valores do ponto médio e da freqüência absoluta da classe i-ésima respectivamente.

  4. Média aritmética simples ou simplesmente média • Popriedade dos desvios: • A soma dos desvios de cada valor com relação à média = zero. • Para dados agrupados em frequências simples: • ∑fd = ∑f (x- ) = 0

  5. Mediana • A mediana é um valor central da série, divide a mesma em dois subconjuntos iguais. • Deve-se ordenar a série em valores crescentes ou decrescentes. • Para séries curtas, o que deve ser observado é a mediana como média dos valores centrais se o n for par. • O cálculo para séries longas é: • mediana = (n+1) / 2 • Com dados grupados, a mediana corresponde à Fr = 0,5.

  6. Moda • Moda ou moda de X, Mo, é o elemento mais freqüente no conjunto. • A moda é facilmente indicada na coluna de frequências simples. • Para dados em intervalos de classe, há um intervalo modal, e a moda é o ponto médio deste intervalo. • No histograma, a moda são os picos da distribuição. • Distribuições bimodais ou polimodais (vários picos) indicam forte assimetria, afastamento da normalidade ou mistura de amostras. • Calcular a média, mediana e indicar a moda dos dados referentes às medidas das conchas, escolhendo uma das variáveis, CAC, LAC ou PC.

  7. 3. MEDIDAS de dispersão. • As medidas de dispersão revelam a variabilidade dos dados. • Exceto a amplitude, mostram o grau de afastamento dos valores observados em relação aos valores representativos centrais. • - Amplitude total: diferença entre os valores extremos da série. • Variância e desvio padrão: • Variância é a quantidade de desvios de cada valor em relação à média. Tem os símbolos δ2 para dados populacionais ou s2 para dados amostrais. • O desvio padrão, δ ou s, é a raiz quadrada da variância. É uma medida de dispersão apresentada na mesma unidade de mensuração de x, lembrando que na variância os valores são considerados como o seu quadrado.

  8. Fórmulas para a variância e desvio padrão: • δ2 = ∑ (x-µ) 2 • n • µ = média da população. • Ver fórmulas alternativas para amostras no livro, como: • s2 = ∑ (x- ) 2 • n-1 • O desvio padrão, δ ou s, é a raiz quadrada da variância: n-1 -1

  9. Coeficiente de variação: • Trata-se de uma medida de dispersão, útil para a comparação da variabilidade em séries diferentes, que apresentam variáveis distintas. É dado por Cv ou pelo Cv% • Idealmente uma amostra deve ter uma Cv baixo, refletindo pouca variação dos dados com relação à média. Utiliza-se uma aproximação do Cv a 20% ou menos da média para observar-se esta característica. Em amostragens aleatórias esta relação pode ser usada para uma aproximação do tamanho da amostra, desde que esta tenha distribuição normal. • Calcular a variância, desvio padrão e coeficiente de variação referentes às medidas das conchas, escolhendo uma das variáveis, CAC, LAC ou PC. s

  10. 4. AS DISTRIBUIÇÕES NORMAIS, A CURVA NORMAL OU CURVA DE GAUSS. • As populações descritas com variáveis quantitativas tem uma tendência à distribuição normal, o que significa que os seus histogramas apresentarão um desenho em forma de sino. Os valores extremos coincidem com as abas do sino. Estes diagramas em forma de sino foram descobertos e estudados por Gauss, daí o termo curva de Gauss (matemático alemão 1977-1855). • As amostras destas populações terão também distribuição normal.

  11. 4.1 PROPRIEDADES DA CURVA NORMAL. • A curva é simétrica. • A média coincide com a ordenada máxima; a média coincide com a mediana e moda (simetria); Curvas assimétricas ou achatadas não mantém as mesmas derivações da normal. • Tem dois pontos de inflexão que correspondem a 1 desvio padrão (δ) acima e abaixo da média. Este limite corresponde a 68% dos valores de x, ou da população em estudo. 2,5%

  12. 4.1 PROPRIEDADES DA CURVA NORMAL. • Aproximadamente 95% da população situa-se entre µ-2 δ e µ+2 δ; Cerca de 99,7% dos valores se forem 3δ. 2,5%

  13. 4.2 A CURVA NORMAL REDUZIDA • A curva normal reduzida é uma distribuição teórica de valores de X padronizados. • A abcissa é chamada de linha ζ ou Z. Os valores são então de uma variável hipotética chamada z. • Nesta distribuição µ = 0 e δ = 1. • A área entre z = -1 e z = +1 é 0,6826. As áreas entre µ e qualquer valor de z são informadas em tabelas como a A1.

  14. 4.2 A CURVA NORMAL REDUZIDA • A área que corresponde a valores de z entre -1,96 e + 1,96, é de 0,4750 + 0,4750 = 0,95. • Entre -2.58 e +2.58 é = 0,9902 • Realizar os exercícios referentes aos exemplos do livro 1, 2, 3.

  15. 4.3 Procedimentos transformadores para distribuições sem normalidade, assimétricas ou achatadas. • As transformações mais usadas são para assimetrias à direita; • x´ = log x • x´ = √x • x´ = 1/x • Para assimetrias à esquerda: • x´ = x2

  16. 4.3 Procedimentos transformadores para distribuições sem normalidade, assimétricas ou achatadas. • O programa Biostat fornece testes de normalidade com base nos parâmetros de simetria e curtose. • Distribuições simétricas têm g1 próximo de 0, sendo menor do que 0 inclinada para esquerda e maior do que 0 inclinada para a direita. • A curva normal é mesocúrtica, com um g2 próximo de 3. Um g2 maior do que 3, indica um excesso de observações nas imediações da média e caudas, nas curvas assimétricas leptocúrticas (skewed); um g2 menor do que 3 indica um excesso de observações no ombros da curva, dita platicúrtica. • Observar alguns exemplos.

  17. 5. Aplicações da curva normal: áreas e proporções da curva. • Transforma-se x em z da seguinte forma: • z = x-µ • δ • Exemplo 4. • Na parte de exercícios, preparar: • Exercícios 8, 9, 10, 11.

  18. 5. Aplicações da curva normal: áreas e proporções da curva. • As regiões de não significância dos valores com relação à média, correspondem geralmente a valores de S 0-1,96 Z nos dois lados da curva. Valores superiores a 1,96 correspondem a 2,5% de cada lado e compõe as áreas de significância das diferenças, ou chamada área α (alfa). Utiliza-se geralmente dois níveis de alfa: 0,05 (5%) - significante - e mais raramente 0,01 (1%) – muito significante. 2,5

More Related