210 likes | 373 Views
Probabilidade e Estatística Básica: Um curso para inocentes com o companheiro R Ministrado por um bobo. Teoria da Estimação. Sérgio Mário Lins Galdino . Agenda. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares
E N D
Probabilidade e Estatística Básica:Um curso para inocentes com o companheiro R Ministrado por um bobo. Teoria da Estimação Sérgio Mário Lins Galdino
Agenda • Estimativas não-tendenciosos e Estimativas Eficientes • Estimativas pontuais e Estimativas Intervalares • Estimativas do Intervalo de Confiança dos Parâmetros da População • Intervalos de Confiança para Médias • Intervalos de Confiança para Proporções • Intervalos de Confiança para Diferenças e Somas
Estimativas não-tendenciosos e Estimativas Eficientes • Uma estimativa é não tendenciosa quando a média ou esperança da estatística é igual ao parâmetro da população. • Quando duas estatísticas da distribuição amostral tem mesma média, a estatística coma menor variância é a mais eficiente. • Estatística eficiente e não tendenciosa nem sempre é possível
Estimativas pontuais e Estimativas Intervalares • Um estimador pontual de um parâmetro populacional é dado por um único valor. • Um estimador intervalar de um parâmetro populacional é dado por dois números (limites inferior e superior) no qual o parâmetro é considerado pertencer. • Exemplo: Temperatura: 28ºC (pontual) • Temperatura: 28±2 (intervalar)
Estimativas do Intervalo de Confiança dos Parâmetros da População Sejam s e s a média e o desvio padrão (erro padrão) da distribuição amostral de uma estatística amostral S. Assumindo S normalmente distribuída ( n ≥ 30, lei dos grandes números). Espera-se encontrar S nos intervalos s ± s , s ±2 s e s ± 3s em cerca de 68,27%, 98,45% e 99,83% das vezes.
Estimativas do Intervalo de Confiança dos Parâmetros da População Os números extremos dos intervalos S1.96s e S2.58s, são chamados limites de confiança 1-95% e 99% (ou 0.95 e 0.99). Os números 1.96, 2.98, etc. são os valores críticos (zc). Exemplo:> LC= 0.95 > ZC = qnorm(1 - (1-LC)/2) > ZC [1] 1.959964
Estimativas do Intervalo de Confiança dos Parâmetros da População O limite de confiança (1-)100% onde [0, 1] (LC = 1- ) pode-se determinar um z∗ com P (−z∗ < z < z∗) = 1 − α z∗ é chamado de z1−α/2 . Em R ele é calculado pela função qnorm > alpha = c(0.01,0.02,0.04,0.05,0.10,0.20,0.5) > zasterisco = qnorm(1 - alpha/2) > zasterisco [1] 2.5758293 2.3263479 2.0537489 1.9599640 1.6448536 1.2815516 0.6744898 >
Intervalos de Confiança para Médias • Amostras grandes ( n ≥ 30). Os limites de confiança para a média da população são no caso de uma população infinita, ou por no caso de amostragem com reposição de uma população finita,
Intervalos de Confiança para Médias • Exemplo: Encontre os limites de confiança de 95% e 99% de uma amostra de tamanho 30 com média 1.82 e desvio padrão amostral 0.17. Resposta: Os limites de confiança de 95% são > qnorm(1-(1-0.95)/2)*0.17/sqrt(30) [1] 0.0608326 > no caso de amostragem com reposição de uma população finita,
Intervalos de Confiança para Médias • Os limites de confiança de 99% são > qnorm(1-(1-0.99)/2)*0.17/sqrt(30) [1] 0.07994759 >
Intervalos de Confiança para Médias • Amostras pequenas (n < 30) e População Normal. Usa-se a distribuição T (t de Student) para obtenção dos limites de confiança. Por exemplo -t0.95 e t0.95 são os valores de T para os quais 5% da área pertence a cada lado da distribuição T
Intervalos de Confiança para Médias • Amostras pequenas (n < 30) e População Normal. pode ser estimado pertencer ao intervalo com 95% de confiança. Os limites de confiança são com tc obtido por tabela ou calculado
Intervalos de Confiança para Médias • Amostras pequenas (n < 30) e População Normal. Exemplo: Os valores de tcem R são calculado pela função qt. > qt(.975, df = c(1:10,20,50,100,1000)) [1] 12.706205 4.302653 3.182446 2.776445 2.570582 2.446912 2.364624 2.306004 2.262157 2.228139 2.085963 [12] 2.008559 1.983972 1.962339 >
Intervalos de Confiança para Médias • Amostras pequenas (n < 30) e População Normal. Exemplo: x=c(175, 176, 173, 175, 174, 173, 173, 176, 173, 179) n=length(x) xm=mean(x) df=n-1 tc=qt(0.975,df) delta.x=tc*sd(x)/sqrt(n) x.inf=xm-delta.x x.sup=xm+delta.x
Intervalos de Confiança para Médias • Amostras pequenas (n < 30) e População Normal. Exemplo(continuação) ># Intervalo de confiança de 95% > x.inf [1] 173.3076 > x.sup [1] 176.0924 > # Média de x > xm [1] 174.7 > xm/sd(x)*sqrt(10) [1] 283.8161 >
Intervalos de Confiança para Médias • Amostras pequenas (n < 30) e População Normal. Exemplo(continuação) > t.test(x) One Sample t-test data: x t = 283.8161, df = 9, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 173.3076 176.0924 sample estimates: mean of x 174.7 >
Intervalos de Confiança para Proporções • Suponha que a estatística S é a proporção de “sucesso” em uma amostra de tamanho n≥30 extraída de uma população binomial em que p é a proporção de sucessos (i. é., probabilidade de sucesso). • Os limites de confiança para a proporção da população são dadas por para uma amostra de população infinita, ou uma amostra com reposição de uma população finita.
Intervalos de Confiança para Proporções (continuação) • Os limites de confiança para a proporção da população são dadas por se a amostragem é sem reposição , de uma população finita de tamanho N.
Intervalos de Confiança para Proporções (continuação) • Exemplo: Uma amostra aleatória de 600 eleitores de certo distrito eleitoral dá 55% como favoráveis a determinado candidato A. Determine limites de confiança para a proporção global de eleitores favoráveis ao candidato na base de 99%. • Os limites de confiança de 99% para população são Conclusão: O candidato A está com 99% de chance para vencer as eleições
Intervalos de Confiança para Diferenças e Somas • Se S1 e S2 são duas estatísticas amostrais com distribuições amostrais aproximadamente normais, a expressão dá limites de confiança para as diferenças dos parâmetros populacionais, e dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.
Intervalos de Confiança para Diferenças e Somas • No caso de populações infinitas dá limites de confiança para as diferenças dos parâmetros populacionais onde são as respectivas médias, desvios padrões e tamanhos das duas amostras populacionais. Analogamente, dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.