460 likes | 660 Views
Introducción a la Inferencia Estadistica. Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff. Introducción a la Inferencia Estadistica. Intervalo de confianza para la media poblacional, σ conocido. Intervalos de confianza.
E N D
Introducción a la Inferencia Estadistica Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Intervalos de confianza Intervalos de confianza: sirven para estimar el valor de un Parámetro de la población. Un intervalo de confianza del 1-α% para un parámetro es un intervalo de valores calculado a partir de los datos de la muestra Probabilidad 1-αde que contenga el verdadero valor del parámetro. El nivel de confianza suele ser 0,90 (90%), 0,95 (95%) ó 0,99 (99%). Interpretación práctica
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Deducción La media muestral y la desviación estándar son buenos estimadores Estos estimadores son a la vez variables aleatorias. Tienen una determinada distribución, en el caso de la media es Normal. Así pues podemos calcular un intervalo de valores [a,b] tales que = C
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Supongamos que disponemos de una población en la que tenemos una v.a. con distribución N(μ,σ) con σ conocida. Obtenemos una muestra de tamaño n y deseamos estimar la media μ de la población. El estimador puntual de la misma es la media muestral cuya distribución muestral es conocida tendrá distribución normal estándar El estadístico
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Sobre la distribución N(0 , 1) podremos seleccionar dos puntos simétricos -zα/2 y z α/2 , tales que P(-z α/2≤ Z ≤ z α/2 ) = 1-α
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Sustituyendo Z Despejando nos queda el intervalo de confianza,
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Gráficamente: para una Normal tipificada, un intervalo de confianza del 95% se puede representar como: La probabilidad de que una variable normal tipificada tome valores en el intervalo [-1.96,1.96] es del 95%. 95% 2.5% 2.5%
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Ejemplo, • Obtener un I. C. del 95% para el promedio de una poblacion de 500 novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que σ2 es de 400 kg2.
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Ejemplo, • Obtener un I. C. del 95% para el promedio de una poblacion de 500 novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que σ2 es de 400 kg2.
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Ejemplo, • Obtener un I. C. del 95% para el promedio de una poblacion de 500 novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose =390 kg. Se sabe que σ2 es de 400 kg2.
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Si la varianza poblacional es desconocida y la variable es normal (o se puede aproximar a la normal por el Teorema central del límite) • Se usa la t de Student, • Con n –1 grados de libertad • Desvíación típica muestral. El intervalo de confianza resulta
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr. Estimar el intervalo de confianza al 95% para el verdadero aumento promedio
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr. Estimar el intervalo de confianza al 95% para el verdadero aumento promedio
Introducción a la Inferencia Estadistica Intervalo de confianza para la media poblacional, σ conocido Ejemplo, En un establecimiento dedicado a la elaboración de alimentos para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 gr. diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35gr. con desviación de 3,04 gr. Estimar el intervalo de confianza al 95% para el verdadero aumento promedio
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Que es: hipótesis estadística es una afirmación respecto a alguna característica de una población. Ho : Hipótesis nula H1 : Hipótesis alternativa Errores que se pueden cometer Pueden ser unilaterales o bilaterales Conclusiones a partir de una muestra aleatoria y significativa, permite aceptar o rechazar la hipótesis nula
Introducción a la Inferencia Estadistica α=5% Reg. Crit. Reg. Crit. No rechazo H0 Η0: μ=40 Contrastes de Hipótesis Ho : μ = μo H1 :μ ≠ μo Contraste bilateral
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Si supongo que H0 es cierta... ¿qué hace un científico cuando su teoría no coincide con sus predicciones? ...el resultado del experimento sería improbable. Sin embargoocurrió.
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Si supongo que H0 es cierta... Rechazo que H0 sea cierta. ...el resultado del experimento sería improbable. Sin embargoocurrió.
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Si supongo que H0 es cierta... • No hay evidencia contra H0 • No se rechaza H0 • El experimento no es concluyente • El contraste no es significativo ¿Si una teoría hace predicciones con éxito, queda probado que es cierta? ...el resultado del experimento es coherente.
Introducción a la Inferencia Estadistica Contrastes de Hipótesis • Nivel de significación: α • Número pequeño: 1% , 5% • Fijado apriori por el investigador • Probabilidad de rechazar H0 cuando es cierta Región crítica • Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 α=5% Reg. Crit. Reg. Crit. No rechazo H0 Η0: μ=40
Introducción a la Inferencia Estadistica Contrastes de Hipótesis La posición de la región crítica depende de la hipótesis alternativa H1: μ≠40 Bilateral Unilateral Unilateral H1: μ>40 H1: μ<40
Introducción a la Inferencia Estadistica Significación: p-valor Contrastes de Hipótesis α H0: μ=40
Introducción a la Inferencia Estadistica Contrastes de Hipótesis No se rechaza H0: μ=40 α H0: μ=40
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Significacion. P-valor Probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Probabilidad de obtener una muestra “más extraña” que la obtenida. P-valor es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>α No se rechaza H0: μ=40 P-valor α P α
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Se rechaza H0: μ=40 Se acepta H1: μ>40 α
Introducción a la Inferencia Estadistica Contrastes de Hipótesis El contraste es estadísticamente significativo cuando p<α Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. α P Se rechaza H0: μ=40 Se acepta H1: μ>40 α P
Introducción a la Inferencia Estadistica Contrastes de Hipótesis • Sobre α • Número pequeño, elegido a priori antes de diseñar el experimento • Conocido α sabemos todo sobre la región crítica • Sobre p • Es conocido tras realizar el experimento • Conocido p sabemos todo sobre el resultado del experimento • Sobre el criterio de rechazo • Contraste significativo = p menor que α
Introducción a la Inferencia Estadistica Contrastes de Hipótesis • Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos: X = 18,5 S = 3,6 • Plantear Contraste • Estadístico • Zona de Rechazo • P-valor • Conclusiones • β t(35)0,05=1,69 T=0,833 No esta en Región Crítica No es > 1,69 P-valor para T=0,833, y para 35 g.l. es aproximadamente 0,20 NO Se rechaza H0: μ<=18 H1: μ>18
Introducción a la Inferencia Estadistica Contrastes de Hipótesis El contraste es estadísticamente significativo cuando p<α Pero que pasa cuando NO Rechazo? El error cometido es β Para calcularla se debe concretar H1 μ1= 20 (Cuidado: el criterio para este valor no es estadístico)
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Cuando Acepto Ho: El error β es (Si el contraste es unilateral con cola a derecha). Calculamos el Z correspondiente : P(Z<zα) tomando μ1= 20 (la media hipotética alternativa) En este caso hemos calculado β Dados: n y μ1
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Calculo del Tamaño Muestral Se obtiene a partir de L2 Podemos fijar n y calcular β ó Podemos fijarβy entonces debemos calcular n para cumplir con ese error μo μ1 L2
Introducción a la Inferencia Estadistica Contrastes de Hipótesis Calculo del Tamaño Muestral Se obtiene a partir de L2 n = (zα + zβ)2 (σ/δ)2 En este caso hemos fijado βy entonces debemos calcular el n para cumplir con ese error μo μ1 L2 δ
Introducción a la Inferencia Estadistica μo μ1 Contrastes de Hipótesis Comportamiento de β, δ y el tamaño muestral n = (zα + zβ)2 (σ/δ)2 Si fijamos β nDISMINUYE cuando aumentoδ μo μ1 L2 δ
Introducción a la Inferencia Estadistica Intervalo de Confianza • Intervalo de Confianza para la Varianza
Introducción a la Inferencia Estadistica Contrastes de Hipótesis para Varianza • Plantear Contraste Estadístico
Introducción a la Inferencia Estadistica Contrastes para dos Poblaciones
Introducción a la Inferencia Estadistica Contrastes para dos Poblaciones Independientes Varianzas Conocidas ) - Δo ( Zexpt = σx2 σy2 Bilateral Unilateral P-valor = 2 P(z> |zexpt|) P-valor = P(z> zexpt)
Introducción a la Inferencia Estadistica Contrastes para dos Poblaciones Independientes Varianzas Iguales Varianzas Distintas
Introducción a la Inferencia Estadistica σx2 σy2 x Contrastes para dos Poblaciones Independientes Intervalo de confianza para diferencia de medias Varianzas Conocidas
Introducción a la Inferencia Estadistica Contrastes para dos Poblaciones Independientes Problema. Se quiere comprobar si los datos de número de resfriados durante el periodo de exámenes por estudiante influyen tomando vitamina C. Los sig. datos corresponden a muestras a las que se les ha suministrado placebo (x) y Acido Ascorbico (y). x = 2,2 y = 1,9 Sx = 0,12 Sy= 0,10 Nx= 155 Ny = 208
Introducción a la Inferencia Estadistica σmayor2 FNnum – 1 , Nden – 1 , 0.025 σmenor2 Contrastes para dos Poblaciones Independientes Placebo (x) y Acido Ascorbico (y). x = 2,2 y = 1,9 Sx = 0,12 Sy= 0,10 Nx= 155 Ny = 208 1,2 < 1,3637 Varianzas Iguales
Introducción a la Inferencia Estadistica Contrastes para dos Poblaciones Independientes Placebo (x) y Acido Ascorbico (y). x = 2,2 y = 1,9 Sx = 0,12 Sy= 0,10 Nx= 155 Ny = 208 (pero iguales)
Introducción a la Inferencia Estadistica Contrastes para dos Poblaciones Independientes Problema. 2 Los sig. datos corresponden a muestras de dos ciudades En las que se ha observado el nivel de contaminación de plomo en el agua corriente. Verificar si hay diferencias entre ambas ciudades. xy
Introducción a la Inferencia Estadistica Contrastes para dos Poblaciones Independientes
Introducción a la Inferencia Estadistica Contrastes para dos Poblaciones Dependientes 1) Definimos la variable D como: D = {Antes - Despues} ó D = {Despues - Antes} ó D = { X - Y} ó D = { Y - X} 2) Proponemos el contraste 3) Calculamos el estadístico en función de la definición de D y del contraste propuesto, siendo D una variable Normal 4) Obtenemos las conclusiones y aportamos el p-valor