240 likes | 366 Views
Curso de Bioestadística Parte 8 Inferencias acerca de una media. Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya Salvatierra Universidad de Guanajuato México. Presentación.
E N D
Curso de BioestadísticaParte 8Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya Salvatierra Universidad de Guanajuato México
Presentación Médico Cirujano por la Universidad Autónoma de Guadalajara. Pediatra por el Consejo Mexicano de Certificación en Pediatría. Diplomado en Epidemiología, Escuela de Higiene y Medicina Tropical de Londres, Universidad de Londres. Master en Ciencias con enfoque en Epidemiología, Atlantic International University. Doctorado en Ciencias con enfoque en Epidemiología, Atlantic International University. Profesor Titular A, Tiempo Completo, Universidad de Guanajuato. Nivel 1 del Sistema Nacional de Investigadores. padillawarm@gmail.com
Competencias • Aplicará prueba de Z para obtener inferencias de una media. • Obtendrá intervalo de confianza para una media. • Aplicará prueba de t para una media en una muestra pequeña. • Obtendrá el intervalo de confianza para una media en una muestra pequeña.
Introducción • Si medimos la estatura de estudiantes de la FEOC, podemos obtener su media y desviación estándar: • Número de estudiantes: 269 • Media de estatura: 161.6 cm • Desviación estándar: 6.3 cm • Mediana: 159 cm • Rango: 149 a 185 cm.
Notación • Para parámetros de la población usamos letras griegas, para parámetros de la muestra, usamos letras latinas.
Distribución de muestreo • Si tomamos muchas muestras del mismo tamaño de la misma población, cada muestra puede tener media y desviación estándar diferentes. • Si graficamos esas medias de las muestras podemos obtener una distribución de muestreo. • Sabiendo que el tamaño de muestra es grande, la distribución de las medias de las muestras es aproximadamente Normal, aunque la distribución de los datos en la población no sea Normal.
Distribución de muestreo Datos de estudiantes de la FEOC. Si tomamos otras 999 muestras de estudiantes podemos graficar la distribución de sus medias.
Intervalos de confianza al 95% • Usa la teoría de la probabilidad para extraer conclusiones acerca de una población, a partir de los datos obtenidos en una muestra. • Es muy difícil estudiar a toda la población, por lo que estudiamos muestras. • Métodos para hacer estimaciones y probar hipótesis son fundamentales para obtener inferencias.
Intervalos de confianza al 95% (cont…) • Entonces los intervalos de confianza para una media se calculan así: _ X ± 1.96 (ES) _ X es el estimado obtenido de la muestra 1.96 es el múltiplo de errores estándar para 95% ES es el error estándar • Deberíamos esperar que el intervalo de confianza al 95% alrededor de la media de la muestra incluya la media de la población en el 95% de las veces, si tomamos miles de muestras.
Intervalos de confianza al 95% (cont…) • Calculemos el intervalo de confianza al 95% para la primera muestra de 269 estudiantes de la FEOC: _ X = 161.6 ES= 6.3/√269= 0.38 IC95%= 161.6 ± 1.96 (0.38) = 161.6 ± 0.74 = 160.86 a 162.34
Intervalos de confianza al 95% (cont…) • Podemos usar intervalos de confianza a otro porcentaje de confianza, sólo debemos cambiar el múltiplo del error estándar: • Por ejemplo, al 90% cambia a 1.69. • Para el 95.4% cambia a 2. • Para el 99% cambia a 3.
Prueba de hipótesis para una media • La prueba de hipótesis es comprobar si nuestra estimación concuerda con una valor específico. • Nuestra muestra de 269 estudiantes fue de 161.6 con desviación estándar de 6.3 y error estándar de 0.38. • En un estudio similar en los estudiantes de la Facultad de Contabilidad y Administración, obtuvieron una media de estatura de 167 cm. • ¿Cómo podemos demostrar si la estatura de los estudiantes de la FEOC es igual o diferente de los estudiantes de la FCA? • Media de FEOC 161.6 • Media de FCA 167 • Podemos ver, obviamente que no son iguales. • Pero no sabemos si la diferencia observada es real o es debido a error de muestreo, ya que 161.6 es una estimación de muchas que pudimos haber obtenido.
Prueba de hipótesis para una media • Para evaluar si la diferencia observada es real, se hace lo siguiente: • Hipótesis nula señala que las medias de ambas poblaciones es la misma (la primera población es la población de estudiantes de la FEOC y la población de referencia es la de estudiantes de Contabilidad). • La hipótesis nula se escribe Ho. • Si la media de la hipótesis es μo y la media en estudio es μ, entonces la hipótesis nula se escribe como HO : μ = μo • Hipótesis alternativa • La hipótesis alternativa es que las medias de las dos poblaciones no son iguales. • Usualmente se escribe como H1: μ≠μ0
Prueba de hipótesis para una media • Ya que se ha señalado la hipótesis nula, calculamos la probabilidad de obtener los datos observados si la hipótesis nula es verdad. • Para obtener esta probabilidad, calculamos una prueba estadística y la comparamos a la distribución implicada por la hipótesis nula. • En muchos casos será la distribución Normal.
Prueba de hipótesis para una media • La forma general de la prueba estadística compara los valores observados estimados de la muestra y el valor esperado si la hipótesis nula fuera verdad. • También toma en cuenta la variabilidad en la población usando el error estándar. • Esta prueba estadística se llama Z y es igual a: _ X – μo Z= ------------ ES _ Entonces, la prueba es una diferencia estandarizada entre X y μo.
Ejemplo • La muestra de estudiantes de la FEOC Media = 161.6 S = 6.3 IC 95% = 160.6 a 162.60 • La hipótesis nula es que no hay diferencia entre las medias de estatura de estudiantes de la FEOC y FCA Ho: μ = 167cm Necesitamos usar la prueba de z: _ X – μo 161.6 -167 z = ----------- = ---------------- = - 14.21 ES(X) 0.38
Muestras pequeñas • Si el tamaño de muestra es pequeño, usamos la distribución t. • Su forma depende de los grados de libertad, que es una medida de qué tan pequeña es el tamaño de muestra. • Los grados de libertad de una distribución t es igual al tamaño de muestra menos 1.
Muestras pequeñas • Entre menos grados de libertad, menos probabilidad de estar alrededor de la muestra y altas probabilidad de estar en las colas. • Las distribuciones t con los más pequeños grados de libertad tienen las más pequeñas probabilidades a los lados de la media y mayores probabilidades en las colas. • Sin embargo, entre mayor el tamaño de muestra y por lo tanto, mayor grados de libertad, más parecida es la distribución t a la distribución Normal. • Hay tablas publicadas de valores seleccionados del área bajo la distribución t que usaremos cuando calculemos intervalos de confianza y pruebas de hipótesis.
Muestras pequeñas • Así, cuando el tamaño de muestra es pequeño, menos de 100, las fórmulas para el intervalo de confianza y la prueba de hipótesis, son: 95%IC Prueba de hipótesis Estimación ± multiplicador (error estándar) Para probar Ho: μ=μo Estimación es la media estimada Para probar H1: μ≠μo Multiplicador es el valor de t que _ corresponde a p=0.05 con grados de X – μ0 libertad igual al tamaño de muestra t = --------- menos 1 ES
Valores de p • ¿Una o dos colas? • Ahora sabemos que el valor de p es la probabilidad de haber obtenido un resultado al menos tan extremo como el encontrado con nuestra muestra si la hipótesis nula fuera verdad. • Pero, ¿qué significa extremo? • Cuando la hipótesis alternativa es H1: µ ≠ µo • Luego resultados extremos pueden ocurrir por azar a cada lado de la media de la hipótesis, µo. • Debido a esto usamos las tablas para dos colas de las distribuciones Normal y t.
Valores de p • Hay situaciones menos comunes donde la hipótesis alternativa es H1: µ < µo o H1: µ > µo • Entonces, valores extremos podrían ocurrir sólo a la izquierda o sólo a la derecha, de la media de la hipótesis. • ¿Cuán pequeño es pequeño para el valor de p? • Muchas personas usan el valor de p de 0.05 como punto de corte. Es un valor arbitrario, pero muy sensible. Significa que estamos preparados para rechazar la hipótesis nula al menos una vez de 20 cuando es verdad. • Note que cuando el valor de una prueba tiene un valor de p menor a 0.05, el intervalo de confianza no incluye el valor de la hipótesis.
Valores de p • ¿Si tenemos un valor de p de 0.048 podemos rechazar la hipótesis nula? • ¿Si tenemos un valor de p de 0.052 no rechazamos la hipótesis nula? • Cuando los valores de p estén entre 0.07 y 0.03 deberán ir acompañados del valor real de p, ya que están en los bordes de ser significativos.
Presentación de resultados • Presente sus resultados acompañados de los intervalos de confianza • Clarifique cuál es sus hipótesis nula y alternativa • De el valor de p de cada prueba, pero es suficiente con decir p< 0.001 cuando sea el caso. • No malinterprete los valores de p • Un valor pequeño de p da lugar a rechazar la hipótesis nula • Un valor de p grande da lugar sólo a no rechazar la hipótesis nula
Bibliografía • 1.- Last JM. A dictionary of epidemiology. New York, 4ª ed. Oxford University Press, 2001:173. • 2.- Kirkwood BR. Essentials of medical statistics. Oxford, Blackwell Science, 1988: 1-4. • 3.- Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991: 1-9.