690 likes | 860 Views
DIPLOMADO DE ESPECIALIZACION DE POSTGRADO EN ASESORIA DE TESIS. ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS . Dr. Carlos Calderón Cabada. Lima, Junio 2006. PRUEBAS ESTADISTICAS PARAMETRICAS. Prueba “t” de Student . ¿QUE ES LA PRUEBA “t” ?.
E N D
DIPLOMADO DE ESPECIALIZACION DE POSTGRADO EN ASESORIA DE TESIS ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006
PRUEBAS ESTADISTICAS PARAMETRICAS Prueba “t” de Student
¿QUE ES LA PRUEBA “t” ? • ES UNA PRUEBA ESTADISTICA PARA EVALUAR SI DOS GRUPOS DIFIEREN ENTRE SI DE MANERA SIGNIFICATIVA RESPECTO DE SUS MEDIAS.
SIMBOLO “ t “
HIPOTESIS A PROBAR • Se trata de comparar dos grupos: • La hipótesis alternativa plantea que los grupos difieren significativamente entre si y la hipótesis nula propone que los grupos no difieren significativamente entre si.
VARIABLE INVOLUCRADA • LA COMPARACION SE REALIZA SOBRE LA VARIABLE INDEPENDIENTE, SI EXISTEN OTRAS SE DEBE EFECTUAR VARIAS PRUEBAS “t” UNA POR CADA VARIABLE. • EL NIVEL DE MEDICION DE LAS VARIABLES ES EL DE INTERVALO O RAZON
INTERPRETACION • PARA GRUPOS PEQUEÑOS (n < 30) • X la media del grupo. • µ la media poblacional • S la Desv. Estandar • n = tamaño de muestra
INTERPRETACION • Para saber si el valor “t” es significativo, se aplica la formula y se calculan losgrados de libertad. • La prueba “t” se basa en una distribución muestral o poblacional de diferencia de medias conocidas como la“t de Student”, • Esta distribución es identificada por los grados de libertad, los cuales constituyen el numero de maneras como los datos pueden variar libremente.
RECOMENDACION • Mientras mayor sea el numero de grados de libertad la distribución “t de Student” se acerca mas a ser una distribución normal. • Si los grados de libertad exceden los 120 la Distribución Normal es utilizada como una aproximación adecuada de la “t de Student”. • Calculado “t” y los gl (grados de libertad) SE ELIGE el nivel de significancia y se compara el valor obtenido con el mostrado en la Tabla
t(v) 0 t1- Distribución t-Student Para muestras pequeñas de población normal PRUEBA “t”
CALCULO DE LOS GRADOS DE LIBERTAD gl = (N1 + N2) – 2 N1 y N2 representan al tamaño de cada grupo comparado.
EVALUACION DE RESULTADOS • Si nuestro valor calculado es igual o mayor que el de la Tabla, se acepta la hipótesis alternativa. • Pero si el valor es menor se acepta la hipótesis nula. USO DE LA TABLA……..
EJERCICIOS • Tomar la Tabla “t” y calcular: • Media Muestral = • Media Poblacional = • α = • n = • gl. (t-1)=
HIPOTESIS A CONTRASTAR Se definen: Las hipótesis nula y alternativa con una distribución de probabilidad conocida Regla de decisión(nivel de significación a) Valor crítico o tabulado datos de la muestra Se calcula una medidaasociada a la hipótesis que se deseadocimar Se comparan los valores calculado con tabulado ¿se rechaza Ho? H1 SI NO Se extraen conclusiones
Utilizar prueba de Z Si ¿Se conoce ? No Si Utilizar prueba de Z Es n ≥ 30? No Utilizar prueba de Z Si Si ¿Se conoce? No ¿Se sabe q la población es normal? Utilizar prueba de t Utilizar prueba de Z (por el teorema central del límite) Si No ¿Se conoce? No Utilizar prueba de Z (por el teorema central del límite) Si Utilizar una prueba no paramétrica Es n ≥ 30?
Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región. Se rechaza la hipótesis nula Se rechaza la hipótesis nula Area A = área B y (A+B) = el nivel deseado de significancia Area A Area B Valor teórico de la diferencia + Valor critico Valor critico
Hipótesis estadística según Número de grupo y tipo de variable
PRUEBA DE CORRELACION DE RANGO DE SPEARMAN El coeficiente de correlación por rango se define como: Donde: N: # de observaciones, # de individuos o fenómenos clasificados por rango. di: Diferencia en los rangos atribuida a dos características diferentes del i-ésimo individuo o fenómeno. La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)
EJEMPLO Una empresa contrató a 7 técnicos en informática, que fueron sometidos a un examen de conocimientos básicos. Luego de un año de servicio, se calificó su rendimiento en el trabajo. A continuación, se muestran los resultados:
Se utiliza la correlación por rangos de Spearman para determinar, si hay relación entre las calificaciones del examen y el rendimiento en el trabajo 1º Se elabora la clasificación de las puntuaciones del examen
2º Se calcula del coeficiente de correlación por rangos de Spearman rs: Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo
Contrastando la hipotes: H0:ρs = 0, no hay relación entre las dos variables H1:ρs ≠ 0, hay relación entre las dos variables Tabla N, con α=0.10, n=7; los valores críticos serían: ± 0.6786 Se acepta Se Rechaza Se Rechaza 0.05 0.05 0.857 -0.6786 Valor critico +0.6786 Valor critico Como rs está fuera de la región de aceptación, rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo
Intervalo de confianza para la diferencia de medias b) Si las varianzas 12 y 22 son desconocidas Para muestras grandes donde
CONSIDERACIONES • La mayoría no de estos análisis no requiere de presupuestos acerca de la forma de la Distribución Poblacional. • Las Variables no necesariamente deben estar medidas en un nivel de intervalo (orden y categoría cero no real) o de razón ( el cero es real) . • Pueden analizarse datos nominales (sin orden ni categoría -Sexo) u ordinales (orden de mayor a menor- primero, segundo). • En todo caso la variables deben ser categóricas. ( en días, meses, años, etc.)
METODOS O PRUEBAS NO PARAMETRICAS MAS EMPLEADAS • 1) LA Ji CUADRADA – CHI-CUADRADA • 2) COEFICIENTES DE CORRELACION E INDEPENDNENCIA PARA TABULACIONES CRUZADAS. • 3) LOS COEFICIENTES DE CORRELACION PARA RANGOS ORDENADOS DE SPERMAN Y KENDALL
Ji - CUADRADA • Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables. • Se simboliza por : א² • Prueba hipotesis Correlacionales • Variables involucradas : dos ( no considera relaciones causales) • Nivel de medicion de variables: Nominal y Ordinal.
Ji - CUADRADA • La Chi – Cuadrada se calcula a traves de una Tabla de contingencia o Tabulacion cruzada, que constituye una Tabla de dos dimensiones o matriz de dos x dos. • Cada dimension contiene una variable. • Cada variable se subdivide en dos o mas categorias.
La Prueba Ji-Cuadrado Supóngase que se tiene una serie de variables aleatorias independientes con distribución normal estándar, , entonces la variable aleatoria , sigue una distribución Ji-Cuadrado. Distribución Ji-Cuadrado
Procedimientos para usar el análisis de ji cuadrada y probar la independencia de dos variables nominales Hipótesis nula: Las variables son independientes Se construye o se obtiene una tabla de tabulación cruzada para las frecuencias reales observadas (Oij ) Suponiendo que las variables son independientes, se construye una tabla de tabulación cruzada para las frecuencias teóricas ( Eij) Se determina el nivel de significado deseado en la prueba. Se determina el valor calculado del estadístico ji cuadrada
USO DE LA TABLA El área sombreada de naranja representa la probabilidad que se determinada por , donde: es el valor critico del margen superior de la tabla, y son los grados de libertad del margen izquierdo de la tabla.
EJEMPLO Martha Revilla, directora de mantenimiento de la calidad en MEGA, elige 29 bicicletas y halla una varianza en la distancia entre ejes de 32.7 pulgadas cuadradas. Si la señora Revilla tienen que garantizar que la variación no supere 27 pulgadas cuadradas ¿indica esto que se cumplen las normas de producción? (α=0.05) Hipótesis • Prueba de una cola a la derecha
0.05 41.337 33.91 • Como X2=33.91<41.337la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
¿Que pasaría, si las instrucciones de la señora Revilla fueran que la variación se mantuviera inferior a 27 pulgadas cuadradas? • Prueba de una cola a la izquierda 0.05 16.928 33.91 • X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
La señora Revilla, ahora elabora un intervalo de confianza del 90% para la varianza de la distancia entre ejes. 0.90 0.05 0.05 16.928 41.337 0.95 • Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas
Prueba Ji-Cuadrado de Independencia H0: Las variables X e Y son independientes H1: Existe asociación entre X e Y
Prueba Ji-Cuadrado de Independencia • Estadística
Ejemplo de Prueba Ji-Cuadrado de independencia Para verificar la suposición de que la fabricación de cierto producto está asociado con enfermedades respiratorias, a 450 trabajadores de una empresa que fabrica el producto se evaluó respecto a la presencia de síntomas de alteraciones respiratorias y se los clasificó a su vez de acuerdo al nivel de exposición al producto. Los resultados se presentan en la tabla siguiente:
H0: Las alteraciones respiratorias son independientes de la exposición al producto. H1: Las alteraciones respiratorias están asociadas a la exposición al producto Frecuencias Esperadas: Por ejemplo:
Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto