340 likes | 1.52k Views
UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio Nacional ESCUELA DE POSTGRADO SECCIÓN DE DOCTORADO. Curso: Seminario de Estadística Aplicada a la Investigación Educacional. Tema: Estadísticos no paramétricos Ji-Cuadrada. Dr. Florencio Flores Ccanto.
E N D
UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio Nacional ESCUELA DE POSTGRADO SECCIÓN DE DOCTORADO Curso: Seminario de Estadística Aplicada a la Investigación Educacional Tema: Estadísticos no paramétricos Ji-Cuadrada Dr. Florencio Flores Ccanto
¿CUÁLES SON LAS SUPOSICIONES DE LA ESTADÍSTICA NO PARAMÉTRICA? • Para realizar análisis no paramétricos, debe partirse de las siguientes consideraciones: • La mayoría de estos análisis no requieren de supuestos acerca de la forma de la distribución poblacional. Aceptan distribuciones no normales. • Las variables no necesariamente deben estar medidas en un nivel por intervalo o de razón, pueden analizar datos nominales u ordinales. • Si se quieren aplicar análisis no paramétrica a datos por intervalos o razón, éstos deben ser resumidos a categorías discretas (a unas cuantas). Las variables deben ser categorías.
¿CUÁLES SON LOS MÉTODOS O PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS MÁS UTILIZADAS? Las Pruebas no paramétricas más utilizadas son: • La Chi-cuadrada o Ji-Cuadrada oX2. • Los coeficientes de correlación e independencia • para tabulaciones cruzadas. • Los coeficientes de correlación por rangos • ordenados de Spearman y Kendall. • Prueba de U de Mann Whitney • Pruebas W de Wilcoxon
Distribución Ji-Cuadrada o Chi-cuadrada o X2?. • Es una prueba útil para variables categóricas y estadística, es aplicable cuando la variable nominal está compuesto por dos o más categorías. Tiene dos aplicaciones: • La prueba de bondad de ajuste Chi-cuadrada. • La prueba Chi-cuadrada de asociación. • Ambas pruebas se utilizan para determinar si las frecuencias observadas (O) en las categorías difieren significativamente de las frecuencias esperadas (E).
Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas.
CARACTERÍSTICAS • La Distribución X2 se lee con grados de libertad G.L = (Nº de filas - 1)(Nº de columnas - 1). • No tiene valores negativos. El valor mínimo es 0. • Todas las curvas son asimétricas • Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha. • Se utiliza para variables medidas en escala nominal u ordinal. • Las fórmulas son:
Ejemplo 1. Variable, categoría y tabla de contingencia 2x2: Sean las variables SEXO (Masculino y Femenino) y CANDIDATO (“A” y “B”). La tabla de contingencia o tabulación cruzada es:
Variable Categoría
Ejemplo 2. Estudio de Tabla de contingencia 3x2: Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal. Variables: APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIÓNcategorías:Primaria, Secundaria. TABLA DE CONTINGENCIA
Tabla de frecuencias observadas (O): La Chi-cuadrada es una comparación entre las tablas de frecuencias observadas y la denominada tabla de frecuencias esperadas (la tabla que esperaríamos encontrar si las variables fueran estadísticamente independientes o no estuvieran relacionadas).
Tabla de frecuencias esperadas (E): La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: N = es el número total de frecuencias observadas. E = (marginal del reglón)(marginal de columna) / N.
Frecuencia observada: Donde: O: frecuencia observada en cada celda E: frecuencia esperada en cada celda Frecuencia esperada:
Para saber si el valor de X2 es o no significativo, debemos calcular los grados de libertad. G.L. = (Nº de filas - 1)(Nº de columnas - 1).
Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2; entonces G.L. = (3-1)(2-1) = 2. • Luego, acudimos a la “tabla de distribución de Chi-cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó = 0,01). • Si el valor obtenido de X2 es igual o superior al valor de la “tabla”, decimos que las variables están relacionadas o no son independientes. • Aplicación: • Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla es 5,9915 (ver tabla). • X2Obtenido= 47,33 • X2Crítico = 5,9915
Prueba de hipótesis: H0: No existe relación entre el aprendizaje y los niveles de educación. H1: Existe relación entre el aprendizaje y niveles de educación. X2obtenidoX2críticoentonces variables no son independientes; es decir existe una relación entre Aprendizaje y los niveles educativos X2obtenidoX2críticoentonces se rechaza la hipótesis nula (H0), y por lo tanto se acepta la hipótesis alterna (H1).
Establezca la Ho a ser probada; por ejemplo, Ho: 1 = 2 = 0,5 Paso Nº 1 Especifique el nivel de significancia α, por ejemplo: α = 0.5 Paso Nº 2 Haga una tabla de frecuencias obtenidas Deduzca las frecuencias esperadas a partir de Ho: Calcule el grado de libertad: Producto de (categorías - 1) Calcule el valor de X2 a partir de las frecuencias obtenidas y frecuencias esperadas. Mediante la tabla de X2 obtenga el valor teórico. Compara dichos valores. Paso Nº 3 Establezca la conclusión con respecto a Ho: Retenga Ho si valor de tabla > Valor calculado. Retenga Ho si valor de tabla < Valor calculado. Paso Nº 4
Ejercicio: Un politólogo cree que, durante los últimos años, la composición étnica de la ciudad donde vive ha cambiado. Las cifras más actuales (reunidas hace unos cuántos años) muestran que los habitantes de dicha ciudad presentan la siguiente composición étnica: 53% noruegos, 32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar esta idea, este científico social obtiene una muestra aleatoria de 750 habitantes, con los resultados que se presentan en la siguiente tabla: a). ¿Cuál es la hipótesis nula? b). ¿Cuál es la hipótesis alterna? c). ¿Cuál es la conclusión?. Utilice = 0,05.
Ejercicio: Una universidad está pensando en implantar uno de los tres sistemas de calificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado; (2) todas las calificaciones están en el sistema 4.0 y (3) 90% de las calificaciones están en el sistema 4.0 y 10% son a probados-reprobado. Se realiza una encuesta para determinar si existe una relación entre el área de interés de cada alumno y su presencia para algún sistema de calificación. Se elige una muestra aleatoria de 200 estudiantes del área ingeniería, 200 de ciencias, y 100 de bellas artes. Se pregunta a cada alumno cuál de los tres calificaciones prefieren. Los resultados aparecen en la siguiente tabla: a). ¿Cuál es la hipótesis nula? b). ¿Cuál es la hipótesis alterna? c). ¿Cuál es la conclusión?. Utilice = 0,05.
Ejercicio: Debido a la inflación galopante, el gobierno está considerando la imposición de un control de precios y salarios. Un economista del gobierno, interesado en determinar si existe una relación entre el empleo y la actitud hacia este control, reúne los siguientes datos. Los datos muestran, para cada tipo de empleo, el número de individuos en la muestra que están a favor o contra de los controles. a). ¿Cuál es la hipótesis nula? b). ¿Cuál es la hipótesis alterna? c). ¿Cuál es la conclusión?. Utilice = 0,05.
ENCUESTA Se quiere estudiar la relación que existe entre el Sexo, Grado académico y el Ingreso familiar de los docentes de la Institución Educativa de la UGEL Nº 6. Por favor responda cada ítem de la presente encuesta: Sexo: ( ) Femenino ( ) Masculino Grado académico: ( ) Bachiller ( ) Magíster ( ) Doctor ( ) Otros Ingreso familiar: ( ) Menos o iguales de S/. 550 ( ) Mayor que S/. 550 y menor que S/. 800 ( ) Mayor que S/. 800 y menor que S/.1200. ( ) Mayor que S/. 1200.