270 likes | 459 Views
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas. Curso de Elementos de Estadística Prof. María Pilar Sánchez Clase Nº7: Distribuciones Chi-cuadrado - F de Fisher Introducción a la inferencia. Primavera, 2002. Distribución Chi-Cuadrado.
E N D
Universidad de ChileFacultad de Ciencias Químicas y Farmacéuticas Curso de Elementos de Estadística Prof. María Pilar Sánchez Clase Nº7: Distribuciones Chi-cuadrado - F de Fisher Introducción a la inferencia. Primavera, 2002
Distribución Chi-Cuadrado Esta es una de las distribuciones más usadas en la estadística, ya sea en: • la estimación y • pruebas de hipótesis para el cálculo de los intervalos de confianza para la varianza de una población y • de probar hipótesis en las pruebas de asociación (tablas de contingencia) y la bondad de ajuste.
Requisitos y características • Es una distribución asimétrica. • Sólo toma valores positivos y es asintótica con respecto al eje de los x positivos (0 < X2 < ∞) • Está caracterizada por el número de desviaciones independientes, es decir, de los grados de libertad que generalmente se designa por "n". • Se ocupa principalmente en la bondad de ajuste, independencia y homogeneidad. • El área comprendida entre la curva y el eje de las x es 1 o 100%
Ejemplo… • Es una prueba que se puede emplear en datos de enumeración que resultan de un proceso de conteo, por ejemplo, ser el fruto de una encuesta y en la cual los valores son asignados en categorías específicas y no toman cualquier valor como en el caso de un dato de medición. • La magnitud del valor de chi-cuadrado se determina como lasuma de los cuadrados de las diferencias absolutasentre cada frecuencia observada y su frecuencia asociada esperada, dividida por la frecuencia esperada. Así se tiene : 2 = [(Oi - Ei) 2/(E)]
chi-cuadrado El valor 2 es una medida del grado con el que los pares de frecuencias observadas y esperadas concuerdan en una situación dada, cuando hay una congruencia grande y estrecha, el valor de chi cuadrado es muy pequeño y cuando la congruencia es pobre el valor es muy grande (esto nos indica que ya un valor grande causa rechazo). La frecuencia observada O es aquella que se obtiene de la frecuencia observada sobre el dato experimental, la frecuencia esperada E es aquella que se espera y se basa en una idea preconcebida o hipótesis a priori (se le asigna o supone una probabilidad conocida).
Chi-cuadrado… • Diferencias grandes producirán un valor grande y mayor de chi-cuadrado; diferencias más pequeñas producirán valores menores de chi-cuadrado y si no hay diferencias entonces chi-cuadrado tomará el valor de cero .
Recordar… • La prueba chi-cuadrado se basa en una variable discreta. Es importante recordar y tener siempre en mente que: • Sólo se pueden analizar datos provenientes de frecuencias, no es posible aplicar esta técnica a datos que existen en forma de porcentajes o proporciones, sin embargo, en algunos casos se puede efectuar un arreglo y convertir proporciones en frecuencias y así entonces aplicar la prueba.
Distribución F de Fisher • El nombre de esta distribución se debe a R. A. Fisher, quién primero la desarrolló y describió. La prueba fse utiliza principalmente para probar la igualdad entre dos varianzas. • Se puede observar, que esta prueba para la igualdad de varianzas se utiliza generalmente para probar la igualdad entre tres o más medias. • Cuando se procede a realizar la inferencia estadística para probar igualdad entre 3 o más medias comúnmente se denomina análisis de varianza. El que implica medir la variabilidad de las medias de las muestras obtenidas a partir de las poblaciones problema.
Distribución F de Fisher • Cuando se tiene interés en comparar varianzas, se puede recurrir a la variable aleatoria f, que es la razón de los estimadores insesgados de dos varianzas poblacionales esto es: • Por ejemplo se pueden dar múltiples problemáticas en que requiere de esta prueba; comparar metodologías, o cualquier variable.
Distribución F de Fisher • La distribución f tiene dos parámetros: los números de grados de libertad que se denotan con el símbolo 1 y 2 . • El parámetro 1 está asociado con el numerador de la razón f; esto es s21, estimador insesgado de la varianza 21 de la población 1. • La varianza s21 , se obtiene a partir de una muestra de n1 observaciones tomadas aleatoriamente a partir de la población 1.
Distribución F de Fisher • Puesto que la suma de las desviaciones a partir de la media muestral, al cuadrado, para s21 tiene (n-1) grados de libertad, el parámetro 1 es igual a (n1 - 1), así también el parámetro 2 es igual a (n2 - 1), de modo semejante, 2 está asociado con el denominador de la razón f; esto es, s22 , estimador insesgado para la varianza 22 de la población 2.
Distribución F de Fisher • La varianza s22 se obtiene a partir de una muestra de n2 observaciones tomadas aleatoriamente a partir de la población 2. • La distribución f se denota con dos subíndices, el primero corresponde a 1 y el segundo a 2
Propiedades • El estadístico de prueba toma solamente valores no negativos, debido a que tanto numerador y denominador de la razón f son varianzas, las que NO pueden ser valores negativos. • El valor de F varía de cero a infinito, sin embargo en la practica se considera a 1 como límite inferior del valor F, debido a que siempre es posible utilizar la mayor varianza muestral como numerador de forma que la relación F no sea menor que 1. El límite superior del valor F rara vez es de más de unos cuantos dígitos en la mayor parte de las situaciones. Ejemplo, una f(0.05;20;24) = 2.03 con un alfa =0.05.
Propiedades • La tabla f se construye en base a que el numerador de la razón F es mayor que el denominador, y luego los valores de f generalmente son mayores que 1 y tienden a 1 cuando tanto 1 y 2 tienden a infinito. • Bajo la Ho, de que las dos varianzas poblacionales son iguales, se espera que las varianzas de dos muestras cualesquiera tomadas respectivamente a partir de las dos poblaciones sean iguales también.
Propiedades • Sin embargo, a pesar que si la hipótesis nula es verdadera, debido a la naturaleza aleatoria del muestreo las dos varianzas muestrales es muy posible difieran una de otra. • Mientras mayor sea la diferencia entre las dos varianzas muestrales, mayor será la magnitud en que el estadístico de prueba F esté por encima de 1. • La hipótesis nula Ho, se rechaza solamente cuando el valor del estadístico de prueba F es suficientemente mayor que 1.
Ejemplo… • Si se quiere determinar las diferencias entre dos metodologías en la educación a pacientes: una basada en la lectura de trípticos y otra basada en el apoyo profesional complementada con trípticos. • Si asignamos la población 1 a todos aquellos pacientes que aprenden empleando el método de lectura con varianza 21 y la población 2 de los pacientes que aprenden con el método “asistencia profesional complementaria", con varianza, 22 . • Ho: 21 = 22
• Nota: Cuando s21 es mayor que s22, no hay dificultad en probar la hipótesis nula de Ho: 21 =22 en contra de H1: 21 > 22 , pues sólo se divide la mayor varianza entre la menor y después se compara con el valor de tabla, sin embargo, la practica de considerar a s21 como numerador de la razón es solamente adecuada cuando es la mayor de las dos varianzas muestrales en una prueba de una cola. Cuando se desea probar la hipótesis de igualdad de varianza en contra de que hay diferencias entonces, se divide entre dos, esto es, se utiliza /2 como nivel de significación y se realiza la prueba como si fuera de una cola.
Inferencia estadística • A continuación veremos algunos conceptos relacionados con el proceso de la inferencia que nos permitirán aplicar todas las distribuciones vistas anteriormente. • Todo este ejercicio lo haremos a través de conocer los que es la docimasia de una hipótesis, una hipótesis, los tipos de hipótesis, y como nos ordenamos para seguir una secuencia ordenada en estos procedimientos.
Inferencia estadística • Docimasia de Hipótesis • La docimasia de hipótesis es uno de los recursos que emplea la estadística para generalizar el conocimiento obtenido en la muestra a toda la población. Su método consiste en suponer valores de parámetros poblacionales y formular normas de decisión que permitan aceptar o rechazar tales valores
Hipótesis estadística Los investigadores trabajan con dos tipos de hipótesis, las hipótesis de investigación y las hipótesis estadísticas: • la hipótesis de investigación es la conjetura o suposición que motiva la investigación y que conduce en forma directa a la hipótesis estadística, que se establece en forma tal que se puede evaluar a través de diferentes pruebas especializadas. Como procedimiento didáctico observemos la siguiente secuencia a modo de establecer un ordenamiento que nos sirva para entendermejor estos conceptos:
Elementos de la inferencia • Datos: El tipo de dato u observación debe ser conocido y establecida su naturaleza, ya que esto determina la base del procedimiento de la prueba en particular a usarse. Es posible establecer si fueron frutos de conteos o bien de medidas (esto diferencia entre una variable de tipo discreta de una de tipo continua).
Elementos de la inferencia • Suposiciones : Las suposiciones tienen importancia tanto en la estimación ya que conduce a modificaciones en el cálculo de los intervalos de confianza como en las pruebas de hipótesis ya que incluyen con gran frecuencia suposiciones acerca de la normalidad de la distribución de la población, la igualdad de las varianzas e independencia de las muestras, lo que determina el procedimiento a usar.
Elementos de la inferencia • Hipótesis : En todo tipo de prueba de hipótesis hay dos tipos de hipótesis con las que se trabaja y las que deben enunciarse en forma explícita; la primera es la llamada : hipótesis nula, designada por el símbolo Ho, correspondiente a la hipótesis que debe probarse y que propone diferencia o no respecto de la población, Casi siempre se enuncia de tal forma que tenga que ser rechazada, así el complemento de la conclusión a la que el investigador quiere llegar se transforma en el enunciado de la hipótesis nula, la que podrá ser rechazada o aceptada.
Elementos de la inferencia Si la hipótesis nulano se rechaza,se dirá que los datos disponibles no proporcionan evidencia suficiente que provoque el rechazo, En cambio si la hipótesis nulase rechaza se concluyeque los datos disponibles no son compatibles con la hipótesis nulapero que se pueden apoyar en la llamada hipóteis alternativa
Elementos de la inferencia • hipótesis alternativay que es el segundo tipo de hipótesis, designándose como H1 o HA. • Es bueno considerar que cuando se acepta una hipótesis nula,no debemos decir que es verdadera sino que puede ser verdadera,puesto que lo que probamos sencillamente es si los datos disponibles apoyan o no a las hipótesis planteadas, luego debemos tener siempre presente esta limitación.
Elementos de la inferencia • Estadística de prueba : La estadística de prueba es alguna estadística que se pueda calcular a partir de los datos de la muestra. Por ejemplo puede ser z, W* (de Wilcoxon), etc. • Distribución de la estadística de prueba : Es clave fundamental para la inferencia estadística es decir es la base para las pruebas aplicadas. • Regla de decisión : La estadística de prueba puede tomar distintos valores los que determinan puntos en el eje horizontal de la gráfica y se dividen en dos áreas, una de ellas se conoce comoregión de aceptación y la otra como región de rechazo.