230 likes | 487 Views
Pruebas de hipótesis. ¿Qué son las pruebas de hipótesis?. Hipótesis (formulación coloquial) Las mujeres fuman más que los hombres Hipótesis (en términos estadísticos) La proporción de mujeres que fuman es superior a la proporción de hombres que fuman Observación
E N D
¿Qué son las pruebas de hipótesis? • Hipótesis (formulación coloquial) • Las mujeres fuman más que los hombres • Hipótesis (en términos estadísticos) • La proporción de mujeres que fuman es superior a la proporción de hombres que fuman • Observación • Proporción de mujeres y hombres fumadores en una muestra
¿Qué son las pruebas de hipótesis? • Decisión (prueba de hipótesis) • Si las observaciones son compatibles con la hipótesis (al menos dentro de un margen razonable), decidimos aceptar la hipótesis. • En caso contrario la rechazamos. • La variabilidad de las muestras determina que debamos utilizar métodos estadísticos que permitan una evaluación adecuada de los resultados.
Definiciones • Tipos de hipótesis • En el caso anterior la hipótesis de que las mujeres fuman más que los hombresconlleva una hipótesis complementaria • También podemos considerar la hipótesis de igualdad de proporciones (es decir que hombres y mujeres fuman por igual)
Definiciones • Hipótesis nula • Una hipótesis restrictiva respecto a los parámetros • Hipótesis alternativa • Indica una diferencia en un determinado sentido. P.e.:
Definiciones • Contraste de hipótesis • En función del problema que se quiere evaluar, se define una hipótesis nula (H0) y una alternativa (H1). P.e.: • La prueba de hipótesis consiste en evaluar si los resultados observados se separan significativamente de los esperados bajo la hipótesis nula.
Supongamos que un determinado laboratorio ha desarrollado un tratamiento que, según ellos, tiene una efectividad de un 70%. En un ensayo clínico con 25 individuos observamos que sólo 15 mejoran (un 60%). ¿podemos concluir que la efectividad es menor del 70%? Si la efectividad es del 70% esperamos que mejoren 17.5 pacientes. Ejemplo introductorio
¿Es posible observar solo 15 mejoras en un grupo de 25 pacientes si la efectividad es del 70%? Ejemplo introductorio Probabilidad de observar un número determinado de mejoras en un grupo de 25 pacientes si P(M)=0.7 (Distribución B(25, 0.7))
¿Es posible observar solo 15 mejoras en un grupo de 25 pacientes si la efectividad es del 70%? Ejemplo introductorio • La probabilidad de que mejoren 15 pacientes de 25 cuando la efectividad del tratamiento es del 70% es: • Es decir, de cada 100 ensayos clínicos que realicemos, 9 tendrán un resultado de 15 mejoras. Este es un resultado que no es incompatible con el hecho de que la probabilidad de mejore sea 0.7.
¿Es posible observar solo 15 mejoras en un grupo de 25 pacientes si la efectividad es del 70%? Ejemplo introductorio • En una prueba de hipótesis calculamos cuál es la probabilidad de observar un resultado igual o peor al obtenido según lo que se espera de la hipótesis nula (grado de significación). Por lo tanto, en este caso calcularíamos: • Es decir, de cada 100 ensayos clínicos que realicemos, esperamos obtener un 19% de ensayos con 15 o menos mejoras si la efectividad es del 70%. • En este caso se interpreta que el resultado observado no se aleja significativamente de lo esperado según la hipótesis nula.
Definiciones • Estadístico de una prueba • Función muestral que permite evaluar si los resultados se comportan según lo esperado por la hipótesis nula • Grado de significación • Probabilidad de haber obtenido un resultado igual al observado o más alejado que el observado según lo esperado por la hipótesis nula. • Nivel de significación • Valor límite del grado de significación para considerar aceptable la hipótesis nula (en general se fija en 0.05). • Región crítica • Fijado un nivel de significación, conjunto de resultados que llevan a rechazar la hipótesis nula • Región crítica óptima • De todas la regiones críticas de un cierto nivel de significación, la región crítica óptima es el conjunto de resultados más probable cuando la hipótesis nula es falsa • Potencia • Probabilidad de observar resultados de la región crítica cuando la hipótesis nula es falsa. La región crítica óptima es la que tiene más potencia para un cierto nivel de significación.
Ejemplo de región crítica • Hipótesis: La efectividad (E) del tratamiento es inferior al 70% • Hipótesis estadísticas • Nivel de significacióna = 0.05. Debemos determinar un conjunto de resultados que tengan una probabilidad inferior a 0.05 si la hipótesis nula es cierta. • Estos resultados deben ser muy probables (potencia) si la hipótesis nula es falsa • Por lo tanto, como la alternativa es que la eficacia es inferior al 70%, resultados inferiores a un 70% de mejoras van en detrimento de la hipótesis nula.
Ejemplo de región crítica • Región crítica:Si es cierta la hipótesis nula, entonces el número de mejoras debe seguir una distribución binomial: B(n,0.7), siendo n el tamaño del grupo donde se evalúa la eficacia. • Para determinar la región crítica, buscaremos un valor x que cumpladado que un número bajo de mejoras va a favor de la alternativa propuesta. • Para n=25, este valor es(como es una v.a. discreta no podemos obtener exactamente 0.05) • Por lo tanto, la región crítica queda definida por un número de mejoras igual o inferior a 13.
Utilización de la región crítica • Hemos visto, en el caso de n=25, que la región crítica corresponde a un número de mejoras igual o inferior a 13. • Por lo tanto, si observamos un número de mejoras igual o inferior a 13 rechazamos la hipótesis nula (ya que este suceso tiene una probabilidad baja, en este caso 0.044). • Si observamos un número de mejoras superior a 13, entonces diremos que los resultados no se desvían significativamente de lo esperado según la hipótesis nula.
El concepto de potencia • La potencia de una región crítica es la probabilidad de observar resultados dentro de dicha región cuando la hipótesis nula es falsa. • En el ejemplo que hemos estudiado, la potencia se calcularía como • Su valor depende del valor de P(E) (que si la hipótesis nula es falsa es inferior a 0.7).
p P(X≤13) El concepto de potencia El valor de la potencia, en el ejemplo indicado, depende de P(E) P(X≤13) p
p P(X≤13) El concepto de potencia • Si en realidad P(E)=0.5, entonces observaremos valores iguales o inferiores a 13 mejoras en un 65.5% de los ensayos que realicemos • Es decir, en un 34.5% de los ensayos el número de mejoras será superior a 13 y entonces aceptaremos la hipótesis nula (efectividad de un 70%) cuando es falsa. • Con 25 individuos, la potencia no es suficiente para asegurar que podemos diferenciar una eficacia del 50% y una eficacia del 70%. • Para aumentar la potencia debemos aumentar el número de individuos en el ensayo clínico.
El concepto de región crítica • La potencia aumenta al aumentar el tamaño muestral • Para n=50, la región crítica es (X≤29) con a=0.048 • Para n=100, la región crítica es (X≤62) con a=0.053 50 100 25
El concepto de región crítica • Para n=100, la región crítica es (X≤62) con a=0.053 • Ahora, si P(E)=0.5, un 99% de los ensayos producirán menos de 62 mejoras y rechazaremos la hipótesis nula p P(X≤62)
El concepto de grado de significación • Para la hipótesis nula que establece que la efectividad es del 70%, la región crítica (X≤62) tiene un nivel de significación de 0.053 para muestras de 100 individuos. • Si en una muestra de 100 individuos observamos 58 mejoras, entonces rechazamos la hipótesis nula. • El grado de significación seria: • Es decir, el grado de significación corresponde a la probabilidad de haber obtenido un resultado igual al obtenido o más alejado que el obtenido según lo que se espera de la hipótesis nula.
El concepto de grado de significación • Si el grado de significación de un resultado es inferior al nivel de significación que se considere, entonces el resultado cae dentro de la región crítica. • En este sentido, el grado de significación permite conocer si el resultado observado es o no de la región crítica. • Por lo tanto, dado un nivel de significación a, y un grado de significación p para un resultado:
Resumen • En cada problema concreto debemos establecer la hipótesis nula y la alternativa (unilateral o bilateral). • Debemos determinar qué estadístico es el más adecuado para evaluar la hipótesis (cada tipo de problema tiene un estadístico adecuado). • Debemos establecer la región crítica en función del nivel de significación considerado. • Una vez establecido, se determina si las observaciones caen o no dentro de la región crítica. • Si caen dentro de la región crítica, entonces se rechaza la hipótesis nula (las diferencias respecto a los resultados esperados son significativas). En caso contrario, se concluye que las diferencias entre las observaciones y lo esperado según la hipótesis nula no son significativas. • Es conveniente calcular el grado de significación del resultado.