1 / 50

Contraste de hipótesis: ¿Qué es una hipótesis estadística?

Contraste de hipótesis: ¿Qué es una hipótesis estadística?. Es una conjetura o creencia acerca de una o varias poblaciones. Normalmente en referencia a sus parámetros: Media. Varianza. Proporción.

rune
Download Presentation

Contraste de hipótesis: ¿Qué es una hipótesis estadística?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Contraste de hipótesis:¿Qué es una hipótesis estadística? • Es una conjetura o creencia acerca de una o varias poblaciones. Normalmente en referencia a sus parámetros: • Media. • Varianza. • Proporción. • Si queremos contrastarla, debe establecerse antes del análisis. Después se utilizan los datos de las muestras para obtener evidencias que confirmen o no la hipótesis propuesta.

  2. Veamos un ejemplo: El efecto "Mozart vs. El Fari“: Se sospecha que los individuos rinden más en un test de inteligencia tras escuchar música de Mozart que cuando han escuchado música de El Fari. Hipótesis científica: Escuchar la música de Mozart tiene un efecto sobre el CI diferente al de la música de El Fari. Experimento: De la población española seleccionamos 20 niños al azar en dos grupos de 10. Un grupo escuchará Mozart antes de hacer el test de CI. El otro escuchará a El Fari. Después de realizar los test, se calculan las medias y cuasivarianzas en cada uno de los dos grupos.

  3. Supongamos que la media del grupo de Mozart fue 110 (y cuasivarianza = 100) mientras que la media del grupo de El Fari fue de 102 (y cuasivarianza = 64). Entonces: ¿Podemos decir que hay diferencias entre ambos grupos (a nivel poblacional)? Para tomar tal decisión necesitaremos plantear DOS hipótesis estadísticas

  4. Hipótesis estadísticas: -Hipótesis nula. Es la que proporciona la solución mássencilla. En nuestro ejemplo sería que la media poblacional de ambos grupos es la misma. (Es decir, que no hay un efecto de la música sobre el CI.) H0: m1 = m2 -Hipótesis alternativa. Es la hipótesis complementaria (y más compleja). En nuestro caso sería que la media poblacional de ambos grupos es diferente. (Es decir, que hay un efecto de la música sobre el CI.) H1: m1 ≠ m2 ¿Cómo decidimos entre ambas hipótesis? Veamos otros ejemplos.

  5. Otro ejemplo: Sometamos a la reina de Inglaterra al siguiente experimento: Se le presentan 8 tazas de té con leche, idénticas en su aspecto. En 4 de ellas la leche se añadió a la taza con anterioridad al té. Y en las 4 restantes se añadió la leche después. La reina las prueba y dictamina acertadamente las tazas en las que se sirvió primero la leche. ¿Chiripa?

  6. ¿Cuántas posibilidades había? Combinaciones de 8 elementos tomados de 4 en 4. Un total de 70 posibilidades. Si supusiéramos que respondió al azar, su probabilidad de acertar hubiera sido de 1/70. Parece razonable concluir que no acertó por suerte. ¿Cuáles son aquí las hipótesis estadísticas? -Hipótesis nula: La reina acertó por chiripa. H0: p= 1/70 -Hipótesis alternativa: La reina tiene un paladar sobrenatural. H1: p≠ 1/70

  7. Parece razonable en este caso rechazar la hipótesis nula. ¿Por qué nos parece razonable rechazar? Hemos supuesto que la reina juzgaba al azar (hipótesis nula). Por tanto hemos supuesto una distribución de probabilidad (para la hipótesis nula): cualquier combinación de las cuatro tazas tenía la misma probabilidad de ser elegida, p = 1/70 (una distribución uniforme). Con esa distribución la reina tenía 69/70 de probabilidad de no acertar. Y sin embargo la reina acertó…

  8. Otro ejemplo: Sospechamos que un dado está cargado en el 1. Es decir que la probabilidad P(1) de sacar un 1 en una tirada es mayor que 1/6. Las hipótesis estadísticas son: Ho:P(1) = 1/6 y H1:P(1) > 1/6 Realizamos el siguiente experimento: Se lanza 120 veces el dado y observamos que el número X de veces que sale un 1 es 25. X es una variable aleatoria. Si fuera cierto que P(1) = 1/6, es decir que el dado no está cargado al 1, ¿cuál sería la distribución de la variable aleatoria X?

  9. Sería una binomial: X ~ B(120, 1/6) Si X = 25, asumiendo la hipótesis nula (es decir la distribución binomial anterior con p = 1/6) esperaríamos que: ¿Dirías que está cargado?

  10. Si el suceso “obtener una proporción de 1 igual a 25/120” ocurrío cuando tenía una pequeña probabilidad de ocurrir si el dado no está cargado (una probabilidad de 0,09), es que el dado probablemente está cargado a favor del 1. Si decidimos que el dado está cargado, lo hacemos con un riesgo calculado: tenemos una probabilidad del 9% de equivocarnos. Obviamente, si no queremos tomar un riesgo tan alto, tendremos que abstenernos de declarar que el dado está cargado a favor del 1. Pero si nos abstenemos de declarar que el dado está cargado a favor del 1, será ¿con que riesgo?

  11. Dependerá con que probabilidad de estar cargado comparemos. Si el dado estuviera cargado al 1 con probabilidad p(1) = 1/3, el error sería: Si el dado estuviera cargado al 1 con probabilidad p(1) = 1/4, el error sería:

  12. Si el dado estuviera cargado al 1 con probabilidad p(1) = 1/5, el error sería:

  13. Otro ejemplo más (lo tenéis en detalle en el libro de Marta y Jose): Pasados 2 años cierta vacuna solo es eficaz en un 25% de los casos. Se experimenta con una nueva vacuna que tal vez prolongue la eficacia. Se inyecta a 20 sujetos experimentales. Si más de 8 sujetos superan el periodo de dos años sin contraer el virus, la nueva vacuna se considera mejor que la anterior. El número 8 es un tanto arbitrario, pero parece razonable teniendo en cuenta que esperaríamos 5 casos para la vacuna anterior.

  14. ¿Quién es H0? • Hipótesis nula: ambas vacunas son iguales. • Hipótesis alternativa: la nueva vacuna es mejor. Con la vacuna antigua cada paciente tiene una probabilidad p = 0.25 de no contraer la enfermedad pasados 2 años. H0: p = 0.25 y H1: p > 1/4 ¿Podemos rechazar la hipótesis nula: que las dos vacunas son igualmente eficaces? El estadístico de prueba es X = # de individuos de la prueba que reciben protección contra el virus más allá de dos años. X = B(20, p).

  15. Dividiremos los posibles valores de X (de 0 a 20) en • dos grupos: • Menores o iguales a 8 (Región de aceptación). • Mayores a 8 (Región crítica o de rechazo). • 8 es el valor crítico en este caso. Si x es el número de pacientes experimentales que no se han infectado después de 2 años, entonces: Si x > 8 rechazamos H0 a favor de la hipótesis alternativa H1. Si x ≤ 8, se acepta H0.

  16. El procedimiento descrito nos puede conducir • a las siguientes conclusiones erróneas: • La nueva vacuna realmente no es mejor • que la antigua (hemos rechazado la hipótesis • nula y cometido un error de tipo I). • (2) Concluimos que la nueva vacuna no es mejor • que la anterior, cuando realmente sí lo es (hemos • aceptado la hipótesis nula y cometido un error • de tipo II).

  17. La probabilidad de cometer un error de tipo I se llama nivel de significación o tamaño de la región crítica y se representa por a. En nuestro ejemplo: Se dice que la hipótesis nula, p = 0.25, se está probando con un nivel de significación de a = 0.0409. Nivel de significación bastante pequeño, por tanto poco probable que hayamos cometido un error de tipo I.

  18. La probabilidad de cometer un error de tipo II se representa por b. Sólo podemos calcularla si tenemos una hipótesis alternativa “concreta”. (Recuerda el caso del dado trucado). Por ejemplo en nuestro caso podíamos haber tomado como hipótesis alternativa: p = 0.5. En nuestro ejemplo:

  19. Riesgos al tomar decisiones Se juzga a un individuo por la presunta comisión de un delito • H0: Hipótesis nula • Es inocente • H1: Hipótesis alternativa • Es culpable • Los datos pueden refutarla. • La que se acepta si las pruebas no indican lo contrario. • Rechazarla por error tiene graves consecuencias. No debería ser aceptada sin una gran evidencia a favor. • Rechazarla por error tiene consecuencias consideradas menos graves que la anterior.

  20. Riesgos al contrastar hipótesis Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal • H0: Hipótesis nula • (Ej.1) Es inocente • (Ej.2) El nuevo tratamiento no tiene efecto • (Ej.3) No hay nada que destacar • H1: Hipótesis alternativa • (Ej.1) Es culpable • (Ej.2) El nuevo tratamiento es útil • (Ej. 3) Hay una situación anormal No especulativa Especulativa

  21. Tipos de error al tomar una decisión

  22. Tipos de error al contrastar hipótesis

  23. Para cualquier tipo de test hay 3 resultados posibles: (1) - Se toma una decisión correcta, es decir se rechaza una hipótesis falsa o no se rechaza una hipótesis verdadera. (2) - Se rechaza una hipótesis verdadera. (3) - No se rechaza una hipótesis falsa. El error de rechazar H0 cuando es verdadera se denomina ERROR DE TIPO I. El error de no rechazar H0 cuando es falsa se denomina ERROR DE TIPO II. Asociados a cada uno de estos errores hay una probabilidad que indicamos como a y b. Idealmente deseamos mantener ambas probabilidades lo mas bajas posibles.

  24. No se puede tener todo a b • Para un tamaño muestral fijo, no se pueden reducir a la vez ambos tipos de error. • Para reducir b, hay que aumentar el tamaño muestral.

  25. Contraste de hipótesis: Los tres pasos básicos para contrastar una hipótesis serán: 1- Formular dos hipótesis H0 y H1. 2- Derivar un estadístico de contraste a partir de la muestra de observaciones e identificar su distribución muestral bajo la hipótesis nula. 3- Derivar una regla de decisión y elegir una de las dos hipótesis en base a la evidencia de una muestra. Una regla de decisión que selecciona una de las dos sentencias siguientes: “rechace H0” o “no rechace H0”.

  26. El primer paso consiste en formular la hipótesis nula (H0) y la hipótesis alternativa (H1 o HA). Por ejemplo: a) H0)  = 0 vs. H1)  = 1 b) H0)  = 0 vs. H1) 0 c) H0)   0vs.H1)  > 0 d) H0)   0vs.H1)  < 0

  27. Recordemos el ejemplo del “Efecto Mozart vs. El Fari”. -Hipótesis nula. No hay un efecto de la música sobre el CI. H0: m1 = m2 -Hipótesis alternativa. Hay un efecto de la música sobre el CI. H1: m1 ≠ m2

  28. Para el ejemplo de Mozart calcularemos el estadístico de contraste a partir de los datos de la muestras (las medias, cuasivarianzas y tamaños muestrales). Supongamos que el valor del estadístico de contraste es 3,90. 1) Si se cumplen una serie de supuestos estadísticos (que la distribución poblacional es normal o la muestra n > 30, por ejemplo) 2) y asumimos que la hipótesis nula es cierta: entonces, conoceremos cuál es la distribución muestral del estadístico de contraste. En el caso de Mozart, el estadístico de contraste Femp seguirá una distribución F de Fisher: F1,18 (con 1 grado de libertad en el numerador y 18 grados de libertad en el denominador).

  29. DISTRIBUCIÓN MUESTRAL F1,18 Distribución muestral con 50.000 réplicas del experimento. Asumiendo que la H0 es cierta.

  30. El rango de valores del estadístico T para los cuales el procedimiento del test recomienda rechazar H0 se denomina “región crítica” y el rango donde se recomienda no rechazar H0 se denomina “región de aceptación”, como comentamos. En la gráfica de la distribución del estadístico tendremos

  31. Región de aceptación de H0 Región crítica o de rechazo de H0 Para decidir si el valor es "razonable" dentro de tal distribución muestral (que es la de H0), se elige un valor crítico (Fteórica) que deje a su izquierda el 95% de los datos (es la región de aceptación de la H0) y a su derecha el 5% de los datos (es la región de rechazo de H0). Si vamos a las tablas de F (percentil 95), vemos que el valor crítico es de 4.414. Por tanto, si nuestra Femp es menor que 4.41 mantenemos la H0, y si nuestra Femp es mayor que 4.41 rechazamos la H0.

  32. La decisión en nuestro caso: Como la F empírica (3.9) no ha superado el valor crítico (4.41), mantenemos la hipótesis nula. Por tanto concluimos que el CI de los individuos no difiere cuando oímos la música de Mozart respecto a la música de El Fari, F(1,18) = 3.9, p > 0.05. Fijaros que si la hipótesis nula es cierta, la rechazaremos en un promedio de 5 de cada 100 experimentos. Es la llamada probabilidad de error tipo I: la probabilidad de rechazar la hipótesis nula siendo ésta verdadera.

  33. El valor de significación "p" Además del valor del estadístico de contraste Femp = 3,9. Disponemos también del valor de probabilidad p, que representa, asumiendo que H0 sea cierta, la probabilidad de obtener una Femp tan extrema o más que la que hemos obtenido. En nuestro ejemplo, p fue 0,064. 0.064 3.9

  34. Fijaros que si el nivel de significación p es menor de 0'05 implica que hemos superado el valor crítico. Por tanto si p es menor que 0'05, entonces rechazamos la hipótesis nula. De la misma manera, si p es mayor de 0'05 ello implica que no hemos superado el valor crítico, en tal caso, aceptamos la hipótesis nula. REGIÓN MANTENIMIENTO H0 REGION DE RECHAZO H0 0.05 0.064 4.41 3.9 Femp Valor crítico

  35. En el ejemplo de comparación de medias de dos grupos, hemos efectuado una prueba F. Sin embargo, podríamos haber efectuado una prueba t de Student. Las conclusiones serían las mismas: 1) El valor de la t empírica sería la raíz cuadrada de la F empírica. 2) El valor de probabilidad p sería el mismo en ambos casos. Por tanto, cuando comparamos las medias de dos grupos, ambas pruebas son posibles y dan esencialmente el mismo resultado. No obstante, la mayoría de autores prefieren indicar la t de Student cuando hay dos grupos. La prueba F sirve para -conjuntamente- medias de 2, 3, 4 grupos, etc; la prueba t sólo sirve para comparar 2 medias de 2 grupos.

  36. Región crítica Valores ‘improbables’ si... Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 Nivel de significación: a Número pequeño: 1% , 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H0 cuando es cierta Región crítica y nivel de significación a=5% Reg. Crit. Reg. Crit. No rechazo H0 H0: m = 40

  37. Contrastes: unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa H1: m ¹ 40 Bilateral Unilateral Unilateral H1: m < 40 H1: m > 40

  38. Valor-p Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p > a. Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. No se rechaza H0: m = 40. P a

  39. Valor-p Se rechaza H0: m = 40 Se acepta H1: m > 40 a

  40. Valor-p El contraste es estadísticamente significativo cuando p < a Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. Se rechaza H0: m = 40 Se acepta H1: m > 40 a P

  41. Sobre a Es número pequeño, preelegido al diseñar el experimento. Conocido a sabemos todo sobre la región crítica. Sobre p Es conocido tras realizar el experimento. Conocido p sabemos todo sobre el resultado del experimento. Resumen: a, p y criterio de rechazo • Sobre el criterio de rechazo • Contraste significativo = p < a.

  42. Potencia de un contraste La potencia de un contraste es la probabilidad de rechazar la hipótesis nula cuando ésta sea falsa. Es por tanto 1 - b. Se suele considerar OK una potencia de al menos 0'80 (es decir, asumiendo 100 experimentos en que hay un efecto real, lo detectaríamos -en promedio- 80 veces.) La potencia de una prueba AUMENTA cuando aumentamos el tamaño muestral. La potencia de una prueba AUMENTA cuando el tamaño del efecto aumenta. La potencia de una prueba DISMINUYE cuando reducimos la probabilidad de error de tipo I (a). Es decir, si a = 0'01 en lugar de 0'05, los valores críticos son algo más extremos y necesitaremos un valor del estadístico de contraste mayor para rechazar la hipótesis nula.

  43. Contrastes para la media de una población (Población normal o n> 30 y s conocida) Hipótesis bilateral 1 -  Ho: m = m0 H1: mm0 + z/2 - z/2 Estadístico Si la media muestral está fuera de este intervalo rechazamos H0 y aceptamos en caso contrario. Región de aceptación.

  44. Ejemplo: • Hipótesis: • Distribución de la estadística de prueba: se sabe que tiene distribución normal con media = 0 y varianza = 1. • Regla de decisión: Ho se rechaza si zcalc cae en la zona de rechazo, utilizando  = 0.05 (error de tipo I) que está dividida en dos partes iguales (/2 = 0.025). • Valor crítico de la estadística de prueba: Se busca en la tabla z, y nos preguntamos que valor de z tiene una probabilidad igual a 0.025 y es valor es 1.96.

  45. Cálculo del estadístico de prueba: • Decisión estadística: Se puede rechazar Ho porque -2.12 está en la región de rechazo con un nivel de significación de  = 0.05. • Conclusión: Se concluye que  no igual a 30. • Valor de p: Busco en la tabla que valor de probabilidad tiene -2.12 y da 0.017 y en ejemplo debemos sumar dos veces por las dos colas y se dice que la hipótesis se rechaza con un valor de p igual a 0.0340.

  46. Contrastes para la media de una población (Población normal o n> 30 y s conocida) Hipótesis unilateral por la izquierda. 1 -  Ho: m = m0 H1: m<m0 - z Estadístico Si la media muestral está fuera de este intervalo rechazamos H0 y aceptamos en caso contrario. Región de aceptación.

  47. Datos y suposiciones las mismas anteriores. • Hipótesis: • Cálculo del estadístico de prueba: • Regla de decisión: Si el zcalc cae en la zona de rechazo se rechaza Ho. Como es una prueba de una cola o unilateral se busca en la tabla que valor de z tiene una probabilidad de 0.05 y es -1.645. • Decisión estadística y Conclusión: Como -2.12 es menor que -1.645 se rechaza Ho y se concluye que la media de la población es menor de 30 años.

  48. Contrastes para la media de una población (Población normal y sDESCONOCIDA) Hipótesis bilateral Ho: m = m0 H1: mm0 Estadístico Si la media muestral está fuera de este intervalo rechazamos H0 y aceptamos en caso contrario. Región de aceptación.

  49. Hipótesis: • Estadística de prueba: dado que se desconoce la varianza de la población se utiliza s2. • Distribución de la estadística de prueba: distribuye t de Student con n-1 grados de libertad. • Regla de decisión: A un nivel de significancia de =0.05, si el valor de tcalc es mayor que tcrítico (2.1604) entonces se rechaza H0. • Cálculo de la estadística de prueba: • Decisión estadística: -1.58 cae en la zona de no rechazo por lo tanto no se rechaza H0.

  50. Mirar en los apuntes también: Comparación de medias Pruebas sobre proporciones Pruebas sobre varianzas

More Related