500 likes | 713 Views
Especialización en Estadística Aplicada. Estadística Inferencial Prueba de Hipótesis. Hipótesis. ¿Qué son las Hipótesis? Son conjeturas lógicas acerca de la solución de un problema. Son explicaciones tentativas del fenómeno investigado formuladas a manera de proposiciones.
E N D
Especialización en Estadística Aplicada Estadística Inferencial Prueba de Hipótesis
Hipótesis ¿Qué son las Hipótesis? • Son conjeturas lógicas acerca de la solución de un problema. • Son explicaciones tentativas del fenómeno investigado formuladas a manera de proposiciones. • Nos indican lo que estamos buscando o tratando de probar.
Hipótesis • ¿Qué características debe tener una hipótesis? • Las hipótesis deben referirse a una situación real. • La relación entre las variables debe de ser clara y verosímil. • Deben ser medibles y observables. • Deben estar relacionadas con técnicas disponibles para probarlas.
Hipótesis • Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación. • Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados • Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.
Hipótesis • Hipótesis: Afirmación o conjetura acerca de una o más poblaciones • Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis
Hipótesis • La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla • El rechazo implica que la evidencia de la muestra refuta la hipótesis
Tipos de Hipótesis • Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población • Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0
Formulación de Hipótesis • Partes de una Hipótesis • Variable 1 y variable 2 o variable independiente y variable dependiente. • Unidad de análisis. • Conectores lógicos
Formulación de Hipótesis • ¿Qué tipos de hipótesis hay? • Hipótesis de Investigación. • Hipótesis nula. • Hipótesis alternativas. • Hipótesis “estadísticas”.
Formulación de Hipótesis • Hipótesis de Investigación (Hi) • Hipótesis descriptiva del valor de una variable o variables. • Hipótesis de asociación • Hipótesis Correlacionales • Hipótesis que establecen relaciones de causalidad • Hipótesis de la diferencia entre grupos
Formulación de Hipótesis • Hipótesis Nula (H0) • Sirven para refutar o negar lo que afirma la hipótesis de investigación. • Hay tantos tipos de hipótesis nulas como de investigación. • Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.
Formulación de Hipótesis • Hipótesis alternativas (Ha o H1) • Son posibilidades “alternas” ante las hipótesis de investigación y nula. • Pueden ser más de una. • Son las hipótesis que se aceptan en caso de rechazar la hipótesis nula
Formulación de Hipótesis • Hipótesis “Estadísticas”. • Son las transformaciones de las hipótesis de investigación, nulas y alternativas en símbolos estadísticos. • Del valor de una variable• De asociación.• De correlación.• De relaciones causales.• De diferencia de grupos.
Prueba de Hipótesis • Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula • Errores • Error tipo I: • Rechazar afirmaciones (H0) verdaderas • Error tipo II: • Aceptar afirmaciones (H1) falsas
Definiciones • Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera • Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera • α = P(E.T.I) • β = p(E.T.II) • Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo
Proceso • Establecer H0: θ = θ0 • Seleccionar H1: • H1: θ ≠ θ0 ;H1: θ < θ0 ;H1: θ > θ0 • Seleccionar el nivel de significación: α • Seleccionar el estadístico de prueba apropiado y establecer la región crítica • Calcular el valor del estadístico de prueba con los datos muestrales • Tomar la decisión
Razonamiento básico Si supongo que H0 es cierta... ¿qué hace un científico cuando su teoría no coincide con sus predicciones? ...el resultado del experimento sería improbable. Sin embargoocurrió.
Razonamiento básico Si supongo que H0 es cierta... Rechazo que H0 sea cierta. ...el resultado del experimento sería improbable. Sin embargoocurrió.
Razonamiento básico • No hay evidencia contra H0 • No se rechaza H0 • El experimento no es concluyente • El contraste no es significativo Si supongo que H0 es cierta... ¿Si una teoría hace predicciones con éxito, queda probado que es cierta? ...el resultado del experimento es coherente.
Región crítica Valores ‘improbables’ si... Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 Nivel de significación: a Número pequeño: 1% , 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H0 cuando es cierta Región crítica y nivel de significación a=5% Reg. Crit. Reg. Crit. No rechazo H0 H0: m=40
Contrastes: unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa H1: m¹40 Bilateral Unilateral Unilateral H1: m<40 H1: m>40
Significación: p a H0: m=40
Significación: p No se rechaza H0: m=40 a H0: m=40
Significación: p Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>a P a No se rechaza H0: m=40 P a
Significación : p Se rechaza H0: m=40 Se acepta H1: m>40 a
Significación : p El contraste es estadísticamente significativo cuando p<a Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. a P Se rechaza H0: m=40 Se acepta H1: m>40 a P
Sobre a Es número pequeño, preelegido al diseñar el experimento Conocido a sabemos todo sobre la región crítica Sobre p Es conocido tras realizar el experimento Conocido p sabemos todo sobre el resultado del experimento Resumen: a, p y criterio de rechazo • Sobre el criterio de rechazo • Contraste significativo = p menor que a
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas sobre la media de una población
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas sobre la media de una población Sea X1, X2, … Xn una muestra aleatoria de tamaño n de una población normal con media µ y varianzaσ2 • Estadístico de prueba: • σ2Conocida: • σ2Desconocida:
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre dos Muestras Independientes
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre dos Muestras Independientes • Estadístico de prueba: • Varianzas conocidas: • Varianzas desconocidas iguales: Se toman dos muestras independientes de dos poblaciones normales con medias µ1 y µ2 y varianzasσ12 y σ22
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre dos Muestras Independientes • Estadístico de prueba: • Si las varianzas son distintas y desconocidas se utiliza la aproximación de Snedecor-Cochran:
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre dos Muestras Pareadas (dependientes)
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre dos Muestras Pareadas (dependientes) • Estadístico de prueba: • σ2Conocida: • σ2Desconocida: Sobre cada unidad experimental se toman dos mediciones Se define la variable aleatoria: Di = Xi - Yi
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis con respecto a proporciones (muestras grandes)
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis con respecto a proporciones (muestras grandes) • Estadístico de prueba: • Se utiliza la aproximación normal • Para la prueba de la diferencia entre dos proporciones se utiliza el estadístico:
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre la Varianza
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre la Varianza Sea X1, X2, … Xn una muestra aleatoria de tamaño n de una población normal con media µ y varianzaσ2
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre las Varianzas de dos Poblaciones
Pruebas de Hipótesis cundo se muestrea de poblaciones normalesPruebas de Hipótesis sobre las Varianzas de dos Poblaciones X1, X2, … Xn una muestra aleatoria de tamaño n1 de una población normal con media µ1 y varianzaσ12 Y1, Y2, … Yn una muestra aleatoria de tamaño n2 de una población normal con media µ2 y varianzaσ22
Pruebas de Independencia • H0: La clasificación A es independiente de la B • H1: Las clasificaciones son dependientes
Pruebas de Independencia • Estadístico de Prueba • Grados de libertad: υ = (r-1)(c-1) • Decisión: Rechazar H0 si χ2 > χ2α
Análisis de Varianza • Objetivo: Comparar dos o más poblaciones para establecer si el promedio es similar o difiere significativamente • H0: μ1=μ2=μ3= . . . =μk • H1: Al menos un promedio es diferente
Análisis de Varianza • Datos
Análisis de Varianza • Variación Total = Variación entre Grupos + Variación dentro de los grupos STC = SCEG + SCDG
Ejemplo: Resultados en un test aplicado a estudiantes de cuatro colegios. ¿Hay diferencias significativas entre los colegios?