580 likes | 1.08k Views
Inferencia Estadística. Tema 7. Descripción breve del tema. Introducción Intervalos de Confianza Determinación del tamaño muestral Contrastes de hipótesis Generalidades de los contrastes Metodología del contraste Región de rechazo y p -valor Relación entre ICs y contrastes de hipótesis
E N D
Inferencia Estadística Tema 7 Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Introducción • Intervalos de Confianza • Determinación del tamaño muestral • Contrastes de hipótesis • Generalidades de los contrastes • Metodología del contraste • Región de rechazo y p-valor • Relación entre ICs y contrastes de hipótesis • Algunos contrastes particulares Depto. Estadística, Universidad Carlos III
Objetivos • Estudio de la estimación mediante conjuntos, los Intervalos de Confianza. • Realización de contrastes de hipótesis estadísticas con niveles de significación fijados de antemano y mediante p-valores. Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Introducción • Intervalos de Confianza • Determinación del tamaño muestral • Contrastes de hipótesis • Generalidades de los contrastes • Metodología del contraste • Región de rechazo y p-valor • Relación entre ICs y contrastes de hipótesis • Algunos contrastes particulares Depto. Estadística, Universidad Carlos III
Introducción Una hipótesis es cualquier afirmación con la que expresamos una creencia sobre una distribución poblacional. Un contraste de hipótesis es una prueba estadística que nos indica si debemos rechazar (o no) tales afirmaciones a partir de las observaciones de una muestra. A partir de una muestra, construiremos también estimadores que toman como valor un intervalo. Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Introducción • Intervalos de Confianza • Determinación del tamaño muestral • Contrastes de hipótesis • Generalidades de los contrastes • Metodología del contraste • Región de rechazo y p-valor • Relación entre ICs y contrastes de hipótesis • Algunos contrastes particulares Depto. Estadística, Universidad Carlos III
Intervalos de Confianza • Dada una probabilidad 1-a fijada de antemano podemos construir un intervalo a partir de la información que nos proporciona una muestra aleatoria X1,X2,…,Xn y que contiene un parámetro q con probabilidad 1-a. Obtenemos un Intervalo de Confianza con nivel de confianza1-a sustituyendo los estimadores de q por su estimación. Depto. Estadística, Universidad Carlos III
Intervalos de Confianza • Construcción de un IC, método del pivote. El objetivo es buscar dos estadísticos, tales que Partimos de un estimador de q con distribución conocida, si es Normal, tenemos Depto. Estadística, Universidad Carlos III
Intervalos de Confianza • Un IC para el parámetro q al nivel de confianza 1-a construido a partir de un estadístico con distribución normal tendrá la forma donde P(Z > za/2) = a/2 para Z~N(0,1). Depto. Estadística, Universidad Carlos III
Intervalos de Confianza • Determinación del tamaño muestral. En general, un IC para q puede escribirse como donde a y b dependen de • El nivel de confianza ; • La varianza del estimador de q ; • El tamaño muestral . El tamaño muestral afecta a la varianza del estimador. Depto. Estadística, Universidad Carlos III
Intervalos de Confianza • Determinación del tamaño muestral. Fijado un nivel de error en la estimación del parámetro (equiv. la amplitud del IC), podemos calcular el tamaño muestral. Basta resolver la ecuación a+b = A , donde A es la amplitud deseada del IC. Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Introducción • Intervalos de Confianza • Determinación del tamaño muestral • Contrastes de hipótesis • Generalidades de los contrastes • Metodología del contraste • Región de rechazo y p-valor • Relación entre ICs y contrastes de hipótesis • Algunos contrastes particulares Depto. Estadística, Universidad Carlos III
Contrastes de Hipótesis Mediante un contraste de hipótesis, contrastamos una afirmación sobre la población a partir de una muestra. • La afirmación que queremos contrastar recibe el nombre de hipótesis nula (H0) • “la duración media de un analgésico es m0”, H0: m = m0 No rechazamos la hipótesis nula, salvo que haya una fuerte evidencia en contra suya. Depto. Estadística, Universidad Carlos III
Contrastes de Hipótesis • La hipótesis alternativa (H1) es lo que ocurre cuando no ocurre H0 • H1: m ¹ m0 • H1: m < m0 Para rechazar la hipótesis nula (y quedarnos con la alternativa), los datos han de mostrar una gran evidencia a favor de H1. Depto. Estadística, Universidad Carlos III
Contrastes de Hipótesis • Tipos de hipótesis • Simples: especifican un valor único del parámetro H0: m = m0 • Compuestas: el parámetro puede tomar varios valores H0: m ³m0 • Tipos de contrastes • Bilaterales: nos interesan valores a dcha. e izq. de uno fijo H0: m = m0 ; H1: m ¹ m0 • Unilaterales: sólo nos interesan los valores a un lado H0: m = m0 ; H1: m < m0 equiv. a H0: m ³m0 ; H1: m < m0 Depto. Estadística, Universidad Carlos III
Contrastes de Hipótesis • Si deseamos garantizar algo, debemos ponerlo en la hipótesis alternativa. • Ante un enunciado del tipo “¿Podemos afirmar que la media poblacional es superior a m0?” planteamos: H0: m = m0 ; H1: m > m0 • Si nos planteamos el refutar algo, debemos ponerlo en la hipótesis nula (su contrario en la alternativa). • Ante un enunciado del tipo “El fabricante afirma que la media es m0, ¿podemos refutar esa afirmación?” planteamos: H0: m = m0 ; H1: m ¹ m0 Depto. Estadística, Universidad Carlos III
Contrastes de Hipótesis • Tipos de errores • Error de Tipo I: Se rechaza la hipótesis nula (H0) cuando es cierta, a = P(Error Tipo I) = P(rechazo H0|H0) es el error más grave. • Error de Tipo II: No se rechaza la hipótesis nula (H0) cuando es falsa, b = P(Error Tipo II) = P(no rechazo H0|H1) este error es menos importante. Depto. Estadística, Universidad Carlos III
Metodología del contraste • Etapas de un contraste de hipótesis: Antes de tomar la muestra • Definir la hipótesis nula y la alternativa. Expresar en términos estadísticos nuestro problema. • Definir una medida de discrepancia entre las datos de la muestra y la hipótesis nula. Decidir cómo medir la distancia entre nuestra estimación y el valor del parámetro según H0. Depto. Estadística, Universidad Carlos III
Metodología del contraste • Decidir qué discrepancias consideramos inadmisibles. Decidir qué distancias entre la estimación y el parámetro (según H0) son demasiado grandes. Una vez tomada la muestra • Calcular la estimación del parámetro y su discrepancia. Si la distancia de la estimación al valor del parámetro (según H0) es grande, rechazamos H0. Si es pequeña, no la rechazamos. Depto. Estadística, Universidad Carlos III
Medida de la discrepancia • La discrepancia es una medida de la distancia del valor que toma el parámetro según la hipótesis nula a su estimador. La construcción de la discrepancia (cómo medimos la distancia) depende de la hipótesis alternativa del contraste. Depto. Estadística, Universidad Carlos III
Medida de la discrepancia • En el contraste El signo de la discrepancia es irrelevante. • En el contraste La discrepancia será mayor cuanto mayor sea Depto. Estadística, Universidad Carlos III
Región de rechazo • Calculamos qué discrepancias resultan inadmisibles, qué distancias entre el parámetro (según H0) y su estimación son demasiado grandes. Estas distancias vienen determinadas por el nivel de significacióna. Este nivel de significación a es la máxima probabilidad de error de tipo I que estamos dispuestos a asumir. Habitualmente a =0’01 ó 0’05 Depto. Estadística, Universidad Carlos III
Región de rechazo Fijado a, tenemos P(rechazo H0|H0) = a Conocemos la distribución del estimador de q (bajo H0) Dado el contraste H0: q = q0 ; H1: q ¹ q0 Rechazamos H0 si El valor c es el que determina la región de rechazo. Depto. Estadística, Universidad Carlos III
Región de rechazo Dado el contraste H0: q = q0 ; H1: q < q0 Rechazamos H0 si Depto. Estadística, Universidad Carlos III
Resolución del contraste • Para resolver el contraste, calculamos la estimación del parámetro q , calculamos su discrepancia respecto de q0 y la comparamos con el valor crítico obtenido para el nivel de significación a fijado de antemano. • Si la estimación de q está dentro de la región de rechazo, hay evidencia suficiente para rechazar H0 • Si la estimación de q está fuera de la región de rechazo, no hay evidencia suficiente para rechazar H0 • Un contraste es estadísticamente significativo si el resultado experimental discrepa más de lo tolerado a priori. Depto. Estadística, Universidad Carlos III
p-valor El p-valor es el mayor nivel de significación para el que no se rechaza la hipótesis nula, o equiv., el nivel crítico que se corresponde con un valor crítico igual a la discrepancia observada p-valor = P(discrepancia mayor que observada|H0) Es la probabilidad de tener una muestra peor que la que tenemos, supuesta cierta la hipótesis nula. Depto. Estadística, Universidad Carlos III
p-valor Cuanto menor sea el p-valor, mayor grado de evidencia tenemos en contra de la hipótesis nula. Si el p-valor es 0’05 ó menor suele rechazarse H0 Dado el contraste H0: q = q0 ; H1: q < q0 Buscamos el valor de a cuando c toma el valor de la estimación en la muestra que tenemos. Depto. Estadística, Universidad Carlos III
p-valor Dado el contraste H0: q = q0 ; H1: q ¹ q0 Buscamos el valor de a cuando c (ó -c) toma el valor de la estimación en la muestra que tenemos Depto. Estadística, Universidad Carlos III
Relación entre ICs y Contrastes • Dado un contraste bilateral H0: q = q0 ; H1: q ¹ q0 con nivel de significación a, se rechaza la hipótesis nula si q0 no pertenece al Intervalo de Confianza con nivel de confianza 1-a obtenido para q. Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la media de una población normalomuestragrandeconvarianzaconocida • Hipótesis nula. H0: m = m0 • Hipótesis alternativa. H1: m ¹ m0 • Rechazo H0 cuando • Hipótesis alternativa. H1: m < m0 • Rechazo H0 cuando • Hipótesis alternativa. H1: m > m0 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para la media de una población normal o a partir de una muestra grande con varianza conocida. con un nivel de confianza 1-a , donde P(Z > za) = a si Z~N(0,1) Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para proporción • Hipótesis nula. H0: p= p0 • Hipótesis alternativa. H1: p¹ p0 • Rechazo H0 cuando • Hipótesis alternativa. H1: p< p0 • Rechazo H0 cuando • Hipótesis alternativa. H1: p> p0 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para una proporción. con un nivel de confianza 1-a , donde P(Z > za) = a si Z~N(0,1) Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la media de una población normal con varianza desconocida • Hipótesis nula. H0: m = m0 • Hipótesis alternativa. H1: m ¹ m0 • Rechazo H0 cuando • Hipótesis alternativa. H1: m < m0 • Rechazo H0 cuando • Hipótesis alternativa. H1: m > m0 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para la media de una población normal con varianza desconocida. con un nivel de confianza 1-a , donde P(X > tn,a) = a si X~tn Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la varianza de una población normal • Hipótesis nula. H0: s2= s02 • Hipótesis alternativa. H1: s2¹ s02 • Rechazo H0 cuando • Hipótesis alternativa. H1: s2< s02 • Rechazo H0 cuando • Hipótesis alternativa. H1: s2> s02 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para la varianza de una población normal. con un nivel de confianza 1-a , donde P(X > c2n,a) = a si X~c2n Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la igualdad de medias de dos poblaciones normales con varianzas conocidas • Hipótesis nula. H0: m1= m2 • Hipótesis alternativa. H1: m1¹ m2 • Rechazo H0 cuando • Hipótesis alternativa. H1: m1< m2 • Rechazo H0 cuando • Hipótesis alternativa. H1: m1> m2 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas conocidas. con un nivel de confianza 1-a , donde P(Z > za) = a si Z~N(0,1) Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la igualdad de proporciones de dos poblaciones (muestras independientes) • Hipótesis nula. H0: p1= p2 • Hipótesis alternativa. H1: p1¹ p2 • Rechazo H0 cuando • Hipótesis alternativa. H1: p1< p2 • Rechazo H0 cuando • Hipótesis alternativa. H1: p1> p2 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para la diferencia de proporciones de dos poblaciones (muestras independientes). con un nivel de confianza 1-a , donde P(Z > za) = a si Z~N(0,1) Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la igualdad de medias de dos poblaciones normales con varianzas desconocidas y distintas (muestras independientes) • Hipótesis nula. H0: m1= m2 • Hipótesis alternativa. H1: m1¹ m2 • Rechazo H0 cuando • Hipótesis alternativa. H1: m1< m2 • Rechazo H0 cuando • Hipótesis alternativa. H1: m1> m2 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y distintas. con un nivel de confianza 1-a , donde P(Z > za) = a si Z~N(0,1) Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la igualdad de medias de dos poblaciones normales con varianzas desconocidas pero iguales • Hipótesis nula. H0: m1= m2 • Hipótesis alternativa. H1: m1¹ m2 • Rechazo H0 cuando • Hipótesis alternativa. H1: m1< m2 • Rechazo H0 cuando • Hipótesis alternativa. H1: m1> m2 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales. con un nivel de confianza 1-a , donde P(X > tn,a) = a si X~tn Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la igualdad de medias en dos poblaciones normales con varianza desconocida (muestras relacionadas), d = x1-x2 • Hipótesis nula. H0: md= 0 • Hipótesis alternativa. H1: md¹ 0 • Rechazo H0 cuando • Hipótesis alternativa. H1: md< 0 • Rechazo H0 cuando • Hipótesis alternativa. H1: md> 0 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianza desconocida (muestras relacionadas). con un nivel de confianza 1-a , donde P(X > tn,a) = a si X~tn Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste para la igualdad de varianzas de dos poblaciones normales • Hipótesis nula. H0: s12= s22 • Hipótesis alternativa. H1: s12¹ s22 • Rechazo H0 cuando • Hipótesis alternativa. H1: s12< s22 • Rechazo H0 cuando • Hipótesis alternativa. H1: s12> s22 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III
IntervalosdeConfianzaparticulares • Intervalo de Confianza para el cociente de varianzas de dos poblaciones normales. con un nivel de confianza 1-a , donde P(X > Fn1-1,n2-1,a) = a si X~ Fn1-1,n2-1 Fn2-1,n1-1,1-a = 1/Fn1-1,n2-1,a Depto. Estadística, Universidad Carlos III
Contrastes particulares • Contraste aproximado para el EMV • Hipótesis nula. H0: q = q0 • Hipótesis alternativa. H1: q ¹ q0 • Rechazo H0 cuando • Hipótesis alternativa. H1: q < q0 • Rechazo H0 cuando • Hipótesis alternativa. H1: q > q0 • Rechazo H0 cuando Depto. Estadística, Universidad Carlos III