150 likes | 355 Views
¿Cómo se construye el intervalo de confianza para la proporción poblacional(P) con una muestra aleatoria?. Desarrollemos el ejercicio siguiente:. Objetivo : Construir el intervalo de confianza para la proporción P con una muestra aleatori a. Ejercicio :
E N D
¿Cómo se construye el intervalo de confianza para la proporción poblacional(P) con una muestra aleatoria? Desarrollemos el ejercicio siguiente:
Objetivo: Construir el intervalo de confianza para la proporción P con una muestra aleatoria. Ejercicio: “En el sondeo más reciente de la encuestadora GPS se obtuvo que a 447 electores José Rodríguez(A) les inspira personalmente mucha confianza, mientras que Marino Rojas(B) inspira mucha confianza a 478 electores de un total de 2478 personas encuestadas. ¿Cuál sería el intervalo de confianza al 95% para la proporción de cada uno?” Planteamiento
¿Cuáles son los datos? Revisemos el enunciado del ejercicio y apuntemos los datos en el recuadro de la izquierda. Revisemos
Los datos y resultados son: Proporciones muestrales: Rd = 447/2478 = 0,180 Ro = 478/2478 = 0,193 Número de casos: 2478 Rojas inspira confianza a un 19,3 % de las personas encuestadas y Rodríguez a un 18,0%. Recordemos: p=x/n En el sondeo más reciente de la encuestadora GPS se obtuvo que a 447 electores José Rodríguez(A) les inspira personalmente mucha confianza, mientras que Marino Rojas(B) inspira mucha confianza a 478 electores de un total de 2478 personas encuestadas. ¿Cuál sería el intervalo de confianza Recordemosal 95% para la proporción de cada uno? Cálculo de las proporciones
Recordemos • La pregunta es: • ¿Cuál sería el intervalo de confianza al 95% para la proporción poblacional de cada candidato(A y B)?.
¿Qué pasos debemos dar para responder la pregunta?. Indiquemos los pasos a continuación: Veamos paso por paso
¿Qué debemos hacer para responder la pregunta?. Los pasos son los siguientes: Conocer los supuestos que debemos aplicar. Aplicar la fórmula adecuada (en función de los supuestos) para la construcción del intervalo. 3. Realizar el cálculo. 4. Interpretar resultado. Describámoslos Los símbolos que emplearemos para referirnos a los parámetros ( población) y a las estadísticas ( muestra) son:
Conocer los supuestos que debemos aplicar Debemos saber si la muestra tiene un tamaño grande Si la muestra tiene un tamaño grande podemos aplicar la Ley de los Grandes Números. Para saber si n es grande deben cumplirse estas dos condiciones: 1. p n ≥ 5 2. (1-p) n ≥ 5 Si la muestra es pequeña no podemos construir el intervalo de confianza (tendríamos que aplicar otros métodos alternativos no explicados en la asignatura). Debemos conocer si trabajamos con una población finita La norma que empleamos para saber si la población es finita es que el número de casos sea inferior a 100.000 (en este caso debemos comprobar el paso 3) Si la población es mayor de 100.000 (infinita) no debemos comprobar el paso 3. 3. Debemos conocer si trabajamos con una muestra con reemplazamiento o sin reemplazamiento En poblaciones finitas si el muestreo es sin reemplazamiento hay que aplicar la corrección respectiva. En poblaciones finitas si el muestreo es con reemplazamiento no hay que aplicar tal corrección . Supuestos • En el ejemplo: • p n ≥ 5 es 478 (cumple la condición) • (1-p) n ≥ 5 es 2000 (cumple la condición), luego n es grande En el sondeo GPS la población de interés es la población electoral del país, luego es muy grande
¿Cómo se construye el intervalo de confianza para la proporción con una muestra? 2. Aplicar la fórmula adecuada (en función de los supuestos) para la construcción del intervalo n es grande (Ley de los Grandes Números). Población infinita n es grande (Ley de los Grandes Números). Población finita (muestreo sin reemplazamiento) El valor z se establece en función del nivel de confianza (en el ejemplo: 95%) y se obtiene en la tabla de la curva normal. z=1,96 se relaciona con un área de 0,475. Al ser simétrica la curva supone un área de 0,475x2=0,950, es decir, un 95% de probabilidad o nivel de confianza.
¿Cómo se construye el intervalo de confianza para la proporción con una muestra? 2. Aplicar la fórmula adecuada (en función de los supuestos) para la construcción del intervalo y 3. Realizar el cálculo En nuestro ejemplo, al ser una población infinita y un n grande optamos por la fórmula: IC (π)= 0,180 ± 0,015 IC (0,165 ; 0,195) paraRd • Proporciones: • Rd= 447/2478 = 0,180 • Ro = 478/2478 = 0,193 • Número de casos: 2478 Z95=1,96 IC (π)= 0,193 ± 0,016 IC (0,177 ; 0,209) paraRo
¿Cómo se construye el intervalo de confianza para la proporción con una muestra? • Interpretar resultado Hemos obtenido que el IC95es(0,165 ; 0,195) para Rd y (0,177 ; 0,209) paraRo esdecir: la probabilidadque el intervaloconstruidocomprendido entre esosvalorescontenga el verdadero valor del parámetroP,es del 95%. Por lo tanto, entre un 16,5% y un 19,5% confía en José Rodríguez y entre un 17,7% y un 20,9% confía en Marino Rojas . Puesto que ambos intervalos se solapan se trata de un empate técnico. El nivel de confianza de ambos intervalos es del 95%
Prueba de hipótesis para una proporción(P) • Supongamos que un portavoz del partido A haya señalado que en Rodríguez confía una de cada cinco personas esto es, el 20%. • El sistema de hipótesis quedaría planteado como sigue: • H0:P = 0,20 • H1: P ≠ 0,20
Prueba de hipótesis para una proporción(P) • Se establece un nivel de significación(α) • Habitualmente α = 0,05 (5%) • Se plantea un estadístico de prueba • Se establece la región de rechazo La región de rechazo, con un nivel de significación de 0,05 se situaría fuera del intervalo de valores z (-1,96;1,96) Que sigue una distribución N(0,1)
Prueba de hipótesis para una proporción(P) • Cálculo • Z* = (0,180-0,200) / 0,008 = -2,5 • Contraste • -2,5 es menor que -1,96 por lo que pertenece a la región de rechazo. • Decisión: Se debe rechazar la hipótesis nula(Hο). Rodríguez no recibe la confianza de una de cada cinco personas, con un nivel de significación del 0,05%.
Prueba de hipótesis para una proporción(P) • ¿y qué ocurre con Rojas? • Las hipótesis, la región de rechazo y el estadístico de contraste, son idénticas. • El valor de z* es: z* = (0,193-0,200) /0,008= -0,88 • -0,88 es mayor que -1,96 por lo que no pertenece a la región de rechazo. En este caso sí se podría afirmar, queRojas recibe la confianza de una de cada 5 personas . La muestra con ese nivel de significación(α), no es capaz de aportar la información necesaria para rechazar la Hο.