520 likes | 815 Views
Distribución de la media muestral de una variable aleatoria discreta con distribución uniforme. Consideremos una población grande en la cual los valores de una variable aleatoria X tienen la siguiente distribución:.
E N D
Distribución de la media muestral de una variable aleatoria discreta con distribución uniforme Consideremos una población grande en la cual los valores de una variable aleatoria X tienen la siguiente distribución:
La variable X es discreta y toma los valores 1, 2, 3, 4 y 5 todos con probabilidad igual a 0,20. Entonces la media de esta población, el valor esperado de X, es el valor 3, = 3. (se puede mostrar que la desviación estándar poblacional es = 1,414). Ahora supongamos que se conoce el valor de la media poblacional, pero que se puede seleccionar una muestra aleatoria simple de tamaño n=2 de esta población. Una muestra posible de tamaño 2 de esta población es {1,3}. Para esta muestra en particular, la media muestral es 2. Esta media muestral será un estimador de la media poblacional, pero no es igual a la media poblacional.
Supongamos que se seleccionan 40 muestras aleatorias de tamaño n=2 de nuestra población de interés. • La distribución de la media muestral tiene la misma forma que la población original? • Cuál es el centro aproximado de la distribución?
Muestras de mayor tamaño Supongamos ahora que se utilizó un programa de computación para generar una gran cantidad de muestras de tamaño n=30 de esta población y se obtuvo el siguiente histograma de las medias muestrales. Se agregó al histograma una curva normal.
Muestras de una distribución normal Supongamos ahora que se utilizó un programa de computación para generar una gran cantidad de muestras de tamaño n=2 de una población normal con media 3 y variancia 2 y el histograma de las medias muestrales resultantes es el siguiente. Se agregó al histograma una curva normal.
Teorema del Límite Central Obtén una muestra aleatoria simple de tamaño n de cualquier población de media y desviación típica finita . Cuando n es grande, la distribución de la media muestral es aproximadamente normal:
El Teorema del límite central en acción: la distribución de las medias muestrales de una población muy asimétrica. (a) La distribución de una observación. (b) La distribución de la media muestral de dos observaciones. (c ) La distribución de la media muestral para 10 observaciones. (d) La distribución de la media muestral para 25 observaciones.
4.45. Rendimiento de acciones. La distribución de los rendimientos anuales de las acciones es aproximadamente simétrica, aunque las observaciones extremas son más frecuentes que una distribución normal. Como esta falta de normalidad no es muy fuerte, la media de los rendimientos, incluso durante un número pequeño de años, es aproximadamente normal. A largo plazo, los rendimientos anuales varían con una media próxima al 9% y una desviación típica próxima al 28%. Jaime piensa retirarse dentro de 45 años y está considerando la posibilidad de invertir en bolsa. ¿Cuál es la probabilidad (suponiendo que los rendimientos anuales de las acciones mantienen la misma variación) de que la media de los rendimientos anuales en los próximos 45 años supere el 15%? ¿Cuál es la probabilidad de que esta media de rendimientos sea menor del 5%?
X = rendimientos anuales de las acciones E(X) = = 9 Var(X) = = 28 n = 45
Reglas generales de la probabilidad Reglas de la probabilidad Regla 1. 0 P(A) 1 para cualquier suceso A Regla 2. P(S) =1 Regla 3. Para cualquier suceso A, P(no ocurra A) = 1 - P(A) Regla 4. Regla de la suma. Si A y B son disjuntos, P(A o B) = P(A) + P(B).
Diagrama de Venn que muestra dos sucesos A y B disjuntos S B A
Diagrama de Venn que muestra dos sucesos A y B que no son disjuntos. El suceso {A y B} consta de los resultados comunes a A y B S
Ejemplos: ¿Indepdendientes o no? • Debido a que una moneda no tiene memoria y que quien lanza la moneda no puede influir sobre su caída, es razonable suponer que los sucesivos lanzamientos de una moneda son independientes. Para una moneda bien equilibrada esto significa que después de ver el resultado del primer lanzamiento, seguimos asignando una probabilidad de ½ a las caras del segundo lanzamiento.
Por otro lado, los colores de las sucesivas cartas de una baraja no son independientes. Una baraja de 52 cartas tiene 26 cartas rojas y 26 negras. Si escogemos una carta de una baraja bien mezclada, la probabilidad de obtener una carta roja es de 26/52=0,50 (resultados igualmente probables). Una vez hemos visto que la primera carta es roja, sabemos que sólo quedan 25 cartas rojas en la baraja entre las 51 cartas restantes. La probabilidad de que la segunda carta sea roja es, por tanto, 25/51=0,49. Conocer el resultado de la primera carta escogida cambia la asignación de probabilidades para la segunda.
Regla de la multiplicación para sucesos independientes Dos sucesos A y B son independientes si el conocimiento de que ha ocurrido uno de ellos no cambia la probabilidad de que ocurra el otro. Si A y B son independientes, P(A y B) = P(A) P(B)
Aplicación de la regla de la multiplicación Ejemplos: Cables submarinos Un cable submarino transatlántico está provisto de repetidores que amplifican la señal. Si falla un repetidor, éste debe ser reparado. Para ello hay que recuperar el cable y llevarlo hasta la superficie a un coste elevado. Cada repetidor tiene una probabilidad de 0,999 de funcionar correctamente durante 10 años. Supón que los repetidores fallan de forma independiente los unos de los otros. (Esta suposición significa que no hay “causas comunes”, como por ejemplo un terremoto, que pudieran afectar a varios repetidores simultáneamente). Sea Ai el suceso que indica que el repetidor i funciona correctamente durante 10 años.
La probabilidad de que dos repetidores funcionen correctamente durante 10 años es P(A1 y A2) = P(A1) P(A2) = 0,999 x 0,999 = 0,998 Para un cable con 10 repetidores la probabilidad de que no fallen durante 10 años es P(A1 y A2 y … y A10) = P(A1) P(A2) … P(A10) = 0,999 x 0,999 x …. x 0,999 = 0,99910 = 0,990
Cables con 2 o 10 repetidores son bastante fiables. Desgraciadamente, un cable submarino transatlántico tiene 300 repetidores. La probabilidad de que los 300 funcionen correctamente durante 10 años es P(A1 y A2 y … y A300) = 0,999300 = 0,741 En consecuencia tenemos una posibilidad entre cuatro de que el cable tenga que ser recuperado para reparar algún repartidor durante un período de 10 años. En realidad, los repetidores están diseñados para que su fiabilidad sea superior a 0,999 durante un período de 10 años. Algunos cables submarinos transatlánticos han funcionado durante más de 20 años sin problemas.
La regla general de la suma para sucesos disjuntos P(A o B o C) = P(A) + P(B) + P(C), cuando los sucesos A, B y C son disjuntos. S B A C
Regla general de la suma para dos sucesos cualesquiera Para dos sucesos cualesquiera A y B, P(A o B) = P(A) + P(B) – P(A y B)
Ejemplo: ¿Quién será ascendido? Romeo y Julia trabajan en el Ministerio de Agricultura. Se está haciendo una recalificación de los puestos de trabajo, y tanto Romeo como Julia tienen posibilidades de ascender en la escala funcionarial. Romeo cree que él tiene una probabilidad de 0,7 de ascender y que Julia tiene una probabilidad de 0,5. (La asignación de probabilidades es arbitraria, es lo que cree Romeo). Para poder calcular la probabilidad de que al menos uno de los dos ascienda, esta asignación de probabilidades no nos proporciona suficiente información. Concretamente, la suma de las dos probabilidades de promoción da un resultado imposible: 1,2. Si Romeo cree además que la probabilidad de que ambos asciendan es 0,3, entonces aplicando la regla general de la adición tenemos P(al menos uno de los dos asciende) = 0,7 + 0,5 - 0,3 = 0,9
Resumen Los sucesos A y B son disjuntos si no tienen resultados en común. Los sucesos A y B son independientes si conocer que ocurre un suceso no cambia la probabilidad que asignaríamos al otro suceso. Cualquier asignación de probabilidad cumple, además de las reglas de la clase anterior, las siguientes reglas más generales: Regla de la suma: Si los sucesos A, B, C , …, son disjuntos dos a dos, entonces P(de que ocurra al menos uno de estos sucesos) = P(A) + P(B) + P( C) + … Regla de la multiplicación: Si A y B son sucesos independientes, entonces P(A y B) = P(A) P(B) Regla general de la suma: Para dos sucesos cualesquiera, P(A o B) = P(A) + P(B) – P(A y B)
18-24 años y casada. • P(edad 18-24 y casada) = 3.046/99.585 = 0,031 • 18 a 24 años. P(edad 18-24) = 12.614/99.585 = 0,127 • casada, dado que tiene entre 18 y 24 años. P(casada / edad 18-24) = 3.046/12.614 = 0,241
Relación entre las tres probabilidades Regla de la multiplicación La probabilidad de que dos sucesos A y B ocurran simultáneamente se puede hallar de la siguiente manera, P(A y B) = P(A) P(B/A) Aquí P(B/A) es la probabilidad de que ocurra B condicionada a que ha ocurrido A.
Definición de probabilidad condicional Cuando P(A) > 0, la probabilidad de B condicionada a A viene dada por
Ejemplo: ¿Cuál es la probabilidad de que una mujer sea viuda, dado que ella tiene 65 años o más? P(65 años o más) = 18.262/99.585 = 0,183 P(viuda y 65 años o más) = 8.636/99.585 = 0,087 La probabilidad condicionada es entonces
Ejercicio 5.8: Cafeína en la dieta • El café, el té y la cola son fuentes comunes de cafeína. Supón que • el 55% de los adultos toma café • el 25% de los adultos toma té • el 45% de los adultos toma gaseosas como coca cola • y también que • el 15% toma café y té • el 5% toma las tres bebidas • el 25% toma café y cola • el 5% toma solamente té • Dibuje un diagrama de Venn con esta información. • ¿Qué porcentaje de adultos bebe solamente cola? • ¿Qué porcentaje no beben ninguna de estas bebidas?
Datos: A=“toma café” P(A) = 0,55 B=“toma té” P(B) = 0,25 C=“toma cola” P(C) = 0,45 P(A y B) = 0,15 P(A y B y C) = 0,05 P(A y C) = 0,25 P(B y Ac y Cc) = 0,05
Luego, P(Ac/B)=1-P(A/B)=1-P(A y B)/P(B)= =1-(0,15/0,25)=1-0,6=0,4 donde se deduce que P(Ac y B)=P(Ac/B) P(B)=0,4 x 0,25=0,1 Con lo que se conoce que P(B y C) – P(A y B y C) = 0,10 – 0,05 = 0,05 y entonces los que toman sólo cola son el 15%. Como P(A o B o C) = 0,80 entonces la probabilidad del evento contrario indica que el 20% de los adultos no bebe ninguna de estas bebidas.
Generalización de la regla de la multiplicación La regla de la multiplicación se puede extender al caso de que varios sucesos ocurran simultáneamente. Para calcular esta probabilidad, lo que hay que hacer es condicionar cada suceso a la ocurrencia de todos los sucesos precedentes. Por ejemplo, supongamos que tenemos tres sucesos A, B y C. La probabilidad de que los tres ocurran simultáneamente es P(A y B y C) = P(A) P(B/A) P(C/A y B)
Ejemplo: El futuro de los jugadores de basquetbol, beisbol y futbol.Sólo el 5% de los chicos que en secundaria juegan básquetbol, béisbol y fútbol compiten en la liga universitaria cuando llegan a la universidad. De estos, sólo el 1,7% llegan a jugar como profesionales. Sólo un 40% de los estudiantes que compiten en la liga universitaria y luego en la liga profesional llegan a graduarse. Definamos los siguientes sucesos: A = “juega en la liga universitaria” B = “juega profesionalmente” C=“profesional con carrera universitaria” ¿Cuál es la probabilidad de que un estudiante de secundaria que juega básquetbol, béisbol o fútbol, compita en la liga universitaria y llegue a graduarse?
Sabemos que P(A) = 0,05, P(B/A) = 0,017 y P(C/ A y B) = 0,4 La probabilidad que buscamos es P(A y B y C) = P(A) P(B/A) P(C/ A y B) = 0,05 x 0,017 x 0,4 =0,0034 Sólo 3 de cada 10.000 chicos que jugaban en secundaria llegarán a competir en la liga universitaria, luego en la liga profesional y, además, se graduarán en la universidad. Parece más razonable que los chicos que juegan en secundaria se concentren en sus estudios y no sueñen con la esperanza de llegar a jugadores profesionales.
Probabilidad condicional e independencia Sucesos independientes Dos sucesos A y Bcon probabilidades mayores que 0 son independientes si P(B/A) = P(B)
Diagrama de árbol o árbol de decisión Es una forma de organizar la información sobre las probabilidades, para aplicar las reglas de la multiplicación y la suma. Cada segmento en el árbol corresponde a una etapa del problema. Cada rama completa muestra una alternativa en la decisión a tomar. Las probabilidades al final de las ramas representan la probabilidad conjunta para cada combinación de eventos. La probabilidad condicional puede obtenerse dividiendo la probabilidad conjunta de interés por la probabilidad del evento apropiado [P(B) = P(A y B) + P(Ac y B)], o sea la suma de todas las ramas que forman parte del evento apropiado.
Ejemplo: ¿Cuál es la probabilidad de que un deportista del colegio secundario entre a las ligas profesionales? La probabilidad pedida es P(B) y para calcularla se utilizará el diagrama de árbol. Cabe recordar que: P(B) = P(A y B) + P(Ac y B) El primer término de esta suma queda descripto en la parte superior del árbol. Como P(A) = 0,05 entonces P(Ac) = 1-P(A) = 0,95. También se conoce que P(B/A) = 0,017, luego P(Bc/A) = 1-P(B/A) = 1- 0,017 = 0,983.
Entonces, P(B y A) = P(A) P(B/A) = 0,05 x 0,017 = 0,00085 La parte inferior del diagrama de árbol describe a los deportistas que no compiten en del colegio secundario. Luego, P(B y Ac) = P(Ac) P(B/Ac) = 0,95 x 0,0001 = 0,000095 El resultado final es: P(B) = 0,00085 + 0,000095 = 0,000945
P(B/A) = P(A) = P(Bc/A) = P(Ac) = P(B/Ac) = P(Bc/Ac) =
Regla de Bayes Ejemplo: ¿Qué proporción de deportistas profesionales compitieron en el colegio secundario?
Regla de Bayes Regla de Bayes Si A y Bson eventos cuyas probabilidades no son ni 0 ni 1,
Ejercicio 4.97: Zipdrive, Inc., ha desarrollado un nuevo disco para pequeñas computadoras. La demanda de este nuevo producto es incierta pero puede ser descripta como “alta” o “baja” en cualquier año. Despúes de 4 años, el producto se espera que sea obsoleto. La administración debe decidir si construir una planta o contratar una fábrica de Hong King para producir el nuevo producto. La construcción de una nueva planta puede ser muy beneficioso si la demanda se mantiene alta pero puede conducir a pérdidas si la demanda cae en los años futuros. Después de estudiar cuidadosamente el mercado y todos los costos relevantes, la oficina de planeamiento de Zipdrive proporcionó la siguiente información. Sea A el evento que “la demanda es alta en el primer año”, y B el evento que “la demanda es alta en los siguientes 3 años”. La división de marketing estimó las siguientes probabilidades:
P(A) = 0,9 P(B/A) = 0,36 P(B/Ac) = 0 La probabilidad de que construir una planta sea más provechoso que contratar la fábrica de Hong Kong es 0,95 si la demanda es alta los 4 años, 0,3 si la demanda es alta solamente en el primer año y 0,1 si la demanda es baja en los 4 años. Dibuje el diagrama de árbol que organiza esta información. El árbol tendrá tres etapas: demanda del primer año, demanda de los siguientes 3 años y si construir una fábrica es más provechoso que contratar la fábrica de Hong Kong. ¿Qué decisión tiene la mayor probabilidad de ser provechosa?
P(C/B y A) = 0,95 B C P(B/A) = 0,36 P(Cc/B y A ) = 0,05 Cc A C P(C/ Bc y A) = 0,3 P(A) = 0,90 P(Bc/A) = 0,64 Bc Cc P(Cc/Bc y A) = 0,70 B P(B/Ac) = 0 P(Ac) = 0,10 C Ac P(C/Bc y Ac) = 0,10 P(Bc/Ac) = 1 Cc Bc P(Cc/Bc y Ac) = 0,90
Se define C=“construir la planta es más provechoso que contratar la fábrica de Hong Kong”. P(C) = P( C y B y A) + P(C y Bc y A) + P(C y Bc y Ac) = = P(C/B y A) P(B/A) P(A) + P(C/Bc y A) P(Bc/A) P(A) + P(C/Bc y Ac) P(Bc/Ac) P(Ac) = = 0,95 x 0,36 x 0,90 + 0, 3 x 0,64 x 0,90 + 0,10 x 1 x 0,10 = = 0,4906 P(Cc) = P( Cc y B y A) + P(Cc y Bc y A) + P(Cc y Bc y Ac) = = P(Cc/B y A) P(B/A) P(A) + P(Cc/Bc y A) P(Bc/A) P(A) + P(Cc/Bc y Ac) P(Bc/Ac) P(Ac) = = 0,05 x 0,36 x 0,90 + 0,70 x 0,64 x 0,90 + 0,90 x 1 x 0,10 = = 0,5094