900 likes | 4k Views
Variable Aleatoria Discreta. Principales Distribuciones. Definición de v. a. discreta Función de Probabilidad Función de Distribución Características de las v.a. discretas Principales Distribuciones discretas Ejercicios. Definición de variable aleatoria.
E N D
Variable Aleatoria Discreta.Principales Distribuciones Definición de v. a. discreta Función de Probabilidad Función de Distribución Características de las v.a. discretas Principales Distribuciones discretas Ejercicios
Definición de variable aleatoria • El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica. • En estos casos aparece la noción de variable aleatoria • Función que asigna a cada suceso un número. • Las variables aleatorias pueden ser discretas o continuas (como en el primer tema del curso). • En las siguientes transparencias vamos a recordar conceptos de temas anteriores, junto con su nueva designación. Los nombres son nuevos. Los conceptos no.
Definición de v. a. discreta • Sea (, (), P) un espacio de probabilidad. Una función • X: • X() es una variable aleatoria. • Una variable aleatoria es una función que asocia un número real y sólo uno, a cada suceso elemental del espacio muestral () de un experimento aleatorio. • Ejemplo: • Experimento aleatorio: Lanzar una moneda al aire dos veces • Espacio muestral: = {CC, CX, XC, XX} • Sucesos elementales: {CC}, {CX}, {XC}, {XX} • Se define la variable X: Nº de caras obtenidas • Asignación de números reales: (CC, 2); (CX, 1); (XC, 1); (XX, 0) • Por tanto, la variable X viene definida por los valores: 0, 1, 2 • En el ejemplo anterior, X = {0, 1, 2} • Las variables aleatorias discretasson aquellas que sólo pueden tomar un número de valores finito o infinito numerable. X: • X() = x • Se representan mediante letras mayúsculas y pueden tomar n posibles valores: • X = { x1, x2, ... , xi, ... , xn}
Función de Probabilidad: f(x) • Asigna a cada posible valor de una variable discreta su probabilidad. • Recuerda los conceptos de frecuencia relativa y diagrama de barras. • Ejemplo • Número de caras al lanzar 3 monedas.
1 2 0 Función de Probabilidad: f(x) • Sea (, (), P) un espacio de probabilidad, X una v. a. discreta y {xi} i = 1 .. los valores que toma. • Se llama función de probabilidad, f(x), a la función que indica la probabilidad de cada posible valor de la v. a. d. X, es decir: • f: N [0, 1] • xi f(xi) = P(X = xi) = pi =P[{} t.q. X()=xi] i=1, .., • y que verifica: • (i) 0 f(xi) 1 • f(xi) = 1 • Gráficamente se representa • mediante barras. Con los • datos del ejemplo anterior
Función de Distribución, F(x) Sea (, (), P) un espacio de probabilidad, X v. a. discreta, {xi} i = 1 .. los valores que toma y {pi} i = 1 .. la función de probabilidad de X. Se llama función de distribución (acumulativa) de la v.a.d. X, F(x), a la probabilidad de que X sea menor o igual que x; es decir: F: N [0, 1] xi F(xi) = P(X ≤ xi) = P[{} t.q. X() ≤ xi] = Que cumple las siguientes propiedades: (i) F(- ) = 0 (ii) F(xmin) = f(x1) (iii) F(xmax) = 1 (iv) F() = 1 (v) F es monótona no decreciente, es decir, si xi xj entonces F(xi) F(xj) (vi) F es continua a derecha, tiene límites a izquierda y es constante en [xi-1, xi), donde toma el valor (vii) P(X > x) = 1 - P(X x) = 1 - F(x) (viii) P(xiX xj) = F(xj) - F(xi-1)
0 1 2 Función de Distribución, F(x) Gráficamente resulta en la función escalera: Continuando con el ejemplo anterior: F
Características de las v.a. discretas Se trata de resumir la información de una variable aleatoria en un conjunto de medidas (números). Esperanza: Sea X una v. a. d. El valor esperado o esperanza matemática de X, denotada por E(X) o por µ, se define como: E(X) es un valor fijo que depende de la distribución de probabilidad de X. Está medida en las mismas unidades que X. Propiedades de la esperanza: (i) Si C es una constante, entonces E(C) = C. (ii) Linealidad: E(aX + b) = aE(X) + b, a, b (iii) Si g(X) es una función de X, entonces: (iv) Si g(X), h(X) son funciones de X, entonces E[g(X)+h(X)]=E[g(X)]+E[h(X)] (v) |E[g(X)]| E[|g(X)|]
Características de las v.a. discretas Varianza: Sea X una v. a. d. La varianza de X se denota con Var(X), V(X) o 2 y se define como La raíz cuadrada positiva de la varianza se llama desviación típica y se denota con . Tanto la varianza como la desviación típica miden la dispersión de la v.a. respecto a su media. Observaciones: - La varianza y la desviación típica son cantidades positivas. - La desviación típica está medida en las mismas unidades que la v.a. Propiedades de la varianza: (i) Si C es una constante, V(C)=0 (ii) V(X) = E(X2) - E2(X) (iii) Si a y b son constantes: V(aX+b) = a2 V(X) La desviación media se define como la esperanza de |X-µ|.
Principales Distribuciones En la práctica, la función de probabilidad de la mayoría de las variables discretas se ajusta a un modelo teórico expresado mediante una fórmula concreta. Veremos los más habituales.
Principales Distribuciones • Distribución de Bernouilli Be(p) • Tenemos un experimento de Bernoulli si al realizar un experimentos sólo son posibles dos resultados: • X=1 (éxito, con probabilidad p) • X=0 (fracaso, con probabilidad q=1-p) • Al haber únicamente dos soluciones se trata de sucesos complementarios, verificándose que: • p + q = 1 • Además E(X) = p, Var(X) = p q • Ejemplos: • Lanzar una moneda y que salga cara. • p=1/2 • Elegir una persona de la población y que esté enfermo. • p=1/1000 = prevalencia de la enfermedad • Como se aprecia, en experimentos donde el resultado es dicotómico, la variable queda perfectamente determinada conociendo el parámetrop.
Principales Distribuciones Distribución Binomial B(n,p) • Función de probabilidad • Problemas de cálculo si n es grande y/o p cercano a 0 o 1. • Media: μ = n p • Varianza: σ2 = n p q • Si se repite un número fijo de veces, n, un experimento de Bernoulli con parámetro p, el número de éxitos sigue una distribución binomial de parámetros (n,p). • Lanzar una moneda 10 veces y contar las caras. B(n=10,p=1/2)
Principales Distribuciones Distribución Binomial B(n,p) Se aplica cuando se realizan un número n de veces el experimento de Bernouilli, siendo cada ensayo independiente del anterior. Definimos la v.a.: X=“Número de éxitos obtenidos en las n realizaciones” que puede tomar los valores k=0,1,…,ncon probabilidades: E(X) = n.p Var(X) = n.p.(1-p) = n.p.q Ejemplo: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? La fórmula quedaría: Luego P (X = 6) = 0,205 20,5% de probabilidad de obtener 6 caras al lanzar 10 veces una moneda.
Principales Distribuciones No siempre es necesario aplicar la fórmula para obtener la función de probabilidad asociada a un valor de la variable. Existen tablas donde se puede consultar el valor de f(xi). La tabla de la Binomial tiene la siguiente estructura: Dado X B (x; n; p), para buscar una f (x): 1ª columna: valor de n 2ª columna: posibles valores de X: 0, 1, …, n 3ª columna: valor de f(x) bajo diferentes valores de p Nota: Cuando n > 17, f(xi) puede aproximarse mediante el modelo normal Ejemplo: P(X = 1) = 0,02 bajo X B (x; 2; 0,01)
Principales Distribuciones Distribución de Poisson P() Esta distribución aparece en algunos procesos que tienen una dimensión temporal o espacial. En este tipo de experimentos los éxitos buscados son expresados por unidad de área, tiempo, pieza, etc,: - nº de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc, etc. - nº de bacterias por cm2 de cultivo - nº de llamadas telefónicas a un conmutador por hora, minuto, etc, etc. - nº de llegadas de embarcaciones a un puerto por día, mes, etc, etc. X= “Número de éxitos obtenidos por unidad de tiempo o de espacio” Para determinar la probabilidad de que ocurran k éxitos por unidad de tiempo, área, o producto, la fórmula a utilizar sería: E(X)= Var(X)=
Principales Distribuciones Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado. En estas condiciones el proceso de Poisson, que mide el número de éxitos en un intervalo de tiempo t, en lugar de por unidad de tiempo, vendría dado por A se le llama tasa de emisión (por unidad de tiempo).
Principales Distribuciones • Ejemplo: • Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba: • a) cuatro cheques sin fondo en un día dado, • b) 10 cheques sin fondos en cualquiera de dos días consecutivos? • a) X = Nº de cheques sin fondo que llegan al banco en un día cualquiera • X= 0, 1, 2, 3, ....., etc = 6 cheques sin fondo por día b)X= Nº de cheques sin fondo que llegan al banco en dos días consecutivos X = 0, 1, 2, 3, ......, etc = 6 x 2 = 12 cheques sin fondo (dos días) Nota: siempre debe de estar en función de X siempre o dicho de otra forma, debe “hablar” de lo mismo que X.
Principales Distribuciones • Ejemplo: • En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar • a) una imperfección en 3 minutos, • b) al menos dos imperfecciones en 5 minutos, • c) cuando más una imperfección en 15 minutos. • a) X = Nº de imperfecciones en la hojalata por cada 3 minutos • X = 0, 1, 2, 3, ...., etc. = 0.2 x 3 = 0.6 imperfecciones (3 minutos) b) X = Nº de imperfecciones en la hojalata por cada 5 minutos X = 0, 1, 2, 3, ...., etc = 0.2 x 5 =1 imperfección (5 minutos) = 1 - (0.367918 + 0.367918) = 0.26416
Principales Distribuciones c) X = Nº de imperfecciones en la hojalata por cada 15 minutos X = 0, 1, 2, 3, ....., etc. = 0.2 x 15 = 3 imperfecciones (15 minutos) = 0.0498026 + 0.149408 = 0.1992106 También se puede considerar esta distribución como una aproximación de la binomial cuando n↑ y p↓, pero el producto n.p permanece constante. Al igual que ocurría con la binomial, los valores acumulados de la distribución de Poisson se encuentran tabulados para que resulte más fácil su manejo.
Principales Distribuciones Ejemplo: En una concurrida intersección de tráfico, la probabilidad de que un automóvil tenga un accidente de tráfico es muy escasa, digamos de 0,0001. Sin embargo, durante cierta parte del día (entre las 4:00 pm y las 6:00 pm) un gran número de automóviles pasa por esa intersección, digamos unos 1000. En dichas condiciones, ¿cual es la probabilidad de que dos o más accidentes ocurran durante ese período? X= nº accidentes en 1000 coches XB(1000, 0.0001) Como la probabilidad p es menor que 0,1, y el producto n.p es menor que 10, entonces aplicamos el modelo de distribución de Poisson y podríamos aproximar por X P(0.1) P(X 2) = 1 – P(X < 2) = 1 – P(X 1) = 1 – 0.9953 = 0.0047
Principales Distribuciones Distribución Geométrica G(p) Realizamos el experimento de forma independiente hasta que obtenemos el primer éxito, y definimos la v.a.: X=”Número de experimentos hasta obtener el primer éxito” que toma los valores k=1,2,3,… con probabilidades: donde se tiene que E(X)=1/p y Var(X)=(1-p)/p2. Ejemplo: Una vía de una ciudad tiene seis cruces regulados por semáforos. La probabilidad de que al pasar un vehículo un semáforo esté verde es de 0.60. ¿ Cuál es la probabilidad de atravesar dicha vía en verde, encontrándose rojo solamente el último semáforo? Se supone que la regulación de los semáforos es tal que estos son independientes entre sí. X = nº de semáforos que debemos atravesar hasta encontrar el primero rojo X G(0.4) P(X=6) = 0.65 * 0.4 = 0.0311
Principales Distribuciones Distribución Binomial Negativa BN (n,p) Realizamos el experimento de forma independiente hasta obtener n éxitos y definimos la v.a.: X = “Número de fracasos antes del n-ésimo éxito” que puede tomar los valores k=0,1,2,… Además E(X)=n(1-p)/p y Var(X)=n(1-p)/p2. Ejemplo: En los play-off de la NBA americana, el vencedor de cada eliminatoria final es el equipo que logre primero la 4ª victoria en un total de 7 confrontaciones. ¿Cuál es la probabilidad de que un equipo dispute como mucho 6 partidos, si su porcentaje de partidos ganados es del 60%? P = probabilidad de éxito = 0.6 X= nº fracasos hasta obtener la 4ª victoria X BN(4,0.6) P(X 2)=P(X=0) + P(X=1) + P(X=2) = 0.1296 + 0.20736 + 0.20736 = 0.54432
Principales Distribuciones Distribución Hipergeométrica H(N,D,n) La distribución hipergeométrica es el modelo que se aplica en experimentos donde, al igual que en la distribución binomial, en cada ensayo hay tan sólo dos posibles resultados: éxito o fracaso. Pero se diferencia de la distribución binomial en que los distintos ensayos son dependientes entre sí (no hay reemplazamiento). Supongamos que tenemos un lote de N piezas de las cuales D son del tipo considerada éxito (D ≤ N). Extraigo una muestra de n piezas (sin reemplazamiento) y defino la v. a.: X = “Número de éxitos en n intentos” que puede tomar los valores k = max{0,n+D-N},1,…,min{D,n} Además E(X)= nD/N y Var(X)=np(1-p)[(N-n)/(N-1)] con p=D/N=proporción de éxitos.
Principales Distribuciones Ejemplo: En una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3 sean blancas? Entonces: N = 12; N-D = 5; D = 7; k = 3; n = 4 Si aplicamos el modelo: Por lo tanto, P (X = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%.
Principales Distribuciones Distribución Multinomial La distribución multinomial es similar a la distribución binomial, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber múltiples resultados: con n = x1 + x2 + x3 + … Ejemplo: En una fiesta, el 20% de los asistentes son españoles, el 30% franceses, el 40% italianos y el 10% portugueses. En un pequeño grupo se han reunido 4 invitados: ¿cual es la probabilidad de que 2 sean españoles y 2 italianos? Aplicamos el modelo: LuegoP = 0,0384 3.84% de probabilidad
Principales Distribuciones Distribucion Multihipergeométrica La distribución multihipergeométrica es similar a la distribución hipergeométrica, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber múltiples resultados (en la urna, en lugar de haber únicamente bolas de dos colores, hay bolas de diferentes colores). Ejemplo: En una caja de lápices hay 10 de color amarillo, 3 de color azul y 4 de color rojo. Se extraen 7 lápices, ¿cual es la probabilidad de que 5 sean amarillos y 2 rojos? LuegoP = 0,0777 7,77% de prob.
Ejercicios • Ejercicio 3.1 • En una determinada especie animal, en cada parto hay igual probabilidad de macho que de hembra (un sólo descendiente por parto). Cuando de una pareja nace una hembra, esta no tiene más descendencia. El mayor número de partos posibles es 4 y el menor es 1. Se quiere estudiar la variable aleatoria X = Nº de descendientes varones de la pareja. • Construir el espacio muestral correspondiente y determinar las probabilidades de los sucesos elementales. • Obtener y dibujar la función de probabilidad de la v. a. X. • Idem con la función de distribución. • Calcular E[X], V(X) y (X). • Calcular P(X>0), P(0 < X < 3) y P(X >1). • Sea la v.a. Y = Nº de descendientes. Calcular f(Y), E[Y] y V(Y).
Ejercicios • Ejercicio 3.2 • Un embarque de 7 televisores contiene 2 aparatos defectuosos. Un hotel realiza una compra aleatoria de 3 de ellos. Si X es el nº de unidades defectuosas que se compran: • a) Encuentre la distribución de probabilidad de X. • b) Representarla gráficamente. • c) Encuentre la distribución acumulada de X. • d) Representarla gráficamente. • e) Utilizando F(x) encuentre P(X=1) y P(0 < X 2). • f) Calcule Varianza y Media de X. Ejercicio 3.3 Determinar el valor de k para que la función P(x) = k/x, x = 1,2,3,4, sea la función de probabilidad de X . Determinar P(1 X 3).
Ejercicios • Ejercicio 3.4 • La probabilidad de que un paciente se recupere de una extraña enfermedad de la sangre es 0.4. Si se sabe que 15 personas han contraído esa enfermedad, ¿Cuál es la probabilidad de que: • a) al menos 10 sobrevivan. • b) sobrevivan entre 3 y 8 personas. • c) sobrevivan exactamente 5 personas?.
Ejercicios Ejercicio 3.5 Considérese un fabricante de automóviles que compra los motores a una compañía donde se fabrican bajo estrictas especificaciones. El fabricante recibe un lote de 40 motores. Su plan para aceptar el lote consiste en seleccionar 8, de manera aleatoria, y someterlos a prueba. Si encuentra que ninguno de los motores presenta serios defectos, el fabricante acepta el lote; de otra forma lo rechaza. Si el lote contiene 2 motores con serios defectos, ¿Cúal es la probabilidad de que sea aceptado?. • Ejercicio 3.6 • Un lepidopterista desea capturar un ejemplar de una clase de mariposas que se encuentra con un porcentaje del 15%. Hallar la probabilidad de que tenga que cazar 10 mariposas de la clase no deseada antes de encontrar: • a) Un ejemplar de la clase deseada. • b) Tres ejemplares de la clase deseada
Ejercicios • Ejercicio 3.7 • Una empresa ha medido el número de errores que cometen las secretarias recién contratadas a lo largo de los últimos tres años (X), encontrando que éstas cometen hasta cinco errores en una página de 20 líneas y que esta variable aleatoria representa la siguiente función de probabilidad: • Calcule: • a) La representación gráfica de la función de probabilidad y la función de distribución • b) El valor esperado de X • c) La varianza de X • d) La media y la varianza en el caso de que cada error se pondere por 1/5
Ejercicios • Ejercicio 3.8 • La variable X = “número de pólizas vendidas por un agente de una empresa de seguros” tiene la siguiente distribución de probabilidad: • Calcule: • a) Calcule el valor esperado de X • b) Calcule la varianza de X • c) ¿Cuál es la probabilidad de que el agente venda más de una póliza? • d) ¿y la de que venda menos de 3? • e) ¿y entre 1 y 4 pólizas (ambas inclusive)? • En el supuesto de que el director de la empresa premie con 100 puntos cada producto vendido; • f) ¿Qué representa Y? ¿Cuál es su distribución de probabilidad? • g) Calcule el valor esperado y varianza de Y
Ejercicios • Ejercicio 3.9 • Sea X una variable aleatoria discreta tal que: • P (X = a) = 1/10; con a = 2, 3, ... , 11 • a) Calcule la función de distribución de X • b) P (X > 7) • c) P (X ≤ 5) • d) P (3 ≤ X ≤ 8) • Ejercicio 3.10 • Un psicólogo cognitivo realiza un experimento en el que presenta a cinco sujetos un par de estímulos luminosos. La tarea consiste en que cada sujeto debe indicar si ambos estímulos son iguales o no en intensidad. Obtener la función de probabilidad asociada al número de aciertos de los sujetos, suponiendo que éstos han respondido al azar. Representar gráficamente el resultado de dicha distribución.
Ejercicios • Ejercicio 3.11 • De una población de 300 pacientes con depresión, de los cuales el 30 por 100 sufre alteraciones somáticas, un psicólogo clínico extrae una muestra aleatoria simple de 16 sujetos. Según esto: ¿Cuál es la probabilidad de que haya como mínimo 10 sujetos que sufran alteraciones somáticas en esta muestra? • Ejercicio 3.12 • Suponiendo que según los últimos datos del I.N.E. (Instituto Nacional de Estadística) la probabilidad de nacimiento de niñas en la población española es 0,51, averiguar la probabilidad de que una familia de seis hijos tenga: • a) como mínimo una niña; • b) como mínimo un niño.
Ejercicios • Ejercicio 3.13 • En un sondeo sobre la actitud hacia la donación de órganos se encuentra que en una determinada población hay un 80% de sujetos que están a favor. Si se extrae una muestra aleatoria de 10 sujetos obtenga lo siguiente: • a) Probabilidad de que 4 personas estén a favor • b) Probabilidad de que más de 4 personas estén a favor • c) Probabilidad de que menos de 4 personas estén a favor • d) Probabilidad de que como máximo 4 personas estén a favor • e) Probabilidad de que como mínimo haya 7 personas a favor • f) Probabilidad de que estén a favor al menos el valor esperado de sujetos que están a favor • g) ¿Qué puntuación le corresponde al percentil 89? • h) Probabilidad de que estén en contra 4 o más personas