1 / 42

Distribución Normal o gaussiana

Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad. Una  distribución normal  de  media μ  y  desviación típica σ  se designa por  N(μ, σ) . Su gráfica es la  campana de Gauss :. Definición.

anne
Download Presentation

Distribución Normal o gaussiana

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Distribución Normal o gaussiana

  2. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad

  3. Una distribución normal de media μ y desviación típica σ se designa por N(μ, σ). Su gráfica es la campana de Gauss:

  4. Definición • Se dice que una variable aleatoria X se encuentra normalmente distribuida si su función de densidad está dada por

  5. El 99% de los datos se encuentra entre el promedio y 3 desviaciones estandar

  6. Calculo de probabilidades distribución normal

  7. Ejemplo • Se sabe que la longitud de las alas extendidas de un tipo de ave rapaz es una variable aleatoria que sigue una distribución Normal, de media 120 cm. y desviación típica 8 cm. X → N (120; 8) Calcúlese la probabilidad de que la longitud de un ave elegida al azar sea: • a.- Mayor de 130 cm • b.- Menor de 100 cm • c.- Esté comprendido entre 110 y 130 cm

  8. Distribución Normal Típica • La forma anterior de calculo de probabilidad resulta muy difícil de calcular, • Ante lo cual se realiza un cambio de parámetro y se cambia la variable x por la variable z y se pasa de la distribucón normal general a la distribución normal tipica

  9. Una variable aleatoria continua, X, sigue una distribución normal de parámetros = µ= 0 y σ = 1

  10. Y su función de densidad es: • µ =0 y σ = 1

  11. Por lo tanto debemos realizar el cambio de variable

  12. Calculo de probabilidad distribución normal tipificada

  13. Suponga que x tiene una distribución normal con normal µ =10 y σ = 2 • Calcular • P(x<13) • P(x>9) • P(6≤x≤14)

  14. Ejemplo • Se sabe que la longitud de las alas extendidas de un tipo de ave rapaz es una variable aleatoria que sigue una distribución Normal, de media 120 cm. y desviación típica 8 cm. X → N (120; 8) Calcúlese la probabilidad de que la longitud de un ave elegida al azar sea: • a.- Mayor de 130 cm • b.- Menor de 100 cm • c.- Esté comprendido entre 110 y 130 cm

  15. Muestreo • Población • Es un conjunto finito o infinito de elementos cuyas características se desean estudiar

  16. Muestra • Subconjunto de la población Muestreo • Procedimiento para obtener una muestra Parámetros Son ciertos valores numéricos fijos que pueden describir las características de una población (promedio, varianza, proporción)

  17. Inferencia estadística • Es un tipo de inferencia inductiva que permite generalizar las conclusiones obtenidas en una muestra de la población a todos los elementos de la población. • La generalización de las conclusiones obtenidas en una muestra a toda la población está sujeta a riesgos por cuanto la muestra se debe seleccionar con un muestreo probabilístico

  18. El estudio de la inferencia estadística se acostumbra a dividir en 3 partes. • Estimación puntual • Estimación por intervalo • Contraste de hipótesis.

  19. Diseño de muestreo • Es el plan que se llevará a cabo para seleccionar la muestra, de tal manera que exista un conocimiento bien fundado de que la muestra sea representativa

  20. Método de selección de la muestra Existen dos tipos de muestreo: el probabilístico y el no probabilístico. Con el muestreo probabilístico, todos los sujetos tienen la misma probabilidad de entrar a formar parte del estudio. La elección se hace al azar. El no probabilístico es aquel en el que no todos los sujetos tienen la misma probabilidad de formar parte de la muestra de estudio. • Los tipos de muestreo probabilísticos más utilizados son: aleatorio simple, aleatorio sistemático, aleatorio estratificado y aleatorio por conglomerados.

  21. Muestreo aleatorio simple: Muestra seleccionada de manera que cada elemento o individuo de la población tenga las mismas posibilidades de que se incluya. Por ejemplo, los números del cartón de los juegos de azar es una muestra aleatoria imple ya que todos los números tienen igual probabilidad de salir.

  22. Muestreo aleatorio sistemático: Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población. El k se calcula dividiendo el total de la población por la muestra necesaria: k = N/n • . Si se tiene una población de 8 000 individuos y el tamaño de la muestra necesario es de 400, se seleccionará uno de cada 20, que será la fracción de muestreo (8 000/400). Para decidir por cuál se ha de comenzar, se selecciona aleatoriamente, o por sorteo, un número del 1 al 20, y a partir de dicho número se va seleccionando a un sujeto de cada 20.

  23. Muestreo aleatorio estratificado: Una población se divide en subgrupos según alguna característica, y se forman los denominados estratos y se selecciona al azar una muestra de cada estrato. La estratificación se suele hacer en función de diferentes variables o características de interés: género, edad, situación laboral, etc. • Por ejemplo, si se desea efectuar una estratificación por género y se sabe que en la población la distribución es de 55 mujeres y 45 hombres, por tanto, si el tamaño de la muestra es de 400, se elegirán aleatoriamente 220 mujeres y 180 hombres.

  24. Definición de intervalo de confianza • Dada una muestra aleatoria simple (X1, X2,…, Xn) de una variable aleatoria X se llama intervalo de confianza para un parámetro θ, con nivel o coeficiente de confianza “1-α”, 0< α < 1, a un intervalo aleatorio (dado que sus extremos dependen de las muestras elegidas)

  25. Nivel de Confianza. • Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro. (1-α)

  26. Estimación de Intervalos de confianza para la media • Caso 1 • La muestra es seleccionada de una población con distribución normal y varianza poblacional conocida • µ є [ x - z1-α/2 *σ/√n , x + z1-α/2 *σ/√n]

  27. Caso 2 • La muestra es seleccionada de una población que tiene una distribución cualquiera con media µ y varianza σ2 conocida. En este caso n ≥30 • µ є [ x - z1-α/2 *σ/√n , x + z1-α/2 *σ/√n]

  28. Caso 3 • La muestra aleatoria es seleccionada de una población distribuida de manera normal pero los parámetros σ,µ (poblacionales) son desconocidos y n≤30 • µ є [ x - t1-α/2 (n-1)*s/√n , x +t1-α/2 (n-1) *s/√n]

  29. Datos importantes

  30. Como consecuencia de la falta de gas registrada en la ciudad de La Plata, en los meses de invierno, la Empresa Camuzzi - Gas Pampeana decide hacer un estudio para determinar la cantidad gastada en este combustible para calefacción casera en un año en particular. Con tal motivo se selecciona una muestra de n = 64 hogares de la ciudad. La media muestral del gasto en gas para calefacción resultó de $83,6. Se sabe por experiencia que la desviación estándar de la población es $17,8. • a) Halle un intervalo de confianza del 95% para el gasto promedio anual en este tipo de • combustible en las viviendas de la ciudad de La Plata. • b) Calcule un intervalo de confianza del 99% para ese gasto promedio anual.

  31. . Se encuentra que la concentración promedio de zinc de una muestra de 36 cereales es de 2.6 gramos por miligramo. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el cereal. Suponga que la desviación estándar de la población es 0.3 y los datos se distribuyen de manera normal.

  32. Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio de nicotina de 1.6mg. y una desviación típica de 0.7mg. Suponiendo que la variable X=“contenido de nicotina en un cigarrillo”, sigue una distribución N(µ; σ), obténgase un intervalo de confianza al 99% � del contenido medio de nicotina por cigarrillo en esa marca.

  33. Una empresa fabrica bombillas cuya duración en horas sigue una distribución N(µ; 200). • Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constrúyase un intervalo de confianza al nivel del 95%, 99 % � para la vida media de las bombillas fabricadas por esa fábrica.

  34. Error muestral y tamaño muestral Error muestral E= Tamaño muestral N=

  35. La desviación típica de la altura de los habitantes de un país es de 8 cm y los datos se distribuyen de manera normal . Calcular el tamaño mínimo que ha de tener una muestra de habitantes de dicho país para que el error cometido al estimar la altura media sea inferior a 1 cm con un nivel de confianza del 90%

  36.  La Consejería de Trabajo planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 95% y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que empleemos?.

  37. Intervalo de confianza para una proporción

  38. Intervalo de confianza para una proporción

  39. Error muestral E= Tamaño Muestral

  40. Se quiere estimar el resultado de un referéndum mediante un sondeo. Para ello se realiza un muestreo aleatorio simple con n=100 personas y se obtienen 35% que votarán a favor y 65% que votarán en contra (suponemos que no hay indecisos para simplificar el problema a una variable dicotómica). Con un nivel de error del 5%, calcule un intervalo de confianza para la verdadera proporción de las elecciones.

  41. Tomada al azar una muestra de 500 personas en cierta comunidad, se encontró que 220 personal leían el periódico habitualmente. Calcula con un nivel de confianza de 90%, 95% y 99% el intervalo en que se encontrará la verdadera proporción de electores

  42. Una multinacional está estudiando la posibilidad de instalar un nuevo sistema de producción en sus empresas; antes de hacerlo decide consultar a sus trabajadores. Como no tienen ninguna referencia previa sobre la opinión de sus empleados, supone que tal opinión está dividida en partes igual 50% a favor y 50% en contra. Si desea una fiabilidad del 99% con un error máximo del 4% ¿Cuál debe ser el tamaño mínimo de la muestra?

More Related