650 likes | 923 Views
Estadística II. Plutarco Martínez Bustos. Calendario académico 2014 – 2. Primer seguimiento: del 1 – al 6 de septiembre Segundo seguimiento: del 6 al 11 de octubre Tercer seguimiento: del 10 al 15 de noviembre. Contenido. Unidad I. Distribuciones de probabilidad discretas y continuas
E N D
Estadística II Plutarco Martínez Bustos
Calendario académico 2014 – 2 • Primer seguimiento: del 1 – al 6 de septiembre • Segundo seguimiento: del 6 al 11 de octubre • Tercer seguimiento: del 10 al 15 de noviembre
Contenido • Unidad I. Distribuciones de probabilidad discretas y continuas Distribución binomial, distribución de Poisson y distribución normal • Unidad II. Intervalos de confianza Intervalo de confianza para una y dos medias, intervalo de confianza para una y dos proporciones • Unidad III. Prueba de hipótesis Prueba de hipótesis para una y dos medias • Unidad IV. Uso del software estadística SPSS Tablas de frecuencia, gráficos, medidas de dispersión, de tendencia central, de forma, intervalos de confianza prueba de hipótesis. • Unidad V. Técnicas de muestreo Tipos de muestreo: Aleatorio simple, sistemático, estratificado por conglomerados.
Bibliografía • Levin Jack, Fundamentos de estadística en la investigación social. 2da edición, Harla. • Wayne D. Bioestadística Base Para el Análisis de las Ciencias de la Salud. 4ta edición, Limusa • Molina J y Rodrigo M. Estadística descriptiva en Psicología. Material de clase. Disponible en: http://ocw.uv.es/ciencias-de-la-salud/pruebas-1/1-3/ejercicios-proyectos-y-casos/
Distribuciones de Probabilidad Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento si éste se llevase a cabo. Toda distribución de probabilidad es generada por una variable (porque puede tomar diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar) El conocimiento acumulado en Psicología ha permitido evidenciar como algunas variables de interés en este campo se distribuyen de un modo característico, esto es, tienen una distribución de probabilidad particular que se repite a lo largo del tiempo y para diferentes muestras.
Distribuciones de Probabilidad Variable aleatoria: Se define como cualquier característica medible que toma diferentes valores con probabilidades determinadas. Toda variable aleatoria posee una distribución de probabilidad que describe su comportamiento. Si la variable es discreta, es decir, si toma valores aislados dentro de un intervalo, su distribución de probabilidad especifica todos los valores posibles de la variable junto con la probabilidad de que cada uno ocurra. En el caso continuo, es decir, cuando la variable puede tomar cualquier valor de un intervalo, la distribución de probabilidad permite determinar las probabilidades correspondientes a con subintervalos de valores. Dentro de las distribuciones a tratar están: la distribución binomial, de Poisson (distribuciones discretas) y la distribución normal (continua)
Distribución Binomial La distribución binomial es una distribución discreta muy importante que surge en muchas aplicaciones bioestadísticas. Esta distribución aparece de forma natural al realizar repeticiones independientes de un experimento que tenga respuesta binaria, generalmente clasificada como “éxito” con una probabilidad y un “fracaso” con una probabilidad . Por ejemplo, esa respuesta puede ser el hábito de fumar (sí/no), si un paciente hospitalizado desarrolla o no una infección. La distribución de probabilidad de la variable aleatoria binomial es:
Distribución Binomial Con Dónde: Probabilidad de éxito : Probabilidad de fracaso : numero de éxitos : Número de experimentos
Ejemplos 1. Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. 2. En el programa de Psicología la probabilidad de que un estudiante apruebe el semestre es del 90%. Si consideramos 6 estudiantes, ¿Cuál es la probabilidad de a. Tres estudiantes ganen b. Tres pierdan c. menos de dos pierdan d. 5 ganen
Ejemplos 3. En la población colombiana la proporción de mujeres es de 0.60, ¿cuál es la probabilidad de que al extraer una muestra aleatoria de 7 personas de esa población, a. Dos son mujeres b. al menos 5 son mujeres. 4. Los alumnos de cierta clase se encuentran en una proporción del 67 % que estudian inglés y el resto francés. Tomamos una muestra de 15 alumnos de la clase, calcular la probabilidad de que: a. Menos de tres alumnos de inglés. b. De que los 15 alumnos estudien francés c. De que estudien inglés entre 8 y 10 alumnos.
Distribución de Poisson Los experimentos que resulten en valores numéricos de una variable aleatoria X, que representa el número de resultados durante un intervalo o una región específica se llama experimento de Poisson. Esta distribución esta dada por: Con Donde: es el número promedio por resultados y
Ejemplos 1. El psicólogo de una institución atiende en promedio a 6 pacientes por día. Hallar la probabilidad de que se atiendan • Cuatro pacientes en un día • Mas de tres pacientes en un día 2. La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de que entre 800 recién nacidos hayan 5 pelirrojos?
Ejemplos 3. La probabilidad de que una persona adquiera una enfermedad como consecuencia de la vacuna contra la misma es de 0.0003. Hallar de que la adquieran exactamente 5 personas de una población de 30000 vacunados. 4. La probabilidad de que un estudiante presente problemas de escoliosis en una institución de la ciudad es de 0.006. De los siguientes 2000 estudiantes revisados, encuentre la probabilidad de que: • Menos de 3 presenten este problema • 3, 4, o 5 presenten este problema • Mas de 2 presentan este problema
Distribución Normal Se trata de un modelo teórico de distribución de probabilidad para variables aleatorias cuantitativas continuas que se caracteriza, gráficamente, por tener forma similar a la de una campana. Por ello, y por haber sido estudiada inicialmente por el matemático Karl Gauss, se le denomine también como curva o campana de Gauss. La importancia de esta distribución reside en el hecho de que diversas variables, como los caracteres fisiológicos y morfológicos de individuos —altura, peso, atributos sociológicos, psicológicos y, en general, variables que vienen determinados por muchos factores, se distribuyen según el modelo de la curva normal.
Distribución Normal En el caso de la distribución normal de parámetros y , dicha función viene dada por: Donde : Media poblacional : Varianza : Desviación típica o estándar
Ejemplos 1. Hallar las siguientes probabilidades
Ejemplos 2. Las estaturas de un grupo de estudiantes se distribuyen de acuerdo a una distribución normal de media 168 y desviación típica 8 cm. Hallar la probabilidad de que un estudiante mida: • Menos de 165 cm • Por lo menos 168 cm c. Entre 166 y 170 cm?.
Ejemplos 3. Los pesos de 60 estudiantes siguen una distribución Normal con media de 67 y desviación estándar de 5. Calcula la probabilidad de que el peso sea: a) mayor de 80 kg. b) 50 kg. o menos c) menos de 60 kg. d) como maximo 70 kg. e) Entre 60 y 70 kg.
Ejemplos 4. Las puntuaciones de un determinado test psicológico se distribuyen normalmente con media de 15 y desviación típica de 5. Hallar la probabilidad de que una persona obtenga: • Menos de 8 puntos b. Por lo menos 10 puntos c. Entre 13 y 16 puntos
Ejemplos 5. Las puntuaciones de un ejercicio de biología fueron 1,2, … dependiendo del número de respuestas correctas a 10 preguntas formuladas. La puntuación media fue de 6.7 y la desviación típica de 1.2. Suponiendo que las puntuaciones se distribuyen normalmente. Hallar: • Porcentaje de estudiantes que obtuvo menos de 6 puntos • La puntación máxima del 10% más baja de la clase • La puntuación mínima del 90% superior de la clase
Ejemplo 6. La puntuación media en un examen final fue de 72 y la desviación típica 9, El 97.5% de los mejores alumnos recibió la calificación A. ¿Cuál es la puntuación que un estudiante debe tener para recibir un A?
Intervalos de Confianza En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada. La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota
Intervalo de confianza para conociendo Si es la media de una muestra aleatoria de tamaño de una población con varianza conocida el intervalo de confianza para es: Donde es el valor de Z a la derecha del cual se tienen un área de
Ejemplos 1. Se ha obtenido una muestra de 35 alumnos de una Facultad para estimar la calificación media de los expedientes de los alumnos en la Facultad. El promedio de esos 35 estudiantes fue de 4.9. Se sabe por otros cursos que la desviación típica de las puntuaciones en dicha Facultad es de 2.01 puntos. Encuentre los Intervalo de confianza del 90 % y 99% para la calificación media de los expedientes de los estudiantes.
Ejemplos 2. En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una media de 32.7 puntos y una desviación típica de 12.64. Encuentre un intervalo de confianza de 95% para la media poblacional.
Ejemplos 3. En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para estimar la temperatura media de sus enfermos. La media de la muestra ha sido 37.1 °C y se sabe que la desviación típica de toda la población es 1.04 °C. Obtenga un intervalo de confianza, al 90 %, para la media poblacional.
Intervalo de confianza para con desconocida Si es la media de una muestra aleatoria de tamaño de una población con varianza desconocida el intervalo de confianza para es: Donde es un valor t Con grados de libertad del cual se tienen un área de
Ejemplos 1. El consumo regular de cereales preendulzados contribuye a la caída de los dientes, enfermedades del corazón y otros procesos digestivos de acuerdo con un estudio realizado. En una muestra aleatoria de 20 porciones sencillas de un cereal el contenido promedio de azúcar fue d 11.3 gramos con una desviación estándar de 2.45 gramos. Suponiendo que los contenidos de azúcar están distribuidos normalmente, determine un IC del 95% para el contenido promedio de azúcar de porciones sencillas de dicho cereal
Ejemplos 2. Se desea hallar un intervalo de confianza para la estatura promedio de todos los estudiantes de Psicología de cierta universidad. Para tal efecto, de los estudiantes de dicha carrera se seleccionó una muestra aleatoria de 15 personas a quienes se les preguntó su estatura en metros, obteniéndose los siguientes resultados: 1.50, 1.63, 1.50, 1.69, 1.69, 1.79, 1.73, 1.69, 1.56, 1.70, 1.65, 1.74, 1.70, 1.70, 1.65 Halle un intervalo de confianza del 95%. |
Ejemplos 3. La puntuación media de una muestra de 20 jueces de gimnasia rítmica, elegidos al azar, para una misma prueba, presentó una media de 9,8 y una desviación típica muestral de 0,09. Calcular un intervalo de confianza con un 90% para la nota media. (Suponemos que la variable que mide la puntuación sigue una distribución normal.)
Ejemplo 4. En un estudio de cáncer de pulmón se considera que su tamaño es una variable aleatoria con distribución aproximadamente normal. Una muestra de 8 pacientes ha proporcionado los resultados siguientes (en cm): 7,5 2,5 9,0 6,5 3,3 6,5 1,5 6,5 Determine un intervalo de confianza del 95% para el tamaño medio de este tipo de cáncer
Intervalo de confianza para una proporción Si es la proporción de éxito en una muestra aleatoria de tamaño n y , un intervalo de confianza aproximado de para el parámetro binomial es: Con Donde es el valor de con un área de
Ejemplos 1. En una muestra de 300 universitarios el 80% ha respondido que asiste semanalmente al cine. Entre que valores se encuentra, con un nivel de confianza del 95%, la proporción de universitarios que acude todas las semanas al cine. 2. En una encuesta realizada a 150 familias de una determinada población, se encontró que en 25 de ellas había tres o más hijos. Halle el intervalo de confianza para estimar la proporción real de las familias en las que hay tres o más hijos, con un nivel de confianza del 90%.
Ejemplos 3. En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 años, se encontró que el 17.6% eran hipertensas. Un intervalo de 95% de confianza para la proporción de mujeres hipertensas. 4. El 65% de los alumnos de cierta localidad utiliza con regularidad la biblioteca del pueblo. Halla un intervalo en el que se encuentre el 95% de las proporciones de alumnos que utilizan la biblioteca en muestras de tamaño 60.
Intervalo de Confianza para conociendo y Si y son las medias de muestras aleatorias independientes de tamaños de poblaciones con varianzas conocidas y respectivamente un IC para
Ejemplos 1. Un laboratorio está interesado en comparar el tiempo que tarda en sufrir efecto un fármaco nuevo con el del fármaco que comercializa actualmente. Sobre dos muestras independientes de 25 enfermos cada una. Se estudia el tiempo que tardan en remitir los síntomas, resultando para el actual una media muestral de 18.21 horas con una desviación estándar de 5.31. Para el nuevo la media ha sido de 16.82 con una desviación estándar de 4.05. Se suponen que los tiempos de remisión de los síntomas con ambos fármacos tienen distribuciones normal • Determine un IC del 95% para la diferencia de tiempos medios de remisión de los síntomas • ¿Es significativa la diferencia?
Muestreo En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población que son importantes para la investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir ejemplificar las características de ésta.
Métodos de Muestreo Clasificación Según el método de selección de unidades o elementos que componen una muestra, pueden clasificarse en dos grandes grupos, muestreo aleatorio y no aleatorio Muestreo Aleatorio: Denominado también muestreo probabilístico, se define como cualquier método de selección de una muestra que se basa en la teoría de probabilidad. Muestreo no aleatorio:Es un método de selección de una muestra sin utilización de aleatoriedad denominado también como muestreo sin norma, ya que los elementos se selección de cualquier manera
Tipos de Muestreo Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos. 1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.
Tipos de Muestreo 2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.
Tipos de Muestreo 3.- Muestreo aleatorio estratificado: Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).
Tipos de Muestreo 4.- Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.
Selección del tamaño de la Muestra Muestreo Aleatorio Simple(MAS) MAS para la varianza. Para hacer estimaciones de la varianza el tamaño de la muestra está dado por: Donde: N: Tamaño de la población Z: Es la desviación correspondiente al nivel de confianza. d: Es el error máximo admisible (asignada por el investigador). : Varianza
Ejemplo Se tiene una población de 1200 y su desviación estándar es de 450 y el error es de 100. Determine un tamaño de la muestra con una confianza de • 90% • 95%
Ejemplo = = 55.13 = 52.7≈53 b = = 77.79 = 73.05≈73
Selección del tamaño de la Muestra Muestreo para Proporciones: Este método se aplica cuando se trabaja con características cualitativas, denominadas también atributos. El tamaño de la muestra esta dado por: Donde: N: Tamaño de la población Z: Es la desviación correspondiente al nivel de confianza. D: Es el error máximo admisible (asignada por el investigador). p: Proporción de elementos de la población que tienen la característica a estudiar (asignada por el investigador) q: Proporción de elementos de la población que no tienen la característica a estudiar
Ejemplo 1. El orientador de una institución educativa desea observar que trastornos son los que se presentan con mayor frecuencia en los niños (as) de la institución donde labora, cuenta con una población de 3500 estudiantes y desea determinar un tamaño de muestra con una confianza del 95% (Z=1.96)y una proporción de estudiantes con trastornos del 90% y un error del 5%. Determine el tamaño de muestra deseado. 2. Se quiere realizar una encuesta a 27 estudiantes de Estadística II para determinar el grado de aceptación que tienen de la asignatura. Para ello se desea tomar una muestra con una confianza del 95%, un error de 8% y una proporción del 95%.
Ejemplo = = 138.3 = 133.04≈133 ¿Que sucede si se desea aumentar el margen de error al 8%? = = 54.02 = 53.2
Muestreo Estratificado Este método se emplea de preferencia, cuando se desea una selección más eficiente que la obtenida con el método aleatorio simple. Este proceso de estratificación requiere que la población se divida en grupos homogéneos llamados estratos, donde cada elemento tiene una característica tal que no le permita pertenecer a otro estrato.