190 likes | 310 Views
U.D.9 LA MUESTRA. 1.- Introducción. Análisis de los datos: Descriptivo: describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
E N D
1.- Introducción Análisis de los datos: Descriptivo: describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Inferencial: apoyándose en probabilidad y a partir de datos sobre una muestra, efectúa estimaciones, decisiones y generalizaciones sobre un conjunto mayor de datos.
2.- Conceptos y Elementos del Muestreo • Población/Universo: conjunto de elementos de los que se desea obtener información. • ELEMENTOS: empresas, familias, personas,… • Muestra: subconjunto extraído de la población para examinarlos e inferir resultados a la población • Muestreo: procedimiento que permite seleccionar la muestra. Fases: • Definir la Población objeto de estudio • Determinar el Marco Muestral: enumeración exhaustiva de todas la unidades de la población • Seleccionar el método de muestreo • Determinación del tamaño muestral • Obtener la muestra
Parámetro Poblacional: característica que se desea estudiar de la población. Se estima a partir de los datos obtenidos de la muestra. Ese valor se denomina Estimador Muestral • Error Muestral: error cometido por estudiar la muestra y no la población entera. A mayor muestra menor será el error. • Intervalo de confianza: conjunto de valores entre los que previsiblemente se encuentra el parámetro a estimar. • Nivel de confianza: probabilidad de que el parámetro se encuentre en el intervalo de confianza El error muestral es, habitualmente, 2 veces la desviación típica del estimador. Así el nivel de confianza es del 95,5% Si el error se considera 3 veces la desviación típica del estimador, el nivel de confianza es del 99,7%
3.- Método de Muestreo • Probabilístico • M. aleatorio simple • M. aleatorio sistemático • M. estratificado • M. por ruta aleatoria • M. por conglomerados • No probabilístico • M. de conveniencia • M. de juicios • M. por cuotas • M. bola de nieve
3.1.- PROBABILISTICO • Cada elemento de la población tiene una probabilidad conocida de ser elegido. • Las muestras se seleccionan al azar • Se puede conocer el error y nivel de confianza de las estimaciones • Los resultados se pueden generalizar • Más caro, lento y complicado que los probabilísticos
a) M. ALEATORIO SIMPLE IRRESTRICTO • Todos los elementos de la población tienen la misma probabilidad de ser elegidos. • Procedimiento: • Enumerar los elementos de 1 a N • Elegir n unidades de la muestra mediante una tabla de números aleatorios. • Recomendada para encuestas de pequeña escala
Para instalar una máquina expendedora de productos de bollería en un centro educativo situado en la ciudad de Granada, una empresa decide realizar una encuesta a los alumnos.
b) M. ALEATORIO SISTEMÁTICO • Selecciona un primer elemento al azar y el resto quedan determinados por éste. • Procedimiento: • Se ordenan los elementos de 1 a N • Se calcula el intervalo de selección “k”≤ N/n • Se elige un nº aleatorio entre 1 y k. se le denomina arranque aleatorio, a. • Los elementos de la muestra serán: a, a+k, a+2k… • Para poblaciones grandes, se usa mucho en investigaciones comerciales
c) M. ALEATORIO ESTRATIFICADO • La población de N individuos se divide en L estratos que son homogéneos entre sí y heterogéneos entre ellos. De cada estrato se elige una muestra de manera aleatoria o por asignación. (ni) • A. igual: reparto a iguales de la muestra entre los estratos: ni=n/L • A. Proporcional: reparto de la muestra entre los estrato de forma proporcional al tamaño de los estratos. ni= (Ni*n)/N • Permite estimaciones más precisas. La variable de estratificación debe relacionarse con la investigación.
Una editorial se plantea realizar un estudio para conocer las características preferidas por los alumnos en cuanto al formato de sus textos. N:4.000 estudiantes Variable de estratificación: nivel educativo Estratos (L): 3 - ESO - Bachillerato - Ciclos Formativos
d) M. POR RUTAS Se realiza una encuesta a hogares para analizar los usuarios de Internet en la ciudad de Murcia • Se le dan normas a los encuestadores sobre la ruta que debe seguirse en la selección de la muestra. Es el entrevistador, al azar, el que elige. e) M. POR CONGLOMERADOS • Las unidades muestrales son grupos formado a su vez por unidades muestrales ( ej: edificios). De ellos se obtiene mediante m.a.s otro grupo (ej: vivienda 4º B) y de este otro. Es un procedimiento polietápico (más de 1 etapa).
3.2.-NO PROBABILÍSTICO • La selección depende del investigador o entrevistador de campo, es subjetiva • No se apoya en probabilidad, y por tanto, no es posible calcular el error cometido ni el nivel de confianza. • Costes y dificultad del diseño son más reducidos.
a) M. DE CONVENIENCIA: elegir las unidades que mejor se adapten a las conveniencias del investigador. Ej: proximidad b) M. DE JUICIOS: la elección se deja en manos de expertos que sustituyen el azar Se desea realizar una encuesta piloto para instalar un establecimiento de peluquería de señoras en un barrio de la ciudad de Palencia. Se desea realizar una encuesta a empresas de la comunidad de Extremadura, para conocer sus necesidades en cuanto a programas informáticos
c) M. POR CUOTAS:fijar criterios que deben cumplir los individuos para ser parte de la muestra d) M. DE BOLA DE NIEVE: las unidades muestrales se incluyen por sugerencia de las unidades ya elegidas Encuesta de opinión sobre los líderes políticos según el nivel de estudios de los encuestados
4.- D.T.M - Tamaño de la Población (N). Puede ser finita o infinita - Nivel de confianza (Zα =k) : indica la probabilidad de que los resultados de nuestra investigación sean ciertos:. Un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de k más utilizados y sus niveles de confianza son: Los valores se obtienen de la tabla de la distribución normal estándar N(0;1) - Error muestral (d)deseado, en tanto por uno: es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la población y el que obtendríamos si preguntáramos al total de ella. Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían un producto y tenemos un error muestral del 5% comprarán entre 95 y 105 personas - Varianza poblacional (S² ). Se estima a través de una muestra piloto u otra encuesta - P : proporción de individuos que presentan la característica en estudio. El valor: q= 1-p Si no se tiene datos del valorde p, se estima que es 0,5 (50%) , que maximiza el tamaño muestral.
PARáMETROS A ESTIMAR: - MEDIAS (µ) - PROPORCIÓN (p)
ESTIMACIÓN DE MEDIASSe desea conocer el número de hogares que hay que considerar de una población de 500 hogares para conocer el consumo medio en bebidas alcohólicas. El error máximo admitido es de 3 euros y el nivel de confianza del 95,5%. Se ha estimado por encuestas similares que la varianza muestral es de 30 euros.
ESTIMAR PROPORCIONES ¿A cuántas personas tendríamos que estudiar para conocer la prevalencia de diabetes? Confianza = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral: ¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?