500 likes | 943 Views
Estadística Descriptiva: 1. Muestreo y Presentación de los Datos. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María. Estadística: Dos conceptos fundamentales: muestra y población. Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones
E N D
Estadística Descriptiva:1. Muestreo y Presentación de los Datos. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María
Estadística:Dos conceptos fundamentales: muestra y población • Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones • Muestra: subconjunto de la población que se extrae para ser estudiado
Estadística: ¿Porqué una muestra? • Imposibilidad o costo excesivo de realizar un censo en que se mide toda la población
Estadística: Herramientas con dos Objetivos Básicos • Describir la muestra: Estadística Descriptiva: • Obtener conclusiones de la población a partir de la muestra: Inferencia Estadística.
Marco Muestral: conjunto de elementos de la población suceptible de ser muestreada. Ejemplo: Domingo 24 Agosto en La Tercera Qué es la Estadística?Dos conceptos fundamentales: muestra y población
Qué es la Estadística?Dos conceptos fundamentales: muestra y población ¿Porqué candidato votaría usted?
Qué es la Estadística?Dos conceptos fundamentales: muestra y población Si la elección tuviera que definir entre ellos dos ¿Por cuál votaría usted?
Qué es la Estadística?Dos conceptos fundamentales: muestra y población • Población Objetivo? • Marco Muestral? • Muestra?
Técnicas de Muestreo¿Cómo recolectar los datos? • Muestreo No-Aleatorizado (o No-Probabilista) • Se basa en el juicio personal del investigador. • Puede generar buenas muestras pero no permite una evaluación estadística de confianza. • Muestreo Aleatorizado (o Probabilista) • Se controla la probabilidad de seleccionar un determinado individuo del marco muestral. • Permite estudiar objetivamente la confianza de las generalizaciones hacia la población objetivo.
Técnicas de Muestreo¿Cómo recolectar los datos? • Muestreo Aleatorizado o Probabilista: • Muestreo aleatorio simple • Muestreo sistemático • Muestreo estratificado • Muestreo clusterizado • Muestreo no-Aleatorizado o no-Probabilista • Muestreo por convenciencia • Muestreo por juicio • Muestreo por cuota • Muestreo tipo “bola de nieve” (snowball)
Técnicas de MuestreoMuestreo por Conveniencia • Los elementos de la muestra se eligen por estar en el lugar o en el momento adecuado para la investigación. • El criterio de selección (lugar, tiempo y demases) es completamente dependiente del investigador, sin reglas predeterminadas.
Ejemplos: encuestas en la calle, encuestas a estudiantes, encuestas web Técnicas de MuestreoMuestreo por Conveniencia
Técnicas de MuestreoMuestreo por Juicio • Un tipo de muestreo por conveniencia • Se selecciona de acuerdo a alguna característica especifica del encuestado juzgada por el encuestador • Clientes/Consumidores de un cierto tipo • Expertos en un tema o aspecto de la organización • Personajes “líderes de opinión”
Técnicas de MuestreoMuestreo por Cuota • Intenta mejorar la representatividad de la muestra separando a la población de acuerdo a variables de control: edad, sexo, raza, nivel socio-económico • A casa subgrupo o estrato se le asigna una cuota o proporción de muestreo, típicamente % de la población • Otros criterios: varianza. • Dentro del grupo se muestrea por conveniencia
Técnicas de MuestreoMuestreo tipo bola de nieve • Se selecciona un grupo inicial (usualmente de forma probabilista aunque el resultado final no lo sea) • Los nuevos encuestados se seleccionan en base a las referencias de los encuestados anteriores, explotando sus “redes sociales” • Muy utilizado en ciencias sociales, cuando la característica a estudiar es rara o escasa y cuando es difícil conseguir encuestados.
Técnicas de MuestreoMuestreo Aleatorio Simple • Cada elemento del marco muestral tiene la misma probabilidad de ser seleccionado y cada elemento se selecciona de manera independiente de los otros • con reemplazo: se pueden repetir elementos • sin reemplazo: no se pueden repetir elementos • Procedimiento: se indexa a la población y luego se elige un índice de manera aleatoria hasta completar el tamaño deseado de la muestra.
Técnicas de MuestreoMuestreo Aleatorio Simple • Para muchos estudios se siguen utilizando tablas de números aleatorios aunque existen muchos algoritmos generadores de los mismos. • ¿cómo usar una tabla de números aleatorios?
Técnicas de MuestreoMuestreo Aleatorio Sistemático • Se elige un elemento de partida aleatoriamente y el resto se elige en sucesión hasta completar la muestra • Regla de sucesión: Si n es el tamaño de la muestra y N el de la población muestral se determina s = floor(N/n) • El genera un número aleatorio x. El k-ésimo seleccionado es (x+k·s) mod N • Se elige el x-ésimo • Luego el (x+s)-ésimo • Luego el (x+2s)-ésimo • etc
Técnicas de MuestreoMuestreo Aleatorio Sistemático • ¿Tiene cada elemento la misma probabilidad de ser seleccionado? ¿tiene cada subconjunto la misma probabilidad de ser seleccionado? • Importante: el registro de donde se selecciona no debe presentar sesgo periódico, sino se reduce la representatividad de la muestra. • Si el registro está ordenado de acuerdo a lo que se estudia se puede aumentar la representatividad. • Se puede prescindir de identificar exactamente el tamaño del marco muestral
Técnicas de MuestreoMuestreo Aleatorio Estratificado • Antes de seleccionar los elementos, se agrupa la población muestral en estratos de acuerdo a una variable importante: edad, sexo, • Objetivo: reducir la variabilidad que se puede observar dentro de cada estrato • Dentro de cada estrato se puede proceder con muestreo simple o sistemático • El número de elementos a elegir puede ser proporcional al tamaño o inversamente proporcional a la variabilidad del estrato
Técnicas de MuestreoMuestreo Aleatorio ór Grupos • Se divide a la población en grupos lo más homogéneos entre ellos y lo más heterogéneos internamente • Se seleccionan aleatoriamente los grupos a encuestar ya sea de manera simple o sistemática • Cada grupo seleccionado se muestrea completamente: se toman todos sus elementos. • En ocasiones sólo se conocen los grupos y no los elementos que componen cada grupo.
Técnicas de MuestreoMuestreo Aleatorio por Grupos • Ejemplo: Encuesta a los espectadores de una película: se muestrean los horarios a encuestar.
En el muestreo aleatorizado se elige controlando la probabilidad de selección de los elementos. Mejorable segmentando.
En el muestreo no aleatorizado se elige de acuerdo al criterio del investigador: por conveniencia o juicio. Mejorable segmentando.
Técnicas de MuestreoTamaño de la Muestra (n) • Problema duro de la Estadística Inferencial • Criterios Generales • Qué se va a medir • Qué se quiere determinar • Nivel máximo de error admisible • Nivel de confianza con qué se quiere obtener la estimación del tamaño muestral • Variabilidad de las características a medir
Estadística Descriptiva¿Cómo organizar y presentar los datos?
Estadística DescriptivaExperimento, Medición y Tipos de Datos • El muestreo se realiza con el objetivo de llevar a cabo un experimento: observación, medición o registro de características o atributos de la población de las cuáles se tiene incertidumbre. • Lo último es lo que define un experimento • Se conocen los posibles valores, pero • No se sabe a-priori cuáles van a ser los resultados • Es repetible bajo condiciones esencialmente equivalentes
Estadística DescriptivaExperimento, Medición y Tipos de Datos • Producto del muestreo y la medición obtenemos datos • Para propósitos estadísticos es útil distinguir entre los siguientes tipos de datos: • Numéricos o Cuantitativos • Cualitativos • Estructurados: formados por conjuntos de los anteriores, pero correspondientes a una misma medición (ejemplo: grafos, matrices)
Estadística DescriptivaExperimento, Medición y Tipos de Datos • Numéricos o Cuantitativos: operables aritméticamente • Escala Intervalar: Tienen sentido las diferencias. • Escala de Razón: Tienen sentido los cuocientes. • Discretos/Continuos. • Cualitativos: • Categóricos: Son sólo nombres de referencia. • Ordinales: Se pueden jerarquizar u ordenar.
Estadística DescriptivaExperimento, Medición y Tipos de Datos • Ejercicio: Deseamos estudiar los hábitos de estudio de un conjunto de sansanos y su impacto sobre el rendimiento académico • Sugiera variables a medir en cada una de las categorías definidas anteriormente
Estadística DescriptivaConcepto Fundamental: Frecuencia • La frecuencia de un suceso en la muestra es el número de veces que éste se repite en la muestra (valor de una característica o de un subconjunto de valores). • Llamaremos frecuencia relativa a la fracción de veces que éste aparece en la muestra. • Si la frecuencia del suceso es k y la muestra es de tamaño n llamaremos: k/n
Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles • Diagramas de sectores (“de torta”) • Diagramas de barras Estadística DescriptivaPresentación de los Datos
Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles • Diagramas de Pareto: diagrama de barras ordenado descendentemente por frecuencia. Se suele incluir la frecuencia acumulada hasta cada elemento. Estadística DescriptivaPresentación de los Datos
Datos Ordinales: Los diagramas de barras se suelen ordenar de acuerdo a la jerarquía natural de los valores • posibles. Ejemplo: estratos económicos: Estadística DescriptivaPresentación de los Datos
Datos Cualitativos: Cuando son muchos es posible agruparlos en subconjuntos, pero generados en gral. por criterios no-estadísticos. Estadística DescriptivaPresentación de los Datos
Estadística DescriptivaPresentación de los Datos • Datos Cuantitativos: En universo de posibles valores es infinito o muy grande. En la muestra puede no repetirse ningún valor. ¿Cómo presentarlos?
Estadística DescriptivaPresentación de los Datos • Datos Cuantitativos.Tabligrama: El último dígito se expresa separado de los más significativos. • Consideremos los siguientes datos
15 455677888888 16 000000122333345556677799 17 001233344456788 18 05 Estadística DescriptivaPresentación de los Datos • Datos Cuantitativos: Tabligrama
Estadística DescriptivaPresentación de los Datos • Datos Cuantitativos.Tablas de frecuencias: Agrupar los valores en intervalos y registrar la frecuencia (relativa o absoluta) de ese grupo de valores en la muestra
Estadística DescriptivaPresentación de los Datos • Tablas de frecuencias.¿Cuántos intervalos K considerar? ¿Cómo deben estar estos distribuidos? • Histograma: Los intervalos son todos del mismo tamaño y cubren uniformemente el rango de los datos. • Rango = máximo – mínimo • Amplitud de cada clase: A = (Rango+1)/K • 1er Intervalo: [a1,b1]=[(min – 0.5), (min – 0.5)+A] • 2do Intervalo: [a2,b2]=[b1, b1 + A] • … • k-ésimo: [ak,bk]=[bk-1, bk-1 + A]
Estadística DescriptivaPresentación de los Datos K := N° Clases R := Rango = máx { xi } - mín { xi } = 162 - 107 = 55 A := Amplitud = ( R + 1 ) / K = ( 55 + 1 ) / 7 = 8 Límites 106,5-114,5 114,5-122,5 122,5-130,5 130,5-138,5 138,5-146,5 146,5-154,5 154,5-162,5 Marca 110,5 118,5 126,5 134,5 142,5 150,5 158,5 Frecuencias ABS - REL - REL. AC. 5 0,125 0,125 3 0,075 0,2 5 0,125 0,325 8 0,2 0,525 6 0,15 0,675 7 0,175 0,85 6 0,15 1
Estadística DescriptivaPresentación de los Datos 9 Histograma 8 7 6 5 4 3 2 1 0 110,5 118,5 126,5 134,5 142,5 150,5 158,5
Estadística DescriptivaPresentación de los Datos 9 Polígono de Frecuencias 8 7 6 5 4 3 2 1 0 102,5 166,5 110.5 118,5 126,5 134,5 142,5 150,5 158,5
Estadística DescriptivaPresentación de los Datos 1 0.9 OJIVA 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 102,5 166,5 110,5 118,5 126,5 134,5 142,5 150,5 158,5