1 / 50

Estadística Descriptiva: 1. Muestreo y Presentación de los Datos.

Estadística Descriptiva: 1. Muestreo y Presentación de los Datos. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María. Estadística: Dos conceptos fundamentales: muestra y población. Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones

sibyl
Download Presentation

Estadística Descriptiva: 1. Muestreo y Presentación de los Datos.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estadística Descriptiva:1. Muestreo y Presentación de los Datos. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

  2. Estadística:Dos conceptos fundamentales: muestra y población • Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones • Muestra: subconjunto de la población que se extrae para ser estudiado

  3. Estadística: ¿Porqué una muestra? • Imposibilidad o costo excesivo de realizar un censo en que se mide toda la población

  4. Estadística: Herramientas con dos Objetivos Básicos • Describir la muestra: Estadística Descriptiva: • Obtener conclusiones de la población a partir de la muestra: Inferencia Estadística.

  5. Marco Muestral: conjunto de elementos de la población suceptible de ser muestreada. Ejemplo: Domingo 24 Agosto en La Tercera Qué es la Estadística?Dos conceptos fundamentales: muestra y población

  6. Qué es la Estadística?Dos conceptos fundamentales: muestra y población ¿Porqué candidato votaría usted?

  7. Qué es la Estadística?Dos conceptos fundamentales: muestra y población Si la elección tuviera que definir entre ellos dos ¿Por cuál votaría usted?

  8. Qué es la Estadística?Dos conceptos fundamentales: muestra y población • Población Objetivo? • Marco Muestral? • Muestra?

  9. Técnicas de Muestreo¿Cómo recolectar los datos? • Muestreo No-Aleatorizado (o No-Probabilista) • Se basa en el juicio personal del investigador. • Puede generar buenas muestras pero no permite una evaluación estadística de confianza. • Muestreo Aleatorizado (o Probabilista) • Se controla la probabilidad de seleccionar un determinado individuo del marco muestral. • Permite estudiar objetivamente la confianza de las generalizaciones hacia la población objetivo.

  10. Técnicas de Muestreo¿Cómo recolectar los datos? • Muestreo Aleatorizado o Probabilista: • Muestreo aleatorio simple • Muestreo sistemático • Muestreo estratificado • Muestreo clusterizado • Muestreo no-Aleatorizado o no-Probabilista • Muestreo por convenciencia • Muestreo por juicio • Muestreo por cuota • Muestreo tipo “bola de nieve” (snowball)

  11. Técnicas de MuestreoMuestreo por Conveniencia • Los elementos de la muestra se eligen por estar en el lugar o en el momento adecuado para la investigación. • El criterio de selección (lugar, tiempo y demases) es completamente dependiente del investigador, sin reglas predeterminadas.

  12. Ejemplos: encuestas en la calle, encuestas a estudiantes, encuestas web Técnicas de MuestreoMuestreo por Conveniencia

  13. Técnicas de MuestreoMuestreo por Juicio • Un tipo de muestreo por conveniencia • Se selecciona de acuerdo a alguna característica especifica del encuestado juzgada por el encuestador • Clientes/Consumidores de un cierto tipo • Expertos en un tema o aspecto de la organización • Personajes “líderes de opinión”

  14. Técnicas de MuestreoMuestreo por Juicio

  15. Técnicas de MuestreoMuestreo por Cuota • Intenta mejorar la representatividad de la muestra separando a la población de acuerdo a variables de control: edad, sexo, raza, nivel socio-económico • A casa subgrupo o estrato se le asigna una cuota o proporción de muestreo, típicamente % de la población • Otros criterios: varianza. • Dentro del grupo se muestrea por conveniencia

  16. Técnicas de MuestreoMuestreo tipo bola de nieve • Se selecciona un grupo inicial (usualmente de forma probabilista aunque el resultado final no lo sea) • Los nuevos encuestados se seleccionan en base a las referencias de los encuestados anteriores, explotando sus “redes sociales” • Muy utilizado en ciencias sociales, cuando la característica a estudiar es rara o escasa y cuando es difícil conseguir encuestados.

  17. Técnicas de MuestreoMuestreo tipo bola de nieve (ejemplo)

  18. Técnicas de MuestreoMuestreo Aleatorio Simple • Cada elemento del marco muestral tiene la misma probabilidad de ser seleccionado y cada elemento se selecciona de manera independiente de los otros • con reemplazo: se pueden repetir elementos • sin reemplazo: no se pueden repetir elementos • Procedimiento: se indexa a la población y luego se elige un índice de manera aleatoria hasta completar el tamaño deseado de la muestra.

  19. Técnicas de MuestreoMuestreo Aleatorio Simple • Para muchos estudios se siguen utilizando tablas de números aleatorios aunque existen muchos algoritmos generadores de los mismos. • ¿cómo usar una tabla de números aleatorios?

  20. Técnicas de MuestreoMuestreo Aleatorio Simple

  21. Técnicas de MuestreoMuestreo Aleatorio Sistemático • Se elige un elemento de partida aleatoriamente y el resto se elige en sucesión hasta completar la muestra • Regla de sucesión: Si n es el tamaño de la muestra y N el de la población muestral se determina s = floor(N/n) • El genera un número aleatorio x. El k-ésimo seleccionado es (x+k·s) mod N • Se elige el x-ésimo • Luego el (x+s)-ésimo • Luego el (x+2s)-ésimo • etc

  22. Técnicas de MuestreoMuestreo Aleatorio Sistemático • ¿Tiene cada elemento la misma probabilidad de ser seleccionado? ¿tiene cada subconjunto la misma probabilidad de ser seleccionado? • Importante: el registro de donde se selecciona no debe presentar sesgo periódico, sino se reduce la representatividad de la muestra. • Si el registro está ordenado de acuerdo a lo que se estudia se puede aumentar la representatividad. • Se puede prescindir de identificar exactamente el tamaño del marco muestral

  23. Técnicas de MuestreoMuestreo Aleatorio Estratificado • Antes de seleccionar los elementos, se agrupa la población muestral en estratos de acuerdo a una variable importante: edad, sexo, • Objetivo: reducir la variabilidad que se puede observar dentro de cada estrato • Dentro de cada estrato se puede proceder con muestreo simple o sistemático • El número de elementos a elegir puede ser proporcional al tamaño o inversamente proporcional a la variabilidad del estrato

  24. Técnicas de MuestreoMuestreo Aleatorio ór Grupos • Se divide a la población en grupos lo más homogéneos entre ellos y lo más heterogéneos internamente • Se seleccionan aleatoriamente los grupos a encuestar ya sea de manera simple o sistemática • Cada grupo seleccionado se muestrea completamente: se toman todos sus elementos. • En ocasiones sólo se conocen los grupos y no los elementos que componen cada grupo.

  25. Técnicas de MuestreoMuestreo Aleatorio por Grupos • Ejemplo: Encuesta a los espectadores de una película: se muestrean los horarios a encuestar.

  26. En el muestreo aleatorizado se elige controlando la probabilidad de selección de los elementos. Mejorable segmentando.

  27. En el muestreo no aleatorizado se elige de acuerdo al criterio del investigador: por conveniencia o juicio. Mejorable segmentando.

  28. Técnicas de Muestreo

  29. Técnicas de Muestreo

  30. Técnicas de MuestreoTamaño de la Muestra (n) • Problema duro de la Estadística Inferencial • Criterios Generales • Qué se va a medir • Qué se quiere determinar • Nivel máximo de error admisible • Nivel de confianza con qué se quiere obtener la estimación del tamaño muestral • Variabilidad de las características a medir

  31. Estadística Descriptiva¿Cómo organizar y presentar los datos?

  32. Estadística DescriptivaExperimento, Medición y Tipos de Datos • El muestreo se realiza con el objetivo de llevar a cabo un experimento: observación, medición o registro de características o atributos de la población de las cuáles se tiene incertidumbre. • Lo último es lo que define un experimento • Se conocen los posibles valores, pero • No se sabe a-priori cuáles van a ser los resultados • Es repetible bajo condiciones esencialmente equivalentes

  33. Estadística DescriptivaExperimento, Medición y Tipos de Datos • Producto del muestreo y la medición obtenemos datos • Para propósitos estadísticos es útil distinguir entre los siguientes tipos de datos: • Numéricos o Cuantitativos • Cualitativos • Estructurados: formados por conjuntos de los anteriores, pero correspondientes a una misma medición (ejemplo: grafos, matrices)

  34. Estadística DescriptivaExperimento, Medición y Tipos de Datos • Numéricos o Cuantitativos: operables aritméticamente • Escala Intervalar: Tienen sentido las diferencias. • Escala de Razón: Tienen sentido los cuocientes. • Discretos/Continuos. • Cualitativos: • Categóricos: Son sólo nombres de referencia. • Ordinales: Se pueden jerarquizar u ordenar.

  35. Estadística DescriptivaExperimento, Medición y Tipos de Datos • Ejercicio: Deseamos estudiar los hábitos de estudio de un conjunto de sansanos y su impacto sobre el rendimiento académico • Sugiera variables a medir en cada una de las categorías definidas anteriormente

  36. Estadística DescriptivaConcepto Fundamental: Frecuencia • La frecuencia de un suceso en la muestra es el número de veces que éste se repite en la muestra (valor de una característica o de un subconjunto de valores). • Llamaremos frecuencia relativa a la fracción de veces que éste aparece en la muestra. • Si la frecuencia del suceso es k y la muestra es de tamaño n llamaremos: k/n

  37. Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles • Diagramas de sectores (“de torta”) • Diagramas de barras Estadística DescriptivaPresentación de los Datos

  38. Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles • Diagramas de Pareto: diagrama de barras ordenado descendentemente por frecuencia. Se suele incluir la frecuencia acumulada hasta cada elemento. Estadística DescriptivaPresentación de los Datos

  39. Estadística DescriptivaPresentación de los Datos

  40. Datos Ordinales: Los diagramas de barras se suelen ordenar de acuerdo a la jerarquía natural de los valores • posibles. Ejemplo: estratos económicos: Estadística DescriptivaPresentación de los Datos

  41. Datos Cualitativos: Cuando son muchos es posible agruparlos en subconjuntos, pero generados en gral. por criterios no-estadísticos. Estadística DescriptivaPresentación de los Datos

  42. Estadística DescriptivaPresentación de los Datos • Datos Cuantitativos: En universo de posibles valores es infinito o muy grande. En la muestra puede no repetirse ningún valor. ¿Cómo presentarlos?

  43. Estadística DescriptivaPresentación de los Datos • Datos Cuantitativos.Tabligrama: El último dígito se expresa separado de los más significativos. • Consideremos los siguientes datos

  44. 15 455677888888 16 000000122333345556677799 17 001233344456788 18 05 Estadística DescriptivaPresentación de los Datos • Datos Cuantitativos: Tabligrama

  45. Estadística DescriptivaPresentación de los Datos • Datos Cuantitativos.Tablas de frecuencias: Agrupar los valores en intervalos y registrar la frecuencia (relativa o absoluta) de ese grupo de valores en la muestra

  46. Estadística DescriptivaPresentación de los Datos • Tablas de frecuencias.¿Cuántos intervalos K considerar? ¿Cómo deben estar estos distribuidos? • Histograma: Los intervalos son todos del mismo tamaño y cubren uniformemente el rango de los datos. • Rango = máximo – mínimo • Amplitud de cada clase: A = (Rango+1)/K • 1er Intervalo: [a1,b1]=[(min – 0.5), (min – 0.5)+A] • 2do Intervalo: [a2,b2]=[b1, b1 + A] • … • k-ésimo: [ak,bk]=[bk-1, bk-1 + A]

  47. Estadística DescriptivaPresentación de los Datos K := N° Clases R := Rango = máx { xi } - mín { xi } = 162 - 107 = 55 A := Amplitud = ( R + 1 ) / K = ( 55 + 1 ) / 7 = 8 Límites 106,5-114,5 114,5-122,5 122,5-130,5 130,5-138,5 138,5-146,5 146,5-154,5 154,5-162,5 Marca 110,5 118,5 126,5 134,5 142,5 150,5 158,5 Frecuencias ABS - REL - REL. AC. 5 0,125 0,125 3 0,075 0,2 5 0,125 0,325 8 0,2 0,525 6 0,15 0,675 7 0,175 0,85 6 0,15 1

  48. Estadística DescriptivaPresentación de los Datos 9 Histograma 8 7 6 5 4 3 2 1 0 110,5 118,5 126,5 134,5 142,5 150,5 158,5

  49. Estadística DescriptivaPresentación de los Datos 9 Polígono de Frecuencias 8 7 6 5 4 3 2 1 0 102,5 166,5 110.5 118,5 126,5 134,5 142,5 150,5 158,5

  50. Estadística DescriptivaPresentación de los Datos 1 0.9 OJIVA 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 102,5 166,5 110,5 118,5 126,5 134,5 142,5 150,5 158,5

More Related