530 likes | 1.12k Views
XS-104 Estadística I. Yadira María Alvarado Salas III Cuatrimestre 2013 - UNED. Capítulo 1. Naturaleza de la estadística. 1 Introducción. Es posible que todo lector del libro de texto, crea conocer lo que es estadística.
E N D
XS-104 Estadística I Yadira María Alvarado Salas III Cuatrimestre 2013 - UNED
Capítulo 1 Naturaleza de la estadística
1 Introducción • Es posible que todo lector del libro de texto, crea conocer lo que es estadística. • Es casi seguro que esa definición no coincidirá con la de otro lector. • Esto es así porque: • La palabra estadística es utilizada en varios sentidos. • Los propios estadísticos ponen de relieve unos aspectos o aplicaciones más que otros.
2 Datos estadísticos o estadísticas • Se asocia la palabra estadística con: • Publicaciones censales. • Noticias sobre producción. • Nacimientos, admitidos a la U, accidentes de tránsito. • Cuadros o gráficos en revistas o periódicos. • Cifras o porcentajes utilizados en discursos políticos. • Este sentido corresponde al plural estadísticas, el cual se utiliza para indicar: • Un conjunto de datos numéricos organizados, resumidos y presentados para perfilar un fenómeno de interés, como: • Estadísticas de población, de producción industrial o un campeonato de fútbol. • Un término más apropiado es “datos estadísticos”.
2 Datos estadísticos o estadísticas • No todo tipo de información es un dato estadístico: • Número aislado: • Si no se puede comparar o no muestra una relación significativa con otros números, no es un dato estadístico. • Ejemplos: • Los datos de un paciente en un hospital (temperatura de un paciente). • Monto, plazo y tasa de un solo préstamo. • Datos estadísticos: • Números referidos a una misma CARACTERÍSTICA. • Le interesa los patrones o regularidades que presenta un conjunto de datos, los cuales se puedan comparar, analizar o interpretar. • Ejemplos: • Los datos de un grupo de pacientes con la misma dolencia (temperatura promedio de un grupo de pacientes). • Monto, plazo y tasa de varios créditos.
3 La estadística como disciplina científica • La estadística es un campo del conocimiento. • Es una disciplina científica que se dedica a: • Desarrollo de la teoría y aplicación de técnicas. • Técnicas apropiadas para recolectar, clasificar, presentar, analizar e interpretar información cuantitativa. • Obtenidas por observación o experimentación. • Como ciencia, la estadística se concibe como: • Una rama de las matemáticas aplicadas. • Pero también incluye elementos teóricos y técnicas propias. • Es una herramienta esencial de la investigación en casi todos los campos de la actividad humana.
4. Unidad estadística, característica y observación • Unidad estadística • Es la unidad sobre la cual se hacen las mediciones. • Característica • Es la variable de interés. • Observación • Es el valor observado en una determinada unidad estadística. • Observaciones • Conjunto de observaciones o datos recolectados.
5. El concepto de población • La población es el total o el agregado de las unidades de estudio. Ejemplos: • Una investigación dirigida a conocer el ingreso mensual de las familias del Área Metropolitana de San José: • Unidad de estudio: la familia residente en esa zona geográfica. • Población: el conjunto de familias que viven en esa zona, en el momento del estudio. • Un profesor de matemática está interesado en analizar el rendimiento de sus alumnos de primer año de secundaria y tiene 2 grupos, uno de 26 y otro de 28 alumnos: • La población objeto de estudio es de 54 alumnos. • Un agrónomo zootecnista aplica una nueva dieta a una muestra de 20 vacas Holstein para determinar su efecto sobre la producción de leche: • La poblaciónestá dada por todas las reses de esa raza a las que se les podría aplicar la dieta.
5. El concepto de población • Una población puede ser finita o infinita: • Ej finita: conjunto de familias en el Área Metropolitana. • Ej infinita: procesos que se repiten indefinidamente. • El análisis se hace con los valores observados y no con las unidades estadísticas. • Unidad de estudio: familia residente en el AM. • Población: todas las familias residentes en el AM. • Población: conjunto de valores de esas familias. • La población la constituyen el conjunto de números. • Un mismo conjunto de unidades puede dar origen a diferentes poblaciones.
Uso del muestreo • Se toma una parte de la población (muestra) y se generalizan los resultados • Es un procedimiento inductivo, de una inferencia que se hace de la parte hacia el todo • El riesgo es que la parte seleccionada no sea representativa del todo • Dos factores básicos para lograr que la muestra sea representativa: • El tamaño de la muestra: cuanto mayor sea, mayor representatividad • Forma de selección
Uso del muestreo • El tamaño de la muestra depende de: • La homogeneidad de los elementos de la población • El nivel de precisión deseado para las estimaciones • El grado de confianza que se quiere en la inferencia • Cuanto más homogénea sea menor el tamaño de la muestra • Cuándo usar muestras: • Cuando la población es infinita o muy grande • Cuando es muy costoso y requiere mucho tiempo • Cuando la unidad de estudio se destruye o se transforma • Cuando los resultados de la muestra son suficientemente precisos
Selección de la muestra • Se distinguen tres formas de selección: • Aleatoria o al azar: cada elemento tiene una probabilidad conocida y no nula de ser seleccionado. • Caso particular: todos los elementos tienen la misma probabilidad • Intencional: se utiliza el juicio de una persona con experiencia y conocimiento • Conveniencia: se escogen las unidades o elementos que están disponibles o son más fáciles de conseguir . Se corre el riesgo de que no sea representativa • Ejemplo: estimación de hogares con internet en AM • Si se extrae en Los Pinares, no es representativa. • Si se usa el juicio de un experto, sería más representativa, pero sesgada • Con un procedimiento aleatorio, podría no ser representativa, pero produce errores aleatorios
Selección de la muestra • La representatividad de la muestra no está plenamente garantizada en las selecciones • Existen discrepancias entre el resultado de la muestra y el valor de la población • Los estadísticos utilizan muestras al azar porque: • Aunque esas discrepancias tienen magnitudes y sentido que no pueden predecirse, • la selección al azar las produce como errores aleatorios o de muestreo • Tienen su origen exclusivamente en el hecho de ser una muestra al azar • La selección intencional o por juicio, en cambio, produce sesgos de selección.
Selección de la muestra • Los sesgos son errores sistemáticos, es decir, en un solo sentido y pueden ser: • Sesgos de selección: se presentan cuando se utilizan muestras • Sesgos de medición: son comunes a censos y a muestras (ej. Ingresos). • En general los sesgos se desconocen, por lo que no se pueden evaluar ni corregir • Los errores de muestreo no son predecibles individualmente, pero sí en muestras sucesivas • Pueden ser descritos con un modelo de probabilidades • Pueden utilizarse para evaluar la confianza que merece el resultado de una sola muestra.
Selección de la muestra • Los sesgos de selección no pueden ser evaluados o medidos con un modelo • Los errores de muestreo, por su naturaleza aleatoria, sí pueden ser evaluados y medidos • El muestreo aleatorio o probabilístico se prefiere porque: • Elimina los sesgos de selección • Produce errores aleatorios que son medibles utilizando modelos probabilísticos • El error de muestreo puede hacerse pequeño, aumentando el tamaño de la muestra. • En muestras pequeñas, es más apropiado la selección intencional que la aleatoria.
La tabla de números al azar • Gran número de dígitos obtenidos por un proceso que garantiza aleatoriedad • En Excel se tienen las funciones: • ALEATORIO() • ALEATORIO.ENTRE(1;60) • También existen los métodos computarizados que generan muestras de números aleatorios
Atributos y variables • El análisis estadístico se realiza con datos que provienen de la operación de medir o contar • Ejemplos: peso (medir), cantidad de hijos (contar) • Los atributos o cualidades se definen bajo categorías • Ejemplos: estado conyugal (soltero, casado, viudo, divorciado, separado, unión libre • Para su manejo electrónico se les asigna números únicamente con fines de clasificación (códigos) • No es lícito ejecutar operaciones aritméticas con esos códigos • Cuando se mide una característica que difiere de unidad a unidad, se le llama variable.
Atributos y variables • Cuantitativas: peso, número de hijos • Cualitativas o atributos: estado civil. • Cuantitativas continuas: variables con cualquier valor en un intervalo de números reales • Una variable es continua si teóricamente puede tomar cualquier valor en el intervalo. Ej: peso, estatura, velocidad, edad • Cuantitativas discretas o discontinuas: variables cuyos valores son numerables • No puede asumir todos los valores dentro de un intervalo, sino un número finito. Ej: cantidad de goles, octavos de kg de mantequilla
Estadística descriptiva yEstadística inferencial • Estadística descriptiva: descripción del conjunto de datos observados • Técnicas: cuadros, gráficos, promedios, porcentajes y medidas de variabilidad • Estadística inferencial: obtención de conclusiones o inferencias que se generalizan a la población de la cual fueron extraídas las unidades • Proceso inductivo: se toma una parte (muestra), se examina y los resultados se generalizan al conjunto o universo (población) • 2 problemas para la toma de la muestra: el tamaño de la muestra y el método de selección • 2 problemas para la generalización: método de generalización y medición del error asociado.
Capítulo 2 Fuentes de datos y Técnicas de recolección
Introducción • Para llevar a cabo un estudio (de investigación científica o de obtención de información estadística para la toma de decisiones) se plantea el problemas: • Qué tipo de datos se requieren • Cómo van a obtenerse esos datos • Cuáles procedimientos y cuidados se siguen para lograr que sean pertinentes y de buena calidad • Se deben recoger buenos datos ya que una técnica estadística esmerada y compleja no puede compensar la mala calidad de los datos • El investigador debe hacer lo posible por lograr información precisa y confiable
La obtención de la información estadística:datos existentes y no existentes
Fuentes primarias yfuentes secundarias • Fuente: origen de la información utilizada en el estudio o análisis. • Fuente primaria: se refiere a la institución (pública o privada o sin fines de lucro), o si es del caso la persona, que recogió primero los datos y produjo la estadística. Ejemplos: • INEC (Censos de población y vivienda, estadísticas vitales, Encuesta de Hogares, Índice de precios, permisos de construcción) • Banco Central (PIB, IMAE, tipo de cambio) • CCSS (estadísticas de seguridad social y atención) • Tribunal Supremo de Elecciones (electorales) • Una fuente primaria no es necesariamente una publicación.
Fuentes primarias yfuentes secundarias • Fuente secundaria: quien utiliza la información, en un estudio o análisis, no recolectó los datos estadísticos, sino que provienen de una fuente primaria ajena. • Ejemplos: • MIDEPLAN • Proyecto Estado de la Nación • Organización de las Naciones Unidas • Organización Internacional del Trabajo • Términos análogos a fuente primaria y secundaria • Datos primarios: recogidos por la misma persona o institución que los va a utilizar • Datos secundarios: recogidos por otra persona o institución.
La necesidad de evaluar las fuentes • El usuario debe asegurarse del grado de confianza que merecen los datos • Toda fuente debe evaluarse: • Cobertura e integridad del estudio • Calidad, confiabilidad, comparabilidad y pertinencia de los datos • Los datos de fuentes primarias, son en general, más confiables: • La fuente secundaria puede contener errores de transcripción • La fuente primaria incluye a menudo, definiciones • La fuente primaria incluye a menudo el cuestionario y procedimientos • La fuente primaria suele proporcionar más detalle • Una fuente secundaria con frecuencia omite parte de la información, o combina categorías
Técnicas para la recolección de datos no existentes • Experimento: procedimiento que somete a prueba una o varias hipótesis, mediante el manejo controlado de variables • Desventaja: debe realizarse en un ambiente artificial • Observación: el investigador observa lo que le interesa y registra sus observaciones (hoja de trabajo, contador, grabadora). Ejemplos • Ciencias físicas y naturales • Observación mecánica (rating) • Ciencias sociales (observación participante y no participante) • Entrevista cara a cara: visita del enumerador al informante (censos, encuestas) • Ventaja: el entrevistador está en control de la entrevista • Desventaja: costo elevado
Técnicas para la recolección de datos no existentes • Entrevista telefónica: especialmente en opinión pública, política y mercado • Ventajas: reduce costos y acorta el tiempo • Desventajas: se debe tener teléfono, no se puede usar material visual, y los cuestionarios no deben ser largos. • Correo: envío de cuestionario para que se llene y devuelva • Ventajas: es más cómodo y barato • Desventajas: • Las instrucciones deben ser claras y preguntas ordenadas • Se requiere alto nivel educativo de parte de la población • No se tiene control sobre quién responde • Alto porcentaje de "no respuesta" (datos no representativos)
Técnicas para la recolección de datos no existentes • Encuesta por Internet: primero se adjuntó el cuestionario, actualmente se coloca en un sitio web y se invita a las personas a responderlo • Ventajas: costo bajo y menor tiempo, posibilita la presentación de medios audiovisuales, cuestionario interactivo, información en tiempo real, rapidez en los resultados • Desventajas: no hay listados actualizados, la no respuesta puede ser baja, no hay control • Registro: se hace obligatorio el registro de ciertos hechos (oficinas públicas): matrimonios, nacimientos, defunciones, accidentes de tránsito • Ventaja: es muy barato • Desventaja: las personas no cumplen con las disposiciones legales (subregistro).
Técnicas para la recolección de datos no existentes • Encuestas autoadministradas a personas o grupos: el cuestionario es llenado por el informante (luego de una explicación), en presencia del entrevistador • Ventaja: técnica barata y cómoda, permite que se planteen dudas o se pidan explicaciones • Desventaja: requiere de “poblaciones cautivas” que no siempre corresponden al universo • Estos métodos se pueden combinar
Fases de una investigación estadística • Tres etapas principales: • Planeamiento y preparación • Ejecución del trabajo de campo • Procesamiento y análisis de los resultados • Etapas más detalladas • Definición del problema • Establecimiento de los propósitos específicos del estudio • Preparación de un plan de trabajo • Construcción del cuestionario • Diseño y selección de la muestra • Preparación y ejecución del trabajo y campo • Procesamiento de la información • Análisis e interpretación de los datos • Preparación del informe
Capítulo 3 El cuestionario
El cuestionario: características y funciones • La interrogación contempla dos pasos • Preparación de un cuestionario con preguntas de interés • Aplicación de ese cuestionario a los informantes • Factores que condicionan la entrevista • Grado de dificultad de la pregunta y medida de intimidad de las preguntas • Nivel de información, valores y sentido de autoestima del informante • Apariencia y actitud del entrevistador, vocabulario empleado • Presencia de otras personas
El cuestionario: características y funciones • Las funciones del cuestionario: son tres • Traducir necesidades de investigación a preguntas, que permitan obtener respuestas válidas y confiables • Guiar la entrevista y motivar al entrevistador para que comunique información veraz. • Facilitar el correcto registro de las respuestas y etapas siguientes (codificación y procesamiento)
El cuestionario: características y funciones • Primera función: traducir necesidades a preguntas • Investigar el problema, examinar exhaustivamente los datos existentes. • Pertinencia: no excluir preguntas claves, no incluir preguntas innecesarias, con excepción de las preguntas de “calentamiento” y las de transición. • DOS CUALIDADES FUNDAMENTALES que debe reunir el cuestionario: • Confiabilidad: una pregunta es confiable, si aplicada bajo las mismas condiciones, se obtienen respuestas similares. • Validez: una pregunta es válida si las respuestas reflejan lo que se quiere medir . • Considerar costo de entrevista y cansancio del informante.
El cuestionario: características y funciones • Segunda función: guiar la entrevista y ayudar al entrevistador • El cuestionario gobierna la entrevista • Son esenciales: el vocabulario, la redacción y orden de las preguntas, forma de discurrir el cuestionario • Tercera función: facilitar el correcto registro de las respuestas • La información debe expresarse en códigos • Presentarse en un archivo electrónico de datos • Dos pasos básicos: codificación de las respuestas y digitación de códigos. El cuestionario lo facilita porque: • Las preguntas cerradas son “precodificadas” • En las preguntas abiertas se les coloca el código al margen • La información se centraliza en un mismo documento
El cuestionario: características y funciones • Preguntas de la investigación y del cuestionario • La interrogante de investigación es de tipo abstracto • Existen problemas de lenguaje que provocan dificultades • Los entrevistados no son capaces de percibir y estructurar el tema • En el entrevistado hay desconfianza, temor, afán de prestigio que pueden falsear las respuestas • La investigación puede tener un gran componente inconsciente
La forma de las preguntas:abiertas y cerradas • Preguntas estructuradas o no • Grado de libertad que se le permite al entrevistado
La forma de las preguntas:abiertas y cerradas • Preguntas cerradas • Las opciones de respuestas se hallan limitadas o fijadas de antemano • Pueden ser: • Dicotómicas: sólo dos opciones (Ej sexo: femenino, masculino) • De opciones múltiples (Ej: estado conyugal) • Diferenciar entre opciones múltiples (sólo una respuesta es válida) y respuesta múltiples (se permiten varias respuestas) • ¿Posee usted automóvil? /___/ Sí /___/ No • Ejemplos en pág 73-74
La forma de las preguntas:abiertas y cerradas • Batería de preguntas • Bloque de preguntas que indaga varias dimensiones de un cierto tópico (opiniones, actitudes, conceptos, objetos, productos) • ¿Cuánta confianza le tiene a … Mucha Alguna Poca Ninguna Asamblea Legislativa /__/ /__/ /__/ /__/ Gobierno /__/ /__/ /__/ /__/ Tribunal Elecciones /__/ /__/ /__/ /__/ ICE /__/ /__/ /__/ /__/ Sala Cuarta /__/ /__/ /__/ /__/ • Ejemplos: pág 75-76
La forma de las preguntas:abiertas y cerradas • Preguntas abiertas • Permiten una respuesta libre, no limitada a alternativas preestablecidas. Ejpág 76 • Es común una pregunta abierta después de una cerrada. • Para usted ¿qué es tener éxito en la vida? _____________________________________________ _____________________________________________ • Ejpág 77
La forma de las preguntas:abiertas y cerradas • Pregunta abierta con registro cerrado • La pregunta es abierta con opciones preestablecidas • Las opciones no se le leen al informante. Ejpág 77 • ¿Usted ha sido víctima de algún delito durante el año pasado? 1 /__/ Violación del domicilio o robo 2 /__/ Robo en bolsillos o de cartera 3 /__/ Daños o destrucción de su propiedad 4 /__/ Ataques o golpes 5 /__/ Robo de automóvil 8 /__/ Otros (especifique) ___________________ 0 /__/ Nada
La forma de las preguntas:abiertas y cerradas • Pregunta semiabierta • Pregunta cerrada pero con posibilidad de que el entrevistado exprese una respuesta diferente • Cuando compra un pantalón de mezclilla, ¿a qué le da más importancia? 1 /__/ Marca 2 /__/ Talla 3 /__/ Tipo de tela 4 /__/ Precio 5 /__/ Otra (especifique) _________________________ 9 /__/ NS / NR
Ventajas y desventajas comparativas entre las preguntas abiertas y cerradas • Preguntas abiertas • Ventajas: • El interrogado contesta espontáneamente • El interrogado explica siguiendo su propia lógica • Desventajas: • Plantean problemas de procesamiento y de análisis • Pueden ser laboriosas en su manejo y requerir mucho tiempo • Preguntas cerradas • Ventajas: • Pueden ser formuladas rápidamente, fáciles de anotar • Quedan clasificadas en el mismo momento • Procesamiento y análisis relativamente sencillos. • Desventajas: • Pueden llegar a forzar al entrevistado a dar una respuesta • Puede no incorporar la opción adecuada a su opinión • La respuesta puede ser interpretada erróneamente.
Tipos de preguntassegún información que indagan • Preguntas de hechos: • Relativos a su persona, familia, organización, etc. • Podrían fáciles y precisas, otras no (ingreso) • Edad, lugar de residencial, nivel de educación. • Preguntas de acciones o conductas pasadas: • Realización de un acto. Ej: voto, marcas de café • Preguntas de intención: • Cómo actuaría si se presentara la ocasión, ej compras • Preguntas difíciles (recordar o imaginar) • Preguntas de opinión: • Se pide al individuo que diga lo que piensa, ej leyes nuevas • Preguntas de actitud: • Se asemejan a las de opinión, ej el aborto • Cada respuesta constituye un indicador de hecho o actitud
Detalles acerca de la construcción de cuestionarios • El orden de las preguntas • Evitar contaminación, preguntas de calentamiento, efecto embudo, preguntas amenazantes • Preguntas filtro • Preguntas canalizadoras a ciertos informantes • El número de preguntas y la duración del cuestionario • Restringir las preguntas difíciles, realizar un número razonable de preguntas. • La modulación de los cuestionarios • Módulo básico y módulo específico, aplicados en dos grupos
Detalles acerca de la construcción de cuestionarios • Algunos problemas frecuentes en la redacción de las preguntas • Tipo de lenguaje utilizado • Pregunta bidimensional o doble • La doble negación • Preguntas cargadas (sesgadas) (se sugiere respuesta) • Preguntas que suponen demasiado conocimiento • Instrucciones para el entrevistador • Las instrucciones deben aparecer en el cuestionario • La prueba del cuestionario • Identificar y eliminar problemas de mala redacción, mal ordenamiento, ítemes innecesarios, palabras con sesgos • Permite conocer la duración del cuestionario
Procesamiento de los datos • Revisión de los cuestionarios • Preguntas aplicadas • Respuestas ilegibles • Respuestas confusas • Eliminar inconsistencias • Respuestas extrañas o poco comunes • Codificación • Manual de códigos • Digitación o captura de los datos • Digitación directa en el disco duro del computador • Captura directa por los entrevistadores • Captura utilizando lectura óptica • Tabulación de los datos