170 likes | 519 Views
2. Muestreo y Mediciones. Variable – una característica que puede variar su valor entre los sujetos de una muestra o una población Tipos de variables Categóricas ( también llamadas cualitativas ) Cuantitativas (Hay diferentes métodos estadísticos para cada tipo ).
E N D
2. Muestreo y Mediciones • Variable – unacaracterísticaquepuedevariarsu valor entre los sujetos de unamuestra o unapoblación • Tipos de variables • Categóricas (tambiénllamadascualitativas) • Cuantitativas (Hay diferentesmétodosestadísticosparacadatipo)
Variable categórica– la escala de mediciónes un conjunto de categorías • Ejemplos: • Raza – grupoétnico (caucásico, afro-americano, hispano) • Afiliaciónreligiosa • Carreraprofesional • Identificaciónpolítica (Dem., Rep., Indep.) • Vegetariano? (si, no) • Evaluación de salud mental (buena, formación de síntomasleves, formación de síntomasmoderados, deteriorada)
Variable cuantitativa– posiblesvaloresdifieren en magnitud • Ejemplos: • Edad, altura, peso, IMC (índice de masa corporal) • Ingreso annual • Promedioescolar • Tiempoutilizado en Internet el día de ayer • Tiempo de reacción a un estímulo (p. ej., experimento de uso de celularmientras se maneja) • Número de “eventospersonales” en el añopasado
Escalas de medición Para variables categóricas, dos tipos: • Escala nominal – categorías no ordenadas • Preferenciaparapresidente, raza, género, afiliaciónreligiosa, carreraprofesional, temas de opinión (a favor o en contra, sí vs. no) • Escala ordinal – categoríasordenadas • Ideologíapolítica (muy liberal, liberal, moderada, conservadora, muyconservadora) • Ansiedad, estrés, auto-estima (alta, media, baja) • Discapacidad mental (ninguna, leve, moderada, severa) • Gastogubernamental en salud (superior, igual, inferior)
Para variables cuantitativas, conjunto de valoresposibles, escala de intervalo(p. ej., intervalonumérido entre cada par de valoresposibles) • Nota: En la práctica, variables categóricasordinales con frecuencia son tratadascomo de intervaloasignándolesvalores a lascategorías (p. ej., el promedioescolarestácompuesto de calificaciones A, B, C, D, E unaescala ordinal, pero se calculautilizando los valores 4, 3, 2, 1, 0) • El orden del tipo de variables del nivelmás alto al másbajo de diferenciación entre niveles: intervalo ordinal nominal
Otraclasificación: Discreta/Continua • Variable discreta – los posiblesvalores son un conjunto de númerosseparados, tales como 0, 1, 2, … • Ejemplo: Número de … Mensajes de e-mail enviados el día anterior • Variables continuas – númeroinfinito de posiblesvalores • Ejemplo: Número de horasutilizando Internet en el día anterior (En la práctica, la distinción no esclara)
Quétipo de variable es …? • Núm. de películas vistas en el verano (0, 1, 2, 3, 4, …) • Tipo de músicafavorita (rock, jazz, folcrórica, clásica, otra) • Cuantitativa o categórica? • Nominal, ordinal, o escala de intervalo? • Continua o discreta?
Datosrecolectados en un estudio • Encuesta: Muestrar personas de unapoblación y entrevistarlas • Ejemplo: General Social Survey. Resultadosdesde 1972 en sda.berkeley.edu/GSS (p. ej., teclear “heaven” y “sex” comonombres de variables) • Experimento: Compararrespuestas de sujetos en condicionesdiferentes, donde los sujetos son asignados a lascondiciones • Ejemplo: Estudio de salud – La aspirina reduce la posibilidad de ataque al corazón?
Aleatorización • Aleatorización– el mecanismoparaobtenerdatosconfiablesreduciendoposiblessesgos • Notación: n = tamaño de muestra • Muestreoaleatorio simple: En unaencuesta, cadamuestra de tamañonposibletiene la mismaoportunidad de ser seleccionada • Este es un ejemplo de un método de muestreoprobabilístico – Podemosespecificar la probabilidad de queunadeterminadamuestra sea seleccionada
Cómo se implementa el muestreoaleatorio? • Se utilizan “tablas de númerosaleatorios” o software estadísticoquegenerenúmerosaleatorios • Marco muestral (lista de todos los sujetos en la población) debeexistirpara implemental el muestreoaleatorio simple
Otrosmétodos de muestreoprobabilístico son: sistemático, estratificado, de conglomerados (libro de texto, pp. 21-24) • En muestreo no-probabilístico, no se puedenespecificar la probabilidad de lasmuestrasposibles. Inferenciasbasadas en estasmuestraspueden ser muypococonfiables • Ejemplo: muestras de voluntarios, tales comoencuestas en internet, por lo general estánmuysesgadas
Ejemplos: Muestras de voluntarios • Lou Dobbs (CNN) preguntó en (Agosto 26) Uberliberal Bill Maher says the American people are too stupid to decide whether Obama's unwritten health-care legislation is right for them, and that the president should just ram it through Congress. Do you believe that the president knows best on health care?” Yes, I agree we need his reforms 5% No thanks, I'll decide for myself 95% • Ejemplo en libro de texto (p. 20) sobrelasrespuestas del cuestionario en el libroWomen in Love (p. ej., se concluyeque 70% de lasmujerescasadas al menos 5 añostienenrelacionesextramaritales)
Experimentos vs. estudiosobservacionales • Encuestas son estudiosobservacionales(sólo se observansujetos sin manipulación experimental) • Experimentos: Investigadorasignasujetos a condicionesexperimentales • Sujetosdeben ser asignados a condicionesaleatoriamente (“tratamientos”) • Aleatorización “equilibra” los grupos de tratamientos con respecto a otras variables quepuedenafectar la respuesta (p. ej., característicasdemográficas), se hacemásfácilevaluarcausa y efecto
Error muestral • El error muestral de unaestadísticaes el error queocurrecuando se usaunaestadísticamuestralparapredecir el valor de un parámetropoblacional • Aleatorizaciónprotege contra sesgos, el error muestraltiende a fluctuaralrededor de 0 con un tamañopredecible • Existenmétodosparapredecir la magnitud (margen de error) p. ej., cuando se estima un porcentaje, se tiene no más de +3% ó -3%cuandonesaprox. 1000 (p. ej., encuesta de Gallup) • La dirección y el tamaño del sesgo se desconocencuando no se puedeemplearaleatorización
Otrosfactores • Otrosfactoresademás del error muestralpuedencausarque los resultadosvaríen de unamuestra a otra: • Sesgomuestral (p. ej., muestreo no-probabilístico) • Sesgo de respuesta (p. ej., preguntas mal redactadas, similares a aquéllas en encuestas de Lou Dobbs en loudobbsradio.com/surveyarchive) • Sesgo de no respuesta (sub-cobertura, informaciónfaltante) • Leer ejemplos pp. 19-21 del libro de texto
Nota: Resultados de encuestaspuedendepender mucho en la redacción de laspreguntas Ejemplo: Encuesta del New York Times en 2006: • “Favor gasoline tax?” 12% yes • “Favor gasoline tax … • to reduce U.S. dependence on foreign oil?” 55% yes • to reduce global warming?” 59% yes