440 likes | 692 Views
Análisis Cuantitativo de Datos (Básico). Medicina Preventiva Facultad de Medicina UJED. ¿Para qué necesitamos la estadística?.
E N D
Análisis Cuantitativo de Datos (Básico) Medicina Preventiva Facultad de Medicina UJED
¿Para qué necesitamos la estadística? “… el mundo está lleno de variaciones, y a veces se hace difícil descubrir las verdaderas diferencias que surgen como consecuencia (de esas variaciones). La estadística no sería necesaria si todas las personas fueran idénticas” Norman y Streiner. Bioestadística.
Estadística La Estadística Descriptiva se dedica a la organización, resumen y presentación de los datos. La E. Inferencial nos permite hacer generalizaciones de la información obtenida, al obtenerla de una número pequeño de individuos y suponerla –de manera válida- para un número grande.
VARIABLES • son “cosas” que medimos, controlamos o manipulamos. • V. INDEPENDIENTES vs. V. DEPENDIENTES • Las v. independientes son aquellas que son manipuladas mientras que las dependientes son aquellas que solamente medimos.
Cómo medir las variables (1) • V. Nominales.- Mas que medir, las v. nominales clasifican. Consisten en categorías a las que se les asigna un nombre, sin que exista ningún orden implícito entre ellas: • Hombre / Mujer • Mexicano / Extranjero • Recibió Vacuna: SI / NO
Cómo medir las variables (2) • V. Ordinales.- Consisten en categorías que tienen un orden. • Clase Social: Alta / Media / Baja • Alumno : Excelente / Bueno / Regular / Malo
Cómo medir las variables (3) • V. Interválica. Tiene distancias iguales entre sus valores, por lo que se puede cuantificar y comparar las diferencias entre ellas. El punto “cero” es arbitrario. • Temperatura : Celsius ( Fahrenheit )
Cómo medir las variables (4) • V. Proporcional. Son como las v. interválicas, pero hay un punto “cero” no arbitrario. • Peso : Kilos ( libras ) • Talla : Centímetros (Pulgadas )
Descripción de los Datos En la descripción de datos, nos interesan dos cosas: • Dónde se juntan ( medidas de centralización ) • Cómo se reparten ( m. de dispersión )
M. De Centralización Moda.- Es el valor o la categoría que más se repite. Puede suceder que no haya moda, que exista un solo valor de la moda o que haya varios valores diferentes.
Moda El valor modal para el estado civil de las madres que viven en la col. Carlos Luna, es “Casada”.
M. De Centralización Mediana.- Es el valor que está “en medio” de una lista ordenada de datos. Deja la mitad de los valores observados por debajo de él y la otra mitad, por encima.
¿Mediana? ¿Cuál es la Mediana del Estado Civil de las Madres en la col. Carlos Luna?
M. De Centralización • Media.- Su nombre completo es Media Aritmética y también es conocida como Promedio. Se calcula sumando los valores observados y luego se divide esa suma entre el numero de valores sumados. Es una medida para variables interválicas y proporcionales.
M. De Centralización • Moda: 39 • Mediana: 36.00 • Media : 37.9
M. De Dispersión • Rango (Recorrido). Es la “distancia” que existe entre los valores máximo y mínimo de la variable Rango = Valor Mayor – Valor Menor De las mamás que viven en la col. Carlos Luna, quién mas hijos ha tenido reportó 13 ocasiones, mientras que la que menos, ha tenido 1 hijo. Rango = 13 - 1 Rango = 12
¿Qué significa “distancia”? 2 10 12
M. De Dispersión • Percentil. Es el valor de la variable correspondiente al porcentaje indicado en la frecuencia acumulada relativa P15: ¿Qué valor está en el 15% de la frecuencia acumulada relativa?
Percentiles P90 P70 P15 = 26 P40 = 34 P70 = 41.3 P90= 54 P40 P15
M. De Dispersión Percentiles “Destacados” • Cuartiles P25: ¿Qué valor está en el 25% de la frecuencia acumulada relativa?( llamado Q1 ) P50: ¿en el 50% ? ( Q2 o Mediana ) P75: ¿en el 75% ? ( Q3 ) • Deciles P10, P20, P30, … P80, P90
Cuartiles y Rango Intercuartil Q3 Q2 Q1=30 Q2=36 Q3=44 R. Intercuartil = Q3-Q1=14 Q1
M. De Dispersión Las medidas anteriores nos dicen “entre qué valores” está la información, pero eso no es suficiente. ¿ Están muy dispersos ? ¿ muy juntos ?
M. De Dispersión • Desviación Media: Es el promedio de las “distancias” entre cada observación y la Media de ellas. Las “distancias” son siempre positivas, por lo que debemos usar valores absolutos –que son complicados de manipular al momento de realizar los cálculos, aún con la computadora-
Moda = 3 Mediana = 3 Media = 3.88
M. De Dispersión Una alternativa para no usar valores absolutos en los cálculos, es usar el “cuadrado”. Varianza.- es el promedio del cuadrado de las “distancias” entre cada observación y la media de ellas. Desviación Estándar ( Típica ) .- Es la raíz cuadrada de la Varianza
Para el cálculo de la varianza, es necesario considerar todas las distancias, pero al cuadrado.
¿Qué podemos decir acerca del número de hijos de las mamás de la col. Carlos Luna?
Moda = 3 Mediana = 3 Media = 3.88
Q1 = 2 Mediana = 3 Q3 = 4.5