220 likes | 668 Views
medidas de resumen. Procedimiento. En un programa para la detección de hipertensión en una muestra de 30 hombres en edades entre 30 y 40 años, la distribución de la presión diastólica (mínima) en mm Hg fue la siguiente:. Problema variable en estudio. Tipo de variable y escala de medida.
E N D
Procedimiento En un programa para la detección de hipertensión en una muestra de 30 hombres en edades entre 30 y 40 años, la distribución de la presión diastólica (mínima) en mm Hg fue la siguiente: Problema variable en estudio Tipo de variable y escala de medida Ordenar los datos, amplitud y número de clases La variable en estudio es : presión diastólica ( medida en mm de Hg) Tabla de frecuencias gráfico
Dentro de los tipos de variables y escalas de medida tenemos: Procedimiento tipos de variables escalas de medida Problema variable en estudio ejemplos categórica o de atributo Tipo de variable y escala de medida nominal raza, sexo ordinal calificaciones numéricas Ordenar los datos, amplitud y número de clases intervalo temperatura v continuasv discretas razón peso, altura Tabla de frecuencias La variable en estudio ( presión diastóloca ,mm de Hg) es numérica, continua . Escala de razón gráfico
Procedimiento Los datos ordenados en forma creciente: Problema variable en estudio Tipo de variable y escala de medida 60 La amplitud total = 120 – 60 = K Número de clases: Ordenar los datos, amplitud y número de clases = 6 clases K = 1 + 3.32log n = 5.90 Extensión del intervalo : h H = A/ K = 60/6 = 10 Tabla de frecuencias En este caso , entonces, la tabla de frecuencias tendrá aproximadamente 6 clases de amplitud 10 unidades en cada clase gráfico Otra forma de calcular k es n , en este caso 30 =5.48.Aproximando al entero superior, da 6 clases
Procedimiento Fr x F fr f 0.1 3 0.1 3 60 -70 Problema variable en estudio 6 0.2 9 0.3 70 -80 0.23 80 -90 7 16 0.53 Tipo de variable y escala de medida 0.3 90 -100 9 25 0.83 27 0.90 2 0.07 100 -110 0.97 Ordenar los datos, amplitud y número de clases 2 29 110 -120 0.07 0.03 120 -130 30 1 1.00 1.0 total 30 Tabla de frecuencias gráfico
De acuerdo con el tipo de variable (numérica ,continua) y su escala de medida (de razón), el gráfico más adecuado sería un histograma o un Polígono de frecuencias. En este ejemplo se utiliza un Procedimiento Problema variable en estudio Histograma de la distribución de presión diastólica en mm de Hg según las frecuencias absolutas f Tipo de variable y escala de medida Ordenar los datos, amplitud y número de clases Tabla de frecuencias gráfico 60 70 80 90 100 110 120 130 mmHg
Una forma rápida de tener información sobre una distribución RESUMEN DE DATOS Se puede hacer a través de tablasgráficos Dan una idea global de la forma
Otra forma es a través de las MEDIDAS DE RESUMEN ó MEDIAMEDIANAMODA medidas de tendencia central
MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión A AMPLITUD TOTALVARIANZA yDESVIACIÓN TIPICASEMIRRECORRIDO INTERCUARTILICOCOEFICIENTE DE VARIACION 2 2 Q CV
MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión SEPARATRICES ó CUANTILES : deciles cuartiles percentiles medidas de posición D Q P 0.40 0.80 0.20 P20 P40 P80
MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión medidas de posición medidas de asimetría (sesgo) asimetría positiva asimetría negativa distribución simétrica
MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión medidas de posición medidas de asimetría medidas de apuntamiento o curtosis Distrib. leptocurtica Distrib. platicurtica en azul la distribución normal (de referencia) distribución mesocurtica
medidas de tendencia central y dispersión forman DUOS Según teoría de momentos Media - Varianza ydesviación típica Datos numéricos – distribuciones simétricas o asimétricas con muchas observaciones Según el método de las separatrices Mediana - Semirrecorrido intercuartílico Datos ordinales o numéricos distribución asimétrica y con pocas observaciones- Según el método de los extremos Moda -Amplitud total Datos nominales Distribuciones bimodales
Moda y Amplitud total Datos nominales Distribuciones bimodales
h Extensión del intervalo Diferencia entre la frecuencia de la clase modal y la clase anterior Diferencia entre la frecuencia de la clase modal y la clase siguiente 1 2 Mo Li x Limite inferior de la clase modal
Mediana y semirrecorrido intercuartilico Datos ordinales o numéricos ; o se usa en Distribución asimétrica y con pocas observaciones ó
Fr 10.75 0.50.25 0 recorrido intercuartil P75 P50 P25 x Q3 Q2 Q1 mediana
Niveles de Hb en 61 adultos normales 105 110 112 112 118 119 120 120 120 125 126 127 128 130 132 133 134 135 138 138 138 138 141 142 144 145 146 148 148 148 149 150 150 150 151 151 153 153 154 154 154 154 155 156 156 158 160 160 160 163 164 164 165 166 168 168 170 172 172 176 179 133.5 149.5 159 Un resumen de esta serie en 5 valores Min =105 ; Max =179; Q1 = 133.5 ; Q3 = 159 ; Q2 =Mn= 149.5 recorrido intrercuartil Min Max Q1 Mn Q3 105 179 133.5 149,5 159
Media - Varianza y Desviación típica Datos numéricos ;distribuciones simétricas o asimétricas con muchas observaciones 2 2 ó
Al agrupar los datos se produce una perdida de información Mismo ejemplo anterior : Niveles de Hb (g/l) en 60 adultos normales DATOS AGRUPADOS DATOS SIN AGRUPAR Media144,33Mediana147,22Moda153,64 Desviaciónestándar18,67 Niveles de Hb (g/l) Media145,715 Mediana149,5 Moda138 Desviaciónestándar18,13 Curtosis-0,6643 Coeficiente de asimetría-0,3531 Amplitud total74 Mínimo105 Máximo179 n60 Es la que más varia al agrupar En este caso el limite superior está incluido en la clase anterior