350 likes | 565 Views
Bioestadística. PROGRAMA DE DOCTORADO EN SALUD PÚBLICA. Contactos. Mirko Zimic Jefe de la Unidad de Bioinformática y Biología Computacional, Facultad de Ciencias, UPCH 3190000 anexo 2604 mzimic@jhsph.edu mzimic@gmail.com
E N D
Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA
Contactos • Mirko Zimic Jefe de la Unidad de Bioinformática y Biología Computacional, Facultad de Ciencias, UPCH 3190000 anexo 2604 mzimic@jhsph.edumzimic@gmail.com http://www.upch.edu.pe/facien/dbmbqf/docentes.htmhttp://www.abeperu.net/
Summarizing The ‘randomness’ of a random variable resides on: • The variability of the initial conditions • The dynamical instability • The perturbation suffered during a measurement
Important Conclusion: Determinism and Random Behavior are not actually divorced, but they are connected through the Dynamical Equations. Therefore, Random Behavior is a consequence of determinism under special conditions
Clasificación general: Categórica Cuantitativa o numérica Nominal Ordinal Discreta Continua
Las variables continuas • El carácter continuo de una variable lo da la naturaleza intrínseca del observable físico y es independiente de la manera cómo se mida (i.e. del instrumento utilizado) ó de la manera cómo se reporte la medición
Efecto de la manera ‘cómo se mide’ una variable • Imaginemos que medimos la induración del PPD en varios pacientes, y para ello utilizamos una regla milimetrada. Las dimensiones medidas para diferentes personas fueron: 5mm, 12mm, 9mm, 32mm, 21mm • Aparentemente estamos frente a una variable discreta, aunque en realidad la induración (longitud) es y debe tratarse de manera continua.
Categorización/discretización: • Las variables continuas pueden ser convertida en variables discretas y hasta en categóricas • En este proceso se pierde información (precisión) • La información debe obtenerse al mayor nivel de precisión posible y luego agruparse si fuera necesario (discretización)
Perfil de la distribución • Describe cómo los Datos están Distribuídos • Caracterización del perfil de la distribución: Simétrica o sesgada
Recordemos las características de una variable continua con distribución normal… Figure 10.10 6
Dos bases de datos hipotéticas… Es importante tener una imagen visual de la distribución de la variable Datos de baja variabilidad La media provee una buena representación de los valores en la base de datos. Al incrementar datos la distribución cambia.. Datos con alta variabilidad La media ya NO provee ahora una buena información de los datos como sucedía anterioremente
El Teorema del Límite Central da validez a los intervalos de confianza • La media de una muestra “grande” de datos de cualquier tipo sigue una distribución normal • Esto aún se cumple para datos binomiales (sexo, prevalencia, sensibilidad, etc) • Qué es una muestra grande? Eso varía según cada tipo de dato (entre otras cosas) • A medida que el tamaño de muestra crece, la distribución de la media muestral se hace más normal
Continuous Models on the Line • Normal • Logistic • Cauchy • Laplace • Student • Non-central Student
Normal Distribution • Mean= 0 • SD = 0.5, 1, 2
Logistic distribution • Mean=0 • SD=0.5, 1
Student distribution • Degrees of freedom= 1,10,100
Laplace distribution Mean=0 SD=0.5, 1, 5
Continuous Models on the Half Line • Exponential • Gama • Chi-square • Non central Chi-square • F • Non central F • Weibull
Exponential distribution • Scale parameter = 0.5, 1, 2
Chi-square distribution • Degrees of freedom = 3, 5, 10,15
F distribution • Degrees of freedom = (3,3), (10,10), (30,30)
Continuous Models on a Finite Interval • Beta • Uniform
Uniform distribution • P = 1/3
Beta distribution • Parameters: (2,15), (5,15), (15,5)
Discrete Models • Binomial • Poisson • Negative Binomal • Uniform
Binomial distribution • N=10 • P= 0.2, 0.5, 0.8
Poisson distribution • Intensity parameter = 1, 3, 7
Negative Binomial • P N 0.5 10 0.4 3 0.4 6
Perfil de la distribución (skewness coefficient) • Describe cómo los Datos están Distribuídos • Caracterización del perfil de la distribución: Simétrica o sesgada
Perfil de la distribución • Describe cómo los Datos están Distribuídos • Caracterización del perfil de la distribución: Simétrica o sesgada Sesgada izquierda Simétrica Mean Median Mode Mean = Median = Mode
Perfil de la distribución • Describe cómo los Datos están Distribuídos • Caracterización del perfil de la distribución: Simétrica o sesgada Sesgada derecha Sesgada izquierda Simétrica Media Mediana Moda Media = Mediana = Moda Moda Mediana Media
Análisis de OUTLIERS: Datos sesgados: • Valores que se exceden de 3 rangos intercuartiles por debajo del primer cuartil Q1 o por encima del tercer cuartil (Q3) (percentiles 25 y 75 respectivamente) Sesgada izquierda Sesgada Positiva outlier region outlier region Q1 Q1 Q3 Q3 Q1 – 3(Q3 – Q1) Q3 + 3(Q3 – Q1)
Uso de la Teoría de Propagación Errores • Se aplica cuando tenemos una o muy pocas mediciones y deseamos presentar un rango de variabilidad en nuestras conclusiones