630 likes | 1.18k Views
Percy Mayta Tristán MD, MPH (c) , MHEd (c) Profesor, Escuela de Medicina, Universidad Peruana de Ciencias Aplicadas Profesor, Escuela de Posgrado, Universidad Peruana Cayetano Heredia Comité Editor, Revista Peruana de Medicina Experimental y Salud Publica
E N D
Percy Mayta Tristán MD, MPH (c), MHEd(c) Profesor, Escuela de Medicina, Universidad Peruana de Ciencias Aplicadas Profesor, Escuela de Posgrado, Universidad Peruana Cayetano Heredia Comité Editor, Revista Peruana de Medicina Experimental y Salud Publica Comité de Ética, Instituto Nacional de Salud percy.mayta@upc.edu.pe Cómoelegir la pruebaestadísticasegún variable usada
Logros • Recordar algunos conceptos básicos de estadística para poder comprender el uso de pruebas de hipótesis. • Conocer los pasos para elegir una prueba estadística. • Conocer las principales pruebas estadísticas y los escenarios en los que se pueden usar. • Conocer la forma de redactar un plan de análisis de datos en un protocolo de investigación.
Contexto • Día a día, cada decisión que tomamos tiene un margen de error (las cirugías tienen un margen de error, los vuelos aéreos tienen un margen de error, etc.) • Conocer cual es la magnitud del error es la tarea del investigador. Por eso se debe plantear en cada caso, el error que estamos dispuestos a aceptar.
Planteamiento de hipótesis (1) • Desde el punto de vista matemático siempre se tiene dos hipótesis: • Hipótesis nula (H0) o hipótesis de trabajo • Hipótesis alternativa (H1) o hipótesis preliminar del investigador
Planteamiento de hipótesis (2) • Ejemplos: • H0: la variable edad tiene distribución normal • H1: la variable edad no tiene distribución normal • H0: µ(edad mujeres) = µ(edad varones) • H1: µ(edad mujeres) ≠ µ(edad varones)
Definiciones: nivel de significancia • Nivel de significancia: es la máxima cantidad de error que estamos dispuestos aceptar para dar como válida la hipótesis del investigador • En líneas generales siempre se establece en 5% o menos (0.05 ó menor)
Definiciones: error tipo I • Error tipo I: • Conocido como alfa (α) • Ocurre cuando rechazamos la hipótesis nula cuando esta es verdadera • La meta es mantener este error lo más pequeño posible
Definiciones: error tipo II • Error tipo II: • Conocido como beta (β) • Ocurre cuando no rechazamos la hipótesis nula cuando está es falsa • La meta es mantener este error lo más pequeño posible (aceptado: 0.20)
Definiciones: poder • Poder (potencia): • El poder de un estudio viene dado por (1 – β) • Es la probabilidad de rechazar la hipótesis nula cuando es falsa • La meta es mantener el poder de un estudio lo más grande posible
Ejemplo • Si especificamos que α = 0,05, veremos una región de rechazo:
P-valor (1) • El p-valor: es la probabilidad de equivocarse al aceptar la hipótesis del investigador como verdadera; es decir, la probabilidad de cometer error tipo I. • Interpretación del p-valor: • Si el valor de p es menor que el error tipo I (α), entonces es posible rechazar la hipótesis nula • Si el valor de p es igual o mayor que el error tipo I (α), entonces no es posible rechazar la hipótesis nula.
P-valor (2) • A tomar en cuenta: • El error tipo I (α) es 0,05 en la mayoría de casos • El error tipo II (β) es en la mayoría de casos 0,20, de esta manera el poder de un estudio es de 0,80 (80%) • Por convención se juzga como “estadísticamente significativo si el valor de p < 0.05
Precisión (1) • Hace referencia a la concentración de los valores estimados en torno al valor que se trata de estimar, de tal manera que la distancia entre el valor a estimar y el valor estimado sea pequeña
Precisión (2) • Es un concepto unido al tamaño de muestra • Por ejemplo: si deseo calcular el tamaño de muestra para un estudio que quiere determinar la prevalencia de caries en escolares de Lima, se requiere saber la prevalencia esperada y la precisión de este estimado.
Exactitud • Es lo cerca que el resultado de una medición está del verdadero valor. • La precisión y la exactitud son conceptos ligados pero no significan lo mismo.
Intervalos de confianza (1) • Se entiende por un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. • Se trata de que los resultados de una muestra permitan inferir el estimado de la población.
Intervalos de confianza (2) • La probabilidad de que el verdadero valor se encuentre en el intervalo que hemos construido se denomina nivel de confianza y se denota como (1 - α) • Generalmente se construye intervalos de confianza de 95% (otros menos frecuentes son de 90% y de 99%)
Intervalos de confianza (3) • Se puede construir un intervalo de confianza al 95% (IC95%) para una media, una proporción, una prevalencia, una diferencia, entre otros. • A mayor tamaño de muestra, mayor precisión y se tendrá un intervalo de confianza más pequeño.
Recordando • Cuando se comete un error de tipo I • Cuando se comete un error de tipo II • Qué es el valor de p • Cuando se hace más pequeño un intervalo de confianza.
Qué hacer para elegir una prueba estadística: paso 1 • Cuáles son los objetivos de mi estudio. • Qué hipótesis he planteado. • Cuál es la naturaleza de mi variable dependiente e independiente.
A tener en cuenta • Estos elementos deben ser previstos desde el protocolo para calcular el tamaño muestral mínimo requerido para demostrar nuestra hipótesis.
Pruebas básicas para asociación entre dos variables categóricas SI NO ¿Grupos relacionados? Test de McNemar OJO :) Cuando menos, un valor esperado es menor de 2 o cuando menos el 20% de los valores esperados es menor a 5 NO SI Test Exacto de Fisher Chi Cuadrado
Escenario 1 • Se desea evaluar si existe asociación entre el género y el uso de piercings en una población de estudiantes de Medicina de la Universidad Z. • Se desarrolla un estudio con 39 alumnos de los cuales 8 tienen piercing. Ho: No existe asociación entre el género y el usar piercing
¿Son grupos relacionados? NO ¿Hay valores esperado menor de 2 o cuando menos el 20% son menores a 5?
¿Qué prueba uso? Test Exacto de Fisher ¿Qué concluiría? Ho: No existe asociación entre el género y el usar piercing
Escenario 2 • Se desarrolla un estudio de casos y controles, considerando como caso a las personas con la enfermedad gavinica (EG) y como variable de exposición consumo de Redbull. • De las 400 personas con EG, 100 se expusieron al Redbull; de los 1200 controles, 200 estuvieron expuestas al Redbull. Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull
¿Son grupos relacionados? NO ¿Hay valores esperado menor de 2 o cuando menos el 20% son menores a 5?
¿Qué prueba uso? Chi Cuadrado ¿Qué concluiría? Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull
Y tomando los intervalos de confianza OR ¿Qué concluiría? Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull
Entonces…. • Debemos tener claro algunos pasos cuando elegimos una prueba: • Cuáles son mis objetivos de estudio. • Cuál es mi variable dependiente (outcome) e independiente (exposición), y de que tipo son. • Cuál es mi hipótesis (traducir en términos estadísticos). • Qué supuestos requiero evaluar para saber que prueba elegir. OJO, este proceso lo debemos hacer desde el protocolo y es la base para estimar el tamaño de muestra.
No continuaremos revisando los supuestos de cada prueba estadística (es todo un curso). • Veremos tips básicos a tener en cuenta para cada tipo de prueba (las más comunes).
Comparar dos grupos no relacionados (independientes, o datos no pareados). En otras palabras, evaluar si hay asociación entre dos variables, donde una de ellas es categórica dicotómica
Comparar dos grupos relacionados (dependientes, o datos pareados). En otras palabras, evaluar si hay asociación entre dos variables: Por ejemplo pre-post o dos formas de medir lo mismo en una misma unidad., donde una de ellas es categórica dicotómica
Comparar tres grupos o más no relacionados (independientes, o datos no pareados). En otras palabras, evaluar si hay asociación entre dos variables, donde una de ellas es categórica politómica
Cuantificar la correlación entre dos variables de similar naturaleza En otras palabras, evaluar la magnitud y direccionalidad de la asociación entre dos variables
Cuantificar la magnitud de la asociación entre dos o más variables En otras palabras, evaluar la magnitud y direccionalidad de la asociación entre dos variables
Considerandos • La investigación se hace en redes y en equipo. • El investigador no debe saber a la perfección todos los aspectos relacionados con los procesos del trabajo, pero si entender por qué se hicieron. • Alguien del equipo debe hacerse responsable de la parte del análisis de datos. • Deficiencias en el análisis de datos es uno de los principales motivos de rechazo de artículos.
Análisis de Datos • Se definirá el paquete estadístico a usar (STATA, SPSS, R, SAS, Epi-Info, etc.) • Se debe exponer las técnicas lógicas y básicas para análisis (estadísticas descriptivas) que serán empleadas para descifrar lo que revelan los datos que se han recogidos • Se expresa también análisis y modelos más avanzados de ser necesario
Análisis de Datos: Ejemplo (1) Randomized control trial to evaluate the effect of a novel-based intervention to increase HIV testing in MSM in Lima, Peru
Análisis de Datos: Ejemplo (2) Hepatitis B infection and its association with consistent condom use: A population-based survey in Peru
Análisis de Datos: Ejemplo (3) USO DE TECNOLOGÍAS DE INFORMACIÓN Y COMUNICACIÓN EN MÉDICOS RECIÉN EGRESADOS DE LIMA, 2011
Para el taller • Revise sus objetivos y enuncie sus hipótesis. • Revise las características de las variables implicadas. • Plantee cual sería la prueba estadística a elegir.