410 likes | 713 Views
Introducción Probabilidad, estadística e inferencia científica. Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A. Intro: hace 2.500 años…. Antístenes: “…yo veo estos caballos, blancos, negros, grises……¡¡pero la ‘caballinidad’ no la he visto nunca!!”
E N D
IntroducciónProbabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A.
Intro: hace 2.500 años… • Antístenes: “…yo veo estos caballos, blancos, negros, grises……¡¡pero la ‘caballinidad’ no la he visto nunca!!” • Platón: “Cierto, porque tienes los ojos del cuerpo para ver los caballos blancos y negros, pero los ojos de la mente para ver la idea de ‘caballo’ no los tienes…” M.Pavesi: inferencia y estadística
Intro: el método científico (I) • En el siglo XIV, los científicos empezaron a darle la razón al pobre filósofo ridiculizado por Platón: • La ciencia se basa en EXPERIENCIAS OBJETIVAS • ‘Experiencia objetiva’ significa OBSERVACIONES PÚBLICAS (intersubjetivas) y REPETIBLES M.Pavesi: inferencia y estadística
Intro: el método científico (II) • Otras características de la ciencia moderna son: • EL RIGOR metodológico • La MODELIZACIÓN de la realidad • La importancia vital del ERROR en el desarrollo científico M.Pavesi: inferencia y estadística
El arco del conocimiento TEORÍA Hipótesis Inducción Deducción Experiencia: datos Predicciones: datos M.Pavesi: inferencia y estadística
Inducción La parte ascendiente del “arco” se basa en el PRINCIPIO DE INDUCCIÓN: X1 ==> Y1 X2 ==> Y2 ….. Xn ==> Yn X ==> Y M.Pavesi: inferencia y estadística
Inducción y Verdad Bertrand Russell presenta… El pavo inductivista M.Pavesi: inferencia y estadística
Problemas para el inductivista “pavo” • …cree que el resultado observado en una muestra de la población es verdadero para la población. • …cree que la inducción es el método científico para demostrar la verdad • …cree que la estadística es el instrumento para llegar a esta demostración “matemática” M.Pavesi: inferencia y estadística
Problemas para el inductivista “pavo” Resultado... M.Pavesi: inferencia y estadística
El inductivista “sofisticado” • …reconoce que las inferencias científicas siempre tienen un “valor” que depende del nº de observaciones realizadas (tamaño de la muestra). M.Pavesi: inferencia y estadística
El inductivista “sofisticado” • …sabe que solo es posible APROXIMAR / MODELIZAR / ESTIMAR la realidad y que cada estimación tiene su margen de error. M.Pavesi: inferencia y estadística
El inductivista “sofisticado” • …sabe que no existen hipótesis verdaderas, pero podemos rechazar una hipótesis y aceptar otra en función de las “evidencias” de las que disponemos. M.Pavesi: inferencia y estadística
Karl Popper: gorilas y contrastes de hipótesis Hipótesis: todos los gorilas son negros C1 ==> negro C2 ==> negro ... Cn ==> ‘Copito de nieve’ Rechazo la hipótesis inicial No es posible verificar una hipótesis, pero sí es posible rechazarla a partir de un número suficiente de evidencias contrarias M.Pavesi: inferencia y estadística
Desplazamiento probabilístico Cualquier tipo de conocimiento de las ciencias naturales (empíricas) es probabilístico: • Se aproxima la realidad con una determinada precisión • Se acepta un determinado margen de error para cualquier aproximación • No se “demuestra” una hipótesis, se descarta (con un margen de error) la hipótesis contraria. M.Pavesi: inferencia y estadística
Probabilidades directas e inversas • “Sé (asumo) que este dado no está trucado: ¿qué probabilidad tengo de sacar siempre un 1 en 15 jugadas seguidas” ==> CÁLCULO (matemáticas) • “He sacado siempre 1 en 15 jugadas seguidas. ¿Estará trucado el dado? ==> ESTADÍSTICA (inferencial) M.Pavesi: inferencia y estadística
Estadística inferencial y cálculo de probabilidades HIPÓTESIS/TEORÍA Cálculo de probabilidades Estadística inferencial Inducción Deducción Experiencia: datos Probabilidades (frecuencias) M.Pavesi: inferencia y estadística
La estadística en los contrastes de hipótesis Únicamente se tiene en cuenta la información experimental (muestral) PUNTOS FUERTES: Objetividad de los datos. Métodos (relativamente) sencillos. PUNTOS DÉBILES: no conocemos la probabilidad de una hipótesis o de un resultado, sino la probabilidad del resultado observado asumiendo H0. M.Pavesi: inferencia y estadística
Contrastes de hipótesis (I) Hipótesis de trabajo del investigador: El fármaco F es eficaz para reducir de forma clínicamente relevante la TAS después de “x” días de tratamiento M.Pavesi: inferencia y estadística
Contrastes de hipótesis (II) Hipótesis nula (H0): el fármaco F no tiene ningún efecto sobre la tensión arterial sistólica …¿qué significa “efecto cero”? H0 para el estadístico: la diferencia entre el fármaco F y un placebo en la reducción de la TAS después de “x” días de tratamiento es inferior o igual a 10 mm Hg (diferencia CLÍNICAMENTE RELEVANTE) M.Pavesi: inferencia y estadística
Contrastes de hipótesis (III) Hipótesis alternativa (H1): la diferencia entre el fármaco F y un placebo en la reducción de la TAS después de “x” días de tratamiento es mayor de 10 mm Hg (diferencia CLÍNICAMENTE RELEVANTE) M.Pavesi: inferencia y estadística
Contrastes de hipótesis (IV) Ingredientes: • Mínima diferencia clínicamente relevante (Delta) • Márgenes de error del contraste de hipótesis • Poder estadístico del contraste • Tamaño de la muestra (representativa de la población): la “N” depende de todo lo anterior M.Pavesi: inferencia y estadística
Un pequeño margen de error... α En cada contraste de hipótesis asumimos 2 riesgos: El RIESGO α (error Tipo I): • Probabilidad de observar Delta y rechazar H0cuando, en realidad, H0 es verdadera. • Porcentaje de resultados FALSOS POSITIVOS que decidimos asumir. M.Pavesi: inferencia y estadística
Un pequeño margen de error... β En cada contraste de hipótesis asumimos 2 riesgos: El RIESGO β (error Tipo II): • probabilidad de NO llegar a observar Delta y aceptar H0 cuando, en realidad, H1 es verdadera. • Porcentaje de resultados FALSOS NEGATIVOS que decidimos asumir. M.Pavesi: inferencia y estadística
Un gran poder...estadístico El PODER ESTADÍSTICO (P = 1-β): • es la probabilidad de acertar cuando rechazamos H0 • puede interpretarse como el VALOR PREDICTIVO DE LA PRUEBA PARA LOS RESULTADOS POSITIVOS. M.Pavesi: inferencia y estadística
Errores en un contraste de hipótesis M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (1) El VALOR DE SIGNIFICACIÓN (p-value): • Es la probabilidad de observar un resultado como el que hemos observado en la muestra cuando, en la realidad, H0 es verdadera. ….es decir, la PROBABILIDAD DE OBSERVAR ESTE RESULTADO ÚNICAMENTE POR AZAR. M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (2) El VALOR DE SIGNIFICACIÓN (p-value): • es un índice de la EVIDENCIA del resultado observado, de cuanto es FIABLE el resultado comparado con su variabilidad. M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (3) • valor de significación GRANDE = PROBABILIDAD ELEVADA de que el resultados obtenido se deba al AZAR. P = 0,750 ==> hay un 75% de posibilidades (3 de cada 4 estudios) de equivocarnos al rechazar H0 M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (4) • valor de significación PEQUEÑO = PROBABILIDAD MUY BAJA de que el resultados obtenido se deba al AZAR. P = 0,015 ==> hay un 1,5% de posibilidades (15 de cada 1000 estudios) de equivocarnos al rechazar H0 M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (5) ¿Qué es un VALOR DE SIGNIFICACIÓN PEQUEÑO? POR CONVENCIÓN (no porque lo diga la Biblia…) descartamos el papel del azar si la ‘p’ es inferior a ciertos valores (0,05 ó 0,01, por ejemplo). La decisión se basa en criterios CLÍNICOS: ¿qué tasa de FALSOS POSITIVOS estamos dispuestos a aceptar? M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (6) …sobre todo, recordad: ¡¡LA p NO NOS DICE NADA SOBRE LA RELEVANCIA CLÍNICA DEL RESULTADO OBSERVADO!! M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (7) …por ejemplo... Fármaco A. Tasa de curación: 22% Fármaco B. Tasa de curación: 11% …y efectivamente… Fármaco A. Tasa de curación: 2/9 Fármaco B. Tasa de curación: 1/9 P=0,98 M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (8) …por ejemplo... Fármaco A. Tasa de curación: 22% Fármaco B. Tasa de curación: 11% …y efectivamente… Fármaco A. Tasa de curación: 35/154 Fármaco B. Tasa de curación: 18/158 P=0,008 M.Pavesi: inferencia y estadística
Y por fin...…la “p” ! (9) …y por otra parte... Fármaco A. Tasa de curación conocida: 50% Fármaco B. Tasa de curación esperada: 52% Δ=2%; Riesgo Tipo I: 0,05; Riesgo Tipo II: 0,20 N (por grupo): 9.806 M.Pavesi: inferencia y estadística
…y el riesgo β y el Poder, ¿qué?... ¡NO SON MENOS IMPORTANTES! • Con un riesgo β elevado y un Poder insuficiente, un resultado NEGATIVO no permite llegar a NINGUNA CONCLUSIÓN • En algunos estudios (ej., nuevos fármacos) queremos estar muy seguros de un resultado NO SIGNIFICATIVO • CONVENCIÓN: Riesgo β <= 0,20-0,10 M.Pavesi: inferencia y estadística
Y para acabar: pequeña galería de los horrores... “No se observan diferencias estadísticamente significativas entre los dos grupos de tratamiento. Conclusión: los dos tratamientos son igual de efectivos…” ….NNNOOOOORRRRRRLLLLL….!!!!!! “Absence of evidence is not evidence of absence” (Douglas G. Altman) M.Pavesi: inferencia y estadística
Y para acabar: pequeña galería de los horrores... La ‘p’ de la comparación entre el tratamiento A y el Placebo és menor de la ‘p’ de la comparación entre el tratamiento B y el Placebo. Conclusión: A es mejor que B... ….NNNOOOOORRRRRRLLLLL….!!!!!! La ‘p’ solo nos informa sobre la fiabilidad del resultado de un contraste de hipótesis. M.Pavesi: inferencia y estadística
Y para acabar: pequeña galería de los horrores... Estadístico: “¿Cuál es tu hipótesis de trabajo?” Investigador (es un decir...): “¿Hipótesis? Todas, las tengo todas…” ….NNNNOOOOORRRRLLLLLL….!!!!!! UN estudio, UNA hipótesis de trabajo, UN contraste de hipótesis. EL ESTUDIO UNIVERSAL NO EXISTE ! M.Pavesi: inferencia y estadística
Y para acabar: pequeña galería de los horrores... Investigador (al pobre estadístico): “Mira, he venido a verte porque tengo una base de datos…” ….NNNOOOOORRRRRRLLLLL….!!!!!! El riesgo α se incrementa exponencialmente al multiplicar los contrastes de hipótesis: 1 test: Riesgo α = 5%……5 tests: Riesgo α > 20% M.Pavesi: inferencia y estadística
….en fin... (Darrell Huff: “How to lie with statistics”)
…¡¡ Gracias por vuestra atención !!... Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A. (marco.pavesi@novartis.com)