1 / 52

Com sobreviure a una estadística científica

Com sobreviure a una estadística científica. Xavier Basagaña Setmana de la Ciència 2013. Estadística. Ciència o un conjunt d’eines per resumir informació. Estadística. Hipòtesi. Experiment. Eina fonamental en la ciència. Refutació. Suport. Quantificació del resultats: estadística.

kiona
Download Presentation

Com sobreviure a una estadística científica

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Com sobreviure a una estadística científica Xavier Basagaña Setmana de la Ciència 2013

  2. Estadística • Ciència o un conjunt d’eines per resumir informació.

  3. Estadística Hipòtesi Experiment Eina fonamental en la ciència Refutació Suport Quantificació del resultats: estadística Ens ofereix la possibilitat de testar si determinats fenòmens segueixen algun patró que puguem identificar, o es poden atribuir a l’atzar.

  4. Estadística • Exemples: • Tinc una molècula que crec que pot funcionar com a tractament d’una malaltia. • He dissenyat una bateria que crec que dura més que les existents. • He descobert un material més resistent que els que es feien servir en un determinat producte. • Crec que he descobert la zona del cervell que controla una certa funció • ...

  5. Per què la teoria no és suficient? Calen experiments • Si les propietats químiques d’un compost ens diuen que cura una malaltia, per què cal recórrer a l’estadística? • Sistemes biològics molt complexos (mai es podrà controlar tot). • En determinades persones pot funcionar i en altres no. • Diferents graus de curació. • Interacció amb altres substàncies • ...

  6. Mesures estadístiques utilitzades habitualment

  7. Mesures descriptives

  8. Mesures descriptives • Resumeixen una informació. Fàcils d’entendre. • Proporcions: • Proporció de fumadors: 25% • Proporció que presenten efectes secundaris: 0.1% • Percentatge de peces defectuoses en un procés de producció: 0.001%.

  9. Mesures descriptives • Mitjanes: • Salari brut anual, mitjana: 22.899 €. • Nivells de contaminació atmosfèrica (PM10) a Barcelona: 40 µg/m3. • Nivells mitjans de colesterol: 210 mg/dL • Mitjana de cotxes per habitant: 0.47.

  10. Mesures descriptives

  11. Mesures descriptives • Tot i ser fàcils d’entendre, sempre hi ha perill a l’hora d’interpretar les dades. • Exemples (no científics): eleccions, EGM. • Determinats gràfics poden induir conclusions errònies.

  12. Mesures descriptives

  13. Mesures d’associació

  14. Mesures d’associació Variable explicativa Variable resposta Alcohol Malaltia Variables confusores Tabac Associació entre 2 variables (causa-efecte):

  15. Mesures d’associació Variable explicativa Variable resposta Augment de temperatures Emissió de gasos Variables confusores Cicles Naturals Associació entre 2 variables (causa-efecte):

  16. Mesures d’associació Variable explicativa Variable resposta Prendre un medicament Curació Variables confusores Característiques del pacient Associació entre 2 variables (causa-efecte):

  17. Mesures d’associació Variable explicativa Variable resposta Estar a l’atur Nivell d’estudis Variables confusores Edat Associació entre 2 variables (causa-efecte):

  18. Variables contínues

  19. Com es quantifiquen les associacions 2 variables contínues (associació lineal)

  20. Com es quantifiquen les associacions Reduir el consum de sodi als 25 anys de 150 mmol/dia a 50 mmol/dia, implica una reducció de 9 mm Hg en la pressió sistòlica als 55 anys. 2 variables contínues (associació lineal):

  21. Com es quantifiquen les associacions Esperança de vida = 10.754 + 6.6354*log(PIB per capita) 2 variable contínues (corbes)

  22. Com es quantifiquen les associacions Esperança de vida = 10.754 + 6.6354*log(PIB per capita) • 2 variable contínues (corbes) • Les associacions multiplicatives es poden resumir de forma entenedora amb un sol número: • Ex: Al doblar el PIB, l’esperança de vida augmenta 4.6 anys (6.6354*log(2)). • Amb corbes més complicades, una bona idea podria ser agafar 2 punts interessants de l’eix X i donar l’increment en Y.

  23. Variables categòriques

  24. Com es quantifiquen les associacions • Quan la resposta (l’efecte) és sí/no. • Models per la probabilitat (risc). • Exemples: • Probabilitat de curar-se. • Probabilitat (risc) de morir. • Probabilitat d’acabar els estudis. • Probabilitat d’error en un procés industrial. • Probabilitat que un client compri un producte.

  25. Com es quantifiquen les associacions En ciències de la salut és molt comú fer servir el risc relatiu (RR). • Exemple: risc en fumadors 10%, risc en no fumadors 4%. • RR = 0.1/0.04 = 2.5 • RR> 1  Fumar és un factor de risc. • Exemple: risc en els que fan activitat física 2%, risc en els que no, 8%. • RR = 0.02/0.08 = 0.25. • RR<1  Activitat física és un factor protector. • Exemple: risc en homes 5%, risc en dones 5%. • RR = 0.05/0.05 = 1  No hi ha associació entre la malaltia i el sexe.

  26. Com es quantifiquen les associacions • En ciències de la salut es fan servir altres mesures de risc relatiu: • Risc relatiu (RR) • Odds ratio (OR) * • Hazard ratio (HR) • Totes es poden interpretar com: • Aquest grup té x% més risc que l’altre • A mesura que augmenta la variable explicativa, el risc augmenta x% * interpretable com a RR només si d’una malaltia que afecta <10% de la població, si no molt difícil d’interpretar.

  27. Ratio vs. percent change • Exemples: • OR = 1.06  increment del 6% en el risc. • RR = 1.20  increment del 20% en el risc. • HR=2  increment del 100% en el risc, o el risc es dobla. • RR= 5  es té 5 vegades més risc.

  28. Com es quantifiquen les associacions Càncer de pulmó, mortalitat cardiovascular i exposició a llarg termini a contaminació atmosfèrica per partícules fines Exemple:

  29. Com es quantifiquen les associacions Per cada 10 g/m3 que augmenta la contaminació, la mortalitat augmenta un 6%. La taula reporta RR, el resultats ho interpreten com a canvi percentual.

  30. Incertesa, atzar

  31. Incertesa, atzar • L’atzar apareix perquè quasi sempre treballem amb mostres, no amb tota la població. • Enquesta de vot. • Estudi en un grup de pacients: si el repetim en un nou grup de pacients el resultat no serà exactament el mateix. • Fins i tot en condicions experimentals hi hauran petites variacions si es repeteix un altre dia → només veiem una mostra del experiments, no tots els possibles (que s’han fet i es faran)

  32. Incertesa, atzar http://www.mathsisfun.com/data/images/quincunx.swf Exemple (quincunx)

  33. Incertesa • L’estadística incorpora el fet que hi ha una certa variació en els resultats → incorpora la incertesa. • Forma usual: totes les mesures estadístiques van acompanyades d’un interval de confiança. • Indica els valors més probables on estarà el valor real.

  34. Incertesa -5 -4 -3 -2 -1 0 1 2 3 4 5 El 95% de les vegades la bola caurà entre -2 i 2. Interval de confiança al 95%: [-2, 2]

  35. Incertesa Exemple anterior: L’efecte més probable de la contaminació en la mortalitat és un augment del 6%, però podria ser entre un 2% i un 11%.

  36. Incertesa Exemple anterior: Per les altres causes de mort, l’efecte va de una reducció d’un 5% de la mortalitat a un increment d’un 6%  no podem concloure res.

  37. significació

  38. Significació “…Chlamydia pneumoniae antibody titers are significantly associated with acute stroke …” “…weekly use of hypochlorite bleach was non-significantly associated with new-onset asthma…” “… The mode of transport was a statistically significant determinant of personal exposure to PM 2.5…” “… this difference being clinically important although not statistically significant…” “… Escitalopram treatment also was statistically significantly superior to citalopram…” Resultats estadísticament significatius.

  39. Significació • p-valor: Probabilitat de que, si realment no existeix una associació, per atzar trobis una associació com la que has trobat o més forta. • Exemple: els diabetics tenen el doble de risc de patir un atac de cor. El p-valor és de 0.02 = 2%. • La probabilitat que per atzar el meu estudi trobi un efecte del doble o més (quan en realitat no hi ha associació) és del 2%. • Si aquesta probabilitat és molt baixa  els resultats no són deguts a l’atzar.

  40. p-valor • Interpretació una mica complicada. • Moltes vegades s’acaba interpretant com la probabilitat que els resultats siguin deguts a l’atzar. • No és exacte des del punt de vista teòric, però la majoria de vegades es pot interpretar així. • Des del punt de vista comunicatiu no hi veig un gran problema (opinió personal)

  41. p-valor

  42. p-valor • Normalment p-valor<0.05 es considera estadísticament significatiu. • Totalment arbitrari (5 dits de la mà) • Implícitament estem acceptant que en un 5% d’estudis (1 de cada 20) ens equivoquem. • Considerem una associació com a causal quan és deguda a l’atzar.

  43. Replicació de resultats

  44. (mals) Gràfics

  45. Exemples de mals gràfics Tallar l’eix de les Y

  46. Exemples de mals gràfics http://en.wikipedia.org/wiki/Misleading_graph

  47. Exemples de mals gràfics Font: Good Medicine Magazine

  48. Exemples de mals gràfics http://en.wikipedia.org/wiki/Misleading_graph

  49. Exemples de mals gràfics Activitat a Internet en 60 segons.

  50. Exemples de mals gràfics Font: New Scientist

More Related