380 likes | 793 Views
Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet. Modellbaserad analys Regression Logistisk regression Överlevnadsanalys. Konfidensintervall P-värden (enkla tester). Formell analys. Hitta misstag Hantera extremvärden Bortfall.
E N D
Grundläggande Biostatistik Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet
Modellbaserad analys Regression Logistisk regression Överlevnadsanalys Konfidensintervall P-värden (enkla tester) Formell analys Hitta misstag Hantera extremvärden Bortfall Lär känna data, tabeller, mått, grafer Informell data analys Hur samlas data in? Mätskalor reliabilitetvaliditet Design och mätning
Syften.. • Skatta prevalens och risker för insjuknande av sjukdom • Jämföra utfall av behandling tex läkemedel/rehabiliteringsmetoder • Kartlägga riskfaktorer, dvs faktorer som ökar risken för sjukdom • Följa förlopp – tillväxtkurvor, etc…
Strategi vid kliniska prövningar • - Sample size beräkningar • Datainsamling • Beskrivande statistik • Statistisk analys • Inferens • - Presentation/publikation
Mätning Variabel Kategorisk Kvantitativ Diskret Kontinuerlig Ordnad Ej ordnad
Grupper av variabler • Utfallsvariabler – primära/sekundära • Behandlingsvariabler/riskfaktorer – variabler som påverkar utfallet • Bakgrundsvariabler – demografiska variabler • Förväxlingsvariabler – confounders/inflytelserika men ej intressanta variabler för frågeställningen
Kvalitativavariabler = kategorivariabler Kvantitativavariabler = numeriskavariabler Nominala variabler Utfallen är kategorier som inte kan rangordnas Ordinala variabler Utfallen är ordnade kategorier Intervall- variabler Kan beräkna differenser men inte kvoter Kvot- variabler Kan beräkna differenser och kvoter Blodtyp Kön Yrke Rökning (ja/nej) VAS-skalan Betyg Självskattad hälsa, smärta Rökning (nej, lite, mycket) Temperatur Mätt i C° F° K° Längd Vikt, ålder Rökning (antal cigaretter per dag) Datanivåer (typer av variabler)
x y x y Orsak verkan samband? x påverkar y x är associerad med y
Studiedesign Experiment Observationsstudie Tvärsnitts- undersökning Longitudinell undersökning Klinisk prövning Kohortstudie Fall-kontroll studie
Randomiserad kontrollerad studie Behandling Utfall Patienter Randomisering Kontroll/ Placebo Utfall Fler armar kan förekomma
Kohort studie Exponerade Utfall Population Ej exponerade Utfall
Fall kontroll studie Fall Exponerade Kontroller Ej exponerade
Tvärsnitts-studie Mätningar Population Urval
Analys och inferens Skattning av sant medelvärde Sant medelvärde Inferens Urvalsmetod Population Urval
Inferens 2: Hypotesprövning Skiljer sig män och kvinnor åt vad avser kroppstemperatur? P-värde = 0.024 Slutsats: ?
Statistisk inferens de metoder som används för att utifrån ett stickprov dra slutsatser om en hel population.
Hypotesprövning Vid prövning av behandlingsmetod på två grupper: H0: ingen skillnad mellan grupper HA: skillnad mellan grupper När väljer vi nollhypotesen och när förkastar vi den till fördel för den alternativa hypotesen?
Konfidensintervall • Skattningar är osäkra på grund av att vi studerar en del av populationen. • Skattningar kan ges med FELMARGINAL. • Det kallas KONFIDENSINTERVALL. • Konfidensintervallet anges med grad av osäkerhet som kallas konfidensnivå (95%, 99%, etc)
Konfidensintervall intervall som inkluderar det sanna medelvärdet nästan säkert (95%). Kroppstemperatur Konfidensintervallet blir 36.73 – 36.88 Detta intervall inkluderar populationens medelvärde nästan säkert (med 95% konfidens)
P-värde p-värde = sannolikheten för det erhållna utfallet eller extremare under förutsättning att nollhypotesen är sann. • Om denna sannolikhet är liten tror vi att nollhypotesen är falsk. Vi förkastar nollhypotesen. • Om denna sannolikhet är stor kan vi inteförkasta nollhypotesen.
Praxis för bedömning av p-värden p > 0.05 ingen skillnad (ej signifikant) 0.05>p>0.01 skillnad (signifikant *) 0.01>p>0.001 skillnad (signifikant **) 0.001>p skillnad (signifikant ***)
H0: grupp1=grupp2 HA: grupp1≠grupp2 Typ I och II fel Type 1 error is referred to as false positive Type 2 error is referred to as false negative
Begreppet power – studiens styrka • Sannolikheten att kunna påvisa en skillnad mellan • grupper (tex behandlingsgrupper) om den finns där • Utgör en komponent vid bestämning av studiens storlek • Andra komponenter är: • Den minsta skillnad vi vill kunna påvisa • Risk för ett falskt positivt fynd (alfa-fel) • Storleken av spridningen i utfallet • Val av metod
Presentation av data Bild Mått Tabell Val styrs av variabeltyp
Lägesmått Medelvärde Median ”Mittersta värdet” 36.8 gr C 36.8 gr C
Variationsmått Standardavvikelse Kvartilavstånd (IQR) Variationsvidd (Range) s = 4.13 år q1 = 36.56, q3 = 37.06 IQR= 0.5 grC max =38.22, min = 35.72 VV = 2.5
Grafisk beskrivning: Histogram Referens
Grafisk bild av samband (scatter plot) År styrka i höger och vänster hand associerade?