180 likes | 301 Views
Forskningstræning – Modul 1. Lidt om fordelinger – kort fortalt. Forskningstræning Copenhagen University Hospital, Bispebjerg-Frederiksberg Februar 2013. Fordelinger er beskrivelser udfaldssandsynligheder Et par af dem praktisk kan komme til at møde:. binomial-fordeling Normalfordeling
E N D
Forskningstræning – Modul 1 Lidt om fordelinger – kort fortalt Forskningstræning Copenhagen University Hospital, Bispebjerg-Frederiksberg Februar 2013
Fordelinger er beskrivelser udfaldssandsynligheder Et par af dem praktisk kan komme til at møde: • binomial-fordeling • Normalfordeling • Afledninger heraf: T-fordeling X2-fordeling F-fordeling Hvorfor skal der arbejdes med fordelinger?
Fordi det er praktisk med få tal at kunne beskrive sine data! Det vi bruger til beskrive med kalder vi parametre. For alle praktiske formål bruger vi: Angivelse af fordelingstype Angivelse af middelværdi og spredning
Typer af data Normalfordelte kontinuerte data F.eks. Blodtryk Hvordan afgører vi “normal distribution”? Dichotome data E.g. Død versus ”Ikke død” How do we determine the fictive Standard Deviation?
Vi starter med at kikke på: • Normalfordelte kontinuerte data Hvordan afgører vi “normal distribution”?
Normalfordelte kontinuerte data Hvad hvis fordelingen er skæv, typisk hvis der er et naturligt nul-punkt F.eks. Blodtryk Hvad gør vi så?
Hvor synes I middelværdien var bedst fastlagt? Det er intuitivt af sikkerheden på en bestemmelse afhænger af ”højden i forhold til bredden”, hvilket er baggrunden for såvel t-fordeling som X2-fordeling og F-fordeling Ved normalfordelte data bruges en t-fordeling til at vurdere højde-bredde forholdet.
Dichotome data F.eks. Død versus ”Ikke død” Hvordan bestemmer vi en spredning?
Dichotome data Simpelt nok: Vi laver en antagelse/beslutning: Alle dichotome datasæt tilhører binomial-fordeling Til at vurdere “højde-bredde forholdet” bruges en X2-fordeling ved dichotome data, som er meget mere “krævende” end t-fordelingen Derfor er en “dichotomisering” af kontinuerte data ”kostbar” ifht. antal samples for at få et godt højde-bredde forhold
...og hvad så med p-værdien? Definition: Sandsynligheden for at få det observerede udfald (eller mere ekstremt), hvis nulhypotesen er sand
...og så var der lige det der med bonferoni-korrektion: Simpleste korrektion for masse-signifikans. Meget konservativ. Gælder kun for korrektion af signifikante udfald, altså at forhindre Type I fejl. Koster mht. power. Er kun brugbar ved lille antal korrektioner (<30).
Hvorfor bonferoni-korrektion: P (mindst et signifikant resultat) = 1 – P (intet signifikant resultat) P (mindst et signifikant resultat) = 1 – (1-0.05)20 P (mindst et signifikant resultat) = 0.64 Hvordan bonferoni-korrektion: Simpelt: Det samlede signifikans niveau (alpha), skal deles med antal delanalyser, dvs. alpha-i = alpha/i