150 likes | 319 Views
Praktikum Experimentelle Ökologie — SS 20005. Modul Statistische Datenanalyse. • Statistik und experimentelles Design gehören zu den wichtigsten Arbeitsinstrumenten von Biologen (bes. Ökologen).
E N D
Praktikum Experimentelle Ökologie — SS 20005 Modul Statistische Datenanalyse • Statistik und experimentelles Design gehören zu den wichtigsten Arbeitsinstrumenten von Biologen (bes. Ökologen). • Die statistische Analyse sollte vor der Durchführung eines Experiments geplant werden, nicht erst danach. • Fehler bei der stat. Auswertung und dem experimentellen Design gehören zu den wichtigsten Gründen, weshalb Forschungsresultate in Ökologie nicht publiziert werden können. • Statistik ist nicht Mathematik und nicht allzu schwierig zu lernen. • Statistik lernt man am einfachsten, wenn man eigene Daten analysieren kann und die Hilfe von erfahrenen Leuten in Anspruch nehmen kann.
Die Normalverteilung (Glockenkurve) Mittelwert (mean) n Standardabweichung (standard deviation) s = n - 1 Varianz (variance) s2 = n - 1 Typen von Daten: • kontinuierlich • binär • kategoriell Häufigkeitsverteilungen von Daten: Normalverteilung Binomialverteilung Poissonverteilung
Frequency 68% 95% Standard deviation Beispiel: Körpergrösse der Kursteilnehmer Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung Wahrscheinlichkeit, dass • eine Person grösser als 185 cm gross ist • kleiner als 160 cm gross ist • zwischen 160 und 170 cm gross ist
Merke: Mittelwerte von Zufallsstichproben variieren um den wahren Mittelwert der Grundgesamtheit ! Beispiel Körpergrösse Standardfehler des Mittelwerts (standard error of the mean) s s.e. = Wichtige Begriffe und Konzepte Grundgesamtheit (population) Stichprobe (sample) Stichprobenerhebung (sampling): muss repräsentative sein, d.h. alle Individuen einer Population müssen die gleiche Wahrscheinlichkeit haben, in der Stichprobe vertreten zu sein (Zufallsstichprobe, random sampling) 95% Konfidenzinterval (confidence interval)
Testen von Hypothesen Gibt es Unterschiede zwischen Gruppen der Grundgesamtheit? (Beispiel Körpergrösse von Frauen und Männern) Nullhypothese H0: es gibt keine Unterschiede Alternativhypothese H1: es gibt Unterschiede t -Test: Vergleich von zwei Gruppen Varianzanalyse (ANOVA): Vergleich von zwei oder mehr Gruppen
Varianzanalyse (Analysis of Variance) Beispiel Düngungsexperiment Biomasse (g) von 10 Pflanzen wenig Dünger: 12.3, 13.4, 11.8, 16.5, 14.1 viel Dünger: 17.8, 19.5, 18,1 16.7, 21.3
Abweichung vom Mittelwert Gesamtmittelwert (grand mean) H1: Gruppen haben unterschiedliche Mittelwerte Mittelwert einer Behandlungsgruppe (treatment mean) Biomasse (g) Abweichung vom Mittelwert (“residual” oder “error”) wenig viel Dünger H0: keine Unterschiede zwischen zwei Gruppen Biomasse (g) wenig viel Dünger
Source DF Sum of Squares Mean Square F Ratio Treatment 1 64.009 64.009 19.6 Error 8 26.196 3.275 Prob > F Total 9 90.205 0.0022 Wenn H0 zutrifft, dann sind MSerror und MStreat etwa gleich gross. D.h. MStreat F = sollte etwa 1 sein MSerror One-way analysis of variance DF = degrees of freedom SStotal = Total sum of squares SSerror = Error sum of squares SStreat = Treatment sum of squares SStotal = SStreat + SSerror MSerror = SSerror / 8 MStreat = SStreat / 1
SStotal SStreat SSerror SStreat % der vom Modell erklärten Varianz R2 = SStotal MStreat F = MSerror SStotal Biomasse (g) wenig viel Dünger SStreat SSerror Biomasse (g) Biomasse (g) wenig viel wenig viel
Fiktives Datenset A Grosse Mittelwertsunterschiede Geringe Streuung innerhalb Gruppen Grafen & Hails
Fiktives Datenset B Geringe Mittelwertsunterschiede Grosse Streuung innerhalb Gruppen Grafen & Hails
Hilfe meine Daten sind nicht normalverteilt! Datentransformation bes. bei kontinuierlichen Daten bes. bei Zähldaten bes. bei Prozentwerten Annahmen der ANOVA • Residuen sind normalverteilt • gleiche Streuung in jeder Gruppe • Datenpunkte sind unabhängig
Statistische Schlussfolgerung H0 abgelehnt H0 nicht abgelehnt Effekt vorhanden type II error Wahre Situation Kein Effekt type I error Schlussfolgerungen beim prüfen von Nullhypothesen Test ist signifikant: die Gruppen gehören mit Irrtumswahrscheinlichkeit p zu unterschiedlichen Grundgesamtheiten (solchen mit unterschiedlichen Mittelwerten) Test nicht signifikant: kein Beweis dass Gruppen gleich sind! The absence of a proof is not proof for an absence!
Statistische Macht (statistical power) Wahrscheinlichkeit mit der eine Nullhypothese, die effektiv falsch ist, abgelehnt werden kann. Abhängig von: • Grösse der Unterschiede zwischen Gruppen (effect size) • Stichprobenumfang (sample size) • Ausmass der Streuung innerhalb der Gruppen (error variance)