1 / 15

Modul Statistische Datenanalyse

Praktikum Experimentelle Ökologie — SS 20005. Modul Statistische Datenanalyse. • Statistik und experimentelles Design gehören zu den wichtigsten Arbeitsinstrumenten von Biologen (bes. Ökologen).

cicero
Download Presentation

Modul Statistische Datenanalyse

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Praktikum Experimentelle Ökologie — SS 20005 Modul Statistische Datenanalyse • Statistik und experimentelles Design gehören zu den wichtigsten Arbeitsinstrumenten von Biologen (bes. Ökologen). • Die statistische Analyse sollte vor der Durchführung eines Experiments geplant werden, nicht erst danach. • Fehler bei der stat. Auswertung und dem experimentellen Design gehören zu den wichtigsten Gründen, weshalb Forschungsresultate in Ökologie nicht publiziert werden können. • Statistik ist nicht Mathematik und nicht allzu schwierig zu lernen. • Statistik lernt man am einfachsten, wenn man eigene Daten analysieren kann und die Hilfe von erfahrenen Leuten in Anspruch nehmen kann.

  2. Die Normalverteilung (Glockenkurve) Mittelwert (mean) n Standardabweichung (standard deviation) s = n - 1 Varianz (variance) s2 = n - 1 Typen von Daten: • kontinuierlich • binär • kategoriell Häufigkeitsverteilungen von Daten: Normalverteilung Binomialverteilung Poissonverteilung

  3. Frequency 68% 95% Standard deviation Beispiel: Körpergrösse der Kursteilnehmer Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung Wahrscheinlichkeit, dass • eine Person grösser als 185 cm gross ist • kleiner als 160 cm gross ist • zwischen 160 und 170 cm gross ist

  4. Merke: Mittelwerte von Zufallsstichproben variieren um den wahren Mittelwert der Grundgesamtheit ! Beispiel Körpergrösse Standardfehler des Mittelwerts (standard error of the mean) s s.e. = Wichtige Begriffe und Konzepte Grundgesamtheit (population) Stichprobe (sample) Stichprobenerhebung (sampling): muss repräsentative sein, d.h. alle Individuen einer Population müssen die gleiche Wahrscheinlichkeit haben, in der Stichprobe vertreten zu sein (Zufallsstichprobe, random sampling) 95% Konfidenzinterval (confidence interval)

  5. Testen von Hypothesen Gibt es Unterschiede zwischen Gruppen der Grundgesamtheit? (Beispiel Körpergrösse von Frauen und Männern) Nullhypothese H0: es gibt keine Unterschiede Alternativhypothese H1: es gibt Unterschiede t -Test: Vergleich von zwei Gruppen Varianzanalyse (ANOVA): Vergleich von zwei oder mehr Gruppen

  6. Varianzanalyse (Analysis of Variance) Beispiel Düngungsexperiment Biomasse (g) von 10 Pflanzen wenig Dünger: 12.3, 13.4, 11.8, 16.5, 14.1 viel Dünger: 17.8, 19.5, 18,1 16.7, 21.3

  7. Abweichung vom Mittelwert Gesamtmittelwert (grand mean) H1: Gruppen haben unterschiedliche Mittelwerte Mittelwert einer Behandlungsgruppe (treatment mean) Biomasse (g) Abweichung vom Mittelwert (“residual” oder “error”) wenig viel Dünger H0: keine Unterschiede zwischen zwei Gruppen Biomasse (g) wenig viel Dünger

  8. Source DF Sum of Squares Mean Square F Ratio Treatment 1 64.009 64.009 19.6 Error 8 26.196 3.275 Prob > F Total 9 90.205 0.0022 Wenn H0 zutrifft, dann sind MSerror und MStreat etwa gleich gross. D.h. MStreat F = sollte etwa 1 sein MSerror One-way analysis of variance DF = degrees of freedom SStotal = Total sum of squares SSerror = Error sum of squares SStreat = Treatment sum of squares SStotal = SStreat + SSerror MSerror = SSerror / 8 MStreat = SStreat / 1

  9. SStotal SStreat SSerror SStreat % der vom Modell erklärten Varianz R2 = SStotal MStreat F = MSerror SStotal Biomasse (g) wenig viel Dünger SStreat SSerror Biomasse (g) Biomasse (g) wenig viel wenig viel

  10. Fiktives Datenset A Grosse Mittelwertsunterschiede Geringe Streuung innerhalb Gruppen Grafen & Hails

  11. Fiktives Datenset B Geringe Mittelwertsunterschiede Grosse Streuung innerhalb Gruppen Grafen & Hails

  12. Hilfe meine Daten sind nicht normalverteilt! Datentransformation bes. bei kontinuierlichen Daten bes. bei Zähldaten bes. bei Prozentwerten Annahmen der ANOVA • Residuen sind normalverteilt • gleiche Streuung in jeder Gruppe • Datenpunkte sind unabhängig

  13. Statistische Schlussfolgerung H0 abgelehnt H0 nicht abgelehnt Effekt vorhanden type II error  Wahre Situation Kein Effekt type I error  Schlussfolgerungen beim prüfen von Nullhypothesen Test ist signifikant: die Gruppen gehören mit Irrtumswahrscheinlichkeit p zu unterschiedlichen Grundgesamtheiten (solchen mit unterschiedlichen Mittelwerten) Test nicht signifikant: kein Beweis dass Gruppen gleich sind! The absence of a proof is not proof for an absence!

  14. Statistische Macht (statistical power) Wahrscheinlichkeit mit der eine Nullhypothese, die effektiv falsch ist, abgelehnt werden kann. Abhängig von: • Grösse der Unterschiede zwischen Gruppen (effect size) • Stichprobenumfang (sample size) • Ausmass der Streuung innerhalb der Gruppen (error variance)

More Related