120 likes | 251 Views
Statistik. Y X einfacher einseitiger Zusammenhang: einfache lineare Regression Verdunstung (Y) hängt von der Lufttemperatur (X) ab. Y X einfacher wechselseitiger Zusammenhang: Korrelation
E N D
Statistik Y X einfacher einseitiger Zusammenhang: einfache lineare Regression Verdunstung (Y) hängt von der Lufttemperatur (X) ab Y X einfacher wechselseitiger Zusammenhang: Korrelation Verdunstung (Y) hängt von der Lufttemperatur (X) ab, umgekehrt hängt die Lufttemperatur auch von der Verdunstung ab (vgl. Verdunstungskälte) Typen statistischer Zusammenhänge: Statistik I
Statistik Skalenniveau Zusammenhangsmaß (Wertebereich) Richtung des Zusammenhangs Nominal [ = ; ≠ ] Kontingenzkoeffizient (0 <= C <= 1) nein Ordinal [ = ; ≠ ; > ; < ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja Metrisch (nicht-linear, nicht normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; *; / ] Korrelationskoeffizient Spearman/ Korrelationskoeffizient Kendall (-1 <= rs <= +1) ja hohe Korrelation: r = -0.819 niedrige Korrelation: r = 0.07 Metrisch (linear, normalverteilt) [ = ; ≠ ; > ; < ; + ; - ; * ; / ] Korrelationskoeffizient Pearson (-1 <= r <= +1) ja Stärke Übersicht über die gängigen Korrelationskoeffizienten
Statistik • SPSS • Berechnung des Koeffizienten: “Analysieren – Korrelation – Bivariat …” • oder Z-Transformation (Standardisierung) der eingehenden Variablen und Anwendung der Berechnungsformel • Excel • Berechnung der Koeffizienten mit Funktions-Assistenten: “Statistik – Pearson …” • oder Z-Transformation der eingehenden Variablen und Anwendung der Berechnungsformel Pearson-Korrelationskoeffizient r – Berechungsbeispiele
Statistik Y X einfacher einseitiger Zusammenhang: einfache lineare Regression Verdunstung (Y) hängt von der Lufttemperatur (X) ab Y X einfacher wechselseitiger Zusammenhang: Korrelation Verdunstung (Y) hängt von der Lufttemperatur (X) ab, umgekehrt hängt die Lufttemperatur auch von der Verdunstung ab (vgl. Verdunstungskälte) Typen statistischer Zusammenhänge: Statistik I
Statistik Einfache lineare Regression: Grundlagen • Messen der Art des statistischen Zusammenhangs zwischen zwei Variablen • Aus den Messwerten einer Variablen X soll dabei auf die Messwerte einer Variablen Y geschlossen werden ( Y X ). • Gesucht wird also ein geeignete Funktion, die die Messwerte der Variablen Y aus X “erklärt”: Y ist dabei die abhängige (zu erklärende) Variable, X ist die unabhängige Variable
Statistik Einfache lineare Regression: Idee • Frage: In welcher Weise verändert sich die Verdunstung mit der Temperatur? • Lineare Regression bedeutet, dass eine lineare Funktion y = f(x) gesucht wird, die die Tendenz der Punktwolke abbildet. Als Funktion wird die Geradengleichung y = bx + a verwendet • + : auch für nicht gemessene Temperaturen kann die Verdunstung geschätzt werden (Modell) y ~ 0.15x – 0.5
Statistik (xi/yi) ei (xi/a+bxi) Einfache lineare Regression: Berechnung der Geraden I • Ziel: Bestimmung einer Geraden, die die Punktwolke optimal repräsentiert, d.h. deren Lage unmittelbar von der Verteilung der Messwertpaare ( xi / yi ) abhängig ist • Optimal bedeutet, dass alle gemessenen Werte möglichst nahe an der Geraden liegen sollen, genauer, dass die Summe der Abweichungen ei zwischen Mess- und Modellwerten minimal ist ei = yi – (a+bxi)
Statistik “Gausssches Prinzip der kleinsten Quadrate” a und b sind so zu wählen, dass die Funktion ein Minimum annimmt Berechnungsformel Regressionskoeffizient (Steigung) BerechnungsformelRegressionskonstante (Y-Achsenabschnitt) Einfache lineare Regression: Berechnung der Geraden II
Statistik • SPSS • Berechnung von Regressionskoeffizient und -konstante sowie der Modellgüte: “Analysieren – Regression – Linear” • Excel • Berechnung der beiden Parameter “per Hand”: Regressionsgerade – Berechungsbeispiele
Statistik Analytisch-statist. Probleme bei Korrelation und Regression • Fehleranfälligkeit bei kleinen N • Ausreißerproblematik • Modellgüte bei linearer Einfachregression (erklärte Varianz) • Anwendung der multiplen liearen Regression • Residuen-Interpretation