200 likes | 404 Views
Überblick Statistik. Deskriptive Statistik=beschreibende Statistik Inferenzstatistik=schließende Statistik 2 Arten von Hypothesenprüfungen möglich 1) Zusammenhänge: Korrelation, Regression 2) Unterschiede: X 2, T-Test, U-Test, Wilcoxon, KS-Test, Varianzanalysen etc. REGRESSION.
E N D
Überblick Statistik Deskriptive Statistik=beschreibende Statistik Inferenzstatistik=schließende Statistik 2 Arten von Hypothesenprüfungen möglich 1) Zusammenhänge: Korrelation, Regression 2) Unterschiede: X2, T-Test, U-Test, Wilcoxon, KS-Test, Varianzanalysen etc.
REGRESSION Tamara Katschnig
Definition In der Psychologie, Soziologie und Pädagogik, aber auch in der Wirtschaft, der Technik, der Medizin und den Naturwissenschaften hat man es oft mit zufälligen Variablen zu tun. Dabei kennt man oft nur eine Variable und deren Verteilung. Daraus sollen Vorhersagen über die andere Variable gemacht werden. Bspl.: Bremsweg eines Pkws - km/h Intelligenzquotient-Schulleistung
Voraussetzungen für die Lineare Regression • Die Grundgesamtheit ist normalverteilt • Die Daten haben Intervallskalenniveau
Definition Regression bezeichnet die Art des Zusammenhangs zwischen zwei Variablen. Unter linearer Regression wird nun die lineare Vorhersage einer Variable y aus einer anderen Variable x (beide intervallskaliert) verstanden. Regressionsgleichung: y=bx+a
Definition Mittels der linearen Regression wird mit möglichst geringem Fehler eine Gerade durch eine Punktewolke gelegt. Diese Gerade nennt man Regressionsgerade. Diese Gerade lässt sich eindeutig durch die Steigung b und den y-Achsenabschnitt a festlegen.
Definition Fasst man x und y als abhängige Größen auf (z. B. Größe und Gewicht) und trägt man die Messergebnisse in einem Koordinatensystem auf, so erhält man eine „Punktewolke“ (auch „Punkteschwarm“) genannt, die/der längs einer Geraden zentriert ist
Beispiel Angenommen wir erheben an n=6 Personen zwei Variablen x und y (x=Leistung in einem Eignungstest, y=Leistung nach einem Jahr)
Beispiel Zeichnet man dies in einem Koordinatensystem und zieht eine Gerade durch erhalten wir 6 Punkte, die jedoch nicht alle auf der Gerade liegen. Bezüglich aller 6 Punkte können wir eine Diskrepanz zwischen dem eigentlichen Wert y und seinem vorhergesagten Wert ŷ, besonders stark ist die Differenz bei Person 1,2 u. 5.
Beispiel Es wird dabei nicht das konkrete y (zum jeweiligen x) passende betrachtet, sondern diejenige y-Koordinate, welche einem bestimmten x auf der Geraden entspricht. ŷ =vorhergesagter y-Wert auf der Geraden. Die Differenz zwischen y und ŷ nennt man Residuum.
Beispiel Aus dem Verlauf dieser Gerade kann man die Art des Zusammenhangs erkennen und Prognosen innerhalb des Beobachtungsbereiches machen. y=bx+a y=0,774.x+2,69
Beispiel Wir suchen nun den Wert y für eine VP, die bei Test x 5 bzw. 9 Punkte hat. y= 0,774 . 5 + 2,69=6,56 y= 0,774. 9 + 2,69= 9,65
REGRESSIONÜbung Tamara Katschnig
Beispiel 1 10 Personen wurden gewogen und ihre Körpergröße wurde gemessen. Größe (x) 170 176 165 171 177 167 179 185 175 180 Gewicht (y) 68 70 67 78 83 60 77 89 77 76 y=1,1x-118=Gerade, diese ermöglicht bei gegebener Körpergröße x deren Körpergewicht y vorherzusagen.
Signifikanzniveau sozialwiss. • p<0,05 Ergebnis ist signifikant H1 gilt: Es gibt einen Zusammenhang zwischen den berechneten Variablen. • p>0,05 Ergebnis ist nicht signifikant H0 gilt: Es gibt keinen Zusammenhang zwischen den berechneten Variablen. 95% Sicherheit, 5% Irrtumswahrscheinlichkeit
Beispiel 1 Eine weitere Vpn hat eine Körpergröße von (a) 172cm, (b) 165cm, (c) 183cm. Schätzen Sie das Körpergewicht (kg) dieser Vpn.
Beispiel 1-Lösung y= 1,1.x-118 (a) y= 1,1.172cm-118=71kg (b) y= 1,1.165cm-118=63kg (c) y= 1,1.183cm-118=83kg
Beispiel 2-Lösung y= 1,461.x+63,091 (a) y= 1,461.37+63,091=117,18 (b) y= 1,461.52+63,091=139,01