550 likes | 723 Views
FPR I - WS 2007 - Herzlich Willkommen -. 2. Block Crash-Kurs: Versuchsplanung Versuchsdesign Planung und Gestaltung einer empirischen Studie. Heutige Themen. Versuchsplanung, Versuchsdesign, Planung und Gestaltung einer empirischen Studie Die multiple lineare Regression
E N D
FPR I - WS 2007- Herzlich Willkommen - 2. Block Crash-Kurs: Versuchsplanung Versuchsdesign Planung und Gestaltung einer empirischen Studie
Heutige Themen • Versuchsplanung, Versuchsdesign, Planung und Gestaltung einer empirischen Studie • Die multiple lineare Regression • Die Reliabilitätsanalyse • Die Faktorenanalyse
Versuchsplanung Versuchsdesign Planung und Gestaltung einer empirischen Studie
Planung einer empirischen Studie (1) Planungsreferat • Phase 1: Erkundungsphase • Interesse, Idee, praktisches Problem, Literatursuche • Phase 2: theoretische Phase • Datensammlung und Datenauswahl • Formulierung einer Fragestellung • Aufstellen der statistischen Hypothesen (H0, H1)
Planung einer empirischen Studie (2) • Phase 3: Planungsphase • Aufstellen eines Versuchsdesigns • Auswahl der Stichprobe • Auswahl der Versuchsbedingungen • Auswahl des Messinstruments • ev. Fragebogen-, Testkonstruktion und Beschreibung der Items/Fragen • Auswahl der (voraussichtlichen) statistischen Methoden (mit Begründung und Voraussetzungen) --- Ende Planungsreferat ---
Planung einer empirischen Studie (3) Phase 4: Untersuchungsphase • Datenerhebung mittels Experiment, Befragung, Beobachtung, Testung und... • Eingabe der Daten in SPSS Auswertungsreferat • Phase 5: Auswertungsphase • Testtheoretische Überprüfung eigens konstruierter Tests, Fragebögen,… (Reliabilitätsanalyse, Item-Trennschärfen, Itemschwierigkeiten, ev. Validität: Korrelationen mit einem Kriterium,…)
Planung einer empirischen Studie (4) • Phase 5 (Fortsetzung) • Deskriptive Beschreibung der Stichprobe, (Grafiken, Tabellen, Mittelwerte, Median, Varianzen, Quartilabstand…) • Verteilungen der selbst konstruierten Items bzw. Fragen (Rohscore, Häufigkeiten der Antwortmögl. pro Item…) • Hypothesenprüfung: Durchführung diverser zulässiger (!) statistischer Verfahren (t-Test, (M)ANOVA, Korrelationen, Regression, Kreuztabellen, Chi-Quadrat-Test...) Anmerkung: Bessere Verfahren/Analysen – bessere Bewertung der Seminararbeit
Planung einer empirischen Studie (5) • Phase 6: Interpretationsphase • Ergebnisse, ev. Kritikpunkte, schwächen der Untersuchung, Störvariablen • Phase 7: Konklusion (Kurzzusammenfassung der wichtigsten Ergebnisse der Studie! – wichtig für den Zuhörer!)
Literatursuche (1) • UB-OPAC (Online Katalog ab 1989) • (http://aleph.univie.ac.at/ALEPH/) • Gesamtbestand der Uni Wien ab 1989 (Hauptbibliothek und Institutsbibliotheken) • Suche nach Titel, Autor, Schlagwort,…
Literatursuche (2) • (psychologische) Datenbanken • Psyndex • PsycInfo • Medizinische Datenbank: Pubmed • Über diesen Link auch von zu Hause: https://univpn.univie.ac.at/ • Login mit User-ID und Passwort
Literatursuche (3) • Wichtig: Vor allem mit englischen Suchbegriffen und Schlagwörtern suchen! • Viele Zeitschriften auch online verfügbarhttp://www.univie.ac.at/fb-psych/ • Gesamte verfügbare Zeitschriftenliste in FB (neben PCs) oder Online über FB-Homepage http://www.univie.ac.at/fb-psych/
Literatursuche (4) Psychologische Tests/Messinstrumente • „Testliste“ in FB für Psychologie (bei PCs) • Testbeschreibungen und Gütekriterien in • Kubinger, K. D. (1995). Einführung in die psychologische Diagnostik. Weinheim: Psychologie Verlags Union.(siehe auch Anhang!) • Kubinger, K. D. (2003). Schlüsselbegriffe der psychologischen Diagnostik. Weinheim: Beltz • Handbuch des Messinstruments
Literatursuche (5) • Lehrbücher, Monographien ausleihen • Online suchen • bei UB Wien online bestellen • bei FB f. Psych. online oder selbst suchen (jedes Buch hat eine Signaturnummer aus einem Buchstaben+Zahlencode) z.B:EA-521/P-Rot • Suchlegende (welches Buch in welchem Raum\Regal) in Bibliothek bzw. TutorInnen
Zitierregeln (1) kurzes Beispiel • Nach der Deutschen Gesellschaft für Psychologie • www.dgps.de A) Zitieren im Literaturverzeichnis • Bsp Monographie: Nachname, Vorname abgekürzt. (Erscheinungsjahr). Titel der Arbeit (inkl. Untertitel). Erscheinungsort: Verlag. Rost, J. (1996). Lehrbuch Testtheorie Testkonstruktion. Bern: Verlag Hans Huber.
Zitierregeln (2) • Bsp Zeitschrift: Nachname, Vorname abgekürzt. (Erscheinungsjahr). Titel der Arbeit (inkl. Untertitel). Name der Zeitschrift, Jahrgang bzw. Band, Seitenangaben. Borg, I. (1984). Das additive Konstantenproblem der multidimensionalen Skalierung. Zeitschrift für Sozialpsychologie, 15, 248-253.
Zitierregeln (3) B) Zitieren im Text • Bsp: In einer Studie konnten Schmid et al. (1981) zeigen, dass… • Bsp: 1981 konnten Schmid et al. in einer Studie zeigen, dass… • Bsp: In einer Studie (Schmid et al., 1981) konnte gezeigt werden, dass…
Versuchsdesign aufstellen • Was will ich erheben, testen,… • Wie will ich es erheben, testen,… • Fragebogen • Test • Experiment, Quasiexperiment (VG, KG) • Beobachtung • Interview • … -> selbst konstruiert (vs. aus Literatur, bereits vorhanden)
Ad Messinstrument: • Test/Fragebogensuche: • Literatursuche • Existiert bereits ein Fragebogen, Test? • Wenn ja, Testqualität (Gütekriterien) überprüfen (Handbuch) • Wenn nein, eigene Konstruktion
Selbstkonstruktion • Wie kann ich eine Fragestellung, Hypothese operationalisieren? Grundfrage für weitere stat. Auswertungen: -> Welche Variablenart bzw. welches Skaleniveau soll mein Messinstrument aufweisen?!!!
Variablentypen Quantitativ • Stetig: (theoretisch) unendlich viele Ausprägungen/Intervalle (wie Größe, Gewicht, Längen,...) • Diskret: eine bestimmte, endliche Anzahl (z.B: Anzahl der Personen in einem Raum, Testscore,...). Qualitativ nur beschränkte Ausprägungen oder quantitative Variablen in Klassen zusammengefasst • Dichotom: 2 Ausprägungen (z.B: Geschlecht, Versuchs-Kontrollgruppe, Psychologie vs. Nicht-PsychologiestudentInnen, Altersklasse: 15-30 und 31-60…) • Polytom: mehr als 2 Ausprägungen (z.B: Bildung, Haarfarbe, Beruf, Einkommensklasse: 0-500, 501-1000, >1000 Euro...)
Skalentypen • Intervallskaliert/rationalskaliert(Größe, Gewicht, Längen, (~)Rohscore, Temperatur...) • rang- oder ordinalskaliert (Noten, Rangreihen, Dienstgrade, Beliebtheit von Personen...) • nominalskaliert (Geschlecht, Bildungsgrad, Haarfarbe, Beruf...)
Zusammenhang Skalen- Variablentypen Intervallskala Quantitativ (stetig, diskret) Rangskala Grenzfall zw. Quant. und Qual. Nominalskala Qualitativ (dichotom, polytom)
Vorplanung Achtung!!! -> Je nach Variablentyp sind nur bestimmte zulässige statistische Verfahren anwendbar! ->daher muss vor Item-, Test- oder Fragebogenkonstruktion folgendes beachtet werden: • welche statistischen Verfahren will ich anwenden • wie müssen demnach die Variablen erhoben bzw. konstruiert werden • Welche Möglichkeiten der Erhebung habe ich
Beispiel 1 Ich will eine lineare Regression rechnen: Voraussetzung für eine Regression: • AV muss intervallskaliert, quantitativ sein.
Beispiel 2 Ich will eine zweifache Varianzanalyse rechnen: Voraussetzung für eine 2-fache ANOVA: • AV intervallskaliert, quantitativ • UVs beide qualitativ (dichotom, polytom) oderqualitative V. in Klassen zusammengefasst • Genügend VP pro Zelle (Faktorkombination)
Skalenkonstruktion Definition: Eine Skala besteht aus einer Reihe von Items, welche die gleiche Dimension messen. Qualitätsprüfung: Mittels testtheoretischer Verfahren (Reliabilitätsanalyse, FA, Rasch Modell!, Trennschärfen…) Beispiel: Forschungsfrage: Einstellung zur EU • Konstruktion einer Anzahl von Items (Skala), welche die Einstellung der Befragten zur EU erfassen.
Skalenkonstruktion • Vorgehen: • die Items formulieren • Das Antwortformat festlegen (z.B. „Rating Skala“: dreikategoriell: stimme zu, weiß nicht, stimme nicht zu; multiple choice, single choice, Zahlenwerte von 1 bis 10… ) • Das Antwortformat muss über die Items gleich bleiben! …und hoffen dass die Qualität der Skala bei späteren testtheoretischen Auswertungen gewährleistet ist. • Die testtheoretische, qualitative Überprüfung der Skala kann i.d.R. nur nach Testungen (mit Daten) durchgeführt werden!
SkalenkonstruktionExemplarischer Fragebogen mit 3 Items zum Thema „Einstellung zur EU“ • Frage 1:Die EU bringt uns viele wirtschaftliche Vorteile. O trifft zu O trifft manchmal zu O trifft nicht zu • Frage 2: Eine ständige Erweiterung des europäischen Raumes schadet der heimischen Wirtschaft enorm. O trifft zu O trifft manchmal zu O trifft nicht zu • Frage 3: Ich würde bei einer Volksabstimmung für die EU stimmen. O trifft zu O trifft manchmal zu O trifft nicht zu Kodierung: 1-3 Werte pro Item Rohscore: hoher Wert: positive Einstellung, niedriger Wert: negative Einstellung Min. Max: 3 bzw. 9 Rohwertepunkte • Eine Skala hat immer 2 Dimensionen • Achtung auf die Polarität der einzelnen Items!! 3 2 1 1 2 3 3 2 1
Rohwert • Die gewählten Antwortwerte aller Items eines Befragten werden zu (s)einem Rohwert summiert. • Likert-Skala, Ratingskala • Voraussetzung!: Die Skala ist testtheoretisch in Ordnung (siehe unten)
Rohwert • Achtung!!: auf die richtige Punktevergabe der Antwortmöglichkeiten pro Item achten! (die Polarität muss stimmen!) (siehe oben: Bsp.-Skala „EU“) • Eine Skala hat 2 Dimensionen: ad Beispiel: hoher Rohscore -> positive Einstellung zur EU niedriger Rohscore -> negative Einstellung zur EU
Antwortkategorien (1) Rating-Skalen 0 stimmt gar nicht 0 stimmt teilweise 0 stimmt völlig Polaritätenprofil: gespannt 1 2 3 4 5 gelöst aggressiv -2 -1 0 1 2 friedlich Durch ankreuzen | x | Durch ankreuzen | Durch wählen z.B.: Werte von 1 bis 10
Antwortkategorien (2) Multiple Choice Mehrfachantworten: Wählen sie Ihre Hobbies 0 Sport 0 Kino 0 Lesen 0 Ausgehen 0 Basteln,… Meist bei demographischen Fragen Einfachantwort:Hauptstadt von Frankreich 0 Istanbul 0 Oslo 0 Paris 0 Bukarest Meist bei Leistungstests
Testtheoretische Analyse der Skala • Qualitätsprüfung der Skala • Immer erst nach der Stichprobenerhebung möglich • Man benötigt Daten um testtheoretisch auszuwerten
1. Überprüfung der Eindimensionalität „Messen alle Items einer Skala die gleiche Dimension?“ • Reliabilitätsanalyse • Rasch Modell • ev. Faktorenanalyse (1 Faktor)
2. Itemparameter • Itemschwierigkeit (bzw. Lösungshfgkt) • Dichotom (richtig/falsch)
2. Itemparameter • Häufigkeiten/Verteilungen der gewählten Antwortkategorien pro Item • auch mehrkategoriell!
2. Itemparameter • Itemtrennschärfe („Wie gut passt das Item zur Gesamtskala“) -> Korrelation eines Items mit der Skala
3. Validität(eventuell) „Misst die Skala das, was sie messen soll?“ • Korrelation mit Testwerten aus einem anderem Test, der gleiches misst • Korrelation mit einem anderen Kriterium (z.B: Rohscore im Mathematiktest korreliert mit Mathematiknote)
Vorgehen • Nach testtheoretischen Überprüfung der Skala: • Eliminierung der Items, die nicht zu den anderen passen (geringe Trennschärfe, zu leicht, zu schwer, verringerte Reliabilität…) Achtung!!: ev. nur falsche Polarität Weitere Auswertung und Hypothesenprüfung nur mit der korrigierten Skala!
Zusammenfassung: selbst konstruierte Messinstrumente • Angabe von: • Entwicklungsschritten/vorgehen (kurz) • Beschreibung, was mit dem Instrument gemessen wird • Skalentyp • Antwortformat (Bsp.: 3stufige Ratingskala) • Anzahl der Items • (!) Itembeispiele(wichtig für das Referat! – besseres Verständnis für den Zuhörer) • Gütekriterien: Testtheoretische Analysen (nach Datenerhebung) der selbst entwickelten Instrumente sind Voraussetzung für die Weiterverwendung!
Gegebene Tests, Fragebögen • Prüfung, ob passend und testtheoretisch in Ordnung (Handbuch lesen) • Immer Angabe von: • Name des Untersuchungsinstruments • Autor(inn)en • Kurze Erklärung, was mit dem Instrument gemessen wird • Gütekriterien(Rel, Obj, Val…) • Skalentyp (Bsp.: 3stufige Ratingskala, semantisches Differential..) • Welches Antwortformat • Anzahl der Items • (!) Itembeispiel(wichtig für das Referat! – besseres Verständnis für den Zuhörer) • Wurden die Items modifiziert? Warum? (wenn möglich Originalskala übernehmen)
Demographische Variablen • Niemals bei Erhebung vergessen! • Fast alle Fragestellungen zielen auf differentielle Unterschiede ab! • Geschlecht • Alter • Schulbildung • Beruf • Familienstand • Anzahl der Kinder • ……immer an die Untersuchung angepasst
Tipp… Immer maximale Information erfragen! Beispiel Alter immer genau erheben (z.B: in Jahren 21, 54, 66…) nicht in Klassen erheben (0-20, 21-60,…) bereits anfänglicher Informationsverlust! • In Klassen kann nachträglich in SPSS eingeteilt werden
Qualitative vs. Quantitative Auswertung Was kann wie ausgewertet werden?
1 Demographische Variablen (1) z.B. Geschlecht, Bildungsstand, Haarfarbe… • Sind qualitative (dichotome, polytome) Variablen, nominalskaliert • Auswertung: • deskriptiv, nach Häufigkeiten, • qualitativ (Binomialtest, Chi-Quadrat-Test, Kreuztabellen)
1. Demographische Variablen (2) z.B. Alter, Einkommen • Sind quantitative (stetige, diskrete) Variablen, min. intervallskaliert • Auswertung: alles möglich • Deskriptiv, nach Häufigkeiten, • qualitativ (wenn in Klassen) • quantitativ (t-Test, VA, Regression…)
2. einzelne Fragen, Items(nominalskaliert) z.B. Welche Augenfarbe 0 blau 0 grün 0 braun 0 andere • Ist eine qualitative (polytome) Variable, nominalskaliert • Auswertung: • deskriptiv, nach Häufigkeiten • qualitativ (Binomialtest, Chi-Quadrat-Test, Kreuztabellen)
3. einzelne Fragen, Items(rangskaliert) z.B. Sind sie mit dem EU Betritt der Türkei einverstanden? 0 trifft zu 0 trifft eher zu 0 trifft eher nicht zu 0 trifft nicht zu • Ist eine rangskalierte Variable • Auswertung: • deskriptiv, nach Häufigkeiten, • qualitativ (Binomialtest, Chi-Quadrat-Test, Kreuztabellen) • beschränkt quantitativ (Median, Quartilabstand)
4. Eine Skala von Items(~ intervallskaliert) (1) A) Normierter Test, Fragebogen aus Literatur B) Selbstkonstruierte Skala, wenn Testtheoretische Kriterien (Reliabilität, Item-Trennschärfen,…) in Ordnung sind • Regel für FPR I: • Reliabilität: >0.6…ok, >0.8…gut • Trennschärfen: >0.10…ok, >0.3…gut • Items mit negativen oder Trennschärfen um Null eliminieren!