1.25k likes | 1.51k Views
Auswertung von Marktforschungsdaten mit SPSS für Windows WINDER Thomas 369 46 26-11 t.winder@marketmind.at Porzellangasse 32, 1090 Wien. Inhalte der Lehrveranstaltung SPSS. allgemeine Einführung in SPSS Datendefinition Einlesen von Daten Datenbereinigung
E N D
Auswertung von Marktforschungsdaten mit SPSS für Windows WINDER Thomas 369 46 26-11 t.winder@marketmind.at Porzellangasse 32, 1090 Wien
Inhalte der Lehrveranstaltung SPSS • allgemeine Einführung in SPSS • Datendefinition • Einlesen von Daten • Datenbereinigung • deskriptive Datenanalyse • Mittelwertvergleiche (T-Test) • Zusammenhang zweier nominalskalierter Variablen (Chi2-Test) • Mittelwertvergleiche (Varianzanalyse) • Auswertung der Daten aus der Marktforschungsübung
Lehrveranstaltung SPSS • Ziel der Lehrveranstaltung: Learning by Doing • gemeinsam die Grundlagen erarbeiten • selbst Erfahrungen machen (Beispiele selbst bearbeiten) • mit SPSS arbeiten und dabei das Programm kennenlernen
Lehrveranstaltung SPSS • unterstützende Medien: • Angewandte Statistik mit SPSS (Hatzinger 2004) • Skriptum (Otter 2001 bzw. Winder 2002) • von Dr. Otter übernommen • Hilfsfunktion in SPSS • SPSS-Manuals • SPSS-Hompage ( www.spss.de oder www.spss.com )
Lehrveranstaltung SPSS • weiterführende Literatur: • Lehrbuch der Statistik (Bortz 1977, S. 139 – 154) • Formulierung und Überprüfung von Hypothesen • Statistik für Wirtschaftswissenschafter (Bleymüller et al. 1994) • T-Test (S. 107 – 117) • Chi2-Test (S. 130 – 132) • Multivariate Analysemethoden (Backhaus et al. 2000, S. 70 - 79) • Einfaktorielle Varianzanalyse
Lehrveranstaltung SPSS • Beurteilung • Anwesenheit • Wake Ups (Wiederholungen) • drei Wake Ups zu Beginn der Stunde, die in die Beurteilung einfließen • zumindest bei zwei Wake Ups positiv teilnehmen • Ergebnis der beiden besseren Wake Ups wird berücksichtigt
Lehrveranstaltung SPSS • Geschichtlicher Rückblick: • 1968: Entwicklung der Ausgangssoftware an der Stanford University für den internen Gebrauch durch: • Norman H. Nie • C. Hadlai (Tex) Hull • Dale H. Bent • Weiterentwicklung an der University of Chicago (durch Nie und Hull) • SPSS: Statistical Package for the Social Sciences • 1970 publizierte McGraw-Hill die ersten SPSS user's manuals • 1975 wurde die SPSS Inc. gegründet • Verwendung auf Großrechnersystemen (GE, DEC, NASA, ...) • 1984: erstes Statistik Package für PC DOS • 1992: erste Statistik Software für Microsoft Windows • 2002: OLAP (online analytical processing)
Lehrveranstaltung SPSS • Überblick - Statistik Software: • ca. 160 Software Programme derzeit am Markt (siehe http://www.uni-koeln.de/themen/statistik/software/liste.html) • wichtigste Konkurrenzprogramme: • SAS • Systat • R bzw. S-Plus (ursprünglich interaktive Programmiersprache S für statistische und grafische Anwendungen von AT&T; seit 1993 ist die Urversion unter dem Namen R als open source project verfügbar und wird kontinuierlich von mehr als 500 Personen weiterentwickelt - als Zentrum gilt die Universität Wien)
Lehrveranstaltung SPSS • SPSS Schulungsprogramm 2006: • SPSS Crash Kurs 1 1.190,- • SPSS Crash Kurs 2 790,- • Einführung in die SPSS-Syntax 790,- • Grundkurs Statistik mit SPSS 790,- • Regressions- und Varianzanalyse 790,- • Segmentieren und Klassifizieren 1.190,- • Zufriedenheitsanalyse und Marktforschung 1.190,- SPSS GmbH Software Rosenheimer Straße 30 81669 München http://www.spss.com/de/training
Lehrveranstaltung SPSS • SPSS für Windows: • Version 16.0 • Diplomanden – evtl. Benützung über das Institut • Studenten – direkt bei SPSS sind Studentenversionen erhältlich
Inhalte der Lehrveranstaltung SPSS • allgemeine Einführung in SPSS • Datendefinition • Einlesen von Daten • Datenbereinigung • deskriptive Datenanalyse • Mittelwertvergleiche (T-Test) • Zusammenhang zweier nominalskalierter Variablen (Chi2-Test) • Mittelwertvergleiche (Varianzanalyse) • Auswertung der Daten aus der Marktforschungsübung
Datenstruktur Variablen Fälle (=Apn)
Info über Datendatei alle Informationen über die entsprechende SPSS-Datendatei
Öffnen von Dateien relevante SPSS-Dateitypen: *.sav ... SPSS Datendatei *.spv ... SPSS Ausgabedatei (*.spo) *.sps ... SPSS Syntaxdatei
Überblick I Datenbereinigung: Auffinden von Eingabefehlern in der Datenmatrix
Überblick II Datenbereinigung: Auswahl von spezifischen Fällen (mit Fehlern) deskriptive Datenanalyse: Auswahl von Subsamples (z.B.: alle befragten Frauen, Personen älter als 20 Jahre, ...)
Überblick III deskriptive Datenanalyse: gleichzeitige Analyse von mehreren Subsamples
Überblick IV Datenbereinigung: Erstellen von neuen Variablen bzw. Ersetzen von Werten bestehender Variablen
Überblick V Datenbereinigung: Erstellen von neuen Variablen bzw. Ersetzen von Werten bestehender Variablen auf Basis von mathematisch/statistischen Funktionen
Überblick VI Datenbereinigung: Suchen von Fehlern Häufigkeiten Kontrolle der Quoten Kreuztabellen deskriptive Datenanalyse: Standardauswertungen Häufigkeiten Standardauswertungen Deskriptive Statistiken Chi2-Test Kreuztabellen
Überblick VII Mittelwertvergleiche: Analyse von signifikanten Unterschieden T-Test bei einer Stichprobe T-Test bei unabhängigen Stichproben T-Test bei gepaarten/abhängigen Stichproben
Überblick VIII Varianzanalyse: Analyse der Wirkungen von verschiedenen Faktoren auf eine abhängige Variable
Überblick IX deskriptive Datenanalyse: Analyse von mehreren zusammengehörigen Variablen in einem Arbeitsschritt (z.B.: Zuordnung von Imageitems auf eine Marke)
Überblick X Datendefinition: Variablenansicht zur Definition der verschiedenen Variablen
Überblick XI Datendefinition: Definition des Variablentyps, v.a.: Numerisch String
Überblick XII Datendefinition: Benennen der (numerischen) Codes anhand von sogenannten Wertelabels
Überblick XIII Datendefinition: Definition der fehlenden Werte (Missings)
Überblick XIV Datendefinition: Definition des Skalenniveaus: Nominal Ordinal Intervall Ratio Metrisch
Optionen unbedingt aktivieren, um Befehlssyntax im Ausgabefenster zu erhalten
Inhalte der Lehrveranstaltung SPSS • allgemeine Einführung in SPSS • Datendefinition • Einlesen von Daten • Datenbereinigung • deskriptive Datenanalyse • Mittelwertvergleiche (T-Test) • Zusammenhang zweier nominalskalierter Variablen (Chi2-Test) • Mittelwertvergleiche (Varianzanalyse) • Auswertung der Daten aus der Marktforschungsübung
Inhalte der Lehrveranstaltung SPSS • allgemeine Einführung in SPSS • Datendefinition • Erstellen eines Codeplanes (face to face – Interviews) • Beispiel aus dem Skriptum • Beispiel aus der Praxis (SWISS) • Exkurs: Dateneingabe • Erstellen einer Datendefinition in SPSS (face to face – Interviews) • Beispiel aus dem Skriptum • Beispiel aus der Praxis (SWISS)
Erstellen eines Codeplanes • Fragebogennummer • je nach Anzahl der vorgesehenen Fragebögen (im Zweifel lieber mehr Stellen) • fehlende Stellen vor der eigentlichen Zahl mit Blank oder 0 ergänzen – macht keinen Unterschied und wird von SPSS nicht angezeigt
Erstellen eines Codeplanes • Skalenfragen • in der Regel nur eine Stelle notwendig für jede Skalenfrage • Ausnahmen: • mehr als 9 (wenn 10 nicht als 0 eingegeben und anschließend umkodiert wird) bzw. 10 Skalenstufen • Ausweichkategorie („Weiß nicht“, ...) mit 99 kodiert (nur sinnvoll, wenn 9 oder mehr Skalenstufen; ansonsten Ausweichkategorie mit 9 kodieren !!!) • Beispiel: Wie gut hat Dir der Werbespot gefallen? Bitte sag mir anhand der 5-stufigen Skala von 1="hat mir sehr gut gefallen" bis 5="hat mir überhaupt nicht gefallen", wie gut Dir der Werbespot insgesamt gefallen hat. hat mir sehr gut gefallen 1 2 3 4 5 hat mir überhaupt nicht gefallen
Erstellen eines Codeplanes • offene Fragen (numerisch) • je nach Anzahl der erwarteten Antworten(in der Regel sind zwei oder max. drei Stellen erforderlich) • parallel werden Listen angelegt (am einfachsten in Word oder Excel): • 1 = London • 2 = Zürich • 3 = Wien • 4 = ... • Beispiel: Gibt es Elemente, die Dir bei diesem Spot besonders gut gefallen haben? 1. _________________________________________________________ 2. _________________________________________________________3. _________________________________________________________
Erstellen eines Codeplanes • offene Fragen (string) • je nach benötigten Anschlägen/Buchstaben(nicht empfehlenswert, evtl. bei allgemeingültigen Codes, wie bei Länderbezeichnungen oder Flughafencodes: AUT, GER, ...; LHR, VIE, ...) • Listen sind trotzdem notwendig zum Nachschlagen, zur einheitlichen Verwendung, zur korrekten Dateneingabe, ... • Syntax zum Einlesen der entsprechenden Variable:data list file = "c:\ergebnis1.txt" record = 1/fn 1-5, q1_1 6, q1_2 7, ... q42 30-32 (a).
Erstellen eines Codeplanes • geschlossene Fragen (Entweder/Oder; Ja/Nein) • nur eine Stelle notwendig für jede geschlossene Frage • Achtung: • es können mehrere geschlossene Fragen kombiniert oder verschachtelt werden • es gibt ganze Fragebatterien mit dichotomen (Ja/Nein) Antworten für jede Frage/Antwort eine Stelle vorsehen • Beispiel 1: getrennte Fragestellung; jeweils nur eine Antwort möglich für jede Frage eine Stelle vorsehen Hast Du einen Internetzugang? Ja 1 Nein 2 Und wie häufig nutzt Du das Internet? täglich 1 mehrmals pro Woche 2 mehrmals im Monat 3 seltener 4
Erstellen eines Codeplanes • geschlossene Fragen (Entweder/Oder; Ja/Nein) • Beispiel 2a: kombinierte Fragestellung; nur eine einzige Antwort möglich Hast Du einen Internetzugang und wenn „Ja“, wie häufig nutzt Du das Internet? Ja, täglich 1 Ja, mehrmals pro Woche 2 Ja mehrmals im Monat 3 Ja, aber selten 4 Nein 5
Erstellen eines Codeplanes • geschlossene Fragen (Entweder/Oder; Ja/Nein) • Beispiel 2b: kombinierte Fragestellung; zwei Antworten notwendig Frage teilen und zwei Stellen vorsehen Hast Du einen Internetzugang und wenn „Ja“, wie häufig nutzt Du das Internet? Ja 1 täglich 1 mehrmals pro Woche 2 mehrmals im Monat 3 seltener 4 Nein 2
Erstellen eines Codeplanes • geschlossene Fragen (Entweder/Oder; Ja/Nein) • Beispiel 3: Fragebatterien mit dichotomen (Ja/Nein) Antworten für jede Frage eine Stelle vorsehen (nicht eine Frage, sondern 5 x 4 = 20 Fragen) Ich lese Ihnen nun nacheinander eine Reihe von Eigenschaften vor. Bitte sagen Sie mir jeweils, ob diese auf die Marke ... passt oder nicht. A1 One T-Mobile tele.ring sympathisch 1 1 1 1 elitär 1 1 1 1 modern 1 1 1 1 dynamisch 1 1 1 1 erfolgreich 1 1 1 1
Erstellen eines Codeplanes • geschlossene Fragen (Mehrfachantworten) • für jedes Item/Antwortmöglichkeit ist eine Stelle notwendig • jedes Item entspricht einer eigenen Variablen und ist mit Ja oder Nein zu kodieren • Beispiel 1:(vgl. Beispiel 3) Ich lese Ihnen nun eine Reihe von Eigenschaften vor. Bitte sagen Sie mir welche von diesen auf die Marke A1 passt. A1 sympathisch 1 elitär 1 modern 1 dynamisch 1 erfolgreich 1
Erstellen eines Codeplanes • geschlossene Fragen (Mehrfachantworten) • Beispiel 2: Wo bzw. in welchem Zusammenhang ist Dir schon einmal Werbung von SPARK7.COM begegnet? Radio 1 Events 1 Kino 1 Veranstaltungsort 1 Inserate (Tageszeitungen) 1 Inserate (Magazine) 1 Werbebanner (Internet) 1 sonstiges 1
Inhalte der Lehrveranstaltung SPSS • allgemeine Einführung in SPSS • Datendefinition • Einlesen von Daten • Anwendung der Datendefinition (face to face - Interviews) • direktes Einlesen von Excel-Daten (CATI - Interviews) • Exkurs: Befragungsmasken für Telefoninterviews
Einlesen von Daten • Befehlssyntax I • Auf die meisten SPSS-Befehle können Sie über die Menüs und Dialogfelder zugreifen. Einige Befehle und Optionen sind aber nur in der SPSS-Befehlssprache verfügbar (z.B.: data list). • Mit der Befehlssprache verfügen Sie außerdem über die Möglichkeit, Jobs in einer Syntaxdatei zu speichern. Sie können eine Analyse dann zu einem späteren Zeitpunkt wiederholen oder diese automatisch mit dem Produktionsmodus ausführen lassen. • Eine Syntaxdatei ist eine einfache Textdatei, die SPSS-Befehle enthält. Es ist möglich, ein Syntaxfenster zu öffnen und Befehle einzugeben, oder mit einer der folgenden Funktionen zu arbeiten: • Übernehmen der Befehlssyntax aus Dialogfeldern mit der Schaltfläche "Einfügen„ • Kopieren der Syntax aus dem Ausgabe-Log
Einlesen von Daten • Befehlssyntax II • Beachten Sie beim Bearbeiten und Verfassen einer Befehlssyntax die folgenden Regeln: • Jeder Befehl muss in einer neuen Zeile beginnen und mit einem Punkt (.) enden. • Die meisten Unterbefehle werden durch Schrägstriche (/) voneinander getrennt. Der Schrägstrich vor dem ersten Unterbefehl ist in der Regel optional. • Variablennamen müssen vollständig ausgeschrieben werden. • Text in Apostrophen oder Anführungszeichen muss sich in einer Zeile befinden. • Zeilen mit Befehlssyntax dürfen nicht länger als 80 Zeichen sein. • Zum Kennzeichnen der Dezimalstellen muss der Punkt (.) verwendet werden, auch wenn die regionalen Einstellungen für Windows anders sind. • Bei der SPSS-Befehlssyntax wird nicht zwischen Groß- und Kleinschreibung unterschieden. Für viele Befehle können Abkürzungen aus mindestens drei Zeichen verwendet werden. Sie können beliebig viele Zeilen zur Angabe eines einzelnen Befehls verwenden.
Einlesen von Daten • Befehlssyntax III • An fast jedem Punkt, an dem ein Leerzeichen zulässig ist, können Sie beliebig viele Leerzeilen oder Zeilenumbrüche einfügen, beispielsweise bei Schrägstrichen, runden Klammern, arithmetischen Operatoren oder zwischen Variablennamen. So ist beispielsweise sowohl FREQUENCIES VARIABLES=JOBCAT GENDER /PERCENTILES=25 50 75 /BARCHART als auch freq var=jobcat gender /percent=25 50 75 /bar zulässig. Mit beiden Formen wird das gleiche Ergebnis erzielt.
Einlesen von Daten • Data List Befehl • Liest die Daten aus einem beliebigen Dateiformat ein und vergibt Variablennamen. DATA LIST [FILE=file] [{FIXED}] [RECORDS={1}] [SKIP={n}] [{TABLE }] {n} {NOTABLE} {FREE } [{("delimiter",“delimiter“,..., TAB)}] {LIST } /{1 }varname {col location [(format)]} [varname ...] {rec #} {(FORTRAN-like format) } [/{2 } ...] [/ ...] {rec #} • Beispiel: data list file = "a:\ergebnis_b.txt" record = 1/ fb 1-3, f1 4, f1_1 5, f2 6-7, f3_1 8, f3_2 9, f3_3 10, f4 11, f5 12-13, f6 14 (a). Execute.
Einlesen von Daten • Data List Befehl • Liest die Daten aus einem beliebigen Dateiformat ein und vergibt Variablennamen. DATA LIST [FILE=file] [{FIXED}] [RECORDS={1}] [SKIP={n}] [{TABLE }] {n} {NOTABLE} {FREE } [{("delimiter",“delimiter“,..., TAB)}] {LIST } /{1 }varname {col location [(format)]} [varname ...] {rec #} {(FORTRAN-like format) } [/{2 } ...] [/ ...] {rec #} • Beispiel: data list file = "a:\ergebnis_b.txt" record = 1/ fb 1-3, f1 4, f1_1 5, f2 6-7, f3_1 8, f3_2 9, f3_3 10, f4 11, f5 12-13, f6 14 (a). Execute. Stellenangabe in der Datendatei Zahl der Zeilen in der Datendatei Dateiname mit exaktem Pfad (a) ... notwendig um eine Stringvariable zu definieren Variablenname
Einlesen von Daten • Data List Befehl + Variable/Value Labels data list file = "a:\ergebnis_b.txt" record = 1/ fb 1-3, f1 4, f1_1 5, f2 6-7, f3_1 8, f3_2 9, f3_3 10, f4 11, f5 12-13, f6 14 (a). variable labels fb "Fragebogennummer“/ f1 „Durchführung". value labels f1 1 "intern" 2 "extern"/ f4 1 "äußerst wichtig" 2 "wichtig" 3 "durchschnittlich" 4 "weniger wichtig" 5 "überhaupt nicht wichtig". Execute.
Einlesen von Daten • Fehlermeldungen I: data list file = "c:\ergebnis_a.txt" record = 1/ fb 1-2, f1 3, f2 4, f2_1 5, f2_2 6, f2_3 7, f2_4 8, f3_1 9, f3_2 10, f4 11-12, f5 13, f6 14-15. >Error # 31 in column 18. Text: c:\ergebnis_a.txt >File not found. >This command not executed. • Fehlerquelle: • falscher Pfad: • falsches Laufwerk (a/c/e/....) • falsche Dateiextension (doc, xls, ...) • falscher Dateiname • fehlende Anführungszeichen • ...
Einlesen von Daten • Fehlermeldungen II: >Warning # 522 >An unexpected end of file has been found in the middle of reading a case. >The partial case will be ignored. Check your input for a possible missing >record. • Fehlerquelle: • Zahl der definierten Zeilen (records) nicht korrekt