250 likes | 345 Views
German Stata User Meeting 2003. Tabellierung von Mehrfachantwort- gruppen Zwei neue Programme. Hilde Schaeper / schaeper@his.de. 1. Set von binären Variablen. In welchem Rahmen haben Sie während Ihres Studiums an folgenden Lehr- und Lernformen aktiv mitgewirkt? (Mehrfachnennung möglich)
E N D
German Stata User Meeting 2003 Tabellierung von Mehrfachantwort- gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de
1. Set von binären Variablen In welchem Rahmen haben Sie während Ihres Studiums an folgenden Lehr- und Lernformen aktiv mitgewirkt? (Mehrfachnennung möglich) Ich habe in Gruppen an der Bearbeitung von Studienaufgaben mitgewirkt Ich habe in praxis-/forschungsorientieten Projektstudien mitgearbeitet Ich habe in kooperativen Studienprojekten von Hochschule und Betrieben/ Dienststellen gearbeitet Ich habe freiwillige betriebliche Praktika absolviert Ich habe in internationalen Zusammenhängen studiert Ich war als Tutor/Tutorin eingesetzt lform1 lform2 lform3 lform4 lform5 lform6 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Bei HIS: Zwei Arten der Kodierung von Mehrfachantwortfragen German Stata User Meeting, 12.08.2003
In welchen Fächern haben Sie Ihre Abitur-prüfung abgelegt? LK1 LK2 GK1 GK2 Mathematik 1 Physik 2 Chemie 3 Biologie 4 Geographie 5 Deutsch 6 Englisch 7 Französisch 8 Spanisch 9 Geschichte 10 Sozialkunde 11 usw. Haben Sie neben den für das Studium erfor-derlichen Lehrveranstaltungen auch Veran-staltungen innerhalb oder außerhalb der Hochschule speziell mit dem Ziel der Ver-besserung der Berufschancen besucht? ja 1 nein 2 Wenn ja, welche? 1. 2. 3. lv1 lv2 lv3 fach1 fach2 fach3 fach4 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen 2. Set von polytomen Merkmalen German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Die SPSS-Prozedur <mult response> (Beispiele) 1. univariate Verteilung dichotomer Mehrfachantwortvariablen mult response groups=lehrform(lform1 to lform9 (1)) /freq=lehrform. Mehrfachantworten Group LEHRFORM (Value tabulated = 1) Pct of Responses 26,4 11,2 3,6 12,8 6,3 6,2 Pct of Cases 77,4 33,0 10,5 37,5 18,5 18,0 Dichotomy label Formen: Gruppen Formen: Projektstudien Formen: koop. Studienprojekte Formen: freiwillige Praktika Formen: internationales Studium Formen: Tutor/in --- snip --- Name LFORM1 LFORM2 LFORM3 LFORM4 LFORM5 LFORM6 Count 5997 2557 814 2910 1432 1399 ------- ----- ----- Total responses 22728 100,0 293,2 350 missing cases; 7.752 valid cases German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen 2. bivariate Verteilung dichotomer Mehrfachantwortvariablen GESCHL Count |männlich weiblich Row pct | Row Col pct | Total | 1 | 2 | LEHRFORM --------+--------+--------+ LFORM1 | 2490 | 3507 | 5997 Formen: Gruppen | 41,5 | 58,5 | 77,4 | 78,2 | 76,8 | +--------+--------+ LFORM2 | 1074 | 1483 | 2557 Formen: Projektstudi | 42,0 | 58,0 | 33,0 | 33,7 | 32,5 | +--------+--------+ --- snip --- +--------+--------+ Column 3186 4566 7752 Total 41,1 58,9 100,0 Percents and totals based on respondents 7.752 valid cases; 350 missing cases German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen 3. Tabellierung polytomer Mehrfachantwortvariablen mult response groups=lehrveranst(lv1 to lv3 (1, 99))/freq=lehrveranst. Mehrfachantworten Group LEHRVERA Pct of Pct of Category label Code Count Responses Cases Einsatz von EDV(-Programmen), Programmie 1 399 8,3 12,5 techn. Grundlagen der DV 2 26 ,5 ,8 EDV allgemein 3 80 1,7 2,5 Wirschaftsveranstaltungen 4 358 7,4 11,2 Jura-Veranstaltungen 5 94 1,9 3,0 Regionalstudien 6 11 ,2 ,3 Veranstaltungen zur Ökologie 7 33 ,7 1,0 (Fremd-)Sprachenveranstaltungen 8 960 19,9 30,2 Zusatzzertifikate 9 224 4,6 7,0 --- snip --- Sonstiges 99 53 1,1 1,7 ------- ----- ----- Total responses 4826 100,0 151,6 4.919 missing cases; 3.183 valid cases German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Tabellierung von Mehrfachantwortvariablen in Stata 1. Dichotome Mehrfachantwortvariablen a) <tabstat> (interner Ado-File) tabstat lform1-lform6 [aw=gewinsg], statistics(mean count) /// columns(statistics) format(%3.1f) variable | mean N ------------+-------------------- lform1 | 75,5 7752,0 lform2 | 31,3 7752,0 lform3 | 10,1 7752,0 lform4 | 37,3 7752,0 lform5 | 18,3 7752,0 lform6 | 18,0 7752,0 --------------------------------- German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen a) <tabstat> mit by()-Option tabstat lform1-lform3 [aw=gewinsg], statistics(mean count) /// columns(statistics) format(%3.1f) by(geschl) Summary for variables: lform1 lform2 lform3 by categories of: geschl (Geschlecht) geschl | mean N ----------------+-------------------- männlich | 77,2 3186,0 | 31,6 3186,0 | 10,7 3186,0 ----------------+-------------------- weiblich | 73,5 4566,0 | 30,9 4566,0 | 9,4 4566,0 ----------------+-------------------- Total | 75,5 7752,0 | 31,3 7752,0 | 10,1 7752,0 ------------------------------------- German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Eigenschaften von <tabstat> Übersichtlichkeit Gewichte (aweights, fweights) Formatierung der Statistiken Präfix „by ... :“ Option by() keine absoluten Häufig- keiten für „genannt“ keine Variablenetiketten Formatanweisung gilt für alle Statistiken für Prozentwerte ist vorhe- rige Rekodierung notwendig Variablen müssen als Indi- katorvariablen vorliegen keine Ausgabe in Form von Kreuztabellen German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen b) <tabcond> (externer Ado-File) tabcond variables lform1-lform9, cond("@==1") -------------------------------------------- Variable | @==1 --------------------------------+----------- Formen: Gruppen | 5997 Formen: Projektstudien | 2557 Formen: koop. Studienprojekte | 814 Formen: freiwillige Praktika | 2910 Formen: international | 1432 Formen: Tutor/in | 1399 Formen: Studiengruppen geleitet | 603 Formen: Lernprogramme genutzt | 1387 Formen: Recheche mit PC | 5629 -------------------------------------------- German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (neuer externer Ado-File) Syntax mrditab varlist [weight] [ifexp] [inrange] [, response(integer)missing(integer)format(%fmt)] Eigenschaften Übersichtlichkeit prozentuale Häufigkeiten auf Basis der Fälle und Antworten Variablennamen u. -etiketten Formatierung der Statistiken Gewichte (aweight, iweight, fweight) Definition von bis zu zwei „missing values“ Spezifikation des für die Tabellierung zu benutzenden Wertes Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung keine Ausgabe von Kreuztabellen nur numerische Variablen German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel ohne Optionen) . qui mvdecode lform1-lform9, mv(-1) . mrditab lform1-lform4 variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------- lform1 Formen: Gruppen | 5997 77,4 48,8 | lform2 Formen: Projektstudien| 2557 33,0 20,8 | lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte | lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika | ------------------------------------------------------------------ valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel mit Formatoption) . qui mvdecode lform1-lform9, mv(-1) . mrditab lform1-lform4, format(%5.2f) variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------- lform1 Formen: Gruppen | 5997 77,36 48,84 | lform2 Formen: Projektstudien| 2557 32,99 20,83 | lform3 Formen: koop. Studienp| 814 10,50 6,63 rojekte | lform4 Formen: freiwillige Pr| 2910 37,54 23,70 aktika | ------------------------------------------------------------------ valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel mit Gewichtsanweisung) . qui mvdecode lform1-lform9, mv(-1) . mrditab lform1-lform4 [aw=gewinsg], format(%5.2f) !!!weighted analysis using aweight = gewinsg!!! variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------- lform1 Formen: Gruppen | 5828 75,46 47,46 | lform2 Formen: Projektstudien| 2415 31,27 19,67 | lform3 Formen: koop. Studienp| 777 10,06 6,33 rojekte | lform4 Formen: freiwillige Pr| 2881 37,30 23,46 aktika | ------------------------------------------------------------------ valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel mit Missing-Option) . mrditab lform1-lform4, mis(-1) variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------- lform1 Formen: Gruppen | 5997 77,4 48,8 | lform2 Formen: Projektstudien| 2557 33,0 20,8 | lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte | lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika | ------------------------------------------------------------------ valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel mit Response-Option) . qui recode lform1-lform9 (1=2)(0=1)(-1=.) . mrditab lform1-lform4, response(2) variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------- lform1 Formen: Gruppen | 5997 77,4 48,8 | lform2 Formen: Projektstudien| 2557 33,0 20,8 | lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte | lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika | ------------------------------------------------------------------ valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Tabellierung von Mehrfachantwortvariablen in Stata 2. Polytome Mehrfachantwortvariablen a) <mrdum> (externer Ado-File) mrdum lv1-lv3, stub(lv) response(1 2 3 4) labels --------------------------------------------------------------------- responses | code present percent -----------------------------------------+--------------------------- Einsatz von EDV(-Programmen), Programmie | 399 12,54 techn. Grundlagen der DV | 26 0,82 EDV allgemein | 80 2,51 Wirschaftsveranstaltungen | 358 11,25 --------------------------------------------------------------------- Cases with at least one response : 3183 (39.29 %) Completely missing : 4919 Total cases : 8102 Variables created for 4 possible responses + 1 for missing German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Eigenschaften von <mrdum> keine Übersichtstabelle unter Verwendung von Gewichten bei Verwendung von Gewich- ten oder Erstellen von Kreuz- tabellen : zweistufiges Vor- gehen erforderlich Übersichtstabelle der abso- luten und prozentualen Häufigkeiten (Kreuz-)Tabellierung der re- sultierenden Dummy-Variab- len German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen b) <mtab> (externer Ado-File) mtab lv1-lv3 Overall Between Within respset | Freq. Percent Freq. Percent Percent ----------+----------------------------------------------------- Einsatz | 399 8,27 399 12,54 51,42 techn. G | 26 0,54 26 0,82 50,00 EDV allg | 80 1,66 80 2,51 47,06 Wirschaf | 358 7,42 358 11,25 52,65 Jura-Ver | 94 1,95 94 2,95 50,00 Regional | 11 0,23 11 0,35 45,83 Veransta | 33 0,68 33 1,04 47,83 --- snip --- Kontakte | 51 1,06 51 1,60 54,26 zusätzl. | 16 0,33 16 0,50 69,57 sonstige | 53 1,10 53 1,67 49,53 ---------+----------------------------------------------------- Total | 4826 100,00 4826 151,62 55,74 (n = 3183) pct. responses pct. cases German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Eigenschaften von <mtab> keine Gewichte keine Kreuztabellen kein Präfix „by ...:“ übersichtliche Tabellierung der absoluten und prozentu- alen Häufigkeiten Prozentuierung sowohl auf Basis der Antworten als auch auf Basis der Beobachtungen German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrtab> (neuer externer Ado-File) Syntax mrtab varlist [weight] [ifexp] [inrange] [, by(varname) format(%fmt) center count column row name(varname)] Eigenschaften Übersichtlichkeit ein- und zweidimensionale Häufigkeitstabellen absol. Häufigkeiten, Spaltenprozente, Zeilenprozente (wählbar) Formatierung der Statistiken Gewichte (aweight, iweight, fweight) Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung keine Ausgabe von Randverteilungen nur numerische Variablen keine Spaltenvariablen mit negativen Werten German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrtab> (Beispiel für eindimensionale Häufigkeitstabellen) . mrtab lv1-lv3, count col ----------------------------------------------------------------- respset | count col. pct -----------------------------------------+----------------------- Einsatz von EDV(-Programmen), Programmie | 399 12,5 techn. Grundlagen der DV | 26 0,8 EDV allgemein | 80 2,5 (Fremd-)Sprachenveranstaltungen | 960 30,2 Rhetorikkurse, Persönlichkeitstraining | 386 12,1 Veranstaltungen im eigenen Fach | 1060 33,3 Veranstaltungen im anderen Fach | 299 9,4 sonstiges | 1431 45,0 ----------------------------------------------------------------- valid cases (unweighted) 3183 missing cases (unweighted) 4919 German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrtab> (Beispiel mit name-Option) . mrtab lv1-lv3, count col name(lehrveranstaltungen) ----------------------------------------------------------------- lehrveranstaltungen | count col. pct -----------------------------------------+----------------------- Einsatz von EDV(-Programmen), Programmie | 399 12,5 techn. Grundlagen der DV | 26 0,8 EDV allgemein | 80 2,5 (Fremd-)Sprachenveranstaltungen | 960 30,2 Rhetorikkurse, Persönlichkeitstraining | 386 12,1 Veranstaltungen im eigenen Fach | 1060 33,3 Veranstaltungen im anderen Fach | 299 9,4 sonstiges | 1431 45,0 ----------------------------------------------------------------- valid cases (unweighted) 3183 missing cases (unweighted) 4919 German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrtab> (Beispiel für Kreuztabellen (by-Option)) . mrtab lv1-lv3 [aw=gewinsg], count col row by(geschl) /// name(lehrveranstaltungen) !!!weighted analysis using aweight = gewinsg!!! +--------------------------------+ | cell content | |--------------------------------| | 1. frequency | | 2. row percent | | 3. column percent (of cases) | +--------------------------------+ ----------------------------------------------------------------- | Geschlecht lehrveranstaltungen | männlich weiblich -----------------------------------------+----------------------- Einsatz von EDV(-Programmen), Programmie | 206 199 | 50,9 49,1 | 12,4 13,0 --- snip --- ----------------------------------------------------------------- valid cases (unweighted) 1 = "männlich" 1294 valid cases (unweighted) 2 = "weiblich" 1889 missing cases (unweighted) 4919 German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Behandlung von identischen Werten bei polytomen Mehrfachantwortvariablen Beispielsdatensatz id abifach1 abifach2 abifach3 abifach4 1 Biologie Deutsch Englisch sonst. Sprache 2 Deutsch Mathematik sonst. Sprache sonst. Sprache Auswertung mit „mult response“ Pct of Category label Count Cases Biologie 1 50,0 Deutsch 2 100,0 Englisch 1 50,0 Mathematik 1 50,0 sonst. Sprachen 3 150,0 Auswertung mit <mrtab> ---------------------------------- Abiturfächer | count col. pct ----------------+----------------- Biologie | 1 50,0 Deutsch | 2 100,0 Englisch | 1 50,0 Mathematik | 1 50,0 sonst. Sprachen | 2 100,0 ---------------------------------- German Stata User Meeting, 12.08.2003