Lerneinheit 18: Zufallsauswahlen

Lerneinheit 18: Zufallsauswahlen Unverzerrtheit und Standardfehler von Schätzungen in Zufallsauswahlen Zufallsauswahlen werden in der quantitativen Sozialforschung gegenüber willkürlichen und bewussten Auswahlen bevorzugt, da sie statistische Repräsentativität garantieren können. Darüber hinaus kann bei Zufallsauswahlen sichergestellt werden, dass die Schätzungen aus den Stichprobendaten im Durchschnitt über alle möglichen Stichproben genau die zu schätzende Populationseigenschaft erfassen. Möglich sind zudem Aussagen darüber, wie genau eine Schätzung im Durchschnitt ist. Als Beispiel soll von folgender Situation ausgegangen werden: Ein Bildungsforscher interessiert sich dafür, wie hoch der Anteil der Schüler in den Schulen ist, die die Schule ohne Abschluss verlassen. Um das Beispiel einfach zu halten, wird davon ausgegangen, dass es insgesamt 6 Schulen gibt, wobei der Forscher jedoch aus Kostengründen nur 2 Schulen un- tersuchen kann. Jede Schule hat gleich viele Schüler. In Schule 1 verlassen 10% die Schule ohne Abschluss, in Schule 2 20% usw. bis zur Schule 6, in der 60% die Schule ohne Abschluss verlassen. In der Population der 6 Schulen verlassen daher insgesamt 35% =(10%+20%+ 30%+40%+50%+60%)/6 die Schule ohne Abschluss. In der statistischen Theorie der Zufallsauswahlen spricht man von einer einfachen Zufallsaus-wahl, wenn alle denkbaren Stichproben gleicher Fallzahl die gleiche Chance (Wahrscheinlich-keit) haben, ausgewählt zu werden. Empirie: Quantitative Methoden

Unverzerrtheit und Standardfehler von Schätzungen in Zufallsauswahlen Bei einfachen Zufallsauswahlen hat auch jedes Element der Population die gleiche Chance, in eine Stichprobe aufgenommen zu werden. Wenn im Beispiel der n=2 Schulen aus N=6 Schulen eine einfache Zufallsauswahl gezogen wird, wobei eine Schule nicht zweimal ausgewählt werden kann, dann gibt es genau 15 Stichproben, die mit jeweils gleicher Wahrscheinlichkeit von jeweils 1/15 ausgewählt werden: Nr. Schulen % ohne Abschluss Mittelwert 1 1,2 10% , 20% 15% 2 1,3 10% , 30% 20% 3 1,4 10% , 40% 25% 4 1,5 10% , 50% 30% 5 1,6 10% , 60% 35% 6 2,3 20% , 30% 25% 7 2,4 20% , 40% 30% 8 2,5 20% , 50% 35% 9 2,6 20% , 60% 40% 10 3,4 30% , 40% 35% 11 3,5 30% , 50% 40% 12 3,6 30% , 60% 45% 13 4,5 40% , 50% 45% 14 4,6 40% , 60% 50% 15 5,6 50% , 60% 55% In Stichprobe Nr. 1 werden die Schulen 1 und 2 aufgenommen. Der Durchschnittswert der Schüler ohne Abschluss beträgt in dieser Stichprobe 15% (=10%/2 +20%/2). Entsprechend berechnen sich die Werte in den anderen Stichproben. Von den 15 Stichproben ist in 3 Stichprobender Mittelwert mit dem Populationswert von 35% identisch, in 7 Stichproben weicht der Stichprobenmittelwert um maximal 5% vom Populationswert ab und in 11 Stichproben um maximal 10%. Empirie: Quantitative Methoden

Nr. Schulen % ohne Abschluss Mittelwert Stichprobenfehler quadrierter Fehler 1 1,2 10% , 20% 15% –20 400 2 1,3 10% , 30% 20% –15 225 3 1,4 10% , 40% 25% –10 100 4 1,5 10% , 50% 30% –5 25 5 1,6 10% , 60% 35% 0 0 6 2,3 20% , 30% 25% –10 100 7 2,4 20% , 40% 30% –5 25 8 2,5 20% , 50% 35% 0 0 9 2,6 20% , 60% 40% 5 25 10 3,4 30% , 40% 35% 0 0 11 3,5 30% , 50% 40% 5 25 12 3,6 30% , 60% 45% 10 100 13 4,5 40% , 50% 45% 10 100 14 4,6 40% , 60% 50% 15 225 15 5,6 50% , 60% 55% 20 400 Summe 525.0% 0 1750 Durchschnittswert 35.0% 0 116.667 Unverzerrtheit und Standardfehler von Schätzungen in Zufallsauswahlen Der Durchschnittswert über alle 15 möglichen Stichproben beträgt 35%, was genau gleich dem Populationswert ist. Infolgedessen ist der durchschnittliche Stichprobenfehler 0. Zufallsaus-wahlen, deren Durchschnittswert über alle Stichproben gleich dem Populationswert sind, wer-den als unverzerrt(engl.: unbiased) bezeichnet. Empirie: Quantitative Methoden

Nr. Schulen % ohne Abschluss Mittelwert Stichprobenfehler quadrierter Fehler 1 1,2 10% , 20% 15% –20 400 2 1,3 10% , 30% 20% –15 225 3 1,4 10% , 40% 25% –10 100 4 1,5 10% , 50% 30% –5 25 5 1,6 10% , 60% 35% 0 0 6 2,3 20% , 30% 25% –10 100 7 2,4 20% , 40% 30% –5 25 8 2,5 20% , 50% 35% 0 0 9 2,6 20% , 60% 40% 5 25 10 3,4 30% , 40% 35% 0 0 11 3,5 30% , 50% 40% 5 25 12 3,6 30% , 60% 45% 10 100 13 4,5 40% , 50% 45% 10 100 14 4,6 40% , 60% 50% 15 225 15 5,6 50% , 60% 55% 20 400 Summe 525.0% 0 1750 Durchschnittswert 35.0% 0 116.667 Unverzerrtheit und Standardfehler von Schätzungen in Zufallsauswahlen Der Durchschnittswert der quadrierten Stichprobenfehler beträgt 116.667. Bei unverzerrten Auswahlen wird die positive Quadratwurzel aus diesem Wert, 10.801 als Standardfehler (SE) bezeichnet. Je kleiner der Standardfehler ist, desto genauer ist im Durchschnitt die Schätzung einer Populationseigenschaft aus Stichprobendaten einer Zufallsstichprobe. Empirie: Quantitative Methoden

Einfache und Komplexe Zufallsauswahlen Über ein geeignetes Auswahlverfahren soll erreicht werden, dass Stichproben zu unverzerrten Schätzungen von Populationseigenschaften mit möglichst kleinen Standardfehlern führen. Bei einfachen Zufallsauswahlen ist garantiert, dass Populationsmittelwerte unverzerrt ge-schätzt werden. Außerdem gilt dann, dass die Höhe des Standardfehlers nur von der Unter-schiedlichkeit der Werte in der Population und der Anzahl der Elemente in der Population und in der Stichprobe abhängt, wobei die Anzahl der Elemente in der Population bei relativ zur Stichprobe großen Populationen praktisch irrelevant ist. Die Stichprobenfallzahl ist dagegen von Bedeutung: Je größer die Stichprobenfallzahl, desto kleiner ist der Standardfehler. In der Praxis der quantitativen Sozialforschung ist es oft nicht möglich, einfache Zufallsaus-wahlen durchzuführen. Stattdessen werden meist geschichtete(stratifizierte, engl.stratified)und/oder (mehrstufige)Klumpenstichproben(engl. cluster sampling) gezogen. In beiden Situationen ist die Grundgesamtheit in eine (in der Regel sehr große) Zahl von Teil-gruppen (Subpopulationen) zerteilt. Mehrstufige Auswahlen In einer Klumpenstichprobe wird in einem mehrstufigen Auswahlverfahren zunächst eine Anzahl von Teilgruppen, die „Klumpen“ (engl. Cluster), zufällig ausgewählt. Innerhalb dieser Teilgruppen werden dann in einer weiteren zufälligen Auswahl die eigentlich interessierenden Elemente ausgewählt. Empirie: Quantitative Methoden

Mehrstufige Auswahlen Nr. Schulen % ohne Abschluss Mittelwert 1 1,2 10% , 20% 15% 2 1,3 10% , 30% 20% 3 1,4 10% , 40% 25% 4 1,5 10% , 50% 30% 5 1,6 10% , 60% 35% 6 2,3 20% , 30% 25% 7 2,4 20% , 40% 30% 8 2,5 20% , 50% 35% 9 2,6 20% , 60% 40% 10 3,4 30% , 40% 35% 11 3,5 30% , 50% 40% 12 3,6 30% , 60% 45% 13 4,5 40% , 50% 45% 14 4,6 40% , 60% 50% 15 5,6 50% , 60% 55% Dieses Vorgehen kann sich auch über mehr als zwei Stufen erstrecken. So werden bei persönlichen Interviews oft in einem ersten Schritt Orte (sample points) ausgewählt, innerhalb derer im zweiten Schritt Haushalte ausgewählt werden, innerhalb derer dann im dritten Schritt eine „Zielperson“ ausgewählt wird. Angenommen, im Beispiel der Schulauswahl gibt es zwei Teilgruppen, wobei die Schulen 1 bis 3 die ersten und die Schulen 4 bis 6 die zwei-te Gruppe bilden. Wird eine zweistufige Klumpenstichprobe gezo-gen, wobei in der ersten Stufe eines der beiden Cluster ausgewählt wird und in der Stufe inner-halb des ausgewählten Clusters zwei Schulen, dann reduziert sich die Zahl der möglichen Stichproben auf 6. Zur Kennzeichnung sind die bei diesem Vorgehen nicht realisierbaren Stich-proben ausgestrichen. Empirie: Quantitative Methoden

Mehrstufige Auswahlen Nr. Schulen % ohne Abschluss Mittelwert Stichprobenfehler quadrierter Fehler 1 1,2 10% , 20% 15% –20 400 2 1,3 10% , 30% 20% –15 225 6 2,3 20% , 30% 25% –10 100 13 4,5 40% , 50% 45% 10 100 14 4,6 40% , 60% 50% 15 225 15 5,6 50% , 60% 55% 20 400 Summe 210.0% 0 1450 Durchschnittswert 35.0% 0 241.667 Auch bei der mehrstufigen Auswahl ist die Schätzung des Populationsmittelwerts mit einem Wert von 35% unverzerrt. Der Standardfehler der zweistufigen Klumpenstichprobe beträgt im Beispiel 15.546 = (241.667) und ist damit deutlich größer als der Standardfehler der einfa-chen Zufallsauswahl, der nur 10.801 beträgt. Der Grund für den größeren Standardfehler liegt darin, dass sich die Fälle (im Beispiel Schu-len) innerhalb eines Clusters ähnlicher sind als die Fälle zwischen unterschiedlichen Clustern. So beträgt der Mittelwert der Schüler ohne Abschluss im ersten Cluster 20%, im zweiten Cluster dagegen 50%, im ersten Cluster sind also die erfolgreicheren, im zweiten die erfolgloseren Schulen. Dadurch, dass in den realisierbaren Stichproben jeweils ähnlichere Fälle sind als bei einer ein-fachen Zufallsauswahl, geht gewissermaßen relativ zur einfachen Zufallsauswahl Information verloren, was nur durch eine größere Stichprobe ausgeglichen werden kann. Empirie: Quantitative Methoden

Nr. Schulen % ohne Abschluss Mittelwert 1 1,2 10% , 20% 15% 2 1,3 10% , 30% 20% 3 1,4 10% , 40% 25% 4 1,5 10% , 50% 30% 5 1,6 10% , 60% 35% 6 2,3 20% , 30% 25% 7 2,4 20% , 40% 30% 8 2,5 20% , 50% 35% 9 2,6 20% , 60% 40% 10 3,4 30% , 40% 35% 11 3,5 30% , 50% 40% 12 3,6 30% , 60% 45% 13 4,5 40% , 50% 45% 14 4,6 40% , 60% 50% 15 5,6 50% , 60% 55% Geschichtete Auswahlen Das Gegenteil zu mehrstufigen Klumpenauswahlen sind geschichtete Auswahlen. Kennzeichen einer geschichteten Auswahl ist, dass sich wiederum die Population aus Teilgruppen zusam-mensetzt, wobei bei einer geschichteten Auswahl in jeder Teilgruppe eine eigene Teilstichpro-be gezogen wird. Für das Beispiel der Auswahl von zwei Schulen wird wiederum angenommen, dass es zwei Teil-gruppen gibt, wobei die Schulen 1 bis 3 die er-sten und die Schulen 4 bis 6 die zweite Gruppe bilden. Für die geschichtete Stichprobe wird aus jeder der beiden Gruppen jeweils eine Schule ausge-wählt. Dann gibt es insgesamt 9 realisierbare Stichproben. Zur Kennzeichnung sind die bei diesem Vorgehen nicht realisierbaren Stich-proben wiederum ausgestrichen. Empirie: Quantitative Methoden

Geschichtete Auswahlen Nr. Schulen % ohne Abschluss Mittelwert Stichprobenfehler quadrierter Fehler 3 1,4 10% , 40% 25% –10 100 4 1,5 10% , 50% 30% –5 25 5 1,6 10% , 60% 35% 0 0 7 2,4 20% , 40% 30% –5 25 8 2,5 20% , 50% 35% 0 0 9 2,6 20% , 60% 40% 5 25 10 3,4 30% , 40% 35% 0 0 11 3,5 30% , 50% 40% 5 25 12 3,6 30% , 60% 45% 10 100 Summe 315.0% 0 300 Durchschnittswert 35.0% 0 33.333 Wiederum ist die Schätzung des Populationsmittelwerts mit einem Wert von 35% unverzerrt. Der Standardfehler der geschichteten Auswahl beträgt im Beispiel 5.774 = (33.333) und ist damit kleiner als der Standardfehler von 10.801 bei einer einfachen Zufallsauswahl. Grund für den kleineren Standardfehler ist wiederum die Ähnlichkeit der Fälle innerhalb der Gruppen. Dadurch dass sichergestellt ist, dass in der Stichprobe alle Gruppen vertreten sind, ist garantiert, dass in jeder Stichprobe Schulen mit hohen und niedrigen Erfolgsquoten enthalten sind, was zum geringeren Standardfehler führt. Wenn sich die Elemente in den Teilgruppen allerdings genau so unterscheiden wie zwischen den Teilgruppen, dann führen einfache Zufallsauswahlen, Klumpenauswahlen und geschichtete Auswahlen zu gleichen Standardfehlern. Empirie: Quantitative Methoden

Nr. Schulen % ohne Abschluss Mittelwert Klumpenausw. geschicht. Ausw. 1 1,2 10% , 20% 15% x 15% 2 1,3 10% , 30% 20% x 20% 3 1,4 10% , 40% 25% x 25% 4 1,5 10% , 50% 30% x 30% 5 1,6 10% , 60% 35% x 35% 6 2,3 20% , 30% 25% x 25% 7 2,4 20% , 40% 30% x 30% 8 2,5 20% , 50% 35% x 35% 9 2,6 20% , 60% 40% x 40% 10 3,4 30% , 40% 35% x 35% 11 3,5 30% , 50% 40% x 40% 12 3,6 30% , 60% 45% x 45% 13 4,5 40% , 50% 45% x 45% 14 4,6 40% , 60% 50% x 50% 15 5,6 50% , 60% 55% x 55% Summe 525% 205% 320% Durchschnittswert 35% 29.286% 40% Zufallsauswahlen bei ungleichen Gruppengrößen In der Praxis weisen die Teilgruppen, die als Schichten bzw. Klumpen dienen, oft unterschied-lich große Fallzahlen aus. Um die Konsequenz unterschiedlich großer Klumpen oder Schichten zu verdeut- lichen, wird das Schulbeispiel so abgeändert, dass die erste Gruppe aus den Schulen 1 bis 4 und die zweite aus den Schulen 5 und 6 besteht. Empirie: Quantitative Methoden

Zufallsauswahlen bei ungleichen Gruppengrößen Das Beispiel zeigt, dass bei ungleichen Gruppengrößen sowohl Klumpenstichprobe wie auch geschichtete Auswahlen zu verzerrten Schätzungen des Populationsmittelwerts führen. Dies tritt dann auf, wenn die Auswahlwahrscheinlichkeit ungleich großer Gruppen gleich groß sind. Da im Beispiel die erste Gruppe doppelt so groß ist wie die zweite Gruppe, steht auch ein aus-gewählter Fall in der ersten Gruppe für doppelt so viele Fälle in der Population wie in der zweiten Gruppe. Um dies auszugleichen, sollte die Wahrscheinlichkeit, die erste Gruppe statt der zweiten auszuwählen, doppelt so hoch ein wie die Wahrscheinlichkeit, die zweite statt der ersten Gruppe auszuwählen. Die Auswahlwahrscheinlichkeit einer Gruppe ist dann proportional zur Gruppengröße. Erst dadurch wird sichergestellt, dass bei mehrstufigen Auswahlverfahren selbstgewichtende Stichproben resultieren, bei dem jeder Fall der Stichprobe für die gleiche Zahl von Fällen in der Population steht, bzw. jeder Fall der Population die gleiche Wahrscheinlichkeit hat, in die Stichprobe zu gelangen. Um eine selbstgewichtende Stichprobe im Schulbeispiel zu realisieren, haben die 6 Stichproben der ersten Gruppe also eine doppelt so hohe Auswahlwahrscheinlichkeit wie die einzig mögliche Stichprobe der zweiten Gruppe. Die Auswahlwahrscheinlichkeit einer Stichprobe aus der ersten Gruppe beträgt daher 2/31/6 = 2/18, die aus der zweiten Gruppe 1/31/1 = 1/3 = 6/18. Für die Berechnung des Durchschnittswertes müssen dann die Stichprobenmittelwer- te und quadrierten Fehler mit den Auswahlwahrscheinlichkeiten multipliziert werden. Empirie: Quantitative Methoden

Zufallsauswahlen bei ungleichen Gruppengrößen Nr. Schulen % ohne Abschluss Mittelwert Wahrsch. Mittelw.Wahrsch. quad. FehlerWahrsch. 1 1,2 10% , 20% 15% 2/18 30/18 4002/18 2 1,3 10% , 30% 20% 2/18 40/18 2252/18 3 1,4 10% , 40% 25% 2/18 50/18 1002/18 6 2,3 20% , 30% 25% 2/18 50/18 1002/18 7 2,4 20% , 40% 30% 2/18 60/18 252/18 10 3,4 30% , 40% 35% 2/18 70/18 02/18 15 5,6 50% , 60% 55% 6/18 330/18 4006/18 Durchschnittswert 18/18 630/18 = 35% 4100/18 = 227.778 Dadurch, dass die Ziehungswahrscheinlichkeiten proportional zur Größe der beiden Gruppen sind (und innerhalb der Cluster die Auswahlwahrscheinlichkeit gleich dem Kehrwert der mög-lichen Stichproben ist), sind die Schätzungen des Populationsmittelwerts unverzerrt. Der Standardfehler der zweistufigen Klumpenstichprobe ist 15.092 = (227.778) und damit etwas kleiner als bei zwei gleich großen Gruppen, aber immer noch deutlich größer als bei der einfachen Zufallsauswahl mit einem Wert von 10.801. Bei geschichteten Auswahlen wird die ungleiche Größen der Schichten dadurch berücksichtigt, dass bei der Berechnung der Mittelwerts in der Stichprobe die relative Schichtgröße einfließt. Um im Beispiel zu berücksichtigen, dass die zweite Schicht (Gruppe) halb so groß ist wie die erste Schicht, ist bei der Berechnung des Mittelwerts in den Stichproben der Wert der ersten Gruppe mit 2 zu multiplizieren und die Summe dann durch 3 (=2+1) zu teilen. Empirie: Quantitative Methoden

Zufallsauswahlen bei ungleichen Gruppengrößen Nr. Schulen % ohne Abschluss Mittelwert . quadrierter Fehler 4 1,5 10% , 50% 102/3+501/3 = 70/3 1225/9 5 1,6 10% , 60% 102/3+601/3 = 80/3 625/9 8 2,5 20% , 50% 202/3+501/3 = 90/3 225/9 9 2,6 20% , 60% 202/3+601/3 = 100/3 25/9 11 3,5 30% , 50% 302/3+501/3 = 110/3 25/9 12 3,6 30% , 60% 302/3+601/3 = 120/3 225/9 13 4,5 40% , 50% 402/3+501/3 = 130/3 625/9 14 4,6 40% , 60% 402/3+601/3 = 140/3 1225/9 Summe 840/3 = 280 4200/9 = 466.667 Durchschnittswert 35% 58.333 Durch die Berücksichtigung der ungleichen Schichtgrößen (Gruppengrößen) sind die Schät-zungen des Populationsmittelwerts wiederum unverzerrt. Der Standardfehler beträgt nun 7.638 = (58.333). Er ist größer als der Standardfehler bei gleich großen Gruppen aber kleiner als der Standardfehler bei einer einfachen Zufallsauswahl. Empirie: Quantitative Methoden

Realisierung von Zufallsauswahlen in der quantitativen Sozialforschung In der Praxis der quantitativen Sozialforschung werden meist mehrstufige geschichtete Aus-wahlen gezogen, wobei innerhalb von Schichten zwei- oder dreistufige Klumpenauswahlen gezogen werden. Dabei ist zu unterscheiden, ob es eine Liste oder Kartei aller Elemente der interessierenden Po-pulation gibt, oder ob das nicht der Fall ist. • Im ersten Fall ist eine Karteiauswahl möglich: jedem Element der Population ist eine Kartei- karte oder ein Datensatz in einer Datei zugeordnet. Ein Beispiel sind zufällige Auswahlen von Adressen aus dem Einwohnermeldeamt oder von Telefonnummern aus Telefonverzeichnissen, aus denen zufällig Elemente ausgewählt werden. • Wenn es keine Datei mit allen Elementen gibt, erfolgt in der Regel eine Gebietsauswahl: Auswahleinheiten sind geographisch definiert (Flächen), wobei die Gebiete oft so festgelegt werden dass die Zahl der Elemente pro Gebiet gleich groß ist. Gebietsauswahlen sind stets Klumpenauswahlen. Auf der ersten Stufe werden zufällig die Gebiete (sog. sample-points) ausgewählt. Innerhalb eines Sample-Points erfolgt dann oft ein sogenannter Random-Walk, d.h. ausgehend von einem festen Startpunkt wird nach Zufalls- regeln ein Weg durch das Gebiet ausgewählt und die Stichprobenelemente auf diesem Weg aufgesucht. Bei einer Befragung ergibt für den Interviewer etwa folgende Vorschrift „Gehe zunächst nach links bis zur nächsten Kreuzung. Dann rechts, dann wieder links ... . Jeder 6. Haushalt ist zu notieren.“ Empirie: Quantitative Methoden

Realisierung von Zufallsauswahlen in der quantitativen Sozialforschung Bei allgemeinen Bevölkerungsumfragen über persönliche Interviews werden in der Praxis beide Strategien angewendet: • Karteiauswahlen erfolgen über Adressen aus Einwohnermeldeämtern. Da es in der BRD kein zentrales (öffentliches) Adressregister gibt, werden dabei zweistufige Klumpenauswahlen realisiert. Im ersten Schritt werden zufällig (mit Ziehungswahrscheinlichkeiten proportional zur Zahl der jeweiligen Einwohner) und innerhalb von Schichten Orte ausgewählt und in diesen Orten dann im zweiten Schritt aus den Einwohnermeldeamtsregistern Adressen gezogen. Letzteres erfolgt oft über eine systematische Zufallsauswahl. Von den ersten n Elementen einer Datei wird eines zufällig ausgewählt und von diesem Element ausgehend dann jedes n- te Element in die Stichprobe aufgenommen. Formal handelt es sich hier um eine Clusteraus- wahl, bei der alle Elemente eines einzigen von insgesamt n Clustern ausgewählt werden. Sinnvoll ist dies nur, wenn die Adressdatei nicht systematisch sortiert ist, da anderenfalls die Chance steigt, dass die Eigenschaften in der realisierten Stichprobe deutlich von den interessierenden Populationseigenschaften abweichen. • Gebietsauswahlen professioneller Befragungsinstitute nutzen das sogenannte ADM-Design (ADM steht für „Arbeitskreis deutscher Marktforschungsinstitute“). In einer dreistufigen Klumpenauswahl werden auf der ersten Stufe Sample-Points aus synthetischen (künstlichen) Wahlkreisen gezogen, wobei sich diese Wahlkreise von den realen Wahlkreisen dadurch unterscheiden, dass sie hinsichtlich der Bevölkerungsgröße und -zusammensetzung stärker standardisiert sind. Empirie: Quantitative Methoden

Realisierung von Zufallsauswahlen in der quantitativen Sozialforschung Die Gesamtheit der synthetischen Wahlkreise ist in sog. Netze aufgeteilt, wobei jedes Netz eine geografisch stratifizierte Zufallsauswahl aus der Gesamtheit ist. Die Mitglieder des ADM haben jeweils eine Reihe dieser Netze erworben. Ausgehend von einer Startadresse im Wahlkreis erfolgt die zweite Stufe der Auswahl von Haushalten über einem Random-Walk. Dabei werden drei unterschiedliche Methoden ange- boten: • Random-Walk mit Adressvorlauf: In einem Random-Walk werden zunächst nur die Adressen aufgeschrieben. Erst in nach- folgenden Kontaktversuchen (möglichst durch andere Personen) werden die Adressen für die Interviews kontaktiert. • Random-Walk ohne Adressvorlauf mit Brutto-Vorgabe: Bereits bei der Adressermittlung im Random-Walk wird erstmals versucht, die ausgewähl- ten Adressen zu kontaktieren. Pro Sample-Point wird eine vorgegebene Anzahl von Adres- sen (z.B. 10 oder 20) ermittelt. Wenn eine ermittelte Adresse bzw. Zielperson nicht kontaktiert werden kann, erfolgen später weitere Kontaktversuche. • Random-Walk ohne Adressvorlauf mit Netto-Vorgabe: Im Unterschied zum Random-Walk mit Brutto-Vorgabe ist nicht die Zahl der zu kontaktie- renden Adressen pro Sample-Point begrenzt. Stattdessen ist festgelegt, wie viele Inter- views in einem Sample-Point realisiert werden sollen (z.B. 10). Empirie: Quantitative Methoden

Realisierung von Zufallsauswahlen in der quantitativen Sozialforschung Innerhalb eines Haushalts erfolgt auf der dritten Stufe die Auswahl eines Haushaltsmit- glieds, die sogenannte Zielperson, wiederum zufällig. Dazu wird oft der sogenannte Schwe- denschlüssel genutzt, das ist eine Zufallsliste, über die aus der zunächst erfragten An- zahl aller in Frage kommenden Haushaltsmitglieder eine Person ausgewählt wird. Alternativ wird über die „last birthday“- bzw. „next birthday“-Methode die Person ausge- wählt, die als letztes bzw. nächstes Geburtstag hat. Obwohl die zweistufige Karteiauswahl stärker geklumpt ist, als die Auswahl über das ADM-Design, hat sich die Stichprobenqualität bei Karteiauswahlen empirisch als besser erwiesen. Ursache hierfür ist vermutlich, dass bei der Auswahl der Zielpersonen Interviewer bzw. Adressermittler keinen Spielraum haben. Beim Random-Walk können dagegen bei der Adress-ermittlung eher Adressen notiert werden, die evtl. mehr Erfolg versprechen. Dies gilt vor allem, wenn kein unabhängiger Adressvorlauf erfolgt. Wenn zudem nur die Zahl der Nettoadressen festgelegt ist, hat es ein Interviewer leichter, wenn er bereit im ersten Versuch möglichst viele Haushalte kontaktiert. Auch bei der Auswahl der Zielperson kann der Interviewer eher als bei der Karteiauswahl versuchen, zugunsten leichter zu realisierender Interviews von den vorge-gebenen Auswahlregeln abzuweichen. Auf der anderen Seite ist bereits die Adressermittlung bei der Karteiauswahl in Deutschland sehr kostspielig. Deutlich preiswerter sind Random-Walks im ADM-Design, insbesondere, wenn kein getrennter Adressvorlauf erfolgt. Empirie: Quantitative Methoden

Realisierung von Zufallsauswahlen in der quantitativen Sozialforschung Beim ADM-Design gibt es institutsspezifische Abweichungen. So fassen einige Erhebungsin-stitute ihre Netze zusammen und generieren daraus neue Teilnetze. Nicht unüblich ist es zu-dem, ganze Sample-Points auszutauschen, wenn sich im Feld zeigt, dass die Zahl der Inter-views in einem ursprünglich ausgewählten Sample-Point zu gering ist. Das Allensbacher Institut für Demoskopie verzichtet nach eigenen Angaben innerhalb der Sample-Points auf Zufallsauswahlen und realisiert stattdessen Quotenauswahlen. Die Zufällig-keit der Auswahl soll dadurch sichergestellt sein, dass die Interviewerzusammensetzung der der Bevölkerung entspricht. Bei allgemeinen Bevölkerungsumfragen über Telefoninterviews werden zweistufige Aus-wahlen eingesetzt. Auf der ersten Stufe erfolgt die Auswahl einer Telefonnummer • zufällig aus einem Verzeichnis von Telefonnummern • oder durch zufällige Generierung von Zahlen, die als Telefonnummern dienen. • Beim Random-Digit-Verfahren: erzeugt ein Zufallszahlengenerator die vollständige Num- mer. • Beim Random-Last-Digits-Verfahren (RLD) werden aus einer Telefonnummerndatei zu- fällig Nummern gezogen. Dann werden die letzten Ziffern durch mit einen Zufallszahlen- generator erzeugte Ziffern ersetzt. Empirie: Quantitative Methoden

Realisierung von Zufallsauswahlen in der quantitativen Sozialforschung • Bei der zufälligen Auswahl aus dem Universum gültiger Blöcke (in der BRD nach den Propagisten dieses Verfahrens auch als Gabler-Häder-Verfahren bezeichnet) werden zu- nächst alle Telefonnummern aus Verzeichnissen in eine Datei geschrieben. Anschließend werden die letzten Ziffern entfernt und Dubletten (d.h. Nummern mit gleichen ersten Zif- fern) entfernt. Die so gebildeten Blöcke werden zu einem vollständigen Universum mögli- cher Telefonnummern ergänzt, aus denen zufällig Nummern angewählt werden. Die letzten beiden Methoden werden verwendet, weil die Telefonbücher wegen fehlender Einträge nicht alle Nummern enthalten und das rein zufällige Generieren von vollständigen Telefonnummern zu viele nicht existente Nummern erzeugt. Auf der zweiten Auswahlstufe wird dann eine Zielperson in der Regel nach der „last birthday“- oder der „next birthday“-Methode ermittelt. Bevölkerungsumfragen beziehen sich i.a. auf die in Privathaushalten lebende Wohnbevölke-rung ab einem vorgegebenen Alter. Personen, die hierunter nicht fallen, z.B. Obdachlose oder die Anstaltsbevölkerung in Heimen, Gefängnissen oder Kasernen werden so von vornherein ausgeschlossen. Allgemeine Bevölkerungsumfragen werden in der BRD zudem i.a. nur auf Deutsch geführt. Dies führt dazu, dass auch Personen ohne hinreichende Deutschkenntnisse ausgeschlossen wer-den. Empirie: Quantitative Methoden

Realisierung von Zufallsauswahlen in der quantitativen Sozialforschung Schwierig ist oft die Auswahl einer Spezialpopulation, etwa die Auswahl von Vätern, die von ihren Kindern getrennt leben. Eine Möglichkeit besteht darin, Kontaktinterviews mit der Wohnbevölkerung zu führen und nur bei Vorliegen des interessierenden Merkmals (im Bei-spiel Väter, die von ihren Kindern getrennt leben) ein vollständiges Interview zu führen. Eine andere Möglichkeit besteht darin, zunächst in anderen Umfragen Adressen bzw. Telefonnum-mern von Zielpersonen zu sammeln und diese in einem zweiten Schritt erneut zu kontaktieren. Markt- und Meinungsforschungsinstitute bieten seit einiger Zeit Befragungen in einem soge-nannten Access-Panel an. Die Institute haben dazu Adressdateien mit einer sehr großen Anzahl von Personen zusammengestellt, die sich bereit erklärt haben, an Umfragen teilzunehmen. Es wird behauptet, dass (einfache) Zufallsauswahlen aus diesen Dateien zu Stichproben führen, die die gleiche Qualität haben wie Zufallsauswahlen aus der Wohnbevölkerung. Stichproben der Sozialforschung beziehen sich nicht nur auf Personen. So können auch Stich-proben aus Organisationen und Einrichtungen, etwa Schulen, Krankenhäuser oder Unterneh-men gezogen werden. Schwierig werden Auswahlen immer dann, wenn keine Karteiauswahlen möglich sind. Empirie: Quantitative Methoden

Literaturhinweise: • Schnell u.a., 6. • Diekmann, B. IX. Empirie: Quantitative Methoden

Lerneinheit 18: Zufallsauswahlen

Lerneinheit 18: Zufallsauswahlen

Presentation Transcript

Kompass für wissenschaftliches Arbeiten

Lerneinheit 19: Ausfälle und Gewichtungen

Katzen

Leonardo Silver Living Multiplikatorenschulung Modul 1

Leonardo Silver Living – Multiplikatorenschulung Modul 4 „Wohnungsanpassung“ Lerneinheit 1: