1 / 24

Statistik: 14.10.04

Statistik: 14.10.04. Erheben von Daten Kategoriale Merkmale. Datenquellen. Primäre Daten, aus Vollerhebung Stichprobenerhebung Sekundäre Daten Volkszählungsdaten Daten von Statistik Austria, von der OeNB Daten aus der Hörerevidenz der WU Personal-, Lagerkartei. Messen.

Download Presentation

Statistik: 14.10.04

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistik: 14.10.04 Erheben von Daten Kategoriale Merkmale

  2. Datenquellen • Primäre Daten, aus • Vollerhebung • Stichprobenerhebung • Sekundäre Daten • Volkszählungsdaten • Daten von Statistik Austria, von der OeNB • Daten aus der Hörerevidenz der WU • Personal-, Lagerkartei PI Statistik, WS 2004/05

  3. Messen • Messen: Ist Ergebnis eines Messprozesses mit • Messinstrumenten • Messverfahren • messenden Personen • Beispiele: gemessen werden (1) die Länge eines Tisches, (2) die Länge eines Eies, (3) die Härte von Stahl, (4) die Zufriedenheit des Käufers eines PKW PI Statistik, WS 2004/05

  4. Qualität von Messungen Kriterien für die Qualität von Messungen • Genauigkeit (accuracy): bezieht sich auf einzelnen Messvorgang • systematischer Fehler (Bias) • Präzision, Variabilität • Reproduzierbarkeit: bezieht sich auf Messsystem • Stabilität: zeitlicher Aspekt des Messsystems PI Statistik, WS 2004/05

  5. Prozesse: Messen - Variabilität Beobachten (Messen) ist zentrales Element für Qualität von Produktions- und Dienstleistungsprozessen • Prozessvariabilität • Messvariabilität • Beispiele: • Qualität des Kaffees • Wartezeit im Call-Center PI Statistik, WS 2004/05

  6. Datenerhebungen (surveys) • Vollerhebung (census) und Stichprobe • Grundgesamtheit (Umfang N; N meist sehr groß) • Statistische Einheiten, Elemente • Stichprobenrahmen (Liste aller Elemente der Grundgesamtheit) • Stichprobe (Umfang n; n meist klein) PI Statistik, WS 2004/05

  7. Auswahl der Stichprobe • Auswahl ohne Zufallsmechanismus (non-probability sample survey) • Bequemlichkeits-Stichprobe (convenience sampling) • Systematische Stichprobe • Auswahl nach Zufallsprinzip (probability sample survey) • Einfache Zufallsstichprobe (simple random sample) • Geschichtete Zufallsstichprobe (stratified random sample) • Systematische Zufallsstichprobe • Klumpen- (Cluster)stichprobe PI Statistik, WS 2004/05

  8. Einfache Zufallsstichprobe • jede mögliche Stichprobe vom Umfang n hat die gleiche Wahrscheinlichkeit, gezogen zu werden PI Statistik, WS 2004/05

  9. Beispiel: Einfache Zufalls-SP G = {a,b,c,d,e}, n=2: es gibt 10 mögliche Stichproben: (a,b), (a,c), ..., (a,e), ..., (d,e) • Urne enthält 10 Zettel mit den 10 Paaren; wir wählen zufällig einen aus • Urne enthält 5 Zettel mit den 5 Buchstaben; wir wählen zufällig zwei (ohne Zurücklegen) aus • Zufallszahlen PI Statistik, WS 2004/05

  10. Zufallszahlen • In Büchern; z.B. in Hackl & Katzenbeisser, S. 434 • Statistik-Software kann Pseudozufallszahlen erzeugen, z.B. EXCEL: Analyse-Funktionen >> Zufallszahlengenerierung >> Diskrete Verteilung PI Statistik, WS 2004/05

  11. Einfache ZSP: Vor-/Nachteile • Vorteile • Ergebnisse haben keinen systematischen Fehler (Bias); sie sind "unverzerrt" • kontrollierter Stichprobenfehler • Nachteil • in Praxis nicht leicht realisierbar, oft aufwendig PI Statistik, WS 2004/05

  12. Geschichtete Zufallsstichprobe • Zerlegung der Grundgesamtheit in Schichten • Innerhalb jeder Schicht: einfache Zufallsstichprobe • Vorteil: reduzierter Stichprobenfehler PI Statistik, WS 2004/05

  13. Beispiel: Einkommen PI Statistik, WS 2004/05

  14. Klumpenstichprobe • Vollerhebung in zufällig ausgewählten Teilmengen (Klumpen; Teilmengen, die die Grundgesamtheit gut repräsentieren) Geschichtete und Klumpenstichprobe: sind Beispiele für zweistufige Stichprobenverfahren PI Statistik, WS 2004/05

  15. Erhebungsfehler • Reiner Stichprobenfehler (pure sampling error) • Variation des Ergebnisses dadurch, dass bestimmte Elemente ausgewählt werden; quantifizierbar • Stichprobenverfälschungen, z.B. Fehler im Stichprobenrahmen • Nicht-Stichprobenfehler (non-sampling error): Fehlende Antwort (non-response), Fehler der beteiligten Personen (Interviewer, Interviewter), Fehler bei Verarbeitung; schlechte Fehlerkontrolle, etc.; kaum messbar PI Statistik, WS 2004/05

  16. Kategoriale Merkmale • Auch qualitative und kategorielle Merkmale genannt • Ordnet der Beobachtungs- oder Untersuchungseinheit eine von endlich vielen Klassen (Kategorien) zu; • Dazu gehören nominale und ordinale Merkmale • Ist immer diskret (die Menge der Merkmalsausprägungen ist endlich oder abzählbar) PI Statistik, WS 2004/05

  17. Kreisdiagramm Beispiel: Augenfarbe von Studierenden PI Statistik, WS 2004/05

  18. Kreisdiagramm Explodierter 3D-Kreis PI Statistik, WS 2004/05

  19. Säulen-, Stabdiagramm PI Statistik, WS 2004/05

  20. Absolute & relative Häufigkeit • (absolute) Häufigkeit: gibt an, wie oft eine bestimmte Kategorie in der Datenmenge vorkommt; typisches Symbol: Hi • z.B.: 15 Studierenden haben blaue Augen • relative Häufigkeit (Anteil) h i • n: Umfang der Datenmenge • Oft als Prozente (Prozentanteil) angegeben PI Statistik, WS 2004/05

  21. Kumulierte (relative) Häufigkeiten • Summe der relativen Häufigkeiten aller vorhergehenden Kategorien, einschließlich der aktuellen • Nur für ordinale Merkmale sinnvoll PI Statistik, WS 2004/05

  22. Noten von 52 Studierenden PI Statistik, WS 2004/05

  23. Pivot Table-Bericht • „Ein PivotTable-Bericht ist eine interaktive Tabelle, die große Datenmengen rasch kombinieren und vergleichen kann.“ • Wichtige Hilfe zum Auszählen von Datenmengen PI Statistik, WS 2004/05

  24. Fragestellungen • Kommen alle Kategorien gleich häufig vor ? • Entsprechen die Häufigkeiten in den Kategorien einer bestimmten Vorgabe ? • Entspricht die Häufigkeit (Prozentsatz, Anteil) in einer bestimmten Kategorie einem bestimmten Wert? • In welchem Bereich kann man den Anteil einer Kategorie in der Grundgesamtheit erwarten ? PI Statistik, WS 2004/05

More Related