340 likes | 446 Views
Verarbeitung geographischer Daten SS 2002. Diskriminanzanalyse. Referentinnen: Florentina Dobre, Iulia Pascu, Nikola Sander.
E N D
Verarbeitung geographischer DatenSS 2002 Diskriminanzanalyse Referentinnen: Florentina Dobre, Iulia Pascu, Nikola Sander
1.Einleitung2. Das Verfahren2.1 Definition der Gruppen und Variablen 2.2 Formulierung der Diskriminanzfunktion 2.3 Schätzung der Diskriminanzfunktion 2.4 Prüfung der Diskriminanzfunktion 2.5 Prüfung der Merkmalsvariablen 2.6 Klassifizierung von neuen Elementen 3. Mehr Gruppen – mehr Variablen Fall4. Die Anwendung des SPSS-Programms
„Die Diskriminanzanalyse ist eine Methode zur Überprüfung von Gruppen- und Klassenunterschieden.“(Bahrenberg 1992, 316) 1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Merkmale: • Erklärung von abhängigen durch • unabhängige Variablen • Zusammenhänge zwischen Variablen • konfirmatorisches Verfahren
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Fragestellungen: • Ist die Gruppierung die bestmögliche? • Zu welcher Gruppe gehört ein bisher • nicht klassifiziertes Element? • Gibt es signifikante Gruppen- • unterschiede hinsichtlich der • Variablen?
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Diskriminanzanalyse in der Geographie: • Trennung von Raumeinheiten • Zuordnung nicht klassifizierter • Raumeinheiten • Überprüfung einer erstellten • Raumgliederung • Analyse der Unterschiede zwischen • Raumtypen
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Voraussetzungen: • metrisch skalierte Variablen • Normalverteilung der Daten • kein Element darf mehreren Gruppen • angehören • STP-Umfang mind. Doppelt so groß • wie Anzahl der Variablen • Gruppenanzahl kleiner als • Variablenanzahl
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • zwei Gruppen – zwei Variablen Fall • Anwendungsproblem • vorgeschaltete Analyse • Festlegung der Gruppenanzahl • Beispiel: • 23 Klimastationen in 2 Gruppen • laut Clusteranalyse
Tunesien- Beispiel Klimastation Gruppe A Gruppe B http://dev.lib.utexas. edu/maps/africa/ tunisia_pol_1990.jpg (Stand: 09.06.2002)
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Projektion der Gruppenelemente auf • die beiden Merkmalsachsen • -> Überschneidungsbereiche Abb.1 Trennung durch die Ausgangsvariablen x1 und x2 Quelle: Bahrenberg 1992, 319.
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Funktion (Achse) zur optimalen • Trennung der Gruppen zu bestimmen -> Diskriminanzachse Abb.2 Trennung durch verschiedene Diskriminanzachsen Quelle: Bahrenberg 1992, 321
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Diskriminanzfunktion Y Linearkombination der beiden Merkmalsvariablen X1 und X2 Y = v1x1 + v2x2 Y = Diskriminanzvariable (Funktion) x1, x2 = Merkmalsvariablen v1, v2 = Diskriminanzkoeffizienten für die Merkmalsvariablen
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Annahme: Die Diskriminanzachse verläuft durch den Ursprung allein die Steigung bestimmt die Qualität der Trennung durch folgendes Verhältnis: v2 x2 = ― x1 v1 • v1 und v2 sind aufgrund der Daten der Merkmalsausprägungen zu schätzen
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Diskriminanzkriterium • Messung der Unterschiedlichkeit der Gruppen • Berücksichtigt auch die Streuung innerhalb der Gruppen • Verhältnis von erklärter und nicht erklärter Streuung
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Komponenten des Diskriminanzkriteriums: • Maximierung der Streuung zwischen • den Gruppen (erklärte Streuung): _ _ d² = (yA – yB)² _ _ - yA und yB - Gruppenmittelpunkte 2. Minimierung der Streuung innerhalb der Gruppen (nicht erklärte Streuung): _ _ nA nB s² = Σ (yAj – yA)² + Σ (yBj – yB)² j=1 j=1
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Maximierung des Diskriminanzkriteriums • Bedingung für möglichst kleine Überschneidungebereiche d² γ = — max s²
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Durch partielle Differentiation von γ nach v1 und v2 erhält man folgende Bestimmungsgleichungen: v1*s11+v2*s12=d1 v1*s12+v2*s22=d2 d1, d2 – Mittelwertabweichungen s11, s22 – Varianz der beiden Variablen s12 - Kovarianz Benötigt zur Berechnung der Diskriminanzfunktion Beispiel: y = 0,414*x1-0,037*x2
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Messung der Unterschiedlichkeit der Gruppen • Analyse der Trennkraft der Funktion Zwei Möglichkeiten der Prüfung: • Vergleich mit dem Kritischen Diskriminanzwert • Betrachtung des Diskriminanzkriteriums
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Vergleich mit kritischem Diskriminanzwert • Berechnung eines Wertes auf der • Diskriminanzachse für jedes Element j • yj = v1x1j + v2x2j • Berechnung deskritischen • Diskriminanzwertes: • arithmetisches Mittel (gleichgroße Cluster) • gewichtetes arithmetisches Mittel (unterschiedlich große Cluster)
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS _ _ • Vergleich mit kritischem Diskriminanzwert nAyA+nByB yT = nA+nB 17 * 14,34 + 6 * 13,29 = = 14,06 17 + 6 Einteilung der Diskriminanzwerte in Gruppen wenn: yj > yT: Zuordnung zu Gruppe A yj < vT: Zuordnung zu Gruppe B yj = yT: Keine Zuordnung möglich Vergleich im Beispiel: fehlerhafte Zuordnung der Klimastationen Kairouan und El Djem
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Vergleich mit kritischem Diskriminanzwert Quantitative Aussage über die Trennkraft der Diskriminanzfunktion anhand der Klassifikationsmatrix Trefferquote: Aussage über tatsächliche Trennkraft der Diskriminanzfunktion
Tunesien- Beispiel Klimastation Gruppe A Gruppe B http://dev.lib.utexas. edu/maps/africa/ tunisia_pol_1990.jpg (Stand: 09.06.2002)
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums • Eigenwertγ(Maximalwert des • Diskriminanzkriteriums): • Maß für die Trennkraft / Güte der Diskriminanzfunktion • Nachteil: nicht auf Werte zwischen Null und Eins normiert zwei Alternativen
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums ●Kanonischer Korreltationskoeffizient γ cK = 1 + γ • Im zwei Gruppen – zwei Variablen Fall ist CK = B Je größer der kanonische Korrelationskoeffizient, desto höher ist die Trennkraft der Diskriminanzfunktion Beispiel: CK = 0,7158
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums 1 • Wilks`Lambda Lk = 1 + γ • Inverses Gütemaß: je kleiner die Werte desto höher die Trennkraft • Beispiel: Lk = 0,4875 • Ermöglicht eine statistische Signifikanzprüfung der Diskriminanzfunktion durchzuführen
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Überprüfung des Einflusses der • Variablen auf die Zuordnung der • Elemente • Wichtig: • Erklärung der • Gruppenunterschiedlichkeit • Entfernung nicht aussage- • kräftiger Variablen • Betrachtung der Diskrimianz- • koeffizienten v • Skalierungsabhängig • Standardisierung
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS C1 = sX1* v1 = 1,1427 * 0,414 = 0,473 C2 = sx2* v2 = 1,760 * -0,037 = -0,065 • je größer das Ergebnis, desto stärker • der Einfluss • das Vorzeichen der Werte ist unwichtig
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Klassifizierung neuer Elemente mit • Hilfe der Diskriminanzfunktion • Einsetzen der Merkmalsvariablen des • neuen Elements in die Diskriminanzfunktion • Vergleich des Wertes mit kritischem • Diskriminanzwert • Einteilung in eine Gruppe • Je nachdem, ob neuer Wert größer oder kleiner als kritischer Diskriminanzwert ist
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Mehr Gruppen – mehr Variablen Fall • Praxisbezogen • Ermittlung mehrerer Diskriminanz- • funktionen (Achsen) • mehrere Methoden der Klassifizierung • neuer Elemente • 1. Distanzkonzept • (min. Abstand zwischen Elementen und • Gruppencentroid) • 2. Wahrscheinlichkeitskonzept • (höchste Wahrscheinlichkeit der • Gruppenzugehörigkeit)
1. Einleitung 2. Verfahren 2.1. Gruppen- definition 2.2 Funktions- formulierung 2.3 Funktions- schätzung 2.4 Funktions- prüfung 2.5 Variablen- prüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS SPSS • Geeignet für den Mehr Gruppen – • Mehr Variablen Fall • Notwendigkeit, eine Spalte für die • Gruppen (als abhängige Variable) zu • erstellen
im Menu „Statistiken“ • „Klassifizieren“ • „Diskriminanzanalyse“
abhängige und unabhängige Variablen wählen • Bereich definieren • zwischen „unabhängige Variable zusammen aufnehmen“ und • „schrittweise Methode verwenden“ wählen • „Auswählen“: Analyse auf bestimmte Fälle beschränken
„Statistik“ • Deskriptivstatistiken • zusätzliche Funkionskoeffizienten • Kovrianz- und Korrelationsmatrizen innerhalb • der Gruppen und der Gesamtstichprobe • Minimalprogramm • folgende Optionen aktivieren
Bei „Speichern“ lassen sich folgende Ergebnisse als • neue Variablen speichern: