190 likes | 343 Views
Geostatistik. 3 Analyse. Problemstellung. Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften. Situation:
E N D
Geostatistik 3 Analyse Christian Siemes – Analyseverfahren
Problemstellung Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften Situation: Fläche ist nach mehreren Verfahren erstellt. Es liegen gegebenenfalls die entsprechenden Varianzen der einzelnen Punkte vor. Fragen: • Wie weit darf man den Punkten mit ihren Varianzen vertrauen? (Kontrollmessungen?) • Wie vergleicht man die verschiedenen Flächen? Christian Siemes – Analyseverfahren
Kontrollmessungen Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften Problem bei der 1. Frage: Nachmessen nicht möglich (z.B. Wetterdaten) Nachmessen zu teuer Nachmessen teurer als alternative Maßnahme (siehe Beispiel) Beispiel: Strand mit Schadstoffbelastung • An einigen Stellen Grenzwerte fast erreicht • Zusätzliche Bohrungen? • Großflächigerer Austausch das Sandes? Christian Siemes – Analyseverfahren
Taktiken zur Kontrolle in ArcGIS Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften Zwei Werkzeuge in ArcGIS: Validation Cross-Validation Wo in ArcGIS? • Im Geostatistical Wizard integriert (Wird im letzten Schritt angezeigt) • Benutzen das zu prüfende Verfahren selbst Christian Siemes – Analyseverfahren
Validation Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften Aufspaltung des gesamten Datensatzes in Trainings- und Testdaten (Create Subset) Erstellung der Fläche mit den Trainingsdaten Vergleich der Fläche mit den Testdaten Nicht alle Daten beim Erstellen verwendet! • Keine direkte Kontrolle der endgültigen Fläche (d.h. mit allen Punkten erstellten Fläche) • Kontrolliert nur die Einstellungen im Geostatistical Wizard auf Machbarkeit (z.B. Nugget, Sill, Model, number of lags, ...) Christian Siemes – Analyseverfahren
Cross-Validation Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften • Entfernen eines einzelnen Punktes aus dem Datensatz • Berechnung der Fläche • Vergleich der Fläche mit dem entfernten beobachteten Wert liefert Fehler • Wiederholen für alle Punkte des Datensatzes Hoher Rechenaufwand! • ArcGIS trickst: Alle Punkte werden genutzt um die Funktion im Semivariogramm zu bestimmen • Diese wird für alle Durchgänge genutzt Christian Siemes – Analyseverfahren
Ergebnis der Cross-Validation Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften (Die Validation liefert das gleiche Ergebnis mit der Einschränkung, dass es nur für die Trainingsdaten gültig ist. Daher wird von nun an nur die Cross-Validation genannt.) Cross-Validation gibt folgendes Ergebnis aus • Das Ergebnis für jeden Punkt (Tabelle) • Vier Plots (Predicted, Error, Standardized Error, QQPlot) • Einige statistische Elemente (mittlere Fehler, Varianzen, ...) Christian Siemes – Analyseverfahren
Ausgangsgrößen Daraus ergibt sich: Vergleiche: Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften Christian Siemes – Analyseverfahren
Mean Prediction Error Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften „Mean“ = arithmetische Mittel der Fehler Wegen Gewichtung beim Kriging nicht genau gleich null. Achtung: Skalierung der Daten!(mm, m, km) Christian Siemes – Analyseverfahren
Mean Standardized Prediction Error Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften „Mean Standardized“ = standardisiertes, arithmetische Mittel der Fehler (des Wertes eines Punktes nach dem Kriging) Wegen Gewichtung beim Kriging nicht genau gleich null. (Bemerkung: „0“ setzt voraus 1. dass die Fehler zufällig sind und 2. dass E{Zi} = wahrer Wert ist.) Christian Siemes – Analyseverfahren
Root-Mean-Square-Prediction-Error Einzelner Parameter Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften „Root-Mean-Square“ = Schätzung des Fehlers (des Wertes eines Punktes nach dem Kriging) Christian Siemes – Analyseverfahren
Root-Mean-Square Standardized Prediction Errors Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften „Average Standard Error“ = Schätzung des standardisierten Fehlers (des Wertes eines Punktes nach dem Kriging) Christian Siemes – Analyseverfahren
Average Kriging Standard Error Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften „Average Standard Error“ = Schätzung der Standardabweichung (des Wertes eines Punktes nach dem Kriging) Christian Siemes – Analyseverfahren
Bewertungsmaßstäbe Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften Wozu sind die eben genannten statischen Elemente verwendbar? Situation: Mehrere auf verschiedene Weise erstellte Flächen liegen mit Cross-Validation vor. Welches Modell nehmen? Zwei Bewertungsmaßstäbe • Optimalität • Gültigkeit Christian Siemes – Analyseverfahren
Optimalität Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften „Root-Mean-Square“ ist möglichst nahe bei null, d.h. die Verbesserungen werden möglichst klein. Ziel: Die erstellte Fläche soll die reale Fläche wiedergeben. Christian Siemes – Analyseverfahren
Gültigkeit Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften „Root-Mean-Square“ ist möglichst nahe bei „Average Standard Error“. Analog: „Root-Mean-Square Standardized“ ist möglichst nahe bei eins. Ziel: Die Genauigkeit der Fläche soll der errechneten Genauigkeit des Krigingmodells entsprechen. (siehe Beispiel „Strand mit Schadstoffbelastung“) Christian Siemes – Analyseverfahren
Gültigkeit Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften • Root-Mean-Square > Average Standard Error (Analog zu Root-Mean-Square Standardized > 1) Die Standardabweichungen des Kriging sind zu niedrig (= genau) bestimmt worden. • Root-Mean-Square < Average Standard Error (Analog zu Root-Mean-Square Standardized < 1) Die Standardabweichungen des Kriging sind zu hoch (= ungenau) bestimmt worden. Christian Siemes – Analyseverfahren
Der Plot „Predicted“ Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften Kriging hat eine glättende Eigenschaft (im Bezug auf Cross-Validation), d.h. Kriging bestimmt • hohe Werte in niedriger Umgebung zu niedrig. • niedrige Werte in hoher Umgebung zu hoch. (Siehe Plot: Geradensteigung ist kleiner eins.) Tritt besonders bei den höchsten und niedrigsten Werten auf. Christian Siemes – Analyseverfahren
Schlussbemerkung Inhaltsverzeichnis I Motivation II Kontroll-Taktiken .1 Validation .2 Cross-Validation III Auswertung .1 statistische Elemente .2 Bewertungs- maßstäbe .3 Besondere Eigenschaften • Vorhin genannte Eigenschaft der Cross-Validation verursacht systematische Abweichungen. (u.a. deswegen statistische Elemente der Modelle nicht absolut vergleichen, nur relativ) Christian Siemes – Analyseverfahren