570 likes | 879 Views
Robuste Schätzung. Einführung Schätztheorie Ansätze für robuste Schätzer Herleitung einer Schätzfunktion Klassen von Schätzfunktionen. Methode der kleinsten Quadrate. Eigenschaften Größte Wahrscheinlichkeit für ausgeglichene Werte Erwartungstreue
E N D
Robuste Schätzung • Einführung • Schätztheorie • Ansätze für robuste Schätzer • Herleitung einer Schätzfunktion • Klassen von Schätzfunktionen Ausgleichungsrechnung II Gerhard Navratil
Methode der kleinsten Quadrate Eigenschaften • Größte Wahrscheinlichkeit für ausgeglichene Werte • Erwartungstreue Beliebt weil Schätzer linear einfach zu handhaben Nachteil: Anfällig für grobe Fehler Ausgleichungsrechnung II Gerhard Navratil
Annahme bei der Methode der kleinsten Quadrate Fehler der Beobachtungen normalverteilt Annahme getroffen aufgrund des zentralen Grenzwertsatzes Gilt nur wenn (idealerweise) • Frei von groben Fehlern • Keine systematischen Einflüsse Meist nicht in vollem Umfang gegeben! Ausgleichungsrechnung II Gerhard Navratil
X 2 3 4 5 1 Beispiel (1) 5 Festpunkte, jeweils Strecke zu Neupunkt gemessen 200m 100m Ausgleichungsrechnung II Gerhard Navratil
Beispiel (2) Einführen eines groben Fehlers Strecke 1 – X statt 282,844m neu 292,844m (10m-Fehler) Vorher: Ausgleichungsrechnung II Gerhard Navratil
Beispiel: Was fällt auf? Grober Fehler (10m) verursacht Fehler in ausgeglichenen Koordinaten von 5m (y) und 2m (x) Generell große Verbesserungen (nicht nur bei Seite 1-X) Dieses Beispiel: Nur ein grober Fehler – Elimination der Beobachtung aufgrund Verbesserungen möglich Ausgleichungsrechnung II Gerhard Navratil
Ursache für Versagen? Voraussetzung für Funktionieren von Methode der kleinsten Quadrate war Normalverteilung der Beobachtungen Grobe Fehler nicht normalverteilt Ausgleichungsrechnung II Gerhard Navratil
Wünschenswert wäre Klare Abtrennung grober Fehler Notwendig: Verbesserung bei groben Fehlern korrigiert diesen Fehler ganz/fast Also: Ergebnis nur von ‚korrekten‘ Beobachtungen beeinflusst! Methoden, bei denen das passiert: Robuste Schätzer z.B. Median Ausgleichungsrechnung II Gerhard Navratil
Eigenschaften für robuste Schätzer • Verteilungsrobust: Fehler im stochastischen Modell sollen wenig stören • Datenrobust: Gute Ergebnisse bei groben Fehlern in Datenmaterial • Modellrobust: Ergebnis hauptsächlich von ‚guten‘ Daten beeinflusst • Hohe Trennfähigkeit: Grobe Fehler sollen an Verbesserungen erkennbar sein • Optimale Ergebnisse: Ergebnisse sollen der Methode der kleinsten Quadrate entsprechen Ausgleichungsrechnung II Gerhard Navratil
Fortsetzung Beispiel (1) Lösung des Beispiels mit Least Median Square (LMS): Alle eindeutigen Lösungen bestimmt, Median der Verbesserungs-quadrate, Minimum gibt Lösung 10 Lösungen, Lösung mit minimalem Median ist Vorher: Ausgleichungsrechnung II Gerhard Navratil
Fortsetzung Beispiel (2) Ergebnis unterscheidet sich kaum von Lösung ohne groben Fehler Falsche Beobachtung (1 von 5 = 20%) hat keinen Einfluss Verbesserungen: Fehler leicht zufinden! Ausgleichungsrechnung II Gerhard Navratil
Fortsetzung Beispiel (3) Weitere Methode (siehe Kraus Photo-grammetrie Bd. 2): Iterative Ausgleichung mit Kehrwerten der Verbesserungen als Gewichten 1. 2. Ausgleichungsrechnung II Gerhard Navratil
Fortsetzung Beispiel (4) Einfluss der grob falschen Beobachtung wird immer geringer Verbesserung wird größer Nach der 17. Iteration: Lösung ändert sich nicht mehr Ausgleichungsrechnung II Gerhard Navratil
Schätztheorie Schätzfunktion + Eigenschaften Einflussfunktion: Misst Einfluss einer Änderung im Parametervektor auf die Schätzfunktion Verlustfunktion: Abweichung der Schätz-funktion vom optimalen Ergebnis Ausgleichungsrechnung II Gerhard Navratil
Schätzfunktion Funktion, die den gesuchten Parameter aus den Beobachtungen ableitet Beobachtungsgleichungen Schätzwert für unbekannten Parameter Tn Anhand dieses Schätzwertes Untersuchung der Eigenschaften der Schätzfunktion Ausgleichungsrechnung II Gerhard Navratil
Einflussfunktion (1) Überlegung: Gegeben (n-1) Zufalls-variablen Xi mit empirischer Verteilung Fn-1 und Schätzfunktion Hinzufügen einer weiteren Zufallsvariable: Ausgleichungsrechnung II Gerhard Navratil
Einflussfunktion (2) Differenz der Schätzfunktionen Tn-1 und Tn multipliziert mit Anzahl der Zufallsvariablen Sensibilitätskurve SC Beschreibt den Effekt des Hinzufügens einer Beobachtung auf die Schätzfunktion n ∞, also 1/n=e: Einflussfunktion IF Ausgleichungsrechnung II Gerhard Navratil
Einflussfunktion (3) Misst Effekt einer infinitesimalen Änderung in den Daten auf den Schätzer Theoretisch strenges aber abstraktes Maß Grobe Fehler: Nur Schätzfunktion mit beschränktem Einfluss kann robust sein Typen von Schätzfunktionen: • Monoton, unbeschränkt: arithmetisches Mittel • Monoton, beschränkt: Median • Beschränkt mit Sprung auf 0: Arithmetisches Mittel mit Verwerfungsregel • Beschränkt mit stetigem Übergang auf 0: Hampel-Schätzer Ausgleichungsrechnung II Gerhard Navratil
Einflussfunktion (4) Aus: Wicki (1999) Robuste Schätzverfahren für die Parameterschätzung in geodätischen Netzen, S. 36 Ausgleichungsrechnung II Gerhard Navratil
Verlustfunktion r Verbesserungen: erfüllen funktionales Modell Schätzfunktion für Verbesserungen notwendig Verlustfunktionr(v): Abweichung der Schätzfunktion vom optimalen Ergebnis Gauß‘sche VerlustfunktionMethode der kleinsten Quadrate Ls-Norm-Schätzer: Ausgleichungsrechnung II Gerhard Navratil
Konsistenz Schätzfunktion Tn für Parameter t ist konsistent, wenn Tn bei wachsendem n gegen t konvergiert Also: Je größer die Stichprobe desto sicherer die Schätzung Ausgleichungsrechnung II Gerhard Navratil
Erwartungstreue Erwartungstreu: Erwartungswert ist gleich dem zu schätzenden Parameter, also Muss unabhängig von der Anzahl der Realisierungen gelten Bias: Bias bei erwartungstreuen Schätzern gleich Null Ausgleichungsrechnung II Gerhard Navratil
Bruchpunkt Grenzwert für den Prozentsatz grob falscher Beobachtungen vor Verlust der Erwartungstreue Bruchpunkt 10%: bis zu 10% der Beobachtungen dürfen falsch sein und das Ergebnis ist noch korrekt Arithmetisches Mittel, Methode der kleinsten Quadrate: Bruchpunkt 0% Maximal möglicher Wert: 50% (Median, LMS) Voraussetzung: Keine Hebelbeobachtungen Angabe in Geodäsie nicht möglich (außer 0%) Ausgleichungsrechnung II Gerhard Navratil
Effizienz (1) Schätzvarianz Maß für die Streuung der Schätzfunktion um den Erwartungswert möglichst klein! Effizienz: Verhältnis zwischen kleinst-möglicher Schätzvarianz und Schätz-varianz der verwendeten Schätzfunktion Ausgleichungsrechnung II Gerhard Navratil
Effizienz (2) Praktische Anwendungen: Möglichst hohe asymptotische Effizienz, also Oft nur relative Effizienz erreichbar – relativ effizient, wenn Schätzvarianz kleiner als die anderer Schätzfunktionen Ausgleichungsrechnung II Gerhard Navratil
Suffizienz Suffizient, wenn alle relevanten Informatio-nen der Stichprobe verwendet werden Nicht gegeben, wenn bestimmte Informa-tionen nicht einfließen z.B. Punkt durch 3 Strecken bestimmt, Lösung nur aus 2 Strecken berechnet Ausgleichungsrechnung II Gerhard Navratil
Hebelbeobachtung (1) Daten, die geometrisch weit entfernt von der Masse der übrigen Daten liegen Bsp: Ausgleichende Gerade Ausgleichungsrechnung II Gerhard Navratil
Hebelbeobachtung (2) Beobachtungsgleichungen bei Qll=I: v=Ax-l L2-Norm liefert Projektionsmatrix (Hatmatrix) H Kofaktoren der Verbesserungen: Qvv=I-H Ausgleichungsrechnung II Gerhard Navratil
Hebelbeobachtung (3) Für die Spur von Qvv gilt: Spur gleich Rang idempotente Matrix Für die Redundanzanteile gilt Also Bezug Redundanzanteil – Geometrie Ausgleichungsrechnung II Gerhard Navratil
Hebelbeobachtung (4) Wert von hii groß (nahe bei 1) Hebelbeobachtung Beobachtung mit kleiner Redundanz (nur schwach kontrolliert) Hebelbeobachtung „Gute“ Hebelbeobachtungen haben einen starken positiven Einfluss auf das Ergebnis der Schätzung Aber: Fehler nur schwer lokalisierbar Ausgleichungsrechnung II Gerhard Navratil
Behandlung von Hebelbeobachtungen • Optimierung der Beobachtungspläne • „Entgeometrisierung“ des Modells • Hampel-Krasker-Schätzer (nach Caspary (1996), Anmerkungen zum robusten Schätzen) Ausgleichungsrechnung II Gerhard Navratil
Problem bei Hebelbeobachtungen Maskierung bei Gruppe von Beobachtungen Beispiel: nicht unabhängige Wieder-holung einer Messung Ausgleichungsrechnung II Gerhard Navratil
Maskierte Hebelbeobachtung Distanz c istunvollständigkontrolliert! rc = 0%, grober Fehler fällt nicht auf Strecke c 2x gemessen rc1 = 50%, rc2 = 50%grober Fehler in einer Messung fällt auf Grober Fehler in beiden Beobachtungen (nicht unabhängig) fällt nicht auf! Ausgleichungsrechnung II Gerhard Navratil
Ansätze für robuste Schätzer (1) Messfehler x: Wahrscheinlichkeit P, dass x Werte aus einem Bereich X beschrieben über Verteilungsfunktion Geodäsie: Annahme Normalverteilung, also Systematische Einflüsse meist vorhanden Störung! Ausgleichungsrechnung II Gerhard Navratil
Ansätze für robuste Schätzer (2) Robuste Schätzer: Messfehler gehören Stammverteilung oder Störverteilung an Wahrscheinlichkeit e, dass Messfehler auftreten Für Stammverteilung G meist Normalverteilung Schätzer robust, wenn gute Schätzwerte auch bei nicht streng normalverteilten Daten Ausgleichungsrechnung II Gerhard Navratil
Herleitung der Schätzfunktion (1) Beispiel: Methode der kleinsten Quadrate Eindimensionale Schätzfunktion Gauß‘sche Verlustfunktion Extremwertaufgabe ist Ausgleichungsrechnung II Gerhard Navratil
Herleitung der Schätzfunktion (2) Lösung: 1. Ableitung gleich Null setzen Eindimensionaler Fall: Arithmetisches Mittel Mehrdimensionaler Fall: Annahme unkorrelierte, gleichgenaue Messungen, also Qll=P=I: Ausgleichungsrechnung II Gerhard Navratil
Herleitung der Schätzfunktion (3) Verlustfunktion soll minimal werden Erste Ableitung Y der Verlustfunktion Da variable Größen in x und nicht in v: Kettenregel Ausgleichungsrechnung II Gerhard Navratil
Herleitung der Schätzfunktion (4) Wegen v=Ax-lmuss gelten Einführung von(Zeilenvektor der A-Matrix) führt zu Matrizenschreibweise Liefert das Normalgleichungssystem Ausgleichungsrechnung II Gerhard Navratil
Herleitung der Schätzfunktion (5) Modifizierte Gauß‘sche Verlustfunktion, Erste Ableitung: Und somit Einsetzen von v=Ax-lgibt Ergibt keine robuste Schätzfunktion ! Ausgleichungsrechnung II Gerhard Navratil
M-Schätzer (1) Verallgemeinerung der Maximum Likelihood-Schätzer: M- oder Huber-Schätzer Eng verwandt mit Methode der kleinsten Quadrate Verlustfunktion so gewählt, dass Schätzer robust, dann bekannte Bedingung Ausgleichungsrechnung II Gerhard Navratil
M-Schätzer (2) Eindimensionaler Fall:Verlustfunktionliefert arithmetisches Mittel Nicht robust! Beurteilung der Eigenschaften: Einfluss-funktion bestimmen, nach Hampel und Borutta: Ausgleichungsrechnung II Gerhard Navratil
M-Schätzer (3) Zeile ai: Einfluss der i-ten Beobachtung auf den Unbekanntenvektor Funktion Y(vi) ist bei M-Schätzern proportional zur Einflussfunktion Wenn Einflussfunktion beschränkt: robust Für Diskussion der Eigenschaften der Verlustfunktion reicht Diskussion von Y Oft Einflussfunktion nicht explizit bestimmt Ausgleichungsrechnung II Gerhard Navratil
M-Schätzer (4) Annahme: Stammverteilung G, Störver-teilung S, geringe Anzahl von Ausreißern Stetige, konvexe Verlustfunktion mit robusten Eigenschaften: Ausgleichungsrechnung II Gerhard Navratil
M-Schätzer (5) Ausgleichungsrechnung II Gerhard Navratil
L-Schätzer (1) Linearkombination von Ordnungsstatistiken Einfachster Fall: Direkt beobachtete Größen, n Beobachtungen, nach Größe sortiert L(i) …i-te Ordnungsstatistik der Stichprobe Schätzfunktion Ausgleichungsrechnung II Gerhard Navratil
L-Schätzer (2) • Gleiche Gewichte (1/n): arithmetisches Mittel • a1=an=1/2, sonst 0: Schätzung nach Tschebyscheff Beide Lösungen nicht robust! Ausgleichungsrechnung II Gerhard Navratil
L-Schätzer (3) • Abschneiden des größten und kleinsten Wertes • Alle Werte außer mittlerem Wert abschneiden: Median Beide Lösungen robust! Ausgleichungsrechnung II Gerhard Navratil
Ls-Norm-Schätzer (1) Verlustfunktion als Potenz der Verbes-serungsabsolutbeträge Erste Ableitung wird Normalgleichungen: Ausgleichungsrechnung II Gerhard Navratil
Ls-Norm-Schätzer (2) Es zeigt sich, dass Y-Funktion beschränkt für in diesem Bereich robust Ausgleichungsrechnung II Gerhard Navratil