1 / 19

Routing Instabilitäten

Routing Instabilitäten. Vortrag: Daniel Weber Betreuer: Olaf Maennel. Lokalisierung von Routing Instabilitäten. Ablauf. Begriffsdefinitionen Motivation Ursachen von Instabilitäten Einfacher Ansatz Fehlerquellen Verbesserter Ansatz Gruppierung von Updates Fazit. Begriffsdefinitionen.

naava
Download Presentation

Routing Instabilitäten

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Routing Instabilitäten Vortrag: Daniel Weber Betreuer: Olaf Maennel Lokalisierung von Routing Instabilitäten

  2. Ablauf • Begriffsdefinitionen • Motivation • Ursachen von Instabilitäten • Einfacher Ansatz • Fehlerquellen • Verbesserter Ansatz • Gruppierung von Updates • Fazit

  3. Begriffsdefinitionen • Instabilitäten • jegliche Veränderungen eines AS-Pfads zu einem bestimmten Präfix • Störungsstellen • das AS oder die Kante zwischen zwei ASen, das/die die Instabilität verursacht hat • Beobachtungspunkte • passiv am BGP teilnehmende Systeme, die die eingehenden BGP-Updates für eine spätere Auswertung aufzeichnen

  4. Motivation zur Lokalisierung • Relativ junges Forschungsgebiet • erst mit komplexem Internet entstanden • BGP-Dynamik teilweise als „schwarze Magie“ missverstanden • Beeinflussung der Erreichbarkeit • kurzzeitiger oder längerer Verlust der Konnektivität • Performanceverlust der Anbindung durch häufige Updates • Beeinträchtigung des globalen Routings • Vereinfacht die Behebung von Fehlern • Fehlerquelle muss bekannt sein um das Problem zu lösen • „Schuldfrage“ einfacher zu klären

  5. Ursachen von Instabilitäten • Konfigurationsänderungen • Neue Peering- oder Upstream-Beziehungen • Einrichtung von Filtern • Veränderung interner Metriken • Konfigurationsfehler • oszillierende Routen • „schwarze Löcher“ • Fehlfunktionen von Hardware, Software, usw. • Ausfälle von Leitungen oder Routern

  6. Einfacher Ansatz • Vergleich von altem und neuem Pfad • gemeinsame Abschnitte beider Pfade ausschließen • der „bessere“ Pfad enthält die Instabilität AS 4 AS 6 AS 1 AS 3 AS 5 AS 7

  7. Mögliche Fehlentscheidungen Ausschluß gemeinsamer Abschnitte im Pfad kann zu einem falschen Ergebnis führen: tatsächliche Störungsstelle vermutete Störungsstelle AS 6 AS 3 AS 1 AS 9 AS 5 AS 7

  8. Mögliche Fehlentscheidungen Induzierte Updates: vermutete Störungsstelle tatsächliche Störungsstelle AS 6 AS 7 AS 1 AS 2 AS 3 AS 4 AS 5 Bevorzugung von 1-2-3-4 vor 1-8-4 manuell Konfiguriert AS 8

  9. Verbesserter Ansatz • Keine vorschnellen Ausschlüsse gemeinsamer Abschnitte der AS-Pfade • Keine falschen Ergebnisse durch induzierte Updates • Keine Beeinflussung durch teilweise nicht erkennbare Instabilitäten • Nutzung bisher nicht ausgewerteter Informationen

  10. Einschub: Stabile AS-Pfade • für beide Verfahren notwendig • stabile AS-Pfade werden nicht sofort erreicht sondern erst nach einer Konvergenzzeit Wie das „Ende“ der Update-Bursts erkennen?

  11. Einschub: Stabile AS-Pfade Drei mögliche Verfahren zur Erkennung zusammengehöriger Updates: • statischer Timeout • relativer Timeout • adaptiver Timeout

  12. Einschub: Stabile AS-Pfade Erkennung der Bursts: statischer Timeout Timeout BGP-Peers Zeit • geeigneter Timeout für ein Präfix kann für ein anderes absolut ungeeignet sein

  13. Einschub: Stabile AS-Pfade Erkennung der Bursts: relativer Timeout Timeout BGP-Peers Zeit • Updates in Folge eines anderen Ereignisses werden möglicherweise diesem zugeordnet

  14. Einschub: Stabile AS-Pfade Erkennung der Bursts: adaptiver Timeout relativer Timeout von t/2 statischer Timeout mit t* = 0 BGP-Peers Zeit t • über eine Zeitspanne t wird ein relativer Timeout von t/2 verwendet • führt dies zu keinem „Ende“, werden nur noch die laufenden Updates abgewartet

  15. Verbesserter Ansatz (cont‘d) 1. Schritt: UNION-Heuristik nach Zeit Alle ASe auf dem alten wie auch auf dem neuen Pfad werden als mögliche Störungsquelle berücksichtig. Beobachtungs-punkt 1 Präfix A

  16. Verbesserter Ansatz (cont‘d) 2. Schritt: INTERSECT-Heuristik nach Beobachtungspunkt Die Schnittmenge verschiedener Beobachtungs-punkte wird als Kandidatenmenge verwendet Beobachtungs-punkt 2 Beobachtungs-punkt 1 Präfix A

  17. Verbesserter Ansatz (cont‘d) 3. Schritt: GREEDY-Heuristik nach Präfixen Die am häufigsten auftretenden Elemente aller Kandidatenmengen werden als Kandidaten gewählt. Beobachtungs-punkt 2 Beobachtungs-punkt 1 Präfix A Präfix B

  18. Fazit • Lokalisierung einer Instabilität nicht trivial aber relativ genau möglich • je mehr Beobachtungspunkte desto besser • die „Stelle“ der Instabilität beeinflusst deren Sichtbarkeit • Ausbreitung von Instabilitäten • ideale Standorte für Beobachtungspunkte

  19. Ende Danke!

More Related