560 likes | 829 Views
Rood-zwart-bomen. Datastructuren Onderwerp 10. Vandaag. Rood-zwart-bomen (“red black trees”) Waarom? Wat en hoe? Hoe snel?. Zoekbomen recap. Zoekboom: implementatie van ADT met operaties: ZOEK-ELEMENT VOORGANGER OPVOLGER MINIMUM MAXIMUM INSERT DELETE
E N D
Rood-zwart-bomen Datastructuren Onderwerp 10
Vandaag • Rood-zwart-bomen (“red black trees”) • Waarom? • Wat en hoe? • Hoe snel?
Zoekbomen recap • Zoekboom: implementatie van ADT met operaties: • ZOEK-ELEMENT • VOORGANGER • OPVOLGER • MINIMUM • MAXIMUM • INSERT • DELETE • n is steeds het aantal niet-NIL keys in de zoekboom • Bij een zoekboom kan elk van deze in O(h) tijd, met h de hoogte van de boom • Als we niks doen, kan de hoogte groot worden • Slechtste geval: linked list, n hoog als n keys in boom • Kunnen we de zoekboom zo implementeren dat de hoogte beperkt blijft??
Zoekbomen met logaritmische hoogte • Veel vormen van zoekbomen zijn ontworpen zodat • De hoogte van de boom O(log n) blijft • Operaties in O(log n) tijd gedaan kunnen worden • Een van de meest elegante en praktische vormen van een zoekboom zijn de rood-zwart-bomen (red-black trees) • De hoogte blijft O(log n) in het slechtste geval • Gebruikt rotaties en een kleur voor elke node • Er zijn heel wat andere soorten bomen met zelfde eigenschappen: • 2-3-4-bomen, 2-3-bomen, alpha-beta-bomen, AVL-bomen, B-bomen • Ook veel gebruikt: skip-lists. Andere datastructuur met zelfde soort tijdseigenschappen (gelinkte lijst met aantal extra pointers die maken dat je soms stukken slim kan overslaan (skippen))
Rood-zwart-bomen • Binaire zoekboom • Iedere knoop heeft de volgende velden: • Kleurbit: roodof zwart • Key • Left (pointer naar linkerkind) • Right (pointer naar rechterkind) • P (Parent) (pointer naar ouder) • Met een Boolean kunnen we de kleur bijhouden. We schrijven hier: rood en zwart ipv. bitwaarde voor notatiegemak.
Rood-zwart eigenschappen • Een binaire zoekboom is een rood-zwart-boom, als de volgende rood-zwart eigenschappen gelden: • Elke knoop is rood of zwart • De wortel is zwart • Bladeren (die NIL zijn) zijn zwart • Als een knoop rood is, dan zijn allebei zijn kinderen zwart • Voor elke knoop v geldt: elk pad van v naar een blad onder v heeft hetzelfde aantal zwarte knopen • Idee 1: we doen de operaties op de boom zodat de rood-zwart eigenschappen blijven kloppen • Hierbij gebruiken we rotaties (komt) • Idee 2: als de rood-zwart eigenschappen kloppen dan heeft de boom diepte O(log n) • Bewijs komt zometeen
NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL NIL Een voorbeeld van een rood-zwart-boom 26 41 17 47 14 21 30 10 16 19 23 28 38 35 39 7 12 15 20 3
We tekenen de boom zonder de NIL-knopen 26 41 17 47 14 21 30 10 16 19 23 28 38 35 39 7 12 15 20 3
Implementatie van NIL-knopen • Er zijn verschillende implementaties van de NIL-knopen mogelijk: • Gewoon aparte knoop voor elke NIL-knoop • Geen object-verwijzing in NIL-knoop (extra test bij bijv. Zoekacties op dit soort verwijzingen) • Boolean’s • In het boek wordt het volgende gedaan: • Alle NIL-knopen worden door een en hetzelfde object gerepresenteerd • Die ene NIL-knoop is ook de parent van de root • Deze knoop heet NIL[T] • Verschillende implementaties kunnen in de constante, verstopt in de O-notatie, uitmaken
Implementatie boek 26 41 17 47 14 21 30 10 16 19 23 28 38 35 39 7 12 15 20 3
Hoogte-analyse van rood-zwartbomen 1 • Definitie: de zwart-hoogte(black-height) van een knoop x, notatie zh(x) is het aantal zwarte knopen van x naar een blad. We tellen x zelf niet mee, het blad wel. • Vanwege eigenschappen van rood-zwartbomen: het hangt niet af welk blad we bekijken (eigenschap 5)
zh(x) 3 26 3 41 17 2 47 14 21 30 2 2 2 1 10 16 19 23 28 38 2 1 1 1 1 1 35 39 7 12 15 20 1 1 1 1 1 1 3 1
Een Lemma Lemma Laat x een knoop zijn. Als x zwarthoogte r heeft, dan bevat de deelboom, gevormd door x en al zijn afstammelingen tenminste 2r-1 niet-NIL knopen. Bewijs Met inductie naar de (gewone) hoogte van x. • Als x hoogte 0 heeft, dan is x een leaf (NIL-knoop); de boom gevormd door x en al zijn afstammelingen bevat alleen x en dus 0 niet-NIL knopen, wat precies 20-1 is. • Stel x heeft hoogte h >0, en het lemma geldt voor alle knopen met hoogte < h. Dus: het lemma geldt voor de kinderen van x. Elk kind van x heeft zwarthoogte r-1of r.De deelboom bevat: • ³2r-1 – 1 niet-NIL knopen in de linkerdeelboom van x; • ³2r-1 – 1 niet-NIL knopen in de rechterdeelboom van x; • en x zelf (ook niet-NIL). • Dus minstens 2r-1 -1 + 2r-1 -1 + 1 = 2r-1 niet-NIL knopen. • QED
14 r 10 16 r r-1
Zwart-hoogte en hoogte van boom Lemma De wortel van een rood-zwartboom met n interne knopen heeft zwarthoogte hooguit lg (n+1). • Want n³ 2zh(root) -1 Stelling De hoogte van een rood-zwartboom is hooguit 2 lg(n+1). • Bewijs: tenminste de helft van alle knopen op een pad van de wortel naar een blad zijn zwart, want er zijn geen twee rode knopen na elkaar op zo’n pad. Dus de hoogte is maximaal twee keer de zwart-hoogte van de wortel. • QED • Gevolg: operaties Tree-Search, Minimum, Maximum, Successor, Predecessor kosten O(lg n) tijd als we een rood-zwart-boom hebben.
Rotaties 1 • Bij INSERTIONs en DELETIONs moeten we zorgen dat rood-zwart-eigenschap behouden blijft • Hoe? Rotaties! • Twee soorten: links-rotatie en rechts-rotatie • Kunnen rood-zwart eigenschap verknoeien of herstellen • Behouden de zoekboom-eigenschappen • Links-rotatie: 17 14 14 17
Links- en rechts-rotatie 17 14 14 17 17 14 14 17
17 17 21 10 14 21 19 23 10 16 19 23 7 14 20 7 12 15 20 3 16 12 3 15
Eigenschap van rotaties • Rood-zwart-eigenschappen kunnen veranderen voor de geroteerde knopen en alle knopen op pad van geroteerde knopen naar wortel 17 14 14 17
Invoegen van een nieuwe node • Als we een nieuwe knoop met key z willen invoegen: • Eerst voegen we z toe, net als in zoekboom • Daarna doen we een stap RB-INSERT-FIXUP(T,z): • Herstelt de rood-zwart eigenschap door rotaties
Neem aan dat we een knoop-object z hebben met een key-waarde key[z]. Ongeveer net als bij gewone zoekbomen voegen we in, maar Gebruik van nil[T] Nieuwe knoop krijgt kleur rood We roepen RB-INSERT-FIXUP aan y = nil[T]; x = nil[T]; whilex¹ nil[T] do y = x; if key[z] < key[x]then x = left[x]elsex = right[x] p[z] = y; if (y == nil[T])then root[T]= z; else if key[z] < key[y] then left[y] = zelse right[y] = z left[z] = nil[T]; right[z] = nil[T]; color[z] = rood; RB-INSERT-FIXUP(T,z) Pseudocode RB-INSERT(T,z)
x wordt een blad waar key[z] zou passen; y is de ouder van x Zet z op de plek van x en zet alle pointers goed Kleur z rood Roep RB-INSERT-FIXUP aan y = nil[T]; x = nil[T]; whilex¹ nil[T] do y = x; if key[z] < key[x]then x = left[x]elsex = right[x] p[z] = y; if (y == nil[T])then root[T]= z; else if key[z] < key[y] then left[y] = zelse right[y] = z left[z] = nil[T]; right[z] = nil[T]; color[z] = rood; RB-INSERT-FIXUP(T,z) RB-INSERT(T,z)
Hoe doen we de fixup? • Kijk eens naar de rood-zwart-eigenschappen: • Elke knoop is rood of zwart • De wortel is zwart • Bladeren (die NIL zijn) zijn zwart • Als een knoop rood is, dan zijn allebei zijn kinderen zwart • Voor elke knoop v geldt: elk pad van v naar een blad onder v heeft hetzelfde aantal zwarte knopen • Alleen eigenschappen 2 en 4 kunnen worden geschonden. • Eigenschap 2 is makkelijk: als de ingevoegde knoop de wortel is, dan is die rood, maar moet zwart zijn. Dus, kleur de wortel zwart. Dat verknoeit niets. • Eigenschap 4 kan verknoeid worden als we z onder een rode knoop hangen. We kunnen niet zomaar z dan zwart kleuren, wan dat zou eigenschap 5 schaden…
Duw het probleem omhoog • Ons algoritme gebruikt als invariant • z is rood • Als p[z]de wortel is, dan is p[z]zwart • Als de rood-zwart-eigenschappen niet gelden, dan gelden ze op precies 1 punt niet, nl. bij z, en 1 van de volgende 2 gevallen geldt: • z is de wortel en z is rood OF • z is rood en p[z] is rood • Merk op: deze geldt initieel (met z de ingevoegde knoop) • In het begin geldt dit voor de ingevoegde knoop z (onderaan de boom). Door rotaties en herkleuringen schuiven we het probleem omhoog, tot we bij de wortel zijn of er geen probleem meer is… • Hoe we precies dit doen: gevalsonderscheid!
Geval 0: z is de wortel • Kleur z zwart • Klaar! • Als z niet de wortel is: z is rood, de ouder van z is rood (en dus is vanwege invariant is de ouder van z ook niet de wortel)
Als z niet de wortel is: • Als z niet de wortel is: z is rood, de ouder van z is rood (en dus is vanwege invariant is de ouder van z ook niet de wortel) • 6 gevallen 38 p[z] p[z] 38 35 z 45 z
6 gevallen • 1 en 1b: de oom van z is rood • 2 en 2b: “recht”: z is linkerkind van linkerkind, of rechterkind van rechterkind, en de oom van z is zwart • 3 en 3b: “zigzag”: z is linkerkind van rechterkind, of rechterkind van linkerkind, en de oom van z is zwart
In geval 1 is p[z] het linkerkind van zijn ouder: left[p[p[z]] == p[z] En is het rechterkind van de ouder van de ouder van z rood Naamgeving: right[p[p[z]] is de oom van z Geval 1: p[z] is linkerkind, en right[p[p[z]] is rood 50 48 38 35 z
Kleur ouder en oom van z zwart Kleur grootouder van z rood z wordt grootouder z = p[p[z]] Geval 1: p[z] is linkerkind, en right[p[p[z]] is rood z 50 50 62 62 38 38 35 35 z Check de invarianten!
Geval 1B: p[z] is rechterkind, en left[p[p[z]] is rood • Net als geval 1, maar gespiegeld z 50 50 62 62 38 38 z 35 35
Wat is het geval? • We krijgen nog deze gevallen: • Geval 2: p[z] is een linkerkind, de oom van z is zwart, en z is een linkerkind • Geval 2B: p[z] is een rechterkind, de oom van z is zwart, en z is een rechterkind • Gespiegeld aan geval 2 • Geval 3: p[z] is een linkerkind, de oom van z is zwart, en z is een rechterkind • Geval 3b: p[z] is een rechterkind, de oom van z is zwart, en z is een linkerkind • Gespiegeld aan geval 3 • Ik behandel eerst geval 3 (uit het boek), en dan pas geval 2.
Ziet er zo uit Lijkt op geval 1, maar nu is de oom van z zwart, en we eisen dat z een linkerkind is (maakte niet uit bij geval 1) Geval 3: p[z] is een linkerkind, de oom van z is zwart, en z is een linkerkind 50 62 38 35 z
Geval 3: rotatie en herkleuren • Doe rechterrotatie en herkleur 38 50 50 35 62 62 38 z 35 … en klaar!
We doen nu een linkerrotatie en komen daarmee in geval 3 Geval 2: p[z] is een linkerkind, de oom van z is zwart, en z is een rechterkind 50 71 28 35 z
Linkerrotatie: dit beinvloedt alleen z en zijn ouder. Hierna zijn we in geval 3 beland en lossen we het op als in geval 3! 50 50 71 28 71 35 35 z 28 z
Recap • Geval 1 en 1B: kleur de ouder en oom van z zwart, en de grootouder van z rood; z wordt zijn grootouder • Geval 2: doe een linkerrotatie en je komt in geval 3 • Geval 2B: doe een rechterrotatie en je komt in geval 3B (niet getoond) • Geval 3: doe een rechterrotatie en kleur de oude ouder van z zwart en de oude grootouder van z rood. Nu gelden alle rood-zwart-boom-eigenschappen weer. • Geval 3B: doe een linkerrotatie en kleur de oude ouder van z zwart en de oude grootouder van z rood. Nu gelden alle rood-zwart-boom-eigenschappen weer. (Niet getoond.)
Pseudocode for RB-INSERT-FIXUP(T,z) whilecolor[p[z]] == rood do if (p[z] == left[p[p[z]])then y = right[p[p[z]]];if (color[y] == rood) {geval 1} then color[p[z]] = zwart; color[y] = zwart; color[p[p[z]] = rood; z = p[p[z]]; else if (z == right[p[z]]) {geval 2} thenz = p[z]; LEFT-ROTATE(T,z); color[p[z]] = black; {geval 3} color[p[p[z]] = red; RIGHT-ROTATE(T,p[p[z]]); elsezelfde code als voor het if-geval met links en rechts verwisseld
Tijd van invoeging • De diepte van de boom is en blijft O(log n) • Eerst gaan we van de wortel naar een blad, en dan weer terug omhoog • Op elke positie doen we een constant aantal acties • O(log n) tijd
Opmerking • Andere soorten zoekbomen met O(log n) tijd voor insertions werken ook met rotaties, maar hebben een ander mechanisme om te zien waar en wanneer je moet roteren
Weglaten / deletion • Weglaten lijkt er een beetje op: iets meer gevallen • Weglaten heeft twee stappen: • Verwijderen van de knoop, ongeveer als in “gewone” zoekboom • Fixup, die rood-zwart eigenschappen herstelt, met herkleuringen en rotaties • Bij het weglaten kan gebeuren: • Een knoop a wordt verplaatst naar een andere plek waar een knoop b stond die weggelaten werd • Geef verplaatste knoop a de kleur van de weggelaten knoop b • Een blad wordt weggelaten • Een knoop met 1 kind wordt overgeslagen
RB-Fixup-Delete • Herinner van “gewone” delete de gevallen: • We kunnen een blad weglaten • Rood of zwart • We kunnen een knoop met 1 kind “overslaan” • Rood of zwart • Bij het verplaatsen: knoop kan nieuwe kleur krijgen: • Kleur van de knoop die weggelaten was op wiens plek hij komt
Rode knopen zijn makkelijk • De rood-zwart-boom eigenschappen blijven geldig als we een rood blad weggooien of overslaan • Elke knoop is rood of zwart • De wortel is zwart • Bladeren (die NIL zijn) zijn zwart • Als een knoop rood is, dan zijn allebei zijn kinderen zwart • Voor elke knoop v geldt: elk pad van v naar een blad onder v heeft hetzelfde aantal zwarte knopen • Dus we hoeven alleen een “fixup” te doen als we een zwarte knoop overslaan of weglaten
Gevallen • Weglaten van een zwarte knoop • Wortel (heeft dan 1 kind) • Oplossen door nieuwe wortel zwart te maken (als ie ‘t niet al was) • Knoop met 1 kind middenin, kind is zwart • Oplossen met rotaties • Knoop met 1 kind middenin, kind is rood • Kleur kind zwart • Blad • Oplossen met rotaties
Geval 1 • Geval 1: de wortel heeft 1 kind, en we laten de wortel weg • Mogelijk probleem: conditie 2: wortel kan rood wortel • Oplossing: kleur de wortel zwart. Condities gelden nu 42 15 15 15
Als we een zwarte knoop x met 1 rood kind overslaan, dan doen we: Kleur het kind zwart Controleer dat we weer een rood-zwart-boom hebben aan de eisen In feite is het rode kind weggelaten Geval 2: Overslaan van zwarte knoop met 1 rood kind 15 8 17 7 29 15 17 7 7 29
Als we een zwarte knoop x met 1 zwart kind overslaan, dan was de boom geen rood-zwart-boom! In het voorbeeld: linksaf heeft “8” een grotere zwartdiepte dan rechtsaf… Dus, dit geval doet zich niet voor Geval 2B:Overslaan van zwarte knoop met 1 zwart kind 15 8 17 7 29 ? 15 17 7 7 29
Alleen eigenschap 5 is verknoeid: voorouders van weggelaten knoop x hebben verschillend aantal zwarte knopen op paden naar bladeren Oplossen door omhoog te lopen en door rotaties e.e.a. op te lossen Preciezer: 1 knoop en al zijn voorouders hebben eigenschap 5 niet vervuld Geval 3: Weglaten van zwart blad 15 8 17 7 10 29 15 8 17 7 29
Samenvatting probleem Kan zowel bij weglaten van blad als bij overslaan van knoop zich voordoen … en links enrechts kunnenanders zitten z i-1 zwarte knopen i zwarte knopen x y Deze namenblijf ik gebruiken
Weer verschillende gevallen gevallen x is een knoop die te weinig zwart heeft naar beneden, vergeleken met z’n broer • De broer van x is rood • De broer van x is zwart en heeft twee zwarte kinderen • De broer van x is zwart, heeft een zwart kind en een rood kind, en het rode kind “zit aan de kant van x” • De broer van x is zwart, heeft een zwart kind en een rood kind, en het zwarte kind “zit aan de kant van x”OF:De broer van x is zwart en heeft twee rode kinderen NB: nil-bladeren tellen hier ook als zwarte kinderen
Roteer en herkleur om ervoor te zorgen dat de broer van x zwart is Nu kom je in geval 2-4: de broer van x is zwart Geval 1: de broer van x is rood z x i i-1 y b a i i y Getallen: aantal zwarte knopen op bladpaden, inclusief z b i x i-1 a i