410 likes | 550 Views
Graph Matching. Torsten Gründel 03.11.2006. Überblick. Was ist Graph Matching Morphismen Allgeimeines Graphisomorphismus Subgraphisomorphismus Eigenschaften. Überblick. Kategorien von Matchingmethoden Exakte Matchingmethoden Unexaktes Matching Matchingkosten
E N D
Graph Matching Torsten Gründel 03.11.2006
Überblick • Was ist Graph Matching • Morphismen • Allgeimeines • Graphisomorphismus • Subgraphisomorphismus • Eigenschaften
Überblick • Kategorien von Matchingmethoden • Exakte Matchingmethoden • Unexaktes Matching • Matchingkosten • Optimale & Suboptimale Inexakte Matchingalgorithmen • Matchingmethoden
Überblick • Subgraphalgorithmus von Ullmann • Definitionen • Einfacher Aufzählungsalgorithmus • Verbesserte Prozedur • Zusammenfassung • Referenzen
1. Was ist Graph Matching? • Rechenintensive Technik aus den späten 70ern • „Graph Matching ist der Prozess, eine Korrespondenz zwischen Knoten und Kanten zweier Graphen zu finden, die (mehr oder weniger strikte) Bedingungen erfüllt und sicherstellt, dass gleiche Substrukturen eines Graphen auf gleiche Substrukturen des anderen Graphen abgebildet werden.“ • Vielfältige Einsatzgebiete: • 2D & 3D Bildanalyse • Dokumentenverarbeitung • Biometrische Identifizierung • Bilddatenbanken • Videoanalyse • Biomedizinische und Biologische Anwendungen
2. Morphismen • Allgemeines • Graphisomorphismus • Subgraphisomorphismus • Eigenschaften
2. Morphismen • „Ein Morphismus ist eine Abbildung zwischen zwei mathematischen Objekten des selben Typs, die die grundlegende Struktur der Objekte erhält.“ • Hier: Abbildung zwischen den Knoten der Graphen G=(V,E) und G‘=(V‘,E‘), die die Kantenverbindungen erhält. • Definition Graphenhomomorphisus (schwächste Form): • Striktere Form: Graphmonomorphismus Hier müssen die Knotenabbildungen eindeutig sein
2. Morphismen • Allgemeines • Graphisomorphismus • Subgraphisomorphismus • Eigenschaften
A D C B E 2.1 Graphisomorphismus • Definition: Ein Graphenisomorphismus ist ein bijektiver Graphenhomomorphismus zwischen zwei Graphen G=(V,E) und G‘=(V‘,E‘) 4 A D F(A) = 1 F(B) = 2 F(C) = 3 F(D) = 4 F(E) = 5 1 3 C 2 B E 5
A D C 4 B E 1 3 2 5 2.1 Graphisomorphismus • Definition: Ein Graphenisomorphismus ist ein bijektiver Graphenhomomorphismus zwischen zwei Graphen G=(V,E) und G‘=(V‘,E‘) A D F(A) = 2 F(B) = 1 F(C) = 3 F(D) = 5 F(E) = 4 C B E
2. Morphismen • Allgemeines • Graphisomorphismus • Subgraphisomorphismus • Eigenschaften
2.2 Subgraphisomorphismus • Knoteninduzierter Subgraph: G‘=(V‘,E‘) ist Subgraph von G=(V,E) und • Definition: Ein Subgraphisomorphismus ist ein Graphisomorphismus zwischen einem Graph G=(V,E) und einem knoteninduzierten Subgraph eines zweiten Graphen G‘=(V‘,E‘) 4 A A F(A) = 1 F(B) = 3 F(C) = 2 1 1 3 3 B B 2 2 C C 5
2.2 Subgraphisomorphismus • Knoteninduzierter Subgraph: G‘=(V‘,E‘) ist Subgraph von G=(V,E) und • Definition: Ein Subgraphisomorphismus ist ein Graphisomorphismus zwischen einem Graph G=(V,E) und einem knoteninduzierten Subgraph eines zweiten Graphen G‘=(V‘,E‘) 4 A A F(A) = 1 F(B) = 3 F(C) = 4 1 3 B B 2 C C 5
2. Morphismen • Allgemeines • Graphisomorphismus • Subgraphisomorphismus • Eigenschaften
2.5 Eigenschaften • Graphisomorphismus: nicht bewiesen ob in NP • Alle Anderen: NP-Vollständig • Polynomielle Algorithmen für spezielle Graphen existieren • Rechenzeit heute akzeptabel, da • Gesteigerte Rechenleistung • Graphen in Praxis unterscheiden sich von „Worst Case Graphen“ • Knoten- & Kanteneigenschaften reduzieren Suchzeiten
3. Graph Matching Methoden • Exaktes Matching • Unexaktes Matching • Matchingkosten • Optimale & Suboptimale Inexakte Matchingalgorithmen • Matchingmethoden
3.1 Exaktes Graph Matching 2 • Matching anhand vorgestellter Morphismen • Meist werden Bäume verwendet • Suchstrategie (z.B. BFS, DFS) gibt Reihenfolge vor • Grundidee: Partielles Matching (anfangs leer) iterativ um Matchingpaar erweitert A B 1 { } {(A,1)} {(A,2)} {(A,1), (B,1)} {(A,2), (B,1)} {(A,1), (B,2)} {(A,2), (B,2)}
3. Graph Matching Methoden • Exaktes Matching • Unexaktes Matching • Matchingkosten • Optimale & Suboptimale Inexakte Matchingalgorithmen • Matchingmethoden
3.2 Unexaktes Matching • Gründe für Unexaktheit: • Nichtdeterministische Elemente sind enthalten • Exaktes Matching ist zu teuer (Rechenzeit) • Matching muss nicht kantenerhaltend sein • Bestrafung durch zuweisen von Kosten bei Unterschieden • Suche Matching mit minimalen Kosten • Unterscheiden: • Optimale Inexakte Matchingalgorithem • Suboptimale Matchingalgorithmen
3.2.1 Matchingkosten • Fehlerkorrektur oder Fehlertoleranz • Zuweisung von Kosten für jeden Fehler (z.B. fehlender Knoten) • Vergleich der Graphen anhand der Kosten • Graphenbearbeitungskosten (GbK) • Zuweisung von Kosten für Graphenbearbeitungsoperationen • GbK = billigste Sequenz von Operationen zur Transformierung von G in G‘ • Graphenbearbeitungsabstand • Graphenbearbeitungskosten erfüllen gewisse Bedingungen • Operationen zur Transformierung als Maß für den Abstand zwischen Graphen • Graphabstand (nur für Algorithmen in metrischen Räumen) • Kostendefinition erfüllt Distanzfunktionseigenschaften • Kosten sind Maß für die Ungleichheit von Graphen
3.2.2 Optimale & Suboptimale inexakte Matchingalgorithmen • Optimale Inexakte Matchingalgorithmen • Finden immer globales Minimum, also auch exakte Lösung wenn vorhanden • Kommt mit Graphschwankungen zurecht • Kostenintensiver als Exakte Algorithmen • Eignen sich zur Lösung von Problemen wenn exakte Lösung erforderlich aber Graphschwankungen vorliegen • Suboptimale Matchingalgorithmen • Finden lokales Minimum • Keine Garantie exakte Lösung zu finden, wenn vorhanden • Normalerweise polynomielle Vergleichszeit • Eignen sich, wenn Rechenzeit gespart werden soll
3.2.3 Matchingmethoden • Baumsuche • Heuristische Abschätzung der Matchingkosten für verbleibende Knoten • Entfernen von unfruchtbaren Pfaden anhand Abschätzungen • Kontinuierliche Optimierung • Grundidee: • Graphmatching umwandeln in kontinuierliches, nichtlineares OP • Anwendung eines Optimierungsalgorithmus um Lösung zu finden • Rücktransformierung in Graphmatching Domäne • Polynomielle Rechenzeit (mit kleinem Exponenten) bzgl. Graphgröße • Spektralmethoden • Benutzt Eigenschaft, dass
4. Ullmanns Subgraphalgorithmus • Allgemeines • Einfacher Aufzählalgorithmus • Verbesserte Version • Eigenschaften
4.1 Allgemeines • Wahrscheinlich bekanntester Graphmatching Algorithmus • Anwendbar für • Subgraphisomorphismus • Graphisomorphismen • Graphmonomorphismen • MCS • Maximum Clique • Exakter DFS Baumsuchalgorithmus • Findet Subgraphisomorphismen zwischen zwei Graphen und
4. Ullmanns Subgraphalgorithmus • Allgemeines • Einfacher Aufzählalgorithmus • Verbesserte Version • Eigenschaften
4.2 Einfacher Aufzählungsalgorithmus • Benutzen Matrizen der Form: • Einträge bestehen aus 0 und 1 • Genau eine 1 in jeder Reihe • Nicht mehr als eine 1 pro Spalte • Matrizen dienen Zur Permutation von Adjazenzmatrizen • Permutationsmatrix • Falls , dann korrespondiert der j-te Knoten in zu dem i-ten Knoten in
4.2 Einfacher Aufzählungsalgorithmus (Beispiel Permutation) 1 2 4 3 1 3 2
4.2 Einfacher Aufzählungsalgorithmus • Vergleiche Resultierenden Graph mit • Isomorphismus vorhanden falls • Erstellung einer Startmatrix mit • Generierung aller mit durch systematisches umändern von 1en in 0en • Baum von Matrizen mit Terminierungsebene
4.2 Einfacher Aufzählungsalgorithmus (Generierung Startmatrix) 1 1 2 2 4 3 3
4.2 Einfacher Aufzählungsalgorithmus (Der Algorithmus) Step 2: Gibt es in aktueller Reihe eine 1, deren Spalte noch nicht verwendet wurde? Wenn ja, dann verwende diese Spalte Step 3: Suche ersten verwendbaren Spalteneintrag mit 1 und setze alle anderen Einträge der Zeile auf 0 Step 4: Falls Terminierungslevel erreicht, dann überprüfe ob Isomorphismus vorhanden Step 5: Überprüfe, ob es einen Eintrag weiter rechts in Matrix gibt, der 1 ist und verwendet werden kann Step 6: Speichere welche Zeile verwendet wurde und erhöhe die Zeilenanzahl um 1 Step 7: Backtracking Step 1: Initialisieren der Variablen, starten bei Initialmatrix und erster Zeile. Alle Spalten wurden noch nicht verwendet
4.2 Einfacher Aufzählungsalgorithmus (Beispiel) Step 4 Step 6 Step 7 Step 5 Step 1 Step 2 Step 3
4.2 Einfacher Aufzählungsalgorithmus (Beispiel) Vergleiche mit A 1 2 3 1 1 2 1 4 1 4 2 4 2 1 1 3 3 3 3 3 3 2 3 1 1 3 2
4.3 Verbesserte Prozedur • Wenn für alle Isomorphismen M‘ unter M gilt dann setze • Neue Bedingung: • Iteratives Testen bis keine 1 in 0 umgewandelt wird
4.3 Verbesserte Prozedur (Der Algorithmus) Step 1: Variablen aufsetzen Step 2 - 4: Nachbarn des i-ten Knoten suchen Step 5: nächster Matrixeintrag Step 6: Überprüfe ob Matrixeintrag 0 ist Step 7: Überprüfe ob Nachbar des i-ten Knotens auf einen Knoten gemappt werden kann. Step 8: Setze Eintrag auf 0 Step 9: Nächster Matrixeintrag und nächster Knoten j Step 10: Fehler, nächster Knoten i, neuer Durchlauf oder Erfolg
4.3 Verbesserte Prozedur (Anwendung) • Verbesserung durch Anwendung von
4.3 Verbesserte Prozedur (Anwendung) • i = 1 • j = 1 • sc = 1000 • lst = 3 • i = 1 • j = 1 • sc = 1000 • lst = 3 • h = 1 • i = 1 • j = 1 • sc = 1000 • lst = 3 • h = 1 • x = 3 • i = 1 • j = 1 • sc = 1000 • lst = 3 • h = 2 • x = 3 Step 1,2,3,4,5 Step 6 Step 7
4.3 Verbesserte Prozedur (Anwendung) • i = 1 • j = 2 • sc = 0100 • lst = 3 • h = 2 • x = 3 • i = 1 • j = 2 • sc = 0100 • lst = 3 • h = 1 • x = 3 Step 6 Step 7 Step 9 Step 8
4.2 Verbesserte Prozedur (Beispiel) Step 1 Step 2 Step 3 Step 4 Step 6 Step 7 Step 5
5. Zusammenfassung • Rechenintensiv, aber akzeptabel • Verschiedene Arten von Matching und Methoden • Vielfältige Anwendungsgebiete und Methoden (>170 Referenzen im zweiten Paper) • Für uns besonders RDF-Matching interessant