200 likes | 571 Views
A. B. C. Bayes‘sche Netzwerke. Einsatz Bayes‘scher Netzwerke zur Identifikation von Kundenwünschen. Inhaltsübersicht - Rohfassung. Problemstellung Grundlagen der Wahrscheinlichkeitsrechnung Unbedingte / Bedingte Wahrscheinlichkeiten Totale Wahrscheinlichkeit / Bayes‘scher Satz
E N D
A B C Bayes‘sche Netzwerke Einsatz Bayes‘scher Netzwerke zur Identifikation von Kundenwünschen
Inhaltsübersicht - Rohfassung • Problemstellung • Grundlagen der Wahrscheinlichkeitsrechnung • Unbedingte / Bedingte Wahrscheinlichkeiten • Totale Wahrscheinlichkeit / Bayes‘scher Satz • Kleines Rechenbeispiel „Interview“ • Bayes‘sche Netzwerke • Geschichtliches • Was ist ein Bayes‘sches Netzwerk / Definition • Netzwerkbeispiele • Evidenzen • D-Separation • Kettenregel für Bayes‘sche Netzwerke • Beispielrechnung „Startproblem“ • Bucket Elimination • Einsatzgebiete • Allgemein • Identifikation von Kundenwünschen bei Daimler-Benz • Bewertung • Das Programm „Bayesware“ • Quellenangabe
Grundlagen - Unbedingte/Bedingte WSK • Unbedingte Wahrscheinlichkeit: P(A) • Bedingte Wahrscheinlichkeit: P(B|A) • Bezeichnet die Wahrscheinlichkeit des Ereignisses B unter der Bedingung, dass A bereits eingetreten ist • Es gelten folgende Rechenregeln: • Allgemeiner Multiplikationssatz für 2 Ereignisse: • Allgemeiner Multiplikationssatz für n Ereignisse:
Grundlagen – Totale WSK / BayesSatz • Formel der totalen Wahrscheinlichkeit: • Der Bayes‘sche Satz:
Grundlagen - Beispielaufgabe 3 Fahrzeuge der Gruppe I (Auto I) mit je 2 männlichen und 2 weiblichen Personen und 2 Fahrzeugen der Gruppe II (Auto II) mit je 1 männlichen und 2 weiblichen Personen stehen zur Verfügung. a) Es wird ein Fahrzeug ausgewählt und daraus eine Person befragt, subjektive Bevorzugung ausgeschlossen. Man ermittle die Wahrscheinlichkeit, dass die befragte Person eine Frau ist. b) Wie groß ist im Fall der Wahl einer weiblichen Person die Wahrscheinlichkeit, dass diese aus einem Fahrzeug der Gruppe II stammt. a) Formel der totalen Wahrscheinlichkeit: b) Bayes‘scher Satz:
Kettenregel für Bayes‘sche Netzwerke Sei BN ein Bayes‘sches Netzwerk über (vollständiges Ereignissystem). Dann ist die Verbundwahrscheinlichkeitsverteilung P(U) das Produkt aller in BN spezifizierten Potentiale. ist die Menge aller Elternknoten von .
Bayes‘sche Netze - Geschichtliches • Thomas Bayes, ein Priester, schuf mit seinem Werk: „An essay towards solving a problem in the doctrine of chances„ 1763 die Grundlagen • Die Konzepte für die heutige Bayes‘schen Netze (kausale Netzwerke, d-connection, d-separation) kann man auf Judea Pearl zurückführen • In der ersten Hälfte der 1980er wurden Bayes‘sche Netze in das Feld der Expertensysteme eingeführt • Erst am Ende der 1980er existieren erste Real-World-Anwendungen Thomas Bayes 1702-1761
Bayes‘sche Netze - Definition • Werden auch als bayesian belief networks, probabilistic networks, causal networks oder als kausalprobabilistische Netze bezeichnet • Bestehen aus einer Menge von Zufallsvariablen und gerichteten Kanten zwischen den Variablen, die zusammen einen gerichteten azyklischen Graphen (DAG) bilden • Jede Variable hat eine endliche Anzahl von sich gegenseitig ausschließenden Zuständen • Jeder Knoten hat eine Tabelle mit den bedingten Wahrscheinlichkeiten (CPT), die den Einfluss der Elternknoten quantifizieren
Bayes‘sches Netz - Struktur I Ohne Tabellen der bedingten Wahrscheinlichkeiten a) b)
Bayes‘sches Netz II Mit Tabellen der bedingten Wahrscheinlichkeiten P ( Zündkerzen ) P ( Treibstoff? ) P ( Tankanzeige | Treibstoff? ) P ( Startet | Treibstoff? , Zündkerzen )
D-Separation - Begriff / Definition D-Separation erlaubt eine allgemeine Aussage darüber, ob eine Knotenmenge X unabhängig von einer Knotenmenge Y ist, gegeben eine Evidenzknotenmenge E. • Zwei verschiedene Variablen X und Y sind d-separated (direction-dependent-separated), falls auf allen Pfaden zwischen X und Y eine Variable Z existiert, so dass entweder ... • die Verbindung serial oder diverging und Z ein Evidenzknoten ist oder … • die Verbindung converging und weder Z noch Z‘s Nachfahren Evidenzknoten sind • Sind zwei Knoten nicht d-separated, werden sie auch als d-connected bezeichnet
Z Z Z X Y D-Separation - Fallüberblick Folgende drei Verbindungsarten existieren: (1) Serial Connection (2) Diverging Connection (3) Converging Connection
D-Separation - Beispiel A F C G H B D E • Wahre Aussagen: • F d-separated von H bei geg. G • F d-separated von E bei geg. C • A d-separated von B • Falsche Aussagen: • C d-separated von G bei geg. F • A d-separated von B bei geg. D • D d-separated von F bei geg. C, G
Bayes‘sche Netze - Einsatzgebiete • Medizinische Diagnose (größter Bereich), Erlernen eines Grundrisses oder einer Sprache und als Grundlage für die heuristischen Suche • Die ersten wirklichen Anwendungen in denen Bayes‘sche Netze eingesetzt wurden: • MUNIN (Andreassen 1989) – dient zur Diagnose von neuromuskulären Krankheiten • PATHFINDER (Heckermann 1992) – deckt ca. 60 Lymphknotenkrankheiten und 100 Symptome und Testergebnisse ab
Bayes‘sche Netze - Bewertung • Vorteile: • Kann sehr gut zur Darstellung von unsicherem Wissens genutzt werden • Nachteile: • Woher weiß man die Wahrscheinlichkeiten? • Von Experten schätzen lassen (unsicher!) • Netz mit Testdaten trainieren