260 likes | 348 Views
Resource-Bounded Reasoning about Knowledge. On Epistemic Foundations of Intelligent Agents Ho Ngoc Duc. Überblick. Intelligente Agenten Wissen und Handlung Explizites Wissen Algorithmisches Wissen Ausblick. Intelligente Agenten.
E N D
Resource-Bounded Reasoning about Knowledge On Epistemic Foundations of Intelligent Agents Ho Ngoc Duc
Überblick • Intelligente Agenten • Wissen und Handlung • Explizites Wissen • Algorithmisches Wissen • Ausblick
Intelligente Agenten • „Agent“: nützliche Abstraktion für Konzeptualisierung verschiedener Bereiche • Agenten als intentionale Systeme • Modellierung mit Hilfe mentalistischer Begriffe: Belief, Desire, Intention, Obligation • Zusammenspiel zwischen Handlung und Wissen/Ziel/Intention • Am wichtigsten: epistemische Begriffe
Agententheorien • In allen wichtigen Ansätzen in der (D)AI Forschung: Wissen als Grundbegriff • In der Regel: Modalsysteme • Moore, Cohen & Levesque, Rao & Georgeff, Shoham, Singh, Meyer et.al.: KD45, S4, S5 • Andere Begriffe reduzierbar / gleiche Logik • Logische Allwissenheit (Logicalomniscience problem, LOP), Seiteneffekt-Problem
Probleme des Modalansatzes • Modallogik nicht geeignet: nur implizites Wissen. Nur explizites Wissen kann Handlung begründen: • Deduktive Wissensbasen • Optimale Tour (TSP) • Primzahl-Faktorisierung • Optimale (Gewinn-)Strategie in Schach • Ressourcenbeschränkte Agenten (resource-bounded agents): Agentenverfügen grundsätzlich nur über begrenzte Ressourcen
Alternativen zu modalen Systemen • Schwächere Kalküle als normale Modallogiken, schwächere Abgeschlossenheitsbedingungen (sonst keine Logik!) • Semantisch: Montague-Sem., unmögliche Welten • Syntaktisch: unvollständige Deduktionssysteme • Wann ist ein Schluß plausible? • Kein Nutzen für Agententheorien: entweder immer noch zu stark, also nicht explizites Wissen, oder zu schwach, dann irrationale Agenten
Was läuft schief? • Lösung des LOP liefert nicht automatisch ein Modell für expilizites Wissen • Ressourcenbeschränktheit: nicht Ungültigkeit bestimmter logischer Schlußregeln, sondern: die Häufigkeit ihrer Anwendung ist beschränkt • Nichtwissen nicht wegen Unkenntnis der Logik, sondern wegen fehlender Ressourcen (wenn er genug Zeit hätte...)
Meine Ziele • Framework für ressourcenbeschränktes Schliessen • Beziehung Wissen / Ressourcen • Primär: Solide epistemischeGrundlage für Theorien rationalerAgenten. • Nebenergebnis: intuitive Lösung des LOP: Nichtwissen von logischen Konsequenzen wegen fehlender Ressourcen, trotzdem rational
Explizites Wissen • Explizite Modellierung des Schliessens • Idee: alle Prämissen einer Schlußregel und Anwendung der Regel, dann Konklusion • Annahme: (R) p1... pn q • Modalansatz: Kp1... Kpn Kq • Realistisch: Kp1... Kpn<R>Kq • Bsp. Modus ponens: Kp K(p q) <MP>Kq • Bsp. Axiom: <Ax>K(~(p ~p))
Dynamische epistemische Logik • Gültige Regel – Atomare Aktion • Komplexe Aktionen der dynamischen Logik: R1;R2, R1R2, R* • Formeln: [R]Kp, <R>Kp (der Agent weiß p in allen/in einigen Zuständen nach der Ausführung der Aktion R) • Höhere Abstraktion: Hilfsaktion F=(R1 ... Rn)+ (ein „Denkvorgang“) – „ Agent weiß nach einigen Denkschriten, daß p“: <F>Kp
Dynamisch-epistemische Axiome • Kp K(p q) <F>Kq • <F>Kp, wobei p Tautologie • Nicht-Vergessen: Kp [F]Kp, p persistent • Ferner: K4 für <F> (S4: unechte Denkhandlung) • Intendierte Semantik: Baumstruktur. Übergang zwischen 2 Informationszuständen (Knoten) durch Denkhandlung. • <F>[F]p [F]<F>p interessant (Konfluenz)
Eigenschaften der D-E Systeme • Konsistenz • Adäquate Respräsentation vom expliziten Wissen • Alle Formen des LOP gelöst. Unter keiner logischen Schlußregel ist Wissen abgeschlossen. • Agenten trotzdem rational: wenn p q gültig, dann auch Kp <F>Kq • Mit Konfluenz: Eingeschränkte Korrespondenz: <F>Kp is D-E-Theorem gdw Kp ist M-E-Theorem
Explizites Wissen nicht genug • Quantitative Constraints: keine WANN Angabe • Unterscheidung einfache / komplexe Folgerung • Zu restriktiv: Wissen, das innerhalb von 1 h gewonnen werden kann, kann auch Handlungen begründen • Stärkere Beziehungen zwischen epist. Aussagen: wenn q aus p folgt, kann aus Kp nur <F>Kq gewonnen werden (in irgendeiner Historie...). Wir brauchen: in der realen Historie, 1 h von nun
Quantifizierung von Ressourcen • Naheliegend: Ktp Kt+1q, wenn q in einem Schritt aus p herleitbar • Schwachpunkt: unendlich viele Konsequenzen in einem einzigen Schritt, sehr lange Iteration, q nicht zuverlässig herleitbar wenn nötig • Andere Möglichkeit: nicht spezifizierte Quantität von Ressourcen angenommen. Wissen = positive Antwort, bevor alles verbraucht • Zu vage, kein objektives Kriterium
Algorithmisches Wissen: Motivation • Schachspieler hat noch keine Gewinnstrategie, kann sie innerhalb von 5 min berechnen, hat 10 min für nächsten Zug • Internet-Einkauf: verschlüsselte Nummer, mit Privatschlüssel: 1 s, Abhörer mit öffentlichem Schlüssel: Millionen Jahre • Was kann ich zuverlässig innerhalb 1h berechnen? • K50p: „Wenn mit Frage p? konfrontiert, liefert zuverlässig Anwort innerhalb von 50 s“
Beispiel • Abkürzung: Dnp := (p Knp)&(~p Kn~p) • Atomare Aussagen: Pn, n natürliche Zahl • Axiome: AL, {Pn|n Primzahl},{~Pn|n keine Primzahl}. Also: Theorie d. Primzahlen • Komplexität: f(n)=n½*||n||2 • Interessante epistemische Aussagen: Df(n)Pn, Df(i)q, Kb||n||Da||n||Pn, Ka||n||Kb||n||Daf(n)Pn
Sprache für Algorithmisches Wissen • Zunächst die Ressource Zeit • Syntax: Basissprache, erweitert um Operatoren Kn • Knp besagt: (1) p folgt aus der Gesamtheit dessen was Agent weiß; (2) Agent hat einen Algorithmus, um diese Beziehung herzustellen und kann diesen bei Anfrage p wählen; (3) Stop nach n Schritten • Es gibt Algorithmen mit unbekannter Komplexität und Aufzählungsalgorithmen. Deshalb: K. Bedeutung: (3‘) Stop irgendwann
Axiome für Algorithmisches Wissen • System K für K (gleiche Logik wie Modalsystem. Interpretation anders, andere Begründung) • Einbettungsresultat • Knp Kp, Knp Kmp, wenn n<m • Df(p)p, Kb||p||Daf(p)p, (Kx||p||)*Daf(p)p wenn p zu einer Teilsprache gehört, die entscheidbar ist mit Komplexität f • Wenn untere Grenze bekannt: negatives Wissen ~Kg(p)p (erst recht wenn p kein implizites Wissen)
Logik des Algorithmischen Wissens • Es gibt nicht „die“ Logik des algorithm. Wissens • Meta-Regel zur Modellierung des Wissens über bestimmte Weltausschnitte • Wenn Algorithmen für Teilbereich anwendbar, dann können epistemische Aussagen angenommen werden • Neutral gegenüber Komplexitätsmaßen
Anwendungsbeispiel • RSA Public-Key Kryptographie • Grundlage: Wissen über Primzahlen. Großer Unterschied zwischen dem Wissen, daß p (k)eine Primzahl ist und der Kenntnis einer Faktorisierung • Kpt(n)x,y(n=x*y & x>1 & y>1) • x,yKfr(n)(n=x*y & x>1 & y>1) • ~x,yK100...00(n=x*y & x>1 & y>1) (100...00: Ablauf d. Gültigkeit / Nützlichkeit d. Information)
Semantik • Evaluierung von Wissensaussagen nur mit Hilfe algebraischer Eigentschaften der Modelle à la Mögliche-Welten kaum möglich. • Computationale Semantik: Abbildung Formeln der Sprache auf Algorithmen, Knp wahr gdw ein Algorithmus für p existiert und n Schritte verlangt • Scheint viel versprechender. Verlangt mehr Verständnis der Algorithmen
Ausblick • Wissen & probabilistische Algorithmen: n ist „probably prime“ mit Wahrscheinlichkeit 1-2-20 wenn n den Rabin-Test 10 mal besteht. Nicht: Pn ist zu 99,99...% wahr, sondern epistemische Aussage (p ist entweder eine Primzahl oder nicht) • Wie ändern sich Denkkapazitäten über Zeit? Kann aus Ktnp auf Kt+1np geschlossen werden? • Anwendung in der Spieltheorie
Weitere Beispiele • AL-Sprache mit Operator T und zus. Axiomen: {Tp|p Tautologie}, {~Tp|p keine Tautologie} • Alle Queries Tp entscheidbar in Zeit 2||p|| • TSP: n Punkte aus einer Menge. 2 Prädikate (oder Operatoren) Opt und NearOpt. Epistem. Axiome: Kn!Opt(...), Kn*||n||NearOpt(...)
Ausblick 2 • Technische Untersuchung: kein Schwerpunkt. Zuerst: Begriffe einführen, Intuitionen erläutern, Anwendungsbeispiele (warum nicht vorhandene?) • Vollständigkeit nur mit formaler Semantik • Komplexität: abhängig von Algorithmen zur Berechnung des Wissens. Verhältnis offen.
Ressource-Boundedness • Allgemein: Problemlösung mit begrenzten Mitteln • Speziell: Denkprobleme. Was kann man wissen? Was folgt aus vorhandenem Wissen unter R-B? • Bisherige Ansätze: Regeln unzulässig; Beweise der Länge <5; endliche Automaten. Alle: willkürliche Einschränkung der Rationalität • Mein Ansatz: Ressourcenraum (Nk,). Jede Dimension ein Typ von relevanten Ressourcen (Zeit, Gedächnis, Bandbreite)
Prädikatenlogik • Straightforward: ganz allgemein logische Folgebeziehung. Was sind die stärksten epist. Aussagen über log. Konsequenzen d. Wissens? • Keine wesentl. Einsichten zum Wissensbegriff • Viel stärkere Ausdruckfähigkeit: Wissen-was • Kpt(n)x,y(n=x*y & x>1 & y>1) (...dass n prim) • x,yKfr(n)(n=x*y & x>1 & y>1) (eine Faktorisierg) • pt(n)<<fr(n): Public-Key Kryptographie