240 likes | 359 Views
Parametrisierte DCGs. Prolog Grundkurs WS 99/00 Christof Rumpf rumpf@uni-duesseldorf.de. Kontextfreie Sprachen. DCGs ohne Parameter entsprechen den kontextfreien Grammtiken der Chomsky-Hierarchie. Die folgende DCG erkennt die kontextfreie Sprache a n b n , n 0 :. s --> [].
E N D
Parametrisierte DCGs Prolog Grundkurs WS 99/00 Christof Rumpf rumpf@uni-duesseldorf.de
Kontextfreie Sprachen • DCGs ohne Parameter entsprechen den kontextfreien Grammtiken der Chomsky-Hierarchie. • Die folgende DCG erkennt die kontextfreie Sprache anbn , n 0: s --> []. s --> [a], s, [b]. GK Prolog - Parametrisierte DCGs
Reguläre Sprachen • Durch Beschränkung der Regeln auf die Form • VN × VTVN VN × VT • kann man mit DCGs reguläre Grammatiken schreiben. Die folgende DCG erkennt die reguläre Sprache a*b*: s --> []. s --> [a], s. s --> [b], b. b --> []. b --> [b], b. GK Prolog - Parametrisierte DCGs
Kontextsensitive Sprachen • Parametrisierte DCGs sind in der Lage, kontext-sensitive Sprachen zu erkennen. Die folgende DCG erkennt die kontextsensitive Sprache anbncn, n 0: s --> a(I), b(I), c(I). a(i) --> []. a(i(I)) --> [a], a(I). b(i) --> []. b(i(I)) --> [b], b(I). c(i) --> []. c(i(I)) --> [c], c(I). GK Prolog - Parametrisierte DCGs
Rekursiv aufzählbare Sprachen • Mit parametrisierten DCGs können selbst rekursiv aufzählbare Sprachen erkannt werden. Zum Beweis implementiere man eine allgemeine Turing-Maschine mit einer DCG. • Repräsentiere • Zustände als Konstituenten • Band als Listen-Parameter GK Prolog - Parametrisierte DCGs
Schweitzerdeutsch • Das Schweizerdeutsche zeigt sogenannte kreuzserielle Abhängigkeiten zwischen Verben und NPs, die den kontextfreien Rahmen sprengen. • Claudia Helmut Eva Hans Ulrike watched let help make work. • NP1 NP2 NP3 NP4 NP5 V1 V2 V3 V4 V5 • Claudia beobachtete, wie Helmut Eva Hans helfen ließ, Ulrike zum arbeiten zu bringen. • Sortiert nach akk/dat-Zuweisung: GK Prolog - Parametrisierte DCGs
Generierung von Syntaxbäumen • Zusätzliche Argumente von DCGs können verwendet werden, um beim Parsen einer Kette den entsprechenden Ableitungsbaum zu erzeugen. • ?- s(T,[paul,klaut,bananen],[]). • T = s(np(paul),vp(v(klaut),np(bananen))) • yes GK Prolog - Parametrisierte DCGs
Baum als Struktur • s(s(NP,VP)) --> • np(NP,Num), vp(VP,Num). • vp(vp(V,NP),Num) --> • v(V,Num), np(NP,_). • v(v(klaut), sg) --> [klaut]. • v(v(klauen), pl) --> [klauen]. • np(np(paul), sg) --> [paul]. • np(np(bananen),pl) --> [bananen]. GK Prolog - Parametrisierte DCGs
Baum als Liste • s([s,NP,VP]) --> • np(NP,Num), vp(VP,Num). • vp([vp,V,NP],Num) --> • v(V,Num), np(NP,_). • v([v,[klaut]], sg) --> [klaut]. • v([v,[klauen]], pl) --> [klauen]. • np([np,[paul]], sg) --> [paul]. • np([np,[bananen]],pl) --> [bananen]. GK Prolog - Parametrisierte DCGs
Parsen mit Baum-Ausgabe • Eine DCG mit Syntaxbaumgenerierung kann mit einem Pretty-Printer gekoppelt werden, um einen Parser mit Ausgabe zu erhalten. • parse(Sentence):- • s(Tree,Sentence,[]), • pp(Tree). GK Prolog - Parametrisierte DCGs
Verarbeitung von Testsätzen • Zum Testen einer Grammatik wird oft eine Menge von Testsätzen benötigt, die man am besten als Fakten in der Datenbasis ablegt. • ex(1,[maria,sieht,den,mann]). • ex(2,[maria,sieht,dem,mann]). • ex(3,... • test(N):- • ex(N,S), write(S), nl, • parse(S). GK Prolog - Parametrisierte DCGs
Testen von Teilphrasen • Eine Grammatik besteht neben dem Lexikon aus einer Menge von Phrasenstrukturregeln. Bei der Grammtikentwicklung ist es oft sinnvoll, die Regeln für Teilphrasen gezielt zu testen, bevor man ganze Sätze parst. Dadurch werden Fehler i.d.R. viel schneller gefunden. • ?- pp([mit,dem,teleskop],[]). GK Prolog - Parametrisierte DCGs
Metavariablen • Weder unser parse/1 noch test/1 sind geeignet, um Teilphrasen zu verarbeiten. Lösung: Aufruf der DCG über Metavariablen mit dem eingebauten Prädikat call/1. • ex(1,s([maria,sieht,den,mann],[])). • ex(2,pp([im,park],[])). • ex(3,... • test(N):- • ex(N,G), write(G), nl, call(G). GK Prolog - Parametrisierte DCGs
Analyse vs. Generierung • Der Aufruf eines Parsers mit einer gegebenen Kette setzt einen Analyseprozeß in Gang. Das Ergebnis der Analyse ist ein Grammatikalitäts-urteil über die Kette bezüglich der Grammatik. • Der Aufruf eines Parsers mit einer Variablen bewirkt die Generierung von grammatischen Ketten (bezüglich der Grammatik!). GK Prolog - Parametrisierte DCGs
Korrektheit und Vollständigkeit • Korrektheit und Vollständigkeit von Grammatiken versucht man durch Testen zu ermitteln. Dazu analysiert man eine Menge geeigneter Testsätze, die auch ungrammatische Sätze enthalten sollte, bzw. generiert Sätze und beurteilt deren Grammatikalität. • Korrektheit: Es werden nur grammatische Ketten analysiert/generiert. • Vollständigkeit: Es werden alle grammatischen Ketten analysiert/generiert. GK Prolog - Parametrisierte DCGs
Generierung rekursiver Phrasen • Rekursive Regeln können beliebig lange Ketten generieren. Beim Testen von Grammatiken auf generative Kapazität bereitet das top-down depth-first-Verfahren des Interpreters Probleme, da die erste Ableitung beliebig oft iteriert wird und Alternativen unberücksichtigt bleiben. • Maria sieht den Mann im Park im Park im Park im Park im Park im Park ... GK Prolog - Parametrisierte DCGs
Beschränkung der Kettenlänge • Durch die Bindung einer Kette an eine Liste definiter Länge kann die Generierung redundanter Iterationen vermieden werden. • ?- S = [_,_,_,_,_,_,_,_,_], s(S,[]). • S=[maria,sieht,den,mann,im,park,mit,dem,teleskop]->; • S=[maria,sieht,den,mann,mit,dem,teleskop,im,park]->; • S=[maria,mit,dem,teleskop,sieht,den,mann,im,park]->; • ... GK Prolog - Parametrisierte DCGs
Generierung von Listen • Die Generierung von Listen definiter Länge kann automatisiert und für einen „Phrasengenerator“ verwendet werden. • genlist(0,[]). • genlist(N,[_|T]):- • N > 0, M is N-1, genlist(M,T). • generate(N):- genlist(N,S), parse(S). GK Prolog - Parametrisierte DCGs
Fail-Loop • Mit Hilfe eines Fail-Loops kann ein Generator definiert werden, der alle Phrasen einer festen Länge ohne Benutzerinteraktion generiert und ausgibt. • generateall(N):- • genlist(N,S), s(S,[]), write(S), nl, fail. • generateall(_). GK Prolog - Parametrisierte DCGs
Zählschleife • Mit einer Zählschleife definieren wir einen Generator, der alle Phrasen ausgibt, deren Länge in einem gegebenen Intervall liegt. • generateall(Max,Max):- generateall(Max). • generateall(N,Max):- • N < Max, M is N+1, • generateall(N), • generateall(M,Max). GK Prolog - Parametrisierte DCGs
Pretty-Printer für Ketten • Unser Generator kann noch etwas attraktiver gestalten werden, indem eine Ausgabe der Ketten ohne Listenklammern und Kommata eingebaut wird. • print_phrase([]):- nl. • print_phrase([Word|Words]):- • tab(1),write(Word), print_phrase(Words). • ?- print_phrase([maria,sieht,den,mann]). • maria sieht den mann GK Prolog - Parametrisierte DCGs
Dateiausgabe • Die Ausgabe komplexer Syntaxbäume oder größerer Mengen von generierten Sätzen läßt den Bildschirm des Arity\Prolog-Interpreters als ungeignetes Ausgabemedium erscheinen, da man nicht zurückblättern kann. Auch möchte man manchmal Programm-Ausgaben dauerhaft dokumentieren. Dazu benötigen wir Mittel, um eine Ausgabe in eine Datei umzuleiten. GK Prolog - Parametrisierte DCGs
tell/1 und told/0 • Das eingebaute Prädikat tell/1 öffnet eine Datei und setzt einen Zeiger auf den Dateianfang. Der Dateiname muß als atomares Argument spezifiziert sein. • Das eingebaute Prädikat told/0 schließt die Datei, die als letztes geöffnet wurde. Wird told/0 nach einem Aufruf von tell/1 nicht ausgeführt, stürzt Prolog ab. GK Prolog - Parametrisierte DCGs
file_output/2 • Das Prädikat file_output/2 leitet alle Ausgaben in eine Datei File um, die während der Ableitung eines Aufrufs Goal erfolgen. • file_output(File,Goal):- • tell(File), • (call(Goal) ; true), • told. GK Prolog - Parametrisierte DCGs