Formale Sprachen Teil 3

Formale SprachenTeil 3 Klaus Becker 2006

Syntax und Semantik

Teil 1 Mini-Programmiersprache

Zielsetzung Ziel ist es, für eine einfache Programmiersprache einen Interpreter und einen Compiler zu entwickeln. Die hier betrachtete Programmiersprache orientiert sich an der Sprache zur Steuerung des Roboters Karol. hinlegenschrittwiederhole solange NichtIstZiegel wiederhole solange NichtIstWand schritt *wiederhole linksDrehen*wiederhole

Die Programmiersprache Zur Vereinfachung der Darstellung verwenden wir abkürzende Bezeichner für die Anweisungen der Programmiersprache. h swh nz wh nw s *wh l*wh hinlegenschrittwiederhole solange NichtIstZiegel wiederhole solange NichtIstWand schritt *wiederhole linksDrehen*wiederhole

Die Programmiersprache MyKa Elementare Anweisungen:h „Ziegel hinlegen“a „Ziegel aufheben“s „Schritt vorwärts“l „links drehen“r „rechts drehen“ h swh nz wh nw s *wh l*wh Elementare Bedingungen:nz „nicht auf Ziegel“nw „nicht vor Wand“ Kontrollanweisung:wh ... ... „wiederhole solange ...“ *wh Ein MyKa-Programm setzt sich – wie im Beispiel gezeigt – aus elementaren und Kontrollanweisungen zusammen. Bei der Darstellung von MyKa-Programmen dürfen mehrere Anweisungen in eine Zeile geschrieben werden, ...

Zweistufige Sprachbeschreibung Oft ist es sinnvoll, eine formale Sprache zweistufig festzulegen: Zeichen: Zeilenumbruch Zeilenumbruch {ASCII: a, b, c, ..., ´*´, ´ ´, chr(13), chr(10), ...} Alphabet für Token Festlegung der korrekten Token (Wörter) Sprache der Token Wörter / Token: {h, a, s, l, r, nz, nw, wh, *wh} Alphabet für Programme Festlegung der korrekten Tokenfolgen (Sätze) Sprache der Programme Sätze / Tokenfolgen: {h s wh nz wh nw s *wh l *wh , ...}

Eine Grammatik für MyKa ! Terminalsymbole S = s L = l R = r H = h A = a NW = n w NZ = n z WHA = w h WHE = '*' w h ... MyKa1.grm ... "Start Symbol" = <Programm> ! Produktionen <Programm> ::= <Anweisungsfolge> <Anweisungsfolge> ::= <Anweisung> <Anweisungsfolge> ::= <Anweisung> <Anweisungsfolge> <Bedingung> ::= NW <Bedingung> ::= NZ <Anweisung> ::= S <Anweisung> ::= L <Anweisung> ::= R <Anweisung> ::= H <Anweisung> ::= A <Anweisung> ::= WHA <Bedingung> <Anweisungsfolge> WHE

Aufgabe Starten Sie das Werkzeug „GOLD Parser Builder“ und laden Sie die Datei „MyKa1.grm“. Testen Sie die hier vorgegebene Grammatik zur präzisen Festlegung der Programmiersprache MyKa.

Es fehlt die Semantik Bisher wurde nur die Syntax der Sprache MyKa festgelegt. Die Bedeutung der einzelnen Sprachelemente scheint klar zu sein. Aber ist das wirklich so? Bereits bei der elementaren Anweisung „h“ ist nicht klar, wie viele Ziegel hingelegt werde, ob der / die Ziegel in die Zelle, in der sich der Roboter befindet, gelegt werden, oder in die vor dem Roboter usw. . Ziel ist es im Folgenden, auch die Semantik der Programmiersprache exakt zu beschreiben. Zwei Ansätze sollen hierzu vorgestellt werden: Zum einen soll die Bedeutung der Konstrukte der Sprache MyKa durch das Verhalten eines Interpreters festgelegt werden (Interpreteransatz). Zum anderen soll die Bedeutung von Konstrukten der Sprache MyKa auf die Bedeutung der Konstrukte einer anderen (bereits bekannten) Sprache zurückgeführt werden (Übersetzeransatz). Letztlich werden hier somit ein Interpreter und ein Übersetzer (Compiler) für die Programmiersprache MyKa entwickelt. Zur syntaktischen Vorbereitung werden zudem ein Scanner und ein Parser für diese Sprache benutzt.

Teil 2 Scanner und Parser

Syntaxanalyse Zur Analyse der Syntax der Sprache MyKa sollen im Folgenden ein Scanner und ein Parser entwickelt werden. Nach der Syntaxanalyse soll feststehen, ob eine vorgegebene Zeichenfolge ein syntaktisch korrektes MyKa-Programm darstellt. h swh nz wh nw s *wh l*wh

Scanner Aufgabe eines Scanners ist es, aus einer Zeichenfolge lexikalische Einheiten zu bilden und diese als Tokenfolge aufzubereiten. h swh nz wh nw s *wh l*wh Scanner Scanner-Automat h s wh nz wh nw s *wh l *wh

Scanner-Automat Der Scanner benutzt einen endlichen Automaten zur Erkennung der lexikalischen Einheiten. q1 zw q2 ´ ´; chr(13); chr(10) h w n q3 w * s; l; r; h; a ´ ´; chr(13) q0 q10 q20 Immer dann, wenn der Endzustand erreicht wird, ist ein Token erkannt. Danach beginnt der Scanner seine Arbeit wieder im Anfangszustand. q30 Fehlerzustand

Parser Aufgabe eines Parsers ist es, eine Tokenfolge auf syntaktische Korrektheit zu analysieren (und evtl. die Tokenfolge geeignet aufzubereiten). h s wh nz wh nw s *wh l *wh Parser Parser-Automat Ok!

Parser-Automat Der Parser benutzt einen Kellerautomaten zur syntaktischen Analyse der Tokenfolge. Oberstes Kellerzeichen / Eingabezeichen: Kelleroperation any / s : any / l :any / r : any / h :any / a :wh / *wh : pop Der Kellerautomaten akzeptiert eine Zeichenfolge, wenn der Automat nach Abarbeitung der Zeichenfolge im Enzustand ist und wenn zudem der Keller leer ist. q1 any / wh : push wh any / s : any / l :any / r : any / h :any / a :any / wh :any / *wh : any / nz : any / nw : q0 else / *wh : any / nz :any / nw : q2 Fehlerzustand

Aufgabe Testen Sie den implementierten Scanner. Schauen Sie sich die Implementierung an. Berücksichtigen Sie beim Scanner-Automaten zusätzlich folgende Kontrollanweisung: if <Bed.> th <Anw.> el <Anw.> *if Ergänzen Sie die Implementierung des Scanner-Automaten entsprechend und testen Sie den erweiterten Scanner.

Aufgabe Testen Sie den implementierten Parser. Schauen Sie sich die Implementierung an. Berücksichtigen Sie beim Parser-Automaten zusätzlich folgende Kontrollanweisung: if <Bed.> th <Anw.> el <Anw.> *if Ergänzen Sie die Implementierung des Parser-Automaten entsprechend und testen Sie den erweiterten Parser.

Teil 3 Ein Programm-Interpreter

Interpreter Ein Interpreter führt die Anweisungen Schritt für Schritt aus. Er beschreibt damit das Verhalten der jeweiligen Anweisungen. Eine präzise Interpreter-beschreibung kann somit zur Festlegung der Semantik der Elemente der Programmier-sprache benutzt werden (Interpreter-Semantik). h s wh nz wh nw s *wh l *wh Zustand vorher: abzuarbeitendes Programm; Roboterwelt Zustand nachher: abzuarbeitendes Programm; Roboterwelt

Ausführungstransformationen 1 wahr h s wh nz wh nw s *wh l *wh wh nzwh nw s *wh l*wh 1 s wh nz wh nw s *wh l *wh wh nws *whl wh nz wh nw s ... ...

Ausführungstransformationen 1 1 wahr wahr wh nws*whl wh nz wh nw s ... wh nws*whl wh nz wh nw s ... 1 1 s wh nw s *whl wh nz wh nw s ... s wh nw s *whl wh nz wh nw s ... ...

Ausführungstransformationen 1 1 falsch wahr wh nws*whl wh nz wh nw s ... wh nz wh nw s *wh l *wh 1 1 l wh nz wh nw s *wh l *wh wh nws *whl wh nz wh nw s ... ...

Transformationsregeln Vor der Wand s ... s ... ... ...

Transformationsregeln Anzahl: n h ... h ... Anzahl: n+1 ... ...

Transformationsregeln wahr falsch wh <K> *wh ... wh <K> *wh ... <K> wh <K> *wh ... ...

Semantikfestlegung mit Regeln Das Verhalten des Interpreters wird hier präzise mit Hilfe von Transformationsregeln festgelegt. Diese bilden somit die Grundlage für eine Implementierung des Interpreters. s ... Solange d. Restprogramm-Stapel nicht leer ist wende die zum obersten Stapelelement passende Transformationsregel an ...

Aufgabe Testen Sie den implementierten Interpreter. Schauen Sie sich die Implementierung an. Entwerfen Sie Transformationsregeln, die die Ausführung der folgenden Kontrollanweisung beschreiben: if <Bed.> th <Anw.> el <Anw.> *if Ergänzen Sie die Implementierung des Interpreters entsprechend der Transformationsregeln.

Teil 4 Ein Programm-Übersetzer

Übersetzer Ein Übersetzer transformiert Programme der Ausgangs-Programmiersprache (Quellsprache) in eine andere Sprache (Zielsprache). Eine präzise Übersetzer-beschreibung kann zur Festlegung der Semantik der Elemente der Ausgangs-Programmiersprache benutzt werden, sofern die Semantik der Zielsprache klar ist (Übersetzer-Semantik). h s wh nz wh nw s *wh l *wh Zustand vorher: abzuarbeitendes Programm; Roboterwelt Zustand nachher: abzuarbeitendes Programm; Roboterwelt h s nz 10 nw 8 s 4 l 2

Von der Quell- zur Zielsprache h s wh nz wh nw s *wh l *wh h s nz 10 nw 8 s 4 l 2 h s wh nz wh nw s *wh l *wh Die Quellsprache MyKa verfügt über die Kontrollstruktur wh ... *wh zur Ausführung von Wiederholungen. Die Zielsprache soll solche Wiederholungen durch GOTO-Sprünge ersetzen. 0 h 1 s 2 falsch nz? 3 wahr 4 falsch nw? 5 wahr 6 s 4 8 l 9 10

Von der Quell- zur Zielsprache h s wh nz wh nw s *wh l *wh h s nz 10 nw 8 s 4 l 2 h s wh nz wh nw s *wh l *wh 0: h 1: s 2: nz? 3: f: goto 10 4: w: nw? 5: f: goto 8 6: w: s 7: goto 4 8: l 9: goto 210: stop 0: h 1: s 2: nz 3: 10 4: nw 5: 8 6: s 7: 4 8: l 9: 210: 0 h 1 s 2 falsch nz? 3 wahr 4 falsch nw? 5 wahr 6 s h s nz 10 nw 8 s 4 l 20 1 2 3 4 5 6 7 8 9 4 8 l GOTO-Programme werden in verkürzter Form als Folge von Token (siehe oben) dargestellt. 9 10

Übersetzungsvorgang im Detail h s wh nz wh nw s *wh l *wh wh nz wh nw s *wh l *wh 0 2 h s s wh nz wh nw s *wh l *wh nz wh nw s *wh l *wh 1 2 2 h h s ...

Übersetzungsvorgang im Detail nz wh nw s *wh l *wh nw s *wh l *wh 2 2 4 4 2 h s h s nz * wh nw s *wh l *wh s *wh l *wh 4 2 6 4 2 h s nz * h s nz * nw * ...

Übersetzungsvorgang im Detail s *wh l *wh l *wh 6 4 2 8 2 h s nz * nw * h s nz * nw 8 s 4 *wh l *wh *wh 7 4 2 9 2 h s nz * nw * s h s nz * nw 8 s 4 l ...

Übersetzungsvorgang im Detail *wh 9 2 h s nz * nw 8 s 4 l 10 h s nz 10 nw 8 s 4 l 2

Transformationsregeln Quellcode Das Verhalten des Übersetzers kann präzise mit Hilfe von Transformationsregeln festgelegt werden. s ... i ... ... Solange die Quellcode-Schlange nicht leer ist wende die passende Transformationsregel an Zielcode Markenzähler Hilfsstapel für Rücksprungmarken ... i+1 ... Diese bilden dann die Grundlage für eine Implementierung des Übersetzers. ... s

Regel für eine elementare Anweisung Eine elementare Anweisung wird direkt in die Code-Schlange übernommen. Der Markenzähler wird um 1 erhöht. s ... i ... ... ... i+1 ... ... s

Regel für die Wiederhole-Anweisung Die aktuelle Markennummer wird zur späteren Festlegung der Rücksprungadresse in einem Hilfsstapel zwischengespeichert. wh ... i ... ... ... i i ... ...

Regel für die Wiederhole-Anweisung Die Bedingung wird in die Code-Schlange übernommen. Zusätzlich wird ein Platzhalter (hier *) übernommen, der später mit einer Marke für einen Vorwärtssprung ersetzt wird. Hiermit soll ein Sprung aus der Schleife ermöglicht werden, wenn die Bedingung nicht erfüllt ist. Des weiteren wird der Markenzähler um 2 erhöht. Hiermit soll ein Sprung zur ersten Anweisung innerhalb der Schleife ermöglicht werden, sofern die Bedingung erfüllt ist. ... i ... ... ... i+2 ... ... *

Regel für das Ende einer Wiederholung Die auf einem Hilfsstapel abgelegte Rücksprungmarke wird in die Codeschlange übernommen. Zusätzlich wird das letzte * in der Codeschlange durch den neuen Markenzähler ersetzt. Hierdurch wird der Sprung „aus der Schleife“ realisiert. *wh ... i k ... ... * … ... i+1 ... ... i+1 … k

Aufgabe Testen Sie den implementierten Compiler. Schauen Sie sich die Implementierung an. Entwerfen Sie Transformationsregeln, die die Übersetzung der folgenden Kontrollanweisung beschreiben: if <Bed.> th <Anw.> el <Anw.> *if Ergänzen Sie die Implementierung des Compilers entsprechend der Transformationsregeln.

Teil 5 Aufgaben und Lösungsvorschläge

Aufgabe Erweitern Sie die Programmiersprache um folgende Kontrollanweisung: if <Bed.> t <Anw.> e <Anw.> *if Ergänzen Sie entsprechend den Scanner, den Parser, den Interpreter und den Übersetzer (Codegenerator).

Die Programmiersprache Zur Vereinfachung der Darstellung verwenden wir abkürzende Bezeichner für die Anweisungen der Programmiersprache. wh nw if nz th h s el s *if*wh hinlegenschrittwiederhole solange NichtIstZiegel wiederhole solange NichtIstWand schritt *wiederhole linksDrehen*wiederhole

Erweiterter Scanner-Automat q1 zw q2 ´ ´; chr(13); chr(10) h w n q3 w * i s; l; r; h; a; t; e ´ ´; chr(13) q0 q10 q20 i f t q4 e h q5 l q30 q6 Fehlerzustand

Erweiterter Parser-Automat Oberstes Kellerzeichen / Eingabezeichen: Kelleroperation any / s : any / l :any / r : any / h :any / a :wh / *wh : popif / *if : popany / th : push thth / el : pop q1 any / wh : push whany / if : push if any / nz : any / nw : q0 else / *wh : any / nz :any / nw : q2 Fehlerzustand

Zusätzliche Regeln f. d. Interpreter wahr falsch if th <A1> el <A2> *if ... if th <A1> el <A2> *if ... <A1> ... <A2> ...

Aufgabe Beschreiben Sie die Arbeitsweise des Code-Interpreters mit Hilfe geeigneter Transformationsregeln. Ergänzen Sie hierzu den folgenden Lösungsvorschlag.

Lösungsvorschlag i ... >s ... i+1 ...s >...

Formale Sprachen Teil 3

Formale Sprachen Teil 3

Presentation Transcript

185.263 Automaten und Formale Sprachen VO 2.0 + UE 1

Teil 3

Formale Methoden

Formale Sprachen und Automaten

Formale Sprachen und Automaten

Formale Sprachen Teil 2

Einführung in Berechenbarkeit, formale Sprachen und Komplexitätstheorie

Reguläre Sprachen

Germanische Sprachen und Kulturen/3.

Hauptseminar Automaten und Formale Sprachen

Teil 3:

8. Formale Sprachen und Grammatiken

Formale Sprachen

Teil 3: Relationenmodell

Teil 3

ByeBye -Party Teil 3/3

Unser Sonnensystem Teil 3

Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie

Formale Sprachen

Formale Sprachen

1 . Formale Sprachen 1 .1 Aufbau von Sprachen

Gliederung: Teil 3 - Anpassungen