Compilation Analyses Lexicale, Syntaxique, et S mantique

1. 1 Compilation Analyses Lexicale, Syntaxique, et S�mantique Introduction Les techniques d'analyse syntaxique utilisables dans la construction pratique des compilateurs sont principalement issues de deux grandes familles de grammaires, les LL(k) et les LR(k), pour lesquelles la th�orie fournit des r�sultats quasi optimaux. Introduction Les techniques d'analyse syntaxique utilisables dans la construction pratique des compilateurs sont principalement issues de deux grandes familles de grammaires, les LL(k) et les LR(k), pour lesquelles la th�orie fournit des r�sultats quasi optimaux.

2. Transparent 2 Sommaire 1. Introduction � la compilation 2. Analyse lexicale 3. Rappels sur les langages formels 4. Analyse syntaxique non d�terministe 5. Analyse syntaxique descendante m�thodes LL() 6. Analyse syntaxique ascendante m�thodes LR() 7. Traduction dirig�e par la syntaxe 8. G�n�rateurs LR() 9. S�mantique statique des L.P. 10. Traitements �source to source� R�f�rences bibliographiques Compilateurs: Principes, techniques et outils, A. Aho, R. Sethi, J. Ullman; InterEditions (1991) Lex & Yacc, JR Lewine, T. Mason, D. Brown; O�Reilly & Associates, Inc (1992) A first course using ANSI C, LEX and YACC, J. P. Bennett, 2nd edition, McGraw Hill (1996) Modern Compilation Implementation, A. Appel; Cambridge University Press (1998) The Essence of Compilers, R. Hunter, Prentice hall (1999) Compilateurs, D.Grune et all, Dunod (2002) Crafting a Compiler, C.Fischer, R.LeBlanc, Benjamin Cummings Series (1988) Autres Cours ESSI Petit Pr�cis de Lex. J. Farr�; Notes de TP ESSI-2 (1998) Petit Pr�cis de Yacc. J. Farr�; Notes de TP ESSI-2 (1998) Cours de Compilation du MIT (format .ppt en Anglais) lecture3: grammaires, arbres, langages, analyseurs lecture4: construction SLR lecture5: construction LR(1) lecture6: construction LALR(1) lecture7: s�mantique statique. R�f�rences bibliographiques Compilateurs: Principes, techniques et outils, A. Aho, R. Sethi, J. Ullman; InterEditions (1991) Lex & Yacc, JR Lewine, T. Mason, D. Brown; O�Reilly & Associates, Inc (1992) A first course using ANSI C, LEX and YACC, J. P. Bennett, 2nd edition, McGraw Hill (1996) Modern Compilation Implementation, A. Appel; Cambridge University Press (1998) The Essence of Compilers, R. Hunter, Prentice hall (1999) Compilateurs, D.Grune et all, Dunod (2002) Crafting a Compiler, C.Fischer, R.LeBlanc, Benjamin Cummings Series (1988) Autres Cours ESSI Petit Pr�cis de Lex. J. Farr�; Notes de TP ESSI-2 (1998) Petit Pr�cis de Yacc. J. Farr�; Notes de TP ESSI-2 (1998) Cours de Compilation du MIT (format .ppt en Anglais) lecture3: grammaires, arbres, langages, analyseurs lecture4: construction SLR lecture5: construction LR(1) lecture6: construction LALR(1) lecture7: s�mantique statique.

3. 3 Chapitre 5Analyse syntaxique descendantem�thodes LL(k) Propri�t� LL(k) D�terminer si une grammaire est LL(1) ? Analyseur LL(1) G�n�rateur syntaxique LL(1) Quelques Environnments de Compilation (compiler- compiler) Java Compiler Compiler [tm] (JavaCC [tm]) - The Java Parser Generator http://javacc.java.net/ SYNTAX http://syntax.gforge.inria.fr/ Free Compiler Construction Tools http://www.thefreecountry.com/programming/compilerconstruction.shtml ANTLR, ANother Tool for Language Recognition, http://www.antlr.org/ The Compiler Generator Coco/R http://www.ssw.uni-linz.ac.at/Coco/Quelques Environnments de Compilation (compiler- compiler) Java Compiler Compiler [tm] (JavaCC [tm]) - The Java Parser Generator http://javacc.java.net/ SYNTAX http://syntax.gforge.inria.fr/ Free Compiler Construction Tools http://www.thefreecountry.com/programming/compilerconstruction.shtml ANTLR, ANother Tool for Language Recognition, http://www.antlr.org/ The Compiler Generator Coco/R http://www.ssw.uni-linz.ac.at/Coco/

4. Transparent 4 Propri�t� LL(k) il existe k? 0 d�pendant uniquement de la grammaire tel que: pour tout mot X � analyser dans T* pour tout A dans N au plus une r�gle A?? de P d�rive de S en: A?? *? y1 . . . yk T* LL(k) Lecture du mot de gauche � droite(Left to Right) D�rivations gauches (Leftmost) Propri�t� LL(k) des grammaires Notation: pour toute production {A??} d' une grammaire G, on note: Vuek(A??)={y[k], S ??g uAv ?u?v ?? uyw ?T*, avec v ?(N ? T)* } ? Interpr�tation: Vuek(A??) est l'ensemble des pr�fixes de longueur k que l'on peut r�ellement obtenir dans un arbre de d�rivation, en d�rivant A?? D�finition: une grammaire est LL(k) si pour tout non terminal A et pour toute paire de production A?? et A?? : ? ? ? => Vuek(A??) ? Vuek(A??) = ? ? Propri�t�: une grammaire LL(k) est LL(k') pour k' > k ? Grammaire LL(1) Notation: pour k= 1, on note: Vue(A??) = Vuek(A??) ? Principe : Pour d�cider si une grammaire est LL(1), il suffit de savoir construire tous les ensembles Vue(A??) ? T , pour toutes les productions A?? v�rifier la propri�t� de la d�finition ci-dessus.LL(k) Lecture du mot de gauche � droite(Left to Right) D�rivations gauches (Leftmost) Propri�t� LL(k) des grammaires Notation: pour toute production {A??} d' une grammaire G, on note: Vuek(A??)={y[k], S ??g uAv ?u?v ?? uyw ?T*, avec v ?(N ? T)* } ? Interpr�tation: Vuek(A??) est l'ensemble des pr�fixes de longueur k que l'on peut r�ellement obtenir dans un arbre de d�rivation, en d�rivant A?? D�finition: une grammaire est LL(k) si pour tout non terminal A et pour toute paire de production A?? et A?? : ? ? ? => Vuek(A??) ? Vuek(A??) = ? ? Propri�t�: une grammaire LL(k) est LL(k') pour k' > k ? Grammaire LL(1) Notation: pour k= 1, on note: Vue(A??) = Vuek(A??) ? Principe : Pour d�cider si une grammaire est LL(1), il suffit de savoir construire tous les ensembles Vue(A??) ? T , pour toutes les productions A?? v�rifier la propri�t� de la d�finition ci-dessus.

5. Transparent 5 Grammaire non LL() Grammaire INST inst ::= var := exp (r1) inst ::= if exp then s_d_inst else s_d_inst endif (r2) s_d_inst ::= inst ; s_d_inst | inst (r3 r4) exp ::= var + exp | var = exp | var (r5 r6 r7) Analyse non LL(k) if v1= v2 then v3 := v4 + v5 ; if v3= v4 then v5 := v1 = v4 else v3 := v4 end if ; v7 := v8 else v3 := v4 endif Grammaires LL() Certaines propri�t�s permettent de d�cider facilement si une grammaire est ou n'est pas LL(k)? Grammaires R�cursives Gauches Th�or�me: Une grammaire LL(k) n'est pas r�cursive gauche ? Preuve en TD3 Simples LL(k) D�finition: Une grammaire est simple LL(k), not� SLL(k), si toutes les r�gles de P sont de la forme Si ? a1.. an ui avec a1.. an ? T+ et ui ? (N u T) * il existe k >= 0 tel que pour toute paire de r�gles Si ? a1.. an ui et Si ? b1.. bm vi les mots a1.. an et b1.. bm n'ont pas de pr�fixe commun de longueur k ? Th�or�me: Une grammaire SLL(k) est LL(k) ? Analyse de la grammaire INST La grammaire INST n'est pas RG; Les d�rivations issues de INST sont SLL(1): se d�cident par "var" ou "if" Les d�rivations issues de EXP sont LL(2) (pas SLL(2)) se d�cident par "var" "+" ou "var" "=" ou "var" suivi d'un lex�me ? diff�rent de "+" ou "=" Les d�rivations issues de S_D_INST ne sont pas LL(k): pour tout k, il existe des INST plus longues que k Grammaires LL() Certaines propri�t�s permettent de d�cider facilement si une grammaire est ou n'est pas LL(k)? Grammaires R�cursives Gauches Th�or�me: Une grammaire LL(k) n'est pas r�cursive gauche ? Preuve en TD3 Simples LL(k) D�finition: Une grammaire est simple LL(k), not� SLL(k), si toutes les r�gles de P sont de la forme Si ? a1.. an ui avec a1.. an ? T+ et ui ? (N u T) * il existe k >= 0 tel que pour toute paire de r�gles Si ? a1.. an ui et Si ? b1.. bm vi les mots a1.. an et b1.. bm n'ont pas de pr�fixe commun de longueur k ? Th�or�me: Une grammaire SLL(k) est LL(k) ? Analyse de la grammaire INST La grammaire INST n'est pas RG; Les d�rivations issues de INST sont SLL(1): se d�cident par "var" ou "if" Les d�rivations issues de EXP sont LL(2) (pas SLL(2)) se d�cident par "var" "+" ou "var" "=" ou "var" suivi d'un lex�me ? diff�rent de "+" ou "=" Les d�rivations issues de S_D_INST ne sont pas LL(k): pour tout k, il existe des INST plus longues que k

6. Transparent 6 Grammaire LL(1) Grammaire INST' inst ::= var := exp (r1) inst ::= if exp then s_d_inst else s_d_inst endif (r2) s_d_inst ::= inst s_s_inst (r3) s_s_inst ::= ; s_d_inst | ? (r4 r5) exp ::= var s_d_exp (r6) s_d_exp ::= + exp | = exp | ? (r7 r8 r9) Analyse LL(1) if v1 = v2 then v3 := v4 + v5 ; if v3= v4 then v5 := v1 = v4 else v3 := v4 end if ; v7 := v8 else v3 := v4 endif Factorisation � gauche de la grammaire INST La grammaire INST' est obtenue par factorisation: de inst en s_s_inst dans r3 et r4 de var en s_d_exp dans r5, r6, r7 Remarque: Une "bonne" grammaire (factoris�e � gauche et non r�cursive gauche) peut n'�tre ni SLL(k), ni m�me LL(k) pour aucun k ? Analyse de la grammaire INST ' La grammaire INST n' est pas RG; Les d�rivations issues de INST sont SLL(1): se d�cident par "var" ou "if" Les d�rivations issues de EXP sont SLL(0) Les d�rivations issues de S_D_EXP sont LL(1) se d�cident par "+" ou "=" ou un lex�me diff�rent de "+" ou "=" ? Les d�rivations issues de S_D_INST sont LL(0) Les d�rivations issues de S_S_INST sont LL(1) se d�cident par ";" ou un lex�me diff�rent de ";" ? Factorisation � gauche de la grammaire INST La grammaire INST' est obtenue par factorisation: de inst en s_s_inst dans r3 et r4 de var en s_d_exp dans r5, r6, r7 Remarque: Une "bonne" grammaire (factoris�e � gauche et non r�cursive gauche) peut n'�tre ni SLL(k), ni m�me LL(k) pour aucun k ? Analyse de la grammaire INST ' La grammaire INST n' est pas RG; Les d�rivations issues de INST sont SLL(1): se d�cident par "var" ou "if" Les d�rivations issues de EXP sont SLL(0) Les d�rivations issues de S_D_EXP sont LL(1) se d�cident par "+" ou "=" ou un lex�me diff�rent de "+" ou "=" ? Les d�rivations issues de S_D_INST sont LL(0) Les d�rivations issues de S_S_INST sont LL(1) se d�cident par ";" ou un lex�me diff�rent de ";" ?

7. Transparent 7 Code Ada pour un analyseur LL(1) Analyseur � pile pour INST' Lex(ul); while ul /= EOT() loop case ul of "var" => case Som() of end case; "if" => case Som() of end case; end case; end loop; Analyseur � pile pour une grammaire LL(1) procedure Analyseur { Lex(ul); while ul /= EOT() loop case ul of "var" => voir � cot� "if" => voir � cot� ";" => case Som() of ";" => S_S_INST => // r4 S_D_EXP => // r9 others => raise ERREUR_de_syntaxe; end case; "+" => case Som() of "+" => S_D_EXP => // r7 others => raise ERREUR_de_syntaxe; end case; "=" | "then" => comme "+" "else" | "endif" => comme ";" end case; end loop; } Analyseur � pile pour une grammaire LL(1) procedure Analyseur { Lex(ul); while ul /= EOT() loop case ul of "var" => voir � cot� "if" => voir � cot� ";" => case Som() of ";" => S_S_INST => // r4 S_D_EXP => // r9 others => raise ERREUR_de_syntaxe; end case; "+" => case Som() of "+" => S_D_EXP => // r7 others => raise ERREUR_de_syntaxe; end case; "=" | "then" => comme "+" "else" | "endif" => comme ";" end case; end loop; }

8. Transparent 8 Code Ada pour un analyseur LL(1) Analyseur � pile pour INST' Lex(ul); while ul /= EOT() loop case ul of "var" => case Som() of "var" => Dep() ; Lex(ul) ; INST => Dep();Emp(EXP); Emp(":="); Emp("var"); // r1 S_D_INST => Dep(); Emp(S_S_INST); Emp(INST); // r3 EXP => Dep(); Emp(S_D_EXP); Emp("var"); // r6 others => raise ERREUR_de_syntaxe; end case; "if" => case Som() of "if" => Dep() ; Lex(ul) ; "INST" => Dep(); Emp( "endif"); Emp(S_D_INST); Emp("else"); Emp(S_D_INST); Emp("then"); Emp(EXP); Emp( "if" ); // r2 S_D_INST => Dep(); Emp(S_S_INST) ; Emp(INST); // r3 others => raise ERREUR_de_syntaxe; end case; - - - - - - - Analyseur � pile pour une grammaire LL(1) procedure Analyseur { Lex(ul); while ul /= EOT() loop case ul of "var" => voir � cot� "if" => voir � cot� ";" => case Som() of ";" => S_S_INST => // r4 S_D_EXP => // r9 others => raise ERREUR_de_syntaxe; end case; "+" => case Som() of "+" => S_D_EXP => // r7 others => raise ERREUR_de_syntaxe; end case; "=" | "then" => comme "+" "else" | "endif" => comme ";" end case; end loop; } Analyseur � pile pour une grammaire LL(1) procedure Analyseur { Lex(ul); while ul /= EOT() loop case ul of "var" => voir � cot� "if" => voir � cot� ";" => case Som() of ";" => S_S_INST => // r4 S_D_EXP => // r9 others => raise ERREUR_de_syntaxe; end case; "+" => case Som() of "+" => S_D_EXP => // r7 others => raise ERREUR_de_syntaxe; end case; "=" | "then" => comme "+" "else" | "endif" => comme ";" end case; end loop; }

9. Transparent 9 Code Java pour un analyseur LL(1) Analyseur � pile pour INST' Lex(ul) ; while (ul != EOT() ) { switch (ul) { case "var": switch (Som() ) { } ; break; case "if" : switch (Som() ){ } ; break; } } Analyseur � pile pour une grammaire LL(1) procedure Analyseur() { Lex(ul); while ( ul != EOT() ) { switch (ul) { case "var" : voir � cot� case "if" : voir � cot� case ";" : switch (Som() ) { case ";" : case S_S_INST: // r4 case S_D_EXP : // r9 default: throw new ErreurSyntaxe(); } ; break ; case "+" : switch (Som() ) { case "+" : case S_D_EXP : // r7 default: throw new ErreurSyntaxe(); } ; break ; case "=" : case "then" : comme "+" case "else": case "endif" : comme ";" } } } Analyseur � pile pour une grammaire LL(1) procedure Analyseur() { Lex(ul); while ( ul != EOT() ) { switch (ul) { case "var" : voir � cot� case "if" : voir � cot� case ";" : switch (Som() ) { case ";" : case S_S_INST: // r4 case S_D_EXP : // r9 default: throw new ErreurSyntaxe(); } ; break ; case "+" : switch (Som() ) { case "+" : case S_D_EXP : // r7 default: throw new ErreurSyntaxe(); } ; break ; case "=" : case "then" : comme "+" case "else": case "endif" : comme ";" } } }

10. Transparent 10 Code Java pour un analyseur LL(1) Lex(ul) ; while (ul != EOT() ) { switch (ul) { case "var": switch (Som() ) { case "var": Dep() ; Lex(ul) ; break ; case INST: Dep(); Emp(EXP); Emp(":="); Emp("var"); break ; // r1 case S_D_INST: Dep(); Emp(S_S_INST); Emp(INST); break; // r3 case EXP : Dep(); Emp(S_D_EXP); Emp("var"); break ; // r6 default : throw new ErreurSyntaxe(); } ; break; case "if" : switch (Som() ) { case "if" : Dep() ; Lex(ul) ; break ; case "INST": Dep(); Emp( "endif"); Emp(S_D_INST); Emp("else"); Emp(S_D_INST); Emp("then"); Emp(EXP); Emp( "if" ); break ; // r2 case S_D_INST : Dep(); Emp(S_S_INST) ; Emp(INST); break ; // r3 default : throw new ErreurSyntaxe(); } ; break; } } Analyseur � pile pour une grammaire LL(1) procedure Analyseur() { Lex(ul); while ( ul != EOT() ) { switch (ul) { case "var" : voir � cot� case "if" : voir � cot� case ";" : switch (Som() ) { case ";" : case S_S_INST: // r4 case S_D_EXP : // r9 default: throw new ErreurSyntaxe(); } ; break ; case "+" : switch (Som() ) { case "+" : case S_D_EXP : // r7 default: throw new ErreurSyntaxe(); } ; break ; case "=" : case "then" : comme "+" case "else": case "endif" : comme ";" } } } Analyseur � pile pour une grammaire LL(1) procedure Analyseur() { Lex(ul); while ( ul != EOT() ) { switch (ul) { case "var" : voir � cot� case "if" : voir � cot� case ";" : switch (Som() ) { case ";" : case S_S_INST: // r4 case S_D_EXP : // r9 default: throw new ErreurSyntaxe(); } ; break ; case "+" : switch (Som() ) { case "+" : case S_D_EXP : // r7 default: throw new ErreurSyntaxe(); } ; break ; case "=" : case "then" : comme "+" case "else": case "endif" : comme ";" } } }

11. Transparent 11 Analyseur r�cursif LL(1) proc INST(ul) { switch( ul ) { case "var" : break; case "if" : break; default : throw new ErreurSyntaxe(); } } proc EXP(ul) { switch( ul ) { case "var" : break; default : throw new ErreurSyntaxe(); } } proc S_D_INST(ul) { switch( ul ) { case "var" : case"if" : break; default : throw new ErreurSyntaxe(); } } Analyseur pour une grammaire LL(1) proc scan(ul, term) { if (ul = term) Lex(ul) ; else throw new ErreurSyntaxe();} proc INST(ul); voir � cot� proc EXP(ul) ; voir � cot� proc S_D_INST(ul) voir � cot� proc S_S_INST(ul) { switch ( ul) { case ";": scan(ul, ";" ); S_D_INST(ul) ; break ; // r4 case"else": case "endif": case ";" : break; // r5 default: throw new ErreurSyntaxe(); } } proc S_D_EXP(ul) { switch ( ul) { case "+": scan(ul, "+" ); EXP(ul) ; break; // r7 case "=" : scan(ul, "=" ); EXP(ul) ; break; // r8 cas "then": case"else": case"endif": case";": break; // r9 default: throw new ErreurSyntaxe(); } } Analyseur pour une grammaire LL(1) proc scan(ul, term) { if (ul = term) Lex(ul) ; else throw new ErreurSyntaxe();} proc INST(ul); voir � cot� proc EXP(ul) ; voir � cot� proc S_D_INST(ul) voir � cot� proc S_S_INST(ul) { switch ( ul) { case ";": scan(ul, ";" ); S_D_INST(ul) ; break ; // r4 case"else": case "endif": case ";" : break; // r5 default: throw new ErreurSyntaxe(); } } proc S_D_EXP(ul) { switch ( ul) { case "+": scan(ul, "+" ); EXP(ul) ; break; // r7 case "=" : scan(ul, "=" ); EXP(ul) ; break; // r8 cas "then": case"else": case"endif": case";": break; // r9 default: throw new ErreurSyntaxe(); } }

12. Transparent 12 Analyseur r�cursif LL(1) proc INST(ul) { switch( ul ) { case "var" : scan(ul, "var" ); scan(ul, ":=" ); EXP(ul) ; break; // r1 case "if" : scan(ul, "if" ); EXP(ul) ; scan(ul, "then" ); S_D_INST(ul); scan(ul, "else" ); S_D_INST(ul); scan(ul, "endif" ); break; // r2 default : throw new ErreurSyntaxe(); } } proc EXP(ul) { switch( ul ) { case "var": scan(ul, "var" ); S_D_EXP(ul) ; break; // r6 default : throw new ErreurSyntaxe(); } } proc S_D_INST(ul) { switch( ul ) { case "var": case"if": INST (ul); S_S_INST (ul); break; // r3 default : throw new ErreurSyntaxe(); } } Analyseur pour une grammaire LL(1) proc scan(ul, term) { if (ul = term) Lex(ul) ; else throw new ErreurSyntaxe();} proc INST(ul); voir � cot� proc EXP(ul) ; voir � cot� proc S_D_INST(ul) voir � cot� proc S_S_INST(ul) { switch ( ul) { case ";": scan(ul, ";" ); S_D_INST(ul) ; break ; // r4 case"else": case "endif": case ";" : break; // r5 default: throw new ErreurSyntaxe(); } } proc S_D_EXP(ul) { switch ( ul) { case "+": scan(ul, "+" ); EXP(ul) ; break; // r7 case "=" : scan(ul, "=" ); EXP(ul) ; break; // r8 case"then": case"else": cas "endif": case";": break; // r9 default: throw new ErreurSyntaxe(); } } Analyseur pour une grammaire LL(1) proc scan(ul, term) { if (ul = term) Lex(ul) ; else throw new ErreurSyntaxe();} proc INST(ul); voir � cot� proc EXP(ul) ; voir � cot� proc S_D_INST(ul) voir � cot� proc S_S_INST(ul) { switch ( ul) { case ";": scan(ul, ";" ); S_D_INST(ul) ; break ; // r4 case"else": case "endif": case ";" : break; // r5 default: throw new ErreurSyntaxe(); } } proc S_D_EXP(ul) { switch ( ul) { case "+": scan(ul, "+" ); EXP(ul) ; break; // r7 case "=" : scan(ul, "=" ); EXP(ul) ; break; // r8 case"then": case"else": cas "endif": case";": break; // r9 default: throw new ErreurSyntaxe(); } }

13. Transparent 13 PREMIER() Calcul de Prem(X) si x ? T alors Prem(x) = {x} si {X ? ?} ? P alors ? ? Prem(X) si X ? N et {X ? Y1 ..Yi..Yn } ? P alors calculer la cl�ture des r�gles suivantes: Prem(Y1) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1.. i-1 alors Prem(Yi) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1 .. n alors ? ? Prem(X) Calcul de Prem(X1� Xj�Xn): Prem(X1) - ? ? Prem(X1� Xj�Xn) si ? ? Prem(Xj) pour j = 1 .. i-1 alors Prem(Xj) - ? ? Prem(X1� Xj�Xn) si ? ? Prem(Xj) pour j = 1 .. n alors ? ? Prem(X1� Xj�Xn) Les Premiers dans une grammaire (ici de longueur 1) Notation: pour tout ? ?(N ?T)+, on note: Prem(? ) = { a ?T si ? ?? a w avec w ? (N ?T)?, et ? si ? ?? ? } ? Interpr�tation: Prem(?) est l'ensemble des premiers symboles terminaux de tous les mots que l'on peut d�river � partir de ? (� partir de l'axiome ou non !) Propri�t�: si une grammaire G ne contient pas de ?-production (r�gle A? ?): Vue(A? ?) = Prem(?[1]) ? Exemple: si ? = RSw et R?? ? P : alors Vue(A? ? ) ? Prem(R) et Prem(S) G�n�ralisation: Premiers de longueur k Premk(? ) = { a ?Tk si ? ?? a w avec w ? (N ?T)?, et ? si ? ?? ? } ? Les Premiers dans une grammaire (ici de longueur 1) Notation: pour tout ? ?(N ?T)+, on note: Prem(? ) = { a ?T si ? ?? a w avec w ? (N ?T)?, et ? si ? ?? ? } ? Interpr�tation: Prem(?) est l'ensemble des premiers symboles terminaux de tous les mots que l'on peut d�river � partir de ? (� partir de l'axiome ou non !) Propri�t�: si une grammaire G ne contient pas de ?-production (r�gle A? ?): Vue(A? ?) = Prem(?[1]) ? Exemple: si ? = RSw et R?? ? P : alors Vue(A? ? ) ? Prem(R) et Prem(S) G�n�ralisation: Premiers de longueur k Premk(? ) = { a ?Tk si ? ?? a w avec w ? (N ?T)?, et ? si ? ?? ? } ?

14. Transparent 14 PREMIERs de EE'TT'F Cloture Les premiers dans une grammaire si {X ? Y1 ..Yi..Yn } ? P Prem(Y1) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1.. i-1 alors Prem(Yi) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1 .. n alors ? ? Prem(X) Les Premiers pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | id Les premiers dans une grammaire si {X ? Y1 ..Yi..Yn } ? P Prem(Y1) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1.. i-1 alors Prem(Yi) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1 .. n alors ? ? Prem(X) Les Premiers pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | id

15. Transparent 15 PREMIERs de EE'TT'F Cloture T ? FT' E ? TE' {X ? ?Y?} et ??Prem(?) Les premiers dans une grammaire si {X ? Y1 ..Yi..Yn } ? P Prem(Y1) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1.. i-1 alors Prem(Yi) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1 .. n alors ? ? Prem(X) Les Premiers pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | var Prem(F) = { ( ,var } Prem(E') = { + , ? } Prem(T') = { * , ? } Prem(E, T, F) = { ( ,var } Les premiers dans une grammaire si {X ? Y1 ..Yi..Yn } ? P Prem(Y1) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1.. i-1 alors Prem(Yi) - ? ? Prem(X) si ? ? Prem(Yj) pour j = 1 .. n alors ? ? Prem(X) Les Premiers pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | var Prem(F) = { ( ,var } Prem(E') = { + , ? } Prem(T') = { * , ? } Prem(E, T, F) = { ( ,var }

16. Transparent 16 SUIVANT() Calcul de Suiv(X) si S est l'axiome alors # ? Suiv(S) si A et B ? N et x ? T et {A ? ?Bx} ? P alors x ? Suiv(B) si {A ? ?B?} ? P alors Prem(?) - ? ? Suiv(B) calculer la cl�ture des r�gles suivantes: si {A ? ?B} ? P alors Suiv(A) ? Suiv(B) si {A ? ?B?} ? P et ? ? Prem(?) alors Suiv(A) ? Suiv(B) Les suivants dans une grammaire (ici de longueur 1) Notation: pour tout A ?N, on note: Suiv(A) = {a?T? #, S#??uAav avec uv?(N ? T)? } ? Interpr�tation: Suiv(A) est l'ensemble des symboles terminaux qui peuvent suivre imm�diatement A dans une d�rivation � partir de l'axiome. Propri�t�: soit A? ? une production d'une grammaire G: Vue(A? ? ) =Prem(?) ? Suiv(A) si ? ?? ? Vue(A? ? ) =Prem(?) sinon ? Calcul des suivants dans une grammaire Notation: pour tout ? ?(N ?T)+, on note: Fin(? ) = {X ? N, ? ?? ? X avec ? ? (N ? T)? } ? Interpr�tation: Fin(? ) est l'ensemble des non terminaux qui peuvent terminer une d�rivation issue de ? Propri�t�: x ? T, x ? Suiv(A) <=> il existe X? ?? ? P tel que A ? Fin(?) et x ? Prem(? ) ? D�cidabilit� de la propri�t� LL(1) Th�or�me: Pour d�cider si une grammaire est LL(1) il suffit de calculer les ensembles Prem() et Suiv() et de tester la propri�t� sur Vue sur l'ensemble des r�gles de production : pour toute paire de production A? ? et A? ? , ? ? ? si ? ?? ? => ( Prem(?) ? Suiv(A) ) ? Prem(?) = ? si ? ?? ? => Prem(?) ? ( Prem(?) ? Suiv(A) ) = ? si ni ?, ni ? ?? ? => Prem(?) ? Prem(?) = ? sinon ?, et ? ?? ? => pas LL(1) ?Les suivants dans une grammaire (ici de longueur 1) Notation: pour tout A ?N, on note: Suiv(A) = {a?T? #, S#??uAav avec uv?(N ? T)? } ? Interpr�tation: Suiv(A) est l'ensemble des symboles terminaux qui peuvent suivre imm�diatement A dans une d�rivation � partir de l'axiome. Propri�t�: soit A? ? une production d'une grammaire G: Vue(A? ? ) =Prem(?) ? Suiv(A) si ? ?? ? Vue(A? ? ) =Prem(?) sinon ? Calcul des suivants dans une grammaire Notation: pour tout ? ?(N ?T)+, on note: Fin(? ) = {X ? N, ? ?? ? X avec ? ? (N ? T)? } ? Interpr�tation: Fin(? ) est l'ensemble des non terminaux qui peuvent terminer une d�rivation issue de ? Propri�t�: x ? T, x ? Suiv(A) <=> il existe X? ?? ? P tel que A ? Fin(?) et x ? Prem(? ) ? D�cidabilit� de la propri�t� LL(1) Th�or�me: Pour d�cider si une grammaire est LL(1) il suffit de calculer les ensembles Prem() et Suiv() et de tester la propri�t� sur Vue sur l'ensemble des r�gles de production : pour toute paire de production A? ? et A? ? , ? ? ? si ? ?? ? => ( Prem(?) ? Suiv(A) ) ? Prem(?) = ? si ? ?? ? => Prem(?) ? ( Prem(?) ? Suiv(A) ) = ? si ni ?, ni ? ?? ? => Prem(?) ? Prem(?) = ? sinon ?, et ? ?? ? => pas LL(1) ?

17. Transparent 17 SUIVANTs de EE'TT'F Cloture E ? TE' T ? FT' E ? TE' ??Prem(E') T ? FT' ??Prem(T') Suivant() calculer la cl�ture des r�gles suivantes: si {A ? ?B?} ? P alors Prem(?) - ? ? Suiv(B) si {A ? ?B} ? P alors Suiv(A) ? Suiv(B) si {A ? ?B?} ? P et ? ? Prem(?) alors Suiv(A) ? Suiv(B) Calcul de Suiv() pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | id Prem(F) = { ( ,var } Prem(E') = { + , ? } Prem(T') = { * , ? } Prem(E, T, F) = { ( ,var } Suivant() calculer la cl�ture des r�gles suivantes: si {A ? ?B?} ? P alors Prem(?) - ? ? Suiv(B) si {A ? ?B} ? P alors Suiv(A) ? Suiv(B) si {A ? ?B?} ? P et ? ? Prem(?) alors Suiv(A) ? Suiv(B) Calcul de Suiv() pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | id Prem(F) = { ( ,var } Prem(E') = { + , ? } Prem(T') = { * , ? } Prem(E, T, F) = { ( ,var }

18. Transparent 18 SUIVANTs de EE'TT'F Cloture E ? TE' T ? FT' E ? TE' ??Prem(E') T ? FT' ??Prem(T') Suivant() calculer la cl�ture des r�gles suivantes: si {A ? ?B?} ? P alors Prem(?) - ? ? Suiv(B) si {A ? ?B} ? P alors Suiv(A) ? Suiv(B) si {A ? ?B?} ? P et ? ? Prem(?) alors Suiv(A) ? Suiv(B) Calcul de Suiv() pour EE'TT'F: (r0) E0 ? E # (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | id Prem(F) = { ( ,var } Prem(E') = { + , ? } Prem(T') = { * , ? } Prem(E, T, F) = { ( ,var } Suiv(E) = Suiv(E') = { ) , # } Suiv(T) = Suiv(T') = {+ ,) , # } Suiv(F) = { *, + ,) , # } Suivant() calculer la cl�ture des r�gles suivantes: si {A ? ?B?} ? P alors Prem(?) - ? ? Suiv(B) si {A ? ?B} ? P alors Suiv(A) ? Suiv(B) si {A ? ?B?} ? P et ? ? Prem(?) alors Suiv(A) ? Suiv(B) Calcul de Suiv() pour EE'TT'F: (r0) E0 ? E # (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | id Prem(F) = { ( ,var } Prem(E') = { + , ? } Prem(T') = { * , ? } Prem(E, T, F) = { ( ,var } Suiv(E) = Suiv(E') = { ) , # } Suiv(T) = Suiv(T') = {+ ,) , # } Suiv(F) = { *, + ,) , # }

19. Transparent 19 G�n�ration des Tables LL(1) pour chaque {A ? ?} ? P { pour chaque a ? T, a ? Prem(?) { M[A, a] += {A ? ?} } si ? ? Prem(?) alors { pour chaque b ? T, b ? Suiv(A) { M[A, b] += {A ? ?} } si # ? Suiv(A) alors M[A, #] += {A ? ?} } } toute entr�e non d�finie dans M est une "erreur" M[$, #] = "accepter" Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a?

20. Transparent 20 Table LL(1) pour EE'TT'F PREMIERS SUIVANTS Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Table LL(1) pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | var Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Table LL(1) pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | var

21. Transparent 21 Table LL(1) pour EE'TT'F PREMIERS Prem(E) = Prem(T) = Prem(F) = { var , ( } Prem(E') = { +, ? } Prem(T') = { *, ? } SUIVANTS Suiv(E) = Suiv(E') = { ) , # } Suiv(T) = Suiv(T') = {+ ,) ,# } Suiv(F) = { *, + ,) , #} Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Table LL(1) pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | var Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Table LL(1) pour EE'TT'F: (r1) E ? T E' (r2, r3) E' ? + T E' | ? (r4) T ? F T' (r5, r6) T' ? * F T' | ? (r7, r8) F ? ( E ) | var

22. Transparent 22 Table LL(1) pour INST' Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Table LL(1) pour INST' inst ::= var := exp (r1) inst ::= if exp then s_d_inst else s_d_inst endif (r2) s_d_inst ::= inst s_s_inst (r3) s_s_inst ::= ; s_d_inst | ? (r4 r5) exp ::= var s_d_exp (r6) s_d_exp ::= + exp | = exp | ? (r7 r8 r9) Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Table LL(1) pour INST' inst ::= var := exp (r1) inst ::= if exp then s_d_inst else s_d_inst endif (r2) s_d_inst ::= inst s_s_inst (r3) s_s_inst ::= ; s_d_inst | ? (r4 r5) exp ::= var s_d_exp (r6) s_d_exp ::= + exp | = exp | ? (r7 r8 r9)

23. Transparent 23 Table LL(1) pour INST' Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Table LL(1) pour INST' inst ::= var := exp (r1) inst ::= if exp then s_d_inst else s_d_inst endif (r2) s_d_inst ::= inst s_s_inst (r3) s_s_inst ::= ; s_d_inst | ? (r4 r5) exp ::= var s_d_exp (r6) s_d_exp ::= + exp | = exp | ? (r7 r8 r9) Construction des Tables LL(1) Donn�es: une grammaire G, suppos�e LL(1). La construction permet de v�rifier la propri�t� R�sultat: une table d'analyse LL(1) pour un analyseur pr�dictif M�thode: Prem() et Suiv() permettent de construire une table d'analyse M pour un analyseur pr�dictif M : (N ? {$}) x (T ? {#}) ? P ? {erreur, accepter} Propri�t�: La grammaire est LL(1) ssi M[A, a] contient au plus une action pour tout A et a? Table LL(1) pour INST' inst ::= var := exp (r1) inst ::= if exp then s_d_inst else s_d_inst endif (r2) s_d_inst ::= inst s_s_inst (r3) s_s_inst ::= ; s_d_inst | ? (r4 r5) exp ::= var s_d_exp (r6) s_d_exp ::= + exp | = exp | ? (r7 r8 r9)

24. Transparent 24 Analyse descendante LL(1) Source ? if v1= v2 then v3 := v4 + v5 ; if v3= v4 then v5 := v1= v4 else v3 := v4 endif ; v7 := v8 else v3 := v4 endif # Grammaire INST apr�s factorisation � gauche inst ::= var := exp (r1) inst ::= if exp then s_d_inst else s_d_inst endif (r2) s_d_inst ::= inst s_s_inst (r3) s_s_inst ::= ; s_d_inst | ? (r4 r5) exp ::= var s_d_exp (r6) s_d_ exp ::= + exp | = exp | ? (r7 r8 r9) Analyse LL(1) du source if v1= v2 then v3 := v4 + v5 ; if v3= v4 then v5 := v1= v4 else v3 := v4 endif ; v7 := v8 else v3 := v4 endif #Grammaire INST apr�s factorisation � gauche inst ::= var := exp (r1) inst ::= if exp then s_d_inst else s_d_inst endif (r2) s_d_inst ::= inst s_s_inst (r3) s_s_inst ::= ; s_d_inst | ? (r4 r5) exp ::= var s_d_exp (r6) s_d_ exp ::= + exp | = exp | ? (r7 r8 r9) Analyse LL(1) du source if v1= v2 then v3 := v4 + v5 ; if v3= v4 then v5 := v1= v4 else v3 := v4 endif ; v7 := v8 else v3 := v4 endif #

25. Transparent 25 Analyseur g�n�rique LL(1) Actions procedure Action(u: LEX; X: N_ou_T) { if (X = u ) { Dep(X) ; Lex(u) ; } else switch (M(u, X)) { case "A ? ? " : Dep(X) ; Emp(miroir(? )) ; break ; case "A ? ?" : Dep(X) ; break ; case "succ�s" : break ; case "erreur" : throw new Erreur() ; } } Analyseur function Analyse() { Lex(ul); Emp(Axiome); while (ul != "#") { Action(ul, Som()) ; } return succes ; } D�cidabilit� sur les grammaires LL() Th�or�me: La propri�t� LL(k) d'une grammaire est ind�cidable (pour k non fix�) ? Corollaire: Il n'existe pas d'algorithme permettant de transformer une grammaire quelconque en une grammaire �quivalente LL(k) ; mais on peut toujours essayer sur une grammaire donn�e! Th�or�me: Une grammaire LL(1) est non ambigu� preuve: d'apr�s la propri�t� LL(1) il ne peut exister deux d�rivations distinctes pour deux mots identiques ? g�n�ralisation: ce r�sultat est vrai pour les grammaires LL(k) ? Complexit� de l'analyse LL() Th�or�me: Le test LL(1) et la construction de la table d'analyse est en O( |P|*|T|*|N| ) preuve: d'apr�s le calcul de Prem() et Suiv() et la construction pr�c�dente ? g�n�ralisation: ce r�sultat est vrai pour l'analyse LL(k) ? Th�or�me: L'analyse LL(1) d'un mot m est en O(|m|) preuve: directement d'apr�s le code ci-contre ? g�n�ralisation: ce r�sultat est vrai pour l'analyse LL(k) ? Langages LL() Th�or�me: La propri�t� LL(k) d'un langage est ind�cidable (pour k non fix�) ? Th�or�me: LL(1) ?... ? LL(k) ? ALG DETERMINISTE ? D�cidabilit� sur les grammaires LL() Th�or�me: La propri�t� LL(k) d'une grammaire est ind�cidable (pour k non fix�) ? Corollaire: Il n'existe pas d'algorithme permettant de transformer une grammaire quelconque en une grammaire �quivalente LL(k) ; mais on peut toujours essayer sur une grammaire donn�e! Th�or�me: Une grammaire LL(1) est non ambigu� preuve: d'apr�s la propri�t� LL(1) il ne peut exister deux d�rivations distinctes pour deux mots identiques ? g�n�ralisation: ce r�sultat est vrai pour les grammaires LL(k) ? Complexit� de l'analyse LL() Th�or�me: Le test LL(1) et la construction de la table d'analyse est en O( |P|*|T|*|N| ) preuve: d'apr�s le calcul de Prem() et Suiv() et la construction pr�c�dente ? g�n�ralisation: ce r�sultat est vrai pour l'analyse LL(k) ? Th�or�me: L'analyse LL(1) d'un mot m est en O(|m|) preuve: directement d'apr�s le code ci-contre ? g�n�ralisation: ce r�sultat est vrai pour l'analyse LL(k) ? Langages LL() Th�or�me: La propri�t� LL(k) d'un langage est ind�cidable (pour k non fix�) ? Th�or�me: LL(1) ?... ? LL(k) ? ALG DETERMINISTE ?

26. 26 Chapitre 6Analyse syntaxique ascendantem�thodes LR(k) Analyse Ascendante Propri�t� LR(k) Grammaire SLR, LR(1), LALR(1) Analyseur LR(1) G�n�rateur syntaxique LR(1)

27. Transparent 27 Analyse Ascendante Principe le mot x � analyser dans T* est lu une seule fois de gauche � droite on construit un arbre de d�rivation en montant des feuilles (= x ) vers la racine = axiome M�thode par d�calage ou r�duction r�duire par une d�rivation droite inverse se d�caler sur X Principe de l'Analyse Ascendante le mot X � analyser dans T* est lu une seule fois de gauche � droite on construit un arbre de d�rivation en montant des feuilles (mot des feuilles = X) vers la racine=axiome en assemblant des sous arbres d'analyse on "remonte" les d�rivations en utilisant les r�gles A?? de P de la droite vers la gauche (Pile), cad ? (au Sommet) est r�duit en A: on dit que l'on r�duit ? M�thode d�calage-r�duction on g�re un mot w dans (N ? T)+ comme le mot des racines des sous arbres d'analyse d�j� construits pris de gauche � droite lorsque w = u o� u ? (N ? T)* et P ne contient pas de r�gle A?u , l'analyseur avance dans la lecture de X � la lettre suivante x et donc w = u x lorsque w = u? o� u ? (N ? T)* et ? est une partie droite de r�gles A?? dans P (plusieurs ? possibles, car d�composition de w = u? non unique) , l'analyseur doit pouvoir d�cider: s'il y a lieu de r�duire w en uA et par quelle r�gle de P ? s'il y a lieu d'avancer dans la lecture du mot X � la lettre suivante x et donc w = u? x Propri�t�: la suite de d�rivations utilis�es pour r�duire un mot X correspond � la suite inverse des d�rivations les +� droites (Rightmost) pour produire XPrincipe de l'Analyse Ascendante le mot X � analyser dans T* est lu une seule fois de gauche � droite on construit un arbre de d�rivation en montant des feuilles (mot des feuilles = X) vers la racine=axiome en assemblant des sous arbres d'analyse on "remonte" les d�rivations en utilisant les r�gles A?? de P de la droite vers la gauche (Pile), cad ? (au Sommet) est r�duit en A: on dit que l'on r�duit ? M�thode d�calage-r�duction on g�re un mot w dans (N ? T)+ comme le mot des racines des sous arbres d'analyse d�j� construits pris de gauche � droite lorsque w = u o� u ? (N ? T)* et P ne contient pas de r�gle A?u , l'analyseur avance dans la lecture de X � la lettre suivante x et donc w = u x lorsque w = u? o� u ? (N ? T)* et ? est une partie droite de r�gles A?? dans P (plusieurs ? possibles, car d�composition de w = u? non unique) , l'analyseur doit pouvoir d�cider: s'il y a lieu de r�duire w en uA et par quelle r�gle de P ? s'il y a lieu d'avancer dans la lecture du mot X � la lettre suivante x et donc w = u? x Propri�t�: la suite de d�rivations utilis�es pour r�duire un mot X correspond � la suite inverse des d�rivations les +� droites (Rightmost) pour produire X

28. Transparent 28 Analyse Ascendante D�terministe Grammaire ETF E ::= E + T | T (r1 r2) T ::= T * F | F (r3 r4) F ::= var | ( E ) (r5 r6) Analyse d�terministe? v1 + v2 * v3 v1 + v2 * v3 v1 + v2 * v3 Suite de d�rivations et Analyse D�rivations gauches: E ?g E + T ?g T + T ?g F + T ?g v1 + T ?g v1 + T * F ?g v1 + F * F ?g v1 + v2 * F ?g v1 + v2 * v3 D�rivations droites: E ?d E + T ?d E + T * F ?d E + T * v3 ?d E + F * v3 ?d E + v2 * v3 ?d T + v2 * v3 ?d F + v2 * v3 ?d v1 + v2 * v3 Manche (traduction pour "handle") D�finition: ? ? (N ? T)* est une forme sententielle droite (fsd) dans une grammaire G si S *?d ? ? D�finition: ? ? (N ? T)* est appel� manche dans une fsd ? si ? = g ? x o� x ? T* et g A x est une fsd avec A?? ? P Les Manches (des fsg et fsd) sont soulign�s dans les d�rivations ci-dessus ? G�n�ration ou Analyse "descendante" d'un mot: on "descend" les d�rivations gauches; v1 est le premier manche ?T* produit et v3 le dernier ; en sym�trisant la d�finition de manche pour d'une fsg: le manche est pr�c�d� d'un mot terminal ?T* et provient d'une fsg Analyse "ascendante" d'un mot: on "remonte" les d�rivations droites o� v3 est le premier manche ?T* r�duit et v1 le dernier; le manche est suivi d'un mot terminal ?T* et provient d'une fsdSuite de d�rivations et Analyse D�rivations gauches: E ?g E + T ?g T + T ?g F + T ?g v1 + T ?g v1 + T * F ?g v1 + F * F ?g v1 + v2 * F ?g v1 + v2 * v3 D�rivations droites: E ?d E + T ?d E + T * F ?d E + T * v3 ?d E + F * v3 ?d E + v2 * v3 ?d T + v2 * v3 ?d F + v2 * v3 ?d v1 + v2 * v3 Manche (traduction pour "handle") D�finition: ? ? (N ? T)* est une forme sententielle droite (fsd) dans une grammaire G si S *?d ? ? D�finition: ? ? (N ? T)* est appel� manche dans une fsd ? si ? = g ? x o� x ? T* et g A x est une fsd avec A?? ? P Les Manches (des fsg et fsd) sont soulign�s dans les d�rivations ci-dessus ? G�n�ration ou Analyse "descendante" d'un mot: on "descend" les d�rivations gauches; v1 est le premier manche ?T* produit et v3 le dernier ; en sym�trisant la d�finition de manche pour d'une fsg: le manche est pr�c�d� d'un mot terminal ?T* et provient d'une fsg Analyse "ascendante" d'un mot: on "remonte" les d�rivations droites o� v3 est le premier manche ?T* r�duit et v1 le dernier; le manche est suivi d'un mot terminal ?T* et provient d'une fsd

29. Transparent 29 Un manche ou LE manche ? Grammaire ambigu� des expressions E ::= E + E | E * E (r1 r2) E ::= var | ( E ) (r3 r4) Des Manches diff�rents v1 + v2 * v3 v1 + v2 * v3 Un Manche ou LE Manche ? Propri�t�: si une grammaire est non ambigu�, toute fsd a exactement un manche ? Exemple d'ambigu�t�: Deux D�rivations droites distinctes: E ?d E + E ?d E + E * E ?d E + E * v3 ?d E + v2 * v3 ?d v1 + v2 * v3 E ?d E * E ?d E * v3 ?d E + E * v3 ?d E + v2 * v3 ?d v1 + v2 * v3 Un Manche ou LE Manche ? Propri�t�: si une grammaire est non ambigu�, toute fsd a exactement un manche ? Exemple d'ambigu�t�: Deux D�rivations droites distinctes: E ?d E + E ?d E + E * E ?d E + E * v3 ?d E + v2 * v3 ?d v1 + v2 * v3 E ?d E * E ?d E * v3 ?d E + E * v3 ?d E + v2 * v3 ?d v1 + v2 * v3

30. Transparent 30 Analyseur par D�calage-R�duction Sch�ma simplifi� Analyseur par D�calage - R�duction D�finition: un ADR pour une grammaire G se compose de : un tampon d'entr�e pour les lex�mes dans T*, termin� par # une pile M de symboles dans (N ? T)*, initialement vide. une sortie pour produire la d�rivation (ou l'arbre de) une table A g�n�r�e pour G, avec 4 actions {M} ? { D, R, ac, er} D�caler "shift": empile dans M le symbole courant de l'entr�e avancer d'un symbole en entr�e R�duire "reduce": d�piler le manche dans M (p symboles en sommet de pile) empile dans M le non terminal de la r�duction du manche Accepter: si M contient l'axiome et que l'entr�e contient # Erreur: si pas d'action pr�vue dans A un analyseur ind�pendant de la grammaire G ex�cutant A en boucle, jusqu'� Accepter ou Erreur ? Conflits pour un ADR L'impl�mentation d'un ADR consiste � r�gler deux sortes de choix : conflit d�caler ou r�duire ("shift/reduce" terminologie Yacc) conflit r�duire r1 ou r�duire r2 ("reduce/reduce" sous Yacc) Divers ADRs: analyseurs LR(k), LALR(k) , SLR(k) analyseurs par pr�c�dence d'op�rateurs Analyseur par D�calage - R�duction D�finition: un ADR pour une grammaire G se compose de : un tampon d'entr�e pour les lex�mes dans T*, termin� par # une pile M de symboles dans (N ? T)*, initialement vide. une sortie pour produire la d�rivation (ou l'arbre de) une table A g�n�r�e pour G, avec 4 actions {M} ? { D, R, ac, er} D�caler "shift": empile dans M le symbole courant de l'entr�e avancer d'un symbole en entr�e R�duire "reduce": d�piler le manche dans M (p symboles en sommet de pile) empile dans M le non terminal de la r�duction du manche Accepter: si M contient l'axiome et que l'entr�e contient # Erreur: si pas d'action pr�vue dans A un analyseur ind�pendant de la grammaire G ex�cutant A en boucle, jusqu'� Accepter ou Erreur ? Conflits pour un ADR L'impl�mentation d'un ADR consiste � r�gler deux sortes de choix : conflit d�caler ou r�duire ("shift/reduce" terminologie Yacc) conflit r�duire r1 ou r�duire r2 ("reduce/reduce" sous Yacc) Divers ADRs: analyseurs LR(k), LALR(k) , SLR(k) analyseurs par pr�c�dence d'op�rateurs

31. Transparent 31 Analyse par d�calage-r�duction dans ETF Source dans ETF v1 + v2 * v3 # Analyse ADR Grammaire ETF r�cursive gauche (r1, r2) E ? E + T | T (r3, r4) T ? T * F | F (r5, r6) F ? var | ( E ) Analyse ADR "remonter" la d�rivation droite: E ?d E + T ?d E + T * F ?d E + T * v3 ?d E + F * v3 ?d E + v2 * v3 ?d T + v2 * v3 ?d F + v2 * v3 ?d v1 + v2 * v3 Les conflits se r�solvent comme suit: r�duire v1 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var + r�duire F par r4 (au lieu de d�caler), car il n'existe pas de manche contenant F + r�duire T par r2 (au lieu de d�caler), car il n'existe pas de manche contenant T + r�duire v2 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var * r�duire F par r4 (au lieu de d�caler), car il n'existe pas de manche contenant F * r�duire v3 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var # r�duire T*F par r3 (au lieu de d�caler), car il n'existe pas de manche contenant T*F # r�duire E+T par r1 (au lieu de d�caler), car il n'existe pas de manche contenant E+T # Grammaire ETF r�cursive gauche (r1, r2) E ? E + T | T (r3, r4) T ? T * F | F (r5, r6) F ? var | ( E ) Analyse ADR "remonter" la d�rivation droite: E ?d E + T ?d E + T * F ?d E + T * v3 ?d E + F * v3 ?d E + v2 * v3 ?d T + v2 * v3 ?d F + v2 * v3 ?d v1 + v2 * v3 Les conflits se r�solvent comme suit: r�duire v1 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var + r�duire F par r4 (au lieu de d�caler), car il n'existe pas de manche contenant F + r�duire T par r2 (au lieu de d�caler), car il n'existe pas de manche contenant T + r�duire v2 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var * r�duire F par r4 (au lieu de d�caler), car il n'existe pas de manche contenant F * r�duire v3 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var # r�duire T*F par r3 (au lieu de d�caler), car il n'existe pas de manche contenant T*F # r�duire E+T par r1 (au lieu de d�caler), car il n'existe pas de manche contenant E+T #

32. Transparent 32 Analyse par d�calage-r�duction dans ETF Source dans ETF v1 + v2 * v3 # Analyse ADR Grammaire ETF r�cursive gauche (r1, r2) E ? E + T | T (r3, r4) T ? T * F | F (r5, r6) F ? var | ( E ) Analyse ADR Le tableau ci-contre donne les �tats successifs d'un analyseur ADR pour le mot : v1 + v2 * v3 # . On "remonte" la d�rivation droite: E ?d E + T ?d E + T * F ?d E + T * v3 ?d E + F * v3 ?d E + v2 * v3 ?d T + v2 * v3 ?d F + v2 * v3 ?d v1 + v2 * v3 Les conflits ont �t� r�solus comme suit: r�duire v1 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var + r�duire F par r4 (au lieu de d�caler), car il n'existe pas de manche contenant F + r�duire T par r2 (au lieu de d�caler), car il n'existe pas de manche contenant T + r�duire v2 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var * r�duire F par r4 (au lieu de d�caler), car il n'existe pas de manche contenant F * r�duire v3 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var # r�duire T*F par r3 (au lieu de d�caler), car il n'existe pas de manche contenant T*F # r�duire E+T par r1 (au lieu de d�caler), car il n'existe pas de manche contenant E+T # Grammaire ETF r�cursive gauche (r1, r2) E ? E + T | T (r3, r4) T ? T * F | F (r5, r6) F ? var | ( E ) Analyse ADR Le tableau ci-contre donne les �tats successifs d'un analyseur ADR pour le mot : v1 + v2 * v3 # . On "remonte" la d�rivation droite: E ?d E + T ?d E + T * F ?d E + T * v3 ?d E + F * v3 ?d E + v2 * v3 ?d T + v2 * v3 ?d F + v2 * v3 ?d v1 + v2 * v3 Les conflits ont �t� r�solus comme suit: r�duire v1 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var + r�duire F par r4 (au lieu de d�caler), car il n'existe pas de manche contenant F + r�duire T par r2 (au lieu de d�caler), car il n'existe pas de manche contenant T + r�duire v2 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var * r�duire F par r4 (au lieu de d�caler), car il n'existe pas de manche contenant F * r�duire v3 par r5 (au lieu de d�caler), car il n'existe pas de manche contenant var # r�duire T*F par r3 (au lieu de d�caler), car il n'existe pas de manche contenant T*F # r�duire E+T par r1 (au lieu de d�caler), car il n'existe pas de manche contenant E+T #

33. Transparent 33 Propri�t� LR(k) il existe k? 0 d�pendant uniquement de la grammaire tel que: pour tout mot X � analyser dans T* pour toute fsd F= ? ? a w dans (N ? T)* et tout manche ? il existe au plus une r�gle A? ? dans P telle que ? A a w est une fsd Intitul� LR(k) Lecture du mot de gauche � droite("Left to Right") D�rivations (les + �) droites ("Rightmost") Propri�t� LR(k) des grammaires D�finition: une grammaire est LR(k) ssi pour ?, ?, ?, ? ?(N ? T)*; A, B ?N ; a ?Tk ; w, w'? T* si S *?d ? A aw ?d ? ? a w et si S *?d ? B w' ?d ? ?' w' = ? ? a ? alors A=B , ? =?' , ? = ? et w'=a ? Note: ? est un manche des deux fsd ? ? aw et ? ?' w' ? Propri�t�: une grammaire LR(k) est LR(k') pour k' > k ? Grammaire LR(1) La d�finition pr�c�dente donne celle des: LR(0) en prenant a = ? LR(1) en prenant a ?T ? Intitul� LR(k) Lecture du mot de gauche � droite("Left to Right") D�rivations (les + �) droites ("Rightmost") Propri�t� LR(k) des grammaires D�finition: une grammaire est LR(k) ssi pour ?, ?, ?, ? ?(N ? T)*; A, B ?N ; a ?Tk ; w, w'? T* si S *?d ? A aw ?d ? ? a w et si S *?d ? B w' ?d ? ?' w' = ? ? a ? alors A=B , ? =?' , ? = ? et w'=a ? Note: ? est un manche des deux fsd ? ? aw et ? ?' w' ? Propri�t�: une grammaire LR(k) est LR(k') pour k' > k ? Grammaire LR(1) La d�finition pr�c�dente donne celle des: LR(0) en prenant a = ? LR(1) en prenant a ?T ?

34. Transparent 34 ETF est elle LR(0) ? Grammaire ETF E ::= E + T | T (r1 r2) T ::= T * F | F (r3 r4) F ::= var | ( E ) (r5 r6) pas LR(0) , mais LR(1) ? La d�cision peut d�pendre du prochain terminal � lire (look ahead) v1 + v2 + v3 v1 + v2 * v3 Une grammaire est elle LR(k) ? En pratique on consid�re les grammaires LR(0) ou LR(1) Intuitivement, la propri�t� est vraie si la connaissance de k terminaux apr�s le caract�re courant (look-ahead) permet de d�cider de mani�re unique comment traiter le manche. La d�finition pr�c�dente est difficile � utiliser pour prouver la propri�t�; par contre, on peut exhiber un contre-exemple de d�rivations pour prouver l'absence de cette propri�t�. La construction de l'analyseur LR(k) donn�e ci apr�s permet de r�pondre � la m�me question. ETF est elle LR(0) ? Intuitivement, la r�ponse est NON Formellement: on consid�re deux d�rivations droites: E ?d E + T ?d E + F ?d E + v3 ?d E + T + v3 avec ? =a= ? , A = E , ? = E+T, w = + v3 E ?d E + T ?dE + T * F avec ? = E+, B = T, ?' = T*F, w'= ? et ? ?' w' = ? ? a ? = E+T*F avec ? = *F voir aussi l'analyse des items canoniques de l'analyseur SLR Une grammaire est elle LR(k) ? En pratique on consid�re les grammaires LR(0) ou LR(1) Intuitivement, la propri�t� est vraie si la connaissance de k terminaux apr�s le caract�re courant (look-ahead) permet de d�cider de mani�re unique comment traiter le manche. La d�finition pr�c�dente est difficile � utiliser pour prouver la propri�t�; par contre, on peut exhiber un contre-exemple de d�rivations pour prouver l'absence de cette propri�t�. La construction de l'analyseur LR(k) donn�e ci apr�s permet de r�pondre � la m�me question. ETF est elle LR(0) ? Intuitivement, la r�ponse est NON Formellement: on consid�re deux d�rivations droites: E ?d E + T ?d E + F ?d E + v3 ?d E + T + v3 avec ? =a= ? , A = E , ? = E+T, w = + v3 E ?d E + T ?dE + T * F avec ? = E+, B = T, ?' = T*F, w'= ? et ? ?' w' = ? ? a ? = E+T*F avec ? = *F voir aussi l'analyse des items canoniques de l'analyseur SLR

35. Transparent 35 Les langages de mots de pile Grammaire Dyck des () D ::= D D (r1) | a D b (r2) | a b (r3) Langage des Contextes Gauches CG = {?, ? D est un pr�fixe viable de Dyck} CG ::= CG D ( par r1) | CG a ( par r2) | ? ( par r3) => CG = (D | a)* Langage des Pr�fixes Viables PV est le langage des mots de pile ADR PV ::= CG D + CG D D | CG a + CG a D + CG a D b | CG a + CG a b => PV ? RAT Comment trouver le Manche ? Les analyseurs ADR utilisent pour rep�rer les manches une propri�t� fondamentale des grammaires alg�briques: le langage des pr�fixes des fsd , cad les mots de pile d'un ADR, est rationnel. D�finition: Tout pr�fixe p= ? u de ? ? dans une fsd F= ? ? w o� ? est le manche est dit pr�fixe viable de F Remarque: p d�borde le d�but du manche ?, mais pas la fin Propri�t�: Les pr�fixes viables forment l'ensemble des mots qui peuvent appara�tre dans la pile lors d'une ADR ? Th�or�me: Le langage des pr�fixes viables d'une grammaire alg�brique est un langage rationnel Preuve: voir la construction de l'automate des pr�fixes viables SLR ? R�solution ADR: l'analyseur ADR utilise un automate d'�tat fini pour rep�rer les manches. Comment trouver le Manche ? Les analyseurs ADR utilisent pour rep�rer les manches une propri�t� fondamentale des grammaires alg�briques: le langage des pr�fixes des fsd , cad les mots de pile d'un ADR, est rationnel. D�finition: Tout pr�fixe p= ? u de ? ? dans une fsd F= ? ? w o� ? est le manche est dit pr�fixe viable de F Remarque: p d�borde le d�but du manche ?, mais pas la fin Propri�t�: Les pr�fixes viables forment l'ensemble des mots qui peuvent appara�tre dans la pile lors d'une ADR ? Th�or�me: Le langage des pr�fixes viables d'une grammaire alg�brique est un langage rationnel Preuve: voir la construction de l'automate des pr�fixes viables SLR ? R�solution ADR: l'analyseur ADR utilise un automate d'�tat fini pour rep�rer les manches.

36. Transparent 36 Analyseur LR Sch�ma conceptuel Analyseur LR D�finition: un ALR pour une grammaire G se compose de : un tampon d'entr�e pour les lex�mes � analyser dans T*, termin� par # une pile M de symboles dans (N ? T)*, initialement vide. une pile E d'�tats de l'automate fini PV , initialement avec un �tat initial une sortie pour produire la d�rivation (ou l'arbre de) une table de transition T[{e}, N ? T] ? {e} pour les �tats de PV une table A g�n�r�e pour G, avec 4 actions {M} ? { D, R, A, E} D�caler: empile dans M le symbole courant de l'entr�e empile dans E l'�tat atteint = T[etat_courant, som(M)] avancer d'un symbole en entr�e R�duire: d�piler le manche dans M (p symboles en sommet de pile) d�piler p �tats dans E empile dans M le non terminal de la r�duction du manche empile dans E l'�tat atteint = T[etat_courant, som(M)] Accepter: si M = {l'axiome} et que l'entr�e = {#} Erreur: si pas d'action pr�vue dans A un analyseur ind�pendant de la grammaire G ex�cutant A en boucle, jusqu'� pile ou entr�e vide ?Analyseur LR D�finition: un ALR pour une grammaire G se compose de : un tampon d'entr�e pour les lex�mes � analyser dans T*, termin� par # une pile M de symboles dans (N ? T)*, initialement vide. une pile E d'�tats de l'automate fini PV , initialement avec un �tat initial une sortie pour produire la d�rivation (ou l'arbre de) une table de transition T[{e}, N ? T] ? {e} pour les �tats de PV une table A g�n�r�e pour G, avec 4 actions {M} ? { D, R, A, E} D�caler: empile dans M le symbole courant de l'entr�e empile dans E l'�tat atteint = T[etat_courant, som(M)] avancer d'un symbole en entr�e R�duire: d�piler le manche dans M (p symboles en sommet de pile) d�piler p �tats dans E empile dans M le non terminal de la r�duction du manche empile dans E l'�tat atteint = T[etat_courant, som(M)] Accepter: si M = {l'axiome} et que l'entr�e = {#} Erreur: si pas d'action pr�vue dans A un analyseur ind�pendant de la grammaire G ex�cutant A en boucle, jusqu'� pile ou entr�e vide ?

37. Transparent 37 Analyseur g�n�rique LR(1) Actions boolean Action(LEX u) { Etat e = som().etat() ; switch (A[e, u] ){ "d�caler " => e' = T[e, u] ; emp(u, e') ; lex(u) ; break; " r�duire A? m" => e = som().etat() ; dep(e, m) ; emp("A", T[e, "A"] ) ; "succ�s" => return true; "erreur" => return false ; } } Analyseur function Analyse() { lex(ul); emp(Fond, Etat_Initial); while ul /= "#" { succes=Action(ul) } return succes ; } Grammaires LR() Propri�t� (rappel): pour k' > k >= 0, LR(k) => LR(k') ? Th�or�me: La propri�t� LR(k) d'une grammaire est ind�cidable (pour k non fix�) ? Corollaire: Il n'existe pas d'algorithme permettant de transformer une grammaire quelconque en une grammaire �quivalente LR(k) ; mais on peut toujours essayer sur une grammaire donn�e! Th�or�me: Une grammaire LR(1) est non ambigu� preuve: d'apr�s la propri�t� LR(1) il ne peut exister deux d�rivations distinctes pour deux mots identiques ? g�n�ralisation: ce r�sultat est vrai pour les grammaires LR(k) ? Complexit� de l'analyse LR() Th�or�me: L'analyse LR(1) d'un mot m est en O(|m|) preuve: d'apr�s le code ci-contre ? g�n�ralisation: ce r�sultat est vrai pour l'analyse LR(k) ? Langages LR() Th�or�me: LR(0) = LR(1) = LR(k) = ALG DETERMINISTE ? Remarque: En pratique, pour un langage donn�, on peut �tre amen� � pr�f�rer une grammaire LR(1), voire LR(2), � une grammaire LR(0) qui peut �tre beaucoup plus difficile � lire et volumineuse en nombre de r�gles de production. Th�or�me: La propri�t� LR(k) d'un langage est ind�cidable (pour k non fix�) ? Grammaires LR() Propri�t� (rappel): pour k' > k >= 0, LR(k) => LR(k') ? Th�or�me: La propri�t� LR(k) d'une grammaire est ind�cidable (pour k non fix�) ? Corollaire: Il n'existe pas d'algorithme permettant de transformer une grammaire quelconque en une grammaire �quivalente LR(k) ; mais on peut toujours essayer sur une grammaire donn�e! Th�or�me: Une grammaire LR(1) est non ambigu� preuve: d'apr�s la propri�t� LR(1) il ne peut exister deux d�rivations distinctes pour deux mots identiques ? g�n�ralisation: ce r�sultat est vrai pour les grammaires LR(k) ? Complexit� de l'analyse LR() Th�or�me: L'analyse LR(1) d'un mot m est en O(|m|) preuve: d'apr�s le code ci-contre ? g�n�ralisation: ce r�sultat est vrai pour l'analyse LR(k) ? Langages LR() Th�or�me: LR(0) = LR(1) = LR(k) = ALG DETERMINISTE ? Remarque: En pratique, pour un langage donn�, on peut �tre amen� � pr�f�rer une grammaire LR(1), voire LR(2), � une grammaire LR(0) qui peut �tre beaucoup plus difficile � lire et volumineuse en nombre de r�gles de production. Th�or�me: La propri�t� LR(k) d'un langage est ind�cidable (pour k non fix�) ?

38. Transparent 38 Grammaires SLR() items LR(0) pour E ::= E + T Grammaire ETF enracin�e E ' ::= E # (r0) E ::= E + T | T (r1 r2) T ::= T * F | F (r3 r4) F ::= var | ( E ) (r5 r6) Construction des analyseurs LR() La construction des analyseurs LR() pour une grammaire donn�e est fastidieuse: on utilise donc de pr�f�rence un g�n�rateur syntaxique LR comme YACC ou BISON. Cette construction repose sur le calcul de la table d'Actions et de la Table de Transition pour les �tats de l'automate des Pr�fixes Viables. Trois classes de grammaires, avec une inclusion stricte: SLR ? LALR ? LR permettent de r�aliser cette construction en utilisant l'analyseur g�n�rique LR pr�sent� pr�c�demment. Construction des analyseurs SLR On pr�sente une construction g�n�rale qui permet d'obtenir le d�coupage des manches par un Automate d'�tat fini. Dans le cas des grammaires, dites SLR, cette construction permet d'obtenir directement les tables d'analyse LR(). Dans la suite, on "enracine" les grammaires utilis�es par une r�gle de production ajout�e � P: { S'?S# } ; ceci afin de ne pas devoir traiter la derni�re "remont�e" vers S comme un cas particulier. D�finition: On appelle item LR(0) une production de P marqu�e en partie droite par "?" Interpr�tation: le marqueur mat�rialise la position courante de la reconnaissance ascendante de la r�gle ?Construction des analyseurs LR() La construction des analyseurs LR() pour une grammaire donn�e est fastidieuse: on utilise donc de pr�f�rence un g�n�rateur syntaxique LR comme YACC ou BISON. Cette construction repose sur le calcul de la table d'Actions et de la Table de Transition pour les �tats de l'automate des Pr�fixes Viables. Trois classes de grammaires, avec une inclusion stricte: SLR ? LALR ? LR permettent de r�aliser cette construction en utilisant l'analyseur g�n�rique LR pr�sent� pr�c�demment. Construction des analyseurs SLR On pr�sente une construction g�n�rale qui permet d'obtenir le d�coupage des manches par un Automate d'�tat fini. Dans le cas des grammaires, dites SLR, cette construction permet d'obtenir directement les tables d'analyse LR(). Dans la suite, on "enracine" les grammaires utilis�es par une r�gle de production ajout�e � P: { S'?S# } ; ceci afin de ne pas devoir traiter la derni�re "remont�e" vers S comme un cas particulier. D�finition: On appelle item LR(0) une production de P marqu�e en partie droite par "?" Interpr�tation: le marqueur mat�rialise la position courante de la reconnaissance ascendante de la r�gle ?

39. Transparent 39 Automates SLR() La fermeture ? ( { E'? ? E } ) E'? ?E E? ?E + T E? ?T T? ?T * F T? ?F F? ?var F? ?( E ) Les transitions LR(0) Fermeture d'un item LR(0) D�finition: Soit I un ensemble d'items, on note ? (I) la fermeture de I d�finie par: I ? ? si A?? ? B? ? ? alors B? ? g ? ? pour B? g ? P Interpr�tation: le marqueur indique que dans l'�tat I (ensemble I): on esp�re r�duire ?B? en A ? a d�j� �t� "remont�" il faut "remonter" B on ajoute donc � cet �tat I, toutes les possibilit�s pour "remonter" B ? Construction de l'Automate de Transition LR(0) Th�or�me: Le langage des pr�fixes viables d'une grammaire alg�brique est reconnu par l'automate TRANS de Transition LR(0) d�fini comme suit: les �tats de TRANS sont des fermetures ? les transitions sont d�finies par : TRANS[I, X] = ? ( {A?? X??} pour {A?? ?X? } ? I) o� I est un ensemble d'items et X ? N ? T l'�tat initial est ? ( {S'? ? S } ) tous les �tats sont terminaux Interpr�tation : les �tats de l'automate codent l'ensemble des parties droites possibles pour compl�ter le pr�fixe empil� en cours d'analyse ? Fermeture d'un item LR(0) D�finition: Soit I un ensemble d'items, on note ? (I) la fermeture de I d�finie par: I ? ? si A?? ? B? ? ? alors B? ? g ? ? pour B? g ? P Interpr�tation: le marqueur indique que dans l'�tat I (ensemble I): on esp�re r�duire ?B? en A ? a d�j� �t� "remont�" il faut "remonter" B on ajoute donc � cet �tat I, toutes les possibilit�s pour "remonter" B ? Construction de l'Automate de Transition LR(0) Th�or�me: Le langage des pr�fixes viables d'une grammaire alg�brique est reconnu par l'automate TRANS de Transition LR(0) d�fini comme suit: les �tats de TRANS sont des fermetures ? les transitions sont d�finies par : TRANS[I, X] = ? ( {A?? X??} pour {A?? ?X? } ? I) o� I est un ensemble d'items et X ? N ? T l'�tat initial est ? ( {S'? ? S } ) tous les �tats sont terminaux Interpr�tation : les �tats de l'automate codent l'ensemble des parties droites possibles pour compl�ter le pr�fixe empil� en cours d'analyse ?

40. Transparent 40 Items LR(0) Canoniques ? I ensemble d'items LR(0) ? X ? (N ? T) FERMETURE ? ( I ): ? I? ? ( I ) ? si [A? ??B ? ] ? ? ( I ) et [B? ? ] ? P, alors [B? ? ? ] ? ? ( I ) TRANSITIONS TRANS( I, X ) : ? TRANS( I, X ) = ? ( { [A? ?X? ? ] } , pour [A? ??X ? ] ? I ) C: Ensemble d'items canoniques ? ? ( { [E'? ? E] } ) ? C ? ? I ? C, TRANS(I, X) ? C D�finition: On appelle Items LR(0) canoniques les �tats atteignables dans TRANS � partir de l'�tat initial ? ( {S'? ? S } ) Construction des items LR(0) canoniques Items pour ETF D�finition: On appelle Items LR(0) canoniques les �tats atteignables dans TRANS � partir de l'�tat initial ? ( {S'? ? S } ) Construction des items LR(0) canoniques Items pour ETF

41. Transparent 41 Automates SLR() L'Automate des Pr�fixes Viables dans ETF Construction des items LR(0) canoniques Items pour ETF Construction des items LR(0) canoniques Items pour ETF

42. Transparent 42 Tables SLR pour ETF ETF est SLR Construction de la Table ACTION SLR On construit la table A d'analyse en appliquant les r�gles suivantes o� A?N, a?T ? {#} et Ip l'item LR(0) associ� � l'�tat p de l'Automate des pr�fixes viables. si A???a? ? Ip alors A[p, a] = "d�caler" si A??? ? Ip alors pour tout a ? Suivant(A): A[p, a] = "r�duire par A ? ? " si S'?S? ? Ip alors A[p, #] = "accepter" sinon A[p, a] = "erreur" Conflits pendant la construction de la table ACTION d�calage/r�duction: il existe Ip contenant les items: A???a? => A[p, a] = "d�caler" B??'? avec a ? Suite(B) =>A[p, a] = "r�duire " r�duction/r�duction: il existe Ip contenant les items: A??? et a ? Suiv(A) => A[p, a] = "r�d par A" B??'? et a ? Suiv(B) =>A[p, a] = "r�d par B" Construction de la Table ACTION SLR On construit la table A d'analyse en appliquant les r�gles suivantes o� A?N, a?T ? {#} et Ip l'item LR(0) associ� � l'�tat p de l'Automate des pr�fixes viables. si A???a? ? Ip alors A[p, a] = "d�caler" si A??? ? Ip alors pour tout a ? Suivant(A): A[p, a] = "r�duire par A ? ? " si S'?S? ? Ip alors A[p, #] = "accepter" sinon A[p, a] = "erreur" Conflits pendant la construction de la table ACTION d�calage/r�duction: il existe Ip contenant les items: A???a? => A[p, a] = "d�caler" B??'? avec a ? Suite(B) =>A[p, a] = "r�duire " r�duction/r�duction: il existe Ip contenant les items: A??? et a ? Suiv(A) => A[p, a] = "r�d par A" B??'? et a ? Suiv(B) =>A[p, a] = "r�d par B"

43. Transparent 43 Tables SLR pour ETF ETF est SLR, mais pas LR(0) Propri�t� LR() des grammaires D�finition: une grammaire est SLR(1) ou SLR, si la construction pr�c�dente de la table Action se termine sans conflit. ? Propri�t�: une grammaire est LR(0) ? SLR, si la construction pr�c�dente de la table Action se termine sans conflit et que pour chaque �tat, les actions (D, Ri ou Rj) ne d�pendent pas des Terminaux ? Grammaire ETF r�cursive gauche (r1, r2) E ? E + T | T (r3, r4) T ? T * F | F (r5, r6) F ? var | ( E ) Suivants pour ETF (r0) E : # (r1) E : + (r6) E : ) (r3) T : * (r2) T : + ) # (r4) F : * + ) # F = { * + ) # } => T = { * + ) # } => E = { + ) # } Propri�t� LR() des grammaires D�finition: une grammaire est SLR(1) ou SLR, si la construction pr�c�dente de la table Action se termine sans conflit. ? Propri�t�: une grammaire est LR(0) ? SLR, si la construction pr�c�dente de la table Action se termine sans conflit et que pour chaque �tat, les actions (D, Ri ou Rj) ne d�pendent pas des Terminaux ? Grammaire ETF r�cursive gauche (r1, r2) E ? E + T | T (r3, r4) T ? T * F | F (r5, r6) F ? var | ( E ) Suivants pour ETF (r0) E : # (r1) E : + (r6) E : ) (r3) T : * (r2) T : + ) # (r4) F : * + ) # F = { * + ) # } => T = { * + ) # } => E = { + ) # }

44. Transparent 44 Analyse LR(1) dans ETF Source v1 + v2 * v3 # Analyse SLR Grammaire ETF r�cursive gauche (r1, r2) E ? E + T | T (r3, r4) T ? T * F | F (r5, r6) F ? var | ( E ) Analyse ADR Le tableau ci_contre donne les �tats successifs d'un analyseur ADR pour le mot : v1 + v2 * v3. R�ssultat La suite des R�ductions ex�cut�es par l'Automate: R6 R4 R2 R6 R4 R6 R3 R1 est la suite des d�rivations inverses les + � droite pour le mot en entr�e Grammaire ETF r�cursive gauche (r1, r2) E ? E + T | T (r3, r4) T ? T * F | F (r5, r6) F ? var | ( E ) Analyse ADR Le tableau ci_contre donne les �tats successifs d'un analyseur ADR pour le mot : v1 + v2 * v3. R�ssultat La suite des R�ductions ex�cut�es par l'Automate: R6 R4 R2 R6 R4 R6 R3 R1 est la suite des d�rivations inverses les + � droite pour le mot en entr�e

45. Transparent 45 Un conflit dans la construction SLR Grammaire des affectations sur valeurs r�f�rences A ::= G = D | D (r1, r2) G ::= * D | var (r3, r4) D ::= G (r5) Items LR(0) canoniques Conflit dans la table Action[2, "="] = "d�caler" Action[2, "="] = "r�duire D ? G" Conflits pendant la construction de la table ACTION d�calage/r�duction: il existe un �tat I2 contenant les items: A?G?=D => A[2, "="] = "d�caler" D?G? => A[2, "="] = "r�duire par D?G " car A ? G=D ?*D=D => "=" ? Suivants(D) Exemple: le mot *v1= v2# se r�duit en *G avec = v2# en entr�e deux possibilit�s: r�duire G en D => *D = v2 ?G=v2 ?G=G ?G=D ? A => accepter d�caler =v2 => *G = v2 ?* G = G ?* G = D ?* A => erreur Interpr�tation: la grammaire pr�sent�e ici n'est pas ambigu�; le conflit provient de la technique SLR qui n'est pas assez puissante pour m�moriser suffisamment de contexte gauche; Apr�s avoir remonter une entr�e vers G, l'analyseur ne dispose pas d'assez d'information pour d�cider qu'il faut r�duire G car d�caler ne peut conduire � une bonne solution ! Conflits pendant la construction de la table ACTION d�calage/r�duction: il existe un �tat I2 contenant les items: A?G?=D => A[2, "="] = "d�caler" D?G? => A[2, "="] = "r�duire par D?G " car A ? G=D ?*D=D => "=" ? Suivants(D) Exemple: le mot *v1= v2# se r�duit en *G avec = v2# en entr�e deux possibilit�s: r�duire G en D => *D = v2 ?G=v2 ?G=G ?G=D ? A => accepter d�caler =v2 => *G = v2 ?* G = G ?* G = D ?* A => erreur Interpr�tation: la grammaire pr�sent�e ici n'est pas ambigu�; le conflit provient de la technique SLR qui n'est pas assez puissante pour m�moriser suffisamment de contexte gauche; Apr�s avoir remonter une entr�e vers G, l'analyseur ne dispose pas d'assez d'information pour d�cider qu'il faut r�duire G car d�caler ne peut conduire � une bonne solution !

46. Transparent 46 Grammaires LR() Grammaire SCC enracin�e S' ::= S # (r0) S ::= CC (r1) C ::= c C | d (r2 r3) items LR(1) SUIVANTS SUIV(S)= {#} SUIV(C) = {c d #} Extension des analyseurs SLR() aux LR() Dans l'analyse SLR on ex�cute l'action r�duire { A? ? } dans l'�tat Ip pour tout a?T ? {#} si A?? ? ? Ip et a ? Suivant(A) Or il se peut que ?? soit un pr�fixe viable mais pas ?Aa Un analyseur LR peut s'obtenir � partir de la construction SLR o� l'on ne r�duit ?? en ?A que si ?Aa est un pr�fixe viable D�finition: On appelle item LR(1) un couple [A? ? ?? , a], compos� d'un item LR(0) et d'un terminal a (de pr�vision ou d'anticipation) . D�finition:un item LR(1) [A? ? ? ? , a] est dit valide pour un pr�fixe viable ?? si: S *?d ?Aaw avec ?Aaw ?d ???aw Interpr�tation: si on a d�j� remont� ?? si ce qui suit en entr�e commence par ?a alors ???aw est une fsd dont la derni�re d�rivation est ?Aaw ?d ???aw la pr�vision a n'a aucun effet dans les items sans r�duction, de la forme A? ? ??, avec ? non vide. Extension des analyseurs SLR() aux LR() Dans l'analyse SLR on ex�cute l'action r�duire { A? ? } dans l'�tat Ip pour tout a?T ? {#} si A?? ? ? Ip et a ? Suivant(A) Or il se peut que ?? soit un pr�fixe viable mais pas ?Aa Un analyseur LR peut s'obtenir � partir de la construction SLR o� l'on ne r�duit ?? en ?A que si ?Aa est un pr�fixe viable D�finition: On appelle item LR(1) un couple [A? ? ?? , a], compos� d'un item LR(0) et d'un terminal a (de pr�vision ou d'anticipation) . D�finition:un item LR(1) [A? ? ? ? , a] est dit valide pour un pr�fixe viable ?? si: S *?d ?Aaw avec ?Aaw ?d ???aw Interpr�tation: si on a d�j� remont� ?? si ce qui suit en entr�e commence par ?a alors ???aw est une fsd dont la derni�re d�rivation est ?Aaw ?d ???aw la pr�vision a n'a aucun effet dans les items sans r�duction, de la forme A? ? ??, avec ? non vide.

47. Transparent 47 Automates LR() Grammaire SCC {S'? S # ; S? CC ; C? cC | d } ? ( [ S'? ? S, # ] ) S'? ?S, # S? ?CC , # C? ?cC, c|d C? ? d , c|d Les transitions LR(1) Fermeture d'un item LR(1) D�finition: Soit I un ensemble d'items LR(1) , on appelle ? (I) la fermeture de I d�finie par: I ? ? si [A?? ? B?, a]? ? alors [B? ? g, b]? ? pour [B? g ] ?P et b?Prem(?a) ? Construction de l'Automate de Transition LR(1) Th�or�me: Le langage des "pr�fixes viables suivis d'un terminal d'anticipation " d'une grammaire alg�brique est reconnu par l'automate T de Transition LR(1) d�fini comme suit: les �tats de T sont des fermetures ? les transitions sont d�finies par : T(I, X) = ?( [A?? X??, b] pour [A?? ?X?, b] ? I ) o� I est un ensemble d'items LR(1) et X ? N ? T l'�tat initial est ? ( [S'? ? S, #] ) tous les �tats sont terminaux ? Fermeture d'un item LR(1) D�finition: Soit I un ensemble d'items LR(1) , on appelle ? (I) la fermeture de I d�finie par: I ? ? si [A?? ? B?, a]? ? alors [B? ? g, b]? ? pour [B? g ] ?P et b?Prem(?a) ? Construction de l'Automate de Transition LR(1) Th�or�me: Le langage des "pr�fixes viables suivis d'un terminal d'anticipation " d'une grammaire alg�brique est reconnu par l'automate T de Transition LR(1) d�fini comme suit: les �tats de T sont des fermetures ? les transitions sont d�finies par : T(I, X) = ?( [A?? X??, b] pour [A?? ?X?, b] ? I ) o� I est un ensemble d'items LR(1) et X ? N ? T l'�tat initial est ? ( [S'? ? S, #] ) tous les �tats sont terminaux ?

48. Transparent 48 Construction des items LR(1) canoniques Items LR(1) pour SCC �tat I4: on reconna�t le premier "d" : on doit donc r�duire ssi le lookahead = "c" | "d" et erreur sinon �tat I7: on reconna�t le second "d" : on doit donc r�duire ssi le lookahead = "#" et erreur sinon �tat I3: on reconna�t les premiers "c" �tat I6: on reconna�t les seconds "c" Construction des items LR(1) canoniques Items LR(1) pour SCC �tat I4: on reconna�t le premier "d" : on doit donc r�duire ssi le lookahead = "c" | "d" et erreur sinon �tat I7: on reconna�t le second "d" : on doit donc r�duire ssi le lookahead = "#" et erreur sinon �tat I3: on reconna�t les premiers "c" �tat I6: on reconna�t les seconds "c"

49. Transparent 49 Automates LR(1) L'Automate des Transitions LR(1) dans SCC Construction des items LR(1) canoniques Items LR(1) pour SCC �tat I4: on reconna�t le premier "d" : on doit donc r�duire ssi le lookahead = "c" | "d" et erreur sinon �tat I7: on reconna�t le second "d" : on doit donc r�duire ssi le lookahead = "#" et erreur sinon �tat I3: on reconna�t les premiers "c" �tat I6: on reconna�t les seconds "c" Construction des items LR(1) canoniques Items LR(1) pour SCC �tat I4: on reconna�t le premier "d" : on doit donc r�duire ssi le lookahead = "c" | "d" et erreur sinon �tat I7: on reconna�t le second "d" : on doit donc r�duire ssi le lookahead = "#" et erreur sinon �tat I3: on reconna�t les premiers "c" �tat I6: on reconna�t les seconds "c"

50. Transparent 50 Tables LR(1) pour SCC Construction de la Table ACTION LR(1) On construit la table comme dans le cas SLR soit A?N, a?T ? {#} et Ip l'item LR(1) associ� � l'�tat p de l'Automate des pr�fixes viables. si [A???a?, b]? Ip alors A[p, a] = "d�caler" si [A???, a] ? Ip alors A[p, a] = "r�duire par A ? ? " si [S'?S?, #] ? Ip alors A[p, #] = "accepter" sinon A[p, a] = "erreur" �tat initial = [S'??S, #] transitions comme dans le cas SLR Etats et items LR(1) canoniques de SCC C? c?C , c|d C? c?C , # I3= C? ?cC , c|d I6= C? ?cC , # C? ?d , c|d C? ?d , # I4= C? d? , c|d I7= C? d? , # I8= C? cC? , c|d I9= C? cC? , # Propri�t� des grammaires LR(1) Th�or�me: La construction donn�e ci dessus est sans conflit pour toute grammaire LR(1) ? Construction de la Table ACTION LR(1) On construit la table comme dans le cas SLR soit A?N, a?T ? {#} et Ip l'item LR(1) associ� � l'�tat p de l'Automate des pr�fixes viables. si [A???a?, b]? Ip alors A[p, a] = "d�caler" si [A???, a] ? Ip alors A[p, a] = "r�duire par A ? ? " si [S'?S?, #] ? Ip alors A[p, #] = "accepter" sinon A[p, a] = "erreur" �tat initial = [S'??S, #] transitions comme dans le cas SLR Etats et items LR(1) canoniques de SCC C? c?C , c|d C? c?C , # I3= C? ?cC , c|d I6= C? ?cC , # C? ?d , c|d C? ?d , # I4= C? d? , c|d I7= C? d? , # I8= C? cC? , c|d I9= C? cC? , # Propri�t� des grammaires LR(1) Th�or�me: La construction donn�e ci dessus est sans conflit pour toute grammaire LR(1) ?

51. Transparent 51 Construction LR(1) vs SLR L'Automate des Transitions SLR dans SCC Construction SLR pour SCC Items LR(0) pour SCC les Items LR(0) regroupent des items LR(1) La construction SLR pour SCC est plus �conomique On fusionne I4 et I7 sans conflit de r�duction en I4: on doit r�duire (r3) ssi le lookahead = "c" | "d" en I7: on doit r�duire (r3) ssi le lookahead = "#" en I74: on r�duit dans tous les cas, et l'erreur (�ventuelle) sera d�tect�e plus tard les �tats I3 et I6 peuvent �tre fusionn�s sans conflit car les actions sont "shift". Idem pour I8 et I9 Construction SLR pour SCC Items LR(0) pour SCC les Items LR(0) regroupent des items LR(1) La construction SLR pour SCC est plus �conomique On fusionne I4 et I7 sans conflit de r�duction en I4: on doit r�duire (r3) ssi le lookahead = "c" | "d" en I7: on doit r�duire (r3) ssi le lookahead = "#" en I74: on r�duit dans tous les cas, et l'erreur (�ventuelle) sera d�tect�e plus tard les �tats I3 et I6 peuvent �tre fusionn�s sans conflit car les actions sont "shift". Idem pour I8 et I9

52. Transparent 52 Tables SLR pour SCC Construction pratique des analyseurs LR() La construction des analyseurs LR() repose sur le calcul de la table d'Actions et de la Table de Transitions pour les �tats de l'automate des Pr�fixes Viables. Quatre classes de grammaires, avec une inclusion stricte: LR(0) ? SLR ? LALR(1) ? LR(1) permettent de r�aliser cette construction en utilisant l'analyseur g�n�rique LR pr�sent� pr�c�demment. La construction SLR est efficace, mais la classe des langages atteints est insuffisante en pratique pour les LP. La construction LR(1) est plus co�teuse en m�moire, mais la classe des langages atteints couvre en pratique tous les LP. A titre d'exemple, on peut avoir pour la m�me grammaire: N �tats dans l'automate des transitions SLR N3 �tats dans l'automate des transitions LR les grammaires LALR(1) r�alisent un bon compromis complexit�/puissance d'expression; c'est la famille qui est support�e par les g�n�rateurs syntaxiques LR comme YACC ou BISON. Construction pratique des analyseurs LR() La construction des analyseurs LR() repose sur le calcul de la table d'Actions et de la Table de Transitions pour les �tats de l'automate des Pr�fixes Viables. Quatre classes de grammaires, avec une inclusion stricte: LR(0) ? SLR ? LALR(1) ? LR(1) permettent de r�aliser cette construction en utilisant l'analyseur g�n�rique LR pr�sent� pr�c�demment. La construction SLR est efficace, mais la classe des langages atteints est insuffisante en pratique pour les LP. La construction LR(1) est plus co�teuse en m�moire, mais la classe des langages atteints couvre en pratique tous les LP. A titre d'exemple, on peut avoir pour la m�me grammaire: N �tats dans l'automate des transitions SLR N3 �tats dans l'automate des transitions LR les grammaires LALR(1) r�alisent un bon compromis complexit�/puissance d'expression; c'est la famille qui est support�e par les g�n�rateurs syntaxiques LR comme YACC ou BISON.

53. Transparent 53 Grammaires LALR(1) Grammaire SCC {S'? S# ; S? CC ; C? cC | d } Fusion des items LR(1) I3= { [ C? c?C , c|d ], [ C? ?cC , c|d ], [ C? ?d , c|d ] } I6= { [ C? c?C , # ], [ C? ?cC , # ], [ C? ?d , # ] } I36= { [ C? c?C , c|d|# ], [ C? ?cC , c|d|# ], [ C? ?d , c|d|# ] } Construction des transitions LALR(1) Principe: On fusionne les �tats issus d'ensembles d'items LR(1) dont les ensembles d'items LR(0) ( "c�ur") sont identiques. D�finition: On appelle coeur d'un ensemble I d'items LR(1) l'ensemble d'items LR(0) [ A????] pour lesquels I contient un item LR(1) [A? ? ??, ak] (les ak peuvent �tre diff�rents) Pour tout c�ur C d�items LR(1) [A? ? ??, ak] , PREVISION( C )= {ak} ? SUIVANT(A) Construction LALR(1) "m�thode gourmande": Etant donn�e une table Action LR(1): la fusion d'�tats ayant le m�me coeur n'engendre aucun conflit "d�caler/r�duire". D�finition: une grammaire est LALR(1) si la fusion pr�c�dente n'engendre pas de conflit "r�duire/r�duire". Les conflits "r�duire/r�duire" cr��s par cette fusion sont rares en pratique (grammaires LR, non LALR). Remarque: la m�thode "gourmande" a peu d'int�r�t en pratique, puisqu'elle implique la construction des items LR(1). Construction des transitions LALR(1) Principe: On fusionne les �tats issus d'ensembles d'items LR(1) dont les ensembles d'items LR(0) ( "c�ur") sont identiques. D�finition: On appelle coeur d'un ensemble I d'items LR(1) l'ensemble d'items LR(0) [ A????] pour lesquels I contient un item LR(1) [A? ? ??, ak] (les ak peuvent �tre diff�rents) Pour tout c�ur C d�items LR(1) [A? ? ??, ak] , PREVISION( C )= {ak} ? SUIVANT(A) Construction LALR(1) "m�thode gourmande": Etant donn�e une table Action LR(1): la fusion d'�tats ayant le m�me coeur n'engendre aucun conflit "d�caler/r�duire". D�finition: une grammaire est LALR(1) si la fusion pr�c�dente n'engendre pas de conflit "r�duire/r�duire". Les conflits "r�duire/r�duire" cr��s par cette fusion sont rares en pratique (grammaires LR, non LALR). Remarque: la m�thode "gourmande" a peu d'int�r�t en pratique, puisqu'elle implique la construction des items LR(1).

54. Transparent 54 Construction LALR(1) Grammaire SCC {S'? S# ; S? CC ; C? cC | d } Noyaux LR(0) + pr�vision initiale I0= [ S'? ?S , # ] I1= [ S'? S? , # ] I2= [ S? C?C , # ] I3= [ C? c?C , c|d ] I4= [ C? d? , c|d ] I5= [ S? CC? , # ] I6= [ C? c?C , # ] I7= [ C? d? , # ] etc Construction LALR(1) "m�thode �conomique": On ne construit pas les Items LR(1): On construit seulement les "noyaux" des Items LR(0) On calcule it�rativement les symboles de pr�vision pour chaque noyau LR(0) D�finition: le noyau d'un ensemble d'items I est le sous-ensemble des items de I qui n'ont pas leur point ?en d�but de partie droite plus l'item initial [S' ? ? S, #] (il s'agit des items obtenus directement par transition et non pas par fermeture) Construction LALR(1) "m�thode �conomique": On ne construit pas les Items LR(1): On construit seulement les "noyaux" des Items LR(0) On calcule it�rativement les symboles de pr�vision pour chaque noyau LR(0) D�finition: le noyau d'un ensemble d'items I est le sous-ensemble des items de I qui n'ont pas leur point ?en d�but de partie droite plus l'item initial [S' ? ? S, #] (il s'agit des items obtenus directement par transition et non pas par fermeture)

55. Transparent 55 Construction LALR(1) Grammaire SGD {S'? S ; S? G = D | D ; G? * D | id ; D? G } Noyaux LR(0) + Passes Pr�vision I0= [S'? ?S] I1= [S'? S?] I2= [S? G?=D] [D? G?] I3= [S? D?] I4= [G? *?D] I5= [G? id?] I6= [S? G=?D] I7= [G? *D?] I8= [D? G?] I9= [S? G=D?] D�termination des symboles de pr�vision � partir des noyaux: Soit K le noyau d'un ensemble d'items I X ? (N ? T) # est un symbole de pr�vision factice pour repr�senter les symboles de pr�vision pour chaque item [B ? ??? ] ? K, si [A ? ??X?, a] ? ? ({[B ? ??? , #]}) et a ? # alors [A ? ?X??, a] ? TRANS(I,X) (g�n�ration spontan�e d'un symbole de pr�vision) si [A ? ??X?, #] ? ? ({[B ? ???, # ]}) alors [A ? ?X??, #] ? TRANS(I,X) (propagation des symboles de pr�vision) Exemple grammaire SGD ? ({[S' ? ?S, # ]}) = { [S' ? ?S, # ], [S ? ?G=D, # ], [S ? ?D, # ], [G ? ?*D, #/= ], [G ? ?id, # /= ], [D ? ?G, # ] }D�termination des symboles de pr�vision � partir des noyaux: Soit K le noyau d'un ensemble d'items I X ? (N ? T) # est un symbole de pr�vision factice pour repr�senter les symboles de pr�vision pour chaque item [B ? ??? ] ? K, si [A ? ??X?, a] ? ? ({[B ? ??? , #]}) et a ? # alors [A ? ?X??, a] ? TRANS(I,X) (g�n�ration spontan�e d'un symbole de pr�vision) si [A ? ??X?, #] ? ? ({[B ? ???, # ]}) alors [A ? ?X??, #] ? TRANS(I,X) (propagation des symboles de pr�vision) Exemple grammaire SGD ? ({[S' ? ?S, # ]}) = { [S' ? ?S, # ], [S ? ?G=D, # ], [S ? ?D, # ], [G ? ?*D, #/= ], [G ? ?id, # /= ], [D ? ?G, # ] }

56. Transparent 56 Construction LALR(1) Grammaire SGD {S'? S ; S? G = D | D ; G? * D | id ; D? G } Noyaux LR(0) + Passes Pr�vision I0= [S'? ?S] I1= [S'? S?] I2= [S? G?=D] [D? G?] I3= [S? D?] I4= [G? *?D] I5= [G? id?] I6= [S? G=?D] I7= [G? *D?] I8= [D? G?] I9= [S? G=D?] D�termination des symboles de pr�vision � partir des noyaux: Soit K le noyau d'un ensemble d'items I X ? (N ? T) # est un symbole de pr�vision factice pour repr�senter les symboles de pr�vision pour chaque item [B ? ??? ] ? K, si [A ? ??X?, a] ? ? ({[B ? ??? , #]}) et a ? # alors [A ? ?X??, a] ? TRANS(I,X) (g�n�ration spontan�e d'un symbole de pr�vision) si [A ? ??X?, #] ? ? ({[B ? ???, # ]}) alors [A ? ?X??, #] ? TRANS(I,X) (propagation des symboles de pr�vision) Exemple grammaire SGD ? ({[S' ? ?S, # ]}) = { [S' ? ?S, # ], [S ? ?G=D, # ], [S ? ?D, # ], [G ? ?*D, #/= ], [G ? ?id, # /= ], [D ? ?G, # ] }D�termination des symboles de pr�vision � partir des noyaux: Soit K le noyau d'un ensemble d'items I X ? (N ? T) # est un symbole de pr�vision factice pour repr�senter les symboles de pr�vision pour chaque item [B ? ??? ] ? K, si [A ? ??X?, a] ? ? ({[B ? ??? , #]}) et a ? # alors [A ? ?X??, a] ? TRANS(I,X) (g�n�ration spontan�e d'un symbole de pr�vision) si [A ? ??X?, #] ? ? ({[B ? ???, # ]}) alors [A ? ?X??, #] ? TRANS(I,X) (propagation des symboles de pr�vision) Exemple grammaire SGD ? ({[S' ? ?S, # ]}) = { [S' ? ?S, # ], [S ? ?G=D, # ], [S ? ?D, # ], [G ? ?*D, #/= ], [G ? ?id, # /= ], [D ? ?G, # ] }

57. Transparent 57 Classification des Grammaires Alg�briques

58. Transparent 58 Classification des Langages Alg�briques

59. Transparent 59 Quelques Environnements de Compilation (compiler-compiler) Java Compiler Compiler [tm] (JavaCC [tm]) - The Java Parser Generator http://javacc.java.net/ SYNTAX http://syntax.gforge.inria.fr/ Free Compiler Construction Tools http://www.thefreecountry.com/programming/compilerconstruction.shtml ANTLR, ANother Tool for Language Recognition, http://www.antlr.org/ The Compiler Generator Coco/R http://www.ssw.uni-linz.ac.at/Coco/

60. La Compilation sur le Webhttp://toutprogrammer.com/ Attribute Grammar Systems Code Generator Kits Soci�t�s Compiler Construction Kits Cross Compilers Functional GNU Compiler Collection Lexer and Parser Generators Object-Oriented Procedural Theory Transformation Tools

Compilation Analyses Lexicale, Syntaxique, et S mantique

Compilation Analyses Lexicale, Syntaxique, et S mantique

Presentation Transcript

mind mapping carte conceptuelle et carte s mantique

Compilation Analyses Lexicale, Syntaxique, et S mantique

Interface syntaxe-s mantique pour l extraction d information

Corese Moteur de recherche s é mantique pour RDF

Photon(s) + MET Analyses

S é mantique lexicale Vecteur conceptuels et TALN