160 likes | 341 Views
JavaCC Java compiler’s compiler (version générant du Javascript). Source lue par JavaCC. Options Program header Tokens Productions. options { STATIC = true; } PARSER_BEGIN(ExpressionCompiler) class ExpressionCompiler{ var variables = new Array(); // Javascript == Java
E N D
JavaCCJava compiler’s compiler(version générant du Javascript)
Source lue par JavaCC Options Program header Tokens Productions options { STATIC = true;} PARSER_BEGIN(ExpressionCompiler) class ExpressionCompiler{ var variables = new Array(); // Javascript == Java }// (exemple)PARSER_END(ExpressionCompiler) TOKEN :{// nom du fichier résultant <RIGHT_PAREN: ")" >| <PLUS: "+" >} void expr() : {}{ term() ("+" term() {génération de code;})* }
Option + header options {// obligatoire, seule possibilité STATIC = true;} PARSER_BEGIN(ExpressionCompiler)// Header class ExpressionCompiler{ var variables = new Array(); // Javascript == Java var varMap = new Array(); function keepVarName(name) { // code auxiliaire if (varMap[name]==undefined) { // si nécessaire varMap[name] = true; variables.push(name); } } }PARSER_END(ExpressionCompiler)
Exemples de tokens SPECIAL_TOKEN : // ignorés dans la grammaire, mais mémorisés{ < SPACE: " ">| < NBSP: "\240">| < CR: "\r">| < TABULATION: "\t">| < NEW_LINE: "\n">}TOKEN :{ <RIGHT_PAREN: ")" >| <LEFT_PAREN: "(" >| <PLUS: "+" >| <STAR: "*" >| <MINUS: "-" >} TOKEN :{ <INTEGER: ["0"-"9"] (["0"-"9"])*>| <IDENTIFIER: (["a"-"z"] | ["A"-"Z"]) (["a"-"z"] | ["A"-"Z"] |["0"-"9"] )* >}
Règles de production // principal void prog() : {}{ expr() <EOF>} void expr() : {}{ term() ("+" term() )* } void term() : {}{ factor() ("*" factor() )*} void factor() : {}{( <INTEGER> | <IDENTIFIER> | "(" expr() ")" )} Parseur d’expressions: 3 + ((x+11)*5 + 8)
Répétitions ( x )* 0 – n fois ( x )+ 1 – n fois ( x )? optionnel [ x ] même que ci-dessus void product() : { /*déclarations, init*/ } { ( tag() ) + ( <ID> ) * endTag() }
LOOKAHEAD void statement() : { var nb = 0;}{ "add" ( LOOKAHEAD (3)"A" "," nb=number() | "A" "," "B" | LOOKAHEAD ( "B" "," number() ) "B" "," nb=number() | "B" "," "B" ) }
Génération de code void factor() : { var t; } { ( t=<INTEGER> {res.push(parseInt(t.image));} | <IDENTIFIER> {res.push(token.image);} | "(" expr() ")" ) } // note: token est défini par défaut, il correspond au // dernier token rencontré
Transmission de variables void factor(entier) : { var t; } { ( t=<INTEGER> {res.push(parseInt(t.image)+entier);} | "(" expr() ")" ) { return t.image; } }
Génération d’un programme exécutable void factor() : { var myToken; }{ ( <INTEGER> {print("res.unshift(parseInt("+token.image+"))\n");} |myToken = <IDENTIFIER> {print("var x = g..ById('"+myToken.image+"').value\n"); print("res.unshift(parseInt(x))\n"); keepVarName(myToken.image);} | "(" expr() ")" )}
Tokens avec mêmes débuts TOKEN : { < COLON: ":" > | < ID: ":" (["a"-"z])* > } Texte lu: :234 <COLON> 2 3 4 :aaa <ID> Le token choisi est celui qui est le plus long possible. S’il y a deux solutions de même longueur, la première est sélectionnée.
JavaCC: queue des tokens et des “special tokens” Token next specialToken image Token next specialToken image Token next specialToken image Token next specialToken image Token next specialToken image tous les tokens du fichier lu on peut sauver le premier pour les parcourir tous à la fin de la compilation special tokens apparaissant dans l’ordre inverse des flèches
Compilation Fichiers générés ExpressionParser.js : le parseur ExpressionParserTokenManager.js : détection des tokens ExpressionParserConstants.js : numéro de chaque token
Appel des compilateurs générés par JavaCC var resfunction compile() {source à try {compiler initTokenManager();ExpressionParserTokenManager(new inputStream(sourceString) ) prog() // appel de la production initiale alert(res[0]) // montre le résultat créé par le parseur } catch (e) { alert(!e.mess?e:e.mess) // erreurs }}
Fichiers à importer dans l'application précédente <scripttype="text/javascript"src="ExpressionParser.js"></script><scripttype="text/javascript"src="ExpressionParserTokenManager.js"></script><scripttype="text/javascript"src="/LemanOS/Js/Stream.js"> Les deux premiers sont générés par JavaCC (les constantes ne sont pas nécessaires) Le troisième contient la gestion de la source à parser et compiler
Actions à faire générer par le parseur 2 5 3 8 2 5 3 2 5 11 pop push pop void expr() : {}{ term() ("+" term() { res.push(res.pop()+res.pop());} )* }