890 likes | 1.08k Views
Definições Prévias Linguagens Gramática. Fonte : http://www.icmc.sc.usp.br/~mdgvnune/download/sce5832/Teoria.html. Definições Prévias. Alfabeto ou Vocabulário: Conjunto finito não vazio de símbolos. Símbolo é um elemento qualquer de um alfabeto. Ex: { a,b}
E N D
Definições Prévias • Linguagens • Gramática Fonte: http://www.icmc.sc.usp.br/~mdgvnune/download/sce5832/Teoria.html
Definições Prévias Alfabeto ou Vocabulário: Conjunto finito não vazio de símbolos. Símbolo é um elemento qualquer de um alfabeto. Ex:{a,b} {0,1,2,3,4,5,6,7,8,9} Cadeia: Concatenação de símbolos de um alfabeto. Define-se como cadeia vazia ou nula uma cadeia que não contém nenhum símbolo. Ex: aab 123094 l - cadeia nula
Definições Prévias Comprimento de cadeia:Número de símbolos de uma cadeia.Ex:|aab| = 3 |123094|=6 |l|=0 Concatenação de cadeias: Define-se a concatenação zde uma cadeia xcom uma cadeia y, como sendo a concatenação dos símbolos de ambas as cadeias, formando a cadeia xy. |z| = |x| + |y| Ex:x = abaa; y = ba Þ z = abaaba x = ba; y = lÞ z = ba
Definições Prévias Produto de alfabetos: É o produto cartesiano de alfabetos. Ex: V1 = {a,b} V2 = {1, 2, 3} Þ V1.V2 = V1xV2 = {a1, a2, a3, b1, b2, b3} Observe que V1.V2 ¹ V2.V1 Exponenciação de alfabetos: São todas as cadeias de comprimento n sobre V (Vn). V0={l}, V1=V, Vn=Vn-1.V Ex: V = {0, 1} V3 = V2.V = (V.V).V = {00, 01, 10, 11}.{0, 1} = {000, 001, 010, 011, 100, 101, 110, 111}
Definições Prévias Fechamento (Clausura) de um Alfabeto: Seja A um alfabeto, então o fechamento de A é definido como A* = A0È A1 È A2È ... È An È ... Portanto A* = conjunto das cadeias de qualquer comprimento sobre o alfabeto a. Ex: A = {1} A* = {l, 1, 11, 111, ...} Fechamento Positivo de A: A+ = A* - {l}
Linguagens Linguagem é uma coleção de cadeias de símbolos, de comprimento finito. Estas cadeias são denominadas sentenças da linguagem, e são formadas pela justaposição de elementos individuais, os símbolos ou átomos da linguagem.
Linguagens Ex: {ab, bc} ( linguagem formada pelas cadeias ab e bc) {abn,anb; n=0} ( linguagem formada por todas as cadeias que começam com "a" seguido de um número qualquer de "b"'s ou começam com um número qualquer de "a"'s seguidos de um "b", por exemplo ab, abb, aab, aaab, ...)
Linguagens Métodos de Representação de Linguagens Uma linguagem pode ser representada através de três mecanismos básicos: 1) enumeração das cadeias de símbolos que formam as suas sentenças (somente linguagens finitas podem ser representadas por este método) 2) através de um conjunto de leis de formação das cadeias (ao conjunto de leis de formação dá-se o nome de Gramática) 3) através de regras de aceitação de cadeias (às regras de aceitação dá-se o nome de Reconhecedor)
Linguagens Enumeração Enumeração das cadeias de símbolos que formam as suas sentenças: todas as sentenças da linguagem aparecem explicitamente na enumeração, e a decisão acerca da pertinência ou não de uma cadeia à linguagem se faz por meio de uma busca da cadeia em questão no conjunto de sentenças da linguagem; Exemplo: L = {a, b, ab, ba} ( linguagem formada pelas cadeias a, b, ab e ba)
Linguagens Leis de Formação Através de um conjunto de leis de formação das cadeias (ao conjunto de leis de formação dá-se o nome de Gramática): dada uma cadeia de símbolos, só é possível afirmar que tal cadeia pertence à linguagem se for possível, aplicando-se as leis de formação que compõem a gramática da linguagem, derivar (sintetizar) a cadeia em questão. Ao processo de obtenção de uma sentença a partir da gramática dá-se o nome de derivação da sentença.
Linguagens Exemplo: G = ( {A, B}, {0, 1}, P, A) P: A Þ 0A A Þ B B Þ 1B B Þl
Linguagens Exemplo: G = ( {A, B}, {0, 1}, P, A) P: A Þ 0A A Þ B B Þ 1B B Þl Resp.: L(G) = {0n1m; n, m=0}
Linguagens Regras de aceitação de cadeias Através de regras de aceitação ou reconhecimento de cadeias (reconhecedor ou autômato): para decidir se uma cadeia é uma sentença da linguagem, basta aplicar a ela as regras de aceitação, as quais deverão fornecer a decisão acerca da pertinência da cadeia à linguagem.
Linguagens Exemplo: M = ({A, B, {0, 1}, f, A, {B}) f : f(A,0) Þ A f(A, 1) Þ B f(B, 1) Þ B f(B, 0) Þ A A Linguagem reconhecida é a de cadeias de 0's e 1's, terminando necessariamente com 1.
Gramáticas Formalmente as gramáticas, são caracterizadas como quádruplas ordenadas G = ( Vn, Vt, P, S) onde: Vnrepresenta o vocabulário não terminal da gramática. Este vocabulário corresponde ao conjunto de todos os símbolos dos quais a gramática se vale para definir as leis de formação das sentenças da linguagem.
Gramáticas Vté o vocabulário terminal,contendo os símbolos que constituem as sentenças da linguagem. Dá-se o nome de terminais aos elementos de Vt. P representa o conjunto de todas as leis de formação utilizadas pela gramática para definir a linguagem. Para tanto, cada construção parcial, representada por um não-terminal, é definida como um conjunto de regras de formação relativas à definicão do não-terminal a ela referente. A cada uma destas regras de formação que compõem o conjunto P dá-se o nome de produção da gramática.
Gramáticas Cada produção P tem a forma: a Þ b a Î (Vn U Vt)+; b Î (Vn U Vt)* S єVn denota a principal categoria gramatica de G; é dito o símbolo inicial ou o axioma da gramática. Indica onde se inicia o processo de geração de sentenças. Ex.1: G = ({S, A, B{, {a, b}, P, S) P: S => AB A => a B => b
Def1. Uma cadeia a g b gera diretamente (Þ) uma cadeia a d b se (g Þ d) Î P; a, b є(Vn UVt)* ; g є(Vn UVt)+ No Ex.1.: aB Þ ab; S Þ AB Def2. Uma cadeia a gera(Þ*) uma cadeia b se $ g1, g2,... gn,tal que a = g1Þ g2 ... Þ gn= b, n³ 0. Se n = 0 : a = b portanto a Þ*a para "a No Ex.1.: S Þ*ab; SÞ*aB; AB Þ*ab; ab Þ*ab Def3. Uma cadeia a Î (Vn È Vt)* é uma forma sentencial de G se S Þ*a ou seja, a é um embrião para uma cadeia gerada pela gramática. No Ex.1: aB, AB, Ba, S, ab são formas sentenciais.
Uma forma sentencial, a, é uma sentença de G se S Þ*a e a Î Vt*. Ou seja, as cadeias geradas pela gramática são as sentenças de G. Def4. A Linguagem L gerada por uma gramática G é definida como o conjunto de cadeias geradas por G. Ou seja, L(G) = {x є Vt*| S Þ* x} ou {x|x é sentença de G}
Gramáticas Exemplo: Gramática G1 = (V1, S1, P1, A) onde: V1 = {A, B} S1 = {0, 1} P1: A Þ 0A A Þ B B Þ 1B B Þl Exercício: Verifique que L(G) = {0n1m} Faça a árvore de derivação para x=00111
Def5.Duas gramáticas G1 e G2 são equivalentes sse L(G1) = L(G2) Def6. Uma sentença é ambígua se $ duas ou mais seqüências de derivação que a define. Def7. Uma gramática é ambígua se possui alguma sentença ambígua. Ex2. G: S => A B A => A A | B | a B => B c d | A Verifique se x= aaacd é ambígua. Gramáticas
Gramáticas Até este ponto não foi imposta qualquer restrição sobre a gramática ou sobre as produções que denotam as leis de formação da linguagem que está sendo definida. As gramáticas gerais têm limitações em relação à sua aplicabilidade no contexto do estudo dos compiladores, devido às dificuldades que acarretam em seu tratamento, sendo que as linguagens de programação de interesse não exigem toda a generalidade que as gramáticas gerais definidas acima são capazes de oferecer.
Gramáticas Torna-se atraente o estudo de casos particulares, de aplicação mais restrita, porém suficiente para resolver os problemas levantados ao se projetar compiladores para linguagens de interesse. Sendo assim, dividimos as gramáticas em quatro classes, que serão vistas a seguir.
Gramáticas Classes Gramaticais Conforme as restrições impostas ao formato das produções de uma gramática, a classe de linguagens que tal gramática gera varia correspondentemente. A teoria mostra que há quatro classes de gramáticas capazes de gerar quatro classes correspondentes de linguagens, de acordo com a denominada Hierarquia de Chomsky.
Gramáticas • Gramáticas com Estrutura de Frase ou Tipo 0 • Gramáticas Sensíveis ao Contexto ou Tipo 1 • Gramáticas Livres de Contexto ou Tipo 2 • Gramáticas Regulares ou Tipo 3
Gramáticas GEF Gramáticas com Estrutura de Frase ou Tipo 0 São aquelas às quais nenhuma limitação é imposta. Obviamente, todo o universo das linguagens que se pode definir através dos mecanismos generativos definidos pelas gramáticas corresponde exatamente ao conjunto das linguagens que esta classe de gramáticas é capaz de gerar. Esta classe de gramáticas a hierarquia de Chomsky classifica como sendo a das Gramáticas com Estrutura de Frase (GEF) ou Tipo 0. Para essas gramáticas, as produções são todas da forma: a Þ b, a Î (Vn U Vt)+, b Î (Vn U Vt)*.
Gramáticas GEF Exemplo: G = ({A, B, C}, {a, b}, P, A) P: A Þ BC BC Þ CB B Þ b C Þ a
Gramáticas GEF Exemplo: G = ({A, B, C}, {a, b}, P, A) P: A Þ BC BC Þ CB B Þ b C Þ a Resp.: L(G) = {ba, ab}
Definição 0: As linguagens geradas pelas Gramáticas com Estrutura de Frase ou do Tipo 0 são chamadas de Linguagens com Estrutura de Frase (LEF) ou Linguagens do Tipo 0. Linguagens LEF
Gramáticas GSC Gramáticas Sensíveis ao Contexto ou Tipo 1 Se às regras de substituição for imposta a restrição de que nenhuma substituição possa reduzir o comprimento da forma sentencial à qual a substituição é aplicada, cria-se uma classe de gramáticas ditas sensíveis ao contexto. As gramáticas que obedecem a estas restrições pertencem, na hierarquia de Chomsky, ao conjunto das Gramáticas Sensíveis ao Contexto (GSC) ou do Tipo 1.
Gramáticas GSC Para as GSC, as produções são todas da forma a Þ b,com |a||b|onde a, bÎ (Vn U Vt)+ (há uma exceção permitida: S Þ l, se S não ocorre do lado de direto de nenhuma regra)
Gramáticas GSC Essas gramáticas são chamadas de sensíveis ao contexto por tornarem possível a definição de regras do tipo: bAg Þ bag, onde A ÎVn, a Î(Vn U Vt)+, b,gÎ(Vn U Vt)* Ou seja, A, no contexto de b e g, é substituído por a.
Gramáticas GSC Exemplo: G = ({S, B, C}, {a, b, c}, P, S) P : S Þ aSBC S Þ aBC CB Þ BC aB Þ ab bB Þ bb bC Þ bc cC Þ cc Resp.: L(G) = {anbncn | n>=1}
Definição 1: As linguagens geradas pelas Gramáticas Sensíveis ao Contexto ou do Tipo 1 são chamadas de Linguagens Sensíveis ao Contexto (LSC) ou Linguagens do Tipo 1. Resultado 1: Toda gramática do tipo 1 é também do tipo 0. Corolário 1: Toda LSC é também uma LEF (mas nem toda LEF é LSC). Linguagens LSC
Gramáticas GLC Gramáticas Livres de Contexto ou Tipo 2 As Gramáticas Livres de Contexto (GLC) ou do Tipo 2 são aquelas cujas regras de produção são da forma: A Þ a onde A Î Vn, a Î (Vn U Vt)* Ou seja, quando do lado esquerdo da regra há apenas um símbolo não-terminal.
GLC e LLC Definição 2: As linguagens geradas pelas Gramáticas Livres de Contexto ou do Tipo 2 são chamadas de Linguagens Livres de Contexto (LLC) ou Linguagens do Tipo 2. Resultado 2: Nem toda gramática do tipo 2 é também do tipo 1. Isso acontece porque as regras da forma A Þ l não satisfazem a restrição de comprimento, pois|A| > | l|, já que 1 > 0. Resultado 2´: Apesar do Resultado 2, é possível mostrar que toda LLC é também uma LSC (mas nem toda LSC é uma LLC). (qualquer GLC pode ser transformada em uma gramática equivalente à original que satisfaz simultaneamente as definições de GLC e de GSC)
Outra maneira de se representar as Gramáticas Livres de Contexto é através da Forma Normal de Backus. BNF Neste caso, => é substituído por ::= e os não terminais são ladeados por < > No caso de repetições de lado esquerdo: <A> ::= a1 <A >::= a2 : <A> ::= an escreve-se: <A> ::= a1| a2| ...| an Os símbolos <,> , :, =, | formam a metalinguagem, ou seja, são símbolos que não fazem parte da linguagem mas ajudam a descrevê-la. BNF
Exemplo: G = {Vn, Vt, P, S} onde: Vn = {<sentença, <sn, <sv, sujeito, <predicado, <artigo, <substantivo, <verbo, <complemento} Vt = {o, a, peixe, comeu, isca} S = <sentença P = 1. <sentença> ::= <sn><sv> 2. <sn> ::= <artigo><substantivo> 3. <sv> ::= <verbo><complemento> 4. <complemento> ::= <artigo><substantivo> 5. <artigo> ::= o|a 6. <verbo> :: = mordeu 7. <substantivo> ::= peixe|isca Exercícios: verifique se a cadeia “a isca mordeu o peixe” é uma sentença de L(G). Dê exemplos de sentenças de L(G), construindo árvores de derivação sintática. GLC e LLC
GLC e LLC • Exemplo 1:G = ({S}, {a, +, *, (, )}, P, S) P : • S Þ S * S S Þ S + S S Þ (S) S Þ a • L(G) = conjunto das expressões aritméticas envolvendo *, +, ( ) e a. • Um exemplo de cadeia formada por esta gramática é • a * (a + a).
GLC e LLC • Exemplo 2: G = ({S, A, B}, {a, b}, P, S) P : S Þ aB | bA A Þ a | aS | bAA B Þ b | bS | aBB • L(G) = { x Î Vt+ | x contém número de a's igual ao número de b's } • Exercício: mostre que isso é verdade, por indução sobre o comprimento de uma sentença. • Hipótese Indutiva: para todo w Î Vt*, • S Þ* w sse w consiste de = no. de a´s e b´s. • A Þ* w sse w tem um a a mais que b´s. • B Þ* w sse w tem um a b mais que a´s.
GLC e LLC Exemplo 3: Processo inverso: dada L(G), definir G. L(G) = {0n12n0m | n ≥0, m ≥0 }
GLC e LLC Exemplo 3: Processo inverso: dada L(G), definir G. L(G) = {0n12n0m | n ≥0, m ≥0 } Resp.: G= ({S, A, B}, {0, 1}, P, A) P: S Þ AB A Þ 0A11 | lB Þ 0B | l
GLC e LLC Exemplo 4: L(G) = {ambn | m ≥ 0, n ≥ 0 }
GLC e LLC Exemplo 4: L(G) = {ambn | m≥0, n≥0 } ou a*b* Resp.: G=({S, A, B}, {a, b}, P, S) P: S Þ AB A Þ aA | a B Þ bB | b Obs.: Caso geral: Se S Þ aS|b então L(G) = a*b
GLC e LLC Exemplo 5: L(G) = {anbn | n ≥ 1}
Exemplo 5: L(G) = {anbn | n ≥ 1} S Þ aSb | ab GLC e LLC
GLC e LLC Exemplo 6: G = ({E, T, F}, { i, +, -, *, /, ^}, P, E) P : E Þ T | E + T | E - T T Þ F | T * F | T / F F Þ i | F ^ i (recursiva à esquerda) Verifique a ordem de precedência dos operadores via árvore de derivação sintática: i - i * i + i ^ i i + i * i i * i + i i + i + i
Precedência de Operadores - Concluindo: Operadores que aparecem em regras mais distantes do axioma S têm maior precedência do que os que aparecem mais próximo. ^ precede * e /, que precedem + e – * e / têm igual precedência + e – têm igual precedência Precedência Operadores
Operadores que estão a uma mesma distância do axioma (portanto de igual precedência) têm prioridade definida pela recursividade do não-terminal do lado esquerdo da regra: se à esquerda, primeiro o da esquerda; se à direita, primeiro o da direita. i + i – i ≈ ((i + i) – i) i + i * i / i ≈ (i + ((i * i) / i)) i ^ i ^ i - i ≈ (((i ^ i) ^ i) – i) Precedência Operadores
Gramáticas GR Gramáticas Regulares ou Tipo 3 Aplicando-se mais uma restrição sobre a forma das produções, pode-se criar uma nova classe de gramáticas, as Gramáticas Regulares (GR), de grande importância no estudo dos compiladores por possuírem propriedades adequadas para a obtenção de reconhecedores simples. Nas GRs, as produções são restritas às formas seguintes: A Þ aB A Þ a A Þl onde A,B Î Vn e a Î Vt