340 likes | 658 Views
Program Subjek. Program Objek. ANALISIS. SINTESIS. Penganalisis Leksikal (Scanner). Penganalisis Sintaks (Parser). Penganalisis Semantik. Pembentuk Kode. Pengoptimal Kode. TABEL. Komponen sebuah Kompilator. Scanning.
E N D
Program Subjek Program Objek ANALISIS SINTESIS Penganalisis Leksikal (Scanner) Penganalisis Sintaks (Parser) Penganalisis Semantik Pembentuk Kode Pengoptimal Kode TABEL Komponen sebuah Kompilator
Scanning • Scanning termasuk ke dalam analisis lexical, yaitu proses untuk mengidentifikasi satuan terkecil dari Bahasa, yang disebut Token / Terminal / Daun (identifier, keyword,label, operator aritmetika dan assignment, operator relasional, tanda baca, dsb) • Aspek dalam Scanner : • Bagaimana bentuk dan penyajian Token. Metode yang digunakan Grammar Regular dan Ekspresi Regular • Pengenalan Token. Metode yang digunakan Automata Hingga, dengan penyajian menggunakan Diagram Transisi
Scanning (cont.) • Scanner berinteraksi dengan Parser, dengan cara : • Scanner mengolah Program Source secara terpisah sebagai satu fase, dimana token disimpan dalam sebuah tabel sebelum Parser bekerja • Scanner berinteraksi dengan Parser, dimana scanner dipanggil oleh parser bila token dalam program source diperlukan
Automata Hingga (AH) • Automata Hinga (AH) / Finite state Automaton (FA) adalah suatu struktur abstrak yang didefinisikan, terdiri dari : • Himpunan Hingga A berisi simbol Input • Himpunan Hingga S berisi State (internal state) • Himpunan Hingga Z berisi simbol output • Sebuah fungsi f: S x Z S, disebut fungsi next state • Sebuah fungsi g: S x A Z, disebut fungsi output • AH berhubungan dengan Regular Grammar • Jenis AH : • AH Determinstik (AHD) • AH Non Deterministik (AHN) • AHN dengan transisi untai hampa
Automata Hingga Deterministik (AHD) • Automata Hinga Deterministik (AHD) didefinisikan dengan 5 tupel • Himpunan Hingga internal state (S) • Himpunan Hingga simbol input (V) • Sebuah fungsi f: S x V S ; merupakan fungsi next state • State awal (q0 S) • Himpunan hingga state penerima S • AHD sering digambarkan dengan cara : • Table Transisi State • Transisi Digraph
Automata Hingga Deterministik (AHD) (cont.) Contoh : Diketahui AHD dengan 2 simbol input dan 3 state, • V = { a,b} • S = { q0, q1, q2) • T = {q0, q1} state penerima • q0 sebagai state awal • Fungsi next state didefinisikan f:(S,V)
q2 q0 q1 Automata Hingga Deterministik (AHD) (cont.) b b a a b a • Periksalah string berikut : • aba • q0 q0 q1 q0 (diterima) • 2. aabbaa • q0 q0 q0 q1 q2 q2 q2 (ditolak, state penerima yang ditentukan adalah q0 dan q1, bukan q2)
d Start Integer OUT d delimeters Automata Hingga Deterministik (AHD) (cont.) Contoh : Identifikasi Integer String Grammar : <integer> ::= <digit> | <integer><digit> (Accept)
<letter> Start Error Identifier <letter> <digit> <digit> Automata Hingga Deterministik (AHD) (cont.) Contoh : Identifikasi Identifier String <identifier> ::= <letter>|<identifier><letter>|<identifier><digit>
Lexical Analysis (scanner) - berhubungan dengan bahasa • Mengidentifikasikan semua besaran yang membuat suatu bahasa • Mentransformasikan ke token-token • Menentukan jenis dari token-token • Menangani kesalahan • Menangani tabel simbol • Scanner, didesign untuk mengenali - keyword, operator, identifier • Token : separates characters of the source language into group that logically belong together • Misalnya : konstanta, nama variabel ataupun operator dan delimiter (atau sering disebut menjadi besaran lexical)
Lexical Analysis ( Besaranleksikal ) • Identifier dapat berupa keyword atau nama kunci, seperti IF..ELSE, BEGIN..END (pada Pascal), INTEGER (pascal), INT, FLOAT (Bhs C) • Konstanta : Besaran yang berupa bilangan bulat (integer), bilangan pecahan (float/Real), boolean (true/false), karakter, string dan sebagainya • Operator; Operator arithmatika ( + - * / ), operator logika ( < = > ) • Delimiter; Berguna sebagai pemisah/pembatas, seperti kurung-buka, kurung -tutup, titik, koma, titik-dua, titik-koma, white-space • White Space: pemisah yang diabaikan oleh program, seperti enter, spasi, ganti baris, akhir file
Lexical Analysis - Contoh • Contoh 1: ada urutan karakter yang disebut dengan statement fahrenheit := 32 + celcius * 1.8, Maka akan diterjemahkan kedalam token-token sepertidibawah ini identifier fahrenheit operator := integer 32 operator penjumlahan + Identifier celcius operator perkalian * real / float 1.8
Lexical Analysis - Contoh 2 • Setiap bentuk dari token di representasi sebagai angka dalam bentuk internal, dan angkanya adalah unik • Misalnya nilai 1 untuk variabel, 2 untuk konstanta, 3 untuk label dan 4 untuk operator, dst • Contoh instruksi : • Kondisi : IF A > B THEN C = D; • Maka scanner akan mentransformasikan kedalam token-token, sbb:
Lexical Analysis - Contoh 2 • Kondisi 3 • : 26 • IF 20 • A 1 • > 15 • B 1 • THEN 21 • C 1 • D 1 • ; 27 Token-token ini sebagai inputan untuk syntax Analyser , token-token ini bisa berbentuk pasangan item. Dimana Item pertama menunjukkan alamat atau lokasi dari token pada tabel simbol. Item kedua adalah representasi internal dari token. Semua token direpresentasikan dengan informasi yang panjangnya tetap (konstan), suatu alamat (address atau pointer) dan sebuah integer (bilangan bulat)
Syntax Analyzer (Parsing) • Pengelompokan token-token kedalam class syntax (bentuk syntax), seperti procedure, Statement dan expression • Grammar : sekumpulan aturan-aturan, untuk mendefinisikan bahasa sumber • Grammar dipakai oleh syntax analyser untuk menentukan struktur dari program sumber • Proses pen-deteksian-nya (pengenalan token) disebut dengan parsing
Syntax Analyzer • Maka Syntax analyser sering disebut dengan parser • Pohon sintaks yang dihasilkan digunakan untuk semantics analyser yang bertugas untuk menentukan ‘maksud’ dari program sumber. • Misalnya operator penjumlahan maka semantics analyser akan mengambil aksi apa yang harus dilakukan
Contoh • Terdapat statement : ( A + B ) * ( C + D ) • Akan menghasilkan bentuk sintaksis: <factor>, <term> & <expression>
Syntax tree • Pohon sintaks/ Pohon penurunan (syntax tree/ parse tree) beguna untuk menggambarkan bagaimana memperoleh suatu string dengan cara menurunkan simbol-simbol variable menjadi simbol-simbol terminal. • Misalnya: S AB A aA | a B bB | B Penurunan untuk menhasilkan string aabbb
Parsing atau Proses Penurunan Parsing dapat dilakukan dengan cara : • Penurunan terkiri (leftmost derivation) : simbol variable yang paling kiri diturunkan (tuntas) dahulu • Penurunan terkanan (rightmost derivation): variable yang paling kanan diturunkan (tuntas) dahulu • Misalkan terdapat ingin dihasilkan string aabbaa dari context free language: S a AS | a, A SbA | ba
Parsing atau Proses Penurunan Penurunan kanan : S => aAS => aAa => aSbAa => aSbbaa => aabbaa Penurunan kiri : S => aAS => aSbAS => aabAS => aaabbaS => aabbaa
Parsing Misalnya: S -> aB | bA A -> a | aS |bAA B -> b | bS | aBB Penurunan untuk string aaabbabba Dalam hal ini perlu untuk melakukan percobaan pemilihan aturan produksi yang bisa mendapatkan solusi
Metode Parsing Perlu memperhatikan 3 hal: • Waktu Eksekusi • Penanganan Kesalahan • Penanganan Kode Parsing digolongkan menjadi: • Top-Down Penelusuran dari root ke leaf atau dari simbol awal ke simbol terminal metode ini meliputi: • Backtrack/backup : Brute Force • No backtrack : Recursive Descent Parser • Bottom-Up Metode ini melakukan penelusuran dari leaf ke root
Parsing • Parsing adalah konsturksi atau pembentukan Pohon Sintaks untuk suatu kalimat (ekspresi) • Bila terdapat lebih dari satu pohon sintaks untuk sebuah grammar maka dikatakan grammar tersebut Ambiguous. • Dua cara melakukan validitas sintaks dengan parsing : • TOP DOWN Parsing : melakukan derivasi string dari NT • BOTTOM UP Parsing : melakukan reduksi simbol ke NT
1 2 3 S ……. NT11 NT1n NT12 t NT21 Parsing Top Down • Jika adalah input string, maka derivasi dari Top Down Parse dapat ditunjukkan sebagai berikut : S … … … • Parse Tree untuk Top Down Parsing selalu dimulai dari sebelah kiri
<identifier> <identifier> <identifier> <identifier> <identifier> <digit> <identifier> <identifier> <identifier> <digit> <digit> <digit> 2 <letter> <letter> <letter> x x Parsing Top Down(cont.) Contoh : Parsing Top Down untuk identifier x2 Derivasinya : <identifier> <identifier><digit> <letter><digit> x <digit> x2 a. <identifier> c d e b
E T + E V T id V * T id V id Parsing Top Down(cont.) Contoh : ekspresi a + b * c grammar : E ::= T + E | T T ::= V * E | V V ::= <id>
<identifier> <identifier> <identifier> <identifier> <letter> <letter> <letter> <letter> x x x x x 2 2 2 2 2 <letter>2 <identifier><digit> x2 <identifier>2 <digit> <digit> Parsing Bottom Up • Parsing Bottom Up membangun pohon sintaks melalui urutan simbol yang direduksi, atau dimulai dengan sebuah string hingga mencapai simbol start Grammar • Contoh : diketahui identifier x2, dengan parsing bottom up menjadi : <identifier> d a b e c
Relasi Preseden dan Pemakaiannya • Teknik parsing pada metode Bottom-Up dilakukan dengan mencari berulang-ulang, handle (leftmost simple phrase) u dari bentuk sentensial saat itu dan mereduksinya menjadi suatu nonterminal U dnegan memakai reduksi U u • Jadi tujuan utamanya adalah mencari Handle dari sebuah bentuk sentensial yaitu simple phrase terkiri (leftmost) dari bentuk sentensial tersebut. • Masalah tersebut diselesaikan dengan Grammar Preseden
U ….. ……….. R S…. handle Relasi Preseden dan Pemakaiannya (cont.) Misal, R dan S berada dalam suatu grammar G. Beberapa bentuk sentensial dapat dibentuk dari simbol R dan G tersebut (…RG…..). Ada tiga kemungkinan yang timbul dalam handle yang dibuat dari R dan S. • R adalah bagian dari suatu handle tapi S tidak (R S) • dikatakan R > S (R memiliki Preseden atas S). • R harus merupakan ekor dari beberapa produksi U …R. • Karena handle berada di kiri S,maka S harus merupakan terminal
U ..…. …. …. ….. … RS.. handle U ……. …R S ……….. Relasi Preseden dan Pemakaiannya (cont.) • R dan S keduanya adalah bagian dalam suatu handle (R S) • dikatakan R dan S memiliki Preseden yang sama, dan harus direduksi secara bersamaan waktu • Harus ada suatu produksi U …RS... • S adalah bagian dari suatu handel, tetapi R tidak (S R) • dikatakan R < S • S merupakan kepala dari beberapa produksi U S….. handle
Z b M b a Relasi Preseden dan Pemakaiannya (cont.) Contoh : Diketahui, Grammar dengan simbol Start Z dan produksi : • Z bMb • M (L | a • L Ma) Berikut ini akan ditunjukkan bentuk sentensial, phon sintaks,handel dari relasi yang dapat diturunkan dari produksi. • Bentuk sentensial : bab Pohon Sintaks : Handel : a Relasi yang diberikan Pohon : b a a b
Z Z b b M M b b ( ( L L M a ) Relasi Preseden dan Pemakaiannya (cont.) • Bentuk sentensial : b(Lb Pohon Sintaks : Handel : (L Relasi yang diberikan Pohon : b ( ( L L b • Bentuk sentensial : b(Ma)b Pohon Sintaks : Handel : Ma) Relasi yang diberikan Pohon : b ( ( L L b