130 likes | 490 Views
Otomata Teorisinin Uygulama Alanları. ve DİlİMLEyİCİ(LEXİCAL ANALYSER) ÖrNEĞİ. Sunumun sebebi hakkında. Uygulama Alanları. Uygulama Alanları = q'lar ve 1 ve 0'lar ne olabilir?. Bu sunuda derleyiciler alanındaki uygulamasını göreceğiz. Doğal dil işleme(nlp) Biyoloji
E N D
Otomata Teorisinin Uygulama Alanları ve DİlİMLEyİCİ(LEXİCAL ANALYSER) ÖrNEĞİ
Uygulama Alanları Uygulama Alanları = q'lar ve 1 ve 0'lar ne olabilir? Bu sunuda derleyiciler alanındaki uygulamasını göreceğiz. Doğal dil işleme(nlp) Biyoloji (Hücresel Otomat, Game of Life) Sıvı akışları Kozmoloji Derleyiciler
Bizim sunumuzun içeriği • Derste öğrendiklerimizin derleyicilerde nasıl kullanıldığı • Basit bir dilimleyici projesi • Derste gördüğümüz NFA-Boş • Kısacık bir Jflap özeti ve NFA-Boş'tan NFA'ya • NFA'dan Jflap ile DFA'ya geçiş • DFA geçiş tablosu ve önemi • Teoriden koda • TürkÇE'nin dilimleyicisinden örnek
Derste öğrendiklerimiz makineler Alfabe = {a,b}
Derleyicilerde kullanılan makineler Alfabe = {a,b,c,ç,d,e...z,A,B,C...Z} Tabi bu sadece bir anahtar kelime için verilmiş bir örnek, ileride ne kadar karmaşık olacağını göreceğiz.
Bizim sonlu sayıda(finite-state) makinasını anlamak için yapacağımız küçük proje • Proje kendisine gelen bir kaynak dosyasından, belli formatlardaki e-posta adreslerini, telefon numaralarını ve adresleri ayıklayan ve yanlarına e-posta, tel ve adres yazdıran küçük bir uygulama olacak. Bu formatlar aşağıdaki gibidir: • ==> ........@.....(.)com • ==> +90...-...-..-.. • ==> Apt:..../No:....İzleyeceğimiz yol: bizim gereksinimlerimize göreRegular Expression == > NFA ==> DFA ==> Geçiş Tablosu ==> Tabloda gezen for döngüsü
Regular Expression • Derste gördüğümüz bir regular expression • r = a(a+b)*aa • Bu regular expression'un ürettiği diziler: L = { aaaaa,abbabaa..} • Fakat bize iki harf yetmeyeceğinden • r = (a+b+c+d+e+f+..+z), r yerinede harf diyelim • harf = (a+b+c+d..+z) • rakam = (0+1+2+3+4+5+6+7+8+9) • isim = (harf)(harf+rakam)*
Projemizin Regular Expression'ları Basit bir regular exp. örneği r = a(a+b)*aa • ==> ........@.....(.)com • ==> +90...-...-..-.. • ==> Apt:..../No:.... • harf = (a+b+c+d..+z) • rakam = (0+1+2+3+4+5+6+7+8+9) • isim = (harf)(harf+rakam)* • e-posta = isim '@' isim '.' com • tel = '+90' (rakam)^3 '-' (rakam)^3 '-' (rakam)^2 '-' (rakam)^2 • adres = 'Apt:' isim '/No:' isim • Not: (^ işareti üssüyü ifade etmektedir. 'x' tırnak işareti ise x'in mutlaka dizgide olacağını ifade eder. Biraz önceki regular expression'u hatırlayalım:
DFA'dan Geçiş Tablosu Bu tablo iki boyutlu A dizisi olsun örnek olarak input[] = {abc} olsun
Sonuç • Bir e-posta regular expression'u için bu kadar karmaşık işlemler gerektiriyor, hem e-posta hem adres hemde telefon için veya bir derleyicideki anahtar kelimeler, sabitler, değişkenler için pazar ne kadar karışır siz tahmin edin. Peki çözümü yok mu? Bunun için sizin regular expressionlarınızı veren ve size java kodunu döndüren Jflex'e veya C++ için olanu flex'e müracaat edebilirsiniz.