1 / 19

Agenda

PALIROM- Pachet de aplicaţii lingvistice pentru limba română Ştefan Diaconescu sdiaconescu@softwin.ro. Agenda. Parteneri Obiectivele proiectului Principiul de bază Elemente privind limbajul de descriere 4.1 – Nivele de descriere 4.2 – Secţiuni de descriere

alec
Download Presentation

Agenda

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PALIROM- Pachet de aplicaţii lingvistice pentru limba românăŞtefan Diaconescu sdiaconescu@softwin.ro

  2. Agenda • Parteneri • Obiectivele proiectului • Principiul de bază • Elemente privind limbajul de descriere • 4.1 – Nivele de descriere • 4.2 – Secţiuni de descriere • Arhitectura generală a sistemului • Câteva noţiuni de bază ale limbajului de descriere • 6.1 – Arbori de dependenţe (DT) • 6.2 – Arbori atribut – valoare (AVT) • 6.3 – Gramatici de dependenţe şi generative (GDG)

  3. Parteneri • SOFTWIN – Departamentul Cercetare-Dezvoltare • Universitatea “Politehnica” Bucureşti, Facultatea de Electronică, Telecomunicaţii şi Tehnologia Informaţiei (Prof. Univ. Dr. Ing. Corneliu Burileanu) • Universitatea “Politehnica” Bucureşti, Facultatea de Automatică şi Calculatoare (Prof. Univ. Dr. Ing. Nicolae Ţăpuş) • Institutul de Lingvistică „Iorgu Iordan – Al. Rosetti” (Dr. Ana Maria Barbu) • Universitatea Bucureşti (Conf. Dr. Emil Ionescu) • Institutul de Matematică “Simion Stoilow” al Academiei Române (Mb. Coresp. al Academiei Gheorghe Paun)

  4. Obiective 1.Standarde 2.Instrumente 3.Resurse 4.Aplicaţii

  5. Secvenţiere operaţii 4.Aplicaţii 3.Resurse (monolingve) 2.Instrumente 1.Standarde PALIROM

  6. Principiul de bază • Principiu: crearea unui limbaj (metalimbaj) care să permită: • Descrierea cunoştinţelor lingvistice privind o limbă naturală • Descrierea corespondenţelor lingvistice între două limbi naturale GRAALAN (Grammar Abstract Language)

  7. Nivele GRAALAN (a) Nivele convenţionale Nivele GRAALAN Secţiuni GRAALAN 1. Nivelul sunet Sunet Cunoştinţe mono-lingve 2. Nivelul alfabet fonetic Semn fonetic Nivelul alfabet GRAALAN Alphabet Semn alfabet normal 3. Nivelul alfabet normal

  8. Nivele GRAALAN (b) Nivele convenţionale Nivele GRAALAN Secţiuni GRAALAN 4. Nivelul morfem Morfem Cunoştinţe mono-lingve - Lexicon 5. Nivelul flexiune sintetică Cuvânt - Syllabification Nivelul morfologic GRAALAN - Morphological configurator - Inflection rules Structură A/S 6. Nivelul flexiune sintetică / analitică - Inflection forms

  9. Nivele GRAALAN (c) Nivele convenţionale Nivele GRAALAN Secţiuni GRAALAN 7. Nivelul propoziţie Propoziţie Nivelul sintaxă GRAALAN - Syntax Cunoştinţe mono-lingve 8. Nivelul frază Frază Text 9. Nivelul text

  10. Nivele GRAALAN (d) Nivele convenţionale Nivele GRAALAN Secţiuni GRAALAN Nivelul GRAALAN bilingv Dicţionare bilingve Cunoştinţe bilingve 10. Nivelul bilingv - Bilingual - Messages Facilităţi specifice compilării - Macros

  11. Secţiunile GRAALAN • A) Cunoştinţe monolingve • 1. Alfabet • 2. Silabificare • 3. Morfologie • 4. Lexicon • 5. Reguli de flexiune • 6. Forme de flexiune • 7. Sintaxă • B) Corespondenţe bilingve • C) Facilităţi specifice compilării • Mesaje • Macrouri

  12. Arhitectura generală 4. Aplicaţii Morphological analyser, Grammar checker, Inflection, Indexing/Searching, Lemmatiser, Speller, Hyphenating, Lexicon, Lexical dictionary, Human assisted machine translation, Computer assisted machine translation, Automatic machine translation, etc. 3. Baze de cunoştinţe lingvistice LKB (XML) MONO: Alphabet LKB, Syllabification LKB, Morphology LKB, Inflection rules LKB, Inflection forms LKB, Lexicon LKB, Syntax LKB, BI: Lexical corresp. LKB, Morphological corresp. LKB, Syntactic corresp. LKB Alphabet DTD, Syllabification DTD, Morphology DTD, Inflection rules DTD, Inflection forms DTD, Lexicon DTD, Syntax DTD, Lexical corresp. DTD, Morph. corresp. DTD, Syntactic corresp. DTD 2. Instrumente lingvistice Compilator GRAALAN , LKT – Creare lexicon, MKT – Creare forme flexionate, Creare coresp. bilingve 1. GRAALAN - Grammar Abstract Language Secţiuni: Alfabet, Silabificare, Morfologie, Reguli de flexiune, Forme de flexiune, Lexicon, Sintaxă, Corespondenţe bilingve, Mesaje ; Macrouri 0. Baze teoretice GDG - Generative Dependency Grammar, DT - Dependency Tree, AVT - Attribute Value Tree

  13. Arbori de dependenţe (DT) a @r1@ @r2@ “şi” 2 1 “Maestrul” “disciplolul” @r4@ @r1@ @r2@ “şi” 2 1 @r5@ “văd ” “vin” Maestrul şi discipolul vin şi văd că ciobanii şi străinii râd şi dănţuie. “că ”

  14. Arbori de dependenţe (DT) a @r6@ @r1@ @r2@ “şi ” 2 1 “ciobanii” “străinii ” @r4@ @r1@ @r2@ “şi ” 2 1 “dănţuie” “râd ”

  15. Arbori de atribut-valoare (AVT) substantiv propriu clasa tip comun masculin gen feminin neutru singular număr plural nearticulat articol ... articulare nehoărât pronume ... hotărât adjectiv ... nominativ verb ... caz genitiv numeral ... dativ adverb ... acuzativ prepoziţie ... vocativ conjuncţie ... interjecţie ...

  16. Gramatici de dependenţe şi generative (GDG) Definiţie (informală) a GDG: Gramatici care printr-un proces generativ permit transformarea unui text (frază) sursă într-un arbore de dependenţe (DT). Analiză Frază sursă (formă de suprafaţă) Arbore de dependenţe (formă de adâncime) Gramatică de dependenţe şi generativă Generare

  17. Proprietăţi implementare GDG • a) Descriere Sintaxă : Cum anume părţile de vorbire sunt combinate pentru a forma fraze. • b) Descriere Dependenţe : Care sunt relaţiile între părţile de vorbire ale unei fraze : relaţii de coordonare şi relaţii de regenţă/subordonare. • c) Descriere Acord : Potrivirea între părţile de vorbire ale unei fraze din punct de vedere al categoriilor şi valorilor de categorii (gen, număr, caz, etc.) • d) Descriere Erori: Frazele prost construite trebuie identificate şi semnalate ca eronate. • e) Reversibilitate: Utilizarea aceleiaşi gramatici pentru descrierea transformărilor de la structura de suprafaţă la structura de adâncime şi invers.

  18. Implementare GRAALAN Linguist Macro GRAALAN Macro processor GRAALAN compiler GRAALAN text XML LKB Infl. Forms Tool (MKT) Lexicon Tool (LKT) GRAALAN Link

  19. Q&A

More Related