200 likes | 568 Views
2. Cuprins. Cercetari si sisteme existente ale tehnologizarii morfologiei limbii rom
E N D
1. Crearea unui generator morfologic pentru verbele din limba româna Bîrladeanu Antonina
Universitatea Tehnica a Moldovei
Catedra Informatica si Limbi Moderne Aplicate
Republica Moldova
E-mail: antoniab@mail.md
Burciu Natalia
Universitatea Tehnica a Moldovei
Catedra Informatica si Limbi Moderne Aplicate
Republica Moldova
E-mail: natusicb@yahoo.com
2. 2 Cuprins Cercetari si sisteme existente ale tehnologizarii morfologiei limbii române
Proprietatile verbului
Regulile morfologice elaborate
Algoritmul de functionare a generatorului morfologic
Afisarea formei elaborate si a rezultatelor generarii morfologice
Avantajele si Dezavantajele generatorului morfologic
Cercetari ulterioare
3. 3 Sisteme existente ale tehnologizării limbii române Primele sisteme moderne de prelucrare automată a limbii române:
BANDASEM (Banca de date fono-morfo-semantice a limbii române);
SDLR (Sistemul pentru dialog în limba română)
SIRLIN (Un sistem de întrebare-răspuns în limba română),
IURES (O abordare a ingineriei în domeniul raspunderii întrebarilor în limba româna);
QUERNAL (O interfata a Limbajului Natural pentru Baze de date relationale);
SINAL (un sistem de dialog în limbaj natural),
MORPHO (Un sistem de administrare si organizare a unui dictionar morfologic);
4. 4 Cercetari ale morfologiei limbii române
Generarea unui Dictionar Morfologic Român
Volumul actual al Dictionarului din lexicul limbii române cuprinde toate cuvintele din DEX. Pentru acest volum functionează experimental algoritmul de flexionare si recunoastere. Ca o primă verificare a modelului creat, s-a realizat un model al unui corector ortografic pentru limba română numit ORTOGRAF.
Aplicatia ANMOR
Aplicatia reprezinta un mediu de dezvoltare/actualizare pentru modelul morfologic paradigmatic al limbii române, iar preocuparile sale esentiale sunt asigurarea corectitudinii si completitudinii datelor. Componentele principale sunt: un verificator de erori sintactice si inconsistente, un editor al dictionarului si un asistent în procesul de îmbogatire cu noi cuvinte a bazei de date.
Nota E de mentionat ca ambele aplicatii folosesc ca baza crearea unui model de formalizare a morfologiei limbii române.
5. 5 Cuprins Cercetari si sisteme existente ale tehnologizarii morfologiei limbii române
Proprietatile verbului
Regulile morfologice elaborate
Algoritmul de functionare a generatorului morfologic
Afisarea formei elaborate si a rezultatelor generarii morfologice
Avantajele si Dezavantajele generatorului morfologic
Cercetari ulterioare
6. 6 Proprietatile Verbului
Mod ( verbe personale indicativ, conjunctiv, conditional optativ, imperativ; verbe nepersonale infinitiv, gerunziu, participiu, supin);
Timp ( prezent, imperfect, perfectul compus, perfectul simplu, mai mult ca perfectul, viitorul (viitorul simplu, viitorul anterior), perfect);
Conjugarea (conj I, conj II, conj III, conj IV);
Persoana (pers1, pers 2, pers 3);
Numarul (singular, plural);
7. 7 Verbele personale se caracterizeaza prin modurile: Indicativ
Timpul (prezent, imperfect, perfectul compus, perfectul simplu, mai mult ca perfectul, viitorul (viitorul simplu, viitorul anterior);
Conjugarea (conj I (term. V-a), conj II (V-ea), conj III (V-e), conj IV (V-i, î);
Persoana (pers 1, pers 2, pers3);
Numarul (singular, plural);
Conjunctiv, Conditional-optativ, Imperativ
Timpul ( prezent, perfect)
Persoana (pers 1, pers 2, pers3);
Numarul (singular, plural);
8. 8 Verbele nepersonale se caracterizeaza prin modurile: 1. Infinitivul
Forma (a + Verbul, de a + Verbul)
2. Gerunziu
Forma (Verb+înd, ne + Verb+înd, Verb + ind, ne+ Verb + ind)
3. Participiu (Verb+t)
4. Supin
Forma (de+Verb+Participiu, dupa+Verb+Participiu, la +V + participiu, pentru+V+particpiu)
9. 9 Cuprins Cercetari si sisteme existente ale tehnologizarii morfologiei limbii române
Proprietatile verbului
Regulile morfologice elaborate
Algoritmul de functionare a generatorului morfologic
Afisarea formei elaborate si a rezultatelor generarii morfologice
Avantajele si Dezavantajele generatorului morfologic
Cercetari ulterioare
10. 10 Regulile create pentru verbe
S-au creat în cadrul acestui proiect, manual circa 280 de reguli pentru verbele de baza.
Drept exemplu pentru modurile personale :
Conjunctia Modul Timpul Persoana Numarul Regulile
I Indicativ Prezent 1 Singular V - a |
III Indicativ Prezent 1 Singular V - e |
IV Indicativ Perfectul Compus 2 Singular ai _ V + t |
I Conjunctiv Prezent 2 Singular sa _ V - a + i |
II Conditional-optativ Prezent 1 Singular as _ V
Pentru modurile nepersonale:
Conjunctia Modul Regula
III Gerunziu Dis V - e + ind |
I Supin Dis de _ V + t |
Dis disinenta; caracteristica care înlocuieste pentru modurile nepersonale timpul, persoana, numarul
Nota Verbele care au o modalitate diferita de formare le-am caracterizat ca exceptii
11. 11 Regulile create pentru verbele exceptii Verbele pentru care am creat manual regulile pentru toate modurile (circa 1430) sunt:
verbele auxiliare (a avea, a fi)
verbele de conjugarea I (a da, a sta, a minca, a usca, a lua)
verbele de conjugarea II (a vrea, a crea, a agrea)
verbele de conjugarea IV (a voi, a sti)
Verbele pentru care am creat regulile pentru unele moduri, sau pentru anumite conjugari
de exemplu (a crea,a agrea, a scrie, a sti,a trebui, a contribui, a distribui, a atribui, a dezvalui, a rupe, a sparge, a fierbe, a frige, a coace, a înfige, a prinde, a merge, a scrie)
12. 12 Studiul disinentelor verbelor si crerea regulilor pentru verbe la Modul Indicativ Timpul Imperfect
13. 13 Cuprins Cercetari si sisteme existente ale tehnologizarii morfologiei limbii române
Proprietatile verbului
Regulile morfologice elaborate
Algoritmul de functionare a generatorului morfologic
Afisarea formei elaborate si a rezultatelor generarii morfologice
Avantajele si Dezavantajele generatorului morfologic
Cercetari ulterioare
14. 14 Algoritmul de functionare al generatorului morfologic