1 / 32

TEHNOLOGIZAREA LIMBII ROM NE: RESURSE LINGVISTICE, APLICATII, INSTRUMENTAR E.Boian, C.Ciubotaru, S.Cojocaru, A.Cole

chelsea
Download Presentation

TEHNOLOGIZAREA LIMBII ROM NE: RESURSE LINGVISTICE, APLICATII, INSTRUMENTAR E.Boian, C.Ciubotaru, S.Cojocaru, A.Cole

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. 1

    2. 2

    3. 3

    4. 4 Informatie morfologica Flexionare automata: Statica Dinamica

    5. 5 Metoda statica: gramatici de flexionare A.LOMBARD, C. GĀDEI: Dictionnaire morphologique de la langue roumaine, Bucuresti, 1981. accelera V201 accelerat N1 accelerat A2 accelerator M1 accelerator N11 accelerator A66 accent N1 accentua V214 accept N1 accepta V3 acces N1 ....................................................

    6. 6 Gramatica de flexionare Vom numi gramatica de flexionare obiectul G={R,T, ?}, unde R este multimea de reguli, iar T - multimea (ordonata) a seturilor de afixe, ? - simbol ce nu se contine nici īn unul din cuvintele limabjului dat.Regulile gramaticale au urmatoarea forma: [ [/]* [# ] [ N1] a1 b1 a2 ... an-1 bn-1 an ? a'1b1a'2 … a'n-1 bn-1 a'n N2 ] unde ai, a'i sunt cuvinte arbitatre, iar bi sunt cuvinte nevide sau sunt substituite de simbolul special . Nj sunt numerele ce indica setul de afixe din multimea T.

    7. 7 Interpretarea regulii: partea stānga Fie w cuvāntul lema din care vor fi formate cuvintele flexionate. Fiecare semn / indica "retezarea" ultimei litere din cuvāntul w. Cuvāntul v obtinut īn rezultatul taierii consecutive a literelor de la sfārsit este considerat radacina (daca N1 īn partea stānga exista); N1 - indicele respectiv īn multimea afixe T. Īn toate cazurile cuvāntul v va avea forma: f0 a1 f1 a2 f2 ... an-1 fn-1 an fn, unde fi este un cuvānt arbitrar (posibl vid), ce nu contine cuvāntul interzis bi (pentru i=1,2, ... ,n-1) .

    8. 8 Interpretarea regulii: partea dreapta Īn rezultatul substitutiei paralele se obtine radacina a doua: f0 a'1 f1 a'2 ... a'n fn Se ataseaza setul de afixe N2

    9. 9 Exemplu Grupul M1 1 Grupul M2 2 u ? i 3 Grupul M3 2 t ? t 3 Grupul M4 2 tt ? t 3 Grupul M5 2 d ? z 3 Grupul M6 2 s ? s 3 “Rezultant M3” Grupul M3 Regula: 2 t?t 3 N2 {-, ul,ului, ule} N3 {i, ii, ilor}

    10. 10 Gramatica pentru limba romāna Gramatica de flexionare pentru limba romāna 866 de reguli gramaticale 320 seturi de afixe (subparadigme) Au fost aplicate la obtinerea unui vocabular morfologic de circa 30000 cuvinte-lema.

    11. 11 Metoda dinamica Exista un algoritm de flexionare automata? Exemple: abate – verb, substantiv; masa - mase,mese.

    12. 12 Identificarea grupului de flexionare CG={M,F,N,A,V,P} - multimea categoriilor garmaticale ce denota, respectiv, substantive masculine, feminine, neutre, adjective, verbe, pronume. c ? CG , GF- gramatica de flexionare. Lc - lista perechilor (a,µ), unde a sunt cuvinte de categoria c, iar µ este numarul grupului de flexionare respectiv. Doua grupuri de flexionare µ1 si µ2 le vom numi echivalente daca lor le corespunde unul si acelasi set de reguli gramaticale din gramatica GF. Pentru simplificarea expunerii vom exclude din examinare multimea cuvintelor iregulare.

    13. 13 N = max |a| - lungimea maximala a cuvintelor a € Lc. Aj={a1j, a2j, ..., akj}- multimea afixelor de lungimea j ale cuvintelor a (j = N). n - lungimea afixului curent. Vom pune īn corespondenta fiecarui grup de flexionare µ o multime Sµ, initial vida. Grupurilor echivalente le va corespunede aceeasi multime.

    14. 14 1. n:=1 2. i: =1 3. Selectam toate cuvintele , care au afixul ain ? An. Stabilim grupul lor de flexionare µ. 4. Daca toate grupurile de flexionare sunt egale sau echivalente includem afixul ai īn multimea Sµ. Urmam pasul 6. Excludem din Lc cuvintele cu afixul ain. 5. Daca cuvintele selectate au grupuri diferite (neechivalente) efectuam urmatoarele verificari: - afixul ain=a' si exista perechile (a ', µ1) si (a ', µ2) ? Lc. Īn acest caz cuvāntul a' se include īn categoria celor partial regulare; -afixul ain=a' si exista perechile (a ', µ1) si (a ', µ2) unde a''= ß a'. Īn acest caz cuvāntul a' se include īn categoria celor partial regulare. 6. Incrementam i cu o unitate (i = k) si repetam procedeul urmānd pasul 3. Daca i > k incrementam n cu o unitate si urmam pasul 2. Procesul se va sfārsi cānd n > N. 7. Formam reuniunea multimilor, carora le corespunde aceeasi regula gramaticala.

    15. 15 Exemplu de aplicare: substantive masculine af ?{it, ot, pt, ct, lt, ut, et, rt, st, ft, īt, ent, ant, int, ont, unt, sānt, nat, tat, lat, bat, mat, zat, gat, pat, jat, rat, cat, sat, vat, eat, oat, tat, fat, dat, sat, niat, liat, ciat, uiat, tiat, miat, giat, diat, ariat, triat, priat} ? M3, af ?{tt} ? M4, af ?{d} ? M5, af ?{os, es, as, us, is, ās, ns, ps, rs, cs} ? M6 ......................................................................

    16. 16 af ?{b} U{ic,ec,rac,mac,bac,āc, uc, dac, oc ,nc, lac, zac, vac, rc, lc, geac, tac, lac, nac, pac, sac, jac, sac, cac} U {fag, arag, arag, bag, mag, ng, og, ug, ig, eg, rg, lg} U {f} U { h} U {j} U {ul, ol, al, ll, sial, cial, til, cil, mil, fil, ril, bil, vil, dil, xil, zil, nil, hil, upil, ral, tal, fal, sal, ibal, nal, lal, mal, pal, gal, dal, ual, val, sal, ghel, fel, udel} U {mn, en, in, on, ān, rn, un, vn, gan, can, zan, ban, nan, san, ran, tan, lan, van, han, pan, dan, tan, uan, fan, aolean, oman, aman, rman, iman, esman, osman, hman, bman, sman, atman, lman, dman, rman, badian, radian} U {tap, up, ip, op, rp, mp, ep, cap, sap, rap, lap, nap} U {ur, or, ir, ār, rr, ier, ger, mer, per, ler, her, fer, ber, xer, ner, ter, der, zer, jer, ter, ier, ser, rer, ver, ser, gar, safar, tar, har, car, var, bar, car, dar, far, ear, gar, har, iar, jar, mar, par, rar, sar, tar, oar, tar, sar, var, zar, tuar, iuar, ouar, guar, zuar, onar, inar, unar, snar, enar, tnar, arnar, rnar, ānar, gnar, mnar, znar, olar, elar, ilar, glar, ular, blar, slar, plar, balar, tanar, lanar, omanar, canar, iermanar} U {v} U{ez, onz, lz, baz, az, āz, ruz, auz, moz, guz, tz, muz, suz, luz, iz, mz, anz, laz, uoz, tuz} U {s} U {et, ut, nt, it,cat} ?M1.

    17. 17 Substantive partial regulare {osc} ? M17, M18; {iac} ? M13, M39; {drag} ? M14, M15; {gaci} ? M73, M98; {opil, cal, bel, ocel} ? M1, M12; …………………………………………………………

    18. 18

    19. 19

    20. 20

    21. 21

    22. 22

    23. 23

    24. 24

    25. 25

    26. 26

    27. 27

    28. 28

    29. 29

    30. 30

    31. 31

    32. 32

More Related