320 likes | 473 Views
E N D
1. 1
2. 2
3. 3
4. 4 Informatie morfologica Flexionare automata:
Statica
Dinamica
5. 5 Metoda statica: gramatici de flexionare A.LOMBARD, C. GĀDEI: Dictionnaire morphologique de la langue roumaine, Bucuresti, 1981.
accelera V201
accelerat N1
accelerat A2
accelerator M1
accelerator N11
accelerator A66
accent N1
accentua V214
accept N1
accepta V3
acces N1
....................................................
6. 6 Gramatica de flexionare Vom numi gramatica de flexionare obiectul G={R,T, ?},
unde R este multimea de reguli, iar T - multimea (ordonata) a
seturilor de afixe, ? - simbol ce nu se contine nici īn unul
din cuvintele limabjului dat.Regulile gramaticale au urmatoarea
forma:
[ [/]* [# ] [ N1] a1 b1 a2 ... an-1 bn-1 an ? a'1b1a'2
a'n-1 bn-1 a'n N2 ]
unde ai, a'i sunt cuvinte arbitatre, iar bi sunt cuvinte nevide sau
sunt substituite de simbolul special .
Nj sunt numerele ce indica setul de afixe din multimea T.
7. 7 Interpretarea regulii: partea stānga Fie w cuvāntul lema din care vor fi formate cuvintele
flexionate. Fiecare semn / indica "retezarea" ultimei litere
din cuvāntul w. Cuvāntul v obtinut īn rezultatul taierii
consecutive a literelor de la sfārsit este considerat radacina
(daca N1 īn partea stānga exista);
N1 - indicele respectiv īn multimea afixe T.
Īn toate cazurile cuvāntul v va avea forma:
f0 a1 f1 a2 f2 ... an-1 fn-1 an fn,
unde fi este un cuvānt arbitrar (posibl vid), ce nu contine
cuvāntul interzis bi (pentru i=1,2, ... ,n-1) .
8. 8 Interpretarea regulii: partea dreapta Īn rezultatul substitutiei paralele se obtine
radacina a doua:
f0 a'1 f1 a'2 ... a'n fn
Se ataseaza setul de afixe N2
9. 9 Exemplu Grupul M1 1
Grupul M2 2 u ? i 3
Grupul M3 2 t ? t 3
Grupul M4 2 tt ? t 3
Grupul M5 2 d ? z 3
Grupul M6 2 s ? s 3
Rezultant M3
Grupul M3
Regula: 2 t?t 3
N2 {-, ul,ului, ule}
N3 {i, ii, ilor}
10. 10 Gramatica pentru limba romāna Gramatica de flexionare pentru limba romāna
866 de reguli gramaticale
320 seturi de afixe (subparadigme)
Au fost aplicate la obtinerea unui vocabular
morfologic de circa 30000 cuvinte-lema.
11. 11 Metoda dinamica Exista un algoritm de flexionare automata?
Exemple:
abate verb, substantiv;
masa - mase,mese.
12. 12 Identificarea grupului de flexionare CG={M,F,N,A,V,P} - multimea categoriilor garmaticale ce denota, respectiv, substantive masculine, feminine, neutre, adjective, verbe, pronume.
c ? CG , GF- gramatica de flexionare.
Lc - lista perechilor (a,µ), unde a sunt cuvinte de categoria c,
iar µ este numarul grupului de flexionare respectiv.
Doua grupuri de flexionare µ1 si µ2 le vom numi echivalente
daca lor le corespunde unul si acelasi set de reguli
gramaticale din gramatica GF.
Pentru simplificarea expunerii vom exclude din examinare
multimea cuvintelor iregulare.
13. 13 N = max |a| - lungimea maximala a cuvintelor a Lc.
Aj={a1j, a2j, ..., akj}- multimea afixelor de lungimea j
ale cuvintelor a (j = N).
n - lungimea afixului curent.
Vom pune īn corespondenta fiecarui grup de
flexionare µ o multime Sµ, initial vida.
Grupurilor echivalente le va corespunede aceeasi
multime.
14. 14 1. n:=1
2. i: =1
3. Selectam toate cuvintele , care au afixul ain ? An. Stabilim grupul lor de
flexionare µ.
4. Daca toate grupurile de flexionare sunt egale sau echivalente includem afixul ai
īn multimea Sµ. Urmam pasul 6. Excludem din Lc cuvintele cu afixul ain.
5. Daca cuvintele selectate au grupuri diferite (neechivalente) efectuam urmatoarele verificari:
- afixul ain=a' si exista perechile (a ', µ1) si (a ', µ2) ? Lc. Īn acest caz cuvāntul a' se include īn categoria celor partial regulare;
-afixul ain=a' si exista perechile (a ', µ1) si (a ', µ2) unde a''= ß a'. Īn acest caz cuvāntul a' se include īn categoria celor partial regulare.
6. Incrementam i cu o unitate (i = k) si repetam procedeul urmānd pasul 3. Daca
i > k incrementam n cu o unitate si urmam pasul 2. Procesul se va sfārsi cānd
n > N.
7. Formam reuniunea multimilor, carora le corespunde aceeasi regula gramaticala.
15. 15 Exemplu de aplicare: substantive masculine af ?{it, ot, pt, ct, lt, ut, et, rt, st, ft, īt, ent, ant, int, ont, unt, sānt, nat, tat, lat, bat, mat, zat, gat, pat, jat, rat, cat, sat, vat, eat, oat, tat, fat, dat, sat, niat, liat, ciat, uiat, tiat, miat, giat, diat, ariat, triat, priat} ? M3,
af ?{tt} ? M4,
af ?{d} ? M5,
af ?{os, es, as, us, is, ās, ns, ps, rs, cs} ? M6
......................................................................
16. 16 af ?{b}
U{ic,ec,rac,mac,bac,āc, uc, dac, oc ,nc, lac, zac, vac, rc, lc, geac, tac, lac, nac, pac, sac, jac, sac, cac}
U {fag, arag, arag, bag, mag, ng, og, ug, ig, eg, rg, lg}
U {f}
U { h}
U {j}
U {ul, ol, al, ll, sial, cial, til, cil, mil, fil, ril, bil, vil, dil, xil, zil, nil, hil, upil, ral, tal, fal, sal, ibal, nal, lal, mal, pal, gal, dal, ual, val, sal, ghel, fel, udel}
U {mn, en, in, on, ān, rn, un, vn, gan, can, zan, ban, nan, san, ran, tan, lan, van, han, pan, dan, tan, uan, fan, aolean, oman, aman, rman, iman, esman, osman, hman, bman, sman, atman, lman, dman, rman, badian, radian}
U {tap, up, ip, op, rp, mp, ep, cap, sap, rap, lap, nap}
U {ur, or, ir, ār, rr, ier, ger, mer, per, ler, her, fer, ber, xer, ner, ter, der, zer, jer, ter, ier, ser, rer, ver, ser, gar, safar, tar, har, car, var, bar, car, dar, far, ear, gar, har, iar, jar, mar, par, rar, sar, tar, oar, tar, sar, var, zar, tuar, iuar, ouar, guar, zuar, onar, inar, unar, snar, enar, tnar, arnar, rnar, ānar, gnar, mnar, znar, olar, elar, ilar, glar, ular, blar, slar, plar, balar, tanar, lanar, omanar, canar, iermanar}
U {v}
U{ez, onz, lz, baz, az, āz, ruz, auz, moz, guz, tz, muz, suz, luz, iz, mz, anz, laz, uoz, tuz}
U {s}
U {et, ut, nt, it,cat} ?M1.
17. 17 Substantive partial regulare {osc} ? M17, M18;
{iac} ? M13, M39;
{drag} ? M14, M15;
{gaci} ? M73, M98;
{opil, cal, bel, ocel} ? M1, M12;
18. 18
19. 19
20. 20
21. 21
22. 22
23. 23
24. 24
25. 25
26. 26
27. 27
28. 28
29. 29
30. 30
31. 31
32. 32