120 likes | 305 Views
Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL). Coloma Lleal Galceran (dir.) Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo, Mar Cruz Pi ñ ol, Mar Forment Fern á ndez, Ignacio V á zquez Di é guez. Al í cia Dom è nech, M ó nica Gonz á lez, Laura Romero (bec à ries).
E N D
Grup d’Història i Contacte de Llengües(GHCL) Coloma Lleal Galceran (dir.) Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo, Mar Cruz Piñol, Mar Forment Fernández, Ignacio Vázquez Diéguez. Alícia Domènech, Mónica González, Laura Romero (becàries) Departament de Filologia Hispànica Facultat de Filologia DICCIONARI ELECTRÒNIC DEL CASTELLÀ DEL SEGLE XV A LA CORONA D’ARAGÓ
1. DEL TEXT A LA BASE el text * selecció: textos del segle XV escrits en castellà a la Corona d’Aragó i conservats en manuscrits o incunables. * criteris de transcripció: fidelitat a l’original; mots aglutinats separats per punt volat; noms propis units; majúscules contextuals eliminades… la base inicial * camps inicials: forma i situació * camps afegits: vocable, funció i variant
REPLACE ALL vocablo WITH “assi”, variante WITH forma, función WITH “adv.” FOR (forma=“assi” OR forma=“asi” OR forma=“assy” OR forma=“asy” OR forma=“ansi” OR forma=“ansy”) 2. LEMATITZACIÓ LOCATE FOR (“assemos ” $forma OR “assedes ” $forma OR “asseden ” $forma) DO WHILE NOT EOF() STORE TRIM(forma) TO mot STORE LEN(mot) TO mida REPLACE NEXT 1 función WITH “verbo”, vocablo WITH LEFT(mot,(mida-6))+“r”, variante WITH LEFT(mot,(mida-6))+“r” CONTINUE ENDDO Programa lematitzador a partir de: * lexicó: formes d’inventari tancat (articles, pro- noms, conjuncions, preposicions…) i formes lèxiques d’alta freqüència. * regles de derivació i flexió. {-oso, -ario, -ble…} adj. {-dad, -ez, -ura…} sust. fem. {-riamos, -assedes…} verb {-mente} adv. … * regles sintàctiques. distinció articles/pronoms (lo, la) distinció sust./verb… (canto) … * correcció ortogràfica i, a continució, revisió del text LOCATE FOR forma=(“el ” OR forma=“la ” OR forma=“lo ” OR forma=“los ” OR forma=“las ”) DO WHILE NOT EOF() SKIP IF función=“verbo” SKIP -1 REPLACE NEXT 1 vocablo WITH “el ella ello”, funciónWITH “pron. pers.” ELSE SKIP -1 REPLACE NEXT 1 vocablo WITH “el la lo”, función WITH “art.” ENDIF SKIP 2 CONTINUE ENDDO TOTAL DE FORMES LEMATITZADES AUTOMÀTICAMENT: 96,7% DEL TEXT
5: EL DICCIONARI: Base REUNIÓ Informació general
Altres possibilitats de cerca: alguns exemples 1. Llistat de locucions locucions adverbials locucions sustantives
2. Llistat de neologismes Obtenció de llistats dels termes a partir de la data de primera documentació en el DCECH de Corominas-Pascual (en aquest cas, igual o posterior a 1400). Es marca en negreta la data de la primera documentació en el nostre corpus quan és igual o anterior a la del DCECH.
3. Famílies etimològiques Llistat dels termes del nostre corpus que parteixen d’una mateixa base etimològica.
4. Camps semàntics ‘document’
‘planta’ ‘documento’