160 likes | 420 Views
Incorporación de Adjetivos al WordNet Español. Anselmo Peñas, Irina Chugur, Julio Gonzalo y Felisa Verdejo UNED. Índice. Introducción Enlace de adjetivos a nombres y verbos del español Enlace de adjetivos al Índice InterLingua (ILI) de EuroWordNet Conclusiones. Synset.
E N D
Incorporación de Adjetivos al WordNet Español Anselmo Peñas, Irina Chugur, Julio Gonzalo y Felisa Verdejo UNED
Índice • Introducción • Enlace de adjetivos a nombres y verbos del español • Enlace de adjetivos al Índice InterLingua (ILI) de EuroWordNet • Conclusiones
Synset Introducción: EuroWordNet • EuroWordNet base de datos léxica multilingüe en ocho idiomas europeos • Redes Semánticas formadas por synsets Un synset es un conjunto de sinónimos correspondientes a un concepto lexicalizado • Relaciones semánticas entre synsets: hiponimia, meronimia, implicatura, etc. • Índice InterLingua (ILI) superconjunto de los conceptos que aparecen en los distintos wordnets
Introducción: Objetivos del Trabajo • Introducir synsets adjetivales en el WN español • de forma automática • metodología consistente con la construcción de synsets nominales y verbales enlazar palabras del español con los synsets de WordNet 1.5 (Miller et al. 1990) • enlaces con nombres y verbos del español • enlaces al Índice InterLingua
Enlace de adjetivos a nombres y verbos del español (I) • Identificación de relaciones • Definiciones del diccionario • Sinonímicas “censurable: reprobable” relación de sinonimia • Antonímicas “irreal: no real” relación de antonimia • Analíticas “dubitativo: que implica duda” relación adjetivo - nombre/verbo • Uso de patrones y criterios morfológicos
A verbos A nombres Sinónimos Antónimos Enlaces 1691 591 332 160 Adjetivos 47.23% 16.51% 9.27% 4.47% Enlace de adjetivos a nombres y verbos del español (II) • Selección de 3580 adjetivos (selección de seis sufijos productivos)
ILI 00226642 Synset inglés {shattered, smashed, splintered} Synset español {baldado, deshecho, destrozado} Enlace de adjetivos al ILI de EWN Recursos • Adjetivos del inglés ya enlazados al ILI (Synsets de WordNet 1.5) • Diccionarios bilingües en formato electrónico (inglés-español, español-inglés) Heurísticas • Traducción al español de adjetivos ingleses (2) • Traducción al inglés de adjetivos españoles (4)
Monosémico según WN damp Traducciones 019354444 húmedo mojado Enlace de adjetivos al ILI de EWN Traducción al español de adjetivos ingleses • Traducción de adjetivos ingleses monosémicos
Synset inglés {gruff hoarse husky} 00235058 Traducciones ronco bronco áspero rudo ronco ronco Co-ocurrencia malhumorado Enlace de adjetivos al ILI de EWN Traducción al español de adjetivos ingleses • Traducción al español de las variantes de un synset inglés
Traducción única Monosémico según WN ashamed 00125050 Enlace de adjetivos al ILI de EWN Traducción al inglés de adjetivos españoles • Traducción al inglés única y monosémica abochornado
[Ocurrencias de adj en las traducciones inversas de las variantes de syn ]2 h_r (adj, syn)= Número de traducciones inversas Traducciones inversas h_r= 0.67 > 0.3 Traducción única 01016975 deliberate intentional knowing willful wilful X deliberate 00965893 careful deliberate measured h_r= 0.25 < 0.3 01834448 deliberate h_r= 0.5 > 0.3 01407902 Calculated deliberate measured h_r= 0.5 > 0.3 Enlace de adjetivos al ILI de EWN Traducción al inglés de adjetivos españoles • Traducción al inglés única y polisémica premeditado
Monosémico según WN Monosémico según WN screaming 00235682 01818583 garish loud ... ... ... Enlace de adjetivos al ILI de EWN Traducción al inglés de adjetivos españoles • Traducción al inglés múltiple, algunas traducciones monosémicas chillón
00816602 flooded 00817914 00064913 swamped 01398176 Enlace de adjetivos al ILI de EWN Traducción al inglés de adjetivos españoles • Traducción al inglés múltiple con synsets en común encharcado
Enlace de adjetivos al ILI de EWN • 3102 adjetivos enlazados (dic. español-inglés tiene 3741) • 5237 enlaces y 3424 synsets 1.53 variantes por synset • Revisión manual de muestras significativas
Conclusiones • Incorporación de adjetivos españoles a EWN • Heurísticas para enlazar adjetivos, válidas para otras categorías • Dos aproximaciones: • Diccionario monolingüe: • apropiada para relaciones entre categorías, • dificultad para enlazar nuevos synsets a WN • Diccionarios bilingües: • apropiada para enlazar palabras a un WN