1 / 16

Incorporación de Adjetivos al WordNet Español

Incorporación de Adjetivos al WordNet Español. Anselmo Peñas, Irina Chugur, Julio Gonzalo y Felisa Verdejo UNED. Índice. Introducción Enlace de adjetivos a nombres y verbos del español Enlace de adjetivos al Índice InterLingua (ILI) de EuroWordNet Conclusiones. Synset.

Download Presentation

Incorporación de Adjetivos al WordNet Español

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Incorporación de Adjetivos al WordNet Español Anselmo Peñas, Irina Chugur, Julio Gonzalo y Felisa Verdejo UNED

  2. Índice • Introducción • Enlace de adjetivos a nombres y verbos del español • Enlace de adjetivos al Índice InterLingua (ILI) de EuroWordNet • Conclusiones

  3. Synset Introducción: EuroWordNet • EuroWordNet base de datos léxica multilingüe en ocho idiomas europeos • Redes Semánticas formadas por synsets Un synset es un conjunto de sinónimos correspondientes a un concepto lexicalizado • Relaciones semánticas entre synsets: hiponimia, meronimia, implicatura, etc. • Índice InterLingua (ILI) superconjunto de los conceptos que aparecen en los distintos wordnets

  4. Introducción: Objetivos del Trabajo • Introducir synsets adjetivales en el WN español • de forma automática • metodología consistente con la construcción de synsets nominales y verbales enlazar palabras del español con los synsets de WordNet 1.5 (Miller et al. 1990) • enlaces con nombres y verbos del español • enlaces al Índice InterLingua

  5. Enlace de adjetivos a nombres y verbos del español (I) • Identificación de relaciones • Definiciones del diccionario • Sinonímicas “censurable: reprobable”  relación de sinonimia • Antonímicas “irreal: no real”  relación de antonimia • Analíticas “dubitativo: que implica duda”  relación adjetivo - nombre/verbo • Uso de patrones y criterios morfológicos

  6. A verbos A nombres Sinónimos Antónimos Enlaces 1691 591 332 160 Adjetivos 47.23% 16.51% 9.27% 4.47% Enlace de adjetivos a nombres y verbos del español (II) • Selección de 3580 adjetivos (selección de seis sufijos productivos)

  7. ILI 00226642 Synset inglés {shattered, smashed, splintered} Synset español {baldado, deshecho, destrozado} Enlace de adjetivos al ILI de EWN Recursos • Adjetivos del inglés ya enlazados al ILI (Synsets de WordNet 1.5) • Diccionarios bilingües en formato electrónico (inglés-español, español-inglés) Heurísticas • Traducción al español de adjetivos ingleses (2) • Traducción al inglés de adjetivos españoles (4)

  8. Monosémico según WN damp Traducciones 019354444 húmedo mojado Enlace de adjetivos al ILI de EWN Traducción al español de adjetivos ingleses • Traducción de adjetivos ingleses monosémicos

  9. Synset inglés {gruff hoarse husky} 00235058 Traducciones ronco bronco áspero rudo ronco ronco Co-ocurrencia malhumorado Enlace de adjetivos al ILI de EWN Traducción al español de adjetivos ingleses • Traducción al español de las variantes de un synset inglés

  10. Traducción única Monosémico según WN ashamed 00125050 Enlace de adjetivos al ILI de EWN Traducción al inglés de adjetivos españoles • Traducción al inglés única y monosémica abochornado

  11. [Ocurrencias de adj en las traducciones inversas de las variantes de syn ]2 h_r (adj, syn)= Número de traducciones inversas Traducciones inversas h_r= 0.67 > 0.3 Traducción única 01016975 deliberate intentional knowing willful wilful X deliberate 00965893 careful deliberate measured h_r= 0.25 < 0.3 01834448 deliberate h_r= 0.5 > 0.3 01407902 Calculated deliberate measured h_r= 0.5 > 0.3 Enlace de adjetivos al ILI de EWN Traducción al inglés de adjetivos españoles • Traducción al inglés única y polisémica premeditado

  12. Monosémico según WN Monosémico según WN screaming 00235682 01818583 garish loud ... ... ... Enlace de adjetivos al ILI de EWN Traducción al inglés de adjetivos españoles • Traducción al inglés múltiple, algunas traducciones monosémicas chillón

  13. 00816602 flooded 00817914 00064913 swamped 01398176 Enlace de adjetivos al ILI de EWN Traducción al inglés de adjetivos españoles • Traducción al inglés múltiple con synsets en común encharcado

  14. Enlace de adjetivos al ILI de EWN • 3102 adjetivos enlazados (dic. español-inglés tiene 3741) • 5237 enlaces y 3424 synsets  1.53 variantes por synset • Revisión manual de muestras significativas

  15. Conclusiones • Incorporación de adjetivos españoles a EWN • Heurísticas para enlazar adjetivos, válidas para otras categorías • Dos aproximaciones: • Diccionario monolingüe: • apropiada para relaciones entre categorías, • dificultad para enlazar nuevos synsets a WN • Diccionarios bilingües: • apropiada para enlazar palabras a un WN

More Related