120 likes | 399 Views
ANÁLISIS MORFOLÓGICO. Carlos Mario Zapata J. GENERALIDADES. Identificación de mecanismos para crear palabras y formas de palabras de manera sistemática. Procesamiento de las palabras de manera tanto escrita como hablada.
E N D
ANÁLISIS MORFOLÓGICO Carlos Mario Zapata J. Lingüística Computacional
GENERALIDADES • Identificación de mecanismos para crear palabras y formas de palabras de manera sistemática. • Procesamiento de las palabras de manera tanto escrita como hablada. • Usos: corrección de palabras (spelling), separación de palabras (hyphenation), conjugadores de verbos, etiquetación de corpus (tagging), traducción automática, etc. • Es más fácil para humanos que para computadores. • Existen diferencias sustanciales entre los morfemas para diferentes idiomas. • I speak – hablo; I will speak – hablaré; book – hon – libro; books – hon – libros. Lingüística Computacional
DEFINICIONES • Morfema: unidad más pequeña a la que se puede asignar un significado. Unidad mínima para el análisis gramatical. • Flexivos: indican número, tiempo, género y persona (-a, -s, etc.) • Derivativos o Afijos: elementos que acompañan a la raíz y que suelen aportar significados adicionales. Pueden ser prefijos, sufijos e infijos. • Diminutivos • Aumentativos • Despectivos • Gentilicios Lingüística Computacional
DEFINICIONES • Lexema: unidad fundamental del léxico de una lengua, el cual aporta el significado básico de la palabra. • Lema: la entrada en un diccionario. • Raíz: Formante común al conjunto de formas léxicas o palabras que pertenecen al mismo lexema. • Palabra: unidad que sirve para construir frases u oraciones (frases con sentido gramatical completo). • Sencilla: un solo morfema. Ej: de, dos, y, que, no. • Varios morfemas: otr-a-s (una raíz y dos afijos). Lingüística Computacional
DEFINICIONES • Morfo: la realización de parte de una palabra. • El atlas, los atlas • El mejor, la mejor • Alomorfo: variación en la forma de los morfemas como consecuencia del contexto fonológico. • Ej: in: • i- ante /l/ o /r/: ilegal, irreal. • Im- ante /p/ o /b/: imposible, imborrable. • In- en los casos restantes. • Caber, cupo y quepo Lingüística Computacional
TIPOS DE LENGUAJES • Tipos de Lenguajes: • Aislados (Chino mandarín): no hay afijos. La única operación morfológica es la composición (unión de dos lexemas para producir una palabra nueva). • junzi 'señor, caballero' que deriva de jun 'señor, noble' y zi 'niño' • Aglutinadores (Turco, Finlandés): cada característica se expresa con un afijo. • evlerinizden o "de sus casas", se compone de los morfemas, ev-ler-INIZ-den con los significados casa-plural-su-de. Lingüística Computacional
TIPOS DE LENGUAJES • Tipos de Lenguajes: • Inflexionales (Indo-Europeos, Castellano): Se basan en la inflexión (modificación de un lexema mediante sufijos sin dar lugar a un lexema nuevo) • Inflexiones verbales: pens-ar, pens-ó, pens-ará • Inflexiones nominales: gat-o, gat-a, gat-a-s • Inflexiones radicales: niñ-o, niñ-era, niñ-ería • Polisintéticos (Lenguajes Inuit): Mucha más información morfológica. 'qanik', quiere decir "copos de nieve en el aire", y 'aput', "la nieve en el suelo“ • Derivación: modificación de un lexema mediante prefijos y sufijos para dar un nuevo lexema. Ej.: cuchillo-cuchillada Lingüística Computacional
IMPORTANCIA DEL ANÁLISIS MORFOLÓGICO • Complejidad de los lenguajes que se van usando para PLN. Ej: Finlandés, Español. • Reducción del volumen del diccionario. • Prerrequisito para el análisis sintáctico. Lingüística Computacional
IDENTIFICACIÓN: PALABRAS ENTRADA SEGMENTACIÓN: LEXEMAS Y AFIJOS LEMATIZACIÓN: COMO APARECE EN DICCIONARIO CONCATENACIÓN: RELACIÓN MEDIANTE REGLAS MORFOSINTÁCTICAS CATEGORIZACIÓN: ASIGNACIÓN CATEGORÍA GRAMATICAL ETIQUETADO: INFORMACIÓN RELEVANTE MORFOLOGÍA COMPUTACIONAL Lingüística Computacional
ANÁLISIS MORFOLÓGICO • Texto de entrada: “El asistente liquida las facturas” Lingüística Computacional