130 likes | 319 Views
Propuesta de modelo deconstructivista LEGOLANGUAGE. Conclusiones reunión trabajo 8/11/2013. Modelo deconstructivista. Objetivos
E N D
Propuesta de modelo deconstructivista LEGOLANGUAGE Conclusiones reunión trabajo 8/11/2013
Modelo deconstructivista • Objetivos • Diseñar un modelo de representación de los procesos de TLH que, basándose en aproximaciones de ingeniería del software, pueda servir como mecanismo para describir y comprender conceptualmente el funcionamiento del proceso a través de la descomposición del mismo en unidades atómicas de procesamiento TLH. • Estandariza la representación de cualquier proceso en GPLSI para su reutilización • Si usamos un gráfico en nuestras publicaciones deberíamos usar este estándar • Crear un estándar de comunicación lógica entre procesos de TLH que nos permita conectar cada uno de los módulos con una interfaz común • Crear un estándar de prototipado de procesos TLH mediante la implementación física de las unidades atómicas de procesamiento TLH
Arquitectura deconstructivista • Inspirada en modelo ANSI/Sparc de BDs Representación conceptual de un proceso de TLH. Es un ejercicio intelectual. Se trata de tener claro cómo se descompone el proceso en sus partes atómicas para comprenderlo. Se representa mediante un modelo conceptual. Es independiente del formalismo y la implementación usada para definirlo. Nivel conceptual Nivel lógico Mecanismo lógico mediante el cual se formaliza (se formula) la representación conceptual del proceso de TLH. Basado estructuras de información estandarizadas. Es independiente del mecanismo de implementación usado Nivel físico Implementación de los formalismos lógicos usados para la representación conceptual del proceso.
Modelo conceptual LEGOLANGUAGE • Mecanismos de abstracción: clasificación • Ladrillo (inicial, intermedio, final, enriquecido) • Herramienta • Recurso unique ID unique ID unique ID tool resource value inicial intermedio final enriquecido
Modelo conceptual LEGOLANGUAGE • Mecanismos de abstracción: agregación • decomp: ladrillos descompuestos en unidades de menor grano • recomp: ladrillos recompuestos en unidades de mayor grano • parity: ladrillos que refieren el mismo item • input: ladrillos fuente para herramientas • output: ladrillos generados por herramientas • model: recursos que modelan/entrenan herramientas • content: ladrillos que forman/etiquetan el recurso parity unique ID unique ID unique ID decomp recomp tool content resource value input model output
Representación conceptual de un proceso de análisis sintáctico H00004 H00002 H00001 H00003 Segmentador1 AnalizarLexico1 POS1 Parser1 R00001 Lexicon1 Posición: Carácter Textual: word Textual: word Textual: sentence Lexico: POS descartado Lexico: POS no ambiguo Sintax: Parser superficial Posición: Carácter Lexico: POS ambiguo Lexico: POS ambiguo
Secuencia de deconstrucción H00001 H00002 Segmentador1 AnalizarLexico1 Textual T0001S001WR003 T0001S001WR002 T0001S001PS001 Posición T0001S001PS002 T0001S001PS003 Textual T0001S001LX002 T0001S001LX003 Lexico T0001S001LX004 T0001S001LX005 T0001S001 T0001S001WR001 T0001S001LX001 0-1 Word La casa verde tiene ventanas Carácter DetFS Sentence SusFS casa verde POS ambiguo Verb La 2-5 6-10 Adj PronFS
Secuencia de deconstrucción H00004 H00003 Parser1 POS1 T0001S001LX001 T0001S001LX002 T0001S001LX004 T0001S001LX005 T0001S001PS001 T0001S001LX003 Lexico Sintaxis Posición Lexico T0001S001SY001 Verb SN PronFS 0-10 Adj SusFS Parser superficial DetFS Carácter POS descartado POS desambiguado
Representación conceptual de un proceso NER enriquecido con imágenes + geolocalización H00005 H00004 H00003 NER lugar RI imagenes RI geoposición R00004 R00002 R00003 Google Images Google Maps NE diccionario Textual: word NER: Loc Imagen: NE: Loc Imagen: NE: Loc Lexico: POS no ambiguo Posición: Carácter NE: Loc Posición: Geo-Coordenada Posición: Geo-Coordenada Posición: Carácter Estructura enriquecida a almacenar
Modelo lógico • Ontología Legolanguage (instancias estables) • Identifica tipos de ladrillos, herramientas, recursos • Instancia las herramientas y recursos • Fénix • Instancia los ladrillos
Aproximación a Onto-Legolanguage PLN parity decomp recomp contain L- brick recs model input output tool léxico sintaxis semántica textual posición POS rol Carácter inicio-fin palabra párrafo oración desambiguado ambiguo descartado
Modelo físico • Ontología OntoLegolanguage • Se implementa con Protegé, OWL-DL,… • Fénix • Se implementa con Java, … • Implementación de herramientas y recursos
Resumen arquitectura LEGOLANGUAGE Conceptual unique ID Lógico unique ID unique ID tool resource Físico value Java Protegé