350 likes | 522 Views
Algunas aplicaciones de la inteligencia artificial para la organización de la información Jacques Schreiber Universidade de Santa Cruz do Sul Departamento de Informática. Nuevas tecnologías aplicadas a la documentación. Sumario: - Inteligencia artificial y sus aplicaciones
E N D
Algunas aplicacionesde la inteligencia artificialpara la organizaciónde la informaciónJacques SchreiberUniversidade de Santa Cruz do Sul Departamento de Informática
Nuevas tecnologías aplicadas a la documentación Sumario: - Inteligencia artificial y sus aplicaciones - Contextualización - Redes neuronales - Redes neuronales aplicadas en el área
Nuevas tecnologías aplicadas la la documentación Inteligencia artificial (IA) • Definiciones • Áreas que utilizan recursos de IA • Lenguaje natural • Juegos (reglas) • Diagnóstico (Sistemas expertos, representación del conocimiento) • Predicción (algoritmos genéticos y redes neuronales) • Educación (sistemas tutoriales inteligentes)
Nuevas tecnologías aplicadas a la documentación Contextualización del problema: • La corrección y la agilidad en la recuperación de la información son elementos vitales para las organizaciones modernas, cualquiera que sea su actividad. • La cantidad de información disponible es enorme, y la tendencia del crecimiento es exponencial. • Los sistemas tradicionales de búsqueda están empezando a alcanzar sus límites.
Nuevas tecnologías aplicadas a la documentación Contextualización del problema • El uso de sistemas tradicionales puede, en algunos casos, hacer dificultosa para los usuarios la recuperación de la información relevante, así como para los profesionales de la documentación, que han de realizar actividades como la indización, clasificación y manutención del conjunto. Dos requisitos clave para resolver este problema son: • simplificación de las actividades de búsqueda realizadas por usuarios comunes; y • reducción de costes de manutención.
Para estos tipos de aplicación se utiliza una tecnología llamada de redes neuronales (RN) Nuevas tecnologías aplicadas a la documentación Actualmente, existen sistemas capaces de ejecutar tareas hasta ahora imposibles para los ordenadores, como reconocer el habla, reconocer modelos de imágenes o clasificar objetos o documentos. Ej.: Via Voice, de la IBM Reconocimiento de huellas digitales o iris de los ojos Aplicaciones policiales Reconocimiento de formas
Nuevas tecnologías aplicadas a la documentación Breve historia: • Esta área de investigación comenzó en 1943 cuando el neurofísico McCulloch y el matemático Walter Pitts propusieron una estructura artificial análoga a la neurona biológica
Nuevas tecnologías aplicadas a la documentación La conexión entre el axón de una neurona y la dendrita de otra se llama sinapsis
Nuevas tecnologías aplicadas a la documentación ¿Y qué son las redes neuronales? • Son sistemas computacionales, de implementación en hardware o software, que imitan las habilidades computacionales del sistema nervioso biológico, usando un gran número de simples neuronas artificiales interconectadas.
Nuevas tecnologías aplicadas a la documentación Una neurona artificial
Redes neuronales artificiales: aprendizaje supervisado Ejemplo de entrenamiento Aprender las entradas: Entrada = {1,1} deberá producir la salida = {1} Entrada = {0,0} deberá producir la salida = {0} Pesos iniciales: {-1,-1} Constante de aprendizaje: {1}
Redes neuronales artificiales: aprendizaje supervisado Función de transferencia: rampa Si el resultado de la suma < 0, entonces la salida = 0 Si el resultado de la suma >= 0 y <= 1, entonces la salida = entrada Si el resultado > 1, entonces la salida = 1
Redes neuronales artificiales: aprendizaje supervisado Presentamos el primer objeto... Usando la función suma tenemos: 1*-1 + 1*-1 = -2 Aplicando este resultado, la función T: 0
Redes neuronales artificiales: aprendizaje supervisado Recordemos que: Entrada = {1,1} debería producir la salida = {1} De momento, la salida obtenida fue = {0} Por tanto, hace falta… un ajuste sináptico
Redes neuronales artificiales: aprendizaje supervisado Constante = 1 Error = salida esperada - salida obtenida Peso nuevo = Peso antiguo + ( Error * Entrada * Constante) Se aplica la regla Delta: Ajuste para el peso 1 Error = 1- 0 = 1 Peso nuevo = -1 + (1 * 1 * 1) = 0 Ajuste para el peso 2 Error = 1 - 0 = 1 Peso nuevo = -1 + (1 * 1 * 1) = 0
Redes neuronales artificiales: aprendizaje supervisado El primer objeto se presenta nuevamente Usando la función suma tenemos: 1*0 + 1*0 = 0 Aplicando este resultado, la función T: 1
Redes neuronales artificiales: aprendizaje supervisado Conclusiones: 1. Si presentamos nuevamente el segundo objeto, verificaremos que el resultado calculado es el esperado 2. Se considera, entonces, que la red ha aprendido
Nuevas tecnologías aplicadasa la documentación RN SOM - Teuvo Kohonen Después de entrenada, datos similares presentados a la red estimularán siempre la misma neurona. Por lo tanto es una red indicada para establecer relaciones, desconocidas previamente, entre datos. Cuando un dato se presenta a la red, solamente resulta activada una neurona del conjunto de salida; por lo tanto, lo que se hace es una clasificación
Nuevas tecnologías aplicadasa la documentación Por lo tanto: Las redes de nodos adaptables que mediante un proceso de aprendizaje a partir de ejemplos, almacenan experiencia y poseen capacidad de generalización. EJEMPLOS...
Nuevas tecnologías aplicadasa la documentación Representación de un objeto que ha de ser aprendido Um neurônio artificial
Primero la red aprende y clasifica y después podemos utilizarla con otros ejemplos Nuevas tecnologías aplicadasa la documentación Funcionamento de una red neuronal:
Nuevas tecnologías aplicadasa la documentación Diferencias entre programas tradicionales y RN: • Un programa tradicional es un conjunto de instrucciones que representan objetos del mundo real que codifican el conocimiento; ejecutará siempre lo que está codificado en las instrucciones. • En una RN ningún conocimiento está codificado; es necesario enseñar presentando ejemplos. Básicamente, el conocimiento, al ser enseñado, se almacena en forma de pesos (valores) que darán a la red el comportamiento deseado. • Simulando un comportamiento parecido al del ser humano
Nuevas tecnologías aplicadasa la documentación Estas tareas se caracterizan porque no pueden representarse con algoritmos genéricos. Son, por lo tanto, de difícil automatización Algunas tareas características de un profesional de la documentación: • Indizar: describir o identificar mediante una representación lingüística un documento en función de sus contenidos • Clasificar: también en función de sus contenidos, agrupar en categorías documentos similares, de manera que resulten pertinentes para una misma búsqueda • Construcción de lenguajes documentales: agrupar términos o códigos, que representan conceptos, en clases comunes y relacionarlas apropiadamente • Búsqueda: relaciona la consulta del usuario con los documentos relevantes del fondo.
Nuevas tecnologías aplicadasa la documentación Ejemplo 1: ESRIN, de la Agencia Espacial Europea, en Italia. Además de controlar los satélites ERS y ENVISAT, efectúa la gestión de todos los documentos oficiales. Utiliza un sistema basado en las redes neuronales de Kohonen. Alcance del experimento: 975 documentos de tamaño variado
Nuevas tecnologías aplicadasa la documentación Etapas del experimento: 1a - Se creó un diccionario con 2962 términos. Por ejemplo: • fabric (fabricación, fabricado, fábrica) • face (cara, rostro, revestimiento) 2a- Cada documento fue codificado utilizando un contador de concurrencias y generó un vector. Rutinas especiales considerarán los diferentes tamaños de los documentos. Ejemplo: documento “X” destornillador chapa metálica hidráulico 3 1 16
Nuevas tecnologías aplicadasa la documentación Etapas del experimento: 3a - una red neuronal fue entrenada utilizando el vector generado anteriormente. El resultado fue la creación de 100 clases de palabras en lugar de las 2692 originales. Este procedimiento compensa el “ruido documental” (palabras no relacionadas con la materia del documento).
Nuevas tecnologías aplicadasa la documentación Funciones del experimento: • Expansión explícita de la consulta :el usuario entra (teclea) palabras simples y obtiene como resultado un conjunto de otras palabras relacionadas. • Expansión implícita de la consulta :todos los documentos están codificados como modelos semánticos. Un usuario puede consultar, y esta consulta ser comparada con los modelos semánticos de los documentos. De este modo, el usuario obtiene no solamente aquellos documentos con las palabras clave buscadas, sino también otros documentos similares (con la misma materia aunque con otras palabras).
La similitud contextual también es posible Nuevas tecnologías aplicadasa la documentación • Otra función es la agrupación de documentos en una estructura de conceptos: una red de tipo auto-organizativo recibe los documentos codificados como entrada y produce como salida 16 agrupaciones (clases).
Nuevas tecnologías aplicadasa la documentación Ejemplo 2: WEBSOM • Es un organizador de mensajes de una lista de discusión. • Capaz de categorizar 4600 mensajes Metodología: 1. Se extraen de los mensajes los términos más relevantes (palabras vacías, que se dan con baja frecuencia o caracteres no textuales se eliminan) 2. Los términos resultantes son utilizados en la generación de un mapa de categorías de palabras
Nuevas tecnologías aplicadasa la documentación Ejemplo 2: WEBSOM 3. Las palabras próximas en el mapa representan la misma categoría:
Nuevas tecnologías aplicadasa la documentación Ejemplo 2: WEBSOM 4. Cada documento ocupa un lugar en el espacio en función de su contenido El color indica la densidad de documentos
Nuevas tecnologías aplicadasa la documentación Los ejemplos y demostraciones están en las siguientes direcciones: • Esrin: http://esapub.esrin.esa.it • WEBSOM: http://websom.hut.fi/websom/comp.ai.neural-nets-new/html/root.html
Nuevas tecnologías aplicadasa la documentación Consideraciones finales: • Muchas tecnologías originadas en el ámbito de la IA pueden aplicarse a la organización y la recuperación de la información • Las redes neuronales presentan el inconveniente de exigir una gran capacidad de computación • Los sistemas de recuperación y clasificación de información en el web se encuentran en franca expansión
Nuevas tecnologías aplicadasa la documentación Referencias bibliográficas Redes neuronales: http://menphis.unisc.br/jacques/index.html Redes neuronales aplicadas a la documentación: http://alcazaba.unex.es/~vhersol/Publicaciones/Anu-SOCADI.pdf WEBSOM: http://websom.hut.fi/