280 likes | 437 Views
Universidad de Oviedo. SOAF: un sistema de indexado semántico de OA basado en las anotaciones colaborativas. SPDECE 2007 - Bilbao. Doina Ana Cernea - Departamento de Matemáticas María Esther del Moral - Departamento de Ciencias de la Educación Emilio Labra - Departamento de Informática.
E N D
Universidad de Oviedo SOAF: un sistema de indexado semántico de OA basado en las anotaciones colaborativas SPDECE 2007 - Bilbao Doina Ana Cernea - Departamento de Matemáticas María Esther del Moral - Departamento de Ciencias de la Educación Emilio Labra - Departamento de Informática
Introducción • El nuevo marco de la Web Semántica se convierte en un escenario idóneo para la formación on-line, ya que permite la adaptabilidad a las necesidades específicas del alumno y facilita el aprendizaje colaborativo. • Los contenidos educativos diseñados y organizados en Objetos de Aprendizaje (OA) se caracterizan por su alta densidad de elementos multimedia. • Se detecta la necesidad de dotar de semántica de manera automática a los recursos multimedia, componentes esenciales de los OA, para su óptima localización y recuperación, en consonancia con las necesidades específicas de unos objetivos educativos concretos, frente al vacío semántico que existe entre la descripción basada en los contenidos y la descripción basada en conceptos. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El nuevo marco de la Web Semántica e implicaciones en el diseño de los OA • La Web Semántica es una visión (Tim Berners-Lee): • disponer los datos en la Web definidos y entrelazados de forma que puedan ser leídos y utilizados por las máquinas no solamente para su visualización sino también para: • Automatizar tareas • Integrar y • Reutilizar datos entre aplicaciones • RDF (Resource Description Framework): un modelo de datos para describir recursos • Ontologías: un vocabulario compartido que describe la organización del conocimiento de un dominio. • OWL (Web Ontology Language) es un lenguaje de marcado para publicar y compartir datos usando ontologías en la WWW Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Tecnologías de la Web Semántica • La Web Semántica implica la creación de tecnologías para la descripción de los datos contenidos dentro de las páginas Web. RDF - vocabulario propuesto para la descripción de los recursos y de las relaciones que existen entre ellos. • Ejemplo: código RDF para la descripción semántica de un OA sobre Geometría Fractal: <rdf:RDF xmlns:rdf=”...” ... > <rdf:Description rdf:about="http://.../geofractal/estruFractal"> <rdf:type rdf:resource="http://...#Introduction"/> <dc:title>Introducción a la Estructura Fractal</dc:title> <dc:creator> <lom:entity> <vCard:FN>J. Garrido</vCard:FN></lom:entity> </dc:creator> </rdf:Description> </rdf:RDF> Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Tecnologías de la Web Semántica • Otra tecnología clave en el desarrollo de la Web Semántica es la asociada a la representación del conocimiento de un dominio concreto, es decir, la definición de los conceptos y sus relaciones • OWL - lenguaje común para la definición de las ontologías y está basada en la lógica descriptiva • Ejemplo: el OA “Introducción a la Geometría Fractal” Introducción es de tipo Lección y puede contener varios ejercicios Exercise: http://...#Introduction http://...#Lecture http://...#Introduction http://...#contains http://...#Exercise Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Aprendizaje colaborativo potenciado por la Web Semántica • En el contexto creado por la Web 2.0 surge el nuevo paradigma de la colaboración denominado software social, cuyas aplicaciones como las redes sociales, wikis y folksonomías han encontrado una gran aceptación dentro de las comunidades de e-Learning, potenciando el aprendizaje colaborativo, basado en la construcción conjunta del conocimiento. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Sistemas de etiquetado colaborativo: folksonomías • Las folksonomías se definen como sistemas colaborativos para la categorización no jerárquica de los recursos de Internet a través de etiquetas compartidas por una comunidad o red social. • Estructuras sociales emergentes mediante las conexiones: • Usuarios – recursos: las etiquetas de los usuarios establecen un vínculo entre éstos y los recursos • Recursos – recursos: los recursos pueden estar conectados entre sí a través de enlaces (sus propias etiquetas sirven de enlace con otros recursos etiquetados del mismo modo) • Usuarios – usuarios: los usuarios pueden responder a ciertas afiliaciones sociales, al proceder de comunidades virtuales que comparten los mismos intereses Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Etiquetas Usuarios Recursos t1,t2,t3 t7,t2,t5 t1,t2,t3 t1,t2,t3 t1,t8,t9 t10,t2 t7,t8,t9 t5,t7,t3 Modelo conceptual de un sistema de etiquetado colaborativo Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Indexado semántico de los recursos Web educativos • Web Semántica ↔ descripción de los recursos con un grado más fino de granularidad (los recursos de Internet dejan de ser unidades de información) • Ejemplo: de la descripción semántica del OA “Introducción a la Geometría Fractal” se podría extraer ladefinición del concepto de estructura fractal o la propiedad de recursividad. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Contenidos para e-Learning: el concepto de Objeto de Aprendizaje • Definición y estructura • Objeto de Aprendizaje (OA), Learning Object (LO), Reusable Learning Object (RLO). • Polsani: “unidades de contenido educativo, independientes, con sentido por si mismas, con potencial para ser reutilizadas en múltiples contextos de enseñanza” • Un OA puede ser: • Un único recurso educativo (imagen, animación, simulación, párrafo descriptivo…) • Un apartado de una lección • Una lección • Un curso Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Contenidos para e-Learning: el concepto de Objeto de Aprendizaje • Definición y estructura • Curso • Módulo (Capítulo) - opcional • Lección (Objeto de Aprendizaje - RLO) • Tópico (Objeto de Información – RIO) • Subtema (incluye los recursos educativos) 7+2 módulos teóricos para su máximo rendimiento, teniendo en cuenta las limitaciones de la memoria humana (Miller) Visión General Resumen Evaluación Actividades Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
OA en la Web Semántica • Los OA poseen una estructura granular flexible: • En un primer nivel los apartados (Objetos de Información) • En un segundo nivel los recursos que los componen (texto, multimedia, etc.) Objetos de Información Objeto de Aprendizaje Recursos de Aprendizaje Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Tipos de recursos educativos, componenetes de los OA • Resursos de texto: técnicas de procesamiento del lenguaje natural, muy utilizadas por los buscadores, que suponen la división del texto en una lista de términos que a continuación serán normalizados mediante técnicas de radicación, eliminando las ambigüedades lingüísticas y las palabras vacías de contenido • Recursos de imagen • Recursos audio y vídeo Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia • El gap semántico: • Vacío semántico que existe entre la extracción automática de información proporcionada por los ordenadores y percepción humana de las imágenes basada en conceptos de alto nivel (high-level concepts). • La ausencia de coincidencias entre la información que se puede extraer de los datos visuales y la interpretación un usuario determinado pueda encontrar para los mismos datos en una situación concreta Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Descripción basada en conceptos de alto nivel: “high – level concept” Información Semántica Semantic Gap vectores de características color y texturas bordes Descripción basada en contenidos “low – level features” Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia • Características de bajo nivel y conceptos de alto nivel: • Los rasgos que pueden ser directamente extraídos a partir de las representaciones digitales de los objetos, se denominan características de bajo nivel (low-level-features). • Pueden estar muy lejos de la metodología de interpretación que los seres vivos asocian con la percepción del objeto. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia • Características de bajo nivel y conceptos de alto nivel: • Características de bajo nivel: • estadísticas de tonos y colores (medias, histogramas, etc) • descriptores de Fourier (DFT) • descriptores relacionados con la geometría fractal • parámetros de forma (áreas, diámetros, perímetros) • parámetros geométricos (líneas, curvas y contornos) • parámetros extraídos de la imagen binaria • descripción de los modelos de textura • … Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia • Interpretación subjetiva del ser humano implica el uso de conceptos de alto nivel (high-level-concepts) específicos para los diversos dominios de aplicación. • El proceso de extracción de la semántica de los recursos es más compleja, ya que requiere el conocimiento del dominio, interacciones del usuario o ambas cosas e interpretaciones subjetivas. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia • Extracción de la información de los recursos multimedia • Distintas aproximaciones: • Segmentación de la imagen en varias regiones. Aplicación de un modelo matemático (redes de inferencia o distribuciones Múltiples Bernoulli) para enlazar las regiones con los conceptos. • Análisis orientado a la escena global. Aplicación de anotaciones de escenas básicas obtenidas mediante filtros globales o utilización de descriptores locales correspondientes a las regiones relevantes de la imagen. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
El gap semántico de los recursos multimedia • Descripción semántica de recursos multimedia: el estándar MPEG - 7 • La necesidad de una representación de alto nivel de los recursos multimedia, que capture también el significado de sus contenidos, ha impulsado el desarrollo del estándar MPEG – 7, desarrollado por la MPEG (Moving Picture Experts Group). • Proporciona descriptores de metadatos para los contenidos de bajo nivel y aporta también un conjunto de herramientas para la modelación de una descripción semántica de estos recursos. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Arquitectura SOAF: Integración de las anotaciones colaborativas de los usuarios con la semántica emergente • Desde esta perspectiva, el sistema SOAF contempla y procesa tres tipos de meta-información que pueden acompañar a los OA o a los recursos que los componen: • La semántica proporcionada de forma automática mediante indexado semántico a partir de las características de bajo nivel • Los descriptores de alto nivel o metadatos de los autores (en la mayoría de los casos se refieren a título, fecha de creación, nombre de los autores, tema, objetivos de aprendizaje,…) • La semántica de los usuarios mediante anotaciones colaborativas. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Arquitectura SOAF: Integración de las anotaciones colaborativas de los usuarios con la semántica emergente Descriptores de bajo nivel Proceso automático OA Descriptores de alto nivel Autores Etiquetas Usuarios Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
O4 O1 O3 O2 Arquitectura SOAF: Integración de las anotaciones colaborativas de los usuarios con la semántica emergente Retroalimentación del sistema Características de bajo nivel SOAF LSI OA Metadata del autor Descripción semántica Anotaciones usuarios Folksonomías Filtrado Social Tags colaborativos Sugerencias del sistema Red de Ontologías Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Extracción de semántica emergente • El sistema SOAF propone una arquitectura para la extracción automática de descripción semántica de los recursos educativos multimedia basada en Latent Semantic Indexing [28] a partir de la representación de los recursos (texto o multimedia) en vectores del espacio vectorial Rn, y aplicando análisis de matrices establece las asociaciones y las conexiones entre los diversos recursos de un repositorio. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Semántica emergente Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Semántica emergente Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Etiquetas generadas colaborativamente • SOAF utiliza un sistema basado en folksonomías para capturar las anotaciones de los propios usuarios focalizadas en sus experiencias de aprendizaje. • SOAF utiliza estas anotaciones colaborativas para completar y corregir el indexado semántico generado automáticamente por ordenador a partir de las características de bajo nivel. • Se observa que con el tiempo, la frecuencia relativa de una misma etiqueta tiende a ser un valor constante, lo que indica que el etiquetado colaborativo posee la capacidad de coordinar las acciones de los usuarios para crear anotaciones coherentes para los recursos que comparten. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas
Filtrado social de las anotaciones colaborativas de los usuarios • El conjunto de etiquetas asignadas por los usuarios se pueden filtrar aplicándoles un test de confianza basado en la similitud de perfiles para garantizar su fiabilidad, pertinencia y validez. El sistema crea y almacena los perfiles de los usuarios a partir de sus intereses y sus criterios subjetivos, a la vez que compara sus perfiles y determina similitudes vía fórmulas estándar de correlación estadística. • Mediante el filtrado social el sistema “recomienda” una etiqueta si varios usuarios con perfiles similares la han asignado, es decir, se le asigna un mayor valor de confianza a la etiqueta más utilizada por usuarios con perfiles similares. Doina Ana Cernea – SOAF: un sistema de indexado semántico de OA basado en anotaciones colaborativas