200 likes | 378 Views
La explotación cooperativa de contenidos en el contexto de la Web Semántica. Diego Ferreyra. XXI Reunión del Foro de Directores y Responsables de Unidades de Información Documental Julio/2005. Estándares en la Web. 1945 Vannevar Bush As we May Think / Athlantic Monthtly. (Memex)
E N D
La explotación cooperativa de contenidos en el contexto de la Web Semántica Diego Ferreyra XXI Reunión del Foro deDirectores y Responsables de Unidades de Información Documental Julio/2005
Estándares en la Web • 1945 Vannevar Bush As we May Think / Athlantic Monthtly. (Memex) • 1965 Ted Nelson acuña el término “hipertexto” (Xanadú) • 1986Se publica la Norma ISO 8879 (SGML == Standard Generalized Markup Language) • 1991 Primera especificación HTML desarrollada por Tim Berners-Lee • 1994Primer borrador de HTML 2.0 • 1996Encuentro en la Universidad de Warwick para crear un marco de trabajo con metadatos • 1998Extensible Markup Language (XML) 1.0 • 1999 RDF Model and Syntax Specification La explotacion cooperativa de contenidos en el contexto de la web semantica
El marco Warwick DC-2 • Marzo de 1995 en Dublin (Ohio) se realiza el primer encuentro ausipiciado por la Online Computer Library Center (OCLC) y el National Center for Supercomputing Applications (NCSA) = Dublin Core de 13 elementos. • En 1996 en la Universidad de Warwick se realiza el segundo encuentro. Se acuerda desarrollar una arquitectura: • Modular: diferentes tipos de metadatos • Extensible: nuevos tipos de metadatos • Distribuida: poder referir objetos externos • Recursiva: poder ser considerada a su vez como contenido de información La explotacion cooperativa de contenidos en el contexto de la web semantica
Tipos de estándares • Visual Resources Association Data Standards Committee • Estándares de contenidos • AACR • Estándares de estructuras de datos • Dublin Core, VRA • Estándares de comunicación • MARC 21 • Estándares de valores • Lenguajes controlados La explotacion cooperativa de contenidos en el contexto de la web semantica
Mapa de lenguajes de metadatosRDF, XML, DCMI, SVG, DALM, OIL, OWL, SOAP,WSDL http://mapageweb.umontreal.ca/turner/meta/english/metamap.html La explotacion cooperativa de contenidos en el contexto de la web semantica
Web semántica • XML (EXtensible Markup Language) + DTD (Document Type Definition) • RDF (Resource Description Framework): es una recomendación del W3C, basado en XML, que proporciona la tecnología para escribir metadatos que describen recursos en la Web. La explotacion cooperativa de contenidos en el contexto de la web semantica
Web semántica Una ontología es una descripción formal de los conceptos y las relaciones entre conceptos. (GRUBER, 1993) • Ontología: es una descripción formal de conceptos en el dominio de un discurso. Una ontología es una especificación de una conceptualización. • Las ontologías establecen una terminología conjunta entre miembros de una comunidad de interés. Estos miembros pueden ser humanos o agentes automáticos. • En términos prácticos, el desarrollo de una ontología incluye: o Definir clases en la ontología o Colocar las clases en un jerarquía de taxonomías(subclase-superclase) o Definir atributos y describir los valores permitidos para esos atributos o Rellenar los valores de los atributos con ejemplos. La explotacion cooperativa de contenidos en el contexto de la web semantica
Web semántica • Inferencia de semántica a partir de estructuras lógicas. • Logica: XML basado en definiciones de tipos de datos basado en DTDs • Semántica: RDF basado en esquemas basado en declaración de relaciones (nominales y referenciales) La explotacion cooperativa de contenidos en el contexto de la web semantica
http://www.r020.com.ares un sitio que se llamaR020 || <http://www.r020.com.ar> <meta name="DC.Title" content="R020" /> || <rdf:Description rdf:about="http://www.r020.com.ar/"> <dc:title>R020</dc:title> || Sujeto: http://www.r020.com.ar/ Predicado: http://purl.org/dc/elements/1.1/title Objeto:http://www.anthus.com/CyberDewey/D020.html La explotacion cooperativa de contenidos en el contexto de la web semantica
Referencias a los esquemas utilizados: <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:skos="http://www.w3.org/2004/02/skos/core#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about=“http://www.r020.com.ar/ "> .... </rdf:Description> </rdf:RDF> La explotacion cooperativa de contenidos en el contexto de la web semantica
http://www.r020.com.ar/tematres/xml.php?skosTema=680 Metadatos literales: <dc:title>TemaTres</dc:title> <dc:creator>Diego Ferreyra</dc:creator> <dc:description> Tesauro generalista para educación general básica argentina. Tesauro de pruebas </dc:description> Metadatos por URI <skos:Concept rdf:about="http://www.r020.com.ar/tematres/index.php?tema=680"> <skos:prefLabel>CATALOGACION</skos:prefLabel> <skos:inScheme rdf:resource="http://www.r020.com.ar/tematres/"/> <skos:narrower rdf:resource="http://www.r020.com.ar/tematres/index.php?tema=681"/> </skos:Concept> La explotacion cooperativa de contenidos en el contexto de la web semantica
Web semántica • Una semántica para programas.... no para humanos :-) • RDF: procesamiento global e interoperable de la información Web • Problemáticas de los lenguajes documentales • Semántico ~o~ Sintáctico La explotacion cooperativa de contenidos en el contexto de la web semantica
Web semántica Supuestos de la clasificación (J. H. Shera): • Un orden universal • Unidad del conocimiento • Similaridad entre miembros de una clase • Esencialidad intrínseca El idioma analítico de John Willkins / Jorge L. Borges Lenguaje como contrato <> lenguaje como representación El lenguaje establece un contrato y un compromiso entre partes La explotacion cooperativa de contenidos en el contexto de la web semantica
Ejemplos de explotación cooperativa Ejemplo basado en RDF • RSS 1.0: RDF Site Summary Descripción simple de contenidos. Ejemplos: http://www.r020.com.ar/rss/index.php http://www.r020.com.ar/clase/ Ejemplo basado en XML • Open Archive Initiative: OAI La explotacion cooperativa de contenidos en el contexto de la web semantica
Ejemplos de explotación cooperativa: TemaTres TemaTres es una aplicación Web para la gestión de lenguajes documentales. • Relaciones entre términos • relaciones equivalencia: (UP) • relaciones jerárquicas: (TE / TG) • relaciones asociativas (TR) • Navegación sistemática y alfabética • Buscador • Salidas • SKOS-Core • ZThes La explotacion cooperativa de contenidos en el contexto de la web semantica
Ejemplos de explotación cooperativa: TemaTres La explotacion cooperativa de contenidos en el contexto de la web semantica
Explotación colaborativa basada en metadatos Folksnomy : Folk (pueblo) + taxonomy (taxonomía) • Clasificaciones a partir de regularidades lingüísticas emergentes. • Clasificación a partir de etiquetas (tags) simples • Facilidad para incorporar la novedad lingüística • Explotación de la inteligencia de la comunidad • Navegación plana= vocabulario controlado no jerárquico • Ambigüedad / sinonimia La explotacion cooperativa de contenidos en el contexto de la web semantica
Ejemplos de explotación colaborativa basadas en metadatos Ejemplos: http://del.icio.us/tag/ http://www.flickr.com/photos/tags/ http://www.technorati.com/tag/ http://www.metafilter.com/tags.mefi http://www.43things.com/ http://www.citeulike.org/tag/ La explotacion cooperativa de contenidos en el contexto de la web semantica
Ejemplos de explotación de relaciones basadas en lenguaje natural Sin intervención humana en la categorización http://www.tenbyten.org/10x10.html Mapeador sobre el agregador de noticias del Google News http://www.marumushi.com/apps/newsmap/ La explotacion cooperativa de contenidos en el contexto de la web semantica
¿Lenguaje natural vs controlado? Iuri Lotman: La semiosfera Espacio de realización de procesos comunicativos y de producción de nueva información • Carácter delimitado: la frontera dinámica • Irregularidad semiótica Gramaticalidad / Textualidad Las sociedades en crisis son sociedades más textualizadas que gramaticalizadas La explotacion cooperativa de contenidos en el contexto de la web semantica