420 likes | 546 Views
OpenSKOS / VocabulaireBank. Hennie Brugman Meertens Instituut Technisch coordinator CATCHPlus. Overzicht. Inleiding Ontstaansgeschiedenis “Technische acronymen” Functionele beschrijving en demo Toepassingen in de praktijk Content en beschikbaarheid
E N D
OpenSKOS / VocabulaireBank Hennie Brugman Meertens Instituut Technisch coordinator CATCHPlus
Overzicht • Inleiding • Ontstaansgeschiedenis • “Technische acronymen” • Functionele beschrijving en demo • Toepassingen in de praktijk • Content en beschikbaarheid • Stakeholders en toekomstige ontwikkelingen • Basis/onderdeel van een (inter)nationaal platform?
Problemen mbt gebruik van vocabulaires • Bouwen en beheren van thesauri is tijdrovend • Liever hergebruik • Hoe ontdek en evalueer je bestaande thesauri? • Je software-tools moeten specifieke thesauri ondersteunen • Meestal hooguit als browsable en doorzoekbare website gepubliceerd • Niet als data, niet in standaardvorm • Toolbouwers moeten veel maatwerk verrichten
OpenSKOS doelen • Standaard formaat en access methoden • SKOS, SKOS gebaseerde REST API • Web publicatie van vocabulaires • Als Linked Open Data • Als doorzoekbare en browse-bare dataset REST API • Te gebruiken voor duurzame referenties naar concepten persistente identifiers en/of stabiele URLs • Te harvesten door middel van OAI-PMH • Bevorderen semantische interoperabiliteit door het ondersteunen van ‘alignments’ • Stimuleren van Open licenties
Voordelen aanbieders • Anderen je vocabulaires aanbieden kan met een simpele upload actie • Of via een eigen OpenSKOS instantie, of via OAI-PMH • Het is mogelijk je eigen vocabulaire te gebruiken in andermans tools (al dan niet commercieel), als die tools OpenSKOS aanspreken • Vocabulaires kunnen makkelijk en frequent door de bouwer/beheerder worden ge-update, zonder tussenkomst van derden • Het is eenvoudig concepten uit je eigen vocabulaires te koppelen aan andere vocabulaires
Voordelen gebruikers • Het is eenvoudig om vocabulaires te ontdekken, evalueren en te gebruiken • Minder noodzaak ze zelf te construeren • Nieuwe mogelijkheden tot browsen en zoeken • In vocabulaires, in collectie-beschrijvingen • Altijd up-to-date versies van vocabulaires beschikbaar
Voordelen toolbouwers • Geen maatwerk per vocabulaire meer nodig, geen periodieke updates door te voeren • Kunnen profiteren van werk van andere toolbouwers en vocabulaire-aanbieders • Kunnen OpenSKOS gebruiken voor een reeks van nieuwe use cases
VAS, versie 1 • In eigen beheer gebouwd • Lourens van der Meij, VU • Tekortkomingen • Ontbrekende functionaliteit • Twijfel aan schaalbaarheid • API definitie kon netter • Desondanks succesvol • Jarenlang stabiel gedraaid en gebruikt • Toegepast tbv gebruik Beeld en Geluid thesaurus door Nationaal Archief (via Pictura’s Memorix tool)
VAS, versie 2: OpenSKOS • Gedurende half jaar intensief overlegd door CATCHPlus, RCE, Adlib, Pictura, Trezorix • Op initiatief van en gehost door RCE • Mede naar aanleiding van VAS, versie 1 • Doel: elkaars tools en omgevingen op elkaar aansluiten mbt vocabulaires/kennisstructuren • Uitkomst: architectuur-concept en REST API specificatie • OpenSKOS implementatie is helemaal conform de uitkomsten van dit overleg
SKOS, een ultrakorte primer • SKOS kennisstructuren bestaan uit Concepten, onderverdeeld in ConceptSchemes • Concepten hebben een URL ter identificatie • Concepten hebben labels in 1 of meer talen • Concepten kunnen worden gedocumenteerd met ‘notes’ • Concepten hebben onderling semantische relaties • broader, narrower, related
SKOS Term: Economic cooperation Used For: Economic co-operation Broader terms: Economic policy Narrower terms: Economic integration, European economic cooperation, European industrial cooperation, Industrial cooperation Related terms: Interdependence Scope Note: Includes cooperative measures in banking, trade, industry etc., between and among countries.
SKOS en het semantisch web • Concepten kunnen over grenzen van ConceptSchemes worden gelinkt • exactMatch, closeMatch, broadMatch, narrowMatch, relatedMatch • Mits een Concept een stabiele, resolvable URL heeft kan er naar gelinkt worden • Concepten kunnen zelf linken naar (Linked Open Data op) het web
Nut/voordelen • Standardisatie • Sluit aan bij web • Concept- versus term-gebaseerd
Linked Open Data • Een methode om data te tonen, delen en verbinden via ‘dereferencable URIs’ op het Web. CATCHPlus bijeenkomst - 10 juni 2011 - Meertens Instituut
Nut/voordelen • Eenvoudige, gestandaardiseerde manier van webtoegang tot data • ‘web van data’
RESTful web services • Web service: • Software die interactie tussen machines over het web mogelijk maakt (“afspraken over vragen en antwoorden”) • RESTful: • Gebruikt standaard protocollen van world wide web (http) • Beschrijft resultaten zoveel mogelijk als (online) ‘resources’ • Aan te roepen via gewone URLs • In principe eenvoudig in gebruik en schaalbaar • Voor gebruik vanuit software • Dus primair voor gebruik door programmeurs • Middleware • Linked Data is een specifieke instantie van een RESTful web service
Nut/voordelen • Standaard vorm van communicatie tussen machines • Modulair, gelaagd • Beter over verschillende machines en instellingen te verspreiden • Allerlei verschillende toepassingen ‘er bovenop’ te bouwen
Architectuur RESTful API Dashboard voor interactieve toegang OAI-PMH data provider en harvester Upload module
RESTful API • Concept resolve API • Find API • Autocomplete • CRUD (create, retrieve, update, delete) • Institutions • Collections
Demo • Concept resolve • api/concept/a5994c9c-3368-9e52-494c-89b0fa8cd263.rdf • api/concept?id=http://data.beeldengeluid.nl/gtaa/30135&format=html
Demo • Find API • api/find-concepts?q=crisis&format=rdf • api/find-concepts?q=crisis+collection:4&format=json • api/find-concepts?q=crisis+tenant:rkd&format=json • api/find-concepts?q=prefLabelText:rutte+collection:4+inScheme:http*Persoonsnamen&format=json&fl=prefLabel,scopeNote
Demo • Autocomplete API • api/autocomplete/politi?returnLabel=prefLabel • api/autocomplete/speelf?returnLabel=prefLabel
Demo • Institutions, Collections API • in RDF: /api/institutions • in HTML: /api/institutions?format=html • /api/collections/beng:gtaa.html
Demo • Dashboard en upload module • http://openskos.org/dashboard
Demo • OAI-PMH • OAI voorbeelden
Client tools en diensten • Bruikbaar voor CATCHPlus cases • CLARIN(-NL) CLAVAS project • Nationaal Archief gebruikt de API voor toegang tot de Beeld en Geluid GTAA thesaurus (via Memorix) • Generieke browse- en zoek- web applicatie – Q42
Content • GTAA (via Beeld en Geluid) • 2 eigen OpenSKOS instanties • Open Database Licentie • AAT-NED (via RKD) • Door RKD beschikbaar gesteld • Licentie?
Beschikbaarheid • Broncode is onder Open source licentie en online beschikbaar (GitHub) • We promoten Open Database licenties en Creative Commons • We promoten vrij gebruik van services • M.u.v. schrijf-acties via API en Dashboard toegang • Iedereen kan eigen instantie van OpenSKOS draaien • Pictura biedt 10 jaar hosting van OpenSKOS aan
Stakeholders • Adlib • Beeld en Geluid • Clarin/Clavas • DEN • KB • Meertens • Nationaal Archief • Naturalis • Pictura • RCE • RKD • Trezorix • Werkgroep erfgoedthesauri
Toekomst • Linken met nieuwe “DEN inventarisatie van erfgoedthesauri” • Uitbreiden van de inhoud • Meerdere OpenSKOS instanties • Beeld en Geluid: bouwen thesaurusbeheerapplicatie • Pilot in overweging • RCE, Beeld en Geluid, Meertens • Presentaties • KVAN dagen (juni 2012, met Pictura en BenG) • LREC conferentie Istanbul (mei 2012)