430 likes | 682 Views
Simple Knowledge Organisation System. SKOS. w pigułce. Marcin Roszkowski. PLAN WYSTĄPIENIA. Wprowadzenie Semantic Web w 5 minut, Linked Data. Czym jest SKOS? Dlaczego SKOS? SKOS w praktyce. Krytyka SKOS. Wnioski. SEMANTIC WEB W 5 MINUT. Tim Berners-Lee (2007) Sukces World Wide Web:
E N D
Simple Knowledge Organisation System SKOS w pigułce Marcin Roszkowski
PLAN WYSTĄPIENIA • Wprowadzenie • Semantic Web w 5 minut, • Linked Data. • Czym jest SKOS? • Dlaczego SKOS? • SKOS w praktyce. • Krytyka SKOS. • Wnioski.
SEMANTIC WEB W 5 MINUT Tim Berners-Lee (2007) Sukces World Wide Web: • nieograniczone możliwości łączenia informacji (np. hiperłącza), • otwarte standardy, • rozdzielenie warstw sieci (komunikacja, wizualizacja, przetwarzanie).
SEMANTIC WEB W 5 MINUT • dzisiejsza sieć to sieć dokumentów (statyczne, dynamiczne), • dane w dokumentach zrozumiałe tylko dla ludzi, • aplikacje sieciowe nie są w stanie przetworzyć danych.
SEMANTIC WEB W 5 MINUT • utrzymanie postulatu AAA (Anyone can say Anything about Any topic), • rozpowszechnienie standardów opisywania treści, • „zrozumienie” danych przez aplikacje, • możliwość powiązania danych.
SEMANTIC WEB W 5 MINUT Podstawowe standardy/specyfikacje: • RDF (Resource Description Framework) - specyfikacja modelu metadanych, • RDF Schema (RDFS) - język reprezentacji wiedzy, • OWL (Web Ontology Language) – język modelowania ontologii internetowych, rozszerzenie RDFS.
SEMANTIC WEB W 5 MINUT Cel • standaryzowany i spójny model danych, • zmiana perspektywy - dane, • dane powiązane (Linked Data).
LINKED DATA • nie model danych, lecz filozofia, • metoda ekspresji, reprezentacji, łączenia i współdzielenia danych, • Tim Berners-Lee: data hugging, • narzędzia: • identyfikator URI, • protokół http, • RDF oraz RDFS/OWL.
LINKED DATA Cztery zasady Linked Data: • Używaj URI jako nazwy dla obiektów. • Stosuj protokół http, po to by uzyskać informacje o tych obiektach. • Aktywacja poszczególnego URI ma spowodować pozyskanie użytecznych informacji. • Wykorzystuj powiązania z innymi obiektami za pomocą URI, aby zapewnić możliwość eksploracji i odkrywania innych obiektów.
LINKED DATA • FOAF (Friend Of A Friend), • format reprezentacji danych personalnych, • internetowa tożsamość, • wizytówka sieciowa, • rozszerzenie RDF.
FOAF <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:admin="http://webns.net/mvcb/"></foaf:PersonalProfileDocument><foaf:Person rdf:ID="me"><foaf:name>Marcin Roszkowski</foaf:name><foaf:givenname>Marcin</foaf:givenname><foaf:family_name>Roszkowski</foaf:family_name><foaf:mbox_sha1sum>e59bff904001aa669cc84a983fcbf6e4b97e2299</foaf:mbox_sha1sum><foaf:homepage rdf:resource="http://biblioteka.unipt.pl"/><foaf:based_near rdf:resource="http://sws.geonames.org/3088972/" rdfs:label="Piotrków Trybunalski"/><foaf:depiction rdf:resource="http://4.bp.blogspot.com/_4XgyLS9g-Xg/roszkowski.jpg"/><foaf:workplaceHomepage rdf:resource="http://mroszkowski.blogspot.com"/><foaf:schoolHomepage rdf:resource="Uniwersytet Jana Kochanowskiego. Filia w Piotrkowie Trybunalskim"/></foaf:Person></rdf:RDF>
LINKED DATA Formaty danych / zbiory danych: • FOAF (Friend Of A Friend), • SIOC (Semantically-Interlinked Online Communities) Project – format danych do opisu społeczności, jej członków, zainteresowań • DOAP (Description of a Project) - format danych do opisu projektów open source, jego twórców, przebiegu, efektów, • Kartoteki wzorcowe VIAF (The Virtual International Authority File), • DBpedia – ustrukturyzowane dane pochodzące z Wikipedii. • SKOS (Simple Knowledge Organisation System).
CZYM JEST SKOS? Czym jest SKOS? • format danych dla systemów porządkowania pojęć (systemy organizacji wiedzy), • formalny język reprezentacji struktury SOW, • rozszerzenie RDF, • rekomendacja World Wide Web Consortium - W3C (sierpień 2009 r.)
CZYM JEST SKOS? Systemy organizacji wiedzy (SOW): • systemy porządkowania pojęć, • tradycyjne języki informacyjno--wyszukiwawcze, • sieciowe systemy organizacji wiedzy: • taksonomie internetowe, • ontologie.
OPIS W SKOS • opis pojęcia z wykorzystaniem składni RDF, • Trójki RDF (RDF triples) : • podmiot – predykat – obiekt, • pojęcie – predykat – wartość. • Przywołanie pojęcia za pomocą indywidualnego URI w opisywanym zbiorze.
OPIS W SKOS <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://www.ukat.org.uk/thesaurus/concept/1750"> <skos:prefLabel>Economic cooperation</skos:prefLabel> </skos:Concept> </rdf:RDF>
CECHY SKOS Standaryzowany zbiór klas i własności, które służą do: • identyfikacji pojęcia: skos:Concept za pomocą jego URI • http://bn.org.pl/jhp/concept/1750(pojęcie językoznawstwa) • identyfikacji SOW: skos:ConceptScheme • np. JHP BN
CECHY SKOS • ustalenia nazw dla pojęcia i określenie ich statusu: • skos:prefLabel (w różnych językach etnicznych) Językoznawstwo @pl, • skos:prefLabel Linguistics @en, • skos:altLabel Lingwistyka, • skos:hiddenLabel Językonzawstwo,
CECHY SKOS • dodatkowych informacji o znaczeniu pojęcia i jego zmianach: • skos:note, • skos:scopeNote, • skos:definition, • skos:editorialNote,
CECHY SKOS • ustalenia relacji znaczeniowych pomiędzy pojęciami: • relacja nadrzędności zakresowej skos:broader, • relacja podrzędności zakresowej skos:narrower, • relacja skojarzeniowa skos:related,
JHP W SKOS <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://bn.org.pl/jhp/concept/1750"> <skos:prefLabel>Językoznawstwo</skos:prefLabel> <skos:altLabel>Lingwistyka</skos:altLabel> <skos:hiddenLabel>Językoznwastwo</skos:hiddenLabel> <skos:broader rdf:resource="http://bn.org.pl/jhp/concept/4382"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/2108"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/9505"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/15053"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/18987"/> <skos:related rdf:resource="http://bn.org.pl/jhp/concept/3250"/> <skos:inScheme rdf:resource="http://bn.org.pl/jhp"/> </skos:Concept> </rdf:RDF>
EKSPRESJA SKOS Siła ekspresji SKOS pozwala również na uwzględnienie: • sztucznego systemu notacyjnego, np. dla klasyfikacji: <skos:notation>81</skos:notation>, • odwzorowanie fasetowej struktury pola semantycznego: <skos:collection>Procesy</skos:collection> • odwzorowanie zależności pomiędzy pojęciami z różnych SOW (mapowanie), wykładniki typów zgodności zakresowej: skos:exactMatch, skos:closeMatch.
SOW W SKOS • UK Archival Thesaurus (UKAT), • The General Multilingual Environmental Thesaurus (GEMET), • Australian Public Affairs Information Service (APAIS) Thesaurus, • Tezaurus AGROVOC, • Library of Congress Subject Headings (LCSH) • Medical Subject Headings (MeSH), • GeoNames, kartoteka wzorcowa nazw geograficznych, • UNESCO Thesaurus, • ISO639 Codes for the representation of names of languages.
DLACZEGO SKOS? • wspólny model danych dla opisu SOW, • opis SOW musi być zrozumiały dla aplikacji, • SOW muszą być współdzielone, • SOW jako platforma wspólnego odniesienia.
JAK TO DZIAŁA? Rezultaty wyszukiwania Rezultaty wyszukiwania Rezultaty wyszukiwania JIW SOW1 SOW2 OPAC BAZA1 BAZA2
JAK TO DZIAŁA? API
KRYTYKA SKOS • format danych vs. mechanizmy ich przetwarzania, • wymiar technologiczny: • aplikacje eksplorujące i przetwarzające linked data, języki zapytań (np. SPARQL), • mechanizmy wizualizacji RAW DATA,
KRYTYKA SKOS • wymiar technologiczny: • narzędzia opisu SOW w SKOS (np. Protege, Tematres) • problemy: • reprezentacja niesamodzielnych jednostek leksykalnych (symbole pomocnicze, określniki), • reprezentacja zdań JIW.
PODSUMOWANIE • formalizacja umożliwia automatyczne przetwarzanie, • bariery: odległość, język, granice dyscyplinarne, • SKOS < Linked Data, • projekt nadal rozwijany, • ocena bibliotekarzy?
PODSUMOWANIE • SKOS = format danych dla SOW, • potrzeba współdzielonych zbiorów danych, • co z „naszymi” formatami?
PODSUMOWANIE RAW DATA NOW !
Simple Knowledge Organisation System SKOS w pigułce Marcin Roszkowski Dziękuję za uwagę