300 likes | 424 Views
Semantic Web. Resource Description Framework. Zakaj splet ni zadosti. Omrežna dostopnost informacij v poznih 80-ih: Internet je načeloma omogočal dostop do informacij na oddaljenih računalnikih, vendar je bilo to lahko zelo zapleteno.
E N D
Semantic Web Resource Description Framework
Zakaj splet ni zadosti Omrežna dostopnost informacij v poznih 80-ih: • Internet je načeloma omogočal dostop do informacij na oddaljenih računalnikih, vendar je bilo to lahko zelo zapleteno. • Dostop do informacij je lahko pomenil prehod preko različnih omrežij in uporabo različnih ukazov za rabo zbirk. • Ko je bila informacija najdena, jo je bilo težko dobiti na svoj računalnik, • največkrat je šlo le s prepisovanjem z zaslona, • v najboljšem primeru si jo lahko naročil na svoj e-poštni naslov. • Zbrane so bile največkrat le najlaže dostopne informacije in ne najboljše.
Zakaj splet ni zadosti Splet je spremenil vse: • Omogoča enostavno, od oddaljenosti, konkretne hrbtenice in računalniškega sistema neodvisno odkrivanje in pridobivanje informacij. • Kopiranje informacij ni potrebno, isto dosežemo s postavljanjem kazalcev na informacije. • Splet je postal enoten, medsebojno povezan prostor dokumentov.
Zakaj splet ni zadosti • Splet omogoča človeškemu uporabniku izkoriščanje hipertekstnih povezav za povezovanje dokumentov in podatkov in, posledično, tvorbo novega znanja. • Pretok informacij od informacijskih aplikacij k uporabnikom je postal izjemno enostaven. • Zelo zapleten in neučinkovit pa je ostal pretok informacij med aplikacijami. • Splet ne omogoča avtomatskega povezovanja podatkov in avtomatske tvorbe novega znanja.
Zakaj splet ni zadosti • Običajni spletni hipertekstni kazalci omogočajo le enostavno statično povezovanje dokumentov, namenjenih človeškim očem, na način, ki ga je predvidel avtor dokumenta. • Večina podatkov, trenutno dostopnih na spletu (skritih v dokumentih in v podatkovnih zbirkah), je uporabnih samo na način, za katerega so bili objavljeni. • Ne obstaja splošen sistem spletnega objavljanja, ki bi omogočal poljubno rabo podatkov.
Zakaj splet ni zadosti • Splet je predvsem mreža dokumentov, Semantic Web bo predvsem mreža podatkov. • Semantic Web bo razširitev spleta, v kateri bodo podatki dobili jasno določen pomen.
Semantic Web (SW) • SW je zamišljen kot globalna mreža podatkov, nameščenih in povezanih na način, ki omogoča • enostavno strojno procesiranje, • učinkovitejše odkrivanje, • avtomatsko tvorbo informacij, njihovo “razumevanje” in sklepanje, • integracijo podatkov in različne načine rabe z različnimi aplikacijami. • Tak splet si lahko predstavljamo kot globalno, decentralizirano inteligetno podatkovno zbirko.
Semantic Web (SW) • Namen SW je opisati podatke tako, da bodo globalno razumljivi za poljubne aplikacije in za ljudi. • Če je informacija namenjena strojni rabi, ni nujno, da je nerazumljiva človeku, in obratno. • Slovnico za opisovanje podatkov, razvito v ta namen, ureja Resource Description Framework (RDF).
Semantic Web (SW) • Ko je podatek opisan z RDF, so avtomatski postopki z njim mogoči. • RDF je generični format, ki ne predvideva vnaprej nobenega načina rabe. • Da je podatek mogoče opisati z RDF, mora biti identificiran – imeti mora svoj URI. • RDF temelji na XML. XML predstavlja standardizirano sintakso, s katero je mogoče zapisati podatke. • RDF in z njim povezani jeziki podatkom podelijo pomen, iz podatkov sestavijo dejstva in dejstva sestavijo v znanje.
Abstraktno o RDF • RDF je poudarjeno splošen (generičen) format, kar pomeni, da je uporaben za abstrakten način opisovanja česarkoli. • Z RDF sestavljamo izjave o virih. • Vir je karkoli, kar ima URI. • Najbolj znan URI je URL (vendar to načeloma ne pomeni, da mora biti vsak vir, opisan z RDF, dostopen na spletu). • RDF je standarden način izjavljanja o URI, zapisan v XML.
Semantic Web (SW) • SW je utemeljil Tim Berners-Lee, avtor spleta. • Razvoj poteka pod okriljem W3C. • Pri razvoju sodeluje veliko število raziskovalcev in partnerjev iz informacijske industrije.
Možen scenarij rabe SW • Naletiš na omrežju na najavo zanimivega kongresa. Sprožiš postopek prijave (vsi podatki so, jasno, opisani z RDF): • tvoj osebni programski organizator* preveri razpoložljivost v osebnem koledarju, • če je ok, s strani z najavo kongresa izlušči naslov za prijavo, sproži prijavo, • vnese datume v osebni koledar, • po potrebi sproži dialog, da si razjasni vir denarja za kotizacijo, • v sodelovanju z osebnim finančnim agentom* nakaže denar, * program
Možen scenarij rabe SW • osebni programski organizator* redno spremlja novosti na kongresni spletni strani, • ko se pojavijo informacije o sekcijah in referatih (v sodelovanju z osebnim vsebinskim agentom*) sestavi predlog dnevnega reda obiskov referatov, • v sodelovanju s programskimi agenti* transportnih agencij sestavi predlog potovanja, • če ga potrdiš, izvede rezervacije ali plačila, in * program
Možen scenarij rabe SW • na spletu poišče zgodovinske, kulturne, kulinarične... informacije o kraju kongresa in izdela povzetek. • Vse to je možno, če so podatki ali storitve aplikacij, ki so sicer (razen finančnih) vse že zdaj javno dostopne na spletu, opisane na standarden način, ki omogoča izmenjavo med aplikacijami. • Zaenkrat seveda nič od tega ne moremo narediti drugače kot ročno.
Kaj lahko trenutno storimo brez SW • Denimo, da želimo omogočiti izmenjavo podatkov med aplikacijama a in b. • a uporabi Extensible Markup Language (XML) za opis podatkov. • Programer, ki piše programe za transformacijo podatkov med formatoma aplikacij a in b, mora razumeti XML in ne njunih “zasebnih” formatov. • Aplikaciji sta tako povezani z orodji XML, predvsem transformacijskim jezikom XSLT. Tako se podatek iz aplikacije a avtomatsko preoblikuje v format b, če ga gledamo skozi aplikacijo b. • Vendar problem komunikacije ostaja: • za vsak par aplikacij, celo za vsak način rabe podatkov v paru je treba narediti transformacijski program.
Kaj lahko trenutno storimo brez SW • Problem avtomatskega prenosa podatkov med podatkovnimi zbirkami: • Prenos podatkov ovirajo različne strukture (podatkovne sheme) zbirk. • XML Schema omogoča izdelavo standardne podatkovne sheme za zbirke. • Če bi srenja sprejela tako standardno shemo, bi to omogočalo prenašanje podatkov. • Nobena srenja ni sposobna brez izjem sprejeti ene standardne sheme.
RDF • Potrebujemo torej mehanizem, ki bo omogočal prenašanje podatkov med različnimi podatkovnimi shemami. • Tak mehanizem mora opisovati značilnosti virov podatkov in podatkov v njih. • Spet: tak mehanizem je Resource Description Framework (RDF).
RDF • Podoben problem, kot s prenosljivostjo podatkov, je na spletu tudi s programi. • Spletni programski jeziki so zelo primerni za vključevanje programov v dokumente, nič pa to ne pripomore k sodelovanju spletnih programov. • Razvijajo se novi protokoli in jeziki (v skladu z RDF), ki bodo standardizirali opisovanje, kaj počnejo programi.
RDF • Potrebujemo torej jezike in protokole, s katerimi bomo lahko opisali • inpute, outpute programov, • kaj programi počnejo s podatki, • same podatke in • odnose (hierarhične in drugačne) med podatki. • Taka jezika sta tudi RDF-Schema in OWL (Web Ontology Language), jezik s katerim gradimo ontologije (npr. tezavre). • Tak protokol, zapisan z XML, je Simple Object Access Protocol (SOAP).
Načini izjavljanja v RDF • Izjave v RDF so v osnovi trojke subjekt, lastnost, objekt. • Primer trojke: Janez Novak avtorhttp://www.enstreznik.org/besedilo.htmlsubjekt lastnost objekt • Vrstni red elementov je lahko drugačen (npr. objekt lastnost subjekt) • Elementi trojk so izraženi z URI (Uniform Resource Identifiers). • URI je identifikacija vira, ki opisuje subjekt, lastnost ali objekt. • URI vira imenujemo “URIref” – referenca v obliki URI. • Različne možne vrednosti subjektov, lastnosti ali objektov, na katere kaže en URIref imenujemo slovar (vocabulary) teh vrednosti. • URIref, ki predstavlja posamezen slovar, imenujemo “imenski prostor”.
Načini izjavljanja v RDF • Slovar referatov v letniku:http://www.mf.uni-lj.si/~jure/referati08/referat1.htmlhttp://www.mf.uni-lj.si/~jure/referati08/referat2.htmlhttp://www.mf.uni-lj.si/~jure/referati08/referat3.htmlimenski prostor = ref: • Slovar študentov v letniku:http://www.mf.uni-lj.si/~jure/studenti08/student1.htmlhttp://www.mf.uni-lj.si/~jure/studenti08/student2.htmlhttp://www.mf.uni-lj.si/~jure/studenti08/student3.htmlimenski prostor = stud: • Slovar elementov Dublin Core:http://purl.org/dc/elements/1.1/imenski prostor = dc: • Izjave:stud:student1.htmldc:creatorref:referat1.html stud:student2.html dc:creator ref:referat2.html
Načini izjavljanja v RDF • Tudi RDF ima svoj slovar in imenski prostor rdf:. • Slovar RDF vsebuje izraze, namenjene delovanju RDF. • Gre večinoma za izraze, ki uvajajo neke splošne odnose. • Tak izraz je “about”, ki uvaja URIref subjekta.
RDF/XML V resnični rabi se izjave RDF zapisujejo v XML: <?xml version=“1.0”?> <rdf:RDF xmlns:rdf=“http://www.w3c.org/1999/02/22-rdf-syntax-ns#” xmlns:stud=“http://www.mf.uni-lj.si/~jure/studenti08/” xmlns:dc=“http://purl.org/dc/elements/1.1/”> <rdf:Description rdf:about=“http://www.mf.uni-lj.si/~jure/referati08/referat1.html”> <dc:creator stud:ime=“http://www.mf.uni-lj.si/~jure/studenti08/student1.html”/> <dc:date>2008/03/15</dc:date> </rdf:Description> </rdf:RDF> uvajanje imenskih prostorov student1 je 15. 3. 2008 izdelal referat1
Možen scenarij rabe SW • Želiš, da tvoj spletni robot najde identifikacije (URIje) vseh ljudi, ki predavajo na Odd. za gojenje zajcev Filozofske fakultete. • Robot ima na voljo informacije, opisane v trojki RDF, npr: <http://www.ff.uni-lj.si/predav/JakaKunc.html><http://www.ff.uni-lj.si/nac_sodel/predavanje.html> <http://www.ff.uni-lj.si/Odd_goj_zajcev.html> • Izjava lahko pomeni da nekdo, predstavljen z JakaKunc.html sodeluje z entiteto, predstavljeno v Odd_goj_zajcev.html na način, predstavljen v predavanje.html.
Možen scenarij rabe SW • Izjava v RDF, predstavljena z XML, bi izgledala približno takole: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:nacin="http://www.ff.uni-lj.si/nac_sodel/"> <rdf:Description rdf:about="http://www.ff.uni-lj.si/predav/JakaKunc.html"><nacin:predava rdf:place="http://www.ff.uni-lj.si/Odd_goj_zajcev.html"/></rdf:Description> </rdf:RDF>
Možen scenarij rabe SW • Novi jeziki za sestavljanje ontologij opisujejo medsebojne odnose podatkov. • Znanju o predavateljih bi v enem od takih jezikov lahko dodali @prefix vloga: <http://www.ff.uni-lj.si/sodelavci/>@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> # komentar: profesor in docent sta tipa predavatelja:vloga:profesor rdfs:subClassOf vloga:predavatelj vloga:docent rdfs:subClassOf vloga:predavatelj • profesorindocentsta izraza v ontologiji.
Možen scenarij rabe SW • Nekdo drug iz nekega drugega razloga v svojem imenskem prostoru (imprx) definira pojem ima_predavatelja: @prefix imprx: <http://www.moj_streznik/oddelki/>rdf:place=<http://www.ff.uni-lj.si/Odd_goj_zajcev.html> imprx:ima_predavatelja rdf:about=<http://www.ff.uni-lj.si/predav/MihaKrt.html> • ima_predavatelja je izraz v ontologiji.
Možen scenarij rabe SW • Da bi izkoristili take informacije dodatno definiramo imprx:ima_predavatelja rdfs:inverse_of nacin:predava • kar pomeni, • ima_predavateljaje nasprotno od predava in • v izjavah, ki uporabljajo imprx:ima_predavateljalahko enostavno zamenjamo subjekt in objekt in dobimo nova dejstva, kakršna potrebujemo. • ima_predavatelja in predavasta izraza v ontologiji.
Možen scenarij rabe SW • Zdaj lahko iz različnih spletnih virov podatkov avtomatsko skonstruiramo znanje, ki pravi: • Jaka Kunc in Miha Krt predavata na Odd. za gojenje zajcev in • tam predavajo tudi vsi, ki so tam definirani kot profesorji ali docenti. • Na osnovi dejstev b) lahko verjetno iz kakšne druge zbirke, objavljene na spletu v zapisu RDF, pridobimo še dodatne informacije.
Primer opisa spletišča D-Lib z RDF in DC <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://www.dlib.org"> <dc:title>D-Lib Program - Research in Digital Libraries</dc:title> <dc:description>The D-Lib program supports the community of people with research interests in digital libraries and electronic publishing. </dc:description> <dc:publisher>Corporation For National Research Initiatives </dc:publisher> <dc:date>1995-01-07</dc:date> <dc:subject> <rdf:Bag> <rdf:li>Research; statistical methods</rdf:li> <rdf:li>Education, research, related topics</rdf:li> <rdf:li>Library use Studies</rdf:li> </rdf:Bag> </dc:subject> <dc:type>World Wide Web Home Page</dc:type> <dc:format>text/html</dc:format> <dc:language>en</dc:language> </rdf:Description> </rdf:RDF>