230 likes | 332 Views
S émantický web. Martin Švihla svihlm1 @fel.cvut.cz (január 2004). Obsah. Čo je sémantický web ? Motivácia pre vznik sémantického webu Používané technológie Využitie sémantického webu Súčasný stav Rozvoj – predpoklady a postupy Záver. Čo je to Sémantický web?.
E N D
Sémantický web Martin Švihla svihlm1@fel.cvut.cz (január 2004)
Obsah • Čo je sémantický web? • Motivácia pre vznik sémantického webu • Používané technológie • Využitie sémantického webu • Súčasný stav • Rozvoj – predpoklady a postupy • Záver
Čo je to Sémantický web? Sémantický web je rozšírenie súčasného webu, v ktorom sú dáta popísané tak, aby ich významu rozumeli aj počítače. To by malo umožniť lepšiu spoluprácu medzi ľuďmi a strojmi.
Motivácia Problém: docent X. sa má zúčastniť na vedeckej konferencii v Pekingu Postup riešenia: • docent X. zadá svojmu softvérovému agentovi základné údaje o konferencii • softvérový agent vyhľadá najvhodnejšie letenky • zistí z internetových stránok rozvrh konferencie • v osobnom profile docenta X. nájde jeho záujem: čínsku operu • zistí predstavenia čínskej opery v Pekingu v dňoch konferencie • všetky informácie poskytne docentovi X. • docent X. požiada svojho digitálneho asistenta o rezerváciu vybraných leteniek a lístkov do opery
Súčasný web Stav • obrovské množstvo informácií • informácie sú určené pre ľudí, ich významu stroje nerozumejú • metadáta sú obmedzené: keywords, title Dôsledky • neefektívne a nepresné vyhľadávanie • obrovské znalostné domény sú náročné na údržbu • obmedzené možnosti automatickej výmeny informácií
Vízia sémantického webu (zjednodušený pohľad) • dáta sú popísané tak, aby bol ich význam zrozumiteľný počítačom • agenti môžu týmito dátami prechádzať, vyhľadávať v nich podľa významu informácií • agenti môžu navzájom komunikovať, dokážu nájsť spoločnú reč • agent sa môže učiť rozumieť pojmom z nových znalostných domén
Štruktúra sémantického webu • syntax XML • RDF vrstva (obsahuje metadáta) • ontológie - popis pojmov a vzťahov • logické odvodzovanie (inference) na základe pravidiel • zabezpečenie vierohodnosti (trust layer)
XML syntax • pridáva (stromovú) štruktúru do dokumentov • každý môže vytvárať vlastné tagy • štruktúra XML nevypovedá o význame dát <Person Id=“xxxx”> <Name>docentX</Name> <Age> <value>66</value> <unit>year</unit> </Age> <Person> … počítač rozumie štruktúre, ale nie významu tagov
RDF metadáta • zapísané v XML • na vyjadrenie informácie používa tvrdenia (statements) vo forme tripletov (triples) • triplet má formu jednoduchej vety – podmet, prísudok, predmet docentX hasAge 66
RDF metadáta • zapísané v XML • na vyjadrenie informácie používa tvrdenia (statements) vo forme tripletov (triples) • triplet má formu jednoduchej vety – podmet, prísudok, predmet • predmet môže byť ďalším podmetom 33 docentX hasFriend hasAge hasAge 66 docentY
RDF metadáta • zapísané v XML • na vyjadrenie informácie používa tvrdenia (statements) vo forme tripletov (triples) • triplet má formu jednoduchej vety – podmet, prísudok, predmet • predmet môže byť ďalším podmetom a tak vzniká sieť informácií 33 docentX hasFriend ... hasAge hasAge ... 66 docentY
Ontológie • Ontológia poskytuje zdieľaný slovník, ktorý popisuje vybranú doménu. • Popisuje typy objektov a/alebo pojmy, ich vlastnosti a vzťahy medzi nimi. <rdfs:Class rdf:about="Person" rdfs:label="Person"> <rdfs:subClassOf rdf:resource="Human"/> </rdfs:Class> <rdf:Property rdf:about="hasSon"> <rdfs:domain rdf:resource="Person"/> <rdfs:range rdf:resource="Person"/> <rdfs:subPropertyOf rdf:resource="hasRelative"/> </rdf:Property>
Logické odvodzovanie (inference) • Súčasťou ontológie je súbor odvodzovacích pravidiel • Podľa týchto pravidiel dokáže odvodzovací mechanizmus zistiť informácie, ktoré neboli v metadátach uvedené
Logické odvodzovanie (inference) • Súčasťou ontológie je súbor odvodzovacích pravidiel • Podľa týchto pravidiel dokáže odvodzovací mechanizmus zistiť informácie, ktoré neboli v metadátach uvedené Ak docentX je inštancia triedy Person a jeho syn je PeterX... <Person> <Name>docentX</Name> <hasSon>PeterX</hasSon> <Person> ... potom odvodzovací mechanizmus dokáže zistiť, že docentX aj PeterX sú z triedy Human a žesú príbuzní(hasRelative).
Záruka pravdivosti Problém: • odvodzovanie nemusí byť spoľahlivé • v prípade pochybností by mal existovať mechanizmus overenia pravdivosti informácií Možné riešenia: • agent je schopný doložiť informáciu aj postupom jej získania (odvodenia) • digitálny podpis
Výsledok (z pohľadu strojov) Súčasný web
Výsledok (z pohľadu strojov) Súčasný web Sémantický web livesIn docentX hasWife livesIn hasProblem worksAt hasProblem (inferred)
Použitie sémantického webu • správa znalostí (knowledge management) • vyhľadávanie informácií • štrukturalizácia skladov informácií • adaptácia informačných zdrojov • Enterprise Application Integration • eCommerce (B2B) • snaha o štandardizáciu formátu zdieľaných informácií
Súčasný stav 1/2 • semantický web zatiaľ nie je masovo rozšírený • technológia je považovaná za veľmi perspektívnu • prebieha vývoj a úprava štandardov (RDF, OWL...) • do výskumu sa investuje (EU, HP, NASA, Microsoft...) • používajú sa niektoré jednoduché štandardy • RSS • DublinCore • RedHat’s Update Agent • ... nevyužívajú naplno možnosti konceptov SW
Súčasný stav 2/2 • Sú vytvorené aplikácie: • parsery a validátory RDF, čiastočne aj OWL • anotácia HTML • tvorba, ukladanie a distribúcia ontológií • RDF servery • ... • Chýbajú „killer apps“
Rozvoj - predpoklady • vyhovujúce (open source) štandardy • systémy musia byť tolerantné voči chybám (Error 404, nelogické odvodzovanie) • masové vytváranie metadát a ontológií • vytvorenie praktických aplikácií
Rozvoj - postup Smer rozvoja • Zdola nahor - vývoj štandardov, architektúry a infraštruktúry (W3C) • Zhora dolu- tvorba ontológií, metadát a aplikácií Generovanie metadát • generovanie RDF metadát popri HTML prezentáciách • poskytovanie informácií priamo vo forme RDF metadát (knižnice, elektronické obchody...)
Záver • Sémantický web nie je doposiaľ rozšírený • Koncept je považovaný za perspektívny • Štandardy sú vo fáze dokončenia • Začínajú vznikať ontológie a metadáta • Objavujú sa prvé aplikácie Najzaujímavejšie na sémantickom webe nie je to, čo si vieme predstaviť s ním robiť, ale to, čo si predstaviť nevieme. Rovnako ako sme si pred desiatimi rokmi nevedeli predstaviť možnosti súčasného webu. (Tim Berners-Lee)