160 likes | 290 Views
Fra Internet til semantisk web via taksonomier. AF: Hosein Askari ITST. Internet. WWW blev opfundet af Tim Berners Lee i begyndelsen af 1990’erne i CERN TCP/IP sikrer transport af bits gennem netværket HTTP og HTML standarder formidler og præsenterer Hyperlinket tekster
E N D
Fra Internet til semantisk web via taksonomier AF: Hosein Askari ITST
Internet • WWW blev opfundet af Tim Berners Lee i begyndelsen af 1990’erne i CERN • TCP/IP sikrer transport af bits gennem netværket • HTTP og HTML standarder formidler og præsenterer Hyperlinket tekster • Nuværende Internet opstod via accept og anvendelse af disse standarder i forskellige applikationer
Internet: medio 2002 • Over 2 mia. sider på nettet • Over 300 mio. bruger • + xxx mio. sider på intranet løsninger • Medfører => særdeles vanskeligt at: • Finde • Organisere • Vedligeholde • De information som efterspørges af brugerne
Søgemaskiner og relaterede problemer • Overflow, irrelevante information • Kan ikke uddrage information, især hvis information er spredt i forskellige kilder • Søgeresultater kan ikke bruges som input i andre automatiseret processer (no trust) • Andre type af asset end tekster !! • ….
Semantiske web • Ide ejeren: Tim Berners Lee • Idé : At bygge et maskinforståelig semantisk lag oven på det eksisterende Internet. • Hvordan: Metadata, Ontologier, formel logik (logiske sprog)
Metadata (i web baseret miljø) • Primære funktion: Understøtter søgning og genfinding af dokumenter. • Kan også anvendes for: • Adgangsstyring • Styring af arbejdsgang • Versionsstyring • Styring af relationer til andre ressourcer
Ontologi • For at kunne dele viden mellem forskellige applikationer kræves en fælles mængde af begreber med fælles og entydigt forståelse for begreberne. • En ontologi er en mængde af udtryk og relationer således at en domæne kan modelleres. • Simple ontologier kan modelleres i RDF skema (RDFS) og præsenteres i RDF
Ontologi (typer) • Domæneontologi eks. Sundhed • Metadataontologi eks. Dublin Core • Overordnede og fælles ontologi eks. Tid, afstand
Formel logik (logiske sprog) • For at kunne opnår/beregne ny viden med udgangspunkt i eksisterende viden og ontologier kræves søgemaskiner med indbygget infrence mekanisme. • Beregning af ny viden er baseret på 1. Ordens logik. Prædikat P Subj. Y Ny viden Subj. X
Standarder og teknologier • XML og XML Schema • Ingen semantik på tag niveau • Mest accepteret format for udveksling af metadata og ontologier på Internettet. • RDF og RDF schema (RDFS) • En metadatamodel for at binde en ressource til de relaterede egenskaber og egenskabsværdier. • En egenskabsværdi kan også være en ressource med egenskaber og egenskabsværdier osv. Osv …
RDF egenskabsværdi ressource egenskab hasCreator www.mysite.dk/AboutMe www.mysite.dk/.. Hosein Askari hasName hasCreator www./aboutme www.mysite.dk/.. HasEmail hsa@itst.dk
RDFS • Man kan ikke definere egenskaberne og relationerne imellem dem og andre ressourcer i RDF datamodellen ! • RDFS beskriver klasser af resourcer og typer af relationer mellem ressourcer • RDFS fortæller hvordan kan man kombinere klasser , egenskaber og egenskabsværdier
RDFS RDFS Rdfs:domain Rdfs:Range #hasCreator #website #Person rdf:Type rdf:Type hasCreator www.mysite.dk/.. www./aboutme RDF
DAML+OIL • Man kan ikke bygge andet end simple ontologier i RDFS og derfor den logiske beregning for at opnå ny viden er dermed begrænset • DAML +OIL udvider RDFS´s specifikation for klassifikation og tildeling af egenskaber til resourcer • DAML +OIL har indbygget logisk som kan anvendes for beregning af ny viden.
OWL • OWL er w3c’s måde at gøre DAML+OIL til en standard for ontologier på internet. • OWL er identisk med DAML + OIL (få undtagelser ) • OWL findes i 3 udgaver = 3 niveauer for specificering af klasser og egenskaber
”WEB of trust” (Tim Berners Lee) Logik Digital signatur Ontologier (OWL, etc.) RDF , RDFS Xml , NS , xml schema Unicode URI