170 likes | 284 Views
Semantisk web og ontologier – et forsøk på oppklaring? Bibliotekmøtet 2010, Hamar. Lisbeth Eriksen, Universitetsbiblioteket for miljø- og biovitenskap, Ås. Min presentasjon. Semantisk web – hva og hvorfor? Teknisk infrastruktur for semantisk web og ontologier Ontologier – hva og hvorfor?
E N D
Semantisk web og ontologier – et forsøk på oppklaring?Bibliotekmøtet 2010, Hamar Lisbeth Eriksen, Universitetsbiblioteket for miljø- og biovitenskap, Ås
Min presentasjon • Semantisk web – hva og hvorfor? • Teknisk infrastruktur for semantisk web og ontologier • Ontologier – hva og hvorfor? • Fasettert klassifikasjon og ontologier – to sider av samme sak? • Semantisk web og digitale bibliotekfunksjoner – likheter? • Hva bør skjer videre innenfor det norske bibliotekfagligemiljøet? DETTE ER TITTELEN PÅ PRESENTASJONEN
Hva betyr semantisk web og hvorfor semantisk web, og ikke bare den ”vanlige” web’en? • Semantikk er den grenen av lingvistikken (språkvitenskapen) som studerer ordenes betydning, både enkeltvis og i sammenstilte strukturer • Semantisk web har hentet sin betydning fra språkvitenskapen • Semantisk web skal gi mer mening og struktur til ”dagens” web – smartere web • Tim Berners-Lees visjon for www er utvidelse av web’en hvor: ”information is given well-defined meaning, better enabling computers and people to work in cooperation” • Dagens web publiserer informasjon, mens semantisk web publiserer data DETTE ER TITTELEN PÅ PRESENTASJONEN
Hva betyr semantisk web… (forts.) • Semantisk web gir mening til informasjon ved at data kan deles og prosesseres av maskiner – maskin til maskin kommunikasjon, men også bedre menneske-maskin samhandling • Semantisk web krever at informasjons bærende enheter på web er tagget med semantisk metadata på en standardisert måte • Standardiseringen gjør det mulig å utveksle, bruke og gjenbruke data og informasjon på web • De viktigste fundamentene for semantisk web er utvikling, registrering og deling av metadata skjemaer og ontologier og teknisk infrastruktur • Den teknologiske infrastrukturen er ikke nok, men vi må forstå den for å kunne utnytte den DETTE ER TITTELEN PÅ PRESENTASJONEN
Teknisk infrastruktur for semantisk web: RDF (Resource Description Framework) • RDF er en datamodell (metadata standard) som definerer resurser (objekter) og relasjonene mellom dem • RDF gjør det mulig for applikasjoner å utveksle data mellom servere verden over • RDF støtter opp om semantisk web mål om deling av ressurser mellom applikasjoner og maskiner • Eksempel på en RDF beskrivelse (datamodell) hvor geonames er et navnerom (namespace) og locatedIn er relasjonen mellom ressursene • RDFS (RDF Skjema)et vokabular som beskriver egenskaper og klasser (ontologier) for RDF resurser DETTE ER TITTELEN PÅ PRESENTASJONEN locatedIn geonames:Oslo : geonames:Norway
Teknisk infrastruktur for semantisk web (forts.): OWL (Web Ontology Language) • OWL er et ontologi språk (dataspråk) for beskrivelse av ontologier • OWL kan definere begreper eller klasser, relasjoner mellom dem og egenskaper i ontologier • OWL har tre forskjellige formater: OWL Lite, OWL DL and OWL Full • OWL Lite kan brukes når man ønsker å restrukturere tesauri og taxonomier til ontologier • Eks. AGROVOC tesaurusen er blitt restrukturert ved bruk av OWL i en mer semantisk strukturert concept server (begrepsserver) http://aims.fao.org/website/The-Concept-Server/sub DETTE ER TITTELEN PÅ PRESENTASJONEN
Ontologier – hva og hvorfor? • Er et kunnskapsorganisasjonssystem (KOS) innen et bestemt fagområde (domene) som inneholder begreper ”concepts”, definisjon av begrepene og relasjonene mellom dem • Kan også sees på som en web-basert tesaurus innenfor et bestemt fagområde med et utvidet sett av relasjoner • En ontologi er en standardisert formell eller uformell organisering av kunnskap • For bedre gjenfinning og presisjon ved søk innen et bestemt område • For å utvikle bedre brukergrensesnitt som gir mer læring for de som søker • For bedre samsøk og deling av kunnskap på web DETTE ER TITTELEN PÅ PRESENTASJONEN
Ontologier og fasettert klassifikasjon – to sider av samme sak, eller? • Ontologier bygges opp av klasser (begreper) og relasjoner mellom klassen (begrepene) for å beskrive et domene (emneområde) • Beskrivende ontologier: beskriver klasser i et domene med f.eks. is-a (er) eller part-of (del av) relasjoner DETTE ER TITTELEN PÅ PRESENTASJONEN
Ontologier og fasettert klassifikasjon… (forts.) • Klassifiserende ontologier: kategoriserer begrepene som i fasettert klassifikasjon • Klassifiserende ontologier preger: Bibl. klassifikasjon, thesuri, web-directories og database skjemaer DETTE ER TITTELEN PÅ PRESENTASJONEN
Fasettert klassifikasjon og fundamentale kategorier • En fasett representerer en lik gruppe av begreper • Kan organiseres som et sett av uavhengige domener eller moduler og på forskjellige måter • Er gjestfrie og fleksible ved at nye termer lett kan inkluderes og fasetter kan gjenbrukes i andre sammenheng • Kan vise et emne i komplekse sammenheng og fra forskjellige synsvinkler • Kan brukes ved automatisk indeksering av dokumenter • Fundamentale kategorier : Ranganathan 5 kategorier: PMEST (Personality, Matter, Energy, Space and Time) og Bhattachary (?) 4 kategorier : DEPA (Domain, Entity, Property, Action [+ Modifiers]) DETTE ER TITTELEN PÅ PRESENTASJONEN
Hvordan bygge opp en fasettert klass./ontologi innenfor et bestemt område? • Analysere et emneområde (domene) i samarbeid med emneeksperter – ide planet • Definere begrepene som skal inngå • Innsamling av termer manuelt fra fagfolk eller andre manuelle eller nettbaserte kilder (tesauri, taxonomier, ordbøker etc.) • Sjekke om det allerede finnes ontologier som kan inkluderes • Organisere termene i hierarkier eller etter relasjoner • DEPA strukturen: Domain (D): for eksempel landbruk, Entity (E): korn, Property (P): for eksempel kvalitet, Action (A): for eksempel høsting DETTE ER TITTELEN PÅ PRESENTASJONEN
Semantisk web (sw) og bibliotek funksjoner – likheter i utvikling? • Samlingsutvikling = utvalg av ressurser for semantisk web og deling av ressurser • Katalogisering = Semantisk Web ”semantisk” representasjon (RDA den nye katalogiseringsstandarden) • Referansetjenester/søk = Semantisk web søke tjenester • Bibliotek og sw har lik målsetting som går på servise, tilgang til informasjon og bedre gjenfinning • Bibliotek og sw har utviklet seg på grunnlag av internasjonale og nasjonale standarder • Bibliotekene sitter på store ”lukkede” datamengder som ikke er tilrettelagt for gjenbruk i andre sammenheng og her kan sw bidra for bedre deling av ressurser DETTE ER TITTELEN PÅ PRESENTASJONEN
Det norske bibliotekmiljøet og utfordringen med semantisk web – hvem, hva og hvor? • ”Web community are not fully aware of the skills, talent and knowledge that librarians have, and which can help advance the Semantic Web” skriver Prof. Jane Greenberg ved Univ. of North Carolina, Metadata Research Centre i art. i Cat. & Class. Quarterly fra 2007 • Bibliotekmiljøet kan katalogisering, klassifikasjon, emneindeksering, tesauri, metadata m.m, men vi må bevise det for IKT og web-miljøet!! • Hvem bør ta ansvaret for utviklingen av en web-tjeneste med informasjon om ontologier, metadata og semantisk web i Norge? • Viktig at bibliotekmiljøene samler og registrerer norske KOS’er på web – kan bli en del av e-forskning og e-undervisning DETTE ER TITTELEN PÅ PRESENTASJONEN
Det norske bibliotekmiljøet og utfordringen med semantisk web…(forts.) • Hvem skal være pådriver? NKKI, Nasjonalbiblioteket, BIBSYS eller andre i samarbeid med bibliotekmiljøene/fagmiljøene • Gledelig! Tema om biblioteker og semantisk web på IFLA konf. i Gøteborg i august • FAOs (FNs mat- og landbruks org) har utiklet en web-tjeneste med oversikt og tilgang til KOS’er innen mat, landbruk, livsvitenskap m.m. http://aims.fao.org/website/Knowledge-Organization-Systems-%28KOS%29/sub • Den tekniske infrastrukturen ligger der, men innholdet som skal skapes må vi bibliotekarer bidra med • Takk for oppmerksomheten! DETTE ER TITTELEN PÅ PRESENTASJONEN
Referanseliste • Ontology Development 101: A guide to creating your first ontology http://protege.stanford.edu/publications/ontology_development/ontology101-noy-mcguinness.html • Alligning Controlled Vocabularies using Faceted based approach ftp://ftp.fao.org/docrep/fao/012/ak911e/ak911e00.pdf • Knitting the Semantic Web i Cataloging & Classification Quart., nr. 3/4, vol. 43, 2007 (flere artikler) http://www.catalogingandclassificationquarterly.com/ccq43nr3-4.html DETTE ER TITTELEN PÅ PRESENTASJONEN