320 likes | 486 Views
Emnekart som portalløsning. Den nye generasjonen av nettsteder. Steve Pepper, daglig leder, Ontopia leder SC34/WG3, redaktør XML Topic Maps <pepper@ontopia.net>. Hvem er jeg?. Steve Pepper Leder av Norges delegasjon til ISO SC34 Formann i SC34/WG3
E N D
Emnekart som portalløsning Den nye generasjonen av nettsteder Steve Pepper, daglig leder, Ontopia leder SC34/WG3, redaktør XML Topic Maps <pepper@ontopia.net>
Hvem er jeg? • Steve Pepper • Leder av Norges delegasjon til ISO SC34 • Formann i SC34/WG3 • Redaktør av XML Topic Maps 1.0 spesifikasjonen (XTM) • Ontopias gründer og adm.dir. • Ontopia • En av verdens fremste emnekartbedrifter • Norsk bedrift med hovedkontor i Oslo • Konsulenter med flere års erfaring innen emnekart • Leverandør av emnekart-programvare • direkte til sluttbrukere • via partnere
Emnekart – korte karakteristikker • En ny måte å organisere, gjenfinne og navigere informasjonsressurser • En kunnskapsteknologi som er optimalisert til bruk i informasjonshåndtering • En metode for samlokalisering av all viten om et gitt tema • En teknologi som understøtter emneportaler og tema-basert organiseringav kunnskap • Emnekart er allerede i bruk i forbindelse med: • forskning.no, forbrukerportalen, itu.no, LivsIT-prosjektet, m.m. • Emnekart er foreslått som grunnlag for: • Nasjonal kunnskapsbase, Kulturnett Norge, m.m.
Emnekart som internasjonal standard • Internasjonal standard • ISO/IEC 13250:2000 Topic Maps • Modell og syntax som er basert på SGML • Røttene går tilbake til tidlig på 90-tallet • Davenport Group CAPH ISO • Med andre ord: En moden standard • Web standard • XML Topic Maps 1.0 • XML-versjon til bruk på Web • Godkjent av ISO, oktober 2001 • ISO/IEC 13250:2002 Topic Maps
Emnekart og stikkordregistre • Et emnekart kan betraktes som en slags stikkordregister • Bortsett fra at det er mye kraftigere • Stikkordregistre brukes til å gjøre det enklere å finne informasjon • Med emnekart blir informasjon enklere å • gjenfinne, • gjenbruke, og • koble sammen med annen informasjon • Bl.a. derfor egner emnekart seg for portaler…
Topics, Associations, Occurrences Subject Identity Scope = Emner, Assosiasjoner, Forekomster = Temaidentitet = Perspektiv The TAO of Topic Maps Topics, Associations, Occurrences Subject Identity Scope
(register) kunnskapslaget informasjonslaget (innhold) De to lagene • Grunnidéene bygger på stikkordregistre • Disse grunnidéene er blitt utvidet og generalisert til bruk med digitalt innhold • Tenk dere to lag: • Informasjonslaget • et sett av informasjonsressurser (nederst), og • Kunnskapslaget • en “kunnskapsvev” (øverst) • Dette tilsvarer hvordan en bok består av innhold og register
informasjonslaget (1) Informasjonslaget • Det nederste laget består av innhold • vanligvis digitalt, men trenger ikke være det • kan være i et hvilket som helst format: Word, HTML, XML, PDF • kan være tekst, grafikk, video, lyd, osv. • Dere er alle produsenter; tenk på deres eget innhold • Dette tilsvarer innholdet i boka
(2) Kunnskapslaget • Det øvre laget består av emner og assosiasjoner • Emner representerer de ulike temaer som informasjonen omhandler • Tilsvarer listen over emner i et stikkordregister • Gruppert i klasser (“emnetyper”) • Assosiasjoner representerer koblinger mellom temaer • Tilsvarer “se også” referanser i et register • Gruppert i klassert (“assosiasjonstyper”) komponerte komponerte Tosca Puccini MadameButterfly født i Lucca kunnskapslaget
kunnskapslaget informasjonslaget Forekomster kobler sammen lagene • Disse to lagene er koblet sammen • Forekomster peker til informasjon som er relevant for et gitt emne • Referansene tilsvarer sidetallene i et stikkordregister • Gruppert i klasser (“forekomsttyper”) komponerte komponerte Tosca Puccini MadameButterfly født i Lucca
En informasjonsmengde • kan være hva som helst Et kunnskapslag composition composition • Emner (Topics) • dekker informasjonens emneområde Tosca • Assosiasjoner (Associations) • uttrykker koblinger mellom emner Puccini MadameButterfly birth • Forekomster (Occurrences) • pekere til informasjon som er relevant for emnet Lucca knowledge layer information layer Kort oppsummering • Nota Bene: • Emnekartet ligger i et eget lag som er utenfor informasjonsressursene = The TAO of Topic Maps
The Omnigator Instant Topic Map Portals! A free topic map browser and debugger Online demo:http://www.ontopia.net/omnigator Download:http://www.ontopia.net/download/freedownload.html
Omnigator: En browser for emnekart • Altetende! • Enhver syntaks: XTM, HyTM, LTM • Enhver ontologi • Ethvert emnekart (inkludert dine) • Gratis! • Kan prøves ut online: • http://www.ontopia.net/omnigator • Eller lastes ned fra: • http://www.ontopia.net/ • Test ut ditt eget emnekart: • Legg det i Omnigator-folderen, og emnekartportalen er klar! • Men husk at Omnigator er kun til prototyper … • En virkelig emnekartportal krever et skreddersydd grensesnitt
emne-kart Hvordan Omnigator virker http Omnigator Ontopiasemnekartmotorog Navigator webtjenerf.eks. Tomcat <HTML>sider klient server
(multiple) types current topic (multiple) names multipleoccurrences multipleassociations http://www.ontopia.net/omnigator
Oppsummering så langt • Noe er nytt og noe er gammelt • Etablerte, velprøvde og fungerende idéer er tatt fra ulike felt: • stikkordregister, glossar, tesaurus • bibliografiske prinsipper (f.eks. samlokalisering) • til og med formell logikk og kunstig intelligence • Disse er smidd sammen til en helhetlig modell • Denne modellen har en formell beskrivelse • Den har en utvekslingssyntaks • Og det er en internasjonal standard • standardprogramvare • utveksling mellom systemer • sammenknytting av systemer • Men dette er bare begynnelsen…
Andre vesentlige egenskaper • Emnekart har mange andre egenskaper • Vi kan ikke gå inn på alle nå • Vi nøyer oss med tre av dem • Automatisert sammenfletting • Emnekart kan kobles sammen automatisk • Det som gjør dette mulig er temaidentitet (“subject identity”) • Innebygget støtte for kontekstavhengighet • Kunnskap er ikke absolutt. Den har også et subjektivt element • Emnekart bruker perspektiv (“scope”) til å håndterer dette • Kraftige søkegrensesnitt • Den formelle strukturen egner seg for formelle spørrespråk • Topic Maps Query Language (TMQL)
Hva perspektiv brukes til • Ulike verdensanskuelser • Virkelighetens verden er tvetydig; kunnskap har en subjektiv dimensjon • Med perspektiv er det mulig å uttrykke flere motstridende syn på samme tid • Kontekstavhengig viten • Kunnskap kan være gyldig kun i en bestemt kontekst, og ikke ellers • Perspektiv gjør det mulig å uttrykke kontekstavhengig gyldighet • Skreddersøm av informasjon og kunnskap • Ulike brukere har ulike behov for kunnskap • Med perspektiv kan man ta hensyn til alder, utdannelsesnivå, språk,teknisk ferdighet, sikkerhetsklarering, osv. og gi skreddersy informasjonenetter konsumentens behov
Hva sammenfletting brukes til • Integrering av informasjon, integrering av portaler • Informasjon som ligger i ulike systemer kan knyttes sammen slik at brukeren får enhetlig tilgang til alt – uavhengig av hvor eller hvordan det er lagret • Kunnskapsdeling på tvers av organisasjoner • Kunnskap som blir registrert i én del av organisasjonen kan gjøres tilgjengelig for hele organisasjonen • Distribuert kunnskapsforvaltning • Kunnskapsforvaltning må ikke lenger sentraliseres for at kunnskapskal kunne deles • Kunnskapsdeling mellom organisasjoner • Informasjon og kunnskap kan deles mellom organisasjoner
Emnekart som portalløsning Fordeler Forutsetninger Føringer
Noen interessante egenskaper ved emnekart • En formell modell for kunnskap • Gjør det mulig å modellere selve kunnskapsdomenet (temaområdet). • Emnekartet blir en kunnskapsbase i seg selv. • Modellen er svært fleksibel • Mulig å begynne i det små og vokse etter behov. • Det finnes en XML-basert utvekslingssyntaks • Emnekartet kan brukes av flere applikasjoner. • Emnekart er en internasjonal standard • Leverandøruavhengighet. Flere verktøy å velge mellom. • Støtter automatisert sammenfletting • Portaler kan enkelt knyttes sammen med hverandre. • Innebygde mekanismer for kontekstavhengighet • Personalisering av innhold etter brukerens behov.
Emnekartportalens fordeler • Gir en meget god struktur til hele nettstedet • Lettere å navigere (gjenspeiler hvordan folk tenker – assosiativt) • Gjør det enklere å finne informasjon (samlokaliseringsprinsippet) • Bygger på en formell beskrivelse som muliggjør validering og bedre konsistens • Medfører enklere vedlikehold • Lettere å oppdatere innholdet (når emnekartet oppdateres blir portalen oppdatert) • Ontologien kan utvides etter behov (man bare legger til nye typer) • Lenkene er lettere å håndtere (finnes i et eget lag, utenfor dokumentene)
Flere fordeler ved emnekartportaler • Tillater bruk av standardverktøy og -komponenter • Raskere og billigere å utvikle et nytt nettsted • Samme teknologikomponenter kan brukes til flere nettsteder • En fordel for både kunde og leverandør • Innholdet er ikke knyttet til ett bestemt “publiseringsverktøy” • Enklere å bytte til et nytt verktøy eller en ny leverandør • Tilbyr ny funksjonalitet • Innhold kan gjenbrukes (samme datagrunnlag til flere nettsteder) • Sammenkobling av portaler • Potensiale for web services, agent-baserte applikasjoner • Mulig å kombinere strukturerte søk, fulltekstsøk og brukernavigasjon
Generelle regler for emnekartportaler • Du må ha emnekartverktøy • Uten programvare som “forstår” emnekart blir mye av poenget borte • Det finnes mye å velge mellom, i alle prisklasser • Valget avhenger av behov og prosjektrammer • Datagrunnlaget er helt avgjørende • Hvor kommer det fra? Mennesker eller maskiner? • Strukturen på dataene styrer hva du kan gjøre • Du må ha en ontologi! • Styrer hele strukturen, og derfor helt avgjørende • Ikke så avskrekkende som det høres ut – kan gjøres enkelt • En slags kombinert taksonomi og tesaurus
superclass-subclass superclass subclass place person synopsis map bio guidelines opera city composer born-in composed-by Puccini Lucca Tosca Topic Map Hva er egentlig ontologien? • Ontologien er en del av emnekartet • Den forteller hva slags type ting man har • Puccini er et emne av type komponist • Lucca er et emne av type by • komponist og by er emner som også er tilstede i emnekartet • Assosiasjonen mellom Puccini og Luccaer av type født-i, der Puccini spiller rollen person og Lucca spiller rollen sted • født-i, person og sted er også emner i det samme emnekartet • Lucca har en forekomst av type kart og Puccini har en forekomst av type biografi • kart and biografi er også emner • Osv.
emne-kart Grunnleggende arkitektur for en emnekartportal Vedlikehold av en emnekartportal emne-kart-appli-kasjon data og dokumenter klient brukere server
emne-kart Vedlikehold av en emnekartportal emne-kart-appli-kasjon “redaktør” emne-kart-appli-kasjon data og dokumenter klient brukere server
Teknologiføringer ved bruk av emnekart • Å basere nettsted på emnekart legger ingen teknologiske føringer • Nettstedets design er helt upåvirket av valget av emnekart • Navigeringsapplikasjonen kontrollerer dette selv • Bruk av HTML / XHTML / XML / WML blir mye mer fleksibel • Emnekartet blir det samme; applikasjonen velger utformat • Det samme gjelder hvordan dataene lagres • De kan ligge hvor som helst, og henvises til fra emnekartet • De kan også være i et hvilket som helst format • Emnekartet kan lagres som XML, i en database, eller på annen måte • Valg av verktøy, derimot, kan legge føringer • Omnigator produserer HTML med CSS, f.eks • OKS lagrer emnekartet som XML eller i en RDBMS, f.eks • ZTM forutsetter bruk av Python og Zope, f.eks. • osv.
integrates orders contains requires contains owns integrates ProductY CustomerA ProductZ Order1 orders contains ProductX SkillQ CustomerB Order2 Customerdatabase Orderdatabase Productdatabase Skillsdatabase Customerdatabase Sammenkobling av informasjon • Emnekart kan brukes til å koble sammen informasjon fra ulike kilder • Slik kan man samle informasjon fra ulike deler av en organisasjon til en kunnskapsbase • Automatisk fletting er det som gjør dette mulig • Denne kunnskapsbasen kan så drive ulike nettsteder • intranett • ekstranett for ulikebrukergrupper • Osv • I tillegg kan portalerkobles sammen …
“virkelighet” emnekart født i Nora Krogstad Helmer skrev skrev Et dukkehjem Et dukkehjem A doll’s house Fru Linde Dr. Rank Henrik Ibsen Hedda Gabler Skien kunnskap informasjon CapLex Ibsen-senter SNL SNL Ibsen-senter NBL SNL Ibsen-senter SNL CapLex Ibsen-senter Ibsen-senter Ibsen-senter Skienkom-mune Det uunngåelige Ibsen-eksempelet
Typiske prosjektdeler • Analyse av behov, skriving av spesifikasjon • Utvikling av ontologi • Konvertering / oppbygning av datagrunnlag • Emnekartet kan ofte genereres automatisk fra eksisterende data • Utvikling av nettsted • Sider beregnet på brukerne • Vedlikeholdsgrensesnitt • Administrasjonsgrensesnitt • Andre deler kan også inngå • Prototyping • Brukertesting av grensesnitt • osv. • Med andre ord: • Ikke ulik “konvensjonelle” portalprosjekter
Enn om man ikke bruker emnekart? • Ingen kontroll over strukturen • Over tid blir det stadig mer vanskelig for brukere å finne frem • Løsningen vil bli proprietær • Vanskelig å komme seg fri fra leverandøren • Ny funksjonalitet vanskelig å tilby • Vanskelig å gjenbruke innholdet • Ingen sammenkobling av portaler • Web services, agent-baserte applikasjoner krever mer arbeid • Strukturerte søk umulig • Ikke noe billigere på kort sikt; vesentlig dyrere på lengre sikt • Valget gir seg selv!