200 likes | 387 Views
“Kirjastoontologia” Kirjastojen tulevaisuuspäivä, Kajaani 28.5.2009 Erkki Lounasvuori. Huom! Tämä esitys pohjautuu Kaisa Hypenin luentoon Kaunokki- ryhmän kokouksessa 15.5.2009. ONTOLOGIA MÄÄRITTELYÄ:
E N D
“Kirjastoontologia” Kirjastojen tulevaisuuspäivä, Kajaani 28.5.2009 Erkki Lounasvuori Huom! Tämä esitys pohjautuu Kaisa Hypenin luentoon Kaunokki- ryhmän kokouksessa 15.5.2009
ONTOLOGIA MÄÄRITTELYÄ: • Ontologiafilosofiassa:olevaisen perimmäistä olemusta tutkiva filosofian osa (Kielitoimiston sanakirja) • Käsite on omittu tietohallintaan ja tekoälytutkimukseen, ja sillä on useita, toisistaan poikkeavia määritelmiä • Ontologioilla keskeinen asema semanttisessa webissä • Tässä: tesauruslähtöinen, tietokoneohjelmistojen näkökulmasta kehitettyä sisällönkuvailujärjestelmää, joka • - kuvaa mikromaailman käsitteet / oliot • - järjestää käsitteiden väliset suhteet • - on formaali, eksplisiittinen ja yhdenmukainen • - on verrattavissa tesauruksiin ja indeksointiin • Eija Airio
Käsitteiden väliset suhteet kuvataan loogisella, myös tietokoneen "ymmärtämällä" tavalla. Funktio- eli assosiatiivinen suhde Hierarkkinen suhde Koostumussuhde Katri Seppälä: Käsiteanalyysi ontologiatyössä Vrt. asiasanastot, joiden avulla tuotettu tieto edellyttää ihmisen tulkintaa.
Samalla ontologiat ovat myös käsitemalleja, joissa yksilöidään tietyn aihealueen käsitteet ja niiden väliset suhteet. Katri Seppälä: Käsiteanalyysi ontologiatyössä
Semanttinen tietämyksenhallinta Kimmo Kajas: Ontologia – katteeton lupaus vai todellinen työkalu? • ontologia on ”teoria toimialueen olemuksesta” ja sen todellinen olemus on ”lähempänä tietämystä tai ymmärrystä kuin luokiteltua tietoa. Ontologia kykenee parhaimmillaan vastaamaan kysymykseen ’Miksi?’” Hotti et al.: Tietämyksenhallinta ja ontologiat sosiaalihuollon näkökulmasta • ”ontologia on keskeisessä asemassa semanttisessa tietämyksenhallinnassa, koska se kuvaa formaalisti käsiteltävää sovellusalaa. Ontologia on käsitemalli, joka esittää joukon tiettyyn aihealueeseen liittyviä käsitteitä ja niiden välisiä suhteita.” • semanttinen tietämyksenhallinta: alalla kertyneen tietämyksen kumuloiminen ja hyödyntäminen tietojärjestelmän avulla
Finnish Collaborative Holistic Ontology KOKO KOKO YSO KAUNOKKI AFO MAO VALO Kaunokin ontologisointi alkanut marraskuussa Turun kaup.kirjastossa. Tkk ohjaa ja opastaa TAO ... ...
Mikä Kaunokki? • Fiktiivisen aineiston asiasanasto, n. 5 500 termiä • Kokeilupainos v. 1996, varsinainen asiasanasto v. 2000, verkkoversio v. 2007 • Taustalla Jarmo Saartin väitös Kaunokirjallisuuden sisällönkuvailun aspektit • Kattaa kaikki kaunokirjallisuuden lajit, aikuisten ja lasten kirjallisuuden, elokuvat • Mukana jonkin verran kirjallisuudentutkimukseen liittyviä termejä • Noudatettu YSAn periaatteita ja rakennetta • Ruotsinkielinen versio Bella • Ylläpito ja kehittäminen Helsingin kaupunginkirjastossa, Kaunokki-työryhmä • http://kaunokki.kirjastot.fi
Kaunokin erityisyydestä • Kaunokirjallisuuden luonne – teos omalakisensa taideluomus, kielen eri tasot (metaforisuus, konnotaatiot, vertaukset) > monitulkintaisuus • ”[Kirjallisuuden kieli] on aina ihmisenä olemista koskevan perustiedon kieltä.” (Rikama, 2007) • Kirjallisuuden aiheena voi olla mikä vain, sen käsittelytapa yksilöllinen > haasteita sanastoille! • Kaunokirjallisuuden sisällönkuvailun luonne – ”aboutness” • Kaunokin fasetit: • Genre, laji, tyyli • Teema • Henkilö, toimija • Paikka, miljöö • Aika • Muut
Kaunokin ontologisointi • Tehdään osana Kirjasampo –projektia Turun kaupunginkirjastossa, TKK ohjaa. • Protégé-ontologisointiohjelma. • Ontologiaa varten analysoidaan asiasanojen taustalla olevien käsitteiden väliset suhteet, tarkennetaan niiden välistä hierarkiaa ja muita suhteita sekä tarkistetaan, mitkä Kaunokin käsitteistä vastaavat YSO:n käsitteitä. • Pyritään lisäämään Kaunokin sisäistä hierarkkisuutta. • Lisätään käsitteiden määritelmiä (esim. genret). • Tämän jälkeen käsitellään Kaunokin fasettirakenne ja liitetään se ontologiaan. • Tavoite: ontologisointi valmis kesään mennessä.
Kaunokin myötä KOKO:an tulee runsaasti lisää termejä luokkiin • kulttuuriset ilmiöt • kulttuuriset tuotokset • mentaaliset ilmiöt • keskinäinen toiminta • sisäiset ja ulkoiset ominaisuudet
Miksi tämä kaikki? • Kaunokki-Sahassa ollut mahdollista ottaa huomioon Kaunokin fasettiluonne • genret, teemat, aika, paikka yms. tallennetaan omaan kenttäänsä • asiasanojen ketjutus mahdollista > asioiden yhteydet esiin • Osakohteiden luettelointi tarkalla tasolla mahdollista • Kirjastoammattilaisen suosittelut, ”sukulaisteokset” • Sisällönkuvailussa käytetään ontologioita, tärkeimmät KOKO, KAUNO, SUO, Lingvoj, lisää tulossa • Ontologioiden synergiaedut, ks. esim. tyylit KOKOssa ja Kaunokissa
Kaunokirjallisuuteen liittyviä tietopalvelukysymyksiä • ”missä romaanissa on kuvaus Suurinkvisiittorista” • ”Daniil Harmsin tyyppistä satiiria” • ”runo yksinaruisesta keinusta” • ”runo, josta asiakas muistaa ainoastaan ’yksinäisyys soittaa viuluaan’” • ”romaaneja, joissa veisataan virsiä” • ”romaaneja, joissa kuvataan työntekoa positiivisessa hengessä” • ”amerikansuomalaisen kirjoittajan kirjoittama romaani, jossa käytetään hienoa amerikansuomea ja se on suht vanha, ehkä 1960-luvulta. Tekijän etunimi alkaa ehkä A-kirjaimella” • ”turkin kielestä käännetty, turkkilaista surrealismia edustava teos, lienee kirjoitettu noin kolmekymmenluvulta, ruotsinnos tai suomennos” • …
Kirjasampo.fi Teosrekisterin haku, selailu, moninäkymähaut, suosittelut ym.Personoidut toiminnotYhteisölliset toiminnotMuu tieto Lasten verkkopalvelu Sivupiiri.fi Sisältöjen vientiRSS; XML webservices, leijukkeet KDK Drupal 6 -julkaisujärjestelmä Kirjastokanava.fi Kysykirjastonhoitajalta Frank-paikannus Linkkihakemisto Tietosisältöjen tuonti haku- ja selausrajapintojen avullaSOAP wdsl Yhteistyö-kumppanit Kulttuurisampo.fi Teosrekisterin tietokantaSelailu- ja hakutekniikka Teosrekisterin sisältö näytetään myös Kulttuurisammossa Useita sovelluksia, näyttökerroksia ja rajapintoja Kifi-käyttäjähallintaLdap-autentikointi Saha Luettelointiliittymä Saha RDF-editori Tallennus RDF-muodossa Helmet-kauno-dumppi Kitka-kirjailijatiedot Kaunokki-ontologia Uutuusaineisto – BTJ Arvosteleva kirjaluettelo Roma-tietokanta
????! Kirjasto 2.0 käyttöliittymässä Drupal Kaunokirjallisuuden sisällönku- vailu & sen erityispiirteet Kirjaston perinteiset vahvuudet, intertekstuaalisuus Uudet verkkotekniikat & kirjasto- järjestelmän rajat? Kehityksen ennakointi? Pitkä häntä esiin <> yhteistyöverkosto Helmetin kauno- aineisto Uusi aineisto: tiedot BTJ:ltä Yhteistyö TKK:n kanssa. Semanttinen tallennusalusta Saha. Kauno- kirjallisuuden metadata- skeema Kirjasampo ontologiat Kaunokin ontologisointi Kaunokirjallisuuden kontekstit – Kulttuurisampo Viitetietojen rikastaminen Esim. kirjailijatieto, teosesittelyt, AKL
Kaunokirjallisuuden tietojärjestelmän laaja malli, Kirjasammon sisällöt Kaunokirjallisen teoksen kuvailu - luettelointitiedot - asiasanoitus - tiivistelmä Lukijoiden reseptiot • yksittäisen teoksen vastaanotto eri lukijoilla • teosten kritiikit, arvostelut • tieteelliset tutkimukset Tekijätiedot • henkilöhistoria • julkaisuhistoria • käsikirjoitukset Kaunokirjallinen teos -teokset digitoituina - intertekstuaaliset viittaukset Kulttuurihistoriallinen konteksti • kaunokirjallisuuden historia • kulttuurihistoria • reseption historia Jarmo Saarti: Kaunokirjallisuuden sisällönkuvailun aspektit, 1999, 179.
Toteutusaikataulu • Esiselvitys 2007 – 2008 • Sisällöt, toiminnot, toimintaedellytykset • Tekniset ratkaisut • Ideointiryhmä, yhteistyöverkosto • Toteutusvaihe 2008 – 2010 • Teosrekisteri • Haku- ja käyttöliittymä • Sisällönkuvailijoiden verkosto • Osaksi yleisten kirjastojen tietoteknistä infrastruktuuria • Julkistaminen syksyllä 2009? www.kirjasampo.fi • Mukana kirjastopäivillä 10.-12.6. • Integrointi osaksi kirjastot.fi -palveluita • Ylläpito ja kehittäminen 2011 – • Palvelulla täysipäiväinen päätoimittaja • Tekninen tuki ja palvelinympäristö: www.kirjastot.fi
Kulttuurisampo ja kaunokirjallisuus • Kirjasammon kaunokirjallisuus testiaineistona Kulttuurisammossa: • mitä kirjallisuutta tiettyyn aiheeseen / paikkaan / henkilöön / kirjallisuudenlajiin liittyy, • mitkä teokset ovat "samankaltaisia" toistensa kanssa, • keiden kirjailijoiden tuotanto liittyy jollakin tavoin toisiinsa • semanttiset suosittelut, temaattiset yhteydet toimivat • tulokset rohkaisevia ja innostavia
”Content no longer king – Context is!” Lise Vandborg, Project Manager, Litteratursiden.dk