350 likes | 463 Views
Sanastosta ontologiaksi. mikä muuttuu? Seinäjoen kaupunginkirjasto-maakuntakirjasto 4.11.2009 Kaisa Hypén. Ontologian määrittelyä. ontologia fil. olevaisen perimmäistä olemusta tutkiva filosofian osa (Kielitoimiston sanakirja)
E N D
Sanastosta ontologiaksi mikä muuttuu? Seinäjoen kaupunginkirjasto-maakuntakirjasto 4.11.2009 Kaisa Hypén
Ontologian määrittelyä • ontologiafil. olevaisen perimmäistä olemusta tutkiva filosofian osa (Kielitoimiston sanakirja) • käsite on omittu tietohallintaan ja tekoälytutkimukseen, ja sillä on useita, toisistaan poikkeavia määritelmiä • ontologioilla keskeinen asema semanttisessa webissä • tässä: tesauruslähtöinen, tietokoneohjelmistojen näkökulmasta kehitettyä sisällönkuvailujärjestelmää, joka • kuvaa mikromaailman käsitteet / oliot • järjestää käsitteiden väliset suhteet • on formaali, eksplisiittinen ja yhdenmukainen • on verrattavissa tesauruksiin ja indeksointiin Eija Airio
Käsitteiden väliset suhteet kuvataan loogisella, myös tietokoneen "ymmärtämällä" tavalla. Funktio- eli assosiatiivinen suhde Koostumussuhde Hierarkkinen suhde Katri Seppälä: Käsiteanalyysi ontologiatyössä
Asiasanasto / ontologia Asiasanastojen avulla tuotettu tieto edellyttää aina ihmisen tulkintaa. Asiasanasto > ontologia: • Asiasanaston termien analyysi, merkitysten ja keskinäisten • suhteiden määrittely. • Ontologian käsitteet yksilöidään urien avulla • koneluettavuus • linkitettävyys
Kaunokin ontologisointi • Osa Kirjasampo –projektia Turun kaupunginkirjastossa, TKK:n ohjaus. • Protégé-ontologisointiohjelma. • Käsiteanalyysi, käsitteiden väliset suhteet ja hierarkiat, ripustus YSO:an. • Lisätään Kaunokin sisäistä hierarkkisuutta ja käsitteiden määritelmiä (esim. genret). • Kaunokin fasetit huomioitu ontologiassa. • Kaunokki-ontologia = yhdistelmäontologia, jossa mukana Kaunokin ja YSA:n termit ontologisoituna. • Sisällöllisesti asiasanasto ja ontologia pyritään pitämään mahdollisimman identtisinä. • käytettävissä ONKI-palvelimella
Esimerkki 2: yhdistäminen YSO:an • Kirjallisuus, YSOssa eritelty käsite • Kirjallisuus taidelajina • Kirjalliset teokset • Kirjallisuus erikoisalana • Kaunokki-ontologiassa noudatetaan YSOn logiikkaa, osittain eri kuin Kaunokissa
Esimerkki 3: lisämerkityksiä YSO:ssa oleville käsitteille • Lisämerkitys mm. näille YSO:n käsitteille:
Kaunokin myötäyhdistelmäontologioihin tulee runsaasti lisää • termejä erityisesti luokkiin • kulttuuriset ilmiöt • kulttuuriset tuotokset • mentaaliset ilmiöt • keskinäinen toiminta • sisäiset ja ulkoiset ominaisuudet
Summa summarum • Pohjana sanasto, jonka termistö esitetään uudella tavalla • Uusi tapa ja menetelmä hahmottaa sanaston kokonaisuutta • Ontologiarakenne myös sanaston sisällöllisen kehittämisen työväline • Asiasanastot ja tesaurukset kortistoajan sisällönkuvailuväline, ontologiat verkkomaailman • Sanastot muodostavat hyvän lähtökohdan ontologioille, ontologiat kehittävät osaamista edelleen
Ontologiainfrastruktuuri, perusta luotu FinnONTO-hankkeessa (TKK) 2003-2007 KOKO YSO KAUNOKKI AFO MAO VALO TAO Ontologisointi tehty osana Kirjasampo-projektia. Julkistus syyskuussa 2009. ... ... Ontologiat käytettävissä ONKI-palvelimellahttp://www.yso.fi/
Miksi kirjastoissa pitäisi tietää semanttisesta webistä ja ontologioista? • Semanttinen web vahvistuu vähitellen? • Ontologiat vaikuttavat sisällönkuvailutyön käytäntöihin • Uudella tavalla tuotettu metadata on käytettävissä monipuolisemmin – kirjastot osaksi semanttista verkkoa? • Semanttinen verkko, jossa tietoja prosessoidaan aiempaa tehokkaammin • Mikä vahvistaa kirjaston roolia verkossa, auttaa myös fyysisessä kirjastossa
Entäpä sitten käytännössä? • Mikä Saha?
Muumimamman meditatiivinen Saha? • Äiti sahasi sahaamistaan lempeässä • harmaassa ilmassa, hän mittasi pölkyt • täsmälleen yhtä pitkiksi ja järjesti ne • sievästi kaareksi ympärilleen. Puumuuri • kasvoi yhä korkeammaksi, ja lopulta äiti • sahasi pienessä tilassa, joka antoi hänelle • erinomaisen turvallisuuden tunteen… • Jakaranda ja palisanteri, mutisi äiti • hartaan tyytyväisenä ja jatkoi • sahaamistaan. • … Toiset olivat tottuneet sahaavaan • äitiin, jota näkyi yhä vähemmän puupinon • takaa… Lopulta pino tuli niin korkeaksi, että • äidistä näkyivät vain korvat. Mutta hän vain • sahasi sahaamistaan, ja joka aamu hän • kulki ympäri saaren ja kokosi uusia • laudanpätkiä. • Tove Jansson: Muumipappa ja meri. • Suom. Laila Järvinen.
Sittenkin tällainen: SAHA3 • Selainpohjainen annotaatiojärjestelmä • Sovellus käyttäjille, jotka eivät tunne semanttisen webin tekniikoita eivätkä annotointiin liittyviä erityiskäsitteitä • Jaettavissa useiden käyttäjien kesken • Toimii tietokoneen sijasta web-palvelimella (Valkeapää 2006, 35)
Kaunokki-Saha • Semanttisen laskennan tutkimusyksikön kehittämä annotaatioeditori • Annotointi = kuvailusta käytetty termi semanttisessa webissä • Lähtökohtana kaunokirjallisuuden erityispiirteet • Erityistä huomiota • Sisällönkuvailuun • Osakohteiden tallennukseen • Teosten välisten yhteyksien esilletuomiseen • Funktionaalisen luetteloinnin piirteitä • Kukin teos yhtenä tietueena • Kieliversiot • Mukana myös kirjailijoihin liittyvää tietoa • Kehittyneemmät ja monipuolisemmat hakuehdot • Kun tallennetaan yhden teoksen tietoja, täydennetään samalla semanttista verkkoa
Sisällönkuvailu Kaunokki-Sahaan • Kaunokki-ontologia integroitu Kaunokki-Sahaan • sisällönkuvailutermejä ei tarvitse etsiä erillisistä selaimista • käytettävissä YSOn ja Kaunokin käsitteet • sisällönkuvailu tehdään vain yhdellä kielellä, voidaan näyttää käyttöliittymässä/Sahassa halutulla kielellä (Kaunokki-ontologia: suomi, ruotsi, YSO: suomi, ruotsi, englanti) • Sisällönkuvailutyön perusteet eivät muutu, tiedontallennuksen ja –esittämisen välineet kyllä • Lukijat mukaan sisällönkuvailutyöhön?
Abstrakti ja fyysinen teos Sahassa • Abstrakti teos - kuvaillaan sitä, mikä on yhteistä kaikenkielisille ja eri formaateissa julkaistuille versioille • Sisällönkuvailu • Päävastuullinen tekijä • Fyysinen teos – kuvaillaan sitä, mikä liittyy kyseiseen kirjaan • Kirjaan liittyvät tekijät (kääntäjä, toimittaja, kuvittaja…) • Ulkoasu (sivumäärä, kansi…) • Julkaisuhistoria (kieli, kustantaja, ilmestymisaika…) • Ohje: http://wiki.kirjastot.fi/index.php/Kirjasampo-Sahan_ohjeistus
Kaunokki-Sahassa suomenkielisen kaunokirjallisuuden perustiedot Tarvitaan yhteistyötä vanhemman kaunokirjallisuuden sisällönkuvailuun Kirjastot rakentavat yhdessä kaunokirjallisuuden tiedonhaun välinettä Voimat yhdistämällä ja keskittämällä parempia tuloksia Miten yhdessä tuotettu metadata on integroitavissa esim. kirjastojärjestelmiin? Mitä kirjastoilta toivotaan? Miten kirjastot hyötyvät?
Kauno- kirjallisuuden sisällönkuvailu 4.11.2009 Seinäjoki Kaisa Hypén
Kirjastonhoitaja Jouko Raivionkirjaston kaunokirjallisuutta käyttävien asiakkaiden tyypittely (1990) • tekijäorientoituneet: etsivät tietyn kirjailijan tuotantoa • apuna kokoelmatietokanta, tekijän mukaan järjestetyt kokoelmat • lajiorientoituneet: etsivät tiettyyn lajityyppiin kuuluvaa kirjallisuutta • apuna kokoelmatietokanta, jos kirjallisuutta on asiasanoitettu • apuna hyllyryhmittely, jos se on kirjastossa käytössä • aiheorientoituneet: etsivät kirjallisuutta tietystä aiheesta • apuna kokoelmatietokanta, jos kirjallisuutta on asiasanoitettu • apuna kirjaston henkilökunta, erilaiset hakemistot Näiden lisäksi erilaiset samoojat, etsijät, vanhoja lukukokemuksia kaipaavat, löytöjen tekijät, palautushyllyjen selaajat.
Kaunokirjallisuuteen liittyviä tietopalvelukysymyksiä • ”missä romaanissa on kuvaus Suurinkvisiittorista” • ”Daniil Harmsin tyyppistä satiiria” • ”runo yksinaruisesta keinusta” • ”runo, josta asiakas muistaa ainoastaan ’yksinäisyys soittaa viuluaan’” • ”romaaneja, joissa veisataan virsiä” • ”romaaneja, joissa kuvataan työntekoa positiivisessa hengessä” • ”amerikansuomalaisen kirjoittajan kirjoittama romaani, jossa käytetään hienoa amerikansuomea ja se on suht vanha, ehkä 1960-luvulta. Tekijän etunimi alkaa ehkä A-kirjaimella” • ”turkin kielestä käännetty, turkkilaista surrealismia edustava teos, lienee kirjoitettu noin kolmekymmenluvulta, ruotsinnos tai suomennos” • …
Kaunokirjallisuuden indeksoinnin perusteista • Jarmo Saarti: Kaunokirjallisuuden sisällönkuvailun aspektit: kirjastoammattilaisten ja kirjastonkäyttäjien tekemien romaanien tiivistelmien ja asiasanoitusten yhdenmukaisuus. Väitöskirja, Oulun yliopisto 1999. • kirjallisuuden monitulkintaisuus, oman tulkinnan osuuden tunnistaminen • vaatii asiantuntemusta, yleissivistystä, genrejen sisäisten konventioiden tuntemusta • ns. genre-kirjallisuuden asiasanoitus: genren konventiot ohjaavat lukutapaa • ns. avoin (”laatu”) kirjallisuus: avoin useammille tulkinnoille
Mikä Kaunokki? • Fiktiivisen aineiston asiasanasto, n. 4 500 termiä • Kokeilupainos v. 1996, varsinainen asiasanasto v. 2000, verkkoversio v. 2007 • Perustana Jarmo Saartin väitöskirja ja sisällönkuvailutyö Kajaanin kaupunginkirjastossa • Kattaa kaikki kirjallisuudenlajit, aikuisten ja lasten kirjallisuuden, elokuvat • Mukana jonkin verran kirjallisuudentutkimukseen liittyviä termejä • Noudatettu YSAn periaatteita ja rakennetta • Ruotsinkielinen versio Bella • Ylläpito ja kehittäminen Helsingin kaupunginkirjastossa, Kaunokki-työryhmä
Kaunokin erityisyydestä • Kaunokirjallisuuden luonne – teos omalakisensa taideluomus, kielen eri tasot (metaforisuus, konnotaatiot, vertaukset) > monitulkintaisuus • ”[Kirjallisuuden kieli] on aina ihmisenä olemista koskevan perustiedon kieltä.” (Rikama, 2007) • Kirjallisuuden aiheena voi olla mikä vain, sen käsittelytapa yksilöllinen > haasteita sanastoille! • Kohderyhmän vaikutus: lasten- ja aikuistenkirjallisuus • Kaunokirjallisuuden sisällönkuvailun luonne – ”aboutness”
Kaunokin fasetit • Genre, laji, tyyli • Teema • Henkilö, toimija • Paikka, miljöö • Aika • Muut
Genrestä (1) • genre ~ kirjallisuudenlaji, -luokka • genrejä satoja, uusia syntyy jatkuvasti • Kaunokissa n. 600 genreä, liittyvät niin kirjan muotoon (novellit) kuin sisältöön (filosofiset romaanit) • ”genrekirjallisuus” ~ viihdekirjallisuus (esim. dekkarit, naisten viihdekirjallisuus): ”ajanvietteeksi tarkoitettu kaunokirjallisuus, jolla ei ole kunnianhimoisia taiteellisia tavoitteita” (Otavan kirjallisuustieto 1990). Pyrkii noudattamaan genren vakiintuneita piirteitä, vastaamaan lukijan odotuksiin. • genrellä tärkeä merkitys teoksen markkinoinnissa, ja se ohjaa myös lukijan odotuksia, valintoja ja lukutapaa
Genrestä (2) • genre kuvaa kokoavasti sitä, miten teoksessa käsitellään aiheita ja teemoja, mikä teoksen näkökulma kuvaamiinsa asioihin • teoksessa käytetyt kerronnan keinot, mikä teoksen tyyli on esim. sairaus motiivina dekkarissa tai elämäkerrallisessa romaanissa. • kaikkia nimekkeitä ei voi määritellä kuuluvaksi johonkin genreen - on romaaneja, joille voi luontevasti antaa useitakin genrejä • kaunokirjallisuuden hyllyryhmittely perustuu genreille
Muut fasetit (1) • aiheet, teemat, motiivit • ”aboutness”: mistä kirjassa on kyse • liittyy usein tarinaan, juoneen • vältettävä liikaa tulkintaa • keskeisimmät teemat, aiheet ja motiivit, myös sivuteemat, jos käsitelty aihe harvinainen • poimitaan ontologiasta • henkilöt, toimijat • teoksen keskeiset toimijat • ihmiset, eläimet, taruolennot, kyborgit… - poimitaan ontologiasta tai luodaan uusi, erityisesti nimetyt päähenkilöt • miljööt, tapahtumapaikat • todelliset, tunnistettavat paikat (maat, kaupungit, kylät) • fiktiiviset paikat (myyttien, tarujen paikat, avaruus…) • poimitaan ontologiasta (Kaunokki, paikkaontologia) tai luodaan uusi • tapahtumapaikat kannattaa indeksoida tarkasti, jos ne käyvät tekstistä ilmi
Muut fasetit (2) • tapahtuma-aika • tarkka aika (vuodet, päivä…) • ”sumea aika” (kesä, yö…) – poimitaan ontologiasta • muut kuvattavat seikat • esim. palkinnoille ja sovituksille Sahassa omat kentät • tähän kenttään on mahdollista tallentaa oma asiasana, jos ontologiasta ei löydy (harkintaa!) • asiasanayhdistelmät eli ketjut • toisiinsa liittyvät asiasanat, jotka eivät ole ontologiassa toistensa ylä- tai alakäsitteitä • esim. symboliikka : kivet • kuvaus • suorasanainen kuvaus teoksesta (esim. oma tiivistelmä, takakansiteksti, poiminta kritiikistä… lähde mainittava)
Indeksoinnista vielä • yksityiskohtaisemmat ohjeet ks. Kaunokki s. 6-18 • Kaunokin / Bellan lisäksi käytetty YSA Yleinen suomalainen asiasanasto ja Allärs Allmän tesaurus på svenska • indeksointi on aina subjektiivista, yksi näkemys teoksen sisältöön • erilaiset indeksoinnit samasta teoksesta, valitut asiasanat osattava perustella • yhtä ainoaa ”oikeaa” sisällönkuvailua ei ole! • Kirjasampo-Sahan pelisäännöt? • uusi, yhteisöllinen toimintatapa • erilaiset näkemykset, kompromissit, yhteisesti sovittavat käytännöt