1 / 24

Asiasanastoista ontologioihin? YSA-YSO-näkökulma

Asiasanastoista ontologioihin? YSA-YSO-näkökulma. Eeva Kärki Kansalliskirjasto 20.10.2009. Agenda. YSA YSO YSA – YSO: eroja Selvitettävää Osoitteita. Tesaurukset ja ontologiat. molemmat ovat käsitejärjestelmän kuvauksia asiasanastot = ihmisen tulkittavissa olevia

sine
Download Presentation

Asiasanastoista ontologioihin? YSA-YSO-näkökulma

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Asiasanastoista ontologioihin?YSA-YSO-näkökulma Eeva Kärki Kansalliskirjasto 20.10.2009

  2. Agenda • YSA • YSO • YSA – YSO: eroja • Selvitettävää • Osoitteita

  3. Tesaurukset ja ontologiat • molemmat ovat käsitejärjestelmän kuvauksia • asiasanastot = ihmisen tulkittavissa olevia • ontologiat = koneen (ja ihmisen?) tulkittavissa olevia

  4. YSA eli Yleinen suomalainen asiasanasto (1) • n. 27 400 asiasanaa (näistä n. 5000 maantieteellistä nimeä) • kaikki tiedonalat • ei henkilön- eikä yhteisönnimiä • yleissanasto (epätasaisuutta…) • tesaurus-rakenne • aakkosellinen ja systemaattinen osa • ylläpito: Kansalliskirjasto (1 htv) • ”tekninen” ylläpito: Fennica-tietokanta (Voyager)

  5. YSA (2)Ylläpito sanaehdotukset, muutokset (vesa-posti@helsinki.fi) Fennican indeksoijat yleiset ja tieteell. kirjastot BTJ Kirjastopalvelu arkistot, museot erikoissanastot media ”tavalliset käyttäjät”

  6. YSA (3)Sanastopalaveri • 3-4 kertaa vuodessa, osallistujia 12-15 henkeä • Fennican sisällönkuvailijat • Allärsin edustaja • BTJ Kirjastopalvelu • Helka-tietokannan edustaja • Eduskunnan kirjaston asiasanaston edustaja • Agriforestin (Maa- ja metsätaloussanasto) edustaja • Helsingin kaupunginkirjaston edustaja

  7. YSA (4)Uudet asiasanat ja asiasanamuutokset • n. 400-500 uutta YSA-termiä per vuosi • uudet sanat ja muutokset ilmoitetaan kirjastojen yms. sähköpostilistoilla parin päivän sisällä kokouksesta • päivitys Fennica-tietokantaan • VESAssa n. parin viikon kuluttua kokouksesta • Huom! ns. vapaan indeksoinnin termejä ei käsitellä palaverissa eikä ilmoiteta listoilla (näitäkin tulee n. 500 per vuosi)

  8. YSA (5)Käyttö • Fennica (Suomen kansallisbibliografia) • kaikki yleiset kirjastot • suurin osa tieteellisistä kirjastoista (YSAn lisäksi monet tieteelliset kirjastot käyttävät oman alansa erikoissanastoja) • arkistot • museot (Museoalan asiasanaston lisäksi)

  9. YSA (6)Tesaurus-rakenne • KÄYTÄ = viittaus ohjaustermistä asiasanaan (VESA = asiasanaa xxx ei käytetä) • KT = korvaa termit • LT = laajemmat termit • ST = suppeammat termit • RT = rinnakkaistermit • Huomautus • Lähde • Ryhmäkoodi ( VESA = kuuluu ryhmiin) • Kaikki termisuhteet ovat aina vastavuoroisia

  10. YSO eli Yleinen suomalainen ontologia(1) • FinnOnto-osaprojekti (Tekes) 2004-2010 • perustuu YSAan (aina jonkun verran jäljessä YSAsta) • tällä hetkellä n. 22 000 termiä • ei maantieteellisiä nimiä • kieli: suomi • ruotsinkieliset vastineet (Allärs) • englanninkieliset vastineet • poimittu Helsingin kaupunginkirjaston luokituskaavion englanninkielisen version hakemistosta; vastineissa virheitä, koska termejä ei ole tarkistettu erikoisalojen sanastoista/sanakirjoista • ruotsinkielistä ontologiaa (Allso) on tehty lokakuun alusta lähtien • englanninkielisten vastineiden oikeellisuutta ei ole tarkistettu eikä ontologista rakennetta ole tehty

  11. YSO (2) • YSOa käytetään myös rakenteellisena mallina ja liittymäkohtana erikoisalojen ontologioihin, kuten • AFO (Agriforestista tehty ontologia) • VALO (Valokuva-alan ontologia) • MAO (Museoalan ontologia) • osoite: http://www.yso.fi/onki/yso/

  12. ”asia” abstrakti muuttuva pysyvä paikka ajanjakso prosessi fyysinen objekti ominaisuus ilmiö henkiset tuotokset toiminto tapahtuma järjestelmä fyysinen kokonaisuus YSOn kehikko (Lähde: Katri Seppälä)

  13. YSOn kehikko • abstrakti • muuttuva • prosessit • tapahtumat • toiminta • pysyvä • ajanjakso • fyysinen kokonaisuus • fyysinen objekti • henkiset tuotokset • ilmiöt • järjestelmät • ominaisuudet • paikka

  14. Pysyvä • ajanjakso • fyysinen kokonaisuus • fyysinen objekti • aine • konkreettinen eloton objekti • …. • lavasteet • leikkikalut • legot • leikkikalut käyttöympäristön mukaan • leijat, lennokit, liidokit, vesilelut • leikkikalut materiaalin mukaan • kiiltokuvat, pehmolelut, puulelut, tinasotilaat nuket • nukkekodit • …. • letkut • liikennemerkit • …..

  15. YSOn kehikko ST-suhteet • geneeriset suhteet (laji – alalaji) • voimalat - lämmitysvoimalat • partitiiviset suhteet (kokonaisuus – osa) • kasvinosat – juuri, kukka jne. • esitetään eri tavalla kuin geneeriset ST-suhteet • näitä ei ole vielä tehty YSOon (eli ovat nyt tavallisia ST-suhteita)

  16. YSA – YSO (1) Sanojen väliset suhteet • YSAssa asiasanan ympärille rakennetaan tesaurus-suhteet aikaisemmin YSAssa oleviin asiasanoihin • kaikki YSAssa esiintyvät sanat ovat ”todellisia” asiasanoja • monilla sanoilla ei ole hierarkkisia suhteita, vain assosiatiivisia suhteita (RT-suhde) • joillakin sanoilla ei ole mitään suhteita • käsitejärjestelmäkokonaisuudet melko pieniä

  17. YSA – YSO (2) Sanojen väliset suhteet (jatkuu) • YSOssa on valmis kehikko, johon kukin sana yritetään sijoittaa mahdollisimman loogisesti • ontologissa paljon hierarkian vaatimia ns. ”aputasosanoja”, jotka eivät ole asiasanoja • käsitekehikko monimutkainen ja tarkka • kaikilla sanoilla/termeillä on joku hierarkkinen suhde • pitkiä hierarkioita (esim. kissa) • monet käsitteet vaikea sijoittaa kehikkoon loogisesti (ongelma varsinkin ns. ”pehmeillä tiedonaloilla”) -> vaarana, että kokonaisuus on epäjohdonmukainen (esim. avioero – asumusero)

  18. YSA – YSO (3) Sanojen monimerkityksisyys yms. • YSAssa ratkaistu kahdella tavalla (esim. kaanonit, kurkku, messut) • YSOssa pyritty ottamaan esille mahdollisimman paljon monimerkityksisyyttä (kaanonit, kurkku, messut) • kuinka ”syvälle” polysemiaan kannattaa mennä? • YSOssa osa termeistä esitetty myös eri ”funktioissa” (esim. lapset) , kooste-sanat Maantieteelliset nimet • YSAssa mukana n. 5000 paikannimeä (myös luonnonmaantieteellisiä nimiä, koti- ja ulkomaisia) • YSOssa ei maantieteellisiä nimiä, maantieteellist nimet paikkaontologioissa (SUO, SAPO; sisältävät vain suomalaisia paikannimiä)

  19. YSA – YSO (4) Alanmukaiset ryhmät • YSAssa voidaan selata alanmukaisia ryhmiä • YSOssa ei voida selata alanmukaisia ryhmiä (ainakaan vielä) Vapaa indeksointi • YSAssa ohjeet vapaan indeksoinnin sanaryhmien yhteydessä • YSOssa asia ratkaisematta

  20. Selvitettävää: kysymyksiä (1) • Miksi pitäisi siirtyä asiasanoista ontologioihin? • Mitä todellista lisäarvoa ontologiat tuovat sisällönkuvailuun ja tiedonhakuun? • Ontologiat luotu lähinnä koneymmärrettäväksi, soveltuvatko ne ihmisen tulkittaviksi? • Ovatko ontologiat sisällöltään niin valmiita, että niitä voidaan ryhtyä käyttämään? • Maantieteelliset nimet: tulevatko SUO ja SAPO osaksi KOKO-ontologiaa? Entä ulkomaiset paikannimet?

  21. Selvitettävää: kysymyksiä (2) • Miten käytetään niitä asiasanoja, jotka eivät ole missään ontologioissa? • esim. vapaan indeksoinnin sanat, numeeriset ajanmääreet • Koska asiasanaa ei voi käyttää muussa kuin ontologian esittämässä yhteydessä, miten menetellään, jos ko. sanaa tarvitaankin ihan muissa yhteyksissä? • onko otettava yhteys ontologian ylläpitäjään? • Onko kaikki käytettävät asiasanastot ontologisoitava? • resurssit? Sisällöllinen ja tekninen ylläpito? • Entä ulkomaistenasiasanastojen ja ontologioiden käyttö?

  22. Selvitettävää: kysymyksiä (3) • Onko teknisiä valmiuksia ryhtyä käyttämään ontologioita sisällönkuvailussa ja tiedonhaussa (esim. kirjastojärjestelmät )? • termien poiminta ontologiasta pitää olla niin vaivatonta, ettei se hidasta sisällönkuvailutyötä • miten käy ketjutusten? • Jos ontologioita ryhdytään käyttämään asiasanoituksessa, pystytäänkö aikaisemmat indeksoinnissa käytetyt asiasanat kytkemään ontologian yhteyteen? • jos ei, mitä se vaikuttaa tiedonhakuun?

  23. Osoitteita • http://vesa.kansalliskirjasto.fi/ (pääsee sekä uuteen että vanhaan VESAn käyttöliittymään) • http://www.yso.fi/onki/yso/ (YSO) • http://demo.seco.tkk.fi/onkipaikka/ (SUO = Suomalainen paikkaontologia) • http://www.yso.fi/onki/sapo/?l=fi (SAPO = Suomen ajallinen paikkaontologia) • http://www.yso.fi/onki/koko/?l=fi (KOKO-ontologia) • http://www.yso.fi/?l=fi (Ontologiapalvelin, linkit FinnONTO-projektissa työstettyihin ontologioihin) • http://www.yso.fi/lusto-demo.html (Kantapuu-museotietokanta, hakudemo) • http://wordnet.princeton.edu/ (WordNet)

  24. Muuta • Ontologiaseminaari kirjastosektorille 23.10.2009; aiheita mm. • Järjestelmäarkkitehtuuri • FRBR, RDA • Kaunokki, Mediaontologia • YSOn tilanne • Paneelikeskustelu, alustajina Eero Hyvönen (FinnOnto) ja Vesa Suominen (Yliopistonlehtori/Oulun yliopisto. Informaatiotutkimus) Järjestäjä: Kansalliskirjasto

More Related