720 likes | 990 Views
Semantika koolitus . Moodul 4 Semantikavarade haldamine. Tartus, 01.12.2009 Peep Küngas. Koolitus toimub Euroopa Liidu struktuurifondide programmi “Infoühiskonna teadlikkuse tõstmine” raames, mida rahastab Euroopa Regionaalarengu Fond. K oolitusmooduli eesmärk.
E N D
Semantikakoolitus. Moodul 4Semantikavaradehaldamine Tartus, 01.12.2009 Peep Küngas Koolitus toimubEuroopa Liidu struktuurifondide programmi “Infoühiskonna teadlikkuse tõstmine” raames, mida rahastab Euroopa Regionaalarengu Fond
Koolitusmooduli eesmärk • Selgitada semantikavarade haldamise olemust • Tutvustada haldamise protsesse ja töövõtteid • Tutvustada haldamisega seotud probleeme läbi praktiliste harjutuste • Aidata tuvastada semantikavarade haldamise edukaks läbiviimiseks vajalikud nõuded nende terve elutsükli jooksul koolitusel osaleja organisatsioonis
Milleks haldamine Probleem
Teenustepõhine arhitektuur (SOA) Dirk Krafzig, Karl Banke, and Dirk Slama. Enterprise SOA. Prentice Hall, 2005
X-tee andmeteenustest* • Kokku ~4000 andmevälja • ~1400 erinevat tippelemendi nimetust • Ca 2000 defineeritud andmetüüpi/päringut • Top 10% mõistetest katab ca 50% annotatsioonidest – 20% ca 80% • Orienteeruv mõistete arv (andmeobjektid) – min 1000 (vaid andmed) - 2000 (kvaliteetne ontoloogia) *Ca 50% andmeteenuste baasil (24 WSDL dokumenti, 538 andmeteenust)
X-tee kui andmekogu Haldamiseks on vaja organisatsiooni ja toetavaid protsesse
Semantikavarad Part of Ontoloogiad Is a E207 Klassifikaatorid Part of Taksonoomiad Subclass Tesaurused numbriline kood, mis on ette nähtud katastriüksuste identifitseerimiseks Sõnaraamatud katastriüksus katastritunnus katastris iseseisva üksusena registreeritud maatükk
Probleemid (1) • Andmete ja andmeteenuste kirjeldusi on palju • Andmeteenuste hulk on suur ning üha kasvav • Kirjeldused on omavahel seotud • Teenuste kirjeldused viitavad andmeobjektide kirjeldustele • Andmekoosseisude kirjeldused viitavad andmeobjektide kirjeldustele • Andmeobjektide kirjeldused on defineeritud ontoloogiates • Muudatused ühes kirjelduses tingivate seotud kirjelduste kaasajastamise
Probleemid (2) • Kirjelduste kõrge kvaliteedi tagamine on keerukas • Eeldab vastava know-how olemasolu • Vajalik stabiilsus ja järjepidev haldamine • Erinev andmete/teenuste semantika erinevates valdkondades
Semantikavarade haldamise põhimõtted Kirjelduste haldamine
Standardid • WSDL – teenuste süntaktiline kirjeldamine • XSD – andmetüüpide süntaktiline kirjeldamine • OWL – valdkonnamudelite kirjeldamine • SA-WSDL – süntaktiliste kirjelduste (WSDL) sidumine semantikaga (OWL)
Semantilise koosvõime võtmepõhimõtted (1) • Semantilisel kirjeldamisel rakendatakse järgnevaid keeli ning nende laiendusi: XSD, OWL, WSDL, SA-WSDL, WS-BPEL • Riigi infosüsteemide nii inim- kui masinloetavad semantilised kirjeldused on tasuta kättesaadavad • Iga ministeerium on kohustatud looma ning seejärel haldama oma valitsemisalaga seotud semantilisi varasid • Ontoloogiate ja valdkonnasõnastike valdkonniti kattuvate osade loomine ning haldamine toimub meeskonnatöö vormis
Semantilise koosvõime võtmepõhimõtted (2) • Kõik institutsioonid on vabad oma infosüsteemide sisemise arhitektuuri ja koosvõime põhimõtete valikul, kuid nende omavahelisel seostamisel on kohustuslik on järgida raamistiku põhimõtteid (nn subsidiaarsuse põhimõte) • Infosüsteemide semantiline koosvõime Eestis on strateegiline valik, kusjuures avalik sektor näitab semantilise koosvõime põhimõtete järgimisel eeskuju • Semantiliste varade loomiseks ja haldamiseks vajalike tehnoloogiate väljatöötamisele suunatud tegevused seostatakse teadus- ja arendustegevusega Eestis • Semantiliste varade loomisel ja haldamisel arvestatakse korduvkasutatavuse põhimõtteid
Semantilise koosvõime võtmepõhimõtted (3) • Erasektorile tagatakse ligipääs infosüsteemide semantilise kirjeldamise keskkonnale ning võimalus kirjeldada semantiliselt omi infosüsteeme sarnastel alustel mil avaliku sektori esindajad riigi infosüsteeme • Semantiline koosvõime toetab e-Äri lahenduste loomist, vajadusel ettevõtete infosüsteemide liidestamist riigi infosüsteemidega ning riigi poolt kodanikele pakutavate teenuste personaliseerimist • Riik soosib eraettevõtete ja nende ühenduste kaasatust semantiliste varade loomisel, publitseerimisel ja rakendamisel
Haldamise põhimõtted (1) • Varade lisamine • veendutakse, et see ei dubleeri olemasolevaid • Vara ümbernimetamine • suunatakse vastavale varale osutavad viited ümbernimetatud varale • Varade mestimine • suunatakse esialgsetele varadele osutavad viited üldisemale varale
Haldamise põhimõtted (2) • Varade poolitamine • säilitatakse viide kas üldisemale varale või luuakse uus semantikavara, mis ei välista viidet ühelegi konkretiseerimise tulemusena tekkinud varale • Varade kustutamine • lahendatakse sõltuvused • Semantikavaradesse tehtud muudatused kajastuvad vastavus- ja teisendustabelites, mis talletavad semantikavarade haldamisel tehtud operatsioone ning lisaks kajastavad varade teisendusi ühest valdkonnast teise
Semantikavarade loomine valdkonniti • Terminoloogiate loomine • Tesauruste loomine • Ontoloogiate loomine • Andmekoosseisude- ja teenuste semantiline kirjeldamine
Semantikavarade haldamine valdkonniti • Semantiliste varade haldamisel valdkonniti eemaldatakse liiasus erinevate varade lõikes • Tagatakse kõikide semantiliste varade maksimaalne korduvkasutus • Korduvkasutus tähendab vastavate valdkondade piires erinevat liiki semantiliste varade seostamist omavahel
Semantikavarade valdkonnaülene mestimine • Valdkonnaülest semantiliste varade mestimist võiks vaadelda kahe protsessina: • vastavustabelite loomine • valdkonnaüleste semantiliste varade loomine ja haldamine
Teavitamine • Organisatsiooni sees • Organisatsioonide vahel • Millal? • Semantiliste varade importimine • Terminite terminoloogiast kustutamine • Terminitevaheliste seoste kustutamine • Mõistete ontoloogiast kustutamine • Mõistetevaheliste seoste kustutamine • Mõistete mestimine • Andmeteenuste andmetüüpidelt ja nende väljadelt mõistelise vastavuse kustutamine • Semantikavarade sisu muutmisel
Haldaja vahetamine • Seoste nimekirja baasil analüüsitakse erinevate omanike semantikavarasid puudutavate seoste arvu • Kontakteerutakse enim seoseid omavate omanikega ning alustatakse läbirääkimisi • Tuvastatakse uus omanik ning tingimused semantikavarade omaniku vahetamiseks • Viiakse semantikavarad vastavusse uue omaniku nõuetega • Antakse semantikavarad üle
Semantikavara käibelt eemaldamine • Luuakse sõltuvuste nimekiri • Tuvastatakse teised semantikavarad ning rakendused, mis sõltuvad eemaldatavatest • Eemaldatakse sõltuvused seotud kehtivatest semantikavaradest • Eemaldatakse sõltuvused rakendustest • Arhiveeritakse eemaldatavad semantikavarad • Eemaldatakse semantikavarad käibelt
Näidisprotsesside ja organisatsiooni tutvustamine Organisatioon
Organisatioon • Organisatsioon on vajalik projektide jätkusuutlikkuse tagamisel • Vajadus semantilise kirjeldamise protseduuriliste ja sisuliste eeskirjade järele, mida kõik osalised jälgiksid • Järgnevad rollid peavad olema esindatud: • Integraator (tarkvara arendaja) • Teadmusinsener • Valdkonnaekspert
Mõistete baasi ühtlustamine ja vigade eemaldamine Ontoloogiate haldamine
Valdkonnasisene haldamine • Mõistete ja seoste ümbernimetamine • Mõistete ja seoste kirjelduste redigeerimine • Uute mõistete ja seoste lisamine • Mõistete ja seoste kustutamine • Mõistete ja seoste migreerimine teistesse ontoloogiatesse • Mõistete mestimine ja poolitamine • Reeglite lisamine, muutmine, kustutamine • Anomaaliate eemaldamine
Valdkonnaülene haldamine • Sarnaste mõistete ja omaduste tuvastamine valdkonnaüleselt • Sama sisuga mõistete ja omaduste mestimine • Uute valdkonnaüleste ontoloogiate loomine koostöös teiste ontoloogiate haldajatega • Vastavustabelite loomine erinevate ontoloogiate mõistete ja omaduste vahel
Dokumentatsiooni haldamine • Mõistete ja omaduste identifikaatorite ümbernimetamine • label, comment, version kasutamine • mõiste, omaduse, ontoloogia kirjelduses • Mitmekeelne dokumentatsioon • Keelemärgendite täiendamine • lang atribuut
Ontoloogiate mestimine • Vali 2 ontoloogiat • Tuvasta sarnased mõisted • Analüüsi nende kattuvust • Tuvasta sarnased seosed • Analüüsi nende kattuvust • Mesti kattuvad mõisted ja seosed ning loo vajadusel uued mõisted ja seosed
Mõistete migreerimine • Valitakse migreeritav mõiste või omadus • Valitakse sihtontoloogia • Tuvastatakse rekursiivselt millised mõisted või omadused tuleb koos valitud mõistega migreerida • Valitud mõisted ja omadused lisatakse sihtontoloogiasse • Kaasajastatakse viited migreeritavatele mõistetele • Mõistega seotud teiste semantiliste varade omanikke teavitatakse migreerimisest ning palutakse neil seotud viited kaasajastada
Mõistete mestimine • Valitakse sarnase sisuga mõisted • Analüüsitakse nende kasutamist (viited nendele) • Tuvastatakse mõistete sisu samasus • Kokkuleppel sama sisuga mõistete haldajatega luuakse uus või muudetakse kõige paremini sobiva mõiste inimkeelset dokumentatsiooni • Liidetakse kokku erinevate sama sisuga mõistete omadused
Mõistete poolitamine • Tuvastatakse, et sama mõistet kasutatakse erinevates interpretatsioonides • Luuakse iga interpretatsiooni jaoks uus detailsem mõiste kirjeldus • Lisatakse uued mõisted vana mõiste alammõisteteks • Vajadusel lisatakse uued omadused
Andmeobjektide kirjelduste üldistusaste • Sisemisi indekseid, mis välja eipaista, pole vaja kirjeldada • Aluseks IS integratsiooni vajadused • Piisav detailsus andmete üheseks mõistmiseks • Nt “Kood” vs “Isikukood” vs “Õppuri isikukood” • Sobituvus teistesse lahendustesse
Andmeteenuste ja -koosseisude semantiliste kirjelduste kaasajastamine Semantiliste kirjelduste haldamine
Semantilise kirjeldamise kulu • Andmestruktuuride ja nende elementide arv XSD ja XMI dokumentides • XML elementide dokumentatsiooni kättesaadavus projekti kontekstis • Valdkonna ontoloogia suurus • Andmeteenuste WSDL kirjelduste detailsus • Andmekoosseisude XMI kirjelduste kvaliteet • Spetsiaaltööriistade olemasolu
Dokumenteerimine (WSDL/XSD) • SA-WSDL modelReference jt atribuudid • X-tee märgendid: • notes, technotes, title • WSDL/XSD märgendid • xsd:annotation/xsd:documentation, wsdl:documentation • mitmekeelsus – lang atribuut • WSDL nimeruumis pole elemendil documentation keelemärgend võimalik
Andmekoosseisude kirjelduste uuendamine • Andmemudel viiakse vastavusse tegeliku olukorraga • Tuvastatakse erinevused vana andmemudeli ja uue vahel • Tuvastatakse erinevused infosüsteemi realisatsiooni ja dokumentatsiooni vahel andmemudeli osas • Andmemudeli dokumentatsiooni täiendatakse olemasolevate andmeobjektide sisu paremaks hoomamiseks RIHA kooskõlastajate poolt • Lisatakse viited andmemudeli olemitelt vastava sisuga ontoloogia mõistetele • Genereeritakse XMI dokumendid RIHA-sse andmekoosseisude üleslaadimiseks
SA-WSDL viited • Lisatakse SA-WSDL kirjeldused uutele XML skeemidele ja XMI dokumentidele • Lisatakse SA-WSDL kirjeldused XML skeemide ja XMI dokumentide uutele versioonidele • Kaasajastatakse SA-WSDL viited XML skeemides ja XMI dokumentides vastavalt muudatustele seotud ontoloogiates
SA-WSDL viidete näide Näiteks kui on vaja semantiliselt kirjeldada järgnev XML skeemi fragment: <complexType name=”KinnisvaraObjekt"> <sequence> <element name=”registrikood” type="string"/> <element name=”kuupaev" type=”datetime"/> </sequence> </complexType> Siis semantiliseltkirjeldatudskeemvõiksnähaväljajärgnev: <complexType name=”KinnisvaraObjekt"> <sequence> <element name=”registrikood”type="string“ sawsdl:modelReference="http://onto.soatrader.com/ontology/Kinnisturaamat#Katastritunnus" sawsdl:loweringSchemaMapping="http://ws.soatrader.com/sawsdl/Kinnisturaamat/lowering12.xslt" sawsdl:liftingSchemaMapping="http://ws.soatrader.com/sawsdl/Kinnisturaamat/lifting21.xslt" /> <element name=”kuupaev" type=”datetime"/> </sequence> </complexType>
XML skeemide dokumenteerimine • XML skeemidele dokumentatsiooni lisades jälgitakse X-tee andmeteenuste XML skeemide dokumenteerimise tavasid: • //annotation/appinfo/xtee:title - Parameetri pealkiri (kasutajale näitamiseks) • //annotation/appinfo/xtee:notes - Parameetri kommentaar (kasutajale näitamiseks) • //annotation/appinfo/xtee:technotes - Parameetri kommentaar (arendajale)