850 likes | 1.05k Views
Mentor: prof. dr Milorad Banjanin. Sistem automatskog rezonovanja u ontološkoj analizi semantičke korektnosti modela podataka. Student: Jovana Janković. ER model podataka. CASE alati. Ključni pojmovi. Ontologija. Model podataka. Ontološki jezik. OWL. RDF. Predikatski račun prvog reda.
E N D
Mentor: prof. dr Milorad Banjanin Sistem automatskog rezonovanja u ontološkoj analizi semantičke korektnosti modela podataka Student: Jovana Janković
ER model podataka CASE alati Ključni pojmovi Ontologija Model podataka Ontološki jezik OWL
RDF Predikatski račun prvog reda Ključni pojmovi Sistem automatskog rezonovanje Prolog Protégé XML
Modelovanjepodataka je jednaodnajvažnijihaktivnosti u procesurazvoja informacionihsistemakojuvršeprojektantibazapodatakanaosnovudomenskog znanjaizodređeneoblasti. Ugradnjasemantike u model podatakazavisiodsposobnostiiiskustvaprojektantadakrozodređenekonceptekaoštosustrukturadijagrama, ograničenjailioperacijepreslika relevantneosobinerealnogposlovnogsistema.
S obzirom da je bazapodatakajezgrosvakoginformacionogsistemailisloženijegsoftverskogproizvodakojiorganizovanočuvaimanipulišepodacima, postavljaju se sljedeća pitanja: • Bazapodatakaje skup međusobno • povezanih podatakakoji se čuvaju zajedno • i među kojima ima onoliko ponavljanja koliko • je neophodno za njihovo • optimalno korišćcenje • pri višekorisničkom radu. Dalibazapodatakaodgovaraspecifičnimosobinamaposlovnogsistemaiz određeneproblemskeoblasti? 1. Kolikokvalitetimplementiranebazepodatakazavisiodiskustvaiznanja projektantaidizajnera? 2.
Problematikaove temejesteteoretskoiempirijskoistraživanjemodalitetaprovere kvalitetamodelapodatakasaaspektasemantikeidomenskevaljanostiza oblast u kojoj se želikreiratikonceptualni model, saciljemda se izgradekvalitetnijeiadekvatnije bazepodataka, koje u manjojmerizaviseodiskustvaprojektanta.
KreiranjeteorijskogmodelaontološkizasnovaneanalizesemantičkekorektnostiKreiranjeteorijskogmodelaontološkizasnovaneanalizesemantičkekorektnosti modelapodatakaprimenomsistemaautomatskogrezonovanja. CILJ I ZADACI ISTRAŽIVANJA Pripremaimplementiranogsistemazakorišćenje u obrazovnomprocesuu nastavnomradu, u okviručasovanastaveiizradeseminarskihradova studenata. Definisanjeteorijskogmodelaontološkizasnovaneanalizesemantičke korektnostimodelapodatakaprimenomsistemaautomatskogrezonovanja. Analizarezultataempirijskogistraživanjaisintezazaključaka, koji se odnosena pozitivneinegativnekarakteristike, odnosnoprednostiinedostatke implementiranogsistema. Analiza, projektovanjeiimplementacijasoftverskepodrškezaontološki zasnovanuanalizusemantičkekorektnostimodelapodataka. Empirijskoistraživanjeefikasnostiimplementiranesoftverskepodrške upotrebomeksperimentalnemetode. Razmatranjeperspektivaimogućihpravacadaljegrazvojasistema. Praktičnaimplementacijaovakvogsistema, čija bi upotrebljivost, efekti, pozitivneinegativnekarakteristike bile utvrđenekrozeksperimentalno istraživanje u obrazovanjustudenata u oblastiinformatike.
HIPOTEZE ISTRAŽIVANJA Moguće je kreiratiteorijski model zaontološkizasnovanuanalizusemantičke korektnostimodelapodatakaprimenomsistemaautomatskogrezonovanja. GLAVNA HIPOTEZA
ONTOLOGIJE • U oblastiveštačkeinteligencije, pojamontologijase vezujeza: • Ponovnu upotrebu znanja (Reusability) • Dijeljenje znanja iz određenog domena (Sharing) U računarskominženjerstvuontologija se odnosinapredstavljanjeznanja (Knowledge Representation) Ontologijekoristeljudi, bazepodatakaisoftverskeaplikacijekojedijele informacijeizodređenogdomena. Ontologija se definišekaoskupterminakoji se koristeda bi se opisaodomen, tj. oblast znanja. • riječina svim prirodnim jezicima, • uključujući i njihove pogrešne • konstrukcije ako ih ima; Specifična predmetna oblast znanja
(“…a formal, explicit specification of a shared conceptualization”). FORMALNA DIJELJENA KONCEPTUALIZACIJA EKSPLICITNA Ontologija apstraktan model fenomenaizstvarnogsvijetakoji se dobijaidentifikovanjemrelevantnihkoncepataovihfenomena. eksplicitno su definisanisvi konceptiiograničenjakoja se koriste ontologijatrebada je razumljiva, tj. čitljivazamašine. trebada «uhvati» znanjeprihvaćenoodstranezajednice u kojoj se uvodiikoristi. Najpopularniju definicija ontologijeje dao [Gruber 1995] “formalna,eksplicitna specifikacijadijeljenekonceptualizacije“
“Ontologijaje skuplogičkihaksiomadizajniran takoda se odnosinaplaniranoznačenje nekogrječnika” (“a set of logical axioms designed to account for the intended meaning of a vocabulary”). [Guarino, 1998.] Uovojdefiniciji je istaknutaulogateorijelogikeu značenjui predstavljanjuontologije.
Definicija:OntologijaO je skupsastavljenod pet elemenata (C, I, R, F, A), gde je: C – konačanskupkoncepata, apstrakcijakojima se opisujuobjektirealnogsveta, I– konačanskupinstancikoncepata, tj. objekatastvarnogsvijeta, R – konačanskuprelacijaizmeđuelemenataskupa I, F– konačanskupfunkcijadefinisanihnadobjektimarealnogsvijeta, A – konačanskupaksiomanapredikatskomračunuprvogredakojiodređuju značenjeklasaobjekata, relacijaizmeđuobjekataifunkcijadefinisanihnad objektimarealnogsveta.
POSTUPAK IZGRADNJE ONTOLOGIJE Izgradnja ontologije Testiranje aplikacije Osnovnanamjenaontologijajesteomogućavanjepredstavljanja, prenošenjairazmjeneznanjaiznekeoblasti. Generisanje alata za akviziciju znanja Generisanje testne baze znanja Izgradnja inicijalne baze znanja
ONTOLOŠKI JEZICI I ALATI W3C (World Wide Web Consortium) je prihvatiosledećeontološke jezike: RDF Resource Descriptiom Framework jezikzasemantičkemrežekojislužizaopisresursana Web-u, RDFS RDF Schema je proširenje RDF jezika,
ONTOLOŠKI JEZICI I ALATI W3C (World Wide Web Consortium) je prihvatiosledećeontološke jezike: OIL Ontology Interchange Language, jezikzasnovannadeskriptivnojlogici, Web Ontology Language itrenutno predstavljanajpopularnijiontološkireprezentacionijezik. OWL XML EXtensible Markup Language.
Ontologije se mogusvrstatiu trikategorije, u zavisnostioddomena,tj. područjakojimodeluju: Ontologijezapredstavljanjeznanja (Knowledge Representation Ontology) su sistemizapredstavljanjeznanjakojisjedinjujuontološkeradneokvire (Framework). • Znanjese predstavljaili u KIF formatu • (Knowledge InterchangFormat)koji je • logičkisveobuhvatan • iobezbeđujedefinicijeobjekata, funkcijai • relacijaili, pak, • nakompjuterskiorjentisanomjeziku • dizajniranomzarazmjenuznanjaizmeđu • različitihprograma; Ontologije o opštemsvetskomznanju (Upper Level Ontology); Ontologijespecifičnihdomena (Domain Specific Ontology) saprimarnimfokusom napovezivanjustrukturaiponašanjakrozkonceptovlašćenja.
Klasifikacija ontoloških jezika FormalneosnovesvihvodećihjezikaSemantičkog Web-a (OWL, RDF i RDF(S)) su zasnovanenaklasičnojpredikatskojlogici. Ontološkijezici se zasnivajunaupotrebi XML jezika. Oni morajubitikompatibilnisa drugimindustrijskimi Web standardima.
Protégé – ontološkialat/editor sa Stanford univerziteta, bazirannaprogramskomokruženju Java. Inicijalno je bio softver u oblasti medicine ibiohemijskihnauka, a trenutno je jedanodvodećihontoloških editora u svijetu. Protégé podržava nekolikojezikazapredstavljanjeontologija: OWL, RDF(S), OIL, XMI (XML Metadata Interchange) idruge.
Sa različitim klasama (Class) koje su opisane osobinama (Properties )i drugim konceptima ontologije. Grafički prikaz apstraktnih klasa ontologija koji ostvaruje semantičke mreže Is-a Opisuje se koncept (stvar- Thing), tj. objekat iz realnog svijeta Koncepti u realnom svijetu predstavljaju konkretne objekte i pojmove.
Karakteristike i elementi OWL tehnologija OWL tehnologije sastoje se od JEDINKI • Postoje tri osnovnevrsteosobina: • osobineobjekata (ObjectProperties), • osobinetipovapodataka (Datatype Properties), • osobine bilješki(AnnotationProperties). Instance klase OSOBINA Binarne relacije između jedinki KLASA
Kvantifikatorska ograničenja Quantifier Restrictions Ograničenja Kardinaliteta Cardinality Restrictions Ograničenja u OWL jeziku Ograničenja tipa “ima vrijednost” (hasValue Restrictions).
Skuptakvihtrojki se zove RDF grafgdje su čvorovi grafa subjekti i objekti. Namjenjenje zapredstavljanjemetapodataka o Web resursima. RDF (Resource Descriptiom Framework) Strukturasvakogizraza u RDF je kolekcijatrojki, odkojih se svaka sastojiodsubjekta, predikataiobjekta. radniokvirzaopisipredstavljanjeinformacija na Web-u.
Struktura RDF izraza Predicate FORMA GRAFA Subject Object <rdf:Descriptionrdf:about="subject"> <ex:predicate> <rdf:Descriptionrdf:about="object"/> </ex:predicate> </rdf:Description> Uređena trojka subject predicate object RDF/XML Relaciona forma predicate(subject, object) FORMA “Turtle” subject ex:predicate object.
RDF koristi sljedeće osnovne koncepte Grafički model podataka, Riječnik baziran na URI, LITERALE, XML sintaksu (XML Serialization Syntax) PREDSTAVLJANJE JEDNOSTAVNIH ČINJENICA, SEMANTIČKE VEZE IMEĐU IZRAZA,
Formalna apstrakcijaputemkoje se realni svijet preslikava u bazupodataka. MODELI PODATAKA Specifičneteorijepomoćukojih se vršispecifikacijaiprojektovanje konkretnihbazapodataka iinformacionihsistema. Modelompodataka se, prekoskupapodatakai njihovihveza, prikazujestanjerealnogsistema u jednom određenomtrenutku
1G 2G GENERACIJE MODELA PODATAKA klasičniprogramskijezici, sarelativnojednostavnimtipovimapodatakaisiromašnomsemantikom, ne mogupredstavitirealan sistem. modelikonvencionalnihsistemazaupravljanjebazompodataka: hijerarhijski, mrežniirelacioni, posedujuznatnobogatijusemantiku od1. generacije, isloženijetipovepodataka, ali nepotpunoopisujurealansistem.
3G 4G GENERACIJE MODELA PODATAKA semantičkibogatimodeli – ER (Entity Relationship Attribute), SDM (Semantic Data Model) idrugi, posedujuspecifičnekonceptezadetaljanopisrealnogsistema, sanedostatkom u pogledupotpune softverskerealizacije (CASE alati). objektni model podataka (OOM), nastao je početkom 90-tih godina20. vijeka, kaoimplementacijastrukturapodatakaizobjektno orijentisanihprogramskihjezika (C++, SmallTalk) u sistemeza upravljanjebazamapodatak, uoblastiinženjerskogprojektovanja(CAD sistemi), ilikaoimplementacijaugnježdenihtabela u okviru klasičnogrelacionogmodelapodataka.
Entity Relationship Atribute Data model semantički bogat model treće generacije. Posjeduje specifične koncepte za detaljan opis realnog svijeta ER MODEL PODATAKA
Model entitetapoveznika (Entity Relationship Data Model) (ili model objekti-veze MOV)se baziranaosnovnojideji da se realansvijetinjegovidijeloviopisuju pomoćudvaosnovnakoncepta: entitetai poveznika. Eniteti se mogu klasifikovati u skupove sličnih entiteta. Entitet je apstraktna predstava nekog objekta. To je osnovna jedinica posmatranja u nekom sistemu. Entitet je nešto što se može jednoznačno identifikovati.
ER model ER dijagram sadrži tri tipa komponenti: Entiteta(objekte) Veze Atribute Skupovisličnihentitetanazivaju se klasamaentiteta,gdje svientitetijedneklase poseduju bar jednuzajedničkuosobinu, naosnovukojesusvrstani u istuklasu. Brojzajedničkihosobinajedneklase je uglavnomvećiodjedan, a nazivaju se obelježjimaili atributima.
Skupsvihmogućihvrijednostikoje to obelježjemožeimati. Domenobilježja A označava se sadom(A). Domen obilježja Nazivtipaentitetatrebadaodražavasemantikuismisaoapstraktnogopisaklaseentitetaizrealnogsveta Tip entiteta Modelklaseentiteta. Svaki tip entitetamorabitiopisansvojimimenomiatributima. Skupentitetakojiimajuista obilježja.
Osnovni elementi ER dijagrama entitet atribut poveznik (veza) slabi entitet gerund (glagolskaimenica)
Atribut Karakteristika (svojstvo) koje bliže opisuje entitet. Može dobiti vrijednost iz određenog skupa vrijednosti koji predstavlja domen atributa (tip vrijednostiatributa). Atribut ili skup atributa koji jednoznačno određuje svaku pojavu tipa entiteta se naziva primarniključ tipa entiteta
Atribut Grafički prikaz - elipsa unutar koje je upisan naziv atributa • Ključni atibuti se podvlače Naziv Veličina Ime Cijena JMBG
Poveznik (veza) • Odnos ili veza između pojava jednog ili više tipova entiteta koji je od značaja za informacioni sistem • Veza kazuje da se pojavio događaj ili da postoji prirodna veza između tipova entiteta • Definicija treba da objasni prirodu veze i zašto je važna
Stepen veze BINARNA TERNARNA REFLEKSIVNA (REKURZIVNA)
Paralelena veza Među entitetima može postojati paralelna veza Onamože biti dvostruka, trostruka, itd.
Ključ (jedinstveni identifikator) • Svaki tip entiteta mora imati neki atribut ili skup atributa naosnovukoga razlikujemosvakupojedinačnu pojavu tog tipa entiteta • Atribut (iliskupatributa) koji jedinstveno identifikuju svaku pojedinačnu pojavu tipa entiteta Definicija ključa Odabrati atribut koji neće mijenjati svoju vrijednost Pravila za izbor ključa Odabrati atribut koju nikad neće imati null vrijednost
Kardinalitet veze • MINIMALNI kardinalitet: Minimalni broj pojava entiteta • B koji mogu biti povezani sa svakom pojavom entiteta A Broj pojava entiteta B koji mogu biti povezani sa svakom pojavom entiteta A Kardinalitet veze - opisuje ograničenja preslikavanja pojedinačnih entiteta koji učestvuju u posmatranoj vezi. • MAKSIMALNI kardinalitet: Maksimalni broj pojava pojava entiteta B koji mogu biti povezani sa svakom pojavom entiteta A. M:N 1:1 1:N Moguće je da u nekoj vezi pojedine instance nekog entiteta ne učestvuju (1:0,0:N)
Primjeri • Kardinalitet tipa 1:1 (1,1) (1,1) Radnik je Osiguranik
Primjeri (1,1) (1,N) • Kardinalitet tipa 1:N Radnik Raspoređen Radno mesto
Primjeri (1,M) (1,N) • Kardinalitet tipa M:N Radnik Radi Projekat
Ovako modifikovani model je nazvanEER (Enhanced Entity Relationship Data Model) ER model podatakaje, zbogkoncepatakojinisu u potpunostimoglikvalitetnodapredstave osobinerealnihposlovnihsistema, proširenkonceptimakaoštosu: generalizacija/specijalizacija, gerund, kategorija, jaki slab tip entiteta Najpoznatijisu: OracleCase, BPWin/ERWin, Sybase Power Designer i dr. Uprethodnih20-ak godina se pojavioznatanbroj softvera (Computer Aided SoftwareEngineering- CASE alata) kojiomogućujubržiproceslogičkogifizičkogprojektovanja modelabazepodataka.
Apstrakcija podataka Specijalizacijaigeneralizacijasupostupcikojim se definišuosobineskupovasličnih entitetagdje se zajednička obilježjagrupišu u superklasu, a specifičnaobeležja, shodno različitimulogamaentiteta u odgovarajućepotklase. Vezaizmeđu superklaseipotklasa označavamo nadijagramusa IS_A simbolomu okvirupoveznika, Pri entitetukoji je superklasa navodise klasifikacionoobeležje. • Proces kreiranja nekoliko entiteta (specijaliziranih podklasa) iz jednog entiteta • Proces kreiranja jednog opšteg entiteta (generalne superklase) iz nekoliko srodnih entiteta Pod sličnim tipovima objekata ovdje se mogu tretirati tipovi objekata koji imaju jedan broj istih (zajedničkih) atributa, tipova veza sa drugim objektima i operacija.
Kardinalitet IS_A hijerarhije Preslikavanje može biti • Ako svakoj pojavi nadkase odgovara bar jedna pojava podklase. • Minimalni kardinalitet je 1 Totalno • Ako bar jednoj pojavi nadkase ne odgovara nijedna pojava podklase. • Minimalni kardinalitet je nula. Parcijalno • Ako je svakoj pojavi nadklase pridružena pojava iz najviše jedne podklase. • Maksimalni kardinalitet je jedan. Disjunktno • Ako je bar jednoj pojavi nadklase odgovaraju pojave iz više od jedne podklase. • Maksimalni kardinalitet je N. Prosječno
Stanovnik totalno (1,1) disjunktno IS_A (1,1) (1,1) (1,1) Zaposlen Nezaposlen Penzioner Nezaposlen (0,N) parcijalno IS_A prosječno Dete Učenik Student Invalid
Gerund Gerund iliglagolskaimenica je tip entitetadobijentransformacijomtipapoveznika, uciljupovećanjasemantikemodela. Radnik osposobljen Mašina Zovese još iagregacija, tj. mešovitiobjekat- vezaislužiprevazilaženjuproblema u slučajuda je potrebnopovezatidvapoveznikakoji se, premaautorimamodela, ne mogudirektnopovezati. može_ proizvesti proizvodi Potrebna nam je veza proizvodi Dio
PRVENSTVENA NAMJENA JE STANDARDIZACIJA STRUKTURE I SADRŽAJA DOKUMENATA OPISUJE PODATKE ALI NIŠTA NE GOVORI O NAČINU PRIKAZIVANJA TIH PODATAKA, DOK HTML PRVENSTVENO OPISUJE NAČIN PRIKAZIVANJA PODATAKA JEZIK ZA OZNAČAVANJE STRUKTURE DOKUMENTA UNUTAR NJEGOVOG SADRŽAJA DOZVOLJAVA OPISIVANJE INDIVIDUALNIH DEFINICIJA TIPOVA DOKUMENATA (DTD ili XML Schema) EFIKASAN I FLEKSIBILAN JEZIK ZASNOVAN NA SGML-u (Standard Generalized Markup Lanuage) XML -eXtensible Markup Language Može da posluži i kao “model posrednik” za transformaciju jednog modela podataka u drugi POSEBNO JE ZNAČAJAN KAO “SEMISTRUKTURALNI MODEL” PODATAKA KOJI SE KORISTI U INTEGRACIJI BAZA PODATAKA I ZA NJIHOVO POVEZIVANJE SA DRUGIM IZVORIMA INFORMACIJA DOSTUPNIM PREKO INTERNETA
Automatsko rezonovanje Ovi programi se koriste za rješavanje problema u oblastima kao što su Sistemiautomatskogrezonovanjasuračunarskiprogramikojiposedujuodređene komponenteinteligentnogponašanjaikoji se moguprimenjivatikaoljuskeekspertnih sistema, dijaloškisistemi, prevodiociprirodnihjezika, obrazovniračunarskisoftveri, informacionisistemii dr. Izvođenjezaključka u ovakvimsistemimanajčešće se bazira narezolucijskojmetodiopovrgavanja, tj. negiranjutvrđenjakoji se dokazuje u sistemu zaautomatskodokazivanjeteorema(ADT) iizvođenjuzaključkaizodređenogskupa pravilaičinjenica Automatskorezonovanje je jednaodosnovnihoblastiveštačkeinteligencije. Sistemi bazirani na znanju Ekspertni sistemi Korektnost programa Upitni jezici nad relacionim bazama podataka Projektovanje elektronskih kola Generisanje programa
Predikatski račun prvog reda U predikatskomračunuprvogreda sekoristesljedećiprimitivnisimboli: kvantifikatori: univerzalni (∀) iegzistencijalni (∃) simbolizakonstante (a, b, c, ...), funkcije (f, g, h, ...), promenljive (u, v, w, x, y, z, ...) ipredikate (P, Q, R, ...), logičkiveznici: negacija ( ), konjukcija (⋀), disjunkcija (⋁), implikacija (⇒) i ekvivalencija (⇔).