140 likes | 294 Views
Adatb ázisok oktatási labor. Knowledge and Database Management. On the integration of Large Data Banks by a Powerful Cataloguing Method. Kardkovács Zsolt – Surányi Gábor – dr. Gajdos Sándor. Nagy adattárak integrációjának nyomában egy hatékony katalogizáló eljárással.
E N D
Adatbázisok oktatási labor Knowledge and Database Management On the integration of Large Data Banks by a Powerful Cataloguing Method Kardkovács Zsolt – Surányi Gábor – dr. Gajdos Sándor Nagy adattárak integrációjának nyomában egy hatékony katalogizáló eljárással Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék
Miről lesz szó? • A probléma környezete – megoldandó feladatok • A megoldás ötlete – elméleti alapok • A megoldás finomítása • Katalogizáló eljárás megvalósítása • Katalogizáló eljárás alapműveleteiről • Tapasztalatok Neumann János emlékkonfencia
Hová forduljak? • Hová fordulhatok, ha… • egy izgalmas tudományos–fantasztikus könyvet keresek? • utazni szeretnénk egy nyugalmas, festői vidékre? • a betegségemre a leghatékonyabb gyógykezelést akarom? • szeretném megállapítani, mire képesek az egyes gének? • a legmegfelelőbb személyt akarom kiválasztani a munkára? • … és … • az információt rejtő adatbázisok rendelkezésre állnak • nincs sok időm, hogy megtaláljam a választ • nem akarok drága szakembereket fizetni ilyen információért • én akarok dönteni Neumann János emlékkonfencia
Hogyan szolgálhatnám ki a felhasználót? • Hogyan találom meg a helyes választ, ha bár… • rendelkezem ugyan a megfelelő adatokkal • rendelkezésre áll az ismeretanyag, amiből megválaszolható kérdés • tudom, hogy kell a különböző attribútumokat megfeleltetni • az adatbázisok adatai „tiszták” • …de nem tudom, hogy… • lekérdezhető–e (hogyan?) a jól ismert lekérdezőnyelveken • hogyan integrálhatóak a különböző adatbázisok • hogyan igazolható a relációkon belüli fogalmak azonossága • két tulajdonság (kijelentés) közül melyik az erősebb • milyen módszerekkel gyorsíthatom a keresést Neumann János emlékkonfencia
Rendezzük az adatokat! Elég, ha0NF (NFNF) sémákban gondolkodunk! Pl. R = ( könyvszerző, könyvcím ) r ( {Neumann János, Oskar Morgenstern} , {Theory of Games and Economic Behaviour} ) NULL értékeknek az üres halmaz felel meg! (NULL = NULL?) Helyettesíthetőség: Definiáljuk az mattribútum elemein értelmezett előrendezési relációt! Pl. legyen a jól ismert reláció és m= könyvszerző {Neumann János} / könyvszerző {Neumann János, Oskar Morgenstern} Neumann János emlékkonfencia
Rendezzük az összetett adatokat! Fedés: Terjesszük ki a helyettesíthetőséget attribútumok egy Mhalmazára! Pl. 1legyen a jól ismert reláció és m1= könyvszerző 2legyen az alfabetikus rendezés és m2= könyvcím M= {m1, m2} = { 1, 2 } r1: ( { Neumann János, Oskar Morgenstern }, { Theory of Game and Economic Behavior } ) r2: ( { Neumann János }, { The Computer and the Brain } ) Ekkor… r1 / Mr2 Neumann János emlékkonfencia
Vizsgáljuk meg a rendezést! Helyettesíthetőség: Kiterjeszthetjük–e származtatott attribútumokra is? f : X1, X2, …, Xn YP( X1, X2, …, Xn, Y ) Bernays – Schönfinkel – Ramsey osztály (adott struktúrán): X1 X2 …Xn Y1 Y2 P1( X1, X2, …, Y1) P2( X1, X2, …, Y2) ( Y1, Y2 ) Fedés: Viselkedése hasonlít az objektumorientált specializációra Neumann János emlékkonfencia
Építsünk katalógust! Építsünk gráfot az mattribútum helyettesíthetősége alapján! V = { reláció elemei } E = { egy csúcsból mutat él egy v csúcsba, ha m attribútumban a csúcs helyettesíthető v-vel } Építsünk gráfot az Mattribútum halmaz fedése alapján! E = { egy csúcsból mutat él egy v csúcsba, ha M attribútum halmazon v fedi a csúcsot } Észrevétel: Az erősen összefüggő komponensek klikkeket alkotnak. V = { reláció klikkjei } E = { egy csúcsból mutat él egy v csúcsba, ha a klikk egy csúcsából mutat él a v klikk egy csúcsába és nincs olyan u klikk, amelyen át v a csúcsból elérhető } Neumann János emlékkonfencia
Keressünk értéket a gráfban! Algoritmus: 1. Induljunk a gyökér elemből (legyen ez a NULL elem) 2. Keresési kulcs egy elemével vizsgáljuk meg a csúcsot! 3. Az elem mentén haladjunk az irányítás mentés a gráfban addig, míg a fedés teljesül vagy véget nem ér a gráf! 4. Létezik–e másik eleme a kulcsnak? 5.a. Ha igen, akkor vedd a kulcs újabb elemét 5.b. Menj a 2-es pontra 6.a. Ha véget ért a gráf, akkor nincs ilyen elem 6.b. Egyéb esetben a keresett elemhez jutottunk Neumann János emlékkonfencia
Keressünk minimum értéket a gráfban! • Keressünk egy dolgozót, aki… • beszél angolul és németül • ért a számítógép–tervezéshez • Legyen tehát: • M = { nyelvtudás, gyakorlat } és • k = { {német, angol}, {számítógép–tervezés} } • Megoldás: • 1. Tegyük fel a csúcs (virtuálisan)létezik a gráfban • 2. A csúcsból induló (esetleg virtuális) utakon elérhető csúcsok • elemei kielégítik a kritériumot Neumann János emlékkonfencia
Keressünk korlátos értéket a gráfban! • Keressük azokat a honvédeket, akik… • csak magyarul beszélnek • és legfeljebb tiszthelyettesi rangban szolgálnak • Legyen tehát: • M = { nyelvtudás, rangfokozat } és • k = { {magyar}, {főtörzsőrmester} } • Megoldás: • 1. Tegyük fel, hogy a csúcs (virtuálisan) létezik a gráfban • 2. A gyökér elem(ek)ből induló (esetleg virtuális) a csúcsba vezető • utakon elérhető csúcsok elemei kielégítik a kritériumot Neumann János emlékkonfencia
Keressünk hasonló értéket a gráfban! • Szeretnék egy olyan helyen nyaralni, ahol… • nyugalom van, tengerpart és múzeum • repülővel vagy hajóval megközelíthető • és 250.000Ft érték körül eljuthatok • Legyen tehát: • M = { tulajdonságok, megközelítés, ár } és • k = { {nyugalom, tengerpart, múzeum}, {repülő, hajó}, {250.000} } • Megoldás: • 1. Ha a csúcs létezik a gráfban, akkor ez a tökéletes ajánlat • 2. Ha nem létezik, akkor a virtuális csúcsba belépő és kilépő • éleken közvetlen elérhető ajánlatok a megfelelőek Neumann János emlékkonfencia
Mire jutottunk? • Definiáltunk egy eljárást és módszert, amely… • általában működik az adatbázistípusokra • alkalmas adatbázisok integrált katalogizálására • kiterjeszthető származtatott attribútumokra • számítható • támogatja • a felső– és alsókorlátos keresést • a hasonlósági mértékek létrehozását • a hasonlósági keresést • lehetővé teszi a webszolgáltatások működtetését Neumann János emlékkonfencia
Van kérdésük? Köszönöm a megtisztelő figyelmüket! Kérem, tegyék fel a katalogizáló eljárással kapcsolatos kérdéseiket! Neumann János emlékkonfencia