1 / 14

On the integration of Large Data Banks by a Powerful Cataloguing Method

Adatb ázisok oktatási labor. Knowledge and Database Management. On the integration of Large Data Banks by a Powerful Cataloguing Method. Kardkovács Zsolt – Surányi Gábor – dr. Gajdos Sándor. Nagy adattárak integrációjának nyomában egy hatékony katalogizáló eljárással.

edward
Download Presentation

On the integration of Large Data Banks by a Powerful Cataloguing Method

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Adatbázisok oktatási labor Knowledge and Database Management On the integration of Large Data Banks by a Powerful Cataloguing Method Kardkovács Zsolt – Surányi Gábor – dr. Gajdos Sándor Nagy adattárak integrációjának nyomában egy hatékony katalogizáló eljárással Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék

  2. Miről lesz szó? • A probléma környezete – megoldandó feladatok • A megoldás ötlete – elméleti alapok • A megoldás finomítása • Katalogizáló eljárás megvalósítása • Katalogizáló eljárás alapműveleteiről • Tapasztalatok Neumann János emlékkonfencia

  3. Hová forduljak? • Hová fordulhatok, ha… • egy izgalmas tudományos–fantasztikus könyvet keresek? • utazni szeretnénk egy nyugalmas, festői vidékre? • a betegségemre a leghatékonyabb gyógykezelést akarom? • szeretném megállapítani, mire képesek az egyes gének? • a legmegfelelőbb személyt akarom kiválasztani a munkára? • … és … • az információt rejtő adatbázisok rendelkezésre állnak • nincs sok időm, hogy megtaláljam a választ • nem akarok drága szakembereket fizetni ilyen információért • én akarok dönteni Neumann János emlékkonfencia

  4. Hogyan szolgálhatnám ki a felhasználót? • Hogyan találom meg a helyes választ, ha bár… • rendelkezem ugyan a megfelelő adatokkal • rendelkezésre áll az ismeretanyag, amiből megválaszolható kérdés • tudom, hogy kell a különböző attribútumokat megfeleltetni • az adatbázisok adatai „tiszták” • …de nem tudom, hogy… • lekérdezhető–e (hogyan?) a jól ismert lekérdezőnyelveken • hogyan integrálhatóak a különböző adatbázisok • hogyan igazolható a relációkon belüli fogalmak azonossága • két tulajdonság (kijelentés) közül melyik az erősebb • milyen módszerekkel gyorsíthatom a keresést Neumann János emlékkonfencia

  5. Rendezzük az adatokat! Elég, ha0NF (NFNF) sémákban gondolkodunk! Pl. R = ( könyvszerző, könyvcím ) r ( {Neumann János, Oskar Morgenstern} , {Theory of Games and Economic Behaviour} ) NULL értékeknek az üres halmaz felel meg! (NULL = NULL?) Helyettesíthetőség: Definiáljuk az mattribútum elemein értelmezett  előrendezési relációt! Pl. legyen a jól ismert  reláció és m= könyvszerző {Neumann János}   / könyvszerző {Neumann János, Oskar Morgenstern} Neumann János emlékkonfencia

  6. Rendezzük az összetett adatokat! Fedés: Terjesszük ki a helyettesíthetőséget attribútumok egy Mhalmazára! Pl. 1legyen a jól ismert  reláció és m1= könyvszerző 2legyen az alfabetikus rendezés és m2= könyvcím M= {m1, m2}  = { 1, 2 } r1: ( { Neumann János, Oskar Morgenstern }, { Theory of Game and Economic Behavior } ) r2: ( { Neumann János }, { The Computer and the Brain } ) Ekkor… r1   / Mr2 Neumann János emlékkonfencia

  7. Vizsgáljuk meg a rendezést! Helyettesíthetőség: Kiterjeszthetjük–e származtatott attribútumokra is? f : X1, X2, …, Xn YP( X1, X2, …, Xn, Y ) Bernays – Schönfinkel – Ramsey osztály (adott struktúrán): X1 X2 …Xn Y1 Y2 P1( X1, X2, …, Y1)  P2( X1, X2, …, Y2)  ( Y1, Y2 ) Fedés: Viselkedése hasonlít az objektumorientált specializációra Neumann János emlékkonfencia

  8. Építsünk katalógust! Építsünk gráfot az mattribútum helyettesíthetősége alapján! V = { reláció elemei } E = { egy csúcsból mutat él egy v csúcsba, ha m attribútumban a csúcs helyettesíthető v-vel } Építsünk gráfot az Mattribútum halmaz fedése alapján! E = { egy csúcsból mutat él egy v csúcsba, ha M attribútum halmazon v fedi a csúcsot } Észrevétel: Az erősen összefüggő komponensek klikkeket alkotnak. V = { reláció klikkjei } E = { egy csúcsból mutat él egy v csúcsba, ha a klikk egy csúcsából mutat él a v klikk egy csúcsába és nincs olyan u klikk, amelyen át v a csúcsból elérhető } Neumann János emlékkonfencia

  9. Keressünk értéket a gráfban! Algoritmus: 1. Induljunk a gyökér elemből (legyen ez a NULL elem) 2. Keresési kulcs egy elemével vizsgáljuk meg a csúcsot! 3. Az elem mentén haladjunk az irányítás mentés a gráfban addig, míg a fedés teljesül vagy véget nem ér a gráf! 4. Létezik–e másik eleme a kulcsnak? 5.a. Ha igen, akkor vedd a kulcs újabb elemét 5.b. Menj a 2-es pontra 6.a. Ha véget ért a gráf, akkor nincs ilyen elem 6.b. Egyéb esetben a keresett elemhez jutottunk Neumann János emlékkonfencia

  10. Keressünk minimum értéket a gráfban! • Keressünk egy dolgozót, aki… • beszél angolul és németül • ért a számítógép–tervezéshez • Legyen tehát: • M = { nyelvtudás, gyakorlat } és • k = { {német, angol}, {számítógép–tervezés} } • Megoldás: • 1. Tegyük fel a csúcs (virtuálisan)létezik a gráfban • 2. A csúcsból induló (esetleg virtuális) utakon elérhető csúcsok • elemei kielégítik a kritériumot Neumann János emlékkonfencia

  11. Keressünk korlátos értéket a gráfban! • Keressük azokat a honvédeket, akik… • csak magyarul beszélnek • és legfeljebb tiszthelyettesi rangban szolgálnak • Legyen tehát: • M = { nyelvtudás, rangfokozat } és • k = { {magyar}, {főtörzsőrmester} } • Megoldás: • 1. Tegyük fel, hogy a csúcs (virtuálisan) létezik a gráfban • 2. A gyökér elem(ek)ből induló (esetleg virtuális) a csúcsba vezető • utakon elérhető csúcsok elemei kielégítik a kritériumot Neumann János emlékkonfencia

  12. Keressünk hasonló értéket a gráfban! • Szeretnék egy olyan helyen nyaralni, ahol… • nyugalom van, tengerpart és múzeum • repülővel vagy hajóval megközelíthető • és 250.000Ft érték körül eljuthatok • Legyen tehát: • M = { tulajdonságok, megközelítés, ár } és • k = { {nyugalom, tengerpart, múzeum}, {repülő, hajó}, {250.000} } • Megoldás: • 1. Ha a csúcs létezik a gráfban, akkor ez a tökéletes ajánlat • 2. Ha nem létezik, akkor a virtuális csúcsba belépő és kilépő • éleken közvetlen elérhető ajánlatok a megfelelőek Neumann János emlékkonfencia

  13. Mire jutottunk? • Definiáltunk egy eljárást és módszert, amely… • általában működik az adatbázistípusokra • alkalmas adatbázisok integrált katalogizálására • kiterjeszthető származtatott attribútumokra • számítható • támogatja • a felső– és alsókorlátos keresést • a hasonlósági mértékek létrehozását • a hasonlósági keresést • lehetővé teszi a webszolgáltatások működtetését Neumann János emlékkonfencia

  14. Van kérdésük? Köszönöm a megtisztelő figyelmüket! Kérem, tegyék fel a katalogizáló eljárással kapcsolatos kérdéseiket! Neumann János emlékkonfencia

More Related