1 / 56

Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben

Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben. Tóth Máté Toth.Mate@feek.pte.hu. Mai menetrend. A tématérkép adatmodell Az ISO/IEC 13250 szabványcsalád részei A tématérkép szintaxisok Tématérképek szerkesztése LTM-ben. Tématípusok.

hallie
Download Presentation

Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TématérképekA tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté Toth.Mate@feek.pte.hu

  2. Mai menetrend • A tématérkép adatmodell • Az ISO/IEC 13250 szabványcsalád részei • A tématérkép szintaxisok • Tématérképek szerkesztése LTM-ben

  3. Tématípusok A tématípusok dolgok egy osztályát definiálja. Ha egy fogalomhoz nem rendelhetők konkrét esetek, akkor a fogalom nem tekinthető tématípusnak. Az "irodalom" lehet-e tématípus? És az "irodalmi mű" Amikor tématípushoz konkrét esetet rendelünk, akkor állítást fogalmazunk meg, amely a tématípus és a hozzá rendelhető konkrét eset közötti relációt írja le. Pl. a következő állítást formalizáljuk: „A gólyakalifa egy irodalmi mű.” (The nightmare is a literary work.)

  4. Tématípusok Puskás Öcsi is a football player Football player is a person. VAGY Buksi is a dog; Dog is an animal; VAGY The National Széchényi Library is a library; Library is a public institution. ? „IS A”

  5. Tématípusok IS A relációk és a generikus hierarchialáncok 1. Puskás öcsi Puskás öcsi egy futball játékos A futball játékos egy személy Akkor ebből az következik, hogy Puskás öcsi egy személy 2. Buksi Buksi egy kutya; A kutya egy állat; Tehát Buksi egy állat. 3. OSZK Az OSZK egy könyvtár; A könyvtár egy közintézmény; Az OSZK egy közintézmény.

  6. Tématípusok Kanada miniszterelnöke egy homo sapiens. A homo sapiens egy emlős. Tehát: Kanada miniszterelnöke egy emlős? Ez az AKO reláció, vagyis „a kind of” azaz „A homo sapiens egy fajta emlős…” (Az emlősök egy fajtája.)

  7. Tématípusok ország (pl. Magyarország) megye (pl. Baranya) város (pl. Pécs) Tehát: Pécs egy megye? Baranya egy ország? Ezek a partitív relációk Helyesen: hely ország megye város

  8. Melyik generikus hierarchialánc?

  9. Tématípusok FORMAI KÖVETELMÉNYEK A tématípus legyen kellően általános (az ország jobb tématípus, mint például az európai ország, mert általánosabb fogalomra utal. Igaz ez akkor is, ha ebből az következik, hogy valamennyi európai ország esetében definiálnunk kell egy újabb asszociációt, miszerint Európában található.) Ne legyen nagyon általános sem, mert zavarhatja a megértést. (Az ország tehát jobb, mint a hely, amely képes lenne összemosni a városokat, kontinenseket és az országokat). A tématípus neve legyen rövid a könnyű kezelhetőség, megjeleníthetőség kedvéért. Minden tématípus legyen egyes számban (a tématípus tehát ország és nem országok)

  10. Szereptípusok Témák közötti kapcsolatokat írhatunk le asszociációkkal. Az asszociációk szerepek között értelmeződnek. Pl. István király az ország szempontjából: király az egyház szempontjából: szent Szent Imre szempontjából: édesapa Koppány szempontjából: ellenfél Géza fejedelem szempontjából: fiú SZEREPEK

  11. király ellenfél édesapa szent fiú KOPPÁNY VEZÉR MAGYARORSZÁG IMRE HERCEG GÉZA FEJEDELEM R. KAT. EGYHÁZ

  12. Szereptípusok Egy téma akármennyi szerepet felvehet Van amikor a tématípus megegyezik a szereptípussal. Pl. I. István egy király, I. István királyként van viszonyban Magyarországgal (a téma- és a szereptípus egyaránt király); Gera Zoltán egy futballista, futballistaként tagja a Fulham csapatának (persze mondhatjuk azt is, hogy az alkalmazottja)

  13. Asszociációtípusok Két azonos szerep között szimmetrikus asszociáció pl. Kosztolányi barátja Karinthynak, Karinthy barátja Kosztolányinak Bináris asszociáció: két különböző szerep között Kosztolányi férjként viszonyul Harmos Ilonához, aki feleségként viszonyul hozzá) Három- vagy többértékű reláció: Több szereplő vesz részt az asszociációban. Ki ölt meg kit, mivel? (elkövető, áldozat, elkövetés módja)

  14. Asszociációtípusok Kerüljük a redundanciát! Pl. Géza fejedelem fia István király, István király fia Imre herceg, Géza fejedelem unokája Imre herceg Így a tématérképünk is átláthatóbb marad. Nehezebben kerülünk ellentmondásba saját magunkkal. GÉZA FIA UNOKÁJA ISTVÁN FIA IMRE

  15. Névtípusok A tématérképek a dolgokat több néven is képesek kezelni! Pl. Dr. Tanner Béla (főorvos) édesanyjának Bélus; kollégáknak: Béla; szomszéd kisfiúnak: Béla bá; betegeknek: Tanner főorvos úr; stb. Pl. A gólyakalifa The nightmare (angol) Il califo della cicogna (olasz) Kitüntetett névalak Névvariánsok

  16. Névtípusok és scope Az egyes névalakok, szerepek csak bizonyos szövegkörnyezetben, beszédmódban értelmezhetők. Pl. The nightmare (érvényes: angol szövegkörnyezetben) Bélus (érvényes: informális közegben), Dr. Tanner Béla (hivatalos névalak) Csak a tématérképek képesek ezt kezelni; Mindig kell egy kitüntetett névalak! Mindennek van kontextusa (ha más nem, akkor a nyelv)

  17. Scope Az érvényességi tartomány az asszociációk irányát is meghatározza. Az asszociációk kétirányúsága szintén tématérképes specialitás (Ilyet már az LTM tématérképünkben is láttunk) Scope. Akkor érvényes a kijelentés, ha ebben az irányban olvassuk... zenekara Lovasi András Kispál és a borz frontembere

  18. Előfordulások A belső előfordulások (internal occurences) olyan rövid adatok, tulajdonságok, amelyek a tématérképen belül könnyen elhelyezhetők, begépelhetők a megfelelő helyre. Pl. Babitsnál és Kosztolányinál a születési és halálozási évszám feltüntetése. Külső előfordulásként (external occurences) a weben máshol található dokumentumok szerepelhetnek URL cím megadásával (pl. egy regény teljes szövegének hozzáférhetősége).

  19. Külső előfordulások • A tématérképek kiindulása volt, hogy a kibertérben lévő információkat elérhetővé tegyék. (tárgymutató) • A külső előfordulások külső hivatkozások. • Előfordulás – hol fordulnak elő információk az adott téma kapcsán. • Online és offline forrásokra is lehet hivatkozni: • Könyvekre; • Újságcikkekre; • Honlapokra; • Lényegében a PSI egy speciális külső előfordulás, amely az adott téma egyértelműsítését szolgálja.

  20. Külső előfordulások T T T T T

  21. Belső előfordulások A tématérképen belül elhelyezkedő rövid feljegyzések. Pl. évszámok (Babits Mihály 1883-1941) Adatok (Mount Everest 8848 m) Tulajdonságok (Gordon „Ő a leggyorsabb a szigeten.”) Rövid definíció (Kisvakond „Zdenek Miler népszerű mesefigurája, a hasonló című cseh rajzfilm főhőse.” Stb. A belső előfordulások mentén nem jönnek létre tripletek, így ezek nem kereshetők!

  22. Téma vagy előfordulás Soproni Kékfrankos színe VÖRÖS színe Egri Bikavér Egri Bikavér Soproni Kékfrankos Belső előfordulás „VÖRÖS” Belső előfordulás „VÖRÖS” Melyik megoldás a helyes? Azt szeretnénk kifejezni, hogy az Egri Bikavér színe vörös. két téma közötti asszociáció, vagy előfordulás?

  23. Ontológiavezérelt tématérkép-szerkesztés • Először az ontológiát kell elkészíteni; • Definiálni a téma-, asszociáció-, előfordulás-, név- és szereptípusokat; • Ezek lényegében az ontológai szintű megfelelői a tématérképek elemeinek; • Az ontológiában meg kell adnunk a számszerűségi jellemzőket; • A potenciális kapcsolatokat az egyes elemek között. • „Benépesítés” • Az egyes típusokhoz konkrét eseteket rendelünk. • Iterativitás • A benépesítés során szokott kiderülni, hogy mi nem jó az ontológiában, ezért állandóan vissza kell oda térni;

  24. A tématérkép szabványcsalád • A jelenleg elérhető hivatalos szabványok a következők: • ISO/IEC 13250:2003 SGML applications – Topic maps (SGML alkalmazások); • ISO/IEC 13250-2:2006 Topic Maps – Data model (adatmodell); • ISO/IEC 13250-3:2007 Topic Maps – XTM Syntax (XTM szintakszis); • ISO/IEC 13250-4:2009 Topic Maps – Canonicalization (kanonizálás).

  25. A tématérkép szabványcsalád • A szabványosításért felelős munkacsoport a fentieken túl a következő tématérkép szabványokon dolgozik jelenleg: • ISO/IEC 13250-5 TopicMapsReferenceModel (referencia modell); • ISO/IEC 13250-6 CTM (kompakt leíró nyelv); • ISO/IEC 13250-7 GTM (grafikus leíró nyelv); • ISO/IEC 18048 TopicMapsQueryLanguage (lekérdező nyelv); • ISO/IEC 19756 TopicMapsConstraintLanguage (specifikációs nyelv).

  26. A tématérkép adatmodell • A tématérképek sokféleképpen megjeleníthetőek: • tématérkép szintakszisokat használva fájlokban, • adatbázisokban, • futó programok belső adatszerkezeteiként, • és mentálisan az emberi gondolkodásban is. • Ezek a formátumok ugyanannak az absztrakt szerkezetnek a megjelenítésére szolgálnak. • Az ISO/IEC 13250-2 ezt a szerkezetet határozza meg egy adatmodell formájában.

  27. A tématérkép adatmodell • Az adatmodell meghatározza • a Tématérképek absztrakt szerkezetét, az információs készlet formalizálásával és szöveges formában bizonyos mértékig az értelmezésüket is. • a Tématérképek összeolvasztásának szabályait, • néhány alapvető tárgyazonosítót. • Az adatmodell célja, • hogy meghatározza a Tématérképek csereszabványos szintakszisának értelmezését • és hogy alapul szolgáljon a kanonizálást, lekérdezést, korlátozásokat stb. meghatározó további szabványokhoz.

  28. A tématérkép adatmodell • Az adatmodell szabad teret enged a dolgok reprezentálásának. • Két speciális relációtípust definiál: • Típus-eset kapcsolat • Szupertípus-altípus kapcsolat

  29. A tématérkép adatmodell • A típus-eset kapcsolat. (homo sapiens – Kanada miniszterelnöke) • A tématípus olyan tárgy, amely egy tárgykészlet tagjaiban lévő azonosságokat tömörít. • Bármely tárgy, amely egy adott tématípus kiterjesztéséhez tartozik, annak a tématípusnak az esete. • Egy tématípus lehet egy másik tématípus esete. • Nincs korlátozás, hogy egy tárgy hány tématípusnak lehet az esete. • A típus-eset kapcsolat nem tranzitív. Azaz, ha B az A típus esete, és C a B típus esete, ebből nem következik, hogy C esete A-nak. (A – emlős; B – homo sapiens; C – Kanada miniszterelnöke)

  30. A tématérkép adatmodell • A szupertípus-altípus kapcsolat • Egy általánosabb típus (a szupertípus) és ennek a specifikusabb változata (az altípus) közötti kapcsolat. • Ha B altípusa A-nak, ebből az következik, hogy B minden esete A-nak is esete. • Ennek fordítottja nem feltétlenül igaz. • Egy típusnak akármennyi altípusa és szupertípusa lehet. • A szupertípus-altípus kapcsolat tranzitív, ami azt jelenti, hogy ha B altípusa A-nak, és C altípusa B-nek, akkor C altípusa A-nak is. (pl. A – élőlény; B – állat; C – kutya) • Generikus hierarchialánc

  31. A tématérkép szintaxisok • HyTM (HyTime Topic Maps) • A tématérképek számára eredetileg kifejlesztett szintaxis • Nem része a legújabb ISO szabványnak. • A tématérképek történetének kezdeti szakaszában ez volt az egyetlen szintakszis. • Az alapjául szolgáló HyTime nyelvet eredetileg az SMDL-lel (Standard Music Description Language) együtt kezdték el fejleszteni az 1980-as évek végén. • Arra keresték a választ, hogy miként lehetne zenei utalásokat hiperlinkekkel reprezentálni.

  32. A tématérkép szintaxisok • HyTime • Az első szabvány javaslat 1989-ben született, • 1992. november 1-től az ISO és az IEC közös szabványa lett ISO/IEC 10744 tételszámon. • A HyTM nyelv, hosszú időn keresztül része volt az ISO/IEC 13250 szabványnak.

  33. A tématérkép szintaxisok • A régi tématérkép szabvány fogalmai: • BOS (Bounded Object Set) • Hub document • Sort name és Display name (Variant name) • Topic charachteristic • Topic characteristic assignment • Unconstrained scope • A tématérkép SGML dokumentum.

  34. A tématérkép szintaxisok • Az XTM • XML TopicMaps = XML Tématérképek • XML (eXtensibleMarkupLanguage = Kiterjesztett Jelölőnyelv) alapján tématérképek készítésére kifejlesztett nyelv. • Ez a leggyakrabban használt szintakszis, • A tématérképek nemzetközi csereformátuma.

  35. A tématérkép szintaxisok • XTM 2.0 • A nyelv legújabb verziója, az XTM 2.0, amely az ISO/IEC 13250:2007(E) szabvány szabvány része. • Az 1.0 verzióhoz képest meglévő különbségeket a szabvány D függeléke tartalmazza. (ISO 13250, 2007) • Az XTM alkalmazására manuálisan nincs szükség, így nem okoz problémát annak terjengőssége. • Több tématérkép-szerkesztő program is van forgalomban, amelyekkel készíthetők alkalmazások.

  36. A tématérkép szintaxisok • A CTM (Compact Topic Maps) • szöveg alapú tématérkép-reprezentáló szintaxis. • Az XTM szabvány kiegészítésére fejlesztik. • A nyelv még nem készült el, jelenleg csupán egy munkaverzió érhető el • Alkalmas arra, hogy manuálisan hozzanak létre tématérképeket, hogy dokumentumokban érthető példákat nyújtsanak általuk, és hogy szintaktikai bázisául szolgáljon a TMCL-nek és a TMQL-nek. • Fő szempont a fejlesztés során az egyszerűség, a könnyű írhatóság és olvashatóság.

  37. A tématérkép szintaxisok • GTM (GraphicalNotationforTopicMaps) • Szintén a tématérképek humán interpretációját segíti • vizuális alapon reprezentálja az alkalmazásban leírt viszonyrendszereket. • A fejlesztés előrehaladott állapotban van, mégsincsenek erről átfogó anyagok. • Maguk a fejlesztői is csak szűk körben használják ezt a szintakszist.

  38. A tématérkép szintaxisok

  39. A tématérkép szintaxisok • LTM (The LinearTopic Map Notation) • Tématérképek közvetlen humán létrehozása és értelmezése szempontjából van jelentősége. • Az LTM az oslói székhelyű Ontopia cég által kifejlesztett nyelv, • egyszerű, az XTM-mel szemben sokkal „szűkszavúbb” és hatékonyabb. • Az LTM elsősorban oktatási célokra készült, • A gyakorlati alkalmazás során megérthetők az alapvető fogalmak.

  40. A tématérkép szintaxisok • szöveg-alapú leíró nyelv • alkalmas tématérképek • manuális szerkesztésére, • a tématérkép modell reprezentálására (pl. emailben) • Az Ontopia által készített technikai dokumentáció írja le. • Ebben a jelentésben még nem tartották kizártnak, hogy a nyelv szabvánnyá növi ki magát, • Ugyanilyen céllal elkezdődött a CTM fejlesztése az ISO/IEC keretein belül.

  41. A tématérkép szintaxisok • ISO 18048: TMQL (TopicMapsQuerylanguage) • A tématérkép adatmodellnek megfelelő alkalmazások különböző technológiákkal tárolódnak (relációs adatbázisok, szövegfájlok, XML dokumentumok, tématérkép adatbázisok). • Valamennyi technológia biztosítja a visszakereshetőséget, szükséges volt egy egységes szabványos lekérdező nyelv megalkotása. • A lekérdező nyelv logikája megegyezik a relációs adatbázisok lekérdezésére szolgáló SQL-ével. • A számítógép azt keresi, hogy a hiányzó elem mely asszociációban foglalt állításba helyettesíthető be.

  42. A tématérkép szintaxisok • ISO/IEC 19756 TMCL (TopicMapsConstraintLanguage) • A OWL (Web OntologyLanguage) nyelvvel azonos funkciót lát el • A TMCL-t fejlesztő bizottság legújabb munkaverziója 2009. július 15-én jelent meg. • A szabványként való közzététel hónapokon belül várható.

  43. A tématérkép szintaxisok • A tématérkép szabványosítás nem terjed ki valamennyi a technológiával kapcsolatos kérdésre. (Pl.: PSI) • A tématérkép technológiában a dolgoknak van identitásuk, • Egyértelműen meg kell határozni, hogy amiről egy adott néven állítunk valamit, az pontosan milyen valóságban létező dolognak a reprezentánsa. • Ennek a tématérképek esetében • egyrészt az egybeolvasztáskor (merging), • másrészt a témák, fogalmak humán és gépi interpretációját lehetővé tételében van jelentősége.

  44. A tématérkép szintaxisok • Az OASIS bizottsága öt ajánlást fogalmazott meg a PSI-kre vonatkozóan: • A Publikált tárgyindikátor ember által olvasható metaadatokat kell adjon saját magáról; • A Publikált tárgyindikátor megadhat géppel olvasható metaadatokat saját magáról; • Az első és a második ajánlás metaadatainak következetesnek, de nem feltétlenül azonosnak kell lenni; • A Publikált tárgyindikátornak jeleznie kell, hogy PSI-ként használandó; • Publikált tárgyindikátornak azonosítania kell a publikálóját.

  45. Az Omnigator Tématérkép vizualizáló szoftver, amely az OKS Samplers része; Omnivorous (mindenevő: LTM, XTM, RDF) http://www.ontopia.net (OKS Samplers ingyenes letöltés) Indításhoz: apache-tomcat/bin/startup.bat Majd a böngészőbe beírni, hogy http://localhost:8080/ Szükséges hozzá: JAVA Runtime Environment (JRE) 1.4 JAVA_HOME (Vezérlőpult…) Nézzük meg, hogy mit tud! http://www.ontopia.net/omnigator/models/index.jsp

  46. Az Omnigator A legújabb verzió problémás ügy. Alternatív megoldás: Licensz kulcsot bemásolni: C:\Documents and Settings\UserName\ Innen letölteni egy jó verziót: http://www.topicmaps.com/pepper/oks-enterprise-4.0.4-20081028.zip

  47. Tématérkép-szerkesztés (LTM) Válasszuk ki, hogy miről szeretnénk tématérképet szerkeszteni? Babits és Kosztolányi regényekről; Papíron írjuk le a fogalmakat, amelyekkel dolgozni szeretnénk egyelőre a témákat, asszociációkat és előfordulásokat; Az LTM szintaxis szabályai szerint írjuk le az egyes témákat, asszociációkat és előfordulásokat egy szövegfájlba.

  48. Fogalmak összegyűjtése Témák: regény A gólyakalifa Édes Anna Aranysárkány Halálfiai író Babits Mihály Kosztolányi Dezső város Budapest Szabadka Szekszárd Asszociációk: írta (ki írta az adott regényt?) született (a szerző születési helye) meghalt (a szerző elhalálozásának helye) itt játszódik (a regény) Előfordulások: első megjelenés dátuma (regényé); kép (szerzőről); teljes szöveg (regényé); hivatalos honlap (városé); élt (születés, és elhalálozás dátuma)

More Related