1 / 67

A szemantikus web

A szemantikus web. Tóth Máté Toth.mate@feek.pte.hu. Menetrend. Az LTM tématérképek bemutatása, a házi feladattal kapcsolatos kérdések megbeszélése Az RDF logika URI-k A szemantikus web elképzelés A szemantikus web rétegei Az ontológiák. Emlékeztető: Tématérképek.

Download Presentation

A szemantikus web

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. A szemantikus web Tóth Máté Toth.mate@feek.pte.hu

  2. Menetrend • Az LTM tématérképek bemutatása, a házi feladattal kapcsolatos kérdések megbeszélése • Az RDF logika • URI-k • A szemantikus web elképzelés • A szemantikus web rétegei • Az ontológiák

  3. Emlékeztető: Tématérképek • A tématérkép technológia a tartalomkezelésnek egy olyan formája, amely témák közötti kapcsolatokat (asszociációk) definiál és azokhoz külső erőforrásokat, feljegyzéseket (külső és belső előfordulások) rendel; • A technológiával egy-egy téma környezetét, előfordulásait és asszociációs mezejét lehet feltárni. • Tudástechnológia, szemantikus technológia; • ISO szabványcsalád; • Széles körben használt technológia weben történő tudásreprezentációra;

  4. A szintaktikai paradigma néhány problémája • A dokumentumok közötti asszociációk, azaz a dokumentumok vannak a központban… • Meg kell oldani, hogy a tartalom legyen a központban! • Keresési lehetőségek korlátozottsága - • A tartalom alapján való keresést is lehetővé kell tenni! • A mély web kereshetetlensége; • A mély weben tárolt tartalmakat is kereshetővé kell tenni!

  5. A szintaktikai paradigma néhány problémája • A világháló szintaktikai paradigmájában az információ kódolására használt szabványok csak a szintaxist ragadják meg! • Ezért heurisztikákon alapul a kódolt információ visszakeresése. • A tudásreprezentáció a dokumentumok szintjén próbálta megragadni a tudást. • A tárgyközpontúság forradalma azt jelenti, hogy a fogalmak kerülnek a középpontba.

  6. A szemantikai paradigma • A számítógép számára a szintaktikai paradigmában a dolgoknak nincs jelentése. • A számítógép nem érti, hogy mi micsoda! - el kell neki árulni :) • Ha már tudja, akkor visszakereséskor is érvényesíteni tudja! • A mély weben tárolt tartalmakat is ugyanígy le kell írni!

  7. Szavak helyett mondatok! • Nehéz lenne csak szavakban beszélni… • A szemantika megragadásának kulcsa, hogy a metaadatok mondatok legyenek. • Elmondható-e minden három szavas mondatokban? • Majdnem minden :) „A Mirabeau-híd alatt fut a SzajnaS szerelmeinkEmléke mért zavar maMi volt az öröm ráadás a jajraJöjj el éj az óra verjenSzáll az idő itthagy engem”

  8. oktatója PTE-FEEK hallgatói Agárdi Péter oktatja PTE FEEK, oktatója, Agárdi Péter Agárdi Péter, oktatja, egyetemi hallgatók PTE FEEK, hallgatói, egyetemi hallgatók Egyetemi hallgatók

  9. 1 702 297 fő PTE-FEEK lakosainak száma oktatója hallgatói Agárdi Péter lakhelye Budapest oktatja Egyetemi hallgatók lakhelye Bodrogi Gyula

  10. Az RDF logika • Az RDF = Resource Description Framework, Erőforrás Leíró Keretrendszer • Háromszavas mondatokból, ún. tripletekből áll. • A tripletekkel modellezhetők a világ dolgai; • Az elképzelés szerint több alkalmazás együttesen leírja a világ valamennyi létezőjét.

  11. RDF • Egyrészt egy adatmodell, amelynek elemei: • Erőforrások • Tulajdonságok • Literálok • Kijelentések • Másrészt egy XML alapú szintaxis • amellyel bináris relációk írhatók le, • amellyel a valóság írható le formálisan.

  12. RDF • Az RDF adatmodell szerkezeti építőeleme a hármas (triplet) • Szubjektum vagy alany (subject) • Predikátum vagy állítmány (predicate) • Objektum vagy tárgy (object) • E három együtt adja az állítást

  13. RDF és a tématérképek • Az RDF-fel kifejezhetők tématérképek, igaz adatvesztéssel… • Az Omnigator képes konvertálni a tématérképeket RDF-be. • Az RDF-et nem csak szemantikus web alkalmazásokhoz használják. • Az adatmodellből hiányzik a • scope, • a dolgok különböző neveken való kezelése, • az előfordulások témákhoz rendelése.

  14. RDF vs. adatbázisok Fulham csapata Gera Zoltán szül. éve 1979 Zenit csapata Huszti Szabolcs szül. éve 1983

  15. Üres csomópontok „F” épület épület közterület Budavári Palota ir.szám postacíme H-1827 város OSZK Budapest

  16. RDF vs. adatbázisok • Nem egyszerűbb adatbázisokban leírni a tartalmakat? • De igen, sokkal egyszerűbb! • DE! • interoperabilitás; • adatok számítógépek közötti cseréje; • a strukturálatlan információk kezelésére az adatbázisok kevésbé alkalmasak; • új információt akarunk beilleszteni, aminek nincs oszlopa… • ELLENBEN: • az adatbázisokban tárolt információk teljes mértékben leírhatók RDF-ben

  17. RDF • Az RDF-et úgy tervezték, hogy bármiről lehessen vele állításokat tenni, ami azonosítható a weben. • Az RDF olyan egységes keretet biztosít az információtartalom leírására, amelyben azok átvihetők egyik alkalmazásból a másikba. • Nem csak azok az alkalmazások használhatják az információt, amelyek számára azt eredetileg ábrázolták, hanem a más célokra készült, későbbi alkalmazások is. • Alkalmazások határain átnyúló tudásreprezentáció.

  18. Tárgyak azonosítása • Hogyan biztosítható, hogy a számítógépek és az emberek is ugyanazt értsék a dolgokon? • URI (Universal Resource Identifier) Pl. URL • személy: mailto:thmate@oszk.hu • Cég, szervezet: http://www.ki.oszk.hu • sport: http://hu.wikipedia.org/wiki/Tenisz • város: http://www.budapest.hu • dokumentum: http://nektar • Állításokat is csak URI-k között lehet tenni. • Az URI-kat elsősorban a számítógépek értik. A szemantikus web technológiákat ugyanis gépi visszakeresésre optimalizálták.

  19. Tárgyak azonosítása • Az RDF webes erőforrásokat ír le. • Erőforrás minden, aminek van URI-ja. • Az URI-k literálok (karaktersorozatok), amelyek webes erőforrásokat azonosítanak. • Aminek van URI-ja az „fent van a weben”. • Ha két metaadat-leírás ugyanazt azt URI-t használja, akkor ugyanazt a dolgot azonosítja. (vö. PSI)

  20. Tárgyak azonosítása http://www.budapest.hu http://hu.wikipedia.org/wiki/Tenisz mailto:thmate@oszk.hu

  21. Tárgyak azonosítása http://www.budapest.hu http://hu.wikipedia.org/wiki/Tenisz lakik űzi mailto:thmate@oszk.hu

  22. URI, URL, URN • A dokumentumok elnevezésének szükségességét Tim Berners-Lee először 1991-ben vetette fel, • 1994 márciusában alakult meg az URI-k szabványosítását előkészítő munkabizottság. • Az URI-kra vonatkozó első általános szintaxist 1998-ban publikálták • a legutolsót, amely jelenleg is a legfrissebb ajánlás, 2005 januárjában.

  23. URI, URL, URN • URI=URL+URN • URL: Universal Resourse Locator (Egységes Erőforrás Helymeghatározó) – az erőforrásokat az elérési útjukkal együtt azonosítják. • URN: Universal Resource Name (Egységes Erőforrás-név) – perzisztens – mindig rendelkezésre álló erőforrások. • URI lehet helymeghatározó, név, vagy mindkettő.

  24. URI, URL, URN • Az URI-k kifejezetten gépi interpretációra lettek kifejlesztve • Bizonyos URI-k esetében a tartalom kikövetkeztethető: • http://www.budapest.hu • mailto:csoban.laszlo@gmail.com • Vagy egységes szabályok szerint képződnek: • http://www.okm.gov.hu • http://hu.wikipedia.org/Tenisz

  25. RDF és a szemantikus web • RDF már az 1990-es évek végén létezett. • A szemantikus web elképzelést azonban csak 2001-hez kötik. • Az RDF a szemantikus webnek csak az egyik rétege! • Roadmap to the semantic web (1998) • Tim Berners-Lee et al: The Semantic Web = Scientific American (2001)

  26. A szemantikus web “A szemantikus web nem egy önálló web, hanem a jelenleginek a kiterjesztése, ahol az információnak jól definiált jelentést adunk, amely elősegíti a számítógépek és az emberek közti együttműködést. Az első lépéseket már megtettük abban az irányban, hogy a jelenlegi web struktúrájába beleszőjük a szemantikus webet. A közeli jövőben ezek a fejlesztések jelentős új funkciókat kaphatnak, ahogy a gépek egyre alkalmasabbak lesznek azon adatok feldolgozására és “megértésére”, amelyeknek ma csupán a megjelenítésére képesek.”

  27. A szemantikus web • Intelligens web, szemantikus világháló • A számítástudomány új kutatási fejlesztési iránya, amelynek a célja, hogy kényelmesebbé tegye a világhálón lévő tartalmak visszakeresését. • Globális metaadat infrastruktúra. • Szemantikus technológiák sora, amely a tudásreprezentációt hivatottak szolgálni. • Sokkal inkább egy globalista vízió, mint egy technológia

  28. A szemantikus web • A jelentést kell kódolni, úgy, hogy a számítógép is tudja, hogy mire gondolunk. • Nem egy működő rendszer! • Egymásra épülő technológiák sora, amelyek más célra is használhatók. (pl. vállalati tudásbázisok) • Web 3.0???

  29. A szemantikus web „The goal of the Semantic Web initiative is as broad as that of the Web: to be a universal medium for the exchange of data. It’s envisaged to smoothly interconnect personal information management, enterprise application integration, and the global sharing of commercial, scientific and cultural data.” (W3C, 2003)

  30. A szemantikus web • Pete és Lucy testvérek, akik együtt keresnek édesanyjuknak fizikoterápiás kezelést kéthetente. • Az intelligens kereső kikeresi az édesanyjuknak előírt kezelést nyújtó szolgáltatók közül azokat, amelyeknél érvényes a mama biztosítása. • Kiválogatja azokat, amelyek a lakhelyének a 20 mérföldes körzetében vannak, és az értékelésük kiváló, vagy nagyon jó a minősítések szerint. • Ezt követően összeegyezteti az időpontot Lucy és Pete naptárával, hogy a nekik is megfelelő időben legyen a kezelés. • Az intelligens kereső vázolja a tervet. • Pete-nek nem tetszik, mert éppen csúcsforgalom idején kellene autóznia, ezért megismétli a keresést szigorúbb kritériumokkal. • Szinte azonnal jön a válasz a módosított tervvel, amelyhez azonban a gép figyelmezteti Pete-et, hogy néhány kevésbé fontos találkozót át kell tennie más időpontra.

  31. A szemantikus web recepciója • Az információ indexelése és visszakeresése. Az információvisszakeresésben a szemantikus web túlmegy a tárgyszók és az alfabetikus indexek mélységén, és a használók képesek fogalmak és kategóriák mentén keresni; • Metaadatok. E szerint a szemantikus web metadatok tömege, amelyek a weben lévő adatok közötti hatékonyabb keresést tesz lehetővé; • Magyarázó jegyzetek, kommentárok. E szerint a szemantikus web legfőbb újítása a felhasználó által generált tartalom, a kommentárok, bejegyzések. • Egy nagy együttműködő adatbázis. Az adatok legnagyobb részét adatbázisokon kívül tárolják a weben. A tárolt adatok leírásának és visszakeresési lehetőségeinek egységesítése nyomán a szemantikus web egy nagy virtuális adatbázisként is értelmezhető.

  32. A szemantikus web recepciója • Az adatok gépi visszakeresése. Ez a megközelítés az adatok visszakeresésének az automatizálására koncentrál. E szerint nem kell az oldalakat egyenként betölteni és azokról az adatokat kinyerni, hiszen az adatok formátuma és hozzáférési lehetőségei lehetővé teszik, hogy azokat a számítógép emberi közreműködés nélkül kezelje. • Szolgáltatások. A szolgáltatások géppel olvasható adatokat tesznek közzé, így a számítógép az ember helyett végzi az egyeztetéseket. • Szolgáltatások felderítése. Azon szolgáltatások felderítése, amelyek lehetővé teszik a szabványok szerinti hozzáférést. • Intelligens „titkár”. Egy olyan intelligens számítógépes alkalmazás, amely az ember helyett cselekszik gyakorlati ügyek intézése során, például repülőjegyet, vagy szállodai szobát rendel. A szemantikus weben ebben a megközelítésben emberek intelligens „titkárainak” interakciója zajlik. (Passin 2004:3–8)

  33. Semantic web layercake

  34. Semantic web layercake

  35. Semantic web layercake

  36. A szemantikus web szintjei • Az egyes szintek funkciói: • Az URI-k azonosítják a fogalmakat, amikről beszélünk (önleíró dokumentum); • Az XML biztosítja az egységes szintaxist; • Az RDF a szemantikai tartalmat hordozza; • Az ontológiák írják le a szabályokat, amelyek alapján következtetések vonhatók le; • Az ontológiák formális logikákon alapulnak • Az egyes szintek egymásra épülnek. • Minden szint eggyel komplexebb, mint az alatta elhelyezkedő. • Mégis az egyes szintek önállóan fejleszthetők.

  37. A szemantikus web rétegei A szemantikus web három különböző rétegből áll: • metaadatok: az erőforrások és tulajdonságok leírása (URI, XML, RDF); • sémák: a fogalmak hierarchikus leírása (RDFS, OWL, SKOS); • logikák: leíró logikák (OWL, RIF).

  38. W3C • A szemantikus web megvalósulásának előfeltétele, hogy a tartalmak létrehozói általánosan elfogadott szabványokhoz tartsák magukat a fejlesztések során. • World Wide Web konzorcium; • www.w3c.org • Vezetője Tim Berners-Lee;

  39. W3C • Nyílt szoftverszabványokat készítenek a világhálóra; • A szabványok alkalmazását az iroda a gyártókra bízza; • Nemzeti irodái vannak • A W3C Magyar Iroda 1995 óta működik

  40. W3C szabványok

  41. A szabványosítás folyamata Munkacsoport (Working Group) • W3C tagjai alkotják Munkaterv (Working Draft) • Első nyilvános dokumentum • Minden érdeklődő hozzászólhat • A dokumentumokat többször is javítják, kiadják munkatervként Előzetes javaslatterv (Candidate Recommendation) • Akkor, amikor már nincsen részletes változtatás • Első implementációk készülnek Javaslatterv (Proposed Recommendation) • Széles körben elfogadott és implementált W3C Ajánlás • Amikor a tagok és az igazgató is elfogadják • A webes társadalom szabványként tekint rá

  42. XML „Ahogyan a HTML lehetővé tette, hogy minden számítógép-felhasználó olvashassa az internetes dokumentumokat, úgy az XML – az inkompatibilis számítógépek bábeli zűrzavarában is – az eszperantót jelenti, melyen mindenki olvashat és írhat.”

  43. XML • eXtensible Markup Language • Az XML először 1998-ban jelent meg W3C ajánlásként. • Az ajánlást a W3C konzorcium égisze alatt működő XML munkabizottság dolgozta ki. • Elődje az SGML. • Az ajánlásnak a legfrissebb verziója 2008 novemberében látott napvilágot (ötödik kiadás) • Az XML egy leíró nyelv, amely más, speciális felépítésű nyelvek leírására szolgál. (Pl. XTM)

  44. XML • Amikor az XML segítségével megalkotunk egy új nyelvet, az az XML alkalmazása. • egy konkrét XML dokumentum pedig egy ilyen nyelvnek egy példánya, alkalmazása. • Az XML dokumentum szöveges állomány, amelyet arra terveztek, hogy strukturált formában legyen képes szövegeket tárolni. • Az XML lényege az egységes szintaxis, amely ugyanakkor nagy szabadságot enged egy-egy új dokumentum létrehozása során.

  45. XML • Az XML-lel kapcsolatos tevékenység a W3C-n belül. • 10 munkabizottság! • egy a munkabizottságokban folyó munka koordinációjáért felelős (XML Coordination Group), • az XML-nek magának a fejlesztéséért (XML CoreWorking Group). • speciális problémákra keresnek megoldásokat, • a megjelenítés (XSL Working Group), • a lekérdezés (XML QueryWorking Group), • a struktúra, a tartalom és a szemantika megragadása (XML SchemaWorking Group).

  46. XML névterek • Egyedi elem és attribútumnevek a lokális nevek, • ezek ütközhetnek két alkalmazás összekapcsolása esetén. • Pl.: <m> = „munkatársak” vagy „művek”. • Ekkor az egyedi nevek kaphatnak egy prefix elemet, amelynek használatával univerzális vagy minősített nevekké tehetők, • Pl. <n:m> vagy: <s:m>.

  47. XML • Az XML nem specifikus a szemantikus webre, önállóan is számos alkalmazási területe lehetséges. • Pl. • Könyvtári rekordok formai feltárása • Digitalizálás • Megjelenítés (HunTéka)

  48. XML vs. HTML

  49. RDF séma • „RDF segítségével képesek vagyunk leírni azt, hogy egy ember barátja egy másiknak. Ezt úgy tehetjük meg, hogy konstruálunk egy RDF kijelentést, amelynek alanya és tárgya két ember, predikátuma egy olyan erőforrás, amelyről tudjuk, hogy a „barátja” viszonyt azonosítja valahogy. Kérdés ezek után, hogy el tudjuk-e dönteni, hogy az egyik ember ismeri-e a másikat?” • Igen… (olyan következtetés volt a részünkről, amelyhez háttértudásra volt szükségünk.) Mi tudjuk ugyanis, hogy valakik nem lehetnek barátok, ha nem is ismerik egymást. • Valami olyan kijelentésre lenne szükségünk, hogy ’bármely két erőforrás között, amelyek n:barátja viszonyban állnak egymással, fennáll az s:ismerőse viszony is.’ (Szeredi, 2005)

More Related