490 likes | 554 Views
Wikik, szemantikus wikik és alkalmazásuk Nagy Attila Egészségügyi Ontológiai Fórum. A wikikről általában. Egy új médium születése. About the World Wide Web ( http://www.w3.org/WWW/ ) The World Wide Web (known as “WWW”, “Web” or “W3”) is the universe of network-accessible
E N D
Wikik, szemantikus wikik és alkalmazásukNagy AttilaEgészségügyi Ontológiai Fórum
Egy új médium születése About the World Wide Web (http://www.w3.org/WWW/) The World Wide Web (known as “WWW”, “Web” or “W3”) is the universe of network-accessible information, the embodiment of human knowledge.
Egy új médium születése Mi a Web legnagyobb hiányossága? • gyakorlatilag “read only” • ahhoz, hogy valaki a Weben megjelenjen, saját szerverre van szüksége, amin egy teljesen új site-ot tud indítani • a meglévő oldalak gyakorlatilag nem szerkeszthetőek
Egy új médium születése Az első wiki: a WikiWikiWeb • 1995. március 25-én indult • Ward Cunningham írta Perl-ben • ma is működik (http://c2.com/cgi/wiki) • egy Portland Pattern Repository nevű weboldal kiegészítéseként készült • az oldal és a wiki témája is a szoftverfejlesztésben használt tervezési minták (Design Pattern) és az extrém programozás (XP)
Egy új médium születése Honnan a név? “Cunningham named WikiWikiWeb that way because he remembered a Honolulu International Airport counter employee telling him to take the so-called "Wiki Wiki" Chance RT-52 shuttle bus line that runs between the airport's terminals. "Wiki Wiki" is a reduplication of "wiki", a Hawaiian-language word for fast.”
Egy új médium születése Mi tehát a wiki? Egy olyan alkalmazás, amely hypertext gyors szerkesztését teszi lehetővé. (ebben mindegyik megegyezik) Általában jellemző: • webes felülete van • többen szerkesztik • lehetővé teszi a szerkesztők kommunikációját • az oldalak szerkesztési történetét tárolja
A közösség ereje Az elmúlt 20 év tapasztalata: Nagy számú ráérő ember hatalmas dolgokra képes.
A közösség ereje Példa: Linux The cost to redevelop the Linux kernel version 2.6.0 in a traditional proprietary development setting has been estimated to be US$612M (467M€) in 2004 prices [...]. In 2006, a study funded by the European Union put the redevelopment cost of kernel version 2.6.8 significantly higher, to 882M€ (US$1.14B). Debian Sarge disztribúció • kb. 230 millió sornyi forráskód • kb. 8 milliárd dollár • kb. 60 000 emberév
A közösség ereje 2007 november~ 2 millió cikk Példa: Wikipedia
Milyen egy sikeres wiki? Példa: Wikipedia
Milyen egy sikeres wiki? Példa: DidiWiki – személyes wiki
Milyen egy sikeres wiki? Példa: Mozilla Wiki – egy fejlesztői közösség wikije
Milyen egy sikeres wiki? Példa: egy baráti kör wikije
Milyen egy sikeres wiki? Jellemzők: • vannak felhasználói • ezek számára a tartalom hasznos • akik tudják fejleszteni a tartalmat, azok meg is teszik
A wiki-k problémái Vandalizmus Mivel könnyű a tartalmat módosítani, könnyű ezt rosszindulatúan is megtenni. Több fajtája van, változó indítékkal és károkozással.
A wiki-k problémái 1. Egyszerű feltűnősködés • tipikus példa: egy szerkesztésben eltűnik egy oldalól 31298 karakter, és megjelenik rajta 4 • ezt automatikusan is lehet korrigálni • általában nem ez jelent gondot
A wiki-k problémái 2. Reklámozás • egyesek a wiki-ket ingyenes reklámlehetőségnek tekintik, és saját cégüket vagy szolgáltatásukat népszerűsítik • ez csak emberi közreműködéssel javítható • ha a közösség aktív és/vagy sok tagja van, akkor nagyon hamar ellátják a cikket a megfelelő jelzéssel • ezután az érdeklődők (vagy ellenérdekeltek) kijavítják a cikket tárgyilagosabbra
A wiki-k problémái 3. Tények célzott megrongálása • tipikus példa: egy nem közismert személy születési dátumának megváltoztatása • egy kísérlet szerint az ilyen vandalizmus marad fenn legtovább a Wikipedián • szerencsére nem feltűnő, így nem motiválja a rongálókat
A wiki-k problémái Védekezés a vandalizmus ellen • a védekezés alapját az jelenti, hogy gyakorlatilag minden wiki nyomon követi a lapok minden korábbi változatát • így a rongálás könnyen visszaállítható • ha egy oldal kezelhetetlenül nagy mennyiségű vandalizmust kap, részlegesen vagy teljesen lezárható • szerencsére ez általában átmeneti • természetesen az egész wiki is lezárható
A wiki-k problémái Szerkesztői háborúk (Edit wars) • a wikit sokan szerkesztik • a szerkesztők nem feltétlenül értenek egyet • gyakori helyzet, hogy a szerkesztők visszavonják egymás szerkesztéseit • a Wikipedián ez érzékeny témákban fordul elő • kezelése: three-reverts rule • a megoldás általában: • konszenzuskeresés a vitalapon • eltérő álláspontok párhuzamos szerepeltetése
A wiki-k problémái Megbízhatóság • a fentiek miatt wiki elvileg kevésbé megbízható a hagyományos médiumoknál • Ennek a nézetnek a legfontosabb hangoztatója az Encyclopedia Britannica, ami valahogyan a Wikipedia legfőbb kritikusa lett. • miért használható a Wikipedia mégis? • az igazán káros vandalizmusok az apró tények “elállítgatásai”, ezeket elhelyezése pedig nem vonzó a rongálók számára, mert nem kelt feltűnést.
A wiki-k problémái A wiki-k egyes számú paradoxona: Megszokott dolog, hogy valami, aminek elméletileg működnie kellene, a gyakorlatban nem válik be; a wikik viszont éppen ellenkezőleg: annak ellenére működnek és megbízhatóak, hogy elméletileg törékenyeknek és megbízhatatlanoknak kellene lenniük!
A wiki-k problémái A paradoxon feloldása: nagyon erős közösség! A Wikipediát használva időnként találunk “oda nem illő dolgokat”. Érdemes 5 perc után frissíteni az oldalt; ekkorra rendszerint eltűnik a rongálás.
A technikai oldal A megvalósítás elsősorban a wiki közönségének mérete szerint változik. Vannak: • személyes wikik • közösségi wikik • globális wikik
A technikai oldal Személyes wikik • lehet: • integrált webszerver (DidiWiki, C) • böngészőben, de teljesen kliensoldalon (TiddlyWiki, JS) • web nélkül (Tomboy, C#) • általában nem használnak adatbázist • nyilván itt nem a közösségi aspektus a lényeges, hanem a szerkeszthető hypertext • legtöbbször az internet felől nem láthatóak
A technikai oldal Közösségi wikik • a megvalósítás tipikusan webszerver és valamilyen szkriptnyelv • általában adatbázisba tárol, de nem mindig • mindenki olvashatja, de a szerkesztés korlátozott • általában regisztrációhoz kötött (a regisztráció pedig közösségi tagsághoz) • a szervert nem kell masszív terhelésre méretezni • (PII 500MHz 128 MB RAM kellemesen tud futtatni egy ilyen wikit)
A technikai oldal Globális wikik • az egész internet számára engedélyezett az olvasás és a szerkesztés is • ez nagyon jelentősen meg tudja növelni a szerverre nehezedő terhelést • ha a wiki igazán forgalmas, szerverparkra lehet szükség, elosztott adatbázissal és proxykkal
A technikai oldal Globális wikik: Wikimedia Foundation adatbázisok proxyk keresők webkiszolgálók
A MediaWiki szintaxisa ''dőlt betű'' '''félkövér''' [[Belső link]] [[Belső link|Átnevezett belső link]] [http://hu.wikipedia.org Külső link] * pontozott listaelem * ez is # számozott listaelem # ez is #* és ilyet is lehet #*# sőt, ilyet is
Mi hiányzik a Wikipediából? • emberek írják embereknek • emiatt a szöveg gépi feldolgozása éppen olyan nehéz, mintha hagyományos weboldalakról lenne szó • amivel több, mint egy halom weboldal, az a belső linkek hálózata • ezek a linkek viszont típustalanok • nem jelentenek semmit, azon kívül, hogy “ebben a cikkben megemlítik ezt” • hasznos lenne, ha a wikiktől lehetne kérdezni • pl. olyanokat, hogy “Mi Németország fővárosa?” vagy pl. “Melyek azok az európai országok, amiknek nem a legnagyobb városa a főváros?”
A Semantic MediaWiki (SMW) • a MediaWiki kiegészítése • PHP nyelven írták • a szintaxisa a MW szintaxisának kiegészítése • lehetővé tesz: • szemantikusan annotált linkeket • számszerű jellemzőket • lekérdezéseket
SMW példa A wikink tartalma “Berlin” oldalon: Berlin is the capital of [[is_capital_of::Germany]]. Its population is [[has_population:=3,993,933]]. Lekérdezések: Mi Németország fővárosa? [[is_capital_of::Germany]] Melyek azok a fővárosok, amiknek a lakossága 1 milliónál kevesebb? [[is_capital_of::+]] [[has_population:=<1000000]]
SMW példa Melyek azok az EU-s városok, amelyeknek a lakossága 2 és 3 millió közötti? [[Category:City]] [[located_in::<q> [[Category:Country]] [[member_of::European Union]] </q>]] [[has_population:=>2000000]] [[has_population:=<3000000]] Melyek azok az EU-s országok, amelyeknek nem a fővárosa a legnagyobb városa? ezt nem lehet megfogalmazni az SMW eszközeivel!
Az SWM és az OWL Fogalmak OWL SMW instance wiki-oldal class kategória object property szemantikusan annotált link datatype property számszerű jellemző
Az SMW és az OWL Expresszivitás OWL 1.0: • AL atomi negáció, konjunkció, teljes univerzális és limitált egzisztenciális kvantor • C komplex fogalmak negációja • S = ALC + tranzitív szerepek • H szerephierarchiák • O felsorolt fogalmak (nominálisok) • I inverz szerepek • N minősítetlen kardinalitás • (D) adattípusok és adattulajdonságok
Az SMW és az OWL Expresszivitás OWL 1.1 = OWL 1.0 + • R reflexivitás, irreflexivitás, diszjunkt szerepek • Q minősített kardinalitás SMW: FL– • (FL–: az AL résznyelve, ami nem engedi meg az atomi negációt.)
Az SMW és az OWL Következtetés DL • négy alapvető következtetési művelet van • Ellentmondásmentesség vizsgálata • fogalmak kielégíthetőségének vizsgálata • klasszifikáció • realizáció (típuskeresés) • az utóbbi 3 visszavezethető az elsőre
Az SMW és az OWL Következtetés SMW • egyetlen művelet van: egy típushoz tartozó összes példány keresése • minden ontológia konzisztens • ellentmondást meg sem lehet fogalmazni
Az SMW alternatívái IkeWiki • meglehetősen hiányos dokumentáció (így nem tudtam felmérni a képességeit) SweetWiki: ők félreértettek valamit... SweetWiki is original in the sense that all its behavior is articulated around an ontology that describes all the objects/concepts in the wiki itself + all the relationships between them. For example, we defined the concept of a WikiPage, a WikiWord, a forward link, a backward link, an uploaded file, an uploaded image, an author, etc. Each of these concepts in turn may be linked together: a page A may have a forward link to a page B. We defined in the ontology a rule that states that if A has a foward link to B, then B is backlinked by A. Etc. This ontology is small and described in OWL lite.
Az SMW potenciális alternatívája • Az SMW használatánál alapvető élmény a rettenetes erőforrásigény. • A DidiWiki-t viszont minimális gépigénnyel is teljesen jól lehet futtatni... • ...ugyanakkor ezt a minimális expresszivitást a jól bevált Prolog villámgyorsan tudja kezelni. • adódik az ötlet:
Az SMW potenciális alternatívája • drótozzuk össze a DidiWiki-t a Prologgal! • az SMW-éhez mérhető expresszivitás azonnal adódik • de: a Prolog sokkal többre képes, és mivel 1. általános célú programnyelvként is használható, és 2. kedvelt környezet DL reasonerek megvalósításához, az • expresszivitás a későbbiekben a rendszer teljes újragondolása nélkül is fokozható lenne
Mire használhatjuk a wikiket? Az EOF munkáit koordinálni ötleteit × kérdéseit rögzíteni felvetéseit összefoglalni találkozóit azok témáit
Mire használhatjuk a wikiket? Az ontológiákkal rögzíteni tudásreprezentációval × leíró logikával rendszerezni egészségügyi informatikával megvitatni kapcsolatos ismereteinket
Alkalmazási lehetőségek kutatása Az egészségügyi intézményekben jelenleg használatos • statikus intranet • körlevelek • kiragasztott papírok kiválthatóak lennének, emellett: • esetismertetések • konzultációk
Mi kell egy jó wikihez? • egy jó közösség • odafigyelő adminisztráció • motiváció • különösen fontos a kezdeti időszakban gyorsan gyarapodó, jó tartalom biztosítása • egy olyan közösségi erőfeszítést szívesebben támogatunk, amely már eljutott valahová