220 likes | 327 Views
Zdieľanie výsledkov výskumu v portáli založenom na webe so sémantikou. Ladislav Rado. Cieľ. Navrhnúť softvérový nástroj, ktorý umožní využitie metadát na vytvorenie skupín výskumníkov s podobnými záujmami a zdieľanie ich výsledkov. Identifikácia spoločných záujmov. Sieť vzájomných citácií
E N D
Zdieľanie výsledkov výskumu v portáli založenom na webe so sémantikou Ladislav Rado
Cieľ Navrhnúť softvérový nástroj, ktorý umožní využitie metadát na vytvorenie skupín výskumníkov s podobnými záujmami a zdieľanie ich výsledkov
Identifikácia spoločných záujmov Sieť vzájomných citácií Využitie klasifikácie publikácií
Sieť vzájomných citácií Intelektuálne (odkazujúce) Sociokognitívne
Sieť vzájomných citácií Odkazujúce[MT05] Ľudia Výskumá práca Spoločnosť Žurnál Konferencia Reprezentácia grafmi
Sieť vzájomných citácií Sociokognitívne[MT05] Spolupracovník Vzdelávací vzťah Organizátor - účastník Súkromná známosť kde sa dajú nájsť? v poďakovaniach web stránky autorov, konferencií
Uzol grafu Autor príspevku[NM01b] Počet spolupracovníkov autora (stupeň uzla) Počet publikovaných príspevkov Pravdepodobnosť spolupráce Vzájomná vzdialenosť v grafe L Sila relácie“medzi” vzhľadom na iné dvojice výpočet stredných hodnôt váhované siete [NM01a]
Metriky grafov - statické hľadisko[NM01a] Lievik (Funneling) – rozhodujúce spojenia Obrovský komponent – 80 až 90% Priemerný stupeň odlúčenia (počet vzťahov) priame cez jeden medzičlánok cez viacero m.
Metriky grafov - statické hľadisko Zoskupovanie [NM01b] koeficient zoskupovania C = Siete výskumníkov krátke spojenia s ostatnými existencia obrovského komponentu sieť malého sveta[PJ02] L ≥ L_randGraph, C >> C_randGraph použiť lokálne výpočty v grafe?
Ohodnotenie uzlov v grafe Algoritmy na grafe[KJ99] Hľadajú rovnovážny stav - Iteratívne metódy Garfield 1972 – priemerný počet citácií na príspevok počas posledných 2 rokov Problém: cyklus v grafe Lepšie ak je hodnotenie získané od autorít HITS PageRank(náhodný chodec) ObjectRank [GS05](ontológie, kontext portálu a používateľa) NodeRank [PJ02](lokálne hodnotenie)
Metriky grafov - dynamické hľadisko Z pohľadu vývoja v oblasti[HO04] Kumulatívne prerušenie spolupráce, “spiace” spojenia Časové okno (5 – 8 rokov) skupinová analýza profesionálna kariéra ≈40 rokov
Využitie klasifikácie publikácií Primárna klasifikácia zaradenie podľa hlavnej témy, kľúčové slová Dodatočná klasifikácia ACM Digital Library (portal.acm.org) Primary Classification:K.Computing MilieuxK.4COMPUTERS AND SOCIETYK.4.3Organizational Impacts Additional Classification:K.Computing MilieuxK.6MANAGEMENT OF COMPUTING AND INFORMATION SYSTEMSK.6.1Project and People ManagementK.7THE COMPUTING PROFESSIONK.7.1Occupations
Proces vytvorenia SW nástroja[AM06] Získanie údajov Kvalita, viacero zdrojov Príprava údajov obaľovače Rozlíšenie entít Reprezentácia metadát a ontológie RDF(S), OWL, FOAF Odvodzovanie, dopytovanie Prezentácia Vyhodnotenie
Rozlíšenie entít Horné a dolné ohraničenie[HO04,NM01a,NM01b] Prvé iniciálky Všetky iniciálky Príklad: M. Priezvisko M. I. Priezvisko Meno I.Priezvisko. Pridať toľko ďalších informácií k menu autora, aby ho bolo možné jednoznačne určiť[MY06] ďalší problém: diakritikaĽ vs. L’ vs. L
Model domény Ontológia – koncepty a inštancie Odvodzovanie Dynamickosť ontológie emergentná sémantika[MP05] (chýba abstraktný model) Zjednotiť ontológie a zodpovedajúce údaje Zobrazenie zhody medzi dvoma ontológiami (do veľkej miery závisí od použitej porovnávacej metódy) Porovnávanie Rôzne úrovne (reťazce, koncepty)
Používateľ • Používateľ – asociatívny prvok[MP05] • Personalizácia • Cold-start problem • explicitné vs. implicitné získavanie hodnotenia [PJ02] • aktivita používateľa - prieskum, vyhľadávanie • Zoskupenie používateľov • Profil, hodnotenia • Výmena hodnotení (vzájomné ovplyvňovanie)[GS05] • Skryté odkazy (neformálne stretnutia,“hidden web”) • Porovnanie profilov – kolaboratívne filtrovanie
Literatúra [AM06] Aleman-Meza, B., Nagarajan, M., Ramakrishnan, C., Ding, L., Kolari, P., Sheth, A.,Arpinar, I., Joshi, A., Finin, T.: Semantic analytics on social networks: experiences inaddressing the problem of conflict of interest detection. Proceedings of the 15th internationalconference on World Wide Web, (2006), pp. 407–416 Detekcia konfliktu záujmov (autori publikácií a recenzenti,aby sa nenastala zaujatosť posudzovateľa voči článku, rôzne úrovne podľa váhy) Integrácia sociálnych sietí z FOAF a DBLP biblografických záznamov Dve množiny owl:sameAs, ambiguous, dôvody nejednoznačnosti priradenia [BJ05] Breslin, J., Harth, A., Bojars, U., Decker, S.: Towards Semantically-Interlinked OnlineCommunities. The 2nd European Semantic Web Conference (ESWC’05), Heraklion,Greece,Proceedings, LNCS, (2005), vol. 3532, pp. 500–514 Návrh ontológie pre spojenie komunít na webe (forum, weblog, mailing list) ako zobraziť FOAF, RSS, (X)HTML,… do ontológie reprezentovanej RDF, OWL Využitie ontológie pre prehliadanie, dopytovanie, využitie metadát vzťah related_to
Literatúra [DJ02a] Davies, J., Duke, A., Stonkus, A.: OntoShare: Using Ontologies for Knowledge Sharing.Proceedings of the 11th International WWW Conference WWW2002 , (2002) Nástroj pre poloautomatické vytváranie RDF Evolúcia ontológie používaním systému Diskusia o skrytých odkazoch --‘weak ties’ Využili subClassOf (hierarchie) plánujú isRelatedTo [GS05] Ghita, S., Nejdl, W., Paiu, R.: Semantically Rich Recommendations in Social Networksfor Sharing, Exchanging and Ranking Semantic Context. Proceedings of ISWC, Galway,Ireland, November, (2005) Výmena článkov článkov a metadát (kontext a hodnotenie) cez e-mail Prepojenie FOAF, a kontextov prehliadača (desktop) a portálu pre výpočet hodnotenia modifikovanli PageRank
Literatúra [HO04] Horn, D., Finholt, T., Birnholtz, J., Motwani, D., Jayaraman, S.: Six degrees of jonathangrudin: a social network analysis of the evolution and impact of CSCW research. Proceedingsof the 2004 ACM conference on Computer supported cooperative work, (2004), pp.582–591 Sieťa spoluautorov (coauthorship) Vlastnosti grafov (rôzne merania), časový rozmer, vývoj komunity Metóda rozlíšenia mien [KJ99] Kleinberg, J.: Hubs, authorities, and communities. ACM Computing Surveys (CSUR),(1999), vol. 31, no. 4es Metódy hodnotenia uzlov v grafe HITS, Pagerank, Katz a Hubbel, Pinski [MY06] Matsuo, Y., Mori, J., Hamasaki, M., Takeda, H.: POLYPHONET: An advanced social network extraction system. World Wide Web Conference (WWW), (2006) Metóda extrakcie sociálnej siete s využitím vyhľadávača pre rozlíšenie entít podľa počtu vrátených výsledkov sa určuje sémantická podobnosť Využitie vyhľadávača pre doplnenie metadát
Literatúra [MP05] Mika, P.: Ontologies are us: A unified model of social networks and semantics. Proc.ISWC2005 , (2005) vychádza z princípu social tagging (prípadová štúdia del.icio.us) Začlenenie sociálneho kontextu do ontológie pre štúdium (emergent semantics) Matica prepojení ľudí, konceptov a inštancií, metóda riešenia (tri bipartitné grafy) [MT05] Miki, T., Nomura, S., Ishida, T.: Semantic Web Link Analysis to Discover Social Relationshipsin Academic Communities. Proceedings of the 2005 Symposium on Applicationsand the Internet (SAINT’05)-Volume 00 , (2005), pp. 38–45 Analýza siete vzájomných citácií oddeľuje sociálne siete, Nielen spoluautorstvo pre hľadanie sociálnych spojení Zoskupenie autorov podľa oblastí výskumu [NM01a] Newman, M.: Scientific collaboration networks. II. Shortest paths, weighted networks, andcentrality. Physical Review E, (2001), vol. 64, no. 1, p. 16132 Prepojenie na základe spoluautorstva, Priradenie váhy podľa počtu článkov Metriky pre grafy – betweenness, funneling, giant component Algoritmus hľadania najkratšej cesty
Literatúra [NM01b] Newman, M.: The structure of scientific collaboration networks. Proceedings of the NationalAcademy of Sciences, (2001), vol. 98, no. 2, pp. 404–409 Rozlíšenie mien podľa Metriky: počet spolupracovníkov, koeficient zoskupovania, stupeň odlúčenia Komunity tvoria siete “malého sveta” [PJ02] Pujol, J., Sangüesa, R., Delgado, J.: Extracting reputation in multi agent systems bymeans of social network topology. Proceedings of the first international joint conference onAutonomous agents and multiagent systems: part 1 , (2002), pp. 467–474 Algoritmus pre hodnotenie autoritatívnosti, nepotrebuje poznať celý graf ale len jeho časť Návrh priradenia váh odkazom, citáciám podľa mena Prispôsobenie sa grafom s rôznymi topológiami.