180 likes | 319 Views
An approach to analysis of publication s network for their personalized recommendation. Riešiteľ: Ladislav Rado Vedúci: Mária Bieliková Projekt: DP2 PeWe group, FIIT STU 4.4. 2007. Zdieľanie výsledkov výskumu. Cieľ
E N D
An approach to analysis of publications network for their personalized recommendation Riešiteľ: Ladislav Rado Vedúci: Mária Bieliková Projekt: DP2 PeWe group, FIIT STU 4.4. 2007
Zdieľanie výsledkov výskumu • Cieľ • Analyzovať siete publikácií na základe prepojení publikácií a odporučiť relevantné publikácie vzhľadom na ciele používateľa • Projekt Mapekus • Modelovanie a získavanie, spracovanie a využívanie znalostí o konaní používateľa v hyperpriestore Internetu
Analýza siete publikácií • Dôvody: • Hodnotenie autorov, publikácií • Určenie oblastí záujmov autorov • Vytvorenie skupín autorov • Metódy hodnotenia • Podľa typu grafov • Analýza autorov • Hodnotenie komunitou – odkazy • Zameranie – podľa oblastí záujmov • Spolupráca
Model domény Rozšíriť o p:alternativeName String* alebo pridať vzťah owl:sameAs
Typy grafov a ich hodnotenie • Prepojenia grafu • Spoluautor • uzly – autori • hrany – váha spolupráce • Referencie • uzly – publikácie • hrany – citácie • Tripartitný graf • používateľ priradí kľúčové slová publikácii – social tagging • používateľ – autor, publikácia - inštancia, kľúčové slovo - koncept • Bipartitný graf • uzly – autori a publikácie • hrany – vzťahy medzi nimi • autor napísal publikáciu a inverzná relácia, • publikácia cituje publikáciu, autor je spoluautor s autorom
Hodnotenie prepojení grafu • Spoluautor • betweenness, clustering coefficient, Erdos – smerom od autora • giant component - skupina autorov spojená cez jedného ďalšieho • histogram počtu spolupracovníkov - mocninové rozdelenie • Referencie • PageRank, HITS, varianty keyword/topic-based • Bipartitný graf • Štatistické • vzácnosť, popularita, dĺžka asociácie • Sémantické • kontext, umiestnenie, dôvera
Návrh • Sieť citácií • vytvorenie grafu z relácií X references Y • vypočítať hodnotenie publikácií a z toho vypočítaťhodnotenie autorov • hodnotenie publikácií autora prispieva k jeho hodnoteniu • v prípade spoluautorov si rozdelia hodnotenie publikácie • citovanie svojich publikácií • pomáha pri hľadaní hlavných smerov výskumu? • kazí objektívne hodnotenie autora?
Experimenty Analýza odkazov • Dve publikácie, ktoré odkazujú na jednu (alebo viacero spoločných) majú pravdepodobne niečo spoločné. • Publikácia odkazuje iné publikácie, ktoré môžu mať niečo spoločné (zistiť na základe ich klasifikácie)
Typy spätnej väzby • Akcia používateľa • Vybral (ako prvé) tie z oblastí jeho záujmov? • Ako vyberali iní s podobnými záujmami? • Podobnosť záujmov na základe podobnosti rozdelení oblastí záujmu – rôzne modely • Otázka • Použije nájdenú publikáciu? • áno, nie, nerozhodnutý
Námety na odporúčanie publikácií • najviac citované • v určitej oblastiach záujmu • najviac žiadané • na čo skupina používateľov s podobnými záujmami začala klikať (počet, sekvencia), • čo používateľ chce - prehľadové alebo špecializované publikácie na základe polohy v klasifikačnej hierarchii • zabudnuté publikácie • “skončili v šuflíku” - málo citované • prednostne od autorít, usporiadané zostupne • nepozreté publikáce • ostatné relevantné vzhľadom na záujmy • premiešanie poradia a “testovanie používateľa”
Personalizované odporúčanie • Zložky personalizácie • Typ publikácie – prehľadová, špecifická • Typ autora – autorita, nováčik • Zhoda záujmov – určitosť, nerozhodnosť • s aktuálnymi záujmami • s celkovými • Usporiadanie výsledkov – uprednostňovanie
Zobrazenie výsledkov • Prehľadávanie • hierarchia publikácií podľa oblastí záujmu • pridávanie ohraničení • Vyhľadávanie • kľúčové slová • Od prehľadov ku špecifickej téme • alebo opačne
Formulár vyhľadávania Systém zmení hodnoty po vykonaní akcie používateľom
Komponenty • Použité nástroje • Získanie metadát • Mapekus.Wrapper.ACM, DBLP • Výpočty v grafe • JUNG – Java universal network/graph framework • Zobrazenie rozsiahlych grafov • knižnice Prefuse, Guess (2D), Walrus (3D) • Prezentačná vrstva • P3 – Publication Presentation Portal, Factic • Zaznamenávanie akcií používateľa • Click, SemanticLog
Rozpoznávanie položiek citácií • regulárne výrazy • predpokladá mená autorov na začiatku • rozpoznáva autora(ov), rok a názov v uvedenej priorite • 3 heuristiky na mená autorov • Priezvisko, I. aleboI. Priezvisko alebo Meno I. Priezvisko • ďalšie • rok v zátvorkách s písmenom (2006b) • predložky pred priezviskom van, von, de, … • rôzne znaky oddelenia položiek nielen bodka • nadpis môže obsahovať dvojbodku, čiarku, pomlčku • diakritika
Stav a plány • Stav doteraz • Tvorba grafu na základe citácií (zdroj DBLP). • Ohodnotenie uzlov algoritmom PageRank • Rozpoznávanie položiek v citáciách • Zobrazenie grafu • Odstraňovanie diakritiky pre vyhľadávanie • Plán DP2 • Prehľadávanie – oblasti, typ publikácie (zdroj ACM) • Určiť záujmy každého používateľa • autori s podobnými záujmami • Zatiaľ len pre paper
Plán • DP3 • Vyhľadávanie • na základe kľúčových slov • typu publikácie • uprednostňovanie – zmena poradia • Spôsoby personalizácie. • Časová os – zobrazenie populárnych publikácií podľa rokov