260 likes | 415 Views
Personalizácia v otvorenom informačnom priestore: vylepšený proxy server. Onto žúr , 5 .1 2 .2008. Michal Barla, Jozef Tomek. Cieľ prezentácie. Informovať Vás o platforme, ktorá sa u nás vyvíja na a ktorá pre vás môže byť zaujímavá ak: riešite /vyp ísali ste /chcete vyp ísať
E N D
Personalizácia v otvorenom informačnom priestore: vylepšený proxy server Ontožúr, 5.12.2008 Michal Barla, Jozef Tomek
Cieľ prezentácie • Informovať Vás o platforme, ktorá sa u nás vyvíja na a ktorá pre vás môže byť zaujímavá ak: • riešite/vypísali ste/chcete vypísať • BP/DP/DizP (a vidím potenciál aj na OPčka) v oblastiach • modelovanie používateľa, personalizácia a prispôsobovanie, kolaboratívne správanie a odporúčanie, sociálne siete, klasifikácia (stránok, používateľov), analýza textu, ...
Štruktúra prezentácie • Motivácia • Čo ponúkame • Čo potrebujeme • Čo chcete...
Zatvorený informačný priestor • Problémy s datasetmi pre používateľské štúdie • Aktuálnosť • Úplnosť • Konzistentnosť • S čím sa porovnať? • Ako motivovať ľudí, aby určitý typ informácií nehľadali na googli ale v našom prehliadači? • Prelomiť návyky, pluginy, extensions, lenivosť
Proxy server • Brána do otvoreného informačného priestoru • Neviažeme sa na jednu doménu • Doménou je vyhľadávanie informácií • Nemeníme návyky ľudí v práci s webom • Aspoň nie skokovo • Vieme sa porovnať s googlom etc. • Prirodzený baseline
Všeobecný princíp interakcií • Proxy zodpovedné za logovanie akcií • Dva typy handlerov • Request • Response • Špeciálne vs. generické • Pre stránku xyz.ab, vyhľadávač abc.xy • Pre ľubovoľnú stránku • Proxy „zobudí“ každý relevantný handler • observer
Ukážka úvodnej stránky open source proxy servercapistrano tutorialapache administration • Recent searches of your community : • open corpus adaptive hypermedia • collaborative searching • keyword user model hierarchy
SearchPageResponse • getDOMForPage() • setDOMForPage(DOM document) • addRef(title-url pair) • addList(String title, List<title-url pairs> urls)
SearchForKeywordRequest • getSearchString() • setSearchString(String) • Má zmysel toto nejako parsovať na strane proxy? • List<String> getSearchKeywords()
SearchForKeywordRequest • Zalogujeme • User (trackingCookie, IP address…?) • search string (rozparsovane keywords) • search engine • timestamp
SearchForKeywordsResponse • int getResultCount() • List<Result> getListOfResults(int page) • List<Result> getListOfResults(int maxpages) • List<Result> getListOfResults(int minPage, int maxPage) • Result: • URL, pozícia, opis • Vedeli by sme vytiahnuť z DB klikanosť, obľúbenosť (v nejakej komunite?), ...
SearchForKeywordsResponse • addResult(Result PageReference, int position) • Remove/Hide(int position) • emphasize(int position, Level) /*+ aj - */ • annotate(int position, AnnotationType type) • setPosition(int oldPosition, int newPosition) • swapPositions(int position_a, int position_b)
SearchForKeywordsResponse • K používateľovi a hľadaným kľúčovým slovám prilogujeme • Zobrazené výsledky (url, pozícia) • Kliknutý výsledok (url, pozícia)
PageResponse • getDOMForPage() • setDOMForPage(DOM document) • emphasize(Node, Level) • ?Annotate(Node, Level)
PageResponse • Zalogujeme • Čas strávený na stránke • Vieme zalogovať akúkoľvek udalosť generovanú prehliadačom • Odkaz na JavaScript vložený do hlavičky každej stránky • Asynchrónne reporty na server • Špeciálny User-Agent zabezpečí nepreposlanie reportu ďalej smerom k samotnej stránke
Proxy server – technická stránka • Základom RabbIT web proxy • Java-based • Podporujúce HTTP štandardy • Živý projekt (v3.16updated: aug 11 2008) • Robustné, rýchle (aspoň si to myslíme) • Java NIO • Prezentovaná funkcionalita implementovaná pre vybrané webové vyhľadávače • S možnosťou dokódiť si ďalšie
Čo potrebujeme/budeme potrebovať • Spätnú väzbu • Ak viacero ľudí potrebuje rovnakú vec, možno by sa mohla stať súčasťou API, službou proxy • Používateľov • Ktorí cez to budú surfovať • Ktorí do toho zapoja svoje UMAP, Text Mining a ďalšie metódy (BP, DP, OP) • Prispievateľov (BP, OP, free time ) • Rozšírenie funkcionality na ďalší vyhľadávač • Manažment používateľov, vzťahov, logov, ...