130 likes | 234 Views
Little Google Game. Jakub Šimko sharak @ post.sk , xsimkoj1@is.stuba.sk Vyh ľadávanie Informácií, 7.12.2009, Fakulta informatiky a informa čných technológií, STU BA. Motivácia: Súvislosti termov. Získať graf súvislostí termov, vhodný pre pre tvorbu odporúčaní na základe podobnosti
E N D
Little Google Game JakubŠimko sharak@post.sk, xsimkoj1@is.stuba.sk Vyhľadávanie Informácií, 7.12.2009, Fakultainformatiky a informačných technológií, STU BA
Motivácia: Súvislosti termov • Získať graf súvislostí termov, vhodný pre pre tvorbu odporúčaní na základe podobnosti • Graf má vytvoriť človek • Kto ho vytvorí (zadarmo)? • Kto je ten expert, čo povie „takto to je“? • Existuje možnosť, že nám informácie poskytne dobrovoľne?
Riešenie: Hra • Hráči pri hrách často intenzívne a konštruktívne myslia – v záujme víťazstva • Vytvorme teda hru, kde hráč priamo či nepriamo rieši skutočný problém • Príklad za všetky: Google Image Labeller • Ľudia súťažia a zabávajú sa... • ...a popri tom „tagujú“ obrázky podľa toho čo na nich vidia, čím zároveň riešia jeden z najväčších problémov vyhľadávania informácií vôbec (vyhľadávanie obrázkov).
Little Google Game • Slovná hra s vyhľadávačom Google • Úloha: minimalizácia počtu výsledkov vyhľadávania vrátených vyhľadávačom • Hráč môže použiť len špeciálny formát dopytu • Dopyt tvorí zadaný „úlohový term“ a N „negatívnych termov“, ktoré vymýšľa hráč • Príklad dopytu: „Jaguar –car –animal“ • Negatívne termy redukujú množinu výsledkov
Little Google Game • Negatívne termy (slová či frázy so znamienkom mínus) vylučujú z výsledkov určitú skupinu dokumentov • Aby bola vylúčená skupina čo najväčšia, musia sa úlohový a negatívny term vyskytovať spolu často - zvyčajne keď spolu súvisia • Používatelia teda budú k úlohovému termu hľadať súvisiace výrazy aby dosiahli čo najväčšie skóre (najnižší počet dokumentov) • Ich pokusy zaznamenáme
Little Google Game • V prípade zhody viacerých hráčov vytvoríme prepojenia: • Výsledok nereflektuje skutočný spoločný výskyt týchto slov, ale to ako ich spolu očakávajú používatelia
LGG: Experiment • Hráči hrali hru v klientskej aplikácii • Zaistenie dodržiavania pravidiel (sprostredkuje dopyty do vyhľadávača) • Zaznamenávanie priebehu • Rebríček hráčov (podpora súťaženia) • Doteraz 32 používateľov vo viac ako 300 hrách s viac ako 2000 pokusmi • Výsledkom analýzy je graf pojmov a súvislostí • 94 uzlov (termov) a 90 hrán
„Podvádzanie“ • Motiváciou hráčov bolo hľadať účinné negatívne výrazy. • Niektorí sa snažili hľadať univerzálne negatívne termy (vhodné na každú úlohu) • Väčšina z nich boli študenti FIIT • Povolené boli len slová obsiahnuté v slovníku WordNet (Angličtina) • Okrem toho boli zakázané • Jednopísmenové slová • Prvých 300 najčastejšie sa vyskytujúcich slov v angličtine • Vybrané slová ako: google, www....
Použité technológie • Silverlight, ASP.NET (C#, XAML) • WordNet.Net – Anglický slovník • GraphToolkit – Grafová vizualizačná knižnica pre Silverlight • Google Search API (JavaScript) • MS SQL
Zhodnotenie • Povzbudivé výsledky aj v experimente malého rozsahu • Experiment odhalil viacero softvérových nedostatkov, dodal nové nápady pre dizajn hry, najmä z hľadiska hrateľnosti • Otvorené otázky: • Ktoré slová voliť ako úlohové, v záujme rovnomerného a dostatočne obsiahleho rozšírenia grafu? • Alternatívne algoritmy analýzy?