60 likes | 232 Views
Roman T áborský Vyhladávanie informácii 2010/2011. Rank algoritmy. Rank algoritmy. Algoritmy ktoré hodnotia dokumenty na základe kritérii Z ískavanie relevantných dokumentov Vzájomne sa môžu dopĺňať Každý má iné kritéria Implementácia Pomocou grafu Počet iterácii “ Treshhold ”.
E N D
Roman Táborský Vyhladávanie informácii 2010/2011 Rank algoritmy
Rank algoritmy • Algoritmy ktoré hodnotia dokumenty na základe kritérii • Získavanie relevantných dokumentov • Vzájomne sa môžu dopĺňať • Každý má iné kritéria • Implementácia • Pomocou grafu • Počet iterácii • “Treshhold”
PageRank • Základný algoritmus pre google • Hodnotí stránky na základe počtu príchodzých odkazov • Vplyv stránky záleží od jej výstupných odkazov • Hodnotenie stránky závisí od hodnotenia stránok ktoré na ňu odkazujú
TrustRank • Doplnok pre algoritmus PageRank • Takmer rovnaký algoritmus výpočtu • Dobré stránky sa linkujú medzi sebou • Úvodná propagácia dôveryhodnosti • Oracle – niekto kto povie či je stránka ”trustworthy” – dôveryhodná
Opic, HITS • OPIC • Iteračný pohyb cez jednotlivé stránky • Kritéria: importance, history, cash • Rôzne stratégie prechodu na ďalší dokument • HITS • Hub a authority stránky • Kategorizácia stránky závisí od počtu príchodzích a odchádzajúcich odkazov • Huby sa často odkazujú na autority
Hilltop • Algoritmus na vyhodnotenie real-time dopytu • Využíva triedenie dokumentov na základe informácii o obsahu • Title, kľúčové slová ... • Ručné definovanie expertných stránok • Stránka je hodnotená na základe toho koľko expertných stránok sa na ňu odkazuje