80 likes | 236 Views
Web Graf. Bc . Michal Oceľák Študijný program: Informatika Vedúci : doc. RNDr . Gabriel Semanišin , PhD. Ústav : ÚINF - Ústav informatiky. Cie ľ. Analyzovať existujúce modely Web-u a sociálnych sietí . Analyzovať algoritmy vyhľadávania informácií na Web-e.
E N D
Web Graf Bc. Michal Oceľák Študijnýprogram: InformatikaVedúci: doc. RNDr. Gabriel Semanišin, PhD. Ústav: ÚINF - Ústavinformatiky
Cieľ • Analyzovaťexistujúcemodely Web-u a sociálnychsietí. • Analyzovaťalgoritmyvyhľadávaniainformáciína Web-e. • Navrhnúťmodifikácieexistujúcichmodelov a vyhľadávacíchalgoritmov pre špecifickésiete a podsiete (napr. sieťuniverzity). • Navhnutéalgoritmyimplementovať a experimentálneoveriť.
Web vs. Klasické dokumenty • Je obrovský • Viacako 10 miliárdstránok, priemernáveľkosťstránky500KB • 20-krát väčšie ako LibraryofCongress • Je dinamický • 40% stránok sa mení týždenne, 23% .comdomien denne • Ročne pribudnú miliardy webstránok • Je neorganizovaný • Žiadne normy, formáty. Chyby, spamy, ...
Analyzovaťexistujúcemodely Web-u a sociálnychsietí. • Web ako komplexný graf • Small-World siete • Biologickésiete • Erdös{Rényi model) – náhodné grafy • Scale-Free siete
Analyzovaťalgoritmyvyhľadávaniainformáciína Web-e. • Vyhľadávače založené na hyperlinku • PageRank(Google) • HITS (TEOMA) • ...
Navrhnúťmodifikácieexistujúcichmodelov a vyhľadávacíchalgoritmov • Výber najvhodnejšieho/najvhodnejších modelov a vyhľadávacích algoritmov
Literatúra • Barabasi, A. L., Albert, R., Emergence of scaling in random networks, In: Science (New York, N.Y.) 286.5439 (1999), pp. 509-512. • Bonato, A., A Course on the Web Graph, American Mathematical Society 2008. • Kleinberg, J., Authoritative sources in a hyperlinked environment, Journal of the ACM 46 (1999) No. 5, 604-632. • Langvile, A.N., Meyer, C.D., Google's PageRank and Beyond" The Science of Search Engine Rankings, Princeton University Press, Princeton, 2006.