A Model of Information Foraging via Ant Colony Simulation

Matthew Kusner A Model of Information Foraging via Ant Colony Simulation

Information Foraging • Theory Background • People search for information in roughly the same way that animals search for food in their surroundings. • Information Scent • Ex: “the text associated with Web links” (Fu, 2007) • Background knowledge • Recommendations

Ant Colony Simulation • Pheromone trails • Laid by ants who've found food. • Followed by other ants with probability p. • Path Evaporation • Path Optimization • Simulation specifics

AOL Data Set • 21 million queries (March 1– May 31, 2006) • 650k users19 million click-through events • Quantities: querytime of query • click URLuser IDclicked link rank

Information Foraging → Ant Colony • user → ant • clicked link → food • information scent → pheromone path • website importance → food distance • where website importance is defined by: • 1. Rank • 2. Popularity of website • 3. Combination of above methods

Distancing Methods • Ranking • Popularity • Combination [based on data in Joachims et al., 2005]

Results • AOL user-visit per website vector • [numWvisits1, numWvisits2, ..., numWvisitsn] • Simulation ant-visit per food vector • [numAvisits1, numAvisits2, ..., numAvisitsn] • Pearson Correlation Score (PCS) • Permutation Test → 95% Coverage Interval • (AOL_datai, simulation_datai) selection with replacement • Bootstrapping → p-value • Shuffle AOL vector

Results • Queries with significant p-values: • vacation” (ranking), “baseball” (ranking), “reebok” (ranking), “adidas” (ranking), “marbles” (ranking), “helicopter” (ranking), “car” (ranking), “potatoes” (ranking), “coffee” (ranking), “farming” (ranking), “rock” (popularity), “shirts” (ranking), “playstation” (ranking), “sega” (popularity), “tom cruise” (ranking), “mel gibson” (ranking), “burger king” (ranking), “chicago” (ranking), “los angeles” (ranking), and “paris” (ranking) • Distancing methods without 95% CI overlap: • Ranking: • “potatoes” - neither popularity, nor combination • “shirts” - not popularity • “playstation” - not popularity • “burger king” - not combination

Discussion • Disadvantages of popularity and combination methods • “vacation” example • Possible reasons for 95% CI overlap • Randomness • Disregard of structure • Significance of queries with low p-values • Search engine matching • Future directions • Different Simulation • Other similarity metrics • Random beginnings

References • Fu, W., & Pirolli, P. (2007). SNIF-ACT: a cognitive model of user navigation on the World Wide Web. Human-Computer Interaction, 22(4), 355-412. • T. Joachims, L. Granka, B. Pang, H. Hembrooke, and G. Gay (2005). Accurately Interpreting Clickthrough Data as Implicit Feedback, Proceedings of the ACM Conference on Research and Development on Information Retrieval (SIGIR).

A Model of Information Foraging via Ant Colony Simulation

A Model of Information Foraging via Ant Colony Simulation

Presentation Transcript

Ant colony algorithm

Ant Colony Optimization

Ant Colony Optimization

Ant Colony Optimization

Ant Colony Optimization

Ant Colony Optimization

The Regulation of Ant Colony Foraging Activity without Spatial Information

Ant Colony Optimization

Ant Colony Optimization

Ant Colony Optimization

Ant Colony Optimisation

Ant Colony Optimization

ANT COLONY OPTIMIZATION

Computational Representation of Ant Foraging

Ant Colony Optimization

Ant colony algorithm

Computational Representation of Ant Foraging

Ant Colony Optimization

Ant Colony Optimization

Ant Colony Optimization

ANT COLONY OPTIMIZATION