260 likes | 572 Views
Sisteme de recomandare. Lupuleţ Corneliu Neculciu Filip Velişcu Ovidiu Ţambrea Constantin Tăbărana Cristian. Sisteme de recomandare.
E N D
Sisteme de recomandare Lupuleţ Corneliu Neculciu Filip Velişcu Ovidiu Ţambrea Constantin Tăbărana Cristian
Sisteme de recomandare Un sistem de recomandare este un instrument care încearcă să prezinte utilizatorilor, obiecte şi noţiuni de interes pentru aceştia (filme, muzică, ştiri, imagini, persoane). Recomandarea se face pe baza cunoaşterii (explicită sau implicită) a profilului utilizatorului (modelul de preferinţe)
Descriere formală • U mulţimea utilizatorilor • A mulţimea articolelor cunoscute de sistem (şi care pot fi recomandate) • funcţie care măsoară interesul unui utilizator pentru un anumit articol Scopul De a estima cât mai bine această funcţie în punctele în care nu este definită, adică de a prezice ce anume este posibil să-i placă (şi cât de mult) unui utilizator ale cărui “gusturi” apreciem că sistemul le cunoaşte.
Clasificare Construirea profilului utilizatorului se poate face în mod: • explicit - sistemul cere informaţii de la utilizatori (ex: note acordate filmelor) • implicit - prin analiza articolelor sau paginilor web vizitate În funcţie de tehnica de estimare folosită, există • recomandări bazate pe conţinut • recomandări colaborative Filtrare colaborativă: • utilizator • articol • atribut
Probleme La sistemele bazate pe filtrare colaborativă centrată pe utilizatori există două probleme bine-cunoscute: • First-Rater Problem - Problema articolelor nou introduse în baza de date; • Cold-Start Problem - Problema utilizatorilor nou veniţi în sistem
Item-based filtering • Filtrare user-based - probleme de scalabilitate • Item-based - avantaj - procesul de determinare a similarităţii între articole poate fi independent de cel de prezicere (recomandare) şi poate fi realizat offline. • Poate fi îmbunătăţit cu informaţii semantice provenite din alte surse (ex: ontologii specifice domeniului) • Se poate folosi tehnica "Latent Semantic Indexing" (LSI) pentru reducerea dimensiunii matricii iniţiale (item, item) la un grup restrâns de atribute strâns corelate.
Exemple de Sisteme - Google News - Amazon - Yahoo Movies! - iTunes - Youtube - StumbleUpon - Photoree - BookLamp
Crearea unui profil Probleme: • sistemul are nevoie de multe informații pentru a funcționa cu o precizie acceptabilă • utilizatorul nu are: • timpul • dorința • cunoștințele • să dea explicit toate informațiile de care sistemul are nevoie
Solutia Google: Web History Web History este o facilitate introdusă de Google pentru a reţine ce pagini a vizitat utilizatorul.
Avantaje/Dezavantaje Avantaje: • adună date foarte repede • odată format, sistemul este foarte stabil - anomaliile de comportament cauzate de curiozitate, greșeli, etc. au efect neglijabil Dezavantaje: • cold-start - sunt prezentate subiectele cele mai populare, nu neapărat cele mai interesante pentru utilizatorul curent • funcționează doar dacă utilizatorul e logat pe contul de google și a activat Web History • poate fi lent in detectarea schimbărilor de preferințe
StumbleUpon • comunitate Web • facilitează descoperirea de site-uri • sistem de recomandare bazat pe utilizator • peers (utilizatori cu "gusturi" similare) • friends (aleşi de utilizator) • filtrare colaborativă (eng. "colaborative filtering") • automatizează "word of mouth"
Avantaje / dezavantaje Avantaje: • viteza • practic pentru număr uriaş de site-uri comparativ cu analiza de conţinut Dezavantaje: • "First-Rater" problem • "Cold-Start" problem • rating-uri subiective
Yahoo Movies! Industria filmelor este foarte vastă. Din acest motiv, a fost necesar un algoritm de recomandare diferit, optimizat şi pentru filme vizionate de către puţini utilizatori. Sistemul folosit de Yahoo Movies! se bazează pe motorul de recomandare făcut de Choice Stream: Modelarea bayesiană a preferinţelor pe baza atributelor (eng. Attributed Bayesian Choice Modelling).
Avantaje/dezavantaje • Avantaje: • "First-Rater" Problem dispare • "Cold-Start" Problem este atenuată • Eficienta recomandărilor • Dezavantaje: • Alegerea valorilor atributelor este subiectivă
Genius • Genius este un feature introdus în aplicaţia iTunes începând cu versiunea 8 • generează automat o listă de melodii similare cu melodia curentă • pentru utilizare este nevoie de cont iTunes • Genius va colecta periodic informaţiile legate de utilizator şi bibliotecile personale de melodii şi le va trimite în mod anonim la baza de date Apple • Genius analizează metadatele melodiilor(ritmul, ratingurile, poziţia în playlisturi) • se presupune ca Genius creează amprenta acustică a melodiilor • strategie comercială
Avantaje/Dezavantaje Avantaje: • Genius este un feature util userilor care vor să asculte melodii "înrudite" sau chiar să le cumpere Dezavantaje: • trimiterea datelor în anonimat reduce Genius doar la un sistem bazat pe itemi • înclinatie spre comercial şi nu spre utilizator
Bibliografie Semantically Enhanced Collaborative Filtering on the Web: http://maya.cs.depaul.edu/~mobasher/papers/ewmf04-web/ewmf04.html Item based collaborative filtering recommendation algorithms: http://www.cs.tau.ac.il/~fiat/dmsem03/ItemBasedCollaborativeFilteringRecommendationAlgorithms.ppt StumbleUpon's recommendation technology: http://www.stumbleupon.com/technology/ Google News http://www.searchenginejournal.com/google-news-adds-most-popular-recommended-sections/2809/ Collaborative Filtering vs Attributed Bayesian Choice Modelling http://behavioraltargeting.info/downloadattachment.php?aId=cf74d490a8b97edd535b4ccdbfd0df55&articleId=31
Vă Mulţumim! Întrebări ?