360 likes | 579 Views
Jure Leskovec Computer Science Department Cornell University / Stanford University. Velika ( socialna ) omre žja: od Facebooka do Messengerja. Danes: Splet – milijoni uporabnikov. Splet je kot laboratorij, kjer lahko preučujemo milijone ljudi.
E N D
Jure Leskovec Computer Science Department Cornell University / Stanford University Velika(socialna)omrežja: od Facebooka do Messengerja
Danes: Splet – milijoni uporabnikov Splet je kot laboratorij, kjer lahko preučujemo milijone ljudi Uporabniki za seboj puščajo sledi svojih socialnih aktivnosti Veliki on-line računalniški sistemi s stotinami milijonov uporabnikov
VELIKA omrežja Ko ustvarimo povezave iz kaosa nastane red...
Primeri omrežij c) Socialna omrežja b) Internet (AS) a) World wide web d) Komunikacijska omrežja e) Bibliografska omrežja f) Biološka omrežja
Dve vrsti vprašanj • Zakaj so omrežja taka kot so? • Kako se omrežja razvijajo? • Kakšne lastnosti imajo? • Kako se stvari razširjajo po takih omrežjih? • Kako se po omrežjih razširjajo bolezni, informacije, vpliv, ...
6 stopenj ločenosti • Small-world experiment[Milgram ‘67]: • 210 kmetov v Nebraski skuša preko poznanstev priti do borznega posrednika v Bostonu • Pravila igre: pismo lahko posreduješ enemu izmed svojih bližnjih prijateljev • Bodo pisma sploh našla cilj? • Koliko korakov je potrebnih, da najdejo cilj? • Kakšna je najboljša strategija posredovanja pisem? Problem iskanja v omrežju
6SL: Iskanje v omrežju Posrednik Kmet
6 stopenj ločenosti • Koliko pisem je našlo naslovnika? 29% • Koliko korakov (povezav) je pismo prepotovalo? Povprečna dolžina poti je 6.2 Torej, 6 stopenj ločenosti (6 degrees of separation)
MSN Instant Messenger • Seznam kontaktov • Pogovorno okno
Omrežje pogovorov na MSN MSN Instant Messenger:1 milijarda pogovorov/dan Omrežje: 240milijonovljudi, 1.3 milijardepovezav (Jun ‘06)
MSNInstant Messenger(240M ljudi, 1.3 milijarde povezav) Število poti Število korakov (povezav) med pari uporabnikov Dolžina najkrajše poti med paroma točk Povprečna dolžina najkrajše poti je6.6 90% poti je krajših od 8 korakov
Število sosedov v omrežju Uporabnik si je izmenjal sporočila z 2 milijonoma uporabnikov Delež Število sosedov v omrežju
Robustnost najkrajših poti Obojestranska komunikacija Kratke poti obstajajo. So robustne. Jih lahko najdemo? Povprečna dolžina najkrajše poti Vse povezave Omrežje z naključnimi povezavami Največje število sosedov v omrežju
Iskanje v omrežju Posrednik Vsako vozlišče (človek) pozna le svoje povezave. Kmet
Kako težko je najti soseda, ki je bližje? Verjetnost, da je naključni sosed bližje cilju Število korakov do cilja p k
Kaj pa, če uporabimo geografijo? • Ideja: • Pismo poredujemo prijatelju, ki je goegrafsko najbližje cilju Ali so najkrajše poti tudi geografsko najbližje?
Najkrajše poti niso najbližje Geografska dolžina najkrajše poti Najbližja najkrajša pot Kratke poti so 15,000 km predolge.
Ali geografija sploh pomaga? Geografija pomaga, vendar le, da pridemo bluzu k p
Kakšna je torej struktura omrežja? • V omrežju z 240 milijoni uporabnikov (5% svetovnega prebivalstva) • Kratke poti obstajajo • In so presenetljivo kratke: v povrečju le 6.6 korakov • A kako jih ljudje (z le denim poznavanjem omrežja) najdemo? • Geografija je zelo uspešna, da pridemo blizu • Potem je potrebna drugačna strategija: starost, spol, poklic, itd.
Kako se stvari razširjajo po omrežjih? Kaj, če bi lahko hkrati brali 1 milijon časopisov?
Kako se informacije razširjajo Neka obskurna novica Jonas na svojem blogu • Kaj, če bi spremljali praktično vse svetovne medije in sledili novicam, ko se razširjajo? Siol.Net SloTech 24ur.com RTV Slovenija Delo Dnevnik
Razširjanje novic na spletu • Mediji (blogi, novičarske strani, časopisi, televizije, spletni portali) objavljajo članke Lahko sledimo novicam, ko se razširjajo in se spreminjajo preko milijonov spletnih portalov
Podatki: splet • Stalno sledimo 3.6 milijonom spletnim medijem: • 20,000 časopisom in televizijam (Google News) • 3.5 milijonov različnim blogom • Vsak dan približno 1 milijon člankov Število člankov In izločimo vse fraze (dolga zaporedja besed, ki se velikokrat ponovijo) Čas [24h]
O čem se govori na spletu? Oktober Avgust
Kako se novica spreminja,ko se razširja? Our opponent is someone who sees America, it seems, as being so imperfect, imperfect enough that he‘spalling around with terrorists who would target their own country.
Mutacije med novicami Število pojavitev
Odnos med mediji in blogi (1) Blogi sledijo medijem z 2.5 urnim zamikom Delež pojavitev Čas [h]
Simbioza med blogi in mediji Blogi Preostali blogi Zgodnji blogi Delež pojavitev v blogih Mediji Mediji Čas [h]
Vprašanje ? = Imam 10 minut časa. Kateri časopis naj berem, da bom najbolje obveščen? = Kateri so najvplivnejši časopisi?
Ideja: pokritje novic =Izberimo množico časopisov, ki najbolje pokrijejo prostor novic. “novice” Splet
Isti problem: Vodovodna omrežja • Imamo: • Mestno vodovodno omrežje • Podatke o tem, kako se onesnaženje razširja po takem omrežju • Kam naj postavimo nadzorne postaje, da bomo čim prej zaznali onesnaženje? c1 S S c2
Kam postaviti senzorje? Hočemo, da čim prej zaznamo onesnaženje Hočemo, da čim manj ljudi zboli Odvisno od tega, kaj želimo
Novice: Zaključek • Lahko sledimo milijonom člankom in ljudem, ki izražajo svoja mnenja na spletu • Mnenja lahko sledimo in jih preučujemo • Kaj se tretutno dogaja na spletu? O čem ljudje razpravljajo? • Kako se informacije spreminjajo in kako jih ljudje sestavljamo? • Kakšno je razpoloženje/mnenje ljudstva?
Zaključek • Zakaj so omrežja taka kot so? • Šele nedavno lahko opazujemo ljudi v tako velikem obsegu • Potrdimo nekatere sociološke teorije, postavimo druge pod vprašaj • Prednosti analize velikih količin podatkov • Opazimo strukture in lastnosti, ki pri majhnih vzorcih neopazne
Hvala! Vprašanja? jure@cs.stanford.edu