670 likes | 983 Views
Social network analysis & friend network in blogosphere. 吳邦一 樹德資工系. Social network. Node: actor (people, group, organization) Arc (edge) : social relation tie, such as friend, collaboration, message transmission … Directed or undirected (bidirectional or unidirectional) Friend network:
E N D
Social network analysis & friend network in blogosphere 吳邦一 樹德資工系
Social network • Node: actor (people, group, organization) • Arc (edge) : social relation tie, such as friend, collaboration, message transmission… • Directed or undirected (bidirectional or unidirectional) • Friend network: • Node: people • Arc: friend relationship • In blogosphere: a node is a blog
Friend relation in blogosphere • By data mining • Similar hyper-linking • Similar interests • comments • Cross posting • From the explicit friend lists maintained by bloggers themselves
Friend network in Blogosphere • A node is a blog • X1 在x3的朋友清單中但x3不在x1的朋友清單中 • X1 在x2的朋友清單中而且x2也在x1的朋友清單中
Why unidirectional friends? • 在大多數的Blog系統中,加入一個好友是不需要對方認可的 • Hub effect:藝人、名人、正妹帥哥 • 別忘了無名是以相簿起家 • 包括:wretch, yam, xuite, pchome • 台灣大概只有MSN live space and pixnet的好友需要確認
Balance theory • People tend to maintain balanced relationship: • Reciprocity: bidirectional tie • symmetry, undirected • Transitivity: a friend’s friend tends to be friend • Bloggers like to but hard to know • Who add me as a friend • Also hard to know a friend of distance more than 2
誰加入你為好友 • 在某人A的部落格網頁上, 你可以看見他的好友清單(如果他有, 而且是開放的), 但是你無從得知有哪些人將A加入好友, 除非.... • 你把所有其他的部落格看一遍來個地毯式搜索徹底檢查 • Like a one-way function • Easy to find the outgoing arcs but hard to find the incoming arcs
人緣列表 • Only in few blog systems (in Taiwan) • MSN live spaces, Pixnet : need confirmation • Yam(天空部落)提供人緣列表 • Other blog systems in Taiwan • Wretch, PCHome, Xuite, Blogger, Yahoo, Sina, … • Wretch just provides the service recently.
Why crawling the friend network • 學術研究 • Social network analysis: • 傳統上只能做小型社群: data acquisition • Online data: 有機會分析大型的朋友網路 • Newman (01): Scientific collaboration networks • Ahn (07): CyWorld, 超過一千多萬人,韓國最大Blog系統 • 提供bloggers查詢服務 • 人際關係搜尋引擎
WARM – blog friend relationship search service http://warm.stu.edu.tw
想知道誰將你加為好友 1 2 3 4
想知道誰將你加為好友(續) • 輸出畫面中包含 • 雙向好友(雙箭頭表示) • 單向好友(單箭頭表示) • 點選鄰近程度可顯示你與對方的距離
關係搜尋 1 2 3 4 5
利用關係搜尋 • 若ksbcboy想認識lindy7684,ksbcboy可以利用【關係查詢】輸入自己與對方帳號後查出現面的結果。 • 這表示要認識lindy7684,他可能要先認識suzuka,想認識suzuka可能得先認識cristin,而要認識cristin可以從yulu著手,而yulu本身就是ksbcboy的朋友。
利用關係搜尋(續) • 上面的例子中,只查出一條線,更通常的情形可以查出很多條路線,例如如果nocold同樣去查lindy則會得到下面的結果,這時候代表他有很多條路線可以進行
人氣排名 • 這是一個輸出的例子,當然,排名一值會有改變。 • 這裡也顯示關注人數增加或減少的情形以及排名的升降,另外,也提供簡單的評論功能。 • WARM的資料更新跟其他搜尋引擎是一樣的,並無法做到及時更新,所以增減的改變要在下一次資料更新時才會顯現。上次更新日期顯示在首頁中。
相似人氣 • 如果我們去查詢Jolin的相似人氣,會得到類似右圖的結果。這表示加入Jolin的那些人中有10684位(29%)也加SHE為好友。 • 除了看哪些人的粉絲重疊比較高之外,也可能發現跟你相似人氣者其實是你的一位朋友。
相似好友 • 相似好友與相似人氣很像,不同的是,他是查詢「你所加的那些好朋友其實也是誰的好朋友」 • 此外,相似好友還有一個用途是可能找到志同道合的人,也就是他加入的blog跟你很像,那麼,他可能跟你興趣相同。
好友群 • 所謂好友群是指一群彼此聯繫緊密的朋友,她們內部聯繫緊密,而對外部的人的連結相對較疏 • 一個人的好友通常可以分成若干群 高中同學 國中同學 女朋友
利用好友群功能 • 如果我們去查lindy在無名的好友群,會得到類似右圖的結果 • 通常可用來了解你的朋友中哪些人彼此關係比較密切。 • 發現他聯誼所認識的女孩子跟他的哪位朋友彼此有互連。
有什麼用途? 對資工人來說,不過是BFS, database, shortest path, 網頁程式等簡單技術的應用(除了好友群) 他有用嗎?
使用者需要的,就是有用的 我們不過證實了使用者的需求 – ISP最需要知道的事情 社會科學是在研究人的行為
網站只是為了滿足人類的偷窺慾望嗎? 人類在網路上的社交行為已經成為趨勢,無法討論對錯,只能讓它變得更好 為何網路使用者會成為宅男腐女?
把要去台北的人帶上火車才發現鐵軌只舖到台南把要去台北的人帶上火車才發現鐵軌只舖到台南 • 網路社群平台的最終目的為何? • 社交平台,擴大人際關係 • Social network 的diameter會隨時間變小 • 在真實社會中,我們會藉由社交活動認識朋友的朋友,擴大自己的人際關係,但是在網路上,Blog能提供足夠的交友功能嗎? • Only publish, comments, cross-posting • 越來越宅
提供更多的社會活動服務為各平台提供商的責任與趨勢提供更多的社會活動服務為各平台提供商的責任與趨勢 目前僅僅剛開始, 勢必有越來越多的服務
隱私權迷思 • 抓到劈腿對我們來說是個意外,這樣的意外是不是我們的錯誤?然而,換一個角度想,常看到網友受騙的情事,如果這個網站,可以讓人在結交往有時了解一下對方的交友狀況,不也有預防犯罪的功能嗎? • 公開此服務讓網友了解別人可以對你做什麼,如果你不願意,把你的資訊設為保密狀態吧!
隱私權的問題 • 媒體報導過於辛辣,讓人有揭發隱私之錯覺 • We have only public data • 劈腿故事與單向好友的迷思 • 別人出賣你是否是我的錯 • 有人大叫「我愛林志玲」此是否為林志玲的隱私
The difficulty of blog friend network analysis • Blog friend relation differs from the real one • Data incompleteness • suffered for all social network analyses • Hub-effect • Only for unidirectional relationships • How to verify • Traditional method • Network reconstruction • good metrics need to be defined
How to compute • BFS • O(mn) is too time-consuming • Random sampling (100 nodes is enough) • Is diameter a good metric? • Usually not strongly connected • Effect diameter (90 percentile)
六度分離理論 • 六度分離理論:大多數的人之間距離不超過6 • 所謂的關係,定義很模糊, 我們都有很熟的朋友, 也有很多不怎麼熟的朋友. • 在BLOG上, 並非朋友都會設定好友, 從這一點上來說, BLOG的好友比現實生活稀疏; • 另一方面, 設為好友的未必是朋友(如名人或是仰慕的對象), 從這一點來說, BLOG好友又較真實來得多一些 • 整體來說, 除去名人效應(而名人通常並不設很多的好友), BLOG的好友連接比真實來得少, • 如果人們會透過WARM的查詢而發現原來未設好友的朋友, 因而拉近了彼此的距離, 這就是WARM當初所希望做到的
Degree 分佈 (log-log scale) Power-law with two slops Big-tail 三種會員等級