440 likes | 671 Views
Different Aspects of Social Network Analysis. 指導教授:郭文興 學生 :吳順雄. Mohsen Jamali and Hassan Abolhassani Web Intelligence Research Laboratory Computer Engineering Department Sharif University of Technology, Tehran, Iran. 目錄. Abstract I. Introduction II. Social Network Models
E N D
Different Aspects of Social Network Analysis 指導教授:郭文興 學生:吳順雄 Mohsen Jamali and Hassan Abolhassani Web Intelligence Research Laboratory Computer Engineering Department Sharif University of Technology, Tehran, Iran
目錄 • Abstract • I. Introduction • II. Social Network Models • A.Using formal methods to show Social Networks • B. Using Graphs to Represent Social Relations • C. Using Matrices to Represent Social Relations • D. Statistical Models for Social Network Analysis
目錄 • III. Social Network Properties • A. Maximum flow • B. Hubbell and Katz cohesion • C. Centrality and Power • IV. Groups and SubStructures in Social Networks • A. Cliques • B. N-Clans • C. K-plexes • V. The Web as a Social Network • A. Applying social network analysis to the Web
目錄 • VI. Inferring Communities in Web • A. Bibliographic Metrics • B. Bipartite Cores • VII. Blogsphere as Social Network • VIII. Semantic Web and Social Networks • IX. Conclusions • X. References
Abstract • 社群網路分析的重點是分析人群、組織或是國家間的關係形態。 • 社群網路分析提供了視覺和數學的分析。 • 社群網路是由網頁間的超連結組成的。 • 調查範圍從純數學分析到已知的語意網中的社群網路分析。 • 主要目的是替研究不同方面的社群網路分析提供一個路線圖。
Introduction • 社群網路是許多個體或組織間的社交結構。 • E-mail流量、疾病傳播和犯罪活動都可以被做成社群網路模型。 • 社群網路分析是測量個人、群體、組織、動物、電腦或其他資訊處理的流向和關係。 • 個人和群體是網路中的節點,而各節點間的關係和流向就是節點間的連線。
Introduction • 網路中的子群體的數量、大小和連線可以透露出整個網路的習慣。 • 在第二節,我們描述將社群網路視覺化以及分析的各種不同的模型。 • 在第三節會詳細討論一些社群網路的重要屬性。 • 網路也可以看成是一種社群網路,這在第5、6節會討論。 • BLOG是網路中一種特殊的子集合,在第7節會討論BLOG的社群網路。
Introduction • 語意網是一個新興的概念,他將網路上的資料被定義和連結,使得人們可以使用,也可以被機器處理。 • 在第8節會討論社群網路中的語意網的分析,以及他們彼此間的影響。 • 最後是結論和未來工作的步驟。
Social Network Models • A. Using formal methods to show Social Networks • 在社群網路分析使用數學和圖像技術,能表現出網路的緊密和系統化。 • 數學的表示法也能讓我們使用電腦來分析網路資料。 • 使用正規方法能讓我們從資料中找出圖像處理的技術和數學的規則。 • 分析完整個網路,可以得到一些差別: • 描述方法也可以透過圖像表達。 • 分析過程常建構於分解相鄰矩陣。 • 統計模型建構於機率分布。
Social Network Models • B. Using Graphs to Represent Social Relations • 網路分析使用的圖像表達是由點(使用者)和線(使用者間的關係)組成。 • 社會學家將這種圖示重新命名為sociograms(社會關係圖)。 • 透過顯示社會關係圖來視覺化,提供一個社群網路資料的描述方法。 • 對一個小圖形來說是足夠的,但是通常資料或研究的問題都太複雜而不能簡單達成。
Social Network Models • C. Using Matrices to Represent Social Relations • 最簡單且常見的矩陣是二元矩陣。 • 這是所有網路分析的起始點,也稱為相鄰矩陣。 • 根據習慣,傳送端是行,目標是列。
Social Network Models • D. Statistical Models for Social Network Analysis • 將彼此間有互動的個體的機率做成模型。 • 兩個最著名的方向是Markov Random Fields(MRFs)和Exponential Random Graphical Models(ERGMs),又 稱為 。 • 統計模型假設有n個使用者,再將使用者間的二元關係表示成 的 的矩陣Y。 • 使用者i與j之間有關係的話 為1,否則為0。 • 也可以在使用者i、j之間加上強度。
Social Network Models • D. Statistical Models for Social Network Analysis • 另外每個個體也可以有特性集合 。 • n次向量 是被完整觀測的共變量。 • 現有的模型有許多問題,像是衰退分析和延展性。
Social Network Properties • A. Maximum flow • 詢問許多相鄰的使用者從來源到目標的路徑,便能了解如何完全連結兩個使用者。 • 如果我需要傳給目標訊息,但是我只能透過一個使用者轉傳,即使轉傳的使用者有很多路徑可以傳給目標,這個連線還是很弱。 • 如果我有4個人可以轉傳,而且每個轉傳的使用者都有1個或多個路徑能傳給目標,則這個連線是很強的。
Social Network Properties • B. Hubbell and Katz cohesion • maximum flow是集中在兩個使用者間連線的弱點或是重複連線。 • 我們可以將連線定義為所有線路的強度。 • 如果我們想知道兩個使用者如何互相影響,則必須考慮他們全部範圍的連線。 • 即使包含了所有的連線,也不能認為長度10的路徑會跟長度1的路徑一樣重要。 • Hubbell和Katz計算了使用者間所有的連線,並且根據長度加權後發現,距離越長,連線越弱。
Social Network Properties • C. Centrality and Power • 社會學家都認為動力是社群結構的基本屬性。
Groups and SubStructures in Social Networks • 許多了解網路的人都著重在混合的連線有多密集以及發展較大的派系或小團體。 • 將使用者分成小團體,在社群結構中是很重要的概念,在了解整個網路可能發生的行為時是很重要的。 • 假設有一個使用者在兩個不同的網路各組成2個不重疊的小團體,其中一些成員是重疊的。 • 有重疊的團體間,發生的衝突會比沒有重疊的團體少。
Groups and SubStructures in Social Networks • 當團體有重疊時,動員和擴散會很快的傳遍整個網路;但是沒有重疊的團體,團體的特性就不會傳給其他團體。 • 圖形的主要特徵 • 如何分割小團體? • 小團體有多大? • 是否有部分使用者在扮演網路角色?
Groups and SubStructures in Social Networks • A. Cliques • 派系是一群網路中彼此關係比其他網路成員更緊密的人所組成的團體。 • 派系的嚴格定義,每個成員彼此間都有直接的關係。 • 普遍的定義是在團體裡與任何一個路徑距離大於1的人有連結,而通常距離都是2,也就是朋友的朋友。 • 這種基礎定義的團體,稱為N-clique,N是由允許連接到其他成員的路徑長度決定。
Groups and SubStructures in Social Networks • B. N-Clans • N-clique想找出長且連續的團體,而不是緊密但是不連續的團體。 • 但是N-clique有一個不受歡迎的特性,不是團體中的使用者也可以連接到團體中的成員。 • 分析家建議N-cliques限制兩個使用者間的延展和路徑距離。 • 這種限制也影響了N-clique裡的成員彼此間的路徑。
Groups and SubStructures in Social Networks • C. K-Plexes • 一個替代的方法是即使使用者只與其他k個成員有連結,仍然允許他是團體中的成員。 • 如果他直接連結團體中n-k個成員,可以稱為是大小為n的團體。 • 相較於n-clique分析產生大且連續的團體,k-plex分析傾向找出數量多且較小的團體
Groups and SubStructures in Social Networks • C. K-Plexes
The Web as a Social Network • 社群網路是由網頁超連結至其他網頁所組成的。 • 將網路作成模型,頂點是網頁,邊緣就是超連結。 • 可以發布和收集個人資訊是網路一開始成功的主要原因。 • 在2003年,網路開始成為多數使用者在社群方面的活動空間。 • 網站快速的成長,幾乎可以成為社群網路服務(social networking services,SNS)。 • 最早出現的Friendster吸引了超過500萬人註冊,隨後Google和Microsoft也開始類似的服務。
The Web as a Social Network • 雖然網站的內容都很類似,但是提供了一個存取的中心點,也帶來處理個人資訊分享和線上社會化的結構。 • 網站也允許使用者張貼有基本資訊的個人簡介、邀請其他人來註冊以及連結到朋友的個人簡介。 • 系統也可以視覺化,並透過瀏覽網路發現共同的朋友,或是有相同興趣,未來可能變成朋友的人。
The Web as a Social Network • A. Applying social network analysis to the Web • PageRank in Google:假設一個人無限次的亂逛網路,隨機連出每個網頁的機率是1 – p,隨機跳進一個網頁的機率是p,所以每個網頁被瀏覽的比例會不同,也就能看出哪些網頁比較熱門。 Google依照這公式模擬每個網頁的瀏覽量來評分,當使用者輸入關鍵字搜尋時,符合的項目便按照評分的高低來排序。
The Web as a Social Network • A. Applying social network analysis to the Web • Hyperlink induced topic search(HITS):超連結引誘標題搜尋有一點不同,他不是預先處理網頁,而是依靠搜尋引擎。 • 一個給HITS的詢問會先往前傳給搜尋引擎,再從網路上得到與詢問相符的網頁。 • 每個節點u在延展的圖片中有兩個相關的分數 和 ,初始成1。然後HITS再開始疊代計算 • 和 在疊代完後會標準化成1。 • 但是因為HITS是詢問-依賴的結構,所以速度會比Google慢。
Inferring Communities in Web • 社群的組成是網路上一個重要的活動。 • 已知大量的網頁,我們的目標就是從網路上找出更多潛在的社群。 • 在這節用兩種方法來驗證社群的連接拓墣。
Inferring Communities in Web • A. Bibliographic Metrics • 圖2表示兩個互補的標準,書目對(bibiographic coupling)和共被引(co-citation)。
Inferring Communities in Web • B. Bipartite Cores • 目錄學在描述兩個網頁間的相似性時是有效的。 • 一個完整的雙邊圖可以被分成兩個集合,L和R。 • , 。 • L的每一個頂點都有一個邊緣到R的頂點。 • 使用 來表示完整的雙邊圖,其中 、 。 • 雙邊的子圖因為有兩個互有關係的原因,所以與網路社群有關係
Inferring Communities in Web • 雙邊核心 有一個屬性,L上的所有頂點都有書目對的下限值r,而所有R上的頂點都有共被引的下限值l。 • 所以雙邊子圖組成的頂點在書目學上有最小程度的相似。 • 第二個原因是他們很有經驗的在網路社群的核心結構中簽名。
Blogsphere as Social Networks • 最近,BLOG成為網路上新興的社群媒介,他可以讓使用者快速且容易的發布他個人的想法。 • 由於BLOG可以超連結到網頁或其他BLOG,所以看成是多樣團體的網路。 • 部落客可以在部落格串聯中列出其他人的部落格,而且可以閱讀跟評論其他人發表的文章。 • 部落格是網路中的子集合,所以可以看成是社群網路,但是如果考慮評論和部落格間的連結,它連接的結構又有一些不同。
Blogsphere as Social Networks • 為了測量部落格的流行,GiladMishne和Natalie Glance採用兩種指標: • 連入部落格的連結數。 • 瀏覽過的網頁數。 • Ko Fujimura提出一個新的演算法“EigenRumor”,將每個部落格加權後再來評分。 • 在EigenRumor的模型中,相鄰矩陣是由代理人-物件的連結所構成,而不是網頁-網頁或物件-物件。 • EigenRumor演算法是以代理人的特性來計算分數。
Semantic Web and Social Networks • 現在無論是內部網路、外部網路或是網際網路,都在發生一場革命,也就是讓網路能有具有意義,可以理解,也可以讓機器處理。 • 這就稱為語意網,他將會讓我們轉變成對任何事物都是知識中心的觀點。 • 語意網是一種新興的概念,他能讓網路上的資料被定義,方便人類使用也可以讓機器處理。 • 語意網和社群網路模型彼此間可以互相支援。
Semantic Web and Social Networks • 要實現這些事情,會遇到許多挑戰: • 知識的表達:如何讓許多共同的東西能夠有相同的名稱。 • 知識的管理:相對於整個網路,語意網可以公正的連結到RDF 的圖片等級,但是連結到RDF的檔案等級就比較弱。所以需要更有效的存取知識,尤其是社群網路上的語意網。 • 社群網路的摘錄、整合以及分析:即使許多東西都已經被定義的很好,但是要從網路上的雜訊或是不完整的知識中正確的摘錄出社群網路仍然是非常困難的。 • 起源和信任分散的推論:如何利用信任模型中的知識的起源來管理和減少分散推論的複雜度。
Semantic Web and Social Networks • 儘管他很早開始流行,但是使用者卻很晚才發現集中社群網路服務的缺點。 • 首先,資訊是掌控在資料庫擁有者的手上,存在系統中的個人資訊是不能被輸出的,所以也就不能從一個系統轉移到下一個系統。 • 第二,集中的系統不允許使用者控制他們自己提供的資訊,而這在語意網的技術中也有被提出來。
Conclusions • 本篇paper複習了社群網路的正式表現方法和社群網路的屬性。 • 網路本身也可以算是一種社群網路。 • 在網路的社群網路中,檔案是社會關係圖的節點,檔案間的連結則是社會關係圖的邊緣。 • 部落格是網路的子集合,也可以當成是社群網路。 • 語意網是新興的概念,他可以讓網路上的資料被定義而被使用者和機器使用。 • 語意網和社群網路彼此互相支援。