1 / 31

Social Network

Social Network. Nhóm thực hiện : Trần Việt Dũng Phú Quang Hiển Mai Đình Lợi. Phân công công việc. Hiển : Lợi : Dũng :. Nội dung trình bày. Giới thiệu mạng xã hội Bài toán phát hiện cộng đồng trên mạng xã hội Một số thuật toán phát hiện cộng đồng Kết luận. Giới thiệu.

fern
Download Presentation

Social Network

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Social Network Nhóm thực hiện : Trần Việt Dũng Phú Quang Hiển Mai Đình Lợi

  2. Phân công công việc • Hiển : • Lợi : • Dũng :

  3. Nội dung trình bày • Giới thiệu mạng xã hội • Bài toán phát hiện cộng đồng trên mạng xã hội • Một số thuật toán phát hiện cộng đồng • Kết luận

  4. Giới thiệu

  5. Giới thiệu • Một mạng xã hội được mô hình hoá bằng một đồ thị. • các đỉnh (nút) đại diện cho mỗi cá nhân • các cạnh đại diện cho các mối quan hệ giữa các cá nhân

  6. Ví dụ

  7. Giới thiệu • Bài toán phân tích mạng xã hội có nhiều đặc tính như các bài toán trên đồ thị. • Trong đồ thị mạng xã hội các đỉnh có thể còn có chứa nhiều các thuộc tính khác nhau, và các cạnh ( các liên kết ) có thể có trọng số, hoặc có hướng

  8. Giới thiệu(tt) • Việc phân tích mạng xã hội có ý nghĩa rất nhiều trong thực tế. Nó được áp dụng ở một số vấn đề trong mạng xã hội như • phân loại nút ( cá nhân) , • gợi ý bạn bè (Friend Suggestion), • tiếp thị có mục tiêu (Targeted marketing), • dự đoán xu hướng phát triển của mạng ( Network prediction)

  9. Bài toán phát hiện cộng đồng • Một cộng đồng có thể được xem như là một nhóm các đối tượng cùng chia sẻ một vài đặc tính cơ bản • Bài toán phát hiện cộng đồng có thể được xem như đồng nhất các đồ thị con, tức là các vùng trên đồ thị được xếp vào các nhóm khác nhau.

  10. Khai phá cộng đồng trong MXH không đồng nhất • Mạng xã hội đa quan hệ • Khai phá cộng đồng phụ thuộc vào yêu cầu của người dùng dựa theo tiêu chí là truy vấn của người dùng

  11. Thuật toán Normalize Cut • Bài toán khai phá cộng đồng theo một nghĩa nào đó rất giống bài toán phân nhóm. • Giả sử có n đối tượng và k cộng đồng, và mạng quan hệ được biểu diễn như là ma trận đối xứng SRnxn., trong đó Sij biểu thị độ mạnh của mối quan hệ giữa các đối tượng.

  12. Thuật toán Normalize Cut(tt) • Thuật toán : • B1 : Định nghĩa D là ma trận đường chéo trong đó phần từ (i, i) là tổng của hàng thứ i của S, và xây dựng ma trận L=D-1/2S D1/2. • B2: Tìm y1 ,y2 ,….,yk , với k vecto đặc trưng lớn nhất của L, và tạo thành ma trận Y=[y1 y2… yk] Rn x k bằng cách chồng các vec tơ đặc trưng lên các cột. • B3 : Coi mỗi hàng của Y là một điểm trong Rk, và nhóm chúng vào k nhóm thông qua K-means. • B4 : Với mỗi nhóm, ta định nghĩa nó như là một cộng đồng.

  13. Thuật toán lát cắt giới hạn • Trong một số trường hợp, người dùng mong đợi cộng đồng được khai phá có độ lớn hợp lý và độ mạnh của quan hệ cộng đồng được khai phá đủ mạnh • Phương pháp dựa trên ngưỡng được xác định trước

  14. Thuật toán lát cắt giới hạn • Có 2 hướngtiến hành thuật toán : • Người dùng cung cấp một ngưỡng và mong đợi độ mạnh quan hệ giữa bất kì cặp đối tượng nào trong bất kì cộng đồng nào thì không nhỏ hơn ngưỡng đó • Người dùng mong đợi một số lượng nhất định đối tượng xuất hiện trong tất cả các cộng đồng được khai phá

  15. Phát hiện cộng đồng trong MXH quy mô lớn • Trên thực tế,các mạng xã hội là các đồ thị thưa rất lớn, với sự chồng chéo quan hệ giữa các nhóm đỉnh

  16. Các nghiên cứu • Một số thuật toán phân chia dựa trên betweenness như thuật toán do Girvan và Newman đề xuất: loại bỏ các cạnh phụ thuộc vào các giá trị betweenness của chúng, • Thuật toán do Radicchi đề xuất với việc sử dụng hệ số phân chia nhóm cạnh • Thuật toán do Clauset, Newman, Moore cũng đề xuất một thuật toán phân sử dụng một chiến lược tham lam để có một ΔQ lớn nhất…

  17. Thuật toán ComTector • Thuật toán phân chia dựa trên betweenness sẽ tính toán chậm trong khi các phương pháp gom cụm nhanh nói chung không thể đưa ra các chia thoả đáng do các chiến lược tối ưu hoá địa phương của nó • Thuật toán đượcđềxuất : thuật toán ComTector (Community Detector)

  18. Thuật toán ComTector(tt) • Hiệu quả cho việc phát hiện cộng đồng trong các mạng xã hội quy mô lớn bởi việc chồng chéo tự nhiên của các cộng đồng trong các trường hợp thực tế • Thuật toán phát hiện cộng đồng dựa trên liệt kê tất cả các clique lớn nhất

  19. Thuật toán lan truyền nhãn (LPA) • Với sự phát triển của mạng xã hội, kích thước của việc phân tích, phát hiện cộng đồng cũng tăng theo • Các thuật toán phát hiện cồng đồng phải nhanh, độ phức tạp của các thuật toán càng phải gần tuyến tính

  20. Thuật toán lan truyền nhãn • Ý tưởng cơ bản để có thể tăng hiệu năng của thuật toán là tránh các cập nhật không cần thiết từ thuật toán gốc • Thuật toán LPA được đề xuất bởi Raghvan để xác định cộng đồng trong các mạng lớn, với độ phức tạp gần như tuyến tính với số lượng cạnh

  21. Thuật toán lan truyền nhãn (tt) • Ban đầu, mỗi nút được gán một nhãn duy nhất. • Trong quá trình lặp lại, mỗi nút sẽ có nhãn phù hợp với phần lớn hàng xóm của chúng. • Kết thúc thuật toán, các nút cùng nhãn được kết nối với nhau tạo thành một cộng đồng

  22. Thuật toán lan truyền nhãn (tt) • Thuật toán có một số ưu điểm với các mạng thưc tế như : • không cần các tham số, • dễ dàng bổ sung, • và thời gian thực hiện nhanh.

  23. Tăng tốc độ của LPA • Ý tưởng có bản của việc bổ sung này là tránh các cập nhật không cần thiết trong mỗi vòng lặp của thuật toán

  24. Các khái niệm • Ta gọi một nút mà tất cả các nút hàng xóm của nó đều có cùng nhãn là nút phí trong (interior node) . • Những nút không interior được gọi là nút biên ( boundary). • Một nút không hể thay đổi nhãn nếu nó xâm phạm đến việc cập nhật được gọi là thụ động ( passive). • Những nút không thụ động được gọi là chủ động ( active )

  25. Tăng tốc độ của LPA(tt) • Vậy mỗi nút có thể nhận được 1 trong 3 trạng thái : phía trong thụ động, phía trong chủ động, và biên thụ động. • Thuật toán sẽ hoàn thành khi mỗi nút đều trở nên passive. • Các nút hoạt động hiện tại được chứa trong active node list.

  26. Tăng tốc độ của LPA(tt) • 1) t=0, xây dựng danh sách các nút hoạt động đang chứa trong tất cả các nút. • 2) Đặt một nút hoạt động bất kì i nào đó từ danh sách và cố gắng làm theo nhãn mới theo luật cập nhât. Mỗi nút được lựa chọn cho việc cập nhật sẽ thay đổi nhãn của chúng trong quá trình cập nhât.

  27. Tăng tốc độ của LPA(tt) • 3) Kiểm tra nếu nút cập nhật là passive thì xoá chúng khỏi danh sách. Tiếp theo, kiểm tra tất cả hàng xóm của nó cho việc thay đổi trạng thái trong bước 3. • B1:Nếu một hàng xóm phía trong trở thành active bound node thì thêm nó vào danh sách active node list. • B2: xoá bỏ bất kì các hàng xóm active trước đó, cái mà trở thành passive từ active node list. • B3: thêm bất kì hàng xóm passive bound trước đó, cái mà trở thành active tới danh sách active node list. • 4) Nếu danh sách active node list rỗng thì dừng lại. Nếu không thì tiếp tục tăng t và thực hiện bước 2.

  28. Tăng tốc độ của LPA(tt) • Bảng I đánh giá hiệu quả của việc cải thiện LPA so với thuật toán gốc.

  29. Kết luận • Về cơ bản, bài toán phân tích mạng xã hội và sâu hơn là bài toán trích rút cộng đồng về cơ bản giống các bài toán trên đồ thị • Các thuật toán để giải quyết trên lý thuyết đồ thị cũng có thể để giải quyết bài toán khai phá cộng đồng

  30. Tài liệu tham khảo • Mining Hidden Community in Heterogeneous Social Networks – DengCai, Zheng Shao, Xiaofei He, Xifeng Yan, and Jiawei Han – 2005 • ISCoDe : a framework for interest similarity-based community detection in social networks -Eva Jaho, Merkouris Karaliopoulos and Ioannis Stavrakakis -2011 • Community Detection in Large-Scale Social Networks -Nan Du,Bin WuXin Pei,Bai Wang,Liutong Xu- 8/2007 • Community Detection Using A Neighborhood Strength Driven Label Propagation Algorithm -Jierui Xie and Boleslaw K. Szymanski -6/2011

  31. Cảm ơn !

More Related