1 / 44

シェリングモデルに着想を得た 軽量な分散クラスタリング手法

シェリングモデルに着想を得た 軽量な分散クラスタリング手法. ○ 津川 翔 ( 阪 大・経済 ) 大崎 博之 ( 阪 大・情報 ) 今 瀬 真 ( 阪 大・情報 ). 発表の内容. 研究の背景:接続性に基づく分散クラスタリング 関連研究 研究の目的:トポロジ変化が頻繁な環境に適した分散クラスタリング手法の実現 SBDC (Schelling-Based Distributed Clustering) シミュレーション まとめと今後の課題. 研究の背景:接続性に基づくクラスタリング. ネットワークの接続性に基づき自然な分割を決定.

halil
Download Presentation

シェリングモデルに着想を得た 軽量な分散クラスタリング手法

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. シェリングモデルに着想を得た軽量な分散クラスタリング手法シェリングモデルに着想を得た軽量な分散クラスタリング手法 ○津川翔 (阪大・経済) 大崎博之 (阪大・情報) 今瀬真 (阪大・情報) ITRC meet31

  2. 発表の内容 • 研究の背景:接続性に基づく分散クラスタリング • 関連研究 • 研究の目的:トポロジ変化が頻繁な環境に適した分散クラスタリング手法の実現 • SBDC (Schelling-Based Distributed Clustering) • シミュレーション • まとめと今後の課題 ITRC meet31

  3. 研究の背景:接続性に基づくクラスタリング ネットワークの接続性に基づき自然な分割を決定 クラスタ内のリンクが密にクラスタ間のリンクは疎になるようにクラスタを決定 MANET、WSNなどの大規模ネットワークにおけるアプリケーションの品質向上に有効 ITRC meet31

  4. 研究の背景:分散クラスタリング • 各ノードが近隣ノードの情報のみでクラスタを決定する • 大規模ネットワークにおいて求められる • ノード数やリンク数が膨大でありネットワーク全体の情報を集めるのが困難であるため ITRC meet31

  5. 関連研究:既存の接続性に基づく分散クラスタリング手法関連研究:既存の接続性に基づく分散クラスタリング手法 • CDC [Ramaswamy05] • Originator と呼ばれる特定のノードからのフラッディングにより近隣ノードの情報を収集 • SDC [Li10] • 各ノードが積極的に問い合わせを行うことにより近隣ノードの情報を収集 • 積極的に近隣ノードの情報を収集し高い精度のクラスタリングを目指す ITRC meet31

  6. 既存手法のトポロジ変化への耐性 • ノードの参加・離脱に対応しクラスタを維持する機構を備えている → ある程度のトポロジ変化には対応可能 • 頻繁にトポロジが変化する環境は想定していない → 頻繁にトポロジが変化する環境では多数の近隣ノードの情報を収集する既存手法の性能は劣化すると考えられる 頻繁にトポロジが変化する環境では、最小限の近隣ノードの情報のみでクラスタリングを行うことが望ましい ITRC meet31

  7. 研究の目的 • 動的な環境に適した分散クラスタリング手法 SBDC (Schelling-Based Distributed Clustering) の提案 • 最小限の近隣ノードの情報のみでクラスタリングを行う • シェリングモデルと呼ばれる社会モデルから着想を得る • SBDC の評価 • 動的な環境として MANET を想定したシミュレーション ITRC meet31

  8. 各エージェントは「許容水準」と呼ばれるパラメータθ (0≦θ≦1) を有する シェリングモデル 近隣 (8個の隣接セル) のエージェントのうち、自身と同じ属性を持つエージェントの比率を計算 この値が許容水準θ未満であれば空きセルに移動 同じ属性を有するエージェントの集団が形成 1/4 < θ 近隣にいる同じ属性のエージェントの比率 = 1/4 各エージェントが移動を繰り返すと 各エージェントは積極的に集ろうとしてないにもかかわらず、結果として近隣のエージェントの情報のみでエージェントの集団が形成される ※色の違いは属性の違いを表す ITRC meet31

  9. シェリングモデルの示唆すること • 社会学にとって… • Micromotives do not always match macrobehaviour • 情報科学にとって… • 一種のクラスタリングアルゴリズムと捉えられる • 単純、分散、自己組織 • 最適ではないが、効率的 • 各エージェントは自身の近隣の情報しか用いない ITRC meet31

  10. SBDC の核となるアイディア (1/4) • 接続性に基づくクラスタリングをノードの色分けと捉える • 同色の連結部分を一つのクラスタとみなす ITRC meet31

  11. 各ノードは確率 p で空き地ノードに、1-p で通常ノードになる SBDC の核となるアイディア(2/4) • 空セルとエージェントをネットワークにマッピングする 空セルを空き地ノードとして表現 エージェントを色を持つ通常ノードとして表現 ITRC meet31

  12. 同色のノードが媒介中心性の小さい辺で接続されている時、距離が近いと考える同色のノードが媒介中心性の小さい辺で接続されている時、距離が近いと考える SBDC の核となるアイディア (3/4) • 「近隣の同色のエージェントの割合」の代わりに「隣接ノードとの距離」を用いる 距離は 2 ホップの範囲のサブネットワークから得られる辺の媒介中心性の推定値を利用して求める ITRC meet31

  13. SBDC の核となるアイディア (4/4) • エージェントの移動をノードの色の交換として表現 空き地ノードは隣接ノードの中で最も多い色と同じクラスタに所属する 色を交換 ITRC meet31

  14. シミュレーションの概要 • ノードが高速に移動するMANETのトポロジ変化を想定 • 二次元平面上にランダムにノードを配置 • 無線通信範囲内に存在するノード同士はリンクを生成 • ノードの移動モデル:RWP (Random WayPoint) モデル • T [s] ごとにクラスタ更新 ITRC meet31

  15. 評価指標 • モジュラリティ:クラスタリングの精度を評価 • クラスタの更新に必要なメッセージ数:クラスタリング手法の効率性を評価 • クラスタのサイズ、孤立ノード数、クラスタサイズの変動係数:クラスタの一様性を評価 • クラスタの変更回数:クラスタの安定性を評価 全てのリンクのうちクラスタ i に属するノードの有するリンクの割合 全てのリンクのうちクラスタ i 内のリンクの割合 ITRC meet31

  16. 最小限の近隣ノードの情報しか用いていないにもかかわらず、既存手法と同程度の精度を達成することに成功している最小限の近隣ノードの情報しか用いていないにもかかわらず、既存手法と同程度の精度を達成することに成功している シミュレーション結果:静的な環境における精度 ITRC meet31

  17. シミュレーション結果:ノードの移動速度が精度に与える影響シミュレーション結果:ノードの移動速度が精度に与える影響 動的な環境であっても既存手法よりも高い精度を維持できている ITRC meet31

  18. シミュレーション結果:クラスタ更新の間隔を変化させた時の効率性と精度の関係シミュレーション結果:クラスタ更新の間隔を変化させた時の効率性と精度の関係 効率性と精度のトレードオフを考慮することで、SBDC の有効性が明らかになる SDC はクラスタ更新の間隔を短かくすることで精度を向上させることができるが膨大な量のメッセージ交換が発生する CDC は非常に単純なクラスタ更新の手法を用いているため、精度は高くない ITRC meet31

  19. シミュレーション結果:ノードの移動速度がクラスタの大きさに与える影響シミュレーション結果:ノードの移動速度がクラスタの大きさに与える影響 CDC は大きなクラスタを形成 SBDC のクラスタサイズはトポロジ変化の頻度にそれほど影響されない SDC は孤立ノードが増加し、クラスタサイズも小さくなる ITRC meet31

  20. シミュレーション結果:ノードの移動速度がクラスタの安定性に与える影響シミュレーション結果:ノードの移動速度がクラスタの安定性に与える影響 接続性に基づくクラスタリングのアプリケーションにとって好ましい性質 SBDC は比較的安定したクラスタを形成 ITRC meet31

  21. まとめと今後の課題 • 動的な環境に適した分散クラスタリング手法 SBDC (Schelling-Based Distributed Clustering) を提案 • 最小限の近隣ノードの情報でクラスタを構築 • シミュレーションにより SBDC の有効性を評価 • → 動的な環境で SBDC は既存手法を上まわる性能を発揮することを確認 • 今後の課題 • ネットワークのダイナミクスに応じて制御の複雑さを適応的に切り替える機構の検討 ITRC meet31

  22. ITRC meet31

  23. モジュラリティ 全てのリンクのうちクラスタ i に属するノードの有するリンクの割合 全てのリンクのうちクラスタ i のノード同士をつなぐリンクの割合 23 情報ネットワーク研究会 ITRC meet31 2011/11/18

  24. シミュレーション結果:クラスタ更新の間隔が効率性と精度に与える影響シミュレーション結果:クラスタ更新の間隔が効率性と精度に与える影響 SBDC は良い精度を実現できるにもかかわらず SDC と比べて効率的である ITRC meet31

  25. 静的な環境における精度 ITRC meet31

  26. 基本的なアイディア • 最小限の近隣ノードの情報のみでクラスタを形成 • シェリングモデルと呼ばれる社会モデルを応用 • 人種間の分居現象を説明した社会モデルを応用 • 最小限の近隣の人の情報に基づき各人が移動することで人のグループが形成されるという性質を利用 ITRC meet31

  27. 空き地ノード:シェリングモデルの空きセルに相当 通常ノード:シェリングモデルのエージェントに相当 色属性 (この例では3色のいずれかの色)を持つ 動作の概要:初期化 確率p で空き地ノードになる 確率 1-p で通常ノードとなり、自身の色を決定 ITRC meet31

  28. 動作の概要:隣接ノードの情報収集 隣接ノードの色および、隣接ノードのリストを問い合わせる ITRC meet31

  29. 媒介中心性:全最短経路のうち、そのリンクを通る経路の割合媒介中心性の高いリンク:クラスタの境界になりやすい媒介中心性:全最短経路のうち、そのリンクを通る経路の割合媒介中心性の高いリンク:クラスタの境界になりやすい 動作の概要:隣接ノードの類似度の計算 接続性を考慮するため媒介中心性の推定値を用いて類似度を計算 基本的な考え:同じ色のノードは類似度が高い 2 ホップの範囲のサブネットワークから媒介中心性を推定 ノードの動作を決定するため、隣接ノードの類似度を計算 14 6 隣接ノードの平均類似度:6/20=0.3 迂回路が存在しないので最短経路が多数通る ITRC meet31

  30. 許容水準 (移動するかしないかを決める類似度の閾値 ) :0.5 動作の概要:許容水準と隣接ノードの類似度の比較 隣接ノードの平均類似度 0.3 が許容水準 0.5 を下回っているため、空き地を探して移動する ITRC meet31

  31. 動作の概要:空き地ノードの探索と色の交換 深さ優先探索で空き地を探して、色を交換 ITRC meet31

  32. 動作の概要:空き地ノードの探索と色の交換 この動作を各ノードが自律分散で行う 深さ優先探索で空き地を探して、色を交換 32 情報ネットワーク研究会 ITRC meet31 2011/11/18

  33. 動作の概要:クラスタの決定 空き地ノードは隣接ノードの中で最も多い色と同じクラスタと判定 各ノードは隣接する同色のノードを同じクラスタと判定 ITRC meet31

  34. Cluster update interval vs. Message cost and Modularity score CIF 2012

  35. Simulation time vs. Modularity score CIF 2012

  36. Number of nodes vs. Modularity score in dynamic environment CIF 2012

  37. Cluster size CIF 2012

  38. Coefficient of variation of cluster size CIF 2012

  39. Number of orphan nodes CIF 2012

  40. Stability CIF 2012

  41. Application-level performance CIF 2012

  42. Tolerance vs. Modularity CIF 2012

  43. Node color vs. Modularity score CIF 2012

  44. CIF 2012

More Related