1 / 22

R * -Tree を用いた部分空間での Join について

R * -Tree を用いた部分空間での Join について. 2002/9/18 笹栗 茂. 前回までの実装. 木の構造、高さが同じ場合は Join + Restriction が可能 ⇒ 木の高さが違う場合について. 木の高さが違う場合の Join. 木の高さが同じ部分木同士を Join 高さが高い方の木を低い方の木の高さまでくだる 各ノードに 横のノードへの参照 を持たせ、それを辿り順次 Join. X. Y. Join. R. S. A. B. C. D. ①. ②. ③. ④. ⑤. ⑥. 1. 2. 3. 4. ①.

oki
Download Presentation

R * -Tree を用いた部分空間での Join について

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. R*-Treeを用いた部分空間でのJoinについて 2002/9/18 笹栗 茂

  2. 前回までの実装 • 木の構造、高さが同じ場合はJoin + Restrictionが可能 ⇒木の高さが違う場合について

  3. 木の高さが違う場合のJoin • 木の高さが同じ部分木同士をJoin • 高さが高い方の木を低い方の木の高さまでくだる • 各ノードに横のノードへの参照を持たせ、それを辿り順次Join X Y Join R S A B C D ① ② ③ ④ ⑤ ⑥ 1 2 3 4 ① ② ③ ④ ⑤ ⑥ 高さが同じ部分木でJoin

  4. 実験 NN・BNN • データ数  木A2000 木B60000 • 用いるデータ キー値以外を一様分布 キー値は0.005~1(間隔0.005) 木Bに関してはこの値をランダムに発生 • 次元数  3 • 作成する木 木A 制御しない NN(1:1:1) 主キーの重要度高 HN(10:1:1) 主キーの重要度低 LN(1:10:10) 木B 制御しない BNN • 測定項目 • Restrictionなしのノードアクセス数 • キー値以外でのRestriction1次元、2次元をいれて100回試行した平均のノードアクセス数(Selctivity(幅)が10,20,30,40,50,60,70,80,90%) ここでのノードアクセス数は木Bのみ測定。 よって実際のノードアクセス数は約2倍となる Key HN Key LN Key

  5. 実験結果- 木について

  6. 実験結果- ノードアクセス数(Restriction なし)

  7. 実験結果- ノードアクセス数(Restriction 1次元 木Aのみ)

  8. 実験結果- ノードアクセス数(Restriction 1次元 木Aのみ)

  9. 実験結果- ノードアクセス数(Restriction2次元 木Aのみ)

  10. 実験結果- ノードアクセス数(Restriction2次元 木Aのみ)

  11. 実験結果- ノードアクセス数(Restriction1次元 木Bのみ)

  12. 実験結果- ノードアクセス数(Restriction1次元 木Bのみ)

  13. 実験結果- ノードアクセス数(Restriction2次元 木Bのみ)

  14. 実験結果- ノードアクセス数(Restriction2次元 木Bのみ)

  15. 実験結果- ノードアクセス数(Restriction1次元 木A、B)

  16. 実験結果- ノードアクセス数(Restriction1次元 木A、B)

  17. 実験結果- ノードアクセス数(Restriction2次元 木A、B)

  18. 実験結果- ノードアクセス数(Restriction2次元 木A、B)

  19. 考察 • 全体を通して主キーの重要度を高くした場合が良い • 主キーの重要度低の場合、Selectivityが小さい時はRestriction無しに比べノードアクセス数の減少度大 • しかし全体的にノードアクセス数が多い • 同じノードを複数回訪れるため ⇒LNの場合影響大

  20. ノードアクセス数を減らす手法(DFRJの論文より)ノードアクセス数を減らす手法(DFRJの論文より) • Restricting Search Space R∩Sと交差しないMBRは相手のノードのMBRとは交差しない R まずR∩Sと交差するMBRを見つけ、その後、相手のノードのMBRと交差判定を行なう S R,Sはノード中の全てのMBR を含むMBR この領域に含まれるエントリのみを 下位ノードで交差判定 これはノードアクセス数を減らすのではなく比較回数を減らす。

  21. 改良できる点 • □の部分を交差判定に用いる 同じレベルの部分木でJoinを行うので交差判定に 使われない X Y Join A B C D R S 1 2 3 4 ① ② ③ ④ ⑤ ⑥ ① ② ③ ④ ⑤ ⑥ 交差判定を行い、下位レベルでの 交差領域を絞り込む X Y A B C D R S 1 2 3 4 ① ② ③ ④ ⑤ ⑥ ① ② ③ ④ ⑤ ⑥

  22. Joinについての今後 • 木Bも制御した場合について、TPC-Hデータでの実験 • Restricting Search Spaceの導入 • Join属性の片方は主キーなどをふまえた交差領域を減らす手法の考察 • BFRJについても考察

More Related