100 likes | 246 Views
OLAP を考慮した多次元インデックスでの部分空間 Join について. 2002/11/21 笹栗 茂. 現状. DFRJ 、 BFRJ 実装 Plane Sweep 導入 Search Space Restriction 導入 ノードアクセス数を減らす手法を検討中. ノードアクセス数を減らす手法の提案. Join + Restriction において アプローチ Join を高速化 木構築時にキー値に重要度 Restriction を高速化 木構築時にキー値以外に重要度. 重要度無. キー値に重要度. キー値以外に重要度. Key. Key.
E N D
OLAPを考慮した多次元インデックスでの部分空間JoinについてOLAPを考慮した多次元インデックスでの部分空間Joinについて 2002/11/21 笹栗 茂
現状 • DFRJ、BFRJ実装 • Plane Sweep導入 • Search Space Restriction導入 • ノードアクセス数を減らす手法を検討中
ノードアクセス数を減らす手法の提案 • Join+Restrictionにおいて • アプローチ • Joinを高速化 • 木構築時にキー値に重要度 • Restrictionを高速化 • 木構築時にキー値以外に重要度 重要度無 キー値に重要度 キー値以外に重要度 Key Key Key
交差領域を減らす手法について • 葉の1つ上でMBRの再構成 C 3 B ② D ⑤ 4 Join ③ 2 A ⑥ 1 ④ ① C 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 このMBRで探索することに より交差領域削減 AとCのMBRの交差領域に基づきMBRを再構成 ⇒交差領域におけるLowerとUpperの点でMBRを作成 1 1 この矩形は再構成する必要なし
例 ② D ⑤ 3 B ③ 4 ⑥ ③ Join ④ ① C 2 A 1 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 A B C D A B C D 1 2 3 4 ① ② ③ ④ ⑤ ⑥ 1 2 3 4 ① ② ③ ④ ⑤ ⑥ AとCの交差領域を覚えておき その中で1のLowerとUpperを探す [Lower,Upper]で交差するMBRをJoin A B C D A B C D 1 2 3 4 ① ② ③ ④ ⑤ ⑥ 1 2 3 4 ① ② ③ ④ ⑤ ⑥ ③のMBRはLower≦ ③ ≦ Upperで構成されていないので探索する必要なし
課題点 • Lowerが交差領域の最小に近くまたUpperが交差領域の最大に近い場合 D ② D ⑤ 3 B 4 ③ Join ⑥ 2 A ④ 1 ① C 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 AとDの交差領域におけるLowerとUpperの点でMBRを作成 1 1 この領域の探索(Eg. ④)は無駄
実験 NN・BNN HN LN Key Key Key • データ数 木A2000 木B60000 • 用いるデータ キー値以外を一様分布 キー値は0.005~1(間隔0.005) 木Bに関してはこの値をランダムに発生 • 次元数3 • 作成する木 木A 制御しない NN(1:1:1) 主キーの重要度高 HN(10:1:1) 主キーの重要度低 LN(1:10:10) 木B 制御しない BNN • 測定項目 3つの木で提案手法を導入した場合としない場合の ノードアクセス数を測定
従来手法 vs 提案手法(ノードアクセス数) ほとんど減らない
3 2 4 1 Primary Key 各位置に重複は存在しない その他有効であると考えられるOLAP(TPC-H)の特性 • Joinの条件となる属性(Join属性)はキー属性 • Joinを行う木においてどちらかの木ではJoin属性は主キー • 複合主キーでない場合、軸の各位置に存在する値は唯一 MBR1と2は横軸のみでみると交差 しかし交差範囲においてMBR1(2)中に 点が存在する位置にはMBR2(1)では点は 存在しない
今後について • その他手法について • 特性を利用 • 中間ノードに情報を保持など