100 likes | 279 Views
今後について. 2003/1/10 笹栗 茂. 研究についての今後. Joinについて 提案手法はあまり効果が無い クラスタリングによっては効果有 Join+Restrictionは 1 次元に比べ効果有 Cold の時 Hot 時で Restriction の属性が多い場合 ⇒ 現況では Join と Restriction が同時に行えるというだけの論文 Join の効率化手法の検討 多次元インデックスを Join と Restriction を含むクエリに用いることの有効性を示す 論文について 上記の状況を受けて何を題材とするのか VLDB :
E N D
今後について 2003/1/10 笹栗 茂
研究についての今後 • Joinについて • 提案手法はあまり効果が無い • クラスタリングによっては効果有 • Join+Restrictionは1次元に比べ効果有 • Coldの時 • Hot時でRestrictionの属性が多い場合 ⇒現況ではJoinとRestrictionが同時に行えるというだけの論文 • Joinの効率化手法の検討 • 多次元インデックスをJoinとRestrictionを含むクエリに用いることの有効性を示す • 論文について • 上記の状況を受けて何を題材とするのか • VLDB: • Processing Relational Join Operation with Restrictions Using R*-tree • 修士論文: • 多次元インデックスによるリレーションの空間表現とクエリ処理の効率化
論文について 現在Introductionまでが終了 関連研究の調査 1/10 • VLDB/修士論文 • 目次案 • Abstract • Introduction • Related Work • Conventional Relational Join Operations • Query Processing Using UB-tree • Representation of Relational Table by Using R*-tree • R*-treeStructure • Representation of Relational Table Using R*-tree • Characteristics of Data in relational tables • Enhancing R*-tree to be suitable for representing relational tables • Normalization • Area修正 • Processing Join Operation with Multi-attribute Restrictions Using R*-tree • Join Algorithms Using R*-tree (Spatial Join) • Applying Spatial Join to Relational Join Operation • Modified Join Algorithm Using R*-tree Specialized for Relational Model and Queries • Experiments • Conclusion 龍君の論文引用 1/16 来週中(1/17)には第 0 Versionを完成したい
UB-TreeでのJoinを含むクエリの処理 • UB-Treeの論文[1]にTPC-Hクエリ(Q3)をどのように処理するかが記載 TPC-H Benchmark Query Q3 [1]:Processing Operations with Restrictions in RDBMS without External Sorting: The Tetris Algorithm. V. Markl, M. Zirkel, R. Bayer., ICDE’99
標準的なQ3の処理木 ω(REVENUE,ORDERDATE) Hash結合やソートマージ結合 など結合手法は考えられるが ここではソートマージ結合使用 σ:Selection ∞:Join γ:Grouping ω:Ordering M:Merge τ:Tetris γ(ORDERKEY,ORDERDATE, SHIPPRIORITY) ∞ ORDERKEY ω(ORDERKEY), M(ORDERKY) ソートマージ結合 ∞ CUSTKEY ω(CUSTKEY), M(CUSTKEY) Selection σ(MKTSEGMENT) σ(SHIPDATE) σ(ORDERDATE) CUSTMER ORDER LINEITEM
Tetrisを用いたQ3の処理木 (UB-TreeでのQ3の処理) ω(REVENUE,ORDERDATE) σ:Selection ∞:Join γ:Grouping ω:Ordering M:Merge τ:Tetris γ(ORDERKEY,ORDERDATE, SHIPPRIORITY) M ORDERKEY ω(ORDERKEY) マージ M CUSTKEY Selectionとソート τ ω(CUSTKEY) σ(MKTSEGMENT) τ ω(CUSTKEY) σ(ORDERDATE) τ ω(ORDERKEY) σ(SHIPDATE) CUSTMER ORDER LINEITEM
今後の研究計画① • UB-TreeではTetrisアルゴリズムを用い、ソートとSelectionを同時に実行し、結果をマージ • 本研究はJoinとSelectionを同時に実行 ⇒どのような比較実験を行うか ・R*-tree上でのソートアルゴリズム(龍君が卒論で作成) を用いてソート+Selection→マージ ・Join属性でない属性で1次元インデックス作成し、 Selectionの後 ソートマージ結合 ・Join+Selectionを比較 • ソートアルゴリズムの実装必要 • ソートマージ結合の実装必要
今後の研究計画② • 2次元でのJoinについて • 何と比較するのか • 2次元のキー値のみでインデックス作成したものとRestrictionの属性も含むインデックスとの比較 • 1つのテーブルに1次元インデックスを二つ作成し結果をソートマージ結合するものと多次元インデックスとの比較
今後の予定 • VLDB論文 • 第 0 Versionを来週中 • 実験 • 研究計画①, ②に必要なものを実装 • 1月中旬から後半 • 比較実験 • 1月後半 • 修士論文 • 1月後半からVLDB論文と平行して