380 likes | 503 Views
Geometric-Similarity Retrieval in Large Image Bases. 牧之内研究室 修士1年 陸. Ioannis Fudos, Leonidas Palios and Evaggelia Pitoura Proceedings of the 18th International Conference on Data Engineering. Introduction. 大きなイメージ・ベースからの与えられた形に似ているイメージを問い合わせする新しい方法 シェイプの間の平均ポイント距離に基づく、形類似性基準上の方法構造
E N D
Geometric-Similarity Retrieval in Large Image Bases 牧之内研究室 修士1年 陸 Ioannis Fudos, Leonidas Palios and Evaggelia Pitoura Proceedings of the 18th International Conference on Data Engineering
Introduction • 大きなイメージ・ベースからの与えられた形に似ているイメージを問い合わせする新しい方法 • シェイプの間の平均ポイント距離に基づく、形類似性基準上の方法構造 • 類似性基準はひずみに寛容で、各形の中の頂点数かベクトルのオーダーに依存しません
a pixel-based shape similarity • 単に小さな回転および移動を許可する • 類似性基準はしたがって非常に高い次元(イメージ中のピクセルの数に線形)を仮定します、次元減少して実行されます
階層面マッチング • エッジからの情報を使用して、距離イメージを作成し、次に、距離イメージ中の合計距離値を最小限にしようとします、そして、輪郭を取ります • 階層面マッチングは全く正確な結果を与えるが、1つの問い合わせ当たりすべての抽出された輪郭に長い計算を掛かります
幾何学的なハッシュ法に基づいたイメージ問い合わせ方法 • 寄与するライン・セグメントに基づいた形のハッシュ記号を計算します • 回転と移動に敏感です
max morphological distance • max morphological distance [11]に基づいた最も近い隣の形探索 • 任意のポイント・セット(例、腫物および他の医学の画像処理クラスタ)のためにうまく出来ますが、問い合わせスペースに高次元の形問い合わせは再び曖昧です
組織 • 形の類似性基準とアルゴリズム • 幾何学的にハッシング • 外部記憶装置 • 問い合わせ処理アプローチ • GeoSIR、プロトタイプ・システムについて
2. Geometric Similarity and the Matching Algorithm • Motivation • Geometric Similarity • Efficient Retrieval of Similar Shapes • Populating the Shape Database • Outline of the Matching Algorithm
2.1. 1動機 Hausdorff distance Given two finite point sets A = {a1,…,ap} and B = {b1,…,bq} H(A, B) = max(h(A, B), h(B, A)) where
2.2.幾何学的な類似性 • 類似性基準 ポイント平均最小の距離に基づいた類似性基準を使用します Havg(A,B)= averagea∊ A min b∊ B d(a,b) • 効率的に計算することができます • それは規模、移動および回転不変式です 図1の例では、類似性手段で、BがAよりQに接近しています
2.3.類似形の効率的な検索 イメージ検索アルゴリズムについて記述する前に2つの重要な考えを示します: • 形の直径の標準化 • ∊-envelopeの概念
2.3.1形の直径の標準化 直径の標準化は形の最も遠いペア頂点を(0, 0) (1, 0)に位置されるように、平行移動し、回転し、拡大縮小します
2.3.2 ∊-envelopeの概念 アルゴリズム(図3)は形のエッジ毎をある距離で問い合わせ形のエッジと平行なラインをとることにより計算される問い合わせ形を「fattened」バージョンにするということですこのfattened 形を∊-envelopeと呼びます
2.3.3効果の例 アプローチより多くのスペース効率であることに加えて、ローカルのひずみの影響を受けにくい
2.4.形データ・ベースの保存 • 形の直径(最長のEuclidean距離を示す頂点ペア)を計算します • すべての頂点ペアその距離が少なくとも直径の長さの1-a倍である(0≤a<1) • 各形は、ポイント(0,0) (1,0)にa-直径を 2度保存されます
2.4.形データ・ベースの保存 (0,0) (1,0)
2.5. Outline of the Matching Algorithm 最も良くクエリー形と一致するデータ・ベース形の検索用のアルゴリズムの基礎的なステップは次のとおりです: • 初期の∊1値を計算します • (∊i-envelope- ∊i-1-envelope) の内部で落ちるデータ・ベース形の頂点を集めます • 少なくとも1の分数1-(パラメーター、) を持っていない場合、新しくもっと大きな封筒は計算されます • 形ベースに∊i-envelopeの内部にその頂点数 1- bを持っている形 • ステップ2に行き 、幾何学的なハッシング
2.5. Outline of the Matching Algorithm (0,0) (1,0)
3. Geometric Hashing 対数の時間において近似のマッチ方法 その方法は、それらの直径に関して標準化された形の頂点の軌跡を一様にカバーするカーブの有限の族を使用します。つまり、(0,0)(1,0)中心された半径1を備えた2つの円によって定義された半月形。形ベースの形がそれらのa-直径に関して標準化されたので、ある頂点は外部になりますあたかもそれらが半月形の境界に置かれるかのように、それらの頂点が扱われます
3.1ハッシング計算 • 左上部のクォーターq1をkつ等しいエリアに分割 kつ円弧を使用します 、第i弧は、 を中心に半径1の円に由来します,xiはi=1,…,kによる次の方程式の解です ここでA0は半月形のエリアです
3.2ハッシング計算 • クォーターqi に対応するciからのその頂点の平均距離を最小限にするハッシュ・カーブciを計算します • 形ベースにそのカーブに関連した形を集めます • 集めた形およびクエリー形の各々間の類似性手段を適用します • クエリー形に接近しているものを報告します 注:カーブ族にマッチを見つけることは対数の時間をとります
3.3ハッシング計算の例 K=50の場合
4. External Storage • 2つの方法を考慮し、実行を評価します 1. それらの特性なハッシングカーブによってソートされた形を格納します 2. 形の中の平均類似性差を最小限にすることが隣接したディスク位置に格納したように、形を格納します
4.1.特性ハッシングカーブによってソート • 各形の4部分によってソートする方法 • 平均特性曲線 に最も接近しているものよって形をソートする • その4部分の辞書順に続く形を格納してください • その4つの要素の平均に最も接近しているものを選んでください • この要素によってソートされた形を格納してください
4. 2. Average Measureのローカル最適化 • heuristic ruleによって第1ブロックの第1形を選択します • ディスク・ブロック中の後の個々の形は同じブロック中に前の形からの平均measureを最小限にするために選択されています • 次のブロックの第1形については、前の5つのディスク・ブロックの第1の形からの平均距離を最小限にする形を選択します
4.3評価 • 2つの方法の評価 1. rehashingはO(NlogN)です、非常にI/Oインテンシブです 2. I/Oオペレーションの平均数は前の方法のより最大約30%よいrehashingは O(N1.5logN)です、前の方法中でほど集中的なI/Oではありません rehashing時間は1つの形当たり頂点数が一定と仮定したrehashing時間です、Nがデータ・ベース中の形の数です
5.クエリー処理 • Topologicalクエリー • Statistical Estimations • Processing a Single Operator • Processing Queries
5. 1Topologicalクエリー Topologicalクエリーの定義: • topologicalオペレーターの結果および類似性オペレーターの結果がtopologicalクエリーです • P1とP2がtopological queriesな場合、P1 P2はtopological queryです • P1とP2がtopological queriesな場合、P1 P2はtopological queryです • P1がtopological queryな場合、COMPLEMENT(P1)はtopological queryですCOMPLEMENT(P1)=DB-P1 • P1がtopological queriesな場合、(P1 )はtopological queryです
5.2 Statistical Estimations 効率的にクエリーをインプリメントするために、オペレーターによって作られたセットのサイズの評価を必要とします そのために「significant」頂点(VS(Q))の数を次のように定義します:
6. GeoSIR • 彼らは提案された幾何学的な類似性アプローチをインプリメントする対話型のシステム(GeoSIR)を開発しました • 形ベースおよび補助のデータ構造を外部記憶装置に保存します • システム:Solaris • 幾何学類似性アルゴリズム:C • ユーザ・インターフェース:Tcl/Tk
6. GeoSIRの使い方 Workspaceで略図の書き インクリメント「fattening」 OK 幾何学ハッシング Y OK クエリー・スケッチの編集
7.まとめ • 結論 • 効率的な形検索技術 • 幾何学的なハッシング技術 • 今後の仕事 • ビデオ検索システムに組み込む • 3D認識も含む