280 likes | 380 Views
「自動三角網」 「アプリに適するコードへ再編」. M1 三村 純一. 目的. 自動三角網をする目的 現在、カメラ運動を実装する際、三角パッチ切り出しによる動画が最も有効。 また、全自動化を目指すため自動三角網を考える。. 動画. 三角網とは. 形状に合わせて三角パッチを張り合わせたアミ. 初期三角網を作る. まずは、背景画像を気にしないで三角網を実装!. 三角網の条件. 条件1 三角パッチ同士は重ならない。 条件2 三角網は閉路である。. 図1 . 重なり合う三角パッチ. 図2 . 開路を持つ三角網. 領域2. 領域1. 領域3. 領域4.
E N D
「自動三角網」「アプリに適するコードへ再編」「自動三角網」「アプリに適するコードへ再編」 M1 三村 純一
目的 • 自動三角網をする目的 現在、カメラ運動を実装する際、三角パッチ切り出しによる動画が最も有効。 また、全自動化を目指すため自動三角網を考える。 動画
三角網とは 形状に合わせて三角パッチを張り合わせたアミ
初期三角網を作る まずは、背景画像を気にしないで三角網を実装!
三角網の条件 • 条件1 三角パッチ同士は重ならない。 • 条件2 三角網は閉路である。 図1. 重なり合う三角パッチ 図2. 開路を持つ三角網
領域2 領域1 領域3 領域4 ボロノイ図&ドロネー網 例:
ボロノイ図&ドロネー網 例: 円2 × 円1 ×
実写真 ボロノイ図 ドロネー網 実写真の初期三角網
三角網の最適化 境界辺 • ピクセル値を基に画像へのマッチングを評価。 • 黄色の辺を含む2つの三角パッチに注目! • 対角辺への入れ替えを行い、次々とマッチングを行う。 • 境界辺については、入れ替える必要なし。 マッチング後
マッチングの評価方法 w=30 w=100 採用!! • 各辺が、本当に被写体の辺であるかを評価する! • 方法: • 辺の評価値w(マッチングの度合いを示す指標)を定義、計算 • また辺の対角辺の評価値wも計算 • もし対角辺の評価値の方が小さければ、辺の入れ替えを行う
100×100の固定テンプレート Q B Q A B A P P 評価値の定義は? アフィン変換 射影変換 • 辺を含む三角パッチを切り出す! • 切り出された四辺形APBQを固定テンプレートへ射影。 ただし射影方法は、アフィン変換と射影変換の2通り!
Q B 検出テンプレート Q Q B B A P A P A P A B アフィン変換 射影変換 • 2つの画像の差画像を取得 • 検出テンプレートとの相関を評価値wとする。 w=画素毎の積の総和 注意: 境界線 ・・・ w=-1 四辺形が凸 ・・・ w= 0
Q B A P Q B A P 差画像の比較 評価値w → 大 アフィン Q A B P 射影 評価値w → 小 アフィン A P Q 射影 B 採用!
提案手法の整理(アルゴリズム) 辺の組み合わせを調べる w1={1,2} w2={2,3} w3={4,5} : w12={7,8} 全ての辺の評価値を計算 辺の組み合わせが等しい 最大値がw=0の場合 最大の評価値を持つ辺を選択 w1=0 w2= -1 w3=150 : w12=30 w2<w2’ ⇒辺そのままw2=0 w2>w2’ ⇒辺入れ替えw2=0 周り4辺を再計算 対角辺の評価値を計算 w2’=150 終了!
実験Ⅰ • 写真1枚・・・やや複雑な写真 特徴点 ・・・ 25個
結果 初期三角網 最適化 正解率 74%(31/42) 正解率 90%(38/42)
実験Ⅱ • 写真2枚で同じ特徴点を持つ場合 写真1 写真2 写真1と写真2は全て同じ特徴点 初期三角網も同じものを使う テンプレートで相関をとる際、写真1からの差画像と写真2からの差画像を足したものに相関を考える。 w = w_pic1 + w_pic2
結果 初期三角網 最適化 写真1 正解率 74%(31/42) 正解率 100%(42/42) 写真2 正解率 100%(42/42) 正解率 74%(31/42)
実験Ⅲ • 写真8枚で違う特徴点を持つ場合 写真4 写真1 写真2 写真3 写真7 写真8 写真5 写真6 同じ特徴点を持つ写真同士のグループを作る グループ内では初期三角網は同じものを使う 各グループで、最適な三角網を作る グループ同士で異なる三角網は揃える
同じ特徴点を持つ写真同士のグループを作る グループ1 グループ2 写真8 写真1 写真2 写真3 隠れ点・・・「5」 隠れ点・・・「6」 グループ4 グループ3 写真7 写真5 写真6 写真4 隠れ点・・・「7」 隠れ点・・・「8」
グループ内では初期三角網は同じものを使う グループ1 グループ2 写真8 写真1 写真2 写真3 全ての写真 正解率 100%(6/6) たまたまです。 グループ4 グループ3 写真7 写真5 写真6 写真4
各グループで、最適な三角網を作る グループ1 グループ2 写真8 写真1 写真2 写真3 全ての写真 正解率 100%(6/6) 最適化成功! グループ4 グループ3 写真7 写真5 写真6 写真4
グループ同士で異なる三角網は揃える グループ1 グループ2 写真8 写真1 写真2 写真3 全ての写真 揃えることに成功! グループ4 グループ3 写真7 写真5 写真6 写真4
結果 写真1 写真2 写真3 写真4 写真5 写真6 写真8 写真7 正解率 100% 三角網は全て一致している!
アプリケーションにおける問題点 • 実行速度 アプリケーションなので、より良いソフトにするためには、実行速度は速くする必要がある。 → プログラムの改良 ☆改良結果 隠れ点推定 ⇒ 自動三角網 ⇒ 3次元復元 ⇒ 3次元CG ⇒ カメラ運動復元 ⇒ avi書き出し 環境: CPU Pentium4 3.0GHz メモリ 512MB OS FreeBSD 5.4 計算機 MATLAB version 6.5.1 16[s] 16[s] 67[s] 51[s] 69[s] 2[s] 総合: 現在: 従来: 4[h]以上 113[s] 29[s] 70[s] 1[s] 84[s] 14[s] 従来: 2[h]以上
変数メモリ マシン環境によってはメモリ不足になる恐れがあるので、改良する必要がある。 → 大きい変数は、ファイルで書き出す! ☆改良結果 <一番大きい変数> 写真毎に切り出した 各三角パッチの写真 480×640 × 3 × 8 × 6 =44236800B =44.2MB 各3kbのjpegファイル CRASH!!
他のソフトウェア • 動画を書き出すために、「ImageMagick」を使用してアニメーションgifを作成。 • また、「Gimp」でファイルを圧縮。 • さらに、動画を表示するために「Mozilla」を使用。 よって、これらのソフトウェアが無い環境だと、実行出来ない。 ⇒ 全てMATLABで行う環境に改良。 アニメーションgif → ムービーフレーム (oraviファイル) 動画の表示 → movie関数 (oravi再生ソフト) ☆改良結果 アニメーションgif aviファイル 圧縮後: 466 KB 圧縮前: 33600 KB 圧縮後: 498 KB 圧縮前: 543 KB
入力:特徴点位置座標 今後の展望 • 実行速度のさらなる向上 可変型テンプレートetc • アプリに現実行プログラムを適用 現在、入力:「特徴点位置座標」のみで以下全てが実行される環境 隠れ点推定 ⇒ 3次元復元 ⇒ 自動三角網 ⇒ ⇒ テクスチャマッピング ⇒ カメラ運動復元 • 論文作成