450 likes | 659 Views
ナイト. 第 12 回パターン認識・メディア理解 (PRMU) 研究会 アルゴリズムコンテスト表彰式. 騎士を 数え ナイト ~ 画像に含まれる特定物体の計数 ~. パターン認識・メディア理解 (PRMU) 研究会 アルゴリズムコンテスト. 開会挨拶. 開会挨拶. 第 12 回パターン認識・メディア理解研究会 アルゴリズムコンテスト実行委員長 馬場口 登(阪大). パターン認識・メディア理解 (PRMU) 研究会 アルゴリズムコンテスト. 課題概要. PRMU アルゴリズムコンテスト. パターン認識・メディア理解 (PRMU) の 若手研究者の育成を目的
E N D
ナイト 第12回パターン認識・メディア理解(PRMU)研究会 アルゴリズムコンテスト表彰式 騎士を数えナイト~画像に含まれる特定物体の計数~
パターン認識・メディア理解(PRMU)研究会 アルゴリズムコンテスト 開会挨拶
開会挨拶 • 第12回パターン認識・メディア理解研究会 アルゴリズムコンテスト実行委員長 馬場口 登(阪大)
パターン認識・メディア理解(PRMU)研究会 アルゴリズムコンテスト 課題概要
PRMUアルゴリズムコンテスト • パターン認識・メディア理解(PRMU)の 若手研究者の育成を目的 • 具体的な課題を解決することの楽しさや、 PRMU研究の面白さを体験してもらう アルゴリズムの完璧さよりも、若手研究者や学生の皆さんの独自の着眼点や素朴なアイディアを評価
過去のアルコン(1997-2007) • 第1回 ステレオグラムが見えるコンピュータアルゴリズムを 作ってみませんか? • 第2回 ウサギをさがせ -パターン認識の基本問題にトライしませんか- • 第3回 カメレオンはどこだ! -テクスチャ画像の領域分割- • 第4回 わたしは誰? -顔画像からの個人識別- • 第5回 交通標識の認識 • 第6回 砂嵐から立体を見つけ出そう -多眼ランダムドットステレオ- • 第7回 そこにいるのは何人? -画像からの人物係数- • 第8回 複数の写真からパノラマ写真を作ろう -画像のモザイキング- • 第9回 侵入物を探せ -物体領域抽出- • 第10回 編集を賢くお手伝い! ~映像のショット分割~ • 第11回 ジグソーパズルを完成させよう! ―マッチングによる画像復元―
第12回コンテスト概要 • 課題:テスト画像に参照画像がいくつ含まれるかを答えること • 早く、正確に! テスト画像 参照画像
第12回コンテスト概要 • 早い方が良いが、当てずっぽうは困る 個数だけではなく、「大まかな位置」も同時に答えてもらう
正確さの尺度:スコア • スコアの計算: • x:正解の数 • y:回答のうち、画像の位置が正しいものの数 • z:回答のうち、画像の位置が正しくないものの数 100点 (x=2, y=2, z=0) -100点 (x=2, y=1, z=3)
レベル構成 • レベル1:平行移動+拡大縮小 • レベル2:平行移動+拡大縮小+回転 • レベル3:平行移動+拡大縮小+回転+オクルージョン
レベル3:平行移動+拡大縮小+回転+オクルージョンレベル3:平行移動+拡大縮小+回転+オクルージョン
レベル3:平行移動+拡大縮小+回転+オクルージョンレベル3:平行移動+拡大縮小+回転+オクルージョン
レベル3:平行移動+拡大縮小+回転+オクルージョンレベル3:平行移動+拡大縮小+回転+オクルージョン
応募に必要なもの • 画像の数を数える関数の実装 • C言語(ANSI-C準拠) • アルゴリズム説明書(A4、2ページ以内) • 配布物 • プログラム一式 • Linux用プログラム(cygwin対応) • Windows用プログラム(Visual Studio .net 2005 & 2008対応) • サンプル画像
スケジュール • 公開開始:4月22日(火) • 応募開始:5月23日(金) • 応募締切:7月25日(金) 20人(グループ)からのべ33件の応募
応募数 ただし、のべ件数
応募者の学年 ただし、のべ件数 グループ応募は代表者
審査プロセス • 客観評価: 7月26日(土)~ 8月5日(火) • 応募されたプログラムを実行し、サンプル画像5枚と非公開の評価用画像5枚の計10枚に対するスコアと処理時間を計測 • 主観評価:8月6日(水)~ 8月21日(木) • 応募アルゴリズムの説明書と客観評価の結果を審査委員に提示し、10段階の主観評価とコメントを提出していただく • 議論: 8月22日(金)~ 8月25日(月) • 客観評価と主観評価の結果に基づいて入賞アルゴリズム案を2案作成し、実行委員全員による議論を経て最終的な審査結果とした
スコア・処理時間の分布 良 正確 悪 高速
スコア・処理時間の分布 良 高スコア 正確 高速 悪 高速
審査プロセス • 客観評価: 7月26日(土)~ 8月5日(火) • 応募されたプログラムを実行し、サンプル画像5枚と非公開の評価用画像5枚の計10枚に対するスコアと処理時間を計測 • 主観評価:8月6日(水)~ 8月21日(木) • 応募アルゴリズムの説明書と客観評価の結果を審査委員に提示し、10段階の主観評価とコメントを提出していただく • 議論: 8月22日(金)~ 8月25日(月) • 客観評価と主観評価の結果に基づいて入賞アルゴリズム案を2案作成し、実行委員全員による議論を経て最終的な審査結果とした
実行委員会 審査委員(11名) • 実行委員長 • 馬場口 登(大阪大学) • 実行委員(20名) • 岩村 雅一(大阪府立大学) • 石井 育規(松下電器産業株式会社) • 内橋 真吾(富士ゼロックス株式会社) • 川崎 洋(埼玉大学) • 島田 伸敬(立命館大学) • 嶌田 聡(NTTサイバーソリューション研究所) • 藤吉 弘亘(中部大学) • 帆足 啓一郎 ((株)KDDI研究所) • 柳井 啓司(電気通信大学) • 山口 晃一郎(豊田中央研究所) • 天野 敏之(奈良先端科学技術 大学院大学) • 玉木 徹(広島大学) • 斎藤 英雄(慶応義塾大学) • 前田 英作(NTT) • 大町 真一郎(東北大学) • 角所 考(京都大学) • 内田 誠一(九州大学) • 亀田 能成(筑波大学) • 黄瀬 浩一(大阪府立大学) • 中居 友弘(日本学術振興会、 大阪府立大学) • 協力 • 本道 貴行(大阪府立大学)
審査プロセス • 客観評価: 7月26日(土)~ 8月5日(火) • 応募されたプログラムを実行し、サンプル画像5枚と非公開の評価用画像5枚の計10枚に対するスコアと処理時間を計測 • 主観評価:8月6日(水)~ 8月21日(木) • 応募アルゴリズムの説明書と客観評価の結果を審査委員に提示し、10段階の主観評価とコメントを提出していただく • 議論:8月22日(金)~ 8月25日(月) • 客観評価と主観評価の結果に基づいて入賞アルゴリズム案を2案作成し、実行委員全員による議論を経て最終的な審査結果とした 公平を期すため、審査期間中、審査委員には個人を特定できる情報を一切提供しなかった
パターン認識・メディア理解(PRMU)研究会 アルゴリズムコンテスト 審査結果発表
ニンテンドー DS Lite 審査員特別賞 • 正井 秀俊(まさい ひでとし) 筑波大学 第三学群工学システム学類 知的工学主専攻 延原研究室 B4 • 応募レベル1 • 平均スコア67.0点、平均計算時間0.04秒 • 講評 • 中心点を基にした単純な処理ではあるが、アイディアは新しく計算処理も早い • 非常に高速で、スコアも悪くない • 1枚だけ非常にスコアの低い画像があり、平均スコアが下がっている
USB接続 外付けHDD Buffalo HD-PF400U2-WH 入賞 • 平原 一帆(ひらはら かずほ) 広島市立大学大学院 情報科学部 知能工学専攻 言語音声メディア工学研究室 M1 • 応募レベル2 • 平均スコア75.4点、平均計算時間2.78秒 • 講評 • すべての色ではなく、最頻色の1色と、それと異なる2色を用いて、三角形を特徴量にしているところが光るアイデア
デジタルカメラ LUMIX DMC-FX55 入賞 • 高田 征吾(たかだ せいご) 立命館大学 情報理工学部 メディア情報学科 3次元ビジョン研究室 B4 • 応募レベル2 • 平均スコア62.6点、平均計算時間0.13秒 • 講評 • 参照画像に存在しない画素から見るべき領域を削減したことが奏功して、レベル2にもかかわらず、高速である
デジタルカメラ LUMIX DMC-FX55 入賞 • 山崎 真也(やまざき しんや;M2) • 古畑 俊一郎(ふるはた しゅんいちろう;M2) • 佐藤 秀昭(さとうひであき;M1) • 渡辺 大介(わたなべ だいすけ;B4) • 筑波大学大学院 システム情報工学研究科 知能機能システム専攻 画像情報研究室 • 筑波大学 第三学群工学システム学類 画像情報研究室 • 応募レベル3 • 平均スコア57.4点、平均計算時間60.95秒 • 講評 • 回転に不変になるように円形領域の色ヒストグラムを用いたのは、おもしろいアイデア • 円領域以外の情報を捨てる潔さは評価できる
デジタルカメラ LUMIX DMC-FX35 優秀賞 図書カード1万円分 • 河野 修久(こうの のぶひさ) 広島市立大学大学院 情報科学研究科 知能工学専攻 データ工学研究室 M1 • 応募レベル1 • 平均スコア100点、平均計算時間2.02秒 • 講評 • 個々の処理は平凡なものであるが、非常に綿密に組み合わせることで性能向上を達成しており、完成度は大変高い • 他のレベルでもいけるのでは?
Apple iPod nano 8GB 優秀賞 図書カード1万円分 • 楠 卓也(くす たくや) 広島市立大学大学院 情報科学研究科 知能工学専攻 画像メディア工学研究室 M2 • 応募レベル2 • 平均スコア94.8点、平均計算時間1.15秒 • 講評 • 円形領域を抽出することにより、回転に対するロバスト性を担保できていて、なおかつスコアが高い
DVDレコーダー DIGA DMR-XP12 最優秀賞 図書カード2万円分 • 吉村 宗浩(よしむら かずひろ) 立命館大学 情報理工学部 メディア情報学科 3次元ビジョン研究室 B4 • 応募レベル1 • 平均スコア91.1点、平均計算時間1.69秒 • 講評 • 「特徴線」による新しい方法を提案しており、オリジナリティが極めて高い
パターン認識・メディア理解(PRMU)研究会 アルゴリズムコンテスト 入賞者によるアルゴリズム紹介
入賞者によるアルゴリズム紹介 • 審査員特別賞 • 正井 秀俊 「飛相似による特定画像の検出」 • 入賞 • 平原 一帆 「頻色三色による三角形の出現を用いたアルゴリズム」 • 高田 征吾 「色の分布と形状の特徴を用いたアルゴリズム」 • 山崎 真也 「円形テンプレートの色情報を用いた類似画像探索」 • 優秀賞 • 河野 修久 「画像に出現する色のプロットを用いた目的画像探索」 • 楠 卓也 「円形テンプレートを用いた アクティブ探索法による物体の位置検出」 • 最優秀賞 • 吉村 宗浩 「直線上の色の変化を比較したマッチング」
パターン認識・メディア理解(PRMU)研究会 アルゴリズムコンテスト 特別講演
特別講演「画像照合から始まる画像認識への道程」特別講演「画像照合から始まる画像認識への道程」 • 講師:佐藤真一(国立情報学研究所) • 1992年東京大学大学院工学系研究科情報工学専攻博士課程了.同年学術情報センター助手. 1998年同助教授.2000年国立情報学研究所助教授,2004年同教授,現在に至る. • 1995 年から1997年まで,米国カーネギーメロン大学客員研究員としてInformedia 映像ディジタルライブラリの研究に従事.工博. • 画像理解,画像データベース,映像データベース等の研究に従事.電子情報通信学会,情報処理学会,IEEE CS,ACM各会員.