200 likes | 365 Views
アンケート調査への OMR 活用. 岡山商科大学経営学部 田中 潔. この報告の背景 いくつか. スキャナを OMR として利用することは聞いていた。認識ソフトを使う機会がなかった 学内出席採点開発の機会に恵まれた 認識ソフトを導入してみた ついでに社会調査に応用する機会 結果: 調査や出席採点には使える感触. アンケート調査のデータエントリー. 表計算入力型 … エクセルが代表、入力大変 機械エントリー型 今や OMR 光学式マークリーダー OCR 光学式文字リーダー さらにスマホやタッチペンによる漢字認識も アンケートへの OCR 、 OMR 利用
E N D
アンケート調査へのOMR活用 岡山商科大学経営学部 田中 潔
この報告の背景 いくつか • スキャナをOMRとして利用することは聞いていた。認識ソフトを使う機会がなかった • 学内出席採点開発の機会に恵まれた • 認識ソフトを導入してみた • ついでに社会調査に応用する機会 • 結果: 調査や出席採点には使える感触
アンケート調査のデータエントリー • 表計算入力型…エクセルが代表、入力大変 • 機械エントリー型 • 今やOMR 光学式マークリーダー • OCR 光学式文字リーダー • さらにスマホやタッチペンによる漢字認識も • アンケートへのOCR、OMR利用 • 1990年代割と盛んに
今なぜOMRなのか? • OMRの長所 • 認識性が単純であり、ラフ • OMRの制約 • 精度向上には、専用用紙、インクを推奨 • 定型的フォーマットに向く • 印刷会社に限定がある(例:小林記録紙) • このため、原理の追求は行われたが、残念ながら普及するには至らなかった
その後、認識装置 格段の進歩 • 特に、DeskTopOMR推進の原動力 • 1.安価、高速になったスキャナ • 特に自動給紙タイプのハンディ型 • 電子書籍普及戸ともに、画像読み取りとして「自炊」デバイスとして重宝 • 2.マーク識別ソフトの生き残り • 大手メーカーは参入しないものの、それなりの小さな市場を形成してきた
普通紙マークシートソフト • 正一郎 IAC社 13万円 • Remark office OMR ハンモック社 16万円 • いずれも、 • OMR・バーコード認識 • エクセル風表計算 • 定型的な単純集計・統計機能 • 外部データへの変換
OMR読み取りまでの手順概要 • 1.Wordなどで回答用紙を作成する • 2.読み取る項目を認識ソフトで指定する • 3.回答用紙をスキャナで読み取り • 画像ファイル化する • 4.認識ソフトで認識する マーク→数値 • 5.エクセル風画面から数値データとして保存 • 各種ファイル化が可能 • またはコピペで移動させる
認識ソフトの出会い、なれそめ • 2010・2011 学内出席システムの整備 • 主システムはWeb上で稼動学生証バーコード→ハンディスキャナ認識 • 毎回小テストをとりたい要望 • 解決1 学籍番号バーコードシールを配布 • 解決2 別のおまけシステムの導入 • このとき認識ソフトRemark Officeを購入できた。この有効利用
こうして、出席システムへの適用は可能になったこうして、出席システムへの適用は可能になった • 学内幾つかの科目で利用される • キャリアセンターなどの意見採集に応用 • そこで、アンケート調査の回答に適用できないか?との模索開始
アンケート調査の回答用紙に応用記入例(一部)アンケート調査の回答用紙に応用記入例(一部)
回答用紙の認識項目の割当(テンプレート作成)回答用紙の認識項目の割当(テンプレート作成)
認識できるマークパターンRemarkOfficeの場合 • Multiple 単一回答または複数回答 • Grid 複数行(列)を一つの文字列 • ○●○ • ○○● “12” • Binary0/1の文字列 • ○●●○ “0110” • その他、List、Add、Booleanなどもある • バーコードCODE39,Codebarも認識
若干の注意点 • ○●○●○○ 1と3にマークあり • 認識させると“1,3”という文字列を返す • ちょうどエクセルの複数回答として認識 • “010100”はbinaryで可能 • 0,1,0,1,0,0の数値としては返してくれない • しかし、SPSSやExcelファイルなど多岐にわたるファイルに変換が可能
使用するマークのフォント • 認識できるフォント • 推奨: Arialの大文字O(オー)10-12ポイント • 日本語○●①②・・・も問題なし • サイトから専用フォント①やAの○囲いなどが供給される • 検索エンジン「OMRフォント」で検索 • Windowsマークシートフォントは大きくしてもうまく行かなかった。今後の研究課題
岡山地域の印刷動向調査2011への適用 目的: 岡山県下の企業を対象に、社内での印刷や外注状況を知る 方法: 所定のアンケート用紙による郵送留置き方法 回収: 郵送により返送(約1週間) 対象: 岡山企業年報2011の企業4,026社のうち無作為に抽出した600社
認識とは別に、事前に会社IDの設定により、フェース部分の印刷認識とは別に、事前に会社IDの設定により、フェース部分の印刷
実施結果の評価・まとめ • 回収した約200票は20分程度で読み取り出来た • 誤認識回収の訂正を含めても1時間以内で素データが完成した • A41ページの回答票に20問程度の回答が可能だった • 回答項目が増えても複数ページに分ければ読み取りは可能 • 複数回答の設計に工夫が必要