140 likes | 352 Views
カタカナ入力による英単語抽出システムに関する研究. 大阪工業大学 情報科学部 コンピュータ科学科 情報アーキテクチャ研究室 Q09-099 渡辺 大貴. 発表内容. 背景・問題点 解決策 システム概要 実験 考察 まとめ. 問題点. 背景・問題点. 発音情報による英単語の抽出方法は 音声入力 に限られる. 音声 入力は周囲の環境を選んでしまう マイクセンサが必要となる. カタカナ入力 による英単語抽出 システム. 解決策. 発音情報をキーボードの入力で抽出する カタカナと発音記号の対応表を作成する. (キーボード). システム概要. 機能
E N D
カタカナ入力による英単語抽出システムに関する研究カタカナ入力による英単語抽出システムに関する研究 大阪工業大学 情報科学部 コンピュータ科学科 情報アーキテクチャ研究室 Q09-099 渡辺 大貴
発表内容 • 背景・問題点 • 解決策 • システム概要 • 実験 • 考察 • まとめ
問題点 背景・問題点 発音情報による英単語の抽出方法は 音声入力に限られる 音声入力は周囲の環境を選んでしまう マイクセンサが必要となる
カタカナ入力による英単語抽出システム 解決策 • 発音情報をキーボードの入力で抽出する • カタカナと発音記号の対応表を作成する (キーボード)
システム概要 • 機能 • 発音記号変換機能 • 英単語抽出機能 • データベース • カタカナと発音記号の対応表DB • 英単語辞書DB
カタカナと発音記号の対応表DB 現状の問題点 • 発音記号の明確なカナ読みが定義されていない。 • 1つのカタカナに対し、複数の発音記号が割り当てられる。 著者がすべての発音記号の聞こえ方を独自にカタカナに対応させ、それをDB化した。
カタカナと発音記号の対応表DB カタカナのカラム 複数の発音記号のカラム
カタカナと発音記号の対応表DB • 文字コードの都合上、発音記号は対応表を作り用いた
実験1 入力:ライト ⇒同音異義語をすべて出力
実験2 入力:カリッジ 入力:カレッジ ⇒少しの違いならば、自動的に正しい答えを出力
実験3 入力:アブソルートリー 入力:アブソルーリー ⇒1文字でもカタカナが抜けると出力不可
考察 • 複数の同音異義語を正しく抽出している • 多少の入力違いならば、システムがカバーし、正しい出力を行う • 長めの単語は聞き抜けが生じて、入力抜けは正しく出力できない
まとめ • 場所を選ばず、マイクセンサも必要としないため、デバイスの選択肢が広くなる。 • 今後の課題 • より多くのユーザを得るため、webブラウザの対応やスマートフォンの対応 • カタカナと発音記号の対応表DBの改良 • 入力抜けでも正しく出力させる