80 likes | 162 Views
・ 2007 年度実施項目 1)発話語に依存しない話者識別(情報源の識別技術) →音声時間波形の狭帯域包絡線間相関を利用 使用周波数範囲を 4kHz 範囲で 約 80% の認識率 →個人性が, 声帯基本周波数 , 副鼻腔共振周波数. 声帯音源基本周波数 男: 100 ~ 150Hz(8-11) 女: 250 ~ 300Hz(13-15) 第 2 フォルマント周波数 600 ~ 4kHz(19-30) 第 1 フォルマント周波数 200 ~ 1.4kHz(12-23) 副鼻腔共振周波数
E N D
・2007年度実施項目 1)発話語に依存しない話者識別(情報源の識別技術) →音声時間波形の狭帯域包絡線間相関を利用 使用周波数範囲を4kHz範囲で約80%の認識率 →個人性が,声帯基本周波数,副鼻腔共振周波数 声帯音源基本周波数男:100~150Hz(8-11) 女:250~300Hz(13-15)第2フォルマント周波数 600~4kHz(19-30) 第1フォルマント周波数 200~1.4kHz(12-23)副鼻腔共振周波数 3.1k~5.4kHz(28-31)帯域番号:7-11,22-31 ⇒発話者が男性 100 80 60 Accuracy and Ratio (%) 40 20 0 6-14,22-31 7-11,22-31 (68-0.2k,10k-5.2k) (81-162,1.1k-5.2k) Used Band Number
【今後の研究予定】 話者識別システムの実用化に向けた検討1)音声基本周波数を活用して識別率を向上2)重要帯域の近傍帯域での識別率調査3)公の音声DBを用いた提案手法の有効性検証4)重要帯域の物理要因調査
【進捗状況】 9月ASJ投稿予定 1)音声基本周波数を活用して識別率を向上 個人性を多く含む重要帯域 ・声帯音源基本周波数 ・母音の第2フォルマント周波数 ・副鼻腔共振周波数 関連しそうである 基本周波数の時間変動の平均と分散 ⇒個人を特定する特徴量になるか (小橋川の卒業研究) 作業担当者:B4 高山現在,卒研資料の確認作業を行なっている
【進捗状況】 2)重要帯域の近傍帯域での識別率調査 個人性を多く含む重要帯域 ・6-14, 22-31 →近傍帯域での識別率調査 →ロバスト性の検証(3月ASJ) 前回,調査できなかった一部の帯域(9-14, 22-31・10-14, 22-31)を調査 ⇒結果を3)と4)の項目で使用する 作業担当者:B4 青木現在,作業を担当者に依頼し,調査中
【進捗状況】 9月ASJ・大学紀要投稿予定 3)公の音声DBを用いた提案手法の有効性検証 これまでは自分たちで収録した音声を使用 →追従実験が難しい →信頼性が十分ではない 公の音声DB(ETL-WD-Ⅰ&Ⅱ)を使用 →追従実験が可能 →登録話者数を増やせる(+女性10名) →提案手法の有効性が得られる 作業担当者:B4 波々伯部現在,音声DBから識別に使用する単語を選出 →選出単語を用いて識別率を調査する
【進捗状況】 9月ASJ投稿予定 4)重要帯域の物理要因調査 個人性を多く含む重要帯域 ・声帯音源基本周波数 ・母音の第2フォルマント周波数 ・副鼻腔共振周波数 関連しそうである 鼻を塞ぎ共振特性を変えた音声を使用 (被験者:前回の音声収録者4名) ⇒識別率が下がれば関連している 作業担当者:M1 末廣現在,音声収録の準備を行なっている
9月ASJに講演申込する物理特性要因調査について9月ASJに講演申込する物理特性要因調査について 【目的】 副鼻腔の骨形状に個人性は依存するのかを調査 【方法】 1)副鼻腔の振動を物理的に止めた音声を使用 2)鼻に詰物をした音声を使用 →止める/塞ぐ方法はどうするか? 図1 ノーズクリップ 図2 ダイビング用マスク まずは副鼻腔の振動が外部から止められるかを調べる
副鼻腔の構造 ・上顎洞 ・前頭洞 ・蝶形(骨)洞・篩骨洞(篩骨蜂巣) 前頭洞 篩骨洞(篩骨蜂巣) 蝶形洞 上顎洞 参考:http://www.sanada.gr.jp/clinic/lecture/paranasal1.html 鼻を塞ぐだけで副鼻腔の振動を止められるか?