1 / 8

Accuracy and Ratio (%)

・ 2007 年度実施項目 1)発話語に依存しない話者識別(情報源の識別技術)   →音声時間波形の狭帯域包絡線間相関を利用     使用周波数範囲を 4kHz 範囲で 約 80% の認識率   →個人性が, 声帯基本周波数 , 副鼻腔共振周波数. 声帯音源基本周波数 男: 100 ~ 150Hz(8-11)  女: 250 ~ 300Hz(13-15) 第 2 フォルマント周波数 600 ~ 4kHz(19-30)   第 1 フォルマント周波数 200 ~ 1.4kHz(12-23) 副鼻腔共振周波数

acacia
Download Presentation

Accuracy and Ratio (%)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ・2007年度実施項目 1)発話語に依存しない話者識別(情報源の識別技術)   →音声時間波形の狭帯域包絡線間相関を利用     使用周波数範囲を4kHz範囲で約80%の認識率   →個人性が,声帯基本周波数,副鼻腔共振周波数 声帯音源基本周波数男:100~150Hz(8-11) 女:250~300Hz(13-15)第2フォルマント周波数 600~4kHz(19-30)  第1フォルマント周波数 200~1.4kHz(12-23)副鼻腔共振周波数 3.1k~5.4kHz(28-31)帯域番号:7-11,22-31 ⇒発話者が男性 100 80 60 Accuracy and Ratio (%) 40 20 0 6-14,22-31 7-11,22-31 (68-0.2k,10k-5.2k) (81-162,1.1k-5.2k) Used Band Number

  2. 【今後の研究予定】 話者識別システムの実用化に向けた検討1)音声基本周波数を活用して識別率を向上2)重要帯域の近傍帯域での識別率調査3)公の音声DBを用いた提案手法の有効性検証4)重要帯域の物理要因調査

  3. 【進捗状況】 9月ASJ投稿予定 1)音声基本周波数を活用して識別率を向上 個人性を多く含む重要帯域 ・声帯音源基本周波数 ・母音の第2フォルマント周波数  ・副鼻腔共振周波数 関連しそうである 基本周波数の時間変動の平均と分散 ⇒個人を特定する特徴量になるか  (小橋川の卒業研究) 作業担当者:B4 高山現在,卒研資料の確認作業を行なっている

  4. 【進捗状況】 2)重要帯域の近傍帯域での識別率調査 個人性を多く含む重要帯域 ・6-14, 22-31  →近傍帯域での識別率調査  →ロバスト性の検証(3月ASJ) 前回,調査できなかった一部の帯域(9-14, 22-31・10-14, 22-31)を調査  ⇒結果を3)と4)の項目で使用する 作業担当者:B4 青木現在,作業を担当者に依頼し,調査中

  5. 【進捗状況】 9月ASJ・大学紀要投稿予定 3)公の音声DBを用いた提案手法の有効性検証 これまでは自分たちで収録した音声を使用 →追従実験が難しい →信頼性が十分ではない 公の音声DB(ETL-WD-Ⅰ&Ⅱ)を使用 →追従実験が可能 →登録話者数を増やせる(+女性10名) →提案手法の有効性が得られる 作業担当者:B4 波々伯部現在,音声DBから識別に使用する単語を選出 →選出単語を用いて識別率を調査する

  6. 【進捗状況】 9月ASJ投稿予定 4)重要帯域の物理要因調査 個人性を多く含む重要帯域 ・声帯音源基本周波数 ・母音の第2フォルマント周波数  ・副鼻腔共振周波数 関連しそうである 鼻を塞ぎ共振特性を変えた音声を使用 (被験者:前回の音声収録者4名)   ⇒識別率が下がれば関連している 作業担当者:M1 末廣現在,音声収録の準備を行なっている

  7. 9月ASJに講演申込する物理特性要因調査について9月ASJに講演申込する物理特性要因調査について 【目的】  副鼻腔の骨形状に個人性は依存するのかを調査 【方法】 1)副鼻腔の振動を物理的に止めた音声を使用 2)鼻に詰物をした音声を使用  →止める/塞ぐ方法はどうするか? 図1 ノーズクリップ 図2 ダイビング用マスク まずは副鼻腔の振動が外部から止められるかを調べる

  8. 副鼻腔の構造 ・上顎洞 ・前頭洞 ・蝶形(骨)洞・篩骨洞(篩骨蜂巣) 前頭洞 篩骨洞(篩骨蜂巣) 蝶形洞 上顎洞 参考:http://www.sanada.gr.jp/clinic/lecture/paranasal1.html 鼻を塞ぐだけで副鼻腔の振動を止められるか?

More Related