1 / 16

ベイズ基準による HSMM 音声合成の評価

ベイズ基準による HSMM 音声合成の評価. ◎ 橋本佳,南角吉彦,徳田恵一 (名工大). はじめに. HMM に基づく音声合成 ML 基準によるモデル学習 MDL 基準によるモデル構造選択 ベイズ基準による HMM 音声合成(橋本ら ; ’08 ) モデルパラメータの周辺化 データ量を考慮したモデル構造選択 学習・合成間におけるモデルの不一致 ベイズ基準による HSMM 音声合成(橋本ら ; ’09 ) 学習・合成において同一のモデルを使用. ベイズ基準による HSMM 音声合成の詳細な評価. 隠れマルコフモデル( HMM ). 1. 2. 3. :.

knox-abbott
Download Presentation

ベイズ基準による HSMM 音声合成の評価

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大)

  2. はじめに • HMMに基づく音声合成 • ML基準によるモデル学習 • MDL基準によるモデル構造選択 • ベイズ基準によるHMM音声合成(橋本ら; ’08) • モデルパラメータの周辺化 • データ量を考慮したモデル構造選択 • 学習・合成間におけるモデルの不一致 • ベイズ基準によるHSMM音声合成(橋本ら; ’09) • 学習・合成において同一のモデルを使用 ベイズ基準によるHSMM音声合成の詳細な評価

  3. 隠れマルコフモデル(HMM) 1 2 3 : 観測系列 : 状態系列 1 1 1 1 2 2 3 3

  4. 隠れセミマルコフモデル(HSMM) 継続長分布 1 2 3 : 観測系列 : 状態系列 1 1 1 1 2 2 3 3 状態継続長を考慮したモデル

  5. 尤度関数の比較 • 尤度関数 : 観測系列 HMM HSMM : 状態系列 : モデルパラメータ HSMMでは状態遷移確率が継続長分布によって算出

  6. ベイズ基準による音声合成(1/2) モデル学習基準・音声合成基準 ML基準 ベイズ基準 : モデルパラメータ : 合成音声パラメータ系列 : 合成文のラベル列 : 学習文のラベル列 : 学習データ

  7. ベイズ基準による音声合成(2/2) ベイズ基準における予測分布(周辺尤度関数) : 合成データの状態遷移を表す隠れ変数 : 学習データの状態遷移を表す隠れ変数 : 合成データの尤度関数 : 学習データの尤度関数 : モデルパラメータの事前分布 変分ベイズ法による近似(Attias; ’99)

  8. 変分ベイズ法(1/2) • 対数周辺尤度の下限 を定義 : に関する期待値 (Jensenの不等式) : 近似事後分布 下限の最大化による対数周辺尤度の近似 ⇒ を最大化する近似事後分布を推定

  9. 変分ベイズ法(2/2) • 近似事後分布の独立性を仮定 • 変分法による事後分布推定 : 正規化項 交互に更新することで を最大化

  10. 音声パラメータ生成 • 音声パラメータ 静的特徴量と動的特徴量によって表現 ⇒ 合成部では静的特徴量のみ推定 • ベイズ基準による合成音声パラメータ生成 下限 は対数周辺尤度を近似 ⇒ を最大化する音声パラメータを推定

  11. 実験条件

  12. ML基準・HMMとの比較 • ML基準とベイズ基準の比較 • HMMとHSMMの比較 ※ ※クロスバリデーションを用いたベイズ基準によるモデル構造選択(橋本ら; ’08)

  13. 主観評価実験 ML基準・HMMとの比較 分布数 87,267 88,287 745,969 744,955

  14. 改善の要因の調査 • ベイズ基準による改善の要因 • パラメータの周辺化 • モデル構造選択

  15. 主観評価実験 モデル構造の比較 分布数 88,287 88,287 744,955 744,955

  16. むすび • ベイズ基準によるHSMM音声合成の評価 • HSMMによる品質改善 • ベイズ基準の有効性 • パラメータの周辺化とモデル構造の両方が必要 • 今後の課題 • 小規模な学習データでの音声合成実験 • モデル構造と音質の調査

More Related