240 likes | 620 Views
2E3-1. 音声による子音カテゴリカル知覚の習得モデルに関する研究. 第 20 回 人工知能学会 全国大会 2006 年 6 月 8 日 宮澤 幸希 , 白勢 彩子 , 菊池 英明 早稲田大学 人間科学学術院. 研究の目的 生得か学習か、何を学ぶのか. 言語認知のメカニズムを明らかにする → 学習過程に注目 → 新しい音声言語理解技術の開発を目指す 乳児が母語を獲得するプロセス 生得的な機構を除いた聴覚系モデル による学習実験. 発表の概要. 言語認知の特徴 先行研究から得られた知見 子音カテゴリカル知覚 とは 学習モデルによる実験
E N D
2E3-1 音声による子音カテゴリカル知覚の習得モデルに関する研究 第20回 人工知能学会 全国大会 2006年6月8日 宮澤 幸希, 白勢 彩子, 菊池 英明 早稲田大学 人間科学学術院
研究の目的生得か学習か、何を学ぶのか • 言語認知のメカニズムを明らかにする → 学習過程に注目 → 新しい音声言語理解技術の開発を目指す • 乳児が母語を獲得するプロセス 生得的な機構を除いた聴覚系モデルによる学習実験
発表の概要 • 言語認知の特徴 先行研究から得られた知見 • 子音カテゴリカル知覚とは • 学習モデルによる実験 カテゴリカル知覚を再現するモデル • 実験結果と結論 カテゴリカル知覚を再現できたか?
言語認知の特徴 先行研究から得られた知見
人間の言語知覚の特性 • 無意識に獲得 • 誰でも母語を話せるようになる • 明示的なフィードバック(教師情報)を必要としない • 環境適応 • 誰の声でも、同じ音素として認識できる • 正確に聞き取れない状況でも理解できる → 現在の音声言語理解技術における問題
子音カテゴリカル知覚とは有声・無声子音の音響特徴子音カテゴリカル知覚とは有声・無声子音の音響特徴 図.無声破裂子音/t/, 有声破裂子音/d/のスペクトログラム
子音カテゴリカル知覚とはどのような知覚現象か?子音カテゴリカル知覚とはどのような知覚現象か? • 音響特徴を連続的に変えた子音を聞いても連続的には知覚されず、変化が一定の範囲内であれば同一の音として知覚される 図. 連続的に変化 させた子音に対する/d/, /t/同定曲線(Ryalls, 2003)
子音カテゴリカル知覚とはどのように獲得されるのか?子音カテゴリカル知覚とはどのように獲得されるのか? • 生まれたばかりの乳児でも、 子音カテゴリカル知覚を示す 誕生直後:一般的な子音 生後六ヶ月:母語の子音のみ 図. 生後1ヵ月の乳児を対象とした 子音聴取実験 (Eimas, 1971) 青線は、点線を境に子音カテゴリを変えている(/b/から/p/) 赤線は変えていない(/b/)
学習モデルによる実験 カテゴリカル知覚を再現するモデル
学習過程に注目した聴覚系モデル • Self-Organizing Maps(SOM, Kohonen考案) • 感覚神経のメカニズムを参考に考案 • 教師なし学習を実現する学習モデル • 特定の課題に対応していない SOMによる言語獲得過程シミュレーション • 学習に使えるのは、環境から与えられる情報のみ
SOMによる言語獲得実験環境から何を学習するのか?SOMによる言語獲得実験環境から何を学習するのか? • 音響特徴は、言語や子音の種類ごとに偏りがある • 母語の音響特徴の頻度分布を利用して、 子音カテゴリの聞き分けを学習できるだろうか? 図. アメリカ英語話者の/d/, /t/音発話に おけるVOT頻度分布(Blumstein, 1980)
子音カテゴリ学習実験動物実験を参考に • 動物もカテゴリカル知覚が可能(Kuhl&Miller) • チンチラネズミが/d/, /t/音を弁別 • VOT値、話者数、学習の手順が報告されている • 弁別境界値も示されている(33.5ms) • この実験と同条件でSOMの学習を行う • VOT値の頻度分布は記載なし → 予測
子音カテゴリ学習実験実験条件 • 英語話者の発話(条件1) • 動物実験から予測(条件2) • 実験1と2を考慮した頻度分布モデル(条件3, 下図) 図. 条件1、条件2から作成したVOT頻度分布
子音カテゴリ学習実験SOMによる学習 • VOT値をベクトルコードに変換 • 入力値同士の相関関係を表現 • 指標VOT値をもとに、子音のカテゴリを決定 図. 指標VOT値 図. 入力パターン
実験結果と結論 カテゴリカル知覚を再現できたか?
実験結果カテゴリ境界 • 学習の結果、SOMが獲得した子音カテゴリの境界は、人間の知覚境界とほぼ等しかった 図. 学習を終えたときのSOM (実験条件3, 2回目の結果) 図. 獲得されたカテゴリ境界
実験結果頻度分布との関係 • VOT頻度分布の境界で、SOMのカテゴリも変化 図. 連続VOT値に対するSOMの応答 (実験条件3, 2回目の結果)
実験結果各実験条件の結果 • 条件1 • アメリカ英語の環境 • 条件2 • 動物実験と同じ手続き • 条件3 • 条件1と2に基づく • 全ての条件で、人間や動物の境界に近い 表. 各条件のカテゴリ境界 値はカテゴリが/d/から/t/に変わったときのVOT値 (ms)
本研究のまとめ • 有声・無声音のカテゴリカル知覚を、 生得的な機構を除いた聴覚系モデルによって実現した • 自己組織的メカニズムが、言語経験に基づいて正しい子音カテゴリを獲得した
今後の研究方針 • 有声・無声子音だけでなく、音韻全体の 獲得過程を再現するモデルの研究を行う • 必要な特徴量選択の問題 • 時間的に変化する特徴量の扱い • カテゴリカル知覚に関する詳細な検討 • 言語理解にとって、カテゴリカルな知覚形式は どのような利点があるのか? • 聴覚神経系をより精密に再現
補記 モデルの詳細
補記:SOMの計算について • 初期状態では、全ての参照 ベクトルはランダムな値 • 入力・参照ベクトルの内積が最大になるノードが勝利する • 勝利ノードと近傍ノードの 参照ベクトルが、入力ベク トルに近づくよう強化される • 強化関数は勝利ノードからの距離を横軸とする正規分布を模した放物線とした • 参照ベクトルは、絶対値が 1になるように正規化される 入力ベクトル 勝利ノードc 勝利ノードの近傍ノード i番目のノードの 参照ベクトル