ニューラルネットワークを用いた母音範疇の獲得モデルに関する研究

1-2-9 ニューラルネットワークを用いた母音範疇の獲得モデルに関する研究日本音響学会 2007年秋季研究発表会 2007年9月19日宮澤　幸希, 白勢　彩子, 菊池　英明早稲田大学人間科学学術院

？言語獲得モデルによる学習実験研究の目的生得か学習か、何を学ぶのか • 言語認知のメカニズムを明らかにする　　→　学習過程に注目　　→　乳児の言語獲得能力の明確化を目指す • 明示的なフィードバック（教示）を必要としない • 話者や環境の変化に対して頑強

言語の獲得と知覚のメカニズム 先行研究から得られた知見

母国語音韻体系の知覚子音範疇化と母音マグネット効果母国語音韻体系の知覚子音範疇化と母音マグネット効果 • 生後間もない乳児も　　子音範疇を知覚 • 誕生直後：　　　　　　　　　　　言語間で共通の子音 • 生後7ヶ月：　　　　　　　　　　　母国語の子音のみ図. 子音範疇化知覚 • 生後6ヶ月で母国語の母音範疇を獲得（Jusczyk,2000） • 子音ほど明確な範疇化知覚は示さない • 異なる話者が発した母音も、同一の音として知覚

母国語音韻体系の知覚生得的な制約と学習 • 生後6ヶ月の乳児は、2種類の人工音素を、　　　　2分間の聴取で聞き分けた（Kuhl,2004） • きわめて短期間で、異なる範疇の存在を知覚 • 生得的な制約をもつメカニズムが、学習によって　　　　　　　　　　　　特定の言語に最適化されるという考え • 制約の例：聴覚系の応答特性？神経回路の配線？ • 学習の例：成人の音声の統計的分布モデルによるシミュレーションを行なう

言語獲得のモデル 母音範疇の形成過程を再現するモデル

SOMの利用 • Self-Organizing Maps（SOM, Kohonen,1989） • 大脳皮質感覚野の情報処理を参考に考案 • 入力信号の分布傾向を教師なしで分類可能 • 入力信号のカテゴリ数を推定可能　　大脳一次聴覚野のモデル　　母音範疇の獲得モデル • SOMモデルを使用してシミュレーションを行なう • 母音体系と母音数の獲得過程 • どの程度の学習量で獲得できるかとして適当と仮定

先行実験有声・無声子音の獲得モデル • 入力：成人英語話者のVOTの統計的分布 • 結果：SOMが獲得した有声・無声子音境界は、人間の境界とほぼ等しかった（宮澤ら,2006） • 結論：　　　　　　　言語獲得における自己組織的機構と、統計的分布に　　基づいた学習の　重要性が示された

入力データ　　　　　　　評価データ 母音範疇の獲得モデル入力値と評価値 • SOMの入力データ • 日本語話し言葉コーパス（CSJ）講演再朗読音声（60代男性）のF1, F2 （フレーム長： 20ms） • 無音部、ノイズ部、エラーデータを除去 • F1, F2, （F2-F1）、過去2フレーム分の　　　　　　　 F1, F2, （F2-F1）を加えた9次元の特徴量 • 学習結果の評価データ • CSJの音素ラベルデータに基づき、母音中心を　　　　　　　　正解情報つきデータセットを作成

分散収束理論に基づく母音体系 母音範疇の獲得モデルモデルの概要 • 制約なし条件（ -Bias モデル） • 言語に特化した機構のないモデル • SOMは重み0で初期化 • 制約あり条件（ +Bias モデル） • 分散収束理論に基づく母音体系のF1，F2 の値を　　入力として、あらかじめSOMの学習を行っておく • 乳児の母音知覚能力が、一次聴覚野の神経細胞の結合状態として生得的に備わっている、と仮定

母音範疇の獲得モデル評価方法 • 母音範疇を求める • 「密度ヒストグラムによるクラスタ数推定法（寺島ら,1996)」を使用 • SOMのクラスタを統合して、カテゴリ数と境界を求める • 評価データと比較して、正解率を求めるカテゴリ数：5 正解率：0.728

実験結果と結論

実験結果各実験条件の結果 • 学習量10～100 • 制約あり（+Bias）のほうが正解率高、　母音数5に近い • 学習量100～1000 • 制約あり（+Bias）と　制約なし（-Bias）の　差はなくなる上表. 学習量とカテゴリ数下表．学習量と正解率

まとめ • 母音範疇の獲得過程を、生得的な制約を　　　　除いた／仮定したモデルによって再現した • 学習の初期段階では、制約が有効に機能した • 言語獲得の初期段階において、　　　　　　　　　　　　生得的な仕組みが効果的に働いている可能性 • 制約の種類に関しては、より詳細な検討が必要 • 学習が進行すると、生得的な制約のあり／なしによる差は少なくなる

今後の研究方針 • 範疇化知覚の獲得に関する詳細な検討 • 言語理解にとって、カテゴリカルな知覚形式は　　　どのような利点があるのか？ • 音声の統計的分布はどのような性質をもつか？ • 音韻全体の獲得過程を再現するモデル • 必要な特徴量選択の問題 • 時間的に変化する特徴量の扱い • 獲得した音韻情報の統合による単語の学習

ニューラルネットワークを用いた 母音範疇の獲得モデルに関する研究