220 likes | 369 Views
共起用例と名詞の出現パターンを用いた動作性名詞の項構造解析. 奈良先端科学技術大学院大学 情報科学研究科 小町守 ・飯田龍・乾健太郎・松本裕治. 研究背景. 述語項構造解析 意味役割付与 : CoNLL shared task 2004, 2005. He wouldn’t accept anything of value from those he was writing about.
E N D
共起用例と名詞の出現パターンを用いた動作性名詞の項構造解析共起用例と名詞の出現パターンを用いた動作性名詞の項構造解析 奈良先端科学技術大学院大学 情報科学研究科 小町守・飯田龍・乾健太郎・松本裕治
研究背景 • 述語項構造解析 • 意味役割付与: CoNLL shared task 2004, 2005 He wouldn’t accept anything of value from those he was writing about. [A0 He] [AM-MOD would] [AM-NEG n’t] [V accept] [A1 anything of value] from [A2 those he was writing about] . V: verb; A0: acceptor; A1: thing accepted; A2: accepted-from; A3: attribute; AM-MOD: modal; AM-NEG: negation
動作性名詞の項構造解析 ガ ヲ 【外界】 リスク管理の必要性が強く叫ばれているが、市場の実態が把握できていないため打つ手がないのが実情。BISが昨年春から調査の手法について検討していた。 ヲ ガ 管理(する) [ ガ:【外界】, ヲ:リスク ] 調査(する) [ ガ:BIS, ヲ:実態 ]
動作性名詞の項構造解析 1階の入り口のところの電話で電話をかけた。 • 事態性判別 • (狭義の)動作性名詞の項構造解析 電話<電話機> 電話(する) [ ガ:(話し手), ニ:(外界) ] 動作性名詞: 動詞由来の名詞, サ変名詞 動作性名詞の用例に事態性があるかどうか判別 事態性のある動作性名詞の項構造を決定し、項を同定
目次 • はじめに • 動作性名詞の項構造解析の問題設定 • 予備実験コーパスの作成 • 動作性名詞の項構造解析へのアプローチ • 事態性判定実験 • 動作性名詞のヲ格同定実験 • 関連研究 • まとめ • 今後の予定
予備実験コーパスの作成 • 新聞記事(京大コーパス)に事態性名詞や照応のタグをつけたコーパスを作成中 (仕様は http://cl.naist.jp/~ryu-i/coreference_tag.html) • 事態を表現する名詞(形態素)にタグ付与 • 事態性がある場合、項(格要素)が記事中にあれば該当する形態素にタグ付与、なければ「外界」タグ付与 • 全部で約780記事(約6,500文)タグづけ済み ※文間: 文内には出現しないが同一記事中にある
作業者間のタグの一致率 • 指示先不一致: 事態性タグを付与した動作性名詞と項構造は一致したが格要素の指示先が不一致 • タグ一致: 2名の作業者間で事態性タグを付与した動作性名詞と格要素がいずれも一致 2名の作業者がタグ付与した140記事
作業者間のタグの一致率 • 事態性判別はほとんど揺れなくタグ付与可能 • 項同定のためにはタグの仕様を再検討する必要 • ヲ格・ニ格は格フレームの選択が難しい 2名の作業者がタグ付与した140記事
動作性名詞の項構造解析へのアプローチ ①語の意味クラスの分類問題 出現文脈の情報を使って解く 事態性判別 モノ ②文内の項の同定 文構造の情報を使って解く 名詞 文内 コト 文間 一人称 外界 二人称 ③文内に項の候補が見つからなかった場合は文外に探しに行く 不定
新聞 記事 名詞 リスト 名詞 リスト …に対する説得工作は失敗に… …に対する説得工作は失敗に… …横にある椅子の取っ手を… …横にある椅子の取っ手を… 事態性判別の方針 出現用例獲得 辞書 • 大量のデータから文構造を教師なし学習 大量に用意可能
動作性名詞の出現パターンの学習 正例 ・・・ 説得 交渉 ・・・ 文節内 • 用例中の名詞の出現パターンを木構造に変換し、BACT [Kudo and Matsumoto, 2004] で学習 • 学習した木構造が出現パターンのルールに相当 …説得工作は失敗に… サ変 サ変 事態性あり 負例 ・・・ 椅子 机 ・・・ 後文脈 …椅子の取っ手を… の 一般名詞 事態性なし
事態性判別実験 • 方法: SVM を用いて動作性名詞の事態性を判別(10分割交差検定) • 使った素性 • 意味的な素性 • 動作性名詞の意味クラス • 分類語彙表中での分類項目の上位4桁 • 統語的な素性 • 動作性名詞の周辺に項になりそうな名詞があるかどうか • EDR の動詞共起パターン副辞書 • BACT で獲得した動作性名詞の出現パターン
事態性判別実験結果 新聞記事の事態性判別 • 精度=事態性があると分類された動作性名詞のうち正解 • 再現率=動作性名詞のうち事態性を正しく判定できた率 • 新聞記事80記事(800文) • 動作性名詞1,237個(うち590個が事態性ありの事例)
事態性判別実験エラー分析 [ ガ:外界, ヲ:外界 ] • 項が文外に存在 • 周辺文脈が一般名詞のルールにマッチ 今年の三が日には、お雑煮を食べたらすぐに、のびのびになっている受賞後第一作の執筆に取りかかりたい。 「野良黒山の会」のリーダー、木場将弘さん方では、妻の和枝さんらが現地と電話のやりとりを続けた。
動作性名詞の項構造解析へのアプローチ モノ 名詞 項構造解析 文内 コト 文間 一人称 外界 二人称 不定
事態性を持つ動作性名詞の項の分布 新聞記事80記事(800文) • ヲ格は文内(かつ動作性名詞から近い場所)に分布 • ガ格は文内・文間・外界に広く分布 • ニ格は絶対数が少ない
ヲ格の項の同定実験 • 対象: 文内にヲ格の項がある文 • 目的: 動詞の項構造解析モデル [飯田ら, 2006] が動作性名詞に対しても有効か調査 • 使った素性 • 文の構造情報 • ヲ格を持つ動作性名詞の語彙・統語情報 • ヲ格候補の語彙・統語・意味・位置情報 • ヲ格を持つ動作性名詞とヲ格候補の対の情報 • 新聞記事の共起情報から計算した相互情報量 • 動作性名詞とヲ格候補の対の距離
ヲ格の項の同定実験結果 精度 文内に関しては動詞と同じモデルでもそこそこ解ける • 評価事例 • 新聞記事80記事中文内にヲ格がある動作性名詞235個 再現率
関連研究 • 動作性名詞の項構造解析のコーパス • NomBank [Meyers et al, 2004] • PropBank [Palmer et al, 2005] に従ってタグづけ • 文内の項に限定 • 名詞句の関係解析 • 名詞の格フレーム辞書の構築 [笹野ら, 2005] • より一般的な枠組み • 事態性判別問題を扱っていない
まとめ • 動作性名詞の項構造解析のためのコーパスを作成した • 名詞の出現パターンを用いた事態性判別手法を提案した • 精度73.3%・再現率80.2% • 動詞の項構造解析モデルを用い、動作性名詞の文内のヲ格の項同定実験を行った • 精度81.9%・再現率81.5%
今後の予定 • 文外の候補を同定するモデルの作成 • ヲ格以外の必須格についても項同定 • 意味役割や語彙概念構造を用いた解析