170 likes | 366 Views
AquaLog: An Ontology-Portable Question Answering System for the Semantic Web. Vanessa Lopez, Michele Pasin, and Enrico Motta Knowledge Media Institute, The Open University, United Kingdom. 発表者: 村上 明子 ( akikom@jp.ibm.com ) 日本アイ・ビー・エム(株)東京基礎研究所. 概要. a portable question answering system
E N D
AquaLog: An Ontology-Portable Question Answering System for the Semantic Web Vanessa Lopez, Michele Pasin, and Enrico Motta Knowledge Media Institute, The Open University, United Kingdom 発表者: 村上 明子 (akikom@jp.ibm.com) 日本アイ・ビー・エム(株)東京基礎研究所
概要 • a portable question answering system • 自然言語 → クエリ • オントロジ(semantic markupされたもの) → クエリ、結果 • Why portable? • 既存のNLPを使っている • あるオントロジーに対するconfiguration timeは無視できるほど少ない
AKT: Advanced Knowledge Technologies
Related Work • Close-Domain Natural Language Interfaces • 対象となるドメインの知識をデータベース化し、質問を何らかの形でSQLとして検索する • Open-Domain QA Systems • 質問のタイプを分類し、その後単語にマッチするものを探す • ほとんどが固有名詞抽出の問題 • Open-Domain QA Systems using Triple Representation • 質問をtripleにしたり、検索対象(答えの存在する知識)をtripleにしたりする • AquaLogともっとも似ているアプローチ • Ontologies in Question Answering • Ontologyを用いるのは一般にquery expansionのことが多い • Close-Domainであれば知識にもOntologyの利用は可能
The Architecture • Waterfall model • NL → query triples → ontology compatible triples → Answer • なぜtripleを採用したか? • 質問は大体tripleで表すことができる • 例:日本の首都はどこですか? • 日本→[首都]→(答え) • RDF,OWLもtripleと同じ表現を使っている • <subject, predicate, object> • SemanticWebをtargetにするなら自然な発想
Two main processing modules • The linguistic component • The relation similarity service • 例としてOpen UniversityのKMIで作られているOntologyを用いている KMIの“academic life”に関するOntology • projects, technologies, people, news, events, organizations, publications, and research areas
The linguistic component • 自然言語のinputをQuery-Tripleにmapするcomponent • GATEを使用 • pattern baseのパーザー。sentences, tokens, nouns, verbsなどの認識ができる • そのほか、筆者らはterms, relationsやquestion indicators (which, who, whenなど)と質問タイプとパターンを認識できるように拡張 • JAPE grammarsと作成した23のパターンに対して正規表現を利用 • 曖昧性が残る場合は次のRSSへ任せる
Relation Similarity Service(1) • 自然言語から得られたtripleからOntology中のtripleに以下の方法でマッチさせる • string similarity matching • generic lexical resourcesを用いる(Word Netなど) • Learning Mechanismによって得られたdomainに依存したlexicon • Interactiveということが重要 • ユーザーの指定によって曖昧性が除去される • relationとconceptはClass Similarity Service (CSS)によってそれぞれ一致しているか見る • 固有名詞はdistance metrics algorithmによって一致するものを探す
例: who are the researchers in semantic web research area? semantic web or web Relation Similarity Service(2) • マッピングに失敗した質問のうち、いわゆるYes/Noの質問であれば答えられるものがある • termに曖昧性がある場合はユーザーにinteractiveに選ばせることで解決できる • semanticに曖昧性があるときはrelationなどを追加できる 例: Is Enrico working in IBM? (CSS: Class Similarity Service) 例: Who is the secretary in KMi? →(secretary) works-for (organization)
Learning Mechanism(1) • さまざまな言い回しに対してすべての表現をデータベースに入れるのは不可能 例:works (for) is working, works, collaborate, is involved • 2つのメソッドから構成される • matching • 文章が入力されるとKBにあるかどうかチェック • learning • KBにない場合、候補をユーザーに選択させるrelationと共にKBに登録 • 似ているコンテキストの時でも使えるようにコンテキストも同時に登録
Learning Mechanism(2) • Learning Process • contextの判定・登録 • 質問のargument、ontologyの名前、ユーザーの情報から決められる • contextは主にtripleのrelation • relationを共に登録することによって、多義語を複数の人が各々のcontextで使用することが可能になる • Context Generalization • Ontologyの上位概念を用いることによってcontextをgeneralizeする • ユーザーコミュニティへのサポート • クエリー中のterm, category, relationの選択をコミュニティ内で再利用する • 逆に前の記録を消すことも可能
Evaluation • QAの能力とユーザーの使い勝手の両方で評価が必要 • 現在のシステムではAKT ontologyとKMi KBを用いて実装 • 10人のメンバーに質問を作ってもらう(事前に言語処理についての情報を与えずに) • 76の質問のうち37個はうまく扱えた(48.68%) • ontologyを超えた質問はうまく扱えない(一番の研究者は?など) • さらに、Semantic Webへのインターフェースの役割も果たすためには、各ontologyにおけるportabilityの評価も必要 • ontologyがきちんとtripleの形であればAquaLogでの利用は簡単 → Wine Ontologyで評価