210 likes | 273 Views
リスク情報サイト横断検索システム. 静岡大学システム工学科 前田 研究室 50613042 高柳真吾. 研究 背景. 地震災害 ・静岡県を中心とした地震防災対策強化地域では東海地震による深刻な被害が予想される。 自助・共助・公助 ・ 防災 対策 には行政による「公助」、自分の身を自分で守る「自助」、地域や身近な人で助け合う「共助」の連携が必須である。. 研究背景と 目的②. ・情報共有による自助・共助・公助の連携 事前に公助による防災情報を知っておくことで災害時に 自助・共助で適切に防災活動を行う。 ・情報共有の必要性
E N D
リスク情報サイト横断検索システム 静岡大学システム工学科 前田研究室 50613042 高柳真吾
研究背景 地震災害 ・静岡県を中心とした地震防災対策強化地域では東海地震による深刻な被害が予想される。 自助・共助・公助 ・防災対策には行政による「公助」、自分の身を自分で守る「自助」、地域や身近な人で助け合う「共助」の連携が必須である。
研究背景と目的② ・情報共有による自助・共助・公助の連携 事前に公助による防災情報を知っておくことで災害時に 自助・共助で適切に防災活動を行う。 ・情報共有の必要性 様々な防災機関で配信されている防災情報は防災機関 同士の連携が不足している面もあり情報提供に改善の 余地がある。 共有化した防災情報を利用者に提供することで 利用者の自助、共助能力の向上を目指すシステムの構築を行う。
先行研究 共助を支援するシステム 中野[1]は島田市の市民活動団体のブログポータルサイト「eコミュニティしまだ」の記事の関連性を図示することで、リスクコミュニケーションをし易い関係づくりを支援した。
リスク情報サイト横断検索システム 中野のシステムを基に、防災情報に特化したシステムを構築する。 ・概要 地震防災対策強化地域の住民に複数の防災機関が配信する情報を共有化した情報を提供する。 ↓ 災害時の自助共助能力を向上を支援する。
リスク情報サイト横断検索システム 検索窓の解説 検索窓にはキーワード(文章でも構いわない)、もしくは記事URLを入力することができる。 検索ボタンを押すと ・浜松市の災害情報 ・静岡県の災害情報 ・気象庁 地震津波 ・内閣府一日前プロジェ クト 上記の四つのwebサイトから検索ワードとの連想検索を行う。 防災 「防災」と入力 検索窓 図2:リスク情報サイト横断連想検索システム
リスク情報サイト横断検索システム 関連ワードの解説 防災 対策 図3:リスク情報サイト横断連想検索システム、関連ワード表示部 検索された記事の中に含まれる単語で重要性の高いものを関連ワードとして、最大50件表示する。 キーワードをクリックすることで検索窓に入力でき、これを用いて再検索することができる
リスク情報サイト横断検索システム グラフの解説 連想検索ボタン 図4:リスク情報サイト横断連想検索システム、グラフ表示部 これはノードといい、記事を表している。ダブルクリックすることで 別ウインドウでその記事を表示する。 ノードを一件指定して連想検索ボタンを押すことで指定したノードの記事に対して類似度の高い記事を再検索することができる。 • これは枝といい、記事と記事のつながりを表す。最大20本表示する。 • 色の違いで文書の繋がりの強さを区別している。
連想検索 通常の単語検索はクエリ単語の出現回数から適合する文 書を判断するが、連想検索は各文書の単語の出現パター ンから適合する文書を判断する。
連想検索 類似度計算 記事→単語連想検索 関連ワードを探し出す計算 対象データの文書集合Dの中の選択された文書集合Sにおける各語 t の類似度ω(t|s) 関連ワードを抽出する文書群(#S )対して 対象の単語(t)を含む文書が少ない、かつ 対象の単語(t)を含む文書の中で t の頻度が高ければ類似度が高いと判断する。 N :Dの文書総数 df(t) :Dにおける単語tを含む文書数 #S :Sに含まれる文書数 tf(t|d):文書dにおける単語tの頻度 tf(.|d):文書dのすべての単語に関するtf(t|d)の平均値
連想検索類似度計算 単語→記事連想計画 文書を単語の集まりとし、データベースから類似度の高い文書を選ぶ計算。 単語の数をn個とし、それらの単語をt1,…..,tn としたときの文書bの類似度。 文書を構成する単語の平均類似度を求めている。 文書の長さによる単語の種類の増加と単語の頻度の増加を考慮し、Shinghalの文書長正規化を用いて補正している。 n 文書長正規化 dlen(b):文書bの中の異なる単語の種類数 L: 文書集合Dにおける文書の異なる単語種類平均値
近接度計算 • Touchgraphで記事間の枝を表示するために計算する。 • 繋ぐ記事2件が含む総単語数に対して、共通の単語数(Fxy)が多ければ文書間に高い近接度があるとする。 :文書xと文書yの近接度 : 文書xの持つ単語の数 : 文書xと文書yが共に含む 単語の数 : 文書yの持つ単語の数
結果及び考察 「避難」をキーワードに入力した場合結果及び考察 「避難」をキーワードに入力した場合 図5:「避難」をキーワードに入力した場合の出力
結果及び考察 「避難」をキーワードに入力した場合結果及び考察 「避難」をキーワードに入力した場合 ・静岡県は市をひと括りに避難 勧告を出している。対して浜 松市は市内の各地域に避難 勧告を出している。 ・浜松市は市内の防災訓練情 報を配信している。静岡県は 県内の防災訓練情報の他に 防災機関の国民保護訓練の 情報を配信している。 出典:http://blogs.yahoo.co.jp/hamamatsu_saigai/24224722.html 「舞阪及び雄踏地域に避難勧告を発令」 防災機関の役割と影響の範 囲が読み取れる 出典:http://blogs.yahoo.co.jp/shizuoka_saigai/42787158.html 【訓練】避難勧告等発令情報(防災局発表)
結論 考察より ・利用者に知りたい防災情報の総合的な知識を提供する。 ・利用者にそれぞれの防災機関が行う防災対策の違いを認識させる。 というシステムの目的を満たしていることを示せた。 対象とする防災機関を増やすことで、より実用的なシステムになると考えられる。
記事 • 「バイオトイレの寄贈がありました」 • で検索した結果 • 直接関係のある物資の話題の記事の他に、「バイオトイレの寄贈がありました」の記事の背景にある、避難所の話題、医療の話題に関する記事を検索した。 • ユーザは意図した情報に関連する情報を収集することが出来、総合的な防災情報を得ることが出来ると考えられる。 結果及び考察 図6:記事「バイオトイレの寄贈がありました」を入力した場合の出力
TouchGraphとGETAの応用 • TouchGraph グラフ表示に利用した Javaプログラム Javaappletとして利用 出来るためWebブラウ ザ上で利用者がグラフ を操作することができ る(拡大、枝の伸縮、 グラフの回転等) 図4:TouchGraph
近接度計算 • Touchgraphで記事間の枝を表示するために計算する。 • 単語の数の割に共通の単語数(Fxy)が多ければ文書間に高い近接度があるとする。 :文書xと文書yの近接度 : 文書xの持つ単語の数 : 文書xと文書yが共に含む 単語の数 : 文書yの持つ単語の数
連想検索 汎用連想検索エンジンGETA 本研究ではデーターベース保存、 文書検索、関連ワード抽出に使用 した。 文書と単語頻度の関係をWAMと 呼ばれる仮想的な行列で表現す ることにより、文書検索のための 必要な要素を効率よく収集し、 文書検索と関連ワード抽出に利用 する類似度を計算する。 図4:WAMイメージ
出典:http://blogs.yahoo.co.jp/hamamatsu_saigai/24224722.html出典:http://blogs.yahoo.co.jp/hamamatsu_saigai/24224722.html 「舞阪及び雄踏地域に避難勧告を発令」 出典:http://blogs.yahoo.co.jp/shizuoka_saigai/42787158.html 【訓練】避難勧告等発令情報(防災局発表)