170 likes | 277 Views
ブーム読み取りシステムに関する研究. 大阪工業大学 情報化学部 メディア学科 C04-037 川崎友大. 目次. 1. 背景 2. 解決策 3. システム設計 4. 評価 5. 今後の課題. 1 .背景. スーパーマーケットの売り上げ向上実現 □ 季節ごとの行事の企画 □ 即売による企画 どこのスーパーも既に実現している. 不定期に起こるブーム現象による悪影響 □ 商品の品切れ □ 市場の供給不足 現状の解決方法 □ 店長が新聞やニュース番組をチェック △ 時間や手間がかかる △ 客観的判断が出来ない. 2 .解決策.
E N D
ブーム読み取りシステムに関する研究 大阪工業大学 情報化学部 メディア学科 C04-037 川崎友大
目次 • 1. 背景 • 2. 解決策 • 3. システム設計 • 4. 評価 • 5. 今後の課題 -1-
1.背景 • スーパーマーケットの売り上げ向上実現 □季節ごとの行事の企画 □即売による企画 どこのスーパーも既に実現している -2-
不定期に起こるブーム現象による悪影響 □商品の品切れ □市場の供給不足 • 現状の解決方法 □店長が新聞やニュース番組をチェック △時間や手間がかかる △客観的判断が出来ない -3-
2.解決策 • ネット媒体からブームを自動抽出する □時間や手間がかからない • ネット媒体の候補 1.検索エンジン ⇒情報の鮮度が古い 2.ツィッター ⇒自然言語の為、システム化の困難 -4-
Yahoo検索ランキング ⇒24時間以内で検索されたキーワードをランク化 ⇒RSS形式で発信 情報の鮮度と取り扱いやすい情報様式 -5-
3.システム設計 3.1 システムイメージ 書き込み 参照 ランクDB 1.DOM機能 RSS 2.パターンマッチング機能 キーワード DB 3.ブーム読み取り機能 4.ブーム表示機能 -6-
3.2 DOM機能 ・Yahoo検索ワードランキングをランクDBに登録 DOM機能 ・ランクDB <item> <title>マンゴ</title> <description>メキシコ産がニーズナブルと話題 </description> <pubDate>Thu, 10 Feb 2011 12:56:28 +0900</pubDate> <ranking:rank>16</ranking:rank> <ranking:point>6411</ranking:point> </item> -7-
3.3 パターンマッチング機能 • 3.3.1 ランクDBのキーワード分解 『ひらなが』と『漢字』と『カナ』に分解 ・マンゴ ・メキシコ ・産 ・が ・ニーズナブル ・と ・話題 -8-
3.3.2 パターンマッチング ・キーワードDB ・分解したキーワード ・マンゴ ・メキシコ ・産 ・が ・ニーズナブル ・と ・話題 ・ランクDB -9-
3.4 ブーム読み取りシステム ・3.4.1 ランクDBから必要データ抽出 条件1dateが直近1ヶ月以内 条件2 KIDが0以外 -10-
3.4.2 ブーム評価 • 評価ポイントの算出 評価ポイント= KID毎のpointの累計+KIDの登場回数×1000 ・キーワードDB hpoint 22124 5894 12345 34512 0 -11-
3.5 ブーム表示機能 ・TOP画面 ・終了画面 -12-
4.評価 • 2010年12月のデータ ブーム候補 1位 桃 12030点 2位 ぶどう 8943点 3位 柿 4320点 ・テレビ番組で取り上げられた『桃』が頻繁に登場 -13-
システムの評価 • ブームの自動抽出 1日1回起動することで実現達成 • パターンマッチング機能の評価 『ひらがな』,『漢字』,『カナ』を切れ目にすることで 『しぶ柿』を対象内に『柿田』の人名を対象外にできた • 評価ポイントの妥当性 1ヶ月単位では1000倍は妥当 対象期間に応じて重み付けの係数の修正必要有り -14-
5.今後の課題 • 長期間のデータの蓄積 • ブーム抽出の精度変化の為 • キーワードデータベースの多様化 • 様々な分野のフィールドを加え拡張する -15-