300 likes | 373 Views
マイクロブログではどの程度 流言が訂正されるのか? ―Twitter 上での 1 年間の流言訂正情報の分析 ―. 宮部 真 衣 † 灘本 明代 ‡ 荒牧 英 治 † † 京都大学 ‡ 甲南 大学. Outline. 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ. 背景. 流言関連ツイート数. ユニークユーザ数. 34,482 件. 28,325 名. 流言の拡散しにくい環境の構築が必要. 関西電力 が電力の提供を始めたようなので、コチラで節電すれば 立派な 支援になります。. 【2011 年 3 月 】 震災時. マイクロブログの普及
E N D
マイクロブログではどの程度流言が訂正されるのか?―Twitter上での1年間の流言訂正情報の分析―マイクロブログではどの程度流言が訂正されるのか?―Twitter上での1年間の流言訂正情報の分析― 宮部 真衣† 灘本 明代‡ 荒牧 英治† †京都大学 ‡甲南大学
Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ
背景 流言関連ツイート数 ユニークユーザ数 34,482件 28,325名 流言の拡散しにくい環境の構築が必要 関西電力が電力の提供を始めたようなので、コチラで節電すれば立派な支援になります。 【2011年3月】震災時 • マイクロブログの普及 • Twitterアクティブユーザ数:2.8億人 • 2012年,GlobalWebIndex調査 • 東日本大震災(2011年3月11日) • Twitterなどのマイクロブログが重要な情報インフラの1つとして活用された • 一方,多くの流言も拡散された
流言の拡散防止 ユーザが情報を発信する前に,ユーザに対して その情報が流言である可能性を提示する • 流言の拡散 • 人は,その情報が正しいと思って発信する • つまり,流言であることを認識していない • 流言に関する情報(訂正情報)の提供 • 東日本大震災では,流言に関する情報が人手でまとめられ,提供されていた
問題点と本研究の提案 • 流言に関する情報をTwitterから自動的に収集するシステム“流言情報クラウド”を構築 • 1年間システムを運用して得られたデータから,その傾向を分析 提案 • 人手による訂正情報提供の問題点 • 誰かがまとめない限り,情報は提供されない • 情報をまとめる人に負荷がかかる
Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ
流言情報クラウドの概要 自動収集 ・・・・・ ・・・・・ 手動登録 流言に関する 情報を収集 流言情報を提供し 流言拡散を防止 流言に関する情報を収集し,ユーザの流言拡散防止を支援するサービス
流言収集の自動化(1/3) 情報の真偽判定は 可能か? 流言を収集・蓄積するためには,その情報の真偽を判別する必要がある
TRUE or FALSE ? 月刊体育施設 という業界紙があるらしい.
流言収集の自動化(2/3) ワンピースの作者 尾田栄一郎氏、地震の被害者救済に15億円を寄付「自分が幸せになったということは、世の中から受けたひとつの借りだ」 地震が起きた時、社内サーバールームにいたのだが、ラックが倒壊した。腹部を潰され、血が流れている。痛い、誰か助けてくれ。 【拡散希望】中の人が今友達からメールで回ってきました。 関西地区にお住まいのみなさん。地震に伴い、関西電力が電力の提供を始めたようです。 ある情報が流言であることを 単純に判定するのは容易ではない • 情報の真偽は,人間でも判別が困難 • 正しく判別するには,正しい情報が必要 • 流言情報の内容は多様
流言収集の自動化(3/3) 本研究では,流言訂正情報に着目
流言の訂正情報とは? このツイートはデマです。RT xxx: 〇〇〇 〇〇〇は本当なの?嘘じゃないの? 〇〇〇というデマを広げた人間がいるみたいだね 流言を直接検出するよりも 訂正情報の方が容易に検出できる可能性がある • 本研究における定義 • ある情報の不確かさを指摘している情報 • 訂正情報の傾向 • 訂正を明示する用語が含まれる場合が多い • 「デマ」「間違い」「ガセ」「誤り」「嘘」など
本研究のアプローチ 流言 情報 流言 情報 流言情報クラウドでは, 訂正情報を収集することにより, 間接的に流言を収集 ○○○○○は, デマらしいです. 訂正 情報
流言情報クラウド 2012年6月から運用
Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ
分析の概要(1/2) 【例】 ネット上で「今日から7月」ってデマが飛び回っている様です。お気を付けください • 流言情報クラウドを1年間運用し,Twitterから収集した訂正ツイートを分析 • 2012年6月22日~2013年6月21日 • 分析に用いる訂正ツイート:39922 件 • 収集した訂正情報のうち,流言が明示的に示されているものを使用
分析の概要(2/2) 分析1 1日あたり/1年間に訂正される 流言はどの程度存在したのか? 分析2 1つの流言に対し,どの程度の 訂正ツイートが発信されたのか? 以下に関する調査結果を報告する
流言に関する表現の異なりの扱い iPhone を電子レンジで チンすると直ぐに 充電ができる iPhone を電子レンジで チンすると充電できる iPhone を電子レンジで チンすると 急速充電できる 本研究では,異なる表現は まとめて1つの流言情報として扱う iPhone が電子レンジで 充電できる 1つの流言に対し,多様な表現が出現
1日あたりの訂正ツイート数,訂正された流言数1日あたりの訂正ツイート数,訂正された流言数
1年間の訂正ツイート数 1年間に発信された訂正ツイート:39922 件
1年間の訂正された流言数 1日ごとに訂正された流言の数を算出
訂正ツイート数と訂正された流言数 iPhoneを電子レンジでチンすると充電できる 地震でガレキの中に閉じ込められた、助けて(前日:震度5弱の地震発生) iPhoneを水に浸すと音質が良くなる • トトロのメイちゃんは『死んでいる』 • (前日:金曜ロードSHOW!で『となりのトトロ』放送) 1 日あたりに訂正される流言数は平均14 件程度であるが,多数のユーザが訂正する特定の流言の出現により,訂正ツイート数が急激に増加する場合がみられた まとめ1
流言あたりの訂正ツイート数の分布 訂正された流言の大部分は訂正数が少なく,10件以上の訂正ツイートが投稿される流言は10%程度であった まとめ2 1年全体で訂正された流言数:2953件
訂正情報数の推移傾向 一部のデータにおいて見られた特徴 1. 突出する部分がある 2. 長期間投稿が続く この2つの特徴に基づいて分類 訂正ツイートが10件以上ある流言288件の時系列データを分析
分類の定義 【長期/短期の分類】 訂正情報の投稿が14日以上 ↓ 長期と分類 突出 突出/短期 型 突出/長期 型 平坦/長期 型 平坦/短期 型 短期間 長期間 平坦 【突出/平坦の分類】 ある流言の1日の最大訂正ツイート数 > 2×平均訂正ツイート数 ↓ 突出と分類
分類結果 • 【突出/短期】の例 • コントレックスは被曝を防げる • 韓国が“コリアン文明”を世界四大文明に追加 • 【突出/長期】の例 • iPhoneを電子レンジでチンすると直ぐに充電ができる • 子宮頸がんワクチンで不妊 平坦/長期は, 同一ユーザが 定期的に投稿 • 【平坦/短期】の例 • 東京湾のアナゴが7万Bq/kg • ゴキブリにオロナミンC与え続けたらカブトムシになる • 【平坦/長期】の例 • Facebookじゃ稼げない • この人は虫としゃべれる
本研究の限定性 訂正された流言の大部分は訂正数が少なく,10件以上の訂正ツイートが投稿される流言は10%程度であった まとめ2 今後,実際に拡散された流言ツイートを分析し, 訂正ツイートとの関係を明らかにする必要がある ただし,訂正ツイートの多い流言=拡散数の多い流言かどうかは不明
Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ
本研究のまとめ • “流言情報クラウド”により,1年間 • 収集した流言訂正ツイートについて分析 概要 • 訂正される流言数は平均14 件/日だが,特定の流言の出現により,訂正数が急激に増加する場合がある • 10件以上の訂正が投稿される流言は10%程度であり,訂正された流言の大部分は訂正数が少ない 分析 結果 今後の 課題 • 拡散された流言ツイートと訂正ツイートとの関係の分析
ご清聴ありがとうございました mai.miyabe@gmail.com