1.12k likes | 1.23k Views
統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―. 2013 年8月1日 富山国際大学 教授 浜松誠二. Ⅰ . 統計処理を巡る話題 ― 我々の知識には根拠がなかった ―. 1.最強の学問 ― 統計ブーム ―. 「統計学が最強の学問である」 西内啓著 ダイヤモンド社 2013 年. EBM( Evidence-Based Medicine ) 科学的根拠に基づく医療. ( 前史 ) イグナッツ・ゼンメルワイスの発見 (1840) 産院での女性の死亡率 12 %⇒ 2 % 手を洗うことの励行で産褥熱感染の回避. EBM宣言.
E N D
統計で富山を知る―情報システムの進化・普及と統計の活用―統計で富山を知る―情報システムの進化・普及と統計の活用― 2013年8月1日 富山国際大学 教授 浜松誠二
Ⅰ.統計処理を巡る話題―我々の知識には根拠がなかった―Ⅰ.統計処理を巡る話題―我々の知識には根拠がなかった―
1.最強の学問―統計ブーム― • 「統計学が最強の学問である」 西内啓著 ダイヤモンド社 2013年
EBM(Evidence-Based Medicine) 科学的根拠に基づく医療 (前史) • イグナッツ・ゼンメルワイスの発見(1840) 産院での女性の死亡率 12%⇒2% 手を洗うことの励行で産褥熱感染の回避
EBM宣言 ゴードン・ガイヤット、デヴィト・サケット (1992) • 治療法の選択は、最高の根拠に基づくべきで、最高の根拠とはできれば統計からくるべきだ。
「10万人の命」宣言 • ドン・バーウック (2004) • 回避可能な死の防止のために 6つの変化の導入 肺感染、静脈感染の防止など 治療方法の確認 ⇒ 根拠のある治療
分析が可能に カルテの電子化と共有 事実の発見 • 海外の様子が見えだす(日本) 共有化、国際化、日本へも情報
日本での医療を巡る話題 • がん検診の評価 • メタボの評価 • サプリメントの評価
H.G.ウェールズ • 「統計学的思考が読み書きと同じように良き社会人としての必須の能力になる日がくる。」 (1903年)
H.ヴァリン Google チーフエコノミスト • 「これから10年もっともセクシーな職業は統計家である。 」(2009年)
データサイエンティストの時代 • 情報通信白書 将来的に25万人不足
2.統計処理の変化 ─情報技術の深化の中で─2.統計処理の変化 ─情報技術の深化の中で─
(1) 統計学 • A.ケトレー (近代統計学の父) 社会事象の正規分布 • ナイチンゲール 戦場での死因(統計の有効活用)
19c末~20c初 F.ゴールトン 指紋の発見者生物測定研究所 生物学に数学的厳密さを回帰 平均への回帰 親子の身長相関 計測の尺度 K.ピアソン 進化論の追跡 『科学概論』1880s 決定論的見方に追加すべきものを認識
フィッシャー実験計画 ロザムステッド農事試験場のデータ解析 W.ゴセット ステュデントのt検定
標本調査と統計学 マスコミの隆盛 新聞社の模擬投票 20cに入って盛んに 世論調査社の設立 アメリカ大統領選挙 ギャッラップの大成功(1936)と大失敗(1948) センサス局等の活動 標本調査の価値 → 標本調査の理論
統計学の実践 • 数表活用 ↓ • Excelでの計算 • 解析的解法 ↓ • シミュレーション等による解法
(2) 日常的統計処理 • データの入手 普段の活動で蓄積 インターネットでの提供 • データの加工 Excelで簡便に 多様な表現 • 成果の発信
○ 統計体系の再構築(日本) • 統計法 改正2007年 全面施行 2009年 基幹統計 国民経済計算、国勢調査、・・・ 経済センサス 2009年7月1日実施
政府統計の総合窓口 • 体系的整理 インターネット経由での入手 データベースシステム
○ 世界の統計 • 各国の統計システム • 国際機関の統計 無料化
データの加工 • Excelによる統計表の整理、 検定 χ2検定 • Excelによるグラフの作成 散布図で多様なグラフのテンプレート
(3) 体系的検証勘による対応から根拠のある対応へ (Evidence-Based)(3) 体系的検証勘による対応から根拠のある対応へ (Evidence-Based) • 年毎の新たなワインの質 (オーリー・アッシェンフェルター) =12.145+0.00117×冬の降雨 +0.00614×育成期平均気温 -0.00386×収穫期降雨
貢献出走塁 (ビル・ジェイムズ) =(ヒット数+四球) ×総塁数 ÷(死球以外の打席数+四球数)
自動販売機で新たな需要発見 • GPS等で建設機械の稼働状況を把握 • ツイッター情報から風邪の流行を予測 • リポーターの情報を集約から ゲリラ雷雨の予測
(4) 仮説の構築 • データの蓄積 • 相関から意味の発見 • ビッグデータ Volume 大量 Variety 多様 Velocity 高速
ビッグデータの争奪 ・インターネットの利用がそのままデータに 位置情報、検索情報、交信情報、・・・ グーグル アップル フェースブック アマゾン ・・・
(5) 人工知能 (AI Ⅲ) • 翻訳 • チェス • 自動車の自動運転 • ・・・・・
3.知識の根拠は脆弱 • 【知識についての考え方】
(1)我々の知識の根拠 ほとんど全てが ・権威(先生・マスコミ)からもらったもの ・生活体験からつかんだもの 多くは従っておいてよい 真実を知ろうとしたときは 一歩、抜け出ることが必要
(2) 正しい知識を持っているか①都合のよい判断(2) 正しい知識を持っているか①都合のよい判断 • ベンジャミン・フランクリン • 酸っぱいブドウ
B.フランクリンの格言 • 理性のある動物、人間とは、まことに都合のいいものである。したいと思うことなら、何にだって理由を見つけることも、理窟をつけることもできるのだから。
無意識のフィルター • 脳科学の発展 • 多様な実験 権威に従う 先入観で判断する 記憶も歪む
原子力村 • 仲間内で集まってもだめ 公共事業の暴走 下水道、ダム、道路、砂防、・・・ • 審議会も機能せず 誰を委員とするか • 社外役員の重要性
②無反省な弁明 • 富山の特徴に関する多様な言説があるが根拠に乏しい。 • 日常的認識での誤りが多い。
③ヒューリスティクな判断 • 「人間は生きていくために物事を適当に判断するようにできている」 • 錯覚は人にとって必要
ヒューリスティクな誤りの類型 • ベースレートの誤信 乳がん検診陽性でのがんの確率 • ギャンブラーの誤信 失敗続きの後は • 利用可能性への過度の依存 私の知人はこうであった • 因果関係の存在への期待 ハリネズミの失敗 • アンカリングの習性 先入観の囚われ • 後知恵の追加 自らの正当化のみ • 大量情報処理の恣意的整理 8以上の序列化は無理 このため、正しい判断には工夫が必要
⇒知性は理性的でない こう考えると いろいろな課題を謙虚に考え 真実を得るための努力を 意識的に行うことができる
4. 真実を得るための仕掛け • 積極的に仕掛けを構築する必要がある
(1) 調査研究の手法 • 統計二次分析 • 実験 • 調査票調査 • インタビュー調査 • 参与観察 • 踏査 • ドキュメント分析 • (比較研究) • (既存研究調査)
事例的調査 • 網羅的情報収集 一定のやり方で見た情報・聞いた情報は 全て記録する • 全ての情報での仮説構築 集まった情報は勝手に破棄しない
統計的調査 • 確実な統計的手続き • 仮説の検証 (いつまでも仮説を逃れられない) • 相関があっても因果関係とはいえない (因果関係を説明する数学的方法論はない)