220 likes | 399 Views
計量的手法入門 人材開発コース・ワークショップ( IV). 2000年6月29日、7月6・13日 奥西 好夫 ( okunishi@i.hosei.ac.jp). 講義概要. 0.研究計画 ( proposal) の手順 1.研究計画とデータの対応 2.データの収集、利用 3.データのチェック、検討 4.データの分析 --- 統計手法の利用 参考文献 統計ソフトの案内. 0.研究計画 ( proposal) の手順. 0-1. 何を明らかにしたいのか? <研究課題>. 一般的な問い( general question)
E N D
計量的手法入門人材開発コース・ワークショップ(IV)計量的手法入門人材開発コース・ワークショップ(IV) 2000年6月29日、7月6・13日 奥西 好夫 (okunishi@i.hosei.ac.jp)
講義概要 0.研究計画(proposal)の手順 1.研究計画とデータの対応 2.データの収集、利用 3.データのチェック、検討 4.データの分析 --- 統計手法の利用 参考文献 統計ソフトの案内
0-1.何を明らかにしたいのか? <研究課題>0-1.何を明らかにしたいのか? <研究課題> • 一般的な問い(general question) • 具体的な問い(specific questions)
0-2.その問題を明らかにすることにどういう意義があるのか? <研究意義、問題意識>0-2.その問題を明らかにすることにどういう意義があるのか? <研究意義、問題意識> • 既存研究との関連 --- これまでの学問的蓄積への貢献 • 個人的、社会的、政策的関心等
0-3.その問題をどのように明らかにするのか? <研究方法>0-3.その問題をどのように明らかにするのか? <研究方法> • 研究対象、研究方法の選択 • 実行可能性と正当化 --- なぜ上記の選択を行ったのか --- 「位置づけ」の明確化
0-4.どのような結果が予想されるのか? <研究内容>0-4.どのような結果が予想されるのか? <研究内容> • 研究仮説の設定 • どこまでやれば、当初提示した「研究課題」に答えたことになるのか
1-1.研究課題の解明や理論仮説の検証に必要な変数が含まれているか1-1.研究課題の解明や理論仮説の検証に必要な変数が含まれているか • 研究課題とデータの調査対象、時期、内容等との整合性 • 被説明変数、説明変数はそれぞれ何か • データでわかること、わからないこと
1-2.データ上の変数と理論変数の関連はどうか、どのような測定尺度を用いるか1-2.データ上の変数と理論変数の関連はどうか、どのような測定尺度を用いるか • データ解釈の多義性(context依存性) • 主観と客観(共通尺度設定の困難さ) • 意識と行動
2-1.自分でデータを集める • 調査対象の選定、協力獲得 • 調査票の設計 • 調査票の配布、回収、点検 • 使用する統計ソフトに応じたデータの入力
2-2.既存データを利用する • 官庁統計調査の結果報告書 • 各種統計調査の個票データ(マイクロ・データ) --- 日本では「統計法」の制約 *東大社研データ・アーカイブ *ミシガン大学データ・アーカイブ • 各種業務統計の利用(企業の人事データ等) • 使用する統計ソフトに応じたデータの変換
3-1.サンプルの特性 • 調査対象、抽出法 • サンプル・サイズ、回収率 • 標本誤差と非標本誤差 • サンプル・セレクション・バイアス
3-2.欠損値、誤記入値、異常値 • 変数の特性値(特に最大値・最小値)、分布状況をチェック • サンプルから除外、または置き換え
3-3.各変数の特性値、変数間の相関関係 • データの特徴を掴んだり、モデル推計に用いる変数の選択に有効 • データ・マイニング、プリテスト --- pros and cons
4-1.記述統計 --- サンプル・データの「縮約」 • 代表値(平均、最大・最小値、n分位数、中位数、最頻値) • ばらつき(標準偏差、範囲、変動係数、n分位分散係数) • ゆがみ(歪度) • 相関係数 • グラフの活用
4-2.推測統計 --- サンプル・データから「真の特性」を推測 • 確率論が基礎 • 母集団の分布、標本、標本平均の分布 • それぞれの特性値(平均と分散) • 推定(点推定、区間推定、標準誤差) • 検定(帰無仮説と対立仮説、p-値) • ランダム・サンプリング、ランダム・アサインメントの重要性
4-3.応用例 • クロス集計表 • 平均値の差の検定 • 線形回帰分析 • プロビット・モデル • ・ ・ ・
参考文献 統計ソフトの案内 • エクセル統計2000 • SPSS • STATA • ・ ・ ・