340 likes | 436 Views
社会统计在中国职工研究中的应用. —— 以“ 2002 年职工队伍状况调查数据”为例. 中国人民大学社会学系 冯仕政 fengsz@ruc.edu.cn. 统计应用的三个内容. 统计知识的应用 统计软件的应用 应用统计软件(统计 + 软件)协助社会科学分析. 第一步:研究什么问题?. 在理论兴趣与社会现实的不断交锋中,不断明确 所要 研究、 所能 研究的问题 理论兴趣: 个人的社会认知或专业兴趣 有关组织或个人的指示、任务和委托 社会现实: 鲜活的生活事实 已获取和能获取的档案、数据和其他资料. 我 想 研究:中国工人的 “ 阶级意识 ”.
E N D
社会统计在中国职工研究中的应用 ——以“2002年职工队伍状况调查数据”为例 中国人民大学社会学系 冯仕政 fengsz@ruc.edu.cn
统计应用的三个内容 • 统计知识的应用 • 统计软件的应用 • 应用统计软件(统计+软件)协助社会科学分析
第一步:研究什么问题? • 在理论兴趣与社会现实的不断交锋中,不断明确所要研究、所能研究的问题 • 理论兴趣: • 个人的社会认知或专业兴趣 • 有关组织或个人的指示、任务和委托 • 社会现实: • 鲜活的生活事实 • 已获取和能获取的档案、数据和其他资料
我想研究:中国工人的“阶级意识” • 基于社会感知:因就业、失业和下岗所引发的社会冲突越来越频繁、越来越激烈 • 基于专业关切:这些冲突是以“阶级”为基础的吗? 或,“阶级”在其中扮演什么角色?
关于“阶级意识”的理论争论 • 自在阶级、自为阶级与阶级意识 • 阶级意识的现状 • 个体意识的集合还是心心相印的群体意识? • 阶级意识包含哪些内容?…… • 阶级意识的形成: • 结构地位论 • 历史文化论 • 国家中心论 • 精英策动论
能研究吗?评估可行性 • 了解调查背景 • 项目建议书 • 调查问卷 • 调查执行报告 • 了解数据状况 • 变量设置 • 变量描述统计
了解调查背景 • 了解调查背景的中心任务是评估研究设计和的科学性,以及数据的代表性 • 调查总体:职工队伍,什么是“职工”?根据工作状态、工作身份还是工会会员身份? • 抽样框:用什么数据做抽样框? • 样本分配:抽样设计 • 田野执行:执行的具体过程?质量控制? • 数据清理过程:逻辑矛盾、缺失值、……
调查数据质量评估报告 • 31个省、市、自治区、146个城市、80个县城、30000多户家庭 • 家庭户,不含集体户 • 从家庭户中抽取1位16岁以上的从业、下岗、失业内退或离退休人员为最终调查对象 • 家庭基本情况、个人劳动就业、收入分配、社会保障、技能培训、民主权利、安全生产、劳动关系、思想状况等 • 抽样方法、质量控制、总体估计以及代表性估计
初步探索数据 • Codebook • 有哪些变量?变量性质? • 变量的取值?取值的分布? • 数据是否清理干净? • 描述统计 • 观测值、平均值、标准差、全距 • 对数据的初步探索能够做到心中有“数”,既有利于评估选题的可行性,也有助于研究方向的精细化
选题的修正和提炼 • 在了解调查背景、内容和数据初步探索的基础上,重新定向和提炼研究选题 放弃“阶级意识”,尝试研究“加班”问题 • 专业上对“加班”问题有兴趣 • 国内外相关研究很少,有学术价值 • 调查中相关数据比较丰富,有可行性
先了解加班(a34, a35)的基本情况 • A34. 您上周实际工作了多少小时(包括加班、加点)? • 在5189个样本中有4729人(在职工作者)回答了该问题 • 每周工作40小时及以下只占46.8% • 平均每周工作43.3小时,最短0小时,最长112小时, 依国家法律而论,加班是普遍现象
加班待遇 A35. 如果您加班加点,您所在单位是否按照《劳动法》规定给您支付了了加班加点工资或安排了补休?[a35]
加班的性别差异 (F=31.84 P <.01)
加班的年龄差异 (F=2.71 p< .05)
婚姻与加班 (F=1.29 p> .1)
不应只满足于描述加班状况,而应更深层次挖掘加班的社会动因和过程不应只满足于描述加班状况,而应更深层次挖掘加班的社会动因和过程 以往局限于从劳动法的角度来考虑加班问题,关注的是劳动和休息的法律保障,以及超时劳动的补偿问题 这里从社会学角度来考察:人们为什么要加班? 问题的提出:为什么要加班?
理论思考 • 理论思考的功能在于操作化研究提供“施工蓝图”,避免随意性导致的不周延和低效率 • 我的初步思考 • 劳动既是个人的志愿选择,也是一种结构性安排 • 劳动既是一个提供服务和物质产品的生产过程,也是一个不断再生支配-服从关系的政治过程
理论假设 • 假设1:劳动作为个体选择下的生产过程 • 1.1 个人对工资的追求越强烈,加班可能性越低,加班的时间越长 • 1.2 个人的技术水平和教育水平越低,加班的可能越高,加班的时间越长
理论假设(续1) • 假设2:劳动作为结构限制下的生产过程 • 2.1 一个组织的薪资制度越是趋近小时工资制,其职工加班的可能性越高,加班时间越长 • 2.2 一个组织的产品越是面向市场,其职工加班的可能性越高,加班时间越长 • 2.3 一个组织的技术水平越低,其职工加班的可能性越高,加班时间越长
理论假设(续2) • 3. 劳动作为个体选择下的政治过程 • 3.1 个体越是热爱劳动,加班的可能性越高,加班时间越长 • 3.2个体实现自我的欲望越强,加班的可能性越高,加班的时间越长 • 3.3个体对选择工作的机会越多,加班的可能性越低,加班的时间越短
理论假设(续3) • 4. 劳动作为结构限制下的政治过程 • 4.1 一个组织越是不民主,其职工加班的可能性越高,加班的时间越长 • 4.2 一个组织的权力等级越高,其职工加班的可能性越低,加班的时间越短
函数表示 • y=a+f(x1i, x2i, x3i, x4i)+e • Y: 加班 • x1i:第一组假设所涉及的变量 • x2i:第二组假设所涉及的变量 • x3i:第三组假设所涉及的变量 • x4i:第四组假设所涉及的变量 • f表示自变量xmi与应变量y之间的映射关系
因变量 是否加班:a34分成两组—加班vs.不加班 加班时长: (a34—40)小时 自变量: 工资追求:a40-1:收入高 技术水平:a18,技术、职称等级 教育水平:a9 薪资制度:a12 (代理变量proxy) 组织市场化:a21 (代理变量proxy) 变量的操作化
变量的操作化(续) • 组织技术水平:a23(代理变量,proxy) • 个人劳动热情:a37(代理变量,proxy) • 自我实现欲望:a39_8 (代理变量,proxy) • 工作选择机会:a38 • 组织民主程度: • a821:是否实行劳资恳谈会 • a84:是否开展工资集体协商
人口学变量 • 性别 • 教育 • 婚姻
基本趋势观察 • 见表2
对数回归模型:预测是否加班 • 结果见表3
多元线性回归模型:预测加班时长 • 结果见表4
结论与讨论 • 哪些假设得到验证,哪些假设没有得到支持? • 进一步思考: • 理论假设的问题? • 数据的问题? • 测量的问题? • 对今后调查和研究的意义
反思问卷设计 • 问卷调查 • 1、一定要有理论思考 • 2、理论思考一定要清晰 • 3、没有理论指导的问卷调查一定是不周延的,低效率的 • 4、相关档案的保存非常重要