760 likes | 901 Views
教育统计与测量的基础知识. 更多资源 xiti123.taobao.com. 第一节 教育统计基础知识. 一、教育统计与测量概述. 1. 什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。. 2. 统计学分类. (1) 数理统计:以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。 (2) 应用统计:统计原理在某个行业的具体应用。如工业统计学、教育统计学等。. 3. 教育统计 .
E N D
更多资源xiti123.taobao.com 第一节 教育统计基础知识
一、教育统计与测量概述 1. 什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
2.统计学分类 (1) 数理统计:以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。 (2) 应用统计:统计原理在某个行业的具体应用。如工业统计学、教育统计学等。
3. 教育统计 教育统计是运用数理统计原理和方法,研究教育问题的一门应用科学。主要包括: • 描述统计; • 推断统计; • 实验设计。
. 教育统计中几个名词 • 频数:随机事件在n次试验中出现的次数,称这个随机事件的频数。 • 频数分布:各种随机事件在n次试验中出现的次数分布,称为频数分布。 • 离差:个体量和某一群体的平均量之差。
教育统计中几个名词 • 正态分布:是一种连续型随机变量的概率分布。 • 二项式分布中当 p=q时,且n很大时,二项式分布接近于正态分布
二、统计表 • 构成:统计表一般由标题、表号、标目、表注等构成。 • 编制基本原则:结构简明,一目了然。
(顶线) (底线) 统计表基本格式 表的标题 ? ? ? 注脚:说明资料来源等 X X X
1. 直条图 2. 圆形图 三. 统计图统计图由标题、图号标目、图注等项构成。
3. 线条图 4. 频数颁布直方图 图2.4中考化学统计成绩直方图
5. 累积频数图图2.5 2004年中考化学抽样得分情况累积频数图 图2.6:高一语文 10 20 30 40 50 60 70 80 90 100
四、集中量 1. 算术平均数( ) 所有观察值总和除以总频数之和所得商。
四、集中量 2. 加权平均数( ) • 是不同比重数据(或平均数)的平均数 • 或. • N表示各组的频数;X 表示各组的平均数。
例1:一个学生某门课期中考试成绩为72分,期末考试成绩为86分,而期考试占总成绩的40%,期末占60%,这个学生的学期总分是多少?例1:一个学生某门课期中考试成绩为72分,期末考试成绩为86分,而期考试占总成绩的40%,期末占60%,这个学生的学期总分是多少?
例2 :某校初一共有3个班,某次语文测验中,一班50人均分为68,二班45人均分为75,三班40人均分为80,问全校初一语文的平均成绩? 不能用:(68+75+80)/3=74.33
正态分布图 • 偏正态分布
五、差异量 1. 全距(R) 一组数据中最大值和最小值之差表示,又称极差。 2. 标准差(σ或S) 标准差概念:标准差是指离差平方和后平均的方根。
问题1: 某班甲乙两组在一次测验中的成绩分别为65,68,71,72,74(均分为70分)和 30,50,86,90,94(均分为70分)。如何评价两组的学习情况?
方法一:根据定义式计算 • 方法二:根据原始数据计算 • 方法三:利用计算器计算 • 方法四:利用计算机计算
3.差异系数(变异系数) • 两个群体测量单位不同,或虽测量单位相同,平均数相差很大时,不能用标准差比较他们离散程度,可利用差异系数。
问题2:某校期末考试语文平均成绩为69.3分,标准差为11.2分;英语平均成绩为94.8,标准差为13.8分。问哪一学科离散程度大?问题2:某校期末考试语文平均成绩为69.3分,标准差为11.2分;英语平均成绩为94.8,标准差为13.8分。问哪一学科离散程度大?
问题3:设某考区已录取高中学生语文平均分为69分,标准差为12.5分,而未录取高中的学生语文平均分为40分,标准差为12.5分。比较他们语文成绩的离散程度。问题3:设某考区已录取高中学生语文平均分为69分,标准差为12.5分,而未录取高中的学生语文平均分为40分,标准差为12.5分。比较他们语文成绩的离散程度。 CV1=12.5/69 *100%=18.12%; CV2=12.5/40 *100%=31.25%。 未录取学生的离散程度大。
问题4:下表中是某班甲乙两同学的期末考试成绩,问:(1)甲同学的语文和数学哪科相对较好? (2)甲同学和乙同学相比,哪一个学业成绩较好?
六、标准分 (1)概念:标准分是将原始分数(测验分数)与平均分数相减,再除以标准差所得的商。 甲同学: z(语文)=(73-48.3)/ 3.9=1.8 z(数学)=(79-66.9) / 18.5=0.7
(2)标准分特点 • 标准分是以标准差为单位的,故称为标准分。它是一种相对地位分。 • 标准分有正负之分,一般在[-3,3]中(几率为99.74%) ,平均值为零。 • 标准分可比性根据在于标准正态分布。 T分数:T=100Z+500 (一般200≤T≤800)
(3)标准分应用 • 比较各个学生成绩在班级中地位; • 比较某个学生两科或多科测验中所得分的优劣,精确地计算学生的总成绩。 • 确定等级评定的人数。
七、相关系数 • 相关:是指两个或两个以上变量之间存在相互依存关系。如数学课成绩与数学竞赛成绩、数学与物理成绩等。 • 正相关 • 负相关 • 零相关
相关系数:用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。最常用的是积差相关系数。相关系数:用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。最常用的是积差相关系数。
八、差异显著性检验★假设检验的基本原理 1.假设 • 虚无假设(零假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)无区别的假设,一般H0表示。 • 备择假设(研究假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)相反的假设,一般用H1表示。 • 由于直接检验备择假设的真实性困难,假设检验一般都是从虚无假设出发,通过虚无假设的不真实性来证明备假设的真实性。
八、差异显著性检验 • 2. 小概率事 在随机事件中,概率很小的事件被称为小概率事件,习惯上约定在0.05以下,即当P(A)< 5%时,则称A为小概率事件。在统计推断中认为,小概率事件在一次试验或观察中是不可能发生的。
八、差异显著性检验 3.显著性水平 • 两种水平 (1)α=0.05,显著性水平为0.05,即统计推断时可能犯错误的概率5%,也就是在95%的可靠程度上进行检验; (2) α=0.01,显著性水平为0.01,即统计推断时可能犯错误的概率1%,也就是在99%的可靠程度上进行检验。
4.双样本Z检验 双样本均为大样本,N1、N2都大于30,并标准差相差不很大。(N小于30要用t检验) 八、差异显著性检验
八、差异显著性检验 例3:某校高一进行数学教改实验,若实验前两班的化学成绩无显著性差异,实验一段时间后的数学测验成绩,实验班51名为均分为62.37,标准差为13.65,对照班45名学生的均分为56.16,标准差为16.37,试进行差异性检验。
(1)提出假设 虚无假设H0:μ1=μ2(实验班和对照班样本来自同一个总体)。 备择假设H1:μ1≠μ2 (实验班和对照班样本不是来自同一个总体)。 (2)选择统计量,计算其值 (3)确定显著水平 α=0.05。 (4)统计决断 |Z|=2.0 > 1.96,则P<0.05,拒绝零假设。实验班和对照的化学成绩存在显著差异.
第二节 教育测量的质量特性
一、教育测量的信度和效度 • 一个高质量的测验,它的结果是可靠而且是有效的; • 可靠性(信度)和有效性(效度)是评价测验质量的两个重要指标。
当一个测验多次测量的结果一致时,它就被认为是可靠的;当一个测验多次测量的结果一致时,它就被认为是可靠的; • 估计测量一致性程度的指标被称为信度。
如果在大体相同的条件下,几次测验都得到了大体相同的分数,那么这个测验的信度是较高的,反之,信度就低;如果在大体相同的条件下,几次测验都得到了大体相同的分数,那么这个测验的信度是较高的,反之,信度就低; • 即如果被试的实得分数与真实分数差距小,则测验的分数越可靠,信度越高。 • 通常用信度系数衡量测验好坏: • 一般能力与学籍测验的信度系数常在0.9以上; • 性格、兴趣、态度等人格测验常在0.8-0.85之间,有的认为0.7以上。
估计信度的方法 • 再测信度 • 复本信度 • 分半信度 • 内部一致性信度
试卷的信度 • σ2i:每一道试题的方差; • σ2:全卷的方差; • k试卷中试题的数目。
教育测量的效度 • 效度是测量的有效性,即一个测验对它所要测量的特性准确测量的程度。 • 效度不仅受随机误差的影响,还受系统误差的影响。
效度的类型 • 内容效度 • 构想效度 • 内部效度 • 统计结论效度 • 外部效度
内容效度 • 题目对欲测的内容或行为范围取样的适当程度,即是否充分代表了该范围内的基本知识和基本能力。 • 要具备好的内容效度要满足两个条件: • 确定好内容范围; • 测试题目具有该范围的代表性。
确定内容效度的方法 • 专家判断法 • 再测法
内容效度较适合评价教育成就测验和职业选拔测验;内容效度较适合评价教育成就测验和职业选拔测验; • 缺乏可靠的数量指标,妨碍各测验间的相互比较。