920 likes | 1.29k Views
题 目. 调查问卷的效度、信度. 2013 年 09 月 02 日. 丽水学院商学院 何永达 副教授. what's validity ?. 效度?. what's reliability ?. 信度?. Main Content. 一、 Questionnaire Validity 二、 Example of Validity 三、 Questionnaire Reliability 四、 Example of Reliability 五、 The correlation between
E N D
题 目 调查问卷的效度、信度 2013年 09月 02日 丽水学院商学院 何永达 副教授
what's validity? 效度? what'sreliability? 信度?
Main Content 一、 Questionnaire Validity 二、 Example of Validity 三、 Questionnaire Reliability 四、 Example of Reliability 五、 The correlation between Reliability and Validity
1.误差公理 • 误差(error)是指对事物某一特征的度量值偏离真实值的部分,即测定值与真实值之差,样本统计量与总体参数之差。 • 没有一项研究推论能够达到百分之百的真实。 No study is free of errors, the inferences are never perfectly valid. • 误差公理:实验结果都会有误差,误差自始至终存在于一切科学实验的过程之中。
2.误差的种类(types of error) (1)随机误差(random error) • 随机误差是由不确定原因引起的,不可避免和消除。 其偏离总体的方向不能确定。包括随机测量误差和抽样误差。
随机测量误差(random measurement error) :没有固定的倾向,可使多次观测结果有大有小。 • 抽样误差(sample error) :由于抽样造成的样本指标与总体指标之间的差别。
(2)系统误差(systematic error) • 由于偏倚(使研究结果按照一个方向偏离总体, bias)产生的错误结果,可校正和消除。 • (3) 过失误差(gross error)是由于科研设计错误,或实验者的主观片面、粗心大意引起的误差。必须避免和剔除!
问卷测验中测量误差通常来源于两个方面: • 一是产生于问卷测验过程中的误差,称为测量误差(measurement Error),也称为随机误差(random error); • 二是由问卷的结构质量造成的误差,称为系统误差(system Error)。 • measurement Error reliability(信度) • system Error validity(效度)
一、调查问卷的效度 • The validity of a questionnaire
效度(validity)通常是指问卷的有效性和正确性,亦即问卷能够测量出其所欲测量特性的程度。效度(validity)通常是指问卷的有效性和正确性,亦即问卷能够测量出其所欲测量特性的程度。 • 对于一个标准测验来说,效度比信度更为重要。
1.效度分析的意义 • 效度是问卷调查研究中最重要的特征,问卷调查的目的就是要获得高效度的测量与结论,效度越高表示该问卷测验的结果所能代表要测验的行为的真实度越高,越能够达到问卷测验目的,该问卷才正确而有效。 • 问卷的准确性或称为有效性是用问卷的效度加以刻划的,它反映了对问卷的系统误差的控制程度。
2、效度的定义 • 效度是指问卷测验的准确性,即测验能够反映所要测量特性的程度. • 包括两个方面的含义:一是问卷测验的目的;二是问卷对测量目标的测量精确度和真实性。效度是一个具有相对性、连续性、间接性的概念。
在测量理论中,效度被定义为在一系列测量中,与测量目的有关的真变异数 ( 即有效变异 ) 与总变异数之比: r2xy表示测量的效度系数,Sv2代表有效变异数,Sx2代表总变异数。
3.常用的效度指标 • 确定一个问卷效度的方法,通常是以答卷者的问卷得分和另一个效度标准求相关,以其相关系数的大小来表示效度。如果相关系数高,则该问卷的效度就高。 • 一般常用的效度指标有内容效度、结构效度。
(1)内容效度 (content validity) • 内容效度是指问卷内容的贴切性(relevance)和代表性(representativeness),即问卷内容能否反应所要测量的特质,能否达到测验目的,较好地代表所欲测量的内容和引起预期反应的程度。内容效度常以题目分布的合理性来判断,属于命题的逻辑分析,所以,内容效度也称为“逻辑效度” (logical validity)、“内在效度(intrinsic Validity)”、“循环效度(circular validity)”
内容效度的评价主要通过经验判断进行,通常考虑3方面的问题:内容效度的评价主要通过经验判断进行,通常考虑3方面的问题: • 其一是项目所测量的是否真属于应测量的领域; • 其二是测验所包含的项目是否覆盖了应测领域的各个方面; • 其三是测验题目的构成比例是否恰当
常用的内容效度的评价方法有两种: • 一是专家法,即请有关专家对问卷题目与原来的内容范围是否符合进行分析,作出判断,看问卷题目是否较好地代表了原来的内容 • 二是统计分析法,即从同一内容总体中抽取两套问卷,分别对同一组答卷者进行测验, 两种问卷的相关系数就可用来估计问卷的内容效度 • 计算某个问题与去掉此问题后总得分的相关性情况,分析是否需要被剔除(敏感性分析)
(2)结构效度(ConstructValidity) • 结构效度又称构想效度,是指问卷对某一理论概念或特质测量的程度,即某问卷测验的实际得分能解释某一特质的程度。如果我们根据理论的假设结构,通过问卷测验得到答卷者实际分数,经统计检验,结果表明问卷能有效解释答卷者该项特质,则说此问卷具有良好的结构效度。
常用的确定结构效度的方法有: • (1)根据文献、前人研究结果、实际经验等建 • 立假设性理论建构; • (2)对问卷题目进行分析。主要是分析问卷的 • 内容,答卷者对题目所作的反应,问卷题 • 目的同质性以及分项目之间的关系来判断 • 问卷的结构效度; • (3)根据建构的假设性理论编制适当的问卷; • (4)计算与同类权威问卷的相关; • (5)以统计检验的实证方法去考查问卷是否能 • 有效解释所欲建构的特质。
3.效标效度(Criterion Validity) • 效标效度也称为准则关联效度(Criterion-Related Validity)、经验效度(Empirical Validity)、统计效度(Statistical Validity)。效标效度是说明问卷得分与某种外部准则(效标)间的关联程度,用问卷测量得分与效度准则之间的相关系数表示
一般估计效标效度的主要方法有: • (1)相关法,即求某问卷分数与效标间的相关,所得结果即效标效度。 • (2)区分法,即看问卷分数是否可以区分由效标所划分的团体。 • 可以运用t检验对先后两次问卷结果平均分数进行差异性检验。若差异有统计学意义,说明问卷是有效的;若差异无统计学意义,说明问卷是无效的。
(4)判别效度(Discriminant Validity) • 判别效标也称为辨别效标,是指运用相同的问卷测定不同特质和内涵,测量结果之间不应有太大的相关性。
(5)聚合效度(Convergent Validity) • 聚合效度也称为收敛效度,是指运用不同测量方法测定同一特质所得结果的相似程度,即对同一特质的两种或多种测定方法间应有较高的相关性。
6.效度的评价 • Spitzer认为如果满足以下5个条件就可以认 为问卷由效: • (1)问卷有内容效度和结构效度; • (2)在问卷制定阶段应当请有关人员提出意见,供修正和提高内容效度; • (3)问卷经过反复使用证明了其可靠性;(4)如果有公认标准存在,应以公认标准为准; • (5)公认金标准时可由判别效度代替
7.提高问卷效度的方法 • (1)理论正确,解释清楚。问卷内容要适合问卷测验的目的,题目要清楚明了,易于理解,问卷的排列要由易到难,题目的难度和区分度要合适; • (2)操作规范以减少误差; • (3)控制系统误差。它主要包括仪器不准,题目和指导语有暗示性,答案安排不当(被试可以猜测)等, 控制这些因素可以降低系统误差, 提高效度;
(4)样本适宜且要预防流失。重视问卷调查的回收率。样本容量一般不应低于30;(4)样本适宜且要预防流失。重视问卷调查的回收率。样本容量一般不应低于30; • (5)适当增加问卷的长度。增加问卷的长度既可提高问卷的信度,也可以提高问卷的效度,但增加问卷的长度对信度的影响大于对效度的影响; • (6)排除无关因素干扰。认清并排除足以混淆或威胁结论的无关干扰变量。
1.问卷的敏感性(可靠性)分析 • (1)操作过程 • 从菜单选择Analyze → Scale → Reliability Analysis…→ Item(输入问卷的各条目或各因子包含的条目)→ 单击“Statistics”按钮,弹出信度分析统计量对话框 → Descriptives for: → √ Scale if item deleted →OK
Scale if item deleted:去掉当前题目整个问卷的描述统计量,即敏感性分析,包括以下内容:Scale Mean if Item Deleted:去掉当前题目问卷合计分的均数; • Scale Variance if Item Deleted: 去掉当前题目问卷合计分的方差; • Corrected Item-Total Correlation: 当前题目得分与去掉当前题目问卷合计分的Pearson相关系数; • Squared Multiple Correlation:以当前题目为因变量,其它所有题目为自变量求得的决定系数R2;Alpha if Item Deleted: 去掉当前题目后问卷的Cronbach α系数。
(2)输出结果 • SCL90各条目的敏感性分析结果: • Item Scale Scale Corrected • Mean Variance Item- Alpha • if Item if Item Total if Item • Deleted Deleted Correlation Deleted • A1 31.7250 1272.7173 0.6397 0.9736 • E2 31.7500 1253.6282 0.8027 0.9732 • B3 31.8250 1261.0712 0.7408 0.9734 • A4 31.7500 1259.7821 0.7557 0.9733 • D5 31.7000 1278.2667 0.3872 0.9740 • C6 31.8250 1300.0455 0.0596 0.9745 • I7 31.9000 1279.0667 0.5320 0.9737 • H8 31.5750 1255.1224 0.7590 0.9733 • B9 31.2750 1259.2301 0.6572 0.9735 • ………………………………………………………………….. • E86 31.1750 1272.8147 0.3764 0.9742 • I87 31.9250 1277.1481 0.6231 0.9736 • I88 32.0500 1282.9718 0.6057 0.9737 • J89 32.2000 1304.1641 0.0000 0.9741 • I90 32.1750 1302.7122 0.1250 0.9741
一般地,在做问卷的敏感性分析时,可以将“Alpha if Item Deleted”值,作为调整题目的一个重要参考依据 • 如果“Alpha if Item Deleted”值越大,其相对应的题目越应是首先考虑调整的题目 • 从本次问卷结果敏感性分析可以看出,量表的各个题目的“Alpha if Item Deleted”值均在0.97左右变化,且变化的幅度很小 • 所以,根据 “Alpha if Item Deleted”这项检验指标的检验值分析,本量表的各题目设置合理,均可以保留,无需调整
2.问卷的结构效度的分析 • 问卷的结构效度的评价较为复杂,可用各个题目与量表各因子的相关分析和因子分析方法来反映。该检验将问卷中的每一道题看着一个变量,然后通过调查的结果得分对所有问题做因子分析,提取一些较为显著的因子,通过各个问题在每个因子上的载荷将问题分类。如果相同概念的问题都归为同一因子,则说明问卷具有很好的结构效度
(1)利用相关分析评价问卷的结构效度 1.从菜单选择Analyze →Scale →Reliability Analysis…→Item(输入问卷的各条目或各因子包含的条目) →Statistics弹出信度分析统计量对话框 →Inter-Item → √ Correlations → OK 2.如果同一问题下的几个调查项目之间相关系数较高,说明问卷结构效度好!如果不同问题下的调查项目之间相关系数较低,说明问卷结构效度好!
(2)利用因子分析评价问卷的结构效度 • 因子分析不仅能够评价量表结构的相合性,还可以用共性变异(共性方差)与总变异之比作为结构效度的衡量指标。结构效度的分析最好使用证实性因子分析,它较探索性因子分析更能说明问题。
执行Analyze → Data Reduction → Factor … ,弹出“Factor Analysis”对话框: • 单击Descriptives→ Statistics → √ Initial Solution → Correlation Matrix → √ KMO and Bartlett’s test of sphericity → Continue
结构效度的评价标准 • KMOandBartlet检验考察量表是否适合作因子分析;通常按以下标准解释,KMO(采样充足度)值大小 • 0.9以上表示非常适合; • 0.8一0.9表示适合; • 0.7一0.8表示一般; • 0.6一0.7表示不太适合; • 0.5一0.6表示很不适合; • 0.5以下表示不适合
1.信度分析的意义 • 信度主要是指问卷是否精准(precision) • 信度分析涉及了问卷测验结果的一致性和稳定性,其目的是如何控制和减少随机误差
调查问卷的信度包含两层含义: • 一是相同的个体在不同时间,以相同的问卷测验,或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即问卷测验结果是否随时间和地点等因素而变化; • 二是能否减少随机误差对问卷测验结果的影响,从而能够反映问卷所要测量的真实情况,即问卷测验结果是否具有稳定性、可靠性和可预测性。一个好的问卷必须是稳定可靠的,且多次问卷测验结果应前后一致
2.信度的定义 • 信度是用估计测量误差大小的尺度,来说明问卷测验结果中测量误差所占的比率 • 信度可定义为真实分数(true score)的方差与测验实得分数(observed score) 的方差之比,当实得分数变异可以全部由真实分数的变异解释时,测验误差就是0,这时问卷测验的信度为1
若用表示问卷测验的信度,理论应有 • 或 • 式中 表示真实分数的方差; • 表示实得分数的方差; • 表示误差的方差。
3.信度的分类 • 信度研究的是问卷测验结果的可靠性与稳定性,可以从不同的角度来评价: • (1)在相同条件下所得问卷测验结果的一致程度; • (2)不同研究者用同一种问卷同时测验所得结果的一致程度; • (3)同一研究者用同一种问卷在不同时间内测验所得结果的一致程度
4.常用的信度系数 • (1)重测信度(test-retest reliability) • 假定短时间内一批对象的状况并没有改变,对每个对象用同一个问卷先后测验两次,两次测验得分的相关系数就称为重测信度。重测信度是用皮尔逊积差相关系数r公式计算的
重测信度也存在着局限性: • 间隔时间长,环境影响; • 如果间隔时间短,记忆影响。
(2)复本信度(alternate form reliability) • 复本通常是根据相同的设计说明分别独立编制的两个平行问卷,即题目不同但是内容相似的两份问卷。复本信度也叫等值性系数(coefficient of equivalence)。两个复本间隔一定时间或同时施于同一答卷者所得分数的相关系数就是复本信度
缺点: • 如复本编制不容易,易出现顺序效应,受练习的影响; • 复本信度只能反应问卷内容所造成的误差,无法反应答卷者本身所造成的误差等
(3)分半信度(split-half reliability) • 当测验没有复本且测验不可避免地受到时间的影响,只适合用于一次测验时,可用分半信度。 • 分半的方法很多,一般是将奇数题和偶数题各作为一半,而非前后分半,目的是避免顺序效应。分半信度也叫折半信度,其计算方法是将问卷的题目分成对等的两半,分别求出两半题目的总分,再计算两部分总分的相关系数。