140 likes | 268 Views
经济统计学 第九章 相关分析和回归分析. 主讲老师:龚秀芳. 本章内容. 第一节 相关分析 第二节 直线回归分析 第三节 可线性化的曲线回归. 第一节 相关分析 一、变量之间的关系 变量之间的关系可以分为函数关系和相关关系两种。 1. 函数关系 函数关系是指变量之间的一种完全确定性的关系,即一个变量的数值完全由另一个变量的数值确定,可以用数学表达式准确地表示出来。 例如: l=2 π r ,其中 l 为圆周长, r 为圆半径。半径越大,圆周长越长。 2. 相关关系 相关关系是一种变量之间的不严格、不确定的关系,受着随机因素的影响。
E N D
经济统计学第九章 相关分析和回归分析 主讲老师:龚秀芳
本章内容 第一节 相关分析 第二节 直线回归分析 第三节 可线性化的曲线回归
第一节 相关分析 一、变量之间的关系 变量之间的关系可以分为函数关系和相关关系两种。 1.函数关系 函数关系是指变量之间的一种完全确定性的关系,即一个变量的数值完全由另一个变量的数值确定,可以用数学表达式准确地表示出来。 例如:l=2πr,其中l为圆周长,r为圆半径。半径越大,圆周长越长。 2.相关关系 相关关系是一种变量之间的不严格、不确定的关系,受着随机因素的影响。 例如:身高和体重的关系。
二、相关分析的种类 1.根据自变量的多少划分,分为单相关和复相关。 单相关又称一元相关,自变量的个数只有一个。 复相关又称多元相关,自变量有两个或两个以上。 2.根据相关的形态划分,分为线性相关与非线性相关。 线性相关又称直线相关,是指当自变量变动时,因变量随之发生大致均等的变动,从图形上看,其观察点的分布近似地表现为一条直线。 非线性相关也称曲线相关,是指当自变量变动时,因变量也随之发生变动,但这种变动不是均等的,从图形上看,其观察点的分布近似地表现为一条曲线,如抛物线、指数曲线等,因此也称曲线相关。
3.根据相关的方向划分,分为正相关和负相关。3.根据相关的方向划分,分为正相关和负相关。 正相关是指当自变量的值增加或减少时,因变量的值也随之增加或减少。 负相关是指当自变量的值增加或减少时,因变量的值反而减少或增加。 4.根据相关的程度划分,分为完全相关、不相关、不完全相关。 完全相关是指因变量的数值完全由自变量的数值确定。完全相关就是函数关系,或者说函数关系是相关关系的一个特例。 不相关是指变量之间彼此互不影响,其数值变化各自独立。
三、相关分析的主要内容 有两方面内容:一是确定现象之间有无相关关系;二是确定现象之间相关的形态和相关的密切程度。 (一)相关关系的判断 1.定性分析。在进行相关分析之前,首先根据研究者的理论知识、专业知识和实践经验,对客观现象之间是否存在相关关系,以及有何种相关关系做出判断,这就是定性分析。 2.相关表。相关表就是根据现象之间的原始资料,将一变量的若干变量值按从小到大的顺序排列,并将另一变量的值与之对应排列形成的统计表。 3.相关图。相关图又称散点图,它是根据相关表中的数据,在直角坐标系中绘制的图形。通常,以x轴代表自变量,以y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点的分布状况。
(二)相关程度的测定 英国统计学家卡尔·皮尔逊设计了一个用于测定变量之间线性相关程度和相关方向的统计指标–––相关系数(r),它的定义公式为: 相关系数的值为–1≤r≤+1时,其性质如下: 1.当r>0,两变量正相关;当r<0时,两变量负相关。 2.当|r|=1,两变量为完全线性相关,即函数关系。 3.当r=0,两变量间无线性相关关系,但可能有曲线关系。 一般地,当|r|<0.3为微弱线性相关;0.3≤| r|<0.5为低度线性相关;0.5≤| r|<0.8为显著线性相关;0.8≤| r|<1为高度线性相关。
例:为了了解某公司员工的工龄与其工作效率之间的相关性,该公司人力资源部进行了一项研究,其目的是想依据研究成果预计员工的工作效率,随机抽取样本如下:计算相关系数,说明相关程度。例:为了了解某公司员工的工龄与其工作效率之间的相关性,该公司人力资源部进行了一项研究,其目的是想依据研究成果预计员工的工作效率,随机抽取样本如下:计算相关系数,说明相关程度。 解:r=0.3531,微弱相关
第二节 直线回归分析 一、回归分析与相关分析的区别与联系 1. 概念:回归分析是指对具有相关关系的现象,根据其相关的形态,选择一个合适的数学模型,近似地表示变量之间平均变化关系的统计方法。 2.回归分析与相关分析的区别 (1)在相关分析中,两个变量之间的关系是对等的,不存在自变量和因变量的划分问题;在回归分析中,变量之间的关系是不对等的。 (2)在相关分析中,根据两个变量只能计算一个相关系数来反映变量之间相关程度的大小。而在回归分析中,对于互为因果的两个变量,有可能存在两个回归方程。 (3)在相关分析中,所有的变量都必须是随机变量;而在回归分析中,自变量是给定的,因变量才是随机的。
3.回归分析与相关分析的联系 (1)相关分析是回归分析的基础和前提。如果缺少对现象之间的相关关系作判断,就不能作回归分析,即使勉强做了,有时也没有实际意义。 (2)回归分析是相关分析的深入和继续。相关分析仅仅说明现象之间是否具有关系,它们之间的关系密切程度如何。只有通过回归分析,建立了回归方程,才能从数量上反映变量之间的联系形式,才可进行相应的回归预测,使相关分析具有实际意义。
二、直线回归模型 三、估计标准误差 一般标准差反映的是各变量值与其平均数的平均差异程度,表明其平均数对各变量值的代表性强弱;估计标准误差反映的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值的代表性强弱。 估计标准误差越小,估计值的代表性越强,用回归方程估计或预测的结果越准确。
样本决定系数是相关系数r的平方,它是一个回归直线与样本观测值拟合程度判定的指标。样本决定系数是相关系数r的平方,它是一个回归直线与样本观测值拟合程度判定的指标。 r2的值总在0和1之间。一个直线回归模型如果充分利用了x的信息,则r2越大,拟合程度就越好;反之,如r2不大,说明模型中给出的x对y的信息还不够充分,应进行修改,使x对y的信息得到充分利用。
第三节 可线性化的曲线回归 1.指数曲线模型 2.幂函数曲线模型 3.双曲线模型 4.对数曲线模型 转化为直线回归模型 转化为直线回归模型 转化为直线回归模型 转化为直线回归模型