340 likes | 448 Views
市场预测与决策 陈晓慧 (7) 2009.2. M (1) t = M (1) t –1 +x t -x t-n /n. chap7 回归分析预测法. 一元线性回归预测法 多元线性回归预测法 非线性回归预测法 虚拟变量回归预测法. 本章学习要点: 本章重点是要掌握回归分析预测的原理与方法、步骤,特别是能从实际出发解决一元线性回归的预测问题。. 第六章 回归分析预测法. 回归分析起源于 生物学 的研究。
E N D
市场预测与决策 陈晓慧 (7) 2009.2. M(1)t= M(1)t –1+xt-xt-n/n
chap7回归分析预测法 • 一元线性回归预测法 • 多元线性回归预测法 • 非线性回归预测法 • 虚拟变量回归预测法
本章学习要点: 本章重点是要掌握回归分析预测的原理与方法、步骤,特别是能从实际出发解决一元线性回归的预测问题。
第六章 回归分析预测法 回归分析起源于生物学的研究。 英国的著名生物学家达尔文在19世纪末,发现父亲的身高与儿子的身高之间有密切的关系。一般来说,父亲身材高大的,其子也比较高大,父亲矮小的,其子也比较矮小。但是,在大量的研究资料中,又发现身高有一种向平均身高回归的倾向,即身高很高大的父亲,其子比父亲略矮;反之,很矮的父亲,其子比父亲略高。这种身高倾向平均数的现象称为回归(Regression)。 经济领域中的许多问题,也可用回归分析来预测,并且取得了很好的效果。
一元线性回归方程预测法 回归分析预测就是通过对观察数 据的统计分析和处理来研究与确定事物间相 互关系和联系形式的一种方法。是确定变量 之间函数关系的一种有利的工具。
一、回归预测分类 一元线性回归 二元线性回归 多元线性回归 线性回归 非线性回归 回归预测
二、一元线性回归方程(Element Linear Regression ) 经济变量之间通常存在着因果关系。 例如,收入和消费;价格与需求量之间,都有一定的关系。下面是1980年以来人平均收入和人平均消费支出的 七组数据,见下表: 在表中,x—人平均收入,y—人平均消费支出。
从表中可知,x和y呈现线性规律,设回归线性方程为:从表中可知,x和y呈现线性规律,设回归线性方程为: ŷi=a+bx (1) 由(1)可得到x和y之间的定量关系表示为: (2) 其中:(2) —一元线性回归方程; a 和b—回归系数 ;a—截距;b—斜率。
三、回归参数估计 由一组观察值 画出散点图,如右图所示,这样的直线可画出很多条,而回归直线只有一条,因为只有回归直线最接近实际观察值。要拟合一条最理想的回归直线,就要确定a和b。确定a和b的 方法有多种,其中应用最多的是最小二乘法。 回归直线 t 图 回归直线的散点图 四、最小二乘法 设任意一个回归值ŷi实际观察yi之间存在的误差为ei,令 有: (3)
(4) (5) (6) (7) 由(6)、(7)解得a,b分别为:
五、可靠性检验 为了避免误差过大,确定a和b之后,在允许误差的情况,进行可靠性检验。 1.R检验 检验x 与y之间的线性相关的程度。 其数学表达式为: (1)当:0≤ |r| ≤ 1 若r与b取同号,则有: b>0,r>0,表明x和y同方向变化,称为正相关; 若r与b取同号,则有: b<0,r<0,表明x和y反方向变化,称为负相关。
(3)从相关系数临界表中查出rc 根据 n-m-1(自由度)和α(显著性水平)在相关系数临界值表上可查出rc。 (4)作出判断 当|r|≧rc,则x和y之间线性相关性显著,检验合格,预测模型有效; 当|r|<rc,则x和y之间线性相关性不显著,检验不合格,预测模型无效;此时要分析原因,对回归模型重新处理,至到检验合格。
2.F检:是对全部回归系数进行一次性显著性检验2.F检:是对全部回归系数进行一次性显著性检验 (方程显著性检验) 回归模型显著性检验步骤为: (1) 根据α以及分子(m)和分母(n-m-1)的自由度,查F分布表得临界值Fc; (2)作出判断 ①当F>Fc(α,m,n-m-1), 则回归模型具有显著水平,x和y之间的变化是符合回归模型; ②当F≤FC(α,m,n-m-1)时, 则回归模型没有显著水平,x和y之间的变化不符合回归模型的变化,预测模型无效。
六、预测区间估计 • (一)有关概念: • 点估计(Point estimate) • 给定值x0,ŷ=a+bx,就可以得到一个ŷ0。 • 区间估计(Range estimate) • 指出有效区间,这个区间又称为置信区间。 对于观察数据量n ≤30的小样本而言,因变量y的估计值ŷ0的置信区间为:[ŷ0-δ, ŷ0+ δ] (18) (19)
5.置信度与置信区间的关系 ①当置信度为68.3%时,预测值的近似置信区间为: [ŷ0-Sy, ŷ0+Sy] ②当置信度为95.4% 时,预测值的近似置信区间为: [ŷ0-2Sy,ŷ0+2Sy] ③当置信度为99.7 %时,预测值的近似置信区间为: [ŷ0-3Sy, ŷ0+3Sy] 其中: 为标准差
七、Forecast process 1.确定预测目标(Object)和影响因素(Affect factor) 通常情况下,市场预测的目标必定是因变量,例如,预测未来5年小家电需求量,它的因变量就是未来5年小家电的需求量。 确定自变量,既要对历史资料和现在资料进行分析,在诸多个影响因素中找出最有影响的因素(主要矛盾),作为自变量。 2.建立回归预测模型(Regression forecast model) 根据收集的资料,画散点图,并依据变量之间的相关关系,用恰当的数学表达式表示出来。
3.r test 根据 n-m-1(自由度)和α(显著性水平)在相关系数临界值表上可查出rc。 (4)作出判断 当|r|≧rc,预测模型有效; 当|r|<rc, 预测模型无效 4.F test 根据α以及分子(m)和分母(n-m-1)的自由度,查F分布表得临界值Fc; ①当F>Fc(α,m,n-m-1),回归系数显著; ②当F≤FC(α,m,n-m-1)时,回归系数不显著。
⒌ 预测 ①当置信度为95.4% 时,预测值的近似置信区间为: [ŷ0-2Sy,ŷ0+2Sy] ②当置信度为99.7 %时,预测值的近似置信区间为: [ŷ0-3Sy, ŷ0+3Sy] 其中: 为标准差
一元线性方程举例 某地区1988-1994年结婚人数与某家电产品销 售额如表下所示,假定1995年该地区的结婚人数将达74百对,试预测1995年该家电产品的销售额。 表
结婚人数 解:1.画散点图, 如右图 由图可知:结婚人数与 家电产品的销售量呈线性关系,故可用一元线性回归模型进行预测。 • • • • • • 家电产品的销售量 图 2.确定一元回归预测模型参数a,b。 其中: 并将有关计算a,b的数据填入表中
由表中的数据计算a,b 则所求的一元线性回归预测方程为: ŷ=a+bx=5.44+0.73x b=0.73的经济含义是该地区结婚人数每增加1百对,该家电销售额将0.73百万元。 3.方差分析
4.模型检验 ∴S回=S²XY/Sxx=770.57²/1058.86=560.77,m=1 S余=Syy-S²XY/Sxx=565.71-770.57²’1058.86=4.94 n-m-1=7-1-1=5, S总=Syy=565.71, n-m-1=7-1=6, (1)F检验 当α=0.05,Fc(α,m,n-m-1)=Fc(0.05,1,5)=6.61 ∵F=567.58>Fc=6.61 ∴回归模型具有显著性水平.
(2) r 检验 5.预测模型点估计及置信区间 1995年的结婚人数0=74(百对)时,在同期内相应的家电产品销售额为:ŷ=5.44+0.73×74=59.46(百万元) 6.计算标准误差 当置信度为95.4%时,预测值y0的置信区间为: [ŷ0-2Sy,ŷ0+2Sy]=[59.46-2×0.994, 59.46+2×0.994]=[57.47,61.45]
多元线性回归预测分析法 在市场预测中,一个结果,有时会遇到两个因素或两个以上的因素共同发生作用,此时就不能再用一元线性回归方程预测了,而多元线性回归方程预测就是解决这类问题。 一、多元线性回归的概念(Multi-elements linear regression ) 影响因变量的因素有两个或两个以上,且自变量与因变量的分布呈线性趋势的回归,用这种回归分析预测的方法称为多元线性回归预测。 二、多元线性回归预测法 一般形式:ŷi=a+b1x1+b2x2+……+bmxm 其中:x1,x2,……,xn 为自变量, a, b1, b2, ……, bn为回归方程的参数
存在两个自变量的多元线性回归方程称为二元线性回归方程,它是多元回归方程的特例。存在两个自变量的多元线性回归方程称为二元线性回归方程,它是多元回归方程的特例。 1.建立线性回归方程 多元回归方程(以二元为例)线性回归预测法的步骤如下: ŷ=a+b1x1+b2x2 其中:a,b1,b2为回归系数。由最小二乘法得: (2) 将相关数据代入上式方程组,得到参数a, b1, b2, 则多元回归方程为: ŷi=a+b1x1+b2x2(3)
2.显著性检验 (1)r test (2)F test(1)t test是检验每一个xi在指定显著性水平(α)下,对y的影响是否显著的(变量显著性检验 ). ① 当 则xi对y有显著影响,保留在方程中; 反之影响小,可忽略。 ② t计算公式
回归分析中的非线性问题 以上学的是线性的,在实际应用中,碰到的问题经常是非线性的,有些可将其线性化,如有以下几种形式: 1.三角函数(Trigonometric function) y=a + sin t (1) 令x= sin t, 则(1)可变为:y=a+x (2) 即(1)可转化为线性方程。 2.指数函数(Exponential function) (3) (4)
3、幂函数(Power function) 4、双曲函数(Hyperbola function) 5、对数函数(Logarithm function)
非线性问题举例1 非线性问题举例1 某店在1984~1993年的商品流通费用率和商品零售额的具体情况见表6-7,若1995年商品销售额36.33万元,请预测1995年的商品流通费用率。 解题步骤: (1)散点图 (2)确定预测模型
(3)确定参数a,b, • 可得预测模型:ŷ=2.5611+42.8726/x • 相关系数r检验 • (5)进行预测 • 当x=36.33时, ŷ1995=2.5611+42.8726/x=3.74%
课堂作业 ⒈什么情况下使用回归分析预测法? ⒉什么是r检验、 F检验、 t检验? ⒊ 某家用电器社会购买力(十万元)与该市家庭人均货币收入(元)的资料如表所示: (1)建立一元线性回归方程模型; (2) 对回归模型进行检验(α=0.05); (3)当市民人均收入按10%增长,试预测第十年的购买力是多少?(并作区间估计)