1.05k likes | 1.31k Views
非线性拟合 -- 捕食和功能响应曲线. 张海成 李希希 张艳聪. 主要内容. 1 基本概念原理. 2. 3. 生态学问题. 统计学解答. 2. 一 基本概念原理. 1.1 引入. 1.2. 1.3. 1.4. 多元线性回归. 一元线性回归. 非线性回归. 张海成. 3. 1.1 引入. 考察变量之间关系的统计方法:. 连续变量 : 相关分析、回归分析. 4. 回归. 相关. 不必区分 自变量与因变量 描述两变量数量上 联系的密切程度 所研究变量属于 对等 的关系. 区分 自变量和因变量
E N D
非线性拟合 --捕食和功能响应曲线 张海成 李希希 张艳聪
主要内容 1 基本概念原理 2 3 生态学问题 统计学解答 2
一 基本概念原理 1.1 引入 1.2 1.3 1.4 多元线性回归 一元线性回归 非线性回归 张海成 3
1.1 引入 考察变量之间关系的统计方法: 连续变量: 相关分析、回归分析 4
回归 相关 • 不必区分自变量与因变量 • 描述两变量数量上联系的密切程度 • 所研究变量属于对等的关系 • 区分自变量和因变量 • 自变量对因变量数量上的影响程度 • 所研究变量属于非对等关系 5
回归分析法: 通过实验和观测建立变量之间关系的一种数理统计方法 线性回归分析 一元回归分析 回归分析 多元回归分析 非线性回归分析 6
主要目的: 在于了解自变量对因变量影响 内容: • 探索和确定变量之间的相关关系和相关程度 • 建立回归模型,检验变量之间的相关程度 • 应用回归模型进行估计和预测等 7
1.2 一元线性回归 Y因变量; x自变量;β0, β1回归系数,ε随机误差 • 适用条件: • 无偏性: E(ε) = 0 • 正态性, ε为服从正态分布的随机变量 • 方差齐性:各组ε的方差都相同,即 ε与自变量、因变量之间相互独立 • 独立性:各组ε之间相互独立,且COV(ε i, ε j) = 0, (i≠ j) 8
参数β0, β1 的普通最小二乘估计 基本思想:回归直线与所有样本数据点距离最近 体重—身高 9
对β0,β1分别求偏导 且令两偏导等于0 整理后得到 求解 10
回归方程拟合优度的评价 拟合优度: 样本观测值聚集在样本回归线周围的紧密程度 决定系数:R² SST 总离差平方和 SSE 残差平方和 SSR 回归平方和 11
R²表示全部偏差中有百分之多少可由x和y的回归关系来解释R²表示全部偏差中有百分之多少可由x和y的回归关系来解释 12
回归方程的显著性检验 13
对整个回归方程的显著性检验 • 提出假设:H0:回归方程不显著(βi = 0); H1: 回归方程显著(βi不全为0) • F-检验(ANOVA) ③ 给出显著性水平α,确定临界值F(1, n-2) ④若F ≥ Fα(1, n-2), 拒绝H0,说明回归方程总体显著;反之 14
对回归系数的显著性检验 • 提出建设:H0: 回归系数不显著(β1 = 0 ); H1:回归系数显著(β1 ≠0) • t-检验 t 统计量 S1:回归系数的标准差 Syx, σ: 估计标准误差 σ²:误差项方差 ③ 给定显著性水平α,确定临界值tα/2(n-2) ④若|t|≥ tα/2(n-2), 则拒绝H0,认为回归系数显著;反之 15
两条或多条回归方程的差异性比较 例:1)A,B两样地观测数据得到的回归方程是否有显著性差异 2)男、女生身高与体重的回归方程是否有显著性差异 Y = a1X + b1 + ε1 Y = a2X + b2 + ε2 … Y = anX + bn + εn 原理: 检验斜率、残差、截距三项 1)残差ε: F-检验 2)斜率a,截距b使用其他复杂统计量,SPSS以协方差分析进行检验(见ANCOVA-63)
SPSS具体处理步骤: 多用协方差分析检验截距和斜率的差异,以SPSS为例:1.先重新整理数据,将y2数据列加到y1下面,变成一个变量y;将x2数据列加到x1下面,变成一个变量x;然后再设定一个新的分组变量group,原来第1组值为1,第2组值为2. 2.进行协方差分析(第一步分析斜率是否无差异). Analyze->General Linear Model->UnivariateDependent List:填入y---------将y做为因变量 Fixed Factor:填入group Covaraites:填入x--------将x做为协变量 Model:选Custom Model:填入 x group x*group---------注意如果变量填入顺序不一样,结果也会不一样. (注意:x*group是通过双选得到)Sum of squares下拉列表框:选TypeI然后点击ok,看结果里x*group这一行的Sig.P值,若大于0.05,则接受原假设,即两条回归直线的斜率无差异,否则拒绝. 3.再来进行截距的无差异分析 其实过程跟上面一样,只是Model里去掉了x*group交叉项. Analyze->General Linear Model->UnivariateDependent List:填入y---------将y做为因变量 Fixed Factor:填入group Covaraites:填入x--------将x做为协变量 Model:选Custom Model:填入 x group ---------注意如果变量填入顺序不一样,结果也会不一样. Sum of squares下拉列表框:选TypeI点击ok后,看group一行的Sig.P值,若P值大于0.05说明两条回归直线截距也无差异,若小于0.05说明截距是有差异的. PS:paired test是student-t检验的一种,但检验的结论是两组数据所来源总体的差异。所以判断两回归曲线的差异,需用协方差分析或单独的检验统计两来判断截距和斜率的差异。
回归方程的估计与预测 点估计 回归方程估计 置信区间估计 19
回归方程的估计与预测 对于给定的X值,求出 Y 平均值的一个估计值或 Y的一个个别值的预测值。 点估计 20
自由度为n-2的 t 分布 的 水平双侧分位数 回归方程的估计与预测 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y的平均值E(y0)的估计区间 ,这一估计区间称为置信区间 置信区间估计 对于给定的 x = x0,Y 的1-置信区间为: 21
回归方程的估计与预测 置信区间估计 Sy: 回归估计标准差 22
1.3 多元线性回归 (假定:x1,x2…xp无交互作用) ε = Y:因变量; x1, x2, … xp: 自变量; Β0, β1, … βp: 回归系数 ε :随机误差 适用条件: 无偏性E(ε) = 0 服从正态分布 方差齐性 独立性 23
多元线性回归模型的参数估计 基本思想:使估计值 与观测值y之间的残差在所有样本点上达到最小 方法:最小二乘法 (详见路径分析) Q最小 • 步骤: • 分别对β0, β1…… βp求偏导 • 令各偏导等于0 • 求得β0, β1…… βp 24
拟合优度检验 总偏差 (SST) = 回归偏差 (SSR) + 剩余偏差 (SSE) 25
回归方程显著性检验 对整个回归模型的显著性检验(似一元回归模型) ① 提出假设,H0:回归模型不显著(β1 = β2……= βp = 0);H1:回归模型显著( β1, β2…… βp 不全为0) ② 建立F统计量 ③ 给出显著性水平α,查F分布表,得临界值Fα (p, n-p-1) ④ F ≥ Fα (p, n-p-1), 则拒绝H0,回归模型显著 26
回归系数显著性检验 ① 提出假设: H0: βi = 0; H1:βi = 0; ② 建立t检验计算公式:③ ④ Si:回归系数标准差;Cii是(XTX)-1中第i+1个主对角线元素 ③ 给出显著性水平α,查t分布表,得临界值tα / 2 (n-p-1) ④ |t|≥ tα / 2 (n-p-1), 则拒绝H0,回归系数显著 27
1.4 非线性回归模型 线性模型: yi 是解释变量xi的线性函数 yi是相应参数βi的线性函数 28
非线性模型: • 建立因变量与自变量之间的非线性关系 • 无假设条件,可建立任意形式的模型 本质线性模型 非线性模型 本质非线性模型 29
本质线性模型 30
模型的选取 • 了解数据特点或可辨别变量间的相关关系 • ——直接选择函数模型 • 数据认识不充分,不能辨别变量间的相关关系 • —— 绘制散点图,根据图形特点选择模型形式 • 对于无法直接从散点图看出应选取何种回归模型的 • ——尝试多种可能的模型,并通过R²的大小、图形本身的比较选择出最优模型 B = pDq 31
函数转换法不足: • 可能导致更复杂的计算 • 可能导致数据失真 • 不是所有非线性模型均可转换为线性模型 32
本质非线性模型 无法通过变量变换转化为线性模型 33
非线性回归模型解法 • 最小二乘法(模型主体部分占优势) Gauss-Newton算法 Newton-Raphson算法 • 最大似然法(模型随机误差部分占优势) 1) 估算模型中参数的起始值及其取值范围 2) 利用迭代算法寻找使得残差平方和最小的参数估计值 Newton-Raphson算法 计数算法 BHHH算法 34
二 生态学问题 数学模型 2.1 生态学问题 2.2 李希希 35
动物生态学的基本知识 动物生态学(animal ecology):是从生物种群和群落的角度研究动物与其周围环境相互关系的科学,是生态学的分支,是由动物学与生态学等交叉形成的学科。 36
研究内容 (1)阐明动物与生存条件的关系,生存条件的变化对动物的生理结构、形态特征和行为方式的影响; (2)研究在一定的生存条件下各种动物种群的数量关系,出生率和死亡率的变化,种群密度和年龄分布; (3)研究一定的环境条件下种内和种间关系以及它们对动物进化的意义,种内与种间的合作与竞争,捕食-被捕食,种间各种共生关系,以及动物种群的结构和演化; (4)研究不同生态条件下动物种群和群落的形成、适应性和演化; (5)人类对动物资源开发利用和动物遗传资源的保护等。 37
2.1 生态学问题 自然界中有很多例子能证明捕食者具有控制其捕食猎物密度的功能。 例如:1、1950年~1960年间北美五大洲中的七鳃鳗几乎导致湖红点鲑的灭绝; 2、在人类开始捕杀狼之前,黄石地区的狼使得当地麋鹿的密度受到控制。 38
功能响应(Functional Response):一个捕食者个体所能猎杀的猎物数量(或者一个寄生物能攻击的寄主数量)是关于猎物密度的函数。 一定时间内被猎杀的猎物数随着猎物密度的增加逐渐接近一个渐近线。 39
第Ⅰ类功能响应 ※捕食者随机搜寻猎物 ※搜寻时间为一常数 ※食欲有限 ※不考虑猎物被捕食者处理所需的时间。 被捕食猎物数在一定范围内随猎物种群的增加而直线增加,超过则不再增加。 被猎杀猎物比例保持最大(非密度依赖型),继而降低。 其中,Ne是被捕食猎物数; N是猎物密度。 40
第Ⅱ类功能响应 ※捕食者随机搜寻猎物 ※搜寻时间与处理时间成反比 ※捕食者食欲有限 捕食的猎物数随猎物密度的增加,以双曲线型接近渐近线,超过这一范围将不再增加 被猎杀猎物的比例渐进型减少(反密度依赖型)。 T 表示总时间。 Th表示每个捕食者处理每个猎物所需的时间(其中包括用于吞食猎物和无法攻击其他猎物的所有时间)。 41
第Ⅲ类功能响应 ※取食猎物的效率 ~食量限制 ~猎物种群低密度下的敏感 程度 ※猎物数与猎物种群密度为 “S”型曲线 猎物被猎杀比例逐渐增加至S型曲线的拐点(密度依赖型),然后开始减少。 42
研究功能响应涉及的相关问题 功能响应的类型是什么?(比较C和E、D和F) 功能响应的机制模型中系数的最佳估计是什么? 描述两种功能响应的模型中系数是否有显著的不同? 43
研究功能响应相关问题的一般方法 模型选择——包括使用对被捕杀猎物与猎物总数之比的逻辑斯蒂回归方法 假设检验——包括对被杀猎物数量和所提供猎物数量比值的非线性最小二乘回归来估计功能响应的参数以及比较不同功能响应的参数。 44
2.2 功能响应的数学模型 • 与功能响应相关的因素 被捕食量,用Ne表示。 攻击系数(瞬时的搜寻速率)使得猎物的遇到概率和猎物密度相关联。用a表示。 猎物密度,用N表示。 从开始捕食到捕到猎物所用的时间。用Ts表示。 总时间,用T表示。 6. 每个捕食者处理每个猎物所需的时间(其中包 括用于吞食猎物和无法攻击其他猎物的所有时 间),用Th表示。 Ne= a*TsN 45
Ne= a*TsN • 将Ts考虑为一个变量,又根据: Ts=T - ThNe • 将代入中,变形可得: 公式2:Ne=aNT/(1+aNTh) 46
第Ⅰ类功能响应 公式2: Ne= aNT/(1+aNTh) 当Th=0,即不考虑猎物的处理时间时: 公式1: Ne = aNT 47
Disc方程模拟第Ⅱ类功能响应 模型假定: 1.渐近线由时限决定; 2.捕食者遇到猎物概率和猎物密度线性相关; 3.当捕食者在处理猎物时不再进行其他捕获; 4.猎物密度恒定。 48
第Ⅱ类功能响应 公式2:Ne=aNT/(1+aNTh) 被捕食量,用Ne表示。 攻击系数(瞬时的搜寻速率)使得 猎物的遇到概率和猎物密度相关联。 用a表示。 3. 猎物密度,用N表示。 4. 总时间,用T表示。 5. 每个捕食者处理每个猎物所需的时 间(其中包括用于吞食猎物和无法 攻击其他猎物的所有时间),用Th 表示。 49
存在猎物消耗时描述功能响应的适合模型ɑ关于N的双曲线型函数存在猎物消耗时描述功能响应的适合模型ɑ关于N的双曲线型函数 b,c和d均为常数 50