E N D
数学建模模型方法综述 哈尔滨学院
一、层次分析法模型 简介 层次分析法(The Analytic Hierarchy Process即AHP)是由美国运筹学家、匹兹堡大学教授T.I.Saaty于20世纪70年代创立的一种系统分析与决策的综合评价方法,是在充分研究了人们的思维过程的基础上提出来的,它较合理地解决了定性问题定量化的处理过程。AHP的主要特点是通过建立递阶层次结构,把人们的判断转化为若干因素两两之间重要度的比较上面,从而把难于量化的定性判断转化为可操作的重要度的比较上面。在许多情况下,决策者可以直接使用AHP进行决策,极大地提高了决策的有效性、可靠性和可行性,但其本质是一种思维方式,它把复杂问题分解成多个组成因素,又将这些因素按支配关系分别形成递阶层次结构,通过两两比较的方法确定决策方案相对重要度的总的排序。整个过程体现了人决策思维的基本特征,即分解、判断、综合,克服了其它方法回避决策者主观判断的缺点。本节将为读者介绍AHP建模步骤、AHP的有关理论,并用一个具体例子说明AHP在复杂系统决策中的应用。
层次分析法的基本方法与步骤 运用层次分析法进行决策,大体上可分为四个步骤: (1)分析系统中各因素之间的关系,建立系统的递阶层次结构; (2)对同一层次的各元素关于上一层次中某一准则的重要性进行两两比较,构造两两比较判断矩阵。 (3)由判断矩阵计算被比较元素对于该准则的相对权重,并进行一致性检验。 (4)计算各层元素对系统目标的合成权重,并进行排序。
实现方法(1)----递阶层次结构的建立 复杂问题的决策因涉及的因素比较复杂,通常是比较困难的,应用AHP的第一步就是将问题涉及的因素条理化、层次化,构造出一个有层次的结构模型。在这个模型下,复杂问题的组成因素被分成若干组成部分,称之为元素。这些元素又按其属性及关系形成若干层次,上一层次的元素对下一层次的有关元素起支配作用,这些层次可以分为三类。 最高层:又称目标层。这一层次的元素只有一个。一般它是分析问题的预定目标或理想结果。 中间层:又称准则层。这一层次包括了为实现目标所涉及的中间环节,它可以由若干层次组成,包括所需考虑的准则和子准则。 最低层:又称方案层。这一层次包括了为实现目标可供选择的各种措施,决策方案等。 上述层次之间的支配关系不一定是完全的,即可以存在这样的元素,它并不支配下一层次的所有元素,而仅支配其中的部分元素,这种自上而下的支配关系所形成的层次结构称为递阶层次结构。一个典型的层次结构如图7—1所示。
实现方法(1)----递阶层次结构的建立 目标层 决策目标 准则层 准则1 准则2 准则m1 子准则1 子准则2 子准则m2 方案层 方案1 方案2 方案n 递阶层次结构示意图
实现方法(1)----递阶层次结构的建立 在递阶层次结构中层次数与问题的复杂程度及需分析的详尽程度有关,一般层次不受限制,每一层次中各元素所支配的元素不要超过9个。因为支配元素过多会给两两比较判断带来困难,如果超过9个,可以考虑合并一些因素或增加层次数。无论哪种情况,都要在对问题进行深入研究的情况下进行,以便使之具有一定的合理性。 一个递阶层次结构应具有以下特点: (1)从上到下顺序地存在支配关系,并用直线段表示。除目标层外,每个元素至少受上一层一个元素支配。除最后一层外,每个元素至少支配下一层次一个元素,上下层元素的联系比同一层次强,以避免同一层次中不相邻元素存在支配关系; (2)整个结构中,层次数不受限制; (3)最高层只有一个元素,每一个元素所支配的元素一般不超过9个,元素过多时可进一步分组; (4)对某些具有子层次的结构可引入虚元素,使之成为递阶层次结构。
实现方法(2)-----构造两两比较判断矩阵 层次分析法的特点之一是定性分析与定量计算相结合,定性问题定量化,第二步就是要在已有层次结构的基础上构造两两比较的判断矩阵。在这一步中,决策者要反复回答问题,针对准则C,两个C所支配的元素ui 与uj 哪个更重要,重要程度如何,并按1~9标度对重要程度赋值。表7—l给出了1~9标度的含义。这样对于准则C,几个被比较元素通过两两比较构成一个判断矩阵A=(aij)nxn,其中,aij 就是元素ui 与uj 相对于C的重要度比值。
实现方法(2)-----构造两两比较判断矩阵 判断矩阵具有性质:aij>o, aij=1/ajiaii=1,i,j=1 ,2,…,n 具有这种性质的矩阵A称为正互反矩阵。由判断矩阵所具有的性质知,一个n阶判断矩阵只需给出其上三角或下三角的n(n-1)/2个元素就可以了,即只需作n(n-1)/2次两两比较判断。 若判断矩阵A同时具有性质:对任意 i,j,k, aij = aik * akj,则称A为一致性矩阵。并不是所有的判断矩阵都具有一致性。事实上,AHP中多数判断矩阵(三阶以上)不满足一致性。一致性及其检验是AHP的重要内容。
实现方法(3)单一准则下元素相对权重计算及一致性检验实现方法(3)单一准则下元素相对权重计算及一致性检验 这一步要在第二步的基础上,从给出的每一判断矩阵中求出被比较元素的排序权重向量,并通过一致性检验确定每一判断矩阵是否可以接受。 (1)权重计算方法 • 和法:取判断矩阵n个列向量(针对n阶判断矩阵)的归一化后算术平均值近似作为权重向量,即有 • 根法(几何平均法):将A的各个列向量采用几何平均然后归一化,得到的列向量近似作为加权向量。
实现方法(3)单一准则下元素相对权重计算及一致性检验实现方法(3)单一准则下元素相对权重计算及一致性检验 • 特征根法(EM): 求判断矩阵的最大特征根及其对应的右特征向量,分别称为主特征根与右主特征向量,然后将归一化后的右主特征向量作为排序权重向量。 特征根法的原理和算法 特征根法是AHP中提出最早,也最为人们所推崇的方法。 除以上方法外还有对数最小二乘法,最小偏差法,梯度特征向量法等。
特征根法的原理和算法 设w0=(w1,w2,…wn)是 n 阶判断矩阵A 的排序权重向量,当A 为一致性矩阵时,显然有 可以验证:Aw=nw 且n为矩阵A的最大特征根,A的其余特征根为0,A的秩为1。对一般的正互反矩阵,根据正矩阵的Perron定理可知,其最大特征根为正,且它对应的右特征向量为正向量,最大特征根λmax为A的单特征根,因而它所对应的特征向量除差一个常数因子外是唯一的。特征根法是借用数值分析中计算正矩阵的最大特征根和特征向量的幂法实现的。
一致性检验 在判断矩阵的构造中,并不要求判断矩阵具有一致性,这是客观事物的复杂性与人的认识的多样性所决定的,1~9标度也决定了三阶以上判断矩阵是很难满足一致性的。但要求判断有大体上的一致性是应该的,出现甲比乙极端重要,乙比丙极端重要而丙又比甲极端重要的判断,一般是违反常识的,一个混乱的经不起推敲的判断矩阵有可能导致决策的失误,而且上述各种计算排序权重的方法当判断矩阵过于偏离一致性时,其可靠性程度也就值得怀疑了。因此需要对判断矩阵的一致性进行检验,其步骤为: (i) 计算一致性指标C.I(Consistent Index) (ii) 查找相应的平均随机一致性指标R.I.(Random Index),表给出了1—12阶正互反矩阵的平均随机一致性指标。 (iii) 计算一致性比率C.R.(Consistent Ratio) 当C.R.<O.10时,认为判断矩阵的一致性是可以接受的,否则应对判断矩阵作适当修正。 为了讨论一致性需计算最大特征根λmax,除特征根方法外,可用分式求得。
实现方法(3)计算各层元素对目标层的总排序权重实现方法(3)计算各层元素对目标层的总排序权重 上面得到的是一组元素对其上一层次中某元素的权重向量。我们最终要得到各元素,特别是最低层中各方案对于目标的排序权重,即所谓总排序权重,从而进行方案选择。总排序权重要自上而下地将单准则下的权重进行合成。 假定已经算出第k-1层上nk-1个元素相对于总目标的排序权重w(k-1)=(w1(k-1) ,w2(k-1), … ,w1(k-1) )T,以及第k层nk个元素对于第k-1层上第 j 个元素为准则的单排序向量pj(k)=(p1j(k) , p2j(k) , … , pnkj(k) )T,其中不受 j 元素支配的元素权重取为0。矩阵p(k)=(p1(k) , p2(k) , … , pnk(k) )T是nk x nk-1阶矩阵,表示了第k层上元素对第k-1是层上各元素的排序,那么第k层上元素对目标的总排序向量w(k)为: w(k)=(w1(k) , w2(k) , … , wnk(k) )T =p(k) w(k-1) . 且一般公式为: w(k)=p(k) p(k-1) …p(3) w(2) 这里w(2)是第二层上元素的总排序向量,也是单准则下排序向量。
二、运筹学模型 1、排队论 排队论起源于20世纪初的电话通话。1909—1920年丹麦数学家、电气工程师爱尔朗(A.K.Erlang)用概率论方法研究电话通话问题,从而开创了这门应用数学学科,并为这门学科建立许多基本原则。20世纪30年代中期,当费勒(W.Feller)引进了生灭过程时,排队论才被数学界承认为一门重要的学科。在第二次世界大战期间和第二次世界大战以后,排队论在运筹学这个新领域中变成了一个重要的内容。20世纪50年代初,堪道尔(D.G.Kendall)对排队论作了系统的研究,他用嵌入马尔柯夫(A.A.Markov)链方法研究排队论,使排队论得到了进一步的发展。是他首先(1951年)用3个字母组成的符号A/B/C表示排队系统。其中A表示顾客到达时间分布,B表示服务时间的分布,C表示服务机构中的服务台的个数。一般用D表示定长分布,用M表示指数分布,用Geo表示几何分布,用Er表示r阶的爱尔用HR表示R相超过指数分布,用G表示一般分布。
例如,M/M/n表示到达间隔时间与服务时间都服从指数分布(参数一般不相同)服务机构有n个服务台的排队系统,G/M/1表示到达间隔时间服从一般分布服务时间服从指数分布服务机构只有一个服务台的排队系统。后来人们在3个字母后又加了2个字母,分别表示系统的容量和输入源中的顾客数,并在前两个字母的右上角加字母以表示每次到达几个顾客和每次服务几个顾客。例如,Mξ/Gη/1/m/n表示到达间隔时间服从指分布每次到达ξ(ξ可以为随机变量)个顾客服务时间服从一般分布每次服务η(η可以为随机变量)个顾客服务机构只有一个服务台且最多只能容纳m个顾客输入源,最多只有n个顾客的排队系统。如果只有前3个字母则表示系统的容量和输入源都是有限的。从20世纪60年代起,排队论研究的课题日趋复杂,很多问题不是很难求得其精确解,就是求得的解非常复杂不便于应用,因而开始了近似发法的研究。例如,M/M/n表示到达间隔时间与服务时间都服从指数分布(参数一般不相同)服务机构有n个服务台的排队系统,G/M/1表示到达间隔时间服从一般分布服务时间服从指数分布服务机构只有一个服务台的排队系统。后来人们在3个字母后又加了2个字母,分别表示系统的容量和输入源中的顾客数,并在前两个字母的右上角加字母以表示每次到达几个顾客和每次服务几个顾客。例如,Mξ/Gη/1/m/n表示到达间隔时间服从指分布每次到达ξ(ξ可以为随机变量)个顾客服务时间服从一般分布每次服务η(η可以为随机变量)个顾客服务机构只有一个服务台且最多只能容纳m个顾客输入源,最多只有n个顾客的排队系统。如果只有前3个字母则表示系统的容量和输入源都是有限的。从20世纪60年代起,排队论研究的课题日趋复杂,很多问题不是很难求得其精确解,就是求得的解非常复杂不便于应用,因而开始了近似发法的研究。
排队系统由输入过程与到达规则、排队规则、服务机构的结构、服务时间与服务规划组成。排队系统由输入过程与到达规则、排队规则、服务机构的结构、服务时间与服务规划组成。 • 一般还假设到达间隔时间序列与服务时间均为独立同分布随机变量序列,且这两个序列也相互独立。 • 评价一个排队系统的好坏要以顾客与服务机构两方面的利益为标准。就顾客来说总希望等待时间或逗留时间越短越好,从而希望服务台个数尽可能多些但是,就服务机构来说,增加服务台数,就意味着增加投资,增加多了会造成浪费,增加少了要引起顾客的抱怨甚至失去顾客,增加多少比较好呢?顾客与服务机构为了照顾自己的利益对排队系统中的3个指标:队长、等待时间、服务台的忙期(简称忙期)都很关心。因此这3个指标也就成了排队论的主要研究内容。
2、对策论 • 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于17 世纪的科学家,如C.,Huygens 和W.,Leibnitz 等。现代对策论起源于1944 年J.,Von Neumann 和O.,Morgenstern 的著作《Theory of Games and Economic Behavior》。 • 对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展的历史并不长,但由于它所研究的
现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。 • 在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。
对策模型的基本要素 三要素 1、局中人 参加者,具有决策权 2、策略 局势 3、一局对策的得失 (1)一局对策结束时,每个局中人的得失是全体局中人所取定的一组策略(局势)的函数,称为支付函数或赢得函数 (2)零和对策:在任一局势中,全体局中人的得失相加总是等于零时的决策
三、概率和统计回归模型 • 概率模型 现实世界的变化受着众多因素的影响,包括确定的和随机的。如果从建模的背景、目的和手段看,主要因素是确定的,随机因素可以忽略,或者随机因素的影响可以简单地以平均值的作用出现,那么就能够建立确定性模型。如果随机因素对研究对象的影响必须考虑,就应建立随机模型。本章讨论如何用随即变量和概率分布描述随机因素的影响,建立随机模型--概率模型。 • 统计模型 如果由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的模型,那么通常要搜集大量的数据,基于对数据的统计分析建立模型,这就是本章还要讨论的用途非常广泛的一类随机模型—统计回归模型。
一 传送系统的效率 在机械化生产车间里,排列整齐的工作台旁工人们紧张的生产同一种产品,工作台上放一条传送带在运转,带上设置若干钩子,工人将产品挂在经过他上方的钩子上带走,如图。当生产进入稳定状态后,每个工人生产一件产品所需时间是不变的,而他挂产品的时刻是随机的。衡量这种传送系统的效率可以看他能否及时把工人的产品带走。在工人数目不变的情况下传送带速度越快,带上钩子越多,效率越高。 传送带 挂钩 …… …… 工作台 要求构造衡量传送系统效率的指标,并在简化假设下建立模型描述这个指标与工人数目、钩子数量等参数的关系。
1 模型分析 为了用传送带及时带走的产品数量来表示传送系统的效率,在工人生产周期(即生产一件产品的时间)相同的情况下,需要假设工人生产出一件产品后,要么恰好有空钩子经过工作台,他可以将产品挂上带走,要么没有空钩子经过,他将产品放下并立即投入下一件产品的生产,以保证整个系统周期性的运转。 工人生产周期相同,但由于各种因素的影响,经过相当长的时间后,他们生产完一件产品的时刻会不一致,认为是随机的,并在一个生产周期内任一时刻的可能性一样。 由上分析,传送系统长期运转的效率等价于一周期的效率,而一周期的效率可以用它在一周期内能带走的产品数与一周期内生产的全部产品数之比来描述。
2 模型假设 1)有 个工人,其生产是独立的,生产周期是常数, 个工作台均匀排列。 2)生产已进入稳态,即每个工人生产出一件产品的时刻 在一个周期内是等可能性的。 3)在一周期内有 个钩子通过每一工作台上方,钩子均匀排列,到达第一个工作台上方的钩子都是空的。 4)每个工人在任何时刻都能触到一只钩子,且之能触到一只,在他生产出一件产品的瞬间,如果他能触到的钩子是空的,则可将产品挂上带走;如果非空,则他只能将产品放下。放下的产品就永远退出这个传送系统。
二 报童的诀窍 问题: 报童每天清晨从报社购进报纸零售,晚上将没有卖掉的报纸退回。设报纸每份的购进价为b,零售价为a,退回价为c,假设a>b>c。即报童售出一份报纸赚a-b,退回一份赔b-c。报童每天购进报纸太多,卖不完会赔钱;购进太少,不够卖会少挣钱。试为报童筹划一下每天购进报纸的数量,以获得最大收入。 模型分析: 购进量由需求量确定,需求量是随机的。假定报童已通过自 己的经验或其他渠道掌握了需求量的随机规律,即在他的销 受范围内每天报纸的需求量为 份的概率是 有了 和 就可以建立关于购进量的优化模型。
四、神经网络模型 • 神经网络简介 • 人工神经网络是在现代神经科学的基础上提出和发展起来的,旨在反映人脑结构及功能的一种抽象数学模型。自1943 年美国心理学家W. McCulloch 和数学家W. Pitts 提出形式神经元的抽象数学模型—MP模型以来,人工神经网络理论技术经过了50多年曲折的发展。特别是20 世纪80年代,人工神经网络的研究取得了重大进展,有关的理论和方法已经发展成一门界于物理学、数学、计算机科学和神经生物学之间的交叉学科。它在模式识别,图像处理,智能控制,组合优化,金融预测与管理,通信,机器人以及专家系统等领域得到广泛的应用,提出了40 多种神经网络模型,其中比较著名的有感知机,Hopfield 网络,Boltzman机,自适应共振理论及反向传播网络(BP)等。
五、模糊数学模型 • 1965 年,美国著名计算机与控制专家查德(L.A.Zadeh)教授提出了模糊的概念,并在国际期刊《Information and Control》并发表了第一篇用数学方法研究模糊现象的论文“Fuzzy Sets”(模糊集合),开创了模糊数学的新领域。 • 模糊是指客观事物差异的中间过渡中的“不分明性”或“亦此亦彼性”。如高个子与矮个子、年轻人与老年人、热水与凉水、环境污染严重与不严重等。在决策中,也有这种模糊的现象,如选举一个好干部,但怎样才算一个好干部?好干部与不好干部之间没有绝对分明和固定不变的界限。这些现象很难用经典的数学来描述。
模糊数学就是用数学方法研究与处理模糊现象的数学。它作为一门崭新的学科,它是继经典数学、统计数学之后发展起来的一个新的数学学科。经过短暂的沉默和争议之后,迅猛的发展起来了,而且应用越来越广泛。如今的模糊数学的应用已经遍及理、工、农、医及社会科学的各个领域,充分的表现了它强大的生命力和渗透力。模糊数学就是用数学方法研究与处理模糊现象的数学。它作为一门崭新的学科,它是继经典数学、统计数学之后发展起来的一个新的数学学科。经过短暂的沉默和争议之后,迅猛的发展起来了,而且应用越来越广泛。如今的模糊数学的应用已经遍及理、工、农、医及社会科学的各个领域,充分的表现了它强大的生命力和渗透力。 • 统计数学是将数学的应用范围从确定性的领域扩大到了不确定性的领域,即从必然现象到偶然现象,而模糊数学则是把数学的应用范围从确定领域扩大到了模糊领域,即从精确现象到模糊现象。
实际中,我们处理现实的数学模型可以分成三大类:第一类是确定性数学模型,即模型的背景具有确定性,对象之间具有必然的关系。第二类是随机性的数学模型,即模型的背景具有随机性和偶然性。第三类是模糊性模型,即模型的背景及关系具有模糊性。实际中,我们处理现实的数学模型可以分成三大类:第一类是确定性数学模型,即模型的背景具有确定性,对象之间具有必然的关系。第二类是随机性的数学模型,即模型的背景具有随机性和偶然性。第三类是模糊性模型,即模型的背景及关系具有模糊性。 • (1)模糊统计方法 • 模糊统计方法是一种客观方法,主要是基于模糊统计试验的基础上根据隶属度的客观存在性来确定的 • (2)指派方法 • 指派方法是一种主观的方法,它主要依据人们的实践经验来确定某些模糊集隶属函数的一种方法。如果模糊集定义在实数域R 上,则模糊集的隶属函数称为模糊分布。所谓指派方法就是根据问题的性质主观地选用某些形式地模糊分布,再根据实际测量数据确定其中所包含地参数。
(3)模糊聚类分析方法 • 在工程技术和经济管理中,常常需要对某些指标按照一定的标准(相似的程度或亲疏关系等)进行分类处理。例如,根据生物的某些性态对其进行分类,根据空气的性质对空气质量进行分类,以及工业上对产品质量的分类、工程上对工程规模的分类、图像识别中对图形的分类、地质学中对土壤的分类、水资源中的水质分类等等。这些对客观事物按一定的标准进行分类的数学方法称为聚类分析,它是多元统计“物以聚类”的一种分类方法。然而,在科学技术、经济管理中有许多事物的类与类之间并无清晰的划分,边界具有模糊性,它们之间的关系更多的是模糊关系。对于这类事物的分类,一般用模糊数学方法、我们把应用模糊数学方法进行的聚类分析,称为模糊聚类分析。
时间序列是指把某一变量在不同时间上的数值按时间先后顺序排列起来所形成的序列,它的时间单位可以是分、时、日、周、旬、月、季、年等。时间序列模型就是利用时间序列建立的数学模型,它主要被用来对未来进行短期预测,属于趋势预测法。时间序列是指把某一变量在不同时间上的数值按时间先后顺序排列起来所形成的序列,它的时间单位可以是分、时、日、周、旬、月、季、年等。时间序列模型就是利用时间序列建立的数学模型,它主要被用来对未来进行短期预测,属于趋势预测法。 六、时间序列预测模型
项数n的数值,要根据时间序列的特点而定,不宜过大或过小.n过大会降低移动平均数的敏感性,影响预测的准确性;n过小,移动平均数易受随机变动的影响,难以反映实际趋势.一般取n的大小能包含季节变动和周期变动的时期为好,这样可消除它们的影响.对于没有季节变动和周期变动的时间序列,项数n的取值可取较大的数;如果历史数据的类型呈上升(或下降)型的发展趋势,则项数n的数值应取较小的数,这样能取得较好的预测效果.项数n的数值,要根据时间序列的特点而定,不宜过大或过小.n过大会降低移动平均数的敏感性,影响预测的准确性;n过小,移动平均数易受随机变动的影响,难以反映实际趋势.一般取n的大小能包含季节变动和周期变动的时期为好,这样可消除它们的影响.对于没有季节变动和周期变动的时间序列,项数n的取值可取较大的数;如果历史数据的类型呈上升(或下降)型的发展趋势,则项数n的数值应取较小的数,这样能取得较好的预测效果.
2、加权一次移动平均预测法 简单一次移动平均预测法,是把参与平均的数据在预测中所起的作用同等对待,但参与平均的各期数据所起的作用往往是不同的。为此,需要采用加权移动平均法进行预测,加权一次移动平均预测法是其中比较简单的一种。
3、指数平滑预测法 1、一次指数平滑预测法
七、一元线性回归模型 为了研究这些数据之间的规律性,作散点图。数据大致落在一条直线附近,这说明x(身高)与y(腿长)之间的关系大致可以看作是直线关系。不过这些点又不都在一条直线上,这表明x和y之间的关系不是确定性关系。
例 测16名成年女子的身高与腿长所得数据如下:
回归方程的显著性检验 在实际工作中,事先我们并不能断定y与x之间有线性关系。当然,这个假设不是没有根据,我们可以通过专业知识和散点图作粗略判断。但在求出回归方程后,还需对线性回归方程同实际观测数据拟合的效果进行检验。