570 likes | 648 Views
数学建模与人才培养. 浙江大学数学系杨启帆. 为什么要开设数学建模和数学实验课 学校应当培养什么样的学生? 浙大老校长竺可桢教授曾对学生提出过这样的要求:求是创新 用今天的话说,就是:学习新知识,提高综合素质与能力 新知识: 数学知识、专业知识、计算机知识、外语知识、文学艺术知识等等等等 能力: 收集处理数据的能力、观察能力、想象能力、分析能力、逻辑推理能力、应用数学知识解决实际问题的能力、计算机使用与编程等能力、外语能力、写作能力、与人合作能力等。. 数学建模和数学实验系列教学活动能较好地实现上述目标,它至少具有以下特征:
E N D
数学建模与人才培养 浙江大学数学系杨启帆
为什么要开设数学建模和数学实验课 学校应当培养什么样的学生? 浙大老校长竺可桢教授曾对学生提出过这样的要求:求是创新 用今天的话说,就是:学习新知识,提高综合素质与能力 新知识:数学知识、专业知识、计算机知识、外语知识、文学艺术知识等等等等 能力:收集处理数据的能力、观察能力、想象能力、分析能力、逻辑推理能力、应用数学知识解决实际问题的能力、计算机使用与编程等能力、外语能力、写作能力、与人合作能力等。
数学建模和数学实验系列教学活动能较好地实现上述目标,它至少具有以下特征:数学建模和数学实验系列教学活动能较好地实现上述目标,它至少具有以下特征: • 能培养学习兴趣(没有兴趣的学习是被动的) • 数学建模课鼓励学生多动脑脑筋,(不能光老师讲学生听,要提倡让学生主动学习…) • 数学建模注重知识更新,让学生多接触前沿学科知识,接触科研实际。 • 数学建模为学生提供了参与科研实践的机会 学习数学建模、参加数学建模实践和数学建模竞赛能使学生增长知识,得到全方位的锻炼
浙江大学数学建模教学情况简介(一)教材建设(教学内容选取)浙江大学数学建模教学情况简介(一)教材建设(教学内容选取) 在案例选取时要有一定的目的,如: 开拓学生的视野(案例涉及面要广) 建模新技巧、新方法的引入 说明某一道理等 尽量避免为建模而建模,避免类似方法和模型的重叠,避免模型罗列。(这样做可以保护和激发学生的学习积极性)
马路的宽度 D是容易测得 的,问题的关键在 于L的确定。为确定 L,还应当将 L划分为两段:L1和L2,其中 L1是司机在发现黄灯亮及判断应当刹车的反应时间内驶过的路程 ,L2为刹车制动后车辆驶过的路程。L1较容易计算,交通部门对司机的平均反应时间 t1早有测算,反应时间过长将考不出驾照),而此街道的行驶速度 v 也是交管部门早已定好的,目的是使交通流量最大,可另建模型研究,从而 L1=v*t1。刹车距离 L2既可用曲线拟合方法得出,也可利用牛顿第二定律计算出来 ( 留作习题)。 黄灯究竟应当亮多久现在已经变得清楚多了。第一步,先计算出 L应多大才能使看见黄灯的司机停得住车。第二步,黄灯亮的时间应当让已过线的车顺利穿过马路,即T 至少应当达到 (L+D)/v。 例1交通灯在绿灯转换成红灯时,有一个过渡状态——亮一段时间的黄灯。请分析黄灯应当亮多久。(引导学生培养观察能力、学会找到研究问题的突破口) 设想一下黄灯的作用是什么,不难看出,黄灯起的是警告的作用,意思是马上要转红灯了,假如你能停住,请立即停车。停车是需要时间的,在这段时间内,车辆仍将向前行驶一段距离 L。这就是说,在离街口距离为 L处存在着一条停车线(尽管它没被画在地上),见图1-4。对于那些黄灯亮时已过线的车辆,则应当保证它们仍能穿过马路。 D L
A1 dr ds dθ θ A B 由题意, ,故ds=2dr 图3-2可看出, 图3-2 例2我方巡逻艇发现敌方潜水艇。与此同时敌方潜水艇也发现了我方巡逻艇,并迅速下潜逃逸。设两艇间距离为60哩,潜水艇最大航速为30节而巡逻艇最大航速为60节,问巡逻艇应如何追赶潜水艇。 (数学建模要引导学生应用数学知识去实现某种想法) 这一问题属于对策问题,较为复杂。讨论以下简单情形: 假设潜艇发现自己目标已暴露,立即下潜,并沿着直 线方向全速逃逸,逃逸方向我方并不知道。 设巡逻艇在A处发现位于B处的潜水艇,取极坐标,以B为极点,BA为极轴,设巡逻艇追赶路径在此极坐标下的方程为r=r(θ),见图3-2。
故有: 即: (3.3) 解为: (3.4) 追赶方法如下: 先使自己到极点的距离等于潜艇到极点的距离,然后按(3.4)对数螺线航行,即可追上潜艇。 (用数学建模解决实际问题即用数学思想实现某种思想)
我有一只具有跑 表功能的计算器。 例3 山崖高度的估算(研究问题的步步深入) 假如你站在崖顶且身上带着一只具有跑表功 能的计算器,你也许会出于好奇心想用扔下 一块石头听回声的方法来估计山崖的高度, 假定你能准确地测定时间,你又怎样来推算 山崖的高度呢,请你分析一下这一问题。
假定空气阻力不计,可以直接利用自由落体运动的公式假定空气阻力不计,可以直接利用自由落体运动的公式 来计算。例如, 设t=4秒,g=9.81米/秒2,则可求得h≈78.5米。 方法一 我学过微积分,我可以做 得更好,呵呵。
除去地球吸引力外,对石块下落影响最大的当 属空气阻力。根据流体力学知识,此时可设空气阻力正比于石块下落的速度,阻力系 数K为常数,因而,由牛顿第二定律可得: 令k=K/m,解得 代入初始条件 v(0)=0,得c=-g/k,故有 再积分一次,得:
代入初始条 件h(0)=0,得到计算山崖高度的公式: ① 将e-kt用泰勒公式展开并 令k→ 0+,即可得出前面不考虑空气阻力时的结果。 若设k=0.05并仍设 t=4秒,则可求 得h≈73.6米。 进一步深入考虑 多测几次,取平均值 听到回声再按跑表,计算得到的时间中包含了 反应时间 不妨设平均反应时间 为0.1秒 ,假如仍 设t=4秒,扣除反应时间后应 为3.9秒,代入 式①,求得h≈69.9米。 再一步深入考虑
还应考虑回声传回来所需要的时间。为此,令石块下落 的真正时间 为t1,声音传回来的时间记 为t2,还得解一个方程组: 这一方程组是非线性的,求解不太容易,为了估算崖高竟要去解一个非线性主程组似乎不合情理 相对于石块速度,声音速度要快得多,我们可 用方法二先求一次h,令t2=h/340,校正t,求石块下落时间 t1≈t-t2将t1代入式①再算一次,得出崖高的近似值。例如, 若h=69.9米,则 t2≈0.21秒,故 t1≈3.69秒,求得 h≈62.3米。
将湖想象成凸出地面的木桩, 在AB间拉一根软线,当线被拉紧时将得到最短路径。根据这样的想象,猜测 可以如下得到最短路径: 过A作圆的切线切圆于E,过B作圆的切线切圆 于F。最短路径为由线 段AE、弧EF和线段FB连接而成的连续曲线(根据对称性,AE′,弧E′F′,F′B连接而成的连续曲线也是)。 E F O B A r E′ F′ 例4(最短路径)数学是一种重要工具,数学学得越好、基础越扎实、认识越深入 设有一个半径为 r 的圆形湖,圆心为 O。A、 B位于湖的两侧,AB连线过O,见图。 现拟从A点步行到B点,在不得进入湖中的限 制下,问怎样的路径最近。
定义2.1(凸集)称集合 R为凸集,若x1、x2∈R及λ∈[0,1],总有λx1+(1+λ)x2∈R。即若x1、x2∈R,则x1、x2的连线必整个地落 在R中。 定理2.2(分离定理)对平面中的凸 集R与R外的一点K,存在直线 l , l分离R与K,即R与K分别位于 l 的两侧(注:对一般的凸 集R与R外的一点K,则存在超平面分 离R与K),见图。 R k l 以上只是一种猜测,现在来证明这一猜测是正确的。为此,先介绍一下凸集与凸集的性质。 下面证明猜想
(方法一)显然, 由AE、EF、FB及AE′,E′F′,F′B围成的区域 R是一凸集。利用分离定理易证最短径不可能经过R外的点,若不然,设 Γ为最短路径,Γ过R外的一点M,则必存在直 线l分离M与R,由于路径Γ是连续曲线,由A沿Γ到M,必交l于M1,由M沿Γ到B又必交l于M2。这样,直线 段M1M2的长度必小于路 径M1MM2的长度,与Γ是A到B的最短路径矛盾,至此,我们已证明最短路径必在凸集R内。不妨设路径经湖的上方到达B点,则弧EF必在路径F上,又直线段AE是由A至E的最短路径,直线FB是由F到B的最短路径,猜测得证。 E F O B M A M2 l r M1 Γ E′ F′ 猜测证明如下:
根据猜测不难看出, 例5中的条件可以大大放松,可以不必 设AB过圆心,甚至可不必设湖是圆形的。例如对 下图,我们可断定由A至B的最短路径必 为l1与l2之一,其证明也不难类似给出。 若可行区域的边界是光滑曲面。则最短路径必由下列弧组成,它们或者是空间中的自然最短曲线,或者是可行区域的边界弧。而且,组成最短路径的各段弧在连接点处必定相切。 A l1 D l2 B 还可用微积分方法求弧长,根据计算证明满足限止条件的其他连续曲线必具有更大的长度;此外,本猜测也可用平面几何知识加以证明等。 到此为止,我们的研讨还只局限于平面之中,其实上述猜测可十分自然地推广到一般空间中去。1973年,J.W.Craggs证明了以上结果:
(二)在模型讲解中介绍建模方法与技巧 (初等方法)经验公式的建立、量纲分析法建模、冲量分析、比例关系的利用等 (微分方程方法建模)房室系统方法、集中参数法与分布参数法建模、工程师原则、统计筹算率等 (逻辑模型)公理化方法、奇偶性校验、对称性利用等
例5(希尔密码) 目的:改变字母出现的频率 工具:应用矩阵乘法 困难:逆变换的实现有困难 解决办法:以逆元素乘法代替除法(需 要附一些条件)。使学生认识到有时要创造性地运用知识和技能。 例6 从p-p模型到一般双种群系统模型到无圈定理(统计筹算率-工程师原则-生态系统的三种极本类型-平衡点稳定性研究
仍用x1(t)和x2(t)记t时刻的种群量(也可以是种群密度),仍用x1(t)和x2(t)记t时刻的种群量(也可以是种群密度), 设 Ki为种群i的净相对增长率。 (3.33) 一般的双种群系统 Ki随种群不同而不同,同时也随系统状态的不同而不同,即Ki应为x1、x2的函数。Ki究竟是一个怎样的函数,我们没有更多的信息。不妨再次采用一下工程师们的原则,采用线性化方法。这样,得到下面的微分方程组: (3.33)不仅可以用来描述捕食系统。也可以用来描述相互间存在其他关系的种群系统。
(3.33)式的一些说明 式中a1、b2为本种群的亲疏系数,a2、b1为两种群间的交叉亲疏系数。a2b1≠0时,两种群间存在着相互影响,此时又可分为以下几类情况: (i)a2>0,b1>0,共栖系统。 (ii)a2<0,b1>0( 或a2>0,b1<0 ),捕食系统。 (iii)a2<0,b1<0,竞争系统。 (i)—(iii)构成了生态学中三个最基本的类型,种群间较为复杂的关系可以由这三种基本关系复合而成。
(三)尽量选取有启发性、学生感兴趣的案例 • 为什么要用三级火箭发射人造卫星(为什么不能走微型化道路,卫星为什么要很快进入轨道,卫星的最优结构设计) • 通讯卫星的频道与转换开关的设计(双随机矩阵空间及其维数,矩阵分解等) • 幻方的构造及研究(线性空间及基底、欧拉方与正交试验等) • 信息论的建立及应用举例等
(例7)2004年浙江大学数学建模竞赛 (B题)通讯卫星上的开关设置 地面上存在着n个接收站与n个发送站,而在通讯卫星上则设置了若干种开关模式。开关模式可用矩P=(pij)表示,若卫星可接收发送站i发射的信息并将信息送回地面的接收站j,矩阵中的元素pij =1,否则pij =0。通讯卫星上的接收发送任务也可以用一个矩阵T=(tij)来表示,其元素tij为需经通讯卫星传递的由i发点发送到j接收点的信息量的传送时间长度。由于技术原因,当发送站i在发送给接收站j信息时,它不能同时发送给别的接收站信息;同样,当接收站j在接收发送站i的信息时,也不能同时接收其他发送站发送的信息。你的任务是:
目 的 • 设计一组开关模式,k=1, …,r(注:r应当尽可能小),使得对任意给定的任务矩阵T,卫星开关设置均能完成要求的发接收任务。 • 设计一个算法,在发接收任务T给出后,可根据你设计的开关模式(k=1,…,r)求出各开关的使用时间λ,使得在完成预定传送任务的前提下使用各开关模式的总时间短。 • 同样由于技术上的原因,开关模式的总数r有一个上限。当需要传送的任务数数量较大时,仍无法分派任务。要求想一些办法来解决这一困难,(当然,这时可能要作出一些牺牲,即传送时间可能会增加一些)。
即要求设计开关系统及使用方法,达到以下目的:即要求设计开关系统及使用方法,达到以下目的: (1)开关数量要少(控制在一个合理的范围内) (2)使用卫星上的开关时应尽量节省卫星租用时间 (3)设计具体操作方法
问题及模型 问题的标准形式为:在地面上存在着n个收站与n个发战,而在通讯卫星上则设置了若干种开关模式。开关模式可用矩阵P=(pij)来表示,若卫星可接收发射站i发射的信息并将信息传送回地面的接收站j时,矩阵元素pij =1,否则pij =0。通讯卫星的接发任务也可用一矩阵T=(tij)来表示,其元素tij为需经通讯卫星传递的由i发点发送到j接受点的信息量的传送时间长度。问题要求求r并设计一组开关模式Pk,k=1, …,r及模式Pk的使用时间λk,使得在完成预定传送任务的前提下各开关模式使用的总时间最短,即要求求解下面的问题:
一个实例设 这是一个有3个发送站与3个接收站的实例,tij在矩阵中已给出,例如由发站1传送到收站1的通讯量为3单位时间等。 分析 容易看出,三个发站需传送的时间分别为6、5、5;而三个收站需接收的时间分别为6、3、7。为完成全部传送任务,通讯卫星总传送时间至少应为7单位时间,即的下界为7。 由于技术上的原因,当发站i在发送给收站j信息时,它不能同时发送给别的收站信息;同样,当收站j在接收发站i的信息时,也不能同时接收其他发站发送的信息。这一要求说明,任一开关模式Pk应具有以下性质:(1)Pk的每一行中有且只有一个1,每一列中也有且只有一个1;(2)所有的1均位于不同的行列中。 满足(1)、(2)的矩阵 被称为置换矩阵,n阶置换矩阵Pk共有n!个,当n较大时,我们不可能在通讯卫星上设置这么多种不同的开关模式。因而,为了设计出切实可行的开关模式,我们还得另想办法。 (问题)至少要多少种开关模式? 易见,必须有 r 不能小于 n
步1 先将T改变为 , 满足: (1) ≥T (2)记 , 步2 用Pk表示 ,即将 分解为 (r为空间的维数) (设计方法1) 注意到Pk每行(或列)元素之和均为1,故不管如何指派开关的使用时间(即不论如何取λk),矩阵 均具有某些特殊的性质,例如其行和(及列和)均为同一常数。这样的矩阵构成一个线性空间(参见Dürer魔方),为减少开关模式的种类,可取此空间的一组基底作为开关模式。在使用这种开关模式时,无论T的元素tij怎么取,通讯卫星对每一发(收)点的开通时间总和是恒定的。在这种开关模式下,可按如下方式指派各开关模式的使用时间:
将T化为 的方法一般有无穷多种,如可如下化法: 令 事实上, ,(即通讯卫星传送总时间的下界)。 令 其中 的任一行(或列)中元素之和均为7。 用这种方法化例中的T,得到
的分解方法可如下进行: 步1 选取由Pij>0可推出 >0的置换矩阵P 步2 确定 步3 取 ,用 - 代替 步4 若 =0,停;否则,返回步1。 定义1 称行和、列和均相等的矩阵为双随机矩阵(Doubly stochastic matrix) 定理1(Birkhoff定理,1944)任一n阶双随机矩阵均可写成至多 (n-1)2+1个置换矩阵的非线性组合。 例2. 为方便起见,我们来分解一个元素均为非负整数的3阶双随机矩阵, (由Birkhoff定理,r≤5)
解:取 ,λ=min {1, 3, 3 } =1 分解成 ,再取 ,取 因min{ 5, 5, 3} = 3,又有
于是又有 易得分解结果为:
尚需解决的问题是如何求P,使得Pij>0必有 。读者不难发现,此问题可以通过求解一个两分图上的最大流(或最大匹配)来实现,计算量为O(n4),是多项式时间可解的。具体方法为:作一两分图,若 ,则作边(i, j),令边容量为1,这样,可作出P的充要条件是该最大流问题的最大流量为n。对例9.33,n=3。由于所有 ,先取 , -P1为 于是又可求得
,相应的两分图为: 又可得 ,…,如此下去,直到作不出P为至, 由于 的特殊性质及Birkhoff定理,上述分解必能在不超过r= (n-1)2 + 1步内终止。 上述开关设计方法要求在通讯卫星上设置(n-1)2 + 1种不同的开关模式(即Pk),当n稍大时,(n-1)2 + 1仍显得太大而使得使用时不便。例如,当n=41时,(n-1)2 + 1=1601。为实用方便,人们研究了限止开关模式个数的相应问题。
min S.t 若要求r≤n,即要求通讯卫星上至多设置n种开关模式,则问题化为令r≤n,求不超过n个置换矩阵Pk及λk,使之满足: (1) 为了使任意一对发射法与接收站之间的传送均为可能实现的,自然应要求 Pk满足 (2) (右面的矩阵有n2个值为1的分量,每一Pk恰有n个1分量)故r=n。 容易看出,(1)隐含着T的每一元素只能被唯一的P复盖,即T的元素在分解中是不可分割的,这当然是一个好性质,使实际操作时较为方便,但可惜的是对一般的双随机矩阵,分解很可能无解。
, , 则min S.t 例3若取 (注意:T已是双随机矩阵,行和列和均为10) 的解为λ1=3,λ2=4,λ3=5。
(大于10)而 但等号经常并不成立。1985年,F·Rendel证明,在给定满足(2)的置换矩阵P1,…,Pn后,求解问题(1)是NP难的,从而不可能存在多项式时间算法,除非P=NP。 现要求r≤2n 一种自然而方便的开关设置为引入两组各有n个开关模式的置换矩阵P1,…,Pn,Q1,…,Qn,满足下面的(5.3)式: 例如,当n=3时,可令:
现在,我们来分解例9.33中的双随机矩阵 ,令 = ,得方程组 (注:这种设置方法保持了其内在的对称性,不失为一种明智的做法。)
注意到(5.3),易证空间 的维数为 5, 故 之一可任取,(稍加注意即可保持非负性), 例如,令μ3=0,求得 ,故有 求出各对角线与反对角线上的三个元素之和,并作一些简单的消去运算; 将矩阵的所有元素相加,可得下面的方程组:
读者不难验证,上述方法可推广到n是奇数的一般情况。事实,由各对角线元素之和可导出n-1个方程,由各反对角线元素之和又可导出n-1个方程,加上矩阵所有元素之和导出的等式,共计可导出2 n-1个方程,并易知它们是独立的。另一方面空间 的维数恰为2 n-1,故 之一可任取,而通过方程组解得所有的 ,(只须注意保持其非负性即可) 但当n为偶数时,情况就不大相同了。让我们先来观察一下n=4的情况。 当n=4时,
易见, 具有非常特殊的结构,一般的偶数阶双随机矩 阵,即使其元素是非负整数,也无法用Pk、Qk来分解。 当 具有上述结构时,能否用Pk和Qk来分解呢?易见,由各对角线元素之和可导出:
上述方程中只有6个是独立的,且已不可能再得出新的独立方程,(读者可自行分析之)故可选取其中2个的值,进而可解出其余。例如,若令上述方程中只有6个是独立的,且已不可能再得出新的独立方程,(读者可自行分析之)故可选取其中2个的值,进而可解出其余。例如,若令 4= 3=0,可得 2=1, 1=0,进而可求得 1=2, 4=3, 3=3及 2=4, 已达到下界。 易见,P1 + P3 = Q2 + Q4,P2 + P4 = Q1 + Q3,故空间 的维数为6,与上面的分析是一致的。 另外,由反对角线元素之和又可导出 读者可将上述讨论推广到n为一般偶数的情况,分析方法是完全类似的。
易见, 具有非常特殊的结构,一般的偶数阶双随机矩 阵,即使其元素是非负整数,也无法用Pk、Qk来分解。 当 具有上述结构时,能否用Pk和Qk来分解呢?易见,由各对角线元素之和可导出:
上述方程中只有6个是独立的,且已不可能再得出新的独立方程,(读者可自行分析之)故可选取其中2个的值,进而可解出其余。例如,若令上述方程中只有6个是独立的,且已不可能再得出新的独立方程,(读者可自行分析之)故可选取其中2个的值,进而可解出其余。例如,若令 4= 3=0,可得 2=1, 1=0,进而可求得 1=2, 4=3, 3=3及 2=4, 已达到下界。 易见,P1 + P3 = Q2 + Q4,P2 + P4 = Q1 + Q3,故空间 的维数为6,与上面的分析是一致的。 另外,由反对角线元素之和又可导出 读者可将上述讨论推广到n为一般偶数的情况,分析方法是完全类似的。
当n是偶数时,我们虽无法将一般的双随机矩阵分解为Pk、Qk的非负组合,但上述讨论仍然是十分有意义的。首先,要求完成的任务矩阵是T,在将T转换成不小于它的双随机矩阵时我们可尽量使其具有上述的特殊结构(有兴趣的读者可自行研究这一问题),只要能做到这一点,即可给出一个达到下界的开关模式的指派方式。其次,即使这样的努力没有成功,也容易给出一个具有上述特殊结构 矩阵, 并使 尽可能地小,即给出一种开关指派的近似最佳方 法,由此可设计出效果较好的近似算法。 由于技术水平的提高,目前通讯卫星传送信息已允许一个发射站同时向多个接收站发送信息,当然,同时发送的信息条数具有某一上限,例如上限为v。1987年,J.L.Lewandowski和C.L.Liu研究了如下更一般的问题:
给定一正整数v,(v为通讯卫星传送容量的总限止),求开关模式给定一正整数v,(v为通讯卫星传送容量的总限止),求开关模式 M:= :={ ; (0, 1) | , i= 1, …, m; ,i= 1, …, n, }的设计,要求所用的开关模式总数量 r尽可能小,且 有解,其中T为信息传送量矩阵(需满足一定要求),ak为开关模式Mk的使用时间。他们设计了一个求解此问题的O(n5)算法,有兴趣的读者可直接阅读他们的论文。
小 结:本题有许多问题值得研究,例如: 问题1:开关数最小(至少多少只?) 问题2:化双随机矩阵的方法 问题3:双随机矩阵空间的维数 问题4:怎样减少开关数量(限制开关数) n只、2n只,…….. 问题5:分解方法(开关数少、使用时间短) (1)开关确定后的分解方法 (2)使卫星利用率最高-NP难—近似方法 问题6:推广问题的研究
怎么度量信息 可否用消除不确定性的多少来度量信息! 白箱 黑箱 灰箱 信息II 信息I 不确定度C 不确定度A 不确定度B (例8)信息的度量与应用 对于系统,可以利用守恒关系有 A+I=B,得I=B-A。 首先分析一下问题的认识过程 1.对一问题毫无了解,对它的认识是不确定的 2. 通过各种途径获得信息,逐渐消除不确定性 3. 对这一问题非常的了解,不确定性很小
显然,获取可能性越小的事件已经发生所得到的信息量就越大 基于前面的观点,美国贝尔实验室的学者香农(Shannon)应用概率论知识和逻辑方法推导出了信息量的计算公式 In his words "I just wondered how things were put together." Claude Elwood Shannon (April 30, 1916 - February 24, 2001) has been called "the father of information theory".
上述公理怎样推出信息量的计算公式呢 Shannon提出的四条基本性质 (不妨称它们为公理 ) 公理1 信息量是该事件发生概率的连续函数 公理2 如果事件A发生必有事件B发生,则得知事件A发生的信息量大于或等于得知事件B发生的信息量。 公理3 如果事件A和事件B的发生是相互独立的,则获知 A、B事件将同时发生的信息量应为单独获知两事件发生的信息量之和。 公理4 任何信息的信息量均是有限的。 将某事件发生的信息记为M,该事件发生的概率记为p,记M的信息量为I(M),香农用逻辑推理得出I(M)=-Clogap。
设某一实验可能有N种结果,它们出现的概率分别为p1,…,pN,则事先告诉你将出现第i种结果的信息,其信息量为-log2pi,而该实验的不确定性则可用这组信息的平均信息量(或熵)设某一实验可能有N种结果,它们出现的概率分别为p1,…,pN,则事先告诉你将出现第i种结果的信息,其信息量为-log2pi,而该实验的不确定性则可用这组信息的平均信息量(或熵) 来表示 平均信息量(熵)问题 例7投掷一枚骼子的结果有六种,即出现1—6点、出现每 种情况的概率均为1/6,故熵 H=log26≈2.585(比特)。 投掷一枚硬币的结果为正、反面两种,出现的概率均为1/2,故熵 H=log22=1(比特)。 向石块上猛摔一只鸡蛋,其结果必然是将鸡蛋摔破,出现的概率为1,故熵H=log21=0 从例子可以看出,熵实质上反映的是问题的“模糊度”,熵为零时问题是完全清楚的,熵越大则问题的模糊程度也越大