1.34k likes | 1.49k Views
人工智能 Artificial Intelligence. 主 讲 人 :姚 忠 E-mail : 13811013409@139.com. 第四章 不确定性推理. 0 、 引言 - 推理的方式及分类. 确定性推理、不确定性推理 从推理所用知识的确定性来划分 所谓 确定性 推理,就是指推理时所用知识与证据都是确定的,推出的结论也是确定的,其值或者为真或者为假,没有第三种情况出现。 -- 根据经典逻辑(命题逻辑及一阶谓词逻辑)的逻辑规则进行的一种推理。 所谓 不确定性 推理,是指推理时使用的知识与证据不都是确定的,推出的结论也是不确定的。
E N D
人工智能 Artificial Intelligence 主 讲 人:姚 忠 E-mail: 13811013409@139.com
0、引言-推理的方式及分类 确定性推理、不确定性推理 从推理所用知识的确定性来划分 所谓确定性推理,就是指推理时所用知识与证据都是确定的,推出的结论也是确定的,其值或者为真或者为假,没有第三种情况出现。 --根据经典逻辑(命题逻辑及一阶谓词逻辑)的逻辑规则进行的一种推理。 所谓不确定性推理,是指推理时使用的知识与证据不都是确定的,推出的结论也是不确定的。 --现实世界中的事物和现象大都是不确定的,或者模糊的,很难用精确的数学模型来描述,要使计算机能模拟人类的思维活动,就必须使它具有不确定推理的能力。
一、基本概念 前面讨论了建立在经典逻辑基础上的确定性推理,已知事实以及推理时所依据的知识都是确定的。推出的结论或证明的假设都是精确的,其真值或者为真,或者为假。 但是,现实世界中的事物事物之间的关系及其负责复杂,由于客观上存在的随机性、模糊性以及某些事物或现象暴露的不充分性,导致人们对它们的认识是不精确的、不全面的,具有一定程度的不确定性。
一、基本概念 I.不确定性是建立在非经典逻辑基础上的一种 推理。它是从不确定性的初始证据出发,通过运用 不确定性的知识,最终推出具有一定程度的不确定 性但却是合理或者近乎合理的结论的思维过程。 II.分类: 不确定推理方法分为两类:一是模型方法,另 一是控制方法。
一、基本概念 模型方法-特点是把不确定的证据和不确定的知识分别与某种度量标准对应起来,并给出更新结论不确定性的合适的算法。从而建立相应的不确定性推理模型。 控制方法-特点是通过识别领域中引起不确定性的某些特征及相应的控制策略来限制或减少不确定系统产生的影响,这类方法没有设置不确定的统一模型。
一、基本概念 模型方法又分为 a.数值方法 数值方法根据其所依据的理论不同分为基于概率的方法和模糊推理方法; 基于概率的方法所依据的理论是概率论,而模糊推理依据的理论是模糊理论。 b.非数值方法 非数值方法是除a之外的不确定性的方法。逻辑法就是一种非数值方法。
一、基本概念 由于概率论有着完善的理论,同时还为不确定性的合成与传递提供了现成的公式,成为度量不确定性的重要手段。 这种纯粹依靠概率模型来表示和处理不确定性的方法称为纯概率方法或概率方法。它虽然有严密的理论依据,但却要求给出事件的先验概率和条件概率,而这些数据又不易获得,使其应用受到限制. 为此,人们在概率论的基础上,发展了一些新的处理不确定性的方法。包括:可信度方法、主观Bayes方法和证据理论方法。
一、基本概念 重点探讨的不确定推理方法 • 可信度方法 • 主观Bayes方法 • 证据理论方法 • 模糊推理方法
二、可信度方法 可信度方法是美国斯坦福大学E. H.Shortliffe等人在 确定性理论(Theory of Confirmation)的基础上,结合概 率论提出的一种不确定性推理方法。在MYCIN中成功应用。 I.概念 所谓可信度,就是人们在实际生活中根据自己的经验或 观察对某一事件或现象为真的相信程度(certainty)。 可信度也可以称为”确定性因子“,具有较大的主观性和 经验性,其准确性很难把握。但是,对于某一具体领域而 言,由于领域专家具有丰富的专业知识和实践经验,要给出 该领域的知识的可信度还是完全有可能的。
二、可信度方法 II.表示 C-F模型中,知识是用产生式规则表示的,一般形式为: IF E THEN H (CF(H,E)) 其中,E是知识的前提条件,或称为证据。可以是简单条件,还可以是AND或OR所构成的复合条件。 E=E1 AND E2 AND(E3 OR E4) H是结论,可以是简单结论,也可以是多个结论; CF(H,E)是该知识的可信度,称为可信度因子(Certainty Factor)或规则强度。反映了前提条件与结论的联系程度。 如: IF 头痛 AND 流涕THEN 感冒(0.7) -----表示有七成把握认为他是患感冒了。
二、可信度方法 CF(H,E)是在[-1,1]上取值。 CF(H,E)值要求领域专家直接给出。原则是: 若由于相应证据的出现增加结论H为真的可信度,则取CF(H,E)>0,证据的出现越是增加支持H为真,就使CF(H,E)的值越大。 反之,取CF(H,E)<0,证据的出现越是支持H为假,就使CF(H,E)的值越小。 若证据的出现与否与H无关,则取CF(H,E)=0。
二、可信度方法 III.证据不确定性的表示 证据的不确定性也可以用可信度因子表示。 CF(E)是在[-1,1]上取值。对于初始证据,若对它的所有观察S能肯定它为真,则取CF(E)=1;若肯定它为假,则取CF(E)=-1;若它以某种程度为真,则取CF(E)为(0,1)中的一个值,即0<CF(E)<1。若它以某种程度为假,则取CF(E)为(-1,0)中的一个值,即-1<CF(E)<0。 知识的静态强度与证据的动态强度都是用可信度因子CF 表示的,但意义不相同。静态强度CF(H,E)表示的是知 识的强度,即当E所对应的证据为真时,对H的影响程度;而 动态强度CF(E)表示的是证据E当前的不确定性程度。
二、可信度方法 IV.组合证据不确定性的方法 当组合证据是多个单一证据的合取时, E=E1 AND E2 AND… AND En 若已知CF(E1), CF(E2),…, CF(En),则 CF(E)=min {CF(E1), CF(E2),…, CF(En)} 当组合证据是多个单一证据的析取时, E=E1 OR E2 OR… OR En 若已知CF(E1), CF(E2),…, CF(En),则 CF(E)=max {CF(E1), CF(E2),…, CF(En)}
二、可信度方法 V.不确定性的传递算法 C-F模型中的不确定推理从不确定的初始证据出发,通过运用相关的不确定性知识,最终推出结论并求出结论的可信度。 结论H的可信度由下式计算: CF(H)= CF(H,E)×max{0, CF(E)}; 若当相应证据以某种程度为假,即CF(E)<0,则 CF(H)=0 说明,该模型没有考虑证据为假时对结论H所产生的影响。 若证据为真,即 CF(E)=1, 可得 CF(H)= CF(H,E)说明知识中的规则强度CF(H,E)实际就是前提条件对应的证据为真时结论H的可信度。或者说,当知识的前提条件对应的证据存在且为真时,结论H有CF(H,E)大小的可信度。
二、可信度方法 VI.结论不确定性的合成算法 由多条不同知识推出了相同的结论,但可信度不同,则可用合成算法求出综合可信度。 设有如下知识: IF E1 THEN H (CF(H, E1)) IF E2 THEN H (CF(H, E2)) 则结论H的综合可信度可分为两步算出: (1) 分别对每一条知识求出CF(H): CF1(H)= CF(H, E1)× max{0, CF( E1)}; CF2(H)= CF(H, E2)× max{0, CF( E2)};
二、可信度方法 VI.结论不确定性的合成算法 (2)用下述公式求E1与E2对H的综合影响所形成的可 信度CF1,2(H)。
H E1 E2 E3 E4 E7 E8 E5 E6 二、可信度方法 例题: 设有一组知识: r1: IF E1 THEN H (0.8) r2: IF E2 THEN H (0.6) r3: IF E3 THEN H (-0.5) r4: IF E4 AND ( E5 OR E6)THEN E1(0.7) r5: IF E7 AND E8 THEN E3(0.9) 已知: CF( E2)=0.8, CF( E4)=0.5, CF( E5)=0.6, CF( E6)=0.7, CF( E7)=0.6, CF( E8)=0.9 求:CF(H) 推理网络
二、可信度方法 第一步:对每一条规则求出CF(H) r4: IF E4 AND ( E5 OR E6)THEN E1(0.7)
二、可信度方法 第一步:对每一条规则求出CF(H) r5: IF E7 AND E8 THEN E3(0.9)
二、可信度方法 第一步:对每一条规则求出CF(H) r1: IF E1 THEN H (0.8)
二、可信度方法 第一步:对每一条规则求出CF(H) r2: IF E2 THEN H (0.6)
二、可信度方法 第一步:对每一条规则求出CF(H) r3: IF E3 THEN H (-0.5)
二、可信度方法 第二步:根据结论不确定性的合成算法得到 所以,综合可信度为0.49。
三、主观Bayes方法 主观Bayes方法又称主观概率论,是由R.O.Duda(杜达)等人于1976年提出的一种不确定推理模型,是对概率论中基本Bayes公式的改进,该方法在地矿勘探专家系统PROSPECTOR中得到了成功地应用。 I.基本Bayes公式 设事件B1、B2、。。 Bn是彼此独立、互不相容的事件, (全),. 对于任一事件A能且只能与B1、B2、。。.Bn中的一个同时发生。而且 ,则有
三、主观Bayes方法 则有 是事件Bi的先验概率 ; 是事件Bi发生 条件下事件A的条件概率; 是事件A发生条件下事 件Bi的条件概率。 这个公式将出现病症A时,患疾病Bi的概率计算问题转 化为 和 的计算问题。即患了疾病Bi时表现为症状A的概率和患疾病Bi的概率的计算。 如果借助产生式规则 IF E THEN Hi 中的前提条件E代替Bayes公式中的A,用Hi代替公式中 的Bi ,就可以得到
三、主观Bayes方法 也就是说,已知结论Hi的先验概率P(Hi)和已知结论 Hi (i=1,2,…,n)成立时前提条件E所对应的证据出现的条 件概率P(E/Hi),就可用上式求出相应证据出现时结论Hi 的条件概率P(Hi/E)。
三、主观Bayes方法 设H1 ,H2 ,H3分别是3个结论,E是支持这些结论的 证据,且已知:P(H1)=0.4, P(H2)=0.5, P(H3) =0.2, P(E/H1)=0.3, P(E/H2)=0.4, P(E/H3) =0.5,求P(H1/E), P(H2/E), P(H3/E)的值 。
三、主观Bayes方法 II.主观Bayes方法 从上述讨论,直接使用逆概率方法求结论Hi 在证据E 存在情况下的条件概率P(Hi/E)时,不仅需要已知Hi的先 验概率P(Hi),而且还需要知道结论Hi成立的情况下, 证据E出现的概率P(E/Hi)。这在实际中也是相当困难的。 为此,1976年杜达(R.O.Duda)、哈特(P.E.Hart)等 人在Bayes公式的基础上经适当改进提出了主观Bayes方 法,建立了相应的不确定推理模型,并在地址勘探专家系 统PROSPECTOR中得到了成功的运用。
三、主观Bayes方法 a.知识不确定的表示 在主观Bayes方法中,知识是用产生式规则表示的,具 体形式为: IF E THEN (LS,LN) H (P(H))其中: (1)E是该知识的前提条件,它既可以是一个简单条件,也可以是一个复合条件; (2)H是结论, P(H)是H的先验概率,它指出在没 有任何证据情况下的结论H为真的概率,即H的一般可能性。 其值由领域专家根据以往的实践及经验给出;
三、主观Bayes方法 IF E THEN (LS,LN) H (P(H)) (3)( LS,LN )为规则强度,其值由领域专家给出。 LS,LN相当于知识的静态强度。其中LS称为规则成立的 充分性度量,用于指出E对H的支持程度,取值范围为 。其定义为: (A)
三、主观Bayes方法 a.知识不确定的表示 IF E THEN (LS,LN) H (P(H))其中 LN相当于规则成立的必要性度量。用于指出¬E对H的支 持程度,即E对H为真的必要性程度,取值范围为 , 其定义为 (LS,LN)既考虑了证据E的出现对其结论H的支持, 又考虑了证据E的不出现对其结论的H的影响。 (A1)
三、主观Bayes方法 b.证据不确定性的表示 在主观Bayes方法中,证据的不确定性也是用概率表示 的。例如对于初始证据E,由用户根据观察S给出概率P (E/S),它相当于动态强度。但由于P(E/S)不太直观, 因而在具体的应用系统中往往采用复合一般经验的比较直观 的方法,如在PROSPECTOR中就引入了可信度的概念。让 用户在-5至5之间的11个整数中根据实际情况选一个数作为 初始证据的可信度,表示他对所提供的证据可以相信的程度。 然后从可信度C(E/S)计算出概率P(E/S)。
三、主观Bayes方法 b.证据不确定性的表示 可信度C(E/S)和概率P(E/S)的对应关系如下: C(E/S)=-5,表示在观察S下证据E肯定不存在,即 P(E/S)=0; C(E/S)=0,表示观察S与证据E无关,应该仍然是先验概 率,即P(E/S)=P(E); C(E/S)=5,表示在观察S下证据E肯定存在,即 P(E/S)=1; C(E/S)为其他数时与P(E/S)的对应关系,则通过对上述三点进行分段线性插值得到
三、主观Bayes方法 b.证据不确定性的表示 可信度C(E/S)和概率P (E/S)的对应关系式: 这样,用户只要对初始证据给出相应的可信度C(E/S),就可由上式将其转换为相应的概率P(E/S)。
三、主观Bayes方法 c.组合证据不确定性的表示 当组合证据是多个单一证据的合取时,即: E=E1 AND E2 AND … AND En 则组合证据的概率取各个单一证据的概率的最小值,即 P(E/S)=min {P(E1 /S), P(E2 /S),…, P(En/S)} 当组合证据是多个单一证据的析取时,即:则组合证据的概率取各个单一证据的概率的最大值,即 P(E/S)=max {P(E1 /S), P(E2 /S),…, P(En/S)} 对于“非”的运算,则用下式计算: P(¬ E/S)=1- P(E/S)
三、主观Bayes方法 d.不确定性的传递算法 在主观bayes方法的表示中,P(H)是专家对结论给出 的先验概率,它是在没有考虑任何证据的情况下根据经验给 出的。随着新证据的获得,对H的信任程度应该有所改变。主 观Bayes方法推理的任务就是根据证据E和概率P(E)和LS、 LN的值,把H的先验概率P(H)更新为后验概率P(H/E)和 P(H/¬ E )。即 P(H) P(H/E)或P(H/¬ E )。 由于一条知识所对应的证据可能是肯定存在的,也可能是肯定不存在的,或者是不确定的,而且在不同情况下确定后验概率的方法不同,所以下面分别进行讨论。
三、主观Bayes方法 1.证据肯定存在的情况 在证据肯定存在时, P(E)= P(E/S)=1 由bayes公式可得证据E成立的情况下,结论H成立的概 率为: (1) 同理,证据E成立的情况下,结论H不成立的概率为: (2) (1)除以(2)式,得到 (3)
三、主观Bayes方法 1.证据肯定存在的情况 为简洁,引入几率(odds)函数O(x),它与概率P(x) 的关系为: 或者 概率和比率的取值范围是不同的,概率 ,几率 ,可见,P(x)和O(x)有相同的单调性。即 P(x1)< P(x2),则O(x1)< O(x2)。那么,两者虽有着不同的形式,但一样可以表示证据的不确定性。它们变化的趋势是相同的,当A为真的程度越大时,几率函数的值也越大。 (B)
三、主观Bayes方法 1.证据肯定存在的情况 由LS的定义式(A)以及概率与几率的关系式(B),可得Bayes的修正公式: 这就是证据肯定存在时,把先验几率(Prior odds)更新为后验几率(posterior odds)O(H/E)的计算公式,若换为概率形式,由(B)式,得到 这就是把先验概率P(H)更新为后验概率P(H/E)的计算公式。 (C)
三、主观Bayes方法 1.证据肯定存在的情况 由以上讨论可以看出充分性度量LS的意义: (1)当LS>1时,由(C)式,可得 由P(x)与O(x)具有相同的单调性,可知 这表明,当LS>1时,由于证据E的存在,将增大结论H为真的概率,而且LS越大, P(H/E)越大,即E对H为真的支持越强。当 时, ,即 ,表明由于证据E的存在,将导致H为真,由此,E的存在对H为真是充分的,故称LS为充分性度量。
三、主观Bayes方法 1.证据肯定存在的情况 (2)当LS=1时,由(C)式,可得 这表明,E与H无关。 (3)当LS<1时,由(C)式,可得 这表明,由于E的存在,将使H为真的可能性下降。 (4)当LS=0时,由(C)式,可得 这表明由于证据E的存在,将导致H为假。 上述关于LS的讨论可作为领域专家为LS赋值的依据当证据愈是支持H为真时,应使相应的LS的值越大。
三、主观Bayes方法 2.证据肯定不存在的情况 在证据肯定不存在时, P(E)= P(E/S)=0; P(¬ E )=1; 由于 两式相除得到 由(A1)和(B),可将(D)写为Bayes修正公式: 这就是证据E不存在时,把先验几率O(H)更新为后验概率O(H/ ¬ E)的计算公式。 (D)
三、主观Bayes方法 2.证据肯定不存在的情况 如果把几率换成概率,可以得到 这就是先验概率P(H)更新为后验概率P(H/ ¬ E)的计算公式。 由上述表达式讨论必要性度量LN的意义: (1)当LN>1时, 因为P(x)与O(x)具有相同的单调性,可知 这表明LN>1时,由于证据E不存在,将增大结论H为真的概率,而且LN越大, P(H/ ¬ E)就越大;即¬ E对H为真的支持越强。当 时, ,
三、主观Bayes方法 2.证据肯定不存在的情况 即 。表明由于证据不存在,将导致H为真。 (2)当LN=1时, 这表明, ¬ E与H无关. (3)当LN<1时, 这表明,由于证据E不存在,将使H为真的可能性下降, 或者说由于证据E不存在,将反对H为真。由此,可以体会E 对H的必要性。
三、主观Bayes方法 2.证据肯定不存在的情况 (4)当LN=0时,可得 这表明, 由于证据E不存在,将导致H为假。由此可以 看出E对H为真的必要性,故称LN为必要性度量。 由上述讨论,领域专家可为LN赋值,若证据E对H愈是必 要,则相应的LN值越小。
三、主观Bayes方法 2.证据肯定不存在的情况 由于E和¬ E 不可能同时支持H或同时反对H,所以在一条 知识中的LS和LN一般不应该出现如下情况中的一种: (1)LS>1,LN>1 (2)LS<1,LN<1 只有如下三种情况存在: (1)LS>1且LN<1 (2)LS<1且LN>1 (3)LS=LN=1
三、主观Bayes方法 例题:设有如下知识: r1: IF E1 THEN (10,1) H1 (0.03) r2: IF E2 THEN (20,1) H2 (0.05) r3: IF E3 THEN (1,0.002) H3 (0. 3) 求当证据E1 E2 E3存在及不存在时, P(Hi/ Ei)及 P(Hi/ ¬ Ei)的值各是多少: 由于r1和r2中的LN=1,所以E1和E2不存在时对H1和H2不 产生影响,即不需要计算P(H1/ ¬ E1)和P(H2/ ¬ E2);
三、主观Bayes方法 r1: IF E1 THEN (10,1) H1 (0.03) r2: IF E2 THEN (20,1) H2 (0.05) r3: IF E3 THEN (1,0.002) H3 (0. 3) 由于r1和r2中的LS>1,所以E1和E2存在时需要计算P (H1/ E1)和P(H2/ E2); 后验概率: