190 likes | 518 Views
面向价值领域的协商(一). 在面向任务领域的协商中,任务被显式地定义:给定每个 Agent 要完成的任务集合,以及与完成任务相关的费用, Agent 试图使完成这些任务的全部费用最小。它显式地告诉 Agent 它该做什么。 面向价值领域的协商:通过定义一个关于环境的可能状态的价值函数来确定 Agent 的目标。这样, Agent 的目标隐含着产生使函数值达到最大的环境状态。 规划可把一个环境状态转换成另一个环境状态。多个 Agent 之间实行联合规划。 Agent 的兴趣是使环境状态达到最大值的规划达成一致。. 可能的环境状态集合. 可能的 Agent 集合.
E N D
面向价值领域的协商(一) 在面向任务领域的协商中,任务被显式地定义:给定每个Agent要完成的任务集合,以及与完成任务相关的费用,Agent试图使完成这些任务的全部费用最小。它显式地告诉Agent它该做什么。 面向价值领域的协商:通过定义一个关于环境的可能状态的价值函数来确定Agent的目标。这样,Agent的目标隐含着产生使函数值达到最大的环境状态。规划可把一个环境状态转换成另一个环境状态。多个Agent之间实行联合规划。Agent的兴趣是使环境状态达到最大值的规划达成一致。
可能的环境状态集合 可能的Agent集合 可能的联合规划集合 费用函数,给每个规划和每个Agent设定一个实数,用来表示Agent执行该规划的费用 面向价值领域的协商(二)
WOD中的相遇(交互) 是环境的初始状态 是价值函数,给每个环境状态 和每个Agent 设定一个实数W(e,i),这个实数表示状态e对于Agent i的值或价值 表示规划 WOD种不对单个指标协商:它们既要对实现的状态协商,也对实现状态的手段协商
辩 论(一) 前面所讲的达成一致的方法有一些优点,最重要的可能就是这些协商具有某些期望的特性,但这些协商也存在以下缺点: • 不能说明观点:因为在协商的时候,需要表明协商的立场是有理由的。 • 不能改变观点 :前面倾向于假设Agent的效用函数是固定的,并且是不可改变的,不会随着协商过程而改变,这从某种程度上来说是对的,但是,从主观的、个人的观点看,偏好在协商时很可能会发生改变。 所以出现了基于辩论的协商
辩 论(二) 多Agent情形下的辩论是一个过程,在这个过程中,Agent试图使其他Agent确信某一情况的状态为真(或者假)。这个过程包含Agent对提出的命题支持或者反对的理由,以及对这些辩论的可接受性的检验。 人类之间出现的四种不同辩论的模式(哲学家Michael Gilbert): • 逻辑模式 • 情感模式 • 本能模式 • 神秘模式
基于逻辑的辩论 逻辑模式的辩论被认为是“最纯的”或者“最理性的”的一种论证。 基于Fox与他的同事提出的辩论系统: 论证的基本形式: • Database是逻辑公式的集合(可能是不一致的) • Sentence是称为结论的逻辑公式 • Grounds是逻辑公式集合 (1) (2)Sentence可以由Grounds证明
基于逻辑的辩论 ——论证(一) 一般来说,对于一个给定的命题,Agent可以构造几个论证,有些论证支持这个命题,有些论证反对这个命题(这种情况是对命题的否定)。也可以给一个数字或权重表示对命题支持的程度。 非平凡论证 重言式论证 定义:攻击 定义:击败
基于逻辑的辩论 ——论证(二) 可以区分5种类型的论证,分别用A1到A5表示: 说明编号大的论证类比编号小的论证类是更可接受的。直观的感觉是存在更少的原因认为它们有什么不妥。
课堂讨论 (1)能否举例面向价值领域的协商? (2)能否举例基于逻辑的辩论?并对上述五种类型的论证的优先关系通过实例给予说明。
合同网(一) 合同网是R. Smith提出的一种协商方法(他称之为结点间建立联系的方法) , 合同网协议最早用于分布式传感器系统中, 完成了在一个分布式系统中传递控制的作用。 合同网模型由多个可以互相传递信息的结点组成, 这些结点可分为三类: . 管理者:任务的拥有者, 负责该任务的分配 . 投标者:能够完成任务的结点 . 中标者: 投标成功的投标者, 被授予了任务
合同网(二) 标值的计算和评估在很大程度上将影响问题的求解过程. • 合同网的基本思想是:当管理者有任务需要其它结点帮助解决时, 它就向其它结点广播有关该任务信息即发出任务通告(招标) , 接到招标的结点则检查自己对解决该问题的相关能力, 然后发出自己的投标值并使自己成为投标者, 最后由管理者评估这些投标值并选出最合适的中标者授予任务, 即按照市场中的招标—投标—中标机制来完成 • 各结点间的协商过程:
标书发布对象 产生任务的节点进行任务通知,向网络中的其他节点公告存在的任务,然后作为该任务在工作期内的管理者。在缺少有关网络中其他节点特殊能力信息的情况下,要求管理者向所有的其他节点发布一般的广播。然而,如果管理者有网络中哪些节点是可能的候选者的知识,那么它仅向这些候选者发布受限的广播。最后,如果管理者能准确知道网络中哪个节点是合适的,那么它发布点到点的通知。随着问题的工作进展,不同的管理者将发出许多这样的任务通知。
合同网的适用范围 • 通过招标—投标—中标过程进行任务分配,解决资源冲突,协调各个Agent的行为。 • 对于类似于信息请求这样的简单任务,用合同的方式可能是不合适的,在这情况下,可以使用无多余修饰的请求——应答序列。用请求和信息消息实现这些消息(相对控制而言,这有助于数据的分布)的传递。当合同不是必需时,可以用请求消息来直接对请求的信息进行编码。信息消息用于对请求消息的响应和通常的数据消息传递两方面。
合同网节点的角色 从合同网的招投标过程中可以看出合同网中的各个节点都可以有多种身份, 即随着时间、条件和状态的变化,某个结点即可能是负责监控任务执行和处理结果的管理者(Manager), 又可能是要么是负责完成具体任务的合同承担者,具体为投标者或中标者。这就要求合同网中每个节点都有独立的招投标的处理能力。
BDI模型 Rao和Georgeff的研究将Agent视为理性Agent,并将信念(Belief)、期望(Desire)和意图(Intention)作为Agent的三种基本精神状态来对Agent 的行为进行描述, 因此称这种Agent模型为BDI模型。信念是系统状态的信息部件; 期望刻画了Agent的动机特性;意图则是由信念和期望所驱动的行为。 传统的BDI模型利用事件激活选择函数来选择最佳的行为作为意图, 这种模型适合于达到目标的方法较为灵活的系统, 但选择函数的实现却较为复杂, 并且与具体的应用相关。
BDI模型中的行为驱动规则 考虑到BDI模型的精神状态特征,在基于精神状态的Agent的实现中采用规则来表示信念、期望和意图之间的驱动关系, 并称其为BDI行为驱动规则。由此,BDI行为驱动规则可以表示为: Bel(a,f )ûDes (a,s)→Int (a,i)。Bel(a,f ) 表示Agent a 相信f;Des (a,s)表示Agent a 期望达到状态s;Int (a,i) 表示Agent a有意愿i。规则表示当Agent a相信f, 且Agent a期望达到状态s, 则Agent a有意愿i。
BDI模型中的BDI形成关系 Agent对外界变化(包括通信系统)的感知导致信念和期望发生变化, 信念和期望根据BDI行为驱动规则生成新的意图,而该意图的实施又会对信念和期望产生影响。从效应指向意图的箭头仅表明随着意图的实现, 该意图将从精神状态库中删除, 新的意图只能通过BDI行为驱动规则生成。
课堂讨论 (1)举例几种合同网任务分配协商时标值评估一般会考虑哪些因素? (2)假设实现这样的合同网协议:任务为因数分解的任务,有一个Agent连续地产生新任务,并需要分配给其他任务,阐述通过合同网协议分配任务的过程。