250 likes | 533 Views
Ontology Web Ontology 用途不可限量 Ontology 的构建 DL 描述逻辑,例子 A Web of Ontologies 主要挑战. Characteristics of Web Ontology. step1. step2. step3. references. Ontology 本来是,哲学中研究 ‘ being ’ 的性质及其内在关系的理论; ontology 是一种元理论,它的理论让人们在认识上,能够区别开那些本来是不同的 beings ,区别开 beings 之间关系的差异。
E N D
Ontology Web Ontology 用途不可限量 Ontology 的构建 DL描述逻辑,例子 A Web of Ontologies 主要挑战 Characteristics of Web Ontology step1 step2 step3 references
Ontology本来是,哲学中研究 ‘being’的性质及其内在关系的理论;ontology是一种元理论,它的理论让人们在认识上,能够区别开那些本来是不同的beings,区别开beings之间关系的差异。 Ontology is the theory of objects and their ties . An ontology is a specification of a conceptualization An Ontology 是在一定知识范围内,对所谈论的一组概念,对它们给出一种语义约定。 Ontology
一个Ontology 规定了一个论域,规定了所讨论的用词范围,约定了它们的语义 三类交互讨论方式, 可以是不同领域人与人在这一论域中的交互讨论, 这时,要求用词范围广,用词定义有深度,但不必那么确切,可以模糊,必要时可以循环定义, 可以是人和机器的交互讨论, 语义的表达,不一定全部使用文字,可以用多媒体图示语义 可以是 不同应用领域的计算系统之间的交互讨论 语义的表达必须确切,不容许语义冲突,不可循环定义 Ontology是 用于交互讨论的共享语义
例如,想要讨论:养育技术,变飞禽为宠物 • 关键词 飞禽 宠物 养育, 通过google 搜索, 搜索结果 30 条中只有一条具有近似的含义 • 用ontology 设法表达丰富语义: 一种养育技术,让幼小的飞禽经过养育成为陪伴人、受人喜爱的宠物
Dangdang google
圈定知识的应用范围 应用领域的知识范围,如 微电子业、或者 汽车业; 应用领域所涉及的常用词语,如 尺寸、热耗、速度等属性词语,从语义上深一步探讨,它们需要在更基本的抽象级别上定义,为此,需要在更抽象一级的层面上圈出新的知识范围, 圈出抽象的知识层次 Metadata级,在工程、物理的公用知识级别上,运用尺寸、热耗、速度等术语的ontology 元级别有基于更为基本的元级别,如探讨最基本的时间、空间、物质等概念的语义内涵,--理论物理 An Ontology 圈定一个知识范围
一个ontology , 一般首先给出一组概念的层次性结构,概念间的包含关系、组成关系、划分关系等, 分类层次结构,例如,动物分类学中的纲目及区分于其他类属的特征,语义深浅大有讲究 按is-a和part-of关系组织,组成概念结构。 概念的语义描述,应该不局限于这种静态结构。其他如,‘先后关系’,‘因果关系’ ,或者语义复杂的 ‘参照关系’。具有丰富语义的关系往往无法清楚地表达出它的语义来,例如,Bob 和 Alice 处于无法解脱的又恨又爱状态 语义的深浅层次
Ontology 的两个问题 • Ontology 讲究对词语含义的完整表达,在逻辑学和词语学上,具有语义的学术深度 • 但不可能在有限的表达中穷尽其词语的语义 • ontology 和 OO (面向对象的概念设计)主要是什么区别? • OO (面向对象的概念设计) UML 主要用于人和人的交互共享,人和机器的交互共享,但基本不用于机器系统之间的交互共享 • ontology (语义网) OWL 主要用于人和机器的交互共享,和机器系统之间的交互共享。但在 人和人之间的交互共享上,通常会嫌它叙述太啰嗦,…
UML 和 OWL是互通的 return
Web Ontology ,对于页面中常用的词语(对应的概念)的含义,用 归类、性质、和关系等描述,显式地表达出语义, 一个Web Ontology是一种共享词语和复用词语的语义约定 Web Ontology 对其表达的语义不求全,在一定的语义深度层面上,取得复用者的认可 例如 Yahoo 信息提供商收集了广泛的‘页面词语’按照一定语义分类层次,形成Yahoo hierarchy, 又,Dublin Core描述网页信息资源的基本元数据metadata(Content ,Intellectual Property ,Instantiation) Web Ontology-- 让ontology从哲学范畴中解放出来,变为网页信息共享所必备的、几乎人人关心的东西
Web Ontology 目标不再局限于逻辑学的学术范畴。语义描述主要是为计算机容易利用。不求语义的完整和深入,只求语义表达的可扩展性。 它的任务是把共同约定、共同享用的知识(词语的语义规范),用计算机容易处理的形式表达出来。网页中所含的宝贵信息,通过tag(tag本身是词语)标识,而词语的语义则用ontology来理解是否真的合用,如‘养育’一词在该网站范围是否意味着:从幼小开始培养。 Web Ontology
Web portal,专题信息的收集站和提供信息服务的门户站。用ontologies所表达的共同兴趣,可以让不同侧面的读者查找到更加贴切的信息 公司,内部存储积累的信息如何被有效利用,设法让内部各单位业务所产生和积累的信息,可以被不同角色的人员,例如销售人员、产品生产主管、公司研究主管等,根据他们自己需要的语义,去‘提取’有用的信息 紧急事务处理,涉及跨多个业务知识领域的分析理解、把应急处理模版映射到实的执行计划,把高层决策映射到执行行动序列 应用Web Ontology的方式
语义性搜索(带有明确语义但无法用关键词组表达的语义搜索),语义性搜索(带有明确语义但无法用关键词组表达的语义搜索), 跨领域的一名多义和多名同义的概念理解和概念区分, 决策中高层决策所涉及词语概念,到具体行动的映射,网络信息服务的可扩展性,等等 Web Ontology的用途不可限量 return
一个Web Ontology 在一定的知识范围(例如 汽车修理业、动物分类学)内的用词(概念concept ), 所使用的常用词语集 terms, 词语的定义definitions以及词语之间的关系relationships 基本词语,例如,字符串,名字,等已经在别处定义的词语, 复合词语,例如,学生,注册纪录,等词语,需要给出定义 公理性陈述:用基本词语和关系,给出复合词语的定义性陈述。 Ontology 不局限于某Web文档集合,这种语义范围不稳定。要在相对稳定的脑力思维级别,圈定一个知识范围 构建一个 Web Ontology
词语的定义和词语间的二元关系 类 class 又直称为 概念 原子类 atomic class, 复合类 cmpsite class, 角色 role 二元谓词,例如,父子关系 原角 atomic role,父-子 逆角 inverse rolev,子-父 Ontology 的表达,可以用受限的一阶谓词逻辑,DL描述逻辑
词语的定义, 例如, 家禽、宠物 两个概念的异同---- 动物类、养育环境、用途 复合 cmpsite class概念的定义,区别其语义异同, 东西、动物、陪伴人的东西;家养动物是动物的子类、禽类是动物的子类、家禽是禽类同时为家养动物,宠物是家养动物同时为陪伴人的东西 词语间的二元关系 原子作用atomic role,例如养育环境depend(_,_) 逆作用inverse role, 环境所养育depend -(_,_) 其他, 复合二元关系R◎S等 描述逻辑理论DL,它的特点是语义表达能力有限,推理简单,容易获得多项式复杂性的推理算法
文件系统ontology 的公理陈述 每个文件都有唯一的字符串名 每个文件,它或者是基本文件,或者是目录文件 目录文件的儿子都是文件 基本文件 不是 目录文件 基本文件 没有 儿子 每个文件的父文件个数小于等于1个 根 是一个没有 父文件的目录文件 …… 例1, ‘文件系统’的ontology (基于DL逻辑)
词语和词语间的二元关系 类 class 又直称为 概念C 原子类atomic class 复合类 cmpsite class 作用 role 二元谓词R 原子作用atomic role 逆作用inverse role …… 例子2 抽象理论模型也可以成为一个ontology例如,一个描述逻辑理论DL (ALC) • 定义性陈述statement 使用一组构造子constructors 来定义复合类概念,这种陈述被称为公理陈述 axiom statement,又分为二 • 概念的定义陈述term. axiom • 具体对象及其属性取值的描述assert. axiom • Tbox 一组概念的定义陈述 • Abox 一组具体对象及其属性 取值的描述
使用一组构造子constructors 复合概念 :∪、 ∩、 ~非、 概念的约束: 、、≡ 概念C受到关系R的限制: R.C; R.C; 陈述例hasChild. FemalePerson hasChild.FemalePerson hasChild是关系R, 陈述:至少有一个女孩子,全是女孩子 概念类的个数约束 (> 3 hasChild) (< 2 hasFemaleRelative) 有三个以上孩子, 至少有一个是女的亲属 构造子是对概念予以约束(语义约束)的手段 用于构造复合概念的构造子 return
挑战,Web of Ontologies全球知识网 与 人脑内部的知识网,组织形式? • 全球知识网 不同于相对集中的词库、字典库, • 分布式的建设: 语义冲突消解, • 语义深度层次的划分:高等理论水平的ontologies层应该首先建设 • 主要应用领域,以及它们的主要行动模板,所涉及的元数据,应该首先建设 • 人们头脑中的知识粗略地来说,也是按‘块’划分(knowledge chunk),知识的抽象层次和知识的应用领域,使用的频繁程度等等,皆可以用于‘块的划分’原则。
Web Ontology的挑战: 用经济学的术语,在Web上Ontology的生产,流通和消费 三个环节 • Web Ontology的构建和生产: • 挑战之一,在创建Web内容的同时,方便地、同步地构建内容的Ontology。 • 挑战之二,在改变Web文本内容的同时,维护Web Ontology的同步变化。避免Ontology成为过期的废信息。 • 挑战之三,当网站自身不主动向Semantic Web迁移,如何把这些缺乏迁移动力的网站的数据转换为可用的语义信息 • Web Ontology的传递和流通: • 理解 “方言” Ontology • Ontology门户网站 • Web Ontology的使用和消费: • 超越传统browser的客户端 • 人机交流ontology, 把语义自动变为机器可读的Ontology
Ontologies提供对不同元数据词汇及web page 模式间的互操作 interoperation 例如,有一个单位A要编制自己的业务的ontology,并发现一个onto-B很类似, 其中90%的概念词语(tags)是A可以采用的,但10%必须另行定义 建造Ontology的过程是选择复用对象,一大抄的过程,抄得合适不合适是学问 建造Ontology需要理论和适用工具 理论建设:语义表达和语义分析工具,需要新的理论工具, 需要工具平台的建设Ontologies 的互相利用,集成,比较检验等 MetaData和Ontologies词汇(vocabularies)的语义
例子,想要讨论的主题:养育技术,变飞禽为宠物例子,想要讨论的主题:养育技术,变飞禽为宠物 • 关键词 飞禽 宠物 养育 • 用图表达语义:语义丰富但恰当画出语义需要训练 技术 动物 IS-A IS-A IS-A 飞禽养育技术 飞禽 宠物 幼崽 PART-OF 养育为 IS-A IS-A 幼崽飞禽 宠物 幼崽飞禽
References 01 • Reference • [Asunción Gómez Pérez. 2002] Deliverable 1.3: A Survey on Ontology Tools. OntoWeb Consortium, 31 May 2002. http://www.ontoweb.org/download/deliverables/D13_v1-0.zip. • [Chalendar, G. & Grau, B., 2000]. SVETLAN: A system to classify nouns in context. In Proceedings of the First Workshop on Ontology Learning (OL-2000) in conjunction with the 14th European Conference on Artificial Intelligence (ECAI 2000). August, Berlin, Germany. • [Fikes , R.; Hayes, P.; & Horrocks,I, 2002]. DQL - A Query Language for the Semantic Web. Knowledge Systems Laboratory, 2002. • [Gruber. 1993] Ontolingua: A translation approach to portable ontology specifications. Knowledge Acquisition, 5(2), 199-200 • [Gómez-Pérez, A. 1998] Knowledge Sharing and Reuse. In the Handbook of Applied Expert Systems. CRC Press. 1998. • [Jonathan Robie. 2001] The Syntactic Web- Syntax and Semantics on the Web. In XML Conference and Exposition 2001, December 9-14 2001, Orlando, Florida, USA.
References 02 • [Maedche, A. & Staab, S. 2000]. Mining Ontologies from Text. In Dieng, R. & Corby, O. (Eds). EKAW-2000 - 12th International Conference on Knowledge Engineering and Knowledge Management. October 2-6, 2000, Juan- les-Pins, France. LNAI, Springer.2000 • [Michael Sintek, Stefan Decker,2002] TRIPLE---A Query, Inference, and Transformation Language for the Semantic Web. International Semantic Web Conference (ISWC), Sardinia, June 2002. • [Natalya F. Noy, Deborah L. McGuinness 2001] Ontology Development 101: A Guide to Creating Your First Ontology technical report. 2001 • [Ning Zhang, Hong Chen, Yu Wang, Shi-Jun Cheng, and Ming-Feng Xiong. 2003]. Odaies: Ontology-driven Adaptive Web Information Extraction System. In IEEE/WIC International Conference on Intelligent Agent Technology 2003, Halifax, Canada. 2003 • [RACER] http://www.cs.concordia.ca/~faculty/haarslev/racer/ • [TOVE 2003] http://www.eil.utoronto.ca/enterprise-modelling/tove/ • [Uschold, M.; Grüninger, M. 1996] ONTOLOGIES: Principles, Methods and Applications. Knowledge Engineering Review. Vol. 11; N. 2; June 1996. • [Y. Sure, M. Erdmann, J. Angele, S. Staab, R. Studer, and D. Wenke. 2003]. OntoEdit: Collaborative ontology engineering for the semantic web. In International Semantic Web Conference 2002 (ISWC 2002), Sardinia, Italia. 2003