880 likes | 1.07k Views
医学信息学 - 本体与 解决问题方法 - 知识整合论. 包含飞 上海中医药大学 中医学信息化标准化研究室. Medical Informatics ― Ontology ―Biomedical Knowledge Integration. 内容来自( content from ): Mark A. Musen : Medical Informatics: Searching for Underlying Components (医学信息学:寻找基本组分).
E N D
医学信息学-本体与 解决问题方法-知识整合论 包含飞 上海中医药大学 中医学信息化标准化研究室
Medical Informatics―Ontology―Biomedical Knowledge Integration 内容来自(content from): Mark A. Musen :Medical Informatics: Searching for Underlying Components(医学信息学:寻找基本组分)
Cornelius Rosse, DSc,José L. Mejino, Bharath R. Modayur, Rex Jakobovits, Kevin P. Hinshaw and James F. Brinkley:解剖学知识表达的宗旨和组织原理:“Digital Anatomist”符号知识库 • Cornelius Rosse and José L. V. Mejino Jr.: A reference ontology for bioinformatics: the Foundational Model of Anatomy(生物医学信息学的一个参考本体:解剖学的基本模型)
包含飞:生物医学知识整合论(Ⅰ―Ⅳ)Hanfei Bao:The Theory of Biomedical Knowledge Integration(Ⅰ―Ⅱ)
如何定义医学信息学---医学信息学的灵魂部分在发生什么如何定义医学信息学---医学信息学的灵魂部分在发生什么
Mark A. Musen : • 一个广泛的共识是医学信息管理将是未来医疗保健和世界卫生的核心。 • 世界各地的医学专业团体都把医学信息学看作医学实践的实质性要素。
医学研究所(Institute of Medicine)医疗事故问题的最近的报告特别规定信息技术是解决方法的一个重要组成部分。 • 学术部门医生和科学家美国最有权威的美国临床调查协会(the American Society for Clinical Investigation)历史上首次把医学信息学作为调查领域。
随着信息学的概念进入主流,也许有人认为这对医学信息学这一研究领域是值得欢欣鼓舞的日子。随着信息学的概念进入主流,也许有人认为这对医学信息学这一研究领域是值得欢欣鼓舞的日子。 • 然而我的问题是我仍然不能肯定“什么是医学信息学”。
Shortliffe’s教科书最新版定义这个学科为“涉及管理和应用医学信息中的广泛问题包括医学计算和医学信息的本质研究的领域。”Shortliffe’s教科书最新版定义这个学科为“涉及管理和应用医学信息中的广泛问题包括医学计算和医学信息的本质研究的领域。” • van Bemmel 和Musen定义信息学为“研究应用和处理数据,信息和知识的科学”,定义医学信息学为“应用于医学、卫生保健和公共保健的信息学”。
作为一个学者,我(Musen)非常希望相信医学信息学是一门科学,至少它含有某些科学要素。 • 然而,如何理清信息学的基础理论和应用经验方法确认假设仍然是医学信息学界的一个挑战。
很多人谈论医学信息学时,并不其指理论和方法论,而简单地指计算机在医学中的应用。很多人谈论医学信息学时,并不其指理论和方法论,而简单地指计算机在医学中的应用。 • 在定义这一学科时强调计算机这一角色实质是强调我们工作的技术而不是直接强调我们的工作本身。 • 不可以轻易地称医学信息学为“医学计算机科学”,就象不能称概率论为“骰子科学”,不能称文学研究为“铅笔科学”。
领域以外的人士倾向于把医学信息学视为没有推动性的科学,至少对计算机科学没有推动作用。领域以外的人士倾向于把医学信息学视为没有推动性的科学,至少对计算机科学没有推动作用。
很重要的是医学信息学与计算机科学研究开发基于知识的系统的研究者的目标之间存在相当的重叠。 • 90年代开始的建立基于知识系统的原理的研究与发展医学信息学的理论如何密切相关。
把医学信息学现在的工作简单地解释为计算机科学带有生物医学兴趣是错误的。把医学信息学现在的工作简单地解释为计算机科学带有生物医学兴趣是错误的。 • 把医学信息学理解为着重开发临床计算机系统的软件工程也是错误的。
确实我们常常只能通过系统层次的评估才能检验我们的基础模型是否成功,但如果我们认为信息学(informatics)是一门与计算机科学(computer science)和信息科学(information science)有所不同的学科,那么我相信我们需着重在内容知识(content knowledge)的概念模型上,在我们的研究议程上把其作为基础的要素。
历史上自产的信息系统一直是医学信息学的学术研究的坚实的基础。但不可阻挡地,那些“自产”的系统逐步消失并为商业化系统所取代。历史上自产的信息系统一直是医学信息学的学术研究的坚实的基础。但不可阻挡地,那些“自产”的系统逐步消失并为商业化系统所取代。 • 医疗卫生机构随着经济气候的改变必须重定义它们的使命和战略,医学信息学的学术团体也需随着它们附属的医疗卫生机构的改变重新定义它们自己。 • 随着开发和部署临床信息系统变为工业界的直接职责,很多曾经被认为是学术性医学信息学的一部分现在已经从大学专业突然夺走。
当我们集中于那些牢固地属于学术王国的医学信息学部分时,我们的研究贡献事实上会更大。 • 如果医学信息学确实是一门学术性学科,那么必须确定其科学基础。 • 我相信医学信息学的研究者难于相互之间或向其他专业的同事解释他们复杂而艰巨的努力目标,原因主要在于没有努力理请学科的一组基本假设。 • 然而,我们学科中很少有致力于提出基础理论的哲学家。
Blois的工作的原理性贡献在于认为认识论是核心元素,它可以令人信服地说明医学信息学是一门学科研究。不是人工制品的堆砌,或是信息技术在临床环境中的配置,它使医学信息学适合学术询问。Blois的工作的原理性贡献在于认为认识论是核心元素,它可以令人信服地说明医学信息学是一门学科研究。不是人工制品的堆砌,或是信息技术在临床环境中的配置,它使医学信息学适合学术询问。 • 开发认识论模型大部分已不再是哲学家的工作,而是由希望建立基于知识系统的人工智能专家进行研究。
然而,自Blois死后,基于知识系统领域的开发者的对知识模型和表达的认识已发生很大变化。很多计算机科学传统领域的从业者甚至没有感觉已经发生的转变。然而,自Blois死后,基于知识系统领域的开发者的对知识模型和表达的认识已发生很大变化。很多计算机科学传统领域的从业者甚至没有感觉已经发生的转变。 • 医学信息学领域的学者更应该了解模型化知识的基本思路,而这现在被广泛地用于设计和装备智能计算机系统。
在过去的十年中,第二代基于知识系统为编码和应用临床知识提供了更清晰更易维护的架构。在过去的十年中,第二代基于知识系统为编码和应用临床知识提供了更清晰更易维护的架构。
人工智能领域的研究者现在把智能化计算机系统看作有4个基本概念组成部分:人工智能领域的研究者现在把智能化计算机系统看作有4个基本概念组成部分: • (1) 专业本体学,它定义应用领域的主要概念及相互间的关系; • (2) 详细的专业知识库,包括关于(用专业本体学表示的)领域的一组命题; • (3) 问题解决方法,编码抽象的、可能非专业依赖性算法,可自动完成系统任务; • (4) 映射集合,规定用专业本体学表达的概念和相应的知识库如何满足具体的问题解决方法的输入-输出的需要。
本体及问题解决方法为潜在的高度复用性组件,它们可看成为建筑模块,借此可以通过结合(必要时可通过扩大)合适的组件建立各种各样的智能系统。本体及问题解决方法为潜在的高度复用性组件,它们可看成为建筑模块,借此可以通过结合(必要时可通过扩大)合适的组件建立各种各样的智能系统。
从某种意义上讲,具体本体和其一起自动化某一任务问题的解决方法定义解决该任务所需知识的理论。 • 这种理论是一种罗列问题解决所需要的专业领域概念(本体)和为获得解法(问题解决方法)而应用于专业领域概念的算法。
数据描述和过程规定的区别在计算机科学的早期就已有之。新意在于数据描述即本体被赋以中心意义并成为独立于具体算法的存在。本体于是象一种数据库构架,有可分离特点,与操作它们的算法集合区别开来。 • 与传统的数据库构架不同,本体可以表示被表示的概念之间的极其复杂的关系,实现领域的获取丰富的复用性模型的愿望,而不在于提供存储数据实例的有效框架。
无疑构建强大的临床信息系统所需要的丰富的专业领域本体是困难的,并且为很多生物医学应用系统所需要的很多问题解决方法面临重要的计算挑战,恰恰是因为生物医学信息学中的模型化工作是如此艰难及需要如此多的创新,所以我们的研究对转化到同样需要丰富的概念模型的其他生物医学领域具有很大的潜力。无疑构建强大的临床信息系统所需要的丰富的专业领域本体是困难的,并且为很多生物医学应用系统所需要的很多问题解决方法面临重要的计算挑战,恰恰是因为生物医学信息学中的模型化工作是如此艰难及需要如此多的创新,所以我们的研究对转化到同样需要丰富的概念模型的其他生物医学领域具有很大的潜力。
然而为了把我们的工作推广,我们必须学会用超越我们具体应用领域的元概念来描述我们的工作,专业领域本体及问题解决方法的概念对构架我们的研究设想和使我们的成果与其他研究者交流是极好的初选。然而为了把我们的工作推广,我们必须学会用超越我们具体应用领域的元概念来描述我们的工作,专业领域本体及问题解决方法的概念对构架我们的研究设想和使我们的成果与其他研究者交流是极好的初选。
任何一门科学,都必须具备三个根本要素,即研究对象、研究方法和概念(范畴)体系。任何一门科学,都必须具备三个根本要素,即研究对象、研究方法和概念(范畴)体系。 学科的要素
研究对象是该学科的根本出发点,也代表了该学科的本质属性。研究对象是该学科的根本出发点,也代表了该学科的本质属性。 • 研究方法是人们认识对象的方式与方法的学问,它是科学发展最活跃的因素。
因为科学总是随着研究方法的发展而发展的。人们用特定的研究方法来研究特定的研究对象,便逐步形成上升为理性的认识,并借助语词以概念、范畴的形式加以表述。因为科学总是随着研究方法的发展而发展的。人们用特定的研究方法来研究特定的研究对象,便逐步形成上升为理性的认识,并借助语词以概念、范畴的形式加以表述。 • 当用来进行理论思维的概念、范畴积累起来,形成认识或解释对象的理论体系之后,便标志着这一门科学走向成熟。
顾名思义,本体是本体学研究的对象,本体学一词在哲学上是研究存在的学问,存在是事物的最高抽象,最少内容,天下第一“有中之无”。顾名思义,本体是本体学研究的对象,本体学一词在哲学上是研究存在的学问,存在是事物的最高抽象,最少内容,天下第一“有中之无”。 ——孙正聿:《哲学导论》, 北京:中国人民大学出版 社,1999, p86-89
“有多少种关于‘本体’的观念,也标志着有多少种哲学理论体系”。“如何回答‘本体究竟是什么’,也就是回答‘哲学究竟是什么’”。“有多少种关于‘本体’的观念,也标志着有多少种哲学理论体系”。“如何回答‘本体究竟是什么’,也就是回答‘哲学究竟是什么’”。 ——孙正聿:《哲学导论》, 北京:中国人民大学出版 社,1999, p86-89
“通常认为,哲学本体论关于一般存在或存在本身的哲学学说,关于脱离具体存在的超验存在的学说。”“通常认为,哲学本体论关于一般存在或存在本身的哲学学说,关于脱离具体存在的超验存在的学说。” • “‘存在’,这是一个外延最广大(无所不包)、内涵最稀薄(毫无内容)的概念。” ——孙正聿:《哲学导论》, 北京:中国人民大学出版 社,1999, p86-89
如果我们试图观察世界,我们说在这个世界中一切皆有,外此无物,这样我们便抹杀了所有的特定的东西,于是我们所得到的,便只是绝对的空无,而不是绝对的富有了。这就是说,“存在”是一个“最抽象也最空疏”的概念。(黑格尔) ——孙正聿:《哲学导论》, 北京:中国人民大学出版 社,1999, p86-89
Cornelius Rosse: • 虽然解剖学现用术语数量巨大,它们在硬拷贝资源和专用医学词汇中被广泛使用, 但这些术语的表达仍缺乏一致性。 • 每一个较大的医学词汇项目都按自己的概念化要求来安排这些解剖学术语。
这种差异性或不一致性也许不足为奇,因为作为能重复应用的解剖学信息资源的基本组织原则尚未阐明。这种差异性或不一致性也许不足为奇,因为作为能重复应用的解剖学信息资源的基本组织原则尚未阐明。 • 很多类型的临床数据可看作各种解剖学实体所表现的属性,因此我们认为标准化解剖学概念的表达有助于临床概念表达标准的建立。
形式化的经典的解剖学模型被认为是临床概念表达的先决条件。满足这种需求的最好方法是开展对解剖学知识的符号表达的相互一致性研究,这种研究还应该与当前广泛开展的可视化人体解剖学(visualizing human anatomy)研究同时进行。
我们的目标是建立一个系统,在系统中概念化的解剖学实体及其相互关系被详细规定为本体,即机体结构的模型化。我们的目标是建立一个系统,在系统中概念化的解剖学实体及其相互关系被详细规定为本体,即机体结构的模型化。 • 为了使知识库能在不同的领域如医护、生物医学教学和研究等都具有复用性,我们坚持以解剖学的视点开发模型。
1.解剖学被定义为: • 物理对象和间隔空间(space)的有序集合体,按既定的空间关系或模式拼装而成,这种空间关系受基因组协调表达的影响而构成机体及其分部。也即从物质的观点,有组织地结构构成了机体及其分部。 • 为了清晰起见,也为了有别于第二定义,我们称之为解剖学(结构)。(#物理部分)
2.解剖学另一个定义为: • 发现、分析和表达解剖学(结构)及其建立过程与为理解、解释解剖观察并从中得出结论所需要的概念化实体的科学。 • 为有别于解剖学(结构),我们称此为解剖学(科学)。(#意识部分) • 第二定义意味着解剖学(科学)的宗旨是对组成解剖学(结构)的物理实体的概念化。
我们已讨论过解剖学的物理实体的空间或图象表达(spatial or graphical representations)和字符表达(symbolic representations)(#语义表达)的区别,并提议同时开发这两种可重复使用的表达,选择最适合的并能使二者联接起来的方法。 • 这一提议也为其他学者所采纳,可视人体工程(Visible Human project)正在继续研究。
这种分类和推理应依靠经典解剖学知识,因此经典模型应作为解剖学的知识库的基础。这种分类和推理应依靠经典解剖学知识,因此经典模型应作为解剖学的知识库的基础。 • 这也是我们形式化经典符号模型并兼顾实例解剖学的原因之一。
正在开发的DIGITAL ANATOMIST:符号知识库 • 目前Digital Anatomist符号知识库是根据关系和定义构建的层次结构。 • 我们当前的实验性工作集中在覆盖胸腔的解剖学实体的知识库。 • 知识库的基础为-is a-关系层次结构,包含8700个概念和200个类。我们称这一层次结构为解剖学本体。
解剖学本体的对象需限于解剖学(科学),最广义地说,本体被定义为概念系统的明确规定。而目前,本体的范围被进一步限定于宏观解剖学实体。解剖学本体的对象需限于解剖学(科学),最广义地说,本体被定义为概念系统的明确规定。而目前,本体的范围被进一步限定于宏观解剖学实体。 • 解剖学本体首先必需对组成人体的物理实体实现概念化,这个前提必需满足,然后才可能把状态(states)、过程(processes)、行为(activities)等概念与物理解剖学实体联系起来,因而目前我们限定本体于物理解剖学实体的静态。
本体必需对经典解剖学(canonical anatomy)实现模型化并为知识库提供适合于组织实例解剖学(instantiated anatomy)数据的方法。(#以类带实例) • 虽然目前本体限定在结构的宏观层次,但构成宏观实体的物理单元必需同时在微观层次定义。 • 解剖学实体的表达必须有机器语法分析性,而在人类阅读方面,专家和新手均能充分理解的。
解剖学实体 Is_a 物理性解剖学实体 概念性解剖学实体 解剖学关系 物质性物理性解剖学实体 非物质性物理性解剖学实体 体物质 解剖学结构 解剖学间分 生物学大分子 细胞 器官 细胞部分 组织 器官部分 器官系统 身体部分 人体
虽然开发目标是宏观解剖学,本体应可以扩展到其他解剖学领域(胚胎学)和发生生物学(developmental biology),微观解剖学,细胞生物学,分子生物学和神经解剖学。
解剖学实体的表达必须有机器语法分析性,而在人类阅读方面,专家和新手均能充分理解的。解剖学实体的表达必须有机器语法分析性,而在人类阅读方面,专家和新手均能充分理解的。
本体不同于知识本身,也不同于现有的知识的描述性文本的表达,本体是对术语和知识结构的明确的约定。本体不同于知识本身,也不同于现有的知识的描述性文本的表达,本体是对术语和知识结构的明确的约定。 • 这种约定主要在于解剖学结构单元的概念化及其关系。
在医学词典和解剖学教科书中,解剖学实体的定义着重于对功能性属性形式化,然而这些属性不能建立可用于对解剖学实体分组和相互区分的具体约定。 (#知识背景空间是功能关系) • 为了对机体的物理结构模型化,解剖学实体的属性的根据应为组成实体的构成部分和由实体构成的实体。也即解剖学结构的物理实体应该定义为组成它们的部分以及它们参与形成的更高一级的实体。 (#知识背景空间是局-整关系)
因此我们通过对组成机体的单元(units)及单元之间的关系具体约定来形式化地定义解剖学物理实体。因此我们通过对组成机体的单元(units)及单元之间的关系具体约定来形式化地定义解剖学物理实体。 • 为此有必要限制和规定几个表示分划关系(分部(subdivision),部分(part),成分(component))的术语的意义。 • 定义中的区别主要用-consists of-(包含关系)及其反关系-constitutes- (构成关系)说明。