700 likes | 807 Views
人工智能、模式识别与医学专家系统. 生物医学工程研究所. 第一节 人工智能. “ 智能化 ” 是当前新技术、新产品、新产业的重要发展方向、开发策略和显著标志,例如:智能控制( Intelligent Control )、智能自动化( Intelligent Automation )、智能管理( Intelligent Management )、 …… 。因此,人工智能具有广泛的用途。可以说,哪里有计算机应用,哪里就在用人工智能;哪里需要自动化或半自动化,哪里就在应用人工智能的理论、方法和技术。. 一 . 人工智能概述 什么是智能
E N D
人工智能、模式识别与医学专家系统 生物医学工程研究所
第一节 人工智能 “智能化”是当前新技术、新产品、新产业的重要发展方向、开发策略和显著标志,例如:智能控制(Intelligent Control)、智能自动化(Intelligent Automation)、智能管理(Intelligent Management)、……。因此,人工智能具有广泛的用途。可以说,哪里有计算机应用,哪里就在用人工智能;哪里需要自动化或半自动化,哪里就在应用人工智能的理论、方法和技术。
一.人工智能概述 • 什么是智能 智能(Intelligence)即智力功能,是人类大脑所具有的感知、认识、学习、理解、分析、综合、判断、推理、创造……等局部功能的总和与它们的有机综合的统称;因此,完善的智能中不能不包含有人类的情感、意识、意志等这种高级因素。
智能究竟是什么?智能是解决感性问题的能力。所谓感性就是个别的、特殊的、随机的、模糊的、感官的、情绪化的、个人意志的。解决这类问题需要经验的积累和归纳推理并形成新的经验。也就是具有自动学习、经验积累和应用知识的能力。智能究竟是什么?智能是解决感性问题的能力。所谓感性就是个别的、特殊的、随机的、模糊的、感官的、情绪化的、个人意志的。解决这类问题需要经验的积累和归纳推理并形成新的经验。也就是具有自动学习、经验积累和应用知识的能力。 对电脑而言,智能就是必须具有优化、扩展和改变主体已有程序和创建新程序的能力,即具有我们过去常说的主观能动性。智能可以利用一般经验或理论解决特殊问题,也可以归纳总结个别的经验使之上升到普遍的理论。
人的行为可分为社会行为和个人行为。 智能在人的社会行为中的作用主要是制定社会规则、探索和发现自然规则以及选择和套用这些规则。 而智能在人的个人行为中主要是通过个人情感和意志起作用以处理新鲜感受。
什么是人工智能 人工智能(Artificial Intelligence) 是利用设备或机器,用人工的方法,对人脑的思维活动过程进行模拟;当使得设备或机器的功能与脑功能大体等价时,这种设备或机器的功能就可以认为是具有某种程度的人工智能。人工智能应该以平均智力商为评定标准,并在与对比者(人)同等条件状况下进行全面地综合测试或进行某几种局部功能的单项测试;当测试结果不低于规定的智力商数时,应当承认该设备或机器具有某种程度或某种意义的人工智能。
所谓人工智能,又称为智能模拟,是计算机技术的一个分支,它研究如何利用计算机来完成用人的智慧才能完成的工作。人工智能问题是一个古老的但又是十分新颖的研究课题。近十多年来,各国研究人员在人工智能的研究上都已经获得巨大的进展。然而各种传统的或新颖的智能模型迄今还不能完全而圆满地对大脑思维活动的过程进行解释和模拟,人们还不十分了解信息在大脑中的底层结构和编码方法;其中特别是象人们的概念、意识、情感和创造性思维过程等,还根本无从着手;同时关于这一方面,在哲学上、自然科学上还有很大的争论,还不能得到哲学界和自然科学界的一致认同。所谓人工智能,又称为智能模拟,是计算机技术的一个分支,它研究如何利用计算机来完成用人的智慧才能完成的工作。人工智能问题是一个古老的但又是十分新颖的研究课题。近十多年来,各国研究人员在人工智能的研究上都已经获得巨大的进展。然而各种传统的或新颖的智能模型迄今还不能完全而圆满地对大脑思维活动的过程进行解释和模拟,人们还不十分了解信息在大脑中的底层结构和编码方法;其中特别是象人们的概念、意识、情感和创造性思维过程等,还根本无从着手;同时关于这一方面,在哲学上、自然科学上还有很大的争论,还不能得到哲学界和自然科学界的一致认同。
人工智能与计算机 人们早已习惯于把计算机称之为“电脑”,但是人们忽略了这样一个事实∶无论电脑的功能有多么强大,用途有多么广泛,它也不过是个具有超级能力的白痴。 严格地讲,电脑只能执行特定的指令,而人脑则是处理所有感受到的信息。所谓“特定的指令”是指电脑程序可接受的或可执行的外部输入。显然执行指令与处理信息有着本质的不同。 这并不是否认电脑具有处理信息的能力,这里说的电脑处理信息与人脑处理信息是不同的概念。其实电脑处理信息过程也是在执行外部指令或给定程序中的指令。
电脑的软硬件都不是自发进化而成的。电脑程序是人根据自然规律、法则和社会经验的归纳总结,是由人编制的。 电脑程序集中的是人的经验总结,其本质是理性的。所谓理性就是理论的、有序的、精确的、数字化的、结论性的、有规律的、普遍性的、公共的、合乎逻辑的。简单类比就如同是一本操作手册,人们只要照它去做就是了。 显然智能不是被用来解决这类理性化的问题的。(智能是解决感性问题的能力。)因为当一切都规定好了、程序化了,就根本不需要智能了。由此我们得出一个结论∶无论电脑的功能有多么强大,只要它只能按给定的程序来工作,它就不能算作具有智能。
记忆、归纳推理与信息处理 通常记忆内容包括两个部分∶一是记录所接受或感受到的信息,这主要是指外部进来的信息。二是自动记录主体自身的活动过程。电脑只能记忆前者,而不能记忆后者。而人脑则两者都可以做到。电脑的记忆过程是被动地执行指令,它所能记住的东西仅仅是工作所需的程序和要处理的数据。而人脑所记录的东西不仅仅是感受到的信息,而且最重要的是能够记录处理信息的过程,或者说能够记录大脑自身有意识的活动内容。记忆内容第二部分所指的过程是自动的、不受控的,而第一部分则是可以被控制的。
记忆、归纳推理与信息处理 利用已有的经验来解决新的问题需要归纳和推理。人的这种能力是由人脑的记忆构造决定的。人脑在发育的早期阶段记忆过程主要是素材和基本经验块堆的建立和积累,即机械记忆。人脑在成熟阶段记忆过程主要是经验块堆的关联和重组,即关联记忆。由关联记忆形成的人脑活动使人的思维模式天生具有归纳推理能力。经验的重组使人得到了新的经验,获得了进步。人脑的这种记忆构造的优点是具有模糊识别和记忆修补能力,缺点是老的关联成分会因打散而消退, 即产生忘却。
记忆、归纳推理与信息处理 人记住一张脸至少不比记住一个外语单词要难,而电脑恰恰相反,它宁愿去记一个城市的电话簿。电脑几乎完全靠机械般的精确记忆,而且不能利用记忆进行归纳推理,因而无法实现智能所必须的利用自身经验之功能。电脑虽能记忆,但不能具有经验。 电脑在记忆时会把所有的素材都记录下来。严格地讲,电脑中的磁盘并不完全属于它的"脑子",磁盘中的数据部分就象人的笔记本和资料库那样,是脑外之物。而我们人脑中已经固有了基本素材和经验,记忆时只需要把已有的各个素材和经验的关联记录下来。这里所说的素材就是人对最基本物理感受的机械记忆。
记忆、归纳推理与信息处理 其实这些素材的量并不是很多,当出生的婴儿一开始感受这个世界,只需要不长的时期就可以得到他一生所需的基本记忆素材。其他时间的记忆就是把这些素材关联成块,再把块关联成堆。块块堆堆之间的再关联就构成了我们脑袋里的复杂记忆。对人类大脑的解剖分析也支持这一论点,另外人的记忆和经验的增加并没有使大脑越长越大,这还可以解释我们大脑在工作时为什么消耗很小的物理能量。关联记忆使得我们成年人脑袋的大小并不与记忆的多少成正比。要是我们把所有的感受象录音、录像那样全都记下来,要么把我们的脑子胀爆,要么我们的脑袋长得比楼房还大。
记忆、归纳推理与信息处理 人类的情感和智能都与我们大脑的记忆特性密切相关,我们大脑有意识的活动在相当程度上是记忆活动。探索和认识人脑的记忆原理是实现人工智能的重要一环,也是电脑模拟或实现人脑智能的必经之路。任何试图逃避这一关的做法都不会成功。 电脑科技的高速发展并未导致电脑在智能化方面有什么进展,其重要原因之一就是电脑的记忆方式一直停留在它的初始阶段。
二、人工智能的发展轨迹 (1) 模拟人类的思维规律,即推理方法的研究和程序化;(2) 正确的知识表示,运用知识进行推理,即知识的形式化;(3) 从大量已有的知识推出新的知识,即专家系统。
三、人工智能的基本方法 • 人工智能的基本方法有以下几种:1、启发式搜索:人们解决问题的基本方法是方案--试验法,对各种可能的方案进行试验,直至找到正确的方案。搜索策略有盲目搜索、启发式搜索之分。盲目搜索是对可能方案进行顺序的试验;启发式搜索是依照经验或某种启发式信息,摒弃希望不大的搜索方向。启发式搜索大大加快搜索过程,使得人们处理问题效率得到提高。
2、规划:人们待解决的问题一般可以分解转化为若干小问题,对于每个小问题还可以进行分解。由于解决小问题的搜索大为减少,使得原问题的复杂度降低,问题的解决得到简化。规划要依靠启发式信息,成功与否,很大程度上决定于启发信息的可靠程度。3、知识的表达技术:知识在计算机内的表达方式是用计算机模拟人类智能必须解决的重要问题。问题解决的关键是如何把各类知识进行编码、存储;如何快速寻找需要的知识;如何对知识进行运算、推理;如何对知识进行更新、修改。2、规划:人们待解决的问题一般可以分解转化为若干小问题,对于每个小问题还可以进行分解。由于解决小问题的搜索大为减少,使得原问题的复杂度降低,问题的解决得到简化。规划要依靠启发式信息,成功与否,很大程度上决定于启发信息的可靠程度。3、知识的表达技术:知识在计算机内的表达方式是用计算机模拟人类智能必须解决的重要问题。问题解决的关键是如何把各类知识进行编码、存储;如何快速寻找需要的知识;如何对知识进行运算、推理;如何对知识进行更新、修改。
四、人工智能的研究和应用领域 人工智能的研究和应用领域概括起来有8个:1、问题求解:我们通过对人们求解问题的一般规律、求解问题的思路的研究,编制一个智能程序,依照人们解决问题的方法与步骤,解决问题。2、自然语言处理:自然语言处理是研究计算机如何运用已有的词法和语法规则,正确理解人们的自然语言,以方便用户的使用与表达。3、模式识别:模式识别是研究如何从庞大的信息中提取特征,根据特征识别不同事物的基本原理。
4、智能数据库:智能数据库是研究利用人的推理、想象、记忆原理,实现对数据库的存储、搜索和修改。智能数据库通过有效的组织,能够满足人们快速检索和修改数据库的要求。5、智能机器人:智能机器人能够对外部环境具有一定的适应能力,根据实际的环境信息进行综合处理,并做出正确的响应。这种机器人用于航天、军事、工业制造等领域。6、博奕:博弈是研究使自己取胜、战胜对手的策略。在决策过程中要对形势做出恰当的估计,搜寻各种可能的策略组合,通过对比分析确定对自己最有利的策略。其中运用到问题求解、模式识别等方法。4、智能数据库:智能数据库是研究利用人的推理、想象、记忆原理,实现对数据库的存储、搜索和修改。智能数据库通过有效的组织,能够满足人们快速检索和修改数据库的要求。5、智能机器人:智能机器人能够对外部环境具有一定的适应能力,根据实际的环境信息进行综合处理,并做出正确的响应。这种机器人用于航天、军事、工业制造等领域。6、博奕:博弈是研究使自己取胜、战胜对手的策略。在决策过程中要对形势做出恰当的估计,搜寻各种可能的策略组合,通过对比分析确定对自己最有利的策略。其中运用到问题求解、模式识别等方法。
7、程序自动设计:程序自动化是为了设计一种算法。该算法是分层结构的,先提出一些规定,形成最高一级的算法,并提出下一层算法的规定,然后按照这些规定形成下一级的算法和再下一级的规定,最后完成整个程序。程序自动化较多的研究工作放在了自动程序验证方面,即让计算机自动查找程序中的错误。8、定理的自动证明:计算机通过模仿人的推理和演绎过程,从最基本的公理出发,证明定理的正确性。 现在信息技术的飞速发展,使得Al有更广泛的研究和应用领域,如专家咨询系统、组合调度问题、虚拟现实等等。7、程序自动设计:程序自动化是为了设计一种算法。该算法是分层结构的,先提出一些规定,形成最高一级的算法,并提出下一层算法的规定,然后按照这些规定形成下一级的算法和再下一级的规定,最后完成整个程序。程序自动化较多的研究工作放在了自动程序验证方面,即让计算机自动查找程序中的错误。8、定理的自动证明:计算机通过模仿人的推理和演绎过程,从最基本的公理出发,证明定理的正确性。 现在信息技术的飞速发展,使得Al有更广泛的研究和应用领域,如专家咨询系统、组合调度问题、虚拟现实等等。
五、应用举例 指纹识别技术是指利用计算机进行的指纹自动识别技术,它是一项综合技术,其研究发展涉及到多个前沿及边缘科学,如模糊数学、数学形态学、神经网络、模式识别、计算机视觉、人工智能、数据压缩、并行处理以及网络技术等。这种技术的原理是通过指纹扫描仪上的光电识别器(摄像头)对人指尖的卷状纹理和涡进行扫描后,计算机把特定的隆起部位的位置制成表和记录下来而形成一个对每一个人来说都是唯一的一个压痕模式,存入计算机指纹数据库。
计算机指纹扫描仪能够区分人的手指与伪造的如蜡制的手指或橡胶手套上的指纹,这是由于对人的手指其扫描仪传感系统能分辨出血液的流动情况、血压等信息。当进行身份认证时,指纹自动识别系统会将人现场通过指纹扫描仪收集到的指纹经软件系统与数据库的指纹相对照而进行确认,对主流机型只需2秒左右的时间。由于两个人拥有完全相同指纹的概率估计少于10亿分之一,因此识别率极高,如美国Identix公司的指纹扫描设备在用一个右手指正确匹配上接近100%。指纹相对人的其它生物特征具有个体差异大、实现识别所需的软硬件资源较小等优势,因此具有较大的应用空间。计算机指纹扫描仪能够区分人的手指与伪造的如蜡制的手指或橡胶手套上的指纹,这是由于对人的手指其扫描仪传感系统能分辨出血液的流动情况、血压等信息。当进行身份认证时,指纹自动识别系统会将人现场通过指纹扫描仪收集到的指纹经软件系统与数据库的指纹相对照而进行确认,对主流机型只需2秒左右的时间。由于两个人拥有完全相同指纹的概率估计少于10亿分之一,因此识别率极高,如美国Identix公司的指纹扫描设备在用一个右手指正确匹配上接近100%。指纹相对人的其它生物特征具有个体差异大、实现识别所需的软硬件资源较小等优势,因此具有较大的应用空间。
第二节 模式识别 人工智能中有一个很重要的领域就是模式识别。但对于什么是“模式”,或者什么是机器能够辩别的“模式”,迄今尚无确切的定义。我们只能形象地解释说,人之所以能识别图像、声音、动作、文字、面部表情等,是因为它们都存在着反映其特征的某种模式。但这一解释根本没有诠释模式的内涵和外延。
一.模式识别与模式识别的定义与目的 按照广义的定义,模式是一些供模仿用的、完美无缺的标本。 模式识别就是识别出特定客体所模仿的标本。
识别能力是人类和其它生物的一种基本属性,根据被识别的客本的性质可以将识别活动分为两个主要类型:具体的客体和抽象的客体。识别能力是人类和其它生物的一种基本属性,根据被识别的客本的性质可以将识别活动分为两个主要类型:具体的客体和抽象的客体。 字符、图画、音乐…是具体的客体,它们通过对感官的刺激而被识别;论点、思想、信仰…则是非物质的客体,对它们的研究主要属于哲学、政治学的范畴。 我们主要是研究具体客体的识别,而且仅局限于研究用机器完成与识别任务有关的基本理论与实用技术。这一类课题属于工程学、计算机科学、应用数学的范畴。对我们将要讨论的内容,我们对模式、模式识别作如下狭义的定义:
模式是对某些感兴趣的客体的定量的或结构的描述,模式类是具有某些共同特征的模式的集合。模式是对某些感兴趣的客体的定量的或结构的描述,模式类是具有某些共同特征的模式的集合。 模式识别是研究一种自动技术,依靠这种技术,机器将自动地(或人尽量少地干涉)把待识模式分配到各自的模式类中去。 但模式识别不是简单的分类学,其目标包括对于识别对象的描述、理解与综合。
模式识别是伴随着计算机的研究、应用日益发展起来的。其应用领域涉及社会生活的各个方面,而且还在不断扩大。人们亲切地称计算机为电脑,几乎所有本来由人脑实现的功能,都谋略用“电脑”来完成。而且已经取得,并不断取得令人振奋的成就。模式识别是伴随着计算机的研究、应用日益发展起来的。其应用领域涉及社会生活的各个方面,而且还在不断扩大。人们亲切地称计算机为电脑,几乎所有本来由人脑实现的功能,都谋略用“电脑”来完成。而且已经取得,并不断取得令人振奋的成就。
但比起人脑来,电脑毕竟是小巫见大巫,不仅仅在于人脑约有1011~1012个脑细胞(被称为神经元),更在于每个神经元约有103~104个突触,即一个神经元可通过突触与8000 个其它神经元交换信息,当生物电流通过某一突触时,神经元就将信息传送到下一神经元。所以人脑有极丰富的联想能力。可以超越时空,任意跳跃。因此计算机的联想、判别与推理能力远不如人脑,特别是在对外界信息的感知能力方面,更远不如人脑。
识别是人对感觉的认知和判断能力。 识别能力的高低体现了智能水平。识别由低到高分为三个层次。 • 仪器水平∶物理识别 • 动物水平∶模糊识别 • 人类智能水平∶情感识别
物理识别是对接受到的信息实现物理、化学和生物学的量化认识。视觉包括明暗、颜色、大小、形状、远近、运动状态等。听觉包括声音大小、频率、方位、波形等。触觉包括温度、导热率、硬度、粘度、大小、形状、受力、活动状态等。嗅觉和味觉包括物质的组成及化学成分。物理识别是对接受到的信息实现物理、化学和生物学的量化认识。视觉包括明暗、颜色、大小、形状、远近、运动状态等。听觉包括声音大小、频率、方位、波形等。触觉包括温度、导热率、硬度、粘度、大小、形状、受力、活动状态等。嗅觉和味觉包括物质的组成及化学成分。 现代科技与电脑相结合在物理识别范围和识别精度方面早已大大超过人自身的能力。几乎所有的科学仪器都是用于这种识别。这种识别的特点是识别内容分别独立互不相关,事件具有精确的重复性,无需经验和智能,完全可以程序化。所以它是最低层次的识别。
模糊识别是在大量复杂的信息中识别出有用的部分,即对接收的信息与以往的记忆和经验进行关联认识,剔除无关的信息。视觉包括在复杂的背景中辨认特定的人和物或以往经历过的人和物。听觉包括在嘈杂的背景中辨别出特定的声音,特别是不同人的讲话声。模糊识别可解决有谁、有什么、是谁、是什么的问题。这种对人来说轻而易举的能力对电脑来说真是太难了。目前电脑可通过对照记录的方式实现单一识别能力,例如指纹、图形、语音等。由于电脑不能实现关联记忆,所以它在模糊识别方面难以有突破性进展。这个层次的识别与我们常见的宠物、牲畜、鸟、昆虫的识别能力大致相当,因此它不能产生高级智能。模糊识别是在大量复杂的信息中识别出有用的部分,即对接收的信息与以往的记忆和经验进行关联认识,剔除无关的信息。视觉包括在复杂的背景中辨认特定的人和物或以往经历过的人和物。听觉包括在嘈杂的背景中辨别出特定的声音,特别是不同人的讲话声。模糊识别可解决有谁、有什么、是谁、是什么的问题。这种对人来说轻而易举的能力对电脑来说真是太难了。目前电脑可通过对照记录的方式实现单一识别能力,例如指纹、图形、语音等。由于电脑不能实现关联记忆,所以它在模糊识别方面难以有突破性进展。这个层次的识别与我们常见的宠物、牲畜、鸟、昆虫的识别能力大致相当,因此它不能产生高级智能。
情感识别是最高级的识别。它是完全的感性识别。这种识别主要是针对人际之间的信息交流。它包括文字、语言、歌曲、表情、外表、气味和动作所表达的含义,既识字又听得懂说话,甚至包括自然现象、事件、环境和物品的人文美学含义。这种识别已经超出了人工智能的模糊识别,达到了人工高级生命的能力。以单一语音识别为例∶初级识别能够知道有声音,模糊识别能够知道说什么或谁在说话,而高级识别则能通过说话的内容、音调、节奏知道说话者的情绪和态度。这种识别要求电脑具有人类的情感。由此可见,高级智能与情感是完全相关的。情感识别是最高级的识别。它是完全的感性识别。这种识别主要是针对人际之间的信息交流。它包括文字、语言、歌曲、表情、外表、气味和动作所表达的含义,既识字又听得懂说话,甚至包括自然现象、事件、环境和物品的人文美学含义。这种识别已经超出了人工智能的模糊识别,达到了人工高级生命的能力。以单一语音识别为例∶初级识别能够知道有声音,模糊识别能够知道说什么或谁在说话,而高级识别则能通过说话的内容、音调、节奏知道说话者的情绪和态度。这种识别要求电脑具有人类的情感。由此可见,高级智能与情感是完全相关的。
模式识别的全过程可用下图简要的表示: 非电量转换及数字化 被识对象 预处理 特征或基元提取 图8.1模式识别的全过程 模式分类 二.模式识别的全过程 以上过程中,每一阶段设计的好坏都会对全盘的工作产生严重的影响,所以每一阶段都应争取尺可能完美的效果。
由于被识别的对象多半是具有不同特征的非电量,如灰度、色彩、声音、压力、温度等,所以第一步就要将它们转变为电信号,然后经A/D转换,将它们转换为能由计算机处理的数字量。由于被识别的对象多半是具有不同特征的非电量,如灰度、色彩、声音、压力、温度等,所以第一步就要将它们转变为电信号,然后经A/D转换,将它们转换为能由计算机处理的数字量。 • 数字化后的电信号需经预处理,以滤除样品采集过程中掺入的干扰、噪声,并人为地突出有用信号,以得到良好的识别效果。
经改善后的有用信号,还要作特征抽取或基元抽取,才能对其分类。由于特征的抽取与待识模式的类别密切相关,很难有某种泛泛的规律可依循。随着工作的深入,要不断修改与完善此阶段的工作,这也是图8.1 中虚线回溯的含义。 • 模式分类就是在前几步准备工作的基础上,把被识别对象归并分类,确认其为何种模式的过程。这是模式识别“出成果”的阶段,直接以其分类结果表明本次识别的结束。
模式分类按其方法,大致可分为四大类 • 统计决策法 • 句法结构法 • 模糊判决法 • 人工智能法
电脑模式识别技术最初起源于图像识别的需要,比如协助警方根据照片从茫茫人海中搜寻某个罪犯,或者帮助医生把显微镜下的细菌进行分类…。电脑模式识别技术最初起源于图像识别的需要,比如协助警方根据照片从茫茫人海中搜寻某个罪犯,或者帮助医生把显微镜下的细菌进行分类…。 人脑在接受到视觉器官传递来的信息时,是怎样识别和区分大千世界的万物的呢? 一种方案是,大脑用一个神经元与图像上的每一点一一对应并逐一判别,最后综合为整体;但既使只描述图像局部的大致轮廓,神经元的数目仍不够使用。
另一种更符合实际的方案是:大脑感知的不是图像上的所有的点,而是轮廓中最典型的特征,如线段、角度、弧度、反差、颜色等,把它们从图像中抽取出来,然后结合头脑中过去的记忆和有关经验和知识分析判断。这种“特征抽取”也是电脑图像识别的基础。另一种更符合实际的方案是:大脑感知的不是图像上的所有的点,而是轮廓中最典型的特征,如线段、角度、弧度、反差、颜色等,把它们从图像中抽取出来,然后结合头脑中过去的记忆和有关经验和知识分析判断。这种“特征抽取”也是电脑图像识别的基础。 要根据一张照片让电脑在一群人中辩认出某个人,可以先把这张照片输入电脑,抽取照片上人像上的特征,如鼻子、嘴巴、眼睛和轮廓特点,进行分类和加工,存放在机器里作为识别那个人的“模板”。然后,让所有人都接受光电设备的描扫,把他们的图像与机器事先存放的“模板”一一匹配。
只要待辩认的人躲在这群人中间,哪怕他化了装,留了长发,蓄了胡须,也逃不脱电脑的“火眼金睛”。这种图像处理方法也叫“模板匹配”,它已广泛应用于公安部门识别犯罪嫌疑人的侦破工作。只要待辩认的人躲在这群人中间,哪怕他化了装,留了长发,蓄了胡须,也逃不脱电脑的“火眼金睛”。这种图像处理方法也叫“模板匹配”,它已广泛应用于公安部门识别犯罪嫌疑人的侦破工作。 图像识别技术比较成功的运用领域是文字识别。如果把每一个汉字或西文字母都视为一个小图形,模板匹配的方法自然可以移植到文字识别过程中。目前印刷体文字识别软件早已进行商品化阶段。
通常将印刷品上的文字用扫描仪输入,首先经过特征抽取处理,例如,某字的笔画有几笔,收尾端点有几个,拐角有多少等。在电脑中已预先保存了各种字的图形和它们的特征,也称为“模板”,全部模板就构成一部“模板字典库”。由于要考虑字体、字号、纸张、油墨等因素影响,每个字都有若干套不同的模板。接下来就是将抽取到的文字特征与模板字典逐一匹配,直到在字典库中找到最接近的模板为止。运用这种方法,对于印刷体文字,电脑能够以“一目十行”的速度进行阅读。通常将印刷品上的文字用扫描仪输入,首先经过特征抽取处理,例如,某字的笔画有几笔,收尾端点有几个,拐角有多少等。在电脑中已预先保存了各种字的图形和它们的特征,也称为“模板”,全部模板就构成一部“模板字典库”。由于要考虑字体、字号、纸张、油墨等因素影响,每个字都有若干套不同的模板。接下来就是将抽取到的文字特征与模板字典逐一匹配,直到在字典库中找到最接近的模板为止。运用这种方法,对于印刷体文字,电脑能够以“一目十行”的速度进行阅读。
电脑的语音识别也是一个非常重要的人工智能技术,是人工智能多年追逐的目标。与“视觉”输入设备扫描仪对应的“听觉”输入设备是话筒,语音识别的基础技术也是模式识别。由于每个人说话的音色和音调都有一定的差异,发声频率各不相同。人脑对语音似乎有一种自适应的能力,既能区分不同性别、不同年龄的语音差异,又能调整为能够理解的音素,从而听懂各色人说出的话语。采用模板匹配方式的电脑不可能具备这种本领,它通常只能“听懂”特定某人的声音,而且是经过了一段时间的“学习”的结果。学习过程称为“训练”即对着电脑大声重复地讲述某些字词,直到它把这些字词的声音频谱特征“记住”,存放在参考样本库作为识别这个字词的模板。当换了另一个人说话,电脑的正确识别率可能就会下降。电脑的语音识别也是一个非常重要的人工智能技术,是人工智能多年追逐的目标。与“视觉”输入设备扫描仪对应的“听觉”输入设备是话筒,语音识别的基础技术也是模式识别。由于每个人说话的音色和音调都有一定的差异,发声频率各不相同。人脑对语音似乎有一种自适应的能力,既能区分不同性别、不同年龄的语音差异,又能调整为能够理解的音素,从而听懂各色人说出的话语。采用模板匹配方式的电脑不可能具备这种本领,它通常只能“听懂”特定某人的声音,而且是经过了一段时间的“学习”的结果。学习过程称为“训练”即对着电脑大声重复地讲述某些字词,直到它把这些字词的声音频谱特征“记住”,存放在参考样本库作为识别这个字词的模板。当换了另一个人说话,电脑的正确识别率可能就会下降。
此外,语音识别对说话者使用的词汇必须作出限制,否则要求电脑具有极大的存储容量和极高处理速度。此外,语音识别对说话者使用的词汇必须作出限制,否则要求电脑具有极大的存储容量和极高处理速度。 1998年IBM公司发布ViaVoice98,使中文语音识别技术取得了实质性突破,该软件具有语音导航功能,在普通话的基础上能适应广东、四川、上海三种口音,用平常速度口音读一般文章的识别率达到85%~95% ,并具有自适应功能,快速口音适应只需训练5个词、3句话,5分钟左右即可建立一个语音模型。已被广泛使用。
人工智能模式识别的进展,已经在一定程度上使电脑具备了“听”、“说”、“读”的能力,但距离理想的目标还有较长的路程。对人类来说,哪怕你把字写得龙飞凤舞,哪怕你把话说的含糊不清,我们也能根据对上下文的理解做出正确的识别。这表明人脑模式识别的方法不是或者不完全是“模板匹配”,对模糊信息的处理,人脑比电脑要强得多。此外,电脑储存的模板库或样本库,与它的判断识别机构两相分离,当模板库容量十分庞大时,搜索匹配就显得力不从心;而人脑记忆的知识与其判断机构浑然一体,它的模式识别是寻找、运用知识的思维决策。人工智能模式识别的进展,已经在一定程度上使电脑具备了“听”、“说”、“读”的能力,但距离理想的目标还有较长的路程。对人类来说,哪怕你把字写得龙飞凤舞,哪怕你把话说的含糊不清,我们也能根据对上下文的理解做出正确的识别。这表明人脑模式识别的方法不是或者不完全是“模板匹配”,对模糊信息的处理,人脑比电脑要强得多。此外,电脑储存的模板库或样本库,与它的判断识别机构两相分离,当模板库容量十分庞大时,搜索匹配就显得力不从心;而人脑记忆的知识与其判断机构浑然一体,它的模式识别是寻找、运用知识的思维决策。
模式识别已广泛应用于生物医学工程领域。生物医学信号的自动分类和识别,医学图像的识别都有相当多的应用实例。随着计算机的发展与普及,模式识别的应用必定会越来越广泛。模式识别已广泛应用于生物医学工程领域。生物医学信号的自动分类和识别,医学图像的识别都有相当多的应用实例。随着计算机的发展与普及,模式识别的应用必定会越来越广泛。
第三节 专家系统 所谓的专家系统实质上是某一专门知识,例如某种疾病的诊断、处方,某些矿物的资源勘探数据分析等的计算机咨询系统(软件)。 专家系统的基础是专家知识。专家知识可以分成两大类,一类是已经总结在书本上的定律、定理和公式等,另一类是专家们在实际工作中长期积累的经验、教训。这后一类知识往往难以总结成书面的规律或条文,但这类知识却是十分宝贵的,它们在专家做出决策、指导工作和解决疑难问题等方面起着重要作用。
第三节 专家系统 • 什么是专家系统:“专家系统”(Expert System)是指具有相当于专家的知识和经验水平,以及解决专门问题能力的计算机系统,通常指计算机软件。
自一九六八年由费根鲍姆主持研制完成的第一个专家系统DENDRAL(质谱数据分析、推断化学分子结构的系统)以来,已经在各行各业中研制了大量的专家系统。专门为专家系统设计的语言软件Lisp和Prolog也已诞生。尽管有报道说某些专家系统的分析判断能力超过了专家水平,并创造了大量社会财富。但是绝大多数的专家系统只能达到或接近专家水平。自一九六八年由费根鲍姆主持研制完成的第一个专家系统DENDRAL(质谱数据分析、推断化学分子结构的系统)以来,已经在各行各业中研制了大量的专家系统。专门为专家系统设计的语言软件Lisp和Prolog也已诞生。尽管有报道说某些专家系统的分析判断能力超过了专家水平,并创造了大量社会财富。但是绝大多数的专家系统只能达到或接近专家水平。 在专家系统的研制过程中,人们越来越感到专家知识的获取并转换成计算机能够接受的形式是专家系统研究的瓶颈。
在研究人工智能的过程中,神经生理学和心理学等方面的研究也是一个重要的侧面。现代脑科学已证实,人脑在结构上是左脑和右脑左右对称的器官,但左右脑的功能却截然不同。左脑主司读、写、听、说这类文字、语言理解和生成的功能,专门处理逻辑推里、数学运算等“串行”任务。右脑主要负责形象思维的任务,例如图像识别与处理、模式识别、音乐与艺术、模糊推理与学习等“并行”任务。当我们力图用当代最先进的串行计算机来实现右脑的形象思维功能时遇到了极大困难。在研究人工智能的过程中,神经生理学和心理学等方面的研究也是一个重要的侧面。现代脑科学已证实,人脑在结构上是左脑和右脑左右对称的器官,但左右脑的功能却截然不同。左脑主司读、写、听、说这类文字、语言理解和生成的功能,专门处理逻辑推里、数学运算等“串行”任务。右脑主要负责形象思维的任务,例如图像识别与处理、模式识别、音乐与艺术、模糊推理与学习等“并行”任务。当我们力图用当代最先进的串行计算机来实现右脑的形象思维功能时遇到了极大困难。
一个对人来说是非常简单的识别或判断的任务,串行计算机却要用大量的内存和漫长的计算时间才能完成,以至当问题获得解答时已没有实际使用的价值。因而许多研究人员力图模拟神经系统的工作原理来研制新一代的计算机,这种计算机将与传统计算机有完全不同的工作原理,它是全并行式运行的具有分布式存储能力,这就是在目前吸引了大量研究人员关注的人工神经网络。人工神经网络具有自学习的能力,不需要复杂的编程,可以解决当前专家系统研制的知识获取和语言软件两大瓶颈问题。一个对人来说是非常简单的识别或判断的任务,串行计算机却要用大量的内存和漫长的计算时间才能完成,以至当问题获得解答时已没有实际使用的价值。因而许多研究人员力图模拟神经系统的工作原理来研制新一代的计算机,这种计算机将与传统计算机有完全不同的工作原理,它是全并行式运行的具有分布式存储能力,这就是在目前吸引了大量研究人员关注的人工神经网络。人工神经网络具有自学习的能力,不需要复杂的编程,可以解决当前专家系统研制的知识获取和语言软件两大瓶颈问题。
专家系统的一个重要应用领域就是医疗诊断系统。早在一九七一年就由斯坦福大学的E.H.Shortiffe等研制了血液感染病医疗诊断系统MYCIN,它已成为成功的专家系统的一个典型。此外,世界上比较著名的医疗诊断系统还有青光眼医疗诊断系统CASNET,内科病医疗诊断系统INTERNIST,肾病医疗诊断系统PIP,处理精神病的系统PARRY等。我国的研究者根据我国的特点,在中医专家系统方面做了大量的工作,有一些已投入实际应用。专家系统的一个重要应用领域就是医疗诊断系统。早在一九七一年就由斯坦福大学的E.H.Shortiffe等研制了血液感染病医疗诊断系统MYCIN,它已成为成功的专家系统的一个典型。此外,世界上比较著名的医疗诊断系统还有青光眼医疗诊断系统CASNET,内科病医疗诊断系统INTERNIST,肾病医疗诊断系统PIP,处理精神病的系统PARRY等。我国的研究者根据我国的特点,在中医专家系统方面做了大量的工作,有一些已投入实际应用。