1 / 29

《 模式识别 》 Pattern Recognition

《 模式识别 》 Pattern Recognition. 余 莉 电话: 76434 ( O ) ,61430 ( M ) E-mail : yuli@nudt.edu.cn (民网) liliyu@gfkd.mtn (军网). 课程对象. 信息工程专业本科生的专业课 学院硕士研究生的学位课 学院博士研究生的必修课之一. 学习方法. 着重理解 基本概念 基本方法 算法原理 注重理论与实践紧密结合. 基本要求. 基本: 完成课程学习,通过考试,获得学分。 提高: 能够将所学知识和内容用于课题研究,解决实际问题。

cosima
Download Presentation

《 模式识别 》 Pattern Recognition

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 《模式识别》 Pattern Recognition 余 莉 电话: 76434(O),61430(M)E-mail:yuli@nudt.edu.cn(民网) liliyu@gfkd.mtn(军网)

  2. 课程对象 • 信息工程专业本科生的专业课 • 学院硕士研究生的学位课 • 学院博士研究生的必修课之一

  3. 学习方法 • 着重理解基本概念基本方法算法原理 • 注重理论与实践紧密结合

  4. 基本要求 • 基本:完成课程学习,通过考试,获得学分。 • 提高:能够将所学知识和内容用于课题研究,解决实际问题。 • 飞跃:通过模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。

  5. 课程内容及安排 • 第一章 引论 (2学时) • 第二章 聚类分析 (4学时) • 第三章 判别域代数界面方程法 (4学时) • 第四章 统计判决 (4学时) • 第五章 统计决策中的学习与估计(4学时) • 第六章 最近邻方法 (2学时) • 第七章 特征提取与选择 (2学时) • 复习 (2学时) • 实验 上机实验 (8学时) • 作业 每章课后布置习题 • 考核 笔试(70%)+实验(20%)+作业(10%)

  6. 教材及参考教材 • 教材 • 孙即祥,《现代模式识别》,国防科技大学出版社,2002.1 • 参考教材 • J.P.Marques de Sa,《模式识别-原理、方法及应用》,清华大学出版社,2002.11 • 边肇祺等,《模式识别》(第二版)清华大学出版社 2000.1 • Sergios Theodoridis, 李晶皎等译,模式识别(第三版),电子工业出版社,2006

  7. 第一章 引 论 1.1 模式和模式识别 • 1.1.1 模式和模式识别的概念 • 识别是人类的基本行为 • 模式识别(Pattern Recognition)——使用计算机来辨别事物。机器识别,计算机识别,机器自动识别。

  8. 1. 2 模式识别系统

  9. 概 念 • 样本(Sample):一个具体的研究(客观)对象。如某人写的一个汉字,一幅图片等。 • 模式(Pattern):对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世界的某一样本的测量值的集合(或综合)。 • 模式类(Class):具有某些共同特性的模式的集合。

  10. 特征矢量: 设一个研究对象的 个特征量测量值分别 为 ,我们将它们作为一个整体来 考虑,让它们构成一个 维特征矢量。 特征空间: 各种不同取值的特征矢量的全体构成了 维特征空间。 注:特征矢量就是特征空间中的一个点。 (颜色(绿/红),似圆度)

  11. 模式识别:确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。模式分类的过程。模式识别:确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。模式分类的过程。 似圆度 颜色(绿/红)

  12. 1.1.2 机器与人类识别事物原理的比较 • 人类:具有抽象抽象概念的能力 • 总结规律,抽象出概念 • 机器:缺乏抽象能力 • 基本方法是计算

  13. 1.1.3 模式识别技术的应用领域 • 生物学 • 自动细胞学、染色体特性研究、遗传研究 • 天文学 • 天文望远镜图像分析、自动光谱学 • 经济学 • 股票交易预测、企业行为分析 • 医学 • 心电图分析、脑电图分析、医学图像分析

  14. 文字识别(Character Recognition) • OCR(Optical Character Recognition) • 智能交通(Intelligent Traffic) • 车牌、车型 • 语音识别(Speech recognition) • 翻译机,身份识别等 • 目标识别 • ATR(Automaic Target Recognition)

  15. 1. 2 模式识别系统 例子1:诊断 • (1)确定患者的病症:测量体温、血压,化验血沉,询问临床表现(模式采集); • (2)医生运用医学知识和个人经验(分类判决规则),根据主要病症(特征提取/选择),作出诊断(分类判决):该患者(模式样本)患了何种疾病(模式类)。

  16. 1. 2 模式识别系统 识别结果 二次特征 提取与选择 分类 识别 待识 对象 数据采集 特征提取 改进分类识别规则 数据采集 特征提取 二次特征提取与选择 训练 样本 正确率 测试 改进采集 提取方法 改进特征提取与选择 制定改进分类识别规则 人工 干预

  17. 1. 2 模式识别系统 例子2:苹果和香蕉的分类 似圆度 颜色(绿/红)

  18. 例子3:纸币识别系统 纸币识别器对纸币按面额进行分类 面额 5元 10元 20元 50元 100元

  19. 例子3:纸币识别系统 长度(mm) 宽度(mm) 5元 136 63 10元 141 70 20元 146 70 50元 151 70 100元 156 77

  20. 例子3:纸币识别系统 磁性金属条位置(大约) 5元 有 54/82 10元 有 54/87 20元 有 57/89 50元 有 60/91 100元 有 63/93

  21. 例子3:纸币识别系统 数据采集、特征提取: 长度、宽度、磁性、磁性的位置等等 特征选择: 长度、位置 分类识别: 确定纸币的面额

  22. 1. 3 特征矢量和特征空间 各类空间(Space)的概念 对象空间 模式采集:从客观世界(对象空间)到模式空间的过程称为模式采集。 模式空间 所有样本观测数据构成的空间 特征提取和特征选择:由模式空间到特征空间的变换和选择。 特征空间 类型判别:特征空间到类型空间所作的操作。 类型空间

  23. 1. 3 特征矢量和特征空间

  24. 1. 4 模式识别方法 • 统计判决 • 句法结构 • 模糊判决 • 逻辑推理 • 神经网络

  25. (1)统计判决 • 理论基础:概率论,数理统计 • 模式描述方法:特征向量 • 主要方法几何分类:线性分类,非线性分类统计分类:Bayes决策无教师的分类:聚类分析 • 主要优点1)比较成熟2)能考虑干扰噪声等影响3)识别模式基元能力强 • 主要缺点1)对结构复杂的模式抽取特征困难2)不能反映模式的结构特征,难以描述模式的性质3)难以从整体角度考虑识别问题

  26. (2)句法结构 • 理论基础:形式语言,自动机技术 • 模式描述方法:符号串,树,图 • 模式判定:是一种语言,用一个文法表示一个类, m类就有m个文法,然后判定未知模式遵循哪一个文法。 • 主要优点1)识别方便,可以从简单的基元开始,由简至繁。2)能反映模式的结构特征,能描述模式的性质。3)对图象畸变的抗干扰能力较强。 • 主要缺点当存在干扰及噪声时,抽取特征基元困难,且易失误。

  27. (3)模糊判决 • 理论基础:模糊数学 • 模式描述方法:模糊集合 A={(a,a), (b,b),... (n,n),} • 模式判定:是一种集合运算。用隶属度将模糊集合划分为若干子集,m类就有m个子集,然后根据择近原则分类。 • 主要优点由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。 • 主要缺点准确合理的隶属度函数往往难以建立,故限制了它的应用。

  28. (4)逻辑推理 • 理论基础:演绎逻辑,布尔代数 • 模式描述方法:字符串表示的事实 • 模式判定:是一种布尔运算。从事实出发运用一系列规则,推理得到不同结果,m个类就有m个结果。 • 主要优点已建立了关于知识表示及组织,目标搜索及匹配的完整体系。对需要众多规则的推理达到识别目标确认的问题,有很好的效果。 • 缺点当样本有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好。

  29. (5)神经网络 • 理论基础:神经生理学,心理学 • 模式描述方法:以不同活跃度表示的输入节点集 • 模式判定:是一个非线性动态系统。通过对样本的学习建立记忆,然后将未知模式判决为其最接近的记忆。 • 主要优点可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。 • 主要缺点模型在不断丰富与完善中,目前能识别的模式类还不够多。

More Related