890 likes | 1.17k Views
第8章 数字图像处理技术. 智西湖. 8.1 数字图像处理概述 8.1.1 数字图像处理的发展与应用状况 图像的应用已有数千年历史。最初是用于像形文字和绘画。17世纪出现显微镜图,在医学上有很大的贡献。20世纪30年代出现电视,对新闻传播和文化娱乐起了很大作用。1858年出现的黑白照片和1924年制出的彩色照片,对人类文化、艺术和生活带来很大影响。1972年出现了卫星遥感图和医学上的 CT 图,这些图像采用了计算机技术,对军事、科研和医学具有极为重要的意义。 . 数字图像处理的起源. 图 8.1 1921 年的图像. 图 8.2 1922 年的图像.
E N D
第8章 数字图像处理技术 智西湖
8.1 数字图像处理概述 • 8.1.1 数字图像处理的发展与应用状况 图像的应用已有数千年历史。最初是用于像形文字和绘画。17世纪出现显微镜图,在医学上有很大的贡献。20世纪30年代出现电视,对新闻传播和文化娱乐起了很大作用。1858年出现的黑白照片和1924年制出的彩色照片,对人类文化、艺术和生活带来很大影响。1972年出现了卫星遥感图和医学上的CT图,这些图像采用了计算机技术,对军事、科研和医学具有极为重要的意义。
数字图像处理的起源 图8.1 1921年的图像 图8.2 1922年的图像
1929. • 15 种色调 图8.3 1929年的图像
60年代末数字图像处理出现 图8.4 60年代末期70年代初的数字图像处理
图像处理的应用范围 • 医学:CT,MRI分析,手术导航等 • 军事:交战仿真 导弹 • 安全:指纹 视网膜 签名 面部识别等 • 娱乐:游戏、动画、电影 • 通讯:电视、电话 • 工业:机械人、质量控制、检测 • 环境资源:云图分析、RS、GIS等 • Internet:基于内容的图像检索 • …………
军事应用 a. AIM-9X“响尾蛇”导弹 b. “新一代响尾蛇”地对空导弹 图8.5 军事应用
医学应用 图8.6 医学应用
应用于安全方面 a. 指纹识别 b. 虹膜识别 图8.7 安全方面应用
惠更斯号探测土卫六 • “惠更斯号”传回的土卫六表面照片,NASA科学家称土卫六发现甲烷河流和冰封陆地. 图8.8 土卫六表面照片
图像的类型 图像 可见图像 数学函数 图片 连续函数 照片 物体 图 离散函数 画 光图像 图8.10 图像的类型
数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理作为一门学科形成于20世纪60年代初。早期图像处理的目的是以改善图像质量、改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像。常用的图像处理方法有图像增强、复原、编码、压缩等。
20世纪60年代以来,美国及一些国际组织发射了资源遥感卫星(如LANDSAT系列)和天空实验室(如SKYLAB),由于成像条件受飞行器位置、姿态、环境条件等影响,图像质量不高。因此,以昂贵的代价进行简单直观的判读来获取图像不合算,必须采用数字图像处理技术。如LANDSAT(地球资源)系列陆地卫星,采用多波段(光谱)扫描器(MSS),在900km高空对地球每一个地区以18天为一周期进行扫描成像,其图像分辨率大致相当于地面上10--100米左右(如1983年发射的LANDSAT-4,分辨率为30m)。这些图像在空中先处理(数字化,编码)成数字信号存入磁带中,在卫星经过地面站上空时,高速传送下来,然后由处理中心分析判读。这些图像无论是在成像、存储、传输过程中,还是在判读分析中,都必须采用很多数字图像处理方法。
首次获得成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,获得了月球的地形图、彩色图及全景镶嵌图,成果非凡,为人类登月奠定了坚实基础,也推动了数字图像处理学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术发挥了巨大作用。
随着计算机技术和人工智能、思维科学研究的迅速发展,从20世纪70年代中期开始,数字图像处理向更高、更深层次发展。人们开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。很多国家,特别是发达国家投入更多人力、物力到这项研究,取得了不少重要成果。其中代表性的成果是20世纪70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解虽然在理论方法研究上已取得不小进展,但它本身是个比较难的研究领域,因为人类对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的课题。
数字图像处理的另一巨大成就是医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得诺贝尔奖,对人类作出了划时代贡献。 与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大成就,如航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等。图像处理成为引人注目、前景远大的新型学科。
在飞机及卫星遥感技术中,要对空中摄影得来大量照片进行处理分析,以前需要雇用几千人,而现在改用配备有高级计算机的图像处理系统来判读分析,节省人力,又加快了速度,还可以从照片中提取人工所不能发现的大量有用情报。现在世界各国都在利用陆地卫星所获取的图像进行资源调查(如森林调查、海洋泥沙和渔业调查、水资源调查等),资源勘察(如石油勘查、矿产量探测、大型工程地理位置勘探分析),农业规划(如土壤营养、水份和农作物生长、产量估算),城市规划(如地质结构、水源及环境分析)。在气象预报和对太空其他星球研究方面,数字图像处理技术也发挥了相当大的作用。
在工业和工程领域中图像处理技术有着广泛的应用,如自动装配线中检测零件的质量、对零件进行分类,印刷电路板疵病检查,弹性力学照片的应力分析,流体力学图片的阻力和升力分析,邮政信件自动分拣,在有毒、放射性环境内识别工件及物体的形状和排列状态,先进的设计和制造技术中采用工业视觉等等。值得一提的是研制具备视觉、听觉和触觉功能的智能机器人,将会给工农业生产带来新的激励,目前已在工业生产中的喷漆、焊接、装配中得到有效的利用。在工业和工程领域中图像处理技术有着广泛的应用,如自动装配线中检测零件的质量、对零件进行分类,印刷电路板疵病检查,弹性力学照片的应力分析,流体力学图片的阻力和升力分析,邮政信件自动分拣,在有毒、放射性环境内识别工件及物体的形状和排列状态,先进的设计和制造技术中采用工业视觉等等。值得一提的是研制具备视觉、听觉和触觉功能的智能机器人,将会给工农业生产带来新的激励,目前已在工业生产中的喷漆、焊接、装配中得到有效的利用。
在军事方面图像处理和识别主要用于导弹的精确制导,各种侦察照片的判读,图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;在公共安全方面,图像处理技术可用于指纹识别,人脸面部鉴别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。在文化艺术方面,目前图像技术的应用有数字图像艺术创作、动画制作、游戏、工艺美术设计、文物资料照片的复制和修复等等,以至于现在已逐渐形成一门新的艺术:计算机美术。
8.1.2 数字图像处理技术 • 图像的增强 图像的增强用于调整图像的对比度,突出图像中的重要细节,改善视觉质量。通常采用灰度直方图修改技术进行图像增强。图像的灰度直方图是表示一幅图像灰度分布情况的统计特性图表,与对比度紧密相连。如果获得一幅图像的直方图效果不理想,可以通过直方图均衡化处理技术作适当修改,即把一幅已知灰度概率分布图像中的像素灰度作某种映射变换,使它变成具有均匀灰度概率分布的新图像,使图像清晰(如图8.11)。
原图 直方图均衡化后的结果 图8.11 直方图的均衡化处理
图像的平滑 (Image Smoothing)图像的平滑处理即图像的去噪声处理,主要是为了去除实际成像过程中,因成像设备和环境所造成的图像失真,提取有用信息。 实际获得的图像在形成、传输、接收和处理过程中,不可避免地存在外部干扰和内部干扰,如光电转换过程中敏感元件灵敏度的不均匀性、数字化过程的量化噪声、传输过程中的误差以及人为因素等,均会使图像变质。因此,去除噪声恢复原始图像是图像处理中的一个重要内容,图8.12为图像去噪对照图。
原图像 去噪处理后的图像(Wiener滤波) 受到噪声干扰的图像 图8.12 图像的去噪声处理
边缘锐化图像边缘锐化处理主要是加强图像中的轮廓边缘和细节,形成完整的物体边界,达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。锐化的作用是要使灰度反差增强,因为边缘和轮廓都位于灰度突变的地方。所以锐化算法的实现是基于微分作用。它是早期视觉理论和算法中的基本问题,边缘锐化处理如图8.13所示。边缘锐化图像边缘锐化处理主要是加强图像中的轮廓边缘和细节,形成完整的物体边界,达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。锐化的作用是要使灰度反差增强,因为边缘和轮廓都位于灰度突变的地方。所以锐化算法的实现是基于微分作用。它是早期视觉理论和算法中的基本问题,边缘锐化处理如图8.13所示。
用Sobel 算子边缘锐化处理后的图像 原图 图8.13 图像的锐化处理
图像的分割图像分割是将图像分成若干部分,每一部分对应于某一物体表面,在进行分割时,每一部分的灰度或纹理符合某一种均匀测度度量。其本质是将像素进行分类。分类依据是像素的灰度值、颜色、频谱特性、空间特性或纹理特性等(如图8.14)。图像分割是图像处理技术的基本方法之一,应用于诸如染色体分类、景物理解系统、机器视觉等方面。图像的分割图像分割是将图像分成若干部分,每一部分对应于某一物体表面,在进行分割时,每一部分的灰度或纹理符合某一种均匀测度度量。其本质是将像素进行分类。分类依据是像素的灰度值、颜色、频谱特性、空间特性或纹理特性等(如图8.14)。图像分割是图像处理技术的基本方法之一,应用于诸如染色体分类、景物理解系统、机器视觉等方面。
图像的识别图像的识别过程实际上可以看作是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体,给这些物体赋予特定的标记,它是机器视觉系统必须完成的一个任务。图像识别按从易到难,可分为三类问题:第一类识别问题中,图像中的像素表达了某一物体的某种特定信息。如遥感图像中的某一像素代表地面某一位置地物的一定光谱波段的反射特性,通过它即可判别出该地物的种类。图像的识别图像的识别过程实际上可以看作是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体,给这些物体赋予特定的标记,它是机器视觉系统必须完成的一个任务。图像识别按从易到难,可分为三类问题:第一类识别问题中,图像中的像素表达了某一物体的某种特定信息。如遥感图像中的某一像素代表地面某一位置地物的一定光谱波段的反射特性,通过它即可判别出该地物的种类。
图像校正数字图像信息的获取来自于CCD (Charge Coupled Device电荷耦合装置)图像传感器。但是CCD的输入/输出特性不是线性的,如果不进行校正处理,将无法得到好的图像效果。图像校正是为改善图像质量而提出的一种处理方法。以图像的伽玛校正(gamma correction)功能为例,调整此功能可使画面中较暗的部分层次分明、细节清晰可辨,使色彩还原更自然; 轮廓线平滑(如图8.15);这是调节亮度对比度无法达到的效果。
伽玛校正校正后图像 伽玛校正校正前图像 图8.15 图像的伽玛校正
8.1.3 计算机图像处理的内容计算机图像处理研究的主要内容是:①如何对模拟图像进行采样、量化以产生数字图像;②如何对数字图像做各种变换以方便处理;③如何压缩图像数据以便存储和传输。 • 图像的数字化图像的数字化是指将一幅图像从原来的形式转化为数字的形式,主要研究如何对图像进行采样、量化以及编码等过程。 • 图像编码压缩图像编码压缩可减少用于描述图像的数据量,以节省图像传输和处理的时间,减少存储容量。
图像变换由于图像阵列很大,直接在空间域中进行处理涉及的计算量很大。因此,往往采用各种图像变换方法,如傅立叶变换(DFT)、离散余弦变换(DCT)、离散小波变换(DWT)等间接处理技术,将空间域的处理转换为变换域的处理,不仅可以减少计算量,而且可获得更有效的处理。图像变换还包括传统的几何变换,如图像缩放、旋转、平移、投影等。图像变换由于图像阵列很大,直接在空间域中进行处理涉及的计算量很大。因此,往往采用各种图像变换方法,如傅立叶变换(DFT)、离散余弦变换(DCT)、离散小波变换(DWT)等间接处理技术,将空间域的处理转换为变换域的处理,不仅可以减少计算量,而且可获得更有效的处理。图像变换还包括传统的几何变换,如图像缩放、旋转、平移、投影等。 • 图像重构(Image Reconstruction) 采用某种滤波方法,如去除噪声、干扰和模糊等,恢复或重建原来的图像。
8.2 图像与图像数字化过程 • 8.2.1 图像的表示当我们从某点观察某一景象时,物体所发出的光线(发光物的辐射光或物体受光源照射后反射或透射的光)进入人眼,在人眼的视网膜上成象,这就是人眼所看到的客观世界,我们称之为景象。这个“象”反映了客观景物的亮度和颜色随空间位置和方向的变化,因此“象”是空间坐标的函数。视网膜成像是一种自然生理现象,人类文明发展到一定时期才意识到它的存在,并设法用各种手段将其记录下来,这种记录下来的各种各样的“象”称为图像。
图像是人类用来表达和传递信息的最重要手段。现代图像既包括可见光范围的图像(能被人眼观察到的各种图像),也包括不可见光范围内借助于适当转换装置转换成人眼可见的图像(如红外成像技术)。还包括视觉无法观察的其他物理图像和空间物体图像,以及由数学函数和离散数据所描述的连续或离散图像。在空间图像信息中,光强度是其基本要素,它随图像空间坐标(x,y,z)及光线的波长λ和时间t的变化而变化,因此空间图像函数可表示为:
二维平面图像隐式地包含着景深z的信息,它以x和y的某种函数的形式,即z=f(x,y),隐含在x,y平面之中。因此平面图像同样可表示为:二维平面图像隐式地包含着景深z的信息,它以x和y的某种函数的形式,即z=f(x,y),隐含在x,y平面之中。因此平面图像同样可表示为: 在大多数情况下,要采用离散的技术来处理来自连续世界的图像。实际图像是连续的,计算机只能处理离散的数字图像,所以对连续图像要经过采样和量化以获取离散的数字图像。
8.2.2 图像数字化概述 现实中的图像是一种模拟信号。图像数字化的目的是把真实的图像转变成计算机能够接受的显示和存储格式,以便于计算机进行分析处理。 图像的数字化过程分为采样、量化与编码三步。采样的实质就是要用多少个点来描述一张图像,采样的结果即通常所说的图像分辨率。如,一幅640×480的图像,表示这幅图像由307200个像素点组成。采样频率是指一秒钟内采样的次数,它反映了采样点之间的间隔大小。采样频率越高,得到的图像样本就越细腻逼真,图像的质量也越高,但要求的存储量也越大。
量化是指要使用多大范围的数值来表示图像采样之后的每一个点。量化的结果是图像能够容纳的颜色总数,它反映了采样的质量。如,若以4位来存储一个点,图像表示只能有16种颜色。若采用16位存储一个点,则有2的16次方=65536种颜色。所以,量化位数越大,表示图像可拥有更多的颜色,自然可产生更为细致的图像效果,但也会占用更大存储空间。 假设有一幅黑白照片,因为它在水平与垂直方向上的灰度变化都是连续的,可认为有无数个像素,而且任一点上灰度的取值都是从黑到白可以有无限个可能值。通过沿水平和垂直方向的等间隔采样可将一幅模拟图像分解为近似的有限个像素,每个像素的取值代表该像素的灰度(亮度),对灰度进行量化,使其取值变为有限个值。通常采用256级均匀量化(也称8比特量化)已能得到优质的图像。
经过这样采样和量化得到的一幅空间上表现为离散分布的有限个像素,灰度取值上表现为有限个离散的可能值的图像称为数字图像。只要水平与垂直方向采样点数N和M足够多,量化比特数足够大,则数字图像的质量比原始模拟图像毫不逊色。 在采样与量化处理后,才能产生一张数字化的图像,再运用计算机图像处理软件的各种技巧,对图像进行处理、修饰或转换,达到所需要的图像效果。
8.2.3 图像的采样计算机要感知图像,就要把图像分割成离散的小区域,即像素。像素是计算机系统生成和再现图像的基本单位,像素的亮度、色彩等特征通过特定的数值来表示。数字化图像的形成是计算机使用相应的软硬件技术把许多像素点的特征数据组织成行列,整齐地排列在一个矩形区域内,形成计算机可识别的图像。 图像采样就是将二维空间上模拟的连续亮度(即灰度)或色彩信息,转化为一系列有限的离散数值来表示。由于图像是一种二维分布的信息,所以具体的作法是对图像在水平方向和垂直方向上等间隔地分割成矩形网状结构,所形成区域,称之为像素点。被分割的图像若水平方向有M个间隔,垂直方向上有N个间隔,则一幅图像画面就被表示成MN个像素构成的离散像素点的集合(如图8.16)。MN表示图像分辨率。
图8.16 图像采样就是在水平和垂直方向上等间隔地分割成网状
在进行采样时,采样点间隔的选取很重要。它决定了采样后的图像是否能真实地反映原图像的程度(如图8.17所示)。一般说来,原图像中的画面越复杂,色彩越丰富,则采样间隔应越小。由于二维图像的采样是一维的推广,根据信号的采样定理,要从取样样本中精确地复原图像,我们可得到图像采样的奈奎斯特(Nyquist)定理:图像采样的频率必须大于或等于源图像最高频率分量的两倍。在进行采样时,采样点间隔的选取很重要。它决定了采样后的图像是否能真实地反映原图像的程度(如图8.17所示)。一般说来,原图像中的画面越复杂,色彩越丰富,则采样间隔应越小。由于二维图像的采样是一维的推广,根据信号的采样定理,要从取样样本中精确地复原图像,我们可得到图像采样的奈奎斯特(Nyquist)定理:图像采样的频率必须大于或等于源图像最高频率分量的两倍。
16×16像素(256色) 8×8 像素 (256色) 32×32像素 (256色) 64×64像素 (16位量化,65536种颜色) 图8.17 不同采样精度所获得的图像分辨率不同
8.2.4 图像量化采样后得到的亮度或色彩值在取值空间上仍是连续值。把这些连续量表示的像素值离散化为整数值的操作叫量化。图像量化实际就是将图像采样后的样本值的范围分为有限多个区域,落入某区域中的所有样本值用同一值表示,是用有限的离散数值量来代替无限的连续模拟量的一种映射操作。 把图像颜色(黑白图像为灰度)取值范围分成K个子区间,在第i个区间中取某确定的色彩值Gi,落在第i个区间中的任何色彩值都以Gi代替,这样就有K个不同色彩值,即颜色值的取值空间被离散化为有限个数值。 量化时所确定的离散取值个数称为量化级数,表示量化的色彩或亮度值所需的二进制位数称为量化字长。一般可用8位、16位、24位或更高的量化字长来表示图像的颜色(如图8.18)。量化字长越大,越能真实反映原有图像的颜色。但得到的数字图像容量也越大。
2 bit (4色) 5 bit(32色) 4 bit (16色) 3 bit (8色) 1 bit (2色) 图8.18 不同量化字长的灰度图象效果
8.2.5 图像的编码与压缩 数字化后得到的图像数据量巨大,必须采用编码技术压缩信息的比特量。一定意义上讲,编码压缩技术是实现图像传输与存储关键。 图像的预测编码是将图像数据的空间变化规律和序列变化规律用一个预测公式表示,知道了某一像素前面各相邻像素值后,可用公式预测该像素值。采用预测编码一般只需传输图像数据起始值和预测误差。 变换编码方法是将整幅图像分成一个个小数据块,再将这些数据块经过变换、量化和编码。图像显示时再经过逆变换可重构原来图像。 除了常见的压缩编码外,目前又出现了新的编码方法,如分形编码、小波变换图像压缩编码等,使图像的压缩率进一步提高。
8.3 图像处理中的色彩学知识 • 8.3.1认识色彩在现实世界中,大自然赋予万物以绚丽的色彩,给人们以美的感受。颜色是图像至关重要的组成部分。 色彩始于光,也源于光。1672年牛顿用三棱镜将太阳光(白光)分解成红、橙、黄、绿、青、蓝、紫(品红)顺序排列渐变的彩带, 这种现象称作色散(dispersion)。
一般的光源是由不同波长的单色光混合而成的复色光。所谓“单色光”是指白光或太阳光经三菱镜折射所分离出的光谱色光:红、橙、黄、绿、蓝、靛、紫等七个颜色,因为这种被分解的色光,即使再一次通过三菱镜也不会再分解为其他的色光,所以将这种不能再分解的色光叫做单色光;而由“单色光”所混合的光称为“复色光”。自然界中的太阳光及人工制造的一些光源所发出的光都是复色光。 人眼根据光线的波长来感觉颜色,有色物体对光线具有选择性吸收的特性,即光线照射到有色物体上时,入射光中被吸收的各种波长的色光是不等量的,有的被多吸收,有的被少吸收。
包含全部颜色光谱的光是白色,白光照射到有色物体上,其反射或透射的光线与入射光线相比,不仅亮度有所减弱,光谱成分也改变了,因而物体呈现出各种不同的颜色。当没有光线时,人眼感觉的颜色是黑色的。色彩的产生主要是因为人眼接收来自物体表面或内部对于光源的反射或透射,因此色彩是由光、物体特性与人眼视觉机构等三大因素所涵盖,色彩可用亮度,色调和饱和度来描述,人眼所看到的任一色彩都是这三个特性的综合效果,下面介绍几种常用的颜色模式。包含全部颜色光谱的光是白色,白光照射到有色物体上,其反射或透射的光线与入射光线相比,不仅亮度有所减弱,光谱成分也改变了,因而物体呈现出各种不同的颜色。当没有光线时,人眼感觉的颜色是黑色的。色彩的产生主要是因为人眼接收来自物体表面或内部对于光源的反射或透射,因此色彩是由光、物体特性与人眼视觉机构等三大因素所涵盖,色彩可用亮度,色调和饱和度来描述,人眼所看到的任一色彩都是这三个特性的综合效果,下面介绍几种常用的颜色模式。