1.43k likes | 1.75k Views
第 7 章 图像分割(上). 前面主要讲述的是图像预处理方面的知识 在本章以及第 8 章主要介绍图像分析的问题,即着眼于找出图像中哪些事物,也即是模式识别问题,主要从统计模式识别来讲. 统计模式识别. 统计模式识别,应用最广 认为图像可能包含一个或多个物体,并且每个物体属于若干事先定义的类型、范畴或模式类别之一. “ Bar”. 图像分割. 特征抽取. 分类. 输入图像. 物体图像. 特征矢量. 物体类型. 对于给定的一幅含有多个物体的数字图像,模式识别的过程由三个阶段组成,如图所示. 检测出各种物体,并把他们的图像和其余景物分离.
E N D
第7章 图像分割(上) • 前面主要讲述的是图像预处理方面的知识 • 在本章以及第8章主要介绍图像分析的问题,即着眼于找出图像中哪些事物,也即是模式识别问题,主要从统计模式识别来讲
统计模式识别 • 统计模式识别,应用最广 • 认为图像可能包含一个或多个物体,并且每个物体属于若干事先定义的类型、范畴或模式类别之一
“Bar” 图像分割 特征抽取 分类 输入图像 物体图像 特征矢量 物体类型 • 对于给定的一幅含有多个物体的数字图像,模式识别的过程由三个阶段组成,如图所示 检测出各种物体,并把他们的图像和其余景物分离 对物体进行度量,即对物体进行定量分析估计 输出仅仅是一种决策,确定每个物体应该归属的类别
图像分割介绍 对应单个区域和多个区域 灰度、颜色、纹理 • 定义 将图像分成各具特性的区域,并提取出感兴趣目标的技术和过程 图像处理过渡到图像分析的关键步骤,也是一种基本的计算机视觉技术 借助集合概念进行正式的定义: 令R代表整个图像区域,对R的分割可看做将R分成若干个满足以下条件的非空子集(子区域)R1,R2,R3…Rn
分割所得到的全部子区域的总和(并集)应能包括图像中所有象素,或者说分割应将图像中的每个象素都分进某1个子区域中分割所得到的全部子区域的总和(并集)应能包括图像中所有象素,或者说分割应将图像中的每个象素都分进某1个子区域中 分割准则应可适用于所有区域和象素 (1) ∪i=1nRi=R 各个子区域是互不重叠的,或者说1个象素不能同时属于2各区域 (2) 对所有的i和j,i≠j,有Ri∩Rj=φ 在分割后得到的属于同1个区域中的象素应该具有某些相同特性 分割准则应能帮助确定各区域象素有代表性的特性 (3) i=1,2…n,有P(Ri)=TRUE (4) 对i≠j,有P(Ri∪Rj)=FALSE 在分割后得到的属于不同区域中的象素应该具有一些不同的特性 (5) 对i=1,2…n,Ri是连通的区域 要求同1个子区域内的象素应当是连通的
图像分割方法分类 • 基于阈值的分割-通过阈值对不同物体进行分割 • 基于边缘的分割-先确定边缘象素,并把它们连接在一起,以构成所需的边界 • 基于区域的分割-把各象素划归到各个物体或区域中 • 基于运动的分割-通过视频物体运动进行分割
基于阈值的分割 • 图像阈值分割是一种广泛应用的分割技术,利用图像中要提取的目标物与其背景在灰度特性上的差异,把图像视为具有不同灰度级的两类区域(目标和背景)的组合,选取一个合适的阈值,以确定图像中每个象素点应该属于目标还是背景区域,从而产生相应的二值图像 可以大量压缩数据,减少存储容量,而且能大大简化其后的分析和处理步骤
1 f(x,y)≥t 1 f(x,y)≤t g(x,y)= g(x,y)= 0 f(x,y)<t 0 f(x,y)>t 1 t1≤f(x,y)≤t2 g(x,y)= 0 其它 但是,它对物体与背景具有较强对比的景物的分割很有效,而且总能用封闭连通的边界定义不交叠的区域 设原始图像f(x,y),以一定的准则在f(x,y)中找出一个合适的灰度值,作为阈值t,则分割后的图像g(x,y),可由下式表示: 或 另外,还可以将阈值设置为一个灰度范围[t1,t2],凡是灰度在范围内的象素都变为1,否则皆变为0,即
f(x,y) f(x,y)≥t g(x,y)= 0 其它 ZE f(x,y)∈Z g(x,y)= ZB其它 某种特殊情况下,高于阈值t的象素保持原灰度级,其它象素都变为0,称为半阈值法,分割后的图像可表示为: 阈值分割图像的基本原理,可用下式表示: 阈值 阈值的选取时阈值分割技术得关键,如果过高,则过多的目标点被误归为背景;如果阈值过低,则会出现相反的情况
由此可见,阈值化分割算法主要有两个步骤: 1、确定需要的分割阈值 2、将分割阈值与象素值比较以划分象素 在利用阈值方法来分割灰度图像时一般都对图像有一定的假设。基于一定的图像模型的。 最常用的模型: 假设图像由具有单峰灰度分布的目标和背景组成,处于目标或背景内部相邻象素间的灰度值是高度相关的,但处于目标和背景交界处两边的象素在灰度值上有很大的差别。 如果一幅图像满足这些条件,它的灰度直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合构成的。
阈值选取方法 • 直方图阈值分割法 • 类间方差阈值分割法 • 二维最大熵值分割法 • 模糊阈值分割法
直方图阈值分割 • 简单直方图分割法 • 最佳阈值
简单直方图分割法 图像的灰度级范围为0,1,…l-1,设灰度级i的象素数为ni,则一幅图像的总象素N为 N=∑i=0l-1ni 灰度图像的直方图 灰度级i出现的概率定义为: pi=ni/N 反映一幅图像上灰度分布的统计特性,成为利用象素灰度作属性的分割方法的基础
P 暗 Z1 Zi Zt Zj Zk 亮 B1 B2 背景 目标 60年代中期,Prewitt提出了直方图双峰法,即如果灰度级直方图呈明显的双峰状,则选取两峰之间的谷底所对应的灰度级作为阈值。
注意:应用灰度直方图双峰法来分割图像,也需要一定的图像先验知识,因为同一个直方图可以对应若干个不同的图像,直方图只表明图像中各个灰度级上有多少个象素,并不描述这些象素的任何位置信息。注意:应用灰度直方图双峰法来分割图像,也需要一定的图像先验知识,因为同一个直方图可以对应若干个不同的图像,直方图只表明图像中各个灰度级上有多少个象素,并不描述这些象素的任何位置信息。 该方法不适合直方图中双峰差别很大或双峰间的谷比较宽广而平坦的图像,以及单峰直方图的情况。 70年代初,研究工作集中在直方图变换,但无论是直方图还是直方图变换法都仅仅考虑了直方图灰度信息而忽略了图像的空间信息
最佳阈值 • 所谓最佳阈值是指图像中目标物与背景的分割错误最小的阈值 设一幅图像只由目标物和背景组成,已知其灰度级分布概率密度分布为P1(Z)和P2(Z),且已知目标物象素占全图象素数比为θ,因此,该图像总的灰度级概率密度分布P(Z)可用下式表示: P(Z)= θP1(Z)+(1-θ)P2(Z) 假定阈值为Z,认为图像由亮背景上的暗物体所组成,即灰度小于Z的位目标物,大于Z的为背景
P1(Z) P2(Z) 目标物 背景 Zt 如图所示,如选定Zt为分割阈值,则将背景象素错认为是目标物象素的概率为: E1(Zt)=∫-∞ZtP2(Z)dZ 将目标物象素错认为是背景象素的概率为: E2(Zt)=∫zt ∞ P1(Z)dZ 因此,总的错误概率E(Z)为: E(Zt)=(1-θ)E1(Zt)+ θ E2(Zt)
最佳阈值就是使E(Zt)为最小值时的Zt,将E(Zt)对Zt求导,并令其等于0,解出其结果为:最佳阈值就是使E(Zt)为最小值时的Zt,将E(Zt)对Zt求导,并令其等于0,解出其结果为: θP1(Zt)=(1- θ)P2(Zt) 设P1(Zt)和P2(Zt)均为正态分布函数,其灰度均值分别为μ1和μ2,对灰度均值得标准偏差分别为σ1和σ2,即
将上两式代入,且对两边求对数,得到: 简化为: AZt2+BZt+C=0 上式是Zt的一个二次方程式,有两个解,因此,要使分割误差最小,需要设置两个阈值,即上式的两个解。如果设σ2= σ12 = σ22,即方差相等,则上式方程存在唯一解,即:
P1(Z) P2(Z) P E2(Zt) E1(Zt) Zt Z 如果设θ=1- θ,即θ=1/2时, 从前面可以看出,假如图像的目标物和背景象素灰度级概率呈正态分布,且偏差相等(σ12 = σ22),背景和目标物象素总数也相等(θ=1/2),则这个图像的最佳分割阈值就是目标物和背景象素灰度级两个均值得平均
类间方差阈值分割 • 这是由Ostu提出的最大类间方差法,又称为大津阈值分割法,是在判决分析最小二乘法原理的基础上推导得出的 具体算法: 设原始灰度图像灰度级为L,灰度级为i的象素点数为ni,则图像的全部象素数为 N=n0+n1+…+nL-1
归一化直方图,则 pi=ni/N,∑i=0L-1pi=1 按灰度级用阈值t划分为两类:C0=(0,1,..t)和C1=(t+1,t+2,…L-1),因此,C0和C1类的类出现概率及均值层分别由下列各式给出 其中:
可以看出,对任何t值,下式都能成立: C0和C1类的方差可由下式求得: 定义类内方差为: 类间方差为: 总体方差为:
引入关于t的等价判决准则: 类间/类内 三个准则是等效的,把使C0,C1两类得到最佳分离的t值作为最佳阈值,因此,将λ(t)、η(t)、κ(t)定义为最大判决准则。 由于σw2是基于二阶统计特性,而σB2是基于一阶统计特性,它们都是阈值t的函数,而σT2与t值无关,因此三个准则中η(t)最为简单,因此选其作为准则,可得到最佳阈值t*
二维最大熵阈值分割 • 一维最大熵阈值分割 • 二维最大熵阈值分割
一维最大熵阈值分割 • 熵是平均信息量的表征 • 原理 根据信息论,熵的定义为: H=-∫-∞+ ∞p(x)lgp(x)dx 所谓灰度的一维熵最大,就是选择一个阈值,使图像用这个阈值分割出的两部分的一阶灰度统计的信息量最大。
pi B O i t 设ni为数字图像中灰度级i的象素点数,pi为灰度级i出现的概率,则 pi=ni/(N×N), i=1,2…L 图像灰度直方图如图所示: O区概率分布: pi/pt i =1,2…t B区概率分布: pt=∑i=1tpi pi/(1-pt) i =t+ 1,t+2…L 其中: 对于数字图像,目标区域和背景区域的熵分别定义为:
熵函数定义为: 当熵函数取最大值时对应的灰度值t*就是所求的最佳阈值,即
二维最大熵阈值分割 基于 灰度信息,没有利用空间信息 一维最大熵 直方图 信噪比降低 分割效果差 在图像特征中,点灰度是最基本的特征,但它对噪声敏感,区域灰度特征包含了部分空间信息,且对噪声的敏感程度低于点灰度特征 利用图像点灰度和区域灰度均值得二维最大熵阈值法 综合利用点灰度特征和区域灰度特征,可以较好的表征图像的信息
具体方法如下: 首先以原始灰度图像(L个灰度级)中各象素及其4邻域的4个象素为一个区域,计算出区域灰度均值图像(L个灰度级),这样原始图像中的每个象素都对应一个点灰度-区域灰度均值对,这样的数据对存在L×L种可能的取值 设ni,j为图像中点灰度为i及其区域灰度均值为j的象素点数,pi,j为点灰度-区域灰度均值对(i,j)发生的概率,则 pi,j=ni,j/(N×N) {pi,j}就是该图像关于点灰度-区域灰度均值得的二维直方图
点灰度-区域灰度均值对(i,j)的概率高峰主要分布在XOY平面的对角线附件,并且在总体上呈现双峰和一谷状态点灰度-区域灰度均值对(i,j)的概率高峰主要分布在XOY平面的对角线附件,并且在总体上呈现双峰和一谷状态 这是由于图像的所有象素中,目标点和背景点所占比例最大,而目标区域和背景区域内部象素灰度级比较均匀,点灰度及其区域灰度均值相差不大,所以都集中在对角线附近,两个峰分别对应于目标和背景,远离XOY平面对角线的坐标处,峰的高度急剧下降,这部分所反映的是图像中的噪声点、边缘点和杂散点
二维直方图的XOY平面图 目标 边界 噪声 背景 在A区和B区上用点灰度-区域灰度均值二维最大熵法确定最佳阈值,使真正代表目标和背景的信息量最大 设A区和B区各自具有不同的概率分布,用A区和B区的后验概率对各区域的概率pi,j进行归一化处理,以使分区熵之间具有可加性。如果阈值设在(s,t),则
PA=∑i∑jpi,j,i=1,2…s,j=1,2…t PB=∑i∑jpi,j,i=s+1,s+2…L,j=t+1,t+2…L 定义离散二维熵为: H=-∑i∑jpi,jlgpi,j 则A区和B区的二维熵分别为: 其中:
由于C区和D区包含的是关于噪声和边缘的信息,所以将其忽略不计,即假设C区和D区的pi,j≈0。C区: i=s+1,s+2,…L;j=1,2…t。D区:i=1,2,…s;j=t+1,t+2…L,可以得到: PB=1-PA HB=HL-HA HL=-∑i∑jpi,jlgpi,j i=1,2…L,j=1,2,…L 则: H(B)=lg(1-PA)+(HL-HA)/(1-PA)
熵的判别函数定义为: 选取的最佳阈值向量(s*,t*)满足:
模糊阈值分割 • 思路:先将一幅图像看作一个模糊阵列,然后通过计算图像的模糊概率或模糊熵来确定阈值 按照模糊子集的概率,可以将一幅M行,N列,且具有L个灰度级的数字图像X看作为一个模糊点阵,μ是定义在该L个灰度级上的资格函数,象素(m,n)灰度值为xm,n。根据信息论的基本理论,可得到图像X的模糊率V(x)和模糊熵E(x)
模糊率V(x)从数量上定义了图像X在μ资格函数下所呈现的模糊性的大小。直观的看,当μ(xm,n)=0.5时,V(x)和E(x)都取得了最大值,偏离该值时,V(x)和E(x)将下降。模糊率V(x)从数量上定义了图像X在μ资格函数下所呈现的模糊性的大小。直观的看,当μ(xm,n)=0.5时,V(x)和E(x)都取得了最大值,偏离该值时,V(x)和E(x)将下降。 模糊率V(x)从数量上定义了图像X在μ资格函数下所呈现的模糊性的大小。直观的看,当μ(xm,n)=0.5时,V(x)和E(x)都取得了最大值,偏离该值时,V(x)和E(x)将下降。 若直接从数字图像的直方图考虑,前两式可改写为: f(l)表示灰度值取l的象素点之和。 下面我们通过模糊率V(x)进行阈值选择,同样采用模糊熵E(x)也能得到同样的结论
μ 1 S 0 p r x 在模糊阈值算法中,资格函数对分割结果影响较大,常见的资格函数主要有以下几种: (1)Zadeh标准S函数,如图所示 其中:q=(p+r)/2;△q=r-q=q-p;定义c=r-p=2 △q
μ 1 0 p q x (2)具有升半柯西分布形式的资格函数,如图所示 其中:K>0
μ 1 0 p q x (3)线性资格函数,如图所示 资格函数使原始图像模糊化,如选用S函数作为资格函数,对每一个q值,通过资格函数μ计算出相应的图像模糊率V(q)。图像的模糊率反映了该图像与一二值图像的相似性
对于原始图像目标,背景呈现双峰分布的直方图,对应的V(x)图形也具有双峰,这时总存在一个q0值,其对应的模糊率V(q0)值,即为图像分割的最佳阈值。对于原始图像目标,背景呈现双峰分布的直方图,对应的V(x)图形也具有双峰,这时总存在一个q0值,其对应的模糊率V(q0)值,即为图像分割的最佳阈值。 一般情况下,图像的直方图较为复杂,峰谷不明显,相应的V(q)图可能有多个谷底,这时可选取V(q)所有极小值中的最小值所对应的q作为阈值
基于边缘的分割 • 先检测不连续的点,然后将点连接成边界 • 点检测 • 线检测 • 边缘检测 无论哪种方法,其处理过程为 R = w1z1+w2z2+…+w9z9 = S wkz 其中 zk是与模板系数wk相联系的灰度级象素 R代表模板中心象素的值 w1 w2 w3 w4 w5 w6 w7 w8 w9
点检测 • 通过下面模板,检测图像中孤立的点 -1 -1 -1 -1 8 -1 -1 -1 -1
线检测 • 设R1, R2, R3, and R4为下图中从左到右的模板中心象素值 • 假设所有的模板都同时对一幅图像进行操作 • 如果在图像中某个象素点存在, |Ri| > |Rj|,对所有的 j ≠ i,则可以说该点与模板I的方向最接近 -1 -1 -1 -1 -1 2 -1 2 -1 2 -1 -1 2 2 2 -1 2 -1 -1 2 -1 -1 2 -1 -1 -1 -1 2 -1 -1 -1 2 -1 -1 -1 2 水平 + 45O垂直 - 45O
哈夫变换 • 哈夫变换-利用图像全局特性而直接检测目标轮廓,即可将边缘象素连接起来组成区域封闭边界的常见方法 如果预先知道区域形状,利用哈夫变换可方便的得到边界曲线,而将不连续的边缘象素点连接起来 主要优点:受噪声和曲线间断的影响较小
基本思想:点-线的对偶性。图像变换前在图像空间,变换后在参数空间基本思想:点-线的对偶性。图像变换前在图像空间,变换后在参数空间 • 基本原理 设在原始图像空间(x,y),直线方程为 而对于这个直线上的任意点pi=(xi,yi)来说,它在由斜率和截距组成的变换空间(u,v)中应满足方程式
为了避免垂直直线的无限大斜率问题,往往采用极坐标(ρ,θ)作为变换空间,其极坐标方程可写为 参量ρ和θ可以唯一确定一条直线,ρ表示原点到直线的距离,θ表示该直线的法线于x轴的夹角,对于(x,y)空间点的任一点(xi,yi)采用极坐标(ρ,θ)作为变换空间,其变换方程为 这表明原图像空间中的一点(xi,yi)对应于(ρ,θ)空间中的一条正弦曲线,其初始角和幅值随xi和yi的值而变
Q qmax 0 A(p,q) P P qmin pmax pmin 0 在具体计算时需要在参数空间PQ中建立一个2-D的累加数组。设这个累加数组为A(p,q),如图所示,其中[pmin,pmax]和[qmin,qmax]分别为预期的斜率和截距的取值范围。 开始时设置数组A为0,然后对每个图像空间中的给定边缘点,让p取遍P轴上所有的可能值,并根据q=-px+y算出对应的q。 再根据p和q的值(都已整数化),对A进行累加:A(p,q)=A(p,q)+1。累加结束后,根据(p,q)的值就可知道有多少点是共线的,即A(p,q)的值就是在(p,q)处共线点的个数,同时(p,q)值也给出了直线方程的参数,即给出来点所在的线 注意:这里空间点共线统计的准确性是由累加数组的尺寸决定的。