610 likes | 788 Views
数字图像处理 (Digital Image Processing ). 数字图像处理与模式识别研究所. 第三章 常用的数学变换. 3.1 引言 3.2 空域变换 3.3 离散傅立叶变换 3.4 离散余弦变换 3.5 KL 变换 3.6 其他正交变换. 3.1 引言. 图像的数学变换的特点在于其有精确的数学背景,是许多图像处理技 术的基础。在这些变换中,一种是在空间域上进行的,这些变换根据处理 操作的特点,可以分为图像的代数运算和几何运算,它们都是利用对输入 图像进行加工而得到输出图像。另一种重要的数学变换则是将原定义在图
E N D
数字图像处理(Digital Image Processing) 数字图像处理与模式识别研究所
第三章 常用的数学变换 3.1 引言 3.2 空域变换 3.3 离散傅立叶变换 3.4 离散余弦变换 3.5 KL变换 3.6 其他正交变换
3.1 引言 图像的数学变换的特点在于其有精确的数学背景,是许多图像处理技 术的基础。在这些变换中,一种是在空间域上进行的,这些变换根据处理 操作的特点,可以分为图像的代数运算和几何运算,它们都是利用对输入 图像进行加工而得到输出图像。另一种重要的数学变换则是将原定义在图 像空间的图像以某种形式转换到另外一些空间,并利用输入图像在这些空 间的特有性质有效而快速地对图像进行处理和分析。最典型的变换有离散 傅立叶变换,它把空域中的图像信号看作二维时间序列,将其变换到频率 域来分析图像的频谱特性。 空域变换有如加法、减法等的代数变换,也有如旋转、拉伸等的几何变 换;频域变换除了傅立叶变换外,常用的非空域的变换还有离散余弦变换、 PCA变换等等。无论是在空域中的数学变换还是频域中的数学变换,它们 在图像分析、滤波、增强、压缩等处理中都有着非常典型而重要的应用。
3.2 空域变换 1. 代数变换 图像的代数变换是指对两幅图像进行点对点的四则运算而得到一幅新的 输出图像。图像的代数运算在图像处理中有着广泛的应用,它除了可以实现 自身所需要的算术操作,还能为许多复杂的图像处理提供准备。 1)加法运算 2)减法运算(差分)
+ =
— =
线性变换 非线性变换 3)其他灰度变换 灰度变换的变换函数曲线如下图:
255 0 255 (1) 图象求反
255 0 255 (3) 动态范围压缩
2. 几何变换 图像在生成过程中,由于系统本身具有非线性或拍摄角度不同,会使生 成的图像产生几何失真。几何失真一般分为系统失真和非系统失真。系统失 真是有规律的、能预测的;非系统失真则是随机的。 几何变换可以改变图像中物体之间的空间关系。这种运算可以看成是图 像内的各物体在图像内移动的过程。例如,物体的转动、扭曲、倾斜、拉伸 等等,都是几何运算的结果。如下图:
1)平移 2)放缩
y 0,0 x 3)旋转
y 0,0 x 4)水平镜像
y 0,0 x 5)垂直镜像
C C A B F A F B D D 6)一般的几何变换 下图显示了在失真和相应的校正图像中的四边形区域,四边的顶点是相 应的“控制点”。假设四边形区域中的几何形变过程用双线性方程对来建模, 即:
7)几何变换中灰度插值 对图像作定量分析时,就要对失真的图像进行几何校正(即将存在几 何失真的图像校正成无几何失真的图像),以免影响分析精度。基本方 法是先建立几何校正的数学模型;其次利用已知条件确定模型参数;最后 根据模型对图像进行几何校正。通常分为两步: (1) 图像空间的坐标变换; (2) 确定校正空间各象素的灰度值。 输出象素通常被映射到输入图像中的非整数位置,即位于四个输入象 素之间。因此,为了决定与该位置相对应的灰度值,必须进行插值运算。 常用的插值方法有3种: (1) 最近邻插值(Nearest Neighbor Interpolation) (2) 双线性插值(Bilinear Interpolation) (3) 三次立方插值
(1) 最近邻插值(Nearest Neighbor Interpolation) 最简单的插值方法是最近邻插值,即选择离它所映射到的位置最近的 输入象素的灰度值为插值结果。数学表示为: (2) 双线性插值(Bilinear Interpolation) 双线性插值法是对最近邻法的一种改进,即用线性内插方法,根据点 的四个相邻点的灰度值,分别在x和y方向上进行两次线性插值插值。如下 图:
首先,在x方向上作线性插值,对上端的两个顶尖进行线性插值得: 类似的,对于底端两个顶点进行线性插值有: y方向上作线性插值,以确定: 最后得到双线性插值公式为:
(3) 三次立方插值 该方法利用三次多项式 来逼近理论上的最佳插值函数 ,其 数学表达式为: 上式中的是周围象素沿方向离原点的距离。待求象素的灰度值由其周 围16个点的灰度值加权内插得到。可推导出待求象素的灰度值计算式为: 其中:
.2 .1 0 1 2 三次立方插值原理图 S(x) 0 (i.1,j.1) (i.1,j+2) (i,j+1) (i,j) v u (x,y) x (i+1,j) (i+1,j+1) (i+2,j+2) (i+2,j.1)
3.3 离散傅立叶变换 1.连续傅立叶变换 1)1D傅立叶变换定义 傅立叶变换: 傅立叶反变换: 函数f(x)的傅立叶一般情况下是一个复数量,可以表示为: 写成指数形式: 其中: 称|F(ω)|为f(x)的傅立叶幅度谱,而Φ(ω)为相位谱。
2)2D傅立叶变换 傅立叶变换可推广到二维函数。如果二维函数f(x,y)满足狄里赫莱条件,那么存在下面的二维傅立叶变换对: 类似于一维傅立叶变换,二维傅立叶变换的幅度谱和相位谱:
2.离散傅立叶变换 如果x(n)为一数字序列,0≤n≤N-1,则其离散傅立叶变换定义如下: 二维离散傅立叶变换: 其中,u,m均取0,1,…,M-1;v,n均取0,1,…,N-1; W1=exp(-j2π/M);W2=exp(-j2π/N))。
3.离散傅立叶变换的性质 傅立叶变换有许多重其要的性质,这些性质为实际应用提供了诸多便利。下面以二维傅立叶变换为例,介绍几个主要的性质。 1)可分离性 令: 则:
2)线性 傅立叶变换是线性变换,满足线性变换的叠加性: 3)共轭对称性 如果F(u,v)是f(x,y)的傅立叶变换,F*(-u,-v)是傅立叶变换的共轭函数,那么: 4)旋转性 如果空间域函数旋转的角度为θ0,那么在变换域中此函数的傅立叶变换也旋转同样的角度,即:
5)比例变换性 如果如果是的傅立叶变换,a和b是两个标量,那么: 6)Parseval定理 这个性质也称为能量保持定理。如果F(u,v)是f(x,y)的傅立叶变换,那么有下式成立: 这个性质说明变换前后的能量保持不变。
7)相关定理 两个二维函数f(x,y),g(x,y)的相关函数定义如下: 符号“ο”表示相关运算。傅立叶变换的一个重要性质是相关定理: 8)卷积定理 两个二维函数f(x,y),g(x,y)的卷积运算定义如下: 符号“*”表示卷积运算。根据上面的定义,傅立叶变换的卷积定理如下:
4. 快速傅立叶变换 1965年,库利—图基提出把原始的N点序列依次分解成一系列短序 列,然后求出这些短序列的离散傅立叶变换,以此来减少乘法运算,这 就是快速傅立叶变换(Fast Fourier Transform,FFT)。 对于一个有限长序列{x(n)},0≤n≤N-1, ,按n的奇偶把x(n) 分解为两个N/2点的子序列: 其傅立叶变换为:
前一半的值 后一半的值
点DFT 点DFT 一次分解后 的运算量: 复乘: 复加:
点 DFT 点 DFT 点 DFT 点 DFT 每个 点DFT 分解成两个 点DFT。
所需的 运算量: 第一级 第二级 第三级
上面称为DIT-FFT算法。也可以在频域进行分解,相应算法是DIF-FFT,其蝶形分解图如下:上面称为DIT-FFT算法。也可以在频域进行分解,相应算法是DIF-FFT,其蝶形分解图如下:
5. 离散傅立叶变换的显示 下图是一个图的DFT频谱图:
离散傅立叶变换对称平移方法 离散傅立叶变换对称平移后频谱 离散傅立叶变换的显示——对称平移后
Jean Buptiste Joseph Fourier和他的付立叶变换 (a)输入图像 (b)幅值谱 (c)相位谱 (d)由幅值谱重构的图象 (e)由相位谱重构的图象 结论:相位谱可能具有更重要的应用
3.4 离散余弦变换 • 1D离散余弦变换的正变换 • 余弦变换为: • 其中, • 反变换为:
2. 2D离散余弦变换的正变换 • 正变换为: • 其中, • a(v)与a(u)定义类似。 • 反变换为:
二维DCT基图像 3. 2D DCT基图像
3.5 KL变换 1. 离散KL变换 KL(Karhunen-Loeve)或(DKT),也称为Hotelling变换、特征向 量变换(Eigenvector-Based Transform)、主分量(PCA)变换等。 它是一种利用图像的统计性质/统计模型的变换。常用在数据压缩、特 征提取等方面。 1)定义 设图像f NN (x,y),采样了M次,得到集合 {fi(x,y),i=1,2,…,M}。对每个 图像按行或按列依次排列,得采样图像:Xi=(xi1,xi2,…,xiN2)T,则有: Mx为均值向量: Mx=E{X}, CX为协方差矩阵:CX=E{(X-Mx)(X-Mx)T}, 近似表示:
令ei,i, i=1,2,…,N2分别表示矩阵的特征矢量与特征值,将i减序排列,1> i2>…N2, 构造变换矩阵: KL变换: KL反变换: 2)性质 变换后均值为0,方差为:
2. 应用 1)压缩 CX实对称矩阵,总可以找到标准正交的特征向量集合构成A, A-1=A’,由Y利用 X=A’Y+MX重建X。 压缩时,取k个大的i,并构造出Ak,,则 离散K-L变换在最小平方误差的意义上最优。 特点:1)比其它方法图像压缩的效率高; 2)图像标准化(旋转)。 其缺点是:1)非分离,需要计算CX,及其特征值、特征向量; 2)无快速算法。
y1 y1 x2 y1 y2 y1 e1 e2 y1 (c) x1 0 (b) (a) 2)图像旋转 第一基向量与数据中最大变化的方向相对应。若目标已抽出,希望 与某个标准的、或不变的方向对准。需要处理目标中各像素的坐标。如 下图所示: 二维目标的旋转。(a)原始数据的散布指明单位特征向量的方向; (b)利用变换Y=AX作数据旋转;(c)利用变换Y=A(X-MX)作数据旋转和中心化