多媒体技术基础及应用

多媒体技术基础及应用 北京广播电视大学　吕小星　副教授

第4章多媒体数据压缩编码技术 本章讲课思路: 静态图像压缩编码的国际标准(JPEG) 预测编码统计编码变换编码数据压缩的基本概念

第二部分（二）预测编码

4.4 预测编码 预测编码（Predictive Coding）是统计冗余数据压缩理论的三个重要分支之一，它的理论基础是现代统计学和控制论。预测编码主要是减少了数据在时间和空间上的相关性，因而对于时间序列数据有着广泛的应用价值。

1.预测编码的基本思想 建立一个数学模型利用以往的样本数据对新样本值进行预测将预测值与实际值相减对其差值进行编码这时差值很少可以减少编码码位。

2.预测编码的分类 预测编码分为：线性预测和非线性预测

3.DPCM和ADPCM DPCM 差分脉冲编码调制 Differential Pulse Code Modulation

DPCM编/解码原理图

编码器 量化器发送预测器解码器 DPCM系统接收预测器信道

预测域 最佳线性预测例如：三阶线性预测系统

预测域 应用均方误差最小准则，求出预测系数、、

均方误差的表达式为

解方程， 得、、

DPCM编/解码原理图

N阶预测器的设计 假定给定样本序列：、、…… 预测那么预测误差

均方误差的定义为: 假如是一个平稳随机过程, 对各个取偏导数,令其为零。

通过线性方程组求出预测系数a i 就得到n-1线性方程组,解系数。

DPCM线性预测系统，较为常见的噪声 斜率过载当预测误差值很大（图像边界），而量化器的量化输出不够大时，出现斜率过载，使边界变模糊。

颗粒噪声 在图像灰度平坦区域（人的面部或背景），预测误差绝对值较小，而量化器的输出绝对值不够小，将预测误差扩大化，使量化输出忽正忽负，出现粒状斑点。

假轮廓噪声 对于图像中平滑上升或平滑下降区域，预测误差绝对值很小，但经过量化器后，由于量化器的步距较大，将差值扩大，使平滑区域变成一个个台阶，形成假轮廓噪声。

边沿繁忙 不同帧之间在同一像素位置产生的量化误差各不相同，使边缘处看到不断闪烁变化的忙乱现象。

ADPCM自适应预测编码 这种编码方法中，量化器的步长和预测器的参数均能根据图象的局部特征作自适应的调整。

已知三阶预测器: 设量化器最大输出为emax，最小输出为emin，某一个预测误差的量化输出为e′

当不变 自动增大自动减小

4.帧间预测编码 帧间编码技术处理的对象是序列图像（也称为运动图像）。随着大规模集成电路的迅速发展，已有可能把几帧的图像存储起来作实时处理，利用帧间的时间相关性进一步消除图像信号的冗余度，提高压缩比。帧间编码的技术基础是预测技术。

I J K M 前一帧的像素 U L N O Q P A B C 当前场的像素 D F E Z G H 前一场的像素 S R T 图4.19帧间预测像素位置示意图（1）帧间预测若最小，则用同一场同一扫描行上的前一个像素H 最小，则用同一场上一扫描行上的像素B 最小，则上一帧对应位置像素M

（1）条件传送和内插 • 条件传送：设置一个阈值“T”，对于帧间对应位置像素的亮度或色差信号值，大于T值传送，小于T值者不传送。一帧电视画面，只传送其中一部分活动比较明显像素的帧间差值信号，可以有效降低传输比特率。这种传送方式，称为条件传送。

（1）条件传送和内插 • 内插方法：当帧内像素的空间分辨率降低时，如果采样频率降低一倍，那么对于未采样像素的亮度或色差信号值，可用内插（插补）方法补充。

fi-1 fi fi+1 图4.17 同一扫描行上像素插补（1）条件传送和内插 • 内插方法举例：

fA fB fi fC fD 4.18 隔场邻近点像素插补（1）条件传送和内插 • 内插方法举例：

3.运动补偿 近几年运动补偿技术(Motion Compensation)十分活跃。在H.261，MPEG标准编码中都用到这个技术。

运动估计有下述三种方法： (1)块匹配法（Block Matching Algorithm BMA） (2)像素递归法（Pixel Recursive Algorithm PRA） (3)傅立叶变换法。

块匹配法 图4.19 块匹配位移估计算法

块匹配法 假定当前帧中的一个M×N子块是从第k—Ns帧平行移动而来，并设M×N子块内所有像素都具有同一个位移值（i，j）。假定运动物体在Ns帧差时间内水平和垂直最大位移均为L，这样我们可以在第k—Ns帧搜索区SR内进行搜索，这里SR搜索区为（M+2L，N+2L）

匹配算法 • 归一化相关函数 NCCF • 均方误差 MSE • 帧间绝对差 MAD

计算两帧中子块的相关函数 当NCCF相关函数最大时，i,j就被定为子块的水平和垂直的偏移值，但此式计算量大.

MSE是均方误差,MAD是绝对差 取MES或MAD最小时的i,j值就是水平和垂直的偏移量。

搜索方法 • 穷尽搜索法 • 二维对数法（TDL） • 三步搜索法（TTS）

穷尽搜索法 穷尽搜索法取MAD最小值，新得到的i,j就是水平和垂直的偏移量。

二维对数法(TDL) 此算法用MSE均方误差作为匹配准则，并在搜索窗口中用沿着最小误差方向执行对数二维搜索过程。

（1）5个初始点如图所示取MSE为最小点,如 （2）下一步搜索三个新位置，如最小误差位置同前，如（3）步长除以2，并搜索围绕次最小误差的9个（3*3）点如

                       三步搜索法    三步搜索法(TTS) 此搜索过程是一个由粗到细的过程，每一步搜索9个点，用MSE度量，找到最小搜索步长减半再搜索，共25个点。

预测编码小结 重点掌握: 预测编码的基本思想预测编码的分类 ADPCM编码方法中自适应系数m的变化条件

多媒体技术基础及应用 吕小星副教授北京广播电视大学理工教学部 E-Mail: lvxx@mail.btvu.org Tel: 62123648 2007.9

第4章多媒体数据压缩编码技术 本章讲课思路: 静态图像压缩编码的国际标准(JPEG) 预测编码统计编码变换编码数据压缩的基本概念

第二部分（三）变换编码

4.5 变换编码 1.什么叫数据压缩？定义（1）: 数据压缩就是以最少的数码表示信源所发的信号，减少容纳给定消息集合或数据采样集合的信号空间。

第四章多媒体数据压缩编码技术 4.1 数据压缩编码的重要性和分类 4.2 预测编码 4.3 变换编码 4.4 统计编码 4.5 数据压缩编码的国际标准

1、变换编码的特点 利用预测编码可以去除图象数据的时间和空间的冗余。它的优点是直观、简捷、易于实现，特别是用于硬件实现。但压缩能力有限，DPCM一般只能压缩到2~4bit/像素。

1、变换编码的特点 变换编码是进行一种函数变换，映射变换从信号域变换到另一个信号域。

多媒体技术基础及应用

多媒体技术基础及应用

Presentation Transcript