第七讲

第七讲 MTI 多媒体技术 XIDIAN 国际视频压缩标准简介

主要内容 • 视频压缩标准发展历史 • H.26X系列压缩标准简介 • MPEG系列压缩标准简介

视频压缩标准发展历史 H.261 H.262 H.263 H.263+ H.264 ITU: MPEG1 MPEG2 MPEG4 (Part2) ISO/IEC: MPEG7 MPEG21 MPEG4(Part10)

视频压缩标准对比

视频压缩标准对比（续）

MPEG-1视频压缩标准 MPEG-1标准号为ISO/IEC 11172，它由五部分组成： • MPEG-1系统（ MPEG-1 Systems ）：规定视频数据、声音数据及其他相关数据的同步合成技术 • MPEG-1视频编码标准（MPEG-1 Video） • MPEG-1音频编码标准（MPEG-1 Audio） • MPEG-1一致性测试：详细说明如何测试比特数据流和解码器是否满足MPEG-1前3个部分(Part1，2和3)中所规定的要求。 • MPEG-1软件模拟：一个技术报告，给出了软件执行MPEG1前3个部分的运行结果。

MPEG-1视频压缩标准 输入、输出指标： MPEG视频编码器 352×288×25×8×1.5 1.15Mb/s 30Mb/s 352×240×30×8×1.5 26 : 1

MPEG1视频压缩算法 运动补偿帧间预测(temporal) ＋ DCT(spatial)

Frame 1

Frame 2

Residual Frame

象素运动轨迹

Block-based Motion Estimation and Compensation

16×16 Block Size

8×8 Block Size

4×4 Block Size

Sub－pixel Motion Estimation and Compensation 子像素运动估值与补偿

Sub－pixel Motion Estimation and Compensation

MPEG1视频编码器框架

MPEG1视频编码器框架 分块

MPEG1视频压缩算法 分割：运动图像序列图片组（GOP） I B B P B B P … 图片条（Slice）块（Block） 8 宏块 Macro Block 16 8 16

MPEG1视频压缩算法 GOP的组成： I：内帧 P：单向预测帧 B：双向预测帧一个内帧是一个随机访问点。B图像不能作为其它图像的参考帧。

MPEG1视频压缩算法 为了在图像质量和数据速率之间作出调整，MPEG编码器允许（1）选择内帧I的频率和位置，（2）选择I和P之间双向预测帧B的数目。

MPEG1视频压缩算法 运动补偿技术在宏块一级工作。宏块分为四类： • 帧内宏块，简称I块 • 前向预测宏块，简称F块 • 后向预测宏块，简称B块 • 平均宏块，简称A块 I图像只包含I块，P图像只包含I块和F块，B图像可以包含4种类型的宏块。

MPEG1视频压缩算法 I图像帧的压缩算法：在空间方向上（内帧），MPEG－1压缩采用JPEG压缩算法来去掉冗余信息。

MPEG1视频压缩算法 P图像帧的压缩算法：对于P宏块，MPEG－1采用运动补偿帧间预测算法来去掉时间轴上的冗余信息。

MPEG1视频压缩算法 运动矢量的概念

MPEG1视频压缩算法 基于块的运动矢量估值算法——块匹配法

MPEG1视频编码算法 块匹配法（Block Matching Algorithm）需要解决两个关键问题：（1）匹配准则（2）搜索算法

MPEG1视频编码算法 BMA中常用的匹配准则：绝对值：均方误差：平均绝对帧差：

MPEG1视频编码算法 BMA常用搜索算法—二维对数搜索法：

MPEG1视频编码算法 BMA常用搜索算法—三步搜索法：

MPEG1视频编码算法 BMA常用搜索算法—对偶搜索法：

MPEG1视频编码算法 B图像帧的压缩算法：

MPEG-1 音频压缩标准 • 输入、输出指标： MPEG音频编码器 32kHz, 44.1kHz, 48kHz 32kb/s~ 384kb/s 16位 PCM

MPEG-1 音频压缩算法 • 听觉系统的感知特性：听阈－频率曲线

MPEG-1 音频压缩算法 • 听觉系统的感知特性：一个强纯音会掩蔽在其附近同时发声的弱纯音，这种特性称为频域掩蔽，也称同时掩蔽

MPEG-1 音频压缩算法 • 听觉系统的感知特性：在时间上相邻的声音之间也有掩蔽现象，称为时域掩蔽。时域掩蔽又分为超前掩蔽和滞后掩蔽。一个强纯音会掩蔽在其附近同时发声的弱纯音，这种特性称为频域掩蔽，也称同时掩蔽

MPEG-1 音频压缩算法 • 感知子带压缩算法算法以心理声学模型为基础，主要利用了听觉阈值和听觉掩蔽特性

MPEG-1 音频压缩算法 • 感知子带压缩算法 1、将音频信号用滤波器组分成32个子带； 2、用FFT将子带变换到频率域 3、根据心理声学模型估计各个子带的感知阈值 4、根据对感知阈值的估计对各个子带进行比特分配和量化。 MP3采用了与MP1、MP2不同的滤波器和心理声学模型。

MPEG-1 音频压缩算法 MPEG-1 Audio层1和层2编码器和解码器的结构

MPEG-1 音频压缩算法 MPEG-1 Audio层3编码器和解码器的结构

H.261概述 • H.261也称P×64，这是ITU-T（前身为CCITT）最早制定的关于视频编码的国际标准。考虑到ISDN的传输码率以64kbps为单位，因此以p×64kbps（p＝1～30）作为为H.261的标准码率。H.261标准主要用于电视电话和电视会议。它支持QCIF（p=1、2）、CIF（p>2）两种图像输入格式。

H.261解决的问题 • 第一是编码算法问题。确立了一种合理的、保证图像质量且为各国图像编码专家所公认的统一的算法。算法必须能够实时操作，解码延时要短。 • 第二是与PCM标准兼容的问题。编解码器以64～1920kb／s的工作速率去覆盖N-ISDN或PCM一次群的通道。 • 第三，解决电视制式不同的问题。为了使同一标准既能用于PAL（625）和NTSC（525）两种电视制式系统，源编码基于中间格式CIF格式，所以输入输必须经转换到CIF或QCIF格式再进行源编码。

第七讲

第七讲

Presentation Transcript