740 likes | 935 Views
第七讲. MTI. 多媒体技术. XIDIAN. 国际视频压缩标准简介. 主要内容. 视频压缩标准发展历史 H.26X 系列压缩标准简介 MPEG 系列压缩标准简介. 视频压缩标准发展历史. H.261. H.262. H.263 H.263+. H.264. ITU:. MPEG1. MPEG2. MPEG4 (Part2). ISO/IEC:. MPEG7. MPEG21. MPEG4 (Part10). 视频压缩标准对比. 视频压缩标准对比(续). 视频压缩标准对比(续). 视频压缩标准对比(续). 视频压缩标准对比(续).
E N D
第七讲 MTI 多媒体技术 XIDIAN 国际视频压缩标准简介
主要内容 • 视频压缩标准发展历史 • H.26X系列压缩标准简介 • MPEG系列压缩标准简介
视频压缩标准发展历史 H.261 H.262 H.263 H.263+ H.264 ITU: MPEG1 MPEG2 MPEG4 (Part2) ISO/IEC: MPEG7 MPEG21 MPEG4(Part10)
MPEG-1视频压缩标准 MPEG-1标准号为ISO/IEC 11172,它由五部分组成: • MPEG-1系统( MPEG-1 Systems ):规定视频数据、声音数据及其他相关数据的同步合成技术 • MPEG-1视频编码标准(MPEG-1 Video) • MPEG-1音频编码标准(MPEG-1 Audio) • MPEG-1一致性测试:详细说明如何测试比特数据流和解码器是否满足MPEG-1前3个部分(Part1,2和3)中所规定的要求。 • MPEG-1软件模拟:一个技术报告,给出了软件执行MPEG1前3个部分的运行结果。
MPEG-1视频压缩标准 输入、输出指标: MPEG视频 编码器 352×288×25×8×1.5 1.15Mb/s 30Mb/s 352×240×30×8×1.5 26 : 1
MPEG1视频压缩算法 运动补偿帧间预测(temporal) + DCT(spatial)
Sub-pixel Motion Estimation and Compensation 子像素运动估值与补偿
MPEG1视频编码器框架 分块
MPEG1视频压缩算法 分割: 运动图像序列 图片组(GOP) I B B P B B P … 图片 条(Slice) 块(Block) 8 宏块 Macro Block 16 8 16
MPEG1视频压缩算法 GOP的组成: I:内帧 P:单向预测帧 B:双向预测帧 一个内帧是一个随机访问点。B图像不能作为其它图像的参考帧。
MPEG1视频压缩算法 为了在图像质量和数据速率之间作出调整,MPEG编码器允许(1)选择内帧I的频率和位置,(2)选择I和P之间双向预测帧B的数目。
MPEG1视频压缩算法 运动补偿技术在宏块一级工作。宏块分为四类: • 帧内宏块,简称I块 • 前向预测宏块,简称F块 • 后向预测宏块,简称B块 • 平均宏块,简称A块 I图像只包含I块,P图像只包含I块和F块,B图像可以包含4种类型的宏块。
MPEG1视频压缩算法 I图像帧的压缩算法: 在空间方向上(内帧),MPEG-1压缩采用JPEG压缩算法来去掉冗余信息。
MPEG1视频压缩算法 P图像帧的压缩算法: 对于P宏块,MPEG-1采用运动补偿帧间预测算法来去掉时间轴上的冗余信息。
MPEG1视频压缩算法 运动矢量的概念
MPEG1视频压缩算法 基于块的运动矢量估值算法——块匹配法
MPEG1视频编码算法 块匹配法(Block Matching Algorithm)需要解决两个关键问题: (1)匹配准则 (2)搜索算法
MPEG1视频编码算法 BMA中常用的匹配准则: 绝对值: 均方误差: 平均绝对帧差:
MPEG1视频编码算法 BMA常用搜索算法—二维对数搜索法:
MPEG1视频编码算法 BMA常用搜索算法—三步搜索法:
MPEG1视频编码算法 BMA常用搜索算法—对偶搜索法:
MPEG1视频编码算法 B图像帧的压缩算法:
MPEG-1 音频压缩标准 • 输入、输出指标: MPEG音频 编码器 32kHz, 44.1kHz, 48kHz 32kb/s~ 384kb/s 16位 PCM
MPEG-1 音频压缩算法 • 听觉系统的感知特性: 听阈-频率曲线
MPEG-1 音频压缩算法 • 听觉系统的感知特性: 一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽
MPEG-1 音频压缩算法 • 听觉系统的感知特性: 在时间上相邻的声音之间也有掩蔽现象,称为时域掩蔽。时域掩蔽又分为超前掩蔽和滞后掩蔽。 一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽
MPEG-1 音频压缩算法 • 感知子带压缩算法 算法以心理声学模型为基础,主要利用了听觉阈值和听觉掩蔽特性
MPEG-1 音频压缩算法 • 感知子带压缩算法 1、将音频信号用滤波器组分成32个子带; 2、用FFT将子带变换到频率域 3、根据心理声学模型估计各个子带的感知阈值 4、根据对感知阈值的估计对各个子带进行比特分配和量化。 MP3采用了与MP1、MP2不同的滤波器和心理声学模型。
MPEG-1 音频压缩算法 MPEG-1 Audio层1和层2编码器和解码器的结构
MPEG-1 音频压缩算法 MPEG-1 Audio层3编码器和解码器的结构
H.261概述 • H.261也称P×64,这是ITU-T(前身为CCITT)最早制定的关于视频编码的国际标准。考虑到ISDN的传输码率以64kbps为单位,因此以p×64kbps(p=1~30)作为为H.261的标准码率。H.261标准主要用于电视电话和电视会议。它支持QCIF(p=1、2)、CIF(p>2)两种图像输入格式。
H.261解决的问题 • 第一是编码算法问题。确立了一种合理的、保证图像质量且为各国图像编码专家所公认的统一的算法。算法必须能够实时操作,解码延时要短。 • 第二是与PCM标准兼容的问题。编解码器以64~1920kb/s的工作速率去覆盖N-ISDN或PCM一次群的通道。 • 第三,解决电视制式不同的问题。为了使同一标准既能用于PAL(625)和NTSC(525)两种电视制式系统,源编码基于中间格式CIF格式,所以输入输必须 经转换到CIF或QCIF格式再进行源编码。