780 likes | 1.18k Views
第4章 视频压缩标准. 4.1 JPEG 标准 4.2 H.261 标准 4.3 MPEG 标准简介 4.4 MPEG-2 视频 4.5 MPEG-2 系统 4.6 MPEG-4. 4.1 JPEG 标准. 4.1.1 JPEG 标准简介 JPEG(Joint Photographic Experts Group) 是联合照片(静止)图像专家组的英文缩写。. JPEG 标准包括两种基本压缩方法。 (1)有损压缩方法:它是以 DCT 变换为基础的压缩方法,其压缩比较高,是 JPEG 标准的基础。
E N D
第4章 视频压缩标准 • 4.1 JPEG标准 • 4.2 H.261标准 • 4.3 MPEG标准简介 • 4.4 MPEG-2 视频 • 4.5 MPEG-2系统 • 4.6 MPEG-4
4.1 JPEG标准 • 4.1.1 JPEG标准简介 • JPEG(Joint Photographic Experts Group)是联合照片(静止)图像专家组的英文缩写。
JPEG标准包括两种基本压缩方法。 • (1)有损压缩方法:它是以DCT变换为基础的压缩方法,其压缩比较高,是JPEG标准的基础。 • (2)无损压缩方法,又称预测压缩方法,是以二维DPCM为基础的压缩方式,解码后能完全精确地恢复原图像采样值,其压缩比低于有损压缩方法。
JPEG标准还包括多种工作模式。 • (1)顺序模式 • (2)累进模式 • (3)分级模式
4.1.2 JPEG压缩编码算法 • 基于DCT的JPEG编解码原理框图如图4-1所示。
1.DCT变换 • 输入端把原始图像分成8×8像素块(Block)之后送入DCT变换器,目的是去除图像数据的空间冗余。 • 2.量化 • 利用人眼的视觉特性设计量化表。 • 3.之字形扫描 • 在编码之前,需要把二维的变换系数矩阵转换为一维序列。
4.可变长熵编码 • 为了消除码字中的统计冗余,采用可变长熵编码。 • 具体的编码方法如下。 • (1)首先对系数序列分组,把每个非零系数和它前面相邻的全部零系数分在一组内。
(2)将每一组用两个符号表示为 • [ (符号1),(符号2)] • 相应的交流系数(AC Coefficient)组表示成 • [(Run ,Size),(Amplitude) ] • (3)对每个符号组进行编码
4.2 H.261标准 • H.261标准主要应用在综合业务数字网ISDN上传输电视电话会议等低码率的多媒体领域。1990年12月国际电报电话咨询委员会(CCITT)通过了H.261建议书,即“采用p×64kbit/s的声像业务的图像编解码”,其中p=1,2,…,32。
4.2.1 图像格式 • H.261与H.263的图像格式如表4-13所示。
其中,CIF(Common Intermediate Format)为通用中间格式,QCIF (Quarter CIF)为1/4通用中间格式,SQCIF为扩展的通用中间格式,4CIF为4倍的通用中间格式,16CIF为16倍的通用中间格式。
4.2.2 H.261编码器 • 在H.261算法中,不仅使用了JPEG算法中的帧内压缩,还使用了帧间预测和运动补偿技术。下面简单介绍H.261编码算法。H.261编码器框图如图4-3所示。
4.3 MPEG标准简介 • MPEG(Moving Picture Experts Group)是ISO和IEC两个国际组织的联合技术委员会(JTCI)领导下的运动图像专家组的英文缩写。
4.3.1 MPEG-1 • MPEG专家组于1992年制定了MPEG-1标准。标准的文件编号为ISO/IEC11172。MPEG-1主要包括三个部分: • 第一部分系统(ISO/IEC11172-1),是关于数字视频、数字音频和辅助数据等多路压缩数据流复用和同步的规定;
第二部分视频(ISO/IEC11172-2),是关于位速率约为1.5Mbit/s的视频信号的压缩编码的规定; 第二部分视频(ISO/IEC11172-2),是关于位速率约为1.5Mbit/s的视频信号的压缩编码的规定; • 第三部分音频(ISO/IEC11172-3),是关于每通道位速率为64kbit/s,128kbit/s和192kbit/s的数字音频信号的压缩编码的规定。
MPEG-1标准的目标主要包括以下几方面: • (1)在图像和声音的质量上必须高于可视电话和会议电视的声像质量,至少应达到VHS家用录像机的声像质量; • (2)压缩后的数码率应能存储在光盘、数字录音带DAT或可写磁光盘等媒体中;
(3)压缩后的码率应与目前的计算机网络传输码率相适配,为1.2~1.5Mbit/s; (3)压缩后的码率应与目前的计算机网络传输码率相适配,为1.2~1.5Mbit/s; • (4)在通信网络上能适应多种通信网络的传输。
4.3.2 MPEG-2 • MPEG-2是由ISO/IEC的MPEG专家组与ITU-T(国际电信联盟电信标准化部门)的ATV的图像编码专家组共同开发的,所以MPEG-2标准也是ITU-T的建议。
(1)MPEG-2的组成 • MPEG-2分为许多个部分,其中主要有三个部分: • 第一部分系统(ISO/IEC13818-1),是关于多路音频、视频和数据的复用和同步的规定; • 第二部分视频(ISO/IEC13818-2),主要涉及各种比特率的数字视频压缩编解码的规定;
第三部分音频(ISO/IEC13818-3),扩充了MPEG-1的音频标准,使之成为多通道音频编码系统,可达到的环绕声5.1声道。 第三部分音频(ISO/IEC13818-3),扩充了MPEG-1的音频标准,使之成为多通道音频编码系统,可达到的环绕声5.1声道。 • (2)兼容性 • MPEG-2以空间和时间可分级方法提供空间和时间不同分辨率视频格式之间的兼容。
(3)MPEG-1与MPEG-2的区别 • 在许多情况下,MPEG-2表示成MPEG-1的一个超集。 • (4)MPEG-2的应用 • MPEG-2已广泛应用于DVD,SDTV和 HDTV中。
4.4 MPEG-2 视频 • 4.4.1 MPEG-2的型和级 • MPEG-2标准支持不同性能和不同复杂性的解码器,覆盖广泛的应用范围,充分考虑了各种应用的不同要求,有较强的通用性。 • MPEG-2还规定了不同的压缩处理方法,称为型(Profile)。
1.级(Level) • 级表示MPEG-2编码器输入端的信源图像格式。 • (1)低级(Low Level,LL) • LL级对应的输入信源格式是CIF格式,约是601标准中的信源格式的1/4,即352×248×30或352×288×25,相应编码的最大输出码率为4Mbit/s。
(2)主级(Main Level,ML) • ML对应于ITU-R601建议的信源格式,即720×480×29.97或720×576×25,最大允许输出码率为15Mbit/s,其高型的码率是20Mbit/s。 • (3)高H-1440级(High-1440 Level) • H-1440属于高清晰度发展道路上的准高清晰度级,没有得到实际应用。
(4)高级(High Level,HL) • HL对应高清晰度电视的信源格式,即1920×1080×30或1920×1152×25,最大输出码率为80Mbit/s,其高型的码率是100Mbit/s。 • 2.型(Profile) • (1)简单型(Simple Profile,SP) • (2)主型(Main Profile,MP) •
(3)信杂比可分级型SNR(SNR Scalable) • (4)空间可分级型(Spatial Scalable Profile,SSP) • (5)高型(High Profile,HP) • (6)4∶2∶2型(4∶2∶2Profile) • (7)多视点型(Mulitiview Profile,MVP)
4.4.2 视频结构 • 1.视频序列 • 视频序列也称图像序列,它是随机选取节目的一个基本单元。 • 2.图像组 • 图像组是将一个图像序列中连续的几个图像组成一个小组,简称为GOP。
3.图像 • 图像是一个独立的显示单元,也是图像编码的基本单元,可分为I,P和B三种编码图像。 • 4.像条 • 像条是发生误码且不可纠正时,数据重新获得同步,从而能正常解码的基本单元。
5.宏块 • 宏块是运动预测的基本单元。运动估计以宏块为单位,借此得到最佳匹配宏块的运动矢量。运动预测只对亮度阵列进行,对应的色差阵列其运动估计使用和亮度阵列相同的运动矢量。 • 6.块(像块) • 块或称像块,是DCT变换的基本单元。
4.4.3 图像压缩编码 • MPEG算法达到了很高的压缩比,但仍保持了很好的图像质量,单靠帧内编码是不可能达到的。在MPEG压缩编码中,主要通过DCT变换和运动预测技术来压缩空间冗余和时间冗余。 • 在MPEG-2压缩编码算法中,不仅包括了JPEG算法中的DCT、自适应量化和熵编码等一系列帧内编码方法,更重要的是利用了帧间运动补偿技术。
1.I,P和B编码图像 • (1)帧内编码图像(Intra Picture) • (2)前向预测编码图像(Predicated Picture) • (3)双向预测编码图像(Bidrectional Picture)
2.编码原理 • (1)帧重排 • (2)当输入的第一帧作为I帧图像进入图4-8所示的编码器中时,开关K1,K2和K4在上方,K3 在左方。 • (3)当P4作为P帧进入编码器时,开关K1,K2和K4切换到下方,K3还在左方。
(4)当B2作为B帧进入编码器时,开关K1在下方,K2在上方,K3在右方,K4在中间。 (4)当B2作为B帧进入编码器时,开关K1在下方,K2在上方,K3在右方,K4在中间。 • 3.图像组(Group of Pictures,GOP) • 在图4-9所示的图像序列中,每 12帧中包含1个I帧、3个P帧和8个B帧,称为一个图像组(GOP)。
4.4.4 视频基本码流结构 • 经过编码器编码后,6个视频层次构成的编码视频码流称为视频基本码流(ES),图4-11所示为简化的基本码流结构图。
(1)在视频序列层中,一个编码的视频序列由一个序列信头开始,后面跟随一个图像组头,然后是由许多图像(I,P和B)组成的一系列GOP,视频序列结束于一个序列终止码。 (1)在视频序列层中,一个编码的视频序列由一个序列信头开始,后面跟随一个图像组头,然后是由许多图像(I,P和B)组成的一系列GOP,视频序列结束于一个序列终止码。 • (2)在图像组层中,GOP头中给出了时间码和紧跟在I幀后面的B图像的预测特性等信息。
(3)在图像层中,图像头中给出了时间参考信息、图像编码类型和VBV(视频缓存校验器)延时等信息。(3)在图像层中,图像头中给出了时间参考信息、图像编码类型和VBV(视频缓存校验器)延时等信息。 • (4)在像条层中,像条头中给出了像条垂直位置、量化因子码等信息。 • (5)在宏块层中,其中的宏块类型码中给出了宏块属性、运动矢量。 • (6)最后一层是块层,给出了其DCT系数。
4.4.5 MPEG-2的可分级编码 • 分级(Scalability)编码使原本一体的码流呈现一种分级结构,使其中的部分码流可单独解码,从而可得到不同的分辨率和所需的码率。 • 可分级编解码的意义在于其码流的独立分层及可分层叠加,从而使该码流适应不同环境的传输信道和不同用户需求的能力大大增加。
MPEG-2中的可分级编解码主要包括以下几种:空间分级 (Spatial Scalability)、时间分级(Temporal Scalability)、SNR分级(SNR Scalability)和数据划分(Data Partitioning)等。 • 1.空间可分级 • 2.SNR可分级(SNR Scalability)
(1)底层编码 • 底层的编码在帧内/帧间判决、自适应量化和缓存调整方面和不分级编码类似。 • (2)增强层编码 • 在增强层编码中,首先对底层输出的量化后的DCT系数进行反量化,然后用未量化的DCT系数和反量化后的DCT系数相减求差值,得到修正系数。
3.时间可分级(Temporal Scalability) • 4.混合可分级性 • 混合可分级性(Hybrid Scalability)是空间、SNR和时间可分级的混合,产生两个以上的视频层,以支持更多需求的应用。下面介绍混合可分级在数字电视领域中的应用。 • (1)空间和SNR混合可分级的应用
(2) 空间和时间混合可分级的应用 • (3)时间和SNR可分级的应用 • 5.数据划分 • 在信道和发射功率受到限制时,往往希望能够在比较差的条件下收到质量略差些的图像,而不致于根本没有图像。
4.4.6 MPEG-2解码 • MPEG-2解码是MPEG-2编码处理的逆过程,从编码比特流中重建图像帧。MPEG-2解码框图如图4-17所示。