420 likes | 717 Views
第 1 讲. 视频压缩编码与 MPEG-2. 主讲:陈俊. 主要内容. 一、视频压缩编码方法. 二、视频压缩编码相关标准. 三、 MPEG-2 视频标准简介. 四、 MPEG-2 视频编码器构成. 前言:数字卫星电视上行发射系统组成. MPEG-2. DVB-S. 节 目 流 复 用 器. 视频. 视频编码器. 打包. 传 送 流 复 用. 信 道 编 码 与 调 制. 上 变 频. 音频. 打包. 音频编码器. 其它业务. 数据编码器. 打包. 一、视频压缩编码方法简介. (一)基本概念 :
E N D
第1讲 视频压缩编码与MPEG-2 主讲:陈俊
主要内容 一、视频压缩编码方法 二、视频压缩编码相关标准 三、MPEG-2视频标准简介 四、MPEG-2视频编码器构成
前言:数字卫星电视上行发射系统组成 MPEG-2 DVB-S 节 目 流 复 用 器 视频 视频编码器 打包 传 送 流 复 用 信 道 编 码 与 调 制 上 变 频 音频 打包 音频编码器 其它业务 数据编码器 打包
一、视频压缩编码方法简介 (一)基本概念: 信息的冗余度 ★ 空间冗余:相邻像素之间的相关性 相应采用的压缩编码:帧内编码 ★ 时间冗余:前后帧之间对应像素的相关性 相应采用的压缩编码:帧间编码
(二)常用编码方法: 1、 预测编码:帧内DPCM, 帧间DPCM 2、 运动补偿:分割、检测与估值、补偿、编码 3、 变换编码:离散傅里叶变换(DCT) 4、统计编码:夫曼编码(Huffman)(可变长编码) 游程长度编码 (RLC)
1、 预测编码 1)帧内DPCM:二维图像中相邻图像间的相关性 压缩比:2~3倍 2)帧间DPCM:相邻帧之间平均象素变化小于7.5% 压缩比:10倍左右 帧重复、阈值法、帧内插、运动补偿
2、 运动补偿 处理过程 1)图像分割:静止部分、运动部分 2)运动检测与估值:运动类型、运动物体的位移值 3)运动补偿:用位移值进行运动补偿预测 4)预测信息编码:作为边信息传送
MB MB MB` 前帧 后帧 运动矢量:H和V 差值阵:MB=MB-MB` 查找运动矢量 MB MB`
前向预测 帧内图象 预测图象 插补图象 I B P B P B I 双向预测 帧内图象(Intrapictures) 预测图象(Predicted Pictures) 插补图象(Interpolated pictures or Bidirectional prediction) 帧间编码方式
3、 变换编码 1)变换编码的特点 1)在变换域描述图像比空间域简单 2)图像相关性下降,信号能量集中 3)可利用人眼视觉特性,如频率、心理和视觉 4)抗干扰能力强,仅要求误码率 < 10 – 4 5)由快速算法,能实现实时压缩
2)变换编码的过程 (1)计算变换系数--DCT (2)量化变换系数 (3)“Z”字形扫描 (4)熵编码
(1)DCT 变换公式: F(u,v)=1/4[C(u)C(v) ∑∑f(x,y)cos[(2x+1)uл/16]cos[(2y+1)vл/16] f(u,v)=1/4[∑∑ C’(u)C’(v) f(x,y)cos[(2x+1)uл/16]cos[(2y+1)vл/16] 7 7 x=0 y=0 7 7 u=0 v=0
DCT变换过程示意 直流 分量 MCU 计算变换系数 64 88 63 交流分量
(2)量化变换系数 低频 高频 小量化步长 大量化步长
(3)“Z”字形顺序排列 DC AC10 AC70 AC77 直流系数 交流系数
(4) 熵编码 (a) 游程长度编码 符号-1:包括两个数据: 跨越长度:非零AC系数前连零的个数 位 长:非零系数的编码位数 符号-2:只包含非零系数值(振幅),若最后一个非零 AC系数后还有零系数,则用EOB表示子图像的结束 (b) 可变长度编码 符号-1:用霍夫曼编码, 符号-2:用二进制编码
二、视频压缩编码标准 1. H.261(电视电话会议制式) :(1984~1990) P×64标准(kbit/s), P=1,2,…32 压缩工具:DCT-----帧内压缩 运动补偿-----帧内编码 2. JPEG(静止图象压缩标准):1986~1992 用于静止图像的压缩-----活动图像的帧内压缩 压缩工具:DCT 或 DPCM
MPEG-1(活动图象及伴音编 码): 1988~1993 MPEG-----Moving Pictrue Expert Group 活动图像专家组 MPEG-1:码率为1.5Mb/s, 包含视频和伴音 使用于低精度图像模式 (352×288) 主要应用于数字存储媒体 在中国,用作VCD, 后发展到SVCD,CVD
4. MPEG-2(广播电视图像及伴音 ): 1991~1994 定义了包含低级、主级和高级各种级别的图像格式 涵盖了MPEG-1(VCD)、 SDTV(DVD)和 HDTV等各种应用 其中的主级主类格式应用最广泛: 提供720×576图像模式 码率为 3~15Mb/s, 包含视频、伴音及数据 主要应用于数字电视广播、多媒体通信等
MPEG其他标准: • 1)MPEG-3:原为应用于HDTV的标准,现已包含在 • MPEG-2中,故已取消。 • 2)MPEG-4:基于内容的编码标准(93~99年) • 具有基于内容的的编码方法和灵活的组合结构,并采用了工具箱的方法,提供更高的压缩比、更低输出比特率的编码方法,可广泛应用于各种窄带多媒体通信领域。 • 3)MPEG-7:多媒体内容描述接口(98~2001年) • 建立多媒体数据库和相应的搜索引擎之间的接口,主要应用于数字图书馆、多媒体目录服务、广播媒体选择、多媒体编辑等。
三、MPEG-2视频标准的概念 1、MPEG-2标准组成 MPEG-2标准共含9部分:系统、视频、音频、一致性、软件、数字存储媒体的指令和控制、非向后兼容的音频、10比特视频、实时接口。其中最重要的3部分为: 第1部分:MPEG-2系统标准(IS13818-1) 第2部分:MPEG-2视频压缩标准(IS13818-2) 第3部分:MPEG-2音频压缩标准(IS13818-3)
2、MPEG-2的级与类的概念 类(Profile)—压缩算法子集 1 )简单类:SP (Simple Profile) 2)主用类:MP (Main Profile) 3)SNR可分级类:SNR (SNR Scable Profile) 4)空间可分级类:Spt (Spatial Scalable Profile) 5)高级类:HP (High Profile)
级 (Level)—图像的格式 1)低级图象格式:LL (Low Level) 2)主级图象格式: ML (Main Level) 3)高级窄屏幕图象格式: H-14 (High 1440 Level) 4)高级宽屏幕图象格式: HL (High Level)
高级图象格式: 主级图象格式: 低级图象格式:
矩阵变换 Y R-Y B-Y R G B Cr=0.625(R-Y)+.05 Cb=0.5(R-Y)+0.5 Y=0.30R+0.60G+0.10B 四、MPEG-2视频编码器构成 1、MPEG-2亮度和色度信号的形成: 矩阵变换:
2、视频信号的模数转换: 13.5MHz 取样 量化 并行 输出 接口 Y R-Y B-Y 视频码流 8bitz 6.75MHz
1)取样频率的选择: 亮度信号取样频率:Fs=13.5MHz 色度信号取样频率:Fs=6.75MHz 场样点数:对于625/50(PAL制式):行样点数:864 每场有312.5行,总样点数270000 对于525/60(NTSC制式):行样点数:858 每场有262.5行,总样点数:225225
2)量化比特数的选择: 8比特 亮度信号共有220级, 黑电平对应于量化级16, 峰值白电平对应于量化级235, 色度信号共有224级, 最大负电平是16, 最大正电平是240, 零电平是128。 某些应用可扩展到10比特
3)数字化后的码率: 数字化后的码率:亮度信号:13.5×8=108Mbit/s 两个色差信号:6.75×8=54Mbit/s 总数码率:216Mbit/s 采用输出接口:以8比特样值并行传输 数据率为27Mbyte/s。
5 像块 Block 6 • 2 • 3 4 • 2 • 3 4 • 2 • 3 4 • 10 • 8 12 5 9 7 11 8×8 4:1:1格式 4:2:2格式 4:4:4格式 5 7 6 8 3、MPEG-2图像的宏块结构:
4、帧内编码: 1). 图像的三种编码类型: 1) I 帧(帧内编码帧): 对整个帧进行DCT,全部要传。 2) P帧(前向预测编码帧):以前一个I帧或从前一个P帧为 预测帧进行编码,只需传送两帧之间的差值。 3)B帧(双向预测编码帧): 从相邻的I帧或P帧做双向预测 进行编码,也只需传送两帧之间的差值。 2). 帧内/帧间编码判决原则: ★ 与前帧相关性不大的当前帧,判为I帧,并进行帧内编码 ★ 若当前帧与前一帧的相关性大,可判为P帧,并对这两帧的 差值进行帧间编码。
3)帧内(或帧间差值)编码框图 输出码流 输入码流 DCT 量化 “Z” 字形 扫描 熵编码 8×8 Block 查量化系数表 游程长度编码 可变长度编码
5、帧间编码: 参考帧 视频解码 Y 打包 数字化 运动估计 和 运动补偿 帧内编码或 差值编码 R G B ES码流 R-Y B-Y
I1 P4 B2 B3 P7 B5 B6 P10 B8 B9 帧内图象 预测图象 插补图象 各帧图像处理与传输顺序 处理时 I1 B2 B3 P4 B5 B6 P7 B8 B9 P10 传输时
6、MPEG-2的视频码流结构: 视频基本流(ES流)的六层结构 高层 1)视频序列层(Sequence) 2)图像组层(GOP:Group of Picture) 3)图像层(Picture) 4)像条层(Slice) 5)宏块层(Macro Block) 6)像块层(Block) 低层
视频序列层 视频序列 视频序列 视频序列 序列SC 序列头 序列扩展 GOP SC GOP头 PIC数据 序列SC 图像组层 1)视频序列层(Sequence)
2)图像组层( GOP:Group of Picture ) 图像组层 GOP SC GOP头 PIC数据 PIC SC PIC头 PIC扩展 I帧数据 PICSC PIC头 PIC扩展 P帧数据 图像层
3)图像层( Picture ) 图像层 PIC SC PIC头 PIC扩展 I帧数据 PICSC PIC头 PIC扩展 P帧数据 条 SC 条头 宏块 宏块 宏块 宏块 条SC 条头 宏块 宏块 宏块 宏块 像条层
4)像条层( Slice) 像条层 条 SC 条头 宏块 宏块 宏块 宏块 条SC 条头 宏块 宏块 宏块 宏块 IC数据 PIC数据 像块 像块 像块 像块 宏块层
5)宏块层( Macro Block) IC数据 PIC数据 像块 像块 像块 像块 DCT数据 EOB 6)像块层(Block)