500 likes | 664 Views
图像编码. 图像的信息量和信息冗余 编码技术 静止图像压缩编码标准( JPEG ) MPEG. 图像的信息量. 图像数据量计算公式: Q= N*M*b 计算信息量. 码 长. 计算不同编码方案的数据量. 计算平均码长. p = [0.19 0.25 0.21 0.16 0.08 0.06 0.03 0.02]; cl1 = 3*ones(size(p)); cl2 = [2 2 2 3 4 5 6 6]; clAve1 = p*cl1' clAve2 = p*cl2'. 信息冗余. 编码冗余 空间冗余 心理视觉冗余. 编码冗余.
E N D
图像编码 图像的信息量和信息冗余 编码技术 静止图像压缩编码标准(JPEG) MPEG
图像的信息量 • 图像数据量计算公式: Q= N*M*b • 计算信息量 码 长 • 计算不同编码方案的数据量
计算平均码长 • p = [0.19 0.25 0.21 0.16 0.08 0.06 0.03 0.02]; • cl1 = 3*ones(size(p)); • cl2 = [2 2 2 3 4 5 6 6]; • clAve1 = p*cl1' • clAve2 = p*cl2'
信息冗余 • 编码冗余 • 空间冗余 • 心理视觉冗余
编码冗余 • 编码冗余如前表所示。 • 选择不同的编码方案就可以实现数据压缩。 • 存在原因:图像中各灰度级出现的概率不完全相同。 • 利用哈夫曼编码来消除编码冗余。
空间冗余 • 产生原因:图像中存在许多灰度级均匀一致的连续区域。 • 图7-1 P112 • 行程长度编码和预测编码
心理视觉冗余 • 视觉感知时对信息的接受是有选择的。 • 有些信息相对不重要——视觉冗余信息 • 去除这些信息并不会明显地降低对图像质量的感受。 • 心理视觉冗余是复杂过程,有时因人而异。
图像编码技术分类 • 有损编码 • 解码后重新构造的图像与原始图像存在不同 • 利用心理冗余和空间冗余 • 容易取得较好的压缩比 • 无损编码 • 重构图像与原图像完全一样 • 对原始信号的准确程度要求高的场合
数据压缩技术的评价指标 • 均方根误差 • 均方信噪比 • 主观保真度准则
编码技术 • 哈夫曼编码 • 行程长度编码
哈夫曼编码算法 • 将图像灰度值按概率大小排列; • 把最小的概率加起来作为新符号的概率 • 遍历所有概率组成(灰度值) • 每次合并符号的时候,大概率赋1,小概率赋0 • 确定从树根到原始信源符号的路径组成码字
0.375 1 概率1 0.175 0 0.175 0 1 0 0.150 1 0 0.125 1
哈夫曼编码的特点 • 两次读取图像 • 计算频率 • 码字转换 • 编码的不唯一性 • 编码效率高只在图像灰度分布不均匀的时候 • 必须通过查表来确定码字转换关系
行程长度编码 5个 • 编码实例(16色bmp数据): 第一行:24 24 24 30 60 40 09 22…46…46 第二行:64 65 67 88 88 88 88 … 90 78 • 00 00:表示该行图像数据已结束 • 00 01:表示整个图像结束 • 00 02:用来转义后面两个字节,即表示其后的两个字节分别表示下一个像素从当前位置开始的水平与垂直位移 • 00 N:表示从当前位置起,图像数据存在连续N个不同的值(存放于N/2个字节中)
行程编码原理 • 在给定的图像数据中寻找连续重复的数值,然后用两个字符值取代这些连续值 • “aaabbbbccccddd”=>”3a4b4c3d” • 处理包含大量重复信息时可以得到很好的压缩效率,但在连续重复数据少时效果差 • PCX图像文件的RLE压缩算法
图像的预测编码 • 着眼于消除空间冗余 • 利用相连像素间的相关性,根据一个或多个像素的灰度值预测它的下个像素的可能数值,再求其预测值与真实值的差值,然后将差值量化,编码,从而消除空间冗余
预测编码原理图 + 输入图像 符号编码器 压缩图像 ∑ - 预测器 压缩图像 符号解码器 重构图像 ∑ + + 预测器
变换编码的基本原理 • 变换编码解码工作流程 • P7-5 P122 • 基本思想:将空域中的图像数据经过某种正交变换(fft,DCT等)转换到另一个变换域进行描述 • 对变换系数进行编码处理,从而达到压缩图像数据的目的 • 实验中的DCT压缩程序与图7-7比较
静止图像压缩技术(JPEG) • JPEG:Joint Photographic Experts Group • JPEG标准中的三层次定义: • 基本系统 • 扩展系统 • 特殊无损系统
静止图像压缩技术(JPEG) • JPEG标准中的四种操作模式: • 基本顺序模式:左-〉右,上-〉下扫描 • DCT累进模式编码:多次扫描 模糊-〉清晰 • 无损预测模式:保证精确再现图像 • 分层模式编码:多种分辨率
图像编码的要求 • 必须将图像质量控制在可视保真度范围内,同时编码器可以被参数化,允许设置压缩或质量水平 • 压缩标准可以应用于任何一类数字图像 • 压缩标准可以从完全无损到有损范围内可选
无损预测编码方法 • JPEG无损预测编码:差分脉冲编码调制 • 优点:硬件易于实现,重建图像质量好 • 缺点:压缩比小(2:1) • 具体预测方法:共8种方法,见图7-8 • 差值编码采用哈夫曼编码
DCT变换的编码步骤 • 颜色空间转换 • 正向DCT变换 • 量化 • 直流系数的差分编码和交流系数的行程编码 • 熵编码(哈夫曼编码)
DCT累进操作模式 • DCT顺序模式编码:对每一图像子块(8X8)按从左至右,上到下的顺序一次扫描完成编码。 • DCT累进操作模式:多次扫描 • 粗扫-〉细扫 • 频谱选择法 • 位逼近法
MPEG标准简介 • MPEG标准及其应用 • MPEG-1:低码率的多媒体编码 • MPEG-2:移动图像和伴音的通用编码 • MPEG-4:甚低码率视频音频编码 • MPEG-7:多媒体内容描述接口 • MPEG-21:超越压缩 • MHEG:超越媒体
MPEG标准及其应用 • 利用通信技术和计算机技术的信息交流的必然发展方向是多媒体。 • 多媒体五大趋势: • 多媒体的表示、处理、传送和服务全部数字化。 • 信号容量大导致传输困难,必须进行压缩。 • 按照摩尔定律发展的半导体工业使得可以实时执行软件压缩算法。 • 多媒体的标准化进程逐渐加快。 • 多媒体的应用和服务大量涌现。
MPEG标准及其应用 • 多媒体技术中的关键部分是多媒体信息处理技术。 • 多媒体信息处理: • 各种媒体信息的压缩和处理 • 基本技术:图像处理技术和声音处理技术
图像处理技术 • 静态图像和动态图像的产生、获取及变换 • 图像的压缩还原 • 三维动画的生成
声音处理技术 • 语音的输入和输出 • 声音的压缩和还原 • 自然语音合成
多媒体信息处理的基本任务 • 为了有效地存储和传输这些媒体信息,需要进行信息压缩编码 • 编码一般要求高压缩率、高容错性以及高保真度。
发展阶段 MPEG各标准比较 MPEG-21:数字对象的声明、内容的表示、数字对象的认证和描述、内容管理与使用、知识产权管理、网络和终端、事件报告 MPEG-7:内容管理 描述和组织 搜索和代理 MPEG-4:小波 对象和结构 QoS MPEG-2:场/帧DCT MC预测 可调节 MPEG-1:DCT 运动估计 运动补偿 信号 特征 语义 知识
MPEG的基本思想和方法 • 在空间方向上:图像数据采用JPEG(joint photographic experts group)压缩算法来去掉冗余信息。 • 在时间方向上:图像数据压缩采用运动补偿(Motion Compensation)算法来去掉冗余信息。
MPEG-1:低码率的多媒体编码 • 制定于1992年,适用于CD-ROM,Video-CD,CD-R等。 • 主要针对1.5mbps以下数据传输率的数字存储媒质运动图像及其伴音编码。 • 可以优化为中等分辨率: • NTSC:352X240 • PAL:352X288 • 1.5mbps,30帧,CD音质,与VHS相当。
MPEG-1:低码率的多媒体编码 • 编码速率最高可达4Mbps~5Mbps • 视频压缩率:26:1 • 120分钟的电影压缩到1.2G • MPEG-1的处理对象是标准图像交换格式 • SIF:Standard Interchange Format • Or: Source Input Format
MPEG-1的组成部分 • 标准号:ISO/IEC 11172 • 五个部分: • 系统:规定电视图像数据、声音数据及其他相关数据的同步 • 电视图像:规定电视数据的编码和解码 • 声音:规定声音数据的编码和解码 • 一致性测试:测试比特流和解码器是否满足规定要求 • 软件模拟:用软件执行前三个部分的技术报告。
MPEG-1视频 • 数字化视频的存储空间问题: • PAL电视:未经压缩的数字信息数据高达30Mbps,650兆光盘仅能存储几十秒钟。 • 保存大量的冗余信息。 • 思路: • 人眼能分辨的颜色远未达到24位-减小采样深度。 • 帧与帧间存在大量的重复信息-帧间预测和帧间补偿。
MPEG-1数据结构和压缩模式 • 6层结构: • 由若干图像组构成的图像序列(Sequence) • 由图像组成的图像组(Group of Picture,GOP) • 图像帧(Picture) • 由宏块(Macroblock)组成的切片(Slice) • 宏块 • 块(Block)
MPEG-1数据结构和压缩模式 • 图像帧(Picture) : • I帧(Intra,帧内图像):帧内DCT编码,类JPEG。 • P帧(Predicted,预测图像):帧间编码,采用运动补偿预测帧间误差,前向预测。 • B帧(Bidirectionally,双向插值图像):同P帧,但可前向、后向或双向预测。 • D帧(DC分量帧):直流系数帧
P I B B B B P B B P B B P B B I 视频数据结构
MPEG-1数据结构和压缩模式 • 宏块:压缩模式中最小的数据单位,由4个8×8的亮度(Y)象素块(即16X16)和两个8×8的色度(U和V)象素块组成。 • 块:8×8象素块,最小的DCT单位。
当前图像 重构图像 指导帧 宏块的移动矢量
MPEG-2 • 移动图像和伴音信息的通用编码 • MPEG-1以1.2Mbps的速率压缩出来的视频图像质量较差。 • 运动图像专家组的进一步研究:MPEG-2 • 着重解决了视频质量问题。 • MPEG-2是MPEG-1的扩充兼容版本,采用的基本编码算法相同。
MPEG-2 • 标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定。 • 高级工业标准的图像质量以及更高的传输率: • 编码码率-3Mbps~10Mbps • NTSC制式下720X486,最高30帧/秒 • CD级的音质
MPEG-2 • 适用于数字电视广播(DVB)、HDTV和DVD
MPEG-4:甚低码率视频音频编码 • MPEG专家组的研究转向: 单纯提高压缩效率->基于内容的通用多媒体编码标准 • MPEG-4将众多的多媒体应用集成在一个完整框架内,旨在为多媒体通信及应用环境提供标准的算法和工具,用于实现音视频数据的有效编码及更为灵活的存取。
MPEG-4应用 • 多媒体应用、交互式视频游戏、基于面部动画技术的虚拟会议、远程视频监控、远程数据业务等与网络有关的业务上。 • 低比特率应用:视频电话,视频电子邮件、移动多媒体通信和电子新闻。 • DIVX- MPEG-4影碟和网上MPEG-4电影,网上视频节目格式ASF等。
MPEG-7内容描述接口 • 多媒体技术的发展->视音频信息越来越多->用户希望能够通过一个简单的搜索引擎快速地找到自己所需要的资料。 • 现有的搜索引擎是基于文本信息的检索,不能满足用户对音视频信息、多媒体信息检索的需求。 • 要实现对多媒体内容的搜索,关键是要定义一种标准的多媒体内容的接口,规范对多媒体内容的描述。