1 / 89

上海理工大学 —— 出版印刷学院 樊丽萍 digtalimage11@163

印刷图像处理. 上海理工大学 —— 出版印刷学院 樊丽萍 digtalimage11@163.com. 成绩评定方式. 教材 :. 印刷图像处理 —— 印刷工业出版社. 参考书 :. 1. 数字图像处理 —— 电子工业出版社. 2.MATLAB 图像处理 —— 电子工业出版社. 3. 印刷图像处理 —— 上海科学技术出版社. 使用软件 :. Adobe Photoshop 、 MATLAB. 第三章 图像的编码与压缩. 一、基本概念. 1.图像压缩的发展. 带宽压缩 (模拟方法). 数字压缩. 2. 数据压缩. 压缩标准.

sela
Download Presentation

上海理工大学 —— 出版印刷学院 樊丽萍 digtalimage11@163

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 印刷图像处理 上海理工大学——出版印刷学院 樊丽萍 digtalimage11@163.com

  2. 成绩评定方式

  3. 教材: 印刷图像处理——印刷工业出版社 参考书: 1.数字图像处理——电子工业出版社 2.MATLAB图像处理 ——电子工业出版社 3.印刷图像处理——上海科学技术出版社 使用软件: Adobe Photoshop、MATLAB

  4. 第三章 图像的编码与压缩 一、基本概念 1.图像压缩的发展 带宽压缩(模拟方法) 数字压缩 2.数据压缩 压缩标准 减少表示给定信息量所需的数据量 减少数据量的基本原理: 除去其中多余的数据。(数据冗余)

  5. 设n1 ,n2是两个表示相同信息的数据集合中所携栽信息单元的数量 相对的数据冗余RD可定义为: CR通常称为压缩率,定义为: ①当n1=n2时,CR=1,RD =0,表示相对于第二个数据 集合,信息的第一种表达方法没有数据冗余。 ②当n2<<n1时,CR→∞,RD →1,意味着显著的压缩 和大量的数据冗余。 ③当n2>>n1时,CR→0,RD →-∞,表示第二集合中含 有的数据大大超过原有的数据量——数据扩展

  6. 3.数据冗余 编码冗余、像素间冗余、心理视觉冗余 ①编码冗余: 如果图像的灰度级在编码时用的编码符号数多于表示每个灰度级实际所需的符号数,则这种编码存在编码冗余。 当一幅图像的灰度等级直接用二进制编码来表示,编码冗余总是存在的。

  7. :第k级灰度, 如果用于表示每个rk值的位(bit)数为 :灰度级为 的像素个数 设: L是灰度级数,n为像素总数,每个rk出现的概率 则表达每个像素所需的位数(比特数) 对M×N大小的图像进行编码所需的比特数为MNLavg

  8. 例1:如图表,说明图像变长编码的数据压缩 答:这是一幅8个灰度级的图像灰度分布——23 编码1:

  9. 则冗余水平为: 压缩比为: 6 .25 5 4 3 .125 2 1 0 0.0 1/7 2/7 3/7 4/7 5/7 6/7 1 0 编码2: 结论: 两个函数成反比 既:最短的编码字赋予图像中出现频率最高的灰度级。 用尽量少的bit表达尽可能多的灰度级,以实现数据的压缩

  10. ②像素间冗余 ◎图像的像素间存在较强的、有规则的相关性 ◎任何给定像素的值可以根据与这个像素相邻 的像素进行适当的预测,它的值可以通过以 与其相邻的像素值为基础进行推测。 ◎许多个像素对视觉的贡献是冗余的 例:原图像数据:234,223,231,238,235 压缩后的数据:234,-11, 8, 7, -3

  11. ③心理视觉冗余 ◎人眼感觉到的图像的亮度不仅取决于该区域的反射光,还要考虑到马赫带效应。 ◎眼睛对所有的视觉信息感受的灵敏度不同。 ◎会导致一定量信息的丢失——量化

  12. 数字化图像 二.数据压缩的模型 编码器 1.数据压缩模型 信源编码 数字化图像 f(x,y) 插入预制冗余数据来减少信道噪声的影响 信道编码 信道 信源解码 信道解码 解码器

  13. 信源编码器和信源解码器 f(x,y) 转换器 量化器 符号编码器 信道 信源编码器 转为减少像素间冗余的格式 减少编码冗余 减少心理视觉冗余 信道 符号解码器 反向转换器 信源解码器 与符号编码器操作次序相反 与转换器次序相反

  14. 2.压缩编码的类型 霍夫曼编码 算术编码 统计编码 预测编码 变换编码 其他变长编码 ①信息保持编码(无误差压缩、无损压缩) 减少图像像素间冗余、减少编码冗余 其压缩率为2~10

  15. 无损压缩算法中删除的仅仅是图像数据中冗余的信息,因此在解压缩时能精确恢复原图像,无损压缩的压缩比很少有能超过3:1无损压缩算法中删除的仅仅是图像数据中冗余的信息,因此在解压缩时能精确恢复原图像,无损压缩的压缩比很少有能超过3:1

  16. ②有损压缩 • 以图像重建的准确度上的让步而换取压缩能力 基本特征:编码器中是否存在量化器模块 量化器充当无误差预测的取整函数,将预测误差映射成有限范围内的输出 有损预测编码 将图像变换到变换系数集,将这些系数量化和编码 变换编码 变换的基函数——小波函数: 将大多数的可视信息压缩到少量的系数中,剩余的系数被量化。 小波编码

  17. 有损压缩是通过牺牲图像的准确率以实现较大的压缩率,如果容许解压图像有一定的误差,则压缩率可显著提高。有损压缩在压缩比大于30:1时仍然可重构图像,而如果压缩比为10:1到20:1,则重构的图像与原图几乎没有差别有损压缩是通过牺牲图像的准确率以实现较大的压缩率,如果容许解压图像有一定的误差,则压缩率可显著提高。有损压缩在压缩比大于30:1时仍然可重构图像,而如果压缩比为10:1到20:1,则重构的图像与原图几乎没有差别

  18. 复习: 1. 图像是逐点描述的,因此当分辨率一定时图像的硬拷贝输出质量。 A. 取决于显示器分辨率 B. 取决于显示卡质量 C. 取决于文件格式 D. 取决于输出设备记录精度 2 .是图像处理中图像重建的应用。 A. CT技术 B. 质量检测 C. 鱼群分布调查 D. GIS定位 3.如原图像数据为:100,120,140,160…..,压缩后图像数据为:100,20,20,20…..,则这种压缩算法是压缩了冗余。 A.心理视觉 B.像素间 C. 编码 D.没有压缩

  19. 4.信源编码器中的转换器压缩的是图像中的冗余。4.信源编码器中的转换器压缩的是图像中的冗余。 • A.心理视觉 B.像素间 C. 编码 D.没有压缩 • 5.以图像重建的准确度上的让步而换取压缩能力 • 的算法称为 。 • A. 有损压缩 B. 无损压缩 • 6. 对一幅100*100像素的图像,若每像素用8bit表示其灰度值,经霍夫曼编码后压缩图像的数据量为20000bit,则图象的压缩比为: • A.2:1 B.3:1 C.4:1D.1:2

  20. 如果信源 被平均输出 假设:信源符号 的事件概率为 且有: 定义编码效率为: 冗余度为: 编 码 效 率 越 大, 表 示 编 码 方法越好。 三.数据图像压缩方法 1.熵编码(统计编码) 每个信源输出的平均信息——熵Entropy

  21. 熵编码的原理:使编码后的图像平均码字长度尽可能接近图像熵熵编码的原理:使编码后的图像平均码字长度尽可能接近图像熵 ①哈夫曼编码——可变长编码方式 ◎减少编码冗余 ◎把最短的码字赋予出现概率最大的灰度级 哈夫曼编码的编码步骤: ◎将需要考虑的符号概率排序,并将最低概率的 符号联结为一个单一符号 ◎对每个化简后的信源进行编码,从最小的信源 开始,一直编码到原始的信源

  22. 例1.假设需要传递的信源和信源的概率如下所示,给出其哈夫曼编码,并计算信源的熵,平均码长,编码效率和冗余度例1.假设需要传递的信源和信源的概率如下所示,给出其哈夫曼编码,并计算信源的熵,平均码长,编码效率和冗余度 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04

  23. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1

  24. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1

  25. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3

  26. 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3 第四步 0.6 0.4 输入 a2 a6 a1 a4 a3 a5

  27. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3 第四步 0.6 0.4 0 1 0 1 0 1 0 1 0 1

  28. 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3 第四步 0.6 0.4 输入 a2 a6 a1 a4 a3 a5 0 1 0 1 0 1 0 1 0 1 a2=1

  29. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3 第四步 0.6 0.4 0 1 0 1 0 1 0 1 0 1 a6=00

  30. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3 第四步 0.6 0.4 0 1 0 1 0 1 0 1 0 1 a1=011

  31. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3 第四步 0.6 0.4 0 1 0 1 0 1 0 1 0 1 a4=0100

  32. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3 第四步 0.6 0.4 0 1 0 1 0 1 0 1 0 1 a3=01010

  33. 输入 a2 a6 a1 a4 a3 a5 输入概率 0.4 0.3 0.1 0.1 0.06 0.04 第一步 0.4 0.3 0.1 0.1 0.1 第二步 0.4 0.3 0.2 0.1 第三步 0.4 0.3 0.3 第四步 0.6 0.4 0 1 0 1 0 1 0 1 0 1 a5=01011

  34. 则:信源z的霍夫曼编码如图 信源熵:

  35. 编码效率为: 冗余度为: 所以对于信源X的霍夫曼的编码效率为97.3%; 尚有2.7的冗余度.

  36. 霍夫曼解码: 通过查询表的方式完成 按照从左到右的方法对串中每个符号进行分析来解码 如图编码串: 缺点: ◎对于过短的文件进行编码,意义不大 ◎用于通讯网络,会引起较大的延时

  37. 算术编码——解决哈夫曼编码不能解决的问题 设:字符序列{x,y}对应的概率为{1/3,2/3},Nx和Ny分别表示字符x和y的最佳码长,则根据信息论有: 字符x、y的最佳码长分别为1.58bit和0.588bit,这是不可能实现 即采用哈夫曼方法对{x,y}的码字分别为0和1,也就是两个符号信息的编码长度都为1。对于出现概率大的字符y并未能赋予较短的码字;

  38. 算术编码分为固定方式和自适应方式两种编码 • 用0~1之间的实数间隔进行编码,信源符号与码字之间不存在一一对应的关系 符号概率:决定压缩编码的效率; 信源符号的间隔 编码间隔:符号压缩后的输出 编码原理:将编码的信息表示成实数0和1之间的一个间隔,信息越长,编码表示他的间隔越小,表示这一间隔所需的二进制就越多 图像数据看作是由多个符号组成的字符序列,对该序列递归地进行算术运算后,成为二进制分数;

  39. 例2:设图像信源编码可用a、b、c、d这4个符号来表示,若图像信源字符集为{dacba},信源字符出现的概率分别如下表所示,采用算术编码对图像字符集编码。 解答:(1) 根据已知条件和数据可知,信源各字符在区间[0,1]内的子区间间隔分别如下: a=[0.0 ,0.4) b=[0.4 ,0.6) c=[0.6 ,0.8) d=[0.8 ,1.0)

  40. (2) 计算中按如下公式产生新的子区间: (3) 第1个被压缩的字符为“d”,其初始子区间 为[0.8 ,1.0) (4) 第2个被压缩的字符为“a”,由于其前面的字符取值区间为[0.8 ,1.0)范围,因此,字符“a”应在前一字符区间间隔[0.8 ,1.0)的[0.0 ,0.4)子区间内,根据公式可得: StartN=0.8+0.0×(1.0-0.8)=0.8 EndN=0.8+0.4×(1.0-0.8)=0.88

  41. (5) 第3个被压缩的字符为“c”,由于其前面的字符取值区间为[0.8 ,0.88)范围内,因此,字符“c”应在前一字符区间间隔[0.8 ,0.88)的[0.6 ,0.8)子区间内,根据公式可得: StartN=0.8+0.6×(0.88-0.8)=0.848 EndN =0.8+0.8×(0.88-0.8)=0.864 (6) 第4个被压缩的字符为“b”,由于其前面的字符取值区间为[0.848 ,0.864)范围内,因此,字符“b”应在前一字符区间间隔[0.848 ,0.864)的[0.4 ,0.6)子区间内,根据公式可得: StartN =0.848+0.4×(0.864- 0.848)=0.8544 EndN =0.848+0.6×(0.864- 0.848)=0.8576

  42. (7) 第5个被压缩的字符为“a”,由于其前面的字符取值区间为[0.8544 ,0.8)范围内,因此,字符“a”应在前一字符区间间隔[0.8544 ,0.8576)的[0.0 ,0.4)子区间内,根据公式可得: StartN=0.8544+0.0×(0.85760.8544)=0.8544 EndN =0.8544+0.4×(0.8576-0.86544)=0.85568 经过上述计算,字符集{dacba}被描述在实数[0.8544 ,0.85568)子区间内,即该区间内的任一实数值都惟一对应该符号序列{dacba}; 因此,可以用[0.8544 ,0.85568)内的一个实数表示字符集{dacba}。

  43. [0.8544 ,0.85568)子区间的二进制表示形式为 [0.1101101010000110 ,0.1101101100001101); 在该区间内的最短二进制代码为0.11011011,去掉小数点及其前的字符,从而得到该字符序列的算术编码为11011011。 算术编码可以通过硬件电路实现,在上述乘法运算,可以通过右移来实现,因此在算术编码算法中只有加法和移位运算。 根据上述运算结果,编码11011011惟一代表字符序列{dacba},因此,平均码字长度为: 8/5=1.6 bit/字符

  44. 0 1 1/4 3/4 [ 题 ] 己知信源 X = 试对 1011 进行算术编码。 [ 解 ] (1) 对二进制信源只有两个符号“0”和“1”,设置小概率Qe =1/4,大概率Pe = 1 – Qe = 3/4. (2) 设 C 为子区间的左端起始位置,A 为子区间的宽度,符号“0”的子区间为[0,1/4), 符号“1”的子区间为[1/4, 1)

  45. (3) 初始子区间为[0, 1), C=0, A=1,子区间按以下各步依次缩小: 步序 符号 C A 1 1 0+1*1/4=1/4 1*3/4=3/4 2 0 1/4 3/4*1/4=3/16 3 1 1/4+3/16*1/4=19/64 3/16*3/4=9/64 4 1 19/64+9/64*1/4=85/256 9/64*3/4=27/256 1 0 1/4 1 0 7/16 1 19/64 1 85/256 112/256

  46. 最后的子区间左端(起始位置) C = ( 85/256)d = (0.01010101)b 最后的子区间右端(终止位置) C+A = (112/256) d = (0.01110000) b 编码结果为子区间头、尾之间取值,其值为0.011, 可编码为011,原来4个符号1011现被压缩为三个符号011。

  47. 行程:具有相同灰度值的像素序列 ③行程长度编码:( RLE )消除像素间冗余 • 编码思想: • 用行程的灰度和行程的长度代替行程本身 • 例:设重复次数为 iC, 重复像素值为 iP • 编码为:iCiP iCiP iCiP • 编码前:aaaaaaabbbbbbcccccccc • 编码后:7a6b8c • ◎对于有大面积色块的图像,压缩效果很好 • ◎对于纷杂的图像,压缩效果不好,

  48. ④ LZW编码——字串表编码:消除像素间冗余 • ◎对信源符号的可变长度序列分配固定长度编码 ①构造一个对信源符号进行编码的编码本 或(“字典”) 固定大小:TIFF、PDF格式中应用 可变大小:GIF格式中应用 ②用字典中的码字对信源序列进行编码 算法的核心:寻找能识别的最长模式 压缩比:1:1 ~ 3:1

  49. 例:一个4×4、8位图像 构造一个512字节(9位)的字典

More Related