1 / 51

第三章 信源编码(一) 离散信源无失真编码

第三章 信源编码(一) 离散信源无失真编码. 3.1 信源及其分类 3.2 离散无记忆信源的等长编码 3.3 离散无记忆信源的不等长编码 3.4 最佳不等长编码. 3.1 信源及其分类. 信源及其分类. 离散信源 …U -2 ,U -1 ,U 0 ,U 1 ,U 2 ,… , U l 取自字母表 A 无记忆信源 : U l 彼此独立 有记忆信源: U l 彼此相关 简单信源: U l 独立同分布 平稳信源,各态历经源 M 阶记忆源(有限状态马尔可夫链) 连续信源 时间离散连续源 随机波形源. 3.2 离散无记忆源的等长编码.

hallam
Download Presentation

第三章 信源编码(一) 离散信源无失真编码

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第三章 信源编码(一)离散信源无失真编码

  2. 3.1 信源及其分类 • 3.2 离散无记忆信源的等长编码 • 3.3 离散无记忆信源的不等长编码 • 3.4 最佳不等长编码

  3. 3.1 信源及其分类

  4. 信源及其分类 离散信源 …U-2,U-1,U0,U1,U2,…,Ul取自字母表A • 无记忆信源: Ul彼此独立 • 有记忆信源:Ul彼此相关 • 简单信源: Ul独立同分布 • 平稳信源,各态历经源 • M阶记忆源(有限状态马尔可夫链) 连续信源 • 时间离散连续源 • 随机波形源

  5. 3.2 离散无记忆源的等长编码

  6. 离散无记忆源 • 字母表A={a1,…,aK},概率p1,…,pK,长为L的源输出序列uL={u1,…,uL},共有KL种序列 • 码符号字母表B={b1,…,bD},以码符号表示源输出序列,D元码 • 等长D元码,不等长D元码 • 单义可译码,每个消息都至少有一个码字与之对应。 • 单义可译码存在充要条件DN≥KLN≥LlogK/logD

  7. DMS的等长编码 • NlogD≥LH(U) • H(U)是统计平均值,L达到无限时,一个具体的源输出序列的平均每符号的信息量才等于H(U) • 选L足够长,使 NlogD≥L[H(U)+eL]

  8. DMS序列的自信息量

  9. 弱、强e典型序列集

  10. 信源划分定理 非典型序列集 序列集合 典型序列集

  11. 典型序列的比例

  12. 编码速率和等长编码定理 • R=(1/L)logM=(N/L)logD, M为码字总数 • 定义:对于给定信源和编码速率R以及任意e>0,若有L0,以及编译码方法,使得L>L0,错误概率小于e,R是可达的 • 等长编码定理 R>H(U),R是可达的,R<H(U)是不可达的 • 编码效率=H(U)/R

  13. 3.3 DMS的不等长编码

  14. 平均码长

  15. 几个定义 • 唯一可译码 • 逗点码,无逗点码 • 字头或前缀 • 异字头码或异前缀码 • 树码,满树,非满树,全树 • 树码构造异字头码

  16. 例子

  17. Shannon-Fano编码 • D元码 • 每次信源符号化为概率近似相等的D个子集 • 这样可以保证D个码元近似等概,每个码字承载的信息量近似最大,码就近似最短。 • 理想情况I(ak)=nklogD, p(ak)=D-nk

  18. Kraft不等式 长度为n1,n2,…,nK的D-元异字头码存在的充分必要条件是 二元异字头码Kraft不等式等号成立 • 定理:任意唯一可译码必满足Kraft不等式

  19. 不等长编码定理 编码速率

  20. 3.4最佳不等长编码

  21. Huffman编码的最佳性 • 所谓最佳:是指在所有可能的编码方法中,其编码得到的平均码长最短。 • 定理3.4.1:对于给定信源,存在有最佳惟一可译二元码,其最小概率的两个码字CK-1和CK的长度最长且相等,它们之间仅最后一位码元取值不同(一个为0,另一个为1)。

  22. Huffman编码的最佳性 • 对信源 • 可对aK-1和aK的码字的最后一位分别指定为1和0,然后作一辅助集

  23. Huffman编码的最佳性 • 定理3.4.2 对辅助集U ’为最佳的码,对原始消息集U也是最佳的。 • 若C’1,C’2,…,C’K-1是对辅助集U '的最佳码,相应码长为n’1,n’2,…,n’K-1,则对U的码字C1,C2,…, CK的码长为 • nk= n’kk≤K–2 • nk= n’K-1+1 k=K, K–1

  24. Huffman编码的最佳性

  25. 例:Huffman编码过程

  26. 例:Huffman编码过程

  27. Shannon-Fano编码例子 • cabcedeacacdeddaaabaababaaabbacdebaceada 共40个字母 • 频度 • a - 16,b - 7,c - 6,d - 6,e - 5 1) 将给定符号按照其频率从大到小排序。 • a - 16 b - 7 c - 6 d - 6 e – 5 2) 将序列分成左右两部分,使得左部频率总和尽可能接近右部频率总和。有: • (a, b), (c, d, e)

  28. Shannon-Fano编码例子 • 3) 我们把第二步中划分出的上部作为二叉树的左子树,记 0,下部作为二叉树的右子树,记 1。 • 4) 分别对左右子树重复 2 3 两步,直到所有的符号都成为二叉树的树叶为止。 a 00 b 01 c 10 d 110 e 111 0 1 0 1 0 1 0 1 a b c d e

  29. Shannon-Fano编码例子 • 编码结果 • Cabcedeacacdeddaaabaababaaabbacdebaceada • 10 00 01 10 111 110 111 00 10 00 10 ...... • 长91bit • 采用3bit等长编码需120bit • 采用ASCII码需要320bit

  30. 采用Huffman编码 a 0 a 16 0 b 100 13 b 7 0 c 101 0 c 6 24 1 d 110 1 d 6 11 e 111 0 1 e 5 总比特数88,信源熵为86.601bit 1

  31. Huffman编码 • Shannon-Fano编码构造二叉树是自树根到树叶,很难保证最佳性。 • Huffman编码则是从树叶到树根,是最佳的

  32. 总结 • Huffman需要知道信源的概率分布,这在实际中有时是比较困难的。 • 采用半静态模型、自适应模型、markov模型,部分匹配预测模型等等解决这一问题。

  33. D元Huffman编码 • 共有K个符号,概率最小的R个符号码长最长 • K+B=D+m(D-1) • 注意B<D-1 K-2=m(D-1)+D-2-B B=D-2-((K-2) mod (D-1)) R=2+((K-2) mod (D-1)) R个 B个

  34. Shannon-Fano-Elias编码 累计分布函数 修正累计分布函数

  35. Shannon-Fano-Elias编码 • 采用 的数值作为ak的码字 • 码长

  36. Shannon-Fano-Elias编码

  37. Shannon-Fano-Elias编码

  38. 算术码 应用于JPEG2000,H.263等图像压缩标准

  39. 1 0 P(0) P(1) F(0) F(1) 算术码 • 信源序列(u1u2…un)的累计分布 • 算术编码是计算序列的累计分布,用累计分布值表示序列,所以称为算术编码 • 以二元信源输出序列的编码为例01110

  40. F(1) P(00) P(01) F(0) F(01) 算术码 P(010) P(011) F(011) P(0110) P(0111) P(01110) P(01111) F(0111) F(01111)

  41. 算术码 • 信源符号序列u对应区间的宽度等于符号序列的概率

  42. 算术编码 • F(u)将[0,1)分割成许多小区间,取小区间内的一个点代表该序列,以该点数值的二进制小数表示该序列,码字长度为

  43. 算术编码

  44. 例: • P(0)=0.25,P(1)=0.75, u=11111100 P(u=11111100)=0.7560.252 L=7 F(s)=0.110100100111 C=1101010 编码效率92.7%

  45. LZ编码 • 利用字典编码方法 • 信源符号A=(a1…aK) • 将序列分为不同的段 • 取最短长度的连续符号构成段,保证互不相同。 • 先取一个符号分段,若与前面段相同,就再取一个符号,直至序列结束 • 得到字典表,码字由段号加后一个符号组成。 • 单符号的码字,段号为0

  46. LZ编码

  47. LZ编码 1 2 3 4 5 6 7 00000 00110 00011 00001 10000 00100 01110

  48. + LZ编码 • 设长为L的信源序列u分为M(u)个码段,每段短语的二元码符号长度为 • 总码长 • 平均

  49. LZ编码 • 设长度为l段有Kl种。若把长为L的信源序列u分为M(u)个码段后,设最长的段长为lmax,而且所有小于等于lmax的段型全部都有,则

  50. LZ编码 典型段,ak出现的次数为lmaxp (ak)

More Related