250 likes | 416 Views
ç¬¬ä¸€ç« ï¼šç»ªè®º. 什么是信æºç¼–ç ? 为什么è¦ä¿¡æºç¼–ç / æ•°æ®åŽ‹ç¼©ï¼Ÿ 为什么å¯ä»¥ä¿¡æºç¼–ç / æ•°æ®åŽ‹ç¼©ï¼Ÿ æ€Žæ ·è¿›è¡Œä¿¡æºç¼–ç ?. æ•°å—通信系统. 调制. 物ç†ä¿¡é“需è¦ç”µä¿¡å·ã€æ— 线电信å·æˆ–å…‰ä¿¡å· è°ƒåˆ¶å™¨æŽ¥æ”¶ä¿¡é“ç¼–ç 器的输出,并输出适åˆç‰©ç†ä¿¡é“çš„ä¿¡å·. ä¿¡é“ç¼–ç . ç”±äºŽåœ¨ä¼ è¾“è¿‡ç¨‹ä¸å™ªå£°å’Œå¹²æ‰°åœ¨æ‰€éš¾å…,在信é“ç¼–ç 器ä¸å¼•å…¥ä¸€å®šå†—余,在信é“解ç 端利用æ¤å†—ä½™æ¥å°½å¯èƒ½åœ°é‡å»ºè¾“å…¥åºåˆ— å¯é æ€§ï¼šå¢žåŠ å†—ä½™. ä¿¡æºç¼–ç . 对信æºè¿›è¡Œ 压缩 ã€æ‰°ä¹±å’ŒåŠ 密,用最少的ç å—æœ€å®‰å…¨åœ°ä¼ è¾“æœ€å¤§çš„ä¿¡æ¯é‡ 有效性 :去除冗余 æ•°æ®åŽ‹ç¼© :用紧致的方å¼è¡¨ç¤ºä¿¡æ¯çš„æŠ€æœ¯æˆ–ç§‘å¦ ç‰©ç†ä¸–界的类比:装包.
E N D
第一章:绪论 • 什么是信源编码? • 为什么要信源编码/数据压缩? • 为什么可以信源编码/数据压缩? • 怎样进行信源编码?
调制 • 物理信道需要电信号、无线电信号或光信号 • 调制器接收信道编码器的输出,并输出适合物理信道的信号
信道编码 • 由于在传输过程中噪声和干扰在所难免,在信道编码器中引入一定冗余,在信道解码端利用此冗余来尽可能地重建输入序列 • 可靠性:增加冗余
信源编码 • 对信源进行压缩、扰乱和加密,用最少的码字最安全地传输最大的信息量 • 有效性:去除冗余 • 数据压缩:用紧致的方式表示信息的技术或科学 • 物理世界的类比:装包
为什么需要压缩? • 对物理世界:没有足够的空间 • 对数字世界: • Q:带宽/存储会指数增长——为什么还要压缩呢? • A:数据产生增长得更快! • 例: • 1秒钟的CDDA音频: • 44100 个样本 x 2 个通道 x 16 个比特/样本 = 1,411,200 比特 • 1秒钟的CCIR 601视频: • 720 x 576 像素/帧 x2 通道 x8 比特/像素 x25帧/秒 = 166Mb/s • 2个通道:亮度+ 色度(4:2:2)
为什么需要压缩? (2) • 更多例子:
为什么需要压缩? (3) • 如果没有压缩 • 很多应用/服务不可行 • 如视频流服务 • 很多其他应用/服务更贵 • 如模拟移动电话 vs.数字移动电话 • 为什么不是所有的情况都用压缩形式呢? • 数据产生/使用采用非压缩形式更方便,而不考虑存储
为什么可以压缩? • 自然界中的大多数数据都是冗余的:任何非随机选择的数据都有一定结构,可利用这种结构得到数据的更紧致表示 • 统计冗余:大多数常见的压缩算法都利用了该冗余 • 字母冗余:英文中字母E最常出现,而Z很少出现 • 文本冗余:字母Q后常跟有字母U • 图像冗余:自然图像中相邻像素的颜色往往比较相近 • … • 数据的物理产生过程 • 如利用人类的发声系统,设计语音压缩算法 • 可用在军事、移动通信和玩具中的语音合成中 • 数据的应用:感知冗余 • 听觉冗余:如mp3音频编码 • 视觉冗余
例:空间冗余 • 图像中存在大面积部分相似或完全一样的像素 • 水平相邻像素的联合直方图 pmf
例:时间冗余 • 视频图像前后几帧的内容变化不大(位置可能不同,可用运动估计方法找到对应位置)
例:结构冗余 • 图像中物体表面纹理等结构存在冗余
基本术语 • 无损编码:x = x’ • 亦称为熵编码(entropy coding)或可逆编码(reversible coding) • 有损编码:xx’ • 亦称为不可逆编码(irreversible coding) 信源 码流 解压缩后的表示 x’ x y 编码器 解码器
基本术语 (2) • 压缩率:|x|/|y| • |x| 表示编码 x 需要的比特数目 • 如 |x| = 65,536, |y| = 16384, 压缩率 = 4:1 • 即数据的容量减少了(|x|-|y|)/|y| = 75% • 其他表示编码性能的度量 • 码率:比特/样本 • 如 ASCII: 8 比特/字符,RGB: 24/48/72 比特/像素 • 质量:对有损编码而言 • 人类感知到的x与 x’ 之间的差异或在数学上x与 x’ 之间的差异 • 复杂度 • 算法的运算量和存储量 • 编码器和解码器的复杂度:对称/非对称 • 时延
建模 & 编码 • 怎样开发压缩算法? • 第一阶段:建模 • 提取冗余信息 • 冗余 可预测性 • 第二阶段:编码 • 用二进制表示模型与观测数据之间的差异 • 亦称为残差(residual)
例1:全局预测模型 • 考虑输入序列: • Sn = 9, 11, 11, 11, 14, 13, 15, 17, 16, 17, 20, 21 • 二进制表示需要5比特/样本 • 考虑模型: • Ŝn = n + 8: • 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 • 残差为: • en = Sn - Ŝn: 0, 1, 0, -1, 1, -1, 0, 1, -1, -1, 1, 1 • 编码:2 比特/样本 • 编码机制 == 模型 + 残差 • 注意模型也需要编码 (通常在算法中体现)
例2:局部预测模型 • 考虑输入序列: • Sn = 27, 28, 29, 30, 30, 32, 31, 31, 29, 28, 27 • 考虑模型: • Ŝ1 = 0; Ŝn = Sn-1 for n > 1 • 0, 27, 28, 29, 30, 30, 32, 31, 31, 29, 28 • 残差: • {en}= 27, 1, 1, 1, 0, 2, -1, 0, -2, -1, -1 • 可以用少得多的比特编码 • 预测编码 • 利用前面的样本来预测之后的样本 • 对利用时间冗余很有用 • 如在音频和视频中
编码实例:盲文 • 由路易·布莱尔(Louis Braille)发明:3 x 2凸印点阵 • 26个盲文字母 • 一些盲文字和字符串 • 例:“Be nice to others”
编码实例:Morse码 • 19世纪中叶,由 Samuel Morse发明 • 每个字符用“ . –” 表示
编码实例:Morse码 (2) • Morse码与字母频率: • 基本原则:用较短的码字表示出现频率高的字符,较长的码字表示出现频率低的字符 • 但也不是100% 满足(如l vs. m ) • 这就是利用统计冗余编码的基本思想
怎样选择编码技术 • 编码技术的性能在很大程度上取决于信源的性质(数据内在的冗余) • 对文本编码效果很好的编码技术可能在图像压缩上表现欠佳 • 课程将讲述与文本、图像、语音、音频和视频信源相关的编码技术 • 人们对技术的熟悉程度:hammer 是技术,也是艺术
会议 Data Compression Conference (DCC) SPIE conf. Video communication and Image Processing (VCIP) IEEE conf. Image Processing (ICIP) IEEE symp. Circuits and Systems (ISCAS) IEEE conf. Multimedia and Expo (ICME) Picture Coding Symposium (PCS) Pacific-Rim Conference on Multimedia (PCM) IEEE conf. Acoustics, Speech, and Signal Processing (ICASSP) 刊物 IEEE Trans. Circuits and Systems for Video Technology IEEE Trans. Information Theory IEEE Trans. Image Processing IEEE Trans. Signal Processing … 相关会议、刊物
一些有用的链接 • http://datacompression.info/Tutorials.shtml • http://www.itu.int/publications/default.aspx • http://www.stanford.edu/~bgirod/courses.html
总结 • 数据压缩的定义(非正式地) • 无损编码 • 有损编码 • 压缩算法的基本方式: • 建模 + 编码 • 国际上一些早期编码标准的例子 • Braille, Morse
下节课内容 • 第二章:无损编码的数学基础 • 阅读教材 • 第1章内容:本节课内容 • 第2章内容:下节课内容 • 《信息论》中熵、信源编码理论基础部分