350 likes | 561 Views
数字电视原理与应用. Principle and Application of Digital Television. 主讲:张文军教授 上海交通大学电子信息工程学院 Email:zhangwenjun@sjtu.edu.cn 2006~2007 学年第一学期. 1. 2. 3. 数字电视概述 电视技术的发展历程 模拟电视原理 数字电视的发展. 数字电视基本原理 视频压缩原理 MPEG-2 视频编码及测量 MPEG-2 音频编码及测量 MPEG-2 系统及其测量 数字调制基础 数字电视的纠错编码原理. 数字电视相关标准 DVB-S 标准及相关测量
E N D
数字电视原理与应用 Principle and Application of Digital Television 主讲:张文军教授 上海交通大学电子信息工程学院 Email:zhangwenjun@sjtu.edu.cn 2006~2007学年第一学期
1 2 3 • 数字电视概述 • 电视技术的发展历程 • 模拟电视原理 • 数字电视的发展 • 数字电视基本原理 • 视频压缩原理 • MPEG-2视频编码及测量 • MPEG-2音频编码及测量 • MPEG-2系统及其测量 • 数字调制基础 • 数字电视的纠错编码原理 • 数字电视相关标准 • DVB-S标准及相关测量 • DVB-C标准及相关测量 • OFDM技术 • DVB-T标准及相关测量 • ATSC和ISDB-T标准及其测量 • 我国的数字电视标准 课程安排 MPEG-2音频编码及其测量,class 04
数字电视基本原理 • 视频压缩原理 ——第5章 • MPEG-2视频编码部分及其测量 ——第4,6,11章 • MPEG-2音频编码及其测量 —第7章 • MPEG-2系统部分及其测量 ——第3,9,10章 • 数字调制基础 ——第12章 • 数字电视中的纠错编码原理 ——补充 MPEG-2音频编码及其测量,class 04
2.音频编码历史 3.人耳心理声学模型 4.音频编码的基本原理 5.子带编码 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 MPEG-2音频编码及其测量,class 04
1、数字音频源信号 • 人耳动态范围大约140dB,听觉带宽最大20kHz。 • 在模拟音频信号采样数字化之前,要经过低通滤波器进行带限。 • 然后进行模数转换: • 采样分辨率至少16bits • 采样频率: • 32kHz——MPEG标准仍支持,但已经不用 • 44.1kHz——音频CD • 48kHz/96kHz——演播室质量 • 16bit48kHz采样的码率每个信道786kbit/s,立体声信号近似码率为1.5Mbit/s 16 bit A 1.5Mbit/s Up to 768kbit/s D Right 15~20kHz BW Compression 32/44.1/48kHz 音频采样频率 16 bit A Up to 768kbit/s D 100~400kbit/s Left 15~20kHz BW 32/44.1/48kHz 音频采样频率 图7.1 数字音频源信号 MPEG-2音频编码及其测量,class 04
1、数字音频源信号 • 音频压缩的目标是将1.5Mbit/s码率降低到100~400kbit/s • MP3音频文件通常码率为32kbit/s • 与视频压缩相似,音频压缩也有两种方式: • 冗余度消除——省略多余信息,无损 • 不相关性消除——省去接收端(人耳)不能察觉的信息,有损 • 所有音频压缩方法基于心理声学模型,利用人耳的不足,消除音频信号中的不相关信息。 • 人耳不能察觉频域和时域中强声音脉冲邻近的声音 • 对人耳而言,某些声音可以掩盖其他低幅度的声音信号。 MPEG-2音频编码及其测量,class 04
3.人耳心理声学模型 4.音频编码的基本原理 5.子带编码 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 2.音频编码历史 MPEG-2音频编码及其测量,class 04
2、音频编码历史 • MASCAM • 1988,Institut für Rundfunktechnik(IRT)为DAB(digital audio broadcasting)系统提出 • MUSICAM(masking pattern universal subband integrated coding and multiplexing) • 1989,CCETT,Philips和Matsushita联合提出 • 用于DAB • 上两种都基于子带编码,音频信号分成大量子带,每个子带进行或大或小程度的不相关性消除。 • ASPEC方法 • Fraunhofer Gesellschaft和Thomson提出 • 基于变换编码 • 利用DCT将时域音频信号变换到频域,然后消除不相关性信号分量。 MPEG-2音频编码及其测量,class 04
2、音频编码历史 • 子带编码的MUSICAM和变换编码的ASPEC都包含在MPEG-1音频压缩标准(1991 ISO/IEC 11172-3)中,分为3层: • Layer I和II——MUSICAM编码 • Layer III(MP3音频文件)——ASPEC编码 • MP3不是MPEG-3,MPEG-3起初为实现HDTV,但HDTV后来集成到MPEG-2,所以MPEG-3不存在。 • MPEG-2音频(1994 ISO/IEC 13818-3)在MPEG-1基础上又增加了layer II MC(multichannel) MPEG-2音频编码及其测量,class 04
子带编码 声道 ISO/IEC 11172-3 MPEG1音频,1990/91 Layer I,低复杂度,低压缩比 Layer II,中复杂度 DCT变换编码 Layer III,高复杂度,高压缩,子带和变换编码,mp3 ISO/IEC 13818-3 MPEG2音频,1994 Layer I,II,III与MPEG-1相同 Layer II,MC(5.1声道) 2、音频编码历史 MASCAM IRT Munich,1988 MUSICAM IRT,CCETT,Philips, Matsushita,1989 ASPEC Fraunhofer Gesellschaft, Thomson MPEG-2音频编码及其测量,class 04
2、音频编码历史 • 美国Dolby实验室提出的Dolby数字音频标准(AC-3) • 1990年提出, • 1991年12月,第一部AC-3音频编码电影“Star Track VI”公映 • 许多电影采用Dolby数字技术。 • 美国数字地面广播ATSC只采用AC-3音频编码。 • 其他一些国家(如澳大利亚)将同时采用MPEG和AC-3音频。 • MPEG和AC-3音频的质量基本没有差别,现代MPEG解码芯片支持两种方法。 • DVD同时支持PCM音频、MPEG音频和AC-3音频编码。 MPEG-2音频编码及其测量,class 04
2、音频编码历史 • AC-3的应用 • 电影 • ATSC • MPEG-2 TS流 • DVD • AC-3基于MDCT(modified DCT),5.1声道,每声道128kbit/s • MPEG支持新音频编码方法: • MPEG-2 AAC(advanced audio coding) ISO/IEC 13818-7 • MPEG-4 ISO/IEC 14496-3(自然/合成音频对象) • MPEG-7 ISO/IEC 15938 MPEG-2音频编码及其测量,class 04
2.音频编码历史 4.音频编码的基本原理 5.子带编码 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 3.人耳心理声学模型 MPEG-2音频编码及其测量,class 04
3、人耳心理声学模型 • 冗余度降低(无损)和不相关性降低(有损)可以将原始声音信号码率降低90%。 • 不相关性降低依赖于人耳的心理声学模型——Zwicker教授 • 知觉编码——人耳不能分辨的声音分量不传输。 • 人耳剖面图,分为三个主要部分:外耳、中耳、内耳。 图7.3 人耳剖面图 MPEG-2音频编码及其测量,class 04
锤骨 鼓膜 隔膜 内耳 低频接收器 外耳 听觉神经 高频接收器 中耳 耳咽管 3、人耳心理声学模型 • 外耳实现阻抗匹配功能,声音通过空气传输,类似3kHz区域回声递升滤波器。人耳灵敏度最高的范围正是:3kHz~4kHz。 • 耳膜或鼓膜将声波转换为机械振动,通过锤骨、砧骨、镫骨传送到通向感觉内耳的膜状窗。 • 耳膜前后的空气压力必须相同,这由耳膜后面的咽鼓管来保证,咽鼓管使得该区域与咽部相连通。当我们到很高的高度时,耳内会有很大压力,通过吞咽动作,咽鼓管内的黏膜可以补偿压力。 图7.3 人耳剖面图 图7.4 人耳的技术模型 MPEG-2音频编码及其测量,class 04
锤骨 鼓膜 隔膜 内耳 低频接收器 外耳 听觉神经 高频接收器 中耳 耳咽管 3、人耳心理声学模型 • 内耳有平衡器官,由几个充满液体的弓形和耳蜗构成。 • 耳蜗是真正的听觉器官,直接听到声音。如果展开耳蜗会在其入口处发现高频传感器,然后是中频传感器,最末端是低频传感器。 • 耳蜗由一个螺旋型管道组成,内部有一个更小的膜状螺旋型通道,从前到后越来越宽。 • 内耳膜上分布着频率选择、声音采集传感器,将听觉神经连接到大脑。 图7.3 人耳剖面图 图7.4 人耳的技术模型 MPEG-2音频编码及其测量,class 04
3、人耳心理声学模型 • 听觉神经传送的电信号幅度近似为100mVpp,电脉冲的重复率为1kHz数量级,这个速率包含的信息是某个频率音调的音量。音调的音量越高,重复率越大。 • 每个频率传感器通过一个独立的神经线与大脑通讯。 • 传感器的频率选择性在低频处最大,随频率升高而降低。 图7.5 人耳的机械/电子模型 MPEG-2音频编码及其测量,class 04
与音频 编码相关的人耳特性 • 人耳的灵敏度在很大程度上依赖于频率。 • 低于20Hz,高于20kHz的声音信号人耳无法听到。 • 人耳最敏感范围为3kHz~4kHz,在该范围之外,人耳敏感度向高频和低频两个方向降低。 • 低于某个阈值的声音人耳无法听到,该阈值取决于频率,声音信号中低于该阈值的分量无需传送,对人耳而言是不相关信息。 图7.6 听觉阈值与频率关系 MPEG-2音频编码及其测量,class 04
与音频 编码相关的人耳特性 • 掩蔽现象: • 例如一个测试人员听一个幅度固定的1kHz正弦波,同时添加其他不同频率和幅度的正弦波,发现在1kHz附近低于某个阈值的其他正弦信号听不到,该阈值取决于频率,称作掩蔽阈值。 • 掩蔽阈值曲线取决于掩蔽信号的频率,掩蔽信号的频率越高,被掩蔽的范围越大。这一特性叫做频域掩蔽。 • 在掩蔽阈值以下的声音分量不需传送。 图7.7 频域掩蔽 图7.8 掩蔽阈值 MPEG-2音频编码及其测量,class 04
与音频 编码相关的人耳特性 • 时域掩蔽 • 时域中一个强脉冲会掩蔽该脉冲前后低于某个阈值的声音信号。 • 这种现象,尤其是前掩蔽,很难想象,但可以进行很好的解释。是由于人耳的有限时域分辨率,再加上信号通过听觉神经传输到大脑的方式。 • 目前的音频压缩方法只利用了频域掩蔽。 图7.9 时域掩蔽 MPEG-2音频编码及其测量,class 04
2.音频编码历史 3.人耳心理声学模型 5.子带编码 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 4.音频编码的基本原理 MPEG-2音频编码及其测量,class 04
4、音频编码的基本原理 • 量化噪声: • 对完全调制正弦信号进行模数转换,由于量化噪声的影响,分辨率为N bits时的信噪比约为6NdB(经验值) • 8bit分辨率的信噪比为48dB • 16bit分辨率的信噪比为96dB • 音频信号通常采样分辨率为16bit或更高 • 16bit分辨率仍然不能满足人耳的动态范围140dB Irrelevancy reduction Redundancy reduction Frequency Subbands Audio in Filtering process Time: fine Frequency: coarse Subband Quantizer Data Coding Compressed Audio out Spectrum Analysis Time: coarse Frequency: fine Psycho- acoustic model 图7.10 基于知觉编码的音频编码原理框图 MPEG-2音频编码及其测量,class 04
4、音频编码的基本原理 • 数字声音源信号在编码器中分为两个分支: • 滤波 • 将声音信号经过滤波分为许多子带。 • 如果某个子带的信号值低于掩蔽阈值,该子带被其他子带完全掩蔽,不需传送,该子带信息对人耳完全不相关。 • 滤波过程的时域分辨率必须足够高,否则会丢失时域信息;相应只需较低的频域分辨率。 • 频谱分析 • 通过FFT进行频谱分析。 • 测定低时域分辨率和高频域分辨率声音信号的成分。 • 基于心理声学模型(掩蔽效应),可以确定出当前信号中的不相关频率分量。 • 频谱分析模块后是心理声学模型模块,该模块决定子带选择完全抑制或者选择或粗或细量化两种方式。 • 量化通过子带量化器控制。 • 然后通过特殊数据编码进行冗余度降低。 MPEG-2音频编码及其测量,class 04
4、音频编码的基本原理 • 不相关性降低的另一种可能性: • 如果某个子带信号只有部分边缘在掩蔽阈值以上,该子带的量化可以很粗,使得该子带量化噪声低于阈值而听不到。 • 低于听觉阈值的信号不需传送。针对各子带的不同听觉阈值,可以选择或粗或细的量化,使得量化噪声总是低于阈值。频率越高,分辨率可以越低。 • 知觉编码有多种方式实现: • 子带编码 • 变换编码 • 混合编码 MPEG-2音频编码及其测量,class 04
2.音频编码历史 3.人耳心理声学模型 4.音频编码的基本原理 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 5.子带编码 MPEG-2音频编码及其测量,class 04
Audio in Q BP Q Frequency subbands Compressed Audio out Q Bandpass filter Example MPEG layer I II FFT Psychoaoustic model 512 point FFT @MPEG Layer 1 1024 points @Layer II Every 24ms BP BP 5、 MPEG Layer I,II子带编码 • 声音信号通过32个滤波器组成的滤波器组,将信号分成750Hz的频率子带,每个子带有独立量化器。 • 量化器受FFT模块和心理声学模型模块控制。 • 量化器可以完全抑制子带或减少量化阶数。 图7.11 子带编码 MPEG-2音频编码及其测量,class 04
5、 MPEG Layer I,II子带编码 • Layer II中,每隔24ms对1024个采样值做FFT,即心理声学模型模块的输入每隔24ms变化。 • 在24ms间隔中,子带根据心理声学模型模块的信息做不相关性降低。 • 认为24ms内信号不变。 • 各子带的听觉阈值不同,因此不同子带的码字分配和量化都不同。 • 低频分量必须做细量化,高频量化可以变粗。 MPEG-2音频编码及其测量,class 04
5、 MPEG Layer I,II子带编码 • 音频传输中不相关性消除的两例: • 某子带中有一个5kHz的信号在掩蔽阈值以上,因此该子带只能减少量化阶。 • 另一子带中有一个约10kHz的信号在掩蔽阈值以下,该子带被相邻子带信号完全掩蔽,可以被完全抑制。 Signal level in subband above masking threshold determined by a signal at 4kHz: Quantization noise adjusted to below threshold Signal level in subband below masking threshold detemined by a signal at 8kHz:subband completely suppressed • 为进一步降低不相关性,还要分析子带中是否有谐波位于邻近低端子带内;以及被掩蔽信号是否有谐波分量。 • 只有没有谐波分量的被掩蔽信号可以被完全抑制。 spectrum calculated by means of FFT; Thresholds calculated after FFT; Quantizer controlled by psychoacoustic model 图7.12 利用掩蔽效应的不相关性消除 MPEG-2音频编码及其测量,class 04
Subband filter & Quantizer 0 12 samples 12 samples 12 samples Subband filter & Quantizer 1 12 samples 12 samples 12 samples Subband filter & Quantizer 2 12 samples 12 samples 12 samples Subband filter & Quantizer 31 12 samples 12 samples 12 samples Layer I frame Layer II frame 5、 MPEG Layer I,II子带编码 • MPEG编码中,每帧的采样值数目固定。 • Layer I 一帧每个子带有12个采样值; • Layer II 每个子带有3x12个采样值。 图7.13 MPEG-2 Layer I,II 数据结构 MPEG-2音频编码及其测量,class 04
5、 MPEG Layer I,II子带编码 • 对每一块( 12个采样值)找出最大值,作为整个块12个采样值的比例因子,来降低冗余度。 Highest value is used for scale factor determination for a block of samples Block of samples 图7.14 MPEG-2 Layer I,II冗余度降低 MPEG-2音频编码及其测量,class 04
2.音频编码历史 3.人耳心理声学模型 4.音频编码的基本原理 5.子带编码 MPEG-2音频编码及其测量 1.数字音频源信号 6.变换编码 MPEG-2音频编码及其测量,class 04
6、变换编码 • 变换编码与子带编码相反,不用滤波器组进行子带滤波,声音信号的频域分离通过DFT实现。 • 利用DCT或MDCT,声音信号变换为256或512个频谱能量值。 • 与子带编码相同,同时对声音信号做相对高频域分辨率的FFT,FFT输出的数据送到心理声学模型模块,来控制MDFT得到的音频信号能量值进行或粗或细的量化或完全抑制。 • 相对子带编码的优点是,对不相关性降低过程,频域分辨率较高。 • Dolby数字AC-3音频编码采用的方法。 Compressed Audio out M(DCT) Modified Discrete Cosine Transform Audio in Quantizer Example Dolby Digital AC-3 FFT Psychoaoustic model 图7.15 变换编码 MPEG-2音频编码及其测量,class 04
6、变换编码 • 子带编码和变换编码的混合编码: • MPEG Layer III编码中,在MDCT之前先进行子带滤波。 • 先进行较粗的子带分离,然后每个子带进行MDCT来得到更高分辨率。 • MDCT之后,由心理声学模型控制,进行不相关性降低。 • 心理声学模型模块的输入为FFT模块的输出。 • 即MP3音频文件,广泛使用。 Subband filter Quantizer Audio in M(DCT) Compressed Audio out Example MPEG layer III FFT Psychoaoustic model 图7.16 混合编码 MPEG-2音频编码及其测量,class 04
6、变换编码 • 多通道音频编码: • 可以测定通道间的不相关性,并在传输中省去该不相关信息。 • 分析各通道对空间听觉没有作用的相关分量。 • MPEG Layer II MC和Dolby数字5.1环绕。 • 5.1声道包括:左、中、右、左环绕、右环绕和一个低音扩音器的低频增强通道(LFE) 图7.17 扩音机5.1多通道音频配置 MPEG-2音频编码及其测量,class 04
Thank You ! Zhangwenjun@sjtu.edu.cn www.themegallery.com