170 likes | 372 Views
第二章 音频信号的获得与处理. 一、 数字音频基础 1 、 声音、模拟音频:自然声音是一种机械振动,振动越强,声音就越大。例用话筒把机械振动转换成电信号,这是一种模拟的音频,它是以模拟电压的幅度表示声音的强弱。特点是直观性强,表示复杂,转化中容易失真 声波: 20-20kHz ;敏感域:语音,音乐 特征:频率(音调),振幅(声强),音色(波形). 实际声波信号:. 周期性(乐音),带宽 (频谱) ,基频,高次谐波,最高次谐波(最高频)
E N D
第二章 音频信号的获得与处理 • 一、数字音频基础 • 1、声音、模拟音频:自然声音是一种机械振动,振动越强,声音就越大。例用话筒把机械振动转换成电信号,这是一种模拟的音频,它是以模拟电压的幅度表示声音的强弱。特点是直观性强,表示复杂,转化中容易失真 • 声波:20-20kHz;敏感域:语音,音乐 • 特征:频率(音调),振幅(声强),音色(波形)
实际声波信号: • 周期性(乐音),带宽(频谱),基频,高次谐波,最高次谐波(最高频) • 2、数字音频:数字音频是通过采样和量化把模拟量表示的音频信号转换成许多二制数1和0组成数字音频文件。特点是没有直观性,表示取决于约定,转化中不会失真。
采样:对时间连续的函数X(t),按一定的时间间隔T取值,得到离散信号X(nT)的过程.n为整数,T为采样周期,1/T为采样频率.采样:对时间连续的函数X(t),按一定的时间间隔T取值,得到离散信号X(nT)的过程.n为整数,T为采样周期,1/T为采样频率. • 采样不失真的条件:无限密。 • 工程技术上,奈魁斯特定理(采样定理): • 采样不失真条件:f>fc • 是正弦波采样不失真的条件:采样频率大于二倍频率。:f>2f • 一般波形采样不失真的条件:大于最高次谐波频率fc的二倍。f>2fc • 对于完全的声波,20-20000Hz,则f>2*20000=40000Hz.
量化:(测量声波各点之值时精度的约定。)为了把抽样序列X(nT)输入计算机, 必须将量值化成一个有限个幅度值的集合X(nT).通常是用B位二进制表示. • 存储信号的比特率为I, I=Bfs • 其中, fs是抽样率; • B是每个样本的比特数(比特/秒,bit/s)通常用二进制码字表示.当B=8,可表示256个不同的值,当B=16可表示65536个不同的值. • 对于均匀量化的情况,当量化器最大的范围为Xmax时,则D=2Xmax/2B
抽样值与实际值之差最大不大于D. • 相邻两个量化值之间的差距为量化阶距D.
3、多媒体技术中常用声音的文件格式有: ⑴WAV文件 • WAV是Microsoft公司的音频文件格式。来源于对模拟信号的直接采样,各采样点的值以八位或十六位量化位数表示,其文件大小为: • WAV文件字节数=采样频率(Hz/s)*量化位数*声道数/8 • 当采样频率为44.1(kHz),量化位数选16,含左右声道时,一秒钟立体声WAV文件的大小是: • 44000*16*2/8=176400(字节) • 减小WAV文件的主要途径:降低采样频率. • 利用Microsoft sound System 软件Sound finder 可以转换AIF、SND和VOC文件到WAV格式。其中AIF是Apple计算机的音频文件格式;snd是next计算机的波形音频文件格式;
⑵VOC文件 • voc文件是Creative公司波形音频文件格式。 • 利用声霸卡提供的软件可实现voc和wav文件的转换程序voc2wav转换Creative的voc文件到Microsoft的wav文件。 • 程序wav2voc转换microsoft的wav文件到creative的voc文件。
⑶MIDI文件 • MIDI文是(Musical Instrument Digital Interface)乐器数字接口的缩写。 • rmi是Microsoft公司的MIDI文件格式。
1、处理音频信号应注意的问题 • 时间性强,延时别超过25ms(快,短) • 立体声(双声道及多声道) • 语音语调(情感问题) • 计算机处理音频信号的技术角度 • 人机通讯:语音识别 • 机人通讯:语音合成、音乐合成声音定位。 • 人-机-人通讯:语音采集,编码/解码,网络传输等。
一、音频卡的工作原理 Creative Co. Sound Blaster (1)音频卡的功能 音频卡的功能有以下几个主要方面:音频录放、编辑、音乐合成、文语转换、 CD-ROM接口、MIDI接口、游戏接口等。 (P25)
● 音频录放 ①数字化音频采样频率范围:5khz~44.1khz;量化位:8位/16位;通道数:立体声/单声道。 ②编码与压缩:基本编码方法有PCM(脉冲编码调制);压缩编码方法有ADPCM (8:4;8:3;8:2;16:4) CCITT A律(13:8) CCITT m律(14:8) 实时硬件压缩/软件压缩。 ③音频录放的自动动态滤波。 ④录音声源:麦克风、立体声线路输入、CD。
● 编辑与音乐合成 • 编辑与合成就像一部数字音频编辑器,它可以对声音文件进行各种特殊的处理:如倒播、增加回音效果、静噪音、往返放音、交换声道等。 • 音乐合成功能和性能主要是依赖于合成芯片。 • (2)音频卡的工作原理 • 音频卡的工作原理框图主要由以下几个部分组成:
● 声音的合成与处理: 这是音频卡的核心部分,它由数字声音处理器、调频(FM)音乐合成器及乐音数字接口(MIDIi)控制器组成。这部分的主要任务是完成声波信号的模/数(A/D)和数/模(D/A)转换,利用调频技术控制声音的音调、音色和幅度等。 ● 混合信号处理器 混合信号处理器内置数字/模拟混音器,混音器的声源由以下几种信号如MIDI信号、CD音频、线路输入、麦克风等。可以选择一个声源或几个不同的声源进行混合录音。
● 功率放大器 由于混合信号处理器输出的信号功率还不够大不能推动扬声器或音箱,所以一般都有一个功率放大器作为功率放大使得输出的音频信号有足够的功率。 ● 总线接口和控制器 总线接口有多种早期的音频卡为ISA总线接口,现在的音频卡一般是PCI总线接口。 总线接口和控制器是由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑及直接存储器访问(DMA)控制逻辑组成。
(3)声卡的安装 硬件: 插卡(远离显卡), 接CD-ROM(含音频线I/O线游戏线等),外设(音箱,MIC等) 软件: