2.93k likes | 3.25k Views
数字信号处理器( DSP ) 原理与应用. 天津大学 傅星 教授 xingfu@tju.edu.cn. 主要内容. 一、 DSP 的一般概念 二、 DSP 系统构成及设计方法 三、 DSP 芯片的基本结构和特征 四、定点 DSP 及定点运算 五、浮点 DSP 及浮点运算 六、 DSP 系统软硬件设计 七、 DSP 应用实例. 一、 DSP 的一般概念. 1 、一般概念. 数字信号处理 ( Digital Signal Processing ) 以数字形式对信号进行采集、变换、滤波、估值、增强、 压缩、识别等处理
E N D
数字信号处理器(DSP)原理与应用 天津大学 傅星 教授 xingfu@tju.edu.cn
主要内容 一、DSP的一般概念 二、DSP系统构成及设计方法 三、DSP 芯片的基本结构和特征 四、定点DSP及定点运算 五、浮点DSP及浮点运算 六、DSP系统软硬件设计 七、DSP应用实例
一、DSP的一般概念 1、一般概念 • 数字信号处理(Digital Signal Processing) 以数字形式对信号进行采集、变换、滤波、估值、增强、 压缩、识别等处理 • 数字信号处理器(Digital Signal Processor,DSP)芯片 是一种特别适合于进行数字信号处理运算的微处理器,其 主要应用是实时快速地实现各种数字信号处理算法
数字信号处理的实现方法 • 在通用的计算机(如PC机)上用软件(如Fortran、C语言)实现 ;速度慢 • 在通用计算机系统中加上专用的加速处理机实现;应用受限制 • 用通用的单片机(如MCS-51、96系列等)实现 ;仅限于简单算法 • 用通用的可编程DSP芯片实现 ;广泛应用 • 用专用的DSP芯片实现 ;应用受限制
数字信号处理的实现方法 实现方法 速度 应用场合 适应性 性价比 PC机 高级语言编程 中等 非嵌入式 复杂算法 较好 PC机+高速处理 硬件+ 专用指令 快 非嵌入式 复杂算法 中等 单片机 汇编语言编程 慢 嵌入式 简单算法 较好 通用DSP 专用指令 较快 嵌入式 复杂算法 好 专用DSP 硬件+ 专用指令 快 嵌入式 复杂算法 中等
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电 • 数字滤波 • 卷积 • 相关 • 希尔伯特变换 • FFT • 自适应滤波 • 加窗 • 波形产生
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电 • 三维旋转 • 机器人视觉 • 图像传输/压缩 • 同态处理 • 模式识别 • 工作站 • 动画/数字地图
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电 • 频谱分析 • 函数发生器 • 模式匹配 • 地震信号处理 • 数字滤波 • 锁相环
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电 • 声码器 • 语音识别 • 语音增强 • 语音合成
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电 • 磁盘控制 • 数值控制 • 声控 • 伺服控制 • 机器人控制 • 激光打印机控制 • 发动机控制 • 自适应驾驶
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电 • 雷达处理 • 声纳处理 • 图像处理 • 导航 • 导弹制导 • 高频调制解调器 • 保密通讯
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电 • 回声对消 • ADPCM代码转换器 • 数字交换机 • 线路转发器解调器 • 通道多路复用 • 1200至19200bps调制 • 自适应均衡 • 传真 • 扩频通讯
DSP芯片的主要应用领域 (1)信号处理 (2)图像处理 (3)仪器 (4)声音/语言 (5)控制 (6)军事应用 (7)电信 (8)无线电 • 全球定位 • 导航 • 数字无线电/TV
DSP系统基本构成 抗混叠 滤波 平滑 滤波 输入 输出 DSP A/D D/A 存储器
系统设计的一般方法 需求分析 系统结构选择 系统总体构成 软硬件设计 交付使用 试运行 系统调试
2、DSP芯片主要特点 • 在一个指令周期内可完成一次乘法和一次加法 • 程序和数据空间分开,可以同时访问指令和数据 • 片内具有快速 RAM,通常可通过独立的数据总线在两块中同时访问 • 具有低开销或无开销循环及跳转的硬件支持 • 快速的中断处理和硬件I/O支持 • 具有在单周期内操作的多个硬件地址产生器 • 可以并行执行多个操作 • 支持流水线操作,使取指、译码和执行操作可以重叠执行
DSP的优缺点 • 优点:大规模集成性、 稳定性好 精度高 可编程性 高速性能 可嵌入性 接口和集成方便 • 缺点:成本较高 高频时钟的高频干扰 功率消耗较大等 DSP技术更新速度快,开发和调试工具不尽完善
3、DSP芯片的发展历史 • 世界上第一个单片 DSP 芯片应当是1978年 AMI公司发布的 S2811 • 1980 年,日本 NEC 公司推出的μPD7720是第一个具有乘法器的商用 DSP 芯片 • 美国德州仪器(Texas Instruments)公司为世界上最大的 DSP 芯片供应商,其DSP市场份额占全世界份额近 50%, • AD公司的ADSP2101,ADSP2111, ADSP2171, ADSP21000等系列;Motolora公司的MC56001,MC96002等
DSP芯片的发展(续) • 完成乘加操作的时间下降到10ns以下 • 乘法部件占模片区从40%下降到5% • 引脚数从64增加到200以上 • 重量和体积大大下降 • 采用低电压,功耗大大下降
年份 1982年 1992年 1999年 制造工艺 4μm NMOS 0.8μm CMOS 0.3μm CMOS MIPS 5MIPS 40MIPS 100MIPS MHz 20MHz 80MHz 100MHz 内部RAM 144字 1K字 32K字 内部ROM 1.5K字 4K字 16K字 价格 $150.00 $ 15.00 $5.00~$25.00 功耗 250mW/MIPS 12.5mW/MIPS 0.45mW/MIPS 集成 晶体管数 50K 500K TI DSP 芯片发展比较表
4、DSP分类 静态 按基础特性: 一致性(兼容性) 定点(Fixed) 按数据格式: 浮点(Floating) 通用 按用途: 专用
5、DSP的性能指标 • 运算速度 • DSP芯片的价格 • DSP芯片的硬件资源 • DSP芯片的运算精度 • DSP芯片的开发工具 • DSP芯片的功耗 • 其它:
DSP芯片的运算速度 • 指令周期:即执行一条指令所需的时间 • MAC时间:即一次乘法加上一次加法的时间 • FFT执行时间:即运行一个N点FFT程序所需的时间 • MIPS:即每秒执行百万条指令 • MOPS:即每秒执行百万次操作 • MFLOPS:即每秒执行百万次浮点操作 • BOPS:即每秒执行十亿次操作 MIPS(Million Instruction per second)是一种评估DSP速度的一个指标。DSP运行频率也是评估DSP的一个指标,他们二者之间的联系需要考虑到DSP体系结构(是否多路并行结构、是执行定点还是浮点运算)。
商业级→工业级→军品→航空级 价格趋势 • 价格 • 商业级 :一般应用;适用于实验室等环境较好场合; • 工业级 :可靠性好;适用于工业现场等环境恶劣场合; • 军品 :可靠性高;适用于各种恶劣场合; • 航空级 :可靠性很高;适用于特殊场合;
硬件资源 • 内存:RAM、ROM、Flash等 • 寄存器:通用、特殊功能 • I/O数量:单向、双向 • 寻址能力:直接、间接 • 定时器、计数器: • 通讯接口: • 内置功能单元:A/D、D/A等
一般而言,定点DSP芯片的价格较便宜,功耗较低,但运算精度稍低。而浮点DSP芯片的优点是运算精度高,且C语言编程调试方便,但价格稍贵,功耗也较大。 • 运算精度 • CALU: • 寄存器: • 硬件乘法器: • 片内RAM: • 开发工具 • 功耗 • 其它 • 封装的形式: • 质量标准: • 供货情况: • 生命周期:
运算量是DSP芯片处理能力的标志 按样点处理 一个采用LMS(Least Mean Square)算法的256 抽头的自适应FIR(Finite Impulse Response)滤波器 假定:3个MAC/抽头 则:256×3=768个MAC周期 设:采样频率为8kHz,即样点之间的间隔为125μs;采样频率为44.1kHz,即样点之间的间隔为22.7μs
按帧处理 中低速语音编码算法: 10ms或20ms为一帧,每隔10ms或20ms语音编码算法循环一次。 选择DSP芯片时应该比较一帧内DSP芯片的处理能力和DSP算法的运算量。 假设:DSP芯片的指令周期为 p(ns),一帧的时间为 (ns) 则:在一帧内所能提供的最大运算量为 /p条指令。 如:TMS320LC549-80的指令周期为12.5ns,设帧长为20ms,则一帧内所能提供的最大运算量为160万条指令
二、DSP系统构成及设计方法 输入信号 处理 输出信号 处理 输入 输出 DSP A/D D/A 通讯及 人机接口 存储器
从使用者看 DSP系统设计方法 自上而下 功能及指标 软件结构 用户接口 硬件结构 外输入接口 从设计者看 自下而上
从使用者看 DSP系统设计方法 功能及指标 软件结构 用户接口 软硬件交界面 从中间开始 硬件结构 外输入接口 从设计者看
DSP总体设计框图 系统需求说明书 定义技术指标 选择DSP芯片及外围芯片 软件设计说明书 硬件设计说明书 硬件电路与调试 软件编程与测试 系 统 集 成 系统测试,样机、中试与产品
编写C语言源程序 宏汇编源文件 优化ANSI C编译器 文档管理器 编写TMS320 汇编源程序 生成TMS320汇编文件 宏汇编库 汇编语言汇编器 生成目标文件 软件系统设计框图 链接器 软件仿真 软件开发系统 输出执行文件 写EEPROM 调试器 评测模块EVM 系统仿真XDS TMS320目标系统
硬件系统设计框图 确定硬件方案 A/D,D/A 内存,逻辑控制 通信,总线 人机接口 器件选型 原理图设计 PCB板设计 硬件调试
系统设计实例 POS机 银 行 锁 存储器 音频 键盘 网络接口 CPU 显示 数据传输接口 打印机 磁卡
系统设计实例 家庭影院 多路通用接口 显示器 D/A L/R音箱 电源 CPU D/A 低音 家庭网络 存储器
系统设计实例 视频会议系统 网络接口 1394 视频接口 音频接口 时钟 CPU 专用接口 电源 存储器 PCI总线