曙海培训-DSP系统和硬件开发讨论区-高速实时数字信号处理硬件技术发展概述[曙海教育集团论坛]项目外包开发咨询

以文本方式查看主题

-  曙海教育集团论坛  (http://sun4.cn/bbs/index.asp)
--  DSP系统和硬件开发讨论区  (http://sun4.cn/bbs/list.asp?boardid=5)
----  高速实时数字信号处理硬件技术发展概述  (http://sun4.cn/bbs/dispbbs.asp?boardid=5&id=1322)

--  作者：wangxinxin
--  发布时间：2010-11-13 13:37:43
--  高速实时数字信号处理硬件技术发展概述
摘要：在过去的几年里，高速实时数字信号处理（DSP）技术取得了飞速的发展，目前单片DSP芯片的速度已经可以达到每秒80亿次定点运算（8 000 MIPS）；其高速度、可编程、小型化的特点将使信息处理技术进入一个新纪元。一个完整的高速实时数字信号处理系统包括多种功能模块，如DSP、ADC、DAC、RAM、FPGA、总线接口等技术。本文的内容主要是分析高速实时数字信号处理系统的特点、构成、发展过程和系统设计中的一些问题，并对其中的主要功能模块分别进行了分析。最后文中介绍了一种采用自行开发的COTS产品快速构建嵌入式并行实时信号处理系统的设计方法。关键词：高速数字信号处理；DSP；COTS；MIMP结构中图分类号：TN919.5 文献标识码：A Abstract: In recent years, high speed real-time DSP technology has made rapid development. At present, the speed of single DSP chip has reached 8 000 MIPS, the characters of high speed, programmable and miniaturization, will make information processing technology into a new era. An integrated high speed real-time DSP system includes many kinds of function modules, such as DSP, ADC, DAC, RAM, FPGA, bus interface technology, etc. This paper is focus on analyzing the characters, constitutes and developing process of high speed real-time DSP system, also including some problems of system designs, especially introduces some mainly function modules. At last, the paper introduces a design method which adopts COTS production self-exploited to rapidly construct embedded parallel real-time DSP system. Key words: high speed digital signal processing; DSP; COTS; MIMP 1 概述信号处理的本质是信息的变换和提取，是将信息从各种噪声、干扰的环境中提取出来，并变换为一种便于为人或机器所使用的形式。从某种意义上说，信号处理类似于“沙里淘金”的过程：它并不能增加信息量（即不能增加金子的含量），但是可以把信息（即金子）从各种噪声、干扰的环境中（即散落在沙子中）提取出来，变换成可以利用的形式（如金条等）。如果不进行这样的变换，信息虽然存在，但却是无法利用的，这正如散落在沙中的金子无法直接利用一样。高速实时信号处理是信号处理中的一个特殊分支。它的主要特点是高速处理和实时处理，被广泛应用在工业和军事的关键领域，如对雷达信号的处理、对通信基站信号的处理等。高速实时信号处理技术除了核心的高速DSP技术外，还包括很多外围技术，如ADC、DAC等外围器件技术、系统总线技术等。本文比较全面地介绍了各种关键技术的当前状态和发展趋势，并介绍了目前高性能嵌入式并行实时信号处理的技术特点和发展趋势，最后介绍了一种基于COTS产品快速构建嵌入式并行实时信号处理系统的设计方法。 2 DSP技术 2.1 DSP的概念 DSP（digital signal processor），即数字信号处理器，是一种专用于数字信号处理的可编程芯片。它的主要特点是： ①高度的实时性，运行时间可以预测； ②Harvard体系结构，指令和数据总线分开（有别于冯·诺依曼结构）； ③RISC指令集，指令时间可以预测； ④特殊的体系结构，适合于运算密集的应用场合； ⑤内部硬件乘法器，乘法运算时间短、速度快； ⑥高度的集成性，带有多种存储器接口和IO互联接口； ⑦普遍带有DMA通道控制器，保证数据传输和计算处理并行工作； ⑧低功耗，适合嵌入式系统应用。 DSP有多种分类方式。其中按照数据类型分类，DSP被分为定点处理器（如ADI的ADSP218x/9x/BF5xx、TI的TMS320C62/C64）和浮点处理器（如ADI的SHARC/TigerSHARC系统、TI的TMS320C67）。雷达信号处理系统对DSP的要求很高，通常是使用32 bit的高端DSP；而且浮点DSP更能满足雷达信号大动态范围的要求。 2.2 DSP和其他处理器的比较目前在高性能嵌入系统/实时信号处理领域，占统治地位的处理器是DSP；而目前诸如MCU（微控制器）、GPP/RISC（通用处理器）、FPGA、ASIC等都在分享这一市场。它们在性能、价格、开发难度、功耗等等方面有着不同的特点，因此各自适合不同的市场领域。表1对它们的特点进行比较。其中，GPP和MCU和DSP一样都可以通过高层语进行编程；而FPGA则需要硬件描述语言进行开发设计；ASIC则属于功能定制产品。它们和DSP有着很大区别，主要在于GPP多用于通用计算机，内部采用冯?诺依曼结构，只有处理内核没有DMA控制器，没有丰富的IO设备接口，不适合实时处理，而且功率很大，如Intel的CPU的功耗多在20～100 W左右，PowerPC的功耗最小也要5～10 W，而且DSP可以做到1～2 W。而MCU主要用于嵌入式系统的控制，没有计算和处理能力。就信号处理能力而言，DSP最适合信号处理的前端，GPP/RISC处理器比较适合复杂算法或者混合信号处理与数据处理的场合。 2.3 DSP的发展和趋势 1982年TI公司推出了世界上第一款成功商用的DSP－TMS320C10。在上世纪90年代，DSP技术有很大的发展，出现了几款典型的DSP，主要有ADI公司的ADSP2106x/ADSP21160和TI公司的TMS320C62x/C67x。ADI的DSP具有出色的浮点处理能力，多用于雷达/声纳等信号处理；独特的多DSP互联能力（总线直接互联和Link口互联），使它们被称为“多DSP系统的实现标准”。而TI公司的DSP则更注重单片的处理能力，在民用高端DSP市场占有很大份额。进入21世纪，DSP在各方面性能都有了飞跃。ADI公司推出TigerSHARC系列，TS101主频达到300 MHz，目前已经得到大量的应用；2003年推出最新的TS201，主频达到600 MHz，处理能力为3.6 GFLOPs，是当前处理能力最强的浮点DSP之一。TI公司则推出了C64系列，2004年初已经公布了1 GHz的TMS320C6416的技术是目前少数突破1 GHz的DSP之一，定点处理能力达到8 000 MIPS。目前TS201和1 GHz C64都仍处于工程样品阶段，ADI公司预计在2004年8月正式量产TS201。目前DSP的发展趋势是向速度更快、集成度更高的方向发展。DSP将会在其内部集成特殊的运算单元，以适合矩阵运算等运算密集的特殊算法。另外，光DSP（ODSP，Optical DSP）也将成为一个新的发展热点。ODSP采用光调制矩阵进行光速级的矢量和矩阵的运算。目前以色列的LENSLET公司公布的ODSP原型机Enlight256，处理能力相当于1 GHz C64的1 000倍。 2.4 当前DSP性能状态和比较下面表2中通过典型的技术指标，比较了目前多款主流DSP的技术性能。表2中不仅给出了目前常见的4种DSP的主要指标比较，还给出了IBM公司的PowerPC系列处理器的典型性能指标。PowerPC系列虽然属于MPU，但是由于它的出色处理性能，而且低功耗（相对于Intel的CPU）等特点，使得它非常适合嵌入式的实时信号处理系统中，目前PowerPC处理器在国际上军用信号处理市场占有大部分市场。但由于PowerPC毕竟属于MPU，在结构上和DSP有些差异，例如它没有内部DMA控制器、IO处理器、存储器外设接口，内核在计算的同时，还需要负责读取数据，使得整个处理时间加长。因此虽然PowerPC系列有着标称值很高的指标，但是对于需要持续实时信号处理的系统并不一定都合适。下面简单给出一个TS101、C64和MPC7410的比较结论： ①TigerSHARC适合于多DSP互联、动态范围大、带宽处理量比较平均的持续实时信号处理系统； ②TMS320C64适合于动态范围不大、对DSP片间互联要求不高的持续实时信号处理系统； ③MPC7410适合于动态范围大、对DSP片间互联要求不高、带宽处理量比较小的事后数据处理系统。 3 外围器件技术一个高速实时信号处理系统除了DSP技术外，还需要配合大量的外围电路。图1描述了一个典型的基于DSP的高速实时信号处理系统的主要功能框图。按照功能分类，外围电路可以分成几类： ①模拟信号数字信号的转换电路，ADC、DAC、DDS等； ②用于数字信号下变频和上变频的DDC、DDU； ③缓冲和存储电路，RAM、FIFO等； ④逻辑控制和协处理器，CPLD和FPGA； ⑤通信接口电路，光纤、LVDS等。下面分别简单介绍每类外围器件的当前技术状态。 3.1 模拟信号数字信号的转换电路 3.1.1 ADC器件技术状态和趋势 ADC器件对处理系统起到关键作用，影响到系统的可实现性和系统的性能。ADC器件由其内部构造不同，可以分成串并行和全并行。前者通过多级串行的逐次比较，可以很好地提供ADC量化精度，但缺点是速率较慢；目前500 MHz以下的ADC多是采用这种类型。后者是将输入模拟信号同时和2N个比较器比较，并行产生量化值，因此也称为Flash ADC；这种ADC器件可以实现很高频率的模数转换，但是缺点是精度较低，而且功耗很大。串并行ADC以ADI公司的AD6645为例，可以实现最大采样率105 MSPS，14 bit量化精度。全并行ADC以ATMEL公司的TS83102G0 为例，可以实现最大采样率2 GSPS，10 bit量化精度，采用LVDS接口，功耗只有4.6 W。目前ADC器件发展的趋势是： ①高输入带宽、高采样速率、高量化精度； ②对外接口电平发展为LVDS等高速电平； ③低功耗、多通道集成、多功能集成。 3.1.2 DAC器件技术状态和趋势 DAC器件在系统中的作用和ADC相反，所以其内部结构和ADC也相反的过程。目前DAC的指标相对ADC要更高一些，例如ADI公司的AD736可以实现1.2 GSPS的转换速率，精度为14 bit，对外接口采用DDR方式的LVDS电平；而其功耗却只有0.55 W。当前DAC的发展趋势是： ①高速、高精度、低功耗； ②多功能集成，如增加滤波器； ③接口电平采用高速协议：LVDS、DDR等技术。 3.1.3 DDS器件技术状态和趋势 DDS器件内部结构基本分为两类： ①相位累加器（如图2所示）。 ②数据存储型（如图3所示）。当前DDS的典型指标可以达到超过1 GSPS以上，相位累加器精度可以保证在32 bit； 300 MSPS的AD9854可以实现48 bit的相位累加器精度。当前DDS的发展趋势： ①更高时钟频率：目前最高到达了1G左右； ②通过提高相位累加器的位数、查找表位数及DAC的位数以提高输出的信噪比和SFDR； ③编程实现多种调制输出方式：幅度、相位调制； ④实现任意波形输出的能力。 3.2 RAM、FIFO技术存储器技术目前的技术状态是同步技术、双沿和多沿传输技术的广泛应用。目前同步静态存储器成为高速、大容量SRAM中的主要力量，例如SBSRAM、ZBTSRAM等同步SRAM，时钟频率可以高达200 MHz以上。另外，新型DDRSRAM、甚至QDRSRAM，可以在一个时钟周期内传输2个或者4个数据，这将大大提高SRAM的读写带宽。而动态RAM中，由于DDR技术的应用，使得存储速率可以达到每线400 Mb/s；而且由于新的芯片封装技术和制造工艺的应用，使得单片DRAM的容量越来越大，目前单片最大1Gbit的DDRSDRAM已经大量应用。目前常用的FIFO器件仍然是高速同步FIFO，同步时钟可以达到100 MHz以上。目前出现了DDR接口的FIFO器件，可以达到250 MHz以上，大大提高了带宽。目前存储器发展的主要趋势是： ①高速、大带宽：采用DDR、QDR等技术，甚至LVDS等接口电平逻辑； ②低功耗、高密度：采用更新的芯片封装和制造工艺，提高单片容量、降低功耗。 3.3 CPLD、FPGA技术 CPLD和FPGA一直是数字电路中的重要成员。传统的小规模的CPLD大多实现逻辑控制和逻辑转换的功能；而目前大规模的FPGA则通常实现更加复杂的算法、信号处理等工作，它们的效率往往要高于DSP很多。目前FPGA的技术已经达到了千万门级的水平，而且通常嵌入一些信号处理的功能模块，如DSP模块、存储器模块、Gbit串行收发模块等等；另外目前FPGA的另一大技术特点是FPGA的IO管脚支持越来越多的电平协议。这些技术的出现使得目前SOPC的系统设计大大增加。目前CPLD和FPGA的重要厂商仍然是Xilinx、Altera和Lattice。它们的典型高端器件如：Virtex II/ Virtex II Pro、Stratix/Stratix GX、ISPGDX等器件。它们共同的特征是： ①大规模、超大规模的门数设计； ②内嵌大容量SRAM、DSP模块、硬件乘加器等资源； ③具有高速串行通信的硬件模块，如Xilinx的RocketIO可到10 Gb/s。 3.4 通信接口电路传统的通信接口大多采用低速的接口，如232、422等接口；随着系统功能的提高、处理带宽的增加，对通信接口的要求也大大提供。目前在通信接口电路中采用很多高速通信手段，实现大带宽的数据传输。目前光纤接口和基于差分信号的串行传输技术被大量应用。 3.4.1 光纤通信光纤通信是利用光来传输信息的一种传输方式。由于光信号的特点，决定了光纤传输有很多天生的优点： ①容许频带宽，传输容量大； ②单波长光纤传输系统的传输速率一般为2.5 Gb/s和10Gb/s，多模为1.062 5 Gb/s和1.25 Gb/s； ③损耗小，中继距离很长且误码率很小，传输距离从几百米到几公里； ④抗电磁干扰性能好； ⑤无串音干扰，保密性好； ⑥光纤线径细、重量轻、柔软； ⑦光纤的原材料资源丰富，用光纤可节约金属材料； ⑧耐腐蚀力强、抗核幅射、能源消耗小。光纤传输在很早就被用于电信系统的中继传输中，但直到最近几年才被广泛应用在嵌入式系统的数据传输中，例如Fibre Channel、光纤以太网等技术。目前这些光纤传输技术的带宽已经可以到达10 Gb/s以上。 3.4.2 基于低压差分电平的串行传输技术低压差分电平协议是目前比较流行的一种电平形式，它具有摆幅小、抗干扰强、辐射小等优点，广泛应用于高速数字信号的传输协议中；例如LVDS协议就是满足最流行的传输协议之一，它的共模电压为1.2 V，差模电压为350 mV，传输速率可以达到上Gb/s。目前很多第三代互联技术都是以低压差分电平一些为基础，例如RapidIO协议、InfiniBand协议等等。而基于低压差分电平的串行传输协议，更是将铜线传输带宽提高到一个前所未有的水平。采用了时钟打包和时钟恢复技术的串行传输协议，不用再考虑数据线和时钟线之间的Skew和Jitter等问题，更容易提高传输速率，而且减少线对数量，降低实现成本。通过对信号的预加重和均衡处理，目前串行RapidIO协议可以支持3.125 Gb/s，而Xilinx公司的RocketIO接口可以实现单线对10 Gb/s的串行传输速率。这种技术目前已经逐步成熟，将会大量应用于板内、底板间、机箱间等大量高速数据传输的场合。 4 基于标准总线的DSP系统设计随着处理系统规模的增大，系统设计时通常被分成多个较独立的功能模块。总线技术就是为了解决系统各模块之间的管理、控制、通信等问题而产生的。早期的系统由于功能较简单，故很多系统采用了自定义总线的方式，即用户根据自己系统的要求设计一套满足特定功能的总线。随着信号处理技术的发展，自定义总线对系统的使用和扩展带来了很大的制约，而且每个新系统的开发时间和开发成本都难以降低。随后在DSP信号处理系统中使用标准总线系统的思路被提出，所谓标准总线系统就是满足一定工业标准或国际标准的总线（如PCI总线）。这种方式可以提供很多优点。（1）提供DSP系统的通用、标准的扩展和互联能力。 ①总线接口逻辑的统一标准； ②板卡物理尺寸和结构的统一标准； ③使DSP系统便于扩展、互联和快速构建平台。（2）提供DSP系统方便的控制界面和用户界面。标准总线系统的计算机平台可以通过标准总线对DSP系统进行控制、管理和设置。（3）提供DSP板卡之间的通信、传输方式。板卡之间通过标准总线互联，便于通信。（4）节省开发时间、降低开发成本。可以选择很多商用的标准总线产品（COTS）来实现用户系统。 4.1 标准总线的发展和当前技术目前工业中较为流行的标准总线有多种：ISA总线、PCI总线、cPCI总线、VME总线、PC104等。 ISA总线目前已经基本被淘汰。PCI总线随着PC市场的发展而迅速壮大起来，成为目前技术最先进、应用最广、支持最多的总线之一。但由于PCI总线标准的物理结构，限制了它在环境恶劣的工业领域尤其是军事领域中的应用。而基于PCI总线逻辑协议的cPCI总线标准，却能很好的弥补这个问题。因为cPCI总线除了机械标准外，其他都是采用PCI的标准；而机械标准是采用欧洲卡标准，具有很强的加固能力；因此cPCI总线可应用到任何恶劣环境的工业系统和军用系统中。 VME总线则是最老牌的系统总线，它是Motorola等几家大公司在80年代初提出的一种独立于DSP的总线标准，而且在机械结构方面同样也是采用了欧洲卡的标准。由于美国军方在早期大量使用基于VME标准的产品，因此VME标准总线目前仍是世界范围内军用系统的最大标准。