以文本方式查看主题 - 曙海教育集团论坛 (http://sun4.cn/bbs/index.asp) -- DSP2000技术讨论 (http://sun4.cn/bbs/list.asp?boardid=27) ---- DSP—数字化音频领域的未来 (http://sun4.cn/bbs/dispbbs.asp?boardid=27&id=1575) |
||
-- 作者:wangxinxin -- 发布时间:2010-11-20 13:38:45 -- DSP—数字化音频领域的未来 随着数字信号处理技术的日益推进, IT领域的科技成果越来越普遍的应用于视音频领域并大大的推动了视音频科技的进步,其中DSP(Digital Signal Processor即数字信号处理器)在音频领域内的应用就是一个很好的例子。 DSP的优势 要了解DSP的优势,就必须明白DSP与传统微处理器在硬件基本架构上的不同。 Von Neumann与Harvard基本架构 所有的微处理器都是由几个基本的模块所组成:运算器以完成数学运算、存储器和解码器以完成类比信号与数位信号间的转换。在程序中,在每一周期必须告知微处理器要做些什么。因此微处理器必须从储存程序的存储体取得控制指令与一些数据而加以运算。但是对于所有的微处理器并不是使用相同的方法,一般来说可分成Von Neumann与Harvard二种基本架构,同时又有取其二者优点而衍生出多种的混合改良架构,在增加存储器与周边装置后,就成为能作为数字信号处理应用的微处理控制器。 DSP的Modified Harvard架构 DSP是属于Modified Harvard架构,即它具有两条内部总线,一个是数据总线,一个是程序总线;而传统的微处理器内部只有一条总线供数据传输与程序执行使用; 从上面我们已经看到Modified Harvard架构在大量数学运算方面有着强大的优势,在DSP内部具有硬件乘法器,大量的寄存器,目前最快的可在一个指令周期内完成32bit乘32bit的指令,而传统的微处理器运算系以微代码来执行,遇到乘法运算指令时就得消耗掉好几个指令周期,加上传统的微处理器中的寄存器较少,不得不经常从外部储存器传输数据来进行运算,而DSP指令具备重新执行功能,因此在数学运算速度超越一般传统的微处理器。 DSP在音频领域的应用 由于不存在线形放大电路非理想传输函数所造成的失真缺点,运算速度又比传统微处理器快,DSP已普遍应用于视音频领域的合成、辨识与编码;由于对硬盘存储容量的要求日益提高,使得对VCM(VOICE COIL MOTOR)的定位精度的要求也越来越严谨,DSP IC已成为高容量硬盘机的核心元件;DSP还广泛应用在DAT、DLT等磁带机上,用以控制转速与磁头读写位置;应用于全球定位系统(GPS)的接收机之相关器(CORRELATOR)上,提供计算卫星所发射的射频信号至接收器距离的功能。图象处理的离散余弦变换(DCT)应用;电视信号的抗多经干扰(Ghost Cancellation) 。至于对模糊失真控制(Fuzzy Control)的大量浮点运算,能达到即时要求,更是得心应手。
主动噪声控制 传统的被动式隔音方法,单纯以隔音材料阻隔噪声,对中、低频噪音源产生的噪声几乎无阻隔能力,因此必须以厚重的隔音材料方能产生效果。主动噪声控制是以电子闭回路控制的方法,产生和原始噪声反相的声音,以抵消原噪声(如图-1)。其优点在于它对于抑制低频噪声极为有效。其应用上的限制在于它无法控制中高频段的噪声(1.5K赫兹以上)
在通讯的各个环节,都可能产生恼人的噪声,其综合的影响,便是降低通讯效率、成功率。主动噪声控制技术能在很多层面提高信噪比,且和传统简单的滤波器相比,它能动态地适应各种状况,过去滤波器所无法处理的不确定噪声也可相当程度地克服。 语音讯号处理 虽然目前许多资料已由数位编码后,经原有的语音通讯通道收发。但语音仍然稳占所有通讯含量的第一位。对语音讯号的处理的需求,近年来呈现指数增长。语音技术可分为如下四项:语音增强(Speech Enhancement),语音辨识(Speech Recognition) ,语音编解码(Speech Coding/Decoding),回声抑制(Echo Suppression)。语音增强 图-2
在信号处理上,针对应用场合、背景噪声特性、语音清晰度对可允许的语音失真的相对要求等 ,我们可制定不同的方案,以满足任务需求。例如,语音识别软体对语音信号的要求,就有别于人耳对语音信号的要求,因此,在完成通讯时,和在完成语音识别任务时,需使用不同的程序。针对不同任务研发机构若不能对语音特性具备全面的了解与把握,是无法在这上面取得真正优化的结果。 语音辨识 语音识别系统的核心,应具有硬件要求少,自含时间矫正,和能量矫正的特点。目前已实际应用的为小辞汇量(200字)系统的独立语音识别,中辞汇量(1800字)的核心亦完成。在自动语音识别的发展方向上,将集中於发展语音控制技术,而非语音输入技术。重点在于首次识别的准确率,而非混合语意的辅助识别。 语音编、解码 由于在DSP具有语音处理上的强大功能,因此才有可能在语音编码的设计、使用上,偏重使用压缩比较高的“编码激励线性预测”(CELP)型算法。目前使用的开放标准为ITU的G.723.1,这种算法广泛使用于IP的编解码上,具有6.3Kbps和5.3Kbps两种传输率,语音品质高,抗噪声能力和计算负荷适中。可提供用户使用於各种平台上。同时,专属的2.4Kbps的语音编码算法也在开发中,预计该算法将在语音品质、抗噪声能力、语音压缩比、计算负荷、计算延时上取得更好的平衡。因以硬体性能不断的提升,会适配较大的计算量的编码方式,根据信息论的原理,若在不降低确定的信号指标的条件下,如果采用高的压缩比方式则必然相对的应用大运算量的编解码方式,以在高压缩比的情况下取得较好的音频性能。 回声抑制 在长距离通讯及活动通讯中,经常会被回声所困扰。无论是线性回声,或是音响回声,当延时超过0.5秒 ,都会在接收端清晰的收到。针对这两种现象,各有适用的回声抑制算法。基于DSP的算法稳定、简洁,不但抑制响应速度快,而且对Double Talk、Near-End-Speech及静音状态,皆能保持降噪性能。同时因为线性回声时间延迟可在1毫秒到900毫秒的大范围内变动,同样有基于DSP专属的算法来克服这种变异性对系统带来的额外负荷(在传统的回声抑制系统中,300毫秒的延时意味者系统性能价格比的急剧劣化)。而这些算法的源代码亦能应用在各种通讯平台上,解决长程通讯各环节所产生的问题。 音乐讯号处理 自从数字化的音乐规范开始流行后,因数字信号处理所附带的弹性因素,已在影音讯号的储存 、传送、播放上,产生了许多开放规范和专属规范。对使用者而言,它们带来的效果,除了更耐久更廉价的储存媒介、更多元化的接收管道外,也包括更绚丽的视听效果。但在终端获得和原始影音信号源相当的影音效果,到目前为止都仍然是昂贵且不见得有效的。为了实现所谓的“环场音效”,目前已有诸如Dolby Surround、Dolby ProLogic、AC-3 、THX等各式开放规范,也有商品化的解码晶片。但整个环节中最弱的一环,是在由扬声系统到人耳的这一段。这一段的传递函数因不同的听音者,不同的听音环境而随机的改变,甚至差异极大。原始录音工程师的心血,在这一段经常被糟蹋无遗。而且和传统音响系统相同,这个性能最不容易把握的环节,往往也是投资昂贵的一个环节。 且以DSP动态的 补偿声场的变异,基本上可以做到使用一个低成本基于DSP技术的系统去替代昂贵的非DSP的高档系统,完整还原原始录音效果。(如图-3) DSP以其强大的运算能力及优良的性能价格比已经成为越来越多的数字化视音频设备的核心构件,随着科技的进步,DSP技术的日益完善,相信DSP的未来就是数字化音频领域的未来。 |