迎合三重播放业务时代需要的基础局端 DSP
这种架构既快速又高效,因为 SCR 使主从单元之间实现了真正的同时数据传输。例如,PCI 至 DDR EMIF 的连接独立于 PCI 166 至 DSP CPU 的连接。数据完全是并行传输。当多个主单元访问同一个从单元时,SCR 执行判优。同时系统设计人员可以通过对主单元的优先级别进行编程来施加某些控制。
架构要求
在执行算法时,CPU 与存储器之间的指令和数据传输至关重要。在如图 2 所示的 TMS320C6455 DSP 存储器系统中,可通过使用 256 位宽的数据总线并在 CPU 与存储器之间的内部直接存储器存取 (DMA) 架构上创建两层高速缓存来优化数据传输。
另一个架构要求是高效片上处理引擎。一种高效的方法是集成片上协处理器,以加速要求高性能的特定功能。例如,MS320C6455 DSP 就集成了 Viterbi 协处理器 (VCP) 与 Turbo 协处理器 (TCP),如图 1 所示。
片上处理工作完成后,开发人员仍需将大量数据从芯片传输至电路板上,最终传输到电信传输介质上。显然应选择高速 IO,但考虑到上述的异构架构,确定哪种处理方法最佳就会变得复杂。
最佳解决方案是为片内板级接口提供多种高性能 IO 接口。SRIO 是异构多处理器器件间通信的最佳选择,因为其高吞吐消息传递方案可实现 95% 的带宽利用率(4x 串行双向链路可达 10 Gb/s)。
当然,外部存储器传输最好采用 32 位 DDR2 存储器控制器;同样,连接片外器件最好采用 66 MHz PCI 总线;处理板上或板外 IP 流量的最好选择 1 Gb/s 以太网媒体接入控制器 (EMAC);电信专用的通用测试与操作 PHY 接口则可充分满足 ATM (UTOPIA 2) 连接的需求。
虽然 DSP 处理能力随着具有更强并行能力以及其它高级特性的新架构的推出而显著提高,但电路板设计人员还可通过将多个 DSP 高效集成到单个电路板来获取更明显的改善。使用 SRIO 快速连接大大简化了这项工作,因为从 DSP 软件的角度来看,DSP 之间的数据流处理与单个 DSP 内的数据流处理并没有很大的差异。
板级性能
在传统系统中,语音与数据流量是分开的,这导致了效率低下。随着时间或其它一些影响流量配置的参数的变化,可能会出现处理能力与带宽的闲置。利用新一代架构,设计人员能够设计出在单个器件上更高效处理所有流量的系统。
这种融合解决方案的范例之一是 Surf 公司的 SurfRider 产品系列。该产品系列针对可优化的低成本电路板提供软硬件,以满足特定系统流量要求。
SurfRider/AMC 可在单个电路板上集成多达 8 个 DSP,并可实现高达 10Gb/s 吞吐能力。在单个高级电信计算架构 (ATCA) 或 MicroTCA 机架上可安装 8 个电路板。
发展无止境
通过在 DSP 内部增加并行处理功能,并使用 DSP、片外存储器及其它组件之间的超高速互联,芯片设计人员可设计出新一代基础局端电路板和网关系统。这些系统使电信营运商不仅能够同时提供三重播放业务服务,而且还可灵活适应流量类型和负载的变化。
发展永无止境。过去数年的进展令人难忘,不过不会止步于此。一些新的设计战略已相当明了,如:集成更多片上协处理器和增加并行设计。但芯片和电路板设计人员也认识到嵌入多个 DSP 的电路板的成本仍然不菲。
在单个芯片上集成多个 DSP 内核的做法正在悄然兴起。除了成本低于多个独立封装的 DSP 外,多核 DSP 还具有其它优势。共享内存的多个内核可以在较低时钟频率和电压下运行,以降低每通道的功耗。这对多通道分组语音流量 (packetized voice traffic) 尤其适用,因为其要求的处理能力和内存带宽低于视频要求。
多核还为蜂窝基础设施以及正在兴起的 WiMAX 应用领域带来了独特机遇。这是因为无线传输需要先进的 OFDM 调制解调器。这类调制解调器的工作负载不仅要求多核 DSP 以更高速度运行(1GHz,而VoIP MP为 500MHz),而且还要求出色的硬件加速能力并具备如 Turbocore和 Viterbi 这样的协处理器。功耗限制也会降低每芯片的内核数量。
随着电信行业迈入三重播放业务时代,其面临着几年前可能还无法解决的工程设计挑战。对性能的要求无疑会继续提高,但设计人员增强创新型 DSP 芯片性能的能力会随着多核和基于 DSP 的 SoC 的兴起而提高,使 DSP 能够解决以前在系统性能、功耗、灵活性以及单通道价格等方面的难题。
评论