新闻中心

EEPW首页 > 嵌入式系统 > 专题 > 大数据量进一步推动集中式计算

大数据量进一步推动集中式计算

作者:时间:2018-01-11来源:电子产品世界

作者/市场营销副总裁 Steve Mensor

本文引用地址:http://www.eepw.com.cn/article/201801/374299.htm

近10年来,大家看到已实现了大幅的增长,大量数据都流向云端以利用其在专用数据中心中低成本处理的优势。这是一种似乎与计算领域总趋势不一致的趋势,总的趋势是始于大型机却逐渐移向周边包围型智能和物联网(IoT)。随着我们进入2018年,这种集中化将达到它的极限。驱动下一波应用所需的数据量正在开始推动发展方向上的改变。

当前在企业生成数据中,仅有10%是在集中式数据中心之外被生成和被处理的。行业分析机构Gartner预测这个数字将在2022年达到50%。这是一种必然的反转,其推动因素是业界向超级连通信息物理系统的转变。这一反转将随着诸如5G无线通信等技术的到来和新一波面向应用的计算硬件浪潮的兴起而实现。

物联网的第一波浪潮就产出了众多小型个体性数据项目,它们共同在大型数据中心中以最有效的方式被聚合和处理。但是随着物联网设备和越来越多的信息物理系统开始依赖于解读更大量数据流的能力,重心就需要向边缘转移。

汽车行业提供了这种转变的一个缩影,而我们将随之在众多行业中看到这种转变。举例来说,将来自于多辆汽车的GPS数据聚集在一起,就实现了交通堵塞的信息采集。再反送回车载单元,就可以引导驾驶员去驾行畅通的路线。数周的重复数据采集已经显现出更长期的效益。运行于数据中心的系统已经从成千上万车辆的通行状况中获知,在哪些高速的方式运转。结果是更加精确、生动的数字地图:所有功能都实现了,而且无需派遣大量的调查车辆。

在集中式服务器中维护数据只能走到这么远。现在,汽车制造商正快速转向在他们的车辆中构建更高等级的自动能力。让计算机来控制驾驶的能力可以减少拥堵并缩短出行时间。如今,自动化驾驶员辅助系统(ADAS)大部分都包含智能化功能,由车载摄像头和雷达系统所采集的场景信息完全在车辆内进行处理,这些数据中的很小一部分会转发至汽车制造商的服务器。转发的数据可以用于更新维护数据库以帮助实现预测性维护,以及收集ADAS软件运行情况的统计数据。

还有更多可以使用的数据,但是带宽和处理能力的限制阻碍了其使用,装备ADAS系统的车辆每行驶1英里将产生大约10GB数据。这些信息会马上被处理,然后会被快速遗弃;这些数据所包含的内在信息可能对很多系统都有价值。数据太过密集,所以很难传送至集中式云服务器。但是,更接近车辆的系统可以使用高速、高性价比的无线网络,例如专为V2X通信设计的IEEE 802.11p协议,以获取这些数据并基于它们做出有依据的决定。

随着自主驾驶变得越来越普遍,路边的信标和智能交通信号灯将与行驶的车辆配合以优化道路使用。在一个简单的场景中,通行车辆上的传输装置会使用车联网(V2X)将它们遇到的路面情况的数据传递给路边信标。信标本身可以是孤立的,仅以低速方式连接至云端。信标可以使用其自身的计算能力来了解路面情况,并将信息传送给另一个方向的通行车辆,而不必为了将数据传送至云端进行处理而遗弃大量的数据。

相似地,智能交通信号灯将采集来自于车辆的数据和图像,以有助于确定行人、其他弱势道路使用者和车辆本身的位置。这将帮助它们的软件就“它们应该在何时变灯以实现最佳交通流量”这一问题做出智能的决策。路边的信标和车辆也将开始互相配合以提供“一目了然”功能,从而通过确定最安全的操作时点来辅助超车和变道等驾驶行为。

随着自主驾驶等级的提升,对于低延迟、实时响应的需求变得更加至关重要。当车辆高速通行时,数毫秒都很重要。当今的无线网络可能会有大约数百毫秒级的双向延迟,而第五代移动通信(5G)已经被重新架构,以在仅仅1毫秒之内对消息做出响应。但是这种引人瞩目的延迟改进需要与数据移向云端时所发生的延迟进行比较。

边缘计算

为了支持毫秒级的响应时间,计算资源需要被放置在更接近传送点的位置,即位于网络边缘的“微云”上。微云所执行的处理将包括大量的数据分析,这通常基于机器学习技术。这种将人工智能(AI)技术推向网络边缘的趋势,已经随着诸如亚马逊云计算服务中的Greengrass(Amazon Web Services’ Greengrass)这样的创新项目而发生了。这种服务原本被开发用来应对物联网服务发送数据到云时,可能出现的无论服务器资源是否可用都需要AI支持这一情况。

首先,这些机器学习算法的训练将发生在核心云中,同时边缘计算系统提供了能够处理一些推理的任务,这样也可以减轻云的能量需求。另外,连训练过程也很可能移向边缘,也还是因为数据的重心所致。即使有高比例数据压缩,上传足够的数据以实现良好的训练往往被证明是不现实的。

本地训练也能使系统为它们所看到的情况、而非一个国家或者全球的平均值来修正自己的行为。智能交通信号灯可以学习本地的堵塞模式,或利用通行车辆的燃油效率追踪来基于本地条件去优化它们周边的交通流量。

为了合理地服务这些多样化的、需要快速响应的应用,微云或者边缘计算机不能简单地只是一个云服务器的规模缩小版。高性能是必需的,但是它要以一种紧凑、可靠、节能的形式来提供,这些系统很可能紧邻像路边的机柜一样小的通信设备。即使是那些被部署在校园中的系统,将无法获得与核心数据中心中的刀片服务器同等级的支持。

为了实现计算效率最大化,硬件加速技术将在边缘计算机和微云中起到关键作用。在处理诸如实时机器学习等任务时,多核处理器本身会很慢且能耗很高。一种加速选择可以是用一个通用图形处理单元(GPGPU)或视觉处单元(VPU)来增强多核CPU。GPGPU和VPU被用于一些嵌入式系统中,来运行机器学习和数据分析算法,因为它们拥有高度并行化的浮点运算单元,可以为很多并行的神经元集合多输入,而且这种做法比CPU的集群要快得多;即便是高端CPU供应商,也已经在整合其大规模并行单指令多数据(SIMD)单元(如Intel的AVX512 和ARM的NEON)来弥补这种差距。

强调GPGPU中浮点运算的峰值性能,使得这种架构不适合具有能量约束性系统,因为GPGPU通常需要将能耗等级维持在150W以上。甚至在机器学习中,使用GPGPU和VPU还会有一些缺点,这类器件的首要设计目的是加速涉及诸如卷积等操作的2D和3D图形以及图像应用。它们将自己用于深度神经网络的卷积层,但是其他类型的操作会引起存储访问方面的麻烦。最高池化和全连接层将重点放在虚拟神经元之间的数据传输上,使用了并不适合其存储结构的访问模式。更进一步的问题是,它们将重点放在了浮点和矩阵运算上,使得GPGPU和VPU很难适合那些在边缘计算机中需要加速的其他应用。基于可编程硬件而非处理器的解决方案则提供了自由度,可以优化虚拟神经元之间的数据传输。可编程硬件还提供了自由度以适应范围更广的、要求边缘计算机去执行的任务。

产品及技术方向

多年以来一直在为可编程逻辑领域提供创新,在性能、功耗和成本领先性方面树立了行业标准。

2013年,发布了Speedster22i 系列产品,从而推出了业内最先进的产品,该系列带有用于高性能有限应用的嵌入式系统级知识产权(IP)产品。Speedster22i系列产品是首款特定应用型芯片,支持了全新的、具有创新性的高性能可编程设计。

2016年10月,Achronix宣布其可集成至客户SoC中的Speedcore嵌入式FPGA(eFPGA)IP产品开始供货;在发布此消息时,Achronix已经向多家客户交付了Speedcore IP。从那时起,对Speedcore IP的需求空前高涨。Speedcore eFPGA IP是专为人工智能/机器学习(AI/ML)、高性能计算、汽车、5G无线通信和网络等应用设计的。它和Speedster22i FPGA基于同一种高性能架构。

Achronix的所有产品都得到了我们自己强健的、经过验证的ACE设计工具的支持。ACE是一款功能强大的EDA工具,可以支持逻辑综合、布局和布线,还可提供时序收敛和调试工具。ACE工具可免费用于评估。

Achronix最近宣布已完成一款在16nm工艺上验证了 Speedcore的测试芯片,该芯片采用台积电(TSMC)的16FFplus-GL工艺制造,拥有11层金属叠层;其中的一个高性能Speedcore eFPGA内核包含40,000个查找表、48个大小为20Kbit的RAM单元块和72个DSP64单元块。Achronix正在积极开发其7nm产品,并计划也将于近期将该产品推向市场。

中国市场策略

2017年是Achronix取得突破性发展的一年,公司成为了全球增长速度最快的半导体公司之一。公司在2017年实现了巨大的增长,营业收入比上年增长7倍且超过1亿美元。我们的所有产品都可为中国市场供货,包括Speedcore、Speedster22i等等,中国是Achronix最重要的市场之一。

Achronix面向全球客户提供产品和服务,在中国设有专门的销售和应用工程支持机构。Achronix的客户横跨数个目标市场,从人工智能和机器学习到自动驾驶、高性能计算和5G无线通信均有所覆盖。凭借特定领域的专业知识和客户在这些目标应用上取得的成功,以及强大的工程支持团队,Achronix已经完全做好准备来用自己基于FPGA的硬件加速技术和产品为中国半导体行业的快速增长提供鼎力支持。



评论

技术专区

关闭