新闻中心

EEPW首页 > 嵌入式系统 > 设计应用 > ARM Cortex-A移动应用处理器产品简介

ARM Cortex-A移动应用处理器产品简介

作者:时间:2016-11-28来源:网络收藏
ARMCortex-A移动应用处理器产品线横跨了几代产品和三个主要产品类别。有些开发人员和SoC设计人员经历了一款或多款新型ARM处理器的推出过程,他们知道该产品线如何从单个高性能通用CPU设计演进成为三个不同产品线,分别面向高端、中端、入门级的移动设备SoC市场,这让他们受益匪浅。

  Cortex-A8

  ARM在2005年向市场推出Cortex-A8处理器,是第一款支持armv7-a架构的处理器。ARMv7包括3个关键要素:NEON单指令多数据(SIMD)单元、ARMtrustZone安全扩展、以及thumb2指令集,通过16位和32位混合长度指令以减小代码长度。Cortex-A8是ARM实现的第一个基于新ISA的超标量处理器:它实现了完全双发射流水线,这意味着cortex-a8能够同时发出在指令流中先后出现的任何两个没有数据依赖的指令。但是,它不能乱序来发射或撤销指令-该功能在之后的设计中才被实现。

  image001.png

  当我们推出Cortex-A8时,很多合作伙伴认为这款处理器放在移动电话上是大材小用,他们很自然地质疑道,“客户会在手机上浏览互联网?不太可能吧。”但是,我们和业界一些主要思想领袖合作,向客户将会需要的产品迈进,尤其是因为当Cortex-A8在2008年投入批量生产时,高带宽无线连接(3G)已经问世,大屏幕也用于移动设备。创新的移动行业充分利用了该产品:Cortex-A8芯片的推出正好赶上了智能手机出货量猛增的大好时机。

  Cortex-A9

  推出Cortex-A8之后不久,ARM又推出了首款多核ARMv7CPU:cortex-a9。Cortex-A9利用硬件模块来管理CPU集群中一至四个核心之间的高速缓存一致性,加入了一个外部二级高速缓存。理论上,客户可以设计不包括二级缓存的小型版本Cortex-A9,这种设计允许剔除管理高速缓存一致性的逻辑模块,以实现尺寸更小的单核设计。但实际上,大多数设计都采用双核个或更多核心并附带二级高速缓存。此外,在2011年底和2012年初,当移动SoC设计人员可以采用多个核心之后,提高性能的突破点从提高单核性能转移到提高核的数量。旗舰级高端移动CPU迅速从最初的双核拓扑结构移至四核Cortex-A9。

  image003.png

  除了开启了多核性能大门之外,与Cortex-A8相比,每个Cortex-A9处理器的单时钟周期指令吞吐量提高了大约25%。这个性能的提升是在保持相似功耗和芯片面积的前提下,通过缩短流水线并乱序执行以及在流水线早期阶段集成neonSIMD和浮点功能而实现的。

  Cortex-A15

  随着智能手机市场开始加速发展,ARM再次预见到了不断发展的移动系统对芯片性能提出的更高要求。为此ARM开发了一款性能上大幅提升的处理器,用以专门针对新的高端移动市场。在已经非常强大的Cortex-A9的基础上,ARM凭借cortex-a15又将性能提高了50%以上。此外,Cortex-A15引入了一系列架构扩展,从而实现了更大物理地址空间、硬件虚拟化支持和扩展一致性。在32位系统中内存被划分为2GB设备内存和2GB普通内存,当设备的RAM超出2GB的时候,拥有更大的物理地址空间就变得异常重要。ARM和其他合作伙伴也一直在探索虚拟化技术在商务移动系统和自带设备中的用户操作系统以及类似应用情景进行探索——扩展一致性在big.LITTLE处理器技术中被应用的淋漓尽致,它提供了一种降低平均功耗并在功耗受限的条件下优化达到最大性能的方法。

  image005.png

  Cortex-A15集群集成了监听控制单元(SCU)以实现硬件一致性,每个集群包含一至四个CPU核心,并集成二级高速缓存控制器——Cortex-A15之后的所有ARMCortex-A系列CPU都沿用了这种拓扑结构。

  在移动设备中不断突破性能极限

  A15+performance+graph.png

  比较Cortex-A系列高端处理器的性能,可以看到自从Cortex-A81GH处理器在2008年上市以来,性能有了大幅提升。

  一致性扩展机制,实现为AMBAACE,使下图所示的big.littleSoC成为可能。在big.LITTLE系统中,通常实现一个“大”CPU集群,并对其进行调节以满足高性能的要求,同时对“小”的CPU集群进行调节,满足对高能效。在典型工作负载中,LITTLE处理器可以处理绝大部分工作,而“big”CPU集群的激活时间不足10%,在很多情况下还达不到总CPU运行时间的1%。通过CoreLinkCCI-400高速缓存一致性互连组件,CPU集群能够监听其他集群的高速缓存,从而实现软件线程从一个集群到另一集群的快速转移。

  Cortex-A12

  随着智能手机市场的爆炸式增长,SoC供应商和OEM将该市场划分为旗舰高端级别、中端级别、低成本入门级别。随着这些细分市场的出现,ARM一直在定义专门针对上述三个级别市场的不同处理器。cortex-a12是采用全新微架构的一个全新处理器,专门面向快速发展的中端移动市场。下图显示了这些细分市场的规模,以及面向这些细分市场的ARMCortex-A产品:

  image010.png

  Cortex-A12的设计面向中端移动SoC,以满足这一细分市场对于芯片面积和功耗的要求。它使用无序双执行流水线,其性能比当前在许多中端移动SoC中使用的Cortex-A9高出40%。Cortex-A12在2013年中推向市场,有望在2014投入量产。它是一款32位处理器,具有与Cortex-A15相同的物理地址扩展和相关的架构特性。

  image012.png

  Cortex-A12能够在很多(但并非全部)用例中提供接近Cortex-A15的性能。Cortex-A12还针对中端移动设计进行了优化,取消了一些企业功能,使用略微简单的流水线,因此在横跨多个市场的高端设备上都可以找到Cortex-A15的身影,而Cortex-A12则专门面向中端移动设计。

上一页 1 2 下一页

关键词: ARMCortex-A处理

评论


相关推荐

技术专区

关闭