新闻中心

EEPW首页 > 模拟技术 > 市场分析 > 15年了,龙芯拿什么与国外芯片巨头对抗?

15年了,龙芯拿什么与国外芯片巨头对抗?

作者: 时间:2015-09-24 来源:雷锋网 收藏
编者按:自诞生之初就处于社会舆论的风口浪尖,承载国人希望的龙芯究竟怎么样?各种报道毁誉参半,那么今天,就让我们一起揭开迷雾下的真相,洞察龙芯背后的艰辛与心血。

 6、的指令集

本文引用地址:https://www.eepw.com.cn/article/280561.htm

  走兼容MIPS指令集发展路线,在2008年金融危机后,以比较低的价格购买了MIPS指令的永久授权,在十几年的发展中对指令集进行了相当大的扩展,逐渐发展出了自己的指令集loongISA。

  loongISA指令集共1907条指令。源自mips:

  216条mips基础指令,获得永久授权。

  311条DSP指令,获得永久授权。

  自主指令:

  mips基础指令扩展——148条loongEXT,

  虚拟机扩展——5条loongVM指令,

  二进制翻译扩展——213条loongBT,

  向量指令扩展——1014条loongSIMD

  在MIPS的指令系统的创新方面已经远远超过了MIPS公司,之所以购买Mips指令永久授权主要是减少市场化过程中的麻烦。举例来说,Transmeta公司曾经市场前景良好,但Intel起诉它,打了两年官司。虽然最终Intel输了,但两年过程中没有人敢跟Transmeta做生意, Transmeta被官司拖垮了。

  MIPS公司破产后,所拥有的技术专利分的比较散。虽然MIPS被英国Imagination公司收购,但Imagination的主营业务是GPU,在CPU设计方面技术底蕴不足,它既没有能力,也没有意志扛起MIPS阵营的大旗,指令集扩展和微结构研发都不如龙芯。

  而龙芯只要保持现有的发展势头,使应用软件跟着龙芯走,构建并壮大自己的产业联盟,那么龙芯对Mips的扩展就是行之有效的,而且有机会夺取Mips阵营的主导权。

  7、编译器

  程序员在编程的时候写的是编程语言,但是计算机运行的时候是机器语言,编译器就是将程序员的编程语言翻译成机器语言的工具,而编译器的好坏也非常影响一款计算机的整机性能,比如SUN就曾经依靠对编译器的优化使CPU的spec跑分提升了50%,大幅提升了整机性能和用户体验。

  国际上使用最为广泛的编译器是GCC,该编译器对X86、ARM、MIPS、Alpha等指令集的CPU优化各不相同,对市场占有率高的X86和ARM优化得较好,版本也比较新(GCC部分代码就是Intel提供的),但对龙芯、申威的优化比较差,版本也比较老旧。

  因此,龙芯自主研发了LCC以提高编译器的效率,虽然LCC诞生的时间还很短,对自家CPU的优化能力无法与Intel公司的ICC编译器相比较,以GS464E的spec2000跑分为例,使用LCC比使用GCC4.8整数提升7%,浮点提升36.8%。毕竟万丈高楼平地起,期待龙芯能不断提升LCC编译效率。

  8、微结构和主频

  CPU性能(单核)=主频*IPC(这个公式必须是同指令集才能成立,不同指令集不可比较)。主频就是CPU工作的时钟频率,同一款CPU在一个时钟周期内完成的指令数量是固定的,因此主频越高,完成一个时钟周期所消耗的时间越短,CPU的运行速度就越快。

  IPC是单位时间内调用的指令集数量,微结构设计得越好,单位时间内能调用的指令集数量越多,CPU的性能就越好。微结构好坏取决于前端设计水平,主频的高低一方面受微结构流水线级数的影响,但更多的是取决于后端的设计水平。再往细的方面说,前端设计主要指芯片的执行结构、数字逻辑层设计、执行状态仿真等方面,后端设计主要指物理层电路的具体优化,包括单元布局、时序优化等方面。

  微结构研发不仅技术门槛高,而且费时费钱,一个微结构从研发到产品一般需要3年,而所需资金更是难以计数。龙芯自2001年以来,共研发GS132、GS232、GS264、GS464、GS464V、GS464E共6个微结构,以龙芯及其有限的人力和财力,实现了以平均2.33年更新一个微结构的发展速度,相较于国家非常有限的扶持,龙芯拿出了远远超过投入的产出。

  龙芯在2015年8月发布的GS464E微结构测试参数非常亮眼。根据中电集团的测试报告,GS464E的SPEC2000使用GCC4.8编译器跑分为:整数768/G、浮点1153/G,使用LCC编译器跑分为:整数828/G、浮点1578/G,微结构的效率在整数性能方面基本追平了AMD目前最好的微结构,在浮点性能方面接近Intel在2013年发布的Ivy,分支预测和访存带宽更是能直接与Ivy比肩(Intel公司2013年的Ivy和2015年的Skylake差距很小)。

  现在,龙芯和国外巨头在微结构方面的差距已经比较小了,差距主要在主频方面和制程工艺方面。在主频方面,2015年发布的龙芯3A2000的主频只有1G,而代码已冻结,即将流片的龙芯3A3000的也只有1.6-1.8G的主频。相比之下,Intel的CPU主频大多在3G以上,部分CPU主频接近4G;在制程工艺方面,受限于中芯国际的代工水平,龙芯能使用的最好的制程为28nm,而市面上出售的Intel芯片制程大多为22nm,Intel最新的产品普遍采用14nm制程工艺。

  9、龙芯产品

  目前,龙芯有龙芯1、龙芯2、龙芯3三个系列。武汉数字工程研究院研发了基于龙芯1A的可信移动终端。龙芯1B多用于工业应用,有工业以太网交换机、网络税控机、北斗车载终端和嵌入式数据采集器等产品。龙芯1C是针对民用市场定义的芯片,被用于智能指纹锁、3d打印机、开源主板、考务终端、考勤/门禁等产品。龙芯1D、1E、1F是直接根据特地客户提出的需求定制的,龙芯1D是超声波热表、水表和气表测量专用芯片;龙芯1E和1F是宇航级芯片,被用于北斗卫星。

  龙芯2系列芯片的微结构为GS264,龙芯2F被用于上网本和一体机等产品。中国兵器工业集团研发了基于龙芯2F+1A的四余度火控计算机系统。龙芯2H被用于上网本、防火墙、交换机、车载计算机平台等产品。龙芯2K是工控芯片,用于数控机床。龙芯2J是按军方需求定制,该芯片被用户单位总师评价为,“已知范围内性能最高,设计最复杂的军品CPU。”龙芯3A1000微结构为GS464被用于笔记本。

  龙芯3B1000和3B1500微结构是GS464V,3B1000被用于高性能计算机KD-90和超算曙光6000,KD-90集成了10片3B1000处理器,理论峰值计算能力达到每秒1万亿次。曙光6000超算使用了2500片3B1000,另外曙光还出品了3B1500的服务器和堡垒机。

  中电十四所用GS464V微结构研发了华睿2号(DSP),华睿2号能将雷达信号处理算法提炼成FFT、FIR、相关、矩阵求逆等17种基本计算构件,较好地解决了雷达系统大带宽、高吞吐的应用需求。龙芯3A2000和龙芯3B2000的微结构是GS464E,龙芯3A2000有台式机和笔记本产品,龙芯3B2000将被用于服务器。

  10、BIOS、操作系统和软件生态

  在BIOS方面,龙芯联合中电科技集团开发的全中文龙芯安全bios----昆仑固件。昆仑固件支持龙芯、飞腾、申威等国产芯片。在操作系统方面,龙芯在2015年8月发布基于linux的社区版操作系统loongnix。此外,龙芯还支持国产中标麒麟操作系统以及Reworks嵌入式操作系统。在软件方面,龙芯支持金山WPS文字处理,JAVA和Flash,火狐浏览器和Chrome浏览器,达梦、金仓、神州通用数据库,东方通、金蝶、中创中间件,中软政务处理系统等,主要针对有信息安全要求的党、政、军、国企、事业单位办公电脑和服务器市场。在软件中有很多核心代码,针对X86和ARM的芯片都是用汇编优化过的,而针对其它结构是用C语言写的普通功能性代码,有着很大的优化提升空间。

  例如某单位的指挥系统刚移植到龙芯CPU时,开机就需要50分钟,但经过两个月的磨合优化,开机时间降低到了30秒。又如有一个数据库,刚开始启动需要10分钟,后来降到10秒。因此,龙芯目前软件生态的重点是对编译器、C库、JAVA、数据库、中间件进行优化,以及对一些专业应用,比如军用的GIS应用加速、网络安全的协议栈等。

  对于普通消费者常用的软件,因龙芯电脑的市场占有率过于渺小,加上龙芯人力、物力、财力都非常有限,在这方面实在是心有余而力不足,这也是民用PC市场基本看不到龙芯电脑的主要原因。

  11、龙芯产业联盟构建

  龙芯想要市场化运营就离不开一个强大的产业联盟的支持。目前,龙芯的合作伙伴主要有中国电子科技集团、中航工业集团、中国核工业集团、中船重工、中国船舶工业集团、中国航天科技集团、中国核建、中国工业兵器集团、曙光、浪潮、中科梦兰、锐捷网络、东软集团、神州数码、研华科技、中兴、西安华芯、清华同方、众达精电等。到2014年底,龙芯下游已有两三百家合作伙伴企业,下游里仅仅是围绕龙芯做研发的技术人员已有上万人。



关键词: 龙芯 海思

评论


相关推荐

技术专区

关闭