国产新一代芯片,能不能追平英特尔?

日期:2023-11-30 16:03:38 作者:kunshan 浏览量:42

image.png

芯片已经成为生产力提升过程中的绝对主角。


上周三,美国对中国的芯片政策进行了调整,此次政策相比上次更为严格。新政策不仅禁止了用于AI计算的高算力芯片出口到中国,还可能影响到4090这样的消费级产品。

在消息传出后,4090显卡成为了微博上的热搜词汇。尽管目前尚无法确定4090显卡是否会正式出现在这一波的禁令名单中,但市场的担忧情绪已明显升温。

从美国修改政策的频率来看,芯片显然已成为生产力提升过程中的核心因素。这也进一步突显了芯片技术在现代社会中的重要地位。

image.pngimage.png
尽管近年来我们推出了壁仞100这样优秀的GPU或加速计算芯片,但去年刚刚流片成功的它,今年却被列入了实体清单。因此,壁仞100的大规模量产很可能会被推迟,导致我们在市场上难以看到类似英伟达或AMD的国产GPU。


然而,在国产CPU领域,我们可以看到一些能够达到国际主流水平的产品。例如,在最近的GMIF2023大会上,龙芯宣布了最新CPU——3A6000将于本季度正式发布。这表明国产CPU领域在起步更早的情况下,已经取得了一些令人瞩目的进展。

image.png
作为一直关注国产芯片领域的我们,也是早早申请了媒体测试机,终于在两周前拿到了搭载3A6000的主机。


 国产芯片啥样?

打开主机,不仅主板和CPU出自龙芯,其余配件也都出自国产厂商,内存和硬盘也分别来自紫光和大华,机箱电源也是来自爱国者。只有显卡采用了AMD的RX580芯片,但战狼的型号命名,让它在一众国产配件前也不是很违和。

image.png

这块最新主板上还集成了龙芯自主研发的最新7A2000桥片,除了用来控制像USB,音频,网络这样的接口外,里面还集成了龙芯自研的GPU芯片,也就是说,即使不装上显卡,这台电脑依然可用,并且实现了全部配件100%国产化。

image.png
在系统方面,除了主流的国产统信操作系统还有龙芯自研的Loongnix。两者都是基于Linux的系统,但为了照顾大家的习惯,在界面设计上都非常贴近Windows,所以用起来的学习成本很低。


 真的追上10代酷睿了吗?

在龙芯官方公众号发布的一篇文章中,他们宣称龙芯3A6000的总体性能已经追上了2020年上市的Intel第10代酷睿4核心处理器。尽管Intel已经发布了第十三代产品,但这些年的CPU性能过剩,第10代的性能已经足以满足日常办公、娱乐和游戏等需求。

在频率方面,10代i3表现出色,其基础频率达到3.6Ghz,通过睿频加速后,单核最高可以达到4.3Ghz。相比之下,龙芯3A6000的频率与前一代相同,固定为2.5Ghz。不过,这次龙芯增加了超线程技术,将4核心4线程升级为4核心8线程。

为了进行测试,我们采用了两款软件:SPEC 2006用于测试CPU性能,Stream用于测试内存速度。SPEC作为市面上专业的测试软件,先编译再运行各类测试项目,因此可以在各种架构CPU和各类的系统上运行,无论是X86还是LongArch,无论是Windows还是Linux。由于其广泛的适用性和专业性,SPEC已成为目前主流的CPU测试软件。



image.pngSPEC编译过程截图
Stream测试用于评估CPU和内存之间的交互速度。在CPU设计中,内存控制器是关键部分,因为处理所需的数据通常存储在内存中。如果CPU的计算速度很快,但与内存之间的数据交换速度过慢,就会严重限制CPU的性能发挥。因此,Stream测试是评估系统性能的重要环节。
image.pngStream测试过程截图
在SPEC2006的测试中,龙芯3A6000的整数部分单核得分40.4,多核得分146,浮点部分单核得分51.6,多核得分136。
image.pngSPEC得分截图


在整数单核和浮点多核的得分方面,10代i3略高于龙芯3A6000,但其他两个项目的得分龙芯均超过对手。具体得分如下:10代i3得分:整数:单核42.5,多核147;浮点:单核51.3,多核150。

在这次纯粹的CPU计算性能对比中,龙芯与10代i3可以说是势均力敌。这表明在计算性能方面,现在的龙芯已经可以让大家放心了。接下来,我们将看看新一代龙芯在内存交互方面的表现如何。

在Stream测试中,龙芯和内存的最高交互速度出现在四线程的测试中,四个项目的速度都超过了40GB/S。相比之下,i3-10100F在同样的项目中只有30GB/S。这种情况也出现在单线程和8线程的测试中。因此,在内存控制器方面,龙芯的表现已经超越了10代酷睿i3,并且优势相当明显。


image.pngStream最终成绩,均超过40G/S


综合上述两项测试来看,龙芯3A6000在理论性能上确实达到了10代酷睿四核处理器的水平。那么,在实际使用中表现如何呢?

值得一提的是,在测试兼容性时,将同事的两条频率为3200的16G金士顿内存插到龙芯主机上,测试没有问题后,就一直使用下去。然而,在运行SPEC跑分时,成绩总是偏低。后来将两条国产内存换上去,分数就正常了。这表明国产硬件之间可能存在某种神秘的加成效应。

在实际体验中,龙芯3A6000表现如何呢?由于没有具体数据和实际应用场景的描述,我无法给出具体的评价。但可以肯定的是,龙芯3A6000作为一款国产CPU,能够在理论性能上与10代酷睿四核处理器相当,并且在实际使用中具有一定的优势,这是非常值得肯定的。当然,在实际应用中可能还会面临其他问题,如软件兼容性、应用优化等。但随着技术的不断进步和生态系统的完善,相信这些问题也将逐步得到解决。



 国产芯片能干啥?

作为自主研发的代表,龙芯的3A6000底层采用了自主研发的LoongArch(龙架构),与Intel的X86架构有很大的区别。因此,龙芯的CPU无法装载Windows系统,目前只能使用开源的Linux系统。由于不同的架构和系统,很多Windows上的软件无法在龙芯系统上运行。

因此,在测试完性能后,我们需要了解龙芯的生态软件发展情况。目前,龙芯最主要的任务是办公生产力。Linux版本的WPS已经很好地适配了龙架构,使用起来与Windows上的WPS几乎一模一样。这篇稿子就是在龙芯电脑上完成的。

除了办公软件外,还有其他日常软件可以在龙芯系统上运行吗?这是一个很重要的问题。目前,龙芯已经取得了一些进展,例如在浏览器方面,龙芯已经与国内厂商合作开发了基于Chromium的浏览器,可以在龙芯系统上顺畅运行。此外,还有很多开源软件也已经适配了龙架构,如LibreOffice、GIMP等。虽然与Windows系统相比仍有差距,但龙芯正在逐步完善其生态系统,相信未来会有更多的软件适配龙架构。


image.png


对于轻度办公,使用龙芯处理器应该可以很好地满足需求。让我们进一步测试一下龙芯处理器在重度办公场景下的表现。

首先,打开一个50M的百万字Word文件,龙芯处理器基本上可以实现秒开,经过几秒钟的加载后,就可以顺畅地编辑全文。然而,在打开一个200M的Word文件时,会有3秒左右的延迟。这种情况与我日常使用的11代i3移动处理器的表现差不多。

接下来,测试打开一个50M的Excel文件、一个50M的PPT文件和一个500页的PDF文件。令人欣喜的是,这些文件都可以实现秒开,并且可以直接进行编辑。然而,旁边的笔记本这次就要慢上很多了。

image.png

在娱乐方面,主板桥片上集成的GPU已经无法满足需求。在播放4K本地视频时,其表现基本上处于播放PPT的状态。

安装RX580战狼显卡后,视频播放的压力得到了显著缓解。播放本地4K视频和在线B站4K视频都非常流畅。但需要说明的是,当在B站观看4K视频时遇到大量弹幕时,可能会出现掉帧的情况,而且弹幕数量越多,掉帧的情况就越严重。

image.png

在游戏方面,我们也有意外的收获。原本以为在Linux上没有太多游戏可供选择,但龙芯通过转译技术(可以理解为将外文翻译成中文)成功运行了许多X86架构的游戏,并且流畅度非常出色。

例如,劳拉、火炬之光2,甚至魔兽世界都可以流畅运行。经典的CS 1.6和魔兽争霸3也通过转译成功运行,并且运行过程非常流畅。这表明龙芯处理器在游戏性能方面也有着不俗的表现。随着龙芯生态系统的不断完善,未来会有更多游戏支持龙芯处理器,给玩家带来更好的游戏体验。


image.png
在做转译测试的时候,发现3A6000居然可以运行Photoshop,虽然会遇到字体的BUG,但日常P图完全够用了。
image.png
像浏览网页等日常体验,3A6000可以说是毫无压力,无论是一次开几十个网页还是说各大网站的高清视频播放,体验完整性上丝毫不逊于Intel等X86平台。


 国产芯片目前的最大敌人:生态系统

从理论性能测试和日常使用体验来看,龙芯最新的3A6000已经追上了2020年发布的10代酷睿四核处理器。尽管频率比竞品低了1个多Ghz,但龙芯仍然取得了这一成就。

龙芯董事长胡伟武介绍称,龙芯目前正在践行Intel的Tick-Tock战略,处于打磨架构的阶段。如果下一代龙芯能够采用更先进的制程技术,性能将会得到进一步提升。

回顾龙芯的发展历程,2002年龙芯1号刚刚发布时,性能只有当时主流型号的5%。然而,到了2021年的3A5000,其性能已经达到了当时主流水平的50%(相当于第四代酷睿的水平)。而今年的3A6000已经基本上追赶上了主流水平。

由此可见,龙芯这几年的性能提升速度之快令人瞩目。随着龙芯不断追求技术创新和优化,相信未来其性能将会得到进一步提升,为更多用户带来更好的使用体验。


image.png

图片来源:龙芯在上证路演截图


当龙芯的性能达到主流水平时,软件生态成为了关键问题。如果仅有出色的硬件性能而没有足够的软件支持,那么龙芯的发展就会受到限制。

目前,龙芯面临三个主要问题:

首先,需要建立一套自己的系统,并且这套系统的兼容性需要做到像X86架构下的Windows那样,即使从Intel处理器换到AMD处理器,系统仍然可以兼容运行。在最新的Windows 11系统下,也可以玩20多年前在Windows 98上运行的红警2游戏。

其次,需要提高转译性能,使得X86上成熟的应用能够在龙芯处理器上运行。不需要以高性能运行,只要兼容性最好即可。

最后,龙芯需要建立一套与软件开发者合作的模式,鼓励更多开发者为龙芯平台开发应用。只有当更多的软件在龙芯平台上可用时,用户才会选择使用龙芯处理器。

苹果的Rosetta 1和Rosetta 2在这方面提供了很好的借鉴。当苹果从IBM处理器迁移到Intel处理器时,Rosetta 1保证了关键程序的可用性。直到五年后,大多数程序都完成了对Intel X86架构的原生支持,Rosetta 1才下线。2020年,苹果宣布Mac产品线全部从Intel转移到自研的M芯片后,Rosetta 2正式上线,帮助许多专业软件保证兼容可用。


image.png

苹果转向Intel芯片时,专门推出Rosseta1


第三,如何吸引更多的开发者为龙芯平台开发应用,是龙芯发展面临的另一个重要问题。只有当开发者数量增多,龙芯应用才能呈现出百花齐放的效果。

幸运的是,在3A6000成功流片后,龙芯内部认识到了这个问题。在今年的业绩说明会上,胡伟武提出了龙芯的生态解决方案。

首先,龙芯计划基于Linux打造自己的操作系统——Loongnix(以下称龙系统)。传统的Linux在大的版本更新后,软件兼容性问题经常会出现。比如,就像从Windows 10升级到Windows 11后,发现很多在Windows 10上运行良好的软件在Windows 11上无法运行或出现很多错误。

龙系统的重点在于解决不同版本Linux之间的应用兼容性问题。现在,在龙系统上运行的软件,即使进行大版本更新后,仍然可以继续使用。在硬件兼容性方面,龙系统的目标是使得任何一代龙架构的CPU都可以运行最新的龙系统。

另外,龙系统的另一个目标是成为Linux中的安卓系统。其他使用龙芯CPU的厂商可以根据自己的需求在龙系统上进行定制化开发,就像小米在安卓系统上开发出自己的Miui一样。

image.png


另外,龙芯也在积极开发自己的应用程序框架,以帮助开发者更好地开发基于龙架构的各种生态应用。他们计划推出一套类似于iOS和Android的开发环境,以吸引更多的开发者使用龙架构。同时,龙芯也在努力提高转译效率,因为具有完全的自主性,所以添加一些优化进去会更加方便。不过目前来看,转译效果还不够理想,需要进一步优化。

为了吸引更多的用户,龙芯需要提供更好的基础软件体验,如浏览器、影音软件等。同时,他们正在联合一些大企业,如微信、QQ、腾讯会议和飞书等,将这些必要的应用生态做好,以吸引更多的用户。

如何吸引更多的开发者是一个难题。需要有一方做出部分牺牲,是用户牺牲体验,还是开发者牺牲收益。目前来看,龙芯的做法只能是后者。毕竟在开放性的市场,不能让用户被迫使用特定的产品。因此,龙芯需要加强基础软件体验,并联合大企业做好应用生态,吸引更多的用户进来,从而进入到一个良性循环。


 芯片追赶,一切才刚开始

两年前,我们还在为中国自主CPU的性能突破而庆祝。如今,随着龙芯3A6000的出现,我们不再担忧性能问题,反而开始担心没有软件能在国产处理器上运行。

想要打造自己的芯片并非易事,当芯片性能足够出色时,还需要建立起一整套自己的生态体系,只有这样用户才会买单。在这方面,龙芯才刚刚开始。虽然竞争对手已经霸占市场多年,但龙芯仍有很多机会。

从上到下的自主研发意味着很多方面可以更加方便地进行优化。例如,传统X86平台的电脑在运行一些加密软件时需要配备密码机,而龙芯由于内部集成了加密指令集,因此不需要添加任何外部设备就可以运行这些加密软件。

龙芯已经展现出在生态建设上的决心。胡伟武在多场演讲中提到,在性能追平后,他们将全力转移到生态建设上来。目前,龙芯拥有几百名软件开发人员,下游的开发人员更是达到了几十万。相信几年后,我们将看到一套生态基础完善、迈入良性循环的龙芯体系。

在GPU方面也是如此,现在我们已经有超过英伟达A100的壁仞100,但英伟达依靠CUDA已经培养出一大批在GPU上编程的开发者。就像苹果的iOS一样,背靠如此多的开发者,就会有非常多的应用给用户使用。对于英伟达来说,CUDA就是它的iOS。

目前刚刚起步的国产GPU公司也意识到这个问题,像壁仞和摩尔线程,它们在追赶性能的同时也在大力发展自己的社区并兼容目前主流的开发框架。

国产芯片的未来让人无比期待。龙芯用了20年就追上了别人60年的水平。因此,现在请大家给予国产GPU芯片一些宽容和支持,生态环境还需大家一同建设。

注:本文来源半导体封测,版权原作者所有,如侵犯你的权益,我们将第一时间删除。

行业资讯
上一篇:  干掉硅中介层? 上一篇:  HBM技术,如何发展?