【文/科工力量专栏作者 铁流】

日前,龙芯发布了用于服务器市场的的3D5000系列芯片,引发关注。

3D5000与3C5000属于同一代CPU,是采用Chiplet技术把两片3C5000芯片互联和封装在一起,进而获得一片32核CPU,这种方式也被称为“胶水32核”。就性能而言,龙芯3D5000的IPC接近AMD Zen2的水平,全芯片性能与同主频下的32核AMD Zen2架构CPU接近,对于大部分应用已经是够用了。

在2023年,性能更强的龙芯6000系列CPU将要问世,龙芯在IPC上与英特尔、AMD的差距将会进一步缩小,真正阻碍龙芯在市场上推广的要素将不再是CPU性能,而是软件生态。

龙芯5000系列是自主CPU里程碑

2019年,龙芯3A4000四核处理器亮相。龙芯3A4000是继3A3000之后的新一代处理器。3A4000既升级了新内核GS464V,IPC大幅提升;又通过在原有28nm工艺上深入磨合优化,改进电路和物理设计方法,在制造工艺与3A3000相同的情况下,将性能提升了一倍。就3A4000的IPC而言,已经从3A3000的7/G达到了9.8/G,AMD的Zen大致也就在10/G水平,龙芯3A4000的GS464V是一款可以与第一代Zen匹敌的内核。

3A5000的内核是基于GS464V进行小改,IPC为10.6/G,采用12nm工艺,主频为2.2G至2.5G,后期流片的有2.7G主频版本,SPEC06定点成绩超过26(GCC,@2.5Ghz),这对于自主CPU而言已经是非常不错了,即便和引进的CPU相比,其定点和浮点性能仅次于海光,超过其他引进的X86和ARM CPU。

龙芯3A5000与龙芯3C5000、3D5000属于同一代CPU,3C5000采用LoongArch指令集,16核心单芯片unixbench分值9500以上,双精度计算能力达560GFlops,16核处理器峰值性能与典型ARM 64核处理器的峰值性能相当,并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上。就SPEC2006测试来看,单核定点浮点Base分均大于10/G,单芯片分值超过200。可满足通用计算、大型数据中心、云计算中心的计算需求。该处理器通过芯片级安全机制可为等保2.0、可信计算、国密算法替代、网络安全漏洞防护等提供CPU级内生支持。

3C5000最大特点是单核性能强,特别是unixbench这种看重单核和内存性能,多核加速比很低的测试,龙芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到这个成绩。从公开的数据来看,3C5000的性能在信创市场足够用了,而且16核的核心是使其部署比较灵活。

龙芯3D5000则是把两个3C5000封装到一起的胶水32核芯片,集成了64MB的L3 Cache,支持最多8个DDR4-3200 DRAM,可以通过HyperTransport接口构建至多四路处理器,因此单机可以支持多达128核。在性能方面,龙芯3D5000单路和双路服务器的SPEC CPU2006 Base实测可以超过400分和800分,预计四路服务器的分值可以达到1600分。可以说,龙芯3D5000主要针对一些对性能有更高要求的场景,只要软件生态跟得上,完全可以替换掉英特尔至强CPU。