龙芯6000性能将再次飞跃

相对于一些技术引进CPU在引进海外技术后CPU IPC增长缓慢,性能提高基本依靠购买更好的EDA工具和买台积电更好的工艺。龙芯一直致力于提升CPU微结构设计水平来提升CPU的性能,没有盲目去堆核心数量。这种稳扎稳打的做法使龙芯在过去10年中IPC提升了3-4倍,在桌面CPU上成效立竿见影。

CPU的IPC在过去10年中提升了3-4倍,这使龙芯可以在制造工艺上落后技术引进的某ARM CPU一代的情况下,依然可以依靠CPU微结构设计水平做到性能持平或略优于技术引进的某ARM CPU。当龙芯与引进的某ARM CPU采用相同工艺时,龙芯可以凭借其IPC上的优势在性能上领先某ARM CPU。

龙芯3A5000

3A6000和3A5000采用相同制造工艺,龙芯依靠其设计能力把CPU性能大幅提升,主要是拉大框架,比如把4发射改成6发射等等。从此前公布的仿真成绩看,定点相对于3A5000提升30%,浮点相对于3A5000提升60%,这种提升是非常骇人的——如果仿真成绩与最终成绩相当,那么,3A6000 SPEC06单核定点Base分大于13/G,浮点Base分大于16/G,基本达到AMD Zen2水平。如果3A5000为2.5G至2.8G,那么,3A6000的 SPEC06单核定点Base分大于35,浮点将大于45。

从公开信息看,在使用相同工艺的情况下,3A6000性能比3A5000提升40%—60%,芯片面积缩小20%,12nm的3A6000对标7nm的AMD Zen2。做最保守估算,3A6000 SPEC06单核定点Base分为32分(@2.5G)至35分(@2.8G)。这个性能对于信创和日常使用而言都已经明显过剩了。

必须说明的是,仿真往往是不准确的,有的公司会高估,有的公司会低估,从龙芯这几年发布的信息看,龙芯是偏保守的,实测成绩只会比仿真成绩好,以最近流片回来的2K2000来看,实测成绩比龙芯仿真成绩高了20%至30%,这大大超乎龙芯的预期。龙芯2k2000的LA364性能基本追平ARM A76,充分展示了自主路线的发展潜力和发展活力。