(观察者网讯)据《华尔街日报》7日报道,美国对华半导体出口管制正促使多家中国龙头科技公司加快研究步伐,寻求利用国产自研等现有芯片资源开发尖端AI,摆脱对个别外国先进制程芯片的依赖。

报道还引述对研究论文的评估以及对相关员工的采访指出,尽管这对中企来说构成一定挑战,但部分实验已经让人们看到了突破美方围堵的前景,中国科技公司面对未来潜在限制的适应能力也或更强。

《华尔街日报》报道截图

报道提到,去年10月,美国商务部公布了一系列针对中国先进集成电路领域的出口管制措施,此后一个月,OpenAI就发布了ChatGPT,并在全球引发了一波生成式AI的开发热潮。这种软件可以自行生成文本和图像,其开发需要的算力之大前所未有。

随着类ChatGPT模型的商业化竞赛日益升温,全球各地的公司都急需更强大的芯片,并寻求更有效的利用,以压低激增的AI开发成本。报道称,为绕过美国限制,不少中国科技龙头企业正在设法组合大量可获得的低性能芯片,或将外国先进制程芯片留给计算最密集的任务使用。

新加坡国立大学高性能AI实验室主任尤洋告诉《华尔街日报》,由于组合低性能芯片的做法成本很高,这正促使一些公司加速开发技术,使用不同类型的芯片来训练大规模AI模型,包括国产自研芯片。

报道称,这在中国公司并不鲜见。根据开源研究论文和知情人士的说法,百度近年来一直在寻求将国产芯片纳入其AI开发,包括海光的DCU、华为的AI训练芯片昇腾,还有百度自己的昆仑芯。此外,有论文显示,阿里巴巴、百度和华为已在寻求使用A100、老一代英伟达芯片V100和P100以及华为昇腾芯片的各种组合。

与此同时,中国公司也正在研究使用各种软件技术来降低训练大规模AI模型的计算强度。这种方法已在全球范围内加速推广,包括在美国公司中。不过,论文显示,中国公司在结合使用多种软件技术方面更为积极。

报道指出,尽管其中许多方法在全球研究界仍处于不断完善中,实施起来也存在困难,但中国研究人员已取得了一些成功。

据悉,在今年3月的一篇论文中,华为研究人员展示了他们如何利用这种技术,只使用昇腾芯片来训练其最新一代大语言模型。研究人员表示,尽管存在一些缺点,但华为盘古大语言模型在处理阅读理解、语法挑战等一些中文任务上都具有最先进性能。