DeepSeek-V3登顶美区App Store，东大大模型技术碾压美国？

美媒惊呼：中方已全面碾压美国！扎克伯格公开抱怨中方太狠了：硅谷这次麻烦大了！

当地时间1月27日凌晨，来自东大深度求索公司的DeepSeek-V3模型首次登顶美区App Store排名第一位，在免费APP下载榜单上力压长期霸榜的ChatGPT，这被美国彭博社认为是东大大模型全面超越美国多款大模型技术的开端，更有甚者认为这是东大大模型技术开始碾压美国的里程碑时刻。

2024年年底，深度求索公司发布DeepSeek-v3大模型后，瞬间在美国业界引起巨大震动，根据DeepSeek-v3的技术报告，该大模型的训练成本仅为550万美元（约合4000万元），而且仅仅使用了性能远逊于美方的H800人工智能芯片，就可以训练出可以比肩ChatGPT最新版本的大模型，这一事实让美方投资界和人工智能领域的专家一度开始自我怀疑。

随后，深度求索近期又发布了DeepSeek-R1推理模型，这款开源软件的总体性能完全可以比肩闭源的OpenAI的o1正式版大模型，这一消息瞬间点燃了国际市场，美国人工智能领域的专业媒体纷纷惊呼美国人工智能产业已经彻底输了。

与此同时，另外一款推理大模型Kimi k1.5（月之暗面）更是让太平洋对岸惊出一身冷汗，因为K1.5的文本和视觉多模态推理性能，已经证实彻底追上了现役全球最强推理模型——OpenAI o1正式版，而在快速推理思维链（短模型或短思考模式）模式下，K1.5的性能要大幅领先美方最新版本的GPT-4o和Claude 3.5的高水平，而在综合数据分析和AIME榜单上，Kimi k1.5对美方最先进模型抱着断层式碾压。
值得注意的是，DeepSeek-v3大模型的训练时间只有2个月，训练成本只有美方的20分之一，这简直让美国同行无地自容，扎克伯格在26日公开表示，东大在大模型领域的投入太卷了，影响了美国的领先优势。

值得一提的是，无论DeepSeek-R1还是Kimi k1.5都是在相对较低成本、短时间和较低算力下训练出来的，其总体性能达到或超越美方人工智能领域巨头花费数十亿美元，甚至上百亿美元的巨额资金，花费几十个月才训练出来的大模型，这对美方人工智能产业来说，简直就是晴天霹雳。

其带来的冲击必然将让全球人工智能产业发展进行新一轮洗牌，美方在人工智能领域所谓的领先已经不复存在，美方企业进行构筑的以人工智能芯片、大型算力集群以及巨额投资为基础的大模型技术门槛瞬间被打破，而美方一直对东大进行的全方面算力限制也已经毫无意义，英国《金融时报》1月26日刊文称，“在东大大模型面前，美方在人工智能领域的自信心瞬间崩塌了，一切努力都再次归零，这一切来的实在太快，硅谷还在”。

换句说话，东大在人工智能领域追赶的脚步不仅大幅加快了，而且还打破了美方一手制造的所谓“人工智能神话”，那就是训练高性能大模型必须在基础算力和资金投入上进行大规模军备竞赛，才能生产出高性能大模型。

然而事实证明，不需要拥有强大的算力中心支持和资金投入铺垫，东大企业通过模型合并、最短拒绝采样、并行输出结果方案、多层迭代和针对性优化等训练方法方面的革新，在训练大模型领域开辟出了不同的思路和方案，这足以证明美方在训练大模型时出现了方案、方法和思路上的选择性失误，更让美方投资人无法接受的是，在花费巨大投入的情况下，美方大模型构建出来的领先优势瞬间灰飞烟灭，这让人不得不怀疑硅谷企业在训练和科研领域到底存在多少结构性问题。

声明：该文仅代表作者本人观点，欢迎在下方【顶/踩】按钮中亮出您的态度。