台媒:DeepSeek震撼美国AI科技圈,神秘老板梁文锋新闻联播低调亮相!美股大V称,DeepSeek创造了一个AI巨头们的痛苦时刻。
中时电子报报道,最近一周,中国的神秘AI公司、被称为“AI界拼多多”的人工智慧初创企业深度求索(DeepSeek)刷屏全球各大主流媒体和社交网站,尤其让美国AI科技圈极为震撼。该公司创办人梁文锋首次在央视新闻联播亮相时表示,DeepSeek之所以震撼美国,是因为它来自中国公司,中国AI要发展,必然需要有人站到技术的前沿。
据《快科技》报道,DeepSeek最新发布的R1模型不仅在性能上比肩甚至超越了OpenAI的o1,并完全开源,更以极低的成本实现了这一突破。一向极为低调的DeepSeek老闆梁文锋日前首次亮相新闻联播时表示,“在美国每天发生的大量创新裡,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏裡去。毕竟大部分中国公司习惯 follow,而不是创新。”
目前AI科技界有些人认为,DeepSeek可能会颠覆辉达(NVIDIA)在AI硬体领域的主导地位。在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第3,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第1。
Arena放榜之后,全球关于DeepSeek的讨论再次升级。辉达的高级研究科学家范麟熙评价道:“我们生活在这样一个时代:一家非美国公司正在让OpenAI的初衷得以延续──真正开放、为所有人赋能的前沿研究。”
美国私募基金Noah's Arc Capital Management认为,DeepSeek-V3模型的突破显著降低了AI培训成本,使AMD GPU成为比NVIDIA更具有成本效益的替代品,增强了AMD的市场地位。
报导指出,DeepSeek-R1让美国乃至全球的AI圈有如此大的反应,主要因为它突破了由美国和OpenAI建立起的规则。以往由OpenAI引领的AI路线是以规模制胜,但这种发展模式也将AI发展带入了一个怪圈,为追求更高的性能,大模型的体积只能不断膨胀,参数数量呈现指数级增长,同时带来了惊人的能源消耗和训练成本。而一家公司想发展AI,就必须投入高昂的成本向辉达买GPU晶片训练,绝大多数公司根本难以为继。
而DeepSeek的诞生,让低成本、高性能的AI成为可能。大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力。而辉达等硬体商的传统优势更多集中在训练侧,这可能会对其市场地位和战略佈局产生影响。
美股大V“THE SHORT BEAR”在社交媒体上表示,DeepSeek创造了一个AI巨头们的痛苦时刻,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬体费用,现在这种冒险行为变得越来越无利可图,也因此造成辉达股价大跌。
梁文锋说,中国AI不可能永远处在跟随的位置,经常有人说中国AI和美国有1、2年差距,但真实的落差是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。辉达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态,所以中国必然需要有人站到技术的前沿。
声明:该文仅代表作者本人观点,欢迎在下方【顶/踩】按钮中亮出您的态度。