图片源于:https://torontosun.com/business/money-news/what-is-deepseek-the-chinese-ai-company-upending-the-stock-market
中国科技初创公司DeepSeek的人工智能聊天机器人在周一引发了一场狂潮,正在颠覆股市,并引发了有关美国和中国在AI技术开发经济和地缘政治竞争的辩论。
深受好奇心驱动,该公司的AI助手在苹果iPhone商店迅速成为下载量第一的免费应用。
一些美国科技行业观察者担心的是,DeepSeek的出现意味着中国初创公司以极低的成本迎头赶上美国在生成性AI领域处于前沿的公司。
如果这一说法属实,那么这就质疑了美国科技公司计划投资的数据中心和计算芯片,以进一步推动AI进步所需的大量资金。
但对于DeepSeek技术进展的炒作和误解也引发了混乱。
“它们所构建的模型非常优秀,但也并不是什么奇迹,”跟踪半导体行业的Bernstein分析师Stacy Rasgon说道,他是描述华尔街反应夸大的几位股票分析师之一。
“他们没有使用任何未知或秘密的创新,这些都是大家在进行实验的东西。”
DeepSeek是怎样的公司?
DeepSeek成立于2023年,总部位于中国杭州,并在同一年发布了其首个AI大型语言模型。
该公司首席执行官梁文峰曾共同创办中国顶尖的对冲基金High-Flyer,该基金专注于AI驱动的量化交易。
到2022年,该基金已经积累了1万颗加利福尼亚州Nvidia的高性能A100图形处理器芯片,这些芯片用于构建和运行AI系统。
在2022年夏季的一则社交媒体帖子中提到此消息后,美国迅速限制了向中国销售这些芯片。
DeepSeek表示,其近期模型是利用不被禁止在中国使用的Nvidia较低性能的H800芯片构建的,从而传递出一个信息:最先进的硬件可能并不是前沿AI研究所需的。
上个月,DeepSeek开始在AI行业引起更多关注,当时它发布了一种新的AI模型,声称其技术水平与OpenAI这样美国公司相当,并且在使用昂贵的Nvidia芯片训练系统方面更具成本效益。
该聊天机器人在今年早些时候在苹果和谷歌应用商店上线后变得更为广泛可接触。
但上周发布的一篇后续研究论文——正好在特朗普总统宣誓就职的那天——引发了随之而来的恐慌。
论文讨论了DeepSeek的另一种AI模型R1,其展示了先进的“推理”能力,比如重新思考解决数学问题的方法,并且成本显著低于OpenAI的一款类似模型o1。
“他们的经济模式看起来如何,我不知道,”Rasgon说。“但我认为价格点让人感到恐慌。”
‘斯普特尼克’背景
围绕DeepSeek的技术能力的戏剧背后,在美国就如何最有效地与中国竞争AI的问题展开了辩论。
“Deepseek R1是AI的斯普特尼克时刻,”风险投资家Marc Andreessen在周日的社交平台X上发文称,提到1957年苏联发射的卫星开启了美苏冷战时期的太空探索竞赛。
作为特朗普的科技政策顾问,Andreessen警告称,美国政府对AI行业的过度监管将妨碍美国公司,令其被中国超越。
但对DeepSeek的关注也可能会削弱美国近年来将重点放在限制向中国销售美国设计的AI半导体的外政策略。
一些美国-中国关系专家认为,这并非偶然。
“技术创新是真实的,但发布的时机在政治上是有其意图的,”战略与国际研究中心Wadhwani AI中心主任Gregory Allen称。
Allen将DeepSeek上周的公告比作美国制裁的中国公司华为在2023年有关拜登政府出口管制的外交讨论期间发布的新手机。
“试图表明出口管制是徒劳或适得其反的,这在目前正是中国外政策略的重要目标,”Allen表示。
周一,特朗普说DeepSeek的突破“很好,因为你不用花这么多钱。”
特朗普在迈阿密对国会共和党人表示,如果这个消息属实,那么这就是“积极的”,因为“你不会花那么多而得到同样的结果。”
他称这一发展为“我们工业的警钟,提醒我们需要专注于争取胜利。”
特朗普在上周宣誓就职的第一天签署了一项命令,表示他的政府将“识别和消除现有出口控制中的漏洞”,表明他可能会继续并加剧拜登的做法。
DeepSeek在没有进行大规模投入下取得的进展可能会削弱OpenAI、Oracle和软银等公司所估算的高达5000亿美元的AI投资。
周一,Nvidia的股票下跌了17%,但该公司在一份声明中称赞DeepSeek的工作是“优秀的AI进展”,并利用了“完全符合出口管制的广泛可用的模型和计算。”
DeepSeek有什么不同?
与OpenAI等竞争对手不同的是,DeepSeek的模型是“开源”的——这意味着关键组件对任何人都可以免费访问和修改,尽管公司尚未透露用于训练的数据。
但吸引人们最多关注的DeepSeek的R1模型,Nvidia称这是“测试时间扩展”的完美示例——即AI模型有效展示其思维过程,并使用这些过程进行进一步的训练,而无需输入新的数据源。
RAND公司研究员Lennart Heim表示:“这基本上就是在思考时出声。”
OpenAI的推理模型,从o1开始,同样会这样,并且其他美国竞争对手,如Anthropic和谷歌,可能有类似的能力尚未发布。
但“这是我们第一次看到一家中国公司在相对短的时间内如此接近。
我认为这就是为什么很多人关注它的原因,”Heim说。
“我曾经相信OpenAI是领导者,山顶之王,没有人能够赶上。
证明事实并非完全如此。