大厂又下血本囤货了

中国新闻周刊

DeepSeek打破大模型堆算力的想象,并没有照进现实。

3月13日,据财经援引接近英伟达人士报道,腾讯近期向英伟达采购一批H20芯片,订单金额约合几十亿元量级。中国新闻周刊就此消息向腾讯求证,截至发稿并未获得回复。

今年以来,英伟达的股价已经下跌近25%,市值累计蒸发9000多亿美元。不过或许是受腾讯采购消息影响,美东时间3月13日,英伟达盘中一度涨超1.5%。

业内预判,算力“军备赛”的主要受益者还是英伟达。

图/视觉中国

图/视觉中国

囤卡的不只腾讯

曾一度在国产大模型混战中“失声”的腾讯,在过去一个月中,借着DeepSeek现象级爆火的东风动作不断。

2月8日,腾讯云宣布上线DeepSeek-R1及V3原版模型API接口。2月13日,腾讯元宝版本更新,正式接入DeepSeek-R1 671B满血版,靠着比DeepSeek本体“更丝滑”的使用体验和短时间内的大手笔投放,在App Store中国区免费App排行榜中一度登顶,完成对DeepSeek和豆包的逆袭。此后,腾讯旗下包括微信、QQ音乐、腾讯文档等多个应用相继接入DeepSeek。

这也被外界视作腾讯转变AI战略的一系列信号。

也正因如此,此番腾讯采购数十亿元英伟达芯片的消息一出,引发了不小的关注。

不过,腾讯大笔囤卡并不是突然发生的。

市场研究机构Omdia数据显示,2024年,腾讯订购了约23万颗英伟达AI芯片,购买量仅次于微软和字节跳动。

2024年英伟达Hopper架构芯片出货量。图/Omdia

2024年英伟达Hopper架构芯片出货量。图/Omdia

公开报道显示,在腾讯1月13日召开的2024年度员工大会上,马化腾便曾表示腾讯会持续投入资源进行算力的储备,希望各个事业群都能拥抱大模型的产品化落地场景。

“AI行业对芯片等算力资源的的需求一定是持续的,无论是在训练上,还是在应用上。这就像耕田是一定要有灌溉的水一样。”有AI行业人士对中国新闻周刊表示。

而这样的需求,显然也并非腾讯所特有的。

事实上,今年以来,科技巨头加码AI投入的消息并不鲜见。

海外来看,Meta创始人扎克伯格在今年初的财报电话会上表示,Meta计划长期投资数千亿美元用于AI基础设施,今年在AI相关业务上的资本开支将从去年的390亿美元提高至600亿—650亿美元。谷歌、亚马逊、甲骨文等也相继提高了计划给AI数据中心建设的预算。

国内大厂也加快了脚步。浙商证券研报显示,字节跳动在AI上投入巨大,去年资本开支达800亿元,今年有望达到1600亿元。今年初阿里巴巴集团CEO吴泳铭宣布,未来三年阿里将投入超过3800亿元,用于建设云和AI硬件基础设施。

在这些基础设施中,算力是重要的一环;AI芯片又是算力的核心,其性能影响着计算的成本和效率等。因此,采购性能更好、数量更充足的AI芯片,本就是大厂们基础设施建设中的重要一环。

算力需求激增

大厂们算力“军备赛”愈演愈烈,与“2025年是AI应用爆发年”的业内普遍预判脱不开干系。

CIC灼识咨询总监陈一心曾对中国新闻周刊表示,应用创新将是今后大模型的核心竞争点。“鉴于AI平权的趋势,大模型的使用成本大幅降低,预计将会催生更多优秀的大模型应用,以服务用户实际的、需要落地的需求。”

“DeepSeek像是导火索,引燃了早就堆好的火药桶——大厂们本来就憋着劲搞AI应用,现在突然冒出个成功案例,直接刺激大家加速布局。”深度科技研究院院长张孝荣也表示。

而这势必将带来算力需求的爆发式增长。

从应用端看,一方面,随着DeepSeek带动AI应用迅速普及,B端和C端用户的规模持续增加,对大模型的调用量也必然大幅增长。迅速增长的Tokens,自然需要消耗更多的推理算力。

另一方面,随着大模型功能走向“高级”,无论是深度思考、多模态,还是更进一步具备执行能力的AI Agent,其处理任务的复杂程度也会让Tokens数量指数级增长。

在这一发展过程中,想要用户体验更好,提升算力储备就也无法避免。毕竟,没有人可以永远包容“服务器繁忙,请稍后再试”。

同时,为了满足用户对AI应用日益上调的预期,企业们也需要让自家模型越来越聪明。模型进化过程中,训练算力的持续投入也无法避免。

而眼下,算力,尤其是智能算力,是存在较大缺口的。据工信部统计,截至去年底,全国算力总规模突破230EFLOPS(每秒一百亿亿次的浮点运算),但供需缺口仍达35%。

也正因如此,如果再叠加上美国出口政策随时可能变动的因素,也就不难理解国内大厂囤卡的操作了。“买卡就是买竞争力。”张孝荣表示,“现在各家都在‘卷’大模型,谁算力跟不上谁就掉队。”

据国际市场调研机构SemiAnalysis估计,去年,中国市场专供的英伟达H20系列芯片出货量预计超过100万枚,为英伟达贡献超120亿美元的收入。

美东时间3月17日至21日,英伟达即将在美国加州圣何塞举办全球AI界顶级峰会GTC 2025。在本次GTC大会上,英伟达CEO黄仁勋计划揭晓新一代AI芯片平台Rubin的技术细节及量产时间规划等,同时本届GTC中将首次推出聚焦量子计算的“量子日”。届时,其AI芯片性能、成本等改进,以及对未来算力的思考与布局,或将为行业带来新的变化。

编辑 高凯欣
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开