DeepSeek一句话,何以让寒武纪股价逼近茅台|南方产业观

南方产业观察
+订阅

一场由中国AI大模型引领的算力革命,正在资本市场掀起波澜壮阔的国产替代浪潮。

连日来,A 股市场掀起罕见的科技股狂欢浪潮。其中,寒武纪连续涨停,股价已超1300元,距离茅台股价几乎只差一个涨停板,其总市值也已飙升至5500亿元。

这一切的导火索,源于中国AI公司DeepSeek在微信公众号留言区的一句话:“UE8M0 FP8 是针对即将发布的下一代国产芯片设计”。

“下一代国产芯片”“UE8M0 FP8”“专为国产 AI 芯片设计”等关键词,瞬间点燃市场热情。这背后,是头部国产开源模型对国产芯片的支持,有望推动国产算力生态加速落地。

受访者 供图

国产算力迎来爆发

最近,DeepSeek在发布DeepSeek-V3.1模型时,仅在正文和留言区轻描淡写地提到“UE8M0 FP8格式为下一代国产芯片优化”。

FP8(8位浮点数)是一种数据存储格式,相当于用更短的“数字密码”记录信息,比传统的16位、32位格式节省“空间”。

简单来说,“UE8M0 FP8”就是为AI场景设计出来的“高效数据格式”,能让大模型跑得更快,占用的内存/显存更少。

那么,怎样的芯片才能适配这样的模型,“下一代芯片”又是谁?DeepSeek没说,但可以从中国信通院8月初公布的一批“DeepSeek大模型适配厂商”中,寻找蛛丝马迹。

在“首批通过DeepSeek适配测试名单”中,包含中国电信的星辰MaaS平台;华为的推理服务器;寒武纪的AIDC一体机;昆仑芯的P800一体机;沐曦的C550一体机及智算集群。目前,深圳云天励飞DeepEdge10芯片平台也已适配DeepSeek系列模型。

受访者 供图

“我们的旗舰AI训推产品MTT S5000是国内首批原生支持FP8并已大规模量产的GPU。”专注于全功能GPU研发的摩尔线程的技术人员告诉南方+记者。

他介绍,摩尔线程的MUSA架构原生支持硬件FP8张量加速计算,相对于传统的FP16计算能够实现两倍的浮点算力提升、访存和通信带宽效率提升和存储容量利用率提升,同时最优化张量表达精度。

此前,摩尔线程递交科创板招股书,拟募资约80亿元,成为今年上半年科创板拟募资规模最大的冲刺者,也打响了“国产英伟达”上市的第一枪。

受访者 供图

而作为上市公司,寒武纪在市场的反应更是十分直观:8月22日寒武纪涨停,市值超过5000亿,单日猛增866亿美元,取代中芯国际,位居中国半导体行业第一位。当前,寒武纪股价超过1300元,仅次于贵州茅台。

近段时间以来,寒武纪股价涨势如虹,截至8月25日的最近11个交易日,寒武纪股价累计涨幅一度超100%。

如果拉长时间维度,2023年以来,寒武纪股价已经从不足50元,一度飙升至1391元,最大涨幅超过25倍。

英伟达“平替”价值凸显

寒武纪之所以火爆,主要得益于,全球AI算力爆发与国产替代政策红利的双重驱动。

在PC电脑时代,英特尔把握住了时代的脉搏,一跃成为芯片行业的王者。

而在移动手机时代,手机芯片高通弯道超车,把英特尔打得毫无还手之力。

一般来说,上个时代的最强者,往往会给自己戴上难以逾越的镣铐。英特尔如此,诺基亚也是如此。

但无论是PC还是手机,用的主要是CPU(中央处理器),就像一位全能型选手,能应对文字处理、网页浏览等多样化需求。AI训练需要的是“并行计算”——比如识别一张图片,需要同时处理数百万个像素点的特征,这就像一场万人齐舞的团体操,需要高度同步的协作,而非单打独斗。这就给了英伟达机会。

今年以来,Agentic AI的爆发,也同样意味着对算力基础设施的需求会是一个爆发性的增长。

原本在AI芯片领域一家独大的英伟达,却深陷“后门”风暴,就在8月22日凌晨,有媒体报道,英伟达紧急通知三星、Amkor等核心供应商:即刻停止H20芯片生产。这款曾被中国厂商疯抢的“特供版”AI芯片,一夜之间沦为弃子。

在英伟达部分芯片遭禁的背景之下,寒武纪、摩尔线程等国产芯片的“平替价值”正在显现。

早在2010年底,在中国科学院计算所一次内部汇报中,后来的寒武纪创始人,陈云霁、陈天石兄弟就提出了研发AI芯片的构想——开展人工智能和芯片设计的交叉研究。这一想法无异于是天方夜谭,因为英伟达在当时也还只是一家卖游戏显卡的公司。

2017年9月,华为发布人工智能手机芯片“麒麟970”,背后搭载的正是寒武纪1A处理器,寒武纪一夜之间声名鹊起。

2024年,寒武纪思元590芯片问世,这是一款采用7nm工艺的国产芯片,在推理场景能效比能比肩国际巨头,几乎支持所有国内主流大模型。

数据显示,寒武纪思元590芯片性能达英伟达A100的80%,且功耗降低15%,成为政务云、运营商智算中心的首选。

据中信证券预计,2026年国内智算芯片市场空间约3230亿元,届时,国产芯片有望占据近一半市场份额。

生态协同重构市场格局

一枚指甲盖大小的芯片,背后事关产业安全。

以往国内云计算公司尤其是互联网公司,一直偏向于采购英伟达等成熟公司的AI芯片产品。行至当下,以寒武纪为代表的部分国产AI推理芯片,也可以满足AI推理计算需求,这是以往不敢想象的一幕。

一方面,国产化加速叠加大模型推理需求爆发,以DeepSeek等为代表的本土大模型快速发展,带动了对高性能AI推理芯片的旺盛需求。

另一方面,寒武纪业绩快速增长,今年一季度实现营业收入较上年同期大幅增长4230.22%;与此同时,公司已经连续两个季度实现盈利,一季度归母净利润较2024年第四季度环比增长达到30.61%。

有着大模型世界领先地位的DeepSeek,不以押注英伟达“地表最强”GPU为目标,反而以“算法换算力”,正在打造“国产大模型+国产芯片+国产软件系统”的国产化闭环。

而芯片厂商也牢牢绑定大模型。目前,寒武纪与浪潮、中科曙光联合推出“国产算力全家桶”,并加入“模芯生态创新联盟”,推动芯片与大模型的深度协同优化,降低推理成本。这种“硬件+软件+应用”的闭环生态,正在重构行业竞争格局。

“3nm工艺打不过7nm”,这看似违反常识的现象,正在中国芯片产业真实上演。

比如,华为昇腾910C已经用384颗芯片组成的CloudMatrix系统,实现了对英伟达GB200系统1.7倍的算力反超。

在单卡性能上,采用台积电3nm工艺的英伟达GB200确实占据优势。这颗包含2080亿个晶体管的怪兽芯片,代表着当前GPU领域的工艺巅峰。

但华为用“集群作战”的方式实现了逆转。通过384颗910C组成的CloudMatrix系统,整体算力比英伟达GB200NVL72系统高出67%。这种“蚂蚁啃大象”的战术,诠释了中国工程师的智慧:既然单打独斗难以取胜,就用系统级创新弥补个体差距。

摩尔线程创始人兼CEO张建中,在2020年创立摩尔线程前,曾担任英伟达全球副总裁兼中国区总经理。在接受南方+记者采访时,他就提到,芯片制程达到3纳米甚至1纳米,就不断逼近了物理极限,因此还需要软件、硬件、流程、工艺、质量等一系列手段来提高制程。

但除此之外,网络拓扑、片间互联、卡与卡之间的互联、节点与节点之间的互联,整个大的集群管理、算法以及各种不同的库、框架等等一系列工具,也可以达到同样效果。

在行业内,投资人曾总结一个规律:“硬科技最开始的5-10年,回报预期低于线性增长,唯有耐心熬过蛰伏期,等它过了拐点,才能迎来爆发式成长。”

中国硬科技崛起长路漫漫,艰难险阻。而寒武纪等国产芯片厂商,无疑激励了更多人投身到硬科技的星辰大海。

南方+记者  郜小平

话题研究员 刘静

编辑 刘静
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开