摘要:
未来AI算力格局很可能不是“一方通吃”,而是多元并存。
凤凰网科技 出品
作者|Dale、姜凡
编辑|董雨晴
当地时间12月8日,特朗普于社交媒体公布,将准许英伟达向中国出口其H200人工智能芯片,但附有一项关键条款:销售收入的25%须作为税费上缴美国政府。
在全球市场,英伟达总能显示出极强的话题性,但也让英伟达一直处在高压线上。据 Business Insider 报道,英伟达CEO黄仁勋近期在内部表示:“如果我们交出糟糕的季报,哪怕只差一点点,看起来有一点点不稳,整个世界就会崩溃。”
真正使其感到不安的,是极速变化的AI市场,撕裂了全球的生产秩序。
然而英伟达愈强,外部挑战者就愈发想要改变其绝对垄断的局面。特别是,当算力即国力的趋势已定,中国挑战者们,更加希望能够逆转未来。
就在英伟达高端芯片对华供应受限的周期内,中国本土GPU企业正迎来技术迭代与市场拓展的双重加速。摩尔线程、沐曦等国内厂商已陆续公布可替代产品,虽然在整体生态成熟度与峰值算力上仍存差距,但自主可控的供应链趋势已不可逆转。
市场情绪也在发生这样的变化。值得关注的是,正式登陆资本市场仅5日,摩尔线程股价涨幅最高超50%,一度触及941元/股,市值超越4000亿元。接连异动,“吓”的摩尔线程在夜间紧急发布公告,称“公司股票价格涨幅较大,显著高于相关指数涨幅,可能存在短期上涨过快出现的下跌风险。”
曾经看似无可撼动的英伟达“算力帝国”,正在全球政策博弈与内外竞争的双重挤压下,悄然浮现结构性裂痕。
英伟达H200宣布回归,在摩尔线程上市3天后
有点戏谑的是,此次H200获准回归中国市场的时间,刚刚踩在“中国版英伟达”摩尔线程正式上市三天后。
12月5日,摩尔线程正式登陆A股,创下首日涨幅425%的佳绩。在上市后的5天时间里,摩尔线程也在疯涨,股价触及惊人的900元。
同样在12月5日,“国产GPU四小龙”之一的沐曦股份开启申购,面向公众的IPO申购倍数高达近3000倍,成为新“打新之王”。
这些企业的成长速度值得肯定。摩尔线程营收从2022年的0.46亿元上升至2024年的4.38亿元,年复合增长率高达208.44%;沐曦的增长更为可观,从2022年的42.64万元增至2024年的7.43亿元,三年复合增长率达到4074.52%。
在技术层面,国产GPU企业也取得了一些实质性的进展。摩尔线程累计研发投入超过43亿元,研发人员占比达77%以上。其基于MTT S5000构建的夸娥万卡智算集群,能够高效支持万亿参数的大模型训练,其计算效率达到同等规模国外同代系 GPU 集群。
沐曦的下一代旗舰产品曦云C700系列性能直接对标国际顶尖的英伟达H100,预计在2027年下半年实现大规模量产。
英伟达在中国市场的挫折加速了替代方案的崛起。2026财年第三季度,英伟达在中国区收入同比暴跌63%,占总收入比例从13%骤降至5%。
黄仁勋本人则在今年10月的一次对谈中透露,受出口管制影响,英伟达已100%退出中国市场,市场份额从95%骤降至0%。
如今H200回归,会对国产生态再度产生影响吗?
一位AI infra层企业高管曾对凤凰网科技表示,大模型企业训练多采用英伟达的H卡,但是在推理层面,国产卡更具性价比。2025年,DeepSeek掀起了推理市场的热潮,也为国产生态打开了关键的窗口。
实际上,换卡从不是一件简单的事情。英伟达的真正护城河正是其软件生态。CUDA平台拥有超过400万开发者和大量软件库,形成了几乎无法逾越的生态壁垒。国内领先的AI企业,也一度与英伟达的 “Hopper” 架构高度绑定。
不过,DeepSeek在8月21日正式发布V3.1时,曾提到“UE8M0 FP8是针对即将发布的下一代国产芯片设计”,意味着从那时起国内的头部大模型已经在配合国产芯片了,这样的软硬件协同对国产生态发展至关重要。摩尔线程也在近期表示,将发布新一代GPU架构。其还号召了一场GPU开发者大会,计划共同探索国产算力的突破路径。
况且,就连英伟达自身都已处在架构转换的过程中。2024年3月,英伟达在GTC大会上发布新一代芯片架构blackwell,6月投产后就就已部署至微软azure和亚马逊云平台。当年度10月升级至B300型号后,已在2025年第三季度量产。该系列目前依然不在出口许可范围内。
此次允许销售H200,对于英伟达是一种生意上的胜利,但黄仁勋清楚语境的改变,其也表示,“美国放松对AI芯片销售的限制,中国是否会接受英伟达的H200芯片,我对此并不确定。”
国产芯片虽然在顶级性能上和英伟达的最新高端产品有差距,但能满足大部分推理场景的需求。中国企业正通过大规模部署、软件优化、任务分流等方式实现 “够用就好”的算力策略,满足多数商用和行业应用需求。
英伟达,不再“唯一”
未来AI算力格局很可能不是“一方通吃”,而是多元并存。随着AI训练与推理负载的日益多元化和高度专业化,GPU的通用性与ASIC芯片的高效性也将找到各自的应用场景。
英伟达重返中国市场更像是一场“迟到者的回归”,在这则消息发出前,英伟达也经历最糟糕的一个月。
自10月29日股价触及212美元/股的历史高点后,英伟达在不足一个月内累计跌幅约16%,市值蒸发逾8000亿美元,约合人民币5万亿元。
此番回调甚至发生在企业基本面依然向好的背景下:其三季度营收达570亿美元,同比增长62%;净利润同比增长65%至319亿美元。
市场对英伟达已经陷入了“业绩差证伪AI,业绩好助长泡沫”的两难困境。
困境背后资本也在大规模撤离。桥水基金第三季度大幅减持英伟达,硅谷风投教父彼得·蒂尔清仓了英伟达,曾在次贷危机前做空房地产的“大空头”迈克尔·伯里更是公开质疑科技公司围绕英伟达的循环交易。
伯里指出,英伟达、英特尔、OpenAI、甲骨文等公司之间存在复杂的资金循环关系,真正的最终需求量极其微小。
除了中国市场的境况变迁,谷歌TPU的崛起是英伟达面临的另一重直接威胁。2025年,谷歌发布了第七代TPU Ironwood,这是一个里程碑式的产品。Ironwood采用4nm制程工艺,FP8算力高达4.6 PetaFLOPS,通过光学互连技术可将多达9216颗芯片连接成一个计算集群,总算力达42.5 ExaFLOPS。
与英伟达GPU的“暴力美学”不同,谷歌TPU走的是“集群艺术”路线。其核心优势在于系统级优化:通过OCS(光路交换)技术,TPU集群可以实现毫秒级拓扑重构和故障绕行,系统可用性提升至99.999%。
更重要的是,谷歌正积极推动TPU的商业化进程。据报道,谷歌正在与Meta等科技大厂洽谈合作,Meta正考虑从2027年开始在其数据中心部署谷歌TPU。这对英伟达是沉重一击,Meta一直是英伟达最大的客户之一,拥有60万颗以上的H100芯片。
谷歌的战略很明确:不比“单卡最强”,而是比“每美元算力”。谷歌通常将TPU的定价设定在比同级别GPU低30%-50%的区间,对长上下文推理、大规模模型训练等任务,TPU能比GPU节省一半以上成本。
谷歌TPU只是英伟达面临的众多挑战之一。更广泛的趋势是,全球科技巨头普遍加速自研AI芯片,争夺算力主权。
亚马逊AWS持续更迭Graviton、Trainium、Inferentia系列;微软也发布了自研AI芯片Maia系列。在AI应用领域,OpenAI的竞争对手Anthropic已计划使用谷歌的算力,部署多达100万个谷歌TPU芯片训练旗下AI大模型Claude。
甚至苹果也加入这一阵营,在其技术论文中确认,Apple Intelligence的核心模型是在2048块TPU v5p和8192块TPU v4上训练的。这直接打破了“只有英伟达GPU才能训练顶级模型”的神话。
这种多元化趋势在Anthropic的合作策略中体现得尤为明显:一方面与英伟达签订长期基础设施协议,另一方面又同时采购谷歌最新TPU。大型AI公司不再愿意将未来完全押注在某一种芯片架构上。
而当H200或将重返中国,黄仁勋也许赢得了一场战役,但整个战争的格局已被永久改变。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com