马斯克说明年Q1,唐杰说用不了那么久,谁在闷头做中国的Mythos?
创始人
2026-06-20 21:43:13
0

机器之心发布

Mythos 被禁了。

Anthropic 那个让硅谷集体沉默的模型,美国政府不让卖给中国。X 平台上有人直接问马斯克:中国什么时候能追上?Musk 说九个月。智谱首席科学家唐杰回了一句:用不了那么久。

GLM-5.2 刚发布,评测全面逼近前沿,基座差距在肉眼可见地收窄。唐杰的底气大概率来自于此。但我们更关心另一个问题:追上 Mythos,光靠基座迭代够不够?

不够。OpenAI 从 GPT-4 到 o1,核心增量来自后训练。Anthropic 的 Constitutional AI,本质是后训练方法论。基座决定上限,后训练决定你能摸到上限的多少。事实上,GLM 从 5.1 到 5.2 的能力跨越,本身就是后训练的胜利。

而这恰好引出一个关键事实:恰好两周前,机器之心报道了一家专门做大模型后训练的团队:Mind Lab,隶属于 Mindverse(心洲科技)。从 HuggingFace 的数据来看,他们目前是全球唯一一家完成了 GLM-5.1/5.2 系列后训练的外部团队。 他们基于 GLM-5.1 后训练的模型 Macaron-V1-Preview,评测结果已经超过了基座本身,提分幅度不小。

这意味着什么?如果 GLM 基座能力继续往上走,Mind Lab 在后训练上已经验证过的提分能力再叠加上去,通过后训练路线追平 Mythos 级别的智能,Mind Lab 同样有机会。

但这次看到唐杰那条回帖,我们重新去看了一眼 GLM 的后训练生态。发现的事情挺振奋人心的。

去 HuggingFace 上翻了一圈

从 HuggingFace 上看来,Mind Lab 目前仍然是全球唯一一家,完成了 GLM-5.1/5.2 系列模型后训练的实验室。 GLM-5.1 的 finetune 和 adapter 分类下,翻来翻去就是他们一家做完了全流程并公开发布。

一个有意思的细节:HuggingFace 上 GLM-5.1 后训练模型下载量排第四的,其实是另一个团队(inferencerlabs)对 Macaron 做量化后可以直接运行在 Mac 上版本。别人的模型已经在被二次加工和传播了,生态影响力在自发形成。

GLM-5.2 发布之后我们又去看了,Mind Lab 同样是第一个宣布支持并启动后训练的。值得一提的是,GLM-5.2 引入了一个全新的架构设计 IndexCache,这是该版本区别于 5.1 的核心技术变化之一。Mind Lab 已经完成了对 IndexCache 的完整适配,并将方案直接开源了出来。新基座刚发布,核心新架构的训练支持就已经到位并开源,这个响应速度本身就说明问题。更早之前,他们在技术博客里就披露了对 DSA(动态稀疏注意力)和 MTP(多 token 预测)这些 700B 以上模型特有架构模块的适配方案。

从架构适配到训练框架再到开源发布,每次 GLM 出新版,Mind Lab 跟进的速度都是按天算的,这不是临时抱佛脚能做到的事。

后训练提了多少分

上一轮的成绩单已经摆在那里了。

先前基于 GLM-5.1 的后训练,Mind Lab 的提分幅度相当可观:PinchBench 从 GLM-5.1 基座的 76.6 分提升到 Macaron-V1-Preview 的 92.5 分,涨了 15.9 分,相对提升约 20.8%;Terminal-Bench 2.0 从 63.5 分提升到 67.4 分,涨了 3.9 分。这个幅度说明一件事:GLM 系列的基座能力远没有被充分释放,后训练还有很大的提分空间。

现在他们搬到了 GLM-5.2 上。5.2 比 5.1 基座能力有显著跃升,后训练能释放的空间也跟着变大。

GLM5.1 到 5.2 的跨越,本质上就是后训练的胜利。而 Mind Lab 是目前唯一具备 GLM5.1/5.2 后训练能力的外部团队,而且是目前唯一具备 GLM5 系列后训练能力的外部团队。智谱的基座能力还在持续往上走,年底大概率会发布新一代模型。到那个时候,基座本身的能力跨了一大步,Mind Lab 在后训练上积累的提分能力再叠加上去,逻辑链条是连续的,Mind Lab 同样有机会追平 Mythos 同等水平的智能。

而且有一点容易被忽视:做后训练的团队,迭代周期天然比做基座的短。基座训练动辄几个月,后训练的周期是按周算的。新基座一出来,后训练团队理论上可以比基座团队自己更快地把能力释放出来。在「从智谱新基座到 Mythos 级别产品」这段路上,Mind Lab 的节奏可能比你想象的快,因为他们只押这一件事。

除了智谱自己,只有他们

既然后训练价值这么大,为什么做的人这么少?

门槛不低。三个能力缺一不可:

对基座架构的深度理解。GLM 使用的 MTP 和 DSA 都是在 700B 以上模型才用到的技术,indexcache 更是支持 GLM5.2 训练到 1M 上下文的关键技术,不是拿开源训练框架直接跑得通的。

高质量训练数据的构造能力。后训练和预训练用的数据完全不同,不是规模取胜,而是质量和结构取胜。这部分的 know-how 在行业里高度不透明。

工程基础设施。大模型后训练同样吃算力,同样需要精细到每个超参数的训练策略管理。就在最近,Mind Lab 直接开源了一套支持 GLM-5.1 和 5.2 的 Megatron 训练框架。 这意味着他们不只是在现有框架上做适配,而是从训练基础设施层面把 GLM 系列的后训练链路打通了,而这个工程量本身就是一道很高的门槛。

GLM-5.1 发布到现在不短了,HuggingFace 上做完后训练并开源的只有一家。除了智谱自己以外,Mind Lab 是目前唯一展现出有能力在 GLM 最新基座上做后训练的外部团队。 这个位置本身就是稀缺的。

九个月够不够

Mythos 被禁,中国想用上同等能力只能靠自研。马斯克说九个月。唐杰说用不了那么久。

唐老师表示,做出中国的 Mythos,需要两条腿走路,即基座预训练迭代和后训练模型的自我迭代。智谱在前者的位置很明确,而后者的位置上,Mind Lab 是目前除智谱以外唯一交出公开成果、并且持续在 GLM 最新基座上迭代的团队。

后训练赛道在国内还没有得到足够关注。大部分讨论集中在基座之争:谁的参数多、谁的评测高、谁又发了新版本。但当基座差距逐渐收窄,后训练的质量会越来越成为产品体验的分水岭。

九个月够不够,我们不确定。但有一件事是确定的:在 GLM5.1/5.2 的后训练路线上,目前唯一看得到路径、并且已经用成绩证明过提分能力的外部团队,就是 Mind Lab。Mythos 级的智能不是只有预训练一条路能到,后训练这条路上,Mind Lab 已经站在了最近的位置。

这件事,振奋人心。

相关内容

真金白银!福州九条措施促进...
福州新闻网6月20日讯(记者 颜澜萍)人工智能作为新一轮科技革命的...
2026-06-20 17:08:32
原创 ...
公元649年,李世民躺在终南山的行宫里,已经知道自己快死了。距离他...
2026-06-20 17:07:16
原创 ...
更扎心的是,这不是第一次了——两周前的西班牙阿拉贡站,同样的高温,...
2026-06-20 17:06:51
原创 ...
绍兴十年六月,顺昌城外,金兀术亲率的铁骑把这座小城围了个水泄不通,...
2026-06-20 17:06:50
原创 ...
网上有个说法,说梁山好汉朱仝最后被自己老婆一刀捅死,死得又窝囊又难...
2026-06-20 17:06:49
原创 ...
北宋末年的历史长卷中,宋江起义如一道流星划过天际,虽短暂却留下璀璨...
2026-06-20 17:06:47
原创 ...
胡美,原名廷瑞,为避朱元璋字,改名美,沔阳人。作为明初将领,胡美一...
2026-06-20 17:06:43
原创 ...
一说起姓氏,无非就是赵钱孙李、周吴郑王这些常见的,偶尔能听到一些像...
2026-06-20 17:06:40
原创 ...
古代上朝的时间,真的早得超出现代人的想象。 官员们必须在凌晨三点抵...
2026-06-20 17:06:39

热门资讯

“外交礼节荡然无存”!联合国会... 【环球网报道 记者 姜蔼玲】据路透社报道,当地时间19日,以色列常驻联合国代表丹尼·达农与联合国秘书...
连续六周下跌、美联储放鹰、投机... 打开手机看了一眼今天的金价:国际现货黄金4155美元/盎司。 今年1月底是什么价?5594美元,五个...
马斯克说明年Q1,唐杰说用不了... 机器之心发布 Mythos 被禁了。 Anthropic 那个让硅谷集体沉默的模型,美国政府不让卖...
汤臣倍健拟5000万元投资原粒... 北京商报讯(记者 董亮)6月18日晚间,汤臣倍健(300146)披露公告称,公司拟以自有资金5000...
原创 马... 马斯克这手牌打得太绝了!左手把特斯拉FSD送进中国,右手却把SpaceX的中国投资者全部拉黑。短短半...
原创 人... #曹德旺称不要把竞争理解成内卷 #,近日在福耀科技大学企业家培训营现场,面对一众中小企业主诉苦行业内...
泽宇智能:拟向激励对象191人... 每经AI快讯,泽宇智能(SZ 301179,收盘价:21.51元)6月18日晚间发布公告称,本激励计...
外资机构调研活跃,AI半导体等... Wind数据显示,2026年以来至6月19日,外资机构对A股上市公司调研活动频频,半导体、电子设备等...
山西银行:深化社区金融战略推动... 在金融服务加速回归本源、深度嵌入社会治理体系的新形势下,山西银行作为省属金融企业,始终坚守金融工作的...
金饰克价年内大跌近450元 央视财经记者获悉,6月20日,国际金价继续走弱。截至周五(6月19日)纽约尾盘,现货黄金价格下跌0....