Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源
创始人
2025-06-17 11:21:19
0

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

深夜,沉寂已久的Kimi突然发布了新模型——

开源代码模型 Kimi-Dev,在SWE-bench Verified上以60.4%的成绩 取得开源SOTA

参数量只有72B,但编程水平比最新的DeepSeek-R1还强,和闭源模型比较也表现优异。

有网友看到后表示,感觉月之暗面的实力被低估了,其水平应该比xAI强。

Kimi-Dev采用MIT协议,目前权重和代码均已发布,还有网友制作的量化版本也已在抱抱脸上线。

那么,Kimi-Dev是如何做到的呢?

模型扮演两种角色,在测试中自我博弈

目前,Kimi-Dev的完整技术报告暂未出炉,不过官方透露了其中的一些关键技术。

Kimi-Dev-72B的设计核心是 BugFixer和TestWriter两种角色的结合,BugFixer和TestWriter都遵循一个共同的最小框架,包含两个阶段:

  • 文件定位(File Localization):首先找到需要修改的正确文件;

  • 代码编辑(Code Edits):修正现有代码中的问题或潜在缺陷(BugFixer),以及编写并添加新的单元测试代码(estWriter)。

为了增强Kimi-Dev-72B作为BugFixer和TestWriter的先验知识,Kimi团队以Qwen 2.5-72B基础模型为起点使用约1500亿高质量真实数据进行 中期训练

具体来说,Kimi团队 收集了数百万个GitHub issue和PR提交,目的是让Kimi-Dev-72B能够学习人类开发人员如何推理并解决GitHub问题。

另外,Kimi团队还进行了严格的数据净化,确保训练数据当中不包含SWE-bench Verified里的内容。

经过中期训练和监督微调 (SFT)后,Kimi-Dev-72B在文件定位方面已经表现出色,之后的强化学习阶段主要侧重于提升其代码编辑能力。

强化学习训练采用了Kimi k1.5中的策略优化方法,主要有三个关键设计:

一是 仅基于结果的奖励(Outcome-based Reward Only)——训练中仅使用代码在Docker环境中的最终执行结果(成功为 1,失败为 0)作为奖励,而不考虑任何与代码格式或编写过程的因素。

这确保了模型生成的解决方案的正确性以及与实际开发标准的一致性。

二是采用了 高效提示集(Efficient Prompt Set),过滤掉在多样本评估下成功率为零的提示,以更有效地进行大批量训练。

此外,强化学习阶段还采取了循序渐进的策略,逐步引入新提示,逐步增加任务难度。

三是 正向示例强化(Positive Example Reinforcement),也就是在后面的训练过程中,Kimi-Dev会将它之前已经解决的问题的方案重新纳入当前的训练批次中进行学习,从而巩固和强化之前有效的、成功的解决模式和方法。

经过强化学习后,Kimi-Dev-72B能够同时掌握两种角色。在测试过程中,它会采用自我博弈机制,协调自身Bug修复和测试编写的能力。

Kimi-Dev-72B会遵循标准Agentless设置,为每个问题生成最多40个补丁候选(patch candidates)和40个测试候选(test candidates)。

在测试时间自我博弈中,观察到了规模效应(scaling effect)。

以上就是Kimi团队介绍的Kimi-Dev背后的关键,更多细节将在后续的技术报告中揭晓,感兴趣的话可以关注Kimi团队的发布。

下一步,Kimi团队还计划探索更复杂的软件工程任务,并将于与流行的IDE、版本控制系统和CI/CD流水线进行更深入的集成。

项目主页:

https://moonshotai.github.io/Kimi-Dev/

GitHub:

https://github.com/MoonshotAI/Kimi-Dev

HuggingFace:

https://huggingface.co/moonshotai/Kimi-Dev-72B

📪 量子位AI主题策划正在征集中!欢迎参与专题365行AI落地方案,一千零一个AI应用或与我们分享你在寻找的AI产品,或发现的AI新动向

💬 也欢迎你加入量子位每日AI交流群,一起来畅聊AI吧~

相关内容

中国女团五将晋级!2025...
2026年1月15日,2025-2026赛季国际雪联跳台滑雪女子世...
2026-01-15 23:26:20
聂卫平:长子孔令文入日籍,...
2026年1月14日,“棋圣”聂卫平辞世,享年74岁。随着他的离世...
2026-01-15 23:25:50
“棋圣”聂卫平病逝,曾以擂...
2026年1月14日22时55分,中国围棋协会名誉主席、“棋圣”聂...
2026-01-15 23:25:47
奥迪Revolut F1 ...
奥迪Revolut F1车队与吉列达成多年战略合作伙伴关系,吉列正...
2026-01-15 23:25:25
原创 ...
1月15号,真是糟糕的一天,凌晨,鲜衣怒马女干部贺娇龙抢救无效去世...
2026-01-15 23:25:07
原创 ...
CBA常规赛第15轮,广东男篮坐镇主场,以73-113惨败给了上海...
2026-01-15 23:02:01
清代榜眼邓启元
闽中山水毓灵秀,德化瓷光映古今。在这片“中国白”的故乡,清代雍正年...
2026-01-15 23:01:39
为何韩信是兵仙而霍去病不是...
中国历史上有许多英杰,后世之人往往熟悉诗仙李白、诗圣杜甫等,但对于...
2026-01-15 23:01:28

热门资讯

原创 棋... “棋圣”聂卫平走了,享年73岁。 这位在棋盘上战无不胜的传奇,人生却远比围棋复杂。 他曾三度结婚,三...
原创 聂... 2026年1月,中国围棋界的巨星聂卫平走了。消息像一枚重重的落子,压在棋迷心头。他的面容平静,像刚刚...
原创 棋... 2026年1月14日,夜幕低垂,北京城即将迈入子夜的钟声,一代围棋巨匠聂卫平的人生旅程却已悄然落下帷...
龚义霞追忆聂卫平:他们一家人都... (来源:新安晚报) 转自:新安晚报 聂卫平与安徽一直有着很深的渊源。更值得一提的是,“棋圣”聂卫平一...
原创 聂... 1月15日,聂卫平女儿聂云菲发布讣告。 讣告中透露,2025年3月,聂卫平因突发脑梗昏迷12天,苏醒...
原创 棋... 1月14日晚,一条消息悄然传开:“棋圣”聂卫平在北京病逝,享年74岁。没有喧嚣的热搜,没有铺天盖地的...
原创 棋... 那个借来的“中国”5年8月27日,聂卫平走向对战小林光一的棋枰前,做了一件小事:他特意去乒乓球队借了...
原创 体... 2026年1月14日22点55分,聂卫平闭上了眼睛。 女儿聂云菲在社交平台上写下一句诘问:“明明已经...
原创 聂... 1985年,中日围棋擂台赛,聂卫平一人连胜五位日本超一流棋手,把中国队从悬崖边拉回巅峰。那一刻,他不...
原创 不... 聂卫平,这位定义了一个时代的围棋巨匠,他的七十四载人生,远比许多百岁老者更加厚重。如果说对寻常老人而...