阿里发布Qwen3-Coder:4800亿参数,实现开源代码模型新SOTA
创始人
2025-07-24 01:18:06
0

今天,阿里全新开源代码模型 Qwen3-Coder 正式发布。

(来源:X)

Qwen3-Coder 拥有多个尺寸,此次发布的是最强大的版本,名为 Qwen3-Coder-480B-A35B-Instruct(以下简称 Qwen3-Coder)。

它是一款混合专家(MoE)模型,总参数量高达 4,800 亿,激活参数为 350 亿,原生支持 256K token 的上下文,并可通过 YaRN 扩展到高达 1 百万 token,支持 358 种编程语言。

图 | Qwen3-Coder 在测试中的表现(来源:资料图)

由于 Qwen3 系列模型的整体调整,Qwen3-Coder 仅支持非思考模式,不生成思考过程。

在注意力机制方面,Qwen3-Coder 采用了分组查询注意力(GQA)方案,配备 96 个查询(Q)注意力头和 8 个键/值(KV)注意力头,并拥有 160 个专家(Expert),其中 8 个专家被激活。

图 | Qwen3-Coder 模型总览(来源:Qwen)

据介绍,预训练阶段,Qwen3-Coder 从数据、上下文、合成数据三个不同角度进行扩展(scaling),以提升模型的代码能力。

在后训练阶段,研究团队选择在更丰富的真实代码任务上扩展代码强化学习(Code RL)训练。通过自动扩展测试样例,他们构造了大量高质量的训练实例,成功释放了强化学习的潜力:不仅显著提升了代码执行成功率,还对其他任务带来增益。

此前网友挖出线索,阿里团队在代码中介绍 Qwen3-Coder 时写道:“Qwen3-Coder-480B-A35B-Instruct 是一个强大的编码专用语言模型,在代码生成、工具使用和代理任务方面表现出色。”

图 | 网友先前挖出 Qwen3-Coder 的线索(来源:X)

阿里表示,该模型“拥有卓越的代码和代理能力”。Qwen3-Coder 在代理式编码、代理式浏览器使用和代理式工具使用上成为了开源模型的 SOTA,可以媲美 Claude Sonnet 4。

Qwen3-Coder 也是受到了网友的大力追捧,代码库上线一小时就收获了 5.1k Star。

图 | 代码库是 https://github.com/QwenLM/Qwen3-Coder(来源:GitHub)

与此同时,阿里还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。

“Qwen Code 基于 Gemini Code 进行二次开发,但我们进行了提示词和工具调用协议适配,使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在代理式编程任务上的表现。”阿里在官网上表示。

(来源:资料图)

另外,Qwen3-Coder 也可以和 AI 社区优秀的编程工具结合使用,如 Claude Code、Cline 等。开发者也可以通过阿里云 Model Studio 调用 Qwen3-Coder API。

目前,Qwen3-Coder 网页版已经上线,笔者第一时间尝试了它的编程水平。

(来源:https://chat.qwen.ai/)

在只提供一句“克隆推特网页设计和UI”提示的情况下,Qwen3-Coder 给出的结果还是不错的:

图 | Qwen3-Coder 生成的仿推特 UI(来源:资料图)

相比之下,ChatGPT(免费版)给出的结果则是有些简陋,虽然文本和几个功能区域都有,但几乎没有视觉元素:

图 | ChatGPT 生成的仿推特 UI(来源:资料图)

笔者还让 Qwen3-Coder 做了一个简单的网页版乒乓球游戏,同样只是一句话提示:“开发一个可以在网站上运行的乒乓球游戏”。

代码生成后直接在 Artifact 上无缝运行,整个过程不到 20 秒,效果很惊艳,直接用键盘就能控制,支持两人对战,它还自主发挥加上了获胜规则:

而 ChatGPT 生成的虽然也能运行,但无论是美观还是完整性,都远不及 Qwen3-Coder:

图 | ChatGPT 生成的乒乓球游戏截图(来源:资料图)

最后是官方给出的两段代码运行效果,分别是地球 3D 模拟和 Flappy Bird 游戏:

此次发布的 Qwen3-Coder 属于阿里 Qwen3 系列。

三个月前,阿里发布了千问 3(Qwen3)系列模型,包括两款混合专家 MoE 模型、六款密集模型和若干模型变种,例如后训练、FP8 版本等等。

其中的旗舰模型 Qwen3-235B-A22B,总参数量高达 2,350 亿(235B),其中激活参数为 220 亿(A22B),分布在 94 个深层网络层中。

另外一个 MoE 模型 Qwen3-30B-A3B,尺寸较小,总参数量 300 亿,激活参数量 30 亿。

图 | 3 个月前发布的 Qwen3,到现在已经多次迭代(来源:Qwen3)

当时,Qwen3 系列引入了一种混合方法来解决问题,一个模型同时支持思考模式和非思考模式。但现在这种模式已经被取消。

就在 Qwen3-Coder 发布的前一天,阿里同样更新了 Qwen3 系列,新模型名为 Qwen3-235B-A22B-Instruct-2507(简称 Qwen3-2507),迭代速度令人惊喜。

阿里在官网表示,“经过与社区沟通和深思熟虑后,我们决定停止使用混合思维模式。取而代之的是,我们将分别训练 Instruct 和 Thinking 模型,以获得最佳质量。所以我们发布了 Qwen3-235B-A22B-Instruct-2507 及其 FP8 版本,供大家使用。”

图 | Qwen3-2507 与其他模型在多项基准测试成绩上的对比(来源:资料图)

Qwen3-2507 在主流基准测试中表现优异。作为一款“没有思考能力”的开源模型,它在 GPQA、AIME25 和 LiveCodeBench v6 等测试中均超越了未开启思考模式的 Claude Opus 4。

可以说,无论是Qwen3-Coder 还是 Qwen3-2507,再加上 DeepSeek 和 Kimi,都是 AI 开源社区宝贵的财富。

在闭源模型各种刷榜的今天,它们难得的推动了大模型技术的普及化,为AI 社区开发者和研究人员提供了强大的免费工具。更重要的是,它们的广受欢迎让中国在全球 AI 开源领域占据了重要一席。

图 | Reddit 网友热议:目前全球最好的开源模型都来自中国(来源:资料图)

这不仅能促进 AI 技术的普惠发展,还能有效降低创新门槛,让更多开发者参与进来,共同构建一个更加开放和繁荣的 AI 生态系统。

反过来,这些模型未来在产业应用、学术研究和人才培养等方面都将发挥不可估量的作用,进一步加速中国在 AI 领域的进步。

参考资料:

https://qwenlm.github.io/blog/qwen3-coder/

https://qwenlm.github.io/blog/qwen3/

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

https://arxiv.org/pdf/2505.09388

相关内容

原创 ...
在中国漫长的封建帝王史上,明孝宗朱佑樘(1470-1505)堪称一...
2025-09-12 19:35:51
原创 ...
《三国演义》中的吕布,通常被赋予三个显赫的标签:赤兔马、方天画戟和...
2025-09-12 19:35:37
原创 ...
韩国,这个充满自信的国家,总是乐于展示自己的强大和成就。我们常常说...
2025-09-12 19:35:05
吉利力挺长城!常压油箱门3...
2025中国汽车重庆论坛,吉利控股高级副总裁杨学良再次提到「常压油...
2025-09-12 19:35:05
晶泰科技入股普林迈德医工交...
企查查APP显示,近日,北京普林迈德医工交叉实验室有限公司发生工商...
2025-09-12 19:34:32
历史的褶皱与美育的脉搏
四方连续图案骨式(纸本) 35×25厘米 20世纪70年代 张朗 ...
2025-09-12 19:33:40
从眉山到世界 专家学者解码...
潘殊闲教授做《苏洵与巴蜀文化》主题发言 封面新闻记者 王越欣 李庆...
2025-09-12 19:33:23
原创 ...
在1592年,丰臣秀吉凭借其雄心壮志,率领精锐的日本军队深入朝鲜。...
2025-09-12 19:33:03
原创 ...
日本的军国主义,犹如一个潘多拉魔盒。一旦复辟,那么影响力是巨大的,...
2025-09-12 19:32:32

热门资讯

罗永浩:今晚8点半将直播谈西贝... 罗永浩宣布今天晚上8:30,会在三个平台(微博,抖音,B站)上同时直播谈谈西贝一事。他表示诉求并不是...
黄金成全球央行储备资产,金价再... 9月12日,COMEX黄金期货价格盘中直线拉升,目前交投于3695美元附近,黄金相关产品纷纷异动,截...
马斯克AI预言:明年超越个人,... 近日,特斯拉 CEO 马斯克做客播客《All-In》,再次提出轰动性言论。马斯克表示,在短短五年内,...
我国政府负债率处于合理区间,风... 财政部部长蓝佛安9月12日在国新办举行的“高质量完成‘十四五’规划”系列主题新闻发布会上介绍,截至2...
西贝全国门店上线“罗永浩菜单” 连日来,“罗永浩吐槽西贝预制菜”事件持续发酵。9月11日,西贝餐饮创始人、CEO贾国龙针对此事回应媒...
服贸会:智慧医疗展新篇 现存相... 2025年中国服贸会智慧医疗展区亮点频现,集中展示行业前沿技术与应用方案,成为展会焦点之一。 展区内...
罗永浩预告直播谈与西贝争议:诉... 9月12日下午消息,罗永浩发微博称,今天晚上8:30,会在三个平台(微博,抖音,B站,帐号名都叫“罗...
狮桥融资租赁获建信信托增资20... 近日,狮桥融资租赁获得母公司建信信托20亿元增资,这是继2021年后又一次重大资本补充。根据银行间市...
武汉金控集团江城基金品牌旗下湖... 企业与市场网讯:9月10日,武汉金控集团江城基金品牌旗下湖北基金公司首期科技创新公司债券于资本市场成...
浦发银行信用卡保障金融权益,助... 2025年9月金融监管总局联合中国人民银行、中国证监会联合开展金融教育宣传周活动,本次金融教育宣传周...