一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?
创始人
2025-11-19 16:19:17
0

出品|搜狐科技

作者|郑松毅

千呼万唤下,Gemini 3来了!

北京时间11月19日,Google正式发布最新一代人工智能模型Gemini 3。这款被CEO桑达尔·皮查伊称为“最智能模型”的产品,早在10月就已在业内掀起波澜,如今终于揭开面纱。

相较于早期试探性的“小步快跑”,Gemini 3的发布是一次做足准备的全面展示。Gemini团队介绍,“它不仅是全球领先的多模态理解模型,更是迄今为止最强大的智能体(Agentic)和氛围编程(Vibe Coding)模型——而这一切都构建在最先进的推力能力之上。”

看过Gemini 3评测表现的网友纷纷表示,“终于理解了为什么Google会成为股神巴菲特的‘最后一舞’。”

不给对手机会,碾压式领先重夺王位

刚一发布,Gemini 3几乎霸榜所有评测集,以1501分的成绩重夺LMArena大模型竞技场第一,反超昨日马斯克xAI才发布的Grok 4.1模型。

从测试结果不难看出,凭借领先的推理能力和强大的多模态功能,Gemini 3 Pro的性能均显著超越前一代版本模型Gemini 2.5 Pro,且对OpenAI最新模型GPT-5.1呈“碾压”式领先。

其中,在“人类终极考试”中,Gemini 3 Pro在未使用任何工具的情况下得分率达 37.5%。在GPQA Diamond 基准测试中,Gemini 3 Pro准确率高达91.9%。在“地狱模式”数学测试MathArena Apex中,以23.4% 达到了最先进水平,在数学领域为前沿模型树立了全新标杆。

除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩,在 Video-MMMU 上达到 87.6%。同时,该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分,展现出其在事实准确性方面的显著进步。这意味着 Gemini 3 Pro已具备能够有效解决跨越科学和数学等广泛主题的复杂问题。

在AI界的图灵测试“ARC-AGI-2”中,Gemini 3 Pro拿下31.1%的高分,远超于GPT-5.1的17.6%。这意味着AI开始展现出一种近乎于人类的智力和思维方式,能够在从未见过的任务模式下进行推理,而非凭借死记硬背。

OpenAI联合创始人、CEO山姆·奥特曼和xAI创始人、CEO埃隆·马斯克纷纷点赞Google最新模型。奥特曼发推评价“Gemini 3看起来很不错”,马斯克表示“干得很好”。

即日起,Gemini全面融入谷歌的产品生态,这也是Google首次在产品发布当日就将Gemini 引入搜索。此外,Gemini 3今天也同步向 Gemini app 用户、AI Studio 和 Vertex AI 的开发者、以及全新的智能体开发平台 Google Antigravity 中同步推出。

从这足以看出一个平台级的野心——用AI定义整个Google生态的每个支点。

本次Gemini 3 Pro的深度思考版本模型尚未全面开放,但从测试表现上可以获知它的Benchmark水平比Gemini 3 Pro高了一个数量级。Google表示,将在未来几周向Google AI Ultra订阅者开放,目前还在安全评估。

对于Gemini 3的发布,皮查伊有信心地认为,“这是一款能将用户任何想法变成现实的模型。”

知识学习、运动教练、游戏开发样样通

透过测试成绩,再来看看Gemini 3具体能做些什么。

Gemini 3可以编写代码来可视化托卡马克中的等离子体流动,并能创作一首诗来捕捉聚变的物理原理。

如果有用户想学习家族传统菜肴,Gemini 3可以解读并翻译不同语言的手写食谱,生成可与家人分享的食谱。

如果用户想学习一个新领域知识,可以把学术论文、讲座视频等素材一并喂给Gemini 3,它可以生成交互式记忆卡片、可视化或其他格式的代码,以帮助掌握相关知识。

Gemini 3甚至还可以充当教练角色,观看打球运动视频以指出可以改进的地方,并生成训练计划。

搜索模式下,现在使用 Gemini 3 可以实现新的生成式 UI 体验,例如沉浸式视觉布局、交互式工具和模拟,所有这些都是根据查询即时生成的。

此外,Gemini 3还能够编写拥有丰富可视化界面和互动性的3D飞船游戏、可玩的科幻世界、更具实用性的网页等。

在极客论坛,一众前端开发者感叹,“Gemini 3不仅能高效写代码,还能够理解审美,动画效果恰到好处,确实令人生畏。”

全新智能体开发平台亮相,新一轮竞争打响

2025 年 AI 行业“模型即智能体”热潮席卷全球,将大模型从被动的 "预测引擎" 升级为主动的 "行动实体",赋予模型自主决策和执行能力。

然而,尽管玩家扎堆入局,to C 智能体产品却普遍面临“叫好不叫座”的困境,鲜有产品能实现可靠好用的用户体验,其背后考验的是基础模型推理、工具运用与任务规划的综合硬实力。

Gemini 3可以说率先完成了突破,成了第一个在模型界面完成融入通用Agent能力,并且支持执行多种复杂任务的产品。

Gemini团队介绍,“Gemini 3的工具使用能力相比2.5 Pro提升了30%,不仅意味着它能更准确地选择正确工具使用,更重要的是,它能理解什么时候需要不同工具组合来完成复杂任务。”

本次发布中,Google还带来了全新Agent开发平台——Google Antigravity。

借助Gemini 3的高级推理能力、工具使用和智能编码能力,Google Antigravity将 AI 辅助从开发者工具包中的工具转变为一个活跃的伙伴。

尽管 Google Antigravity 的核心仍沿用熟悉的 AI 集成开发环境(IDE),但其智能体已被提升到一个专属的界面,并被赋予直接访问编辑器、终端和浏览器的权限。现在,智能体能够代表开发者自主规划和执行复杂的端到端软件任务,并在此过程中自行验证代码。

结尾谷歌提到,Gemini 3 是迄今为止最安全的模型,并且接受了 Google AI 模型中最全面的一套安全评估。该模型展现了更低的谄媚性,更高的抗提示注入能力,并强化了抵御网络攻击滥用的保护措施。

Gemini 3的胜利还有一点是值得一提的:训练完全基于自家TPU,当全世界的 AI 公司都在苦苦等待英伟达 GPU 发货时,Gemini有着肆意扩张参数的底气。

随着Gemini 3加入模型“角斗场”,Google向世界宣告王者归来,也让AI真实地朝着人们期待的方向迈出显著一步。显然,围绕大模型的新一轮竞争已全面打响。

相关内容

全省唯一 | 漳州这个村,...
近日,联合国粮农组织正式公布“乡村认定倡议”示范村入选名单,华安县...
2026-06-12 15:13:55
借力专家智囊 深挖文脉底蕴...
中国早报湖南讯(记者 伍振兴 刘雄)为进一步盘活本土文旅资源,深挖...
2026-06-12 15:13:15
无视禁令!两游客非法穿越九...
6月8日,游客罗某某、幸某某二人无视相关禁令,从松潘县川主寺镇徒步...
2026-06-12 15:12:37
原创 ...
很多人来北京,直奔故宫长城天安门,拍几张照就走,转头说北京“没啥意...
2026-06-12 15:12:15
带父母去西藏,我选了一家“...
带父母去西藏,我选了一家“敢把底线写进合同”的旅行社 一、决定带爸...
2026-06-12 15:12:00
水上漂浮乐园改造
这是(LeTty_616)整理的信息,希望能帮助到大家 水上漂浮...
2026-06-12 15:11:26
成都望丛祠荷花绽放迎客来
6月11日,四川省成都市望丛祠景区池塘里的荷花盛开,吸引不少游客前...
2026-06-12 15:10:31
扒一扒,这座躺在风口上的城...
1 早些年,苏州就在押注硅基产业。 今年,苏州牢牢卡住AI算力硬件...
2026-06-12 15:08:48

热门资讯

苏农银行:每股派发现金红利0.... 6月12日,苏农银行发布2025年度权益分派实施公告,该行本次权益分派以实施前总股本为基数,每股派发...
B2B外贸营销从官网到获客怎么... 官网上线之后, 很多企业做B2B外贸营销时,最容易出现的误判,是把官网当成项目终点。网站做完、页面...
刚刚,人类历史上首位万亿美元富... 当地时间12日上午,美国太空探索技术公司(SpaceX)在纳斯达克证券交易所开始交易。身在纽约的Sp...
SpaceX总裁暗示可能与特斯... 6月12日消息,据BI报道,关于特斯拉与SpaceX合并的传闻越来越多。 在周五播出的 CNBC 采...
“在上海,处理闲置奢侈品黄金前... 开篇导语 在上海,闲置奢侈品黄金的处理成为许多人关注的问题。面对市场上众多的回收渠道和复杂情况,一...
走进欧莱雅全球产能最大的苏州工... 6月11日,欧莱雅中国在苏州举办以“三十而励,制造美好”为主题的苏州工厂30周年活动。活动现场,欧莱...
SpaceX上市,市值1.8万... 雷递网 雷建平 6月12日 特斯拉CEO马斯克旗下太空探索公司SpaceX(股票代码:SPCX )今...
贝壳“诚意卖”:二手房交易新模... 如果你卖掉一套房子,需要多长时间? 这个问题的答案并不确定。二手房交易本身是一个漫长且充满变数的过程...
别急着抢筹!SpaceX上市首... 今晚,SpaceX(SPCX)正式挂牌。 1.75万亿美元估值,史上最大IPO。 按照SpaceX1...
胜宏科技拟增加不超180亿元进... 北京商报讯(记者 马换换 李佳雪)6月12日晚间,胜宏科技(300476)披露公告称,为充分利用公司...