一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?
创始人
2025-11-19 16:19:17
0

出品|搜狐科技

作者|郑松毅

千呼万唤下,Gemini 3来了!

北京时间11月19日,Google正式发布最新一代人工智能模型Gemini 3。这款被CEO桑达尔·皮查伊称为“最智能模型”的产品,早在10月就已在业内掀起波澜,如今终于揭开面纱。

相较于早期试探性的“小步快跑”,Gemini 3的发布是一次做足准备的全面展示。Gemini团队介绍,“它不仅是全球领先的多模态理解模型,更是迄今为止最强大的智能体(Agentic)和氛围编程(Vibe Coding)模型——而这一切都构建在最先进的推力能力之上。”

看过Gemini 3评测表现的网友纷纷表示,“终于理解了为什么Google会成为股神巴菲特的‘最后一舞’。”

不给对手机会,碾压式领先重夺王位

刚一发布,Gemini 3几乎霸榜所有评测集,以1501分的成绩重夺LMArena大模型竞技场第一,反超昨日马斯克xAI才发布的Grok 4.1模型。

从测试结果不难看出,凭借领先的推理能力和强大的多模态功能,Gemini 3 Pro的性能均显著超越前一代版本模型Gemini 2.5 Pro,且对OpenAI最新模型GPT-5.1呈“碾压”式领先。

其中,在“人类终极考试”中,Gemini 3 Pro在未使用任何工具的情况下得分率达 37.5%。在GPQA Diamond 基准测试中,Gemini 3 Pro准确率高达91.9%。在“地狱模式”数学测试MathArena Apex中,以23.4% 达到了最先进水平,在数学领域为前沿模型树立了全新标杆。

除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩,在 Video-MMMU 上达到 87.6%。同时,该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分,展现出其在事实准确性方面的显著进步。这意味着 Gemini 3 Pro已具备能够有效解决跨越科学和数学等广泛主题的复杂问题。

在AI界的图灵测试“ARC-AGI-2”中,Gemini 3 Pro拿下31.1%的高分,远超于GPT-5.1的17.6%。这意味着AI开始展现出一种近乎于人类的智力和思维方式,能够在从未见过的任务模式下进行推理,而非凭借死记硬背。

OpenAI联合创始人、CEO山姆·奥特曼和xAI创始人、CEO埃隆·马斯克纷纷点赞Google最新模型。奥特曼发推评价“Gemini 3看起来很不错”,马斯克表示“干得很好”。

即日起,Gemini全面融入谷歌的产品生态,这也是Google首次在产品发布当日就将Gemini 引入搜索。此外,Gemini 3今天也同步向 Gemini app 用户、AI Studio 和 Vertex AI 的开发者、以及全新的智能体开发平台 Google Antigravity 中同步推出。

从这足以看出一个平台级的野心——用AI定义整个Google生态的每个支点。

本次Gemini 3 Pro的深度思考版本模型尚未全面开放,但从测试表现上可以获知它的Benchmark水平比Gemini 3 Pro高了一个数量级。Google表示,将在未来几周向Google AI Ultra订阅者开放,目前还在安全评估。

对于Gemini 3的发布,皮查伊有信心地认为,“这是一款能将用户任何想法变成现实的模型。”

知识学习、运动教练、游戏开发样样通

透过测试成绩,再来看看Gemini 3具体能做些什么。

Gemini 3可以编写代码来可视化托卡马克中的等离子体流动,并能创作一首诗来捕捉聚变的物理原理。

如果有用户想学习家族传统菜肴,Gemini 3可以解读并翻译不同语言的手写食谱,生成可与家人分享的食谱。

如果用户想学习一个新领域知识,可以把学术论文、讲座视频等素材一并喂给Gemini 3,它可以生成交互式记忆卡片、可视化或其他格式的代码,以帮助掌握相关知识。

Gemini 3甚至还可以充当教练角色,观看打球运动视频以指出可以改进的地方,并生成训练计划。

搜索模式下,现在使用 Gemini 3 可以实现新的生成式 UI 体验,例如沉浸式视觉布局、交互式工具和模拟,所有这些都是根据查询即时生成的。

此外,Gemini 3还能够编写拥有丰富可视化界面和互动性的3D飞船游戏、可玩的科幻世界、更具实用性的网页等。

在极客论坛,一众前端开发者感叹,“Gemini 3不仅能高效写代码,还能够理解审美,动画效果恰到好处,确实令人生畏。”

全新智能体开发平台亮相,新一轮竞争打响

2025 年 AI 行业“模型即智能体”热潮席卷全球,将大模型从被动的 "预测引擎" 升级为主动的 "行动实体",赋予模型自主决策和执行能力。

然而,尽管玩家扎堆入局,to C 智能体产品却普遍面临“叫好不叫座”的困境,鲜有产品能实现可靠好用的用户体验,其背后考验的是基础模型推理、工具运用与任务规划的综合硬实力。

Gemini 3可以说率先完成了突破,成了第一个在模型界面完成融入通用Agent能力,并且支持执行多种复杂任务的产品。

Gemini团队介绍,“Gemini 3的工具使用能力相比2.5 Pro提升了30%,不仅意味着它能更准确地选择正确工具使用,更重要的是,它能理解什么时候需要不同工具组合来完成复杂任务。”

本次发布中,Google还带来了全新Agent开发平台——Google Antigravity。

借助Gemini 3的高级推理能力、工具使用和智能编码能力,Google Antigravity将 AI 辅助从开发者工具包中的工具转变为一个活跃的伙伴。

尽管 Google Antigravity 的核心仍沿用熟悉的 AI 集成开发环境(IDE),但其智能体已被提升到一个专属的界面,并被赋予直接访问编辑器、终端和浏览器的权限。现在,智能体能够代表开发者自主规划和执行复杂的端到端软件任务,并在此过程中自行验证代码。

结尾谷歌提到,Gemini 3 是迄今为止最安全的模型,并且接受了 Google AI 模型中最全面的一套安全评估。该模型展现了更低的谄媚性,更高的抗提示注入能力,并强化了抵御网络攻击滥用的保护措施。

Gemini 3的胜利还有一点是值得一提的:训练完全基于自家TPU,当全世界的 AI 公司都在苦苦等待英伟达 GPU 发货时,Gemini有着肆意扩张参数的底气。

随着Gemini 3加入模型“角斗场”,Google向世界宣告王者归来,也让AI真实地朝着人们期待的方向迈出显著一步。显然,围绕大模型的新一轮竞争已全面打响。

相关内容

伊朗武装部队发言人:唯有伊...
伊朗武装部队发言人27日表示,只有伊朗才有权为结束战争设定条件,美...
2026-03-28 10:40:12
福建学校安全管理新规9月施...
  福建学校安全管理新规9月施行,涵盖心理健康、人车分流、周边整治...
2026-03-28 10:40:07
原创 ...
李建成的陵墓揭示了他与李世民之间复杂而微妙的兄弟关系 皇宫内的争权...
2026-03-28 10:12:03
原创 ...
受许多文艺作品和影视剧的影响,许多人对中国古代的总管一职,第一印象...
2026-03-28 10:11:29
若马超不死,诸葛亮的北伐能...
事实上,马超的能力一直被严重低估。如果他没有英年早逝,诸葛亮的北伐...
2026-03-28 10:10:59
原创 ...
鲁母侯疵 众所周知,西汉王朝是由汉高祖刘邦创立的。据史料记载,...
2026-03-28 10:10:21
视频丨“村游”玩法新升级 ...
眼下,江西上饶市婺源县的13万亩油菜花迎来最佳观赏期。作为传统的油...
2026-03-28 10:09:15
原创 ...
天命玄鸟,姜儿生商。这只神鸟的后代几经沉浮,几度臣服,从历史的长河...
2026-03-28 10:08:47
北京历史上的百龄植树碑
来源:滚动播报 (来源:千龙网) 阳春三月,植树节之际,寻访北京地...
2026-03-28 10:08:02

热门资讯

麻醉药代谢有期限,术后何时重归... 当患者躺在手术台上,随着麻醉药物缓缓注入,意识逐渐模糊,最终进入无梦的睡眠状态——这一过程看似简单,...
新品上新这么卷,AI真的能帮助... 到了2026年,如何用AI提效,已经成为整个商业世界都不能回避的话题。不过,相对于技术层面的不断突破...
东土科技:终止筹划重大资产重组... 人民财讯3月27日电,东土科技(300353)3月27日公告终止筹划重大资产重组事项。 此前,公司拟...
俄罗斯突然宣布:4月1日起将禁... 来源:第一财经 2026.03.28 本文字数:535,阅读时长大约1分钟 俄罗斯政府表示,俄副总...
原创 金... 最近黄金市场又在闹腾,不少人盯着价格曲线直犯嘀咕,2026年才刚过去三个月,波动就这么大,会不会4月...
3月28日分析:比特币、以太坊... 要珍惜熊市,没有熊市哪来那么多低价筹码,没有熊市也赚不到大钱,熊市还是锻炼心态的好机会。越跌你应该越...
和邦生物:和邦集团累计质押的股... 每经AI快讯,和邦生物(SH 603077,收盘价:2.86元)3月27日晚间发布公告称,四川和邦生...
原创 伊... 最近,中东那边的火药味又浓了起来。就在3月27日,伊朗一位高级安全官员放出话来:如果美国敢在中东地面...
被亚朵们挤压,本土老大锦江酒店... 酒店业“巨无霸”朝港股IPO发起冲刺。 图源:pixabay 3月27日,国内酒店数量规模最大的连...
重资产、慢生意、系统战:中国式... 当中国制造从“产品输出”升级为“产业输出”,京东的欧洲模式为中国品牌出海搭建了一套覆盖物流、基建、工...