一文看懂谷歌最新模型Gemini 3:不靠英伟达,发布即屠榜,马斯克、奥特曼夸赞;看谷歌为何会成股神巴菲特的“最后一舞”?
创始人
2025-11-19 16:19:17
0

出品|搜狐科技

作者|郑松毅

千呼万唤下,Gemini 3来了!

北京时间11月19日,Google正式发布最新一代人工智能模型Gemini 3。这款被CEO桑达尔·皮查伊称为“最智能模型”的产品,早在10月就已在业内掀起波澜,如今终于揭开面纱。

相较于早期试探性的“小步快跑”,Gemini 3的发布是一次做足准备的全面展示。Gemini团队介绍,“它不仅是全球领先的多模态理解模型,更是迄今为止最强大的智能体(Agentic)和氛围编程(Vibe Coding)模型——而这一切都构建在最先进的推力能力之上。”

看过Gemini 3评测表现的网友纷纷表示,“终于理解了为什么Google会成为股神巴菲特的‘最后一舞’。”

不给对手机会,碾压式领先重夺王位

刚一发布,Gemini 3几乎霸榜所有评测集,以1501分的成绩重夺LMArena大模型竞技场第一,反超昨日马斯克xAI才发布的Grok 4.1模型。

从测试结果不难看出,凭借领先的推理能力和强大的多模态功能,Gemini 3 Pro的性能均显著超越前一代版本模型Gemini 2.5 Pro,且对OpenAI最新模型GPT-5.1呈“碾压”式领先。

其中,在“人类终极考试”中,Gemini 3 Pro在未使用任何工具的情况下得分率达 37.5%。在GPQA Diamond 基准测试中,Gemini 3 Pro准确率高达91.9%。在“地狱模式”数学测试MathArena Apex中,以23.4% 达到了最先进水平,在数学领域为前沿模型树立了全新标杆。

除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩,在 Video-MMMU 上达到 87.6%。同时,该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分,展现出其在事实准确性方面的显著进步。这意味着 Gemini 3 Pro已具备能够有效解决跨越科学和数学等广泛主题的复杂问题。

在AI界的图灵测试“ARC-AGI-2”中,Gemini 3 Pro拿下31.1%的高分,远超于GPT-5.1的17.6%。这意味着AI开始展现出一种近乎于人类的智力和思维方式,能够在从未见过的任务模式下进行推理,而非凭借死记硬背。

OpenAI联合创始人、CEO山姆·奥特曼和xAI创始人、CEO埃隆·马斯克纷纷点赞Google最新模型。奥特曼发推评价“Gemini 3看起来很不错”,马斯克表示“干得很好”。

即日起,Gemini全面融入谷歌的产品生态,这也是Google首次在产品发布当日就将Gemini 引入搜索。此外,Gemini 3今天也同步向 Gemini app 用户、AI Studio 和 Vertex AI 的开发者、以及全新的智能体开发平台 Google Antigravity 中同步推出。

从这足以看出一个平台级的野心——用AI定义整个Google生态的每个支点。

本次Gemini 3 Pro的深度思考版本模型尚未全面开放,但从测试表现上可以获知它的Benchmark水平比Gemini 3 Pro高了一个数量级。Google表示,将在未来几周向Google AI Ultra订阅者开放,目前还在安全评估。

对于Gemini 3的发布,皮查伊有信心地认为,“这是一款能将用户任何想法变成现实的模型。”

知识学习、运动教练、游戏开发样样通

透过测试成绩,再来看看Gemini 3具体能做些什么。

Gemini 3可以编写代码来可视化托卡马克中的等离子体流动,并能创作一首诗来捕捉聚变的物理原理。

如果有用户想学习家族传统菜肴,Gemini 3可以解读并翻译不同语言的手写食谱,生成可与家人分享的食谱。

如果用户想学习一个新领域知识,可以把学术论文、讲座视频等素材一并喂给Gemini 3,它可以生成交互式记忆卡片、可视化或其他格式的代码,以帮助掌握相关知识。

Gemini 3甚至还可以充当教练角色,观看打球运动视频以指出可以改进的地方,并生成训练计划。

搜索模式下,现在使用 Gemini 3 可以实现新的生成式 UI 体验,例如沉浸式视觉布局、交互式工具和模拟,所有这些都是根据查询即时生成的。

此外,Gemini 3还能够编写拥有丰富可视化界面和互动性的3D飞船游戏、可玩的科幻世界、更具实用性的网页等。

在极客论坛,一众前端开发者感叹,“Gemini 3不仅能高效写代码,还能够理解审美,动画效果恰到好处,确实令人生畏。”

全新智能体开发平台亮相,新一轮竞争打响

2025 年 AI 行业“模型即智能体”热潮席卷全球,将大模型从被动的 "预测引擎" 升级为主动的 "行动实体",赋予模型自主决策和执行能力。

然而,尽管玩家扎堆入局,to C 智能体产品却普遍面临“叫好不叫座”的困境,鲜有产品能实现可靠好用的用户体验,其背后考验的是基础模型推理、工具运用与任务规划的综合硬实力。

Gemini 3可以说率先完成了突破,成了第一个在模型界面完成融入通用Agent能力,并且支持执行多种复杂任务的产品。

Gemini团队介绍,“Gemini 3的工具使用能力相比2.5 Pro提升了30%,不仅意味着它能更准确地选择正确工具使用,更重要的是,它能理解什么时候需要不同工具组合来完成复杂任务。”

本次发布中,Google还带来了全新Agent开发平台——Google Antigravity。

借助Gemini 3的高级推理能力、工具使用和智能编码能力,Google Antigravity将 AI 辅助从开发者工具包中的工具转变为一个活跃的伙伴。

尽管 Google Antigravity 的核心仍沿用熟悉的 AI 集成开发环境(IDE),但其智能体已被提升到一个专属的界面,并被赋予直接访问编辑器、终端和浏览器的权限。现在,智能体能够代表开发者自主规划和执行复杂的端到端软件任务,并在此过程中自行验证代码。

结尾谷歌提到,Gemini 3 是迄今为止最安全的模型,并且接受了 Google AI 模型中最全面的一套安全评估。该模型展现了更低的谄媚性,更高的抗提示注入能力,并强化了抵御网络攻击滥用的保护措施。

Gemini 3的胜利还有一点是值得一提的:训练完全基于自家TPU,当全世界的 AI 公司都在苦苦等待英伟达 GPU 发货时,Gemini有着肆意扩张参数的底气。

随着Gemini 3加入模型“角斗场”,Google向世界宣告王者归来,也让AI真实地朝着人们期待的方向迈出显著一步。显然,围绕大模型的新一轮竞争已全面打响。

相关内容

月产20部 华策影视加速短...
对于包括短剧在内的新业务,浙江华策影视股份有限公司(以下简称“华策...
2025-11-19 02:15:37
盘前资讯|多只ETF宣告成...
中证网讯 ①11月18日,易方达中证A500红利低波动ETF、鹏华...
2025-11-19 02:15:30
多只基金逆袭成功!基金经理...
年内,伴随着行情整体升温,主动权益基金产品净值呈整体上涨趋势,部分...
2025-11-19 02:14:02
金桥信息选举曹晖为第六届董...
金桥信息11月18日发布公告,根据相关规定,公司设职工代表董事一名...
2025-11-19 02:12:41
原创 ...
古人常有“十年寒窗苦读为了啥”的疑问,答案往往是为了能考取官职,过...
2025-11-19 02:02:51
原创 ...
国民党在1949年大陆战场上接连吃败仗,蒋介石眼看撑不住了,就开始...
2025-11-19 02:01:34
广东省惠来商会唐玉利会长一...
2025年11月16日下午,“惠聚鹅城、共创未来”惠州市惠来商会第...
2025-11-19 01:46:42
男子手搓“自动喂食器” 鸡...
  男子手搓“自动喂食器”。鸡:日子好了,撸上串了!
2025-11-19 01:43:58
龙吟虎啸!沉浸式感受福建舰...
福建舰已就位,且听龙吟虎啸!近日,海军福建舰开展入列后首次海上实兵...
2025-11-19 01:43:46

热门资讯

法治面|为整治土地“非粮化”百... 界面新闻记者 | 赵孟 界面新闻编辑 | 刘海川 四川宜宾一处百亩三角梅苗圃因“非粮化”整治被强...
2025年双十一全网销售数据解... 2025年双十一购物节已圆满落幕, 星图数据对本次大促进行了全面监测与深度分析,形成这份专业解读报告...
材科源图获数千万元天使轮融资:... 苏州材科源图科技有限公司(以下简称“材科源图”)近日宣布完成数千万元天使轮融资。本轮融资由中科创星领...
午后,A股止跌回升!明天凌晨这... 11月19日,市场震荡回升,沪指、创业板指均收红。截至收盘,沪指涨0.18%,创业板指涨0.25%。...
马斯克将开源Grokpedia... IT之家 11 月 19 日消息,据《商业内幕》当地时间 11 月 18 日报道,马斯克认为 Gro...
大商股份(600694),宣布... 大商股份指,截至目前,公司正积极与相关中介机构就本次H股上市的相关工作进行筹备、商讨,关于本次H股上...
一文看懂谷歌最新模型Gemin... 出品|搜狐科技 作者|郑松毅 千呼万唤下,Gemini 3来了! 北京时间11月19日,Google...
从美国OTC市场到纳斯达克:企... 近年来,越来越多的亚洲企业将目光投向美国资本市场,其中一条常见路径是首先登陆美国OTC市场,再寻求转...
10月券商APP月活排名出炉,... 财联社11月19日讯(记者 陈俊兰)进入10月,A股题材切换速度较9月明显加快,短期热点普遍缺乏持续...
10月煤炭价格普遍上涨,国企红... 11月19日,三大股指午后持续走低,其中国企红利板块窄幅震荡。截至下午13:30,国企红利ETF(1...