马斯克口中最智能的Grok 3登场,号称性能超ChatGPT及DeepSeek
创始人
2025-02-18 15:35:37
0

界面新闻记者 | 宋佳楠

2月18日午间,马斯克旗下xAI公司的新一代大模型Grok 3正式发布。发布会采用视频直播形式,观看人数超过100万人,马斯克本人也出现在直播间。

据马斯克介绍,Grok3在很短的时间内实现了功能比Grok2强大一个数量级,Grok-3和Grok-3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。

xAI工程师则表示,虽然Grok起步较晚,但在MMLU得分上以超快的速度追上了ChatGPT,Grok 3所涉及的训练是Grok 2的10倍,目前Grok 3已经在xAI内部运行了2周。MMLU是一个用于评估语言模型在多种任务上语言理解能力的基准测试。

此外,xAI推出名为Deepsearch的Grok-3智能搜索引擎。xAI工程师强调,Deepsearch是xAI的第一代广泛代理工具,它不仅帮助工程师、研究人员和科学家编写代码,也能帮助每个人回答日常遇到的问题。

马斯克在现场演示了Grok 3的搜索能力,如问“下一次的星舰发射是什么时候”,Grok 3会像DeepSeek一样,显示模型正在做什么,包括浏览的网页、思考的过程,并确认网页上的信息是否可信,再得出一个相关的结论。最终,大模型以列表形式预测了下一次星舰的发射期。

值得注意的是,该搜索引擎在深度思考过程中还会显示不同的次任务,这种功能据称比现在的搜索引擎更为强大,可节省更多时间,因对搜索引擎的算法和逻辑重新进行了设计。

对于用户何时可以体验到“地球上最聪明的人工智能”,马斯克称会首先向预定用户开放。由于模型仍在不断更新和改进中,苹果应用商店上线的Grok版本会相对落后,而网页版更新最为及时。据其透露,Grok 3语音模式可能在一周后推出。

直播末尾,马斯克和xAI工程师现场回答了网友提问。当被问及是否会开源时,马斯克给出了肯定的答案,称每次做下一个版本时会开源上一个版本,几个月后会开源Grok 3。对于颇为敏感的“Grok 3是男性还是女性”问题,马斯克称,性别是模型自己定义的,还提醒“不要爱上Grok”。

谈及开发Grok 3最难的部分,马斯克表示是训练模型和100%的逻辑推理过程,那种复杂程度就像随时随地预测宇宙的发展情况。

如果Grok 3的推理能力真如视频中所讲的那样强大,可能推动AI从 “生成答案” 向 “逻辑推导” 升级。

xAI公司成立于2023年7月,此前已推出过Grok-1、Grok-1.5、Grok-1.5 Vision、Grok-2等大模型产品。其中,Grok-1是迄今参数量最大的开源大语言模型;Grok-1.5具有改进的推理能力和128k的上下文长度;Grok-1.5 Vision是首个多模态智能模型;Grok-2在Chatbot Arena榜单排名第18位。

不过,当前大模型行业竞争态势无比激烈。在Grok 3发布当日,奥特曼在X上表示,“对于高要求的测试者来说,试用GPT-4.5带来的感受AGI的体验,远比我预期的要深刻得多!”这似乎在预示着,GPT-4.5已经进入测试阶段,距离正式发布也不会太远了。

而在2月初,谷歌也发布了一系列新模型,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版本。面对竞争对手,Grok 3能否占据主导地位还需进一步观察。

可以确定的是,包括OpenAI、谷歌等AI巨头在内,近期都已感受到了来自中国大模型公司DeepSeek带来的冲击波,以往坚持闭源的OpenAI也有了进一步开源的迹象。2月18日,奥特曼在X上发起投票,问大家希望下一个OpenAI开源的大模型是哪种?是o3-mini还是手机上可运行的大模型?或是在为开源某个大模型做预热。

相关内容

【人民网、央广网、中新网】...
人民网 人民网哈尔滨4月20日电 自免签政策实施以来,绥芬河锚定...
2026-04-28 12:18:31
“五一”旅行产品搜索量上涨...
随着“五一”假期临近,多地出游预订热度持续攀升。北方的新疆与南方的...
2026-04-28 12:17:42
肖克故居,嘉禾小街田村红色...
前段时间,受当地政府邀请,我和我的团队去郴州嘉禾县进行休闲农业培训...
2026-04-28 12:16:57
沈阳周边游去哪?本溪桓仁龙...
周末旅游好去处 沈阳周边适合周末旅游的地方不少,其中本溪桓仁龙祥岛...
2026-04-28 12:16:57
一家人去新疆玩7日怎么玩,...
一家人去新疆玩7日怎么玩,新疆轻松游七天六晚多少费用 带着一家人去...
2026-04-28 12:16:51
巨有科技创5A景区管理:铸...
在文旅产业高质量发展的浪潮中,国家5A级旅游景区已成为高品质旅游目...
2026-04-28 12:16:10
广州一地掀起“挖晶热”,现...
近日,有多名网友在社交平台发帖称,广州市黄埔区暹岗大山掀起“挖晶热...
2026-04-28 12:15:53
从“自我如珠”到“岛上有韵...
前言:珠源湖州,再绽新韵 4月22日,熹圆韵记×云湖岛珍珠文化体验...
2026-04-28 12:15:20
逃离人山人海,解锁旅游生活...
每隔一年到了假期之时,“旅游”跟“人山人海”好像就成了天然的近义词...
2026-04-28 12:15:02

热门资讯

张小泉控制权或再添变数,MCN... 图片来源:视觉中国 蓝鲸新闻4月21日讯(记者 徐晓春)张小泉控制权或再添变数,MCN机构白兔集团刚...
一季度冠军基金重仓曝光:黄金、... 每经记者:任飞 每经编辑:赵云 截至4月22日,2026年第一季度主动权益基金(统计普通股票型、偏股...
沪指重返4100点 2920只... 扬子晚报网4月22日讯(记者 范晓林)截至收盘,沪指重返4100点,创业板指、深成指均涨超1%。创业...
超837亿元!2025年中国演... 央视网消息:4月21日,中国演出行业协会发布多项2025年全国演出市场相关数据。2025年,全国演出...
原创 库... 苹果重大人事调整!苹果正式官宣库克将于2026年9月1日正式卸任CEO职务,转任董事会执行董事长,接...
回购潮下价值凸显,美的集团、泡... 文丨谢长艳 编辑丨张桔 年内上市公司回购潮再涌,尤其A股和港股的龙头公司成为标兵,美的集团、腾讯控股...
珀莱雅上市后年度营收净利首次双... 国产美妆巨头业绩迎来阶段性承压,上市后业绩首次下滑。 4月21日晚间,珀莱雅(603605.SH)发...
中国走得太及时!8500亿美债... 编辑丨子渝 文丨子渝 本文陈述所有内容皆有可靠信息来源,赘述在文章结尾 4月,美国财政部陷入...
大势已逆转!国产新能源或早已证... 打开2026年最新车市终端数据,一场堪称惨烈的行业洗牌,正在清晰上演。 曾经手握二三十万预算、中产群...
阿里等巨头,洽谈投资DeepS... 来源:财熵 阿里等巨头,洽谈投资DeepSeek 据媒体援引四位知情人士透露,中国科技巨头腾讯控股...