11 月18 日,马斯克旗下xAI 宣布推出最新前沿模型Grok 4.1,这是Grok 系列迄今最大幅度的一次升级。官方称其在“对话智能、情绪理解和现实世界任务能力”等方面全面突破,并已在Arena 榜、EQ-Bench、Creative Writing V3 等核心榜单上取得领先。
Grok 4.1 已面向所有用户免费开放,可通过grok.com、grok.x.com 及移动端App 使用。马斯克本人也第一时间转发并表示,用户会“明显感受到速度和质量的提升”。
多项榜单冲顶:对话推理、情绪理解、写作能力全面跃升
根据xAI 公布的数据:
1)Arena 榜单第一名:1483 Elo
Grok 4.1-thinking 与Grok 4.1 分列第一、第二,领先最近的非xAI 模型31 分,属于断档式优势。
2)情绪智商EQ-Bench 第一名
Grok 4.1 Thinking 在EQ-Bench 情绪智能测试中拿到1586 Elo,是迄今表现最强的模型,在“情绪识别、共情、人际理解”等维度上显著提升。
3)写作能力暴涨600 分
在Creative Writing V3 中,Grok 4.1 拿到1722 Elo,比上一代提升高达600 分,追平甚至逼近早期GPT-5.1 Polaris 的水平。
4)幻觉率下降3 倍
官方称Grok 4.1 是目前最不易产生幻觉的Grok 模型,相比早期Grok 4 Fast 幻觉率下降超过3 倍。
用户实测:65% 情况下更偏爱Grok 4.1 的回答
xAI 表示,团队在11 月前两周对小规模用户悄然灰度测试了Grok 4.1。在对比中,用户在65% 的对战结果中更喜欢Grok 4.1 的回复。
这意味着模型升级不仅仅是参数层面的,更在实际交互体验上得到显著认可。
免费开放:所有用户可直接使用最新Grok
与其他厂商不同,xAI 将Grok 4.1 面向所有用户免费开放,包括非订阅用户。目前:
grok.com
grok.x.com
grok 移动端App(grok.com/download)
均已同步模型。
Grok 的战略:用“情绪智能”和“真实世界可用性”建立差异化
从此次升级可以看出,xAI 正在有意识地强化Grok 在以下三条赛道的竞争力:
1.情绪理解与共情能力EQ
这是ChatGPT、Gemini、Claude 尚未完全攻克的“人际感知”维度,Grok 此次大幅领先EQ-Bench,策略意义明显。
2.任务实用性和减少幻觉
降低错误率意味着Grok 在搜索、决策、推荐等结构化任务中更具可用性。
3.快速推理+ 创意写作
兼具速度与创造力,有利于进军创作工具与社交场景。
Grok 4.1 的定位正逐步从“另类、有梗”向“强推理、有温度、能办事”的通用助手转变。
Grok 4.1 不再靠“嘴臭”吸睛,而是用EQ、写作和速度争夺下一代AI 助手的核心场景。(转载自AI普瑞斯)