ChatGPT爱“胡说”?OpenAI揭秘:评估机制在“奖励”猜测致幻觉频发
创始人
2025-09-09 11:46:57
0

在人工智能领域,一个长期困扰研发者的问题是模型生成的“幻觉”——那些听起来头头是道,实则毫无根据的回答。这种现象的根源,近期被一项来自OpenAI的研究揭示:问题不在于模型本身的设计缺陷,而在于评估体系对“猜测”行为的隐性奖励。

传统AI基准测试采用“非黑即白”的评分逻辑:正确答案得分,错误或回避问题均不得分。这种机制下,模型若选择承认“不确定”,其表现评分会直接下滑;而若冒险编造一个看似合理的回答,哪怕内容错误,只要碰巧匹配正确答案,就能获得高分。OpenAI的研究指出,这种评估方式实质上在“鼓励”模型进行不负责任的猜测,而非追求真实性与可靠性。

研究团队以考试场景类比:当学生面对不确定的题目时,若“空着不答”会被扣分,而“蒙一个答案”却可能得分,那么最优策略自然是“尽量猜”。大型语言模型(LLMs)的训练过程正是如此——它们被优化为“应试者”,而非“知识传递者”。OpenAI研究员直言:“模型学会的是如何通过猜测提高分数,而非如何准确表达知识边界。”

实验数据进一步验证了这一结论。在对比测试中,OpenAI的新模型GPT-5 Thinking Mini与旧版o4-Mini表现出显著差异:前者准确率22%,但52%的情况下选择“弃答”(即承认不知道);后者准确率虽略高(24%),但弃答率仅1%,错误率却高达75%。这意味着,o4-Mini更倾向于“瞎猜”,导致正确与错误回答同时增加,而GPT-5则通过提高弃答率,降低了错误信息的传播风险。

“现有评估体系的问题在于,它用准确率单一指标衡量模型,却忽视了错误回答比‘不知道’的后果更严重。”研究团队强调。例如,在医疗或金融咨询场景中,用户更需要的是可靠的信息,而非一个听起来自信但可能错误的答案。若评估标准继续奖励“侥幸猜对”,模型将逐渐依赖这种策略,最终损害用户信任。

针对这一困境,OpenAI提出的核心解决方案是调整评估逻辑:不再因模型“不回答”而惩罚,转而鼓励其表达不确定性。研究人员认为,无需重构模型架构,仅需修改评分方式——例如,对“弃答”给予一定容忍度,同时大幅降低错误回答的得分权重。这种转变旨在引导模型从“追求分数”转向“追求可信度”。

这一思路标志着AI研发方向的微妙转变。过去,行业竞相追求模型的响应速度、语言流畅度等表面指标,却忽视了“可靠性”这一根本需求。OpenAI的研究提醒,真正的挑战在于平衡“知识表达”与“谦逊态度”——让模型既能传递已知信息,又能清晰界定自身能力边界。毕竟,在需要专业建议的场景中,用户宁愿听到“我不知道”,也不愿被一个自信的谎言误导。

相关内容

梧桐市集“迎白露” 共赴传...
9月7日晚,以“秋高气爽迎白露,万人共‘煮’丰收季”为主题的精彩活...
2025-09-09 13:03:15
原创 ...
导读:曾经火爆的旋转小火锅,为何如今门庭冷落?5大痛点直击内心! ...
2025-09-09 13:01:11
四川九寨沟黄龙怎么玩不踩坑...
四川,这片被誉为"天府之国"的神奇土地,位于中国西南腹地,以其得天...
2025-09-09 13:00:43
四川六天五晚旅游攻略:四川...
四川,这片被誉为"天府之国"的神奇土地,位于中国西南腹地,以其得天...
2025-09-09 12:59:07
四川亲子游攻略!四川六天五...
四川,这片被誉为"天府之国"的神奇土地,位于中国西南腹地,地处长江...
2025-09-09 12:58:27
世预赛非洲区:几内亚vs阿...
当地时间2025年9月8日,摩洛哥,世预赛非洲区:几内亚vs阿尔及...
2025-09-09 12:58:08
张家界双人游五天四晚行程旅...
2025张家界五日游:仙境之旅 2025年的初夏,我终于踏上了向往...
2025-09-09 12:55:14
西北七天六晚旅游注意事项,...
《2025西北秘境之旅:七天穿越时空的奇幻旅程》 在中国西北的辽阔...
2025-09-09 12:53:43

热门资讯

日赚1.3亿,创始人光靠卖衣服... 这家公司,每年都从中国市场赚走几百个亿,创始人光是靠卖衣服,曾八次成为日本首富。 这是日本近30年来...
热搜爆了!被小米辞退后,王腾再... 9月9日上午,“王腾称没有窃取公司机密出售”的热搜爆了。 9月9日,@王腾Thomas 发文辟谣,...
曾被雷军点名“动不动泄密”的王... 9月8日深夜,王腾发布微博回应被小米辞退,“很惭愧跟大家说声抱歉,过去犯了一些错误,接受该有的代价。...
全国专精特新企业已超14万家!... 【大河财立方消息】9月9日,国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会。 ...
2025出境旅行社行业新趋势:... “旅游已经不只是‘去看世界’,而是‘用最适合自己的方式体验世界’。” 2025年,出境旅游市场正在迎...
金价持续上涨!受益于金价且弹性... 今日开盘,中证沪深港黄金产业股票指数(931238)强势上涨2.11%,成分股晓程科技(300139...
王腾被小米辞退后,网友替他求情... 作者:龚进辉 昨天深夜,小米爆出了一个惊天大瓜:中国区市场部员工王腾泄露公司机密信息,且存在利益冲突...
支付宝蚂蚁理财金选:与波动共舞... 当市场波动成为常态,稳健理财的终极命题从"如何避险"转向"如何与风险共处"。支付宝蚂蚁理财金选提供的...
自闭症学生报到当天遭劝退,广东... 正值开学季,许多学生通过招生考试迈入人生新阶段,今年19岁的李同学本该也是其中的一员。 李同学是一名...
我国制造业规模连续 15 年保... IT之家 9 月 9 日消息,工信部部长李乐成今日在国新办举行的“高质量完成‘十四五’规划”系列主题...