ChatGPT爱“胡说”?OpenAI揭秘:评估机制在“奖励”猜测致幻觉频发
创始人
2025-09-09 11:46:57
0

在人工智能领域,一个长期困扰研发者的问题是模型生成的“幻觉”——那些听起来头头是道,实则毫无根据的回答。这种现象的根源,近期被一项来自OpenAI的研究揭示:问题不在于模型本身的设计缺陷,而在于评估体系对“猜测”行为的隐性奖励。

传统AI基准测试采用“非黑即白”的评分逻辑:正确答案得分,错误或回避问题均不得分。这种机制下,模型若选择承认“不确定”,其表现评分会直接下滑;而若冒险编造一个看似合理的回答,哪怕内容错误,只要碰巧匹配正确答案,就能获得高分。OpenAI的研究指出,这种评估方式实质上在“鼓励”模型进行不负责任的猜测,而非追求真实性与可靠性。

研究团队以考试场景类比:当学生面对不确定的题目时,若“空着不答”会被扣分,而“蒙一个答案”却可能得分,那么最优策略自然是“尽量猜”。大型语言模型(LLMs)的训练过程正是如此——它们被优化为“应试者”,而非“知识传递者”。OpenAI研究员直言:“模型学会的是如何通过猜测提高分数,而非如何准确表达知识边界。”

实验数据进一步验证了这一结论。在对比测试中,OpenAI的新模型GPT-5 Thinking Mini与旧版o4-Mini表现出显著差异:前者准确率22%,但52%的情况下选择“弃答”(即承认不知道);后者准确率虽略高(24%),但弃答率仅1%,错误率却高达75%。这意味着,o4-Mini更倾向于“瞎猜”,导致正确与错误回答同时增加,而GPT-5则通过提高弃答率,降低了错误信息的传播风险。

“现有评估体系的问题在于,它用准确率单一指标衡量模型,却忽视了错误回答比‘不知道’的后果更严重。”研究团队强调。例如,在医疗或金融咨询场景中,用户更需要的是可靠的信息,而非一个听起来自信但可能错误的答案。若评估标准继续奖励“侥幸猜对”,模型将逐渐依赖这种策略,最终损害用户信任。

针对这一困境,OpenAI提出的核心解决方案是调整评估逻辑:不再因模型“不回答”而惩罚,转而鼓励其表达不确定性。研究人员认为,无需重构模型架构,仅需修改评分方式——例如,对“弃答”给予一定容忍度,同时大幅降低错误回答的得分权重。这种转变旨在引导模型从“追求分数”转向“追求可信度”。

这一思路标志着AI研发方向的微妙转变。过去,行业竞相追求模型的响应速度、语言流畅度等表面指标,却忽视了“可靠性”这一根本需求。OpenAI的研究提醒,真正的挑战在于平衡“知识表达”与“谦逊态度”——让模型既能传递已知信息,又能清晰界定自身能力边界。毕竟,在需要专业建议的场景中,用户宁愿听到“我不知道”,也不愿被一个自信的谎言误导。

相关内容

原创 ...
国名、国旗、国徽、国歌等象征一个国家的符号,代表着国家的独特身份和...
2026-06-23 15:19:42
原创 ...
中国是一片历史厚重的土地,我们常常自豪地提起那句辉煌五千年,这并非...
2026-06-23 15:18:42
原创 ...
公元302年,并州大旱,一个二十多岁的胡人被套上枷锁,两个人共用一...
2026-06-23 15:18:37
原创 ...
导读:在我们前文提到西南百濮的夜郎之后,再往西南的地区便是南中。到...
2026-06-23 15:18:14
原创 ...
众所周知,清朝第一次与外国进行正式谈判,便是康熙时期与沙俄签订的《...
2026-06-23 15:18:07
伊朗议长:虽设立联络热线,...
美伊达成协议后,伊朗谈判代表团转往阿曼,磋商霍尔木兹海峡管理安排。...
2026-06-23 15:05:43
“福建好人榜”公示!向他们...
22日 中共福建省委文明办公布 2026年上半年“福建好人榜”...
2026-06-23 14:28:34
《瀛寰志略》与《海国图志》...
摘要: 本文旨在探讨清朝时期两部重要的著作——《瀛寰志略》与《海国...
2026-06-23 14:19:37
原创 ...
几千年来,有人问什么是伪君子?跟简单,那就是巴掌打在别人的脸上大仁...
2026-06-23 14:19:20

热门资讯

万亿长线资金进场布局高股息银行... 6月23日,银行股集体走强, 中信银行(601998.SH)、 交通银行(601328.SH)、 紫...
原创 曾... 翻开《清明上河图》,画里的酒楼、瓦肆、漕船、虹桥,那股子烟火气隔着快一千年还能扑面而来。汴梁城当年的...
Groq与英伟达交易后转型AI... IT之家 6 月 23 日消息,AI 初创企业 Groq 在去年底与 NVIDIA(英伟达)签署了一...
原创 说... 中国减持美债的步伐正在加速。 最新数据显示,中国持有的美债规模已降至6511亿美元,跌至18年来的最...
董明珠谈格力人才培养与选拔:曾... 快科技6月23日消息,近期董明珠出席格力电器2025年度先进标兵表彰会,围绕内部人才培养与选拔机制对...
南昌第五医院甲状腺科江辉提醒:... 甲状腺结节可导致食欲不振、疲劳和烦躁。 如果不及时治疗,它会长大并压迫食道和气管。 患者会出现吞咽困...
王石致函中央网信办!称遭规模化... 王石致函中央网信办整治规模化网暴。 6月22日,王石转发了律师周兆成的一则贴文,该文显示,王石在6月...
雷军:小米在三电技术上进步非常... 6月23日消息,今日,小米集团创始人雷军发文表示:“这两年,我们在三电技术上投入很大,进步也非常快。...
茅台1935,重构增长逻辑 6月18日,茅台集团党委书记、董事长陈华在北京主持召开2026年茅台1935品牌市场工作会(以下简称...
理财险想退能退多少——奶爸保从... 一、退保能拿回多少钱,取决于保单的现金价值,不是已交保费 很多人买理财险后两三年想退,结果发现拿回来...