ChatGPT爱“胡说”?OpenAI揭秘:评估机制在“奖励”猜测致幻觉频发
创始人
2025-09-09 11:46:57
0

在人工智能领域,一个长期困扰研发者的问题是模型生成的“幻觉”——那些听起来头头是道,实则毫无根据的回答。这种现象的根源,近期被一项来自OpenAI的研究揭示:问题不在于模型本身的设计缺陷,而在于评估体系对“猜测”行为的隐性奖励。

传统AI基准测试采用“非黑即白”的评分逻辑:正确答案得分,错误或回避问题均不得分。这种机制下,模型若选择承认“不确定”,其表现评分会直接下滑;而若冒险编造一个看似合理的回答,哪怕内容错误,只要碰巧匹配正确答案,就能获得高分。OpenAI的研究指出,这种评估方式实质上在“鼓励”模型进行不负责任的猜测,而非追求真实性与可靠性。

研究团队以考试场景类比:当学生面对不确定的题目时,若“空着不答”会被扣分,而“蒙一个答案”却可能得分,那么最优策略自然是“尽量猜”。大型语言模型(LLMs)的训练过程正是如此——它们被优化为“应试者”,而非“知识传递者”。OpenAI研究员直言:“模型学会的是如何通过猜测提高分数,而非如何准确表达知识边界。”

实验数据进一步验证了这一结论。在对比测试中,OpenAI的新模型GPT-5 Thinking Mini与旧版o4-Mini表现出显著差异:前者准确率22%,但52%的情况下选择“弃答”(即承认不知道);后者准确率虽略高(24%),但弃答率仅1%,错误率却高达75%。这意味着,o4-Mini更倾向于“瞎猜”,导致正确与错误回答同时增加,而GPT-5则通过提高弃答率,降低了错误信息的传播风险。

“现有评估体系的问题在于,它用准确率单一指标衡量模型,却忽视了错误回答比‘不知道’的后果更严重。”研究团队强调。例如,在医疗或金融咨询场景中,用户更需要的是可靠的信息,而非一个听起来自信但可能错误的答案。若评估标准继续奖励“侥幸猜对”,模型将逐渐依赖这种策略,最终损害用户信任。

针对这一困境,OpenAI提出的核心解决方案是调整评估逻辑:不再因模型“不回答”而惩罚,转而鼓励其表达不确定性。研究人员认为,无需重构模型架构,仅需修改评分方式——例如,对“弃答”给予一定容忍度,同时大幅降低错误回答的得分权重。这种转变旨在引导模型从“追求分数”转向“追求可信度”。

这一思路标志着AI研发方向的微妙转变。过去,行业竞相追求模型的响应速度、语言流畅度等表面指标,却忽视了“可靠性”这一根本需求。OpenAI的研究提醒,真正的挑战在于平衡“知识表达”与“谦逊态度”——让模型既能传递已知信息,又能清晰界定自身能力边界。毕竟,在需要专业建议的场景中,用户宁愿听到“我不知道”,也不愿被一个自信的谎言误导。

相关内容

原创 ...
来朝鲜的第一天,我踏上了清津市的土地。城市的景象并没有给我太多惊喜...
2026-04-02 23:00:49
原创 ...
考古学家收藏了一只梅瓶,然而,随着古墓的出土,竟然发现了与之完全相...
2026-04-02 22:59:46
原创 ...
说起西汉初年的贾谊,这位二十出头就当上太中大夫的年轻人,在历史上留...
2026-04-02 22:58:10
原创 ...
古人常说:穷则变,变则通。这句话自古以来便让许多人为之着迷,对变法...
2026-04-02 22:57:48
原创 ...
1991年12月25日,戈尔巴乔夫作为苏联的最后一任总统,发表了他...
2026-04-02 22:57:37
原创 ...
绥宁县,位于湖南省西南部,是湖南省的林业标杆县,隶属于邵阳市宝庆地...
2026-04-02 22:57:13
原创 ...
太监,顾名思义,是指在封建社会中被阉割生殖器后,进入宫廷侍奉皇帝及...
2026-04-02 22:55:32
原创 ...
杨家将,是北宋历史上最为显赫的军事家族之一,在中国历史的长河中,这...
2026-04-02 22:55:11
原创 ...
坐落在南三岛田头村陈氏小宗的清礼部尚书陈瑸雕像,静静地矗立在那里,...
2026-04-02 22:53:24

热门资讯

银行ETF鹏华(512730)... 银行板块逆市走高,防御属性凸显,消息面上,随着2025年上市银行年报的陆续披露,6家国有银行及9家A...
西城区图书馆数字资源读者需求调... 西城区图书馆数字资源读者需求调研 亲爱的读者朋友: 您好!感谢您一直以来对西城区图书馆的关注与支持!...
高股息方向表现活跃,红利ETF... 截至收盘,恒生港股通高股息低波动指数上涨0.6%,中证红利低波动指数、中证红利价值指数均上涨0.4%...
中国四线小城,世界饮料之都?咸... (文/刘媛媛 编辑/周远方) 当人们谈论全球饮料产业的地标,多半会想到瑞士沃韦的雀巢总部、美国亚特...
2026数字资产趋势白皮书-火... 白皮书指出,数字资产已从边缘投资品类升级为新一代全球金融基础设施,全球金融正形成 “主权传统金融 +...
投资防踩坑!经典投诉案例来了 【导读 】投资踩坑实录!27篇经典投诉案例,手把手教你避开规则误区与骗局 中国基金报见习记者 秦宁蔚...
港股收评:恒指跌0.7%!航空... 4月2日,港股三大指数集体下挫。恒生指数跌0.7%险守25000点,国企指数、恒生科技指数分别下跌0...
央行新增12家银行为数字人民币... 观点网讯:4月2日,中国人民银行发布公告,为贯彻落实“十五五”规划纲要关于“稳步发展数字人民币”的决...
监管批复!吴琼就任安徽石台农商... 2026年4月2日,根据国家金融监督管理总局消息,《安徽石台农村商业银行股份有限公司关于吴琼同志董事...
产区协同·国资引领·多元融合—... 第114届全国糖酒商品交易会于2026年3月26日至28日在成都世纪城新国际会展中心和中国西部国际博...