首席科学家姚顺雨腾讯首篇论文:道破为何AI死活听不懂人话
创始人
2026-02-04 22:40:39
0

快科技2月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。

值得一提的是,这也是姚顺雨入职腾讯首席AI科学家后,首次署名的研究论文。

他在文中提到,当前AI与真正智能之间的鸿沟,不在于知识的多少,而在于学习的能力。

一个装满知识却不会学习的AI,就像一个背了整本字典却不会写作的人,看起来博学,实则僵化。

人类并不只依赖多年前学到的死知识,而是在实时地从眼前的上下文中学习。

在这篇论文里,研究团队提到,大模型在上下文利用上,依然存在显著的能力短板。

为了衡量现有模型距离真正的“上下文学习者”还有多远,研究团队构建了CL-bench。

这是一个专门评测语言模型能否从上下文中学习新知识并正确应用的基准。

CL-bench包含由资深领域专家精心制作的500个复杂上下文、1899个任务和31607个验证标准。

CL-bench只包含一个简单但苛刻的要求:“解决每个任务要求模型必须从上下文中学习到模型预训练中不存在的新知识,并正确应用。”

通过实验发现,世界上排名前十的语言模型在CL-bench上的任务解决率平均只有17.2%。

也就是说即使是如今最强的语言模型,在上下文的利用方面仍然做得不好,甚至可以说是还不会利用上下文,从上下文中学习。

不过这也为大语言模型后续的迭代指出了一个可能的方向,强化模型从上下文中进行学习的能力。

相关内容

监管批复!卢永胜就任兴海农...
2026年2月4日,根据国家金融监督管理总局消息,《兴海农商银行关...
2026-02-04 15:42:14
特斯拉的销量已经不重要了
作者I山上 薛星星 对于特斯拉——这家全球有史以来市值最高、同时...
2026-02-04 15:42:02
实拍限制阿森纳人海角球战术...
实拍限制阿森纳人海角球战术 切尔西3将冲向中圈
2026-02-04 15:41:46
原创 ...
78岁意大利政要突然将矛头指向中国,竟称世界秩序已名存实亡。欧洲衰...
2026-02-04 15:40:14
险资入市新规提振,港股通非...
截止2月4日13点55分,上证指数涨0.23%,深证成指跌0.72...
2026-02-04 15:39:57
“蛇吞”华人文化背后,真正...
文|文娱先声 在公众视野消失多年的邵氏兄弟,最近登上了热搜。 近...
2026-02-04 15:39:52
从融资到风控:微众银行企业...
当下,新一轮科技革命与产业变革澎湃而至,数字化浪潮以史无前例的态势...
2026-02-04 15:39:31
晶科能源股价涨停,工作人员...
红星资本局2月4日消息,对于马斯克团队考察过晶科能源(688223...
2026-02-04 15:38:58
蜂拥入市,00后想变身「古...
作者 |豹变 高泽 2026年开年,A股以日线“17连阳”的强势...
2026-02-04 15:38:52

热门资讯

原创 人... 如果有一天,地球上所有森林在一夜之间统统消失,人类还能生存吗? 森林一夜消失,人类不会第二天就集体...
汉密尔顿经纪人海因斯再次分道扬... 汉密尔顿经纪人海因斯再次分道扬镳,或担任周冠宇经纪人! #F1 #赛车 #2026年F1赛季 据《每...
原创 张... 从澳网漂移至阿布扎比500赛后,张帅再次让大家见识了她这把37岁“岁月妖刀的”实力,收获双打开门红的...
记者:博埃在训练中途退出,随后... 据德天空记者Torben Hoffmann的消息,拜仁后卫博埃在训练中途退出,随后前往诊所检查。记者...
大模型如何才能像真正的数据科学... 当我们谈论人工智能的时候,大多数人会想到的是一个助手坐在你身边,等待你的指令。你问它一个问题,它就给...
俄美乌新一轮会谈仍高度克制 据凤凰卫视报道,由乌克兰、美国、俄罗斯三国代表组成的安全问题工作组2月4日在阿联酋首都阿布扎比开始举...
原创 F... 巴塞罗那封测后的那份安静自信,简直像无声的宣言,悄悄透出了红牛自研动力单元的底细。他整个人松弛得不像...
外网热议!传奇车王舒马赫不再卧... 【温馨小提示】: 大家也可在小号找到我,关注起来,以后不失联~ 2013年12月29日,7届一级方程...
一场演唱会,见证追觅科技如何用... 2月4日,苏州奥体中心体育场灯光璀璨,追觅科技与央视携手打造的“敢梦敢为·追觅之夜”演唱会正式登场。...