Scaling Law最早源自百度?Anthropic CEO都下场爆料
创始人
2024-11-28 16:11:13
0

大模型的第一规律——Scaling Law,发现者不是2020年的OpenAI,而是2017年的百度?!

近期,一则消息刷爆了外网AI圈。

百度早于Open AI,发表Scaling Law相关论文研究

11月27日早晨,Meta研究员Jack Morris在社交媒体发文称:“大数人不知道,关于Scaling Law的原始研究来自2017年的百度,而不是2020年的OpenAI。”

该推文中提到的论文就来自于百度在2017年发布的一篇论文《DEEP LEARNING SCALING IS PREDICTABLE, EMPIRICALLY》。

论文展示了在机器翻译、语言建模、图像处理和语音识别等四个领域中,随着训练集规模的增长,深度学习泛化误差和模型大小呈现出幂律增长(scaling)模式。只不过当时研究者使用的是 LSTM,而不是Transformer;也还没有将这一发现正式命名为“Law”。但论文的其中一位作者Gregory Diamos当年在百度的介绍还是LLM Scaling Law Researcher。

这项研究还有后续,2019年,百度的上述团队再次发表了一篇论文《Beyond human-level accuracy: computational challenges in deep learning》(超越人类水平的准确性: 深度学习的计算挑战)。

巧的是,OpenAI 在2020年发表的,为人所熟知的的论文《Scaling Laws for Neural Language Models》恰恰引述了百度的这项研究。

图片来源:OpenAI 论文《Scaling Laws for Neural Language Models》

所以归根溯源,Scaling Law的研究从源头看,是绝对绕不开百度的。或者说百度才是Scaling Law的最早发现者,从某种意义上,为全球生成式AI的爆发奠定了基础。

此前曾在Open AI工作,参与了GPT-3等重要项目开发的AI专家Gwern Branwen曾较早注意到了Scaling Law 。他也经常提起:百度的这篇论文确实被严重忽视了。

Anthropic创始人爆猛料,2014年百度工作期间就发现Scaling Law

无独有偶,Anthropic创始人Dario Amodei在本月中旬与Lex Fridman的播客节目中也明确提到,2014年与吴恩达在百度研究AI的时候,他就已经发现了Scaling现象。

在研究语音神经网络时,Dario和团队发现,“随着你给它们提供数据,随着你让模型变大,随着你训练它们的时间越来越长,模型的表现开始越来越好。当时我并没有精确地衡量,但我和同事们都非常非正式地感觉到,给这些模型的数据越、计算越、训练越,它们的表现就越好。”

对于Dario,大部分人更了解的是2016年他加入Open AI并带领团队开发了 GPT-2 和 GPT-3。以及他在2021年与妹妹共同创立Anthropic,并发布Claude。

但Dario最早踏足AI圈却是从百度开始的,博客中他也表示,“ 2014 年底,我在百度与吴恩达共事时首次进入人工智能世界,到现在差不正好是 10 年。“

一张在业界广为流传的图也展示了百度吸纳过全球一大批顶尖的AI人才。

例如,2014年,吴恩达加入百度并在研究院首席科学家,担任百度公司首席科学家,负责百度研究院的领导工作,尤其是Baidu Brain计划。 2014年5月19日,百度宣布任命吴恩达博士为百度首席科学家,全面负责百度研究院。

百度创始人李彦宏在近期媒体专访中被问及此事时,也首次公开分享了其中的细节,“吴恩达来的理由其实也比较简单,他当时在Google,做Google brain,想买的GPU,Google说不行,太贵了。我们说你来,随便买,那他就来了。他来了之后,像Dario Amodei,他原来是斯坦福的学生,那你来加入百度,Dario Amodei来了之后说Jim Fan不错,我找他来进行实习。”

可能百度的作风一直比较低调务实,李彦宏也从不对外炫耀百度的人才储备,就像绝大数的人都不知道Scaling Law的研究是从百度开始的一样。

李彦宏也在专访中表示,“一代一代的人,就把优秀的人才能够吸引过来。当然这些人后来阴差阳错,又离开了百度,我觉得也没问题,人才的这种流动对整个行业是健康的。他找到他的下一站,对于百度来说也培养了一批非常优秀的人才。外界因为某一个人的离开会有报道,但是这个人如果在这儿呆着的话,就没有报道,并不是因为这个人不优秀。其实目前在百度内部,有很很非常优秀的人在做AI,只不过因为他们没有离开,所以外界不知道,没有报道。”

李彦宏带领百度在2023年1月就成立了深度学习研究院,开始大力投入AI。基于对于AI人才毫不吝啬地支持和对AI技术方向的坚定研究,百度才能够在2019年发布第一代的文心大模型,几乎与OpenAI的GPT-1处于同一时间。这也才造就了百度在2023年成为全球第一家推出生成式AI产品的全球科技大厂。

目前,文心大模型不仅是国内能力最强的大模型,也是使用量最广泛的基础模型。数据显示,百度文心大模型日均调用量已经超过15亿次,相较一年前首次披露的数据,增长 30 倍。24年Q3财报电话会上,李彦宏透露,百度将于2025年初发布新版文心大模型。

相关内容

闽清“十五五”聚焦三大AI...
  《闽清县“十五五”人工智能产业发展白皮书》明确,到今年年底,闽...
2026-04-23 05:05:39
女子遇刷单骗局 警方紧急劝...
  近日,连江县的张女士遭遇刷单返利诈骗。在她即将进行大额转账之际...
2026-04-23 05:05:03
福州出台新规规范水产品经营...
日前,记者从福州市市场监管局获悉,为维护水产品市场交易秩序,专治螃...
2026-04-23 05:04:31
坐专线“一站式”玩转琅岐 ...
  14日,记者从福州市道运中心获悉,闽运集团福州公交将于4月18...
2026-04-23 05:04:20
国台办:和平统一将给台湾经...
4月15日,国务院台办举行例行新闻发布会。有记者问,国务院台办发言...
2026-04-23 05:02:27
外交部:如果美方执意以所谓...
近日有媒体报道说,美国总统特朗普就中国向伊朗提供武器的报道表示,如...
2026-04-23 05:02:04
闽清发布“十五五”人工智能...
闽清发布“十五五”人工智能产业发展白皮书锚定百亿产业规模,打造县域...
2026-04-23 04:59:52
伊犁小吃全攻略:本地人私藏...
伊犁小吃全攻略:本地人私藏的10种必尝美味,带你吃透草原风味! 来...
2026-04-23 04:13:39
新疆伊犁旅游全攻略:什么时...
最近好多朋友都在问:“新疆伊犁,到底什么时候去风景最好?” 作为一...
2026-04-23 04:13:19

热门资讯

张小泉控制权或再添变数,MCN... 图片来源:视觉中国 蓝鲸新闻4月21日讯(记者 徐晓春)张小泉控制权或再添变数,MCN机构白兔集团刚...
一季度冠军基金重仓曝光:黄金、... 每经记者:任飞 每经编辑:赵云 截至4月22日,2026年第一季度主动权益基金(统计普通股票型、偏股...
沪指重返4100点 2920只... 扬子晚报网4月22日讯(记者 范晓林)截至收盘,沪指重返4100点,创业板指、深成指均涨超1%。创业...
超837亿元!2025年中国演... 央视网消息:4月21日,中国演出行业协会发布多项2025年全国演出市场相关数据。2025年,全国演出...
原创 库... 苹果重大人事调整!苹果正式官宣库克将于2026年9月1日正式卸任CEO职务,转任董事会执行董事长,接...
回购潮下价值凸显,美的集团、泡... 文丨谢长艳 编辑丨张桔 年内上市公司回购潮再涌,尤其A股和港股的龙头公司成为标兵,美的集团、腾讯控股...
珀莱雅上市后年度营收净利首次双... 国产美妆巨头业绩迎来阶段性承压,上市后业绩首次下滑。 4月21日晚间,珀莱雅(603605.SH)发...
中国走得太及时!8500亿美债... 编辑丨子渝 文丨子渝 本文陈述所有内容皆有可靠信息来源,赘述在文章结尾 4月,美国财政部陷入...
大势已逆转!国产新能源或早已证... 打开2026年最新车市终端数据,一场堪称惨烈的行业洗牌,正在清晰上演。 曾经手握二三十万预算、中产群...
阿里等巨头,洽谈投资DeepS... 来源:财熵 阿里等巨头,洽谈投资DeepSeek 据媒体援引四位知情人士透露,中国科技巨头腾讯控股...