原创 尺度定律失效,中国AI企业 DeepSeek如何打破AI霸权!
创始人
2025-02-13 14:01:52
0

新年期间,科技圈最火爆的莫过于杭州的人工智能企业DeepSeek,其凭借新颖的理念开发的推理型大模型用不足600万美元的成本实现甚至部分超越了行业巨头Open AI的o1模型的测试指标。

由于DeepSeek的R1模型的优秀能力和廉价的开发成本,导致走传统的尺度定律(Scaling Law)原理的AI企业被市场给予巨大的质疑,这包括Open AI以及各类基于尺度定律(Scaling Law)的上下游企业诸如英伟达等等。尺度定律最初由OpenAI在2020年提出,并在其论文《Scaling Laws for Neural Language Models》中详细阐述。该定律的核心发现是神经语言模型性能与模型大小、数据集大小和计算量之间存在幂律关系,且在一定范围内趋势稳定。近几年来最为火爆的GPT系列大模型以及其它厂商开发的诸如Claude等大型预训练模型的开发逻辑都是基于此。完整版本的GPT4有1.76万亿参数,这造就了其巨大的开发和运营成本,而Deep Seek的R1模型仅有6710亿个参数,同时,其采用的混合型大模型构架,在单次推理时仅激活部分专家网络(约37B参数),这使得其运营成本比传统的模型大大减少。

R1模型的诞生让人们不禁开始怀疑尺度定律(Scaling Law)是否是通向AGI的唯一道路,而在市场反应上则是基于尺度定律(Scaling Law)的各类企业的股票市值暴跌,其中英伟达作为尺度定律(Scaling Law)的最大受益者,其股票跌价也是最猛的,最高在1月27日单日股价‌下跌近 17%。其它芯片厂商也遭到了不同程度的影响,内存厂商美光科技和芯片IP厂商Arm Holdings分别下跌超过 11% 和 10%。芯片制造商博通和AMD分别下跌超过17%和6%。这次波动甚至影响到了更为上游的芯片制造设备提供商的股价,荷兰芯片制造设备厂商ASML和ASM International在欧洲的股价同样受到冲击。

虽然英伟达的股价受到了剧烈的冲击,但是其并没有盲目抨击deep seek的技术,其反而公开赞扬其带来的技术突破,其发言人表示:“DeepSeek 是出色的 AI 进步,也是测试时间扩展的完美范例。DeepSeek 说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算。推理需要大量 NVIDIA GPU 和高性能网络。我们现在有三个扩展法则:预训练和后训练,它们将继续,以及新的测试时间扩展。”当然可以看出,英伟达仍然在强调即使在新的开发思路下,英伟达的GPU仍然是不可或缺的。

DeepSeek的崛起

DeepSeek-AI 由梁文峰于 2023 年 5 月创立,实际上是幻方量化( High-Flyer) 的衍生公司,幻方量化是国内知名的量化投资基金,创始人梁文峰本硕毕业于浙江大学信息电子工程专业,在2008年就开始探索机器学习技术应用于量化交易市场,并在2016年创立了幻方量化投资基金。幻方量化在国内作为知名量化投资企业,取得巨大的成果,据悉其管理的资产在2021年后超过千亿元,是国内四大量化投资机构之一。

在投资市场上取得显著成就之后,梁文峰开始涉足人工智能大模型的研究。2023年5月,梁文峰宣布进军通用人工智能(AGI)领域。紧接着在7月,幻方量化宣布成立大模型公司DeepSeek,即杭州深度求索人工智能基础技术研究有限公司,标志着正式进入通用人工智能的竞技场。

进军通用人工智能行业后,其进度很快,在2024年5月,DeepSeek推出其新一代产品DeepSeek-V2。DeepSeek-V2的API定价策略为每百万tokens输入1元、输出2元,其价格仅为GPT-4 Turbo的百分之一。到了同年12月27日,DeepSeek再次突破技术壁垒,发布了DeepSeek-V3,并公开了详尽的53页训练和技术细节报告。

在2025年1月20日, DeepSeek正式发布DeepSeek-R1模型,该模型作为推理型大模型引起了业内巨大的轰动。 这背后来自于Deep Seek的快速技术积累和迭代,2024 年 8 月,DeepSeek发表了一篇论文,描述了它创建的一种新型负载均衡器,用于将其混合专家 (MoE) 基础模型的元素相互链接。2024年12月,该公司发布了其 DeepSeek-V3 基础模型的架构细节,该模型涵盖 6710 亿个参数(对于生成的任何给定tokens,仅激活 370 亿个参数)。这种模式使得其具备更低的运营成本和不输于成本更高的大模型的指标表现。之后R1推理型大模型的公布更是引起了业内的巨大震动,创始人梁文峰更是成为总理主持的座谈会的嘉宾。

面对外界,尤其是西方媒体的各种震惊,梁文峰曾经回复“中国AI不可能永远跟随。”希望深度求索可以带来越来越多的优秀AI技术,中国AI界也可以做大做强,为中国经济和民生添砖加瓦!

相关内容

从滨海湾到植物园:新加坡旅...
一座城市的魅力,往往体现在它能够为不同类型的游客提供多样化的选择。...
2025-08-28 00:45:27
阿森纳晒埃泽酋长球场亮相视...
阿森纳晒埃泽酋长球场亮相视频:完美的欢迎
2025-08-28 00:42:50
原创 ...
引言 历览前贤国与家,成由勤俭破由奢。何须琥珀方为枕,岂得珍珠始是...
2025-08-28 00:35:20
原创 ...
在我国南海北部湾,有三个由海水泥沙冲击形成的冲积岛。 最南边靠近海...
2025-08-28 00:34:46
原创 ...
有些电视剧里面会出现那种打更人,在夜晚的特定时间点敲打木梆子,告诉...
2025-08-28 00:34:36
《三国志·战棋版》PK5官...
哈喽大家好啊,夺宝奇谋玩法已经进入了倒计时,马上就要迎来PK5官渡...
2025-08-28 00:34:29
原创 ...
这位将军是人民武装中大名鼎鼎的“三星少将”,他先后3次被授予少将军...
2025-08-28 00:34:28
原创 ...
人之所以迷信,只是由于恐惧;人之所以恐惧,只是由于无知。——霍尔巴...
2025-08-28 00:34:17

热门资讯

美俄代表每天沟通,美乌团队周末... 【环球时报驻俄罗斯特派记者 肖新新 环球时报驻美国特约记者 李致】路透社26日称,美国总统特朗普在白...
19所广东院校教师来榕研修 日前,来自广东机电职业技术学院等19所广东院校的40余名教师来榕,开展数智商贸背景下“会展新媒体营销...
解决急难愁盼事 清风正气在身边 二十大以来,福州市监察机关共查处群众身边不正之风和腐败问题5947件解决急难愁盼事 清风正气在身边2...
菲妄想打“台湾牌”换中国在南海... 【环球时报综合报道】“菲律宾正在缓慢且非官方地将台湾纳入本国及地区的防务架构中。”《日本时报》25日...
从“票房神话”到被网友玩梗,吴... 搜狐娱乐专稿(李小狼/文)“吴京”正在互联网上被大规模解构。 几年前,他是阳刚硬汉代表,2025年8...
福州:优化营商环境工作专题询问... 27日下午,市人大常委会会议对优化营商环境工作开展专题询问。会上,市人大常委会组成人员及与会人大代表...
记者:如果阿莱克斯离队,勒沃库... 直播吧8月28日讯 据德天空记者普莱腾贝格报道称,勒沃库森有意费耶诺德中场昆滕-廷伯接替阿莱克斯-加...
场边视角看帕利尼亚对阵曼城的进... 场边视角看帕利尼亚对阵曼城的进球
如何评价?C罗球迷在球场外拍摄... 如何评价?C罗球迷在球场外拍摄辱骂梅西的视频