DeepSeek-R1模型震惊硅谷,美媒:制裁反而促进中国创新
创始人
2025-01-27 15:02:58
0

《DeepSeek - R1模型引发的震撼与思考》

DeepSeek - R1模型在人工智能领域崭露头角,震惊了硅谷。这一成果的出现,背后有着独特的意义。美国长期对中国进行技术制裁,试图遏制中国在科技领域的发展。然而事与愿违,美媒都不得不承认这种制裁反而促进了中国创新。在面临外部压力的情况下,中国科研人员和企业激发了更强的斗志,积极探索自主研发道路。DeepSeek - R1模型的成功就是一个有力的例证,它展示了中国在人工智能技术创新方面的巨大潜力,也表明外部制裁难以阻挡中国科技进步的坚定步伐。


【文/观察者网 陈思佳】这两天,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。这一成果引发全球科技行业高度关注,西方媒体也发文感叹“中国AI模型震惊硅谷”。

最新消息显示,DeepSeek已经登顶了中国和美国的苹果App Store应用商店,排名第一,将ChatGPT一举超越。对于一款中国大模型来说,能够在美国力压ChatGPT,是绝无仅有的历史性一刻。

据美国《华尔街日报》当地时间1月26日报道,DeepSeek-R1的出色表现已经给美国科技行业留下深刻印象,从业者纷纷称赞深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言,美国试图通过制裁限制中国的AI发展,但资源的限制反而激发了中国科研人员的创造力。

深度求索在1月20日发布了DeepSeek-R1模型,该公司表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,其性能比肩美国OpenAI o1正式版。

为促进技术社区的充分交流与创新协作,深度求索还公开了DeepSeek-R1训练技术。

DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比较 DeepSeek微信公众号

一些第三方测试结果也显示,DeepSeek-R1的表现足以匹敌美国顶尖AI模型。美国加州大学伯克利分校研究人员设立的聊天机器人竞技场(Chatbot Arena)平台上,DeepSeek-R1和去年12月发布的DeepSeek-V3的性能表现均位列前十。

不仅如此,DeepSeek的开发成本和使用的算力规模都远低于美国顶尖AI公司。先前发布的DeepSeek-V3在仅使用2048颗英伟达H800 GPU的情况下,完成了6710亿参数模型的训练,成本约为560万美元,这远低于其他顶级模型的训练成本。美媒指出,H800的算力要弱于英伟达H100等芯片,美国限制对华出口此类高性能芯片。

《华尔街日报》提到,作为对比,美国AI企业、Claude模型开发商Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)去年曾透露,该公司构建模型的成本约为1亿至10亿美元。

与其他一些顶尖大模型不同,DeepSeek-R1没有使用传统的监督微调(SFT)方法,而是专注于强化学习(RL),这意味着该模型跳过了使用人工标准数据训练的“模仿”环节。

英伟达高级研究科学家范麟熙(Jim Fan)称赞DeepSeek取得了突破,他在社交平台X上发文称,DeepSeek-R1完全由强化学习驱动,“这让人想起了AlphaZero,从零开始学习围棋、将棋和国际象棋,而不是先模仿人类大师的动作。这是论文中最重要的收获。”

DeepSeek-R1的表现引起美国科技行业的高度关注。硅谷风险投资家马克·安德森(Marc Andreessen)表示:“DeepSeek-R1是我见过的最令人惊叹,最令人印象深刻的突破之一。”

旧金山AI硬件公司Positron的联合创始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在讨论DeepSeek的开源模型,“这太酷了。”

一些美国企业也开始在工作中使用DeepSeek。硅谷一家创业公司的联合创始人安东尼·普奥(Anthony Poo)告诉《华尔街日报》,他们原先使用Claude模型预测财务回报,但现在已转向DeepSeek,两者性能相似,使用DeepSeek的成本仅为Claude的四分之一。

普奥说:“OpenAI的模型有着极佳的性能,但我们不想为我们不需要的能力付费。”

截至北京时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT。而就在昨天早上,DeepSeek还没有挤进榜单前五,显示出过去24小时发酵速度之快。在国区苹果App Store免费榜,DeepSeek也已登顶。

DeepSeek已在苹果App Store国区和美区免费榜登顶

近年来,美国在芯片等领域对中国实施出口限制,试图打压中国在AI等领域的发展,但深度求索依然能构建出匹敌美国顶尖科技公司的AI模型。OpenAI前高管扎克·卡斯直言,美国的限制未能阻止DeepSeek的进步,“这凸显了一个深刻的教训:资源限制反而能激发创造力。”

数字新闻杂志The Wire China发文称,DeepSeek-R1的发布将迫使怀疑论者重新评估中国的技术发展。深度求索对开源承诺的坚持也与OpenAI的专有策略形成鲜明对比,深度求索允许全球企业和开发者共同开发和改进技术,OpenAI则限制对其系统的访问以维护竞争优势。

该杂志指出,美国决策者应该反思,通过设置障碍来确保领先地位的方法是否还行得通。美国的出口管制促使中国加速实现技术的自给自足,中美在芯片等领域的技术差距正逐渐缩小,美国的制裁虽然具有破坏性,却可能反过来助推中国的创新能力。

文章写道,美国的出口管制不仅削弱了美国科技公司的收入,也导致全球半导体供应链变得愈发“支离破碎”,“美国越是专注于遏制对手而不解决自身的缺陷,就越有可能加速其领先地位的丧失。”

相关内容

智元机器人拟“入主”上纬新...
7月8日晚,上纬新材发布公告称,智元机器人拟通过公司及核心团队共同...
2025-07-09 08:40:22
两岸足球小将在榕以球会友
在榕城的绿茵场上,两岸足球小将们以球会友,展现出别样的风采。他们身...
2025-07-09 08:39:16
福州市创新创业大赛复赛名单...
近日,备受瞩目的福州市创新创业大赛复赛名单正式揭晓,令人振奋的是,...
2025-07-09 08:38:34
“中国体育彩票杯”中国·嘉...
7月5日至6日, “中国体育彩票杯”中国・嘉峪关第十六届国际铁人三...
2025-07-09 08:37:20
引入无人机智能巡查系统 罗...
在罗源的矿山监管领域,如今迎来了智慧“千里眼”——无人机智能巡查系...
2025-07-09 08:36:30
原创 ...
众所周知,美国的地理位置优越,大多数地区处于亚热带以及温带季风气候...
2025-07-09 08:34:11
原创 ...
引言 邓小平生前的好战友不多,除了周恩来、刘伯承之外,当之无愧的就...
2025-07-09 08:34:00
原创 ...
长枪是最主要的冷战兵器之一,综合威力大,是“十八般武器”之一,“四...
2025-07-09 08:33:39
原创 ...
在1949年爆发的金门战役中,我军遭遇了惨败,九千多人都牺牲在了战...
2025-07-09 08:33:39

热门资讯

尹锡悦将被押往看守所 近日,关于尹锡悦将被押往看守所的消息引发广泛关注。尹锡悦此前的一系列行为引发了民众的强烈不满与质疑,...
半场:昆明城星0-0成都蓉城B... 北京时间7月1日中国足球乙级联赛 预赛阶段 第17轮,昆明城星主场对阵成都蓉城B队。半场战罢,场上比...
原创 洪... 据环球时报报道,代理行使总理职权的泰国副总理兼交通部长素里亚·庄龙琅集3日率领改组后的新内阁成员向泰...
广东铭途1-0武汉三镇B队,朱... 北京时间7月1日中国足球乙级联赛 预赛阶段 第17轮,广东铭途主场对阵武汉三镇B队。广东铭途朱信宇破...
原创 钟... 263年,司马昭派兵伐蜀,邓艾偷渡阴平,灭亡了蜀汉,立下盖世奇功。 魏国皇帝下诏,封邓艾为太尉,封主...
追梦,鹿晗在演唱会上用大屏讲述... 6月29日,前国脚荣昊在社交媒体上晒出了自己现场观看鹿晗演唱会的一些瞬间,其中鹿晗在现场用大屏短片的...
杨维林任公安部副部长,武增任司... 近日,人事变动引人瞩目。杨维林被任命为公安部副部长,他凭借丰富的公安工作经验和卓越的领导能力,将为公...
原创 特... 据金融时报报道,特朗普计划年内访华,中方回应持开放态度。此事引发多方关注。美国总统特朗普团队近期多次...
专访 | 李艳阳:从盛装舞步看... 在马术运动的绚丽版图中,盛装舞步以其独特的优雅与精湛技艺,成为无数马术爱好者心中的至臻追求。自 19...