DeepSeek朝硅谷“开了一枪”
创始人
2025-01-27 09:24:53
0

《DeepSeek朝硅谷“开了一枪”》

DeepSeek的出现宛如一颗石子投入全球科技的湖泊,尤其像是朝着硅谷开了一枪。它带着创新的技术理念和强大的研发成果闯入人们视野。在人工智能竞争激烈的舞台上,DeepSeek展现出独特的算法优势、数据处理能力等。这一行为打破了硅谷长期在科技前沿领域看似主导的平静局面。它以自己的方式向世界宣告,在人工智能研发方面,非硅谷地区也能拥有极具竞争力的力量,刺激着全球科技格局朝着更多元化、更激烈竞争的方向发展。


DeepSeek代表了中国“硬核技术创新”的叙事,这些创业者和公司们,正在开启一个中国创新故事的新篇章。

文|张洋洋

几乎是一夜之间,“来自东方的神秘力量”又一次击中海外人士心脏。

近两日,国产AI黑马DeepSeek(深度求索)在全球科技界刷屏。新模型发布后的访问量激增,一度让DeepSeek闪崩,但问题在数分钟内得到解决。AI界上一次出现宕机情况,还是月之暗面的Kimi出圈爆火之时。

截至发稿,DeepSeek在美区苹果App Store的免费排行榜中飙升至第二,第一是ChatGPT。

▍与OpenAI“掰手腕”

DeepSeek本次“刷屏”,起因是1月20日其正式发布推理大模型DeepSeek-R1,该模型在数学、编程和推理等关键领域的表现,能与OpenAI的最强推理模型o1“掰手腕”,但其API调用成本却低了90%-95%。

DeepSeek-R1的惊艳表现,先是引发了海外市场的强烈关注。在美国,多位AI行业的资深专家和从业者盛赞DeepSeek-R1。

美国计算机科学家、萨姆·奥尔特曼的导师吴恩达在第55届世界经济论坛(冬季达沃斯)上点赞DeepSeek——“我对 DeepSeek 的进展印象深刻。我认为他们能够以非常经济的方式训练模型。他们最新发布的推理模型,非常出色……‘加油’!”。

微软CEO萨蒂亚·纳德拉也公开表示,“他们(DeepSeek)切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”纳德拉还强调,“我们必须非常、非常认真地对待中国的这些进展”。

DeepSeek成立于2023年5月,其背后是国内对冲基金巨头幻方量化。

2023年11月2日,DeeSeek推出首个模型DeepSeek Coder,该模型免费供商业使用且完全开源。2023年11月29日,DeepSeek LLM上线,其参数规模达到 67B,性能接近 GPT-4,同时还发布了该模型的聊天版本 DeepSeek Chat。

真正让Deepseek在AI界出圈的,是其在2024年5月开源的第二代MoE大模型DeepSeek-V2。该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的百分之一,DeepSeek由此被称作“价格屠夫”、“AI界的拼多多”。

随后的2024年下半年,这家公司还先后发布了DeepSeek R1-lite-preview和DeepSeek-V3。

到了2025年推出的R1模型,在数学能力测试中,该模型在MATH基准测试上达到了77.5%的准确率,与OpenAI的o1不相上下;在编程领域,R1在Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。

而这一切,是在不到600万美元的投入和2048块低性能的H800芯片的条件下完成的,训练时间仅用两个月。这种“四两拨千斤”的模式,颠覆了人们对OpenAI“大力出奇迹”式的固有认知,结果令全球侧目。

▍为何是DeepSeek?

在国内7家头部的大模型创业公司当中,DeepSeek可以说是最不显山不露水的一家。在各个大模型厂商早已开启买量,进行广告投放品牌营销时,据《科创板日报》记者了解,这家公司至今尚未有公关团队。

2023年4月,幻方量化宣布成立新组织,集中资源和力量,探索AGI的本质。当时幻方就表示,多年以来,公司坚持把营收的大部分投入人工智能领域,建设领先的AI硬件基础设施,进行大规模的研究,探索人类未知的奥秘。

如今来看,在这一年多时间里,DeepSeek的进展迅速。当下的AI战事进入中场,战况尤为激烈,为何是DeepSeek先让硅谷 “慌了神”?

近期,在微信朋友圈中,《科创板日报》记者注意到,不少AI领域的从业者和投资人,对此进行了分析讨论。除了技术实力本身,团队的创新理念和人才队伍,是业内人士认为DeeSeek能在群狼环伺的AI界杀出重围的主要原因。

幻方量化和DeepSeek创始人梁文锋,毕业于浙江大学信息与通信工程专业。业内口碑称,这是一位极致的80后技术理想主义者。创立幻方,梁文锋就在幕后潜心钻研技术,在DeepSeek时代,其依旧延续着低调作风,和一线研究员一样,每天“看论文,写代码,参与小组讨论”。

“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”在接受《暗涌》的采访中,梁文锋说。

DeepSeek的招聘公告中,赫然写着“顶尖人才招聘”。公开信息显示,目前的DeepSeek团队,集结了一批国内名校毕业的高密度年轻人才,其中不乏应届生、实习生。在这里,工作经验不再是衡量人才的唯一标准。DeepSeek的HR在社交媒体平台表示,“着重考察人选素质和对大模型的热爱”。

只要员工的技术提案有潜力,他们所需算力和资源都能得到充分满足。在大模型领域,算力是稀缺的资源,DeepSeek则是“万卡GPU训练集群,无需申请,不限使用”。

对于这些人才,多名熟悉DeepSeek的AI业内人士也反馈,给出的薪酬极具竞争力。

“投身于探索 AGI 的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题”,这是DeepSeek官方微信号写下的简介。某种程度上,DeepSeek代表了中国“硬核技术创新”的叙事。可喜的是,DeepSeek并非孤例。

前不久,宇树科技发布了一段最新机器狗产品B2-W的演示视频,视频中B2-W机器狗展现了一系列高难度动作,这引来马斯克点赞转发评论,火爆全网。

几乎是在一同期,黄仁勋的英伟达中国年会之行中,宇树科技CEO王兴兴受邀参与,一行人当中,还有银河通用创始人兼CTO王鹤、深涌智能Emerging AI创始人黄可铖等。

以这些硬核技术的创业者和公司为代表,他们正在开启一个中国创新故事的新篇章。

相关内容

智元机器人拟“入主”上纬新...
7月8日晚,上纬新材发布公告称,智元机器人拟通过公司及核心团队共同...
2025-07-09 08:40:22
两岸足球小将在榕以球会友
在榕城的绿茵场上,两岸足球小将们以球会友,展现出别样的风采。他们身...
2025-07-09 08:39:16
福州市创新创业大赛复赛名单...
近日,备受瞩目的福州市创新创业大赛复赛名单正式揭晓,令人振奋的是,...
2025-07-09 08:38:34
“中国体育彩票杯”中国·嘉...
7月5日至6日, “中国体育彩票杯”中国・嘉峪关第十六届国际铁人三...
2025-07-09 08:37:20
引入无人机智能巡查系统 罗...
在罗源的矿山监管领域,如今迎来了智慧“千里眼”——无人机智能巡查系...
2025-07-09 08:36:30
原创 ...
众所周知,美国的地理位置优越,大多数地区处于亚热带以及温带季风气候...
2025-07-09 08:34:11
原创 ...
引言 邓小平生前的好战友不多,除了周恩来、刘伯承之外,当之无愧的就...
2025-07-09 08:34:00
原创 ...
长枪是最主要的冷战兵器之一,综合威力大,是“十八般武器”之一,“四...
2025-07-09 08:33:39
原创 ...
在1949年爆发的金门战役中,我军遭遇了惨败,九千多人都牺牲在了战...
2025-07-09 08:33:39

热门资讯

尹锡悦将被押往看守所 近日,关于尹锡悦将被押往看守所的消息引发广泛关注。尹锡悦此前的一系列行为引发了民众的强烈不满与质疑,...
半场:昆明城星0-0成都蓉城B... 北京时间7月1日中国足球乙级联赛 预赛阶段 第17轮,昆明城星主场对阵成都蓉城B队。半场战罢,场上比...
原创 洪... 据环球时报报道,代理行使总理职权的泰国副总理兼交通部长素里亚·庄龙琅集3日率领改组后的新内阁成员向泰...
广东铭途1-0武汉三镇B队,朱... 北京时间7月1日中国足球乙级联赛 预赛阶段 第17轮,广东铭途主场对阵武汉三镇B队。广东铭途朱信宇破...
原创 钟... 263年,司马昭派兵伐蜀,邓艾偷渡阴平,灭亡了蜀汉,立下盖世奇功。 魏国皇帝下诏,封邓艾为太尉,封主...
追梦,鹿晗在演唱会上用大屏讲述... 6月29日,前国脚荣昊在社交媒体上晒出了自己现场观看鹿晗演唱会的一些瞬间,其中鹿晗在现场用大屏短片的...
杨维林任公安部副部长,武增任司... 近日,人事变动引人瞩目。杨维林被任命为公安部副部长,他凭借丰富的公安工作经验和卓越的领导能力,将为公...
原创 特... 据金融时报报道,特朗普计划年内访华,中方回应持开放态度。此事引发多方关注。美国总统特朗普团队近期多次...
专访 | 李艳阳:从盛装舞步看... 在马术运动的绚丽版图中,盛装舞步以其独特的优雅与精湛技艺,成为无数马术爱好者心中的至臻追求。自 19...