10万月薪招人,百亿大佬进军大模型
创始人
2024-06-20 09:49:26
0

文/何己派编辑/鄢子为

大模型赛道,来了一位踢馆选手。

5月以来,字节、阿里、百度等大厂,打起价格战,不约而同地调整大模型价格。

追溯这轮大战的源头,人们发现了一家非典型参赛选手,深度求索(DeepSeek)。

这家公司在5月初发布最新模型,不仅开源,还将API价格降到GPT-4 Turbo的1%,震惊业界。

其操盘手,正是金融大佬梁文锋。

企查查显示,他创办并实控的幻方量化投资管理公司,注册地在宁波,管理规模曾上千亿。去年,梁文锋团队孵化“深度求索”,探索AGI。

仅用一年时间,梁文锋另起的这座山头,已有AI小巨头之势。

单论算力,有市场分析指出,国内手握1万枚GPU的企业,仅6家,除了BAT、商汤、字节,就是幻方。

一场奇袭

梁文锋发动的这场奇袭,酝酿已久。

4月底,DeepSeek放出“良心价”,API付费服务1元/百万输入tokens,2元/百万输出tokens(32K上下文)。

作为对比,GPT-4 Turbo每百万tokens的输入/输出价格,分别为72元、217元。

这个价格,约莫等于瑞幸咖啡大杀四方的9.9元。

低价造势,后脚立马上线新模型。

5月初,第二代MoE大模型DeepSeek-V2发布,官方称,历时4个月钻研,能力媲美GPT4。

“中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队。”DeepSeek表示。

AI开发者,非常关注DeepSeek-V2的发布。

其做了模型结构创新。没有沿用业界主流的“类LLaMA的Dense结构”和“类Mistral的Sparse结构”,而是提出MLA架构,并用了自研Sparse结构DeepSeekMoE。

由此,大幅减少计算量和推理显存。

同时,新模型继续延续一贯开源的路子,技术报告、模型权重、vllm推理代码,通通开源。

一位AI从业者兴奋地表示,原本手里好几组数据处理任务,堆了1个多月没跑,“GPT-4贵上天,3.5水平不够,DeepSeek-V2发布之后,连夜全跑完了,不到一百块钱,效果爆炸。”

卷到这个价格,公司还有得赚。

深度求索内部员工透露,按目前的价格,不亏本,利润率超50%,不是套壳,也不是出于价格战目的,“不用担心模型断更,也不用担心API涨价。”

她提到,公司没有开源小模型的计划,只有更大。

当下,梁文锋对新的AI生意,积极招兵买马。

《21CBR》记者注意到,深度求索释放了多个招聘计划,待遇丰厚。

其对深度学习研究员,开出最高11万元月薪,实习生的日薪,至高1000元/天。

不缺子弹

看上去,这是个横插一脚的生面孔,但梁文锋对AI,早已隐秘布局多年。

他本硕就读于浙江大学,攻读人工智能,念书时就笃定“AI定会改变世界”。

“创始人,是我坚信的、国内最适合技术驱动型创业的人。”上述深度求索员工评价道。

毕业后,梁文锋没有走程序员的既定路线,而是在成都的出租屋里“折腾”了几年,下场做量化投资。

他没有放下对AI的执念。

公司主要班底里,很多成员做人工智能出身,早在2008年就开始尝试应用AI工具做量化投资,2018年把AI定为公司主要发展方向。幻方称自己是一家完全靠AI来做投资的量化公司。

在量化私募这条赛道上,梁文锋做得顺风顺水,管理规模一度破千亿大关。

去年,“一私募基金员工捐款1.38亿”的消息刷屏。这位化名“一只平凡的小猪”的普通员工,疑为梁文锋本人。

这种财大气粗,也体现探索在AI上。

幻方是亚太地区第一批拿到A100显卡的公司,2021年就囤了1万张卡。

要知道,2023年大模型浪潮掀起,A100芯片一度炒到10万元/枚,还一芯难求。

在AI开发者眼里,这种行为是“钱多得慌囤卡,搞量化根本没必要用1万张A100,一百多个DGX node即可。”

1万张A100,刚好跨过AI大模型训练的算力门槛。

2019至2021年,幻方相继建设了萤火一号”与“萤火二号”AI集群,这两个大项目的投资,加起来就有12亿元。

“幻方作为出资人之一,有充足的研发预算,另外每年有几个亿的捐款预算,之前都是给公益机构,如果需要,也可以做些调整。”梁文锋谈及AI的研究经费。

他尽全力打出“子弹”,称“创新就是昂贵且低效的,有时候伴随着浪费。”

去年末,有消息曝出,深度求索进行装修招标,装修工程面积达到1950平方米,相当于20个标准网球场或2个标准足球场大小。

据推测,这或是为布局算力集群做铺垫。

两块山头

梁文锋左手量化私募,右手人工智能,双赛道赛跑。

某种程度上,AI的技术深度,也深度关联私募业务的发展。

不同于传统私募机构,幻方量化整个投资框架,都是基于人工智能开发的,或者说用神经网络训练的基础模型来延展开发。

其在AI上的探索,一度带来争议。去年,深度求索成立后,外界质疑,幻方这是要“AI炒股”了?

“我们探索AGI不是用来炒股的,是做GPT相关的大模型,与金融无关。我们新成立了一个团队,相当于二次创业。”幻方量化CEO陆政哲很快否认。

从架构来看,未来AI和私募基金业务,分属同一实控人下的两家平行公司管理。

换言之,两块山头,平衡发展。

梁文锋的方向很明确,不做垂类和应用,做通用人工智能,即AGI的研究和探索。

据媒体报道,幻方对深度求索,有独立拆分上市计划,目前进程加快。

至于起家的私募主业,是稳定的“印钞机”。

据私募排排网的统计数据,截至2023年底,资产规模百亿的私募公司里,梁文锋实控的九章资产和宁波幻方量化,分别排第22、23位。

金融业务避免不了争议,尤其在行情不好的时候。

4个月前,市场爆出“多家头部量化私募大几千亿产品清盘”,幻方量化火速辟谣,称旗下没有产品清盘,也从未做过任何DMA杠杆交易。

放眼海内外量化私募,常年维持较高地位的极少,多数平均寿命只有5年。

梁文锋所求索的,或许不只AI的未来,还有主业长青的解药。

相关内容

中国人民银行行长潘功胜会见...
2026年3月23日,中国人民银行行长潘功胜会见来访的蒙古国中央银...
2026-03-24 22:55:29
美伊会谈真实性存疑,特朗普...
美伊双方的官员预计在本周末晚些时候在巴基斯坦进行会谈,依照现在各方...
2026-03-24 22:55:23
街边书店扎堆开,想赚钱别只...
街边书店扎堆开,如何破局经营?核心盈利点拆解 当一条街上出现了好几...
2026-03-24 22:54:21
药明康德绩后涨10%,净利...
继昨日回调后,今日(3.24)AH医药板块强势反攻,同类0.15%...
2026-03-24 22:50:11
宇树科技的资本版图曝光
文章综合自第一财经、公开查询、投行圈子。 人形机器人登陆资本市场迎...
2026-03-24 22:47:37
黄金暴跌180美元后反弹!...
来源:金十数据 黄金当前正遭遇一套典型但极为残酷的宏观组合冲击:美...
2026-03-24 22:44:41
我们的这五年|福州:万亿跨...
  福州:万亿跨越,幸福作答!
2026-03-24 22:43:31
央行明确释放适度宽松流动性...
2025年我国货币政策一直保持稳健基调,进入2026年,政策正式转...
2026-03-24 22:42:55
股息率最高7.79%!抗跌...
最新“抗跌”力量正浮出水面。 抗跌绩优股名单出炉 近段时间,在中东...
2026-03-24 22:40:50

热门资讯

国际油价暴跌,金价反弹 美国总统特朗普23日关于伊朗战事的言论缓解市场对中东军事冲突升级的担忧,国际油价当天暴跌,金价大幅反...
美国想4月9日结束战争?美以伊... 据以色列Ynet新闻网站当地时间3月23日报道,一名以色列官员表示,美国方面已将4月9日设定为结束对...
中国人民银行行长潘功胜会见蒙古... 2026年3月23日,中国人民银行行长潘功胜会见来访的蒙古国中央银行行长那仁朝格特。双方就两国经济金...
街边书店扎堆开,想赚钱别只卖书... 街边书店扎堆开,如何破局经营?核心盈利点拆解 当一条街上出现了好几家风格各不相同的书店,表面上看好像...
药明康德绩后涨10%,净利润翻... 继昨日回调后,今日(3.24)AH医药板块强势反攻,同类0.15%最低档费率的恒生生物科技ETF汇添...
宇树科技的资本版图曝光 文章综合自第一财经、公开查询、投行圈子。 人形机器人登陆资本市场迎来里程碑式突破,宇树科技IPO申请...
黄金暴跌180美元后反弹!三周... 来源:金十数据 黄金当前正遭遇一套典型但极为残酷的宏观组合冲击:美元走强、美债收益率攀升,以及中东战...
央行明确释放适度宽松流动性信号... 2025年我国货币政策一直保持稳健基调,进入2026年,政策正式转向适度宽松,调控重心亦从原来的资金...
股息率最高7.79%!抗跌绩优... 最新“抗跌”力量正浮出水面。 抗跌绩优股名单出炉 近段时间,在中东冲突升级的背景下,A股市场在内外因...
苹果CEO库克:不担心中国机器... (图片来源:摄图网) 3月22日,苹果CEO蒂姆·库克在接受媒体采访时表示,中国机器人行业发展令人印...