具身智能大讲堂获悉,近日,美国具身智能公司Generalist AI完成4亿美元融资,投后估值20亿美元,累计融资超5亿美元。Radical Ventures领投,8VC、Union Square Ventures、Hanabi Capital、Norwest等机构首次入局,英伟达旗下NVentures、Bezos Expeditions等老股东跟投。袁征、林斌、李飞飞、Naval Ravikant等个人投资者也在这一轮现身。
创始团队来自Google DeepMind和波士顿动力。CEO Pete Florence曾任Google DeepMind高级研究科学家,CTO Andrew Barry来自波士顿动力,首席科学家Andy Zeng同样出身Google DeepMind。这个配置在业内不稀奇,但他们选的研发方向,从一开始就跟大多数同行不一样。
PART 01
语言模型的缩放定律能复用到机器人身上吗?
2025年11月,Generalist AI推出第一代模型GEN-0。这一代模型的价值不在产品本身,而在于验证了一件事:语言模型领域的缩放定律——数据越大、模型越大、性能越强——能不能用在机器人训练上。
机器人领域长期依赖真机采集数据,数据获取成本高、规模扩展难,缩放定律是否成立一直没有答案。GEN-0用海量现实世界通用数据完成预训练,给出了肯定的回答。这意味着机器人训练可以不完全依赖昂贵的真机数据,通用数据也能发挥作用。
2026年4月,GEN-1上线。这一代在商业化任务上的表现更具体:多项工业常用操作平均任务成功率达到99%,作业速度约为同期行业最优模型的3倍,箱体组装、手机封装等标准化工序耗时较前代SOTA方案缩短超六成。更关键的数字是:落地单类新任务,只需1小时机器人实测数据完成微调,而行业同类模型通常需要数十到上百小时专属真机数据。
如果这组数字站得住,机器人商业化部署的数据成本门槛就被大幅压低了。工厂端推广机器人,最头疼的就是每换一个新任务,就要重新采集大量数据、重新训练,成本和周期都耗不起。Generalist AI用小样本微调压缩了这个过程,这对规模化落地有直接意义。
PART 02
为什么不谈VLA和世界模型?
具身智能赛道当前有两条主流技术路线:VLA(视觉-语言-动作)和世界模型。前者以多模态感知驱动动作生成为核心,后者侧重构建对物理世界的预测能力。围绕哪条路线更有前途,行业内争论不断。
Generalist AI的态度很明确:不参与这场争论。官方表示,GEN-1既不属于传统VLA体系,也非通用世界模型,是从物理交互数据集从零训练、以实体环境交互为核心的专用基座模型。公司管理层说得更直接:VLA也好,世界模型也好,都只是工具,讨论架构分类没有实质意义,唯一重要的是机器人能不能在真实工况下,以高成功率、低成本完成有商业价值的任务。
这个立场是一种主动切割。具身智能赛道的融资叙事,很大程度上建立在技术框架的差异化上。Generalist AI选择用落地数据说话,是在用另一套语言参与竞争,也是把自己的评价维度从技术路线之争,转移到商业化结果的比拼。
对工厂客户来说,机器人能不能完成任务、成本高不高,比背后用了哪个技术框架重要得多。Generalist AI的产品逻辑,至少在叙事上对准了客户真正关心的问题。但这种策略也有风险:一旦落地数据不及预期,就没有技术叙事可以兜底。
PART 03
50万小时通用数据能换来什么?
GEN-1的训练策略是:预训练阶段用50万小时无机器人本体的通用真实世界数据打底,数据体量是GEN-0的两倍,不接入任何机器人真机数据;预训练完成后,针对新任务只需1小时真机数据即可完成对齐。
这个逻辑是把通用物理世界的理解能力沉淀在预训练阶段,把任务特异性的适配压缩到微调阶段,从而让新任务的数据需求最小化。这条路在语言模型上跑通了,在物理世界里能否同样有效,目前还处于早期验证阶段。GEN-1的数据是一个信号,但距离大规模商业验证还有距离。
GEN-1在实测场景中具备动态调整能力,可以应对突发意外工况并自主修正动作方案。工厂生产线不是标准化实验室,设备偏差、物料摆放不规则、工况临时变化都是常态。机器人如果只能处理预设情况,实际部署价值就会大打折扣。这个能力对工厂非标环境的适配有直接意义。
Generalist AI的长期目标是"零样本物理AGI"——机器人无需任何微调数据,就能处理从未接触过的全新任务。这个愿景以现阶段的技术进展来看,距离真正落地还很遥远。但从GEN-0到GEN-1,微调所需数据量大幅压缩的进展,至少说明这条路径上存在可测量的迭代空间。
PART 04
英伟达和李飞飞为什么押注这家公司?
英伟达旗下NVentures的持续跟投,不只是财务回报的考量,更可能涉及计算资源的供给关系。具身智能的模型训练和推理对算力需求极高,英伟达在这一赛道广泛布局具身智能公司,一定程度上是在为自己的算力产品构建需求侧生态。
李飞飞的加入有另一层含义。作为ImageNet的主要推动者,她对大规模数据驱动视觉智能的发展路径有直接的学术贡献。此次作为天使投资人入局,是对Generalist AI数据优先策略的认可。袁征和林斌的参与,则更多指向产业应用端的资源网络。
Generalist AI表示,本轮资金将用于构建下一代模型、扩展物理数据引擎,以及扩充算力与训练基础设施。
具身智能整体仍处于从实验室走向工厂的过渡阶段。数据能不能规模化获取、模型性能能不能在多样化真实场景中稳定复现、商业化落地的速度能不能支撑当前估值——这些问题,4亿美元暂时还给不出答案。Generalist AI现在拿到的,是继续回答这些问题的资本和时间。