迪士尼机器人「摔跤」也内卷：不仅要摔得轻，还要摔得帅！AI新研究把Bug玩成绝活_文化

迪士尼机器人「摔跤」也内卷：不仅要摔得轻，还要摔得帅！AI新研究把Bug玩成绝活

创始人

2025-12-23 00:55:02

0次

机器人摔倒是个大难题，尤其是“头重脚轻”的机器人，一不小心就可能造成昂贵的损伤。过去，为了防止摔倒，工程师们要么限制其性能，让它畏首畏尾；要么任其“硬着陆”。这些方法都治标不治本。

但是，如果换个思路呢？

与其想尽办法避免摔倒，不如把“摔倒”本身，变成一门可以学习和控制的艺术。

就在最近，来自迪士尼研究院（Disney Research）的一项最新研究，彻底颠覆了我们对机器人摔倒的认知。他们提出了一种名为“机器人速成班：学习柔软且风格化的摔倒”（Robot Crash Course: Learning Soft and Stylized Falling）的全新方法。

这项研究的核心思想是：让机器人不仅能摔得“软”，最大限度减少冲击和损伤，还能摔得“帅”，在倒地后摆出一个用户指定的、充满艺术感的姿势。

想象一下，一个机器人在舞台上出现失误，它没有僵硬地倒下，而是顺势一个翻滚，最后以一个帅气的卧倒姿势结束，不仅没出糗，反而秀了一波操作。这简直是把Bug玩成了绝活！

这项研究成果，不仅能让机器人在娱乐、影视等行业大放异彩，更能为机器人的安全和快速恢复提供全新的解决方案。一个能控制自己摔倒姿势的机器人，可以选择一个最容易站起来的姿势倒下，大大缩短了“宕机”时间。

那么，迪士尼的科学家们究竟是如何教会机器人这项“摔跤神功”的呢？

▍“摔跤”的艺术：如何让机器人摔得又软又帅？

这项技术的灵魂，在于一个精心设计的强化学习（Reinforcement Learning）框架。简单来说，就是让AI在模拟环境中不断地“摔跤”，并通过一个复杂的“奖励函数”来引导它学习。

这个奖励函数就像一位严厉又贴心的教练，它同时关注两个核心目标：冲击最小化和姿态跟踪。

首先，是“软着陆”的目标。 为了让机器人摔得轻，研究人员在奖励函数中设置了惩罚项。机器人身体的任何部分与地面发生碰撞，只要产生的接触力过大，AI就会被扣分。不仅如此，为了保护那些“娇贵”的核心部件，研究人员还引入了“身体部位敏感度权重”。

比如，他们可以设定头部的敏感度权重是4.0，肩膀是3.0，而相对皮实的腿部是1.0。这样一来，AI在训练中就会学到一个至关重要的原则：“摔哪都行，就是别摔到头！” 它会下意识地用手臂、身体等其他部位来缓冲，保护好最关键的部分。

其次，是“风格化”的目标。 这部分的目标是让机器人最终能停在用户指定的姿势上。在训练中，AI会得到一个目标结束姿势（end pose），它的任务就是在摔倒的最后，让自己的身体姿态尽可能地接近这个目标。无论是躺着、趴着，还是侧卧着，只要你敢想，AI就敢学。

当然，这两个目标有时是相互冲突的。又要摔得轻，又要姿势帅，怎么平衡？

迪士尼的研究人员设计了一个巧妙的时间调制机制。在摔倒的初始阶段，奖励函数会优先考虑冲击最小化，让机器人集中精力“保命”。随着机器人逐渐稳定下来，姿态跟踪的权重会慢慢增加，引导机器人平滑地过渡到最终的造型。整个过程一气呵成，既安全又优雅。

这个过程就像武术中的“受身”或柔道中的“UKEMI”技术，不是被动地摔倒，而是主动地利用滚动和身体姿态来化解冲击力。只不过，机器人学会这一切，完全是通过AI自我探索和学习完成的。

▍海量姿势从哪来？物理引擎“摔”出大数据

要训练一个能适应各种摔倒情况和目标姿势的通用模型，一个巨大的、多样化的数据集是必不可少的。如果让艺术家或工程师手动设计成千上万个摔倒姿势，那简直是天方夜谭。

于是，研究团队想出了一个绝妙的办法：让物理引擎自己“摔”出大数据！

他们利用了NVIDIA的 Isaac Sim 物理仿真平台，这个平台可以利用GPU进行大规模并行仿真，效率极高。具体步骤是这样的：

1.随机生成姿态：在机器人的关节限制范围内，随机生成大量的身体姿态，并剔除那些会自我碰撞的无效姿态。

2.模拟“自由落体”：将这些随机姿态的机器人从一个很低的高度（比如4厘米）释放，并锁定其关节（即给予高增益的PD控制）。

3.记录稳定姿态：让机器人在仿真环境中自由翻滚、碰撞，直到它最终静止下来。这个最终的、物理上稳定的姿态，就被记录下来，作为一个合格的“目标结束姿势”。

通过这种方式，他们可以高效地生成数以万计的、符合物理规律的、静态稳定的摔倒姿势。为了确保数据集的多样性，他们还设计了一种机制来避免某些姿势（比如仰面朝天）被过度采样，从而保证了训练数据的全面性。

这个基于物理仿真的采样策略，是整个研究能够成功的关键之一。它不仅解决了数据来源的难题，更保证了AI学习到的目标姿势在现实世界中是“可行”和“稳定”的。有了这个庞大的姿势库，AI就能学会从任何初始摔倒状态，过渡到任何一个它见过的、或没见过的目标姿势，展现出惊人的泛化能力。

实验数据也证明了这一点。当研究人员只用10个艺术家设计的姿势来训练模型时，模型虽然能很好地复现这10个姿势，但对于新的、未见过的姿势就表现很差。而使用了大规模生成数据集训练的模型，则无论是在已见还是未见的姿势上，都表现出了强大的泛化性能和鲁棒性。

▍从仿真到现实：真机实测效果炸裂

在仿真环境中表现出色，只是成功的一半。真正的考验在于，这个在虚拟世界里练就“摔跤神功”的AI，能否在现实世界的真实机器人上复现出来？这就是所谓的 Sim-to-Real 挑战。

研究团队在一个定制的、高0.84米、重16.2公斤的双足机器人上进行了实地测试。他们从艺术家设计的10个极具表现力的姿势中选择目标，然后用棍子等工具从不同方向推搡机器人，模拟各种突发的、不可预料的摔倒情况。

结果令人惊叹！

与传统的“零力矩”（瘫软）、“低增益”（阻尼）或“高增益”（僵硬）摔倒方式相比，搭载了新算法的机器人表现出了无与伦比的控制力。从上图的仿真对比数据可以看出，新方法产生的最大冲击力和平均冲击力，相比其他方法都实现了断崖式的下降，并且方差极小，意味着每次摔倒都非常稳定可控。

在真实世界的实验中，机器人面对外部推力，不再是直挺挺地倒下。它会迅速判断情况，调整四肢，用一种流畅、可控的方式接触地面，并在倒地后稳稳地停在预设的艺术造型上。

整个过程，机器人仿佛一个专业的特技演员，将一次潜在的“事故”变成了一场精彩的“表演”。更重要的是，在全部的真实世界实验中，机器人毫发无伤，所有功能完好如初。 这充分证明了该方法的有效性和实用性。

这项研究虽然目前还存在一些待完善之处，比如需要一个独立的机制来判断“何时应该启动摔倒策略”，或者如何与摔倒后的“恢复站立”策略无缝衔接。但它无疑为机器人领域开辟了一个全新的方向。

未来，这项技术不仅可以用于娱乐行业的特技机器人，让它们上演各种高难度、夸张的动作；也可以用于工业、救援等领域的机器人，让它们在崎岖地形中即使不慎摔倒，也能最大程度地自我保护，并快速恢复工作。

或许在不久的将来，当机器人再次摔倒在我们面前时，我们看到的将不再是笨拙和狼狈，而是一场充满力量与美的“可控表演”。

绝活数据机器人 Bug 目标内卷姿态姿势摔跤研究物理

上一篇：原创此人曾是罗帅下属，授衔结果出来后找上级抱怨，罗帅说了一句话

下一篇：原创貂蝉容貌复原图曝光，专家说了六个字，字字应验

迪士尼机器人「摔跤」也内卷：不仅要摔得轻，还要摔得帅！AI新研究把Bug玩成绝活

相关内容

热门资讯