迪士尼机器人「摔跤」也内卷:不仅要摔得轻,还要摔得帅!AI新研究把Bug玩成绝活
创始人
2025-12-23 00:55:02
0

机器人摔倒是个大难题,尤其是“头重脚轻”的机器人,一不小心就可能造成昂贵的损伤。过去,为了防止摔倒,工程师们要么限制其性能,让它畏首畏尾;要么任其“硬着陆”。这些方法都治标不治本。

但是,如果换个思路呢?

与其想尽办法避免摔倒,不如把“摔倒”本身,变成一门可以学习和控制的艺术。

就在最近,来自迪士尼研究院(Disney Research)的一项最新研究,彻底颠覆了我们对机器人摔倒的认知。他们提出了一种名为“机器人速成班:学习柔软且风格化的摔倒”(Robot Crash Course: Learning Soft and Stylized Falling)的全新方法。

这项研究的核心思想是:让机器人不仅能摔得“软”,最大限度减少冲击和损伤,还能摔得“帅”,在倒地后摆出一个用户指定的、充满艺术感的姿势。

想象一下,一个机器人在舞台上出现失误,它没有僵硬地倒下,而是顺势一个翻滚,最后以一个帅气的卧倒姿势结束,不仅没出糗,反而秀了一波操作。这简直是把Bug玩成了绝活!

这项研究成果,不仅能让机器人在娱乐、影视等行业大放异彩,更能为机器人的安全和快速恢复提供全新的解决方案。一个能控制自己摔倒姿势的机器人,可以选择一个最容易站起来的姿势倒下,大大缩短了“宕机”时间。

那么,迪士尼的科学家们究竟是如何教会机器人这项“摔跤神功”的呢?

▍“摔跤”的艺术:如何让机器人摔得又软又帅?

这项技术的灵魂,在于一个精心设计的强化学习(Reinforcement Learning)框架。简单来说,就是让AI在模拟环境中不断地“摔跤”,并通过一个复杂的“奖励函数”来引导它学习。

这个奖励函数就像一位严厉又贴心的教练,它同时关注两个核心目标:冲击最小化和姿态跟踪。

首先,是“软着陆”的目标。 为了让机器人摔得轻,研究人员在奖励函数中设置了惩罚项。机器人身体的任何部分与地面发生碰撞,只要产生的接触力过大,AI就会被扣分。不仅如此,为了保护那些“娇贵”的核心部件,研究人员还引入了“身体部位敏感度权重”。

比如,他们可以设定头部的敏感度权重是4.0,肩膀是3.0,而相对皮实的腿部是1.0。这样一来,AI在训练中就会学到一个至关重要的原则:“摔哪都行,就是别摔到头!” 它会下意识地用手臂、身体等其他部位来缓冲,保护好最关键的部分。

其次,是“风格化”的目标。 这部分的目标是让机器人最终能停在用户指定的姿势上。在训练中,AI会得到一个目标结束姿势(end pose),它的任务就是在摔倒的最后,让自己的身体姿态尽可能地接近这个目标。无论是躺着、趴着,还是侧卧着,只要你敢想,AI就敢学。

当然,这两个目标有时是相互冲突的。又要摔得轻,又要姿势帅,怎么平衡?

迪士尼的研究人员设计了一个巧妙的时间调制机制。在摔倒的初始阶段,奖励函数会优先考虑冲击最小化,让机器人集中精力“保命”。随着机器人逐渐稳定下来,姿态跟踪的权重会慢慢增加,引导机器人平滑地过渡到最终的造型。整个过程一气呵成,既安全又优雅。

这个过程就像武术中的“受身”或柔道中的“UKEMI”技术,不是被动地摔倒,而是主动地利用滚动和身体姿态来化解冲击力。只不过,机器人学会这一切,完全是通过AI自我探索和学习完成的。

▍海量姿势从哪来?物理引擎“摔”出大数据

要训练一个能适应各种摔倒情况和目标姿势的通用模型,一个巨大的、多样化的数据集是必不可少的。如果让艺术家或工程师手动设计成千上万个摔倒姿势,那简直是天方夜谭。

于是,研究团队想出了一个绝妙的办法:让物理引擎自己“摔”出大数据!

他们利用了NVIDIA的 Isaac Sim 物理仿真平台,这个平台可以利用GPU进行大规模并行仿真,效率极高。具体步骤是这样的:

1.随机生成姿态:在机器人的关节限制范围内,随机生成大量的身体姿态,并剔除那些会自我碰撞的无效姿态。

2.模拟“自由落体”:将这些随机姿态的机器人从一个很低的高度(比如4厘米)释放,并锁定其关节(即给予高增益的PD控制)。

3.记录稳定姿态:让机器人在仿真环境中自由翻滚、碰撞,直到它最终静止下来。这个最终的、物理上稳定的姿态,就被记录下来,作为一个合格的“目标结束姿势”。

通过这种方式,他们可以高效地生成数以万计的、符合物理规律的、静态稳定的摔倒姿势。为了确保数据集的多样性,他们还设计了一种机制来避免某些姿势(比如仰面朝天)被过度采样,从而保证了训练数据的全面性。

这个基于物理仿真的采样策略,是整个研究能够成功的关键之一。它不仅解决了数据来源的难题,更保证了AI学习到的目标姿势在现实世界中是“可行”“稳定”的。有了这个庞大的姿势库,AI就能学会从任何初始摔倒状态,过渡到任何一个它见过的、或没见过的目标姿势,展现出惊人的泛化能力。

实验数据也证明了这一点。当研究人员只用10个艺术家设计的姿势来训练模型时,模型虽然能很好地复现这10个姿势,但对于新的、未见过的姿势就表现很差。而使用了大规模生成数据集训练的模型,则无论是在已见还是未见的姿势上,都表现出了强大的泛化性能和鲁棒性。

▍从仿真到现实:真机实测效果炸裂

在仿真环境中表现出色,只是成功的一半。真正的考验在于,这个在虚拟世界里练就“摔跤神功”的AI,能否在现实世界的真实机器人上复现出来?这就是所谓的 Sim-to-Real 挑战。

研究团队在一个定制的、高0.84米、重16.2公斤的双足机器人上进行了实地测试。他们从艺术家设计的10个极具表现力的姿势中选择目标,然后用棍子等工具从不同方向推搡机器人,模拟各种突发的、不可预料的摔倒情况。

结果令人惊叹!

与传统的“零力矩”(瘫软)、“低增益”(阻尼)或“高增益”(僵硬)摔倒方式相比,搭载了新算法的机器人表现出了无与伦比的控制力。从上图的仿真对比数据可以看出,新方法产生的最大冲击力和平均冲击力,相比其他方法都实现了断崖式的下降,并且方差极小,意味着每次摔倒都非常稳定可控。

在真实世界的实验中,机器人面对外部推力,不再是直挺挺地倒下。它会迅速判断情况,调整四肢,用一种流畅、可控的方式接触地面,并在倒地后稳稳地停在预设的艺术造型上。

整个过程,机器人仿佛一个专业的特技演员,将一次潜在的“事故”变成了一场精彩的“表演”。更重要的是,在全部的真实世界实验中,机器人毫发无伤,所有功能完好如初。 这充分证明了该方法的有效性和实用性。

这项研究虽然目前还存在一些待完善之处,比如需要一个独立的机制来判断“何时应该启动摔倒策略”,或者如何与摔倒后的“恢复站立”策略无缝衔接。但它无疑为机器人领域开辟了一个全新的方向。

未来,这项技术不仅可以用于娱乐行业的特技机器人,让它们上演各种高难度、夸张的动作;也可以用于工业、救援等领域的机器人,让它们在崎岖地形中即使不慎摔倒,也能最大程度地自我保护,并快速恢复工作。

或许在不久的将来,当机器人再次摔倒在我们面前时,我们看到的将不再是笨拙和狼狈,而是一场充满力量与美的“可控表演”。

相关内容

喊你最有劲的朋友来跳 高尔...
喊你最有劲的朋友来跳 高尔夫瘾犯了来跳高尔夫舞
2026-06-28 02:08:10
一个月内三位东盟国家重要领...
应中国共产党邀请,柬埔寨人民党主席、参议院主席洪森于6月25日至2...
2026-06-28 02:07:49
原创 ...
作者:香克斯 生活里很多人遭遇当众呵斥、当众翻脸、当众大吼大叫,总...
2026-06-28 02:07:36
当“FE遇见黄浦”,从新款...
2026FE电动方程式上海站将于7月4日至5日在上海国际赛车场举行...
2026-06-28 02:07:27
GEN 4赛车亚洲首秀落地...
距离FE电动方程式上海站开赛还有一周,FE电动方程式携手上海黄浦在...
2026-06-28 02:07:05
原创 ...
今日!CCTV5直播世界杯,CCTV16中超大连英博VS申花,网络...
2026-06-28 02:06:47
【对外交流】我市与叶卡捷琳...
今年是中俄战略协作伙伴关系建立30周年、《中俄睦邻友好合作条约》签...
2026-06-28 02:06:46

热门资讯

原创 陈... 1948年11月,淮海战役正如火如荼地进行,国民党“确保淮海”的计划已经宣告彻底失败,几十万兵力被困...
著名考古学家白云翔逝世,曾主持... 5月8日,中国社会科学院考古研究所发布讣告:中国社会科学院考古研究所研究员、著名考古学家白云翔先生,...
原创 伊... 河南洛阳西北,新安县磁涧镇的老井岭上,有一座明代王陵。 没有牌坊,没有石像生列队,神道两侧只剩两通残...
原创 苏... 丢失的领土,还能要回来吗? 如果说近代历史上哪个国家趁火打劫、讹诈、抢占中国领土最多,那绝对非北...
原创 诸... 公元201年,命运多舛、漂泊无依的刘备暂时投靠了荆州军阀刘表。刘表待人宽厚,并未因刘备落魄而轻视他,...
原创 浅... 春秋战国时期,群雄逐鹿、百家争鸣,是一个风云变幻的时代,也是一个旧有体制逐渐崩溃、新秩序逐步崛起的时...
原创 隋... 程咬金(589年—665年),字义贞,原名咬金,后改名知节,山东济州斑鸠集人(今东阿西南斑鸠店)。他...
他是皇帝的老师,培养了袁崇焕,... 1638年十一月,河北高阳,76岁的孙承宗率领全家老少登上城头,与攻城的清军血战,城破之后自缢殉国。...
南洋银信:《给阿嬷的情书》中的... 南洋银信既是跨越山海的汇款与家书,也是联结海外华侨与原乡社会的重要情感纽带。作为珍贵的历史遗存,它们...
原创 惊... 在许多关于俄乌冲突的讨论中,北约东扩几乎成了一个反复被引用的万能解释。这个叙事向我们传达的信息是:正...