UC伯克利给四足机器人加Buff：瞬间适应各种真实地形，抹了油的地面也能hold住

丰色 2021-07-11 13:35:04 来源：量子位

让它们在各种地形上行走平稳没有你想象的那么容易。

随着四足机器人的应用越来越成功，它们面对的场景也会越来越多：

今天爬楼梯，明天过草地，后天又去坑坑洼洼的石子地……

这么复杂多变的地形它们可hold不住，分分钟给你表演个人仰马翻。

不过现在，来自UC伯克利、卡内基梅隆大学以及Facebook AI的研究人员发明了一种新算法：

不需要任何参考轨迹，无需微调直接部署在机器人身上——

就能让它们在瞬间适应各种复杂的新地形，一步都不带“走神”地穿过乱石、沙滩、楼梯、长植被、人为搭建的活动板等环境。

在滴了油的垫子上也是健步如飞、突然被负重5公斤也没事！

这个对于人类来说非常简单的技能，机器人现在也拥有了……

就问你厉不厉害（怕不怕）？

ps.眼尖的朋友应该能看出来，这个项目用的机器人就是咱国产的A1，来自杭州的Unitree。

如何做到的？

这个算法被命名为RMA（Rapid Motor Adaptation，快速电机自适应）。

由两部分组成：基本策略模块 (base policy, π)和自适应模块 (adaptation module, ϕ)。

算法完全在仿真环境中训练，然后直接部署于现实世界。

训练分为两个阶段。

第一阶段，将机器人当前状态、先前的动作、环境因素作为输入，使用model-free的强化学习进行基本策略训练。

第二阶段，采用on-policy数据的监督学习，训练自适应模块通过历史状态和动作来预测外部参数（extrinsics），也就是该怎么下脚。

部署阶段，自适应模块生成外部参数，基本策略模块生成所需的关节位置，并使用A1机器人的PD控制器转换为扭矩。

总的来说，基本策略模块探测环境，并实际控制机器人的步态。

自适应模块负责分析基本策略给的数据，并加以分析，然后告诉基本模块如何调整步态。

两者协同工作以便在多样化的环境中实现实时适应。

需要注意的是，该算法没有视觉输入！环境因素由机器人运动部件“感觉到”的力收集而来。

室内和室外测试

又到了评估性能的时刻，室内测试中，将三者：RMA、A1机器人本身的控制器、没有自适应模块的RMA进行了比较。

结果发现，RMA以100%的成功率走下15cm高度的台阶，并以80%的成功率走过可变形表面（记忆泡沫床垫和微微不平整的泡沫垫）。

它也能够成功爬上斜坡和台阶。

在油性表面上行走的成功为90%。

而A1的控制器在不平整的泡沫上就只有20%的成功率。

没有自适应模块的RMA就基本啥也不行了。

最下面的三张图表还说明了三种方法的有效载荷限制：

A1控制器的性能在8Kg载荷下开始下降。

没有自适应模块的RMA承载超过8Kg后就没法移动，不过倒是不会跌倒。

而RMA则在负重、保持平衡与行走距离上碾压前两者。

A1机器人的本身重量为12Kg。

而在室外：RMA在沙子、泥堆、高大植被上行走或穿越灌木的成功率为100%（不会被草缠脚）。

而在乱石堆上行走时成功率为80%。

在铺满了枯枝败叶的自然阶梯上的成功率为70%。

最后，研究人员表示，要开发出真正可靠的地形自适应机器人，现在的这个“盲人”机器人的装备还远远不够，还需配上视觉传感器等工具。这也是他们未来工作的一个重要方向。

论文地址：
https://arxiv.org/abs/2107.04034

看大量实验效果请戳：

https://ashish-kmr.github.io/rma-legged-robots/

CMU UC伯克利四足机器人

丰色

UC伯克利给四足机器人加Buff：瞬间适应各种真实地形，抹了油的地面也能hold住

如何做到的？

室内和室外测试

相关阅读

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

SFT并非必需！推理模型仅靠RL就能获得长思维链能力，清华CMU团队破解黑盒

仿生机器人大咖谈现状：说iPhone时刻有点早，诺基亚时刻刚刚好

纯文本输入，就能绘制精美数学图表：CMU绘图工具Penrose登GitHub热榜 | SIGGRAPH

格物钛携手UC伯克利举办自动驾驶预测模型挑战赛，CVPR揭晓结果

127k引用数的AI大牛创业：为机器人造大脑！OpenAI红杉排队塞钱

热门文章

你的衰老速度被科学家拍出来了| Nature子刊

谢赛宁团队新作：不用提示词精准实现3D画面控制

MoE那么大，几段代码就能稳稳推理 | 开源

硅谷的企业级AI正在这样赚钱｜2025人工智能现状报告

DeepSeek-R2！？神秘模型惊现竞技场，真实身份引网友猜测