宇树机器人强化学习代码全面开源，训练到仿真和实操手把手教学

克雷西 2024-12-17 17:18:44 来源：量子位

支持G1、H1和H1-2三款机器人

克雷西发自凹非寺
量子位 | 公众号 QbitAI

9.9万元起，还能够大规模量产的国产人形机器人，表现得实在是太6了：

而且还走上了开源路线，就在刚刚，宇树机器人开源的强化学习代码又更新了！

更新之后不再是只能训练——不仅能够仿真运行，还能部署到实体机器，整个过程所有代码全部开放。

一开始，宇树开源的是英伟达Issac Gym平台上的训练代码，这次新增了对MuJoCo模拟仿真的支持。

而且还能迁移到实体机器人上运行，目前支持宇树的H1、H1-2和G1三款机器人。

这下从训练到模拟再到真机运行，整个RL套件的开源体系终于完整了。

看到这个消息，有网友激动地表示，训练机器人灵魂的方法终于公开了！

全过程代码公开，还有详细教程

宇树给这个项目取名叫RL GYM，可能和一开始专门提供基于Issac Gym的训练代码有关。

现在RL GYM又支持了MuJoCo，可以在预训练的基础上进行仿真模拟了。

训练阶段的Issac Gym需要CUDA，也就是需要N卡，仿真阶段的MuJoCo则支持各种GPU，甚至CPU和TPU也能运行。

从环境的安装配置，到训练和模拟，以及最后的真机迁移，不仅有代码，还有非常详细的手把手教程。

以最新款的G1为例，在Issac Gym里训练完之后的效果是这样的：

放到MuJoCo里模拟，就有了开头看到在这段DEMO：

最后迁移到G1真机，就能看到训练的效果了（并且真机迁移的部分还有中文教程）：

H1和H1-2也与此类似，另外通过RL GYM还可以在Issac Gym里训练机器狗Go2：

还有更多开源项目

在宇树的整个开源体系当中，RL GYM只是其中一环，在宇树所有的GitHub仓库中星标数排第三。

排第一的是针对开源机器人系统R(obot)OS推出的模拟包，包含了宇树系列机器人的质量、惯量、力矩等参数。

星标数第二的则是使用苹果Vision Pro对G1进行遥操作控制的仓库，可以用于数据采集。

采集到的数据是JSON形式，而训练通过LeRobot实现，因此宇树还提供了将JSON格式数据转为LeRobot所需格式的教程。

其中包含遥操作控制的代码教程，以及硬件配置图、物料清单和安装说明：

除了GitHub上发布的这些工具，宇树还在HuggingFace上公开了训练数据集，与数据采集工具同期发布。

数据集包含五种操作，使用配备有三指灵巧手的宇树G1人形机器人收集，每张图分辨率为640×480，每个手臂和灵巧手的状态和动作维度为7。

比如，利用这套数据集可以让机器人学习拧瓶盖倒水：

将三色积木叠放到一起：

此外还包括将摄像头放入相应包装盒、收集物品并存储、双臂抓取红色木块并将其放入一个黑色长方形容器中这些操作。

最后，宇树开源的也不只是和机器人相关的项目。

上个月宇树发布了售价419美元的激光雷达，在产品上线的同时就将其采用的Point-LIO算法进行了开源。

项目仓库：
https://github.com/unitreerobotics/unitree_rl_gym
参考链接：
https://x.com/unitreerobotics/status/1868664455024029773
https://x.com/UnitreeRobotics/status/1856986819038253396

宇树机器人

克雷西

装满智能体AI的手机，正在呼唤一个“Type-C时刻”2025-04-16
英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练2025-04-15
Llama 4遭竞技场背刺！实锤用特供版刷榜，2000+对战记录公开2025-04-08
“AI眼镜的终极功能，是AI+社交” | 对话影目科技创始人2025-04-07

宇树机器人强化学习代码全面开源，训练到仿真和实操手把手教学

克雷西发自凹非寺
量子位 | 公众号 QbitAI

全过程代码公开，还有详细教程

还有更多开源项目

相关阅读

朱松纯团队最新研究：机器人可与人类“推心置腹”！还说下一步要造“AI大白”

机器人也来玩“踢瓶盖挑战”了，你动他就动，靠脑电控制，路人也能玩丨MIT出品

谷歌AGI机器人大招！54人天团憋7个月，强泛化强推理，DeepMind和谷歌大脑合并后新成果

港科大具身机器人团队，连续获亿级融资

马斯克擎天柱机器人大秀走姿，背后大佬集体现身喊话招人

机器狗界变形金刚来了：“人”狗之间灵活切换，可用前肢开门取物，瑞士团队出品

热门文章

AI应用突围，中小企业的新周期已至

全球首个Linux开发本：50TOPS算力，DeepSeek都配好了，可随地大小开发

倒计时1周！20余位行业大佬共话AI，中国AIGC产业峰会最全攻略在此

「千匹马力」被比亚迪打成白菜价：最新汉唐21万起售，比小米SU 7Ultra更小米！兆瓦闪充高阶智驾都标配

SOTA自动绑骨开源框架来了！3D版DeepSeek开源月大礼包持续开箱ing

宇树机器人强化学习代码全面开源，训练到仿真和实操手把手教学

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI

全过程代码公开，还有详细教程

还有更多开源项目

相关阅读

朱松纯团队最新研究：机器人可与人类“推心置腹”！还说下一步要造“AI大白”

机器人也来玩“踢瓶盖挑战”了，你动他就动，靠脑电控制，路人也能玩丨MIT出品

谷歌AGI机器人大招！54人天团憋7个月，强泛化强推理，DeepMind和谷歌大脑合并后新成果

港科大具身机器人团队，连续获亿级融资

马斯克擎天柱机器人大秀走姿，背后大佬集体现身喊话招人

机器狗界变形金刚来了：“人”狗之间灵活切换，可用前肢开门取物，瑞士团队出品

热门文章

AI应用突围，中小企业的新周期已至

全球首个Linux开发本：50TOPS算力，DeepSeek都配好了，可随地大小开发

倒计时1周！20余位行业大佬共话AI，中国AIGC产业峰会最全攻略在此

「千匹马力」被比亚迪打成白菜价：最新汉唐21万起售，比小米SU 7Ultra更小米！兆瓦闪充高阶智驾都标配

SOTA自动绑骨开源框架来了！3D版DeepSeek开源月大礼包持续开箱ing

克雷西发自凹非寺
量子位 | 公众号 QbitAI