花最少的钱，训超6的机器人：谷歌大脑推出机器人强化学习平台，硬件代码全开源

鱼羊 2019-10-12 12:42:13 来源：量子位

鱼羊发自凹非寺

量子位报道 | 公众号 QbitAI

想要在现实世界的机器人身上探索强化学习（RL），并非易事。

首先，你得拥有类似这样的机器人平台：

而像这样的一只PR2，售价高达40万美元（约合人民币286万元）。

这就足以让很多刚刚起步，或者正想涉足RL/机器人学研究的小型实验室望而却步了。

不过现在，谷歌正在试图让这件事变得更简单，更便宜。

比如这样一只三指机器人：

价格仅3500美元（约合人民币2.5万元）。

还有这样一只四足机器人：

价格4200美元（约合人民币3万元）。

并且，还有相应的开源代码，和精心设计的基准测试作为配套。

这就是谷歌的ROBEL基准。这项研究登上了CoRL 2019。

ROBEL

ROBEL由两只机器人组成，适用于不同的强化学习研究任务。

三指手形机器人，名为D’Claw，擅长学习灵巧操作任务。

D’Claw执行任务的过程中有三种常见的操纵行为。

姿势，适应不同环境的形状。

旋转，将物体旋转到指定的角度。

以及拧紧。

四足机器人，名叫D’Kitty，是只小猫咪，擅长学习敏捷移动。

它的三种基准测试动作，是站立，定向和行走。

机器人的设计都基于现成的组件和常用的原型制作工具（3D打印或激光切割），模块化，易于组装，易于维护。

即使你对硬件并不在行，也仅需要几个小时的时间，就能构建完成。

ROBEL还为所有这些基准测试任务提供了模拟器，有助于研究人员进行算法开发和快速原型设计。

可复现，很鲁棒

听上去便宜好用的ROBEL，到底靠不靠谱呢？

迄今为止，谷歌已经对其进行了长达14000多个小时的训练。

实验证明，ROBEL能够胜任多种机器学习算法。

并且，两个不同的实验室分别对ROBEL进行了“试用”。仅使用ROBEL的设计文件和装配说明，两个实验室都成功复现了ROBEL的两个硬件平台。

两个实验室都对自己组装起来的ROBEL进行了基准任务测试。

两条训练曲线几乎重合。也就是说，在不同地点建造的两只机器人，不仅表现出了相似的训练进度，并且最终都收敛到了同一性能水准。

还真是便宜又好货啊。

传送门

博客地址：

https://ai.googleblog.com/2019/10/robel-robotics-benchmarks-for-learning.html

ROBEL项目地址：

https://sites.google.com/view/roboticsbenchmarks/platforms

论文地址：

https://arxiv.org/abs/1909.11639

机器人

鱼羊

花最少的钱，训超6的机器人：谷歌大脑推出机器人强化学习平台，硬件代码全开源

相关阅读

斯坦福团队新作：喊话就能指导机器人，任务成功率暴增，网友：特斯拉搞快点

AI机器人开始卷家务了，深圳创业果然务实

日本研发投篮机器人，隔半个球场都能百发百中，虐翻人类职业球员

表情最逼真机器人靠AIGC再进化！接入Stable Diffusion能用笔画画

李彦宏发起创立，又一个“机器人”曝光了

这款“咖啡机器人”落地超百家，开启猎户星空机械臂生态第一步

热门文章

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

联想百应智能体入选量子位“2025年值得关注的AIGC产品”：国内首个AI服务智能体打破中小企业AI落地困局

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比

DeepSeek引爆「万物皆可AI」时代，20余位大咖分析行业痛点，万字梳理干货在此