OpenAI 发布了一个程序化生成环境，可以评价智能体泛化技能学习

十三 2019-12-04 17:48:01 来源：量子位

OpenAI发布了用于评价强化学习智能体泛化技能学习的程序化生成环境——Procgen Benchmark。

Procgen Benchmark是一套由16个程序生成的类似游戏的环境，用于在样本效率和增强学习中的泛化做基准测试。

经验证明，不同的环境分布对于充分训练和评估强化学习智能体是至关重要的，从而促进程序内容生成的广泛使用。

然后，研究人员使用此基准来研究缩放模型大小的影响，发现较大的模型可以显著提高样本效率和泛化能力。

OpenAI博客：

https://openai.com/blog/procgen-benchmark/

论文地址：

http://t.cn/AigsB50N

版权所有，未经授权不得以任何形式转载及使用，违者必究。

OpenAI 智能体深度强化学习

相关阅读

ChatGPT开放API，价格直接打1折

OpenAI：ChatGPT成本降90%

鱼羊2023-03-02

ChatGPT OpenAI

月入过万只需用ChatGPT建个网站？AI创业博主在线教学

不仅不用投广告，就连更新都免了

十三2024-01-20

ChatGPT OpenAI 人工智能

GPT-4不偷懒了！OpenAI连甩五个大模型，价格最低打两折

OpenAI工程师在线剧透

白交2024-01-26

OpenAI 大模型

奥特曼小作文否认OpenAI离职霸王条款，网友：他有前科

还回应了OpenAI安全战略

西风2024-05-19

OpenAI Sam Altman

GPT-4o引发OpenAI组织创新热议！重任应届生本科生，职级都是浮云

不以职级派项目

梦晨2024-05-19

OpenAI

OpenAI重夺竞技场第一，但这波靠的是4o

网友：快把o1放出来

鱼羊2024-11-21

GPT-4o OpenAI

热门文章

免费的「网页版Cursor」！新版DeepSeek-V3加持，秒秒钟编出APP

摸DeepSeek过河也得自身硬! 想开后的文小言，真香！

周光：VLA模型将成智能驾驶体验颠覆性拐点

GPT-4o骗了所有人，逐行画图只是前端特效？！底层架构细节成迷，奥特曼呼吁大家别玩了

创新，责任，领导力｜人工智能领军人才发展论坛成功举办