奖励黑客

翁荔离职OpenAI后第一个动作:万字长文探讨RLHF的漏洞,网友们抢着传看

“在我看来,这是现实世界部署更多自主AI模型应用的主要障碍”