扫码关注量子位
国内模二代也遍地开花
资源消耗也比DPO更低
Too Long;Didn’t Read
ChatGPT的SFT+RLHF都不是必要的???
资源消耗没有显著增加
但人力消耗更低
报告正文18页
RLHF的一大缺点,终于被解决了!
CV/NLP通用
支持个性化微调