首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
DeepSeek-R1-Zero
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法
复杂奖励函数不是必要的
西风
2025-02-22
DeepSeek-R1-Zero
沈向洋
阶跃星辰
加载更多
(●`ω`●)没有更多啦~
热门文章
强得不像合资车!丰田首款智能车交卷,14万买端到端+激光雷达
2025-03-07
DeepMind元老创业AI编程:亮相即获1.55亿美元,英伟达红杉抢着投,团队太豪华了!
2025-03-08
Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜
2025-03-09
港大马毅团队等开源新作:用编码率正则化重构视觉自监督学习范式,“少即是多”
2025-03-08
蔚来又融到钱了,合肥国资再注资4亿,新推换电补贴政策兜底
2025-03-07