首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
刷榜
大模型竞技场再被锤!Llama4私下测试27个版本,只取最佳成绩
“竞技场不应该是唯一基准参考”
明敏
2025-05-02
刷榜
大模型竞技场
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
(●`ω`●)没有更多啦~
热门文章
又一开源AI神器!将机器学习论文自动转为可运行代码库
2025-05-01
人人可用的超级智能体!100+MCP工具随便选,爬虫小红书效果惊艳
2025-04-29
Qwen3真香!通义App满血接入,一手实测在此
2025-04-30
当购物用上大模型!阿里妈妈首发世界知识大模型,破解推荐难题
2025-05-01
自动化所:基于科学基础大模型的智能科研平台ScienceOne正式发布
2025-04-30