首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
benchmark
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
Sora/可灵/海螺/混元大PK!多场景对比,谁是最强视频生成模型?
2024-12-11
AI音乐战火升级!三路国产大军全面对决Suno
2024-12-11
谷歌“狙击”OpenAI,发布新一代大模型!主打Agent+多模态
2024-12-12
诺奖青睐AI的这一年,这些人工智能公司&人物&产品值得关注
2024-12-11
OpenAI版《Her》全量来袭:实时视频对话,你每个动作AI都看得见
2024-12-13