首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
基准测试
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
无法记答案的动态基准测试
西风
2025-03-29
AI游戏
基准测试
大模型权威测试被曝翻车!偏袒GPT-4等闭源模型,提示词区别对待
简单改下提示词,LIama3涨10分
白交
2024-07-11
基准测试
大模型
新测试基准发布,最强开源Llama 3分数骤降,差距拉开了
大模型竞技场人类真实数据
梦晨
2024-04-22
基准测试
机器学习免费跑分神器:集成各大数据集,连接GitHub就能用,还能验证论文结果
好评如潮
鱼羊
栗子
2019-10-12
免费工具
基准测试
加载更多
(●`ω`●)没有更多啦~
热门文章
Claude网页版接入MCP!10款应用一键调用,开发者30分钟可创建新集成
2025-05-02
大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了
2025-05-03
OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到
2025-05-03
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源
2025-05-03
2年就过气!ChatGPT催生的百万年薪岗位,大厂不愿意招了
2025-05-04