创造历史，阿里通义开源模型Qwen的衍生模型数量超越Llama

量子位的朋友们 2024-09-29 16:00:30 来源：量子位

进入大模型盲测全球前十

9月29日消息，基准测试平台Chatbot Arena日前公布最新大模型盲测榜单，10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强，其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十，是前十唯一的中国大模型；Qwen系列视觉语言模型Qwen2-VL-72B-Instruct排名Vision榜单第九，是得分最高的开源大模型。

同一时间，全球开源社区基于Qwen系列二次开发的衍生模型数量突破7.43万，超越Llama系列衍生模型的7.28万。通义千问Qwen成长为世界最大的生成式语言模型族群，在Hugging Face社区的开源模型权威榜单Open LLM Leaderboard上，Qwen系列及其衍生模型包揽了前十全部座次。

不论是模型性能还是生态影响力，Qwen都创造了中国开源大模型的历史。

Qwen2.5-72B-Instruct排名Chatbot Arena大语言模型榜单第十

Chatbot Arena是由开放研究机构LMSYS Org推出的大模型性能测试平台，自2023年5月推出以来一直是世界顶级大模型的最重要竞技场。平台目前集成了全球70多个大模型，采用匿名方式将大模型两两组队，交给用户进行盲测，用户根据真实对话体验对模型能力进行投票。

9月19日发布的Qwen2.5迅速进榜，旗舰模型Qwen2.5-72B-Instruct得分位列LLM榜单第十，居于OpenAI的o1、GPT-4o等模型之后，是得分最高的中国大模型；同天开源的视觉语言模型Qwen2-VL-72B-Instruct闯入Vision榜单第九，略逊于GPT-4o、Gemini-1.5-Pro等闭源模型，是成绩最好的开源模型。此前Qwen系列已有多款开源模型闯入Chatbot Arena榜单。

Chatbot Arena官方发文，Qwen2-VL-72B-Instruct是排名最高的开源视觉语言模型

Qwen2.5的发布在海内外开源社区引发一场狂欢，这套开源模型涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，几乎所有尺寸的模型都实现了同等规模业界最佳性能，发布10天下载量超过150万。有国外开发者称赞通义千问称得上是真正的“开放AI”；有用户测评发现Qwen2.5从0.5B到72B都是SOTA水平，于是发起话题：“大家都用Qwen2.5替换了那些常用模型？”

进入大模型盲测全球前十

海外开源社区盛赞Qwen2.5

Qwen

量子位的朋友们

阶跃星辰推出开源 SOTA 图像编辑模型，一个月连发三款多模态模型2025-04-27
清华系智谱×生数达成战略合作，专注大模型联合创新2025-04-27
夸克AI超级框上新“拍照问夸克” 加码多模态能力2025-04-27
一季度超百万辆！比亚迪凭实力书写行业 “霸榜” 传奇2025-04-27

创造历史，阿里通义开源模型Qwen的衍生模型数量超越Llama

相关阅读

最强开源CodeLLM模型深夜来袭！320亿参数，Qwen2.5-Coder新模型超越GPT-4o

Qwen2.5登全球开源王座！72B击败LIama3 405B，轻松胜过GPT-4o-mini

AI大模型看手相！图片视频加持深度思考，阿里QVQ-Max“神了神了”

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

Qwen版o1发布即开源！32B参数比肩OpenAI o1-mini，一手实测在此

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini

热门文章

又一开源AI神器！将机器学习论文自动转为可运行代码库

全栈AI基础设施支撑，跑出全球首个开放使用视频生成DiT模型

人人可用的超级智能体！100+MCP工具随便选，爬虫小红书效果惊艳

当购物用上大模型！阿里妈妈首发世界知识大模型，破解推荐难题

Qwen3真香！通义App满血接入，一手实测在此