【APUS &大数据国家工程实验室】700亿参数APUS大模型3.0伶荔中文大模型正式发布！

量子位的朋友们 2024-02-05 18:43:37 来源：量子位

在中文基准测评榜单C-Eval上获得80.6分

由APUS与深圳大学大数据系统计算技术国家工程实验室（以下简称“大数据国家工程实验室”）联合研发的伶荔Linly-70B中文大模型正式对外开源，并在GitHub上首发。这是APUS大模型3.0的首个开源大模型，也是国内学术界首个700亿参数规模的开源大模型。

【APUS &大数据国家工程实验室】700亿参数APUS大模型3.0伶荔中文大模型正式发布！

此次，APUS和大数据国家工程实验室强强联合，集成各自优势，更有大数据国家实验室陈国良院士权威背书，APUS大模型3.0伶荔已有700亿参数加持，在中文基准测评榜单C-Eval上获得80.6分，更加适配中文场景，满足中文大模型场景使用需求。

跻身700亿+参数开源大模型梯队

当前市场中，700亿以上参数的开源模型数量仅有个位数，特别是学术界，因为算力资源有限，还没有开源过700亿以上参数规模的模型，但其价值不可低估。700亿参数规模的大模型能力上可以接近GPT-4的水平，在局部水平上甚至可以超越GPT-4。在深圳大学李煜东博士看来，市面上700亿参数规模的开源大模型很少的原因在于三方面：一是训练成本更高，二是增量预训练时需要更大数据量，三是使用时需消耗更多的资源。此次APUS和国家工程实验室共同研发APUS大模型3.0伶荔则是迈出至关重要的一步。

中文能力大幅提升

基于APUS郑州智算中心强大的计算能力，APUS大模型3.0伶荔在中文扩表后进行了严格训练，显著提高了模型的训练效率和准确性。该模型的上下文长度设定为4,096，能够处理大约8,000-10,000个汉字的文本输入，从而更好理解和生成中文语境下的自然语言，提高其在各种中文任务中的表现。APUS大模型3.0伶荔在中文基准测评榜单C-Eval上获得了80.6分的成绩，赶超GPT-4，在中文自然语言处理领域，这一成绩表现非常优秀。

多模态能力定制化调优，综合实力凸显

为了提高APUS大模型3.0伶荔在中文场景中的表现，在语料、训练框架和训练方法上进行了定制化调优。基于自研模块化增量预训练框架，针对中文特点扩充词表，增加了对汉字和中文符号的支持。在训练语料方面，精选高质量中英文公开数据源，包括悟道、万卷、MNBVC等，并结合自研的数据选择策略，构建了适合模型高效训练的混合语料库。此外，项目团队还提出创新性课程学习策略，通过动态数据采样，在训练过程中不断调整数据分布，确保模型的英文语言能力能够平稳迁移到中文能力。这一策略的运用，使得模型在中文语境下能够更加自然、准确地理解和生成文本。

全新发布的APUS大模型3.0伶荔在中文自然语言处理领域展现出了卓越的性能和巨大的潜力，并已经准备好应对各种中文任务和挑战。APUS与国家工程实验室已迈出构建中文场景大型语言模型的关键一步，未来二者将持续密切合作，共同探索模型在知识、推理和长文本处理等方面的通用能力，并深化其在工具使用、剧情生成和角色扮演以及医疗等专业领域的应用，进一步提升模型的能力和应用范围。此外，双方还将扩展到视觉模态，构建跨模态生成模型，以更好、更精准满足通用和领域特定的需求。

APUS

量子位的朋友们

【APUS &大数据国家工程实验室】700亿参数APUS大模型3.0伶荔中文大模型正式发布！

相关阅读

APUS与三甲医院深度合作搭建高效普惠的智能诊疗平台

APUS与腾讯云达成战略合作，携手深化产业赋能

APUS大模型：从AI技术中来，到应用中去

APUS李涛出席百度联盟大会：以“大模型”强“新生态”

打造AI医疗样板间，APUS首提“2+5+N”战略获关注

APUS网信大模型落地合作创新网信应用场景

热门文章

鹅厂开源视频生成大杀器！参考图主体精准复刻，还能编辑现有视频

Qwen上新AI前端工程师！一句话搞定HTML/CSS/JS，新手秒变React大神

大模型重塑服务生态，容联七陌「AI进化论」探索智能客服新未来

开源即屠榜！UniME多模态框架登顶MMEB训练榜，刷新多项SOTA纪录

夸克即将发布“深度搜索Pro”，能力比肩DeepResearch

【APUS &大数据国家工程实验室】700亿参数APUS大模型3.0伶荔中文大模型正式发布！

相关阅读

APUS与三甲医院深度合作 搭建高效普惠的智能诊疗平台

APUS与腾讯云达成战略合作，携手深化产业赋能

APUS大模型：从AI技术中来，到应用中去

APUS李涛出席百度联盟大会：以“大模型”强“新生态”

打造AI医疗样板间，APUS首提“2+5+N”战略获关注

APUS网信大模型落地 合作创新网信应用场景

热门文章

鹅厂开源视频生成大杀器！参考图主体精准复刻，还能编辑现有视频

Qwen上新AI前端工程师！一句话搞定HTML/CSS/JS，新手秒变React大神

大模型重塑服务生态，容联七陌「AI进化论」探索智能客服新未来

开源即屠榜！UniME多模态框架登顶MMEB训练榜，刷新多项SOTA纪录

夸克即将发布“深度搜索Pro”， 能力比肩DeepResearch

APUS与三甲医院深度合作搭建高效普惠的智能诊疗平台

APUS网信大模型落地合作创新网信应用场景

夸克即将发布“深度搜索Pro”，能力比肩DeepResearch