华为昇腾的另一面
这,就是华为AI的下半场
金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
提到昇腾,还停留在「超强芯片」的刻板印象?
不不不,是时候重新认识一下它的「暴力美学」了——昇腾AI全栈。
但为什么是AI全栈?
其实,这也影射出了华为的一个「AI观」:
仅芯片的升级、演进,不能够满足当前算力的需求。
在9月25日的华为全联接大会《开放创新,共赢多样性计算新时代》主题演讲中,华为计算产品线总裁邓泰华道出了缘由:
全生态开放创新,使能算力爆炸式增长,为数字经济提供发展新动能。
而这,也正是华为AI的下半场。
华为的AI全栈,现在是一个怎样的状态?
早在2018年的华为全联接大会中,轮值董事长徐直军,便首次公布了华为AI全栈全场景的解决方案。
这一枪可谓是打响了华为AI全栈的号角。
那么,时隔两年,华为AI全栈发展得怎么样了?
在今年的HC大会上,邓泰华展示了这样一张「昇腾AI全栈」全景图。
不难看出,「昇腾AI全栈」主要包括四大层面,分别是系列硬件、AI算子开发、AI模型开发和AI应用开发。
在系列硬件方面,华为AI在2年时间里已经产出、积累了非常丰富的硬件。
用于推理的包括Atlas 200、Atlas 500等,可以在嵌入式设备、边缘设备使用;用于训练的包括像Atlas 800、Atlas 900等,在算力方面拥有强悍的硬实力。
今天,邓泰华还推出了最新的硬件产品,Atlas 300I。
在AI算子开发方面,主要是聚焦在「异构计算架构CANN」身上。
从2018年推出1.0版本,到现在的CANN 3.0,也是仅仅用了2年时间进行迭代。
并且,目前不仅使用于推理、训练场景,还能够实现「端边云协同」。这就意味着不必在不同的终端,再去开发不同的算子,大大提高了效率。
例如,CANN从2.0到3.0版本的升级,以及ModelArts联合调优,就能让ResNet-50模型的训练时间降低到28s。
接下来,是AI模型开发方面。MindSpore是华为在2019年8月推出的全场景AI计算框架,并于今年3月份正式开源。
仅6个时间,便正式推出MindSpore 1.0:一行代码实现亿级参数模型、适配不同硬件开发。
例如,用基于Ghost模块建立的神经体系结构GhostNet,结合MindSpore 1.0来做图像分类、目标检测任务,均已达到业界最优。
不仅如此,华为还计划在明年推出MindSpore 2.0版本,实现全流程极简。
最后,是AI应用开发方面,MindX 1.0“极简易用”的特性,能满足那些没有深度开发能力、但想要打造行业AI应用的客户。
也就是说,只需要极少量、甚至是一行代码,就能够生成AI的应用。
以及ModelArts也已步入了3.0时代,从训练数据到模型落地一站式打通。
除此之外,还有跨越上述三个「软件层」的全流程开发工具链 MindStudio2.0,涵盖了算子开发、模型训练、模型推理、应用开发和应用部署,有利于用户推出自己的开发平台。
……
至于为什么要做全栈,邓泰华做出了解释。
「我们正处于AI爆炸式增长的前夜」,他认为,「AI已然在特定领域超越人类,成为推动社会发展关键引擎」。
这也就意味着,AI从技术本身,就已经具备了场景化、规模部署的条件。
但现实却是,AI在行业的渗透率是非常低的,大约只有4%。
最直接的痛点,就是AI从算法在应用过程中面临诸多挑战,华为总结下来分为三方面,分别是算法开发难、应用开发难、业务部署难。
「要用哪个模型?哪个算子?还有就是懂行业的人不懂AI,懂AI的人不懂行业……」,邓泰华列举了一系列的问题。
而「昇腾AI框架」,就一举解决了这些难题:
华为已经用「快、准、狠」的标准,在AI全栈「软硬件」这一块做好了铺垫。
华为AI的「上半场」已经就绪,已然是迈入「下半场」的姿态。
华为推出分布式多样性计算软件,为何而来?
华为AI的下半场,就不仅仅是单个技术的发展,而是将它们融为一个整体,继续放大华为AI全栈的能力,从而构建一个「坚不可摧」的AI生态。
因此,在华为AI的下半场,只有「昇腾AI全栈」是不够的。
邓泰华在大会中还提出,已经进入分布式多样性计算时代。
为此华为首次推出了分布式多样性计算软件套件**。
在这个套件中,3大关键部件是重点。
首先是性能加速库,通过算法创新,从容应对分布式多样性计算场景面临的难题。
据介绍,今年还会陆续推出机器学习库和图分析库。
其次,是华为自研的统一调度器,将于今年12月上市。
拥有三大创新突破:
- 大规模分布式技术方面,拥有2万节点的科学计算场景,以及30万核的制造场景。
- 关键调度算法方面,拥有百万核MPI,3分钟启动科学计算场景,
- 多负载融合调度方面,可集成主流HPC、AI、BigData等应用;并且,资源利用率达到了90+%。
最后,是基于函数计算的分布式并行应用开发框架。
这种框架可以让分布式并行应用构建,像搭积木般快速便捷。
在现场展示的开发demo中,可以节省3/4的代码量。
据介绍,分布式并行应用框架的上市时间为2021年的6月。
华为的这一步,不仅让「昇腾AI全栈」在技术本身有了提升,于开发者、于产业、于生态,有了更完备的能力。
而华为,并没有停滞于此。
人才方面如何更进一步?不仅融入学分,还培养大学教师
除了技术、产业,华为AI全栈还为生态创造了哪些价值?
人才,人才,还是人才。
为此,华为和教育部联合建设了一个名为「智能基座」产教融合协同育人基地的项目。
项目中的第一个举措,就是改革课程内容。
华为将鲲鹏和昇腾知识融入到了22门专业学分课 (如下图),包括通用计算课程体系和人工智能课程体系。
此外,在这次的HC大会中,华为还推出了「鲲鹏」+「昇腾」系列学习教材。
据介绍,华为在未来还将陆续推出更多的相关系列教材。
举措之二,便是开展师资培训,培养一批具备鲲鹏昇腾专业知识的大学教师。
华为还举办了诸如「百校教师AI峰会」等线下活动,加速了AI人才的培养,使得众多高校开发者基于Atlas 200和Atlas 200 DK开发的各类AI应用。
第三个举措就是优化实践条件,通过鲲鹏和昇腾软硬件结合的AI全栈,以及华为云的能力,强化了计算教学实践平台。
最后,华为不仅送资源,还有福利——现金支持。
从学生到教师,从课程内容到教学平台,华为AI全栈的能力也已深入到了人才、教育当中。
AI全栈的生态构建,就此更加完备。
华为AI,已然大步迈入下半场
如果用一句话来形容华为AI的最新进展,应当是:
已经大步迈入AI的下半场。
当然,步入「AI的下半场」需要一个标杆:
不仅是单个技术的突破与创新,于产业、于人才,于生态,整体协同的发展。
这就是迈入AI下半场应当具备的条件。
现在,再来简单速刷一下华为AI目前的状态。
于技术,基于昇腾的软硬件各层技术已然成熟、可用,形成了一个环环相扣的紧耦合闭环,并且能力还在升级迭代当中。
于产业,基于昇腾、鲲鹏的AI全栈能力,共同开辟了一个多样性计算的时代,推动了产业的发展。
于人才,华为的「智能基座」项目,在学生、教师、资源、平台等方面都投入了大量的力度。
如此看来,华为的AI,已然迈入下半场。
你说呢?
- Ilya宣判:预训练即将终结!NeurIPS现场沸腾2024-12-14
- 罕见!云计算一哥CTO,现场不发产品只讲教训2024-12-06
- 清华系初创面壁智能获新一轮数亿元融资2024-12-11
- 马斯克新文生图模型闪现!网友抢时间疯狂实测:人物生成超逼真,可算把赛博皮卡画明白了2024-12-09