Arm官宣V9架构,用AI和安全对抗英特尔,最快今年年底用上
十年大更新
萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI
Arm指令集,终于升级到了V9大版本。
这是自2011年发布V8架构以来,Arm首次在指令集级别上做出的一个大更新。
在这10年期间,Arm虽然也对V8架构进行了各种升级,但几乎每次都只对架构做出一点改进,以至于一直停留在V8.x的阶段。
嗯……牙膏也确实挤得有点久。
对此,Arm客户之一高通曾抱怨,Arm设计的速度“影响到自己发挥”了:
Arm的设计路线图,让我们没办法一直保持CPU性能的领先地位。
现在,十年磨一剑,Arm终于在指令集上进行了大更新。
V9架构,主要会在这两个领域对抗英特尔:AI和安全。
安全:引入机密计算技术
首先,是安全性。
单从指令集架构来看,V9并不像V8那样,有一个飞跃式的升级。
相比于V8,V9这次依旧延续了64位架构的使用,即沿用了ARM64(AArch64)。
但据Arm表示,安全性于V9而言,其重要程度相当于ARM64对Arm V8。
相比于V7架构的ARM32,V8架构的ARM64有更大的微观架构影响,包括扩展寄存器、64位虚拟地址空间等。
在安全方面,V9引入了用于机密计算的Realms模块,这些模块使得开发人员在编写应用程序时,其数据能屏蔽操作系统和设备上的其他应用程序。
机密计算,一种云计算技术,在使用时能屏蔽数据访问,在硬件层面保护数据。
如果采用Realms模块,就能在处理期间,将敏感数据、代码隔离在受保护的CPU区域中,不受其他应用程序影响。
据了解,Arm花了几年时间研究出这一安全架构,为的就是防止像Spectre和Meltdown这样的新型安全漏洞攻击。
AI:SVE2加成,提升ML任务性能
另一部分,就是AI模块了。
这次,Arm对AI模块的升级,重点在于改善CPU的AI性能。
其中一个重要举动,就是将SVE升级到SVE2。
2016年,Arm与富士通合作研发了可伸缩矢量扩展 (SVE),这是ARM64架构下的下一代SIMD指令集。
SVE首次在富士通的A64FX CPU核心中实现,目前也被应用在世界第一的超级计算机富岳(Fugaku)上。
然而,SVE缺少许多通用性较强的指令,导致可变矢量长度SIMD指令集的首次迭代范围相当有限,更多只针对高性能计算(HPC)工作负载。
2019年4月,SVE2推出,现在,终于被用到了V9架构中。
Arm所推出的SVE2,将被更好地用于机器学习和数字信号处理任务。
Arm认为,虽然市面上已有相关AI芯片,然而在工作负载较小的情况下,CPU仍然是大多数人的选择。
“除了GPU、专用处理器和NPU以外,CPU也同样会处理部分机器学习任务,因此这些模块都需要进行更好的设计。”Arm首席架构师Richard Grisenthwaite表示。
Arm认为,到21世纪中期,语音辅助设备将超过80亿台,而设备中90%的应用将包含AI功能。
而V9架构,则能将未来2代移动设备、和数据中心服务器的处理性能,提升30%。
未来10年将用于3000亿个处理器
过去5年中,基于Arm架构设计的芯片,已经超过1000亿块。
Arm相信,在未来10年里,这一数字还将扩大成3000亿。
Ian Smythe(Arm营销VP)表示,他相信这种新架构,将在未来10年改变计算机运行计算的方式:
V9架构的升级,意味着更高的性能、更安全的计算方式。当前,数据呈爆炸式增长,为了能更好地处理数据,需要增加数据吞吐量、并实现更高的数据保护需求。
目前,高通、苹果、华为海思都是Arm的主要客户。
苹果的自研芯片M1,就采用了Arm架构。
华为虽然曾经于2019年获得Arm V9的合作许可,指令集的授权问题不大(没什么美国技术)。
但受美国禁令影响,架构授权的问题还是存在,因为Arm架构的设计团队,其中一支就来自美国。
当然,华为自己也有微架构设计能力,所以在这方面应该不会受到太大影响。
Arm表示,第一批搭载Arm V9架构的处理器,预计将在今年年底前发货。
参考链接:
[1]https://techcrunch.com/2021/03/30/all-hail-Armv9-Arm-launches-the-next-generation-of-its-processor-architecture/
[2]https://www.anandtech.com/show/16584/Arm-announces-Armv9-architecture
- 首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为2023-12-13
- IDC霍锦洁:AI PC将颠覆性变革PC产业2023-12-08
- AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型2023-12-03
- 苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型2023-12-07