Arm官宣V9架构，用AI和安全对抗英特尔，最快今年年底用上

萧箫 2021-03-31 12:46:29 来源：量子位

十年大更新

萧箫发自凹非寺
量子位报道 | 公众号 QbitAI

Arm指令集，终于升级到了V9大版本。

这是自2011年发布V8架构以来，Arm首次在指令集级别上做出的一个大更新。

在这10年期间，Arm虽然也对V8架构进行了各种升级，但几乎每次都只对架构做出一点改进，以至于一直停留在V8.x的阶段。

嗯……牙膏也确实挤得有点久。

对此，Arm客户之一高通曾抱怨，Arm设计的速度“影响到自己发挥”了：

Arm的设计路线图，让我们没办法一直保持CPU性能的领先地位。

现在，十年磨一剑，Arm终于在指令集上进行了大更新。

V9架构，主要会在这两个领域对抗英特尔：AI和安全。

安全：引入机密计算技术

首先，是安全性。

单从指令集架构来看，V9并不像V8那样，有一个飞跃式的升级。

相比于V8，V9这次依旧延续了64位架构的使用，即沿用了ARM64（AArch64）。

但据Arm表示，安全性于V9而言，其重要程度相当于ARM64对Arm V8。

相比于V7架构的ARM32，V8架构的ARM64有更大的微观架构影响，包括扩展寄存器、64位虚拟地址空间等。

在安全方面，V9引入了用于机密计算的Realms模块，这些模块使得开发人员在编写应用程序时，其数据能屏蔽操作系统和设备上的其他应用程序。

机密计算，一种云计算技术，在使用时能屏蔽数据访问，在硬件层面保护数据。

如果采用Realms模块，就能在处理期间，将敏感数据、代码隔离在受保护的CPU区域中，不受其他应用程序影响。

据了解，Arm花了几年时间研究出这一安全架构，为的就是防止像Spectre和Meltdown这样的新型安全漏洞攻击。

AI：SVE2加成，提升ML任务性能

另一部分，就是AI模块了。

这次，Arm对AI模块的升级，重点在于改善CPU的AI性能。

其中一个重要举动，就是将SVE升级到SVE2。

2016年，Arm与富士通合作研发了可伸缩矢量扩展 （SVE），这是ARM64架构下的下一代SIMD指令集。

SVE首次在富士通的A64FX CPU核心中实现，目前也被应用在世界第一的超级计算机富岳（Fugaku）上。

然而，SVE缺少许多通用性较强的指令，导致可变矢量长度SIMD指令集的首次迭代范围相当有限，更多只针对高性能计算（HPC）工作负载。

2019年4月，SVE2推出，现在，终于被用到了V9架构中。

Arm所推出的SVE2，将被更好地用于机器学习和数字信号处理任务。

Arm认为，虽然市面上已有相关AI芯片，然而在工作负载较小的情况下，CPU仍然是大多数人的选择。

“除了GPU、专用处理器和NPU以外，CPU也同样会处理部分机器学习任务，因此这些模块都需要进行更好的设计。”Arm首席架构师Richard Grisenthwaite表示。

Arm认为，到21世纪中期，语音辅助设备将超过80亿台，而设备中90%的应用将包含AI功能。

而V9架构，则能将未来2代移动设备、和数据中心服务器的处理性能，提升30%。

未来10年将用于3000亿个处理器

过去5年中，基于Arm架构设计的芯片，已经超过1000亿块。

Arm相信，在未来10年里，这一数字还将扩大成3000亿。

Ian Smythe（Arm营销VP）表示，他相信这种新架构，将在未来10年改变计算机运行计算的方式：

V9架构的升级，意味着更高的性能、更安全的计算方式。当前，数据呈爆炸式增长，为了能更好地处理数据，需要增加数据吞吐量、并实现更高的数据保护需求。

目前，高通、苹果、华为海思都是Arm的主要客户。

苹果的自研芯片M1，就采用了Arm架构。

华为虽然曾经于2019年获得Arm V9的合作许可，指令集的授权问题不大（没什么美国技术）。

但受美国禁令影响，架构授权的问题还是存在，因为Arm架构的设计团队，其中一支就来自美国。

当然，华为自己也有微架构设计能力，所以在这方面应该不会受到太大影响。

Arm表示，第一批搭载Arm V9架构的处理器，预计将在今年年底前发货。

参考链接：
[1]https://techcrunch.com/2021/03/30/all-hail-Armv9-Arm-launches-the-next-generation-of-its-processor-architecture/
[2]https://www.anandtech.com/show/16584/Arm-announces-Armv9-architecture

Arm 机器学习计算安全

萧箫

Arm官宣V9架构，用AI和安全对抗英特尔，最快今年年底用上

安全：引入机密计算技术

AI：SVE2加成，提升ML任务性能

未来10年将用于3000亿个处理器

相关阅读

“本届IJCAI审稿宇宙最烂”，顶会放榜引吐槽，登上知乎热榜

Meta AI发布图音文大一统模型Data2vec，CV精度超MAE

吴恩达经典ML课全面升级！更新为Python实现，加入更直观视觉教学

华人小哥控诉机器学习「四大Boring」，CS博士：深有同感，正打算退学

逼真照片随手画，马良神笔已上线 | 点击收获这份英伟达GauGAN开源代码

又是加拿大！连年拒签NeurIPS参会者被指太荒唐，Hinton亲自过问也没辙

热门文章

全栈AI基础设施支撑，跑出全球首个开放使用视频生成DiT模型

数学家们仍在追赶天才拉马努金

7×24小时非人类科学家入场：当AI开始自主探索科学未知领域 | 多伦多大学

人人可用的超级智能体！100+MCP工具随便选，爬虫小红书效果惊艳

蔚来李斌：一年减少了数十亿英伟达芯片采购