英特尔数据中心GPU最新披露：面向云游戏、流媒体，今年Q3上市

梦晨 2022-05-12 20:14:48 来源：量子位

代号 Arctic Sound-M

英特尔®至强®可扩展处理器是面向云游戏、多媒体处理与传输、虚拟桌面基础架构和推理运算的处理器标杆，致力于为当今的媒介消费提供鼎力支持。

随着当前工作负载密度和复杂程度的快速增长，以上每个细分领域都将提出不同的工作负载需求，包括从处理像素、推理和分析、到渲染新的画面内容，再到将这些像素输出至客户端设备进行查看或进一步分析。

然而，目前这些工作都是通过在云端的各个独立产品来完成的。

在本届英特尔 On 产业创新峰会（Intel Vision）上，英特尔分享了其代号为 Arctic Sound-M（ATS-M）的数据中心 GPU 的更多细节。

ATS-M 是一颗支持高质量转码和高性能的强大 GPU，能够提供每秒 150 万亿次运算（150 TOPS），共拥有两种配置。

ATS-M 能够通过单一解决方案灵活地处理广泛的工作负载，并在不牺牲性能或者质量的同时，优化总体拥有成本（TCO）。

面向数据中心工作负载的多用途 GPU

该英特尔数据中心 GPU 将包含两种不同的配置：

150W 功率版本在一个3/4长、全高尺寸的 PCIe 4.0 加速卡中封装了 32 个 Xe 内核。

75W 功率版本则在半高尺寸的 PCIe 4.0 加速卡中封装了两颗具有 8 个 Xe 内核的 GPU，共 16 个 Xe 内核。

这两种配置均配备了 4 个 Xe 媒体引擎、英特尔首款面向数据中心的 AV1 硬件编码器和加速器、GDDR6 内存、光线追踪单元和内置 XMX AI 加速。

采用开源软件的行业领先数据中心 GPU

该英特尔数据中心 GPU 由完整的解决方案堆栈支持，为开发者提供了面向流媒体、云游戏和云端推理的开源软件堆栈，并广泛支持 AVC、HEVC、VP9，以及更多 API、框架和最新的编解码器。

oneAPI 为加速计算提供了高效、智能的路径，让开发者免受专有编程模型所带来的经济和技术负担。

它为专用硬件的封闭编程语言供了开放的选择，即通过一套完整、可靠的工具包来完善现有编程语言和并行计算模型，从而释放硬件的全部性能，并且能够让开发者设计出开放、可移植的代码，更大限度地利用多种 CPU 和 GPU 的组合。

云游戏

全球云游戏市场呈现持续快速增长趋势，预计到2026年，其复合年增长率（CAGR）将达到 43.2%，市值将近 32 亿美元。

英特尔可为 Windows 和 Android 云游戏平台提供支持，为广大玩家带来高品质的游戏体验。ATS-M 拥有两种不同的产品外形设计，用户可灵活地选择符合他们特定工作负载的产品配置。

无论用户对峰值性能、高密度提出需求，还是期待通过一个平台满足跨智能手机和 PC 游戏的融合云游戏解决方案，这款 GPU 均可以提供出色的游戏串流体验。

全堆栈媒体流支持

该 GPU 配备了英特尔首款基于硬件加速的 AV1 编码器，可在不牺牲质量的同时，带来 30% 比特率的提升。

作为引领新一代媒体串流的 GPU，它可实现一卡同时处理多达 8 路 4K 视频流或超过30 路 1080p 视频流。在一台 4 卡服务器中，可以实现每节点处理 120 路视频流以及每机架处理 13,000 路视频流。

利用 Intel® oneVPL，媒体串流和传输软件堆栈可以面向包括 AV1 在内的所有主流编解码器进行解码和编码加速。

流媒体发行商可以在 FFmpeg 或 GStreamer 这两大领先多媒体处理框架中进行选择，它们均可通过 oneVPL 针对英特尔 CPU 和 GPU 进行加速。

英特尔还提供了开放视觉云（Open Visual Cloud），这是一套用于媒体、分析、图形和沉浸式媒体的开源软件堆栈，它针对云原生部署进行了优化，使其能够在 FFmpeg 和 GStreamer 框架内运行。

全堆栈虚拟桌面基础架构支持（VDI）

过去两年，随着远程办公需求的增加，虚拟桌面基础架构（VDI）和设备即服务（DaaS）迎来了快速增长（最近一项研究表明增长超过 11%）。

现代操作系统和应用程序对图形处理的要求越来越高，显示器的分辨率也随之提高；GPU 可以通过承载渲染和编码功能，以更短的响应时间和更高的帧率来改善用户体验。

由此释放出来的 CPU 处理能力可以带来应用程序工作负载的性能提升。

英特尔的这款数据中心 GPU 还提供了灵活的虚拟 GPU（vGPU）调度策略（固定的、灵活的以及硬件利用率优化过的时间片任务调度器），让管理员能够单独微调 GPU 上每个虚拟机的运行指令。

目前，其他厂商的产品仅允许在所有虚拟机的全局设置中进行相关调整。

与目前市面上其他产品不同的是，英特尔不会针对基于硬件的可扩展 I/O 虚拟化（SIOV）额外收取任何软件授权费，这将有助于相关提供商降低虚拟化部署的总成本。

全堆栈媒体分析支持

每个在视觉媒体场景执行的推理都需先经过视频解码和预处理，然后才能交给 AI 模型进行下一步操作。

集成两颗 GPU 的 75W 功率版本 ATS-M 能够在计算和解码能力上实现很好的平衡，且不受媒体限制。

因此，它能够针对媒体分析类的工作负载提供良好的扩展性，为客户提供更高的流密度和更低的成本。

在使用 oneVPL 对于视频流的解码和编码进行加速的同时，oneDNN（oneAPI 深度神经网络库）可针对内核进行 AI 优化，加速面向 TensorFlow 或 PyTorch 框架的推理模型；也可通过 OpenVINO 的模型优化器和推理引擎，进一步加速推理以及客户工作负载的部署。

上述 AI 和媒体软件以及堆栈的组合可以在至强处理器和英特尔数据中心 GPU 之间无缝运行。

代号为 Arctic Sound-M 的英特尔数据中心 GPU 已经获得超过 15 款来自业界领先合作伙伴的设计，并将于 2022 年第三季度发布。

注意事项与免责声明：

实际性能受使用情况、配置和其他因素的差异影。更多信息请访问：
www.Intel.com/PerformanceIndex。

性能结果基于配置信息中显示的日期进行测试，且可能并未反映所有公开可用的更新。配置详情见备用信息。没有任何产品或组件能够保证绝对安全。

您的成本和结果可能有所不同。

GPU 英特尔

梦晨

英特尔数据中心GPU最新披露：面向云游戏、流媒体，今年Q3上市

面向数据中心工作负载的多用途 GPU

采用开源软件的行业领先数据中心 GPU

云游戏

全堆栈媒体流支持

全堆栈虚拟桌面基础架构支持（VDI）

全堆栈媒体分析支持

相关阅读

英特尔新款游戏显卡卖爆！24G大显存版也在路上，这下AI玩家也要抢？

莱斯大学&英特尔新算法证明CPU加速深度学习优于GPU！老黄核弹警告

阿里云容器化GPU共享服务已开放！性能无损失，对你的环境无侵入，真正实现AI降本增效

大模型时代的OCR，“CPU” 的味道更重了

英特尔：80%的边缘数据都是视频数据！新成立物联网视频事业部，总部base中国

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

热门文章

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

联想百应智能体入选量子位“2025年值得关注的AIGC产品”：国内首个AI服务智能体打破中小企业AI落地困局

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

DeepSeek引爆「万物皆可AI」时代，20余位大咖分析行业痛点，万字梳理干货在此

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比