NVIDIA CEO 黄仁勋发布面向各行各业的生成式 AI 平台
“加速计算和 AI 标志着计算的革新”
黄仁勋在 COMPUTEX 主题演讲上展示了多个新系统,软件及服务,以充分利用这个时代最具变革性的技术 —— 生成式 AI 。其中,多数产品由 Grace Hopper 超级芯片提供支持
COMPUTEX — 2023 年 5 月 29 日 — NVIDIA 创始人兼首席执行官黄仁勋在本次主题演讲中发布了多个平台。通过这些平台,企业可以把握住这一历史性的生成式 AI 浪潮,以革新广告、制造、电信等行业。
在近两个小时的演讲中,他介绍了加速计算服务、软件和系统,它们正在推动实现新业务模式和提高当前业务模式效率。
黄仁勋表示,“加速计算和 AI 标志着计算的革新”。
为了展示它的力量,他展示了一个文本提示,为他的主题演讲生成一首主题曲,可以像任何卡拉 OK 曲调一样演唱。
“我们现在正处于一个全新计算时代的转折点,加速计算和 AI 已经被世界上几乎所有的计算和云公司所采用,” 他表示,如今有 40,000 家大公司和 15,000 家初创公司使用 NVIDIA 技术,仅去年一年,CUDA 软件的下载量就达到 2,500 万次。
重磅发布亮点回顾
– Grace Hopper支持用于运行生成式 AI 的大内存超级计算机。
– 模块化参考架构推动实现 100 多种加速服务器配置。
– WPP 和 NVIDIA 在 Omniverse 中创建数字广告内容引擎。
– 网络技术加速基于以太网的 AI 云。
– NVIDIA ACE 游戏开发版通过生成式 AI 令游戏角色栩栩如生。
– 世界各地的电子制造商采用 NVIDIA AI。
新的企业 AI 引擎
黄仁勋发布了能够为企业提供超强 AI 性能的 DGX GH200 大内存 AI 超级计算机。通过 NVIDIA NVLink,这台超级计算机将多达 256 块 NVIDIA GH200 Grace Hopper 超级芯片整合到一个数据中心大小的 GPU 中。
黄仁勋宣布,GH200 超级芯片现已全面投产,它将节能的 NVIDIA Grace CPU 与高性能的 NVIDIA H100 Tensor Core GPU 整合到一个超级芯片中。
DGX GH200 提供 1 exaflop 性能与 144 TB 共享内存,比单个NVIDIA DGX A100 320GB系统高出近500倍。这让开发者可以构建用于生成式AI聊天机器人的大型语言模型、用于推荐系统的复杂算法,以及用于欺诈检测和数据分析的图形神经网络。
谷歌云、Meta和微软是首批有望接入DGX GH200的企业,它们将探索这台超级计算机在生成式AI工作负载方面的能力。
NVIDIA DGX GH200 AI超级计算机为生成式AI工作负载提供1 exaflop性能
黄仁勋表示:“DGX GH200 AI超级计算机集成了NVIDIA最先进的加速计算和网络技术来拓展AI的前沿领域。”
NVIDIA正在建造自己的大规模AI超级计算机NVIDIA Helios。这台超级计算机将于今年上线,它将使用四个与NVIDIA Quantum-2 InfiniBand网络相连的DGX GH200系统,可提供训练大型AI模型所需要的数据吞吐量。
在本次大会上发布的数百个使用NVIDIA系统中,DGX GH200最为瞩目。这些系统将共同为数百万用户带来生成式AI和加速计算。
黄仁勋宣布,将有超过400种采用NVIDIA 最新版本Hopper,Grace,Ada Lovelace和BlueField架构的系统上市。这些系统将被用于解决AI,数据科学和高性能计算领域的复杂挑战。
各种规模的加速
为了满足各种规模数据中心的需求,黄仁勋发布了一个用于创建加速服务器的模块化参考架构NVIDIA MGX。系统制造商将使用该架构快速、经济地构建100多种不同的服务器配置,满足各种AI、HPC和NVIDIA Omniverse应用的需求。
凭借MGX,制造商能够使用通用架构和模块化组件构建CPU和加速服务器。MGX支持NVIDIA全部GPU、CPU、DPU和网络适配器系列,以及各种风冷、液冷机箱的X86和Arm处理器。
众多制造商宣布将使用MGX创造新一代加速计算机。
Grace Hopper推动5G/6G发展
黄仁勋表示,NVIDIA 正在助力塑造未来5G、 6G 无线和视频通信。演讲中展示了通过Grace Hopper 上运行的 AI ,将当今的 2D 视频通话转变为更逼真的 3D体验 ,转换后的临场感令人惊叹。
黄仁勋宣布, NVIDIA 正在与电信巨头软银合作,在日本建立分布式数据中心网络,为提供新型服务奠定基础。它将在通用云平台上提供 5G 服务和生成式AI应用程序。
这些数据中心将使用模块化MGX系统中的NVIDIA GH200超级芯片和NVIDIA BlueField-3 DPU以及NVIDIA Spectrum以太网交换机提供5G协议所需的高精度计时。该平台将通过提高频谱效率来降低成本和能耗。
这些系统将帮助软银探索5G和6G在自动驾驶、AI工厂、增强和虚拟现实、计算机视觉以及数字孪生方面的应用,未来甚至可能被用于3D视频会议、全息通信等。
加速云网络
此外,黄仁勋发布了专门用于提高以太网AI云性能和效率的网络平台NVIDIA Spectrum-X。该平台将Spectrum-4以太网交换机与BlueField-3 DPU和软件相结合,相较于传统的以太网结构,AI性能和电源效率提高了1.7倍。
NVIDIA Spectrum-X 可加速在传统以太网网络上可能会出现性能损失的 AI 工作流程
令游戏角色栩栩如生
生成式AI也影响着人们玩游戏的方式。
黄仁勋发布了NVIDIA Avatar Cloud Engine(ACE)游戏开发版。开发者可以使用这项代工服务构建和部署定制化的语音、对话和动画AI模型。该引擎将赋予非玩家角色(NPC)对话技能,使他们能够以进化出的逼真个性回答问题。
NVIDIA ACE游戏开发版包含NVIDIA Riva等AI基础模型,可检测并转录玩家的语音。NVIDIA NeMo可根据文本提示生成定制化的回答并通过NVIDIA Omniverse Audio2Face实现动画化。
NVIDIA ACE 游戏开发版提供了一整套使令角色栩栩如生的生成式 AI工具
加速Windows上的生成式AI
黄仁勋介绍了NVIDIA和微软如何在生成式AI时代一同推动Windows PC的创新。
使用全新的和经过强化的工具、框架和驱动程序,PC开发者可以更加轻松地开发和部署AI。例如用于优化和部署GPU加速AI模型的Microsoft Olive工具链,以及新的图形驱动程序,将大幅提升配备NVIDIA GPU的Windows PC上的DirectML性能。
这项合作将加强1亿台配备RTX GPU的PC性能,并继续扩大设备数量。这些GPU中的Tensor Core可大幅提升400多个AI加速Windows应用和游戏的性能。
推动全球最大行业实现数字化
生成式AI为价值7,000亿美元的数字广告行业带来新的机遇。
例如,全球最大的营销服务机构WPP正与NVIDIA一起在Omniverse Cloud上构建首个生成式AI内容引擎。
黄仁勋在一段演示中展示了创作团队将如何连接他们的3D设计工具(如Adobe Substance 3D)并在NVIDIA Omniverse中构建客户产品的数字孪生。然后,他们可以凭借在来源可信的数据上训练并使用NVIDIA Picasso构建的生成式AI工具所提供的内容,快速制作出虚拟场景。
WPP客户可以使用制作完毕的场景生成大量广告、视频和3D体验,供全球市场和用户在任何网络设备上使用。
工厂铸就AI的未来
据估计,价值46万亿美元的制造业有1,000万家工厂,它们是工业数字化的重点领域。
黄仁勋表示:“全球最大的工业制造的都是实物。如果能够先以数字方式制造这些产品,就可以节省数十亿美元。”
此次主题演讲展示了多家电子制造商如何利用NVIDIA技术打造数字化流程,实现全数字化智能工厂的愿景。
这些企业通过Omniverse和生成式AI 的API接口,以连接他们的设计和制造工具,从而构建工厂数字孪生。他们还使用NVIDIA Isaac Sim模拟和测试机器人,并使用视觉AI框架NVIDIA Metropolis实现光学检测的自动化。
最新组件NVIDIA Metropolis for Factories可以创建定制化的质控系统,为制造商带来竞争优势。该组件正在帮助企业开发先进的AI应用。
使用AI加速装配线
例如,在全球生产笔记本电脑、智能手机等300种产品的和硕,正在使用Omniverse、Isaac Sim和Metropolis创建虚拟工厂。该公司能够在虚拟工厂中的模拟环境测试各种流程,为其节省了时间和成本。
和硕还使用NVIDIA DeepStream软件开发套件开发智能视频应用,将吞吐量提高了10倍。
富士康工业互联网是这家全球超大技术制造商的服务部门,该部门携手NVIDIA Metropolis合作伙伴,一起实现其电路板质控检查点重要环节的自动化。
黄仁勋在一段视频中展示了广达的子公司Techman Robot如何使用NVIDIA Isaac Sim优化其生产线上的检测。实际上,这是在使用模拟机器人,来训练机器人制造出更好的机器人。
此外,黄仁勋还发布了一个新平台,以支持下一代自主移动机器人 (AMR) 车队。 Isaac AMR 可以帮助模拟、部署和管理自主移动机器人车队。
更多信息,敬请观看完整的主题演讲。
https://www.nvidia.cn/events/computex/
- 不做Sora背后:百度的多模态路线是什么?2024-11-16
- 60%以上低空经济企业上钉钉,钉钉&生态伙伴发布低空行业解决方案2024-11-14
- Claude三巨头回应一切!Opus3.5仍可能发布,5小时视频10万人围观2024-11-12
- 开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版2024-11-12