RTX 3090 AI性能实测：FP32训练速度提升50%，张量核心缩水

晓查 2020-10-03 13:24:55 来源：量子位

RTX 3090是最强AI训练卡吗？

晓查发自凹非寺
量子位报道 | 公众号 QbitAI

NVIDIA最近发布了备受期待的RTX 30系列显卡。

其中，性能最强大的RTX 3090具有24GB显存和10496个CUDA核心。而2018年推出的旗舰显卡Titan RTX同样具有24GB显存。

RTX 3090在深度学习训练任务中，性能表现究竟如何，它能否取代Titan RTX成为最强消费级AI训练卡？现在已经有了答案。

国外两位AI从业者在拿到这款显卡后，第一时间测试了其在TensorFlow上的AI训练性能。

由于RTX 3090现阶段不能很好地支持TensorFlow 2，因此先在TensorFlow 1.15上进行测试。

话不多说，先看数据。在FP32任务上，RTX 3090每秒可处理561张图片，Titan RTX每秒可处理373张图片，性能提升50.4%！

而在FP16任务上，RTX 3090每秒可处理1163张图片，Titan RTX每秒可处理1082张图片，性能仅提升7.5%。

为何在FP32任务上的性能提升比在FP16上更明显，主要是因为RTX 3090大大提高了CUDA核心的数量。但是用于处理FP16的张量核心数量明显减少，这可能会影响FP16性能。

即便如此，张量核心更少的RTX 3090在很多FP16任务上，性能依然有小幅提升。

随后，英伟达官方提供了支持RTX 3090的CUDA 11.1，谷歌官方在TensorFlow nightly版中提供了对最新显卡的支持。

又有用户再次测试了两款显卡的性能对比。

△ 训练性能：每秒处理的图片数量

可以看出，使用FP32进行的所有模型训练，RTX 3090都能实现40%~60%的训练提升。而大多数模型的FP16训练速度几乎不变，最多提升20%，甚至在Inception模型上还有所下降。

只能说RTX 3090在张量核心上的“刀法”颇为精准，如果你对FP16训练性能有较高要求，也许可以等待今后的升级版。

不过RTX 3090上市价格仅1499美元，比Titan RTX便宜1000美元，仍不失为“性价比”之选。

参考链接：

https://www.pugetsystems.com/labs/hpc/RTX3090-TensorFlow-NAMD-and-HPCG-Performance-on-Linux-Preliminary-1902/

https://www.evolution.ai/post/benchmarking-deep-learning-workloads-with-tensorflow-on-the-nvidia-geforce-rtx-3090

AI GPU 英伟达

晓查

RTX 3090 AI性能实测：FP32训练速度提升50%，张量核心缩水

相关阅读

Ilya离职后第一个动作：点赞了这篇论文，网友抢着传看

零基础深度学习教程爆火！专为手机阅读打造，月超23万人下载，155页内容免费开放

阿里达摩院提出时序预测新模型精准预测电网负荷

IDC：今年上半年中国GPU服务器市场规模8.3亿美元，同比增长53.7%

报告：AI岗年薪下降8.9%，收入不及2018年

瑞为技术完成数亿元C轮融资

热门文章

AI应用突围，中小企业的新周期已至

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器

全球首个Linux开发本：50TOPS算力，DeepSeek都配好了，可随地大小开发

阿里云造“Agent工厂”，百炼MCP服务上线，无需代码5分钟建Agent

倒计时1周！20余位行业大佬共话AI，中国AIGC产业峰会最全攻略在此

RTX 3090 AI性能实测：FP32训练速度提升50%，张量核心缩水

相关阅读

Ilya离职后第一个动作：点赞了这篇论文，网友抢着传看

零基础深度学习教程爆火！专为手机阅读打造，月超23万人下载，155页内容免费开放

阿里达摩院提出时序预测新模型 精准预测电网负荷

IDC：今年上半年中国GPU服务器市场规模8.3亿美元，同比增长53.7%

报告：AI岗年薪下降8.9%，收入不及2018年

瑞为技术完成数亿元C轮融资

热门文章

AI应用突围，中小企业的新周期已至

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器

全球首个Linux开发本：50TOPS算力，DeepSeek都配好了，可随地大小开发

阿里云造“Agent工厂”，百炼MCP服务上线，无需代码5分钟建Agent

倒计时1周！20余位行业大佬共话AI，中国AIGC产业峰会最全攻略在此

阿里达摩院提出时序预测新模型精准预测电网负荷