TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变

晓查 2019-05-15 12:31:24 来源：量子位

经过处理可以将MNIST的90％稀疏度模型从12MB压缩到2MB。

晓查编译自 Medium

量子位报道 | 公众号 QbitAI

去年TensorFlow官方推出了模型优化工具，最多能将模型尺寸减小4倍，运行速度提高3倍。

最近现又有一款新工具加入模型优化“豪华套餐”，这就是基于Keras的剪枝优化工具。

训练AI模型有时需要大量硬件资源，但不是每个人都有4个GPU的豪华配置，剪枝优化可以帮你缩小模型尺寸，以较小的代价进行推理。

什么是权重剪枝？

权重剪枝（Weight Pruning）优化，就是消除权重张量中不必要的值，减少神经网络层之间的连接数量，减少计算中涉及的参数，从而降低操作次数。

这样做的好处是压缩了网络的存储空间，尤其是稀疏张量特别适合压缩。例如，经过处理可以将MNIST的90％稀疏度模型从12MB压缩到2MB。

此外，权重剪枝与量化（quantization）兼容，从而产生复合效益。通过训练后量化（post-training quantization），还能将剪枝后的模型从2MB进一步压缩到仅0.5MB 。

TensorFlow官方承诺，将来TensorFlow Lite会增加对稀疏表示和计算的支持，从而扩展运行内存的压缩优势，并释放性能提升。

优化效果

权重剪枝优化可以用于不同任务、不同类型的模型，从图像处理的CNN用于语音处理的RNN。下表显示了其中一些实验结果。

以GNMT从德语翻译到英语的模型为例，原模型的BLEU为29.47。指定80%的稀疏度，经优化后，张量中的非零参数可以从211M压缩到44M，准确度基本没有损失。

使用方法

现在的权重剪枝API建立在Keras之上，因此开发者可以非常方便地将此技术应用于任何现有的Keras训练模型中。

开发者可以指定最终目标稀疏度（比如50%），以及执行剪枝的计划（比如2000步开始剪枝，在4000步时停止，并且每100步进行一次)，以及剪枝结构的可选配置。

import tensorflow_model_optimization as tfmot
model = build_your_model() 
pruning_schedule = tfmot.sparsity.keras.PolynomialDecay(
 initial_sparsity=0.0, final_sparsity=0.5,
 begin_step=2000, end_step=4000)
model_for_pruning = tfmot.sparsity.keras.prune_low_magnitude(model, pruning_schedule=pruning_schedule)
... 
model_for_pruning.fit

△ 三个不同张量，左边的没有稀疏度，中心的有多个单独0值，右边的有1×2的稀疏块。

随着训练的进行，剪枝过程开始被执行。在这个过程中，它会消除消除张量中最接近零的权重，直到达到当前稀疏度目标。

每次计划执行剪枝程序时，都会重新计算当前稀疏度目标，根据平滑上升函数逐渐增加稀疏度来达到最终目标稀疏度，从0%开始直到结束。

用户也可以根据需要调整这个上升函数。在某些情况下，可以安排训练过程在某个步骤达到一定收敛级别之后才开始优化，或者在训练总步数之前结束剪枝，以便在达到最终目标稀疏度时进一步微调系统。

△权重张量剪枝动画，黑色的点表示非零权重，随着训练的进行，稀疏度逐渐增加

GitHub地址：

https://github.com/tensorflow/model-optimization

官方教程：

https://www.tensorflow.org/model_optimization/guide/pruning/pruning_with_keras

TensorFlow 优化算法

晓查

TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变

相关阅读

PyTorch一年增长194%，兼容性更强，超越TensorFlow指日可待

模型压缩一半，精度几乎无损，TensorFlow推出半精度浮点量化工具包，还有在线Demo

TensorFlow全球下载量破1亿，Jeff Dean激动不已，但网友却不给面子

PyTorch横扫各大顶会，TensorFlow退守工业界：机器学习框架，一年间局势突变

PyTorch统治学术论文，TensorFlow只占4%，LeCun：还能为啥？

各种AI模型拿来就能用！五大深度学习模型库大盘点

热门文章

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

联想百应智能体入选量子位“2025年值得关注的AIGC产品”：国内首个AI服务智能体打破中小企业AI落地困局

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比

DeepSeek引爆「万物皆可AI」时代，20余位大咖分析行业痛点，万字梳理干货在此