网易首页 > 网易科技 > 网易科技 > 正文

腾讯AI Lab开源自动化模型压缩框架PocketFlow 进军移动端

0
分享至

【网易智能讯 9月17日消息】腾讯AI Lab机器学习中心今日宣布成功研发出世界上首款自动化深度学习模型压缩框架PocketFlow,并即将在近期发布开源代码。

据悉,这是一款面向移动端AI开发者的自动模型压缩框架,集成了当前主流(包括腾讯AI Lab自研)的模型压缩与训练算法,结合自研超参数优化组件实现了全程自动化托管式的模型压缩与加速。开发者无需了解具体算法细节,即可快速地将AI技术部署到移动端产品上,实现用户数据的本地高效处理。目前该框架正在为腾讯的多项移动端业务提供模型压缩与加速的技术支持,在多款手机APP中得到应用。

PocketFlow研发背景

随着AI技术的飞速发展,越来越多的公司希望在自己的移动端产品中注入AI能力,以优化用户使用体验。以深度学习为代表的AI技术极大地提升了图像理解、语音识别等诸多应用领域中的识别精度,但是主流的深度学习模型往往对计算资源要求较高,难以直接部署到消费级移动设备中。常用的解决方案是将复杂的深度学习模型部署在云端,移动端将待识别的数据上传至云端,再等待云端返回识别结果,但这对网络传输速度的要求较高,在网络覆盖不佳地区的用户使用体验较差,同时数据上传至云端后的隐私性也难以保证。

在这种情况下,众多模型压缩与加速算法应运而生,能够在较小的精度损失(甚至无损)下,有效提升CNN和RNN等网络结构的计算效率,从而使得深度学习模型在移动端的部署成为可能。但是,如何根据实际应用场景,选择合适的模型压缩与加速算法以及相应的超参数取值,往往需要较多的专业知识和实践经验,这无疑提高了这项技术对于一般开发者的使用门槛。

在此背景下,腾讯AI Lab机器学习中心研发了PocketFlow开源框架,以实现自动化的深度学习模型压缩与加速,助力AI技术在更多移动端产品中的广泛应用。通过集成多种深度学习模型压缩算法,并创新性地引入超参数优化组件,极大地提升了模型压缩技术的自动化程度。开发者无需介入具体的模型压缩算法及其超参数取值的选取,仅需指定设定期望的性能指标,即可通过PocketFlow得到符合需求的压缩模型,并快速部署到移动端应用中。

在模型压缩算法方面,AI Lab机器学习中心提出了一种基于判别力最大化准则的通道剪枝算法,在性能基本无损的前提下可以大幅度降低CNN网络模型的计算复杂度,相关论文发表于NIPS 2018 [1]。该算法在训练过程中引入多个额外的损失项,以提升CNN网络中各层的判别力,然后逐层地基于分类误差与重构误差最小化的优化目标进行通道剪枝,去除判别力相对较小的冗余通道,从而实现模型的无损压缩。在超参数优化算法方面,团队研发了AutoML自动超参数优化框架,集成了包括高斯过程(Gaussian Processes, GP)和树形结构Parzen估计器(Tree-structured Parzen Estimator, TPE)等在内的多种超参数优化算法,通过全程自动化托管解决了人工调参耗时耗力的问题,大幅度提升了算法人员的开发效率。

另一方面,考虑到深度学习模型的训练周期普遍较长,团队对基于TensorFlow的多机多卡训练过程进行优化,降低分布式优化过程中的梯度通信耗时,研发了名为TF-Plus的分布式优化框架,仅需十几行的代码修改即可将针对单个GPU的训练代码扩展为多机多卡版本,并取得接近线性的加速比。此外,团队还提出了一种误差补偿的量化随机梯度下降算法,通过引入量化误差的补偿机制加快模型训练的收敛速度,能够在没有性能损失的前提下实现一到两个数量级的梯度压缩,降低分布式优化中的梯度通信量,从而加快训练速度,相关论文发表于ICML 2018 [2]。

在PocketFlow框架的开发过程中,团队加入了对上述多个自研算法的支持,并且有效降低了模型压缩的精度损失,提升了模型的训练效率,并极大地提高了超参数调节方面的自动化程度。

PocketFlow框架介绍

PocketFlow框架主要由两部分组件构成,分别是模型压缩/加速算法组件和超参数优化组件,具体结构如下图所示。


开发者将未压缩的原始模型作为PocketFlow框架的输入,同时指定期望的性能指标,例如模型的压缩和/或加速倍数;在每一轮迭代过程中,超参数优化组件选取一组超参数取值组合,之后模型压缩/加速算法组件基于该超参数取值组合,对原始模型进行压缩,得到一个压缩后的候选模型;基于对候选模型进行性能评估的结果,超参数优化组件调整自身的模型参数,并选取一组新的超参数取值组合,以开始下一轮迭代过程;当迭代终止时,PocketFlow选取最优的超参数取值组合以及对应的候选模型,作为最终输出,返回给开发者用作移动端的模型部署。

具体地,PocketFlow通过下列各个算法组件的有效结合,实现了精度损失更小、自动化程度更高的深度学习模型的压缩与加速:

a) 通道剪枝(channel pruning)组件:在CNN网络中,通过对特征图中的通道维度进行剪枝,可以同时降低模型大小和计算复杂度,并且压缩后的模型可以直接基于现有的深度学习框架进行部署。在CIFAR-10图像分类任务中,通过对ResNet-56模型进行通道剪枝,可以实现2.5倍加速下分类精度损失0.4%,3.3倍加速下精度损失0.7%。

b) 权重稀疏化(weight sparsification)组件:通过对网络权重引入稀疏性约束,可以大幅度降低网络权重中的非零元素个数;压缩后模型的网络权重可以以稀疏矩阵的形式进行存储和传输,从而实现模型压缩。对于MobileNet图像分类模型,在删去50%网络权重后,在ImageNet数据集上的Top-1分类精度损失仅为0.6%。

c) 权重量化(weight quantization)组件:通过对网络权重引入量化约束,可以降低用于表示每个网络权重所需的比特数;团队同时提供了对于均匀和非均匀两大类量化算法的支持,可以充分利用ARM和FPGA等设备的硬件优化,以提升移动端的计算效率,并为未来的神经网络芯片设计提供软件支持。以用于ImageNet图像分类任务的ResNet-18模型为例,在8比特定点量化下可以实现精度无损的4倍压缩。

d) 网络蒸馏(network distillation)组件:对于上述各种模型压缩组件,通过将未压缩的原始模型的输出作为额外的监督信息,指导压缩后模型的训练,在压缩/加速倍数不变的前提下均可以获得0.5%-2.0%不等的精度提升。

e) 多GPU训练(multi-GPU training)组件:深度学习模型训练过程对计算资源要求较高,单个GPU难以在短时间内完成模型训练,因此团队提供了对于多机多卡分布式训练的全面支持,以加快使用者的开发流程。无论是基于ImageNet数据的Resnet-50图像分类模型还是基于WMT14数据的Transformer机器翻译模型,均可以在一个小时内训练完毕。

f) 超参数优化(hyper-parameter optimization)组件:多数开发者对模型压缩算法往往不甚了解,但超参数取值对最终结果往往有着巨大的影响,因此团队引入了超参数优化组件,采用了包括强化学习等算法以及AI Lab自研的AutoML自动超参数优化框架来根据具体性能需求,确定最优超参数取值组合。例如,对于通道剪枝算法,超参数优化组件可以自动地根据原始模型中各层的冗余程度,对各层采用不同的剪枝比例,在保证满足模型整体压缩倍数的前提下,实现压缩后模型识别精度的最大化。


PocketFlow性能展示

通过引入超参数优化组件,不仅避免了高门槛、繁琐的人工调参工作,同时也使得PocketFlow在各个压缩算法上全面超过了人工调参的效果。以图像分类任务为例,在CIFAR-10和ImageNet等数据集上,PocketFlow对ResNet和MobileNet等多种CNN网络结构进行有效的模型压缩与加速。

在CIFAR-10数据集上,PocketFlow以ResNet-56作为基准模型进行通道剪枝,并加入了超参数优化和网络蒸馏等训练策略,实现了2.5倍加速下分类精度损失0.4%,3.3倍加速下精度损失0.7%,且显著优于未压缩的ResNet-44模型; 在ImageNet数据集上,PocketFlow可以对原本已经十分精简的MobileNet模型继续进行权重稀疏化,以更小的模型尺寸取得相似的分类精度;与Inception-V1、ResNet-18等模型相比,模型大小仅为后者的约20~40%,但分类精度基本一致(甚至更高)。



相比于费时费力的人工调参,PocketFlow框架中的AutoML自动超参数优化组件仅需10余次迭代就能达到与人工调参类似的性能,在经过100次迭代后搜索得到的超参数组合可以降低约0.6%的精度损失;通过使用超参数优化组件自动地确定网络中各层权重的量化比特数,PocketFlow在对用于ImageNet图像分类任务的ResNet-18模型进行压缩时,取得了一致性的性能提升;当平均量化比特数为4比特时,超参数优化组件的引入可以将分类精度从63.6%提升至68.1%(原始模型的分类精度为70.3%)。



瞄准移动端AI开发者

在腾讯公司内部,PocketFlow框架正在为多项移动端实际业务提供了模型压缩与加速的技术支持。例如,在手机拍照APP中,人脸关键点定位模型是一个常用的预处理模块,通过对脸部的百余个特征点(如眼角、鼻尖等)进行识别与定位,可以为后续的人脸识别、智能美颜等多个应用提供必要的特征数据。团队基于PocketFlow框架,对人脸关键点定位模型进行压缩,在保持定位精度不变的同时,大幅度地降低了计算开销,在不同的移动处理器上取得了25%-50%不等的加速效果,压缩后的模型已经在实际产品中得到部署。


深度学习模型的压缩与加速是当前学术界的研究热点之一,同时在工业界中也有着广泛的应用前景。随着PocketFlow的推出,开发者无需了解模型压缩算法的具体细节,也不用关心各个超参数的选择与调优,即可基于这套自动化框架,快速得到可用于移动端部署的精简模型,从而为AI能力在更多移动端产品中的应用铺平了道路。

[1] Zhuangwei Zhuang, Mingkui Tan, Bohan Zhuang, Jing Liu, Jiezhang Cao, Qingyao Wu, Junzhou Huang, Jinhui Zhu, “Discrimination-aware Channel Pruning for Deep Neural Networks", In Proc. of the 32nd Annual Conference on Neural Information Processing Systems, NIPS '18, Montreal, Canada, December 2018.

[2] Jiaxiang Wu, Weidong Huang, Junzhou Huang, Tong Zhang, “Error Compensated Quantized SGD and its Applications to Large-scale Distributed Optimization”, In Proc. of the 35th International Conference on Machine Learning, ICML ’18, Stockholm, Sweden, July 2018.

相关推荐
热点推荐
35岁失业真的很难找工作吗?网友:boss直聘上简历基本可以销号了

35岁失业真的很难找工作吗?网友:boss直聘上简历基本可以销号了

王老师日常
2024-04-26 11:13:41
美国务卿布林肯访华,台湾问题摊牌

美国务卿布林肯访华,台湾问题摊牌

金羊网
2024-04-25 09:20:27
外媒:外商在广交会对“中国造”投下信任票

外媒:外商在广交会对“中国造”投下信任票

参考消息
2024-04-25 15:23:14
天哪罗志祥的脸太吓人了,满脸的科技感,好像哪里都动过了

天哪罗志祥的脸太吓人了,满脸的科技感,好像哪里都动过了

娱乐八卦木木子
2024-04-26 03:08:07
上门按摩师:假装盲人后,富家母女在我面前展现鲜为人知的一面

上门按摩师:假装盲人后,富家母女在我面前展现鲜为人知的一面

茶馆说书人
2023-09-08 11:46:14
《浪姐5》韩雪没实力又迷之自信,何洁反应真实!装都懒得装?

《浪姐5》韩雪没实力又迷之自信,何洁反应真实!装都懒得装?

娱乐圈笔娱君
2024-04-25 14:18:37
女私教与男会员贴心聊天记录曝光,这也太劲爆了.....

女私教与男会员贴心聊天记录曝光,这也太劲爆了.....

跑步心情
2024-04-26 09:55:27
英首相称中国“威权主义国家”,中方对他的称呼变了,性质严重了

英首相称中国“威权主义国家”,中方对他的称呼变了,性质严重了

说天说地说实事
2024-04-25 20:10:30
潍坊一男子和小三开房,漂亮女友带人抓现行,先打完小三后打男友

潍坊一男子和小三开房,漂亮女友带人抓现行,先打完小三后打男友

汉史趣闻
2024-04-25 18:33:10
拉黑汪小菲、抚养费不要,让孩子丢掉生日礼物,大S这次铁了心了

拉黑汪小菲、抚养费不要,让孩子丢掉生日礼物,大S这次铁了心了

七阿姨爱八卦
2024-04-25 16:59:55
东莞一镇原镇长被查,其继任者去年已被双开

东莞一镇原镇长被查,其继任者去年已被双开

南方都市报
2024-04-26 10:36:12
星光大道6位冠军现状:多人已无人问津,有人负债累累卖菜谋生

星光大道6位冠军现状:多人已无人问津,有人负债累累卖菜谋生

娱乐的小灶
2024-04-24 21:03:36
你的老师都做过什么惊为天人的事情?网友:从此全校的人惊为天人

你的老师都做过什么惊为天人的事情?网友:从此全校的人惊为天人

兰妮搞笑分享
2024-04-14 05:44:28
中央5台直播足球时间表:4月26日CCTV5不直播中超第八轮比赛!

中央5台直播足球时间表:4月26日CCTV5不直播中超第八轮比赛!

阳阳聊情感
2024-04-26 10:39:59
2005年,蓝洁瑛流落街头,成奎安吩咐饭店老板:以后她吃饭我买单

2005年,蓝洁瑛流落街头,成奎安吩咐饭店老板:以后她吃饭我买单

回京历史梦
2024-04-26 10:27:43
按摩时,足浴技师问你“之前来过么?”可能在暗示你,别不当回事

按摩时,足浴技师问你“之前来过么?”可能在暗示你,别不当回事

毒舌混知所
2024-03-30 07:50:03
烂!43岁阿娇新片和90后男演员拍三角恋,被众嘲:当代西门大妈

烂!43岁阿娇新片和90后男演员拍三角恋,被众嘲:当代西门大妈

靠谱电影君
2024-04-25 19:04:35
三婚女子风韵不减当年,三男子争相求婚,村民:比头婚还抢手!

三婚女子风韵不减当年,三男子争相求婚,村民:比头婚还抢手!

雅清故事汇
2024-04-25 13:19:14
戏子误国!国家终于出手,人民日报发声撕掉了哪些明星的遮羞布?

戏子误国!国家终于出手,人民日报发声撕掉了哪些明星的遮羞布?

橘子大娱社
2024-04-24 20:55:03
英媒:字节跳动公司可能在美国关闭TikTok

英媒:字节跳动公司可能在美国关闭TikTok

周观环宇
2024-04-26 08:34:06
2024-04-26 14:34:44

科技要闻

中国车企“五常”激战北京车展

头条要闻

律师家中燃气管道被拆除 起诉私闯民宅获最高法立案

头条要闻

律师家中燃气管道被拆除 起诉私闯民宅获最高法立案

体育要闻

库里当选最佳关键球员 10项数据联盟第一

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

艺术
教育
房产
本地
数码

艺术要闻

艺术名画︱爱尔兰画家大卫·科因的刀画作品

教育要闻

是什么让满课大学生在深夜里奔跑?

房产要闻

涉及黄埔、番禺、增城!广州新一轮大规模征地启动

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

数码要闻

英特尔计划明年中旬发布 Intel 18A 制程自家处理器产品

无障碍浏览 进入关怀版
×