作为业内备受瞩目的国际顶级会议,第16届OSDI(Operating Systems Design and Implementation)已于日前召开,并正式公布了论文接收名单。其中,微信团队《Ekko: 超大规模推荐系统的模型低延时更新方案》论文成功入选,这也是腾讯首次以第一单位于该会议发表论文。
被誉为系统界的“奥斯卡”,OSDI汇集了全球计算机科学家们对于计算机系统的前瞻性思考,其成果往往引领着全球计算机发展的方向。创会以来近30年,国内单位在该会议发表论文总数仅20余篇,而本届OSDI的论文接收篇数更是低至49篇。
Ekko 来源于微信内部的 WePS 项目,是一个超大规模推荐系统模型低延时更新的解决方案。微信团队入选论文对Ekko展开了详解——面对实时社交活动的场景需求以及微信10亿+的用户体量,业界此前最好的推荐模型更新方案都不能很好地进行适配,于是Ekko应运而出。
Ekko方案包含高效的P2P模型更新传输服务、SLO感知的模型更新调度器、模型状态管理器三大部分,并于全面测试中展示出相比最先进的深度学习推荐系统高达几个数量级更快的模型更新下发性能。不仅在学术上填补了业界在模型高效更新上的空白,更比此前的最佳方案提升高达100x。
Ekko方案已于微信业务场景落地两年,目前微信数千台机器上存储了数百TB的Ekko模型,涵盖包括视频号、看一看和订阅号等场景,每天服务超过10亿用户。视频号更是在全量使用基于Ekko的在线推荐后,结合产品迭代与运营,全球模型更新生效延时低于2.4秒,半年内日活增加达40%,总播放量增长达87%。
论文成果受国际顶会认可,背后是微信及腾讯多年来持续开展计算机系统领域投入、潜心技术研究的成果。接下来,微信团队也将继续加强基础理论和关键技术的研发,并基于前沿技术应用于丰富的业务场景,优化产品体验,带动行业服务。