深度学习与推荐系统

clickstone Beyond Search

项亮出手的第一篇文章，《AlphaGo与深度学习》，不出所料地被广泛传播了。同学们评价的普遍画风是这个样子的：

项大大的文章开始看的饶有兴趣...后面看着看着思考起了人生... #好好学习，天天向上#
嗯，我看懂其中所有的中文和英文，包括数字。
项亮大神出品，看开头我以为我是能看懂的，然后就没有然后了。。。
项大大写的，虽然以为自己能懂实际根本不懂，但并不影响膜拜大神~
大部分是点进去验证一下自己的确看不懂。

有一位同学的分享戳中了我的泪点，「其实每次分享这种干货到朋友圈只是为了证明自己曾经可以看懂」，作为一名机器学习领域的过气选手，我这两年主要精力都放在了做业务上，虽然也做得还不错，但一想起错过了深度学习这一波，我也是宝宝心里苦宝宝不说。。。项亮自己说的，「这篇文字只涉及了AlphaGo算法中1/5的内容」，为了敦促项亮能够持续发文，我先在这里爆他个料，项亮准备把他自己研究深度学习的心得，写成一个系列发表在这里，请大家监督啊！^_^ 这也是大家一起学习的一个好机会。

今天说说深度学习在推荐领域的应用情况。

也许是最早的，算是与 Deep Learning 沾点儿边的推荐算法，是在 Netflix Prize 竞赛后半程异军突起的 Restricted Boltzmann Machine 算法。当时以 SVD++ 为核心的模型几乎已经陷入了僵局，大家基本进入到了比拼trick与融合模型数量的体力活阶段了。RBM 的出现推动整个竞赛上了一个新台阶，相关的论文「Restricted Boltzmann Machines for Collaborative Filtering」在此[1]。但 RBM 本身大家并不认为和 Deep Learning 有太大关系，因为它太“浅”了，官方论文里面最后也提到了 RBM 一个重要的扩展方向就是「Learning Deep Generative Models」。Netflix 在2014年发表了一篇结合使用 GPU 和 AWS 搞分布式神经网络的博客「Distributed Neural Networks with GPUs in the AWS Cloud」[2]，昭告了一下除 Google 之外他们在 deep learning 领域也不容小觑，然而并没有透露太多的应用细节。再多说几句 Netflix Prize，有关 Netflix Prize 对 Netflix Recommendation 带来的改变，可以看看 Netflix 自己的官方博客[3][4]，这几乎也可以看做是推荐系统领域最佳的入门资料。关于 RBM，对工业界同学们更具参考价值的是 Edwin Chen 的这篇「Introduction to Restricted Boltzmann Machines」[5]，更浅显易懂，还有开源代码实现。然后就是最近，有人号称使用 deep learning 取得了比 Netflix Prize 大奖方案更好的结果[6]。

其他一些值得看看的内容：

音乐是 deep learning 适合发挥优势的领域之一，与 Spotify 相关的 deep learning 应用有两篇报导，一篇是「Recommending music on Spotify with deep learning」[7] 很详尽，另外一篇是把 deep learning 与经典的 collaboritive filtering 结合的尝试，「Recurrent Neural Networks for Collaborative Filtering」[8]。
Google 也发表了一篇音乐相关的 deep learning 论文，「Temporal Pooling and Multiscale Learning for Automatic Annotation and Ranking of Music Audio」[9]。
Netflix 的一位算法研究员作为作者之一的「Session-based Recommendations with Recurrent Neural Networks」[10]。
基于 deeplearning4j 的一个推荐引擎「The WellDressed Recommendation Engine」[11]，据说，使用了这个玩意儿的电商网站把 ad coverage 提升了200%。
微软同学在 WWW2015 上的一篇文章，「A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems」[12]，讲在新闻和应用推荐领域使用 deep learning 的一些心得。
最后重磅推荐，Netflix 前推荐引擎总监 Xavier Amatriain 在 KDD2014 上的压轴分享，「The Recommender Problem Revisited」[13]，得认真啃一啃。

今年的 RecSys 会议，将会第一次专门针对 Deep Learning 与 Recommender Systems 设立一个专门的 workshop，将于今年9月15日在 Boston 举办，[14]这里是一些方向性的题目，有启发。欢迎参加的同学能够带回来相关报道，或者哪个直播平台愿意赞助我去直播一下也是极好的。

抛砖引玉，希望大家多多切磋。

[1] http://www.cs.utoronto.ca/~hinton/absps/netflixICML.pdf

[2] http://techblog.netflix.com/2014/02/distributed-neural-networks-with-gpus.html

[3] http://techblog.netflix.com/2012/04/netflix-recommendations-beyond-5-stars.html

[4] http://techblog.netflix.com/2012/06/netflix-recommendations-beyond-5-stars.html

[5] http://blog.echen.me/2011/07/18/introduction-to-restricted-boltzmann-machines/

[6] https://karthkk.wordpress.com/2016/03/22/deep-learning-solution-for-netflix-prize/

[7] http://benanne.github.io/2014/08/05/spotify-cnns.html

[8] http://erikbern.com/wordpress.php?p=589

[9] http://ismir2011.ismir.net/papers/PS6-13.pdf

[10] http://arxiv.org/abs/1511.06939

[11] http://deeplearning4j.org/welldressed-recommendation-engine.html

[12] http://msr-waypoint.com/pubs/238334/frp1159-songA.pdf

[13] http://www.kdd.org/kdd2014/tutorials/KDD - The Recommender Problem Revisited.pdf

[14] http://dlrs-workshop.org/dlrs-2016/cfp/

微信公众号【ResysChina】，中国最专业的个性化推荐技术社区。

点击阅读原文，可以查看项亮讲深度学习的第一篇「AlphaGo 与深度学习」。

继续滑动看下一个