项亮出手的第一篇文章,《AlphaGo与深度学习》,不出所料地被广泛传播了。同学们评价的普遍画风是这个样子的:
项大大的文章开始看的饶有兴趣...后面看着看着思考起了人生... #好好学习,天天向上#
嗯,我看懂其中所有的中文和英文,包括数字。
项亮大神出品,看开头我以为我是能看懂的,然后就没有然后了。。。
项大大写的,虽然以为自己能懂实际根本不懂,但并不影响膜拜大神~
大部分是点进去验证一下自己的确看不懂。
有一位同学的分享戳中了我的泪点,「其实每次分享这种干货到朋友圈只是为了证明自己曾经可以看懂」,作为一名机器学习领域的过气选手,我这两年主要精力都放在了做业务上,虽然也做得还不错,但一想起错过了深度学习这一波,我也是宝宝心里苦宝宝不说。。。项亮自己说的,「这篇文字只涉及了AlphaGo算法中1/5的内容」,为了敦促项亮能够持续发文,我先在这里爆他个料,项亮准备把他自己研究深度学习的心得,写成一个系列发表在这里,请大家监督啊!^_^ 这也是大家一起学习的一个好机会。
今天说说深度学习在推荐领域的应用情况。
也许是最早的,算是与 Deep Learning 沾点儿边的推荐算法,是在 Netflix Prize 竞赛后半程异军突起的 Restricted Boltzmann Machine 算法。当时以 SVD++ 为核心的模型几乎已经陷入了僵局,大家基本进入到了比拼trick与融合模型数量的体力活阶段了。RBM 的出现推动整个竞赛上了一个新台阶,相关的论文「Restricted Boltzmann Machines for Collaborative Filtering」在此[1]。但 RBM 本身大家并不认为和 Deep Learning 有太大关系,因为它太“浅”了,官方论文里面最后也提到了 RBM 一个重要的扩展方向就是「Learning Deep Generative Models」。Netflix 在2014年发表了一篇结合使用 GPU 和 AWS 搞分布式神经网络的博客「Distributed Neural Networks with GPUs in the AWS Cloud」[2],昭告了一下除 Google 之外他们在 deep learning 领域也不容小觑,然而并没有透露太多的应用细节。再多说几句 Netflix Prize,有关 Netflix Prize 对 Netflix Recommendation 带来的改变,可以看看 Netflix 自己的官方博客[3][4],这几乎也可以看做是推荐系统领域最佳的入门资料。关于 RBM,对工业界同学们更具参考价值的是 Edwin Chen 的这篇「Introduction to Restricted Boltzmann Machines」[5],更浅显易懂,还有开源代码实现。然后就是最近,有人号称使用 deep learning 取得了比 Netflix Prize 大奖方案更好的结果[6]。
其他一些值得看看的内容:
音乐是 deep learning 适合发挥优势的领域之一,与 Spotify 相关的 deep learning 应用有两篇报导,一篇是「Recommending music on Spotify with deep learning」[7] 很详尽,另外一篇是把 deep learning 与经典的 collaboritive filtering 结合的尝试,「Recurrent Neural Networks for Collaborative Filtering」[8]。
Google 也发表了一篇音乐相关的 deep learning 论文,「Temporal Pooling and Multiscale Learning for Automatic Annotation and Ranking of Music Audio」[9]。
Netflix 的一位算法研究员作为作者之一的「Session-based Recommendations with Recurrent Neural Networks」[10]。
基于 deeplearning4j 的一个推荐引擎「The WellDressed Recommendation Engine」[11],据说,使用了这个玩意儿的电商网站把 ad coverage 提升了200%。
微软同学在 WWW2015 上的一篇文章,「A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems」[12],讲在新闻和应用推荐领域使用 deep learning 的一些心得。
最后重磅推荐,Netflix 前推荐引擎总监 Xavier Amatriain 在 KDD2014 上的压轴分享,「The Recommender Problem Revisited」[13],得认真啃一啃。
今年的 RecSys 会议,将会第一次专门针对 Deep Learning 与 Recommender Systems 设立一个专门的 workshop,将于今年9月15日在 Boston 举办,[14]这里是一些方向性的题目,有启发。欢迎参加的同学能够带回来相关报道,或者哪个直播平台愿意赞助我去直播一下也是极好的。
抛砖引玉,希望大家多多切磋。
[1] http://www.cs.utoronto.ca/~hinton/absps/netflixICML.pdf
[2] http://techblog.netflix.com/2014/02/distributed-neural-networks-with-gpus.html
[3] http://techblog.netflix.com/2012/04/netflix-recommendations-beyond-5-stars.html
[4] http://techblog.netflix.com/2012/06/netflix-recommendations-beyond-5-stars.html
[5] http://blog.echen.me/2011/07/18/introduction-to-restricted-boltzmann-machines/
[6] https://karthkk.wordpress.com/2016/03/22/deep-learning-solution-for-netflix-prize/
[7] http://benanne.github.io/2014/08/05/spotify-cnns.html
[8] http://erikbern.com/wordpress.php?p=589
[9] http://ismir2011.ismir.net/papers/PS6-13.pdf
[10] http://arxiv.org/abs/1511.06939
[11] http://deeplearning4j.org/welldressed-recommendation-engine.html
[12] http://msr-waypoint.com/pubs/238334/frp1159-songA.pdf
[13] http://www.kdd.org/kdd2014/tutorials/KDD - The Recommender Problem Revisited.pdf
[14] http://dlrs-workshop.org/dlrs-2016/cfp/
点击阅读原文,可以查看项亮讲深度学习的第一篇「AlphaGo 与深度学习」。