1新智元学术
来源:Facebook AI 实验室(FAIR)
作者:Yin Li 等
【新智元导读】Facebook最近在美国的日子不算好过。据英国《卫报》报道,Facebook平台上广受欢迎的新闻推送功能实际上严重依赖于编辑团队来决定新闻内容的取舍和筛选。这一事实引发了美国舆论对Facebook存在政治偏见的抗议。国外有学者撰文强调,Facebook的偏见不可避免,因为算法本身就不是中立的,程序员自身也不是绝对中立的。这再次强调了在人工智能的发展中非监督式学习的必要性。在Facebook AI实验室的这份最新论文中,作者在图像检测中试行了一种简单但有效的无监督训练边缘检测的方法,已接近用完全监督训练的同类边缘检测效果(差异在 3-5% 范围内)。
根据Facebook AI实验室的研究人员田渊栋的介绍:Facebook AI Research (FAIR) 目前在加州的Menlo Park,纽约曼哈顿和法国巴黎有三个分部。总的来说,学术氛围是非常浓厚的,大家坐在Facebook新建的20楼中央做深度学习的研究,目标是发高质量的文章,做有影响力的前沿工作。研究方向相对自由宽松,研究所需的计算资源(如GPU)相对丰富,同时也没有近期的产品压力,可以着眼长远做困难和本质的研究问题。这样的学术氛围除了MSR之外,在各大公司是极其少见的。
扎克伯格之前提过Facebook将来的三大主要方向,其中之一就是人工智能,目前看来公司也确实非常看重我们这个组。FAIR重要的公开工作有DeepFace,运用深度学习将人脸识别(更准确说是人脸判定)提高到Human-level,Memory Networks,在深度学习中加入长期记忆(Long-term memory)以构建自然语言问答系统,开源深度学习框架Torch的更新和推广,运用快速傅利叶变换加速卷积运算的CuFFT,等等。
原题目:Unsupervised Learning of Edges
边缘(检测)中的无监督学习
在新智元的微信公众号后台回复“0522”可下载论文
数据驱动方法在边缘检测领域已被证明有效,并在现代基准测试中取得了顶尖的结果。然而,目前所有数据驱动的边缘检测都要求人以手工标注区域分割或对象边界的方式对训练过程进行监督。特别是,人类标注者会标记出那些语义上有意义的边缘,而这些边缘随后会被用于训练。对于学习准确检测边缘来说,这种强的高水平监督真的是必要的吗?在本研究中我们展示了一种简单但有效的无监督训练边缘检测的方法。为此我们利用了图像的运动。更特别地,我们这一方法的唯一输入是帧之间的嘈杂半密集匹配( noisy semi-dense matches)。我们从对边缘的(图像梯度)初步知识开始,在提高运动估计和边缘检测之间来轮流切换。通过使用庞大的视频数据素材,我们表明用我们的无监督方法训练出的边缘检测器已接近用完全监督方法训练的同类边缘检测器(差异在 3-5% 范围内)。最后,我们表明,当为这些边缘识别器使用深度神经网络时,我们的方法为对象检测提供了一种崭新的预训练模式。
图2:图像的半密集匹配结果是该方法的唯一输入。
在训练期间我们在下面四个过程之间轮流切换:(1)通过匹配与边缘图来计算光流;(2)从光流场中计算运动图像边缘(绿色表示命中的边缘样本,蓝色表示丢弃的运动图像边缘);(3)以运动图像边缘为监督来训练边缘检测器;(4)通过这一新的检测器来重新计算图像边缘。该过程在庞大的视频素材中迭代,导向了光流与边缘的准确度的提高。
图5,对样本图像的边缘检测结果。第 1 行是原始图像,第 2 行是由人类画出的边界。第 3 和第 4 行分别是用伯克利分割图像数据集(BSDB) 和视频训练出的结构化边缘(Structured Edge)得到的结果。第 5和第 6 行是用 BSDB 和视频训练的整体化边缘(Holistic Edge)得到的结果。最后两行中的“十字”符号表示是从随机初始值开始训练的。
在本研究中,我们提出,在无监督的情况下通过捕捉运动图像边缘来从视频中训练边缘检测器。我们研发了一个迭代过程,这个过程在“用边缘结果来更新光流”与“基于光流场来学习边缘检测器”之间来回切换,从而使边缘与光流的准确度越来越高。
我们的论文的主要结果是,使用我们的无监督方法训练的边缘检测器接近了用完全监督方法训练的同类边缘检测器。我们还发现,我们的方法可以成为一种崭新的对深度网络的无监督预训练模式。尽管从预训练中获得的成果是有限的,我们相信对于未来探索而言这是一个有希望的方向。长期而言,我们相信对边缘检测的无监督学习有可能超过监督训练,因为无监督方法可以处理无限多的数据。我们的工作迈出了这一方向上的第一步。
「招聘」
全职记者、编译和活动运营
欢迎实习生
以及人工智能翻译社志愿者
详细信息请进入公众号点击「招聘」
或发邮件至 jobs@aiera.com.cn
新智元招聘信息请点击“阅读原文”