深度重磅 | 麻省理工科技评论：AI 即将腾飞

本文经「DeepTech深科技」（微信公众号：mit-tr）授权转载，禁止二次转载

推荐自：钱皓-互联网分析师微信ID：qianhaoapp

编者注：4月，麻省理工科技评论独家推出关于人工智能的专题报告，名为《AI 即将腾飞》。首先，须定义究竟什么是人工智能？在如今这个百家争鸣的社会，大家都有一套自己对人工智能的定义。在这里，我们将抛砖引玉，介绍一下自己的见解。

人工智能，就像字面的含义一样，它是模拟人类思考元素的集大成者，学习能力和推理能力是其核心内容。举个简单的例子，“机器学习（Machine Learning）”就是人工智能领域里很有前途的课题，其主要内容是利用大数据训练程序，让它们找到一些可遵循的规律，并且让程序本身大胆的预测结果。

谷歌搜索引擎的算法正利用机器学习提升自己的搜索能力。值得一提的是，机器学习还能应用在语音识别和图像识别中，而且自动驾驶技术现在也开始使用机器学习理论来构建主程序了。加入了新的元素之后，机器学习理论现在最新的发展方向是一种叫做“深度学习（Deep Learning）”的理论。

深度学习主要模拟了人脑对新事物的反应、例如学习行为，它粗略地构建了人脑中神经以及神经突触的层级关系。深度学习是人工智能领域十分火热的研究方向，它已经被广泛应用于协助机器执行任务，甚至是使人工智能呈现类似直觉的行为。

值得一提的是，借助深度学习，有时候机器的执行力甚至比人类更加好。而且深度学习的兼容性也十分好，很容易加入人工智能的其他元素，使呈现的结果锦上添花。

讲完对人工智能最基本的定义，我们有必要通过下面的图表来回顾人工智能的发展历史，包括其中的大事件。

人工智能发展史

经过一个世纪的浮沉，人工智能越来越智能了。

1914

一切的一切就要从世界上最早的电脑游戏说起，那是由西班牙发明家伦纳德·托里斯·克维多（Leonardo Torres y Quevedo）发明的游戏“El Ajedrecista（西班牙语，意思为棋手）”。这样的一款游戏有自己的机械架构，能下国际象棋的程序嵌入了机械架构之中。

1943

神经学家沃伦·麦卡洛克（Warren McCulloch）以及逻辑学家瓦特·匹兹（Walter Pitts）发明了能进行逻辑演算的“逻辑单元”，它们能有序连接在一起，就像一个真正的大脑一样。

1950

人工智能研究真正意义上的目标被确立。阿兰·图灵（Alan Turing）在自己的论文中提出设想“机器真的能思考么？”，并提出大胆预测：到2000年，电脑的思考能力已经能超过时下30%的人类了。

1956

约翰·麦卡锡（John McCarthy），马文·明斯基（Marvin Minsky）以及克劳德·香农（Claude Shannon）在达特茅斯举办了一次夏季研讨会，会上汇总并整理了信息学、人工神经网络以及数理逻辑的先进理论，并且最早提出了“人工智能（Artificial Intelligence）”这一名词。

1958

奥利佛·塞尔弗里奇（Oliver Selfridge）在他的论文中提出“万魔殿（Pandemonium）”理论。一种新的神经网络模型被提出，由低级的“数据恶魔（Data Demons）”和高级的“认知恶魔（Cognitive Demons）”协同工作完成模式识别及其他任务。

1960

弗兰克·罗森布拉特（Frank Rosenblatt）展示了“Mark I Perceptron”，这是一次构建人工神经网络并用以图像识别的尝试。纽约时报称之为计算机的“能走，能说，能看，能写，能繁殖…以及能感知自己的存在”的第一步。

1961

马文·明斯基发表了其成名作“前进人工智能！”（Steps Toward Artificial Intelligence）。

1987

厄恩斯特·迪克曼（Ernst Dickmanns）及其团队将奔驰的小货车配备了一台摄像机、一块微处理芯片还有其他一些功能电路，实现了无人驾驶功能，并且时速在60英里每小时左右。在其他人工智能的研究停滞不前，美国国防部先进研究项目局（Defense Advanced Research Projects Agency）削减了该项目的资金。

1997

IBM公司的深蓝电脑成功复仇前世界国际象棋冠军加里·卡斯帕罗夫（Garry Kasparov）。此役被拍成纪录片“人与机器（The Man vs. the Machine）”。

2000

辛西娅·布里泽尔（Cynthia Breazeal）设计了社交机器人“Kismet”，它能表达情感也能与人互动。

2004

美国国防部先进研究项目局资助并举办了第一届“大挑战（Grand Challenge）”，参赛的研究小组需要设计无人驾驶汽车并独立通过莫哈韦沙漠。

2011

IBM的人工智能Watson击败“危险边缘（Jeopardy!）”的两届冠军肯·詹宁斯（Ken Jennings）以及布拉德·拉特（Brad Rutter）。比赛全程电视直播，持续三个晚上，每晚两项竞赛，结果由计算机完胜人类告终。

2012

杰夫欣顿实验室（Geoff Hinton’s lab）组建的一支参赛队伍，在ImageNet图像识别大赛一举夺魁。他们使用的深度学习软件，在对上千种不同物品识别的测试中，均在5次以内就可以完成识别，且正确率达到85%，创下最高准确率。

2014

谷歌收购“DeepMind Technologies”，这是一家位于伦敦的小型创业公司。其专业领域为深度学习，是时下最前沿的人工智能技术，旨在实现图像识别和语音识别。

2016

谷歌的“AlphaGo”机器人4:1大胜曾经的围棋世界冠军李世石。

基于以上的时间线，我们需要从不同的角度来阐述人工智能是如何将从方方面面开始改变我们的工作和产业。五月，我们也将在美国旧金山举办Emtech Digital人工智能论坛，本次论坛的主题是“人工智能如何重塑我们的行业”。后续，我们在中国也将举办一系列类似的活动。在此之前，我们先从这份报道开始我们的人工智能之旅，以下是目录及详细内容：

大问题 工业界的最炫人工智能风

专家问答 对话谷歌大脑负责人：大众的机器学习

深度思考 当人工智能邂逅百度

人工智能/人类协作 人机合作才是正道

工具智能语音领域值得关注创业公司

专家问答 人工智能的颠覆时刻

研究丰田的新型独角兽：如同登月般来改变世界

技术人工智能之弊：偏见的数据将成为人工智能发展的重大瓶颈?

工作人工智能人才炙手可热

工业界的最炫人工智能风

工业界已经对人工智能蠢蠢欲动了，那么这项科技的未来到底如何呢？

先进的机器学习理念，以及数据存储处理成本的下降，使得2015年成为人工智能的腾飞之年。

作为美国联合服务协会（USAA）的数据科学部部长罗伯特·韦尔伯恩（Robert Welborn）认为，2015年是机器学习商业化进程快速发展的一年。时下存储市场的大范围降价，以及存储设备制造成本的降低是机器学习领域腾飞的关键。而当大数据遇上机器学习，一个计算机科学家朝思暮想了数十载的科技也变得触手可及——深度学习。

保险业、金融业、制造业、石油和天然气行业、汽车制造业以及医疗保健行业，这些也许不是你一想到人工智能就能想到的行业。然而继谷歌、百度以及一系列网络公司设立人工智能实验室之后，工业界也刮起了最炫的人工智能风潮。

那么我们不禁要发问：人工智能商业化之后的发展会如何？人工智能会给工业界带来怎样的改变。这将是本次商业报告的“大问题”——主要关注点。

虽然人工智能前途无限，但是现在工业界使用的人工智能软件还只能算是它的九牛一毛。国际数据公司IDC研发部的主任，戴夫·舒布梅尔（Dave Schubmehl）统计并计算了去年各大公司所有认知软件平台的销售情况，除了谷歌和Facebook这种自己自主研发的公司，其他公司的销售总额已经超过了10亿美金。

由此他也大胆预测，到2020年这个数字将超过100亿美金。除了行业内一些大企业，比如IBM以及大数据公司Palantir Technologies，人工智能的市场还由很多初创公司组成。至今为止，由彭博（Bloomberg）公司提供的数据显示，已经有超过2600个人工智能的初创公司成立了。

这么看起来，人工智能的市场还是欣欣向荣的，但从技术层面上来说人工智能中许多的方向——例如模式识别（pattern recognition）、自然语言处理（natural language processing）、图像识别（image recognition）以及假设生成（hypothesisgeneration）——还有很长一段路要走。

先让我们看看人工智能的成功应用。USAA作为最早一批应用人工智能的公司，已经尝试用不同的方式，应用人工智能来完善公司推出的盗窃识别系统。韦尔伯恩介绍说：“该系统的核心就是寻找并匹配客户的典型习惯，如不匹配则判定该操作为异常，即使是在初次操作的时候。我们系统具有学习能力，而且很擅长识别看起来怪异的行为。”识别初次遇到的犯罪行为毫无疑问是这个系统的一大亮点，因为传统的系统往往只能在第二次遭遇犯罪行为时才能识别。

USAA利用人工智能的成功案例还包括，他们利用人工智能来提高客户服务。该系统中引入的人工智能由刚刚被 Intel 收购的Saffron开发完成，系统主要模拟了人脑思维的跳跃性。具体地说，研发人员在系统中加入了7000种不同的元素之后，人工智能便能识别并匹配广大用户的行为。

令人惊讶的是，88%的情况下该系统做出的预测均是正确的，例如预测用户会用什么方式联系USAA，（通过网站？电话？还是电子邮件？）或者是预测用户的需求。而没有人工智能的老系统只能蒙对50%。有着这样骄人的成绩，该系统的应用也正在拓宽。

再说说其他的公司：美国通用电气公司（General Electric）。他们应用人工智能来提高其高精尖飞机引擎的售后服务。该系统集成了一种叫做计算机视觉的人工智能系统（最初由通用电气旗下的NBC环球影视公司开发，主要用来对电影以及电视剧进行分类操作）。

另外，借助计算机辅助设计（CAD）画图以及摄像头和红外探测器的数据采集，通用电气公司利用这样的系统进行检测飞机引擎风扇的裂缝以及其他问题。

该检测系统已经成功投入使用，并且比质检员的效率还高，例如它没有周一和周五的“消极怠工”。但是系统本身还并不完善，还是需要专人来确认它检测的问题。“如此一来一回，检测系统便能识别检测的模式。”通用电气的软件研发部副部长科林·巴里（Colin Parris）如是说。

除了以上的应用，人工智能还能用作新产品和新服务的“推手”。像安德玛（Under Armour）这样的运动品牌大公司，正在开始尝试使用人工智能拉近与客户之间的关系。这是一家有超过1亿6千万客户的公司，旗下设计并产出了很多运动装备，以及像“My FitnessPal”这种提供运动健身信息的手机应用。

安德玛公司决意拓展自己的业务，并不局限于只帮用户记录健身信息。他们已经和IBM的认知计算系统公司Watson达成战略性合作关系，他们将把安德玛公司提供的健身信息和第三方收集的睡眠、活动、健身以及营养信息加入人工智能系统。最终的目标是提供个人健身或者健康的指导，最终能为超过1亿6千万用户提供更有意义的数据支持与服务。

看着USAA和安德玛公司对人工智能的应用，我们仿佛能看到人工智能的未来，与其说像电影中的那种拟人化机器人，不如说是能与时俱进的趁手工具。尽管人工智能会使很多工人失去工作，但是人的判断与反馈对人工智能，比如机器学习系统，还是不可或缺的。

在此次的人工智能商业报告中还有一篇提到人对于人工智能的重要性，欢迎大家继续阅读，那是罗伯特 D·霍夫（Robert D.Hof）撰写的文章。文中提到的谷歌公司工业部副部长约翰·詹南德雷亚（John Giannandrea）在接受罗伯特·霍夫采访时曾说过：“就算你有一台高大上的车子，它还是需要你给它指示目的地在哪。”

对话谷歌大脑负责人：大众的机器学习

“机器学习最近的飞跃是在此研究领域之外的成功应用。”谷歌大脑（Google Brain research group）的负责人杰夫·迪恩如是说。

首先我们先介绍一下本篇问答的主人公杰夫·迪恩（Jeff Dean）。众所周知，谷歌拥有超强的计算能力，而这很大程度上都要感谢杰夫·迪恩的奉献。是他最早参与设计并组建了公司的网络搜索引擎以及广告系统。但是，他的成名之作是发明了一种名叫“MapReduce”的编程模型，它与大数据系统兼容并产生了席卷计算产业的改变。

现在，迪恩正致力于从最深处革新谷歌的技术，甚至整个世界。

他加入并领导了谷歌大脑研究团队，该团队目标是研发更先进的机器学习系统。那是能让软件自动学习怎样执行任务的艺术，它省去了常规冗长的编程过程。谷歌大脑开发的程序现在被谷歌内部的600多个团队使用，通常集成于普通用户没见过的内部系统。但就在去年，谷歌大脑设计并发布了谷歌搜索引擎的重要升级、Gmail垃圾邮件过滤以及全新的谷歌翻译系统。

其实机器学习与谷歌渊源颇深，谷歌的工程师很早就用机器学习“训练”软件，让它们能协助用户搜索信息并呈现相关网站，又或者有选择有指向性地向用户展示广告，以及根据用户的口味向用户推荐YouTube视频。谷歌也是众多继开发模拟神经系统数据传输软件后，在深度学习领域加大投入并取得突破性进展的公司之一。

迪恩就此也大胆断言：“在不久的将来，机器学习就能走进其他领域了。”迪恩也接受了麻省工科技评论记者汤姆·西蒙尼特的采访，会谈举行于谷歌山景城分部。以下是迪恩答记者问的主要内容。

机器学习是如何改变了谷歌内部团队处理新问题，和设计新产品的方法呢？

首先说，这个改变是巨大的。在过去的五年内，机器学习有了长足的发展，它拓宽了人们对于计算机能力的认识，特别是计算机视觉技术以及计算机语音识别的能力。这样的发展自然能带来新的产品以及新方法，例如谷歌图片搜索引擎以及Gmail的智能回复功能。当然谷歌所能想到的远远不止这些。回想五年前的计算机，有些事情还不能借助它们完成，而现在它们甚至能做更多的事情。这也自然地拓宽了我们对计算机能力的认识。

您曾经是TensorFlow的核心团队成员，你们开发的软件帮助了谷歌机器学习的发展，也给了Gmail智能回复邮件的功能。而如今TensorFlow走向了开源的道路，这是为什么呢？

我们提供开源免费的软件，旨在用统一的方式来表达机器学习的想法，这样会使得机器学习研究领域的交流变得方便。机器学习的发展前景是十分好的，我们现在都能在学校里、公司里甚至政府里见到它的身影了。

工业界日后会依赖于机器学习么？

迪恩：首先世界上还有很多产业都能采集数据，而并没有应用机器学习。不过我觉得最终这些产业都会陆陆续续开始使用机器学习的。例如交通，最近很火的自动驾驶，就十分依赖于机器学习。甚至医疗卫生产业也即将出现很多很有意思的机器学习应用，例如门诊结果的生成，又例如对X光结果的病症判断和预测。我不会觉得只有一个产业将会受到机器学习的影响，我觉得会有很多。

机器学习将会成为计算应用科学的基础科学么？

当然，我觉得是。现在很多大学的计算机科学学系中，都会设有机器学习方向。培养的理念就是希望学生能有对机器学习有一定的基本认识，并利用机器学习完成一些项目。

当人工智能邂逅百度

去年11月份，我到访了中国最大的互联网公司百度，一位百度人工智能的开发者向我做了展示，图片中的我竟然长出了狗鼻子、毛茸茸的耳朵还有一个粉红的大舌头。

这是百度去年在万圣节退出的一个叫“Face You”的手机应用。你能在你的大头照上加入很多元素，例如各种鬼怪的特效以及动物的五官。Face You 加入了一项名为深度学习的人工智能，它能识别人脸及其特征，并以此自动添加特效。

深度学习在百度的应用并不局限于像Face You一样的娱乐软件。相反，它能优化一些已经存在的产品，并且协助工程师开发新产品。

百度正在用深度学习开发新应用，例如训练机器和人对话。这其实也标志着深度学习的时代已经到来，正如纽约大学教授燕乐存（Yann LeCun）所说：“机器学习正在向深度学习过渡。而这个过渡的进程也在逐渐加快，因为深度学习在模式识别以及预测分析中已经展现出了强大的能力。”他是深度学习发展史上举足轻重的一位名人，现担任Facebook人工智能实验室的主任。

深度学习是机器学习领域内高效率的典型，它将大量的数据导入到计算机程序中。深度学习将数据源源不断地输入到一个类似神经网络的系统中，让系统能从输入中识别一些抽象的模式。经过这样“训练”后，系统就能识别例如图片中的物体，或者辨识新邮件是否是垃圾邮件。

深度学习的开发和使用，必将帮助百度巩固其作为中国创新型本土产业巨头的地位。全中国有超过5亿3千6百万的搜索用户，其中有92%的用户使用百度来搜索。而且这个数字还在持续增长。而就在去年，百度搜索还开设了很多新的板块，例如能检索音乐、声音的全新的百度音乐、以及涉足金融产业的百度财富。

那么深度学习是怎样走进百度的呢？

我们不得不提到一个人：百度首席科学家吴恩达，他是斯坦福大学的副教授，也是当今机器学习炙手可热的大师。他将深度学习带到了百度，并说：“利用人工智能，百度正在将自己的技术领域变得更加与时俱进以及更具有竞争力。”

并且他补充道：“深度学习的应用天天都在增长。”百度深度学习实验室与百度在硅谷设立的人工智能实验室（Silicon Valley AI Lab）联系十分紧密，经常协同作业。该实验室成立于2013年，设立的初衷是为了吸引人工智能领域新潮的研究和项目。

如吴教授所述，百度深度学习实验室最初设立的项目便是深度学习的实验平台“Paddle”，其他部门的工程师也能使用。而该实验室的员工也会被派驻到其他部门研究学习。深度学习实验室的成果是显著的，例如他们成功地提高了百度杀毒软件的过滤能力，并成功预测公司超大服务器的硬件故障。

文章开头提到的，向我介绍“Face You”手机应用的员工叫顾嘉唯，是一名年轻的研究员。他说起这个手机应用，觉得其背后的技术能够让百度开立研究新方向——虚拟现实，例如利用此项技术将实物带入虚拟的环境中。

人工智能，特别是深度学习已经显著改善，并提高了百度旗下的核心产品，其中包括公司核心的搜索引擎算法，特别是将图片的检索的精准度提高到一个新层次。深度学习还提高了公司语音识别的精准度，帮助公司推出了新的语音检索服务，以及和“Siri”一样的声控私人助理“度秘”。语音识别技术对于百度的未来发展还是十分重要的，它能提供手机上一种方便的输入方式——只需要说就行，不用在小频幕上麻烦的打字了。

深度学习的前景一片光明，也许不久的将来我们身边的事物都将充斥着深度学习的影子，像百度这样利用深度学习的公司不止一家，也正如吴博士所说，深度学习的能力是无限的：“任何有大数据来源的公司都在积极地考虑深度学习的开发。它是一种超能力，能将看起来冗长无味的数据点石成金。”

人机合作才是正道

Pinterest的经历揭示了一个时常被忽略的真相：人工智能和机器学习既倚重数学又同样需要人类智慧。

Pinterest的工程师们常常要开发新的人工智能算法，来从海量的食物、产品、房子等物品的图片中帮客户找到他们要找的东西。匹配词条和相关图片是保证客户回访的关键。但是直到去年，测试新算法的有效性仍需要很多天。

为了打磨机器学习的准确性，提供更快更优质的搜索结果，Pinterest 采取了一个意料之外的方法：人类智能。公司聘请了像CrowdFlower这样的众包公司来由人力完成一些细枝末节的工作，比如给照片做标记，评估搜索结果等。人们一小时之内就可以测试上百个搜索结果的匹配程度。

虽然人工智能近年来取得了巨大的发展，人脑仍然在某些方面更胜一筹，比如说分辩出一块花瓷砖与一块有着相似花色的毛毯的区别。“机器要做到如此，还有很长的路要走”，Pinterest的数据科学家穆罕默德•尚哈吉安（Mohammad Shahangian）如是说。

Pinterest的经历揭示了一个时常被忽略的真相：人工智能和机器学习既倚重数学又同样需要人类智能。谷歌搜索引擎的广告系统应用大量的“评估者”来评定其人工智能的搜索质量，并鉴定出垃圾广告。

Facebook的人脸识别软件通过手动圈人来提高准确率。深度学习作为人工智能的一个分支，是近年来语音识别、翻译、图像分析技术取得重大突破的前提，它需要广泛的人类智慧加以训练。

像Pinterest一样，很多公司会请CrowdFlower、亚马逊旗下的土耳其机器人（Mechanical Turk）这样的众包公司来清理输入给人工智能系统的数据，以教导他们完成特定任务所需的概念以及关联。人们的任务包括在Twitter上分析语义倾向，过滤掉用户生成的攻击性图片或视频。

有时人们甚至在不知不觉间就完成了训练人工智能的任务。比如，存支票的时候把机器无法读取的数目手动键入，藉此改善了银行的智能系统。

不过即使目前看来人类智能处理类似任务比机器更准确，人工智能似乎最终仍会胜出。

作为机器智能公司纽曼塔公司（Numenta）创始人之一，神经学家杰夫•霍金斯（Jeff Hawkins）表示，“困境只是暂时的”，虽然专家们认为“暂时”可能意味着几年也可能是几十年。

一些人工智能方面的研究者认为，最有效的模式或许是设计一个混合体系，使机器和人脑平等协作。盐湖城的一家非营利组织山间医疗（Intermountain Healthcare）正在运行一项试点工程，来帮助年轻的糖尿病患者在护理断档时独立生活。

一家位于奥斯汀的量化认知公司（CognitiveScale）利用云计算系统，通过智能手机程序来给患者实时提供定制化的指导。它能根据患者的体征和饮食来判断当下最能影响患者血糖水平的因素，继而提出饮食建议，甚至提供附近适宜的餐馆。

人们也在寻求人类智能和人工智能更深层次的合作。与苹果手机的Siri系统不同，Facebook的虚拟助手M利用人类智能做出决策。比如说，人工智能选出附近的三家餐馆后，真人“教练”就会参与进来，询问是否有人想要某种特定的食物，或者想定靠窗的位子，然后在网上预定餐馆。“教练”的行为被记录下来反馈给系统，以帮助人工智能学习，将来自主完成此类任务。

对于很多人工智能的研究者来说，最终的目标是开发出能像人类一样思维的机器，但是目前人类的判断力和创造力仍然是无可替代的。谷歌主管工程的副总经理约翰•吉南卓亚（John Giannandrea）说，“你的车再智能，也是由你来决定到底去哪儿。”

毫无疑问，尽管人工智能已经取得了巨大进步，但人机合作仍然是最佳模式。

智能语音领域值得关注创业公司

随着苹果Siri和微软小娜的面世，人工智能助手与应用软件逐渐把目光投向了商务人士。

ClaraLabs

功能：“虚拟员工”能够通过电子邮件安排会议。用户只要在邮件中抄送“克拉拉”，它就会联系其余参会人，并根据用户的偏好选定最佳会议时间。敲定好所有细节后，Clara会给所有人发送会议日程邀请。这项服务的收费在每人每月199到499美元不等，同时还提供团体定制服务。Clara的升级版甚至可以为见面会议预订餐厅，该服务利用“开台（OpenTable）”和“同意请回复（RSVP）”应用程序替用户安排活动。条纹（Stripe）、豪斯（Houzz）和安吉利（AngelList）等数百家企业都在使用该服务。

目标用户：需要开会的专业人士

工作原理：利用机器学习和自然语言处理解析用户的电子邮件，以领会其意图。如果答案直截了当，系统会自动回复，而如果情况复杂，则会预测可行的方案。回复由算法自动生成，但是复杂情况下会有人工干预。

DigitalGenius

功能：自动回复的客服平台。系统能够自动回复“这款车有绿色的吗”这样的简单问题，并可以使用短信、社交网络、电子邮件或者在线聊天的方式进行沟通。对于复杂问题，比如“这款车是你们卖的最环保的车吗”，系统会向客服人员提供技术细节，辅助其作答，比如“是的，这款车是电力驱动而且全部采用可再生材料生产”。使用该平台的公司根据系统的智能程度和使用量付费，目前已有多家财富排行榜前1000名的企业在使用该服务，比如联合利华。

目标用户：需要受理大量客服电话的公司，像金融服务业、航空公司等。

工作原理：深度学习、机器学习、自然语言处理和神经网络算法。公司需向该系统提供客服相关的聊天记录，电子邮件抄本、脸书（Facebook）和推特（Twitter）消息记录等，并将其输入程序中，然后程序会生成客服软件供公司使用。

Howdy

功能：目前很受欢迎的企业通讯系统Slack，运用这款对话软件，也就是俗称的“聊天机器人”来自动处理简单、重复性的任务。聊天机器人通常用来采集工作进展情况、为员工下午餐订单等。也会用来调查小组成员意见，收集回复，整理成书面报告再返还给各成员。用户可以自定义Howdy 要提的问题，然后通过聊天的形式进行问卷调查。Howdy 在测试期内免费，但最终将会按月收费。

目标用户：20人以内团队，需要每天报告进度，整理信息。

工作原理：机器学习和自然语言处理。运用自然语言处理功能解析（Slack）用户的要求，生成准确的（预写）文本。利用机器学习来完善系统。

Kasisto

功能：金融机构在移动应用程序里嵌入这款智能个人助手后，可以提升用户体验。智能助手可以回答1000个银行相关的问题，能够理解语音和文本对话内容，用户通过它可以查询账户余额、消费记录、转账记录、理清消费模式和定位附近的自动提款机。该程序的订阅费用依照使用量按年结算。Kasisto的开发者，斯坦佛大学国际研究所，曾为苹果Siri系统提供了技术支持，但Kasisto是完全独立于Siri的一个新项目。

目标用户：零售银行、商业银行、理财机构以及信用卡发卡机构

工作原理：人工智能推理，基于深度神经网络算法的机器学习，自然语言处理和语音识别功能。利用自然语言处理功能快速判断用户意图，进行智能推理，进而有效的帮助用户达成目的。

Meekan

功能：Meekan是一款排程机器人，可以根据员工在Slack通讯软件中的英文指令安排会议日程。Meekan可以理解“我们想要七月四日前安排一次会议，时间在中午左右”这样的句子，并能分析员工的日程表，选出最佳的会议时间。Meekan还可以在一款英国的搜索引擎“Skyscanner”上订购机票，并帮助用户找到最短的行程、最低价位的中转或直达航线、最早的抵达时间等。目前Meekan是免费的，但大宗客户最终仍需付费订阅。目前用户已有包括美国在线(AOL)和耐克在内的3100多家公司。

目标用户：使用Slack通讯软件的公司

工作原理：利用自然语言处理功能，从用户的聊天内容中扑捉用户意图和会议形式，利用机器学习领悟用户偏好，利用人工智能推理选出最适宜参会者的会议时间。

X.ai

功能：智能助理艾米（Amy），或者也可以选男版安德鲁（Andrew），能够通过电子邮件安排会议日程，其功能与克拉拉相似，但人工干预成分更少。目前这款程序每月能安排上万个会议，其用户群包括了领英（LinkedIn）、声破天（Spotify）、优步（Uber）等公司的员工。目前仍处于内部测试阶段，但计划定价在每月9美元左右，该价位低于克拉拉，并可以无限使用，个性定制智能助理的名字和邮件地址。X.ai 甚至还推出一款限定会议数量的免费版。

目标用户：参加会议的专业人士

工作原理：利用自然语言处理功能分析邮件中涉及的人员、时间、地点和发送者意图，然后将这些信息处理成智能助理可以阅读的模式。利用深度学习功能解析邮件意图以及其对会议安排的相关性。

人工智能的颠覆时刻

作为Twitter人工智能项目负责人，同时也是哈佛大学学术界领军人物的瑞安·亚当斯（Ryan Adams）注意到，越来越多的工业企业开始使用机器学习技术。但是他预计，那些具有庞大数据以及强大的计算能力的公司或许仍然将占据领先地位。

瑞安·亚当斯

瑞安·亚当斯知道他的时机刚刚好。他是“Talking Machines”—一个机器学习相关的播客的共同主播，同时他从2011年开始就是哈佛大学计算机科学教授。他带领着他的课题组从事智能算法方面的研究。就在去年暑期，他的创业项目——Whetlab，一个才成立了15个月的机器学习公司被Twitter收购了。

Whetlab的技术可以自动化解一些在构建大规模机器学习系统时最难以处理的问题。成立Whetlab的目标就是为了解决机器学习中一些极为棘手的挑战，如视觉识别和语音处理。

开始时，这群来自哈佛的研究者们使用了不同的工具，从生物医疗机器人到化学问题，不一而足。之前，Netflix使用了他们早期的一个开源版本来测试深度学习。

现在，正在休假的亚当斯在Twitter位于马萨诸塞州剑桥的办公室中，与商业报告的资深编辑纳内特·伯恩斯（NanatteByrnes）聊起了现在极为火爆的机器学习。

人工智能已经逐渐从学术界的热点变为一个商业工具。是什么在驱动这样的转变？新的算法，更快的电脑还是更多的数据？

就像其他的事物一样，我认为对于人工智能的投资起了决定性的作用。现在，科技企业已经投入了数十亿美金，这毫无疑问加速了这一行业的发展。

Twitter收购了你的公司。机器学习究竟是怎么样帮助Twitter的？你能举个例子吗？

机器学习有许多种途径来改善Twitter，比如改进内容的排布，帮你找到正在发生的新鲜事，帮你找到一个你能融入的社团，以及其他任何能改善用户体验的功能。你可以想象，其中一个挑战就是，如何将那些让用户提供的有意思的信息，与已经发布在Twitter上的内容联系起来。

像深度学习这一类的人工智能技术，还有多少是人们还无法理解的？

现在，深度学习基本上已经在实用阶段。你也能明显感觉到，有重要的变革正在发生。这些深度学习系统正在做一些很新潮的事物。我们对他的认识还十分的少，但是他们确实能发挥作用。

有些时候，人们很难去定义人工智能，甚至是对于人工智能的恰当测试也会引起一片争论。这一困难，一部分原因是因为我们需要将智能这个概念拟人化。我们在“智能”前加上了“人工”二字，尽管智能并不是这个自然界的产物。举个例子来说，我们并没有将飞机叫做“人工飞鸟”，我们也不说飞机在“人工飞行”。但是他们都在天上飞，不是吗？

这是一个非常人类中心论的观点，即如果有另一种智能存在，那么它一定是人造的。因此我认为，我们将很难用非人类中心论的观点去定义智能，而且我自己并没有这样的定义。

如果你能回到过去，并且告诉一个50~60年以前的早期人工智能思想家，“你将有这么一个设备，它能回答你几乎所有你想问的问题，它能理解你的声音并且提供世界上任何一个地方的图片，告诉你如何从A点到B点”，尽管你只是概括了你的智能手机中谷歌，一些地图工具和Siri的功能，但是我想那个人会说，“这就是人工智能”。而我们预计我们现在使用的这些工具将随着时间发生非常巨大的变化。

现在许多公司对人工智能持有非常开放的态度，包括分享人工智能的观点，放出开源软件，允许员工发表文章并在会议上讨论，等等。你认为这样的情形会持续多久？

公开代码不仅能回馈社会，帮助企业招聘顶尖的机器学习人才，并且公司能从更大的团体改进中获益。

为什么这些企业在提供他们的代码和想法时，不觉得他们是在将自己的领地拱手让人？

因为其他这些公司不具备像Google这样的计算能力，他们也没有像Twitter这样的计算能力，他们还不具有数据，是吧？我想你现在可能已经理解了。你可以拥有代码，但是你没有数据，你也没有足够的计算能力，你又能做什么呢？

你认为人工智能将会以什么形式出现？

我认为人工智能和机器人相似，不会突然变得无比智能。我认为人工智能更像个随着时间变得越来越强大的工具箱。但是有一件事我确实比较担心，就是我们现在几乎有能力通过机器学习和人工智能，来合成看起来可以以假乱真的媒体内容。我认为这将十分危险，特别是我们当前的这个社会，似乎越来越倾向于认为视频的内容就代表了事实。

丰田的新型独角兽：如同登月般来改变世界

去年11月，丰田公司孕育了一个独角兽企业：五年内将得到10亿美元投资的丰田研究院（TRI），一个专注于半自动汽车和机器人的研究所。

就像Alphabet的X部门一样，TRI也有着一系列如同登月一般，由技术驱动而引领社会变革的目标，其中包括不会发生事故的汽车和可以帮助老年人的家庭机器人。

对于一个从1860年开始制造织布机，并在70年以后才转型汽车制造的企业来说，这完全算得上是一个全新时代的开始。这个研究所的CEO吉尔·普拉特（Gill Pratt）在一月份的消费者电子展上说，“今后机器人之于制造汽车的丰田，完全有可能等同于当年汽车工业之于还在制作织布机的丰田。”

普拉特是在机器人领域备受尊敬的领军人物。在加入TRI之前，他任职于美国国防部的重要研究机构DARPA，并组织了去年广受关注的人形搜救机器人挑战赛。现在，他将领导世界上最大的汽车厂商对Google，Apple和Uber等科技巨头作出回应。这些年来，这些巨头们都在学术圈挖掘自动汽车的人才，发展他们自己的机器人汽车项目。

但是，TRI的目标与这些巨头们相去甚远。现阶段TRI的目标并不是完全的自动驾驶汽车，而是只有即将发生碰撞时才会介入的高科技“守护神”。

曾经的DARPA城市挑战赛MIT团队负责人、工学教授、同时将成为TRI自动驾驶部门负责人的约翰·伦纳德（John Leonard）说，“也许将来的有一天，自动化的程度能够允许我们开车的时候睡一觉或者看一本书，就像Google所宣传的那样。但是短期来看，一个更为可行的方案是建立一个协同并辅助司机的系统。人类仍然对驾驶负有主要的责任，但是这个自动驾驶系统将协同运行，并在事故发生前及时的介入。”

TRI将在斯坦福和麻省理工学院周边建造设施，与这两所大学合作开展30个初始项目。其中一个由丰田资助的项目已经在斯坦福人工智能实验室展开。这一项目利用机器学习技术来帮助自动驾驶汽车更为有效地处理它们之前没有遇到过的危险情形。另一个在麻省理工学院计算机科学和人工智能实验室开展的项目，则致力于建立一个可以向人类驾驶员解释其行为的自动驾驶系统。

制造一个半自动驾驶汽车的成本也许很难从单个汽车驾驶员收回，特别是考虑到这一安全系统可能永远都不会派上用场。但是普拉特和伦纳德却把这看做是大幅提升安全性能的好机会，并表示TRI将努力把现有系统的可靠性提高“一百万倍”，理论上来说，大约是自动驾驶汽车每一万亿英里才会发生一次事故，这相当于全球所有丰田车一年内行驶的距离总和。

这个团队的第二项任务，是发展家用机器人，看起来像是一个更加充满野心的目标。道路基本上是一个构造优良的环境，并且有一整套（绝大多数）使用者都会遵守的规则，然而每一个住宅或者建筑物包含了不同的灯光、家具、物品与住户。另外，自动汽车的最终目标是消除其他道路使用者，而家用机器人则必须与门窗、设施、人甚至宠物打交道。

在所有的这些挑战中，普拉特列举了四个最为突出的挑战，分别是驱动、控制、耐用性与可靠性。当然，考虑到这个新的研究所只有两个月的历史（他们甚至都还没有属于自己的网站），所以具体的研究方向尚未确定。

“在硅谷，一小群人先有一个想法，然后从这个想法逐渐开始成长”，曾经是Olin工学院（Olin College of Engineering，位于马萨诸塞州的一个私立学院，成立于1997年）机械工程教授，现在已经加入TRI团队的布莱恩·斯托（Brian Storey）说，“我们是刚刚成立的独角兽，所以没有多少现有的案例能告诉我们下一步该怎么做。”

人工智能之弊：偏见的数据将成为人工智能发展的重大瓶颈?

人工智能正在融入我们的日常生活，而我们对人工智能的工作方式却知之甚少。人们对这种熟悉而又陌生的新事物作何感受呢？

2011年，一个机器人在卡内基梅隆大学的办公大楼跑了5个月，给办公楼里的工作人员递送香蕉、饼干等零食。零食机器人大眼睛，红嘴唇，显得很可爱，然而它却经常犯错。与工作人员交流反应迟钝的现象屡见不鲜，有时候还会死机。

但是，办公大楼里的工作人员还是很喜欢零食机器人。它很会讨好人，在犯错的时候会自动道歉。

这是一个试验，为了测试人们对可以互动的机器人的反应。研究人员教零食机器人识别一些食物，并对这些食物发表自己的看法。然而这些食物只是办公楼里一半人爱吃的，至于办公楼里另一半人喜欢什么，机器人就不得而知了。

一段时间后，人们和零食机器人的关系开始变得亲密。有人开始跟它打招呼，表扬它，还会跟它说悄悄话。试验结束时，一名工作人员对零食机器人依依不舍，还送它一个告别礼物——一节5号电池，虽然她知道机器人不会用它。

如卡内基梅隆大学的研究员李闵庚（Min Kyung Lee）所言：“这种感觉很真实”，李闵庚是这项研究的负责人。

在之后的几年里，机器人已经变得更加个性化了。人工智能技术已经催生了像苹果Siri这样的计算机个人助手。Siri可以回答很复杂的问题，还可以很幽默地避开敏感话题。奈飞（Netflix）和亚马逊基于人工智能的推荐引擎所推荐的电影和书也越来越令人满意。

然而，很少有人更进一步地了解人们对人工智能软件的态度。最近有人对40个facebook用户进行了调查。结果发现，有一半人都不知道他们所看到的新闻是基于一种算法推送的。当被告知这一事实后，他们很震惊，甚至有些愤怒。

通过地理定位和其他一些技术所反馈的数据，人工智能系统可以创建一个人们所期望的个性化平台。“如果我要找最近的星巴克，我不会去关心Siri是否对我进行了定位。” 民主和技术中心的政策分析师阿里·兰格（Ali Lange）说。

然而，人工智能系统也会基于一些我们所无法了解的原因做出决断。正因如此，一些研究机构、消费者权益律师和政策制定者对人工智能心存隐忧，担心一些有意或无意的偏见会导致算法歧义，而这种歧义又很难辨别。这绝非危言耸听，已有研究表明一些模棱两可的算法已经引起了网络广告、招聘和定价的偏倚。

在一项研究中，哈佛大学的拉坦娅·斯威尼（Latanya Sweeney）教授利用谷歌分别检索了白人名字（杰弗里、吉尔、艾玛）和黑人名字（德肖恩、达内尔、杰梅因），并分析了在检索过程中谷歌推送的相关广告。斯威尼教授发现，在检索黑人名字时，有超过80%的概率会在网页上出现“逮捕”的字眼，而在检索白人名字时，这一概率要少于30%。斯威尼担心谷歌这种带有种族偏见的广告推送技术会削弱黑人的竞争力，无论是在奖励、约会还是在找工作上。

一些初创公司如BlueVine, ZestFinance和Affirm也在利用人工智能技术来审批和提供信贷。这些公司的创始人表示他们对歧视借贷的危险性很重视。

然而，数据是千变万化的。Affirm的人工智能算法来源于PayPal的联合创始人麦克斯·拉夫琴（Max Levchin）。该算法是利用社交媒体的反馈数据来确定客户的个性，而不是用来判断申请人的还贷能力。

ZestFinance的创始人及谷歌前首席信息官道格拉斯·梅里尔（Douglas Merrill）则表示自己绝不会用社交媒体数据。“它让我感到毛骨悚然，”他说。

ZestFinance和Affirm的创立都是基于这样的想法：通过分析成千上万的数据点，机器学习就可以发现更多潜在的有信誉的用户。换言之，基于大数据的算法要比受各种因素限制的人工服务有更强的辨别能力。

ZestFinance的算法发现：综合考虑收入、开销和城市消费水平要比单单考虑收入更能准确地预测信誉度。全部用大写字母填写申请表的人其信用前景要比全部用小写字母填写申请表的人差。

当将这种具有难以辨别的偏见的数据反馈给人工智能系统时，数据是否在无意间形成了歧视呢？如梅里尔所言：公平才是最重要的。

为了杜绝歧视存在，梅里尔的公司创建了机器学习的工具来测试自己的结果。然而对于消费者，面对人工智能算法的复杂性与多变性，他们很难确保自己得到了应有的公平。

人工智能人才炙手可热

安德烈·卡帕西（Andrej Karpathy）是斯坦福大学在读博士，他曾开发了一个人工智能软件。对他而言，毕业后找工作显然不是什么难事。

在一个人满为患的教室里，斯坦福的研究生和本科生们正在全神贯注地听安德烈·卡帕西的演讲。卡帕西正在讲解，具有识图功能的神经网络的不同算法的利弊。

突然，教室里传来了苹果语音助手Siri的声音：“你说什么，我没听清楚”。

Siri可能是被意外启动了，这引得教室里的人哄堂大笑。当教室里的学生正在深入讨论，如何才能让人工智能软件更好的服务于人的时候，Siri的意外发声则正表明了这类软件在现实世界的广泛应用。

像苹果、谷歌、IBM和Facebook这些财大气粗的公司，现在急需人工智能方面的人才。因此，卡帕西班里的学生在毕业之后会十分抢手。

最近，大公司买下整个初创公司来获得人才的例子并不少见。

人才竞争是如此激烈，以至于小公司不得不扩大招聘，除了计算机科学专业的人之外，他们还招募宇宙科学和物理学方面的人才。

初创公司Maluuba的CEO山姆·派休帕莱克（Sam Pasupalak）甚至有自己的全职猎头团队。他们每天都会研究新发表的论文，寻找潜在的好员工，他们还会参加学术会议，并在会议结束后，拉着大牛们攀谈。

有人工智能背景的人才现在很抢手，因为参与这场人才竞争的不单有科技公司，全球财富500强的公司也想知道人工智能技术，是否能让自己的业务更上一层楼。

没有人比卡帕西更能体会这场人才大战了。这个29岁的在读博士是神经网络领域一颗冉冉升起的新星，而神经网络又是现今人工智能的趋势所在。他在5月份毕业后，会成为非盈利初创公司OpenAI的创始研究员。

Elon Musk 是非盈利性人工智能项目OpenAI的创始人之一。他和Y Combinator 总裁 Sam Altman 共同担任 OpenAI 的联席主席。

卡帕西也有一些工作经验，他有两个暑假在科技巨头谷歌做实习生。卡帕西说，OpenAI给自己一个白手起家的机会，而且OpenAI还可以保证自己学术自由与资金充足。OpenAI声称，其已经得到了彼得·蒂尔、埃隆·马斯克和包括亚马逊在内的一些公司总计10亿美元的捐款。

卡帕西从记事起就一直对电脑很感兴趣。在卡帕西五六岁的时候，那时候他还在斯洛伐克的科西策，他就恳求父母给自己买一台电脑。他是镇子里第一个拥有个人电脑的人。他记得小时候会用电脑玩游戏，还用MS Paint画图。“编程也是一种创作”，他说。

之后，卡帕西搬到加拿大，并考入多伦多大学。卡帕西刚开始想学量子计算机专业，但在听了机器学习领域专家杰弗里·希尔顿（Geofrey Hinton）的课之后，卡帕西决定改变主意。杰弗里·希尔顿当时是神经网络编程的领军人物。

卡帕西介绍说，实现人工智能的传统方法是利用大数据进行检索，而神经网络却可以模拟人脑进行学习。神经网络程序可以进行联想和识别，在识图与药物鉴定方面，比其他智能技术更具优势，甚至在Siri所擅长的语音领域，神经网络的表现也更佳。

卡帕西说，让电脑像人一样学习和思考，是计算机领域的“终极问题”。计算机有强大的数据存储功能，如果它还可以像人一样思考的话，那么你所能想到的所有问题都可以迎刃而解：无论是机器人技术、自动驾驶、艺术，还是语音识别与面部识别的安全系统，全都是小菜一碟。

卡帕西引起OpenAI创始人格雷戈·布罗克曼（Greg Brockman）的注意，源于他在攻读博士学位时做的一个副项目。

出于个人兴趣，卡帕西编写了一个神经网络程序，它可以生成任何类型的文本，如莎士比亚体、奥巴马体等。卡帕西介绍说，一段只有100行的代码就可以识别诗歌、数学公式和其它各种符号，之后，他的程序就可以输出该种风格的字符串。

目前，卡帕西的程序还只是模仿莎士比亚文体和总统演说，然后生成一些意义不大的文本，但是，在某种程度上，卡帕西的神经网络已经接近了人类的阅读模式。卡帕西说，随着读的书越来越多，神经网络的表现也会越来越好。

卡帕西在网上开放了底层代码，这一做法给布罗克曼留下很深的印象。“促进公众参与，是我们希望在人工智能与机器学习领域取得进步的方法之一”，他说。

在布罗克曼决定将卡帕西纳入OpenAI之后，他开始利用OpenAI的每个新员工来吸引卡帕西加入。布罗克曼说：“优秀的人总是愿意跟优秀的人一块工作”。

卡帕西说，有很多他认识的工程师来招聘他，而他从来都不接招聘人员的电话。之后，OpenAI雇了一个关键人物，约翰·舒尔曼（John Schulman）。

舒尔曼刚从加州大学伯克利分校博士毕业。卡帕西说，舒尔曼有一次告诉自己，他要加入布罗克曼的团队。然后，卡帕西开始认真考虑OpenAI的项目计划了。OpenAI致力于创新以及利用人工智能服务于人的理念，非常吸引人。

“我们希望，人工智能不会被任何公司所垄断，我们想引导人工智能为人类创造最大效益，”卡帕西说。

课堂上，在将科技融于生活方面上，卡帕西很有一套。他花了一个小时，来解析各种识图算法的优缺点，然后又向大家介绍了谷歌的一个研究项目。

该项目表明，在进行图像识别时，神经网络的表现更具优越性。之后，在投影仪上弹出了一只很有趣的羊的照片，计算机程序却把它识别为一只狗。

神经网络所接收的数据中有太多狗的照片，以至于“神经网络对狗情有独钟”，卡帕西说。

上海-东方慧

我分享了@钱皓-互联网分析师的文章 °深度重磅 | 麻省理工科技评论：AI 即将腾飞

2016-5-27 07:53 来自 HUAWEI Mate 8

钱皓

专注互联网早中期投资分析。欢迎自媒体合作，加QQ：1000808，请注明身份【免责声明】微博内容纯属个人业余爱好，与任职公司无关，希望与同行多交流！

+关注

底导

微博精彩: 热门微博热门话题; 微博会员微相册; 微游戏微指数

手机玩微博: 扫码下载，更多版本
戳这里

认证&合作: 申请认证链接网站; 企业微博微博营销; 微博标识广告代理商; 开放平台

微博帮助: 常见问题; 自助服务; 企业&商业热线; 4000-980-980

微博客服4000-960-960 意见反馈舞弊举报 About Weibo 微博招聘新浪网导航违规内容投诉010-60618076投诉处理大厅 DMCA投诉/Report 互联网法院微博工作站

京ICP证100780号京ICP备12002058号京网文﹝2024﹞0012-005号（京）网械平台备字（2022）第00006号京食药网食备202210035互联网宗教信息服务许可证：京（2022）0000091

(京)网药械信息备字（2023）第00076号增值电信业务经营许可证B2-20140447增值电信业务经营许可证京B2-20221511乙测资字11510760出版物经营许可证新出发京批字第直220253号

中国互联网举报中心北京互联网举报中心内容从业人员违法违规行为举报网络110报警服务北京文化市场举报热线中国互联网协会北京网络行业协会扫黄打非举报入口网络谣言曝光台