阿尔法狗之父哈萨比斯访谈：人工智能未来将如何碾压一切

来源：造就（ID：xingshu100），翻译：雁行

全文翻译自《The verge》“DeepMind founder Demis Hassabis on how AI will shape the future”一文。

推荐自：@钱皓-互联网分析师微信ID：qianhaoapp

不久前DeepMind的人工智能系统AlphaGo大败韩国国手李世乭，使人们对这种技术的潜力浮想联翩，其热度也空前高涨。

但在谷歌子公司DeepMind，AlphaGo绝不是唯一的项目——连主要项目都算不上。其联合创始人德米斯·哈萨比斯（Demis Hassabis）近日表示，DeepMind要“揭开智能的秘密”，至于要如何做到，他的想法可不是一点两点。

时至今日，哈萨比斯自己也走过了一段颇不寻常的人生历程，但回想起来，一切却都合情合理。作为当年的国际象棋神童，他曾五次夺得脑力奥运会（Mind Sports Olympiad）“全能脑力王”冠军，年纪轻轻便已声名远播。工作之后，他先是效力于Bullfrog和Lionhead等游戏开发商，做过《主题公园》（Theme Park）和《黑与白》（Black & White）等偏重AI的游戏，后来自立门户成立Elixir工作室。

2005年前后，哈萨比斯离开游戏业，去攻读神经科学博士学位，后于2010年与人联合创办DeepMind。

就在AlphaGo战胜李世乭后不久，哈萨比斯接受了这次采访，如果此时他心思不在媒体上，那也是完全可以理解的。

除了AlphaGo，我们的谈话还触及到计算机游戏、下一代智能手机助手、DeepMind在谷歌所扮演的角色、机器人、AI如何辅助科研等等话题。

“围棋一直是人工智能研究中的一个圣杯。”

对于不是很了解AI或围棋的人，你怎么描述人工智能这场胜利引起的文化震动？

哈萨比斯：我要说的有几点。围棋一直是完全信息博弈的最高峰。就其可能性而言，它比国际象棋复杂得多，所以，它一直是人工智能研究中的一个圣杯，或者说是巨大挑战，尤其是在“深蓝”（Deep Blue）攻克国际象棋以后。你也知道，虽然在围棋AI方面的投入很多，但进展一直并不明显。

蒙特卡洛树搜索是十年前一个不小的创新，但我想AlphaGo所做的，无非就是在神经网络中引入了“直觉”——如果可以管它叫直觉的话。而顶尖围棋手区别于一般棋手的地方，就是这种直觉。

让我没想到的是，就连迈克·雷蒙（Michael Redmond）在现场解说的时候都有点不太利索，他还是个专业九段棋手！从这里可以看出来，为围棋写价值函数有多么难。

AlphaGo有没有哪几着棋出乎你的意料之外？

哈萨比斯：有。在双方第一局对战时，AlphaGo在李世乭的左侧地盘大胆突进，我们都大吃一惊，我想李世乭也没有料到，从他的面部表情可以看出来。那应该是相当出人意料的一着。

因为这种攻击性？

哈萨比斯：对，攻击性，还有胆量。而且，这本来是李世乭所擅长的。他以喜好剑走偏锋而闻名，这次比赛也不例外，我们之前就有这方面的预期。李世乭开局四处挑起战况，在那个时候，胜负还很难预料。围棋程序历来不善于应对这种局面。它们的局部计算能力不错，但全局判断就比较薄弱了。

举办这些比赛，输也好，赢也好，都是为了评估AlphaGo的能力。从这次的比赛中，你有哪些认识？

哈萨比斯：我们了解到，这个结果虽不能说超出了自己的期待，但至少跟希望的差不多吧。之前我们本来是跟人说，胜负该是两两之数。

接着你的第一个问题，谈到AI的重要性，我提到过的另一点就是它和深蓝的区别。深蓝是一个手动打造的程序，程序员将来自象棋大师的信息精炼成具体规则和启发式算法，而我们的做法是给AlphaGo灌输学习能力，让它在实践中去学习，这样做更类似于人类。

下一步是什么？未来还会不会举行别的AI大决战？

哈萨比斯：“最终，我们想把AI应用到现实世界的问题中去。”

我想就完全信息博弈而言，围棋就是最高峰。当然还有其他的顶尖棋手可以对弈。还有其他的游戏——比如无限额扑克就很难，多人游戏有它的难度，因为它是一种不完全信息博弈。还有很多游戏是人类明显玩得比计算机好的，比如在韩国比较热门的《星际争霸》。

策略性游戏需要你在信息不完全——也叫做“部分可观测”——的情况下，施展高水平的策略能力。围棋的特点就是，棋盘上有什么一清二楚，所以对计算机来说会略微容易一些。

从你个人角度来说，有没有兴趣搞一场《星际争霸》人机大战？

哈萨比斯：也许吧。我们对一个东西感兴趣，前提是它跟我们的研究项目在同一条道上。所以打赢游戏虽然趣味十足，但不是DeepMind的目的所在。我个人非常热爱游戏，以前也开发过游戏。

但前提是它们能充当有用的测试平台，可以在上面编写算法思路，测试其可扩展性和实际性能，这样做很有效率。最终，我们想把AI应用到现实世界的问题中去。

90年代的时候，计算机杂志上常出现你的名字，跟各种野心勃勃的游戏联系在一起。后来渐渐看到你的名字和DeepMind一起出现，我心想，“还挺配你的。”你能不能画一条线，把之前在游戏业的职业生涯跟现在的工作联系起来？

哈萨比斯：可以，我的终极目标一直是像DeepMind这样一个东西。从某种意义上说，这个计划我酝酿了二十多年了。如果你站在最终建立AI企业的角度，再看我之前的经历，你会发现我的选择都不是那么随机的。如果你熟悉我在Bullfrog这些地方所做的事情，你就会知道，AI是我一切工作的核心组成部分。

彼得·莫利纽（Peter Molyneux，Lionhead创始人）的游戏恰好也都是AI游戏。开发《主题公园》对当时十六七岁的我来说，是一件在内心深处种下种子的事情，我意识到如果我们真的尝试去拓展AI，它可以变得何等强大。那款游戏卖出几百万份，很多人都喜欢玩，因为有AI，游戏会根据你的玩法不断进化。我们把它当作正事来做，我也想把它延伸开来，作为日后游戏生涯的努力方向。

后来我从游戏业抽身，回到学术界，去搞神经科学，是因为到了2005年前后，我感觉到很难再进一步——我们打着开发游戏的旗号，实则是在偷偷做AI研究，结果搞得很艰难，毕竟发行商要的只是游戏。

是不是因为在那个年代，游戏就是AI最显而易见的应用方向？

哈萨比斯：我想是的。我们那时候做的AI其实是非常尖端的。90年代的时候，关于AI的学术研究被束之高阁，神经网络、深度学习、强化学习，这一大批新技术都还没有真正地普及或规模化。所以，最好的AI都进了游戏。它们不是现在这种学习型的人工智能，更接近于有限状态机（finite-state machine），但也相当复杂，而且会进化。

像《黑与白》这样的游戏都涉及到了强化学习——我觉得它仍然是AI应用于游戏的一个最复杂的案例。到了2004、2005年前后，游戏业很明显开始叛离90年代的氛围——那种活跃和创造力，想到什么就可以去做出来的氛围——变得越来越讲究图形效果、系列作品和FIFA比赛之类，已经没原来那么有趣了。

在游戏界，我能做的都已经做了，是时候开始收集不同的信息，为发布DeepMind做准备了。那就要靠神经科学；我想看看人脑是怎么解决问题的，并从中得到点启发。要达到这个目的，还有什么比读一个神经科学博士更好的办法呢？

如果能运用今天的学习型AI，电子游戏将会上升到一个全新的层次。

可能对你来说太没有挑战性了，但能不能把AI的进展应用到现在的游戏中去呢？

哈萨比斯：嗯，要是这样就太好了。最近EA有人联系到我……[若有所思状]这个事确实应该做，就是要做的事情太多了！[笑]这些技术都挺广义的，比较好应用，我也很乐意去做。

只不过要有时间和精力，目前我们专注的是医疗保健和推荐系统这些方面。将来或许可以，这样我的游戏生涯就圆满了。如果你的对手是能够不断进化的，这样的游戏会有很大的市场。而且游戏开发者应该会很高兴，不必每做一款游戏，都建立一个新的AI，或许他们只要训练一个AI来帮他们开发游戏就好了。

我一直想，你在家玩游戏的时候，肯定被那些非玩家角色郁闷得够呛。

哈萨比斯：没错[笑]是的，在大型多人在线游戏里面，那一直让我极度郁闷。我从来没有真正进入过角色，因为那些非玩家角色实在是太蠢了。他们没有任何记忆，不会改变，没有任何来历。“如果能运用今天的学习型AI，电子游戏将会上升到一个全新的层次。

关于未来AI的主要用途，你在提到过医疗保健、智能手机助手和机器人。我们来一一展开一下。谈到医疗保健，IBM的“沃森”已经在癌症诊断等方面做了一些工作——DeepMind能贡献些什么？

哈萨比斯：我们在这方面还刚刚起步。之前我们宣布了和英国国民保健署（NHS）的合作，但这还只是构建一个平台，为机器学习的应用创造条件。照我的理解，沃森和我们所做的工作很不一样，它更像一个专家系统，所以是一种风格迥异的AI。

这类AI一般会从事于医疗影像诊断、生命体征的纵向追踪或一段时间内的生活量化（Quantified Self），帮助人们拥有更加健康的生活方式。这些对强化学习来说，还是挺适合的。

和NHS的合作中，你们推出了一款应用，但跟AI或机器学习的关系好像不是很大。你们是怎么想的？NHS为什么要用它，而不用其他人的软件？

哈萨比斯：据我所知，NHS的软件还挺烂的，所以第一步就是让它实现现代化。这些软件还没有进行移动化改造；当今消费者习以为常的东西，他们都没有。医生护士们应该都非常郁闷，因为这东西在拖他们的后腿。

所以第一个阶段就是给他们提供更多有用的工具，比如可视化和基本统计信息。我们就先构建出来，看具体怎么样，然后，更先进的机器学习技术才能介入进来，并发挥作用。

“我们当然希望这些智能手机助手能够名副其实地智能一些。”

谈谈是智能手机助理。我看你在演讲里用过一张来自《她》（Her）的图片——难道这就是人类的终局？

哈萨比斯：没有，《她》只代表了一种比较浅显的主流观点。我只是觉得，我们当然希望这些智能手机助手能够名副其实地智能一些，具备语境理解能力，更能理解你想做些什么。

目前的系统大都非常脆弱——一旦你偏离预编程的模板，它们就一无是处。所以关键是要让它们真正具备进化能力、灵活性，更经得住考验。

实现这些改进需要哪方面的突破？为什么不能明天就开始改进？

哈萨比斯：不是不可以，只是你需要一种不同的解决方式。还是涉及到预编程和学习的对立统一。目前，几乎所有的智能手机助手都是预编程的，特殊问题特殊解决，这意味着它们都比较脆弱，只能完成预编程的任务。

而现实世界纷繁复杂，用户会做各种不可预知的事情，你不可能提前知晓。在DeepMind，我们相信，实现智能的唯一方式就是从零开始循序渐进地学习。当然，这也是我们创立之初就秉承的宗旨。

AlphaGo得以大成，有赖于一开始灌输给它的很多棋路。但智能手机上的各种输入要比这复杂多了，这又怎么运用起来呢？

哈萨比斯：是啊，这方面有大量的数据供你学习。其实这是未来几个月我们要尝试的东西，对于AlphaGo的算法，我们可以去掉最初的监督式学习，让它去自我对弈，做到真正意义上从零开始。训练时间会变得更长，因为随机试错要花费很长时间，也许要几个月。但我们认为，从零开始的纯粹学习是可以做到的。

可以做到，是不是因为现在的算法已经达到很高程度？

哈萨比斯：不是，我们之前就能做到了。它不会让程序更加强大，只不过是一个纯粹的学习过程，也就是没有加入监督的成分。这些算法可以在没有任何监督的情况工作。去年做的雅达利（Atari）游戏项目就没有任何人类知识的引导，从像素着手，真的就是从屏幕上的随机操作开始的。

游戏要相对容易一点，是不是因为它们更好区分胜负？

哈萨比斯：是因为得分更有规律性。在围棋里面，不论你最后是输是赢，你都只有一个分数。这叫做信度分配问题；问题在于，一盘棋你走出100多步，到最后，你并不能切确地知道哪一步决定了你的输赢，所以说“信号”很弱。而在大部分的雅达利游戏里，你大多数的动作都会得到一个分数，从而有更多的蛛丝马迹可以追踪。

这些进展什么时候能让手机系统智能水平出现质的飞跃，你能否给出一个时间表？

哈萨比斯：我想未来两三年就会逐渐出现。一开始会比较微妙，某些方面只会逐步地改善。也许四五年、五六年以后，性能上就会出现显著的飞跃。

在你指出的未来可能性当中，这个跟谷歌整体的联系最为明显。

哈萨比斯：是的。

谷歌有没有给你任何指示说，这一切要怎么契合它的产品路线图或者是商业模式？

哈萨比斯：没有，我们可以相当自由地优化研究进展。这是我们的使命，也是我们加入谷歌的初衷——也就是更快地实现这个使命。过去的几年，我们也都如愿以偿。

当然，我们参与了很多谷歌内部产品的相关工作，但它们都处在非常早期的阶段，所以还不能拿出来探讨。当然，我觉得智能手机助手是非常核心的——桑德尔·皮凯（Sundar Pichai，现任谷歌CEO）就多次提到说，它对谷歌的未来至关重要。

谷歌的支持对AlphaGo“非常重要”

谷歌还有其他的项目，比如Google Brain，还推出了涉及到机器学习的功能，比如Google Photos、搜索，以及一大堆面向用户的东西。

哈萨比斯：对，很多。

你们会不会和Google Brain有交集，有没有相互重叠的部分？

哈萨比斯：当然有，两边其实非常互补。我们每周都要交流。Google Brain主要专注于深度学习，有像杰夫·迪恩（Jeff Dean）这样出色的工程师，让深度学习渗透到公司每一个角落，所以我们才有了像Google Photos搜索这样好用的东西。他们的工作非常出色。

另外，他们在山景城，更靠近产品部门，研究周期常常在12到18个月左右，而我们更多的是做算法开发，一个项目能持续两三年，不一定一开始就有直接的产品。

谷歌对AlphaGo的支持有多重要？没有谷歌你们能不能做？

哈萨比斯：非常重要。AlphaGo在比赛的时候，其实用不到太多的硬件；但我们要训练它，做很多不同的版本，让它们在云端里对撕，这其中要用到很多硬件。要高效地完成这些过程，也需要很多的硬件。所以没有那些资源，我们不可能在这么短的时间内走到今天这一步。

再讲到机器人。日本作为对机器人情有独钟的国家，其企业开发的机器人主要分成两种。一种就是像发那科（Fanuc）公司的那些工业机器人，在某个具体用途上做得非常好。另一种是礼宾机器人，像软银的Pepper等等，都挺有野心的，但用例有限。对于这个领域的现状，你怎么看？

哈萨比斯：正如你所说，发那科的机器人确实四肢发达，但缺少智能。礼宾机器人就有点像是智能手机助手——反正我见过的那些都是这样，预先设定了应答模板，一旦你脱离预定轨道，它们就傻眼了。

那自然就要问到，机器学习之类的技术将如何提升机器人的能力？

哈萨比斯：就是提供一种完全不同的方法。从零开始构建学习新事物和应对突发事件的能力。我想，任何要在现实世界中和真人用户打交道的机器人或软件，都需要这样的能力，这样它们才能真正派上用场。我觉得到头来，学习必定是最佳途径。

你觉得学习型机器人的用例当中，最快实现的会是哪些？

哈萨比斯：其实，这方面我们没有特别关注。自动驾驶汽车也算机器人，但大部分是狭隘的AI，尽管用到了学习型AI的一些方面来实现计算机视觉。特斯拉所采用的，就是标准的现成技术，一种基于深度学习的计算机视觉技术。我想，老年人护理机器人，或者家政机器人，肯定都是日本很感兴趣的，它们对社会非常有用。特别是在老龄化社会——这是一个相当紧迫的问题。

“如果有一天，AI参与了某种新粒子的发现过程，那应该还挺酷的。”

为什么基于学习的方法在这一类用例里面要优越得多呢？

哈萨比斯：你只要想想：“为什么现在还没有这些东西？”为什么还没有一个机器人可以跟在你屁股后面，帮你收拾？原因是，每个人的房子在布局、家具等等各个方面都很不一样，即便是在同一个屋子，每一天它状态也都不一样，有时候脏乱，有时候整洁。

这就无法通过给机器人进行预编程来设定出收拾屋子方案。而且，你可能还要考虑到自己折衣服时的个人偏好。这个问题其实非常复杂。我们可能觉得这些事很容易做，但实际上，它们都涉及到非常复杂的过程。

问一个私人问题，你有没有扫地机器人？

哈萨比斯：嗯……我们确实有一个，但它不是很好用，所以……[笑]

因为我就有一个，它并不是非常好用，但我会去了解它的脾气，然后尽量忍让，因为我很懒，虽然不完美但我也忍了。所以我就想，当机器人变得更加先进以后，我们会在停止在哪个点上。会不会还没实现真正人类水平的人机交互，我们就止步了，觉得说剩下的忍一忍就好？

哈萨比斯：可能吧。如果一个机器人价格实惠，又能帮你整理碗盘，打扫屋子，那大家为什么不买呢。这些扫地机器人是蠢，而且不具备任何真正意义上的智能，但还是很受欢迎。所以确实，我觉得渐渐的，会有一些有用的东西出来。

那对于未来人类、机器人、AI这三者之间的互动，你有哪些长远的期待？大家想象得都比较科幻，往往都脑洞大开。

哈萨比斯：我个人并不是很关注机器人。

对于AI，我很想做的一件事就是用它加速科学进步。我很希望看到由AI辅助的科学研究：提供一个AI研究助理，帮你揽下很多枯燥的工作，挖掘有趣的文章，在海量数据中发现结构，然后把它呈现给人类专家和科学家，帮他们更快地实现突破。

几个月前，我在欧洲核子研究中心作了一场演讲；他们产生的数据似乎比地球上任何人都要多，而且说不定哪个地方的庞大硬盘上，就存着证明某种新粒子的数据，但就是没有人有空去分析，因为数据实在是太多了。

所以我想，如果有一天，AI参与了某种新粒子的发现过程，那应该还挺酷的。

钱皓

专注互联网早中期投资分析。欢迎自媒体合作，加QQ：1000808，请注明身份【免责声明】微博内容纯属个人业余爱好，与任职公司无关，希望与同行多交流！

+关注

底导

微博精彩: 热门微博热门话题; 微博会员微相册; 微游戏微指数

手机玩微博: 扫码下载，更多版本
戳这里

认证&合作: 申请认证链接网站; 企业微博微博营销; 微博标识广告代理商; 开放平台

微博帮助: 常见问题; 自助服务; 企业&商业热线; 4000-980-980

微博客服4000-960-960 意见反馈舞弊举报 About Weibo 微博招聘新浪网导航违规内容投诉010-60618076投诉处理大厅 DMCA投诉/Report 互联网法院微博工作站

京ICP证100780号京ICP备12002058号京网文﹝2024﹞0012-005号（京）网械平台备字（2022）第00006号京食药网食备202210035互联网宗教信息服务许可证：京（2022）0000091

(京)网药械信息备字（2023）第00076号增值电信业务经营许可证B2-20140447增值电信业务经营许可证京B2-20221511乙测资字11510760出版物经营许可证新出发京批字第直220253号

中国互联网举报中心北京互联网举报中心内容从业人员违法违规行为举报网络110报警服务北京文化市场举报热线中国互联网协会北京网络行业协会扫黄打非举报入口网络谣言曝光台