AlphaGo之父：下个版本会让电脑从零学围棋|AlphaGo|人工智能|围棋_新浪科技

DeepMind创始人哈撒比斯

　　导语：3月9日，谷歌人工智能AlphaGo战胜韩国棋手李世石引起巨大轰动，美国科技媒体“The Verge”在比赛结束后对AlphaGo背后的DeepMind公司联合创始人德米斯·哈萨比斯进行了长篇访谈，哈萨比斯谈到了他对人工智能未来的看法。

　　以下是文章全文：

　　DeepMind的AlphaGo战胜韩国传奇棋手李世石，点燃了空前的对人工智能问题的热情。但是，这家谷歌子公司的AlphaGo计划却远远超出了它自身 - 甚至可以说它本身都不是重点。作为DeepMind的联合创始人，德米斯·哈萨比斯(Demis Hassabis)在本周早些时候表示，DeepMind要做出“智慧解决方案”，对此他有一些想法。

　　哈萨比斯自己走了个不寻常的路去达到人生目标，现在回想起来这却是一个完美的道路。哈萨比斯是一个在智力奥林匹克竞赛中5次获得冠军的国际象棋神童。他声名鹊起则是年轻时在英国Bullfrog和Lionhead游戏开发公司工作，在那里他致力于开发一款类似于“主题公园”、“黑与白”的人工智能游戏，后来他成立了自己的工作室。哈萨比斯在00年代中期离开了游戏行业去读完神经科学的博士学位，2010年他与别人联合创立了DeepMind公司。

　　在AlphaGo首次战胜李世石后的清晨，哈萨比斯坐下来接受The Verge的访谈。他在进屋时评论着首尔四季酒店(注：比赛地点)的灯光布景，给人的感觉十分温馨友好。当一个谷歌代表告诉他，昨夜有3300篇韩国媒体文章报道了他，他明显看起来非常吃惊。 “这令人难以置信，对吧？”他说， “看到一个深奥难懂的事物开始流行起来，这很有趣。”

　　除了AlphaGo，我们的谈话触及视频游戏、下一代智能手机助手、DeepMind在谷歌公司中的角色、机器人、AI如何帮助科研等等。

　　注：本次采访内容已被轻度编辑，以便于阅读。

　　问：The Verge 记者萨姆·贝福德(Sam Byford)：对于那些不了解人工智能或围棋的人，你会如何描述昨天所发生的文化共鸣？

　　哈萨比斯：对于这些我要说几点。围棋一直是完全信息博弈的巅峰。它在可能性方面比国际象棋更复杂，所以它一直是人工智能研究领域努力寻求突破的重大挑战，尤其是在“深蓝”之后。你知道，即使付出了很多的努力，我们还是没有走出太远。蒙特卡洛树搜索是十年前一个很大的创新，但我认为我们成功地用AlphaGo给神经网络引入了“直觉”——如果你想这么叫的话，而正是这些直觉让某些人成为顶尖棋手。我很惊讶，即使是现场解说迈克尔·雷德蒙德(Michael Redmond)也很难算出结局，他可是一个职业9段棋手啊！而这表明了你是有多么难写出围棋的“评价函数”(valuation function)。

　　问：当你看到AlphaGo的特殊举动，你会感到惊讶吗？

　　哈萨比斯：是啊。我们相当震惊，我认为李世石也是，从他的面部表情就能看出来。AlphaGo的那步棋深深地打入了李世石的领地。我认为这是一个相当意外的举动。

　　问：是因为(这步棋的)侵略性吗？

　　哈萨比斯：嗯，是因为侵略和大胆！此外，它在比赛中戏耍了李世石。李世石以好战而闻名，这就是他所传达出的，我们期待的那种东西。本场比赛一开始，他就在整个棋盘上求战，但是没有一处是真的。传统的围棋程序在处理这种情况时非常无力。他们在局域计算中并不差，但是在需要通盘视野的时候会很无力。

　　问：举行这次比赛的一大原因就是评估AlphaGo的能力，无论输赢。你从昨晚学到什么？

　　哈萨比斯：好吧，我想我们了解到：我们已经沿着这条线走出了很远 ——没有超出我们的预期，但达到了我们的期望。我们要告诉大众，我们认为比赛是五五开。我认为这仍然可能是正确的，这儿任何事都有可能发生，我知道李世石今天回来后会采取不同的策略。所以，我认为寻找出对手策略将是非常有趣的。

　　刚才谈到了AI的意义，回答了你的第一个问题。另一个我要告诉你的事情是，我们和深蓝是不同的。深蓝是一个“手工”程序——程序员从国际象棋的规则中提炼出信息和获得启发。而我们的AlphaGo拥有学习能力，它通过实践和学习获得知识，这更像人。

　　问：如果在系列赛中AlphaGo继续以这种方式取胜，接下来会发生什么？未来会有一个人工智能的游戏对决吗？

　　哈萨比斯：我认为作为围棋是完全信息博弈的巅峰。当然，我们还有其他顶尖棋手要比赛。此外，其他的游戏 ——像无限押注的德州扑克就非常困难。多人比赛会有其他的挑战，因为它是一个不完全信息博弈。再有明显的就是，人类在玩《星际争霸》这类游戏时比电脑更好。战略游戏需要在一个不完全信息的世界里拥有高层次的战略能力。而围棋的事情是很明显的，你可以在棋盘上看到一切，因此，这对于电脑来说更容易一些。

　　问：(人工智能)打《星际争霸》这些游戏你个人会感兴趣吗？

　　哈萨比斯：也许吧。我们只对研究项目主线范围内的事情感兴趣。所以DeepMind的目的不只是打游戏，尽管那非常有趣而且令人兴奋。你知道，我喜欢玩游戏，我以前编写过电脑游戏。但是那仅限于作为测试平台，用于尝试写出我们的算法思想和测试出它能到多高等级、能玩得多好，这是一个非常有效的方式。最终，我们希望能应用到现实世界中的重大问题。

　　问：90年代末，我在英国长大，当时我在电脑杂志上看过你的名字，你的名字常常和游戏联系在一起。当我第一次听说DeepMind，看到你名字时，我在想：“真是绝配。”之前你在游戏行业的职业经历对于现在所做的工作有何影响？

　　哈萨比斯：类似DeepMind的东西一直是我的终极目标。从某种意义上来说，我在这方面的计划已有20多年时间。如果你从这种角度来看，即我所做的一切都是为了最终进军人工智能领域，那么可以发现我的选择是合理的。如果熟悉我在Bullfrog等公司的工作，那么你会知道，人工智能是我所做一切的核心。很明显，(Bullfrog创始人之一)皮特·莫里诺克斯(Peter Molyneux)的游戏也都是人工智能游戏。

　　16至17岁时，通过开发《主题公园》，我意识到如果继续发展人工智能，那么人工智能将发挥巨大的力量。我们卖出了数百万个拷贝，而许多人都喜欢这款游戏。正是由于人工智能的存在，这款游戏才可以适应玩家。我们随后继续进行开发，而我也在游戏行业的职业生涯中试图继续发展这一技术。

　　随后，我退出了游戏行业，回到了学术界，从事神经科学的研究。因为在21世纪00年代中期，我感觉通过游戏这扇“后门”去展开人工智能研究已经非常困难，因为游戏发行商只想要游戏。

　　问：当时，游戏是否是人工智能唯一显而易见的应用？

　　哈萨比斯：是的，我认为是这样。实际上我认为，当时我们正在开发技术极其领先的人工智能。我想说的是，那时学术界还停留在90年代，而所有新技术都尚未普及，也没有得到大规模应用，例如神经网络、深度学习和强化学习。因此，最优秀的人工智能技术存在于游戏之中。

　　当时的技术不同于我们目前开发的学习型人工智能，而更多的像是有限状态机。但这些系统很复杂，并且具有自适应性。类似《Black & White》的游戏采用了强化学习技术。我认为这是到目前为止游戏中最复杂的人工智能应用案例。不过到2004至2005年，很明显游戏行业走上了与90年代不同的发展方向。90年代的游戏很有趣，具有创新性。当你想到一个点子时，就可以将其开发出来。而到00年代，游戏更强调图像、内容IP，类似FIFA的游戏大行其道。因此，游戏行业不再有趣。

　　在游戏行业，我做了能做的所有一切，在成立DeepMind之前我需要收集好必要的信息。这就是神经科学。我希望从大脑解决问题的方式中获得灵感。因此，没有什么其他方式比攻读神经科学的博士学位更好。

　　问：这些或许是唾手可得的果实。你是否会将人工智能的技术进步应用在今天的游戏中？

1 2 下一页