AlphaGo之父:下个版本会让电脑从零学围棋

2016年03月11日 18:33 新浪科技 微博
微博 微信 空间 分享 添加喜爱
DeepMind创始人哈撒比斯DeepMind创始人哈撒比斯

  导语:3月9日,谷歌人工智能AlphaGo战胜韩国棋手李世石引起巨大轰动,美国科技媒体“The Verge”在比赛结束后对AlphaGo背后的DeepMind公司联合创始人德米斯·哈萨比斯进行了长篇访谈,哈萨比斯谈到了他对人工智能未来的看法。

  以下是文章全文:

  DeepMind的AlphaGo战胜韩国传奇棋手李世石,点燃了空前的对人工智能问题的热情。但是,这家谷歌子公司的AlphaGo计划却远远超出了它自身 - 甚至可以说它本身都不是重点。作为DeepMind的联合创始人,德米斯·哈萨比斯(Demis Hassabis)在本周早些时候表示,DeepMind要做出“智慧解决方案”,对此他有一些想法。

  哈萨比斯自己走了个不寻常的路去达到人生目标,现在回想起来这却是一个完美的道路。哈萨比斯是一个在智力奥林匹克竞赛中5次获得冠军的国际象棋神童。他声名鹊起则是年轻时在英国Bullfrog和Lionhead游戏开发公司工作,在那里他致力于开发一款类似于“主题公园”、“黑与白”的人工智能游戏,后来他成立了自己的工作室。哈萨比斯在00年代中期离开了游戏行业去读完神经科学的博士学位,2010年他与别人联合创立了DeepMind公司。

  在AlphaGo首次战胜李世石后的清晨,哈萨比斯坐下来接受The Verge的访谈。他在进屋时评论着首尔四季酒店(注:比赛地点)的灯光布景,给人的感觉十分温馨友好。当一个谷歌代表告诉他,昨夜有3300篇韩国媒体文章报道了他,他明显看起来非常吃惊。 “这令人难以置信,对吧?”他说, “看到一个深奥难懂的事物开始流行起来,这很有趣。”

  除了AlphaGo,我们的谈话触及视频游戏、下一代智能手机助手、DeepMind在谷歌公司中的角色、机器人、AI如何帮助科研等等。

  注:本次采访内容已被轻度编辑,以便于阅读。

  问:The Verge 记者萨姆·贝福德(Sam Byford):对于那些不了解人工智能或围棋的人,你会如何描述昨天所发生的文化共鸣?

  哈萨比斯:对于这些我要说几点。围棋一直是完全信息博弈的巅峰。它在可能性方面比国际象棋更复杂,所以它一直是人工智能研究领域努力寻求突破的重大挑战,尤其是在“深蓝”之后。你知道,即使付出了很多的努力,我们还是没有走出太远。蒙特卡洛树搜索是十年前一个很大的创新,但我认为我们成功地用AlphaGo给神经网络引入了“直觉”——如果你想这么叫的话,而正是这些直觉让某些人成为顶尖棋手。我很惊讶,即使是现场解说迈克尔·雷德蒙德(Michael Redmond)也很难算出结局,他可是一个职业9段棋手啊!而这表明了你是有多么难写出围棋的“评价函数”(valuation function)。

  问:当你看到AlphaGo的特殊举动,你会感到惊讶吗?

  哈萨比斯:是啊。我们相当震惊,我认为李世石也是,从他的面部表情就能看出来。AlphaGo的那步棋深深地打入了李世石的领地。我认为这是一个相当意外的举动。

  问:是因为(这步棋的)侵略性吗?

  哈萨比斯:嗯,是因为侵略和大胆!此外,它在比赛中戏耍了李世石。李世石以好战而闻名,这就是他所传达出的,我们期待的那种东西。本场比赛一开始,他就在整个棋盘上求战,但是没有一处是真的。传统的围棋程序在处理这种情况时非常无力。他们在局域计算中并不差,但是在需要通盘视野的时候会很无力。

  问:举行这次比赛的一大原因就是评估AlphaGo的能力,无论输赢。你从昨晚学到什么?

  哈萨比斯:好吧,我想我们了解到:我们已经沿着这条线走出了很远 ——没有超出我们的预期,但达到了我们的期望。我们要告诉大众,我们认为比赛是五五开。我认为这仍然可能是正确的,这儿任何事都有可能发生,我知道李世石今天回来后会采取不同的策略。所以,我认为寻找出对手策略将是非常有趣的。

  刚才谈到了AI的意义,回答了你的第一个问题。另一个我要告诉你的事情是,我们和深蓝是不同的。深蓝是一个“手工”程序——程序员从国际象棋的规则中提炼出信息和获得启发。而我们的AlphaGo拥有学习能力,它通过实践和学习获得知识,这更像人。

  问:如果在系列赛中AlphaGo继续以这种方式取胜,接下来会发生什么?未来会有一个人工智能的游戏对决吗?

  哈萨比斯:我认为作为围棋是完全信息博弈的巅峰。当然,我们还有其他顶尖棋手要比赛。此外,其他的游戏 ——像无限押注的德州扑克就非常困难。多人比赛会有其他的挑战,因为它是一个不完全信息博弈。再有明显的就是,人类在玩《星际争霸》这类游戏时比电脑更好。战略游戏需要在一个不完全信息的世界里拥有高层次的战略能力。而围棋的事情是很明显的,你可以在棋盘上看到一切,因此,这对于电脑来说更容易一些。

  问:(人工智能)打《星际争霸》这些游戏你个人会感兴趣吗?

  哈萨比斯:也许吧。我们只对研究项目主线范围内的事情感兴趣。所以DeepMind的目的不只是打游戏,尽管那非常有趣而且令人兴奋。你知道,我喜欢玩游戏,我以前编写过电脑游戏。但是那仅限于作为测试平台,用于尝试写出我们的算法思想和测试出它能到多高等级、能玩得多好,这是一个非常有效的方式。最终,我们希望能应用到现实世界中的重大问题。

  问:90年代末,我在英国长大,当时我在电脑杂志上看过你的名字,你的名字常常和游戏联系在一起。当我第一次听说DeepMind,看到你名字时,我在想:“真是绝配。”之前你在游戏行业的职业经历对于现在所做的工作有何影响?

  哈萨比斯:类似DeepMind的东西一直是我的终极目标。从某种意义上来说,我在这方面的计划已有20多年时间。如果你从这种角度来看,即我所做的一切都是为了最终进军人工智能领域,那么可以发现我的选择是合理的。如果熟悉我在Bullfrog等公司的工作,那么你会知道,人工智能是我所做一切的核心。很明显,(Bullfrog创始人之一)皮特·莫里诺克斯(Peter Molyneux)的游戏也都是人工智能游戏。

  16至17岁时,通过开发《主题公园》,我意识到如果继续发展人工智能,那么人工智能将发挥巨大的力量。我们卖出了数百万个拷贝,而许多人都喜欢这款游戏。正是由于人工智能的存在,这款游戏才可以适应玩家。我们随后继续进行开发,而我也在游戏行业的职业生涯中试图继续发展这一技术。

  随后,我退出了游戏行业,回到了学术界,从事神经科学的研究。因为在21世纪00年代中期,我感觉通过游戏这扇“后门”去展开人工智能研究已经非常困难,因为游戏发行商只想要游戏。

  问:当时,游戏是否是人工智能唯一显而易见的应用?

  哈萨比斯:是的,我认为是这样。实际上我认为,当时我们正在开发技术极其领先的人工智能。我想说的是,那时学术界还停留在90年代,而所有新技术都尚未普及,也没有得到大规模应用,例如神经网络、深度学习和强化学习。因此,最优秀的人工智能技术存在于游戏之中。

  当时的技术不同于我们目前开发的学习型人工智能,而更多的像是有限状态机。但这些系统很复杂,并且具有自适应性。类似《Black & White》的游戏采用了强化学习技术。我认为这是到目前为止游戏中最复杂的人工智能应用案例。不过到2004至2005年,很明显游戏行业走上了与90年代不同的发展方向。90年代的游戏很有趣,具有创新性。当你想到一个点子时,就可以将其开发出来。而到00年代,游戏更强调图像、内容IP,类似FIFA的游戏大行其道。因此,游戏行业不再有趣。

  在游戏行业,我做了能做的所有一切,在成立DeepMind之前我需要收集好必要的信息。这就是神经科学。我希望从大脑解决问题的方式中获得灵感。因此,没有什么其他方式比攻读神经科学的博士学位更好。

  问:这些或许是唾手可得的果实。你是否会将人工智能的技术进步应用在今天的游戏中?

推荐阅读
聚焦
关闭评论
原创策划

知读会

专访《马斯克传》作者

专访《马斯克传》作者

文斯介绍了他撰写这本书的经历、对马斯克本人的了解以及马斯克与乔布斯的对比。 [详细]

精彩图集

直击人机围棋大战第二局

直击人机围棋大战第二局

谷歌人工智能AlphaGo与韩国棋手的第二局比赛,AlphaGo再下一城,以总比分2:0领先李世石。 [详细]