Nature: 化学界“AlphaGo”问世：加速合成人类所需的化合物

PaperRSS

提示：欢迎点击上方「PaperRss」↑关注我们！

　　人工智能带来的革命仍在继续：从沃森（Waston）机器人不到10分钟诊断出白血病，到AlphaGo击败世界排名第一的围棋选手；从战场到太空，随处都可见其身影。其实，AI也早已渗透进科研领域，成为科学家进行学术研究的新手段。

　　现在，科学家们已经构建出了化学界的“Alphago”：科学家们在《Nature》上发文证明，AI能够以前所未有的速率进行逆向合成反应。

　　在化学研究中，由简单的原料开始合成一个复杂化合物是非常困难的。而逆向合成则是设计化合物生产的标准方法，即化学家们通过逆向思维，从想要制造的化合物分子开始，然后分析可以通过哪些容易得到的试剂和反应序列来合成它，这种方法被广泛用于制造药物和其他产品。

　　逆合成分析法于20世纪60年代由哈佛大学教授E。 J。 Corey提出。Corey教授因发现这一技术，获得了1990年的诺贝尔化学奖。

　　过去，科学家们一直使用计算机辅助有机合成的方式，来完成逆合成分析过程。尽管这种方法可以提高合成效率，然而传统的计算机辅助方式合成速度仍然较慢，且提供的分子质量参差不齐。人类还是需要手动搜索化学反应数据库，来找到制造分子的最佳方法。

图丨Marwin Segler

　　而 Segler团队开发的新AI工具则使这一过程大大缩短。在未来，人类发现新药或者其他产品的速度将有望达到全新水平。

　　化学反应也如同下棋

　　其实，化合物的产生和下棋也有异曲同工之妙。相关的化合物可以被分解成基本组成成分，这些成分便是“棋子”，而计算机程序为这些“棋子”提供不同的路径，然后再在实验室中将它们合成。

　　当然，理论上来看这似乎是很容易的事情，但在实践中却遇到了困难。Segler说：“化学领域比围棋界有更多的可能性，问题也要复杂得多。”

图丨和两种传统合成方法相比（红色和绿色），使用新型人工智能算法（蓝色）在较短时限内可以完成更多分子的合成路线预测。

　　而在最新的研究中，新的AI工具通过深度学习神经网络来学习所有已知的单步有机化学反应——大约1240万个。这使它能够预测在任何单一步骤中可以使用的化学反应。AI工具重复应用这些神经网络来规划多步骤合成，解构所需的分子，直到最终得到可用的试剂。这项工作得到了德国研究基金会的资助。

图 | 逆合成分析法示意图

　　Segler说：“逆向合成是有机化学中的终极学科，一名化学家需要数年的学习才能掌握它——这像下棋一样，除了要学习专业知识外，还需要敏锐的直觉和极强创造力。我们所展示出的是：计算机本身就可以从现有的文献中学习种种规则及这些规则的应用。”

　　目前，许多来自不同学科的研究人员正在着手研究将深度神经网络与蒙特卡洛搜索树相结合。蒙特卡洛搜索树是一种用来评估游戏中移动情况的方法。每走一步，计算机会模拟无数种可能发生的情况，比如如何使象棋游戏结束，计算机会选择最佳方式去走。

图丨Mike Preuss

　　类似地，机器也可以使用这种深度神经网络，来寻找化学合成中的最佳方式。信息系统专家兼该项研究作者Mike Preuss则用一句话总结了这次的化学界“Alphago”的成功秘诀：“深度神经网络用于预测哪些分子会参加反应。蒙特卡洛搜索树来预测反应的可能性”。

　　具体而言，该团队开发的AI算法拥有一个包含1200万个已知反应的数据库，其深层的神经网络程序可以从1200万个已知反应中不断学习，而不是在硬性规则中进行编程。而数据库提供的数据越多，算法可以探索的化学途径就越多，预测合成路线的准确度也就越高。

　　这个算法还运用了类似于AlphaGo的蒙特卡罗树搜索，可将目标分解成数千个可能的节点，在每一步化学反应后评估最有可能成功的下一步，并进一步探索这个“分支”。

图丨AI算法探索不同的化学路径并选择成功率最高的

　　在一次测试中，Waller的小组使用该算法尝试绘制治疗阿尔茨海默病的某种药物中间体的六步合成路线。结果算法在5.4秒内就计算出了与文献反应相同的途径。

　　正如Segler说，“人们认为，像教计算机下国际象棋一样，将大量规则输入计算机，就能够实现想要的效果。但这并不奏效——化学是非常复杂的，它不能仅用简单的规则去理解。事实告诉我们，有新反应的出版物数量每十年就会翻一番。化学家和程序员都无法跟上这种变化。我们需要AI的帮助。”

　　药物合成领域的里程碑

　　那么，这次的化学界“Alphago”究竟本事如何呢？

　　在一项双盲AB测试中，Muenster 的研究人员发现，AI生成的合成路线丝毫不逊于经过测试生成的的合成路线。

　　Segler和他的团队为了测试新AI工具所产生的途径是否能被有经验的化学家分辨出来，向来自中国和德国的两个研究所的45位有机化学家展示了9个分子的两种潜在合成路线：一种由AI合成的途径，另一种途径是由人类设计的。结果，有机化学家们并不能区分出来。

　　Segler说，“我们希望化学家能通过我们的方法，使用更少的资源，进行更少的实验，生产出能够提高我们的生活水平的物质。”

　　事实上，自20世纪60年代以来，研究人员一直在试图利用计算机能力规划有机化学合成，但收效甚微。那个时候，有机化学实验室看上去还像是炼金术的天堂：成排的试剂瓶，老旧的木制试管，以及俯在案边忙碌的化学家。

　　经过50年的快速发展，实验室场景在改变，不过，科研人员工作的本质没变，有机化学家仍需要不断描绘所需要的反应顺序，然后试着遵循这一顺序用手煞费苦心地进行操作。

　　而随着人工智能技术的发展，人们开始试图将机器和人工智能整合至科研进程中，通过创造能自动合成有机分子的设备，将化学家们解放出来。

　　尽管这次的成果并不是第一次在药物合成中运用AI工具，但是，化学家们仍将这一发展视为药物合成领域的一个里程碑，这不仅是因为它可以加速药物发现过程，也是因为它是目前使用AI来标记潜在反应路线的最有效程序之一。

　　2018年3月，韩国Ulsan国立科学技术研究院的化学家Grzybowski报告说，他已经在实验室测试了 Segler团队开发的新AI工具算法建议的8条化学反应途径，并且都成功了。

　　值得一提的是，Segler团队的新AI工具的工作原理有别于Grzybowski及其团队此前发明的加速化学合成的Chematica（它需要人将有机化学规则输入到该系统中供程序使用），因为它只从数据中学习，不需要人类输入规则。

　　瑞典计算化学家Ola Engkvist对这项工作印象深刻。他说：“提高合成化学的成功率，对药物研发项目的速度和效率以及降低成本都有巨大的好处。”

　　Segler也透露，这个AI工具已经引起了几家制药公司的兴趣，但他并不认为有机化学家会因此失业。“AI将成为化学家的助手，”他打了一个比方，“GPS导航设备可能会使纸质地图变得多余，但不是使汽车驾驶员变得多余。”

　　“在过去的60年里，科学家们一直试图通过人工编码的方式，将合成规则指定给计算机，”Waller博士在论文中写道：“和传统方法不同的是，我们使用了具备规划能力、符号象征能力及自动化学习能力的强大算法，这对于计算机能否在化学合成中发挥辅助作用至关重要。而这一技术也为满足人类在农业、医疗及材料科学等领域的需求奠定了坚实的基础。”

　　-End-

　　编辑：邢欢校审：黄珊

　　参考：

　　https：//arxiv.org/pdf/1708.04202.pdf

　　https：//www.nature.com/articles/nature25978

　　来源：DeepTech深科技

相关同类报道

近日，来自上海大学的Mark Waller教授及其团队进行了一项新研究，应用深层神经网络及人工智能算法，来规划新的化学合成路线。这一研究成果已经发表在了最新一期的《自然》杂志上。

逆合成分析法示意图（图片来源：Wikimedia Commons）

逆合成分析法是当今有机合成化学的重要手段之一，于20世纪60年代由哈佛大学教授E. J. Corey提出。这种方法揭示了如何将所需分子分解为更简单的化学构建块，然后化学家可以采取必要的反应步骤，用这些简单的结构单元制备所需的分子，用于制造药物和其他产品。Corey教授因发现这一技术，获得了1990年的诺贝尔化学奖。

为了解决这一问题，Waller教授团队使用蒙特卡洛树搜索（Monte Carlo tree search，MCTS）和与指导搜索的扩展策略网络以及筛选网络相结合，形成了一种新的人工智能算法。研究人员使用2015年之前发布的所有化学反应作为数据，来对这种新型算法进行训练，让这种算法可以自己学习一套“规则”，来预测那些并未包含在训练数据集中的小分子合成路线。

▲和两种传统合成方法相比（红色和绿色），使用新型人工智能算法（蓝色）在较短时限内可以完成更多分子的合成路线预测（图片来源：《Nature》）

研究结果表明，这种新型的算法在单个分子限制时间为5秒钟的情况下，能够对测试集中80%的分子合成路线进行预测。当单个分子用时限制延长至60秒时，新型算法预测分子合成路线的比例达到了92%。这一结果比传统的计算机辅助合成路线设计加快了近30倍。并且在随后进行的双盲测试中，化学家们无法针对同一个分子，对算法预测出的合成路线以及原始文献中的合成路线进行有效区分，从侧面说明了这种新型算法预测的准确性。

这项研究的负责人Mark Waller博士（图片来源：Wallerlab）

“在过去的60年里，科学家们一直试图通过人工编码的方式，将合成规则指定给计算机，”Waller博士在论文中写道：“和传统方法不同的是，我们使用了具备规划能力、符号象征能力及自动化学习能力的强大算法，这对于计算机能否在化学合成中发挥辅助作用至关重要。而这一技术也为满足人类在农业、医疗及材料科学等领域的需求奠定了坚实的基础。”

随着人工智能技术的不断发展，其已经开始在化学合成领域发挥强大的作用。我们也希望，未来的人工智能可以在更加多样的科研领域内，实现越来越多的突破。

参考资料：

[1] Planning chemical syntheses with deep neural networks and symbolic AI

Planning chemical syntheses with deep neural networks and symbolic AI
Nature ( IF 40.137 ) Pub Date : 2018-03-28 , DOI: 10.1038/nature25978
Marwin H. S. Segler, Mike Preuss, Mark P. Waller

To plan the syntheses of small organic molecules, chemists use retrosynthesis, a problem-solving technique in which target molecules are recursively transformed into increasingly simpler precursors. Computer-aided retrosynthesis would be a valuable tool but at present it is slow and provides results of unsatisfactory quality. Here we use Monte Carlo tree search and symbolic artificial intelligence (AI) to discover retrosynthetic routes. We combined Monte Carlo tree search with an expansion policy network that guides the search, and a filter network to pre-select the most promising retrosynthetic steps. These deep neural networks were trained on essentially all reactions ever published in organic chemistry. Our system solves for almost twice as many molecules, thirty times faster than the traditional computer-aided search method, which is based on extracted rules and hand-designed heuristics. In a double-blind AB test, chemists on average considered our computer-generated routes to be equivalent to reported literature routes.

温馨提示：

为方便PaperRSS粉丝们（目前突破 1.5 w+）科研、就业等话题交流。PaperRSS微信公众平台特建立了全国博士就业交流群。群成员主要为美国、欧洲、日本、清华北大、中科院名校、地方大学硕博在读生以及企业经理，HR；涉及各学科领域方向。欢迎各位加小编微信号（IGDB2010）申请加入。PaperRSS为你打造一个高质量的科研、就业交流圈，PaperRSS与你一起扬帆起航。温馨提示：进群请备注一下（姓名-单位-研究方向，谢谢。此外，若高校或科研单位、企业（含博士后）想在此平台发布招聘信息，可以后台联系小编，微信号同上。

课堂外的学术风景

长按可识别图中二维码

轻松关注PaperRSS微信公众号

本硕博交友扫上方二维码关注“本硕博联谊服务号”，

进入本硕博联谊网站，加入互选池，发帖/应征。

继续滑动看下一个