创造一种全新的有用蛋白质,听起来就不像一件普通人能够做到的事情。但如果说只需你随便哼唱一段旋律,就有可能创造出一种全新蛋白质,是不是很不可思议?
这就是麻省理工学院科学家们最新实现的一项成果,在 6 月 26 日发表在 ACS Nano 杂志上的论文中,研究人员通过科学与艺术完美的结合,开发出一套可以将蛋白质分子结构转化成声音的系统,而研究人员逆转这一过程时,只需创作一段旋律,就能够将其转化为自然界中从未见过的全新蛋白质。
视频 | 利用蛋白质的氨基酸序列制作音乐(来源:American Chemical Society/YouTube)
该系统由麻省理工学院土木与环境工程系主任、McAfee 工程学教授 Markus Buehler、博士后 Chi Hua Yu 及其同事开发。根据论文中的具体描述,该系统将自然界中的 20 种氨基酸转换成 20 个音调的音阶。氨基酸是蛋白质的基本组成单元,这也就意味着任何构成蛋白质的氨基酸长序列都能够转化为一串音符序列。
对于熟悉西方音乐传统的人来说,这样的音阶听起来可能并不习惯,但是如果熟悉了这些声音之后,就能很容易辨别出它们之间的关系和区别。Buehler 表示,在听了这些旋律后,他现在已经能够分辨出特定的氨基酸序列,而这些氨基酸序列与具有特定结构功能的蛋白质相对应。
编码蛋白质语言
蛋白质是组成皮肤、骨骼和肌肉的结构材料,同时也是生命体中酶、化学信号物质、分子开关的功能材料。但是蛋白质的结构,包括决定他们三维形状的折叠方式,是极其复杂的。
“他们有自己的语言,而我们不知道它是如何运作的。”Buehler 说,“我们不知道是什么使丝蛋白成为丝蛋白,也不知道什么样的结构模板决定了酶的功能。”
为了更好地理解蛋白质,研究人员尝试将蛋白质语言翻译成人类更容易理解的另一种形式——音乐。与音乐一样,蛋白质的结构也是分层的,在不同的长度或时间尺度上有不同的结构层次。
而蛋白质复杂的结构和功能信息则能够很好地编码在音乐的音调、音量和持续时间等维度中。研究人员希望通过这种方法收集到关于不同蛋白质之间的关系和差异,并以此作为探索调整和修改蛋白质结构、功能的方法。
利用分子的物理特性来确定声音,该系统提供了一种将蛋白质的氨基酸序列转换成音乐序列的方法,虽然这些声音是为了让人类能够听到而被调换的,但是这些音调和它们之间的关系是基于每个氨基酸分子本身的实际振动频率,而这些振动频率是用量子化学理论计算出来的。
图 | 新方法将蛋白质的氨基酸序列转换成敲击和有节奏的声音序列(来源:ACS Nano)
研究小组使用人工智能系统来研究由多种不同蛋白质产生的旋律。他们让人工智能系统在音乐序列中引入微小的变化,或者创造出全新的旋律,然后将声音翻译回相对应的蛋白质。
通过这个过程,研究人员能够创造出现有蛋白质的变体,例如基于在自然界最强的材料之一的蜘蛛丝中发现的一种蛋白质,制造出不同于任何进化产生的更强大的全新蛋白质。
尽管研究人员自己可能也不知道蛋白质语言潜在的规则,但人工智能程序已经学会了蛋白质是如何设计语言的,从而可以对其编码,创造现有版本的变体或全新的蛋白质设计。
研究人员表示,考虑到氨基酸序列有数万亿种潜在的组合,当涉及到创造新的蛋白质时,你不可能从零开始,而这正是人工智能所能做的。
“组合”新蛋白质
通过使用这样一个系统,用一组特定种类蛋白质的数据来训练人工智能可能需要几天的时间,但之后它可以在几微秒内设计出一种新的变体。研究人员表示,没有其他方法能与之媲美,缺点就是这个模型没有告诉我们里面到底发生了什么。“我们只知道它管用。”
其实,这种将蛋白质结构编码到音乐中的方式,反映了更深层次的事实。教科书上的分子结构图,看起来是静态的,实际上它根本不是静止的。每一个分子都在运动和振动,每一丁点的物质都是一组振动组合。
不过,该系统还不允许任何形式的定向修改——任何性质的定向变化,比如机械强度、弹性或化学反应活性,本质上所有的改变和创造将是随机的。当一种新的蛋白质变异产生时,没有办法预测它会发生什么。
该团队还创作了由氨基酸的声音发展而来的音乐作品,这些音乐作品完全由氨基酸产生的声音组成。研究人员表示,目前还没有使用人造或天然的乐器来展示如何利用这种新的声音来源进行作品创作。
研究人员还开发了一款名为“氨基酸合成器”(Amino Acid Synthesizer)的免费安卓智能手机应用程序,可以播放氨基酸的声音,将蛋白质序列录制成音乐作品。
音频 | 这里听到的敲击、节奏和旋律声音完全是由氨基酸序列产生的(来源:MIT)
“Markus Buehler 具有极具创造性的灵魂,他对生物分子内部工作机制的探索极大地促进了我们对生物材料力学反应的理解。”没有参与这项工作的加州大学材料科学教授 Marc Meyers 说,“这种对音乐的想象是一个新颖而有趣的方向。生命的节奏,包括我们心脏的搏动,是重复声音的最初来源,产生了美妙的音乐世界。Buehler 已经进入纳米空间来提取生命基石——氨基酸的韵律。”
“蛋白质序列是复杂的,蛋白质序列之间的比较也是复杂的。MIT 团队提供了一种令人印象深刻的、有趣的和不寻常的方法来探究和解释这种复杂性。这种方法得益于我们与生俱来的听复杂音乐的能力。通过和谐不和谐,我们现在有了一个有趣和有用的工具来比较氨基酸序列。”同样没有参与这项研究的澳大利亚悉尼大学生物化学和分子生物教授 Anthony Weiss 评价道。
-End-
编辑:王新凯
参考:
http://news.mit.edu/2019/translating-proteins-music-0626
https://arstechnica.com/science/2019/06/amino-acids-make-beautiful-music-to-design-novel-protein-structures/
https://pubs.acs.org/doi/10.1021/acsnano.9b02180