摘要
工程改造合成微生物底盘是揭示生命基本原则的最佳方式之一,也是增强健康、医药、农业、兽医和食品行业应用的最佳途径之一。构建微生物底盘的两个主要策略是自上而下的方法(基因组减少)和自下而上的方法(基因组合成)。有关该主题的研究计划已在若干国家获得资助。“最小基因组工厂”(MGF)项目于2001年在日本启动,目标是构建具有较小基因组的微生物用于工业用途。该项目成果的最佳实例之一是大肠杆菌 MGF-01,其基因组大小减少,表现出更好的生长和更高的苏氨酸生产特征。“细胞工厂”项目于1998年至2002年在欧盟第五框架计划中进行,该计划试图全面了解应用领域中使用的微生物。该项目的一项突出成果是阐明了枯草芽孢杆菌分泌的蛋白质,例如John Craig Venter小组成功设计和合成了最小的细菌基因组。本综述介绍了合成微生物底盘的工程,改造和应用的最新进展,特别强调了解底盘作为更好地了解生活和改进应用的方法的价值。
原文:Chi, Haotian, et al. "Engineering and modification of microbial chassis for systems and synthetic biology." Synthetic and Systems Biotechnology 4.1 (2019): 25-33.
在基因组革命和系统生物学的进步下,合成生物学在过去十年急剧增长。系统和合成生物学加速了微生物底物的工程和改造,用于生物技术、制药、生物医学和其他领域的进一步基础研究和应用。在系统生物学,理想的底盘可以是生物体携带全部功能简化的基因组和代谢网络,它能够更有效地合成所需的产品。
构建合成微生物底盘的尝试可分为两种互补方法:自上而下和自下而上。自顶向下的方法也是战略,通过删除不必要的细胞基因,以减少基因组,了解基因组结构和改善其特性。基于大规模DNA分析的出现,基因组的比较分析,尤其是来自不同生物的基因组,通常可以揭示对细胞生命和类似和/或明显不同的代谢途径不可缺少的基因。接下来,可以使用包括质粒或线性DNA介导的程序和位点特异性重组,转座子和CRISPR/Cas系统的使用(图1)。在实验室中,这种删减方法已经在大肠杆菌、链霉菌、枯草芽孢杆菌和恶臭假单胞菌中应用。这些底盘中的一些显示出几乎不受影响的生理特征,并且一些显示出意想不到的特性(表1)。然而,这种方法也带有起始生物固有的局限性,并且在很大程度上是经验性的和耗时的。
图1. 使用自上而下策略设计和修改合成微生物底盘的示意图。计算系统分析和实验数据和模型的出现和使用通常可以揭示细胞生命必不可少的基因。随后,可以通过去除非必需基因产生合成底盘,然后在下游应用中进行验证。应用程序中的基因组数据可以进一步有益于优化机箱和路径。
相反,自下而上的方法试图构建可以从头开始自组装成人工底盘的底盘。长DNA分子到整个基因组的从头合成方法主要基于使用聚合酶链反应(PCR)技术来组装重叠短寡核苷酸库(图2)。这些技术允许完整重建全基因组和新的合成微生物底盘(表1)。
图2. 采用自下而上策略构建合成微生物底盘。第一行显示通过在大肠杆菌和酵母中合成和克隆并通过基因组移植测试活力来构建基因组。第二行显示了具有所需表型的基因,途径或基因组的进一步设计,然后使用相同的方法构建最佳合成底物。
大肠杆菌的由于其明确的遗传背景、易于处理以及工业和医疗应用的潜力使其成为工程底盘的重要宿主。大肠杆菌 K-12是最彻底分析的生物之一,是遗传、生物化学和代谢研究的底盘选择。大多数大肠杆菌底盘从两个密切相关的K-12株,MG1655和W3110。自从2002年发表的基因组减少的大肠杆菌菌株的第一份报告以来,删除了基因组大小已从5.6%提高到38.9%。
为了构建多缺失系列(MDS)菌株,开发了一种快速而直接的方法。通过λ红色同源重组将PCR产生的DNA片段插入基因组中,然后进行双链断裂(DSB)后的重组修复过程,导致无疤痕缺失。从MG1655基因组中通过去除大部分潜在的“自私”DNA(隐蔽性前噬菌体,噬菌体残余物和插入序列[ISs])以及大部分功能未知的基因,产生12个缺失菌株(MD1至MD12)的基因组。。MDS12的生长特性和可转化性基本与野生型 MG1655相同。从菌株MDS12开始,通过一系列基因组序列比较鉴定了近100个提出的缺失(20%的K-12基因组),随后通过λ-red同源重组删除。得到的菌株MDS41,42和43被证实不含IS,总缺失长度分别为662.6, 663.3和708.3kb。MDS42的电穿孔效率等于或超过用于转化的购买菌株的电穿孔效率。然而,最新研究证实,MDS42的基因组减少并未在代谢应激下稳定。对于长期应用或拟议的环境生物技术,需要进一步修改底盘。引入硫代磷酸酯(PT)修饰将是非常有用的,其中DNA 糖磷酸骨架的磷酸部分中的非桥接氧被硫取代,以保护寡核苷酸免于核酸酶降解。DNA PT修饰由两部分组成:DndABCDE作为限制修饰(RM)系统的M组分,保护细胞免受入侵的外来DNA,而DndFGH,作为R组分,识别和水解非PT-保护外源DNA。最近,PT修饰被认为是参与表观遗传基因调控和维持细胞氧化还原稳态的多功能参与者,这有助于维持简化底盘的稳定性以用于进一步的研究。
使用λ-Red重组系统和阴性选择标记sacB(无标记缺失方法)构建另一种代表性的基因组大肠杆菌菌株MGF-01。通过比较分析大肠杆菌 K-12 MG1655和Buchnera sp. ASP的基因组序列,选择了103个区域,基因组大小减少了22%(1.03 Mb)。MGF-01在M9基本培养基中生长至最终细胞密度,比W3110red高1.5倍。此外,MGF-01还显示出1-苏氨酸产量增加2.4倍。随着MGF-01基因组的进一步减少,构建的DGF-327和DGF-298菌株没有任何ISs,基因组大小分别减少了3.27和2.98 Mb。两种菌株均未显示营养缺陷型表型,并且具有更好的生长适应性,特别是在初始生长期,并且在富含培养基中比野生型K-12菌株具有更好的细胞产量。
最近,开发了用于快速编辑宿主基因组的CRISPR/Cas辅助多重自动化基因组工程(MAGE),并且其在大肠杆菌BL21(DE3)中得到证实,该菌株常规用于基于高水平质粒的重组蛋白生产。BLK16,尤其是BLK17表现出高细胞和基因组稳定性,并推荐用于染色体或基于质粒的异源酶或完整途径的高保真表达。最后,BLK16意外地显示出改善的可转化性。
链霉菌是人类医学、兽医学和农业中产生新天然产物的能力。在后基因组时代,收集的大量(宏)基因组数据显示,放线菌具有大的基因组,编码多个次级代谢物生物合成基因簇,其中大部分仍然是隐蔽的。然而,大多数这些菌株遗传操作不便。因此,有必要开发一些通用的模型底盘作为宿主来表达异源次级代谢物途径,特别是用于激活隐性基因簇以帮助药物发现。这样的底盘:无重复的次级基因簇,除去竞争碳和氮利用,增加前体的可用性和异源基因的克隆簇的生产率。
阿维链霉菌(Streptomyces avermitilis)是驱虫剂阿维菌素的生产者,其线性染色体为9.02 Mb。三个发表的比较分析链霉菌的基因组,天蓝色链霉菌 A3(2),灰色链霉菌和链霉菌,揭示6.28-6.50 MB的保守核心区,其中所述的基因是生长。左和右亚端粒区域分别为2 Mb和0.5 Mb,含有菌株特异性基因,编码次级代谢产物生物合成的基因,无必需基因。亚端粒区的超过1.4 MB使用一般的同源重组或删除位点特异性重组(Cre- LOX P)的技术来获得一系列多重缺失突变体,其染色体对应于野生型染色体的83.12-81.46%的。突变体可以在没有额外补充物的最小培养基上生长,表明缺失区域中没有必需基因。此外,这些突变体不产生任何主要的内源性次级代谢产物,并且成功地用作有效异源基因表达的底物,其水平高于天然生产者,导致产生外源天然和非天然代谢物。
天蓝链霉菌(Streptomyces coelicolor)是一种模型菌株,用于开发最早的异源基因转移基因重组技术。通过同源重组从天蓝色链霉菌 M145(缺乏质粒SCP1和SCP2的野生型菌株A3(2)的衍生物)中删除了四个抗生素基因簇。接下来,引入的rpoB [S433L](赋予对利福平抗性)并且另外的rpsL [K88E](赋予链霉素抗性),产生链霉菌 M1152和M1154。尽管使用M1152和M1154获得的生物量产量低于液体培养物中M145的生物量产量,但是两种菌株在从种子培养物接种后与亲本菌株生长相似。该研究表明,观察到M1154通常提供最高水平的抗生素产生,并且M1152比野生型菌株更好地形成孢子,促进菌株保存和操作。链霉菌属 FR-008是一种快速生长的微生物这是一种潜在的工业生产底盘,通过模块化的聚酮化合物合成酶产生大量的大环内酯类糖苷。首先,Streptomycessp的长度为7.26-Mb。使用PacBio测序和转录组分析证实FR-008基因组,其表明该基因组是最小序列的链霉菌基因组之一。然后通过缺失包含150kb染色体的三种内源性聚酮化合物合酶(PKS)基因簇构建突变体(LQ3)。LQ3具有更加稳定和简化的基因组,可以实现更简单,更有效的分离和纯化 生物技术应用程序。
恶臭假单胞菌(Pseudomonas putida)是一种普遍存在的革兰氏阴性土壤细菌,符合许多生成合成生物学底物的标准,包括其代谢多样性,稳健性和易于操作。此外,假单胞菌物种天然产生繁杂的次级代谢产物,包括鼠李糖脂,萜类,聚酮化合物,和非核糖体肽和其它氨基酸衍生的化合物。P. putida KT2440是最佳表征的腐生实验室假单胞菌,和2002年以来。基于该菌株,使用组合方法构建四个双缺失突变体,其中在两个循环中缺失高达7.4%的单个基因组。这种可回收的三步切除方法基于定制的mini-Tn5 转座子和FLP - FRT位点特异性重组系统的组合。菌株407.1-Δ 2和407.3-Δ 2 在LB培养基中显示出与野生型菌株相似或更好的生长,最终细胞密度比TEC1高1.4倍。
丛毛单胞(Comamonas )是一个属,往往有助于革兰氏阴性物种的生物修复和物质循环,由于其感测并通过追求的生物外源性化合物趋化的能力。Comamonas testosteroni CNB-1 是一种常见的Comamonas菌株,由于获得了该细菌的基因组学和蛋白质组学信息,以及其遗传和生物化学背景,它是一种非常有前途的候选物,可用作多功能和可编程底物Comamonas testosteroni CNB-1 含有质粒pCNB1,这是一种91-kb的固有质粒,可以干扰宿主的代谢性能,并具有转化效率和外源质粒的表达。因此,使用新的质粒固化策略成功地消除了pCNB1,该策略包括使用稀有切割归巢内切核酸酶,选择标记和反选择系统。随后验证了无质粒菌株的产生,以增加使用基于PCR的 Cre-lox P系统遗传操作睾丸酮丛毛单胞菌CNB-1染色体的能力。
枯草芽孢杆菌(Bacillus subtilis )是一种非致病性革兰氏阳性细菌,因其卓越的蛋白质分泌能力而闻名。此外,广泛范围的天然双组分体系和群体感应存在于系统芽孢杆菌物种都使得他们优选的底盘生物体用于工业生产的各种产品,包括化学品,生物聚合物和蛋白质。得到的枯草芽孢杆菌菌株使用逐步缺失构建 Δ6,缺少两个前噬菌体(SPβ,PBSX),三个原噬菌体样区域和最大的聚酮化合物合酶(pks )操纵子。因此,基因组减少了7.7%,同时消除了332个基因。代谢通量分析,蛋白质组学以及蛋白质分泌,能力发育,孢子形成和细胞运动的特异性检测表明,去除可有可无的基因可能为优化的芽孢杆菌细胞工厂铺平道路。通过删除11个噬菌体,噬菌体样和抗生素产生相关基因区域构建MG1M菌株约1 Mb(991 kb)。MG1M菌株缺失了大约24%的枯草芽孢杆菌基因组,没有显示出明显的形态变化,但确实表现出细胞外蛋白质表达的变化,异源淀粉酶分泌显着增加。另一种新的枯草芽孢杆菌菌株MGB874 通过逐步的基因组缺失缺少来自原始枯草芽孢杆菌 168的874kb(20%)序列。该UPP(编码尿嘧啶 - 磷酸核糖基转移酶)盒和5-氟尿嘧啶(5-FU)选择用于去除用于引入初级缺失的抗药性标记。MGB874细胞和进一步的系统分析用于工业,因为它们在细胞外纤维素酶(1.7倍)和蛋白酶(2.5倍)的生产力方面得到显着改善。
在所有已知的微生物生物活性化合物中(22,500),38%来自真菌。因此,有必要为用作抗生素,其它药物,毒素,杀虫剂,以及动物和植物的生产高价值的次级代谢产物的新的酵母菌底盘生长因子。
粟酒裂殖酵母( Schizosaccharomyces pombe),和具有高等真核生物如植物和动物共享许多相同遗传和生化特征的真核生物。粟酒裂殖酵母逐渐成为一种有吸引力的宿主,可以表达越来越多的膜和分泌蛋白以及细胞质蛋白。但是,重组的降解基因产物由宿主特异性蛋白酶在粟酒裂殖酵母对异源蛋白的生产和分泌效率。多蛋白酶缺陷底盘的构建是避免这些问题的有效方法。基于S. pombe 基因组数据库(http://www.genedb.org/genedb/pombe/),已知有200多种基因与蛋白水解生物过程有关。通过使用基于重复融合PCR的基因破坏和5-氟乳清酸介导的ura4阴性选择成功删除七种蛋白酶基因,构建了15个多重缺失突变体菌株。与对照相比,所得突变体中蛋白水解敏感模型蛋白(人生长激素(hGH))的产生增强至约30倍。
酿酒酵母(Saccharomyces cerevisiae)是第一个完全测序的真核基因组,是了解哺乳动物基因和用于从生物乙醇到胰岛素生产的生物技术过程中最广泛使用的模式生物。在学术界和工业界拥有丰富的知识基础和丰富的专业知识,使其成为生产新产品的有吸引力的底盘。为了鉴定酵母生长的必需基因并有效地产生乙醇,开发了一种计算机程序来预测酵母基因组中的可删除区域。接下来,进行PCR介导的染色体分裂(PCS)以大规模操纵酵母基因组,突变体损失约5%的基因组的缺失突变体(MFY1158,MFY1160和MFY162)提供增加的乙醇产量和甘油同时显示出到几乎等同于亲本菌株[的各种应力的抗性水平。酿酒酵母( Saccharomyces cerevisiae)的模块化底盘通过结合前体和辅因子可用性和启动子交换来构建诱导途径和抗性机制以应对生物分子生产。
酿酒酵母的巨大成就是由染色体工程的各种进步推动的。在2011 年,酿酒酵母的两个最大染色体(IV和XII)通过体内同源重组融合,产生3.2-Mb长的化合物染色体,其不损害细胞生长。2014年进一步融合,其中酿酒酵母的四条染色体(VII-V-XV-IV)被融合以产生具有最长酵母染色体臂(3.7Mb)的4.3-Mb长染色体。
最近,通过酿酒酵母BY474的16个天然染色体(I-XVI)的连续端对端融合构建了具有仅一条染色体的生物学功能性SY14,缺失了15个着丝粒,30个端粒和19个长重复。第一染色体融合菌株SY0由CRISPR-Cas9介导的染色体VII和VIII融合构建。成功地进行了另外14轮连续染色体融合,并使用相同的成对融合策略产生一系列菌株(SY1-SY14)。由于大多数染色体间相互作用的丧失,SY14中染色体的全局三维结构发生了显着变化。然而,SY14和野生型酵母细胞中的染色体具有几乎相同的转录组。无论环境,竞争力,配子的增长减少生产和生存能力,巨大的单染色体可以支持细胞生命。几乎在同一时间,通过使用CRISPR-Cas9 融合酿酒酵母BY474 的16个染色体产生携带两条染色体的n = 2菌株,并显示轻微的转录组学变化而没有重大缺陷。然而,n = 1菌株不能通过多种策略构建。这个结果可能是由于染色体融合和着丝粒位置的不同顺序,这可能影响单个染色体的最终成功融合,或者可能取决于位于不同染色体上的端粒相关长重复序列的冗余拷贝是否被删除。然而,这项研究指出了两个趋势。首先,染色体的数量可能会影响孢子可行性,特别是当数量低于16时。对于12条染色体,孢子形成显着减少,达到其野生型值的不到10%。另一个趋势是,当16个染色体菌株和8个染色体菌株之间的杂交显示出完全四分体形成和小于1%的孢子形成时,酵母孢子形成被阻止,其中没有活孢子可以恢复。这些结果表明,8个染色体 - 染色体融合事件足以分离菌株的繁殖。具有删除和融合基因组的底盘可以是解开基因组的基本原理并用于不同类型应用的重要模型。
在过去的几年中,合成生物学带来了增加的尝试来使用合理的工程原理和工作流构建和程序大型用户定义的途径乃至整个生物体。在快速和低成本DNA合成和组装技术,“引导向上”在宿主细胞中的合成的DNA和新的低通量和高通量基因组工程技术为合成微生物底盘的工程和改造铺平了道路。因此,可以解决一些最紧迫的问题,例如医疗保健; 食品生产; 产生可再生,优质和清洁能源; 和生物材料的生产。
快速有效的DNA合成和装配技术,如Gibson装配,Golden Gate装配和DNA装配,产生了对全基因组从头合成的需求。2004年,通过使用PCR技术组装重叠短寡核苷酸库,合成了一个连续的32kb 聚酮化合物合酶基因簇。虽然在PCR步骤中存在一些不便,例如昂贵的寡核苷酸合成和基因组规模的高错误率,但这一成就也是制造人工细胞的途径。2008年初,Venter及其同事合成了生物体的第一个完整基因组,一个582,970 bp的生殖支原体基因组,是一个被认为是“合成基因组学的曙光”的里程碑。该基因所得到的合成基因组的,名为生殖支原体JCVI-1.0。
利用全合成基因组装配和基因组移植的先进方法,可以创建由化学合成基因组控制的细菌细胞。基于计算机设计的基因组序列,将1.08-Mb基于Mycoplasma mycoides JCVI-syn1.0的基因组进行设计,合成,组装,然后移植到Mycoplasma capricolum受体细胞中,以产生仅由合成的M. mycoides 细胞控制。染色体。合成的M. mycoides基因组的组装是通过体外酶促策略和酵母中的体内重组的组合完成的。为了移植合成基因组,通过甲基化供体DNA或简单地破坏受体细胞的限制系统来打破限制性屏障。JCVI-syn1.0具有预期的表型特性,并且能够连续自我复制。
以syn1.0基因组为起点,通过去除42个其他基因,设计并构建了531-kb基因组JCVI-syn3.0,其中包含编码438个蛋白质和35个注释RNA的473个基因。该合成基因组小于可以在无菌培养中生长的任何已知生物的基因组。首先,Tn5 诱变用于鉴定必需的,准必需的和非必需的基因。收集的必需基因信息被用于设计和生产最小的基因组,但它未能构建可行的基因组。然后,一类准必需基因被证实不是必需基因,但需要强劲的生长。最后,通过三个循环的设计,合成和测试,构建了一个可行的最小基因组JCVI-syn3.0,包括149个功能未知的基因。最近,鉴定了这149个未知基因中的一些的推定功能,这将有益于对最小基因组的理解。JCVI-syn3.0是一个多功能底盘,用于研究生命的核心功能和探索全基因组设计。
合成酵母基因组计划或Sc2.0项目是一项雄心勃勃的计划,旨在为真核生物模型生物生成合成基因组,作为促进真核染色体遗传研究的底线。几种合成染色体,包括合成酵母染色体臂(synIXR)和完全合成染色体(synII,synIII,synV,synVI,synX,synXII),已被证明在酵母中起作用。
第一个Sc2.0合成染色体,命名为synIII,具有功能性272,871-bp染色体,基于316,617-bp天然酿酒酵母染色体III。根据适应度,基因组稳定性和遗传灵活性原则,通过在计算机中编辑原生序列来设计“设计者”序列。然后,使用三个主要步骤构建synIII,包括构建块(BB)合成,小型块的组装,以及用合成的小型块池直接放置天然酵母染色体III。通过去除多个部分,例如亚端粒区,转移RNA,内含子,转座子,使synIII基因组最小化和沉默的交配场所。其他变化包括TAG / TAA终止密码子取代,其允许使用释放的TAG密码子掺入非天然氨基酸和引入loxPsym位点和PCRTag,其允许通过定向进化容易地修饰合成酵母基因组。这些变化不会显着影响酿酒酵母的适合度,转录组或复制。
Project Sc2.0构建了一个软件框架BioStudio,用于生成染色体设计,从而可以使用从核苷酸到基因组范围的通用装配策略,并强制执行版本控制以系统地跟踪编辑。在设计每条染色体时应用了一套规则,类似于synIII构造的一些变化。开发设计规则是为了产生超过三分之一的酵母染色体,只遇到最小的问题,证明了设计的合理性。块通过限制酶限制(RE)识别位点,否则10 kb段不存在。被称为''minichunks''(2-3 kb)和'chunk''(约8-10 kb)的较小片段被组装成较长的DNA片段,''megachunks''(30-50 kb),通过RE切割和体外连接,随后将巨型块整合到天然基因组中,替换相应的野生型区段。最近,由于环synV染色体的构建,Sc2.0设计原则得到了扩展。根据Sc2.0原理化学合成,组装和掺入酿酒酵母的 SynV(536,024bp)。所有突变通过基于CRISPR-Cas9的方法校正。通过在指定坐标处精确连接染色体末端(端粒),在酵母中构建功能性环状synV(ring_synV)衍生物。它提供了一个模型来研究基因组重排,环染色体进化和人类环染色体疾病。产生完全合成酵母的一个重要步骤是携带两个和三个完全合成染色体的细胞,与野生型细胞相比,没有差异表型或基因组结构。Sc2.0项目促进了设计基因组以更好地了解生命的能力,并且还提供了构建应用程序底盘的模型。
为了设计和修改用于工业应用的合成微生物底盘并理解生命的普遍原则,世界各地的许多研究小组已经努力开发用于低通量和高通量基因组工程,全基因组合成,装配的高效策略'启动''方法。从自上而下和自下而上的角度来看生物设计为实现这一目标提供了有用的框架。
非必需基因的鉴定对于工程改造微生物底盘至关重要,这有助于了解哪些基因对细胞特性至关重要,以及支持细胞生命需要多少基因。一般而言,首先采用大量计算分析来确定维持生命的核心必需基因。必需基因通常参与基础代谢,细胞壁代谢,细胞分裂和DNA代谢。除了这些过程,非必需基因,包括隐秘的前噬菌体,噬菌体残余,插入序列[ISs],随后通过各种实验方法鉴定或删除了一些未知基因和丰富的代谢途径。最后,对实验数据的分析可以促进对一些未知基因或途径的理解,并允许进一步的工程化。通过减少现有冗余基因组构建的一些底盘已经显示出增强的基因组稳定性,增加的工业产品的产量或两者。
自上而下构建和设计底盘的方法的基本过程是通过结合计算系统分析,实验数据和诸如代谢,调节和信号网络的模型来确定必不可少的基因。然后,通过使用各种策略删除非必需基因来构建和修改底盘。在分析生物合成途径与底座中的基因组之间的相互作用之后,设计合适的生物合成途径并将其引入底盘以用于工业应用。关于天然生物部分的基因组鉴定和储存库的进一步反馈数据可以帮助显着推进合成生物学应用(图1)。最近,基因组融合技术的进步不仅有助于为研究和应用提供更好的工程用多功能底盘的策略,而且还可以使重要的进步成为可能。
为了采用自下而上的方法合成底盘,遗传电路很容易通过计算自动化设计,通过低成本的DNA合成构建,组装然后移植以产生由化学合成的基因组控制的细菌细胞。由于软件和DNA合成技术的进一步改进,目前的Sc2.0合成成本平均约为每对碱基0.10美元。当然,Sc2.0项目的总成本,包括直接和相关的间接成本,将会大大增加。
对底盘的调查已经提供了有关基因网络和相互作用的详细信息。这些结果将加速定制工业底盘的建设,用于生产有用的药物和化学品,环境毒素的生物修复,以及可再生能源的创造。