生命科学   2021, Vol. 33 Issue (12): 1510-1519.  DOI: 10.13376/j.cbls/2021170.
0

应用

引用本文 [复制中英文]

池豪铭, 刘天罡. 合成生物学助力天然产物的高效合成及创新发现. 生命科学, 2021, 33(12): 1510-1519. DOI: 10.13376/j.cbls/2021170.
[复制中文]
CHI Hao-Ming, LIU Tian-Gang. Synthetic biology promotes efficient production and innovative discovery of natural products. Chinese Bulletin of Life Sciences, 2021, 33(12): 1510-1519. DOI: 10.13376/j.cbls/2021170.
[复制英文]

基金项目

国家重点研发计划(2018YFA0900400)

作者简介

刘天罡,武汉大学药学院教授,博士生导师。刘天罡教授长期从事代谢工程和合成生物学研究,致力于微生物天然产物的高效合成和高通量基因组挖掘与改造,带领科研团队针对复杂天然产物生产效率低、发现速度慢两个难题进行攻关,建立自动化微生物铸造平台,微生物代谢物检测平台,开发微生物靶向测序方法和基于体外重建和无细胞体系的分析方法,打造了多种天然化合物高效合成的底盘细胞,并助力提升多种天然产物工业合成效率和水平。作为项目负责人主持国家重点研发计划合成生物学专项项目,并以第一完成人获2018年湖北十大科技事件和2019年湖北省科技进步一等奖 。

通信作者

刘天罡:E-mail: liutg@whu.edu.cn

文章历史

收稿日期:2021-10-09
合成生物学助力天然产物的高效合成及创新发现
池豪铭 , 刘天罡
(武汉大学药学院,组合生物合成及新药发现教育部重点实验室,武汉 430071)
摘要:天然产物是候选药物以及药物先导化合物的重要来源,但传统的天然产物生产方式及新天然产物发现的速度和数量日益无法满足社会的巨大需求。随着合成生物学各方面技术的发展,合成生物学在天然产物高产和发现两个领域上的新策略、新方法、新应用应运而生,尤其在复杂天然产物的高效生物全合成、天然产物复杂前体结构的化学半合成、沉默天然产物的高通量挖掘等方面有着里程碑式的发展。该文讨论并总结了目前合成生物学在天然产物研究领域所面临的挑战和机遇,为如何解决复杂天然产物合成机制难以解析、基于微生物发酵的天然产物“出口”受限等问题提出了一些思考和建议。
关键词合成生物学    微生物底盘    天然产物    高效合成    结构发现    
Synthetic biology promotes efficient production and innovative discovery of natural products
CHI Hao-Ming , LIU Tian-Gang     
(Key Laboratory of Combinational Biosynthesis and Drug Discovery, Ministry of Education, School of Pharmaceutical Sciences, Wuhan University, Wuhan 430071, China)
Abstract: Natural products are significant sources of drug candidates and lead compounds, but the traditional approaches to natural product manufacture and the speed and quantity of new natural product discovery are failing to meet the enormous needs of society. With the advancement of technologies in all aspects of synthetic biology, new strategies, new methods, and new applications of synthetic biology in the two fields of natural product high yield and discovery have emerged, especially in the areas of efficient biological total synthesis of complex natural products, chemical semi-synthesis of complex precursor structures of natural products, and high-throughput mining of silent natural products. This review discusses and summarizes the challenges and opportunities of synthetic biology in the natural product research field, and provides some considerations and suggestions on how to solve the difficulties in resolving the mechanisms of complex natural product synthesis and the limitations of "export" of natural products based on microbial fermentation.
Key words: synthetic biology    microbial chassis    natural products    efficient synthesis    structure discovery    

天然产物是药物和药物先导化合物的一个重要来源。据统计,从1981年到2019年间获批上市的药物中,有四分之一就来源于天然产物及其衍生物[1]。天然产物在治疗众多疾病上有着重要的贡献,如抗疟药青蒿素,降血脂药物辛伐他汀,抗癌药紫杉醇,抗生素青霉素、红霉素,抗糖尿病药物阿卡波糖等一系列药物。尽管天然产物能够激发新药开发的灵感,但进入21世纪之后,各大制药公司对天然产物药物开发的关注度却逐渐下降[2],部分原因在于天然产物在生产和发现上存在不可忽视的问题。

合成生物学作为21世纪的新兴交叉学科,旨在以生物体系作为平台,进行针对性改造并赋予生命体新的功能。迄今为止,合成生物学在能源、材料、医药以及农业等领域取得了令人瞩目的成就。而针对目前天然产物在生产和发现上遇到的种种挑战,不断迭代成熟的合成生物学相关技术,为这些问题的解决给出了一个个高效且便捷的全新思路。

1 天然产物研究领域目前存在的问题 1.1 传统天然产物生产方法上的问题

目前,天然产物的市场需求日益旺盛,原有的从生物体内直接提取的生产模式的局限性也逐渐凸显,青蒿素的供应是一个典型案例。青蒿素(Artemisinin)及其衍生物是治疗疟疾的诺奖药物,其主要原料来源是人工种植的黄花蒿(Artemisia annua),但是该作物的产量极易受到季节及环境的影响,并且整个加工提取的过程长达12~18个月,最终获取的青蒿素质量还不到干燥后原材料的1%[3],使得青蒿素的生产及价格严重受到原材料获取上的掣肘。这种生产方式导致青蒿素的价格波动剧烈,从最高的每吨530万元到最低的95万元,极大地挫伤了农户的种植积极性,进而限制了青蒿素的推广使用。

另一个案例是软海绵素B (Halichondrin B),它是1986年从冈田软海绵(Halichondria okadai)中分离得到的聚醚大环内脂类化合物,具有极强的抗肿瘤活性[4]。遗憾的是,1吨海绵仅能提取约300 mg的软海绵素B[5],而现存的海绵数量甚至无法达到该量级,更何况去满足临床试验至少10 g的需求量,这严重制约了该药物的开发应用。同时,软海绵素B所具有的复杂化学结构和多个手性中心,导致其化学全合成生产难以进行,也阻碍了后续的进一步研发。因此,研究人员对软海绵素B进行一系列的结构修饰、衍生化后,最终通过62步合成得到其前体类似物Eribulin (卫材Eisai将其商品名定为Halaven®)[6],其于2010年11月被美国食品和药物管理局批准用于治疗转移性乳腺癌[7]

由此可以看出,从天然生物材料中提取天然产物的方法存在不可持续供应、生物活性产量低、成本高、环境破坏严重等问题,因此迫切需要建立创新的方法、策略和技术来生产这些高价值天然产物;而微生物发酵生产能够定向可控地获取高价值的天然产物,是理想而又稳固的生物绿色制造途径。

1.2 传统天然产物发现方法上的问题

新型天然产物能够突破化合物结构的多样性,其所具有的药效官能团有助于新药的开发,因此研究人员趋向于从自然界中发现新型天然产物。但是,随着天然产物发现的井喷期逐渐结束,传统的天然产物发现方法的局限性也逐渐凸显出来[8]:生物材料生产不稳定、产物发现冗余、测试周期长且产量低导致的放大不切实际、分离纯化过程困难、对生态环境的破坏等问题。与此同时,21世纪初,各大制药公司也纷纷停止了基于天然产物的药物发现计划[2]。基于这一系列原因,目前挖掘新型天然产物的难度大大提升,同时这些新型天然产物转化为新药的比例也逐年下降。

尽管从事天然产物分离的研究人员在新天然产物挖掘上付出了巨大的精力,但是由于新型天然产物的低丰度性,其可获取量往往仅支持结构鉴定并完成文章的发表,无法满足进一步的活性评估乃至后续的成药研究,从而无法充分挖掘这些天然产物的成药潜力。

2 合成生物学助力天然产物的高效合成 2.1 基于合成生物学的生物全合成

目前,基于合成生物学改造的微生物平台,能够搭建合理的重组生物合成途径并构建相应产物的微生物高产菌株,来实现从可再生原料中生产能源、化学品及药品等高价值天然产物,有效地解决了目前从天然材料中提取天然产物的方法不断受到挑战,难以实现环境友好型工业化生产的问题,为其工业化大规模生产提供了一种替代的可持续绿色制造方法。

四萜化合物番茄红素是一种类胡萝卜素,有着极强的抗氧化、防癌、抗癌作用[9]。目前番茄红素的工业化生产主要分为两种:从番茄中直接提取和化学合成。早在20世纪,就有研究人员在大肠杆菌体内完成了番茄红素的生物全合成[10],但其微生物生物全合成的方法却迟迟无法实现产业化。番茄红素的生物合成途径较为简单,仅包括上游模块前体IPP/DMAPP的供给以及下游模块番茄红素异源合成。目前已有多种策略助力了番茄红素在模式菌株酿酒酵母体内的高产,如过表达限速步骤[11]、下游模块涉及基因的定向进化[11]、下调竞争途径[12-13]、加强乙酰辅酶A前体供应[14]、平衡NADPH利用[14]、多元化IPP和DMAPP获取途径[15-16]等。但这些策略还无法解决番茄红素异源表达重组途径无法强耦合和产物耐受性差的两大困境(图 1),使得目前番茄红素生物全合成无法彻底取代目前的化学合成方式。

图 1 番茄红素异源合成面临的挑战及解决方案

第一,重组途径无法强耦合,即异源微生物宿主中各蛋白工作配合不够高效,导致整个异源重组途径效率低。改善该问题的一种有效的思路是,将IPP/DMAPP的供给途径和番茄红素异源合成途径强耦合,以解决底物传递和代谢流不稳定的问题,如刘天罡课题组和江夏课题组利用多肽相互作用标签RIAD和RIDD,使上游代谢途径的最后一个酶Idi和下游番茄红素模块的第一个酶CrtE在细胞体内进行自组装,得到Idi-CrtE多酶聚合体,解决了各个功能元件在体系中分散度过大,导致中间产物的流失、浓度的稀释以及毒性中间产物积累等问题,使得番茄红素的产量提升了58%,达到了2.3 g/L[17]

第二,产物耐受性,即高浓度番茄红素对异源宿主有毒性。脂溶性番茄红素的疏水性质使其无法在亲水性细胞质中大量积累,导致大量番茄红素易在酿酒酵母的细胞膜中聚集,使细胞膜破裂。基于这一点,提高异源宿主体内的脂质含量能有效增加番茄红素的储存空间,从而突破番茄红素产量的梏桎。武汉大学刘天罡课题组过表达了酿酒酵母体内与脂肪酸合成和三酰基甘油(triacylglycerol, TAG)产物相关的关键基因,并通过调节TAG脂肪酰基组成来调节脂滴大小,使其以高容量容纳番茄红素从而降低细胞毒性,最终,番茄红素产量高达2.37 g/L[18]

由番茄红素生物全合成的例子可以看出,合成生物学能够从多方面、多角度去解决天然产物在模式菌株中高效生产的多种挑战,相信类似的策略能够推广到更多的相似的案例之中。不过在实际研究中,像番茄红素这类有着完善路线、工艺及高得率的明星分子并不多见。更多的高价值复杂天然产物的生物全合成机制的探究往往极为困难、历时弥久,因此基于合成生物学的生物全合成还需要更多的研究人员参与以及经费的持续资助。

2.2 基于合成生物学的化学半合成

大部分植物源的复杂天然产物生物合成途径有关的细胞色素P450及其后修饰酶往往难以挖掘并阐明,这使得对其进行生物全合成变得遥遥无期。而使用化学合成的方法,由于天然产物复杂的结构,其从头全合成路线往往多达几十步,导致总收率极低。为解决这一问题,研究人员提出了化学半合成的方案:以易获取的天然产物类似物为起始物,经过少量的化学催化,来实现复杂天然产物的合成(图 2)。上文中所提到的抗疟疾药物青蒿素,由于其全球市场需求极高,仅依赖传统的植物提取方法远远无法满足市场需求,因此化学半合成或许是一个不错的选择,即通过酿酒酵母发酵生产青蒿酸(青蒿素的化学合成前体),然后通过化学合成转化为青蒿素。

注:图中实线箭头表示生物合成,虚线箭头表示化学合成。 图 2 合成生物学助力化学半合成

在盖茨基金会的赞助下,Jay Keasling教授和Amyris公司对这一问题进行了攻关。首先,在2006年,Ro等[19]通过加强前体物质FPP的供给、下调酵母本底对FPP的利用,得到了一个强前体供给的酵母底盘,并在该底盘中异源表达黄花蒿来源的青蒿酸生物合成基因,使得青蒿酸产量达到了115 mg/L。随后,在2012年,Westfall等[20]更换了产孢率更高和质粒稳定性更好的酵母菌株CEN.PK2,使青蒿酸产量得到了进一步提升,并发现了青蒿酸前体amorphadiene转化为青蒿酸是其中的限速步骤。最后,在2013年,Jay Keasling教授团队基于这一点,向上述高产突变株中再引入了3个植物源还原酶,并通过两相发酵的策略,使青蒿酸产量达到了25 g/L[21]。最后,通过化学合成,以40%~50%的产率得到高纯度青蒿素,使得利用酵母来化学半合成青蒿素取得突破性进展。同年,该法完成了工业化生产,青蒿素最终生产成本在2 000元/公斤以上,设计产能为60吨/年[22]。但是由于价格还是比植物提取的要高,并没有大规模使用,但是其间接的积极作用是将青蒿素的原料稳定在1 500元/公斤左右,促进了青蒿素的广泛使用。

第二个例子则是具有显著抗肾癌活性的愈创木烷类倍半萜类化合物Englerin A[23],其同样也因为复杂且收率低的化学全合成及未阐明的生物合成途径而无法工业化生产。guaia-6, 10(14)-diene与Englerin A有着相同的核心骨架,这意味着若是能够高效地获取guaia-6, 10(14)-diene,就能使Englerin A的半合成成为可能。刘天罡课题组联合Mathias Christmann课题组对真菌来源的倍半萜合酶进行了系统筛选,从禾谷镰刀菌Fusarium graminearum J1-012中找到了能够高效合成guaia-6, 10(14)-diene的倍半萜合酶,随后通过代谢工程的手段在酿酒酵母体内实现了guaia-6, 10(14)-diene的0.8 g/L的高效合成,最后经七步化学合成,以38%的总产率获得了Englerin A[24]

基于合成生物学的化学半合成,除了能够实现复杂天然产物从“0”到“1”的突破外,更能够颠覆行业格局,开辟出与众不同的工业生产方式。维生素E是全球市场容量最大的维生素类产品之一,其化学结构中含有萜类结构单元,一直以来,工业上依靠化学法对其进行合成。武汉大学刘天罡课题组创造性地以微生物发酵合成的法尼烯为前体化学合成了维生素E的关键中间体异植物醇,进而一步合成维生素E[25],颠覆了国外垄断几十年的化学全合成技术。这也使得技术应用方能特科技跻身全球维生素E产业前列,其相关成果被评为2018年湖北十大科技事件之一[26]

3 合成生物学助力天然产物的创新发现 3.1 激活沉默基因簇

随着基因组测序技术和生物信息学工具(如antiSMASH 6.0[27]、BiG-SCAPE[28]、MIBiG 2.0[29]等)的快速发展,大量未被发现的天然产物生物合成基因簇(biosynthetic gene cluster, BGC)被研究人员所预测出来。以链霉菌属为例,仅凭保守估计,其能产生的天然产物数量就达到了150 000种,但其中仅5%被鉴定出来[30]。但是这些天然产物的BGCs往往受到自身严格的转录和翻译调控,在体内大多数都处于沉默状态。这些沉默的基因簇提示我们,生物体内中仍然蕴藏着很多尚未被发现的天然产物。目前,激活沉默基因簇的策略主要分为两大类,靶向沉默BGCs和非靶向沉默BGCs (图 3)。

图 3 通过激活沉默基因簇来发现新型天然产物

靶向沉默BGCs的一种有效策略是在目标BGC上游敲入强启动子,以启动相应生物合成途径,从而合成天然产物。伊利诺伊大学赵惠民课题组利用CRISPR/Cas9技术激活了5种链霉菌属中的多个BGCs,并从中分离得到了新型聚酮化合物[31]。另一种有效策略则是针对沉默BGCs的调控因子进行敲除或“诱骗”。例如,敲除植物内生真菌Pestalotiopsis fici中表观遗传因子cclA、hdaA[32]、COP9信号复合体亚基CsnE[33],以及敲除真菌Calcarisporium arbuscula中编码组蛋白去乙酰化酶的基因hdaA[34],均能够导致新化合物的产生。而转录因子“诱骗”技术(transcription factor decoy, TFD)则是人为设计一段DNA序列,使其能模仿被调控的DNA与调控子结合,来阻止后者与同源DNA的靶点结合,最终使得目的沉默BGCs不会被调控子所抑制从而激活。赵惠民课题组就利用该策略成功激活了不同链霉菌中的8个沉默的BGCs,并鉴定出了1个新的化合物[35]

非靶向沉默BGCs策略,指无需明晰基因组信息,来实现沉默BGCs的激活。Gerard D. Wright课题组通过敲除野生型放线菌中常见抗生素的BGC,来引起调控网络的改变和代谢前体的释放,从而提高野生菌中低表达(并非不表达)代谢物的产量,最终鉴定出了新型抗生素[36]。而M. R. Seyedsa-yamdost教授团队搭建了一种无需遗传操作系统的高通量诱导子筛选与成像质谱偶联的方法(High-Throughput Elicitor screening - Imaging Mass Spectrometry, HiTE-IMS),能够以多种小分子化合物为诱导子,来诱导多种已测序和未测序的细菌激活沉默BGCs,最后利用成像质谱来高通量检测产生的代谢物[37]

3.2 在模式生物中进行基因簇异源表达

由于绝大多数微生物存在实验室不可培养,无法建立遗传操作方法等限制,研究人员难以合理地设计并改造天然宿主中的生物合成途径以提升产率。因此,将这些沉默BGCs从天然宿主中转移到具有完善遗传操作体系的模式生物中,能够极大地提升其产量并发现新型天然产物。

一类策略是靶向目的BGC进行克隆,这就需要从复杂的原始基因组中克隆完整BGC的高效策略。研究人员利用限制酶或CRISPR技术酶切分离出目的BGC,通过异源宿主自身重组修复,使其连接到目的载体上。山东大学张友明团队就利用基于外切核酸酶的RecET重组(ExoCET)技术克隆并构建出长达79 kb的多杀菌素异源表达人工基因簇,使异源宿主Streptomyces albus J1074中多杀菌素的产量提高了328倍[38]。除此之外,利用位点特异性重组来克隆完整BGC也是一种有效的策略。武汉大学刘天罡课题组通过链霉菌噬菌体φC31整合酶介导的BAC文库构建技术,抓取了多杀菌素完整BGC,并通过代谢组学及蛋白质组学分析找到限速步骤,实现了多杀菌素的产量较原始菌株S. albus J1074约1 000倍的提升[39]

另一类策略是在底盘菌株中高通量靶向批量表达沉默BGCs。唐奕课题组开发了一个异源表达(Heterologous EXpression, HEx)的合成生物学平台,以酵母菌株作为底盘,在不进行密码子优化的前提下,将从不同真菌物种中挑选的41个基因簇(包括膜结合萜类环化酶和聚酮合酶)与启动子、终止子融合后,进行异源表达,最终有22个BGCs检测到了相应产物,并鉴定了其中7个产物的结构[40]。除此之外,也有研究人员在丝状真菌体内实现了基因簇的高通量异源表达。Clevenger等[41]利用真菌人工染色体技术(fungal artificial chromosomes, FACs)将56个从曲霉基因组中随机剪切后长约100 kb的片段,在构巢曲霉中进行异源表达,通过代谢组学的方法对宿主的代谢背景进行了清洗,最终发现了15个新型次级代谢产物。

尽管研究人员已经基于多种模式菌株开发出了各种高通量天然产物发现策略,但由于底盘菌株自身的限制,这些策略往往存在一些问题,如无法提供充足的底物用于相关基因的功能鉴定、难以获取足够的产物用于成药分析等。因此,利用合成生物学策略,开发出更通用、更可控的定制化的高效前体供给底盘,能够为BGCs的挖掘提供一个快速且高效的方案。

3.3 使用高效前体供应底盘进行高通量挖掘(图 4)
图 4 利用高效前体供给底盘高通量挖掘新型天然产物

原核生物大肠杆菌(Escherichia coli)具有遗传代谢特性透明、生长速率快、遗传工具众多等特点[42],为将其改造为高效的前体供应底盘提供了良好的基础。武汉大学刘天罡课题组使用基于“定向合成代谢”搭建起的高效合成萜类化合物的大肠杆菌平台,对丝状真菌Fusarium graminearum J1-012中的具有显著底物和反应杂泛性的两个萜类合酶的合成潜力进行了深度挖掘,最终得到多达50种不同的萜类化合物[43],证明了利用高效前体供给底盘来高通量挖掘天然产物的可行性。

但大肠杆菌底盘在挖掘天然产物上存在较大的限制,如无法进行转录后剪接外显子、缺乏翻译后修饰和精确的膜结合过程、存在显著的密码子偏好性、底物的供给效率低、天然产物的耐受性差等问题。因此,相对于细菌的种种限制,研究人员更倾向于使用酿酒酵母(Saccharomyces cerevisiae)等真核生物来打造高效底盘。

武汉大学刘天罡课题组利用二倍半萜前体高效供给的酿酒酵母底盘针对性地对目前数据库中潜在的真菌来源的双功能嵌合萜类合酶(PTTS)进行了系统化的高通量挖掘[44],其中酵母底盘对PPTS底物GFPP的高效供给大大提高了PTTS的功能鉴定效率。基于该方法,研究人员鉴定出了34个PTTS的功能,其数目是目前所有已知的PTTS的两倍,并从中发现了2个结构新颖的二倍半萜化合物。

不过丝状真菌来源的BGCs中通常含有非常小且不可预测的外显子,这使得研究人员难以制备得到能够有效表达产物的cDNA[45]。同时,异源表达BGC时,往往会出现人工选择的外源引入的CPR无法兼容BGC上的P450的现象。这也导致在酿酒酵母中进行真菌来源的天然产物BGCs的异源表达,往往会出现产量低下以至于无法鉴定产物结构的结果。

可以看出,不同来源的基因同底盘菌株往往会存在各种适配性上的问题,为了解决这一问题,我们提出三大原则——近源性、同类性、完备性。近源性原则,指针对BGCs的来源去选择相近来源的底盘,如丝状真菌来源的BGCs在米曲霉(Aspergillus oryzae)中进行异源表达、放线菌来源的BGCs在链霉菌(Streptomyces)中进行异源表达。同类性原则,指针对天然产物的类型去选择提供相同类型前体的底盘,如高效萜类前体供给的大肠或酵母底盘、高产Ⅰ型或Ⅱ型聚酮化合物前体的工业链霉菌底盘等,这样大大提高了基因与宿主的适配性。完备性原则,指作为底盘的模式菌株应当有完善的基因编辑手段及相应的表征数据(如启动子表征、明确限速步骤等),以及能够提供充足的前体、能量、还原力,和相应的抗性基因。相信以这三大原则为基石构建出的高效底盘,能够极大地加速各类不同来源BGCs异源表达的进程。

4 合成生物学在天然产物研究领域所面临的困境 4.1 植物天然产物合成基因元件挖掘困难

目前,绝大多数有着重要活性的植物源天然产物,其生物合成途径中的基因往往散落分布在植物基因组中,并非连锁且成簇存在(图 5A),这使得研究人员只能推测其生物合成途径,并逐个去探索每一个基因。而植物具有生长周期缓慢和遗传背景复杂等不足,导致研究人员无法在植物体内快速地进行基因敲除来鉴定酶功能。这进一步加大了阐明植物天然产物生物合成途径的工作量和难度。

图 5 A. 植物源天然产物的合成基因在基因组上存在不成簇的现象;B. 通过构建更够提供多种核心骨架的酿酒酵母底盘,并对其发酵产物进行化学衍生化,将有利于获取大量的天然或非天然的化合物文库

紫杉醇作为有着显著抗肿瘤活性的明星药物,最早于短叶红豆杉(Taxus brevifolia)树皮中分离得到[46],但13.6 kg的树皮仅能提取到1 g紫杉醇,红豆杉也因此在经无节制的砍伐后被列为国家一级保护植物。紫杉醇具体的生物合成机制至今仍未探清,而其复杂且昂贵的化学全合成[47-49]受限,在商业上无法推广。目前商业化的紫杉醇生产途径主要是化学半合成[50],即以从部分红豆杉属的可再生枝条中提取的10-去乙酰巴卡亭Ⅲ为底物,通过少数几步化学合成来获得紫杉醇。但这种从植物中提取中间体的方法终究会受到植物体自身生长的影响,不适合大规模生产。

基于这样的案例,紫杉醇这类未能阐明生物合成机制的复杂天然产物,如果能够像上文提到的青蒿素、Englerin A、维生素E一样,将生物合成与化学合成结合起来,利用一个精心设计的高效前体供应底盘,以微生物发酵的方式得到一个乃至多个核心骨架,最终通过化学合成得到终产物,必然能多元化、高效化其生产途径。即便无法完成化学半合成,通过对其衍生化来得到数以万计的结构类似物,最后进行活性分析也是一种探究新型化合物的有效策略(图 5B)。这样一种绿色制造、扩大产能、提高新化合物的发现效率的思路必将有着远大的科研前景。

4.2 工程化微生物的发酵产物市场准入受限

我国目前用于生产维生素B2、抗生素,以及氨基酸等的工业菌株均是国外引进的基因工程菌株。而近年来我国科研人员利用合成生物学手段改造的用于生产一些食品原料的菌株,却一直无法实现大规模工业化生产,其主要原因是监管和审批的主体和流程还没有建立。

我们试想,若是在食用安全级的微生物菌株中,引入食用安全级生物的异源基因在其染色体上,该工程化改造的微生物产生的发酵产物经提纯后理论上应该也是食用安全性的。这种微生物发酵的方式,本质上就是通过工业生产的方式,利用一个定制的微型细胞工厂来得到高纯度的产品,最后剔除细胞工厂,使产品中不含有抗性基因和引起过敏或者毒性的细胞因子。针对这样一个微生物发酵的产品,我国社会迫切需要一套量身定制的法律法规,来保证产品的质量,规范生产的工艺。

基于微生物发酵的产品特别是脂溶性产品确实存在一些难以解决的纯度问题,如发酵产品中易携带微生物本底的核酸、蛋白质、细胞膜等杂质。针对这一点,从欧美国家所制定的相关法规来看[51],只要杂质不超过相应的阈值并加以说明,而且这些杂质的来源是从食品级微生物来源的,应当可对其放心使用。因此,我们也呼吁和倡导国家尽快出台相关规范和标准,弥补当前领域的空缺,使国内的先进技术迅速转化为生产力从而实现良性循环。

4.3 新型天然产物实体库的建立

尽管目前我国天然产物领域一直有很好的数据产出,每年新发现的天然产物占全世界的1/3。但这些新型天然产物存在一个“出口”的问题,导致无法充分挖掘出这些天然产物的潜在活性。主要原因有两点。一是这些化合物产量极低,往往仅够鉴定结构,无法进一步进行活性检测;二是化合物的产物不集中,往往散落在各个研究团队中。而单个研究团队的资源与精力的缺乏,导致这些新型天然产物如同蒙尘的珠宝,无人问津。

因此,在充分保障各个研究团队知识产权的前提下,搜集整合各个研究团队处存在的零散的新产物的资源,搭建起一个统一的新型天然产物结构文库,从而对这些化合物进行系统且全面的生物活性或靶点的评估。这将极大地提高化合物活性检测效率,缩减活性检测成本,并且可以解决我国天然产物的“出口”问题,激发研究人员的科研热情。

5 总结与展望

目前,研究人员已经开发出了多种合成生物学策略,用于天然产物的生产和发现,特别是基于高效前体供给的微生物底盘的策略,更是极大地推进了整个天然产物领域的发掘和高产效率。随着测序技术的飞速发展,互联网上存在的数据库日益庞大,目前影响新型天然产物挖掘进程的因素,远不是可供研究的BGCs数量过少,而是BGCs数量过大而无法短时间内高效地进行挖掘。但是,当前研究往往还拘泥于基于经验的人工筛选方法,使得对已知数据的覆盖面、挖掘深度常常无法达到预期的效果。尽管目前已经有研究人员开发出了根据基因簇预测其产物的抗生素活性的机器学习算法[52],但遗憾的是,如今的机器学习都是一个黑箱状态,并且,如果要更改一个初始条件往往需要从头运算。

如果能基于目前互联网中繁杂的数据,开发出一套从未知的基因簇出发,逐步地建模蛋白质结构、推定蛋白质功能、预测产物结构,最后通过结构上的药效官能团来预测新产物可能的生物活性的生物信息学算法或工具(图 6),并结合高通量自动化平台,这将使得研究人员可以优先去大批量挖掘那些最有可能产生新颖活性的天然产物,以减少天然产物发现路途中的重复性工作。在此基础上,再辅之以高效前体供给的微生物底盘,定能极大地加速新型天然产物发现和生产的进程。

图 6 基于基因簇的蛋白质功能、产物结构、产物活性的预测方法畅想
[参考文献]

[1]
Newman DJ, Cragg GM. Natural products as sources of new drugs over the nearly four decades from 01/1981 to 09/2019. J Nat Prod, 2020, 83: 770-803. DOI:10.1021/acs.jnatprod.9b01285
[2]
David B, Wolfender J, Dias DA. The pharmaceutical industry and natural products: historical status and new trends. Phytochem Rev, 2015, 14: 299-315. DOI:10.1007/s11101-014-9367-z
[3]
Vil VA, Yaremenko IA, Ilovaisky AI, et al. Synthetic strategies for peroxide ring construction in Artemisinin. Molecules, 2017, 22: 117. DOI:10.3390/molecules22010117
[4]
Hirata Y, Uemura D. Halichondrins - antitumor polyether macrolides from a marine sponge. Pure App Chem, 1986, 58: 701-10. DOI:10.1351/pac198658050701
[5]
Beesoo R, Neergheen-Bhujun V, Bhagooli R, et al. Apoptosis inducing lead compounds isolated from marine organisms of potential relevance in cancer treatment. Mutat Res, 2014, 768: 84-97. DOI:10.1016/j.mrfmmm.2014.03.005
[6]
Towle MJ, Salvato KA, Budrow J, et al. In vitro and in vivo anticancer activities of synthetic macrocyclic ketone analogues of halichondrin B. Cancer Res, 2001, 61: 1013-21.
[7]
Huyck TK, Gradishar W, Manuguid F, et al. Eribulin mesylate. Nat Rev Drug Discov, 2011, 10: 173-4. DOI:10.1038/nrd3389
[8]
Bernardini S, Tiezzi A, Laghezza Masci V, et al. Natural products for human health: an historical overview of the drug discovery approaches. Nat Prod Res, 2018, 32: 1926-50. DOI:10.1080/14786419.2017.1356838
[9]
Marzocco S, Singla RK, Capasso A. Multifaceted effects of lycopene: a boulevard to the multitarget-based treatment for cancer. Molecules, 2021, 26: 5333. DOI:10.3390/molecules26175333
[10]
Misawa N, Nakagawa M, Kobayashi K, et al. Elucidation of the Erwinia uredovora carotenoid biosynthetic pathway by functional analysis of gene products expressed in Escherichia coli. J Bacteriol, 1990, 172: 6704-12. DOI:10.1128/jb.172.12.6704-6712.1990
[11]
Xie W, Lv X, Ye L, et al. Construction of lycopene-overproducing Saccharomyces cerevisiae by combining directed evolution and metabolic engineering. Metab Eng, 2015, 30: 69-78. DOI:10.1016/j.ymben.2015.04.009
[12]
Xie W, Ye L, Lv X, et al. Sequential control of biosynthetic pathways for balanced utilization of metabolic intermediates in Saccharomyces cerevisiae. Metab Eng, 2015, 28: 8-18. DOI:10.1016/j.ymben.2014.11.007
[13]
Hong J, Park S, Kim S, et al. Efficient production of lycopene in Saccharomyces cerevisiae by enzyme engineering and increasing membrane flexibility and NAPDH production. App1 Microbiol Biotechnol, 2019, 103: 211-23. DOI:10.1007/s00253-018-9449-8
[14]
Shi B, Ma T, Ye Z, et al. Systematic metabolic engineering of Saccharomyces cerevisiae for lycopene overproduction. J Agr Food Chem, 2019, 67: 11148-57. DOI:10.1021/acs.jafc.9b04519
[15]
Luo Z, Liu N, Lazar Z, et al. Enhancing isoprenoid synthesis in Yarrowia lipolytica by expressing the isopentenol utilization pathway and modulating intracellular hydrophobicity. Metab Eng, 2020, 61: 344-51. DOI:10.1016/j.ymben.2020.07.010
[16]
Liu D, Liu H, Qi H, et al. Constructing yeast chimeric pathways to boost lipophilic terpene synthesis. ACS Synth Biol, 2019, 8: 724-33. DOI:10.1021/acssynbio.8b00360
[17]
Kang W, Ma T, Liu M, et al. Modular enzyme assembly for enhanced cascade biocatalysis and metabolic flux. Nat Commun, 2019, 10: 4248. DOI:10.1038/s41467-019-12247-w
[18]
Ma T, Shi B, Ye Z, et al. Lipid engineering combined with systematic metabolic engineering of Saccharomyces cerevisiae for high-yield production of lycopene. Metab Eng, 2019, 52: 134-42. DOI:10.1016/j.ymben.2018.11.009
[19]
Ro D, Paradise EM, Ouellet M, et al. Production of the antimalarial drug precursor artemisinic acid in engineered yeast. Nature, 2006, 440: 940-3. DOI:10.1038/nature04640
[20]
Westfall PJ, Pitera DJ, Lenihan JR, et al. Production of amorphadiene in yeast, and its conversion to dihydroartemisinic acid, precursor to the antimalarial agent artemisinin. Proc Natl Acad Sci USA, 2012, 109: 655-6.
[21]
Paddon CJ, Westfall PJ, Pitera DJ, et al. High-level semi-synthetic production of the potent antimalarial artemisinin. Nature, 2013, 496: 528-32. DOI:10.1038/nature12051
[22]
Peplow M. Synthetic biology's first malaria drug meets market resistance. Nature, 2016, 530: 389-90. DOI:10.1038/530390a
[23]
Ratnayake R, Covell D, Ransom TT, et al. Englerin A, a selective inhibitor of renal cancer cell growth, from Phyllanthus engleri. Organ Lett, 2009, 11: 57-60. DOI:10.1021/ol802339w
[24]
Siemon T, Wang Z, Bian G, et al. Semisynthesis of plant-derived englerin A enabled by microbe engineering of guaia-6, 10(14)-diene as building block. J Am Chem Soc, 2020, 142: 2760-5. DOI:10.1021/jacs.9b12940
[25]
马田, 邓子新, 刘天罡. 维生素E的"前世"和"今生". 合成生物学, 2020, 1: 174-86. DOI:10.12211/2096-8280.2020-022
[26]
湖北省科学技术厅. 2018年湖北十大科技事件评选结果揭晓[EB/OL]. (2019-01-29)[2021-9-19]. http://kjt.hubei.gov.cn/kjdt/kjtgz/201911/t20191102_313705.shtml
[27]
Blin K, Shaw S, Kloosterman AM, et al. antiSMASH 6.0: improving cluster detection and comparison capabilities. Nucleic Acids Res, 2021, 49: W29-W35. DOI:10.1093/nar/gkab335
[28]
Navarro-Muñoz JC, Selem-Mojica N, Mullowney MW, et al. A computational framework to explore large-scale biosynthetic diversity. Nat Chem Biol, 2020, 16: 60-8. DOI:10.1038/s41589-019-0400-9
[29]
Kautsar SA, Blin K, Shaw S, et al. MIBiG 2.0: a repository for biosynthetic gene clusters of known function. Nucleic Acids Res, 2020, 48: D454-D458.
[30]
Watve MG, Tickoo R, Jog MM, et al. How many antibiotics are produced by the genus Streptomyces? Arch Microbiol, 2001, 176: 386-90
[31]
Zhang MM, Wong FT, Wang Y, et al. CRISPR-Cas9 strategy for activation of silent Streptomyces biosynthetic gene clusters. Nat Chem Biol, 2017, 13: 607-9. DOI:10.1038/nchembio.2341
[32]
Wu G, Zhou H, Zhang P, et al. Polyketide production of pestaloficiols and macrodiolide ficiolides revealed by manipulations of epigenetic regulators in an endophytic fungus. Organic Lett, 2016, 18: 1832-5. DOI:10.1021/acs.orglett.6b00562
[33]
Zheng Y, Ma K, Lyu H, et al. Genetic manipulation of the COP9 signalosome subunit PfCsnE leads to the discovery of pestaloficins in Pestalotiopsis fici. Organ Lett, 2017, 19: 4700-3. DOI:10.1021/acs.orglett.7b02346
[34]
Bai J, Mu R, Dou M, et al. Epigenetic modification in histone deacetylase deletion strain of Calcarisporium arbuscula leads to diverse diterpenoids. Acta Pharm Sinica B, 2018, 8: 687-97. DOI:10.1016/j.apsb.2017.12.012
[35]
Wang B, Guo F, Dong S, et al. Activation of silent biosynthetic gene clusters using transcription factor decoys. Nat Chem Biol, 2019, 15: 111-4. DOI:10.1038/s41589-018-0187-0
[36]
Culp EJ, Yim G, Waglechner N, et al. Hidden antibiotics in actinomycetes can be identified by inactivation of gene clusters for common antibiotics. Nat Biotechnol, 2019, 37: 1149-54. DOI:10.1038/s41587-019-0241-9
[37]
Xu F, Wu Y, Zhang C, et al. A genetics-free method for high-throughput discovery of cryptic microbial metabolites. Nat Chem Biol, 2019, 15: 161-8. DOI:10.1038/s41589-018-0193-2
[38]
Song C, Luan J, Cui Q, et al. Enhanced heterologous spinosad production from a 79-kb synthetic multioperon assembly. ACS Synth Biol, 2019, 8: 137-47. DOI:10.1021/acssynbio.8b00402
[39]
Tan G, Deng K, Liu X, et al. Heterologous biosynthesis of spinosad: an omics-guided large polyketide synthase gene cluster reconstitution in Streptomyces. ACS Synth Biol, 2017, 6: 995-1005. DOI:10.1021/acssynbio.6b00330
[40]
Harvey CJB, Tang M, Schlecht U, et al. HEx: a heterologous expression platform for the discovery of fungal natural products. Sci Adv, 2018, 4: eaar5459. DOI:10.1126/sciadv.aar5459
[41]
Clevenger KD, Bok JW, Ye R, et al. A scalable platform to identify fungal secondary metabolites and their gene clusters. Nat Chem Biol, 2017, 13: 895-901. DOI:10.1038/nchembio.2408
[42]
Wang C, Pfleger BF, Kim S. Reassessing Escherichia coli as a cell factory for biofuel production. Currt Opin Biotechnol, 2017, 45: 92-103. DOI:10.1016/j.copbio.2017.02.010
[43]
Bian G, Han Y, Hou A, et al. Releasing the potential power of terpene synthases by a robust precursor supply platform. Metab Eng, 2017, 42: 1-8. DOI:10.1016/j.ymben.2017.04.006
[44]
Chen R, Jia Q, Mu X, et al. Systematic mining of fungal chimeric terpene synthases using an efficient precursor-providing yeast chassis. Proc Natl Acad Sci USA, 2021, 118: e2023247118. DOI:10.1073/pnas.2023247118
[45]
Nagamine S, Liu C, Nishishita J, et al. Ascomycete Aspergillus oryzae is an efficient expression host for production of basidiomycete terpenes by using genomic DNA sequences. Appl Environ Microbiol, 2019, 85: e00409-19.
[46]
Wani MC, Taylor HL, Wall ME, et al. Plant antitumor agents. VI. The isolation and structure of taxol, a novel antileukemic and antitumor agent from Taxus brevifolia. J Am Chem Soc, 1971, 93: 2325-7. DOI:10.1021/ja00738a045
[47]
Nicolaou KC, Yang Z, Liu JJ, et al. Total synthesis of taxol. Nature, 1994, 367: 630-4. DOI:10.1038/367630a0
[48]
Holton RA, Somoza C, Kim HB, et al. First total synthesis of taxol. 1. Functionalization of the B ring. J Am Chem Soc, 1994, 116: 1597-8. DOI:10.1021/ja00083a066
[49]
Danishefsky SJ, Masters JJ, Young WB, et al. Total synthesis of baccatin iii and taxol. J Am Chem Soc, 1996, 118: 2843-59. DOI:10.1021/ja952692a
[50]
Denis JN, Greene AE, Guenard D, et al. Highly efficient, practical approach to natural taxol. J Am Chem Soc, 1988, 110: 5917-9. DOI:10.1021/ja00225a063
[51]
魏笑莲, 钱智玲, 陈巧巧, 等. 遗传改造微生物制造食品和饲料的监管要求及欧盟授权案例分析. 合成生物学, 2021, 2: 121-33. DOI:10.12211/2096-8280.2020-079
[52]
Walker AS, Clardy J. A machine learning bioinformatics method to predict biological activity from biosynthetic gene clusters. J Chem Inf Model, 2021, 61: 2560-71. DOI:10.1021/acs.jcim.0c01304