2024年酶的定向进化技术发展趋势 人工智能带动技术发展【组图】

廖子璇

行业主要上市公司:金斯瑞(HK.1548)、凯赛生物(688065.SH)、华熙生物(688363.SH)、华恒生物(688639.SH)、川宁生物(301301.SZ)等

本文核心数据:酶的定向进化原理;高效构建突变体库的新方法;体外突变发;体内突变法;高通量定向进化的新方法

——酶的定向进化原理

酶的定向进化,旨在试管中模拟自然进化过程,通过提高基因突变率和设计特殊的筛选、选择方法,快速获得拥有特定性能的酶。因此,定向进化又被称为“代替自然选择的上帝之手”,为试管中的达尔文主义。酶的定向进化通常包括三个步骤:①通过对蛋白编码序列进行随机突变、定点突变或重组构建基因突变体库;②定向筛选、选择以获得具有改进表型的突变体;③以该突变体作为下一轮基因多样化的起点,进行定向进化的迭代,直到获得性能最优的突变体。

图表1:蛋白质定向进化原理

根据文库构建原理的不同,蛋白质定向进化可分为随机进化、半理性进化和理性进化三种策略,其大致思路均为由某一靶基因或一族相关的家族基因起始,通过对编码基因进行突变或重组,创建分子多样性文库;筛选文库获得能够编码改进性状的基因,作为下一轮进化的模板;在短时间内完成自然界中需要成千上万年的进化,从而获得具有改进功能或全新功能的蛋白质。

图表2:蛋白质定向进化的最新方法、优势及存在的问题

——高效构建突变体库的新方法

高效构建多样化的基因突变体库是定向进化的关键步骤之一。早期通过化学试剂(如甲磺酸乙酯、亚硝酸等)或射线对基因进行无差别随机突变的传统方法,由于突变率低并且极易造成基因组不稳定而逐渐被淘汰。取而代之的是一系列相对可控且有高突变率的体外突变法和体内突变法。

——体外突变法

体外突变法主要包括可以产生随机突变的易错PCR(error-prone PCR, epPCR)、DNA改组(DNA shuffling)、可以产生非随机突变的定点饱和突变(site-saturation mutagenesis, SSM)、序列饱和突变(sequence saturation mutagenesis, SeSaM)、合成文库(synthetic library generation)等,这些传统体外突变技术成为单个酶定向进化的有力工具,随着分子生物学的快速发展,构建体外突变体库的新方法也不断涌现。

图表3:体外突变法的类别

此外,随着基因高通量合成技术及DNA测序技术的高速发展,传统的体外突变法存在的共有缺陷,如密码子缺乏控制、具有序列偏好性等,在一定程度上被合成文库法所改善。Twist Bioscience公司与M. Reetz课题组合作,在2018年报道了这种新型的体外突变体库构建方法,即在硅基芯片上应用大规模平行寡核苷酸合成技术,然后进行有效的基因组装,每种突变体均采用计算机模拟设计,并在合成前进行筛选,因此消除了不需要的序列偏倚、提前出现的终止密码子和多余的基序。通过实验分析,这种通过大规模基因合成构建突变体库的方法相比于利用传统的易错PCR或饱和突变等方法,具有野生型序列更少、突变体分布比例更均匀、文库多样性更丰富等突出优势,有利于下游筛选,目前,该方法已实现商业化应用。

——体内突变法

基因突变体库的另一大类构建方法是体内突变法,即在胞内诱导特定基因的突变,无需进行基因克隆与转化,很大程度上缩短了定向进化的实验周期。例如早期开发的基于单链DNA重组的多元自动化基因组工程技术(multiplex automated genome engineering, MAGE),是针对大肠杆菌基因组上特定基因进行体内诱变的重要策略。近年来,CRISPR-Cas介导的重组技术实现了在原核与真核细胞中对目的基因进行高效的片段插入、删除和替换,大大提高了原核与真核细胞中重组的效率,因此也发展了一批高效的胞内蛋白质定向进化工具。例如将CRISPR-Cas系统和MAGE整合后,基因重组效率由3%提高到98%,插入/替换效率提高至70%;将CRISPR-Cas9与epPCR偶联(CasPER)可以向酵母基因组中任意基因的600 bp内引入随机突变。

图表4:基于CRISPR的体内突变方法

注:a—基于CRISPR-CAS9同源重组的突变;b—基于NCAS9和DNA聚合酶I的突变;c—基于NCAS9和碱基编辑器的突变

——高通量定向进化的新方法

创建序列覆盖率高、多样性强的突变体库,能最大程度挖掘不同氨基酸序列与其对应表型之间的关系,理论上能够提高获得理想突变体的概率。然而,绝大部分筛选和选择技术通量低、准确性差,导致难以实现对目标蛋白质序列全面且深入的挖掘。因此,开发更快速、灵敏、准确的高通量筛选技术,是提高定向进化效率的关键所在。

——新型高通量筛选技术

在酶分子的定向进化过程中,突变体库的高质量以及高通量筛选方法的可靠性,通常是决定其成败的关键性因素。根据是否需要筛选标记可以将目前普遍应用的高通量筛选方法分为两大类,其中需要标记的技术为平板筛选法、展示法和荧光筛选法,不需要标记的技术为质谱法、红外检测法和特殊光谱检测法,以下着重对这些方法的研究进展进行综述。

图表5:主要新型高通量筛选技术介绍

——连续定向进化

连续进化旨在无人为干预的情况下完成基因突变、蛋白表达、表型选择与筛选的迭代实验。连续定向进化通过缩短每轮的进化时间来增加迭代次数,从而提高获得目标性状突变体的概率。由D. Liu课题组开发的噬菌体辅助的连续进化系统(phage-assisted continuous evolution, PACE)是较经典的案例。PACE将目标蛋白编码序列引入筛选噬菌体DNA载体中(selection phage, SP),并通过敲除pⅢ蛋白编码区而阻断噬菌体侵染力,同时将含有pⅢ的辅助质粒(accessory plasmid, AP)和提高大肠杆菌基因突变率的突变质粒(mutator plasmid, MP)引入大肠杆菌内。通过设计特定的基因回路,将pⅢ的表达与目标蛋白的活性相偶联,再通过类似“潟湖”的液路控制系统使得含有目标活性突变体的噬菌体迭代富集,从而实现进化与筛选自动循环。由于从噬菌体侵染到再组装的周期较为短暂,因此PACE系统可以在24 h内完成30轮以上的蛋白质进化,达到其他定向进化手段难以企及的迭代次数。

图表6:噬菌体辅助连续进化过程

——计算机辅助的定向进化

近年来随着人工智能的高速发展,借助同源建模与机器学习对蛋白质结构进行预测的准确性日益增加,不同的算法及软件被开发以用于蛋白质结构的计算。包括Modeller、Rosetta、AlphaFold 2等在内的多种方法已被广泛用于蛋白质结构的预测。其中,最广为人知的计算方法为AlphaFold 2,这种算法是通过生物信息学和物理方法结合的方法进行预测。

图表7:AlphaFold 2计算原理示意图

更多本行业研究分析详见前瞻产业研究院《中国合成生物学行业市场前瞻与投资战略规划分析报告

同时前瞻产业研究院还提供产业大数据产业研究报告产业规划园区规划产业招商产业图谱智慧招商系统行业地位证明IPO咨询/募投可研IPO工作底稿咨询等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前 瞻产业研究院的正规授权。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。

可行性研究报告
廖子璇

本文作者信息

廖子璇(产业研究院、分析师)

关注(1404473)赞(14)

邀请演讲

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读

精彩推荐