一种单体聚合酶定向进化识别不同启动子的模拟预测方法

文档序号:1939957 发布日期:2021-12-07 浏览:21次 >En<

阅读说明:本技术 一种单体聚合酶定向进化识别不同启动子的模拟预测方法 (Simulation prediction method for identifying different promoters through directed evolution of monomeric polymerase ) 是由 鄂超 戴维江 谢潇 郭霞 杨天森 郑善喜 于 2021-09-13 设计创作,主要内容包括:本发明提供了一种单体聚合酶定向进化识别不同启动子的模拟预测方法,涉及生命科学技术领域。本发明所述方法通过使用Hdcok对得到并通过结构比对与MD模拟筛选出最佳复合体模型、参照定向进化实验对复合体模型进行特定突变、每个结构执行1μs时长的全原子分子动力学模拟和对每段轨迹进行能量计算机氢键盐桥分析,得出进化路径的能量学和结构动力学细节。利用本发明所述方法,成功把一个噬菌体RNAP从识别其原始启动子切换到另一个启动子上。(The invention provides a simulation prediction method for identifying different promoters by directed evolution of monomeric polymerase, and relates to the technical field of life science. The method comprises the steps of obtaining an optimal complex model by using an Hdcok pair, screening the optimal complex model by structure comparison and MD simulation, carrying out specific mutation on the complex model by referring to an directed evolution experiment, carrying out full-atom molecular dynamics simulation on each structure for 1 mu s, and carrying out energy computer hydrogen bond salt bridge analysis on each section of track to obtain the energetics and structure dynamics details of an evolution path. Using the methods described herein, a bacteriophage RNAP is successfully switched from recognizing its original promoter to another promoter.)

一种单体聚合酶定向进化识别不同启动子的模拟预测方法

技术领域

本发明属于生命科学技术领域,具体涉及一种单体聚合酶定向进化识别不同启动子的模拟预测方法。

背景技术

近年来,实验室定向进化技术在生物分子系统的功能设计或再设计方面取得了重大进展,特别是在蛋白质酶的活性和特异性方面进展喜人。在实验室定向进化中,序列突变和重组被密集地推动,然后通过高通量筛选或选择来锁定特定的蛋白质功能。例如,在噬菌体辅助的连续进化(PACE)中,具有修改过的生命周期的噬菌体基因,被用来在细菌宿主细胞之间转移进化,以促进快速复制的噬菌体种群,其中包含对某些有利的酶活性的基因突变。随着定向进化技术的进步,不仅可以设计出具有某些功能的单个蛋白酶,而且还可以对路径或蛋白相互作用网络进行调控或重新布线。同时,基于蛋白质的分子结构和生化特性的蛋白质功能的合理设计一直是人们追求的目标,这通常需要对蛋白质序列或构象演化的高维空间中的最优解进行物理理解和计算探索。由于生物大分子或酶是由高度复杂的结构-功能关系演变而来的内在复杂系统,直接的物理或理性方法通常具有高度的挑战性,无法得出这种复杂系统的最优解。

发明内容

有鉴于此,本发明的目的在于提供一种单体聚合酶定向进化识别不同启动子的模拟预测方法,发现了潜在的物理机制,有望帮助知识/数据学习或合理地重新设计蛋白酶的结构-功能,以实现重新连接的启动子识别功能。

为了实现上述发明目的,本发明提供以下技术方案:

本发明提供了一种基于实验室定向进化的病毒RNA聚合酶识别不同启动子的方法,包括以下步骤:(1)模拟野生病毒RNA聚合酶的游离结构,将所述游离结构与含原始识别启动子的dsDNA对接,构建得到封闭启动复合物;

(2)对所述封闭启动复合物进行全原子分子动力学模拟,筛选最佳复合物模型;

(3)参照定向进化实验,对所述最佳复合物模型进行特定突变,得若干不同的RNA聚合酶/启动子复合物;

(4)对所述RNA聚合酶/启动子复合物进行全原子分子动力学模拟,对得到的模拟轨迹进行数据分析,得进化路径的能量学和结构动力学数据,从而得到识别目标启动子的病毒RNA聚合酶。

优选的,所述病毒包括噬菌体。

优选的,步骤(1)所述原始识别启动子包括T7启动子,所述dsDNA的核苷酸序列如SEQ ID NO.1所示。

优选的,步骤(1)所述对接后还包括筛选构建得到所述封闭启动复合物;

所述筛选包括使用基于FFT的全局对接程序对HDOCK服务器中的推定结合模式进行全局采样,使用改进的基于形状的成对评分功能,选择得分最好的前10个结构模型,然后将所述前10个结构模型与原始识别启动子RNA聚合酶开放启动复合物进行比对,筛选出与原始识别启动子RNA聚合酶具有相似DNA启动子定位的若干结构。

优选的,所述全原子分子动力学模拟的每次模拟时长为1微妙。

优选的,步骤(3)所述特定突变包括利用AmberTools中的Tleap方法改变蛋白质中的氨基酸,将原始识别启动子中的DNA碱基对突变为目标识别启动子中的碱基对,并保持核酸骨架不变。

优选的,在所述特定突变后还包括对得到的突变产物进行能量最小化处理,得到若干不同的RNA聚合酶/启动子复合物。

优选的,步骤(4)所述数据分析包括能量计算和氢键盐桥分析。

优选的,所述能量计算为:利用Gromacs中的g_energy模块,根据含水模型的模拟轨迹重新计算静电和范德瓦尔斯力相互作用,得能量数据。

优选的,步骤(4)所述目标启动子包括T3启动子。

有益效果:本发明提供了一种基于实验室定向进化的病毒RNA聚合酶识别不同启动子的方法,首先为野生型病毒RNA聚合酶(RNAP)构建一个封闭的启动复合物,为从病毒辅助连续进化实验中发现的六个突变型RNAP构建了一个封闭的启动复合物。对这些RNAPs与原始/目标启动子的复合体进行了全原子分子动力学(MD)模拟,每次模拟时间1微秒。本发明实施例中模拟结果显示,蛋白质-DNA的静电相互作用或RNAP-DNA启动子界面的稳定性很好地决定了RNAP和变体的启动子识别偏好。同时确认关键残基和结构元素对启动子识别的转换有很大贡献:在特异性环上的第一个点突变N748D使RNAP与启动子轻微脱离,阻碍了原来的识别;另一个辅助螺旋(206-225)在进一步的突变(E222K和E207K)后接管了启动子识别的转换,通过与启动子DNA形成额外的电荷相互作用,在T7和T3启动子上以不同方式重新定向。富含AT的环和特异性环的进一步突变可以将RNAP-启动子的识别完全转换到T3启动子上。本发明基于硅学突变的方法,即利用分子建模和全原子分子动力学(MD)模拟来研究从实验室定向进化发现的病毒RNA聚合酶变体的启动子识别,尤其是利用PACE在类似噬菌体系统中,可以把一个噬菌体RNAP从识别其原始启动子切换到另一个启动子上。

附图说明

图1为本发明基于实验室定向进化的病毒RNA聚合酶识别不同启动子的方法流程图;

图2为Wt-RNAP和RNAP变体的能量计算在模拟时间上的收敛情况;

图3为单个残基对RNAP-启动子静电偏向的贡献;

图4为单个残基对蛋白质-DNA结合界面上的相应动态变化;

图5为氨基酸对RNAP-DNA启动子识别的贡献。

具体实施方式

本发明提供了一种基于实验室定向进化的病毒RNA聚合酶识别不同启动子的方法,包括以下步骤:(1)模拟野生病毒RNA聚合酶的游离结构,将所述游离结构与含原始识别启动子的dsDNA对接,构建得到封闭启动复合物;

(2)对所述封闭启动复合物进行全原子分子动力学模拟,筛选最佳复合物模型;

(3)参照定向进化实验,对所述最佳复合物模型进行特定突变,得若干不同的RNA聚合酶/启动子复合物;

(4)对所述RNA聚合酶/启动子复合物进行全原子分子动力学模拟,对得到的模拟轨迹进行数据分析,得进化路径的能量学和结构动力学数据,从而得到识别目标启动子的病毒RNA聚合酶。

在本发明的实施例中,所述基于实验室定向进化的病毒RNA聚合酶识别不同启动子的方法优选如图1所示,所述病毒优选包括噬菌体,实施例中优选采用T7噬菌体进行说明,但不能仅将其作为本发明的保护范围。

本发明模拟野生病毒RNA聚合酶的游离结构,将所述游离结构与含原始识别启动子的dsDNA对接,构建得到封闭启动复合物。在本发明实施例中所述T7 RNAP的晶体结构为PDB:1ARO,其中还含有T7溶菌酶,为方便进行结构对比,优选去掉所述溶菌酶,并用MODELLER填补蛋白质中缺少的空白(残基id 60-72,165-182,234-240,345-384,590-611),得到的游离结构(apo T7 RNAP蛋白结构)与只含有Cα原子的apo T7 RNAP结构(PDB:4RNP)之间存在一致性。

本发明将上述apo T7 RNAP蛋白结构对接到双链(ds)DNA启动子上,构建一个封闭启动复合物,所述dsDNA的核苷酸序列优选如SEQ ID NO.1所示。本发明所述dsDNA的获得方法,优选包括使用2.0版本的web 3DNA(w3DNA2.0)界面,生成含有T7启动子的标准B型dsDNA,模板链由28个核苷酸组成(SEQ ID NO.1)。然后使用Hdock Server(http://hdock.phys.hust.edu.cn/)将apo T7 RNAP结构对接到含有T7启动子的30bp dsDNA上。

得封闭启动复合物后,本发明对所述封闭启动复合物进行全原子分子动力学模拟,筛选最佳复合物模型。

本发明在进行所述全原子分子动力学(MD)模拟前,优选还包括对所述封闭启动复合物进行筛选;所述筛选优选包括使用基于FFT的全局对接程序对HDOCK服务器中的推定结合模式进行全局采样,使用改进的基于形状的成对评分功能,选择得分最好的前10个结构模型,然后与原始识别启动子RNA聚合酶开放启动复合物进行比对,筛选出与原始识别启动子RNA聚合酶具有相似DNA启动子定位的三个结构。本发明所述全原子分子动力学模拟的每次模拟时长优选为1微妙。

本发明所述MD模拟优选使用GROMACS-5.1软件包进行,且利用AMBER99sb-2012力场和PARMBSC0核酸参数描述所述系统。在进行所述MD模拟时,为了中和该系统并使离子浓度保持在0.15M,加入了163个Na+离子和119个Cl-离子;仿真系统共包含约156,000个原子。范德瓦尔斯力(vdW)和短程静电相互作用的截止距离被设定为10埃。长程静电相互作用用粒子网Ewald方法处理。相互作用的邻居列表每五步更新一次,时间步长为2fs。然后,在运行每个模拟时执行以下程序:(i)使用最陡峭下降算法进行20,000步能量最小化;(ii)进行200ps的NVT平衡,然后通过用1000kJ mol-1nm2的力常数对重原子进行位置限制和500ps的NPT平衡,使用耦合常数为0.1ps-1的速度重调恒温器将温度保持在310K;(iii)在310K和1个大气压下,使用速度重调恒温器和Parrinello-Rahman Barostat,分别进行1-s的NTP集合MD模拟。

本发明优选还计算了结构中SPL和启动子之间的氢键相互作用(HBs),根据现有的T7 RNAP的开放启动复合物结构,选择得分最高的结构,该结构很好地体现了蛋白质-DNA的HB相互作用。

得最佳复合物模型后,本发明参照定向进化实验,对所述最佳复合物模型进行特定突变,得若干不同的RNA聚合酶/启动子复合物。本发明所述特定突变优选包括利用AmberTools中的Tleap方法改变蛋白质中的氨基酸,将原始识别启动子中的DNA碱基对突变为目标识别启动子中的碱基对,并保持核酸骨架不变。本发明优选根据实验室的定向进化,使得野生型T7 RNAP(wt-T7 RNAP)逐渐进化为一系列的mt-RNAPs,它们较少地识别T7启动子而更多地识别T3启动子。基于这些突变体,本发明优选用7种T7 RNAPs构建14个模拟系统,包括wt-RNAP和变体(1M到6M),以及2种dsDNA(含有T7或T3启动子)。本发明经上述构建的结构后,优选还都进行大量的能量最小化处理,更优选为进行20,000步能量最小化处理,然后进行MD模拟。本发明所述MD模拟优选与上述相同,在此不再赘述。

得RNA聚合酶/启动子复合物后,本发明对所述RNA聚合酶/启动子复合物进行全原子分子动力学模拟,对得到的模拟轨迹进行数据分析,得进化路径的能量学和结构动力学数据,从而得识别目标启动子的病毒RNA聚合酶。本发明优选在MD模拟的最后800ns,RNAP和启动子DNA的结合区之间形成了HB相互作用和SB相互作用(>10%)。为了确定HBs,供体原子和受体原子之间的距离小于3.5埃,并且供体原子-氢原子-受体原子的角度大于140度。而盐桥是指蛋白质中Arg或Lys残基的最正电荷的N原子到核苷酸的磷酸基上最负电荷的两个氧原子之间的距离小于5埃。

在本发明中,蛋白质-DNA相互作用优选在两个残基组之间计算。一组是启动子DNA(ds-DNA-17至-1),另一组是启动子ds-DNA(-17至-1)25埃内的蛋白质核心部分。本发明利用Gromacs中的g_energy模块,根据含水模型的模拟轨迹重新计算了静电(ele)和vdW相互作用。

本发明利用全原子的MD模拟,揭示了病毒T7 RNAP变体沿着实验室定向进化路径重新连接启动子识别的物理机制,RNAP的启动子识别从原来的T7启动子切换到T3启动子。由于第一个点突变N748D出现在T7 RNAP的SPL(特异性环)上,偏向于T3启动子,它严重扰乱了蛋白质-DNA界面的HB模式,改变了SPL下游和ATL(富含AT的环)上游之间的平衡,并使RNAP与启动子轻微分离,阻碍了原始启动子的识别。一个辅助螺旋(AXH 206-225),通过RNAP的第二和第三个突变(E222K和E207K)沿定向进化路径接管切换RNAP-启动子的识别,因为AXH在两个突变后主要通过电荷相互作用与启动子更紧密地互动,然后在T7和T3启动子上以不同方式重新定位以支持进一步分化。启动子的特异性在ATL(R96L+K98R)上的突变后最终被转换,它调整了蛋白质-DNA的HB和SB模式,重新设定了ATL和SPL之间的平衡。SPL上的其他突变(R759L或R759S)进一步调节了RNAP与启动子的相互作用,并保持了启动子的特异性。从模拟中发现的这种结构动态和能量细节可能有助于系统的结构-功能信息学习,以促进对特定RNAP-促进剂识别的进一步合理设计。

下面结合实施例对本发明提供的一种单体聚合酶定向进化识别不同启动子的模拟预测方法进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。

实施例1

1、材料和方法

1.1获得apo T7 RNAP蛋白结构

根据T7 RNAP(PDB:1ARO)的晶体结构,将其内含有的T7溶菌酶去掉,用MODELLER填补蛋白质中缺少的空白(残基id 60-72,165-182,234-240,345-384,590-611)。然后将得到的结构与只含有Cα原子的apo T7 RNAP结构(PDB:4RNP)进行比较,发现两者之间存在一致性。

1.2将apo T7 RNAP对接到双链(ds)DNA启动子上,构建一个封闭的启动复合物

使用2.0版本的web 3DNA(w3DNA2.0)界面,生成含有T7启动子的标准B型dsDNA,模板链由28个核苷酸组成。

然后使用Hdock Server,将apo T7 RNAP结构对接到含有T7启动子的30bp dsDNA上。首先,先从Hdock生成100个复合结构。接下来使用基于FFT的全局对接程序(HDOCKlite)对HDOCK服务器中的推定结合模式进行全局采样,其中使用了改进的基于形状的成对评分功能,从得分最高的10个模型中,选择与T7 RNAP开放启动复合物晶体结构中显示出相似的DNA启动子定位的三个结构,然后进行了1s全原子MD模拟,并计算结构中SPL和启动子之间的HBs。最后,根据现有的T7 RNAP的开放启动复合物结构,选择得分最高的结构,该结构很好地体现了蛋白质-DNA的HB相互作用。

1.3从定向进化中构建突变体RNAPs的结构模型

根据实验室的定向进化,wt-T7 RNAP逐渐进化为一系列的mt-RNAPs,它们较少地识别T7启动子而更多地识别T3启动子。基于这些突变体,选用7种T7 RNAPs构建14个模拟系统,包括wt-RNAP和变体(1M到6M),以及2种dsDNA(含有T7或T3启动子)。对于突变,选择用AmberTools中的Tleap方法来改变蛋白质中的氨基酸,如将T7启动子中的DNA碱基对突变为T3启动子中的碱基对,并保持核酸骨架不变。所有这些构建的结构都进行了大量的能量最小化处理(进行了20,000步能量最小化处理),然后进行以下MD模拟。

1.4原子学MD模拟的设置

所有的MD模拟都是使用GROMACS-5.1软件包进行的,包括AMBER99sb-2012力场和PARMBSC0核酸参数。为了中和该系统并使离子浓度保持在0.15M,加入了163个Na+离子和119个Cl-离子。仿真系统共包含约156,000个原子。范德瓦尔斯力(vdW)和短程静电相互作用的截止距离被设定为10埃。长程静电相互作用用粒子网Ewald方法(54)处理。相互作用的邻居列表每五步更新一次,时间步长为2fs。然后,在运行每个模拟时执行以下程序:(i)使用最陡峭下降算法进行20,000步能量最小化;(ii)进行200ps的NVT平衡,然后通过用1000kJ mol-1nm2的力常数对重原子进行位置限制进行500ps的NPT平衡。使用耦合常数为0.1ps-1的速度重调恒温器将温度保持在310K;(iii)在310K和1个大气压下,使用速度重调恒温器和Parrinello-Rahman Barostat,分别进行了1-s的NTP集合MD模拟。

1.5蛋白质-DNAHBs和SBs的计算

在模拟的最后800ns,RNAP和启动子DNA的结合区之间形成HB相互作用和SB相互作用(>10%)。为了确定HBs,供体原子和受体原子之间的距离小于3.5埃,并且供体原子-氢原子-受体原子的角度大于140度。而盐桥是指蛋白质中Arg或Lys残基的最正电荷的N原子到核苷酸的磷酸基上最负电荷的两个氧原子之间的距离小于5埃。

1.6蛋白质-DNA相互作用能量学的计算

蛋白质-DNA相互作用是在两个残基组之间计算的。一组是启动子DNA(ds-DNA-17至-1),另一组是启动子ds-DNA(-17至-1)25埃内的蛋白质核心部分。利用Gromacs中的g_energy模块,根据含水模型的模拟轨迹重新计算了静电(ele)和vdW相互作用。

1.7粗粒度(CG)模型的构建和CG模拟的设置

CG模拟是由CafeMol 3.0软件进行的。T7 RNAP的初始结构来自晶体结构(PDB ID:1ARO)。通过使用非晶格Go模型构建CG蛋白结构,每个CG粒子位于Cα原子上,代表一个氨基酸,在Go模型势下,构象偏向于原生结构。

在dsDNA(长度为200bp)的CG模型中,通过3SPN.1模型,每个核苷酸由三个CG粒子表示,分别对应碱基、糖和磷酸基,其中考虑了键的拉伸、角的弯曲、二面角的扭曲、基-基相互作用、排除体积效应、溶解能和静电能。静电相互作用和排除体积效应被考虑在内。所有的CG模拟都是在Berendsen恒温器的恒温条件下通过Langevin动力学进行的。

2.结果

2.1蛋白质-DNA静电相互作用能量学为RNAP-启动子的识别提供了定量的衡量标准

为了探究在启动子上稳定RNAP的蛋白质-DNA相互作用是否也有助于启动子的识别和分化,我们计算了WtT7 RNAP和所有突变体(14个模拟系统)的RNAP蛋白和DNA的启动子结合区(-17至-5)之间的静电(ele,E^ele)和范德瓦尔斯(vdW)相互作用能量。蛋白质和DNA的原子之间的相互作用是在截止距离时计算的(截止距离时,结果趋于一致)。Wt-RNAP(图2中A)和RNAP变体的能量计算在模拟时间上的收敛情况。通过对单个系统的一微秒模拟轨迹进行平均计算得到的能量学结果(图2中B)。

结果表明,RNAP和启动子结合区之间的E^ele偏差很好地表征了RNAP的识别偏好:Wt T7 RNAP与T7启动子的静电相互作用能量E^ele比与T3启动子的低,也就是说,它与T7启动子的结合更稳定、更有电性,这与它具有更高的活性或比T3启动子更好地识别T7启动子相一致。对于1M、2M和3M的RNAP变体,它们与T7和T3启动子的结合具有相似的E^ele,与它们在T7和T3之间的启动子活性的低分化一致。值得注意的是,对于在T3而不是T7启动子上表现出高活性的5M和6M-1/2的RNAPs,在T3启动子上的蛋白质-DNA静电能量学的E^ele明显低于T7启动子上。同时,vdW能量学也显示出类似的趋势,即在活性较高的启动子上稳定蛋白质(见图2)。

2.2单个残基对RNAP-启动子静电偏向的贡献以及蛋白质-DNA结合界面上的相应动态变化

由于对于某些RNAP来说,T7和T3启动子之间的蛋白质-DNA能量差异很好地表征了启动子的识别偏好。我们计算了每个系统的

(分别是RNAP与T7和T3启动子的相互作用能量),并将对ΔEele的贡献投射到单个氨基酸(AA)上,作为RNAP第i个AA的(图3)。对启动子识别有重大贡献的关键AA,即具有大振幅的主要位于ATL(AA 93-101)、AXH(206-225)、INB(230-245)和SPL(739-770)。对于wt RNAP,ATL-R96、AXH-R215、INB-R231和SPL-R746/756同时稳定T7和T3启动子,对T7的影响较大,对T3的影响较小;Q135(位于INB和AXH之间)只与T7有明显的相互作用。相应地,ATL-R96、Q135、AXH-R215、INB-R231、SPL-R746具有即偏向于使RNAP更稳定在T7启动子上(图3中B)。此外,SPL-N748显示出对T7启动子的偏爱,尽管它与T7/T3启动子的相互作用不是特别强。然而,另一方面,AXH-E218偏向于T3启动子与各自的启动子也没有明显的相互作用。

在1M(N748D,图3中C)中,突变本身对稳定T3启动子有直接的能量偏向。然而,N748D对T7或T3启动子的能量贡献仍然是微不足道的。尽管ATL-G97(&T101)、Q135和INB-R231仍然有但ATL-K95和K98(连同R96&KR99)、AXH-H211和SPL-N748D(连同T745&R746)开始有明显的即偏向T3启动子。因此,1M变体通过N748D突变直接引入了SPL的不稳定,然后扰乱了ATL和AXH的启动子偏向(见图4中A和B)。

2M(N748D+E222K,图3中D)然后有一个额外的AXH-E222K突变。现在ATL-R96和T101,AXH-R215和SPL-T745&R746(连同K765)贡献了而ATL-K98,Q135,AXH-H211,INB-R231和SPL-N748D(连同Q758&P759&T760)有似乎AXH-E222K突变导致了Q135和INB-R231的启动子偏好的转换(图4中C)。仔细检查发现,INB-R231可以将其侧链从1M切换到2M,因为E222K将其侧链带向T7启动子(K222仍约10埃),而不是T3启动子,相应地,R231在2M中与T3启动子的结合比T7启动子好得多。

接下来,对于带有第三个突变AXH-E207K的3M(N748D+E222K+E207K,图3中E),可以得到ATL-K98(连同R96&R99)、H205、AXH-E207K、SPL-T745&R746&K765具有以稳定T7启动子。而ATL-K95、AXH-H211&R215、INB-R231(连同A234&G235)和SPL-N748D(连同R756)的偏向T3启动子。N748D与T3启动子有明显的稳定相互作用(大于1M或2M中的相互作用),而INB-R231与T7和T3启动子都有密切的相互作用,但仍保持对T3的偏向。尽管AXH-E207K本身在很大程度上稳定并偏向于T7启动子,但它促进了AXH-R215优先结合到T3启动子。E207K和R215对DNA启动子的竞争实际上表明,由于E207K成功地比R215更紧密地结合在T7启动子上,R215实际上比E207K更紧密地结合在T3启动子上(4中D)。由于启动子与E207K和R215分别从AXH的N端和C端相互作用,AXH与DNA长轴的方向角发生了很大的变化(图4中D),T7从2M中的130°15′减少到3M的104°21′,T3从2M中的97°17′增加到3M中的111°8′。因此,T7的变化使AXH与DNA更垂直地对齐,而且这种趋势持续到5M和6M;T3的趋势正好相反。总的来说,2M和3M在T7和T3启动子之间没有太大的区别,然而它们确实为5M/6M的启动子识别/区分准备了必要的或关键的驻留配置。特别是,R215对T3启动子的偏向和伴随的AXH相对于启动子DNA的方向变化似乎是至关重要的。

相比之下,启动子的识别和分化在5M和6M中变得突出,其中ATL上的R96L+K98R另外出现(5M,图3中F),然后是SPL-P759L/S(6M,图3中G和H)。在这两种情况下,有更多的残基对有贡献,即稳定T3启动子。在5M中,AXH-E207K(连同E218)和SPL-T745(连同R746&K765)仍然为而ATL-K93(连同K98R&R99)、AXH-R215&E222K、INB-R231和SPL-N748D都有因为在2M和3M中,正是K96和R98分别偏向于T7启动子,两者的突变在很大程度上取消了ATL对T7启动子的偏向。与3M相比,SPL-K765对T7启动子的稳定也消失了。

在6M-1(P759L)中,SPL-T745和SPL-K765仍能对作出贡献,而ATL-K98R、AXH-R215&H211、SPL-N748D(以及Q744到T760的几个残基)的在6M-2(P759S)中,ATL-T101、AXH-K206和SPL-K765贡献了ATL-K95到R99、AXH-R215&H211、SFL-N748D(以及从Q744到T760的残基)有看来SPL-P759L/S突变诱导Q744到T760区域进一步稳定T3启动子,而灵活的INB-R231不一定偏向T3启动子。AXH-E207K对T7启动子的稳定化在6M中不再持续。在5M或6M中,ATL/AXH/SPL对T7启动子的边缘稳定作用仍然存在。同时,SPL-N748D(从1M开始)和AXH-R215(在3M被触发)对T3启动子有强大的贡献。

2.3分析RNAP-DNA启动子界面的氢键(HBs),进一步探究AA对识别的贡献

为了研究启动子上RNAP的具体识别,我们检查了每个模拟系统的RNAP-启动子界面上相应的氢键(HBs)和盐桥(SB)的相互作用。由于大多数氢键是波动的和高度动态的,我们在微秒模拟过程中(约0.8秒)记录了至少~10%的占用率的氢键。相应的结果总结于图5中A。请注意,T7和T3启动子的DNA序列仅在-17、-15、-12、-11和-10位置不同,而-12至-10位置对于启动子的特异性至关重要。

由ATL和DNA形成的HBs从上游的小沟区域(-17到-15)到中间的大沟(-15到-12)广泛地跨越。在wt-RNAP中,ATL在上游区域(-17至-15)形成约4个HBs(与T7)和7个HBs(与T3),主要与模板链(表示T);在T7和T3启动子上,在非常下游的位置形成一个HB,即T101:NT-12(NT表示非模板链)。在单点突变体(1M)中,ATL在上游形成约6个HBs(与T7一起)和约4个HBs(与T3一起);在T7启动子上形成两个HBs T101:NT-12和K98:NT-11,在T3启动子上这两个HBs转换为T101:NT-11和K98:NT-12。在双突变体和三突变体(2M和3M)中,ALT在上游保持~6个HBs(与T7),但4-7个HBs(与T3);最下游的HB在T7启动子上形成为T101:NT-12/-11,或在T3启动子上形成为T101:NT-12。在T3启动子首选突变体(5M和6M)中,上游的ATL HBs明显减少。T7有1-2个HBs,T3有3-4个HBs;无论在哪个启动子上,最下游的HBs总是保持为T101:NT-12。因此,在wt-RNAP中,ATL HB与上游模板DNA链的联系似乎比T7少,而在过渡性突变体(1M到3M)中,这一趋势有所转变,在定向突变体(5M和6M,由于ATL上的R96L和K98R突变)中,ATLHB与启动子的整体联系有所减弱。特别是,在过渡性突变体(1M和3M)中,ATL与最下游的T101:NT-12的联系可以移动到NT-11,但在定向突变体中恢复到稳定的T101:NT-12。

至于AXH上的AAs,所有的HBs都集中在非模板DNA链上的主槽中间(NT-13至-11)。在wt-RNAP中,AXH与T7和T3启动子形成3个相同的HBs(R215:NT-13、R215:NT-12和H211:NT-11;图5中B)。因此,这些HBs似乎对启动子的分化没有贡献。在1M中,AXH完全失去了与T7启动子的HB联系,而两个AXH HBs(R215:NT-12和H211:NT-12)保持与T3启动子的联系(图5中C)。R215和H211 HBs在2M中(E222K后)以某种方式恢复,H211持续在T3启动子上偏向形成HB,以及在3M中(E207K后,K207:NT-11对两个启动子形成;图5中D和E)。在T7和T3启动子上,K207继续与NT-11甚至NT-10结合,R215与NT-13/12在两个启动子上形成HBs,H211仍然优先与T3启动子结合(5M和6M)。因此,似乎1M(或SPL-N748D)关键地打破了AXH HB与两个物种(T7和T3)之间的启动子DNA关联的平衡,使AXH-H211保持与T3启动子的HB,但不再与T7启动子关联;然后突变E222K和E207K,即。直接出现在AXH上,增强了AXH与DNA的联系,以及支持H211对T3启动子的HB偏好,持续到定向突变体。

由SPL和启动子DNA形成的HBs主要位于较远的下游(主要在模板T-10到-7上),直到NT-11(只有N748在wt-RNA与T7中),或向下到-6/5(T760在wt-RNAP与T7或6M与T3中)。值得注意的是,N748D作为第一个也是最关键的突变出现,在所有的RNAP变体(从1M到6M;图5)中,将碱基特异性HB N748:NT-11与T7和N748:NT-10与T3移动到D748:NT-10上。在过渡性突变体(1M-3M)和定向突变体(5M-6M)中,D748是唯一与DNA碱基(NT-10)形成HB的残基,在T7和T3启动子上都是如此;NT-10另外与E207K和/或T745联系,只在T7而不是T3启动子上。因此,N748D似乎对启动子识别的HB相互作用的重新定位至关重要,并支持AXH对启动子的重新接线分化。SPL中其他形成HB的残基似乎在所有系统中都保持稳定的接触,包括wt-RNAP和变体(R756:G-9,Q758:A-8,R746:G-7)。请注意,T760:T-6存在于wt-RNAP中,具有T7启动子的偏好;然后由于突变P759L/S,它转为T3启动子的偏好(6M)。

最后,INB区主要通过R231、Q239和S241与模板-7和-6的位置形成HBs(偶尔也有R231到-8或S241到-5)。在wt-RNAP中,INB与T7启动子形成的HBs比与T3启动子形成的多一些。在RNAP的变体中,这样的偏向会减少,甚至会稍微逆转。看来,INB仍然可以发挥一些作用。特别是,INB-R231在促进对T3启动子的偏向方面显示出短暂的作用(在2M和5M中),在能量上或通过与DNA形成HBs,然而一般来说R231侧链是高度灵活的,经常摆动,没有持续的偏向。

此外,我们还研究了RNAP-促进剂DNA界面的SB相互作用。上游的ATL对SB相互作用有主导作用,这表明T7和T3启动子之间没有明显的区别。然而,在wt-RNAP中,与T7启动子的ATL SB R96-NT-16确实有助于在能量上稳定T7系统;在2M/3M中,T7启动子上的SB K98-T-15/T-14也是如此(见图2中B)。有趣的是,在有R96L和K98R的5M/6M中,这种稳定和偏倚被取消了,这表明ATL上的突变正好促进了对T3启动子的特异性。同时,在启动子分化的关键的-12到-10区域,有来自AXH的SB(如R215-NT,所有RNAPs,除了与T7的M3;K207-NT从3M开始),来自ATL(K98或R98,所有mt-RNAPs,除了与T7的M3;偶尔K95-NT,在与T3的M1和与T7的M3),以及来自SPL(偶尔K765-NT,对于与T7的1M/5M/6M)。特别是,我们可以看到,AXH参与了更多的SB与DNA的相互作用,从1M-2M的突变开始,AXH-SB在3M-6M中进一步延伸。

我们利用全原子的MD模拟,揭示了病毒T7 RNAP变体沿着实验室定向进化路径重新连接启动子识别的物理机制,因为RNAP的启动子识别从原来的T7启动子切换到略有不同的T3启动子。由于第一个点突变N748D出现在T7 RNAP的SPL(特异性环)上,偏向于T3启动子,它严重扰乱了蛋白质-DNA界面的HB模式,改变了SPL下游和ATL(富含AT的环)上游之间的平衡,并使RNAP与启动子轻微分离,阻碍了原始启动子的识别。值得注意的是,目前的研究确定了一个辅助螺旋(AXH 206-225),它通过RNAP的第二和第三个突变(E222K和E207K)沿定向进化路径接管切换RNAP-启动子的识别,因为AXH在两个突变后主要通过电荷相互作用与启动子更紧密地互动,然后在T7和T3启动子上以不同方式重新定位以支持进一步分化。启动子的特异性在ATL(R96L+K98R)上的突变后最终被转换,它调整了蛋白质-DNA的HB和SB模式,重新设定了ATL和SPL之间的平衡。SPL上的其他突变(R759L或R759S)进一步调节了RNAP与启动子的相互作用,并保持了启动子的特异性。从模拟中发现的这种结构动态和能量细节可能有助于系统的结构-功能信息学习,以促进对特定RNAP-促进剂识别的进一步合理设计。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

序列表

<110> 核工业湖州勘测规划设计研究院股份有限公司

<120> 一种单体聚合酶定向进化识别不同启动子的模拟预测方法

<160> 1

<170> SIPOSequenceListing 1.0

<210> 1

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

attatgctga gtgatcccct cttgactg 28

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:物种基因识别标签的查找方法、装置及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!