一种蛋白质异质索烃的生物合成方法

文档序号：1250171 发布日期：2020-08-21 浏览：1次 >En<

阅读说明：本技术 一种蛋白质异质索烃的生物合成方法 (Biosynthesis method of protein heterogeneous catenane ) 是由张文彬刘雅杰于 2020-05-21 设计创作，主要内容包括：本发明公布了一种蛋白质异质索烃的生物合成方法。通过模拟天然拓扑蛋白质合成中的多步翻译后修饰过程,基于合理的基因序列设计,结合原位组装、链断裂和定点环化,发展了基于两种正交偶联方式的生物合成体系,可以实现蛋白质异质索烃的模块化合成。该方法利用p53dim结构域等缠结基元的分子内二聚来提高蛋白质异质索烃的产量,同时不需要额外的胞外反应。当多肽-蛋白质反应对与断裂内含肽联用时,可以实现支化蛋白质异质索烃的生物合成；当两种正交断裂内含肽联用时,可以获得完全主链环化的蛋白质异质索烃。本发明拓展了拓扑蛋白质的合成方法,可以简洁地实现蛋白质异质索烃的生物合成。(The invention discloses a biosynthesis method of protein heterogeneous catenane. Through simulating a multi-step post-translational modification process in natural topological protein synthesis, based on reasonable gene sequence design, in combination with in-situ assembly, chain breakage and site-specific cyclization, a biosynthesis system based on two orthogonal coupling modes is developed, and modular synthesis of protein heterogeneous hydrocarbons can be realized. The method utilizes intramolecular dimerization of entanglement motifs such as p53dim structural domains and the like to improve the yield of protein heterocatenes without additional extracellular reaction. When the polypeptide-protein reaction pair is combined with the broken intein, the biosynthesis of the branched protein heterosoxocarbon can be realized; when two orthogonal split inteins are combined, a fully backbone cyclized protein heterosoxohydrocarbon can be obtained. The invention expands the synthesis method of the topological protein and can simply realize the biosynthesis of the heterogeneous protein catenane.)

一种蛋白质异质索烃的生物合成方法

技术领域

本发明涉及蛋白质异质索烃的生物合成方法，特别涉及基于多肽-蛋白质反应对和/或断裂内含肽的生物合成体系，以及基于该体系通过两种正交偶联环化方式构建多结构域蛋白质异质索烃的方法。

背景技术

在自然界中，许多天然生物大分子都存在特定的拓扑结构，并与其相应的生物学功能密切相关。目前发现的天然拓扑蛋白质包括环状、扭结、套索蛋白质和蛋白质索烃等。由于环状蛋白质的构建只需对多肽链实现偶联，是目前人工合成拓扑蛋白质的研究重点，通常表现出明显热稳定性的提高。由于蛋白质折叠机制的复杂性，通过控制多肽链之间的缠结关系对蛋白质的拓扑结构进行调控是相对困难的。索烃中最为简单的[2]索烃是由两个机械互锁的环状基元组成，因而相应的蛋白质异质索烃结构既可以结合环状蛋白质的优势，又可以通过调控两个环状基元的相对位置实现协同作用，而该结构尚未在自然界中发现。故而发展蛋白质异质索烃的制备方法是一个非常有吸引力的研究方向。

目前关于人工合成蛋白质索烃的报道相对较少，其合成策略可以大致分为三类，但实现机械互锁结构的本质均是基于蛋白质的折叠结构。第一类是利用肿瘤抑制蛋白质p53的四聚结构域p53tet或其突变型二聚结构域p53dim来指导分子链间的相互缠结，再通过高效特异的天然化学连接或者谍标签-谍捕手(SpyTag-SpyCatcher)反应对进行闭环，从而实现蛋白质同质索烃的合成。第二类则是基于套索肽的拓扑结构转换，通过酶切和组装逐步转变为高阶索烃。第三类则是通过将谍捕手拆分为BDTag和谍订书机酶(SpyStapler)，并基于谍标签-谍捕手反应对的折叠结构对三个基元进行合理重组，结合断裂内含肽介导的环化反应和其自催化生成异肽键的特点，首次实现了蛋白质异质索烃的合成，但其反应无法达到完全，整个纯化过程也较为繁琐。基于组装-反应的协同策略，进一步发展蛋白质异质索烃的生物合成方法，将有助于更深入地研究拓扑结构对蛋白质性质和功能的影响，也将为其在生物医学领域中的应用奠定基础。

发明内容

本发明的目的在于提供一种蛋白质异质索烃的生物合成策略，不需要额外的胞外反应过程，即可实现多结构域蛋白质异质索烃的高效构建。

本发明通过模拟天然拓扑蛋白质合成中的多步翻译后修饰过程，基于合理的基因序列设计，结合原位组装、链断裂和定点环化，发展了基于两种正交偶联方式的合成体系，可以实现蛋白质异质索烃的模块化合成，具有支化或完全主链环化的结构特征。

本发明设计的用于制备蛋白质异质索烃的蛋白质前体序列的基本结构包括：L_1-1-X-L_1-2-(原位酶切位点)-L_2-1-X-L_2-2，其中：

(1)X代表可以形成二聚体的缠结基元，是形成异质索烃的关键元素之一。两个X可以相同，例如肿瘤抑制因子衍生的p53dim结构域、幽门螺旋杆菌HP0242蛋白等形成同质二聚体的缠结基元；两个X也可以不同，例如在上述二聚体基元基础上经过氨基酸残基的取代等衍生的异质二聚体基元，或者是自然界中存在的天然异质缠结二聚体基元。

(2)L_1-1/L_1-2、L_2-1/L_2-2代表可以在胞内发生正交偶联反应的两对环化基元，是形成异质索烃的另一关键元素。所述环化基元可以选自多肽-蛋白质反应对、断裂内含肽等，为了避免过多的副反应，两种环化方式之间应当具有一定的正交性。在特定情况下需要在L_1-2与L_2-1之间插入原位酶切位点，通过在胞内共表达蛋白酶对该位点进行原位酶切才能实现异质索烃的合成，例如插入TVMV酶的识别位点。

两对环化基元的选择主要包括下述三种方式：

①两种正交的多肽-蛋白质反应对，例如谍标签-谍捕手反应对和探标签-探捕手反应对。在这种情况下必须在两个反应对之间插入原位酶切位点，将一条多肽链经共表达蛋白酶酶切变为两条多肽链。

②多肽-蛋白质反应对与断裂内含肽组合，例如谍标签-谍捕手反应对与NpuDnaE断裂内含肽(包括C端部分和N端部分)。当多肽-蛋白质反应对在前面，断裂内含肽在后面，即L_1-1/L_1-2为多肽-蛋白质反应对，L_2-1/L_2-2为断裂内含肽时，由于多肽-蛋白质反应对的胞内环化反应是侧链偶联反应，同时所形成的复合物会存在于最终结构中，因此需要通过原位酶切引发L_2-1/L_2-2的环化反应；当断裂内含肽在前面，多肽-蛋白质反应对在后面，即L_1-1/L_1-2为断裂内含肽，L_2-1/L_2-2为多肽-蛋白质反应对时，基于断裂内含肽介导的环化为主链偶联，断裂内含肽环化后会通过自剪接的方式从前体蛋白质中释放出来的特性，原位酶切可以是非必须的。

③两种正交的断裂内含肽，例如NpuDnaE断裂内含肽的两种不同断裂方式形成的IntC1/IntN1、IntC2/IntN2，以及其他断裂内含肽，例如gp41-1，gp41-8，NrdJ-1和IMPDH-1等，两种断裂内含肽存在一定正交性即可。断裂内含肽介导环化的优势是形成主链环化，并且自身剪接离去，剩余的冗余氨基酸少。利用两种正交的断裂内含肽时可以不插入原位酶切位点。

在上述蛋白质前体序列的基本结构中插入一个或多个相同或不同的目标蛋白，即可构建包含目标蛋白的蛋白质异质索烃。目标蛋白的插入位点可以在环内，即X结构域前和/或X结构域后。由于多肽-蛋白质反应对介导的环化为侧链偶联，其环化后仍然保留N端和C端，因而目标蛋白的插入位点也可以在环外，即多肽-蛋白质反应对的N端和/或C端，从而构建支化异质索烃。

目标蛋白的基因构建参见图1，在蛋白质前体序列L_1-1-X-POI1-L_1-2-(TVMV)-L_2-1-X-POI2-L_2-2中，L_1-1/L_1-2与L_2-1/L_2-2代表两种正交环化方式的环化基元，X代表缠结基元，POI1和POI2代表目标蛋白1和目标蛋白2；TVMV位点代表TVMV酶的识别位点，可以被共表达的TVMV酶识别并进行原位酶切；在第二个缠结基元X前引入纯化标签(如组氨酸标签序列)，方便对合成的异质索烃进行纯化。下面举例说明目标蛋白的可融合位置：

①当L_1-1/L_1-2与L_2-1/L_2-2为正交的多肽-蛋白质反应对时，均发生侧链偶联环化，需要原位酶切，所形成的复合物L₁和L₂会存在于最终的索烃结构中，因此，除了将目标蛋白POI1和POI2分别插入两个环内，形成异质索烃cat-L₁(X-POI1)-L₂(X-POI2)外，进一步在多肽-蛋白质反应对的N端和C端融合上目标蛋白(POI3、POI4、POI5、POI6)可以构建支化异质索烃，目标蛋白插入的位置如下：POI3-L_1-1-X-POI1-L_1-2-POI4-(TVMV)-POI5-L_2-1-X-POI2-L_2-2-POI6。

②当L_1-1/L_1-2与L_2-1/L_2-2为多肽-蛋白质反应对与断裂内含肽组合时，由于断裂内含肽形成的复合物会自剪接离去，若L_1-1/L_1-2为多肽-蛋白质反应对，L_2-1/L_2-2为断裂内含肽，将目标蛋白POI1和POI2分别插入两个环内，形成的异质索烃为cat-L₁(X-POI1)-(X-POI2)，进一步在L_1-1/L_1-2多肽-蛋白质反应对的N端和C端融合上目标蛋白(POI3、POI4)可以构建支化异质索烃，目标蛋白插入的位置如下：POI3-L_1-1-X-POI1-L_1-2-POI4-(TVMV)-L_2-1-X-POI2-L_2-2；反之，若L_1-1/L_1-2为断裂内含肽，L_2-1/L_2-2为多肽-蛋白质反应对，将形成异质索烃cat-(X-POI1)-L₂(X-POI2)，进一步在L_2-1/L_2-2多肽-蛋白质反应对的N端和C端融合上目标蛋白(POI3、POI4)可以构建支化异质索烃，目标蛋白插入的位置如下：L_1-1-X-POI1-L_1-2-(TVMV)-POI3-L_2-1-X-POI2-L_2-2-POI4。

③当L_1-1/L_1-2与L_2-1/L_2-2为正交断裂内含肽时，由于断裂内含肽形成的复合物会自剪接离去并介导主链环化，将目标蛋白POI1和POI2分别插入两个环内，形成的异质索烃为cat-(X-POI1)-(X-POI2)，其所含有的两个环状蛋白质基元均实现了主链环化，且不含有缠结基元和目标蛋白以外的其他冗余组分。

本发明进行蛋白质异质索烃生物合成的策略重点考虑了以下方面：(1)利用p53dim结构域等缠结基元(X)实现机械互锁，通过将分子间二聚转为分子内二聚提高异质索烃的产率；(2)选择可以在胞内发生的环化方式，目前应用较多的是蛋白质-多肽反应对和断裂内含肽；(3)两种环化方式之间具有一定的正交性，避免过多的副反应，例如将谍标签-谍捕手反应对和断裂内含肽结合使用，或者选择两种具有一定正交性的断裂内含肽；(4)断裂内含肽通常包括尺寸较大的N端部分(IntN)和尺寸相对较小的C端部分(IntC)，当IntC位于链中导致反应受阻时，可以通过共表达蛋白酶对新生多肽链进行原位酶切，从而引发该断裂内含肽介导的反式剪接反应。

本发明涉及的断裂内含肽优选为NpuDnaE断裂内含肽，其天然断裂方式是分成含有36个氨基酸的IntC1和含有102个氨基酸的IntN1。通过系统性地截短IntC部分得到的含有15个氨基酸的IntC2和相应的含有123个氨基酸的IntN2，同样具有很好的反式剪接效率。尽管IntC1与IntN2存在一定的反应性，但是IntC2无法和IntN1发生反应，体现出一定的正交性。

本发明中蛋白质异质索烃的生物合成体系均是利用p53dim结构域等缠结基元的分子内二聚导向多肽链的缠结，但是实现正交偶联的方式有所不同。基于多肽-蛋白质反应对的胞内环化反应是一个具有完整N-/C-末端的侧链偶联反应，同时其所形成的复合物会存在于最终结构中，因而可以通过进一步融合其他目标蛋白制备支化蛋白质异质索烃。与之不同的是，基于断裂内含肽的胞内环化反应，可以将肽链的两端以天然肽键相连实现主链环化，同时断裂内含肽会通过自剪接的方式从前体蛋白质中释放出来。

本发明提供的蛋白质异质索烃的生物合成方法主要包括：

1)设计蛋白质异质索烃的蛋白质前体序列，其基本结构由N端到C端包括：L_1-1-X-L_1-2-(原位酶切位点)-L_2-1-X-L_2-2，其中，X代表形成二聚体的缠结基元；L_1-1/L_1-2、L_2-1/L_2-2代表在胞内发生正交偶联反应的两对环化基元，这两对环化基元可以为两种正交的多肽-蛋白质反应对，或者多肽-蛋白质反应对和断裂内含肽组合，或者两种正交的断裂内含肽；当L_1-1/L_1-2为多肽-蛋白质反应对时，在L_1-2与L_2-1之间插入的原位酶切位点为必要元件，通过在胞内共表达蛋白酶对该位点进行原位酶切，否则所述原位酶切位点为非必要元件；在上述基本结构中插入目标蛋白序列，插入位点选自：X结构域前和/或X结构域后、多肽-蛋白质反应对的N端和/或C端；

2)构建步骤1)所述蛋白质前体序列对应的编码基因序列，并引入表达载体中；

3)将步骤2)构建的表达载体转入细胞中进行表达，必要时在细胞内共表达切割所述原位酶切位点的蛋白酶；

4)对步骤3)获得的融合蛋白进行纯化，得到相应的蛋白质异质索烃。

上述步骤1)中，所述多肽-蛋白质反应对优选为谍标签-谍捕手反应对、探标签-探捕手反应对，典型的谍标签(SpyTag)和谍捕手(SpyCatcher)的氨基酸序列分别如序列表中SEQ ID NO:1和SEQ ID NO:2所示，也可以应用具有反应性的SpyTag/SpyCatcher突变体。所述突变体是指在SpyTag/SpyCatcher的上述氨基酸序列基础上经过氨基酸残基的取代、缺失或添加而衍生的肽链，所述取代、缺失或添加的氨基酸残基不会对其生成异肽键的偶联反应产生影响。

上述步骤1)中，缠结基元X优选为肿瘤抑制因子衍生的p53dim结构域，典型的p53dim结构域的氨基酸序列如序列表中SEQ ID NO:3所示，也可以应用能够形成类似二聚结构的p53dim突变体。所述突变体是指在p53dim的上述氨基酸序列基础上经过氨基酸残基的取代、缺失或添加而衍生的肽链，所述取代、缺失或添加的氨基酸残基不会对其缠结二聚体的生成产生影响。

上述步骤1)中，所述断裂内含肽优选NpuDnaE断裂内含肽的N端部分(IntN)和C端部分(IntC)构成环化基元，其两种断裂方式所产生的IntC1、IntN1、IntC2和IntN2的氨基酸序列分别如序列表中SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6和SEQ ID NO:7所示。除此之外，其他满足条件的断裂内含肽也可以应用于本发明以实现蛋白质异质索烃的生物合成。

上述步骤1)中，所述原位酶切位点优选为烟草脉斑驳病毒(Tobacco veinmottling virus，TVMV)蛋白酶的识别序列ETVRFQG。

上述步骤1)中，为了对所合成的蛋白质异质索烃进行拓扑结构的证明，可以在第一个缠结基元X之前引入烟草蚀斑病毒(Tobacco etch virus,TEV)蛋白酶的识别序列ENLYFQG，该序列也可以用作所述的原位酶切位点。进一步的，为了便于纯化，在第二个缠结基元X之前引入了组氨酸标签序列，在步骤4)通过镍柱亲和层析进行蛋白纯化。

上述步骤3)中，对于L_1-1/L_1-2为多肽-蛋白质反应对的情况，必须与原位酶切位点的蛋白酶进行共表达才能实现蛋白质异质索烃的生物合成；而对于L_1-1/L_1-2为断裂内含肽的情况，不需要共表达所述蛋白酶。

上述步骤4)中，对于引入组氨酸标签序列的蛋白质异质索烃，通过镍柱亲和层析对所表达的蛋白质进行纯化，可以结合梯度洗脱或尺寸排阻色谱进一步提高蛋白质异质索烃的纯度。

在本发明的实施例中，如图2所示，设计了下述蛋白质前体序列：

SpyCatcher(B)-p53dim(X)-SpyTag(A)-IntC1-p53dim(X)-IntN1，简记为BXA-IntC1-X-IntN1；

IntC1-p53dim(X)-POI1-IntN1-IntC2-p53dim(X)-POI2-IntN2，简记为IntC1-X-POI1-IntN1-IntC2-X-POI2-IntN2。

将上述编码基因引入表达载体pMCSG19中，再将表达载体转入BL21(DE3)感受态细胞进行表达。对于需要共表达蛋白酶的体系BXA-IntC1-X-IntN1，BL21(DE3)感受态细胞中则还含有可以编码TVMV蛋白酶的pRK1037质粒；而IntC1-X-POI1-IntN1-IntC2-X-POI2-IntN2在单独表达或与TVMV酶共表达的情况下，均可以实现蛋白质异质索烃的生物合成，二者没有明显差异，因此将其表达载体转入常规BL21(DE3)感受态细胞进行表达即可。最后对获得的融合蛋白质进行纯化，即可得到相应的蛋白质异质索烃。

由BXA-IntC1-X-IntN1或IntC1-XPOI1-IntN1-IntC2-XPOI2-IntN2重组质粒表达得到的蛋白质前体，首先通过p53dim结构域的二聚形成分子内缠结的结构，再通过两种正交的偶联方式实现定点环化。在BXA-IntC1-X-IntN1的体系中，必须要通过与TVMV酶进行共表达来实现原位酶切，从而引发IntC1/IntN1介导的反式剪接反应，再结合谍标签-谍捕手反应对介导的侧链环化反应，最终实现蛋白质异质索烃cat-BXA-X的制备。在IntC1-X-POI1-IntN1-IntC2-X-POI2-IntN2的体系中，两对断裂内含肽可以顺序发生反式剪接反应，依次介导两种目的蛋白的环化，最终实现蛋白质异质索烃cat-XPOI1-XPOI2的制备。

在BXA-IntC1-X-IntN1的基础上，通过在SpyCatcher的N端和SpyTag的C端引入其他折叠蛋白质，例如对HER2具有高亲和力的亲和体AffiHER2，可以基于同样的共表达方式实现支化蛋白质异质索烃的生物合成。在IntC1-XPOI1-IntN1-IntC2-XPOI2-IntN2的体系中，选择小泛素修饰蛋白SUMO和超折叠蛋白质GFP作为模型蛋白质，分别实现了蛋白质异质索烃cat-XSUMO-X和cat-XSUMO-XGFP的生物合成。

下面通过一些具体的例子说明蛋白质异质索烃生物合成过程中蛋白质前体的序列：

(a)SpyCatcher(B)-p53dim(X)-SpyTag(A)-IntC1-p53dim(X)-IntN1(BXA-IntC1-X-IntN1)：从N端到C端分别为反应基元SpyCatcher、缠结基元p53dim结构域、反应基元SpyTag、断裂内含肽C端部分IntC1、缠结基元p53dim结构域和断裂内含肽N端部分IntN1，其中SpyCatcher和第一个p53dim结构域之间插入了TEV蛋白酶的识别序列，SpyTag和IntC1之间插入了TVMV蛋白酶的识别序列，并在第二个p53dim结构域之前引入了组氨酸标签序列。BXA-IntC1-X-IntN1对应的基因序列如列表中SEQ ID No:8所示，其中第8-122位氨基酸残基为SpyCatcher，第132-138位氨基酸残基为TEV蛋白酶的识别序列，第186-198位氨基酸残基为SpyTag，第143-180位和第274-311位氨基酸残基为p53dim结构域，第205-211位氨基酸残基为TVMV蛋白酶的识别序列，第221-255位氨基酸残基为IntC1，第261-266位氨基酸残基为6×His标签，第319-420位氨基酸残基为IntN1。

(b)AffiHER2-SpyCatcher(B)-p53dim(X)-SpyTag(A)-AffiHER2-IntC1-p53dim(X)-IntN1(AffiHER2-BXA-AffiHER2-IntC1-X-IntN1)：从N端到C端分别为目的蛋白AffiHER2、反应基元SpyCatcher、缠结基元p53dim结构域、反应基元SpyTag、目的蛋白AffiHER2、断裂内含肽C端部分IntC1、缠结基元p53dim结构域和断裂内含肽N端部分IntN1，其中SpyCatcher和第一个p53dim结构域之间插入了TEV蛋白酶的识别序列，第二个AffiHER2和IntC1之间插入了TVMV蛋白酶的识别序列，并在第二个p53dim结构域之前引入了组氨酸标签序列。AffiHER2-BXA-AffiHER2-IntC1-X-IntN1对应的基因序列如列表中SEQID No:9所示，其中第6-75位和第279-348位氨基酸残基为AffiHER2，第82-196位氨基酸残基为SpyCatcher，第206-212位氨基酸残基为TEV蛋白酶的识别序列，第260-272位氨基酸残基为SpyTag，第217-254位和第424-461位氨基酸残基为p53dim结构域，第355-361位氨基酸残基为TVMV蛋白酶的识别序列，第371-405位氨基酸残基为IntC1，第411-416位氨基酸残基为6×His标签，第469-570位氨基酸残基为IntN1。

(c)IntC1-p53dim-SUMO-IntN1-IntC2-p53dim-IntN2(IntC1-X-SUMO-IntN1-IntC2-X-IntN2)：从N端到C端分别为断裂内含肽C端部分IntC1、缠结基元p53dim结构域、目的蛋白SUMO、断裂内含肽N端部分IntN1、断裂内含肽C端部分IntC2、缠结基元p53dim结构域和断裂内含肽N端部分IntN2，其中IntC1和第一个p53dim结构域之间插入了TEV蛋白酶的识别序列，IntN1和IntC2之间插入了TVMV蛋白酶的识别序列，并在第二个p53dim结构域之前引入了组氨酸标签序列。IntC1-XSUMO-IntN1-IntC2-X-IntN2对应的基因序列如列表中SEQID No:10所示，其中第8-42位氨基酸残基为IntC1，第48-54位氨基酸残基为TEV蛋白酶的识别序列，第62-99位和第358-395位氨基酸残基为p53dim结构域，第100-195位氨基酸残基为目标蛋白质SUMO，第203-304位氨基酸残基为IntN1，第311-317位氨基酸残基为TVMV蛋白酶的识别序列，第345-350位氨基酸残基为6×His，第326-339位氨基酸残基为IntC2，第403-504位氨基酸残基为IntN2。

(d)IntC1-p53dim-SUMO-IntN1-IntC2-p53dim-GFP-IntN2(IntC1-X-SUMO-IntN1-IntC2-X-GFP-IntN2)：从N端到C端分别为断裂内含肽C端部分IntC1、缠结基元p53dim结构域、目的蛋白质SUMO、断裂内含肽N端部分IntN1、断裂内含肽C端部分IntC2、缠结基元p53dim结构域、目的蛋白质GFP和断裂内含肽N端部分IntN2，其中IntC1和第一个p53dim结构域之间插入了TEV蛋白酶的识别序列，IntN1和IntC2之间插入了TVMV蛋白酶的识别序列，第二个p53dim结构域之前引入了组氨酸标签序列。IntC1-XSUMO-IntN1-IntC2-XGFP-IntN2对应的基因序列如列表中SEQ ID No:11所示，其中第8-42位氨基酸残基为IntC1，第48-54位氨基酸残基为TEV蛋白酶的识别序列，第62-99位和第358-395位氨基酸残基为p53dim结构域，第100-195位氨基酸残基为目标蛋白质SUMO，第203-304位氨基酸残基为IntN1，第311-317位氨基酸残基为TVMV蛋白酶的识别序列，第345-350位氨基酸残基为6×His，第326-339位氨基酸残基为IntC2，第403-640位氨基酸残基为目标蛋白质GFP，第643-765位氨基酸残基为IntN2。

本发明利用常规表征手段，如十二烷基磺酸钠-聚丙烯酰氨凝胶电泳(SDS-PAGE)、超高效液相色谱-质谱(LC-MS)以及TEV酶解反应对所制备的蛋白质异质索烃进行基本表征以及拓扑结构证明。

本发明基于合理的基因序列设计，结合原位组装、酶切和定点环化，发展了基于正交偶联的生物合成体系，适用于胞内合成多种功能蛋白质的异质索烃，其主要优势在于：1)通过基因编码的方式可以实现异质索烃的模块化合成，利用p53dim结构域等二聚缠结基元的分子内二聚提高蛋白质异质索烃的产量，相应的缠结基元和偶联手段有多种选择；2)模拟天然拓扑蛋白质合成中的多步翻译后修饰过程，直接在胞内完成多肽链缠结和两种正交的共价环化反应，不需要额外的胞外反应，表达纯化后即可得到相应的蛋白质异质索烃。3)在含多肽-蛋白质反应对的构建中，如BXA-IntC1-X-IntN1，通过在SpyCatcher的N端和SpyTag的C端引入其他折叠蛋白质，可以实现支化蛋白质异质索烃的生物合成；而在含两种正交断裂内含肽的构建中，如IntC1-X-POI1-IntN1-IntC2-X-POI2-IntN2，则实现了完全主链环化的蛋白质异质索烃的生物合成。两种体系均可以实现对现有蛋白质异质索烃结构的拓展。

附图说明

图1显示了本发明利用不同的正交偶联反应合成的部分蛋白质异质索烃的结构示意图，其中L_1-1/L_1-2与L_2-1/L_2-2代表两种正交环化方式的环化基元；当环化基元为多肽-蛋白质反应对时，发生侧链偶联，所形成的复合物分别为L₁和L₂，会存在于合成的异质索烃中；当环化基元为断裂内含肽时，发生主链偶联，环化后自剪接离去，不存在于合成的异质索烃中。

图2显示了本发明中两种代表性的利用正交偶联反应实现蛋白质异质索烃合成的示意图，其中：(a)由原位酶切、SpyTag-SpyCatcher反应对和断裂内含肽IntC1/IntN1介导蛋白质异质索烃的生物合成；(b)由两种正交断裂内含肽IntC1/IntN1和IntC2/IntN2介导蛋白质异质索烃的生物合成。

图3显示了实施例合成的蛋白质异质索烃cat-BXA-X的尺寸排阻色谱(a)，TEV酶切前后的SDS-PAGE表征结果(b)以及cat-BXA-X的质谱(c)。

图4显示了实施例合成的蛋白质异质索烃cat-(AffiHER2-BXA-AffiHER2)-X的尺寸排阻色谱(a)，TEV酶切前后的SDS-PAGE表征结果(b)以及cat-(AffiHER2-BXA-AffiHER2)-X的质谱(c)。

图5显示了实施例合成的蛋白质异质索烃cat-XSUMO-X的尺寸排阻色谱(a)，TEV酶切前后的SDS-PAGE表征结果(b)以及cat-XSUMO-X的质谱(c)。

图6显示了实施例合成的蛋白质异质索烃cat-XSUMO-XGFP的尺寸排阻色谱(a)，TEV酶切前后的SDS-PAGE表征结果(b)，cat-XSUMO-XGFP的质谱(c)。

图7显示了实施例合成的蛋白质异质索烃cat-BXA-X的TEV酶切产物l-BXA(a)和c-X(b)的质谱，cat-(AffiHER2-BXA-AffiHER2)-X的TEV酶切产物l-AffiHER2-BXA-AffiHER2(c)和c-X(d)的质谱以及cat-XSUMO-X的TEV酶切产物l-XSUMO(e)和c-X(f)的质谱。

具体实施方式

下面通过实施例进一步对本发明进行详细说明，但不以任何方式限制本发明的范围。

构建蛋白质异质索烃生物合成过程中蛋白质前体及其相应表达体系的具体步骤：

1)对于SpyTag-SpyCatcher反应对和断裂内含肽IntC1/IntN1共同介导蛋白质异质索烃合成的体系，利用重组基因工程技术构建含有6×His标签(用于蛋白质纯化)、SpyTag和SpyCatcher反应对、p53dim结构域、断裂内含肽IntC1/IntN1的基因序列，即SpyCatcher(B)-p53dim(X)-SpyTag(A)-IntC1-p53dim(X)-IntN1(BXA-IntC1-X-IntN1)。在该基因序列的基础上，进一步在SpyCatcher的N端和SpyTag的C端分别引入折叠蛋白质AffiHER2，构建AffiHER2-SpyCatcher(B)-p53dim(X)-SpyTag(A)-AffiHER2-IntC1-p53dim(X)-IntN1(AffiHER2-BXA-AffiHER2-IntC1-X-IntN1)的基因序列。将这两种基因序列分别插入表达载体pMSCG19中，转入含有pRK1037质粒的BL21(DE3)感受态细胞进行表达，其中pRK1037质粒可以编码TVMV蛋白酶。在表达过程中，通过原位组装、酶切和定点环化，实现蛋白质异质索烃cat-BXA-X和cat-(AffiHER2-BXA-AffiHER2)-X的生物合成。

2)对于正交断裂内含肽介导蛋白质异质索烃合成的体系，利用重组基因工程技术构建含有6×His标签(用于蛋白质纯化)、p53dim结构域、断裂内含肽IntC1/IntN1、断裂内含肽IntC2/IntN2和目的蛋白SUMO/GFP的基因序列，即IntC1-p53dim-SUMO-IntN1-IntC2-p53dim-IntN2(IntC1-X-SUMO-IntN1-IntC2-X-IntN2)，或者IntC1-p53dim-SUMO-IntN1-IntC2-p53dim-GFP-IntN2(IntC1-X-SUMO-IntN1-IntC2-X-GFP-IntN2)。将这两种基因序列分别插入表达载体pMSCG19中，转入BL21(DE3)感受态细胞进行表达。在表达过程中，通过原位组装和正交断裂内含肽介导的环化反应，实现蛋白质异质索烃cat-XSUMO-X和cat-XSUMO-XGFP的生物合成。

利用十二烷基磺酸钠-聚丙烯酰氨凝胶电泳(SDS-PAGE)、超高效液相色谱-质谱(LC-MS)以及TEV酶解反应对所制备的蛋白质异质索烃进行基本表征以及拓扑结构证明。

实施例1：利用pMCSG19/pRK1037的共表达体系实现蛋白质异质索烃cat-BXA-X和cat-(AffiHER2-BXA-AffiHER2)-X的生物合成

将BXA-IntC1-X-IntN1和AffiHER2-BXA-AffiHER2-IntC1-X-IntN1的基因片段分别插入表达载体pMCSG19中，其序列分别如列表中SEQ ID No:8和SEQ ID No:9所示。所得构建经测序确认后，转入含有pRK1037质粒的BL21(DE3)感受态细胞中，利用含有100μg/mL氨苄青霉素钠和50μg/mL卡那霉素的双抗性平板在37℃进行过夜培养。随后挑出单克隆菌落，接种至5mL含有相同抗性的2×YT培养基中，在37℃震荡培养10-12小时制备种子菌液。将该种子菌液按1:100比例接种到250mL含有相同抗性的2×YT培养基中，在37℃震荡培养至OD₆₀₀在0.5-0.7之间，加入异丙基-β-D-硫代吡喃半乳糖苷(IPTG)至终浓度为0.25mM，转至16℃表达20小时。

实施例2：蛋白质异质索烃cat-XSUMO-X和cat-XSUMO-XGFP的生物合成

将IntC1-X-SUMO-IntN1-IntC2-X-IntN2和IntC1-X-SUMO-IntN1-IntC2-X-GFP-IntN2的基因片段分别插入表达载体pMCSG19中，其序列分别如列表中SEQ ID No:10和SEQID No:11所示。所得构建经测序确认后，转入BL21(DE3)感受态细胞中，利用含有100μg/mL氨苄青霉素钠的平板在37℃进行过夜培养。随后挑出单克隆菌落，接种至5mL含有相同抗性的2×YT培养基中，在37℃震荡培养10-12小时制备种子菌液。将该种子菌液按1:100比例接种到250mL含有相同抗性的2×YT培养基中，在37℃震荡培养至OD₆₀₀在0.5-0.7之间，加入异丙基-β-D-硫代吡喃半乳糖苷(IPTG)至终浓度为0.5mM，转至16℃表达20小时。

实施例3：蛋白质异质索烃的纯化

蛋白质表达结束后，用高速冷冻离心机离心收集菌体(5500g×15min)，弃去上清液。将菌体用裂解缓冲液A(50mM磷酸二氢钠，300mM氯化钠，10mM咪唑，pH 8.0)重悬。重悬液在冰水浴条件下用超声波细胞破碎仪超声破碎(工作5秒，间隔5秒，强度30％)，随后离心收集上清液(12000g×30min)。取上清液与Ni-NTA树脂混合均匀并在4℃孵育1h。将该混合液倒入纯化用PD-10重力空柱中，待裂解液流尽后，用5-10倍树脂体积的洗涤缓冲液B(50mM磷酸二氢钠，300mM氯化钠，20mM咪唑，pH 8.0)冲洗树脂以减少非特异性吸附。对于蛋白质异质索烃cat-BXA-X、cat-(AffiHER2-BXA-AffiHER2)-X和cat-XSUMO-X，可以直接用洗脱缓冲液C(50mM磷酸二氢钠，300mM氯化钠，250mM咪唑，pH 8.0)进行洗脱。对于蛋白质异质索烃cat-XSUMO-XGFP，为了提高其纯度，采取梯度洗脱的方式，首先用洗脱缓冲液D(50mM磷酸二氢钠，300mM氯化钠，50mM咪唑，pH 8.0)进行洗脱～10个树脂体积，收集的蛋白质洗脱液基本为异质索烃，再用洗脱缓冲液C洗脱GFP的环状或索烃副产物。

蛋白质洗脱液利用快速纯化液相色谱系统( pure,GE Healthcare)和尺寸排阻色谱柱(Superdex 200 increase 10/300GL,GE Healthcare)进行进一步纯化，流动相为经过0.22μm滤膜过滤的磷酸盐缓冲液PBS(pH 7.4)，流速为0.5mL/min，通过280nm的紫外吸收监测蛋白质的流出峰，收集样品进行表征。

实施例4：蛋白质异质索烃的表征

对于实施例3中纯化得到的蛋白质异质索烃，首先加入5×SDS上样缓冲液，并于98℃加热10min，然后进行SDS-PAGE表征。将SEC纯化后的蛋白质样品用超滤管置换至ddH₂O中后，利用LC-MS对其分子量进行表征。通过超微量分光光度计(NanoPhotometer P330,Implen,Inc.)测定蛋白质的浓度。为了进行异质索烃的拓扑结构证明，将蛋白质溶液(10μM)与10μM TEV蛋白酶以20:1的摩尔比混合，在37℃条件下进行酶切(1、3、6小时，3小时基本可以酶切完全)。酶切结束后，取10μL加入5×SDS上样缓冲液，并于98℃条件下加热10min终止反应，利用SDS-PAGE表征酶切之后的产物组成。利用超滤管将剩余的酶切体系置换至ddH₂O中后，利用LC-MS进行分子量确认。cat-BXA-X、cat-(AffiHER2-BXA-AffiHER2)-X、cat-XSUMO-X和cat-XSUMO-XGFP经镍柱亲和纯化后的SEC表征，酶切前后的SDS-PAGE表征以及LC-MS表征结果分别如图3、4、5和6所示。cat-BXA-X、cat-(AffiHER2-BXA-AffiHER2)-X和cat-XSUMO-X经TEV酶切后酶切产物的LC-MS表征如图7所示。

SEQUENCE LISTING

<110> 北京大学

<120> 一种蛋白质异质索烃的生物合成方法

<130> WX2020-03-059

<160> 11

<170> PatentIn version 3.5

<210> 1

<211> 13

<212> PRT

<213> 人工序列

<400> 1

Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

1 5 10

<210> 2

<211> 115

<212> PRT

<213> 人工序列

<400> 2

Ala Met Val Asp Thr Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser

1 5 10 15

Gly Asp Met Thr Ile Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser

20 25 30

Lys Arg Asp Glu Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu

35 40 45

Arg Asp Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln

50 55 60

Val Lys Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr

65 70 75 80

Ala Ala Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val

85 90 95

Asn Glu Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp

100 105 110

Ala His Ile

115

<210> 3

<211> 38

<212> PRT

<213> 人工序列

<400> 3

Gly Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe Glu

1 5 10 15

Glu Phe Arg Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln Ala

20 25 30

Gly Lys Glu Pro Gly Gly

<210> 4

<211> 35

<212> PRT

<213> 人工序列

<400> 4

Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp

1 5 10 15

Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile

20 25 30

Ala Ser Asn

<210> 5

<211> 102

<212> PRT

<213> 人工序列

<400> 5

Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu

1 5 10 15

Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser

20 25 30

Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His

35 40 45

Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser

50 55 60

Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln

65 70 75 80

Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg

85 90 95

Val Asp Asn Leu Pro Asn

100

<210> 6

<211> 14

<212> PRT

<213> 人工序列

<400> 6

Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn

1 5 10

<210> 7

<211> 123

<212> PRT

<213> 人工序列

<400> 7

Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu

1 5 10 15

Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser

20 25 30

Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His

35 40 45

Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser

50 55 60

Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln

65 70 75 80

Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg

85 90 95

Val Asp Asn Leu Pro Asn Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly

100 105 110

Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg

115 120

<210> 8

<211> 420

<212> PRT

<213> 人工序列

<400> 8

Met Lys Gly Ser Ser Ala Ser Ala Met Val Asp Thr Leu Ser Gly Leu

1 5 10 15

Ser Ser Glu Gln Gly Gln Ser Gly Asp Met Thr Ile Glu Glu Asp Ser

20 25 30

Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp Gly Lys Glu Leu

35 40 45

Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly Lys Thr Ile Ser

50 55 60

Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr Leu Tyr Pro Gly

65 70 75 80

Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly Tyr Glu Val Ala

85 90 95

Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln Val Thr Val Asn

100 105 110

Gly Lys Ala Thr Lys Gly Asp Ala His Ile Asp Gly Pro Gln Gly Ile

115 120 125

Trp Gly Gln Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Ser Gly Gly

130 135 140

Glu Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe Glu Glu Phe

145 150 155 160

Arg Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln Ala Gly Lys

165 170 175

Glu Pro Gly Gly Ser Gly Gly Ser Gly Ala His Ile Val Met Val Asp

180 185 190

Ala Tyr Lys Pro Thr Lys Val Asp Ser Gly Ser Gly Glu Thr Val Arg

195 200 205

Phe Gln Gly Gly Gly Ser Gly Gly Ser Ser Gly Met Ile Lys Ile Ala

210 215 220

Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu

225 230 235 240

Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn Cys

245 250 255

Phe Asn Gly Gly His His His His His His Glu Leu Ser Gly Ser Gly

260 265 270

Ser Gly Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe

275 280 285

Glu Glu Phe Arg Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln

290 295 300

Ala Gly Lys Glu Pro Gly Gly Ser Gly Gly Ser Gly Thr Ser Cys Leu

305 310 315 320

Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu Pro Ile

325 330 335

Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser Val Asp

340 345 350

Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His Asp Arg

355 360 365

Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser Leu Ile

370 375 380

Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln Met Leu

385 390 395 400

Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg Val Asp

405 410 415

Asn Leu Pro Asn

420

<210> 9

<211> 570

<212> PRT

<213> 人工序列

<400> 9

Met Lys Gly Ser Ser Thr Gly Gly Gln Gln Met Gly Arg Asp Pro Gly

1 5 10 15

Val Asp Asn Lys Phe Asn Lys Glu Met Arg Asn Ala Tyr Trp Glu Ile

20 25 30

Ala Leu Leu Pro Asn Leu Asn Asn Gln Gln Lys Arg Ala Phe Ile Arg

35 40 45

Ser Leu Tyr Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala

50 55 60

Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys Gly Gly Gly Gly Ser Ala

65 70 75 80

Ser Ala Met Val Asp Thr Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln

85 90 95

Ser Gly Asp Met Thr Ile Glu Glu Asp Ser Ala Thr His Ile Lys Phe

100 105 110

Ser Lys Arg Asp Glu Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu

115 120 125

Leu Arg Asp Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly

130 135 140

Gln Val Lys Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu

145 150 155 160

Thr Ala Ala Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr

165 170 175

Val Asn Glu Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly

180 185 190

Asp Ala His Ile Asp Gly Pro Gln Gly Ile Trp Gly Gln Glu Asn Leu

195 200 205

Tyr Phe Gln Gly Gly Ser Gly Ser Gly Gly Glu Tyr Phe Thr Leu Gln

210 215 220

Ile Arg Gly Arg Glu Arg Phe Glu Glu Phe Arg Glu Lys Asn Glu Ala

225 230 235 240

Leu Glu Leu Lys Asp Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Gly

245 250 255

Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

260 265 270

Gly Thr Gly Gly Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Pro

275 280 285

Gly Val Asp Asn Lys Phe Asn Lys Glu Met Arg Asn Ala Tyr Trp Glu

290 295 300

Ile Ala Leu Leu Pro Asn Leu Asn Asn Gln Gln Lys Arg Ala Phe Ile

305 310 315 320

Arg Ser Leu Tyr Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu

325 330 335

Ala Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys Gly Val Asp Ser Gly

340 345 350

Ser Gly Glu Thr Val Arg Phe Gln Gly Gly Gly Ser Gly Gly Ser Ser

355 360 365

Gly Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val

370 375 380

Tyr Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly

385 390 395 400

Phe Ile Ala Ser Asn Cys Phe Asn Gly Gly His His His His His His

405 410 415

Glu Leu Ser Gly Ser Gly Ser Gly Gly Glu Tyr Phe Thr Leu Gln Ile

420 425 430

Arg Gly Arg Glu Arg Phe Glu Glu Phe Arg Glu Lys Asn Glu Ala Leu

435 440 445

Glu Leu Lys Asp Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Gly Gly

450 455 460

Ser Gly Thr Ser Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu

465 470 475 480

Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys

485 490 495

Thr Val Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val

500 505 510

Ala Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu

515 520 525

Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr

530 535 540

Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu

545 550 555 560

Asp Leu Met Arg Val Asp Asn Leu Pro Asn

565 570

<210> 10

<211> 525

<212> PRT

<213> 人工序列

<400> 10

Met Lys Gly Ser Ser Ala Ser Ile Lys Ile Ala Thr Arg Lys Tyr Leu

1 5 10 15

Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg Asp His Asn Phe

20 25 30

Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn Cys Phe Asn Gly Gly Glu

35 40 45

Asn Leu Tyr Phe Gln Gly Arg Ser Ser Gly Ser Gly Ser Gly Gly Glu

50 55 60

Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe Glu Glu Phe Arg

65 70 75 80

Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln Ala Gly Lys Glu

85 90 95

Pro Gly Gly Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys

100 105 110

Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly

115 120 125

Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg

130 135 140

Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu

145 150 155 160

Arg Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp Gln Thr Pro Glu

165 170 175

Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln

180 185 190

Ile Gly Gly Ser Gly Gly Ser Gly Gly Thr Cys Leu Ser Tyr Glu Thr

195 200 205

Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val

210 215 220

Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser Val Asp Asn Asn Gly Asn

225 230 235 240

Ile Tyr Thr Gln Pro Val Ala Gln Trp His Asp Arg Gly Glu Gln Glu

245 250 255

Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys

260 265 270

Asp His Lys Phe Met Thr Val Asp Gly Gln Met Leu Pro Ile Asp Glu

275 280 285

Ile Phe Glu Arg Glu Leu Asp Leu Met Arg Val Asp Asn Leu Pro Asn

290 295 300

Val Asp Ser Gly Ser Gly Glu Thr Val Arg Phe Gln Gly Gly Gly Ser

305 310 315 320

Gly Gly Ser Ser Gly Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile

325 330 335

Ala Ser Asn Cys Phe Asn Gly Gly His His His His His His Glu Leu

340 345 350

Ser Gly Ser Gly Ser Gly Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly

355 360 365

Arg Glu Arg Phe Glu Glu Phe Arg Glu Lys Asn Glu Ala Leu Glu Leu

370 375 380

Lys Asp Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Gly Gly Ser Gly

385 390 395 400

Thr Ser Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly

405 410 415

Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val

420 425 430

Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln

435 440 445

Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp

450 455 460

Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp

465 470 475 480

Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu

485 490 495

Met Arg Val Asp Asn Leu Pro Asn Ile Lys Ile Ala Thr Arg Lys Tyr

500 505 510

Leu Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg

515 520 525

<210> 11

<211> 765

<212> PRT

<213> 人工序列

<400> 11

Met Lys Gly Ser Ser Ala Ser Ile Lys Ile Ala Thr Arg Lys Tyr Leu

1 5 10 15

Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg Asp His Asn Phe

20 25 30

Ala Leu Lys Asn Gly Phe Ile Ala Ser Asn Cys Phe Asn Gly Gly Glu

35 40 45

Asn Leu Tyr Phe Gln Gly Arg Ser Ser Gly Ser Gly Ser Gly Gly Glu

50 55 60

Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu Arg Phe Glu Glu Phe Arg

65 70 75 80

Glu Lys Asn Glu Ala Leu Glu Leu Lys Asp Ala Gln Ala Gly Lys Glu

85 90 95

Pro Gly Gly Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys

100 105 110

Pro Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly

115 120 125

Ser Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg

130 135 140

Leu Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu

145 150 155 160

Arg Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp Gln Thr Pro Glu

165 170 175

Asp Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln

180 185 190

Ile Gly Gly Ser Gly Gly Ser Gly Gly Thr Cys Leu Ser Tyr Glu Thr

195 200 205

Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val

210 215 220

Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser Val Asp Asn Asn Gly Asn

225 230 235 240

Ile Tyr Thr Gln Pro Val Ala Gln Trp His Asp Arg Gly Glu Gln Glu

245 250 255

Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys

260 265 270

Asp His Lys Phe Met Thr Val Asp Gly Gln Met Leu Pro Ile Asp Glu

275 280 285

Ile Phe Glu Arg Glu Leu Asp Leu Met Arg Val Asp Asn Leu Pro Asn

290 295 300

Val Asp Ser Gly Ser Gly Glu Thr Val Arg Phe Gln Gly Gly Gly Ser

305 310 315 320

Gly Gly Ser Ser Gly Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile

325 330 335

Ala Ser Asn Cys Phe Asn Gly Gly His His His His His His Glu Leu

340 345 350

Ser Gly Ser Gly Ser Gly Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly

355 360 365

Arg Glu Arg Phe Glu Glu Phe Arg Glu Lys Asn Glu Ala Leu Glu Leu

370 375 380

Lys Asp Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Gly Gly Ser Gly

385 390 395 400

Thr Ser Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile

405 410 415

Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg

420 425 430

Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe

435 440 445

Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr

450 455 460

Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met

465 470 475 480

Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln

485 490 495

Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala

500 505 510

Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys

515 520 525

Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu

530 535 540

Tyr Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys

545 550 555 560

Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly

565 570 575

Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp

580 585 590

Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Val

595 600 605

Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu

610 615 620

Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys

625 630 635 640

Thr Ser Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly

645 650 655

Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val

660 665 670

Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln

675 680 685

Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp

690 695 700

Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp

705 710 715 720

Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu

725 730 735

Met Arg Val Asp Asn Leu Pro Asn Ile Lys Ile Ala Thr Arg Lys Tyr

740 745 750

Leu Gly Lys Gln Asn Val Tyr Asp Ile Gly Val Glu Arg

755 760 765

31页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：miRNA表达载体及其应用

一种蛋白质异质索烃的生物合成方法

相关技术

网友询问留言