一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法

文档序号:1646955 发布日期:2019-12-24 浏览:44次 >En<

阅读说明:本技术 一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法 (Biosynthesis method of nicotinamide adenine dinucleotide compound ) 是由 陈义华 丁勇 于 2018-06-14 设计创作,主要内容包括:本发明公开了一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法。本发明提供的合成路径以分支酸为起点,在PhzD蛋白的作用下经过转氨重排反应生成氨基脱氧异分支酸,氨基脱氧异分支酸在PhzE蛋白的催化下脱去丙酮酸部分生成2,3-二氢-3-羟基邻氨基苯甲酸,采用特定酶将2,3-二氢-3-羟基邻氨基苯甲酸催化生成3-羟基邻氨基苯甲酸,在nabC蛋白的作用下3-羟基邻氨基苯甲酸通过氧化开环重排反应生成喹啉酸,随后进入NAD补救途径,完成NAD的合成。本发明解除了NAD合成与色氨酸或天冬氨酸合成的耦联,同时,分支酸广泛存在于各种生命形式中,且对其他生命必需代谢途径的影响较小。(The invention discloses a biosynthesis method of nicotinamide adenine dinucleotide compounds. The synthesis path provided by the invention takes chorismate as a starting point, amino-deoxy-isochorismate is generated through transamination rearrangement reaction under the action of PhzD protein, the amino-deoxy-isochorismate removes part of pyruvic acid under the catalysis of PhzE protein to generate 2, 3-dihydro-3-hydroxy-anthranilic acid, 2, 3-dihydro-3-hydroxy-anthranilic acid is catalyzed by specific enzyme to generate 3-hydroxy-anthranilic acid, the 3-hydroxy-anthranilic acid generates quinolinic acid through oxidation ring-opening rearrangement reaction under the action of nabC protein, and then the quinolinic acid enters NAD remediation pathway to complete the synthesis of NAD. The invention decouples NAD synthesis from tryptophan or aspartate synthesis, and meanwhile, the branched acid is widely present in various life forms and has small influence on other vital metabolic pathways.)

一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法

技术领域

本发明涉及一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法。

背景技术

烟酰胺腺嘌呤二核苷酸(NAD+,辅酶Ⅰ)和它相应的还原形态NADH是所有生命活动必不可少的辅酶之一,它们作为质子的受体或供体参与了多种生物体内的氧化还原反应。另外,在细胞的生长、分化、调节和疾病等非氧化还原生命过程中,NAD+同样起到非常重要的作用,如参与衰老相关的组蛋白脱乙酰化反应、DNA修复过程中发挥重要作用的聚腺苷二磷酸核糖反应、调控钙离子通道的腺苷二磷酸核糖环化反应等。近年来,越来越多的研究表明,体内NAD的减少是衰老的一个重要原因。在一些发酵产业和生物转化中,NAD+(NADH)的添加可以提高产品的转化效率。

在生物体内,NAD的生物合成包括从头合成途径和补救途径。NAD的补救途径广泛存在于各种生物体内,主要指生物通过直接摄取(如动物从食物中获取、细菌从培养基中摄取等)并利用烟酸及烟酰胺作为前体来合成NAD的过程。生物中已知的NAD从头合成有两条途径:a.天冬氨酸途径;b.色氨酸-犬尿酸途径。一般情况下,细菌和植物(包括部分古菌)中NAD的从头合成利用的是天冬氨酸途径:天冬氨酸在天冬氨酸氧化酶的作用下形成α-亚胺琥珀酸,接着在喹啉酸合酶作用下与磷酸二羟丙酮发生缩合生产喹啉酸,随后喹啉酸在喹啉酸磷酸转移酶的作用下与焦磷酸核糖反应生成烟酸单核苷酸(NAMN)进入补救途径合成NAD。在酵母和哺乳动物等真核生物中,NAD一般是以色氨酸为前体从头合成的:色氨酸经过犬尿酸途径降解生成3-羟基邻氨基苯甲酸后,3,4位双加氧重排缩合形成喹啉酸,经过与天冬氨酸类似的方式进入NAD的补救合成途径合成NAD类化合物。

生物在通过上述两条从头合成途径合成NAD类化合物时,需要消耗合成蛋白质的氨基酸(色氨酸或天冬氨酸),这从一定程度上限制了这类化合物在生物体内的浓度,导致目前通过酵母发酵生产这类化合物成本较高。另外,通过体外酶催化转化法制备NAD需要纯化相应的蛋白酶和消耗昂贵的前体ATP,生产成本也很高。通过化学全合成生产NAD的方法还未见报道。

发明内容

本发明的目的是提供一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法。

本发明提供了一种合成喹啉酸的方法(方法甲),包括如下步骤:

(1)以分支酸为起始物,经过转氨重排反应生成氨基脱氧异分支酸;

(2)氨基脱氧异分支酸脱去丙酮酸部分生成2,3-二氢-3-羟基邻氨基苯甲酸;

(3)2,3-二氢-3-羟基邻氨基苯甲酸脱氢生成3-羟基邻氨基苯甲酸;

(4)3-羟基邻氨基苯甲酸通过氧化开环重排反应生成喹啉酸。

本发明还保护一种烟酰胺腺嘌呤二核苷酸的合成方法(方法乙),包括如下步骤:

(a)按方法甲制备得到喹啉酸;

(b)喹啉酸在喹啉酸磷酸转移酶的作用下与焦磷酸核糖反应生成烟酸单核苷酸;

(c)利用烟酰胺腺嘌呤二核苷酸的补救合成途径,完成从烟酸单核苷酸到烟酰胺腺嘌呤二核苷酸的制备。

本发明还保护一种烟酰胺腺嘌呤二核苷酸磷酸的合成方法(方法丙),包括如下步骤:

(I)按方法乙制备得到烟酰胺腺嘌呤二核苷酸;

(Ⅱ)烟酰胺腺嘌呤二核苷酸在烟酰胺腺嘌呤二核苷酸激酶催化下与ATP反应生成烟酰胺腺嘌呤二核苷酸磷酸。

以上任一所述烟酰胺腺嘌呤二核苷酸的补救合成途径具体可为烟酸单核苷酸在其腺苷转移酶催化下与ATP反应生成烟酸腺嘌呤二核苷酸,烟酸腺嘌呤二核苷酸在烟酰胺腺嘌呤二核苷酸合酶催化下合成烟酰胺腺嘌呤二核苷酸。

所述步骤(1)中,采用2-氨基-4-脱氧分支酸合酶催化分支酸转氨重排生成氨基脱氧异分支酸;

所述步骤(2)中,采用2,3-二氢-3-羟基邻氨基苯甲酸合酶催化氨基脱氧异分支酸脱去丙酮酸部分生成2,3-二氢-3-羟基邻氨基苯甲酸;

所述步骤(3)中,采用DHHA-2,3-脱氢酶催化2,3-二氢-3-羟基邻氨基苯甲酸脱氢生成3-羟基邻氨基苯甲酸;

所述步骤(4)中,采用3-羟基邻氨基苯甲酸-3,4-双加氧酶催化3-羟基邻氨基苯甲酸氧化开环重排反应生成喹啉酸。

本发明还保护以上任一所述DHHA-2,3-脱氢酶在催化2,3-二氢-3-羟基邻氨基苯甲酸脱氢生成3-羟基邻氨基苯甲酸中的应用。

本发明还保护以上任一所述的2-氨基-4-脱氧分支酸合酶和/或2,3-二氢-3-羟基邻氨基苯甲酸合酶和/或DHHA-2,3-脱氢酶和/或3-羟基邻氨基苯甲酸-3,4-双加氧酶在烟酰胺腺嘌呤二核苷酸类化合物合成中的应用。

本发明还保护一种合成3-羟基邻氨基苯甲酸的方法(方法丁),包括如下步骤:利用以上任一所述的DHHA-2,3-脱氢酶催化2,3-二氢-3-羟基邻氨基苯甲酸脱氢生成3-羟基邻氨基苯甲酸。

一种烟酰胺腺嘌呤二核苷酸类化合物的合成方法(方法戊),包括如下步骤:将出发生物体构建成能够实现方法甲所述合成途径的重组生物体,利用该重组生物体合成得到烟酰胺腺嘌呤二核苷酸类化合物;所述重组生物体能够完成如下反应:

(b1)喹啉酸与焦磷酸核糖反应生成烟酸单核苷酸;

(b2)烟酰胺腺嘌呤二核苷酸的补救合成;

(b3)烟酰胺腺嘌呤二核苷酸与ATP反应生成烟酰胺腺嘌呤二核苷酸磷酸。

所述方法戊包括如下步骤:向出发生物体中导入2-氨基-4-脱氧分支酸合酶的编码基因、2,3-二氢-3-羟基邻氨基苯甲酸合酶的编码基因、DHHA-2,3-脱氢酶的编码基因和3-羟基邻氨基苯甲酸-3,4-双加氧酶的编码基因,得到重组生物体,利用该重组生物体合成得到烟酰胺腺嘌呤二核苷酸类化合物。

所述“向出发生物体中导入2-氨基-4-脱氧分支酸合酶的编码基因、2,3-二氢-3-羟基邻氨基苯甲酸合酶的编码基因、DHHA-2,3-脱氢酶的编码基因和3-羟基邻氨基苯甲酸-3,4-双加氧酶的编码基因”具体可通过向含有分支酸代谢途径的生命体系中导入表达2-氨基-4-脱氧分支酸合酶的编码基因、2,3-二氢-3-羟基邻氨基苯甲酸合酶的编码基因、DHHA-2,3-脱氢酶的编码基因和3-羟基邻氨基苯甲酸-3,4-双加氧酶的编码基因的重组表达载体实现。

所述重组表达载体具体可为pXB1a-QA,pXB1a-QA的制备方法具体可为:采用序列3所示的双链DNA分子替代质粒pXB1a的NcoⅠ和EcoRⅠ酶切位点之间的片段,得到质粒pXB1a-HAA。将序列4所示的双链DNA分子***质粒pXB1a-HAA的NcoⅠ酶切位点,得到重组质粒pXB1a-QA。

本发明还保护一种重组生物体,其能够实现方法甲所述合成途径,并且所述重组生物体能够完成如下反应:

(b1)喹啉酸与焦磷酸核糖反应生成烟酸单核苷酸;

(b2)烟酰胺腺嘌呤二核苷酸的补救合成;

(b3)烟酰胺腺嘌呤二核苷酸与ATP反应生成烟酰胺腺嘌呤二核苷酸磷酸。

所述重组生物体具体可为向出发生物体中导入2-氨基-4-脱氧分支酸合酶的编码基因、2,3-二氢-3-羟基邻氨基苯甲酸合酶的编码基因、DHHA-2,3-脱氢酶的编码基因和3-羟基邻氨基苯甲酸-3,4-双加氧酶的编码基因得到的重组生物体。

所述“向出发生物体中导入2-氨基-4-脱氧分支酸合酶的编码基因、2,3-二氢-3-羟基邻氨基苯甲酸合酶的编码基因、DHHA-2,3-脱氢酶的编码基因和3-羟基邻氨基苯甲酸-3,4-双加氧酶的编码基因”具体可通过向含有分支酸代谢途径的生命体系中导入表达2-氨基-4-脱氧分支酸合酶的编码基因、2,3-二氢-3-羟基邻氨基苯甲酸合酶的编码基因、DHHA-2,3-脱氢酶的编码基因和3-羟基邻氨基苯甲酸-3,4-双加氧酶的编码基因的重组表达载体实现。

所述重组表达载体具体可为pXB1a-QA,pXB1a-QA的制备方法具体可为:采用序列3所示的双链DNA分子替代质粒pXB1a的NcoⅠ和EcoRⅠ酶切位点之间的片段,得到质粒pXB1a-HAA。将序列4所示的双链DNA分子***质粒pXB1a-HAA的NcoⅠ酶切位点,得到重组质粒pXB1a-QA。

以上任一所述重组生物体为含有分支酸或者能够体内合成分支酸的生物体。

以上任一所述出发生物体具体可为原核生物、植物或真菌,更具体可为大肠杆菌。

所述大肠杆菌具体可为消除nadA基因和nadB基因的大肠杆菌。

本发明还保护以上任一所述重组生物体在合成烟酰胺腺嘌呤二核苷酸类化合物中的应用。

以上任一所述烟酰胺腺嘌呤二核苷酸类化合物具体可为烟酰胺腺嘌呤二核苷酸(NAD)或烟酰胺腺嘌呤二核苷酸磷酸(NADP),还包括二者的还原形态NADH和NADPH。

以上任一所述分支酸为式(I)所示的化合物。

以上任一所述氨基脱氧异分支酸为式(Ⅱ)所示的化合物。

以上任一所述2,3-二氢-3-羟基邻氨基苯甲酸为式(Ⅲ)所示的化合物。

以上任一所述3-羟基邻氨基苯甲酸为式(Ⅳ)所示的化合物。

以上任一所述喹啉酸为式(Ⅴ)所示的化合物。

以上任一所述DHHA-2,3-脱氢酶可为经过特定酶促反应催化2,3-二氢-3-羟基邻氨基苯甲酸生成3-羟基邻氨基苯甲酸的酶。

所述酶促反应中包括NAD+、2,3-二氢-3-羟基邻氨基苯甲酸和待测酶溶液。

所述酶促反应体系具体可包括50mM PBS(pH 7.4)、2mM NAD+、2mM DHHA和10μM酶溶液。所述酶促反应条件具体可30℃水浴1h。

具体可通过HPLC检测是否生成3-羟基邻氨基苯甲酸。

以上任一所述DHHA-2,3-脱氢酶以NAD+作为辅因子可以催化2,3-二氢-3-羟基邻氨基苯甲酸脱氢生成3-羟基邻氨基苯甲酸。

以上任一所述DHHA-2,3-脱氢酶为脱氢酶A或脱氢酶B或脱氢酶C或脱氢酶D或脱氢酶E或脱氢酶F或脱氢酶G。

所述脱氢酶A是如下(a1)或(a2):

(a1)由序列表中序列2所示的氨基酸序列组成的蛋白质;

(a2)将序列2的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列2衍生的蛋白质。

所述脱氢酶B是如下(a3)或(a4):

(a3)由序列表中序列11所示的氨基酸序列组成的蛋白质;

(a4)将序列11的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列11衍生的蛋白质。

所述脱氢酶C是如下(a5)或(a6):

(a5)由序列表中序列12所示的氨基酸序列组成的蛋白质;

(a6))将序列12的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列12衍生的蛋白质。

所述脱氢酶D是如下(a7)或(a8):

(a7)由序列表中序列13所示的氨基酸序列组成的蛋白质;

(a8)将序列13的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列13衍生的蛋白质。

所述脱氢酶E是如下(a9)或(a10):

(a9)由序列表中序列14所示的氨基酸序列组成的蛋白质;

(a10)将序列14的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列14衍生的蛋白质。

所述脱氢酶F是如下(a11)或(a12):

(a11)由序列表中序列15所示的氨基酸序列组成的蛋白质;

(a12)将序列15的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列15衍生的蛋白质。

所述脱氢酶G是如下(a13)或(a14):

(a13)由序列表中序列16所示的氨基酸序列组成的蛋白质;

(a14)将序列16的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列16衍生的蛋白质。

以上任一所述2-氨基-4-脱氧分支酸合酶具体可为PhzD蛋白。所述PhzD蛋白是如下(b1)或(b2):

(b1)由序列表中序列17所示的氨基酸序列组成的蛋白质;

(b2)将序列17的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列17衍生的蛋白质。

以上任一所述2,3-二氢-3-羟基邻氨基苯甲酸合酶具体可为PhzE蛋白。所述PhzE蛋白是如下(c1)或(c2):

(c1)由序列表中序列18所示的氨基酸序列组成的蛋白质;

(c2)将序列18的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列18衍生的蛋白质。

以上任一所述3-羟基邻氨基苯甲酸-3,4-双加氧酶具体可为NabC。所述NabC蛋白是如下(d1)或(d2):

(d1)由序列表中序列19所示的氨基酸序列组成的蛋白质;

(d2)将序列19的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列19衍生的蛋白质。

以上任一所述2-氨基-4-脱氧分支酸合酶的编码基因具体可为如下(e1)或(e2)或(e3)或(e4):

(e1)其编码区如序列表的序列3自5’端第818-1841位所示的DNA分子;

(e2)序列3自5’端第818-1841位所示的DNA分子;

(e3)在严格条件下与(e1)或(e2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(e4)与(e1)或(e2)或(e3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述2,3-二氢-3-羟基邻氨基苯甲酸合酶的编码基因具体可为如下(f1)或(f2)或(f3)或(f4):

(f1)其编码区如序列表的序列3自5’端第1467至3350位所示的DNA分子;

(f2)序列3自5’端第1467至3350位所示的DNA分子;

(f3)在严格条件下与(f1)或(f2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(f4)与(f1)或(f2)或(f3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述DHHA-2,3-脱氢酶的编码基因具体可为如下(g1)或(g2)或(g3)或(g4):

(g1)其编码区如序列表的序列1所示的DNA分子;

(g2)序列1所示的DNA分子;

(g3)在严格条件下与(g1)或(g2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(g4)与(g1)或(g2)或(g3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述DHHA-2,3-脱氢酶的编码基因具体可为如下(h1)或(h2)或(h3)或(h4):

(h1)其编码区如序列表的序列5所示的DNA分子;

(h2)序列5所示的DNA分子;

(h3)在严格条件下与(h1)或(h2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(h4)与(h1)或(h2)或(h3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述DHHA-2,3-脱氢酶的编码基因具体可为如下(i1)或(i2)或(i3)或(i4):

(i1)其编码区如序列表的序列6所示的DNA分子;

(i2)序列6所示的DNA分子;

(i3)在严格条件下与(i1)或(i2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(i4)与(i1)或(i2)或(i3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述DHHA-2,3-脱氢酶的编码基因具体可为如下(j1)或(j2)或(j3)或(j4):

(j1)其编码区如序列表的序列7所示的DNA分子;

(j2)序列7所示的DNA分子;

(j3)在严格条件下与(j1)或(j2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(j4)与(j1)或(j2)或(j3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述DHHA-2,3-脱氢酶的编码基因具体可为如下(k1)或(k2)或(k3)或(k4):

(k1)其编码区如序列表的序列7所示的DNA分子;

(k2)序列7所示的DNA分子;

(k3)在严格条件下与(k1)或(k2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(k4)与(k1)或(k2)或(k3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述DHHA-2,3-脱氢酶的编码基因具体可为如下(l1)或(l2)或(l3)或(l4):

(l1)其编码区如序列表的序列8所示的DNA分子;

(l2)序列8所示的DNA分子;

(l3)在严格条件下与(l1)或(l2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(l4)与(l1)或(l2)或(l3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述DHHA-2,3-脱氢酶的编码基因具体可为如下(m1)或(m2)或(m3)或(m4):

(m1)其编码区如序列表的序列9所示的DNA分子;

(m2)序列9所示的DNA分子;

(m3)在严格条件下与(m1)或(m2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(m4)与(m1)或(m2)或(m3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述DHHA-2,3-脱氢酶的编码基因具体可为如下(n1)或(n2)或(n3)或(n4):

(n1)其编码区如序列表的序列10所示的DNA分子;

(n2)序列10所示的DNA分子;

(n3)在严格条件下与(n1)或(n2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(n4)与(n1)或(n2)或(n3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

以上任一所述3-羟基邻氨基苯甲酸-3,4-双加氧酶的编码基因具体可为如下(o1)或(o2)或(o3)或(o4):

(o1)其编码区如序列表的序列4所示的DNA分子;

(o2)序列4所示的DNA分子;

(o3)在严格条件下与(o1)或(o2)限定的DNA序列杂交且编码具有相同功能的蛋白质的DNA分子;

(o4)与(o1)或(o2)或(o3)限定的DNA序列具有90%以上同源性且编码具有相同功能的蛋白质的DNA分子。

本发明具有如下优点:

1、本发明解除了NAD合成与色氨酸或天冬氨酸合成的耦联。

2、本发明设计的异源代谢路径的起点为分支酸,广泛存在于各种生命形式中(如细菌、真菌、古菌、植物等),另外分支酸是一个天然的代谢分支点,理论上对其他生命必需代谢途径的影响较小。

3、与传统酵母发酵法相比,本发明重构的NAD合成路径理论上可以获得更高的目标产物产量,并且只需要简单的无机盐-葡萄糖培养基就可以获得目标化合物,无需额外添加色氨酸等NAD合成前体。

4、本发明实施例采用的菌株为大肠杆菌,相对于其他菌株来说,大肠杆菌具有遗传背景清晰、遗传操作简便、发酵工艺成熟、生长速度快等诸多优点;但该途径不限于大肠菌株,也不限于细菌,可以扩展到含有分支酸的所有生命形式和非生命形式。

5、本发明可以通过传统发酵、代谢工程等手段进一步优化,理论上可获得更高的产量,进一步降低生产成本。

附图说明

图1为人工设计的NAD合成代谢途径。

图2为Pau20酶学活性检测。

图3为ClaB3、DhbX、StnN酶学活性检测。

图4为BomO、CbxG、NatDB酶学活性检测。

图5为大肠杆菌Asp-NAD途径的敲除。

图6为大肠杆菌中新NAD合成途径的验证。

具体实施方式

以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。

实施例1、合成路线的确立

通过大量调查研究,确立了一条新的NAD合成路线(图1)。

以分支酸作为起点,在PhzD蛋白的作用下经过转氨重排反应生成氨基脱氧异分支酸(ADIC),氨基脱氧异分支酸在PhzE蛋白的催化下脱去丙酮酸部分生成2,3-二氢-3-羟基邻氨基苯甲酸(DHHA),采用特定酶(DHHA-2,3-脱氢酶)将2,3-二氢-3-羟基邻氨基苯甲酸催化生成3-羟基邻氨基苯甲酸(3-HAA),在NabC蛋白的作用下3-羟基邻氨基苯甲酸通过氧化开环重排反应生成喹啉酸(QA),生物体内喹啉酸在喹啉酸磷酸转移酶的作用下与焦磷酸核糖反应生成烟酸单核苷酸,随后进入NAD补救途径,完成NAD的合成。

生物体内NAD可在烟酰胺腺嘌呤二核苷酸激酶催化下与ATP反应生成烟酰胺腺嘌呤二核苷酸磷酸(NADP)。

NAD可以接受质子变成还原形态的NADH。

NADP可以接受质子变成还原形态的NADPH。

实施例2、DHHA-2,3-脱氢酶的鉴定

一、Pau20的鉴定

1、从大量候选酶中筛选出了一个可能具有DHHA-2,3-脱氢酶活性的酶,将其命名为Pau20,其编码基因如序列表的序列1所示,蛋白质序列如序列表的序列2所示。

2、Pau20的制备及纯化

(1)采用序列表的序列1所示的双链DNA分子替代pET28a质粒(Novagen公司)的NdeI和BamH I酶切位点之间的小片段,得到重组质粒pET28a::pau20(已经测序验证)。

(2)将重组质粒pET28a::pau20导入大肠杆菌E.coli BL21(DE3),得到重组菌BL21(DE3)::pET28a-pau20。

(3)将重组菌BL21(DE3)::pET28a-pau20在含有50μg/mL卡那霉素的LB液体培养基中培养至菌液OD600nm值约0.4左右,放入4℃中冷却约15min后,加入终浓度为0.05mM的IPTG,16℃180rpm诱低温诱导蛋白表达12-16h。

(4)完成步骤(3)后,将诱导体系4℃,5000rpm离心10min,收集菌体沉淀,用适量Binding buffer(0.5M NaCl,20mM Tris-HCl,5mM imidazole,pH 7.9)重悬洗涤一遍,再离心弃去上清。加入10mL的Binding buffer重悬,冰浴,利用超声波破碎菌体(超声功率设置为300W,超声程序为超声5s,间歇9.9s,总时间20min)。超声结束后,高速离心(4℃13000rpm)45min,除去细胞裂解碎片,收集细胞裂解液上清。

(5)将步骤(4)得到的细胞裂解液上清进行His标签亲和层析纯化和脱盐,得到目标蛋白Pau20溶液:

1)取1mL镍NTA琼脂糖凝胶预装柱,用10mLBinding buffer平衡,然后取细胞裂解液上清10mL样品上样,收集流出液。

2)用15mLBinding buffer洗去杂质,流速1-2mL/min,收集流出液。

3)用15mLWashing Buffer(0.5M NaC,20mM Tris-HCl,20mM imidazole,pH 7.9)洗去非特异吸附的杂蛋白,流速1-2mL/min,收集流出液。

4)用5mL Elution Buffer(0.5M NaCl,20mM Tris-HCl,500mM imidazole,pH7.9)洗去特异吸附的目标蛋白,500μL每管收集待分析。

5)再用10mLElution Buffer、10mL去离子水、10mL20%乙醇分别重新柱子,最后将柱子保存在20%乙醇中,封闭,以备下次使用。

6)利用SDS-PAGE电泳检测目标蛋白的分布和纯化情况。

7)用商业化的PD-10脱盐柱对目标蛋白脱盐,具体步骤参见厂家说明书。

8)用超滤膜浓缩纯化脱盐后的目标蛋白,保存在含20%甘油的磷酸盐缓冲液中(pH7.4),分装后-80℃保存。

3、对Pau20的DHHA-2,3-脱氢酶活性进行检测,步骤如下:

(1)配置酶活检测体系(100μL):50mM PBS(pH 7.4),2Mm NAD+(Sigma公司),2mMDHHA(Apollo Scientific公司),10μM步骤2得到的Pau20蛋白。

(2)进行酶活反应,30℃水浴1h,结束后加入100μL三氯甲烷终止反应,13000rpm离心10min后,取上清20μL用于HPLC检测。

每组酶活反应设置3组重复,同时设置Pau20灭活组(将Pau20煮沸灭活)作为对照。

HPLC检测条件:Agilent SB-Aq分析柱(5μm,4.6×250mm,Aglient,Santa Clara,CA,USA),0.8mL/min流速,流动相A:1‰三氟乙酸水溶液;流动相B:乙腈(Merck kGaA公司)。PDA检测器,检测波长设置320nm和254nm。洗脱条件:0min-30min,乙腈浓度从1%梯度上升到50%;30min-35min,乙腈浓度从50%梯度上升到100%;35min-40min,乙腈浓度维持100%;40min-45min,乙腈浓度从100%梯度下降到1%;45min-55min,乙腈浓度维持1%。

结果如图2所示。图2中,A为纯化的Pau20SDS-PAGE电泳图谱,B为Pau20体外酶学反应产物的HPLC检测图谱,其中,Pau20+为实验组,Pau20–为对照组。

产物标准品3-HAA购自美国Sigma公司。

结果表明,Pau20以NAD+作为辅因子可以催化2,3-二氢-3-羟基邻氨基苯甲酸脱氢生成3-羟基邻氨基苯甲酸。

二、其他DHHA-2,3-脱氢酶的鉴定

1、通过进一步的筛选,共筛选了其他6个可能具有DHHA-2,3-脱氢酶活性的蛋白质,依次为ClaB3(AEH42481)、DhbX(CDG76955.1)、StnN(AFW04566.1)、BomO(ALE27507)、CbxG(KDQ70111)和NatDB(CEK42820)。括号中为蛋白在NCBI的序列号。

2、分别构建如下重组质粒:

(1)重组质粒pET28a::ClaB3:采用序列表的序列5所示的双链DNA分子替代pET28a质粒(Novagen公司)的Nde I和BamH I酶切位点之间的小片段,得到重组质粒pET28a::ClaB3(已经测序验证)。序列5所示的双链DNA分子编码序列11所示的蛋白质。

(2)重组质粒pET28a::DhbX:采用序列表的序列6所示的双链DNA分子替代pET28a质粒(Novagen公司)的Nde I和BamH I酶切位点之间的小片段,得到重组质粒pET28a::DhbX(已经测序验证)。序列6所示的双链DNA分子编码序列12所示的蛋白质。

(3)重组质粒pET28a::StnN:采用序列表的序列7所示的双链DNA分子替代pET28a质粒(Novagen公司)的Nde I和BamH I酶切位点之间的小片段,得到重组质粒pET28a::StnN(已经测序验证)。序列7所示的双链DNA分子编码序列13所示的蛋白质。

(4)重组质粒pET28a::BomO:采用序列表的序列8所示的双链DNA分子替代pET28a质粒(Novagen公司)的Nde I和BamH I酶切位点之间的小片段,得到重组质粒pET28a::BomO(已经测序验证)。序列8所示的双链DNA分子编码序列14所示的蛋白质。

(5)重组质粒pET28a::CbxG:采用序列表的序列9所示的双链DNA分子替代pET28a质粒(Novagen公司)的Nde I和BamH I酶切位点之间的小片段,得到重组质粒pET28a::CbxG(已经测序验证)。序列9所示的双链DNA分子编码序列15所示的蛋白质。

(6)重组质粒pET28a::NatDB:采用序列表的序列10所示的双链DNA分子替代pET28a质粒(Novagen公司)的Nde I和BamH I酶切位点之间的小片段,得到重组质粒pET28a::NatDB(已经测序验证)。序列10所示的双链DNA分子编码序列16所示的蛋白质。

3、按照步骤一中的步骤2和步骤3(采用表达候选蛋白的重组质粒替代重组质粒pET28a::pau20)对六种候选蛋白质的DHHA-2,3-脱氢酶活性进行检测。

ClaB3、DhbX、StnN的结果见图3。结果表明这三种蛋白质实验条件下反应活性较好,HPLC即可发现明显的3-HAA生成。

BomO、CbxG、NatDB在实验条件下反应活性稍低,HPLC可发现NADH生成,有疑似3-HAA小峰生成,通过LC-MS得以证实(图4)(LC-MS分析仪器为Agilent 1260/6460 Triple-Quadrupole LC/MS系统,工作模式为电喷雾模式)。

实施例3、NAD合成途径质粒的构建

将phzD、phzE、nabC和pau20的基因序列依据异源表达菌株大肠杆菌的密码子偏好性进行了针对性优化后,连接到质粒pXB1a(参考文献:Cui Q,Zhou F,Liu W,etal.Avermectin biosynthesis:stable functional expression of branched chainα-keto acid dehydrogenase complex from Streptomyces avermitilis,in Escherichiacoli,by selectively regulating individual subunit gene expression[J].Biotechnology Letters,2017,39(10):1-8.;公众可以从中国科学院微生物研究所获得)上,得到重组质粒。

采用序列3所示的双链DNA分子替代质粒pXB1a的NcoⅠ和EcoRⅠ酶切位点之间的片段,得到质粒pXB1a-HAA(已经测序验证)。

序列表的序列3中,自5’端第1至786位为pau20基因,第818-1841位为phzD基因(编码序列表的序列17所示的蛋白质),第1467至3350位为phzE基因(编码序列表的序列18所示的蛋白质)。

将序列4所示的双链DNA分子(nabC基因,编码序列表的序列19所示的蛋白质)***质粒pXB1a-HAA的NcoⅠ酶切位点,得到重组质粒pXB1a-QA(已经测序验证)。

在重组质粒pXB1a-QA中,由***糖诱导表达的启动子启动目的基因的表达。

实施例4、大肠杆菌de novo NAD途径敲除

BW25113::ΔnadA和BW25113::ΔnadB分别为nadA基因消除菌和nadB基因消除菌,记载于文献:Baba T,Ara T,Hasegawa M,et al.Construction of Escherichia coli,K-12 in-frame,single-gene knockout mutants:the Keio collection[J].MolecularSystems Biology,2006,2(1):2006.0008-2006.0008.;公众可以从中国科学院微生物研究所获得。

利用P1噬菌体转导将BW25113::ΔnadB裂解液导入到受体菌BW25113::ΔnadA中,得到双敲除菌株,具体步骤如下:

1、将BW25113::ΔnadB菌液接种于5ml LB培养基中(培养基中添加50μL 20%葡萄糖和25μL 1M氯化钙),37℃培养至菌液OD600nm=0.6-0.8,加入100μL P1噬菌体储存液(P1噬菌体效价109-10pfu/mL),继续培养2-3小时,4℃、1000rpm离心10min,取上清用0.22μm滤膜过滤,即得BW25113::ΔnadB裂解液,备用。

2、取过夜培养的受体菌BW25113::ΔnadA菌液1.5mL,6000rpm离心3min,去上清,用700μL的P1盐溶液(10mM氯化钙和5mM硫酸镁)重悬菌体沉淀,100μL每管分装到无菌EP管。

3、向步骤2中每管准备好的受体菌BW25113::ΔnadA中添加0/1/10/100μL的BW25113::ΔnadB裂解液,室温放置30min后,加入200μL的1M柠檬酸钠和1mL LB液体培养基,37℃220rpm培养1小时。

4、完成步骤3后,菌液8000rpm离心2min去上清,采用200μL LB重悬菌体沉淀后涂布到卡那抗性LB平板上,获得菌株BW25113::ΔnadAΔnadB,分别采用引物nadA-F和引物nadA-R组成的引物对和引物nadB-F和引物nadB-R组成的引物对进行验证。

nadA-F:5’-TCAGGCATCCTCAATTTC-3’;

nadA-R:5’-GGCATACAGCTGAATCTG-3’;

nadB-F:5’-AACATCGCATTATCTGTG-3’;

nadB-F:5’-GCGTAGTGCTGCCAGAGC-3’。

结果如图5所示。图5的电泳图中,左边是使用引物nadA-F和引物nadA-R组成的引物对进行扩增的结果,证明菌株BW25113::ΔnadAΔnadB中nadA基因被敲除,右边是使用引物nadB-F和引物nadB-R组成的引物对进行扩增的结果,证明菌株BW25113::ΔnadAΔnadB中nadB基因也被敲除。综上所述,菌株BW25113::ΔnadAΔnadB自身的de novo NAD途径被敲除。

将野生型菌株和菌株BW25113::ΔnadAΔnadB在M9培养基培养,菌株的生长情况如图5所示。菌株BW25113::ΔnadAΔnadB在M9培养基上中无法生长,但是当外源添加喹啉酸(终浓度10mM)时,菌株恢复生长,说明大肠杆菌中天冬氨酸-NAD途径在M9培养基培养下是必需的。

实施例5、含新NAD合成途径大肠杆菌的构建及验证

1、将重组质粒pXB1a-QA导入菌株BW25113::ΔnadAΔnadB中,得到重组菌BW25113A-QA(含有新NAD合成途径)。

2、将质粒pXB1a导入菌株BW25113::ΔnadAΔnadB中,得到空载体菌株。

3、将重组菌BW25113A-QA或空载体菌株接种到3mL液体LB培养基中(含50μg/mL卡那霉素和50μg/mL链霉素),37℃、220rpm培养12h。将菌液调整浓度值菌液OD600nm=0.1后取2μL点到M9固体培养基上(分为两组:一组为含有10mM***糖的M9固体培养基,一组为不含有***糖的M9固体培养基)37℃培养48h。

结果如图6所示。A+为含空载体菌株在含10mM***糖M9平板上的生长情况;A-QA+为重组菌BW25113A-QA在含10mM***糖M9固体培养基上的生长情况;A-QA-为重组菌BW25113A-QA在不含有***糖的M9固体培养基的生长情况。

结果表明,在***糖诱导的作用下,菌株BW25113A-QA恢复了在M9培养基上的生长能力,说明新NAD合成途径可以在功能上替代大肠杆菌原始途径。

实施例6、含新NAD合成途径大肠杆菌胞内NAD水平的测定

将实施例5接种的重组菌BW25113A-QA接种到3mL液体LB培养基中(含50μg/mL卡那霉素和50μg/mL链霉素),37℃、220rpm培养12h。所得菌液离心(8000rpm,5min),用无菌水洗两次后,加入无菌水稀释至菌液OD600nm=1后取500μL接种到50mL M9液体培养基中(分10mM***糖诱导组和空白组,另设野生菌株BW25113作为对照)。37℃培养至平台期4h后,收获菌体,用预冷PBS缓冲液稀释清洗菌体并稀释菌液浓度至OD600nm=1后,取1mL菌液离心(6000rpm,10min)后留菌体检测胞内NAD+和NADH的含量。

试剂盒法检测胞内NAD+和NADH的含量:使用试剂盒为ab65348(NAD/NADHAssayKit),具体操作按照试剂盒说明书进行。结果如表1所示。

表1 大肠杆菌胞内NAD含量

注:“—”表示菌株在相应条件下未生长,A-QA+为菌株BW25113A-QA 10mM***糖诱导组,A-QA为菌株BW25113A-QA未诱导组;BW25113+为野生菌株10mM***糖实验组,BW25113为不含***糖组。

序列表

<110> 中国科学院微生物研究所

<120> 一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法

<160> 19

<170> SIPOSequenceListing 1.0

<210> 1

<211> 786

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

atgggcacag ccaattccga caaggtcgca ctggtgaccg gggccgccgg aggcatcggc 60

cgggcggtcg tgctcgcgct cgccggagcc ggcgccccgg tggccgccgt cgacatcgac 120

ggcgaggccc tcggggtgct ggagcggcag gcgcgggacg agggcctgga cgtcgccggc 180

ttcgccgcgg acgtcacctc ggccgcgcag acggaggcgg ccgtcgccgc cgccgagaac 240

cgcttcggcc caattcacca cctggtcaac acagccggcg tgctgtgctc gtccccggcc 300

ctggaactca ccgaggacga ctgggagcgg accttcgcgg tcaacaccac ggcggtcttc 360

agggtctccg ccaccgtcac ccgccggatg gtcgcccacg gcgtccgcgg cgcggtcgtc 420

accgtggcgt ccaacgcggc gaacgtgccc cggatgaaca tgtcggcgta cagcgcgtcg 480

aaggccgcgg ctgccgcctg gaccaagaac ctcggcctgg agctcgcggc gcacggcatt 540

cgctgcaacg tcgtgggtcc cgggtcgacc gacaccccga tgctgcgctc actgtggacc 600

gacgcgtccg ggccgtccgg ctccctcgac ggtgtgccgt cgcagtaccg gctcgggatt 660

ccgctcggca ggttcgccgc acccgccgac atcgccgacg ccgtcacatt cctgctctcc 720

gaccgcgcgg cccacatcac catgcacgac ctgatcgtcg acgggggcgc gaccctgggc 780

cgctag 786

<210> 2

<211> 261

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Met Gly Thr Ala Asn Ser Asp Lys Val Ala Leu Val Thr Gly Ala Ala

1 5 10 15

Gly Gly Ile Gly Arg Ala Val Val Leu Ala Leu Ala Gly Ala Gly Ala

20 25 30

Pro Val Ala Ala Val Asp Ile Asp Gly Glu Ala Leu Gly Val Leu Glu

35 40 45

Arg Gln Ala Arg Asp Glu Gly Leu Asp Val Ala Gly Phe Ala Ala Asp

50 55 60

Val Thr Ser Ala Ala Gln Thr Glu Ala Ala Val Ala Ala Ala Glu Asn

65 70 75 80

Arg Phe Gly Pro Ile His His Leu Val Asn Thr Ala Gly Val Leu Cys

85 90 95

Ser Ser Pro Ala Leu Glu Leu Thr Glu Asp Asp Trp Glu Arg Thr Phe

100 105 110

Ala Val Asn Thr Thr Ala Val Phe Arg Val Ser Ala Thr Val Thr Arg

115 120 125

Arg Met Val Ala His Gly Val Arg Gly Ala Val Val Thr Val Ala Ser

130 135 140

Asn Ala Ala Asn Val Pro Arg Met Asn Met Ser Ala Tyr Ser Ala Ser

145 150 155 160

Lys Ala Ala Ala Ala Ala Trp Thr Lys Asn Leu Gly Leu Glu Leu Ala

165 170 175

Ala His Gly Ile Arg Cys Asn Val Val Gly Pro Gly Ser Thr Asp Thr

180 185 190

Pro Met Leu Arg Ser Leu Trp Thr Asp Ala Ser Gly Pro Ser Gly Ser

195 200 205

Leu Asp Gly Val Pro Ser Gln Tyr Arg Leu Gly Ile Pro Leu Gly Arg

210 215 220

Phe Ala Ala Pro Ala Asp Ile Ala Asp Ala Val Thr Phe Leu Leu Ser

225 230 235 240

Asp Arg Ala Ala His Ile Thr Met His Asp Leu Ile Val Asp Gly Gly

245 250 255

Ala Thr Leu Gly Arg

260

<210> 3

<211> 3350

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

atgggcacag ccaattccga caaggtcgca ctggtgaccg gggccgccgg aggcatcggc 60

cgggcggtcg tgctcgcgct cgccggagcc ggcgccccgg tggccgccgt cgacatcgac 120

ggcgaggccc tcggggtgct ggagcggcag gcgcgggacg agggcctgga cgtcgccggc 180

ttcgccgcgg acgtcacctc ggccgcgcag acggaggcgg ccgtcgccgc cgccgagaac 240

cgcttcggcc caattcacca cctggtcaac acagccggcg tgctgtgctc gtccccggcc 300

ctggaactca ccgaggacga ctgggagcgg accttcgcgg tcaacaccac ggcggtcttc 360

agggtctccg ccaccgtcac ccgccggatg gtcgcccacg gcgtccgcgg cgcggtcgtc 420

accgtggcgt ccaacgcggc gaacgtgccc cggatgaaca tgtcggcgta cagcgcgtcg 480

aaggccgcgg ctgccgcctg gaccaagaac ctcggcctgg agctcgcggc gcacggcatt 540

cgctgcaacg tcgtgggtcc cgggtcgacc gacaccccga tgctgcgctc actgtggacc 600

gacgcgtccg ggccgtccgg ctccctcgac ggtgtgccgt cgcagtaccg gctcgggatt 660

ccgctcggca ggttcgccgc acccgccgac atcgccgacg ccgtcacatt cctgctctcc 720

gaccgcgcgg cccacatcac catgcacgac ctgatcgtcg acgggggcgc gaccctgggc 780

cgctagcata tgtctagaga aagaggagaa atactagatg tcaggtatcc ctgaaatcac 840

cgcatatcca ttacctaccg cccagcagtt accggccaat ctggcacgct ggagcttaga 900

acctcgtcgc gccgttctgt tagttcatga tatgcagcgc tattttctgc gtccactgcc 960

ggaatcttta cgcgcaggtc tggttgctaa tgcggcccgc ttacgtcgtt ggtgtgttga 1020

acagggcgtt cagatcgcct atacggctca acccggctca atgaccgaag aacagcgtgg 1080

cttactgaaa gatttttggg gtccggggat gcgtgcaagt cctgcggatc gcgaagtggt 1140

ggaagaatta gctccgggtc cagatgattg gttattaacc aaatggcgct atagtgcctt 1200

ttttcatagc gatttattac agcgtatgcg cgcggcaggt cgtgatcagt tagttctgtg 1260

cggtgtttat gcacatgtgg gcgtgttaat ctctacagtg gatgcttatt ctaatgatat 1320

acagccgttt ctggttgctg atgccattgc cgattttagc gaagcacatc atcgtatggc 1380

cttagaatat gccgcatctc gctgtgcaat ggttgtgaca acggatgaag tgctggaatg 1440

atctagagaa agaggagaaa tactagatga atgccctgcc tacctcactg ttacagcgcc 1500

tgttagaacg tccagctccg tttgcgttac tgtatcgtcc ggaaagtaat ggccctggcc 1560

tgctggatgt gattcgcggc gaagccttag aattacatgg ccttgctgat ttaccattag 1620

atgaaccggg acctggttta ccacgccatg atttattagc cttaatcccg tatcgccaga 1680

ttgccgaacg cggctttgaa gccctggatg atggtacccc gctgttagca ttaaaagttc 1740

tggaacagga attactgcca ctggaacagg cattagcact gttacctaat caggccttag 1800

aactgagtga agaaggcttt gatctggatg atgaagccta cgcggaagtt gtgggtcgtg 1860

tgattgcgga tgaaatagga cgcggcgaag gcgccaattt tgttatcaaa cgccgctttc 1920

aggctcgcat cgatggctat gcaaccgcaa gcgcactgtc tttttttcgt cagctgttac 1980

tgcgtgaaaa aggtgcatat tggaccttta ttgttcatac gggcgaacgc accctggtgg 2040

gcgcctcacc agaacgccat atctcagttc gcgatggttt agcagttatg aatcctatct 2100

caggtacata tcgctatcct ccagccggtc ctaatttagc agaagttatg gaatttctgg 2160

ataatcgtaa agaagccgat gaactgtata tggttgttga tgaagaatta aaaatgatgg 2220

cacgtatttg cgaagatggt ggtcgtgtgc tgggtccgta tttaaaagaa atggcacatc 2280

tggcacatac ggaatatttt atcgaaggcc agacctctcg cgatgtgcgt gaagtgttac 2340

gtgaaacact gtttgcaccg acggtgacgg gttctccatt agaaagcgct tgtcgcgtta 2400

ttcgccgcta tgaaccacag ggtcgtggct attatagtgg tgtggcagcc ctgatcggcg 2460

gcgatggtca gggggggcgg acactggata gcgcaatctt aattcgtacg gcagaaattg 2520

aaggtgatgg tcgcttacgc atcggcgttg gtagtacaat tgtgcgtcat tcagatcctc 2580

tgggcgaagc tgccgaaagc cgtgccaaag caagcggttt aattgccgca ttaaaatcac 2640

aggctccaca gcgcttaggt agtcatccac atgttgttgc agccttagct agtcgtaatg 2700

ctcctattgc cgatttttgg ctgcgcggtg ctagtgaacg ccagcagtta caggccgatc 2760

tgagcggtcg cgaagtgctg attgtggatg cggaagatac ctttacgagt atgattgcta 2820

aacagttaaa aagtctgggc ctgacggtga ccgttcgtgg ttttcaggaa ccatatagct 2880

ttgatggcta tgatctggtt atcatggggc cgggtccggg taatccgacc gaaatcggtc 2940

agcctaaaat cggtcattta catttagcta ttcgtagttt actgtcggaa cgtcgtccgt 3000

ttctggcagt gtgtctgagt catcaggttc tgagcttatg tctgggcttg gacttgcaac 3060

gccgtcagga accaaatcag ggcgttcaga aacagatcga tctgtttggt gccgcagaac 3120

gggttggttt ttataatacc tttgctgctc gggctctaca agatcgcatc gaaatcccgg 3180

aagttggccc aattgaaatc tctcgcgatc gcgaaaccgg cgaagttcat gccctgcgcg 3240

gtccacgctt tgcctcaatg cagtttcatc cggaaagtgt gctgactaga gaaggtcctc 3300

gtatcattgc ggatttactg cgtcatgcat tagtggaacg tcgcccataa 3350

<210> 4

<211> 555

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atgatgttta cctttggtaa accattaaat tttcagcgct ggttagatga tcatagcgat 60

ctgttacgtc ctccagtggg taatcagcag gtgtggcagg atagcgattt tattgtgacc 120

gttgtgggcg gccctaattt tcgtacagat tttcatgatg atcctatgga agaatttttt 180

tatcagttta aaggtaatgc ctatctgaat attatggatc gcggccagat ggatcgcgtg 240

gaactgaaag aaggcgacat ctttctgctg cctcctcatc tgcgtcatag tccacagcgt 300

ccggaagccg gctctcgctg tctggttatc gaacgccagc gcccgaaagg catgttagat 360

ggctttgaat ggtattgctt aagttgtaat ggcttagtgt atcgtgttga tgtgcagctg 420

aatagtattg tgacggattt accgccactg tttgatattt tttatggcaa tgttggcctg 480

cgcaaatgcc cacagtgcgg tcaggtgcat ccgggcaaag ccgcaatcga agcagttgca 540

cgcggtgatc agccg 555

<210> 5

<211> 813

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atggaatttc gtaccatgac ccgtaccacc gattctcgcg caatggaagg taaagtggca 60

ctggtgaccg gcgcagcagg cggtattggt gcagcagttg ttcgcgcaat tgcagaacgc 120

ggcggtgtgc tggcagcagt ggatgcaaat agtgtggcac tgaaagaaac caccgaagca 180

ctggcaggcg aaggcctgcg tgttgaaggc tttgttgcag atgtgacccg tccggatgaa 240

gttgaagcaa ccgttgcagc agttgaagca cgtctgggtc cggttgatca tctggttaat 300

gcagcaggta ttctgcgtct gggcgatgca cgtaccctgt cagataccga ttgggcagat 360

accattgcag ttaatgcaac gggcgttttt cacatgagtc gcgcagttgt taatcgtatg 420

gttccgcgtc gctcaggcgc actggtgacc gtggcatcta atgcagcagg gactccgcgc 480

acccagatgg cagcatacgc agcatcaaaa gcagcagcaa ccatgtttac caaatgtctg 540

ggcctggaag tggcagaata tggtattcgc tgtaatctgg ttgcaccggg tagtaccgat 600

accccgatgc tttcctctat gtggcatgat gatagcggtc gtgaagcaac cgttcgcggc 660

tctctggaaa cctttaaagt gggtattccg ctgcgtaaac tggcagcacc gcgtgatgtg 720

gcagatgcag ttgtgtttct gctgagcgaa gaagcaagtc atattaccct gcacgcactg 780

accgtggatg gcggcgcaac cctgggcgtt taa 813

<210> 6

<211> 786

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

atgacctttg ataaagatta tattgcagtt attaccggcg catgtggcgg tattggtgaa 60

agcgtggcac atgcactggc aaaagaaggt ctgtctctgg cactgctgga taataatgca 120

acccagctgg caaccctggt ggcaaccttg caggataatc atccgcagcc gattgcaggc 180

tttaccgtgg atgttgcaga tgatcgttgt gtggcagaag catttaccgc agtgggtcat 240

cagctgggtc cggtgggcta tctggtgaat ggcgcaggcg ttctgtgtca tgcaagtgtt 300

gcagaaaccc agccgcagga ttgggcaaaa acctttgcag ttaatgcaac cggcgtgttt 360

aatacctcac gtcatgcagc aaatctgatg atggcacagc gtaaaggttc aattgtgacc 420

attgcatcaa atgcagcgcg tgttccgcgc gcaacgatgg cagcatattg tgcatctaaa 480

gcagcagcac aggcatttac ctatgcactg ggcctggaag tggcaccgta tggtattcgc 540

tgtaatgttg ttgcaccggg tagtaccgat accccgatgc tgcgcggtat gtggcatagc 600

gaaagcgata aacagaatac cctgaatggt aatccgcagc agtttcgtat tggtattccg 660

ctgaataaag ttgcaaccgc agaagaaatt gcagcagcag tttgttttta tctgtgtgaa 720

gaatcaggtc agaccaccct gagtaccctg ctggttgatg gcggcgcagc actgggctct 780

tgttaa 786

<210> 7

<211> 861

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

atggttgcac gtatgagtac cgggcgtaca ggaacaggcc gtgcagaacc ggaacgtcgt 60

cgcgcacatc cggcaatgga agtgggtacg atggaagata aagtggcact ggtgaccggc 120

gcagcaggcg gtattggtgc agcagttgca cgcgcactgg cacgtcgcgg cgcacgtgtt 180

gcagcagtgg atctgcatac aggccgcctg accgaagaag ttggtaaact gaccgcagat 240

ggtctggcag ttgaagcatt tccggcagat gtgacccgtg cagcagcagt ggaagaactg 300

gttgaaggtg tggaaacccg cctgggcccg gttgatctgc tggttaatgc agcaggtgtt 360

ctgcgtctgg gtccggttca tcgcctgggc gatgaagatt gggcagcaac ctttgcagtt 420

aataccaccg gcgtttttct ggtgtctcgt gcagtggcag gccgtatgat gccgcgtagt 480

cgcggtgcaa ttgtgaccgt tgcaagtaat gcagcaggga ctccgcgtac cgaaatggca 540

gcctacgcag catctaaagc agcagcaacc atgtttacca aatgtctggc actggaagtg 600

gcaggtcatg gtattcgctg taatgttgtg gcaccgggct caaccgatac cgcaatgctg 660

cgctctatgt ggcaggatga atcaggcgca cgcgcaacca ttgaaggccg tccggaagca 720

tataaactgg gtattccgct gggtaaactg gcacgcccgg cagatattgc agatgcagtt 780

gtgtttctgc tgagcgatcg tgcaggtcat attaccatgc atgaactgac cgttgatggc 840

ggcgcaaccc tgggcgcata a 861

<210> 8

<211> 828

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

atgacgcacg gtccggatca ggatggtctg ggcctggaag gtcgtgttgc agttgtgacc 60

ggcgcagcag gcggtattgg tgcagaaacc gttgcacagc tggttcgtca tcgcgcagca 120

gtggcactgg tggatcgtga tggtccggca ctggatgaac tggttgcacg cctgcgtaaa 180

gaagcagcag cagatccgcg tgcaccggaa ccgcgtctgc tggcagttcc ggcagatgtt 240

agtcatggcg gtgaagtgac cgcagtggtt gaacgtgtgg aatcagaact gggcccgatt 300

acccatctgg ttaatgcagc aggtattctg cgtccgggtc cggttgcagg cctgagcgaa 360

cgcgattggg atgataccct ggcagttaat gcaacggggg tttatctgat gtctcgtgca 420

gtggcaagtc gtatggcacc gcgcggcttt ggcgcaattg tgaccgttac ctctaatgca 480

gcacgtaccg cacgtactgg aatggcagcg tatgcagcaa gtaaagcagc agcacaggca 540

tttaccaaat gtctgggcct ggaactggca gggacaggta ttcgctgtaa tgttgttgca 600

ccgggctcaa ccgatacccc gatgctgacc tcactgtggg aaggcgaaga tgcaggtcgc 660

ccgtctattg aaggcgcacc ggaagcatat cgcgtgggta ttccgaccgg ccgcctggca 720

cgcccgtatg atgtggcaca ggcagttgtt tttctgctga gcgaacgcgc aggtcatatt 780

acccttcagg atctgaccgt tgatggcggc gcaaccctgg gtgtgtaa 828

<210> 9

<211> 771

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

atgaaagata ccattgcagt ggttaccggc gcagcaggcg gtattggtgc agcagtggca 60

gaagcactgg cagtgcgcgg cgcaagcgtg gcactgctgg atcgtgatgc agatcgcctg 120

gcagttgtgg caaaagaact gacctcggca ggtcatcgcg caaccgcatt tccggcagat 180

gtgacctcag gtcaggatgt ggaagcagtg attgaagcag ttgaagaacg cctgggtccg 240

gttgatcgtc tggttaatgc agcaggcgtg ctgcgtaccg gcccggcaca tgaatttgca 300

gatgaagatt gggaagcaac ctttgcagtt aataccacag gcgtttttca tgtgtctcgc 360

gcagttgttc gtcgtatgcg tacccgccgt cgcggtgcac tggtgaccat tgcaagtaat 420

gcagcaggct ctgcacgtac cgaaatggca gcttatgcag catctaaagc agcagcatct 480

atgtttacca aatgtctggg cctggaaaat gcagcgtacg gtattcgctg taatgttgtg 540

gcaccgggta gtaccgatac cccgatgctg accgcactgt gggatgatgc aagcgcagca 600

gatgcatcaa ttgcaggtgt tccggaagca tatcgcgttg gtattccgct ggcaaaactg 660

gcacgtccga aagatgtggc agatgcagtt ctgtttctgc tgagcgatca ggcaagtcat 720

attaccatgc atcatctgac cgttgatggc ggcgcaaccc tgggcgcata a 771

<210> 10

<211> 825

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

atgagcgata ccctgaccac caccggcaca accggcacag cagcagcagc aggcgcagaa 60

tggagcggta gcgcagttgt taccggcgca gcaggcggta ttggtgcaga aattgcacgc 120

gcactggcag cagcaggtgt gccggttgca ctgctggatc gtgaaccggg cgcactgcgt 180

gaactggcaa gcgaactgag cgcagcaggc ggaactgtgc tggcagtggc agcagatgtg 240

accgatagcg cagatgttga tgcagcagtg gcaaaagcag aagcagaact gggtccggtt 300

gcatatctgg ttaatggtgc aggcgttctg cattcaggtc cggcaggcga atttagtgat 360

gaagattggg atcataccct ggcagttaat gcaggtggtg tttttcgtgt tagtcgcgca 420

gtggcacgtc tgatggttcc gcgtggccgc ggctcaattg tgaccattgc atctaatgca 480

gcactgaccc cgcgtacctc tatggcagca tacgcagcaa gtaaagcagc aagtgcaatg 540

tttaccaaat gtctgggcct ggaactgggt cgtcatggta ttcgctgtaa tgttgtggca 600

ccgggctcaa cccgtacctc tatgctgacc gcacttcaag gcgatgcagc agttcgcgca 660

tcagtggatg gtgtgccgga tgcatatcgc gttggtattc cgctgggtcg tattgcagaa 720

ccggcacata ttgcagatgc agttctgttt ctgctgtcag atcgctctgc acatattacc 780

ttgcaggatc tgaccgttga tggcggcgca gcactgggtg tgtaa 825

<210> 11

<211> 270

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 11

Met Glu Phe Arg Thr Met Thr Arg Thr Thr Asp Ser Arg Ala Met Glu

1 5 10 15

Gly Lys Val Ala Leu Val Thr Gly Ala Ala Gly Gly Ile Gly Ala Ala

20 25 30

Val Val Arg Ala Ile Ala Glu Arg Gly Gly Val Leu Ala Ala Val Asp

35 40 45

Ala Asn Ser Val Ala Leu Lys Glu Thr Thr Glu Ala Leu Ala Gly Glu

50 55 60

Gly Leu Arg Val Glu Gly Phe Val Ala Asp Val Thr Arg Pro Asp Glu

65 70 75 80

Val Glu Ala Thr Val Ala Ala Val Glu Ala Arg Leu Gly Pro Val Asp

85 90 95

His Leu Val Asn Ala Ala Gly Ile Leu Arg Leu Gly Asp Ala Arg Thr

100 105 110

Leu Ser Asp Thr Asp Trp Ala Asp Thr Ile Ala Val Asn Ala Thr Gly

115 120 125

Val Phe His Met Ser Arg Ala Val Val Asn Arg Met Val Pro Arg Arg

130 135 140

Ser Gly Ala Leu Val Thr Val Ala Ser Asn Ala Ala Gly Thr Pro Arg

145 150 155 160

Thr Gln Met Ala Ala Tyr Ala Ala Ser Lys Ala Ala Ala Thr Met Phe

165 170 175

Thr Lys Cys Leu Gly Leu Glu Val Ala Glu Tyr Gly Ile Arg Cys Asn

180 185 190

Leu Val Ala Pro Gly Ser Thr Asp Thr Pro Met Leu Ser Ser Met Trp

195 200 205

His Asp Asp Ser Gly Arg Glu Ala Thr Val Arg Gly Ser Leu Glu Thr

210 215 220

Phe Lys Val Gly Ile Pro Leu Arg Lys Leu Ala Ala Pro Arg Asp Val

225 230 235 240

Ala Asp Ala Val Val Phe Leu Leu Ser Glu Glu Ala Ser His Ile Thr

245 250 255

Leu His Ala Leu Thr Val Asp Gly Gly Ala Thr Leu Gly Val

260 265 270

<210> 12

<211> 261

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 12

Met Thr Phe Asp Lys Asp Tyr Ile Ala Val Ile Thr Gly Ala Cys Gly

1 5 10 15

Gly Ile Gly Glu Ser Val Ala His Ala Leu Ala Lys Glu Gly Leu Ser

20 25 30

Leu Ala Leu Leu Asp Asn Asn Ala Thr Gln Leu Ala Thr Leu Val Ala

35 40 45

Thr Leu Gln Asp Asn His Pro Gln Pro Ile Ala Gly Phe Thr Val Asp

50 55 60

Val Ala Asp Asp Arg Cys Val Ala Glu Ala Phe Thr Ala Val Gly His

65 70 75 80

Gln Leu Gly Pro Val Gly Tyr Leu Val Asn Gly Ala Gly Val Leu Cys

85 90 95

His Ala Ser Val Ala Glu Thr Gln Pro Gln Asp Trp Ala Lys Thr Phe

100 105 110

Ala Val Asn Ala Thr Gly Val Phe Asn Thr Ser Arg His Ala Ala Asn

115 120 125

Leu Met Met Ala Gln Arg Lys Gly Ser Ile Val Thr Ile Ala Ser Asn

130 135 140

Ala Ala Arg Val Pro Arg Ala Thr Met Ala Ala Tyr Cys Ala Ser Lys

145 150 155 160

Ala Ala Ala Gln Ala Phe Thr Tyr Ala Leu Gly Leu Glu Val Ala Pro

165 170 175

Tyr Gly Ile Arg Cys Asn Val Val Ala Pro Gly Ser Thr Asp Thr Pro

180 185 190

Met Leu Arg Gly Met Trp His Ser Glu Ser Asp Lys Gln Asn Thr Leu

195 200 205

Asn Gly Asn Pro Gln Gln Phe Arg Ile Gly Ile Pro Leu Asn Lys Val

210 215 220

Ala Thr Ala Glu Glu Ile Ala Ala Ala Val Cys Phe Tyr Leu Cys Glu

225 230 235 240

Glu Ser Gly Gln Thr Thr Leu Ser Thr Leu Leu Val Asp Gly Gly Ala

245 250 255

Ala Leu Gly Ser Cys

260

<210> 13

<211> 285

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 13

Met Ala Arg Met Ser Thr Gly Arg Thr Gly Thr Gly Arg Ala Glu Pro

1 5 10 15

Glu Arg Arg Arg Ala His Pro Ala Met Glu Val Gly Thr Met Glu Asp

20 25 30

Lys Val Ala Leu Val Thr Gly Ala Ala Gly Gly Ile Gly Ala Ala Val

35 40 45

Ala Arg Ala Leu Ala Arg Arg Gly Ala Arg Val Ala Ala Val Asp Leu

50 55 60

His Thr Gly Arg Leu Thr Glu Glu Val Gly Lys Leu Thr Ala Asp Gly

65 70 75 80

Leu Ala Val Glu Ala Phe Pro Ala Asp Val Thr Arg Ala Ala Ala Val

85 90 95

Glu Glu Leu Val Glu Gly Val Glu Thr Arg Leu Gly Pro Val Asp Leu

100 105 110

Leu Val Asn Ala Ala Gly Val Leu Arg Leu Gly Pro Val His Arg Leu

115 120 125

Gly Asp Glu Asp Trp Ala Ala Thr Phe Ala Val Asn Thr Thr Gly Val

130 135 140

Phe Leu Val Ser Arg Ala Val Ala Gly Arg Met Met Pro Arg Ser Arg

145 150 155 160

Gly Ala Ile Val Thr Val Ala Ser Asn Ala Ala Gly Thr Pro Arg Thr

165 170 175

Glu Met Ala Ala Tyr Ala Ala Ser Lys Ala Ala Ala Thr Met Phe Thr

180 185 190

Lys Cys Leu Ala Leu Glu Val Ala Gly His Gly Ile Arg Cys Asn Val

195 200 205

Val Ala Pro Gly Ser Thr Asp Thr Ala Met Leu Arg Ser Met Trp Gln

210 215 220

Asp Glu Ser Gly Ala Arg Ala Thr Ile Glu Gly Arg Pro Glu Ala Tyr

225 230 235 240

Lys Leu Gly Ile Pro Leu Gly Lys Leu Ala Arg Pro Ala Asp Ile Ala

245 250 255

Asp Ala Val Val Phe Leu Leu Ser Asp Arg Ala Gly His Ile Thr Met

260 265 270

His Glu Leu Thr Val Asp Gly Gly Ala Thr Leu Gly Ala

275 280 285

<210> 14

<211> 275

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 14

Met Thr His Gly Pro Asp Gln Asp Gly Leu Gly Leu Glu Gly Arg Val

1 5 10 15

Ala Val Val Thr Gly Ala Ala Gly Gly Ile Gly Ala Glu Thr Val Ala

20 25 30

Gln Leu Val Arg His Arg Ala Ala Val Ala Leu Val Asp Arg Asp Gly

35 40 45

Pro Ala Leu Asp Glu Leu Val Ala Arg Leu Arg Lys Glu Ala Ala Ala

50 55 60

Asp Pro Arg Ala Pro Glu Pro Arg Leu Leu Ala Val Pro Ala Asp Val

65 70 75 80

Ser His Gly Gly Glu Val Thr Ala Val Val Glu Arg Val Glu Ser Glu

85 90 95

Leu Gly Pro Ile Thr His Leu Val Asn Ala Ala Gly Ile Leu Arg Pro

100 105 110

Gly Pro Val Ala Gly Leu Ser Glu Arg Asp Trp Asp Asp Thr Leu Ala

115 120 125

Val Asn Ala Thr Gly Val Tyr Leu Met Ser Arg Ala Val Ala Ser Arg

130 135 140

Met Ala Pro Arg Gly Phe Gly Ala Ile Val Thr Val Thr Ser Asn Ala

145 150 155 160

Ala Arg Thr Ala Arg Thr Gly Met Ala Ala Tyr Ala Ala Ser Lys Ala

165 170 175

Ala Ala Gln Ala Phe Thr Lys Cys Leu Gly Leu Glu Leu Ala Gly Thr

180 185 190

Gly Ile Arg Cys Asn Val Val Ala Pro Gly Ser Thr Asp Thr Pro Met

195 200 205

Leu Thr Ser Leu Trp Glu Gly Glu Asp Ala Gly Arg Pro Ser Ile Glu

210 215 220

Gly Ala Pro Glu Ala Tyr Arg Val Gly Ile Pro Thr Gly Arg Leu Ala

225 230 235 240

Arg Pro Tyr Asp Val Ala Gln Ala Val Val Phe Leu Leu Ser Glu Arg

245 250 255

Ala Gly His Ile Thr Leu Gln Asp Leu Thr Val Asp Gly Gly Ala Thr

260 265 270

Leu Gly Val

275

<210> 15

<211> 256

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 15

Met Lys Asp Thr Ile Ala Val Val Thr Gly Ala Ala Gly Gly Ile Gly

1 5 10 15

Ala Ala Val Ala Glu Ala Leu Ala Val Arg Gly Ala Ser Val Ala Leu

20 25 30

Leu Asp Arg Asp Ala Asp Arg Leu Ala Val Val Ala Lys Glu Leu Thr

35 40 45

Ser Ala Gly His Arg Ala Thr Ala Phe Pro Ala Asp Val Thr Ser Gly

50 55 60

Gln Asp Val Glu Ala Val Ile Glu Ala Val Glu Glu Arg Leu Gly Pro

65 70 75 80

Val Asp Arg Leu Val Asn Ala Ala Gly Val Leu Arg Thr Gly Pro Ala

85 90 95

His Glu Phe Ala Asp Glu Asp Trp Glu Ala Thr Phe Ala Val Asn Thr

100 105 110

Thr Gly Val Phe His Val Ser Arg Ala Val Val Arg Arg Met Arg Thr

115 120 125

Arg Arg Arg Gly Ala Leu Val Thr Ile Ala Ser Asn Ala Ala Gly Ser

130 135 140

Ala Arg Thr Glu Met Ala Ala Tyr Ala Ala Ser Lys Ala Ala Ala Ser

145 150 155 160

Met Phe Thr Lys Cys Leu Gly Leu Glu Asn Ala Ala Tyr Gly Ile Arg

165 170 175

Cys Asn Val Val Ala Pro Gly Ser Thr Asp Thr Pro Met Leu Thr Ala

180 185 190

Leu Trp Asp Asp Ala Ser Ala Ala Asp Ala Ser Ile Ala Gly Val Pro

195 200 205

Glu Ala Tyr Arg Val Gly Ile Pro Leu Ala Lys Leu Ala Arg Pro Lys

210 215 220

Asp Val Ala Asp Ala Val Leu Phe Leu Leu Ser Asp Gln Ala Ser His

225 230 235 240

Ile Thr Met His His Leu Thr Val Asp Gly Gly Ala Thr Leu Gly Ala

245 250 255

<210> 16

<211> 274

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 16

Met Ser Asp Thr Leu Thr Thr Thr Gly Thr Thr Gly Thr Ala Ala Ala

1 5 10 15

Ala Gly Ala Glu Trp Ser Gly Ser Ala Val Val Thr Gly Ala Ala Gly

20 25 30

Gly Ile Gly Ala Glu Ile Ala Arg Ala Leu Ala Ala Ala Gly Val Pro

35 40 45

Val Ala Leu Leu Asp Arg Glu Pro Gly Ala Leu Arg Glu Leu Ala Ser

50 55 60

Glu Leu Ser Ala Ala Gly Gly Thr Val Leu Ala Val Ala Ala Asp Val

65 70 75 80

Thr Asp Ser Ala Asp Val Asp Ala Ala Val Ala Lys Ala Glu Ala Glu

85 90 95

Leu Gly Pro Val Ala Tyr Leu Val Asn Gly Ala Gly Val Leu His Ser

100 105 110

Gly Pro Ala Gly Glu Phe Ser Asp Glu Asp Trp Asp His Thr Leu Ala

115 120 125

Val Asn Ala Gly Gly Val Phe Arg Val Ser Arg Ala Val Ala Arg Leu

130 135 140

Met Val Pro Arg Gly Arg Gly Ser Ile Val Thr Ile Ala Ser Asn Ala

145 150 155 160

Ala Leu Thr Pro Arg Thr Ser Met Ala Ala Tyr Ala Ala Ser Lys Ala

165 170 175

Ala Ser Ala Met Phe Thr Lys Cys Leu Gly Leu Glu Leu Gly Arg His

180 185 190

Gly Ile Arg Cys Asn Val Val Ala Pro Gly Ser Thr Arg Thr Ser Met

195 200 205

Leu Thr Ala Leu Gln Gly Asp Ala Ala Val Arg Ala Ser Val Asp Gly

210 215 220

Val Pro Asp Ala Tyr Arg Val Gly Ile Pro Leu Gly Arg Ile Ala Glu

225 230 235 240

Pro Ala His Ile Ala Asp Ala Val Leu Phe Leu Leu Ser Asp Arg Ser

245 250 255

Ala His Ile Thr Leu Gln Asp Leu Thr Val Asp Gly Gly Ala Ala Leu

260 265 270

Gly Val

<210> 17

<211> 207

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 17

Met Ser Gly Ile Pro Glu Ile Thr Ala Tyr Pro Leu Pro Thr Ala Gln

1 5 10 15

Gln Leu Pro Ala Asn Leu Ala Arg Trp Ser Leu Glu Pro Arg Arg Ala

20 25 30

Val Leu Leu Val His Asp Met Gln Arg Tyr Phe Leu Arg Pro Leu Pro

35 40 45

Glu Ser Leu Arg Ala Gly Leu Val Ala Asn Ala Ala Arg Leu Arg Arg

50 55 60

Trp Cys Val Glu Gln Gly Val Gln Ile Ala Tyr Thr Ala Gln Pro Gly

65 70 75 80

Ser Met Thr Glu Glu Gln Arg Gly Leu Leu Lys Asp Phe Trp Gly Pro

85 90 95

Gly Met Arg Ala Ser Pro Ala Asp Arg Glu Val Val Glu Glu Leu Ala

100 105 110

Pro Gly Pro Asp Asp Trp Leu Leu Thr Lys Trp Arg Tyr Ser Ala Phe

115 120 125

Phe His Ser Asp Leu Leu Gln Arg Met Arg Ala Ala Gly Arg Asp Gln

130 135 140

Leu Val Leu Cys Gly Val Tyr Ala His Val Gly Val Leu Ile Ser Thr

145 150 155 160

Val Asp Ala Tyr Ser Asn Asp Ile Gln Pro Phe Leu Val Ala Asp Ala

165 170 175

Ile Ala Asp Phe Ser Glu Ala His His Arg Met Ala Leu Glu Tyr Ala

180 185 190

Ala Ser Arg Cys Ala Met Val Val Thr Thr Asp Glu Val Leu Glu

195 200 205

<210> 18

<211> 627

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 18

Met Asn Ala Leu Pro Thr Ser Leu Leu Gln Arg Leu Leu Glu Arg Pro

1 5 10 15

Ala Pro Phe Ala Leu Leu Tyr Arg Pro Glu Ser Asn Gly Pro Gly Leu

20 25 30

Leu Asp Val Ile Arg Gly Glu Ala Leu Glu Leu His Gly Leu Ala Asp

35 40 45

Leu Pro Leu Asp Glu Pro Gly Pro Gly Leu Pro Arg His Asp Leu Leu

50 55 60

Ala Leu Ile Pro Tyr Arg Gln Ile Ala Glu Arg Gly Phe Glu Ala Leu

65 70 75 80

Asp Asp Gly Thr Pro Leu Leu Ala Leu Lys Val Leu Glu Gln Glu Leu

85 90 95

Leu Pro Leu Glu Gln Ala Leu Ala Leu Leu Pro Asn Gln Ala Leu Glu

100 105 110

Leu Ser Glu Glu Gly Phe Asp Leu Asp Asp Glu Ala Tyr Ala Glu Val

115 120 125

Val Gly Arg Val Ile Ala Asp Glu Ile Gly Arg Gly Glu Gly Ala Asn

130 135 140

Phe Val Ile Lys Arg Arg Phe Gln Ala Arg Ile Asp Gly Tyr Ala Thr

145 150 155 160

Ala Ser Ala Leu Ser Phe Phe Arg Gln Leu Leu Leu Arg Glu Lys Gly

165 170 175

Ala Tyr Trp Thr Phe Ile Val His Thr Gly Glu Arg Thr Leu Val Gly

180 185 190

Ala Ser Pro Glu Arg His Ile Ser Val Arg Asp Gly Leu Ala Val Met

195 200 205

Asn Pro Ile Ser Gly Thr Tyr Arg Tyr Pro Pro Ala Gly Pro Asn Leu

210 215 220

Ala Glu Val Met Glu Phe Leu Asp Asn Arg Lys Glu Ala Asp Glu Leu

225 230 235 240

Tyr Met Val Val Asp Glu Glu Leu Lys Met Met Ala Arg Ile Cys Glu

245 250 255

Asp Gly Gly Arg Val Leu Gly Pro Tyr Leu Lys Glu Met Ala His Leu

260 265 270

Ala His Thr Glu Tyr Phe Ile Glu Gly Gln Thr Ser Arg Asp Val Arg

275 280 285

Glu Val Leu Arg Glu Thr Leu Phe Ala Pro Thr Val Thr Gly Ser Pro

290 295 300

Leu Glu Ser Ala Cys Arg Val Ile Arg Arg Tyr Glu Pro Gln Gly Arg

305 310 315 320

Gly Tyr Tyr Ser Gly Val Ala Ala Leu Ile Gly Gly Asp Gly Gln Gly

325 330 335

Gly Arg Thr Leu Asp Ser Ala Ile Leu Ile Arg Thr Ala Glu Ile Glu

340 345 350

Gly Asp Gly Arg Leu Arg Ile Gly Val Gly Ser Thr Ile Val Arg His

355 360 365

Ser Asp Pro Leu Gly Glu Ala Ala Glu Ser Arg Ala Lys Ala Ser Gly

370 375 380

Leu Ile Ala Ala Leu Lys Ser Gln Ala Pro Gln Arg Leu Gly Ser His

385 390 395 400

Pro His Val Val Ala Ala Leu Ala Ser Arg Asn Ala Pro Ile Ala Asp

405 410 415

Phe Trp Leu Arg Gly Ala Ser Glu Arg Gln Gln Leu Gln Ala Asp Leu

420 425 430

Ser Gly Arg Glu Val Leu Ile Val Asp Ala Glu Asp Thr Phe Thr Ser

435 440 445

Met Ile Ala Lys Gln Leu Lys Ser Leu Gly Leu Thr Val Thr Val Arg

450 455 460

Gly Phe Gln Glu Pro Tyr Ser Phe Asp Gly Tyr Asp Leu Val Ile Met

465 470 475 480

Gly Pro Gly Pro Gly Asn Pro Thr Glu Ile Gly Gln Pro Lys Ile Gly

485 490 495

His Leu His Leu Ala Ile Arg Ser Leu Leu Ser Glu Arg Arg Pro Phe

500 505 510

Leu Ala Val Cys Leu Ser His Gln Val Leu Ser Leu Cys Leu Gly Leu

515 520 525

Asp Leu Gln Arg Arg Gln Glu Pro Asn Gln Gly Val Gln Lys Gln Ile

530 535 540

Asp Leu Phe Gly Ala Ala Glu Arg Val Gly Phe Tyr Asn Thr Phe Ala

545 550 555 560

Ala Arg Ala Leu Gln Asp Arg Ile Glu Ile Pro Glu Val Gly Pro Ile

565 570 575

Glu Ile Ser Arg Asp Arg Glu Thr Gly Glu Val His Ala Leu Arg Gly

580 585 590

Pro Arg Phe Ala Ser Met Gln Phe His Pro Glu Ser Val Leu Thr Arg

595 600 605

Glu Gly Pro Arg Ile Ile Ala Asp Leu Leu Arg His Ala Leu Val Glu

610 615 620

Arg Arg Pro

625

<210> 19

<211> 185

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 19

Met Met Phe Thr Phe Gly Lys Pro Leu Asn Phe Gln Arg Trp Leu Asp

1 5 10 15

Asp His Ser Asp Leu Leu Arg Pro Pro Val Gly Asn Gln Gln Val Trp

20 25 30

Gln Asp Ser Asp Phe Ile Val Thr Val Val Gly Gly Pro Asn Phe Arg

35 40 45

Thr Asp Phe His Asp Asp Pro Met Glu Glu Phe Phe Tyr Gln Phe Lys

50 55 60

Gly Asn Ala Tyr Leu Asn Ile Met Asp Arg Gly Gln Met Asp Arg Val

65 70 75 80

Glu Leu Lys Glu Gly Asp Ile Phe Leu Leu Pro Pro His Leu Arg His

85 90 95

Ser Pro Gln Arg Pro Glu Ala Gly Ser Arg Cys Leu Val Ile Glu Arg

100 105 110

Gln Arg Pro Lys Gly Met Leu Asp Gly Phe Glu Trp Tyr Cys Leu Ser

115 120 125

Cys Asn Gly Leu Val Tyr Arg Val Asp Val Gln Leu Asn Ser Ile Val

130 135 140

Thr Asp Leu Pro Pro Leu Phe Asp Ile Phe Tyr Gly Asn Val Gly Leu

145 150 155 160

Arg Lys Cys Pro Gln Cys Gly Gln Val His Pro Gly Lys Ala Ala Ile

165 170 175

Glu Ala Val Ala Arg Gly Asp Gln Pro

180 185

37页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:酶催化制备半胱氨酸寡肽及其膜敷料的制备方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类