支链α-酮酸脱氢酶复合体在制备丙二酸单酰辅酶A中的应用

文档序号:900168 发布日期:2021-02-26 浏览:23次 >En<

阅读说明:本技术 支链α-酮酸脱氢酶复合体在制备丙二酸单酰辅酶A中的应用 (Application of branched-chain alpha-ketoacid dehydrogenase complex in preparation of malonyl-CoA ) 是由 刘伟丰 刘波 崔倩倩 陶勇 于 2019-08-23 设计创作,主要内容包括:本发明公开了支链α-酮酸脱氢酶复合体在制备丙二酸单酰辅酶A中的应用。本发明公开了利用支链α-酮酸脱氢酶复合体制备丙二酸单酰辅酶A的方法,该方法包括向生物细胞中导入支链α-酮酸脱氢酶复合体的编码基因,并使支链α-酮酸脱氢酶复合体的编码基因得到表达,得到重组细胞;该培养重组细胞,得到丙二酸单酰辅酶A;支链α-酮酸脱氢酶复合体为由M1)或M2)组成的成套蛋白质:M1)bkdF、bkdG、bkdH和lpdA1;M2)bkdA、bkdB、bkdC和lpdA1。实验证明,利用支链α-酮酸脱氢酶复合体不仅可以制备丙二酸单酰辅酶A,还可以制备以丙二酸单酰辅酶A为中间产物的目的产物。(The invention discloses an application of a branched-chain alpha-ketoacid dehydrogenase complex in preparation of malonyl-CoA. The present invention discloses a method for producing malonyl-CoA using a branched-chain alpha-ketoacid dehydrogenase complex, which comprises introducing a gene encoding a branched-chain alpha-ketoacid dehydrogenase complex into a biological cell, and expressing the gene encoding the branched-chain alpha-ketoacid dehydrogenase complex to obtain a recombinant cell; culturing the recombinant cell to obtain malonyl coenzyme A; the branched-chain alpha-ketoacid dehydrogenase complex is a protein set consisting of M1) or M2): m1) bkdF, bkdG, bkdH and lpdA 1; m2) bkdA, bkdB, bkdC and lpdA 1. Experiments prove that the branched-chain alpha-ketoacid dehydrogenase complex can be used for preparing the malonyl coenzyme A and preparing a target product taking the malonyl coenzyme A as an intermediate product.)

支链α-酮酸脱氢酶复合体在制备丙二酸单酰辅酶A中的应用

技术领域

本发明涉及生物技术领域中,支链α-酮酸脱氢酶复合体在制备丙二酸单酰辅酶A中的应用。

背景技术

黄酮化合物普遍存在于自然界的植物中,是含有2-苯基色原酮结构的一类化合物,属于植物次生代谢产物。黄酮化合物具有抗自由基和抗氧化作用,同时该类化合物还具有抑菌、抗肿瘤和增强机体免疫功能等。聚酮化合物也是一类重要次级代谢产物,由细菌、真菌、放线菌或植物通过低级羧酸如乙酸、丙二酸、丁酸等连续脱羧缩合形成,其合成途径类似于长链脂肪酸,因其重要的生物活性在临床上作为抗生素而得到广泛应用,如红霉素、抗癌药物多柔比星、抗真菌剂两性霉素、抗寄生虫剂阿维菌素、杀虫剂多杀菌素以及免疫抑制剂雷帕霉素等。

工业上聚酮化合物主要由其天然产生菌链霉菌生产,但采用链霉菌生产面临生产菌株调控复杂、产量不易提高等问题。尝试以遗传背景清晰的大肠杆菌为底盘细胞来合成聚酮化合物,不仅有利于实现目标化合物的高水平合成,也有助于阐明聚酮化合物的合成调控机理。目前红霉素等聚酮化合物已经在大肠杆菌中成功合成,但其产量仍然较低,主要原因是聚酮化合物的合成受胞内丙二酸单酰辅酶A含量的限制,此外丙二酸单酰辅酶A也是黄酮化合物合成的重要前体,黄酮化合物的生物合成也受到丙二酸单酰辅酶A含量的限制。

丙二酸单酰辅酶A作为聚酮、黄酮化合物以及脂肪酸合成的重要前体物质,其胞内含量的提高是该类化合物高水平合成的关键。在中央代谢途径中,葡萄糖作为碳源,通过一系列的酶反应得到丙酮酸,丙酮酸在丙酮酸脱氢酶的催化下生成CO2和乙酰辅酶A。大部分的乙酰辅酶A进入三羧酸循环,少量的乙酰辅酶A参与脂肪酸的合成,丙二酸单酰辅酶A是脂肪酸合成的直接前体,是由乙酰辅酶A羧化酶催化乙酰辅酶A得到,该步反应不仅耗能,还涉及CO2的固定。同时,在大肠杆菌中,为了协调磷脂、大分子物质合成和细胞生长等关系,调控脂肪酸合成比例,细胞内丙二酸单酰辅酶A浓度通常被控制的很低。为了提高前体物质的合成水平,当前许多研究集中在代谢流调控领域,通过多靶点遗传操作的代谢工程技术来提高细胞中丙二酸单酰辅酶A的产量,例如提高关键酶乙酰辅酶A羧化酶的表达水平,敲除乙酰辅酶A和丙二酸单酰辅酶A的竞争性支路等策略。

发明内容

本发明的目的是提供支链α-酮酸脱氢酶复合体的一种新功能,支链α-酮酸脱氢酶复合体可以以草酰乙酸为底物进行催化反应,合成丙二酸单酰辅酶A。

本发明首先提供了一种制备丙二酸单酰辅酶A的方法,所述方法包括11)和12):

11)向生物细胞中导入支链α-酮酸脱氢酶复合体的编码基因,并使所述支链α-酮酸脱氢酶复合体的编码基因得到表达,得到重组细胞,将该重组细胞记为重组细胞A;

12)培养所述重组细胞A,制备得到丙二酸单酰辅酶A。

上述方法中,所述支链α-酮酸脱氢酶复合体可为下述M1)或M2):

M1)由bkdF蛋白质(支链α酮酸脱氢酶E1α亚基)、bkdG蛋白质(支链β酮酸脱氢酶E1β亚基)、bkdH蛋白质(支链α酮酸脱氢酶E2亚基)和lpdA1蛋白质(支链α酮酸脱氢酶E3亚基)组成的成套蛋白质;

M2)由bkdA蛋白质(支链α酮酸脱氢酶E1α亚基)、bkdB蛋白质(支链β酮酸脱氢酶E1β亚基)、bkdC蛋白质(支链α酮酸脱氢酶E2亚基)和所述lpdA1蛋白质组成的成套蛋白质;

所述支链α-酮酸脱氢酶复合体的编码基因可为下述L1)或L2):

L1)由所述bkdF蛋白质的编码基因、所述bkdG蛋白质的编码基因、所述bkdH蛋白质的编码基因和所述lpdA1蛋白质的编码基因组成的成套基因;

L2)由所述bkdA蛋白质的编码基因、所述bkdB蛋白质的编码基因、所述bkdC蛋白质的编码基因和所述lpdA1蛋白质的编码基因组成的成套基因。

上述方法中,所述bkdF蛋白质、所述bkdG蛋白质、所述bkdH蛋白质、所述lpdA1蛋白质、所述bkdA蛋白质、所述bkdB蛋白质和所述bkdC蛋白质及其编码基因可来源于阿维链霉菌(Streptomyces avermitilis)。

上述方法中,所述bkdF蛋白质可为下述a1)或a2)的蛋白质:

a1)序列表中序列10所示的蛋白质;

a2)将序列表中序列10的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列10的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述bkdG蛋白质可为下述a3)或a4)的蛋白质:

a3)序列表中序列11所示的蛋白质;

a4)将序列表中序列11的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列11的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述bkdH蛋白质可为下述a5)或a6)的蛋白质:

a5)序列表中序列12所示的蛋白质;

a6)将序列表中序列12的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列12的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述lpdA1蛋白质可为下述a7)或a8)的蛋白质:

a7)序列表中序列13所示的蛋白质;

a8)将序列表中序列13的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列13的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述bkdA蛋白质可为下述a9)或a10)的蛋白质:

a9)序列表中序列7所示的蛋白质;

a10)将序列表中序列7的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列7的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述bkdB蛋白质可为下述a11)或a12)的蛋白质:

a11)序列表中序列8所示的蛋白质;

a12)将序列表中序列8的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列8的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述bkdC蛋白质可为下述a13)或a14)的蛋白质:

a13)序列表中序列9所示的蛋白质;

a14)将序列表中序列9的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列9的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

上述方法中,所述bkdF蛋白质的编码基因可为下述b1)或b2):

b1)序列表中序列2的第1-1221位所示的DNA分子;

b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

所述bkdG蛋白质的编码基因可为下述b3)或b4):

b3)序列表中序列2的第1223-2200位所示的DNA分子;

b4)与b3)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

所述bkdH蛋白质的编码基因可为下述b5)或b6)或b7):

b5)序列表中序列3所示的DNA分子;

b6)序列表中序列2的第2220-3608位所示的DNA分子;

b7)与b5)或b6)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

所述lpdA1蛋白质的编码基因可为下述b8)或b9)或b10):

b8)序列表中序列5所示的DNA分子;

b9)序列表中序列4所示的DNA分子;

b10)与b8)或b9)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

所述bkdA蛋白质的编码基因可为下述b11)或b12):

b11)序列表中序列1的第1-1146位所示的DNA分子;

b12)与b11)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

所述bkdB蛋白质的编码基因可为下述b13)或b14):

b13)序列表中序列1的第1220-2224位所示的DNA分子;

b14)与b13)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

所述bkdC蛋白质的编码基因可为下述b15)或b16):

b15)序列表中序列1的第2224-3591位所示的DNA分子;

b16)与b15)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

上述方法中,所述向生物细胞中导入支链α-酮酸脱氢酶复合体的编码基因具体可为将包含所述支链α-酮酸脱氢酶复合体的编码基因的表达载体导入所述生物细胞。

所述表达载体均可为质粒、黏粒、噬菌体或病毒载体。所述质粒具体可为pYB1k或pLB1a,所述pYB1k的序列为序列表中序列6,所述pLB1a的序列为序列表中序列24。

所述支链α-酮酸脱氢酶复合体的编码基因的四个独立基因(上述L1)或L2))可通过含有各个基因的共表达载体导入所述生物细胞中。所述共表达载体可为pYB1k-bkdABC-lpdA1、pYB1k-bkdFGH-lpdA1或pYB1k-bkdFG-opbkdH-oplpdA1;所述pYB1k-bkdABC-lpdA1为向所述pYB1k中插入所述bkdA蛋白质的编码基因、所述bkdB蛋白质的编码基因、所述bkdC蛋白质的编码基因和所述lpdA1蛋白质的编码基因得到的重组载体,能表达所述bkdA蛋白质、所述bkdB蛋白质、所述bkdC蛋白质和所述lpdA1蛋白质;所述pYB1k-bkdFGH-lpdA1和所述pYB1k-bkdFG-opbkdH-oplpdA1均为为向所述pYB1k中插入所述bkdF蛋白质的编码基因、所述bkdG蛋白质的编码基因、所述bkdH蛋白质的编码基因和所述lpdA1蛋白质的编码基因得到的重组载体,均能表达所述bkdF蛋白质、所述bkdG蛋白质、所述bkdH蛋白质和所述lpdA1蛋白质。

上述方法中,所述生物细胞含有支链α-酮酸合成途径,步骤11)还可包括抑制所述生物细胞中支链α-酮酸的合成。

所得重组细胞A中含有所述支链α-酮酸脱氢酶复合体的编码基因,且其支链α-酮酸的合成受到抑制。

上述方法中,所述抑制支链α-酮酸的合成可通过敲除所述生物细胞中支链α-酮酸合成途径中的至少一个基因,或降低支链α-酮酸合成途径中的至少一个基因编码蛋白质的含量或活性实现。

上述方法中,所述抑制支链α-酮酸的合成可通过敲除所述生物细胞中的ilvA基因(苏氨酸脱氨酶基因)或/和ilvE基因(支链氨基酸转氨酶基因),或降低所述生物细胞中的所述ilvA基因或/和所述ilvE基因编码蛋白质的含量或活性实现。

所述生物细胞含有所述ilvA基因或/和所述ilvE基因。

上述方法中,所述ilvA基因可编码下述a15)或a16)的蛋白质:

a15)序列表中序列15所示的蛋白质;

a16)将序列表中序列15的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列15的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述ilvE基因可编码下述a17)或a18)的蛋白质:

a17)序列表中序列17所示的蛋白质;

a18)将序列表中序列17的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列17的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

进一步,

所述ilvA基因可为下述b17)或b18):

b17)序列表中序列14所示的DNA分子;

b18)与b17)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

所述ilvE基因可为下述b19)或b20):

b19)序列表中序列16所示的DNA分子;

b20)与b19)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

上述方法中,敲除所述生物细胞中的ilvA基因可利用同源重组进行,具体可利用具有所述ilvA基因敲除性状的大肠杆菌菌株JW3745来实现。

上述方法中,敲除所述生物细胞中的ilvE基因可利用同源重组进行,具体可利用具有所述ilvE基因敲除性状的大肠杆菌菌株JW5606来实现。

上述方法中,步骤11)还可包括向所述生物细胞中导入ppc蛋白质(磷酸烯醇式丙酮酸羧化酶)的编码基因并使所述编码基因得到表达,或增加所述生物细胞中所述ppc蛋白质的含量或增强所述ppc蛋白质的活性。所得重组细胞A中含有所述支链α-酮酸脱氢酶复合体的编码基因和所述ppc蛋白质的编码基因,且其支链α-酮酸的合成受到抑制。

进一步,所述ppc蛋白质及其编码基因可来源于谷氨酸棒状杆菌。

更进一步,所述ppc蛋白质可为下述a19)或a20):

a19)序列表中序列19所示的蛋白质;

a20)将序列表中序列19的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列19的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述ppc蛋白质的编码基因可为下述b21)或b22):

b21)序列表中序列18所示的DNA分子;

b22)与b21)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

上述方法中,所述生物细胞能表达外膜蛋白酶VII,步骤11)还可包括敲除所述生物细胞中所述外膜蛋白酶VII的编码基因,或降低所述生物细胞中所述外膜蛋白酶VII的含量或活性。

进一步,所述外膜蛋白酶VII可为ompT蛋白质。

更进一步,所述ompT蛋白质为下述a21)或a22):

a21)序列表中序列28所示的蛋白质;

a22)将序列表中序列28的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列28的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述ompT蛋白质的编码基因为下述b23)或b24):

b23)序列表中序列27所示的DNA分子;

b24)与b23)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

上述方法中,所述向生物细胞中导入ppc蛋白质的编码基因具体可为将包含所述ppc蛋白质的编码基因的表达载体导入所述生物细胞,也可通过将所述ppc蛋白质的编码基因重组至所述生物细胞的基因组中并使所述ppc蛋白质的编码基因得到表达实现。

上述方法中,所述生物细胞可含有草酰乙酸合成途径,能合成草酰乙酸。

进一步,所述生物细胞可为微生物细胞、动物细胞或植物细胞。

更进一步,所述微生物细胞可为N1)或N2)或N3):N1)细菌或真菌;N2)大肠杆菌;N3)大肠杆菌BW25113。

本发明还提供了制备丙二酸单酰辅酶A的方法,所述方法包括:以草酰乙酸为底物,采用所述支链α-酮酸脱氢酶复合体进行催化反应,得到丙二酸单酰辅酶A。

上述方法中,所述催化反应可在F缓冲液中进行;所述F缓冲液由溶剂和溶质组成,所述溶剂为50mM Tris-HCl缓冲液(pH=7.0),所述溶质及其在所述F缓冲液中的浓度分别为0.1mM辅酶A、0.2mM二硫苏糖醇、0.2mM磷酸三苯酯、1mM MgSO4和2mM NAD+(氧化型烟酰胺腺嘌呤二核苷酸)。

所述催化反应可在30-37℃下进行。进一步,所述催化反应可在30℃下进行。

本发明还提供了生产以丙二酸单酰辅酶A为中间产物的目的产物的方法,所述方法包括:培养所述重组细胞A,制备得到目标产物。

上述方法中,所述目标产物可为3-羟基丙酸,所述方法包括:向所述重组细胞A中导入mcr蛋白质(丙二酸单酰辅酶A还原酶)的编码基因并使所述编码基因得到表达,或增加所述重组细胞A中所述mcr蛋白质的含量或增强所述mcr蛋白质的活性,得到重组细胞,将该重组细胞记为重组细胞-mcr;培养所述重组细胞-mcr,制备得到所述目标产物。

进一步,所述mcr蛋白质及其编码基因可来源于嗜热光全绿丝菌(Chloroflexusaurantiacus)。

更进一步,所述mcr蛋白质可由mcr N端结构域和mcr C端结构域组成,所述mcr N端结构域可为下述a23)或a24):

a23)序列表中序列22所示的蛋白质;

a24)将序列表中序列22的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列22的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质;

所述mcr C端结构域可为下述a25)或a26):

a25)序列表中序列23所示的蛋白质;

a26)将序列表中序列23的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列23的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述mcr蛋白质的编码基因可由所述mcr N端结构域的编码基因和所述mcr C端结构域的编码基因组成,所述mcr N端结构域的编码基因可为下述b25)或b26):

b25)序列表中序列21的第1-1689位所示的DNA分子;

b26)与b25)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子;

所述mcr C端结构域的编码基因可为下述b27)或b28):

b27)序列表中序列21的第1704-3749位所示的DNA分子;

b28)与b27)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

再进一步,所述mcr蛋白质的编码基因可为下述b29)或b30):

b29)序列表中序列21所示的DNA分子;

b30)与b29)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

序列21的第1-1689位为所述mcr N端结构域核苷酸序列,第1704-3749位为所述mcr C端结构域核苷酸序列,第1691-1696位为RBS位点的序列。

上述方法中,所述向生物细胞中导入mcr蛋白质的编码基因具体可为将包含所述mcr蛋白质的编码基因的表达载体导入所述生物细胞。

所述表达载体均可为质粒、黏粒、噬菌体或病毒载体。所述质粒具体可为pYB1k或pLB1a,所述pYB1k的序列为序列表中序列6,所述pLB1a的序列为序列表中序列24。

所述包含所述mcr蛋白质的编码基因的表达载体可为pLB1a-mcr;所述pLB1a-mcr为向所述pLB1a中插入所述mcr蛋白质的编码基因得到的重组载体,能表达所述mcr蛋白质。

在实际应用中,可根据目标产物生产过程中是否需要支链α-酮酸的参与进一步确定是否需要抑制支链α-酮酸的合成,目标产物生产过程中需要支链α-酮酸的参与时,可不抑制支链α-酮酸的合成,目标产物生产过程中不需要支链α-酮酸的参与时,可通过抑制支链α-酮酸的合成,进一步提高目标产物的产量。

上述方法中,所述目标产物可为苦味酸或苦味酸合成途径中丙二酸单酰辅酶A至苦味酸间的中间产物,所述方法包括:向所述重组细胞A中导入vps蛋白质(苯戊酮合成酶)的编码基因并使所述编码基因得到表达,或增加所述重组细胞A中所述vps蛋白质的含量或增强所述vps蛋白质的活性,得到重组细胞,将该重组细胞记为重组细胞-vps;培养所述重组细胞-vps,制备得到所述目标产物。

进一步,所述vps蛋白质及其编码基因可来源于啤酒花(Humulus lupulus);

更进一步,所述vps蛋白质可为下述a27)或a28):

a27)序列表中序列26所示的蛋白质;

a28)将序列表中序列26的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与序列26的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。

所述vps蛋白质的编码基因可为下述b31)或b32):

b31)序列表中序列25所示的DNA分子;

b32)与b31)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子。

上述方法中,所述向生物细胞中导入vps蛋白质的编码基因具体可为将包含所述vps蛋白质的编码基因的表达载体导入所述生物细胞。

所述表达载体均可为质粒、黏粒、噬菌体或病毒载体。所述质粒具体可为pYB1k或pLB1a,所述pYB1k的序列为序列表中序列6,所述pLB1a的序列为序列表中序列24。

所述包含所述vps蛋白质的编码基因的表达载体可为pLB1a-vps;所述pLB1a-vps为向所述pLB1a中插入所述vps蛋白质的编码基因得到的重组载体,能表达所述vps蛋白质。

所述中间产物不包括丙二酸单酰辅酶A和苦味酸。在本发明的一个实施例中,所述中间产物为3-甲基-异丁酰间苯三酚(PIVP)。

本发明还提供了一种成套试剂,所述成套试剂为成套试剂甲或成套试剂乙或成套试剂丙;

所述成套试剂甲包括所述支链α-酮酸脱氢酶复合体或所述支链α-酮酸脱氢酶复合体的编码基因;

所述成套试剂乙由所述成套试剂甲与所述mcr蛋白质或所述mcr蛋白质的编码基因组成;

所述成套试剂丙由所述成套试剂甲与所述vps蛋白质或所述vps蛋白质的编码基因组成。

所述成套试剂甲还可包括所述ppc蛋白质或所述ppc蛋白质的编码基因。

所述成套试剂甲还可包括抑制支链α-酮酸合成的物质。

所述抑制支链α-酮酸合成的物质可为敲除生物细胞中支链α-酮酸合成途径中的至少一个基因,或降低支链α-酮酸合成途径中的至少一个基因编码蛋白质的含量或活性所需的物质。

所述抑制支链α-酮酸合成的物质可为敲除生物细胞中的ilvA基因或/和ilvE基因所需的物质。

所述生物细胞含有所述ilvA基因或/和所述ilvE基因。

所述敲除生物细胞中的ilvA基因具体可为含有ilvA基因敲除性状的基因片段或菌株(如大肠杆菌菌株JW3745)。

所述敲除生物细胞中的ilvE基因具体可为含有ilvE基因敲除性状的基因片段或菌株(如大肠杆菌菌株JW5606)。

所述成套试剂甲可仅由所述支链α-酮酸脱氢酶复合体或所述支链α-酮酸脱氢酶复合体的编码基因组成,还可由所述支链α-酮酸脱氢酶复合体或所述支链α-酮酸脱氢酶复合体的编码基因,与所述ppc蛋白质或所述ppc蛋白质的编码基因组成,还可由所述支链α-酮酸脱氢酶复合体或所述支链α-酮酸脱氢酶复合体的编码基因,所述ppc蛋白质或所述ppc蛋白质的编码基因,以及所述抑制支链α-酮酸合成的物质组成。

所述成套试剂甲具有如下D1)或D2)的功能:

D1)合成丙二酸单酰辅酶A;

D2)生产以丙二酸单酰辅酶A为中间产物的目的产物。

所述成套试剂乙可用于生产3-羟基丙酸。

所述成套试剂丙可用于制备苦味酸或苦味酸合成途径中丙二酸单酰辅酶A至苦味酸间的中间产物。

本发明还提供了一种重组细胞,所述重组细胞为所述重组细胞A、所述重组细胞-mcr或所述重组细胞-vps。

本发明还提供了下述I、II或III的应用:

I、所述支链α-酮酸脱氢酶复合体或所述支链α-酮酸脱氢酶复合体的编码基因,所述重组细胞A,或,所述成套试剂甲的下述任一应用:

X1)合成丙二酸单酰辅酶A;

X2)制备合成丙二酸单酰辅酶A产品;

X3)生产以丙二酸单酰辅酶A为中间产物的目的产物;

X4)制备生产以丙二酸单酰辅酶A为中间产物的目的产物的产品;

X5)合成3-羟基丙酸;

X6)制备合成3-羟基丙酸产品;

X7)合成苦味酸或苦味酸合成途径中丙二酸单酰辅酶A至苦味酸间的中间产物;

X8)制备合成苦味酸或苦味酸合成途径中丙二酸单酰辅酶A至苦味酸间的中间产物产品;

X9)合成脂肪酸;

X10)制备合成脂肪酸产品;

X11)合成聚酮化合物;

X12)制备合成聚酮化合物产品;

X13)合成黄酮化合物;

X14)制备合成黄酮化合物产品;

II、所述重组细胞-mcr或所述成套试剂乙的下述任一应用:

Y1)合成3-羟基丙酸;

Y2)制备合成3-羟基丙酸产品;

III、所述重组细胞-vps或所述成套试剂丙的下述任一应用:

Z1)合成苦味酸或苦味酸合成途径中丙二酸单酰辅酶A至苦味酸间的中间产物;

Z2)制备合成苦味酸或苦味酸合成途径中丙二酸单酰辅酶A至苦味酸间的中间产物产品。

丙二酸单酰辅酶A的合成以草酰乙酸为底物。

所述目的产物的合成途径中,需要丙二酸单酰辅酶A的参与。

所述目的产物可为3-羟基丙酸、苦味酸或苦味酸合成途径中丙二酸单酰辅酶A至苦味酸间的中间产物。

所述中间产物不包括丙二酸单酰辅酶A和苦味酸。在本发明的一个实施例中,所述中间产物为3-甲基-异丁酰间苯三酚(PIVP)。

本发明中,所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。

本发明发现了一类新的丙二酸单酰辅酶A来源,即丙二酸单酰辅酶A可以由支链α-酮酸脱氢酶复合体催化草酰乙酸得到,通过生化和遗传等试验证明支链α-酮酸脱氢酶复合体具有草酰乙酸脱氢酶活性。另外,本发明还发现引入/提高磷酸烯醇式丙酮酸羧化酶可进一步提高丙二酸单酰辅酶A合成量,敲除支链α-酮酸合成途径中的基因也可提高丙二酸单酰辅酶A合成量。本发明进一步还利用支链α-酮酸脱氢酶复合体制备了以丙二酸单酰辅酶A为中间产物的目的产物,如3-羟基丙酸、苦味酸或苦味酸合成途径中丙二酸单酰辅酶A至苦味酸间的中间产物。表明,可以利用本发明的支链α-酮酸脱氢酶复合体制备丙二酸单酰辅酶A以及以丙二酸单酰辅酶A为中间产物的目的产物,如3-羟基丙酸、苦味酸、脂肪酸、聚酮化合物和黄酮化合物等,具有广泛的应用前景。

附图说明

图1为表达支链α-酮酸脱氢酶复合体工程菌株的丙二酸单酰辅酶A相对含量的检测结果。

图2为ppc基因导入M-FGH中后丙二酸单酰辅酶A相对含量的检测结果。

图3为表达支链α-酮酸脱氢酶复合体后3-羟基丙酸的产量。

图4为啤酒花α/β酸代谢途径。

图5为表达支链α-酮酸脱氢酶复合体后工程菌株PIVP的产量。

图6为支链α-酮酸脱氢酶复合体体外酶活检测。草酰乙酸为OAA组,草酰乙酸-EDTA为OAA-EDTA组,3-甲基-2氧代丁酸为KIV组,3-甲基-2氧代丁酸--EDTA为KIV-EDTA组。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。

下述实施例中,大肠杆菌BW25113(Datsenko KA,Wanner BL.One-stepinactivation of chromosomal genes in Escherichia coli K-12using PCR products.Proc.Natl.Acad.Sci.U.S.A.2000;97(12):6640-6645.)是一株非病原菌,遗传背景清楚,世代时间短、容易培养且培养基原料低廉,该菌株中含有草酰乙酸合成途径,能合成草酰乙酸。大肠杆菌BW25113公众可从中国科学院微生物研究所获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。

下述实施例中的野生型P1噬菌体(Thomason LC,Costantino N.2007.E.coligenome manipulation by P1transduction.Current Protocols in Molecular Biology:1.17.1-8)公众可从中国科学院微生物研究所获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。

实施例1、支链α-酮酸脱氢酶复合体可以催化丙二酸单酰辅酶A的合成

本发明发现支链α-酮酸脱氢酶复合体可以催化丙二酸单酰辅酶A的合成,本实施例制备了含有支链α-酮酸脱氢酶复合体编码基因(bkdA、bkdB、bkdC、lpdA1、bkdF、bkdG、bkdH基因)的重组菌,并进一步敲除了支链α-酮酸合成途径中的两个基因(苏氨酸脱氨酶ilvA和支链氨基酸转氨酶ilvE基因),对α-酮酸脱氢酶复合体催化丙二酸单酰辅酶A的合成进行了检测,所用引物见表1。

(1)表达阿维链霉菌(Streptomyces avermitilis)支链α-酮酸脱氢酶复合体的质粒的构建

(1-a)bkdA、bkdB、bkdC、lpdA1、bkdF、bkdG、bkdH基因的PCR扩增

采用细菌基因组提取试剂盒(天根生化科技有限公司,产品目录为DP302)提取阿维链霉菌基因组DNA。以提取的阿维链霉菌基因组DNA作为模板,以bkdA-NcoI和bkdC-rbs-R为引物,用高保真TransStart FastPfu DNA聚合酶(北京全式金生物技术有限公司,产品目录为AP221)进行PCR扩增,将得到的基因片段记为ABC,ABC含有序列表中序列1所示的DNA片段;以bkdF-NcoI和bkdH-rbs-R为引物进行PCR扩增,将得到的基因片段记为FGH,FGH含有序列表中序列2所示的DNA片段;以bkdF-NcoI和bkdG-rbs-R为引物进行PCR扩增,将得到的基因片段记为FG,FG含有序列表中序列2的第1-2200位;以rbs-lpdA1-F和lpdA1-XhoI为引物进行PCR扩增,将得到的基因片段记为lpd,lpd含有序列表中序列4所示的lpdA1基因。

其中,序列1的第1-1146位为bkdA基因的DNA序列,编码序列表中序列7所示的bkdA蛋白质;第1220-2224位为bkdB的DNA序列,编码序列表中序列8所示的bkdB蛋白质;2224-3591位为bkdC的DNA序列,编码序列表中序列9所示的bkdC蛋白质;

序列2的第1-1221位为bkdF基因的DNA序列,编码序列表中序列10所示的bkdF蛋白质;序列2的第1223-2200位为bkdG基因的DNA序列,编码序列表中序列11所示的bkdG蛋白质;序列2的第2220-3608位为bkdH基因的DNA序列,编码序列表中序列12所示的bkdH蛋白质;

序列4所示的lpdA1基因编码序列表中序列13所示的lpdA1蛋白质。

根据大肠杆菌中密码子的偏好性,分别优化bkdH和lpdA1基因的序列,将优化后的基因分别记为opbkdH和oplpdA1基因,opbkdH和oplpdA1基因的序列分别为序列表中序列3和序列5,序列3和序列5分别编码序列表中序列12和13所示的bkdH蛋白质和lpdA1蛋白质。人工合成opbkdH和oplpdA1基因,以opbkdH基因为模板,利用rbs-opbkdH-F和rbs-opbkdH-R进行PCR扩增,将得到的基因片段记为opH,opH含有序列3所示的opbkdH基因;以oplpdA1基因为模板,利用rbs-oplpdA1-F和oplpdA1-XhoI进行PCR扩增,将得到的基因片段记为oplpd,oplpd含有序列表中序列5所示的oplpdA1基因。

(1-b)构建含有bkdA、bkdB、bkdC、lpdA1、bkdF、bkdG、bkdH基因的重组表达载体

将上述步骤(1-a)得到的各PCR扩增片段进行琼脂糖凝胶电泳,回收目的片段;同时用NcoI和XhoI酶切载体pYB1k(载体pYB1k核苷酸序列如序列表中序列6),回收载体大片段YB1k-NX片段(即载体骨架)。用Gibson组装方法(Gibson DG,Young L,et al.Enzymaticassembly of DNA molecules up to several hundred kilobases.Nat.methods.2009;6(5):343-345)将回收的ABC、lpd片段与YB1k-NX片段进行连接反应;将回收的FGH、lpd片段与YB1k-NX片段进行Gibson组装连接反应;将回收的FG、opH、oplpd与YB1k-NX片段进行Gibson组装连接反应。将各连接产物用CaCl2法转化大肠杆菌DH5α感受态细胞(北京全式金生物技术有限公司,产品目录为CD201)后,均匀涂布于含卡那霉素的LB平板上,37℃培养过夜。挑选克隆,用引物F108/R124鉴定能够扩增出目的片段的克隆并测序,挑选阳性克隆提取质粒,将ABC、lpd片段与YB1k-NX片段连接得到的序列正确的重组质粒命名为pYB1k-bkdABC-lpdA1,将FGH、lpd片段与YB1k-NX片段连接得到的序列正确的重组质粒命名为pYB1k-bkdFGH-lpdA1,将FG、opH、oplpd与YB1k-NX片段连接得到的序列正确的重组质粒命名为pYB1k-bkdFG-opbkdH-oplpdA1。

pYB1k-bkdABC-lpdA1含有序列表中序列1和4所示的DNA片段,能表达序列7、8、9和13所示的四种蛋白质,pYB1k-bkdFGH-lpdA1含有序列表中序列2和4所示的DNA片段,能表达序列10、11、12和13所示的四种蛋白质,pYB1k-bkdFG-opbkdH-oplpdA1含有序列表中序列2的第1-2200位、序列3和序列4所示的DNA片段,能表达序列10、11、12和13所示的四种蛋白质。

(2)工程菌株苏氨酸脱氨酶ilvA和支链氨基酸转氨酶ilvE基因的敲除

以大肠杆菌BW25113为出发菌,敲除其ilvA基因,将得到的重组菌记为M01A,敲除其ilvE基因,将得到的重组菌记为M01E。

(2-a)制备含有大肠杆菌基因片段的P1噬菌体,所含有的基因片段具有ilvA和ilvE敲除性状

含有ilvA基因敲除性状的大肠杆菌基因片段和含有ilvE基因敲除性状的大肠杆菌基因片段分别来自大肠杆菌菌株JW3745和JW5606,这两株菌为分别含有ilvA和ilvE敲除性状的W3110系列菌株,均来自于日本国立遗传学研究所(NIG,Japan),这两株菌中的编码苏氨酸脱氨酶的ilvA基因和支链氨基酸转氨酶的ilvE基因被替换为两端带有FRT位点的卡那霉素抗性基因(约1300bp)从而将ilvA或ilvE基因敲除(Baba T,Ara T,etal.Construction of Escherichia coli K-12in-frame,single-gene knockoutmutants:the Keio collection.Mol.Syst.Biol.2006;2:2006.0008.)。P1噬菌体制备过程如下:将JW3745或JW5606菌株37℃过夜培养后转接于含5mmol/L CaCl2和0.1%葡萄糖的LB培养基中,37℃培养1h,然后加入野生型P1噬菌体继续培养1-3h。加几滴氯仿再培养几分钟,离心取上清即得到含有ilvA敲除性状的大肠杆菌基因片段的噬菌体P1vir ilvA和含有ilvE敲除性状的大肠杆菌基因片段的噬菌体P1vir ilvE。

(2-b)利用P1噬菌体转导技术构建大肠杆菌菌株M01A-Kan和M01E-Kan

过夜培养的大肠杆菌BW25113(受体菌),取1.5mL菌液10000g离心2分钟后,用0.75mL的P1盐溶液(溶剂为水,溶质为10mM CaCl2和5mM MgSO4)重悬BW25113菌体细胞,将100μL噬菌体P1vir ilvA或P1vir ilvE与100μL BW25113细胞悬浮液混和,37℃孵育30min,然后加入1mL的LB培养基和200μL的1mol/L柠檬酸钠,37℃继续培养1h,离心收集菌体,用100μL的LB培养基重悬后,涂布含卡那霉素的LB平板(卡那霉素的浓度为50μg/ml)上,37℃培养过夜后,挑选克隆,用ilvA-F/ilvA-R或ilvE-F/ilvE-R引物PCR扩增鉴定(扩增出1700bp目的带为阳性),挑选阳性克隆,将噬菌体P1vir ilvA得到的阳性克隆命名为M01A-Kan,将噬菌体P1vir ilvE得到的阳性克隆命名为M01E-Kan。

(2-c)抗性的消除

将pCP20质粒(Clontech公司)通过氯化钙转化法转化分别至M01A-Kan和M01E-Kan中,并在含有氨苄青霉素的LB平板30℃过夜培养后挑选克隆,分别得到含有质粒pCP20的重组大肠杆菌M01A-Kan/pCP20和M01E-Kan/pCP20。将这两种菌分别在含有氨苄青霉素抗性的LB培养基30℃培养后,涂布于无抗性LB平板上42℃培养过夜,挑选克隆,然后用ilvA-F/ilvA-R或ilvE-F/ilvE-R引物PCR扩增鉴定(扩增出400bp目的带为阳性),挑选阳性克隆,将由M01A-Kan得到的阳性克隆命名为M01A,M01A即为将大肠杆菌BW25113的ilvA基因敲除的菌株;将由M01E-Kan得到的阳性克隆命名为M01E,M01E即为将将大肠杆菌BW25113的ilvE基因敲除的菌株。

大肠杆菌BW25113中,ilvA基因的编码序列为序列表中序列14,编码序列表中序列15所示的ilvA蛋白质,ilvE基因的编码序列为序列表中序列16,编码序列表中序列17所示的ilvE蛋白质。

表1.所用引物序列列表

(3)外源表达支链α-酮酸脱氢酶复合体提高工程菌株丙二酸单酰辅酶A合成量检测

(3-a)重组菌的制备

将步骤(1)的pYB1k-bkdABC-lpdA1、pYB1k-bkdFGH-lpdA1和pYB1k-bkdFG-opbkdH-oplpdA1以及载体pYB1k分别导入大肠杆菌BW25113中,将得到的重组菌依次记为M-ABC、M-FGH、M-opFGH和BW;将pYB1k-bkdFGH-lpdA1分别导入步骤(1)的M01A和M01E中,将得到的重组菌分别记为MA-FGH和ME-FGH。

(3-b)培养基的制备

A培养基:A培养基是由溶质和溶剂组成的无菌培养基,溶剂为水,溶质及其在该培养基中的浓度分别为:NaHPO4 25mM,KH2PO4 25mM,NH4Cl 50mM。

B培养基:B培养基为在A培养基中添加Na2SO4、MgSO4、甘油、酵母粉和微量元素得到的无菌培养基,B培养基中Na2SO4的浓度为5mM,MgSO4的浓度为2mM,甘油的体积百分比为0.5%,酵母粉的质量百分比为0.5mg/100mL,各微量元素及其在B培养基中的浓度分别为50μM FeCl3,20μM CaCl2,10μM MnCl2,10μM ZnSO4,2μM CoCl2,2μM NiCl2,2μM Na2MO4,2μMNa2SeO3和2μM H3BO3

C培养基:C培养基为在A培养基中添加葡萄糖得到的无菌培养基,C培养基中葡萄糖的浓度为20g/L。

(3-c)菌体的培养和酶的诱导

将过夜培养的工程菌株M-ABC按1%接种量接种于20ml B培养基的摇瓶中,37℃培养6h后,向培养体系中添加阿拉伯糖使阿拉伯糖在培养体系中的质量百分比浓度为0.2%,继续培养12h,收集菌体,即M-ABC菌体。

按照上述方法,将M-ABC分别替换为M-FGH、M-opFGH、BW、MA-FGH和ME-FGH,得到M-FGH、M-opFGH、BW、MA-FGH和ME-FGH菌体。

(3-d)丙二酸单酰辅酶A的全细胞催化

将步骤(3-c)收集的菌体取等量(所用菌体量为1mL OD600=90的菌体)按照如下方法检测各菌中丙二酸单酰辅酶A的合成量:

将菌体重悬于含5ml C培养基的摇瓶中,37℃培养3h后,离心收集菌体,然后将该菌体重悬于400μL负80℃预冷的80%(体积百分比)甲醇水溶液中,超声破碎细胞,12000rpm4℃离心20min,收集上清液检测上清液中丙二酸单酰辅酶A的含量。上清液中丙二酸单酰辅酶A的含量采用标准曲线法(外标法)以丙二酸单酰辅酶A(Sigma,63410-10MG-F)为标准品利用LCMS/MS进行分析。

结果如图1,图中,纵坐标为检测的丙二酸单酰辅酶A的相对信号强度,检测BW、M-ABC、M-FGH、M-opFGH、MA-FGH和ME-FGH的上清液中丙二酸单酰辅酶A的相对信号强度分别为0.22、1.13、1.89、2.43、2.44和4.59。相对于BW,M-ABC、M-FGH、M-opFGH、MA-FGH和ME-FGH的上清液中丙二酸单酰辅酶A的相对含量分别为5.09、8.48、10.94、10.98和20.61,即M-ABC、M-FGH、M-opFGH、MA-FGH和ME-FGH的上清液中丙二酸单酰辅酶A的含量分别为BW的5.09倍、8.48倍、10.94倍、10.98倍、20.61倍。

表明,向大肠杆菌中导入支链α-酮酸脱氢酶复合体编码基因后,丙二酸单酰辅酶A的合成量显著提高;与导入bkdA、bkdB、bkdC、lpdA1基因相比,导入bkdF、bkdG、bkdH、lpdA1基因丙二酸单酰辅酶A的合成量更高;而将bkdH、lpdA1基因根据大肠杆菌密码子的偏好性进行优化后,丙二酸单酰辅酶A的合成量可以得到进一步的提高;在导入bkdF、bkdG、bkdH、lpdA1基因的基础上,敲除支链α-酮酸脱氢酶复合体的底物—支链α-酮酸合成途径中的ilvA和ilvE基因,丙二酸单酰辅酶A的合成量也可以得到进一步的提升,且ilvE基因敲除后丙二酸单酰辅酶A的合成量可以得到大幅度提升。

实施例2、磷酸烯醇式丙酮酸羧化酶ppc基因可提高工程菌株M-FGH丙二酸单酰辅酶A的合成量

本实施例在实施例1的工程菌株M-FGH基础上,导入磷酸烯醇式丙酮酸羧化酶ppc基因并敲除了ompT基因(ompT基因的序列为序列表中序列27,编码序列28所示的ompT蛋白质),进一步提高了丙二酸单酰辅酶A的合成量,所用引物见表2。

(4)表达磷酸烯醇式丙酮酸羧化酶ppc基因工程菌株的构建

(4-a)谷氨酸棒状杆菌(Corynebacterium glutamicum)和大肠杆菌基因组提取,以及ppc基因、氯霉素抗性片段和ompT基因上下游同源臂的PCR扩增

以ppc-F和ppc-R为PCR扩增引物,利用谷氨酸棒状杆菌基因组DNA为模板,扩增得到片段tac-ppc,tac-ppc含有ppc基因,ppc基因的核苷酸序列为序列表中序列18,编码序列19所示的ppc蛋白质。以Cm-F和Cm-R为PCR扩增引物,利用lox71-Cm-lox66-tac为模板,扩增得到片段Cm,lox71-Cm-lox66-tac片段核苷酸序列为序列表中序列20,该片段通过全基因合成获得(南京金斯瑞)。以ompT-up-F和ompT-up-R为PCR扩增引物,利用大肠杆菌基因组DNA为模板,扩增得到片段ompT-up,以ompT-down-F和ompT-down-R为PCR扩增引物,利用大肠杆菌基因组DNA为模板,扩增得到片段ompT-down。

(4-b)ompT-up-Cm-tac-ppc-ompT-down打靶片段的制备

以tac-ppc、Cm、ompT-up和ompT-down四个片段为模板,以ompT-up-F和ompT-down-R为引物,通过融合PCR的手段,扩增得到打靶片段ompT-up-Cm-tac-ppc-ompT-down,琼脂糖凝胶电泳回收目的片段(天根生化科技有限公司,产品目录为DP209)。

(4-c)含有pKD46质粒宿主菌的制备

将pKD46质粒(Clontech公司)通过氯化钙转化法转化至工程菌株M-FGH中,在含有氨苄青霉素和卡那霉素的LB平板30℃过夜培养后挑选克隆,得到含有质粒pKD46的重组大肠杆菌M-FGH/pKD46。重组大肠杆菌M-FGH/pKD46在阿拉伯糖诱导后,表达噬菌体的3个重组蛋白,宿主菌就具有了同源重组的能力。然后通过10%甘油洗涤制备成M-FGH/pKD46感受态细胞。

(4-d)同源重组

将(4-b)的ompT-up-Cm-tac-ppc-ompT-down片段电转入(4-c)所制备的M-FGH/pKD46感受态细胞中,于含有卡那霉素(浓度为50μg/ml)和氯霉素(浓度为34μg/ml)的LB平板37℃过夜,挑选克隆,用ompT-up1k-F和ppc-R引物PCR扩增鉴定(扩增出6000bp目的带为阳性),挑选阳性克隆命名为M-FGH-ppc。M-FGH-ppc含有序列表中序列18所示的ppc基因,能表达序列19所示的ppc蛋白质。M-FGH-ppc不含有ompT基因。

(5)过表达磷酸烯醇式丙酮酸羧化酶ppc基因及阿维链霉菌支链α-酮酸脱氢酶复合体基因bkdFGH-lpdA1工程菌株丙二酸单酰辅酶A合成量检测

按照实施例1中步骤(3)的(3-c)和(3-d)的方法,将M-ABC分别替换为M-FGH和M-FGH-ppc,其他步骤均不变,检测这两株菌的丙二酸单酰辅酶A合成量。

结果如图2,图中,纵坐标为检测的丙二酸单酰辅酶A的相对信号强度,检测M-FGH和M-FGH-ppc的上清液中丙二酸单酰辅酶A的相对信号强度分别为1.89和3.66。相对于M-FGH,M-FGH-ppc的上清液中丙二酸单酰辅酶A的相对含量为1.94,即M-FGH-ppc的上清液中丙二酸单酰辅酶A的含量为M-FGH的1.94倍。表明,ppc基因可以提高丙二酸单酰辅酶A的合成量。

表2.引物序列列表

实施例3、表达阿维链霉菌支链α-酮酸脱氢酶复合体基因bkdFGH-lpdA1可提高3-羟基丙酸(3-HP)产量。

3-羟基丙酸为重要的平台化合物,为多种化学品的合成原料,可以丙二酸单酰辅酶A为前体,经两步还原反应得到3-羟基丙酸。本实施例通过向实施例1和实施例2得到的M-ABC、M-FGH、M-opFGH、MA-FGH、ME-FGH、M-FGH-ppc中导入嗜热光全绿丝菌(Chloroflexusaurantiacus)丙二酸单酰辅酶A还原酶基因mcr基因制备3-羟基丙酸,并利用实施例1的BW作为对照。所用引物如表3所示。

(6)表达嗜热光全绿丝菌(Chloroflexus aurantiacus)丙二酸单酰辅酶A还原酶基因mcr的质粒的构建

(6-a)经过改造的嗜热光全绿丝菌(Chloroflexus aurantiacus)丙二酸单酰辅酶A还原酶基因mcr基因的核苷酸序列为序列表中序列21,其中mcr基因的N端结构域核苷酸序列是序列21的第1-1689位,编码序列表中序列22所示的mcr的N端结构域;mcr基因的C端结构域核苷酸序列是序列21的第1704-3749位,编码序列表中序列23所示的mcr的C端结构域;N端结构域和C端结构域之间含有RBS位点,序列是序列21的第1691-1696位。序列21所示的mcr基因片段通过全基因合成,连接在pUC57载体上,获得重组载体pUC57-mcr。以pUC57-mcr为模板用引物mcr-F/mcrR扩增得到PCR扩增片段。

(6-b)将上述(6-a)得到的PCR扩增片段进行琼脂糖凝胶电泳,回收目的片段;同时用NcoI和XhoI酶切载体pLB1a(载体pLB1a核苷酸序列为序列表中序列24),回收载体大片段LB1a-NX(即载体骨架)。用Gibson组装方法将上述回收的目的片段与LB1a-NX片段进行连接反应,将连接产物用CaCl2法转化大肠杆菌DH5α感受态细胞(北京全式金生物技术有限公司,产品目录为CD201)后,涂布于含链霉素的LB平板上,37℃培养过夜。挑选克隆,用引物F-105/mcr-R鉴定能够扩增出目的片段的克隆并测序,挑选阳性克隆提取质粒,将获得的序列正确的阳性质粒命名为pLB1a-mcr。

pLB1a-mcr含有序列表中序列21所示的mcr基因,能表达序列22和23所示的mcr的N端结构域和C端结构域。

(7)产3-羟基丙酸工程菌株构建及3-羟基丙酸全细胞催化

(7-a)将步骤(6)所得pLB1a-mcr分别导入M-ABC、M-FGH、M-opFGH、MA-FGH、ME-FGH、M-FGH-ppc和BW中,将得到的重组菌依次命名为M-ABC-HP、M-FGH-HP、M-opFGH-HP、MA-FGH-HP、ME-FGH-HP、M-FGH-ppc-HP和BW-HP,将各重组菌作为待测菌株进一步用于3-羟基丙酸的制备。

(7-b)工程菌株的培养和酶的诱导

将过夜培养的待测菌株按1%接种量接种于(3-b)所述20ml B培养基的摇瓶中,37℃培养6h后,向培养体系中添加阿拉伯糖使阿拉伯糖在培养体系中的质量百分比浓度为0.2%,继续培养12h,收集菌体。

(7-c)3-羟基丙酸的全细胞催化

将上述收集的菌体重悬于含5ml C培养基的摇瓶中,37℃培养8h后,离心取上清过滤,收集滤液。所用菌体量为5mL OD600=30的菌体。以3-羟基丙酸(TCI,H0297-10G)为标准品采用标准曲线法(外标法)利用HPLC定量分析滤液中3-羟基丙酸的含量。

结果如图3所示,M-ABC-HP、M-FGH-HP、M-opFGH-HP、MA-FGH-HP、ME-FGH-HP、M-FGH-ppc-HP和BW-HP所得滤液中3-羟基丙酸的含量分别为0.86、1.44、1.65、1.80、3.84、1.94和0.55g/L,M-ABC-HP、M-FGH-HP、M-opFGH-HP、MA-FGH-HP、ME-FGH-HP和M-FGH-ppc-HP的3-羟基丙酸产量分别为BW-HP的1.56倍、2.62倍、3.00倍、3.27倍、6.98倍和3.53倍。

表明,向大肠杆菌中导入支链α-酮酸脱氢酶复合体编码基因后,3-羟基丙酸的产量显著提高;与导入bkdA、bkdB、bkdC、lpdA1基因相比,导入bkdF、bkdG、bkdH、lpdA1基因3-羟基丙酸的产量更高;而将bkdH、lpdA1基因根据大肠杆菌密码子的偏好性进行优化后,3-羟基丙酸的产量可以得到进一步的提高;在导入bkdF、bkdG、bkdH、lpdA1基因的基础上,敲除支链α-酮酸脱氢酶复合体的底物—支链α-酮酸合成途径中的ilvA和ilvE基因,3-羟基丙酸的产量也可以得到进一步的提升,且ilvE基因敲除后3-羟基丙酸的产量可以得到大幅度提升;在导入bkdF、bkdG、bkdH、lpdA1基因的基础上,再导入ppc基因后可进一步提高3-羟基丙酸的产量。3-羟基丙酸的产量的变化趋势与实施例1和2中相应菌株丙二酸单酰辅酶A的合成量的变化趋势是相同的。

表3.引物序列列表

实施例4、表达阿维链霉菌支链α-酮酸脱氢酶复合体基因bkdFGH-lpdA1可提高啤酒花β酸前体PIVP产量

来源于植物啤酒花的III型聚酮化合物苦味酸在大肠杆菌中的异源表达。苦味酸作为啤酒花(Humulus lupulus大麻科葎草属)风味物质在啤酒花腺体腺毛特异合成积累,是啤酒酿造工业必不可少的要素,有很高的药用价值和保健功能,也是很多药物的前体物质。现在已经报道可以在酵母中实现其途径合成。途径主要是支链脂酰辅酶A和丙二酸单酰辅酶A在vps(苯戊酮合成酶)的作用下生成3-甲基-异丁酰间苯三酚(PIVP),然后PIVP与DMAPP在HIPT1HIPT2(异戊烯基转移酶)的作用下生成的直接前体Di-Prenyl PIVP。然后经过氧化反应到苦味酸(图4)。本实施例通过向实施例1和实施例2得到的M-ABC、M-FGH、M-opFGH、MA-FGH、ME-FGH、M-FGH-ppc中导入啤酒花(Humulus lupulus)苯戊酮合成酶基因vps基因合成PIVP,并利用实施例1的BW作为对照。所用引物如表4和表3所示。

(8)表达啤酒花(Humulus lupulus)苯戊酮合成酶基因vps基因的质粒的构建

(8-a)啤酒花苯戊酮合成酶基因vps基因的核苷酸序列为序列表中序列25。vps基因通过全基因合成,连接在pUC57载体上,获得载体pUC57-vps。以pUC57-vps为模板用引物vps-F/vps-R进行PCR扩增vps基因片段。

(8-b)将上述(8-a)得到的PCR扩增片段进行琼脂糖凝胶电泳,回收目的片段;同时用NcoI和XhoI酶切载体pLB1a(载体pLB1a核苷酸序列如序列24),回收载体大片段LB1a-NX片段(即载体骨架)。用Gibson组装方法将上述回收的目的片段与LB1a-NX片段进行连接反应,将连接产物用CaCl2法转化大肠杆菌DH5α感受态细胞(北京全式金生物技术有限公司,产品目录为CD201)后,涂布于含链霉素的LB平板上,37℃培养过夜。挑选克隆,用引物F-105/vps-R鉴定能够扩增出目的片段的克隆并测序,挑选阳性克隆提取质粒,将获得的序列正确的阳性质粒命名为pLB1a-vps。

pLB1a-vps含有序列表中序列25所示的vps基因,能表达序列26所示的vps蛋白质。

(9)产PIVP菌株构建及3-羟基丙酸全细胞催化

(9-a)将步骤(8)所得pLB1a-vps分别导入M-ABC、M-FGH、M-opFGH、MA-FGH、ME-FGH、M-FGH-ppc和BW中,将得到的重组菌依次命名为M-ABC-PIVP、M-FGH-PIVP、M-opFGH-PIVP、MA-FGH-PIVP、ME-FGH-PIVP、M-FGH-ppc-PIVP和BW-PIVP,将各重组菌作为待测菌株进一步用于合成PIVP。

(9-b)工程菌株的培养和酶的诱导

将过夜培养的各待测菌株按1%接种量接种于(3-b)所述20ml B培养基的摇瓶中,37℃培养6h后,向培养体系中添加阿拉伯糖使阿拉伯糖在培养体系中的质量百分比浓度为0.2%,继续培养12h,收集菌体。

(9-c)PIVP的全细胞催化

将上述收集的菌体重悬于含5ml C培养基的摇瓶中,37℃培养8h后,离心后重悬于400μL负80℃预冷的80%(体积百分比)甲醇水溶液中,超声破碎细胞,12000rpm 4℃离心20min,收集上清液检测上清液中PIVP的含量。所用菌体量为5mL OD600=30的菌体。上清液中PIVP的含量采用标准曲线法(外标法)以PIVP(TRC,P339590-1g)为标准品利用LCMS/MS进行分析。

结果如图5所示,M-ABC-PIVP、M-FGH-PIVP、M-opFGH-PIVP、MA-FGH-PIVP、ME-FGH-PIVP、M-FGH-ppc-PIVP和BW-PIVP所得上清液中PIVP的含量分别为8.96、16.68、23.63、15.14、2.49、82.50和0mg/L,BW-PIVP不产PIVP,M-ABC-PIVP、M-FGH-PIVP、M-opFGH-PIVP、MA-FGH-PIVP、ME-FGH-PIVP、M-FGH-ppc-PIVP均可生产PIVP。

表明,向大肠杆菌中导入支链α-酮酸脱氢酶复合体编码基因后,可生产PIVP:BW-PIVP不合成PIVP;与导入bkdA、bkdB、bkdC、lpdA1基因相比,导入bkdF、bkdG、bkdH、lpdA1基因PIVP的产量更高;而将bkdH、lpdA1基因根据大肠杆菌密码子的偏好性进行优化后,PIVP的产量可以得到进一步的提高;在导入bkdF、bkdG、bkdH、lpdA1基因的基础上,再导入ppc基因后可进一步大幅度提高PIVP的产量。而在导入bkdF、bkdG、bkdH、lpdA1基因的基础上,敲除支链α-酮酸脱氢酶复合体的底物—支链α-酮酸合成途径中的ilvA和ilvE基因,PIVP的产量并未同实施例1相应菌株的丙二酸单酰辅酶A的合成量变化趋势一样进一步提高,这是因为PIVP生成过程中还需要支链α-酮酸的参与,而ilvA和ilvE基因敲除后支链α-酮酸含量下降,进而影响了PIVP的产量,因此在生产以丙二酸单酰辅酶A为中间产物的目的产物中,可根据合成途径中是否需要支链α-酮酸来确定是否敲除支链α-酮酸合成途径中的基因。

表4.引物序列列表

实施例5、表达纯化阿维链霉菌支链α-酮酸脱氢酶复合体基因和其草酰乙酸脱氢酶复合体活力检测

(10)阿维链霉菌支链α-酮酸脱氢酶复合体蛋白表达载体的构建

(10-a)以(1-b)所述pYB1k-bkdFGH-lpdA1质粒为模板,利用引物BCDH-His-F和BCDH-His-R(表5)进行PCR扩增得到YK-BCDH-His DNA片段。

(10-b)将上述(10-a)PCR扩增得到的YK-BCDH-His DNA片段进行DpnI酶切处理,将酶切产物用CaCl2法转化大肠杆菌DH5α感受态细胞(北京全式金生物技术有限公司,产品目录为CD201)后,涂布于含卡那霉素的LB平板上,37℃培养过夜。挑选克隆,用引物F108/lpdA1-XhoI鉴定能够扩增出目的片段的克隆并测序,挑选阳性克隆提取质粒,将获得的序列正确的阳性质粒命名为pYB1k-His-BCDH。

(11)阿维链霉菌支链α-酮酸脱氢酶复合体蛋白表达纯化

(11-a)将pYB1k-His-BCDH导入实施例1的大肠杆菌BW25113中,将得到的重组菌命名为His-BCDH。

(11-b)将过夜培养的工程菌株His-BCDH按1%接种量接种于(3-a)所述5L B培养基的摇瓶中,30℃培养6h后,向培养体系中添加阿拉伯糖使阿拉伯糖在培养体系中的质量百分比浓度为0.2%,继续培养20h,收集菌体,用D缓冲液清洗菌体两遍,然后重悬于D缓冲液中,破碎细胞,20000rpm离心2小时,收集上清液。

D缓冲液由溶剂和溶质组成,溶剂为水,溶质及其在D缓冲液中的浓度为50mMTris-HCl和200mM KCl,pH=8.0。

(11-c)用D缓冲液平衡镍柱10倍柱体积,将(11-b)中离心得到的上清液,流穿上述平衡后的镍柱,用10倍柱体积D缓冲液冲洗后,依次用D缓冲液与E缓冲液的体积比为49/1、45/5和42/8的混合缓冲液分别冲洗5倍柱体积,然后用D缓冲液与E缓冲液的体积比为1/1的混合缓冲液洗脱,得到阿维链霉菌支链α-酮酸脱氢酶复合体蛋白,使用100kDa的超滤管(Amicon Ultra-15)清洗和浓缩上述复合体蛋白,得到脱盐蛋白,可用于体外酶活检测。

E缓冲液为向D缓冲液中添加咪唑得到的咪唑浓度为500mM的溶液。

(12)阿维链霉菌支链α-酮酸脱氢酶复合体催化草酰乙酸产生丙二酸单酰辅酶A活力检测

在96孔板中,每孔添加200μL F缓冲液,然后分为五组,即OAA组、OAA-EDTA组、KIV组(正对照)、KIV-EDTA组和对照组,每组3个重复。

F缓冲液由溶剂和溶质组成,溶剂为50mM Tris-HCl缓冲液(pH=7.0),溶质及其在F缓冲液中的浓度分别为0.1mM CoA(辅酶A)、0.2mM DTT(二硫苏糖醇)、0.2mM TPP(硫胺素焦磷酸)、1mM MgSO4和2mM NAD+(氧化型烟酰胺腺嘌呤二核苷酸)。

向OAA组的每孔中添加草酰乙酸,草酰乙酸在反应体系中的浓度为3mM;

向OAA-EDTA组的每孔中添加草酰乙酸和乙二胺四乙酸二钠(EDTA),草酰乙酸和EDTA在反应体系中的浓度分别为3mM和10mM;

向KIV组的每孔中添加α-酮异戊酸(3-甲基-2-氧代丁酸),α-酮异戊酸在反应体系中的浓度为3mM;

向KIV-EDTA组的每孔中添加α-酮异戊酸和EDTA,α-酮异戊酸和EDTA在反应体系中的浓度分别为3mM和10mM。

对照组仅含有F缓冲液。

每组各试剂添加完后,添加支链α-酮酸脱氢酶复合体,每200μL的反应体系中,加入10μL 0.054mg/mL的支链α-酮酸脱氢酶复合体溶液。

然后将各组96孔板置于30℃反应30min,用酶标仪(BioTek)每分钟检测一次340nm处的吸光值。

结果如图6所示。体外生化实验证实来源于阿维链霉菌的支链α-酮酸脱氢酶复合体具有催化草酰乙酸产生丙二酸单酰辅酶A的活力,支链α-酮酸脱氢酶复合体的酶活力为2.238mM/min/mg蛋白,支链α-酮酸脱氢酶复合体的酶活力定义是每毫克支链α-酮酸脱氢酶复合体每分钟催化产生NADH的摩尔量。

表5.引物序列列表

序列表

<110> 中国科学院微生物研究所

<120> 支链α-酮酸脱氢酶复合体在制备丙二酸单酰辅酶A中的应用

<160> 28

<170> SIPOSequenceListing 1.0

<210> 1

<211> 3591

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 1

atgacggtca tggagcagcg gggcgcttac cggcccacac cgccgcccgc ctggcagccc 60

cgcaccgacc ccgcgccact gctgcccgac gcgctgcccc accgcgtcct gggcaccgag 120

gcggccgcgg aggccgaccc gctactgctg cgccgcctgt acgcggagct ggtgcgcggc 180

cgccgctaca acacgcaggc cacggctctc accaagcagg gccggctcgc cgtctacccg 240

tcgagcacgg gccaggaggc ctgcgaggtc gccgccgcgc tcgtgctgga ggagcgcgac 300

tggctcttcc ccagctaccg ggacaccctc gccgccgtcg cccgcggcct cgatcccgtc 360

caggcgctca ccctcctgcg cggcgactgg cacaccgggt acgacccccg tgagcaccgc 420

atcgcgcccc tgtgcacccc tctcgcgacc cagctcccgc acgccgtcgg cctcgcgcac 480

gccgcccgcc tcaagggcga cgacgtggtc gcgctcgccc tggtcggcga cggcggcacc 540

agcgagggcg acttccacga ggcactgaac ttcgccgccg tctggcaggc gccggtcgtc 600

ttcctcgtgc agaacaacgg cttcgccatc tccgtcccgc tcgccaagca gaccgccgcc 660

ccgtcgctgg cccacaaggc cgtcggctac gggatgccgg gccgcctggt cgacggcaac 720

gacgcggcgg ccgtgcacga ggtcctcagc gacgccgtgg cccacgcgcg cgcgggaggg 780

gggccgacgc tcgtggaggc ggtgacctac cgcatcgacg cccacaccaa cgccgacgac 840

gcgacgcgct accgggggga ctccgaggtg gaggcctggc gcgcgcacga cccgatcgcg 900

ctcctggagc acgagttgac cgaacgcggg ctgctcgacg aggacggcat ccgggccgcc 960

cgcgaggacg ccgaggcgat ggccgcggac ctgcgcgcac gcatgaacca ggatccggcc 1020

ctggacccca tggacctgtt cgcccatgtg tatgccgagc ccacccccca gctgcgggag 1080

caggaagccc agttgcgggc cgagctggca gcggaggccg acgggcccca aggagtcggc 1140

cgatgaagag agttgaccat cgggccccga gaagcgggcc gatgacctcc gttggccttt 1200

ggccggaagg agccgggcga tgaccaccgt tgccctcaag ccggccacca tggcgcaggc 1260

actcacacgc gcgttgcgtg acgccatggc cgccgacccc gccgtccacg tgatgggcga 1320

ggacgtcggc acgctcggcg gggtcttccg ggtcaccgac gggctcgcca aggagttcgg 1380

cgaggaccgc tgcacggaca cgccgctcgc cgaggcaggc atcctcggca cggccgtcgg 1440

catggcgatg tacgggctgc ggccggtcgt cgagatgcag ttcgacgcgt tcgcgtaccc 1500

ggcgttcgag cagctcatca gccatgtcgc gcggatgcgc aaccgcaccc gcggggcgat 1560

gccgctgccg atcaccatcc gtgtccccta cggcggcgga atcggcggag tcgaacacca 1620

cagcgactcc tccgaggcgt actacatggc gactccgggg ctccatgtcg tcacgcccgc 1680

cacggtcgcc gacgcgtacg ggctgctgcg cgccgccatc gcctccgacg acccggtcgt 1740

cttcctggag cccaagcggc tgtactggtc gaaggactcc tggaacccgg acgagccggg 1800

gaccgttgaa ccgataggcc gcgcggtggt gcggcgctcg ggccggagcg ccacgctcat 1860

cacgtacggg ccttccctgc ccgtctgcct ggaggcggcc gaggcggccc gggccgaggg 1920

ctgggacctc gaagtcgtcg atctgcgctc cctggtgccc ttcgacgacg agacggtgtg 1980

cgcgtcggtg cgccggaccg gacgcgccgt cgtcgtgcac gagtcgggtg gttacggcgg 2040

cccgggcggg gagatcgccg cgcggatcac cgagcgctgc ttccaccatc tggaggcgcc 2100

ggtgctgcgc gtcgccgggt tcgacatccc gtatccgccg ccgatgctgg agcgccatca 2160

tctgcccggt gtcgaccgga tcctggacgc ggtggggcgg cttcagtggg aggcggggag 2220

ctgatggccc aggtgctcga gttcaagctc cccgacctcg gggagggcct gaccgaggcc 2280

gagatcgtcc gctggctggt gcaggtcggc gacgtcgtgg cgatcgacca gccggtcgtc 2340

gaggtggaga cggccaaggc gatggtcgag gtgccgtgcc cctacggggg cgtggtcacc 2400

gcccgcttcg gcgaggaggg cacggaactg cccgtgggct caccgctgtt gacggtggct 2460

gtcggagctc cgtcctcggt gcccgcggcg tcctcgctgt ccggggcgac atcggcgtcc 2520

tccgcgtcct cggtgtcatc ggacgacggc gagtcgtccg gcaacgtcct ggtcggatac 2580

ggcacgtcgg ccgcgcccgc gcgccggcgg agggtgcggc cgggccaggc ggcacccgtg 2640

gtgacggcaa ctgccgccgc ggccgccacg cgcgtggcgg ctcccgagcg gagcgacggc 2700

cccgtgcccg tgatctcccc gctggtccgc aggctcgccc gggagaacgg cctggatctg 2760

cgggcgctgg cgggctccgg gcccgacggg ctgatcctga ggtcggacgt cgagcaggcg 2820

ctgcgcgccg cgcccactcc tgcccccacc ccgaccatgc ctccggctcc cactcctgcc 2880

cccacccccg ccgcggcacc ccgcggcacc cgcatccccc tccgaggggt ccgcggtgcc 2940

gtcgccgaca aactctcccg cagccggcgt gagatccccg acgcgacctg ctgggtggac 3000

gccgacgcca cggcactcat gcacgcgcgc gtggcgatga acgcgaccgg cggcccgaag 3060

atctccctca tcgcgctgct cgccaggatc tgcaccgccg cactggcccg cttccccgag 3120

ctcaactcca ccgtcgacat ggacgcccgc gaggtcgtac ggctcgacca ggtgcacctg 3180

ggcttcgccg cgcagaccga acgggggctc gtcgtcccgg tcgtgcggga cgcgcacgcg 3240

cgggacgccg agtcgctcag cgccgagttc gcgcggctga ccgaggccgc ccggaccggc 3300

accctcacac ccggggaact gaccggcggc accttcacgt tgaacaacta cggggtgttc 3360

ggcgtcgacg gttccacgcc gatcatcaac caccccgagg cggccatgct gggcgtcggc 3420

cgcatcatcc ccaagccgtg ggtgcacgag ggcgagctgg cggtgcggca ggtcgtccag 3480

ctctcgctca ccttcgacca ccgggtgtgc gacggcggca cggcaggcgg tttcctgcgc 3540

tacgtggcgg actgcgtgga acagccggcg gtgctgctgc gcaccctgta g 3591

<210> 2

<211> 3608

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 2

atgaccgtgg agagcactgc cgcgcgaaag ccgcgacgca gcgccggtac gaagagcgcc 60

gcagccaagc gcaccagccc cggcgccaag aagtcaccga gcacgaccgg cgccgagcac 120

gagctgattc agctgctcac gcccgacggc cggcgggtga agaaccccga gtacgacgcg 180

tacgtcgcgg acatcacccc cgaagagctg cgcggtctgt accgggacat ggtgctgagc 240

cgccgcttcg acgcagaggc cacctccctg caacgccagg gcgagctggg cctgtgggcc 300

tcgatgctcg ggcaggaggc cgcccagatc ggctcgggcc gggccacccg tgacgacgac 360

tacgtcttcc cgacctaccg cgagcacggc gtcgcctggt gccgcggggt cgaccccacc 420

aacctgctcg gcatgttccg cggcgtgaac aacggcggct gggatcccaa cagcaacaac 480

ttccacctct acacgatcgt catcggctcg cagacgctgc acgccaccgg ctacgccatg 540

ggtatcgcca aggacggcgc cgactcggcc gtgatcgcgt acttcggtga cggcgcctcc 600

agccagggtg acgtcgccga atcgttcacc ttctccgcgg tctacaacgc ccctgtcgtc 660

ttcttctgcc agaacaacca gtgggcgatc tccgagccca ccgagaagca gacccgcgtc 720

ccgctctacc agcgcgcgca gggctacggc ttcccgggcg tccgcgtcga cggcaacgac 780

gtactggcct gcctcgccgt caccaagtgg gccctcgagc gggcccgccg gggcgagggg 840

cccacgttgg tcgaggcgtt cacgtaccgc atgggcgcgc acaccacctc cgacgacccg 900

accaagtacc gggccgacga ggagcgcgag gcgtgggagg cgaaggaccc gatcctgcgt 960

ctgcgcacgt atctcgaggc ctcaaaccac gcggacgagg gattcttcgc ggaactcgag 1020

gtggagagcg aggcgttggg aaggcgagtg cgcgaagtgg tgcgtgccat gccggacccg 1080

gaccacttcg ccatcttcga gaacgtgtac gcggacgggc atgcgctcgt cgacgaggag 1140

cgggcgcagt tcgccgccta ccaggcgtcg ttcacgacgg agcctgacgg cggctccgcc 1200

gcgggacagg ggggtaactg acatggccga gaagatggcg atcgccaagg cgatcaacga 1260

gtcgctgcgc aaggccctgg agtccgaccc caaggttctg atcatgggtg aggacgtcgg 1320

caagctcggt ggcgtcttcc gcgtcaccga cggcctgcag aaggacttcg gcgaggagcg 1380

ggtcatcgac accccgctcg ccgagtcggg catcgtcggc acggcgatcg gtctcgccct 1440

gcgcggctac cgcccggtgg tggagatcca gttcgacggc ttcgtcttcc cggcgtacga 1500

ccagatcgtc acgcagctcg cgaagatgca cgcgcgggcg ctcggcaaga tcaagctccc 1560

cgttgtcgtc cacatcccgt acggcggcgg catcggcgcc gtcgagcacc actccgagtc 1620

ccccgaggcg ctcttcgcgc acgtggcggg cctcaaggtg gtctccccgt ccaacgcgtc 1680

ggacgcgtac tggatgatgc agcaggccat ccagagcgac gacccggtga tcttcttcga 1740

gtcgaagcgg cgctactggg acaagggcga ggtcaacgtc gaggcgatcc ccgacccgct 1800

gcacaaggcc cgtgtggtgc gtgagggcac cgacctgacg ctcgccgcgt acggcccgat 1860

ggtgaaggtc tgccaggagg ccgcggccgc cgccgaggag gagggcaagt ccctggaggt 1920

cgtcgacctg cgctccatgt cgccgatcga cttcgacgcc gtccaggcct ccgtcgagaa 1980

gacccgccgt ctggtcgtgg tgcacgaggc gccggtgttc ctgggcacgg gcgcggagat 2040

cgccgcccgc atcacggagc gctgcttcta ccacctggag gcacccgtgc tgagggtcgg 2100

cggctaccac gccccgtatc cgccggcgcg tctggaagag gagtaccttc cgggccttga 2160

ccgggtgctc gatgccgtcg accgctcgct ggcgtactga ggagagggtc gtgacgacga 2220

tgactgaggc gtccgtgcgt gagttcaaga tgcccgatgt gggtgaggga ctcaccgagg 2280

ccgagatcct caagtggtac gtccagcccg gcgacaccgt caccgacggc caggtcgtct 2340

gcgaggtcga gaccgcgaag gcggccgtgg aactccccat tccgtacgac ggtgtcgtac 2400

gcgaactccg tttccccgag gggacgacgg tggacgtggg acaggtgatc atcgcggtgg 2460

acgtggccgg cgacgcaccg gtggcggaga tccccgtgcc cgcgcaggag gctccggtcc 2520

aggaggagcc caagcccgag ggccgcaagc ccgtcctcgt gggctacggg gtggccgagt 2580

cctccaccaa gcgccgtccg cgcaagagcg cgccggcgag cgagcccgct gcggagggca 2640

cgtacttcgc agcgaccgtt ctccagggca tccagggcga gctgaacgga cacggcgcgg 2700

tgaagcagcg tccgctggcg aagccgccgg tgcgcaagct ggccaaggac ctgggcgtcg 2760

acctcgcgac gatcacgccg tcgggccccg acggcgtcat cacgcgcgag gacgtgcacg 2820

cggcggtggc gccaccgccg ccggcacccc agcccgtgca gacgcccgct gccccggccc 2880

cggcgccggt ggccgcgtac gacacggctc gtgagacccg tgtccccgtc aagggcgtcc 2940

gcaaggcgac ggcggcggcg atggtcggct cggcgttcac ggcgccgcac gtcacggagt 3000

tcgtgacggt ggacgtgacg cgcacgatga agctggtcga ggagctgaag caggacaagg 3060

agttcaccgg cctgcgggtg aacccgctgc tcctcatcgc caaggcgctc ctggtcgcga 3120

tcaagcggaa cccggacatc aacgcgtcct gggacgaggc gaaccaggag atcgtcctca 3180

agcactatgt gaacctgggc atcgcggcgg ccaccccgcg cggtctgatc gtcccgaaca 3240

tcaaggacgc ccacgccaag acgctgccgc aactggccga gtcactgggt gagttggtgt 3300

cgacggcccg cgagggcaag acgtccccga cggccatgca gggcggcacg gtcacgatca 3360

cgaacgtcgg cgtcttcggc gtcgacacgg gcacgccgat cctcaacccc ggcgagtccg 3420

cgatcctcgc ggtcggcgcg atcaagctcc agccgtgggt ccacaagggc aaggtcaagc 3480

cccgacaggt caccacgctg gcgctcagct tcgaccatcg cctggtcgac ggcgagctgg 3540

gctccaaggt gctggccgac gtggcggcga tcctggagca gccgaagcgg ctgatcacct 3600

gggcctag 3608

<210> 3

<211> 1389

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 3

atgactgaag cgtccgtgcg tgagttcaaa atgccggacg tgggtgaagg tctgaccgaa 60

gcggaaatcc tgaaatggta tgtgcagcct ggtgacacgg ttaccgatgg ccaggttgtt 120

tgcgaggtag aaactgcgaa agcggctgtt gagctgccga tcccgtacga cggcgtggtg 180

cgtgaactgc gtttcccgga aggtactact gtcgatgtcg gccaggtaat tatcgcagtt 240

gatgtggccg gcgacgcacc ggttgcggaa atcccggtgc cggcgcagga agccccggtc 300

caggaagagc cgaaaccgga aggtcgtaaa cctgtgctgg taggttatgg tgttgctgaa 360

agcagcacta aacgtcgccc gcgtaagtcc gcgccagcgt ccgaaccggc ggcagaaggc 420

acctatttcg ctgccaccgt tctgcaaggt attcagggtg aactgaacgg ccacggtgca 480

gtaaaacagc gcccactggc gaaaccacca gttcgcaaac tggcgaaaga cctgggtgtg 540

gatctggcga ctattacccc gtccggcccg gatggcgtta ttacccgtga agacgtacac 600

gctgctgtgg cgcctccgcc gccggcacct caaccggtgc agaccccggc ggcaccggct 660

ccggctccgg tggccgcgta cgatacggcg cgtgagacgc gcgttccagt aaaaggtgtt 720

cgtaaggcta ctgccgctgc tatggtgggt agcgcgttca ctgcacctca cgttaccgaa 780

tttgttacgg tagatgtgac tcgtactatg aaactggtgg aagaactgaa acaggataaa 840

gagttcactg gtctgcgcgt taacccgctg ctgctgattg cgaaagcact gctggtcgct 900

atcaagcgta acccggacat caatgcatcc tgggacgaag caaaccagga aatcgttctg 960

aagcactacg taaacctcgg tatcgcggct gcaaccccgc gcggcctgat cgtgccaaat 1020

atcaaagacg ctcatgccaa aaccctgccg cagctggcgg aatctctggg tgaactggtt 1080

tccaccgctc gcgagggtaa gacctccccg actgcaatgc agggcggtac ggtcaccatc 1140

accaatgtgg gtgtattcgg tgttgacacc ggcacgccga tcctgaaccc gggtgagtcc 1200

gccatcctcg ctgtaggtgc tatcaaactg caaccgtggg ttcacaaagg caaagttaaa 1260

ccacgtcagg ttaccaccct ggctctgagc ttcgaccacc gtctggttga cggtgaactg 1320

ggctccaagg tactggcgga cgtggcggcg atcctggagc agccgaagcg tctcatcact 1380

tgggcataa 1389

<210> 4

<211> 1389

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 4

atggcgaacg acgccagcac cgttttcgac ctagtgatcc tcggcggtgg tagcggtggt 60

tacgccgcgg ccctgcgcgg agcgcagctg ggcctggacg tcgccctgat cgagaaggac 120

aaggtcggcg gtacctgcct gcaccgtggg tgcatcccca ccaaggcgct gctgcacgcg 180

ggcgagatcg ccgaccaggc ccgcgagagc gagcagttcg gcgtcaaggc caccttcgag 240

ggcatcgacg taccggccgt ccacaagtac aaggacgggg tcatctcggg cctgtacaag 300

ggtctgcagg ggctgatcgc ctcccgcaag gtgacgtaca tcgagggtga gggccgtctg 360

tcctccccga cctccgtcga cgtgaacggc cagcgcgtcc agggccgcca cgtgctcctg 420

gcgaccggct ccgtgccgaa gtcgctgccg ggcctggcga tcgacggcaa ccgcatcatc 480

tcctccgacc acgcgctggt cctggaccgc gtcccggagt ccgcgatcgt gctcggcggc 540

ggcgtcatcg gcgtcgagtt cgcctccgcg tggaagtcct tcggagccga cgtgacggtg 600

atcgagggcc tcaagcacct cgtcccggtc gaggacgaga actcctccaa gcttcttgag 660

cgcgcgttcc gcaagcgcgg catcaagttc aacctgggca ccttcttctc gaaggccgag 720

tacacccaga acggtgtcaa ggtcaccctc gccgacggca aggagttcga ggccgaggtc 780

ctgctcgtcg ccgtcggccg cggcccggtc tcgcagggcc tcggctacga ggagcagggc 840

gtcgccatgg accgcggcta cgtcctggtc gacgagtaca tgcggacgaa cgtcccgacc 900

atctccgccg tcggtgacct ggtcccgacg ctccagctcg cgcacgtcgg cttcgccgag 960

ggcatcctgg tggcggagcg tctggccggt ctgaagaccg tcccgatcga ctacgacggc 1020

gtgccgcggg tgacgtactg ccaccccgag gtcgcctccg tgggcatcac cgaggccaag 1080

gccaaggaga tctacggcgc ggacaaggtc gtcgctctga agtacaacct ggcgggcaac 1140

ggcaagagca agatcctcaa caccgcgggc gagatcaagc tcgtccaggt gaaggacggt 1200

gccgtggtcg gcgtccacat ggtcggtgac cgtatgggcg agcaggtcgg cgaagcccag 1260

ctgatctaca actgggaggc gctgccggcc gaggtcgccc agctcatcca cgcccacccg 1320

acgcagaacg aagcgatggg cgaggcccac ctggccctcg cgggcaagcc gctgcactcg 1380

cacgactga 1389

<210> 5

<211> 1389

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 5

atggcaaacg acgcatctac ggtgttcgac ctggttatcc tcggtggtgg ttccggtggc 60

tatgctgccg cgctgcgtgg tgcacagctg ggtctggatg ttgcgctgat cgagaaagac 120

aaagttggtg gcacttgcct gcatcgtggt tgcatcccga ccaaagcgct gctgcacgcg 180

ggcgaaattg ctgatcaggc acgcgaatct gaacaattcg gtgtgaaagc gaccttcgag 240

ggtatcgacg ttccggctgt gcacaagtac aaagatggtg ttattagcgg tctgtacaaa 300

ggcctccaag gtctgattgc gtcccgcaag gtgacttaca tcgaaggcga gggtcgtctg 360

tccagcccta cctctgttga cgttaatggt cagcgtgttc aaggccgcca cgttctgctg 420

gctaccggct ctgttcctaa aagcctgcca ggtctggcta tcgacggtaa ccgtattatc 480

tcctctgatc atgctctggt cctggaccgc gttccggagt ccgcgattgt tctgggtggt 540

ggcgttatcg gtgttgagtt tgcctctgca tggaaatctt tcggcgcaga tgtaaccgta 600

atcgaaggtc tgaaacacct ggttccggtc gaagacgaga actcctctaa actgctggaa 660

cgtgcattcc gcaaacgcgg tattaaattc aacctgggta ctttcttcag caaagcagag 720

tatacccaga atggtgttaa agtgactctg gccgacggta aggagtttga agccgaagtt 780

ctgctggtcg cagtaggtcg tggtcctgta tctcagggtc tgggctacga agaacagggt 840

gttgctatgg accgtggcta tgttctggtc gatgagtaca tgcgcaccaa cgtaccgacc 900

atctccgcag tgggtgacct ggtgcctacc ctgcaactgg ctcatgtagg tttcgcggaa 960

ggtatcctgg tagctgaacg tctggcgggc ctgaaaacgg ttccaatcga ttacgatggc 1020

gttccgcgcg tgacctattg ccacccggaa gtggcgtctg taggcatcac cgaagccaaa 1080

gcaaaagaaa tttacggtgc tgacaaagta gtcgctctga aatacaacct ggcgggtaac 1140

ggtaaaagca aaatcctgaa cactgctggt gaaatcaaac tggttcaggt taaagacggt 1200

gcagtggtcg gtgtgcacat ggttggcgac cgcatgggtg aacaggtggg cgaagcacag 1260

ctgatctata actgggaggc tctgccggct gaagttgcgc agctgatcca cgcgcacccg 1320

acccaaaacg aagctatggg cgaagctcac ctggctctgg ctggcaagcc gctgcattct 1380

cacgactaa 1389

<210> 6

<211> 3650

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 6

aatgtgcctg tcaaatggac gaagcaggga ttctgcaaac cctatgctac tccgtcaagc 60

cgtcaattgt ctgattcgtt accaattatg acaacttgac ggctacatca ttcacttttt 120

cttcacaacc ggcacggaac tcgctcgggc tggccccggt gcatttttta aatacccgcg 180

agaaatagag ttgatcgtca aaaccaacat tgcgaccgac ggtggcgata ggcatccggg 240

tggtgctcaa aagcagcttc gcctggctga tacgttggtc ctcgcgccag cttaagacgc 300

taatccctaa ctgctggcgg aaaagatgtg acagacgcga cggcgacaag caaacatgct 360

gtgcgacgct ggcgatatca aaattgctgt ctgccaggtg atcgctgatg tactgacaag 420

cctcgcgtac ccgattatcc atcggtggat ggagcgactc gttaatcgct tccatgcgcc 480

gcagtaacaa ttgctcaagc agatttatcg ccagcagctc cgaatagcgc ccttcccctt 540

gcccggcgtt aatgatttgc ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg 600

ggcgaaagaa ccccgtattg gcaaatattg acggccagtt aagccattca tgccagtagg 660

cgcgcggacg aaagtaaacc cactggtgat accattcgcg agcctccgga tgacgaccgt 720

agtgatgaat ctctcctggc gggaacagca aaatatcacc cggtcggcaa acaaattctc 780

gtccctgatt tttcaccacc ccctgaccgc gaatggtgag attgagaata taacctttca 840

ttcccagcgg tcggtcgata aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac 900

ccgccaccag atgggcatta aacgagtatc ccggcagcag gggatcattt tgcgcttcag 960

ccatactttt catactcccg ccattcagag aagaaaccaa ttgtccatat tgcatcagac 1020

attgccgtca ctgcgtcttt tactggctct tctcgctaac caaaccggta accccgctta 1080

ttaaaagcat tctgtaacaa agcgggacca aagccatgac aaaaacgcgt aacaaaagtg 1140

tctataatca cggcagaaaa gtccacattg attatttgca cggcgtcaca ctttgctatg 1200

ccatagcatt tttatccata agattagcgg atcctacctg acgcttttta tcgcaactct 1260

ctactgtttc tccatacccg ttttttgggc taacaggagg aattaaccat gggtacctct 1320

catcatcatc atcatcacag cagcggcctg gtgccgcgcg gcagcctcga gggtagatct 1380

ggtactagtg gtgaattcgg tgagctcggt ctgcagctgg tgccgcgcgg cagccaccac 1440

caccaccacc actaatacag attaaatcag aacgcagaag cggtctgata aaacagaatt 1500

tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 1560

gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 1620

caaataaaac gaaaggctca gtcgaaagac tgggcctttc gtcgacgcgc tagcggagtg 1680

tatactggct tactatgttg gcactgatga gggtgtcagt gaagtgcttc atgtggcagg 1740

agaaaaaagg ctgcaccggt gcgtcagcag aatatgtgat acaggatata ttccgcttcc 1800

tcgctcactg actcgctacg ctcggtcgtt cgactgcggc gagcggaaat ggcttacgaa 1860

cggggcggag atttcctgga agatgccagg aagatactta acagggaagt gagagggccg 1920

cggcaaagcc gtttttccat aggctccgcc cccctgacaa gcatcacgaa atctgacgct 1980

caaatcagtg gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggcg 2040

gctccctcgt gcgctctcct gttcctgcct ttcggtttac cggtgtcatt ccgctgttat 2100

ggccgcgttt gtctcattcc acgcctgaca ctcagttccg ggtaggcagt tcgctccaag 2160

ctggactgta tgcacgaacc ccccgttcag tccgaccgct gcgccttatc cggtaactat 2220

cgtcttgagt ccaacccgga aagacatgca aaagcaccac tggcagcagc cactggtaat 2280

tgatttagag gagttagtct tgaagtcatg cgccggttaa ggctaaactg aaaggacaag 2340

ttttggtgac tgcgctcctc caagccagtt acctcggttc aaagagttgg tagctcagag 2400

aaccttcgaa aaaccgccct gcaaggcggt tttttcgttt tcagagcaag agattacgcg 2460

cagaccaaaa cgatctcaag aagatcatct tattaatcag ataaaatatt tctagatttc 2520

agtgcaattt atctcttcaa atgtagcacc tgaagtcagc cccatacgat ataagttgtg 2580

cggccgccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 2640

ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagcc atattcaacg 2700

ggaaacgtct tgctctaggc cgcgattaaa ttccaacatg gatgctgatt tatatgggta 2760

taaatgggct cgcgataatg tcgggcaatc aggtgcgaca atctatcgat tgtatgggaa 2820

gcccgatgcg ccagagttgt ttctgaaaca tggcaaaggt agcgttgcca atgatgttac 2880

agatgagatg gtcagactaa actggctgac ggaatttatg cctcttccga ccatcaagca 2940

ttttatccgt actcctgatg atgcatggtt actcaccact gcgatccccg ggaaaacagc 3000

attccaggta ttagaagaat atcctgattc aggtgaaaat attgttgatg cgctggcagt 3060

gttcctgcgc cggttgcatt cgattcctgt ttgtaattgt ccttttaaca gcgaccgcgt 3120

atttcgtctc gctcaggcgc aatcacgaat gaataacggt ttggttgatg cgagtgattt 3180

tgatgacgag cgtaatggct ggcctgttga acaagtctgg aaagaaatgc ataaactttt 3240

gccattctca ccggattcag tcgtcactca tggtgatttc tcacttgata accttatttt 3300

tgacgagggg aaattaatag gttgtattga tgttggacga gtcggaatcg cagaccgata 3360

ccaggatctt gccatcctat ggaactgcct cggtgagttt tctccttcat tacagaaacg 3420

gctttttcaa aaatatggta ttgataatcc tgatatgaat aaattgcagt ttcatttgat 3480

gctcgatgag tttttctaag aattaattca tgagcggata catatttgaa tgtatttaga 3540

aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccactt gcggagaccc 3600

ggtcgtcagc ttgtcgtcgg ttcagggcag ggtcgttaaa tagcgcatgc 3650

<210> 7

<211> 381

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 7

Met Thr Val Met Glu Gln Arg Gly Ala Tyr Arg Pro Thr Pro Pro Pro

1 5 10 15

Ala Trp Gln Pro Arg Thr Asp Pro Ala Pro Leu Leu Pro Asp Ala Leu

20 25 30

Pro His Arg Val Leu Gly Thr Glu Ala Ala Ala Glu Ala Asp Pro Leu

35 40 45

Leu Leu Arg Arg Leu Tyr Ala Glu Leu Val Arg Gly Arg Arg Tyr Asn

50 55 60

Thr Gln Ala Thr Ala Leu Thr Lys Gln Gly Arg Leu Ala Val Tyr Pro

65 70 75 80

Ser Ser Thr Gly Gln Glu Ala Cys Glu Val Ala Ala Ala Leu Val Leu

85 90 95

Glu Glu Arg Asp Trp Leu Phe Pro Ser Tyr Arg Asp Thr Leu Ala Ala

100 105 110

Val Ala Arg Gly Leu Asp Pro Val Gln Ala Leu Thr Leu Leu Arg Gly

115 120 125

Asp Trp His Thr Gly Tyr Asp Pro Arg Glu His Arg Ile Ala Pro Leu

130 135 140

Cys Thr Pro Leu Ala Thr Gln Leu Pro His Ala Val Gly Leu Ala His

145 150 155 160

Ala Ala Arg Leu Lys Gly Asp Asp Val Val Ala Leu Ala Leu Val Gly

165 170 175

Asp Gly Gly Thr Ser Glu Gly Asp Phe His Glu Ala Leu Asn Phe Ala

180 185 190

Ala Val Trp Gln Ala Pro Val Val Phe Leu Val Gln Asn Asn Gly Phe

195 200 205

Ala Ile Ser Val Pro Leu Ala Lys Gln Thr Ala Ala Pro Ser Leu Ala

210 215 220

His Lys Ala Val Gly Tyr Gly Met Pro Gly Arg Leu Val Asp Gly Asn

225 230 235 240

Asp Ala Ala Ala Val His Glu Val Leu Ser Asp Ala Val Ala His Ala

245 250 255

Arg Ala Gly Gly Gly Pro Thr Leu Val Glu Ala Val Thr Tyr Arg Ile

260 265 270

Asp Ala His Thr Asn Ala Asp Asp Ala Thr Arg Tyr Arg Gly Asp Ser

275 280 285

Glu Val Glu Ala Trp Arg Ala His Asp Pro Ile Ala Leu Leu Glu His

290 295 300

Glu Leu Thr Glu Arg Gly Leu Leu Asp Glu Asp Gly Ile Arg Ala Ala

305 310 315 320

Arg Glu Asp Ala Glu Ala Met Ala Ala Asp Leu Arg Ala Arg Met Asn

325 330 335

Gln Asp Pro Ala Leu Asp Pro Met Asp Leu Phe Ala His Val Tyr Ala

340 345 350

Glu Pro Thr Pro Gln Leu Arg Glu Gln Glu Ala Gln Leu Arg Ala Glu

355 360 365

Leu Ala Ala Glu Ala Asp Gly Pro Gln Gly Val Gly Arg

370 375 380

<210> 8

<211> 334

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 8

Met Thr Thr Val Ala Leu Lys Pro Ala Thr Met Ala Gln Ala Leu Thr

1 5 10 15

Arg Ala Leu Arg Asp Ala Met Ala Ala Asp Pro Ala Val His Val Met

20 25 30

Gly Glu Asp Val Gly Thr Leu Gly Gly Val Phe Arg Val Thr Asp Gly

35 40 45

Leu Ala Lys Glu Phe Gly Glu Asp Arg Cys Thr Asp Thr Pro Leu Ala

50 55 60

Glu Ala Gly Ile Leu Gly Thr Ala Val Gly Met Ala Met Tyr Gly Leu

65 70 75 80

Arg Pro Val Val Glu Met Gln Phe Asp Ala Phe Ala Tyr Pro Ala Phe

85 90 95

Glu Gln Leu Ile Ser His Val Ala Arg Met Arg Asn Arg Thr Arg Gly

100 105 110

Ala Met Pro Leu Pro Ile Thr Ile Arg Val Pro Tyr Gly Gly Gly Ile

115 120 125

Gly Gly Val Glu His His Ser Asp Ser Ser Glu Ala Tyr Tyr Met Ala

130 135 140

Thr Pro Gly Leu His Val Val Thr Pro Ala Thr Val Ala Asp Ala Tyr

145 150 155 160

Gly Leu Leu Arg Ala Ala Ile Ala Ser Asp Asp Pro Val Val Phe Leu

165 170 175

Glu Pro Lys Arg Leu Tyr Trp Ser Lys Asp Ser Trp Asn Pro Asp Glu

180 185 190

Pro Gly Thr Val Glu Pro Ile Gly Arg Ala Val Val Arg Arg Ser Gly

195 200 205

Arg Ser Ala Thr Leu Ile Thr Tyr Gly Pro Ser Leu Pro Val Cys Leu

210 215 220

Glu Ala Ala Glu Ala Ala Arg Ala Glu Gly Trp Asp Leu Glu Val Val

225 230 235 240

Asp Leu Arg Ser Leu Val Pro Phe Asp Asp Glu Thr Val Cys Ala Ser

245 250 255

Val Arg Arg Thr Gly Arg Ala Val Val Val His Glu Ser Gly Gly Tyr

260 265 270

Gly Gly Pro Gly Gly Glu Ile Ala Ala Arg Ile Thr Glu Arg Cys Phe

275 280 285

His His Leu Glu Ala Pro Val Leu Arg Val Ala Gly Phe Asp Ile Pro

290 295 300

Tyr Pro Pro Pro Met Leu Glu Arg His His Leu Pro Gly Val Asp Arg

305 310 315 320

Ile Leu Asp Ala Val Gly Arg Leu Gln Trp Glu Ala Gly Ser

325 330

<210> 9

<211> 455

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 9

Met Ala Gln Val Leu Glu Phe Lys Leu Pro Asp Leu Gly Glu Gly Leu

1 5 10 15

Thr Glu Ala Glu Ile Val Arg Trp Leu Val Gln Val Gly Asp Val Val

20 25 30

Ala Ile Asp Gln Pro Val Val Glu Val Glu Thr Ala Lys Ala Met Val

35 40 45

Glu Val Pro Cys Pro Tyr Gly Gly Val Val Thr Ala Arg Phe Gly Glu

50 55 60

Glu Gly Thr Glu Leu Pro Val Gly Ser Pro Leu Leu Thr Val Ala Val

65 70 75 80

Gly Ala Pro Ser Ser Val Pro Ala Ala Ser Ser Leu Ser Gly Ala Thr

85 90 95

Ser Ala Ser Ser Ala Ser Ser Val Ser Ser Asp Asp Gly Glu Ser Ser

100 105 110

Gly Asn Val Leu Val Gly Tyr Gly Thr Ser Ala Ala Pro Ala Arg Arg

115 120 125

Arg Arg Val Arg Pro Gly Gln Ala Ala Pro Val Val Thr Ala Thr Ala

130 135 140

Ala Ala Ala Ala Thr Arg Val Ala Ala Pro Glu Arg Ser Asp Gly Pro

145 150 155 160

Val Pro Val Ile Ser Pro Leu Val Arg Arg Leu Ala Arg Glu Asn Gly

165 170 175

Leu Asp Leu Arg Ala Leu Ala Gly Ser Gly Pro Asp Gly Leu Ile Leu

180 185 190

Arg Ser Asp Val Glu Gln Ala Leu Arg Ala Ala Pro Thr Pro Ala Pro

195 200 205

Thr Pro Thr Met Pro Pro Ala Pro Thr Pro Ala Pro Thr Pro Ala Ala

210 215 220

Ala Pro Arg Gly Thr Arg Ile Pro Leu Arg Gly Val Arg Gly Ala Val

225 230 235 240

Ala Asp Lys Leu Ser Arg Ser Arg Arg Glu Ile Pro Asp Ala Thr Cys

245 250 255

Trp Val Asp Ala Asp Ala Thr Ala Leu Met His Ala Arg Val Ala Met

260 265 270

Asn Ala Thr Gly Gly Pro Lys Ile Ser Leu Ile Ala Leu Leu Ala Arg

275 280 285

Ile Cys Thr Ala Ala Leu Ala Arg Phe Pro Glu Leu Asn Ser Thr Val

290 295 300

Asp Met Asp Ala Arg Glu Val Val Arg Leu Asp Gln Val His Leu Gly

305 310 315 320

Phe Ala Ala Gln Thr Glu Arg Gly Leu Val Val Pro Val Val Arg Asp

325 330 335

Ala His Ala Arg Asp Ala Glu Ser Leu Ser Ala Glu Phe Ala Arg Leu

340 345 350

Thr Glu Ala Ala Arg Thr Gly Thr Leu Thr Pro Gly Glu Leu Thr Gly

355 360 365

Gly Thr Phe Thr Leu Asn Asn Tyr Gly Val Phe Gly Val Asp Gly Ser

370 375 380

Thr Pro Ile Ile Asn His Pro Glu Ala Ala Met Leu Gly Val Gly Arg

385 390 395 400

Ile Ile Pro Lys Pro Trp Val His Glu Gly Glu Leu Ala Val Arg Gln

405 410 415

Val Val Gln Leu Ser Leu Thr Phe Asp His Arg Val Cys Asp Gly Gly

420 425 430

Thr Ala Gly Gly Phe Leu Arg Tyr Val Ala Asp Cys Val Glu Gln Pro

435 440 445

Ala Val Leu Leu Arg Thr Leu

450 455

<210> 10

<211> 406

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 10

Met Thr Val Glu Ser Thr Ala Ala Arg Lys Pro Arg Arg Ser Ala Gly

1 5 10 15

Thr Lys Ser Ala Ala Ala Lys Arg Thr Ser Pro Gly Ala Lys Lys Ser

20 25 30

Pro Ser Thr Thr Gly Ala Glu His Glu Leu Ile Gln Leu Leu Thr Pro

35 40 45

Asp Gly Arg Arg Val Lys Asn Pro Glu Tyr Asp Ala Tyr Val Ala Asp

50 55 60

Ile Thr Pro Glu Glu Leu Arg Gly Leu Tyr Arg Asp Met Val Leu Ser

65 70 75 80

Arg Arg Phe Asp Ala Glu Ala Thr Ser Leu Gln Arg Gln Gly Glu Leu

85 90 95

Gly Leu Trp Ala Ser Met Leu Gly Gln Glu Ala Ala Gln Ile Gly Ser

100 105 110

Gly Arg Ala Thr Arg Asp Asp Asp Tyr Val Phe Pro Thr Tyr Arg Glu

115 120 125

His Gly Val Ala Trp Cys Arg Gly Val Asp Pro Thr Asn Leu Leu Gly

130 135 140

Met Phe Arg Gly Val Asn Asn Gly Gly Trp Asp Pro Asn Ser Asn Asn

145 150 155 160

Phe His Leu Tyr Thr Ile Val Ile Gly Ser Gln Thr Leu His Ala Thr

165 170 175

Gly Tyr Ala Met Gly Ile Ala Lys Asp Gly Ala Asp Ser Ala Val Ile

180 185 190

Ala Tyr Phe Gly Asp Gly Ala Ser Ser Gln Gly Asp Val Ala Glu Ser

195 200 205

Phe Thr Phe Ser Ala Val Tyr Asn Ala Pro Val Val Phe Phe Cys Gln

210 215 220

Asn Asn Gln Trp Ala Ile Ser Glu Pro Thr Glu Lys Gln Thr Arg Val

225 230 235 240

Pro Leu Tyr Gln Arg Ala Gln Gly Tyr Gly Phe Pro Gly Val Arg Val

245 250 255

Asp Gly Asn Asp Val Leu Ala Cys Leu Ala Val Thr Lys Trp Ala Leu

260 265 270

Glu Arg Ala Arg Arg Gly Glu Gly Pro Thr Leu Val Glu Ala Phe Thr

275 280 285

Tyr Arg Met Gly Ala His Thr Thr Ser Asp Asp Pro Thr Lys Tyr Arg

290 295 300

Ala Asp Glu Glu Arg Glu Ala Trp Glu Ala Lys Asp Pro Ile Leu Arg

305 310 315 320

Leu Arg Thr Tyr Leu Glu Ala Ser Asn His Ala Asp Glu Gly Phe Phe

325 330 335

Ala Glu Leu Glu Val Glu Ser Glu Ala Leu Gly Arg Arg Val Arg Glu

340 345 350

Val Val Arg Ala Met Pro Asp Pro Asp His Phe Ala Ile Phe Glu Asn

355 360 365

Val Tyr Ala Asp Gly His Ala Leu Val Asp Glu Glu Arg Ala Gln Phe

370 375 380

Ala Ala Tyr Gln Ala Ser Phe Thr Thr Glu Pro Asp Gly Gly Ser Ala

385 390 395 400

Ala Gly Gln Gly Gly Asn

405

<210> 11

<211> 325

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 11

Met Ala Glu Lys Met Ala Ile Ala Lys Ala Ile Asn Glu Ser Leu Arg

1 5 10 15

Lys Ala Leu Glu Ser Asp Pro Lys Val Leu Ile Met Gly Glu Asp Val

20 25 30

Gly Lys Leu Gly Gly Val Phe Arg Val Thr Asp Gly Leu Gln Lys Asp

35 40 45

Phe Gly Glu Glu Arg Val Ile Asp Thr Pro Leu Ala Glu Ser Gly Ile

50 55 60

Val Gly Thr Ala Ile Gly Leu Ala Leu Arg Gly Tyr Arg Pro Val Val

65 70 75 80

Glu Ile Gln Phe Asp Gly Phe Val Phe Pro Ala Tyr Asp Gln Ile Val

85 90 95

Thr Gln Leu Ala Lys Met His Ala Arg Ala Leu Gly Lys Ile Lys Leu

100 105 110

Pro Val Val Val His Ile Pro Tyr Gly Gly Gly Ile Gly Ala Val Glu

115 120 125

His His Ser Glu Ser Pro Glu Ala Leu Phe Ala His Val Ala Gly Leu

130 135 140

Lys Val Val Ser Pro Ser Asn Ala Ser Asp Ala Tyr Trp Met Met Gln

145 150 155 160

Gln Ala Ile Gln Ser Asp Asp Pro Val Ile Phe Phe Glu Ser Lys Arg

165 170 175

Arg Tyr Trp Asp Lys Gly Glu Val Asn Val Glu Ala Ile Pro Asp Pro

180 185 190

Leu His Lys Ala Arg Val Val Arg Glu Gly Thr Asp Leu Thr Leu Ala

195 200 205

Ala Tyr Gly Pro Met Val Lys Val Cys Gln Glu Ala Ala Ala Ala Ala

210 215 220

Glu Glu Glu Gly Lys Ser Leu Glu Val Val Asp Leu Arg Ser Met Ser

225 230 235 240

Pro Ile Asp Phe Asp Ala Val Gln Ala Ser Val Glu Lys Thr Arg Arg

245 250 255

Leu Val Val Val His Glu Ala Pro Val Phe Leu Gly Thr Gly Ala Glu

260 265 270

Ile Ala Ala Arg Ile Thr Glu Arg Cys Phe Tyr His Leu Glu Ala Pro

275 280 285

Val Leu Arg Val Gly Gly Tyr His Ala Pro Tyr Pro Pro Ala Arg Leu

290 295 300

Glu Glu Glu Tyr Leu Pro Gly Leu Asp Arg Val Leu Asp Ala Val Asp

305 310 315 320

Arg Ser Leu Ala Tyr

325

<210> 12

<211> 462

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 12

Met Thr Glu Ala Ser Val Arg Glu Phe Lys Met Pro Asp Val Gly Glu

1 5 10 15

Gly Leu Thr Glu Ala Glu Ile Leu Lys Trp Tyr Val Gln Pro Gly Asp

20 25 30

Thr Val Thr Asp Gly Gln Val Val Cys Glu Val Glu Thr Ala Lys Ala

35 40 45

Ala Val Glu Leu Pro Ile Pro Tyr Asp Gly Val Val Arg Glu Leu Arg

50 55 60

Phe Pro Glu Gly Thr Thr Val Asp Val Gly Gln Val Ile Ile Ala Val

65 70 75 80

Asp Val Ala Gly Asp Ala Pro Val Ala Glu Ile Pro Val Pro Ala Gln

85 90 95

Glu Ala Pro Val Gln Glu Glu Pro Lys Pro Glu Gly Arg Lys Pro Val

100 105 110

Leu Val Gly Tyr Gly Val Ala Glu Ser Ser Thr Lys Arg Arg Pro Arg

115 120 125

Lys Ser Ala Pro Ala Ser Glu Pro Ala Ala Glu Gly Thr Tyr Phe Ala

130 135 140

Ala Thr Val Leu Gln Gly Ile Gln Gly Glu Leu Asn Gly His Gly Ala

145 150 155 160

Val Lys Gln Arg Pro Leu Ala Lys Pro Pro Val Arg Lys Leu Ala Lys

165 170 175

Asp Leu Gly Val Asp Leu Ala Thr Ile Thr Pro Ser Gly Pro Asp Gly

180 185 190

Val Ile Thr Arg Glu Asp Val His Ala Ala Val Ala Pro Pro Pro Pro

195 200 205

Ala Pro Gln Pro Val Gln Thr Pro Ala Ala Pro Ala Pro Ala Pro Val

210 215 220

Ala Ala Tyr Asp Thr Ala Arg Glu Thr Arg Val Pro Val Lys Gly Val

225 230 235 240

Arg Lys Ala Thr Ala Ala Ala Met Val Gly Ser Ala Phe Thr Ala Pro

245 250 255

His Val Thr Glu Phe Val Thr Val Asp Val Thr Arg Thr Met Lys Leu

260 265 270

Val Glu Glu Leu Lys Gln Asp Lys Glu Phe Thr Gly Leu Arg Val Asn

275 280 285

Pro Leu Leu Leu Ile Ala Lys Ala Leu Leu Val Ala Ile Lys Arg Asn

290 295 300

Pro Asp Ile Asn Ala Ser Trp Asp Glu Ala Asn Gln Glu Ile Val Leu

305 310 315 320

Lys His Tyr Val Asn Leu Gly Ile Ala Ala Ala Thr Pro Arg Gly Leu

325 330 335

Ile Val Pro Asn Ile Lys Asp Ala His Ala Lys Thr Leu Pro Gln Leu

340 345 350

Ala Glu Ser Leu Gly Glu Leu Val Ser Thr Ala Arg Glu Gly Lys Thr

355 360 365

Ser Pro Thr Ala Met Gln Gly Gly Thr Val Thr Ile Thr Asn Val Gly

370 375 380

Val Phe Gly Val Asp Thr Gly Thr Pro Ile Leu Asn Pro Gly Glu Ser

385 390 395 400

Ala Ile Leu Ala Val Gly Ala Ile Lys Leu Gln Pro Trp Val His Lys

405 410 415

Gly Lys Val Lys Pro Arg Gln Val Thr Thr Leu Ala Leu Ser Phe Asp

420 425 430

His Arg Leu Val Asp Gly Glu Leu Gly Ser Lys Val Leu Ala Asp Val

435 440 445

Ala Ala Ile Leu Glu Gln Pro Lys Arg Leu Ile Thr Trp Ala

450 455 460

<210> 13

<211> 462

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 13

Met Ala Asn Asp Ala Ser Thr Val Phe Asp Leu Val Ile Leu Gly Gly

1 5 10 15

Gly Ser Gly Gly Tyr Ala Ala Ala Leu Arg Gly Ala Gln Leu Gly Leu

20 25 30

Asp Val Ala Leu Ile Glu Lys Asp Lys Val Gly Gly Thr Cys Leu His

35 40 45

Arg Gly Cys Ile Pro Thr Lys Ala Leu Leu His Ala Gly Glu Ile Ala

50 55 60

Asp Gln Ala Arg Glu Ser Glu Gln Phe Gly Val Lys Ala Thr Phe Glu

65 70 75 80

Gly Ile Asp Val Pro Ala Val His Lys Tyr Lys Asp Gly Val Ile Ser

85 90 95

Gly Leu Tyr Lys Gly Leu Gln Gly Leu Ile Ala Ser Arg Lys Val Thr

100 105 110

Tyr Ile Glu Gly Glu Gly Arg Leu Ser Ser Pro Thr Ser Val Asp Val

115 120 125

Asn Gly Gln Arg Val Gln Gly Arg His Val Leu Leu Ala Thr Gly Ser

130 135 140

Val Pro Lys Ser Leu Pro Gly Leu Ala Ile Asp Gly Asn Arg Ile Ile

145 150 155 160

Ser Ser Asp His Ala Leu Val Leu Asp Arg Val Pro Glu Ser Ala Ile

165 170 175

Val Leu Gly Gly Gly Val Ile Gly Val Glu Phe Ala Ser Ala Trp Lys

180 185 190

Ser Phe Gly Ala Asp Val Thr Val Ile Glu Gly Leu Lys His Leu Val

195 200 205

Pro Val Glu Asp Glu Asn Ser Ser Lys Leu Leu Glu Arg Ala Phe Arg

210 215 220

Lys Arg Gly Ile Lys Phe Asn Leu Gly Thr Phe Phe Ser Lys Ala Glu

225 230 235 240

Tyr Thr Gln Asn Gly Val Lys Val Thr Leu Ala Asp Gly Lys Glu Phe

245 250 255

Glu Ala Glu Val Leu Leu Val Ala Val Gly Arg Gly Pro Val Ser Gln

260 265 270

Gly Leu Gly Tyr Glu Glu Gln Gly Val Ala Met Asp Arg Gly Tyr Val

275 280 285

Leu Val Asp Glu Tyr Met Arg Thr Asn Val Pro Thr Ile Ser Ala Val

290 295 300

Gly Asp Leu Val Pro Thr Leu Gln Leu Ala His Val Gly Phe Ala Glu

305 310 315 320

Gly Ile Leu Val Ala Glu Arg Leu Ala Gly Leu Lys Thr Val Pro Ile

325 330 335

Asp Tyr Asp Gly Val Pro Arg Val Thr Tyr Cys His Pro Glu Val Ala

340 345 350

Ser Val Gly Ile Thr Glu Ala Lys Ala Lys Glu Ile Tyr Gly Ala Asp

355 360 365

Lys Val Val Ala Leu Lys Tyr Asn Leu Ala Gly Asn Gly Lys Ser Lys

370 375 380

Ile Leu Asn Thr Ala Gly Glu Ile Lys Leu Val Gln Val Lys Asp Gly

385 390 395 400

Ala Val Val Gly Val His Met Val Gly Asp Arg Met Gly Glu Gln Val

405 410 415

Gly Glu Ala Gln Leu Ile Tyr Asn Trp Glu Ala Leu Pro Ala Glu Val

420 425 430

Ala Gln Leu Ile His Ala His Pro Thr Gln Asn Glu Ala Met Gly Glu

435 440 445

Ala His Leu Ala Leu Ala Gly Lys Pro Leu His Ser His Asp

450 455 460

<210> 14

<211> 1545

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 14

atggctgact cgcaacccct gtccggtgct ccggaaggtg ccgaatattt aagagcagtg 60

ctgcgcgcgc cggtttacga ggcggcgcag gttacgccgc tacaaaaaat ggaaaaactg 120

tcgtcgcgtc ttgataacgt cattctggtg aagcgcgaag atcgccagcc agtgcacagc 180

tttaagctgc gcggcgcata cgccatgatg gcgggcctga cggaagaaca gaaagcgcac 240

ggcgtgatca ctgcttctgc gggtaaccac gcgcagggcg tcgcgttttc ttctgcgcgg 300

ttaggcgtga aggccctgat cgttatgcca accgccaccg ccgacatcaa agtcgacgcg 360

gtgcgcggct tcggcggcga agtgctgctc cacggcgcga actttgatga agcgaaagcc 420

aaagcgatcg aactgtcaca gcagcagggg ttcacctggg tgccgccgtt cgaccatccg 480

atggtgattg ccgggcaagg cacgctggcg ctggaactgc tccagcagga cgcccatctc 540

gaccgcgtat ttgtgccagt cggcggcggc ggtctggctg ctggcgtggc ggtgctgatc 600

aaacaactga tgccgcaaat caaagtgatc gccgtagaag cggaagactc cgcctgcctg 660

aaagcagcgc tggatgcggg tcatccggtt gatctgccgc gcgtagggct atttgctgaa 720

ggcgtagcgg taaaacgcat cggtgacgaa accttccgtt tatgccagga gtatctcgac 780

gacatcatca ccgtcgatag cgatgcgatc tgtgcggcga tgaaggattt attcgaagat 840

gtgcgcgcgg tggcggaacc ctctggcgcg ctggcgctgg cgggaatgaa aaaatatatc 900

gccctgcaca acattcgcgg cgaacggctg gcgcatattc tttccggtgc caacgtgaac 960

ttccacggcc tgcgctacgt ctcagaacgc tgcgaactgg gcgaacagcg tgaagcgttg 1020

ttggcggtga ccattccgga agaaaaaggc agcttcctca aattctgcca actgcttggc 1080

gggcgttcgg tcaccgagtt caactaccgt tttgccgatg ccaaaaacgc ctgcatcttt 1140

gtcggtgtgc gcctgagccg cggcctcgaa gagcgcaaag aaattttgca gatgctcaac 1200

gacggcggct acagcgtggt tgatctctcc gacgacgaaa tggcgaagct acacgtgcgc 1260

tatatggtcg gcggacgtcc atcgcatccg ttgcaggaac gcctctacag cttcgaattc 1320

ccggaatcac cgggcgcgct gctgcgcttc ctcaacacgc tgggtacgta ctggaacatt 1380

tctttgttcc actatcgcag ccatggcacc gactacgggc gcgtactggc ggcgttcgaa 1440

cttggcgacc atgaaccgga tttcgaaacc cggctgaatg agctgggcta cgattgccac 1500

gacgaaacca ataacccggc gttcaggttc tttttggcgg gttag 1545

<210> 15

<211> 514

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 15

Met Ala Asp Ser Gln Pro Leu Ser Gly Ala Pro Glu Gly Ala Glu Tyr

1 5 10 15

Leu Arg Ala Val Leu Arg Ala Pro Val Tyr Glu Ala Ala Gln Val Thr

20 25 30

Pro Leu Gln Lys Met Glu Lys Leu Ser Ser Arg Leu Asp Asn Val Ile

35 40 45

Leu Val Lys Arg Glu Asp Arg Gln Pro Val His Ser Phe Lys Leu Arg

50 55 60

Gly Ala Tyr Ala Met Met Ala Gly Leu Thr Glu Glu Gln Lys Ala His

65 70 75 80

Gly Val Ile Thr Ala Ser Ala Gly Asn His Ala Gln Gly Val Ala Phe

85 90 95

Ser Ser Ala Arg Leu Gly Val Lys Ala Leu Ile Val Met Pro Thr Ala

100 105 110

Thr Ala Asp Ile Lys Val Asp Ala Val Arg Gly Phe Gly Gly Glu Val

115 120 125

Leu Leu His Gly Ala Asn Phe Asp Glu Ala Lys Ala Lys Ala Ile Glu

130 135 140

Leu Ser Gln Gln Gln Gly Phe Thr Trp Val Pro Pro Phe Asp His Pro

145 150 155 160

Met Val Ile Ala Gly Gln Gly Thr Leu Ala Leu Glu Leu Leu Gln Gln

165 170 175

Asp Ala His Leu Asp Arg Val Phe Val Pro Val Gly Gly Gly Gly Leu

180 185 190

Ala Ala Gly Val Ala Val Leu Ile Lys Gln Leu Met Pro Gln Ile Lys

195 200 205

Val Ile Ala Val Glu Ala Glu Asp Ser Ala Cys Leu Lys Ala Ala Leu

210 215 220

Asp Ala Gly His Pro Val Asp Leu Pro Arg Val Gly Leu Phe Ala Glu

225 230 235 240

Gly Val Ala Val Lys Arg Ile Gly Asp Glu Thr Phe Arg Leu Cys Gln

245 250 255

Glu Tyr Leu Asp Asp Ile Ile Thr Val Asp Ser Asp Ala Ile Cys Ala

260 265 270

Ala Met Lys Asp Leu Phe Glu Asp Val Arg Ala Val Ala Glu Pro Ser

275 280 285

Gly Ala Leu Ala Leu Ala Gly Met Lys Lys Tyr Ile Ala Leu His Asn

290 295 300

Ile Arg Gly Glu Arg Leu Ala His Ile Leu Ser Gly Ala Asn Val Asn

305 310 315 320

Phe His Gly Leu Arg Tyr Val Ser Glu Arg Cys Glu Leu Gly Glu Gln

325 330 335

Arg Glu Ala Leu Leu Ala Val Thr Ile Pro Glu Glu Lys Gly Ser Phe

340 345 350

Leu Lys Phe Cys Gln Leu Leu Gly Gly Arg Ser Val Thr Glu Phe Asn

355 360 365

Tyr Arg Phe Ala Asp Ala Lys Asn Ala Cys Ile Phe Val Gly Val Arg

370 375 380

Leu Ser Arg Gly Leu Glu Glu Arg Lys Glu Ile Leu Gln Met Leu Asn

385 390 395 400

Asp Gly Gly Tyr Ser Val Val Asp Leu Ser Asp Asp Glu Met Ala Lys

405 410 415

Leu His Val Arg Tyr Met Val Gly Gly Arg Pro Ser His Pro Leu Gln

420 425 430

Glu Arg Leu Tyr Ser Phe Glu Phe Pro Glu Ser Pro Gly Ala Leu Leu

435 440 445

Arg Phe Leu Asn Thr Leu Gly Thr Tyr Trp Asn Ile Ser Leu Phe His

450 455 460

Tyr Arg Ser His Gly Thr Asp Tyr Gly Arg Val Leu Ala Ala Phe Glu

465 470 475 480

Leu Gly Asp His Glu Pro Asp Phe Glu Thr Arg Leu Asn Glu Leu Gly

485 490 495

Tyr Asp Cys His Asp Glu Thr Asn Asn Pro Ala Phe Arg Phe Phe Leu

500 505 510

Ala Gly

<210> 16

<211> 930

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 16

atgaccacga agaaagctga ttacatttgg ttcaatgggg agatggttcg ctgggaagac 60

gcgaaggtgc atgtgatgtc gcacgcgctg cactatggca cttcggtttt tgaaggcatc 120

cgttgctacg actcgcacaa aggaccggtt gtattccgcc atcgtgagca tatgcagcgt 180

ctgcatgact ccgccaaaat ctatcgcttc ccggtttcgc agagcattga tgagctgatg 240

gaagcttgtc gtgacgtgat ccgcaaaaac aatctcacca gcgcctatat ccgtccgctg 300

atcttcgtcg gtgatgttgg catgggagta aacccgccag cgggatactc aaccgacgtg 360

attatcgctg ctttcccgtg gggagcgtat ctgggcgcag aagcgctgga gcaggggatc 420

gatgcgatgg tttcctcctg gaaccgcgca gcaccaaaca ccatcccgac ggcggcaaaa 480

gccggtggta actacctctc ttccctgctg gtgggtagcg aagcgcgccg ccacggttat 540

caggaaggta tcgcgctgga tgtgaacggt tatatctctg aaggcgcagg cgaaaacctg 600

tttgaagtga aagatggtgt gctgttcacc ccaccgttca cctcctccgc gctgccgggt 660

attacccgtg atgccatcat caaactggcg aaagagctgg gaattgaagt acgtgagcag 720

gtgctgtcgc gcgaatccct gtacctggcg gatgaagtgt ttatgtccgg tacggcggca 780

gaaatcacgc cagtgcgcag cgtagacggt attcaggttg gcgaaggccg ttgtggcccg 840

gttaccaaac gcattcagca agccttcttc ggcctcttca ctggcgaaac cgaagataaa 900

tggggctggt tagatcaagt taatcaataa 930

<210> 17

<211> 309

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 17

Met Thr Thr Lys Lys Ala Asp Tyr Ile Trp Phe Asn Gly Glu Met Val

1 5 10 15

Arg Trp Glu Asp Ala Lys Val His Val Met Ser His Ala Leu His Tyr

20 25 30

Gly Thr Ser Val Phe Glu Gly Ile Arg Cys Tyr Asp Ser His Lys Gly

35 40 45

Pro Val Val Phe Arg His Arg Glu His Met Gln Arg Leu His Asp Ser

50 55 60

Ala Lys Ile Tyr Arg Phe Pro Val Ser Gln Ser Ile Asp Glu Leu Met

65 70 75 80

Glu Ala Cys Arg Asp Val Ile Arg Lys Asn Asn Leu Thr Ser Ala Tyr

85 90 95

Ile Arg Pro Leu Ile Phe Val Gly Asp Val Gly Met Gly Val Asn Pro

100 105 110

Pro Ala Gly Tyr Ser Thr Asp Val Ile Ile Ala Ala Phe Pro Trp Gly

115 120 125

Ala Tyr Leu Gly Ala Glu Ala Leu Glu Gln Gly Ile Asp Ala Met Val

130 135 140

Ser Ser Trp Asn Arg Ala Ala Pro Asn Thr Ile Pro Thr Ala Ala Lys

145 150 155 160

Ala Gly Gly Asn Tyr Leu Ser Ser Leu Leu Val Gly Ser Glu Ala Arg

165 170 175

Arg His Gly Tyr Gln Glu Gly Ile Ala Leu Asp Val Asn Gly Tyr Ile

180 185 190

Ser Glu Gly Ala Gly Glu Asn Leu Phe Glu Val Lys Asp Gly Val Leu

195 200 205

Phe Thr Pro Pro Phe Thr Ser Ser Ala Leu Pro Gly Ile Thr Arg Asp

210 215 220

Ala Ile Ile Lys Leu Ala Lys Glu Leu Gly Ile Glu Val Arg Glu Gln

225 230 235 240

Val Leu Ser Arg Glu Ser Leu Tyr Leu Ala Asp Glu Val Phe Met Ser

245 250 255

Gly Thr Ala Ala Glu Ile Thr Pro Val Arg Ser Val Asp Gly Ile Gln

260 265 270

Val Gly Glu Gly Arg Cys Gly Pro Val Thr Lys Arg Ile Gln Gln Ala

275 280 285

Phe Phe Gly Leu Phe Thr Gly Glu Thr Glu Asp Lys Trp Gly Trp Leu

290 295 300

Asp Gln Val Asn Gln

305

<210> 18

<211> 2760

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 18

atgactgatt ttttacgcga tgacatcagg ttcctcggtc aaatcctcgg tgaggtaatt 60

gcggaacaag aaggccagga ggtttatgaa ctggtcgaac aagcgcgcct gacttctttt 120

gatatcgcca agggcaacgc cgaaatggat agcctggttc aggttttcga cggcattact 180

ccagccaagg caacaccgat tgctcgcgca ttttcccact tcgctctgct ggctaacctg 240

gcggaagacc tctacgatga agagcttcgt gaacaggctc tcgatgcagg cgacacccct 300

ccggacagca ctcttgatgc cacctggctg aaactcaatg agggcaatgt tggcgcagaa 360

gctgtggccg atgtgctgcg caatgctgag gtggcgccgg ttctgactgc gcacccaact 420

gagactcgcc gccgcactgt ttttgatgcg caaaagtgga tcaccaccca catgcgtgaa 480

cgccacgctt tgcagtctgc ggagcctacc gctcgtacgc aaagcaagtt ggatgagatc 540

gagaagaaca tccgccgtcg catcaccatt ttgtggcaga ccgcgttgat tcgtgtggcc 600

cgcccacgta tcgaggacga gatcgaagta gggctgcgct actacaagct gagccttttg 660

gaagagattc cacgtatcaa ccgtgatgtg gctgttgagc ttcgtgagcg tttcggcgag 720

ggtgttcctt tgaagcccgt ggtcaagcca ggttcctgga ttggtggaga ccacgacggt 780

aacccttatg tcaccgcgga aacagttgag tattccactc accgcgctgc ggaaaccgtg 840

ctcaagtact atgcacgcca gctgcattcc ctcgagcatg agctcagcct gtcggaccgc 900

atgaataagg tcaccccgca gctgcttgcg ctggcagatg cagggcacaa cgacgtgcca 960

agccgcgtgg atgagcctta tcgacgcgcc gtccatggcg ttcgcggacg tatcctcgcg 1020

acgacggccg agctgatcgg cgaggacgcc gttgagggcg tgtggttcaa ggtctttact 1080

ccatacgcat ctccggaaga attcttaaac gatgcgttga ccattgatca ttctctgcgt 1140

gaatccaagg acgttctcat tgccgatgat cgtttgtctg tgctgatttc tgccatcgag 1200

agctttggat tcaaccttta cgcactggat ctgcgccaaa actccgaaag ctacgaggac 1260

gtcctcaccg agcttttcga acgcgcccaa gtcaccgcaa actaccgcga gctgtctgaa 1320

gcagagaagc ttgaggtgct gctgaaggaa ctgcgcagcc ctcgtccgct gatcccgcac 1380

ggttcagatg aatacagcga ggtcaccgac cgcgagctcg gcatcttccg caccgcgtcg 1440

gaggctgtta agaaattcgg gccacggatg gtgcctcact gcatcatctc catggcatca 1500

tcggtcaccg atgtgctcga gccgatggtg ttgctcaagg aattcggact catcgcagcc 1560

aacggcgaca acccacgcgg caccgtcgat gtcatcccac tgttcgaaac catcgaagat 1620

ctccaggccg gcgccggaat cctcgacgaa ctgtggaaaa ttgatctcta ccgcaactac 1680

ctcctgcagc gcgacaacgt ccaggaagtc atgctcggtt actccgattc caacaaggat 1740

ggcggatatt tctccgcaaa ctgggcgctt tacgacgcgg aactgcagct cgtcgaacta 1800

tgccgatcag ccggggtcaa gcttcgcctg ttccacggcc gtggtggcac cgtcggccgc 1860

ggtggcggac cttcctacga cgcgattctt gcccagccca ggggggctgt ccaaggttcc 1920

gtgcgcatca ccgagcaggg cgagatcatc tccgctaagt acggcaaccc cgaaaccgcg 1980

cgccgaaacc tcgaagccct ggtctcagcc acgcttgagg catcgcttct cgacgtctcc 2040

gaactcaccg atcaccaacg cgcgtacgac atcatgagtg agatctctga gctcagcttg 2100

aagaagtacg cctccttggt gcacgaggat caaggcttca tcgattactt cacccagtcc 2160

acgccgctgc aggagattgg atccctcaac atcggatcca ggccttcctc acgcaagcag 2220

acctcctcgg tggaagattt gcgagccatc ccatgggtgc tcagctggtc acagtctcgt 2280

gtcatgctgc caggctggtt tggtgtcgga accgcattag agcagtggat tggcgaaggg 2340

gagcaggcca cccaacgcat tgccgagctg caaacactca atgagtcctg gccatttttc 2400

acctcagtgt tggataacat ggctcaggtg atgtccaagg cagagctgcg tttggcaaag 2460

ctctacgcag acctgatccc agatacggaa gtagccgagc gagtctattc cgtcatccgc 2520

gaggagtact tcctgaccaa gaagatgttc tgcgtaatca ccggctctga tgatctgctt 2580

gatgacaacc cacttctcgc acgctctgtc cagcgccgat acccctacct gcttccactc 2640

aacgtgatcc aggtagagat gatgcgacgc taccgaaaag gcgaccaaag cgagcaagtg 2700

tcccgcaaca ttcagctgac catgaacggt ctttccactg cgctgcgcaa ctccggctag 2760

<210> 19

<211> 919

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 19

Met Thr Asp Phe Leu Arg Asp Asp Ile Arg Phe Leu Gly Gln Ile Leu

1 5 10 15

Gly Glu Val Ile Ala Glu Gln Glu Gly Gln Glu Val Tyr Glu Leu Val

20 25 30

Glu Gln Ala Arg Leu Thr Ser Phe Asp Ile Ala Lys Gly Asn Ala Glu

35 40 45

Met Asp Ser Leu Val Gln Val Phe Asp Gly Ile Thr Pro Ala Lys Ala

50 55 60

Thr Pro Ile Ala Arg Ala Phe Ser His Phe Ala Leu Leu Ala Asn Leu

65 70 75 80

Ala Glu Asp Leu Tyr Asp Glu Glu Leu Arg Glu Gln Ala Leu Asp Ala

85 90 95

Gly Asp Thr Pro Pro Asp Ser Thr Leu Asp Ala Thr Trp Leu Lys Leu

100 105 110

Asn Glu Gly Asn Val Gly Ala Glu Ala Val Ala Asp Val Leu Arg Asn

115 120 125

Ala Glu Val Ala Pro Val Leu Thr Ala His Pro Thr Glu Thr Arg Arg

130 135 140

Arg Thr Val Phe Asp Ala Gln Lys Trp Ile Thr Thr His Met Arg Glu

145 150 155 160

Arg His Ala Leu Gln Ser Ala Glu Pro Thr Ala Arg Thr Gln Ser Lys

165 170 175

Leu Asp Glu Ile Glu Lys Asn Ile Arg Arg Arg Ile Thr Ile Leu Trp

180 185 190

Gln Thr Ala Leu Ile Arg Val Ala Arg Pro Arg Ile Glu Asp Glu Ile

195 200 205

Glu Val Gly Leu Arg Tyr Tyr Lys Leu Ser Leu Leu Glu Glu Ile Pro

210 215 220

Arg Ile Asn Arg Asp Val Ala Val Glu Leu Arg Glu Arg Phe Gly Glu

225 230 235 240

Gly Val Pro Leu Lys Pro Val Val Lys Pro Gly Ser Trp Ile Gly Gly

245 250 255

Asp His Asp Gly Asn Pro Tyr Val Thr Ala Glu Thr Val Glu Tyr Ser

260 265 270

Thr His Arg Ala Ala Glu Thr Val Leu Lys Tyr Tyr Ala Arg Gln Leu

275 280 285

His Ser Leu Glu His Glu Leu Ser Leu Ser Asp Arg Met Asn Lys Val

290 295 300

Thr Pro Gln Leu Leu Ala Leu Ala Asp Ala Gly His Asn Asp Val Pro

305 310 315 320

Ser Arg Val Asp Glu Pro Tyr Arg Arg Ala Val His Gly Val Arg Gly

325 330 335

Arg Ile Leu Ala Thr Thr Ala Glu Leu Ile Gly Glu Asp Ala Val Glu

340 345 350

Gly Val Trp Phe Lys Val Phe Thr Pro Tyr Ala Ser Pro Glu Glu Phe

355 360 365

Leu Asn Asp Ala Leu Thr Ile Asp His Ser Leu Arg Glu Ser Lys Asp

370 375 380

Val Leu Ile Ala Asp Asp Arg Leu Ser Val Leu Ile Ser Ala Ile Glu

385 390 395 400

Ser Phe Gly Phe Asn Leu Tyr Ala Leu Asp Leu Arg Gln Asn Ser Glu

405 410 415

Ser Tyr Glu Asp Val Leu Thr Glu Leu Phe Glu Arg Ala Gln Val Thr

420 425 430

Ala Asn Tyr Arg Glu Leu Ser Glu Ala Glu Lys Leu Glu Val Leu Leu

435 440 445

Lys Glu Leu Arg Ser Pro Arg Pro Leu Ile Pro His Gly Ser Asp Glu

450 455 460

Tyr Ser Glu Val Thr Asp Arg Glu Leu Gly Ile Phe Arg Thr Ala Ser

465 470 475 480

Glu Ala Val Lys Lys Phe Gly Pro Arg Met Val Pro His Cys Ile Ile

485 490 495

Ser Met Ala Ser Ser Val Thr Asp Val Leu Glu Pro Met Val Leu Leu

500 505 510

Lys Glu Phe Gly Leu Ile Ala Ala Asn Gly Asp Asn Pro Arg Gly Thr

515 520 525

Val Asp Val Ile Pro Leu Phe Glu Thr Ile Glu Asp Leu Gln Ala Gly

530 535 540

Ala Gly Ile Leu Asp Glu Leu Trp Lys Ile Asp Leu Tyr Arg Asn Tyr

545 550 555 560

Leu Leu Gln Arg Asp Asn Val Gln Glu Val Met Leu Gly Tyr Ser Asp

565 570 575

Ser Asn Lys Asp Gly Gly Tyr Phe Ser Ala Asn Trp Ala Leu Tyr Asp

580 585 590

Ala Glu Leu Gln Leu Val Glu Leu Cys Arg Ser Ala Gly Val Lys Leu

595 600 605

Arg Leu Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro

610 615 620

Ser Tyr Asp Ala Ile Leu Ala Gln Pro Arg Gly Ala Val Gln Gly Ser

625 630 635 640

Val Arg Ile Thr Glu Gln Gly Glu Ile Ile Ser Ala Lys Tyr Gly Asn

645 650 655

Pro Glu Thr Ala Arg Arg Asn Leu Glu Ala Leu Val Ser Ala Thr Leu

660 665 670

Glu Ala Ser Leu Leu Asp Val Ser Glu Leu Thr Asp His Gln Arg Ala

675 680 685

Tyr Asp Ile Met Ser Glu Ile Ser Glu Leu Ser Leu Lys Lys Tyr Ala

690 695 700

Ser Leu Val His Glu Asp Gln Gly Phe Ile Asp Tyr Phe Thr Gln Ser

705 710 715 720

Thr Pro Leu Gln Glu Ile Gly Ser Leu Asn Ile Gly Ser Arg Pro Ser

725 730 735

Ser Arg Lys Gln Thr Ser Ser Val Glu Asp Leu Arg Ala Ile Pro Trp

740 745 750

Val Leu Ser Trp Ser Gln Ser Arg Val Met Leu Pro Gly Trp Phe Gly

755 760 765

Val Gly Thr Ala Leu Glu Gln Trp Ile Gly Glu Gly Glu Gln Ala Thr

770 775 780

Gln Arg Ile Ala Glu Leu Gln Thr Leu Asn Glu Ser Trp Pro Phe Phe

785 790 795 800

Thr Ser Val Leu Asp Asn Met Ala Gln Val Met Ser Lys Ala Glu Leu

805 810 815

Arg Leu Ala Lys Leu Tyr Ala Asp Leu Ile Pro Asp Thr Glu Val Ala

820 825 830

Glu Arg Val Tyr Ser Val Ile Arg Glu Glu Tyr Phe Leu Thr Lys Lys

835 840 845

Met Phe Cys Val Ile Thr Gly Ser Asp Asp Leu Leu Asp Asp Asn Pro

850 855 860

Leu Leu Ala Arg Ser Val Gln Arg Arg Tyr Pro Tyr Leu Leu Pro Leu

865 870 875 880

Asn Val Ile Gln Val Glu Met Met Arg Arg Tyr Arg Lys Gly Asp Gln

885 890 895

Ser Glu Gln Val Ser Arg Asn Ile Gln Leu Thr Met Asn Gly Leu Ser

900 905 910

Thr Ala Leu Arg Asn Ser Gly

915

<210> 20

<211> 1257

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 20

gtctcgagaa tatcctcctt ataacttcgt ataatgtatg ctatacgaac ggtaagagcg 60

cttggccgct cacttcgcag aataaataaa tcctggtgtc cctgttgata ccgggaagcc 120

ctgggccaac ttttggcgaa aatgagacgt tgatcggcac gtaagaggtt ccaactttca 180

ccataatgaa ataagatcac taccgggcgt attttttgag ttatcgagat tttcaggagc 240

taaggaagct aaaatggaga aaaaaatcac tggatatacc accgttgata tatcccaatg 300

gcatcgtaaa gaacattttg aggcatttca gtcagttgct caatgtacct ataaccagac 360

cgttcagctg gatattacgg cctttttaaa gaccgtaaag aaaaataagc acaagtttta 420

tccggccttt attcacattc ttgcccgcct gatgaatgct catccggagt tccgtatggc 480

aatgaaagac ggtgagctgg tgatatggga tagtgttcac ccttgttaca ccgttttcca 540

tgagcaaact gaaacgtttt catcgctctg gagtgaatac cacgacgatt tccggcagtt 600

tctacacata tattcgcaag atgtggcgtg ttacggtgaa aacctggcct atttccctaa 660

agggtttatt gagaatatgt ttttcgtctc agccaatccc tgggtgagtt tcaccagttt 720

tgatttaaac gtggccaata tggacaactt cttcgccccc gttttcacta tgggcaaata 780

ttatacgcaa ggcgacaagg tgctgatgcc gctggcgatt caggttcatc atgccgtctg 840

tgatggcttc catgtcggca gaatgcttaa tgaattacaa cagtactgcg atgagtggca 900

gggcggggcg taattttttt aaggcagtta ttggtgccct taaacgcctg gtgctacgcc 960

tgaataagtg ataataagcg gatgaatggc agaaattcga aagcaaattc gacccggtcg 1020

tcggttcagg gcagggtcgt taaatagccg cttatgtcta ttgctggttt accggtttat 1080

tgactaccgg aagcagtgtg accgtgtgct tctcaaatgc ctgagggcat gctgcggcag 1140

cgtgagggga tctttaccgt tcgtataatg tatgctatac caagttatga agctagctta 1200

tcaaaaagtt gacaattaat catcggctcg tataatgtgt ggaaggagga attaacc 1257

<210> 21

<211> 3749

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 21

atgggcagca gccatcacca tcatcaccac agccaggatc cgagcggaac aggacgactg 60

gcaggaaaga ttgcgttaat taccggtggc gccggcaata tcggcagtga attgacacgt 120

cgctttctcg cagagggagc gacggtcatt attagtggac ggaatcgggc gaagttgacc 180

gcactggccg aacggatgca ggcagaggca ggagtgccgg caaagcgcat cgatctcgaa 240

gtcatggatg ggagtgatcc ggtcgcggta cgtgccggta tcgaagcgat tgtggcccgt 300

cacggccaga tcgacattct ggtcaacaat gcaggaagtg ccggtgccca gcgtcgtctg 360

gccgagattc cactcactga agctgaatta ggccctggcg ccgaagagac gcttcatgcc 420

agcatcgcca atttacttgg tatgggatgg catctgatgc gtattgcggc acctcatatg 480

ccggtaggaa gtgcggtcat caatgtctcg accatctttt cacgggctga gtactacggg 540

cggattccgt atgtcacccc taaagctgct cttaatgctc tatctcaact tgctgcgcgt 600

gagttaggtg cacgtggcat ccgcgttaat acgatctttc ccggcccgat tgaaagtgat 660

cgcatccgta cagtgttcca gcgtatggat cagctcaagg ggcggcccga aggcgacaca 720

gcgcaccatt ttttgaacac catgcgattg tgtcgtgcca acgaccaggg cgcgcttgaa 780

cgtcggttcc cctccgtcgg tgatgtggca gacgccgctg tctttctggc cagtgccgaa 840

tccgccgctc tctccggtga gacgattgag gttacgcacg gaatggagtt gccggcctgc 900

agtgagacca gcctgctggc ccgtactgat ctgcgcacga ttgatgccag tggccgcacg 960

acgctcatct gcgccggcga ccagattgaa gaggtgatgg cgctcaccgg tatgttgcgt 1020

acctgtggga gtgaagtgat catcggcttc cgttcggctg cggcgctggc ccagttcgag 1080

caggcagtca atgagagtcg gcggctggcc ggcgcagact ttacgcctcc cattgccttg 1140

ccactcgatc cacgcgatcc ggcaacaatt gacgctgtct tcgattgggc cggcgagaat 1200

accggcggga ttcatgcagc ggtgattctg cctgctacca gtcacgaacc ggcaccgtgc 1260

gtgattgagg ttgatgatga gcgggtgctg aattttctgg ccgatgaaat caccgggaca 1320

attgtgattg ccagtcgcct ggcccgttac tggcagtcgc aacggcttac ccccggcgca 1380

cgtgcgcgtg ggccgcgtgt catttttctc tcgaacggtg ccgatcaaaa tgggaatgtt 1440

tacggacgca ttcaaagtgc cgctatcggt cagctcattc gtgtgtggcg tcacgaggct 1500

gaacttgact atcagcgtgc cagcgccgcc ggtgatcatg tgctgccgcc ggtatgggcc 1560

aatcagattg tgcgcttcgc taaccgcagc cttgaagggt tagaatttgc ctgtgcctgg 1620

acagctcaat tgctccatag tcaacgccat atcaatgaga ttaccctcaa catccctgcc 1680

aacatttaac aggaggaatt aacatggcag atctccatca ccatcatcac catcacagcg 1740

ccaccaccgg cgcacgcagt gcatcggtcg gatgggcgga aagcctgatc gggttgcatt 1800

tggggaaagt tgccttgatt accggtggca gcgccggtat tggtgggcag atcgggcgcc 1860

tcctggcttt gagtggcgcg cgcgtgatgc tggcagcccg tgatcggcat aagctcgaac 1920

agatgcaggc gatgatccaa tctgagctgg ctgaggtggg gtataccgat gtcgaagatc 1980

gcgtccacat tgcaccgggc tgcgatgtga gtagcgaagc gcagcttgcg gatcttgttg 2040

aacgtaccct gtcagctttt ggcaccgtcg attatctgat caacaacgcc gggatcgccg 2100

gtgtcgaaga gatggttatc gatatgccag ttgagggatg gcgccatacc ctcttcgcca 2160

atctgatcag caactactcg ttgatgcgca aactggcgcc gttgatgaaa aaacagggta 2220

gcggttacat ccttaacgtc tcatcatact ttggcggtga aaaagatgcg gccattccct 2280

accccaaccg tgccgattac gccgtctcga aggctggtca gcgggcaatg gccgaagtct 2340

ttgcgcgctt ccttggcccg gagatacaga tcaatgccat tgcgccgggt ccggtcgaag 2400

gtgatcgctt gcgcggtacc ggtgaacgtc ccggcctctt tgcccgtcgg gcgcggctga 2460

ttttggagaa caagcggctg aatgagcttc acgctgctct tatcgcggct gcgcgcaccg 2520

atgagcgatc tatgcacgaa ctggttgaac tgctcttacc caatgatgtg gccgcactag 2580

agcagaatcc cgcagcacct accgcgttgc gtgaactggc acgacgtttt cgcagcgaag 2640

gcgatccggc ggcatcatca agcagtgcgc tgctgaaccg ttcaattgcc gctaaattgc 2700

tggctcgttt gcataatggt ggctatgtgt tgcctgccga catctttgca aacctgccaa 2760

acccgcccga tcccttcttc acccgagccc agattgatcg cgaggctcgc aaggttcgtg 2820

acggcatcat ggggatgctc tacctgcaac ggatgccgac tgagtttgat gtcgcaatgg 2880

ccaccgtcta ttaccttgcc gaccgcgtgg tcagtggtga gacattccac ccatcaggtg 2940

gtttgcgtta cgaacgcacc cctaccggtg gcgaactctt cggcttgccc tcaccggaac 3000

ggctggcgga gctggtcgga agcacggtct atctgatagg tgaacatctg actgaacacc 3060

ttaacctgct tgcccgtgcg tacctcgaac gttacggggc acgtcaggta gtgatgattg 3120

ttgagacaga aaccggggca gagacaatgc gtcgcttgct ccacgatcac gtcgaggctg 3180

gtcggctgat gactattgtg gccggtgatc agatcgaagc cgctatcgac caggctatca 3240

ctcgctacgg tcgcccaggg ccggtcgtct gtaccccctt ccggccactg ccgacggtac 3300

cactggtcgg gcgtaaagac agtgactgga gcacagtgtt gagtgaggct gaatttgccg 3360

agttgtgcga acaccagctc acccaccatt tccgggtagc gcgctggatt gccctgagtg 3420

atggtgcccg tctcgcgctg gtcactcccg aaactacggc tacctcaact accgagcaat 3480

ttgctctggc taacttcatc aaaacgaccc ttcacgcttt tacggctacg attggtgtcg 3540

agagcgaaag aactgctcag cgcattctga tcaatcaagt cgatctgacc cggcgtgcgc 3600

gtgccgaaga gccgcgtgat ccgcacgagc gtcaacaaga actggaacgt tttatcgagg 3660

cagtcttgct ggtcactgca ccactcccgc ctgaagccga tacccgttac gccgggcgga 3720

ttcatcgcgg acgggcgatt accgtgtaa 3749

<210> 22

<211> 562

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 22

Met Gly Ser Ser His His His His His His Ser Gln Asp Pro Ser Gly

1 5 10 15

Thr Gly Arg Leu Ala Gly Lys Ile Ala Leu Ile Thr Gly Gly Ala Gly

20 25 30

Asn Ile Gly Ser Glu Leu Thr Arg Arg Phe Leu Ala Glu Gly Ala Thr

35 40 45

Val Ile Ile Ser Gly Arg Asn Arg Ala Lys Leu Thr Ala Leu Ala Glu

50 55 60

Arg Met Gln Ala Glu Ala Gly Val Pro Ala Lys Arg Ile Asp Leu Glu

65 70 75 80

Val Met Asp Gly Ser Asp Pro Val Ala Val Arg Ala Gly Ile Glu Ala

85 90 95

Ile Val Ala Arg His Gly Gln Ile Asp Ile Leu Val Asn Asn Ala Gly

100 105 110

Ser Ala Gly Ala Gln Arg Arg Leu Ala Glu Ile Pro Leu Thr Glu Ala

115 120 125

Glu Leu Gly Pro Gly Ala Glu Glu Thr Leu His Ala Ser Ile Ala Asn

130 135 140

Leu Leu Gly Met Gly Trp His Leu Met Arg Ile Ala Ala Pro His Met

145 150 155 160

Pro Val Gly Ser Ala Val Ile Asn Val Ser Thr Ile Phe Ser Arg Ala

165 170 175

Glu Tyr Tyr Gly Arg Ile Pro Tyr Val Thr Pro Lys Ala Ala Leu Asn

180 185 190

Ala Leu Ser Gln Leu Ala Ala Arg Glu Leu Gly Ala Arg Gly Ile Arg

195 200 205

Val Asn Thr Ile Phe Pro Gly Pro Ile Glu Ser Asp Arg Ile Arg Thr

210 215 220

Val Phe Gln Arg Met Asp Gln Leu Lys Gly Arg Pro Glu Gly Asp Thr

225 230 235 240

Ala His His Phe Leu Asn Thr Met Arg Leu Cys Arg Ala Asn Asp Gln

245 250 255

Gly Ala Leu Glu Arg Arg Phe Pro Ser Val Gly Asp Val Ala Asp Ala

260 265 270

Ala Val Phe Leu Ala Ser Ala Glu Ser Ala Ala Leu Ser Gly Glu Thr

275 280 285

Ile Glu Val Thr His Gly Met Glu Leu Pro Ala Cys Ser Glu Thr Ser

290 295 300

Leu Leu Ala Arg Thr Asp Leu Arg Thr Ile Asp Ala Ser Gly Arg Thr

305 310 315 320

Thr Leu Ile Cys Ala Gly Asp Gln Ile Glu Glu Val Met Ala Leu Thr

325 330 335

Gly Met Leu Arg Thr Cys Gly Ser Glu Val Ile Ile Gly Phe Arg Ser

340 345 350

Ala Ala Ala Leu Ala Gln Phe Glu Gln Ala Val Asn Glu Ser Arg Arg

355 360 365

Leu Ala Gly Ala Asp Phe Thr Pro Pro Ile Ala Leu Pro Leu Asp Pro

370 375 380

Arg Asp Pro Ala Thr Ile Asp Ala Val Phe Asp Trp Ala Gly Glu Asn

385 390 395 400

Thr Gly Gly Ile His Ala Ala Val Ile Leu Pro Ala Thr Ser His Glu

405 410 415

Pro Ala Pro Cys Val Ile Glu Val Asp Asp Glu Arg Val Leu Asn Phe

420 425 430

Leu Ala Asp Glu Ile Thr Gly Thr Ile Val Ile Ala Ser Arg Leu Ala

435 440 445

Arg Tyr Trp Gln Ser Gln Arg Leu Thr Pro Gly Ala Arg Ala Arg Gly

450 455 460

Pro Arg Val Ile Phe Leu Ser Asn Gly Ala Asp Gln Asn Gly Asn Val

465 470 475 480

Tyr Gly Arg Ile Gln Ser Ala Ala Ile Gly Gln Leu Ile Arg Val Trp

485 490 495

Arg His Glu Ala Glu Leu Asp Tyr Gln Arg Ala Ser Ala Ala Gly Asp

500 505 510

His Val Leu Pro Pro Val Trp Ala Asn Gln Ile Val Arg Phe Ala Asn

515 520 525

Arg Ser Leu Glu Gly Leu Glu Phe Ala Cys Ala Trp Thr Ala Gln Leu

530 535 540

Leu His Ser Gln Arg His Ile Asn Glu Ile Thr Leu Asn Ile Pro Ala

545 550 555 560

Asn Ile

<210> 23

<211> 681

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 23

Met Ala Asp Leu His His His His His His His Ser Ala Thr Thr Gly

1 5 10 15

Ala Arg Ser Ala Ser Val Gly Trp Ala Glu Ser Leu Ile Gly Leu His

20 25 30

Leu Gly Lys Val Ala Leu Ile Thr Gly Gly Ser Ala Gly Ile Gly Gly

35 40 45

Gln Ile Gly Arg Leu Leu Ala Leu Ser Gly Ala Arg Val Met Leu Ala

50 55 60

Ala Arg Asp Arg His Lys Leu Glu Gln Met Gln Ala Met Ile Gln Ser

65 70 75 80

Glu Leu Ala Glu Val Gly Tyr Thr Asp Val Glu Asp Arg Val His Ile

85 90 95

Ala Pro Gly Cys Asp Val Ser Ser Glu Ala Gln Leu Ala Asp Leu Val

100 105 110

Glu Arg Thr Leu Ser Ala Phe Gly Thr Val Asp Tyr Leu Ile Asn Asn

115 120 125

Ala Gly Ile Ala Gly Val Glu Glu Met Val Ile Asp Met Pro Val Glu

130 135 140

Gly Trp Arg His Thr Leu Phe Ala Asn Leu Ile Ser Asn Tyr Ser Leu

145 150 155 160

Met Arg Lys Leu Ala Pro Leu Met Lys Lys Gln Gly Ser Gly Tyr Ile

165 170 175

Leu Asn Val Ser Ser Tyr Phe Gly Gly Glu Lys Asp Ala Ala Ile Pro

180 185 190

Tyr Pro Asn Arg Ala Asp Tyr Ala Val Ser Lys Ala Gly Gln Arg Ala

195 200 205

Met Ala Glu Val Phe Ala Arg Phe Leu Gly Pro Glu Ile Gln Ile Asn

210 215 220

Ala Ile Ala Pro Gly Pro Val Glu Gly Asp Arg Leu Arg Gly Thr Gly

225 230 235 240

Glu Arg Pro Gly Leu Phe Ala Arg Arg Ala Arg Leu Ile Leu Glu Asn

245 250 255

Lys Arg Leu Asn Glu Leu His Ala Ala Leu Ile Ala Ala Ala Arg Thr

260 265 270

Asp Glu Arg Ser Met His Glu Leu Val Glu Leu Leu Leu Pro Asn Asp

275 280 285

Val Ala Ala Leu Glu Gln Asn Pro Ala Ala Pro Thr Ala Leu Arg Glu

290 295 300

Leu Ala Arg Arg Phe Arg Ser Glu Gly Asp Pro Ala Ala Ser Ser Ser

305 310 315 320

Ser Ala Leu Leu Asn Arg Ser Ile Ala Ala Lys Leu Leu Ala Arg Leu

325 330 335

His Asn Gly Gly Tyr Val Leu Pro Ala Asp Ile Phe Ala Asn Leu Pro

340 345 350

Asn Pro Pro Asp Pro Phe Phe Thr Arg Ala Gln Ile Asp Arg Glu Ala

355 360 365

Arg Lys Val Arg Asp Gly Ile Met Gly Met Leu Tyr Leu Gln Arg Met

370 375 380

Pro Thr Glu Phe Asp Val Ala Met Ala Thr Val Tyr Tyr Leu Ala Asp

385 390 395 400

Arg Val Val Ser Gly Glu Thr Phe His Pro Ser Gly Gly Leu Arg Tyr

405 410 415

Glu Arg Thr Pro Thr Gly Gly Glu Leu Phe Gly Leu Pro Ser Pro Glu

420 425 430

Arg Leu Ala Glu Leu Val Gly Ser Thr Val Tyr Leu Ile Gly Glu His

435 440 445

Leu Thr Glu His Leu Asn Leu Leu Ala Arg Ala Tyr Leu Glu Arg Tyr

450 455 460

Gly Ala Arg Gln Val Val Met Ile Val Glu Thr Glu Thr Gly Ala Glu

465 470 475 480

Thr Met Arg Arg Leu Leu His Asp His Val Glu Ala Gly Arg Leu Met

485 490 495

Thr Ile Val Ala Gly Asp Gln Ile Glu Ala Ala Ile Asp Gln Ala Ile

500 505 510

Thr Arg Tyr Gly Arg Pro Gly Pro Val Val Cys Thr Pro Phe Arg Pro

515 520 525

Leu Pro Thr Val Pro Leu Val Gly Arg Lys Asp Ser Asp Trp Ser Thr

530 535 540

Val Leu Ser Glu Ala Glu Phe Ala Glu Leu Cys Glu His Gln Leu Thr

545 550 555 560

His His Phe Arg Val Ala Arg Trp Ile Ala Leu Ser Asp Gly Ala Arg

565 570 575

Leu Ala Leu Val Thr Pro Glu Thr Thr Ala Thr Ser Thr Thr Glu Gln

580 585 590

Phe Ala Leu Ala Asn Phe Ile Lys Thr Thr Leu His Ala Phe Thr Ala

595 600 605

Thr Ile Gly Val Glu Ser Glu Arg Thr Ala Gln Arg Ile Leu Ile Asn

610 615 620

Gln Val Asp Leu Thr Arg Arg Ala Arg Ala Glu Glu Pro Arg Asp Pro

625 630 635 640

His Glu Arg Gln Gln Glu Leu Glu Arg Phe Ile Glu Ala Val Leu Leu

645 650 655

Val Thr Ala Pro Leu Pro Pro Glu Ala Asp Thr Arg Tyr Ala Gly Arg

660 665 670

Ile His Arg Gly Arg Ala Ile Thr Val

675 680

<210> 24

<211> 4293

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 24

aatgtgcctg tcaaatggac gaagcaggga ttctgcaaac cctatgctac tccgtcaagc 60

cgtcaattgt ctgattcgtt accaattatg acaacttgac ggctacatca ttcacttttt 120

cttcacaacc ggcacggaac tcgctcgggc tggccccggt gcatttttta aatacccgcg 180

agaaatagag ttgatcgtca aaaccaacat tgcgaccgac ggtggcgata ggcatccggg 240

tggtgctcaa aagcagcttc gcctggctga tacgttggtc ctcgcgccag cttaagacgc 300

taatccctaa ctgctggcgg aaaagatgtg acagacgcga cggcgacaag caaacatgct 360

gtgcgacgct ggcgatatca aaattgctgt ctgccaggtg atcgctgatg tactgacaag 420

cctcgcgtac ccgattatcc atcggtggat ggagcgactc gttaatcgct tccatgcgcc 480

gcagtaacaa ttgctcaagc agatttatcg ccagcagctc cgaatagcgc ccttcccctt 540

gcccggcgtt aatgatttgc ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg 600

ggcgaaagaa ccccgtattg gcaaatattg acggccagtt aagccattca tgccagtagg 660

cgcgcggacg aaagtaaacc cactggtgat accattcgcg agcctccgga tgacgaccgt 720

agtgatgaat ctctcctggc gggaacagca aaatatcacc cggtcggcaa acaaattctc 780

gtccctgatt tttcaccacc ccctgaccgc gaatggtgag attgagaata taacctttca 840

ttcccagcgg tcggtcgata aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac 900

ccgccaccag atgggcatta aacgagtatc ccggcagcag gggatcattt tgcgcttcag 960

ccatactttt catactcccg ccattcagag aagaaaccaa ttgtccatat tgcatcagac 1020

attgccgtca ctgcgtcttt tactggctct tctcgctaac caaaccggta accccgctta 1080

ttaaaagcat tctgtaacaa agcgggacca aagccatgac aaaaacgcgt aacaaaagtg 1140

tctataatca cggcagaaaa gtccacattg attatttgca cggcgtcaca ctttgctatg 1200

ccatagcatt tttatccata agattagcgg atcctacctg acgcttttta tcgcaactct 1260

ctactgtttc tccatacccg ttttttgggc taacaggagg aattaaccat gggtacctct 1320

catcatcatc atcatcacag cagcggcctg gtgccgcgcg gcagcctcga gggtagatct 1380

ggtactagtg gtgaattcgg tgagctcggt ctgcagctgg tgccgcgcgg cagccaccac 1440

caccaccacc actaatacag attaaatcag aacgcagaag cggtctgata aaacagaatt 1500

tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 1560

gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 1620

caaataaaac gaaaggctca gtcgaaagac tgggcctttc gtcgacctaa ttcccatgtc 1680

agccgttaag tgttcctgtg tcactgaaaa ttgctttgag aggctctaag ggcttctcag 1740

tgcgttacat ccctggcttg ttgtccacaa ccgttaaacc ttaaaagctt taaaagcctt 1800

atatattctt ttttttctta taaaacttaa aaccttagag gctatttaag ttgctgattt 1860

atattaattt tattgttcaa acatgagagc ttagtacgtg aaacatgaga gcttagtacg 1920

ttagccatga gagcttagta cgttagccat gagggtttag ttcgttaaac atgagagctt 1980

agtacgttaa acatgagagc ttagtacgtg aaacatgaga gcttagtacg tactatcaac 2040

aggttgaact gcggatcttg atgagtggat agtacgttgc taaaacatga gataaaaatt 2100

gactctcatg ttattggcgt taagatatac agaatgatga ggttttttta tgagactcaa 2160

ggtcatgatg gacgtgaaca aaaaaacgaa aattcgccac cgaaacgagc taaatcacac 2220

cctggctcaa cttcctttgc ccgcaaagcg agtgatgtat atggcgcttg ctcccattga 2280

tagcaaggaa cctcttgaac gagggcgagt tttcaaaatt agggctgaag accttgcagc 2340

gctcgccaaa atcaccccat cgcttgctta tcgacaatta aaagagggtg gtaagttact 2400

tggtgccagc aaaatttcgc taagagggga tgatatcatt gcttcagcta aagagcttaa 2460

cctgctcttt actgctaaag actcccctga agagttagat cttaacatta ttgagtggat 2520

agcttattca aatgatgaag gatacttgtc tttaaaattc accagaacca tagaaccata 2580

tatctctagc cttattggga aaaaaaataa attcacaacg caattgttaa cggcaagctt 2640

acgcttaagt agccagtatt catcttctct ttatcaactt atcaggaagc attactctaa 2700

ttttaagaag aaaaattatt ttattatttc cgttgatgag ttaaaggaag agttaatagc 2760

ttatactttt gataaagatg gaagtattga gtacaaatac cctgactttc ctatttttaa 2820

aagggatgta ttaaataaag ccattgctga aattaaaaag aaaacagaaa tatcgtttgt 2880

tggctttact gttcatgaaa aagaaggaag aaaaattagt aagctgaagt tcgaatttgt 2940

cgttgatgaa gatgaatttt ctggcgataa agatgatgaa gcttttttta tgaatttatc 3000

tgaagctaat gcagcttttc tcaaggtatt tgatgaaacc gtacctccca aaaaagctaa 3060

ggggtgatat atggctaaaa tttacgattt ccctcaagga gccgaacgcc gcaggatgca 3120

ccgcaaaatc cagtggaaca acgctgtaaa attatctaaa aatggctgga gtaagccaga 3180

ggttaaacgc tggtcttttt tagcattcat ctcaactggc tggcggccgc ggaaccccta 3240

tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3300

aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3360

ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3420

aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3480

acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3540

ttaaagttct gctatgtgat acactattat cccgtattga cgccgggcaa gagcaactcg 3600

gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3660

atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 3720

acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 3780

tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 3840

ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatgccaaca acgttgcgca 3900

aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactgaatgg 3960

aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4020

ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4080

atggtaagcg ctcccgtatc gtagttatct acaccacggg gagtcaggca actatggatg 4140

aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4200

accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4260

tctaggtgaa gatccttttt gataatcgca tgc 4293

<210> 25

<211> 1185

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 25

atggcgtccg taactgtaga gcaaatccga aaggctcagc gagctgaagg tccggccacc 60

atcctcgcca ttggcaccgc cgttcctgcc aactgtttca accaagctga ttttcccgac 120

tactactttc gtgtcaccaa aagtgaacac atgactgatc tcaaaaagaa gttccaacga 180

atgtgtgaaa aatccactat aaaaaagcgt tacttgcact tgaccgaaga gcatctgaag 240

cagaacccac atctgtgcga gtacaatgca ccatctctga acacacgcca agacatgttg 300

gtggttgaag ttcccaagct tgggaaggag gctgcaatca atgccatcaa agaatggggc 360

caacccaagt ccaagatcac ccatctcatc ttctgcaccg gctcctccat cgacatgcca 420

ggagccgatt accaatgcgc caagcttctc ggcctccgac cctcggtgaa gcgagtgatg 480

ctgtatcaac tcggctgtta tgccggtgga aaagttcttc gcatagccaa ggacatagca 540

gagaacaaca agggcgctag agttctcatt gtgtgctctg agatcacagc ttgtatcttt 600

cgcgggccct cggagaaaca tttggattgc ttggtggggc aatctctgtt cggagacggg 660

gcatcttcgg tcatcgttgg tgccgaccct gatgcctcgg taggcgagcg gccgatcttc 720

gagttggttt cagctgcgca gacgattttg cctaactcgg atggagccat agccgggcac 780

gtaacggaag ccgggctgac atttcacttg ctgagggacg tgccagggtt gatctcccaa 840

aacattgaga agagcttgat tgaggccttc actccgattg ggattaatga ctggaacaac 900

atattctgga ttgcacatcc cggtggacct gccattctgg acgagataga ggccaagctc 960

gagctgaaga aggagaagat gaaggcgtct cgtgaaatgc tgagcgagta tgggaacatg 1020

tcatgtgcaa gcgttttctt catagtagat gagatgagga aacagtcgtc gaaggaaggg 1080

aagtctacca ccggagatgg actggagtgg ggcgctctct tcgggtttgg accgggtctg 1140

acggtggaga cggtggtctt gcacagcgtg cccacaaacg tctaa 1185

<210> 26

<211> 394

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 26

Met Ala Ser Val Thr Val Glu Gln Ile Arg Lys Ala Gln Arg Ala Glu

1 5 10 15

Gly Pro Ala Thr Ile Leu Ala Ile Gly Thr Ala Val Pro Ala Asn Cys

20 25 30

Phe Asn Gln Ala Asp Phe Pro Asp Tyr Tyr Phe Arg Val Thr Lys Ser

35 40 45

Glu His Met Thr Asp Leu Lys Lys Lys Phe Gln Arg Met Cys Glu Lys

50 55 60

Ser Thr Ile Lys Lys Arg Tyr Leu His Leu Thr Glu Glu His Leu Lys

65 70 75 80

Gln Asn Pro His Leu Cys Glu Tyr Asn Ala Pro Ser Leu Asn Thr Arg

85 90 95

Gln Asp Met Leu Val Val Glu Val Pro Lys Leu Gly Lys Glu Ala Ala

100 105 110

Ile Asn Ala Ile Lys Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His

115 120 125

Leu Ile Phe Cys Thr Gly Ser Ser Ile Asp Met Pro Gly Ala Asp Tyr

130 135 140

Gln Cys Ala Lys Leu Leu Gly Leu Arg Pro Ser Val Lys Arg Val Met

145 150 155 160

Leu Tyr Gln Leu Gly Cys Tyr Ala Gly Gly Lys Val Leu Arg Ile Ala

165 170 175

Lys Asp Ile Ala Glu Asn Asn Lys Gly Ala Arg Val Leu Ile Val Cys

180 185 190

Ser Glu Ile Thr Ala Cys Ile Phe Arg Gly Pro Ser Glu Lys His Leu

195 200 205

Asp Cys Leu Val Gly Gln Ser Leu Phe Gly Asp Gly Ala Ser Ser Val

210 215 220

Ile Val Gly Ala Asp Pro Asp Ala Ser Val Gly Glu Arg Pro Ile Phe

225 230 235 240

Glu Leu Val Ser Ala Ala Gln Thr Ile Leu Pro Asn Ser Asp Gly Ala

245 250 255

Ile Ala Gly His Val Thr Glu Ala Gly Leu Thr Phe His Leu Leu Arg

260 265 270

Asp Val Pro Gly Leu Ile Ser Gln Asn Ile Glu Lys Ser Leu Ile Glu

275 280 285

Ala Phe Thr Pro Ile Gly Ile Asn Asp Trp Asn Asn Ile Phe Trp Ile

290 295 300

Ala His Pro Gly Gly Pro Ala Ile Leu Asp Glu Ile Glu Ala Lys Leu

305 310 315 320

Glu Leu Lys Lys Glu Lys Met Lys Ala Ser Arg Glu Met Leu Ser Glu

325 330 335

Tyr Gly Asn Met Ser Cys Ala Ser Val Phe Phe Ile Val Asp Glu Met

340 345 350

Arg Lys Gln Ser Ser Lys Glu Gly Lys Ser Thr Thr Gly Asp Gly Leu

355 360 365

Glu Trp Gly Ala Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr

370 375 380

Val Val Leu His Ser Val Pro Thr Asn Val

385 390

<210> 27

<211> 954

<212> DNA

<213> 人工序列(Artificial sequence)

<400> 27

atgcgggcga aacttctggg aatagtcctg acaaccccta ttgcgatcag ctcttttgct 60

tctaccgaga ctttatcgtt tactcctgac aacataaatg cggacattag tcttggaact 120

ctgagcggaa aaacaaaaga gcgtgtttat ctagccgaag aaggaggccg aaaagtcagt 180

caactcgact ggaaattcaa taacgctgca attattaaag gtgcaattaa ttgggatttg 240

atgccccaga tatctatcgg ggctgctggc tggacaactc tcggcagccg aggtggcaat 300

atggtcgatc aggactggat ggattccagt aaccccggaa cctggacgga tgaaagtaga 360

caccctgata cacaactcaa ttatgccaac gaatttgatc tgaatatcaa aggctggctc 420

ctcaacgaac ccaattaccg cctgggactc atggccggat atcaggaaag ccgttatagc 480

tttacagcca gaggtggttc ctatatctac agttctgagg agggattcag agatgatatc 540

ggctccttcc cgaatggaga aagagcaatc ggctacaaac aacgttttaa aatgccctac 600

attggcttga ctggaagtta tcgttatgaa gattttgaac tcggtggcac atttaaatac 660

agcggctggg tggaatcatc tgataacgat gaacactatg acccgggaaa aagaatcact 720

tatcgcagta aggtcaaaga ccaaaattac tattctgttg cagtcaatgc aggttattac 780

gtcacaccta acgcaaaagt ttatgttgaa ggcgcatgga atcgggttac gaataaaaaa 840

ggtaatactt cactttatga tcacaataat aacacttcag actacagcaa aaatggagca 900

ggtatagaaa actataactt catcactact gctggtctta agtacacatt ttaa 954

<210> 28

<211> 317

<212> PRT

<213> 人工序列(Artificial sequence)

<400> 28

Met Arg Ala Lys Leu Leu Gly Ile Val Leu Thr Thr Pro Ile Ala Ile

1 5 10 15

Ser Ser Phe Ala Ser Thr Glu Thr Leu Ser Phe Thr Pro Asp Asn Ile

20 25 30

Asn Ala Asp Ile Ser Leu Gly Thr Leu Ser Gly Lys Thr Lys Glu Arg

35 40 45

Val Tyr Leu Ala Glu Glu Gly Gly Arg Lys Val Ser Gln Leu Asp Trp

50 55 60

Lys Phe Asn Asn Ala Ala Ile Ile Lys Gly Ala Ile Asn Trp Asp Leu

65 70 75 80

Met Pro Gln Ile Ser Ile Gly Ala Ala Gly Trp Thr Thr Leu Gly Ser

85 90 95

Arg Gly Gly Asn Met Val Asp Gln Asp Trp Met Asp Ser Ser Asn Pro

100 105 110

Gly Thr Trp Thr Asp Glu Ser Arg His Pro Asp Thr Gln Leu Asn Tyr

115 120 125

Ala Asn Glu Phe Asp Leu Asn Ile Lys Gly Trp Leu Leu Asn Glu Pro

130 135 140

Asn Tyr Arg Leu Gly Leu Met Ala Gly Tyr Gln Glu Ser Arg Tyr Ser

145 150 155 160

Phe Thr Ala Arg Gly Gly Ser Tyr Ile Tyr Ser Ser Glu Glu Gly Phe

165 170 175

Arg Asp Asp Ile Gly Ser Phe Pro Asn Gly Glu Arg Ala Ile Gly Tyr

180 185 190

Lys Gln Arg Phe Lys Met Pro Tyr Ile Gly Leu Thr Gly Ser Tyr Arg

195 200 205

Tyr Glu Asp Phe Glu Leu Gly Gly Thr Phe Lys Tyr Ser Gly Trp Val

210 215 220

Glu Ser Ser Asp Asn Asp Glu His Tyr Asp Pro Gly Lys Arg Ile Thr

225 230 235 240

Tyr Arg Ser Lys Val Lys Asp Gln Asn Tyr Tyr Ser Val Ala Val Asn

245 250 255

Ala Gly Tyr Tyr Val Thr Pro Asn Ala Lys Val Tyr Val Glu Gly Ala

260 265 270

Trp Asn Arg Val Thr Asn Lys Lys Gly Asn Thr Ser Leu Tyr Asp His

275 280 285

Asn Asn Asn Thr Ser Asp Tyr Ser Lys Asn Gly Ala Gly Ile Glu Asn

290 295 300

Tyr Asn Phe Ile Thr Thr Ala Gly Leu Lys Tyr Thr Phe

305 310 315

70页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种硫酸新霉素的发酵工艺

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类