新型脯氨酸4-羟化酶及其应用

文档序号:1444360 发布日期:2020-02-18 浏览:15次 >En<

阅读说明:本技术 新型脯氨酸4-羟化酶及其应用 (Novel proline 4-hydroxylase and use thereof ) 是由 孙际宾 赵晶 刘超 周文娟 郑平 马延和 于 2018-08-06 设计创作,主要内容包括:本发明公开了一种改造脯氨酸4-羟化酶的方法,该方法通过在待改造脯氨酸4-羟化酶的特定位点之间的区段进行整体替换,和/或在特定位点进行氨基酸突变能显著提高所得脯氨酸4-羟化酶的活性和热稳定性,从而得到稳定性和活性优异的脯氨酸4-羟化酶。本发明的脯氨酸4-羟化酶可以应用于生产反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物。(The invention discloses a method for modifying proline 4-hydroxylase, which can remarkably improve the activity and the thermal stability of the obtained proline 4-hydroxylase by carrying out integral replacement on a section between specific sites of the proline 4-hydroxylase to be modified and/or carrying out amino acid mutation on the specific sites, thereby obtaining the proline 4-hydroxylase with excellent stability and activity. The proline 4-hydroxylase of the invention can be applied to the production of trans-4-hydroxy-L-proline or downstream products using trans-4-hydroxy-L-proline as a precursor.)

新型脯氨酸4-羟化酶及其应用

技术领域

本发明涉及生物技术领域。具体地说,本发明涉及新型的脯氨酸4-羟化酶、其编码基因和包含该酶或其编码基因的宿主细胞以及它们在生产反式-4-羟基-L-脯氨酸中的应用。

背景技术

反式-4-羟基-L-脯氨酸(简称羟脯氨酸),是一种具有独特生理活性的氨基酸,易溶于水,广泛应用于医药、化工、动物饲料和美容业等领域,市场前景广阔。由于价格昂贵羟脯氨酸目前主要用于合成碳青霉烯类抗生素(美罗培南等)的侧链。碳青霉烯类是第三代抗生素,是抗菌谱最广的一类非典型β-内酰胺类抗生素,具有抗菌谱广、抗菌活性强的特点,全球总体市场已超过了30亿美元。

反式-4-羟基-L-脯氨酸可以通过脯氨酸4-羟化酶催化L-脯氨酸羟基化来生产,目前用于生产L-脯氨酸等氨基酸的工程菌主要是谷氨酸棒杆菌(Corynebacteriumglutamicum)、大肠杆菌(E.coli)等,但是这些菌株都没有编码脯氨酸4-羟化酶的基因。因此,挖掘能够在L-脯氨酸生产菌中表达并具有高效催化活性的脯氨酸4-羟化酶是实现反式-4-羟基-L-脯氨酸工业生产的关键。

然而,目前报道的已经工业应用的脯氨酸4-羟化酶只有来源于指孢囊菌RH1的脯氨酸4-羟化酶。指孢囊菌属于放线菌,是一种高GC含量的***,GC含量为74%,并且含有大肠杆菌等宿主的稀有密码子。因此,指孢囊菌的野生型脯氨酸4-羟化酶在原核生物,例如大肠杆菌中重组表达时主要以没有活性或活性很低的包涵体形式存在,经过密码子优化后的突变型孢囊菌来源的脯氨酸4-羟化酶在表达量和催化性能上依然较差。

因此,本领域急需具备表达量和催化性能较好的脯氨酸4-羟化酶,从而有助于提升生物法生产反式-4-羟基-L-脯氨酸的水平。

发明内容

本发明的目的在于提供一种新的脯氨酸4-羟化酶,一种改造脯氨酸4-羟化酶的方法,一种稳定性和活性改善的脯氨酸4-羟化酶以及其在生产反式-4-羟基-L-脯氨酸上的应用。

在第一方面,本发明提供一种改造脯氨酸4-羟化酶的方法,所述方法包括:

1)检索所述待改造的具有脯氨酸4-羟化酶功能的多肽的氨基酸序列;

如果在所述待改造多肽的氨基酸序列中145-146位的氨基酸残基是N、G,182位的氨基酸残基是D或R或S;或者,如果所述待改造脯氨酸4-羟化酶的氨基酸序列中对应于SEQID NO:2的145-146位的氨基酸残基是N、G,对应于SEQ ID NO:2的182位的氨基酸残基是D或R或S;

则将上述氨基酸残基G之后的第16位到上述氨基酸残基D或R或S之前的第4位之间的氨基酸区段替换为SEQ ID NO:13所示氨基酸序列,从而得到改造后的具有脯氨酸4-羟化酶功能的多肽;

或者

2)将所述待改造多肽的氨基酸序列中第90位的氨基酸残基,或者所述待改造脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第90位的氨基酸残基从R替换为G,从而得到改造后的具有脯氨酸4-羟化酶功能的多肽;

或者

3)将所述待改造多肽的氨基酸序列中第112位的氨基酸残基,或者所述待改造脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第112位的氨基酸残基从E替换为P或A,优选P,从而得到改造后的具有脯氨酸4-羟化酶功能的多肽;

或者

4)将所述待改造多肽的氨基酸序列中第260位的氨基酸残基,或者所述待改造脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第260位的氨基酸残基从A替换为P,从而得到改造后的具有脯氨酸4-羟化酶功能的多肽;

或者

3)上述1)和2)的组合,或1)和3)的组合,或1)和4)的组合。

在具体的实施方式中,所述待改造的具有脯氨酸4-羟化酶功能的氨基酸序列包含SEQ ID NO:2或SEQ ID NO:11所示的氨基酸序列;优选所述待改造的具有脯氨酸4-羟化酶功能的氨基酸序列如SEQ ID NO:2或SEQ ID NO:11所示。

在优选的实施方式中,改造后的具有脯氨酸4-羟化酶功能的多肽的热稳定性提高。

在优选的实施方式中,所述方法还包括检测所得具有脯氨酸4-羟化酶功能的多肽的活性或热稳定性的步骤。

在优选的实施方式中,改造后的具有脯氨酸4-羟化酶功能的多肽的氨基酸序列如SEQ ID NO:3、4、5、6、7、8、9、12所示。

在第二方面,本发明提供一种脯氨酸4-羟化酶,所述脯氨酸4-羟化酶:

1)如果所述脯氨酸4-羟化酶的氨基酸序列中145-146位的氨基酸残基是N、G,182位的氨基酸残基是D或R或S;或者,如果所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ IDNO:2的145-146位的氨基酸残基是N、G,对应于SEQ ID NO:2的182位的氨基酸残基是D或R或S;

则所述脯氨酸4-羟化酶的氨基酸序列中在上述氨基酸残基G之后的第16位到上述氨基酸残基D或R或S之前的第4位之间的氨基酸序列区段为SEQ ID NO:13所示氨基酸序列;

或者

2)所述脯氨酸4-羟化酶的氨基酸序列中第90位的氨基酸残基,或者所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第90位的氨基酸残基为G;

或者

3)所述脯氨酸4-羟化酶的氨基酸序列中第112位的氨基酸残基,或者所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第112位的氨基酸残基为P或A,优选P;

或者

4)所述脯氨酸4-羟化酶的氨基酸序列中第260位的氨基酸残基,或者所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第260位的氨基酸残基为P;

或者

5)如果所述脯氨酸4-羟化酶的氨基酸序列中145-146位的氨基酸残基是N、G,182位的氨基酸残基是D或R或S;或者,如果所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ IDNO:2的145-146位的氨基酸残基是N、G,对应于SEQ ID NO:2的182位的氨基酸残基是D或R或S;

则所述脯氨酸4-羟化酶的氨基酸序列中在上述氨基酸残基G之后的第16位到上述氨基酸残基D或R或S之前的第4位之间的氨基酸序列区段为SEQ ID NO:13所示氨基酸序列;并且

所述脯氨酸4-羟化酶的氨基酸序列中第90位的氨基酸残基,或者所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第90位的氨基酸残基为G;

或者

6)如果所述脯氨酸4-羟化酶的氨基酸序列中145-146位的氨基酸残基是N、G,182位的氨基酸残基是D或R或S;或者,如果所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ IDNO:2的145-146位的氨基酸残基是N、G,对应于SEQ ID NO:2的182位的氨基酸残基是D或R或S;

则所述脯氨酸4-羟化酶的氨基酸序列中在上述氨基酸残基G之后的第16位到上述氨基酸残基D或R或S之前的第4位之间的氨基酸序列区段为SEQ ID NO:13所示氨基酸序列;并且

所述脯氨酸4-羟化酶的氨基酸序列中第112位的氨基酸残基,或者所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第112位的氨基酸残基为P或A,优选P;

或者

7)如果所述脯氨酸4-羟化酶的氨基酸序列中145-146位的氨基酸残基是N、G,182位的氨基酸残基是D或R或S;或者,如果所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ IDNO:2的145-146位的氨基酸残基是N、G,对应于SEQ ID NO:2的182位的氨基酸残基是D或R或S;

则所述脯氨酸4-羟化酶的氨基酸序列中在上述氨基酸残基G之后的第16位到上述氨基酸残基D或R或S之前的第4位之间的氨基酸序列区段为SEQ ID NO:13所示氨基酸序列;并且

所述脯氨酸4-羟化酶的氨基酸序列中第260位的氨基酸残基,或者所述脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第260位的氨基酸残基为P;

或者

8)从上述1)-7)中任一项所述脯氨酸4-羟化酶衍生,由上述1)-7)中任一项所述脯氨酸4-羟化酶的氨基酸序列经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成,并且具有上述1)-7)中任一项所述脯氨酸4-羟化酶的功能。

在优选的实施方式中,所述脯氨酸4-羟化酶是从上述1)-7)中任一项所述脯氨酸4-羟化酶衍生,由上述1)-7)中任一项所述脯氨酸4-羟化酶的氨基酸序列在任意一端经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的添加而形成,并且具有上述1)-7)中任一项所述脯氨酸4-羟化酶的功能。

在具体的实施方式中,所述脯氨酸4-羟化酶的氨基酸序列如SEQ ID NO:3、4、5、6、7、8、9、12所示。

在第三方面,本发明提供一种多肽在生产反式-4-羟基-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物中的用途,所述多肽是:

1)具有SEQ ID NO:2或SEQ ID NO:11所示氨基酸序列的多肽;或者

2)第二方面所述的脯氨酸4-羟化酶。

在具体的实施方式中,所述多肽具有SEQ ID NO:2、3、4、5、6、7、8、9、11、12所示氨基酸序列,或者所述多肽的氨基酸序列如SEQ ID NO:2、3、4、5、6、7、8、9、11、12所示。

在优选的实施方式中,所述以反式-4-羟基-L-脯氨酸为前体的下游产物是碳青霉烯类抗生素侧链。

在第四方面,本发明提供一种宿主细胞,所述宿主细胞包含以下多肽的编码基因:

1)具有SEQ ID NO:2或SEQ ID NO:11所示氨基酸序列的多肽;或者

2)第二方面所述的脯氨酸4-羟化酶。

在具体的实施方式中,所述多肽具有SEQ ID NO:2、3、4、5、6、7、8、9、11、12所示氨基酸序列,或者所述多肽的氨基酸序列如SEQ ID NO:2、3、4、5、6、7、8、9、11、12所示。

在优选的实施方式中,所述宿主细胞是细菌;包括但不限于:大肠杆菌(E.coli)、谷氨酸棒杆菌(Corynebacterium glutamicum)、黄色短杆菌(Brevibacterium flavum)、粘质沙雷氏菌(Serratia marcescens)、酿酒酵母(Saccharomyces cerevisiae)、枯草芽孢杆菌(Bacillus subtilis)。

在第五方面,本发明提供一种生产反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物的方法,所述方法包括:

1)第四方面所述的宿主细胞,和

2)任选从1)的培养体系中分离产生的反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物;

或者,所述方法包括:

1)利用以下多肽催化L-脯氨酸生产反式-4-羟基-L-脯氨酸:

a.具有SEQ ID NO:2或SEQ ID NO:11所示氨基酸序列的多肽;或者

b.第二方面所述的脯氨酸4-羟化酶;和

2)任选从1)的催化体系中分离获得的反式-4-羟基-L-脯氨酸。

在第六方面,本发明提供一种反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物的生产菌株的构建方法,所述方法包括使得所述菌株包含以下多肽,所述多肽是:

a.具有SEQ ID NO:2或SEQ ID NO:11所示氨基酸序列的多肽;或者

b.第二方面所述的脯氨酸4-羟化酶。

在优选的实施方式中,所述方法包括使得所述菌株表达所述多肽。

在进一步优选的实施方式中,所述方法包括使得所述菌株包含表达所述多肽的表达载体,或将所述多肽的编码基因整合在所述菌株的基因组中。

在优选的实施方式中,所述宿主细胞是细菌;包括但不限于:大肠杆菌(E.coli)、谷氨酸棒杆菌(Corynebacterium glutamicum)、黄色短杆菌(Brevibacterium flavum)、粘质沙雷氏菌(Serratia marcescens)、酿酒酵母(Saccharomyces cerevisiae)、枯草芽孢杆菌(Bacillus subtilis)。

应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。

附图说明

图1显示了脯氨酸4-羟化酶催化L-脯氨酸羟基化产生反式-4-羟基-L-脯氨酸的示意图;

图2显示了SEQ ID NO:2所示氨基酸序列与注释为脯氨酸4-羟化酶的氨基酸序列比对结果。

具体实施方式

发明人经过广泛而深入的研究,出乎意料地发现将原始脯氨酸4-羟化酶的特定位点之间的区段进行整体替换,能够显著提高所得脯氨酸4-羟化酶突变体的活性;发明人还出乎意料地发现,上述的区段整体替换结合特定位点的氨基酸突变可以在显著提高脯氨酸4-羟化酶活性的同时提高脯氨酸4-羟化酶的热稳定性,从而得到稳定性和活性优异的脯氨酸4-羟化酶。在此基础上完成了本发明。

术语定义

本文所用的术语“多肽”或“本发明多肽”或“本发明的多肽”或“脯氨酸4-羟化酶”或“本发明的脯氨酸4-羟化酶”或“脯氨酸4-羟化酶”或“L-脯氨酸4-羟化酶”具有相同的意义,在本文可以互换使用,均是指具有催化L-脯氨酸产生反式-4-羟基-L-脯氨酸活性的蛋白。大肠杆菌中天然不存在此多肽,因此其属于外源性蛋白。

本发明的脯氨酸4-羟化酶是经改造后活性、热稳定性、或二者同时得到提高的脯氨酸4-羟化酶。所述改造是在待改造脯氨酸4-羟化酶的特定位点之间进行区段的整体替换,或者在待改造脯氨酸4-羟化酶的特定位点进行氨基酸突变,或者两种技术手段的组合。

具体地说,本发明的脯氨酸4-羟化酶是如下所述获得的:

a)在待改造脯氨酸4-羟化酶的氨基酸序列中145-146位的氨基酸残基是N、G,182位的氨基酸残基是D或R或S;或者,待改造脯氨酸4-羟化酶的氨基酸序列中对应于SEQ IDNO:2的145-146位的氨基酸残基是N、G,对应于SEQ ID NO:2的182位的氨基酸残基是D或R或S的前提下,将上述氨基酸残基G之后的第16位到上述氨基酸残基D或R或S之前的第4位之间的氨基酸区段替换替换为SEQ ID NO:13所示氨基酸序列,得到改造后的脯氨酸4-羟化酶;

b)或者将所述待改造多肽的氨基酸序列中第90位的氨基酸残基,或者所述待改造脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第90位的氨基酸残基从R替换为G;

c)或者将待改造脯氨酸4-羟化酶的氨基酸序列中第112位的氨基酸残基,或待改造脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第112位的氨基酸残基从E替换为P或A,优选P;

d)或者将所述待改造多肽的氨基酸序列中第260位的氨基酸残基,或者所述待改造脯氨酸4-羟化酶的氨基酸序列中对应于SEQ ID NO:2的第260位的氨基酸残基从A替换为P;

e)或者结合上述a)和b)、a)和c)、a)和d)两种技术手段。

本发明的改造方法能够显著提高被改造脯氨酸4-羟化酶的活性。例如,改造后的脯氨酸4-羟化酶的纯酶活是野生型的2倍多。

鉴于本发明的教导,本领域技术人员会理解,本发明的改造方法不限于任何具体的脯氨酸4-羟化酶,只要待改造的脯氨酸4-羟化酶的氨基酸序列符合上述要求即可。例如(但不限于),待改造的脯氨酸4-羟化酶的氨基酸序列如SEQ ID NO:2或SEQ ID NO:11所示;改造后的脯氨酸4-羟化酶的氨基酸序列如SEQ ID NO:3、4、5、6、7、8、9、12所示。

基于现有技术的知识,本领域普通技术人员不难知晓,在多肽的某些区域,例如非重要区域改变少数氨基酸残基基本上不会改变生物活性,例如,适当替换某些氨基酸得到的序列并不会影响其活性(可参见Watson等,Molecular Biology of The Gene,第四版,1987,The Benjamin/Cummings Pub.Co.P224)。因此,本领域普通技术人员能够实施这种替换并且确保所得分子仍具有所需生物活性。

因此,本发明不仅包括采用上述脯氨酸4-羟化酶改造方法获得的脯氨酸4-羟化酶,还包括在采用上述脯氨酸4-羟化酶改造方法得到的脯氨酸4-羟化酶的基础上通过显而易见的改变而获得的进一步突变体。例如,从本发明的经改造的脯氨酸4-羟化酶出发,在其氨基酸序列作出一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加从而形成仍具有脯氨酸4-羟化酶功能的突变体。特别是,就本领域技术人员而言,在某蛋白或多肽的氨基酸序列的任一端经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的添加而形成的突变体能够具备原蛋白或多肽的功能是显而易见的。例如,在氨基酸序列的任一端带上6His标签的蛋白或多肽具有与原蛋白或多肽相似的活性是显而易见的。

同时,本领域的技术人员都知道在上述取代、缺失、***和添加一个或几个氨基酸残基并保持多肽初始功能的突变称为保守突变,而保守突变中的典型代表是保守取代,保守取代是下述突变,其中,如果取代位点是芳香族氨基酸,则在Phe、Trp和Tyr之间相互取代;如果是疏水性氨基酸,则在Leu、Ile和Val中相互取代;若果它是极性氨基酸,则在Gln和Asn之间相互取代;如果它是碱性氨基酸,则在Lys、Arg和His中相互取代;如果它是酸性氨基酸,则在Asp和Glu之间相互取代;如果它是具有羟基的氨基酸,则在Ser和Thr之间相互取代。具体而言,被视为保守取代的氨基酸残基之间的取代如下表所示。这些保守性变异的突变体可根据,例如下表所示进行氨基酸替换而产生。

Figure BDA0001755605210000091

Figure BDA0001755605210000101

因此,本发明包括与本发明的脯氨酸4-羟化酶的氨基酸序列相比,有至多20个、较佳地至多10个,再佳地至多3个,更佳地至多2个,最佳地至多1个氨基酸被性质相似或相近的氨基酸所替换而形成的突变体。

本发明还提供了编码本发明多肽的多核苷酸。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。

因此,本文所用的“含有”,“具有”或“包括”包括了“包含”、“主要由……构成”、“基本上由……构成”、和“由……构成”;“主要由……构成”、“基本上由……构成”和“由……构成”属于“含有”、“具有”或“包括”的下位概念。

“对应于”

本文所用的术语“对应于”具有本领域普通技术人员通常理解的意义。具体地说,“对应于”表示两条序列经同源性或序列相同性比对后,一条序列与另一条序列中的指定位置相对应的位置。因此,例如,SEQ ID NO:11所示氨基酸序列中对应于SEQ ID NO:2所示氨基酸序列的第145-146位就是第139-140位。

本领域普通技术人员公知的测定序列同源性或相同性的方法包括但不限于:计算机分子生物学(Computational Molecular Biology),Lesk,A.M.编,牛津大学出版社,纽约,1988;生物计算:信息学和基因组项目(Bi℃omputing:Informatics and GenomeProjects),Smith,D.W.编,学术出版社,纽约,1993;序列数据的计算机分析(ComputerAnalysis of Sequence Data),第一部分,Griffin,A.M.和Griffin,H.G.编,HumanaPress,新泽西,1994;分子生物学中的序列分析(Sequence Analysis in MolecularBiology),von Heinje,G.,学术出版社,1987和序列分析引物(Sequence AnalysisPrimer),Gribskov,M.与Devereux,J.编M St℃kton Press,纽约,1991和Carillo,H.与Lipman,D.,SIAM J.Applied Math.,48:1073(1988)。测定相同性的优选方法要在测试的序列之间得到最大的匹配。测定相同性的方法编译在公众可获得的计算机程序中。优选的测定两条序列之间相同性的计算机程序方法包括但不限于:GCG程序包(Devereux,J.等,1984)、BLASTP、BLASTN和FASTA(Altschul,S,F.等,1990)。公众可从NCBI和其它来源得到BLASTX程序(BLAST手册,Altschul,S.等,NCBI NLM NIH Bethesda,Md.20894;Altschul,S.等,1990)。熟知的Smith Waterman算法也可用于测定相同性。

多肽的用途

基于本发明的教导,本领域技术人员会知晓,本发明的多肽或脯氨酸4-羟化酶能够用于生产反式-4-羟基-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物。特别是,利用经本发明改造后的脯氨酸4-羟化酶以葡萄糖为底物生产反式-4-羟基-L-脯氨酸,产量可达2.39g/l;

在具体的实施方式中,用于生产反式-4-羟基-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物的本发明多肽具有SEQ ID NO:2、3、4、5、6、7、8、9、11、12所示氨基酸序列,或者其氨基酸序列如SEQ ID NO:2、3、4、5、6、7、8、9、11、12所示。

反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物的生产菌株及其构建方法

在本发明的脯氨酸4-羟化酶的基础上,本发明提供反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物的生产菌株。所述生产菌株包含本发明的脯氨酸4-羟化酶,例如包含本发明的脯氨酸4-羟化酶的编码基因,或包含表达本发明的脯氨酸4-羟化酶的表达载体,或将本发明的脯氨酸4-羟化酶的编码基因整合在所述菌株的基因组中。

上述生产菌株可以是细菌,包括但不限于:大肠杆菌(E.coli)、谷氨酸棒杆菌(Corynebacterium glutamicum)、黄色短杆菌(Brevibacterium flavum)、粘质沙雷氏菌(Serratia marcescens)、酿酒酵母(Saccharomyces cerevisiae)、枯草芽孢杆菌(Bacillus subtilis)。

生产反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物的生产方法

在本发明的脯氨酸4-羟化酶或者生产菌株的基础上,本领域技术人员知晓可以利用本发明的生产菌株生产反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物;也可以采用胞外的酶催化体系,从而直接利用本发明的脯氨酸4-羟化酶进行反式-4-羟基-L-脯氨酸或以反式-4-羟基-L-脯氨酸为前体的下游产物的生产。

本发明的优点:

1.本发明的改造方法能够显著提高脯氨酸4-羟化酶的活性;

2.本发明的点突变技术能够显著提高脯氨酸4-羟化酶的热稳定性;

3.本发明的氨基酸序列替换方法结合点突变技术,能够显著提高脯氨酸4-羟化酶的热稳定性和活性,并提高反式-4-羟基-L-脯氨酸的产量。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。

本发明所用试剂和原料均市售可得。

实施例

1.脯氨酸4-羟化酶的合成及克隆表达

首先,发明人通过全基因合成了序列SEQ ID NO:1所示的基因(其编码的氨基酸序列如SEQ ID NO:2所示),5`端采用Nde I内切酶位点,3`端采用Hind III内切酶位点连接到高拷贝质粒pET21a,获得的重组质粒命名为DaWT,然后采用化学转化的方法将重组质粒DaWT导入大肠杆菌BL21a(DE3)感受态细胞内,获得重组工程菌株DaWT,按照下述操作,对脯氨酸4-羟化酶进行诱导表达。

取5μl甘油菌液接种至5ml含有抗生素(100μg/ml氨苄青霉素)的LB培养基(10g/l蛋白胨,10g/l NaCl,5g/l酵母膏),37℃、220rpm过夜培养;然后以1%的接种量,接种至装有100ml LB培养基的500ml摇瓶中(含有抗生素100μg/ml氨苄青霉素),37℃、220rpm培养至OD600为0.6-0.8之间(2h左右),加入0.1mM终浓度的IPTG,18℃、220rpm培养20h左右。

2.脯氨酸4-羟化酶的纯酶活测定

将上述培养好的工程菌株DaWT细胞在4℃、7000rpm条件下离心6min收集细胞,然后用100mM Tris-HCl、100mM NaCl、10%甘油、pH 7.4的缓冲液洗涤细胞三次,立即破碎或者-80℃冰箱内保存备用。将收集好的细胞用适量的50mM MES、100mM NaCl、10%甘油、pH6.5的缓冲液重悬后超声破碎。细胞破碎液在4℃、8000rpm条件下离心35min后将上清液转移至预冷的离心管内,然后用His SpinTrapTM columns(GE Healthcare生产)镍柱纯化蛋白并用浓度梯度咪唑洗脱杂蛋白,去除咪唑后获得脯氨酸4-羟化酶的纯酶,分装至预冷的小离心管内,-80℃保藏备用。

将上述保藏的纯酶冰上融化后,稀释至0.4g/l蛋白浓度,然后按照250μl的体系进行酶活检测反应,250μl酶活反应体系含有50mM MES(pH 6.5)、0.5mM FeSO4、1.5mM抗坏血酸、5mM L-Pro、14mMα-酮戊二酸、8μg纯酶,30℃反应20min后煮沸6min停止反应。然后按照下述的反式-4-羟基-L-脯氨酸的含量检测方法,检测反式-4-羟基-L-脯氨酸的含量。本实施例的酶活1U定义为1min内生成1nmol反式-4-羟脯氨酸。

检测缓冲溶液(pH=6.8):26.0g一水柠檬酸(C6H8O7·H2O),14.0g氢氧化钠,78.0g无水乙酸钠[Na(CH3CO2)],用500ml水溶解上述试剂,转入1L容量瓶,加入250ml正丙醇,用水定容。氯胺T溶液:1.41g三水·N-氯-对甲苯磺酰胺钠盐(氯胺T),用100ml缓冲液溶解。显色剂:10.0g对二甲氨基苯甲醛,用35ml高氯酸溶液(质量分数60%,5ml ddH2O和30ml高氯酸),溶解,缓慢加入65ml异丙醇。取反应液,4000rpm离心20min,取上清加入另一个96深孔板。取200μl稀释液,加入100μl氯胺T溶液,振荡混匀,室温震荡500rpm 20±1min。再加入100μl显色剂,充分混合后,置于水浴摇床130rpm,60℃水浴20min。取出后置于冷水中至少3min,再在室温放置30min。于558±2nm处测量OD值。最终测定DaWT菌株的纯酶活约为45U/mg。

3.脯氨酸4-羟化酶区段替换菌株的构建及纯酶酶活检测

以实施例1中构建的重组质粒DaWT为模板,采用大片段引物及平末端连接法构建重组质粒,所用上游引物为5’-CAGTGGCTGCCGCAGCTGTCTGCTGACCTGGACTACTCGCTCGACGTCGAGACGATGC-3’(SEQ ID NO:14),下游引物为5’-AGCGTCACCGTCACCAGCCGGAGCACGACGTTCAACGTCGATCATGCC GCTGCCGTGTCCGCC-3’(SEQ ID NO:15),进行降落PCR,获得目的基因片段后用Dpn I酶在37℃水浴处理3h左右去除甲基化片段。使用全式金基因纯化试剂盒纯化上述PCR产物,T4PNK磷酸化酶处理,T4连接酶连接获得重组质粒DaM1,通过化学转化的方法将重组质粒DaM1导入大肠杆菌BL21a(DE3)感受态细胞内,获得工程菌株DaM1,其菌株培养和纯酶制备检测方法如实施例1和实施例2所示(获得的脯氨酸4-羟化酶的氨基酸序列如SEQ IDNO:3所示),同时以工程菌DaWT为对照菌株,最终获得的纯酶检测数据如表1所示。

表1区段替换前后的纯酶活对比

Figure BDA0001755605210000141

4.脯氨酸4-羟化酶突变菌株的构建及活性热稳定性检测

采用QuikChange定点突变的方法构建脯氨酸4-羟化酶的3个突变菌株,以实施例1中构建的重组质粒DaWT为模板,以表2所示引物进行降落PCR,获得目的基因片段后用Dpn I酶在37℃水浴处理3h左右去除甲基化片段,然后通过化学转化的方法导入大肠杆菌BL21a(DE3)感受态细胞内,获得工程菌株DaM2、DaM3、DaM4。按照实施例2所述的纯酶制备和酶活检测方法(获得的脯氨酸4-羟化酶的氨基酸序列分别如SEQ ID NO:4-6所示),测定比酶活。同时测定并比较37℃条件下的酶丧失一半活力的孵育时间,即t1/2的大小来判断热稳定大小,如表3所示。

表2定点突变所用引物及获得的工程菌株名称

Figure BDA0001755605210000142

表3突变前后比酶活及t1/2对比

Figure BDA0001755605210000152

从以上结果可以看出,在进行上述定点突变,得到的脯氨酸4-羟化酶突变体的热稳定性得到明显的改善。

5.脯氨酸4-羟化酶整合突变菌株的构建及活性热稳定性检测

以重组质粒DaM1为模板,采用实施例4中的引物和方法进行降落PCR,获得重组质粒DaM5、DaM6、DaM7,然后通过化学转化的方法导入大肠杆菌BL21a(DE3)感受态细胞内,获得工程菌株DaM5、DaM6、DaM7。按照实施例2所述的纯酶制备和酶活检测方法测定比酶活(获得的脯氨酸4-羟化酶的氨基酸序列分别如SEQ ID NO:7-9所示),以DaWT为对照,同时测定并比较37℃条件下的酶丧失一半活力的孵育时间,即t1/2的大小来判断热稳定大小,如表4所示。

表4整合突变前后的比酶活及热稳定性对比

Figure BDA0001755605210000153

从以上结果可以看出,在将区段替换和定点突变结合起来后,得到的脯氨酸4-羟化酶突变体的比酶活和热稳定性同时得到明显的改善。

6.以脯氨酸为底物全细胞催化生产反式-4-羟基-L-脯氨酸

首先按照实施例1中所述,对野生型酶的重组细胞DaWT、以及构建的系列工程菌株DaM1、DaM2、DaM3、DaM4、DaM5、DaM6、DaM7进行摇瓶培养与诱导表达,将上述培养好的细胞在4℃、7000g条件下离心6min收集细胞,然后用buffer A缓冲液洗涤细胞三次。然后将收集后的细胞以10ml反应buffer/100ml摇瓶悬浮后在30℃摇床内培养24h,反应buffer含有50mMMES(pH 6.5)、0.5mM FeSO4、1.5mM抗坏血酸、20mM L-Pro、14mMα-酮戊二酸。反应结束后,4℃、7000rpm离心7min分离上清,将上清液转移至干净的离心管内用于检测其中的反式-4-羟基-L-脯氨酸的产量,检测方法参见实施例2所述。检测结果如下。

表5各菌株全细胞催化数据

Figure BDA0001755605210000161

7.以葡萄糖为原料从头发酵生产反式-4-羟基-L-脯氨酸

将实施例1中构建的质粒DaWT、实施例3中构建的质粒DaM1、实施例4中构建的质粒DaM2、DaM3、DaM4,实施例5中构建的质粒DaM5、DaM6、DaM7,经酶切分别连接到质粒pTC上,获得重组质粒pDaWT、pDaM1、pDaM2、pDaM3、pDaM4、pDaM5、pDaM6、pDaM7。随后,将质粒pDaWT、pDaM1、pDaM2、pDaM3、pDaM4、pDaM5、pDaM6、pDaM7分别导入菌株E.coli MG1655(△putA)中,获得重组大肠杆菌DaWT、DaM1、DaM2、DaM3、DaM4、DaM5、DaM6、DaM7。

将上述菌株进行摇瓶发酵测试生产性能。种子培养基为LB培养基(g/l):酵母膏5,蛋白胨10,氯化钠10,100ml摇瓶20ml装液量;发酵罐培养基(g/l):葡萄糖20,硫酸铵10,磷酸氢二钾1,氯化钠2,硫酸镁0.5,硫酸亚铁0.278,氯化钙0.015,鱼粉8,3-(N-玛琳代)丙磺酸(MOPS)40,250ml摇瓶30ml装液量;1.5ml的LB过夜培养的种子液,加入30ml发酵培养基中,利用5M NaOH溶液调整发酵培养基至pH6.90-7.00之间,加入终浓度10mg/l四环素,33℃,培养24h。发酵液样品经12000rpm离心3min后取上清,稀释至适当浓度后,参照实施例2的检测方法检测反式-4-羟基-L-脯氨酸的产量。发酵结果如表6所示。

表6各菌株摇瓶发酵数据

8.区段替换方法提高羟化酶生产羟脯氨酸产量的验证

首先,为验证本发明的酶改造方法,全基因合成了序列SEQ ID NO:10所示的另一个脯氨酸4-羟化酶的基因(其编码的氨基酸序列如SEQ ID NO:11所示,区段替换后获得的脯氨酸4-羟化酶的氨基酸序列如SEQ ID NO:12所示),5’端采用Nde I内切酶,3’端采用Hind III内切酶酶切后连接到pTC质粒上,获得的重组质粒命名为McWT,同时以McWT为模板,采用大片段引物及平末端连接法构建重组质粒,所用上游引物为5-TCAGTGGCTGCCGCAGCTGTCTGCTGACCTGGACTACGCCATCGACGCGC-3(SEQ ID NO:22),下游引物为5-GCGTCACCGTCACCAGCCGGAGCACGACGTTCAACTTCCAGAGAGCCGCACTT-3(SEQ ID NO:23),进行降落PCR,获得目的基因片段后用Dpn I酶在37℃水浴处理3h左右去除甲基化片段。使用全式金基因纯化试剂盒纯化上述PCR产物,T4PNK磷酸化酶处理,后经T4连接酶连接获得重组质粒McM1。随后,将质粒McWT、McM1分别导入菌株E.coli MG1655(△putA)中,获得重组大肠杆菌McWT、McM1。将上述菌株进行摇瓶发酵测试生产性能。培养基及发酵条件参照实施例7所示,反式-4-羟基-L-脯氨酸的产量检测方法参照实施例2。经检测工程菌株McM1的反式-4-羟基-L-脯氨酸产量比野生型菌株McWT提高了51%。

本发明中涉及到的酶均可以以葡萄糖为底物一步发酵生产反式-4-羟基-L-脯氨酸,经改造后的酶活性和热稳定性显著提高。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 中国科学院天津工业生物技术研究所

<120> 新型脯氨酸4-羟化酶及其应用

<130> P2018-0050

<160> 23

<170> SIPOSequenceListing 1.0

<210> 1

<211> 798

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 1

atggaacccc acgacacact ctcgcccgca caggtcgacg agtaccgaaa gaacggattc 60

ctcgtccagg agcacgtctt cgatgaggag gagatcgaac tgttgcgggc cgaggccgcg 120

caggagttcg cctcgggagg cgagcgcgtc acggtcgagc agaacaccgg catcgtccgc 180

ggcgtgcacg gctgtcacct gtactccgag gtgttcggca gactcgttcg ctcgccccgg 240

ctgctcccga tcgccaggca actgctgcgg gacgacgtgt acgtccacca gttcaagatc 300

aacgcgaagc gcgcgttcaa gggtgaggtc tgggagtggc accaggacta cacgttctgg 360

caccacgagg acgggatgcc cgcgcctcgc gcgttgtccg cggcgatttt cctcgacgag 420

gtgaccgagt tcaacggccc gctgaccttc gtgccaggcg gacacggcag cggcatgatc 480

gacgccgacg tcaagggcga gggctgggcc aacacactga ccgcgagcct caagtactcg 540

ctcgacgtcg agacgatgcg cgggctgatc gaacgcaacg gcatggtcgc gccgaagggc 600

ccgcgcggct ctgtgctctg gttcgacgcc aacatcccgc acagctccgt tccgaacatc 660

tccccgttcg accgcggctt ggtgctgatc acctacaaca gcgtggagaa caagaccgac 720

gtcacacgcg gcacgcgccc cgaatggctc gcggcccgcg acttcacgcc gttgacggcc 780

ctgcaggcca cgtccttc 798

<210> 2

<211> 266

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 2

Met Glu Pro His Asp Thr Leu Ser Pro Ala Gln Val Asp Glu Tyr Arg

1 5 10 15

Lys Asn Gly Phe Leu Val Gln Glu His Val Phe Asp Glu Glu Glu Ile

20 25 30

Glu Leu Leu Arg Ala Glu Ala Ala Gln Glu Phe Ala Ser Gly Gly Glu

35 40 45

Arg Val Thr Val Glu Gln Asn Thr Gly Ile Val Arg Gly Val His Gly

50 55 60

Cys His Leu Tyr Ser Glu Val Phe Gly Arg Leu Val Arg Ser Pro Arg

65 70 75 80

Leu Leu Pro Ile Ala Arg Gln Leu Leu Arg Asp Asp Val Tyr Val His

85 90 95

Gln Phe Lys Ile Asn Ala Lys Arg Ala Phe Lys Gly Glu Val Trp Glu

100 105 110

Trp His Gln Asp Tyr Thr Phe Trp His His Glu Asp Gly Met Pro Ala

115 120 125

Pro Arg Ala Leu Ser Ala Ala Ile Phe Leu Asp Glu Val Thr Glu Phe

130 135 140

Asn Gly Pro Leu Thr Phe Val Pro Gly Gly His Gly Ser Gly Met Ile

145 150 155 160

Asp Ala Asp Val Lys Gly Glu Gly Trp Ala Asn Thr Leu Thr Ala Ser

165 170 175

Leu Lys Tyr Ser Leu Asp Val Glu Thr Met Arg Gly Leu Ile Glu Arg

180 185 190

Asn Gly Met Val Ala Pro Lys Gly Pro Arg Gly Ser Val Leu Trp Phe

195 200 205

Asp Ala Asn Ile Pro His Ser Ser Val Pro Asn Ile Ser Pro Phe Asp

210 215 220

Arg Gly Leu Val Leu Ile Thr Tyr Asn Ser Val Glu Asn Lys Thr Asp

225 230 235 240

Val Thr Arg Gly Thr Arg Pro Glu Trp Leu Ala Ala Arg Asp Phe Thr

245 250 255

Pro Leu Thr Ala Leu Gln Ala Thr Ser Phe

260 265

<210> 3

<211> 272

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 3

Met Glu Pro His Asp Thr Leu Ser Pro Ala Gln Val Asp Glu Tyr Arg

1 5 10 15

Lys Asn Gly Phe Leu Val Gln Glu His Val Phe Asp Glu Glu Glu Ile

20 25 30

Glu Leu Leu Arg Ala Glu Ala Ala Gln Glu Phe Ala Ser Gly Gly Glu

35 40 45

Arg Val Thr Val Glu Gln Asn Thr Gly Ile Val Arg Gly Val His Gly

50 55 60

Cys His Leu Tyr Ser Glu Val Phe Gly Arg Leu Val Arg Ser Pro Arg

65 70 75 80

Leu Leu Pro Ile Ala Arg Gln Leu Leu Arg Asp Asp Val Tyr Val His

85 90 95

Gln Phe Lys Ile Asn Ala Lys Arg Ala Phe Lys Gly Glu Val Trp Glu

100 105 110

Trp His Gln Asp Tyr Thr Phe Trp His His Glu Asp Gly Met Pro Ala

115 120 125

Pro Arg Ala Leu Ser Ala Ala Ile Phe Leu Asp Glu Val Thr Glu Phe

130 135 140

Asn Gly Pro Leu Thr Phe Val Pro Gly Gly His Gly Ser Gly Met Ile

145 150 155 160

Asp Val Glu Arg Arg Ala Pro Ala Gly Asp Gly Asp Ala Gln Trp Leu

165 170 175

Pro Gln Leu Ser Ala Asp Leu Asp Tyr Ser Leu Asp Val Glu Thr Met

180 185 190

Arg Gly Leu Ile Glu Arg Asn Gly Met Val Ala Pro Lys Gly Pro Arg

195 200 205

Gly Ser Val Leu Trp Phe Asp Ala Asn Ile Pro His Ser Ser Val Pro

210 215 220

Asn Ile Ser Pro Phe Asp Arg Gly Leu Val Leu Ile Thr Tyr Asn Ser

225 230 235 240

Val Glu Asn Lys Thr Asp Val Thr Arg Gly Thr Arg Pro Glu Trp Leu

245 250 255

Ala Ala Arg Asp Phe Thr Pro Leu Thr Ala Leu Gln Ala Thr Ser Phe

260 265 270

<210> 4

<211> 266

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 4

Met Glu Pro His Asp Thr Leu Ser Pro Ala Gln Val Asp Glu Tyr Arg

1 5 10 15

Lys Asn Gly Phe Leu Val Gln Glu His Val Phe Asp Glu Glu Glu Ile

20 25 30

Glu Leu Leu Arg Ala Glu Ala Ala Gln Glu Phe Ala Ser Gly Gly Glu

35 40 45

Arg Val Thr Val Glu Gln Asn Thr Gly Ile Val Arg Gly Val His Gly

50 55 60

Cys His Leu Tyr Ser Glu Val Phe Gly Arg Leu Val Arg Ser Pro Arg

65 70 75 80

Leu Leu Pro Ile Ala Arg Gln Leu Leu Gly Asp Asp Val Tyr Val His

85 90 95

Gln Phe Lys Ile Asn Ala Lys Arg Ala Phe Lys Gly Glu Val Trp Glu

100 105 110

Trp His Gln Asp Tyr Thr Phe Trp His His Glu Asp Gly Met Pro Ala

115 120 125

Pro Arg Ala Leu Ser Ala Ala Ile Phe Leu Asp Glu Val Thr Glu Phe

130 135 140

Asn Gly Pro Leu Thr Phe Val Pro Gly Gly His Gly Ser Gly Met Ile

145 150 155 160

Asp Ala Asp Val Lys Gly Glu Gly Trp Ala Asn Thr Leu Thr Ala Ser

165 170 175

Leu Lys Tyr Ser Leu Asp Val Glu Thr Met Arg Gly Leu Ile Glu Arg

180 185 190

Asn Gly Met Val Ala Pro Lys Gly Pro Arg Gly Ser Val Leu Trp Phe

195 200 205

Asp Ala Asn Ile Pro His Ser Ser Val Pro Asn Ile Ser Pro Phe Asp

210 215 220

Arg Gly Leu Val Leu Ile Thr Tyr Asn Ser Val Glu Asn Lys Thr Asp

225 230 235 240

Val Thr Arg Gly Thr Arg Pro Glu Trp Leu Ala Ala Arg Asp Phe Thr

245 250 255

Pro Leu Thr Ala Leu Gln Ala Thr Ser Phe

260 265

<210> 5

<211> 266

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 5

Met Glu Pro His Asp Thr Leu Ser Pro Ala Gln Val Asp Glu Tyr Arg

1 5 10 15

Lys Asn Gly Phe Leu Val Gln Glu His Val Phe Asp Glu Glu Glu Ile

20 25 30

Glu Leu Leu Arg Ala Glu Ala Ala Gln Glu Phe Ala Ser Gly Gly Glu

35 40 45

Arg Val Thr Val Glu Gln Asn Thr Gly Ile Val Arg Gly Val His Gly

50 55 60

Cys His Leu Tyr Ser Glu Val Phe Gly Arg Leu Val Arg Ser Pro Arg

65 70 75 80

Leu Leu Pro Ile Ala Arg Gln Leu Leu Arg Asp Asp Val Tyr Val His

85 90 95

Gln Phe Lys Ile Asn Ala Lys Arg Ala Phe Lys Gly Glu Val Trp Pro

100 105 110

Trp His Gln Asp Tyr Thr Phe Trp His His Glu Asp Gly Met Pro Ala

115 120 125

Pro Arg Ala Leu Ser Ala Ala Ile Phe Leu Asp Glu Val Thr Glu Phe

130 135 140

Asn Gly Pro Leu Thr Phe Val Pro Gly Gly His Gly Ser Gly Met Ile

145 150 155 160

Asp Ala Asp Val Lys Gly Glu Gly Trp Ala Asn Thr Leu Thr Ala Ser

165 170 175

Leu Lys Tyr Ser Leu Asp Val Glu Thr Met Arg Gly Leu Ile Glu Arg

180 185 190

Asn Gly Met Val Ala Pro Lys Gly Pro Arg Gly Ser Val Leu Trp Phe

195 200 205

Asp Ala Asn Ile Pro His Ser Ser Val Pro Asn Ile Ser Pro Phe Asp

210 215 220

Arg Gly Leu Val Leu Ile Thr Tyr Asn Ser Val Glu Asn Lys Thr Asp

225 230 235 240

Val Thr Arg Gly Thr Arg Pro Glu Trp Leu Ala Ala Arg Asp Phe Thr

245 250 255

Pro Leu Thr Ala Leu Gln Ala Thr Ser Phe

260 265

<210> 6

<211> 266

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 6

Met Glu Pro His Asp Thr Leu Ser Pro Ala Gln Val Asp Glu Tyr Arg

1 5 10 15

Lys Asn Gly Phe Leu Val Gln Glu His Val Phe Asp Glu Glu Glu Ile

20 25 30

Glu Leu Leu Arg Ala Glu Ala Ala Gln Glu Phe Ala Ser Gly Gly Glu

35 40 45

Arg Val Thr Val Glu Gln Asn Thr Gly Ile Val Arg Gly Val His Gly

50 55 60

Cys His Leu Tyr Ser Glu Val Phe Gly Arg Leu Val Arg Ser Pro Arg

65 70 75 80

Leu Leu Pro Ile Ala Arg Gln Leu Leu Arg Asp Asp Val Tyr Val His

85 90 95

Gln Phe Lys Ile Asn Ala Lys Arg Ala Phe Lys Gly Glu Val Trp Glu

100 105 110

Trp His Gln Asp Tyr Thr Phe Trp His His Glu Asp Gly Met Pro Ala

115 120 125

Pro Arg Ala Leu Ser Ala Ala Ile Phe Leu Asp Glu Val Thr Glu Phe

130 135 140

Asn Gly Pro Leu Thr Phe Val Pro Gly Gly His Gly Ser Gly Met Ile

145 150 155 160

Asp Ala Asp Val Lys Gly Glu Gly Trp Ala Asn Thr Leu Thr Ala Ser

165 170 175

Leu Lys Tyr Ser Leu Asp Val Glu Thr Met Arg Gly Leu Ile Glu Arg

180 185 190

Asn Gly Met Val Ala Pro Lys Gly Pro Arg Gly Ser Val Leu Trp Phe

195 200 205

Asp Ala Asn Ile Pro His Ser Ser Val Pro Asn Ile Ser Pro Phe Asp

210 215 220

Arg Gly Leu Val Leu Ile Thr Tyr Asn Ser Val Glu Asn Lys Thr Asp

225 230 235 240

Val Thr Arg Gly Thr Arg Pro Glu Trp Leu Ala Ala Arg Asp Phe Thr

245 250 255

Pro Leu Thr Pro Leu Gln Ala Thr Ser Phe

260 265

<210> 7

<211> 272

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 7

Met Glu Pro His Asp Thr Leu Ser Pro Ala Gln Val Asp Glu Tyr Arg

1 5 10 15

Lys Asn Gly Phe Leu Val Gln Glu His Val Phe Asp Glu Glu Glu Ile

20 25 30

Glu Leu Leu Arg Ala Glu Ala Ala Gln Glu Phe Ala Ser Gly Gly Glu

35 40 45

Arg Val Thr Val Glu Gln Asn Thr Gly Ile Val Arg Gly Val His Gly

50 55 60

Cys His Leu Tyr Ser Glu Val Phe Gly Arg Leu Val Arg Ser Pro Arg

65 70 75 80

Leu Leu Pro Ile Ala Arg Gln Leu Leu Gly Asp Asp Val Tyr Val His

85 90 95

Gln Phe Lys Ile Asn Ala Lys Arg Ala Phe Lys Gly Glu Val Trp Glu

100 105 110

Trp His Gln Asp Tyr Thr Phe Trp His His Glu Asp Gly Met Pro Ala

115 120 125

Pro Arg Ala Leu Ser Ala Ala Ile Phe Leu Asp Glu Val Thr Glu Phe

130 135 140

Asn Gly Pro Leu Thr Phe Val Pro Gly Gly His Gly Ser Gly Met Ile

145 150 155 160

Asp Val Glu Arg Arg Ala Pro Ala Gly Asp Gly Asp Ala Gln Trp Leu

165 170 175

Pro Gln Leu Ser Ala Asp Leu Asp Tyr Ser Leu Asp Val Glu Thr Met

180 185 190

Arg Gly Leu Ile Glu Arg Asn Gly Met Val Ala Pro Lys Gly Pro Arg

195 200 205

Gly Ser Val Leu Trp Phe Asp Ala Asn Ile Pro His Ser Ser Val Pro

210 215 220

Asn Ile Ser Pro Phe Asp Arg Gly Leu Val Leu Ile Thr Tyr Asn Ser

225 230 235 240

Val Glu Asn Lys Thr Asp Val Thr Arg Gly Thr Arg Pro Glu Trp Leu

245 250 255

Ala Ala Arg Asp Phe Thr Pro Leu Thr Ala Leu Gln Ala Thr Ser Phe

260 265 270

<210> 8

<211> 272

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 8

Met Glu Pro His Asp Thr Leu Ser Pro Ala Gln Val Asp Glu Tyr Arg

1 5 10 15

Lys Asn Gly Phe Leu Val Gln Glu His Val Phe Asp Glu Glu Glu Ile

20 25 30

Glu Leu Leu Arg Ala Glu Ala Ala Gln Glu Phe Ala Ser Gly Gly Glu

35 40 45

Arg Val Thr Val Glu Gln Asn Thr Gly Ile Val Arg Gly Val His Gly

50 55 60

Cys His Leu Tyr Ser Glu Val Phe Gly Arg Leu Val Arg Ser Pro Arg

65 70 75 80

Leu Leu Pro Ile Ala Arg Gln Leu Leu Arg Asp Asp Val Tyr Val His

85 90 95

Gln Phe Lys Ile Asn Ala Lys Arg Ala Phe Lys Gly Glu Val Trp Pro

100 105 110

Trp His Gln Asp Tyr Thr Phe Trp His His Glu Asp Gly Met Pro Ala

115 120 125

Pro Arg Ala Leu Ser Ala Ala Ile Phe Leu Asp Glu Val Thr Glu Phe

130 135 140

Asn Gly Pro Leu Thr Phe Val Pro Gly Gly His Gly Ser Gly Met Ile

145 150 155 160

Asp Val Glu Arg Arg Ala Pro Ala Gly Asp Gly Asp Ala Gln Trp Leu

165 170 175

Pro Gln Leu Ser Ala Asp Leu Asp Tyr Ser Leu Asp Val Glu Thr Met

180 185 190

Arg Gly Leu Ile Glu Arg Asn Gly Met Val Ala Pro Lys Gly Pro Arg

195 200 205

Gly Ser Val Leu Trp Phe Asp Ala Asn Ile Pro His Ser Ser Val Pro

210 215 220

Asn Ile Ser Pro Phe Asp Arg Gly Leu Val Leu Ile Thr Tyr Asn Ser

225 230 235 240

Val Glu Asn Lys Thr Asp Val Thr Arg Gly Thr Arg Pro Glu Trp Leu

245 250 255

Ala Ala Arg Asp Phe Thr Pro Leu Thr Ala Leu Gln Ala Thr Ser Phe

260 265 270

<210> 9

<211> 272

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 9

Met Glu Pro His Asp Thr Leu Ser Pro Ala Gln Val Asp Glu Tyr Arg

1 5 10 15

Lys Asn Gly Phe Leu Val Gln Glu His Val Phe Asp Glu Glu Glu Ile

20 25 30

Glu Leu Leu Arg Ala Glu Ala Ala Gln Glu Phe Ala Ser Gly Gly Glu

35 40 45

Arg Val Thr Val Glu Gln Asn Thr Gly Ile Val Arg Gly Val His Gly

50 55 60

Cys His Leu Tyr Ser Glu Val Phe Gly Arg Leu Val Arg Ser Pro Arg

65 70 75 80

Leu Leu Pro Ile Ala Arg Gln Leu Leu Arg Asp Asp Val Tyr Val His

85 90 95

Gln Phe Lys Ile Asn Ala Lys Arg Ala Phe Lys Gly Glu Val Trp Glu

100 105 110

Trp His Gln Asp Tyr Thr Phe Trp His His Glu Asp Gly Met Pro Ala

115 120 125

Pro Arg Ala Leu Ser Ala Ala Ile Phe Leu Asp Glu Val Thr Glu Phe

130 135 140

Asn Gly Pro Leu Thr Phe Val Pro Gly Gly His Gly Ser Gly Met Ile

145 150 155 160

Asp Val Glu Arg Arg Ala Pro Ala Gly Asp Gly Asp Ala Gln Trp Leu

165 170 175

Pro Gln Leu Ser Ala Asp Leu Asp Tyr Ser Leu Asp Val Glu Thr Met

180 185 190

Arg Gly Leu Ile Glu Arg Asn Gly Met Val Ala Pro Lys Gly Pro Arg

195 200 205

Gly Ser Val Leu Trp Phe Asp Ala Asn Ile Pro His Ser Ser Val Pro

210 215 220

Asn Ile Ser Pro Phe Asp Arg Gly Leu Val Leu Ile Thr Tyr Asn Ser

225 230 235 240

Val Glu Asn Lys Thr Asp Val Thr Arg Gly Thr Arg Pro Glu Trp Leu

245 250 255

Ala Ala Arg Asp Phe Thr Pro Leu Thr Pro Leu Gln Ala Thr Ser Phe

260 265 270

<210> 10

<211> 804

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 10

atgttgtcgt acgagagtat cgacctgtat cgcgaggacg ggttcctgtt cgcggacccc 60

cttaccgaaa aggagacaga ccttctacgc gaacaggccg atcgtgagtt tctgcgggat 120

tctcccggcc ggatgttgga gaaggacggt ttcacggtgc gcggggtgca cgggtcgcac 180

gtggtgaaca gcacgttcgc ccggctggta cggcacccaa agatcgtcac accggccacg 240

cagctactgg gtggccccgt atatgtgcac cagttcaaga tcaatgcaaa gaaggcgctg 300

accggcgatg tgtggccctg gcaccaggac tacatcttct ggaaccgggg tgacggaatg 360

cgtcgccccg acgtggtgaa cgtcgccgtc ctgctggatg aggcgaccga tctgaacggt 420

ccactgctcg tcctgcccgg ctcacacaag tgcggctctc tggaagtggc gaggcggacg 480

accgtctgtg gcgacggggc gtggcggtcc gacatctccg cagatctgga ctacgccatc 540

gacgcgccgc tgctgtccaa gctcaccgag actacaaaag tgaccgccat caaagggccg 600

cccggctcga tcctcctctt cgatcccctg ctcgtacacg cctcgggcgt gaacatggct 660

ccctacgatc ggcgcatgat cctcgtcacc tacaaccggg tggacaatcc actcggagag 720

gtgcccagcc ctcgaccgga cttcctcgcc gcccgggaca acacgccggt caggccgctc 780

gaccccggcg cggaccttct cgcc 804

<210> 11

<211> 268

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 11

Met Leu Ser Tyr Glu Ser Ile Asp Leu Tyr Arg Glu Asp Gly Phe Leu

1 5 10 15

Phe Ala Asp Pro Leu Thr Glu Lys Glu Thr Asp Leu Leu Arg Glu Gln

20 25 30

Ala Asp Arg Glu Phe Leu Arg Asp Ser Pro Gly Arg Met Leu Glu Lys

35 40 45

Asp Gly Phe Thr Val Arg Gly Val His Gly Ser His Val Val Asn Ser

50 55 60

Thr Phe Ala Arg Leu Val Arg His Pro Lys Ile Val Thr Pro Ala Thr

65 70 75 80

Gln Leu Leu Gly Gly Pro Val Tyr Val His Gln Phe Lys Ile Asn Ala

85 90 95

Lys Lys Ala Leu Thr Gly Asp Val Trp Pro Trp His Gln Asp Tyr Ile

100 105 110

Phe Trp Asn Arg Gly Asp Gly Met Arg Arg Pro Asp Val Val Asn Val

115 120 125

Ala Val Leu Leu Asp Glu Ala Thr Asp Leu Asn Gly Pro Leu Leu Val

130 135 140

Leu Pro Gly Ser His Lys Cys Gly Ser Leu Glu Val Ala Arg Arg Thr

145 150 155 160

Thr Val Cys Gly Asp Gly Ala Trp Arg Ser Asp Ile Ser Ala Asp Leu

165 170 175

Asp Tyr Ala Ile Asp Ala Pro Leu Leu Ser Lys Leu Thr Glu Thr Thr

180 185 190

Lys Val Thr Ala Ile Lys Gly Pro Pro Gly Ser Ile Leu Leu Phe Asp

195 200 205

Pro Leu Leu Val His Ala Ser Gly Val Asn Met Ala Pro Tyr Asp Arg

210 215 220

Arg Met Ile Leu Val Thr Tyr Asn Arg Val Asp Asn Pro Leu Gly Glu

225 230 235 240

Val Pro Ser Pro Arg Pro Asp Phe Leu Ala Ala Arg Asp Asn Thr Pro

245 250 255

Val Arg Pro Leu Asp Pro Gly Ala Asp Leu Leu Ala

260 265

<210> 12

<211> 269

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 12

Met Leu Ser Tyr Glu Ser Ile Asp Leu Tyr Arg Glu Asp Gly Phe Leu

1 5 10 15

Phe Ala Asp Pro Leu Thr Glu Lys Glu Thr Asp Leu Leu Arg Glu Gln

20 25 30

Ala Asp Arg Glu Phe Leu Arg Asp Ser Pro Gly Arg Met Leu Glu Lys

35 40 45

Asp Gly Phe Thr Val Arg Gly Val His Gly Ser His Val Val Asn Ser

50 55 60

Thr Phe Ala Arg Leu Val Arg His Pro Lys Ile Val Thr Pro Ala Thr

65 70 75 80

Gln Leu Leu Gly Gly Pro Val Tyr Val His Gln Phe Lys Ile Asn Ala

85 90 95

Lys Lys Ala Leu Thr Gly Asp Val Trp Pro Trp His Gln Asp Tyr Ile

100 105 110

Phe Trp Asn Arg Gly Asp Gly Met Arg Arg Pro Asp Val Val Asn Val

115 120 125

Ala Val Leu Leu Asp Glu Ala Thr Asp Leu Asn Gly Pro Leu Leu Val

130 135 140

Leu Pro Gly Ser His Lys Cys Gly Ser Leu Glu Val Glu Arg Arg Ala

145 150 155 160

Pro Ala Gly Asp Gly Asp Ala Gln Trp Leu Pro Gln Leu Ser Ala Asp

165 170 175

Leu Asp Tyr Ala Ile Asp Ala Pro Leu Leu Ser Lys Leu Thr Glu Thr

180 185 190

Thr Lys Val Thr Ala Ile Lys Gly Pro Pro Gly Ser Ile Leu Leu Phe

195 200 205

Asp Pro Leu Leu Val His Ala Ser Gly Val Asn Met Ala Pro Tyr Asp

210 215 220

Arg Arg Met Ile Leu Val Thr Tyr Asn Arg Val Asp Asn Pro Leu Gly

225 230 235 240

Glu Val Pro Ser Pro Arg Pro Asp Phe Leu Ala Ala Arg Asp Asn Thr

245 250 255

Pro Val Arg Pro Leu Asp Pro Gly Ala Asp Leu Leu Ala

260 265

<210> 13

<211> 23

<212> PRT

<213> 人工序列 (Artificial sequence)

<400> 13

Val Glu Arg Arg Ala Pro Ala Gly Asp Gly Asp Ala Gln Trp Leu Pro

1 5 10 15

Gln Leu Ser Ala Asp Leu Asp

20

<210> 14

<211> 58

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 14

cagtggctgc cgcagctgtc tgctgacctg gactactcgc tcgacgtcga gacgatgc 58

<210> 15

<211> 63

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 15

agcgtcaccg tcaccagccg gagcacgacg ttcaacgtcg atcatgccgc tgccgtgtcc 60

gcc 63

<210> 16

<211> 26

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 16

actgctgggt gacgacgtgt acgtcc 26

<210> 17

<211> 29

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 17

acgtcgtcac ccagcagttg cctggcgat 29

<210> 18

<211> 24

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 18

gtctggccgt ggcaccagga ctac 24

<210> 19

<211> 21

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 19

tgccacggcc agacctcacc c 21

<210> 20

<211> 29

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 20

cgttgacgcc gctgcaggcc acgtccttc 29

<210> 21

<211> 27

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 21

ctgcagcggc gtcaacggcg tgaagtc 27

<210> 22

<211> 50

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 22

tcagtggctg ccgcagctgt ctgctgacct ggactacgcc atcgacgcgc 50

<210> 23

<211> 53

<212> DNA

<213> 人工序列 (Artificial sequence)

<400> 23

gcgtcaccgt caccagccgg agcacgacgt tcaacttcca gagagccgca ctt 53

30页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种新型的脯氨酸3-羟化酶及其应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!