合成黄芩素和野黄芩素的微生物、其制备方法及其应用

文档序号:1425626 发布日期:2020-03-17 浏览:19次 >En<

阅读说明:本技术 合成黄芩素和野黄芩素的微生物、其制备方法及其应用 (Microorganism for synthesizing baicalein and scutellarein, preparation method and application thereof ) 是由 王勇 李建华 田晨菲 于 2018-09-07 设计创作,主要内容包括:本发明涉及合成黄芩素和野黄芩素的微生物、其制备方法及其应用。本发明人通过基因工程的方法对宿主细胞的异源代谢途径进行改造,获得了高产黄芩素和野黄芩素的工程菌株。本发明还提供了利用所述工程菌株生产黄芩素和野黄芩素的工艺。(The invention relates to a microorganism for synthesizing baicalein and scutellarein, a preparation method and application thereof. The present inventors obtained high-yield baicalein and scutellarein engineering strains by modifying the heterologous metabolic pathway of host cells through a genetic engineering method. The invention also provides a process for producing baicalein and scutellarein by using the engineering strain.)

合成黄芩素和野黄芩素的微生物、其制备方法及其应用

技术领域

本发明涉及合成生物学及医药技术领域,具体地,本发明涉及合成黄芩素和野黄芩素的微生物、其制备方法及其应用。

背景技术

黄芩(Scutcllaria Baicalensis Georgi)是中国著名的传统药物,为唇形科植物;中药黄芩是植物黄芩干燥的根,药用历史悠久,可用于风热湿热等多种疾病的治疗。灯盏花是菊科植物短葶(Erigeron breviscapus)的干燥全草,性寒味苦,具有消炎止痛、活血化瘀和祛风除湿等功效。黄芩和灯盏花提取物早已被广泛应用于中药制剂中,银***、双黄莲口服液和兰岑口服液等的主要原料都是黄芩提取物,中药清开灵的主要有效成分就是黄芩素,它具有消炎,防治腹泻、肝病和肿瘤的作用;常见的灯盏花剂型有灯盏花素片和灯盏花素口服液等,它们在生物体内的主要代谢吸收形式是其苷元野黄芩素。因此,黄芩素和野黄芩素均具有一定的新药开发价值。

黄芩素和野黄芩素是二个结构相似且重要的黄酮类化合物。黄芩素的分子式为C15H10O5,分子量为270.24,而野黄芩素的分子量为C15H10O6,分子量为286.24。它们的结构如图1所示。

与大多数植物源天然产物一样,目前黄芩素和野黄芩素的主要通过化学合成和有机溶剂萃取两种方法制备。有机溶剂萃取主要是对黄芩、灯盏花、半枝莲等药用植物进行组织抽提,在此过程中需要大量的有机溶剂,还存在随后的分离工艺繁琐,工业化造价高等问题。最主要的是该方法受到植物生长缓慢、对药用资源的破坏等难题。尽管通过化学合成也可以大量获得黄芩素和野黄芩素,但是原料会涉及肉桂酸或其衍生物、氧代苯酚等化工物质,一定程度限制了其在药物、食品领域的应用。而且在合成过程中还涉及到有毒试剂及昂贵的化学催化剂的使用等问题。

合成生物学是基于理性的设计,将标准化的生物元件进行集成与装配,从而构建性能优良的人造生命系统。合成生物学一经诞生,它的思想和设计就深刻地影响着工业微生物技术的发展,使微生物技术在药物、生物燃料、精细化学品的开发与生产过程中发挥出更加巨大的作用。

在本领域中,多种天然产物的合成元件经过组装后实现了在微生物中的异源合成。但是本发明中涉及到的黄芩素和野黄芩素这两种活性黄酮类化合物,还尚未见在微生物中成功地异源合成的报道。因此,迫切需要构建一株能够异源合成黄芩素和野黄芩素的微生物菌株。

发明内容

本发明的目的在于提供合成黄芩素和野黄芩素的微生物、其制备方法及其应用。

在本发明的第一方面,提供一种生产黄芩素和野黄芩素的方法,包括:(1)在宿主细胞中引入表达黄酮6-羟化酶(F6H)以及细胞色素P450氧化还原酶(CPR)的基因,以及白杨素或芹菜素合成基因;和(2)在含有苯丙氨酸和/或酪氨酸的培养体系中培养该宿主细胞,从而生产黄芩素或野黄芩素。

在一个优选例中,所述的白杨素或芹菜素合成基因包括:表达苯丙氨酸解氨酶(phenylalanine ammonia-lyase,PAL)、4-香豆酸辅酶A连接酶(4-coumarate:CoA ligase,4CL)、查尔酮合成酶(chalcone synthase,CHS)、查尔酮异构酶(chalcone isomerase,CHI)和黄酮合成酶I(flavone synthase I,FNSI)的基因;较佳地,在被引入宿主细胞时,所述的表达苯丙氨酸解氨酶、4-香豆酸辅酶A连接酶、查尔酮合成酶、查尔酮异构酶和黄酮合成酶I的基因存在于同一表达载体中。

在另一优选例中,所述的黄酮6-羟化酶来源于黄芩(Scutcllaria baicalensis),也包括其同源物(来自其它物种的同源基因或多肽);所述的CPR来源于拟南芥(Arabidopsis thaliana),也包括其同源物。

在另一优选例中,所述的PAL来源于红景天(Rhodotorula toruloides),也包括其同源物;所述的4CL来源于欧芹(Petroselium crispum),也包括其同源物;所述的CHS来源于矮牵牛(Petunia X hybrida),也包括其同源物;所述的CHI来源于苜蓿(Medicagosativa),也包括其同源物;所述的FNS I来源于欧芹(Petroselium crispum),也包括其同源物。

在本发明的另一方面,提供一种生产黄芩素和野黄芩素的方法,包括:(1)在宿主细胞中引入表达黄酮6-羟化酶(F6H)以及细胞色素P450氧化还原酶(CPR)的基因,获得重组的宿主细胞;和(2)在含有白杨素或芹菜素的培养体系中培养该重组的宿主细胞,从而生产黄芩素或野黄芩素。

在本发明的另一方面,提供一种将白杨素或芹菜素转化为黄芩素或野黄芩素的方法:以黄酮6-羟化酶以及细胞色素P450氧化还原酶催化白杨素或芹菜素,从而在白杨素或芹菜素的结构中加上一个羟基,形成黄芩素或野黄芩素。

在一个优选例中,所述的黄酮6-羟化酶(F6H)是截去N端第(1-10)~(20-30)位氨基酸的突变型黄酮6-羟化酶;较佳地,是截去N端第(2-5)~(22-28)位氨基酸的突变型黄酮6-羟化酶。

在另一优选例中,所述的黄酮6-羟化酶与多肽标签融合,所述的多肽标签选自:小牛血清17羟基化酶N端8氨基酸多肽(8RP),小分子泛素修饰相关蛋白(Sumo),麦芽糖结合蛋白(MBP),细胞色素P450 2B1家族可溶性蛋白(2B1),或其组合;较佳地为麦芽糖结合蛋白或细胞色素P450 2B1家族可溶性蛋白,或其组合;较佳地所述多肽标签位于N端。

在另一优选例中,所述的细胞色素P450氧化还原酶(CPR)的是截去N端第(1-20)~(60-85)位氨基酸的突变型细胞色素P450氧化还原酶;较佳地,是截去N端第(2-10)~(65-80)位氨基酸的突变型细胞色素P450氧化还原酶;更佳地,是截去N端第(2-5)~(70-75)位氨基酸的突变型细胞色素P450氧化还原酶。

在另一优选例中,所述的宿主细胞包括:原核细胞或真核细胞;较佳地,所述的原核细胞包括:大肠杆菌细胞,枯草芽孢杆菌细胞;所述的真核细胞包括:酵母细胞。

在本发明的另一方面,提供一种重组宿主细胞,其中包括外源的表达黄酮6-羟化酶以及细胞色素P450氧化还原酶的基因。

在另一优选例中,所述的重组宿主细胞中还包括外源的白杨素或芹菜素合成基因。

在另一优选例中,所述的多肽标签为单拷贝或2~10拷贝(如3、4、5、6、8拷贝)串联的序列结构。

在本发明的另一方面,提供前面任一所述的重组宿主细胞的用途,用于生产黄芩素和野黄芩素。

在一个优选例中,对于细胞内不存在白杨素或芹菜素合成基因的菌株,用于以外源添加的白杨素或芹菜素为底物生产黄芩素和野黄芩素;对于细胞内存在白杨素或芹菜素合成基因的菌株,用于在外源添加苯丙氨酸和/或酪氨酸的培养条件下生产黄芩素和野黄芩素。

在本发明的另一方面,提供一种制备用于生产黄芩素和野黄芩素的宿主细胞的方法,包括:在宿主细胞中引入表达黄酮6-羟化酶以及细胞色素P450氧化还原酶的基因,获得重组菌株;较佳地,还包括引入白杨素或芹菜素合成基因。

在本发明的另一方面,提供一种用于生产黄芩素和野黄芩素的试剂盒所述试剂盒中包括前面任一所述的重组的宿主细胞。

在另一优选例中,所述的试剂盒中还包括:宿主细胞培养基,使用说明书等。

在本发明的另一方面,提供突变型黄酮6-羟化酶,其对应于野生型黄酮6-羟化酶(F6H),截去N端第(1-10)~(20-30)位氨基酸;较佳地,截去N端第(2-5)~(22-28)位氨基酸;较佳地,其具有SEQ ID NO:2所示的氨基酸序列。

在本发明的另一方面,提供突变型细胞色素P450氧化还原酶,其对应于野生型细胞色素P450氧化还原酶,截去N端第(1-20)~(60-85)位氨基酸;较佳地,截去N端第(2-10)~(65-80)位氨基酸;更佳地,截去N端第(2-5)~(70-75)位氨基酸;较佳地,其具有SEQ IDNO:8所示的氨基酸序列。

在本发明的另一方面,提供融合多肽,其包括前面所述的任一突变型黄酮6-羟化酶,以及与之融合的多肽标签,所述的多肽标签选自:8RP,Sumo,MBP,2B1;较佳地为MBP或2B1。

在一个优选例中,所述的融合多肽具有选自下组的氨基酸序列:SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5或SEQ ID NO:6。

在本发明的另一方面,提供多核苷酸,其编码:述的突变型黄酮6-羟化酶;或所述的突变型细胞色素P450氧化还原酶;或所述的融合多肽。

在本发明的另一方面,提供一种表达构建物,其包括:前面所述的任一多核苷酸;或编码前面所述的任一突变型黄酮6-羟化酶或前面所述的融合蛋白的多核苷酸,以及编码前面所述的突变型细胞色素P450氧化还原酶的多核苷酸。

在另一优选例中,所述的表达构建物中,还包括与上述的多核苷酸操作性连接的启动子和终止子。

在本发明的另一方面,提供所述的突变型黄酮6-羟化酶或所述的融合蛋白,以及突变型细胞色素P450氧化还原酶的用途,用于在白杨素或芹菜素的结构中加上一个羟基,形成黄芩素或野黄芩素。

本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。

附图说明

图1、黄芩素和野黄芩素的结构式。

图2、黄芩素和野黄芩素的生物合成路径。

图3、质粒pYH66的构建示意图。

图4、质粒pYH57的构建示意图。

图5、工程菌株BL21(DE3)-pYH57-pYH66和标准品黄芩素的HPLC检测图谱。其中,i表示BL21(DE3)-pETDuet-1-pCDFDuet-1发酵液作为空白对照;ii表示BL21(DE3)-pYH57-pYH66添加苯丙氨酸的发酵液;iii表示黄芩素标准品。

图6、工程菌株BL21(DE3)-pYH57-pYH66产黄芩素的质谱图谱。

图7、工程菌株BL21(DE3)-pYH57-pYH66和标准品野黄芩素的HPLC检测图谱。其中,i表示BL21(DE3)-pETDuet-1-pCDFDuet-1发酵液作为空白对照;ii表示BL21(DE3)-pYH57-pYH66添加酪氨酸的发酵液;iii表示野黄芩素标准品。

图8、工程菌株BL21(DE3)-pYH57-pYH66产野黄芩素的质谱图谱。

图9、SbF6H和AtCPR突变体催化白杨素生成黄芩素。

A,所构建的质粒中关键元件的示意图;

B,重组大肠杆菌中,催化白杨素生成黄芩素的转化率;

C,HPLC分析重组大肠杆菌催化反应液。其中,Chr表示白杨素,Bai表示黄芩素。

具体实施方式

本发明人致力于利用微生物中异源合成黄芩素和野黄芩素,以及提高生物生产黄芩素和野黄芩素的产量,经过深入的研究,通过基因工程的方法对宿主细胞的异源代谢途径进行改造,获得了高产黄芩素和野黄芩素的工程菌株。

如本文所用,所述的“N端第(1-10)~(20-30)位氨基酸”是指起始于N端起第1-10位中的任一位氨基酸,终止于N端起第20-30位中的任一位氨基酸。

如本文所用,所述的“N端第(2-5)~(22-28)位”是指起始于N端起第2-5位中的任一位氨基酸,终止于N端起第22-28位中的任一位氨基酸。

如本文所用,所述的“N端第(1-20)~(60-85)位”是指起始于N端起第1-20位中的任一位氨基酸,终止于N端起第60-85位中的任一位氨基酸。

如本文所用,所述的“N端第(2-10)~(65-80)位”是指起始于N端起第2-10位中的任一位氨基酸,终止于N端起第65-80位中的任一位氨基酸。

如本文所用,所述的“N端第(2-5)~(70-75)位”是指起始于N端起第2-5位中的任一位氨基酸,终止于N端起第70-75位中的任一位氨基酸。

如本文所用,“外源的”或“异源的”是指来自不同来源的两条或多条核酸或蛋白质序列之间的关系。

如本文所用,所述的“可操作地连接(相连)”或“操作性连接(相连)”是指两个或多个核酸区域或核酸序列的功能性的空间排列。例如:启动子区被置于相对于目的基因核酸序列的特定位置,使得核酸序列的转录受到该启动子区域的引导,从而,启动子区域被“可操作地连接”到该核酸序列上。

如本文所用,所述的“表达构建物”是指重组DNA分子,它包含预期的核酸编码序列,其可以包含一个或多个基因表达盒。所述的“构建物”通常被包含在表达载体中。

如本文所用,所述的PAL、4CL、CHS、CHI和FNSI蛋白是在表达系统中形成白杨素或芹菜素合成途径的蛋白。

如本文所用,所述的F6H和CPR蛋白是在表达系统中转化白杨素或芹菜素、生成黄芩素或野黄芩素的蛋白。

野生型的上述蛋白或基因均为本领域已经鉴定的,因此,可以从公众途径获得和制备。作为本发明的优选方式,PAL来源于红景天(Rhodotorula toruloides),其具有GenBank登录号AAA33883.1所示的序列;4CL来源于欧芹(Petroselium crispum),其具有GenBank登录号KF765780.1所示的序列;CHS来源于矮牵牛(Petunia X hybrida),其具有GenBank登录号KF765781.1所示的序列;CHI基因来源于苜蓿(Medicago sativa),其具有GenBank登录号KF765782.1所示的序列;FNS I来源于欧芹(Petroselium crispum),其具有Swiss-Prot登录号Q7XZQ8.1所示的序列。

野生型的F6H和CPR也是本领域已经鉴定的。作为本发明的优选方式,F6H来源于黄岑(Scutellaria baicalensis),其具有GenBank登录号ASW21050.1所示的序列。作为本发明的优选方式,CPR来自于拟南芥(Arabidopsis thaliana),其具有GenBank登录号NP_849472.2所示的序列。

本发明人发现,利用宿主细胞生产黄芩素和野黄芩素的过程中,应用野生型的F6H,仅能产生微量的产物,无法实现规模化生产,因此对多个参与反应的蛋白进行了改造,经过大量筛选分析,获得了一些优选的改造方案,极为显著地提高了微生物,尤其是原核表达系统如大肠杆菌中黄芩素和野黄芩素的产量。

因此,作为本发明的优选方式,提供了一种突变型F6H,其对应于野生型F6H,截去N端第(1-10)~(20-30)位氨基酸;较佳地,截去N端第(2-5)~(22-28)位氨基酸;更佳地,截去N端第2-25位氨基酸。

作为本发明的优选方式,还提供了一种含有所述F6H或突变型F6H的融合蛋白,其包括F6H或任一突变型F6H,以及与之融合的多肽标签,所述的多肽标签选自:8RP,Sumo,MBP,2B1,或它们的组合;较佳地为MBP或2B1。所述的多肽标签与所述F6H或突变型F6H之间,可以包含或不包含连接肽,所述的连接肽不影响两者的生物学活性。

作为本发明的优选方式,提供了一种突变型CPR,其对应于野生型CPR,截去N端第(1-20)~(60-85)位氨基酸;较佳地,截去N端第(2-10)~(65-80)位氨基酸;更佳地,截去N端第(2-5)~(70-75)位氨基酸。

在上述优选的蛋白(包括上述野生型的蛋白,突变型的蛋白)的基础上,本发明还包括它们保留生物活性的片段、衍生物和类似物。它们的蛋白片段、衍生物或类似物可以是若干个(通常为1-50个,更佳地1-20个,还更佳如1-10个、1-5个、1-3个、或1-2个)氨基酸的缺失、***和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(例如100个以内、80个以内、50个以内、20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加或缺失一个或数个氨基酸通常也不会改变蛋白质的功能。但是,对于上述的突变型蛋白,在其进一步的变化形式中,均进行了如上所述的针对N端的截短。

在上述优选的蛋白(包括上述野生型的蛋白,突变型的蛋白)的基础上,本发明还包括它们的类似物。这些类似物与天然蛋白的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些蛋白包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的蛋白并不限于上述例举的代表性的蛋白。

在上述优选的蛋白(包括上述野生型的蛋白,突变型的蛋白)的基础上,本发明还包括与所述的蛋白同源性高(比如与所列举的具体蛋白序列的同源性为70%或更高;优选地同源性为80%或更高;更优选地同源性为90%或更高,如同源性95%,98%或99%)的、且具有相应多肽相同功能的蛋白也包括在本发明内。

本发明中列举了来自特定物种的蛋白或基因。应理解,虽然本发明中优选研究了获自特定物种的蛋白或基因,但是获自其它物种的与所述蛋白或基因高度同源(如具有60%以上,如70%,80%,85%、90%、95%、甚至98%序列相同性)的其它蛋白或基因也在本发明考虑的范围之内。

发明还涉及本发明还提供了编码本发明的蛋白或其保守性变异蛋白的多核苷酸序列。本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码本发明的突变体成熟蛋白的多核苷酸包括:只编码成熟蛋白的编码序列;成熟蛋白的编码序列和各种附加编码序列;成熟蛋白的编码序列(和任选的附加编码序列)以及非编码序列。

本发明还包括针对所述基因的序列,进行密码子优化后形成的多核苷酸序列,例如,根据宿主细胞的偏好进行密码子优化。

本发明中,还构建了一种高产黄芩素和野黄芩素的工程菌株,其中包括外源引入的表达F6H(特别是所述突变型F6H或融合蛋白)以及CPR(特别是所述突变型F6H或融合蛋白)的基因。培养该重组菌株,并在培养体系中加入白杨素或芹菜素,从而可生产黄芩素或野黄芩素。

本发明中,还构建了另一种高产黄芩素或野黄芩素的工程菌株,其中包括外源引入的表达F6H(特别是所述突变型F6H或融合蛋白)以及CPR(特别是所述突变型F6H或融合蛋白)的基因,以及白杨素或芹菜素合成基因。所述的白杨素或芹菜素合成基因包括:表达PAL、4CL、CHS、CHI和FNSI蛋白的基因。

本发明的菌株稳定性好,并可实现在生物反应器中规模性培养及生产黄芩素或野黄芩素。本发明优选的菌株的黄芩素或野黄芩素得率非常高。

本发明中,通过大肠杆菌生产黄芩素或野黄芩素,实现黄芩素或野黄芩素更经济、更方便的制造。

本发明还提供了用于生产黄芩素或野黄芩素工程菌株的试剂盒。此外,其中还可包括大肠杆菌培养基,黄芩素或野黄芩素分离或检测试剂,使用说明书等。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。

实验材料

AxyPrep总RNA小量制备试剂盒,多聚酶链式反应(PCR)胶回收试剂盒,质粒抽提试剂盒均为美国Axygen产品;PrimeScript RT reagent Kit with gDNA Eraser(PerfectReal Time)聚合酶试剂盒,聚合酶链式反应(PCR)高保真酶PrimeSTAR Max DNAPolymerase为日本宝生物公司(TAKARA)产品;限制性内切酶均为NEB产品。

大肠杆菌DH10B用于基因克隆,大肠杆菌BL21(DE3)菌株用于蛋白表达和黄芩素、野黄芩素的生产。pET28a、pEDDuet-1、pCDFDuet-1载体用于代谢途径基因装配。

标准品化合物黄芩素和野黄芩素购自上海源叶生物科技有限公司。其他试剂为国产分析纯或色谱纯试剂,购自国药集团化学试剂有限公司。

PCR使用Arktik Thermal Cycler(Thermo Fisher Scientific);恒温培养使用ZXGP-A2050恒温培养箱和ZWY-211G恒温培养振荡器;离心使用5418R高速冷冻式离心机和5418小型离心机(Eppendorf)。真空浓缩使用Concentrator plus浓缩仪(Eppendorf);OD600使用UV-1200紫外可见分光光度计检测(上海美谱达仪器有限公司)。旋转蒸发系统由IKARV 10digital旋转蒸发仪(IKA)和MZ 2C NT化学隔膜泵、CVC3000真空控制器(vacuubrand)组成。高效液相色谱使用Dionex UltiMate 3000液相色谱系统(Thermo FisherScientific)。

液相检测条件:A相:0.1%甲酸水,B相:乙腈;分离条件:0-20min 20%B相-55%B相,20-22min 55%B相-100%B相,22-27min 100%B相,27-35min100%B相-20%B相,35-40min,20%B相;检测波长:340nm,柱温:30℃。色谱柱:Thermo syncronis C18反相柱(250mm×4.6mm,5μm)。

实施例1、多肽及其序列优化

1、F6H多肽序列的优化改造

来自黄岑(Scutellaria baicalensis)的F6H(SbF6H)长度为517aa(Genbankaccess no.ASW21050.1),具体序列如下(SEQ ID NO:1):

MELSSVIYGAIALLSLFYCYLHFSKPKKSSLNAPPEAGGARFITGHLHLMDGRSASDKLPHINLGLLADQHGPIFTIRLGVHRAVVVSSWELAKEIFTTHDTAVMARPRLIADDYLSYDGASLGFSPYGPYWREIRKLVTTELLSARRIELQRATRVREITQFTGELYKLWEEKKDGSGRVLVDMKQWLGNLSLNLVSRMVVGKRFYGGDDSETTKRWRGVMREFFQLIGQFIPGDGLPFLRWLDLGGFEKRTRDTAYELDKIIAMWLAEYRKREYSGDDKEQCFMALMLSLVQANPTLQLHYDADTIIKATCQVLISAASDTTTVILIWVISLLLNNADVLKKVQEELDEQVGRERRVEESDISNLPYLQAVVKETMRLYPPAPFAGVRAFSEDCTVGGYHIQKGTFLIVNLWKLHRDPRVWSDDALEFKPQRFFDKKVEVKGQDFELMPFGGGRRMCPGSNLGMHMVHFVLANILQAFDITTGSTVDMTESVGLTNMKATPLDAILTPRLSPTLY*

改造1:本发明人针对SEQ ID NO:1进行序列改造,去除其中第2-25位氨基酸,在N端加上MA两个氨基酸,获得改进的F6H突变体trF6H,具体序列如下(SEQ ID NO:2):

MAMPKKSSLNAPPEAGGARFITGHLHLMDGRSASDKLPHINLGLLADQHGPIFTIRLGVHRAVVVSSWELAKEIFTTHDTAVMARPRLIADDYLSYDGASLGFSPYGPYWREIRKLVTTELLSARRIELQRATRVREITQFTGELYKLWEEKKDGSGRVLVDMKQWLGNLSLNLVSRMVVGKRFYGGDDSETTKRWRGVMREFFQLIGQFIPGDGLPFLRWLDLGGFEKRTRDTAYELDKIIAMWLAEYRKREYSGDDKEQCFMALMLSLVQANPTLQLHYDADTIIKATCQVLISAASDTTTVILIWVISLLLNNADVLKKVQEELDEQVGRERRVEESDISNLPYLQAVVKETMRLYPPAPFAGVRAFSEDCTVGGYHIQKGTFLIVNLWKLHRDPRVWSDDALEFKPQRFFDKKVEVKGQDFELMPFGGGRRMCPGSNLGMHMVHFVLANILQAFDITTGSTVDMTESVGLTNMKATPLDAILTPRLSPTLY*

改造2:本发明人针对SEQ ID NO:1进行序列改造,去除其中第2-25位氨基酸,再在N端加上8RP的氨基酸序列,获得改进的F6H突变体8RPtrF6H,具体序列如下(SEQ ID NO:3):

MALLLAVFMPKKSSLNAPPEAGGARFITGHLHLMDGRSASDKLPHINLGLLADQHGPIFTIRLGVHRAVVVSSWELAKEIFTTHDTAVMARPRLIADDYLSYDGASLGFSPYGPYWREIRKLVTTELLSARRIELQRATRVREITQFTGELYKLWEEKKDGSGRVLVDMKQWLGNLSLNLVSRMVVGKRFYGGDDSETTKRWRGVMREFFQLIGQFIPGDGLPFLRWLDLGGFEKRTRDTAYELDKIIAMWLAEYRKREYSGDDKEQCFMALMLSLVQANPTLQLHYDADTIIKATCQVLISAASDTTTVILIWVISLLLNNADVLKKVQEELDEQVGRERRVEESDISNLPYLQAVVKETMRLYPPAPFAGVRAFSEDCTVGGYHIQKGTFLIVNLWKLHRDPRVWSDDALEFKPQRFFDKKVEVKGQDFELMPFGGGRRMCPGSNLGMHMVHFVLANILQAFDITTGSTVDMTESVGLTNMKATPLDAILTPRLSPTLY*

改造3:本发明人针对SEQ ID NO:1进行序列改造,去除其中第2-25位氨基酸,再在N端加上Sumo的氨基酸序列,获得改进的F6H突变体SumotrF6H,具体序列如下(SEQ ID NO:4):

MADSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYD GIRIQADQTPEDLDMEDNDIIEAHREQIGGMPKKSSLNAPPEAGGARFITGHLHLMDGRSASDKLPHINLGLLADQHGPIFTIRLGVHRAVVVSSWELAKEIFTTHDTAVMARPRLIADDYLSYDGASLGFSPYGPYWREIRKLVTTELLSARRIELQRATRVREITQFTGELYKLWEEKKDGSGRVLVDMKQWLGNLSLNLVSRMVVGKRFYGGDDSETTKRWRGVMREFFQLIGQFIPGDGLPFLRWLDLGGFEKRTRDTAYELDKIIAMWLAEYRKREYSGDDKEQCFMALMLSLVQANPTLQLHYDADTIIKATCQVLISAASDTTTVILIWVISLLLNNADVLKKVQEELDEQVGRERRVEESDISNLPYLQAVVKETMRLYPPAPFAGVRAFSEDCTVGGYHIQKGTFLIVNLWKLHRDPRVWSDDALEFKPQRFFDKKVEVKGQDFELMPFGGGRRMCPGSNLGMHMVHFVLANILQAFDITTGSTVDMTESVGLTNMKATPLDAILTPRLSPTLY*

改造4:本发明人针对SEQ ID NO:1进行序列改造,去除其中第2-25位氨基酸,再在N端加上MBP的氨基酸序列,获得改进的F6H突变体MBPtrF6H,具体序列如下(SEQ ID NO:5):

MAKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDR FGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAK GKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFN KGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVN KDKPLGAVALKSYEEELVKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTMPKKSSLNAPPEAGGARFITGHLHLMDGRSASDKLPHINLGLLADQHGPIFTIRLGVHRAVVVSSWELAKEIFTTHDTAVMARPRLIADDYLSYDGASLGFSPYGPYWREIRKLVTTELLSARRIELQRATRVREITQFTGELYKLWEEKKDGSGRVLVDMKQWLGNLSLNLVSRMVVGKRFYGGDDSETTKRWRGVMREFFQLIGQFIPGDGLPFLRWLDLGGFEKRTRDTAYELDKIIAMWLAEYRKREYSGDDKEQCFMALMLSLVQANPTLQLHYDADTIIKATCQVLISAASDTTTVILIWVISLLLNNADVLKKVQEELDEQVGRERRVEESDISNLPYLQAVVKETMRLYPPAPFAGVRAFSEDCTVGGYHIQKGTFLIVNLWKLHRDPRVWSDDALEFKPQRFFDKKVEVKGQDFELMPFGGGRRMCPGSNLGMHMVHFVLANILQAFDITTGSTVDMTESVGLTNMKATPLDAILTPRLSPTLY*

改造5:本发明人针对SEQ ID NO:1进行序列改造,去除其中第2-25位氨基酸,再在N端加上2B1的氨基酸序列,获得改进的F6H突变体2B1trF6H,具体序列如下(SEQ ID NO:6):

MAKKTSSKGKLPPGPSMPKKSSLNAPPEAGGARFITGHLHLMDGRSASDKLPHINLGLLADQHGPIFTIRLGVHRAVVVSSWELAKEIFTTHDTAVMARPRLIADDYLSYDGASLGFSPYGPYWREIRKLVTTELLSARRIELQRATRVREITQFTGELYKLWEEKKDGSGRVLVDMKQWLGNLSLNLVSRMVVGKRFYGGDDSETTKRWRGVMREFFQLIGQFIPGDGLPFLRWLDLGGFEKRTRDTAYELDKIIAMWLAEYRKREYSGDDKEQCFMALMLSLVQANPTLQLHYDADTIIKATCQVLISAASDTTTVILIWVISLLLNNADVLKKVQEELDEQVGRERRVEESDISNLPYLQAVVKETMRLYPPAPFAGVRAFSEDCTVGGYHIQKGTFLIVNLWKLHRDPRVWSDDALEFKPQRFFDKKVEVKGQDFELMPFGGGRRMCPGSNLGMHMVHFVLANILQAFDITTGSTVDMTESVGLTNMKATPLDAILTPRLSPTLY*

2、CPR的优化改造

来自拟南芥(Arabidopsis thaliana)的CPR(AtCPR)序列长度712aa(Genebankaccess no.NP_849472.2),具体如下(SEQ ID NO:7):

MSSSSSSSTSMIDLMAAIIKGEPVIVSDPANASAYESVAAELSSMLIENRQFAMIVTTSIAVLIGCIV MLVWRRSGSGNSKRVEPLKPLVIKPREEEIDDGRKKVTIFFGTQTGTAEGFAKALGEEAKARYEKTRFKIVDLDDYAADDDEYEEKLKKEDVAFFFLATYGDGEPTDNAARFYKWFTEGNDRGEWLKNLKYGVFGLGNRQYEHFNKVAKVVDDILVEQGAQRLVQVGLGDDDQCIEDDFTAWREALWPELDTILREEGDTAVATPYTAAVLEYRVSIHDSEDAKFNDINMANGNGYTVFDAQHPYKANVAVKRELHTPESDRSCIHLEFDIAGSGLTYETGDHVGVLCDNLSETVDEALRLLDMSPDTYFSLHAEKEDGTPISSSLPPPFPPCNLRTALTRYACLLSSPKKSALVALAAHASDPTEAERLKHLASPAGKVDEYSKWVVESQRSLLEVMAEFPSAKPPLGVFFAGVAPRLQPRFYSISSSPKIAETRIHVTCALVYEKMPTGRIHKGVCSTWMKNAVPYEKSENCSSAPIFVRQSNFKLPSDSKVPIIMIGPGTGLAPFRGFLQERLALVESGVELGPSVLFFGCRNRRMDFIYEEELQRFVESGALAELSVAFSREGPTKEYVQHKMMDKASDIWNMISQGAYLYVCGDAKGMARDVHRSLHTIAQEQGSMDSTKAEGFVKNLQTSGRYLRDVW*

本发明人针对SEQ ID NO:1进行序列改造,删除其中第2-72位氨基酸,获得改进的AtCPR突变体trAtCPR,具体如下(SEQ ID NO:8):

MRRSGSGNSKRVEPLKPLVIKPREEEIDDGRKKVTIFFGTQTGTAEGFAKALGEEAKARYEKTRFKIVDLDDYAADDDEYEEKLKKEDVAFFFLATYGDGEPTDNAARFYKWFTEGNDRGEWLKNLKYGVFGLGNRQYEHFNKVAKVVDDILVEQGAQRLVQVGLGDDDQCIEDDFTAWREALWPELDTILREEGDTAVATPYTAAVLEYRVSIHDSEDAKFNDINMANGNGYTVFDAQHPYKANVAVKRELHTPESDRSCIHLEFDIAGSGLTYETGDHVGVLCDNLSETVDEALRLLDMSPDTYFSLHAEKEDGTPISSSLPPPFPPCNLRTALTRYACLLSSPKKSALVALAAHASDPTEAERLKHLASPAGKVDEYSKWVVESQRSLLEVMAEFPSAKPPLGVFFAGVAPRLQPRFYSISSSPKIAETRIHVTCALVYEKMPTGRIHKGVCSTWMKNAVPYEKSENCSSAPIFVRQSNFKLPSDSKVPIIMIGPGTGLAPFRGFLQERLALVESGVELGPSVLFFGCRNRRMDFIYEEELQRFVESGALAELSVAFSREGPTKEYVQHKMMDKASDIWNMISQGAYLYVCGDAKGMARDVHRSLHTIAQEQGSMDSTKAEGFVKNLQTSGRYLRDVW*

实施例2、包含新型F6H突变体的重组质粒的构建

以pETDuet-1为出发质粒,将AtCPR通过一步克隆方法连接到NdeI和XhoI位点获得质粒pYH45。

以pETDuet-1为出发质粒,将trAtCPR通过一步克隆方法连接到NdeI和XhoI位点获得质粒pYH46。

进一步,通过金斯瑞合成密码子优化的F6H的编码基因序列并连接到pUC19载体中,获得pUC19-F6H。以F6H-F/R为引物,以pUC19-F6H为模板进行PCR扩增,体系50μL(PrimeSTAR Max Premix,25μL;双引物终浓度0.2~0.3μM;pUC19-F6H 0.2uL;剩余体积用灭菌蒸馏水补足)。PCR反应条件:98℃预变性2min,然后98℃变性10s,55℃退火15s,72℃延伸20s,25个循环,琼脂糖电泳检测,扩增得到约1.5kb的片段,纯化后用Nco I和BamH I双酶切消化。消化后片段连入相同酶消化过的pYH46,连接产物转化大肠杆菌DH10B感受态细胞,提取质粒经构建时引入酶切位点双酶切验证和基因测序,得到重组质粒pYH59。同样地,将消化后片段连入pYH45,得到重组质粒pYH59。

以trF6H-F/F6H-R为引物,pUC19-trF6H为模板,通过PCR扩增获得的产物在通过一步克隆方法连接到pYH46中的NdeI和BamH I位点获得质粒pYH58。

以pUC19-trF6H为模板,以8RP-trF6H-F/F6H-R为引物扩增后,用一步克隆方法将产物连接到pYH46的NdeI和BamH I位点中,获得pYH60。

以pETSumo(购自Invitrogen公司)为模板,以Sumo-F/Sumo-trF6H-R为引物获得含有Sumo序列的DNA片段,以pUC19-trF6H为模板,Sumo-trF6H-F/F6H-R为引物扩增获得含有trF6HDNA片段。以上述2个DNA片段为模板,以Sumo-F/F6H-R为引物进行融合PCR后,用一步克隆方法将产物连接到pYH46的NdeI和BamH I位点中,获得pYH61。

以pMAL-c5x(购自Invitrogen公司)为模板,以MBP-F/MBP-trF6H-R为引物PCR扩增获得含有MBP序列的DNA片段,以pUC19-trF6H为模板,MBP-trF6H-F/F6H-R为引物扩增获得含有trF6H的DNA片段,以上述获得的2个DNA片段为模板,MBP-F/F6H-R为引物进行融合PCR后,用一步克隆方法将产物连接到pYH46的NdeI和BamH I位点中,获得pYH62。

以pUC19-trF6H为模板,以2B1-F/F6H-R为引物扩增后,用一步克隆方法将产物连接到pYH46的NdeI和BamH I位点中,获得pYH63。

以trF6H-F/F6H-R为引物,pUC19-trF6H为模板,通过PCR扩增获得的产物再通过一步克隆方法连接到pYH45的NdeI和BamH I位点中,得到重组质粒pYH64。

以pMAL-c5x为模板,以MBP-F/MBP-trF6H-R为引物PCR扩增获得含有MBP序列的DNA片段,以pUC19-trF6H为模板,MBP-trF6H-F/F6H-R为引物扩增获得含有trF6H的DNA片段,以上述获得的2个DNA片段为模板,MBP-F/F6H-R为引物进行融合PCR后,用一步克隆方法将产物连接到pYH45的NdeI和BamH I位点中,获得pYH65。

以pUC19-2B1trF6H为模板,以2B1-F/F6H-R为引物扩增后,用一步克隆方法将产物连接到pYH45的NdeI和BamH I位点中,获得pYH66。质粒pYH66的构建示意图如图3所示。

以上构建过程所用的引物如表1。所构建的质粒中关键元件的示意图如图9A。

表1

Figure BDA0001792718840000141

实施例3、表达PAL、4CL、CHS、CHI和FNSI的重组质粒的构建

通过金斯瑞合成来源于红景天(Rhodotorula toruloides)的PAL基因、(GenBank登录号AAA33883.1)、来源于欧芹(Petroselium crispum)的4CL基因(GenBank登录号KF765780.1)、来源于矮牵牛(Petunia X hybrida)的CHS基因(GenBank登录号KF765781.1)、来源于苜蓿(Medicago sativa)的CHI基因(GenBank登录号KF765782.1)、来源于欧芹(Petroselium crispum)的FNS I基因(Swiss-Prot登录号Q7XZQ8.1),并构建到pET28a载体上获得pET28-PAL,pET28-4CL,pET28-CHS,pET28a-CHI,pET28a-FNSI。

合成如表2的引物。以pET28-4CL为模板,4CL-F-NcoI/4CL-R-BamHI为引物获得PCR产物,经与NcoI/BamHI双酶切的pCDFDuet-1连接获得pYH40。

以pET28-CHS为模板,CHS-F-NdeI/CHS-R-XhoI为引物获得PCR产物,经与NdeI/XhoI双酶切的pYH40连接获得pYH50。

以pET28a-CHI为模板,T7CHI-F-XhoI/CHI-R-AvrII为引物获得PCR产物,连接到pYH50获得pYH51。

以pET28-PAL为模板,T7PAL-F-BamH I/PAL-R-Hind III为引物获得PCR产物,经BamH I/Hind III双酶切后与同样双酶切的pYH51连接,获得质粒pYH55。

以pET28a-FNSI为模板,FNSI-HindIII-F/FNSI-NotI-R)为引物获得PCR产物,经Hind III/Not I双酶切后与同样双酶切的pYH55连接,获得最终载体pYH57。质粒pYH57的构建示意图如图4所示。

表2

Figure BDA0001792718840000151

Figure BDA0001792718840000161

实施例4、黄芩素和野黄芩素合成菌株的构建及功能验证

黄芩素和野黄芩素的生物合成的示意图如图1。

将重组质粒pYH66和pYH57共转化到大肠杆菌BL21(DE3)的感受态细胞中以获得工程菌株BL21(DE3)-pYH57-pYH66。

LB固体培养基(壮观霉素80μg/mL,氨苄青霉素100μg/mL)37℃培养过夜。挑取单个克隆到2mL LB液体培养基(壮观霉素80μg/mL,氨苄青霉素100μg/mL),转接过夜培养的菌液到新的10mL MOPS液体抗性培养基中37℃,250r/min培养至OD600=0.5-0.6,水浴降温至16℃左右,然后加入诱导剂IPTG至终浓度1mM,加入不同浓度经灭菌的苯丙氨酸或酪氨酸并转至22℃低温诱导培养,在摇床转速220r/min条件下继续培养48h。携带未连入外来基因的pETDuet-1和pCDFDuet-1空质粒的BL21(DE3)重组菌株作为空白对照,培养操作同上。

同时,将表2所列的各个重组质粒分别转化大肠杆菌,进行培养,检测各自的产物生成情况。

培养后,检测各个转化了重组质粒的重组菌株表达化合物的状况,如表3所示。

表3

Figure BDA0001792718840000162

Figure BDA0001792718840000171

经验证,本发明的各个重组菌株可以成功合成目标化合物。

工程菌株BL21(DE3)-pYH57-pYH66和标准品黄芩素的HPLC检测图谱如图5。工程菌株BL21(DE3)-pYH57-pYH66产黄芩素的质谱图谱如图6。

工程菌株BL21(DE3)-pYH57-pYH66和标准品野黄芩素的HPLC检测图谱如图7。工程菌株BL21(DE3)-pYH57-pYH66产野黄芩素的质谱图谱如图8。

实施例5、以白杨素为底物进行生产

分别将pYH58~pYH66这6个重组质粒转化到大肠杆菌BL21(DE3)的感受态细胞中以获得工程菌株,并命名为BL21(DE3)-pYH58~BL21(DE3)-pYH66。

LB固体培养基(氨苄青霉素100μg/mL)37℃培养过夜。挑取单个克隆到2mL LB液体培养基(氨苄青霉素100μg/mL),转接过夜培养的菌液到新的20mL MOPS液体抗性培养基中37℃,250r/min培养至OD600=0.5-0.6,水浴降温至16℃左右,然后加入诱导剂IPTG至终浓度1mM,在摇床转速220r/min,温度22℃条件下继续培养12h。将上述发酵液并在6000rpm,4℃,10min条件下离心,去掉上清,收集菌体。用反应缓冲液(50mM Tris-HCl,pH 7.4,0.1%Trixton)重悬至OD600=30。取1mL各重组菌的重悬液,向其中加入5μL白杨素(25mM)和2.5μLNADPH(100mM),继续在37℃反应8小时。待反应结束后,向反应液中加入10μL HCl(6M)和1mL乙酸乙酯进行萃取3次,浓缩有机相获得的残留物用200μL甲醇溶解后取10μL进行HPLC分析。

各个重组大肠杆菌中,催化白杨素生成黄芩素的转化率如图9B。

各个重组大肠杆菌催化反应液的HPLC分析结果如图9C。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 中国科学院上海生命科学研究院

<120> 合成黄芩素和野黄芩素的微生物、其制备方法及其应用

<130> 186662

<160> 29

<170> SIPOSequenceListing 1.0

<210> 1

<211> 517

<212> PRT

<213> 黄岑(Scutellaria baicalensis)

<400> 1

Met Glu Leu Ser Ser Val Ile Tyr Gly Ala Ile Ala Leu Leu Ser Leu

1 5 10 15

Phe Tyr Cys Tyr Leu His Phe Ser Lys Pro Lys Lys Ser Ser Leu Asn

20 25 30

Ala Pro Pro Glu Ala Gly Gly Ala Arg Phe Ile Thr Gly His Leu His

35 40 45

Leu Met Asp Gly Arg Ser Ala Ser Asp Lys Leu Pro His Ile Asn Leu

50 55 60

Gly Leu Leu Ala Asp Gln His Gly Pro Ile Phe Thr Ile Arg Leu Gly

65 70 75 80

Val His Arg Ala Val Val Val Ser Ser Trp Glu Leu Ala Lys Glu Ile

85 90 95

Phe Thr Thr His Asp Thr Ala Val Met Ala Arg Pro Arg Leu Ile Ala

100 105 110

Asp Asp Tyr Leu Ser Tyr Asp Gly Ala Ser Leu Gly Phe Ser Pro Tyr

115 120 125

Gly Pro Tyr Trp Arg Glu Ile Arg Lys Leu Val Thr Thr Glu Leu Leu

130 135 140

Ser Ala Arg Arg Ile Glu Leu Gln Arg Ala Thr Arg Val Arg Glu Ile

145 150 155 160

Thr Gln Phe Thr Gly Glu Leu Tyr Lys Leu Trp Glu Glu Lys Lys Asp

165 170 175

Gly Ser Gly Arg Val Leu Val Asp Met Lys Gln Trp Leu Gly Asn Leu

180 185 190

Ser Leu Asn Leu Val Ser Arg Met Val Val Gly Lys Arg Phe Tyr Gly

195 200 205

Gly Asp Asp Ser Glu Thr Thr Lys Arg Trp Arg Gly Val Met Arg Glu

210 215 220

Phe Phe Gln Leu Ile Gly Gln Phe Ile Pro Gly Asp Gly Leu Pro Phe

225 230 235 240

Leu Arg Trp Leu Asp Leu Gly Gly Phe Glu Lys Arg Thr Arg Asp Thr

245 250 255

Ala Tyr Glu Leu Asp Lys Ile Ile Ala Met Trp Leu Ala Glu Tyr Arg

260 265 270

Lys Arg Glu Tyr Ser Gly Asp Asp Lys Glu Gln Cys Phe Met Ala Leu

275 280 285

Met Leu Ser Leu Val Gln Ala Asn Pro Thr Leu Gln Leu His Tyr Asp

290 295 300

Ala Asp Thr Ile Ile Lys Ala Thr Cys Gln Val Leu Ile Ser Ala Ala

305 310 315 320

Ser Asp Thr Thr Thr Val Ile Leu Ile Trp Val Ile Ser Leu Leu Leu

325 330 335

Asn Asn Ala Asp Val Leu Lys Lys Val Gln Glu Glu Leu Asp Glu Gln

340 345 350

Val Gly Arg Glu Arg Arg Val Glu Glu Ser Asp Ile Ser Asn Leu Pro

355 360 365

Tyr Leu Gln Ala Val Val Lys Glu Thr Met Arg Leu Tyr Pro Pro Ala

370 375 380

Pro Phe Ala Gly Val Arg Ala Phe Ser Glu Asp Cys Thr Val Gly Gly

385 390 395 400

Tyr His Ile Gln Lys Gly Thr Phe Leu Ile Val Asn Leu Trp Lys Leu

405 410 415

His Arg Asp Pro Arg Val Trp Ser Asp Asp Ala Leu Glu Phe Lys Pro

420 425 430

Gln Arg Phe Phe Asp Lys Lys Val Glu Val Lys Gly Gln Asp Phe Glu

435 440 445

Leu Met Pro Phe Gly Gly Gly Arg Arg Met Cys Pro Gly Ser Asn Leu

450 455 460

Gly Met His Met Val His Phe Val Leu Ala Asn Ile Leu Gln Ala Phe

465 470 475 480

Asp Ile Thr Thr Gly Ser Thr Val Asp Met Thr Glu Ser Val Gly Leu

485 490 495

Thr Asn Met Lys Ala Thr Pro Leu Asp Ala Ile Leu Thr Pro Arg Leu

500 505 510

Ser Pro Thr Leu Tyr

515

<210> 2

<211> 495

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(495)

<223> F6H突变体

<400> 2

Met Ala Met Pro Lys Lys Ser Ser Leu Asn Ala Pro Pro Glu Ala Gly

1 5 10 15

Gly Ala Arg Phe Ile Thr Gly His Leu His Leu Met Asp Gly Arg Ser

20 25 30

Ala Ser Asp Lys Leu Pro His Ile Asn Leu Gly Leu Leu Ala Asp Gln

35 40 45

His Gly Pro Ile Phe Thr Ile Arg Leu Gly Val His Arg Ala Val Val

50 55 60

Val Ser Ser Trp Glu Leu Ala Lys Glu Ile Phe Thr Thr His Asp Thr

65 70 75 80

Ala Val Met Ala Arg Pro Arg Leu Ile Ala Asp Asp Tyr Leu Ser Tyr

85 90 95

Asp Gly Ala Ser Leu Gly Phe Ser Pro Tyr Gly Pro Tyr Trp Arg Glu

100 105 110

Ile Arg Lys Leu Val Thr Thr Glu Leu Leu Ser Ala Arg Arg Ile Glu

115 120 125

Leu Gln Arg Ala Thr Arg Val Arg Glu Ile Thr Gln Phe Thr Gly Glu

130 135 140

Leu Tyr Lys Leu Trp Glu Glu Lys Lys Asp Gly Ser Gly Arg Val Leu

145 150 155 160

Val Asp Met Lys Gln Trp Leu Gly Asn Leu Ser Leu Asn Leu Val Ser

165 170 175

Arg Met Val Val Gly Lys Arg Phe Tyr Gly Gly Asp Asp Ser Glu Thr

180 185 190

Thr Lys Arg Trp Arg Gly Val Met Arg Glu Phe Phe Gln Leu Ile Gly

195 200 205

Gln Phe Ile Pro Gly Asp Gly Leu Pro Phe Leu Arg Trp Leu Asp Leu

210 215 220

Gly Gly Phe Glu Lys Arg Thr Arg Asp Thr Ala Tyr Glu Leu Asp Lys

225 230 235 240

Ile Ile Ala Met Trp Leu Ala Glu Tyr Arg Lys Arg Glu Tyr Ser Gly

245 250 255

Asp Asp Lys Glu Gln Cys Phe Met Ala Leu Met Leu Ser Leu Val Gln

260 265 270

Ala Asn Pro Thr Leu Gln Leu His Tyr Asp Ala Asp Thr Ile Ile Lys

275 280 285

Ala Thr Cys Gln Val Leu Ile Ser Ala Ala Ser Asp Thr Thr Thr Val

290 295 300

Ile Leu Ile Trp Val Ile Ser Leu Leu Leu Asn Asn Ala Asp Val Leu

305 310 315 320

Lys Lys Val Gln Glu Glu Leu Asp Glu Gln Val Gly Arg Glu Arg Arg

325 330 335

Val Glu Glu Ser Asp Ile Ser Asn Leu Pro Tyr Leu Gln Ala Val Val

340 345 350

Lys Glu Thr Met Arg Leu Tyr Pro Pro Ala Pro Phe Ala Gly Val Arg

355 360 365

Ala Phe Ser Glu Asp Cys Thr Val Gly Gly Tyr His Ile Gln Lys Gly

370 375 380

Thr Phe Leu Ile Val Asn Leu Trp Lys Leu His Arg Asp Pro Arg Val

385 390 395 400

Trp Ser Asp Asp Ala Leu Glu Phe Lys Pro Gln Arg Phe Phe Asp Lys

405 410 415

Lys Val Glu Val Lys Gly Gln Asp Phe Glu Leu Met Pro Phe Gly Gly

420 425 430

Gly Arg Arg Met Cys Pro Gly Ser Asn Leu Gly Met His Met Val His

435 440 445

Phe Val Leu Ala Asn Ile Leu Gln Ala Phe Asp Ile Thr Thr Gly Ser

450 455 460

Thr Val Asp Met Thr Glu Ser Val Gly Leu Thr Asn Met Lys Ala Thr

465 470 475 480

Pro Leu Asp Ala Ile Leu Thr Pro Arg Leu Ser Pro Thr Leu Tyr

485 490 495

<210> 3

<211> 501

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(501)

<223> F6H突变体8RPtrF6H

<400> 3

Met Ala Leu Leu Leu Ala Val Phe Met Pro Lys Lys Ser Ser Leu Asn

1 5 10 15

Ala Pro Pro Glu Ala Gly Gly Ala Arg Phe Ile Thr Gly His Leu His

20 25 30

Leu Met Asp Gly Arg Ser Ala Ser Asp Lys Leu Pro His Ile Asn Leu

35 40 45

Gly Leu Leu Ala Asp Gln His Gly Pro Ile Phe Thr Ile Arg Leu Gly

50 55 60

Val His Arg Ala Val Val Val Ser Ser Trp Glu Leu Ala Lys Glu Ile

65 70 75 80

Phe Thr Thr His Asp Thr Ala Val Met Ala Arg Pro Arg Leu Ile Ala

85 90 95

Asp Asp Tyr Leu Ser Tyr Asp Gly Ala Ser Leu Gly Phe Ser Pro Tyr

100 105 110

Gly Pro Tyr Trp Arg Glu Ile Arg Lys Leu Val Thr Thr Glu Leu Leu

115 120 125

Ser Ala Arg Arg Ile Glu Leu Gln Arg Ala Thr Arg Val Arg Glu Ile

130 135 140

Thr Gln Phe Thr Gly Glu Leu Tyr Lys Leu Trp Glu Glu Lys Lys Asp

145 150 155 160

Gly Ser Gly Arg Val Leu Val Asp Met Lys Gln Trp Leu Gly Asn Leu

165 170 175

Ser Leu Asn Leu Val Ser Arg Met Val Val Gly Lys Arg Phe Tyr Gly

180 185 190

Gly Asp Asp Ser Glu Thr Thr Lys Arg Trp Arg Gly Val Met Arg Glu

195 200 205

Phe Phe Gln Leu Ile Gly Gln Phe Ile Pro Gly Asp Gly Leu Pro Phe

210 215 220

Leu Arg Trp Leu Asp Leu Gly Gly Phe Glu Lys Arg Thr Arg Asp Thr

225 230 235 240

Ala Tyr Glu Leu Asp Lys Ile Ile Ala Met Trp Leu Ala Glu Tyr Arg

245 250 255

Lys Arg Glu Tyr Ser Gly Asp Asp Lys Glu Gln Cys Phe Met Ala Leu

260 265 270

Met Leu Ser Leu Val Gln Ala Asn Pro Thr Leu Gln Leu His Tyr Asp

275 280 285

Ala Asp Thr Ile Ile Lys Ala Thr Cys Gln Val Leu Ile Ser Ala Ala

290 295 300

Ser Asp Thr Thr Thr Val Ile Leu Ile Trp Val Ile Ser Leu Leu Leu

305 310 315 320

Asn Asn Ala Asp Val Leu Lys Lys Val Gln Glu Glu Leu Asp Glu Gln

325 330 335

Val Gly Arg Glu Arg Arg Val Glu Glu Ser Asp Ile Ser Asn Leu Pro

340 345 350

Tyr Leu Gln Ala Val Val Lys Glu Thr Met Arg Leu Tyr Pro Pro Ala

355 360 365

Pro Phe Ala Gly Val Arg Ala Phe Ser Glu Asp Cys Thr Val Gly Gly

370 375 380

Tyr His Ile Gln Lys Gly Thr Phe Leu Ile Val Asn Leu Trp Lys Leu

385 390 395 400

His Arg Asp Pro Arg Val Trp Ser Asp Asp Ala Leu Glu Phe Lys Pro

405 410 415

Gln Arg Phe Phe Asp Lys Lys Val Glu Val Lys Gly Gln Asp Phe Glu

420 425 430

Leu Met Pro Phe Gly Gly Gly Arg Arg Met Cys Pro Gly Ser Asn Leu

435 440 445

Gly Met His Met Val His Phe Val Leu Ala Asn Ile Leu Gln Ala Phe

450 455 460

Asp Ile Thr Thr Gly Ser Thr Val Asp Met Thr Glu Ser Val Gly Leu

465 470 475 480

Thr Asn Met Lys Ala Thr Pro Leu Asp Ala Ile Leu Thr Pro Arg Leu

485 490 495

Ser Pro Thr Leu Tyr

500

<210> 4

<211> 591

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(591)

<223> 的F6H突变体SumotrF6H

<400> 4

Met Ala Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro

1 5 10 15

Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser

20 25 30

Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu

35 40 45

Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Arg

50 55 60

Phe Leu Tyr Asp Gly Ile Arg Ile Gln Ala Asp Gln Thr Pro Glu Asp

65 70 75 80

Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile

85 90 95

Gly Gly Met Pro Lys Lys Ser Ser Leu Asn Ala Pro Pro Glu Ala Gly

100 105 110

Gly Ala Arg Phe Ile Thr Gly His Leu His Leu Met Asp Gly Arg Ser

115 120 125

Ala Ser Asp Lys Leu Pro His Ile Asn Leu Gly Leu Leu Ala Asp Gln

130 135 140

His Gly Pro Ile Phe Thr Ile Arg Leu Gly Val His Arg Ala Val Val

145 150 155 160

Val Ser Ser Trp Glu Leu Ala Lys Glu Ile Phe Thr Thr His Asp Thr

165 170 175

Ala Val Met Ala Arg Pro Arg Leu Ile Ala Asp Asp Tyr Leu Ser Tyr

180 185 190

Asp Gly Ala Ser Leu Gly Phe Ser Pro Tyr Gly Pro Tyr Trp Arg Glu

195 200 205

Ile Arg Lys Leu Val Thr Thr Glu Leu Leu Ser Ala Arg Arg Ile Glu

210 215 220

Leu Gln Arg Ala Thr Arg Val Arg Glu Ile Thr Gln Phe Thr Gly Glu

225 230 235 240

Leu Tyr Lys Leu Trp Glu Glu Lys Lys Asp Gly Ser Gly Arg Val Leu

245 250 255

Val Asp Met Lys Gln Trp Leu Gly Asn Leu Ser Leu Asn Leu Val Ser

260 265 270

Arg Met Val Val Gly Lys Arg Phe Tyr Gly Gly Asp Asp Ser Glu Thr

275 280 285

Thr Lys Arg Trp Arg Gly Val Met Arg Glu Phe Phe Gln Leu Ile Gly

290 295 300

Gln Phe Ile Pro Gly Asp Gly Leu Pro Phe Leu Arg Trp Leu Asp Leu

305 310 315 320

Gly Gly Phe Glu Lys Arg Thr Arg Asp Thr Ala Tyr Glu Leu Asp Lys

325 330 335

Ile Ile Ala Met Trp Leu Ala Glu Tyr Arg Lys Arg Glu Tyr Ser Gly

340 345 350

Asp Asp Lys Glu Gln Cys Phe Met Ala Leu Met Leu Ser Leu Val Gln

355 360 365

Ala Asn Pro Thr Leu Gln Leu His Tyr Asp Ala Asp Thr Ile Ile Lys

370 375 380

Ala Thr Cys Gln Val Leu Ile Ser Ala Ala Ser Asp Thr Thr Thr Val

385 390 395 400

Ile Leu Ile Trp Val Ile Ser Leu Leu Leu Asn Asn Ala Asp Val Leu

405 410 415

Lys Lys Val Gln Glu Glu Leu Asp Glu Gln Val Gly Arg Glu Arg Arg

420 425 430

Val Glu Glu Ser Asp Ile Ser Asn Leu Pro Tyr Leu Gln Ala Val Val

435 440 445

Lys Glu Thr Met Arg Leu Tyr Pro Pro Ala Pro Phe Ala Gly Val Arg

450 455 460

Ala Phe Ser Glu Asp Cys Thr Val Gly Gly Tyr His Ile Gln Lys Gly

465 470 475 480

Thr Phe Leu Ile Val Asn Leu Trp Lys Leu His Arg Asp Pro Arg Val

485 490 495

Trp Ser Asp Asp Ala Leu Glu Phe Lys Pro Gln Arg Phe Phe Asp Lys

500 505 510

Lys Val Glu Val Lys Gly Gln Asp Phe Glu Leu Met Pro Phe Gly Gly

515 520 525

Gly Arg Arg Met Cys Pro Gly Ser Asn Leu Gly Met His Met Val His

530 535 540

Phe Val Leu Ala Asn Ile Leu Gln Ala Phe Asp Ile Thr Thr Gly Ser

545 550 555 560

Thr Val Asp Met Thr Glu Ser Val Gly Leu Thr Asn Met Lys Ala Thr

565 570 575

Pro Leu Asp Ala Ile Leu Thr Pro Arg Leu Ser Pro Thr Leu Tyr

580 585 590

<210> 5

<211> 861

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(861)

<223> F6H突变体MBPtrF6H

<400> 5

Met Ala Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp

1 5 10 15

Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp

20 25 30

Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys

35 40 45

Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp

50 55 60

Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu

65 70 75 80

Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp

85 90 95

Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val

100 105 110

Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro

115 120 125

Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys

130 135 140

Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp

145 150 155 160

Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly

165 170 175

Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala

180 185 190

Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala

195 200 205

Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr

210 215 220

Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser

225 230 235 240

Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro

245 250 255

Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser

260 265 270

Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr

275 280 285

Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val

290 295 300

Ala Leu Lys Ser Tyr Glu Glu Glu Leu Val Lys Asp Pro Arg Ile Ala

305 310 315 320

Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro

325 330 335

Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala

340 345 350

Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr

355 360 365

Met Pro Lys Lys Ser Ser Leu Asn Ala Pro Pro Glu Ala Gly Gly Ala

370 375 380

Arg Phe Ile Thr Gly His Leu His Leu Met Asp Gly Arg Ser Ala Ser

385 390 395 400

Asp Lys Leu Pro His Ile Asn Leu Gly Leu Leu Ala Asp Gln His Gly

405 410 415

Pro Ile Phe Thr Ile Arg Leu Gly Val His Arg Ala Val Val Val Ser

420 425 430

Ser Trp Glu Leu Ala Lys Glu Ile Phe Thr Thr His Asp Thr Ala Val

435 440 445

Met Ala Arg Pro Arg Leu Ile Ala Asp Asp Tyr Leu Ser Tyr Asp Gly

450 455 460

Ala Ser Leu Gly Phe Ser Pro Tyr Gly Pro Tyr Trp Arg Glu Ile Arg

465 470 475 480

Lys Leu Val Thr Thr Glu Leu Leu Ser Ala Arg Arg Ile Glu Leu Gln

485 490 495

Arg Ala Thr Arg Val Arg Glu Ile Thr Gln Phe Thr Gly Glu Leu Tyr

500 505 510

Lys Leu Trp Glu Glu Lys Lys Asp Gly Ser Gly Arg Val Leu Val Asp

515 520 525

Met Lys Gln Trp Leu Gly Asn Leu Ser Leu Asn Leu Val Ser Arg Met

530 535 540

Val Val Gly Lys Arg Phe Tyr Gly Gly Asp Asp Ser Glu Thr Thr Lys

545 550 555 560

Arg Trp Arg Gly Val Met Arg Glu Phe Phe Gln Leu Ile Gly Gln Phe

565 570 575

Ile Pro Gly Asp Gly Leu Pro Phe Leu Arg Trp Leu Asp Leu Gly Gly

580 585 590

Phe Glu Lys Arg Thr Arg Asp Thr Ala Tyr Glu Leu Asp Lys Ile Ile

595 600 605

Ala Met Trp Leu Ala Glu Tyr Arg Lys Arg Glu Tyr Ser Gly Asp Asp

610 615 620

Lys Glu Gln Cys Phe Met Ala Leu Met Leu Ser Leu Val Gln Ala Asn

625 630 635 640

Pro Thr Leu Gln Leu His Tyr Asp Ala Asp Thr Ile Ile Lys Ala Thr

645 650 655

Cys Gln Val Leu Ile Ser Ala Ala Ser Asp Thr Thr Thr Val Ile Leu

660 665 670

Ile Trp Val Ile Ser Leu Leu Leu Asn Asn Ala Asp Val Leu Lys Lys

675 680 685

Val Gln Glu Glu Leu Asp Glu Gln Val Gly Arg Glu Arg Arg Val Glu

690 695 700

Glu Ser Asp Ile Ser Asn Leu Pro Tyr Leu Gln Ala Val Val Lys Glu

705 710 715 720

Thr Met Arg Leu Tyr Pro Pro Ala Pro Phe Ala Gly Val Arg Ala Phe

725 730 735

Ser Glu Asp Cys Thr Val Gly Gly Tyr His Ile Gln Lys Gly Thr Phe

740 745 750

Leu Ile Val Asn Leu Trp Lys Leu His Arg Asp Pro Arg Val Trp Ser

755 760 765

Asp Asp Ala Leu Glu Phe Lys Pro Gln Arg Phe Phe Asp Lys Lys Val

770 775 780

Glu Val Lys Gly Gln Asp Phe Glu Leu Met Pro Phe Gly Gly Gly Arg

785 790 795 800

Arg Met Cys Pro Gly Ser Asn Leu Gly Met His Met Val His Phe Val

805 810 815

Leu Ala Asn Ile Leu Gln Ala Phe Asp Ile Thr Thr Gly Ser Thr Val

820 825 830

Asp Met Thr Glu Ser Val Gly Leu Thr Asn Met Lys Ala Thr Pro Leu

835 840 845

Asp Ala Ile Leu Thr Pro Arg Leu Ser Pro Thr Leu Tyr

850 855 860

<210> 6

<211> 509

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(509)

<223> F6H突变体2B1trF6H

<400> 6

Met Ala Lys Lys Thr Ser Ser Lys Gly Lys Leu Pro Pro Gly Pro Ser

1 5 10 15

Met Pro Lys Lys Ser Ser Leu Asn Ala Pro Pro Glu Ala Gly Gly Ala

20 25 30

Arg Phe Ile Thr Gly His Leu His Leu Met Asp Gly Arg Ser Ala Ser

35 40 45

Asp Lys Leu Pro His Ile Asn Leu Gly Leu Leu Ala Asp Gln His Gly

50 55 60

Pro Ile Phe Thr Ile Arg Leu Gly Val His Arg Ala Val Val Val Ser

65 70 75 80

Ser Trp Glu Leu Ala Lys Glu Ile Phe Thr Thr His Asp Thr Ala Val

85 90 95

Met Ala Arg Pro Arg Leu Ile Ala Asp Asp Tyr Leu Ser Tyr Asp Gly

100 105 110

Ala Ser Leu Gly Phe Ser Pro Tyr Gly Pro Tyr Trp Arg Glu Ile Arg

115 120 125

Lys Leu Val Thr Thr Glu Leu Leu Ser Ala Arg Arg Ile Glu Leu Gln

130 135 140

Arg Ala Thr Arg Val Arg Glu Ile Thr Gln Phe Thr Gly Glu Leu Tyr

145 150 155 160

Lys Leu Trp Glu Glu Lys Lys Asp Gly Ser Gly Arg Val Leu Val Asp

165 170 175

Met Lys Gln Trp Leu Gly Asn Leu Ser Leu Asn Leu Val Ser Arg Met

180 185 190

Val Val Gly Lys Arg Phe Tyr Gly Gly Asp Asp Ser Glu Thr Thr Lys

195 200 205

Arg Trp Arg Gly Val Met Arg Glu Phe Phe Gln Leu Ile Gly Gln Phe

210 215 220

Ile Pro Gly Asp Gly Leu Pro Phe Leu Arg Trp Leu Asp Leu Gly Gly

225 230 235 240

Phe Glu Lys Arg Thr Arg Asp Thr Ala Tyr Glu Leu Asp Lys Ile Ile

245 250 255

Ala Met Trp Leu Ala Glu Tyr Arg Lys Arg Glu Tyr Ser Gly Asp Asp

260 265 270

Lys Glu Gln Cys Phe Met Ala Leu Met Leu Ser Leu Val Gln Ala Asn

275 280 285

Pro Thr Leu Gln Leu His Tyr Asp Ala Asp Thr Ile Ile Lys Ala Thr

290 295 300

Cys Gln Val Leu Ile Ser Ala Ala Ser Asp Thr Thr Thr Val Ile Leu

305 310 315 320

Ile Trp Val Ile Ser Leu Leu Leu Asn Asn Ala Asp Val Leu Lys Lys

325 330 335

Val Gln Glu Glu Leu Asp Glu Gln Val Gly Arg Glu Arg Arg Val Glu

340 345 350

Glu Ser Asp Ile Ser Asn Leu Pro Tyr Leu Gln Ala Val Val Lys Glu

355 360 365

Thr Met Arg Leu Tyr Pro Pro Ala Pro Phe Ala Gly Val Arg Ala Phe

370 375 380

Ser Glu Asp Cys Thr Val Gly Gly Tyr His Ile Gln Lys Gly Thr Phe

385 390 395 400

Leu Ile Val Asn Leu Trp Lys Leu His Arg Asp Pro Arg Val Trp Ser

405 410 415

Asp Asp Ala Leu Glu Phe Lys Pro Gln Arg Phe Phe Asp Lys Lys Val

420 425 430

Glu Val Lys Gly Gln Asp Phe Glu Leu Met Pro Phe Gly Gly Gly Arg

435 440 445

Arg Met Cys Pro Gly Ser Asn Leu Gly Met His Met Val His Phe Val

450 455 460

Leu Ala Asn Ile Leu Gln Ala Phe Asp Ile Thr Thr Gly Ser Thr Val

465 470 475 480

Asp Met Thr Glu Ser Val Gly Leu Thr Asn Met Lys Ala Thr Pro Leu

485 490 495

Asp Ala Ile Leu Thr Pro Arg Leu Ser Pro Thr Leu Tyr

500 505

<210> 7

<211> 712

<212> PRT

<213> 拟南芥(Arabidopsis thaliana)

<400> 7

Met Ser Ser Ser Ser Ser Ser Ser Thr Ser Met Ile Asp Leu Met Ala

1 5 10 15

Ala Ile Ile Lys Gly Glu Pro Val Ile Val Ser Asp Pro Ala Asn Ala

20 25 30

Ser Ala Tyr Glu Ser Val Ala Ala Glu Leu Ser Ser Met Leu Ile Glu

35 40 45

Asn Arg Gln Phe Ala Met Ile Val Thr Thr Ser Ile Ala Val Leu Ile

50 55 60

Gly Cys Ile Val Met Leu Val Trp Arg Arg Ser Gly Ser Gly Asn Ser

65 70 75 80

Lys Arg Val Glu Pro Leu Lys Pro Leu Val Ile Lys Pro Arg Glu Glu

85 90 95

Glu Ile Asp Asp Gly Arg Lys Lys Val Thr Ile Phe Phe Gly Thr Gln

100 105 110

Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Gly Glu Glu Ala Lys

115 120 125

Ala Arg Tyr Glu Lys Thr Arg Phe Lys Ile Val Asp Leu Asp Asp Tyr

130 135 140

Ala Ala Asp Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asp Val

145 150 155 160

Ala Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn

165 170 175

Ala Ala Arg Phe Tyr Lys Trp Phe Thr Glu Gly Asn Asp Arg Gly Glu

180 185 190

Trp Leu Lys Asn Leu Lys Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln

195 200 205

Tyr Glu His Phe Asn Lys Val Ala Lys Val Val Asp Asp Ile Leu Val

210 215 220

Glu Gln Gly Ala Gln Arg Leu Val Gln Val Gly Leu Gly Asp Asp Asp

225 230 235 240

Gln Cys Ile Glu Asp Asp Phe Thr Ala Trp Arg Glu Ala Leu Trp Pro

245 250 255

Glu Leu Asp Thr Ile Leu Arg Glu Glu Gly Asp Thr Ala Val Ala Thr

260 265 270

Pro Tyr Thr Ala Ala Val Leu Glu Tyr Arg Val Ser Ile His Asp Ser

275 280 285

Glu Asp Ala Lys Phe Asn Asp Ile Asn Met Ala Asn Gly Asn Gly Tyr

290 295 300

Thr Val Phe Asp Ala Gln His Pro Tyr Lys Ala Asn Val Ala Val Lys

305 310 315 320

Arg Glu Leu His Thr Pro Glu Ser Asp Arg Ser Cys Ile His Leu Glu

325 330 335

Phe Asp Ile Ala Gly Ser Gly Leu Thr Tyr Glu Thr Gly Asp His Val

340 345 350

Gly Val Leu Cys Asp Asn Leu Ser Glu Thr Val Asp Glu Ala Leu Arg

355 360 365

Leu Leu Asp Met Ser Pro Asp Thr Tyr Phe Ser Leu His Ala Glu Lys

370 375 380

Glu Asp Gly Thr Pro Ile Ser Ser Ser Leu Pro Pro Pro Phe Pro Pro

385 390 395 400

Cys Asn Leu Arg Thr Ala Leu Thr Arg Tyr Ala Cys Leu Leu Ser Ser

405 410 415

Pro Lys Lys Ser Ala Leu Val Ala Leu Ala Ala His Ala Ser Asp Pro

420 425 430

Thr Glu Ala Glu Arg Leu Lys His Leu Ala Ser Pro Ala Gly Lys Val

435 440 445

Asp Glu Tyr Ser Lys Trp Val Val Glu Ser Gln Arg Ser Leu Leu Glu

450 455 460

Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe

465 470 475 480

Ala Gly Val Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser

485 490 495

Ser Pro Lys Ile Ala Glu Thr Arg Ile His Val Thr Cys Ala Leu Val

500 505 510

Tyr Glu Lys Met Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr

515 520 525

Trp Met Lys Asn Ala Val Pro Tyr Glu Lys Ser Glu Asn Cys Ser Ser

530 535 540

Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro Ser Asp Ser

545 550 555 560

Lys Val Pro Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe

565 570 575

Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Val Glu Ser Gly Val Glu

580 585 590

Leu Gly Pro Ser Val Leu Phe Phe Gly Cys Arg Asn Arg Arg Met Asp

595 600 605

Phe Ile Tyr Glu Glu Glu Leu Gln Arg Phe Val Glu Ser Gly Ala Leu

610 615 620

Ala Glu Leu Ser Val Ala Phe Ser Arg Glu Gly Pro Thr Lys Glu Tyr

625 630 635 640

Val Gln His Lys Met Met Asp Lys Ala Ser Asp Ile Trp Asn Met Ile

645 650 655

Ser Gln Gly Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala

660 665 670

Arg Asp Val His Arg Ser Leu His Thr Ile Ala Gln Glu Gln Gly Ser

675 680 685

Met Asp Ser Thr Lys Ala Glu Gly Phe Val Lys Asn Leu Gln Thr Ser

690 695 700

Gly Arg Tyr Leu Arg Asp Val Trp

705 710

<210> 8

<211> 641

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(641)

<223> AtCPR突变体trAtCPR

<400> 8

Met Arg Arg Ser Gly Ser Gly Asn Ser Lys Arg Val Glu Pro Leu Lys

1 5 10 15

Pro Leu Val Ile Lys Pro Arg Glu Glu Glu Ile Asp Asp Gly Arg Lys

20 25 30

Lys Val Thr Ile Phe Phe Gly Thr Gln Thr Gly Thr Ala Glu Gly Phe

35 40 45

Ala Lys Ala Leu Gly Glu Glu Ala Lys Ala Arg Tyr Glu Lys Thr Arg

50 55 60

Phe Lys Ile Val Asp Leu Asp Asp Tyr Ala Ala Asp Asp Asp Glu Tyr

65 70 75 80

Glu Glu Lys Leu Lys Lys Glu Asp Val Ala Phe Phe Phe Leu Ala Thr

85 90 95

Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe Tyr Lys Trp

100 105 110

Phe Thr Glu Gly Asn Asp Arg Gly Glu Trp Leu Lys Asn Leu Lys Tyr

115 120 125

Gly Val Phe Gly Leu Gly Asn Arg Gln Tyr Glu His Phe Asn Lys Val

130 135 140

Ala Lys Val Val Asp Asp Ile Leu Val Glu Gln Gly Ala Gln Arg Leu

145 150 155 160

Val Gln Val Gly Leu Gly Asp Asp Asp Gln Cys Ile Glu Asp Asp Phe

165 170 175

Thr Ala Trp Arg Glu Ala Leu Trp Pro Glu Leu Asp Thr Ile Leu Arg

180 185 190

Glu Glu Gly Asp Thr Ala Val Ala Thr Pro Tyr Thr Ala Ala Val Leu

195 200 205

Glu Tyr Arg Val Ser Ile His Asp Ser Glu Asp Ala Lys Phe Asn Asp

210 215 220

Ile Asn Met Ala Asn Gly Asn Gly Tyr Thr Val Phe Asp Ala Gln His

225 230 235 240

Pro Tyr Lys Ala Asn Val Ala Val Lys Arg Glu Leu His Thr Pro Glu

245 250 255

Ser Asp Arg Ser Cys Ile His Leu Glu Phe Asp Ile Ala Gly Ser Gly

260 265 270

Leu Thr Tyr Glu Thr Gly Asp His Val Gly Val Leu Cys Asp Asn Leu

275 280 285

Ser Glu Thr Val Asp Glu Ala Leu Arg Leu Leu Asp Met Ser Pro Asp

290 295 300

Thr Tyr Phe Ser Leu His Ala Glu Lys Glu Asp Gly Thr Pro Ile Ser

305 310 315 320

Ser Ser Leu Pro Pro Pro Phe Pro Pro Cys Asn Leu Arg Thr Ala Leu

325 330 335

Thr Arg Tyr Ala Cys Leu Leu Ser Ser Pro Lys Lys Ser Ala Leu Val

340 345 350

Ala Leu Ala Ala His Ala Ser Asp Pro Thr Glu Ala Glu Arg Leu Lys

355 360 365

His Leu Ala Ser Pro Ala Gly Lys Val Asp Glu Tyr Ser Lys Trp Val

370 375 380

Val Glu Ser Gln Arg Ser Leu Leu Glu Val Met Ala Glu Phe Pro Ser

385 390 395 400

Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Gly Val Ala Pro Arg Leu

405 410 415

Gln Pro Arg Phe Tyr Ser Ile Ser Ser Ser Pro Lys Ile Ala Glu Thr

420 425 430

Arg Ile His Val Thr Cys Ala Leu Val Tyr Glu Lys Met Pro Thr Gly

435 440 445

Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys Asn Ala Val Pro

450 455 460

Tyr Glu Lys Ser Glu Asn Cys Ser Ser Ala Pro Ile Phe Val Arg Gln

465 470 475 480

Ser Asn Phe Lys Leu Pro Ser Asp Ser Lys Val Pro Ile Ile Met Ile

485 490 495

Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe Leu Gln Glu Arg

500 505 510

Leu Ala Leu Val Glu Ser Gly Val Glu Leu Gly Pro Ser Val Leu Phe

515 520 525

Phe Gly Cys Arg Asn Arg Arg Met Asp Phe Ile Tyr Glu Glu Glu Leu

530 535 540

Gln Arg Phe Val Glu Ser Gly Ala Leu Ala Glu Leu Ser Val Ala Phe

545 550 555 560

Ser Arg Glu Gly Pro Thr Lys Glu Tyr Val Gln His Lys Met Met Asp

565 570 575

Lys Ala Ser Asp Ile Trp Asn Met Ile Ser Gln Gly Ala Tyr Leu Tyr

580 585 590

Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val His Arg Ser Leu

595 600 605

His Thr Ile Ala Gln Glu Gln Gly Ser Met Asp Ser Thr Lys Ala Glu

610 615 620

Gly Phe Val Lys Asn Leu Gln Thr Ser Gly Arg Tyr Leu Arg Asp Val

625 630 635 640

Trp

<210> 9

<211> 25

<212> DNA

<213> 引物(Primer)

<400> 9

tataccatgg aactgagcag tgtga 25

<210> 10

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 10

ctcgaattcg gatccactag tttaatataa agtcgg 36

<210> 11

<211> 43

<212> DNA

<213> 引物(Primer)

<400> 11

ctttaagaag gagatatacc atggcgatgc cgaagaaaag ctc 43

<210> 12

<211> 63

<212> DNA

<213> 引物(Primer)

<400> 12

ctttaagaag gagatatacc atggctctgt tattagcagt ttttatgccg aagaaaagct 60

ctt 63

<210> 13

<211> 39

<212> DNA

<213> 引物(Primer)

<400> 13

ctttaagaag gagatatacc atggctaaaa tcgaagaag 39

<210> 14

<211> 35

<212> DNA

<213> 引物(Primer)

<400> 14

ctgaaagacg cgcagactat gccgaagaaa agctc 35

<210> 15

<211> 35

<212> DNA

<213> 引物(Primer)

<400> 15

gagcttttct tcggcatagt ctgcgcgtct ttcag 35

<210> 16

<211> 87

<212> DNA

<213> 引物(Primer)

<400> 16

ctttaagaag gagatatacc atggctaaga aaacgagctc taaagggaag ctcccaccag 60

gacctagcat gccgaagaaa agctctt 87

<210> 17

<211> 44

<212> DNA

<213> 引物(Primer)

<400> 17

ctttaagaag gagatatacc atggcggact cagaagtcaa tctt 44

<210> 18

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 18

gagaacagat tggtggtatg ccgaagaaaa gctctt 36

<210> 19

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 19

aagagctttt cttcggcata ccaccaatct gttctc 36

<210> 20

<211> 27

<212> DNA

<213> 引物(Primer)

<400> 20

tataccatgg gtgactgcgt tgccccg 27

<210> 21

<211> 30

<212> DNA

<213> 引物(Primer)

<400> 21

cgggatcctt acttcggcag gtcgccgctc 30

<210> 22

<211> 29

<212> DNA

<213> 引物(Primer)

<400> 22

cgggatccct tatgcgactc ctgcattag 29

<210> 23

<211> 26

<212> DNA

<213> 引物(Primer)

<400> 23

gcccaagctt ttatgccagc atcttc 26

<210> 24

<211> 31

<212> DNA

<213> 引物(Primer)

<400> 24

agatatacat atggttacgg tggaagaata c 31

<210> 25

<211> 30

<212> DNA

<213> 引物(Primer)

<400> 25

ccgctcgagt taggtagcca cactatgcag 30

<210> 26

<211> 30

<212> DNA

<213> 引物(Primer)

<400> 26

ccgctcgagc tagaaataat tttgtttaac 30

<210> 27

<211> 28

<212> DNA

<213> 引物(Primer)

<400> 27

gagcctaggt tagttaccga ttttaaag 28

<210> 28

<211> 38

<212> DNA

<213> 引物(Primer)

<400> 28

gaagatgctg gcataaaagc ttcgatcccg cgaaatta 38

<210> 29

<211> 38

<212> DNA

<213> 引物(Primer)

<400> 29

cgacttaagc attatgcggc cgcctacgcc aggttttc 38

43页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:使用T4噬菌体展示技术高效表达超敏蛋白的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!