一种细胞色素p450 bm3突变体及其在醋酸群勃龙合成中的应用

文档序号：128342 发布日期：2021-10-22 浏览：49次 >En<

阅读说明：本技术 一种细胞色素p450 bm3突变体及其在醋酸群勃龙合成中的应用 (Cytochrome P450BM3 mutant and application thereof in synthesis of trenbolone acetate ) 是由李爱涛彭雅琴高成华赵晶张铮斌李纯于 2021-06-28 设计创作，主要内容包括：本发明公开了一种细胞色素P450BM3突变体及其在醋酸群勃龙合成中的应用,所述细胞色素P450BM3突变体选自：突变体LG-23/T438S,LG-23/T438A和/或LG-23/T438G,氨基酸序列如SEQ ID NO：1,SEQ ID NO:2和SEQ ID NO:3所示,其都是在突变体LG-23的基础上定点突变得到。经验证所述细胞色素P450BM3突变体和LG-23都具有甾体化合物11α羟基化催化活性,可应用于醋酸群勃龙的合成中。使用BM3突变体酶和17β-HSD酶一步法催化4,9物生成11α-羟基甲基双烯醇酮,并结合化学催化生成醋酸群勃龙。本发明提供了一种生物酶催化和化学催化结合合成醋酸群勃龙的方法,不仅简化药物合成步骤,提高催化选择性,减少副产物提高产率,并且反应条件温和,成本低廉,绿色环保高效,对推动我国甾体药物的开发进程有着重要的应用价值。(The invention discloses a cytochrome P450BM3 mutant and application thereof in synthesis of trenbolone acetate, wherein the cytochrome P450BM3 mutant is selected from the following components: the mutants LG-23/T438S, LG-23/T438A and/or LG-23/T438G have amino acid sequences shown in SEQ ID NO:1, SEQ ID NO 2 and SEQ ID NO 3, which are obtained by site-directed mutagenesis on the basis of the mutant LG-23. The cytochrome P450BM3 mutant and LG-23 are proved to have catalytic activity of steroid 11 alpha hydroxylation and can be applied to synthesis of trenbolone acetate. BM3 mutant enzyme and 17 beta-HSD enzyme are used to catalyze the 4,9 product to generate 11 alpha-hydroxymethyl dienolone in one step, and the trenbolone acetate is generated by combining chemical catalysis. The invention provides a method for synthesizing trenbolone acetate by combining biological enzyme catalysis and chemical catalysis, which simplifies the drug synthesis steps, improves the catalytic selectivity, reduces byproducts, improves the yield, has mild reaction conditions, low cost, environmental protection and high efficiency, and has important application value for promoting the development process of steroid drugs in China.)

一种细胞色素P450 BM3突变体及其在醋酸群勃龙合成中的应用

技术领域

本发明属于生物催化酶技术领域，具体涉及一种细胞色素P450 BM3突变体及其在醋酸群勃龙合成中的应用。

背景技术

甾体激素类药物是世界上仅次于抗生素的第二大类药物，广泛应用于治疗炎症、心血管疾病、肿瘤、皮肤病、内分泌失调、老年性疾病等疾病。我国天然甾体资源丰富，生产规模、产品质量已接近世界先进水平，但甾体药物研发技术水平仍有一定的差距，主要原因是甾体药物的合成步骤繁琐，反应复杂，基团的远程效应十分明显，收率低，特别是分离纯化困难。

甾体激素按生理活性可分为三大类：蛋白同化激素、肾上腺皮质激素和性激素。其中蛋白同化激素俗称合成类，是一类拟雄性激素的人工合成的甾体激素，通过对雄性激素进行结构改造，从而降低雄激素活性，提高蛋白同活性，且用药后易吸收，血中浓度高，体内活性大，具有多种作用。醋酸群勃龙属于蛋白同化素的一种，在临床上应用广泛，它能迅速增加肌肉力量和围度，提高肌肉质量。此外，醋酸群勃龙可预防疯牛病，国内外市场需求量日益增大。

传统醋酸群勃龙的生产工艺以4，9(11)-二烯雄甾3-17-二酮为原料，以对甲苯磺酸或乙酰氯为催化剂，对3-位羰基进行保护，再采取还原、脱氢进行、水解得到群勃龙；最后群勃龙和乙酸酐进行酯化反应，得到群勃龙醋酸酯。然而该路线副产物多，质量低、收率低，不利于大规模生产应用。

现有技术公开了一种以4，9物(雌甾-4,9-二烯-3,17-二酮，CAS：5173-46-6)为原料，通过3位二甲基醚化、17位还原、3位水解、11,12位脱氢、17位酯化，共5步化学反应，制备醋酸群勃龙的方法，然而该生产路线中使用的乙酰氯，有强烈刺激性和腐蚀性，加水终止反应后生成醋酸，废水很难处理，且后续还原水解反应都是反应终止后溶剂替换，多次水洗，操作复杂且废水量非常大，并且收率不高，其总收率为63.1％。

专利CN108017682A公开了一种醋酸群勃龙的合成方法，其在现有技术的基础上经脱氢和酯化即可得到醋酸群勃龙，通过优化反应路线和条件，得到一条新的醋酸群勃龙的合成路线。然而该专利采用的化学合成路径仍存在存在步骤繁琐，效率低，反应复杂，副产物多且提纯分离困难等问题，还会产生大量污染废弃物。因此如何提高反应选择性，减少副产物，并维持温和的反应条件以及低成本，是目前亟待解决的重要难题。

发明内容

本发明针对现有技术的缺陷，提供了一种对雌甾-4,9-二烯-3,17-二酮(4,9物)和甲基双烯醇酮具有11α羟基化作用的P450 BM3突变体酶，从廉价易得的4,9物出发，使用P450 BM3突变体酶和17β羟类脱氢酶(17β-HSD酶)一步法催化4,9物生成11α-羟基甲基双烯醇酮，并使用GDH酶进行辅因子NADPH的再生和循环，进一步结合化学催化反应生成醋酸群勃龙。生物酶催化的选择性高，副产物少，反应条件温和，成本低廉，绿色环保高效，通过将生物酶催化和化学催化结合，可更高效快速地合成醋酸群勃龙。

为实现上述目的，本发明采用的技术方案是：

本发明的目的之一在于提供一种细胞色素P450 BM3突变体，，所述细胞色素P450BM3突变体选自：突变体LG-23/T438S，LG-23/T438A和/或LG-23/T438G，所述突变体LG-23/T438S的氨基酸序列如SEQ ID NO：1所示，所述突变体LG-23/T438A的氨基酸序列如SEQ IDNO:2所示，所述突变体LG-23/T438G的氨基酸序列如SEQ ID NO:3所示。

进一步地，所述突变体LG-23/T438S，LG-23/T438A和LG-23/T438G是在突变体LG-23的基础上，分别将第438位的苏氨酸突变为丝氨酸，丙氨酸和甘氨酸。

本发明的目的之二在于提供了一种编码所述细胞色素P450 BM3突变体的的基因，所述突变体LG-23/T438S基因的核苷酸序列如SEQ ID NO：4所示，所述突变体LG-23/T438A基因的核苷酸序列如SEQ ID NO:5所示，所述突变体LG-23/T438G基因的核苷酸序列如SEQID NO:6所示。

本发明的目的之三在于提供了一种载体，所述载体中包含上述细胞色素P450 BM3突变体的的基因。

本发明的目的之四在于提供了一种细胞，所述细胞中包含上述载体。

本发明的目的之五在于提供了所述细胞色素P450 BM3突变体，或所述突变体LG-23，或上述载体，或上述细胞在催化甾体化合物11α羟基化中的应用。

进一步地，所述甾体化合物包括但不限于雌甾-4,9-二烯-3,17-二酮和/或甲基双烯醇酮。

本发明的目的之六在于提供了所述细胞色素P450 BM3突变体，或所述突变体LG-23，或上述载体，或上述细胞在醋酸群勃龙合成中的应用。

本发明的目的之七在于提供了一种醋酸群勃龙的合成方法，包括以下步骤：

步骤1、将雌甾-4,9-二烯-3,17-二酮在所述细胞色素P450 BM3突变体或所述突变体LG-23、以及17β羟类脱氢酶和葡萄糖脱氢酶的作用下，生成11α-羟基甲基双烯醇酮；

步骤2、将所述11α-羟基甲基双烯醇酮与一水合对甲基苯磺酸反应，并用三氯甲烷萃取得到群勃龙；

步骤3、将所述群勃龙与4-二甲氨基吡啶和醋酐进行酯化反应，制得醋酸群勃龙。

进一步地，步骤1具体为：将共表达或分别表达细胞色素P450 BM3突变体和17β羟类脱氢酶的遗传工程菌，用缓冲液溶解，加入葡萄糖脱氢酶、底物雌甾-4,9-二烯-3,17-二酮、辅因子NADP⁺、葡萄糖，20～30℃条件下反应完全，加入乙酸乙酯萃取反应液后得到乙酸乙酯萃取液，经无水硫酸钠脱水，抽滤，减压浓缩后，得到11α-羟基甲基双烯醇酮粗品。

进一步地，步骤1中将细胞色素P450 BM3突变体的编码基因和17β羟类脱氢酶的编码基因按前后顺序通过RBS序列可操作地连接于表达调控序列，得到两个酶基因共表达的表达载体。

进一步地，将上述共表达的表达载体转入大肠杆菌中，得到共表达遗传工程菌。

进一步地，步骤1中用助溶剂二甲基甲酰胺(DMF)配制底物雌甾-4,9-二烯-3,17-二酮母液。

进一步地，所述共表达遗传工程菌的OD₆₀₀为20～30，雌甾-4,9-二烯-3,17-二酮的摩尔浓度为1mM，DMF含量为1％(v/v)，NADP⁺摩尔浓度为0.5mM，葡萄糖脱氢酶酶活终浓度为1U/mL，葡萄糖含量为5％(m/v)。

进一步地，将葡萄糖脱氢酶编码基因单独连接于表达调控序列，得到葡萄糖脱氢酶基因的表达载体。

进一步地，步骤2具体为：将所述11α-羟基甲基双烯醇酮粗品溶解于三氯甲烷中，加入一水合对甲基苯磺酸，室温搅拌至反应完全，加入饱和碳酸钠终止反应，并用三氯甲烷萃取反应液后得到三氯甲烷萃取液，经无水硫酸钠脱水，抽滤，减压浓缩并柱层析分离纯化并浓缩干燥后，得到群勃龙。

进一步地，步骤2中，11α-羟基甲基双烯醇酮：三氯甲烷：一水合对甲基苯磺酸的质量比为1:25～35:0.6～0.8。

进一步地，步骤3具体为：将群勃龙溶解于二氯甲烷，加入4-二甲氨基吡啶(DMAP)和醋酐，控温20～25℃搅拌反应至反应完全，加入碳酸钠溶液洗涤至pH 8～9，以二氯甲烷萃取水相；合并全部二氯甲烷，无水硫酸钠脱水，抽滤，减压浓缩至无馏出液后，加入异丙醚夹带馏出残余的二氯甲烷，馏出全部二氯甲烷后再加入异丙醚，降温析晶、离心，烘干，得到醋酸群勃龙。

进一步地，群勃龙：二氯甲烷：DMAP：醋酐的质量比为1：15～25：0.01～0.1：0.8～1.2。

与现有技术相比，本发明的有益效果是：本发明首次提供了一种P450 BM3突变体酶：突变体LG-23/T438S，LG-23/T438A和LG-23/T438G，其是在突变体LG-23的基础上，将第438位的苏氨酸分别突变为丝氨酸，丙氨酸和甘氨酸得到的，经验证，突变体LG-23/T438S，LG-23/T438A，LG-23/T438G以及突变体LG-23都具有催化甾体化合物11α羟基化的作用，可将其应用于醋酸群勃龙的合成中，从廉价易得的4，9物出发，使用P450 BM3突变体酶和17β-HSD酶一步法催化4,9物生成11α-羟基甲基双烯醇酮，并使用GDH酶进行辅因子NADPH的再生和循环，进一步结合化学催化反应生成醋酸群勃龙。即本发明提供了一种将生物酶催化和化学催化结合合成醋酸群勃龙的方法，该方法不仅简化药物的合成步骤，显著提高催化选择性，减少副产物提高产率，并且反应条件温和，成本低廉，绿色环保高效，对推动我国甾体药物的开发进程有着重要的生产应用价值。

附图说明

图1为本发明实施例1中突变体LG-23和LG-23/T438S催化4,9物或甲基双烯醇酮11α羟基化的HPLC分析结果图；

图2为本发明实施例2中共表达P450 BM3-LG-23/T438S和17β-HSDcl的大肠杆菌全细胞催化4,9物转化为11α-羟基甲基双烯醇酮的反应过程和检测结果；

图3为本发明实施例3中生物酶催化和化学催化结合生成醋酸群勃龙的反应流程图；

图4为本发明实施例3中制备得到的11α-羟基甲基双烯醇酮的LC/MS分析图谱。

具体实施方式

下面将结合本发明中的实施例，对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动条件下所获得的所有其它实施例，都属于本发明保护的范围。

实施例1 P450 BM3酶突变体LG-23的定点突变和功能验证

1、突变体LG-23的定点突变

本实施例在现有技术已知的，具有甾体7β羟基化活性的P450 BM3酶突变体LG-23(Li A,Acevedo-Rocha C G,D'Amore L,et al.Regio-and Stereoselective SteroidHydroxylation at the C7-Position by Cytochrome P450 Monooxygenase Mutants[J].Angewandte Chemie International Edition,2020)的基础上，使用表达突变体LG-23的质粒载体pRSFDuet-LG-23作为模板，利用引物PCR诱变技术对突变体LG-23的基因进行定点诱变，将其第438位苏氨酸分别突变为丝氨酸，丙氨酸和甘氨酸，针对突变位点设计一对引物，其中质粒载体pRSFDuet-LG-23为本单位已有。

本实施例以突变体LG-23/T438S为例，提供了定点诱变获得突变体LG-23/T438S时可使用的突变引物(如序列表SEQ ID NO:7-8所示)：

上游引物：5’-TTAAAGAAACTTTATCTTTAAAACCTGAAGGCTTTG-3’，

下游引物：5’-ATTTCCGGCGTGTGAATCAAGCG-3’，

其中加粗序列为突变位点。

PCR体系(20μL)为：模板0.1～1ng，一对突变引物各1μL(10μM)，5μL Prime STARMax DNA聚合酶，加灭菌蒸馏水至20μL。

PCR反应程序为：(1)98℃预变性3min；(2)98℃变性10sec，(3)56℃退火15sec，(4)72℃延伸70sec，步骤(2)～(4)共进行28个循环，最后72℃延伸5min，8℃保藏产物。

扩增得到的PCR产物用0.7％的琼脂糖凝胶电泳进行检测，观察到了一条与P450BM3基因长度相当条带，由此判断编码目的突变体的基因已被扩增出来，故直接往PCR产物中加入限制性内切酶Dpn I，37℃消化3～5h后转化E.coli DH5ɑ感受态细胞，加培养基复苏1h后均匀涂布至含有50μl/mg卡那霉素的固体LB平板。37℃过夜培养后，挑选单克隆至3mL含有50μl/mg卡那霉素的LB液体培养基进行培养，然后送测序公司进行测序得到正确的突变体，将其命名为LG-23/T438S，其编码序列突变位点包括：R47W/S72W/F77Y/V78L/F81I/A82L/F87G/T88S/M177T/M185Q/I209T/A328G/A330W/T438S，所述突变体LG-23/T438S的氨基酸序列如序列表SEQ ID NO:1所示，核苷酸序列如序列表SEQ ID NO:4所示。

采用与上述类似的方法分别设计突变引物，将第438位苏氨酸突变为丙氨酸获得突变体LG-23/T438A，其氨基酸序列如序列表SEQ ID NO:2所示，核苷酸序列如序列表SEQID NO:5所示；将第438位苏氨酸突变为甘氨酸获得突变体LG-23/T438G，其氨基酸序列如序列表SEQ ID NO:3所示，核苷酸序列如序列表SEQ ID NO:6所示。

2、功能验证

将上述得到的质粒pRSFDuet-LG-23/T438S、pRSFDuet-LG-23/T438A以及pRSFDuet-LG-23/T438G分别转化E.coli BL21感受态细胞，加培养基复苏1h后均匀涂布至含有50μl/mg卡那霉素的固体LB平板，以及将保存于-80℃的包含LG-23的E.coli BL21甘油管菌划线于含有50μl/mg卡那霉素的固体LB平板，37℃过夜培养。挑选单克隆至2mL含有50μl/mg卡那霉素的液体LB培养基中，37℃振荡培养过夜，取500μL菌液接入装有50mL TB培养基的100mL三角瓶中，置于37℃，220rpm摇床振荡培养，当培养液的吸光度OD₆₀₀达到0.8时，加入终浓度为0.2mM的IPTG诱导表达，诱导温度为25℃，诱导16～20小时。培养液4000rpm，4℃离心10min，收集细胞，并用100mM的磷酸钾缓冲液(pH8.0)洗涤一次，将细胞于-80℃保存。

将细胞用10mL pH 8.0的100m M的磷酸钾缓冲液(含有5％葡萄糖，5％甘油，0.5mMNADP⁺，10U GDH)重悬于50mL离心管中，立即在液氮中速冻。然后将其放置于水中于室温解冻至融化后，取5mL菌悬液于50mL三角瓶中，加入50uL甾体底物母液(用DMF配制成100mM母液)，于25℃，220rpm条件反应5小时。间隔时间取样，反应液用等体积乙酸乙酯萃取，高速离心3min，取上层乙酸乙酯转入干净的EP管中，挥发完全后用等体积乙腈重悬，用0.22μm的滤膜过滤至进样瓶中，采用HPLC检测反应的转化速率和产物分布。

色谱柱为ZORBAX SB C18(250×4.6mm)柱，流动相为乙腈/超纯水：2min(10:90)，2～15min(70:20)，15～17min(10:90)；柱温为40℃，流速为1.5mL/min，进样量为10μL。甲基双烯醇酮和雌甾-4,9-二烯-3,17-二酮(4,9物)以及羟基化产物紫外检测波长都为310nm。

P450 BM3突变体LG-23，LG-23/T438S，LG-23/T438A和LG-23/T438G催化浓度为1mM(0.27g/L)的4,9物或甲基双烯醇酮11α羟基化的数据如表1所示，HPLC分析结果如图1所示。

表1细胞色素P450 BM3突变体催化甾体11α羟基化

根据图1，P450 BM3突变体LG-23，LG-23/T438S，LG-23/T438S，LG-23/T438A或LG-23/T438G催化4,9物或甲基双烯醇酮11α羟基化的方程式分别如(1)和(2)所示。

根据表1的结果，相对于突变体LG-23对甲基双烯醇酮78％的11α羟基化选择性，突变体LG-23/T438S，LG-23/T438A和LG-23/T438G对甲基双烯醇酮的11α羟基化选择性均有所提高，其中突变体LG-23/T438S对甲基双烯醇酮的11α羟基化选择性提高到了92％。对于4,9物，突变体LG-23/T438S也比LG-23的11α羟基化选择性略高。结果表明，突变体LG-23/T438S催化甾体11α羟基化的效果相对更好，后续以突变体LG-23/T438S为例，进行醋酸群勃龙的合成。

实施例2共表达重组质粒的构建和GDH粗酶冻干粉的制备

虽然可以直接使用该突变体LG-23/T438S或LG-23对甲基双烯醇酮进行11α羟基化生成11α-羟基甲基双烯醇酮，然后再使用化学法两步合成醋酸群勃龙。但考虑原料4,9物更廉价，于是结合可将甾体17位酮还原成羟基的17β-羟基甾体脱氢酶(17β-HSD)，从更廉价易得的4,9物出发，使用突变体LG-23/T438S和17β-HSD酶一步法催化4,9物生成11α-羟基甲基双烯醇酮，并使用葡萄糖脱氢酶进行辅因子NADPH的再生和循环。

其中17β-HSD为来自新月弯孢霉菌(Cochliobolus lunatus)的甾体17β羟基脱氢酶17β-HSDcl酶，催化方程式如(3)或(4)所示：

葡萄糖脱氢酶为来自巨大芽孢杆菌(Priestia megaterium)的葡萄糖脱氢酶(GDH酶)，其催化方程式如(5)所示：

(5)葡萄糖+NADP⁺→葡萄糖酸内酯+NADPH

为催化4,9物一步法生成11α-羟基甲基双烯醇酮，可分别克隆上述三种酶的基因，并在宿主中表达；也可以将突变体LG-23/T438S酶基因和17β-HSDcl酶基因转入同一宿主细胞内，使其共表达，利用单细胞系统实现底物的催化与转化；并使GDH酶基因单独表达，使用其破菌上清粗酶催化实现辅因子NADPH的再生和循环。

1、共表达LG-23/T438S酶和17β-HSDcl酶的重组表达载体构建方法

使用含有20bp同源末端的引物(RBS序列位于其中)PCR扩增编码17β-HSDcl酶的基因和实施例1中得到的质粒载体pRSFDuet-LG-23/T438S，从而使其线性化。随后17β-HSDcl酶基因和线性化的载体在T5外切酶的作用下形成20bp的粘性末端从而连接在一起。首先设计含有同源末端的引物。

线性化载体pRSFDuet-LG-23/T438S引物为(SEQ ID NO:9-10)：

上游引物:5’-TAACCTAGGCTGCTGCCACCGC-3’；

下游引物:5’-GATATATCTCCTTAGGTACCTTACCCAGCCCACACGTC-3’；

采用常规PCR扩增获得线性化载体pRSFDuet-LG-23/T438S；

17β-HSDcl酶基因片段扩增引物为(SEQ ID NO:11-12)：

上游引物：5’-TGGTACCTAAGGAGATATATCATGCCGCACGTGGAGAAC-3’；

下游引物：5’-GGTGGCAGCAGCCTAGGTTATTAGGCGGCGCCGCCGTC-3’；

采用常规PCR扩增获得17β-HSDcl酶基因片段。

通过琼脂糖凝胶电泳电泳对PCR产物的片段大小和纯度进行确认，将目的核酸片段进行琼脂糖凝胶电泳回收，通过微量分光光度计对回收的核酸样品进行浓度和纯度检测。利用T5核酸外切酶连接回收的17β-HSDcl酶基因片段和质粒载体片段，具体为：在5μL反应体系中按照摩尔比3:1加入目的片段和线性化载体(控制线性化载体的量为30～50ng)，再加入0.5μL T5外切酶和1μL NE buffer，加入灭菌蒸馏水补至5μL。加入T5外切酶后严格计时5min，时间到后立即加入50μL E.coli DH5α感受态细胞按照常规转化的基本步骤进行转化，加培养基复苏1h后均匀涂布至含有50μl/mg卡那霉素的固体LB平板。37℃过夜培养后，挑选单克隆至3mL含有50μl/mg卡那霉素的LB液体培养基进行培养，然后送测序公司进行测序得到正确的重组质粒，将其命名为：pRSFDuet-LG-23/T438S_17β-HSDcl。

2、共表达重组质粒的功能验证

将所述共表达重组质粒pRSFDuet-LG-23/T438S_17β-HSDcl转化E.coli BL21感受态细胞，加培养基复苏1h后均匀涂布至含有50μl/mg卡那霉素的固体LB平板，37℃过夜培养。后续养菌方法和反应条件同实施例1的功能验证部分，共表达P450 BM3-LG-23/T438S和17β-HSDcl的大肠杆菌全细胞催化4,9物转化为11α-羟基甲基双烯醇酮的反应过程和检测结果如图2所示，其中图2-a为反应流程图，图中1表示4,9物，1a表示11α-羟基4,9物，1b表示甲基双烯醇酮，2表示11α-羟基甲基双烯醇酮；图2-b为反应0min，5min，20min和120min的HPLC分析结果；图2-c为随着反应时间各个甾体物质的相对占比。

结果显示，当反应时间达到2小时，底物4,9物已全部转化生成11α-羟基甲基双烯醇酮，产物占比达到90％，且中间产物11α-羟基4,9物和甲基双烯醇酮基本无残留。

3、葡萄糖脱氢酶GDH粗酶冻干粉的制备

将来自巨大芽孢杆菌(Priestia megaterium)的GDH酶基因采用本领域常规方法转入E.coli BL21中，IPTG诱导表达，诱导温度为25℃，诱导14～16h。培养液4000rpm，4℃离心10min，收集细胞，并用100mM的磷酸钾缓冲液(pH8.0)洗涤一次后用一定体积的100mM的磷酸钾缓冲液(pH 8.0)重悬于50mL摇菌管中，置于冰水混合物中超声破碎(功率350W，工作时间2s，间隔时间4s，15min)，待溶液变澄清透亮，9000rpm，4℃离心30min分离得到破碎上清和细胞沉淀，小体积分装于培养皿中于真空冷冻干燥机冻干至粉末状，于-20℃可长期保存。若无大量长期需求，也可直接用GDH破菌上清液体进行实验，将破菌上清保存于-80℃可短期内使用。

对获得的GDH粗酶冻干粉进行酶活测定，具体操作如下：将1mg GDH粗酶冻干粉溶于940uL 100mM磷酸钾缓冲液(pH 8.0)于比色皿，加入20uL 50mM NADP⁺，用分光光度计在340nm进行1min的时间扫描，作为空白对照；在向比色皿中加入20uL 50％的葡萄糖后迅速混匀后立即进行时间扫描，并根据NADPH浓度和340nm吸光值的标曲计算所1min内生成的NADPH的物质的量(umol)。实验重复三次。计算GDH酶活,若生成的NADPH的物质的量为Xumol，则GDH冻干粉酶活为X U/mg。

实施例3醋酸群勃龙的合成

本实施例采用生物酶催化和化学催化结合生成醋酸群勃龙，首先生物酶一步法催化4,9物生成11α-羟基甲基双烯醇酮，再采用化学脱水生成群勃龙，最后群勃龙和醋酸酐进行酯化反应得到醋酸群勃龙，反应流程图如图3所示。

具体实验过程包括：

1、羟基化/还原反应

将实施例2培养所得的共表达P450 BM3-LG-23/T438S和17β-HSDcl的大肠杆菌全细胞，用4L pH为8.0的100mM磷酸钾缓冲液重悬(OD₆₀₀为20～30)，加于10L反应罐中，25℃，400rpm搅拌。1g 4,9物溶解于40mL DMF中后投入反应罐中，加入0.7g NADP⁺，100g葡萄糖，2000U GDH粗酶，加毕，25℃搅拌反应2～3小时至TLC分析原料反应完全。然后分别加入4L乙酸乙酯萃取反应液三次，合并全部乙酸乙酯萃取液，无水硫酸钠脱水，抽滤，减压浓缩至无馏出液，得到11α-羟基甲基双烯醇酮(Ⅱ)粗品，其LC/MS分析图谱如图3所示。

2、脱水反应

将上述11α-羟基甲基双烯醇酮(Ⅱ)粗品全部溶解于25mL三氯甲烷中，加入0.66g一水合对甲基苯磺酸，室温搅拌反应至TLC分析原料反应完全，加入10mL饱和碳酸钠溶液终止反应。随后用10mL三氯甲烷萃取水相两遍；合并全部三氯甲烷，无水硫酸钠脱水，抽滤，减压浓缩至小体积，随后用硅胶柱层析分离纯化目标产物，将收集的层析液减压浓缩至干燥，得到群勃龙(Ⅲ)0.729g，质量收率为72.9％(以4,9物计)，HPLC含量为98.3％。

3、酯化反应

取1g群勃龙(Ⅲ)，溶解于15mL二氯甲烷，加入二甲基氨基吡啶(DMAP)25mg和醋酐1.2g，控温20～25℃搅拌反应2小时，TLC分析原料反应完全，5％碳酸钠水溶液10mL洗涤，随后用10mL二氯甲烷萃取水相两遍；合并全部二氯甲烷，无水硫酸钠脱水，抽滤，减压浓缩至无馏出液，加入异丙醚夹带，再加入2mL异丙醚，降温析晶，离心。烘干，得醋酸群勃龙1.066g，质量收率106.6％，HPLC含量≥99.0％，总质量收率为77.7％(以4,9物计)。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

序列表

<110> 湖北大学

<120> 一种细胞色素P450 BM3突变体及其在醋酸群勃龙合成中的应用

<160> 12

<170> SIPOSequenceListing 1.0

<210> 1

<211> 1048

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 1

Ala Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys Asn

1 5 10 15

Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys Ile

20 25 30

Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Trp Val

35 40 45

Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp Glu

50 55 60

Ser Arg Phe Asp Lys Asn Leu Trp Gln Ala Leu Lys Tyr Leu Arg Asp

65 70 75 80

Ile Leu Gly Asp Gly Leu Gly Ser Ser Trp Thr His Glu Lys Asn Trp

85 90 95

Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala Met

100 105 110

Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val Gln

115 120 125

Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu Asp

130 135 140

Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn Tyr

145 150 155 160

Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr Ser

165 170 175

Thr Val Arg Ala Leu Asp Glu Ala Gln Asn Lys Gln Gln Arg Ala Asn

180 185 190

Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu Asp

195 200 205

Thr Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg Lys

210 215 220

Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn Gly

225 230 235 240

Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg Tyr

245 250 255

Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly Leu

260 265 270

Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu Gln

275 280 285

Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro Ser

290 295 300

Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn Glu

305 310 315 320

Ala Leu Arg Leu Trp Pro Thr Gly Pro Trp Phe Ser Leu Tyr Ala Lys

325 330 335

Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp Glu

340 345 350

Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp Gly

355 360 365

Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser Ala

370 375 380

Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala Cys

385 390 395 400

Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly Met

405 410 415

Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu Asp

420 425 430

Ile Lys Glu Thr Leu Ser Leu Lys Pro Glu Gly Phe Val Val Lys Ala

435 440 445

Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr Glu

450 455 460

Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn Thr

465 470 475 480

Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly Thr

485 490 495

Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro Gln

500 505 510

Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly Ala

515 520 525

Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn Ala

530 535 540

Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val Lys

545 550 555 560

Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala Thr

565 570 575

Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala Lys

580 585 590

Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp Asp

595 600 605

Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp Val

610 615 620

Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys Ser

625 630 635 640

Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu Ala

645 650 655

Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu Leu

660 665 670

Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu Leu

675 680 685

Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile Pro

690 695 700

Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly Leu

705 710 715 720

Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu Ala

725 730 735

His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln Tyr

740 745 750

Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met Ala

755 760 765

Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu Leu

770 775 780

Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr Met

785 790 795 800

Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser Glu

805 810 815

Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile Ser

820 825 830

Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser Val

835 840 845

Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile Ala

850 855 860

Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys Phe

865 870 875 880

Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu Thr

885 890 895

Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg Gly

900 905 910

Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu Gly

915 920 925

Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr Leu

930 935 940

Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr Leu

945 950 955 960

His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val Gln

965 970 975

His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp Gln

980 985 990

Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro Ala

995 1000 1005

Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln Val Ser

1010 1015 1020

Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu Lys Gly Arg

1025 1030 1035 1040

Tyr Ala Lys Asp Val Trp Ala Gly

1045

<210> 2

<211> 1048

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Ala Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys Asn

1 5 10 15

Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys Ile

20 25 30

Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Trp Val

35 40 45

Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp Glu

50 55 60

Ser Arg Phe Asp Lys Asn Leu Trp Gln Ala Leu Lys Tyr Leu Arg Asp

65 70 75 80

Ile Leu Gly Asp Gly Leu Gly Ser Ser Trp Thr His Glu Lys Asn Trp

85 90 95

Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala Met

100 105 110

Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val Gln

115 120 125

Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu Asp

130 135 140

Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn Tyr

145 150 155 160

Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr Ser

165 170 175

Thr Val Arg Ala Leu Asp Glu Ala Gln Asn Lys Gln Gln Arg Ala Asn

180 185 190

Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu Asp

195 200 205

Thr Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg Lys

210 215 220

Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn Gly

225 230 235 240

Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg Tyr

245 250 255

Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly Leu

260 265 270

Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu Gln

275 280 285

Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro Ser

290 295 300

Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn Glu

305 310 315 320

Ala Leu Arg Leu Trp Pro Thr Gly Pro Trp Phe Ser Leu Tyr Ala Lys

325 330 335

Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp Glu

340 345 350

Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp Gly

355 360 365

Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser Ala

370 375 380

Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala Cys

385 390 395 400

Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly Met

405 410 415

Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu Asp

420 425 430

Ile Lys Glu Thr Leu Ala Leu Lys Pro Glu Gly Phe Val Val Lys Ala

435 440 445

Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr Glu

450 455 460

Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn Thr

465 470 475 480

Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly Thr

485 490 495

Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro Gln

500 505 510

Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly Ala

515 520 525

Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn Ala

530 535 540

Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val Lys

545 550 555 560

Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala Thr

565 570 575

Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala Lys

580 585 590

Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp Asp

595 600 605

Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp Val

610 615 620

Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys Ser

625 630 635 640

Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu Ala

645 650 655

Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu Leu

660 665 670

Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu Leu

675 680 685

Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile Pro

690 695 700

Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly Leu

705 710 715 720

Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu Ala

725 730 735

His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln Tyr

740 745 750

Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met Ala

755 760 765

Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu Leu

770 775 780

Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr Met

785 790 795 800

Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser Glu

805 810 815

Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile Ser

820 825 830

Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser Val

835 840 845

Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile Ala

850 855 860

Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys Phe

865 870 875 880

Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu Thr

885 890 895

Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg Gly

900 905 910

Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu Gly

915 920 925

Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr Leu

930 935 940

Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr Leu

945 950 955 960

His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val Gln

965 970 975

His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp Gln

980 985 990

Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro Ala

995 1000 1005

Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln Val Ser

1010 1015 1020

Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu Lys Gly Arg

1025 1030 1035 1040

Tyr Ala Lys Asp Val Trp Ala Gly

1045

<210> 3

<211> 1048

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Ala Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys Asn

1 5 10 15

Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys Ile

20 25 30

Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Trp Val

35 40 45

Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp Glu

50 55 60

Ser Arg Phe Asp Lys Asn Leu Trp Gln Ala Leu Lys Tyr Leu Arg Asp

65 70 75 80

Ile Leu Gly Asp Gly Leu Gly Ser Ser Trp Thr His Glu Lys Asn Trp

85 90 95

Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala Met

100 105 110

Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val Gln

115 120 125

Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu Asp

130 135 140

Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn Tyr

145 150 155 160

Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr Ser

165 170 175

Thr Val Arg Ala Leu Asp Glu Ala Gln Asn Lys Gln Gln Arg Ala Asn

180 185 190

Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu Asp

195 200 205

Thr Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg Lys

210 215 220

Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn Gly

225 230 235 240

Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg Tyr

245 250 255

Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly Leu

260 265 270

Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu Gln

275 280 285

Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro Ser

290 295 300

Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn Glu

305 310 315 320

Ala Leu Arg Leu Trp Pro Thr Gly Pro Trp Phe Ser Leu Tyr Ala Lys

325 330 335

Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp Glu

340 345 350

Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp Gly

355 360 365

Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser Ala

370 375 380

Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala Cys

385 390 395 400

Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly Met

405 410 415

Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu Asp

420 425 430

Ile Lys Glu Thr Leu Gly Leu Lys Pro Glu Gly Phe Val Val Lys Ala

435 440 445

Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr Glu

450 455 460

Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn Thr

465 470 475 480

Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly Thr

485 490 495

Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro Gln

500 505 510

Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly Ala

515 520 525

Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn Ala

530 535 540

Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val Lys

545 550 555 560

Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala Thr

565 570 575

Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala Lys

580 585 590

Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp Asp

595 600 605

Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp Val

610 615 620

Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys Ser

625 630 635 640

Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu Ala

645 650 655

Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu Leu

660 665 670

Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu Leu

675 680 685

Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile Pro

690 695 700

Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly Leu

705 710 715 720

Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu Ala

725 730 735

His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln Tyr

740 745 750

Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met Ala

755 760 765

Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu Leu

770 775 780

Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr Met

785 790 795 800

Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser Glu

805 810 815

Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile Ser

820 825 830

Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser Val

835 840 845

Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile Ala

850 855 860

Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys Phe

865 870 875 880

Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu Thr

885 890 895

Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg Gly

900 905 910

Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu Gly

915 920 925

Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr Leu

930 935 940

Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr Leu

945 950 955 960

His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val Gln

965 970 975

His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp Gln

980 985 990

Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro Ala

995 1000 1005

Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln Val Ser

1010 1015 1020

Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu Lys Gly Arg

1025 1030 1035 1040

Tyr Ala Lys Asp Val Trp Ala Gly

1045

<210> 4

<211> 3147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

gcaattaaag aaatgcctca gccaaaaacg tttggagagc ttaaaaattt accgttatta 60

aacacagata aaccggttca agctttgatg aaaattgcgg atgaattagg agaaatcttt 120

aaattcgagg cgcctggttg ggtaacgcgc tacttatcaa gtcagcgtct aattaaagaa 180

gcatgcgatg aatcacgctt tgataaaaac ttatggcaag cgcttaaata cctaagagac 240

atcctaggag acgggttagg atcaagctgg acgcatgaaa aaaattggaa aaaagcgcat 300

aatatcttac ttccaagctt cagtcagcag gcaatgaaag gctatcatgc gatgatggtc 360

gatatcgccg tgcagcttgt tcaaaagtgg gagcgtctaa atgcagatga gcatattgaa 420

gtaccggaag acatgacacg tttaacgctt gatacaattg gtctttgcgg ctttaactat 480

cgctttaaca gcttttaccg agatcagcct catccattta ttacaagtac ggtccgtgca 540

ctggatgaag cacaaaacaa gcaacagcga gcaaatccag acgacccagc ttatgatgaa 600

aacaagcgcc agttccaaga agatacaaag gtgatgaacg acctagtaga taaaattatt 660

gcagatcgca aagcaagcgg tgaacaaagc gatgatttat taacgcatat gctaaacgga 720

aaagatccag aaacgggtga gccgcttgat gacgagaaca ttcgctatca aattattaca 780

ttcttaattg cgggacacga aacaacaagt ggtcttttat catttgcgct gtatttctta 840

gtgaaaaatc cacatgtatt acaaaaagca gcagaagaag cagcacgagt tctagtagat 900

cctgttccaa gctacaaaca agtcaaacag cttaaatatg tcggcatggt cttaaacgaa 960

gcgctgcgct tatggccaac tggtccttgg ttttccctat atgcaaaaga agatacggtg 1020

cttggaggag aatatccttt agaaaaaggc gacgaactaa tggttctgat tcctcagctt 1080

caccgtgata aaacaatttg gggagacgat gtggaagagt tccgtccaga gcgttttgaa 1140

aatccaagtg cgattccgca gcatgcgttt aaaccgtttg gaaacggtca gcgtgcgtgt 1200

atcggtcagc agttcgctct tcatgaagca acgctggtac ttggtatgat gctaaaacac 1260

tttgactttg aagatcatac aaactacgag ctggatatta aagaaacttt atctttaaaa 1320

cctgaaggct ttgtggtaaa agcaaaatcg aaaaaaattc cgcttggcgg tattccttca 1380

cctagcactg aacagtctgc taaaaaagta cgcaaaaagg cagaaaacgc tcataatacg 1440

ccgctgcttg tgctatacgg ttcaaatatg ggaacagctg aaggaacggc gcgtgattta 1500

gcagatattg caatgagcaa aggatttgca ccgcaggtcg caacgcttga ttcacacgcc 1560

ggaaatcttc cgcgcgaagg agctgtatta attgtaacgg cgtcttataa cggtcatccg 1620

cctgataacg caaagcaatt tgtcgactgg ttagaccaag cgtctgctga tgaagtaaaa 1680

ggcgttcgct actccgtatt tggatgcggc gataaaaact gggctactac gtatcaaaaa 1740

gtgcctgctt ttatcgatga aacgcttgcc gctaaagggg cagaaaacat cgctgaccgc 1800

ggtgaagcag atgcaagcga cgactttgaa ggcacatatg aagaatggcg tgaacatatg 1860

tggagtgacg tagcagccta ctttaacctc gacattgaaa acagtgaaga taataaatct 1920

actctttcac ttcaatttgt cgacagcgcc gcggatatgc cgcttgcgaa aatgcacggt 1980

gcgttttcaa cgaacgtcgt agcaagcaaa gaacttcaac agccaggcag tgcacgaagc 2040

acgcgacatc ttgaaattga acttccaaaa gaagcttctt atcaagaagg agatcattta 2100

ggtgttattc ctcgcaacta tgaaggaata gtaaaccgtg taacagcaag gttcggccta 2160

gatgcatcac agcaaatccg tctggaagca gaagaagaaa aattagctca tttgccactc 2220

gctaaaacag tatccgtaga agagcttctg caatacgtgg agcttcaaga tcctgttacg 2280

cgcacgcagc ttcgcgcaat ggctgctaaa acggtctgcc cgccgcataa agtagagctt 2340

gaagccttgc ttgaaaagca agcctacaaa gaacaagtgc tggcaaaacg tttaacaatg 2400

cttgaactgc ttgaaaaata cccggcgtgt gaaatgaaat tcagcgaatt tatcgccctt 2460

ctgccaagca tacgcccgcg ctattactcg atttcttcat cacctcgtgt cgatgaaaaa 2520

caagcaagca tcacggtcag cgttgtctca ggagaagcgt ggagcggata tggagaatat 2580

aaaggaattg cgtcgaacta tcttgccgag ctgcaagaag gagatacgat tacgtgcttt 2640

atttccacac cgcagtcaga atttacgctg ccaaaagacc ctgaaacgcc gcttatcatg 2700

gtcggaccgg gaacaggcgt cgcgccgttt agaggctttg tgcaggcgcg caaacagcta 2760

aaagaacaag gacagtcact tggagaagca catttatact tcggctgccg ttcacctcat 2820

gaagactatc tgtatcaaga agagcttgaa aacgcccaaa gcgaaggcat cattacgctt 2880

cataccgctt tttctcgcat gccaaatcag ccgaaaacat acgttcagca cgtaatggaa 2940

caagacggca agaaattgat tgaacttctt gatcaaggag cgcacttcta tatttgcgga 3000

gacggaagcc aaatggcacc tgccgttgaa gcaacgctta tgaaaagcta tgctgacgtt 3060

caccaagtga gtgaagcaga cgctcgctta tggctgcagc agctagaaga aaaaggccga 3120

tacgcaaaag acgtgtgggc tgggtaa 3147

<210> 5

<211> 3147

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5