一种利用细胞色素P450酶合成16α-羟基化甾体类化合物的方法
阅读说明:本技术 一种利用细胞色素P450酶合成16α-羟基化甾体类化合物的方法 (Method for synthesizing 16 alpha-hydroxylated steroid compound by using cytochrome P450 enzyme ) 是由 许莲花 高齐霖 林素素 于 2021-09-13 设计创作,主要内容包括:本发明公开了一种利用细胞色素P450酶合成16α-羟基化甾体化合物的方法,属于生物技术领域。该方法首先构建了来自白酒红链霉菌的P450SabH基因与还原伴侣蛋白RhFRED基因的共表达载体,在大肠杆菌中表达;经过培养后,利用静息细胞法喂养底物甾体化合物进行生物转化,获得16α位羟基化产物。此反应具有严格的区域选择性和立体选择性,产生单一产物。与此同时,此反应对几种特定的甾体化合物例如孕酮、雄烯二酮等的转化率接近100%,在工业生产当中具有极高的利用价值,提高了原料和能源利用率,降低了16α-羟基化甾体化合物的生产成本。(The invention discloses a method for synthesizing a 16 alpha-hydroxylated steroid compound by using cytochrome P450 enzyme, belonging to the technical field of biology. The method firstly constructs a co-expression vector of a P450SabH gene from white spirit streptomyces erythropolis and a reduction chaperonin RhFRED gene, and expresses the co-expression vector in escherichia coli; after culturing, the substrate steroid compound is fed by a resting cell method for biotransformation, and a 16 alpha-position hydroxylation product is obtained. This reaction is strictly regioselective and stereoselective, resulting in a single product. Meanwhile, the conversion rate of the reaction on a plurality of specific steroid compounds such as progesterone, androstenedione and the like is close to 100%, the reaction has extremely high utilization value in industrial production, the utilization rate of raw materials and energy is improved, and the production cost of the 16 alpha-hydroxylated steroid compound is reduced.)
技术领域
本发明属于生物技术领域,涉及一种利用细胞色素P450酶合成16α-羟基化甾体类化合物的方法,具体说,是通过利用新型细胞色素P450酶P450SabH与还原伴侣RhFRED的共表达重组菌进行生物转化获得16α-羟基孕酮和16α-羟基雄烯二酮等16α-羟基甾体类化合物的方法。
背景技术
细胞色素P450酶作为生物催化剂,拥有化学催化剂不可比拟的优势,能够在温和条件下催化化合物中未活化的碳氢键,并且具有严格的局域选择性和立体选择性。其在环境污染物降解、精细化学品合成以及药物的合成生物学领域具有巨大的应用潜力。随着DNA测序技术的大力发展,大量的微生物基因组数据信息的积累,挖掘新的具有工业应用价值的P450酶日渐成为关注的热点。已有如青篙酸,普伐他汀等药物中间体及药物通过P450酶催化合成的工业化成功案例使得人们对P450能催化更多类型的药物工业合成更具信心。
甾体类药物是目前使用的仅次于抗生素的第二大类药物,大多数甾体类药物是利用对天然甾体化合物的结构修饰获得的具有新颖的生物活性的化合物。对甾体化合物的修饰反应包括羟基化、羰基化、脱氢、芳香化、溴化等。对甾体类化合物进行结构修饰可能会造成物理化学和药物性质发生巨大变化。例如,13-甲基-雌甾-4-烯-3,17-二酮的C-15羟基化,得到的羟基化产物是避孕药孕二烯酮的重要中间体;糖皮质激素16位羟基化能显著提高其生物活性等。
发明内容
本发明的目的在于公开了一种利用细胞色素P450酶与还原伴侣RhFRED共表达重组菌合成16α-羟基化甾体化合物的方法。
本发明的目的是通过以下技术方案来实现的:
一种利用细胞色素P450酶合成16α-羟基化甾体类化合物的方法,具体为:
利用共表达P450SabH基因和RhFRED基因的菌体发酵液对甾体类底物进行生物转化获得16α-羟基化甾体类化合物。其中,所述共表达P450SabH基因和RhFRED基因的菌体发酵液制备方法具体为:利用无缝克隆技术将pET28a载体与P450SabH基因和RhFRED基因连在一起,得到重组质粒pET28a-P450SabH-RhFRED,将所述质粒转入到大肠杆菌BL21(DE3),构建重组大肠杆菌,经筛选、前培养和扩大培养得到共表达P450SabH基因和RhFRED基因的菌体发酵液。所述pET28a的基因序列如SEQ ID NO.1所示,pET28a-P450SabH-RhFRED基因序列如SEQ ID NO.2所示,其中P450SabH基因序列如SEQ ID NO.3所示,RhFRED基因序列如SEQID NO.4所示。
进一步地,利用共表达P450SabH基因和RhFRED基因的菌体发酵液对甾体类底物进行生物转化的条件具体为:将菌体发酵液离心重悬在50mM磷酸盐缓冲液中,保持pH为7.2,加入甾体类底物进行生物转化,在25℃振荡反应。其中,磷酸盐缓冲液与为菌体发酵液的体积比为5:1。所述底物在磷酸缓冲液中的浓度为100μM。
进一步地,所述磷酸缓冲液由终浓度为50mM的磷酸盐(pH=7.2)和甘油组成,甘油体积为所述磷酸缓冲液的10%。
进一步地,所述前培养和扩大培养具体为:
将构建的重组大肠杆菌加入LB培养基中,在37℃条件下培养16h,得重组大肠杆菌的种子液。将所述种子液接种到2×YT培养基中,所述种子液和2×YT培养基的体积比为1:100,在37℃,摇床转速180rpm/min的条件下进行扩大培养,直至菌液OD600值达到0.8,然后加入IPTG和5-氨基乙酰丙酸盐诱导菌体表达蛋白,同时将温度降低至20℃,继续培养20h,得到菌体发酵液。所述IPTG在2×YT培养基中的终浓度为0.1mM,所述5-氨基乙酰丙酸盐在2×YT培养基中的浓度为0.5mM。
进一步地,所述底物为孕酮,经生物转化,得到的16-羟基化甾体类化合物为16α-羟基孕酮。
进一步地,所述底物为雄烯二酮,经生物转化,得到的16-羟基化甾体类化合物为16α-羟基雄烯二酮。
本发明的有益效果是:①本发明涉及的P450SabH为未公开的新酶,其重组菌可转化孕酮及雄烯二酮等甾体类化合物产生16α位羟基化产物,这些产物现阶段在工业上主要从化学合成方法获得;②P450SabH酶对孕酮和雄烯二酮具有严格的区域选择性和立体选择性,产生唯一产物即16α-羟基孕酮和16α-羟基雄烯二酮,可提高分离提取的效率;③本发明构建的催化体系可以在温和条件下选择性地进行氧化反应,相比于传统化学反应的复杂工艺流程,其在生物制药领域具有很大的应用价值;④利用重组菌的生物转化可大大减少副反应产物,易于分离出所要的产物,因此达到高效率。⑤本发明构建的催化体系对特定的甾体类化合物转化率极高,对孕酮和雄烯二酮的转化率接近100%,提高了原料和能源利用效率,具有巨大的市场前景。
附图说明
图1为P450SabH与底物生物转化的流程图;
图2为实验样品的HPLC图谱,其中图2A为孕酮,图2B为雄烯二酮。
具体实施方式
以下结合实施例详细对本发明作进一步地说明。实施方案为便于更好的理解本发明,但并非对本发明的限制。
实施例1
图1为P450SabH与底物生物转化的流程图,具体包括如下步骤:
1、制备共表达重组大肠杆菌:
将pET28a质粒(SEQ ID NO.1)用NdeI和XhoI这对限制性内切酶线性化得到线性化载体。
以白酒红链霉菌的全基因组为模板,通过PCR扩增获得P450SabH的编码基因sab3040序列(SEQ ID NO.3)。其中,PCR扩增所用正向引物序列为SEQ ID NO.5具体为:5′-CGCGCGGCAGCCATATGAACTGCCCGCACGCCG-3′,所用反向引物序列为SEQ ID NO.6,具体为:5′-GCAGCACGCCCAGGAGGACGGGGAAGG-3′。
以pET28b-RhFRED质粒为模板,通过PCR扩增获得RhFRED的编码基因RhFRED序列(SEQ ID NO.4),其中,PCR扩增所用正向引物序列为SEQ ID NO.7具体为:5′-TCCTGGGCGTGCTGCACCGCCATCAACCG-3′,所用反向引物序列为SEQ ID NO.8,具体为:5′-GGTGGTGGTGCTCGATCAGAGGCGCAGGGCCAG-3′。
将PCR产物(P450SabH的编码基因和RhFRED的编码基因)和线性化载体根据试剂盒说明按一定比例混合后,在II重组酶的催化下,37℃反应30min,得到重组质粒pET28a-P450SabH-RhFRED,所述pET28a-P450SabH-RhFRED基因序列如SEQ ID NO.2所示。将重组质粒pET28b-CYP154C2-RhFRED转入到大肠杆菌BL21(DE3)感受态细胞,利用含有卡那霉素的LB固体培养基筛选出单克隆,得到多酶共表达的重组大肠杆菌。
2、重组大肠杆菌的前培养和扩大培养:
将共表达重组大肠杆菌接种到LB液体培养基中,在pH为7.4-7.6范围内,温度为37℃、转速为220rpm条件下培养16小时,得到重组大肠杆菌的种子液。将种子液接种到2×YT培养基中进行扩大培养、发酵,种子液和2×YT培养基的体积比为1:100;接种后,重组的大肠杆菌继续在37℃,摇床转速180rpm的条件下培养3-4h,直至菌液OD600值达到0.8,然后加入IPTG和5-氨基乙酰丙酸盐诱导菌体大量表达蛋白,同时将温度降低至20℃,继续培养20h,得到发酵液。所述IPTG在2×YT培养基中的浓度为0.1mM,所述5-氨基乙酰丙酸盐在2×YT培养基中的浓度为0.5mM。
3、生物转化合成16α-羟基孕酮:
将发酵液低速离心收集菌体,用磷酸缓冲液重悬收集好的菌体,保持pH为7.2,所述磷酸缓冲液由终浓度为50mM的磷酸盐和10vol%的甘油组成。加入孕酮,在25℃振荡反应24h后,加入等体积乙酸乙酯萃取,收集合并乙酸乙酯层,待乙酸乙酯彻底挥干后,得到16α-羟基孕酮。所述离心前发酵液与磷酸缓冲液的体积比为5:1(例如:500ml发酵液离心后的菌体加100ml磷酸缓冲液),所述孕酮在磷酸钠缓冲液中的浓度为100μM。
实施例2
将实施例1步骤3中的底物换成雄烯二酮,所述雄烯二酮在磷酸缓冲液中的浓度为100μM,其余条件不变,最终得到16α-羟基雄烯二酮。
向实施例1得到的16α-羟基孕酮或实施例2获得的16α-羟基雄烯二酮中加入100μL甲醇溶解,进行HPLC检测分析。本发明中HPLC分析采用的是新加坡的Waters E2695高效液相色谱系统和COSMOSIL填充柱,流动相采用的是35vt%-100vt%甲醇-水梯度洗脱20min,检测波长是240nm,流速是1ml/min。
图2为实验样品的HPLC图谱,其中图2A为孕酮的标准品和反应24个小时后获得的16α-羟基孕酮图谱,孕酮和16α-羟基孕酮的保留时间分别为19.486min和15.069min,根据实验样品中16α-羟基孕酮的峰积分面积/(16α-羟基孕酮的峰积分面积+孕酮的峰积分面积)计算得出该生物催化的转化率为99.7%;图2B为雄烯二酮的标准品和反应24个小时后获得的16α-羟基雄烯二酮图谱,雄烯二酮和和16α-羟基雄烯二酮保留时间分别为16.268min和13.111min,根据实验样品中16α-羟基雄烯二酮的峰积分面积/(16α-羟基雄烯二酮的峰积分面积+雄烯二酮的峰积分面积)计算得出该生物催化的转化率为98.7%。此结果均显示获得的产物为唯一产物并且转化效率极高,说明了较严格的底物选择性和催化的高效性。
通过此催化体系所获得的产物16α-羟基化甾体类化合物有望在生物制药领域具有较好的应用价值,相比于传统化学合成的复杂工艺流程以及多副产物的劣势,此催化体系获得的产物单一并且催化效率极高具有更好的经济效益和环境效益。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法把所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围。
序列表
<110> 浙江理工大学
<120> 一种利用细胞色素P450酶合成16α-羟基化甾体类化合物的方法
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 5369
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180
cgacggagct cgaattcgga tccgcgaccc atttgctgtc caccagtcat gctagccata 240
tggctgccgc gcggcaccag gccgctgctg tgatgatgat gatgatggct gctgcccatg 300
gtatatctcc ttcttaaagt taaacaaaat tatttctaga ggggaattgt tatccgctca 360
caattcccct atagtgagtc gtattaattt cgcgggatcg agatctcgat cctctacgcc 420
ggacgcatcg tggccggcat caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc 480
gacatcaccg atggggaaga tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc 540
gtgggtatgg tggcaggccc cgtggccggg ggactgttgg gcgccatctc cttgcatgca 600
ccattccttg cggcggcggt gctcaacggc ctcaacctac tactgggctg cttcctaatg 660
caggagtcgc ataagggaga gcgtcgagat cccggacacc atcgaatggc gcaaaacctt 720
tcgcggtatg gcatgatagc gcccggaaga gagtcaattc agggtggtga atgtgaaacc 780
agtaacgtta tacgatgtcg cagagtatgc cggtgtctct tatcagaccg tttcccgcgt 840
ggtgaaccag gccagccacg tttctgcgaa aacgcgggaa aaagtggaag cggcgatggc 900
ggagctgaat tacattccca accgcgtggc acaacaactg gcgggcaaac agtcgttgct 960
gattggcgtt gccacctcca gtctggccct gcacgcgccg tcgcaaattg tcgcggcgat 1020
taaatctcgc gccgatcaac tgggtgccag cgtggtggtg tcgatggtag aacgaagcgg 1080
cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca gtgggctgat 1140
cattaactat ccgctggatg accaggatgc cattgctgtg gaagctgcct gcactaatgt 1200
tccggcgtta tttcttgatg tctctgacca gacacccatc aacagtatta ttttctccca 1260
tgaagacggt acgcgactgg gcgtggagca tctggtcgca ttgggtcacc agcaaatcgc 1320
gctgttagcg ggcccattaa gttctgtctc ggcgcgtctg cgtctggctg gctggcataa 1380
atatctcact cgcaatcaaa ttcagccgat agcggaacgg gaaggcgact ggagtgccat 1440
gtccggtttt caacaaacca tgcaaatgct gaatgagggc atcgttccca ctgcgatgct 1500
ggttgccaac gatcagatgg cgctgggcgc aatgcgcgcc attaccgagt ccgggctgcg 1560
cgttggtgcg gatatctcgg tagtgggata cgacgatacc gaagacagct catgttatat 1620
cccgccgtta accaccatca aacaggattt tcgcctgctg gggcaaacca gcgtggaccg 1680
cttgctgcaa ctctctcagg gccaggcggt gaagggcaat cagctgttgc ccgtctcact 1740
ggtgaaaaga aaaaccaccc tggcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 1800
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 1860
acgcaattaa tgtaagttag ctcactcatt aggcaccggg atctcgaccg atgcccttga 1920
gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc gtcgccgcac 1980
ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg ctctgggtca 2040
ttttcggcga ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg cttgcggtat 2100
tcggaatctt gcacgccctc gctcaagcct tcgtcactgg tcccgccacc aaacgtttcg 2160
gcgagaagca ggccattatc gccggcatgg cggccccacg ggtgcgcatg atcgtgctcc 2220
tgtcgttgag gacccggcta ggctggcggg gttgccttac tggttagcag aatgaatcac 2280
cgatacgcga gcgaacgtga agcgactgct gctgcaaaac gtctgcgacc tgagcaacaa 2340
catgaatggt cttcggtttc cgtgtttcgt aaagtctgga aacgcggaag tcagcgccct 2400
gcaccattat gttccggatc tgcatcgcag gatgctgctg gctaccctgt ggaacaccta 2460
catctgtatt aacgaagcgc tggcattgac cctgagtgat ttttctctgg tcccgccgca 2520
tccataccgc cagttgttta ccctcacaac gttccagtaa ccgggcatgt tcatcatcag 2580
taacccgtat cgtgagcatc ctctctcgtt tcatcggtat cattaccccc atgaacagaa 2640
atccccctta cacggaggca tcagtgacca aacaggaaaa aaccgccctt aacatggccc 2700
gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg 2760
aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc 2820
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 2880
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 2940
ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 3000
gcttaactat gcggcatcag agcagattgt actgagagtg caccatatat gcggtgtgaa 3060
ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc 3120
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 3180
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 3240
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 3300
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 3360
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 3420
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 3480
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 3540
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 3600
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 3660
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3720
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3780
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3840
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3900
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgaa caataaaact 3960
gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac gggaaacgtc 4020
ttgctctagg ccgcgattaa attccaacat ggatgctgat ttatatgggt ataaatgggc 4080
tcgcgataat gtcgggcaat caggtgcgac aatctatcga ttgtatggga agcccgatgc 4140
gccagagttg tttctgaaac atggcaaagg tagcgttgcc aatgatgtta cagatgagat 4200
ggtcagacta aactggctga cggaatttat gcctcttccg accatcaagc attttatccg 4260
tactcctgat gatgcatggt tactcaccac tgcgatcccc gggaaaacag cattccaggt 4320
attagaagaa tatcctgatt caggtgaaaa tattgttgat gcgctggcag tgttcctgcg 4380
ccggttgcat tcgattcctg tttgtaattg tccttttaac agcgatcgcg tatttcgtct 4440
cgctcaggcg caatcacgaa tgaataacgg tttggttgat gcgagtgatt ttgatgacga 4500
gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg cataaacttt tgccattctc 4560
accggattca gtcgtcactc atggtgattt ctcacttgat aaccttattt ttgacgaggg 4620
gaaattaata ggttgtattg atgttggacg agtcggaatc gcagaccgat accaggatct 4680
tgccatccta tggaactgcc tcggtgagtt ttctccttca ttacagaaac ggctttttca 4740
aaaatatggt attgataatc ctgatatgaa taaattgcag tttcatttga tgctcgatga 4800
gtttttctaa gaattaattc atgagcggat acatatttga atgtatttag aaaaataaac 4860
aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgaaattgta aacgttaata 4920
ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 4980
aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 5040
cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 5100
ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 5160
cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 5220
ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 5280
gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 5340
cgccgctaca gggcgcgtcc cattcgcca 5369
<210> 2
<211> 7533
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gatcagaggc gcagggccag 180
ccggtcgcca caggcacgcg agcagcaggt catcatctgc cggttcgccg cccgctcggc 240
cttggtcagc accgtgtcgc gatggtcgac ctcgccgtcg aggacggcga cctcgcacga 300
gccgcagagg ccttcctcgc agtcgctggg cacgtcgatg ttgttggcgc gcaacgcgtc 360
gaggacggtc tgggtgggtt cgacccgcac ggtcagcccc gagtcacgca gttcgaggtc 420
gaaggcgtgc tcgacgtccg gatcgagcgc cgcgagggac gaggtgaagt gctcgacgtg 480
cagcgccccg tcgggccagt tccggctcgc gtcctcgagt ccggcgagca gccgcccggg 540
cccgcacgcg tagatctgga cgccgggggc gggctcggcg aggagggcgg cgaggtcgat 600
ccgggtgcct tcctcggaca cgtgcagggc ggcccggtca ccgtgcccgg cgacacgctc 660
gagataggcc atgccggaac ggtttcggcc gcagtagtgc agttcgtagc tccacccccg 720
ggcgcgggcg tggtcggcca tggccaggac tggggtgatg ccgatgccgc cggcgacgaa 780
cacgtagtgc tcggcgccgg ggtcgagcgc gaaatggttc cgagggccgc gcatccggag 840
cgggcttccc acctcgagct gttcgtggat gtagcgcgaa ccgccgcggc tctcgggatc 900
caggtgcacg gcaatctcgt agctcggcgc atcgggcgcg ccgcacaggg agtactggcg 960
cgacagcgcg ccgaggtcga ggtcgatatg ggcgccggga gtccacgtgg gcaatgtctt 1020
tccgccggcg tcgcgcagga cgaggcgcag cacgtcgtcg gcgatccggt ccaggcgctc 1080
gacggtgacg gtgcgggaca ccgcccgggc ggcgggttct ccgatggtga ccggttgatg 1140
gcggtgcagc acgcccagga ggacggggaa ggccgccatg tcgttctgcg tcatcacggg 1200
aagcctggtg atctcctcgt ccgggacggc gagacggagt tcggggaagc gggcgaacag 1260
cgcgggcagc gcgatgcccg cctcgacgcg cgacagagcg gcgccggggc agatgtgcgg 1320
gccgtgaccg aaggtcatgt ggcggttacg ggtgggccgg gtgatgtcga aggtgtcggc 1380
gtcggggccg tgctgctcgg tgtcccggcc gatggcccgg taggagatga cgacgccttc 1440
ccccgtgcgg atcaccccgt cgccgacggc tatgtcctcg gtggcgaacc gcatcagcag 1500
atgggtggtg ggggtgtccc agcgcagcgt ctcctcgatc acggcgtccc agccgatctc 1560
cccgtcgagc accttgcgca gctggcccgg gtgggagagg agggcgcgca cggcgttgag 1620
gacgagtccg atggtggtct cgtgcccggc ggcgaccatg gccttgaggt tgcccaccac 1680
ctcctcctcg gtgagcggtt cgccgccctc ctcggccagg atcagcgcac tggtgaggtc 1740
gtccgtgggc cgggcggtct tctcccgtac gaggccggcg tagaagacgt ccagctccgc 1800
cagcagggcg aggcgttcgt cctgcggggt gagcatcgag aagaacgcct tgtactgccg 1860
ggtgagcatg gcgtgctggg acgcgtcgac gcccatcagc atgccgacga ccttcatcgg 1920
cagcggctgg gcgaagaccg ccttcaggtc gacgaccccg tcctcgccct gggcggcgtc 1980
gaggtcgtcc agcagctctt cggtgaactt ctcgatgtcc gggcggatcg cctccaggcg 2040
ccggggagtc agcgcctgcg aggtcttggt gcgcagccgc cggtgttcgg caccgtcgac 2100
ggtgaacatg gaacgcccgg cgtcgatcat gccgatcagc ggccaggcac gtgtcaccgc 2160
tccgctccgc cacgcacccc aggcgtcgat gtccttcacc aggcgtgggt cgacgagcag 2220
ttggcgcgcc tcggcgtgcc gggtgaccgc ccaggccggg acgccgagca ggtcgatccg 2280
ggcgaggacc ccggcgtcgc gcagtcgcag ggtctcgccg tccaggtcct ggaccatggg 2340
gtcgatggtg atgacctcgg cgtcccggcc ggctcggtcg gtttcggcgt gcgggcagtt 2400
catatggctg ccgcgcggca ccaggccgct gctgtgatga tgatgatgat ggctgctgcc 2460
catggtatat ctccttctta aagttaaaca aaattatttc tagaggggaa ttgttatccg 2520
ctcacaattc ccctatagtg agtcgtatta atttcgcggg atcgagatct cgatcctcta 2580
cgccggacgc atcgtggccg gcatcaccgg cgccacaggt gcggttgctg gcgcctatat 2640
cgccgacatc accgatgggg aagatcgggc tcgccacttc gggctcatga gcgcttgttt 2700
cggcgtgggt atggtggcag gccccgtggc cgggggactg ttgggcgcca tctccttgca 2760
tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac ctactactgg gctgcttcct 2820
aatgcaggag tcgcataagg gagagcgtcg agatcccgga caccatcgaa tggcgcaaaa 2880
cctttcgcgg tatggcatga tagcgcccgg aagagagtca attcagggtg gtgaatgtga 2940
aaccagtaac gttatacgat gtcgcagagt atgccggtgt ctcttatcag accgtttccc 3000
gcgtggtgaa ccaggccagc cacgtttctg cgaaaacgcg ggaaaaagtg gaagcggcga 3060
tggcggagct gaattacatt cccaaccgcg tggcacaaca actggcgggc aaacagtcgt 3120
tgctgattgg cgttgccacc tccagtctgg ccctgcacgc gccgtcgcaa attgtcgcgg 3180
cgattaaatc tcgcgccgat caactgggtg ccagcgtggt ggtgtcgatg gtagaacgaa 3240
gcggcgtcga agcctgtaaa gcggcggtgc acaatcttct cgcgcaacgc gtcagtgggc 3300
tgatcattaa ctatccgctg gatgaccagg atgccattgc tgtggaagct gcctgcacta 3360
atgttccggc gttatttctt gatgtctctg accagacacc catcaacagt attattttct 3420
cccatgaaga cggtacgcga ctgggcgtgg agcatctggt cgcattgggt caccagcaaa 3480
tcgcgctgtt agcgggccca ttaagttctg tctcggcgcg tctgcgtctg gctggctggc 3540
ataaatatct cactcgcaat caaattcagc cgatagcgga acgggaaggc gactggagtg 3600
ccatgtccgg ttttcaacaa accatgcaaa tgctgaatga gggcatcgtt cccactgcga 3660
tgctggttgc caacgatcag atggcgctgg gcgcaatgcg cgccattacc gagtccgggc 3720
tgcgcgttgg tgcggatatc tcggtagtgg gatacgacga taccgaagac agctcatgtt 3780
atatcccgcc gttaaccacc atcaaacagg attttcgcct gctggggcaa accagcgtgg 3840
accgcttgct gcaactctct cagggccagg cggtgaaggg caatcagctg ttgcccgtct 3900
cactggtgaa aagaaaaacc accctggcgc ccaatacgca aaccgcctct ccccgcgcgt 3960
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 4020
cgcaacgcaa ttaatgtaag ttagctcact cattaggcac cgggatctcg accgatgccc 4080
ttgagagcct tcaacccagt cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc 4140
gcacttatga ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc agcgctctgg 4200
gtcattttcg gcgaggaccg ctttcgctgg agcgcgacga tgatcggcct gtcgcttgcg 4260
gtattcggaa tcttgcacgc cctcgctcaa gccttcgtca ctggtcccgc caccaaacgt 4320
ttcggcgaga agcaggccat tatcgccggc atggcggccc cacgggtgcg catgatcgtg 4380
ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc ttactggtta gcagaatgaa 4440
tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca aaacgtctgc gacctgagca 4500
acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg gaagtcagcg 4560
ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc ctgtggaaca 4620
cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct ctggtcccgc 4680
cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc atgttcatca 4740
tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac ccccatgaac 4800
agaaatcccc cttacacgga ggcatcagtg accaaacagg aaaaaaccgc ccttaacatg 4860
gcccgcttta tcagaagcca gacattaacg cttctggaga aactcaacga gctggacgcg 4920
gatgaacagg cagacatctg tgaatcgctt cacgaccacg ctgatgagct ttaccgcagc 4980
tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 5040
gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 5100
ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 5160
actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atatgcggtg 5220
tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc 5280
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 5340
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 5400
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 5460
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 5520
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 5580
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 5640
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 5700
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 5760
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 5820
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 5880
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 5940
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 6000
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 6060
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgaacaataa 6120
aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt caacgggaaa 6180
cgtcttgctc taggccgcga ttaaattcca acatggatgc tgatttatat gggtataaat 6240
gggctcgcga taatgtcggg caatcaggtg cgacaatcta tcgattgtat gggaagcccg 6300
atgcgccaga gttgtttctg aaacatggca aaggtagcgt tgccaatgat gttacagatg 6360
agatggtcag actaaactgg ctgacggaat ttatgcctct tccgaccatc aagcatttta 6420
tccgtactcc tgatgatgca tggttactca ccactgcgat ccccgggaaa acagcattcc 6480
aggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc 6540
tgcgccggtt gcattcgatt cctgtttgta attgtccttt taacagcgat cgcgtatttc 6600
gtctcgctca ggcgcaatca cgaatgaata acggtttggt tgatgcgagt gattttgatg 6660
acgagcgtaa tggctggcct gttgaacaag tctggaaaga aatgcataaa cttttgccat 6720
tctcaccgga ttcagtcgtc actcatggtg atttctcact tgataacctt atttttgacg 6780
aggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagac cgataccagg 6840
atcttgccat cctatggaac tgcctcggtg agttttctcc ttcattacag aaacggcttt 6900
ttcaaaaata tggtattgat aatcctgata tgaataaatt gcagtttcat ttgatgctcg 6960
atgagttttt ctaagaatta attcatgagc ggatacatat ttgaatgtat ttagaaaaat 7020
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgaaat tgtaaacgtt 7080
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 7140
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 7200
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 7260
aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 7320
gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct 7380
tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc 7440
gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt 7500
aatgcgccgc tacagggcgc gtcccattcg cca 7533
<210> 3
<211> 1254
<212> DNA
<213> 白酒红链霉菌(Streptomyces)
<400> 3
gtgaactgcc cgcacgccga aaccgaccga gccggccggg acgccgaggt catcaccatc 60
gaccccatgg tccaggacct ggacggcgag accctgcgac tgcgcgacgc cggggtcctc 120
gcccggatcg acctgctcgg cgtcccggcc tgggcggtca cccggcacgc cgaggcgcgc 180
caactgctcg tcgacccacg cctggtgaag gacatcgacg cctggggtgc gtggcggagc 240
ggagcggtga cacgtgcctg gccgctgatc ggcatgatcg acgccgggcg ttccatgttc 300
accgtcgacg gtgccgaaca ccggcggctg cgcaccaaga cctcgcaggc gctgactccc 360
cggcgcctgg aggcgatccg cccggacatc gagaagttca ccgaagagct gctggacgac 420
ctcgacgccg cccagggcga ggacggggtc gtcgacctga aggcggtctt cgcccagccg 480
ctgccgatga aggtcgtcgg catgctgatg ggcgtcgacg cgtcccagca cgccatgctc 540
acccggcagt acaaggcgtt cttctcgatg ctcaccccgc aggacgaacg cctcgccctg 600
ctggcggagc tggacgtctt ctacgccggc ctcgtacggg agaagaccgc ccggcccacg 660
gacgacctca ccagtgcgct gatcctggcc gaggagggcg gcgaaccgct caccgaggag 720
gaggtggtgg gcaacctcaa ggccatggtc gccgccgggc acgagaccac catcggactc 780
gtcctcaacg ccgtgcgcgc cctcctctcc cacccgggcc agctgcgcaa ggtgctcgac 840
ggggagatcg gctgggacgc cgtgatcgag gagacgctgc gctgggacac ccccaccacc 900
catctgctga tgcggttcgc caccgaggac atagccgtcg gcgacggggt gatccgcacg 960
ggggaaggcg tcgtcatctc ctaccgggcc atcggccggg acaccgagca gcacggcccc 1020
gacgccgaca ccttcgacat cacccggccc acccgtaacc gccacatgac cttcggtcac 1080
ggcccgcaca tctgccccgg cgccgctctg tcgcgcgtcg aggcgggcat cgcgctgccc 1140
gcgctgttcg cccgcttccc cgaactccgt ctcgccgtcc cggacgagga gatcaccagg 1200
cttcccgtga tgacgcagaa cgacatggcg gccttccccg tcctcctggg ctga 1254
<210> 4
<211> 990
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gtgctgcacc gccatcaacc ggtcaccatc ggagaacccg ccgcccgggc ggtgtcccgc 60
accgtcaccg tcgagcgcct ggaccggatc gccgacgacg tgctgcgcct cgtcctgcgc 120
gacgccggcg gaaagacatt gcccacgtgg actcccggcg cccatatcga cctcgacctc 180
ggcgcgctgt cgcgccagta ctccctgtgc ggcgcgcccg atgcgccgag ctacgagatt 240
gccgtgcacc tggatcccga gagccgcggc ggttcgcgct acatccacga acagctcgag 300
gtgggaagcc cgctccggat gcgcggccct cggaaccatt tcgcgctcga ccccggcgcc 360
gagcactacg tgttcgtcgc cggcggcatc ggcatcaccc cagtcctggc catggccgac 420
cacgcccgcg cccgggggtg gagctacgaa ctgcactact gcggccgaaa ccgttccggc 480
atggcctatc tcgagcgtgt cgccgggcac ggtgaccggg ccgccctgca cgtgtccgag 540
gaaggcaccc ggatcgacct cgccgccctc ctcgccgagc ccgcccccgg cgtccagatc 600
tacgcgtgcg ggcccgggcg gctgctcgcc ggactcgagg acgcgagccg gaactggccc 660
gacggggcgc tgcacgtcga gcacttcacc tcgtccctcg cggcgctcga tccggacgtc 720
gagcacgcct tcgacctcga actgcgtgac tcggggctga ccgtgcgggt cgaacccacc 780
cagaccgtcc tcgacgcgtt gcgcgccaac aacatcgacg tgcccagcga ctgcgaggaa 840
ggcctctgcg gctcgtgcga ggtcgccgtc ctcgacggcg aggtcgacca tcgcgacacg 900
gtgctgacca aggccgagcg ggcggcgaac cggcagatga tgacctgctg ctcgcgtgcc 960
tgtggcgacc ggctggccct gcgcctctga 990
<210> 5
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
cgcgcggcag ccatatgaac tgcccgcacg ccg 33
<210> 6
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gcagcacgcc caggaggacg gggaagg 27
<210> 7
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tcctgggcgt gctgcaccgc catcaaccg 29
<210> 8
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggtggtggtg ctcgatcaga ggcgcagggc cag 33