溶血磷脂酶变体及其构建方法和在黑曲霉菌株中的表达
阅读说明:本技术 溶血磷脂酶变体及其构建方法和在黑曲霉菌株中的表达 (Lysophospholipase variant, construction method thereof and expression in aspergillus niger strain ) 是由 赵正阳 于 2021-10-11 设计创作,主要内容包括:本发明公开了一种溶血磷脂酶变体的序列。本发明通过一种构建重组黑曲霉表达菌的方法,构建包含溶血磷脂酶变体序列的重组表达盒,该重组表达盒为包含溶血磷脂酶变体基因序列、启动子、终止子、筛选标记、上下游同源序列等元件的基因片段。本发明通过基因工程的手段,构建了溶血磷脂酶变体序列的表达盒,并将其导入黑曲霉表达宿主菌,实现了溶血磷脂酶变体的高效分泌表达。按照本发明所述的方法构建的使用溶血磷脂酶变体序列的黑曲霉重组表达菌株,比使用变化前的原始的溶血磷脂酶序列的黑曲霉重组表达菌株,在同等培养条件下,上清液酶活提高20.7%,每毫克粗蛋白的比酶活提高21.12%。(The invention discloses a sequence of lysophospholipase variant. The invention constructs a recombinant expression cassette containing a lysophospholipase variant sequence by a method for constructing a recombinant Aspergillus niger expression strain, wherein the recombinant expression cassette is a gene fragment containing elements such as a lysophospholipase variant gene sequence, a promoter, a terminator, a screening marker, upstream and downstream homologous sequences and the like. The expression cassette of the lysophospholipase variant sequence is constructed by means of genetic engineering and is introduced into an Aspergillus niger expression host bacterium, so that the high-efficiency secretory expression of the lysophospholipase variant is realized. Compared with the Aspergillus niger recombinant expression strain using the original lysophospholipase sequence before change, the Aspergillus niger recombinant expression strain using the lysophospholipase variant sequence constructed by the method of the invention has the advantages that the enzyme activity of the supernatant is improved by 20.7 percent and the specific enzyme activity per milligram of crude protein is improved by 21.12 percent under the same culture condition.)
技术领域
本发明属于基因工程育种领域,涉及一种能够在黑曲霉宿主菌中大量表达,且具有更高溶血磷脂酶比酶活的多肽,以及其黑曲霉重组表达菌株的构建及应用。
背景技术
溶血磷脂酶被广泛应用在多种行业中。然而,其相对较高的价格仍然限制了其更加广泛的应用。溶血磷脂酶的生产基本是采用微生物发酵的方式。而提高其在微生物发酵过程中的表达量,是提高其工业化生产量,降低其工业生产价格的优良方式。
发明内容
本发明提供了一种具有溶血磷脂酶活性的多肽序列,使用本公司之前申请的专利方法,将其在相应的黑曲霉宿主中表达,其上清液活性、以及分子比酶活,比野生型的黑曲霉来源的溶血磷脂酶在黑曲霉宿主中的表达,分别提高了20.7%和21.12%。
本发明提供了一种溶血磷脂酶变体的序列,以及构建其黑曲霉重组表达菌株的方法。
本发明的重组表达菌株可以通过基因工程方法构建,具体描述为:
一种构建重组黑曲霉表达菌的方法,构建包含溶血磷脂酶变体基因序列的重组表达盒,该重组表达盒为包含溶血磷脂酶变体基因序列、启动子、终止子、信号肽、筛选标记等元件的基因片段。
所述的溶血磷脂酶变体基因为具有如SEQ ID NO.1所示的核苷酸序列;所述的宿主细胞为黑曲霉。
启动子可以是黑曲霉内源启动子:如黑曲霉糖化酶启动子,中性淀粉酶启动子,酸性淀粉酶启动子,α-葡萄糖苷酶启动子等;也可以是外源启动子:如米曲霉中性淀粉酶启动子,米根酶糖化酶启动子;本发明优选黑曲霉糖化酶启动子或黑曲霉中性淀粉酶启动子。
与启动子3’末端连接的可以是调控序列:如合适的前导序列(5’UTR),即对于宿主细胞的翻译重要的mRNA非翻译区,如米曲霉中性淀粉酶和构巢曲霉丙糖磷酸异构酶前导序列。
为了分泌表达特定蛋白,需要信号肽序列介导,在黑曲霉中常用的信号肽序列有糖化酶信号肽,酸性淀粉酶信号肽,黑曲霉植酸酶信号肽,米曲霉TAKA淀粉酶信号肽,在本发明中利用的是溶血磷脂酶变体基因序列本身编码的信号肽。
优选的终止子从如下酶的基因获得:黑曲霉糖化酶、米曲霉TAKA淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
特定的基因在与启动子,调控序列,信号肽序列及终止子相连接后形成表达盒。通过常规方法导入到黑曲霉基因组中,可以随机插入到基因组中,也可以定点整合到某个或多个基因座上。可选的基因座有gla(糖化酶),amya(中性淀粉酶),amyb(中性淀粉酶),aa(酸性淀粉酶),agda(α葡萄糖苷酶),agdb(α葡萄糖苷酶)。
所述表达盒优选地可以与一个或多个选择性标记连接,其允许简单选择经转化、转染、转导等的细胞或菌株。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦)乙酰转移酶)、hyg(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase)以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉(Aspergillus nidulans)或米曲霉的amdS或hyg。
所述表达盒优选地可以与一个或多个反向选择标记(负选择标记)连接。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶),hsvTK(单纯疱疹病毒胸苷激酶)。
所述的表达盒通过常规方法导入随机插入到宿主黑曲霉基因组中,或定点整合到宿主黑曲霉的某个或多个基因座上。
所述的基因座选自糖化酶gla,中性淀粉酶amya,中性淀粉酶amyb,酸性淀粉酶aa,α葡萄糖苷酶agda,α葡萄糖苷酶agdb。
所述的宿主为敲除糖化酶基因、真菌淀粉酶基因和酸性淀粉酶基因的黑曲霉。
本发明的有益效果:
本发明提供了一种溶血磷脂酶变体的基因序列及其多肽序列,并且提供了其在黑曲霉中的表达方法。通过表达本变体序列,获得了高产溶血磷脂酶变体黑曲霉表达菌株。跟表达溶血磷脂酶原始序列的菌株相比,在相同条件下,其上清液活性、以及分子比酶活,比野生型的黑曲霉来源的溶血磷脂酶在黑曲霉宿主中的表达,分别提高了20.7%和21.12%。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是酶活对比图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例
p-ZYAN02-LPPL-T质粒的构建
具体主要包含以下两个步骤:1.制备中间质粒p-ZYAN01。2.线性化中间质粒p-ZYAN01,并将溶血磷脂酶变体基因表达盒及上下游同源片段整合进p-ZYAN01,组成p-ZYAN02-LPPL-T质粒
制备中间质粒p-ZYAN01方法如下:
p-ZYAN01主要由如下几部分及必须的连接序列结合而成,或者由以下几部分直接结合而成。
(1)pUC57质粒XbaI-PscI双酶切后得到的2305bp片段;
(2)hyg基因表达盒,序列见SEQ ID NO.5;
(3)amds表达盒,序列见SEQ ID NO.6。
将pUC57质粒XbaI-PciI双酶切后得到的2305bp片段,hyg基因表达盒,以及amds表达盒,三个基因片段序列片段通过Gibson Master Mix Kit(E2611,New England Biolabs)进行重组,得到重组质粒p-ZYAN01。将溶血磷脂酶变体表达盒整合到黑曲霉糖化酶基因座以进行表达,使用糖化酶启动子和糖化酶终止子。构建溶血磷脂酶变体整合表达质粒p-ZYAN02-LPPL-T。整合质粒构建方法如下:将p-ZYAN01质粒通过业界通用的方法进行线性化;以黑曲霉基因片段SEQ ID NO.7为5’端同源片段,以黑曲霉基因片段SEQ ID NO.8为3’端同源片段,每个片段长2000bp。将上述线性化的p-ZYAN01载体、同源片段和溶血磷脂酶变体表达盒片段通过GibsonMaster Mix Kit(E2611,New England Biolabs)进行重组,得到整合质粒p-ZYAN02-LPPL-T,该整合质粒包含溶血磷脂酶变体表达盒,该表达盒包含了黑曲霉糖化酶启动子序列,南极假丝酵母来源的溶血磷脂酶变体序列以及黑曲霉糖化酶终止子序列,经测序确认序列。
溶血磷脂酶变体表达盒的转化整合
本实施例出发菌株为ZYAN05,是由常规菌株经敲除糖化酶基因、真菌淀粉酶基因和酸性淀粉酶基因后获得的。黑曲霉中上述基因敲除/敲入方法可参考专利C N103937766A或CN 104962594A实施例中公开的技术方法实现。即参照Delmas(Appl EnvironMicrobiol.2014,80(11):3484-7)等人描述的方法。具体地,利用环状DNA载体,包含有上述5’及3’同源序列,选择标记,以及大肠杆菌复制序列。将环状载体转入到黑曲霉中,通过选择获得重组菌株。
采用原生质体转化法将p-ZYAN02-LPPL-T质粒导入黑曲霉菌株ZYAN05,具体操作步骤如下:原生质体的制备:在营养丰富的TZ液体培养基(牛肉膏粉0.8%;酵母浸膏0.2%;蛋白胨0.5%;NaCl 0.2%;蔗糖3%;pH5.8)中培养黑曲霉菌丝体。通过mira-cloth(LPPL-Tiochem公司)从培养液中过滤菌丝体并用0.7M NaCl(pH5.8)洗涤,菌丝体滤干后转移至含纤维素酶1%(Sigma)、蜗牛酶1%(Sigma)和溶壁酶(Sigma)0.2%的酶解液(pH5.8)中,30℃,65rpm酶解3h。然后将含有原生质体的酶解液置于冰上并用四层擦镜纸过滤,得到的滤液经3000rpm,4℃温和离心10min后,弃上清;附着在管壁上的原生质体用STC溶液(1MDSorbitol、50mM CaCl2、10mM Tris,pH7.5)洗涤一次,最后把原生质体重悬于适量的STC溶液中。
将环状p-ZYAN02-LPPL-T质粒10μl(浓度为:100ng/μl)加入到100μl原生质体悬浮液中混匀后室温放置25min;然后分3次共加入900μl PEG溶液,混匀后室温放置25min;3000rpm,常温离心10min,弃上清,原生质体附着于管壁上,将其重悬于1ml STC溶液中。把该悬浮液与预先降温至45℃左右的培养基(乙酰胺0.3%、蔗糖20%、琼脂0.7%)混合并铺平板;待平板凝固后放入34℃培养箱中培养;24h后在平板上再铺一层含300ng/μl潮霉素(Hygromycin)的固体培养基(琼脂1%,其余成分同上),继续将平板置于34℃培养箱中培养4-5天后,长出上层培养基的转化子称为整合转化子。随机挑取几个整合转化子分别传代于含300ng/μl潮霉素(Hygromycin)的固体培养基上,34℃恒温培养3天后,收集菌丝体用液氮冷冻后研磨粉碎,然后用真菌基因组提取试剂盒(杭州博日科技有限公司)提取整合转化子基因组DNA,最后对整合转化子基因组DNA进行PCR鉴定。PCR产物经测序后确认整合到糖化酶基因座。阳性转化子经PCR产物测序后确认后得到重组表达菌株。
重组表达菌种液体发酵生产溶血磷脂酶变体
斜面培养:将所述黑曲霉重组表达菌株取一接种环菌苔接种于PDA固体斜面,35℃下恒温培养60h;摇瓶培养:将斜面培养得到的菌株取一接种环菌苔接入种子培养基中,在初始pH5.5、35℃、摇床转速200rpm条件下培养110h左右。所述斜面培养基如下:蔗糖20g,NaNO3 2g,MgSO4 0.5g,KCl 0.5g,FeSO4 0.01g,K2HPO4 1g,琼脂20g,将上述各组分溶于1000mL水中,调节pH至5.5,121℃灭菌20min,备用。所述摇瓶种子培养基如下:麦芽汁200mL,豆饼粉5g,调节pH至5.5,121℃灭菌20min,备用。
下表是250ml摇瓶2批次的发酵情况,以及于原始溶血磷脂酶发酵情况的对比。
表1:溶血磷脂酶原始序列及溶血磷脂酶变体序列在相同宿主及相同培养条件下的发酵产酶活情况对比
根据所述内容,本发明提供的溶血磷脂酶变体基因比溶血磷脂酶原始基因,分子比酶活提高了21.12%,发酵上清液的酶活提高了20.7%(图1)
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 南京正扬生物科技有限公司
<120> 溶血磷脂酶变体及其构建方法和在黑曲霉菌株中的表达
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1776
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gaaagggccg aggctgaggt tgcgtccgtc gccgccgatt taatcgtccg cgccctcccc 60
aatgcccccg atggctacac tccctccaat gtcacctgtc cctcgactcg tccgagcatt 120
cgtgatgcct cgggcatctc caccaacgag accgagtggc tcaaggtccg tcgcaatgcg 180
accctcaccc cgatgaagaa cctccttagc cgtctcaacc tcaccggctt tgataccacc 240
tcctacatca atgaacactc cagcaacatc tccaacatcc ccaacattgc aattgcggct 300
tcgggtggtg gataccgtgc gctcaccaac ggagctggtg cgctgaaggc tttcgacagc 360
cgctccgaca atgccaccaa ctccggtcaa ctgggtggtc tgctgcaggc ggcaacctac 420
gtctctggtc tgagtggtgg tagctggctg gtcggatcca tgttcgtcaa caacttctcc 480
tccatcggtg aattgcaagc cagcgagaag gtctggcgct tcgacaagtc cctgctcgag 540
ggacccaact tcgaccacat ccagatcgtc agcacggtgg aatactggaa ggacattacc 600
gaggaagtcg acggcaaggc taacgctggt tttaacactt ccttcaccga ctactggggc 660
cgtgcgctgt cctaccagct ggtgaacgcc tccgatgaca agggtggtcc cgactacacc 720
tggtcctcca ttgcgctcat ggacgacttc aagaacggcc agtaccccat gcctattgtg 780
gtcgccgacg gccgcaaccc cggcgaaatc atcgttgaga ccaatgccac cgtttatgaa 840
gtgaaccctt gggaattcgg ctctttcgac cccagcgtct acgccttcgc tcccctgcag 900
tatctgggct cccggttcga gaacggctcc atcccggaca acggcacctg cgtgagcggc 960
ttcgacaatg ccggctttat catgggatca tcctccaccc tgttcaacca attcctcctc 1020
caaatcaaca gcaccagcat ccccacgatc ctgaaggatg ccttcactga catcctcgag 1080
gacctcggtg agcgcaacga cgatatcgcc gtctactccc ccaacccctt ctccggctac 1140
cgcgacagca gcgaggatta cgccacagcc aaggacctcg acgttgtcga cggtggtgaa 1200
gacggcgaga acatccctct gcacccgctg atccagcccg agcgtgccgt cgatgtcatc 1260
ttcgccatcg actcctctgc cgacacagac tactactggc ccaacggtac ctcccttgtc 1320
gcgacctacg agcgcagtct cgagcccagc atcgccaacg gcaccgcctt ccccgccgtg 1380
ccggatcaga acaccttcgt caacctgggt ctcaactccc gcccgacttt cttcggctgc 1440
gaccccaaga acatctccgg caccgccccc ctggtcattt atctgcctaa cagcccctac 1500
acctacgact ccaacttctc gaccttcaag ctgacctaca gcgacgagga gcgtgattcc 1560
gtcatcacca acggctggaa cgtggtcact cgcggtaacg gtaccgttga tgataacttc 1620
ccgtcttgcg tggcgtgcgc tattctccag cgctccacct acaggacgaa cacctctctg 1680
ccagatatct gtaccacctg ctttaacgat tactgctgga acggcacgac aaacagcact 1740
acgcctggag cttatgaacc cagtgtgctg attgct 1776
<210> 2
<211> 592
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Glu Arg Ala Glu Ala Glu Val Ala Ser Val Ala Ala Asp Leu Ile Val
1 5 10 15
Arg Ala Leu Pro Asn Ala Pro Asp Gly Tyr Thr Pro Ser Asn Val Thr
20 25 30
Cys Pro Ser Thr Arg Pro Ser Ile Arg Asp Ala Ser Gly Ile Ser Thr
35 40 45
Asn Glu Thr Glu Trp Leu Lys Val Arg Arg Asn Ala Thr Leu Thr Pro
50 55 60
Met Lys Asn Leu Leu Ser Arg Leu Asn Leu Thr Gly Phe Asp Thr Thr
65 70 75 80
Ser Tyr Ile Asn Glu His Ser Ser Asn Ile Ser Asn Ile Pro Asn Ile
85 90 95
Ala Ile Ala Ala Ser Gly Gly Gly Tyr Arg Ala Leu Thr Asn Gly Ala
100 105 110
Gly Ala Leu Lys Ala Phe Asp Ser Arg Ser Asp Asn Ala Thr Asn Ser
115 120 125
Gly Gln Leu Gly Gly Leu Leu Gln Ala Ala Thr Tyr Val Ser Gly Leu
130 135 140
Ser Gly Gly Ser Trp Leu Val Gly Ser Met Phe Val Asn Asn Phe Ser
145 150 155 160
Ser Ile Gly Glu Leu Gln Ala Ser Glu Lys Val Trp Arg Phe Asp Lys
165 170 175
Ser Leu Leu Glu Gly Pro Asn Phe Asp His Ile Gln Ile Val Ser Thr
180 185 190
Val Glu Tyr Trp Lys Asp Ile Thr Glu Glu Val Asp Gly Lys Ala Asn
195 200 205
Ala Gly Phe Asn Thr Ser Phe Thr Asp Tyr Trp Gly Arg Ala Leu Ser
210 215 220
Tyr Gln Leu Val Asn Ala Ser Asp Asp Lys Gly Gly Pro Asp Tyr Thr
225 230 235 240
Trp Ser Ser Ile Ala Leu Met Asp Asp Phe Lys Asn Gly Gln Tyr Pro
245 250 255
Met Pro Ile Val Val Ala Asp Gly Arg Asn Pro Gly Glu Ile Ile Val
260 265 270
Glu Thr Asn Ala Thr Val Tyr Glu Val Asn Pro Trp Glu Phe Gly Ser
275 280 285
Phe Asp Pro Ser Val Tyr Ala Phe Ala Pro Leu Gln Tyr Leu Gly Ser
290 295 300
Arg Phe Glu Asn Gly Ser Ile Pro Asp Asn Gly Thr Cys Val Ser Gly
305 310 315 320
Phe Asp Asn Ala Gly Phe Ile Met Gly Ser Ser Ser Thr Leu Phe Asn
325 330 335
Gln Phe Leu Leu Gln Ile Asn Ser Thr Ser Ile Pro Thr Ile Leu Lys
340 345 350
Asp Ala Phe Thr Asp Ile Leu Glu Asp Leu Gly Glu Arg Asn Asp Asp
355 360 365
Ile Ala Val Tyr Ser Pro Asn Pro Phe Ser Gly Tyr Arg Asp Ser Ser
370 375 380
Glu Asp Tyr Ala Thr Ala Lys Asp Leu Asp Val Val Asp Gly Gly Glu
385 390 395 400
Asp Gly Glu Asn Ile Pro Leu His Pro Leu Ile Gln Pro Glu Arg Ala
405 410 415
Val Asp Val Ile Phe Ala Ile Asp Ser Ser Ala Asp Thr Asp Tyr Tyr
420 425 430
Trp Pro Asn Gly Thr Ser Leu Val Ala Thr Tyr Glu Arg Ser Leu Glu
435 440 445
Pro Ser Ile Ala Asn Gly Thr Ala Phe Pro Ala Val Pro Asp Gln Asn
450 455 460
Thr Phe Val Asn Leu Gly Leu Asn Ser Arg Pro Thr Phe Phe Gly Cys
465 470 475 480
Asp Pro Lys Asn Ile Ser Gly Thr Ala Pro Leu Val Ile Tyr Leu Pro
485 490 495
Asn Ser Pro Tyr Thr Tyr Asp Ser Asn Phe Ser Thr Phe Lys Leu Thr
500 505 510
Tyr Ser Asp Glu Glu Arg Asp Ser Val Ile Thr Asn Gly Trp Asn Val
515 520 525
Val Thr Arg Gly Asn Gly Thr Val Asp Asp Asn Phe Pro Ser Cys Val
530 535 540
Ala Cys Ala Ile Leu Gln Arg Ser Thr Tyr Arg Thr Asn Thr Ser Leu
545 550 555 560
Pro Asp Ile Cys Thr Thr Cys Phe Asn Asp Tyr Cys Trp Asn Gly Thr
565 570 575
Thr Asn Ser Thr Thr Pro Gly Ala Tyr Glu Pro Ser Val Leu Ile Ala
580 585 590
<210> 3
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atgaagttgc ctctctttgc tgctgcagca gctggcctcg ccaatgccgc ttccctgcct 60
gtc 63
<210> 4
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Lys Leu Pro Leu Phe Ala Ala Ala Ala Ala Gly Leu Ala Asn Ala
1 5 10 15
Ala Ser Leu Pro Val
20
<210> 5
<211> 2515
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtacagtgac cggtgactct ttctggcatg cggagagacg gacggacgca gagagaaggg 60
ctgagtaata agccactggc cagacagctc tggcggctct gaggtgcagt ggatgattat 120
taatccggga ccggccgccc ctccgccccg aagtggaaag gctggtgtgc ccctcgttga 180
ccaagaatct attgcatcat cggagaatat ggagcttcat cgaatcaccg gcagtaagcg 240
aaggagaatg tgaagccagg ggtgtatagc cgtcggcgaa atagcatgcc attaacctag 300
gtacagaagt ccaattgctt ccgatctggt aaaagattca cgagatagta ccttctccga 360
agtaggtaga gcgagtaccc ggcgcgtaag ctccctaatt ggcccatccg gcatctgtag 420
ggcgtccaaa tatcgtgcct ctcctgcttt gcccggtgta tgaaaccgga aaggccgctc 480
aggagctggc cagcggcgca gaccgggaac acaagctggc agtcgaccca tccggtgctc 540
tgcactcgac ctgctgaggt ccctcagtcc ctggtaggca gctttgcccc gtctgtccgc 600
ccggtgtgtc ggcggggttg acaaggtcgt tgcgtcagtc caacatttgt tgccatattt 660
tcctgctctc cccaccagct gctcttttct tttctctttc ttttcccatc ttcagtatat 720
tcatcttccc atccaagaac ctttatttcc cctaagtaag tactttgcta catccatact 780
ccatccttcc catcccttat tcctttgaac ctttcagttc gagctttccc acttcatcgc 840
agcttgacta acagctaccc cgcttgagca gacatcacca tgaaaaagcc tgaactcacc 900
gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca gcgtctccga cctgatgcag 960
ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg taggagggcg tggatatgtc 1020
ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc gttatgttta tcggcacttt 1080
gcatcggccg cgctcccgat tccggaagtg cttgacattg gggagttcag cgagagcctg 1140
acctattgca tctcccgccg tgcacagggt gtcacgttgc aagacctgcc tgaaaccgaa 1200
ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg cgatcgctgc ggccgatctt 1260
agccagacga gcgggttcgg cccattcgga ccgcaaggaa tcggtcaata cactacatgg 1320
cgtgatttca tatgcgcgat tgctgatccc catgtgtatc actggcaaac tgtgatggac 1380
gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc tgatgctttg ggccgaggac 1440
tgccccgaag tccggcacct cgtgcacgcg gatttcggct ccaacaatgt cctgacggac 1500
aatggccgca taacagcggt cattgactgg agcgaggcga tgttcgggga ttcccaatac 1560
gaggtcgcca acatcttctt ctggaggccg tggttggctt gtatggagca gcagacgcgc 1620
tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc ggctccgggc gtatatgctc 1680
cgcattggtc ttgaccaact ctatcagagc ttggttgacg gcaatttcga tgatgcagct 1740
tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag ccgggactgt cgggcgtaca 1800
caaatcgccc gcagaagcgc ggccgtctgg accgatggct gtgtagaagt actcgccgat 1860
agtggaaacc gacgccccag cactcgtccg agggcaaagg aatagtgatt taatagctcc 1920
atgtcaacaa gaataaaacg cgttttcggg tttacctctt ccagatacag ctcatctgca 1980
atgcattaat gcattgactg caacctagta acgccttcag gctccggcga agagaagaat 2040
agcttagcag agctattttc attttcggga gacgagatca agcagatcaa cggtcgtcaa 2100
gagacctacg agactgagga atccgctctt ggctccacgc gactatatat ttgtctctaa 2160
ttgtactttg acatgctcct cttctttact ctgatagctt gactatgaaa attccgtcac 2220
cagccctggg ttcgcaaaga taattgcatg tttcttcctt gaactctcaa gcctacagga 2280
cacacattca tcgtaggtat aaacctcgaa atcattccta ctaagatggt atacaatagt 2340
aaccatggtt gcctagtgaa tgctccgtaa cacccaatac gccggccgaa acttttttac 2400
aactctccta tgagtcgttt acccagaatg cacaggtaca cttgtttaga ggtaatcctt 2460
ctttctagaa gtcctcgtgt actgtgtaag cgcccactcc acatctccac tcgag 2515
<210> 6
<211> 2724
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ctagatctac gccaggaccg agcaagccca gatgagaacc gacgcagatt tccttggcac 60
ctgttgcttc agctgaatcc tggcaatacg agatacctgc tttgaatatt ttgaatagct 120
cgcccgctgg agagcatcct gaatgcaagt aacaaccgta gaggctgaca cggcaggtgt 180
tgctagggag cgtcgtgttc tacaaggcca gacgtcttcg cggttgatat atatgtatgt 240
ttgactgcag gctgctcagc gacgacagtc aagttcgccc tcgctgcttg tgcaataatc 300
gcagtgggga agccacaccg tgactcccat ctttcagtaa agctctgttg gtgtttatca 360
gcaatacacg taatttaaac tcgttagcat ggggctgata gcttaattac cgtttaccag 420
tgccgcggtt ctgcagcttt ccttggcccg taaaattcgg cgaagccagc caatcaccag 480
ctaggcacca gctaaaccct ataattagtc tcttatcaac accatccgct cccccgggat 540
caatgaggag aatgaggggg atgcggggct aaagaagcct acataaccct catgccaact 600
cccagtttac actcgtcgag ccaacatcct gactataagc taacacagaa tgcctcaatc 660
ctgggaagaa ctggccgctg ataagcgcgc ccgcctcgca aaaaccatcc ctgatgaatg 720
gaaagtccag acgctgcctg cggaagacag cgttattgat ttcccaaaga aatcggggat 780
cctttcagag gccgaactga agatcacaga ggcctccgct gcagatcttg tgtccaagct 840
ggcggccgga gagttgacct cggtggaagt tacgctagca ttctgtaaac gggcagcaat 900
cgcccagcag ttagtagggt cccctctacc tctcagggag atgtaacaac gccaccttat 960
gggactatca agctgacgct ggcttctgtg cagacaaact gcgcccacga gttcttccct 1020
gacgccgctc tcgcgcaggc aagggaactc gatgaatact acgcaaagca caagagaccc 1080
gttggtccac tccatggcct ccccatctct ctcaaagacc agcttcgagt caaggtacac 1140
cgttgcccct aagtcgttag atgtcccttt ttgtcagcta acatatgcca ccagggctac 1200
gaaacatcaa tgggctacat ctcatggcta aacaagtacg acgaagggga ctcggttctg 1260
acaaccatgc tccgcaaagc cggtgccgtc ttctacgtca agacctctgt cccgcagacc 1320
ctgatggtct gcgagacagt caacaacatc atcgggcgca ccgtcaaccc acgcaacaag 1380
aactggtcgt gcggcggcag ttctggtggt gagggtgcga tcgttgggat tcgtggtggc 1440
gtcatcggtg taggaacgga tatcggtggc tcgattcgag tgccggccgc gttcaacttc 1500
ctgtacggtc taaggccgag tcatgggcgg ctgccgtatg caaagatggc gaacagcatg 1560
gagggtcagg agacggtgca cagcgttgtc gggccgatta cgcactctgt tgagggtgag 1620
tccttcgcct cttccttctt ttcctgctct ataccaggcc tccactgtcc tcctttcttg 1680
ctttttatac tatatacgag accggcagtc actgatgaag tatgttagac ctccgcctct 1740
tcaccaaatc cgtcctcggt caggagccat ggaaatacga ctccaaggtc atccccatgc 1800
cctggcgcca gtccgagtcg gacattattg cctccaagat caagaacggc gggctcaata 1860
tcggctacta caacttcgac ggcaatgtcc ttccacaccc tcctatcctg cgcggcgtgg 1920
aaaccaccgt cgccgcactc gccaaagccg gtcacaccgt gaccccgtgg acgccataca 1980
agcacgattt cggccacgat ctcatctccc atatctacgc ggctgacggc agcgccgacg 2040
taatgcgcga tatcagtgca tccggcgagc cggcgattcc aaatatcaaa gacctactga 2100
acccgaacat caaagctgtt aacatgaacg agctctggga cacgcatctc cagaagtgga 2160
attaccagat ggagtacctt gagaaatggc gggaggctga agaaaaggcc gggaaggaac 2220
tggacgccat catcgcgccg attacgccta ccgctgcggt acggcatgac cagttccggt 2280
actatgggta tgcctctgtg atcaacctgc tggatttcac gagcgtggtt gttccggtta 2340
cctttgcgga taagaacatc gataagaaga atgagagttt caaggcggtt agtgagcttg 2400
atgccctcgt gcaggaagag tatgatccgg aggcgtacca tggggcaccg gttgcagtgc 2460
aggttatcgg acggagactc agtgaagaga ggacgttggc gattgcagag gaagtgggga 2520
agttgctggg aaatgtggtg actccatagc taataagtgt cagatagcaa tttgcacaag 2580
aaatcaatac cagcaactgt aaataagcgc tgaagtgacc atgccatgct acgaaagagc 2640
agaaaaaaac ctgccgtaga accgaagaga tatgacacgc ttccatctct caaaggaaga 2700
atcccttcag ggttgcgttt ccag 2724
<210> 7
<211> 2000
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ctaccaatgc tctcgaggat tgcctgaaca ttgacattcg gcgtccggcc gggaccaccg 60
cggactcgaa gctgcctgtg ctggtctgga tctttggcgg aggctttgaa cttggttcaa 120
aggcgatgta tgatggtaca acgatggtat catcgtcgat agacaagaac atgcctatcg 180
tgtttgtagc aatgaattat cgcgtgggag gtttcgggtt cttgcccgga aaggagatcc 240
tggaggacgg gtccgcgaac ctagggctcc tggaccaacg ccttgccctg cagtgggttg 300
ccgacaacat cgaggccttt ggtggagacc cggacaaggt gacgatttgg ggagaatcag 360
caggagccat ttccgttttt gatcagatga tcttgtacga cggaaacatc acttacaagg 420
ataagccctt gttccggggg gccatcatgg actccggtag tgttgttccc gcagaccccg 480
tcgatggggt caagggacag caagtatatg atgcggtagt ggaatctgca ggctgttcct 540
cttctaacga caccctagct tgtctgcgtg aactagacta caccgacttc ctcaatgcgg 600
caaactccgt gccaggcatt ttaagctacc attctgtggc gttatcatat gtgcctcgac 660
cggacgggac ggcgttgtcg gcatcaccgg acgttttggg caaagcaggg aaatatgctc 720
gggtcccgtt catcgtgggc gaccaagagg atgaggggac cttattcgcc ttgtttcagt 780
ccaacattac gacgatcgac gaggtggtcg actacctggc ctcatacttc ttctatgacg 840
ctagccgaga gcagcttgaa gaactagtgg ccctgtaccc agacaccacc acgtacgggt 900
ctccgttcag gacaggcgcg gccaacaact ggtatccgca atttaagcga ttggccgcca 960
ttctcggcga cttggtcttc accattaccc ggcgggcatt cctctcgtat gcagaggaaa 1020
tctcccctga tcttccgaac tggtcgtacc tggcgaccta tgactatggc accccagttc 1080
tggggacctt ccacggaagt gacctgctgc aggtgttcta tgggatcaag ccaaactatg 1140
cagctagttc tagccacacg tactatctga gctttgtgta tacgctggat ccgaactcca 1200
accgggggga gtacattgag tggccgcagt ggaaggaatc gcggcagttg atgaatttcg 1260
gagcgaacga cgccagtctc cttacggatg atttccgcaa cgggacatat gagttcatcc 1320
tgcagaatac cgcggcgttc cacatctgat gccattggcg gaggggtccg gacggtcagg 1380
aacttagcct tatgagatga atgatggacg tgtctggcct cggaaaagga tatatgggga 1440
tcatgatagt actagccata ttaatgaagg gcatatacca cgcgttggac ctgcgttata 1500
gcttcccgtt agttatagta ccatcgttat accagccaat caagtcacca cgcacgaccg 1560
gggacggcga atccccggga attgaaagaa attgcatccc aggccagtga ggccagcgat 1620
tggccacctc tccaaggcac agggccattc tgcagcgctg gtggattcat cgcaatttcc 1680
cccggcccgg cccgacaccg ctataggctg gttctcccac accatcggag attcgtcgcc 1740
taatgtctcg tccgttcaca agctgaagag cttgaagtgg cgagatgtct ctgcaggaat 1800
tcaagctaga tgctaagcga tattgcatgg caatatgtgt tgatgcatgt gcttcttcct 1860
tcagcttccc ctcgtgcaga tgaggtttgg ctataaattg aagtggttgg tcggggttcc 1920
gtgaggggct gaagtgcttc ctccctttta gacgcaactg agagcctgag cttcatcccc 1980
agcatcatta cacctcagca 2000
<210> 8
<211> 2000
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
acaatcaatc catttcgcta tagttaaagg atggggatga gggcaattgg ttatatgatc 60
atgtatgtag tgggtgtgca taatagtagt gaaatggaag ccaagtcatg tgattgtaat 120
cgaccgacgg aattgaggat atccggaaat acagacaccg tgaaagccat ggtctttcct 180
tcgtgtagaa gaccagacag acagtccctg atttaccctt gcacaaagca ctagaaaatt 240
agcattccat ccttctctgc ttgctctgct gatatcactg tcattcaatg catagccatg 300
agctcatctt agatccaagc acgtaattcc atagccgagg tccacagtgg agcagcaaca 360
ttccccatca ttgctttccc caggggcctc ccaacgacta aatcaagagt atatctctac 420
cgtccaatag atcgtcttcg cttcaaaatc tttgacaatt ccaagagggt ccccatccat 480
caaacccagt tcaataatag ccgagatgca tggtggagtc aattaggcag tattgctgga 540
atgtcggggc cagttggccc ggtggtcatt ggccgcctgt gatgccatct gccactaaat 600
ccgatcattg atccaccgcc cacgaggcgc gtctttgctt tttgcgcggc gtccaggttc 660
aactctctct gcagctccag tccaacgctg actgactagt ttacctactg gtctgatcgg 720
ctccatcaga gctatggcgt tatcccgtgc cgttgctgcg caatcgctat cttgatcgca 780
accttgaact cactcttgtt ttaatagtga tcttggtgac ggagtgtcgg tgagtgacaa 840
ccaacatcgt gcaagggaga ttgatacgga attgtcgctc ccatcatgat gttcttgccg 900
gctttgttgg ccctattcgt gggatgcgat gccctcgctg tgcagcagca ggtactgctg 960
gatgaggagc catcggtctc tgcacgcaaa cccaacttcc tcttcattct cacggatgat 1020
caggatctcc ggatgaattc tccggcgtat atgccgtata cgcaggcgag aatcaaggaa 1080
aagggtaccg agttcttgaa ccatttcgtc actaccgcgc tttgctgtcc gtcgcgcgtg 1140
agtctttgga cgggaagaca ggctcataat actaatgtga cggatgtgaa cccgccttat 1200
ggtatggaca ctgcttcgat cggtcttgat tcttcagcgt ggttacaatt gctaatgcgg 1260
cataggcgga taccccaaat tcgtcgctca aggcttcaac gaaaacttcc tccccgtttg 1320
gctgcagtcc gccggttaca atacctacta cacggggaag ctgttcaact cgcacagtgt 1380
cgctacctat aacgcgccct ttgtgaacgg tttcaatggc tccgacttcc tcctcgaccc 1440
ccacacatat tcctactgga atgcgacata ccagcgaaac catgagcctc cgcggagtta 1500
cgagggacaa tatactacgg atgtgatgaa ggagaaggca tcgggattgt tggcagatgc 1560
gctggacagt gacgcgccat tcttcctgac ggtcgcgccg atcgcaccgc acacgaacat 1620
cgatgtggag gggctgagcg gtgcgggtgg accgaagatg acagagccgc tgcctgcacc 1680
gagacatgcg catttgtttg ctgatgcaaa ggtgccgcgg acgcctaatt tcaatccgga 1740
caaggtgtgt gatatcctga cacagtggtg gggacgggca ctgacaagag taggattctg 1800
gtgcggggtg gatccaaacc atggaactac agaaccagac cgtcatcgac tacgaagacc 1860
atctttatcg ccagcgtctg cgcactttgc aagccgtcga tgagatggtg gatgcgctga 1920
tcacgcagct ggaagaaagt gggcagatcg acaataccta catcatttac agtgctgata 1980
acggctacca cattggccat 2000