促进普鲁兰酶胞外表达的信号肽
阅读说明:本技术 促进普鲁兰酶胞外表达的信号肽 (Signal peptide for promoting pullulanase extracellular expression ) 是由 佟毅 刘松 徐奎栋 李江华 陈坚 于 2020-07-30 设计创作,主要内容包括:本发明公开了促进普鲁兰酶胞外表达的信号肽,属于基因工程及酶工程技术领域。本发明是以枯草芽孢杆菌(Bacillus subtilis)表达宿主,通过对枯草芽孢杆菌内源信号肽AprE、SacB、Epr进行同义突变,得到能使胞外蛋白量显著提高的同义突变序列,在保证蛋白正常翻译的同时,又能提高蛋白的表达量。Apre、Epr、SacB信号肽的同义突变序列分别能使胞外酶活较野生型提高2.92,1.08,1.37倍,从而为普鲁兰酶的胞外高效表达提供一种策略。(The invention discloses a signal peptide for promoting the extracellular expression of pullulanase, belonging to the technical field of genetic engineering and enzyme engineering. According to the invention, a Bacillus subtilis expression host is used, and a synonymous mutation sequence capable of obviously improving the extracellular protein amount is obtained by performing synonymous mutation on Bacillus subtilis endogenous signal peptides AprE, SacB and Epr, so that the normal translation of the protein is ensured, and the expression amount of the protein can be improved. The synonymous mutation sequences of the Apre, Epr and SacB signal peptides can respectively improve the extracellular enzyme activity by 2.92, 1.08 and 1.37 times compared with the wild type, thereby providing a strategy for the extracellular high-efficiency expression of the pullulanase.)
技术领域
本发明涉及促进普鲁兰酶胞外表达的信号肽,属于基因工程及酶工程技术领域。
背景技术
普鲁兰酶(pullulanase,EC 3.2.1.41)属于α-淀粉酶家族,能特异性水解支链淀粉的分支α-1,6-糖苷键,又称为淀粉脱支酶。但由于野生菌作为生产菌产普鲁兰酶时,存在诸多问题,包括培养困难,产量很低等,因此难以实现工业化大规模生产。随着基因工程的迅速发展,普鲁兰酶编码基因实现了在不同基因工程菌株中的异源表达。
我们前期研究中已经成功实现普鲁兰酶在枯草芽孢杆菌的可溶性表达,而且已经用强启动子PlytR来驱动普鲁兰酶的表达(Yang,S等Characterization and applicationof endogenous phase-dependent promoters in Bacillus subtilis.Appl MicrobiolBiotechnol,2017)。但是通过目前的这些手段,虽然已经使得普鲁兰酶的胞外酶活得到了显著提升,但是依旧以满足大规模工业化的生产需求。因而如何能够进一步提升普鲁兰酶的胞外表达量,仍然是一个亟待解决的问题。
发明内容
为解决上述存在的问题,进一步提升普鲁兰酶的胞外表达量,本发明通过同义突变手段,以期能提高普鲁兰酶的胞外表达。基因的同义突变可使氨基酸序列不变,但可使基因转录水平发生显著的改变。本发明通过同义突变手段改造基因N端编码区,既可以实现基因表达量的显著提高,同时又对酶活的影响几乎可忽略不计。本发明通过同义突变筛选到的信号肽,能够显著提高普鲁兰酶的胞外酶活。
本发明提供了一类信号肽,所述信号肽的核苷酸序列如SEQ ID NO.1~3所示任一。
在本发明的一种实施方式中,所述信号肽的核苷酸序列分别为信号肽AprE,SacB,Epr同义突变序列。
在本发明的一种实施方式中,所述信号肽AprE的同义突变序列如SEQ ID NO.1所示;所述信号肽SacB的同义突变序列如SEQ ID NO.2所示;所述信号肽Epr的同义突变序列如SEQ ID NO.3所示。
本发明提供了含有核苷酸序列如SEQ ID NO.1~3所示的信号肽的重组质粒。
在本发明的一种实施方式中,所述重质粒以任意可以在枯草芽孢杆菌中表达的载体为出发载体。
在本发明的一种实施方式中,所述出发载体包括P43NMK。
在本发明的一种实施方式中,所述重组质粒上还含有组成型启动子。
在本发明的一种实施方式中,所述组成型启动子包括LytR启动子,LytR启动子核苷酸序列如SEQ ID NO.4所示。
本发明提供了含有核苷酸序列如SEQ ID NO.1~3所示的信号肽的重组菌。
在本发明的一种实施方式中,所述重组菌以枯草芽孢杆菌为宿主。
在本发明的一种实施方式中,所述重组菌以枯草芽孢杆菌WB600,或枯草芽孢杆菌168为宿主。
本发明提供一种提高蛋白表达量的方法,把含有核苷酸序列如SEQ ID NO.1~3所示的信号肽的重组菌作为发酵菌株,生产蛋白。
在本发明的一种实施方式中,将重组菌培养为OD600不低于3.0的菌液,再将菌液按照1~10mL/100mL的比例接种至反应体系中。
在本发明的一种实施方式中,培养体系的培养基为TB培养基,在30~40℃、200~250rpm培养25~35小时。
本发明提供一种提高枯草芽孢杆菌胞外蛋白表达量的方法,在编码蛋白的核苷酸序列的N端添加核苷酸序列如SEQ ID NO.1~3所示的信号肽。
在本发明的一种实施方式中,在目的蛋白的N端添加核苷酸序列如SEQ ID NO.1~3所示的信号肽,并构建重组质粒,将重组质粒导入枯草芽孢杆菌。
在本发明的一种实施方式中,在编码目的蛋白的核苷酸序列的起始密码子ATG后***核苷酸序列如SEQ ID NO.1~3所示的信号肽。
在本发明的一种实施方式中,所述目的蛋白为任意能够在枯草芽孢杆菌胞外表达的蛋白。
在本发明的一种实施方式中,所述目的蛋白包括普鲁兰酶和/或sfGFP。
在本发明的一种实施方式中,所述普鲁兰酶氨基酸序列的NCBI登录号为AMQ67157,氨基酸序列如SEQ ID NO.5所示。
在本发明的一种实施方式中,编码所述sfGFP的核苷酸序列如SEQ ID NO.7所示。
本发明还保护核苷酸序列如SEQ ID NO.1~3所示的信号肽,或含有核苷酸序列如SEQ ID NO.1~3所示的信号肽的重组质粒,或含有核苷酸序列如SEQ ID NO.1~3所示的信号肽的重组菌在提高胞外蛋白表达量中的应用。
本发明还保护提高蛋白表达量的方法在提高胞外蛋白表达量中的应用。
本发明还保护提高枯草芽孢杆菌胞外蛋白表达量的方法在提高胞外蛋白表达量中的应用。
本发明还保护所述重组质粒,或重组菌,或所述信号肽AprE,SacB,Epr同义突变序列在提高胞外蛋白表达量中的应用。
本发明的有益效果:
本发明通过将信号肽AprE,SacB,Epr同义突变,从中筛选出能够提高蛋白胞外表达量的同义突变序列,将所得的突变序列融合在普鲁兰酶的N端,可显著提高和降低普鲁兰酶的胞外酶活产量,在枯草芽孢杆菌中转化生产,普鲁兰酶的胞外酶活分别提高2.92,1.08,1.37倍。
附图说明
图1为信号肽和sfGFP分别融合在普鲁兰酶N端和C端的表达质粒图谱(以AprE为例)。
图2为信号肽融合在普鲁兰酶N端的表达质粒图谱(以AprE为例)。
图3为野生型与NCS改造菌株分泌的普鲁兰酶胞外酶活。
具体实施方式
种子培养基:蛋白胨10g/L,酵母提取物5g/L,氯化钠5g/L。
发酵培养基为TB培养基:蛋白胨12g/L,酵母提取物24g/L,甘油4mL/L,KH2PO40.017mol/L,K2HPO4 0.072mol/L。
种子培养:挑取工程菌单菌落接入装液量为25mL的三角瓶(250mL)中,培养温度37℃,摇床转速200r/min,培养12h。
发酵培养:按4%(v/v)的接种量接入装液量为25mL的三角瓶(250mL)中,培养温度37℃,发酵48h。
绿色荧光蛋白表达量及生物量测定:在96孔板中假如200μL稀释后的发酵液,使用Cytation3细胞成像微孔板检测仪(美国伯腾仪器有限公司),绿色荧光激发波长:480nm,绿色荧光发射波长:520nm,细胞生长OD吸收波长:600nm。
普鲁兰酶酶活测定方法:将1mL 1mg/100mL的普鲁兰多糖底物和0.9mL 100mM pH4.5乙酸-乙酸钠缓冲液混合均匀,置于60℃水浴锅内预热10min,加入普鲁兰酶液0.1mL,反应10min后,加入3mL DNS显色液,然后于沸水浴中煮7min,置于冰水中终止显色反应,再加10mL去离子水,混匀,在540nm下测定吸光值。
酶活定义:单位时间内生成1μmol还原糖的酶量为一个酶活力单位。
实施例1:Apre信号肽NCS同义突变文库的构建
将LytR启动子(序列信息见SEQ ID NO.4所示)通过一步克隆试剂盒(购自南京诺唯赞生物科技有限公司公司)连接至P43NMK质粒,构建得到重组质粒,将重组质粒转入E.coli JM109中,将菌液涂布于含有100μg/L氨苄霉素抗性的LB平板,37℃培养至长出单克隆,挑取单克隆测序验证,得到质粒P43NMK-LytR;利用相同的一步克隆方法,将普鲁兰酶基因(核苷酸序列如SEQ ID NO.6所示)通过一步克隆试剂盒融合至LytR的下游,构建得到重组质粒P43NMK-LytR-Pul;利用相同的一步克隆方法,分别将sfGFP荧光蛋白和Apre信号肽(核苷酸序列如SEQ ID NO.7和8所示)分别连接至普鲁兰酶的C端和N端,构建得到重组质粒P43NMK-Apre-Pul。
以P43NMK-Apre-Pul为模板,使用上下游简并引物,通过PCR获得Apre的N端前30位碱基的同义突变文库(同义突变重组质粒),即前30位氨基酸序列不变,核苷酸序列改变。
上游简并引物:
ATGAGRAGYAARAARTTRTGGATHAGYTTRTTRtttgcgttaacgttaatctttacgatgg(SEQ IDNO.12);
下游简并引物:
GTGTACATTTCACCTCCTTTAAATTACTTTCATTAT(SEQ ID NO.11)。
实施例2:SacB信号肽NCS同义突变文库的构建
具体实施方式同实施例1,区别在于,在得到P43NMK-LytR-Pul后,利用一步克隆法,分别将sfGFP荧光蛋白和SacB信号肽(核苷酸序列如SEQ ID NO.9所示)分别连接至普鲁兰酶的C端(sfGFP荧光蛋白)和N端(SacB信号肽),构建得到重组质粒P43NMK-SacB-Pul。
以P43NMK-SacB-Pul为模板,使用上下游简并引物,通过PCR获得SacB的N端前30位碱基的同义突变文库(同义突变重组质粒),即前30位氨基酸序列不变,核苷酸序列改变。
上游简并引物:
ATGCTNAARAGRACNTCNTTYGTNTCNTCNTTRttcatcagttcagctgttttactatcaatct(SEQID NO.13);
下游简并引物:
GTGTACATTTCACCTCCTTTAAATTACTTTCATTAT(SEQ ID NO.11)。
实施例3:Epr信号肽NCS同义突变文库的构建
具体实施方式同实施例1,区别在于,在得到P43NMK-LytR-Pul后,利用一步克隆法,分别将sfGFP荧光蛋白和Epr信号肽(核苷酸序列如SEQ ID NO.10所示)分别连接至普鲁兰酶的C端(sfGFP荧光蛋白)和N端(SacB信号肽),构建得到重组质粒P43NMK-SacB-Pul。
以P43NMK-Epr-Pul为模板,使用上下游简并引物,PCR获得Epr的N端前30位碱基的同义突变文库(同义突变重组质粒),即前30位氨基酸序列不变,核苷酸序列改变。
上游简并引物:
ATGTTRAARAARGTNATHTTRGCNGCNTTYATHttagtaggaagtactttgggagctttta(SEQ IDNO.14);
下游简并引物:
GTGTACATTTCACCTCCTTTAAATTACTTTCATTAT(SEQ ID NO.11)。
实施例4:NCS同义突变文库信号肽核苷酸序列的筛选
(1)将实施例1~3中构建得到的同义突变重组质粒分别转化至表达宿主枯草芽孢杆菌WB600中,将转化液涂布于含50μg/mL卡纳霉素抗性的LB平板上挑战生长,在37℃下培养至长出单克隆,挑取单克隆至含有50μg/mL卡纳霉素抗性200μL LB培养基的96浅孔板,培养8小时,得到种子液;
(2)将种子液按照4mL/100mL的接种量,接种至含有50μg/mL卡纳霉素抗性800μLTB培养基的96深孔板,培养24小时,得到发酵液;
(3)将发酵液迅速置于冰上冷冻,离心后,去除上清,使用100mM的PBS缓冲液(pH7.2)稀释至合适倍数后,通过酶标仪测定荧光值(激发光480,吸收光520)以及OD600。
定义相对荧光强度RFI=荧光值/OD,根据RFI值的高低,选择相对荧光强度最高的细胞送至上海生工公司测序。
经测序鉴定后,AprE信号肽在N端成功实现同义突变,其突变部分的核苷酸序列见SEQ ID NO.15所示;SacB信号肽在N端成功实现同义突变,其突变部分的核苷酸序列如SEQID NO.16所示;Epr信号肽在N端成功实现同义突变,其突变部分的核苷酸序列如SEQ IDNO.17。
实施例5:同义突变信号肽在提高普鲁兰酶胞外表达量中的应用
从实施例4中得到的荧光强度最高的、并已测序的细胞提取质粒,以提取得到的质粒为模板,使用引物通过PCR,分别去除sfGFP荧光蛋白,得到去除了荧光蛋白的重组质粒,将分别含有AprE信号肽、SacB信号肽、Epr信号肽同义突变序列的重组质粒转化到枯草芽孢杆菌WB600中,得到重组菌,并将其接种至含有50μg/mL卡纳霉素抗性20mL LB培养基的250mL摇瓶中,37℃、220rpm发酵8小时后,使得OD600达到4以上,按照4mL/100mL的比例接种到含有50μg/mL卡纳霉素抗性25mL TB培养基的250mL摇瓶中,在37℃、250rpm发酵30小时后,测定普鲁兰酶的胞外酶活,结果如图3所示。
去除sfGFP上游引物:
CGGTAAAAAATAAtgagattatcaaaaaggatcttcacctagat(SEQ ID NO.18);
去除sfGFP下游引物:
gataatctcaTTATTTTTTACCGTGATCTGGAGAAACttc(SEQ ID NO.19)。
通过测定普鲁兰酶的胞外酶活,发现Apre、Epr、SacB信号肽的同义突变序列分别能使胞外酶活较野生型提高2.92,1.08,1.37倍。
表1普鲁兰酶胞外酶活(U/mL)
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
SEQUENCE LISTING
<110> 吉林中粮生化有限公司
江南大学
<120> 促进普鲁兰酶胞外表达的信号肽
<160> 19
<170> PatentIn version 3.3
<210> 1
<211> 84
<212> DNA
<213> 人工序列
<400> 1
agaagtaaaa aattatggat aagtttatta tttgcgttaa cgttaatctt tacgatggcg 60
ttcagcaaca tgtctgcgca ggct 84
<210> 2
<211> 84
<212> DNA
<213> 人工序列
<400> 2
aatataaaaa aatttgcaaa acaagctaca gtattaacct ttactaccgc actgctggca 60
ggaggcgcaa ctcaagcgtt tgcg 84
<210> 3
<211> 78
<212> DNA
<213> 人工序列
<400> 3
aaaaatatgt cttgtaaact agttgtatct gtcactctgt ttttcagttt tctcaccata 60
ggccctctcg ctcatgcg 78
<210> 4
<211> 320
<212> DNA
<213> 人工序列
<400> 4
ctaaccctac ataagtacct tcttttgttt caatgttact gtctggcgat acatcttcac 60
cttgactctt ttgactatta accccgcaac ccgaaagaag caatataaag aacagtaaag 120
caataaattt tttcattttt ttcacctcat tatattttat cgtcaaccta ttttatattt 180
taaagaaaaa ttaagaaaca atgaaacttt tttttataaa aaacgactat tttaggattt 240
cattcttgta ttaaatagag ttgtatttat tggaaattta actcataatg aaagtaattt 300
aaaggaggtg aaatgtacac 320
<210> 5
<211> 724
<212> PRT
<213> 人工序列
<400> 5
Asp Ala Ala Lys Pro Ala Val Ser Asn Ala Tyr Leu Asp Ala Ser Asn
1 5 10 15
Gln Val Leu Val Lys Leu Ser Gln Pro Leu Thr Leu Gly Glu Gly Ala
20 25 30
Ser Gly Phe Thr Val His Asp Asp Thr Ala Asn Lys Asp Ile Pro Val
35 40 45
Thr Ser Val Lys Asp Ala Ser Leu Gly Gln Val Glu Ser Gly Val Lys
50 55 60
Thr Asp Leu Val Thr Val Thr Leu Gly Glu Asp Pro Asp Val Ser His
65 70 75 80
Thr Leu Ser Ile Gln Thr Asp Gly Tyr Gln Ala Lys Gln Val Ile Pro
85 90 95
Arg Asn Val Leu Asn Ser Ser Gln Tyr Tyr Tyr Ser Gly Asp Asp Leu
100 105 110
Gly Asn Thr Tyr Thr Gln Lys Ala Thr Thr Phe Lys Val Trp Ala Pro
115 120 125
Thr Ser Thr Gln Val Asn Val Leu Leu Tyr Asp Ser Ala Thr Gly Ser
130 135 140
Val Thr Lys Ile Val Pro Met Thr Ala Ser Gly His Gly Val Trp Glu
145 150 155 160
Ala Thr Val Asn Gln Asn Leu Glu Asn Trp Tyr Tyr Met Tyr Glu Val
165 170 175
Thr Gly Gln Gly Ser Thr Arg Thr Ala Val Asp Pro Tyr Ala Thr Ala
180 185 190
Ile Ala Pro Asn Gly Thr Arg Gly Met Ile Val Asp Leu Ala Lys Thr
195 200 205
Asp Pro Ala Gly Trp Asn Ser Asp Lys His Ile Thr Pro Lys Asn Ile
210 215 220
Glu Asp Glu Val Ile Tyr Glu Met His Val Arg Asp Phe Ser Ile Asp
225 230 235 240
Pro Asn Ser Gly Met Lys Asn Lys Gly Lys Tyr Leu Ala Leu Thr Glu
245 250 255
Lys Gly Thr Lys Gly Pro Asp Asn Val Lys Thr Gly Ile Asp Ser Leu
260 265 270
Lys Gln Leu Gly Ile Thr His Val Gln Leu Met Pro Val Phe Ala Ser
275 280 285
Asn Ser Val Asp Glu Thr Asp Pro Thr Gln Tyr Asn Trp Gly Tyr Asp
290 295 300
Pro Arg Asn Tyr Asp Val Pro Glu Gly Gln Tyr Ala Thr Asn Ala Asn
305 310 315 320
Gly Asn Ala Arg Ile Lys Glu Phe Lys Glu Met Val Leu Ser Leu His
325 330 335
Arg Glu His Ile Gly Val Asn Met Asp Val Val Tyr Asn His Thr Phe
340 345 350
Ala Thr Gln Ile Ser Asp Phe Asp Lys Ile Val Pro Glu Tyr Tyr Tyr
355 360 365
Arg Thr Asp Asp Ala Gly Asn Tyr Thr Asn Gly Ser Gly Thr Gly Asn
370 375 380
Glu Ile Ala Ala Glu Arg Pro Met Val Gln Lys Phe Ile Ile Asp Ser
385 390 395 400
Leu Lys Tyr Trp Val Asn Glu Tyr His Ile Asp Gly Phe Arg Phe Asp
405 410 415
Leu Met Ala Leu Leu Gly Lys Asp Thr Met Ser Lys Ala Ala Ser Glu
420 425 430
Leu His Ala Ile Asn Pro Gly Ile Ala Leu Tyr Gly Glu Pro Trp Thr
435 440 445
Gly Gly Thr Ser Ala Leu Pro Asp Asp Gln Leu Leu Thr Lys Gly Ala
450 455 460
Gln Lys Gly Met Gly Val Ala Val Phe Asn Asp Asn Leu Arg Asn Ala
465 470 475 480
Leu Asp Gly Asn Val Phe Asp Ser Ser Ala Gln Gly Phe Ala Thr Gly
485 490 495
Ala Thr Gly Leu Thr Asp Ala Ile Lys Asn Gly Val Glu Gly Ser Ile
500 505 510
Asn Asp Phe Thr Ser Ser Pro Gly Glu Thr Ile Asn Tyr Val Thr Ser
515 520 525
His Asp Asn Tyr Thr Leu Trp Asp Lys Ile Ala Leu Ser Asn Pro Asn
530 535 540
Asp Ser Glu Ala Asp Arg Ile Lys Met Asp Glu Leu Ala Gln Ala Val
545 550 555 560
Val Met Thr Ser Gln Gly Val Pro Phe Met Gln Gly Gly Glu Glu Met
565 570 575
Leu Arg Thr Lys Gly Gly Asn Asp Asn Ser Tyr Asn Ala Gly Asp Ala
580 585 590
Val Asn Glu Phe Asp Trp Ser Arg Lys Ala Gln Tyr Pro Asp Val Phe
595 600 605
Asn Tyr Tyr Ser Gly Leu Ile His Leu Arg Leu Asp His Pro Ala Phe
610 615 620
Arg Met Thr Thr Ala Asn Glu Ile Asn Ser His Leu Gln Phe Leu Asn
625 630 635 640
Ser Pro Glu Asn Thr Val Ala Tyr Glu Leu Thr Asp His Val Asn Lys
645 650 655
Asp Lys Trp Gly Asn Ile Ile Val Val Tyr Asn Pro Asn Lys Thr Val
660 665 670
Ala Thr Ile Asn Leu Pro Ser Gly Lys Trp Ala Ile Asn Ala Thr Ser
675 680 685
Gly Lys Val Gly Glu Ser Thr Leu Gly Gln Ala Glu Gly Ser Val Gln
690 695 700
Val Pro Gly Ile Ser Met Met Ile Leu His Gln Glu Val Ser Pro Asp
705 710 715 720
His Gly Lys Lys
<210> 6
<211> 2172
<212> DNA
<213> 人工序列
<400> 6
gatgctgcta aaccagcagt ttctaacgct taccttgacg cttctaacca agttttagtt 60
aaattatctc aaccattaac attaggtgaa ggtgcttctg gtttcactgt acatgatgac 120
actgctaaca aagacatccc agtaacatct gtaaaagacg cttctttagg tcaagttgaa 180
tcaggtgtaa aaactgacct tgttactgtt actttaggcg aagatccaga tgtatctcac 240
actttatcta tccaaacaga cggttaccaa gctaaacaag taatcccacg taacgtactt 300
aactcttctc aatattacta ttctggtgat gatttaggaa acacatacac acaaaaagct 360
actactttca aagtttgggc tcctacatct actcaagtta acgtattgtt atacgattct 420
gctacaggta gcgttacaaa aatcgttcca atgacggctt caggtcacgg tgtttgggag 480
gctactgtta accaaaactt agaaaactgg tactacatgt acgaagtaac tggtcaaggt 540
tctacacgca ctgctgttga tccttacgct actgctatcg ctccaaacgg tacacgcggc 600
atgatcgtag atttagctaa aactgaccca gcaggttgga actctgataa acacattact 660
ccaaaaaaca ttgaagatga agttatctac gaaatgcacg tacgtgattt ctctatcgat 720
ccaaactcag gtatgaaaaa caaaggtaaa tacttagctc taactgaaaa aggcactaaa 780
ggtcctgata acgttaaaac aggtatcgac tctcttaagc aattaggtat tacacatgtt 840
caattaatgc cagttttcgc atctaactca gttgacgaaa ctgatccaac acaatacaac 900
tggggttacg acccacgtaa ctacgatgta ccagaaggtc aatatgcaac taacgctaac 960
ggtaacgcac gtattaaaga attcaaagaa atggttttat cactacaccg tgagcacatc 1020
ggtgttaaca tggacgttgt ttacaaccac acgttcgcta ctcaaatctc tgacttcgat 1080
aaaattgttc cagagtacta ttaccgcact gacgacgcag gtaactacac taacggttct 1140
ggtactggta acgaaattgc tgcagaacgt cctatggtgc aaaaattcat catcgatagc 1200
cttaaatact gggttaacga ataccacatt gacggcttcc gtttcgactt aatggcttta 1260
cttggtaaag acacaatgtc taaggctgct tctgagttac atgctatcaa cccaggtatt 1320
gctttatatg gcgaaccttg gactggtggt acaagcgctc ttcctgacga ccaactttta 1380
actaaaggtg cacaaaaagg catgggagta gctgtattca acgataacct tcgtaacgca 1440
ttagacggaa acgttttcga ttcttctgct caaggattcg caacaggagc tacaggtctg 1500
actgatgcta ttaaaaacgg agttgaagga tcaatcaacg atttcacttc ttctcctggc 1560
gaaacaatta actacgttac atcacacgat aactacactc tttgggacaa aatcgctttg 1620
tctaacccta acgactctga agcagatcgc atcaaaatgg atgagcttgc tcaagctgtt 1680
gttatgactt ctcaaggtgt acctttcatg caaggtggtg aagaaatgtt acgcactaaa 1740
ggtggtaacg ataacagcta taacgcgggt gatgctgtaa acgaattcga ctggtctcgt 1800
aaagctcaat accctgacgt tttcaactac tactcaggtt taatccacct tcgtcttgac 1860
catccagctt tccgtatgac aacagctaac gaaatcaact ctcaccttca attccttaac 1920
tcacctgaaa acacagtagc ttacgaactt actgaccacg taaacaaaga taaatggggt 1980
aacattatcg ttgtttacaa ccctaacaag actgtagcaa ctatcaactt accatctggt 2040
aaatgggcta tcaacgcaac tagcggtaaa gtaggtgaat ctacattagg tcaagctgaa 2100
ggatctgtac aagttcctgg tatttctatg atgatccttc accaagaagt ttctccagat 2160
cacggtaaaa aa 2172
<210> 7
<211> 717
<212> DNA
<213> 人工序列
<400> 7
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60
gacgtaaacg gccacaagtt cagcgtgaga ggcgagggcg agggcgatgc caccaatggc 120
aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180
gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcgc 240
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcagtttc 300
aaggacgacg gcacatacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420
ctggagtaca acttcaacag ccacaacgtc tatatcacgg ccgacaagca gaagaacggc 480
atcaaggcca acttcaagat ccgccacaac gtggaggacg gcagcgtgca gctcgccgac 540
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600
ctgagcaccc agtccgtgct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660
ctggagttcg tgaccgccgc cgggatcact cacggcatgg acgagctgta caagtaa 717
<210> 8
<211> 84
<212> DNA
<213> 人工序列
<400> 8
agaagcaaaa aattgtggat cagcttgttg tttgcgttaa cgttaatctt tacgatggcg 60
ttcagcaaca tgtctgcgca ggct 84
<210> 9
<211> 84
<212> DNA
<213> 人工序列
<400> 9
aacatcaaaa agtttgcaaa acaagcaaca gtattaacct ttactaccgc actgctggca 60
ggaggcgcaa ctcaagcgtt tgcg 84
<210> 10
<211> 78
<212> DNA
<213> 人工序列
<400> 10
aaaaacatgt cttgcaaact tgttgtatca gtcactctgt ttttcagttt tctcaccata 60
ggccctctcg ctcatgcg 78
<210> 11
<211> 36
<212> DNA
<213> 人工序列
<400> 11
gtgtacattt cacctccttt aaattacttt cattat 36
<210> 12
<211> 61
<212> DNA
<213> 人工序列
<400> 12
atgagragya araarttrtg gathagyttr ttrtttgcgt taacgttaat ctttacgatg 60
g 61
<210> 13
<211> 64
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (6)..(6)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (27)..(27)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, or t
<400> 13
atgctnaara gracntcntt ygtntcntcn ttrttcatca gttcagctgt tttactatca 60
atct 64
<210> 14
<211> 61
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (27)..(27)
<223> n is a, c, g, or t
<400> 14
atgttraara argtnathtt rgcngcntty athttagtag gaagtacttt gggagctttt 60
a 61
<210> 15
<211> 30
<212> DNA
<213> 人工序列
<400> 15
agaagtaaaa aattatggat aagtttatta 30
<210> 16
<211> 30
<212> DNA
<213> 人工序列
<400> 16
aatataaaaa aatttgcaaa acaagctaca 30
<210> 17
<211> 30
<212> DNA
<213> 人工序列
<400> 17
aaaaatatgt cttgtaaact agttgtatct 30
<210> 18
<211> 44
<212> DNA
<213> 人工序列
<400> 18
cggtaaaaaa taatgagatt atcaaaaagg atcttcacct agat 44
<210> 19
<211> 40
<212> DNA
<213> 人工序列
<400> 19
gataatctca ttatttttta ccgtgatctg gagaaacttc 40