一种水稻育性调控基因及其突变体与应用

文档序号:1751419 发布日期:2019-11-29 浏览:38次 >En<

阅读说明:本技术 一种水稻育性调控基因及其突变体与应用 (A kind of rice fertility controlling gene and its mutant and application ) 是由 黄培劲 龙湍 唐杰 刘昊 李佳林 李新鹏 安保光 曾翔 吴永忠 于 2018-08-30 设计创作,主要内容包括:本发明提供一种水稻育性调控基因及其突变体与应用。本发明提供了具有调控水稻雄性生殖细胞发育和花粉育性功能的水稻基因GMS1,其CDS序列如SEQ ID NO:2所示,氨基酸序列如SEQ ID NO:3所示。本发明提供了GMS1基因的辐射诱变突变体和CRISPR敲除突变体,并提供了所述突变体的分子标记鉴定方法。本发明提供的水稻基因GMS1可用于水稻杂交种的不育化制种和生产,具有巨大的应用价值和经济价值。(The present invention provides a kind of rice fertility controlling gene and its mutant and application.The present invention provides paddy gene GMS1, the CDS sequences with the development of adjusting and controlling rice male sex-cell and pollen fertility function as shown in SEQ ID NO:2, and amino acid sequence is as shown in SEQ ID NO:3.The present invention provides the radioinduction mutant of GMS1 gene and CRISPR knockout mutations body, and provide the molecular marker identification method of the mutant.Paddy gene GMS1 provided by the invention can be used for the sterilization production of hybrid seeds and production of hybrid rice seed, have huge application value and economic value.)

一种水稻育性调控基因及其突变体与应用

技术领域

本发明属于生物技术领域,具体地涉及一个植物育性调控基因GMS1、GMS1编码蛋白、GMS1的辐射诱变和基因敲除突变体,以及GMS1基因、蛋白和突变体在杂交育种中的应用。

背景技术

水稻是世界上最重要的粮食作物之一。随着人口的增长和生活品质的提升,据预计到2050年水稻的年产量要提高1-2倍才能满足人类发展的需求。杂交水稻是父母本杂交后获得的子一代,其产量往往比常规稻亲本提高15%以上,抗性和适应性也远胜于亲本。因此,应用和推广杂交水稻是提高水稻产量的一个重要途径。

雄性不育系是杂交水稻育制种技术的关键节点。雄性不育系是指雄配子发育异常而丧失生育能力,雌配子发育正常的植物株系。它只能作为母本接受父本的花粉,自交不能结实。目前杂交水稻生产上应用的雄性不育系有核质互作型和光温敏型两种。核质互作型雄性不育系的不育基因在细胞质中,细胞核中没有育性恢复基因。当细胞核中有育性恢复基因的恢复系与其配组杂交时可以生产可育的子一代杂交种,当细胞核中没有育性恢复基因而细胞质中也没有不育基因的保持系与其杂交时可以繁殖不育系种子。由于需要不育系、保持系和恢复系三系配套,这种杂交水稻育制种技术常被称为“三系法”。一些控制核质互作型不育及相应育性恢复的基因已经被克隆(Chen and Liu,2014,Male sterility andfertility restoration in crops,Annu Rev Plant Biol,65:579-606)。核质互作型不育系是杂交水稻育制种中第一种大规模应用的不育系,为杂交水稻产业的建立和发展奠定了材料基础。然而由于核质互作型不育系的组配受到恢复系基因型的限制,导致只有约5%的种质资源能被利用。而细胞质的不育基因有导致米质差、特定病虫害流行的潜在风险。

光温敏型雄性不育系是一种育性受光温环境调控的不育系。在一定的光温条件下这种不育系保持不育,可用于组配杂交。当条件改变时不育系恢复育性,可用于不育系繁殖。由于光温敏雄性不育系实现了不育系和保持系的合二为一,只需要父本与其配组生产子一代杂交种,因此相应的育制种技术常被称为“两系法”。调控光温敏雄性不育的基因在细胞核中,目前已经克隆的基因包括PMS3、TMS5、CSA和TMS10(Chen and Liu,2014,Malesterility and fertility restoration in crops,Annu Rev Plant Biol,65:579-606;Zhou H,et al,2014,RNase ZS1processes UbL40mRNAs and controls thermosensitivegenic male sterility in rice,Nature Communications,5:4884-4892)。与核质互作型不育系相比,光温敏型不育系繁殖程序简单,配组因恢复基因广泛存在而更自由。光温敏不育系的大规模应用极大地巩固和推动了杂交水稻产业发展。然而,由于该型不育系的育性受光温环境影响,也导致制种风险高,制种地域受到限制。

为了克服目前杂交水稻育制种技术中存在的关键性缺陷,创造和利用新类型的不育系将是重要的突破口。本发明提供了一种作物育性基因及基于该基因突变所产生的隐性核不育类型的雄性不育系。该不育系育性稳定,只受核编码的单基因调控,不受光温环境的影响。该不育系的育性恢复基因广泛存在于水稻种质资源中,也可以通过转野生型基因恢复育性。该基因和该基因突变产生的不育系为研发水稻新型杂交育制种技术提供了元件,为解决现有技术存在的问题奠定了基础。

发明内容

本发明提供一种育性相关基因及其核苷酸和蛋白序列,还包括通过操作该基因在调控植株雄性生育力中的应用。非限制性地举例而言,下文描述的任何方法都可与本发明所提供的相应核苷酸序列一起使用,例如,将所述育性基因的突变体序列引入植株以导致植株雄性不育、使植株内源序列突变、向植株中引入该序列的反义序列、使用发卡形式、或将其与其它核苷酸序列连接起来调控植株的表型,或者是本领域技术人员己知的可用于影响植株的雄性生育力的多种方法中的任一方法。

本发明第一个方面是提供一个花粉发育调控基因GMS1。GMS1位于水稻第2号染色体上,其在粳稻中的基因组核苷酸序列如SEQ ID NO:1所示,CDS序列如SEQ ID NO:2所示,氨基酸序列如SEQ ID NO:3所示。在籼稻中其基因组核苷酸序列如SEQ ID NO:4所示,其CDS和氨基酸序与粳稻相同。在拟南芥(Arabidopsis thaliana)中该育性基因的基因组核苷酸序列如SEQ ID NO:26所示,CDS序列如SEQ ID NO:27所示,氨基酸序列如SEQ ID NO:28所示;在小米(Setaria italica)中该育性基因的基因组核苷酸序列如SEQ ID NO:29所示,CDS序列如SEQ ID NO:30所示,氨基酸序列如SEQ ID NO:31所示;高粱(Sorghum bicolor)中该育性基因的基因组核苷酸序列如SEQ ID NO:32所示,CDS序列如SEQ ID NO:33所示,氨基酸序列如SEQ ID NO:34所示;玉米(Zeamays)中该育性基因的基因组核苷酸序列如SEQID NO:35所示,CDS序列如SEQ ID NO:36所示,氨基酸序列如SEQ ID NO:37所示;二穗短柄草(Brachypodium distachyon)中该育性基因的基因组核苷酸序列如SEQ ID NO:38所示,CDS序列如SEQ ID NO:39所示,氨基酸序列如SEQ ID NO:40所示:大麦(Hordeum vulgare)中该育性基因的基因组核苷酸序列如SEQ ID NO:41所示,CDS序列如SEQ ID NO:42所示,氨基酸序列如SEQ ID NO:43所示;短药野生稻(Oryza brachyantha)中该育性基因的基因组核苷酸序列如SEQ ID NO:44所示,CDS序列如SEQ ID NO:45所示,氨基酸序列如SEQ ID NO:46所示;非洲栽培稻(Oryza glaberrima)中该育性基因的基因组核苷酸序列如SEQ ID NO:47所示,CDS序列如SEQ ID NO:48所示,氨基酸序列如SEQ ID NO:49所示。

上述所述育性基因,可从各种植物中分离获得。本领域技术人员应该知晓,本发明所述的育性恢复基因包括与GMS1基因高度同源,并且具有同样的育性调控功能的高度同源的功能等价序列。所述高度同源的功能等价序列包括在严谨条件下能够与本发明所公开的GMS1基因的核苷酸序列杂交的DNA序列。本发明中所使用的“严谨条件”是公知的,包括诸如在含400mM NaCl、40mM PIPES(pH6.4)和l mM EDTA的杂交液中于60℃杂交12-16小时,然后在65℃下用含0.1%SDS、和0.1×SSC的洗涤液洗涤15-60分钟。

功能等价序列还包括与本发明所公开的GMS1基因所示的序列有至少85%、90%、95%、96%、97%、98%、或99%序列相似性,且具有育性调控功能的DNA序列,可以从任何植物中分离获得。其中,序列相似性的百分比可以通过公知的生物信息学算法来获得,包括Myers和Miller算法(Bioinformatics,4(1):1117,1988)、Needleman-Wunsch全局比对法(JMol Biol,48(3):443-453,1970)、Smith-Waterman局部比对法(J Mol Biol,147:195-197,1981)、Pearson和Lipman相似性搜索法(PNAS,85(8):2444-2448,1988)、Karlin和Altschul的算法(Altschul等,J Mol Biol,215(3):403-410,1990;PNAS,90:5873-5877,1993)。这对于本领域技术人员来说是熟悉的。

基于本发明的上述发现,本发明一种具有调控植物雄性育性功能的DNA片段,其序列为以下任一:

1)具有SEQ ID NO:1或2所示的核苷酸序列;

2)具有SEQ ID NO:4或2所示的核苷酸序列;

3)具有SEQ ID NO:26或27所示的核苷酸序列;

4)具有SEQ ID NO:29或30所示的核苷酸序列;

5)具有SEQ ID NO:32或33所示的核苷酸序列;

6)具有SEQ ID NO:35或36所示的核苷酸序列;

7)具有SEQ ID NO:38或39所示的核苷酸序列;

8)具有SEQ ID NO:41或42所示的核苷酸序列;

9)具有SEQ ID NO:44或45所示的核苷酸序列;

10)具有SEQ ID NO:47或48所示的核苷酸序列;

11)在严格条件下能够与(1)-(10)之任一序列的DNA杂交的DNA片段;或

12)与(1)-(11)之任一所述序列互补的DNA片段;或

13)在(1)-(11)之任一所述序列的基础之上,经过一至数个碱基替换和/或一至数个碱基的***和/或缺失以及大片段的核苷酸序列***/缺失/易位/倒位所形成能够影响植物花粉生育能力的DNA片段;或

14)与(1)-(11)之任一所述序列的DNA片段具有85%以上的同一性且编码水稻雄性育性相关蛋白的DNA片段。

上述DNA片段为GMS1基因或其特异性片段。

本发明提供了所述DNA片段编码的蛋白,为如下1)或2)所述的蛋白:

1)SEQ ID NO:3、28、31、34、37、40、43、46或49所示的氨基酸序列组成的蛋白;

2)将SEQ ID NO:3、28、31、34、37、40、43、46或49经过一个或若干个氨基酸残基的取代和/或缺失和/或添加且具有调控植物雄性育性活性的蛋白。

本发明提供一种生物材料,含有上述的DNA序列,所述生物材料为表达盒,表达载体、工程菌、转基因植物或转基因细胞系。

本发明所述的DNA片段可以从任何植物中分离获得,包括但不限于芸苔属、玉米、小麦、高梁、短药野生稻、非洲栽培稻、短柄草属、两节荠属、白芥、草麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、茵宿、燕麦、油菜籽、大麦、燕麦、黑麦(Rye)、小米、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、亚麻、格兰马草(Gramma grass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘廉、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石角斗、剑兰、菊花、百合科、棉花、校、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,植物包括玉米、小米、拟南芥、二穗短柄草、大豆、红花、芥菜、小麦、大麦、黑麦、短药野生稻、非洲栽培稻、棉花和高粱。

本发明的第二方面是提供了通过影响GMS1的核苷酸序列或者通过调控GMS1基因的转录表达从而影响植株育性的方法。所述影响植株育性是指通过调控GMS1基因的表达,从而使所述植株的育性发生改变,如导致植株雄性不育。具体地,取决于实际应用需求,可以通过多种方法来影响GMS1基因在植物体内的表达,从而达到调控植株雄性育性的效果。更具体地,调控GMS1基因的表达可以使用许多本领域普通技术人员可获得的工具进行,例如,通过理化诱变、***突变、基因打靶敲除、反义基因的转入、共抑制或发夹结构的引入等,都可以用于破坏GMS1基因的正常表达,从而获得雄性不育的植株。另一方面,本发明还包括通过将野生型GMS1的核苷酸序列引入植株来恢复GMS1表达被破坏的植株的雄性生育力。

本发明的第三方面提供了一种DNA分子,其含有所述DNA片段,并在所述DNA片段中***、和/或缺失、和/或取代若干个核苷酸从而导致水稻雄性育性发生改变。

进而本发明提供一种GMS1基因的不育突变体序列及其雄性不育突变体材料。所述雄性不育突变体材料是由核苷酸序列的突变所造成,含有该突变后核苷酸序列的植株表现为雄性不育,所述核苷酸序列如SEQ ID NO:1、2、4、26、27、29、30、32、33、35、36、38、39、41、42、44、45、47或48任一所示,所述的突变为点突变、DNA缺失、***或取代突变、反义基因的转入、共抑制或发夹结构的引入或通过基因沉默手段产生的突变。

具体地,所述雄性不育突变体材料是通过突变水稻内源的GMS1基因,或突变与其高度同源的基因的核苷酸序列,使该植物体丧失雄性育性的过程。所述“突变”包括但不限于以下方法,如用物理或化学的方法导致的基因突变,所述突变可以是点突变,也可以是DNA缺失或***突变。突变还可以是通过RNAi、CRSPR-Cas9、人工核酸酶、定点突变等基因沉默手段产生。

在本发明的一个优选的实施方案中,所述的突变体材料为采用CRISPR-Gas9方法,以序列CTTCGTGATCGGCGACTCCA(靶位点1)和/或序列GAGAGAATGCCAGCTGCCG(靶位点2)为靶位点,使靶位点或靶位点及相邻核苷酸序列突变后得到的植物。

所述植物包括但不限于芸苔属、玉米、小麦、高梁、短药野生稻、非洲栽培稻、短柄草属、两节荠属、白芥、草麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、茵宿、燕麦、油菜籽、大麦、燕麦、黑麦(Rye)、小米、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、亚麻、格兰马草(Gramma grass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘廉、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石角斗、剑兰、菊花、百合科、棉花、校、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,包括玉米、小米、拟南芥、二穗短柄草、大豆、红花、芥菜、小麦、大麦、黑麦、短药野生稻、非洲栽培稻、棉花和高粱。

在本发明的优选实施例中,所述的突变体材料为水稻突变体材料,在水稻基因组所述靶位点1和靶位点2或靶位点及相邻区域内具有以下1)和/或2)中的1种或多种突变,如2种、3种、4种突变:

1)在靶位点1或靶位点1及相邻序列内发生了CGGCGACTCCA、CTCCACGGCG、TCGGCGACTCCA、TCGGCGACTCCA、CCACGGCG、ATCGGCGAC、C、CGGCGGCGGCGGCGGCCCCGCGCCGCACGCCGCTCGTCCCGGCGCTCTTCGTGATCGGCGACT、CTCTTCGTGATCGGCGACTCCA或TCCACGGCGGAC序列缺失突变,或T碱基***突变;

2)在靶位点2或靶位点2及相邻序列内发生了AGCTGC、G、GCTG、TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGCATAGTTG或TG序列缺失突变,或A、CT、GT或GC碱基***突变,或从TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGC到GTTTGT或从CAGCTG到ATAGTTAAAAAATT序列替换突变。

进一步,本发明提供了一种适用于CRISPR/Cas9系统对植物GMS1基因进行定向敲除的靶位点,其为CTTCGTGATCGGCGACTCCA(靶位点1)和/或GAGAGAATGCCAGCTGCCG(靶位点2)。

本发明还提供了一种特异性靶向上述靶位点1或靶位点2的sgRNA。

含有上述sgRNA的DNA序列的CRISPR/Cas9打靶载体属于本发明的保护范围。

更具体地,本发明提供了一种水稻雄性不育突变体,其含有突变后的雄性不育基因,所述突变后的雄性不育基因的基因组核苷酸序列如SEQ ID NO:5所示,CDS序列如SEQID NO:6所示,氨基酸序列如SEQ ID NO:7所示。对野生型和突变体序列进行比对发现,在LOC_Os02g18870基因的基因组序列编码区第3外显子的第3600位碱基处的TTGT被替换为A,导致LOC_Os02g18870基因编码蛋白中第230位和第231位的亮氨酸和缬氨酸突变为一个组氨酸,进而导致蛋白丧失功能。本领域技术人员应该知晓,可以将所述核苷酸序列SEQ IDNO:5通过杂交、回交或转基因的方法导入受体植物中,从而获得新的雄性不育突变体材料。

本发明提供了GMS1基因或其编码蛋白或含有其的生物材料或其突变体材料在调控植物雄性育性活性中的应用。所述生物材料为含有GMS1基因的表达盒、表达载体、工程菌、转基因植物或转基因细胞系。

其中所述GMS1基因用于恢复作物植株雄性不育,以便导入外源基因以获得优质的转基因作物。

提供上述GMS1基因用于转基因改良作物的用途。

所述改良包括产量提高、品质提高、抗病虫害、抗逆、抗倒伏等生长性状的改良。

在另一具体实施方案中,所述作物是自花授粉或异花授粉作物。

在一个更加具体的实施方案中,所述作物包括但不限于玉米、小麦、高梁、水稻。

本发明还提供了所述的GMS1基因或其编码蛋白或含有其的生物材料或DNA分子或上述任一种突变体材料在转育带有纯合GMS1突变基因的隐性核不育系中的应用。

本发明还提供了一种在其它植物中获取GMS1基因的直系同源基因的方法,以及利用该方法获得高粱、小米、短柄草、水稻同源GMS1的氨基酸序列。

本发明提供了一种在其它植物中获取GMS1基因的直系同源基因的方法包括:

1)使用前述GMS1基因的DNA片段在核苷酸数据库中进行blastx搜索;

2)所有Identities大于或等于35%、Positives大于或等于50%即为与所述DNA片段直系同源的基因片段。

本发明提供了一种与GMS1基因紧密连锁的分子标记,通过核苷酸序列如SEQ IDNO:8-9所述的引物扩增得到。

本发明提供了一种用于检测GMS1基因突变体材料的分子标记,通过核苷酸序列如SEQ ID NO:10-11所述的引物扩增得到。

选用SEQ ID NO:10-11所示引物扩增待测水稻基因组DNA时,若只能扩增出108bp一条带,则待测水稻为GMS1基因突变体。

含有核苷酸序列如SEQ ID NO:8-9或SEQ ID NO:10-11所述的引物的检测试剂或试剂盒属于本发明的保护范围。

进一步本发明提供了上述两种分子标记或上述检测试剂或试剂盒在检测水稻GMS1基因突变体中的应用。

本发明提供了上述两种分子标记或上述检测试剂或试剂盒在筛选或培育雄性不育水稻突变体中的应用。

与现有技术相比,本发明具有如下的有益效果:本发明提供的水稻花粉发育调控基因GMS1直接参与花粉发育调控,该基因被敲除或表达受到抑制后,花粉完全不育。gms1不育突变体与现有三系和两系不育系相比不育性状稳定,不受环境条件影响。通过植物生物技术途径,本发明在农作物的杂种优势利用和不育化杂交种制种生产中都将发挥重要作用。

附图说明

图1灌浆期野生型(左)和gms1突变体(右)的植株形态。

图2野生型(左)和gms1突变体(右)的小穗形态。

图3野生型(左)和gms1突变体(右)穗开花的形态。

图4解剖后野生型(左)和gms1突变体(右)的小花形态。

图5野生型(左)和gms1突变体(右)的花药形态。

图6野生型(左)和gms1突变体(右)花粉碘染。

图7利用Indel3标记鉴定定位群体中不育单株的基因型。上带大小124bp,下带大小120bp。泳道1-4的DNA模板分别为gms1突变体,明恢63,定位群体中的不育单株2.5和2.6。

图8A为GMS1基因图位克隆图,图8B为gms1突变体的突变位点示意图。

图9GMS1基因在9311(9311-870),明恢63(MH63-870),日本晴(Nip-870)和gms1突变体(gms1-870)材料中的核苷酸序列差异。有差异的地方用黑色背景突出。每行最后一个核苷酸在整个基因序列中的位置标示在行末。

图10GMS1编码蛋白在9311(9311-870)和gms1突变体(gms1-870)中的氨基酸序列差异。有差异的地方用黑色背景突出。每行最后一个氨基酸残基在整个蛋白序列中的位置标示在行末。

图11GMS1杂合株后代基因型鉴定。上带大小111bp,下带大小108bp。箭头所指为不育株DNA。

图12GMS1在水稻不同组织中的表达量。S1-S8分别代表水稻一到八期幼穗。

图13pC9M-GMS1载体示意图。T1代表靶位点1,T2代表靶位点2。

图14转基因植株L138-1-1在靶位点1处的测序峰图。箭头指向缺失位点。

图15转基因植株L138-3-1在靶位点2处的测序峰图。箭头指向缺失位点。

图16GMS1野生型(左)、敲除植株L138-1-1(中)和L138-3-1(右)的小穗形态。

图17GMS1野生型(左)、敲除植株L138-1-1(中)和L138-3-1(右)的花药形态。

图18GMS1野生型(左)、敲除植株L138-1-1(中)和L138-3-1(右)的花粉碘染。

图19pBLU5-870-CDS载体示意图。

图20GMS1在超表达植株中的表达量。

图21pC2300-870-genome载体示意图。

图22gms1突变植株(左)和互补植株(右)的植株形态。

图23水稻GMS1基因编码蛋白与其他物种基因组中的同源蛋白的序列比对图。包括拟南芥(Arabidopsis thaliana)蛋白AT4G10950.1、小米(Setaria italica)蛋白Si019557m、高粱(Sorghum bicolor)蛋白Sb04g011320.1、玉米(Zea mays)蛋白GRMZM2G166330_P01、二穗短柄草(Brachypodium distachyon)蛋白BRADI3G01797.1、大麦(Hordeum vulgare)蛋白MLOC_10139.2、短药野生稻(Oryza brachyantha)蛋白OB02G21480.1、非洲栽培稻(Oryza glaberrima)蛋白ORGLA02G0115000.1。

具体实施方式

以下的实施例便于更好地理解本发明,但并不限定本发明的应用范围。下述实施例中的所有技术和科学术语,如无特殊说明,均为本发明所属领域普通技术人员通常所理解的相同含义。除非有相反指明,本发明所使用或提及的技术均为本领域普通技术人员公认的标准技术。所述试验材料,如无特别注明,均为本发明领域通用的试验材料。下述实施例中所用的试验试剂,如无特殊说明,均为自常规生化试剂商店购买得到的。

本发明所述的雄性不育,特指由植物细胞核基因发生功能变化导致植物雄性生殖器官发育出现异常(无法产生正常雄蕊、花药或者正常的雄性配子体)并出现育性的丧失,即通常所说的雄性核不育(Genic male sterility)而非细胞质核不育(Cytoplasmic malesterility)。雄性生殖器官育性的异常和恢复均由细胞核内的基因加以控制。

因此,本发明也包括利用序列表所述序列调控植株的雄配子生育能力,即利用本发明提供的基因序列在基因组、和/或转录组、和/或蛋白质组水平影响其它植物中相同或同源基因的功能从而达到控制雄性生殖器官育性的目的。例如,下述方法但不限于下述方法:通过天然序列的变异导致基因表达抑制或蛋白质功能的丧失、通过向植物中转入所述基因的反义序列或引入发卡结构、或将所述基因与其它序列(DNA或RNA)相结合产生新的具有功能活性的DNA或RNA链,来影响或改变植物基因的功能。或其它本领域技术人员己知的可用于影响植物雄花育性的技术方法中的任何一种技术方法。

本发明包括水稻GMS1基因,其显性等位基因对植物雄花育性具有关键作用,功能缺失性的隐性等位基因会导致雄性不育。该基因位于水稻2号染色体,其基因具***置如图8A、图8B所示。

该基因序列及其同源序列可从各种植物中获得,包括但不限于卷柏(Selaginellamoellendorffii)、毛果杨(populus trichocarpa)、芜菁(Brassica rapa)、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、大豆(Glycine max)、茄属马铃薯(Solanum tuberosum)、葡萄(Vitis vinifera)、小果野芭蕉(Musa acuminata)、小米(Setaria italica)、高粱(Sorghum bicolor)、玉米(Zea mays)、二穗短柄草(Brachypodium distachyon)、大麦(Hordeum vulgare)、短药野生稻(Oryzabrachyantha)、非洲栽培稻(Oryza glaberrima)、籼稻(Oryza sativa Indica Group)、粳稻(Oryza sativa Japonica Group)、小立碗藓(Physcomitrella patens)等。获得方法包括但不限于:通过水稻GMS1基因序列利用blastx、blastn或通过氨基酸序列利用blastp从其它植物的基因组序列数据库、和/或cDNA序列数据库、和/或蛋白质序列数据库中调取;以水稻GMS1基因的DNA或cDNA或RNA序列为参考序列设计引物,从其它植物的基因组DNA或cDNA或RNA中利用PCR的方法直接获得:以水稻GMS1的基因序列设计探针,利用核酸杂交的方法从基因组文库中分离含有同源基因序列的DNA或cDNA或RNA片段。

GMS1基因同源序列指在与SEQ ID NO:3的氨基酸序列进行blastx比较分析后,Identities大于或等于35%、Positives大于或等于50%的植物基因的DNA序列。进行blastx时,所有参数均遵照http://blast.ncbi.nlm.nih.gov/所示的默认设置进行。

下文通过说明和阐述提供了更为详细的描述,但这并非意欲对本发明的范围加以限制。

实施例1水稻雄性不育突变体gms1的筛选

2013年6月用钴60辐射93-11种子10公斤得到M0代。辐射后的种子种植于海南省临高县试验田,成熟后分单株收种,共获得M1代材料约6500份。2014年春,选种子量较多的3617个M1代材料种植成株系,每个株系种50个单株。分别在分蘖期、孕穗期、抽穗期、开花期、灌浆期筛选株型、穗型、育性、产量等各种类型突变体,并收种保存。其中一个突变体表现为雄性不育,被命名为gms1。

实施例2水稻雄性不育突变体gms1的表型分析

与野生型相比,gms1突变体植株(图1)和小穗(图2)形态正常,花期稍迟。内、外稃大小、小花开张尺寸、开张时间与野生型没有明显差异(图3)。体式显微镜下观察突变体小花形态,发现子房,花柱,柱头均比野生型略大(图4),但花药比野生型瘦小,颜色较浅(图5)。用碘-碘化钾溶液(0.6%KI,0.3%I2,w/w)溶液对花粉进行染色,如图6所示野生型花粉粒大而圆并且被染成蓝黑色,而突变体花粉粒皱缩并且不能被染色。同一家系野生型植株套袋自交后正常结实,而3013突变体不结实。而以水稻品种93-11为父本给3013突变体授粉则可以结实。这表明该突变体为雄性不育突变体。

实施例3水稻雄性不育突变体gms1的遗传分析

在M4代种植gms1的分离群体436株,其中330株育性正常,106株不育,可育与不育株分离比符合3:1(χ2=0.08,P<0.05)。用gms1与明恢63杂交,F1代植株全部可育。在F3代种植gms1的分离群体7832株,其中5834株育性正常,1998株不育,可育与不育株分离比符合3:1(χ2=1.06,P<0.05)。上述结果表明gms1的不育性状是由隐性单基因控制。

实施例4水稻雄性不育基因GMS1的克隆

使用图位克隆的方法对GMS1基因进行定位。以明恢63为父本与gms1突变体杂交构建了一个包含350棵植株的F2群体。利用该群体将GMS1定位于2号染色体SSR标记RM13004和RM13018之间,与SSR标记RM13011共分离。GMS1基因与上述三个标记之间的交换单株分别为1个,0个,1个。利用连锁标记挑选F2群体中的gms1杂合单株发展了一个F3群体,包含7832个单株。在F3群体中RM13004、RM13011、RM13018与GMS1基因之间的交换单株分别为9个,3个,13个。在RM13004和RM13018之间通过分析和比较93-11和日本晴基因组的序列,开发并实验证实了一个新的***缺失标记Indel3。检测Indel3的引物为Indel3-F:GGGAAGAAACAGAGGTGCC(SEQ ID NO:8)和Indel3-R:GCTTGGAGGTATTTGGGACA(SEQ ID NO:9)。利用Indel3-F和Indel3-R可以在gms1突变体和明恢63基因组DNA中分别扩增出1条120bp(序列如SEQ ID NO:62)和1条124bp(序列如SEQ ID NO:63)条带(图7)。实验结果显示定位群体中所有不育单株都只扩增出了一条120bp的条带(图7),表明Indel3与gms1不育表型紧密连锁(图8A)。以Indel3上下游20kb为候选区段,发现在该区段内共有6个注释基因,其中LOC_Os02g18870预测编码一个GDSL类脂肪酶/酰基水解酶,推测是GMS1基因。在日本晴中,LOC_Os02g18870基因组核苷酸序列长5604bp(记为Nip-870,序列如SEQ ID NO:1),CDS核苷酸序列长1200bp(序列如SEQ ID NO:2),包含5个外显子和4个内含子(图8B),编码一个包含399个氨基酸残基的蛋白(序列如SEQ ID NO:3)。

根据Nip-870序列设计引物对LOC_Os02g18870基因在93-11、明恢63和gms1突变体中的等位基因进行扩增和测序,引物序列如表1所示。所有PCR扩增均使用KOD FX DNAPolymerase(TOYOBO CO.,LTD.Life Science Department,Osaka,Japan),并按照产品说明的反应体系和条件,在Thermo scientific Arktik thermal cycler上进行PCR扩增。PCR产物送往南京金斯瑞生物科技有限公司进行测序。测序结果用DNAman 6.0进行拼接。93-11、明恢63和gms1突变体中的LOC_Os02g18870基因分别记为9311-870(序列如SEQ ID NO:4),MH63-870,gms1-870(序列如SEQ ID NO:5)。

表1用于扩增LOC_Os02g18870的引物对序列

引物对名称 正向引物 反向引物
LOC_Os02g18870_1 TGCGAGGTCGGCTGCTA AGATCAGATGCCCCAAATTCATA
LOC_Os02g18870_2 CATGGCTGTGGCCCCTTTGCTC GTTTCTTTCCTATGCCTTTTCC
LOC_Os02g18870_3 GAGGGAAAAGGCATAGGAAA AGGTATGCAAATCAACAAGC
LOC_Os02g18870_4 ATACTATGGCTTTTGGGATGA AATAGTGGATGAAGTCGTTGC
LOC_Os02g18870_5 GGCAGCAACAACTGACCTTTTC ACAAGAAAGCAACATCTCAAGTCA
LOC_Os02g18870_6 AATCTTTGGCAGAGCATG GGAGTTTAAGGGTTGGTTC

对9311-870、gms1-870、MH63-870和Nip-870进行多序列比对,结果如图9所示。9311-870和gms1-870只在第3个外显子的第3600位碱基处存在一个TTGT到A的替换(图8和图9)。氨基酸序列分析显示,该突变将导致LOC_Os02g18870基因编码蛋白中第230位和第231位的亮氨酸和缬氨酸突变为一个组氨酸(图10)。MH63-870和Nip-870与gms1-870也在第3600个碱基处存在上述相同差异(图9)。这表明第3600位碱基处TTGT到A的突变是造成gms1突变体雄性不育的原因。此外9311-870和MH63-870的序列完全一致,而与Nip-870相比,在第308位缺失一个C,在第3303位有一个T变C的SNP(图9)。两处核苷酸差异分别落在第1和第2内含子中,并不影响编码区。这表明LOC_Os02g18870基因在水稻中高度保守,其核苷酸序列即使在籼、粳亚种间也只在非编码区存在两个碱基的差异,而蛋白质序列则没有差异。在93-11中LOC_Os02g18870的CDS核苷酸序列如SEQ ID NO:2所示,编码蛋白序列如SEQ IDNO:3。在gms1突变体中LOC_Os02g18870的CDS核苷酸序列和氨基酸序列分别如SEQ ID NO:6和SEQ ID NO:7所示。

基于LOC_Os02g18870基因突变位点的测序结果,在突变位点两侧设计特异引物3013_F:GCAACGACTTCATCCACT(SEQ ID NO:10)和3013_R:CCTTGATTTCCTGCCTCA(SEQ ID NO:11)。当3013_F和3013_R配对扩增野生型LOC_Os02g18870基因时将产生111bp条带,扩增突变型LOC_Os02g18870基因时将产生108bp条带。使用3013_F和3013_R引物对对38株gms1的M5分离群体进行基因型检测。如图11所示,野生型要么扩增出111bp和108bp两条带,要么扩增出111bp一条带,而不育突变体均只能扩增出108bp一条带。这说明突变基因型与不育表型共分离,LOC_Os02g18870就是GMS1基因。

实施例5GMS1基因的表达分析

取93-11各时期组织提取总RNA,反转录成cDNA。根据GMS1的基因组和编码区核苷酸序列设计跨内含子的引物3013_RTF:AATTCATCCGCCAGCACC(SEQ ID NO:12)和3013_RTR:GCCCACAGCAGGCATCAG(SEQ ID NO:13),同时以水稻Actin基因作为内参对照设计引物Actin-RTF:GATGCTTATGTCGGTGAT(SEQ ID NO:14)和Actin-RTR:ATGCTCTTCTGGTGCTAC(SEQID NO:15)。采取实时定量PCR方法进行表达量分析。如图12所示,GMS1基因在水稻的根、茎、叶、种子、外稃、內稃中均有表达但表达量较低。在一期到三期幼穗中,GMS1的表达量快速升高,然后逐渐降低,直到八期幼穗。其中七期幼穗中GMS1表达量略有升高。此外,在八期穗的花药中,GMS1的表达明显升高。

实施例6GMS1基因敲除株系的获得及表型分析

利用CRISPR/Cas9系统对GMS1基因进行定向敲除。为了提高敲除效率,选择两个靶位点同时进行敲除。靶位点1位于第一外显子的正链上,序列为CTTCGTGATCGGCGACTCCA(SEQID NO:1序列的第168位至第187位),靶位点2位于第二外显子的负链上,序列为GAGAGAATGCCAGCTGCCG(SEQ ID NO:1序列的第1629位至第1647位)。根据Ma等(Ma X,etal.A Robust CRISPR/Cas9System for Convenient,High-Efficiency Multiplex GenomeEditing in Monocot and Dicot Plants.Mol Plant,2015,8:1274-84)的方法将靶位点1和靶位点2连入载体pC9M中,获得载体pC9M-GMS1(图13)。有pC9M-GMS1的大肠杆菌被命名为E.coli-pC9M-GMS1。将pC9M-GMS1通过电击转人农杆菌菌株EH105中,得到的菌株命名为Ab-pC9M-GMS1。

利用重组农杆菌Ab-pC9M-GMS1侵染粳稻中花11愈伤组织,经潮霉素抗性筛选、分化、生根获得再生转基因株系33株。提取上述植株叶片的总DNA,利用引物SP1:CCCGACATAGATGCAATAACTTC(SEQ ID NO:16)和SP2:GCGCGGTGTCATCTATGTTACT(SEQ ID NO:17)做阳性检测,共鉴定出转基因阳性植株30株。随机选取17株阳性株,用靶位点1两侧的引物靶1-F:TTCGCCCTGCTCTTCCCG(SEQ ID NO:18)和靶1-R:AGATCAGATGCCCCAAATTCATA(SEQID NO:19)以及靶位点2两侧的引物靶2-F:TGGAGCCTCTTGGTTAGAGTC(SEQ ID NO:20)和靶2-R:CCTCCTTCTGATTCGTCCT(SEQ ID NO:21)。扩增基因组DNA,扩增产物测序后与基因组进行比对。结果显示17株阳性株的基因组DNA至少在靶位点1和靶位点2中的一处两条等位染色体均发生了突变(表2)。例如植株L138-1-1在靶位点1处发生了CGGCGACTCCA序列的纯合缺失突变(图14)。植株L138-3-1在靶位点2处发生了G缺失的纯合突变(图15)。发生在靶位点1或靶位点1及相邻序列内的突变还包括CTCCACGGCG、TCGGCGACTCCA、TCGGCGACTCCA、CCACGGCG、ATCGGCGAC、C、CGGCGGCGGCGGCGGCCCCGCGCCGCACGCCGCTCGTCCCGGCGCTCTTCGTGATCGGCGACT、CTCTTCGTGATCGGCGACTCCA或TCCACGGCGGAC等序列缺失突变,或T等碱基***突变(表2)。发生在靶位点2或靶位点2及相邻序列内的突变还包括AGCTGC、G、GCTG、TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGCATAGTTG或TG等序列缺失突变,或A、CT、GT或GC等碱基***突变,或从TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGC到GTTTGT或从CAGCTG到ATAGTTAAAAAATT等序列替换突变。

开花后对上述17株阳性株进行表型分析。与野生型ZH11相比,GMS1敲除植株L138-1-1和L138-3-1在株叶和小穗形态上并无明显差别(图16)。但GMS1敲除植株的花药明显更加瘦小(图17)。花粉碘染结果表明,野生型ZH11的花粉大而圆,可以被染色,而GMS1敲除植株的花粉小而皱缩,不能被染色(表2和图18)。GMS1敲除植株的表型与gms1突变体的表型一致。

实施例7GMS1基因超表达株系的获得及表型分析

以9311的RNA反转录产物为模板,用引物3013OXS:tttggtaccATGGCGCTCCCCTTCCTC(SEQ ID NO:22)和3013OXAS:tttggatccCTACTTGAGTTTTACCATCTGCTGCA(SEQ ID NO:23)扩增获得带有GMS1完整编码核苷酸序列(SEQ ID NO:2)的DNA片段。将该片段用Kpn I和BamHI双酶切后连入pBLU5获得质粒pBLU5-870-CDS(图19)。有pBLU5-870-CDS的大肠杆菌被命名为E.coli-pBLU5-870-CDS。将pBLU5-870-CDS通过电击转人农杆菌菌株EH105中,得到的菌株命名为Ab-pBLU5-870-CDS。

利用重组农杆菌Ab-pBLU5-870-CDS侵染粳稻中花11愈伤组织,经潮霉素抗性筛选、分化、生根获得转基因阳性植株42株。使用实时定量PCR方法,利用实施例5中的引物3013_RTF:AATTCATCCGCCAGCACC(SEQ ID NO:12)和3013_RTR:GCCCACAGCAGGCATCAG(SEQ IDNO:13),Actin-RTF:GATGCTTATGTCGGTGAT(SEQ ID NO:14)和Actin-RTF:ATGCTCTTCTGGTGCTAC(SEQ ID NO:15)对转基因阳性植株中GMS1的表达量进行分析。如图20所示,和转基因阴性单株L136-3-1相比,超表达植株中GMS1的表达量普遍上升了3倍以上,但超表达植株并未出现与表达量共分离的明显表型,说明GMS1基因超表达对水稻表型并没有显著影响。

实施例8gms1突变体转基因互补株系的获得及表型分析

以9311的基因组DNA为模板,用引物870F:GGGGTACCGAGCATAAGGCAAACTGGCG(SEQID NO:24)和870R:CGGGATCCATGGCCAAACCATGGGAAGA(SEQ ID NO:25)扩增获得带有GMS1起始密码子ATG上游1373bp和终止密码子TAG下游795bp的基因全长片段。将该片段用Kpn I和BamH I双酶切后连入pC2300获得质粒pC2300-870-genome(图21)。有pC2300-870-genome的大肠杆菌被命名为E.coli-pC2300-870-genome。将pC2300-870-genome通过电击转人农杆菌菌株EH105中,得到的菌株命名为Ab-pC2300-870-genome。利用重组农杆菌Ab-pC2300-870-genome侵染gms1突变体愈伤组织,经抗性筛选、分化、生根共获得转基因阳性植株25株,均使gms1突变体的育性恢复正常(图22)。这进一步证明GMS1基因调控花粉发育,该基因突变会导致花粉败育。

实施例9GMS1基因编码蛋白与植物基因组中预测同源蛋白的序列比对

利用blastx工具在NCBI的Genbank数据库中对水稻GMS1基因编码蛋白的氨基酸序列进行同源性搜索,得到了拟南芥(Arabidopsis thaliana)、小米(Setaria italica)、高粱(Sorghum bicolor)、玉米(Zea mays)、二穗短柄草(Brachypodium distachyon)、大麦(Hordeum vulgare)、短药野生稻(Oryza brachyantha)、非洲栽培稻(Oryza glaberrima)基因组中预测的同源蛋白,将这些蛋白序列进行比对分析,结果显示来自不同植物的同源蛋白都具有非常相似的保守序列,彼此之间同源性很高(图23),表明该蛋白在植物花的雄性器官发育过程中生物学功能保守,起着非常重要的作用。

在拟南芥(Arabidopsis thaliana)中该育性基因的基因组核苷酸序列如SEQ IDNO:26所示,CDS序列如SEQ ID NO:27所示,氨基酸序列如SEQ ID NO:28所示;在小米(Setaria italica)中该育性基因的基因组核苷酸序列如SEQ ID NO:29所示,CDS序列如SEQ ID NO:30所示,氨基酸序列如SEQ ID NO:31所示;高粱(Sorghum bicolor)中该育性基因的基因组核苷酸序列如SEQ ID NO:32所示,CDS序列如SEQ ID NO:33所示,氨基酸序列如SEQ ID NO:34所示;玉米(Zeamays)中该育性基因的基因组核苷酸序列如SEQ ID NO:35所示,CDS序列如SEQ ID NO:36所示,氨基酸序列如SEQ ID NO:37所示;二穗短柄草(Brachypodium distachyon)中该育性基因的基因组核苷酸序列如SEQ ID NO:38所示,CDS序列如SEQ ID NO:39所示,氨基酸序列如SEQ ID NO:40所示:大麦(Hordeumvulgare)中该育性基因的基因组核苷酸序列如SEQ ID NO:41所示,CDS序列如SEQ ID NO:42所示,氨基酸序列如SEQ ID NO:43所示;短药野生稻(Oryzabrachyantha)中该育性基因的基因组核苷酸序列如SEQ ID NO:44所示,CDS序列如SEQ ID NO:45所示,氨基酸序列如SEQ ID NO:46所示;非洲栽培稻(Oryzaglaberrima)中该育性基因的基因组核苷酸序列如SEQ ID NO:47所示,CDS序列如SEQ ID NO:48所示,氨基酸序列如SEQ ID NO:49所示。

实施例10转育带有GMS1基因的隐性核不育系

用gms1突变体与育性正常的受体,如H28B,进行杂交、回交和自交,并在此过程中用分子标记进行gms1基因和遗传背景选择,最终获得H28B背景下带有纯合GMS1突变基因的隐性核不育系。具体实施步骤如下:

1、以受体亲本,如H28B,为父本与gms1杂交获得F1

2、以F1为母本与受体亲本,如H28B,回交获得BC1F1

3、种植BC1F1,使用引物3013_F:GCAACGACTTCATCCACT(SEQ ID NO:10)和3013_R:CCTTGATTTCCTGCCTCA(SEQ ID NO:11)检测gms1基因型。选择gms1杂合基因型,即同时能扩增出111bp和108bp条带的植株。

4、使用一组基因型(例如100个,或200个等)在gms1突变体和轮回亲本基因组之间存在多态性,且分布均匀的分子标记(可以是但不限于SSR、SNP、INDEL、EST、RFLP、AFLP、RAPD、SCAR等类型标记),对步骤3中选出的单株进行遗传背景鉴定,选取与轮回亲本基因型相似度高(如大于88%相似度,或2%中选率等)的植株。

5、用步骤4中选出的植株与受体亲本,如H28B,回交获得BC2F1

6、种植BC2F1,重复步骤3和步骤4,选出gms1基因型杂合,遗传背景回复率高(如大于98%,或2%中选率等)的植株,收自交种BC2F2

7、种植BC2F2,重复步骤3和步骤4,选出gms1基因型杂合,遗传背景纯合率最高的植株,收自交种BC2F3。BC2F3后代中分离的gms1杂合株即gms1隐性核不育系,BC2F3用于保存gms1隐性核不育系种质资源。

序列表

<110> 海南波莲水稻基因科技有限公司

<120> 一种水稻育性调控基因及其突变体与应用

<130> KHP181114253.6

<160> 63

<170> SIPOSequenceListing 1.0

<210> 1

<211> 5604

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60

ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120

gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180

gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240

gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300

atccccgtcg actacatcgg tacgcgcccc ccaccttctc gatcggcggc gccatggctg 360

tggccccttt gctctctcgt gaatcctccc cccccccgct tcaaaggttg caggtggttc 420

tggaatcgtc gatccgatgc tgctttgcct ctcgtacgcc tatggatgca gcatgttgtg 480

ggtttagtgt aatctgggtt ttgggtttct ggtatacgaa ggttttgctt agttgttggt 540

tcctatgaat ttggggcatc tgatctcata catcgggggt atgtggattt ttgcccaaca 600

attgctgaag ctgaagagta atcagttcat agcactctcc tacacagctg accacctgga 660

tctcacatac atagactcct gcggcttcct ctccttgatc tcacatagca atgttgtggg 720

tttagtgtaa tctgggtatt tgggtttctc gcatgcgagg ggcttgctca gttgttggtt 780

cgtctgtggg tttctgccga acaattgctg aagctgaaga gtaaccagtt ttgcagcaca 840

accaccacag tctgggcatc atttgatcct gctgttctta gcactcctgc agagctgacc 900

acctggatct cacgtatcta tatagaatcc tgcggcttcc tctccaaatc agtatccagt 960

atccaccacc gttatcagcc gttgaggcaa tgcattggca gaatgccaga acattaagaa 1020

gtgccatcat aatgtacacc attagtccat gcatccagaa aacattgcca gaatcctgca 1080

atgtatccat ttgatagtcc tgagtcccga ccagttgtct acatgctcca gtctctttgc 1140

caccacacac tgttaaatct ctcttgtcca atgtccacca cattctggac agtttcaagg 1200

tcctcacagg aagcacagct gcacaacctt tgttaatgtt gctttaagaa agtcatatct 1260

actcattagt ttctttggga gagtaaggag ggaaaaggca taggaaagaa acatttaact 1320

agggctactg gctcactatg tgaaagatgt ttcccttcaa tttcatttag ctggtgttct 1380

ttatctcttt tgcccgtctc tgtcagtact tatgtttttc atgaatcaat agtatcttgt 1440

tctttcttct gtttttaaat tattttttcc gtgatttctt aatcttagac ttttttgtgc 1500

atttgcagca gagaagctgg ggcttccttt tgtgcctcca taccttgaac agaacatgcg 1560

catgggtgtc ggcagtgtcg acctcagcaa cattgatggg atgatacaag gtgtcaacta 1620

tgcatccgcg gcagctggca ttctctccag cagtggttct gagctggttt gtcctcctaa 1680

cttcccaaca actctatttc acgcttataa tctagcagga atgtctttgt gagacccttc 1740

tctagaggac gaatcagaag gagggtgttt caacaacaga ctagaagcaa tgactcttct 1800

catagtgtct acatcctctc tagttaggaa gaatacttgc tcaaccattt gaactaatgc 1860

tgaaagattc tcctgttcgg ctgctccctt ccttccatgt gttccaacta gtgtggatta 1920

tcagggcatc aaattccctt cttagttcct aggaattcat gacttatata tgcttcctac 1980

cagatgtgag attgtctaca cgagacgatt gatatgctgg tgctgatggg gggtttattt 2040

atgctgctgg ccttgtccaa gtttgcttgt gaagctacag tgctataagt tgtatggttg 2100

ttttattttc ctgcacgcat aaagcaaaag gagatatatg tagccatcta ctcaaagcta 2160

atttatcata atttttttat tgtctgaaac taaaaaactg catttgttct atactatggc 2220

ttttgggatg atcaaggagt tagtaagaat cactgatccg gcaccaatgt gatgaaattg 2280

atgtatatca tcctgaacat tccattttca tatcaatctt tattcctgct tatgttgttg 2340

aatctccaat ctttgtgccc aaaacaacaa aaacttgtgg agctgcaaat gctaattttg 2400

tcatttcaat aaaacatcat ggtggtgtct aaagaggaga aatgtttacg tatgaacatt 2460

gctgcaaagt tttcctttat gtggctatat gttttaactt tctataaagg attggagcct 2520

cttggttaga gtcaagcttg ttgatttgca taccttttca ttattcttaa atgtacttga 2580

aactaaatcg acatgatcat taactatata acaccagtct aaagaacacc aatctaaaga 2640

acacacttaa tgcttctcta tgaaggtttc tcttttggta tgtaatactt gctcatcgga 2700

tgtatccttt tttgttacta ttttgtctcg tgaactatac atttgaagat tattttgtgg 2760

tggtattctt tactactgcg gcattccagc agctgtaaaa gtatgtgcaa ttatactgtt 2820

aaaaaatctc caacattggc agtcccctag cttggaatct gtcgatattt tctgtgttta 2880

tgttatgatt tcttgcaaac atattttaga ttcttaaatt ttaatggcgt ggttgttcta 2940

gcttaaatat gtttagaaca agggatgtga cacctttact ttgtgcagaa taaaccttca 3000

tgctgatctc ttgtgtatca agccttcagg ctaggggtgt aagtggctaa cccgcgaaac 3060

ccacttatag gctaaaataa gccgcgaacc cgtttatttt gacctataag tgggttcgcg 3120

gctgacccac ttacagccct acttcaggca catgaggatc aatcatttca tagtgtgact 3180

atttgtagtt atctgtatgg ccgtaaataa tggcctctat attgttctgt attggagtat 3240

ctctctacta tttttttctc tgaagaagag cattctttta cctatttttg gttttcataa 3300

tttaatgtga tgcataattt gattctgttc ttttttagat aaaggaggct aatttgattc 3360

tgttcttgca attgtggatg cactgcaggg aatgcatgtg tcgctgagcc agcaggtgca 3420

gcaggttgag gacacatatg agcagctctc tctggctctc ggggaggcag caacaactga 3480

ccttttcaga aagtccgtgt tctttttctc aatcgggagc aacgacttca tccactatta 3540

cctgcgcaat gtgtctggcg tccagatgcg ttacctccca tgggagttca accagcttct 3600

tgtcaatgca atgaggcagg aaatcaaggt gtggttattg ttctccagtt tattctctct 3660

gtgcaacatt tcttgcctcc ttatgattcc agttttagtt ttttgatcag tgtgttgcat 3720

attgcccaaa ggctgtagta tcgtgcttag cagtggccaa tgttgtgagt atgaatttga 3780

tccgtaattt acggcccgta aatattctgt gcttgaaagg tatctgctct cagttccacc 3840

acccagatgt gaatagttct ttgtactcct ggttaggaat atgtttgaga aaaggaggag 3900

tgtggacctc tggggactgc agatacatga attatggaaa actagctatg aacattaatt 3960

tttatgtttc aagggctaga aaattttcaa atgtttatag agaaacctga tatagtacac 4020

tttttctgta ggttaaagtt ttcaaatggt ggatgagttt aaaaccgtgt acagttttgg 4080

actgaagctt ctttgagtta ctgaaatcct caggctgtac agtttttctg tagttatgaa 4140

ttaggttaaa aggataggag ggtatttcat ctgtacattt gtaatatggg aaagttaact 4200

gataaataca tggaattgat taactcaatg gatatttata tcgttggctg ttagcagttc 4260

tgtggtgtta tgtactttac attctccgtc taccgtacct tagtttcaga tttgaggtag 4320

tacgttgcaa cgttgctcaa caaggacata cttgtttttt atatgttcat tttgaattct 4380

taacattttg atcagataag gcggccccaa atctgatagg gactgatgta aagtcgatac 4440

tgaatattgt cttggactga atactgtgtt tgagtccctt agttcttggt ctgcgcatac 4500

ttccagagtg gattgtactt tgtactgcct cccatttgga agtgcaagct aaatgcgtgt 4560

tacttttgct caacttgtag gacaccatgc acactaccaa tatgcccatg atcttaccat 4620

gatacaaaca taattctcac atcatgcata aatgcataat gcacaatttg attttctccc 4680

taatttatcc cctttccttt tttgaacgga taattttaat ttgcaaaaga attggtaaaa 4740

atggccccaa atttctattc agtaaatctt tggcagagca tgcgatgcac attgattgag 4800

gctgcatgcg ccatgagttt atttgtactg tccaacattt gagagcagaa atttctgtta 4860

ccattgtact catccaagtt gacttgagat gttgctttct tgtttcttaa ccttagtaaa 4920

tcagttacaa tgatgcattt ttttattatt tagccatatg cagttcttgt cagattagat 4980

tattaagcta tttatatcta tatataagag ttctgtactt cctgcagaat ttgtacaata 5040

tcaatgttcg gaaggtcgtc atgatgggcc tccctcctgt tggctgcgca cctcactttc 5100

tctgggagta cggcagtcaa gacggggaat gcatcgacta catcaataac gtcgtgattc 5160

agttcaacta tgccctgaga tacatgtcta gtgaattcat ccgccagcac ccaggctcta 5220

tgatcagtta ctgtgatact tttgaggggt ctgtggacat actgaagaat cgtgaccgct 5280

acggtgagca gatgtatcat tgttactact gtcagattgc ctttctgtcc ttagggaaga 5340

actcacatta cgatggaatc acattgtgca ggttttctga ccaccactga tgcctgctgt 5400

gggctgggga agtatggggg cctgttcatg tgtgttcttc cacagatggc gtgcagcgac 5460

gcgtcgagcc atgtctggtg ggacgagttc caccccacgg atgctgtgaa ccgaatcctg 5520

gctgataatg tgtggtctgg tgagcatacc aagatgtgct atcctgtgga tttgcagcag 5580

atggtaaaac tcaagtagaa ctga 5604

<210> 2

<211> 1200

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60

ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120

gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180

gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240

gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300

atccccgtcg actacatcgc agagaagctg gggcttcctt ttgtgcctcc ataccttgaa 360

cagaacatgc gcatgggtgt cggcagtgtc gacctcagca acattgatgg gatgatacaa 420

ggtgtcaact atgcatccgc ggcagctggc attctctcca gcagtggttc tgagctggga 480

atgcatgtgt cgctgagcca gcaggtgcag caggttgagg acacatatga gcagctctct 540

ctggctctcg gggaggcagc aacaactgac cttttcagaa agtccgtgtt ctttttctca 600

atcgggagca acgacttcat ccactattac ctgcgcaatg tgtctggcgt ccagatgcgt 660

tacctcccat gggagttcaa ccagcttctt gtcaatgcaa tgaggcagga aatcaagaat 720

ttgtacaata tcaatgttcg gaaggtcgtc atgatgggcc tccctcctgt tggctgcgca 780

cctcactttc tctgggagta cggcagtcaa gacggggaat gcatcgacta catcaataac 840

gtcgtgattc agttcaacta tgccctgaga tacatgtcta gtgaattcat ccgccagcac 900

ccaggctcta tgatcagtta ctgtgatact tttgaggggt ctgtggacat actgaagaat 960

cgtgaccgct acggttttct gaccaccact gatgcctgct gtgggctggg gaagtatggg 1020

ggcctgttca tgtgtgttct tccacagatg gcgtgcagcg acgcgtcgag ccatgtctgg 1080

tgggacgagt tccaccccac ggatgctgtg aaccgaatcc tggctgataa tgtgtggtct 1140

ggtgagcata ccaagatgtg ctatcctgtg gatttgcagc agatggtaaa actcaagtag 1200

<210> 3

<211> 399

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Met Ala Leu Pro Phe Leu Leu Leu Leu Ala Phe Ala Leu Leu Phe Pro

1 5 10 15

Leu Ser Ala Pro Pro Arg Cys Cys Ser Ala Ala Pro Ala Ser Ser Pro

20 25 30

Pro Pro Ser Pro Pro Pro Ser Pro Ala Ala Ala Ala Ala Ala Pro Arg

35 40 45

Arg Thr Pro Leu Val Pro Ala Leu Phe Val Ile Gly Asp Ser Thr Ala

50 55 60

Asp Val Gly Thr Asn Asn Tyr Leu Gly Thr Leu Ala Arg Ala Asp Arg

65 70 75 80

Glu Pro Tyr Gly Arg Asp Phe Asp Thr Arg Arg Pro Thr Gly Arg Phe

85 90 95

Ser Asn Gly Arg Ile Pro Val Asp Tyr Ile Ala Glu Lys Leu Gly Leu

100 105 110

Pro Phe Val Pro Pro Tyr Leu Glu Gln Asn Met Arg Met Gly Val Gly

115 120 125

Ser Val Asp Leu Ser Asn Ile Asp Gly Met Ile Gln Gly Val Asn Tyr

130 135 140

Ala Ser Ala Ala Ala Gly Ile Leu Ser Ser Ser Gly Ser Glu Leu Gly

145 150 155 160

Met His Val Ser Leu Ser Gln Gln Val Gln Gln Val Glu Asp Thr Tyr

165 170 175

Glu Gln Leu Ser Leu Ala Leu Gly Glu Ala Ala Thr Thr Asp Leu Phe

180 185 190

Arg Lys Ser Val Phe Phe Phe Ser Ile Gly Ser Asn Asp Phe Ile His

195 200 205

Tyr Tyr Leu Arg Asn Val Ser Gly Val Gln Met Arg Tyr Leu Pro Trp

210 215 220

Glu Phe Asn Gln Leu Leu Val Asn Ala Met Arg Gln Glu Ile Lys Asn

225 230 235 240

Leu Tyr Asn Ile Asn Val Arg Lys Val Val Met Met Gly Leu Pro Pro

245 250 255

Val Gly Cys Ala Pro His Phe Leu Trp Glu Tyr Gly Ser Gln Asp Gly

260 265 270

Glu Cys Ile Asp Tyr Ile Asn Asn Val Val Ile Gln Phe Asn Tyr Ala

275 280 285

Leu Arg Tyr Met Ser Ser Glu Phe Ile Arg Gln His Pro Gly Ser Met

290 295 300

Ile Ser Tyr Cys Asp Thr Phe Glu Gly Ser Val Asp Ile Leu Lys Asn

305 310 315 320

Arg Asp Arg Tyr Gly Phe Leu Thr Thr Thr Asp Ala Cys Cys Gly Leu

325 330 335

Gly Lys Tyr Gly Gly Leu Phe Met Cys Val Leu Pro Gln Met Ala Cys

340 345 350

Ser Asp Ala Ser Ser His Val Trp Trp Asp Glu Phe His Pro Thr Asp

355 360 365

Ala Val Asn Arg Ile Leu Ala Asp Asn Val Trp Ser Gly Glu His Thr

370 375 380

Lys Met Cys Tyr Pro Val Asp Leu Gln Gln Met Val Lys Leu Lys

385 390 395

<210> 4

<211> 5603

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60

ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120

gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180

gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240

gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300

atccccgtcg actacatcgg tacgcgcccc ccaccttctc gatcggcggc gccatggctg 360

tggccccttt gctctctcgt gaatcctccc ccccccgctt caaaggttgc aggtggttct 420

ggaatcgtcg atccgatgct gctttgcctc tcgtacgcct atggatgcag catgttgtgg 480

gtttagtgta atctgggttt tgggtttctg gtatacgaag gttttgctta gttgttggtt 540

cctatgaatt tggggcatct gatctcatac atcgggggta tgtggatttt tgcccaacaa 600

ttgctgaagc tgaagagtaa tcagttcata gcactctcct acacagctga ccacctggat 660

ctcacataca tagactcctg cggcttcctc tccttgatct cacatagcaa tgttgtgggt 720

ttagtgtaat ctgggtattt gggtttctcg catgcgaggg gcttgctcag ttgttggttc 780

gtctgtgggt ttctgccgaa caattgctga agctgaagag taaccagttt tgcagcacaa 840

ccaccacagt ctgggcatca tttgatcctg ctgttcttag cactcctgca gagctgacca 900

cctggatctc acgtatctat atagaatcct gcggcttcct ctccaaatca gtatccagta 960

tccaccaccg ttatcagccg ttgaggcaat gcattggcag aatgccagaa cattaagaag 1020

tgccatcata atgtacacca ttagtccatg catccagaaa acattgccag aatcctgcaa 1080

tgtatccatt tgatagtcct gagtcccgac cagttgtcta catgctccag tctctttgcc 1140

accacacact gttaaatctc tcttgtccaa tgtccaccac attctggaca gtttcaaggt 1200

cctcacagga agcacagctg cacaaccttt gttaatgttg ctttaagaaa gtcatatcta 1260

ctcattagtt tctttgggag agtaaggagg gaaaaggcat aggaaagaaa catttaacta 1320

gggctactgg ctcactatgt gaaagatgtt tcccttcaat ttcatttagc tggtgttctt 1380

tatctctttt gcccgtctct gtcagtactt atgtttttca tgaatcaata gtatcttgtt 1440

ctttcttctg tttttaaatt attttttccg tgatttctta atcttagact tttttgtgca 1500

tttgcagcag agaagctggg gcttcctttt gtgcctccat accttgaaca gaacatgcgc 1560

atgggtgtcg gcagtgtcga cctcagcaac attgatggga tgatacaagg tgtcaactat 1620

gcatccgcgg cagctggcat tctctccagc agtggttctg agctggtttg tcctcctaac 1680

ttcccaacaa ctctatttca cgcttataat ctagcaggaa tgtctttgtg agacccttct 1740

ctagaggacg aatcagaagg agggtgtttc aacaacagac tagaagcaat gactcttctc 1800

atagtgtcta catcctctct agttaggaag aatacttgct caaccatttg aactaatgct 1860

gaaagattct cctgttcggc tgctcccttc cttccatgtg ttccaactag tgtggattat 1920

cagggcatca aattcccttc ttagttccta ggaattcatg acttatatat gcttcctacc 1980

agatgtgaga ttgtctacac gagacgattg atatgctggt gctgatgggg ggtttattta 2040

tgctgctggc cttgtccaag tttgcttgtg aagctacagt gctataagtt gtatggttgt 2100

tttattttcc tgcacgcata aagcaaaagg agatatatgt agccatctac tcaaagctaa 2160

tttatcataa tttttttatt gtctgaaact aaaaaactgc atttgttcta tactatggct 2220

tttgggatga tcaaggagtt agtaagaatc actgatccgg caccaatgtg atgaaattga 2280

tgtatatcat cctgaacatt ccattttcat atcaatcttt attcctgctt atgttgttga 2340

atctccaatc tttgtgccca aaacaacaaa aacttgtgga gctgcaaatg ctaattttgt 2400

catttcaata aaacatcatg gtggtgtcta aagaggagaa atgtttacgt atgaacattg 2460

ctgcaaagtt ttcctttatg tggctatatg ttttaacttt ctataaagga ttggagcctc 2520

ttggttagag tcaagcttgt tgatttgcat accttttcat tattcttaaa tgtacttgaa 2580

actaaatcga catgatcatt aactatataa caccagtcta aagaacacca atctaaagaa 2640

cacacttaat gcttctctat gaaggtttct cttttggtat gtaatacttg ctcatcggat 2700

gtatcctttt ttgttactat tttgtctcgt gaactataca tttgaagatt attttgtggt 2760

ggtattcttt actactgcgg cattccagca gctgtaaaag tatgtgcaat tatactgtta 2820

aaaaatctcc aacattggca gtcccctagc ttggaatctg tcgatatttt ctgtgtttat 2880

gttatgattt cttgcaaaca tattttagat tcttaaattt taatggcgtg gttgttctag 2940

cttaaatatg tttagaacaa gggatgtgac acctttactt tgtgcagaat aaaccttcat 3000

gctgatctct tgtgtatcaa gccttcaggc taggggtgta agtggctaac ccgcgaaacc 3060

cacttatagg ctaaaataag ccgcgaaccc gtttattttg acctataagt gggttcgcgg 3120

ctgacccact tacagcccta cttcaggcac atgaggatca atcatttcat agtgtgacta 3180

tttgtagtta tctgtatggc cgtaaataat ggcctctata ttgttctgta ttggagtatc 3240

tctctactat ttttttctct gaagaagagc attcttttac ctatttttgg ttttcataat 3300

tcaatgtgat gcataatttg attctgttct tttttagata aaggaggcta atttgattct 3360

gttcttgcaa ttgtggatgc actgcaggga atgcatgtgt cgctgagcca gcaggtgcag 3420

caggttgagg acacatatga gcagctctct ctggctctcg gggaggcagc aacaactgac 3480

cttttcagaa agtccgtgtt ctttttctca atcgggagca acgacttcat ccactattac 3540

ctgcgcaatg tgtctggcgt ccagatgcgt tacctcccat gggagttcaa ccagcttctt 3600

gtcaatgcaa tgaggcagga aatcaaggtg tggttattgt tctccagttt attctctctg 3660

tgcaacattt cttgcctcct tatgattcca gttttagttt tttgatcagt gtgttgcata 3720

ttgcccaaag gctgtagtat cgtgcttagc agtggccaat gttgtgagta tgaatttgat 3780

ccgtaattta cggcccgtaa atattctgtg cttgaaaggt atctgctctc agttccacca 3840

cccagatgtg aatagttctt tgtactcctg gttaggaata tgtttgagaa aaggaggagt 3900

gtggacctct ggggactgca gatacatgaa ttatggaaaa ctagctatga acattaattt 3960

ttatgtttca agggctagaa aattttcaaa tgtttataga gaaacctgat atagtacact 4020

ttttctgtag gttaaagttt tcaaatggtg gatgagttta aaaccgtgta cagttttgga 4080

ctgaagcttc tttgagttac tgaaatcctc aggctgtaca gtttttctgt agttatgaat 4140

taggttaaaa ggataggagg gtatttcatc tgtacatttg taatatggga aagttaactg 4200

ataaatacat ggaattgatt aactcaatgg atatttatat cgttggctgt tagcagttct 4260

gtggtgttat gtactttaca ttctccgtct accgtacctt agtttcagat ttgaggtagt 4320

acgttgcaac gttgctcaac aaggacatac ttgtttttta tatgttcatt ttgaattctt 4380

aacattttga tcagataagg cggccccaaa tctgataggg actgatgtaa agtcgatact 4440

gaatattgtc ttggactgaa tactgtgttt gagtccctta gttcttggtc tgcgcatact 4500

tccagagtgg attgtacttt gtactgcctc ccatttggaa gtgcaagcta aatgcgtgtt 4560

acttttgctc aacttgtagg acaccatgca cactaccaat atgcccatga tcttaccatg 4620

atacaaacat aattctcaca tcatgcataa atgcataatg cacaatttga ttttctccct 4680

aatttatccc ctttcctttt ttgaacggat aattttaatt tgcaaaagaa ttggtaaaaa 4740

tggccccaaa tttctattca gtaaatcttt ggcagagcat gcgatgcaca ttgattgagg 4800

ctgcatgcgc catgagttta tttgtactgt ccaacatttg agagcagaaa tttctgttac 4860

cattgtactc atccaagttg acttgagatg ttgctttctt gtttcttaac cttagtaaat 4920

cagttacaat gatgcatttt tttattattt agccatatgc agttcttgtc agattagatt 4980

attaagctat ttatatctat atataagagt tctgtacttc ctgcagaatt tgtacaatat 5040

caatgttcgg aaggtcgtca tgatgggcct ccctcctgtt ggctgcgcac ctcactttct 5100

ctgggagtac ggcagtcaag acggggaatg catcgactac atcaataacg tcgtgattca 5160

gttcaactat gccctgagat acatgtctag tgaattcatc cgccagcacc caggctctat 5220

gatcagttac tgtgatactt ttgaggggtc tgtggacata ctgaagaatc gtgaccgcta 5280

cggtgagcag atgtatcatt gttactactg tcagattgcc tttctgtcct tagggaagaa 5340

ctcacattac gatggaatca cattgtgcag gttttctgac caccactgat gcctgctgtg 5400

ggctggggaa gtatgggggc ctgttcatgt gtgttcttcc acagatggcg tgcagcgacg 5460

cgtcgagcca tgtctggtgg gacgagttcc accccacgga tgctgtgaac cgaatcctgg 5520

ctgataatgt gtggtctggt gagcatacca agatgtgcta tcctgtggat ttgcagcaga 5580

tggtaaaact caagtagaac tga 5603

<210> 5

<211> 5600

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60

ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120

gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180

gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240

gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300

atccccgtcg actacatcgg tacgcgcccc ccaccttctc gatcggcggc gccatggctg 360

tggccccttt gctctctcgt gaatcctccc ccccccgctt caaaggttgc aggtggttct 420

ggaatcgtcg atccgatgct gctttgcctc tcgtacgcct atggatgcag catgttgtgg 480

gtttagtgta atctgggttt tgggtttctg gtatacgaag gttttgctta gttgttggtt 540

cctatgaatt tggggcatct gatctcatac atcgggggta tgtggatttt tgcccaacaa 600

ttgctgaagc tgaagagtaa tcagttcata gcactctcct acacagctga ccacctggat 660

ctcacataca tagactcctg cggcttcctc tccttgatct cacatagcaa tgttgtgggt 720

ttagtgtaat ctgggtattt gggtttctcg catgcgaggg gcttgctcag ttgttggttc 780

gtctgtgggt ttctgccgaa caattgctga agctgaagag taaccagttt tgcagcacaa 840

ccaccacagt ctgggcatca tttgatcctg ctgttcttag cactcctgca gagctgacca 900

cctggatctc acgtatctat atagaatcct gcggcttcct ctccaaatca gtatccagta 960

tccaccaccg ttatcagccg ttgaggcaat gcattggcag aatgccagaa cattaagaag 1020

tgccatcata atgtacacca ttagtccatg catccagaaa acattgccag aatcctgcaa 1080

tgtatccatt tgatagtcct gagtcccgac cagttgtcta catgctccag tctctttgcc 1140

accacacact gttaaatctc tcttgtccaa tgtccaccac attctggaca gtttcaaggt 1200

cctcacagga agcacagctg cacaaccttt gttaatgttg ctttaagaaa gtcatatcta 1260

ctcattagtt tctttgggag agtaaggagg gaaaaggcat aggaaagaaa catttaacta 1320

gggctactgg ctcactatgt gaaagatgtt tcccttcaat ttcatttagc tggtgttctt 1380

tatctctttt gcccgtctct gtcagtactt atgtttttca tgaatcaata gtatcttgtt 1440

ctttcttctg tttttaaatt attttttccg tgatttctta atcttagact tttttgtgca 1500

tttgcagcag agaagctggg gcttcctttt gtgcctccat accttgaaca gaacatgcgc 1560

atgggtgtcg gcagtgtcga cctcagcaac attgatggga tgatacaagg tgtcaactat 1620

gcatccgcgg cagctggcat tctctccagc agtggttctg agctggtttg tcctcctaac 1680

ttcccaacaa ctctatttca cgcttataat ctagcaggaa tgtctttgtg agacccttct 1740

ctagaggacg aatcagaagg agggtgtttc aacaacagac tagaagcaat gactcttctc 1800

atagtgtcta catcctctct agttaggaag aatacttgct caaccatttg aactaatgct 1860

gaaagattct cctgttcggc tgctcccttc cttccatgtg ttccaactag tgtggattat 1920

cagggcatca aattcccttc ttagttccta ggaattcatg acttatatat gcttcctacc 1980

agatgtgaga ttgtctacac gagacgattg atatgctggt gctgatgggg ggtttattta 2040

tgctgctggc cttgtccaag tttgcttgtg aagctacagt gctataagtt gtatggttgt 2100

tttattttcc tgcacgcata aagcaaaagg agatatatgt agccatctac tcaaagctaa 2160

tttatcataa tttttttatt gtctgaaact aaaaaactgc atttgttcta tactatggct 2220

tttgggatga tcaaggagtt agtaagaatc actgatccgg caccaatgtg atgaaattga 2280

tgtatatcat cctgaacatt ccattttcat atcaatcttt attcctgctt atgttgttga 2340

atctccaatc tttgtgccca aaacaacaaa aacttgtgga gctgcaaatg ctaattttgt 2400

catttcaata aaacatcatg gtggtgtcta aagaggagaa atgtttacgt atgaacattg 2460

ctgcaaagtt ttcctttatg tggctatatg ttttaacttt ctataaagga ttggagcctc 2520

ttggttagag tcaagcttgt tgatttgcat accttttcat tattcttaaa tgtacttgaa 2580

actaaatcga catgatcatt aactatataa caccagtcta aagaacacca atctaaagaa 2640

cacacttaat gcttctctat gaaggtttct cttttggtat gtaatacttg ctcatcggat 2700

gtatcctttt ttgttactat tttgtctcgt gaactataca tttgaagatt attttgtggt 2760

ggtattcttt actactgcgg cattccagca gctgtaaaag tatgtgcaat tatactgtta 2820

aaaaatctcc aacattggca gtcccctagc ttggaatctg tcgatatttt ctgtgtttat 2880

gttatgattt cttgcaaaca tattttagat tcttaaattt taatggcgtg gttgttctag 2940

cttaaatatg tttagaacaa gggatgtgac acctttactt tgtgcagaat aaaccttcat 3000

gctgatctct tgtgtatcaa gccttcaggc taggggtgta agtggctaac ccgcgaaacc 3060

cacttatagg ctaaaataag ccgcgaaccc gtttattttg acctataagt gggttcgcgg 3120

ctgacccact tacagcccta cttcaggcac atgaggatca atcatttcat agtgtgacta 3180

tttgtagtta tctgtatggc cgtaaataat ggcctctata ttgttctgta ttggagtatc 3240

tctctactat ttttttctct gaagaagagc attcttttac ctatttttgg ttttcataat 3300

tcaatgtgat gcataatttg attctgttct tttttagata aaggaggcta atttgattct 3360

gttcttgcaa ttgtggatgc actgcaggga atgcatgtgt cgctgagcca gcaggtgcag 3420

caggttgagg acacatatga gcagctctct ctggctctcg gggaggcagc aacaactgac 3480

cttttcagaa agtccgtgtt ctttttctca atcgggagca acgacttcat ccactattac 3540

ctgcgcaatg tgtctggcgt ccagatgcgt tacctcccat gggagttcaa ccagcttcac 3600

aatgcaatga ggcaggaaat caaggtgtgg ttattgttct ccagtttatt ctctctgtgc 3660

aacatttctt gcctccttat gattccagtt ttagtttttt gatcagtgtg ttgcatattg 3720

cccaaaggct gtagtatcgt gcttagcagt ggccaatgtt gtgagtatga atttgatccg 3780

taatttacgg cccgtaaata ttctgtgctt gaaaggtatc tgctctcagt tccaccaccc 3840

agatgtgaat agttctttgt actcctggtt aggaatatgt ttgagaaaag gaggagtgtg 3900

gacctctggg gactgcagat acatgaatta tggaaaacta gctatgaaca ttaattttta 3960

tgtttcaagg gctagaaaat tttcaaatgt ttatagagaa acctgatata gtacactttt 4020

tctgtaggtt aaagttttca aatggtggat gagtttaaaa ccgtgtacag ttttggactg 4080

aagcttcttt gagttactga aatcctcagg ctgtacagtt tttctgtagt tatgaattag 4140

gttaaaagga taggagggta tttcatctgt acatttgtaa tatgggaaag ttaactgata 4200

aatacatgga attgattaac tcaatggata tttatatcgt tggctgttag cagttctgtg 4260

gtgttatgta ctttacattc tccgtctacc gtaccttagt ttcagatttg aggtagtacg 4320

ttgcaacgtt gctcaacaag gacatacttg ttttttatat gttcattttg aattcttaac 4380

attttgatca gataaggcgg ccccaaatct gatagggact gatgtaaagt cgatactgaa 4440

tattgtcttg gactgaatac tgtgtttgag tcccttagtt cttggtctgc gcatacttcc 4500

agagtggatt gtactttgta ctgcctccca tttggaagtg caagctaaat gcgtgttact 4560

tttgctcaac ttgtaggaca ccatgcacac taccaatatg cccatgatct taccatgata 4620

caaacataat tctcacatca tgcataaatg cataatgcac aatttgattt tctccctaat 4680

ttatcccctt tccttttttg aacggataat tttaatttgc aaaagaattg gtaaaaatgg 4740

ccccaaattt ctattcagta aatctttggc agagcatgcg atgcacattg attgaggctg 4800

catgcgccat gagtttattt gtactgtcca acatttgaga gcagaaattt ctgttaccat 4860

tgtactcatc caagttgact tgagatgttg ctttcttgtt tcttaacctt agtaaatcag 4920

ttacaatgat gcattttttt attatttagc catatgcagt tcttgtcaga ttagattatt 4980

aagctattta tatctatata taagagttct gtacttcctg cagaatttgt acaatatcaa 5040

tgttcggaag gtcgtcatga tgggcctccc tcctgttggc tgcgcacctc actttctctg 5100

ggagtacggc agtcaagacg gggaatgcat cgactacatc aataacgtcg tgattcagtt 5160

caactatgcc ctgagataca tgtctagtga attcatccgc cagcacccag gctctatgat 5220

cagttactgt gatacttttg aggggtctgt ggacatactg aagaatcgtg accgctacgg 5280

tgagcagatg tatcattgtt actactgtca gattgccttt ctgtccttag ggaagaactc 5340

acattacgat ggaatcacat tgtgcaggtt ttctgaccac cactgatgcc tgctgtgggc 5400

tggggaagta tgggggcctg ttcatgtgtg ttcttccaca gatggcgtgc agcgacgcgt 5460

cgagccatgt ctggtgggac gagttccacc ccacggatgc tgtgaaccga atcctggctg 5520

ataatgtgtg gtctggtgag cataccaaga tgtgctatcc tgtggatttg cagcagatgg 5580

taaaactcaa gtagaactga 5600

<210> 6

<211> 1197

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60

ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120

gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180

gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240

gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300

atccccgtcg actacatcgc agagaagctg gggcttcctt ttgtgcctcc ataccttgaa 360

cagaacatgc gcatgggtgt cggcagtgtc gacctcagca acattgatgg gatgatacaa 420

ggtgtcaact atgcatccgc ggcagctggc attctctcca gcagtggttc tgagctggga 480

atgcatgtgt cgctgagcca gcaggtgcag caggttgagg acacatatga gcagctctct 540

ctggctctcg gggaggcagc aacaactgac cttttcagaa agtccgtgtt ctttttctca 600

atcgggagca acgacttcat ccactattac ctgcgcaatg tgtctggcgt ccagatgcgt 660

tacctcccat gggagttcaa ccagcttcac aatgcaatga ggcaggaaat caagaatttg 720

tacaatatca atgttcggaa ggtcgtcatg atgggcctcc ctcctgttgg ctgcgcacct 780

cactttctct gggagtacgg cagtcaagac ggggaatgca tcgactacat caataacgtc 840

gtgattcagt tcaactatgc cctgagatac atgtctagtg aattcatccg ccagcaccca 900

ggctctatga tcagttactg tgatactttt gaggggtctg tggacatact gaagaatcgt 960

gaccgctacg gttttctgac caccactgat gcctgctgtg ggctggggaa gtatgggggc 1020

ctgttcatgt gtgttcttcc acagatggcg tgcagcgacg cgtcgagcca tgtctggtgg 1080

gacgagttcc accccacgga tgctgtgaac cgaatcctgg ctgataatgt gtggtctggt 1140

gagcatacca agatgtgcta tcctgtggat ttgcagcaga tggtaaaact caagtag 1197

<210> 7

<211> 398

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Met Ala Leu Pro Phe Leu Leu Leu Leu Ala Phe Ala Leu Leu Phe Pro

1 5 10 15

Leu Ser Ala Pro Pro Arg Cys Cys Ser Ala Ala Pro Ala Ser Ser Pro

20 25 30

Pro Pro Ser Pro Pro Pro Ser Pro Ala Ala Ala Ala Ala Ala Pro Arg

35 40 45

Arg Thr Pro Leu Val Pro Ala Leu Phe Val Ile Gly Asp Ser Thr Ala

50 55 60

Asp Val Gly Thr Asn Asn Tyr Leu Gly Thr Leu Ala Arg Ala Asp Arg

65 70 75 80

Glu Pro Tyr Gly Arg Asp Phe Asp Thr Arg Arg Pro Thr Gly Arg Phe

85 90 95

Ser Asn Gly Arg Ile Pro Val Asp Tyr Ile Ala Glu Lys Leu Gly Leu

100 105 110

Pro Phe Val Pro Pro Tyr Leu Glu Gln Asn Met Arg Met Gly Val Gly

115 120 125

Ser Val Asp Leu Ser Asn Ile Asp Gly Met Ile Gln Gly Val Asn Tyr

130 135 140

Ala Ser Ala Ala Ala Gly Ile Leu Ser Ser Ser Gly Ser Glu Leu Gly

145 150 155 160

Met His Val Ser Leu Ser Gln Gln Val Gln Gln Val Glu Asp Thr Tyr

165 170 175

Glu Gln Leu Ser Leu Ala Leu Gly Glu Ala Ala Thr Thr Asp Leu Phe

180 185 190

Arg Lys Ser Val Phe Phe Phe Ser Ile Gly Ser Asn Asp Phe Ile His

195 200 205

Tyr Tyr Leu Arg Asn Val Ser Gly Val Gln Met Arg Tyr Leu Pro Trp

210 215 220

Glu Phe Asn Gln Leu His Asn Ala Met Arg Gln Glu Ile Lys Asn Leu

225 230 235 240

Tyr Asn Ile Asn Val Arg Lys Val Val Met Met Gly Leu Pro Pro Val

245 250 255

Gly Cys Ala Pro His Phe Leu Trp Glu Tyr Gly Ser Gln Asp Gly Glu

260 265 270

Cys Ile Asp Tyr Ile Asn Asn Val Val Ile Gln Phe Asn Tyr Ala Leu

275 280 285

Arg Tyr Met Ser Ser Glu Phe Ile Arg Gln His Pro Gly Ser Met Ile

290 295 300

Ser Tyr Cys Asp Thr Phe Glu Gly Ser Val Asp Ile Leu Lys Asn Arg

305 310 315 320

Asp Arg Tyr Gly Phe Leu Thr Thr Thr Asp Ala Cys Cys Gly Leu Gly

325 330 335

Lys Tyr Gly Gly Leu Phe Met Cys Val Leu Pro Gln Met Ala Cys Ser

340 345 350

Asp Ala Ser Ser His Val Trp Trp Asp Glu Phe His Pro Thr Asp Ala

355 360 365

Val Asn Arg Ile Leu Ala Asp Asn Val Trp Ser Gly Glu His Thr Lys

370 375 380

Met Cys Tyr Pro Val Asp Leu Gln Gln Met Val Lys Leu Lys

385 390 395

<210> 8

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gggaagaaac agaggtgcc 19

<210> 9

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

gcttggaggt atttgggaca 20

<210> 10

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

gcaacgactt catccact 18

<210> 11

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

ccttgatttc ctgcctca 18

<210> 12

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

aattcatccg ccagcacc 18

<210> 13

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

gcccacagca ggcatcag 18

<210> 14

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

gatgcttatg tcggtgat 18

<210> 15

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

atgctcttct ggtgctac 18

<210> 16

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

cccgacatag atgcaataac ttc 23

<210> 17

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

gcgcggtgtc atctatgtta ct 22

<210> 18

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

ttcgccctgc tcttcccg 18

<210> 19

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

agatcagatg ccccaaattc ata 23

<210> 20

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

tggagcctct tggttagagt c 21

<210> 21

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

cctccttctg attcgtcct 19

<210> 22

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

tttggtacca tggcgctccc cttcctc 27

<210> 23

<211> 35

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

tttggatccc tacttgagtt ttaccatctg ctgca 35

<210> 24

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

ggggtaccga gcataaggca aactggcg 28

<210> 25

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

cgggatccat ggccaaacca tgggaaga 28

<210> 26

<211> 2127

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

atgtcgatca agcttctcgt tcttgttttc tctcttctga taatcttcac gagacccaaa 60

ttgatcgccg atcatcactt aactacaaga atctcgccga tttatccttc gatttctacg 120

tttcagcctt cgattccgcc gtttttacct ccatcgccgt cgcgcagagc acaatctccg 180

acggtgaagc cgtctttgcc atttgtaccg gcgttgttcg ttttcggaga ttcctcagtc 240

gatagcggaa ccaataactt tcttggaacc ttagcgagag cagatcggct tccctacggt 300

cgcgatttcg atacgcatca accaacggga aggttttgca atggaagaat cccagttgat 360

tatctaggtt acaattcttc cccagtttct ggatattgat tatagtccca gttgattctt 420

agaagtgtaa gcgaaaatgt tgacttcttg tgttcgattc tttatacaat tgagaggaac 480

aaattcattg aggaaatgtt gaatcattcg ttttttgttg tccattgaaa atcttgtgaa 540

cagctgatcg tttaggctta ccattcgttc ctagctatct tggacaaact gggactgttg 600

aagacatgtt tcaaggagta aactatgcat cagctggtgc tggaatcatc ttatcaagtg 660

gatctgaatt ggtaatactc agtttttcag agtcttttga gttcattttc tgtataccat 720

ctttcagctt tttcaatcct gtgggggaat ttttgttgtt gcagggccag cgggtttcat 780

ttgcgatgca agttgagcag tttgttgata cgtttcagca gatgatactg agtattgggg 840

agaaagcttc ggaacgttta gtgtcaaact cggttttcta catatcgatt ggagtgaatg 900

attacataca tttctacatc agaaacatct ccaatgtgca gaatctctat actccatgga 960

attttaatca gttcttggct tctaatatga gacaggagct caaggttaga cctctaatca 1020

atctttatac gttttctctt ggtaaagagt ttatagggga cagacaagta tgattctgag 1080

ttagtatagt tagtataagt gagacatctt gattagtaca caaaacgttg cctttatgaa 1140

gatcaaatca caaccctttt ttctgttttg gatctctggt ttgtatagtt gtagagagca 1200

taaagctcat taagctgcat attgatagcc taaacatgat tgagttatag tagttgcctc 1260

ttcatttagc tgcatattga tggcctaata agagaagtat tatgtttgtt tcacagacct 1320

tgtacaatgt caaggtgagg aggatggtgg tgatgggact gccacctatt ggctgtgcac 1380

catactacat gtggaaatac agaagccaga acggagaatg tgcagaagaa gtgaacagca 1440

tgatcatgga atccaacttt gtcatgagat acactgtaga taaactcaac cgtgagcttc 1500

caggggcatc cattatctac tgtgacgtgt tccaaagcgc tatggacatt ctcaggaacc 1560

accaacacta cggtaagcac cacttctatg tcaattctca attcacaaaa agactgtgac 1620

tggtaacaag taacaacata gcattataat cccatagcag tatcttggaa ctcaaacata 1680

gtcttctgag agtgatatat agagttttct gatcatcttc aagtgtgaaa gtaacttgtc 1740

aagagtcttg ttgaatctta gttgtgtgtg tattgtggtg tggacaggtt ttaatgagac 1800

gacagatgcg tgttgtgggc tagggaggta caaaggatgg cttccatgca tctcgccgga 1860

gatggcttgc tctgacgcct ccggtcacct ctggtgggac cagtttcatc ctacagacgc 1920

cgttaacgcc attctagccg acaatgtatg gaatggtcgc cacgtggaca tgtgttaccc 1980

tactaaccta gaaactatgc ttcattctta aatcagctga gaggataaaa atgtacataa 2040

aaaacatagt aaattgtaaa tgaactttgc aattttgatg tttggtccat ggtacataaa 2100

ggaaaactat aggtctttta tgctaaa 2127

<210> 27

<211> 1203

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

atgtcgatca agcttctcgt tcttgttttc tctcttctga taatcttcac gagacccaaa 60

ttgatcgccg atcatcactt aactacaaga atctcgccga tttatccttc gatttctacg 120

tttcagcctt cgattccgcc gtttttacct ccatcgccgt cgcgcagagc acaatctccg 180

acggtgaagc cgtctttgcc atttgtaccg gcgttgttcg ttttcggaga ttcctcagtc 240

gatagcggaa ccaataactt tcttggaacc ttagcgagag cagatcggct tccctacggt 300

cgcgatttcg atacgcatca accaacggga aggttttgca atggaagaat cccagttgat 360

tatctaggct taccattcgt tcctagctat cttggacaaa ctgggactgt tgaagacatg 420

tttcaaggag taaactatgc atcagctggt gctggaatca tcttatcaag tggatctgaa 480

ttgggccagc gggtttcatt tgcgatgcaa gttgagcagt ttgttgatac gtttcagcag 540

atgatactga gtattgggga gaaagcttcg gaacgtttag tgtcaaactc ggttttctac 600

atatcgattg gagtgaatga ttacatacat ttctacatca gaaacatctc caatgtgcag 660

aatctctata ctccatggaa ttttaatcag ttcttggctt ctaatatgag acaggagctc 720

aagaccttgt acaatgtcaa ggtgaggagg atggtggtga tgggactgcc acctattggc 780

tgtgcaccat actacatgtg gaaatacaga agccagaacg gagaatgtgc agaagaagtg 840

aacagcatga tcatggaatc caactttgtc atgagataca ctgtagataa actcaaccgt 900

gagcttccag gggcatccat tatctactgt gacgtgttcc aaagcgctat ggacattctc 960

aggaaccacc aacactacgg ttttaatgag acgacagatg cgtgttgtgg gctagggagg 1020

tacaaaggat ggcttccatg catctcgccg gagatggctt gctctgacgc ctccggtcac 1080

ctctggtggg accagtttca tcctacagac gccgttaacg ccattctagc cgacaatgta 1140

tggaatggtc gccacgtgga catgtgttac cctactaacc tagaaactat gcttcattct 1200

taa 1203

<210> 28

<211> 400

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 28

Met Ser Ile Lys Leu Leu Val Leu Val Phe Ser Leu Leu Ile Ile Phe

1 5 10 15

Thr Arg Pro Lys Leu Ile Ala Asp His His Leu Thr Thr Arg Ile Ser

20 25 30

Pro Ile Tyr Pro Ser Ile Ser Thr Phe Gln Pro Ser Ile Pro Pro Phe

35 40 45

Leu Pro Pro Ser Pro Ser Arg Arg Ala Gln Ser Pro Thr Val Lys Pro

50 55 60

Ser Leu Pro Phe Val Pro Ala Leu Phe Val Phe Gly Asp Ser Ser Val

65 70 75 80

Asp Ser Gly Thr Asn Asn Phe Leu Gly Thr Leu Ala Arg Ala Asp Arg

85 90 95

Leu Pro Tyr Gly Arg Asp Phe Asp Thr His Gln Pro Thr Gly Arg Phe

100 105 110

Cys Asn Gly Arg Ile Pro Val Asp Tyr Leu Gly Leu Pro Phe Val Pro

115 120 125

Ser Tyr Leu Gly Gln Thr Gly Thr Val Glu Asp Met Phe Gln Gly Val

130 135 140

Asn Tyr Ala Ser Ala Gly Ala Gly Ile Ile Leu Ser Ser Gly Ser Glu

145 150 155 160

Leu Gly Gln Arg Val Ser Phe Ala Met Gln Val Glu Gln Phe Val Asp

165 170 175

Thr Phe Gln Gln Met Ile Leu Ser Ile Gly Glu Lys Ala Ser Glu Arg

180 185 190

Leu Val Ser Asn Ser Val Phe Tyr Ile Ser Ile Gly Val Asn Asp Tyr

195 200 205

Ile His Phe Tyr Ile Arg Asn Ile Ser Asn Val Gln Asn Leu Tyr Thr

210 215 220

Pro Trp Asn Phe Asn Gln Phe Leu Ala Ser Asn Met Arg Gln Glu Leu

225 230 235 240

Lys Thr Leu Tyr Asn Val Lys Val Arg Arg Met Val Val Met Gly Leu

245 250 255

Pro Pro Ile Gly Cys Ala Pro Tyr Tyr Met Trp Lys Tyr Arg Ser Gln

260 265 270

Asn Gly Glu Cys Ala Glu Glu Val Asn Ser Met Ile Met Glu Ser Asn

275 280 285

Phe Val Met Arg Tyr Thr Val Asp Lys Leu Asn Arg Glu Leu Pro Gly

290 295 300

Ala Ser Ile Ile Tyr Cys Asp Val Phe Gln Ser Ala Met Asp Ile Leu

305 310 315 320

Arg Asn His Gln His Tyr Gly Phe Asn Glu Thr Thr Asp Ala Cys Cys

325 330 335

Gly Leu Gly Arg Tyr Lys Gly Trp Leu Pro Cys Ile Ser Pro Glu Met

340 345 350

Ala Cys Ser Asp Ala Ser Gly His Leu Trp Trp Asp Gln Phe His Pro

355 360 365

Thr Asp Ala Val Asn Ala Ile Leu Ala Asp Asn Val Trp Asn Gly Arg

370 375 380

His Val Asp Met Cys Tyr Pro Thr Asn Leu Glu Thr Met Leu His Ser

385 390 395 400

<210> 29

<211> 2629

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

atggcggcgc cccttctcgc cctcctgctc ctgttcctct ccggtccccg ccgctgctcc 60

gccgccgcgg cctcgccgcc cccaccgtcc ccgcccccgc ggcccgcgcc cctggtcccg 120

gcgctcttcg tcatcggcga ttccacggcc gacgtcggca ccaacaacta cctcggcacg 180

ctcgcccgcg ccgaccgcga gccctacggc cgggacttcg acacgcaccg ccccacgggg 240

cgcttctcca acggccgcat ccccgtcgac tacctcggta atattaaggg catgctccgc 300

ggcctccttt tgtagttcag cgacactgat gcgatgatcc aaggccgtgg tatatatgtt 360

aatgtgcagc ggagcggctg ggccttccct tcgtgcctcc ctaccttgaa cagaacatgc 420

gcacgggcgc cgccggtgcc ggcctcggca agattgatgg gatgatccaa ggcgtcaact 480

acgcgtccgc ggcagccggc atcatctcca gtagtggctc tgagctggta tatatatgtg 540

tcctccaatc ccatcacccc tacaaacctg atgctgagct taatctggca ggcagcattg 600

ccatgatttt gttgacaaat ctgttcgggt gcagaccact gaatactgtt gttgcttcgt 660

gatttgttca cttcactcat gtggtcctta attgaatgag cgatgttgat tgtaatcttt 720

gttgtgctgc agggaatgca tgtgtcgctg acccagcagg tgcaacaggt cgaggacacg 780

tacgagcagc tgtcgctggc tcttggggag gccgcggcag ccaacctgtt caagaggtcg 840

gtgttctttg tgtccatcgg gagcaacgat ttcatccact actacctgcg caatgtgtcg 900

ggtgtccaga tgcgttacct cccttgggaa ttcaacaagc tccttgtcag tacaatgaga 960

caggaaatta aggtgctctc cttgttttcc ggttagttct tttttagggt attttccggt 1020

tagtttattc agtgcagcat tacttgcctt gtttagagtg tgctaggctg atagagcttt 1080

ttacttggtg gtgctattct atttatagtg agggatcttg atgcttgaat tgttttcact 1140

tgcaattggc ataaatggtc ccatgcgtca aggagctgtg cctacaatca ccttttatct 1200

gttgcagttc tgaagtttaa actctgaacc catgaaaggg attaaattca gttgattgaa 1260

ataattattc tgagtttact agggactaac caactataat tgatattgat tatgtcttgg 1320

actgaaggta tgtttgattc gttgatatgc tggcactata tttctgaagt gatttgtaat 1380

ttgtactgcc ctccatatct tgagccaaag ttaactccat tgcacttcag tcttgactgc 1440

tggatccgct tccatattta tccttctgta ttcatatgac ctgactacga tacatcatga 1500

ttctttgtgc ccaatttatc ccatcgatga gtactaagga gaacatacga tgcttgttga 1560

ttgaagatgc gcatgccttg aagttgtatt gtctggcacc caagagttga aacacatact 1620

gtttataatg atacacccaa gattgtttat tttctcttaa tgtttataaa accttcagta 1680

ttaactggaa ttctgttttt ttgttttttt tcatctgtga atcttgttgt ataatgggag 1740

ttgtattgta tattatctac tgctctcttc tgacagtgaa gttttatgca gaatttgtac 1800

aacatcaatg ttcgcaaggt catactgatg ggcctacctc ctgttggatg cgcacctcat 1860

ttcctcgagg agtatggcag tcaaaatggg gaatgcatcg attatatcaa caatgtcgtg 1920

attgagttca actatgccct gaggcacatg tccaatgagt tcatcagcca gcacccagat 1980

tctatgatca gctattgcga tacttttgag gggtccgtgg acatactaaa caaccgtgag 2040

cgttatggtc agcacatgaa tcattagcaa gtttggatta cttgctgtcc ttagggaagc 2100

actcacagtt gactgagata ctgtgcaggt tttgtgacca ccactgatgc ttgctgcggg 2160

ctgggcaagt atggaggctt gatcatgtgc gttcttccac aaatggcgtg cagcgacgcg 2220

tcaagccatg tctggtggga tgaattccac ccaacagatg ctgtcaacca catcctggca 2280

gataatgttt ggtccagtca gcacaccaag atgtgctatc ctttggactt gcaacagatg 2340

gtaaaactga agctatagaa ccaatctgaa gttacttgcc tcacatacgt ttcaaagaaa 2400

tgtatagttg tgaatctgaa agagttgtca tgccaaaatg ttcatggttg tggattgcaa 2460

agatctatga agatagactt gtcaaattta gagctcaggt tacatcaaag tagatgttgc 2520

tgtttttttc tttcatatgt agaggatcta tatggtcaaa ctgacagact ctgttacggt 2580

actcttacga ggtaagatat gatcaaatga gtcaatggtt attcgggag 2629

<210> 30

<211> 1161

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

atggcggcgc cccttctcgc cctcctgctc ctgttcctct ccggtccccg ccgctgctcc 60

gccgccgcgg cctcgccgcc cccaccgtcc ccgcccccgc ggcccgcgcc cctggtcccg 120

gcgctcttcg tcatcggcga ttccacggcc gacgtcggca ccaacaacta cctcggcacg 180

ctcgcccgcg ccgaccgcga gccctacggc cgggacttcg acacgcaccg ccccacgggg 240

cgcttctcca acggccgcat ccccgtcgac tacctcgcgg agcggctggg ccttcccttc 300

gtgcctccct accttgaaca gaacatgcgc acgggcgccg ccggtgccgg cctcggcaag 360

attgatggga tgatccaagg cgtcaactac gcgtccgcgg cagccggcat catctccagt 420

agtggctctg agctgggaat gcatgtgtcg ctgacccagc aggtgcaaca ggtcgaggac 480

acgtacgagc agctgtcgct ggctcttggg gaggccgcgg cagccaacct gttcaagagg 540

tcggtgttct ttgtgtccat cgggagcaac gatttcatcc actactacct gcgcaatgtg 600

tcgggtgtcc agatgcgtta cctcccttgg gaattcaaca agctccttgt cagtacaatg 660

agacaggaaa ttaagaattt gtacaacatc aatgttcgca aggtcatact gatgggccta 720

cctcctgttg gatgcgcacc tcatttcctc gaggagtatg gcagtcaaaa tggggaatgc 780

atcgattata tcaacaatgt cgtgattgag ttcaactatg ccctgaggca catgtccaat 840

gagttcatca gccagcaccc agattctatg atcagctatt gcgatacttt tgaggggtcc 900

gtggacatac taaacaaccg tgagcgttat ggttttgtga ccaccactga tgcttgctgc 960

gggctgggca agtatggagg cttgatcatg tgcgttcttc cacaaatggc gtgcagcgac 1020

gcgtcaagcc atgtctggtg ggatgaattc cacccaacag atgctgtcaa ccacatcctg 1080

gcagataatg tttggtccag tcagcacacc aagatgtgct atcctttgga cttgcaacag 1140

atggtaaaac tgaagctata g 1161

<210> 31

<211> 386

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 31

Met Ala Ala Pro Leu Leu Ala Leu Leu Leu Leu Phe Leu Ser Gly Pro

1 5 10 15

Arg Arg Cys Ser Ala Ala Ala Ala Ser Pro Pro Pro Pro Ser Pro Pro

20 25 30

Pro Arg Pro Ala Pro Leu Val Pro Ala Leu Phe Val Ile Gly Asp Ser

35 40 45

Thr Ala Asp Val Gly Thr Asn Asn Tyr Leu Gly Thr Leu Ala Arg Ala

50 55 60

Asp Arg Glu Pro Tyr Gly Arg Asp Phe Asp Thr His Arg Pro Thr Gly

65 70 75 80

Arg Phe Ser Asn Gly Arg Ile Pro Val Asp Tyr Leu Ala Glu Arg Leu

85 90 95

Gly Leu Pro Phe Val Pro Pro Tyr Leu Glu Gln Asn Met Arg Thr Gly

100 105 110

Ala Ala Gly Ala Gly Leu Gly Lys Ile Asp Gly Met Ile Gln Gly Val

115 120 125

Asn Tyr Ala Ser Ala Ala Ala Gly Ile Ile Ser Ser Ser Gly Ser Glu

130 135 140

Leu Gly Met His Val Ser Leu Thr Gln Gln Val Gln Gln Val Glu Asp

145 150 155 160

Thr Tyr Glu Gln Leu Ser Leu Ala Leu Gly Glu Ala Ala Ala Ala Asn

165 170 175

Leu Phe Lys Arg Ser Val Phe Phe Val Ser Ile Gly Ser Asn Asp Phe

180 185 190

Ile His Tyr Tyr Leu Arg Asn Val Ser Gly Val Gln Met Arg Tyr Leu

195 200 205

Pro Trp Glu Phe Asn Lys Leu Leu Val Ser Thr Met Arg Gln Glu Ile

210 215 220

Lys Asn Leu Tyr Asn Ile Asn Val Arg Lys Val Ile Leu Met Gly Leu

225 230 235 240

Pro Pro Val Gly Cys Ala Pro His Phe Leu Glu Glu Tyr Gly Ser Gln

245 250 255

Asn Gly Glu Cys Ile Asp Tyr Ile Asn Asn Val Val Ile Glu Phe Asn

260 265 270

Tyr Ala Leu Arg His Met Ser Asn Glu Phe Ile Ser Gln His Pro Asp

275 280 285

Ser Met Ile Ser Tyr Cys Asp Thr Phe Glu Gly Ser Val Asp Ile Leu

290 295 300

Asn Asn Arg Glu Arg Tyr Gly Phe Val Thr Thr Thr Asp Ala Cys Cys

305 310 315 320

Gly Leu Gly Lys Tyr Gly Gly Leu Ile Met Cys Val Leu Pro Gln Met

325 330 335

Ala Cys Ser Asp Ala Ser Ser His Val Trp Trp Asp Glu Phe His Pro

340 345 350

Thr Asp Ala Val Asn His Ile Leu Ala Asp Asn Val Trp Ser Ser Gln

355 360 365

His Thr Lys Met Cys Tyr Pro Leu Asp Leu Gln Gln Met Val Lys Leu

370 375 380

Lys Leu

385

<210> 32

<211> 10875

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

tccgggccgg caagccaagc ggcccagagc acgccaccac taagccgagc gcgccaactc 60

accgccgcca ccgagcgcgc gcgcccgcag gaaatggcgg tggcgccctt gctcaccctc 120

ttactcctgc tgttcctctc cggttccggt ccccgccgat gctccgccgc cgccacagcg 180

aactcgacgt cctcaccttc tccgcccccg cggccggcgc cgctagtccc ggcgctcttc 240

gtaatcggcg actccacggc cgacgtaggc accaacaact acctgggcac gctcgcccgc 300

gccgaccgcg agccctacgg ccgggacttc gacacgcacc gccccacggg gcgcttctcc 360

aacggccgca tccccgtcga ctacatcggt aataattaag gccgggctct gcggcctcct 420

ctccatcctt tggttcagct agcgagcagc gacattctat tgatggtctt tgtgcagcgg 480

agcggctggg cctccccttc gtgcctccat accttgaaca gaacatgcgc acgggcgccg 540

ccgatgttgg cctcacaagc attgatggga tgatacaagg cgtcaactac gcgtccgcgg 600

ctgccggcat catctccagc agtggctctg agcttgtaca tatatatcct cccatgaatc 660

ccattgatcc tacaaaacct gatgctaaac ttagctcggc agaatggtca taatttagtt 720

gaaaaaaaaa ttaatttagt cattctggtt gtaatcttgg ttgtgctgta gggaatgcat 780

gtatccctga cccaacaggt gcagcaggtc gaggacacat atgagcagct atcactggct 840

cttggggagg ccgcggtggc caacctgttc aggaggtccg tgttctttgt gtccatcggg 900

agcaatgact tcatccacta ctacctgcgc aatgtgtctg gtgtccagat gcgatacctc 960

ccttgggagt tcaaccagct ccttgtcagt acaatgagac aggaaatcaa ggtgcgcttc 1020

ttcttctcca gttaggtcat tcagtgcagc attggttgtc acatttcttt acttttggag 1080

tgtatggtat atatgcttgc taggctggta gctatgttct tgtgcaaatc agtgagttaa 1140

ttggtgctta attagccgtt gttagcctta gtcatgtgag catcagttgt atacttgtat 1200

agttcaacgt tgtgctgcta ttctatttat agtttggtac tttggttctt tcacgaaata 1260

ttgacagatt ttttgttatg ttcgggaaga catacaagcg ccgggatcgt ggctgaccgg 1320

ggttggcatg tgtgtgcgcg gtcaccacga cagggtgtcc atgtcgttta cgacaagtgg 1380

atagttacgg atatttatca gatttggtta gttatatttg ttaggaagat ctagtttatt 1440

agcaagtcat cgttatgtag tcatgtaagg actataagag tccccatcgg ttaatgagaa 1500

gggtttagcc caggattgag atttatatct ccctaagggc gcctgacagt gccttcctgt 1560

tcgttgccct actgccgctc gtgatcgacc ttcgatcacg acgccaactc gctgcaaggt 1620

tcctcgcgct cacgctccaa tctcttcgcc ctactttcta cgctccaaag cccgacatcc 1680

taccaacttg gtatcagaga cgatggctac gtccggggat gcttccgcac cggttcctcc 1740

gacaacggtc gccccgacga cgggagtgcc tatgaggggc gttccgacgg tcggcgttac 1800

ggccgccgcc actctgcccc tcgccacaac ggcgcctcgt tgtcaccacc accagctatc 1860

tcgtccgtcg ccgaggccct taatgccttg acgtcggcca tcaccagcat gtagctgcaa 1920

atgacggcag tgaaccatca cctggcgaac caggccgctc gtctctctcg gcgattgaca 1980

gacaacacgc cttcacgcag ttcgggttgc ccagattcgg cggggtccca gccctgccca 2040

cttcctcgac gcccgtgatc tccgtggtct cggcggcctc ggactctgcc tcatccatgc 2100

cgcggtcttc gcaccgctca ccgcgaccga accacaaggg gcggcgccgc gtccgcatcc 2160

gccacctgga ggcgtcccga tcaatcagat cgttttcccc ccttgccgtt gccgcagcct 2220

gtgtttccct cggtgggtct tccatacttc accacgccga cgtctcacct gtcgacgcgg 2280

ccaccggcgg ttccttcgtc gcaaagcccg acggggtggc ggtcccaagg taccacaagc 2340

tcacgttcgc tacgtacgac gacacctgcg atcccctcgg ttggctcaac aagtgtgagt 2400

aattcttccg cagccaaaac acgcgcgagg cggacaagac ctggctcgcg tcataccacc 2460

tccaggacgt cgcgctccag tggtacatgg tattggaggc ggacatgggc tgaccggtgt 2520

ggcctgactt ccgccacatg tgtcagcaac gctttggtcc agcgcttagc acgaactacc 2580

tcgccaatct ggcgcggctc ccgttcggcg gttcggtcaa caaatatatg gcagcgtccc 2640

aacgcgcgcc gctcacgtcg gcgacctctc caccctacag aaggtccgct tgttcatggg 2700

tgggggctgc cggaatacat tcgagtcgac atcgaactca tggatcctca agacctgcag 2760

caggccatgc gtttggcgcg ggcttatgag cgccgcaatg ctgcccatgc cccggcttcg 2820

acgggacagc ggccggcgcg gcgtccccct ggcactcaag caaccttgcc agcaccgaca 2880

ggctccacaa ccacatcatc tacacctaca cggctcttca agcagctgac cccggaggag 2940

atggccgatc gatgcaagat gggtctttgc tataattgcg atgagccata cgtgcgcggt 3000

cataagtgtg catgccagtt tttcttggag gcaaccgact atgttgttga agaatcgaaa 3060

gatgacactg agcctgttga tgcctctttt gatccagaga agcccatgat ctccctggcc 3120

gcaatcacgg gcatccgagt ggagaagacg atgcagcttc ctgtccagat tgggatgcac 3180

aagttcactg ccctcctcga ttcaggcagc acgcacaact tcattgacgt caacgcagcg 3240

cgtcgcgcag ggctacaggt ggacgattgc ccaggcacgc acgtcgttgt ggccaacggt 3300

gaccatgtcg cctgccgtgg cctcaaccgt gctatccccc tccagattgg tgacaccagc 3360

tttgcggtgg actgcttcgc cataccgctg ccccactacg acatggtcct gaggatctcg 3420

tggctacgga ccctgggtcc catcttttgg gatttcaacg gccttcacat ggcattcgtc 3480

cttcgtggtc gccgtatgct gtggacgggc gtcggctcgc ccaacgcgca atgtgccgaa 3540

cccctgctcg aaagcgccat ctacaccgac aagggcgctg agccggccct cctcgagtga 3600

ttgctggacc tgttcacgga catcttcgcc gagccaacgg ggcttccgcc cgaacgcctg 3660

ggtgatcacc gcatccacct gaagccgggc acggagccgg tcgccgtgcg cccctccgct 3720

acccacatct ccaaaaagac gagttggagt gctagtgcga cgctatgctc caacagggcg 3780

tcatccggga gagcacgtcc cccttttcgg cgccggtctt gctggtccgc aagcaggatg 3840

caacgtggcg cttttgcgtc gattacaggg cgctcgacgc ggtgactgtg aaggacaagt 3900

tcctgatccc tgtcgtcgaa gagctgctca gcgagctcca tggcgccaac tttttcacca 3960

agctggatcc tcgttcgggc tatcattagg ttcgcgtcca cgcagcggat gttgaaaaga 4020

cagcgttccg gacgcaccac gaccacttcg aattcttggt cattcctttc ggcctgttga 4080

aagccctagt ttggttttgg ataattgatg aaaccctagt actaacctct ataataagtg 4140

tgtgtagact taatgaggtt ggtacatgcc aagtgatgga gcaagtgatg atcatggtga 4200

tgatggtgat gaccacaaga tgatcaagtg ctcaacttgg aaaagaagaa agagaaaaac 4260

aaaactctat ggagatcaag gcgaaggtat tgcttagggt tttggttttg gtgatcaaga 4320

caccatagag ggtgtgatca catttaggat agatagccgt actataaaga ggggaattct 4380

ttggctaagc ggttatcaag tgtcactagg tgtcattgtt catgggcatg catttagaac 4440

ctagtaagct aacttaactc cttcgaagaa aatgtttgtg aaaatgctaa cacacgtgca 4500

catgttggtt cacactttgt ggtgttggca cactttgaga aggaggtgga gtttgaaagg 4560

tagagagagg atgggttcct ctctccctcc cgccgagctt gcgaggcggg attcggcgct 4620

tttcgagaaa atgaagtgca tattttctat tgcgccggtg ggaaaattgg tgaagtcgcg 4680

ggagtgtttc tcgctgagaa aacactcacc ggacgctggc tcagaggcac cggacgctgt 4740

gtctgagcgt ccggtgtgca ggctgcctgg ctcagctagg gttaggcacc ggacgcaagc 4800

tggagcgtcc ggtggtctga gtccggtgtt cgcgtgtttt gcaaccctct ctgggtgtga 4860

gtccggtgag caccggacgc tcagggtgcg tccggtggct tgcgtccggt gaccctgcga 4920

gtttgcggag ctctctgcgc atgagtccgg tgtgcaccgg acgcgtccgg tgccaacctg 4980

ctcagcgtcc ggtgctctgc aggttaccgt tggactctga cacgcggctg acgttggagc 5040

accggacgtt ggtgttgagc gtccggtgcc cctttaagag cgtccggtga ccccgtattt 5100

cgcccagtga aagagccaac ggctctattt gtttgagggg ctataaatac gtgtttggcc 5160

ggcttggggc tcactctctt ggcattctaa catacttgac atacttgtga gcctaagcaa 5220

acacctccca ctcatctcct tcatagatta tacatctttg tgagattggg agtgattcta 5280

agtgcatttg cttgagtgat tgcatctagt ggcacttggg gatcgttcta gctgcagttt 5340

tcttgttact cttggtggtt gccgccacct agacggcttg gagcagcaga ggagctttgg 5400

cacgagttgg tgattgttcg tggccatctc cggtgattgt gagaggtttg tgcctacctc 5460

ggcggagtgc caaaggtaac attagtggat tgctcgtgtc attgagctac ctcacttgtg 5520

ggtaggttct tgtggtgtcc tagtgaggac gaggttcgtg ctacacctct tagccaccga 5580

accatcaagt gttggtcgac acaacgggga cgcagcgtgc cggcaagcac gtgaacctcg 5640

ggagaaaaat cggtgtctca attgtgtttg attggcattc tcccggtgct tgattgttga 5700

tatattggtg attggttcat cccctacacg gcggtataaa tatcttttcc tctcctatta 5760

cttaccacaa agtagtgtaa ctagttttag ttgctagttt tgacttgtgt agttaagctc 5820

actagtgtaa cttgtagaag acctagagct tgtgtgtata gtgatcatag caactagaat 5880

tattggatag gtggtttgca aacacccctt ttagagctag agcaaaaagc tacactttgt 5940

tatttactaa cctcttgctc tagtgagttt gtagattttt taaataggct attcaccctc 6000

cctctagcca tattaggacc tttcacctgt ccaacgcgcc ctcgacgttc caagcactca 6060

tgaacatcgt cctcaagccg ttcctgcgcc gctgtgtctt ggtgttcttt gatgacatcc 6120

tggtctacag acgtggaccg agcacctcca gcaacttcgg gtcgtcttcg acgtcctccc 6180

gtgagcaccg cttgcacctc aagcgttcta agtgctcctt cgccaccact tcggtccact 6240

acttgggcca cgtcatctcc aaggagggtg tggacatgga tgccaccaac gtagccgctg 6300

tgcagacgtg gccgcagccg cgttcggcgc gtggcctccg cggtttcctc ggcctatcgg 6360

gttactatcg ccgctttatc aaggacaatg gtagaatcgc ggcgccctta acccagctcc 6420

tgcgcaagga gtttcattgg tctgaggagg cgggcatggc attctcggcg ctcaaggagg 6480

ccctatgtgc ccccccgtac tccagctgcc tgtatggtac gattgcggcg cccttaaccc 6540

agctcctgca caaggagggg tttcgttggt ctgaggaggc aggcatggca ttctcggcgc 6600

tcaaggaggc cctctgtgcc ccctggtact ccagctgcct gacttcgcag cgacgttctt 6660

catggactgc gacgcgtcag gcttcagctt cggcgtagtg cttcatcagg atgggcggcc 6720

tattgcattc ttcagccacc ccttcgcagc acggcatctc aagacggcgg cctacgagca 6780

cgagattatt gggctcgttc aagcagtccg ccattggcga ccatatcttt gggggcgcgc 6840

cttcgtcgta cagaccgacc actacgccct caagtttatg cttgatcagc ggctgtcgac 6900

gattccgcag cgtcactggg tgagcaagtt atttggttat gatttcagcg ttgaatatcg 6960

tccaggcaaa gggaacgtgg tggccgatgc tttgtcacgc tgggatggcg acgtacctct 7020

cctggcggac gttctggagg ccggcgcctt cctcatggca ctgtctaccc tggcgttcca 7080

actctacgac gacatccacc acgagctgga cgccgacggc gggctgcgcc agcaccgcga 7140

cgccgcagca gccggtgagc tcgatccggc ctttaccgtt cgtgatggcc tcgtgctgta 7200

tgaggggcgt gtctacatcc ctgctgcgtc cgcccgtctc aacgacgtgc tccaactggc 7260

gcacatgggc gggcacgaag ggatccagcg caccctgcag cgcctcccgc agcgcttcta 7320

cgtcgagcat gaccgccgca tcgttggcga cttcgtccgt tcgtccccga cgtgccagcg 7380

gaataaaatg gagacgctgc acccgacagg tcttctccaa cctctgccgg tcccctcccg 7440

tgtttcggct gacatctcca tcaacttcgt cgaagctttg cccaaggtgc atggcaaaag 7500

tgtgctgctc acggtggtgg acagattctc gaagtatgcc cacttcattg cattgggcca 7560

tccctacacg gcgtcttcgg tggcacgagc attcttccac gagatcgttc gtcttcatgg 7620

gtttcctgag tccatcgtga gtgaccgtga cccggtgttc actggtcatg tgtggcgtga 7680

cctgttccgc catgccggtg tcaagcttcg catgagcact gcttttcatt cgcaaacgga 7740

ccgtcaatcg aaggtggtca acaagattat caccatgtat ctcatatgtc ttacagggga 7800

tcgtcctcgt gactggctag attggttggc atgggcggag ttctgctaca acacggcgta 7860

ccacactgct ctgcaggcca cgccgttcta ggtggtctat gggcgcgctc ctccggccct 7920

gttgccgtac acgccggggg aggcacacac agaggcggtc gacaccctgc tcaccaacag 7980

ggatgagttg ttggcggagg tgcgtgctcg gcttctccaa gcacaggaat atgcgcgacg 8040

cttctaagac gccaagcatc gtgcactgga gttcgccatt ggggactggg tcttgcttcg 8100

catgttgcat cgacacacgc aggctcttgt tcccggcggg cgtggcaagc tagggcccaa 8160

atatgcaggt ccttttcagg tactcgagcg cgtgggtgaa gttgcctacc atatgcgtct 8220

tccggatggg gctcggattc acgacgtctt tcatgtgggt gtgttgaagc ttttccgggg 8280

tcctcctccc ccgggtgaac tggtgctacc tcctcttcgt catgggtggc cactacagca 8340

gcctgatagg gtgctgcgct cagagcttcg tcgtggagtt tggcatgtcc tggtggcttg 8400

gtctggcatg ccgacgtccg aagctacctg ggaaccagtg ccggcattcc gcgctgccta 8460

tccttcgttc cagctcgagg acgagctgtt tccttaggga gggagagatg ggttggcatg 8520

tgtgtgcacg gtcaccaaga cagggtgtcc atgtcgttta cgacaagtgg acagttaggg 8580

atatttgtca gatttggtta gttatatttg ttaggaagat ctagtttatt agcaagtcat 8640

cgttatggag tcatgtaagg actataagag tccctattgg ttaatgagaa gggtttagcc 8700

catgattgag atttatatct ccctaagggc gcctggcagt gccttcctgt tcgttgccct 8760

gctgccgctc gtgattgacc ttcgatcacg gcgccaactc gccgcaaggt tcctcgcgct 8820

cacgctccaa tctctccgcc ctactttcta cgctccaaag cccgacgttc taccattttt 8880

tatgcctgaa ctattttcct gcgagtggca taaatgattt gggctgaggc tacaatcccc 8940

ctttgtctgt tgctgttcag tgttctgaat tttaatctct gaactcagga gtgaacatat 9000

ttgtctatgt gggaactgta taacatttgc aatttcgaaa gctaactgat ctgaacacat 9060

gaaagggaag taacctaatg gatattcaga taaccttatt atttatggaa gttctgggat 9120

gtaagacctt ttcaattttc cttagatgga tatatcgctg gctgtgagtt tccaatgtgg 9180

gatgctgctc aagaaagaat gcgttggttt tctatatata tgttcatctt tagttctttg 9240

aaaattgaac agctactgca atctaaattt caaaattgat gtcagttgca gcattttgat 9300

gaaatactaa gtttagctaa tcgaaataca actatcctgc gtgtaccaag aactcaagga 9360

aggcaaggac taattgacta taattgatat ttaattattt cttcgagtga atttatattt 9420

gattcaaata tatgctcact tacatatttc tgaagtgaat ttgtcatggc ccaggatcaa 9480

ctgggcccat ttaattccaa agttctgttc acaggtaccg tagcacactg ctgtgcacgt 9540

ctctgccgag tccaaaataa tgcacaagga ccaagagtct agttagttag gaagtctatt 9600

cattcaattt tcccactccc atgctaaatg gcgactagca tcggtggctc actcgtcatc 9660

agagtgccat accatccctg ctctgatacg ttgccctcca tattttgagc caaagttaat 9720

tgtattgtac ttctatgata caacatgatt ctaagttcat attcatatat tacattgatt 9780

cttaaggcct aatttgtcac atcgatggtt gtattattct ctgacaccca agggttgagt 9840

ttatataaat aataaggggc ggaaagttgt tagtttttta atgtttatga gaccttcatt 9900

attaattaga attctgtact ttttctcctt ttcatatatt cattattgtc caattttctg 9960

tggaccttgt tatataatca agttgcatat cccccactct ctcttctgat agtgatggtt 10020

ttatacagaa tttgtacgac atcaatgttc gcaaagtcat actgatgggc ctacctcctg 10080

ttggttgtgc acctcatttc ctcgaggagt atggcagtca aactggggaa tgcatcgatt 10140

atatcaacaa tgtcgtgatc gagttcaact atgccctgag acacatgtct agcgagttca 10200

tcagccagca tccagattcc atgatcagtt attgcgacac tttcgagggg tctgtggaca 10260

tactaaacaa tcgtgagcat tatggtgagc aaagtaatcg ttggtaagtt tggattactt 10320

gctggccttg gggaagcact tacatctcat tgagatatga cattgtgcag gttttgtcac 10380

caccactgac gcttgctgtg ggctgggcaa gtatggaggc ttgatcatgt gcgttcttcc 10440

acagatggcg tgcagtgatg catcaagcca tgtctggtgg gatgaattcc acccaacaga 10500

ggctgtcaac cgcatcctgg cagataatgt gtggtccagt cagcacacca agatgtgcta 10560

tcctttggac ctgcaacaga tggtaaaact gaagctgtag aaccaatctc gaatgacttg 10620

tttaacatgc gtttcaaaga acttaagagg tgacaagcct aattgaaatg tttagaattg 10680

tgaattacaa aatatttata aggatagact tgtcagtttt agatagctca gggtacatga 10740

aaagcaagag gttgttcctt ggtatgtaga tgcaatgtag gggatctatt tggcgaaact 10800

ggaacacata ctatcaagca tatgtgctaa tgactgatga ataatttagg cgacagaaag 10860

ttatttgaga ttgta 10875

<210> 33

<211> 1179

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

atggcggtgg cgcccttgct caccctctta ctcctgctgt tcctctccgg ttccggtccc 60

cgccgatgct ccgccgccgc cacagcgaac tcgacgtcct caccttctcc gcccccgcgg 120

ccggcgccgc tagtcccggc gctcttcgta atcggcgact ccacggccga cgtaggcacc 180

aacaactacc tgggcacgct cgcccgcgcc gaccgcgagc cctacggccg ggacttcgac 240

acgcaccgcc ccacggggcg cttctccaac ggccgcatcc ccgtcgacta catcgcggag 300

cggctgggcc tccccttcgt gcctccatac cttgaacaga acatgcgcac gggcgccgcc 360

gatgttggcc tcacaagcat tgatgggatg atacaaggcg tcaactacgc gtccgcggct 420

gccggcatca tctccagcag tggctctgag cttggaatgc atgtatccct gacccaacag 480

gtgcagcagg tcgaggacac atatgagcag ctatcactgg ctcttgggga ggccgcggtg 540

gccaacctgt tcaggaggtc cgtgttcttt gtgtccatcg ggagcaatga cttcatccac 600

tactacctgc gcaatgtgtc tggtgtccag atgcgatacc tcccttggga gttcaaccag 660

ctccttgtca gtacaatgag acaggaaatc aagaatttgt acgacatcaa tgttcgcaaa 720

gtcatactga tgggcctacc tcctgttggt tgtgcacctc atttcctcga ggagtatggc 780

agtcaaactg gggaatgcat cgattatatc aacaatgtcg tgatcgagtt caactatgcc 840

ctgagacaca tgtctagcga gttcatcagc cagcatccag attccatgat cagttattgc 900

gacactttcg aggggtctgt ggacatacta aacaatcgtg agcattatgg ttttgtcacc 960

accactgacg cttgctgtgg gctgggcaag tatggaggct tgatcatgtg cgttcttcca 1020

cagatggcgt gcagtgatgc atcaagccat gtctggtggg atgaattcca cccaacagag 1080

gctgtcaacc gcatcctggc agataatgtg tggtccagtc agcacaccaa gatgtgctat 1140

cctttggacc tgcaacagat ggtaaaactg aagctgtag 1179

<210> 34

<211> 392

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 34

Met Ala Val Ala Pro Leu Leu Thr Leu Leu Leu Leu Leu Phe Leu Ser

1 5 10 15

Gly Ser Gly Pro Arg Arg Cys Ser Ala Ala Ala Thr Ala Asn Ser Thr

20 25 30

Ser Ser Pro Ser Pro Pro Pro Arg Pro Ala Pro Leu Val Pro Ala Leu

35 40 45

Phe Val Ile Gly Asp Ser Thr Ala Asp Val Gly Thr Asn Asn Tyr Leu

50 55 60

Gly Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe Asp

65 70 75 80

Thr His Arg Pro Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val Asp

85 90 95

Tyr Ile Ala Glu Arg Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu Glu

100 105 110

Gln Asn Met Arg Thr Gly Ala Ala Asp Val Gly Leu Thr Ser Ile Asp

115 120 125

Gly Met Ile Gln Gly Val Asn Tyr Ala Ser Ala Ala Ala Gly Ile Ile

130 135 140

Ser Ser Ser Gly Ser Glu Leu Gly Met His Val Ser Leu Thr Gln Gln

145 150 155 160

Val Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu Ser Leu Ala Leu Gly

165 170 175

Glu Ala Ala Val Ala Asn Leu Phe Arg Arg Ser Val Phe Phe Val Ser

180 185 190

Ile Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser Gly

195 200 205

Val Gln Met Arg Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val Ser

210 215 220

Thr Met Arg Gln Glu Ile Lys Asn Leu Tyr Asp Ile Asn Val Arg Lys

225 230 235 240

Val Ile Leu Met Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe Leu

245 250 255

Glu Glu Tyr Gly Ser Gln Thr Gly Glu Cys Ile Asp Tyr Ile Asn Asn

260 265 270

Val Val Ile Glu Phe Asn Tyr Ala Leu Arg His Met Ser Ser Glu Phe

275 280 285

Ile Ser Gln His Pro Asp Ser Met Ile Ser Tyr Cys Asp Thr Phe Glu

290 295 300

Gly Ser Val Asp Ile Leu Asn Asn Arg Glu His Tyr Gly Phe Val Thr

305 310 315 320

Thr Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr Gly Gly Leu Ile Met

325 330 335

Cys Val Leu Pro Gln Met Ala Cys Ser Asp Ala Ser Ser His Val Trp

340 345 350

Trp Asp Glu Phe His Pro Thr Glu Ala Val Asn Arg Ile Leu Ala Asp

355 360 365

Asn Val Trp Ser Ser Gln His Thr Lys Met Cys Tyr Pro Leu Asp Leu

370 375 380

Gln Gln Met Val Lys Leu Lys Leu

385 390

<210> 35

<211> 2883

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

gagcacactg cacaccacta cgcactaccc gagcgcgcca actcaccacc accaccaagc 60

gcgcgcgctg gaaatggcgg tggcgccctt gtttgccctc ctagtcctgt tcctctccgg 120

tccccgccga tgcgccgccg ccgccgccgc cgccgccgcc gcggcctcgc cgtcctcacc 180

ttccccgtcc ccgcgacccg caccgctggt cccggcgctt ttcgtaatcg gcgactcaac 240

ggccgacgta ggcaccaaca actatctggg cacgctcgcc cgcgccgacc gcgagcccta 300

tggccgggac ttcgacacgc accaccccac ggggcgcttc tccaacggcc gcatccccgt 360

cgactacatc ggtaataagg gcaggctctg cggcctcctc tcgttgtttg gttcagccac 420

acttattgga aagatcgatt tgtgcagctg agcgactggg cctccccttc gtgcctccct 480

accttgaaca gagcatgcgc acgggcgccg gcggcgttgg cctcacaaac attgatggga 540

tgatacaagg cgtcaactac gcgtcggcgg cagccggcat catctccagc agtggctctg 600

agcttgtata tactccctct gctccgaacg gtcatcccaa atttctagag agttaaagca 660

tcttgagttt gagcaaaatt atataataaa caaataacat ttataacatg aaatgaatat 720

cattagattt ttcatcaatt atatttttat agtatgtcta tttaatggca gaaatctttg 780

taattttttc ataattttgg tcaaacactt tgatttttcc aaagaagttg ggacgactta 840

taattcgaaa cggagggcct acatctatac ttcatatatc atcccacgaa tcccattacc 900

ccaaatctgg tgctaacctt agctggccag catcgtcata atttggttta caaaaaaaat 960

gttcttactt tatgatcagt tcagtcagtt ttgtggttct taaattaatc gagtgattct 1020

agctgtaatc ttggttgtgc tgtagggaat gcatgtatcg ctgacccagc aggtgcagca 1080

ggtcgaggac acatatgagc agctatcact ggctcttggg gaggcggcag cgggcaacct 1140

attcaggagg tccgtgttct ttgtgtccat cgggagcaat gacttcatcc actactacct 1200

tcgcaatgtg tctggtgtcc agatgcggta cctcccttgg gagttcaacc agctccttgt 1260

aagcacaatg agacaagaaa tcaaggtgtg cttcttgttc tctagttagg tcattcagtg 1320

cagcattaga gtatctactt gctaggctgt tagttatgtt cttgtccaaa tcagtgagtt 1380

ggtgacatca tgcttaatta accattgcta gccttgtgag cctgtgagca tcagttgtga 1440

tacttgtgtg gttcaacttc gtggtgctac tctatttaag gtttagttct ttgatgaaat 1500

agttagggat ttctatgcct gaaatattgc tattctattt atagttttgt tctttgatga 1560

aatagttagg ggttttctat gcccgaacta tttttacttg caattggcat aaatgatccc 1620

gtgctttaag ctacaacctc attttgtttg ttgctgttca gcgttctaaa ttttaaactc 1680

tgaactaagg attgaacata tttgtctatg cgagaactgt ataacatttg caatttcgaa 1740

agctatctga tctgaaaaaa cgaaagggct agattcagat aaccttagtt atggcaattc 1800

tggctctggg atgtaagacc ttacaaattt ccttagttag atatatctga acaaatgaaa 1860

ttgtatgttt ttctttatgt ttgtaagacc ttcagtatta actggaatgc tgtatttttg 1920

cttcttttca tatattcgtc attgtcaaat taactgtgga ccttgatata taatcaagat 1980

ctatatcctc tgctgtctct tctgatactg atagttttct acagaatttg tatgacatca 2040

acgttcgcaa ggtcatactg atgggcctac ctcctgttgg ttgtgcacct catttcctcg 2100

aggagtatgg cagtcaaact ggggaatgca tcgattatat caacaatgta gtgatcgagt 2160

tcaactatgc cctgagacac atgtctaggg agttcatcag ccagcatcca gattccatga 2220

tcagttattg cgacactttc gaggggtctg tggacatact aaacaatcgt gagcattatg 2280

gtgagcaaac taatcattgg taaggttgga atacttgccg tccttagggg aagcacttac 2340

atctcattgg gatacgacgt tgtgcaggtt ttgtcaccac aactgatgct tgctgtgggc 2400

tgggcaagta tggaggcctg atcatgtgcg ttcttccaca aatggcgtgc agcgatgcat 2460

caagccatgt ctggtgggat gaattccacc caacagatgc tgtcaaccgc atcctggcag 2520

ataatgtgtg gtccagtcag cataccaaga tgtgctatcc tttggacctg cagcagatgg 2580

taaaactgaa gctgtagaaa ccagtctgga ctgacttgtt taacacgcgt ttcaaagaac 2640

ctacaagagg tgacaagccg aatggaaatg tatagatctg tgaattacaa atacttataa 2700

ggataggctt gtcagtttta gatatctcag gttacatgaa aagcatgatg ttgttccttg 2760

gtatgtagat gcaatgtagg ggatatatat ggtcaaactg gaacacatgc tgtcaggttt 2820

atataggtgc taatgagtga tgaataatct cggtgacaga aagctcattt gagattgtac 2880

ctg 2883

<210> 36

<211> 1182

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

atggcggtgg cgcccttgtt tgccctccta gtcctgttcc tctccggtcc ccgccgatgc 60

gccgccgccg ccgccgccgc cgccgccgcg gcctcgccgt cctcaccttc cccgtccccg 120

cgacccgcac cgctggtccc ggcgcttttc gtaatcggcg actcaacggc cgacgtaggc 180

accaacaact atctgggcac gctcgcccgc gccgaccgcg agccctatgg ccgggacttc 240

gacacgcacc accccacggg gcgcttctcc aacggccgca tccccgtcga ctacatcgct 300

gagcgactgg gcctcccctt cgtgcctccc taccttgaac agagcatgcg cacgggcgcc 360

ggcggcgttg gcctcacaaa cattgatggg atgatacaag gcgtcaacta cgcgtcggcg 420

gcagccggca tcatctccag cagtggctct gagcttggaa tgcatgtatc gctgacccag 480

caggtgcagc aggtcgagga cacatatgag cagctatcac tggctcttgg ggaggcggca 540

gcgggcaacc tattcaggag gtccgtgttc tttgtgtcca tcgggagcaa tgacttcatc 600

cactactacc ttcgcaatgt gtctggtgtc cagatgcggt acctcccttg ggagttcaac 660

cagctccttg taagcacaat gagacaagaa atcaagaatt tgtatgacat caacgttcgc 720

aaggtcatac tgatgggcct acctcctgtt ggttgtgcac ctcatttcct cgaggagtat 780

ggcagtcaaa ctggggaatg catcgattat atcaacaatg tagtgatcga gttcaactat 840

gccctgagac acatgtctag ggagttcatc agccagcatc cagattccat gatcagttat 900

tgcgacactt tcgaggggtc tgtggacata ctaaacaatc gtgagcatta tggttttgtc 960

accacaactg atgcttgctg tgggctgggc aagtatggag gcctgatcat gtgcgttctt 1020

ccacaaatgg cgtgcagcga tgcatcaagc catgtctggt gggatgaatt ccacccaaca 1080

gatgctgtca accgcatcct ggcagataat gtgtggtcca gtcagcatac caagatgtgc 1140

tatcctttgg acctgcagca gatggtaaaa ctgaagctgt ag 1182

<210> 37

<211> 393

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 37

Met Ala Val Ala Pro Leu Phe Ala Leu Leu Val Leu Phe Leu Ser Gly

1 5 10 15

Pro Arg Arg Cys Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser

20 25 30

Pro Ser Ser Pro Ser Pro Ser Pro Arg Pro Ala Pro Leu Val Pro Ala

35 40 45

Leu Phe Val Ile Gly Asp Ser Thr Ala Asp Val Gly Thr Asn Asn Tyr

50 55 60

Leu Gly Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe

65 70 75 80

Asp Thr His His Pro Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val

85 90 95

Asp Tyr Ile Ala Glu Arg Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu

100 105 110

Glu Gln Ser Met Arg Thr Gly Ala Gly Gly Val Gly Leu Thr Asn Ile

115 120 125

Asp Gly Met Ile Gln Gly Val Asn Tyr Ala Ser Ala Ala Ala Gly Ile

130 135 140

Ile Ser Ser Ser Gly Ser Glu Leu Gly Met His Val Ser Leu Thr Gln

145 150 155 160

Gln Val Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu Ser Leu Ala Leu

165 170 175

Gly Glu Ala Ala Ala Gly Asn Leu Phe Arg Arg Ser Val Phe Phe Val

180 185 190

Ser Ile Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser

195 200 205

Gly Val Gln Met Arg Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val

210 215 220

Ser Thr Met Arg Gln Glu Ile Lys Asn Leu Tyr Asp Ile Asn Val Arg

225 230 235 240

Lys Val Ile Leu Met Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe

245 250 255

Leu Glu Glu Tyr Gly Ser Gln Thr Gly Glu Cys Ile Asp Tyr Ile Asn

260 265 270

Asn Val Val Ile Glu Phe Asn Tyr Ala Leu Arg His Met Ser Arg Glu

275 280 285

Phe Ile Ser Gln His Pro Asp Ser Met Ile Ser Tyr Cys Asp Thr Phe

290 295 300

Glu Gly Ser Val Asp Ile Leu Asn Asn Arg Glu His Tyr Gly Phe Val

305 310 315 320

Thr Thr Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr Gly Gly Leu Ile

325 330 335

Met Cys Val Leu Pro Gln Met Ala Cys Ser Asp Ala Ser Ser His Val

340 345 350

Trp Trp Asp Glu Phe His Pro Thr Asp Ala Val Asn Arg Ile Leu Ala

355 360 365

Asp Asn Val Trp Ser Ser Gln His Thr Lys Met Cys Tyr Pro Leu Asp

370 375 380

Leu Gln Gln Met Val Lys Leu Lys Leu

385 390

<210> 38

<211> 4019

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

atgacgatgt catatgtgtg caacaccgac ggcaactttc tttgtgcaat gtgtggagtg 60

aatgtggata gtcaggtcag ccagtgttgt cctcggtgcg gtcatattcc atgatggcgc 120

taaggacatt tattaatgtt tttgttcggt tttctacttt tctgcaaatt aactagacaa 180

ctattttcta catgattaat ggattgactc aaggattccg gttggaaaaa aaggaataat 240

gttgatctga attcttgaag attgagtacc acttacgaat agaatggagg gccaaatttt 300

atgggcccct gtacatcccc gtacaggcct ggactatatc ttggtttgtt ttgggttgta 360

ggtagaattc agtgttgggt tgggttgggt tgccaaattt cttcaaacaa ttgtcaggcc 420

ttttaaccca ccaaaccggc ctgcttcagg ctagcgactt gattgggctc gagtctgaca 480

gagcccatcg tcgacttgca ttgcatacgc ccgcgatcca tctcctccac cttttccacc 540

ccaactcccc aaggacgcgc gaacttgcac cgccttcgcc ggaaatggcg actctcctcg 600

ctctcctcat gtgcctcctc ctcttctccg ctctcccttg ctgcgccgcc gccgcgtcgc 660

cttcccggtc ctccgcccca tcggcggccc ctaccccgct cgtcccggcg ctcttcgtgg 720

tcggcgactc cacggccgac gtcggcacca acaactacct cggcacgctc gcccgcgccg 780

atcgtgagcc ctacggacgc gatttcgaca cccaccgccc caccggacgc ttctccaacg 840

gccgcatccc cgtcgactac ctcggtacgg tgctcgcgtc gcgcttcctt ttggtttcgc 900

cccccttttc tcgattgcta accccttttt ctgtactaca gcggagaagc tggggcttcc 960

cttcgtgcct ccgtaccttg agcagagcat gcgcacgggc gtaagcagtg ttggcctcgg 1020

caatattgat ggaatgatcc aaggcgtcaa ctatgcgtcc gcggcaggcg gcattctctc 1080

cagcagtggc tctgatctgg tctgtcctcc cacttctcct aataacacca tatcgatttt 1140

atgacgcctt ggtgtggccg agagcctgag atatctgttt gggtggagga atcgagtttc 1200

aatttttggt ttgttcacat cagtattgat gctaaccagg tggtgctcgt gcgattttgg 1260

ttgcgcttgt aggggatgca tgtgtcgctg acccagcaaa tgcagcaggt tgaggacaca 1320

tatgagcagc tggcactggc tcttggggag gcagcgacaa ctgacctgtt caagaggtcg 1380

gtgttctttg tgtcgatcgg gagcaacgac ttcatccact actacctgcg caatgtgtcc 1440

ggcgtccaga tgcattacct cccatgggag ttcaatcagc tccttgttaa tgaaatgagg 1500

caggcaatca aggtgcgcat cttgttcctc agtttattac tcccatggga gtactgtatt 1560

atgtgcagca ttgctcatct ctgtgttgtt tcttagtgtg tgtattatct cttatggctg 1620

taacatttca attttacttt gctggattta tctcttatgg ctgtaacatt tcaattttac 1680

tttgctggat tagtgacctc tgtagctagg attaggaatt gtgcttcgga gaaaatgtac 1740

ctctttatgt ggagagacta gcaatttgtt atctctggaa attaactaat gaacactagg 1800

aagtaattaa ctgaatgaat attgttgtgt ccttgcttgg ttgcagttct gaaatgttgg 1860

ttccttcacg gcttcacctt cgatatacat atcattcatt cttagtgtca aattttgggg 1920

tgtttctcaa gaagttaata ttggttgaac acatattcat cttaaatgat cttagttgca 1980

ccatttttat caaatgaaat aacaatgatt ggatctatta tcaggagtct acaatgagat 2040

atactgatgt ttacttgtta cttagttgta tcttgtgtaa acgttaccat ggatggctga 2100

agcgtgtaat catttcagtc tgcatcttct tcttgcccag tttattcttc gtaggattgc 2160

ccacctcctt tctggtatca ctgtcctctg tatcgttcct aaaggcagtg gcattggggt 2220

ttgacaatct atagtcagga ttctctgtaa aattcagaaa atatactctc ttatctgcac 2280

agagattaga aaagtagaaa tttgctatca ttggccggct ttcatttcag gaatattagt 2340

tcctttacct taagatttac atataattgg ttcttagtgt caactgtggg gtgtttctca 2400

agaaggtaat attgattttc tagatattca tcttaatttc taggacagtt gcataggtac 2460

cacaaatgca aaatattcca gatggatgct agttgcagca ttttgataat tttttttaaa 2520

atgactaggt atattatccc gactctgcaa ggaggtatag tggtgtttat ttgttacgta 2580

gtcagtattt agcagtgtct tcaactgact gatgtttttg agtaagctgc actaatttta 2640

taagcgattt atgctgcctt gtttattgag agtgcaagct aagtttctgg caaaaaaaaa 2700

gagagtgcaa gctaagtctg tggtacttat atcaactggt ggaccatctt gcacatttgg 2760

ctcaatgtgc tcatgacttg actttgatac agcatatgct tctcagtcca ggcgtcatgt 2820

atgatgtatc atttgatttt ctatgcccaa tttatctcca ttagctaatc ttaagcagaa 2880

tattcaaggc acggtaattg aagatgcaca ttccagtagt ttgttgtact gtccaactgt 2940

tgattattga atattcttgt gtttcattcc acaatctcat gaatatgctc atgcagattg 3000

aatggattgc ttcagtttgt ttgttcttta caattcttca gaaaattaat tgcatttttt 3060

agaacgaatt taattgcaag ttggcatttt tttcttcata tttcgcaact ttcggtgacc 3120

gaactagttg tgtgtatcct gctcccttct gacatgataa tttatgcaga atctgtacaa 3180

catcaacgtc agaaaggttg tattgatggg ccttcctcct gttggctgtg cacctcactt 3240

cctttcggac tatggcagcc aaaatgggga atgcatcgac tacatcaaca atgttgtgat 3300

tgagttcaac tatgggctgc gatacatgtc cagcgagttc atccgccagt acccagattc 3360

tatgatcagt tactgtgata ctttcgaggg gtcagtggac atactagaga accgtgaccg 3420

ctatggtgag caaatgcatc ataagtacta catttggttt gcctgctatc cttagtaaaa 3480

gccttacatt ttgatggaat tgcaatgcac aggctttgtg accatcactg atgcttgctg 3540

tgggctaggg aagtatggcg gcgtattcat atgtgttctt ccacagatgg cgtgcagcga 3600

cgcatcaagc catgtctggt gggacgagtt ccacccaaca gatgctgtga atcggatcct 3660

ggcagaaaat gtctggtcgg gtgagcacac caagatgtgc tatccagtcg acttgcagga 3720

gatggtgaaa ctgaagcagt agaaaccaac ctgaaatctc catctcagtt gcttgctcaa 3780

cttctttgtt ttcagtttta cgaagaactt ttggggtcgg catagaaaat gtacatatcg 3840

agaatcacgg agttctgtaa tcagatttgg atagctctgg ttaaatgcaa gtatgtttgc 3900

ctgtaagtga actgtaaagg atctgtattg ccaaactgcc acatattgcc tgtcaagtga 3960

gactgaatga gtgatgagcc tgtttggtga caaaaagaaa cgccgagctg ttgacctgc 4019

<210> 39

<211> 1374

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

atgacgatgt catatgtgtg caacaccgac ggcaactttc tttgtgcaat gtgtggagtg 60

aatgtggata gtcaggctag cgacttgatt gggctcgagt ctgacagagc ccatcgtcga 120

cttgcattgc atacgcccgc gatccatctc ctccaccttt tccaccccaa ctccccaagg 180

acgcgcgaac ttgcaccgcc ttcgccggaa atggcgactc tcctcgctct cctcatgtgc 240

ctcctcctct tctccgctct cccttgctgc gccgccgccg cgtcgccttc ccggtcctcc 300

gccccatcgg cggcccctac cccgctcgtc ccggcgctct tcgtggtcgg cgactccacg 360

gccgacgtcg gcaccaacaa ctacctcggc acgctcgccc gcgccgatcg tgagccctac 420

ggacgcgatt tcgacaccca ccgccccacc ggacgcttct ccaacggccg catccccgtc 480

gactacctcg cggagaagct ggggcttccc ttcgtgcctc cgtaccttga gcagagcatg 540

cgcacgggcg taagcagtgt tggcctcggc aatattgatg gaatgatcca aggcgtcaac 600

tatgcgtccg cggcaggcgg cattctctcc agcagtggct ctgatctggg gatgcatgtg 660

tcgctgaccc agcaaatgca gcaggttgag gacacatatg agcagctggc actggctctt 720

ggggaggcag cgacaactga cctgttcaag aggtcggtgt tctttgtgtc gatcgggagc 780

aacgacttca tccactacta cctgcgcaat gtgtccggcg tccagatgca ttacctccca 840

tgggagttca atcagctcct tgttaatgaa atgaggcagg caatcaagaa tctgtacaac 900

atcaacgtca gaaaggttgt attgatgggc cttcctcctg ttggctgtgc acctcacttc 960

ctttcggact atggcagcca aaatggggaa tgcatcgact acatcaacaa tgttgtgatt 1020

gagttcaact atgggctgcg atacatgtcc agcgagttca tccgccagta cccagattct 1080

atgatcagtt actgtgatac tttcgagggg tcagtggaca tactagagaa ccgtgaccgc 1140

tatggctttg tgaccatcac tgatgcttgc tgtgggctag ggaagtatgg cggcgtattc 1200

atatgtgttc ttccacagat ggcgtgcagc gacgcatcaa gccatgtctg gtgggacgag 1260

ttccacccaa cagatgctgt gaatcggatc ctggcagaaa atgtctggtc gggtgagcac 1320

accaagatgt gctatccagt cgacttgcag gagatggtga aactgaagca gtag 1374

<210> 40

<211> 457

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 40

Met Thr Met Ser Tyr Val Cys Asn Thr Asp Gly Asn Phe Leu Cys Ala

1 5 10 15

Met Cys Gly Val Asn Val Asp Ser Gln Ala Ser Asp Leu Ile Gly Leu

20 25 30

Glu Ser Asp Arg Ala His Arg Arg Leu Ala Leu His Thr Pro Ala Ile

35 40 45

His Leu Leu His Leu Phe His Pro Asn Ser Pro Arg Thr Arg Glu Leu

50 55 60

Ala Pro Pro Ser Pro Glu Met Ala Thr Leu Leu Ala Leu Leu Met Cys

65 70 75 80

Leu Leu Leu Phe Ser Ala Leu Pro Cys Cys Ala Ala Ala Ala Ser Pro

85 90 95

Ser Arg Ser Ser Ala Pro Ser Ala Ala Pro Thr Pro Leu Val Pro Ala

100 105 110

Leu Phe Val Val Gly Asp Ser Thr Ala Asp Val Gly Thr Asn Asn Tyr

115 120 125

Leu Gly Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe

130 135 140

Asp Thr His Arg Pro Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val

145 150 155 160

Asp Tyr Leu Ala Glu Lys Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu

165 170 175

Glu Gln Ser Met Arg Thr Gly Val Ser Ser Val Gly Leu Gly Asn Ile

180 185 190

Asp Gly Met Ile Gln Gly Val Asn Tyr Ala Ser Ala Ala Gly Gly Ile

195 200 205

Leu Ser Ser Ser Gly Ser Asp Leu Gly Met His Val Ser Leu Thr Gln

210 215 220

Gln Met Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu Ala Leu Ala Leu

225 230 235 240

Gly Glu Ala Ala Thr Thr Asp Leu Phe Lys Arg Ser Val Phe Phe Val

245 250 255

Ser Ile Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser

260 265 270

Gly Val Gln Met His Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val

275 280 285

Asn Glu Met Arg Gln Ala Ile Lys Asn Leu Tyr Asn Ile Asn Val Arg

290 295 300

Lys Val Val Leu Met Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe

305 310 315 320

Leu Ser Asp Tyr Gly Ser Gln Asn Gly Glu Cys Ile Asp Tyr Ile Asn

325 330 335

Asn Val Val Ile Glu Phe Asn Tyr Gly Leu Arg Tyr Met Ser Ser Glu

340 345 350

Phe Ile Arg Gln Tyr Pro Asp Ser Met Ile Ser Tyr Cys Asp Thr Phe

355 360 365

Glu Gly Ser Val Asp Ile Leu Glu Asn Arg Asp Arg Tyr Gly Phe Val

370 375 380

Thr Ile Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr Gly Gly Val Phe

385 390 395 400

Ile Cys Val Leu Pro Gln Met Ala Cys Ser Asp Ala Ser Ser His Val

405 410 415

Trp Trp Asp Glu Phe His Pro Thr Asp Ala Val Asn Arg Ile Leu Ala

420 425 430

Glu Asn Val Trp Ser Gly Glu His Thr Lys Met Cys Tyr Pro Val Asp

435 440 445

Leu Gln Glu Met Val Lys Leu Lys Gln

450 455

<210> 41

<211> 3584

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

cttccataaa ccagaccggt cttctccccc acctttccca acccagagcg cgcgaactcg 60

ccaccgcctc gccggaaatg gcgccttccc tcgctcacct cgtgtgcctc ctcctcctcc 120

tccttctcct cctctccgct ctacccctct ccgcagccgc ctcgaccccc cggtccgcgc 180

cgccgtcggc gccccccacc ccgctcgtcc ccgcgctctt cgtcatcggc gactccacgt 240

ccgacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc gagccctacg 300

gccgggactt cgacacccac cgccccaccg gacgcttctc caacggccgc atccccgtcg 360

actacctcgg tgcgttgccc gcgacctcgg tgtctcctcg cttctctcgg tttctccatg 420

gatcattggt gcggtgctgg tttctcgatt ttgcgcgtcc ttgcttccag atgcggatcg 480

tttcggttta ttaggcctcc atggttcatc gtgactactg atgattgttt cttctgcttg 540

attgttccgt gtaatcttct gtcgctgctg tggtctgaat ccgcaggagt atggcagccc 600

catgtgatat tcctagtttc ccttctcttg atttctgacc ccttttgttg ctgtaccaca 660

gcggagaagc tggggcttcc cttcgtgcct ccgtacctcg agcagagcat gcgcatgggc 720

gtcggcagcg ttggcctcat caacatcggc ggaatgatcc aaggagtcaa ctacgcttcc 780

gcggcagccg gcattctctc cagcagtggc tctgagctgg tccgttctcc caccgctccc 840

gataactgcg tcaatcttat aacgtcttgg tgctgtcgag agatctgttt ggggatgatt 900

ctgctgtcaa tctgtggttt cttcacacca aatttgatgc taatcggttg gggtttttgc 960

gattttggtc gcgcttgcag gggatgcacg tgtcgctgac ccagcaggtg cagcaggttg 1020

aggacacata tgagcagttg gcgctggctc ttggggaggc agctacagtc gacttgttca 1080

agaggtcggt attctttgtg tcgatcggga gcaacgactt catccactac tacctgcgca 1140

atgtgtcagg cgtgcagatg cattacctcc catgggagtt caatcagctc cttgttaatg 1200

cagtgaggca ggaaatcaag gtgtgcttct tgctcctcag tttgttatgt gtaccattgc 1260

tcgcctcctt tttcattatc agtgtgttgt gcattgtttt acttgtggag atgcaccaca 1320

cgtagtcagg gatctctgta actacgaatt tcgttttgga cataacgtag tttcttgtgt 1380

ggatacacta gaaaaccatt atctgggaaa ttaacacatg aaagtgattt aaatgaatga 1440

ggtttccttg ttggtttgca gttctagaac attaacggct tcacctatgg tttgcagttc 1500

acagatggaa taatcccatt gttcttactg tcgaatttgg ggttatttct ttcaatattg 1560

cacaggtatt gcgattgcaa aatgtttcag actgatgtta gatgcggcat tttgataaaa 1620

tatgaaataa aaatggttgg attgatgatc ccgattctac aatgaggtgt aatggtgttt 1680

ggttgctatg taagggtatg tttggatggt agccaaaact tatctccaat ttttttgcat 1740

gccaatagcc aacattggcc aactctagtt cattttcctt tccaacattg gccaactcat 1800

ggaccagcac aactttgacc aaaattttgg cctaactttt tggtaaggca aacatgggct 1860

caaacaaaac tgacattata ctgtcttaaa actttttttc tctcaaacgc acacttaaat 1920

gtgtgttgtt gtatattaga agaaagcgtc atgatgatgc aaagcaaagc aaatacaacc 1980

ctgaaaagca gaagtcctaa actattgaaa acgaagcaat acaaaaggca gcccaactga 2040

aaaactgaaa ctgcacaagg tgctactcat gctacccgag ctacaccaca gcatactatc 2100

ttaaaatgtg atatattctg aaatgctcag gctgcacttt tttttgtgct accatctgtt 2160

ttgggttcaa gttaagtctg ttgtactttc agagttcatg gatggaaccc tcgttctagg 2220

atgcagtgtt ttatctgtgg aacttgatgt attttcactg gtctgtaatt tctggagctc 2280

atgcttgatc gtcgtgtttg atctgcctgc gtgctgttgg ttcctggtag ttgctttacc 2340

tgtatgcttg taggtttagc ttcctgtttt gtgtctttaa tgtttctcat actctgtaga 2400

actatgccgg tttctttaat ggaaatcgat gaggaggctc gttgcttaaa aactaaaaaa 2460

aaaaacagtc tgttgtactt tcagctataa ctgtataaca ccttgcacat ttatctcgct 2520

gcattgaact gttcatgatc tgaccatggt acaagtgtgc ttctcagttc atgtgtcatg 2580

gatcatttga ttctctatgc ctaatttatc tctgttacct aatcttgagc agaacatgtg 2640

atgcatggtg attgaagatg catataccag tagtttgttg tatgtagaaa ttttctttgt 2700

gtttattcca taatctcatt tatatgctga tgcaaattgt aatggattgc ttcggtttct 2760

ttattcttcg cagtaccgta gcaaattaat tgccattttg catccattac tgtttagttc 2820

tatacatgtg gttcttgtca gattactcca cttttgatgt ctaaactagt tctggactca 2880

tgtgtctcct actaccttct gacaatgatg atttatgcag aatctgtaca atatcaacgt 2940

ccgaaaggtc gtgctgatgg gccttcctcc tgttggctgt gcccctcact tcctctcaga 3000

ctacggcagc caaaatgggg aatgcatcga ctacatcaac aacgtcgtga tcgagttcaa 3060

ctatgggctg agatacatgt ccagcgagtt catccgccag tacccagact cgatgatcag 3120

ctactgtgat acatttgagg ggtcagtgga catactagag aaccgtgacc gctatggtga 3180

gtaaatgcat cattagtatt gcatttaaat tgcgtgccgg ttcgcaactg taacatttgt 3240

agtacattta aatggagtgc taagtcttct catttttggt ggacttgcaa ctgcaggctt 3300

tctgaccacc actgatgctt gctgtgggct tggcaagtat ggcgggctat tcatctgtgt 3360

tcttccacag atggcgtgca gcgacgcgtc aagccatgtg tggtgggatg aattccaccc 3420

gaccgatgct gtgaaccgga tcctggcaga aaacgtgtgg tctggtgagc acaccaggat 3480

gtgctatcca gtgaacttgc aggagatggt gaagctgaag cagtagaacc aacctggatc 3540

gtcattgcag ttacttgctc aacttctgtg ttttcatttt cgac 3584

<210> 42

<211> 1176

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

atggcgcctt ccctcgctca cctcgtgtgc ctcctcctcc tcctccttct cctcctctcc 60

gctctacccc tctccgcagc cgcctcgacc ccccggtccg cgccgccgtc ggcgcccccc 120

accccgctcg tccccgcgct cttcgtcatc ggcgactcca cgtccgacgt cggcaccaac 180

aactacctcg gcacgctcgc ccgcgccgac cgcgagccct acggccggga cttcgacacc 240

caccgcccca ccggacgctt ctccaacggc cgcatccccg tcgactacct cgcggagaag 300

ctggggcttc ccttcgtgcc tccgtacctc gagcagagca tgcgcatggg cgtcggcagc 360

gttggcctca tcaacatcgg cggaatgatc caaggagtca actacgcttc cgcggcagcc 420

ggcattctct ccagcagtgg ctctgagctg gggatgcacg tgtcgctgac ccagcaggtg 480

cagcaggttg aggacacata tgagcagttg gcgctggctc ttggggaggc agctacagtc 540

gacttgttca agaggtcggt attctttgtg tcgatcggga gcaacgactt catccactac 600

tacctgcgca atgtgtcagg cgtgcagatg cattacctcc catgggagtt caatcagctc 660

cttgttaatg cagtgaggca ggaaatcaag aatctgtaca atatcaacgt ccgaaaggtc 720

gtgctgatgg gccttcctcc tgttggctgt gcccctcact tcctctcaga ctacggcagc 780

caaaatgggg aatgcatcga ctacatcaac aacgtcgtga tcgagttcaa ctatgggctg 840

agatacatgt ccagcgagtt catccgccag tacccagact cgatgatcag ctactgtgat 900

acatttgagg ggtcagtgga catactagag aaccgtgacc gctatggctt tctgaccacc 960

actgatgctt gctgtgggct tggcaagtat ggcgggctat tcatctgtgt tcttccacag 1020

atggcgtgca gcgacgcgtc aagccatgtg tggtgggatg aattccaccc gaccgatgct 1080

gtgaaccgga tcctggcaga aaacgtgtgg tctggtgagc acaccaggat gtgctatcca 1140

gtgaacttgc aggagatggt gaagctgaag cagtag 1176

<210> 43

<211> 391

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 43

Met Ala Pro Ser Leu Ala His Leu Val Cys Leu Leu Leu Leu Leu Leu

1 5 10 15

Leu Leu Leu Ser Ala Leu Pro Leu Ser Ala Ala Ala Ser Thr Pro Arg

20 25 30

Ser Ala Pro Pro Ser Ala Pro Pro Thr Pro Leu Val Pro Ala Leu Phe

35 40 45

Val Ile Gly Asp Ser Thr Ser Asp Val Gly Thr Asn Asn Tyr Leu Gly

50 55 60

Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe Asp Thr

65 70 75 80

His Arg Pro Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val Asp Tyr

85 90 95

Leu Ala Glu Lys Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu Glu Gln

100 105 110

Ser Met Arg Met Gly Val Gly Ser Val Gly Leu Ile Asn Ile Gly Gly

115 120 125

Met Ile Gln Gly Val Asn Tyr Ala Ser Ala Ala Ala Gly Ile Leu Ser

130 135 140

Ser Ser Gly Ser Glu Leu Gly Met His Val Ser Leu Thr Gln Gln Val

145 150 155 160

Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu Ala Leu Ala Leu Gly Glu

165 170 175

Ala Ala Thr Val Asp Leu Phe Lys Arg Ser Val Phe Phe Val Ser Ile

180 185 190

Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser Gly Val

195 200 205

Gln Met His Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val Asn Ala

210 215 220

Val Arg Gln Glu Ile Lys Asn Leu Tyr Asn Ile Asn Val Arg Lys Val

225 230 235 240

Val Leu Met Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe Leu Ser

245 250 255

Asp Tyr Gly Ser Gln Asn Gly Glu Cys Ile Asp Tyr Ile Asn Asn Val

260 265 270

Val Ile Glu Phe Asn Tyr Gly Leu Arg Tyr Met Ser Ser Glu Phe Ile

275 280 285

Arg Gln Tyr Pro Asp Ser Met Ile Ser Tyr Cys Asp Thr Phe Glu Gly

290 295 300

Ser Val Asp Ile Leu Glu Asn Arg Asp Arg Tyr Gly Phe Leu Thr Thr

305 310 315 320

Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr Gly Gly Leu Phe Ile Cys

325 330 335

Val Leu Pro Gln Met Ala Cys Ser Asp Ala Ser Ser His Val Trp Trp

340 345 350

Asp Glu Phe His Pro Thr Asp Ala Val Asn Arg Ile Leu Ala Glu Asn

355 360 365

Val Trp Ser Gly Glu His Thr Arg Met Cys Tyr Pro Val Asn Leu Gln

370 375 380

Glu Met Val Lys Leu Lys Gln

385 390

<210> 44

<211> 5417

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

atggcgcccc gctcgccgct cctcctgccc ctcctcctcg ccctcgagct tctcgtcctc 60

ccgctcccca ctccccccca ctgctgctcc gcggcccccc acgtctcgcc gtcaccgtcg 120

ccggaggcgg aggcggtaac ggcaacggca gccacgcgca cgccgctcgt cccggcgctc 180

ttcgtgatcg gggactccac ggccgacgtc ggcaccaaca actacctcgg cacgctcgcc 240

cgcgccgacc gcgagccgta cggccgcgac ttcgacaccc gccgccccac ggggcgtttc 300

tccaacggcc gcatccccgt cgactacatc ggtatgtgcg cgtccccgcc cccgcccctg 360

cccccgctcg ctcgctctcg tgagtcctcc ccgcttccag tgtcgcagat agtactccaa 420

atcgccgctc cgatgctttg cctcttgtac ggctcccatg gatgcagcag ccgtgcagca 480

tttggtgggt ttagtgtgtt gcgtaatttg ggtttctcgc atgcgagggt tttggattca 540

gttgttggtt cctacatctg atctcgtgca ttcgggtatg tgagtttttg ctgaacaatt 600

gctgaatctg aagagtaatc agttctaata gtacactcct acagactagt acaacaagca 660

tccttgtttt caacttgcca aactagagcg tcgcccccac tagaaaaatg caatactata 720

agcgaaatga tctccacaag ctccccatcc caaagctcag tagtaggcta gtagctccac 780

gttccctaaa ctgagtagaa agattaggat ctctctctat gtttagttat tgtttcgttt 840

gagccaattg acaactttcc aatgggagtt tgttatgccc ttaatttatc atgttacaat 900

cagtgggtca tttgagaatt tagtactttt cagaacctac ttctgaaact tgaagaataa 960

aatacatatt aaacatgaat aattgctaaa caggtttcta tccaaactag gattaccagc 1020

ctactatgcg aaagaggttt cccttcaacc tgcaatccaa ttcgtttcta tgtcagtact 1080

tatttttttc ctggttcaat aatatcttat taattgtgca gtttacaact tgcttttttc 1140

ttcttcttga tttcttaatc ttagtccatt ttgttgcatc tgcagcagag aagctggggc 1200

tcccttttgt gcctccatac cttgaacaga acatgcgcat gggcgtcggc agtgttgacc 1260

tcagcaacat tgatgggatg atacaaggtg tcaactatgc atctgccgca gctggaattc 1320

tctcaagcag tggctctgag ctggttcgcc ctcctaactt cccaataact ctatttcacg 1380

cttataatct agcaggaatg tctctgtgaa acctttctct agaggagaaa tcaggaggag 1440

ggtgtttcga caacagacta gaatgaacaa ccctcctctt agtgtcaaca tcctttctaa 1500

ttgggaataa tacttgatca accatgtgaa ctaatgctca atgcttctcc tccttggctg 1560

tttcctttcc ttccatgcat tccaactagt gtagattatt aacgcattcc tagggctatc 1620

tgttaccaat aagacgtgag attgcccacc ggagagtggg tgatgatggg ctggtgctaa 1680

tggacagttt ctccatgctg cttcccttgt ccaagtttcc ttgccaagct acagcgaaat 1740

ataagttgtt tgattgtttt attttcctgc acacaaggta aaaagagaga tatgtggtca 1800

tccacacaaa gctaattcat cagaaatatt gtgttgtgtc agaaactaag caaagtagaa 1860

aactgcttta gttccctacc atgggctttt ggacgatcag ggaatatgca aggataaact 1920

gagttgcact gatatggtga ctttgatgta tatcaccctg aacattccat ttcaatacca 1980

atctttgaat cttattcctg ttcatgttga atctctgatc tttctgtcca aagcatcaaa 2040

aactcatggg gctgcaaagt gttttgccat tgcaatgaaa tatcttggtg gtgtctaaat 2100

agaatagagg cttacatatg aacattgttg aaaatttttc ctttattggt tatgtgtttt 2160

aactttatac aaaggattgg gacctcttgg ttagatccaa gcttgtgcac ttcccacttg 2220

atttgttgta cctcctgtat ttagtagctg aatcaatttt accattaagc aataaaaatc 2280

aatctagaaa acatactttt tgctgctcta tgaagcgatt ttcttgtggt attaacttcc 2340

actcatctga tgtatcctca tttgccactg ttttgtttca tcaagacatc aactatgtct 2400

atatgtttga aggttgtttt ctggtggtat tttataccac tgcaattttt ttcttcagct 2460

gcaaaattct gtgaagctct acagttcaat aacctcaaac attggcagac ccctattctt 2520

ggaatgtgtc aatatgtttc tgtctttttt gttatgattt aatgcaacca tattgcatat 2580

tcttaaattt taatggtgtg gttgctctag ctttcatgtg cttagaatca gggaactctc 2640

acatctttac tttgtgcaga ataaaccttc atgctggtct cttgtgtatc agcctgtagg 2700

cacatgagga tcatttcata gtgtctattt acaattaccc atatggttgt aattcttata 2760

ggagtgtcct tatacctttt ctttactctg cagaaaaact ccatattacc tacttttggt 2820

tttgataact caacgtgatg cctaatttga ttctgttctt gcaattgtgg ttacactgca 2880

gggaatgcat gtttcactga gccagcaggt gcagcaggtt gaggacacat atgagcagct 2940

ggctctggct ctcggggagg aagcaacaac tgatctattc agaaagtctg tgttcttttt 3000

gtcaatcggg agcaacgact ttatccacta ctacctgcgc aatgtgtctg gcatccagat 3060

acgttacctc ccatgggagt tcaaccagct ccttgtcaat gcaatgaggc aggaaatcaa 3120

ggtgtggttc ttgttctcca gtttgttctc tctgtccaac atttctcgcc tctatacaac 3180

actccagttc cagtcttctg atcagtgttt tgcatcgctt aaaggctgta gcatcctgct 3240

tacagtggct aatgatgtga gtgcaatttt agttttgata gtaacttagt ggcatactag 3300

catcacacta cttctggaca ggaatctttc tgccaagtct attttatctg tatttgatca 3360

gtaaatgctc tctgctttag ggtatctgct ccaagttcta gaattaccta ataattggtg 3420

caattcctca ctctaaacac aaatgtgtat aattctttgt agttataaat gtgattgaga 3480

aaaccaggaa tgtgactcca gacatataac ataatgtgaa aatctagcta aggaacatag 3540

gaatgtgaaa atctaatata tattctagaa aaaaaatcaa atgtttatgg agaaatttga 3600

gtatagtgag gaacgttgga tgatagctga atgtgtgtgg aatcttggaa tgaagtttct 3660

ttgagttact gaaatgtgcg agctgaggta agtaggctaa aaaaggacag gtggctattt 3720

cgtctggagg ttgtagacat atataatatg ggaaagttaa ctgataaata catagaagtg 3780

attaacctaa tggatattcg tatcattggt ctgctagcat ttctgggata ttaaataatt 3840

tacactctgt gtaaccttag accctttcag atttgaggta tgttgccatg ttgctctcaa 3900

aatttaactt cctttttata tgttgcaatt ttgatcagat aagacgtaaa gttgatattg 3960

aatattgcct tggattgaat actgtgtcta agttacttaa tttcttggtc ttcaaataca 4020

tgatacatct agaaatactg ccttacattt ttaagtgcaa gctaaatgca tgttgccggg 4080

gcaaccaaag atcagcgccc tgatttcatt aagattagga taaacaagta tagctaaatg 4140

catgttactt tgagctcaac ttgtaggaca ccatgcacat tatcactgta caaacttaat 4200

tctcatgtct ggattatgta taatttggtt tcttcctaat ttatctccat tcttcttttg 4260

atgagataat ttagataatt ttcatttgca aatgaattgg taaacgatcc caagttgcta 4320

ttcagcaaat ctttggcaga acatatgatg catgttgatc gaggctgcat gcaccatgag 4380

ttttatttgt attgtctaac atttgggaac attttcgtta tactcatcca acaatctcat 4440

ttataaactt atcgaagttg gattgatgtg ctttcttgtt gcttaaagtt agtaaattaa 4500

ccacaattat gcattttttt tgctatttag ccatatgcat tttttgtcag attactagat 4560

tattaagctt ttcatatcta taagagctgt gtacttaatg cagaatttgt acaatatcaa 4620

tgtgcggaag gtcgtcatga tgggcctccc tcctgttggc tgtgcacctc actttctctg 4680

ggagtacggc agtcaagatg gggaatgcat cgattatatc aacaatgttg tgattcagtt 4740

caactatgcc ctgagataca tgtctagtga gttcactcgc cagcacccag gctctatgat 4800

cagttattgt gatacttttg aggggtctgt ggacatacta aacaatcgtg accgctacgg 4860

tgagcaaata tatcattgac tactttcaga ctgccttccg tccataggga agtactcaca 4920

ttacgatgca attacaactt gcaggtttcc tgaccaccac tgatgcttgc tgtgggctgg 4980

gaaagtatgg aggcctattc atgtgtgtgc ttccacagat ggcgtgcagt gacgcgtcga 5040

gccatgtctg gtgggacgaa ttccacccca cagattctgt gaaccgaata ctggcagata 5100

atgtgtggtc tggtgagcat acccagatgt gctatcctat ggatttgcag gagatggtaa 5160

aactgaagta gacccaacct gaatctccat tgtagctagt tgcacagctt tcatatactt 5220

tgacaaagaa cctatacggc ggcacacaga aatgtatatc ttgagaacta caaatatttg 5280

tacatatagg tttgtgccaa aaaaaaaaaa agaacggtct tatcatgttt gttcatatat 5340

ttgcactgta aaggatctgt atggccaaac tggaacaggc gcttggtagg taaacgtaaa 5400

gcattgttca gttctca 5417

<210> 45

<211> 1212

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

atggcgcccc gctcgccgct cctcctgccc ctcctcctcg ccctcgagct tctcgtcctc 60

ccgctcccca ctccccccca ctgctgctcc gcggcccccc acgtctcgcc gtcaccgtcg 120

ccggaggcgg aggcggtaac ggcaacggca gccacgcgca cgccgctcgt cccggcgctc 180

ttcgtgatcg gggactccac ggccgacgtc ggcaccaaca actacctcgg cacgctcgcc 240

cgcgccgacc gcgagccgta cggccgcgac ttcgacaccc gccgccccac ggggcgtttc 300

tccaacggcc gcatccccgt cgactacatc gcagagaagc tggggctccc ttttgtgcct 360

ccataccttg aacagaacat gcgcatgggc gtcggcagtg ttgacctcag caacattgat 420

gggatgatac aaggtgtcaa ctatgcatct gccgcagctg gaattctctc aagcagtggc 480

tctgagctgg gaatgcatgt ttcactgagc cagcaggtgc agcaggttga ggacacatat 540

gagcagctgg ctctggctct cggggaggaa gcaacaactg atctattcag aaagtctgtg 600

ttctttttgt caatcgggag caacgacttt atccactact acctgcgcaa tgtgtctggc 660

atccagatac gttacctccc atgggagttc aaccagctcc ttgtcaatgc aatgaggcag 720

gaaatcaaga atttgtacaa tatcaatgtg cggaaggtcg tcatgatggg cctccctcct 780

gttggctgtg cacctcactt tctctgggag tacggcagtc aagatgggga atgcatcgat 840

tatatcaaca atgttgtgat tcagttcaac tatgccctga gatacatgtc tagtgagttc 900

actcgccagc acccaggctc tatgatcagt tattgtgata cttttgaggg gtctgtggac 960

atactaaaca atcgtgaccg ctacggtttc ctgaccacca ctgatgcttg ctgtgggctg 1020

ggaaagtatg gaggcctatt catgtgtgtg cttccacaga tggcgtgcag tgacgcgtcg 1080

agccatgtct ggtgggacga attccacccc acagattctg tgaaccgaat actggcagat 1140

aatgtgtggt ctggtgagca tacccagatg tgctatccta tggatttgca ggagatggta 1200

aaactgaagt ag 1212

<210> 46

<211> 403

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 46

Met Ala Pro Arg Ser Pro Leu Leu Leu Pro Leu Leu Leu Ala Leu Glu

1 5 10 15

Leu Leu Val Leu Pro Leu Pro Thr Pro Pro His Cys Cys Ser Ala Ala

20 25 30

Pro His Val Ser Pro Ser Pro Ser Pro Glu Ala Glu Ala Val Thr Ala

35 40 45

Thr Ala Ala Thr Arg Thr Pro Leu Val Pro Ala Leu Phe Val Ile Gly

50 55 60

Asp Ser Thr Ala Asp Val Gly Thr Asn Asn Tyr Leu Gly Thr Leu Ala

65 70 75 80

Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe Asp Thr Arg Arg Pro

85 90 95

Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val Asp Tyr Ile Ala Glu

100 105 110

Lys Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu Glu Gln Asn Met Arg

115 120 125

Met Gly Val Gly Ser Val Asp Leu Ser Asn Ile Asp Gly Met Ile Gln

130 135 140

Gly Val Asn Tyr Ala Ser Ala Ala Ala Gly Ile Leu Ser Ser Ser Gly

145 150 155 160

Ser Glu Leu Gly Met His Val Ser Leu Ser Gln Gln Val Gln Gln Val

165 170 175

Glu Asp Thr Tyr Glu Gln Leu Ala Leu Ala Leu Gly Glu Glu Ala Thr

180 185 190

Thr Asp Leu Phe Arg Lys Ser Val Phe Phe Leu Ser Ile Gly Ser Asn

195 200 205

Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser Gly Ile Gln Ile Arg

210 215 220

Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val Asn Ala Met Arg Gln

225 230 235 240

Glu Ile Lys Asn Leu Tyr Asn Ile Asn Val Arg Lys Val Val Met Met

245 250 255

Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe Leu Trp Glu Tyr Gly

260 265 270

Ser Gln Asp Gly Glu Cys Ile Asp Tyr Ile Asn Asn Val Val Ile Gln

275 280 285

Phe Asn Tyr Ala Leu Arg Tyr Met Ser Ser Glu Phe Thr Arg Gln His

290 295 300

Pro Gly Ser Met Ile Ser Tyr Cys Asp Thr Phe Glu Gly Ser Val Asp

305 310 315 320

Ile Leu Asn Asn Arg Asp Arg Tyr Gly Phe Leu Thr Thr Thr Asp Ala

325 330 335

Cys Cys Gly Leu Gly Lys Tyr Gly Gly Leu Phe Met Cys Val Leu Pro

340 345 350

Gln Met Ala Cys Ser Asp Ala Ser Ser His Val Trp Trp Asp Glu Phe

355 360 365

His Pro Thr Asp Ser Val Asn Arg Ile Leu Ala Asp Asn Val Trp Ser

370 375 380

Gly Glu His Thr Gln Met Cys Tyr Pro Met Asp Leu Gln Glu Met Val

385 390 395 400

Lys Leu Lys

<210> 47

<211> 6731

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

atggcgctcc ccttcctcct cgccttcgcc ctgctcttcc agctctccgc tcccccgcgc 60

ttctgctccg cggcccccgc ctcctcgccg cccccgtccc cgcccccttc ccctgcggcg 120

gcggcggccc cgcgccgcac gccgctcgtc ccggcgctct tcgtgatcgg cgactccacg 180

gcggacgtcg gcaccaacaa ctacctcggc acgctcgccc gcgccgaccg cgagccgtac 240

ggccgcgact tcgacacccg ccgccccacg gggcgcttct ccaacggccg catccccgtc 300

gactacatcg gtacgcgccc cccaccttct cgatcggcgg cgccatggct gtggcccctt 360

tgctctctcg tgaatcctcc cccgcttcca ggattgcagg tggttctgga atcgtcgatc 420

cgatgctgct ttgcctcttg cacggctatg gatgcagctt gttgtgggtt tagtgtaatc 480

tgggtttggg ttttctggta tacgagggtt ttgctcagtt gttggttcct acatttggat 540

gaatttgggg gcatatgatc tcatgcattg ggagtatgtg gatttttgcc caacaattgc 600

tgaagctgaa gagtaatcag ttctgcaaca caatcaccac agccggatgt tcatagcgct 660

ctcctacaca gctgaccacc tggatctcac atacatagac tcctgcggct tcctctcctt 720

gatctcacat agcatgttgt gggtttagtg taatctgggt atttgggtca tgagagggtt 780

ttcgtctgtg ggtttctgcc gaacaattgc tgaagctgaa gagtaacctg ttttgcagca 840

caactaccac agtctgggac accatttgag cccggctgtt tgtaacactc ctacagagct 900

gaccatctgg atctcacgta tctatataga atcctgcggc ttcctctcca aatcagtatc 960

cagtatccag tatccaccgc cgttatcagc ggttgaggca atgcattggc agagggccag 1020

aacatgaaga agtgccatca taatgtacac cattagtcca tgcatccaga aaacattacc 1080

agaatcctac aatgtatcca tttgatagtc ctgagtcctg accagttgtc tacatgcccc 1140

agtctctttg tcaccacaca ccgttaaatc tctcttgtcc aatgtccacc acattctgga 1200

caatttcaag gtcctcacag gaagcacagc tgcacaacct ttgttaatgt tgctttaaga 1260

aagtcatatc tactaattgg tttatttggg agagtaagga gggaaaaagc ataggaaaga 1320

agcatttaac tagggctact ggctcactat gtgaaagatg tttcccttca atttcattta 1380

gctggtgttc tcgatctctc ttgcccgtct ctgtcagtac ttacgttttt cacgactcaa 1440

tagtatcttg ttctttatac tgtttttaaa ttattttttc ggcgatttct taatcttaga 1500

cttttttgtg catttgcagc agagaagctg gggctccctt ttgtgcctcc ataccttgaa 1560

cagaacatgc gcatgggcgt cggcagtgtc gacctcagca acattgatgg gatgatacaa 1620

ggtgtcaact atgcatccgc ggcagccggc attctctcca gcagtggttc tgagctggtt 1680

tgtcctccta acttcccaac aactctattc acgcttataa tctagcagga atatctttgt 1740

gagacccctc tctagaggac gaatcagaag gagggtgttt caacaacagg ctagaagcaa 1800

tgactcttct catagtgtct acatcctctc tagttaggaa gaatactttc tcaaccattt 1860

gaactatgct caaagattct cctgttcggc tgctcccttc cttccatgtg ttccaaccag 1920

tgtggattat caggtcatca aattcccttc ttagttccta ggagttcatg acttatatct 1980

gcttcctacc agatgtgaga ttgtctacac gagacgattg ataggttaca caagacgatt 2040

gataggctgg tgctaatggg cagtttattc atgctgctgg ccttgtccaa gtttgcttgt 2100

gaagctacag tgctataagt tgtttggttg ttttattttc ctgcacacat aaagcaaaaa 2160

gagatatatg tagccatcta cacaaagcta atttatcata atttttttat tgtgtctgaa 2220

attaaaatag aaaccgcatt tattctctac tatggccttt gggatgatca aggagttagt 2280

aaggatcact gaactgcatc aatgtggtgg aattgatgta tatcatcctt gacattccat 2340

tttcgtatca ctctttattc ctgctatgtt gttgaatctc caatctttgt gcccaaaaca 2400

acaaaaactc gtggagcttc aaattctaat tttgtcattt caataaaaca tcgtggtggt 2460

gtctaaagag gagaaatgtt tacgtatgaa cattgctgca aagctttcct ttatgtggct 2520

atatgtttta actttctata aaggattgga gcctcttggt tagattcaag cttgtgaatt 2580

tctcatttga tttgttgtac ctcctggcaa ttgttggcat attatttatt gcataccttt 2640

tcattattct taaatgtatt tgaaactaaa tcaacatgat catcaagcaa acaacaccaa 2700

tccaaagaac acacttaatg cttctctatg aaggtttctc ttttggtatg taaatacttg 2760

ctcatctgat gtatcctttt ttgttactgt tttgtctcat caactataca tttgaagatt 2820

attttgtggt ggtattcttt actactgcga cattctagca gctgtaaaag tatgtttata 2880

ctgttaaaaa atctccaaaa ttggcagtcc cctagcttgg aatctgtcga tattttctgt 2940

gtttatgtta tgatttcctg caaacatatt ttagattctt aaattttaat ggtgtggttg 3000

ttctagctta aatatgttta gaataaggga tctaacacct ttactttgag cagaataaac 3060

cttcatgctg atctcttgtg tatcaagcct tcaggcacat gaggatcatt tcatagtgtg 3120

actatttgta gttatctgta tggccgtaac taacggcctc tatattgttc tgtataggag 3180

tgtgtctcta ctattttttt ctctgaagaa gagcattctt ttacctattt ttggttttca 3240

taattcaatg tgatgcataa tttgattctg ttctttttta gataaaggaa gctaatttga 3300

ttctgttctt gcaattgtgg ttgcactgca gggaatgcat gtgtcgctga gccagcaggt 3360

gcagcaggtt gaggacacat atgagcagct ctctctggct ctcggggagg cagcaacaac 3420

tgaccttttc agaaagtccg tgttcttttt gtcaatcggg agcaacgact tcatccacta 3480

ttacctgcgc aatgtgtctg gcgtccagat gcgttacctc ccatgggagt tcaaccagct 3540

tcttgtcaat gcaatgaggc aggaaatcaa ggtgtggtta ttgttctcca gtttagtctc 3600

tctgtgcaat atttcttgcc tccttatgat attccagttt tagttttttg atcaatgtgt 3660

tgcatattgc ccaaaggctg tagtatcgtg cttagcagtg gccaatgatg tgagtacaat 3720

tgtagttttg atggtgactt ggtggcatac tggcgtgaca ctatttttgg tcaggaatct 3780

ttctgcgctg actacttatt acctgaattt ggtcagtaaa tattctgtgc ttcataggta 3840

tctgctccca gttccaccac ccagatgtga atagttcttt gtagttagga atatgtttga 3900

gaaaaggagg attgtggact ccagatacat gaattatgaa aagctagcta tgaacattaa 3960

ttcctatgtt tcaagtgtta gaaaattttt aaatgtttat aaagaaacct gatatagtac 4020

actttttctg taggttaaaa ttttcaaatg gtggatgata gtttaaaact gtgtacagtc 4080

ttggactgaa gcttctttga gttactgaaa tgctcaggct gtacagtttt tctgtagtta 4140

tgaattaggt taaaaggata ggagggtaat tcatctgtac atatgtaata tgggaaagtt 4200

aactggtaag tagatggaag tgattaactc gatggatatt tatatcgttg gctgttagca 4260

gttctgtggt gttgtgtact ttacattctc cgtgtaccgt accttagttt cagatttgag 4320

gtagtaagtt gcaacgttac tctataagga catacttgtt ttgtatatgt tcattttgaa 4380

ctcttaacat tttgatcaga caagaagttc agataataaa ttaatcaatt accccaaaaa 4440

atctgctacg ggactgatgt aaagttgata ctgaatattg tcttggactg aatactgtgt 4500

ttgagttagt tcttggtctg cacatacttc cagagtggtt tgtattttgt acgggtactg 4560

ctagtgggcg ggtgatcgct tccccctcct cctagcgatc accagtccct cccccttata 4620

cactcttctt ctcccccttc ctcctcccct tcttctcttc ctactacagt acaccataaa 4680

atttaaaaaa ataaaaaaac aaagttggaa aaaattatgg atagaaatac tatatataaa 4740

aaatttgaat ttaaattcaa atttgaaacg gggctgtnnn nnnnnnnnnn nnnnnnnnnn 4800

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4860

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4920

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4980

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5040

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5100

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5160

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5220

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ttcaaattca aatttgaatc 5280

ggatataatt caaattcaaa tttgaatcgg gtatataaac ttttgacttg taaactttgg 5340

gtctataaac tttaggtgta taaactttag atgtatagaa atactatata taaaaaatat 5400

ttgaattcaa attcaaattt gaatcggata tataaacttt tgatttataa actttgagtc 5460

tctaaacttt agatgtgtaa acttgaggtg tacaaacttt atgtccataa atttactaaa 5520

aagggaaaat aatgtagtgc caaaaaagga aaccacgtag aggagaggga gggggggggg 5580

gatcgatcac ccgttagcca tctcgacttt gtactgcctt ccatttggaa gtgcaagcta 5640

aatgcatgtt acttttgctc aaaacttgta ggacaccatg cacattccca atatgcccat 5700

gatcttacca tgatacaaaa cataattctc acttcatgca taaatgcata atgtacaatt 5760

tgattttctt cctaatttat ctcctttcat cttttgaaca gataatttta attcgcaaaa 5820

gaattggtaa aaatggcccc aaatttctat tcagtaaatc tttggcagaa catgtgatga 5880

tgtaatgcac attgattgag gctgcatgcg ccatgagttt atttgtactg agtactgaca 5940

aacatttgag agcggaaatt tctgttagca ttgtactcat ccaacaatac catgtataca 6000

cttatccaag ttgacttgag atgttgcttt cttgtttttt aaccttagta aaaatcagtt 6060

acaatgatgc attttttttt atttagccat atgcagttct tgtcagatta gattattaag 6120

ctctttatat ctatatataa gagttctgta cttcctgcag aatttgtaca atatcaatgt 6180

tcggaaggtc gtcatgatgg gcctccctcc tgttggctgc gcacctcact ttctctggga 6240

gtacggcagt caagatgggg aatgcatcga ctacatcaat aacgtcgtga ttcagttcaa 6300

ctatgccctg agatacatgt ctagtgaatt catccgccag cacccaggct ctatgatcag 6360

ttactgtgat acttttgagg ggtctgtgga catactgaag aatcgtgacc actacggtga 6420

gcagatgcat cattgttact actgtcagat tgcctttctg tccttaggga agaactcaca 6480

ttacgatgga atcacattgt gcaggttttc tgaccaccac tgatgcctgc tgtgggctgg 6540

ggaagtatgg aggcctgttc atgtgtgttc ttccacagat ggcgtgcagt gacgcgtcga 6600

gccatgtctg gtgggacgag ttccacccca cggatgctgt gaaccgaatc ctggctgata 6660

atgtgtggtc tggtgagcat accaagatgt gctatcctgt ggatttgcag cagatggtaa 6720

aactcaagta g 6731

<210> 48

<211> 1191

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

atggcgctcc ccttcctcct cgccttcgcc ctgctcttcc agctctccgc tcccccgcgc 60

ttctgctccg cggcccccgc ctcctcgccg cccccgtccc cgcccccttc ccctgcggcg 120

gcggcggccc cgcgccgcac gccgctcgtc ccggcgctct tcgtgatcgg cgactccacg 180

gcggacgtcg gcaccaacaa ctacctcggc acgctcgccc gcgccgaccg cgagccgtac 240

ggccgcgact tcgacacccg ccgccccacg gggcgcttct ccaacggccg catccccgtc 300

gactacatcg cagagaagct ggggctccct tttgtgcctc cataccttga acagaacatg 360

cgcatgggcg tcggcagtgt cgacctcagc aacattgatg ggatgataca aggtgtcaac 420

tatgcatccg cggcagccgg cattctctcc agcagtggtt ctgagctggg aatgcatgtg 480

tcgctgagcc agcaggtgca gcaggttgag gacacatatg agcagctctc tctggctctc 540

ggggaggcag caacaactga ccttttcaga aagtccgtgt tctttttgtc aatcgggagc 600

aacgacttca tccactatta cctgcgcaat gtgtctggcg tccagatgcg ttacctccca 660

tgggagttca accagcttct tgtcaatgca atgaggcagg aaatcaagaa tttgtacaat 720

atcaatgttc ggaaggtcgt catgatgggc ctccctcctg ttggctgcgc acctcacttt 780

ctctgggagt acggcagtca agatggggaa tgcatcgact acatcaataa cgtcgtgatt 840

cagttcaact atgccctgag atacatgtct agtgaattca tccgccagca cccaggctct 900

atgatcagtt actgtgatac ttttgagggg tctgtggaca tactgaagaa tcgtgaccac 960

tacggttttc tgaccaccac tgatgcctgc tgtgggctgg ggaagtatgg aggcctgttc 1020

atgtgtgttc ttccacagat ggcgtgcagt gacgcgtcga gccatgtctg gtgggacgag 1080

ttccacccca cggatgctgt gaaccgaatc ctggctgata atgtgtggtc tggtgagcat 1140

accaagatgt gctatcctgt ggatttgcag cagatggtaa aactcaagta g 1191

<210> 49

<211> 396

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 49

Met Ala Leu Pro Phe Leu Leu Ala Phe Ala Leu Leu Phe Gln Leu Ser

1 5 10 15

Ala Pro Pro Arg Phe Cys Ser Ala Ala Pro Ala Ser Ser Pro Pro Pro

20 25 30

Ser Pro Pro Pro Ser Pro Ala Ala Ala Ala Ala Pro Arg Arg Thr Pro

35 40 45

Leu Val Pro Ala Leu Phe Val Ile Gly Asp Ser Thr Ala Asp Val Gly

50 55 60

Thr Asn Asn Tyr Leu Gly Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr

65 70 75 80

Gly Arg Asp Phe Asp Thr Arg Arg Pro Thr Gly Arg Phe Ser Asn Gly

85 90 95

Arg Ile Pro Val Asp Tyr Ile Ala Glu Lys Leu Gly Leu Pro Phe Val

100 105 110

Pro Pro Tyr Leu Glu Gln Asn Met Arg Met Gly Val Gly Ser Val Asp

115 120 125

Leu Ser Asn Ile Asp Gly Met Ile Gln Gly Val Asn Tyr Ala Ser Ala

130 135 140

Ala Ala Gly Ile Leu Ser Ser Ser Gly Ser Glu Leu Gly Met His Val

145 150 155 160

Ser Leu Ser Gln Gln Val Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu

165 170 175

Ser Leu Ala Leu Gly Glu Ala Ala Thr Thr Asp Leu Phe Arg Lys Ser

180 185 190

Val Phe Phe Leu Ser Ile Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu

195 200 205

Arg Asn Val Ser Gly Val Gln Met Arg Tyr Leu Pro Trp Glu Phe Asn

210 215 220

Gln Leu Leu Val Asn Ala Met Arg Gln Glu Ile Lys Asn Leu Tyr Asn

225 230 235 240

Ile Asn Val Arg Lys Val Val Met Met Gly Leu Pro Pro Val Gly Cys

245 250 255

Ala Pro His Phe Leu Trp Glu Tyr Gly Ser Gln Asp Gly Glu Cys Ile

260 265 270

Asp Tyr Ile Asn Asn Val Val Ile Gln Phe Asn Tyr Ala Leu Arg Tyr

275 280 285

Met Ser Ser Glu Phe Ile Arg Gln His Pro Gly Ser Met Ile Ser Tyr

290 295 300

Cys Asp Thr Phe Glu Gly Ser Val Asp Ile Leu Lys Asn Arg Asp His

305 310 315 320

Tyr Gly Phe Leu Thr Thr Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr

325 330 335

Gly Gly Leu Phe Met Cys Val Leu Pro Gln Met Ala Cys Ser Asp Ala

340 345 350

Ser Ser His Val Trp Trp Asp Glu Phe His Pro Thr Asp Ala Val Asn

355 360 365

Arg Ile Leu Ala Asp Asn Val Trp Ser Gly Glu His Thr Lys Met Cys

370 375 380

Tyr Pro Val Asp Leu Gln Gln Met Val Lys Leu Lys

385 390 395

<210> 50

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

tgcgaggtcg gctgcta 17

<210> 51

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

agatcagatg ccccaaattc ata 23

<210> 52

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

catggctgtg gcccctttgc tc 22

<210> 53

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

gtttctttcc tatgcctttt cc 22

<210> 54

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

gagggaaaag gcataggaaa 20

<210> 55

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

aggtatgcaa atcaacaagc 20

<210> 56

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

atactatggc ttttgggatg a 21

<210> 57

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

aatagtggat gaagtcgttg c 21

<210> 58

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

ggcagcaaca actgaccttt tc 22

<210> 59

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

acaagaaagc aacatctcaa gtca 24

<210> 60

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

aatctttggc agagcatg 18

<210> 61

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

ggagtttaag ggttggttc 19

<210> 62

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

gggaagaaac agaggtgcct ttgaacttct ggacatcaag aagaagaagt tgatgagcaa 60

aatagagggg gggggggggg gggagtgtgt gtagctagtg tgtcccaaat acctccaagc 120

<210> 63

<211> 124

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

gggaagaaac agaggtgcct ttgaacttct ggacatcaag aagaagaagt tgatgagcaa 60

aatagagggg gggggggggg gggggggagt gtgtgtagct agtgtgtccc aaatacctcc 120

aagc 124

79页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:编码纤维素酶的基因

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!