突变的肝细胞生长因子基因及其应用
阅读说明:本技术 突变的肝细胞生长因子基因及其应用 (Mutant hepatocyte growth factor gene and application thereof ) 是由 李树民 于 2019-10-12 设计创作,主要内容包括:本申请涉及肝细胞生长因子(Hepatocyte growth factor,HGF)基因的突变的内含子4或其片段。本申请还涉及含有所述突变的内含子4或其片段的编码HGF蛋白的核酸分子,含有所述核酸分子的载体,含有所述核酸分子或载体的宿主细胞。本申请还涉及含有所述核酸分子的药物组合物,以及所述药物组合物的用途。(The present application relates to a mutated intron 4 of the Hepatocyte Growth Factor (HGF) gene or a fragment thereof. The application also relates to a nucleic acid molecule containing the mutated intron 4 or the fragment thereof, which encodes the HGF protein, a vector containing the nucleic acid molecule, and a host cell containing the nucleic acid molecule or the vector. The application also relates to pharmaceutical compositions comprising said nucleic acid molecules, and to uses of said pharmaceutical compositions.)
技术领域
本申请涉及肝细胞生长因子(Hepatocyte growth factor,HGF)基因的突变的内含子4或其片段。本申请还涉及含有所述突变的内含子4或其片段的编码HGF蛋白的核酸分子,含有所述核酸分子的载体,含有所述核酸分子或载体的宿主细胞。本申请还涉及含有所述核酸分子的药物组合物,以及所述药物组合物的用途。
背景技术
肝细胞生长因子(HGF)最初从大鼠血浆和血小板中分离得到,是一种分泌型肝素亲和糖蛋白,又称为扩散因子(Scatter factor,SF)。HGF由***产生,能够与受体c-Met结合并激活该受体的酪氨酸激酶活性,促进肝细胞、上皮细胞、内皮细胞、黑色素细胞、造血细胞等多种类型细胞的生长、迁移和形态发生。HGF在胚肝和胎盘的发育中起重要作用,参与维持和更新肝、肺、肾等器官的细胞,并促进这些器官的再生和损伤后修复。此外,HGF对不同来源的肿瘤细胞具有促侵袭或者生长抑制的作用。
人类HGF基因位于第7号染色体长臂上,长度约为70Kb,由18个外显子和所间隔的17个内含子组成。HGF基因可转录出约6kb的转录本,并以此合成出一个由728个氨基酸组成的前体多肽HGF728。此外,HGF基因还可经历另一种剪切,并合成出由723个氨基酸组成的前体多肽HGF723。无活性的前体多肽经蛋白酶裂解及二硫键连接后,形成具有生物活性的成熟HGF蛋白。
由于HGF蛋白质的体内半衰期很短(HGF抗肾脏纤维化机制的研究进展,国外医学生理病理科学与临床分册,2005年,第25卷第3期),因此,在使用HGF蛋白治疗疾病时,出现了反复给药和用药量过多等问题。为避免此类问题,研究人员开始尝试采用基因治疗的方法,将HGF基因直接应用到临床疾病的治疗中。
目前,临床上已有采用促血管生长因子基因来治疗缺血性疾病的案例,比如VEGF、FGF裸质粒(Theoretical base and investigational plan of the VIFCAD study-genetherapy for refractory coronary artery disease in no-option patients usingtransendocardial bicistronic VEGF/FGF plasmid injection.Post Kardiol Interw;2006,2:116-123)和HGF裸质粒。从已有的报道来看,采用HGF进行基因治疗的血管生成活性比VEGF和bFGF更强,安全性更高。因此,HGF基因在治疗血管缺血性疾病上有更好的应用前景。
另有研究发现,位于HGF基因外显子4和5中间的内含子4在体内起到了控制可变剪切的作用,使HGF基因可同时表达两种天然的HGF异构蛋白,HGF728和HGF723(Hepatocytegrowth factor and its variant with a deletion of five amino acids aredistinguishable in their biological activity and tertiary structure.BiochemBiophys Res Commun.1994 Apr 29;200:808-15)。中国专利ZL03806534.7报道,通过在天然HGF的cDNA的外显子4和5之间***HGF基因组内含子4或其截短的序列,可产生能够同时表达HGF728和HGF723两种蛋白的杂合基因,这两种蛋白可发挥协同效应,对疾病的治疗产生积极的效果。
本领域仍然需要进一步提高HGF基因的表达水平。这至少对于增强使用HGF基因的基因治疗效果是特别有利的。
发明内容
本申请的发明人意外发现,可以对天然肝细胞生长因子基因(例如人HGF基因)的内含子4(例如,SEQ ID NO:1)或其片段进行突变,所产生的经突变的内含子4或其片段能够提高HGF基因的表达水平。
因此,在本申请的第一方面,提供了一种突变的肝细胞生长因子(HGF)基因的内含子4或其片段,其中,所述突变的内含子4在下述位点上包含突变:对应于SEQ ID NO:1的第3815位、第4774位和第4876位的位点;并且,所述片段包含所述突变的内含子4中对应于SEQID NO:1的第1至246位和第3686至4926位的核苷酸片段。在某些优选的实施方案中,所述片段还可以包含,用于连接核苷酸片段的接头序列。
在某些优选的实施方案中,所述片段进一步包含,所述突变的内含子4中对应于SEQ ID NO:1的第2686位至第3685位核苷酸片段。在某些优选的实施方案中,所述片段包含所述突变的内含子4中对应于SEQ ID NO:1的第1至246位和第2686至4926位的核苷酸片段。在某些优选的实施方案中,所述片段还可以包含,用于连接核苷酸片段的接头序列。
在某些优选的实施方案中,所述片段包含或者由下述组成:所述突变的内含子4中对应于SEQ ID NO:1的第1至246位的第一核苷酸片段,所述突变的内含子4中对应于SEQ IDNO:1的第3686至4926位的第二核苷酸片段,以及任选地,位于所述两个核苷酸片段之间的接头序列。在某些优选的实施方案中,所述片段包含或者由下述组成:所述突变的内含子4中对应于SEQ ID NO:1的第1至246位的第一核苷酸片段,和所述突变的内含子4中对应于SEQ ID NO:1的第3686至4926位的第二核苷酸片段,其中,所述第一核苷酸片段的3'端直接连接至所述第二核苷酸片段的5'端。在某些优选的实施方案中,所述片段包含或者由下述组成:所述突变的内含子4中对应于SEQ ID NO:1的第1至246位的第一核苷酸片段,和所述突变的内含子4中对应于SEQ ID NO:1的第3686至4926位的第二核苷酸片段,其中,所述第一核苷酸片段的3'端通过接头序列连接至所述第二核苷酸片段的5'端。可以使用本领域已知的各种接头序列。在某些优选的实施方案中,所述接头序列的长度为1-500个核苷酸,例如1-5个,5-10个,10-20个,20-30个,30-40个,40-50个,50-60个,60-70个,70-80个,80-90个,90-100个,100-200个,200-500个核苷酸。在某些优选的实施方案中,所述接头序列如SEQ ID NO:13所示。
在某些优选的实施方案中,所述片段包含或者由下述组成:所述突变的内含子4中对应于SEQ ID NO:1的第1至246位的第一核苷酸片段,所述突变的内含子4中对应于SEQ IDNO:1的第2686至4926位的第二核苷酸片段,以及任选地,位于所述两个核苷酸片段之间的接头序列。在某些优选的实施方案中,所述片段包含或者由下述组成:所述突变的内含子4中对应于SEQ ID NO:1的第1至246位的第一核苷酸片段,和所述突变的内含子4中对应于SEQ ID NO:1的第2686至4926位的第二核苷酸片段,其中,所述第一核苷酸片段的3'端直接连接至所述第二核苷酸片段的5'端。在某些优选的实施方案中,所述片段包含或者由下述组成:所述突变的内含子4中对应于SEQ ID NO:1的第1至246位的第一核苷酸片段,和所述突变的内含子4中对应于SEQ ID NO:1的第2686至4926位的第二核苷酸片段,其中,所述第一核苷酸片段的3'端通过接头序列连接至所述第二核苷酸片段的5'端。可以使用本领域已知的各种接头序列。在某些优选的实施方案中,所述接头序列的长度为1-500个核苷酸,例如1-5个,5-10个,10-20个,20-30个,30-40个,40-50个,50-60个,60-70个,70-80个,80-90个,90-100个,100-200个,200-500个核苷酸。在某些优选的实施方案中,所述接头序列如SEQ ID NO:13所示。
在某些优选的实施方案中,所述突变的内含子4包含选自下列的突变:在对应于SEQ ID NO:1的第3815位的位置上的核苷酸被突变为腺嘌呤核苷酸;在对应于SEQ ID NO:1的第4774位的位置上的核苷酸被突变为鸟嘌呤核苷酸;在对应于SEQ ID NO:1的第4876位的位置上的核苷酸被突变为鸟嘌呤核苷酸;以及,其任何组合。
在某些优选的实施方案中,所述突变的内含子4包含下述突变:在对应于SEQ IDNO:1的第3815位的位置上的核苷酸被突变为腺嘌呤核苷酸。在某些优选的实施方案中,所述突变的内含子4包含下述突变:在对应于SEQ ID NO:1的第4774位的位置上的核苷酸被突变为鸟嘌呤核苷酸。在某些优选的实施方案中,所述突变的内含子4包含下述突变:在对应于SEQ ID NO:1的第4876位的位置上的核苷酸被突变为鸟嘌呤核苷酸。
在某些优选的实施方案中,所述突变的内含子4包含下述突变:在对应于SEQ IDNO:1的第3815位的位置上的核苷酸被突变为腺嘌呤核苷酸;在对应于SEQ ID NO:1的第4774位的位置上的核苷酸被突变为鸟嘌呤核苷酸;以及,在对应于SEQ ID NO:1的第4876位的位置上的核苷酸被突变为鸟嘌呤核苷酸。
在某些优选的实施方案中,所述肝细胞生长因子为人肝细胞生长因子。在某些优选的实施方案中,所述人肝细胞生长因子具有如SEQ ID NO:12所示的氨基酸序列。在某些优选的实施方案中,所述人肝细胞生长因子基因具有如GenBank数据库登录号:NC_000007.14所示的核苷酸序列。
在某些优选的实施方案中,所述突变的内含子4具有如SEQ ID NO:9所示的核苷酸序列。在某些优选的实施方案中,所述片段具有选自SEQ ID NO:10和SEQ ID NO:11的核苷酸序列。
在本申请的另一方面,提供了一种编码肝细胞生长因子(HGF)的核酸分子,其包含HGF基因的外显子1-18,以及位于外显子4和5之间的根据本申请所述的突变的内含子4或其片段。
在某些优选的实施方案中,所述肝细胞生长因子为人肝细胞生长因子。在某些优选的实施方案中,所述人肝细胞生长因子具有如SEQ ID NO:12所示的氨基酸序列。在某些优选的实施方案中,所述外显子1-18编码如SEQ ID NO:12所示的氨基酸序列。在某些优选的实施方案中,所述人肝细胞生长因子基因具有如GenBank数据库登录号:NC_000007.14所示的核苷酸序列。
在某些优选的实施方案中,所述核酸分子具有选自SEQ ID NO:3,SEQ ID NO:4和SEQ ID NO:5的核苷酸序列。
在本申请的又一方面,提供了一种载体,其包含根据本申请所述的突变的内含子4或其片段。在某些优选的实施方案中,所述载体用于克隆所述突变的内含子4或其片段。
在本申请的又一方面,提供了一种载体,其包含根据本申请所述的核酸分子。在某些优选的实施方案中,所述载体选自质粒;噬菌粒;柯斯质粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体;以及,病毒载体,例如逆转录酶病毒载体(例如慢病毒载体)、腺病毒载体、腺相关病毒载体、疱疹病毒载体(如单纯疱疹病毒载体)、痘病毒载体、杆状病毒载体、***瘤病毒载体、***多瘤空泡病毒载体。
在某些优选的实施方案中,所述载体用于表达(例如在受试者(例如哺乳动物,例如人)体内表达)所述HGF蛋白。在某些优选的实施方案中,所述载体是用于基因治疗的载体,例如质粒,腺病毒载体,腺相关病毒载体,和慢病毒载体。
在某些优选的实施方案中,所述载体具有选自SEQ ID NO:6,SEQ ID NO:7或SEQID NO:8的核苷酸序列。
在本申请的又一方面,提供了一种宿主细胞,其包含根据本申请所述的核酸分子或载体。在某些优选的实施方案中,所述宿主细胞选自原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例如小鼠细胞、人细胞等)。在某些优选的实施方案中,所述宿主细胞是大肠杆菌细胞,例如大肠杆菌DH5α细胞。在某些优选的实施方案中,所述宿主细胞是293T细胞或人细胞。
在本申请的又一方面,提供了一种表达或产生HGF蛋白的方法,所述方法包括,使用根据本申请所述的突变的内含子4或其片段。在某些优选的实施方案中,所述方法包括,使用根据本申请所述的核酸分子或载体。在某些优选的实施方案中,所述方法包括,在允许蛋白表达的条件下,在宿主细胞中表达根据本申请所述的核酸分子或载体;以及任选地,回收宿主细胞中表达的HGF蛋白。
在本申请的又一方面,提供了根据本申请所述的突变的内含子4或其片段用于提高HGF蛋白的表达水平的用途。在某些优选的实施方案中,所述的突变的内含子4或其片段用于在体外提高HGF蛋白的表达水平。在某些优选的实施方案中,所述的突变的内含子4或其片段用于在细胞内提高HGF蛋白的表达水平。在某些优选的实施方案中,所述的突变的内含子4或其片段用于在体外、在细胞内提高HGF蛋白的表达水平。在某些优选的实施方案中,所述的突变的内含子4或其片段用于在体内提高HGF蛋白的表达水平。在某些优选的实施方案中,所述的突变的内含子4或其片段用于在患者(例如哺乳动物,例如人)体内提高HGF蛋白的表达水平。
在本申请的又一方面,提供了根据本申请所述的核酸分子或载体用于表达或产生HGF蛋白的用途。在某些优选的实施方案中,所述的核酸分子或载体用于在体外表达或产生HGF蛋白。在某些优选的实施方案中,所述的核酸分子或载体用于在细胞内表达或产生HGF蛋白。在某些优选的实施方案中,所述的核酸分子或载体用于在体外、在细胞内表达或产生HGF蛋白。在某些优选的实施方案中,所述的核酸分子或载体用于在体内表达或产生HGF蛋白。在某些优选的实施方案中,所述的核酸分子或载体用于在患者(例如哺乳动物,例如人)体内表达或产生HGF蛋白。
在本申请的又一方面,提供了一种药物组合物,其含有根据本申请所述的核酸分子或载体,以及任选地,药学上可接受的载体和/或赋形剂。
本申请所述的药物组合物可通过本领域公知的方法进行施用,例如但不限于通过注射进行施用。在某些优选的实施方案中,本申请所述的药物组合物为注射液或冻干粉剂。
在某些优选的实施方案中,所述核酸分子或载体以治疗有效量(例如治疗缺血性疾病有效量)存在。在某些优选的实施方案中,本申请所述的药物组合物以单位剂量形式存在。
在本申请的又一方面,提供了所述核酸分子或载体在制备药物组合物中的用途,所述药物组合物用于治疗受试者中可受益于天然HGF活性的疾病。在某些优选的实施方案中,所述疾病选自缺血性疾病(例如冠状动脉疾病(CAD)或外周动脉疾病(PAD),例如心肌梗死或下肢动脉缺血),代谢综合征,糖尿病及其并发症(例如糖尿病周围神经病变),再狭窄(例如手术后再狭窄和灌注后再狭窄),以及神经损伤(例如神经退行性疾病(例如肌萎缩性侧索硬化(ALS),帕金森氏病,痴呆病),创伤性神经损伤,周围神经病变(例如糖尿病周围神经病变))。在某些优选的实施方案中,所述受试者为哺乳动物,例如人。在某些优选的实施方案中,所述药物组合物通过注射来进行施用。在某些优选的实施方案中,所述药物组合物为注射液或冻干粉剂。
在本申请的又一方面,提供了一种在受试者中治疗可受益于天然HGF活性的疾病的方法,其包括,给由此需要的受试者施用治疗有效量的根据本申请所述的核酸分子或载体或药物组合物。在某些优选的实施方案中,所述疾病选自缺血性疾病(例如冠状动脉疾病(CAD)或外周动脉疾病(PAD),例如心肌梗死或下肢动脉缺血),代谢综合征,糖尿病及其并发症(例如糖尿病周围神经病变),再狭窄(例如手术后再狭窄和灌注后再狭窄),以及神经损伤(例如神经退行性疾病(例如肌萎缩性侧索硬化(ALS),帕金森氏病,痴呆病),创伤性神经损伤,周围神经病变(例如糖尿病周围神经病变))。在某些优选的实施方案中,所述受试者为哺乳动物,例如人。在某些优选的实施方案中,通过注射,将本申请所述的核酸分子或载体或药物组合物施用给所述受试者。
在本申请中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的细胞培养、分子遗传学、核酸化学、免疫学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本申请,下面提供相关术语的定义和解释。
如本文中所使用的,术语“肝细胞生长因子”或“HGF”或“HGF蛋白”是指天然存在的、具有生物学活性的肝细胞生长因子(hepatocyte growth factor,HGF),它们具有相同的含义,且可互换使用。如本文中所使用的,术语“人肝细胞生长因子”或“hHGF”或“hHGF蛋白”是指天然存在的、具有生物学活性的人肝细胞生长因子,它们具有相同的含义,且可互换使用。可方便地从各种公共数据库(例如,GenBank数据库)获得HGF蛋白或hHGF蛋白的氨基酸序列。例如,天然hHGF蛋白的氨基酸序列可见于GenBank数据库登录号:NP_000592.3。
如本文中所使用的,术语“肝细胞生长因子基因”或“HGF基因”是指,编码肝细胞生长因子的基因;术语“人肝细胞生长因子基因”或“hHGF基因”是指,编码人肝细胞生长因子的基因。通常而言,HGF基因/hHGF基因包含18个外显子和17个内含子。如本领域技术人员所理解的,在真核细胞中,编码结构蛋白的DNA一般被若干非编码性的间插序列(其不会被翻译成氨基酸序列)所间隔;此类非编码性的间插序列即被称为“内含子”,而被“内含子”间隔的每一段编码性的DNA序列(其将会被翻译成氨基酸序列)则称为外显子。因此,HGF基因/hHGF基因按顺序包含外显子1、内含子1、外显子2、内含子2、……、外显子17、内含子17和外显子18。在本申请的实施例中,所使用的hHGF外显子的核酸序列来自GenBank(gi:58533168)。然而,易于理解的是,还可以使用所述外显子序列的简并序列,而不影响或改变所表达的hHGF蛋白的氨基酸序列。因此,在本申请中,HGF基因/hHGF基因的外显子1-18不限于所使用的特定核苷酸序列,且可以是能够编码HGF蛋白/hHGF蛋白的任何核苷酸序列(包括所使用的特定核苷酸序列,以及其简并序列)。在一些优选的实施方案中,hHGF基因的外显子1-18编码具有如SEQ ID NO:12所示的氨基酸序列的hHGF蛋白。在本申请中,术语“内含子4”是指,位于外显子4和5之间的第四个内含子。在某些优选的实施方案中,所述hHGF基因具有如GenBank数据库登录号:NC_000007.14所示的核苷酸序列。在此情况下,可以通过BLAST或者利用hHGF蛋白的氨基酸序列,容易地确定hHGF基因中的外显子1-18和内含子1-17的核苷酸序列。在一些优选的实施方案中,hHGF基因的内含子4具有如SEQ ID NO:1所示的核苷酸序列。
如本文中所使用的,当提及hHGF基因时,参照GenBank数据库登录号:NC_000007.14所示的序列来进行描述;当提及hHGF基因的内含子4时,参照SEQ ID NO:1所示的序列来进行描述。然而,易于理解的是,天然hHGF基因及其内含子4可具有多种版本,它们具有基本上相同的核苷酸序列以及基本上相同的生物学功能,但是彼此之间在核苷酸序列上仍然可以存在微小差异。因此,在本申请中,hHGF基因并不局限于GenBank数据库登录号:NC_000007.14所示的核苷酸序列,并且,其内含子4也不局限于SEQ ID NO:1所示的核苷酸序列。本申请的hHGF基因意欲涵盖所有天然存在的、具有生物学功能的hHGF基因,包括GenBank数据库登录号:NC_000007.14所示的hHGF基因以及其天然存在的变体;并且相应地,其内含子4意欲涵盖所有此类hHGF基因所包含的内含子4,包括SEQ ID NO:1所示的hHGF基因内含子4以及其天然存在的变体。
根据本申请,表述“对应”是指,当对序列进行最优比对时,即当序列进行比对以获得最高百分数同一性时,进行比较的序列中位于等同位置的核苷酸位置或氨基酸位置。例如,表述“对应于SEQ ID NO:1的第3815位的位置”是指,当对某一序列与SEQ ID NO:1进行最优比对时,即当某一序列与SEQ ID NO:1进行比对以获得最高百分数同一性时,进行比较的该序列中位于与SEQ ID NO:1的第3815位等同位置的核苷酸位置。类似地,表述“对应于SEQ ID NO:1的第4774位的位置”和“对应于SEQ ID NO:1的第4876位的位置”也具有类似含义。
如本文中所使用的,术语“核苷酸”意欲包括核糖核苷酸和脱氧核糖核苷酸。例如,腺嘌呤核苷酸意欲包括腺嘌呤核糖核苷酸和腺嘌呤脱氧核糖核苷酸,并且可以根据实际需要进行选择。类似地,鸟嘌呤核苷酸意欲包括鸟嘌呤核糖核苷酸和鸟嘌呤脱氧核糖核苷酸,并且可以根据实际需要进行选择。在某些优选的实施方案中,核苷酸为脱氧核糖核苷酸。在某些优选的实施方案中,核苷酸为核糖核苷酸。在本申请中,所述核苷酸可以是经修饰的(例如,经化学修饰的),也可以是未经修饰的。
如本文中所使用的,术语“核酸”意欲包括核糖核酸,脱氧核糖核酸,及其组合。因此,在本申请中,编码肝细胞生长因子(HGF)的核酸分子可以是RNA,DNA,或者RNA/DNA杂合体。在某些优选的实施方案中,所述核酸分子是RNA。在某些优选的实施方案中,所述核酸分子是DNA。在某些优选的实施方案中,所述核酸分子是RNA/DNA杂合体。在本申请中,所述核酸分子可以是经修饰的(例如,经化学修饰的),也可以是未经修饰的。
如本文中所使用的,术语“载体(vector)”是指,可将多聚核苷酸***其中的一种核酸运载工具。当载体能使***的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;柯斯质粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体及病毒载体等。可用作载体的病毒包括但不限于,逆转录酶病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如单纯疱疹病毒)、痘病毒、杆状病毒、***瘤病毒、***多瘤空泡病毒(如SV40)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。
如本文中所使用的,术语“宿主细胞”是指,可用于扩增或表达外源基因(例如HGF基因)的细胞,其包括但不限于,如大肠杆菌或枯草菌等的原核细胞,如酵母细胞或曲霉菌等的真菌细胞,如S2果蝇细胞或Sf9等的昆虫细胞,或者如纤维原细胞,CHO细胞,COS细胞,NSO细胞,HeLa细胞,BHK细胞,HEK 293细胞,293T细胞或人细胞等的动物细胞。
如本文中所使用的,术语“药学上可接受的”意指,制药领域公认的可用于动物,特别是可用于人的。如本文中所使用的,术语“药学上可接受的载体和/或赋形剂”是指在药理学和/或生理学上与受试者和活性成分相容的载体和/或赋形剂,其是本领域公知的(参见例如Remington's Pharmaceutical Sciences.Edited by Gennaro AR,19thed.Pennsylvania:Mack Publishing Company,1995),并且包括但不限于:pH调节剂(包括但不限于磷酸盐缓冲液),表面活性剂(包括但不限于阳离子,阴离子或者非离子型表面活性剂,例如Tween-80),佐剂,离子强度增强剂(包括但不限于氯化钠),稀释剂,赋形剂,用于容纳或施用治疗剂的介质,以及其任何组合。
如本文中所使用的,药学上可接受的载体可以是无菌液体,诸如水和油,包括源自石油、动物、植物的或合成的油,诸如花生油、大豆油、矿物油、芝麻油等等。当静脉内施用药用组合物时,生理盐水是优选的载体。盐水溶液以及水性右旋糖和甘油溶液也可用作液态载体,特别是用于可注射溶液。
如本文中所使用的,药学上可接受的赋形剂可包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油、滑石、氯化钠、奶粉、甘油、丙烯、乙二醇、水、乙醇等等。如果需要,药物组合物还可以包含润湿剂,或乳化剂例如透明质酸钠,或pH缓冲剂。药物组合物可以采取溶液、悬浮液、乳状液、片剂、丸剂、胶囊、粉剂、缓释配方等形式。
如本文中所使用的,术语“受试者”是指哺乳动物,包括但不限于,人,啮齿类动物(小鼠,大鼠,豚鼠),狗,马,牛,猫,猪,猴,黑猩猩等。优选地,受试者是人。
如本文中所使用的,术语“有效量”是指足以获得或至少部分获得期望的效果的量。例如,预防疾病有效量是指,足以预防,阻止,或延迟疾病的发生的量;治疗疾病有效量是指,足以治愈或至少部分阻止已患有疾病的患者的疾病和其并发症的量。测定这样的有效量完全在本领域技术人员的能力范围之内。例如,对于治疗用途有效的量将取决于待治疗的疾病的严重度、患者自己的免疫系统的总体状态、患者的一般情况例如年龄,体重和性别,药物的施用方式,以及同时施用的其他治疗等等。
发明的有益效果
如之前所报道的,可使用HGF基因来进行基因治疗。在基因治疗过程中,在体内用质粒表达的HGF蛋白可具有多种生物学活性,包括但不限于以下的一种或多种活性:(1)促进内皮细胞生长和/或迁移;(2)促进血管(例如微小血管)发生;和/或,(3)促进神经损伤(例如周围神经病变,例如糖尿病周围神经病变)修复。因此,HGF基因治疗可在多个方面具有应用前景,包括但不限于:(1)促进内皮细胞生长和/或迁移;(2)促进血管(例如微小血管)发生;(3)治疗缺血性疾病,例如冠状动脉疾病(CAD)或外周动脉疾病(PAD),例如下肢动脉缺血;(4)治疗代谢综合征和糖尿病及其并发症(例如,糖尿病周围神经病变);(5)抑制再狭窄;和(6)促进神经损伤(例如,神经退行性疾病,创伤性神经损伤,周围神经病变)修复。
本申请的核酸分子和载体能够在细胞内以显著更高的水平表达HGF蛋白,因此,特别适合用于基因治疗,用于上述多个方面的应用场景中。
序列信息
本发明涉及的序列的信息提供于下面的表1中。
表1:SEQ ID NO:1-13的序列信息
下面将结合实施例对本申请的实施方案进行详细描述,但是本领域技术人员将理解,下列实施例仅用于说明本申请,而不是对本申请的范围的限定。根据优选实施方案的下列详细描述,本申请的各种目的和有利方面对于本领域技术人员来说将变得显然。
具体实施方式
现参照下列意在举例说明本申请(而非限定本申请)的实施例来描述本申请。
除非特别指明,本申请中所使用的分子生物学实验方法和免疫检测法,基本上参照J.Sambrook等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,John Wiley&Sons,Inc.,1995中所述的方法进行;限制性内切酶的使用依照产品制造商推荐的条件。本领域技术人员知晓,实施例以举例方式描述本申请,且不意欲限制本申请所要求保护的范围。
实施例1:重组质粒的构建和制备
1.目的基因的获得
根据GenBank(NG_016274.2)的记载,获取hHGF基因的内含子4(YJG0)的序列(参见SEQ ID NO:1)。根据GenBank(gi:58533168)的记载,获取hHGF基因的外显子1-18的序列。应理解,此处外显子1-18的序列是示例性的,且可以使用不改变所编码的氨基酸序列的其他简并序列形式。
随后,按照外显子1-4、完整天然内含子4、外显子5-18的顺序,合成了含有完整天然内含子4的、编码HGF蛋白的参照核酸1(HGF-YJG0,其序列如SEQ ID NO:2所示)。
进一步,将所述参照核酸1中的内含子4的第3815位碱基由脱氧鸟嘌呤G突变为脱氧腺嘌呤A(G→A),第4774位碱基由脱氧腺嘌呤A突变为脱氧鸟嘌呤G(A→G),第4876位碱基由脱氧腺嘌呤A突变为脱氧鸟嘌呤G(A→G)(以SEQ ID NO:1的序列位置为基准),从而得到包含外显子1-4、突变的内含子4、外显子5-18的核酸突变体1(HGF-MUT0,其序列如SEQ IDNO:3所示),其中,突变的内含子4(MUT0)的序列如SEQ ID NO:9所示。
此外,之前已报道,完整内含子4不是实现其功能所必须的;内含子4的截短序列也可以实现与完整内含子4类似的功能(参见例如中国专利ZL03806534.7)。因此,发明人还设计了2种天然内含子4的片段以及2种含有上述3个点突变的内含子4的片段:
YJG1,其由SEQ ID NO:1的第1-246位核苷酸、如SEQ ID NO:13所示的接头(GATCC)和SEQ ID NO:1的第3686-4926位核苷酸组成;
YJG2,其由SEQ ID NO:1的第1-246位核苷酸、如SEQ ID NO:13所示的接头(GATCC)和SEQ ID NO:1的第2686-4926位核苷酸组成;
MUT1(其序列如SEQ ID NO:10所示),其由SEQ ID NO:1的第1-246位核苷酸、如SEQID NO:13所示的接头(GATCC)和SEQ ID NO:1的第3686-4926位核苷酸组成,且含有上述3个点突变;
MUT2(其序列如SEQ ID NO:11所示),其由SEQ ID NO:1的第1-246位核苷酸、如SEQID NO:13所示的接头(GATCC)和SEQ ID NO:1的第2686-4926位核苷酸组成,且含有上述3个点突变。
在此基础上,合成了下述核酸分子:
包含外显子1-4、YJG1、外显子5-18的参照核酸2(HGF-YJG1);
包含外显子1-4、YJG2、外显子5-18的参照核酸3(HGF-YJG2);
包含外显子1-4、MUT1、外显子5-18的核酸突变体2(HGF-MUT1,其序列如SEQ IDNO:4所示);以及
包含外显子1-4、MUT2、外显子5-18的核酸突变体3(HGF-MUT2,其序列如SEQ IDNO:5所示)。
2.重组质粒的构建
通过限制性内切酶的酶切和连接酶的连接,将合成的参照核酸1克隆入pYJC载体(自行构建,含有CMV启动子、卡那霉素抗性基因、大肠杆菌复制起点),从而构建得到重组质粒pYJC-HGF-YJG0。将重组质粒pYJC-HGF-YJG0转化到大肠杆菌菌株DH5α(购自Invitrogen)中。将经转化的细菌涂板培养,然后挑取单克隆菌落,提取质粒并进行测序。经测序验证,获得含有参照核酸1的核苷酸序列的目的重组质粒。通过类似的方法,构建获得分别含有参照核酸2-3和核酸突变体1-3的另外5种重组质粒。
表2:6种重组质粒的表征
3.重组质粒的制备
用氯化钙法制备E.coli DH5α感受态细胞,然后用所构建的重组质粒进行转化,并进行扩大培养,直至OD600达到60以上。培养后,离心收集菌体,并提取质粒,获得含有重组质粒的原液。
实施例2:重组质粒的检测
1.质粒含量的测定
使用紫外分光光度计,测定所制备的各种原液中的质粒含量。测量结果如表3所示。结果显示,在所制备的各种含有重组质粒的原液中,质粒的含量均在2.0-2.2mg/mL范围内。
表3:重组质粒含量的测定
2.超螺旋比例的测定
取含有重组质粒的原液样品,用注射用水稀释至至质粒浓度为约0.1mg/ml。取稀释后的样品10μl,与10μl 2×上样缓冲液混合,并分别点样于1.0%琼脂糖凝胶的加样孔中。另外,取分子量标准6μl,用作对照。在70V恒压下进行电泳。电泳结束后,将凝胶放入凝胶成像仪中观察并拍照,计算重组质粒的超螺旋比例。测定结果如表4所示。结果显示,在所制备的各种原液样品中,重组质粒的超螺旋比例均大于90.0%。
表4:HGF质粒超螺旋比例测定结果
3.纯度检查
取含有重组质粒的原液样品,用注射用水稀释至质粒浓度约为30μg/ml,然后用HPLC检测纯度,所使用的检测条件如下:
所使用的色谱柱为阴离子交换HPLC分析柱DNA-NPR,其用20mM Tris-HCl,0.5MNaCl,pH8.8缓冲液进行平衡。平衡后,加载样品,进行检测。上样量为100μl,流速为0.5ml/min,检测波长为260nm。上样后,用20mM Tris-HCl,0.5M NaCl,pH8.8缓冲液进行平衡(5min),然后进行线性梯度洗脱,条件如下:(1)由100%A溶液(A溶液为20mM Tris-HCl,0.5M NaCl,pH8.8)线性过渡至100%B溶液(B溶液为20mM Tris-HCl,0.8M NaCl),洗脱30min;(2)然后用20mM Tris-HCl,0.8M NaCl,pH8.8缓冲液洗脱5min。检测结果如表5所示。结果显示,在所制备的各种原液样品中,质粒的HPLC纯度均大于95.0%。
表5:HGF质粒纯度的测定结果
实施例3.HGF蛋白表达量的检测
1.准备工作:
取待转染的293T细胞(购自ATCC),接种于24孔细胞培养板(500μl/孔),然后置于37℃、5%CO2的培养箱中过夜培养,直至细胞汇合率为90~95%。
2.质粒转染:
对于每孔细胞,使用100μl DMEM基础培养基稀释4μl Lipofectamine 2000;并且,使用100μl DMEM基础培养基稀释质粒。室温孵育5min后,将稀释后的质粒和稀释后的Lipofectamine 2000轻轻混匀,并在室温保温20min。实验组细胞用培养基+质粒+转染试剂(100μl/孔)进行转染。阴性对照组细胞用培养基+转染试剂(100μl/孔)进行转染。转染后,将细胞放入37℃、5%CO2的培养箱中培养48h,然后收集培养上清。
采用HGF检测试剂盒(R&D,货号DHG00B),对培养上清中的HGF蛋白进行定量检测。测定结果如表3所示。从表3中可以看出,在使用突变的内含子4或其片段的情况下,HGF蛋白表达量显著提高(与使用未突变的内含子4或其片段的情况相比,HGF蛋白表达量提高至2.98-4.17倍)。
表6:HGF蛋白的定量检测
尽管本申请的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公开的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本申请的保护范围之内。本申请的全部范围由所附权利要求及其任何等同物给出。
序列表
<110> 北京万福来生物技术有限责任公司
<120> 突变的肝细胞生长因子基因及其应用
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 4926
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
gtaagaacag tatgaagaaa agagatgaag cctctgtctt ttttacatgt taacagtctc 60
atattagtcc ttcagaataa ttctacaatc ctaaaataac ttagccaact tgctgaattg 120
tattacggca aggtttatat gaattcatga ctgatattta gcaaatgatt aattaatatg 180
ttaataaaat gtagccaaaa caatatctta ccttaatgcc tcaatttgta gatctcggta 240
tttgtgaaat aataacgtaa acttcgttta aaaggattct tcttcctgtc tttgagaaag 300
tacggcactg tgcaggggga gaggttgatt gtgaaaaatc agaggtagat gagaatctta 360
ctgagggctg agggttcttt aaccttggtg gatctcaaca ttggttgcac attaaaatca 420
cctgctgcaa gcccttgacg aatcttactt agaagatgac aacacagaac aattaaatca 480
gaatctctgg ggagaatagg gcaccagtat tttttgagct cccaccatga ttccaaagtg 540
cagccaaatt tgagaaccac tgctaaaagc tcaagcttca gattgaccag cttttccatc 600
tcacctatcg cctaaagacc aaattggata aatgtgttca ttacgacaga tgggtactat 660
ttaaagatga gtaaacacaa tatacttagg ctcgtcagac tgagagtttt aatcatcact 720
gaggaaaaac atagatatct aatactgact ggagtattag tcaaggctta tttcacacac 780
aattttatca gaaaccaaag tagtttaaaa cagctctccc cttattagta atgcattgga 840
gggtttactt taccatgtac cttgctgagc actgtacctt gttaatctca tttacttgta 900
atgagaacca cacagcgggt agttttattg gttctatttt acctacatga caaaactgaa 960
gcataaaaac acttagtaag ttttcagtgt catgcacaac taggaagtga catggccaga 1020
atataagccc agtcaccatc actctataac ctgcgctttt aacaacttca gggcatgaca 1080
catttggccg gtcagtagaa cccatgctgt gatttgtttt tgcagtggtg gtgatgactg 1140
ccttgttgaa tccacttttt attctattcc attttgggga cacaattctg caagatgatt 1200
cttcattagg aaacagagat gagttattga ccaacacaga aagaaaaaga gtttgttgct 1260
ccacactggg attaaaccta tgatcttggc ctaattaaca ctagctagta agtgtccaag 1320
ctgatcatct ctacaacatt tcaataacag aaaacaacaa ttttcaaaat tagttactta 1380
caattatgta gaaatgcctc taaaacacag tattttcctt atattacaaa aacaaaaatt 1440
ataattggtt ttgtcctctt ttgagagttt gcatggtgtt actccctgca tagtgaagaa 1500
aacattttat ttaagtagat ggatctaagt ttttcatgaa caaaggaatg acatttgaaa 1560
tcaatcctac cctagtccag gagaatgcat tagattaacc tagtagaggt cttatttcac 1620
cctgagtttt ctatgatcgt gattctctgc tggaggagta attgtgaaat agatctctct 1680
gggaactggc ttcctagtcc aatcagctct tttaccaatg aacacttcct tgtgatatag 1740
atgtttatgg ccgagaggat ccagtatatt aataaaatcc ctttttgtat tcaatgaggg 1800
aaacacataa ttttcatcaa ttagcagctt attggaatat ctgcatgatg gtttaacact 1860
tttaagtgtt gactaaagat taattttaca gaaaatagaa aaagaaatat gtttctgtct 1920
ggaggaatga tttattgttg acccctaaat tgaaatattt tactagtggc ttaatggaaa 1980
gatgatgaaa gatgatgaaa ttaatgtaga agcttaacta gaaaatcagg tgacctgata 2040
tctacatctg tatccttcat tggccaccca gcattcatta atgaatcaga tgatggaata 2100
gatcaagttt cctaggaaca cagtgaatat taaaagaaaa caaagggagc ctagcaccta 2160
gaagacctag tttatatttc aaagtatatt tggatgtaac ccaattttaa acatttcctc 2220
acttgtctct cttaaagcct tgccaacagc aaggacagag aaccaaaaat agtgtatata 2280
tgaataaatg cttattacag aatctgctga ctggcacatg ctttgtgtgt aatgggttct 2340
cataaacact tgttgaatga acacacataa gtgaaagagc atggctaggc ttcatccctt 2400
ggtcaaatat ggggtgctaa agaaaagcag gggaaataca ttgggacact aacaaaaaaa 2460
aacagttaat ttaggtaaaa gataaaatac accacagaat gaagaaaaga gatgacccag 2520
actgctcttt aaccttcatg tcctagagag gtttttgata tgaattgcat tcagaattgt 2580
ggaaaggagc ccatcttttc tcttcatttt gattttatta actccaatgg gggaatttta 2640
ttcgtgtttt ggccatatct acttttgatt tctacattat tctctcttcc tttctacctg 2700
tatttgtcct aataaattgt tgacttatta attcactact tcctcacagc ttttttttgg 2760
ctttacaaat ccactggaaa ggtatatggg tgtatcactt tgtgtatttc ggtgtgcatg 2820
tgtagagggg acaaaaatcc tctctcaaac tataaatatt gagtatttgt gtattgaaca 2880
tttgctataa ctactaggtt tcttaaataa tcttaatata taaaatgata tagaaaaagg 2940
gaaattatag ttcgtattat tcatctaagt gaagagatta aaacccaggg agtaaataaa 3000
ttgtctaagg actaaggttg tatactattt aggtgataga tatggggcaa ccgtatgggt 3060
tttatgatta acaaataaac ttctcaccac tctaccatat caacttttcc ataaaagaga 3120
gctatagtat tctttgctta aataaatttg attagtgcat gacttcttga aaacatataa 3180
agcaaaagtc acatttgatt ctatcagaaa agtgagtaag ccatggccca aacaaaagat 3240
gcattaaaat attctggaat gatggagcta aaagtaagaa aaatgacttt ttaaaaaagt 3300
ttactgttag gaattgtgaa attatgctga attttagttg cattataatt tttgtcagtc 3360
atacggtctg acaacctgtc ttatttctat ttccccatat gaggaatgct agttaagtat 3420
ggatattaac tattactact tagatgcatt gaagttgcat aatatggata atacttcact 3480
ggttccctga aaatgtttag ttagtaataa gtctcttaca ctatttgttt tgtccaataa 3540
tttatatttt ctgaagactt aactctagaa tacactcatg tcaaaatgaa agaatttcat 3600
tgcaaaatat tgcttggtac atgacgcata cctgtatttg ttttgtgtca caacatgaaa 3660
aatgatggtt tattagaagt ttcattgggt aggaaacaca tttgaatggt atttactaag 3720
atactaaaat ccttggactt cactctaatt ttagtgccat ttagaactca aggtctcagt 3780
aaaagtagaa ataaagcctg ttaacaaaac acaagctgaa tattaaaaat gtaactggat 3840
tttcaaagaa atgtttactg gtattacctg tagatgtata ttctttatta tgatcttttg 3900
tgtaaagtct ggcagacaaa tgcaatatct aattgttgag tccaatatca caagcagtac 3960
aaaagtataa aaaagacttg gccttttcta atgtgttaaa atactttatg ctggtaataa 4020
cactaagagt agggcactag aaattttaag tgaagataat gtgttgcagt tactgcactc 4080
aatggcttac tattataaac caaaactggg atcactaagc tccagtcagt caaaatgatc 4140
aaaattattg aagagaataa gcaattctgt tctttattag gacacagtag atacagacta 4200
caaagtggag tgtgcttaat aagaggtagc atttgttaag tgtcaattac tctattatcc 4260
cttggagctt ctcaaaataa ccatataagg tgtaagatgt taaaggttat ggttacactc 4320
agtgcacagg taagctaata ggctgagaga agctaaatta cttactgggg tctcacagta 4380
agaaagtgag ctgaagtttc agcccagatt taactggatt ctgggctctt tattcatgtt 4440
acttcatgaa tctgtttctc aattgtgcag aaaaaagggg gctatttata agaaaagcaa 4500
taaacaaaca agtaatgatc tcaaataagt aatgcaagaa atagtgagat ttcaaaatca 4560
gtggcagcga tttctcagtt ctgtcctaag tggccttgct caatcacctg ctatctttta 4620
gtggagcttt gaaattatgt ttcagacaac ttcgattcag ttctagaatg tttgactcag 4680
caaattcaca ggctcatctt tctaacttga tggtgaatat ggaaattcag ctaaatggat 4740
gttaataaaa ttcaaacgtt ttaaggacag atgaaaatga cagaatttta aggtaaaata 4800
tatgaaggaa tataagataa aggatttttc taccttcagc aaaaacatac ccactaatta 4860
gtaaaattaa taggcaaaaa aaagttgcat gctcttatac tgtaatgatt atcattttaa 4920
aactag 4926
<210> 2
<211> 7113
<212> DNA
<213> 智人(Homo sapiens)
<400> 2
atgtgggtga ccaaactcct gccagccctg ctgctgcagc atgtcctcct gcatctcctc 60
ctgctcccca tcgccatccc ctatgcagag ggacaaagga aaagaagaaa tacaattcat 120
gaattcaaaa aatcagcaaa gactacccta atcaaaatag atccagcact gaagataaaa 180
accaaaaaag tgaatactgc agaccaatgt gctaatagat gtactaggaa taaaggactt 240
ccattcactt gcaaggcttt tgtttttgat aaagcaagaa aacaatgcct ctggttcccc 300
ttcaatagca tgtcaagtgg agtgaaaaaa gaatttggcc atgaatttga cctctatgaa 360
aacaaagact acattagaaa ctgcatcatt ggtaaaggac gcagctacaa gggaacagta 420
tctatcacta agagtggcat caaatgtcag ccctggagtt ccatgatacc acacgaacac 480
aggtaagaac agtatgaaga aaagagatga agcctctgtc ttttttacat gttaacagtc 540
tcatattagt ccttcagaat aattctacaa tcctaaaata acttagccaa cttgctgaat 600
tgtattacgg caaggtttat atgaattcat gactgatatt tagcaaatga ttaattaata 660
tgttaataaa atgtagccaa aacaatatct taccttaatg cctcaatttg tagatctcgg 720
tatttgtgaa ataataacgt aaacttcgtt taaaaggatt cttcttcctg tctttgagaa 780
agtacggcac tgtgcagggg gagaggttga ttgtgaaaaa tcagaggtag atgagaatct 840
tactgagggc tgagggttct ttaaccttgg tggatctcaa cattggttgc acattaaaat 900
cacctgctgc aagcccttga cgaatcttac ttagaagatg acaacacaga acaattaaat 960
cagaatctct ggggagaata gggcaccagt attttttgag ctcccaccat gattccaaag 1020
tgcagccaaa tttgagaacc actgctaaaa gctcaagctt cagattgacc agcttttcca 1080
tctcacctat cgcctaaaga ccaaattgga taaatgtgtt cattacgaca gatgggtact 1140
atttaaagat gagtaaacac aatatactta ggctcgtcag actgagagtt ttaatcatca 1200
ctgaggaaaa acatagatat ctaatactga ctggagtatt agtcaaggct tatttcacac 1260
acaattttat cagaaaccaa agtagtttaa aacagctctc cccttattag taatgcattg 1320
gagggtttac tttaccatgt accttgctga gcactgtacc ttgttaatct catttacttg 1380
taatgagaac cacacagcgg gtagttttat tggttctatt ttacctacat gacaaaactg 1440
aagcataaaa acacttagta agttttcagt gtcatgcaca actaggaagt gacatggcca 1500
gaatataagc ccagtcacca tcactctata acctgcgctt ttaacaactt cagggcatga 1560
cacatttggc cggtcagtag aacccatgct gtgatttgtt tttgcagtgg tggtgatgac 1620
tgccttgttg aatccacttt ttattctatt ccattttggg gacacaattc tgcaagatga 1680
ttcttcatta ggaaacagag atgagttatt gaccaacaca gaaagaaaaa gagtttgttg 1740
ctccacactg ggattaaacc tatgatcttg gcctaattaa cactagctag taagtgtcca 1800
agctgatcat ctctacaaca tttcaataac agaaaacaac aattttcaaa attagttact 1860
tacaattatg tagaaatgcc tctaaaacac agtattttcc ttatattaca aaaacaaaaa 1920
ttataattgg ttttgtcctc ttttgagagt ttgcatggtg ttactccctg catagtgaag 1980
aaaacatttt atttaagtag atggatctaa gtttttcatg aacaaaggaa tgacatttga 2040
aatcaatcct accctagtcc aggagaatgc attagattaa cctagtagag gtcttatttc 2100
accctgagtt ttctatgatc gtgattctct gctggaggag taattgtgaa atagatctct 2160
ctgggaactg gcttcctagt ccaatcagct cttttaccaa tgaacacttc cttgtgatat 2220
agatgtttat ggccgagagg atccagtata ttaataaaat ccctttttgt attcaatgag 2280
ggaaacacat aattttcatc aattagcagc ttattggaat atctgcatga tggtttaaca 2340
cttttaagtg ttgactaaag attaatttta cagaaaatag aaaaagaaat atgtttctgt 2400
ctggaggaat gatttattgt tgacccctaa attgaaatat tttactagtg gcttaatgga 2460
aagatgatga aagatgatga aattaatgta gaagcttaac tagaaaatca ggtgacctga 2520
tatctacatc tgtatccttc attggccacc cagcattcat taatgaatca gatgatggaa 2580
tagatcaagt ttcctaggaa cacagtgaat attaaaagaa aacaaaggga gcctagcacc 2640
tagaagacct agtttatatt tcaaagtata tttggatgta acccaatttt aaacatttcc 2700
tcacttgtct ctcttaaagc cttgccaaca gcaaggacag agaaccaaaa atagtgtata 2760
tatgaataaa tgcttattac agaatctgct gactggcaca tgctttgtgt gtaatgggtt 2820
ctcataaaca cttgttgaat gaacacacat aagtgaaaga gcatggctag gcttcatccc 2880
ttggtcaaat atggggtgct aaagaaaagc aggggaaata cattgggaca ctaacaaaaa 2940
aaaacagtta atttaggtaa aagataaaat acaccacaga atgaagaaaa gagatgaccc 3000
agactgctct ttaaccttca tgtcctagag aggtttttga tatgaattgc attcagaatt 3060
gtggaaagga gcccatcttt tctcttcatt ttgattttat taactccaat gggggaattt 3120
tattcgtgtt ttggccatat ctacttttga tttctacatt attctctctt cctttctacc 3180
tgtatttgtc ctaataaatt gttgacttat taattcacta cttcctcaca gctttttttt 3240
ggctttacaa atccactgga aaggtatatg ggtgtatcac tttgtgtatt tcggtgtgca 3300
tgtgtagagg ggacaaaaat cctctctcaa actataaata ttgagtattt gtgtattgaa 3360
catttgctat aactactagg tttcttaaat aatcttaata tataaaatga tatagaaaaa 3420
gggaaattat agttcgtatt attcatctaa gtgaagagat taaaacccag ggagtaaata 3480
aattgtctaa ggactaaggt tgtatactat ttaggtgata gatatggggc aaccgtatgg 3540
gttttatgat taacaaataa acttctcacc actctaccat atcaactttt ccataaaaga 3600
gagctatagt attctttgct taaataaatt tgattagtgc atgacttctt gaaaacatat 3660
aaagcaaaag tcacatttga ttctatcaga aaagtgagta agccatggcc caaacaaaag 3720
atgcattaaa atattctgga atgatggagc taaaagtaag aaaaatgact ttttaaaaaa 3780
gtttactgtt aggaattgtg aaattatgct gaattttagt tgcattataa tttttgtcag 3840
tcatacggtc tgacaacctg tcttatttct atttccccat atgaggaatg ctagttaagt 3900
atggatatta actattacta cttagatgca ttgaagttgc ataatatgga taatacttca 3960
ctggttccct gaaaatgttt agttagtaat aagtctctta cactatttgt tttgtccaat 4020
aatttatatt ttctgaagac ttaactctag aatacactca tgtcaaaatg aaagaatttc 4080
attgcaaaat attgcttggt acatgacgca tacctgtatt tgttttgtgt cacaacatga 4140
aaaatgatgg tttattagaa gtttcattgg gtaggaaaca catttgaatg gtatttacta 4200
agatactaaa atccttggac ttcactctaa ttttagtgcc atttagaact caaggtctca 4260
gtaaaagtag aaataaagcc tgttaacaaa acacaagctg aatattaaaa atgtaactgg 4320
attttcaaag aaatgtttac tggtattacc tgtagatgta tattctttat tatgatcttt 4380
tgtgtaaagt ctggcagaca aatgcaatat ctaattgttg agtccaatat cacaagcagt 4440
acaaaagtat aaaaaagact tggccttttc taatgtgtta aaatacttta tgctggtaat 4500
aacactaaga gtagggcact agaaatttta agtgaagata atgtgttgca gttactgcac 4560
tcaatggctt actattataa accaaaactg ggatcactaa gctccagtca gtcaaaatga 4620
tcaaaattat tgaagagaat aagcaattct gttctttatt aggacacagt agatacagac 4680
tacaaagtgg agtgtgctta ataagaggta gcatttgtta agtgtcaatt actctattat 4740
cccttggagc ttctcaaaat aaccatataa ggtgtaagat gttaaaggtt atggttacac 4800
tcagtgcaca ggtaagctaa taggctgaga gaagctaaat tacttactgg ggtctcacag 4860
taagaaagtg agctgaagtt tcagcccaga tttaactgga ttctgggctc tttattcatg 4920
ttacttcatg aatctgtttc tcaattgtgc agaaaaaagg gggctattta taagaaaagc 4980
aataaacaaa caagtaatga tctcaaataa gtaatgcaag aaatagtgag atttcaaaat 5040
cagtggcagc gatttctcag ttctgtccta agtggccttg ctcaatcacc tgctatcttt 5100
tagtggagct ttgaaattat gtttcagaca acttcgattc agttctagaa tgtttgactc 5160
agcaaattca caggctcatc tttctaactt gatggtgaat atggaaattc agctaaatgg 5220
atgttaataa aattcaaacg ttttaaggac agatgaaaat gacagaattt taaggtaaaa 5280
tatatgaagg aatataagat aaaggatttt tctaccttca gcaaaaacat acccactaat 5340
tagtaaaatt aataggcaaa aaaaagttgc atgctcttat actgtaatga ttatcatttt 5400
aaaactagct ttttgccttc gagctatcgg ggtaaagacc tacaggaaaa ctactgtcga 5460
aatcctcgag gggaagaagg gggaccctgg tgtttcacaa gcaatccaga ggtacgctac 5520
gaagtctgtg acattcctca gtgttcagaa gttgaatgca tgacctgcaa tggggagagt 5580
tatcgaggtc tcatggatca tacagaatca ggcaagattt gtcagcgctg ggatcatcag 5640
acaccacacc ggcacaaatt cttgcctgaa agatatcccg acaagggctt tgatgataat 5700
tattgccgca atcccgatgg ccagccgagg ccatggtgct atactcttga ccctcacacc 5760
cgctgggagt actgtgcaat taaaacatgc gctgacaata ctatgaatga cactgatgtt 5820
cctttggaaa caactgaatg catccaaggt caaggagaag gctacagggg cactgtcaat 5880
accatttgga atggaattcc atgtcagcgt tgggattctc agtatcctca cgagcatgac 5940
atgactcctg aaaatttcaa gtgcaaggac ctacgagaaa attactgccg aaatccagat 6000
gggtctgaat caccctggtg ttttaccact gatccaaaca tccgagttgg ctactgctcc 6060
caaattccaa actgtgatat gtcacatgga caagattgtt atcgtgggaa tggcaaaaat 6120
tatatgggca acttatccca aacaagatct ggactaacat gttcaatgtg ggacaagaac 6180
atggaagact tacatcgtca tatcttctgg gaaccagatg caagtaagct gaatgagaat 6240
tactgccgaa atccagatga tgatgctcat ggaccctggt gctacacggg aaatccactc 6300
attccttggg attattgccc tatttctcgt tgtgaaggtg ataccacacc tacaatagtc 6360
aatttagacc atcccgtaat atcttgtgcc aaaacgaaac aattgcgagt tgtaaatggg 6420
attccaacac gaacaaacat aggatggatg gttagtttga gatacagaaa taaacatatc 6480
tgcggaggat cattgataaa ggagagttgg gttcttactg cacgacagtg tttcccttct 6540
cgagacttga aagattatga agcttggctt ggaattcatg atgtccacgg aagaggagat 6600
gagaaatgca aacaggttct caatgtttcc cagctggtat atggccctga aggatcagat 6660
ctggttttaa tgaagcttgc caggcctgct gtcctggatg attttgttag tacgattgat 6720
ttacctaatt atggatgcac aattcctgaa aagaccagtt gcagtgttta tggctggggc 6780
tacactggat tgatcaacta tgatggccta ttacgagtgg cacatctcta tataatggga 6840
aatgagaaat gcagccagca tcatcgaggg aaggtgactc tgaatgagtc tgaaatatgt 6900
gctggggctg aaaagattgg atcaggacca tgtgaggggg attatggtgg cccacttgtt 6960
tgtgagcaac ataaaatgag aatggttctt ggtgtcattg ttcctggtcg tggatgtgcc 7020
attccaaatc gtcctggtat ttttgtccga gtagcatatt atgcaaaatg gatacacaaa 7080
attattttaa catataaggt accacagtca tag 7113
<210> 3
<211> 7113
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atgtgggtga ccaaactcct gccagccctg ctgctgcagc atgtcctcct gcatctcctc 60
ctgctcccca tcgccatccc ctatgcagag ggacaaagga aaagaagaaa tacaattcat 120
gaattcaaaa aatcagcaaa gactacccta atcaaaatag atccagcact gaagataaaa 180
accaaaaaag tgaatactgc agaccaatgt gctaatagat gtactaggaa taaaggactt 240
ccattcactt gcaaggcttt tgtttttgat aaagcaagaa aacaatgcct ctggttcccc 300
ttcaatagca tgtcaagtgg agtgaaaaaa gaatttggcc atgaatttga cctctatgaa 360
aacaaagact acattagaaa ctgcatcatt ggtaaaggac gcagctacaa gggaacagta 420
tctatcacta agagtggcat caaatgtcag ccctggagtt ccatgatacc acacgaacac 480
aggtaagaac agtatgaaga aaagagatga agcctctgtc ttttttacat gttaacagtc 540
tcatattagt ccttcagaat aattctacaa tcctaaaata acttagccaa cttgctgaat 600
tgtattacgg caaggtttat atgaattcat gactgatatt tagcaaatga ttaattaata 660
tgttaataaa atgtagccaa aacaatatct taccttaatg cctcaatttg tagatctcgg 720
tatttgtgaa ataataacgt aaacttcgtt taaaaggatt cttcttcctg tctttgagaa 780
agtacggcac tgtgcagggg gagaggttga ttgtgaaaaa tcagaggtag atgagaatct 840
tactgagggc tgagggttct ttaaccttgg tggatctcaa cattggttgc acattaaaat 900
cacctgctgc aagcccttga cgaatcttac ttagaagatg acaacacaga acaattaaat 960
cagaatctct ggggagaata gggcaccagt attttttgag ctcccaccat gattccaaag 1020
tgcagccaaa tttgagaacc actgctaaaa gctcaagctt cagattgacc agcttttcca 1080
tctcacctat cgcctaaaga ccaaattgga taaatgtgtt cattacgaca gatgggtact 1140
atttaaagat gagtaaacac aatatactta ggctcgtcag actgagagtt ttaatcatca 1200
ctgaggaaaa acatagatat ctaatactga ctggagtatt agtcaaggct tatttcacac 1260
acaattttat cagaaaccaa agtagtttaa aacagctctc cccttattag taatgcattg 1320
gagggtttac tttaccatgt accttgctga gcactgtacc ttgttaatct catttacttg 1380
taatgagaac cacacagcgg gtagttttat tggttctatt ttacctacat gacaaaactg 1440
aagcataaaa acacttagta agttttcagt gtcatgcaca actaggaagt gacatggcca 1500
gaatataagc ccagtcacca tcactctata acctgcgctt ttaacaactt cagggcatga 1560
cacatttggc cggtcagtag aacccatgct gtgatttgtt tttgcagtgg tggtgatgac 1620
tgccttgttg aatccacttt ttattctatt ccattttggg gacacaattc tgcaagatga 1680
ttcttcatta ggaaacagag atgagttatt gaccaacaca gaaagaaaaa gagtttgttg 1740
ctccacactg ggattaaacc tatgatcttg gcctaattaa cactagctag taagtgtcca 1800
agctgatcat ctctacaaca tttcaataac agaaaacaac aattttcaaa attagttact 1860
tacaattatg tagaaatgcc tctaaaacac agtattttcc ttatattaca aaaacaaaaa 1920
ttataattgg ttttgtcctc ttttgagagt ttgcatggtg ttactccctg catagtgaag 1980
aaaacatttt atttaagtag atggatctaa gtttttcatg aacaaaggaa tgacatttga 2040
aatcaatcct accctagtcc aggagaatgc attagattaa cctagtagag gtcttatttc 2100
accctgagtt ttctatgatc gtgattctct gctggaggag taattgtgaa atagatctct 2160
ctgggaactg gcttcctagt ccaatcagct cttttaccaa tgaacacttc cttgtgatat 2220
agatgtttat ggccgagagg atccagtata ttaataaaat ccctttttgt attcaatgag 2280
ggaaacacat aattttcatc aattagcagc ttattggaat atctgcatga tggtttaaca 2340
cttttaagtg ttgactaaag attaatttta cagaaaatag aaaaagaaat atgtttctgt 2400
ctggaggaat gatttattgt tgacccctaa attgaaatat tttactagtg gcttaatgga 2460
aagatgatga aagatgatga aattaatgta gaagcttaac tagaaaatca ggtgacctga 2520
tatctacatc tgtatccttc attggccacc cagcattcat taatgaatca gatgatggaa 2580
tagatcaagt ttcctaggaa cacagtgaat attaaaagaa aacaaaggga gcctagcacc 2640
tagaagacct agtttatatt tcaaagtata tttggatgta acccaatttt aaacatttcc 2700
tcacttgtct ctcttaaagc cttgccaaca gcaaggacag agaaccaaaa atagtgtata 2760
tatgaataaa tgcttattac agaatctgct gactggcaca tgctttgtgt gtaatgggtt 2820
ctcataaaca cttgttgaat gaacacacat aagtgaaaga gcatggctag gcttcatccc 2880
ttggtcaaat atggggtgct aaagaaaagc aggggaaata cattgggaca ctaacaaaaa 2940
aaaacagtta atttaggtaa aagataaaat acaccacaga atgaagaaaa gagatgaccc 3000
agactgctct ttaaccttca tgtcctagag aggtttttga tatgaattgc attcagaatt 3060
gtggaaagga gcccatcttt tctcttcatt ttgattttat taactccaat gggggaattt 3120
tattcgtgtt ttggccatat ctacttttga tttctacatt attctctctt cctttctacc 3180
tgtatttgtc ctaataaatt gttgacttat taattcacta cttcctcaca gctttttttt 3240
ggctttacaa atccactgga aaggtatatg ggtgtatcac tttgtgtatt tcggtgtgca 3300
tgtgtagagg ggacaaaaat cctctctcaa actataaata ttgagtattt gtgtattgaa 3360
catttgctat aactactagg tttcttaaat aatcttaata tataaaatga tatagaaaaa 3420
gggaaattat agttcgtatt attcatctaa gtgaagagat taaaacccag ggagtaaata 3480
aattgtctaa ggactaaggt tgtatactat ttaggtgata gatatggggc aaccgtatgg 3540
gttttatgat taacaaataa acttctcacc actctaccat atcaactttt ccataaaaga 3600
gagctatagt attctttgct taaataaatt tgattagtgc atgacttctt gaaaacatat 3660
aaagcaaaag tcacatttga ttctatcaga aaagtgagta agccatggcc caaacaaaag 3720
atgcattaaa atattctgga atgatggagc taaaagtaag aaaaatgact ttttaaaaaa 3780
gtttactgtt aggaattgtg aaattatgct gaattttagt tgcattataa tttttgtcag 3840
tcatacggtc tgacaacctg tcttatttct atttccccat atgaggaatg ctagttaagt 3900
atggatatta actattacta cttagatgca ttgaagttgc ataatatgga taatacttca 3960
ctggttccct gaaaatgttt agttagtaat aagtctctta cactatttgt tttgtccaat 4020
aatttatatt ttctgaagac ttaactctag aatacactca tgtcaaaatg aaagaatttc 4080
attgcaaaat attgcttggt acatgacgca tacctgtatt tgttttgtgt cacaacatga 4140
aaaatgatgg tttattagaa gtttcattgg gtaggaaaca catttgaatg gtatttacta 4200
agatactaaa atccttggac ttcactctaa ttttagtgcc atttagaact caaggtctca 4260
gtaaaagtag aaataaagcc tgttaacaaa acacaaactg aatattaaaa atgtaactgg 4320
attttcaaag aaatgtttac tggtattacc tgtagatgta tattctttat tatgatcttt 4380
tgtgtaaagt ctggcagaca aatgcaatat ctaattgttg agtccaatat cacaagcagt 4440
acaaaagtat aaaaaagact tggccttttc taatgtgtta aaatacttta tgctggtaat 4500
aacactaaga gtagggcact agaaatttta agtgaagata atgtgttgca gttactgcac 4560
tcaatggctt actattataa accaaaactg ggatcactaa gctccagtca gtcaaaatga 4620
tcaaaattat tgaagagaat aagcaattct gttctttatt aggacacagt agatacagac 4680
tacaaagtgg agtgtgctta ataagaggta gcatttgtta agtgtcaatt actctattat 4740
cccttggagc ttctcaaaat aaccatataa ggtgtaagat gttaaaggtt atggttacac 4800
tcagtgcaca ggtaagctaa taggctgaga gaagctaaat tacttactgg ggtctcacag 4860
taagaaagtg agctgaagtt tcagcccaga tttaactgga ttctgggctc tttattcatg 4920
ttacttcatg aatctgtttc tcaattgtgc agaaaaaagg gggctattta taagaaaagc 4980
aataaacaaa caagtaatga tctcaaataa gtaatgcaag aaatagtgag atttcaaaat 5040
cagtggcagc gatttctcag ttctgtccta agtggccttg ctcaatcacc tgctatcttt 5100
tagtggagct ttgaaattat gtttcagaca acttcgattc agttctagaa tgtttgactc 5160
agcaaattca caggctcatc tttctaactt gatggtgaat atggaaattc agctaaatgg 5220
atgttaataa aattcaaacg ttttaaggac agatggaaat gacagaattt taaggtaaaa 5280
tatatgaagg aatataagat aaaggatttt tctaccttca gcaaaaacat acccactaat 5340
tagtaaaatt aataggcgaa aaaaagttgc atgctcttat actgtaatga ttatcatttt 5400
aaaactagct ttttgccttc gagctatcgg ggtaaagacc tacaggaaaa ctactgtcga 5460
aatcctcgag gggaagaagg gggaccctgg tgtttcacaa gcaatccaga ggtacgctac 5520
gaagtctgtg acattcctca gtgttcagaa gttgaatgca tgacctgcaa tggggagagt 5580
tatcgaggtc tcatggatca tacagaatca ggcaagattt gtcagcgctg ggatcatcag 5640
acaccacacc ggcacaaatt cttgcctgaa agatatcccg acaagggctt tgatgataat 5700
tattgccgca atcccgatgg ccagccgagg ccatggtgct atactcttga ccctcacacc 5760
cgctgggagt actgtgcaat taaaacatgc gctgacaata ctatgaatga cactgatgtt 5820
cctttggaaa caactgaatg catccaaggt caaggagaag gctacagggg cactgtcaat 5880
accatttgga atggaattcc atgtcagcgt tgggattctc agtatcctca cgagcatgac 5940
atgactcctg aaaatttcaa gtgcaaggac ctacgagaaa attactgccg aaatccagat 6000
gggtctgaat caccctggtg ttttaccact gatccaaaca tccgagttgg ctactgctcc 6060
caaattccaa actgtgatat gtcacatgga caagattgtt atcgtgggaa tggcaaaaat 6120
tatatgggca acttatccca aacaagatct ggactaacat gttcaatgtg ggacaagaac 6180
atggaagact tacatcgtca tatcttctgg gaaccagatg caagtaagct gaatgagaat 6240
tactgccgaa atccagatga tgatgctcat ggaccctggt gctacacggg aaatccactc 6300
attccttggg attattgccc tatttctcgt tgtgaaggtg ataccacacc tacaatagtc 6360
aatttagacc atcccgtaat atcttgtgcc aaaacgaaac aattgcgagt tgtaaatggg 6420
attccaacac gaacaaacat aggatggatg gttagtttga gatacagaaa taaacatatc 6480
tgcggaggat cattgataaa ggagagttgg gttcttactg cacgacagtg tttcccttct 6540
cgagacttga aagattatga agcttggctt ggaattcatg atgtccacgg aagaggagat 6600
gagaaatgca aacaggttct caatgtttcc cagctggtat atggccctga aggatcagat 6660
ctggttttaa tgaagcttgc caggcctgct gtcctggatg attttgttag tacgattgat 6720
ttacctaatt atggatgcac aattcctgaa aagaccagtt gcagtgttta tggctggggc 6780
tacactggat tgatcaacta tgatggccta ttacgagtgg cacatctcta tataatggga 6840
aatgagaaat gcagccagca tcatcgaggg aaggtgactc tgaatgagtc tgaaatatgt 6900
gctggggctg aaaagattgg atcaggacca tgtgaggggg attatggtgg cccacttgtt 6960
tgtgagcaac ataaaatgag aatggttctt ggtgtcattg ttcctggtcg tggatgtgcc 7020
attccaaatc gtcctggtat ttttgtccga gtagcatatt atgcaaaatg gatacacaaa 7080
attattttaa catataaggt accacagtca tag 7113
<210> 4
<211> 3679
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atgtgggtga ccaaactcct gccagccctg ctgctgcagc atgtcctcct gcatctcctc 60
ctgctcccca tcgccatccc ctatgcagag ggacaaagga aaagaagaaa tacaattcat 120
gaattcaaaa aatcagcaaa gactacccta atcaaaatag atccagcact gaagataaaa 180
accaaaaaag tgaatactgc agaccaatgt gctaatagat gtactaggaa taaaggactt 240
ccattcactt gcaaggcttt tgtttttgat aaagcaagaa aacaatgcct ctggttcccc 300
ttcaatagca tgtcaagtgg agtgaaaaaa gaatttggcc atgaatttga cctctatgaa 360
aacaaagact acattagaaa ctgcatcatt ggtaaaggac gcagctacaa gggaacagta 420
tctatcacta agagtggcat caaatgtcag ccctggagtt ccatgatacc acacgaacac 480
aggtaagaac agtatgaaga aaagagatga agcctctgtc ttttttacat gttaacagtc 540
tcatattagt ccttcagaat aattctacaa tcctaaaata acttagccaa cttgctgaat 600
tgtattacgg caaggtttat atgaattcat gactgatatt tagcaaatga ttaattaata 660
tgttaataaa atgtagccaa aacaatatct taccttaatg cctcaatttg tagatctcgg 720
tatttgtgga tcctgggtag gaaacacatt tgaatggtat ttactaagat actaaaatcc 780
ttggacttca ctctaatttt agtgccattt agaactcaag gtctcagtaa aagtagaaat 840
aaagcctgtt aacaaaacac aaactgaata ttaaaaatgt aactggattt tcaaagaaat 900
gtttactggt attacctgta gatgtatatt ctttattatg atcttttgtg taaagtctgg 960
cagacaaatg caatatctaa ttgttgagtc caatatcaca agcagtacaa aagtataaaa 1020
aagacttggc cttttctaat gtgttaaaat actttatgct ggtaataaca ctaagagtag 1080
ggcactagaa attttaagtg aagataatgt gttgcagtta ctgcactcaa tggcttacta 1140
ttataaacca aaactgggat cactaagctc cagtcagtca aaatgatcaa aattattgaa 1200
gagaataagc aattctgttc tttattagga cacagtagat acagactaca aagtggagtg 1260
tgcttaataa gaggtagcat ttgttaagtg tcaattactc tattatccct tggagcttct 1320
caaaataacc atataaggtg taagatgtta aaggttatgg ttacactcag tgcacaggta 1380
agctaatagg ctgagagaag ctaaattact tactggggtc tcacagtaag aaagtgagct 1440
gaagtttcag cccagattta actggattct gggctcttta ttcatgttac ttcatgaatc 1500
tgtttctcaa ttgtgcagaa aaaagggggc tatttataag aaaagcaata aacaaacaag 1560
taatgatctc aaataagtaa tgcaagaaat agtgagattt caaaatcagt ggcagcgatt 1620
tctcagttct gtcctaagtg gccttgctca atcacctgct atcttttagt ggagctttga 1680
aattatgttt cagacaactt cgattcagtt ctagaatgtt tgactcagca aattcacagg 1740
ctcatctttc taacttgatg gtgaatatgg aaattcagct aaatggatgt taataaaatt 1800
caaacgtttt aaggacagat ggaaatgaca gaattttaag gtaaaatata tgaaggaata 1860
taagataaag gatttttcta ccttcagcaa aaacataccc actaattagt aaaattaata 1920
ggcgaaaaaa agttgcatgc tcttatactg taatgattat cattttaaaa ctagcttttt 1980
gccttcgagc tatcggggta aagacctaca ggaaaactac tgtcgaaatc ctcgagggga 2040
agaaggggga ccctggtgtt tcacaagcaa tccagaggta cgctacgaag tctgtgacat 2100
tcctcagtgt tcagaagttg aatgcatgac ctgcaatggg gagagttatc gaggtctcat 2160
ggatcataca gaatcaggca agatttgtca gcgctgggat catcagacac cacaccggca 2220
caaattcttg cctgaaagat atcccgacaa gggctttgat gataattatt gccgcaatcc 2280
cgatggccag ccgaggccat ggtgctatac tcttgaccct cacacccgct gggagtactg 2340
tgcaattaaa acatgcgctg acaatactat gaatgacact gatgttcctt tggaaacaac 2400
tgaatgcatc caaggtcaag gagaaggcta caggggcact gtcaatacca tttggaatgg 2460
aattccatgt cagcgttggg attctcagta tcctcacgag catgacatga ctcctgaaaa 2520
tttcaagtgc aaggacctac gagaaaatta ctgccgaaat ccagatgggt ctgaatcacc 2580
ctggtgtttt accactgatc caaacatccg agttggctac tgctcccaaa ttccaaactg 2640
tgatatgtca catggacaag attgttatcg tgggaatggc aaaaattata tgggcaactt 2700
atcccaaaca agatctggac taacatgttc aatgtgggac aagaacatgg aagacttaca 2760
tcgtcatatc ttctgggaac cagatgcaag taagctgaat gagaattact gccgaaatcc 2820
agatgatgat gctcatggac cctggtgcta cacgggaaat ccactcattc cttgggatta 2880
ttgccctatt tctcgttgtg aaggtgatac cacacctaca atagtcaatt tagaccatcc 2940
cgtaatatct tgtgccaaaa cgaaacaatt gcgagttgta aatgggattc caacacgaac 3000
aaacatagga tggatggtta gtttgagata cagaaataaa catatctgcg gaggatcatt 3060
gataaaggag agttgggttc ttactgcacg acagtgtttc ccttctcgag acttgaaaga 3120
ttatgaagct tggcttggaa ttcatgatgt ccacggaaga ggagatgaga aatgcaaaca 3180
ggttctcaat gtttcccagc tggtatatgg ccctgaagga tcagatctgg ttttaatgaa 3240
gcttgccagg cctgctgtcc tggatgattt tgttagtacg attgatttac ctaattatgg 3300
atgcacaatt cctgaaaaga ccagttgcag tgtttatggc tggggctaca ctggattgat 3360
caactatgat ggcctattac gagtggcaca tctctatata atgggaaatg agaaatgcag 3420
ccagcatcat cgagggaagg tgactctgaa tgagtctgaa atatgtgctg gggctgaaaa 3480
gattggatca ggaccatgtg agggggatta tggtggccca cttgtttgtg agcaacataa 3540
aatgagaatg gttcttggtg tcattgttcc tggtcgtgga tgtgccattc caaatcgtcc 3600
tggtattttt gtccgagtag catattatgc aaaatggata cacaaaatta ttttaacata 3660
taaggtacca cagtcatag 3679
<210> 5
<211> 4679
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgtgggtga ccaaactcct gccagccctg ctgctgcagc atgtcctcct gcatctcctc 60
ctgctcccca tcgccatccc ctatgcagag ggacaaagga aaagaagaaa tacaattcat 120
gaattcaaaa aatcagcaaa gactacccta atcaaaatag atccagcact gaagataaaa 180
accaaaaaag tgaatactgc agaccaatgt gctaatagat gtactaggaa taaaggactt 240
ccattcactt gcaaggcttt tgtttttgat aaagcaagaa aacaatgcct ctggttcccc 300
ttcaatagca tgtcaagtgg agtgaaaaaa gaatttggcc atgaatttga cctctatgaa 360
aacaaagact acattagaaa ctgcatcatt ggtaaaggac gcagctacaa gggaacagta 420
tctatcacta agagtggcat caaatgtcag ccctggagtt ccatgatacc acacgaacac 480
aggtaagaac agtatgaaga aaagagatga agcctctgtc ttttttacat gttaacagtc 540
tcatattagt ccttcagaat aattctacaa tcctaaaata acttagccaa cttgctgaat 600
tgtattacgg caaggtttat atgaattcat gactgatatt tagcaaatga ttaattaata 660
tgttaataaa atgtagccaa aacaatatct taccttaatg cctcaatttg tagatctcgg 720
tatttgtgga tcccttcctt tctacctgta tttgtcctaa taaattgttg acttattaat 780
tcactacttc ctcacagctt ttttttggct ttacaaatcc actggaaagg tatatgggtg 840
tatcactttg tgtatttcgg tgtgcatgtg tagaggggac aaaaatcctc tctcaaacta 900
taaatattga gtatttgtgt attgaacatt tgctataact actaggtttc ttaaataatc 960
ttaatatata aaatgatata gaaaaaggga aattatagtt cgtattattc atctaagtga 1020
agagattaaa acccagggag taaataaatt gtctaaggac taaggttgta tactatttag 1080
gtgatagata tggggcaacc gtatgggttt tatgattaac aaataaactt ctcaccactc 1140
taccatatca acttttccat aaaagagagc tatagtattc tttgcttaaa taaatttgat 1200
tagtgcatga cttcttgaaa acatataaag caaaagtcac atttgattct atcagaaaag 1260
tgagtaagcc atggcccaaa caaaagatgc attaaaatat tctggaatga tggagctaaa 1320
agtaagaaaa atgacttttt aaaaaagttt actgttagga attgtgaaat tatgctgaat 1380
tttagttgca ttataatttt tgtcagtcat acggtctgac aacctgtctt atttctattt 1440
ccccatatga ggaatgctag ttaagtatgg atattaacta ttactactta gatgcattga 1500
agttgcataa tatggataat acttcactgg ttccctgaaa atgtttagtt agtaataagt 1560
ctcttacact atttgttttg tccaataatt tatattttct gaagacttaa ctctagaata 1620
cactcatgtc aaaatgaaag aatttcattg caaaatattg cttggtacat gacgcatacc 1680
tgtatttgtt ttgtgtcaca acatgaaaaa tgatggttta ttagaagttt cattgggtag 1740
gaaacacatt tgaatggtat ttactaagat actaaaatcc ttggacttca ctctaatttt 1800
agtgccattt agaactcaag gtctcagtaa aagtagaaat aaagcctgtt aacaaaacac 1860
aaactgaata ttaaaaatgt aactggattt tcaaagaaat gtttactggt attacctgta 1920
gatgtatatt ctttattatg atcttttgtg taaagtctgg cagacaaatg caatatctaa 1980
ttgttgagtc caatatcaca agcagtacaa aagtataaaa aagacttggc cttttctaat 2040
gtgttaaaat actttatgct ggtaataaca ctaagagtag ggcactagaa attttaagtg 2100
aagataatgt gttgcagtta ctgcactcaa tggcttacta ttataaacca aaactgggat 2160
cactaagctc cagtcagtca aaatgatcaa aattattgaa gagaataagc aattctgttc 2220
tttattagga cacagtagat acagactaca aagtggagtg tgcttaataa gaggtagcat 2280
ttgttaagtg tcaattactc tattatccct tggagcttct caaaataacc atataaggtg 2340
taagatgtta aaggttatgg ttacactcag tgcacaggta agctaatagg ctgagagaag 2400
ctaaattact tactggggtc tcacagtaag aaagtgagct gaagtttcag cccagattta 2460
actggattct gggctcttta ttcatgttac ttcatgaatc tgtttctcaa ttgtgcagaa 2520
aaaagggggc tatttataag aaaagcaata aacaaacaag taatgatctc aaataagtaa 2580
tgcaagaaat agtgagattt caaaatcagt ggcagcgatt tctcagttct gtcctaagtg 2640
gccttgctca atcacctgct atcttttagt ggagctttga aattatgttt cagacaactt 2700
cgattcagtt ctagaatgtt tgactcagca aattcacagg ctcatctttc taacttgatg 2760
gtgaatatgg aaattcagct aaatggatgt taataaaatt caaacgtttt aaggacagat 2820
ggaaatgaca gaattttaag gtaaaatata tgaaggaata taagataaag gatttttcta 2880
ccttcagcaa aaacataccc actaattagt aaaattaata ggcgaaaaaa agttgcatgc 2940
tcttatactg taatgattat cattttaaaa ctagcttttt gccttcgagc tatcggggta 3000
aagacctaca ggaaaactac tgtcgaaatc ctcgagggga agaaggggga ccctggtgtt 3060
tcacaagcaa tccagaggta cgctacgaag tctgtgacat tcctcagtgt tcagaagttg 3120
aatgcatgac ctgcaatggg gagagttatc gaggtctcat ggatcataca gaatcaggca 3180
agatttgtca gcgctgggat catcagacac cacaccggca caaattcttg cctgaaagat 3240
atcccgacaa gggctttgat gataattatt gccgcaatcc cgatggccag ccgaggccat 3300
ggtgctatac tcttgaccct cacacccgct gggagtactg tgcaattaaa acatgcgctg 3360
acaatactat gaatgacact gatgttcctt tggaaacaac tgaatgcatc caaggtcaag 3420
gagaaggcta caggggcact gtcaatacca tttggaatgg aattccatgt cagcgttggg 3480
attctcagta tcctcacgag catgacatga ctcctgaaaa tttcaagtgc aaggacctac 3540
gagaaaatta ctgccgaaat ccagatgggt ctgaatcacc ctggtgtttt accactgatc 3600
caaacatccg agttggctac tgctcccaaa ttccaaactg tgatatgtca catggacaag 3660
attgttatcg tgggaatggc aaaaattata tgggcaactt atcccaaaca agatctggac 3720
taacatgttc aatgtgggac aagaacatgg aagacttaca tcgtcatatc ttctgggaac 3780
cagatgcaag taagctgaat gagaattact gccgaaatcc agatgatgat gctcatggac 3840
cctggtgcta cacgggaaat ccactcattc cttgggatta ttgccctatt tctcgttgtg 3900
aaggtgatac cacacctaca atagtcaatt tagaccatcc cgtaatatct tgtgccaaaa 3960
cgaaacaatt gcgagttgta aatgggattc caacacgaac aaacatagga tggatggtta 4020
gtttgagata cagaaataaa catatctgcg gaggatcatt gataaaggag agttgggttc 4080
ttactgcacg acagtgtttc ccttctcgag acttgaaaga ttatgaagct tggcttggaa 4140
ttcatgatgt ccacggaaga ggagatgaga aatgcaaaca ggttctcaat gtttcccagc 4200
tggtatatgg ccctgaagga tcagatctgg ttttaatgaa gcttgccagg cctgctgtcc 4260
tggatgattt tgttagtacg attgatttac ctaattatgg atgcacaatt cctgaaaaga 4320
ccagttgcag tgtttatggc tggggctaca ctggattgat caactatgat ggcctattac 4380
gagtggcaca tctctatata atgggaaatg agaaatgcag ccagcatcat cgagggaagg 4440
tgactctgaa tgagtctgaa atatgtgctg gggctgaaaa gattggatca ggaccatgtg 4500
agggggatta tggtggccca cttgtttgtg agcaacataa aatgagaatg gttcttggtg 4560
tcattgttcc tggtcgtgga tgtgccattc caaatcgtcc tggtattttt gtccgagtag 4620
catattatgc aaaatggata cacaaaatta ttttaacata taaggtacca cagtcatag 4679
<210> 6
<211> 10811
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
cgcgttgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240
tacatcaagt gtatcatatg ccaagtccgc cccctattga cgtcaatgac ggtaaatggc 300
ccgcctggca ttatgcccag tacatgacct tacgggactt tcctacttgg cagtacatct 360
acgtattagt catcgctatt accatggtga tgcggttttg gcagtacacc aatgggcgtg 420
gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 480
tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taataacccc gccccgttga 540
cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 600
accgtcagat cgcctggaga cgccatccac gctgttttga cctccataga agacaccggg 660
accgatccag cctccgcggc cgggaacggt gcattggaac gcggattccc cgtgccaaga 720
gtgacgtaag taccgcctat agactctata ggcacacccc tttggctctt atgcatgcta 780
tactgttttt ggcttggggc ctatacaccc ccgcttcctt atgctatagg tgatggtata 840
gcttagccta taggtgtggg ttattgacca ttattgacca ctcccctatt ggtgacgata 900
ctttccatta ctaatccata acatggctct ttgccacaac tatctctatt ggctatatgc 960
caatactctg tccttcagag actgacacgg actctgtatt tttacaggat ggggtcccat 1020
ttattattta caaattcaca tatacaacaa cgccgtcccc cgtgcccgca gtttttatta 1080
aacatagcgt gggatctcca cgcgaatctc gggtacgtgt tccggacatg ggctcttctc 1140
cggtagcggc ggagcttcca catccgagcc ctggtcccat gcctccagcg gctcatggtc 1200
gctcggcagc tccttgctcc taacagtgga ggccagactt aggcacagca caatgcccac 1260
caccaccagt gtgccgcaca aggccgtggc ggtagggtat gtgtctgaaa atgagctcgg 1320
agattgggct cgcaccgctg acgcagatgg aagacttaag gcagcggcag aagaagatgc 1380
aggcagctga gttgttgtat tctgataaga gtcagaggta actcccgttg cggtgctgtt 1440
aacggtggag ggcagtgtag tctgagcagt actcgttgct gccgcgcgcg ccaccagaca 1500
taatagctga cagactaaca gactgttcct ttccatgggt cttttctgca gtcaccgtcc 1560
ttgacacgaa gcttgctagc accatgtggg tgaccaaact cctgccagcc ctgctgctgc 1620
agcatgtcct cctgcatctc ctcctgctcc ccatcgccat cccctatgca gagggacaaa 1680
ggaaaagaag aaatacaatt catgaattca aaaaatcagc aaagactacc ctaatcaaaa 1740
tagatccagc actgaagata aaaaccaaaa aagtgaatac tgcagaccaa tgtgctaata 1800
gatgtactag gaataaagga cttccattca cttgcaaggc ttttgttttt gataaagcaa 1860
gaaaacaatg cctctggttc cccttcaata gcatgtcaag tggagtgaaa aaagaatttg 1920
gccatgaatt tgacctctat gaaaacaaag actacattag aaactgcatc attggtaaag 1980
gacgcagcta caagggaaca gtatctatca ctaagagtgg catcaaatgt cagccctgga 2040
gttccatgat accacacgaa cacaggtaag aacagtatga agaaaagaga tgaagcctct 2100
gtctttttta catgttaaca gtctcatatt agtccttcag aataattcta caatcctaaa 2160
ataacttagc caacttgctg aattgtatta cggcaaggtt tatatgaatt catgactgat 2220
atttagcaaa tgattaatta atatgttaat aaaatgtagc caaaacaata tcttacctta 2280
atgcctcaat ttgtagatct cggtatttgt gaaataataa cgtaaacttc gtttaaaagg 2340
attcttcttc ctgtctttga gaaagtacgg cactgtgcag ggggagaggt tgattgtgaa 2400
aaatcagagg tagatgagaa tcttactgag ggctgagggt tctttaacct tggtggatct 2460
caacattggt tgcacattaa aatcacctgc tgcaagccct tgacgaatct tacttagaag 2520
atgacaacac agaacaatta aatcagaatc tctggggaga atagggcacc agtatttttt 2580
gagctcccac catgattcca aagtgcagcc aaatttgaga accactgcta aaagctcaag 2640
cttcagattg accagctttt ccatctcacc tatcgcctaa agaccaaatt ggataaatgt 2700
gttcattacg acagatgggt actatttaaa gatgagtaaa cacaatatac ttaggctcgt 2760
cagactgaga gttttaatca tcactgagga aaaacataga tatctaatac tgactggagt 2820
attagtcaag gcttatttca cacacaattt tatcagaaac caaagtagtt taaaacagct 2880
ctccccttat tagtaatgca ttggagggtt tactttacca tgtaccttgc tgagcactgt 2940
accttgttaa tctcatttac ttgtaatgag aaccacacag cgggtagttt tattggttct 3000
attttaccta catgacaaaa ctgaagcata aaaacactta gtaagttttc agtgtcatgc 3060
acaactagga agtgacatgg ccagaatata agcccagtca ccatcactct ataacctgcg 3120
cttttaacaa cttcagggca tgacacattt ggccggtcag tagaacccat gctgtgattt 3180
gtttttgcag tggtggtgat gactgccttg ttgaatccac tttttattct attccatttt 3240
ggggacacaa ttctgcaaga tgattcttca ttaggaaaca gagatgagtt attgaccaac 3300
acagaaagaa aaagagtttg ttgctccaca ctgggattaa acctatgatc ttggcctaat 3360
taacactagc tagtaagtgt ccaagctgat catctctaca acatttcaat aacagaaaac 3420
aacaattttc aaaattagtt acttacaatt atgtagaaat gcctctaaaa cacagtattt 3480
tccttatatt acaaaaacaa aaattataat tggttttgtc ctcttttgag agtttgcatg 3540
gtgttactcc ctgcatagtg aagaaaacat tttatttaag tagatggatc taagtttttc 3600
atgaacaaag gaatgacatt tgaaatcaat cctaccctag tccaggagaa tgcattagat 3660
taacctagta gaggtcttat ttcaccctga gttttctatg atcgtgattc tctgctggag 3720
gagtaattgt gaaatagatc tctctgggaa ctggcttcct agtccaatca gctcttttac 3780
caatgaacac ttccttgtga tatagatgtt tatggccgag aggatccagt atattaataa 3840
aatccctttt tgtattcaat gagggaaaca cataattttc atcaattagc agcttattgg 3900
aatatctgca tgatggttta acacttttaa gtgttgacta aagattaatt ttacagaaaa 3960
tagaaaaaga aatatgtttc tgtctggagg aatgatttat tgttgacccc taaattgaaa 4020
tattttacta gtggcttaat ggaaagatga tgaaagatga tgaaattaat gtagaagctt 4080
aactagaaaa tcaggtgacc tgatatctac atctgtatcc ttcattggcc acccagcatt 4140
cattaatgaa tcagatgatg gaatagatca agtttcctag gaacacagtg aatattaaaa 4200
gaaaacaaag ggagcctagc acctagaaga cctagtttat atttcaaagt atatttggat 4260
gtaacccaat tttaaacatt tcctcacttg tctctcttaa agccttgcca acagcaagga 4320
cagagaacca aaaatagtgt atatatgaat aaatgcttat tacagaatct gctgactggc 4380
acatgctttg tgtgtaatgg gttctcataa acacttgttg aatgaacaca cataagtgaa 4440
agagcatggc taggcttcat cccttggtca aatatggggt gctaaagaaa agcaggggaa 4500
atacattggg acactaacaa aaaaaaacag ttaatttagg taaaagataa aatacaccac 4560
agaatgaaga aaagagatga cccagactgc tctttaacct tcatgtccta gagaggtttt 4620
tgatatgaat tgcattcaga attgtggaaa ggagcccatc ttttctcttc attttgattt 4680
tattaactcc aatgggggaa ttttattcgt gttttggcca tatctacttt tgatttctac 4740
attattctct cttcctttct acctgtattt gtcctaataa attgttgact tattaattca 4800
ctacttcctc acagcttttt tttggcttta caaatccact ggaaaggtat atgggtgtat 4860
cactttgtgt atttcggtgt gcatgtgtag aggggacaaa aatcctctct caaactataa 4920
atattgagta tttgtgtatt gaacatttgc tataactact aggtttctta aataatctta 4980
atatataaaa tgatatagaa aaagggaaat tatagttcgt attattcatc taagtgaaga 5040
gattaaaacc cagggagtaa ataaattgtc taaggactaa ggttgtatac tatttaggtg 5100
atagatatgg ggcaaccgta tgggttttat gattaacaaa taaacttctc accactctac 5160
catatcaact tttccataaa agagagctat agtattcttt gcttaaataa atttgattag 5220
tgcatgactt cttgaaaaca tataaagcaa aagtcacatt tgattctatc agaaaagtga 5280
gtaagccatg gcccaaacaa aagatgcatt aaaatattct ggaatgatgg agctaaaagt 5340
aagaaaaatg actttttaaa aaagtttact gttaggaatt gtgaaattat gctgaatttt 5400
agttgcatta taatttttgt cagtcatacg gtctgacaac ctgtcttatt tctatttccc 5460
catatgagga atgctagtta agtatggata ttaactatta ctacttagat gcattgaagt 5520
tgcataatat ggataatact tcactggttc cctgaaaatg tttagttagt aataagtctc 5580
ttacactatt tgttttgtcc aataatttat attttctgaa gacttaactc tagaatacac 5640
tcatgtcaaa atgaaagaat ttcattgcaa aatattgctt ggtacatgac gcatacctgt 5700
atttgttttg tgtcacaaca tgaaaaatga tggtttatta gaagtttcat tgggtaggaa 5760
acacatttga atggtattta ctaagatact aaaatccttg gacttcactc taattttagt 5820
gccatttaga actcaaggtc tcagtaaaag tagaaataaa gcctgttaac aaaacacaaa 5880
ctgaatatta aaaatgtaac tggattttca aagaaatgtt tactggtatt acctgtagat 5940
gtatattctt tattatgatc ttttgtgtaa agtctggcag acaaatgcaa tatctaattg 6000
ttgagtccaa tatcacaagc agtacaaaag tataaaaaag acttggcctt ttctaatgtg 6060
ttaaaatact ttatgctggt aataacacta agagtagggc actagaaatt ttaagtgaag 6120
ataatgtgtt gcagttactg cactcaatgg cttactatta taaaccaaaa ctgggatcac 6180
taagctccag tcagtcaaaa tgatcaaaat tattgaagag aataagcaat tctgttcttt 6240
attaggacac agtagataca gactacaaag tggagtgtgc ttaataagag gtagcatttg 6300
ttaagtgtca attactctat tatcccttgg agcttctcaa aataaccata taaggtgtaa 6360
gatgttaaag gttatggtta cactcagtgc acaggtaagc taataggctg agagaagcta 6420
aattacttac tggggtctca cagtaagaaa gtgagctgaa gtttcagccc agatttaact 6480
ggattctggg ctctttattc atgttacttc atgaatctgt ttctcaattg tgcagaaaaa 6540
agggggctat ttataagaaa agcaataaac aaacaagtaa tgatctcaaa taagtaatgc 6600
aagaaatagt gagatttcaa aatcagtggc agcgatttct cagttctgtc ctaagtggcc 6660
ttgctcaatc acctgctatc ttttagtgga gctttgaaat tatgtttcag acaacttcga 6720
ttcagttcta gaatgtttga ctcagcaaat tcacaggctc atctttctaa cttgatggtg 6780
aatatggaaa ttcagctaaa tggatgttaa taaaattcaa acgttttaag gacagatgga 6840
aatgacagaa ttttaaggta aaatatatga aggaatataa gataaaggat ttttctacct 6900
tcagcaaaaa catacccact aattagtaaa attaataggc gaaaaaaagt tgcatgctct 6960
tatactgtaa tgattatcat tttaaaacta gctttttgcc ttcgagctat cggggtaaag 7020
acctacagga aaactactgt cgaaatcctc gaggggaaga agggggaccc tggtgtttca 7080
caagcaatcc agaggtacgc tacgaagtct gtgacattcc tcagtgttca gaagttgaat 7140
gcatgacctg caatggggag agttatcgag gtctcatgga tcatacagaa tcaggcaaga 7200
tttgtcagcg ctgggatcat cagacaccac accggcacaa attcttgcct gaaagatatc 7260
ccgacaaggg ctttgatgat aattattgcc gcaatcccga tggccagccg aggccatggt 7320
gctatactct tgaccctcac acccgctggg agtactgtgc aattaaaaca tgcgctgaca 7380
atactatgaa tgacactgat gttcctttgg aaacaactga atgcatccaa ggtcaaggag 7440
aaggctacag gggcactgtc aataccattt ggaatggaat tccatgtcag cgttgggatt 7500
ctcagtatcc tcacgagcat gacatgactc ctgaaaattt caagtgcaag gacctacgag 7560
aaaattactg ccgaaatcca gatgggtctg aatcaccctg gtgttttacc actgatccaa 7620
acatccgagt tggctactgc tcccaaattc caaactgtga tatgtcacat ggacaagatt 7680
gttatcgtgg gaatggcaaa aattatatgg gcaacttatc ccaaacaaga tctggactaa 7740
catgttcaat gtgggacaag aacatggaag acttacatcg tcatatcttc tgggaaccag 7800
atgcaagtaa gctgaatgag aattactgcc gaaatccaga tgatgatgct catggaccct 7860
ggtgctacac gggaaatcca ctcattcctt gggattattg ccctatttct cgttgtgaag 7920
gtgataccac acctacaata gtcaatttag accatcccgt aatatcttgt gccaaaacga 7980
aacaattgcg agttgtaaat gggattccaa cacgaacaaa cataggatgg atggttagtt 8040
tgagatacag aaataaacat atctgcggag gatcattgat aaaggagagt tgggttctta 8100
ctgcacgaca gtgtttccct tctcgagact tgaaagatta tgaagcttgg cttggaattc 8160
atgatgtcca cggaagagga gatgagaaat gcaaacaggt tctcaatgtt tcccagctgg 8220
tatatggccc tgaaggatca gatctggttt taatgaagct tgccaggcct gctgtcctgg 8280
atgattttgt tagtacgatt gatttaccta attatggatg cacaattcct gaaaagacca 8340
gttgcagtgt ttatggctgg ggctacactg gattgatcaa ctatgatggc ctattacgag 8400
tggcacatct ctatataatg ggaaatgaga aatgcagcca gcatcatcga gggaaggtga 8460
ctctgaatga gtctgaaata tgtgctgggg ctgaaaagat tggatcagga ccatgtgagg 8520
gggattatgg tggcccactt gtttgtgagc aacataaaat gagaatggtt cttggtgtca 8580
ttgttcctgg tcgtggatgt gccattccaa atcgtcctgg tatttttgtc cgagtagcat 8640
attatgcaaa atggatacac aaaattattt taacatataa ggtaccacag tcatagcggc 8700
cgctctagag ggcccgttta aacccgctga tcagcctcga ctgtgccttc tagttgccag 8760
ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 8820
gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 8880
ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 8940
gctggggagt cgaaattcag aagaactcgt caagaaggcg atagaaggcg atgcgctgcg 9000
aatcgggagc ggcgataccg taaagcacga ggaagcggtc agcccattcg ccgccaagct 9060
cttcagcaat atcacgggta gccaacgcta tgtcctgata gcggtccgcc acacccagcc 9120
ggccacagtc gatgaatcca gaaaagcggc cattttccac catgatattc ggcaagcagg 9180
catcgccatg ggtcacgacg agatcctcgc cgtcgggcat gctcgccttg agcctggcga 9240
acagttcggc tggcgcgagc ccctgatgct cttcgtccag atcatcctga tcgacaagac 9300
cggcttccat ccgagtacgt gctcgctcga tgcgatgttt cgcttggtgg tcgaatgggc 9360
aggtagccgg atcaagcgta tgcagccgcc gcattgcatc agccatgatg gatactttct 9420
cggcaggagc aaggtgagat gacaggagat cctgccccgg cacttcgccc aatagcagcc 9480
agtcccttcc cgcttcagtg acaacgtcga gcacagctgc gcaaggaacg cccgtcgtgg 9540
ccagccacga tagccgcgct gcctcgtctt gcagttcatt cagggcaccg gacaggtcgg 9600
tcttgacaaa aagaaccggg cgcccctgcg ctgacagccg gaacacggcg gcatcagagc 9660
agccgattgt ctgttgtgcc cagtcatagc cgaatagcct ctccacccaa gcggccggag 9720
aacctgcgtg caatccatct tgttcaatca tgcgaaacga tcctcatcct gtctcttgat 9780
cagatcttga tcccctgcgc catcagatcc ttggcggcaa gaaagccatc cagtttactt 9840
tgcagggctt cccaacctta ccagagggcg ccccagctgg caattccggt tcgcttgctg 9900
tccataaaac cgcccagtct agctatcgcc atgtaagccc actgcaagct acctgctttc 9960
tctttgcgct tgcgttttcc cttgtccaga tagcccagta gctgacattc atccggggtc 10020
agcaccgttt ctgcggactg gctttctacg tgaaaaggat ctaggtgaag atcctttttg 10080
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 10140
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 10200
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 10260
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt 10320
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 10380
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 10440
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 10500
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 10560
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 10620
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 10680
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 10740
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 10800
ttgctcacat g 10811
<210> 7
<211> 7377
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cgcgttgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240
tacatcaagt gtatcatatg ccaagtccgc cccctattga cgtcaatgac ggtaaatggc 300
ccgcctggca ttatgcccag tacatgacct tacgggactt tcctacttgg cagtacatct 360
acgtattagt catcgctatt accatggtga tgcggttttg gcagtacacc aatgggcgtg 420
gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 480
tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taataacccc gccccgttga 540
cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 600
accgtcagat cgcctggaga cgccatccac gctgttttga cctccataga agacaccggg 660
accgatccag cctccgcggc cgggaacggt gcattggaac gcggattccc cgtgccaaga 720
gtgacgtaag taccgcctat agactctata ggcacacccc tttggctctt atgcatgcta 780
tactgttttt ggcttggggc ctatacaccc ccgcttcctt atgctatagg tgatggtata 840
gcttagccta taggtgtggg ttattgacca ttattgacca ctcccctatt ggtgacgata 900
ctttccatta ctaatccata acatggctct ttgccacaac tatctctatt ggctatatgc 960
caatactctg tccttcagag actgacacgg actctgtatt tttacaggat ggggtcccat 1020
ttattattta caaattcaca tatacaacaa cgccgtcccc cgtgcccgca gtttttatta 1080
aacatagcgt gggatctcca cgcgaatctc gggtacgtgt tccggacatg ggctcttctc 1140
cggtagcggc ggagcttcca catccgagcc ctggtcccat gcctccagcg gctcatggtc 1200
gctcggcagc tccttgctcc taacagtgga ggccagactt aggcacagca caatgcccac 1260
caccaccagt gtgccgcaca aggccgtggc ggtagggtat gtgtctgaaa atgagctcgg 1320
agattgggct cgcaccgctg acgcagatgg aagacttaag gcagcggcag aagaagatgc 1380
aggcagctga gttgttgtat tctgataaga gtcagaggta actcccgttg cggtgctgtt 1440
aacggtggag ggcagtgtag tctgagcagt actcgttgct gccgcgcgcg ccaccagaca 1500
taatagctga cagactaaca gactgttcct ttccatgggt cttttctgca gtcaccgtcc 1560
ttgacacgaa gcttgctagc accatgtggg tgaccaaact cctgccagcc ctgctgctgc 1620
agcatgtcct cctgcatctc ctcctgctcc ccatcgccat cccctatgca gagggacaaa 1680
ggaaaagaag aaatacaatt catgaattca aaaaatcagc aaagactacc ctaatcaaaa 1740
tagatccagc actgaagata aaaaccaaaa aagtgaatac tgcagaccaa tgtgctaata 1800
gatgtactag gaataaagga cttccattca cttgcaaggc ttttgttttt gataaagcaa 1860
gaaaacaatg cctctggttc cccttcaata gcatgtcaag tggagtgaaa aaagaatttg 1920
gccatgaatt tgacctctat gaaaacaaag actacattag aaactgcatc attggtaaag 1980
gacgcagcta caagggaaca gtatctatca ctaagagtgg catcaaatgt cagccctgga 2040
gttccatgat accacacgaa cacaggtaag aacagtatga agaaaagaga tgaagcctct 2100
gtctttttta catgttaaca gtctcatatt agtccttcag aataattcta caatcctaaa 2160
ataacttagc caacttgctg aattgtatta cggcaaggtt tatatgaatt catgactgat 2220
atttagcaaa tgattaatta atatgttaat aaaatgtagc caaaacaata tcttacctta 2280
atgcctcaat ttgtagatct cggtatttgt ggatcctggg taggaaacac atttgaatgg 2340
tatttactaa gatactaaaa tccttggact tcactctaat tttagtgcca tttagaactc 2400
aaggtctcag taaaagtaga aataaagcct gttaacaaaa cacaaactga atattaaaaa 2460
tgtaactgga ttttcaaaga aatgtttact ggtattacct gtagatgtat attctttatt 2520
atgatctttt gtgtaaagtc tggcagacaa atgcaatatc taattgttga gtccaatatc 2580
acaagcagta caaaagtata aaaaagactt ggccttttct aatgtgttaa aatactttat 2640
gctggtaata acactaagag tagggcacta gaaattttaa gtgaagataa tgtgttgcag 2700
ttactgcact caatggctta ctattataaa ccaaaactgg gatcactaag ctccagtcag 2760
tcaaaatgat caaaattatt gaagagaata agcaattctg ttctttatta ggacacagta 2820
gatacagact acaaagtgga gtgtgcttaa taagaggtag catttgttaa gtgtcaatta 2880
ctctattatc ccttggagct tctcaaaata accatataag gtgtaagatg ttaaaggtta 2940
tggttacact cagtgcacag gtaagctaat aggctgagag aagctaaatt acttactggg 3000
gtctcacagt aagaaagtga gctgaagttt cagcccagat ttaactggat tctgggctct 3060
ttattcatgt tacttcatga atctgtttct caattgtgca gaaaaaaggg ggctatttat 3120
aagaaaagca ataaacaaac aagtaatgat ctcaaataag taatgcaaga aatagtgaga 3180
tttcaaaatc agtggcagcg atttctcagt tctgtcctaa gtggccttgc tcaatcacct 3240
gctatctttt agtggagctt tgaaattatg tttcagacaa cttcgattca gttctagaat 3300
gtttgactca gcaaattcac aggctcatct ttctaacttg atggtgaata tggaaattca 3360
gctaaatgga tgttaataaa attcaaacgt tttaaggaca gatggaaatg acagaatttt 3420
aaggtaaaat atatgaagga atataagata aaggattttt ctaccttcag caaaaacata 3480
cccactaatt agtaaaatta ataggcgaaa aaaagttgca tgctcttata ctgtaatgat 3540
tatcatttta aaactagctt tttgccttcg agctatcggg gtaaagacct acaggaaaac 3600
tactgtcgaa atcctcgagg ggaagaaggg ggaccctggt gtttcacaag caatccagag 3660
gtacgctacg aagtctgtga cattcctcag tgttcagaag ttgaatgcat gacctgcaat 3720
ggggagagtt atcgaggtct catggatcat acagaatcag gcaagatttg tcagcgctgg 3780
gatcatcaga caccacaccg gcacaaattc ttgcctgaaa gatatcccga caagggcttt 3840
gatgataatt attgccgcaa tcccgatggc cagccgaggc catggtgcta tactcttgac 3900
cctcacaccc gctgggagta ctgtgcaatt aaaacatgcg ctgacaatac tatgaatgac 3960
actgatgttc ctttggaaac aactgaatgc atccaaggtc aaggagaagg ctacaggggc 4020
actgtcaata ccatttggaa tggaattcca tgtcagcgtt gggattctca gtatcctcac 4080
gagcatgaca tgactcctga aaatttcaag tgcaaggacc tacgagaaaa ttactgccga 4140
aatccagatg ggtctgaatc accctggtgt tttaccactg atccaaacat ccgagttggc 4200
tactgctccc aaattccaaa ctgtgatatg tcacatggac aagattgtta tcgtgggaat 4260
ggcaaaaatt atatgggcaa cttatcccaa acaagatctg gactaacatg ttcaatgtgg 4320
gacaagaaca tggaagactt acatcgtcat atcttctggg aaccagatgc aagtaagctg 4380
aatgagaatt actgccgaaa tccagatgat gatgctcatg gaccctggtg ctacacggga 4440
aatccactca ttccttggga ttattgccct atttctcgtt gtgaaggtga taccacacct 4500
acaatagtca atttagacca tcccgtaata tcttgtgcca aaacgaaaca attgcgagtt 4560
gtaaatggga ttccaacacg aacaaacata ggatggatgg ttagtttgag atacagaaat 4620
aaacatatct gcggaggatc attgataaag gagagttggg ttcttactgc acgacagtgt 4680
ttcccttctc gagacttgaa agattatgaa gcttggcttg gaattcatga tgtccacgga 4740
agaggagatg agaaatgcaa acaggttctc aatgtttccc agctggtata tggccctgaa 4800
ggatcagatc tggttttaat gaagcttgcc aggcctgctg tcctggatga ttttgttagt 4860
acgattgatt tacctaatta tggatgcaca attcctgaaa agaccagttg cagtgtttat 4920
ggctggggct acactggatt gatcaactat gatggcctat tacgagtggc acatctctat 4980
ataatgggaa atgagaaatg cagccagcat catcgaggga aggtgactct gaatgagtct 5040
gaaatatgtg ctggggctga aaagattgga tcaggaccat gtgaggggga ttatggtggc 5100
ccacttgttt gtgagcaaca taaaatgaga atggttcttg gtgtcattgt tcctggtcgt 5160
ggatgtgcca ttccaaatcg tcctggtatt tttgtccgag tagcatatta tgcaaaatgg 5220
atacacaaaa ttattttaac atataaggta ccacagtcat agcggccgct ctagagggcc 5280
cgtttaaacc cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 5340
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 5400
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 5460
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggagtcgaa 5520
attcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 5580
ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 5640
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 5700
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 5760
acgacgagat cctcgccgtc gggcatgctc gccttgagcc tggcgaacag ttcggctggc 5820
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 5880
gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 5940
agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 6000
tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct 6060
tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc 6120
cgcgctgcct cgtcttgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 6180
accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 6240
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 6300
ccatcttgtt caatcatgcg aaacgatcct catcctgtct cttgatcaga tcttgatccc 6360
ctgcgccatc agatccttgg cggcaagaaa gccatccagt ttactttgca gggcttccca 6420
accttaccag agggcgcccc agctggcaat tccggttcgc ttgctgtcca taaaaccgcc 6480
cagtctagct atcgccatgt aagcccactg caagctacct gctttctctt tgcgcttgcg 6540
ttttcccttg tccagatagc ccagtagctg acattcatcc ggggtcagca ccgtttctgc 6600
ggactggctt tctacgtgaa aaggatctag gtgaagatcc tttttgataa tctcatgacc 6660
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 6720
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 6780
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 6840
actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 6900
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 6960
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 7020
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 7080
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 7140
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 7200
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 7260
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 7320
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatg 7377
<210> 8
<211> 8377
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
cgcgttgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240
tacatcaagt gtatcatatg ccaagtccgc cccctattga cgtcaatgac ggtaaatggc 300
ccgcctggca ttatgcccag tacatgacct tacgggactt tcctacttgg cagtacatct 360
acgtattagt catcgctatt accatggtga tgcggttttg gcagtacacc aatgggcgtg 420
gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 480
tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taataacccc gccccgttga 540
cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga 600
accgtcagat cgcctggaga cgccatccac gctgttttga cctccataga agacaccggg 660
accgatccag cctccgcggc cgggaacggt gcattggaac gcggattccc cgtgccaaga 720
gtgacgtaag taccgcctat agactctata ggcacacccc tttggctctt atgcatgcta 780
tactgttttt ggcttggggc ctatacaccc ccgcttcctt atgctatagg tgatggtata 840
gcttagccta taggtgtggg ttattgacca ttattgacca ctcccctatt ggtgacgata 900
ctttccatta ctaatccata acatggctct ttgccacaac tatctctatt ggctatatgc 960
caatactctg tccttcagag actgacacgg actctgtatt tttacaggat ggggtcccat 1020
ttattattta caaattcaca tatacaacaa cgccgtcccc cgtgcccgca gtttttatta 1080
aacatagcgt gggatctcca cgcgaatctc gggtacgtgt tccggacatg ggctcttctc 1140
cggtagcggc ggagcttcca catccgagcc ctggtcccat gcctccagcg gctcatggtc 1200
gctcggcagc tccttgctcc taacagtgga ggccagactt aggcacagca caatgcccac 1260
caccaccagt gtgccgcaca aggccgtggc ggtagggtat gtgtctgaaa atgagctcgg 1320
agattgggct cgcaccgctg acgcagatgg aagacttaag gcagcggcag aagaagatgc 1380
aggcagctga gttgttgtat tctgataaga gtcagaggta actcccgttg cggtgctgtt 1440
aacggtggag ggcagtgtag tctgagcagt actcgttgct gccgcgcgcg ccaccagaca 1500
taatagctga cagactaaca gactgttcct ttccatgggt cttttctgca gtcaccgtcc 1560
ttgacacgaa gcttgctagc accatgtggg tgaccaaact cctgccagcc ctgctgctgc 1620
agcatgtcct cctgcatctc ctcctgctcc ccatcgccat cccctatgca gagggacaaa 1680
ggaaaagaag aaatacaatt catgaattca aaaaatcagc aaagactacc ctaatcaaaa 1740
tagatccagc actgaagata aaaaccaaaa aagtgaatac tgcagaccaa tgtgctaata 1800
gatgtactag gaataaagga cttccattca cttgcaaggc ttttgttttt gataaagcaa 1860
gaaaacaatg cctctggttc cccttcaata gcatgtcaag tggagtgaaa aaagaatttg 1920
gccatgaatt tgacctctat gaaaacaaag actacattag aaactgcatc attggtaaag 1980
gacgcagcta caagggaaca gtatctatca ctaagagtgg catcaaatgt cagccctgga 2040
gttccatgat accacacgaa cacaggtaag aacagtatga agaaaagaga tgaagcctct 2100
gtctttttta catgttaaca gtctcatatt agtccttcag aataattcta caatcctaaa 2160
ataacttagc caacttgctg aattgtatta cggcaaggtt tatatgaatt catgactgat 2220
atttagcaaa tgattaatta atatgttaat aaaatgtagc caaaacaata tcttacctta 2280
atgcctcaat ttgtagatct cggtatttgt ggatcccttc ctttctacct gtatttgtcc 2340
taataaattg ttgacttatt aattcactac ttcctcacag cttttttttg gctttacaaa 2400
tccactggaa aggtatatgg gtgtatcact ttgtgtattt cggtgtgcat gtgtagaggg 2460
gacaaaaatc ctctctcaaa ctataaatat tgagtatttg tgtattgaac atttgctata 2520
actactaggt ttcttaaata atcttaatat ataaaatgat atagaaaaag ggaaattata 2580
gttcgtatta ttcatctaag tgaagagatt aaaacccagg gagtaaataa attgtctaag 2640
gactaaggtt gtatactatt taggtgatag atatggggca accgtatggg ttttatgatt 2700
aacaaataaa cttctcacca ctctaccata tcaacttttc cataaaagag agctatagta 2760
ttctttgctt aaataaattt gattagtgca tgacttcttg aaaacatata aagcaaaagt 2820
cacatttgat tctatcagaa aagtgagtaa gccatggccc aaacaaaaga tgcattaaaa 2880
tattctggaa tgatggagct aaaagtaaga aaaatgactt tttaaaaaag tttactgtta 2940
ggaattgtga aattatgctg aattttagtt gcattataat ttttgtcagt catacggtct 3000
gacaacctgt cttatttcta tttccccata tgaggaatgc tagttaagta tggatattaa 3060
ctattactac ttagatgcat tgaagttgca taatatggat aatacttcac tggttccctg 3120
aaaatgttta gttagtaata agtctcttac actatttgtt ttgtccaata atttatattt 3180
tctgaagact taactctaga atacactcat gtcaaaatga aagaatttca ttgcaaaata 3240
ttgcttggta catgacgcat acctgtattt gttttgtgtc acaacatgaa aaatgatggt 3300
ttattagaag tttcattggg taggaaacac atttgaatgg tatttactaa gatactaaaa 3360
tccttggact tcactctaat tttagtgcca tttagaactc aaggtctcag taaaagtaga 3420
aataaagcct gttaacaaaa cacaaactga atattaaaaa tgtaactgga ttttcaaaga 3480
aatgtttact ggtattacct gtagatgtat attctttatt atgatctttt gtgtaaagtc 3540
tggcagacaa atgcaatatc taattgttga gtccaatatc acaagcagta caaaagtata 3600
aaaaagactt ggccttttct aatgtgttaa aatactttat gctggtaata acactaagag 3660
tagggcacta gaaattttaa gtgaagataa tgtgttgcag ttactgcact caatggctta 3720
ctattataaa ccaaaactgg gatcactaag ctccagtcag tcaaaatgat caaaattatt 3780
gaagagaata agcaattctg ttctttatta ggacacagta gatacagact acaaagtgga 3840
gtgtgcttaa taagaggtag catttgttaa gtgtcaatta ctctattatc ccttggagct 3900
tctcaaaata accatataag gtgtaagatg ttaaaggtta tggttacact cagtgcacag 3960
gtaagctaat aggctgagag aagctaaatt acttactggg gtctcacagt aagaaagtga 4020
gctgaagttt cagcccagat ttaactggat tctgggctct ttattcatgt tacttcatga 4080
atctgtttct caattgtgca gaaaaaaggg ggctatttat aagaaaagca ataaacaaac 4140
aagtaatgat ctcaaataag taatgcaaga aatagtgaga tttcaaaatc agtggcagcg 4200
atttctcagt tctgtcctaa gtggccttgc tcaatcacct gctatctttt agtggagctt 4260
tgaaattatg tttcagacaa cttcgattca gttctagaat gtttgactca gcaaattcac 4320
aggctcatct ttctaacttg atggtgaata tggaaattca gctaaatgga tgttaataaa 4380
attcaaacgt tttaaggaca gatggaaatg acagaatttt aaggtaaaat atatgaagga 4440
atataagata aaggattttt ctaccttcag caaaaacata cccactaatt agtaaaatta 4500
ataggcgaaa aaaagttgca tgctcttata ctgtaatgat tatcatttta aaactagctt 4560
tttgccttcg agctatcggg gtaaagacct acaggaaaac tactgtcgaa atcctcgagg 4620
ggaagaaggg ggaccctggt gtttcacaag caatccagag gtacgctacg aagtctgtga 4680
cattcctcag tgttcagaag ttgaatgcat gacctgcaat ggggagagtt atcgaggtct 4740
catggatcat acagaatcag gcaagatttg tcagcgctgg gatcatcaga caccacaccg 4800
gcacaaattc ttgcctgaaa gatatcccga caagggcttt gatgataatt attgccgcaa 4860
tcccgatggc cagccgaggc catggtgcta tactcttgac cctcacaccc gctgggagta 4920
ctgtgcaatt aaaacatgcg ctgacaatac tatgaatgac actgatgttc ctttggaaac 4980
aactgaatgc atccaaggtc aaggagaagg ctacaggggc actgtcaata ccatttggaa 5040
tggaattcca tgtcagcgtt gggattctca gtatcctcac gagcatgaca tgactcctga 5100
aaatttcaag tgcaaggacc tacgagaaaa ttactgccga aatccagatg ggtctgaatc 5160
accctggtgt tttaccactg atccaaacat ccgagttggc tactgctccc aaattccaaa 5220
ctgtgatatg tcacatggac aagattgtta tcgtgggaat ggcaaaaatt atatgggcaa 5280
cttatcccaa acaagatctg gactaacatg ttcaatgtgg gacaagaaca tggaagactt 5340
acatcgtcat atcttctggg aaccagatgc aagtaagctg aatgagaatt actgccgaaa 5400
tccagatgat gatgctcatg gaccctggtg ctacacggga aatccactca ttccttggga 5460
ttattgccct atttctcgtt gtgaaggtga taccacacct acaatagtca atttagacca 5520
tcccgtaata tcttgtgcca aaacgaaaca attgcgagtt gtaaatggga ttccaacacg 5580
aacaaacata ggatggatgg ttagtttgag atacagaaat aaacatatct gcggaggatc 5640
attgataaag gagagttggg ttcttactgc acgacagtgt ttcccttctc gagacttgaa 5700
agattatgaa gcttggcttg gaattcatga tgtccacgga agaggagatg agaaatgcaa 5760
acaggttctc aatgtttccc agctggtata tggccctgaa ggatcagatc tggttttaat 5820
gaagcttgcc aggcctgctg tcctggatga ttttgttagt acgattgatt tacctaatta 5880
tggatgcaca attcctgaaa agaccagttg cagtgtttat ggctggggct acactggatt 5940
gatcaactat gatggcctat tacgagtggc acatctctat ataatgggaa atgagaaatg 6000
cagccagcat catcgaggga aggtgactct gaatgagtct gaaatatgtg ctggggctga 6060
aaagattgga tcaggaccat gtgaggggga ttatggtggc ccacttgttt gtgagcaaca 6120
taaaatgaga atggttcttg gtgtcattgt tcctggtcgt ggatgtgcca ttccaaatcg 6180
tcctggtatt tttgtccgag tagcatatta tgcaaaatgg atacacaaaa ttattttaac 6240
atataaggta ccacagtcat agcggccgct ctagagggcc cgtttaaacc cgctgatcag 6300
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 6360
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 6420
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 6480
aggattggga agacaatagc aggcatgctg gggagtcgaa attcagaaga actcgtcaag 6540
aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg ataccgtaaa gcacgaggaa 6600
gcggtcagcc cattcgccgc caagctcttc agcaatatca cgggtagcca acgctatgtc 6660
ctgatagcgg tccgccacac ccagccggcc acagtcgatg aatccagaaa agcggccatt 6720
ttccaccatg atattcggca agcaggcatc gccatgggtc acgacgagat cctcgccgtc 6780
gggcatgctc gccttgagcc tggcgaacag ttcggctggc gcgagcccct gatgctcttc 6840
gtccagatca tcctgatcga caagaccggc ttccatccga gtacgtgctc gctcgatgcg 6900
atgtttcgct tggtggtcga atgggcaggt agccggatca agcgtatgca gccgccgcat 6960
tgcatcagcc atgatggata ctttctcggc aggagcaagg tgagatgaca ggagatcctg 7020
ccccggcact tcgcccaata gcagccagtc ccttcccgct tcagtgacaa cgtcgagcac 7080
agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc cgcgctgcct cgtcttgcag 7140
ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga accgggcgcc cctgcgctga 7200
cagccggaac acggcggcat cagagcagcc gattgtctgt tgtgcccagt catagccgaa 7260
tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat ccatcttgtt caatcatgcg 7320
aaacgatcct catcctgtct cttgatcaga tcttgatccc ctgcgccatc agatccttgg 7380
cggcaagaaa gccatccagt ttactttgca gggcttccca accttaccag agggcgcccc 7440
agctggcaat tccggttcgc ttgctgtcca taaaaccgcc cagtctagct atcgccatgt 7500
aagcccactg caagctacct gctttctctt tgcgcttgcg ttttcccttg tccagatagc 7560
ccagtagctg acattcatcc ggggtcagca ccgtttctgc ggactggctt tctacgtgaa 7620
aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 7680
ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 7740
ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 7800
tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 7860
gataccaaat actgttcttc tagtgtagcc gtagttaggc caccacttca agaactctgt 7920
agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 7980
taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 8040
gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 8100
gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 8160
caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 8220
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 8280
tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 8340
acggttcctg gccttttgct ggccttttgc tcacatg 8377
<210> 9
<211> 4926
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gtaagaacag tatgaagaaa agagatgaag cctctgtctt ttttacatgt taacagtctc 60
atattagtcc ttcagaataa ttctacaatc ctaaaataac ttagccaact tgctgaattg 120
tattacggca aggtttatat gaattcatga ctgatattta gcaaatgatt aattaatatg 180
ttaataaaat gtagccaaaa caatatctta ccttaatgcc tcaatttgta gatctcggta 240
tttgtgaaat aataacgtaa acttcgttta aaaggattct tcttcctgtc tttgagaaag 300
tacggcactg tgcaggggga gaggttgatt gtgaaaaatc agaggtagat gagaatctta 360
ctgagggctg agggttcttt aaccttggtg gatctcaaca ttggttgcac attaaaatca 420
cctgctgcaa gcccttgacg aatcttactt agaagatgac aacacagaac aattaaatca 480
gaatctctgg ggagaatagg gcaccagtat tttttgagct cccaccatga ttccaaagtg 540
cagccaaatt tgagaaccac tgctaaaagc tcaagcttca gattgaccag cttttccatc 600
tcacctatcg cctaaagacc aaattggata aatgtgttca ttacgacaga tgggtactat 660
ttaaagatga gtaaacacaa tatacttagg ctcgtcagac tgagagtttt aatcatcact 720
gaggaaaaac atagatatct aatactgact ggagtattag tcaaggctta tttcacacac 780
aattttatca gaaaccaaag tagtttaaaa cagctctccc cttattagta atgcattgga 840
gggtttactt taccatgtac cttgctgagc actgtacctt gttaatctca tttacttgta 900
atgagaacca cacagcgggt agttttattg gttctatttt acctacatga caaaactgaa 960
gcataaaaac acttagtaag ttttcagtgt catgcacaac taggaagtga catggccaga 1020
atataagccc agtcaccatc actctataac ctgcgctttt aacaacttca gggcatgaca 1080
catttggccg gtcagtagaa cccatgctgt gatttgtttt tgcagtggtg gtgatgactg 1140
ccttgttgaa tccacttttt attctattcc attttgggga cacaattctg caagatgatt 1200
cttcattagg aaacagagat gagttattga ccaacacaga aagaaaaaga gtttgttgct 1260
ccacactggg attaaaccta tgatcttggc ctaattaaca ctagctagta agtgtccaag 1320
ctgatcatct ctacaacatt tcaataacag aaaacaacaa ttttcaaaat tagttactta 1380
caattatgta gaaatgcctc taaaacacag tattttcctt atattacaaa aacaaaaatt 1440
ataattggtt ttgtcctctt ttgagagttt gcatggtgtt actccctgca tagtgaagaa 1500
aacattttat ttaagtagat ggatctaagt ttttcatgaa caaaggaatg acatttgaaa 1560
tcaatcctac cctagtccag gagaatgcat tagattaacc tagtagaggt cttatttcac 1620
cctgagtttt ctatgatcgt gattctctgc tggaggagta attgtgaaat agatctctct 1680
gggaactggc ttcctagtcc aatcagctct tttaccaatg aacacttcct tgtgatatag 1740
atgtttatgg ccgagaggat ccagtatatt aataaaatcc ctttttgtat tcaatgaggg 1800
aaacacataa ttttcatcaa ttagcagctt attggaatat ctgcatgatg gtttaacact 1860
tttaagtgtt gactaaagat taattttaca gaaaatagaa aaagaaatat gtttctgtct 1920
ggaggaatga tttattgttg acccctaaat tgaaatattt tactagtggc ttaatggaaa 1980
gatgatgaaa gatgatgaaa ttaatgtaga agcttaacta gaaaatcagg tgacctgata 2040
tctacatctg tatccttcat tggccaccca gcattcatta atgaatcaga tgatggaata 2100
gatcaagttt cctaggaaca cagtgaatat taaaagaaaa caaagggagc ctagcaccta 2160
gaagacctag tttatatttc aaagtatatt tggatgtaac ccaattttaa acatttcctc 2220
acttgtctct cttaaagcct tgccaacagc aaggacagag aaccaaaaat agtgtatata 2280
tgaataaatg cttattacag aatctgctga ctggcacatg ctttgtgtgt aatgggttct 2340
cataaacact tgttgaatga acacacataa gtgaaagagc atggctaggc ttcatccctt 2400
ggtcaaatat ggggtgctaa agaaaagcag gggaaataca ttgggacact aacaaaaaaa 2460
aacagttaat ttaggtaaaa gataaaatac accacagaat gaagaaaaga gatgacccag 2520
actgctcttt aaccttcatg tcctagagag gtttttgata tgaattgcat tcagaattgt 2580
ggaaaggagc ccatcttttc tcttcatttt gattttatta actccaatgg gggaatttta 2640
ttcgtgtttt ggccatatct acttttgatt tctacattat tctctcttcc tttctacctg 2700
tatttgtcct aataaattgt tgacttatta attcactact tcctcacagc ttttttttgg 2760
ctttacaaat ccactggaaa ggtatatggg tgtatcactt tgtgtatttc ggtgtgcatg 2820
tgtagagggg acaaaaatcc tctctcaaac tataaatatt gagtatttgt gtattgaaca 2880
tttgctataa ctactaggtt tcttaaataa tcttaatata taaaatgata tagaaaaagg 2940
gaaattatag ttcgtattat tcatctaagt gaagagatta aaacccaggg agtaaataaa 3000
ttgtctaagg actaaggttg tatactattt aggtgataga tatggggcaa ccgtatgggt 3060
tttatgatta acaaataaac ttctcaccac tctaccatat caacttttcc ataaaagaga 3120
gctatagtat tctttgctta aataaatttg attagtgcat gacttcttga aaacatataa 3180
agcaaaagtc acatttgatt ctatcagaaa agtgagtaag ccatggccca aacaaaagat 3240
gcattaaaat attctggaat gatggagcta aaagtaagaa aaatgacttt ttaaaaaagt 3300
ttactgttag gaattgtgaa attatgctga attttagttg cattataatt tttgtcagtc 3360
atacggtctg acaacctgtc ttatttctat ttccccatat gaggaatgct agttaagtat 3420
ggatattaac tattactact tagatgcatt gaagttgcat aatatggata atacttcact 3480
ggttccctga aaatgtttag ttagtaataa gtctcttaca ctatttgttt tgtccaataa 3540
tttatatttt ctgaagactt aactctagaa tacactcatg tcaaaatgaa agaatttcat 3600
tgcaaaatat tgcttggtac atgacgcata cctgtatttg ttttgtgtca caacatgaaa 3660
aatgatggtt tattagaagt ttcattgggt aggaaacaca tttgaatggt atttactaag 3720
atactaaaat ccttggactt cactctaatt ttagtgccat ttagaactca aggtctcagt 3780
aaaagtagaa ataaagcctg ttaacaaaac acaaactgaa tattaaaaat gtaactggat 3840
tttcaaagaa atgtttactg gtattacctg tagatgtata ttctttatta tgatcttttg 3900
tgtaaagtct ggcagacaaa tgcaatatct aattgttgag tccaatatca caagcagtac 3960
aaaagtataa aaaagacttg gccttttcta atgtgttaaa atactttatg ctggtaataa 4020
cactaagagt agggcactag aaattttaag tgaagataat gtgttgcagt tactgcactc 4080
aatggcttac tattataaac caaaactggg atcactaagc tccagtcagt caaaatgatc 4140
aaaattattg aagagaataa gcaattctgt tctttattag gacacagtag atacagacta 4200
caaagtggag tgtgcttaat aagaggtagc atttgttaag tgtcaattac tctattatcc 4260
cttggagctt ctcaaaataa ccatataagg tgtaagatgt taaaggttat ggttacactc 4320
agtgcacagg taagctaata ggctgagaga agctaaatta cttactgggg tctcacagta 4380
agaaagtgag ctgaagtttc agcccagatt taactggatt ctgggctctt tattcatgtt 4440
acttcatgaa tctgtttctc aattgtgcag aaaaaagggg gctatttata agaaaagcaa 4500
taaacaaaca agtaatgatc tcaaataagt aatgcaagaa atagtgagat ttcaaaatca 4560
gtggcagcga tttctcagtt ctgtcctaag tggccttgct caatcacctg ctatctttta 4620
gtggagcttt gaaattatgt ttcagacaac ttcgattcag ttctagaatg tttgactcag 4680
caaattcaca ggctcatctt tctaacttga tggtgaatat ggaaattcag ctaaatggat 4740
gttaataaaa ttcaaacgtt ttaaggacag atggaaatga cagaatttta aggtaaaata 4800
tatgaaggaa tataagataa aggatttttc taccttcagc aaaaacatac ccactaatta 4860
gtaaaattaa taggcgaaaa aaagttgcat gctcttatac tgtaatgatt atcattttaa 4920
aactag 4926
<210> 10
<211> 1492
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gtaagaacag tatgaagaaa agagatgaag cctctgtctt ttttacatgt taacagtctc 60
atattagtcc ttcagaataa ttctacaatc ctaaaataac ttagccaact tgctgaattg 120
tattacggca aggtttatat gaattcatga ctgatattta gcaaatgatt aattaatatg 180
ttaataaaat gtagccaaaa caatatctta ccttaatgcc tcaatttgta gatctcggta 240
tttgtggatc ctgggtagga aacacatttg aatggtattt actaagatac taaaatcctt 300
ggacttcact ctaattttag tgccatttag aactcaaggt ctcagtaaaa gtagaaataa 360
agcctgttaa caaaacacaa actgaatatt aaaaatgtaa ctggattttc aaagaaatgt 420
ttactggtat tacctgtaga tgtatattct ttattatgat cttttgtgta aagtctggca 480
gacaaatgca atatctaatt gttgagtcca atatcacaag cagtacaaaa gtataaaaaa 540
gacttggcct tttctaatgt gttaaaatac tttatgctgg taataacact aagagtaggg 600
cactagaaat tttaagtgaa gataatgtgt tgcagttact gcactcaatg gcttactatt 660
ataaaccaaa actgggatca ctaagctcca gtcagtcaaa atgatcaaaa ttattgaaga 720
gaataagcaa ttctgttctt tattaggaca cagtagatac agactacaaa gtggagtgtg 780
cttaataaga ggtagcattt gttaagtgtc aattactcta ttatcccttg gagcttctca 840
aaataaccat ataaggtgta agatgttaaa ggttatggtt acactcagtg cacaggtaag 900
ctaataggct gagagaagct aaattactta ctggggtctc acagtaagaa agtgagctga 960
agtttcagcc cagatttaac tggattctgg gctctttatt catgttactt catgaatctg 1020
tttctcaatt gtgcagaaaa aagggggcta tttataagaa aagcaataaa caaacaagta 1080
atgatctcaa ataagtaatg caagaaatag tgagatttca aaatcagtgg cagcgatttc 1140
tcagttctgt cctaagtggc cttgctcaat cacctgctat cttttagtgg agctttgaaa 1200
ttatgtttca gacaacttcg attcagttct agaatgtttg actcagcaaa ttcacaggct 1260
catctttcta acttgatggt gaatatggaa attcagctaa atggatgtta ataaaattca 1320
aacgttttaa ggacagatgg aaatgacaga attttaaggt aaaatatatg aaggaatata 1380
agataaagga tttttctacc ttcagcaaaa acatacccac taattagtaa aattaatagg 1440
cgaaaaaaag ttgcatgctc ttatactgta atgattatca ttttaaaact ag 1492
<210> 11
<211> 2492
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gtaagaacag tatgaagaaa agagatgaag cctctgtctt ttttacatgt taacagtctc 60
atattagtcc ttcagaataa ttctacaatc ctaaaataac ttagccaact tgctgaattg 120
tattacggca aggtttatat gaattcatga ctgatattta gcaaatgatt aattaatatg 180
ttaataaaat gtagccaaaa caatatctta ccttaatgcc tcaatttgta gatctcggta 240
tttgtggatc ccttcctttc tacctgtatt tgtcctaata aattgttgac ttattaattc 300
actacttcct cacagctttt ttttggcttt acaaatccac tggaaaggta tatgggtgta 360
tcactttgtg tatttcggtg tgcatgtgta gaggggacaa aaatcctctc tcaaactata 420
aatattgagt atttgtgtat tgaacatttg ctataactac taggtttctt aaataatctt 480
aatatataaa atgatataga aaaagggaaa ttatagttcg tattattcat ctaagtgaag 540
agattaaaac ccagggagta aataaattgt ctaaggacta aggttgtata ctatttaggt 600
gatagatatg gggcaaccgt atgggtttta tgattaacaa ataaacttct caccactcta 660
ccatatcaac ttttccataa aagagagcta tagtattctt tgcttaaata aatttgatta 720
gtgcatgact tcttgaaaac atataaagca aaagtcacat ttgattctat cagaaaagtg 780
agtaagccat ggcccaaaca aaagatgcat taaaatattc tggaatgatg gagctaaaag 840
taagaaaaat gactttttaa aaaagtttac tgttaggaat tgtgaaatta tgctgaattt 900
tagttgcatt ataatttttg tcagtcatac ggtctgacaa cctgtcttat ttctatttcc 960
ccatatgagg aatgctagtt aagtatggat attaactatt actacttaga tgcattgaag 1020
ttgcataata tggataatac ttcactggtt ccctgaaaat gtttagttag taataagtct 1080
cttacactat ttgttttgtc caataattta tattttctga agacttaact ctagaataca 1140
ctcatgtcaa aatgaaagaa tttcattgca aaatattgct tggtacatga cgcatacctg 1200
tatttgtttt gtgtcacaac atgaaaaatg atggtttatt agaagtttca ttgggtagga 1260
aacacatttg aatggtattt actaagatac taaaatcctt ggacttcact ctaattttag 1320
tgccatttag aactcaaggt ctcagtaaaa gtagaaataa agcctgttaa caaaacacaa 1380
actgaatatt aaaaatgtaa ctggattttc aaagaaatgt ttactggtat tacctgtaga 1440
tgtatattct ttattatgat cttttgtgta aagtctggca gacaaatgca atatctaatt 1500
gttgagtcca atatcacaag cagtacaaaa gtataaaaaa gacttggcct tttctaatgt 1560
gttaaaatac tttatgctgg taataacact aagagtaggg cactagaaat tttaagtgaa 1620
gataatgtgt tgcagttact gcactcaatg gcttactatt ataaaccaaa actgggatca 1680
ctaagctcca gtcagtcaaa atgatcaaaa ttattgaaga gaataagcaa ttctgttctt 1740
tattaggaca cagtagatac agactacaaa gtggagtgtg cttaataaga ggtagcattt 1800
gttaagtgtc aattactcta ttatcccttg gagcttctca aaataaccat ataaggtgta 1860
agatgttaaa ggttatggtt acactcagtg cacaggtaag ctaataggct gagagaagct 1920
aaattactta ctggggtctc acagtaagaa agtgagctga agtttcagcc cagatttaac 1980
tggattctgg gctctttatt catgttactt catgaatctg tttctcaatt gtgcagaaaa 2040
aagggggcta tttataagaa aagcaataaa caaacaagta atgatctcaa ataagtaatg 2100
caagaaatag tgagatttca aaatcagtgg cagcgatttc tcagttctgt cctaagtggc 2160
cttgctcaat cacctgctat cttttagtgg agctttgaaa ttatgtttca gacaacttcg 2220
attcagttct agaatgtttg actcagcaaa ttcacaggct catctttcta acttgatggt 2280
gaatatggaa attcagctaa atggatgtta ataaaattca aacgttttaa ggacagatgg 2340
aaatgacaga attttaaggt aaaatatatg aaggaatata agataaagga tttttctacc 2400
ttcagcaaaa acatacccac taattagtaa aattaatagg cgaaaaaaag ttgcatgctc 2460
ttatactgta atgattatca ttttaaaact ag 2492
<210> 12
<211> 728
<212> PRT
<213> 智人(Homo sapiens)
<400> 12
Met Trp Val Thr Lys Leu Leu Pro Ala Leu Leu Leu Gln His Val Leu
1 5 10 15
Leu His Leu Leu Leu Leu Pro Ile Ala Ile Pro Tyr Ala Glu Gly Gln
20 25 30
Arg Lys Arg Arg Asn Thr Ile His Glu Phe Lys Lys Ser Ala Lys Thr
35 40 45
Thr Leu Ile Lys Ile Asp Pro Ala Leu Lys Ile Lys Thr Lys Lys Val
50 55 60
Asn Thr Ala Asp Gln Cys Ala Asn Arg Cys Thr Arg Asn Lys Gly Leu
65 70 75 80
Pro Phe Thr Cys Lys Ala Phe Val Phe Asp Lys Ala Arg Lys Gln Cys
85 90 95
Leu Trp Phe Pro Phe Asn Ser Met Ser Ser Gly Val Lys Lys Glu Phe
100 105 110
Gly His Glu Phe Asp Leu Tyr Glu Asn Lys Asp Tyr Ile Arg Asn Cys
115 120 125
Ile Ile Gly Lys Gly Arg Ser Tyr Lys Gly Thr Val Ser Ile Thr Lys
130 135 140
Ser Gly Ile Lys Cys Gln Pro Trp Ser Ser Met Ile Pro His Glu His
145 150 155 160
Ser Phe Leu Pro Ser Ser Tyr Arg Gly Lys Asp Leu Gln Glu Asn Tyr
165 170 175
Cys Arg Asn Pro Arg Gly Glu Glu Gly Gly Pro Trp Cys Phe Thr Ser
180 185 190
Asn Pro Glu Val Arg Tyr Glu Val Cys Asp Ile Pro Gln Cys Ser Glu
195 200 205
Val Glu Cys Met Thr Cys Asn Gly Glu Ser Tyr Arg Gly Leu Met Asp
210 215 220
His Thr Glu Ser Gly Lys Ile Cys Gln Arg Trp Asp His Gln Thr Pro
225 230 235 240
His Arg His Lys Phe Leu Pro Glu Arg Tyr Pro Asp Lys Gly Phe Asp
245 250 255
Asp Asn Tyr Cys Arg Asn Pro Asp Gly Gln Pro Arg Pro Trp Cys Tyr
260 265 270
Thr Leu Asp Pro His Thr Arg Trp Glu Tyr Cys Ala Ile Lys Thr Cys
275 280 285
Ala Asp Asn Thr Met Asn Asp Thr Asp Val Pro Leu Glu Thr Thr Glu
290 295 300
Cys Ile Gln Gly Gln Gly Glu Gly Tyr Arg Gly Thr Val Asn Thr Ile
305 310 315 320
Trp Asn Gly Ile Pro Cys Gln Arg Trp Asp Ser Gln Tyr Pro His Glu
325 330 335
His Asp Met Thr Pro Glu Asn Phe Lys Cys Lys Asp Leu Arg Glu Asn
340 345 350
Tyr Cys Arg Asn Pro Asp Gly Ser Glu Ser Pro Trp Cys Phe Thr Thr
355 360 365
Asp Pro Asn Ile Arg Val Gly Tyr Cys Ser Gln Ile Pro Asn Cys Asp
370 375 380
Met Ser His Gly Gln Asp Cys Tyr Arg Gly Asn Gly Lys Asn Tyr Met
385 390 395 400
Gly Asn Leu Ser Gln Thr Arg Ser Gly Leu Thr Cys Ser Met Trp Asp
405 410 415
Lys Asn Met Glu Asp Leu His Arg His Ile Phe Trp Glu Pro Asp Ala
420 425 430
Ser Lys Leu Asn Glu Asn Tyr Cys Arg Asn Pro Asp Asp Asp Ala His
435 440 445
Gly Pro Trp Cys Tyr Thr Gly Asn Pro Leu Ile Pro Trp Asp Tyr Cys
450 455 460
Pro Ile Ser Arg Cys Glu Gly Asp Thr Thr Pro Thr Ile Val Asn Leu
465 470 475 480
Asp His Pro Val Ile Ser Cys Ala Lys Thr Lys Gln Leu Arg Val Val
485 490 495
Asn Gly Ile Pro Thr Arg Thr Asn Ile Gly Trp Met Val Ser Leu Arg
500 505 510
Tyr Arg Asn Lys His Ile Cys Gly Gly Ser Leu Ile Lys Glu Ser Trp
515 520 525
Val Leu Thr Ala Arg Gln Cys Phe Pro Ser Arg Asp Leu Lys Asp Tyr
530 535 540
Glu Ala Trp Leu Gly Ile His Asp Val His Gly Arg Gly Asp Glu Lys
545 550 555 560
Cys Lys Gln Val Leu Asn Val Ser Gln Leu Val Tyr Gly Pro Glu Gly
565 570 575
Ser Asp Leu Val Leu Met Lys Leu Ala Arg Pro Ala Val Leu Asp Asp
580 585 590
Phe Val Ser Thr Ile Asp Leu Pro Asn Tyr Gly Cys Thr Ile Pro Glu
595 600 605
Lys Thr Ser Cys Ser Val Tyr Gly Trp Gly Tyr Thr Gly Leu Ile Asn
610 615 620
Tyr Asp Gly Leu Leu Arg Val Ala His Leu Tyr Ile Met Gly Asn Glu
625 630 635 640
Lys Cys Ser Gln His His Arg Gly Lys Val Thr Leu Asn Glu Ser Glu
645 650 655
Ile Cys Ala Gly Ala Glu Lys Ile Gly Ser Gly Pro Cys Glu Gly Asp
660 665 670
Tyr Gly Gly Pro Leu Val Cys Glu Gln His Lys Met Arg Met Val Leu
675 680 685
Gly Val Ile Val Pro Gly Arg Gly Cys Ala Ile Pro Asn Arg Pro Gly
690 695 700
Ile Phe Val Arg Val Ala Tyr Tyr Ala Lys Trp Ile His Lys Ile Ile
705 710 715 720
Leu Thr Tyr Lys Val Pro Gln Ser
725
<210> 13
<211> 5
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gatcc 5