用于表达大型核酸转基因的质粒载体

文档序号:1676647 发布日期:2019-12-31 浏览:37次 >En<

阅读说明:本技术 用于表达大型核酸转基因的质粒载体 (Plasmid vectors for expression of large nucleic acid transgenes ) 是由 D·基维利希 于 2017-11-02 设计创作,主要内容包括:在某些实施例中,本文提供了质粒表达载体以及使用这种载体进行真核细胞中的转基因的瞬时或稳定整合表达的方法。本文提供的质粒表达载体的大小小于3.6kb并且可以容纳转基因和同源臂的大型(&gt;5kb)多核苷酸插入以实现稳定整合。(In certain embodiments, provided herein are plasmid expression vectors and methods of using such vectors for transient or stable integrated expression of transgenes in eukaryotic cells. The plasmid expression vectors provided herein are less than 3.6kb in size and can accommodate large (&gt;5kb) polynucleotide insertions of the transgene and homology arms for stable integration.)

用于表达大型核酸转基因的质粒载体

相关申请的交叉引用

本申请要求于2016年11月2日提交的美国临时申请号62/416,617的优先权,所述美国临时申请的公开内容出于所有目的整体并入本文。

对“序列表”、表格或在光盘上提交的计算机程序列表附录的引用

写入创建于2017年11月2日、字节数为137,811、机器格式为IBM-PC、采用MS-Windows操作系统的文件888888-888001WO_ST25.TXT中的序列表出于所有目的通过引用整体并入本文。

背景技术

用于表达转基因的现有质粒载体容纳大型核酸***的能力有限。目前,如pcDNA3(英杰公司(InVitrogen))等用于真核基因表达的标准质粒载体的大小相对较大,约5.5千碱基或更大。将大型转基因(>5kb)***到这些载体中会对载体的性能,包含细菌转化效率、载体的增殖和基因表达产生负面影响。质粒载体的大小限制限制了它们在基因疗法和基因置换应用中的使用。鉴于此,已经开发了可以容纳大型***物的某些病毒载体系统。然而,病毒载体带有病毒感染和病毒基因不期望地整合到宿主基因组中的相关风险。另外,病毒载体仍然必须在细菌中进行组装,这由于产生效率降低而限制了***物大小。因此,需要合适且安全的真核表达载体。

发明内容

在某些实施例中,本文提供了质粒表达载体、所述质粒表达载体的组分以及使用这种载体进行真核细胞中的转基因的瞬时或稳定整合表达的方法。通过在指定的同源臂***位点处***同源臂,所述质粒表达载体可以允许随机整合和靶向整合二者。本文提供的质粒表达载体的大小小于3.6kb并且可以容纳转基因和同源臂的大型(例如,大于5kb)多核苷酸***以实现稳定整合。

在某些实施例中,本文提供了质粒载体,所述质粒载体包括:(a)原核复制起点;(b)适合于表达一个或多个转基因的真核启动子;(c)用于***所述一个或多个转基因的多克隆位点;以及(d)编码可选择标志物的核酸,所述核酸可操作地连接到真核启动子和原核启动子,其中所述可选择标志物适合于原核选择和真核选择二者;其中所述载体的长度不大于约或3.6千碱基。

在某些实施例中,所述质粒载体包含:(a)原核复制起点;(b)适合于表达一个或多个转基因的真核启动子;(c)用于***所述一个或多个转基因的多克隆位点;以及(d)编码可选择标志物的核酸,所述核酸可操作地连接到包含真核启动子和原核启动子的双启动子,其中所述可选择标志物适合于原核选择和真核选择二者;其中所述载体的长度不大于3.6千碱基。

在一些实施例中,所述质粒载体的长度为2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5或3.6千碱基。在一些实施例中,元件(a)-(d)在所述质粒的5到3方向上顺序布置。在一些实施例中,所述质粒载体进一步包括位于原核复制起点与所述真核启动子之间的上游同源臂***位点并且进一步包括下游同源臂***位点。在一些实施例中,所述下游同源臂***位点位于编码可选择标志物的核酸之后但在所述复制起点之前。在一些实施例中,所述质粒载体进一步包括处于所述真核启动子与所述多克隆位点之间的合成剪接位点,所述合成剪接位点增强从所述真核启动子转录的RNA的稳定性。在一些实施例中,所述质粒载体进一步包括所述多克隆位点之后的poly A序列。在一些实施例中,所述质粒载体进一步包括用于体外表达所述一个或多个转基因的处于所述多克隆位点上游的另外的启动子。在一些实施例中,用于体外表达的所述另外的启动子是T7启动子。在一些实施例中,所述复制起点选自由以下组成的组:pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101和pC101p-157。在一些实施例中,所述复制起点是pBR322Ori。在一些实施例中,用于表达所述转基因的所述真核启动子选自由以下组成的组:巨细胞病毒(CMV)启动子;来自人、鼠或鸡的β-肌动蛋白基因的启动子;泛素C基因的启动子;和来自疱疹病毒的胸苷激酶基因的启动子。在一些实施例中,(b)的所述真核启动子是巨细胞病毒(CMV)启动子。在一些实施例中,所述可选择标志物选自由抗生素抗性基因、荧光蛋白和酶组成的组。在一些实施例中,所述可选择标志物是抗生素抗性基因。在一些实施例中,所述可选择标志物是杀稻瘟菌素S脱氨酶。在一些实施例中,所述可选择标志物是荧光蛋白。在一些实施例中,所述荧光蛋白是近红外荧光蛋白。在一些实施例中,编码所述可选择标志物的所述核酸可操作地连接到SV40启动子。在一些实施例中,编码所述可选择标志物的所述核酸可操作地连接到EM7启动子。在一些实施例中,所述多克隆位点包括SEQ ID NO:2的核苷酸1427到1479中列出的序列。在一些实施例中,所述上游同源臂***位点包括SEQ ID NO:2的核苷酸311到336中列出的序列。在一些实施例中,所述下游同源臂***位点包括SEQ ID NO:2的核苷酸2960到2985中列出的序列。在一些实施例中,所述载体具有SEQ ID NO:2中列出的核苷酸序列。在一些实施例中,所述质粒载体进一步包括***在所述多克隆位点处的转基因。在一些实施例中,所述转基因编码治疗性蛋白质或治疗性RNA。在一些实施例中,所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。在一些实施例中,所述转基因核酸的长度范围为约5kb到300kb。

在一些实施例中,本文提供了用于基因表达的方法。在一些实施例中,所述方法包括:用本文提供的质粒载体转染真核细胞,所述质粒载体进一步包括***在所述多克隆位点处的转基因;以及在适合于所述转基因表达的条件下培养所述细胞。

在某些实施例中,本文也提供了用于修饰哺乳动物细胞中的靶基因组基因座的方法,所述方法包括:(a)将以下引入到哺乳动物细胞中:(i)核酸酶试剂,所述核酸酶试剂在靶基因组基因座处或附近产生单链或双链断裂,以及(ii)本文提供的质粒载体,所述质粒载体进一步包括***在所述多克隆位点处的转基因,所述多克隆位点处于***在所述上游同源臂***位点处的上游同源臂和***在所述下游同源臂处的下游同源臂的侧翼;以及(b)选择包括所述靶基因组基因座上的所述转基因的靶向哺乳动物细胞。在一些实施例中,所述细胞通过检测所述可选择标志物来选择。在一些实施例中,所述哺乳动物细胞是多能细胞。在一些实施例中,所述多能细胞是诱导多能干(iPS)细胞、胚胎干(ES)细胞、成体干细胞、造血干细胞、神经元干细胞。在一些实施例中,所述哺乳动物细胞是人成纤维细胞。在一些实施例中,所述哺乳动物细胞是人胚肾细胞(HEK)293。在一些实施例中,所述哺乳动物细胞是从患有疾病的患者分离的人细胞,并且其中所述人细胞在其基因组中包括至少一种人类疾病等位基因。在一些实施例中,所述哺乳动物细胞是中国仓鼠卵巢(CHO)细胞。在一些实施例中,所述哺乳动物细胞是永生化的非洲绿猴(COS)细胞。在一些实施例中,将所述转基因整合到所述靶基因组基因座中代替所述基因组中的所述至少一种人类疾病等位基因。在一些实施例中,所述核酸酶试剂是表达构建体,所述表达构建体包括编码核酸酶的核酸序列,并且其中所述核酸可操作地连接到在所述哺乳动物细胞中具有活性的启动子。在一些实施例中,所述核酸酶试剂是编码核酸酶的mRNA。在一些实施例中,所述核酸酶是锌指核酸酶(ZFN)。在一些实施例中,所述核酸酶是类转录激活因子效应物核酸酶(TALEN)。在一些实施例中,所述核酸酶是大范围核酸酶。在一些实施例中,所述核酸酶是Cas9核酸酶。在一些实施例中,所述核酸酶试剂的靶序列位于所述靶基因组基因座中的内含子、外显子、启动子、启动子调节区或增强子区中。在一些实施例中,所述靶序列是AAV1整合位点。在一些实施例中,用于整合所述转基因的所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。在一些实施例中,所整合的所述转基因核酸的长度范围为约5kb到300kb。

在一些实施例中,本文提供的质粒载体选自pDK、pDK 9-1、pDK9-2和pDK9-3_Puro、pDK9-3_Neo。在一些实施例中,本文提供的质粒载体包括转基因。在一些实施例中,所述质粒载体包括因子VIII(FVIII)转基因、B结构域缺失的因子VIII(FVIII-BDD)转基因或苯丙氨酸羟化酶(PAH)转基因。在一些实施例中,所述质粒载体选自pDK9-2_FVIII-BDD和pDK9-2_PAH。

在一些实施例中,本文提供的质粒载体是包括用于将核酸整合到基因组中的左同源臂和右同源臂的靶向载体。在一些实施例中,作为靶向载体的所述质粒载体是pDK9-2_AAVS1Targeted。在一些实施例中,作为靶向载体的所述质粒载体包括转基因。在一些实施例中,作为靶向载体的所述质粒载体包括FVIII转基因、FVIII-BDD转基因或PAH转基因。在一些实施例中,作为靶向载体的所述质粒载体选自pDK9-2_PAH_AAVS1Targeted和pDK9-2_FVIII-BDD_AAVS1Targeted。

在一些实施例中,提供了用于产生本文提供的pDK表达载体的中间载体。在一些实施例中,中间载体选自pDK7-1和pDK8-1。

附图说明

图1展示了本文提供的载体的示意图,所述示意图示出了pDK载体技术的各种特征。

图2展示了示例载体pDK9-2的示意图。

图3展示了用与pDK-PAH相比的pcDNA-PAH转染的293T细胞中的PAH基因的瞬时表达水平。示出了用抗PAH或抗GAPDH抗体探测的细胞裂解物的Western印迹(Western blot)。

图4展示了用与pDK-PAH相比并且被选择用于稳定整合的pcDNA-PAH转染的293T细胞中的PAH基因的稳定表达水平。示出了用抗PAH或抗GAPDH抗体探测的细胞裂解物的Western印迹。

图5展示了用与pcDNA-FVIII-BDD或空质粒相比的pDK-FVIII-BDD转染的293T细胞中的FVIII-BDD基因的瞬时表达水平。示出了用抗因子VIII C-结构域抗体探测的细胞裂解物的Western印迹。

图6展示了使用Cas9系统组合靶向载体pDK-PAH-AAV1、pDK-FVIII-BDD-AAV1、pcDNA-PAH-AAV1或pcDNA-FVIII-BDD-AAV1在AAV1整合位点处使用靶向整合在293或人脂肪来源干细胞(hADSC)中得到的稳定整合克隆的数目。

图7展示了起始载体pCI-neo(普洛麦格(Promega))的示意图。

图8展示了中间载体pDK7-1的示意图。

图9展示了中间载体pDK8-1的示意图。

图10展示了中间载体pDK9-1的示意图。

图11展示了载体pDK9-2(杀稻瘟菌素)的示意图。

图12展示了载体pDK9-3_Puro的示意图。

图13展示了载体pDK9-3_Neo的示意图。

图14展示了载体pDK9-2_FVIII-BDD的示意图。

图15展示了载体pcDNA6_FVIII-BDD的示意图。

图16展示了载体pDK9-2_PAH的示意图。

图17展示了载体pcDNA6_PAH的示意图。

图18展示了载体pDK9-2_AAVS1Targeted的示意图。

图19展示了载体pDK9-2_PAH_AAVS1Targeted的示意图。

图20展示了载体pDK9-2_FVIIIBDD_AAVS1Targeted的示意图。

图21展示了载体pcDNA6-PAH_AAVS1Targeted的示意图。

图22展示了载体pcDNA6-FVIIIBDD_AAVS1Targeted的示意图。

图23展示了载体pDK-Streamline(在本文中也称为pDK)的示意图。

图24展示了载体pDK-Streamline的示意图,其中圈出了表达载体主启动子位置。

图25展示了载体pDK-Streamline的示意图,其中圈出了可选择的杂合启动子位置。

图26展示了载体pDK-Streamline的示意图,其中圈出了左同源***位点和右同源***位点。

图27展示了载体pDK-Streamline的示意图,其中圈出了人工剪接位点。

图28展示了载体pDK-Streamline的示意图,其中圈出了T7启动子位置。

图29展示了载体pDK-Streamline的示意图,其中圈出了载体的两个表达盒部分。

图30A-30B:图30A展示了载体pDK-Streamline的示意图,其中圈出了用于细菌和哺乳动物选择的表达盒。图30B展示了可商购自英杰公司的包含单独的细菌可选择标志物和哺乳动物可选择标志物的载体的示意图。圈出了单独的细菌可选择标志物和哺乳动物可选择标志物。应注意,所述商业载体比pDK-Streamline载体大了近2000bp。

图31是使用CRISPR技术***(即,“敲入”)从包含同源臂的载体获得的序列的示意图。“之前”基因组中的黑色矩形表示CRISPR断裂位点的位置。一旦加入CRISPR,就会在CRISPR位点处发生双链断裂。载体的浅灰色矩形表示将***到基因组中的序列,并且侧翼矩形与基因组中的断裂位点侧翼的区同源。新序列在断裂位点处***到基因组中。只有在同源臂与断裂位点周围的序列相同时,此***才有效。

图32A-32B:图32A展示了环形载体pDK-Streamline的示意图,其中箭头指向同源位点。图32B是图32A的线性表示。

图33示出了pDK-Streamline载体的线性表示,其中箭头指向可以使用酶共混物靶向的区。共混物可以用于去除或改变左臂或右臂同源结构域或者可以使用共混物来线性化环形载体。

图34展示了pDK-Streamline1-Blast(在本文中也称为pDK9-2;SEQ ID NO:2)的载体图谱。

图35展示了pDK-Streamline1-Puro(在本文中也称为pDK9-3_Puro;SEQ ID NO:4)的载体图谱。

图36展示了pDK-Streamline1-Neo(在本文中也称为pDK9-3_Neo;SEQ ID NO:3)的载体图谱。

具体实施方式

本文描述了用于通过瞬时转染或通过随机或靶向重组的稳定整合来表达一个或多个转基因的载体、组分和试剂盒。如本文所描述的,本发明技术部分基于以下观察:通过消除过量的非功能性序列可以增强传统质粒表达载体的能力和功效。通过对载体组装采取从头(de novo)方法,产生了紧凑的质粒表达载体,所述质粒表达载体以高度有序且空间高效的方式结合了进行高拷贝复制、高效基因表达、基因组整合和选择所需的元件。所述载体可以包含用于例如在原核生物和真核生物二者中具有选择功能的单个可选择标志物的原核复制、原核基因表达和真核基因表达的组分、用于细胞和无细胞环境中的一个或多个转基因的稳健表达的启动子以及如合成RNA剪接位点等用于增加蛋白质表达的其它元件。由于所述载体的碱基对大小较小——小于3.6kb,所以这些表达载体对转基因或多种转基因的较大型多核苷酸***具有较高能力并且具有较长同源臂以实现稳定整合。本文提供的载体的一个非限制性实例是pDK9,其由SEQ ID NO:1中列出的核酸序列表示。在一些实施例中,所述载体的大小可以小于或不大于3.6kb,例如介于1.5kb与3.6kb之间,或其间的任何子值或子范围,并且可以包含端点。

I.定义

除非另外定义,否则本文使用的所有技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解的含义相同的含义。

本文使用的术语仅用于描述特定实施例的目的并且不旨在限制本发明。如本文所使用的,除非上下文另有明确指示,否则单数形式“一个/一种(a/an)”和“所述(the)”旨在同样包含复数形式。

如本文所使用的,术语“约”意味着值可以变化+/-20%、+/-15%、+/-10%或+/-5%并且仍处于本公开的范围内。

术语“包括”旨在意味着组合物和方法包含所叙述的元件,但不排除其它元件。当用于定义组合物和方法时,“基本上由……组成”应当意味着排除对组合具有任何重要意义的其它元件。例如,基本上由本文定义的元件组成的组合物不排除不会对所要求保护的主题的一个或多个基本特性和新颖特性产生实质影响的其它元件。“由……组成”应当意味着排除超过痕量的其它成分和所叙述大量方法步骤。由这些过渡术语中的每一个过渡术语定义的实施例处于本技术的范围内并且设想所述术语中的每个术语与本文描述的实施例中的任何实施例一起使用。

如本领域技术人员将理解的,出于任何和所有目的,特别是在提供书面描述方面,本文公开的所有范围还包含任何和所有可能的子值、子范围及其子范围的组合。任何列出的范围都可以容易地被识别为充分描述并且使得相同的范围被分解为至少相等的两份、三份、四份、五份、十份等。作为非限制性实例,本文讨论的每个范围可以容易地分解为下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,如“最多”、“至少”、“大于”、“小于”等所有用语包含所引用的数字并且指的是可以随后分解成如上所讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包含每个单独的成员。因此,例如,具有1-3个细胞的组是指具有1个、2个或3个细胞的组。类似地,具有1-5个细胞的组是指具有1个、2个、3个、4个或5个细胞的组,等等。

另外,在根据马库什群组描述本公开的特征或方面的情况下,本领域技术人员将认识到,本公开也因此以马库什群组的任何单个成员或成员子群的形式进行描述。

如本文所使用的,术语“分离的”,“纯化的”或“基本上纯化的”是指如核酸分子或多肽等从其天然环境中移除、被分离或分开并且至少60%不含、优选地75%不含并且最优选地90%不含与它们天然相关的其它组分的分子。因此,分离的分子是基本上纯化的分子。

术语“同一性”和“相同的”是指序列之间的同一性程度。可以存在部分同一性或完全同一性。部分相同的序列是与另一个序列小于100%相同的序列。部分相同的序列可以具有至少70%或至少75%、至少80%或至少85%、或至少90%或至少95%的总体同一性。

如本文所使用的术语“可检测标记”是指与探针相关的分子或化合物或一组分子或一组化合物并且用于标识与核酸分子杂交的探针,如基因组核酸分子、RNA核酸分子、cDNA分子或参考核酸。

如本文所使用的,术语“检测”是指观察来自用于指示靶标的存在的可检测标记的信号。更具体地,检测用于检测靶核酸分子的具体序列的上下文中。在检测来自用于指示样品中靶核酸的存在的可检测标记的信号的上下文中使用的术语“检测”不需要所述方法提供100%灵敏度和/或100%特异性。优选至少50%的灵敏度;但更优选至少60%、至少70%、至少80%、至少90%或至少99%的灵敏度。优选至少50%的特异性;但更优选至少60%、至少70%、至少80%、至少90%或至少99%的灵敏度。检测还包含产生假阳性和假阴性的测定。假阴性率可以是1%、5%、10%、15%、20%或甚至更高。假阳性率可以是1%、5%、10%、15%、20%或甚至更高。

如本文所使用的,术语“扩增(amplification和amplify)”包含用于复制或再现具有具体序列的靶核酸分子,从而增加样品中的拷贝数目或核酸序列量的所有方法。扩增可以是指数式的或线性的。靶核酸可以是DNA或RNA。以此方式扩增的靶核酸在本文中称为“扩增子”。虽然本文所描述的说明性方法涉及使用聚合酶链式反应(PCR)进行扩增,但是本领域中已知用于扩增核酸的许多其它方法,如但不限于等温法、滚环法等。技术人员应理解,这些其它方法可以用于代替PCR方法或与PCR方法结合使用。参见例如Saiki,《PCR方案(PCRProtocols)》(编者Innis等人,美国学术出版社(Academic Press),加利福尼亚州圣地亚哥,1990,第13-20页)中的“基因组DNA的扩增(Amplification of Genomic DNA)”;Wharam等人,《核酸研究(Nucleic Acids Res.)》,2001年6月1日;29(11):E54-E54;Hafner等人,《生物技术(Biotechniques)》,2001年4月;30(4):852-6,858,860;Zhong等人,《生物技术》,2001年4月;30(4):852-6,858,860;上述文献中的每一个文献通过引用整体并入本文。

如本文所使用的,术语“寡核苷酸”是指由脱氧核糖核苷酸、核糖核苷酸或其任何组合构成的短核酸聚合物。寡核苷酸的长度通常介于约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个或30到约150个核苷酸(nt)之间,更优选地长度为约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个或30到约70个nt。根据本文所描述的和本领域中众所周知的方法,寡核苷酸可以用作引物或探针。

如本文所使用的,对核酸具有“特异性”的寡核苷酸是在适当的杂交或洗涤条件下能够与感兴趣的靶标杂交并且基本上不与不感兴趣的核酸杂交的寡核苷酸。更高水平的序列同一性是优选的并且包含至少75%、至少80%、至少85%、至少90%、至少95%并且更优选地至少98%的序列同一性。可以使用具有采用本领域公知的算法的默认设置的可商购的计算机程序来确定序列同一性。

用于核酸扩增的“引物”是特异性地退火为靶核苷酸序列并且导致在DNA或RNA聚合酶的存在下向所述引物的3'末端添加核苷酸的寡核苷酸。如本领域已知的,所述引物的3'核苷酸通常应与对应核苷酸位置处的靶核酸序列相同以实现最佳表达和扩增。如本文所用的术语“引物”包含可以合成的所有形式的引物,包含但不限于肽核酸引物、锁核酸引物、硫代磷酸酯修饰的引物、标记的引物等。引物可以是天然存在的、或从生物样品中纯化而来的或来自限制性消化(restriction digest)的或通过合成产生的。在一些实施例中,引物的长度可为约15-100个核苷酸,通常为15-25个核苷酸。引物的确切长度将取决于许多因素,包含杂交和聚合温度、引物来源和所用方法。例如,对于诊断应用,根据靶序列的复杂性,寡核苷酸引物通常包含15-25个或更多个核苷酸,但是所述引物可以包含更少或更多的核苷酸。确定引物的适当长度时涉及的因素是本领域普通技术人员容易知道的。本领域的技术人员应理解,术语“正向引物”和“反向引物”通常是指与位于靶核酸侧翼并且用于靶核酸扩增的序列互补的引物。通常,“正向引物”是与DNA的反义链互补的引物,并且“反向引物”与DNA的有义链互补。

如本文所使用的,“探针”是指具有或包含与另一种多核苷酸,例如靶多核苷酸或另一种寡核苷酸互补的序列的一类寡核苷酸。本文所描述的方法中所用的探针的理想长度为小于或等于500个核苷酸,通常介于约10个核苷酸到约100个核苷酸之间,例如约15个核苷酸到约40个核苷酸。本文所描述的方法中所用的探针通常用于通过与靶核酸特异性杂交来检测靶核酸序列。靶核酸包含例如如本文所描述的基因组核酸、经过表达的核酸、经过逆转录的核酸、重组核酸、合成核酸、扩增产物或延伸产物。

有关多核苷酸(即,如寡核苷酸或靶核酸等核苷酸序列)的术语“互补(complement)”,“互补的(complementary)”或“互补性(complementarity)”是指标准沃森/克里克配对规则(Watson/Crick pairing rules)。使得一个序列的5'末端与另一个序列的3'末端配对的核酸序列互补处于“反向平行相关”。例如,序列“5'-A-G-T-3'”与序列“3'-T-C-A-5'”互补。本文所描述的核酸中可以包含天然核酸中不常见的某些碱基;这些碱基包含例如肌苷、7-脱氮鸟嘌呤、锁核酸(LNA)和肽核酸(PNA)。互补不需要是完美的;稳定双链体可以包含错配的碱基对、简并碱基或不匹配的碱基。核酸技术领域的技术人员可以通过考虑多个变量凭经验确定双链体稳定性,所述变量包含例如寡核苷酸的长度、寡核苷酸的碱基组成和序列、离子强度和错配碱基对的发生率。

如本文所使用的,术语向受试者“施用”药剂包含将药剂引入或递送至受试者以发挥其预期功能的任何途径。可以通过任何合适的途径进行施用,包含静脉内、肌肉内、腹腔内或皮下施用。施用包含自我施用和由另一个人施用。

术语“氨基酸”是指天然存在的氨基酸和非天然存在的氨基酸,以及以与天然存在的氨基酸类似的方式起作用的氨基酸类似物和氨基酸模拟物。天然编码的氨基酸是20种常见氨基酸(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸)以及吡咯赖氨酸和硒半胱氨酸。氨基酸类似物是指与天然存在的氨基酸具有相同基本化学结构的试剂,即,与氢、羧基、氨基和R基结合的α碳,如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。这种类似物具有经过修饰的R基(如正亮氨酸)或经过修饰的肽骨架,但保留了与天然存在的氨基酸相同的基本化学结构。在一些实施例中,形成多肽的氨基酸为D型。在一些实施例中,形成多肽的氨基酸为L型。在一些实施例中,形成多肽的第一多个氨基酸为D型,并且第二多个氨基酸为L型。

氨基酸在本文通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会(IUPAC-IUB Biochemical Nomenclature Commission)推荐的单字母符号来表示。同样,核苷酸通过其普遍接受的单字母代码来表示。

在本文中互换使用术语“多肽”、“肽”和“蛋白质”来指氨基酸残基的聚合物。所述术语适用于天然存在的氨基酸聚合物以及其中一个或多个氨基酸残基是非天然存在的氨基酸的氨基酸聚合物,例如,氨基酸类似物。所述术语包含任何长度的氨基酸链,包含全长蛋白质,其中通过共价肽键连接氨基酸残基。

如本文所使用的,“对照”是出于比较目的在实验中使用的替代样品。对照可以是“阳性的”或“阴性的”。例如,当实验的目的是确定治疗剂对特定类型疾病的治疗功效的相关性时,通常采用阳性对照(表现出期望的治疗效果的已知组合物)和阴性对照(未接受治疗或接受空白对照剂的受试者或样品)。

如本文所使用的,术语“有效量”或“治疗有效量”是指足以实现期望的治疗效果的药剂量。在治疗应用的上下文中,施用于受试者的治疗性肽的量可以取决于感染的类型和严重程度以及如总体健康状况、年龄、性别、体重和对药物的耐受性等个体的特性。它还可以取决于疾病的程度、严重程度和类型。本领域技术人员将能够根据这些和其它因素确定合适的剂量。

如本文所使用的,术语“表达”是指多核苷酸转录成mRNA的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。如果多核苷酸源自基因组DNA,则表达可以包含在真核细胞中剪接mRNA。可以通过测量细胞或组织样品中mRNA或蛋白质的量来确定基因的表达水平。一方面,可以将来自一个样品的基因的表达水平与来自对照样品或参照样品的那个基因的表达水平直接进行比较。另一方面,可以将来自一个样品的基因的表达水平与来自施用本文公开的组合物后的相同样品的那个基因的表达水平直接进行比较。术语“表达”还指一个或多个以下事件:(1)从细胞内的DNA序列(例如通过转录)产生RNA模板;(2)在细胞内(例如,通过剪接、编辑、5'帽形成和/或3'末端形成)处理RNA转录物;(3)在细胞内将RNA序列翻译成多肽或蛋白质;(4)在细胞内对翻译后的多肽或蛋白质进行修饰;(5)在细胞表面上呈递多肽或蛋白质;以及(6)从细胞中分泌或呈递或释放多肽或蛋白质。

术语“病患”、“受试者”,“个体”等在本文中可互换使用,并且是指动物,通常是哺乳动物。在优选的实施例中,病患、受试者或个体是哺乳动物。在特别优选的实施例中,病患、受试者或个体是人。在其它实施例中,动物可以是家畜(例如、狗、猫等)、农场动物(例如,牛、绵羊、猪、马等)或实验动物(例如,猴子、大鼠、小鼠,兔子、豚鼠等)。

如本文所使用的,术语“治疗(treating/treatment)”涵盖对如人等受试者的疾病的治疗,并且包含:(i)抑制疾病,即阻止其发展;(ii)缓解疾病,即引起疾病消退;(iii)减缓疾病的进展;和/或(iv)抑制、缓解或减缓疾病的一种或多种症状的进展。

还应了解,所描述的各种治疗或预防医学疾病和病症的方式旨在表示“基本的”,其包含完全的治疗或预防但也包含次于其的治疗或预防,并且其中实现了一些生物学或医学相关的结果。治疗可以是针对慢性疾病的连续长期治疗,或者是用于治疗急性病症的单次或几次施用。

如本文所使用的,术语“治疗的”是指治疗和/或预防。通过抑制、缓解或根除疾病状态来获得治疗效果。

II.质粒表达载体

本文提供的质粒表达载体包含质粒复制、基因表达和靶基因整合所需的核酸元件。所述质粒载体包含用于质粒增殖的细菌复制起点以及用于选择标志物和转基因的原核和/或真核基因表达的各种启动子,包含双启动子。另外的元件包含但不限于用于增加经过转录的RNA的稳定性和蛋白质表达的增强子,包含合成RNA剪接位点和polyA序列。本文提供的载体可以包含本文所描述的核酸元件中的一种或多种核酸元件。本文提供的载体的非限制性实例是pDK9。本文提供了对载体的特征的实例的非限制性描述。

在特定实施例中,本文提供了质粒载体,所述质粒载体包括:(a)原核复制起点;(b)上游同源臂***位点;(c)适合于表达一个或多个转基因的真核启动子;(d)用于***所述一个或多个转基因的多克隆位点;(e)编码可选择标志物的核酸,所述核酸可操作地连接到真核启动子和原核启动子,其中所述可选择标志物适合于原核选择和真核选择二者;以及(f)下游同源臂***位点,其中元件(a)-(f)在所述质粒的5到3方向上顺序布置。

在特定实施例中,本文提供了质粒载体,所述质粒载体包括:(a)原核复制起点;(b)上游同源臂***位点;(c)适合于表达一个或多个转基因的真核启动子;(d)用于***所述一个或多个转基因的多克隆位点;(e)编码可选择标志物的核酸,所述核酸可操作地连接到包含真核启动子和原核启动子的双启动子,其中所述可选择标志物适合于原核选择和真核选择二者;以及(f)下游同源臂***位点,其中元件(a)-(f)在所述质粒的5到3方向上顺序布置。

在特定实施例中,所述载体的长度不大于3.6千碱基。在一些实施例中,所述载体的长度为2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5或3.6千碱基。在一些实施例中,所述载体的长度为约2.8、约2.9、约3.0、约3.1、约3.2、约3.3、约3.4、约3.5或约3.6千碱基。

一些实施例涉及如本文阐述的载体核酸序列和载体核酸元件序列。一些实施例涉及SEQ ID NO:1-45。一些实施例涉及与本文所描述的序列中的任何序列具有70-99.9%的序列同一性的序列,包含其中的所有子范围和子值。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是70%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是75%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是80%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是85%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是90%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是91%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是92%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是93%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是94%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是95%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是96%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是97%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是98%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是99%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是99.5%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是99.9%。在一些实施例中,与本文提供的序列具有百分比同一性的序列可以与天然序列或全长序列具有相同的功能。

用于确定序列同一性的方法是本领域所熟知的。用于确定序列同一性的非限制性实例包含具有默认参数的BLAST或BLAST 2.0序列比较算法或者通过手动比对和目视检查(参见,例如,NCBI网站ncbi.nlm.nih.gov/BLAST/等)。

在实施例中,所述原核复制起点不是F1起点。在实施例中,所述质粒载体恰好包含一个可选择标志物。例如,在一些实施例中,所述载体可以仅包含在原核或真核宿主中的任一者或两者中起作用的单个可选择标志物。

原核复制起点

通常,本文提供的载体包含如细菌复制起点等原核复制起点。用于如细菌等原核生物中的质粒增殖的复制起点的非限制性实例是本领域熟知的,包含例如pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101或pC101p-157。在特定实施例中,所述细菌复制起点是高拷贝数复制起点。在特定实施例中,所述细菌复制起点是pBR322复制起点。在一些实施例中,所述起点还可以充当用于线性化载体的方便位置。

同源臂***位点

为了将核酸靶向整合到宿主基因组中,质粒载体通常包括与靶区同源的核酸片段。将这些核酸片段称为同源臂并且***待***的核酸的任一侧。在本文提供的非限制性示例性质粒表达载体中,存在同源臂***位点,其位于包含一个或多个转基因的***位点(即多克隆位点)的表达盒的侧翼。在特定的实施例中,所述同源臂***位点以相反方向位于高拷贝数原核复制起点的任一侧。此配置确保在重组期间高拷贝复制起点不会整合到宿主基因组中并且因此最小化不期望的整合效应。

同源臂***位点包括稀有限制性位点。使用稀有限制性位点有助于克隆到载体中。在非限制性实例中,同源臂***位点包括Swa1、SbfI、AscI和/或PmeI的限制性位点。在特定实例中,上游(或左)臂***位点包括Swa1和/或SbfI限制性位点。在特定实例中,下游(或左)臂***位点包括AscI和/或PmeI限制性位点。包含如SwaI或PmeI等平端切割器限制位点允许在待***序列含有限制性位点的情况下将平端片段***所述同源臂***位点。

在一些实施例中,上游和/或下游***位点可以容纳长度范围为约500碱基到约4千碱基,如例如长度为约500碱基到约3千碱基;如例如长度为约500碱基到约2千碱基;如例如长度为约1千碱基到约2千碱基的同源臂。

在一个实施例中,所述上游同源臂和所述下游同源臂的总计为至少10kb。在一个实施例中,所述上游同源臂的范围为约5kb到约100kb。在一个实施例中,所述下游同源臂的范围为约5kb到约100kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约5kb到约10kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约10kb到约20kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约20kb到约30kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约30kb到约40kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约40kb到约50kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约50kb到约60kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约60kb到约70kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约70kb到约80kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约80kb到约90kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约90kb到约100kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约100kb到约110kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约110kb到约120kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约120kb到约130kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约130kb到约140kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约140kb到约150kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约150kb到约160kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约160kb到约170kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约170kb到约180kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约180kb到约190kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约190kb到约200kb。

在一个实施例中,所述载体的所述同源臂源自BAC文库、粘粒文库或P1噬菌体文库。在一个实施例中,所述同源臂源自人或非人动物的基因组基因座。在一个实施例中,所述同源臂源自合成DNA。

在一些实施例中,所述质粒包含替代性位点特异性重组靶序列。位点特异性重组靶序列的非限制性实例包含但不限于loxP、lox511、lox2272、lox66、lox71、loxM2、lox5171、FRT、FRT11、FRT71、attp、att、FRT、rox及其位点特异性重组靶序列的组合。

用于转基因表达的真核启动子

本文提供的质粒载体包含用于表达一个或多个转基因的真核启动子。用于表达转基因的众多真核启动子是众所周知的。在将转基因***到多克隆位点中之后,启动子被定位在质粒中以可操作地连接到编码转基因的核酸。通常,选择强启动子,使得在各种细胞和物种中产生一致且高水平的转基因表达。在需要低表达转基因的替代性实施例中,可以使用较弱的启动子。可以采用的真核启动子的非限制性实例包含但不限于哺乳动物启动子,包含病毒启动子。在一些实施例中,所述启动子是CMV启动子、EF1a启动子、SV40启动子、PGK1启动子、Ubc启动子、人β肌动蛋白启动子、CAG启动子、TRE启动子、UAS启动子、Ac5启动子、多角体蛋白启动子、RSV启动子、CaMKIIa启动子、GAL1启动子、GAL10启动子、TEF1启动子、GDS启动子、ADH1启动子、CaMV35S启动子、Ubi启动子、HSV TK启动子、H1启动子、U6启动子、fos启动子或E2F启动子。在一些实施例中,所述真核启动子是组织特异性启动子。在表达盒中使用组织特异性启动子可以限制不想要的转基因表达并且促进持久的转基因表达。在特定实施例中,所述启动子是病毒启动子。在特定实施例中,所述启动子是巨细胞病毒(CMV)启动子。

所述启动子可以是诱导型启动子。诱导型启动子的非限制性实例是金属硫蛋白启动子、alcA启动子(乙醇控制)、四环素调节的启动子TetR和TetR*(突变形式)、基于糖皮质激素受体(GR)的启动子、基于***受体(ER)的启动子、基于蜕皮激素受体的启动子、基于各种类固醇/类视黄醇/甲状腺受体超家族的启动子、基于Xba1(细胞应激转录因子)的启动子和热诱导启动子(热休克蛋白超家族)。

在一些实施例中,所述载体另外包含用于转基因的无细胞表达的启动子。在一些实施例中,所述启动子是病毒启动子。在一些实施例中,所述启动子是病毒噬菌体启动子。在一些实施例中,所述病毒噬菌体启动子是T7或SP6聚合酶启动子。另外,为了引发无细胞转录反应,T7启动子位点可以充当用于对载体进行测序的引发位点。

在一些实施例中,载体包括合成剪接位点。合成剪接位点(在本文中也称为人工剪接位点)允许剪接经过转录的RNA并且在本领域中已经显示可以增加经过转录的RNA的稳定性,从而导致蛋白质表达增加。在一些实施例中,所述剪接位点源自真核基因。在一些实施例中,所述剪接位点基于真核基因的共有供***点和共有受***点。

所述合成剪接位点还可以起到创建用于***可选择标志物的空间的作用。例如,可以将细菌可选择标志物***到所述合成剪接位点中,并且将所述细菌可选择标志物剪接在真核细胞内。因此,在一些实施例中,所述合成剪接位点包含可选择标志物。在实施例中,可选择标志物是细菌可选择标志物。

可选择标志物

本文提供的质粒载体还包含可操作地连接到双启动子(在本文中也称为杂合启动子)的可选择标志物,所述双启动子用于所述可选择标志物的真核表达和原核表达。可以采用的真核启动子的非限制性实例包含但不限于哺乳动物启动子,包含病毒启动子。在一些实施例中,所述启动子是CMV启动子、EF1a启动子、SV40启动子、PGK1启动子、Ubc启动子、人β肌动蛋白启动子、CAG启动子、TRE启动子、UAS启动子、Ac5启动子、多角体蛋白启动子、RSV启动子、CaMKIIa启动子、GAL1启动子、GAL10启动子、TEF1启动子、GDS启动子、ADH1启动子、CaMV35S启动子、Ubi启动子、HSV TK启动子、H1启动子、U6启动子、fos启动子或E2F启动子。在特定实施例中,用于表达可选择标志物的真核启动子是SV40。在一些实施例中,所述双启动子是用于真核表达和原核表达的通用启动子。可以采用的原核启动子的非限制性实例包含但不限于T7、T7lac、SP6、araBAD、trp、lac、Ptac和pL。在一些实施例中,所述原核启动子是EM7。在一些实施例中,所述原核启动子是P3细菌启动子。

可以构建双启动子,使得真核启动子的DNA序列是原核启动子的DNA序列的5'。可替代地,可以构建双启动子,使得原核启动子的DNA序列是真核启动子的DNA序列的5'。因此,在实施例中,所述双启动子包含位于原核启动子5'的真核启动子。在其它实施方案中,所述双启动子包含位于真核启动子5'的原核启动子。

在某些实例中,真核启动子DNA和原核启动子DNA可以具有同源区。可以利用这些同源区来减小双启动子的总长度,从而减小质粒载体的总大小。例如,如果真核启动子的3'末端包含与原核启动子5'末端相同的核酸序列,则真核启动子的3'末端可以用作原核启动子的5'末端,或者可替代地,原核启动子的5'末端可以用作真核启动子的3'末端。在实施例中,所述双启动子包含SEQ ID NO:45的序列。在实施例中,所述双启动子是SEQ ID NO:45的序列。

各种可选择标志物在本领域是已知的。在此处的特定实施例中,可选择标志物被选择为使得其在细菌和真核宿主系统中提供选择。在一些实施例中,可选择标志物是酶。可选择标志物的非限制性实例包含但不限于如杀稻瘟菌素S脱氨酶(bs)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰转移酶(puror)、新霉素磷酸转移酶(neor)、黄嘌呤/鸟嘌呤磷酸核糖基转移酶(gpt)和单纯疱疹病毒胸苷激酶(HSV-k)等抗生素抗性基因。在实施例中,可选择标志物是杀稻瘟菌素S脱氨酶。在实施例中,可选择标志物是嘌呤霉素-N-乙酰转移酶。在实施例中,可选择标志物是新霉素磷酸转移酶。

可以向载体中添加另外的细菌抗生素抗性基因,但其并不是必需的。如上所描述的,可以将所述细菌抗生素抗性基因***到合成剪接位点中。在一些实施例中,质粒载体包含位于例如合成剪接位点内的另外的可选择标志物。通常,质粒不包含另外的特异性细菌抗生素抗性基因以最小化抗性基因占用的序列空间的量,这可能影响载体的容量。在其它实施例中,不包括另外的可选择标志物,所述另外的可选择标志物未可操作地连接到双启动子或者位于合成剪接位点内。

在一些实施例中,所述可选择标志物包括荧光蛋白。荧光蛋白可以用于跟踪活细胞和动物中的表达。在一些实施例中,所述荧光蛋白选自由以下组成的组:近红外荧光蛋白(NirFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(EYFP)、祖母绿荧光蛋白、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、CyPet、青色荧光蛋白(CFP)、蔚蓝色(Cerulean)荧光蛋白和T-天蓝色(T-Sapphire)荧光蛋白。

在一些实施例中,可选择标志物是选自LacZ、荧光素酶和碱性磷酸酶的酶。包含其它荧光蛋白、生物发光蛋白和酶的其它可选择标志物是本领域已知的。可以将编码任何这些蛋白质的核酸结合到所提供的质粒表达载体中。可选择标志物的组合包含本文公开的和/或本领域已知的两种或更多种可选择标志物。在一些实施例中,在相同的转录物上编码所述两种或更多种可选择标志物,通过使用例如载体中的IRES位点或2A肽序列进行分离。在一些实施例中,所述可选择标志物是两种或更多种可选择标志物的融合蛋白。

用于***的示例转基因

在特定实施例中,对本文提供的质粒表达载体进行修饰以包括***上文描述的用于转基因表达的启动子下游的多克隆位点的一个或多个转基因。所述多克隆位点是包含有意聚集的限制性位点的载体序列区,所述限制性位点可用于一个或多个转基因的准备***。在一些实施例中,通过病毒2A自切割核糖体跳跃序列或用于多顺反子核酸序列表达的内部核糖体进入位点(IRES)来分离所述两个或更多个转基因。

转基因可以是真核细胞的任何内源性或外源性多核苷酸。在一些实施例中,所述转基因编码包含多肽或RNA的基因产物。在一些实施例中,所述转基因与疾病或病症相关。在一些实施例中,所述转基因编码可用于治疗疾病或病症的治疗性蛋白质或RNA。

在一些实施例中,所述转基因***的大小范围为约5kb到约300kb。在一个实施例中,所述转基因为约5kb到约200kb。在一个实施例中,所述转基因为约5kb到约150kb。在一个实施例中,所述转基因为约5kb到约100kb。在一个实施例中,所述转基因为约5kb到约50kb。在一个实施例中,所述转基因为约5kb到约10kb。在一个实施例中,所述转基因***为约10kb到约20kb。在一个实施例中,所述转基因***为约20kb到约30kb。在一个实施例中,所述转基因***为约30kb到约40kb。在一个实施例中,所述转基因***为约40kb到约50kb。在一个实施例中,所述转基因***为约60kb到约70kb。在一个实施例中,所述转基因***为约80kb到约90kb。在一个实施例中,所述转基因***为约90kb到约100kb。在一个实施例中,所述转基因***为约100kb到约110kb。在一个实施例中,所述转基因***为约120kb到约130kb。在一个实施例中,所述转基因***为约130kb到约140kb。在一个实施例中,所述转基因***为约140kb到约150kb。在一个实施例中,所述转基因***为约150kb到约160kb。在一个实施例中,所述转基因***为约160kb到约170kb。在一个实施例中,所述转基因***为约170kb到约180kb。在一个实施例中,所述转基因***为约180kb到约190kb。在一个实施例中,所述转基因***为约190kb到约200kb。在一个实施例中,所述转基因***为约200kb到约210kb。在一个实施例中,所述转基因***为约220kb到约230kb。在一个实施例中,所述转基因***为约230kb到约240kb。在一个实施例中,所述转基因***为约240kb到约250kb。在一个实施例中,所述转基因***为约250kb到约260kb。在一个实施例中,所述转基因***为约260kb到约270kb。在一个实施例中,所述转基因***为约270kb到约280kb。在一个实施例中,所述转基因***为约280kb到约290kb。在一个实施例中,所述转基因***为约290kb到约300kb。

可以使用本文提供的载体表达的转基因的非限制性实例包含抗体、生长因子、转录因子、激素、免疫调节分子、抗癌基因、细胞因子、趋化因子、共刺激分子、蛋白质配体、肿瘤抑制因子、毒素和细胞抑制蛋白。在特定实施例中,所述转基因是FVIII、FVIII-BDD或PAH。在特定实施例中,所述转基因编码用2a肽分离的抗体的重链和轻链。用于***本文提供的载体中的非限制性转基因可以在例如美国专利第8945839号、国际PCT申请公开第WO2013/163394号、第WO2013/0163394号和美国专利申请第20120192298A1号和第US20070042462号中找到,其通过引用整体并入本文。

在一些实施例中,所述转基因编码用于治疗疾病或病症的多个基因,其中用2A肽分离每个基因。在示例实施例中,所述转基因编码用于诱导多能干细胞(iPS)的多个基因。例如,在一些实施例中,所述转基因编码Oct4、Sox2、cMyc和/或Klf4中的一个或多个。

在一个实施例中,所述转基因包括编码人免疫球蛋白重链可变区氨基酸序列的基因组核酸序列。在一个实施例中,所述基因组核酸序列包括可操作地连接到免疫球蛋白重链恒定区核酸序列的未重排的人免疫球蛋白重链可变区核酸序列。在一个实施例中,所述免疫球蛋白重链恒定区核酸序列是小鼠免疫球蛋白重链恒定区核酸序列或人免疫球蛋白重链恒定区核酸序列或其组合。在一个实施例中,所述免疫球蛋白重链恒定区核酸序列选自由以下组成的组:CH1、铰链、CH2、CH3及其组合。在一个实施例中,所述重链恒定区核酸序列包括CH1-铰链-CH2-CH3。在一个实施例中,所述基因组核酸序列包括可操作地连接到免疫球蛋白重链恒定区核酸序列的重排的人免疫球蛋白重链可变区核酸序列。在一个实施例中,所述免疫球蛋白重链恒定区核酸序列是小鼠免疫球蛋白重链恒定区核酸序列或人免疫球蛋白重链恒定区核酸序列或其组合。在一个实施例中,所述免疫球蛋白重链恒定区核酸序列选自由以下组成的组:CH1、铰链、CH2、CH3及其组合。在一个实施例中,所述重链恒定区核酸序列包括CH1-铰链-CH2-CH3。

在一个实施例中,所述转基因包括编码人免疫球蛋白轻链可变区氨基酸序列的基因组核酸序列。在一个实施例中,所述基因组核酸序列包括未重排的人λ和/或κ轻链可变区核酸序列。在一个实施例中,所述基因组核酸序列包括重排的人λ和/或轻链可变区核酸序列。在一个实施例中,所述未重排的或重排的λ和/或κ轻链可变区核酸序列可操作地连接到选自λ轻链恒定区核酸序和κ轻链恒定区核酸序列的小鼠或人免疫球蛋白轻链恒定区核酸序列。

在一个实施例中,所述转基因包括人核酸序列。在一个实施例中,所述人核酸序列编码胞外蛋白。在一个实施例中,所述人核酸序列编码用于受体的配体。在一个实施例中,所述配体是细胞因子。在一个实施例中,所述细胞因子是选自CCL、CXCL、CX3CL和XCL的趋化因子。在一个实施例中,所述细胞因子是肿瘤坏死因子(TNF)。在一个实施例中,所述细胞因子是白细胞介素(IL)。在一个实施例中,所述白细胞介素选自IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、IL-19、IL-20、IL-21、IL-22、IL-23、IL-24、IL-25、IL-26、IL-27、IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IL-34、IL-35和IL-36。在一个实施例中,所述白细胞介素是IL-2。在一个实施例中,所述人基因组核酸序列编码细胞质蛋白。在一个实施例中,所述人基因组核酸序列编码膜蛋白。在一个实施例中,所述膜蛋白是受体。在一个实施例中,所述受体是细胞因子受体。在一个实施例中,所述细胞因子受体是白细胞介素受体。在一个实施例中,所述白细胞介素受体是白细胞介素2受体α。在一个实施例中,所述白细胞介素受体是白细胞介素2受体β。在一个实施例中,所述白细胞介素受体是白细胞介素2受体γ。在一个实施例中,所述人基因组核酸序列编码核蛋白。在一个实施例中,所述核蛋白是核受体。

在一个实施例中,所述转基因包括编码序列上的遗传修饰。在一个实施例中,所述遗传修饰包括编码序列的缺失突变。在一个实施例中,所述遗传修饰包括两个内源编码序列的融合。

在一个实施例中,所述转基因包括编码突变型人蛋白的人核酸序列。在一个实施例中,突变型人蛋白的特性在于改变的结合特性、改变的定位、改变的表达和/或改变的表达模式。在一个实施例中,所述人核酸序列包括至少一种人类疾病等位基因。在一个实施例中,所述人类疾病等位基因是神经疾病的等位基因。在一个实施例中,所述人类疾病等位基因是心血管疾病的等位基因。在一个实施例中,所述人类疾病等位基因是肾病的等位基因。在一个实施例中,所述人类疾病等位基因是肌肉疾病的等位基因。在一个实施例中,所述人类疾病等位基因是血液疾病的等位基因。在一个实施例中,所述人类疾病等位基因是致癌基因的等位基因。在一个实施例中,所述人类疾病等位基因是免疫系统疾病的等位基因。在一个实施例中,所述人类疾病等位基因是显性等位基因。在一个实施例中,所述人类疾病等位基因是隐性等位基因。在一个实施例中,所述人类疾病等位基因包括单核苷酸多态性(SNP)等位基因。

在一个实施例中,所述转基因包括调控序列。在一个实施例中,所述调控序列是启动子序列。在一个实施例中,所述调控序列是增强子序列。在一个实施例中,所述调控序列是转录阻遏物结合序列。在一个实施例中,所述***核酸包括人核酸序列,其中所述人核酸序列包括非蛋白质编码序列的缺失,但不包括蛋白质编码序列的缺失。在一个实施例中,所述非蛋白质编码序列的所述缺失包括调控序列的缺失。在一个实施例中,所述调控元件的所述缺失包括启动子序列的缺失。在一个实施例中,所述调控元件的所述缺失包括增强子序列的缺失。

在原核细胞中的使用

在一些实施例中,载体可以用于细菌细胞中的蛋白质表达。一些实施例涉及本文所描述的载体和/或载体元件在原核细胞中的使用。例如,在一些实施例中,载体和/或组分可以用于转染原核细胞,包含在这类细胞中产生目的氨基酸序列。载体具有本文所描述的特征,包括例如,相对小的kb大小可以允许载体和/或组分与重组核酸序列一起使用以在原核细胞中产生氨基酸序列。可以使用任何合适的原核细胞。这类原核生物的非限制性实例包含如球菌、杆菌、螺旋体和弧菌等细菌。可以使用的细菌的非限制性实例包含大肠杆菌、假单胞菌、棒状菌(Corynebacteriaum)、乳酸菌、新月柄杆菌、亚比多球型红杆菌(Rodhobactersphaeroides)、游海假交替单胞菌、希瓦氏菌株Ac10、荧光假单胞菌、铜绿假单胞菌、伸长盐单胞菌、需盐色盐杆菌、变铅青链霉菌、灰色链霉菌、乳酸诺卡氏菌(Nocardia lactamdurans)、耻垢分枝杆菌、谷氨酸棒杆菌、产氨棒杆菌、乳酸发酵短杆菌、枯草芽孢杆菌、短芽孢杆菌、巨大芽孢杆菌、地衣芽孢杆菌、解淀粉芽孢杆菌、乳酸乳球菌、植物乳杆菌、干酪乳杆菌、罗伊氏乳杆菌和加氏乳杆菌。

III.用于同源重组的方法

在一些实施例中,本文提供的质粒表达载体用作同源重组的靶向载体。在一些实施例中,如序列特异性核酸酶等DNA结合蛋白用于在靶核酸序列中产生双链断裂。可以在靶核酸序列中产生一个或多个或多个双链断裂。在一个实施例中,从靶核酸序列中移除第一核酸序列并且将外源核酸序列(即转基因或含有转基因的表达盒)***位于所述靶核酸序列的切割位点之间或切割末端之间的所述靶核酸序列中。根据某些方面,每个同源臂上的双链断裂如通过同源重组等增加或提高核酸序列***或置换的效率。根据某些方面,多个双链断裂或切割位点提高了来自靶向载体的核酸序列的并入效率。

在示例实施例中,将本文提供的载体与编码核酸酶试剂的核酸序列一起引入真核细胞中,所述核酸酶试剂在靶基因座处或其附近产生单链或双链断裂。在一些实施例中,所述载体包括针对真核细胞基因组内的靶基因座的同源臂。在一个实施例中,所述同源臂源自人、非人动物、植物或真菌的基因组基因座。在一些实施例中,所述靶向载体的所述同源臂源自BAC文库、粘粒文库或P1噬菌体文库。在一个实施例中,所述同源臂源自合成DNA。在一些实施例中,通过来自靶源、寡核苷酸合成组装或从头核酸合成的同源臂的核酸扩增(例如PCR)来产生所述同源臂。

在一些实施例中,所述真核细胞是哺乳动物细胞。在一些实施例中,所述真核细胞是原代细胞。在一些实施例中,所述真核细胞是细胞系。细胞系的实例包含但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPa细胞、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRCS、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人胚胎成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalc1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因品种。

在一个实施例中,所述真核细胞是多能细胞。在一个实施例中,所述多能细胞是胚胎干(ES)细胞。在一个实施例中,所述多能细胞是非人ES细胞。在一个实施例中,所述多能细胞是诱导型多能干(iPS)细胞。在一些实施例中,所述诱导型多能(iPS)细胞源自成纤维细胞。在一些实施例中,所述诱导型多能(iPS)细胞源自人成纤维细胞。在一个实施例中,所述多能细胞是造血干细胞(HSC)。在一个实施例中,所述多能细胞是神经元干细胞(NSC)。在一个实施例中,所述多能细胞是外胚层干细胞。在一个实施例中,所述多能细胞是发育上受限的祖细胞。在一个实施例中,所述多能细胞是啮齿动物多能细胞。在一个实施例中,所述啮齿动物多能细胞是大鼠多能细胞。在一个实施例中,所述大鼠多能细胞是大鼠ES细胞。在一个实施例中,所述啮齿动物多能细胞是小鼠多能细胞。在一个实施例中,所述多能细胞是小鼠胚胎干(ES)细胞。

在一个实施例中,所述真核细胞是永生化小鼠或大鼠细胞。在一个实施例中,所述真核细胞是永生化的人细胞。在一些实施例中,所述真核细胞是人成纤维细胞。在一个实施例中,所述真核细胞是癌细胞。在一个实施例中,所述真核细胞是人癌细胞。

应理解,在一些实施例中,本文所描述的载体和组分可以用于在非哺乳类真核生物中产生氨基酸序列。这类真核生物的实例包含但不限于如酵母菌属(例如,酿酒酵母)和毕赤酵母属(例如,毕赤酵母)等酵母;如曲霉、木霉和毁丝霉(例如,嗜热毁丝霉)等真菌;如那些感染病毒的昆虫细胞(例如,如Sf9,Sf21和High Five菌株等杆状病毒感染的细胞)等。

可以通过本领域已知的用于将核酸引入细胞的任何合适方法将本文提供的载体引入细胞中。方法的实例包含但不限于转染、转导、病毒转导、显微注射、脂质转染、核转染、纳米颗粒轰击、转化、电穿孔或配合。

在一些实施例中,将核酸酶试剂与本文提供的靶向载体一起引入真核细胞中。在一个实施例中,在一段时间内将核酸酶试剂与靶向载体分开引入。在一个实施例中,在引入靶向载体之前引入核酸酶试剂。在一个实施例中,在引入靶向载体之后引入核酸酶试剂。

在一些实施例中,与单独使用靶向载体相比,组合使用靶向载体与核酸酶试剂导致靶向效率增加。在一个实施例中,与单独使用靶向载体相比,当靶向载体与核酸酶试剂结合使用时,所述靶向载体的靶向效率增加至少两倍。在一个实施例中,与单独使用靶向载体相比,当靶向载体与核酸酶试剂结合使用时,所述靶向载体的靶向效率增加至少三倍。在一个实施例中,与单独使用靶向载体相比,当靶向载体与核酸酶试剂结合使用时,靶向载体的靶向效率增加至少四倍。

在一个实施例中,所述核酸酶试剂是包括编码核酸酶的核酸序列的表达构建体,其中所述核酸序列可操作地连接到启动子。在一个实施例中,所述启动子是组成型活性启动子。在一个实施例中,所述启动子是诱导型启动子。在一个实施例中,所述核酸酶试剂是编码核酸内切酶的mRNA。

在一些实施例中,所述核酸酶试剂是锌指核酸酶(ZFN)。在一个实施例中,所述ZFN的每个单体包括3个或更多个基于锌指的DNA结合结构域,其中每个基于锌指的DNA结合结构域与3bp亚位点结合。在一个实施例中,所述ZFN是嵌合蛋白,其包括可操作地连接到独立核酸酶的基于锌指的DNA结合结构域。在一个实施例中,所述独立的核酸内切酶是Fokl核酸内切酶。在一个实施例中,所述核酸酶试剂包括第一ZFN和第二ZFN,其中所述第一ZFN和所述第二ZFN各自可操作地连接到Fokl核酸酶,其中所述第一ZFN和所述第二ZFN识别由约6bp到约40bp的切割位点分开的靶向DNA序列的每条链中的两个连续的靶向DNA序列,并且其中Fokl核酸酶二聚化并且产生双链断裂。

在一些实施例中,所述核酸酶试剂是类转录激活因子效应物核酸酶(TALEN)。在一个实施例中,TALEN的每个单体包包12-25个TAL重复,其中每个TAL重复与1bp亚位点结合。在一个实施例中,所述核酸酶试剂是嵌合蛋白,其包括可操作地连接到独立核酸酶的基于TAL重复的DNA结合结构域。在一个实施例中,所述独立的核酸酶是Fokl核酸内切酶。在一个实施例中,所述核酸酶试剂包括第一基于TAL重复的DNA结合结构域和第二基于TAL重复的DNA结合结构域,其中所述第一和所述第二基于TAL重复的DNA结合结构域各自可操作地连接到Fokl核酸酶,其中所述第一和所述第二基于TAL重复的DNA结合结构域识别由约6bp到约40bp切割位点分开的靶向DNA序列的每条链中的两个连续的靶向DNA序列,并且其中Fokl核酸酶二聚化并且在靶序列产生双链断裂。

在一些实施例中,本文提供的靶向载体与II型CRISPR系统组合使用以在宿主基因组中产生单链和/或双链断裂。在特定实施例中,如Cas9核酸酶等核酸酶由引导RNA引导到靶位点。引导RNA和核酸酶在DNA上形成共定位复合物,所述核酸酶在其上诱导靶DNA断裂。在示例实施例中,其中核酸酶是Cas9,所述Cas9通过由蛋白质中的两个催化结构域介导的过程在靶基因组中的原间隔序列临近基序(PAM)上游3bp处产生平末端双链断裂。

CRISPR酶的非限制性实例包含Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物或其修饰版本。在一些实施例中,所述CRISPR酶是Cas9酶。在一些实施例中,所述Cas9酶是肺炎链球菌、化脓性链球菌或嗜热链球菌Cas9或这些生物体中的源性突变体。在一些实施例中,所述CRISPR酶经密码子优化以在真核细胞中表达。在一些实施例中,所述CRISPR酶在靶序列位置处引导一条链或两条链的切割。在一些实施例中,所述CRISPR酶缺乏DNA链切割活性。

用于使用各种核酸酶系统进行同源重组和基因编辑的方法的非限制性实例可以在例如美国专利第8945839号、国际PCT申请公开第WO2013/163394号和美国专利申请第2016/0060657号、第20120192298A1号和第US20070042462号中找到,其中的每一个通过引用整体并入本文。这些和任何其它已知的用于同源重组的方法可以与本文提供的质粒载体一起使用。

治疗应用

本文提供的表达载体可以用于转基因表达,所述转基因编码可用于治疗疾病或病症的治疗性蛋白质或RNA。在一些实施例中,所述载体用于患有基因组疾病(例如血友病A、苯丙酮尿症(PKU)、镰状细胞贫血症和β-地中海贫血、斯特格氏病(Stargardt disease)、杜氏肌营养不良症、囊胞性纤维症、尤塞氏病(Usher disease))的受试者的基因修复(例如,基因置换)或用于癌症抑制、HIV抗性、移植排斥和自身免疫的基因改变。在一些实施例中,所述载体用于表达受试者体内的治疗性蛋白质以治疗疾病或病症。例如,用于如抗体(例如,赫赛汀)、因子Xa抑制剂(例如,抗凝血剂)或用于增强愈合的生长因子(用于骨质疏松症的BGF)等治疗性蛋白质的表达盒。在一些实施例中,所述载体可以用于表达受试者体内的治疗性蛋白质构建体(例如,VEGF捕获剂;可溶性受体融合蛋白,其包括与IgG1FC片段融合的VEGF的受体1和2的用于治疗湿性AMD的膜外片段或用于治疗癌症或自身免疫疾病的抗体片段/构建体(如单链抗体))。美国专利第8945839号、国际PCT申请公开第WO2013/163394号以及美国专利申请第20120192298A1号和第US20070042462号中提供了通过基因置换和/或治疗性蛋白质及其相关基因的表达来治疗疾病和病症的非限制性实例,所述文献的每一个文献通过引用整体并入本文。在特定实施例中,本文提供的包括FVIII或FVIII-BDD转基因的质粒载体可以用于治疗血友病A;本文提供的包括苯丙氨酸羟化酶(PAH)转基因的质粒载体可以用于治疗苯丙酮尿症(PKU);本文提供的包括ABC4转基因的质粒载体可以用于治疗斯特格氏病;本文提供的包括小型肌营养不良蛋白转基因的质粒载体可以用于治疗杜氏肌营养不良症;本文提供的包括囊胞性纤维化跨膜受体(CFTR)转基因的质粒载体可以用于治疗囊胞性纤维症;本文提供的包括ABC4转基因的质粒载体可用于治疗斯特格氏病。

本文提供的载体可以通过任何合适的施用核酸的方法施用于受试者。

试剂盒

本文提供的载体或载体组分可包含于试剂盒中。在一些实施例中,设想所述试剂盒可以用于操控载体的组分(例如,改变同源臂、使载体线性化);扩增载体和/或促进同源重组。所述试剂盒可以包括例如如本文所描述的载体的各种组分中的一种或多种。通过对其合并和使用进行说明,可以一起或单独提供所述组分。所述组分的非限制性实例包含复制起点、启动子、限制性位点、poly A序列、选择启动子(包含如本文所描述的杂合启动子)、可选择标志物(包含在真核生物和原核生物中都起作用的标志物)、同源***位点、用于促进整合或同源重组的组分(例如,CRISPR组分和材料或如本文所描述的其它材料)、RNA稳定剪接位点、T7启动子或用于无细胞表达的其它启动子等。另外的试剂盒组分可以包含但不限于本文所描述的生长培养基(例如,琼脂板);有和没有选择材料(例如,抗生素)、抗生素、原核和真核培养物(例如,细菌培养物、酵母培养物和哺乳动物细胞培养物)等。在一些方面,可以从试剂盒或载体中特异性地排除上文和本文其它处所描述的任何一种或多种组分。在一些方面,例如,试剂盒和载体可以特异性地排除一种或多种多于一种可选择标志物(例如,多于一种抗生素可选择标志物或多于一种抗生素;多于一种抗生素板或生长培养基)、F1复制起点、SV40复制起点等。

在一些实施例中,提供了包含本文提供的载体或组分的试剂盒,其包含其实施例以及含有抗生素或其它类型的可选择标志物的生长培养基。

试剂盒中提供的生长培养基可用于培养细胞(即,原核或真核细胞)并且进一步帮助确定哪些细胞通过包含抗生素或其它可选择标志物成功地摄取载体。本文提供的生长培养基(包含其实施例)可以与真核细胞一起使用。本文提供的生长培养基(包含其实施例)可以与原核细胞一起使用。

在实施例中,所述生长培养基是液体生长培养基、固体生长培养基或半固体生长培养基。在实施例中,所述生长培养基是琼脂。试剂盒可以包含预制琼脂板或含有抗生素的液体生长培养基。在实施例中,生长培养基中包含的抗生素是杀稻瘟菌素S、嘌呤霉素或新霉素。所述抗生素可以是限制或减少真核细胞和原核细胞生长的抗生素。

由于如细菌等原核细胞对某些抗生素天生更具抗性,因此试剂盒中提供的原核生长培养基中抗生素的浓度可以高于常用的浓度(例如5μg/ml的嘌呤霉素或10-20μg/ml的杀稻瘟菌素S),用于选择真核细胞以确保如果细胞未成功摄取载体,则将限制或杀死细菌宿主。在实施例中,抗生素的浓度可以在至少5μg/ml与150μg/ml之间,或其间的任何子值或子范围。例如,所述量可以是至少50μg/ml。在实施例中,所述抗生素的浓度为50μg/ml。在实施例中,所述抗生素的浓度至少为60μg/ml。在实施例中,所述抗生素的浓度为60μg/ml。在实施例中,所述抗生素的浓度至少为70μg/ml。在实施例中,所述抗生素的浓度为70μg/ml。在实施例中,所述抗生素的浓度至少为80μg/ml。在实施例中,所述抗生素的浓度为80μg/ml。在实施例中,所述抗生素的浓度至少为90μg/ml。在实施例中,所述抗生素的浓度为90μg/ml。在实施例中,所述抗生素的浓度至少为100μg/ml。在实施例中,所述抗生素的浓度为100μg/ml。

所述试剂盒还可以包含限制酶以促进复制起点的移除,从而使载体线性化或移除同源臂例如以进行置换。所述限制酶可以作为限制酶共混物提供,所述限制酶共混物靶向位于左同源臂、右同源臂的任一侧的限制性位点或位于复制起点侧翼的限制性位点。因此,在实施例中,所述试剂盒包含第一、第二和第三限制酶共混物。在实施例中,所述第一限制酶共混物可以包含例如用于限制性位点SwaI和SbfI的限制酶;所述第二限制酶共混物可以包含例如用于限制性位点AscI和PmeI的限制酶;并且所述第三限制酶共混物可以包含例如用于限制位点PmeI和SwaI的限制酶。

如上文所提及的,所述试剂盒还可以包含用于促进将载体同源重组到目的基因组位置的部分。CRISPR、TALEN和锌指核酸酶基因组编辑系统是用于在特定目的基因组区(例如,外显子、内含子、与疾病或病症相关的基因)处产生双链断裂的有用工具。

CRISPR系统(例如,II型系统)通常包含设计用于与CRISPR相关核酸内切酶(例如,Cas9)缔合的引导RNA(gRNA)并且其包含靶向(例如,结合)待修饰的基因组序列的靶核苷酸序列以及使DNA双链断裂的CRISPR相关核酸内切酶(例如,Cas9)。在实施例中,所述试剂盒进一步包含用于基因组编辑的II型CRISPR系统。

TALEN系统通常包含与FokI核酸酶融合的植物致病性黄单胞菌属的转录激活因子样(TAL)效应子。通过自定义TAL效应子中的多态性氨基酸重复来实现基因组靶向特异性。在实施例中,所述试剂盒进一步包含用于基因组编辑的TALEN系统。

锌指核酸酶系统通常包含含有两个功能结构域的锌指核酸酶。第一结构域是含有双指模块的DNA结合结构域,其中每个模块识别独特的DNA序列,并且融合形成锌指蛋白。第二结构域是包含FokI的核酸酶结构域的DNA切割结构域。所述第一结构域和所述第二结构域融合,从而产生在由锌指蛋白定义的靶基因组位置处切割双链DNA的复合物。在实施例中,所述试剂盒进一步包含用于基因组编辑的锌指核酸酶系统。

如上已经描述的,本文所描述的任何一个或多个试剂盒部分和组分可以包含在各个实施例中或明确排除在各个实施例之外。

实例

实例1、产生pDK9载体

在此实例中,提供了对用于产生示例载体pDK9的方法的描述。图2中提供了pDK9载体的示意图。pDK9载体的最终大小为3.3kb。pDK9载体的核酸序列的非限制性实例以SEQ IDNOS:1(pDK9-1)、2(pDK9-2)、3(pDK9-3_Neo)和4(pDK9-3_Puro)的形式提供。下文中描述了这些载体中的每一种载体的构建。

移除F1起点

通过PCR和切除连接来移除pCI-Neo载体(普洛麦格;SEQ ID NO:5)中的噬菌体F1复制起点。进行第一PCR以在起点的一侧扩增257碱基对产物并且包括多克隆位点的Not 1限制性位点和polyA位点,并且通过反向寡核苷酸在polyA位点后引入DraIII限制性位点。用以下引物扩增PCR产物:

正向引物:5'GACCCGGGCGGCCGCTTCCCTTTAGTGAGGGTTAA3'(SEQ ID NO:6)

反向引物:5'TGCTGCCACTCCGTGTACCACATTTGTAGAGGTTTTACTTGC3'(SEQ ID NO:7)

进行第二PCR以在起点的另一侧扩增396碱基对产物并且包括SV40启动子。通过正向寡核苷酸在SV40启动子之前引入DraIII限制性位点。所述产物还包括存在于SV40启动子末端的AvrII限制性位点。用以下引物扩增PCR产物:

正向引物:5'GTGGTACACGGAGTGGCAGCACCATGGCCTGAAATAACCTCT3'(SEQ ID NO:8)

反向引物:5'CAAAAGCCTAGGCCTCCAAAAAAGCCTCCTCAC 3'(SEQ ID NO:9)

用Not1和AvrII消化pCI-Neo;用NotI和DraIII消化PCR1产物;用DraIII和AvrII消化PCR2产物。然后进行3向连接以将PCR产物连接到切割的载体中。得到的载体移除了噬菌体F1起点并且被称为pDK7-1(SEQ ID NO:10)。

引入杀稻瘟菌素抗性基因

包含杀稻瘟菌素抗性基因的pcDNA6载体用Xma1消化、钝化并且重新连接以破坏Xma1位点。

进行第一PCR以从所得载体扩增包括AvrII位点的产物,所述AvrII位点包含引物中的EM7启动子。用以下引物扩增PCR产物:

正向引物:5'GGAGGCCTAGGCTTTTGCAAAAAGCTGAGC3'(SEQ ID NO:11)

反向引物:5'TCGTATTATACTATGCCGATATACTATGCCGATGATTAATTGTCAACACGTGCTG3'(SEQ ID NO:12)

进行第二PCR以通过杀稻瘟菌素抗性基因从寡核苷酸中的EM7启动子的重叠部分扩增到载体中的BstZ17I限制性位点。用以下引物扩增PCR产物:

正向引物:5'CAGCACGTGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGA 3'(SEQ ID NO:13)

反向引物:5'TCGACGGTATACAGACATGATAAGATACATTGATGAG 3'(SEQ ID NO:14)

将两种PCR产物连接在一起并且进行延伸以产生EM7杀稻瘟菌素***物。

用AvrII和BsrBI消化pDK7-1,这移除新霉素抗性基因。用AvrII和BstZ17I消化EM7杀稻瘟菌素抗性***物。然后将杀稻瘟菌素抗性***物连接到切割的pDK7-1载体中以产生载体pDK8-1(SEQ ID NO:15)。BstZ17I和BsrBI是平端切割器,因此,将它们连接在一起会破坏这两个位点。

然后用BspHI消化pDK8-1并且重新连接以产生pDK9-1(SEQ ID NO:1)。

为同源臂添加8碱基切割器

进行PCR以在pDK9-1中从BspHI位点扩增到BglII位点,其包括pBR322复制起点。在正向寡聚引物中引入AscI和PmeI限制性位点。在反向寡聚引物中引入SwaI和SbfI限制性位点。

正向引物:5'TGAGTTTCATGAGGCGCGCCCGTCAGACCCGTTTAAACAGATCAAAGGATCTTCTTGAGA3'(SEQ ID NO:16)

反向引物:5'TATTGAAGATCTCCTGCAGGCAGGAACCGTATTTAAATCGCGTTGCTGGCGTTTTTCCAT3'(SEQ ID NO:17)

用BspHI和BglII消化pDK9-1载体和PCR产物并且进行连接以产生载体pDK9-2(SEQID NO:2)。

引入呤霉素抗性基因(杀稻瘟菌素抗性基因的替代物)

将作为杀稻瘟菌素抗性基因的替代物的嘌呤霉素抗性基因克隆到载体中

PCR用于组装嘌呤霉素抗性盒:

使用以下引物进行第一次PCR(PCR1)以通过SV40启动子/EM7启动子扩增AvrII并且包含与第二PCR(PCR2)的重叠部分:

正向引物:5'TTTGGAGGCCTAGGCTTTTGCAAAAAGCTCC3'(SEQ ID NO:18)

反向引物:5'GAGGCGCACCGTGGGCTTGTACTCGGTCATGGTGGCGTTTAGTTCCTCACCTTGTCG3'(SEQ ID NO:19)

使用以下引物进行第二PCR(PCR2)以从PCR1产物重叠部分扩增到对嘌呤霉素产生抗性的Nae1位点:

正向引物:5'GCATAGTATAATACGACAAGGTGAGGAACGCCACCATGATTGAACAAGATGGATTGCAC3'(SEQ ID NO:20)

反向引物:5'CATCCAGCCGGCTCAGGCACCGGGCTTGCGGGTC 3'(SEQ ID NO:21)

将PCR1产物和PCR2产物混合并在两端处通过PCR进行延伸以产生PCR产物3。

用AvrII和NaeI消化pDK9-2载体和PCR3的产物并且进行连接以产生载体pDK9-3Puro(SEQ ID NO:3)。

引入新霉素抗性(杀稻瘟菌素抗性基因的替代物)

将作为杀稻瘟菌素抗性基因的替代物的新霉素抗性基因克隆到载体中。

使用PCR以组装新霉素抗性盒:

使用以下引物进行第一次PCR(PCR1)以通过SV40启动子/EM7启动子扩增AvrII并且包含与第二PCR(PCR2)的重叠部分:

正向引物:5'TTTGGAGGCCTAGGCTTTTGCAAAAAGCTCC 3'(SEQ ID NO:22)

反向引物:5'GTGCAATCCATCTTGTTCAATCATGGTGGCGTTCCTCACCTTGTCGTATTATACTATGC3'(SEQ ID NO:23)

使用以下引物进行第二PCR(PCR2)以从PCR1产物重叠部分扩增到对新霉素产生抗性的Nae1位点:

正向引物:5'GCATAGTATAATACGACAAGGTGAGGAACGCCACCATGATTGAACAAGATGGATTGCAC3'(SEQ ID NO:24)

反向引物:5'CATCCAGCCGGCTCAGGCACCGGGCTTGCGGGTC 3'(SEQ ID NO:25)。

将PCR1产物和PCR2产物混合并在两端处通过PCR进行延伸以产生PCR产物3。

用AvrII和NaeI消化pDK9-2载体和PCR3的产物并且进行连接以产生载体pDK9-3Neo(SEQ ID NO:4)。

实例2、pDK-PAH载体的产生和表征

在此实例中,通过产生包括编码胞质蛋白苯丙氨酸羟化酶(PAH)(约1kb)的测试核酸的pDK9载体来评估pDK载体作为表达载体的能力。提供了对用于将编码PAH的核酸克隆到pDK9-2载体中的方法的描述。

载体构建

为了制备苯丙氨酸羟化酶(PAH)表达载体,从源自人肝脏的商业cDNA文库中通过PCR扩增PAH基因。正向引物包含EcoRI限制性位点和优化的Kozak序列并且反向引物包含终止密码子后的Not1限制性位点:

正向引物:5'AGCCTCGAGAATTCTAATAGGCCACCATGTCCACTGCGGTCCTGGAAAACCCAGGCTTGG 3'(SEQ ID NO:26)

反向引物:5'GGAAGCGGCCGCCTACTTTATTTTCTGGAGGGCACTGCAAAGGATTCCAATTTCACTG3'(SEQ ID NO:27)。

用EcoRI和NotI消化PCR产物和pDK9-2并且进行连接以产生pDK9-2-PAH。pDK-PAH质粒的最终大小为4.3kb。pDK-PAH载体的核酸序列如SEQ ID NO:28所提供的。

为了进行比较研究,将相同的PAH核酸克隆到pcDNA载体(英杰公司)中。用EcoRI和NotI消化PCR产物和pCDNA6并且进行连接以产生pCDNA6-PAH(SEQ ID NO:29)。pcDNA-PAH载体的最终大小为6.5kb。

瞬时表达研究

然后评估pDK-PAH载体在真核细胞中瞬时表达苯丙氨酸羟化酶的能力。

根据制造商的说明,使用293转染293T细胞。考虑到pcDNA-PAH比pDK-PAH大1.51倍,针对相等分子调整用于转染的DNA量。对转染1μg、2μg、5μg、10μg、20μg或25μg的pcDNA-PAH DNA和转染0.66μg、1.3μg、3.3μg、6.6μg、13.3μg或16.6μg的pDK-PAH DNA进行测定。

在转染后48小时,收取并裂解细胞。使用抗PAH和抗GAPDH对照抗体来通过Western印迹评估细胞裂解物。如图3所示,在这两种质粒的可比水平下,与pcDNA-PAH质粒相比,pDK-PAH质粒表达的PAH水平显著更高。

pDK-PAH质粒载体的稳定整合

如上所描述的转染并选择293T细胞用于PAH核酸的阳性整合。转染后48小时,转染的和未转染的(对照)细胞均以1:10的比例***并且置于杀稻瘟菌素S选择下(最终浓度为10μg/ml)。将细胞保持在所述选择下,直至所有对照细胞死亡(11天)。随机挑选来自每个转染群的细胞的10个抗性菌落并且在连续的杀稻瘟菌素S抗生素选择下使其扩增3周。裂解细胞并且如上所描述的测试每个克隆的标准化量用于PAH和GAPDH表达。

选择来自每次转染的十个随机整合稳定克隆用于分析PAH表达。如图4所示,与pcDNA-PAH转染细胞相比,pDK-PAH转染细胞显示出产生更一致且稳定的整合PAH核酸的能力。

实例3、pDK-因子VIII-BDD载体的产生和表征

在该实施例中,通过产生包括编码B结构域缺失的因子VIII(FVIII-BDD)的核酸的pDK9载体来评估pDK9载体作为用于大型核酸***的表达载体的能力。提供了用于将编码FVIII-BDD(约6kb)的核酸克隆到pDK9-2载体中的方法的描述。

载体构建

pDK9-2-FVIIIBDD组装和pcDNA6-FVIIIBDD组装

从源自人肝脏的商业cDNA文库中通过PCR扩增FVIII-BDD基因(FVIII到最小B结构域)。正向引物包含Xho1限制性位点和优化的Kozak序列:

正向引物:5'AGGCTAGCCTCGAGGTAATAGGCCACCATGCAGATCGAGCTGTCCACCTGCTTTTTTCTG3'(SEQ ID NO:30)

反向引物:5'CAGGGTTGTCCGGGTGATCTCCCGCTGGTGACGCGTGCTGGACACATTCTTGCCCCAGCT3'(SEQ ID NO:31)。

使用以下引物进行第二PCR以从包含终止密码子和NotI位点(加入寡聚物中)的最小B结构域(与PCR1重叠)扩增:

正向引物:5'AGCTGGGGCAAGAATGTGTCCAGCACGCGTCACCAGCGGGAGATCACCCGGACAACCCTG 3'(SEQ ID NO:32)

反向引物:5'GGAAGCGGCCGCTCATCAGTACAGATCCTGGGCCTCACATCCCAGGACTTCCATCCTGAG3'(SEQ ID NO:33)。

将PCR1产物和PCR2产物混合并在两端处通过PCR进行延伸以产生PCR产物3。

用XhoI和NotI消化pDK9-2载体和PCR3的产物并且进行连接以产生载体pDK9-2-VFVIII-BDD。pDK-FVIII-BDD质粒载体的最终大小为9.0kb。pDK-FVIII-BDD载体的核酸序列如SEQ ID NO:34所提供的。

为了进行比较研究,将相同的FVIII-BDD核酸克隆到pcDNA载体(英杰公司)中。为了产生pCDNA6-FVIIIBDD,用Kpn1消化pCDNA6并且使其钝化。用XhoI消化PCR3的产物并且使其钝化。然后用Not1消化***物和载体并且进行连接以产生pCDNA6-FVIIIBDD(SEQ ID NO:35)。pcDNA-FVIII-BDD载体的最终大小为11.3kb。由于尺寸大而难以产生该质粒载体。

瞬时表达研究

然后评估pDK-FVIII-BDD载体在真核细胞中瞬时表达FVIII-BDD的能力。

根据制造商的说明,使用293转染293T细胞。调整用于转染的DNA量用于相等分子的pcDNA-FVIII-BDD和pDK-FVIII-BDD。pcDNA-FVIII-BDD载体比pDK-FVIII-BDD载体大1.25倍。

在转染后5天,收取来自细胞的条件培养基。使用抗因子VIII C-结构域抗体来通过Western印迹评估条件培养基。如图5所示,在这两种质粒的可比水平下,与pcDNA-FVIII-BDD质粒相比,pDK-FVIII-BDD质粒表达的FVIIIBDD水平显著更高。

实例4、使用Cas9靶向整合稳定整合pDK-FVIII-BDD质粒载体

在此实例中,描述了使用Cas9靶向整合系统进行的稳定整合。

产生pDK-FVIIIBDD-AAV1和pDK-PAH-AAV1靶向载体

产生靶向AAV1整合位点的pDK-FVIIIBDD载体和pDK-PAH载体的同源靶向版本。

对于pDK9-2:

从293T和人脂肪来源干细胞(ADSC)制备基因组DNA。使用包含用于克隆的8个碱基限制性位点的引物从基因组DNA通过PCR扩增AAV1整合位点的同源臂。

左臂PCR:

正向引物:5'AGCAACGCGATTTAAATTGCTTTCTCTGACCAGCATTCTCTCCCCT 3'(SEQ IDNO:36)

反向引物:5'TGAAGATCTCCTGCAGGGCCCCACTGTGGGGTGGAGGGGACAGATAAAAGTA 3'(SEQ ID NO:37)。

右臂PCR:

正向引物:5'TACTCATGAGGCGCGCCACTACTAGGGACAGGATTGGTGACAGAAAAGCCCCA 3'(SEQ ID NO:38)

反向引物:5'TGATCTGTTTAAACAGAGCAGAGCCAGGAACACCTGTAGGGAAGGGGCA 3'(SEQID NO:39)。

对PCR产物进行测序并且发现其具有与所用的2种不同细胞系相同的序列。

用AscI和PmeI消化pDK9-2载体和右同源臂的PCR产物并且进行连接以产生pDK9-2_AAVS1R(中间载体)。

用SbfI和SwaI消化pDK9-2_AAVR1R载体和左同源臂的PCR产物并且进行连接以产生pDK9-2_AAVS1Targeted的载体(SEQ ID NO:40)。

为了产生pDK9-2_PAH_AAVS1Targeted载体(SEQ ID NO:41),用EcoRI和NotI消化实例2的PAH PCR产物和pDK9-2_AAVS1Targeted载体并且进行连接。

为了产生pDK9-2_FVIIIBDD_AAVS1Targeted载体(SEQ ID NO:42),用XhoI和NotI消化实例3的FVIIIBDD PCR产物和pDK9-2_AAVS1Targeted载体并且进行连接。

组装AAVS1靶向的pCDNA6-PAH载体

将左同源臂***pcDNA6-PAH的SspI位点(实例2)。如上所描述的扩增左臂同源臂、用SbfI消化、钝化;并且然后用SwaI消化。用SspI消化pcDNA6-PAH。将消化的pcDNA6-PAH载体和左同源臂的PCR产物连接以产生pcDNA6-PAH_Left(临时载体)。

将右同源臂***pcDNA6-PAH_Left载体的SapI位点。如上所描述的扩增左臂同源臂、用AscI消化、钝化;并且然后用PmeI消化。用SapI消化pcDNA6-PAH_Left并且使其钝化。将消化的pcDNA6-PAH_Left载体和右同源臂的PCR产物连接以产生pcDNA6-PAH_AAVS1Targeted载体(SEQ ID NO:43)。

组装AAVS1靶向的pCDNA6-FVIIIBDD载体

将左同源臂***pcDNA6-FVIIIBDD的SspI位点(实例3)。如上所描述的扩增左臂同源臂、用SbfI消化、钝化;并且然后用SwaI消化。用SspI消化pcDNA6-FVIIIBDD。将消化的pcDNA6-FVIIIBDD载体和左同源臂的PCR产物连接以产生pcDNA6-FVIIIBDD_Left(临时载体)。

将右同源臂***pcDNA6-FVIIIBDD_Left载体的BstZ17I位点。如上所描述的扩增左臂同源臂、用AscI消化、钝化;并且然后用PmeI消化。用BstZ17I消化pcDNA6-FVIIIBDD_Left。将消化的pcDNA6-FVIIIBDD_Left载体和右同源臂的PCR产物连接以产生pcDNA6-FVIIIBDD_AAVS1Targeted载体(SEQ ID NO:44)。

靶向载体的稳定整合

用表达Cas9的市售质粒DNA和靶向AAV1整合位点的指导RNA、来自复能基因(复能基因公司(Genecopia))的HCP-AAVS1-CG02和表达载体的同源靶向版本转染293T或人脂肪来源干细胞(hADSC)。用293CellFectin和1μg的HCP-AAVS1-CG02质粒;用或不用10μg的pcDNA-PAH_AAV1STargeted质粒或1μg的HCP-AAVS1-GC02;用或不用10μg的pcDNA-FVIIIBDD-AAVS1Targeted质粒或1μg的HCP-AAVS1-GC02以及用或不用7.7μg的pDK-PAH-AAVS1Targeted质粒或1μg的HCP-AAVS1-GC02以及用或或不用8.5μg的pDK-FVIIIBDD-AAVS1Targeted质粒转染293T细胞。

以与293T细胞类似的方式转染hADSC细胞,然而用Lipofectamine 3000代替293CellFectin。

选择细胞用于抗生素抗性并且为每个组合变体选择96个克隆。表达载体提供抗生素抗性,因此如果没有表达载,则在选择下无细胞存活。

为每个克隆制备基因组DNA并且通过在5'和3'侧的连接位点上进行聚合酶链式反应扩增(PCR)来测定整合。同源区外的一个基因组引物和来自载体源性序列的一个引物用于PCR反应。当这两侧产生指示存在靶向整合的扩增产物时,将细胞视作是阳性的。图6中提供了靶向整合的结果。如图6所示,pDK-FVIIIBDD-AAV1和pDK-PAH-AAV1比pcDNA载体产生显著更高的靶向整合成功率。

与人细胞(即真核细胞)相比,在细菌细胞中使用杂合启动子控制下的单个可选择标志物的选择需要更高水平的抗生素。对于真核细胞,1-10μg/ml的杀稻瘟菌素S足以选择成功摄取载体的细胞,并且1-5μg/ml的嘌呤霉素足以选择成功摄取载体的细胞。对于原核细胞,100μg/ml的杀稻瘟菌素S足以选择成功摄取载体的细胞,并且50-100μg/ml的嘌呤霉素足以选择成功摄取载体的细胞。

使用在杂合启动子控制下的单个可选择标志物进行的选择不同于传统的抗生素选择。如果细菌细胞没有摄取载体,则它们不会反应于抗生素而立即死亡。相反,细菌细胞的薄层或菌苔与已摄取载体的细菌细胞的强菌落一起存在。从薄层中选择的细胞不能在液体培养物中生长。该结果不依赖于所用细菌的类型。

应注意,TB培养基比LB培养基更好地用于培养。通常,成功摄取载体的细胞的产量很高。

实例5、用于在pDK9-2中交换表达启动子的方法

用HindIII和BglII消化pDK9-2载体以移除CMV增强子和启动子。可以***任何合适的替代启动子以代替CMV增强子和启动子。非限制性实例包含:来自人、小鼠或鸡的β-肌动蛋白基因的启动子、泛素C基因的启动子或来自疱疹病毒的胸苷激酶基因的启动子。

实例6、用于在pDK9-2中交换poly A信号的方法

用NotI和TspGWI消化pDK9-2载体以移除SV40后期poly A信号。可以***任何合适的替代Poly A信号以代替SV40后期poly A信号。非限制性实例包含:来自牛的生长激素Poly A信号和合成Poly A信号。

实例7、用于在pDK9-2中交换PBR322复制起点的方法

用AscI和SbfI消化pDK9-2载体以移除PBR322复制起点。可以***任何合适的替代复制起点以代替PBR322复制起点。非限制性实例包含:P15A低拷贝数复制起点或pUC复制起点

实例8、pDK-Streamline载体

pDK-Streamline载体(图23)包含以下结构组分:表达载体主启动子、表达载体可选择标志物、用于同源臂的稀有8碱基限制性位点、增加蛋白质表达的RNA稳定剪接位点、用于细菌或无细胞表达的T7启动子以及用于RNA稳定性的poly A信号序列。pDK Streamline载体的主链可以是3.6kb或更小。

表达载体主启动子的非限制性实例(图24)包含CMV增强子和启动子、鸡β-肌动蛋白启动子和Ubc启动子。这些启动子各自提供独特的优势。CMV增强子和启动子是用于实现高水平蛋白质表达的病毒启动子,而鸡β-肌动蛋白启动子被视作是最强的“天然”启动子之一。Ubc启动子是表达泛素系统组分的启动子,其几乎在每种细胞类型中都具有活性。如本领域众所周知的,选择合适的启动子以驱动基因表达是细胞疗法成功的关键。pDK-Streamline载体旨在通过使用侧翼限制性位点让改变主要启动子变得容易。

表达载体可选择标志物具有较小的尺寸,部分原因是消除了细菌的单独可选择标志物。通过产生在原核生物(细菌)和真核生物(哺乳动物细胞)中都具有活性的杂合启动子(图25),在来自单个基因的两种环境中都存在抗生素抗性。pDK-Streamline载体可以包含3种可选择标志物之一:杀稻瘟菌素S脱氨酶、嘌呤霉素-N-乙酰转移酶和新霉素磷酸转移酶。设想其它可选标志物可能是有用的。

将同源臂***表达盒的任一侧(图26)。每侧的两翼是两个8碱基限制性位点(图26)。8碱基切割器非常罕见,使得无论目的基因或同源臂如何,它们在载体中是独特的。在罕见情况下,这些位点中的一个或多个位于其它位置,每侧都有8碱基平端切割器或PCR片段,所述8碱基平端切割用于***来自带有平端酶的限制性消化的平端片段,限制性消化之后是末端抛光。左臂位于主启动子(例如CMV)的正前方,一侧具有SwaI(平端)并且另一侧具有SbfI。右臂一侧具有AscI并且在Poly A信号之后具有PmeI(平端)(图26)。该组构允许在pDK-Streamline载体中容易地交换同源臂。

同源臂***位点在(高拷贝数)细菌复制起点的任一侧上的放置确该起点不会作为***基因组的模板的一部分包含于细胞中,从而使意外影响最小化。如果需要的话,起点也可以充当线性化载体的方便位置。

已经证明允许剪接RNA可以增加RNA的稳定性。RNA本身就不稳定并且其保持完整的时间越长,可表达的蛋白质的量就越多。大多数蛋白质表达开放阅读框(ORF)来自cDNA或DNA序列,其中已经移除所有内含子,主要是为了减小序列的大小。添加人工剪接位点可以增强RNA稳定性。pDK-Streamline包含人工剪接位点,所述人工剪接位点增强RNA稳定性并且允许增加蛋白质表达(图27)。

此外,如果需要的话,人工剪接位点还为另外的细菌表达盒创建空间。例如,可以将更传统的细菌抗性标志物***人工剪接位点中并且所述标志物将作为“填充序列”,当处于真核细胞内部时,所述填充序列将从消息中拼接出来。

pDK-Streamline载体包含恰好位于多克隆位点上游的T7启动子(图28)。T7启动子的存在有几点益处。第一,T7启动子为测序提供了方便的引发位点。第二,它允许体外转录和翻译(无细胞蛋白质表达)。第三,它允许在不使用分离载体的情况下的目的蛋白质的细菌表达。

实例9、pDK-Streamline载体的产生和使用

制备用于蛋白质表达的DNA载体有两个主要步骤:1)用表达盒产生载体以及2)通常通过使用细菌宿主来扩增新载体。“表达盒”是允许蛋白质表达所需的所有片段。通常,表达盒将包含:1)启动子;2)kozac起始序列;3)待表达基因的cDNA;4)和多腺苷酸化信号序列。图29示出了pDK-Streamline载体的两个表达盒部分。一旦组装好载体,就将DNA载体在细菌中扩增并且纯化以供使用。

为了扩增,载体需要复制起点(驱动细菌DNA复制的序列)和通常表达对抗生素(可选择标志物)的抗性的基因。为了扩增,DNA载体被迫进入合适的细菌宿主,这可以使用本领域众所周知的方法来完成。然后用选择的抗生素(LB琼脂)将细菌在营养固体培养基上扩散。只有摄取了载体并且因此能够表达对抗生素的抗性的细菌才能生长。大约24小时后,将有带有载体的细菌克隆“菌落”。将一个或多个菌落分别转移到液体培养基中,也用抗生素进行继续扩增。大约24小时后,细菌被裂解并且DNA载体被纯化用于其它用途。

该一般方法还用于选择已用这种载体转染或编辑的哺乳动物细胞。第一,将具有可选择标志物的载体引入哺乳动物细胞中。第二,添加抗生素以杀死不摄取载体的细胞。第三,扩增在选择下存活的细胞。

传统载体(例如,英杰公司的pcDNA3-1)将具有单独的、仅细菌的可选择标志物,其通常对氨苄青霉素、卡那霉素、四环素等具有抗性(图30B)。遗传载体具有用于哺乳动物细胞的单独的可选择标志物,如对嘌呤霉素、杀稻瘟菌素S、新霉素等具有抗性(图30B)。标志物将表达为单独的表达盒(图30B)。由于需要两个单独的表达盒,这些载体本身就大于pDK-Streamline载体(图30A-30B)。

pDK-Streamline载体通过产生能够在细菌细胞和哺乳动物中起作用的启动子将用于这两者的可选择标志物组合成一个表达盒(图30A)。启动子仅限于在细菌或如哺乳动物细胞等真核细胞中起作用。通过将两个单独的启动子排列并融合到一个表达盒中,pDK-Streamline载体能够在细菌和真核细胞中使用单个可选择标志物。

以前从未将细菌和哺乳动物选择物置于一个表达盒下,因此如嘌呤霉素和杀稻瘟菌素S等抗生素通常不用于细菌选择物。部分的试剂盒可以包含生长培养基,例如已含有嘌呤霉素或杀稻瘟菌素S的LB琼脂板或液体培养基。例如,带有pDK-SL1Blast的试剂盒可以具有含有杀稻瘟菌素S的LB琼脂板,或者带有pDK-SL1Puro的试剂盒可以具有含有嘌呤霉素的LB琼脂板等。抗生素选择板可以包含在试剂盒中的pDK-Streamline载体中。可以特别配制生长培养基(例如,抗生素选择板(例如琼脂板)或液体培养基)用于原核细胞的生长和选择。可以特别配制生长培养基(例如,抗生素选择板(例如,琼脂板)或液体培养基)用于真核细胞的生长和选择。

pDK-Streamline载体具有的另一个特征是能够在表达盒之前和之后***同源臂。当您想要将表达盒***特定基因组位点,例如与CRISPR组合时,需要同源臂。

包含CRISPR的基因组编辑的典型过程如下进行:(1)CRISPR复合物在基因组中的特定位点处产生双链断裂;(2a)细胞识别基因组损伤并且对它进行修复,或者通过移除断裂周围的少量序列并且然后将它连接在一起;或者(2b)细胞使用另一个染色体作为模板来修复断裂以具有与该染色体相同的序列。

因为序列将被破坏并且可能超出框架,所以上文的2a导致基因敲除。可以利用上文的2b将序列改变为优选的序列。如果细胞中充满了在双链断裂的任一侧具有同源性(相同序列)的替代序列,则细胞可以在修复期间将其用作模板并且反而引入该序列(图31A-31B)。这被称为“敲入”(对比当基因序列被破坏并且失去功能时的“敲除”)。

同源臂***位点恰好被放置在用于目的基因和可选择标志物的表达盒之前和之后(图32)。这些位点与用于稀有切割酶的限制性位点结合,使得同源臂可以容易且定向地***(同源臂必须与基因组在同一方向上)。精心放置的限制性位点可以轻松***并且轻松改变同源臂。

每个同源臂的酶共混物以及甚至通过切除细菌复制起点使载体线性化的共混物可以包括在包含pDK-Streamline载体的试剂盒中。载体经常被“线性化”或用限制酶切割以增加整合的机会以及移除任何***后可能有害的序列。

设想可能存在三种不同的共混物:一种用于左臂,一种用于右臂以及一种具有切割最接近复制起点的两种酶(图33)。如上所描述的,虽然用于切割限制性位点的酶已经上市销售,但是无法获得可商购的限制酶的共混物。因为这种共混物可以减少误差(仅添加一种酶将打开载体但是将不允许***)并且使其更方便,所以它对用户具有吸引力。

实例9证明了pDK-Streamline载体的技术优势和易用性。此外,此实例展示了将pDK-Streamline载体与用于扩增载体的其它组分(例如包含预制的抗生素琼脂板)包含在一起或者对例如试剂盒中的载体进行修饰(例如,使用酶共混物改变同源臂)的潜力。

本发明不限于本申请中描述的特定实施例,所述实施例旨在作为本公开的各个方面的单一说明。本文将不描述本公开的所有各个实施例。在不脱离本公开的精神和范围的情况下,可以对本公开进行许多修改和变化,这对本领域技术人员而言是显而易见的。除了本文列举的那些之外,根据前述描述,本公开的范围内的功能等效方法和设备对于本领域技术人员而言是显而易见的。这种修改和变化旨在落入所附权利要求书的范围内。本公开仅受所附权利要求的条款与这些权利要求所赋予的等同物的全部范围的限制。

应理解,本公开不限于当然可以变化的特定用途、方法、试剂、化合物、组合物或生物系统。还应理解,本文所使用的术语仅出于描述特定实施例的目的,而不旨在是限制性的。

P实施例

实施例P1.一种质粒载体,其包括:

(a)原核复制起点;

(b)适合于表达一个或多个转基因的真核启动子;

(c)用于***所述一个或多个转基因的多克隆位点;以及

(d)编码可选择标志物的核酸,所述核酸可操作地连接到真核启动子和原核启动子,其中所述可选择标志物适合于原核选择和真核选择二者;

其中所述载体的长度小于3.6千碱基。

实施例P2.根据实施例P1所述的质粒载体,其中元件(a)-(d)在所述质粒的5到3方向上顺序布置。

实施例P3.根据实施例P1或P2所述的质粒载体,其进一步包括位于元件(a)与元件(b)之间的上游同源臂***位点以及下游同源臂***位点。

实施例P4.根据实施例P3所述的质粒载体,所述下游同源臂***位点位于元件(d)之后。

实施例P5.根据实施例P1到P4中任一项所述的质粒载体,其进一步包括处于元件(b)与元件(c)之间的合成剪接位点,所述合成剪接位点增强从(b)的所述真核启动子转录的RNA的稳定性。

实施例P6.根据实施例P1到P5中任一项所述的质粒载体,其进一步包括处于(d)的所述多克隆位点之后的poly A序列。

实施例P7.根据实施例P1到P6中任一项所述的质粒载体,其进一步包括用于体外表达所述一个或多个转基因的处于(d)的所述多克隆位点上游的另外的启动子。

实施例P8.根据实施例P7所述的质粒载体,其中所述用于体外表达的另外的启动子是T7启动子。

实施例P9.根据实施例P1到P8中任一项所述的质粒载体,其中(a)的所述复制起点选自由以下组成的组:pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101和pC101p-157。

实施例P10.根据实施例P9所述的质粒载体,其中(a)的所述复制起点是pBR322Ori。

实施例P11.根据实施例P1到P10中任一项所述的质粒载体,其中(b)的所述真核启动子选自由以下组成的组:巨细胞病毒(CMV)启动子;来自人、鼠或鸡的β-肌动蛋白基因的启动子;泛素C基因的启动子;和来自疱疹病毒的胸苷激酶基因的启动子。

实施例P12.根据实施例P11所述的质粒载体,其中(b)的所述真核启动子是巨细胞病毒(CMV)启动子。

实施例P13.根据实施例P1到P12中任一项所述的质粒载体,其中所述可选择标志物选自由抗生素抗性基因、荧光蛋白和酶组成的组。

实施例P14.根据实施例P13所述的质粒载体,其中所述可选择标志物是抗生素抗性基因。

实施例P15.根据实施例P13所述的质粒载体,其中所述可选择标志物是杀稻瘟菌素S脱氨酶。

实施例P16.根据实施例P13所述的质粒载体,其中所述可选择标志物是荧光蛋白。

实施例P17.根据实施例P16所述的质粒载体,其中所述荧光蛋白是近红外荧光蛋白。

实施例P18.根据实施例P1到P17中任一项所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到SV40启动子。

实施例P19.根据实施例P1到P18中任一项所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到EM7启动子。

实施例P20.根据实施例P1到P19中任一项所述的质粒载体,其中所述多克隆位点包括SEQ ID NO:2的核苷酸1427到1479中列出的序列。

实施例P21.根据实施例P3到P20中任一项所述的质粒载体,其中所述上游同源臂***位点包括SEQ ID NO:2的核苷酸311到336中列出的序列。

实施例P22.根据实施例P3到P21中任一项所述的质粒载体,其中所述下游同源臂***位点包括SEQ ID NO:2的核苷酸2960到2985中列出的序列。

实施例P23.根据实施例P1到P22中任一项所述的质粒载体,其中所述载体具有SEQID NO:2中列出的核苷酸序列。

实施例P24.根据实施例P1所述的质粒载体,其进一步包括***在所述多克隆位点处的转基因。

实施例P25.根据实施例P24所述的质粒载体,其中所述转基因编码治疗性蛋白质或治疗性RNA。

实施例P26.根据实施例P3到P25中任一项所述的质粒载体,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。

实施例P27.根据实施例P1到P26中任一项所述的质粒载体,其中所述转基因核酸的长度范围为约5kb到300kb。

实施例P28.一种用于基因表达的方法,所述方法包括:用根据实施例P1到P27中任一项所述的载体转染真核细胞,所述载体进一步包括***在所述多克隆位点处的转基因;以及在适合于表达所述转基因的条件下培养所述细胞。

实施例P29.一种用于修饰哺乳动物细胞中的靶基因组基因座的方法,所述方法包括:

(a)将以下引入到哺乳动物细胞中:

(i)核酸酶试剂,所述核酸酶试剂在靶基因组基因座处或附近产生单链或双链断裂,以及

(ii)根据实施例P1到P27中任一项所述的载体,所述载体进一步包括***在所述多克隆位点处的转基因,所述多克隆位点处于***在所述上游同源臂***位点处的上游同源臂和***在所述下游同源臂处的下游同源臂的侧翼;以及

(b)选择包括所述靶基因组基因座上的所述转基因的靶向哺乳动物细胞。

实施例P30.根据实施例P29所述的方法,其中所述细胞通过检测所述可选择标志物来选择。

实施例P31.根据实施例P29或P30所述的方法,其中所述哺乳动物细胞是多能细胞。

实施例P32.根据实施例P31所述的方法,其中所述多能细胞是诱导多能干(iPS)细胞、胚胎干(ES)细胞、成体干细胞、造血干细胞、神经元干细胞。

实施例P33.根据实施例P29或P30所述的方法,其中所述哺乳动物细胞是人成纤维细胞。

实施例P34.根据实施例P29或P30所述的方法,其中所述哺乳动物细胞是从患有疾病的患者分离的人细胞,并且其中所述人细胞在其基因组中包括至少一种人类疾病等位基因。

实施例P35.根据实施例P34所述的方法,其中将所述转基因整合到所述靶基因组基因座中代替所述基因组中的所述至少一种人类疾病等位基因。

实施例P36.根据实施例P29或P30所述的方法,其中所述核酸酶试剂是表达构建体,所述表达构建体包括编码核酸酶的核酸序列,并且其中所述核酸可操作地连接到在所述哺乳动物细胞中具有活性的启动子。

实施例P37.根据实施例P36所述的方法,其中所述核酸酶试剂是编码核酸酶的mRNA。

实施例P38.根据实施例P36所述的方法,其中所述核酸酶是锌指核酸酶(ZFN)。

实施例P39.根据实施例P36所述的方法,其中所述核酸酶是类转录激活因子效应物核酸酶(TALEN)。

实施例P40.根据实施例P36所述的方法,其中所述核酸酶是大范围核酸酶。

实施例P41.根据实施例P36所述的方法,其中所述核酸酶是Cas9核酸酶。

实施例P42.根据实施例P36到P41中任一项所述的方法,其中所述核酸酶试剂的靶序列位于所述靶基因组基因座中的内含子、外显子、启动子、启动子调节区或增强子区中。

实施例P43.根据实施例P42所述的方法,其中所述靶序列是AAV1整合位点。

实施例P44.根据实施例P36到P43中任一项所述的方法,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。

实施例P45.根据实施例P36到P44中任一项所述的方法,其中所述转基因核酸的长度范围为约5kb到300kb。

实施例

实施例1.一种质粒载体,其包括:

(a)原核复制起点;

(b)适合于表达一个或多个转基因的真核启动子;

(c)用于***所述一个或多个转基因的多克隆位点;以及

(d)编码可选择标志物的核酸,所述核酸可操作地连接到包含真核启动子和原核启动子的双启动子,其中所述可选择标志物适核于原核选择和真核选择二者;

其中所述载体的长度小于3.6千碱基。

实施例2.根据实施例1所述的质粒载体,其中元件(a)-(d)在所述质粒的5到3方向上顺序布置。

实施例3.根据实施例1或2所述的质粒载体,其进一步包括位于元件(a)与元件(b)之间的上游同源臂***位点以及下游同源臂***位点。

实施例4.根据实施例3所述的质粒载体,所述下游同源臂***位点位于元件(d)之后。

实施例5.根据实施例1到4中任一项所述的质粒载体,其进一步包括处于元件(b)与元件(c)之间的合成剪接位点,所述合成剪接位点增强从(b)的所述真核启动子转录的RNA的稳定性。

实施例6.根据实施例1到5中任一项所述的质粒载体,其进一步包括处于(d)的所述多克隆位点之后的poly A序列。

实施例7.根据实施例1到6中任一项所述的质粒载体,其进一步包括用于体外表达所述一个或多个转基因的处于(d)的所述多克隆位点上游的另外的启动子。

实施例8.根据实施例7所述的质粒载体,其中所述用于体外表达的另外的启动子是T7启动子。

实施例9.根据实施例1到8中任一项所述的质粒载体,其中(a)的所述复制起点选自由以下组成的组:pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101和pC101p-157。

实施例10.根据实施例9所述的质粒载体,其中(a)的所述复制起点是pBR322Ori。

实施例11.根据实施例1到10中任一项所述的质粒载体,其中(b)的所述真核启动子选自由以下组成的组:巨细胞病毒(CMV)启动子;来自人、鼠或鸡的β-肌动蛋白基因的启动子;泛素C基因的启动子;和来自疱疹病毒的胸苷激酶基因的启动子。

实施例12.根据实施例11所述的质粒载体,其中(b)的所述真核启动子是巨细胞病毒(CMV)启动子。

实施例13.根据实施例1到12中任一项所述的质粒载体,其中所述可选择标志物选自由抗生素抗性基因、荧光蛋白和酶组成的组。

实施例14.根据实施例13所述的质粒载体,其中所述可选择标志物是抗生素抗性基因。

实施例15.根据实施例13所述的质粒载体,其中所述可选择标志物是杀稻瘟菌素S脱氨酶。

实施例16.根据实施例13所述的质粒载体,其中所述可选择标志物是嘌呤霉素-N-乙酰转移酶。

实施例17.根据实施例13所述的质粒载体,其中所述可选择标志物是新霉素磷酸转移酶。

实施例18.根据实施例13所述的质粒载体,其中所述可选择标志物是荧光蛋白。

实施例19.根据实施例16所述的质粒载体,其中所述荧光蛋白是近红外荧光蛋白。

实施例20.根据实施例1到19中任一项所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到SV40启动子。

实施例21.根据实施例1到20中任一项所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到EM7启动子。

实施例22.根据实施例1到21中任一项所述的质粒载体,其中所述多克隆位点包括SEQ ID NO:2的核苷酸1427到1479中列出的序列。

实施例23.根据实施例3到22中任一项所述的质粒载体,其中所述上游同源臂***位点包括SEQ ID NO:2的核苷酸311到336中列出的序列。

实施例24.根据实施例3到23中任一项所述的质粒载体,其中所述下游同源臂***位点包括SEQ ID NO:2的核苷酸2960到2985中列出的序列。

实施例25.根据实施例1到24中任一项所述的质粒载体,其中所述载体具有SEQ IDNO:2中列出的核苷酸序列。

实施例26.根据实施例1所述的质粒载体,其进一步包括***在所述多克隆位点处的转基因。

实施例27.根据实施例26所述的质粒载体,其中所述转基因编码治疗性蛋白质或治疗性RNA。

实施例28.根据实施例3到27中任一项所述的质粒载体,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。

实施例29.根据实施例1到28中任一项所述的质粒载体,其中所述转基因核酸的长度范围为约5kb到300kb。

实施例30.根据实施例1到29中任一项所述的质粒载体,其中所述原核复制起点不是F1起点。

实施例31.根据实施例1到30中任一项所述的质粒载体,其中所述质粒载体恰好包括一个可选择标志物。

实施例32.一种用于基因表达的方法,所述方法包括用根据实施例1到31中任一项所述的载体转染真核细胞,所述载体进一步包括***在所述多克隆位点处的转基因;以及在适合于表达所述转基因的条件下培养所述细胞。

实施例33.一种用于修饰哺乳动物细胞中的靶基因组基因座的方法,所述方法包括:

(a)将以下引入到哺乳动物细胞中:

(i)核酸酶试剂,所述核酸酶试剂在靶基因组基因座处或附近产生单链或双链断裂,以及

(ii)根据实施例1到31中任一项所述的载体,所述载体进一步包括***在所述多克隆位点处的转基因,所述多克隆位点处于***在所述上游同源臂***位点处的上游同源臂和***在所述下游同源臂处的下游同源臂的侧翼;以及

(b)选择包括所述靶基因组基因座上的所述转基因的靶向哺乳动物细胞。

实施例34.根据实施例33所述的方法,其中所述细胞通过检测所述可选择标志物来选择。

实施例35.根据实施例33或34所述的方法,其中所述哺乳动物细胞是多能细胞。

实施例36.根据实施例35所述的方法,其中所述多能细胞是诱导多能干(iPS)细胞、胚胎干(ES)细胞、成体干细胞、造血干细胞、神经元干细胞。

实施例37.根据实施例33或34所述的方法,其中所述哺乳动物细胞是人成纤维细胞。

实施例38.根据实施例33或34所述的方法,其中所述哺乳动物细胞是从患有疾病的患者分离的人细胞,并且其中所述人细胞在其基因组中包括至少一种人类疾病等位基因。

实施例39.根据实施例38所述的方法,其中将所述转基因整合到所述靶基因组基因座中代替所述基因组中的所述至少一种人类疾病等位基因。

实施例40.根据实施例33或34所述的方法,其中所述核酸酶试剂是表达构建体,所述表达构建体包括编码核酸酶的核酸序列,并且其中所述核酸可操作地连接到在所述哺乳动物细胞中具有活性的启动子。

实施例41.根据实施例40所述的方法,其中所述核酸酶试剂是编码核酸酶的mRNA。

实施例42.根据实施例40所述的方法,其中所述核酸酶是锌指核酸酶(ZFN)。

实施例43.根据实施例40所述的方法,其中所述核酸酶是类转录激活因子效应物核酸酶(TALEN)。

实施例44.根据实施例40所述的方法,其中所述核酸酶是大范围核酸酶。

实施例45.根据实施例40所述的方法,其中所述核酸酶是Cas9核酸酶。

实施例46.根据实施例40到45中任一项所述的方法,其中所述核酸酶试剂的靶序列位于所述靶基因组基因座中的内含子、外显子、启动子、启动子调节区或增强子区中。

实施例47.根据实施例46所述的方法,其中所述靶序列是AAV1整合位点。

实施例48.根据实施例40到47中任一项所述的方法,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。

实施例49.根据实施例40到48中任一项所述的质粒载体,其中所述转基因核酸的长度范围为约5kb到300kb。

实施例50.一种试剂盒,其包括根据实施例1到31中任一项所述的载体和包含抗生素的生长培养基。

实施例51.根据实施例50所述的试剂盒,其中所述抗生素是杀稻瘟菌素S、嘌呤霉素或新霉素。

实施例52.根据实施例50或51所述的试剂盒,其中所述生长培养基是液体生长培养基、固体生长培养基或半固体生长培养基。

实施例53.根据实施例50或52所述的试剂盒,其中所述固体生长培养基是琼脂。

实施例54.根据实施例50到53中任一项所述的试剂盒,其进一步包括第一、第二和第三限制酶共混物。

实施例55.根据实施例54所述的试剂盒,所述第一限制酶共混物包括用于限制位点SwaI和SbfI的限制酶;其中所述第二限制酶共混物包括用于限制位点AscI和PmeI的限制酶;并且其中所述第三限制酶共混物包括用于限制位点PmeI和SwaI的限制酶。

实施例56.根据实施例50到55中任一项所述的试剂盒,其进一步包括用于基因组编辑的II型CRISPR系统。

实施例57.根据实施例50到55中任一项所述的试剂盒,其进一步包括用于基因组编辑的TALEN系统。

实施例58.根据实施例50到55中任一项所述的试剂盒,其进一步包括用于基因组编辑的锌指核酸酶系统。

实施例59.一种质粒载体,其包括双启动子和在真核细胞和原核细胞二者中起作用的单个可选择标志物,所述载体不包含另外的可选择标志物。

序列表

<110> D·基维利希

<120> 用于表达大型核酸转基因的质粒载体

<130> 888888-888001WO

<150> US 62/416,617

<151> 2016-11-02

<160> 45

<170> PatentIn版本3.5

<210> 1

<211> 3349

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 1

tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60

ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120

aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360

ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480

gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540

caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600

caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660

cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720

agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780

agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840

gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900

ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960

cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020

aggtgtccac tcccagttca attacagctc ttaaggctag agtacttaat acgactcact 1080

ataggctagc ctcgagaatt cacgcgtggt acctctagag tcgacccggg cggccgcttc 1140

cctttagtga gggttaatgc ttcgagcaga catgataaga tacattgatg agtttggaca 1200

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1260

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1320

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1380

atgtggtaca cggagtggca gcaccatggc ctgaaataac ctctgaaaga ggaacttggt 1440

taggtacctt ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa 1500

agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 1560

ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 1620

attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 1680

gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 1740

ccgcctcggc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 1800

tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcag cacgtgttga 1860

caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga ggaactaaac 1920

catggccaag cctttgtctc aagaagaatc caccctcatt gaaagagcaa cggctacaat 1980

caacagcatc cccatctctg aagactacag cgtcgccagc gcagctctct ctagcgacgg 2040

ccgcatcttc actggtgtca atgtatatca ttttactggg ggaccttgtg cagaactcgt 2100

ggtgctgggc actgctgctg ctgcggcagc tggcaacctg acttgtatcg tcgcgatcgg 2160

aaatgagaac aggggcatct tgagcccctg cggacggtgc cgacaggtgc ttctcgatct 2220

gcatcctggg atcaaagcca tagtgaagga cagtgatgga cagccgacgg cagttgggat 2280

tcgtgaattg ctgccctctg gttatgtgtg ggagggctaa gcacttcgtg gccgaggagc 2340

aggactgaca cgtgctacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 2400

tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 2460

agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 2520

gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 2580

aactcatcaa tgtatcttat catgtctgta ctcatgacca aaatccctta acgtgagttt 2640

tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 2700

tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 2760

ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 2820

ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 2880

gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 2940

aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3000

ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3060

agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3120

aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3180

aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3240

ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3300

cggttcctgg ccttttgctg gccttttgct cacatggctc gacagatct 3349

<210> 2

<211> 3295

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 2

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 60

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 120

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 180

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 240

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 300

cagcaacgcg atttaaatac ggttcctgcc tgcaggagat cttcaatatt ggccattagc 360

catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt 420

gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg 480

gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 540

atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 600

cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 660

tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 720

agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 780

gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt 840

agtcatcgct attaccatgg tgatgcggtt ttggcagtac accaatgggc gtggatagcg 900

gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 960

gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tgcgatcgcc cgccccgttg 1020

acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc tcgtttagtg 1080

aaccgtcaga tcactagaag ctttattgcg gtagtttatc acagttaaat tgctaacgca 1140

gtcagtgctt ctgacacaac agtctcgaac ttaagctgca gtgactctct taaggtagcc 1200

ttgcagaagt tggtcgtgag gcactgggca ggtaagtatc aaggttacaa gacaggttta 1260

aggagaccaa tagaaactgg gcttgtcgag acagagaaga ctcttgcgtt tctgataggc 1320

acctattggt cttactgaca tccactttgc ctttctctcc acaggtgtcc actcccagtt 1380

caattacagc tcttaaggct agagtactta atacgactca ctataggcta gcctcgagaa 1440

ttcacgcgtg gtacctctag agtcgacccg ggcggccgct tccctttagt gagggttaat 1500

gcttcgagca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 1560

gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 1620

aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 1680

ggagatgtgg gaggtttttt aaagcaagta aaacctctac aaatgtggta cacggagtgg 1740

cagcaccatg gcctgaaata acctctgaaa gaggaacttg gttaggtacc ttctgaggcg 1800

gaaagaacca gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag 1860

caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc 1920

caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag 1980

tcccgcccct aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc 2040

cccatggctg actaattttt tttatttatg cagaggccga ggccgcctcg gcctctgagc 2100

tattccagaa gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg 2160

gagcttgtat atccattttc ggatctgatc agcacgtgtt gacaattaat catcggcata 2220

gtatatcggc atagtataat acgacaaggt gaggaactaa accatggcca agcctttgtc 2280

tcaagaagaa tccaccctca ttgaaagagc aacggctaca atcaacagca tccccatctc 2340

tgaagactac agcgtcgcca gcgcagctct ctctagcgac ggccgcatct tcactggtgt 2400

caatgtatat cattttactg ggggaccttg tgcagaactc gtggtgctgg gcactgctgc 2460

tgctgcggca gctggcaacc tgacttgtat cgtcgcgatc ggaaatgaga acaggggcat 2520

cttgagcccc tgcggacggt gccgacaggt gcttctcgat ctgcatcctg ggatcaaagc 2580

catagtgaag gacagtgatg gacagccgac ggcagttggg attcgtgaat tgctgccctc 2640

tggttatgtg tgggagggct aagcacttcg tggccgagga gcaggactga cacgtgctac 2700

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 2760

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 2820

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2880

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2940

atcatgtctg tactcatgag gcgcgcccgt cagacccgtt taaacagatc aaaggatctt 3000

cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 3060

cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 3120

tcagcagagc gcagatacca aatactgttc ttctagtgta gccgtagtta ggccaccact 3180

tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 3240

ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttacc 3295

<210> 3

<211> 3592

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 3

tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60

acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120

ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180

ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240

tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300

tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aatacggttc 360

ctgcctgcag gagatcttca atattggcca ttagccatat tattcattgg ttatatagca 420

taaatcaata ttggctattg gccattgcat acgttgtatc tatatcataa tatgtacatt 480

tatattggct catgtccaat atgaccgcca tgttggcatt gattattgac tagttattaa 540

tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 600

cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 660

atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 720

tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtccgccc 780

cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 840

cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 900

cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 960

ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 1020

aaatgtcgta acaactgcga tcgcccgccc cgttgacgca aatgggcggt aggcgtgtac 1080

ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcact agaagcttta 1140

ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgcttctgac acaacagtct 1200

cgaacttaag ctgcagtgac tctcttaagg tagccttgca gaagttggtc gtgaggcact 1260

gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg 1320

tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac 1380

tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt 1440

acttaatacg actcactata ggctagcctc gagaattcac gcgtggtacc tctagagtcg 1500

acccgggcgg ccgcttccct ttagtgaggg ttaatgcttc gagcagacat gataagatac 1560

attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 1620

atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 1680

aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt tttttaaagc 1740

aagtaaaacc tctacaaatg tggtacacgg agtggcagca ccatggcctg aaataacctc 1800

tgaaagagga acttggttag gtaccttctg aggcggaaag aaccagctgt ggaatgtgtg 1860

tcagttaggg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 1920

tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat 1980

gcaaagcatg catctcaatt agtcagcaac catagtcccg cccctaactc cgcccatccc 2040

gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa ttttttttat 2100

ttatgcagag gccgaggccg cctcggcctc tgagctattc cagaagtagt gaggaggctt 2160

ttttggaggc ctaggctttt gcaaaaagct cccggccggg agcttgtata tccattttcg 2220

gatctgatca gcacgtgttg acaattaatc atcggcatag tatatcggca tagtataata 2280

cgacaaggtg aggaacgcca ccatgattga acaagatgga ttgcacgcag gttctccggc 2340

cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 2400

tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 2460

gtccggtgcc ctgaatgaac tgcaagacga ggcagcgcgg ctatcgtggc tggccacgac 2520

gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 2580

attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 2640

atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 2700

cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 2760

cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 2820

gctcaaggcg agcatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt 2880

gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 2940

tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 3000

cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 3060

catcgccttc tatcgccttc ttgacgagtt cttcgccggc tggatgatcc tccagcgcgg 3120

ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt ataatggtta 3180

caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag 3240

ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtactcatg aggcgcgccc 3300

gtcagacccg tttaaacaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 3360

ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 3420

gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 3480

tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 3540

cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cg 3592

<210> 4

<211> 3405

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 4

tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60

acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120

ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180

ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240

tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300

tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aatacggttc 360

ctgcctgcag gagatcttca atattggcca ttagccatat tattcattgg ttatatagca 420

taaatcaata ttggctattg gccattgcat acgttgtatc tatatcataa tatgtacatt 480

tatattggct catgtccaat atgaccgcca tgttggcatt gattattgac tagttattaa 540

tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 600

cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 660

atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 720

tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtccgccc 780

cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 840

cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 900

cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 960

ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 1020

aaatgtcgta acaactgcga tcgcccgccc cgttgacgca aatgggcggt aggcgtgtac 1080

ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcact agaagcttta 1140

ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgcttctgac acaacagtct 1200

cgaacttaag ctgcagtgac tctcttaagg tagccttgca gaagttggtc gtgaggcact 1260

gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg 1320

tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac 1380

tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt 1440

acttaatacg actcactata ggctagcctc gagaattcac gcgtggtacc tctagagtcg 1500

acccgggcgg ccgcttccct ttagtgaggg ttaatgcttc gagcagacat gataagatac 1560

attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 1620

atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 1680

aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt tttttaaagc 1740

aagtaaaacc tctacaaatg tggtacacgg agtggcagca ccatggcctg aaataacctc 1800

tgaaagagga acttggttag gtaccttctg aggcggaaag aaccagctgt ggaatgtgtg 1860

tcagttaggg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 1920

tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat 1980

gcaaagcatg catctcaatt agtcagcaac catagtcccg cccctaactc cgcccatccc 2040

gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa ttttttttat 2100

ttatgcagag gccgaggccg cctcggcctc tgagctattc cagaagtagt gaggaggctt 2160

ttttggaggc ctaggctttt gcaaaaagct cccggccggg agcttgtata tccattttcg 2220

gatctgatca gcacgtgttg acaattaatc atcggcatag tatatcggca tagtataata 2280

cgacaaggtg aggaactaaa cgccaccatg accgagtaca agcccacggt gcgcctcgcc 2340

acccgcgacg acgtccccag ggccgtacgc accctcgccg ccgcgttcgc cgactacccc 2400

gccacgcgcc acaccgtcga tccggaccgc cacatcgagc gggtcaccga gctgcaagaa 2460

ctcttcctca cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc 2520

gcggtggcgg tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc 2580

ggcccgcgca tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc 2640

ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg 2700

cccgaccacc agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc 2760

gagcgcgccg gggtgcccgc cttcctggag acctccgcgc cccgcaacct ccccttctac 2820

gagcggctcg gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg 2880

tgcatgaccc gcaagcccgg tgcctgagcc ggctggatga tcctccagcg cggggatctc 2940

atgctggagt tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa 3000

agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 3060

ttgtccaaac tcatcaatgt atcttatcat gtctgtactc atgaggcgcg cccgtcagac 3120

ccgtttaaac agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc 3180

ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca 3240

actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta 3300

gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct 3360

ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcg 3405

<210> 5

<211> 5472

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 5

tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60

ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120

aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360

ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480

gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540

caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600

caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660

cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720

agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780

agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840

gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900

ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960

cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020

aggtgtccac tcccagttca attacagctc ttaaggctag agtacttaat acgactcact 1080

ataggctagc ctcgagaatt cacgcgtggt acctctagag tcgacccggg cggccgcttc 1140

cctttagtga gggttaatgc ttcgagcaga catgataaga tacattgatg agtttggaca 1200

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1260

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1320

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1380

atgtggtaaa atccgataag gatcgatccg ggctggcgta atagcgaaga ggcccgcacc 1440

gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggacgcgccc tgtagcggcg 1500

cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc 1560

tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc 1620

gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg 1680

accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg 1740

tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg 1800

gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt 1860

cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa 1920

tattaacgct tacaatttcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc 1980

acaccgcata cgcggatctg cgcagcacca tggcctgaaa taacctctga aagaggaact 2040

tggttaggta ccttctgagg cggaaagaac cagctgtgga atgtgtgtca gttagggtgt 2100

ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca 2160

gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 2220

ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 2280

cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 2340

gaggccgcct cggcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 2400

ggcttttgca aaaagcttga ttcttctgac acaacagtct cgaacttaag gctagagcca 2460

ccatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat 2520

tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt 2580

cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac 2640

tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg 2700

tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc 2760

aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa 2820

tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc 2880

gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg 2940

aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg cgcatgcccg 3000

acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa 3060

atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg 3120

acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct 3180

tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc 3240

ttgacgagtt cttctgagcg ggactctggg gttcgaaatg accgaccaag cgacgcccaa 3300

cctgccatca cgatggccgc aataaaatat ctttattttc attacatctg tgtgttggtt 3360

ttttgtgtga atcgatagcg ataaggatcc gcgtatggtg cactctcagt acaatctgct 3420

ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 3480

gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 3540

tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 3600

gcctattttt ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt 3660

ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 3720

atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 3780

tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 3840

tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 3900

gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 3960

aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 4020

gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 4080

ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 4140

gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 4200

gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 4260

atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 4320

ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 4380

cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 4440

cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 4500

gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 4560

cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 4620

cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt 4680

taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga 4740

ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca 4800

aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 4860

caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 4920

taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag 4980

gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 5040

cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 5100

taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 5160

agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 5220

ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 5280

gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 5340

acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 5400

acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgg 5460

ctcgacagat ct 5472

<210> 6

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 6

gacccgggcg gccgcttccc tttagtgagg gttaa 35

<210> 7

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 7

tgctgccact ccgtgtacca catttgtaga ggttttactt gc 42

<210> 8

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 8

gtggtacacg gagtggcagc accatggcct gaaataacct ct 42

<210> 9

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 9

caaaagccta ggcctccaaa aaagcctcct cac 33

<210> 10

<211> 4852

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 10

tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60

ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120

aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360

ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480

gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540

caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600

caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660

cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720

agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780

agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840

gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900

ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960

cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020

aggtgtccac tcccagttca attacagctc ttaaggctag agtacttaat acgactcact 1080

ataggctagc ctcgagaatt cacgcgtggt acctctagag tcgacccggg cggccgcttc 1140

cctttagtga gggttaatgc ttcgagcaga catgataaga tacattgatg agtttggaca 1200

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1260

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1320

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1380

atgtggtaca cggagtggca gcaccatggc ctgaaataac ctctgaaaga ggaacttggt 1440

taggtacctt ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa 1500

agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 1560

ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 1620

attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 1680

gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 1740

ccgcctcggc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 1800

tttgcaaaga tcgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga 1860

ttgcacgcag gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa 1920

cagacaatcg gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt 1980

ctttttgtca agaccgacct gtccggtgcc ctgaatgaac tgcaagacga ggcagcgcgg 2040

ctatcgtggc tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa 2100

gcgggaaggg actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac 2160

cttgctcctg ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt 2220

gatccggcta cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact 2280

cggatggaag ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg 2340

ccagccgaac tgttcgccag gctcaaggcg agcatgcccg acggcgagga tctcgtcgtg 2400

acccatggcg atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc 2460

atcgactgtg gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt 2520

gatattgctg aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc 2580

gccgctcccg attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgagcg 2640

ggactctggg gttcgaaatg accgaccaag cgacgcccaa cctgccatca cgatggccgc 2700

aataaaatat ctttattttc attacatctg tgtgttggtt ttttgtgtga atcgatagcg 2760

ataaggatcc gcgtatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 2820

cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 2880

tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 2940

tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat 3000

gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga 3060

acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 3120

ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 3180

gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 3240

ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 3300

gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 3360

agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 3420

caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 3480

gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 3540

agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 3600

gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 3660

aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 3720

ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 3780

tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 3840

tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 3900

gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 3960

atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 4020

ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 4080

aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 4140

ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 4200

ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 4260

tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 4320

cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct 4380

gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 4440

gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 4500

tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 4560

ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 4620

gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 4680

ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 4740

tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 4800

ttacggttcc tggccttttg ctggcctttt gctcacatgg ctcgacagat ct 4852

<210> 11

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 11

ggaggcctag gcttttgcaa aaagctgagc 30

<210> 12

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 12

tcgtattata ctatgccgat atactatgcc gatgattaat tgtcaacacg tgctg 55

<210> 13

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 13

cagcacgtgt tgacaattaa tcatcggcat agtatatcgg catagtataa tacga 55

<210> 14

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 14

tcgacggtat acagacatga taagatacat tgatgag 37

<210> 15

<211> 4357

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 15

tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60

ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120

aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360

ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480

gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540

caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600

caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660

cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720

agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780

agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840

gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900

ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960

cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020

aggtgtccac tcccagttca attacagctc ttaaggctag agtacttaat acgactcact 1080

ataggctagc ctcgagaatt cacgcgtggt acctctagag tcgacccggg cggccgcttc 1140

cctttagtga gggttaatgc ttcgagcaga catgataaga tacattgatg agtttggaca 1200

aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1260

tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1320

tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1380

atgtggtaca cggagtggca gcaccatggc ctgaaataac ctctgaaaga ggaacttggt 1440

taggtacctt ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa 1500

agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 1560

ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 1620

attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 1680

gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 1740

ccgcctcggc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 1800

tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcag cacgtgttga 1860

caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga ggaactaaac 1920

catggccaag cctttgtctc aagaagaatc caccctcatt gaaagagcaa cggctacaat 1980

caacagcatc cccatctctg aagactacag cgtcgccagc gcagctctct ctagcgacgg 2040

ccgcatcttc actggtgtca atgtatatca ttttactggg ggaccttgtg cagaactcgt 2100

ggtgctgggc actgctgctg ctgcggcagc tggcaacctg acttgtatcg tcgcgatcgg 2160

aaatgagaac aggggcatct tgagcccctg cggacggtgc cgacaggtgc ttctcgatct 2220

gcatcctggg atcaaagcca tagtgaagga cagtgatgga cagccgacgg cagttgggat 2280

tcgtgaattg ctgccctctg gttatgtgtg ggagggctaa gcacttcgtg gccgaggagc 2340

aggactgaca cgtgctacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 2400

tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 2460

agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 2520

gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 2580

aactcatcaa tgtatcttat catgtctgta ctcatgagac aataaccctg ataaatgctt 2640

caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 2700

ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 2760

gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 2820

aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 2880

ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 2940

atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3000

gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3060

gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3120

atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3180

aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3240

actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3300

aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3360

tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3420

ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3480

agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 3540

tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 3600

aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 3660

gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 3720

atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 3780

gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 3840

gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 3900

tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 3960

accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4020

ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4080

cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4140

agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4200

ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4260

tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4320

ttttgctggc cttttgctca catggctcga cagatct 4357

<210> 16

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 16

tgagtttcat gaggcgcgcc cgtcagaccc gtttaaacag atcaaaggat cttcttgaga 60

<210> 17

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 17

tattgaagat ctcctgcagg caggaaccgt atttaaatcg cgttgctggc gtttttccat 60

<210> 18

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 18

tttggaggcc taggcttttg caaaaagctc c 31

<210> 19

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 19

gaggcgcacc gtgggcttgt actcggtcat ggtggcgttt agttcctcac cttgtcg 57

<210> 20

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 20

cgacaaggtg aggaactaaa cgccaccatg accgagtaca agcccacggt gcgcctc 57

<210> 21

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 21

catccagccg gctcaggcac cgggcttgcg ggtc 34

<210> 22

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 22

tttggaggcc taggcttttg caaaaagctc c 31

<210> 23

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 23

gtgcaatcca tcttgttcaa tcatggtggc gttcctcacc ttgtcgtatt atactatgc 59

<210> 24

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 24

gcatagtata atacgacaag gtgaggaacg ccaccatgat tgaacaagat ggattgcac 59

<210> 25

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 25

catccagccg gctcaggcac cgggcttgcg ggtc 34

<210> 26

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 26

agcctcgaga attctaatag gccaccatgt ccactgcggt cctggaaaac ccaggcttgg 60

<210> 27

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 27

ggaagcggcc gcctacttta ttttctggag ggcactgcaa aggattccaa tttcactg 58

<210> 28

<211> 4642

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 28

tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60

acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120

ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180

ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240

tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300

tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aatacggttc 360

ctgcctgcag gagatcttca atattggcca ttagccatat tattcattgg ttatatagca 420

taaatcaata ttggctattg gccattgcat acgttgtatc tatatcataa tatgtacatt 480

tatattggct catgtccaat atgaccgcca tgttggcatt gattattgac tagttattaa 540

tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 600

cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 660

atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 720

tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtccgccc 780

cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 840

cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 900

cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 960

ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 1020

aaatgtcgta acaactgcga tcgcccgccc cgttgacgca aatgggcggt aggcgtgtac 1080

ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcact agaagcttta 1140

ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgcttctgac acaacagtct 1200

cgaacttaag ctgcagtgac tctcttaagg tagccttgca gaagttggtc gtgaggcact 1260

gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg 1320

tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac 1380

tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt 1440

acttaatacg actcactata ggctagcctc gagaattcta ataggccacc atgtccactg 1500

cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag gaaacaagct 1560

atattgaaga caactgcaat caaaatggtg ccatatcgct gatcttctca ctcaaagaag 1620

aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta aacctgaccc 1680

acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc acccatttgg 1740

ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat gacattggtg 1800

ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg ttcccaagaa 1860

ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg gaactggatg 1920

ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag tttgctgaca 1980

ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg gaggaaggaa 2040

agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc catgcttgct 2100

atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat gaagataaca 2160

ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc cgcctccgac 2220

ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc cgagtcttcc 2280

actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa cctgacatct 2340

gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc cagttttccc 2400

aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag ctcgccacaa 2460

tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata aaggcatatg 2520

gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag aagccaaagc 2580

ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg gagttccagc 2640

ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg aactttgctg 2700

ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg attgaggtct 2760

tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa attggaatcc 2820

tttgcagtgc cctccagaaa ataaagtagg cggccgcttc cctttagtga gggttaatgc 2880

ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 2940

gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 3000

gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 3060

agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaca cggagtggca 3120

gcaccatggc ctgaaataac ctctgaaaga ggaacttggt taggtacctt ctgaggcgga 3180

aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg ctccccagca 3240

ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca 3300

ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc 3360

ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc 3420

catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc ctctgagcta 3480

ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggcc 3540

gggagcttgt atatccattt tcggatctga tcagcacgtg ttgacaatta atcatcggca 3600

tagtatatcg gcatagtata atacgacaag gtgaggaact aaaccatggc caagcctttg 3660

tctcaagaag aatccaccct cattgaaaga gcaacggcta caatcaacag catccccatc 3720

tctgaagact acagcgtcgc cagcgcagct ctctctagcg acggccgcat cttcactggt 3780

gtcaatgtat atcattttac tgggggacct tgtgcagaac tcgtggtgct gggcactgct 3840

gctgctgcgg cagctggcaa cctgacttgt atcgtcgcga tcggaaatga gaacaggggc 3900

atcttgagcc cctgcggacg gtgccgacag gtgcttctcg atctgcatcc tgggatcaaa 3960

gccatagtga aggacagtga tggacagccg acggcagttg ggattcgtga attgctgccc 4020

tctggttatg tgtgggaggg ctaagcactt cgtggccgag gagcaggact gacacgtgct 4080

acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 4140

ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 4200

caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 4260

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 4320

ttatcatgtc tgtactcatg aggcgcgccc gtcagacccg tttaaacaga tcaaaggatc 4380

ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct 4440

accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg 4500

cttcagcaga gcgcagatac caaatactgt tcttctagtg tagccgtagt taggccacca 4560

cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc 4620

tgctgccagt ggcgataagt cg 4642

<210> 29

<211> 6473

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 29

gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60

ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120

cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180

ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240

gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780

gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840

ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900

taagcttggt accgagctcg gatccactag tccagtgtgg tggaattcta ataggccacc 960

atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 1020

gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcgct gatcttctca 1080

ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 1140

aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 1200

acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 1260

gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 1320

ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 1380

gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 1440

tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 1500

gaggaaggaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 1560

catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 1620

gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 1680

cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 1740

cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 1800

cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 1860

cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 1920

ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1980

aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 2040

aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 2100

gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 2160

aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 2220

attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 2280

attggaatcc tttgcagtgc cctccagaaa ataaagtagg cggccgctcg aggtcaccca 2340

ttcgaacaaa aactcatctc agaagaggat ctgaatatgc ataccggtca tcatcaccat 2400

caccattgag tttaaacccg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 2460

gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 2520

tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 2580

ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 2640

gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 2700

ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 2760

accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 2820

gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 2880

tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 2940

gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 3000

agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 3060

ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 3120

tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 3180

ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3240

agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3300

ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 3360

ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 3420

ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 3480

tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgttgaca attaatcatc 3540

ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca tggccaagcc 3600

tttgtctcaa gaagaatcca ccctcattga aagagcaacg gctacaatca acagcatccc 3660

catctctgaa gactacagcg tcgccagcgc agctctctct agcgacggcc gcatcttcac 3720

tggtgtcaat gtatatcatt ttactggggg accttgtgca gaactcgtgg tgctgggcac 3780

tgctgctgct gcggcagctg gcaacctgac ttgtatcgtc gcgatcggaa atgagaacag 3840

gggcatcttg agcccctgcg gacggtgccg acaggtgctt ctcgatctgc atcctgggat 3900

caaagccata gtgaaggaca gtgatggaca gccgacggca gttgggattc gtgaattgct 3960

gccctctggt tatgtgtggg agggctaagc acttcgtggc cgaggagcag gactgacacg 4020

tgctacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 4080

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 4140

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 4200

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 4260

tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa tcatggtcat 4320

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 4380

gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 4440

gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 4500

aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 4560

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 4620

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 4680

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 4740

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 4800

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 4860

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 4920

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 4980

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 5040

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 5100

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 5160

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 5220

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 5280

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 5340

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 5400

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 5460

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 5520

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 5580

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 5640

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 5700

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 5760

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 5820

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 5880

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 5940

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 6000

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 6060

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 6120

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 6180

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 6240

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 6300

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 6360

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 6420

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtc 6473

<210> 30

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 30

aggctagcct cgaggtaata ggccaccatg cagatcgagc tgtccacctg cttttttctg 60

<210> 31

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 31

cagggttgtc cgggtgatct cccgctggtg acgcgtgctg gacacattct tgccccagct 60

<210> 32

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 32

agctggggca agaatgtgtc cagcacgcgt caccagcggg agatcacccg gacaaccctg 60

<210> 33

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 33

ggaagcggcc gctcatcagt acagatcctg ggcctcacat cccaggactt ccatcctgag 60

<210> 34

<211> 8340

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 34

tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60

acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120

ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180

ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240

tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300

tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aatacggttc 360

ctgcctgcag gagatcttca atattggcca ttagccatat tattcattgg ttatatagca 420

taaatcaata ttggctattg gccattgcat acgttgtatc tatatcataa tatgtacatt 480

tatattggct catgtccaat atgaccgcca tgttggcatt gattattgac tagttattaa 540

tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 600

cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 660

atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 720

tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtccgccc 780

cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 840

cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 900

cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 960

ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 1020

aaatgtcgta acaactgcga tcgcccgccc cgttgacgca aatgggcggt aggcgtgtac 1080

ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcact agaagcttta 1140

ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgcttctgac acaacagtct 1200

cgaacttaag ctgcagtgac tctcttaagg tagccttgca gaagttggtc gtgaggcact 1260

gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg 1320

tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac 1380

tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt 1440

acttaatacg actcactata ggctagcctc gaggtaatag gccaccatgc agatcgagct 1500

gtccacctgc ttttttctgt gcctgctgcg gttctgcttc agcgccaccc ggcggtacta 1560

cctgggcgcc gtggagctgt cctgggacta catgcagagc gacctgggcg agctgcccgt 1620

ggacgcccgg ttccccccca gagtgcccaa gagcttcccc ttcaacacca gcgtggtgta 1680

caagaaaacc ctgttcgtgg agttcaccga ccacctgttc aatatcgcca agcccaggcc 1740

cccctggatg ggcctgctgg gccccaccat ccaggccgag gtgtacgaca ccgtggtgat 1800

caccctgaag aacatggcca gccaccccgt gagcctgcac gccgtgggcg tgagctactg 1860

gaaggccagc gagggcgccg agtacgacga ccagaccagc cagcgggaga aagaagatga 1920

caaggtgttc cctggcggca gccacaccta cgtgtggcag gtgctgaaag aaaacggccc 1980

catggcctcc gaccccctgt gcctgaccta cagctacctg agccacgtgg acctggtgaa 2040

ggacctgaac agcggcctga tcggcgctct gctcgtctgc cgggagggca gcctggccaa 2100

agagaaaacc cagaccctgc acaagttcat cctgctgttc gccgtgttcg acgagggcaa 2160

gagctggcac agcgagacaa agaacagcct gatgcaggac cgggacgccg cctctgccag 2220

agcctggccc aagatgcaca ccgtgaacgg ctacgtgaac agaagcctgc ccggcctgat 2280

tggctgccac cggaagagcg tgtactggca cgtgatcggc atgggcacca cacccgaggt 2340

gcacagcatc tttctggaag ggcacacctt tctggtccgg aaccaccggc aggccagcct 2400

ggaaatcagc cctatcacct tcctgaccgc ccagacactg ctgatggacc tgggccagtt 2460

cctgctgttt tgccacatca gctctcacca gcacgacggc atggaagcct acgtgaaggt 2520

ggactcttgc cccgaggaac cccagctgcg gatgaagaac aacgaggaag ccgaggacta 2580

cgacgacgac ctgaccgaca gcgagatgga cgtggtgcgg ttcgacgacg acaacagccc 2640

cagcttcatc cagatcagaa gcgtggccaa gaagcacccc aagacctggg tgcactatat 2700

cgccgccgag gaagaggact gggactacgc ccccctggtg ctggcccccg acgacagaag 2760

ctacaagagc cagtacctga acaatggccc ccagcggatc ggccggaagt acaagaaagt 2820

gcggttcatg gcctacaccg acgagacatt caagacccgg gaggccatcc agcacgagag 2880

cggcatcctg ggccccctgc tgtacggcga agtgggcgac acactgctga tcatcttcaa 2940

gaaccaggct agccggccct acaacatcta cccccacggc atcaccgacg tgcggcccct 3000

gtacagcagg cggctgccca agggcgtgaa gcacctgaag gacttcccca tcctgcccgg 3060

cgagatcttc aagtacaagt ggaccgtgac cgtggaggac ggccccacca agagcgaccc 3120

cagatgcctg acccggtact acagcagctt cgtgaacatg gaacgggacc tggcctccgg 3180

gctgatcgga cctctgctga tctgctacaa agaaagcgtg gaccagcggg gcaaccagat 3240

catgagcgac aagcggaacg tgatcctgtt cagcgtgttc gatgagaacc ggtcctggta 3300

tctgaccgag aacatccagc ggtttctgcc caaccctgcc ggcgtgcagc tggaagatcc 3360

cgagttccag gccagcaaca tcatgcactc catcaatggc tacgtgttcg actctctgca 3420

gctctccgtg tgtctgcacg aggtggccta ctggtacatc ctgagcatcg gcgcccagac 3480

cgacttcctg agcgtgttct tcagcggcta caccttcaag cacaagatgg tgtacgagga 3540

caccctgacc ctgttccctt tcagcggcga gacagtgttc atgagcatgg aaaaccccgg 3600

cctgtggatt ctgggctgcc acaacagcga cttccggaac cggggcatga ccgccctgct 3660

gaaggtgtcc agctgcgaca agaacaccgg cgactactac gaggacagct acgaggatat 3720

cagcgcctac ctgctgtcca agaacaacgc catcgaaccc cggagcttca gccagaaccc 3780

ccccgtgctg acgcgtagct tcagccagaa cagccggcac cccagcaccc ggcagaagca 3840

gttcaacgcc accaccatcc ccgagaacga catcgagaaa accgaccctt ggtttgccca 3900

ccggaccccc atgcccaaga tccagaacgt gtccagcagc gacctgctga tgctgctgcg 3960

gcagagcccc acccctcacg gcctgagcct gagcgacctg caggaagcca agtacgagac 4020

attcagcgac gaccccagcc ctggcgccat cgacagcaac aacagcctgt ccgagatgac 4080

ccacttccgg ccccagctgc accacagcgg cgacatggtg ttcacccccg agagcggcct 4140

gcagctgcgg ctgaacgaga agctgggcac caccgccgcc accgagctga agaagctgga 4200

cttcaaggtc tccagcacca gcaacaacct gatcagcacc atccccagcg acaacctggc 4260

cgctggcacc gacaacacca gcagcctggg ccctcccagc atgcccgtgc actacgacag 4320

ccagctggac accaccctgt tcggcaagaa gtccagcccc ctgaccgagt ccggcggacc 4380

cctgtccctg agcgaggaaa acaacgacag caagctgctg gaaagcggcc tgatgaacag 4440

ccaggaaagc agctggggca agaatgtgtc cagcacgcgt caccagcggg agatcacccg 4500

gacaaccctg cagtccgacc aggaagagat cgattacgac gacaccatca gcgtggagat 4560

gaagaaagag gatttcgata tctacgacga ggacgagaac cagagcccca gaagcttcca 4620

gaagaaaacc cggcactact tcattgccgc cgtggagagg ctgtgggact acggcatgag 4680

ttctagcccc cacgtgctgc ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa 4740

agtggtgttc caggaattca cagacggcag cttcacccag cctctgtata gaggcgagct 4800

gaacgagcac ctggggctgc tggggcccta catcagggcc gaagtggagg acaacatcat 4860

ggtgaccttc cggaatcagg ccagcagacc ctactccttc tacagcagcc tgatcagcta 4920

cgaagaggac cagcggcagg gcgccgaacc ccggaagaac ttcgtgaagc ccaacgaaac 4980

caagacctac ttctggaaag tgcagcacca catggccccc accaaggacg agttcgactg 5040

caaggcctgg gcctacttca gcgacgtgga tctggaaaag gacgtgcact ctggactgat 5100

tggcccactc ctggtctgcc acactaacac cctcaacccc gcccacggcc gccaggtgac 5160

cgtgcaggaa ttcgccctgt tcttcaccat cttcgacgag acaaagtcct ggtacttcac 5220

cgagaatatg gaacggaact gcagagcccc ctgcaacatc cagatggaag atcctacctt 5280

caaagagaac taccggttcc acgccatcaa cggctacatc atggacaccc tgcctggcct 5340

ggtgatggcc caggaccaga gaatccggtg gtatctgctg tccatgggca gcaacgagaa 5400

tatccacagc atccacttca gcggccacgt gttcaccgtg cggaagaaag aagagtacaa 5460

gatggccctg tacaacctgt accccggcgt gttcgagaca gtggagatgc tgcccagcaa 5520

ggccggcatc tggcgggtgg agtgtctgat cggcgagcac ctgcacgctg gcatgagcac 5580

cctgtttctg gtgtacagca acaagtgcca gaccccactg ggcatggcct ctggccacat 5640

ccgggacttc cagatcaccg cctccggcca gtacggccag tgggccccca agctggccag 5700

actgcactac agcggcagca tcaacgcctg gtccaccaaa gagcccttca gctggatcaa 5760

ggtggacctg ctggccccta tgatcatcca cggcattaag acccagggcg ccaggcagaa 5820

gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg 5880

gcagacctac cggggcaaca gcaccggcac cctgatggtg ttcttcggca atgtggacag 5940

cagcggcatc aagcacaaca tcttcaaccc ccccatcatt gcccggtaca tccggctgca 6000

ccccacccac tacagcatta gatccacact gagaatggaa ctgatgggct gcgacctgaa 6060

ctcctgcagc atgcctctgg gcatggaaag caaggccatc agcgacgccc agatcacagc 6120

cagcagctac ttcaccaaca tgttcgccac ctggtccccc tccaaggcca ggctgcacct 6180

gcagggccgg tccaacgcct ggcggcctca ggtcaacaac cccaaagaat ggctgcaggt 6240

ggactttcag aaaaccatga aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct 6300

gaccagcatg tacgtgaaag agtttctgat cagcagctct caggatggcc accagtggac 6360

cctgttcttt cagaacggca aggtgaaagt gttccagggc aaccaggact ccttcacccc 6420

cgtggtgaac tccctggacc cccccctgct gacccgctac ctgagaatcc acccccagtc 6480

ttgggtgcac cagatcgccc tcaggatgga agtcctggga tgtgaggccc aggatctgta 6540

ctgatgagcg gccgcttccc tttagtgagg gttaatgctt cgagcagaca tgataagata 6600

cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga 6660

aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa 6720

caacaattgc attcatttta tgtttcaggt tcagggggag atgtgggagg ttttttaaag 6780

caagtaaaac ctctacaaat gtggtacacg gagtggcagc accatggcct gaaataacct 6840

ctgaaagagg aacttggtta ggtaccttct gaggcggaaa gaaccagctg tggaatgtgt 6900

gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 6960

atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca ggcagaagta 7020

tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact ccgcccatcc 7080

cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta atttttttta 7140

tttatgcaga ggccgaggcc gcctcggcct ctgagctatt ccagaagtag tgaggaggct 7200

tttttggagg cctaggcttt tgcaaaaagc tcccggccgg gagcttgtat atccattttc 7260

ggatctgatc agcacgtgtt gacaattaat catcggcata gtatatcggc atagtataat 7320

acgacaaggt gaggaactaa accatggcca agcctttgtc tcaagaagaa tccaccctca 7380

ttgaaagagc aacggctaca atcaacagca tccccatctc tgaagactac agcgtcgcca 7440

gcgcagctct ctctagcgac ggccgcatct tcactggtgt caatgtatat cattttactg 7500

ggggaccttg tgcagaactc gtggtgctgg gcactgctgc tgctgcggca gctggcaacc 7560

tgacttgtat cgtcgcgatc ggaaatgaga acaggggcat cttgagcccc tgcggacggt 7620

gccgacaggt gcttctcgat ctgcatcctg ggatcaaagc catagtgaag gacagtgatg 7680

gacagccgac ggcagttggg attcgtgaat tgctgccctc tggttatgtg tgggagggct 7740

aagcacttcg tggccgagga gcaggactga cacgtgctac gagatttcga ttccaccgcc 7800

gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg gatgatcctc 7860

cagcgcgggg atctcatgct ggagttcttc gcccacccca acttgtttat tgcagcttat 7920

aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 7980

cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg tactcatgag 8040

gcgcgcccgt cagacccgtt taaacagatc aaaggatctt cttgagatcc tttttttctg 8100

cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 8160

gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 8220

aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 8280

cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 8340

<210> 35

<211> 10141

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 35

gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60

ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120

cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180

ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240

gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780

gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840

ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900

taagcttgtc gaggtaatag gccaccatgc agatcgagct gtccacctgc ttttttctgt 960

gcctgctgcg gttctgcttc agcgccaccc ggcggtacta cctgggcgcc gtggagctgt 1020

cctgggacta catgcagagc gacctgggcg agctgcccgt ggacgcccgg ttccccccca 1080

gagtgcccaa gagcttcccc ttcaacacca gcgtggtgta caagaaaacc ctgttcgtgg 1140

agttcaccga ccacctgttc aatatcgcca agcccaggcc cccctggatg ggcctgctgg 1200

gccccaccat ccaggccgag gtgtacgaca ccgtggtgat caccctgaag aacatggcca 1260

gccaccccgt gagcctgcac gccgtgggcg tgagctactg gaaggccagc gagggcgccg 1320

agtacgacga ccagaccagc cagcgggaga aagaagatga caaggtgttc cctggcggca 1380

gccacaccta cgtgtggcag gtgctgaaag aaaacggccc catggcctcc gaccccctgt 1440

gcctgaccta cagctacctg agccacgtgg acctggtgaa ggacctgaac agcggcctga 1500

tcggcgctct gctcgtctgc cgggagggca gcctggccaa agagaaaacc cagaccctgc 1560

acaagttcat cctgctgttc gccgtgttcg acgagggcaa gagctggcac agcgagacaa 1620

agaacagcct gatgcaggac cgggacgccg cctctgccag agcctggccc aagatgcaca 1680

ccgtgaacgg ctacgtgaac agaagcctgc ccggcctgat tggctgccac cggaagagcg 1740

tgtactggca cgtgatcggc atgggcacca cacccgaggt gcacagcatc tttctggaag 1800

ggcacacctt tctggtccgg aaccaccggc aggccagcct ggaaatcagc cctatcacct 1860

tcctgaccgc ccagacactg ctgatggacc tgggccagtt cctgctgttt tgccacatca 1920

gctctcacca gcacgacggc atggaagcct acgtgaaggt ggactcttgc cccgaggaac 1980

cccagctgcg gatgaagaac aacgaggaag ccgaggacta cgacgacgac ctgaccgaca 2040

gcgagatgga cgtggtgcgg ttcgacgacg acaacagccc cagcttcatc cagatcagaa 2100

gcgtggccaa gaagcacccc aagacctggg tgcactatat cgccgccgag gaagaggact 2160

gggactacgc ccccctggtg ctggcccccg acgacagaag ctacaagagc cagtacctga 2220

acaatggccc ccagcggatc ggccggaagt acaagaaagt gcggttcatg gcctacaccg 2280

acgagacatt caagacccgg gaggccatcc agcacgagag cggcatcctg ggccccctgc 2340

tgtacggcga agtgggcgac acactgctga tcatcttcaa gaaccaggct agccggccct 2400

acaacatcta cccccacggc atcaccgacg tgcggcccct gtacagcagg cggctgccca 2460

agggcgtgaa gcacctgaag gacttcccca tcctgcccgg cgagatcttc aagtacaagt 2520

ggaccgtgac cgtggaggac ggccccacca agagcgaccc cagatgcctg acccggtact 2580

acagcagctt cgtgaacatg gaacgggacc tggcctccgg gctgatcgga cctctgctga 2640

tctgctacaa agaaagcgtg gaccagcggg gcaaccagat catgagcgac aagcggaacg 2700

tgatcctgtt cagcgtgttc gatgagaacc ggtcctggta tctgaccgag aacatccagc 2760

ggtttctgcc caaccctgcc ggcgtgcagc tggaagatcc cgagttccag gccagcaaca 2820

tcatgcactc catcaatggc tacgtgttcg actctctgca gctctccgtg tgtctgcacg 2880

aggtggccta ctggtacatc ctgagcatcg gcgcccagac cgacttcctg agcgtgttct 2940

tcagcggcta caccttcaag cacaagatgg tgtacgagga caccctgacc ctgttccctt 3000

tcagcggcga gacagtgttc atgagcatgg aaaaccccgg cctgtggatt ctgggctgcc 3060

acaacagcga cttccggaac cggggcatga ccgccctgct gaaggtgtcc agctgcgaca 3120

agaacaccgg cgactactac gaggacagct acgaggatat cagcgcctac ctgctgtcca 3180

agaacaacgc catcgaaccc cggagcttca gccagaaccc ccccgtgctg acgcgtagct 3240

tcagccagaa cagccggcac cccagcaccc ggcagaagca gttcaacgcc accaccatcc 3300

ccgagaacga catcgagaaa accgaccctt ggtttgccca ccggaccccc atgcccaaga 3360

tccagaacgt gtccagcagc gacctgctga tgctgctgcg gcagagcccc acccctcacg 3420

gcctgagcct gagcgacctg caggaagcca agtacgagac attcagcgac gaccccagcc 3480

ctggcgccat cgacagcaac aacagcctgt ccgagatgac ccacttccgg ccccagctgc 3540

accacagcgg cgacatggtg ttcacccccg agagcggcct gcagctgcgg ctgaacgaga 3600

agctgggcac caccgccgcc accgagctga agaagctgga cttcaaggtc tccagcacca 3660

gcaacaacct gatcagcacc atccccagcg acaacctggc cgctggcacc gacaacacca 3720

gcagcctggg ccctcccagc atgcccgtgc actacgacag ccagctggac accaccctgt 3780

tcggcaagaa gtccagcccc ctgaccgagt ccggcggacc cctgtccctg agcgaggaaa 3840

acaacgacag caagctgctg gaaagcggcc tgatgaacag ccaggaaagc agctggggca 3900

agaatgtgtc cagcacgcgt caccagcggg agatcacccg gacaaccctg cagtccgacc 3960

aggaagagat cgattacgac gacaccatca gcgtggagat gaagaaagag gatttcgata 4020

tctacgacga ggacgagaac cagagcccca gaagcttcca gaagaaaacc cggcactact 4080

tcattgccgc cgtggagagg ctgtgggact acggcatgag ttctagcccc cacgtgctgc 4140

ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caggaattca 4200

cagacggcag cttcacccag cctctgtata gaggcgagct gaacgagcac ctggggctgc 4260

tggggcccta catcagggcc gaagtggagg acaacatcat ggtgaccttc cggaatcagg 4320

ccagcagacc ctactccttc tacagcagcc tgatcagcta cgaagaggac cagcggcagg 4380

gcgccgaacc ccggaagaac ttcgtgaagc ccaacgaaac caagacctac ttctggaaag 4440

tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg gcctacttca 4500

gcgacgtgga tctggaaaag gacgtgcact ctggactgat tggcccactc ctggtctgcc 4560

acactaacac cctcaacccc gcccacggcc gccaggtgac cgtgcaggaa ttcgccctgt 4620

tcttcaccat cttcgacgag acaaagtcct ggtacttcac cgagaatatg gaacggaact 4680

gcagagcccc ctgcaacatc cagatggaag atcctacctt caaagagaac taccggttcc 4740

acgccatcaa cggctacatc atggacaccc tgcctggcct ggtgatggcc caggaccaga 4800

gaatccggtg gtatctgctg tccatgggca gcaacgagaa tatccacagc atccacttca 4860

gcggccacgt gttcaccgtg cggaagaaag aagagtacaa gatggccctg tacaacctgt 4920

accccggcgt gttcgagaca gtggagatgc tgcccagcaa ggccggcatc tggcgggtgg 4980

agtgtctgat cggcgagcac ctgcacgctg gcatgagcac cctgtttctg gtgtacagca 5040

acaagtgcca gaccccactg ggcatggcct ctggccacat ccgggacttc cagatcaccg 5100

cctccggcca gtacggccag tgggccccca agctggccag actgcactac agcggcagca 5160

tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggccccta 5220

tgatcatcca cggcattaag acccagggcg ccaggcagaa gttcagcagc ctgtacatca 5280

gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac cggggcaaca 5340

gcaccggcac cctgatggtg ttcttcggca atgtggacag cagcggcatc aagcacaaca 5400

tcttcaaccc ccccatcatt gcccggtaca tccggctgca ccccacccac tacagcatta 5460

gatccacact gagaatggaa ctgatgggct gcgacctgaa ctcctgcagc atgcctctgg 5520

gcatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca 5580

tgttcgccac ctggtccccc tccaaggcca ggctgcacct gcagggccgg tccaacgcct 5640

ggcggcctca ggtcaacaac cccaaagaat ggctgcaggt ggactttcag aaaaccatga 5700

aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct gaccagcatg tacgtgaaag 5760

agtttctgat cagcagctct caggatggcc accagtggac cctgttcttt cagaacggca 5820

aggtgaaagt gttccagggc aaccaggact ccttcacccc cgtggtgaac tccctggacc 5880

cccccctgct gacccgctac ctgagaatcc acccccagtc ttgggtgcac cagatcgccc 5940

tcaggatgga agtcctggga tgtgaggccc aggatctgta ctgatgagcg gccgctcgag 6000

gtcacccatt cgaacaaaaa ctcatctcag aagaggatct gaatatgcat accggtcatc 6060

atcaccatca ccattgagtt taaacccgct gatcagcctc gactgtgcct tctagttgcc 6120

agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 6180

ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 6240

ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 6300

atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc tggggctcta 6360

gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 6420

gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 6480

cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 6540

ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 6600

cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 6660

tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 6720

cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 6780

aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt gtggaaagtc 6840

cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccag 6900

gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta 6960

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 7020

cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg ccgaggccgc 7080

ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 7140

caaaaagctc ccgggagctt gtatatccat tttcggatct gatcagcacg tgttgacaat 7200

taatcatcgg catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg 7260

gccaagcctt tgtctcaaga agaatccacc ctcattgaaa gagcaacggc tacaatcaac 7320

agcatcccca tctctgaaga ctacagcgtc gccagcgcag ctctctctag cgacggccgc 7380

atcttcactg gtgtcaatgt atatcatttt actgggggac cttgtgcaga actcgtggtg 7440

ctgggcactg ctgctgctgc ggcagctggc aacctgactt gtatcgtcgc gatcggaaat 7500

gagaacaggg gcatcttgag cccctgcgga cggtgccgac aggtgcttct cgatctgcat 7560

cctgggatca aagccatagt gaaggacagt gatggacagc cgacggcagt tgggattcgt 7620

gaattgctgc cctctggtta tgtgtgggag ggctaagcac ttcgtggccg aggagcagga 7680

ctgacacgtg ctacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 7740

aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 7800

cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 7860

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 7920

catcaatgta tcttatcatg tctgtatacc gtcgacctct agctagagct tggcgtaatc 7980

atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 8040

agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 8100

tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 8160

aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 8220

cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 8280

ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 8340

ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 8400

cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 8460

actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 8520

cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 8580

tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 8640

gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 8700

caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 8760

agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 8820

tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 8880

tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 8940

gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 9000

gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 9060

aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 9120

atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 9180

gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 9240

acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 9300

ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 9360

tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 9420

ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 9480

ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 9540

atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 9600

taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 9660

catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 9720

atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 9780

acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 9840

aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 9900

ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 9960

cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 10020

atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 10080

ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 10140

c 10141

<210> 36

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 36

agcaacgcga tttaaattgc tttctctgac cagcattctc tcccct 46

<210> 37

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 37

tgaagatctc ctgcagggcc ccactgtggg gtggagggga cagataaaag ta 52

<210> 38

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 38

tactcatgag gcgcgccact actagggaca ggattggtga cagaaaagcc cca 53

<210> 39

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 39

tgatctgttt aaacagagca gagccaggaa cacctgtagg gaaggggca 49

<210> 40

<211> 4923

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 40

tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60

acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120

ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180

ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240

tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300

tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aattgctttc 360

tctgaccagc attctctccc ctgggcctgt gccgctttct gtctgcagct tgtggcctgg 420

gtcacctcta cggctggccc agatccttcc ctgccgcctc cttcaggttc cgtcttcctc 480

cactccctct tccccttgct ctctgctgtg ttgctgccca aggatgctct ttccggagca 540

cttccttctc ggcgctgcac cacgtgatgt cctctgagcg gatcctcccc gtgtctgggt 600

cctctccggg catctctcct ccctcaccca accccatgcc gtcttcactc gctgggttcc 660

cttttccttc tccttctggg gcctgtgcca tctctcgttt cttaggatgg ccttctccga 720

cggatgtctc ccttgcgtcc cgcctcccct tcttgtaggc ctgcatcatc accgtttttc 780

tggacaaccc caaagtaccc cgtctccctg gctttagcca cctctccatc ctcttgcttt 840

ctttgcctgg acaccccgtt ctcctgtgga ttcgggtcac ctctcactcc tttcatttgg 900

gcagctcccc tacccccctt acctctctag tctgtgctag ctcttccagc cccctgtcat 960

ggcatcttcc aggggtccga gagctcagct agtcttcttc ctccaacccg ggcccctatg 1020

tccacttcag gacagcatgt ttgctgcctc cagggatcct gtgtccccga gctgggacca 1080

ccttatattc ccagggccgg ttaatgtggc tctggttctg ggtactttta tctgtcccct 1140

ccaccccaca gtggggccct gcaggagatc ttcaatattg gccattagcc atattattca 1200

ttggttatat agcataaatc aatattggct attggccatt gcatacgttg tatctatatc 1260

ataatatgta catttatatt ggctcatgtc caatatgacc gccatgttgg cattgattat 1320

tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 1380

tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 1440

cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 1500

gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 1560

tgccaagtcc gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 1620

agtacatgac cttacgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 1680

ttaccatggt gatgcggttt tggcagtaca ccaatgggcg tggatagcgg tttgactcac 1740

ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 1800

aacgggactt tccaaaatgt cgtaacaact gcgatcgccc gccccgttga cgcaaatggg 1860

cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga accgtcagat 1920

cactagaagc tttattgcgg tagtttatca cagttaaatt gctaacgcag tcagtgcttc 1980

tgacacaaca gtctcgaact taagctgcag tgactctctt aaggtagcct tgcagaagtt 2040

ggtcgtgagg cactgggcag gtaagtatca aggttacaag acaggtttaa ggagaccaat 2100

agaaactggg cttgtcgaga cagagaagac tcttgcgttt ctgataggca cctattggtc 2160

ttactgacat ccactttgcc tttctctcca caggtgtcca ctcccagttc aattacagct 2220

cttaaggcta gagtacttaa tacgactcac tataggctag cctcgagaat tcacgcgtgg 2280

tacctctaga gtcgacccgg gcggccgctt ccctttagtg agggttaatg cttcgagcag 2340

acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 2400

gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 2460

aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gagatgtggg 2520

aggtttttta aagcaagtaa aacctctaca aatgtggtac acggagtggc agcaccatgg 2580

cctgaaataa cctctgaaag aggaacttgg ttaggtacct tctgaggcgg aaagaaccag 2640

ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt 2700

atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 2760

gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 2820

actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 2880

ctaatttttt ttatttatgc agaggccgag gccgcctcgg cctctgagct attccagaag 2940

tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agctcccggc cgggagcttg 3000

tatatccatt ttcggatctg atcagcacgt gttgacaatt aatcatcggc atagtatatc 3060

ggcatagtat aatacgacaa ggtgaggaac taaaccatgg ccaagccttt gtctcaagaa 3120

gaatccaccc tcattgaaag agcaacggct acaatcaaca gcatccccat ctctgaagac 3180

tacagcgtcg ccagcgcagc tctctctagc gacggccgca tcttcactgg tgtcaatgta 3240

tatcatttta ctgggggacc ttgtgcagaa ctcgtggtgc tgggcactgc tgctgctgcg 3300

gcagctggca acctgacttg tatcgtcgcg atcggaaatg agaacagggg catcttgagc 3360

ccctgcggac ggtgccgaca ggtgcttctc gatctgcatc ctgggatcaa agccatagtg 3420

aaggacagtg atggacagcc gacggcagtt gggattcgtg aattgctgcc ctctggttat 3480

gtgtgggagg gctaagcact tcgtggccga ggagcaggac tgacacgtgc tacgagattt 3540

cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 3600

ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 3660

tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 3720

atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 3780

ctgtactcat gaggcgcgcc actactaggg acaggattgg tgacagaaaa gccccatcct 3840

taggcctcct ccttcctagt ctcctgatat tgggtctaac ccccacctcc tgttaggcag 3900

attccttatc tggtgacaca cccccatttc ctggagccat ctctctcctt gccagaacct 3960

ctaaggtttg cttacgatgg agccagagag gatcctggga gggagagctt ggcagggggt 4020

gggagggaag ggggggatgc gtgacctgcc cggttctcag tggccaccct gcgctaccct 4080

ctcccagaac ctgagctgct ctgacgcggc tgtctggtgc gtttcactga tcctggtgct 4140

gcagcttcct tacacttccc aagaggagaa gcagtttgga aaaacaaaat cagaataagt 4200

tggtcctgag ttctaacttt ggctcttcac ctttctagtc cccaatttat attgttcctc 4260

cgtgcgtcag ttttacctgt gagataaggc cagtagccag ccccgtcctg gcagggctgt 4320

ggtgaggagg ggggtgtccg tgtggaaaac tccctttgtg agaatggtgc gtcctaggtg 4380

ttcaccaggt cgtggccgcc tctactccct ttctctttct ccatccttct ttccttaaag 4440

agtccccagt gctatctggg acatattcct ccgcccagag cagggtcccg cttccctaag 4500

gccctgctct gggcttctgg gtttgagtcc ttggcaagcc caggagaggc gctcaggctt 4560

ccctgtcccc cttcctcgtc caccatctca tgcccctggc tctcctgccc cttccctaca 4620

ggtgttcctg gctctgctct gtttaaacag atcaaaggat cttcttgaga tccttttttt 4680

ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 4740

ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 4800

ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 4860

ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 4920

tcg 4923

<210> 41

<211> 6266

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 41

tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60

acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120

ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180

ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240

tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300

tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aattgctttc 360

tctgaccagc attctctccc ctgggcctgt gccgctttct gtctgcagct tgtggcctgg 420

gtcacctcta cggctggccc agatccttcc ctgccgcctc cttcaggttc cgtcttcctc 480

cactccctct tccccttgct ctctgctgtg ttgctgccca aggatgctct ttccggagca 540

cttccttctc ggcgctgcac cacgtgatgt cctctgagcg gatcctcccc gtgtctgggt 600

cctctccggg catctctcct ccctcaccca accccatgcc gtcttcactc gctgggttcc 660

cttttccttc tccttctggg gcctgtgcca tctctcgttt cttaggatgg ccttctccga 720

cggatgtctc ccttgcgtcc cgcctcccct tcttgtaggc ctgcatcatc accgtttttc 780

tggacaaccc caaagtaccc cgtctccctg gctttagcca cctctccatc ctcttgcttt 840

ctttgcctgg acaccccgtt ctcctgtgga ttcgggtcac ctctcactcc tttcatttgg 900

gcagctcccc tacccccctt acctctctag tctgtgctag ctcttccagc cccctgtcat 960

ggcatcttcc aggggtccga gagctcagct agtcttcttc ctccaacccg ggcccctatg 1020

tccacttcag gacagcatgt ttgctgcctc cagggatcct gtgtccccga gctgggacca 1080

ccttatattc ccagggccgg ttaatgtggc tctggttctg ggtactttta tctgtcccct 1140

ccaccccaca gtggggccct gcaggagatc ttcaatattg gccattagcc atattattca 1200

ttggttatat agcataaatc aatattggct attggccatt gcatacgttg tatctatatc 1260

ataatatgta catttatatt ggctcatgtc caatatgacc gccatgttgg cattgattat 1320

tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 1380

tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 1440

cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 1500

gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 1560

tgccaagtcc gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 1620

agtacatgac cttacgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 1680

ttaccatggt gatgcggttt tggcagtaca ccaatgggcg tggatagcgg tttgactcac 1740

ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 1800

aacgggactt tccaaaatgt cgtaacaact gcgatcgccc gccccgttga cgcaaatggg 1860

cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga accgtcagat 1920

cactagaagc tttattgcgg tagtttatca cagttaaatt gctaacgcag tcagtgcttc 1980

tgacacaaca gtctcgaact taagctgcag tgactctctt aaggtagcct tgcagaagtt 2040

ggtcgtgagg cactgggcag gtaagtatca aggttacaag acaggtttaa ggagaccaat 2100

agaaactggg cttgtcgaga cagagaagac tcttgcgttt ctgataggca cctattggtc 2160

ttactgacat ccactttgcc tttctctcca caggtgtcca ctcccagttc aattacagct 2220

cttaaggcta gagtacttaa tacgactcac tataggctag cctcgagaat tctaataggc 2280

caccatgtcc actgcggtcc tggaaaaccc aggcttgggc aggaaactct ctgactttgg 2340

acaggaaaca agctatattg aagacaactg caatcaaaat ggtgccatat cgctgatctt 2400

ctcactcaaa gaagaagttg gtgcattggc caaagtattg cgcttatttg aggagaatga 2460

tgtaaacctg acccacattg aatctagacc ttctcgttta aagaaagatg agtatgaatt 2520

tttcacccat ttggataaac gtagcctgcc tgctctgaca aacatcatca agatcttgag 2580

gcatgacatt ggtgccactg tccatgagct ttcacgagat aagaagaaag acacagtgcc 2640

ctggttccca agaaccattc aagagctgga cagatttgcc aatcagattc tcagctatgg 2700

agcggaactg gatgctgacc accctggttt taaagatcct gtgtaccgtg caagacggaa 2760

gcagtttgct gacattgcct acaactaccg ccatgggcag cccatccctc gagtggaata 2820

catggaggaa ggaaagaaaa catggggcac agtgttcaag actctgaagt ccttgtataa 2880

aacccatgct tgctatgagt acaatcacat ttttccactt cttgaaaagt actgtggctt 2940

ccatgaagat aacattcccc agctggaaga cgtttctcag ttcctgcaga cttgcactgg 3000

tttccgcctc cgacctgtgg ctggcctgct ttcctctcgg gatttcttgg gtggcctggc 3060

cttccgagtc ttccactgca cacagtacat cagacatgga tccaagccca tgtatacccc 3120

cgaacctgac atctgccatg agctgttggg acatgtgccc ttgttttcag atcgcagctt 3180

tgcccagttt tcccaggaaa ttggccttgc ctctctgggt gcacctgatg aatacattga 3240

aaagctcgcc acaatttact ggtttactgt ggagtttggg ctctgcaaac aaggagactc 3300

cataaaggca tatggtgctg ggctcctgtc atcctttggt gaattacagt actgcttatc 3360

agagaagcca aagcttctcc ccctggagct ggagaagaca gccatccaaa attacactgt 3420

cacggagttc cagcccctct attacgtggc agagagtttt aatgatgcca aggagaaagt 3480

aaggaacttt gctgccacaa tacctcggcc cttctcagtt cgctacgacc catacaccca 3540

aaggattgag gtcttggaca atacccagca gcttaagatt ttggctgatt ccattaacag 3600

tgaaattgga atcctttgca gtgccctcca gaaaataaag taggcggccg cttcccttta 3660

gtgagggtta atgcttcgag cagacatgat aagatacatt gatgagtttg gacaaaccac 3720

aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 3780

tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 3840

tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg 3900

tacacggagt ggcagcacca tggcctgaaa taacctctga aagaggaact tggttaggta 3960

ccttctgagg cggaaagaac cagctgtgga atgtgtgtca gttagggtgt ggaaagtccc 4020

caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 4080

gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 4140

cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg 4200

cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct 4260

cggcctctga gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca 4320

aaaagctccc ggccgggagc ttgtatatcc attttcggat ctgatcagca cgtgttgaca 4380

attaatcatc ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca 4440

tggccaagcc tttgtctcaa gaagaatcca ccctcattga aagagcaacg gctacaatca 4500

acagcatccc catctctgaa gactacagcg tcgccagcgc agctctctct agcgacggcc 4560

gcatcttcac tggtgtcaat gtatatcatt ttactggggg accttgtgca gaactcgtgg 4620

tgctgggcac tgctgctgct gcggcagctg gcaacctgac ttgtatcgtc gcgatcggaa 4680

atgagaacag gggcatcttg agcccctgcg gacggtgccg acaggtgctt ctcgatctgc 4740

atcctgggat caaagccata gtgaaggaca gtgatggaca gccgacggca gttgggattc 4800

gtgaattgct gccctctggt tatgtgtggg agggctaagc acttcgtggc cgaggagcag 4860

gactgacacg tgctacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920

ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4980

ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 5040

atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 5100

ctcatcaatg tatcttatca tgtctgtact catgaggcgc gccactacta gggacaggat 5160

tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga tattgggtct 5220

aacccccacc tcctgttagg cagattcctt atctggtgac acacccccat ttcctggagc 5280

catctctctc cttgccagaa cctctaaggt ttgcttacga tggagccaga gaggatcctg 5340

ggagggagag cttggcaggg ggtgggaggg aaggggggga tgcgtgacct gcccggttct 5400

cagtggccac cctgcgctac cctctcccag aacctgagct gctctgacgc ggctgtctgg 5460

tgcgtttcac tgatcctggt gctgcagctt ccttacactt cccaagagga gaagcagttt 5520

ggaaaaacaa aatcagaata agttggtcct gagttctaac tttggctctt cacctttcta 5580

gtccccaatt tatattgttc ctccgtgcgt cagttttacc tgtgagataa ggccagtagc 5640

cagccccgtc ctggcagggc tgtggtgagg aggggggtgt ccgtgtggaa aactcccttt 5700

gtgagaatgg tgcgtcctag gtgttcacca ggtcgtggcc gcctctactc cctttctctt 5760

tctccatcct tctttcctta aagagtcccc agtgctatct gggacatatt cctccgccca 5820

gagcagggtc ccgcttccct aaggccctgc tctgggcttc tgggtttgag tccttggcaa 5880

gcccaggaga ggcgctcagg cttccctgtc ccccttcctc gtccaccatc tcatgcccct 5940

ggctctcctg ccccttccct acaggtgttc ctggctctgc tctgtttaaa cagatcaaag 6000

gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6060

cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6120

ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc 6180

accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6240

tggctgctgc cagtggcgat aagtcg 6266

<210> 42

<211> 9964

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 42

tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60

acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120

ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180

ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240

tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300

tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aattgctttc 360

tctgaccagc attctctccc ctgggcctgt gccgctttct gtctgcagct tgtggcctgg 420

gtcacctcta cggctggccc agatccttcc ctgccgcctc cttcaggttc cgtcttcctc 480

cactccctct tccccttgct ctctgctgtg ttgctgccca aggatgctct ttccggagca 540

cttccttctc ggcgctgcac cacgtgatgt cctctgagcg gatcctcccc gtgtctgggt 600

cctctccggg catctctcct ccctcaccca accccatgcc gtcttcactc gctgggttcc 660

cttttccttc tccttctggg gcctgtgcca tctctcgttt cttaggatgg ccttctccga 720

cggatgtctc ccttgcgtcc cgcctcccct tcttgtaggc ctgcatcatc accgtttttc 780

tggacaaccc caaagtaccc cgtctccctg gctttagcca cctctccatc ctcttgcttt 840

ctttgcctgg acaccccgtt ctcctgtgga ttcgggtcac ctctcactcc tttcatttgg 900

gcagctcccc tacccccctt acctctctag tctgtgctag ctcttccagc cccctgtcat 960

ggcatcttcc aggggtccga gagctcagct agtcttcttc ctccaacccg ggcccctatg 1020

tccacttcag gacagcatgt ttgctgcctc cagggatcct gtgtccccga gctgggacca 1080

ccttatattc ccagggccgg ttaatgtggc tctggttctg ggtactttta tctgtcccct 1140

ccaccccaca gtggggccct gcaggagatc ttcaatattg gccattagcc atattattca 1200

ttggttatat agcataaatc aatattggct attggccatt gcatacgttg tatctatatc 1260

ataatatgta catttatatt ggctcatgtc caatatgacc gccatgttgg cattgattat 1320

tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 1380

tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 1440

cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 1500

gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 1560

tgccaagtcc gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 1620

agtacatgac cttacgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 1680

ttaccatggt gatgcggttt tggcagtaca ccaatgggcg tggatagcgg tttgactcac 1740

ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 1800

aacgggactt tccaaaatgt cgtaacaact gcgatcgccc gccccgttga cgcaaatggg 1860

cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga accgtcagat 1920

cactagaagc tttattgcgg tagtttatca cagttaaatt gctaacgcag tcagtgcttc 1980

tgacacaaca gtctcgaact taagctgcag tgactctctt aaggtagcct tgcagaagtt 2040

ggtcgtgagg cactgggcag gtaagtatca aggttacaag acaggtttaa ggagaccaat 2100

agaaactggg cttgtcgaga cagagaagac tcttgcgttt ctgataggca cctattggtc 2160

ttactgacat ccactttgcc tttctctcca caggtgtcca ctcccagttc aattacagct 2220

cttaaggcta gagtacttaa tacgactcac tataggctag cctcgaggta ataggccacc 2280

atgcagatcg agctgtccac ctgctttttt ctgtgcctgc tgcggttctg cttcagcgcc 2340

acccggcggt actacctggg cgccgtggag ctgtcctggg actacatgca gagcgacctg 2400

ggcgagctgc ccgtggacgc ccggttcccc cccagagtgc ccaagagctt ccccttcaac 2460

accagcgtgg tgtacaagaa aaccctgttc gtggagttca ccgaccacct gttcaatatc 2520

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 2580

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 2640

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgg 2700

gagaaagaag atgacaaggt gttccctggc ggcagccaca cctacgtgtg gcaggtgctg 2760

aaagaaaacg gccccatggc ctccgacccc ctgtgcctga cctacagcta cctgagccac 2820

gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ctctgctcgt ctgccgggag 2880

ggcagcctgg ccaaagagaa aacccagacc ctgcacaagt tcatcctgct gttcgccgtg 2940

ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggaccgggac 3000

gccgcctctg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacagaagc 3060

ctgcccggcc tgattggctg ccaccggaag agcgtgtact ggcacgtgat cggcatgggc 3120

accacacccg aggtgcacag catctttctg gaagggcaca cctttctggt ccggaaccac 3180

cggcaggcca gcctggaaat cagccctatc accttcctga ccgcccagac actgctgatg 3240

gacctgggcc agttcctgct gttttgccac atcagctctc accagcacga cggcatggaa 3300

gcctacgtga aggtggactc ttgccccgag gaaccccagc tgcggatgaa gaacaacgag 3360

gaagccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcggttcgac 3420

gacgacaaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc 3480

tgggtgcact atatcgccgc cgaggaagag gactgggact acgcccccct ggtgctggcc 3540

cccgacgaca gaagctacaa gagccagtac ctgaacaatg gcccccagcg gatcggccgg 3600

aagtacaaga aagtgcggtt catggcctac accgacgaga cattcaagac ccgggaggcc 3660

atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaagtggg cgacacactg 3720

ctgatcatct tcaagaacca ggctagccgg ccctacaaca tctaccccca cggcatcacc 3780

gacgtgcggc ccctgtacag caggcggctg cccaagggcg tgaagcacct gaaggacttc 3840

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc 3900

accaagagcg accccagatg cctgacccgg tactacagca gcttcgtgaa catggaacgg 3960

gacctggcct ccgggctgat cggacctctg ctgatctgct acaaagaaag cgtggaccag 4020

cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgatgag 4080

aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaaccc tgccggcgtg 4140

cagctggaag atcccgagtt ccaggccagc aacatcatgc actccatcaa tggctacgtg 4200

ttcgactctc tgcagctctc cgtgtgtctg cacgaggtgg cctactggta catcctgagc 4260

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 4320

atggtgtacg aggacaccct gaccctgttc cctttcagcg gcgagacagt gttcatgagc 4380

atggaaaacc ccggcctgtg gattctgggc tgccacaaca gcgacttccg gaaccggggc 4440

atgaccgccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac 4500

agctacgagg atatcagcgc ctacctgctg tccaagaaca acgccatcga accccggagc 4560

ttcagccaga acccccccgt gctgacgcgt agcttcagcc agaacagccg gcaccccagc 4620

acccggcaga agcagttcaa cgccaccacc atccccgaga acgacatcga gaaaaccgac 4680

ccttggtttg cccaccggac ccccatgccc aagatccaga acgtgtccag cagcgacctg 4740

ctgatgctgc tgcggcagag ccccacccct cacggcctga gcctgagcga cctgcaggaa 4800

gccaagtacg agacattcag cgacgacccc agccctggcg ccatcgacag caacaacagc 4860

ctgtccgaga tgacccactt ccggccccag ctgcaccaca gcggcgacat ggtgttcacc 4920

cccgagagcg gcctgcagct gcggctgaac gagaagctgg gcaccaccgc cgccaccgag 4980

ctgaagaagc tggacttcaa ggtctccagc accagcaaca acctgatcag caccatcccc 5040

agcgacaacc tggccgctgg caccgacaac accagcagcc tgggccctcc cagcatgccc 5100

gtgcactacg acagccagct ggacaccacc ctgttcggca agaagtccag ccccctgacc 5160

gagtccggcg gacccctgtc cctgagcgag gaaaacaacg acagcaagct gctggaaagc 5220

ggcctgatga acagccagga aagcagctgg ggcaagaatg tgtccagcac gcgtcaccag 5280

cgggagatca cccggacaac cctgcagtcc gaccaggaag agatcgatta cgacgacacc 5340

atcagcgtgg agatgaagaa agaggatttc gatatctacg acgaggacga gaaccagagc 5400

cccagaagct tccagaagaa aacccggcac tacttcattg ccgccgtgga gaggctgtgg 5460

gactacggca tgagttctag cccccacgtg ctgcggaacc gggcccagag cggcagcgtg 5520

ccccagttca agaaagtggt gttccaggaa ttcacagacg gcagcttcac ccagcctctg 5580

tatagaggcg agctgaacga gcacctgggg ctgctggggc cctacatcag ggccgaagtg 5640

gaggacaaca tcatggtgac cttccggaat caggccagca gaccctactc cttctacagc 5700

agcctgatca gctacgaaga ggaccagcgg cagggcgccg aaccccggaa gaacttcgtg 5760

aagcccaacg aaaccaagac ctacttctgg aaagtgcagc accacatggc ccccaccaag 5820

gacgagttcg actgcaaggc ctgggcctac ttcagcgacg tggatctgga aaaggacgtg 5880

cactctggac tgattggccc actcctggtc tgccacacta acaccctcaa ccccgcccac 5940

ggccgccagg tgaccgtgca ggaattcgcc ctgttcttca ccatcttcga cgagacaaag 6000

tcctggtact tcaccgagaa tatggaacgg aactgcagag ccccctgcaa catccagatg 6060

gaagatccta ccttcaaaga gaactaccgg ttccacgcca tcaacggcta catcatggac 6120

accctgcctg gcctggtgat ggcccaggac cagagaatcc ggtggtatct gctgtccatg 6180

ggcagcaacg agaatatcca cagcatccac ttcagcggcc acgtgttcac cgtgcggaag 6240

aaagaagagt acaagatggc cctgtacaac ctgtaccccg gcgtgttcga gacagtggag 6300

atgctgccca gcaaggccgg catctggcgg gtggagtgtc tgatcggcga gcacctgcac 6360

gctggcatga gcaccctgtt tctggtgtac agcaacaagt gccagacccc actgggcatg 6420

gcctctggcc acatccggga cttccagatc accgcctccg gccagtacgg ccagtgggcc 6480

cccaagctgg ccagactgca ctacagcggc agcatcaacg cctggtccac caaagagccc 6540

ttcagctgga tcaaggtgga cctgctggcc cctatgatca tccacggcat taagacccag 6600

ggcgccaggc agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg 6660

gacggcaaga agtggcagac ctaccggggc aacagcaccg gcaccctgat ggtgttcttc 6720

ggcaatgtgg acagcagcgg catcaagcac aacatcttca acccccccat cattgcccgg 6780

tacatccggc tgcaccccac ccactacagc attagatcca cactgagaat ggaactgatg 6840

ggctgcgacc tgaactcctg cagcatgcct ctgggcatgg aaagcaaggc catcagcgac 6900

gcccagatca cagccagcag ctacttcacc aacatgttcg ccacctggtc cccctccaag 6960

gccaggctgc acctgcaggg ccggtccaac gcctggcggc ctcaggtcaa caaccccaaa 7020

gaatggctgc aggtggactt tcagaaaacc atgaaggtga ccggcgtgac cacccagggc 7080

gtgaaaagcc tgctgaccag catgtacgtg aaagagtttc tgatcagcag ctctcaggat 7140

ggccaccagt ggaccctgtt ctttcagaac ggcaaggtga aagtgttcca gggcaaccag 7200

gactccttca cccccgtggt gaactccctg gacccccccc tgctgacccg ctacctgaga 7260

atccaccccc agtcttgggt gcaccagatc gccctcagga tggaagtcct gggatgtgag 7320

gcccaggatc tgtactgatg agcggccgct tccctttagt gagggttaat gcttcgagca 7380

gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 7440

tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 7500

aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg 7560

gaggtttttt aaagcaagta aaacctctac aaatgtggta cacggagtgg cagcaccatg 7620

gcctgaaata acctctgaaa gaggaacttg gttaggtacc ttctgaggcg gaaagaacca 7680

gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag 7740

tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc 7800

agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct 7860

aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg 7920

actaattttt tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa 7980

gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg ccgggagctt 8040

gtatatccat tttcggatct gatcagcacg tgttgacaat taatcatcgg catagtatat 8100

cggcatagta taatacgaca aggtgaggaa ctaaaccatg gccaagcctt tgtctcaaga 8160

agaatccacc ctcattgaaa gagcaacggc tacaatcaac agcatcccca tctctgaaga 8220

ctacagcgtc gccagcgcag ctctctctag cgacggccgc atcttcactg gtgtcaatgt 8280

atatcatttt actgggggac cttgtgcaga actcgtggtg ctgggcactg ctgctgctgc 8340

ggcagctggc aacctgactt gtatcgtcgc gatcggaaat gagaacaggg gcatcttgag 8400

cccctgcgga cggtgccgac aggtgcttct cgatctgcat cctgggatca aagccatagt 8460

gaaggacagt gatggacagc cgacggcagt tgggattcgt gaattgctgc cctctggtta 8520

tgtgtgggag ggctaagcac ttcgtggccg aggagcagga ctgacacgtg ctacgagatt 8580

tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 8640

gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 8700

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 8760

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 8820

tctgtactca tgaggcgcgc cactactagg gacaggattg gtgacagaaa agccccatcc 8880

ttaggcctcc tccttcctag tctcctgata ttgggtctaa cccccacctc ctgttaggca 8940

gattccttat ctggtgacac acccccattt cctggagcca tctctctcct tgccagaacc 9000

tctaaggttt gcttacgatg gagccagaga ggatcctggg agggagagct tggcaggggg 9060

tgggagggaa gggggggatg cgtgacctgc ccggttctca gtggccaccc tgcgctaccc 9120

tctcccagaa cctgagctgc tctgacgcgg ctgtctggtg cgtttcactg atcctggtgc 9180

tgcagcttcc ttacacttcc caagaggaga agcagtttgg aaaaacaaaa tcagaataag 9240

ttggtcctga gttctaactt tggctcttca cctttctagt ccccaattta tattgttcct 9300

ccgtgcgtca gttttacctg tgagataagg ccagtagcca gccccgtcct ggcagggctg 9360

tggtgaggag gggggtgtcc gtgtggaaaa ctccctttgt gagaatggtg cgtcctaggt 9420

gttcaccagg tcgtggccgc ctctactccc tttctctttc tccatccttc tttccttaaa 9480

gagtccccag tgctatctgg gacatattcc tccgcccaga gcagggtccc gcttccctaa 9540

ggccctgctc tgggcttctg ggtttgagtc cttggcaagc ccaggagagg cgctcaggct 9600

tccctgtccc ccttcctcgt ccaccatctc atgcccctgg ctctcctgcc ccttccctac 9660

aggtgttcct ggctctgctc tgtttaaaca gatcaaagga tcttcttgag atcctttttt 9720

tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 9780

gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 9840

accaaatact gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 9900

accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 9960

gtcg 9964

<210> 43

<211> 8134

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 43

gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60

ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120

cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180

ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240

gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780

gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840

ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900

taagcttggt accgagctcg gatccactag tccagtgtgg tggaattcta ataggccacc 960

atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 1020

gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcgct gatcttctca 1080

ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 1140

aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 1200

acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 1260

gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 1320

ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 1380

gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 1440

tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 1500

gaggaaggaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 1560

catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 1620

gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 1680

cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 1740

cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 1800

cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 1860

cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 1920

ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1980

aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 2040

aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 2100

gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 2160

aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 2220

attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 2280

attggaatcc tttgcagtgc cctccagaaa ataaagtagg cggccgctcg aggtcaccca 2340

ttcgaacaaa aactcatctc agaagaggat ctgaatatgc ataccggtca tcatcaccat 2400

caccattgag tttaaacccg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 2460

gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 2520

tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 2580

ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 2640

gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 2700

ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 2760

accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 2820

gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 2880

tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 2940

gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 3000

agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 3060

ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 3120

tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 3180

ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3240

agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3300

ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 3360

ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 3420

ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 3480

tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgttgaca attaatcatc 3540

ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca tggccaagcc 3600

tttgtctcaa gaagaatcca ccctcattga aagagcaacg gctacaatca acagcatccc 3660

catctctgaa gactacagcg tcgccagcgc agctctctct agcgacggcc gcatcttcac 3720

tggtgtcaat gtatatcatt ttactggggg accttgtgca gaactcgtgg tgctgggcac 3780

tgctgctgct gcggcagctg gcaacctgac ttgtatcgtc gcgatcggaa atgagaacag 3840

gggcatcttg agcccctgcg gacggtgccg acaggtgctt ctcgatctgc atcctgggat 3900

caaagccata gtgaaggaca gtgatggaca gccgacggca gttgggattc gtgaattgct 3960

gccctctggt tatgtgtggg agggctaagc acttcgtggc cgaggagcag gactgacacg 4020

tgctacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 4080

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 4140

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 4200

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 4260

tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa tcatggtcat 4320

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 4380

gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 4440

gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 4500

aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc ccgcgccact actagggaca 4560

ggattggtga cagaaaagcc ccatccttag gcctcctcct tcctagtctc ctgatattgg 4620

gtctaacccc cacctcctgt taggcagatt ccttatctgg tgacacaccc ccatttcctg 4680

gagccatctc tctccttgcc agaacctcta aggtttgctt acgatggagc cagagaggat 4740

cctgggaggg agagcttggc agggggtggg agggaagggg gggatgcgtg acctgcccgg 4800

ttctcagtgg ccaccctgcg ctaccctctc ccagaacctg agctgctctg acgcggctgt 4860

ctggtgcgtt tcactgatcc tggtgctgca gcttccttac acttcccaag aggagaagca 4920

gtttggaaaa acaaaatcag aataagttgg tcctgagttc taactttggc tcttcacctt 4980

tctagtcccc aatttatatt gttcctccgt gcgtcagttt tacctgtgag ataaggccag 5040

tagccagccc cgtcctggca gggctgtggt gaggaggggg gtgtccgtgt ggaaaactcc 5100

ctttgtgaga atggtgcgtc ctaggtgttc accaggtcgt ggccgcctct actccctttc 5160

tctttctcca tccttctttc cttaaagagt ccccagtgct atctgggaca tattcctccg 5220

cccagagcag ggtcccgctt ccctaaggcc ctgctctggg cttctgggtt tgagtccttg 5280

gcaagcccag gagaggcgct caggcttccc tgtccccctt cctcgtccac catctcatgc 5340

ccctggctct cctgcccctt ccctacaggt gttcctggct ctgctctgtt ttcctcgctc 5400

actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 5460

gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 5520

cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 5580

ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 5640

ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 5700

ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 5760

agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 5820

cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5880

aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 5940

gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 6000

agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 6060

ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 6120

cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 6180

tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 6240

aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 6300

tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 6360

atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 6420

cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 6480

gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 6540

gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 6600

tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 6660

tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 6720

tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 6780

aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 6840

atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 6900

tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 6960

catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 7020

aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 7080

tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 7140

gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 7200

taaattgctt tctctgacca gcattctctc ccctgggcct gtgccgcttt ctgtctgcag 7260

cttgtggcct gggtcacctc tacggctggc ccagatcctt ccctgccgcc tccttcaggt 7320

tccgtcttcc tccactccct cttccccttg ctctctgctg tgttgctgcc caaggatgct 7380

ctttccggag cacttccttc tcggcgctgc accacgtgat gtcctctgag cggatcctcc 7440

ccgtgtctgg gtcctctccg ggcatctctc ctccctcacc caaccccatg ccgtcttcac 7500

tcgctgggtt cccttttcct tctccttctg gggcctgtgc catctctcgt ttcttaggat 7560

ggccttctcc gacggatgtc tcccttgcgt cccgcctccc cttcttgtag gcctgcatca 7620

tcaccgtttt tctggacaac cccaaagtac cccgtctccc tggctttagc cacctctcca 7680

tcctcttgct ttctttgcct ggacaccccg ttctcctgtg gattcgggtc acctctcact 7740

cctttcattt gggcagctcc cctacccccc ttacctctct agtctgtgct agctcttcca 7800

gccccctgtc atggcatctt ccaggggtcc gagagctcag ctagtcttct tcctccaacc 7860

cgggccccta tgtccacttc aggacagcat gtttgctgcc tccagggatc ctgtgtcccc 7920

gagctgggac caccttatat tcccagggcc ggttaatgtg gctctggttc tgggtacttt 7980

tatctgtccc ctccacccca cagtggggcc ctgcaattat tgaagcattt atcagggtta 8040

ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 8100

gcgcacattt ccccgaaaag tgccacctga cgtc 8134

<210> 44

<211> 11805

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 44

gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60

ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120

cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180

ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240

gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780

gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840

ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900

taagcttgtc gaggtaatag gccaccatgc agatcgagct gtccacctgc ttttttctgt 960

gcctgctgcg gttctgcttc agcgccaccc ggcggtacta cctgggcgcc gtggagctgt 1020

cctgggacta catgcagagc gacctgggcg agctgcccgt ggacgcccgg ttccccccca 1080

gagtgcccaa gagcttcccc ttcaacacca gcgtggtgta caagaaaacc ctgttcgtgg 1140

agttcaccga ccacctgttc aatatcgcca agcccaggcc cccctggatg ggcctgctgg 1200

gccccaccat ccaggccgag gtgtacgaca ccgtggtgat caccctgaag aacatggcca 1260

gccaccccgt gagcctgcac gccgtgggcg tgagctactg gaaggccagc gagggcgccg 1320

agtacgacga ccagaccagc cagcgggaga aagaagatga caaggtgttc cctggcggca 1380

gccacaccta cgtgtggcag gtgctgaaag aaaacggccc catggcctcc gaccccctgt 1440

gcctgaccta cagctacctg agccacgtgg acctggtgaa ggacctgaac agcggcctga 1500

tcggcgctct gctcgtctgc cgggagggca gcctggccaa agagaaaacc cagaccctgc 1560

acaagttcat cctgctgttc gccgtgttcg acgagggcaa gagctggcac agcgagacaa 1620

agaacagcct gatgcaggac cgggacgccg cctctgccag agcctggccc aagatgcaca 1680

ccgtgaacgg ctacgtgaac agaagcctgc ccggcctgat tggctgccac cggaagagcg 1740

tgtactggca cgtgatcggc atgggcacca cacccgaggt gcacagcatc tttctggaag 1800

ggcacacctt tctggtccgg aaccaccggc aggccagcct ggaaatcagc cctatcacct 1860

tcctgaccgc ccagacactg ctgatggacc tgggccagtt cctgctgttt tgccacatca 1920

gctctcacca gcacgacggc atggaagcct acgtgaaggt ggactcttgc cccgaggaac 1980

cccagctgcg gatgaagaac aacgaggaag ccgaggacta cgacgacgac ctgaccgaca 2040

gcgagatgga cgtggtgcgg ttcgacgacg acaacagccc cagcttcatc cagatcagaa 2100

gcgtggccaa gaagcacccc aagacctggg tgcactatat cgccgccgag gaagaggact 2160

gggactacgc ccccctggtg ctggcccccg acgacagaag ctacaagagc cagtacctga 2220

acaatggccc ccagcggatc ggccggaagt acaagaaagt gcggttcatg gcctacaccg 2280

acgagacatt caagacccgg gaggccatcc agcacgagag cggcatcctg ggccccctgc 2340

tgtacggcga agtgggcgac acactgctga tcatcttcaa gaaccaggct agccggccct 2400

acaacatcta cccccacggc atcaccgacg tgcggcccct gtacagcagg cggctgccca 2460

agggcgtgaa gcacctgaag gacttcccca tcctgcccgg cgagatcttc aagtacaagt 2520

ggaccgtgac cgtggaggac ggccccacca agagcgaccc cagatgcctg acccggtact 2580

acagcagctt cgtgaacatg gaacgggacc tggcctccgg gctgatcgga cctctgctga 2640

tctgctacaa agaaagcgtg gaccagcggg gcaaccagat catgagcgac aagcggaacg 2700

tgatcctgtt cagcgtgttc gatgagaacc ggtcctggta tctgaccgag aacatccagc 2760

ggtttctgcc caaccctgcc ggcgtgcagc tggaagatcc cgagttccag gccagcaaca 2820

tcatgcactc catcaatggc tacgtgttcg actctctgca gctctccgtg tgtctgcacg 2880

aggtggccta ctggtacatc ctgagcatcg gcgcccagac cgacttcctg agcgtgttct 2940

tcagcggcta caccttcaag cacaagatgg tgtacgagga caccctgacc ctgttccctt 3000

tcagcggcga gacagtgttc atgagcatgg aaaaccccgg cctgtggatt ctgggctgcc 3060

acaacagcga cttccggaac cggggcatga ccgccctgct gaaggtgtcc agctgcgaca 3120

agaacaccgg cgactactac gaggacagct acgaggatat cagcgcctac ctgctgtcca 3180

agaacaacgc catcgaaccc cggagcttca gccagaaccc ccccgtgctg acgcgtagct 3240

tcagccagaa cagccggcac cccagcaccc ggcagaagca gttcaacgcc accaccatcc 3300

ccgagaacga catcgagaaa accgaccctt ggtttgccca ccggaccccc atgcccaaga 3360

tccagaacgt gtccagcagc gacctgctga tgctgctgcg gcagagcccc acccctcacg 3420

gcctgagcct gagcgacctg caggaagcca agtacgagac attcagcgac gaccccagcc 3480

ctggcgccat cgacagcaac aacagcctgt ccgagatgac ccacttccgg ccccagctgc 3540

accacagcgg cgacatggtg ttcacccccg agagcggcct gcagctgcgg ctgaacgaga 3600

agctgggcac caccgccgcc accgagctga agaagctgga cttcaaggtc tccagcacca 3660

gcaacaacct gatcagcacc atccccagcg acaacctggc cgctggcacc gacaacacca 3720

gcagcctggg ccctcccagc atgcccgtgc actacgacag ccagctggac accaccctgt 3780

tcggcaagaa gtccagcccc ctgaccgagt ccggcggacc cctgtccctg agcgaggaaa 3840

acaacgacag caagctgctg gaaagcggcc tgatgaacag ccaggaaagc agctggggca 3900

agaatgtgtc cagcacgcgt caccagcggg agatcacccg gacaaccctg cagtccgacc 3960

aggaagagat cgattacgac gacaccatca gcgtggagat gaagaaagag gatttcgata 4020

tctacgacga ggacgagaac cagagcccca gaagcttcca gaagaaaacc cggcactact 4080

tcattgccgc cgtggagagg ctgtgggact acggcatgag ttctagcccc cacgtgctgc 4140

ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caggaattca 4200

cagacggcag cttcacccag cctctgtata gaggcgagct gaacgagcac ctggggctgc 4260

tggggcccta catcagggcc gaagtggagg acaacatcat ggtgaccttc cggaatcagg 4320

ccagcagacc ctactccttc tacagcagcc tgatcagcta cgaagaggac cagcggcagg 4380

gcgccgaacc ccggaagaac ttcgtgaagc ccaacgaaac caagacctac ttctggaaag 4440

tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg gcctacttca 4500

gcgacgtgga tctggaaaag gacgtgcact ctggactgat tggcccactc ctggtctgcc 4560

acactaacac cctcaacccc gcccacggcc gccaggtgac cgtgcaggaa ttcgccctgt 4620

tcttcaccat cttcgacgag acaaagtcct ggtacttcac cgagaatatg gaacggaact 4680

gcagagcccc ctgcaacatc cagatggaag atcctacctt caaagagaac taccggttcc 4740

acgccatcaa cggctacatc atggacaccc tgcctggcct ggtgatggcc caggaccaga 4800

gaatccggtg gtatctgctg tccatgggca gcaacgagaa tatccacagc atccacttca 4860

gcggccacgt gttcaccgtg cggaagaaag aagagtacaa gatggccctg tacaacctgt 4920

accccggcgt gttcgagaca gtggagatgc tgcccagcaa ggccggcatc tggcgggtgg 4980

agtgtctgat cggcgagcac ctgcacgctg gcatgagcac cctgtttctg gtgtacagca 5040

acaagtgcca gaccccactg ggcatggcct ctggccacat ccgggacttc cagatcaccg 5100

cctccggcca gtacggccag tgggccccca agctggccag actgcactac agcggcagca 5160

tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggccccta 5220

tgatcatcca cggcattaag acccagggcg ccaggcagaa gttcagcagc ctgtacatca 5280

gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac cggggcaaca 5340

gcaccggcac cctgatggtg ttcttcggca atgtggacag cagcggcatc aagcacaaca 5400

tcttcaaccc ccccatcatt gcccggtaca tccggctgca ccccacccac tacagcatta 5460

gatccacact gagaatggaa ctgatgggct gcgacctgaa ctcctgcagc atgcctctgg 5520

gcatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca 5580

tgttcgccac ctggtccccc tccaaggcca ggctgcacct gcagggccgg tccaacgcct 5640

ggcggcctca ggtcaacaac cccaaagaat ggctgcaggt ggactttcag aaaaccatga 5700

aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct gaccagcatg tacgtgaaag 5760

agtttctgat cagcagctct caggatggcc accagtggac cctgttcttt cagaacggca 5820

aggtgaaagt gttccagggc aaccaggact ccttcacccc cgtggtgaac tccctggacc 5880

cccccctgct gacccgctac ctgagaatcc acccccagtc ttgggtgcac cagatcgccc 5940

tcaggatgga agtcctggga tgtgaggccc aggatctgta ctgatgagcg gccgctcgag 6000

gtcacccatt cgaacaaaaa ctcatctcag aagaggatct gaatatgcat accggtcatc 6060

atcaccatca ccattgagtt taaacccgct gatcagcctc gactgtgcct tctagttgcc 6120

agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 6180

ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 6240

ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 6300

atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc tggggctcta 6360

gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 6420

gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 6480

cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 6540

ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 6600

cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 6660

tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 6720

cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 6780

aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt gtggaaagtc 6840

cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccag 6900

gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta 6960

gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 7020

cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg ccgaggccgc 7080

ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 7140

caaaaagctc ccgggagctt gtatatccat tttcggatct gatcagcacg tgttgacaat 7200

taatcatcgg catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg 7260

gccaagcctt tgtctcaaga agaatccacc ctcattgaaa gagcaacggc tacaatcaac 7320

agcatcccca tctctgaaga ctacagcgtc gccagcgcag ctctctctag cgacggccgc 7380

atcttcactg gtgtcaatgt atatcatttt actgggggac cttgtgcaga actcgtggtg 7440

ctgggcactg ctgctgctgc ggcagctggc aacctgactt gtatcgtcgc gatcggaaat 7500

gagaacaggg gcatcttgag cccctgcgga cggtgccgac aggtgcttct cgatctgcat 7560

cctgggatca aagccatagt gaaggacagt gatggacagc cgacggcagt tgggattcgt 7620

gaattgctgc cctctggtta tgtgtgggag ggctaagcac ttcgtggccg aggagcagga 7680

ctgacacgtg ctacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 7740

aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 7800

cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 7860

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 7920

catcaatgta tcttatcatg tctgtacgcg ccactactag ggacaggatt ggtgacagaa 7980

aagccccatc cttaggcctc ctccttccta gtctcctgat attgggtcta acccccacct 8040

cctgttaggc agattcctta tctggtgaca cacccccatt tcctggagcc atctctctcc 8100

ttgccagaac ctctaaggtt tgcttacgat ggagccagag aggatcctgg gagggagagc 8160

ttggcagggg gtgggaggga agggggggat gcgtgacctg cccggttctc agtggccacc 8220

ctgcgctacc ctctcccaga acctgagctg ctctgacgcg gctgtctggt gcgtttcact 8280

gatcctggtg ctgcagcttc cttacacttc ccaagaggag aagcagtttg gaaaaacaaa 8340

atcagaataa gttggtcctg agttctaact ttggctcttc acctttctag tccccaattt 8400

atattgttcc tccgtgcgtc agttttacct gtgagataag gccagtagcc agccccgtcc 8460

tggcagggct gtggtgagga ggggggtgtc cgtgtggaaa actccctttg tgagaatggt 8520

gcgtcctagg tgttcaccag gtcgtggccg cctctactcc ctttctcttt ctccatcctt 8580

ctttccttaa agagtcccca gtgctatctg ggacatattc ctccgcccag agcagggtcc 8640

cgcttcccta aggccctgct ctgggcttct gggtttgagt ccttggcaag cccaggagag 8700

gcgctcaggc ttccctgtcc cccttcctcg tccaccatct catgcccctg gctctcctgc 8760

cccttcccta caggtgttcc tggctctgct ctgttttacc gtcgacctct agctagagct 8820

tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 8880

acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 8940

tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 9000

tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 9060

cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 9120

actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 9180

gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 9240

ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 9300

acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 9360

ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 9420

cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 9480

tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 9540

gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 9600

ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 9660

acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 9720

gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 9780

ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 9840

tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 9900

gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 9960

tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 10020

ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 10080

taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 10140

cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 10200

gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 10260

gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 10320

tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 10380

gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 10440

ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 10500

ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 10560

cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 10620

ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 10680

gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 10740

ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 10800

ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 10860

tcctttttca ataaattgct ttctctgacc agcattctct cccctgggcc tgtgccgctt 10920

tctgtctgca gcttgtggcc tgggtcacct ctacggctgg cccagatcct tccctgccgc 10980

ctccttcagg ttccgtcttc ctccactccc tcttcccctt gctctctgct gtgttgctgc 11040

ccaaggatgc tctttccgga gcacttcctt ctcggcgctg caccacgtga tgtcctctga 11100

gcggatcctc cccgtgtctg ggtcctctcc gggcatctct cctccctcac ccaaccccat 11160

gccgtcttca ctcgctgggt tcccttttcc ttctccttct ggggcctgtg ccatctctcg 11220

tttcttagga tggccttctc cgacggatgt ctcccttgcg tcccgcctcc ccttcttgta 11280

ggcctgcatc atcaccgttt ttctggacaa ccccaaagta ccccgtctcc ctggctttag 11340

ccacctctcc atcctcttgc tttctttgcc tggacacccc gttctcctgt ggattcgggt 11400

cacctctcac tcctttcatt tgggcagctc ccctaccccc cttacctctc tagtctgtgc 11460

tagctcttcc agccccctgt catggcatct tccaggggtc cgagagctca gctagtcttc 11520

ttcctccaac ccgggcccct atgtccactt caggacagca tgtttgctgc ctccagggat 11580

cctgtgtccc cgagctggga ccaccttata ttcccagggc cggttaatgt ggctctggtt 11640

ctgggtactt ttatctgtcc cctccacccc acagtggggc cctgcaatta ttgaagcatt 11700

tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 11760

ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtc 11805

<210> 45

<211> 506

<212> DNA

<213> 人工序列

<220>

<223> 人工多核苷酸

<400> 45

gcagcaccat ggcctgaaat aacctctgaa agaggaactt ggttaggtac cttctgaggc 60

ggaaagaacc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 120

gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 180

ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 240

gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 300

ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 360

ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagctcccg 420

ggagcttgta tatccatttt cggatctgat cagcacgtgt tgacaattaa tcatcggcat 480

agtatatcgg catagtataa tacgac 506

133页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:利用源自舞蹈拟土地杆菌的岩藻糖基转移酶的2’-岩藻糖基乳糖的生产方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!