基于aav病毒的基因编辑表达盒

文档序号:1425599 发布日期:2020-03-17 浏览:14次 >En<

阅读说明:本技术 基于aav病毒的基因编辑表达盒 (AAV virus-based gene editing expression cassette ) 是由 褚贝贝 杨国宇 王江 刘忠虎 汪新建 钟凯 鲁维飞 郭豫杰 于 2018-09-11 设计创作,主要内容包括:本发明涉及基因编辑领域。具体而言,本发明涉及基于AAV病毒的基因编辑表达盒。更具体而言,本发明涉及基于AAV病毒的基因编辑表达盒,以及包括所述表达盒的载体和利用所述表达盒或载体的基因编辑方法。(The present invention relates to the field of gene editing. In particular, the invention relates to AAV virus-based gene editing expression cassettes. More particularly, the present invention relates to AAV virus-based gene editing expression cassettes, as well as vectors comprising the expression cassettes and gene editing methods using the expression cassettes or vectors.)

基于AAV病毒的基因编辑表达盒

技术领域

本发明涉及基因编辑领域。具体而言,本发明涉及基于AAV病毒的基因编辑表达盒。更具体而言,本发明涉及基于AAV病毒的基因编辑表达盒,以及包括所述表达盒的载体和利用所述表达盒或载体的基因编辑方法。

背景技术

成簇的规律间隔的短回文重复序列(Clustered regularly interspaced shortpalindromic repeats,CRISPR)及其相关蛋白9(CRISPR-associated proteins 9,Cas9)在基础生物学研究、生物化学、农业、医药业等领域成为一种革命性的工具(Barrangou etal.,CRISPR provides acquired resistance against viruses in prokaryotes[J].Science,2007,315(5819):1709-1712;Doudna and Charpentier,Genome editing.Thenew frontier of genome engineering with CRISPR-Cas9[J].Science,2014,346(6213):1258096;Hsuet al.,Development and applications of CRISPR-Cas9forgenome engineering[J].Cell,2014,157(6):1262-1278;Van Der Oost et al.,Unravelling the structural and mechanistic basis of CRISPR-Cas systems[J].NatRev Microbiol,2014,12(7):479-492;Barrangou and Doudna,Applications of CRISPRtechnologies in research and beyond[J].Nat Biotechnol,2016,34(9):933-941.)。它设计简单、操作便捷且成本较低,可用来切割或结合特定的DNA或RNA序列,逐渐成为基因编辑、基因调控、基因治疗等技术的标准应用程序。2012年Doudna等将CRISPR RNA(crRNA)与反式激活crRNA(trans-activating crRNA,tracrRNA)连接并构建成单链向导RNA(singleguide RNA,sgRNA)载体,证实与Cas9一起可在体外切割DNA片段。只需要改变sgRNA中与目的基因互补的序列,就可以造成DNA双链的断裂(double-strand break,DSB)(Jinek etal.,A programmable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity[J].Science,2012,337(6096):816-821.)。断开的DNA一般通过两条途径进行修复:主要是非同源末端连接(nonhomologous end joining,NHEJ),造成断开位置的随机***或缺失(Insertion or deletion,Indel)碱基(Lieber,The mechanism of double-strand DNA break repair by the nonhomologous DNA end-joining pathway[J].AnnuRev Biochem,2010,79:181-211.)从而形成移码突变,进而造成基因敲除;另一条是同源重组修复途径(homology directed repair,HDR),可利用带有同源臂的模板对切开位点进行特定修复(San Filippo et al.,Mechanism of eukaryotic homologous recombination[J].Annu Rev Biochem,2008,77:229-257.),行使基因的***、缺失、突变等功能。2013年Zhang团队和Church团队同时发表了将CRISPR/Cas9系统用于真核细胞中进行基因组编辑,在基因研究中具有里程碑式的意义(Cong et al.,Multiplex genome engineering usingCRISPR/Cas systems[J].Science,2013,339(6121):819-823;Mali P et al.,RNA-guidedhuman genome engineering via Cas9[J].Science,2013,339(6121):823-826.)。

sgRNA作为CRISPR/Cas9技术的重要组成部分,起引导Cas9蛋白靶向目标DNA的作用。为了同时对多个靶位点进行切割,就需要利用多个sgRNA载体。然而,细胞中共转染多个质粒容易引起转染效率低下(Wang et al.,One-step generation of mice carryingmutations in multiple genes by CRISPR/Cas-mediated genome engineering[J].Cell,2013,153(4):910-918.)。Cao等以一步克隆法,构建多达6个各以U6启动子启动sgRNA转录的串联慢病毒载体,并证实了其可在细胞中起作用(Cao et al.,An easy andefficient inducible CRISPR/Cas9platform with improved specificity formultiple gene targeting[J].Nucleic Acids Res,2016,44(19):e149.)。但是慢病毒的承载量较AAV大,能够有效的行使Cas9系统的多基因编辑功能。Yin等以In-Fusion法构建含有4个sgRNA串联的、各以U6启动子启动转录的AAV载体,包装病毒后感染HIV-1模型小鼠,发现能有效清除HIV前病毒(Yin et al.,In Vivo Excision of HIV-1Provirus by saCas9and Multiplex Single-Guide RNAs in Animal Models[J].Mol Ther,2017,25(5):1168-1186.),但是串联4个sgRNA的重组载体由于长度较大,包装的病毒活力较差,使用中需要较大的病毒量从而增加了试验成本。

AAV被视为最有发展潜力的病毒载体,具有不整合到宿主基因组、免疫原性较低、无致病性等优点。但是其承载量较小(约4.7kb),限制了其使用范围。鉴于AAV介导的CRISPR/Cas9系统基因编辑在生物医药领域的广阔前景,有必要优化AAV载体,以克服以上提到的不足。

发明概述

在一方面,本发明提供了一种表达盒,其包含分别位于表达盒5′端和3′端的两个反向末端重复(ITR),以及位于两个反向末端重复之间的第一启动子、与第一启动子可操作地连接的编码Cas9多肽的第一多核苷酸、多个串联的启动子-sgRNA单元,其中所述串联的启动子-sgRNA单元之间存在间隔序列,且其中所述表达盒大小不超过5.0kb。

在一些实施方案中,所述启动子-sgRNA单元的数量为2个、3个、4个或更多个。

在一些实施方案中,位于表达盒5′端的反向末端重复AAV2 ITR 5′序列如SEQ IDNO:7所示,位于表达盒3′端的反向末端重复AAV2 ITR 3′序列如SEQ ID NO:8所示。

在一些实施方案中,所述启动子-sgRNA单元中的启动子为tRNA编码序列。

在一些实施方案中,所述第一启动子是是SEQ ID NO:10所示的EF1α启动子。

在一些实施方案中,所述tRNA编码序列是任何哺乳动物的tRNA,例如Gln tRNA、Pro tRNA、Gly tRNA、Asn tRNA、Cys tRNA、Glu tRNA。

在一些实施方案中,所述tRNA编码序列是SEQ ID NO:9所示的Gln tRNA。

在一些实施方案中,所述启动子是小鼠γ疱疹病毒-68(MHV68)RNA

在一些实施方案中,所述间隔序列的长度不超过40bp,例如10bp、20bp或40bp,优选20bp或40bp,最优选20bp。

在一些实施方案中,所述Cas9多肽为金黄色葡萄球菌(Staphylococcus aureus)Cas9(SaCas9),其任选地与核定位序列(NLS)连接,可后接转录终止信号PolyA,并且所述启动子-sgRNA单元中的sgRNA为SaCas9对应的sgRNA。

在一些实施方案中,本发明的表达盒从5'-3'方向按顺序包含AAV2 ITR5′、EF1α启动子、与EF1α启动子可操作地连接的SaCas9表达序列、不超过4个串联的tRNA编码序列-SaCas9对应的sgRNA单元、以及AAV2 ITR3′。

在一些实施方案中,包含如SEQ ID NO:1-3所示的核苷酸序列。

在另一方面,本发明提供了一种重组载体,其包含本发明的表达盒。

在一些实施方案中,所述载体是腺相关病毒载体。

在另一方面,本发明提供了一种试剂盒,其包含本发明的表达盒或本发明的重组载体。

在另一方面,本发明提供了一种基因编辑的方法,包括将本发明的表达盒或本发明的重组载体递送至细胞的步骤。

具体实施方式

图1示出pX601(EF1α-tRNA)重组载体示意图。。

图2示出支架-U6/tRNA重组载体示意图。图2a为支架-U6重组载体,图2b为支架-tRNA重组载体;划线部分表示此部位***0、10、20、40bp的间隔序列。

图3示出串联sgRNA重组载体结构示意图。ITR为反向末端重复序列;NLS为核定位信号序列;HA为HA标签;Scaf为支架序列;EF1α、CMV、tRNA、U6为表示相应的启动子;t4、1t4、2t4、4t4为以EF1α和tRNA为启动子的、分别含有间隔序列长度为0、10、20、40bp的串联4个sgRNA的重组载体;U4、1U4、2U4、4U4为以CMV和U6为启动子的、分别含有间隔序列长度为0、10、20、40bp的串联4个sgRNA的重组载体。

图4示出T7核酸内切酶I检测串联sgRNA重组载体在NIH3T3细胞中基因编辑结果。图4a为mMSTN-sgRNA1位点不同串联组T7核酸内切酶I法检测结果;图4b为mMSTN-sgRNA2位点不同串联组T7核酸内切酶I法检测结果;图4c为mTyr-sgRNA3位点不同串联组T7核酸内切酶I法检测结果;图4d为mRosa26-sgRNA2位点不同串联组T7核酸内切酶I法检测结果。SU为以U6为启动子的一个sgRNA组;St为以tRNA为启动子的一个sgRNA组;M为50bp DNA Ladder;C-为阴性对照。箭头指示切开的目的片段。

图5示出T7核酸内切酶I检测AAV-DJ介导的串联sgRNA重组载体在NIH3T3细胞中基因编辑效果。图5a为mMSTN-sgRNA1位点不同串联组T7核酸内切酶I法检测结果;图5b为mMSTN-sgRNA2位点不同串联组T7核酸内切酶I法检测结果;图5c为mTyr-sgRNA3位点不同串联组T7核酸内切酶I法检测结果;图5d为mRosa26-sgRNA2位点不同串联组T7核酸内切酶I法检测结果。M为50bp DNA Ladder;C-为阴性对照。箭头指示切开的目的片段。

发明详述

除非另有指示或定义,否则所有所用术语均具有本领域中的通常含义,该含义将为本领域技术人员所了解。参考例如标准手册,如Sambrook等人,“Molecular Cloning:ALaboratory Manual”(第2版),第1-3卷,Cold Spring Harbor Laboratory Press(1989);Lewin,“Genes IV”,Oxford University Press,New York,(1990);及Roitt等人,“Immunology”(第2版),Gower Medical Publishing,London,New York(1989),以及本文中引用的一般现有技术;此外,除非另有说明,否则未具体详述的所有方法、步骤、技术及操作均可以且已经以本身已知的方式进行,该方式将为本领域技术人员所了解。亦参考例如标准手册、上述一般现有技术及其中引用的其他参考文献。

在说明书中和权利要求中所使用的,指不同的结构或方法步骤的序数指示,比如第一、第二和第三,不应该被解释为指示任何具体的结构或步骤、或者这种结构或步骤的任何特定顺序或构型。在本文中描述的所有方法可以以任何合适的顺序进行,除本文中另有指示,或者明显与上下文矛盾。

重组表达盒

在一方面,本发明提供了一种表达盒,其包含分别位于表达盒5′端和3′端的两个反向末端重复(ITR),以及位于两个反向末端重复之间的第一启动子、与第一启动子可操作地连接的编码Cas9多肽的第一多核苷酸、多个串联的启动子-sgRNA单元,其中所述串联的启动子-sgRNA单元之间存在间隔序列,且其中所述表达盒大小不超过5.0kb。

在一些实施方案中,所述启动子-sgRNA单元的数量为2个、3个、4个或更多个。

如本文所用,术语“CRISPR”是指规律成簇间隔短回文重复,其构成的基因座家族通常由短的和高度保守的DNA重复组成,例如重复1-40次且至少部分回文结构的24-50个碱基对。重复序列通常是物种特异性的,并且通过恒定长度例如20-58个碱基对的可变序列间隔开。CRISPR基因座也可以编码一种或多种蛋白质和一种或多种不翻译成蛋白质的RNA。因此,“CRISPR-Cas”系统是与细菌或古细菌相同或衍生自细菌或古细菌并含有至少一个由CRISPR基因座编码或衍生的Cas蛋白的系统。

如本文所用,缩写“Cas”是指CRISPR相关部分,例如来自II型系统的蛋白质如Cas9或其衍生物。

如本文所用,术语“Cas9多肽”、“Cas9核酸酶”或“Cas9酶”可以互换地使用,通常指在天然存在的CRISPR系统中存在的核酸酶。Cas9多肽可以通过与向导RNA(如人工gRNA(如sgRNA))一起相互作用来识别和/或切割靶核酸结构。“Cas9多肽”的实例包括Cas9核酸酶或其变体。所述Cas9核酸酶可以是来自不同物种的Cas9核酸酶,例如来自葡萄球菌属(Staphylococcus)。

在本发明的实施方案中,可使用衍生自金黄色葡萄球菌(Staphylococcusaureus)的SaCas9(如SEQ ID NO:7所示)及其变体,以及衍生自金黄色葡萄球菌的CRISPR系统。每种Cas9多肽依赖于不同的识别位点或PAM,SaCas9的PAM是5′-NNGRRT-3′,其中N是任意核苷酸,R是嘌呤。每种具有不同的sgRNA支架序列,形成单向导RNA的3′部分。sgRNA的靶标序列特异性的5′部分的长度也同样在Cas9酶间不同,Sa使用18至24个核苷酸靶标序列。

所述Cas9核酸酶变体的实例包括但不限于Cas9核酸酶的高特异性变体,例如PCT/US2016/049147、PCT/US2016/020756等描述的SaCas9核酸酶变体。

在CRISPR系统中,Cas9酶通过sgRNA被引导切割DNA靶标序列。sgRNA至少包括具有两种功能的两个部分。第一部分是sgRNA的靶向部分,相对于第二部分,其在sgRNA的5′端。sgRNA的第一部分与靶标序列的链互补。靶标序列紧接靶标DNA上Cas9的PAM序列5′。与靶标序列互补的sgRNA部分的长度可以在10个核苷酸、13个核苷酸、15个核苷酸、18个核苷酸、20个核苷酸、22个核苷酸或24个核苷酸之间,或者在10至30之间的任意数目的核苷酸。与靶标序列互补的sgRNA部分应该能够与在靶标链中的序列杂交,并且最佳地完全与靶标序列互补。sgRNA的互补部分的准确长度和定位取决于与其配对的Cas9酶。选择的Cas9酶需要sgRNA经过设计从而特异性地用于该酶,并且控制sgRNA的设计。

本发明可用的其他一些“Cas9多肽”可见于例如http://www.addgene.org/crispr/guide/。

如本文所用,术语“启动子-sgRNA单元”是指启动子和sgRNA可操作地连接的构建体或片段,其中sgRNA包含特异性针对靶标序列的序列以及组成sgRNA所需的支架序列。特异性针对靶标序列的序列通常长度约为20bp-30bp,约为20bp、约为21bp、约为22bp、约为23bp、约为24bp、约为25bp、约为26bp、约为27bp、约为28bp、约为29bp或约为30bp。所述支架序列通常不超过80bp、不超过79bp、不超过78bp、不超过77bp、不超过76bp、不超过75bp、不超过74bp、不超过73bp、不超过72bp、不超过71bp、或不超过70bp。启动子-sgRNA单元可以可操作地连接表达载体所需的其它元件,例如反向末端重复、PolyA等,以构建能够表达期望的蛋白的载体,也可以连接额外的启动子和与额外的启动子可操作地连接的核苷酸序列。

如本文所用,两个或多个启动子-sgRNA单元可以在表达盒上串联,以构建含有多重sgRNA的重组载体,用于进行多基因编辑,同时对多个靶位点进行切割,从而节约实验成本和时间。如本文所用,在串联的启动子-sgRNA单元之间掺入间隔序列可以提高多基因编辑的效率。

如本文所用,术语“间隔序列”是指任意长度的无意义的核苷酸片段,所述片段不编码任何产物,也不具有任何调控功能,仅为隔开串联的启动子-sgRNA单元。所述间隔序列可以为任意bp长度的片段,优选不超过40bp,例如40bp、30bp、20bp、10bp,更优选40bp或20bp,甚至更优选20bp。

如本文所用,“gRNA”和“向导RNA”、“sgRNA”和“单向导RNA”可互换使用,指的是能够与Cas9多肽形成复合物并由于与靶序列具有一定互补性而能够将所述复合物靶向靶序列的RNA分子。例如,在基于Cas9的基因编辑系统中,gRNA通常由部分互补形成复合物的crRNA和tracrRNA分子构成,其中crRNA包含与靶序列具有足够互补性以便与该靶序列杂交并且指导CRISPR复合物(Cas9+crRNA+tracrRNA)与该靶序列序列特异性地结合的序列。然而,本领域已知可以设计单向导RNA(sgRNA),其同时包含crRNA和tracrRNA的特征。基于所使用的Cas9多肽和待编辑的靶序列设计合适的gRNA序列属于本领域技术人员的能力范围内。

如本文所用,术语“重组”表达盒或载体指存在彼此天然不相关的两种或多种核酸区域。在本发明中,重组表达盒或重组载体可分别与表达盒或表达载体互换地使用。

如本文所用,术语“可操作地连接”描述调控元件和基因或其编码区之间的连接。即,通常基因表达位于某种调控元件的控制下,例如不限于组成型或诱导型启动子、组织特异性调控元件和增强子。称基因或编码区域与调控元件“可操作地连接”,意思是基因或编码区域受调控元件的控制或影响。在本发明中,调控元件包括启动子、增强子、反式激活因子等。

在一些实施方案中,位于表达盒5′端的反向末端重复AAV2 ITR 5′序列如SEQ IDNO:7所示,位于表达盒3′端的反向末端重复AAV2 ITR 3′序列如SEQ ID NO:8所示。

在一些实施方案中,所述表达盒的反向末端重复在表达盒的两侧,用于在腺相关病毒(AAV)载体中包装。本领域技术人员可以根据本发明的精神和需要设计两个ITR之间的序列。

如本文所用,术语“反向末端重复”或“ITR”指因为它们的对称性这样命名的AAV病毒顺式元件。这些元件对于AAV基因组的高效扩增非常重要。假设ITR功能的不可缺少的最小限定元件为Rep-结合位点(RBS;对于AAV2为5′-GCGCGCTCGCTCGCTC-3′)和末端分辨位点(TRS;对于AAV2为5′-AGTTGG-3′)加上允许形成发夹的可变回文序列。根据本发明,ITR包含至少这3个元件(RBS、TRS和允许形成发夹的序列)。此外,在本发明中,术语“ITR”指已知的天然AAV血清型的ITR(例如血清型1、2、3、4、5、6、7、8、9、10或11AAV的ITR)、通过融合来源于不同血清型的ITR元件形成的嵌合ITR以及它们的功能变体。

在一些实施方案中,所述第一启动子是是SEQ ID NO:10所示的EF1α启动子。

在一些实施方案中,所述启动子-sgRNA单元中的启动子为tRNA编码序列。

在一些实施方案中,所述tRNA编码序列是任何哺乳动物的tRNA,例如Gln tRNA、Pro tRNA、Gly tRNA、Asn tRNA、Cys tRNA、Glu tRNA。

在一些实施方案中,所述tRNA编码序列是SEQ ID NO:9所示的Gln tRNA。

在一些实施方案中,所述启动子是小鼠γ疱疹病毒-68(MHV68)RNA。

如本文所用,术语“启动子”包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列,以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。在一些实施例中,一个载体包含一个或多个聚合酶III启动子(例如1、2、3、4、5、或更多个聚合酶III启动子)、一个或多个聚合酶II启动子(例如1、2、3、4、5、或更多个聚合酶II启动子)、一个或多个聚合酶I启动子(例如1、2、3、4、5、或更多个聚合酶I启动子)、或其组合。聚合酶III启动子的实例包括但不限于U6启动子和tRNA编码序列。聚合酶II启动子的实例包括但不限于EF1α启动子、CMV启动子(任选地具有CMV增强子)、CBA启动子、hSynapsin启动子、HSV-TK启动子、SV40早期启动子和LSP启动子。

在本发明的实施方案中,优选片段小于U6启动子的聚合酶III启动子,包括但不限于tRNA编码序列;优选片段小于CMV启动子的聚合酶II启动子,包括但不限于EF1α启动子。任选的,本发明可利用其他较短的元件,如polyA尾等。

如本文所用,术语“tRNA”和“tRNA编码序列”可以互换地使用,是指存在于野生型tRNA编码基因中的非常短的约70bp长的依赖于RNA聚合酶III的启动子,其能够表达高水平的功能性sgRNA。如本领域技术人员已知的,tRNA转录所需的启动子位于转录起始位点下游的转录区内,因此也称为下游启动子(downwtream promoter)或内部启动子(internalpromoter)或称为内部控制区(internal contron regin,ICR),其依赖于RNA聚合酶Ⅲ。tRNA内部启动子含有两个分开的box A和box B,且box A和box B之间的距离较宽,其中boxA相当于启动子作用,box B相当于增强子作用。TFⅢC结合box A和box B使TFⅢB依次结合在起始位点的近上游,TFⅢB结合起始位点并和TFⅢC相连,TFⅢB负责RNA聚合酶III结合的正确定位从而启动转录。因此本文所用的tRNA编码序列可以起到启动子的作用,并且可以表达至少2个全长sgRNA,留出>800bp的可用空间给Cas9转录和功能所需要的额外位点,例如依赖RNA聚合酶II的启动子、NLS、和poly(A)等,或者如本发明的实施方案所述,提供空间给报告分子。所述sgRNA特异性针对一系列的DNA标靶,并且也特异性针对比SpCas9更小的Cas9多肽,例如SaCas9。

以往的工作专注于使用U6启动子来驱动sgRNA转录。虽然非常有效,但是U6启动子约254bp长,并且因此两个U6启动子将需要超过AAV载体的整个包装容量的10%。因此期望鉴定比U6更小的、效果相同的RNA聚合酶III启动子。如本文所用,哺乳动物或病毒起源的tRNA能够驱动sgRNA的表达。本发明利用人tRNA编码序列用于表达高水平的sgRNA。在其他实施方案中,也可以使用病毒起源的tRNA编码序列。

将RNA聚合酶III启动子可操作地连接于单向导RNA(sgRNA)。在一个实施方案中,sgRNA包含与靶标DNA序列的正义链互补的5′部分和能够结合Cas9的保守的、结构化的3′末端。靶标DNA可以包含编码期望突变和/或缺失的基因的任何DNA序列。潜在的靶标序列必须恰好位于靶标DNA序列中被Cas9多肽识别的PAM序列的5′。表达盒可以仅包含一个与sgRNA可操作地连接的RNA聚合酶III启动子,或者在表达盒中可以包括两个或更多个RNA聚合酶III启动子-sgRNA组合。在单基因或靶标序列中,使用靶向两个靶标序列的两个或更多个sgRNA,足以修饰一个或更多个靶标序列。

tRNA编码序列的实例包括但不限于Gln tRNA、Pro tRNA、Gly tRNA、Asn tRNA、CystRNA、Glu tRNA、小鼠γ疱疹病毒-68(MHV68)RNA或任何哺乳动物tRNA(参见例如MefferdAL,et al.Expression of CRISPR/Cas single guide RNAs using small tRNApromoters[J].RNA,2015,21(9):1683-1689)。

如本文所用,“EF1α启动子”是衍生自pEF-BOS质粒(Mizushima和Nagata,1990)的约212bp的强哺乳动物表达启动子,其大小约为CMV启动子(584bp)的一半。EF1α启动子是组成型启动子,在细胞中表达水平十分稳定,与细胞类型无关。

在一些实施方案中,所述Cas9多肽为金黄色葡萄球菌(Staphylococcus aureus)Cas9(SaCas9),其任选地与核定位序列(NLS)连接,并且所述启动子-sgRNA单元中的sgRNA为SaCas9对应的sgRNA。

在优选实施方案中,Cas9多肽为金黄色葡萄球菌Cas9(SaCas9),优选地,所述Cas9多肽后接转录终止信号PolyA。

在一些实施方案中,本发明的表达盒从5'-3'方向按顺序包含AAV2ITR5′、EF1α启动子、与EF1α启动子可操作地连接的SaCas9表达序列、不超过4个串联的tRNA编码序列-SaCas9对应的sgRNA单元、以及AAV2ITR3′。

在一些实施方案中,本发明的表达盒包含如SEQ ID NO:1-3所示的核苷酸序列。

在本发明的另一方面,本发明提供了一种表达盒,其包含如SEQ ID NO:1-6所示的核苷酸序列,优选包含如SEQ ID NO:1-3所示的核苷酸序列,其中N为特异性针对靶标序列的序列,本领域技术人员可以根据已知的技术和手段根据需要设计该特异性序列,其后接SaCas9对应的sgRNA支架序列,如SEQ ID NO:11所示。

重组载体

在另一方面,本发明提供了一种重组载体,其包含本发明的表达盒、或由本发明的表达盒组成、或基本上由本发明的表达盒组成。

在一些实施方案中,所述载体是腺相关病毒载体。

如本文所用,术语“载体”指包括能够转移和/或运输核酸组合物至宿主细胞、进入宿主细胞和/或至宿主细胞中的特定位置的任何元件,例如质粒、噬菌体、转座子、粘粒、染色体、人工染色体(YAC或BAC)、病毒等。因此该术语包括克隆和表达工具,以及病毒和非病毒载体,和可能的裸的或组合的DNA。然而,该术语不包括产生基因转移载体的细胞,比如逆转录病毒包装细胞系。

对于本发明的目的,“重组病毒”、“重组载体”、或“重组病毒载体”指遗传上已经被改变的病毒,例如通过向颗粒添加或***异源性核酸组合物。在一些实施方案中,重组病毒包含AAV。因此例如“重组AAV病毒”与“重组AAV载体”也表达相同的意思。重组AAV载体包含至少一种AAV衣壳(“外壳”),和包含在衣壳内的重组AAV(载体)基因组。

对于本发明的目的,“重组AAV基因组”或“重组AAV载体基因组”是指包含异源性序列的AAV基因组。通常,以异源性序列(例如表达盒)替换所有病毒基因的方式设计重组AAV基因组,仅保留完整的基因组必需的顺式元件,即反向末端重复(ITR)、DNA包装信号、和复制起点。可选地,基因组必需的顺式元件可以是那些如现有技术中描述的(Musatov等人,Acis-acting element that directs circular adeno-associated virus replicationand packaging,J Virol.December 2002;76(24):12792-802)。重组AAV基因组是重组AAV载体的一部分。

可以将本发明的表达盒通过本领域技术人员已知的方法直接引入待编辑的细胞中,例如将本发明的表达盒与质粒连接,或通过脂质体将本发明的表达盒直接转染细胞。可选地,可以将本发明的表达盒包装进载体中再转染细胞。

AAV载体的优势在于它们通常能够浓缩至每毫升≥1014病毒颗粒的滴度,这是具有转导所有病毒感染的细胞的潜力的载体水平。此外,基于AAV的载体具有已确立的安全性记录,不以显著的水平整合入靶标细胞基因组中,因此避免了有害基因的***激活的可能。

将本发明的表达盒掺入AAV病毒载体的技术和手段是本领域技术人员熟知的。如本发明所用,通过与包装质粒和辅助质粒共转染,将含有本发明的表达盒的质粒包装进入AAV病毒,以获得重组AAV病毒。

试剂盒

在另一方面,本发明提供了一种试剂盒,其包含本发明的表达盒和重组载体。

试剂盒一般包括表明试剂盒内容物的预期用途和/或使用方法的标签。术语标签包括在试剂盒上或与试剂盒一起提供的或以其他方式随试剂盒提供的任何书面的或记录的材料。

基因编辑的方法

在另一方面,本发明提供了一种基因编辑的方法,包括将本发明的表达盒或本发明的重组载体递送至对象的细胞的步骤。

使用标准的转染技术将重组载体引入细胞中。将分子(如质粒或病毒)引入细胞中还可以使用本领域技术人员已知的其他技术完成,例如磷酸钙转染或电穿孔。

如本文所用,术语“对象”是指人和非人动物。本公开的术语“非人动物”包括所有的脊椎动物,例如哺乳动物和非哺乳动物,比如非人灵长类、羊、狗、猫、马、牛、鼠、鸡、两栖动物、爬行动物等。

如本文所用,术语“引入”或“递送”指将用于重组蛋白或核苷酸表达的本发明的质粒或载体递送至细胞或者递送至对象的细胞和/或组织和/或器官。这样的引入或递送可以在体内、体外或离体进行。可以通过以下方式将用于重组蛋白或多肽表达的质粒引入细胞:转染,这通常表示通过化学方法将异源DNA***细胞(例如,磷酸钙转染、聚乙烯亚胺(PEI)或脂质体转染);物理方法(电穿孔或显微注射);感染,这通常指通过感染性物质,即病毒引入;或者转导,这在微生物学中指用病毒稳定感染细胞,或者通过病毒性物质(例如,噬菌体)将遗传物质从一种微生物转移至另一种微生物。用于重组多肽、蛋白或寡核苷酸表达的本发明的载体可以通过物理方式递送(例如,磷酸钙转染、电穿孔、显微注射或脂质体转染),或者通过与药学可接受的载体(carrier)一起制备本发明的载体用于体外、离体或体内递送至细胞、组织、器官或对象。

实施例

在此描述的实施例是用于说明的目的,并不意在限制本发明的范围,本领域技术人员可以根据本发明的精神和教导对具体步骤进行修改。除非另有规定或从内容明显看出,否则所记载的与一些实施方案有关的任何特征可以与任何其他实施方案来结合使用。

实施例1构建pX601(EF1α-tRNA)载体

1.1构建pX601(tRNA)载体

本发明使用Gln tRNA编码序列(SEQ ID NO:7)作为启动子-sgRNA单元的启动子,所述编码序列由上海生工公司合成tRNA-SP质粒,将其作为模板(10ng/体系),以引物:

PA-tRNA-F:

5′-AGGCATGCTGGGGAGGTACCGGTTCCATGGTGTAATGGTT-3′和

tRNA(SpCas)(VB)-R:

5′-ACAGGTCTTCTCGAAGACCCAGGTTCCACCGAGATTTGAA-3′

进行PCR扩增;

同时,以pX601质粒(购自Addgene,质粒编号61591)为模板(10ng/体系),以引物:

tRNA(SpCas)-F:

5′-CTGGGTCTTCGAGAAGACCT-3′和

Scaf-ITR-R:

5′-CTAGGGGTTCCTGCGGCCGCAAAAAAATCTCGCCAACAAGTTG-3′

分别用Q5 DNA聚合酶进行PCR扩增,扩增结束后,各加入Dpn I 1μL,37℃孵育30min消化质粒模板。孵育结束后,1%琼脂糖凝胶120V电泳25min,并胶回收所得目的条带,获得tRNA扩增片段和SaCas9sgRNA支架扩增片段。

以所得tRNA扩增片段和SaCas9sgRNA支架扩增片段各1μL为模板(各10ng),以引物:

PA-tRNA-F:

5′-AGGCATGCTGGGGAGGTACCGGTTCCATGGTGTAATGGTT-3′和

Scaf-ITR-R:

5′-CTAGGGGTTCCTGCGGCCGCAAAAAAATCTCGCCAACAAGTTG-3′

用Q5高保真DNA聚合酶进行PCR扩增,各加入Dpn I 1μL,37℃孵育30min消化质粒模板。孵育结束后,1%琼脂糖凝胶120V电泳25min,并胶回收所得目的条带,获得tRNA-SaCas9 sgRNA支架扩增连接片段。

以Kpn I和Not I各1μL酶切pX601质粒(1μg),在PCR仪中,37℃孵育30min。结束后,1%琼脂糖凝胶120V电泳25min,并胶回收所得目的条带,获得pX601经Kpn I/Not I双酶切片段。

将tRNA-SaCas9 sgRNA支架片段和pX601经Kpn I/Not I双酶切片段通过

Figure BDA0001795344880000141

II One Step Cloning试剂盒(南京诺唯赞生物科技有限公司)按照生产商的说明书进行连接。37℃孵育30min后,立即冰中>5min,转化进入XL10-gold感受态细胞,37℃培养过夜后,挑取单菌落摇菌并送测序鉴定,鉴定正确的样品命名为pX601(tRNA)。

1.2构建pX601(EF1α-tRNA)载体

以pLentiCRISPR V2质粒(购自Addgene,质粒编号52961)(10ng/体系)为模板,以引物:

pX601(EF1α)-F:

5′-CCTGCGGCCTCTAGACTCGAGGTGGGCAGAGCGCACATCGC-3′和

EF1α-R:

5′-TGGGGCCATGGTGGCACCGGTCCTGTGTTCTGGCGGCAAAC-3′

进行PCR扩增EF1α启动子序列,扩增结束后,用Dpn I消化质粒模板,方法同1.1,获得EF1α扩增片段。

以Xho I/Age I酶切pX601(tRNA)质粒,获得pX601(tRNA)经Xho I/Age I双酶切片段。

将EF1α扩增片段和pX601(tRNA)经Xho I/Age I双酶切片段以

Figure BDA0001795344880000152

IIOne Step Cloning试剂盒按照生产商的说明书进行连接。37℃孵育30min后,立即冰中>5min,转化进入XL10-gold感受态细胞,37℃培养过夜后,挑取单菌落摇菌并送测序鉴定,鉴定阳性样品命名为pX601(EF1α-tRNA),所得载体结构示意图如图1所示。

实施例2构建含有间隔序列的重组载体

2.1设计和构建含有间隔序列的支架-启动子重组载体

根据需要如表1所示设计引物:

表1

Figure BDA0001795344880000151

Figure BDA0001795344880000161

以pX601(EF1α-tRNA)质粒为模板(10ng/体系),以引物:scaf-F/scaf-R、scaf-F/scaf-10-R、scaf-tRNA-F/tRNA-R、scaf-10-tRNA-F/tRNA-R、scaf-20-tRNA-F/tRNA-R、scaf-40-tRNA-F/tRNA-R进行PCR扩增,获得支架和tRNA中间依次加入0bp、10bp、20bp和40bp间隔序列的支架-tRNA质粒。

同时,以pX601质粒为模板(10ng/体系),以引物:scaf-U6-F/U6-R、scaf-10-U6-F/U6-R、scaf-20-U6-F/U6-R、scaf-40-U6-F/U6-R,分别用Q5 DNA聚合酶进行PCR扩增,获得支架和U6启动子中间依次加入0bp、10bp、20bp和40bp间隔序列的支架-U6质粒。扩增结束后,用Dpn I消化质粒模板,方法同实施例1。

将以上所得胶回收产物1μL为模板(各10ng),以scaf-F/tRNA-R和scaf-F/U6-R为引物,用Q5高保真DNA聚合酶进行PCR扩增,方法同实施例1,PCR结束后,各加入rTaq 0.5μL,37℃孵育30min。

pMD19-T是本领域技术人员已知的一种T载体,其是一种高效克隆PCR产物(TA克隆)的专用质粒载体,为线性化载体,无需酶切可直接与具有A末端的PCR产物连接,属于非定向克隆。将所得胶回收产物按照生产商的说明书连接pMD19-T,4℃连接过夜。转化进入Top10感受态细胞,预先在LB(Amp+,100μg/mL)板中加入IPTG 10μL和X-gal 30μL,37℃培养过夜后,挑取白色菌落摇菌并送测序鉴定,鉴定正确的样品并获得命名为支架-U6(0bp间隔序列)、支架-U6(10bp间隔序列)、支架-U6(20bp间隔序列)、支架-U6(40bp间隔序列)和支架-tRNA(0bp间隔序列)、支架-tRNA(10bp间隔序列)、支架-tRNA(20bp间隔序列)、支架-tRNA(40bp间隔序列)的质粒,其结构示意图分别如图2a和图2b所示。

实施例3构建靶向多个靶标的sgRNA串联重组载体

本发明以3个小鼠内源基因的4个sgRNA位点,依次为:mMSTN-sgRNA1、mMSTN-sgRNA2、mTyr-sgRNA3、mRosa26-sgRNA2,以pX601为载体骨架将其串联,构建sgRNA串联重组载体。

以支架-U6或支架-tRNA为模板,设计引物进行PCR扩增,其中,sg1-F引物(5′-3′)包括20bp的U6或tRNA 3′端序列,加上第一个sgRNA的向导序列(约22bp),再加上18bp的支架5′端序列;sgN-R引物(5′-3′)包括20bp反向的支架5′端序列,加上反向的第N个sgRNA的向导序列(约22bp),再加上18bp反向的U6或tRNA 3′端序列;其余sgRNA引物序列除了带有特定的向导序列,正向引物还带有18bp的支架5′端序列,反向引物则带有18bp的U6或tRNA3′端序列。引物序列如表2所示:

表2

Figure BDA0001795344880000171

以支架-tRNA质粒(10ng/体系)为模板,以引物:tRNA-Sg1-F/tRNA-sg2-R、tRNA-sg2-F/tRNA-sg3-R、tRNA-sg3-F/tRNA-sg4-R进行PCR扩增;同时,以支架-U6质粒为模板(10ng/体系),以引物:U6-Sg1-F/U6-sg2-R、U6-sg2-F/U6-sg3-R、U6-sg3-F/U6-sg4-R进行PCR扩增,扩增结束后,用Dpn I消化质粒模板,方法同实施例1,获得含不同长度间隔序列的tRNA串联组扩增片段和含不同长度间隔序列的U6串联组扩增片段。

以Bbs I将pX601或pX601(EF1α-tRNA)进行酶切,得到pX601经Bbs I酶切片段和pX601(EF1α-tRNA)经Bbs I酶切片段。

将tRNA串联组扩增片段和U6串联组扩增片段(***的DNA片段)以及pX601经Bbs I酶切片段和pX601(EF1α-tRNA)经Bbs I酶切片段(线性化载体)按以下公式计算用量:

***的DNA片段用量(μL)=20ng/y ng/μL

线性化载体用量(μL)=(x bp×0.02)/y ng/μL

将胶回收产物用ClonExpress MultiS One Step Cloning试剂盒(购自南京诺唯赞,批号7E002G6)进行连接,参照该说明书操作,连接体系如下:

Figure BDA0001795344880000181

37℃孵育30min后,立即冰中>5min后进行转化进入XL10-gold感受态细胞,涂LB(Amp+,100μg/mL)板并37℃孵育过夜。

最后,以引物:sg1-TEST-F:5′-gAAACAATCATTACCATGCCTA-3′和sg4-TEST-R:5′-GCCCATCTTCTAGAAAGACTGC-3′,进行菌液PCR鉴定,将菌液PCR鉴定阳性样品送测序,测序正确样品进行中提质粒,命名为:t4、1t4、2t4、4t4、U4、1U4、2U4、4U4,其中t4、1t4、2t4、4t4分别为以EF1α和tRNA为启动子的、分别含有间隔序列长度为0、10、20、40bp的串联4个sgRNA的重组载体;而U4、1U4、2U4、4U4分别为以CMV和U6为启动子的、分别含有间隔序列长度为0、10、20、40bp的串联4个sgRNA的重组载体。以上各串联sgRNA重组载体的结构示意图如图3所示。

实施例4检测基因编辑效果

4.1细胞转染

转染前一天,NIH3T3细胞按每孔5.2×105个细胞/孔轻轻加入6孔板中。将100μLDMEM培养基、4μg质粒和8μL TurboFect(购自Thermo scientific,批号00448764)充分混匀后,室温静置15-20min,按所需量加入各孔中后,轻轻晃动6孔板混匀。放入细胞培养箱中,37℃,5%CO2条件下培养。转染8h后,吸弃废液,各加3mL 10%胎牛血清培养液继续培养。

转染72h后,用细胞/细菌/酵母基因组小量提取试剂盒(上海莱枫),按照生产商说明书提取基因组DNA。

4.2 T7核酸内切酶I法检测基因编辑效果

以200ng基因组DNA为模板,以如表3所示的各sgRNA位点检测引物,用Q5高保证DNA聚合酶扩增,1%琼脂糖凝胶电泳,并胶回收所得目的条带。

表3

Figure BDA0001795344880000191

将200ng所得PCR产物分别加入含有NEbuffer 2的管中,并设置未用质粒转染的NIH3T3细胞基因组为阴性对照(C-)。在PCR仪中进行加热变性、退火复性处理,结束后,每管加入0.4μL T7核酸内切酶I,37℃孵育1h。

各样品中加入2μL 6×Loadding Buffer,PAGE变性胶电泳110V,50min。电泳结束后,SYBR Green I染色1h,凝胶成像系统拍照(图4a-d)。

T7核酸内切酶I识别并切割带有切割位点的产物。箭头所指为含有突变的DNA。以ImageJ软件分析同泳道内各条带(a为PCR扩增片段,b、c为T7核酸内切酶I酶切出的目的条带)灰度值,通过公式(b+c)/(a+b+c)计算Indel比例。

从图4可知,以tRNA启动子代替U6启动子能够成功地靶向靶标基因并进行切割。此外,在tRNA-sgRNA单元之间加入间隔序列能够提高基因编辑的效率,并且加入20bp的间隔序列和加入40bp的间隔序列比不加入间隔序列或加入10bp的间隔序列的基因编辑效率高。

实施例5 AAV病毒介导的基因编辑

5.1 AAV病毒包装

1、细胞转染

转染前一天,AAV-293细胞按每皿4×106个细胞/孔轻轻加入100mm平皿中,细胞密度长至70-90%即可进行转染,转染体系如下:

Figure BDA0001795344880000201

转染后6h更换含新鲜的10%胎牛血清培养液。

2、细胞收集

转染后72h,收集细胞液,并将含AAV颗粒的细胞用细胞刮刀轻轻刮下,收集于15mL离心管中,150×g离心3min收集细胞,去除上清,用PBS洗一次,最后再用300μL PBS重悬细胞。

3、细胞破碎

准备37℃恒温水浴锅和液氮,将装有细胞的离心管在液氮及37℃水浴反复冻融三次。4℃,2000×g离心5min,收集含AAV病毒颗粒的上清。4、核酸酶处理

每1mL病毒粗提物中加入0.1μL Benonase酶,37℃水浴1h,除去病毒液中的RNA、细胞基因组及残留的质粒DNA。4℃,600×g离心10min,取上清。

5、柱纯化

用腺相关病毒纯化试剂盒(购自Biomiga,批号1369011804250101)对AAV病毒粗提物进行纯化,具体操作步骤如下:

a.将首次收集的细胞液和2所得液体经0.45μm滤器过滤;

b.滤液移入超滤管中,4℃,3000rpm离心20min,直至剩余约300μL病毒液;

c.将病毒液移入1.5mL EP管中,加100μL Buffer S到超滤管中洗一次,吸出并与病毒液混匀;

d.准备纯化柱:上下颠倒以混匀纯化柱中填料,放入50mL离心管中,4℃,1000rpm离心2min。撕掉底部并拧松顶帽,让Buffer流出。液体完全流出后,再加入4mL Buffer S,在重力作用下使其流出。

e.将c所得病毒液移入准备好的纯化柱中

f.加入4mL Buffer S,在重力作用下使其流出,收集流穿液。

6、将柱纯化得到的流穿液,加入到超滤管中,1400×g离心30min,得到约200μL浓缩病毒液。分装后,于-80℃保存。

7、病毒滴度测定(qPCR法)

a.引物设计

设计引物:

正向引物:5′-CGGCCTCAGTGAGCGA-3′和

反向引物:5′-AGGAACCCCTAGTGATG-3′,由上海生工公司合成。

b.AAV病毒样品预处理

以DNase I及蛋白酶K处理AAV病毒,体系如下:

Figure BDA0001795344880000211

37℃孵育1h后,于100℃孵育10min。各加入2μL蛋白酶K,55℃孵育1h后,然后,于100℃孵育10min。

c.稀释标准品质粒

首先用微量紫外分光光度计测定标准品浓度,参考其原始浓度,用ddH2O将标准品稀释成5个梯度:105、106、107、108、109

d.qPCR检测

以qPCR方法测定标准质粒以及预处理的AAV病毒样品的拷贝数。

e.滴度计算

以标准品Ct值为纵坐标Y,拷贝数为横坐标X,做标准曲线,得到标准曲线的函数公式及R平方值。

将AAV样品Ct均值,代入标准曲线所得公式,计算所加入AAV模板拷贝数X,再换算成滴度。换算公式为:AAV病毒滴度=10x×40000(稀释倍数)vg/mL。

计算得到t4、1t4、2t4和4t4所包装的病毒滴度分别为1.2×1012vg/mL、1.0×1012vg/mL、1.2×1012vg/mL和1.3×1012vg/mL。

5.2 AAV-DJ病毒介导的基因编辑检测

1、AAV病毒转导细胞

转染前一天,NIH3T3细胞按每孔2.5×105个细胞/孔轻轻加入12孔板中。以MOI=105,按公式:

病毒量=(转染时细胞数×MOI)/病毒滴度,计算需要加入的病毒体积数。

根据计算好的各组病毒量,加入到0.5mL 10%胎牛血清培养液中,分别加入到各孔NIH3T3细胞,每组三个重复。4h后再加入0.5mL 10%胎牛血清培养液,24h换新鲜培液。

2、AAV-DJ病毒介导的基因编辑检测

AAV-DJ病毒是常见的AAV血清型,AAV-DJ血清型对视网膜、肝脏、肺、肾脏具有亲噬性,其含有衍生自8个血清型的杂交衣壳。

用t4、1t4、2t4和4t4所包装的病毒病毒转导细胞,7天后,以T7核酸内切酶I法进行基因编辑效果检测,结果如图5所示。显示出与tRNA-sgRNA单元之间没有间隔序列的载体相比,在串联的tRNA-sgRNA单元之间加入间隔序列能够显著提高AAV-DJ病毒介导的基因编辑效率。

序列表

<110> 河南农业大学

<120> 基于AAV病毒的基因编辑表达盒

<130> TC2268

<160> 11

<170> PatentIn version 3.5

<210> 1

<211> 4849

<212> DNA

<213> Artificial Sequence

<220>

<223> 1t4

<220>

<221> misc_feature

<222> (4037)..(4058)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4224)..(4244)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4410)..(4432)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4598)..(4619)

<223> n is a, c, g, or t

<400> 1

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcctcta gactcgaggt gggcagagcg cacatcgccc acagtccccg 180

agaagttggg gggaggggtc ggcaattgat ccggtgccta gagaaggtgg cgcggggtaa 240

actgggaaag tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt 300

atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac 360

aggaccggtg ccaccatggc cccaaagaag aagcggaagg tcggtatcca cggagtccca 420

gcagccaagc ggaactacat cctgggcctg gacatcggca tcaccagcgt gggctacggc 480

atcatcgact acgagacacg ggacgtgatc gatgccggcg tgcggctgtt caaagaggcc 540

aacgtggaaa acaacgaggg caggcggagc aagagaggcg ccagaaggct gaagcggcgg 600

aggcggcata gaatccagag agtgaagaag ctgctgttcg actacaacct gctgaccgac 660

cacagcgagc tgagcggcat caacccctac gaggccagag tgaagggcct gagccagaag 720

ctgagcgagg aagagttctc tgccgccctg ctgcacctgg ccaagagaag aggcgtgcac 780

aacgtgaacg aggtggaaga ggacaccggc aacgagctgt ccaccaaaga gcagatcagc 840

cggaacagca aggccctgga agagaaatac gtggccgaac tgcagctgga acggctgaag 900

aaagacggcg aagtgcgggg cagcatcaac agattcaaga ccagcgacta cgtgaaagaa 960

gccaaacagc tgctgaaggt gcagaaggcc taccaccagc tggaccagag cttcatcgac 1020

acctacatcg acctgctgga aacccggcgg acctactatg agggacctgg cgagggcagc 1080

cccttcggct ggaaggacat caaagaatgg tacgagatgc tgatgggcca ctgcacctac 1140

ttccccgagg aactgcggag cgtgaagtac gcctacaacg ccgacctgta caacgccctg 1200

aacgacctga acaatctcgt gatcaccagg gacgagaacg agaagctgga atattacgag 1260

aagttccaga tcatcgagaa cgtgttcaag cagaagaaga agcccaccct gaagcagatc 1320

gccaaagaaa tcctcgtgaa cgaagaggat attaagggct acagagtgac cagcaccggc 1380

aagcccgagt tcaccaacct gaaggtgtac cacgacatca aggacattac cgcccggaaa 1440

gagattattg agaacgccga gctgctggat cagattgcca agatcctgac catctaccag 1500

agcagcgagg acatccagga agaactgacc aatctgaact ccgagctgac ccaggaagag 1560

atcgagcaga tctctaatct gaagggctat accggcaccc acaacctgag cctgaaggcc 1620

atcaacctga tcctggacga gctgtggcac accaacgaca accagatcgc tatcttcaac 1680

cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc agaaagagat ccccaccacc 1740

ctggtggacg acttcatcct gagccccgtc gtgaagagaa gcttcatcca gagcatcaaa 1800

gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg acatcattat cgagctggcc 1860

cgcgagaaga actccaagga cgcccagaaa atgatcaacg agatgcagaa gcggaaccgg 1920

cagaccaacg agcggatcga ggaaatcatc cggaccaccg gcaaagagaa cgccaagtac 1980

ctgatcgaga agatcaagct gcacgacatg caggaaggca agtgcctgta cagcctggaa 2040

gccatccctc tggaagatct gctgaacaac cccttcaact atgaggtgga ccacatcatc 2100

cccagaagcg tgtccttcga caacagcttc aacaacaagg tgctcgtgaa gcaggaagaa 2160

aacagcaaga agggcaaccg gaccccattc cagtacctga gcagcagcga cagcaagatc 2220

agctacgaaa ccttcaagaa gcacatcctg aatctggcca agggcaaggg cagaatcagc 2280

aagaccaaga aagagtatct gctggaagaa cgggacatca acaggttctc cgtgcagaaa 2340

gacttcatca accggaacct ggtggatacc agatacgcca ccagaggcct gatgaacctg 2400

ctgcggagct acttcagagt gaacaacctg gacgtgaaag tgaagtccat caatggcggc 2460

ttcaccagct ttctgcggcg gaagtggaag tttaagaaag agcggaacaa ggggtacaag 2520

caccacgccg aggacgccct gatcattgcc aacgccgatt tcatcttcaa agagtggaag 2580

aaactggaca aggccaaaaa agtgatggaa aaccagatgt tcgaggaaaa gcaggccgag 2640

agcatgcccg agatcgaaac cgagcaggag tacaaagaga tcttcatcac cccccaccag 2700

atcaagcaca ttaaggactt caaggactac aagtacagcc accgggtgga caagaagcct 2760

aatagagagc tgattaacga caccctgtac tccacccgga aggacgacaa gggcaacacc 2820

ctgatcgtga acaatctgaa cggcctgtac gacaaggaca atgacaagct gaaaaagctg 2880

atcaacaaga gccccgaaaa gctgctgatg taccaccacg acccccagac ctaccagaaa 2940

ctgaagctga ttatggaaca gtacggcgac gagaagaatc ccctgtacaa gtactacgag 3000

gaaaccggga actacctgac caagtactcc aaaaaggaca acggccccgt gatcaagaag 3060

attaagtatt acggcaacaa actgaacgcc catctggaca tcaccgacga ctaccccaac 3120

agcagaaaca aggtcgtgaa gctgtccctg aagccctaca gattcgacgt gtacctggac 3180

aatggcgtgt acaagttcgt gaccgtgaag aatctggatg tgatcaaaaa agaaaactac 3240

tacgaagtga atagcaagtg ctatgaggaa gctaagaagc tgaagaagat cagcaaccag 3300

gccgagttta tcgcctcctt ctacaacaac gatctgatca agatcaacgg cgagctgtat 3360

agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg aagtgaacat gatcgacatc 3420

acctaccgcg agtacctgga aaacatgaac gacaagaggc cccccaggat cattaagaca 3480

atcgcctcca agacccagag cattaagaag tacagcacag acattctggg caacctgtat 3540

gaagtgaaat ctaagaagca ccctcagatc atcaaaaagg gcaaaaggcc ggcggccacg 3600

aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc catacgatgt tccagattac 3660

gcttacccat acgatgttcc agattacgct tacccatacg atgttccaga ttacgcttaa 3720

gaattcctag agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg 3780

tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 3840

aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 3900

gggtggggca ggacagcaag ggggaggatt gggaagagaa tagcaggcat gctggggagg 3960

taccggttcc atggtgtaat ggttagcact ctggactctg aatccagcga tccgagttca 4020

aatctcggtg gaacctnnnn nnnnnnnnnn nnnnnnnngt tttagtactc tggaaacaga 4080

atctactaaa acaaggcaaa atgccgtgtt tatctcgtca acttgttggc gagatttttt 4140

tgcggccgca gggttccatg gtgtaatggt tagcactctg gactctgaat ccagcgatcc 4200

gagttcaaat ctcggtggaa cctnnnnnnn nnnnnnnnnn nnnngtttta gtactctgga 4260

aacagaatct actaaaacaa ggcaaaatgc cgtgtttatc tcgtcaactt gttggcgaga 4320

tttttttgcg gccgcagggt tccatggtgt aatggttagc actctggact ctgaatccag 4380

cgatccgagt tcaaatctcg gtggaacctn nnnnnnnnnn nnnnnnnnnn nngttttagt 4440

actctggaaa cagaatctac taaaacaagg caaaatgccg tgtttatctc gtcaacttgt 4500

tggcgagatt tttttgcggc cgcagggttc catggtgtaa tggttagcac tctggactct 4560

gaatccagcg atccgagttc aaatctcggt ggaacctnnn nnnnnnnnnn nnnnnnnnng 4620

ttttagtact ctggaaacag aatctactaa aacaaggcaa aatgccgtgt ttatctcgtc 4680

aacttgttgg cgagattttt gcggccgcag gaacccctag tgatggagtt ggccactccc 4740

tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 4800

tttgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcagg 4849

<210> 2

<211> 4879

<212> DNA

<213> Artificial Sequence

<220>

<223> 2t4

<220>

<221> misc_feature

<222> (4037)..(4058)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4234)..(4254)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4430)..(4452)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4628)..(4649)

<223> n is a, c, g, or t

<400> 2

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcctcta gactcgaggt gggcagagcg cacatcgccc acagtccccg 180

agaagttggg gggaggggtc ggcaattgat ccggtgccta gagaaggtgg cgcggggtaa 240

actgggaaag tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt 300

atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac 360

aggaccggtg ccaccatggc cccaaagaag aagcggaagg tcggtatcca cggagtccca 420

gcagccaagc ggaactacat cctgggcctg gacatcggca tcaccagcgt gggctacggc 480

atcatcgact acgagacacg ggacgtgatc gatgccggcg tgcggctgtt caaagaggcc 540

aacgtggaaa acaacgaggg caggcggagc aagagaggcg ccagaaggct gaagcggcgg 600

aggcggcata gaatccagag agtgaagaag ctgctgttcg actacaacct gctgaccgac 660

cacagcgagc tgagcggcat caacccctac gaggccagag tgaagggcct gagccagaag 720

ctgagcgagg aagagttctc tgccgccctg ctgcacctgg ccaagagaag aggcgtgcac 780

aacgtgaacg aggtggaaga ggacaccggc aacgagctgt ccaccaaaga gcagatcagc 840

cggaacagca aggccctgga agagaaatac gtggccgaac tgcagctgga acggctgaag 900

aaagacggcg aagtgcgggg cagcatcaac agattcaaga ccagcgacta cgtgaaagaa 960

gccaaacagc tgctgaaggt gcagaaggcc taccaccagc tggaccagag cttcatcgac 1020

acctacatcg acctgctgga aacccggcgg acctactatg agggacctgg cgagggcagc 1080

cccttcggct ggaaggacat caaagaatgg tacgagatgc tgatgggcca ctgcacctac 1140

ttccccgagg aactgcggag cgtgaagtac gcctacaacg ccgacctgta caacgccctg 1200

aacgacctga acaatctcgt gatcaccagg gacgagaacg agaagctgga atattacgag 1260

aagttccaga tcatcgagaa cgtgttcaag cagaagaaga agcccaccct gaagcagatc 1320

gccaaagaaa tcctcgtgaa cgaagaggat attaagggct acagagtgac cagcaccggc 1380

aagcccgagt tcaccaacct gaaggtgtac cacgacatca aggacattac cgcccggaaa 1440

gagattattg agaacgccga gctgctggat cagattgcca agatcctgac catctaccag 1500

agcagcgagg acatccagga agaactgacc aatctgaact ccgagctgac ccaggaagag 1560

atcgagcaga tctctaatct gaagggctat accggcaccc acaacctgag cctgaaggcc 1620

atcaacctga tcctggacga gctgtggcac accaacgaca accagatcgc tatcttcaac 1680

cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc agaaagagat ccccaccacc 1740

ctggtggacg acttcatcct gagccccgtc gtgaagagaa gcttcatcca gagcatcaaa 1800

gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg acatcattat cgagctggcc 1860

cgcgagaaga actccaagga cgcccagaaa atgatcaacg agatgcagaa gcggaaccgg 1920

cagaccaacg agcggatcga ggaaatcatc cggaccaccg gcaaagagaa cgccaagtac 1980

ctgatcgaga agatcaagct gcacgacatg caggaaggca agtgcctgta cagcctggaa 2040

gccatccctc tggaagatct gctgaacaac cccttcaact atgaggtgga ccacatcatc 2100

cccagaagcg tgtccttcga caacagcttc aacaacaagg tgctcgtgaa gcaggaagaa 2160

aacagcaaga agggcaaccg gaccccattc cagtacctga gcagcagcga cagcaagatc 2220

agctacgaaa ccttcaagaa gcacatcctg aatctggcca agggcaaggg cagaatcagc 2280

aagaccaaga aagagtatct gctggaagaa cgggacatca acaggttctc cgtgcagaaa 2340

gacttcatca accggaacct ggtggatacc agatacgcca ccagaggcct gatgaacctg 2400

ctgcggagct acttcagagt gaacaacctg gacgtgaaag tgaagtccat caatggcggc 2460

ttcaccagct ttctgcggcg gaagtggaag tttaagaaag agcggaacaa ggggtacaag 2520

caccacgccg aggacgccct gatcattgcc aacgccgatt tcatcttcaa agagtggaag 2580

aaactggaca aggccaaaaa agtgatggaa aaccagatgt tcgaggaaaa gcaggccgag 2640

agcatgcccg agatcgaaac cgagcaggag tacaaagaga tcttcatcac cccccaccag 2700

atcaagcaca ttaaggactt caaggactac aagtacagcc accgggtgga caagaagcct 2760

aatagagagc tgattaacga caccctgtac tccacccgga aggacgacaa gggcaacacc 2820

ctgatcgtga acaatctgaa cggcctgtac gacaaggaca atgacaagct gaaaaagctg 2880

atcaacaaga gccccgaaaa gctgctgatg taccaccacg acccccagac ctaccagaaa 2940

ctgaagctga ttatggaaca gtacggcgac gagaagaatc ccctgtacaa gtactacgag 3000

gaaaccggga actacctgac caagtactcc aaaaaggaca acggccccgt gatcaagaag 3060

attaagtatt acggcaacaa actgaacgcc catctggaca tcaccgacga ctaccccaac 3120

agcagaaaca aggtcgtgaa gctgtccctg aagccctaca gattcgacgt gtacctggac 3180

aatggcgtgt acaagttcgt gaccgtgaag aatctggatg tgatcaaaaa agaaaactac 3240

tacgaagtga atagcaagtg ctatgaggaa gctaagaagc tgaagaagat cagcaaccag 3300

gccgagttta tcgcctcctt ctacaacaac gatctgatca agatcaacgg cgagctgtat 3360

agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg aagtgaacat gatcgacatc 3420

acctaccgcg agtacctgga aaacatgaac gacaagaggc cccccaggat cattaagaca 3480

atcgcctcca agacccagag cattaagaag tacagcacag acattctggg caacctgtat 3540

gaagtgaaat ctaagaagca ccctcagatc atcaaaaagg gcaaaaggcc ggcggccacg 3600

aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc catacgatgt tccagattac 3660

gcttacccat acgatgttcc agattacgct tacccatacg atgttccaga ttacgcttaa 3720

gaattcctag agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg 3780

tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 3840

aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 3900

gggtggggca ggacagcaag ggggaggatt gggaagagaa tagcaggcat gctggggagg 3960

taccggttcc atggtgtaat ggttagcact ctggactctg aatccagcga tccgagttca 4020

aatctcggtg gaacctnnnn nnnnnnnnnn nnnnnnnngt tttagtactc tggaaacaga 4080

atctactaaa acaaggcaaa atgccgtgtt tatctcgtca acttgttggc gagatttttt 4140

tgcggccgca ggggaggtac cggttccatg gtgtaatggt tagcactctg gactctgaat 4200

ccagcgatcc gagttcaaat ctcggtggaa cctnnnnnnn nnnnnnnnnn nnnngtttta 4260

gtactctgga aacagaatct actaaaacaa ggcaaaatgc cgtgtttatc tcgtcaactt 4320

gttggcgaga tttttttgcg gccgcagggg aggtaccggt tccatggtgt aatggttagc 4380

actctggact ctgaatccag cgatccgagt tcaaatctcg gtggaacctn nnnnnnnnnn 4440

nnnnnnnnnn nngttttagt actctggaaa cagaatctac taaaacaagg caaaatgccg 4500

tgtttatctc gtcaacttgt tggcgagatt tttttgcggc cgcaggggag gtaccggttc 4560

catggtgtaa tggttagcac tctggactct gaatccagcg atccgagttc aaatctcggt 4620

ggaacctnnn nnnnnnnnnn nnnnnnnnng ttttagtact ctggaaacag aatctactaa 4680

aacaaggcaa aatgccgtgt ttatctcgtc aacttgttgg cgagattttt gcggccgcag 4740

gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 4800

gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 4860

gcgcgcagct gcctgcagg 4879

<210> 3

<211> 4939

<212> DNA

<213> Artificial Sequence

<220>

<223> 4t4

<220>

<221> misc_feature

<222> (4037)..(4058)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4254)..(4274)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4470)..(4492)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4688)..(4709)

<223> n is a, c, g, or t

<400> 3

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcctcta gactcgaggt gggcagagcg cacatcgccc acagtccccg 180

agaagttggg gggaggggtc ggcaattgat ccggtgccta gagaaggtgg cgcggggtaa 240

actgggaaag tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt 300

atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac 360

aggaccggtg ccaccatggc cccaaagaag aagcggaagg tcggtatcca cggagtccca 420

gcagccaagc ggaactacat cctgggcctg gacatcggca tcaccagcgt gggctacggc 480

atcatcgact acgagacacg ggacgtgatc gatgccggcg tgcggctgtt caaagaggcc 540

aacgtggaaa acaacgaggg caggcggagc aagagaggcg ccagaaggct gaagcggcgg 600

aggcggcata gaatccagag agtgaagaag ctgctgttcg actacaacct gctgaccgac 660

cacagcgagc tgagcggcat caacccctac gaggccagag tgaagggcct gagccagaag 720

ctgagcgagg aagagttctc tgccgccctg ctgcacctgg ccaagagaag aggcgtgcac 780

aacgtgaacg aggtggaaga ggacaccggc aacgagctgt ccaccaaaga gcagatcagc 840

cggaacagca aggccctgga agagaaatac gtggccgaac tgcagctgga acggctgaag 900

aaagacggcg aagtgcgggg cagcatcaac agattcaaga ccagcgacta cgtgaaagaa 960

gccaaacagc tgctgaaggt gcagaaggcc taccaccagc tggaccagag cttcatcgac 1020

acctacatcg acctgctgga aacccggcgg acctactatg agggacctgg cgagggcagc 1080

cccttcggct ggaaggacat caaagaatgg tacgagatgc tgatgggcca ctgcacctac 1140

ttccccgagg aactgcggag cgtgaagtac gcctacaacg ccgacctgta caacgccctg 1200

aacgacctga acaatctcgt gatcaccagg gacgagaacg agaagctgga atattacgag 1260

aagttccaga tcatcgagaa cgtgttcaag cagaagaaga agcccaccct gaagcagatc 1320

gccaaagaaa tcctcgtgaa cgaagaggat attaagggct acagagtgac cagcaccggc 1380

aagcccgagt tcaccaacct gaaggtgtac cacgacatca aggacattac cgcccggaaa 1440

gagattattg agaacgccga gctgctggat cagattgcca agatcctgac catctaccag 1500

agcagcgagg acatccagga agaactgacc aatctgaact ccgagctgac ccaggaagag 1560

atcgagcaga tctctaatct gaagggctat accggcaccc acaacctgag cctgaaggcc 1620

atcaacctga tcctggacga gctgtggcac accaacgaca accagatcgc tatcttcaac 1680

cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc agaaagagat ccccaccacc 1740

ctggtggacg acttcatcct gagccccgtc gtgaagagaa gcttcatcca gagcatcaaa 1800

gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg acatcattat cgagctggcc 1860

cgcgagaaga actccaagga cgcccagaaa atgatcaacg agatgcagaa gcggaaccgg 1920

cagaccaacg agcggatcga ggaaatcatc cggaccaccg gcaaagagaa cgccaagtac 1980

ctgatcgaga agatcaagct gcacgacatg caggaaggca agtgcctgta cagcctggaa 2040

gccatccctc tggaagatct gctgaacaac cccttcaact atgaggtgga ccacatcatc 2100

cccagaagcg tgtccttcga caacagcttc aacaacaagg tgctcgtgaa gcaggaagaa 2160

aacagcaaga agggcaaccg gaccccattc cagtacctga gcagcagcga cagcaagatc 2220

agctacgaaa ccttcaagaa gcacatcctg aatctggcca agggcaaggg cagaatcagc 2280

aagaccaaga aagagtatct gctggaagaa cgggacatca acaggttctc cgtgcagaaa 2340

gacttcatca accggaacct ggtggatacc agatacgcca ccagaggcct gatgaacctg 2400

ctgcggagct acttcagagt gaacaacctg gacgtgaaag tgaagtccat caatggcggc 2460

ttcaccagct ttctgcggcg gaagtggaag tttaagaaag agcggaacaa ggggtacaag 2520

caccacgccg aggacgccct gatcattgcc aacgccgatt tcatcttcaa agagtggaag 2580

aaactggaca aggccaaaaa agtgatggaa aaccagatgt tcgaggaaaa gcaggccgag 2640

agcatgcccg agatcgaaac cgagcaggag tacaaagaga tcttcatcac cccccaccag 2700

atcaagcaca ttaaggactt caaggactac aagtacagcc accgggtgga caagaagcct 2760

aatagagagc tgattaacga caccctgtac tccacccgga aggacgacaa gggcaacacc 2820

ctgatcgtga acaatctgaa cggcctgtac gacaaggaca atgacaagct gaaaaagctg 2880

atcaacaaga gccccgaaaa gctgctgatg taccaccacg acccccagac ctaccagaaa 2940

ctgaagctga ttatggaaca gtacggcgac gagaagaatc ccctgtacaa gtactacgag 3000

gaaaccggga actacctgac caagtactcc aaaaaggaca acggccccgt gatcaagaag 3060

attaagtatt acggcaacaa actgaacgcc catctggaca tcaccgacga ctaccccaac 3120

agcagaaaca aggtcgtgaa gctgtccctg aagccctaca gattcgacgt gtacctggac 3180

aatggcgtgt acaagttcgt gaccgtgaag aatctggatg tgatcaaaaa agaaaactac 3240

tacgaagtga atagcaagtg ctatgaggaa gctaagaagc tgaagaagat cagcaaccag 3300

gccgagttta tcgcctcctt ctacaacaac gatctgatca agatcaacgg cgagctgtat 3360

agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg aagtgaacat gatcgacatc 3420

acctaccgcg agtacctgga aaacatgaac gacaagaggc cccccaggat cattaagaca 3480

atcgcctcca agacccagag cattaagaag tacagcacag acattctggg caacctgtat 3540

gaagtgaaat ctaagaagca ccctcagatc atcaaaaagg gcaaaaggcc ggcggccacg 3600

aaaaaggccg gccaggcaaa aaagaaaaag ggatcctacc catacgatgt tccagattac 3660

gcttacccat acgatgttcc agattacgct tacccatacg atgttccaga ttacgcttaa 3720

gaattcctag agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg 3780

tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 3840

aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 3900

gggtggggca ggacagcaag ggggaggatt gggaagagaa tagcaggcat gctggggagg 3960

taccggttcc atggtgtaat ggttagcact ctggactctg aatccagcga tccgagttca 4020

aatctcggtg gaacctnnnn nnnnnnnnnn nnnnnnnngt tttagtactc tggaaacaga 4080

atctactaaa acaaggcaaa atgccgtgtt tatctcgtca acttgttggc gagatttttt 4140

tgcggccgca gagagaatag caggcatgct ggggaggtac cggttccatg gtgtaatggt 4200

tagcactctg gactctgaat ccagcgatcc gagttcaaat ctcggtggaa cctnnnnnnn 4260

nnnnnnnnnn nnnngtttta gtactctgga aacagaatct actaaaacaa ggcaaaatgc 4320

cgtgtttatc tcgtcaactt gttggcgaga tttttttgcg gccgcagaga gaatagcagg 4380

catgctgggg aggtaccggt tccatggtgt aatggttagc actctggact ctgaatccag 4440

cgatccgagt tcaaatctcg gtggaacctn nnnnnnnnnn nnnnnnnnnn nngttttagt 4500

actctggaaa cagaatctac taaaacaagg caaaatgccg tgtttatctc gtcaacttgt 4560

tggcgagatt tttttgcggc cgcagagaga atagcaggca tgctggggag gtaccggttc 4620

catggtgtaa tggttagcac tctggactct gaatccagcg atccgagttc aaatctcggt 4680

ggaacctnnn nnnnnnnnnn nnnnnnnnng ttttagtact ctggaaacag aatctactaa 4740

aacaaggcaa aatgccgtgt ttatctcgtc aacttgttgg cgagattttt gcggccgcag 4800

gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 4860

gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 4920

gcgcgcagct gcctgcagg 4939

<210> 4

<211> 5943

<212> DNA

<213> Artificial Sequence

<220>

<223> 1u4

<220>

<221> misc_feature

<222> (4600)..(4621)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4964)..(4984)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (5327)..(5349)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (5692)..(5713)

<223> n is a, c, g, or t

<400> 4

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcctcta gactcgaggc gttgacattg attattgact agttattaat 180

agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 240

ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 300

tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 360

atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 420

ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 480

gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atggtgatgc 540

ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga tttccaagtc 600

tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg gactttccaa 660

aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta cggtgggagg 720

tctatataag cagagctctc tggctaacta ccggtgccac catggcccca aagaagaagc 780

ggaaggtcgg tatccacgga gtcccagcag ccaagcggaa ctacatcctg ggcctggaca 840

tcggcatcac cagcgtgggc tacggcatca tcgactacga gacacgggac gtgatcgatg 900

ccggcgtgcg gctgttcaaa gaggccaacg tggaaaacaa cgagggcagg cggagcaaga 960

gaggcgccag aaggctgaag cggcggaggc ggcatagaat ccagagagtg aagaagctgc 1020

tgttcgacta caacctgctg accgaccaca gcgagctgag cggcatcaac ccctacgagg 1080

ccagagtgaa gggcctgagc cagaagctga gcgaggaaga gttctctgcc gccctgctgc 1140

acctggccaa gagaagaggc gtgcacaacg tgaacgaggt ggaagaggac accggcaacg 1200

agctgtccac caaagagcag atcagccgga acagcaaggc cctggaagag aaatacgtgg 1260

ccgaactgca gctggaacgg ctgaagaaag acggcgaagt gcggggcagc atcaacagat 1320

tcaagaccag cgactacgtg aaagaagcca aacagctgct gaaggtgcag aaggcctacc 1380

accagctgga ccagagcttc atcgacacct acatcgacct gctggaaacc cggcggacct 1440

actatgaggg acctggcgag ggcagcccct tcggctggaa ggacatcaaa gaatggtacg 1500

agatgctgat gggccactgc acctacttcc ccgaggaact gcggagcgtg aagtacgcct 1560

acaacgccga cctgtacaac gccctgaacg acctgaacaa tctcgtgatc accagggacg 1620

agaacgagaa gctggaatat tacgagaagt tccagatcat cgagaacgtg ttcaagcaga 1680

agaagaagcc caccctgaag cagatcgcca aagaaatcct cgtgaacgaa gaggatatta 1740

agggctacag agtgaccagc accggcaagc ccgagttcac caacctgaag gtgtaccacg 1800

acatcaagga cattaccgcc cggaaagaga ttattgagaa cgccgagctg ctggatcaga 1860

ttgccaagat cctgaccatc taccagagca gcgaggacat ccaggaagaa ctgaccaatc 1920

tgaactccga gctgacccag gaagagatcg agcagatctc taatctgaag ggctataccg 1980

gcacccacaa cctgagcctg aaggccatca acctgatcct ggacgagctg tggcacacca 2040

acgacaacca gatcgctatc ttcaaccggc tgaagctggt gcccaagaag gtggacctgt 2100

cccagcagaa agagatcccc accaccctgg tggacgactt catcctgagc cccgtcgtga 2160

agagaagctt catccagagc atcaaagtga tcaacgccat catcaagaag tacggcctgc 2220

ccaacgacat cattatcgag ctggcccgcg agaagaactc caaggacgcc cagaaaatga 2280

tcaacgagat gcagaagcgg aaccggcaga ccaacgagcg gatcgaggaa atcatccgga 2340

ccaccggcaa agagaacgcc aagtacctga tcgagaagat caagctgcac gacatgcagg 2400

aaggcaagtg cctgtacagc ctggaagcca tccctctgga agatctgctg aacaacccct 2460

tcaactatga ggtggaccac atcatcccca gaagcgtgtc cttcgacaac agcttcaaca 2520

acaaggtgct cgtgaagcag gaagaaaaca gcaagaaggg caaccggacc ccattccagt 2580

acctgagcag cagcgacagc aagatcagct acgaaacctt caagaagcac atcctgaatc 2640

tggccaaggg caagggcaga atcagcaaga ccaagaaaga gtatctgctg gaagaacggg 2700

acatcaacag gttctccgtg cagaaagact tcatcaaccg gaacctggtg gataccagat 2760

acgccaccag aggcctgatg aacctgctgc ggagctactt cagagtgaac aacctggacg 2820

tgaaagtgaa gtccatcaat ggcggcttca ccagctttct gcggcggaag tggaagttta 2880

agaaagagcg gaacaagggg tacaagcacc acgccgagga cgccctgatc attgccaacg 2940

ccgatttcat cttcaaagag tggaagaaac tggacaaggc caaaaaagtg atggaaaacc 3000

agatgttcga ggaaaagcag gccgagagca tgcccgagat cgaaaccgag caggagtaca 3060

aagagatctt catcaccccc caccagatca agcacattaa ggacttcaag gactacaagt 3120

acagccaccg ggtggacaag aagcctaata gagagctgat taacgacacc ctgtactcca 3180

cccggaagga cgacaagggc aacaccctga tcgtgaacaa tctgaacggc ctgtacgaca 3240

aggacaatga caagctgaaa aagctgatca acaagagccc cgaaaagctg ctgatgtacc 3300

accacgaccc ccagacctac cagaaactga agctgattat ggaacagtac ggcgacgaga 3360

agaatcccct gtacaagtac tacgaggaaa ccgggaacta cctgaccaag tactccaaaa 3420

aggacaacgg ccccgtgatc aagaagatta agtattacgg caacaaactg aacgcccatc 3480

tggacatcac cgacgactac cccaacagca gaaacaaggt cgtgaagctg tccctgaagc 3540

cctacagatt cgacgtgtac ctggacaatg gcgtgtacaa gttcgtgacc gtgaagaatc 3600

tggatgtgat caaaaaagaa aactactacg aagtgaatag caagtgctat gaggaagcta 3660

agaagctgaa gaagatcagc aaccaggccg agtttatcgc ctccttctac aacaacgatc 3720

tgatcaagat caacggcgag ctgtatagag tgatcggcgt gaacaacgac ctgctgaacc 3780

ggatcgaagt gaacatgatc gacatcacct accgcgagta cctggaaaac atgaacgaca 3840

agaggccccc caggatcatt aagacaatcg cctccaagac ccagagcatt aagaagtaca 3900

gcacagacat tctgggcaac ctgtatgaag tgaaatctaa gaagcaccct cagatcatca 3960

aaaagggcaa aaggccggcg gccacgaaaa aggccggcca ggcaaaaaag aaaaagggat 4020

cctacccata cgatgttcca gattacgctt acccatacga tgttccagat tacgcttacc 4080

catacgatgt tccagattac gcttaagaat tcctagagct cgctgatcag cctcgactgt 4140

gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 4200

aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 4260

taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 4320

agagaatagc aggcatgctg gggaggtacc gagggcctat ttcccatgat tccttcatat 4380

ttgcatatac gatacaaggc tgttagagag ataattggaa ttaatttgac tgtaaacaca 4440

aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt 4500

ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat 4560

ttcttggctt tatatatctt gtggaaagga cgaaacaccn nnnnnnnnnn nnnnnnnnnn 4620

ngttttagta ctctggaaac agaatctact aaaacaaggc aaaatgccgt gtttatctcg 4680

tcaacttgtt ggcgagattt ttttgcggcc gcaggagggc ctatttccca tgattccttc 4740

atatttgcat atacgataca aggctgttag agagataatt ggaattaatt tgactgtaaa 4800

cacaaagata ttagtacaaa atacgtgacg tagaaagtaa taatttcttg ggtagtttgc 4860

agttttaaaa ttatgtttta aaatggacta tcatatgctt accgtaactt gaaagtattt 4920

cgatttcttg gctttatata tcttgtggaa aggacgaaac accnnnnnnn nnnnnnnnnn 4980

nnnngtttta gtactctgga aacagaatct actaaaacaa ggcaaaatgc cgtgtttatc 5040

tcgtcaactt gttggcgaga tttttttgcg gccgcaggag ggcctatttc ccatgattcc 5100

ttcatatttg catatacgat acaaggctgt tagagagata attggaatta atttgactgt 5160

aaacacaaag atattagtac aaaatacgtg acgtagaaag taataatttc ttgggtagtt 5220

tgcagtttta aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta 5280

tttcgatttc ttggctttat atatcttgtg gaaaggacga aacaccnnnn nnnnnnnnnn 5340

nnnnnnnnng ttttagtact ctggaaacag aatctactaa aacaaggcaa aatgccgtgt 5400

ttatctcgtc aacttgttgg cgagattttt ttgcggccgc aggagggcct atttcccatg 5460

attccttcat atttgcatat acgatacaag gctgttagag agataattgg aattaatttg 5520

actgtaaaca caaagatatt agtacaaaat acgtgacgta gaaagtaata atttcttggg 5580

tagtttgcag ttttaaaatt atgttttaaa atggactatc atatgcttac cgtaacttga 5640

aagtatttcg atttcttggc tttatatatc ttgtggaaag gacgaaacac cnnnnnnnnn 5700

nnnnnnnnnn nnngttttag tactctggaa acagaatcta ctaaaacaag gcaaaatgcc 5760

gtgtttatct cgtcaacttg ttggcgagat ttttgcggcc gcaggaaccc ctagtgatgg 5820

agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 5880

cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc 5940

agg 5943

<210> 5

<211> 5973

<212> DNA

<213> Artificial Sequence

<220>

<223> 2u4

<220>

<221> misc_feature

<222> (4600)..(4621)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4974)..(4994)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (5347)..(5369)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (5722)..(5743)

<223> n is a, c, g, or t

<400> 5

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcctcta gactcgaggc gttgacattg attattgact agttattaat 180

agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 240

ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 300

tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 360

atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 420

ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 480

gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atggtgatgc 540

ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga tttccaagtc 600

tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg gactttccaa 660

aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta cggtgggagg 720

tctatataag cagagctctc tggctaacta ccggtgccac catggcccca aagaagaagc 780

ggaaggtcgg tatccacgga gtcccagcag ccaagcggaa ctacatcctg ggcctggaca 840

tcggcatcac cagcgtgggc tacggcatca tcgactacga gacacgggac gtgatcgatg 900

ccggcgtgcg gctgttcaaa gaggccaacg tggaaaacaa cgagggcagg cggagcaaga 960

gaggcgccag aaggctgaag cggcggaggc ggcatagaat ccagagagtg aagaagctgc 1020

tgttcgacta caacctgctg accgaccaca gcgagctgag cggcatcaac ccctacgagg 1080

ccagagtgaa gggcctgagc cagaagctga gcgaggaaga gttctctgcc gccctgctgc 1140

acctggccaa gagaagaggc gtgcacaacg tgaacgaggt ggaagaggac accggcaacg 1200

agctgtccac caaagagcag atcagccgga acagcaaggc cctggaagag aaatacgtgg 1260

ccgaactgca gctggaacgg ctgaagaaag acggcgaagt gcggggcagc atcaacagat 1320

tcaagaccag cgactacgtg aaagaagcca aacagctgct gaaggtgcag aaggcctacc 1380

accagctgga ccagagcttc atcgacacct acatcgacct gctggaaacc cggcggacct 1440

actatgaggg acctggcgag ggcagcccct tcggctggaa ggacatcaaa gaatggtacg 1500

agatgctgat gggccactgc acctacttcc ccgaggaact gcggagcgtg aagtacgcct 1560

acaacgccga cctgtacaac gccctgaacg acctgaacaa tctcgtgatc accagggacg 1620

agaacgagaa gctggaatat tacgagaagt tccagatcat cgagaacgtg ttcaagcaga 1680

agaagaagcc caccctgaag cagatcgcca aagaaatcct cgtgaacgaa gaggatatta 1740

agggctacag agtgaccagc accggcaagc ccgagttcac caacctgaag gtgtaccacg 1800

acatcaagga cattaccgcc cggaaagaga ttattgagaa cgccgagctg ctggatcaga 1860

ttgccaagat cctgaccatc taccagagca gcgaggacat ccaggaagaa ctgaccaatc 1920

tgaactccga gctgacccag gaagagatcg agcagatctc taatctgaag ggctataccg 1980

gcacccacaa cctgagcctg aaggccatca acctgatcct ggacgagctg tggcacacca 2040

acgacaacca gatcgctatc ttcaaccggc tgaagctggt gcccaagaag gtggacctgt 2100

cccagcagaa agagatcccc accaccctgg tggacgactt catcctgagc cccgtcgtga 2160

agagaagctt catccagagc atcaaagtga tcaacgccat catcaagaag tacggcctgc 2220

ccaacgacat cattatcgag ctggcccgcg agaagaactc caaggacgcc cagaaaatga 2280

tcaacgagat gcagaagcgg aaccggcaga ccaacgagcg gatcgaggaa atcatccgga 2340

ccaccggcaa agagaacgcc aagtacctga tcgagaagat caagctgcac gacatgcagg 2400

aaggcaagtg cctgtacagc ctggaagcca tccctctgga agatctgctg aacaacccct 2460

tcaactatga ggtggaccac atcatcccca gaagcgtgtc cttcgacaac agcttcaaca 2520

acaaggtgct cgtgaagcag gaagaaaaca gcaagaaggg caaccggacc ccattccagt 2580

acctgagcag cagcgacagc aagatcagct acgaaacctt caagaagcac atcctgaatc 2640

tggccaaggg caagggcaga atcagcaaga ccaagaaaga gtatctgctg gaagaacggg 2700

acatcaacag gttctccgtg cagaaagact tcatcaaccg gaacctggtg gataccagat 2760

acgccaccag aggcctgatg aacctgctgc ggagctactt cagagtgaac aacctggacg 2820

tgaaagtgaa gtccatcaat ggcggcttca ccagctttct gcggcggaag tggaagttta 2880

agaaagagcg gaacaagggg tacaagcacc acgccgagga cgccctgatc attgccaacg 2940

ccgatttcat cttcaaagag tggaagaaac tggacaaggc caaaaaagtg atggaaaacc 3000

agatgttcga ggaaaagcag gccgagagca tgcccgagat cgaaaccgag caggagtaca 3060

aagagatctt catcaccccc caccagatca agcacattaa ggacttcaag gactacaagt 3120

acagccaccg ggtggacaag aagcctaata gagagctgat taacgacacc ctgtactcca 3180

cccggaagga cgacaagggc aacaccctga tcgtgaacaa tctgaacggc ctgtacgaca 3240

aggacaatga caagctgaaa aagctgatca acaagagccc cgaaaagctg ctgatgtacc 3300

accacgaccc ccagacctac cagaaactga agctgattat ggaacagtac ggcgacgaga 3360

agaatcccct gtacaagtac tacgaggaaa ccgggaacta cctgaccaag tactccaaaa 3420

aggacaacgg ccccgtgatc aagaagatta agtattacgg caacaaactg aacgcccatc 3480

tggacatcac cgacgactac cccaacagca gaaacaaggt cgtgaagctg tccctgaagc 3540

cctacagatt cgacgtgtac ctggacaatg gcgtgtacaa gttcgtgacc gtgaagaatc 3600

tggatgtgat caaaaaagaa aactactacg aagtgaatag caagtgctat gaggaagcta 3660

agaagctgaa gaagatcagc aaccaggccg agtttatcgc ctccttctac aacaacgatc 3720

tgatcaagat caacggcgag ctgtatagag tgatcggcgt gaacaacgac ctgctgaacc 3780

ggatcgaagt gaacatgatc gacatcacct accgcgagta cctggaaaac atgaacgaca 3840

agaggccccc caggatcatt aagacaatcg cctccaagac ccagagcatt aagaagtaca 3900

gcacagacat tctgggcaac ctgtatgaag tgaaatctaa gaagcaccct cagatcatca 3960

aaaagggcaa aaggccggcg gccacgaaaa aggccggcca ggcaaaaaag aaaaagggat 4020

cctacccata cgatgttcca gattacgctt acccatacga tgttccagat tacgcttacc 4080

catacgatgt tccagattac gcttaagaat tcctagagct cgctgatcag cctcgactgt 4140

gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 4200

aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 4260

taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 4320

agagaatagc aggcatgctg gggaggtacc gagggcctat ttcccatgat tccttcatat 4380

ttgcatatac gatacaaggc tgttagagag ataattggaa ttaatttgac tgtaaacaca 4440

aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt 4500

ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat 4560

ttcttggctt tatatatctt gtggaaagga cgaaacaccn nnnnnnnnnn nnnnnnnnnn 4620

ngttttagta ctctggaaac agaatctact aaaacaaggc aaaatgccgt gtttatctcg 4680

tcaacttgtt ggcgagattt ttttgcggcc gcaggggagg taccgagggc ctatttccca 4740

tgattccttc atatttgcat atacgataca aggctgttag agagataatt ggaattaatt 4800

tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa taatttcttg 4860

ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt accgtaactt 4920

gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac accnnnnnnn 4980

nnnnnnnnnn nnnngtttta gtactctgga aacagaatct actaaaacaa ggcaaaatgc 5040

cgtgtttatc tcgtcaactt gttggcgaga tttttttgcg gccgcagggg aggtaccgag 5100

ggcctatttc ccatgattcc ttcatatttg catatacgat acaaggctgt tagagagata 5160

attggaatta atttgactgt aaacacaaag atattagtac aaaatacgtg acgtagaaag 5220

taataatttc ttgggtagtt tgcagtttta aaattatgtt ttaaaatgga ctatcatatg 5280

cttaccgtaa cttgaaagta tttcgatttc ttggctttat atatcttgtg gaaaggacga 5340

aacaccnnnn nnnnnnnnnn nnnnnnnnng ttttagtact ctggaaacag aatctactaa 5400

aacaaggcaa aatgccgtgt ttatctcgtc aacttgttgg cgagattttt ttgcggccgc 5460

aggggaggta ccgagggcct atttcccatg attccttcat atttgcatat acgatacaag 5520

gctgttagag agataattgg aattaatttg actgtaaaca caaagatatt agtacaaaat 5580

acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 5640

atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 5700

ttgtggaaag gacgaaacac cnnnnnnnnn nnnnnnnnnn nnngttttag tactctggaa 5760

acagaatcta ctaaaacaag gcaaaatgcc gtgtttatct cgtcaacttg ttggcgagat 5820

ttttgcggcc gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 5880

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 5940

cagtgagcga gcgagcgcgc agctgcctgc agg 5973

<210> 6

<211> 6033

<212> DNA

<213> Artificial Sequence

<220>

<223> 4u4

<220>

<221> misc_feature

<222> (4600)..(4621)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (4994)..(5014)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (5387)..(5409)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (5782)..(5803)

<223> n is a, c, g, or t

<400> 6

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcctcta gactcgaggc gttgacattg attattgact agttattaat 180

agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 240

ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 300

tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 360

atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 420

ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 480

gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atggtgatgc 540

ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga tttccaagtc 600

tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg gactttccaa 660

aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta cggtgggagg 720

tctatataag cagagctctc tggctaacta ccggtgccac catggcccca aagaagaagc 780

ggaaggtcgg tatccacgga gtcccagcag ccaagcggaa ctacatcctg ggcctggaca 840

tcggcatcac cagcgtgggc tacggcatca tcgactacga gacacgggac gtgatcgatg 900

ccggcgtgcg gctgttcaaa gaggccaacg tggaaaacaa cgagggcagg cggagcaaga 960

gaggcgccag aaggctgaag cggcggaggc ggcatagaat ccagagagtg aagaagctgc 1020

tgttcgacta caacctgctg accgaccaca gcgagctgag cggcatcaac ccctacgagg 1080

ccagagtgaa gggcctgagc cagaagctga gcgaggaaga gttctctgcc gccctgctgc 1140

acctggccaa gagaagaggc gtgcacaacg tgaacgaggt ggaagaggac accggcaacg 1200

agctgtccac caaagagcag atcagccgga acagcaaggc cctggaagag aaatacgtgg 1260

ccgaactgca gctggaacgg ctgaagaaag acggcgaagt gcggggcagc atcaacagat 1320

tcaagaccag cgactacgtg aaagaagcca aacagctgct gaaggtgcag aaggcctacc 1380

accagctgga ccagagcttc atcgacacct acatcgacct gctggaaacc cggcggacct 1440

actatgaggg acctggcgag ggcagcccct tcggctggaa ggacatcaaa gaatggtacg 1500

agatgctgat gggccactgc acctacttcc ccgaggaact gcggagcgtg aagtacgcct 1560

acaacgccga cctgtacaac gccctgaacg acctgaacaa tctcgtgatc accagggacg 1620

agaacgagaa gctggaatat tacgagaagt tccagatcat cgagaacgtg ttcaagcaga 1680

agaagaagcc caccctgaag cagatcgcca aagaaatcct cgtgaacgaa gaggatatta 1740

agggctacag agtgaccagc accggcaagc ccgagttcac caacctgaag gtgtaccacg 1800

acatcaagga cattaccgcc cggaaagaga ttattgagaa cgccgagctg ctggatcaga 1860

ttgccaagat cctgaccatc taccagagca gcgaggacat ccaggaagaa ctgaccaatc 1920

tgaactccga gctgacccag gaagagatcg agcagatctc taatctgaag ggctataccg 1980

gcacccacaa cctgagcctg aaggccatca acctgatcct ggacgagctg tggcacacca 2040

acgacaacca gatcgctatc ttcaaccggc tgaagctggt gcccaagaag gtggacctgt 2100

cccagcagaa agagatcccc accaccctgg tggacgactt catcctgagc cccgtcgtga 2160

agagaagctt catccagagc atcaaagtga tcaacgccat catcaagaag tacggcctgc 2220

ccaacgacat cattatcgag ctggcccgcg agaagaactc caaggacgcc cagaaaatga 2280

tcaacgagat gcagaagcgg aaccggcaga ccaacgagcg gatcgaggaa atcatccgga 2340

ccaccggcaa agagaacgcc aagtacctga tcgagaagat caagctgcac gacatgcagg 2400

aaggcaagtg cctgtacagc ctggaagcca tccctctgga agatctgctg aacaacccct 2460

tcaactatga ggtggaccac atcatcccca gaagcgtgtc cttcgacaac agcttcaaca 2520

acaaggtgct cgtgaagcag gaagaaaaca gcaagaaggg caaccggacc ccattccagt 2580

acctgagcag cagcgacagc aagatcagct acgaaacctt caagaagcac atcctgaatc 2640

tggccaaggg caagggcaga atcagcaaga ccaagaaaga gtatctgctg gaagaacggg 2700

acatcaacag gttctccgtg cagaaagact tcatcaaccg gaacctggtg gataccagat 2760

acgccaccag aggcctgatg aacctgctgc ggagctactt cagagtgaac aacctggacg 2820

tgaaagtgaa gtccatcaat ggcggcttca ccagctttct gcggcggaag tggaagttta 2880

agaaagagcg gaacaagggg tacaagcacc acgccgagga cgccctgatc attgccaacg 2940

ccgatttcat cttcaaagag tggaagaaac tggacaaggc caaaaaagtg atggaaaacc 3000

agatgttcga ggaaaagcag gccgagagca tgcccgagat cgaaaccgag caggagtaca 3060

aagagatctt catcaccccc caccagatca agcacattaa ggacttcaag gactacaagt 3120

acagccaccg ggtggacaag aagcctaata gagagctgat taacgacacc ctgtactcca 3180

cccggaagga cgacaagggc aacaccctga tcgtgaacaa tctgaacggc ctgtacgaca 3240

aggacaatga caagctgaaa aagctgatca acaagagccc cgaaaagctg ctgatgtacc 3300

accacgaccc ccagacctac cagaaactga agctgattat ggaacagtac ggcgacgaga 3360

agaatcccct gtacaagtac tacgaggaaa ccgggaacta cctgaccaag tactccaaaa 3420

aggacaacgg ccccgtgatc aagaagatta agtattacgg caacaaactg aacgcccatc 3480

tggacatcac cgacgactac cccaacagca gaaacaaggt cgtgaagctg tccctgaagc 3540

cctacagatt cgacgtgtac ctggacaatg gcgtgtacaa gttcgtgacc gtgaagaatc 3600

tggatgtgat caaaaaagaa aactactacg aagtgaatag caagtgctat gaggaagcta 3660

agaagctgaa gaagatcagc aaccaggccg agtttatcgc ctccttctac aacaacgatc 3720

tgatcaagat caacggcgag ctgtatagag tgatcggcgt gaacaacgac ctgctgaacc 3780

ggatcgaagt gaacatgatc gacatcacct accgcgagta cctggaaaac atgaacgaca 3840

agaggccccc caggatcatt aagacaatcg cctccaagac ccagagcatt aagaagtaca 3900

gcacagacat tctgggcaac ctgtatgaag tgaaatctaa gaagcaccct cagatcatca 3960

aaaagggcaa aaggccggcg gccacgaaaa aggccggcca ggcaaaaaag aaaaagggat 4020

cctacccata cgatgttcca gattacgctt acccatacga tgttccagat tacgcttacc 4080

catacgatgt tccagattac gcttaagaat tcctagagct cgctgatcag cctcgactgt 4140

gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 4200

aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 4260

taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 4320

agagaatagc aggcatgctg gggaggtacc gagggcctat ttcccatgat tccttcatat 4380

ttgcatatac gatacaaggc tgttagagag ataattggaa ttaatttgac tgtaaacaca 4440

aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt 4500

ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat 4560

ttcttggctt tatatatctt gtggaaagga cgaaacaccn nnnnnnnnnn nnnnnnnnnn 4620

ngttttagta ctctggaaac agaatctact aaaacaaggc aaaatgccgt gtttatctcg 4680

tcaacttgtt ggcgagattt ttttgcggcc gcagagagaa tagcaggcat gctggggagg 4740

taccgagggc ctatttccca tgattccttc atatttgcat atacgataca aggctgttag 4800

agagataatt ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg 4860

tagaaagtaa taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta 4920

tcatatgctt accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa 4980

aggacgaaac accnnnnnnn nnnnnnnnnn nnnngtttta gtactctgga aacagaatct 5040

actaaaacaa ggcaaaatgc cgtgtttatc tcgtcaactt gttggcgaga tttttttgcg 5100

gccgcagaga gaatagcagg catgctgggg aggtaccgag ggcctatttc ccatgattcc 5160

ttcatatttg catatacgat acaaggctgt tagagagata attggaatta atttgactgt 5220

aaacacaaag atattagtac aaaatacgtg acgtagaaag taataatttc ttgggtagtt 5280

tgcagtttta aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta 5340

tttcgatttc ttggctttat atatcttgtg gaaaggacga aacaccnnnn nnnnnnnnnn 5400

nnnnnnnnng ttttagtact ctggaaacag aatctactaa aacaaggcaa aatgccgtgt 5460

ttatctcgtc aacttgttgg cgagattttt ttgcggccgc agagagaata gcaggcatgc 5520

tggggaggta ccgagggcct atttcccatg attccttcat atttgcatat acgatacaag 5580

gctgttagag agataattgg aattaatttg actgtaaaca caaagatatt agtacaaaat 5640

acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 5700

atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 5760

ttgtggaaag gacgaaacac cnnnnnnnnn nnnnnnnnnn nnngttttag tactctggaa 5820

acagaatcta ctaaaacaag gcaaaatgcc gtgtttatct cgtcaacttg ttggcgagat 5880

ttttgcggcc gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 5940

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 6000

cagtgagcga gcgagcgcgc agctgcctgc agg 6033

<210> 7

<211> 130

<212> DNA

<213> Artificial Sequence

<220>

<223> AAV2-ITR 5′

<400> 7

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct 130

<210> 8

<211> 141

<212> DNA

<213> Artificial Sequence

<220>

<223> AAV2-ITR 3′

<400> 8

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag ctgcctgcag g 141

<210> 9

<211> 72

<212> DNA

<213> Artificial Sequence

<220>

<223> tRNA 编码序列

<400> 9

ggttccatgg tgtaatggtt agcactctgg actctgaatc cagcgatccg agttcaaatc 60

tcggtggaac ct 72

<210> 10

<211> 212

<212> DNA

<213> Artificial Sequence

<220>

<223> EF1α启动子

<400> 10

gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgat 60

ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120

gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180

tttttcgcaa cgggtttgcc gccagaacac ag 212

<210> 11

<211> 76

<212> DNA

<213> Artificial Sequence

<220>

<223> sgRNA支架

<400> 11

gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60

caacttgttg gcgaga 76

41页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:水稻维管束特异性表达的启动子POs01g0699100及其应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!