Dna切割剂

文档序号:1957762 发布日期:2021-12-10 浏览:13次 >En<

阅读说明:本技术 Dna切割剂 (DNA cleavage agent ) 是由 K·V·谢韦里诺夫 S·A·什马科夫 D·N·阿塔莫诺娃 I·I·高亚宁 O·S·穆沙罗娃 于 2019-11-26 设计创作,主要内容包括:本发明描述了来自解纤维梭菌细菌的CRISPR-Cas9系统的新细菌核酸酶,以及所述核酸酶用于在DNA分子中产生严格特异性双链断裂的用途。本发明的核酸酶表现出不寻常的品质,并且可以用作用于将变化引入在单细胞生物和多细胞生物的基因组DNA序列中严格规定的位点的工具。因此,本发明增加了可用的CRISPR-Cas9系统的多功能性,其使得能够使用来自各种生物的Cas9核酸酶,以便在大量特异性位点和宽的温度范围内切割基因组DNA和质粒DNA。本发明还简化了生物技术相关的解纤维梭菌细菌的基因组的编辑。(The present invention describes novel bacterial nucleases from the CRISPR-Cas9 system of clostridium cellulolyticum bacteria and the use of said nucleases for generating a strictly specific double strand break in a DNA molecule. The nucleases of the present invention exhibit unusual qualities and can be used as a tool for introducing changes into strictly defined sites in the genomic DNA sequence of single-and multi-cell organisms. Thus, the present invention increases the versatility of the available CRISPR-Cas9 system, which enables the use of Cas9 nuclease from a variety of organisms to cleave genomic DNA and plasmid DNA at a large number of specific sites and over a wide temperature range. The invention also simplifies the editing of the genome of biotechnologically relevant clostridium cellulolyticum bacteria.)

DNA切割剂

技术领域

本发明涉及分子生物学和微生物学领域,特别地,它公开了CRISPR-Cas系统的新细菌核酸酶。本发明可以用作用于各种生物中的DNA的严格特异性修饰的工具。

背景技术

DNA序列的修饰是当今生物

技术领域

的热点问题之一。编辑和修饰真核生物和原核生物的基因组,以及体外操纵DNA,需要将双链断裂靶向引入DNA序列内。为了解决这个问题,目前使用下述技术:含有锌指型结构域的人工核酸酶系统、TALEN系统和细菌CRISPR-Cas系统。前两种技术需要核酸酶氨基酸序列的费力优化用于识别特异性DNA序列。相比之下,当涉及到CRISPR-Cas系统时,识别DNA靶的结构不是蛋白质,而是短的引导RNA。特定的DNA靶的切割并不需要从头合成核酸酶或其基因,而是通过使用与靶序列互补的引导RNA来完成。它使CRISPR Cas系统成为用于切割各种DNA序列的方便有效手段。该技术允许使用不同序列的引导RNA在几个区域处同时切割DNA。这种方法也用于同时修饰真核生物中的几个基因。

就其性质而言,CRISPR-Cas系统是原核免疫系统,其能够将断裂高度特异性地引入病毒遗传材料内(Mojica F. J. M.等人Intervening sequences of regularly spacedprokaryotic repeats derive from foreign genetic elements //Journal ofmolecular evolution. – 2005. – 第60卷 – 第2期 – 第174-182页)。缩写CRISPR-Cas代表"成簇规律间隔短回文重复和CRISPR相关基因"(Jansen R.等人Identification ofgenes that are associated with DNA repeats in prokaryotes //Molecularmicrobiology. - 2002. - 第43卷 - 第6期 - 第1565-1575页)。所有CRISPR-Cas系统都由CRISPR盒和编码各种Cas蛋白的基因组成(Jansen R.等人,Molecular microbiology. -2002. – 第43卷 - 第6期 - 第1565-1575页)。CRISPR盒由各自具有独特的核苷酸序列的间隔区和重复的回文重复组成(Jansen R.等人,Molecular microbiology. - 2002. - 第43卷 - 第6期 - 第1565-1575页)。CRISPR盒的转录随后为其加工,导致引导crRNA的形成,所述引导crRNA连同Cas蛋白一起形成效应复合物(Brouns S. J. J.等人Small CRISPRRNAs guide antiviral defense in prokaryotes / / Science. - 2008. - 第321卷 -第5891期 - 第960-964页)。由于crRNA和靶DNA位点(其称为前间隔序列(protospacer))之间的互补配对,Cas核酸酶识别DNA靶并且在其中高度特异性地引入断裂。

取决于系统中包括的Cas蛋白,将具有单个效应蛋白的CRISPR-Cas系统分组为六种不同类型(I-VI型)。II型CRISPR-Cas9系统的特征在于其简单的组成和活性机制,即其功能需要形成仅由一种Cas9蛋白和如下的两种短RNA组成的效应复合物:crRNA和示踪RNA(tracrRNA)。示踪RNA与源自CRISPR重复的crRNA区域互补配对,以形成引导RNA与Cas效应子结合所必需的二级结构。Cas9效应蛋白是RNA依赖性DNA内切核酸酶,具有两个核酸酶结构域(HNH和RuvC),其将断裂引入靶DNA的互补链内,因此形成双链DNA断裂(Deltcheva E.等人CRISPR RNA maturation by trans-encoded small RNA and host factor RNaseIII //Nature. - 2011. – 第471卷 – 第7340期 – 第602页)。

迄今为止,能够将双链断裂靶向性和特异性地引入DNA内的几种CRISPR-Cas核酸酶是已知的。限制CRISPR-Cas系统使用的主要特性之一是PAM序列,其从3'端开始侧接DNA靶,并且其存在是DNA被Cas9核酸酶正确识别所必需的。各种CRISPR-Cas蛋白具有不同的PAM序列,其限制了在任何DNA区域处使用核酸酶的潜力。具有新的各种PAM序列的CRISPR-Cas蛋白的使用是必需的,以使得能够在体外和活生物的基因组两者中修饰任何DNA区域。真核基因组的修饰还需要使用小尺寸的核酸酶,以提供AAV介导的CRISPR-Cas系统到细胞内的递送。

尽管用于切割DNA和修饰基因组DNA序列的许多技术是已知的,但仍需要新的有效手段用于修饰在各种生物中以及在DNA序列的严格特异性位点处的DNA。本发明提供了对于解决这个问题所必需的许多性质。

本发明的基础是在解纤维梭菌(Clostridium cellulolyticum)细菌中发现的CRISPR Cas系统。厌氧菌解纤维梭菌(Clostridium cellulolyticum(C. cellulolyticum))能够无需添加商业纤维素酶而水解木质纤维素,以形成作为最终产物的乳酸、乙酸和乙醇(Desvaux M. Clostridium cellulolyticum: model organism ofmesophilic cellulolytic clostridia. FEMS Microbiol Rev. 2005 Sep;29(4):741-64)。这些微生物的这种能力使其成为生物燃料生产者的有希望的候选物。在生物技术生产中使用生产菌如解纤维梭菌有助于使得原材料加工循环更有效,增加效率,并且最终降低对生物圈的所有组分的负荷。基因工程方法可以显著改善微生物代谢参数,并且使平衡倾向于支持更多丁醇而不是乳酸和乙酸的生产。例如,乳酸和苹果酸脱氢酶基因的双重突变体显示了乳酸形成的不存在和丁醇产率的增加(Li Y等人,Combined inactivation ofthe Clostridium cellulolyticum lactate and malate dehydrogenase genessubstantially increases ethanol yield from cellulose and switchgrassfermentations. Biotechnol Biofuels. 2012 Jan 4;5(1):2)。迄今为止,还无法开发有效的程序用于生产具有磷酸转乙酰酶和乙酸激酶基因中的突变的解纤维梭菌菌株,其可以降低乙酸生产。本发明可以用于修饰解纤维梭菌的基因组以及其它活生物的基因组。

发明内容

本发明的目的是提供使用CRISPR-Cas9系统,用于修饰单细胞生物或多细胞生物的基因组DNA序列的新方法。由于必须存在于待修饰的DNA区域的3'端处的特定PAM序列,目前系统具有有限的用途。寻找具有其它PAM序列的新Cas9酶将扩大在各种生物的DNA分子中期望的严格特异性位点处形成双链断裂的可用手段的范围。

为了解决这个问题,作者对先前预测的解纤维梭菌的II型CRISPR核酸酶CcCas9进行表征,所述CcCas9可以用于将定向修饰引入上述生物和其它生物两者的基因组内。表征本发明的基本特征如下:(a)不同于其它已知PAM序列的短的、两字母的PAM序列;(b)表征的CcCas9蛋白的小尺寸,其为1030个氨基酸残基(a.a.r.),其比来自金黄色葡萄球菌(Staphylococcus aureus)的已知Cas9酶(SaCas9)少23个a.a.r.;(c)CcCas9核酸酶的宽操作温度范围,其在37°C至65°C的温度下是活性的,具有在45°C下的最佳温度,这使其能够在具有各种温度的生物中使用。

所述问题通过使用蛋白质得到解决,所述蛋白质包含SEQ ID NO: 1的氨基酸序列,或包含与SEQ ID NO: 1的氨基酸序列具有至少95%同一性,且与SEQ ID NO: 1的差别仅在于非保守氨基酸残基的氨基酸序列,以在DNA分子中形成紧在所述DNA分子中的核苷酸序列5’- NNNNGNA-3’之前定位的双链断裂。N预期指核苷酸(A、G、C、T)中的任一种。在本发明的一些实施方案中,这种用途的特征在于双链断裂在37℃至65℃的温度下在DNA分子中形成。在本发明的优选实施方案中,这种用途的特征在于双链断裂在37℃至55℃的温度下在DNA分子中形成。

所述问题通过使用用于修饰单细胞生物或多细胞生物的基因组DNA序列的方法得到进一步解决,所述方法包括将有效量的以下物质引入该生物的至少一个细胞内:a)包含SEQ ID NO: 1的氨基酸序列的蛋白质或编码包含SEQ ID NO: 1的氨基酸序列的蛋白质的核酸,以及b)包含与直接毗邻核苷酸序列5'-NNNNGNA-3'的生物的基因组DNA区域的核苷酸序列形成双链体,并且在双链体形成后与所述蛋白质相互作用的序列的引导RNA,或编码所述引导RNA的DNA序列,其中所述蛋白质与引导RNA和核苷酸序列5’-NNNNGNA-3’的相互作用,导致在紧邻序列5'-NNNNGNA-3'的基因组DNA序列中形成双链断裂。

可以与靶DNA区域和СсCas9蛋白形成复合物的crRNA和示踪RNA(tracrRNA)的混合物,可以用作引导RNA。在本发明的优选实施方案中,基于crRNA和示踪RNA构建的杂合RNA可以用作引导RNA。用于构建杂合引导RNA的方法是技术人员已知的(Hsu PD等人,DNAtargeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep;31(9):827-32)。

本发明既可以用于体外切割靶DNA,也可以用于修饰一些活生物的基因组。基因组可以以直接方式即通过在相应位点处切割基因组进行修饰,以及通过经由同源修复插入外源DNA序列进行修饰。

来自除用于施用外的生物基因组的双链或单链DNA的任何区域(或这些区域之间以及与其它DNA片段的组合物),都可以用作外源DNA序列,其中所述区域(或区域的组合物)预期整合到由CcCas9核酸酶诱导的靶DNA中的双链断裂位点内。在本发明的一些实施方案中,来自用于引入CcCas9蛋白的生物基因组,但通过突变(核苷酸的取代)以及通过一个或多个核苷酸的插入或缺失进一步修饰的双链DNA区域,可以用作外源DNA序列。

本发明的技术结果是增加可用的CRISPR-Cas9系统的多功能性,以使得能够使用Cas9核酸酶用于在大量特异性位点和更宽的温度范围内切割基因组DNA或质粒DNA。

附图说明

图1. 解纤维梭菌中的CRISPR基因座的示意图。

图2. 通过体外方法的PAM测定。用于切割限于序列NNNNGNA的DNA的系统的开发。

图3. 各个PAM位置的重要性的检查。

图4. 在切割各种DNA靶时的蛋白质活性检查。

图5. 人grin2b基因的DNA片段的体外切割反应。

图6. CcCas9活性的温度范围研究。

图7. 引导RNA与靶DNA的区域之间的相互作用的示意图。

图8. 来自生物金黄色葡萄球菌(SaCas9)、空肠弯曲杆菌(Campylobacterjejuni)(CjCas9)和CcCas9的Cas9蛋白序列的比对。序列的非保守区域是加下划线的。

具体实施方式

如本发明的描述中使用的,术语“包括(includes)”和“包括(including)”应该被解释为意指“包括等等”。所述术语不预期被解释为“仅由……组成”。除非分开定义,否则本申请中的技术和科学术语具有科学和技术文献中普遍接受的典型含义。

如本文使用的,术语“两个序列的同源性百分比”等价于术语“两个序列的同一性百分比”。序列的同一性基于参考序列进行确定。用于序列分析的算法是本领域已知的,例如在Altschul等人,J. Mol. Biol.,215,第403-10页(1990)中描述的BLAST。出于本发明的目的,为了确定核苷酸序列和氨基酸序列之间的同一性和相似性水平,可以使用核苷酸序列和氨基酸序列的比较,其通过由美国国家生物技术信息中心(National Center forBiotechnology Information)(http://www.ncbi.nlm.nih.gov/blast)提供的BLAST软件包,使用具有标准参数的带缺口比对来执行。两个序列的同一性百分比由这两个序列中的相同氨基酸的位置数目决定,考虑了对于两个序列通过比对的最佳比较待输入的缺口数目和每个缺口的长度。同一性百分比等于考虑到序列比对,在给定位置处的相同氨基酸数目除以位置总数再乘以100。

术语“特异性地杂交”指两个单链核酸分子或足够互补的序列之间的缔合,其允许在本领域通常使用的预定条件下的这种杂交。

短语“在核苷酸PAM序列之前定位的双链断裂”意指靶DNA序列中的双链断裂在核苷酸PAM序列之前0至25个核苷酸的距离处制备。

包含特异性氨基酸序列的蛋白质预期指具有由所述氨基酸序列以及可能通过肽键与所述氨基酸序列连接的其它序列组成的氨基酸序列的蛋白质。其它序列的实例可以是核定位信号(NLS),或为所述氨基酸序列提供增加的功能性的其它序列。

与引导RNA同时引入的外源DNA序列预期指在通过引导RNA的特异性确定的断裂位点处,对于双链靶DNA的特异性修饰而特异性地制备的DNA序列。这种修饰可以是例如在靶DNA中的断裂位点处的某些核苷酸的插入或缺失。外源DNA可以是来自不同生物的DNA区域,或来自与靶DNA相同的生物的DNA区域。

引入细胞内的蛋白质和RNA的有效量预期指这样的蛋白质和RNA的量,当引入所述细胞内时,所述量能够形成功能性复合物,即与靶DNA特异性地结合,并且在其中在由引导RNA和DNA上的PAM序列确定的位点处产生双链断裂的复合物。该过程的效率可以通过使用技术人员已知的常规技术,分析从所述细胞中分离的靶DNA进行评价。

蛋白质和RNA可以通过各种技术递送至细胞。例如,蛋白质可以作为以下进行递送:编码该蛋白质的基因的DNA质粒、用于该蛋白质在细胞质中的翻译的mRNA、或包括该蛋白质和引导RNA的核糖核蛋白复合物。递送可以通过技术人员已知的各种技术来执行。

核酸编码系统的组分可以如下直接或间接引入细胞内:通过经由技术人员已知的方法的细胞转染或转化,通过使用重组病毒,通过对细胞的操纵如DNA显微注射等。

由核酸酶和引导RNA以及外源DNA(如果需要的话)组成的核糖核酸复合物,可以通过将复合物转染到细胞内或通过将复合物机械地引入细胞内,例如通过显微注射进行递送。

编码待引入细胞内的蛋白质的核酸分子可以整合到染色体内,或可以染色体外复制DNA。在一些实施方案中,为了确保蛋白质基因由引入细胞内的DNA有效表达,有必要根据细胞类型修饰所述DNA的序列,以便优化密码子用于表达,这是由于各种生物基因组的编码区中的同义密码子的不相等的出现频率。密码子优化对于增加动物、植物、真菌或微生物细胞中的表达是有必要的。

为了具有与SEQ ID NO: 1的氨基酸序列具有至少95%同一性的序列的蛋白质在真核细胞中起作用,该蛋白质最后到达这种细胞的核是有必要的。因此,在本发明的一些实施方案中,具有与SEQ ID NO: 1的氨基酸序列具有至少95%同一性的序列,并且通过添加一个或多个核定位信号在一端或两端处进一步修饰的蛋白质,用于在靶DNA中形成双链断裂。例如,可以使用来自SV40病毒的核定位信号。为了提供到核的有效递送,核定位信号可以通过间隔区序列与主要蛋白质序列分开,所述间隔区序列例如在Shen B等人"Generation ofgene-modified mice via Cas9/RNA- mediated gene targeting",Cell Res. 2013 May;23(5):720-3中进行描述。进一步地,在其它实施方案中,可以使用不同的核定位信号或用于将所述蛋白质递送到细胞核内的替代方法。

本发明包括来自解纤维梭菌(Clostridium cellulolyticum(C. cellulolyticum))生物的蛋白质用于将双链断裂在严格指定的位置处引入DNA分子内的用途,所述蛋白质与先前表征的Cas9蛋白质同源。

在代谢工程中,由于缺乏有效的编辑工具,编辑解纤维梭菌的基因组是艰巨任务。用于靶向基因组编辑的方法,例如重组工程、II组内含子逆转录转座和等位基因交换,具有许多明显的局限性。例如,依赖重组的等位基因交换的程序是相当耗时的,并且具有低效率。(Heap J. T.等人Integration of DNA into bacterial chromosomes from plasmidswithout a counter-selection marker //Nucleic acids research. – 2012. – 第40卷- 第8期 - 第e59-e59页)。长DNA片段的插入,例如代谢途径转移,用目前的基因组改造工具是困难的,所述工具需要现有的重组位点和/或重组酶(Esvelt K. M.,Wang H. H.Genome‐scale engineering for systems and synthetic biology //Molecularsystems biology. – 2013. – 第9卷 - 第1期 - 第641页)。简单有效的方法是成功的基因组操纵和产生具有预定性质的突变体所需的。

使用CRISPR核酸酶将靶向修饰引入基因组具有许多优点。首先,系统的活性的特异性由crRNA序列决定,所述crRNA序列允许对于所有靶基因座使用一种类型的核酸酶。其次,该技术使得能够将与不同基因靶互补的几种引导RNA一次递送到细胞内,从而使得可一次同时修饰几种基因。

此外,来自解纤维梭菌细菌的天然CRISPR-Cas9系统的使用使得用于编辑该生物基因组的系统更简便有效,因为该程序不需要外源基因引入细胞内、外源基因的维持和表达。相反,可开发用于将针对靶基因的引导RNA引入细菌内的程序,通过所述程序,宿主细胞内CRISPR-Cas9系统能够识别具有生物技术意义的细菌的相应DNA靶,并且在其中引入双链断裂。

对于来自解纤维梭菌H10的Cas9蛋白的生物化学表征,将编码主要系统组分(CcCas9、cas1、cas2蛋白基因以及CRISPR盒和引导RNA)的CRISPR基因座克隆到单拷贝细菌载体pACYC184内。由Cas9和crRNA/tracrRNA(示踪RNA)双链体组成的效应核糖核酸复合物,需要在DNA靶上存在PAM(前间隔序列调整基序)用于DNA的识别和后续水解,加上crRNA间隔区-前间隔序列互补性。(Mojica F. J. M.等人Short motif sequences determine thetargets of the prokaryotic CRISPR defence system //Microbiology. – 2009. – 第155卷 – 第3期 – 第733-740页)。PAM是严格定义的几个核苷酸的序列,其在II型系统中与脱靶链上的前间隔序列的3'端相邻或远离几个核苷酸定位。在不存在PAM的情况下,并不发生DNA键的水解伴随双链断裂的形成。靶上存在PAM序列的需要增加了识别特异性,但同时对引入断裂的靶DNA区域的选择施加了限制。

为了确定CRISPR-Cas9系统的引导RNA的序列,执行了携带所生成的pACYC184_CcCas9构建体的大肠杆菌(E. coli)DH5α细菌的RNA测序。测序显示了系统的CRISPR盒是主动转录的,示踪RNA也是如此(图1)。crRNA和tracrRNA序列的分析允许考虑它们有可能形成被CcCas9核酸酶识别的二级结构。

进一步地,作者使用细菌PAM筛选确定了CcCas9蛋白的PAM序列。为了确定CcCas9蛋白的PAM序列,携带pACYC184_CcCas9质粒的大肠杆菌DH5α细胞通过质粒文库进行转化,所述质粒文库含有CcCas9系统的CRISPR盒的间隔区序列5’-TAAAAAATAAGCAAGCGATGATATGAATGC-3’,侧翼为来自5'或3'端的随机七字母序列。携带对应于CcCas9系统的PAM序列的序列的质粒经受在功能性CRISPR-Cas系统的作用下的降解,而剩余的文库质粒被有效地转化到细胞内,赋予其针对抗生素氨苄青霉素的抗性。细胞在含有抗生素的平板上的转化和温育后,将集落从琼脂表面洗掉,并且使用Qiagen PlasmidPurification Midi试剂盒由其提取DNA。含有随机化PAM序列的区域通过PCR从分离的质粒库中进行扩增,然后经受在Illumina平台上的高通量测序。通过比较将文库中包括的具有独特PAM的质粒转化到携带pACYC184_CcCas9的细胞、或携带空载体pacyc184的对照细胞内的效率,来分析所得到的读段。结果使用生物信息学方法进行分析。因此,可鉴定CcCas9系统的PAM,其为两字母序列NNNNGNA(图2)。

接下来,通过在体外再现切割反应进一步确定PAM序列。为了确定CcCas9蛋白的PAM序列,使用双链PAM文库的体外切割。为此,有必要获得如下的CcCas9效应复合物的所有组分:引导RNA和重组形式的核酸酶。通过RNA测序确定引导RNA序列使得能够在体外合成crRNA和tracrRNA分子。使用NEB HiScribe T7 RNA合成试剂盒来进行合成。双链DNA文库是374 bp片段,其包含侧翼为来自3'端的随机化七核苷酸(5’ NNNNNNN 3’)的前间隔序列:

为了切割这个靶,使用下述序列的引导RNA:

tracrRNA:

和crRNA:

粗体指示了与前间隔序列(靶DNA序列)互补的crRNA序列。

为了获得重组CcCas9蛋白,将其基因克隆到质粒pET21a内。大肠杆菌Rosetta细胞通过所得到的质粒CcCas9_pET21a进行转化。使携带质粒的细胞生长至OD_600=0.6的光密度,然后通过加入IPTG至1mM的浓度来诱导CcCas9基因的表达。使细胞在25℃下温育4小时,这之后将它们裂解。重组蛋白如下在两个阶段中进行纯化:通过亲和层析(NiNTA)和通过在Superdex 200柱上的蛋白质尺寸排阻。使用Amicon 30 kDa过滤器浓缩所得到的蛋白质。此后,将蛋白质在-80℃下冷冻并且用于体外反应。

切割线性PAM文库的体外反应在下述条件下执行:

1xCutSmart缓冲液

400 nM CcSas9

100 nM DNA文库

2 µM crRNA

2 µM tracrRNA

总反应体积为20 µl。

解纤维梭菌H10常见于堆肥中,并且具有45℃的最佳分裂温度,并且相应地,反应在此温度下进行30分钟。

切割导致文库片段的一部分断裂成具有约50个碱基对(bp)和324 bp长度的两部分。作为对照样品,使用不添加crRNA(Cas效应复合物的重要组分)的反应。

将反应产物施加到1.5%琼脂糖凝胶上且经受电泳。将长度为374 bp的未切割DNA片段从凝胶中提取,并且制备用于使用NEB NextUltra II试剂盒的高通量测序。样品在Illumina平台上进行测序,然后使用生物信息学方法分析序列,其中与对照样品相比,确定了在PAM(NNNNNNN)的各个位置处的核苷酸表示中的差异(图3)。

因此,作者能够通过体外方法确定CcCas9的PAM序列:NNNNGNA,其完全重复了在用细菌的实验中获得的结果。

接下来,检查了PAM序列的各个位置的重要性。为此,在切割包含侧翼为PAM序列GAGAGTA的DNA靶5’- gtgctcaatgaaaggagata-3’的以下DNA片段时,执行体外反应:

反应在下述条件下执行:

1xCutSmart缓冲液

400 nM CcSas9

20 nM DNA

2 µM crRNA

2 µM tracrRNA

温育时间为30分钟,反应温度为45℃。实验结果确认了CcCas9的PAM序列为NNNNGNA -3’。最保守的氨基酸是在位置5处的G(参见图4)。

给出该方法的下述示例性实施方案用于公开本发明的特性的目的,并且不应该被解释为以任何方式限制本发明的范围。

实施例1. 测试СсCas9蛋白在切割各种DNA靶时的活性

为了检查CcCas9识别侧翼为NNNNGNA 3’序列的各种DNA序列的能力,进行了关于来自人grin2b基因序列的DNA靶的体外切割的实验(参见下表1)。

表1. 从人grin2b基因中分离的DNA靶。

DNA靶 PAM
ctacatcacgtaacctgtct tagaAgA
gaacgagctctgctgcctga cacgGcc
agaacgagctctgctgcctg acacGgc
acggccaacaccaaccagaa cttgGgA
tccgctctgggcttcatctt caactcg
cgactccctgcaaacacaaa gaaagag
atctacatcacgtaacctgt cttaGaA
tatctcctttcattgagcac caaaccc

在与上述实验相似的条件下执行体外DNA切割反应。作为DNA靶,使用大小约500bp的人grin2b基因片段:

实验结果显示了,在具有引导RNA的复合物中的CcCas9能够识别包含PAM序列NNNNGNA的各种DNA靶(图5)。在一些靶的情况下,CcCas9耐受在PAM序列的位置7处的取代。

实施例2. CcCas9活性的温度范围

为了确定CcCas9蛋白的温度范围,在不同温度条件下进行关于DNA靶的体外切割的实验。

为此,使侧翼为PAM序列GAGAGTA的靶DNA经受在不同温度下,通过具有相应引导RNA的CcCas9效应复合物的切割(图6)。

发现CcCas9蛋白具有宽温度范围的活性。最大核酸酶活性在45℃的温度下实现,而该蛋白质在37℃至55℃的范围内是足够活性的。因此,具有引导RNA的复合物中的CcCas9是用于限于序列5’-NNNNGNA-3’的DNA分子中的切割(形成双链断裂)的新工具,具有37℃至55℃的温度范围。靶DNA与一起形成引导RNA的crRNA和示踪RNA(tracrRNA)的复合物的示意图显示于图7中。

实施例3.

来自属于梭菌属(Clostridium)的密切相关生物的Cas9蛋白。迄今为止,仅在梭菌中发现了一种II型CRISPR Cas系统,其为来自产气荚膜梭菌(Clostridium perfringens)的Cas9 CRISPR Cas系统(Maikova A等人,New Insights Into Functions and PossibleApplications of Clostridium difficile CRISPR-Cas System. Front Microbiol. 2018 Jul 31;9:1740)。

来自产气荚膜梭菌细菌的Cas9蛋白与CcCas9蛋白具有36%的同一性(同一性程度使用BLASTp软件、缺省参数进行计算)。在尺寸方面可比较的来自金黄色葡萄球菌的Cas9蛋白与CcCas9具有28%的同一性(BLASTp,缺省参数)。

因此,CcCas9蛋白在氨基酸序列方面显著不同于迄今为止研究的其它Cas9蛋白,包括在相关生物中发现的Cas9蛋白。

基因工程领域的技术人员将了解,申请人获得并表征的CcCas9蛋白质序列变体可以无需改变蛋白质本身的功能而进行修饰(例如,通过并不直接影响功能活性的氨基酸残基的定向诱变(Sambrook等人,Molecular Cloning: A Laboratory Manual,(1989),CSHPress,第15.3-15.108页))。特别地,技术人员将认识到可以修饰非保守氨基酸残基,而不影响负责蛋白质功能性(决定蛋白质功能或结构)的残基。这种修饰的实例包括用同源氨基酸残基取代非保守氨基酸残基。含有非保守氨基酸残基的一些区域显示于图8中。在本发明的一些实施方案中,可使用这样的蛋白质,其包含与SEQ ID NO: 1的氨基酸序列具有至少95%同一性,且与SEQ ID NO: 1的差别仅在于非保守氨基酸残基的氨基酸序列,以在DNA分子中形成紧在所述DNA分子中的核苷酸序列5’- NNNNGNA-3’之前定位的双链断裂。同源蛋白质可以通过相应核酸分子的诱变(例如,定点或PCR介导的诱变)获得,随后为根据本文所述的功能分析,就其功能的保存测试所编码的修饰的Cas9蛋白。

实施例4. 本发明中描述的CcCas9系统与引导RNA组合可以用于修饰多细胞生物包括真核生物的基因组DNA序列。为了将呈具有引导RNA的复合物的CcCas9系统引入该生物的细胞(所有细胞或一部分细胞)内,可以应用技术人员已知的各种方法。例如,用于将CRISPR-Cas9系统递送至生物的细胞的方法已公开于来源(Liu C等人,Deliverystrategies of the CRISPR-Cas9 gene-editing system for therapeuticapplications. J Control Release. 2017 Nov 28;266:17-26; Lino CA等人,Delivering CRISPR: a review of the challenges and approaches. Drug Deliv.2018 Nov;25(1):1234-1257),以及在这些来源内进一步公开的来源中。

对于CcCas9核酸酶在真核细胞中的有效表达,期望通过技术人员已知的方法(例如,IDT密码子优化工具)来优化CcCas9蛋白的氨基酸序列的密码子。

对于CcCas9核酸酶在真核细胞中的有效活性,有必要将蛋白质输入真核细胞的核内。这可以通过使用来自SV40 T抗原的核定位信号(Lanford等人,Cell,1986,46: 575–582)来完成,所述核定位信号经由在Shen B等人"Generation of gene-modified micevia Cas9/RNA- mediated gene targeting",Cell Res. 2013 May;23(5):720-3中描述的间隔区序列与CcCas9序列连接,或不含间隔区序列。因此,待在真核细胞的核内部转运的核酸酶的完整氨基酸序列将是下述序列:MAPKKKRKVGIHGVPAA-CcCas9- KRPAATKKAGQAKKKK(下文称为CcCas9 NLS)。可以使用至少两种方法来递送具有上述氨基酸序列的蛋白质。

基因递送通过制备质粒来实现,所述质粒携带在启动子(例如CMV启动子)的控制下的CcCas9 NLS基因、以及在U6启动子的控制下的编码引导RNA的序列。作为DNA靶,使用侧翼为5’-NNNNGNA-3’的DNA序列,例如,人grin2b基因的DNA序列:

因此,crRNA表达盒如下所示:

粗体指示U6启动子序列,随后为靶DNA识别所需的序列,而直接重复序列以大写字母突出显示。

示踪RNA表达盒如下所示:

粗体指示U6启动子序列,随后为编码示踪RNA的序列。

使用Lipofectamine2000试剂(Thermo Fisher Scientific),将质粒DNA纯化并转染到人HEK293细胞内。使细胞温育72小时,这之后使用基因组DNA纯化柱(Thermo FisherScientific)由其提取基因组DNA。通过在Illumina平台上测序来分析靶DNA位点,以便确定由于定向双链断裂,随后为其修复,而在靶位点中发生的DNA中的插入/缺失数目。

靶片段的扩增使用侧接断裂引入的假定位点的引物来执行,例如,对于上文提到的grin2b基因位点使用以下引物:

在扩增后,根据用于高通量测序的Ultra II DNA Library Prep Kit forIllumina(NEB)试剂样品制备方案来制备样品。然后在Illumina平台上执行测序,300个循环,直接读取。通过生物信息学方法来分析测序结果。靶DNA序列中的几个核苷酸的插入或缺失被视为切割检测。

通过在CutSmart缓冲液(NEB)中使重组CcCas9 NLS与引导RNA温育,来进行作为核糖核酸复合物的递送。重组蛋白质通过经由亲和层析(NiNTA,Qiagen)与尺寸排阻(Superdex 200)纯化细菌生产细胞而由其产生。

蛋白质与RNA以1:2:2(CcCas9 NLS : crRNA :tracrRNA)的比率混合,使混合物在室温下温育10分钟,然后转染到细胞内。

接下来,分析由其提取的DNA在靶DNA位点处的插入/缺失(如上所述)。

相对于先前表征的Cas9蛋白,在本发明中表征的来自解纤维梭菌细菌的CcCas9核酸酶具有许多优点。

CcCas9具有与其它已知的Cas核酸酶不同的短的两字母PAM,其是该系统起作用所需的。根据作者,定位远离前间隔序列4个核苷酸的短PAM GNA对于CcSas9是足够的。进一步地,在位置+5处的G是关键,而位置+7重要性较低,并且体外水解不仅在A或T的存在下检测到,而且在位置+7处的C的存在下检测到,尽管具有略微更低的效率。

迄今为止已知的能够将双链断裂引入DNA内的大多数Cas核酸酶具有复杂的多字母PAM序列,限制了适合于切割的序列的选择。在所研究的识别短PAM的Cas核酸酶中,仅CcCas9能够识别限于GNA核苷酸的序列。

CcCas9的第二个优点是小蛋白质尺寸(1030个a.a.r.,其与SaCas9相比少了23个a.a.r.)。迄今为止,它是研究的具有两字母PAM序列的唯一的小尺寸蛋白质。

CcCas9系统的第三个优点是活性的宽温度范围:核酸酶在37℃至65℃的温度下是活性的,具有在45℃下的最佳温度。

尽管已参考所公开的实施方案描述了本发明,但本领域技术人员将了解,详细描述的特定实施方案被提供用于说明本发明的目的,而不应解释为以任何方式限制本发明的范围。应理解,可以进行各种改变而不脱离本发明的精神。

<110> JSC "BIOCAD"

<120> DNA切割剂

<130> 417252

<150> RU 2018141524

<151> 2018-11-26

<160> 2

<170> BiSSAP 1.3.6

<210> 1

<211> 1021

<212> PRT

<213> 解纤维梭菌

<400> 1

Met Lys Tyr Thr Leu Gly Leu Asp Val Gly Ile Ala Ser Val Gly Trp

1 5 10 15

Ala Val Ile Asp Lys Asp Asn Asn Lys Ile Ile Asp Leu Gly Val Arg

20 25 30

Cys Phe Asp Lys Ala Glu Glu Ser Lys Thr Gly Glu Ser Leu Ala Thr

35 40 45

Ala Arg Arg Ile Ala Arg Gly Met Arg Arg Arg Ile Ser Arg Arg Ser

50 55 60

Gln Arg Leu Arg Leu Val Lys Lys Leu Phe Val Gln Tyr Glu Ile Ile

65 70 75 80

Lys Asp Ser Ser Glu Phe Asn Arg Ile Phe Asp Thr Ser Arg Asp Gly

85 90 95

Trp Lys Asp Pro Trp Glu Leu Arg Tyr Asn Ala Leu Ser Arg Ile Leu

100 105 110

Lys Pro Tyr Glu Leu Val Gln Val Leu Thr His Ile Thr Lys Arg Arg

115 120 125

Gly Phe Lys Ser Asn Arg Lys Glu Asp Leu Ser Thr Thr Lys Glu Gly

130 135 140

Val Val Ile Thr Ser Ile Lys Asn Asn Ser Glu Met Leu Arg Thr Lys

145 150 155 160

Asn Tyr Arg Thr Ile Gly Glu Met Ile Phe Met Glu Thr Pro Glu Asn

165 170 175

Ser Asn Lys Arg Asn Lys Val Asp Glu Tyr Ile His Thr Ile Ala Arg

180 185 190

Glu Asp Leu Leu Asn Glu Ile Lys Tyr Ile Phe Ser Ile Gln Arg Lys

195 200 205

Leu Gly Ser Pro Phe Val Thr Glu Lys Leu Glu His Asp Phe Leu Asn

210 215 220

Ile Trp Glu Phe Gln Arg Pro Phe Ala Ser Gly Asp Ser Ile Leu Ser

225 230 235 240

Lys Val Gly Lys Cys Thr Leu Leu Lys Glu Glu Leu Arg Ala Pro Thr

245 250 255

Ser Cys Tyr Thr Ser Glu Tyr Phe Gly Leu Leu Gln Ser Ile Asn Asn

260 265 270

Leu Val Leu Val Glu Asp Asn Asn Thr Leu Thr Leu Asn Asn Asp Gln

275 280 285

Arg Ala Lys Ile Ile Glu Tyr Ala His Phe Lys Asn Glu Ile Lys Tyr

290 295 300

Ser Glu Ile Arg Lys Leu Leu Asp Ile Glu Pro Glu Ile Leu Phe Lys

305 310 315 320

Ala His Asn Leu Thr His Lys Asn Pro Ser Gly Asn Asn Glu Ser Lys

325 330 335

Lys Phe Tyr Glu Met Lys Ser Tyr His Lys Leu Lys Ser Thr Leu Pro

340 345 350

Thr Asp Ile Trp Gly Lys Leu His Ser Asn Lys Glu Ser Leu Asp Asn

355 360 365

Leu Phe Tyr Cys Leu Thr Val Tyr Lys Asn Asp Asn Glu Ile Lys Asp

370 375 380

Tyr Leu Gln Ala Asn Asn Leu Asp Tyr Leu Ile Glu Tyr Ile Ala Lys

385 390 395 400

Leu Pro Thr Phe Asn Lys Phe Lys His Leu Ser Leu Val Ala Met Lys

405 410 415

Arg Ile Ile Pro Phe Met Glu Lys Gly Tyr Lys Tyr Ser Asp Ala Cys

420 425 430

Asn Met Ala Glu Leu Asp Phe Thr Gly Ser Ser Lys Leu Glu Lys Cys

435 440 445

Asn Lys Leu Thr Val Glu Pro Ile Ile Glu Asn Val Thr Asn Pro Val

450 455 460

Val Ile Arg Ala Leu Thr Gln Ala Arg Lys Val Ile Asn Ala Ile Ile

465 470 475 480

Gln Lys Tyr Gly Leu Pro Tyr Met Val Asn Ile Glu Leu Ala Arg Glu

485 490 495

Ala Gly Met Thr Arg Gln Asp Arg Asp Asn Leu Lys Lys Glu His Glu

500 505 510

Asn Asn Arg Lys Ala Arg Glu Lys Ile Ser Asp Leu Ile Arg Gln Asn

515 520 525

Gly Arg Val Ala Ser Gly Leu Asp Ile Leu Lys Trp Arg Leu Trp Glu

530 535 540

Asp Gln Gly Gly Arg Cys Ala Tyr Ser Gly Lys Pro Ile Pro Val Cys

545 550 555 560

Asp Leu Leu Asn Asp Ser Leu Thr Gln Ile Asp His Ile Tyr Pro Tyr

565 570 575

Ser Arg Ser Met Asp Asp Ser Tyr Met Asn Lys Val Leu Val Leu Thr

580 585 590

Asp Glu Asn Gln Asn Lys Arg Ser Tyr Thr Pro Tyr Glu Val Trp Gly

595 600 605

Ser Thr Glu Lys Trp Glu Asp Phe Glu Ala Arg Ile Tyr Ser Met His

610 615 620

Leu Pro Gln Ser Lys Glu Lys Arg Leu Leu Asn Arg Asn Phe Ile Thr

625 630 635 640

Lys Asp Leu Asp Ser Phe Ile Ser Arg Asn Leu Asn Asp Thr Arg Tyr

645 650 655

Ile Ser Arg Phe Leu Lys Asn Tyr Ile Glu Ser Tyr Leu Gln Phe Ser

660 665 670

Asn Asp Ser Pro Lys Ser Cys Val Val Cys Val Asn Gly Gln Cys Thr

675 680 685

Ala Gln Leu Arg Ser Arg Trp Gly Leu Asn Lys Asn Arg Glu Glu Ser

690 695 700

Asp Leu His His Ala Leu Asp Ala Ala Val Ile Ala Cys Ala Asp Arg

705 710 715 720

Lys Ile Ile Lys Glu Ile Thr Asn Tyr Tyr Asn Glu Arg Glu Asn His

725 730 735

Asn Tyr Lys Val Lys Tyr Pro Leu Pro Trp His Ser Phe Arg Gln Asp

740 745 750

Leu Met Glu Thr Leu Ala Gly Val Phe Ile Ser Arg Ala Pro Arg Arg

755 760 765

Lys Ile Thr Gly Pro Ala His Asp Glu Thr Ile Arg Ser Pro Lys His

770 775 780

Phe Asn Lys Gly Leu Thr Ser Val Lys Ile Pro Leu Thr Thr Val Thr

785 790 795 800

Leu Glu Lys Leu Glu Thr Met Val Lys Asn Thr Lys Gly Gly Ile Ser

805 810 815

Asp Lys Ala Val Tyr Asn Val Leu Lys Asn Arg Leu Ile Glu His Asn

820 825 830

Asn Lys Pro Leu Lys Ala Phe Ala Glu Lys Ile Tyr Lys Pro Leu Lys

835 840 845

Asn Gly Thr Asn Gly Ala Ile Ile Arg Ser Ile Arg Val Glu Thr Pro

850 855 860

Ser Tyr Thr Gly Val Phe Arg Asn Glu Gly Lys Gly Ile Ser Asp Asn

865 870 875 880

Ser Leu Met Val Arg Val Asp Val Phe Lys Lys Lys Asp Lys Tyr Tyr

885 890 895

Leu Val Pro Ile Tyr Val Ala His Met Ile Lys Lys Glu Leu Pro Ser

900 905 910

Lys Ala Ile Val Pro Leu Lys Pro Glu Ser Gln Trp Glu Leu Ile Asp

915 920 925

Ser Thr His Glu Phe Leu Phe Ser Leu Tyr Gln Asn Asp Tyr Leu Val

930 935 940

Ile Lys Thr Lys Lys Gly Ile Thr Glu Gly Tyr Tyr Arg Ser Cys His

945 950 955 960

Arg Gly Thr Gly Ser Leu Ser Leu Met Pro His Phe Ala Asn Asn Lys

965 970 975

Asn Val Lys Ile Asp Ile Gly Val Arg Thr Ala Ile Ser Ile Glu Lys

980 985 990

Tyr Asn Val Asp Ile Leu Gly Asn Lys Ser Ile Val Lys Gly Glu Pro

995 1000 1005

Arg Arg Gly Met Glu Lys Tyr Asn Ser Phe Lys Ser Asn

1010 1015 1020

<210> 2

<211> 3066

<212> DNA

<213> 解纤维梭菌

<400> 2

atgaaatata cattaggtct tgatgttgga attgcttctg taggttgggc ggtaattgat 60

aaggataata ataaaattat tgacttagga gttagatgtt ttgataaagc agaggaatct 120

aaaacgggtg agtcacttgc aacagctaga aggatagcta gaggtatgag aagaagaatt 180

tcgagaagat cccaaaggct acgtttagtt aaaaaactgt ttgttcaata tgaaattatt 240

aaagattcaa gtgaatttaa ccggatattt gacacttcgc gggatgggtg gaaagatcct 300

tgggaattaa ggtataatgc tttatcaaga atacttaaac cttatgaact tgttcaggta 360

cttacacata ttactaagag aagaggcttt aaaagtaaca gaaaggaaga cttgtctact 420

acaaaagaag gtgtagttat aactagtatt aaaaacaatt ctgagatgct tcgtacgaaa 480

aattaccgta ctattggaga aatgattttt atggagactc ctgaaaatag taacaaaagg 540

aataaggtag acgagtatat tcacactatt gccagagaag atcttctcaa tgaaataaaa 600

tatatattta gtatacaaag aaagcttgga agcccctttg taactgaaaa attagaacat 660

gactttttga atatatggga atttcaacgt ccttttgcca gtggtgatag tatactttca 720

aaagtgggaa agtgtaccct gctaaaggag gagttgagag caccgacttc ctgttacaca 780

tcagaatatt ttggattact tcaatcgatt aacaatctag ttttggttga agataacaat 840

acattaacat taaataatga tcaaagagca aaaataatag aatatgctca tttcaagaat 900

gaaatcaagt attctgaaat aagaaaatta ttagatattg aacctgaaat tttattcaaa 960

gcacataatt tgacacacaa aaatccctca ggaaacaatg agagcaaaaa gttttatgaa 1020

atgaagtctt atcataaact gaaaagcaca ttacctacag acatctgggg gaaattgcat 1080

tctaacaagg aatctcttga taatcttttt tactgcctta cggtctataa aaacgataac 1140

gaaataaagg actatttaca agcgaataat cttgattatt taattgaata tatagcaaaa 1200

ttgccaactt tcaacaaatt taaacatcta tctttagttg ccatgaaaag gattattccg 1260

tttatggaaa aagggtataa atatagtgat gcctgtaata tggcggaatt agattttaca 1320

ggttccagca aacttgaaaa gtgtaataag ttaactgttg aaccaattat tgagaatgta 1380

actaatccag ttgtaataag ggctctgacg caagcaagga aagttataaa tgcgattata 1440

cagaagtatg gtctcccgta tatggtaaat atagaacttg cacgtgaagc gggaatgaca 1500

cgtcaggata gagataattt aaaaaaagaa catgaaaaca accgaaaagc aagggaaaaa 1560

atatcagacc taatacgcca aaatggtaga gttgcaagtg gtctggatat actgaaatgg 1620

cgtctttggg aagaccaggg cggaagatgt gcttattccg gcaaaccaat tcctgtttgt 1680

gatttattga atgactcact gactcagata gatcacattt atccgtatag tagaagtatg 1740

gacgattcat atatgaataa agttttagtt ttaaccgacg aaaatcaaaa taaaagaagt 1800

tatacgccat atgaagtatg ggggtcaact gaaaaatggg aggattttga ggcaagaata 1860

tattctatgc atttacctca aagtaaagaa aaaaggcttt tgaacagaaa ctttattaca 1920

aaagatttgg actcatttat ttcaagaaat cttaacgata ctaggtatat atcaaggttt 1980

ttaaaaaact atatagaatc gtatctgcag tttagtaatg attcacctaa gtcttgtgtg 2040

gtctgcgtta atggtcagtg taccgctcag cttagaagta gatgggggtt aaataaaaat 2100

cgagaagagt cagacctgca tcatgccctt gatgcagcag taattgcgtg tgcagataga 2160

aaaataatta aagaaataac aaactattat aatgaaagag aaaaccataa ttataaagtt 2220

aaatatcctt tgccttggca ttcgtttagg caagatttaa tggaaacgtt agcaggtgtt 2280

ttcatatccc gggcacccag aagaaaaatt accgggccag cccatgatga gacaatcaga 2340

tctcccaagc attttaacaa aggtttaact tcggtaaaaa taccgttaac aacagtgacg 2400

ttggaaaaac ttgagacaat ggtaaaaaat acaaaagggg gaatttcaga taaggcagta 2460

tataacgttc taaaaaatag attaatagag cataataata agccattaaa agcttttgct 2520

gaaaaaatat ataaaccact aaaaaatggt acaaacggtg caataattag gagtattcga 2580

gttgagacac catcatatac aggagtattc agaaatgaag gaaaggggat atctgataat 2640

tccttaatgg ttagggttga tgtatttaag aaaaaagata agtattacct tgtgccaata 2700

tatgtagcac atatgataaa aaaagagtta ccttcgaaag ctatagttcc tctgaaacct 2760

gaatctcaat gggagttaat tgatagtact catgaatttc ttttttcact ataccaaaat 2820

gattaccttg ttataaaaac taaaaagggt ataactgagg gctattatag atcttgccac 2880

aggggtaccg gtagcctgag cctaatgcct cattttgcta ataataagaa tgttaaaata 2940

gatattggag ttaggacagc aataagtatt gaaaaatata atgtggatat acttggtaat 3000

aaaagcatag taaaaggaga accaagacgt gggatggaga aatataatag tttcaaatcc 3060

aactaa 3066

25页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:改善蛋白酶表达的手段和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!