通过天然miRNA的基因组编辑抑制靶基因表达

文档序号：90746 发布日期：2021-10-08 浏览：26次 >En<

阅读说明：本技术 通过天然miRNA的基因组编辑抑制靶基因表达 (Inhibition of target gene expression by genome editing of native mirnas ) 是由刘君涛许建平陈延辉刘志强陈希于 2020-02-26 设计创作，主要内容包括：本发明涉及通过天然miRNA的基因组编辑减少或抑制靶基因表达的方法和组合物。(The present invention relates to methods and compositions for reducing or inhibiting expression of a target gene by genome editing of a native miRNA.)

序列表

以ASCII文本格式的序列表，该序列表是根据37 C.F.R.§1.821提交的，名称为“81815_ST25.txt”，大小为47千字节，于2019年2月26日生成。这个序列表特此通过引用以其披露内容并入本说明书中。

技术领域

本发明涉及通过天然miRNA的基因组编辑减少或抑制靶基因表达的方法和组合物。

背景技术

由含有不完全发夹的较长RNA(前miRNA)转录和加工而成的微小RNA(miRNA)是约20-24个核苷酸的RNA。miRNA可以以转录后的方式精确靶向并减少或抑制其mRNA靶基因的表达(Yu等人.2017,New Phytol.[新植物学家]第216(4)卷,第1002-1017页；Gebert和MacRae 2019,Nature Reviews Molecular Cell Biology[自然分子细胞生物学评论],第20卷,第21-37页)。与小干扰RNA诱导的RNAi相比，miRNA介导的基因表达抑制具有高度特异性和有效性。miRNA已被用于例如通过转基因方法(例如WO 2010/123904)靶向来自病原体的外源RNA，由此人工miRNA是异位过表达的。这种方法可以是有效的；然而，依赖于植物的遗传转化需要大量的转化事件以识别显示出良好表达水平的事件，同时保留受体植物的农艺特性和优势。此外，这些事件被认为是遗传修饰的生物体(GMO)，它们不是被禁止商业化，就是必须经过昂贵和漫长的监管程序才能进入市场。

因此，需要改进依赖于使用miRNA以调节靶基因表达的方法。

发明内容

本披露提供了新颖的靶基因沉默方法，该方法使用基因组编辑将嵌入在天然前miRNA中的20-24核苷酸长天然miRNA核心与源自并旨在与靶基因序列互补的amiRNA核心序列交换。对天然前miRNA的修饰将产生针对其他靶基因转录产物的替代性人工miRNA，从而赋予新颖的表型，例如对有害生物(例如病毒)的新颖的抗性。

本发明提供了一种降低靶基因表达的方法，该方法包括向植物细胞引入核酸酶，该核酸酶能够在编码所述植物细胞的天然前miRNA的基因组位点处定点DNA切割；在所述基因组位点或在所述基因组位点附近使至少一个双链断裂；选择细胞，其中所述至少一个双链断裂已用中间DNA(intervening DNA)修复而替换所述基因组位点；并且减少所述靶基因的表达，其中所述中间DNA编码修饰的前miRNA，所述前miRNA包含与所述靶基因互补的amiRNA核心序列。

在其他优势中，这种方法依赖于基因组编辑技术以精确地并且特异地重新编程天然前miRNA以补充不同的靶基因，这可以导致产生可被视为无GMO的植物，因为该方法实施后，植物基因组中限制不存在外来DNA。

这种方法的另一个优点依赖于能够产生在同一基因座处有一个天然miRNA的拷贝和一个修饰/编辑的miRNA的拷贝的植物。这与杂交作物尤其相关，杂交作物可以之后表达新修饰的miRNA拷贝以靶向不同的目的基因，同时保留天然mRNA的拷贝和其相关的生物学功能。与之前依赖于遗传转化的方法相比，另一个益处在于，最终编辑的植物细胞携带每个miRNA的一个拷贝(天然miRNA的一个拷贝和amiRNA的一个拷贝)，而根据现有技术方法获得的植物细胞携带每个版本的miRNA的两个拷贝(天然miRNA的两个拷贝和amiRNA的两个拷贝)，其对植物细胞代谢的要求更高并且可能会影响植物的性能。

在另一个实施例中，本发明涉及根据前述实施例中所述的方法，其中所述靶基因是外源靶基因，更优选地是有害生物基因，更优选地是病毒、真菌或微生物基因。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述靶基因是布尼亚病毒属(Bunyavirales)基因，优选地是番茄斑萎病毒属(tospovirus)基因，更优选地是番茄斑萎病毒(tomato spotted wilt virus，TSWV)基因。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述靶基因是内源植物基因。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述靶内源植物基因是参与植物发育、生物或非生物胁迫的基因。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述植物细胞是茄科植物、玉米、水稻、卡诺拉油菜(canola)、大豆或向日葵细胞。在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述植物细胞是番茄细胞。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述编码天然前miRNA的基因组位点编码天然番茄前miRNA。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述基因组位点包含SEQ ID NO:6或SEQ ID NO:7。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述中间DNA包含SEQ ID NO:1至5中的任一个。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述核酸酶选自由以下组成的组：兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9/Cpf1-胞嘧啶脱氨酶、嵌合Cas9/Cpf1-腺嘌呤脱氨酶、嵌合FEN1-FokI、和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述细胞具有单倍体、二倍体、多倍体或六倍体基因组。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述细胞对于修饰的前miRNA是杂合的。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中一个或多个指导序列与所述核酸酶一起引入。

在另一个实施例中，本发明涉及植物细胞，优选地是茄科植物、玉米、水稻、卡诺拉油菜、大豆或向日葵细胞，更优选地是通过前述实施例中任一项所述的方法获得的番茄植物细胞。

在另一个实施例中，本发明涉及根据前述实施例中所述的植物细胞，其中所述细胞包含SEQ ID NO:1-5中的任一个。

在另一个实施例中，本发明涉及根据前述实施例中所述的植物细胞，其中所述细胞包含SEQ ID NO:8-17中的任一个。

在另一个实施例中，本发明涉及一种生产植物种子的方法，优选地是茄科植物、玉米、水稻、卡诺拉油菜、大豆或向日葵种子，更优选地是番茄种子，所述方法包括将包含通过前述实施例中任一项所述的方法获得的植物细胞的植物与其自身或与相同作物的另一植物杂交。

附图说明

图1示出了通过将天然miRNA核心交换为与新靶基因互补的amiRNA核心来修饰天然前miRNA的图示。

图2示出了具有不同过表达病毒amiRNA核心序列的本氏烟(Nicotianabenthamiana)植物对TSWV的抗性水平。

图3示出了具有不同过表达病毒amiRNA核心序列的TSWV浸润的本氏烟植物的图片。

图4示出了本氏烟植物中TSWV抗性的水平，这些本氏烟植物具有不同的天然前miRNA序列，这些序列由SEQ ID NO:2的病毒amiRNA核心修饰。

图5示出了用于本氏烟植物中的瞬态试验的二元载体17839(SEQ ID NO:18)。

图6示出了用于番茄转化的二元载体24598(SEQ ID NO:19)，其具有由组成型prAtEF1aA1-02启动子驱动的大豆密码子优化的Cas9和由prAtU6-01和prSlU6驱动的两个基因特异性gRNA，以突变番茄SlmiR156b基因(SEQ ID NO:6)。

序列表中的序列简述

SEQ ID NO:1是amiTSWV_N1w_PC的TSWV序列(在本发明的上下文中用作amiRNA核心)

SEQ ID NO:2是amiTSWV_N2_PC的TSWV序列(在本发明的上下文中用作amiRNA核心)

SEQ ID NO:3是amiTSWV_N2_PC_rev的TSWV序列(在本发明的上下文中用作amiRNA核心)

SEQ ID NO:4是amiR159a_3p_N_GC35的TSWV序列(在本发明的上下文中用作amiRNA核心)

SEQ ID NO:5是amiR159a_3p_N_GC50的TSWV序列(在本发明的上下文中用作amiRNA核心)

SEQ ID NO:6是miR156b的番茄序列，包括1kb启动子(在本发明的上下文中用作前miRNA支架)

SEQ ID NO:7是miR1919b的番茄序列，包括1kb启动子(在本发明的上下文中用作前miRNA支架)

SEQ ID NO:8-12分别为嵌入SEQ ID NO:6中的SEQ ID NO:1、2、3、4或5

SEQ ID NO:13-17分别为嵌入SEQ ID NO:7中的SEQ ID NO:1、2、3、4或5

SEQ ID NO:18是二元载体17839的核苷酸序列

SEQ ID NO:19是二元载体24598的核苷酸序列。

SEQ ID NO:20和21是gRNA序列。

SEQ ID NO:22是amiTSWV_N1w_PC_rev的TSWV序列(在本发明的上下文中用作amiRNA核心)

SEQ ID NO:23是amiR159a_3p_N_GC35_rev的TSWV序列(在本发明的上下文中用作amiRNA核心)

SEQ ID NO:24是amiR159a_3p_N_GC50的TSWV序列(在本发明的上下文中用作amiRNA核心)

具体实施方式

本说明不旨在是可以实施本发明的所有不同方式，或可以添加到本发明中的所有特征的详细目录。例如，关于一个实施例所说明的特征可以并入其他实施例中，并且关于一个特定实施例所说明的特征可以从那个实施例删除。此外，鉴于本披露内容，本文建议的不同实施例的众多变化以及附加对于本领域技术人员是显而易见的，这不脱离本发明。因此，以下说明旨在阐述本发明的一些特定实施例，并且并没有穷尽地叙述其所有排列、组合和变化。

除非另外定义，本文所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在本文的发明的说明中使用的术语是仅出于描述特定实施例的目的，且并不旨在限制本发明。本文提及的所有出版物、专利申请、专利以及其他参考文献通过引用以其全文并入本文。

提供下面的定义和方法以便更好地定义本发明并且在本发明的实践中指导本领域的普通技术人员。除非另外说明，本文使用的术语应该根据相关领域的那些一般技术人员的常规用法来理解。分子生物学中的一般术语的定义也可在Rieger等人，Glossary of Genetics:Classical and Molecular[遗传学词汇表：标准和分子]，第5版，Springer-Verlag,New York[施普林格出版社：纽约]，1994中找到。

如在本发明的实施例的说明和所附权利要求中所使用的，单数形式“一个/一种(a/an)”和“该(the)”旨在也包括复数形式，除非上下文清楚地另外指明。

如本文使用的，“和/或”是指并且涵盖相关列出项目中的一个或多个的任何和所有可能的组合。

如本文使用的术语“约”当指代可测量的值如化合物的量、剂量、时间、温度等时意指涵盖指定量的20％、10％、5％、1％、0.5％、或甚至0.1％的变化。

术语“包含(comprise、comprises和/或comprising)”当在本说明书中使用时，指明所列举特征、整体、步骤、操作、元件、和/或组分的存在，但是不排除一种或多种其他特征、整体、步骤、操作、元件、组分、和/或其组的存在或添加。

如本文使用的，过渡短语“基本上由……组成”意指权利要求的范围将被解释为涵盖该权利要求中所提到的指定材料或步骤以及不实质上影响要求保护的发明的一个或多个基本特征和新特征的那些材料或步骤。因此，当用于本发明的权利要求中时，术语“基本上由……组成”并不旨在被解释为等同于“包含(comprising)”。

如本文使用的，术语“扩增的”意指使用至少一种核酸分子作为模板，构建核酸分子的多个拷贝或与该核酸分子互补的多个拷贝。参见例如Diagnostic MolecularMicrobiology:Principles and Applications[诊断分子微生物学：原理与应用]，D.H.Persing等人编著，American Society for Microbiology[美国微生物学会]，华盛顿哥伦比亚特区(1993)。扩增产物被称为扩增子。

“编码序列”是转录成RNA(例如mRNA、rRNA、tRNA、snRNA、有义RNA或反义RNA)的核酸序列。在一些实施例中，该RNA随后在生物体内被翻译以产生蛋白质。

如在此所使用的术语转基因的“事件”是指一种通过用异源DNA(例如，包括一个或多个目的基因(例如，转基因)的表达盒)转化和再生单个植物细胞而产生的重组植物。术语“事件”是指包含异源DNA的原始转化体和/或该转化体的子代。术语“事件”也是指通过该转化体和另一种品系之间进行有性远交(outcross)而产生的子代。即使在重复回交至一个轮回亲本后，来自该转化的亲本的插入DNA和侧翼DNA存在于在该杂交子代的同样的染色体位置。通常，植物组织的转化产生多个事件，每个上述事件代表DNA构建体插入至植物细胞的基因组中的不同位置中。基于转基因或其他期望的特征的表达，选择特定的事件。因而，如在此所使用的“事件MIR604”、“MIR604”或“MIR604事件”意指原始的MIR604转化体和/或MIR604转化体的子代(美国专利号7,361,813；7,897,748；8,354,519和8,884,102，通过引用结合在此)。

如本文使用的“表达盒”意指能够在适当的宿主细胞中指导特定的核苷酸序列表达的核酸分子，该核酸分子包括可操作地连接至目的核苷酸序列(典型地是编码区)的启动子，该核苷酸序列可操作地连接至终止信号。它还典型地包含适当翻译该核苷酸序列所需要的序列。该编码区通常对目的蛋白质进行编码，但是还可以在正义或反义方向上对目的功能性RNA(例如反义RNA或非翻译RNA)进行编码。表达盒还可以包含在指导目的核苷酸序列表达中不需要的序列，但是其因为用于将表达盒从表达载体移除的方便的限制性位点而存在。包含目的核苷酸序列的表达盒可以是嵌合的，意味着至少一个它的组分相对于至少一个它的其他组分是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而，通常表达盒相对于宿主来说是异源的，即表达盒的特定核酸序列在宿主细胞中不是天然存在的，并且必须已经通过本领域已知的转化方法引入至宿主细胞或宿主细胞的祖先中。在该表达盒中核苷酸序列的表达可以是在组成型启动子或诱导型启动子的控制之下，该启动子只有当该宿主细胞暴露于一些特定的外界刺激时才引发转录。在多细胞生物体(例如植物)的情况下，该启动子对于特定组织、或器官、或者发育阶段也可以是特异的。当被转化进植物中时，表达盒或其片段也可被称为“插入的序列”或者“插入序列”。

“基因”是位于基因组内的限定区域，并且除了前述的编码核酸序列之外，它还包括其他负责控制该编码部分的表达(也就是转录和翻译)的主要调节性核酸序列。基因可以包括编码区和非编码区(例如、内含子、调节元件、启动子、增强子、终止序列和5'和3'非翻译区)二者。基因典型地表达mRNA、功能性RNA、或特异性蛋白，包括调节序列。基因可能或可能不能用于产生功能性蛋白质。在一些实施例中，基因仅指编码区。术语“天然基因”是指如在自然界中发现的基因。术语“嵌合基因”是指包含以下各项的任何基因：1)DNA序列，包括在自然界中未一起发现的调节序列和编码序列，或2)编码不天然邻接的蛋白的部分的序列，或3)不天然邻接的启动子的部分。因此，嵌合基因可以包括从不同来源得到的调节序列和编码序列，或包括从相同来源得到的、但以与在自然界中所发现的不同的方式进行安排的调节序列和编码序列。基因可以是“分离的”，分离的基因意为一种核酸分子，其基本上(substantially或essentially)不含正常情况下发现与其天然状态时的核酸分子相关的组分。此类组分包括其他细胞材料、来自重组产物的培养基、和/或在化学合成该核酸分子中所使用的多种化学品。

关于多核苷酸编码序列的术语“表达(express或expression)”，意指该序列被转录，并且任选被翻译。

“目的基因”、“目的核苷酸序列”或“目的序列”是指当转移至植物时，在该植物上赋予所希望的特征(例如抗生素抗性、病毒抗性、昆虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、改进的营养价值、改进的工业过程的性能或者改变的繁育能力)的任何基因。“目的基因”还可以是被转移至植物用于在该植物中产生商业上有价值的酶或代谢物的基因。

如本文使用的，“外源的”是指与其引入的宿主细胞天然不相关的核酸分子或核苷酸序列，该序列来源于另一种物种或来自相同物种或生物体，但是从其原始形式或主要在细胞中表达的形式进行了修饰，包括天然存在的核酸序列的非天然存在的多个拷贝。因此，源自与将其引入的细胞所属的生物体或物种不同的生物体或物种的核苷酸序列相对于那个细胞或细胞的子代而言是异源的。另外，异源核苷酸序列包括一种核苷酸序列，该核苷酸序列源自并插入相同的天然原始细胞类型，但是却以非天然状态存在，例如，以不同拷贝数目存在，和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。核酸序列还可以异源于与其相关的其他核酸序列，例如在核酸构建体中，例如像表达载体。作为一个非限制性实例，启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中，这些调节元件和/或编码序列不与那个特定启动子相关地天然存在，即它们与该启动子是异源的。

“同源”核酸序列是与其被引入的宿主细胞天然相关联的核酸序列。同源核酸序列还可以与其他核酸序列天然相关的核酸序列，这些其他核酸序列可以例如存在于核酸构建体中。作为一个非限制性实例，启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中，这些调节元件和/或编码序列与那个特定启动子相关地天然存在，即它们与该启动子是同源的。

“可操作地连接”是指在一个单个核酸序列上核酸序列的关联，这样使得一个的功能影响另一个的功能。例如，当一个启动子能够影响编码序列或者功能RNA的表达时(即该编码序列或功能RNA处于该启动子的转录控制之下)，则该启动子与该编码序列或者功能RNA是可操作地连接的。正义方向或者反义方向的编码序列能够与调节序列可操作地连接。因此，可操作地与核苷酸序列相关的调节或控制序列(例如，启动子)能够影响核苷酸序列的表达。例如，与编码GFP的核苷酸序列可操作地连接的启动子将能够影响该GFP核苷酸序列的表达。

控制序列不需要与目的核苷酸序列相邻，只要它们起到指导其表达的作用。因此，例如，介入未翻译的、已转录的序列可以在启动子与编码序列之间存在，并且该启动子序列仍可以被认为“可操作地连接至”该编码序列上。

如本文使用的“引物”是分离的核酸，它们通过核酸杂交被退火为互补靶DNA链，以在该引物与该靶DNA链之间形成杂交，然后通过一种聚合酶(如DNA聚合酶)沿着该靶DNA链延长。引物对或引物组可以用于核酸分子的扩增，例如通过聚合酶链式反应(PCR)或者其他核酸扩增方法。

“探针”是互补于靶核酸分子的一部分的分离的核酸分子，并且典型地用于检测和/或定量靶核酸分子。因此，在一些实施例中，探针可以是可检测部分或报道基因附接到的分离的核酸分子，如放射性同位素、配体、化学发光剂、荧光剂或酶。根据本发明的探针不仅可以包括脱氧核糖核酸或核糖核酸，还包括与靶核酸序列特异性结合并且可以用于检测该靶核酸序列的存在或定量该靶核酸序列的量的聚酰胺类以及其他探针材料。

设计TaqMan探针，使得其在由特定引物组扩增的DNA区域内退火。由于Taq聚合酶延伸引物并从互补链的3'至5'的单链模板合成新生链，所以聚合酶的5'至3'外切核酸酶通过探针延伸新生链，并且因此降解已经退火到模板的探针。探针的降解从其中释放荧光团，并打破了与淬灭剂的紧密相接，从而减轻了淬灭效应并允许荧光团的荧光。因此，在定量PCR热循环仪中检测到的荧光与释放的荧光团和PCR中存在的DNA模板的量成正比。

引物和探针的长度一般在5和100个核苷酸或更多核苷酸之间。在一些实施例中，引物和探针的长度可以为至少20个核苷酸或更多，或至少25个核苷酸或更多，或长度至少30个核苷酸或更多。这些引物和探针在本领域已知的最佳杂交条件下与靶序列特异性杂交。根据本发明的引物和探针可以具有与该靶序列互补的完整序列，虽然与该靶序列不同并保留与该靶序列杂交的能力的探针可通过根据本发明的常规方法进行设计。

用于制备和使用探针和引物的方法描述于例如Molecular Cloning:A Laboratory Manual[分子克隆：实验室手册],第2版,第1-3卷,Sambrook等人编辑,ColdSpring Harbor Laboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],纽约州,1989中。PCR引物对可以源自已知序列，例如通过使用旨在用于该目的的计算机程序。

聚合酶链式反应(PCR)是一种用于“扩增”特定DNA片段的技术。为了进行PCR，必须知道待复制的DNA分子的核苷酸序列的至少一部分。通常，使用与待扩增的DNA的每条链的3'端处的核苷酸序列(已知序列)互补(例如，基本互补或完全互补)的引物或短寡核苷酸。将DNA样品加热以分离其链，并与这些引物混合。这些引物与其DNA样品中的互补序列杂交。使用原始DNA链作为模板开始合成(5'至3'方向)。该反应混合物必须包含全部四种脱氧核苷酸三磷酸(dATP、dCTP、dGTP和dTTP)和DNA聚合酶。聚合继续进行，直到每条新合成的链已经进行得足够远以包含被另一个引物识别的序列。一旦发生这种情况，就会产生与原始分子相同的两个DNA分子。将这两个分子加热以分离其链，并重复该过程。每个循环使DNA分子的数量加倍。使用自动化设备，每个循环的复制可以在不到5分钟内完成。30个循环后，以DNA单分子开始的扩增已经超过10亿个拷贝(2³⁰＝1.02x 10⁹)。

寡核苷酸引物对的寡核苷酸互补于位于相对DNA链上和待扩增区域侧翼的DNA序列。退火引物与新合成的DNA链杂交。第一个扩增循环将导致两条新的DNA链，其5’端通过寡核苷酸引物的位置固定，但其3’端是可变的(‘不规则的’3’端)。两条新链可以依次充当用于合成所希望的长度的互补链的模板(5’端由引物定义并且3’端是固定的，因为合成不能超过相反引物的末端)。几个循环后，所希望的固定长度产品开始占主导地位。

定量聚合酶链式反应(qPCR)(也称为实时聚合酶链式反应)实时监测来自PCR反应的DNA产物的积累。qPCR是基于聚合酶链式反应(PCR)的分子生物学实验室技术，它用于扩增并且同时定量靶DNA分子。可以在PCR中扩增和检测特定序列的甚至一个拷贝。PCR反应以指数方式生成DNA模板的拷贝。这导致起始靶序列的量和在任何特定循环下累积的PCR产物的量之间的定量关系。由于与模板、试剂限制或焦磷酸盐分子的积累一起发现的聚合酶反应的抑制剂，所以PCR反应最终停止以指数速率生成模板(即平台期)，使得PCR产物的终点定量不可靠。因此，重复的反应可以生成可变量的PCR产物。只有在PCR反应的指数期期间才有可能回推以便确定模板序列的起始量。PCR产物积累时的测量(即实时定量PCR)允许在反应的指数期进行定量，并且因此消除与常规PCR相关的变异性。在实时PCR测定中，通过荧光信号积累来检测阳性反应。对于DNA样品中的一个或多个特异性序列，定量PCR能够进行检测和定量二者。数量可以是拷贝的绝对数量或是当归一化到DNA输入或额外的归一化基因时的相对量。从实时PCR的第一次记录以来，它已被用于越来越多的并且不同数量的应用，包括mRNA表达研究、基因组或病毒DNA中的DNA拷贝数测量、等位基因辨别测定、基因的特异性剪接变体的表达分析和石蜡包埋组织中的基因表达以及激光捕获的显微切割细胞。

如在此所使用的，短语“Ct值”是指“循环阈值”，其被定义为“扩增靶标的量达到固定阈值的分数循环数”。在一些实施例中，其表示扩增曲线和阈值线之间的交点。扩增曲线典型地处于“S”形，这表示在给定循环(X轴)处的每个反应(Y轴)的相对荧光的变化，该变化在一些实施例中通过实时PCR仪器在PCR期间记录。在一些实施例中，阈值线是反应达到高于背景的荧光强度处的检测水平。参见Livak和Schmittgen(2001)25Methods[《方法》]402-408。它是PCR中靶标浓度的相对量度。通常，在一些实施例中，对于给定的参考基因，定量测定如qPCR的良好Ct值在10-40的范围内。Ct水平与样品中的靶核酸量成反比(即Ct水平越低，样品中的可检测的靶核酸量越高)。此外，定量测定如qPCR的良好Ct值显示出在成比例稀释靶gDNA的情况下的线性响应范围。

在一些实施例中，在其中可以实时收集Ct值进行定量分析的条件下进行qPCR。例如，在典型的qPCR实验中，在延伸期期间的PCR的每个循环处监测DNA扩增。当DNA处于扩增的对数线性期时，荧光的量通常增加到背景以上。在一些实施例中，在该时间点收集Ct值。

如本文使用的，术语“细胞”是指任何活细胞。该细胞可以是原核细胞或真核细胞。该细胞可以是分离的。该细胞可能能够或可能不能够再生成生物体。该细胞可以是在组织、愈伤组织、培养物、器官、或部分的上下文中。在一些实施例中，该细胞可以是植物细胞。本发明的植物细胞可以处于分离的单细胞形式，或者可以是培养的细胞，或者可以是作为较高级的组织单位(例如像，植物组织或植物器官)的一部分。该植物细胞可以源自被子植物或裸子植物或是它们的一部分。在另外的实施例中，该植物细胞可以是单子叶植物细胞、双子叶植物细胞。该单子叶植物细胞可以是例如玉蜀黍、水稻、高粱、甘蔗、大麦、小麦、燕麦、草皮草、或观赏草细胞。该双子叶植物细胞可以是例如烟草、胡椒、茄子、向日葵、十字花科植物、亚麻、马铃薯、棉花、大豆、甜菜、或油菜细胞。

如在此所使用的术语“植物部分”包括但不限于：胚、花粉、胚珠、种子、叶、茎、芽、花、枝、果实、果仁、穗、穗轴、果壳、茎杆、根、根尖、花药、植物细胞(包括在植物和/或植物的部分中完整的植物细胞)、植物原生质体、植物组织、植物细胞组织培养物、植物愈伤组织、植物团等。如本文使用的，“芽”是指包括叶和茎的地上部分。此外，如本文使用的，“植物细胞”是指植物的结构和生理单位，包括细胞壁并且也可以指原生质体。

在细胞、原核细胞、细菌细胞、真核细胞、植物细胞、植物和/或植物部分的上下文中，术语“引入”(introducing或introduce)意指将核酸分子与该细胞、真核细胞、植物、植物部分和/或植物细胞以这样一种方式相接触，使得该核酸分子得以进入细胞、真核细胞、植物细胞和/或植物和/或植物部分的细胞的内部。在引入多于一种核酸分子的情况下，这些核酸分子可以被装配成单个聚核苷酸或核酸构建体的一部分，或装配成分开的聚核苷酸或核酸构建体，并且可以位于相同或不同的核酸构建体上。因此，可以在单个的转化事件中、在分开的转化事件中、或者例如作为通过常规杂交的育种方案的一部分，将这些多核苷酸引入到植物细胞中。

“倒位”是染色体重排，其中染色体的区段首尾相连。当单个染色体在自身内部发生断裂和重排时，就会发生倒位。染色体“易位”是非同源染色体之间的部分的重排。

如本文使用的，术语“转化”和“转基因”是指包含至少一种重组(例如，异源)多核苷酸的全部或部分的任何细胞、原核细胞、真核细胞、植物、植物细胞、愈伤组织、植物组织、或植物部分。在一些实施例中，将该重组多核苷酸的全部或部分稳定地整合到染色体或稳定的染色体外元件中，以便使得其传递到连续世代。出于本发明的目的，术语“重组多核苷酸”是指已经通过基因工程予以改变、重排或修饰的多核苷酸。实例包括任何克隆的多核苷酸，或与异源序列连接或接合的多核苷酸。术语“重组”不是指因天然存在的事件(如自发突变)或因非自发诱变随后选择性育种而产生的多核苷酸改变。

如本文使用的术语“转化”是指将异源核酸引入细胞中。细胞的转化可以是稳定或瞬时的。因此，本发明的转基因细胞、植物细胞、植物和/或植物部分可以被稳定转化或瞬时转化。术语“转化”可以指将核酸分子转移到宿主细胞的基因组中，导致基因上稳定的遗传。在一些实施例中，引入植物、植物部分和/或植物细胞中是经由细菌介导的转化、粒子轰击转化、磷酸钙介导的转化、环糊精介导的转化、电穿孔、脂质体介导的转化、纳米粒子介导的转化、聚合物介导的转化、病毒介导的核酸递送、晶须介导的核酸递送、微量注射、超声波处理法、浸润法、聚乙二醇介导的转化、原生质体转化或导致向植物、植物部分和/或其细胞引入核酸的任何其他电学、化学、物理和/或生物学机制，或其任何组合进行的。

用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括经由以下方式转化：细菌介导的核酸递送(例如，经由来自农杆菌属的细菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学、化学、物理(机械)和/或生物学机制，包括其任何组合。本领域中已知的各种植物转化方法的一般指南包括Miki等人，(“Procedures for Introducing Foreign DNAinto Plants[将外源DNA引入植物中的程序]”在Plant Molecular Biology and Biotechnology[植物分子生物学和生物技术]的方法中，Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.[CRC出版有限公司]，波卡拉顿，1993)，第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞分子生物学快报]7:849-858(2002))。

农杆菌介导的转化是用于转化植物的常用方法，因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带目的外源DNA的二元载体转移至适当的农杆菌菌株，这可能取决于由宿主农杆菌菌株在共同存在的Ti质粒上或染色体地携带的vir基因的互补体(Uknes等人，1993，Plant Cell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌，一种辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地，可以通过核酸转化将该重组二元载体转移至农杆菌中(和Willmitzer，1988，Nucleic Acids Res.[核酸研究]16:9877)。

通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养，并且遵循本领域熟知的方法。典型地在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。一种转化番茄植物的示例性方法披露在Garcia D.,Narváez-Vásquez J.,Orozco-Cárdenas M.L.(2015)Tomato(Solanum lycopersicum).[番茄(番茄(Solanum lycopersicum))]在：Wang K.(编辑)Agrobacterium Protocols.[土壤杆菌属方案]Methods in Molecular Biology[分子生物学方法],第1223卷.Springer,New York,NY.[施普林格出版社：纽约，纽约州]中。

另一种用于转化植物、植物部分以及植物细胞的方法涉及在植物组织和细胞上推进惰性或生物学活性的粒子。参见例如，美国专利号4,945,050；5,036,006和5,100,792。通常，这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时，可以通过用含有目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地，一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性粒子(例如，干燥的酵母细胞、干燥的细菌或噬菌体，各自包含一个或多个试图被引入的核酸)推进到植物组织中。

在多核苷酸的上下文中，“瞬时转化”意指：将多核苷酸引入细胞中并且没有整合到该细胞的基因组中。

如本文使用的，在被引入细胞中的多核苷酸的上下文中，“稳定引入(stablyintroducing、stably introduced)”、“稳定转化(stable transformation或stablytransformed)”意指：引入的多核苷酸被稳定地整合到该细胞的基因组中，并且因此该细胞用该多核苷酸稳定地转化。因此，整合的多核苷酸能够由其子代继承，更具体地说，由多个连续世代的子代继承。如本文使用的“基因组”包括核和/或质体基因组，并且因此包括多核苷酸到例如叶绿体基因组中的整合。如本文使用的稳定转化还可以是指被保持在染色体外，例如，作为微染色体的多核苷酸。

瞬时转化可以通过例如酶联免疫测定(ELISA)或蛋白质印迹来进行检测，这两种方法可以检测由引入生物体的一个或多个核酸分子编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列(这些序列与引入生物体(例如，植物)中的核酸分子的核苷酸序列特异性地杂交)的DNA印迹杂交测定来进行检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列(这些序列与引入植物或其他生物体的核酸分子的核苷酸序列特异性地杂交)的RNA印记杂交测定来进行检测。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域内熟知的其他扩增反应来进行检测，该反应采用与核酸分子的一个或多个靶序列进行杂交的特异性引物序列，导致该一个或多个靶序列的扩增，这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。

因此，在本发明的具体实施例中，植物细胞可以通过本领域内已知的任何方法并且如本文描述进行转化并且可以使用多种已知技术中的任一种来从这些经转化的细胞再生出完整的植物。在以下文献中描述了从植物细胞、植物组织培养物和/或培养的原生质体进行的植物再生：例如，Evans等人(Handbook of Plant Cell Cultures[植物细胞培养物手册]，第1卷，MacMilan Publishing Co.[麦克米兰出版公司]，纽约(1983))；以及VasilI.R.(编辑)(Cell Culture and Somatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学]，学术出版社，奥兰多，第I卷(1984)和第II卷(1986))。选择转化的转基因植物、植物细胞和/或植物组织培养物的方法在本领域中是常规的，并且可以用于在此提供的本发明的方法中。

“转化和再生过程”是指将转基因稳定地引入植物细胞并从转基因植物细胞再生植物的过程。如本文使用的，转化和再生包括选择过程，通过该过程转基因包括选择性标记，并且转化的细胞已经并入并表达转基因，使得转化的细胞将在选择剂存在下存活并发育繁盛。“再生”是指从植物细胞、一组植物细胞、或植物片(如来自原生质体、愈伤组织、或组织部分的)长成整个植物。

术语“核苷酸序列”、“核酸”、“核酸序列”、“核酸分子”“寡核苷酸”以及“多核苷酸”在此可互换地使用来指核苷酸的杂聚物并且涵盖RNA和DNA二者，包括cDNA、基因组DNA、mRNA、合成的(例如，化学合成的)DNA或RNA以及RNA和DNA的嵌合体。术语核酸分子是指核苷酸链，而不考虑该链的长度。这些核苷酸包含糖、磷酸和碱，该碱是嘌呤或嘧啶。核酸分子可以是双链或单链的。在单链时，核酸分子可以是正义链或反义链。可以使用寡核苷酸类似物或衍生物(例如，肌苷或硫代磷酸核苷酸)合成核酸分子。此类寡核苷酸可以例如用于制备具有改变的碱基配对能力或对核酸酶的增强的抗性的核酸分子。在此提供的核酸序列在此以5'至3'方向从左至右表示，并且使用代表核苷酸字符的标准代码表示，如美国序列规则，37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所述。

“核酸片段”是给定核酸分子的一部分。“RNA片段”是给定的RNA分子的一部分。“DNA片段”是给定的DNA分子的一部分。“核酸区段”是给定的核酸分子的一部分并且并不是从该分子分离的。“RNA区段”是给定的RNA分子的一部分并且并不是从该分子分离的。“DNA区段”是给定的DNA分子的一部分并且并不是从该分子分离的。多核苷酸的区段可以是任何长度，例如长度为至少5、10、15、20、25、30、40、50、75、100、150、200、300或500或更多个核苷酸。指导序列的区段或一部分可以是该指导序列的约50％、40％、30％、20％、10％，例如该指导序列的三分之一或更短，例如长度为7、6、5、4、3、或2个核苷酸。

在分子的上下文中，术语“源自”是指使用亲本分子或来自该亲本分子的信息，分离或制造的分子。例如，Cas9单突变体切口酶和Cas9双突变体无效核酸酶源自野生型Cas9蛋白。

在高等植物中，脱氧核糖核酸(DNA)是遗传物质，而核糖核酸(RNA)涉及将DNA中包含的信息到蛋白中的转移。“基因组”是在生物体的每个细胞中所包含的遗传物质的整体。除非另外表明，本发明的特定的核酸序列还暗示性地涵盖其保守地修饰的变体(例如，简并密码子取代)以及互补序列、以及连同明确地指明的序列。具体地，简并密码子取代可以通过产生如下序列而获得，在这些序列中，一个或多个所选的(或全部)密码子的第三位被混合碱基和/或脱氧肌苷残基取代(Batzer等人,Nucleic Acid Res.[核酸研究]19:5081(1991)；Ohtsuka等人,J.Biol.Chem.[生物化学杂志]260:2605-2608(1985)；和Rossolini等人,Mol.Cell.Probes[分子与细胞探针]8:91-98(1994))。术语核酸分子与基因、cDNA和由基因编码的mRNA可互换使用。

如本文使用的“序列同一性”是指两个最佳比对的多核苷酸或肽序列在组分(例如，核苷酸或氨基酸)的整个比对窗口内不变的程度。“同一性”可以通过已知方法容易地计算出，这些方法包括但不限于以下文献中描述的那些：Computational Molecular Biology[计算分子生物学](Lesk,A.M.,编辑)Oxford University Press[牛津大学出版社],纽约(1988)；Biocomputing:Informatics and Genome Projects[生物计算：信息学和基因组项目](Smith,D.W.,编辑)Academic Press[学术出版社],纽约(1993)；Computer Analysisof Sequence Data[序列数据的计算机分析]，第I部分(Griffin,A.M.和Griffin,H.G.编辑)Humana Press[胡马纳出版社]，新泽西(1994)；Sequence Analysis in Molecular Biology[分子生物学的序列分析])(von Heinje,G.编辑)学术出版社(1987)；和Sequence Analysis Primer[序列分析引物](Gribskov,M.和Devereux,J.编辑)斯托克顿出版社，纽约(1991)。

如本文使用的，术语“序列同一性百分比”或“同一性百分比”是指在最佳比对两个序列时，与测试(“主题”)多核苷酸分子(或其互补链)相比，参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中的同一核苷酸的百分比。在一些实施例中，“同一性百分比”可以是指氨基酸序列中同一氨基酸的百分比。

如本文使用的，在两个核酸分子、核苷酸序列或蛋白质序列上下文中，短语“基本上同一”是指当比较并比对最大对应性时具有至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％核苷酸或氨基酸残基同一性的两个或更多个序列或子序列，如使用以下序列比较算法之一或通过目测检查所测量的。在本发明的一些实施例中，在长度为至少约50个残基至约150个残基的序列区域上存在基本同一性。因此，在本发明的一些实施例中，在长度为至少约50、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、或更多个残基的序列区域上存在实质一致性。在一些具体实施例中，这些序列在至少约150个残基上是基本上同一的。在另外的实施例中，序列在编码区的整个长度上是基本上同一的。此外，在代表性实施例中，基本上同一的核苷酸序列或蛋白序列进行基本上相同的功能(例如指导至具体的基因组靶表、具体的基因组靶位点的内切核酸酶切割)。

对于序列比较，典型地，一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时，将测试序列和参考序列输入到计算机中(若有必要，则指定子序列坐标)，并且指定序列算法程序的参数。然后，该序列比较算法基于所指定的程序参数来计算一个或多个测试序列相对于参考序列的序列同一性百分比。

用于比对比较窗口的最佳序列比对是本领域技术人员所熟知的并且可以由以下工具实施：如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法，并且任选地由这些算法的计算机化实现方式来实施，如作为Wisconsin(材料科学软件公司(Accelrys Inc.)，圣地亚哥，加利福尼亚州)的部分可获得的GAP、BESTFIT、FASTA和TFASTA。测试序列和参考序列的已比对区段的“同一性分数”是由两个已比对序列所共有的同一组分的数目除以参考序列区段(即，完整的参考序列或参考序列的更小限定部分)中组分的总数目。序列同一性百分比被表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是相对于全长多核苷酸序列或其部分，或相对于较长的多核苷酸序列。出于本发明的目的，也可以使用针对翻译的核苷酸序列的2.0版BLASTX和针对多核苷酸序列的2.0版BLASTN确定“同一性百分比”。

用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Centerfor Biotechnology Information)公开地获得。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP)，这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈值(Altschul等人,1990)。这些最初的邻域字命中点作为种子，用于启动搜索以找到包含它们的更长的HSP。然后，将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列，使用参数M(对于一对匹配残基的奖赏得分；总是>0)和N(对于错配残基的罚分；总是<0)来计算累积得分。对于氨基酸序列，使用评分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X；由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下；或者到达任一序列的末端时，停止字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M＝5、N＝-4、以及两条链的比较作为默认值。对于氨基酸序列，BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:10915(1989))。

除了计算序列同一性百分比之外，BLAST算法还进行两个序列之间相似性的统计分析(参见，例如Karlin和Altschul,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N))，它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如，如果在测试核苷酸序列与参考核苷酸序列的比较中的最小概率总和小于约0.1至小于约0.001，则该测试核酸序列被认为是与该参考序列相似的。因此，在本发明的一些实施例中，在测试核苷酸序列与参考核苷酸序列的比较中的最小概率总和小于约0.001。

当两个核苷酸序列在严格条件下彼此杂交时，这两个核苷酸序列也可以被认为是基本上同一的。在一些代表性实施例中，被认为基本上同一的两个核苷酸序列在高严格条件下彼此杂交。

在核酸杂交实验(如DNA杂交和RNA杂交)的上下文中，“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的，并且在不同的环境参数下是不同的。对核酸杂交的广泛指导见于以下：Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第I部分“Overview of principles of hybridization and the strategy ofnucleic acid probe assays[杂交原理和核酸探针测定策略综述]”Elsevier[爱思唯尔],纽约(1993)。通常，高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(T_m)低约5℃。

T_m是50％的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于特定探针的T_m。用于互补核苷酸序列(它们在DNA或RNA印迹中在滤器上具有超过100个互补残基)的杂交的严格杂交条件的一个实例是在42℃下具有1mg肝素的50％甲酰胺，其中杂交是过夜进行的。高严格洗涤条件的一个实例是0.15MNaCl，在72℃持续约15分钟。严格洗涤条件的实例是在65℃以0.2x SSC洗涤持续15分钟(参见Sambrook，下文，针对SSC缓冲液的描述)。通常，高严格洗涤之前会先进行低严格洗涤，以去除背景探针信号。对于例如多于100个核苷酸的双链体的中严格洗涤的实例是在45℃以1x SSC持续15分钟。对于例如多于100个核苷酸的双链体的低严格性洗涤的一个实例是在40℃下以4-6xSSC进行15分钟。对于短探针(例如，约10至50个核苷酸)，严格条件典型地涉及小于约1.0M的Na离子的盐浓度，典型地在pH 7.0至8.3下约0.01至1.0M的Na离子浓度(或其他盐)，并且温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言，在特定的杂交测定中相比于不相关的探针观察到的高出2x(或更高)的信噪比表明检测到特异性杂交。如果在严格条件下彼此不杂交的核苷酸序列所编码的蛋白质是基本上同一的，则这些核苷酸序列仍然是基本上同一的。例如，当使用遗传密码所允许的最大密码子简并性来生成核苷酸序列的拷贝时，这种情况可能发生。

以下是可以用来克隆同源核苷酸序列(这些序列是与本发明的参考核苷酸序列基本上同一的)的杂交/洗涤条件的设置的实例。在一个实施例中，参考核苷酸序列在50℃在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中与“测试”核苷酸序列杂交，同时在50℃在2X SSC、0.1％SDS中洗涤。在另一个实施例中，参考核苷酸序列在50℃在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中与“测试”核苷酸序列杂交，同时在50℃在1X SSC、0.1％SDS中洗涤；或者在50℃在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中杂交，同时在50℃在0.5X SSC、0.1％SDS中洗涤。在仍另外的实施例中，参考核苷酸序列在50℃在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中与“测试”核苷酸序列杂交，同时在50℃在0.1X SSC、0.1％SDS中洗涤；或者在50℃在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mMEDTA中杂交，同时在65℃在0.1X SSC、0.1％SDS中洗涤。

“分离的”核酸分子或核苷酸序列或“分离的”多肽是借助于人的手脱离其天然环境存在的和/或当与其在其天然环境中的功能相比时具有不同的、修饰的、调节的和/或改变的功能的并且因此不是天然的产物的核酸分子、核苷酸序列或多肽。分离的核酸分子或分离的多肽能以纯化形式存在或可以存在于非天然环境(例如像重组宿主细胞)中。因此，例如，相对于多核苷酸而言，术语分离的意指将该多核苷酸从它天然存在于其中的染色体和/或细胞中分离出。如果将一种多核苷酸从它天然存在于其中的染色体和/或细胞中分离出并且然后将其插入它并不天然存在于其中的遗传背景、染色体、染色体位置、和/或细胞中，则该多核苷酸也是被分离的。本发明的重组核酸分子和核苷酸序列可以被认为是如上文所定义的“分离的”。

因此，“分离的核酸分子”或“分离的核苷酸序列”是核酸分子或核苷酸序列，该核酸分子或核苷酸序列不与在其衍生而来的生物体的天然存在的基因组中的与其邻近的核苷酸序列(位于5'端的序列或位于3’端的序列)相邻。因此，在一个实施例中，一个分离的核酸包括一些或全部的5'非编码(例如，启动子)序列，这些序列紧接编码序列。因此，该术语包括，例如，重组核酸，该重组核酸并入载体、并入自我复制的质粒或病毒、或并入原核生物或真核生物的基因组DNA，或者它作为独立于其他序列的单独分子(例如，cDNA或通过PCR或限制性内切核酸酶处理而得到的基因组DNA片段)而存在。它也包括作为编码额外多肽或肽序列的杂合核酸分子的部分的重组核酸。“分离的核酸分子”或“分离的核苷酸序列”还可以包括以下核苷酸序列，该核苷酸序列源自并插入相同的天然原始细胞类型，但是却以非天然状态存在，例如，以不同拷贝数目存在，和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。

术语“分离的”可以进一步指核酸分子、核苷酸序列、多肽、肽或片段，它们实质上不含细胞材料、病毒材料、和/或培养基(例如，当通过重组DNA技术生产时)、或化学前体或其他化学品(例如，当进行化学合成时)。另外，“分离的片段”是不作为片段天然存在并且不会在天然状态下如此存在的核酸分子、核苷酸序列或多肽的片段。“分离的”不必须意味着该制备是工业纯的(同质的)，但是它是足够纯的以提供处于一种可以用于预期目的形式的多肽或核酸。

在本发明的代表性实施例中，“分离的”核酸分子、核苷酸序列和/或多肽具有是至少约5％、10％、15％、20％、25％、30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、97％、98％、99％纯(w/w)或更纯。在其他实施例中，“分离”的核酸、核苷酸序列和/或多肽表示与起始材料相比，实现所述核酸的至少约5倍、10倍，25倍、100倍、1000倍、10,000倍、100,000-倍或更大富集(w/w)。

“野生型”核苷酸序列或氨基酸序列是指天然存在(“天然”)或内源核苷酸序列或氨基酸序列。因此，例如，“野生型mRNA”是天然存在于生物体中的或对生物体来说是內源性的mRNA。“同源”核苷酸序列是与它被引入的宿主细胞天然相关的核苷酸序列。

术语“开放阅读框”和“ORF”是指在编码序列的翻译起始和终止密码子之间编码的氨基酸序列。术语“起始密码子”和“终止密码子”是指在编码序列中三个相邻的核苷酸(“密码子”)的一个单位，它对应地指明蛋白合成(mRNA翻译)的起始和链终止。

“启动子”是指核苷酸序列，通常在它的编码序列的上游(5')，它通过提供对适当的转录所需的RNA聚合酶以及其他因子的识别来控制该编码序列的表达。“启动子调节序列”由近端和更远端上游元件组成。启动子调节序列影响相关编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括增强子、启动子、非翻译的前导序列、内含子、以及聚腺苷酸化信号序列。它们包括自然序列以及合成序列、连同可能是合成序列与自然序列的组合的序列。“增强子”是一个DNA序列，它可以刺激启动子的活性并且可以是该启动子或插入的异源元件的一个固有元件以增强一种启动子的水平或组织特异性。它能够在两个方向(正常或翻转)上进行操作，并且甚至当移动到该启动子的上游或下游时还能够发挥作用。术语“启动子”的含义包括“启动子调节序列”。

“初级转化株”以及“E0世代”是指与最初转化(即，自从转化起未经历减数分裂以及受精)的组织具有相同遗传世代的转基因植物。“次级转化株”以及“E1、E2、E3等世代”是指经由一个或多个减数分裂以及受精循环而源自初级转化株的转基因植物。它们可以通过初级或次级转化株的自体受精或初级或次级转化株与其他转化或未转化植物的杂交衍生的。

“转基因”是指核酸分子，该核酸分子已经通过转化被引入该基因组中并且被稳定地保持。转基因可以包括至少一个表达盒，典型地包括至少两个表达盒，并且可以包括十个或更多个表达盒。转基因可以包括例如对于待转化的特定植物的基因而言是异源的或者是同源的基因。此外，转基因可以包括被插入非天然生物体中的天然基因，或嵌合基因。术语“内源基因”是指在生物体的基因组中在它的天然位置中的天然基因。“外源”基因是指正常在宿主生物体中未发现但通过基因转移被引入该生物体中的基因。

“内含子”是指几乎唯一地在真核基因中发生的DNA的内插区段，但该内插区段在该基因产物中没有被翻译成氨基酸序列。通过一个称为剪接的过程从未成熟的mRNA中去除这些内含子，该剪接使外显子未被触及，从而形成mRNA。出于本发明的目的，术语“内含子”的定义包括对源自靶基因的内含子的核苷酸序列进行修饰，条件是该修饰过的内含子没有显著地降低其关联的5’调节序列的活性。

“外显子”是指携带蛋白或其一部分的编码序列的DNA的区段。外显子被内插的、非编码序列(内含子)分离。出于本发明的目的，术语“外显子”的定义包括对源自靶基因的外显子的核苷酸序列进行修饰，条件是该修饰过的外显子没有显著地降低它的关联的5’调节序列的活性。

术语“切割(cleavage或cleaving)”是指多核苷酸的核糖基磷酸二酯主链中的共价磷酸二酯键联的断裂。术语“切割(cleavage或cleaving)”涵盖单链断裂和双链断裂二者。作为两次不同的单链切割事件的结果，可以发生双链切割。切割可以导致产生平末端或交错末端。“核酸酶切割位点”或“基因组核酸酶切割位点”是包括核酸酶切割序列的核苷酸区域，该核酸酶区域由特异性核酸酶识别，该核酸酶用于切割一条或两条链中基因组DNA的核苷酸序列。由核酸酶的这种切割引发了细胞内的DNA修复机制，它建立了同源重组发生的环境。

“供体分子”或“供体序列”是旨在用于在靶多核苷酸(典型地靶基因组位点)处进行插入的核苷酸聚合物或低聚物。供体序列可以是一个或多个目的转基因、表达盒、或核苷酸序列。供体分子可以是供体DNA分子，是单链的、部分双链的、或双链的。供体多核苷酸可以是天然的或修饰的多核苷酸，RNA-DNA嵌合体，或DNA片段，单链的、或至少部分双链的、或完全双链的DNA分子，或PGR扩增的ssDNA，或至少部分dsDNA片段。在一些实施例中，供体DNA分子是环化DNA分子的一部分。完全双链的供体DNA是有利的，因为它可能提供增加的稳定性，因为与ssDNA相比，对于核酸酶降解，dsDNA片段通常更具有抗性。在一些实施例中，供体多核苷酸分子可以包含至少约100、150、200、250、300、250、400、450、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、7500、10000、15,000或20,000个核苷酸，包括此范围内的未在此明确叙述的任何值。在一些实施例中，供体DNA分子包含异源核酸序列。在一些实施例中，供体DNA分子包含至少一个表达盒。在一些实施例中，供体DNA分子可以包含转基因，该转基因包含至少一个表达盒。在一些实施例中，供体DNA分子包含原于靶基因组的基因的等位基因修饰。该等位基因修饰可以包含至少一个核苷酸插入、至少一个核苷酸缺失、和/或至少一个核苷酸取代。在一些实施例中，该等位基因修饰可以包含插入缺失(INDEL)。在一些实施例中，供体DNA分子包含与靶基因组位点同源的臂。在一些实施例中，供体DNA分子包含与基因组核酸序列具有至少90％同一性的至少100个连续核苷酸，并且任选地可以进一步包含异源核酸序列，例如转基因。在一些实施例中，“供体DNA分子”是“中间DNA”。

如本文使用的，关于本发明的一个或多个核苷酸序列的术语“邻近的(vicinity或proximal)”或“与……邻近(vicinity of或proximal to)”意指紧邻或由从约1个碱基至约2000个碱基(例如，1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100、200、250、300、350、400、450、500、750、1000、1500、或2000个碱基)分隔，包括包含在该范围内但未在此明确叙述的任何值。

“微小RNA”(缩写为miRNA)是在植物、动物和一些病毒中发现的小的非编码RNA分子(含有约20和约24个核苷酸，通常约22个核苷酸)，其功能是RNA沉默和基因表达的转录后调节。miRNA基因通常由RNA聚合酶II(Pol II)转录。聚合酶经常与DNA序列附近发现的启动子结合，编码将成为前miRNA的发夹环。所得的转录本在5'末端用特别修饰的核苷酸封端，用多个腺苷(poly-A尾)多聚腺苷酸化，并剪接。

“前miRNA”是具有茎环结构的miRNA前体，去除了5'帽和3'ploy-A。它是帮助产生miRNA的天然结构。有时这个术语用于将其与成熟的miRNA(介于约20到约24个核苷酸之间，通常为约22个核苷酸序列)区分开来。以这种方式意指结构，而不是最终的功能性短序列。术语“miRNA支架”或“miRNA主链”在本发明的上下文中同样用于指代前miRNA结构。

如本文所用，术语“amiRNA”(人工miRNA)通常指其核心序列(成熟miRNA序列和相应的miRNA*序列)被“amiRNA核心”序列取代的天然miRNA支架，以将靶向(沉默)重新定向至新基因。术语“amiRNA核心”是指这种方法的人工(设计的)部分，与新靶基因互补的约20至24个核苷酸短序列。在此背景下，术语互补指的是amiRNA结合靶RNA分子的能力。在一些实施例中，amiRNA核心与新的靶基因分子90％互补，并保留其结合靶RNA分子的能力。

如本文使用的，术语“指导RNA”或“gRNA”通常是指可以与CRISPR系统效应物(如Cas或Cpf1蛋白)结合并帮助将Cas或Cpf1蛋白靶向靶多核苷酸(例如DNA)内的特定位置的RNA分子(或总RNA分子的组)。本发明的指导RNA可以是工程化的单RNA分子(sgRNA)，其中例如sgRNA包含crRNA区段和任选的tracrRNA区段。本发明的指导RNA也可以是双指导系统，其中crRNA和tracrRNA分子是物理上不同的分子，然后相互作用形成双链体，用于募集CRISPR系统效应物(如Cas9)，并用于将该蛋白质靶向靶多核苷酸。

如本文使用的，术语“crRNA”或“crRNA区段”是指RNA分子或RNA分子的部分，其包括多核苷酸靶向指导序列、参与蛋白质结合的茎干序列(stem sequence)和任选的3'-突出端序列。多核苷酸靶向指导序列是与靶DNA中的序列互补的核酸序列。此多核苷酸靶向指导序列也称为“前间隔序列”。换句话说，靶向crRNA分子的指导序列的多核苷酸以序列特异性方式，经由杂交(即碱基配对)与靶DNA相互作用。如此，crRNA分子的多核苷酸靶向指导序列的核苷酸序列可以变化，并且决定了指导RNA和靶DNA将发生相互作用的靶DNA内的位置。

crRNA分子的多核苷酸靶向指导序列可以被修饰(例如通过基因工程)，从而与靶DNA内的任何所希望的序列杂交。本发明的crRNA分子的多核苷酸靶向指导序列可以具有从约12个核苷酸至约100个核苷酸的长度。例如，crRNA的多核苷酸靶向指导序列可以具有以下长度：从约12个核苷酸(nt)至约80个nt、从约12个nt至约50个nt、从约12个nt至约40个nt、从约12个nt至约30个nt、从约12个nt至约25个nt、从约12个nt至约20个nt、或从约12个nt至约19个nt。例如，crRNA的多核苷酸靶向指导序列可以具有从约17个nt至约27个nt的长度。例如，crRNA的多核苷酸靶向指导序列可以具有以下长度：从约19个nt至约20个nt、从约19个nt至约25个nt、从约19个nt至约30个nt、从约19个nt至约35个nt、从约19个nt至约40个nt、从约19个nt至约45个nt、从约19个nt至约50个nt、从约19个nt至约60个nt、从约19个nt至约70个nt、从约19个nt至约80个nt、从约19个nt至约90个nt、从约19个nt至约100个nt、从约20个nt至约25个nt、从约20个nt至约30个nt、从约20个nt至约35个nt、从约20个nt至约40个nt、从约20个nt至约45个nt、从约20个nt至约50个nt、从约20个nt至约60个nt、从约20个nt至约70个nt、从约20个nt至约80个nt、从约20个nt至约90个nt、或从约20个nt至约100个nt。crRNA的多核苷酸靶向指导序列的核苷酸序列可以具有至少约12个nt的长度。在一些实施例中，crRNA的多核苷酸靶向指导序列的长度是20个核苷酸。在一些实施例中，crRNA的多核苷酸靶向指导序列的长度是19个核苷酸。

本发明还提供了包含工程化crRNA的指导RNA，其中该crRNA包含能够与基因组靶序列杂交的诱饵(bait)RNA区段。此工程化的crRNA可以是物理上不同的分子，就像在双引导系统中一样。

如本文使用的，术语“tracrRNA”或“tracrRNA区段”是指RNA分子或其部分，其包括蛋白质结合区段(例如，蛋白质结合区段能够与CRISPR相关蛋白(如Cas9)相互作用)。本发明还提供了包含工程化的tracrRNA的指导RNA，其中该tracrRNA进一步包含能够与供体DNA分子结合的诱饵RNA区段。工程化的tracrRNA可以是物理上不同的分子(如在双引导系统中)、或者可以是sgRNA分子的区段。

在一些实施例中，作为sgRNA或作为两个或更多个RNA分子的指导RNA不含有tracrRNA，因为本领域已知一些CRISPR相关的核酸酶(如Cpf1(也称为Cas12a))因其RNA介导的内切核酸酶活性而不需要tracrRNA(Qi等人,2013,Cell[细胞],152:1173-1183；Zetsche等人,2015,Cell[细胞]163:759-771)。本发明的此类指导RNA可以包含crRNA，其中诱饵RNA可操作地连接在crRNA的5'或3'端。Cpf1还对其同源pre-crRNA具有RNA酶活性(Fonfara等人,2016,Nature[自然],doi.org/10.1038/nature17945)。本发明的指导RNA可以包含其中Cpf1加工为成熟crRNA的多个crRNA。在一些实施例中，这些crRNA中的每一个均与诱饵RNA可操作地连接。在其他实施例中，这些crRNA中的至少一个与诱饵RNA可操作地连接。诱饵RNA可以对目的序列(SOI)或靶基因组位点具有特异性，如本文示例中所述。

本发明还提供了包含编码本发明的指导RNA的核酸序列的核酸分子。该核酸分子可以是DNA或RNA分子。在一些实施例中，该核酸分子是环化的。在其他实施例中，该核酸分子是直链的。在一些实施例中，该核酸分子是单链的、部分双链的、或双链的。在一些实施例中，核酸分子与至少一个多肽复合。该多肽可以具有核酸识别结构域或核酸结合结构域。在一些实施例中，多肽是用于介导例如本发明的嵌合RNA、核酸酶和任选的供体分子的递送的穿梭物。在一些实施例中，多肽是Feldan穿梭物(美国专利公开号20160298078，通过引用并入本文)。核酸分子可以包含能够驱动嵌合RNA表达的表达盒。核酸分子还可以包含额外的表达盒，其能够表达例如核酸酶(如CRISPR相关核酸酶)。本发明还提供了包含编码本发明的嵌合RNA的核酸序列的表达盒。

“定点修饰多肽”修饰靶DNA(例如靶DNA的切割或甲基化)和/或与靶DNA缔合的多肽(例如组蛋白尾的甲基化或乙酰化)。定点修饰多肽在本文也称为“定点多肽”或“RNA结合定点修饰多肽”。由于定点修饰多肽与指导RNA的缔合，定点修饰多肽与指导RNA相互作用(该指导RNA是单个RNA分子或至少两个RNA分子的RNA双链体)，并被引导至DNA序列(例如染色体序列或染色体外序列，例如游离体序列、微环序列、线粒体序列、叶绿体序列等)。

在一些情况下，定点修饰多肽是天然存在的修饰多肽。在其他情况下，定点修饰多肽不是天然存在的修饰多肽(例如嵌合多肽或被修饰的(例如突变、缺失、插入)的天然存在的多肽)。示例性天然存在的定点修饰多肽是本领域已知的(参见例如Makarova等人,2017,Cell[细胞]168:328-328.e1,和Shmakov等人,2017,Nat Rev Microbiol[自然微生物学综述]15(3):169-182,这两篇文献均通过引用并入本文)。这些天然存在的多肽结合DNA靶向RNA，并且由此被指导至靶DNA内的特定序列，并且切割靶DNA，从而产生双链断裂。

定点修饰多肽包含两个部分，即RNA结合部分和活性部分。在一些实施例中，定点修饰多肽包含：(i)与DNA靶向RNA相互作用的RNA结合部分，其中该DNA靶向RNA包含与靶DNA中的序列互补的核苷酸序列；和(ii)展现出定点酶活性(例如DNA甲基化活性、DNA切割活性、组蛋白乙酰化活性、组蛋白甲基化活性等)的活性部分，其中由DNA靶向RNA决定酶活性的位点。在其他实施例中，定点修饰多肽包含：(i)与DNA靶向RNA相互作用的RNA结合部分，其中该DNA靶向RNA包含与靶DNA中的序列互补的核苷酸序列；和(ii)调节靶DNA内的转录(例如增加或减少转录)的活性部分，其中由DNA靶向RNA决定靶DNA内的调节的转录的位点。

在一些情况下，定点修饰多肽具有修饰靶DNA的酶活性(例如核酸酶活性、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、去氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、螺旋酶活性、光解酶活性或糖基化酶活性)。在其他情况下，定点修饰多肽具有修饰与靶DNA缔合的多肽(例如组蛋白)的酶活性(例如甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰基酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性或去豆蔻酰化活性)。

在一些情况下，不同定点修饰多肽，例如不同Cas9蛋白(即来自多种物种的Cas9蛋白)可以有利地用于多种本发明提供的方法，用来利用不同Cas9蛋白的多种酶特征(例如用于不同前间隔序列邻近基序(PAM)序列偏好；用于增加或减少的酶活性；用于增加或减少的细胞毒性水平；用于改变NHEJ、同源定向修复、单链断裂、双链断裂等之间的平衡)。来自多种物种的Cas9蛋白(例如，Shmakov等人,2017中披露的那些，或源自其的多肽)可能需要靶DNA中的不同PAM序列。因此，对于选择的特定Cas9酶，PAM序列要求可能不同于已知对于Cas9活性所需要的5'-N GG-3’序列(其中N是A、T、C、或G)。本文已经鉴定了来自多种多样的物种的许多Cas9直系同源物，并且该蛋白仅共享少数相同的氨基酸。所有鉴定的Cas9直系同源物具有与中央HNH内切核酸酶结构域和分开的RuvC/RNA酶H结构域相同的结构域构造。Cas9蛋白共享具有保守构造的4个关键基序；基序1、2、和4是RuvC样基序，而基序3是HNH基序。

定点修饰多肽还可以是嵌合的和修饰的Cas9核酸酶。例如，它可以是修饰的Cas9“碱基编辑器”。碱基编辑使得能够以可编程方式将一个靶DNA碱基直接不可逆转变为另一个碱基，而不需要DNA切割或供体DNA分子。例如，Komor等人(2016,Nature[自然],533:420-424)教导了Cas9-胞苷脱氨酶融合，其中也已经将Cas9工程化为无活性的，并且并不诱导双链DNA断裂。此外，Gaudelli等人(2017,Nature[自然],doi:10.1038/nature24644)教导了融合至tRNA腺苷脱氨酶的催化活性削弱的Cas9，它可以介导靶DNA序列中A/T至G/C的转变。可以充当本发明的方法和组合物中的定点修饰多肽的另一类工程化的Cas9核酸酶是识别广范围的PAM序列(包括NG、GAA、和GAT)的变体(Hu等人,2018,Nature[自然],doi:10.1038/nature26155)。

任何Cas9蛋白(包括那些天然存在的和/或从天然存在的Cas9蛋白突变或修饰的那些)可以用作本发明的方法和组合物中的定点修饰多肽。具有催化活性的Cas9核酸酶切割靶DNA，从而产生双链断裂。然后由细胞按以下两种方式之一修复这些断裂：非同源末端连接、和同源定向修复。

在非同源末端连接(NHEJ)中，通过断裂端彼此直接连接，修复双链断裂。如此，没有新核酸材料插入该位点，尽管一些核酸材料可以失去，导致缺失。在同源定向修复中，将与切割的靶DNA序列同源的供体DNA分子或中间DNA用作模板，用于切割的靶DNA序列的修复，导致遗传信息从供体多核苷酸转移至靶DNA。如此，可以将新核酸材料插入/拷贝到该位点。在一些情况下，使靶DNA与供体分子(例如供体DNA分子或中间DNA分子)接触。在一些情况下，将供体DNA分子或中间DNA分子引入细胞中。在一些情况下，供体DNA分子或中间DNA分子的至少一个区段整合到细胞的基因组中。

归因于NHEJ和/或同源定向修复对靶DNA进行修饰导致例如基因修正、基因置换、基因标记、转基因插入、核苷酸缺失、基因破坏、基因突变等。因此，在不存在外源提供的供体多核苷酸的情况下，通过切割靶DNA序列并且允许细胞修复该序列，由定点修饰多肽切割DNA可以用于从靶DNA序列缺失核酸材料(例如用来破坏使细胞易于感染的基因(例如CCR5或CXCR4基因，它们使T细胞易于被HIV感染)，用于去除神经元中的致病三核苷酸重复序列，用于产生基因敲除和突变作为研究的疾病模型等)。因此，主题方法可以用于敲除基因(导致转录的完全缺乏或转录改变)，或用于将遗传材料敲入靶DNA中的选择的基因座中。可替代地，如果用至少包括与靶DNA序列同源的区段的供体分子将DNA靶向RNA双链体和定点修饰多肽共同施用至细胞，则可以使用主题方法用于添加，即插入或置换核酸材料至靶DNA序列(例如用来“敲入”编码蛋白、siRNA、miRNA等的核酸)，用于添加标记(例如6xHis、荧光蛋白(例如绿色荧光蛋白；黄色荧光蛋白等)、血球凝集素(HA)、FLAG等)，用于添加调节序列至基因(例如启动子、聚腺苷酸化信号、内部核糖体进入序列(IRES)、2A肽、起始密码子、终止密码子、剪接信号、定位信号等)，用于修饰核酸序列(例如引入突变)等。如此，包含DNA靶向RNA双链体和定点修饰多肽的复合物可用于任何体外或体内应用，在这些应用中，希望以位点特异性的，即“靶向的”方式修饰DNA，例如基因敲除、基因敲入、基因编辑、基因标记等，如用于例如基因疗法(例如用于治疗疾病)，或者作为抗病毒、抗病原、或抗癌治疗剂，在农业中产生基因修饰生物体，由细胞大规模产生蛋白，用于治疗、诊断、或研究目的，诱导iPS细胞，生物研究，靶向病原体的基因用于缺失或置换等。

术语“CRISPR相关蛋白”、“Cas蛋白”、“CRISPR相关核酸酶”或“Cas核酸酶”是指野生型Cas蛋白、其片段、或其突变体或变体。术语“Cas突变体”或“Cas变体”是指野生型Cas蛋白的蛋白或多肽衍生物，例如具有一个或多个点突变、插入、缺失、截短、融合蛋白、或其组合的蛋白。在某些实施例中，Cas突变体或Cas变体基本上保留了Cas蛋白的核酸酶活性，例如与源自植物的核定位信号(NLS)可操作地连接的本文描述的Cas9变体。在某些实施例中，将Cas核酸酶突变，使得一个或两个核酸酶结构域无活性，例如像不具有催化活性的Cas9称为dCas9，它仍然能够靶向特定基因组位置，但是不具有内切核酸酶活性(Qi等人,2013,Cell[细胞],152:1173-1183，特此并入本文)。在一些实施例中，将Cas核酸酶突变，使得它缺乏其野生型对应物的一些或全部核酸酶活性。Cas蛋白可以是Cas9、Cpf1(Zetsche等人,2015,Cell[细胞],163:759-771，特此并入本文)或任何另一种CRISPR相关核酸酶。

来自嗜热菌(Thermus thermophilus)等细菌的阿尔古(Argonaute)蛋白也可以以类似于CRISPR/Cas9的方式用作基因组编辑。与Cas9类似，阿尔古蛋白被认为使用寡核苷酸作为降解入侵基因组的导向物。这些指导物和嗜热菌阿尔古蛋白的复合物在高温(75摄氏度)下切割互补DNA链。WO 2014/189628描述了这个系统可以用于基因组编辑的一种方法。其他实例包括WO 2014/189628、WO 2016/161375、和WO 2016/166268。

该基因组位点编码正在通过本发明方法修饰的植物细胞的天然前miRNA。该中间DNA是一段与编码植物细胞的天然前miRNA的基因组位点相同的DNA，但用与新靶基因互补的amiRNA核心序列替换天然miRNA核心序列。该中间DNA与核酸酶一起被引入植物细胞。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中能够在编码天然前miRNA的基因组位点处定点DNA切割的核酸酶在所述基因组位点序列处使一个双链断裂。

在另一个实施例中，本发明涉及根据前述实施例中所述的方法，其中能够在编码天然前miRNA的基因组位点处定点DNA切割的核酸酶在所述基因组位点附近使一个双链断裂，优选地在所述基因组位点的上游或下游2kb范围内。

在另一个实施例中，本发明涉及根据前述实施例中所述的方法，其中能够在编码天然前miRNA的基因组位点处定点DNA切割的核酸酶在所述基因组位点附近使一个双链断裂，优选地在所述基因组位点的上游或下游500个核苷酸范围内。

在另一个实施例中，本发明涉及根据前述实施例中所述的方法，其中能够在编码天然前miRNA的基因组位点处定点DNA切割的核酸酶使一个双链断裂，在所述基因组位点的上游或下游100个核苷酸范围内。

在另一个实施例中，本发明涉及根据前述实施例中所述的方法，其中能够在编码所述植物细胞的天然前miRNA的基因组位点处定点DNA切割的核酸酶在所述基因组位点或在所述基因组位点附近使至少两个双链断裂。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述靶基因是有害生物基因或线虫有害生物基因。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述靶基因是内源植物基因。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述靶内源植物基因是参与植物发育、生物或非生物胁迫的基因。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述编码天然前miRNA的基因组位点编码天然番茄前miRNA。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述基因组位点包含SEQ ID NO:6或SEQ ID NO:7。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述基因组位点由SEQ ID NO:6或SEQ ID NO:7组成。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述基因组位点编码SlmiR156b或SlmiR1919b基因。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中该中间DNA包含SEQ ID NO:1至5中的任一个。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中该中间DNA包含SEQ ID NO:22至24中的任一个。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中该中间DNA包含SEQ ID NO:8至17中的任一个。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述细胞具有单倍体、二倍体、多倍体或六倍体基因组。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述细胞对于修饰的前miRNA是杂合的。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述细胞具有修饰的前miRNA的一个拷贝和天然前miRNA的一个拷贝。

在本发明的上下文中，包含修饰的前miRNA的一个拷贝的单倍体植物细胞在例如育种过程和种子生产方法中具有效用。

在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中所述方法还包括一个或多个指导序列的使用。在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中一个或多个指导序列与所述核酸酶一起引入细胞。在另一个实施例中，本发明涉及根据前述实施例中任一项所述的方法，其中一个或多个指导序列源自靶基因组位点。

在另一个实施例中，前述实施例中任一项所述的方法赋予对植物有害生物的抗性。

在另一个实施例中，本发明涉及根据前述实施例中所述的植物细胞，其中所述细胞包含SEQ ID NO:1-5中的任一个。

在另一个实施例中，本发明涉及根据前述实施例中所述的植物细胞，其中所述细胞包含SEQ ID NO:22-24中的任一个。

在另一个实施例中，本发明涉及根据前述实施例中所述的植物细胞，其中所述细胞包含SEQ ID NO:8-17中的任一个。

在另一个实施例中，本发明涉及包含SEQ ID NO:1-5中任一个的植物细胞。

在另一个实施例中，本发明涉及包含SEQ ID NO:22-24中任一个的植物细胞。

在另一个实施例中，本发明涉及包含SEQ ID NO:8-17中任一个的植物细胞。

在另一个实施例中，本发明涉及包含SEQ ID NO:6的一个拷贝和SEQ ID NO:8-12中任一个的一个拷贝的二倍体植物细胞。

在另一个实施例中，本发明涉及包含SEQ ID NO:7的一个拷贝和SEQ ID NO:13-17中任一个的一个拷贝的二倍体植物细胞。

在另一个实施例中，本发明涉及一种生产植物种子的方法，优选地是茄科植物、玉米、水稻、卡诺拉油菜、大豆或向日葵种子，更优选地是番茄种子，所述方法包括将包含根据前述实施例中任一项所述的植物细胞的植物与其自身或与相同作物的另一植物杂交。

在另一个实施例中，本发明涉及包含根据前述实施例中任一项所述的植物细胞的植物。在另一个实施例中，本发明涉及包含根据前述实施例中任一项所述的植物细胞的番茄植物。

在另一个实施例中，本发明涉及包含根据前述实施例中任一项所述的植物细胞的植物部分。在另一个实施例中，本发明涉及包含根据前述实施例中任一项所述的植物细胞的番茄植物部分。在另一个实施例中，该植物部分是植物种子，优选地是番茄植物种子。

在另一个实施例中，根据前述实施例中任一项所述的该植物或植物部分提供有害生物抗性。在另一个实施例中，根据前述实施例中任一项所述的该植物或植物部分提供针对番茄斑萎病毒组(tospovirus)的有害生物抗性。在另一个实施例中，根据前述实施例中任一项所述的该植物或植物部分提供针对TSWV的抗性。

在另一个实施例中，本发明涉及一种生产植物种子的方法，优选地是茄科植物、玉米、水稻、卡诺拉油菜、大豆或向日葵种子，更优选地是番茄种子，所述方法包括将根据前述实施例中任一项所述的植物与其自身或与相同作物的另一植物杂交。

在另一个实施例中，本发明涉及一种生产植物的方法，优选地是茄科植物、玉米、水稻、卡诺拉油菜、大豆或向日葵植物，更优选地是番茄植物，所述方法包括将根据前述实施例中任一项所述的植物与其自身或与相同作物的另一植物杂交，以产生包含本发明的amiRNA并表现出新颖的表型的子代植物。

本发明的方法已在模型作物番茄和模型病毒番茄斑萎病毒(TSWV)中实施并示例。具有本文所披露信息的技术人员可以容易地转移知识并在不同植物和不同目标类型中实施本发明的方法。

实例

实例1：适合用作amiRNA核心的TSWV序列的鉴定

收集公开的TSWV基因组(表1)并进行比对。

表1列出了从NCBI(可在万维网www.ncbi.nlm.nih.gov/nuccore/上找到)收集的TSWV基因组。

选择具有高度相似性的保守TSWV区域。分析了番茄植物基因组中21-nt序列的GC含量、二级结构、特定位置和脱靶(TSWV 21-nt序列与番茄基因组比较)。TSWV序列有30％至60％的GC含量并且在番茄基因组上不少于3个错配的命中是优选的。

为了测试给定的amiRNA核心病毒序列是否可以有效控制病毒，如上所述，在TSWV病毒基因组中鉴定了潜在靶标，并在瞬态实验中进行了测试。将拟南芥(Arabidopsis)天然前miRNA AtmiR159a用作支架。通过用设计的与TSWV靶基因互补的21-nt序列替换天然AtmiR159a核心序列，直接合成修饰的miRNA。将修饰的miRNA与天然miRNA在结构和稳定性(MFE)方面进行比较，选择变化最小的miRNA用于瞬态病毒测定的实验评估和验证。对于这些瞬态测定，使用二元载体17839(图5)以表达设计的amiRNA。通过BamHI/NcoI以切割二元载体17839和合成的AtmiR159a-amiRNA片段二者，并进行凝胶纯化。将该两个片段连接在一起并转化到DH5α细胞。阳性克隆经BamHI/NcoI消化验证，并对所有连接进行测序。

表2列出了在AtmiR159a支架内测试为amiRNA核心的所有TSWV序列。其中的五种(SEQ ID NO:1-5)已被鉴定为适合在瞬态测定中提供对TSWV的高抗性(图2和3)。

例子	amiRNA核心	抗性功效	SEQ ID NO:
				ET-16	amiRNA_RdRp_GC52	中等抗性
ET-17	amiRNA_RdRp_GC42	易感性
				ET-18	amiRNA_NSs_GC52	易感性
ET-19	amiRNA_N_GC42	中等抗性
				ET-20	amiRNA_GnGc_GC52	易感性
ET-21	amiRNA_GnGc_GC40	中等抗性
				ET-22	amiRNA_NSm_GC30	中等抗性
ET-23	amiTSWV_N1w_PC	高抗性	1
				ET-24	amiTSWV_N2_PC	高抗性	2
ET-26	amiTSWV_N2_PC_rev	高抗性	3
				ET-27	amiRNA_NSs_GC52_rev	易感性
ET-36	amiR159a_3p_N_GC42	易感性
				ET-37	amiR159a_3p_N_GC25	易感性
ET-38	amiR159a_3p_N_GC35	高抗性	4
				ET-39	amiR159a_3p_N_GC50	高抗性	5
ET-40	amiR159a_3p_N_GC43	易感性
				ET-41	amiR159a_3p_NSs_GC35	易感性
ET-42	amiR159a_3p_RdRP_GC25	易感性
				ET-43	amiR159a_3p_GnGc_GC30	中等抗性
ET-44	amiR159a_3p_NSm_GC40	易感性

例子ET-23、ET-24、ET-26、ET-38和ET-39对TSWV提供高水平的抗性。因此，实例1中描述的这种方法允许识别与新靶基因同源的合适的amiRNA核心序列，并且可以有效地用于获得新颖的表型。值得注意的是，ET-26(ET-24的反向互补序列)也提供了高水平的抗性，这表明一旦识别出有效的amiRNA核心序列，其反向互补序列也可以成功使用本发明的方法。

实例2：鉴定合适的天然番茄前miRNA序列

为了测试给定的天然番茄前miRNA序列是否可以有效地用作用于控制病毒的TSWVamiRNA核心序列的容器，在番茄基因组中鉴定了潜在的前miRNA支架，并使用ET-24(SEQ IDNO:2)作为TSWV amiRNA核心序列进行测试(参见实例1)。

收集公开的番茄sRNA-seq数据(表3)以检查天然miRNA表达。

表3列出了从NCBI SRA数据库(可在万维网www.ncbi.nlm.nih.gov/sra/上找到)收集的番茄sRNA-seq数据集。

运行	实验	长度	总斑点数
				SRR039920	SRX019222	36	5299195
SRR039921	SRX019223	36	4574008
				SRR2039800	SRX1038192	37	6202076
SRR2989577	SRX1478064	36	11026240
				SRR2989578	SRX1478065	36	18528550
SRR4013313	SRX2008739	50	23760631
				SRR4346447	SRX2213272	51	46872476
SRR5031857	SRX2356906	51	2655264
				SRR5031858	SRX2356907	51	4954975
SRR5031859	SRX2356908	51	4375546
				SRR786979	SRX252396	36	15573561
SRR786980	SRX252397	36	13077046
				SRR1463412	SRX627473	49	18158256
SRR1777738	SRX833690	50	10309183
				SRR1795959	SRX871216	51	73080323

在这些数据集中对成熟的miRNA丰度进行了分析，并与miRBase(可在万维网 www.mirbase.org/上找到)上公开的数据进行了比较。以下标准用于选择番茄天然miRNA进行修饰，包括具有多个家族成员的miRNA，产生相同的成熟miRNA和高表达水平，尤其是在绿色组织中。

选择了表3中列出的一些优秀候选者进行进一步实验。首先使用该amiRNA核心序列ET24(SEQ ID NO:2)以验证这些候选者，随后也使用了新的21-nt序列。首先通过Kpn1/Nco1酶切二元载体17839，并且将5762bp片段进行凝胶纯化。直接合成1kb启动子区域和修饰的前miRNA(该miRNA核心序列被已鉴定的amiRNA核心序列ET-24替代)并用Kpn1/Nco1切割。将该两个片段连接在一起并转化到DH5α细胞。阳性克隆经Kpn1/Nco1消化验证，并对所有连接进行测序。

表4列出了测试为前miRNA支架的所有序列。其中的两种(SEQ ID NO:9和14)已被鉴定为适合在瞬态测定中提供对TSWV的高抗性(图4)。

例子	前miRNA	抗性功效	SEQ ID NO:
				ET-28	miR156a_N2_PC	易感性
ET-29	miR156b_N2_PC	抗性	9
				ET-30	miR168a_N2_PC	NA
ET-31	miR168b_N2_PC	易感性
				ET-32	miR172a_N2_PC	易感性
ET-33	miR395b1_N2_PC	易感性
				ET-34	miR395b2_N2_PC	易感性
ET-35	miR1919b_N2_PC	抗性	14

持有amiRNA核心TSWV序列ET-24(分别为SEQ ID No 9和14)的番茄前miRNA支架ET-29和ET-35显示出对TSWV的良好抗性水平，表明其适合用于本发明的方法中。

实例3：设计基因组编辑构建体，通过替换amiRNA核心序列，修饰天然番茄前miRNA 以靶向番茄病毒病原体基因靶。

为了测试编辑番茄天然miRNA为靶向病毒基因是否可以给予番茄对该病毒的抗性，设计了以下构建体以编辑该天然番茄miRNA SlmiR156b。测试的靶病毒基因是来自TSWV的RNA依赖性RNA聚合酶(RdRp)、糖蛋白前体(Gn/Gc)、非结构运动蛋白(NSm)、非结构沉默抑制蛋白(NSs)和核衣壳蛋白(N)。Cas9与两个gRNA一起用于在番茄天然SlmiR156b基因座周围以产生双链断裂，并提供修饰的amiRNA供体用于替换。

用于番茄转化的二元载体24598(图6)含有由组成型prAtEF1aA1-02启动子驱动的大豆密码子优化Cas9和由prAtU6-01和prSlU6驱动的两个基因特异性gRNA，以编辑番茄SlmiR156b基因。该构建体旨在通过用靶向TSWV病毒基因组的人工核心序列替换天然SlmiR156b核心序列。还包括1.5kb的供体序列，该序列含有1kb启动子、具有人工核心的前SlmiR156b、和0.5kb终止子。由prGmEF-01驱动的cSpec-03用作可选标记。该供体DNA片段以及prAtU6-01-rsgRNASlmiR156b-A(SEQ ID NO:20)和prSlU6-rsgRNASlmiR156b-B(SEQ IDNO:21)的两个gRNA盒由Generalbiol合成。这个二元载体中的全部四个盒都是单个转基因的一部分。

序列表

<110> Syngenta Crop Protection AG

Syngenta Biotechnology China Co. Ltd.

LIU, Juntao

XU, Jianping

CHEN, Yanhui

LIU, Zhiqiang

CHEN, Xi

<120> 通过天然miRNA的基因组编辑抑制靶基因表达

<130> 81815-CN-REG-ORG-P-1

<160> 24

<170> PatentIn version 3.5

<210> 1

<211> 21

<212> DNA

<213> 番茄斑萎病毒

<400> 1

cagtgttgtc tgtgctatat a 21

<210> 2

<211> 21

<212> DNA

<213> 番茄斑萎病毒

<400> 2

atgaaatgtt cggggttaaa a 21

<210> 3

<211> 21

<212> DNA

<213> 番茄斑萎病毒

<400> 3

ttttaacccc gaacatttca t 21

<210> 4

<211> 21

<212> DNA

<213> 番茄斑萎病毒

<400> 4

ttcaaatgct ttgcttttca g 21

<210> 5

<211> 21

<212> DNA

<213> 番茄斑萎病毒

<400> 5

tagcagcata ctctttcccc t 21

<210> 6

<211> 1084

<212> DNA

<213> 番茄（Solanum lycopersicum）

<400> 6

attcggttac ctctctttcc tatgtaacta aatgtctgct aatgtattca caagtccaag 60

tgatgtattc gaaattataa aatttaagga attcttataa tttgaaaaag aagtagaaaa 120

taatgtaatt agctcttaac gctatgaaat ttatgtaaat tatataatta ttatgtactc 180

cttccgattc atatgacata tcttactttt aacctttaca ttttgttcaa aataagtaat 240

tttattgtaa ctaagaatgt attactatta tttagttttt caaatttacg ccttcttttg 300

ataagtgggt tttaactttt aacgtaacca agaaatgata ttaaatatgt actatataat 360

taagaataat tagtaaaaac aatttttaat attttaggac ctaaactttt tatttttttg 420

tgcgacatgt tacctaaaag atagtaaaaa aataattgcc aataataaat ggaataattt 480

tactagaaaa taaacatagg aaaagaaata tacgtaacac attaaattat atcaacggat 540

cattaaaatt cttttgtatt gtctatataa tactatataa aagtaaagaa ttctataaaa 600

ttaatttgag ttgacataga aaaactgttt tgggttaaat tttttactag ttgtgcacta 660

tttatcttcg atctataaat agatcgacat gttggaaaac actcaaacca tcctatgcta 720

taagataata tatagctaca tttcttagat aactagaaac ctccattagc ttcctattct 780

cataagcaaa tctccaatca taatttacaa actgagactc gatgtatgat cagtgataga 840

tttaaaattt agatatcaca agtgatatgt ttagatcata agggtctaga aatgcatatc 900

taactcgatg tattctatgt tgcactttgt cccgcatcac ctcacaactg taagtataaa 960

ttatttcaaa gagagcagga aagtattggg tgagatattg ttgacagaag atagagagca 1020

cgaataatga ggtgctaatt ggaagctgca ccttaattct ttgtgctctc tattcttctg 1080

tcat 1084

<210> 7

<211> 1207

<212> DNA

<213> 番茄

<400> 7

agcgaattat acagaacata attatgcaaa ttttgctata acatacaaat atgaatttta 60

tgtttgatat atgtgaaagt tgcccattat ggaattagct atgaaattta tggtaatttt 120

aagggacaat tacgcggtga agcaaactta tactacttaa atattcatca tagctatagt 180

ttgctataat taacactcgc gactaatatt atacattaat tatgtggcct gacttcgagt 240

ttgtataatt agtcagaata aacaaataca tgttataata tacaattatc taaccgatat 300

acataaacaa tttacctctc tcccactctt tgccctctct cgctcgtctc tctcccaatc 360

tcgttcttct cttcctccct ttcccagtat tgccgccact ctcccaatct ctctctcctc 420

tctcctccct ctcccaatct ctcttgccat atatacaaat acatatgtat aatatacaat 480

tatataacca atatacatat acaatgcacc tctccccctc tctttgccct ctctcctctc 540

tctcccagtc tcgcttgcct gtctcttctc tataacatgt agttacagat tgtaattatc 600

aaactgtaac tatgaagagt aattaaacta tttttgagtg actatacgtg aaagttcctc 660

taattttaat caattcatca caaatccata tctaaatgaa atgaacaaag aaaaattatt 720

attgtttagt tatgaatttt atcaatcact aattcacgtg aatattaggg aataaaaaat 780

gactactttg gcataatcta aacttgctag tagaaatttg aagttgcaaa aagaaaaaga 840

gaagcaaaag aagtgaaaga aaaagaggcg ttattgtttt ttactttatt cagtataaag 900

tgcgttttac tcttctattt cttgtagctc acaaatcgtc tttactgacc ctacaaattc 960

tcttccggca agttttcagg ttcctccgaa tcgctccgac gcctttgatg ttcacatctt 1020

ccggtagtcc tgtcgcagat gactttcgcc catttatgga accacacttt ctttaatttg 1080

aattctatgt ggtaggacga gagtcatctg tgacaggata atggaagatc gagttatcaa 1140

aggcttattg ggcgtttcct ttttcatctt gagttcgtac cagattaatg caaaaccgaa 1200

gaagtag 1207

<210> 8

<211> 1083

<212> DNA

<213> 人工序列

<220>

<223> 番茄/番茄斑萎病毒

<400> 8