线粒体基因组的遗传修饰

文档序号:554791 发布日期:2021-05-14 浏览:6次 >En<

阅读说明:本技术 线粒体基因组的遗传修饰 (Genetic modification of mitochondrial genome ) 是由 米查尔·明丘克 张雷 帕亚姆·A·伽玛吉 于 2019-03-21 设计创作,主要内容包括:本公开文本涉及基因组工程化,尤其是线粒体DNA(mtDNA)的靶向遗传修饰的领域。(The present disclosure relates to the field of genome engineering, in particular targeted genetic modification of mitochondrial dna (mtdna).)

线粒体基因组的遗传修饰

相关申请的交叉引用

本申请要求2018年3月21日提交的美国临时申请号62/646,156的权益,将其披露内容通过引用以其整体特此并入。

技术领域

本公开文本涉及基因组工程化,尤其是线粒体基因组(mtDNA)的靶向修饰的领域。

背景技术

线粒体疾病是遗传上多种多样的一类遗传性多系统障碍(经常影响需要最大量的能量的器官,诸如心脏、大脑、肌肉和肺),其大部分通过线粒体DNA(mtDNA)的突变传播,影响大约1/5,000的成年人。参见例如,Gorman等人(2015)Ann Neurol 77:753-759。到目前为止已经表征了至少250个致病性mtDNA突变(Tuppen等人(2010)Biochem Biophys Acta1797:113-128),并且这些突变似乎在若干种类型的人类疾病中发挥作用。人mtDNA是小的双链多拷贝基因组,以约100-10,000个拷贝/细胞存在。在疾病状态中,突变的mtDNA经常与野生型mtDNA在被称为“异质性”的现象(由多个线粒体通过卵细胞的母系遗传导致)中共存。因为突变体mtDNA通常在功能上是隐性的,所以突变的mtDNA的存在通过野生型基因组促进,并且由异质性mtDNA突变导致的病症的疾病严重性与突变负荷相关。参见例如,Gorman等人(2016)Nat Rev Dis Primers 2:16080。阈值效应(其中必须在症状显现之前超过>60%的突变体mtDNA负荷)是异质性mtDNA疾病的明确特征,并且将异质性比率偏移至低于此阈值的尝试驱动了关于治疗这些不可治愈且基本上不可治疗的障碍的许多研究。

一个这种方法依赖于使用线粒体靶向锌指核酸酶(mtZFN)以及其他基因组工程化工具进行的mtDNA的定向核溶解。参见例如,Srivastava等人(2001)Hum Mol Genet 10:3093-3099(2001);Bacman等人(2013)Nat Med 19:1111-1113;Gammage等人(2014)EMBOMol Med 6:458-466;Reddy等人(2015)Cell 161:459-469;Gammage等人(2016)NucleicAcids Res 44:7804-7816;Gammage等人(2018)Trends Gene 34(2):101)。因为哺乳动物线粒体缺乏有效的DNA双链断裂(DSB)修复途径,所以将DSB选择性引入到突变体mtDNA中导致这些分子通过不完全表征的机制而快速降解。因为mtDNA拷贝数维持在细胞类型特定的稳态水平下,所以选择性消除突变体mtDNA刺激剩余的mtDNA池的复制,从而引起异质性比率的偏移。已经显示用于将ZFN递送到培养细胞中的线粒体的方法能够产生较大的异质性偏移,其导致患者来源的细胞培养物的表型救援。参见例如,Minczuk等人(2006)Proc NatlAcad Sci U S A 103:19689-19694(2006);Minczuk等人(2010)Nat Protoc 5:342-356;Minczuk等人,(2008)Nucleic Acids Res 36:3926-3938;Gaude等人(2018)Mol Cell 69:581-593;美国专利号9,139,628。

虽然初始描述了与20世纪80年代后期出现的人类疾病相关的mtDNA突变(参见例如,Holt等人(1988)Nature 331:717-719;Wallace等人(1988)Science 242:1427-1430;Wallace等人(1988)Cell 55:601-610),但是在其间的数十年中对于异质性线粒体疾病的有效治疗一直未出现。通过线粒体替代疗法预防mtDNA突变的传递已经受到关注(参见例如,Craven等人(2010)Nature 465:82-85;Tachibana等人(2013)Nature 493:627-631;Hyslop等人(2016)Nature 534:383-386;Kang等人(2016)Nature 540:270-275),但是鉴于mtDNA瓶颈的性质(Floros等人(2018)Nat Cell Biol 20:144-151)、异质性线粒体疾病呈现(Vafai等人(2012)Nature 491:374-383)以及大部分新病例中线粒体疾病的家族史的后续缺失,线粒体替代可能仅具有有限的用途。另外,用于治疗线粒体疾病的分子途径未提供针对异质性线粒体疾病的临床相关疗法。参见例如,Viscomi等人(2015)Biochim BiophyActa 1 847:544-557;Pfeffer等人(2013)Nat Rev Neurol 9:474-481。

因此,仍然需要用于mtDNA基因修饰,尤其是mtDNA的异质性偏移的另外的方法和组合物以提供通过减少突变体线粒体序列的量治疗多种遗传来源的线粒体疾病的通用治疗剂。

发明内容

本发明描述了用于基因疗法和基因组工程化的组合物和方法。具体地,所述的方法和组合物涉及内源线粒体基因组(突变体或野生型)的核酸酶介导的基因组修饰(例如,一个或多个插入和/或缺失)。所述线粒体基因组可以针对致病突变的靶向校正,包括通过以下方式来改变:在患有线粒体疾病的受试者中,包括在一个或多个特定组织和/或器官中(例如在心脏组织中)的突变体与野生型mtDNA的比率的核酸酶介导的偏移,所述核酸酶介导的偏移导致靶向组织的表型逆转为野生型(例如,分子和生物化学表型)。此逆转通过异质性偏移发生,其中通过以下方式改变突变体与野生型mtDNA的比率:切割所述突变体序列,使得在不存在有效DNA修复机制的情况下(如在线粒体中),疾病相关的所述突变体mtDNA在通过靶向核酸酶进行的选择性切割之后降解。

因此,所述一种或多种基因组修饰(例如,异质性偏移)可以包括切割,接着是降解所切割的mtDNA序列,并且这些遗传修饰和/或包含这些修饰的细胞可以在离体或体内方法中使用。

因此,本文描述了包含左锌指核酸酶和右锌指核酸酶(ZFN)的锌指核酸酶用于治疗有需要的受试者的线粒体障碍的用途(或包含所述锌指核酸酶的药物组合物),其中一个ZFN配偶体包含切割结构域和与突变体线粒体DNA(突变体mtDNA)中的靶位点结合的锌指蛋白(ZFP),并且另一个ZFN配偶体包含切割结构域和与野生型线粒体DNA(mtDNA)或突变体mtDNA(突变体mtDNA)中的靶位点结合的锌指蛋白(ZFP),使得所述受试者中的突变体mtDNA减少或消除(例如,使野生型与突变体mtDNA的异质性比率偏移)。在一些实施方案中,所述右ZFP和左ZFP两者均与突变体mtDNA中的靶标结合,而在其他实施方案中,一个ZFN配偶体与野生型mtDNA结合并且另一个ZFN配偶体与突变体mtDNA结合。在其他实施方案中,与所述野生型mtDNA结合的ZFN是所述左ZFN,而所述右ZFN与所述突变体mtDNA结合,或者所述右ZFN与所述野生型mtDNA结合,而所述左ZFN与所述突变体mtDNA结合。还描述了通过在有需要的受试者中表达本文所述的ZFN来治疗所述受试者的线粒体障碍的方法。在本文所述的用途或方法中的任一种中,所述突变体mtDNA包含以下突变中的一种或多种:5024C>T、1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C和/或14709C。在某些实施方案中,所述锌指核酸酶由一种或多种多核苷酸(例如,编码所述左ZFN和右ZFN的单独多核苷酸或编码左ZFN和右ZFN两者的同一多核苷酸)编码,所述一种或多种多核苷酸包括但不限于由一种或多种AAV载体携带的一种或多种多核苷酸。所述受试者可以是人受试者,并且所述mtDNA可以在所述受试者的任何组织中。在一些实施方案中,所述mtDNA可以在所述受试者的大脑、肺和/或肌肉中。所述ZFN和/或多核苷酸可以通过任何合适的手段(包括静脉内注射)来给予。在其中所述突变体mtDNA包含5024C>T突变的实施方案中,所述左ZFP可以与SEQ ID NO:33内的靶位点结合,并且所述右ZFP可以与SEQ IDNO:34内的靶位点结合,包括但不限于这样的ZFN,其中所述左ZFN包含被命名为WTM1/48960的ZFP,并且所述右ZFN包含被命名为MTM62/48962、MTM24/51024、MTM25/51025、MTM26/51026、MTM27/51027、MTM28/51028、MTM29/51029、MTM30/51030、MTM32/51032、MTM33/51033、MTM36/51036、MTM37/51037、MTM39/51039、MTM42/51042、MTM43/51043或MTM45/51045的ZFP。

还描述了一种包含左锌指核酸酶和右锌指核酸酶(ZFN)的锌指核酸酶,其中所述左ZFN包含切割结构域和与SEQ ID NO:33内的野生型线粒体DNA中的靶位点结合的锌指蛋白(ZFP),并且所述右ZFN包含切割结构域和与SEQ ID NO:34或SEQ ID NO:35内的突变体线粒体DNA中的靶位点结合的ZFP。在某些实施方案中,所述ZFN由一种或多种多核苷酸(例如,由AAV载体携带)编码。还描述了包含如本文列出的核酸酶和/或多核苷酸的细胞(例如,心脏、大脑、肺和/或肌肉细胞),包括这样的细胞,其中所述细胞中位置5024处的突变体mtDNA减少或消除,以及由这些细胞演变而来的细胞、细胞系和部分或完全分化的细胞(可能不包含ZFN或编码ZFN的多核苷酸)。还提供了包含一种或多种锌指核酸酶;一种或多种多核苷酸和/或如本文所述的细胞的药物组合物。

在一方面,本文公开了用于使用一种或多种核酸酶进行mtDNA基因的靶向修饰的方法和组合物。核酸酶(例如工程化大范围核酸酶、锌指核酸酶(ZFN)(术语“ZFN”包含ZFN对)、TALE-核酸酶(包含TALE效应子结构域与来自限制性核酸内切酶和/或来自大范围核酸酶的核酸酶结构域的融合物的TALEN(诸如大范围TALE和紧密型TALEN)(术语“TALEN”包含TALEN对)))、Ttago系统和/或CRISPR/Cas核酸酶系统用于切割线粒体基因组,通常是突变体线粒体基因组处的DNA,使得异质性(如野生型与突变体线粒体基因组之间的异质性)偏移并且突变体mtDNA的量减少。靶标(例如,突变体mtDNA)可以在切割之后失活,因为mtDNA中的双修复途径是无效的,并且因此突变体mtDNA(其中野生型mtDNA未被切割)的选择性切割导致突变体mtDNA的快速降解以及野生型与突变体mtDNA的异质性比率的相应偏移。本文所述的核酸酶可以诱导所述靶DNA中的双链断裂(DSB)或单链断裂(切口)。在一些实施方案中,使用两种切口酶通过引入两个切口来产生DSB。在一些情况下,所述切口酶是ZFN,而在其他情况下,所述切口酶是TALEN或CRISPR/Cas切口酶。本文所述的任何核酸酶(例如,ZFN、TALEN、CRISPR/Cas等)可以特异性地靶向靶突变体mtDNA,包括例如表2所示的靶序列,包括例如包含所述野生型或突变体序列的9至20个或更多个(9、10、11、12、13、14、15、16、17、18、19、20个或更多个)连续或非连续核苷酸的靶位点。任何突变体可以被所述DNA结合结构域靶向,所述突变体包括但不限于m.5024C>T。例如,与mtDNA突变相关的人类疾病的非限制性组包括Kearns-Sayre综合征(KSS;进行性肌病、眼肌麻痹、心肌病);CPEO:慢性进行性眼外肌麻痹;以及皮尔逊综合症(Pearson Syndrome)(全血细胞减少症、乳酸酸中毒),其中全部三种疾病与所述线粒体基因组中单个大缺失(大约5kb)相关。其他与突变体线粒体相关的人类疾病是MELAS(肌病、脑病、乳酸酸中毒和中风样发作),其与TRNL1基因中的3243A>G突变(在本文中也被称为A3243G或3243G)和/或3271T>C突变(在本文中也被称为T3271C或3271C)或ND1和ND5中的偶发突变相关;MERRF(伴随破碎红纤维的肌阵挛性癫痫、肌病),其与TRNK基因中的8344A>G和/或8356T>C突变(在本文中被称为A8344G或8344G/T8356C或8356C)相关;NARP(神经病、共济失调、视网膜色素变性),其与ATP6基因中的8993T>G突变(在本文中被称为T8993G或8993G)相关;MILS(进行性脑干病,也被称为母系遗传的Leigh综合征),其也与ATP6中的8993T>G/C突变(在本文中被称为T8993G、T8993C、8993G、8993C)和/或9176T>G/C突变(在本文中被称为T9176G、T9176C、9176G、9176C)相关;MIDD(糖尿病、耳聋),其与TRNL1基因中的3243A>G突变(在本文中被称为A3243G或3243G)相关;LHON(视神经病变),其与ND1中的3460G>A突变(在本文中被称为G3460A或3460A)、ND4中的11778G>A突变(在本文中被称为G11778A或11778A)和/或ND6基因中的14484T>C突变(在本文中被称为T14484C或14484C)相关;肌病和糖尿病,其与TRNE基因中的14709T>C突变(在本文中被称为T14709C或14709C)相关;感音神经性聋和耳聋,其与RNR1基因中的1555A>G突变(在本文中被称为A1555G或1555G)和TRNS1基因中的偶发突变相关;运动耐受不良,其与CYB基因中的偶发突变相关;以及致死性婴儿脑病Leigh/Leigh样综合征,其与ND3基因中的10158T>C突变(被称为T10158C或10158C)和/或10191T>C突变(被称为T10191C或10191C)和/或10197G>A突变(被称为G10197A或10197A)相关。mtDNA中的其他突变包括ND6基因中的14709T>C突变(被称为T14709C或14709C);ND6基因中的14459G>A和/或14487T>C突变(在本文中被称为G14459A或14459A和T14487C或14487C)和/或ND4基因中的11777C>A突变(被称为C11777A或11777A)和/或与Leigh综合征相关的1624C>T突变(被称为C1624T或1624T);ND5基因中的13513G>A突变(被称为G13513A或13513A);7445A>G突变(被称为A7445G或7445G)和/或与耳聋和肌病相关的在7472处的插入;与多系统障碍相关的5545C>T突变(被称为C5545T或5545T)以及与心肌病相关的4300A>G突变(被称为A4300G或4300G)。参见例如,Greaves和Taylor(2006)IUBMB Life 58(3):143-151;Taylor和Turnbull(2005)Nat Rev Genet 6(5):389-402;以及Tuppen等人(2010)同上)。所有的突变相对于野生型序列进行编号。

在一方面,本文描述了与mtDNA基因组中的靶位点结合的非天然存在的锌指蛋白(ZFP),其中所述ZFP包含一个或多个工程化锌指结合结构域。在一个实施方案中,所述ZFP是切割目的靶基因组区域的锌指核酸酶(ZFN),其中所述ZFN包含一个或多个工程化锌指结合结构域和核酸酶切割结构域或切割半结构域。切割结构域和切割半结构域可以例如从各种限制性核酸内切酶和/或归巢核酸内切酶获得,并且可以是野生型或工程化的(突变体)。在一个实施方案中,所述切割半结构域源自IIS型限制性核酸内切酶(例如,FokI)。在某些实施方案中,所述锌指结构域包含具有如表1的单行所示进行排序的识别螺旋结构域的锌指蛋白。包含这些锌指蛋白的核酸酶可以包括任何接头序列(例如,将其与切割结构域连接)和任何切割结构域(例如,二聚化突变体,例如ELD突变体;在416、422、447、448和/或525中一个或多个处具有突变的FokI结构域;和/或导致切口酶功能的催化结构域突变体)。参见例如,美国专利号8,703,489;9,200,266;8,623,618;和7,914,796;以及美国专利公开号20180087072。在某些实施方案中,所述ZFN的ZFP与表2所示序列内的9至18个或更多个核苷酸的靶位点结合。在某些实施方案中,所述ZFN与突变体mtDNA(与野生型mtDNA相比)选择性地结合,使得所述ZFN选择性地切割突变体mtDNA(与野生型mtDNA的切割相比)。在其他实施方案中,所述ZFN与包含以下突变中的一种或多种的突变体mtDNA中的靶位点选择性地结合:相对于野生型序列进行编号的1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C或14709C,其中所述位置之后的核苷酸指示突变体序列。本文所述的任何ZFN可以包含ZFN对(例如,左和右),其中所述对中的一个成员与突变体mtDNA序列结合,并且所述对中的另一个成员与野生型mtDNA结合。可替代地,本文所述的ZFN可以包含ZFN对(左和右),其中两个ZFN均与野生型mtDNA结合,或两个ZFN均与突变体mtDNA结合。

在另一方面,本文描述了结合靶位点(例如,在mtDNA中的包含表2所示的靶序列中的至少9或12个(例如,9至20个或更多个)核苷酸的靶位点)的转录激活因子样效应子(TALE)蛋白,其中所述TALE包含一个或多个工程化的TALE结合结构域。在一个实施方案中,所述TALE是切割目的靶基因组区域的核酸酶(TALEN),其中所述TALEN包含一个或多个工程化TALE DNA结合结构域和核酸酶切割结构域或切割半结构域。切割结构域和切割半结构域可以例如从各种限制性核酸内切酶和/或归巢核酸内切酶(大范围核酸酶)获得。在一个实施方案中,所述切割半结构域源自IIS型限制性核酸内切酶(例如,FokI)。在其他实施方案中,所述切割结构域源自大范围核酸酶,所述大范围核酸酶结构域也可以展现DNA结合功能。在某些实施方案中,所述TALEN与突变体mtDNA(与野生型mtDNA相比)选择性地结合,使得所述TALEN选择性地切割突变体mtDNA(与野生型mtDNA的切割相比)。在其他实施方案中,所述TALEN与包含以下突变的靶位点选择性地结合:相对于野生型序列进行编号的1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C或14709C,其中所述位置之后的核苷酸指示突变体序列。本文所述的任何TALEN可以包含TALEN对(例如,左和右),其中所述对中的一个成员与突变体mtDNA序列结合,并且所述对中的另一个成员与野生型mtDNA结合。可替代地,如本文所述的TALEN可以包括TALEN对(左和右),其中两个TALEN均与野生型mtDNA结合或两个TALEN均与突变体mtDNA结合。

另一方面,本文描述了与mtDNA中的靶位点结合的CRISPR/Cas系统,其中所述CRISPR/Cas系统包含一种或多种工程化单一指导RNA或功能等同物以及Cas9核酸酶。在某些实施方案中,所述单一指导RNA(sgRNA)与包含如表2示的靶位点的9个、12个或更多个连续核苷酸的序列结合。在某些实施方案中,所述sgRNA与突变体mtDNA(与野生型mtDNA相比)选择性地结合,使得所述CRISPR/Cas核酸酶选择性地切割突变体mtDNA(与野生型mtDNA的切割相比)。在其他实施方案中,所述CRISPR/Cas系统与包含以下突变的靶位点选择性地结合:相对于野生型序列进行编号的1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C或14709C,其中所述位置之后的核苷酸指示突变体序列。本文所述的任何sgRNA均可以与突变体或可替代地野生型mtDNA选择性地结合。在使用sgRNA对的情况下,一个或两个成员可以于野生型或突变体mtDNA结合。

如本文所述的核酸酶(例如,ZFN、CRISPR/Cas系统、Ttago和/或TALEN)可以结合至和/或切割mtDNA的编码区或非编码区中的目的区域(例如像前导序列、尾随序列或内含子)或在所述编码区的上游或下游的非转录区内的目的区域。所述靶位点的长度可以是9-18个或更多个核苷酸,包括如表2所示的靶位点或在mtDNA中涵盖1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C或14709C的靶位点。在某些实施方案中,所述核酸酶的DNA结合结构域(ZFP、TALE、sgRNA等)与突变体mtDNA(与野生型mtDNA的切割相比)选择性地结合。在一些实施方案中,所述一种或多种核酸酶的DNA结合结构域与TRNL1、ND1、ND5、TRNK、ATP6、ND4、ND6、TRNE、RNR1、TRNS、CYB、CYTb、12SrRNA和/或ND3线粒体基因中的所选位置结合。

在另一方面,本文描述了编码一种或多种核酸酶(例如,本文所述的ZFN、CRISPR/Cas系统、Ttago和/或TALEN)的一种或多种多核苷酸。在某些实施方案中,同一多核苷酸编码一种核酸酶(例如,成对核酸酶的左单体和右单体两者或CRISPR/Cas系统的所有组分),而在其他实施方案中,单独多核苷酸用于所述核酸酶的组分(例如,第一多核苷酸编码成对核酸酶的一个成员(例如,左成员/单体)并且第二多核苷酸编码成对核酸酶的另一成员(例如,右单体/成员))。所述多核苷酸可以在病毒或非病毒载体中配制,所述载体包括但不限于AAV、Ad、逆转录病毒载体等,以及在mRNA、质粒、微环DNA等中配制。在某些实施方案中,所述载体被靶向至特定组织或器官,例如,AAV载体被靶向至心脏(心脏组织)。在某些实施方案中,所述核酸酶是包含左ZFN和右ZFN的ZFN,单独配制为AAV载体组合物并且同时给予(例如,配制为包含两种AAV载体的单一药物组合物)。

在另一方面,本文描述了一种ZFN、CRISPR/Cas系统、Ttago和/或TALEN表达载体,其包含编码如本文所述的一种或多种核酸酶(例如,ZFN、CRISPR/Cas系统、Ttago和/或TALEN)的与启动子可操作连接的多核苷酸。在一个实施方案中,所述表达载体是病毒载体(例如,AAV载体)。在一方面,所述病毒载体展现出组织特异性嗜性。

在另一方面,本文描述了一种包含一种或多种核酸酶(例如,ZFN、CRISPR/Cas系统、Ttago和/或TALEN)表达载体的宿主细胞。

在另一方面,提供了包含如本文所述的表达载体(例如,包含一种或多种核酸酶的一种或多种组分)的药物组合物。在一些实施方案中,所述药物组合物可以包含多于一种表达载体。在一些实施方案中,所述药物组合物包含具有第一多核苷酸的第一表达载体和具有第二多核苷酸的第二表达载体。在一些实施方案中,所述第一多核苷酸和所述第二多核苷酸是不同的。在一些实施方案中,所述第一多核苷酸和所述第二多核苷酸是基本上相同的。在某些实施方案中,所述药物组合物包含编码ZFN对的左单体的第一AAV载体和/或编码所述ZFN对的右单体的第二AAV载体。在某些实施方案中,所述药物组合物(例如,包含多核苷酸(诸如包含一个或两个单体的AAV载体)的药物)的浓度在1x1010至1x1014(或其间的任一值)个载体基因组(vg)/细胞或受试者之间。在一些实施方案中,所述药物组合物的浓度是1x1012、5x1012或1x1013个vg/细胞或受试者(例如,通过尾静脉注射)。所述药物组合物适于向受试者递送,包括但不限于系统性、腹膜内、静脉内、肌内、粘膜或局部递送方法或其组合。所述药物组合物还可以包含供体序列(例如,编码在疾病或障碍诸如线粒体障碍中缺少或缺乏的蛋白质的转基因)。在一些实施方案中,所述供体序列与表达载体缔和。

在一些实施方案中,提供了包含DNA结合结构域(例如,锌指蛋白或TALE或sgRNA或大范围核酸酶)和野生型或工程化切割结构域或切割半结构域的融合蛋白。

在另一方面,本文描述了包含一种或多种本文所述的核酸酶(例如,ZFN、TALEN、TtAgo和/或CRISPR/Cas系统)的组合物,所述核酸酶包括包含DNA结合分子(例如,ZFP、TALE、sgRNA等)和核酸酶(切割)结构域的核酸酶。在某些实施方案中,所述组合物包含与药学上可接受的赋形剂组合的一种或多种核酸酶。在一些实施方案中,所述组合物包含两组或更多组(对)核酸酶,每组具有不同的特异性。在其他方面,所述组合物包含不同类型的核酸酶。在一些实施方案中,所述组合物包含编码mtDNA特异性核酸酶的多核苷酸,而在其他实施方案中,所述组合物包含mtDNA特异性核酸酶蛋白。在某些实施方案中,所述组合物适于向受试者递送,包括经由系统性递送。

在另一方面,本文描述了一种编码本文所述的一种或多种核酸酶或核酸酶组分(例如,ZFN、TALEN、TtAgo或CRISPR/Cas系统的核酸酶结构域)的多核苷酸。所述多核苷酸可以是例如mRNA或DNA。在一些方面,所述mRNA可以进行化学修饰(参见例如,Kormann等人,(2011)Nature Biotechnology 29(2):154-157)。在其他方面,所述mRNA可以包含ARCA帽(参见美国专利号7,074,596;和8,153,773)。在另外的实施方案中,所述mRNA可以包含未经修饰和经修饰的核苷酸的混合物(参见美国专利公开号2012/0195936)。在另一方面,本文描述了一种核酸酶表达载体,其包含编码本文所述的一种或多种ZFN、TALEN、TtAgo或CRISPR/Cas系统的与启动子可操作连接的多核苷酸。在一个实施方案中,所述表达载体是病毒载体,例如AAV载体。

在另一方面,本文描述了一种包含如本文所述的一种或多种核酸酶、一种或多种核酸酶表达载体的宿主细胞。在某些实施方案中,所述宿主细胞包含其中突变体mtDNA的量减少或消除,从而使所述细胞中的mtDNA的异质性比率偏移(与野生型细胞相比)。在某些实施方案中,所述异质性比率朝向野生型(非突变体mtDNA)偏移至少5%或更多,优选地至少10%或更多,并且甚至更优选地至少20%或更多。所述宿主细胞可以用一种或多种核酸酶表达载体稳定转化或瞬时转染或其任何组合。在其他实施方案中,所述一种或多种核酸酶表达载体在所述宿主细胞中表达一种或多种核酸酶。在另一个实施方案中,所述宿主细胞还可以包含外源多核苷酸供体序列。在本文所述的任何实施方案中,所述宿主细胞可以包括胚胎细胞,例如一种或多种小鼠、大鼠、兔或其他哺乳动物细胞胚胎(例如,非人灵长类动物)。在一些实施方案中,所述宿主细胞包括组织。还描述了由本文所述的细胞产生或演变而来的细胞或细胞系,包括包含mtDNA的修饰(例如,mtDNA的异质性比率)的多能、全能、多潜能或分化细胞。在某些实施方案中,本文描述了包含如本文所述的修饰的如本文所述的分化细胞,所述分化细胞由如本文所述的干细胞演变而来。在某些实施方案中,所述宿主细胞是心脏细胞或干细胞,例如造血干细胞或诱导型多能干细胞。

在另一方面,本文描述了一种用于在细胞中切割mtDNA基因的方法,所述方法包括:(a)在使靶向mtDNA的一种或多种核酸酶表达并切割所述mtDNA的条件下,将编码所述一种或多种核酸酶的一种或多种多核苷酸引入所述细胞中。在某些实施方案中,与野生型mtDNA相比,选择性地切割突变体mtDNA。这导致突变体mtDNA:野生型mtDNA的异质性比率的偏移。任选地,所述方法还包括向所述细胞给予供体(例如,治疗性蛋白质),所述供体可以被整合到细胞的基因组中或mtDNA中。一种或多种供体核酸酶的整合经由同源定向修复(HDR)或通过非同源末端接合(NHEJ)相关的修复发生。此外,可以使用递送系统中的任一种或组合(例如,非病毒载体、LNP或病毒载体)将所述一种或多种核酸酶编码多核苷酸和/或供体引入所述细胞中。在某些实施方案中,使用对于某些细胞、组织和/或器官类型具有特异性的载体,例如对于心脏组织、脑组织、肺组织、肌肉组织等具有特异性的AAV载体。在某些实施方案中,突变体mtDNA的切割使异质性朝着野生型(例如,包括部分或完全恢复到野生型序列)序列偏移,从而治疗和/或预防有需要的受试者的线粒体疾病。在某些实施方案中,被切割并恢复为野生型的突变体mtDNA包含点突变(例如,5024C>T)。

在本文所述的任何组合物或方法中,所述一种或多种多核苷酸可以按提供所需效应的任何浓度(剂量)来提供和/或递送。在优选实施方案中,所述一种或多种多核苷酸是使用腺相关病毒(AAV)载体以10,000-1x1014个或更多个载体基因组/细胞或受试者(或其间的任一值)来递送。在某些实施方案中,所述一种或多种多核苷酸是使用慢病毒载体以250与1,000之间(或其间的任一值)的MOI来递送。在其他实施方案中,所述一种或多种多核苷酸是使用质粒载体以150-1,500ng/100,000个细胞(或其间的任一值)来递送。在其他实施方案中,所述一种或多种多核苷酸是作为mRNA以150-1,500ng/100,000个细胞(或其间的任一值)来递送。在递送两个或更多个多核苷酸时,所述载体可以是相同的或不同的载体,并且相同的载体可以以任何比率,包括但不限于1:1比率递送。在某些实施方案中,使用两个AAV载体以任何浓度/单体,包括但不限于1x1010至1x1014(或其间的任何值),任选地以5x1012个vg/单体递送成对核酸酶(例如,包含MTM25单体和WTM1单体的ZFN)的组分。在某些实施方案中,单独单体的剂量或可替代地总剂量(两个单体)是1x1012、5x1012或1x1013个vg/细胞或受试者(例如,通过尾静脉注射)。在一些实施方案中,所述ZFN以如下剂量给予:5e12个vg/kg的总AAV剂量(例如,每个AAV-ZFN单体的2.5e12个vg/kg);1e13个vg/kg的总AAV剂量(例如,每个AAV-ZFN单体的0.5e13个vg/kg);5e13个vg/kg的总AAV剂量(例如,每个AAV-ZFN单体的2.5e13个vg/kg);1e14个vg/kg的总AAV剂量(例如,每个AAV-ZFN单体的0.5e14个vg/kg);5e14个vg/kg的总AAV剂量(例如,每个AAV-ZFN单体的2.5e14个vg/kg);或1e15个vg/kg的总AAV剂量(例如,每个AAV-ZFN单体的0.5e15个vg/kg)。在某些实施方案中,所述AAV通过静脉内注射来给予。

在又另一方面,本文提供了一种包含经遗传修饰的mtDNA的细胞,例如通过减少和/或消除细胞中的突变体mtDNA来改变野生型与突变体mtDNA的异质性比率的细胞。在某些实施方案中,与来自患有线粒体障碍的受试者的细胞相比,所述细胞异质性比率降低。通过由对于mtDNA的突变体形式具有特异性的核酸酶(例如,这样的核酸酶,其靶向至如表2所示或涵盖以下突变中的一种或多种的9-20个或更多个碱基对的序列:1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C或14709C)切割突变体mtDNA之后的降解,从所述细胞减少和/或消除所述突变体mtDNA。促成降解的切割可以在所述一个或多个靶位点和/或一个或多个切割位点内和/或在所述靶序列的9-18个或更多个碱基对的靶位点的边缘的1-50个碱基对内。如本文所述的经修饰的细胞可以被分离或者可以在受试者,例如患有线粒体障碍的受试者内。

在本文所述的任何方法和组合物中,所述细胞可以是任何真核细胞。在某些实施方案中,所述细胞是分化细胞,例如心脏细胞、脑细胞、肝细胞、肾细胞、肌肉细胞、神经细胞、肠细胞、眼细胞和/或耳细胞等。在其他实施方案中,所述细胞是干细胞。在其他实施方案中,所述细胞是患者来源的,例如自体CD34+(造血)干细胞(例如,经由粒细胞集落刺激因子(GCSF)给予在患者中从骨髓动员至外周血中)。可以收获、纯化、培养CD34+细胞,并且通过任何合适的方法将核酸酶引入细胞中。

在另一方面,本发明的方法和组合物提供如本文所述的组合物(核酸酶、药物组合物、多核苷酸、表达载体、细胞、细胞系和/或动物诸如转基因动物)例如用于治疗和/或预防线粒体疾病的用途。在某些实施方案中,这些组合物用于筛选用于治疗线粒体障碍的药物文库和/或其他治疗组合物(即,抗体、结构RNA等)。此类筛选可以在细胞水平上从操纵的细胞系或原代细胞开始,并且可以进行到整个动物(例如,兽医或人类疗法)的治疗水平。因此,在某些方面,本文描述了一种治疗和/或预防有需要的受试者的线粒体疾病的方法,所述方法包括向所述受试者给予如本文所述的一种或多种核酸酶、多核苷酸和/或细胞。所述方法可以是离体或在体内的。在某些实施方案中,向所述受试者给予如本文所述的细胞。在本文所述的任何方法中,所述细胞可以是源自所述受试者的干细胞(患者来源的干细胞)。

在本文所述的任何组合物和方法中,将所述核酸酶以mRNA形式和/或使用一种或多种非病毒、LNP或病毒载体引入。在某些实施方案中,将所述一种或多种核酸酶以mRNA形式引入。在其他实施方案中,将所述一种或多种核酸酶使用病毒载体引入,所述病毒载体例如腺相关载体(AAV)(包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV 8.2、AAV9、AAV rh10、AAV2/8、AAV2/5和AAV2/6)或经由慢病毒或整合缺陷慢病毒载体。

一旦递送到所述细胞,就转录和/或翻译所述一种或多种核酸酶,并且所述核酸酶蛋白被所述线粒体吸收。因此,在一些实施方案中,所述一种或多种核酸酶包含线粒体靶向肽(参见例如,美国专利号9,139,628;Omuta(1998)J.Biochem 123(6):1010-6)。在某些实施方案中,使用组织或细胞特异性载体,例如对于心脏(心脏组织)具有特异性的载体。

可以使用本发明的组合物和方法来修饰任何细胞,包括但不限于原核细胞或真核细胞,诸如细胞、昆虫、酵母、鱼、哺乳动物(包括非人哺乳动物)和植物细胞。在某些实施方案中,所述细胞是心脏细胞、脑细胞、肝细胞、脾细胞、肠细胞或免疫细胞,例如T细胞(例如,CD4+、CD3+、CD8+等)、树突细胞、B细胞等。在其他实施方案中,所述细胞是多能、全能或多潜能细胞,例如诱导型多能干细胞(iPSC)、造血干细胞(例如,CD34+)、胚胎干细胞等。可以用于本发明的方法和组合物的特定干细胞类型包括胚胎干细胞(ESC)、诱导型多能干细胞(iPSC)和造血干细胞(例如,CD34+细胞)。所述iPSC可以源自患者样品和/或正常对照,其中患者来源的iPSC可以在目的基因处突变为正常或野生型基因序列,或者可以将正常细胞在目的基因处改变为已知疾病等位基因。类似地,造血干细胞可以从患者或从供体分离。

因此,本文描述了用于改变mtDNA基因组的方法和组合物,包括但不限于选择性切割突变体mtDNA以改变细胞、器官和/或组织(例如,有需要的受试者的细胞、器官和/或组织)中的突变体与野生型mtDNA的异质性比率,从而治疗和/或预防线粒体疾病。所述组合物和方法可以在体外、体内或离体使用,并且包括给予人工转录因子或包含靶向至mtDNA的DNA结合结构域的核酸酶。

还提供了试剂盒,其包含本发明的核酸、核酸酶和/或细胞。所述试剂盒可以包含编码所述核酸酶的核酸(例如,合适表达载体中所包含的编码RNA分子或ZFN、TALEN、TtAgo或CRISPR/Cas系统的基因)、或所述核酸酶蛋白质的等分试样、供体分子、合适的干性调节剂、细胞、用于进行本发明方法的说明书等。

从整体而言鉴于本公开文本,这些和其他方面对于技术人员来说都是易于清楚的。

附图说明

图1A至图1G描绘了靶向至线粒体DNA的核酸酶和体内mtDNA异质性修饰的设计。图1A是示出了与野生型和突变体基因组中m.5024上游的序列(SEQ ID NO:1)结合的单体“WTM1”和由于靶位点中的C>T突变(由*指示)而优先与突变位点(SEQ ID NO:2)结合的突变体特异性单体“MTM25”的示意图。强制性异二聚体FokI结构域的二聚化产生DNA双链断裂,从而导致突变体mtDAN的特异性缺失。图1B描绘了用于筛选靶向至小鼠mtDNA的核酸酶的文库(左图)和筛选测定(右图)的示意图。对于筛选,将MTM(n)mtZFN文库(标记为“MTM(n)”)克隆到含有核糖体口吃T2A位点(“2A”)、WTM1 mtZFN(“WTM1”)和锤头状核酶(“HHR”)的骨架中,使得所述骨架也共表达来自单独启动子(SV40)的mCherry。将这些构建体转染到具有m.5024C>T的小鼠胚胎成纤维细胞(MEF)中,在24小时通过荧光激活细胞分选(FACS)分选转染子;通过焦磷酸测序测定提取的DNA和转染的成纤维细胞中的异质性偏移。图1C示出了在不同浓度下通过四环素敏感性HHR 7促进的来自用对照或MTM25/WTM1转染的MEF的m.5024C>T异质性的焦磷酸测序分析的结果。根据不同的测试条件对m.5024C>T异质性的变化(“Δm.5024C>T(%)”)进行作图。“utZFN”是在小鼠mtDNA 7中不具有靶位点的mtZFN。n=4-8。误差条指示SD。进行的统计分析:双尾学生t检验***p<0.01。图1D是描绘体内实验的示意图。在单独的AAV基因组中编码MTM25和WTM1,将所述基因组包裹在AAV9.45中,然后同时系统性地(尾静脉)给予。在注射后65天将动物处死。图1E示出了来自注射MTM25和/或WTM1的动物的总心脏蛋白的蛋白质印迹分析。两种蛋白质均包括HA标签并且根据分子量区分。图1E示出了来自耳和心脏总DNA的m.5024C>T异质性的焦磷酸测序分析。对这些之间的m.5024C>T变化(Δ)进行作图。n=4-20(表S1)。误差条指示SEM。进行的统计分析:双尾学生t检验。***p<0.001。图1F示出了通过qPCR进行的mtDAN拷贝数的分析。每个正方形指示一个动物。n=4-8(表S1)。误差条指示SEM。进行的统计分析:双尾学生t检验**p<0.01。

图2A至图2E描绘了m.5024C>T mtDNA异质性的减少导致活受试者中的表型救援。图2A是由m.5024C>T突变编码的mt-tRNA:ALA的例示。圆圈指示由于5024C>T突变插入的突变体“A”的位置。鉴于此突变的性质和位置,含有突变错配的转录的tRNA分子不太可能正确地折叠或氨基酰化,从而导致在高水平的m.5024C>T异质性下mt-tRNA:ALA的稳态水平降低。图2B示出了总心脏RNA提取物的northern印迹分析的量化。将mt-tRNA丰度针对5S rRNA归一化。n=4-6。误差条指示SEM。进行的统计分析:双尾学生t检验。***p<0.001。所述数据指示与未处理的细胞相比,在用WTM1/MTM25ZFN对处理的细胞中,如针对mt tRNA:CYS归一化的mt tRNA:ALA的存在增加。图2C描绘了用于评估mt-tRNAALA分子表型救援的生理作用的中间剂量(5e12个vg/动物)AAV处理的小鼠和年龄/初始异质性匹配的(媒介物处理的)对照的代谢物组学数据的主成分分析(PCA)图。每个正方形指示一个动物(参见实施例2)。图2D示出了通过LC/MS进行的来自中间剂量AAV处理的小鼠(右条“+AAV”)和年龄/初始异质性匹配的对照(左条“VEH”)的小鼠心脏组织的总代谢物丰度(左图中的磷酸烯醇丙酮酸盐;中间图中的丙酮酸盐;右图中的乳酸盐)的测量值。上图中描绘了最终糖酵解代谢物的化学结构和连接这些代谢物的反应。误差条指示SEM。进行的统计分析:单尾学生t检验。*p<0.05。图2E示出了来自小鼠心脏组织的初始反应物和糖酵解途径的产物的化学结构(上图)和体内丰度。与对照(左条“VEH”)相比,经处理的动物心脏中升高的葡萄糖水平(左图)结合降低的下游代谢物丰度(中间图中所示的葡萄糖-6-磷酸盐和右图中所示的果糖-6-磷酸盐)促成了在经处理的动物(右条“+AAV”)中观察到线粒体代谢恢复和有氧糖酵解增强的谱。

具体实施方式

本文公开了用于mtDNA的靶向修饰(包括选择性切割突变体mtDNA)使得mtDNA的异质性偏移并且实现分子和生物化学表型向野生型的逆转的组合物和方法。

本发明设想了对mtDNA的遗传修饰,包括但不限于选择性切割mtDNA以用于治疗和/或预防有需要的受试者中任何遗传来源的线粒体疾病。任何突变体mtDNA可以被DNA结合结构域靶向,所述突变体mtDNA包括但不限于m.5024C>T、1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C和/或14709C。

概述

除非另有指示,否则方法的实践以及本文所公开的组合物的制备和使用采用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和相关领域的常规技术,这些技术是本领域所熟知的。这些技术在文献中有充分解释。参见例如,Sambrook等人,MOLECULAR CLONING:A LABORATORY MANUAL,第二版,Cold Spring Harbor LaboratoryPress,1989和第三版,2001;Ausubel等人,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley&Sons,纽约,1987和定期更新;丛书METHODS IN ENZYMOLOGY,Academic Press,圣地亚哥;Wolffe,CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic Press,圣地亚哥,1998;METHODS IN ENZYMOLOGY,第304卷,“Chromatin”(P.M.Wassarman和A.P.Wolffe编辑),Academic Press,圣地亚哥,1999;和METHODS IN MOLECULAR BIOLOGY,第119卷,“Chromatin Protocols”(P.B.Becker编辑)Humana Press,托托瓦,1999。

定义

术语“核酸”、“多核苷酸”和“寡核苷酸”可互换使用,并且是指呈线性或环状构象并且呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。出于本公开文本的目的,不应将这些术语视为在聚合物的长度方面加以限制。这些术语可以涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(例如,硫代磷酸酯骨架)中被修饰的核苷酸。通常,特定核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T进行碱基配对。

术语“多肽”、“肽”和“蛋白质”可互换使用,是指氨基酸残基的聚合物。所述术语还适用于如下氨基酸聚合物,其中一个或多个氨基酸是对应天然存在的氨基酸的化学类似物或经修饰衍生物。

“结合”是指高分子之间(例如,蛋白质与核酸之间)的序列特异性非共价相互作用。并非结合相互作用的所有组分都需要是序列特异性的(例如,与DNA骨架中的磷酸残基接触),只要所述相互作用作为整体是序列特异性的即可。此类相互作用的特征通常是解离常数(Kd)为10-6M-1或更低。“亲和力”是指结合强度:增强的结合亲和力与较低的Kd相关。

“结合结构域”是能够与另一分子非共价结合的分子。结合分子可以与例如DNA分子(DNA结合蛋白,诸如锌指蛋白或TAL-效应子结构域蛋白或单一指导RNA)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)结合。在蛋白质结合分子的情况下,其可以与自身结合(以形成同二聚体、同三聚体等),和/或其可以与一种或多种不同蛋白质的一个或多个分子结合。结合分子可以具有多于一种类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白质结合活性。因此,DNA结合分子(包括人工核酸酶和转录因子的DNA结合组分)包括但不限于ZFP、TALE和sgRNA。

“锌指DNA结合蛋白”(或结合结构域)是蛋白质或较大蛋白质内的结构域,其以序列特异性方式通过一个或多个锌指结合DNA,所述锌指是结合结构域内的氨基酸序列区域,所述结合结构域的结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。人工核酸酶和转录因子可以包含ZFP DNA结合结构域和功能结构域(ZFN的核酸酶结构域或ZFP-TF的转录调节结构域)。术语“锌指核酸酶”包括一种ZFN以及二聚化以切割靶基因的ZFN对(包括第一ZFN和第二ZFN,也称为左ZFN和右ZFN)。

“TALE DNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。重复结构域参与TALE与其同源靶DNA序列的结合。单个“重复单元”(也称为“重复”)的长度通常为33-35个氨基酸,并且表现出与天然存在的TALE蛋白中的其他TALE重复序列具有至少一些序列同源性。参见例如,美国专利号8,586,526。人工核酸酶和转录因子可以包含TALE DNA结合结构域和功能结构域(TALEN的核酸酶结构域或TALEN-TF的转录调节结构域)。术语“TALEN”包括一种TALEN以及二聚化以切割靶基因的TALEN对(包括第一TALEN和第二TALEN,也称为左TALEN和右TALEN)。

锌指和TALE结合结构域可以“被工程化”以与预先确定的核苷酸序列结合,例如通过工程化(改变一个或多个氨基酸)天然存在的锌指或TALE蛋白的识别螺旋区。因此,工程化DNA结合蛋白(锌指或TALE)是非天然存在的蛋白质。工程化DNA结合蛋白的方法的非限制性例子是设计和选择。设计的DNA结合蛋白是在自然界中不存在的蛋白质,其设计/组成主要源自合理标准。设计的合理标准包括应用替换规则和计算机化算法,以用于处理存储现有ZFP和/或TALE设计和绑定数据的信息的数据库中的信息。参见,例如,美国专利号6,140,081;6,453,242;6,534,261;和8,585,526;还参见国际专利公开号WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536;和WO 03/016496。

“所选择的”锌指蛋白或TALE是并非在自然界中发现的蛋白质,其产生主要源自经验过程,诸如噬菌体展示、相互作用陷阱或杂交体选择。参见例如,美国专利号5,789,538;5,925,523;6,007,988;6,013,453;6,200,759;8,586,526;以及国际专利公开号WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;和WO 02/099084。

“TtAgo”是原核Argonaute蛋白,被认为参与基因沉默。TtAgo源自细菌嗜热栖热菌(Thermus thermophilus)。参见例如,Swarts等人,同上,G.Sheng等人,(2013)Proc.Natl.Acad.Sci.U.S.A.111,652)。“TtAgo系统”是所需的所有组分,包括例如用于通过TtAgo酶切割的指导DNA。

“重组”是指两个多核苷酸之间交换遗传信息的过程,包括但不限于通过非同源末端接合(NHEJ)进行的供体捕捉以及同源重组。出于本公开文本的目的,“同源重组(HR)”是指这种交换的特化形式,其发生于例如细胞中的双链断裂通过同源定向修复机制修复期间。这个过程需要核苷酸序列同源性,使用“供体”分子模板修复“靶”分子(即,经历双链断裂的分子),并且因为其导致遗传信息从供体转移至靶标,被不同地称为“非交换型基因转化”或“短束基因转化”。不希望受任何特定理论约束,这种转移可以涉及在断裂的靶标与供体之间形成的异源双链体DNA的错配修正,和/或“合成依赖性链退火”(其中使用供体重合成将成为靶标的一部分的遗传信息),和/或相关过程。这种特化的HR通常导致靶分子序列的改变,使得供体多核苷酸的部分或全部序列掺入靶多核苷酸中。

在本公开文本的方法中,如本文所述的一种或多种靶向核酸酶在预先确定的位点处在靶序列(例如,细胞染色质)中产生双链断裂(DSB)。DSB可以通过同源定向修复或通过非同源定向修复机制产生缺失和/或插入。缺失可以包括任何数量的碱基对。类似地,插入可以包括任何数量的碱基对,包括例如整合任选地与断裂区域中的核苷酸序列具有同源性的“供体”多核苷酸。供体序列可以是物理整合的,或可替代地,供体多核苷酸用作通过同源重组修复断裂的模板,导致将供体中的全部或部分核苷酸序列引入细胞染色质中。因此,可以改变细胞染色质中的第一序列,并且在某些实施方案中,可以将所述第一序列转换为供体多核苷酸中存在的序列。因此,术语“替代”(“replace”或“replacement”)的使用可以理解为代表一个核苷酸序列被另一个核苷酸序列替代(即,在信息意义上的序列替代),并且不一定需要将一个多核苷酸物理地或化学地被另一个多核苷酸替代。

在本文描述的任何方法中,另外的锌指蛋白对、TALEN、TtAgo或CRISPR/Cas系统可以用于细胞内另外的靶位点的另外的双链切割。

本文所述的任何方法可以用于通过靶向整合供体序列(其破坏一个或多个目的基因表达)而插入任何大小的供体和/或使细胞中的一种或多种靶序列部分或完全失活。还提供了具有部分或完全失活的基因的细胞系。

在本文所述的任何方法中,外源核苷酸序列(“供体序列”或“转基因”)可以包含与目的区域中的基因组序列同源但不相同的序列,从而刺激同源重组以在目的区域中插入不同序列。因此,在某些实施方案中,与目的区域中的序列同源的供体序列的部分相对于被替代的基因组序列展现出约80%至99%(或其间的任何整数)的序列同一性。在其他实施方案中,供体与基因组序列之间的同源性高于99%,例如,如果超过100个连续碱基对的供体和基因组序列之间只有1个核苷酸不同。在某些情况下,供体序列的非同源部分可以包含在目的区域中不存在的序列,从而将新序列引入目的区域中。在这些情况下,通常非同源序列的侧翼为与目的区域中的序列同源或相同的50-1,000个碱基对(或其间的任何整数值)或大于1,000的任意数量的碱基对的序列。在其他实施方案中,供体序列与第一序列非同源,并通过非同源重组机制插入基因组中。

“切割”是指DNA分子的共价骨架的断裂。切割可以通过各种方法进行,所述方法包括但不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割都是可能的,并且作为两个不同的单链切割事件的结果,可以发生双链切割。DNA切割可以使得产生平端或交错端。在某些实施方案中,融合多肽用于靶向双链DNA切割。

“切割半结构域”是多肽序列,其结合第二多肽(相同的或不同的)形成具有切割活性(优选地双链切割活性)的复合物。术语“第一和第二切割半结构域”、“+和-切割半结构域”和“左和右切割半结构域”可互换使用,以指二聚化的切割半结构域对。

“工程化切割半结构域”是已经被修饰以便与另一个切割半结构域(例如,另一个工程化切割半结构域)形成专性异二聚体的切割半结构域。还参见,美国专利号8,623,618;7,888,121;7,914,796;和8,034,598,其通过引用以其整体并入本文。

术语“序列”是指任何长度的核苷酸序列,其可以是DNA或RNA;可以是线性、环状或分支的,并且可以是单链或双链的。术语“供体序列”是指被插入基因组中的核苷酸序列。供体序列可以具有任何长度,例如长度介于2与100,000,000个核苷酸之间(或其间或高于其的任何整数值),优选地长度介于约100与100,000个核苷酸之间(或其间的任何整数),更优选地长度介于约2000与20,000个核苷酸之间(或其间的任何值)并且甚至更优选地介于约5与15kb之间(或其间的任何值)。

“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白质(包含组蛋白和非组蛋白染色体蛋白)。大多数的真核细胞染色质以核小体的形式存在,其中核小体核心包含约150个碱基对的DNA,所述DNA与八聚体相缔合,所述八聚体包含组蛋白H2A、H2B、H3和H4各两个,并且接头DNA(长度可变,取决于生物体)在核小体核心之间延伸。组蛋白H1分子通常与接头DNA相缔合。出于本公开文本的目的,术语“染色质”意为涵盖原核和真核的所有类型的细胞核蛋白。细胞染色质包含染色体和游离型染色质。

“染色体”是包含细胞基因组的全部或一部分的染色质复合物。细胞的基因组通常以其核型为特征,所述核型是包含所述细胞基因组的所有染色体的集合。细胞的基因组可以包含一条或多条染色体。

“附加体”是复制型核酸,核蛋白复合物或包含不属于细胞染色体核型的一部分的核酸的其他结构。附加体的例子包括质粒和某些病毒基因组。

“可接近区域”是细胞染色质中的位点,其中存在于核酸中的靶位点可以被识别所述靶位点的外源分子结合。不希望受任何具体理论的限制,据信可接近区域是未包装到核小体结构中的区域。可接近区域的不同结构可以经常通过其对于化学和酶促探针(例如核酸酶的)敏感性来检测。

“靶位点”或“靶序列”是定义核酸的一部分的核酸序列,结合分子将结合所述部分,前提是存在用于结合的充分条件。靶位点可以具有任何长度,例如9至20个或更多个核苷酸,并且长度和结合的核苷酸可以是连续的或非连续的。

“外源”分子是正常地在细胞中不存在但可以通过一种或多种遗传、生物化学或其他方法引入细胞中的分子。“在细胞中正常存在”是关于细胞的特定发育阶段和环境条件来确定。因此,例如,仅在肌肉的胚胎发育期间存在的分子是关于成体肌肉细胞的外源分子。类似地,通过热休克引入的分子是关于非热休克细胞的外源分子。外源分子可以包含例如功能失常的内源分子的功能形式或功能正常的内源分子的功能失常形式。

外源分子尤其可以是小分子,如通过组合化学工艺产生的小分子,或高分子,如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何经修饰衍生物、或者包含一种或多种上述分子的任何复合物。核酸包括DNA和RNA,可以是单链或双链的;可以是线性、分支或环状的;并且可以是任何长度。核酸包括能够形成双螺旋的那些,以及形成三螺旋的核酸。参见,例如,美国专利号5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重构因子、甲基化的DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰基酯酶、脱乙酰酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解螺旋酶。

外源分子可以是与内源分子类型相同的分子,例如,外源蛋白质或核酸。例如,外源核酸可以包含引入细胞中的感染性病毒基因组、质粒或游离体,或正常地在细胞中不存在的染色体。将外源分子引入细胞中的方法是本领域技术人员已知的,并且包括但不限于脂质介导的转移(即,脂质体,包括中性和阳离子型脂质)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子还可以是与内源分子类型相同,但源自与细胞来源不同的物种的分子。例如,可以将人类核酸序列引入最初源自小鼠或仓鼠的细胞系中。

相比之下,“内源”分子是在特定发育阶段在特定环境条件下在特定细胞中正常存在的分子。例如,内源核酸可以包含染色体、线粒体、叶绿体或其他细胞器的基因组、或天然存在的游离型核酸。其他内源分子可以包括蛋白质,例如转录因子和酶。

如本文所用,术语“外源核酸的产物”包括多核苷酸和多肽产物,例如转录产物(多核苷酸诸如RNA)和翻译产物(多肽)。

“融合”分子是其中两个或更多个亚单元分子被连接(优选地共价连接)的分子。亚单元分子可以是相同化学类型的分子,或者可以是不同化学类型的分子。第一类型的融合分子的例子包括但不限于融合蛋白(例如,ZFP或TALE DNA结合结构域与一个或多个激活结构域之间的融合物)和融合核酸(例如,编码上述融合蛋白的核酸)。第二类型的融合分子的例子包括但不限于形成三螺旋的核酸与多肽之间的融合物,以及小沟结合物与核酸之间的融合物。

细胞中融合蛋白的表达可以源自将融合蛋白递送至细胞或通过将编码融合蛋白的多核苷酸递送至细胞来获得,其中多核苷酸发生转录,并且转录物发生翻译,以产生融合蛋白。反式剪接、多肽切割和多肽连接也可以参与蛋白质在细胞中的表达。将多核苷酸和多肽递送至细胞的方法呈现于本公开文本中的其他地方。

出于本公开文本的目的,“基因”包括编码基因产物(参见下文)的DNA区域,以及所有调节基因产物的产生的DNA区域,不论此类调节序列是否与编码序列和/或所转录序列相邻。因此,基因包括但不必限于启动子序列、终止子、翻译调控序列(诸如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区域。

“基因表达”是指将基因中包含的信息转化为基因产物。基因产物可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核糖酶、结构RNA或任何其他类型的RNA)或mRNA翻译产生的蛋白质。基因产物还包括通过诸如加帽、聚腺苷酸化、甲基化和编辑等方法修饰的RNA,以及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP核糖基化、豆蔻酰化(myristilation)和糖基化修饰的蛋白质。

对基因表达的“调节”是指基因活性的变化。对表达的调节可以包括但不限于基因激活和基因阻遏。基因组编辑(例如,切割、改变、失活、随机突变)可以用于调节表达。基因失活是指如与不包括如本文所述的ZFP、TALE、TtAgo或CRISPR/Cas系统的细胞相比,基因表达的任何减少。因此,基因失活可以是部分失活或完全失活。

“目的区域”是细胞染色质的任何区域,例如像基因或者基因内或与基因相邻的非编码序列,其中可期望所述区域结合外源分子。结合可以用于所靶向DNA切割和/或所靶向重组的目的。例如,目的区域可以存在于染色体、游离体、细胞器基因组(例如,线粒体、叶绿体)或感染性病毒基因组中。目的区域可以位于基因的编码区内,位于经转录非编码区内(例如前导序列、尾随序列或内含子),或位于在编码区上游或下游的非转录区内。目的区域的长度可以小至单一核苷酸对或多达2,000个核苷酸对,或任何整数值的核苷酸对。

“真核”细胞包括但不限于真菌细胞(诸如酵母)、植物细胞、动物细胞、哺乳动物细胞和人类细胞(例如,T细胞),包括干细胞(多能和多潜能)。

关于两个或更多个组分(诸如序列元件)的并列,术语“操作性连接”和“操作性地连接”(或“可操作连接”)可互换使用,其中所述组分经排列使得两个组分正常发挥功能并允许以下可能性:至少一个所述组分可以介导对至少一个其他组分发挥的功能。通过说明,如果转录调节序列响应一种或多种转录调节因子的存在或不存在控制编码序列的转录水平,那么转录调节序列(诸如启动子)与编码序列操作性连接。转录调节序列通常与编码序列顺式操作性连接,但无需与其直接相邻。例如,增强子是与编码序列操作性连接的转录调节序列,即使其不邻接。

关于功能多肽,术语“操作性连接”可以指以下事实:每个组分在与另一组分连接时发挥的功能与其没有如此连接时发挥的功能相同。例如,关于其中ZFP、TALE、TtAgo或CasDNA结合结构域与激活结构域融合的融合多肽,如果在功能多肽中,ZFP、TALE、TtAgo或CasDNA结合结构域部分能结合其靶位点和/或其结合位点,同时激活结构域能上调基因表达,那么ZFP、TALE、TtAgo或Cas DNA结合结构域和激活结构域呈操作性连接。在融合多肽中的ZFP、TALE、TtAgo或Cas DNA结合结构域与切割结构域融合时,如果在融合多肽中,ZFP、TALE、TtAgo或Cas DNA结合结构域部分能结合其靶位点和/或其结合位点,同时切割结构域能切割靶位点附近的DNA,那么ZFP、TALE、TtAgo或Cas DNA结合结构域和切割结构域呈操作性连接。

蛋白质、多肽或核酸的“功能性片段”是蛋白质、多肽或核酸,其序列与全长蛋白质、多肽或核酸不同,但保留与全长蛋白质、多肽或核酸相同的功能。功能性片段可以具有与相应的天然分子相比较多、较少或相同的残基数,和/或可以含有一个或多个氨基酸或核苷酸取代。确定核酸功能(例如,编码功能、与另一核酸杂交的能力)的方法是本领域所熟知的。类似地,确定蛋白质功能的方法是熟知的。例如,多肽的DNA结合功能可以例如通过滤膜结合、电泳迁移率变动或免疫沉淀测定来确定。DNA切割可以通过凝胶电泳来测定。参见Ausubel等人,同上。蛋白质与另一蛋白质相互作用的能力可以例如通过免疫共沉淀、双杂交测定或互补(遗传和生物化学二者)来确定。参见例如,Fields等人(1989)Nature 340:245-246;美国专利号5,585,245和国际专利公开号WO 98/44350。

“载体”能将基因序列转移至靶细胞。典型地,“载体构建体”、“表达载体”和“基因转移载体”意指能引导所关注基因表达并且可以将基因序列转移至靶细胞的任何核酸构建体。因此,所述术语包括克隆和表达运载体,以及整合载体。

术语“受试者”和“患者”可互换使用,并且是指哺乳动物诸如人患者和非人灵长类动物,以及实验动物诸如兔、狗、猫、大鼠、小鼠和其他动物。因此,如本文所用的术语“受试者”或“患者”意指可以向其给予本发明的核酸酶、供体和/或经遗传修饰的细胞的任何哺乳动物患者或受试者。本发明的受试者包括患有障碍的受试者。

“干性”是指任何细胞以类似干细胞的方式发挥作用的相对能力,即全能性、多能性或寡能性和任何特定干细胞可以具有的扩大的或无限的自我更新的程度。

“ACTR”是抗体偶合的T细胞受体,即能够与外源供应的抗体结合的工程化T细胞组分。抗体与ACTR组分的结合使T细胞能够与抗体识别的抗原相互作用,并且当遇到此抗原时,包含T细胞的ACTR被触发而与抗原相互作用(参见美国专利公开号2015/0139943)。

融合分子

本文描述了可用于切割细胞中mtDNA的所选靶基因的组合物,例如核酸酶。

包含来自锌指蛋白(“ZFP”)的DNA结合结构域或TAL效应子结构域(“TALE”)的重组转录因子和包含锌指核酸酶(“ZFN”)、TALEN、CRISPR/Cas核酸酶系统的工程化核酸酶以及全部被设计以与靶DNA位点结合的归巢核酸内切酶具有调控内源基因的基因表达的能力并且可用于基因组工程化、基因疗法和线粒体障碍的治疗。参见例如,美国专利号9,394,545;9,150,847;9,206,404;9,045,763;9,005,973;8,956,828;8,936,936;8,945,868;8,871,905;8,586,526;8,563,314;8,329,986;8,399,218;6,534,261;6,599,692;6,503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;美国专利公开号2003/0232410;2005/0208489;2005/0026157;2005/0064474;2006/0063231;2008/0159996;2010/0218264;2012/0017290;2011/0265198;2013/0137104;2013/0122591;2013/0177983;2013/0177960;和2015/0056705,其披露内容出于所有目的通过引用以其整体并入。此外,正在开发基于Argonaute系统(例如,来自嗜热栖热菌,称为“TtAgo”,参见Swarts等人(2014)Nature 507(7491):258-261)的靶向核酸酶,所述靶向核酸酶也可能具有用于基因组编辑和基因疗法的潜力。

核酸酶介导的基因疗法可以用于对细胞进行基因工程化以具有一种或多种失活基因和/或致使此细胞表达在此细胞中先前未产生的产物(例如,经由转基因插入和/或经由内源序列的校正)。转基因插入的用途的例子包括插入编码一种或多种新颖治疗性蛋白质的一种或多种基因、插入编码在细胞中或在个体中缺乏的蛋白质的编码序列、在含有突变基因序列的细胞中插入野生型基因和/或插入编码结构核酸(如shRNA或siRNA)的序列。内源基因序列的“校正”的可用应用的例子包括疾病相关的基因突变的改变、异质性偏移、编码剪接位点的序列的改变、调控序列的改变和编码蛋白质的结构特征的序列的靶向改变。转基因构建体可以通过同源定向修复(HDR)或通过非同源末端接合(NHEJ)驱动的过程期间的末端捕获来插入。参见例如,美国专利号9,045,763;9,005,973;7,888,121;和8,703,489。

使用这些工程化转录因子和核酸酶的临床试验已经显示,这些分子能够治疗各种病症,包括癌症、HIV和/或血液障碍(诸如血红蛋白病和/或血友病)。参见例如,Yu等人,(2006)FASEB J.20:479-481;Tebas等人,(2014)New Eng J Med 370(10):901。因此,这些方法可以用于治疗疾病。

在某些实施方案中,融合分子(例如,核酸酶)的一种或多种组分是天然存在的。在其他实施方案中,融合分子(例如,核酸酶)的一种或多种组分是非天然存在的,即在DNA结合分子和/或一个或多个切割结构域中工程化。例如,天然存在的核酸酶的DNA结合部分可以被改变以与所选的靶位点结合(例如,CRISPR/Cas系统或大范围核酸酶的单一指导RNA,其已被工程化以与不同于同源结合位点的位点结合)。在其他实施方案中,所述核酸酶包含异源DNA结合结构域和切割结构域(例如,锌指核酸酶;TAL效应子结构域DNA结合蛋白;大范围核酸酶DNA结合结构域与异源切割结构域)。因此,任何核酸酶可以用于实践本发明,包括但不限于至少一种ZFN、TALEN、大范围核酸酶、CRISPR/Cas核酸酶等,所述核酸酶切割靶基因,所述切割产生靶基因的基因组修饰(例如,切割的基因中的插入和/或缺失)。

本文还描述了通过核酸酶复合物的工程化切割半结构域配偶体的独立滴定增加切割活性的特异性。在一些实施方案中,两种配偶体(半切割结构域)的比率以1:2、1:3、1:4、1:5、1:6、1:8、1:9、1:10或1:20比率或其间的任何值给出。在其他实施方案中,两种配偶体的比率大于1:30。在其他实施方案中,两种配偶体以选择成与1:1不同的比率部署。在单独使用或组合使用时,本发明的方法和组合物经由降低脱靶切割活性来提供靶向特异性的意外的且出乎意料的增加。这些实施方案中使用的核酸酶可以包括ZFN、TALEN、CRISPR/Cas、CRISPR/dCas和TtAgo或其任何组合。

A.DNA结合分子

本文所述的融合分子可以包括任何DNA结合分子(也被称为DNA结合结构域),包括蛋白质结构域和/或多核苷酸DNA结合结构域。在某些实施方案中,DNA结合结构域与9-18个或更多个核苷酸的靶位点结合,其中所述靶位点包含一个或多个突变体mtDNA序列。所述突变可以是点突变,例如包含m.5024C>T突变的靶位点。

在某些实施方案中,本文所述的组合物和方法采用用于与供体分子结合和/或与细胞的基因组中的目的区域结合的大范围核酸酶(归巢核酸内切酶)DNA结合结构域。天然存在的大范围核酸酶识别15-40个碱基对的切割位点,并且通常分为四个家族:LAGLIDADG家族、GIY-YIG家族、His-Cyst盒家族和HNH家族。示例性归巢核酸内切酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。上述示例性归巢核酸内切酶的识别序列是已知的。还参见美国专利号5,420,032和6,833,252;Belfort等人,(1997)Nucleic Acids Res.25:3379-3388;Dujon等人,(1989)Gene 82:115-118;Perler等人,(1994)Nucleic Acids Res.22,1125-1127;Jasin(1996)Trends Genet.12:224–228;Gimble等人,(1996)J.Mol.Biol.263:163-180;Argast等人,(1998)J.Mol.Biol.280:345-353和New England Biolabs目录。另外,可以对归巢核酸内切酶和大范围核酸酶的DNA结合特异性进行工程化以结合非天然靶位点。参见例如,Chevalier等人,(2002)Molec.Cell 10:895-905;Epinat等人(2003)NucleicAcids Res.31:2952-2962;Ashworth等人,(2006)Nature 441:656-659;Paques等人,(2007)Current Gene Therapy 7:49-66;以及美国专利公开号2007/0117128。归巢核酸内切酶和大范围核酸酶的DNA结合结构域可以在核酸酶的环境下作为整体而改变(即,使得核酸酶包含同源切割结构域)或者可以与异源切割结构域融合。

在其他实施方案中,本文所述的方法和组合物中使用的一种或多种核酸酶的DNA结合结构域包含天然存在的或工程化的(非天然存在的)TAL效应子DNA结合结构域。参见例如,美国专利号8,586,526,其通过引用以其整体并入本文。已知黄单胞菌属(Xanthomonas)的植物病原性细菌会在重要的作物植物中引起许多种疾病。黄单胞菌属的致病性取决于保守的III型分泌(T3S)系统,其将多于25种不同的效应子蛋白注入植物细胞中。在所注入的这些蛋白质中有转录激活因子样(TAL)效应子,其模拟植物转录激活因子并操纵植物转录组(参见Kay等人,(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录激活结构域。最充分表征的TAL效应子之一是来自油菜黄单胞菌疱斑致病变种(Xanthomonascampestgris pv.Vesicatoria)的AvrBs3(参见Bonas等人,(1989)Mol Gen Genet 218:127-136和国际专利公开号WO 2010/079430)。TAL效应子含有串联重复序列的中心化结构域,每个重复序列含有约34个氨基酸,所述重复序列是这些蛋白质的DNA结合特异性的关键。另外,其含有核定位序列和酸性转录激活结构域(综述参见Schornack等人(2006)JPlant Physiol 163(3):256-272)。另外,在植物致病性细菌青枯雷尔氏菌(Ralstoniasolanacearum)中,已经发现在青枯雷尔氏菌生物变型1菌株GMI1000和生物变型4菌株RS1000中,名为brg11和hpx17的两种基因与黄单胞菌属的AvrBs3家族是同源的(参见Heuer等人(2007)Appl and Envir Micro 73(13):4379-4384)。这些基因的核苷酸序列彼此98.9%一致,但不同之处在于hpx17的重复结构域中1,575bp的缺失。然而,两种基因产物与黄单胞菌属的AvrBs3家族蛋白具有小于40%序列同一性。参见例如,美国专利号8,586,526,其通过引用以其整体并入本文。

这些TAL效应子的特异性取决于在串联重复序列中发现的序列。重复序列包含大约102bp,并且所述重复序列通常彼此91%-100%同源(Bonas等人,同上)。重复序列的多态性通常位于位置12和13处,并且在位置12和13的高变双残基(RVD)的身份与TAL效应子的靶序列中连续核苷酸的身份之间显现存在一一对应关系(参见Moscou和Bogdanove,(2009)Science 326:1501以及Boch等人,(2009)Science 326:1509-1512)。在实验中,已经确定这些TAL效应子的DNA识别天然代码,使得位置12和13的HD序列导致与胞嘧啶(C)结合,NG与T结合,NI与A、C、G或T结合,NN与A或G结合,并且ING与T结合。这些DNA结合重复序列已经与新组合和数目的重复序列组装为蛋白质,以制造能与新序列相互作用的人工转录因子,并激活非内源报告基因在植物细胞中的表达(Boch等人,同上)。工程化TAL蛋白已与FokI切割半结构域相连,以产生TAL效应子结构域核酸酶融合物(TALEN)。参见例如,美国专利号8,586,526;Christian等人(2010)Genetics epub 10.1534/genetics.110.120717)。在某些实施方案中,TALE结构域包含N帽和/或C帽,如美国专利号中8,586,526所述。

在某些实施方案中,用于体内切割和/或靶向切割细胞的基因组的一种或多种核酸酶的DNA结合结构域包括锌指蛋白。优选地,锌指蛋白是非天然存在的,其被工程化为与所选的靶位点结合。参见例如,参见例如,Beerli等人(2002)Nature Biotechnol.20:135-141;Pabo等人(2001)Ann.Rev.Biochem.70:313-340;Isalan等人(2001)NatureBiotechnol.19:656-660;Segal等人,(2001)Curr.Opin.Biotechnol.12:632-637;Choo等人(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利号6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;以及美国专利公开号2005/0064474;2007/0218528;2005/0267061,全部通过引用以其整体并入本文。

与天然存在的锌指蛋白相比,工程化的锌指结合结构域可以具有新颖的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用数据库,所述数据库包含三联体(或四联体)核苷酸序列和个别锌指氨基酸序列,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列缔合。参见,例如,共同拥有的美国专利号6,453,242和6,534,261,其通过引用以其整体并入本文中。

示例性选择方法,包括噬菌体展示和双杂交系统,披露于美国专利号5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及国际专利公开号WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197;以及GB专利号2,338,237。另外,例如在共有的国际专利公开号WO 02/077227中已经描述了对锌指结合结构域的结合特异性的增强。

另外,如这些和其他参考文献中所披露,锌指结构域和/或多指锌指蛋白可以使用任何适宜的接头序列(包括例如,长度为5个或更多个氨基酸的接头)连接在一起。对于长度为6个或更多个氨基酸的示例性接头序列,还参见美国专利号6,479,626;6,903,185;和7,153,949。本文所述蛋白质可以包括蛋白质的个别锌指之间的适宜接头的任一组合。

ZFP可以与一个或多个核酸酶(切割)结构域可操作地缔合(连接)以形成ZFN。术语“ZFN”包含二聚化以切割靶基因的ZFN对。方法和组合物还可以用于相对于其他非预期的切割位点(称为脱靶位点)提高ZFN(包括核酸酶对)对其预期靶标的特异性(参见美国专利公开号20180087072)。因此,本文描述的核酸酶可以包含在其一个或多个DNA结合结构域骨架区中的突变和/或在其核酸酶切割结构域中的一种或多种突变。这些核酸酶可以包括对ZFPDNA结合结构域(“ZFP骨架”)内可以与DNA骨架上的磷酸非特异性相互作用的氨基酸的突变,但其不包含DNA识别螺旋中的变化。因此,本发明包括ZFP骨架中是核苷酸靶标特异性不需要的阳离子型氨基酸残基的突变。在一些实施方案中,ZFP骨架中的这些突变包含使阳离子型氨基酸残基突变为中心或阴离子型氨基酸残基。在一些实施方案中,ZFP骨架中的这些突变包含使极性氨基酸残基突变至中性或非极性氨基酸残基。在优选实施方案中,突变是在相对于DNA结合螺旋的位置(-5)、(-9)和/或位置(-14)进行。在一些实施方案中,锌指可以包含在(-5)、(-9)和/或(-14)的一种或多种突变。在另外的实施方案中,多指锌指蛋白中的一个或多个锌指可以包含(-5)、(-9)和/或(-14)中的突变。在一些实施方案中,在(-5)、(-9)和/或(-14)的氨基酸(例如精氨酸(R)或赖氨酸(K))突变为丙氨酸(A)、亮氨酸(L)、Ser(S)、Asp(N)、Glu(E)、Tyr(Y)和/或谷氨酰胺(Q)。

在一些方面,与野生型相比,DNA结合结构域(例如,ZFP、TALE、sgRNA等)优先靶向突变体mtDNA。在成对的核酸酶中,一个DNA结合结构域可以靶向野生型序列,并且另一个DNA结合结构域可以靶向突变体序列。可替代地,两个DNA结合结构域可以靶向野生型或突变体序列。在某些实施方案中,DNA结合结构域靶向突变体mtDNA(例如,m.5024C>T)中的位点(9至18个或更多个核苷酸),如表2所示。在其他实施方案中,DNA结合结构域靶向包含以下突变中的一种或多种的突变体mtDNA中的序列:1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C或14709C。

靶位点的选择;用于设计和构建融合蛋白(和编码所述融合蛋白的多核苷酸)的ZFP和方法是本领域技术人员已知的并且详细描述于以下文献中:美国专利号6,140,081;5,789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;和国际专利公开号WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536;和WO 03/016496。

另外,如这些和其他参考文献中所披露,锌指结构域和/或多指锌指蛋白可以使用任何适宜的接头序列(包括例如,长度为5个或更多个氨基酸的接头)连接在一起。对于长度为6个或更多个氨基酸的示例性接头序列,还参见美国专利号6,479,626;6,903,185;和7,153,949。本文所述蛋白质可以包括蛋白质的个别锌指之间的适宜接头的任一组合。

在某些实施方案中,DNA结合分子是CRISPR/Cas核酸酶系统的一部分。参见例如,美国专利号8,697,359和美国专利公开号2015/0056705。CRISPR(规律成簇的间隔短回文重复序列)基因座(其编码所述系统的RNA组分)和cas(CRISPR相关)基因座(其编码蛋白质)(Jansen等人(2002)Mol.Microbiol.43:1565-1575;Makarova等人(2002)Nucleic AcidsRes.30:482-496;Makarova等人(2006)Biol.Direct 1:7;Haft等人(2005)PLoSComput.Biol.1:e60)构成CRISPR/Cas核酸酶系统的基因序列。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能将CRISPR介导的核酸切割的特异性程序化的非编码RNA元件的组合。

II型CRISPR是最充分表征的系统之一,并在四个连续步骤中进行靶向DNA双链断裂。首先,从CRISPR基因座转录两个非编码RNA,即前crRNA阵列和tracrRNA。第二步,tracrRNA杂交到前-crRNA的重复区上,并且介导将前-crRNA加工成包含单独的间隔子序列的成熟crRNA。第三步,成熟的crRNA:tracrRNA复合物通过crRNA上的间隔子与靶DNA上的原型间隔子之间的Watson-Crick碱基配对将Cas9引导至靶DNA,靶DNA靠近原型间隔子邻近基序(PAM)是靶标识别的附加要求。最后,Cas9介导靶DNA的切割以在原间隔区内产生双链断裂。CRISPR/Cas系统的活性包括三个步骤:(i)在称为“适应”的过程中将外来DNA序列插入CRISPR阵列中以防止后来的攻击,(ii)表达相关蛋白质,以及表达并加工所述阵列,之后(iii)RNA介导干扰外来核酸。因此,在细菌细胞中,若干种所谓的“Cas”蛋白与CRISPR/Cas系统的天然功能有关,并在诸如插入外源DNA等功能中发挥作用。

在某些实施方案中,Cas蛋白可以是天然存在的Cas蛋白的“功能衍生物”。天然序列多肽的“功能衍生物”是具有与天然序列多肽共同的定性生物特性的化合物。“功能衍生物”包括但不限于天然序列的片段和天然序列多肽和其片段的衍生物,前提是其具有与相应的天然序列多肽共同的生物活性。本文所预期的生物活性是功能衍生物将DNA底物水解为片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变体、共价修饰物和其融合物。合适的Cas多肽或其片段的衍生物包括但不限于Cas蛋白或其片段的突变体、融合物、共价修饰。Cas蛋白,包括Cas蛋白或其片段,以及Cas蛋白或其片段的衍生物,可以从细胞中获得或化学合成或通过这两种程序的组合获得。细胞可以是天然地产生Cas蛋白的细胞,或天然地产生Cas蛋白并且进行遗传工程化从而以较高表达水平产生内源Cas蛋白或从外源引入核酸产生Cas蛋白的细胞,所述外源引入核酸编码与内源Cas相同或不同的Cas。在一些情形中,细胞并非天然地产生Cas蛋白,并且进行遗传工程化以产生Cas蛋白。在一些实施方案中,Cas蛋白是一种小的Cas9直向同源物,经由AAV载体进行递送(Ran,等人(2015)Nature 510,第186页)。

在一些实施方案中,DNA结合分子是TtAgo系统的一部分(参见Swarts等人,同上;Sheng等人,同上)。在真核生物中,基因沉默是由蛋白质的Argonaute(Ago)家族介导的。在此范式中,Ago与小(19-31nt)RNA结合。此蛋白质-RNA沉默复合物通过所述小RNA与靶标之间的Watson-Crick碱基配对来识别靶RNA,并且以核酸内切方式切割靶RNA(Vogel(2014)Science 344:972-973)。相比之下,原核Ago蛋白与小单链DNA片段结合,并且可能作用来检测并去除外源(经常是病毒)DNA(Yuan等人(2005)Mol.Cell 19,405;Olovnikov等人(2013)Mol.Cell 51,594;Swarts等人,同上)。示例性的原核Ago蛋白包括来自风产液菌(Aquifexaeolicus)、类球红细菌(Rhodobacter sphaeroides)、和嗜热栖热菌(Thermusthermophilus)的那些。

最充分表征的原核Ago蛋白之一是来自嗜热栖热菌(T.thermophilus)的蛋白(TtAgo;Swarts等人,同上)。TtAgo与具有5’磷酸基团的15nt或13-25nt单链DNA片段缔和。TtAgo结合的这种“指导DNA”用于引导蛋白质-DNA复合物结合第三方DNA分子中的Watson-Crick互补DNA序列。一旦这些指导DNA中的序列信息允许鉴定靶DNA,TtAgo-指导DNA复合物就会切割靶DNA。TtAgo-指导DNA复合物与其靶DNA结合时的结构也支持这种机制(G.Sheng等人,同上)。来自类球红细菌(RsAgo)的Ago具有相似的特性(Olovnikov等人,同上)。

可以将任意DNA序列的外源指导DNA加载到TtAgo蛋白上(Swarts等人,同上)。由于TtAgo切割的特异性是由指导DNA引导的,因此,由外源的由研究者指定的指导DNA形成的TtAgo-DNA复合物将TtAgo靶DNA切割引导至互补的由研究者指定的靶DNA。以此方式,可以在DNA中产生靶向双链断裂。使用TtAgo-指导DNA系统(或来自其他生物的直系同源Ago-指导DNA系统)允许在细胞内靶向切割基因组DNA。这种切割可以是单链或双链。为了切割哺乳动物基因组DNA,优选使用为在哺乳动物细胞中表达而优化的TtAgo密码子形式。此外,可能优选的是用体外形成的TtAgo-DNA复合物处理细胞,其中TtAgo蛋白与细胞穿透肽融合。另外,可能优选的是使用已经通过诱变改变以使其在37℃时具有改进活性的TtAgo蛋白形式。使用本领域中利用DNA断裂的标准技术,可以使用Ago-RNA介导的DNA切割来影响结果的全景图(包括基因敲除、靶向基因添加、基因校正、靶向基因缺失)。

因此,核酸酶包含与任何基因中的靶位点特异性结合的DNA结合分子,期望将供体(转基因)插入所述靶位点中。

B.切割结构域

任何合适的切割结构域可以与DNA结合结构域操作性地连接以形成核酸酶。例如,ZFP DNA结合结构域已与核酸酶结构域融合形成ZFN,这是功能实体,所述功能实体能够通过其工程化(ZFP)DNA结合结构域识别其预期核酸靶标,并导致DNA通过核酸酶活性在ZFP结合位点附近被切割,包括用于各种生物体中的基因组修饰。参见例如,美国专利号7,888,121;8,623,618;7,888,121;7,914,796和8,034,598;以及美国专利公开号2011/0201055。同样,TALE DNA结合结构域已与核酸酶结构域融合以产生TALEN。参见例如,美国专利号8,586,526。

如上所述,切割结构域可以与DNA结合结构域异源,例如锌指DNA结合结构域和来自核酸酶或TALEN DNA结合结构域的切割结构域和切割结构域、或大范围核酸酶DNA结合结构域和来自不同核酸酶的切割结构域。异源切割结构域可以从任何核酸内切酶或核酸外切酶获得。可以衍生切割结构域的示例性核酸内切酶,包括但不限于限制性核酸内切酶和归巢核酸内切酶。切割DNA的另外的酶是已知的(例如,S1核酸酶;绿豆核酸酶;胰腺DNase I;微球菌核酸酶;酵母HO核酸内切酶)。这些酶(或其功能片段)中的一种或多种可以用作切割结构域和切割半结构域的来源。

类似地,切割半结构域可以源自如上列出的任何核酸酶或其部分,其需要二聚化来产切割活性。通常,如果融合蛋白包含切割半结构域,那么切割需要两个融合蛋白。可替代地,可以使用包含两个切割半结构域的单一蛋白质。两个切割半结构域可以源自相同核酸内切酶(或其功能性片段),或者每个切割半结构域可以源自不同核酸内切酶(或其功能性片段)。另外,两个融合蛋白的靶位点优选地关于彼此来布置,使得两个融合蛋白与其各自的靶位点的结合将切割半结构域置于针对彼此的空间定向中,此允许切割半结构域例如通过二聚化形成功能性切割结构域。因此,在某些实施方案中,靶位点的近边缘被5-8个核苷酸或15-18个核苷酸隔开。但是,任何整数个核苷酸或核苷酸对(例如2至50个核苷酸对或更多)都可以插入两个靶位点之间。通常,切割位点位于靶位点之间。

限制性核酸内切酶(限制酶)存在于许多物种中,并且能够与DNA(在识别位点)进行序列特异性结合,并能够在结合位点或结合位点附近切割DNA。某些限制酶(例如,IIS型)在远离识别位点的位点处切割DNA,并且具有可分离的结合结构域和切割结构域。例如,IIS型FokI酶催化DNA的双链切割,在一条链上距其识别位点9个核苷酸处,并且在另一条链上距其识别位点13个核苷酸处进行切割。参见例如,美国专利号5,356,802;5,436,150;和5,487,994;以及Li等人(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li等人(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768;Kim等人(1994a)Proc.Natl.Acad.Sci.USA 91:883-887;Kim等人(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一个实施方案中,融合蛋白包含来自至少一种IIS型限制酶的切割结构域(或切割半结构域)和一个或多个锌指结合结构域(其可以工程化或可以不经工程化)。

其切割结构域可与结合结构域分离的示例性IIS型限制酶是FokI。此特定酶作为二聚体是活性的。Bitinaite等人,(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575。因此,出于本公开文本的目的,在公开的融合蛋白中使用的FokI酶的部分被认为是切割半结构域。因此,对于使用锌指-FokI融合物的靶向双链切割和/或靶向替代细胞序列,可以使用各自包含FokI切割半结构域的两种融合蛋白来重构有催化活性的切割结构域。可替代地,也可以使用包含锌指结合结构域和两个FokI切割半结构域的单一多肽分子。在本公开文本的其他地方提供了使用锌指-FokI融合物进行靶向切割和靶向序列改变的参数。

切割结构域或切割半结构域可以是蛋白质的任一部分,其保留切割活性,或者保留多聚化(例如,二聚化)以形成功能性切割结构域的能力。

示例性的IIS型限制酶描述于以其整体并入本文的国际公开WO 07/014275中。另外的限制酶也包含可分离的结合结构域和切割结构域,并且本公开文本考虑了这些。参见例如,Roberts等人,(2003)Nucleic Acids Res.31:418-420。

在某些实施方案中,所述切割结构域包含最小化或防止同二聚化的一个或多个工程化切割半结构域(也称为二聚化结构域突变体),例如如在美国专利号8,623,618;7,888,121;7,914,796;和8,034,598;以及美国专利公开号2011/0201055中所述,其全部披露内容通过引用以其整体并入本文。在FokI的位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538处的氨基酸残基都是影响FokI切割半结构域二聚化的靶标。

在某些实施方案中,工程化的切割半结构域源自FokI,并且在相对于如下所示的野生型FokI切割半结构域(全长FokI的残基394至579)编号的氨基酸残基416、422、447、448和/或525(参见例如,美国专利公开号20180087072)中的一个或多个中包含一种或多种突变:

野生型FokI切割半结构域(SEQ ID NO:1)

QLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINF

这些突变减少FokI结构域与DNA分子之间的非特异性相互作用。在其他实施方案中,源自FokI的切割半结构域在氨基酸残基414-426、443-450、467-488、501-502和/或521-531中的一个或多个中包含突变。所述突变可以包括与FokI同源的天然限制性酶中存在的残基的突变。在某些实施方案中,所述突变是取代,例如野生型残基被不同的氨基酸,例如丝氨酸(S),例如R416S或K525S取代。在优选实施方案中,在位置416、422、447、448和/或525处的突变包括带正电的氨基酸被不带电或带负电的氨基酸替代。在另一个实施方案中,除一个或多个氨基酸残基416、422、447、448或525中的突变之外,工程化的切割半结构域在氨基酸残基499、496和486中包含突变。在优选实施方案中,本发明提供了融合蛋白,其中工程化的切割半结构域包含多肽,其中除在位置416、422、447、448或525处的一种或多种突变之外,位置486处的野生型Gln(Q)残基被Glu(E)残基替代,位置499处的野生型Ile(I)残基被Leu(L)替代,并且位置496处的野生型Asn(N)残基被Asp(D)或Glu(E)残基(“ELD”或“ELE”)替代。

可以使用具有多于一个突变的切割结构域,例如在一个切割半结构域中位置490(E→K)和538(I→K)处的突变,以产生被命名为“E490K:I538K”的工程化的切割半结构域,并且通过使在另一个切割半结构域中的位置486(Q→E)和499(I→L)突变以产生被命名为“Q486E:I499L”的工程化的切割半结构域;使位置486处的野生型Gln(Q)残基被Glu(E)残基替代,使位置499处的野生型Iso(I)残基被Leu(L)残基替代并且使残基496处的野生型Asn(N)残基被Asp(D)或Glu(E)残基(分别也被称为“ELD”和“ELE”结构域)替代的突变;工程化的切割半结构域包含在位置490、538和537(相对于野生型FokI编号)处的突变,例如使位置490处的野生型Glu(E)残基被Lys(K)残基替代,使位置538处的野生型Iso(I)残基被Lys(K)残基替代并且使位置537处的野生型His(H)残基被Lys(K)残基或Arg(R)残基(分别也被称为“KKK”和“KKR”结构域)替代的突变;并且/或者工程化的切割半结构域包含在位置490和537(相对于野生型FokI编号)处的突变,例如使位置490处的野生型Glu(E)残基被Lys(K)残基替代并且使位置537处的野生型His(H)残基被Lys(K)残基或Arg(R)残基(分别也被称为“KIK”和“KIR”结构域)替代的突变。参见例如,美国专利号7,914,796;8,034,598;和8,623,618;其披露内容出于所有目的通过引用以其整体并入。在其他实施方案中,工程化的切割半结构域包含“Sharkey”和/或“Sharkey”突变(参见Guo等人,(2010)J.Mol.Biol.400(1):96-107)。

可替代地,核酸酶可以使用所谓的“分裂酶”技术在体内组装于核酸靶位点处(参见例如,美国专利公开号2009/0068164)。此类分裂酶的组分可以在单独的表达构建体上表达,或者可以连接于一个开放式阅读框中,其中个别组分例如由自裂解的2A肽或IRES序列隔开。组分可以是个别锌指结合结构域或大范围核酸酶核酸结合结构域的结构域。

可以在使用前例如在基于酵母的染色体系统中针对活性来筛选核酸酶,如美国专利号8,563,314中所述。

Cas9相关的CRISPR/Cas系统包含两个RNA非编码组分:含有被相同的直接重复序列(DR)间隔的核酸酶指导序列(间隔子)的tracrRNA和前-crRNA阵列。为了使用CRISPR/Cas系统来实现基因组工程化,必须存在这些RNA的两种功能(参见Cong等人(2013)Sciencexpress 1/10.1126/science 1231143)。在一些实施方案中,tracrRNA和前-crRNA经由单独的表达构建体或作为单独的RNA供应。在其他实施方案中,构建嵌合RNA,其中将工程化的成熟crRNA(赋予靶特异性)与tracrRNA(供应与Cas9的相互作用)融合以产生嵌合cr-RNA-tracrRNA杂交物(也被称为单一指导RNA)。(参见Jinek等人(2012)Science 337:816-821;Jinek等人(2013)eLife 2:e00471.DOI:10.7554/eLife.00471和Cong,同上)。

在一些实施方案中,使用CRISPR-Cpf1系统。在弗朗西斯氏菌属物种(Francisellaspp)中鉴定出的CRISPR-Cpf1系统是一种2类CRISPR-Cas系统,其可在人细胞中介导稳健的DNA干扰。尽管Cpf1和Cas9在功能上是保守的,但它们在许多方面(包括在Cpf1和Cas9的指导RNA和底物特异性方面)都存在差异(参见Fagerlund等人(2015)Genom Bio 16:251)。Cas9与Cpf1蛋白之间的主要区别是Cpf1不利用tracrRNA,并且因此仅需要crRNA。FnCpf1crRNA的长度为42-44个核苷酸(19-核苷酸重复序列和23-25-核苷酸间隔子),并且包含单个茎-环,可以耐受保留二级结构的序列变化。此外,Cpf1 crRNA明显短于Cas9所需的约100个核苷酸的工程化sgRNA,并且对于FnCpfl的PAM要求是在置换链上的5'-TTN-3'和5'-CTA-3'。尽管Cas9和Cpf1都在靶DNA中产生双链断裂,但是Cas9使用其RuvC和HNH样结构域以在指导RNA的种子序列内进行平末端切割,而Cpf1使用RuvC样结构域以在种子序列外产生交错切割。由于Cpf1远离关键种子区域进行交错切割,因此NHEJ不会破坏靶位点,因此确保Cpf1可以继续切割同一位点,直到发生所需的HDR重组事件为止。因此,在本文描述的方法和组合物中,应理解术语“Cas”包括Cas9和Cpf1蛋白二者。因此,如本文所用,“CRISPR/Cas系统”是指CRISPR/Cas和/或CRISPR/Cpf1系统,包括核酸酶和/或转录因子系统二者。

靶位点

如上所述,DNA结合结构域可以被工程化为与选择的任何序列结合。与天然存在的DNA结合结构域相比,工程化DNA结合结构域可以具有新颖的结合特异性。

在某些实施方案中,所述一种或多种核酸酶可以靶向任何野生型或突变体mtDNA序列,所述核酸酶选择性地靶向突变体mtDNA,例如涵盖诸如以下项的突变体mtDNA序列的9-25个或更多个核苷酸(连续或非连续)的靶位点:1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C或14709C或如表2所示的靶位点。

遵循本说明书的教导,此类表达盒的构建利用分子生物学领域熟知的方法(参见例如,Ausubel或Maniatis)。在使用表达盒来生成转基因动物之前,表达盒对于与所选的控制元件缔和的应激诱导子的反应性可以通过将表达盒引入合适的细胞系(例如,原代细胞、转化细胞或永生化细胞系)中来测试。

此外,尽管对于表达不是必需的,但外源序列也可以是转录或翻译调控序列,例如启动子、增强子、绝缘子、内部核糖体进入位点、编码2A肽的序列、锤头状核酶、靶向肽和/或聚腺苷酸化信号。此外,目的基因的控制元件可以与报告基因可操作地连接以产生嵌合基因(例如,报告物表达盒)。

还可以实现非编码核酸序列的靶向插入。编码反义RNA、RNAi、shRNA和微RNA(miRNA)的序列也可以用于靶向插入。

在另外的实施方案中,供体核酸可以包含非编码序列,所述非编码序列是针对另外的核酸酶设计的特异性靶位点。随后,另外的核酸酶可以在细胞中表达,使得通过插入另一个目的供体分子来切割和修饰原始供体分子。以这种方式,可以产生供体分子的重复整合,从而允许在特定目的基因座处或在安全港基因座处的特性堆积(trait stacking)。

细胞

因此,本文提供了包含经遗传修饰的mtDNA基因的经遗传修饰的细胞。在某些实施方案中,所述修饰包括切割突变体mtDNA,使得改变mtDNA的异质性比率。在某些实施方案中,在患有一种或多种线粒体障碍的患者中切割突变体mtDNA,使得治疗和/或预防所述障碍或其相关的症状。核酸酶可以差异地结合并切割任何突变体mtDNA,包括但不限于在点突变(诸如m.5024C>T)处结合。

与随机切割不同,靶向切割确保例如在设计核酸酶,使得DNA结合结构域与突变的序列结合并且展现出对于突变体形式的特异性时,与野生型相比,mtDNA的突变体形式优先被切割。

任何细胞类型可以如本文所述进行遗传修饰,所述细胞类型包括但不限于细胞和细胞系。含有经修饰的mtDNA的细胞的其他非限制性例子包括心脏细胞、脑细胞、肺细胞、肝细胞、T细胞(例如,CD4+、CD3+、CD8+等);树突细胞;B细胞;自体(例如,患者来源的)或异源多能、全能或多潜能干细胞(例如,CD34+细胞,包括多能干细胞(iPSC)、胚胎干细胞等)。在某些实施方案中,如本文所述的细胞是源自患者的CD34+细胞。

如本文所述的细胞可用于例如通过体内或离体疗法治疗和/或预防患有所述障碍的受试者的线粒体疾病。对于离体疗法,可以使用标准技术扩增核酸酶修饰的细胞,并且然后再引入到患者中。参见例如,Tebas等人,(2014)New Eng J Med 370(10):901。在干细胞的情况下,在输注到受试者中之后,与野生型(患病)细胞相比,这些前体以改变的异质性比率分化成表达mtDNA的细胞。还提供包含如本文所述的细胞的药物组合物。另外,在向患者给予之前,所述细胞可以低温保存。

如本文所述的细胞和离体方法提供对于受试者(例如,哺乳动物受试者)的障碍(例如,线粒体障碍)的治疗和/或预防,并且消除对于连续预防性药物给予或有风险的程序(诸如异基因骨髓移植或γ逆转录病毒递送)的需要。由此,本文所述的本发明提供了一种更安全、成本有效且节省时间的治疗和/或预防线粒体障碍的方式。

递送

本文所述的核酸酶、编码这些核酸酶的多核苷酸、供体多核苷酸和包含本文所述的蛋白质和/或多核苷酸的组合物可以通过任何合适的手段递送。在某些实施方案中,核酸酶和/或供体在体内递送。在其他实施方案中,将核酸酶和/或供体递送到分离的细胞(例如,自体或异源干细胞),以提供可用于向患者离体递送的经修饰的细胞。

递送如本文描述的核酸酶的方法描述于例如以下文献中:美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824,其全部披露内容通过引用以其整体并入本文。

如本文所述的核酸酶和/或供体构建体还可以使用任何核酸递送机制(包括裸DNA和/或RNA(例如,mRNA)和含有编码一种或多种组分的序列的载体)递送。可以使用任何载体系统,包括但不限于质粒载体、DNA微环、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体;疱疹病毒载体和腺相关病毒载体等及其组合。还参见美国专利号6,534,261;6,607,882;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824;以及美国专利公开号2014/0335063,其通过引用以其整体并入本文。此外,清楚的是,这些系统中的任一种可以包含处理所需的一种或多种序列。因此,当将一种或多种核酸酶和供体构建体引入细胞中时,可以将核酸酶和/或供体多核苷酸携带在相同递送系统上或不同递送机制上。当使用多种系统时,每种递送机制可以包含编码一种或多种核酸酶的序列和/或供体构建体(例如,编码一种或多种核酸酶的mRNA和/或携带一种或多种供体构建体的mRNA或AAV)。

可使用常规的基于病毒和非病毒的基因转移方法在细胞(例如哺乳动物细胞)和靶组织中引入编码核酸酶和供体构建体的核酸。非病毒载体递送系统包括DNA质粒、DNA微环、裸核酸和与递送运载体(诸如脂质体或泊洛沙姆(poloxamer))复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞之后具有附加型或整合的基因组。对于基因疗法程序的综述,参见Anderson,Science 256:808-813(1992);Nabel和Felgner,TIBTECH11:211-217(1993);Mitani和Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer和Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等人,Current Topics in Microbiology and Immunology Doerfler和(编)(1995);以及Yu等人,Gene Therapy 1:13-26(1994)。

核酸的非病毒递送方法包括电穿孔、脂转染、显微注射、生物弹道学、病毒体、脂质体、免疫脂质体、多聚阳离子或脂质:核酸缀合物、脂质纳米颗粒(LNP)、裸DNA、裸RNA、加帽的RNA、人工病毒粒子和试剂增强的DNA摄取。还可以使用采用例如Sonitron 2000系统(Rich-Mar)的声致穿孔(sonoporation)来递送核酸。

其他示例性核酸递送系统包括由以下项提供的那些:Amaxa Biosystems(Cologne,德国)、Maxcyte,Inc.(Rockville,马里兰)、BTX分子递送系统(Holliston,MA)和Copernicus Therapeutics Inc.(参见例如美国专利号6,008,336)。脂质转染描述于例如美国专利号5,049,386;4,946,787;和4,897,355中,并且脂质转染试剂在市场上有售(例如,TransfectamTM和LipofectinTM)。适合于多核苷酸的有效受体识别脂转染的阳离子型和中性脂质包括Felgner,国际专利公开号WO 91/17424、WO 91/16024的那些。在一些方面,核酸酶作为mRNA递送,并且转基因经由其他形式(诸如病毒载体、微环DNA、质粒DNA、单链DNA、线性DNA、脂质体、纳米颗粒等)递送。

脂质:核酸复合物(包括靶向的脂质体诸如免疫脂质复合物)的制备是本领域技术人员熟知的(参见例如,Crystal,Science 270:404-410(1995);Blaese等人,Cancer GeneTher.2:291-297(1995);Behr等人,Bioconjugate Chem.5:382-389(1994);Remy等人,Bioconjugate Chem.5:647-654(1994);Gao等人,Gene Therapy 2:710-722(1995);Ahmad等人,Cancer Res.52:4817-4820(1992);美国专利号4,186,183;4,217,344;4,235,871;4,261,975;4,485,054;4,501,728;4,774,085;4,837,028;和4,946,787)。

其他递送方法包括使用将要递送的核酸包装至EnGeneIC递送运载体(EDV)中。这些EDV被使用双特异性抗体特异性地递送至靶组织中,其中所述抗体的一个臂对所述靶组织具有特异性,并且另一个臂对EDV具有特异性。抗体将EDV负载至靶细胞表面,之后EDV通过胞吞作用被引入细胞中。进入细胞后,内容物被释放(参见MacDiarmid等人,(2009)Nature Biotechnology 27(7):643)。

使用基于RNA或DNA病毒的系统递送编码工程化的CRISPR/Cas系统的核酸利用高度演进的方法将病毒靶向体内的特定细胞并将病毒有效负载运输至细胞核中。可以将病毒载体直接给予受试者(体内),或其可以用于在体外处理细胞,以及将经修饰的细胞给予受试者(离体)。常规的递送CRISPR/Cas系统的基于病毒的系统包括但不限于用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒和单纯疱疹病毒载体。使用逆转录病毒、慢病毒和腺相关病毒基因转移方法时,在宿主基因组中整合是可能的,通常导致所插入转基因的长期表达。另外,在许多不同的细胞类型和靶组织中观察到高转导效率。

逆转录病毒的向性可以通过掺入外来包膜蛋白、扩大靶细胞的潜在靶群体来改变。慢病毒载体是能够转导或感染非分裂细胞并且典型地产生高病毒滴度的逆转录病毒载体。逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体包括顺式作用的长末端重复序列,其具有对多达6-10kb的外来序列的包装能力。最小顺式作用LTR对载体的复制和包装而言是足够的,所述载体随后用于将治疗性基因整合至靶细胞中以提供持久的转基因表达。广泛使用的逆转录病毒载体包括基于以下的那些:鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合(参见例如,Buchscher等人(1992)J.Virol.66:2731-2739;Johann等人(1992)J.Virol.66:1635-1640;Sommerfelt等人(1990)Virol.176:58-59;Wilson等人(1989)J.Virol.63:2374-2378;Miller等人(1991)J.Virol.65:2220-2224;国际专利公开号WO 1994/026877)。

在其中瞬时表达是优选的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有极高的转导效率,并且不需要细胞分裂。使用此类载体,已经获得高滴度和高表达水平。这种载体可以在相对简单的系统中大量生产。腺相关病毒(“AAV”)载体还用于例如在核酸和肽的体外生产中用靶核酸转导细胞,以及用于体内和离体基因治疗程序中(参见例如,West等人,Virology 160:38-47(1987);美国专利号4,797,368;国际专利公开号WO 93/24641;Kotin(1994)Human Gene Therapy 5:793-801;Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建描述于多个出版物中,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat和Muzyczka,PNAS 81:6466-6470(1984);以及Samulski等人,J.Virol.63:03822-3828(1989)。可以使用任何AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV6和AAV8、AAV 8.2、AAV9和AAV rh10以及假型化AAV诸如AAV9.45、AAV2/8、AAV2/5和AAV2/6。

至少六种病毒载体方法目前可用于临床试验中的基因转移,所述试验利用涉及通过插入辅助细胞系中的基因与缺陷性载体互补以产生转导剂的途径。

pLASN和MFG-S是已经用于临床试验中的逆转录病毒载体的例子(Dunbar等人,Blood 85:3048-305(1995);Kohn等人,Nat.Med.1:1017-102(1995);Malech等人,PNAS 94:22 12133-12138(1997))。PA317/pLASN是第一个用于基因疗法试验中的治疗性载体。(Blaese等人,Science 270:475-480(1995))。已经观察到MFG-S包装的载体的转导效率为50%或更高。(Ellem等人,Immunol Immunother.44(1):10-20(1997);Dranoff等人,Hum.Gene Ther.1:111-2(1997)。

重组腺相关病毒载体(rAAV)是有前景的基于缺陷性和非病原性细小病毒腺相关2型病毒的替代性基因递送系统。所有载体都源自仅保留侧接转基因表达盒的AAV 145碱基对(bp)反相末端重复序列的质粒。由于整合至经转导细胞基因组中所致的有效基因转移和稳定转基因递送是这种载体系统的关键特征。(Wagner等人,Lancet 351:9117 1702-3(1998),Kearns等人,Gene Ther.9:748-55(1996))。根据本发明,也可以使用其他AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV8.2、AAV9、AAV9.45和AAVrh10以及假型化AAV,诸如AAV2/8、AAV2/5和AAV2/6。在一些实施方案中,使用靶向心脏、肺、大脑和/或肌肉的AAV血清型,包括但不限于使用能够跨血脑屏障的AAV血清型。

复制缺陷型重组腺病毒载体(Ad)可以以高滴度产生,并且易于感染多种不同的细胞类型。对大多数腺病毒载体进行工程化,使得转基因替代Ad E1a、E1b和/或E3基因;随后使复制缺陷性载体在反式供应所缺失的基因功能的人类293细胞中增殖。Ad载体可以在体内转导多种类型的组织,包括非分裂的已分化细胞,诸如在肝、肾和肌肉中发现的那些。常规Ad载体具有较大运载能力。Ad载体在临床试验中的使用的例子涉及使用肌内注射的用于抗肿瘤免疫的多核苷酸疗法(Sterman等人,Hum.Gene Ther.7:1083-9(1998))。腺病毒载体用于临床试验中的基因转移的用途的额外例子包括Rosenecker等人,Infection 24:1 5-10(1996);Sterman等人,Hum.Gene Ther.9:71083-1089(1998);Welsh等人,Hum.GeneTher.2:205-18(1995);Alvarez等人,Hum.Gene Ther.5:597-613(1997);Topf等人,GeneTher.5:507-513(1998);Sterman等人,Hum.Gene Ther.7:1083-1089(1998)。

包装细胞用于形成能感染宿主细胞的病毒粒子。此类细胞包括包装腺病毒的293细胞以及包装逆转录病毒的ψ2细胞或PA317细胞。用于基因疗法中的病毒载体通常是由将核酸载体包装至病毒粒子中的生产细胞系产生。载体典型地含有包装和随后整合至宿主中(如果适用)所需的最小病毒序列,其他病毒序列由编码要表达的蛋白质的表达盒替代。失去的病毒功能由包装细胞系反式供应。例如,用于基因疗法中的AAV载体典型地仅具有来自AAV基因组的反相末端重复(ITR)序列,所述序列是包装和整合至宿主基因组中所需的。将病毒DNA包装于细胞系中,所述细胞系含有编码其他AAV基因(即,rep和cap)但缺少ITR序列的辅助质粒。所述细胞系还被作为辅助者的腺病毒感染。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。由于缺少ITR序列,辅助质粒并未被大量包装。腺病毒的污染可以通过例如热处理来减少,腺病毒对所述热处理比AAV更敏感。

在许多基因疗法应用中,可期望以高度特异性将基因疗法载体递送至特定组织类型。因此,可以修饰病毒载体,以通过将配体表达为与病毒外表面上的病毒外壳蛋白的融合蛋白而具有对给定细胞类型的特异性。配体被选择以具有对已知存在于目标细胞类型上的受体的亲和力。例如,Han等人,Proc.Natl.Acad.Sci.USA 92:9747-9751(1995)报道,莫洛尼(Moloney)鼠白血病病毒可以被修饰以表达与gp70融合的人类神经生长因子,并且重组病毒感染某些表达人类表皮生长因子受体的人类乳腺癌细胞。这个原则可以扩展至其他病毒-靶细胞对,其中靶细胞表达受体并且病毒表达包含针对细胞表面受体的配体的融合蛋白。例如,丝状噬菌体可以被工程化以展示对实际上任何所选细胞受体具有特定结合亲和力的抗体片段(例如,FAB或Fv)。虽然上述说明主要适用于病毒载体,但是相同原则可以适用于非病毒载体。此类载体可以被工程化以含有特定摄取序列,所述摄取序列有利于被特定靶细胞摄取。

基因疗法载体可以通常通过如下所述的系统性给予(例如,静脉内、腹膜内、肌内、皮下、舌下或颅内输注)局部施加或经由肺吸入在体内给予至个体受试者来递送。可替代地,可以将载体离体递送至细胞中,例如从个别患者外植的细胞(例如,淋巴细胞、骨髓抽取物、组织活检)或全适供血者造血干细胞,之后将所述细胞再植入患者体内,通常在选择已经掺入所述载体的细胞后再植入。

也可以将含有核酸酶和/或供体构建体的载体(例如,逆转录病毒、腺病毒、脂质体等)直接给予至生物体以在体内转导细胞。可替代地,可以给予裸DNA。通过通常用于引入分子以与血液或组织细胞最终接触的任何途径给予,所述途径包括但不限于注射、输注、局部施加、吸入和电穿孔。使用此类核酸的适宜方法是本领域技术人员可获得的并且所熟知的,并且虽然可以使用多于一种途径来给予特定组合物,但是特定途径通常可以提供比另一途径更直接并且更有效的反应。

适用于引入本文所述的多核苷酸的载体包括非整合慢病毒载体(IDLV)。参见例如,Ory等人(1996)Proc.Natl.Acad.Sci.USA 93:11382-11388;Dull等人(1998)J.Virol.72:8463-8471;Zuffery等人(1998)J.Virol.72:9873-9880;Follenzi等人(2000)Nature Genetics 25:217-222;美国专利号8,936,936。

药学上可接受的载体部分取决于所给予的特定组合物,以及取决于用于给予所述组合物的特定方法。因此,存在众多种可使用的药物组合物的适宜制剂,如下文所述(参见例如,Remington's Pharmaceutical Sciences,第17版,1989)。

清楚的是,可以使用相同或不同的系统递送核酸酶编码序列和供体构建体。例如,供体多核苷酸可以由AAV携带,而一种或多种核酸酶可以由mRNA携带。此外,可以通过相同或不同的途径给予(肌内注射、尾静脉注射、其他静脉注射、腹膜内给予和/或肌内注射)不同的系统。可以同时或以任何顺序递送多种载体。

用于离体和体内给予的制剂包括在液体或乳化液体中的悬浮液。活性成分经常与药学上可接受的且与活性成分相容的赋形剂混合。合适的赋形剂包括例如水、盐水、右旋糖、甘油、乙醇等及其组合。另外,所述组合物可以含有少量辅助物质,诸如润湿剂或乳化剂、pH缓冲剂、稳定剂或增强药物组合物的有效性的其他试剂。

用于修饰mtDNA,包括用于治疗和/或预防线粒体障碍所给予的有效量将在受试者之间并且根据给予模式和给予部位而变化。因此,有效量最佳由给予组合物的人来决定,并且本领域普通技术人员可以容易地决定适当剂量。在某些实施方案,在允许足够时间进行表达(例如,通常2-15天或更多)之后,分析mtDNA修饰的血清或其他组织水平以及与给予之前相比较将确定所给予的量是否过低、在适当范围内或者过高。用于初始和后续给予的适宜方案也是可变的,但是如果需要,以初始给予随后为后续给予为代表。后续给予可以按可变间隔来给予,介于每天至每年至每隔若干年的范围内。在某些实施方案中,在使用病毒载体诸如AAV时,给予的总剂量或组分剂量可以在1x1010与5x1015个vg/ml之间(或其间的任何值),甚至更优选地在1x1011与1x1014个vg/ml之间(或其间的任何值),甚至更优选地在1x1012与1x1013个vg/ml之间(或其间的任何值)。在一些实施方案中,总剂量可以静脉内给予并且可以在5e12个vg/kg与1e15个vg/kg之间(或其间的任何值),甚至更优选地在5e13个vg/kg与5e14个vg/kg之间(或其间的任何值),甚至更优选地在5e13个vg/kg与1e14个vg/kg之间(或其间的任何值)。

应用

本文公开的方法和组合物用于例如通过改变突变体mtDNA与野生型DNA的异质性比率,使得线粒体疾病或障碍得以治疗和/或预防来为所述疾病和障碍提供疗法。所述细胞可以体内修饰或者可以离体修饰,并且随后向受试者给予。因此,所述方法和组合物提供对于线粒体障碍的治疗和/或预防。

可以使用本文所述的方法和组合物治疗和/或预防的线粒体障碍的非限制性例子包括:LHON(Leber遗传性视神经病变)、MM(线粒体肌病)、AD(阿尔茨海默氏病)、LIMM(致死性婴儿线粒体肌病)、ADPD(阿尔茨海默氏病和帕金森氏病)、MMC(母系肌病和心肌病)、NARP(神经源性肌肉软弱、共济失调和视网膜色素变性;被报告为Leigh病的在此基因座处的交替表型)、FICP(致死性婴儿心肌病加MELAS相关心肌病)、MELAS(线粒体脑肌病、乳酸酸中毒和中风样发作)、LDYT(Leber遗传性视神经病变和肌张力障碍)、MERRF(肌阵挛性癫痫和破碎样红肌肉纤维)、MHCM(母系遗传的肥厚性心肌病)、CPEO(慢性进行性眼外肌麻痹)、KSS(Kearns Sayre综合征)、DM(糖尿病)、DMDF(糖尿病+耳聋)、CIPO(伴随肌病和眼肌麻痹的慢性假性肠梗阻)、DEAF(母系遗传的耳聋或氨基糖苷诱导的耳聋)、PEM(进行性脑病)、SNHL(感音神经性聋)、老化、脑肌病、FBSN(家族性双侧纹状体坏死)、PEO和SNE(亚急性坏死性脑病)。

核酸酶介导的切割可以用于校正与疾病相关的mtDNA序列(例如,点突变、取代突变等)。校正可以经由例如在有效的DNA修复机制不存在的情况下切割的mtDNA序列的降解进行,通常在线粒体中是这种情况。可以被靶向的特定突变体人mtDNA包括1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472插入、8344G、8356C 8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C和14709C。

以非限制性例子的方式,本文所述的方法和组合物可以用于治疗和/或预防线粒体障碍,包括但不限于线粒体肌病;糖尿病和耳聋(DAD);Leber病;Leber遗传性视神经病变(LHON),其特征在于由于视神经和视网膜的变性而导致中央视觉的进行性丧失,在芬兰影响50,000分之1的人;Leigh综合征;母系遗传的Leigh综合征;Leigh样综合征;神经病、共济失调、视网膜色素变性和上睑下垂(NARP);肌神经源性胃肠脑病(MNGIE);伴随破碎样红纤维的肌阵挛性癫痫(MERRF);线粒体肌病、脑肌病、乳酸酸中毒、中风样发作(MELAS);mtDNA缺失线粒体神经胃肠脑肌病(MNGIE)、心肌病、耳聋、其他障碍。

以下实施例涉及本公开文本的示例性实施方案,其中核酸酶包含锌指核酸酶(ZFN)。应理解,这仅是出于示例的目的并且可以使用其他核酸酶,例如TALEN、TtAgo和CRISPR/Cas系统、具有工程化DNA结合结构域的归巢核酸内切酶(大范围核酸酶)和/或天然存在的工程化的归巢核酸内切酶(大范围核酸酶)DNA结合结构域与异源切割结构域的融合物和/或大范围核酸酶与TALE蛋白的融合物。例如,另外的核酸酶可以被设计成与包含本文公开的序列的9至12个连续核苷酸的序列(例如,表2)结合。另外,以下实施例涉及这样的核酸酶,其中DNA结合结构域(ZFP、TAL效应子结构域、sgRNA等)与具有5024C>T突变(如表2所示)的mtDNA选择性地结合。应清楚的是,这仅是出于示例的目的并且设想与其他突变体mtDNA序列结合的核酸酶,包括但不限于以下位置中的一个或多个处的一种或多种突变:1555G、1624T、3243G、3460A、3271C、4300G、5545T、7445G、7472随机插入、8344G、8356C8993G、9176G/C、10158C、10191C、10197A、11777A、11778A、13513A、14459A、14484C、14487C和/或14709C。

实施例

实施例1:mtDNA核酸酶

基本上如以下文献中所述来设计靶向至mtDNA的锌指蛋白并且将其掺入mRNA、质粒、AAV或腺病毒载体中:Gammage等人(2014)EMBO Mol Med.6:458-466;Gammage等人(2016)Methods in Mol.Biol.1351:145-162;美国专利号6,534,261和9,139,628。

具体地,生成具有对于突变体mtDNA(m5024C>T)的单核苷酸结合特异性的ZFP对。参见图1。因为小鼠mtDNA中的此位点对于ZFP是具有挑战性的,所以采用具有不同数量的锌指基序、间隔区长度和另外的接头的靶向策略的选择。候选ZFP的组装产生被称为突变体特异性单体(MTM)的靶向m.5024C>T位点的24个独特ZFP;和被称为野生型特异性单体1(WTM1)的靶向相对链上的相邻序列的单一配偶体ZFP的文库(图1A)。

通过在5’EcoRI与3’BamHI限制位点之间的FokI(+)的上游插入MTM ZFP结构域来克隆MTM(n)_T2A_WTM1 m.5024C>T候选文库。然后对此产物进行PCR扩增,以包括5’ApaI位点并去除3’终止密码子,同时还掺入T2A序列和3’XhoI位点。然后使用ApaI/XhoI位点将此片段克隆到pcmCherry(Addgene 62803)中。使用5’EcoRI和3’BamHI位点在掺入3’锤头状核酶(HHR)的pcmCherry_3k19载体(Addgene 104499)中FokI(-)的上游单独克隆WTM1 ZFP,并且对所得产物进行PCR扩增,以包括5’XhoI和3’AflII位点,从而允许在MTM(n)变体的下游克隆。

还将MTM25(+)和WTM1(-)单体克隆到单独的pcmCherry和pTracer载体中,如先前在Gammage等人(2016)Methods in Mol.Biol.1351:145-162中所述。通过MTM25(+)_HHR和WTM1(-)_HHR转基因的PCR扩增掺入5’EagI和3’BglII位点来实现预期用于AAV产生的mtZFN的载体构建。

然后将这些产物克隆到rAAV2-CMV中的5’EagI与3’BamHI位点之间。通过PCR用血凝素(HA)标签替代WTM1(-)的FLAG表位。使用所得质粒在UNC基因疗法中心的载体核心实验室(UNC Gene Therapy Center,Vector Core Facility,教堂山,北卡罗来纳州)生成重组AAV2/9.45-CMV-MTM25和AAV2/9.45-CMV-WTM1病毒颗粒。将3K19锤头状核酶(HHR)序列(Beilstein等人(2015)ACS Synth Biol 4:526-534)掺入mtZFN-AAV9.45构建体中,以允许来自CMV的转基因的普遍表达,同时限制表达水平,从而允许给予在不诱导大mtDNA拷贝数缺失的情况下确保靶向组织中细胞的有效共转导所需的高病毒滴度。

表1示出了示例性mtDNA ZFP DNA结合结构域的DNA结合结构域内的识别螺旋和这些ZFP的靶位点(DNA靶位点用大写字母表示;非接触核苷酸用小写字母表示)。由ZFP识别螺旋接触的靶位点中的核苷酸用大写字母表示;非接触核苷酸用小写字母表示。还遵循本领域已知的方法将TALEN和/或sgRNA设计成表2中所示的序列(例如,包含表2中所示的靶位点的9至20个或更多个(包括9、10、11、12、13、14、15、16、17、18、19、20、21个或更多个)核苷酸(连续或非连续的核苷酸)的靶位点)。参见例如,美国专利号8,586,526(使用TALEN的经典或非经典RVD)和美国专利公开号2015/0056705。

表1:mtDNA锌指蛋白识别螺旋设计

表2:锌指蛋白的靶位点

MTM# SBS# 靶位点
WTM1 48960 aaGTTAAACTTGTGTGTtttcttagggc(SEQ ID NO:33)
MTM62 48962 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM24 51024 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM25 51025 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM26 51026 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM27 51027 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM28 51028 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM29 51029 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM30 51030 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM32 51032 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM33 51033 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM36 51036 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM37 51037 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM39 51039 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM42 51042 tgATAAGGATTGTAaGACTTCatcctac(SEQ ID NO:34)
MTM43 51043 tgATAAGGATTGTAaGACttcatcctac(SEQ ID NO:34)
MTM45 51045 tgATAAGGATTGTAAGActtcatcctac(SEQ ID NO:34)
MTM65 48965 gaTAAGGATTGTAAGACttcatcctaca(SEQ ID NO:35)
MTM66 48966 gaTAAGGATTGTAAGACttcatcctaca(SEQ ID NO:35)
MTM48 51048 gaTAAGGATTGTAAGACttcatcctaca(SEQ ID NO:35)
MTM49 51049 gaTAAGGATTGTAAGACttcatcctaca(SEQ ID NO:35)
MTM50 51050 gaTAAGGATTGTAAGACttcatcctaca(SEQ ID NO:35)
MTM52 51052 gaTAAGGATTGTAAgacttcatcctaca(SEQ ID NO:35)
MTM55 51055 gaTAAGGATTGTAAGACttcatcctaca(SEQ ID NO:35)
MTM56 51056 gaTAAGGATTGTAAGACttcatcctaca(SEQ ID NO:35)

测试所有ZFN成对组合的切割活性。将野生型和m.5024C>T小鼠胚胎成纤维细胞(MEF)细胞系在含有2mM L-谷氨酰胺、110mg/L丙酮酸钠(Life Technologies)和10%FCS(PAA Laboratories)的Dulbecco改进的Eagle培养基(DMEM)中培养。使用MEF1试剂盒和T20程序,使用Nucleofector II设备(Lonza)通过电穿孔转染细胞。如Gammage等人(2016)Methods Mol Biol 1352:145-162中所述进行荧光激活细胞分选(FACS)。通过将四环素滴定到培养基中,控制HHR自催化的速率来实现mtZFN表达的控制,如先前在Gammage等人(2016)Nucleic Acids Res 44:7804中所述,其还描述如何进行总细胞蛋白提取。通过在SDS-PAGE 4%-12%bis-tris Bolt凝胶上拆分20-100μg提取的蛋白质来实现通过蛋白质印迹检测蛋白质。使用iBlot 2转移池(Life Technologies)将这些转移到硝基纤维素。此工作中用于蛋白质印迹的抗体:大鼠抗HA(Roche,1:500)、山羊抗大鼠HRP(Santa Cruz,1:1000)。使用考马斯亮蓝(Life Technologies)对凝胶进行染色以用于负载。发现所有的对是活性的。

还在携带约65%m.5024C>T的小鼠胚胎成纤维细胞(MEF)中使构建体经受若干轮的筛选以评估异质性偏移活性。如图1所示,这些筛选鉴定成对MTM25/WTM1的一致的特异性活性,其在MEF细胞系中产生从65%至45%m.5024C>T的约20%偏移,如通过焦磷酸测序所测定的。简而言之,通过焦磷酸测序进行m.5024C>T mtDNA异质性的评估。使用具有以下引物的100ng模板DNA,使用KOD DNA聚合酶(Takara)准备40个周期的用于焦磷酸测序的PCR反应:

m.4,962–4,986正向

5’ATACTAGTCCGCGAGCCTTCAAAG 3’(SEQ ID NO:36)

m.5,360–m.5,383反向

5’[Btn]GAGGGTTCCGATATCTTTGTGATT 3’(SEQ ID NO:37)

m.5003–m.5022测序引物

5’AAGTTTAACTTCTGATAAGG 3’(SEQ ID NO:38)

另外,如Minczuk等人(2010)Methods Mol Biol 649:257-270中所述通过固定MEF细胞中的免疫荧光确认线粒体定位。MTM25和WTM1唯一地定位在线粒体中,并且选择此对用于进一步的体内实验。

应清楚的是,这些设计可以包括在任何指分子之间和/或在ZFP与切割结构域之间的任何接头,包括但不限于如美国专利号9,394,531中所述的经典和/或非经典接头(在指之间)和/或ZFP与切割结构域之间的接头。还参见,美国专利号8,772,453和美国专利公开号2015/0064789。

此外,可以设计除ZFN以外的核酸酶(包括CRISPR/Cas核酸酶、TALEN等)以靶向9-18个或更多个如以上所示的核苷酸的位点。核酸酶(ZFN、CRISPR/Cas系统和TALEN)中的任一种可以包含工程化切割结构域(例如美国专利号8,623,618中披露的异二聚体(例如,ELD和KKR工程化切割结构域))和/或如美国专利公开号20180087072中所述的在位置416、422、447、448和/或525中具有一种或多种突变的切割结构域。这些突变体与本文所述的示例性ZFP DNA结合结构域结合使用。

实施例2:体内核酸酶活性

还在小鼠体内测试核酸酶活性。将此研究中使用的C57BL/6j-t RNAALA小鼠以每个笼子一至四只圈养在温度受控(21℃)的房间中,其中明亮-黑暗周期为12h并且相对湿度为60%。

在单独的病毒基因组中编码MTM25和WTM1 mtZFN单体并且将其包裹在心脏靶向性的工程化AAV9.45血清型中(图1D)。参见Pulicheria等人(2011)Mol Ther 19:1070-1078。通过在SDS-PAGE 4%-12%bis-tris Bolt凝胶上拆分20-100μg提取的蛋白质来实现通过蛋白质印迹检测蛋白质。使用iBlot 2转移池(Life Technologies)将这些转移到硝基纤维素。此工作中用于蛋白质印迹的抗体:大鼠抗HA(Roche,11867431001,1:500)、山羊抗大鼠HRP(Santa Cruz,SC2065,1:1000)。使用考马斯亮蓝(Life Technologies)对凝胶进行染色以用于负载。

如图1E所示,在系统性(尾静脉)给予5x1012个病毒基因组(vg)/单体/小鼠之后,通过蛋白质印迹检测总小鼠心脏组织中MTM25和WTM1的稳健表达。

如下进行进一步的体内实验。如下所示在组中处理具有44%-81%m.5024C>T异质性(20个媒介物,7个单一单体,4/mtZFN-AAV9.45剂量)的2至8个月大的雌性小鼠:

通过尾静脉注射系统性地给予媒介物(1x PBS,350mM NaCl,5%w/v D-山梨醇)和AAV的处理。

对于小鼠心脏组织,将其50mg使用gentleMACS解离器(Miltenyi)在RIPA缓冲液(150mM NaCl,50mM Tris(pH 8),1%(v/v)Triton X-100,0.5%(v/v)脱氧胆酸盐,0.1%(v/v)SDS)中匀浆化。将所得匀浆以10,000x g在4℃下离心10分钟,然后回收上清液并且将其以10,000x g在4℃下离心10分钟。通过BCA测定(Pierce)测定细胞和组织蛋白提取物的浓度。

进行通过焦磷酸测序进行的mtDNA异质性的评估,并且将其表示为两周大时(实验干预之前)确定的耳洞基因型与死后心脏基因型之间的变化(Δ)。简而言之,根据制造商的方案(Applied Biosystems),使用PowerUp SYBR Green主混合物通过qPCR测定小鼠心脏样品的线粒体DNA拷贝数。使用7900HT快速实时PCR系统(Thermo Fisher)分析样品。使用以下引物:

MT-COI正向

5’TGCTAGCCGCAGGCATTACT 3’(SEQ ID NO:39)

MT-COI反向

5’CGGGATCAAAGAAAGTTGTGTTT 3’(SEQ ID NO:40)

RNaseP正向

5’GCCTACACTGGAGTCCGTGCTACT 3’(SEQ ID NO:41)

RNaseP反向

5’CTGACCACACACGAGCTGGTAGAA3’(SEQ ID NO:42)

分别针对C57BL/6j小鼠核和线粒体基因组,使用NCBI参考序列GRCm38.p6和NC_005089.1设计焦磷酸测序和qPCR的所有引物。

如图1F和图1G所示,在注射后65天注射的动物揭示了mtZFN处理的小鼠中m.5024C>T突变体mtDNA的消除,但在媒介物或单一单体注射的对照中没有消除。通过mtZFN处理改变异质性的程度遵循双相AAV剂量依赖性趋势,其中中间剂量(5x1012个vg)在消除m.5024C>T突变体mtDNA中是最有效的。最低的(1x1012个vg)剂量没有导致异质性偏移,这可能是由于mtZFN的浓度不足和/或AAV导致靶向组织的镶嵌转导。最高的剂量(1x1013个vg)展现出与中间剂量(5x1012个vg)相比减弱的异质性偏移活性,这可能是由于导致部分mtDNA拷贝数缺失的脱靶作用,当给予较低剂量时未观察到这种现象(图1G)。后一种结果与我们过去的观察一致,从而强调了微调线粒体中mtZFN水平对于有效的mtDNA异质性修饰的重要性。

已经定义了体内实现m.5024C>T异质性的稳健偏移的条件,我们接下来解决线粒体疾病的动物模型中疾病相关的表型校正(参见Kauppila等人(2016)Cell Rep 16:2980-2990。在tRNAALA小鼠模型中重现的线粒体疾病中mt-tRNA的共同特征是与突变体负载成比例的mt-tRNA分子的不稳定性。参见图2A;Yarham等人(2010)Wiley Inderdiscip Rev RNA1:304-324。

为了评估mtZFN处理对于用跨剂量范围的mtZFN处理的动物的心脏中mt-tRNAALA的稳定性的影响,基本上如Pearce等人(2017)Elife 6,doi:10-7554/eLife.27596中所述进行northern印迹。简而言之,通过使用gentleMACS解离器(Miltenyi)的匀浆化,使用Trizol(Ambion)从25mg的小鼠心脏组织提取总RNA。具体地,在含有8M脲的10%聚丙烯酰胺凝胶上拆分5ug的总RNA。将凝胶干燥地印迹到带正电的尼龙膜(Hybond-N+)上,其中所得的膜通过暴露于254nm UV光,120mJ/cm2进行交联。对于tRNA探针,将交联的膜与由对应于小鼠mtDNA的适当区域的PCR片段转录的放射活性标记的RNA探针T7杂交。用互补α[32P]-末端标记的DNA寡聚物探测5SrRNA。将膜暴露于储存磷光质屏并且使用Typhoon磷光成像系统(GE Healthcare)进行扫描。使用Fiji软件定量信号。寡聚物序列如下:

MT-TA正向

5’

TAATACGACTCACTATAGGGAGACTAAGGACTGTAAGACTTCATC 3’(SEQ ID NO:43)

MT-TA反向(SEQ ID NO:44)

5’GAGGTCTTAGCTTAATTAAAG 3’

MT-TC正向(SEQ ID NO:45)

5’TAATACGACTCACTATAGGGAGACAAGTCTTAGTAGAGATTTCTC3’

MT-TC反向(SEQ ID NO:46)

5’GGTCTTAAGGTGATATTCATG 3

5S rRNA寡聚物:

5’

AAGCCTACAGCACCCGGTATTCCCAGGCGGTCTCCCATCCAAGTACTAACCA 3’(SEQ ID NO:47)

分别针对C57BL/6j小鼠核和线粒体基因组,使用NCBI参考序列GRCm38.p6和NC_005089.1设计northern印迹和qPCR的所有引物。

如图2B所示,存在mt-tRNAALA稳态水平的显著增加,其与这些小鼠中检测到的异质性偏移成比例(图1F)。与给予高病毒剂量相关的mtDNA拷贝数的缺失(图1G)未显现出影响异质性偏移之后mt-tRNAALA稳态水平的恢复,这与先前公布的数据一致,即甚至严重的mtDNA缺失也不显示出线粒体RNA稳态水平的成比例变化。参见Jazayeri等人(2003)J.Biol.Chem 278:9823-9830。

进行进一步的实验以评估mt-tRNAALA分子表型救援的生理作用。具体地,评估来自用中间病毒滴度(5x1012个vg)处理的小鼠的心脏组织中的稳态代谢物丰度。简而言之,切割冷冻的组织样本并且称重到预填充陶瓷珠(Stretton Scientific Ltd.,德比郡,英国)的Precellys管中。添加准确体积的提取溶液(30%乙腈,50%甲醇和20%水)以获得40mg样本/mL提取溶液。使用Precellys 24均化器(Stretton Scientific Ltd.,德比郡,英国)裂解组织样品。将悬浮液混合并且在热混合器(Eppendorf,德国)中在4℃下孵育15分钟,接着进行离心(16,000g,在4℃下15分钟)。采集上清液并且转移到自动采样器玻璃小瓶中,将其在-80℃下储存,直至进一步分析。将样品随机化,以便避免由于机器沉降导致的偏差并且进行盲处理。使用QExactive Orbitrap质谱仪结合Dionex U3000 UHPLC系统(Thermo)进行LC-MS分析。将液相色谱系统装配来自Merck Millipore(德国)的ZIC-pHILIC柱(150mm×2.1mm)和保护柱(20mm×2.1mm),并且将温度维持在40℃。流动相由20mM碳酸铵和在水(溶剂A)中的0.1%氢氧化铵和乙腈(溶剂B)构成。将流速设定在200μL/min,其中梯度如先前在Mackay等人(2015)Methods Enzymol 561:171-196中所述。以全MS和极性转换模式操作质谱仪。使用XCalibur Qual Browser和XCalibur Quan Browser软件(Thermo Scientific)分析获取的谱。

如图2C至图2E所示,此分析揭示了mtZFN处理的小鼠中改变的代谢特征(图2C),从而证明了与对照相比升高的磷酸烯醇丙酮酸盐和丙酮酸盐水平以及较低的乳酸盐水平(图2D)。另外,经处理的动物展现出更高的葡萄糖水平,但是更低的葡萄糖-6-磷酸盐和果糖-6-磷酸盐水平(图2E)。

因此,实现了使用核酸酶进行的m.5024C>T异质性偏移后的线粒体功能的恢复。

总而言之,数据证明了靶向突变体线粒体DNA序列的核酸酶可以在体外和体内用于操纵小鼠mtDNA中的异质性突变,从而产生心脏组织中疾病表型的分子和生理救援。

本文提及的所有专利、专利申请和出版物均通过引用以其整体特此并入。

虽然已经出于清晰理解的目的通过说明和实施例详细提供了公开文本,但是本领域技术人员将了解,可以在不背离本公开文本的精神或范围的情况下进行各种改变和修改。因此,前述说明和实施例不应视为限制性的。

50页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:免疫刺激剂及预防感染的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!