用于基因编辑的组合物和方法

文档序号:1602458 发布日期:2020-01-07 浏览:14次 >En<

阅读说明:本技术 用于基因编辑的组合物和方法 (Compositions and methods for gene editing ) 是由 A.S.伦德伯格 S.库尔卡尼 L.克莱因 H.K.帕马纳班 Y.S.阿拉泰恩 于 2018-02-21 设计创作,主要内容包括:本申请提供了用于治疗患有与ANGPTL3相关的一种或多种病状的患者的离体或体内材料和方法。另外,本申请提供了用于通过基因组编辑来编辑和/或调节ANGPTL3基因在细胞中的表达的材料和方法。(The present application provides ex vivo or in vivo materials and methods for treating patients having one or more conditions associated with ANGPTL 3. In addition, the present application provides materials and methods for editing and/or regulating expression of the ANGPTL3 gene in a cell by genome editing.)

用于基因编辑的组合物和方法

相关申请

本申请根据35U.S.C.§119(e)要求于2017年2月22日提交的美国临时申请第62/461,829号、于2017年6月29日提交的美国临时申请第62/526,562号和于2017年11月17日提交的美国临时申请第62/587,832号的权益,所述美国临时申请中的每一个均以全文引用的方式并入本文中。

序列表

本申请与电子格式的序列表一起提交。标题为C154270001WO00-SEQLIST-HJD.txt的序列表文件创建于2017年10月27日并且大小为13.2MB。电子格式的序列表中的信息以全文引用的方式并入本文中。

技术领域

在一些方面,本公开涉及基因编辑领域,例如,涉及血管生成素样3(ANGPTL3)基因的改变。

背景技术

基因组工程化是指用于对活生物体的遗传信息(基因组)进行有针对性的特异性修饰的策略和技术。由于具有广泛范围的可能应用,特别是在人类健康领域中,因此基因组工程化是非常活跃的研究领域。例如,基因组工程化可以用于改变(例如,校正或敲除)携带有害突变的基因或探索基因的功能。被开发用于将转基因***到活细胞中的早期技术常常受到将新序列***到基因组中的随机性质的限制。随机***到基因组中可能导致扰乱对邻近基因的正常调节,从而导致严重的不利作用。此外,随机整合技术几乎不提供再现性,因为无法保证序列将会被***到两个不同细胞中的相同位置处。如锌指核酸酶(ZFN)、转录激活子样效应核酸酶(TALEN)、归巢核酸内切酶(HE)和MegaTAL等最近的基因组工程化策略使能够修饰DNA的特定区域,从而与早期技术相比提高了改变的精确度。这些较新的平台提供了更大程度的再现性,但仍有其局限性。

尽管全球研究人员和医疗专业人员一直努力试图解决遗传病症并且尽管基因组工程化方法是有前途的,但是仍然迫切地需要开发涉及ANGPTL3相关适应症的安全且有效的治疗方案。

通过使用基因组工程化工具使基因组产生可以通过单次治疗解决ANGPTL3相关病症或病状的永久性变化,所得到的疗法可以完全补救某些ANGPTL3相关适应症和/或疾病。

发明内容

在一些方面,本公开提供了用于修饰血管生成素样3(ANGPTL3)基因的高效基因编辑方法。例如,在一些实施例中,本文的基因编辑方法可以用于修饰群中至少50%、至少60%或至少70%的细胞。令人惊讶的是,在一些实施例中,这些经过修饰的细胞群中的细胞表现出ANGPTL3蛋白分泌减少5倍(或更多)。因此,这些方法可以特别用于治疗如血脂异常等ANGPTL3相关适应症。进一步地,在一些实施例中,本文所提供的方法使用了允许更准确地外推从动物模型到人类的实验数据的跨物种(交叉反应性)基因编辑系统。

在一些方面,本文提供了用于生产经过血管生成素样3(ANGPTL3)修饰的细胞群的方法,所述方法包括:向细胞中引入(a)靶向ANGPTL3基因组基因座(例如,SEQ ID NO:5304)的向导RNA(gRNA)或对gRNA进行编码的核酸(例如,作为交叉反应性gRNA)以及(b)RNA引导的核酸内切酶或对RNA引导的核酸内切酶进行编码的核酸(例如,Cas9);以及生产包括所述ANGPTL3基因组基因座中的修饰(例如,***、缺失或至少一个核苷酸突变)的细胞的群。在一些实施例中,gRNA包括与ANPTL3基因组基因座内的序列互补的(20bp)间隔序列(例如,ANGPTL3基因内,例如,染色体1:62,597,486到1:62,606,304)。***是引入至少一个核苷酸,缺失是去除至少一个核苷酸,并且突变是至少一个核苷酸(例如,从一个核苷酸如C到另一个核苷酸如A)的变化。

在一些实施例中,所述群中至少50%的所述细胞包括所述ANGPTL3基因中的修饰(例如,***、缺失或至少一个核苷酸突变)。例如,群中至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%可以包括AGPTL3基因中的修饰。在一些实施例中,群中50%-100%的细胞包括所述ANGPTL3基因中的修饰。例如,群中50%-60%、50%-65%、50%-70%、50%-75%、50%-80%、50%-85%、50%-90%、或50%-95%的细胞可以包括ANGPTL3基因中的修饰。在一些实施例中,所述群中50%-70%的所述细胞包括所述ANGPTL3基因中的修饰。

在一些实施例中,由所述群中的细胞分泌的ANGPTL3蛋白相对于对照物减少至少2倍。例如,由群中的细胞分泌的ANGPTL3蛋白可以相对于对照物减少至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍或至少10倍。在一些实施例中,由所述群中的细胞分泌的ANGPTL3蛋白相对于对照物减少至少5倍。在一些实施例中,由群中的细胞分泌的ANGPTL3蛋白相对于对照物减少至少2倍到5倍。

在一些实施例中,所述对照物是未经过修饰的细胞群和/或未接收包括与所述ANGPTL3基因的区域互补的间隔序列的所述gRNA的细胞群。在一些实施例中,所述对照物是接收包括与非ANGPTL3基因的区域互补的间隔序列的gRNA的细胞群。

在一些实施例中,所述RNA引导的核酸内切酶是Cas9核酸内切酶。在一些实施例中,所述RNA引导的核酸酶是Cpf1核酸酶。可以使用其它RNA引导的核酸酶。在一些实施例中:所述Cas9核酸内切酶或Cpf1核酸内切酶选自化脓性链球菌(S.pyogenes)Cas9、金黄色葡萄球菌(S.aureus)Cas9、脑膜炎奈瑟氏菌(N.meningitides)Cas9、嗜热链球菌(S.thermophilus)CRISPR1Cas9、嗜热链球菌CRISPR 3Cas9、齿垢密螺旋体(T.denticola)Cas9、毛螺科菌(L.bacterium)ND2006Cpf1和氨基酸球菌属(Acidaminococcus sp.)BV3L6Cpf1。

在一些实施例中,所述gRNA是单向导RNA(sgRNA)(其含有靶向序列(crRNA序列)和RNA引导的核酸酶募集序列(tracrRNA))。

在一些实施例中,所述gRNA靶向所述ANGPTL3基因组基因座中的调节元件(例如,启动子、增强子或其它调节元件)。

在一些实施例中,所述gRNA对人和食蟹猴具有交叉反应性(例如,gRNA的间隔序列与人ANGPTL3基因的区域互补并且与食蟹猴ANGPTL3基因的区域互补)。

在一些实施例中,所述gRNA是经过化学修饰的gRNA。在一些实施例中,所述经过化学修饰的gRNA在所述gRNA的3'端和5'端包括硫代磷酸化2'-O-甲基核苷酸。在一些实施例中,所述经过化学修饰的gRNA在所述gRNA的3'端包括硫代磷酸化2'-O-甲基核苷酸。在一些实施例中,所述经过化学修饰的gRNA在所述gRNA的5'端包括硫代磷酸化2'-O-甲基核苷酸。在一些实施例中,所述经过化学修饰的gRNA在所述gRNA的3'端和/或5'端包括三个硫代磷酸化2'-O-甲基核苷酸。

在一些实施例中,所述细胞包括肝细胞。

在一些实施例中,所述间隔序列包括选自以下的间隔序列:CAAAGACCUUCUCCAGACCG(SEQ ID NO:17071);GCCAAUGGCCUCCUUCAGUU(SEQ ID NO:17069);以及GGCCUCCUUCAGUUGGGACA(SEQ ID NO:17070)。在一些实施例中,所述间隔序列包括GCCAAUGGCCUCCUUCAGUU(SEQ ID NO:17069)。在一些实施例中,所述间隔序列包括GGCCUCCUUCAGUUGGGACA(SEQ ID NO:17070)。在一些实施例中,所述间隔序列包括CAAAGACCUUCUCCAGACCG(SEQ ID NO:17071)。

在一些实施例中,所述细胞群存在于具有ANGPTL3相关病状的受试者中。在一些实施例中,ANGPTL3相关病状是血脂异常(脂质(例如甘油三酯、胆固醇和/或脂肪磷脂)的量异常)。

在一些实施例中,所述gRNA和RNA引导的核酸酶被调配(预先复合)成核糖核蛋白颗粒(RNP)。

在一些实施例中,(a)和/或(b)的所述核酸存在于病毒载体,任选地,腺相关病毒(AAV)载体上。

在一些实施例中,将(a)的所述gRNA或所述对gRNA进行编码的核酸和/或(b)的所述RNA引导的核酸内切酶或所述对RNA引导的核酸内切酶进行编码的核酸调配成脂质体或脂质纳米颗粒(LNP)。

在一些方面,本文还提供了一种交叉反应性向导RNA(gRNA)或对交叉反应性gRNA进行编码的核酸,其包括选自GCCAAUGGCCUCCUUCAGUU(SEQ ID NO:17069)和GGCCUCCUUCAGUUGGGACA(SEQ ID No:17070)的间隔序列。

因此,在一些方面,本文提供了用于通过以下使基因组产生永久性变化的细胞、离体和体内方法:通过基因组编辑在血管生成素样3(ANGPTL3)基因或对ANGPTL3基因的调节因子进行编码的其它DNA序列内或附近引入至少一个核苷酸的***、缺失或突变;以及减少或消除ANGPTL3基因产物的表达或功能,所述ANGPTL3基因产物可以用来治疗如血脂异常等ANGPTL3相关病状或病症。本文还提供了用于执行这种方法的组分和组合物以及载体。

本文还提供了用于通过基因组编辑来编辑细胞中ANGPTL3基因的方法,所述方法包括将一个或多个脱氧核糖核酸(DNA)核酸内切酶(例如,Cas9)引入到细胞中以在ANGPTL3基因或ANGPTL3调节元件内或附近实现一个或多个单链断裂或双链断裂的步骤,所述步骤导致ANGPTL3基因内或附近至少一个核苷酸的一个或多个永久性***、缺失或突变,从而减少或消除了ANGPTL3基因产物的表达或功能。在一些实施例中,还将靶向ANGPTL3基因组基因座的gRNA引入到细胞中。

附图说明

通过参考附图可以更好地理解本说明书中公开和描述的材料和方法的各个方面,在附图中:

图1A描绘了II型CRISPR/Cas系统。

图1B是对II型CRISPR/Cas系统的另一种描绘。

图2、3和4是表示在靶向ANGPTL3基因的HEK293T细胞中具有化脓性链球菌Cas9的gRNA的切割效率的图。

图5A描绘了靶向原代人肝细胞中的ANGPTL3的gRNA的切割效率。

图5B描绘了靶向从食蟹猴分离的原代肝细胞中的ANGPTL3的gRNA的切割效率。

图6A描绘了靶向原代人肝细胞中的ANGPTL3的gRNA的切割效率。

图6B描述了gRNA的基因编辑对原代人肝细胞中的ANGPTL3蛋白分泌的作用。

图7A描绘了靶向原代人肝细胞中的ANGPTL3的gRNA的切割效率。

图7B描述了gRNA的基因编辑对原代人肝细胞中的ANGPTL3蛋白分泌的作用。

图8描述了gRNA的基因编辑对猴肝细胞中的ANGPTL3蛋白分泌的作用。

序列表简要说明

SEQ ID NO:1-620是Cas核酸内切酶直向同源序列。

SEQ ID NO:621-631是故意空白的。

SEQ ID NO:632-4,715是微RNA序列。

SEQ ID NO:4,716-4,733是故意空白的。

SEQ ID NO:4,734-5,302是AAV血清型序列。

SEQ ID NO:5,303是ANGPTL3核苷酸序列。

SEQ ID NO:5,304是在ANGPTL3基因上游和/或下游包含5千碱基对的基因序列。

SEQ ID NO:5,305-5,398是用于通过齿垢密螺旋体Cas9核酸内切酶来靶向ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近的20bp间隔序列。

SEQ ID NO:5,399-5,595是用于通过嗜热链球菌Cas9核酸内切酶来靶向ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近的20bp间隔序列。

SEQ ID NO:5,596-6,079是用于通过金黄色葡萄球菌Cas9核酸内切酶来靶向ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近的20bp间隔序列。

SEQ ID NO:6,080-6,633是用于通过脑膜炎奈瑟氏菌Cas9核酸内切酶来靶向ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近的20bp间隔序列。

SEQ ID NO:6,634-10,171是用于通过化脓性链球菌Cas9核酸内切酶来靶向ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近的20bp间隔序列。

SEQ ID NO:10,172–17,018是用于通过氨基酸球菌属、毛螺菌科(Lachnospiraceae)和新凶手弗朗西斯菌(Francisella novicida)Cpf1核酸内切酶来靶向ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近的22bp间隔序列。

SEQ ID No:17,019-17,048是故意空白的。

SEQ ID NO:17,049是化脓性链球菌Cas9核酸内切酶的样本向导RNA(gRNA)。

SEQ ID NO:17,050-17,052示出了样本sgRNA序列。

SEQ ID No:17,054-17,057示出了样本向导靶序列。

SEQ ID NO:17,059-17,066示出了样本sgRNA序列。

SEQ ID NO:17,053和17,067是最小CRISPR RNA与最小tracrRNA之间的双链体内的核苷酸的示例性非配对区域。

SEQ ID NO:17,068-17,071是实例ANGPTL3gRNA间隔序列。

具体实施方式

I.引言

基因组编辑

本公开提供了用于对活生物体的遗传信息(基因组)进行有针对性的特异性改变的策略和技术。如本文所使用的,术语“改变”或“遗传信息的改变”是指细胞的基因组的任何变化。在治疗遗传病症的背景下,改变可以包含但不限于***、缺失和校正。如本文所使用的,术语“***”是指在DNA序列中添加一个或多个核苷酸。***的范围可以为几个核苷酸的小型***到如cDNA或基因等大片段的***。术语“缺失”是指DNA序列中一个或多个核苷酸的丢失或去除或者基因的功能的丧失或去除。在一些情况下,缺失可以包含例如几个核苷酸、外显子、内含子、基因片段或基因的完整序列的丢失。在一些情况下,基因的缺失是指基因或其基因产物的功能或表达的消除或减少。这可能不仅是由基因内或附近的序列的缺失造成的,还可能是由破坏基因表达的其它事件(例如,***、无义突变)造成的。如本文所使用的,术语“校正”是指细胞中的基因组的一个或多个核苷酸的变化,无论是通过***、缺失还是取代。这种校正可能产生校正到基因组位点的更有利的基因型或表型结果,无论是在结构还是功能上。“校正”的一个非限制性实例包含将突变体或缺陷序列校正为野生型序列,所述野生型序列将结构或功能恢复到基因或其一个或多个基因产物。根据突变的性质,可以经由本文所公开的各种策略实现校正。在一个非限制性实例中,可以通过将含有突变的区域用其野生型对应物替换来校正错义突变。作为另一个实例,可以通过去除额外序列来校正基因中的重复突变(例如,重复扩增)。

在一些方面,改变还可以包含基因敲入、敲除或敲低。如本文所使用的,术语“敲入”是指将DNA序列或其片段添加到基因组中。待敲入的这种DNA序列可以包含一个或多个完整的基因,可以包含与基因缔合的调节序列或者可以包含前述内容的任何部分或片段。例如,可以将对野生型蛋白质进行编码的cDNA***到携带突变基因的细胞的基因组中。敲入策略无需全部或部分地替换缺陷基因。在一些情况下,敲入策略可以进一步涉及用提供的序列取代现有序列,例如,用野生型拷贝取代突变等位基因。另一方面,术语“敲除”是指消除基因或基因的表达。例如,可以通过导致阅读框破坏的核苷酸序列的缺失或添加来敲除基因。作为另一个实例,可以通过用不相关序列替换基因的一部分来敲除基因。最后,如本文所使用的,术语“敲低”是指基因或其一个或多个基因产物的表达的减少。作为基因敲低的结果,可以减弱蛋白质活性或功能或者可以降低或消除蛋白质水平。

基因组编辑通常是指优选地以精确或预定方式修饰基因组的核苷酸序列的过程。本文所描述的基因组编辑方法的实例包含在基因组的精确靶位处使用定点核酸酶来切割脱氧核糖核酸(DNA)由此在基因组内的特定位置处产生单链或双链DNA断裂的方法。这种断裂可以并且经常是通过自然的内源细胞过程进行修复的,所述自然的内源细胞过程如同源定向修复(HDR)和非同源末端连接(NHEJ),如最近在Cox等人,《自然医学(NatureMedicine)》21(2),121-31(2015)中评述的。这两个主要的DNA修复过程由一系列替代性途径组成。NHEJ直接连接由双链断裂产生的DNA末端,有时损失或添加核苷酸序列,这可能破坏或增强基因表达。HDR利用同源序列或供体序列作为用于在断点处***所定义DNA序列的模板。同源序列可以处于如姐妹染色单体等内源性基因组中。可替代地,供体可以是如质粒、单链寡核苷酸、双链寡核苷酸、双链体寡核苷酸或病毒等外源核酸,所述外源核酸具有与核酸酶切割基因座有高同源性的区域,但是还可能含有另外的序列或序列变化,包含可以并入所切割靶基因座中的缺失。第三修复机制可以是微同源性介导的末端连接(MMEJ),也被称为“替代性NHEJ”,其中遗传结果类似于NHEJ之处在于在切割位点处可能发生小型缺失和***。MMEJ可以利用DNA断裂位点侧翼的几个碱基对的同源序列来驱动更有利的DNA末端连接修复结果,并且最近的报告已经进一步阐明了这个过程的分子机制;参见例如,Cho和Greenberg,《自然(Nature)》518,174-76(2015);Kent等人,《自然结构与分子生物学(Nature Structural and Molecular Biology)》,提前在线出版doi(Adv.Online doi):10.1038/nsmb.2961(2015);Mateos-Gomez等人,《自然》518,254-57(2015);Ceccaldi等人,《自然》528,258-62(2015)。在一些情况下,有可能可以基于对DNA断裂位点处的潜在微同源性的分析来预测可能的修复结果。

这些基因组编辑机制中的每一种基因组编辑机制可以用于产生期望的基因组改变。基因组编辑过程中的步骤可以是在靠近预期突变位点的靶基因座中产生一个或两个DNA断裂,这两个DNA断裂作为双链断裂或作为两个单链断裂。这可以通过使用定点多肽来实现,如本文所描述和说明的。

CRISPR核酸内切酶系统

CRISPR(成簇规律间隔短回文重复序列(Clustered Regularly InterspacedShort Palindromic Repeat))基因组基因座可以在许多原核生物(例如,细菌和古菌)的基因组中找到。在原核生物中,CRISPR基因座对充当用于帮助保卫原核生物抵御如病毒和噬菌体等外来侵入物的类型的免疫系统的产物进行编码。CRISPR基因座功能有三个阶段:将新序列整合到CRISPR基因座中、表达CRISPR RNA(crRNA)和使外来侵入物核酸沉默。已经鉴别出了五种类型的CRISPR系统(例如,I型、II型、III型、U型和V型)。

CRISPR基因座包含被称为“重复”的多个短重复序列。重复在被表达时可以形成二级结构(例如,发夹)和/或包括未结构化的单链序列。重复通常成簇地发生并且频繁地在物种之间发散。重复规律地间隔有被称为“间隔”的独特***序列,从而产生重复-间隔-重复基因座架构。间隔与已知的外来侵入物序列完全相同或与其具有高同源性。间隔-重复单元对crisprRNA(crRNA)进行编码,所述crRNA被加工成间隔-重复单元的成熟形式。crRNA包括靶向靶核酸时涉及的“种子”或间隔序列(在原核生物的天然存在形式中,间隔序列靶向外来侵入物核酸)。间隔序列位于crRNA的5'端或3'端。

CRISPR基因座还包括对CRISPR相关(Cas)基因进行编码的多核苷酸序列。Cas基因对生物发生以及原核生物中的crRNA功能的干扰阶段所涉及的核酸内切酶进行编码。一些Cas基因包括同源二级和/或三级结构。

II型CRISPR系统

II型CRISPR系统中的crRNA生物发生本质上需要反式激活CRISPR RNA(tracrRNA)。II型CRISPR系统的非限制性实例示出在图1A和图1B中。tracrRNA可以通过内源RNaseIII修饰并且然后与前体crRNA阵列中的crRNA重复杂交。可以募集内源RNaseIII以对前体crRNA进行切割。切割后的crRNA可以经受核糖核酸外切酶修剪以产生成熟的crRNA形式(例如,5'修剪)。tracrRNA可以保持与crRNA杂交,并且tracrRNA和crRNA与定点多肽(例如,Cas9)缔合。crRNA-tracrRNA-Cas9复合体中的crRNA可以将复合体引导到crRNA可以与其杂交的靶核酸。crRNA与靶核酸的杂交可以激活Cas9以进行靶核酸切割。II型CRISPR系统中的靶核酸被称为原型间隔邻近基序(PAM)。本质上,PAM对于促进定点多肽(例如,Cas9)与靶核酸的结合而言是必不可少的。II型系统(也被称为Nmeni或CASS4)进一步细分为II-A型(CASS4)和II-B型(CASS4a)。Jinek等人,《科学(Science)》337(6096):816-821(2012)显示,CRISPR/Cas9系统可用于RNA可编程基因组编辑,并且国际专利申请公开第WO2013/176772号提供了CRISPR/Cas核酸内切酶系统用于位点特异性基因编辑的许多实例和应用。

V型CRISPR系统

V型CRISPR系统与II型系统有若干个重要差异。例如,Cpf1是与II型系统相比缺少tracrRNA的单个RNA引导的核酸内切酶。事实上,Cpf1相关CRISPR阵列可以在不需要另外的反式激活tracrRNA的情况下被加工成成熟crRNA。V型CRISPR阵列可以被加工成长度为42-44个核苷酸的短成熟crRNA,每个成熟crRNA以同向重复的19个核苷酸开始,随后是间隔序列的23-25个核苷酸。相比而言,II型系统中的成熟crRNA可以以间隔序列的20-24个核苷酸开始,随后是同向重复的约22个核苷酸。而且,Cpf1可以利用富含T的原型间隔邻近基序,使得Cpf1-crRNA复合体高效地切割短的富含T的PAM之后的靶DNA,所述短的富含T的PAM与II型系统的靶DNA之后的富含G的PAM形成对比。因此,V型系统在远离PAM的点处进行切割,而II型系统在邻近PAM的点处进行切割。另外,相比于II型系统,Cpf1经由具有4或5核苷酸5'突出的交错DNA双链断裂对DNA进行切割。II型系统经由平端双链断裂进行切割。类似于II型系统,Cpf1含有预测的RuvC状核酸内切酶结构域,但是缺少第二HNH核酸内切酶结构域,这与II型系统形成对比。

Cas基因/多肽和原型间隔子邻近基序

示例性CRISPR/Cas多肽包含如在Fonfara等人,《核酸研究(Nucleic AcidsResearch)》42:2577-2590(2014)中公开的Cas9多肽。自Cas基因被发现以来,CRISPR/Cas基因命名系统已经经历了大量重写。Fonfara等人还提供了来自不同物种的Cas9多肽的PAM序列(还参见SEQ ID NO:1-620)。

II.组合物和方法

本文提供了用于使用基因组工程工具通过使ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列缺失或突变来使基因组产生永久性变化的细胞、离体和体内方法。这种方法使用如CRISPR相关(Cas9、Cpf1等)核酸酶等核酸内切酶在ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列的基因组基因座内或附近进行永久编辑。以此方式,本公开所阐述的实例可以有助于通过单次治疗(而不是在患者的一生中提供潜在的治疗)减少或消除ANGPTL3基因的表达。

定点多肽(核酸内切酶、酶)

定点多肽是在基因组编辑中用于对DNA进行切割的核酸酶。定点多肽可以作为以下中的任一项施用于细胞或患者:一个或多个多肽或者对多肽进行编码的一个或多个mRNA。SEQ ID NO:1-620中列出的或本文所公开的任何酶或直向同源物可以用于本文的方法中。

在CRISPR/Cas9或CRISPR/Cpf1系统的背景下,定点多肽可以与向导RNA结合,所述向导RNA进而指定靶DNA中多肽所针对的位点。在本文所公开的CRISPR/Cas9或CRISPR/Cpf1系统中,定点多肽可以是如DNA核酸内切酶等核酸内切酶。

定点多肽可以包括多个核酸切割(即,核酸酶)结构域。两个或更多个核酸切割结构域可以经由接头连接在一起。例如,接头可以包括柔性接头。接头的长度可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、35个、40个或更多个氨基酸。

天然存在的野生型Cas9酶包括两个核酸酶结构域:HNH核酸酶结构域和RuvC结构域。本文中,术语“Cas9”是指天然存在的Cas9和重组Cas9两者。本文中设想的Cas9酶可以包括HNH或HNH状核酸酶结构域和/或RuvC或RuvC状核酸酶结构域。

HNH或HNH状结构域域包括McrA状折叠。HNH或HNH状结构域包括两个反向平行的β链以及α螺旋。HNH或HNH状结构域包括金属结合位点(例如,二价阳离子结合位点)。HNH或HNH状结构域可以对靶核酸的一个链(例如,crRNA靶向链的互补链)进行切割。

RuvC或RuvC状结构域包括RNaseH或RNaseH状折叠。多样的一系列基于核酸的功能中涉及RuvC/RNaseH结构域,所述基于核酸的功能包含作用于RNA和DNA两者上。RNaseH结构域包括被多个α螺旋围绕的5个β链。RuvC/RNaseH状或RuvC/RNaseH状结构域包括金属结合位点(例如,二价阳离子结合位点)。RuvC/RNaseH状或RuvC/RNaseH状结构域可以对靶核酸的一个链(例如,双链靶DNA的非互补链)进行切割。

定点多肽可以在核酸例如基因组DNA中引入双链断裂或单链断裂。双链断裂可以刺激细胞的内源DNA修复途径(例如,同源依赖修复(HDR)或NHEJ或替代性非同源末端连接(A-NHEJ)或微同源性介导末端连接(MMEJ))。NHEJ可以在不需要同源模板的情况下修复切割后的靶核酸。这有时可能在靶核酸中在切割位点处引起小型缺失和***(***缺失)并且可能导致破坏或改变基因表达。HDR可以在同源修复模板或供体可用时进行。同源供体模板可以包括与靶核酸切割位点侧翼的序列同源的序列。姐妹染色单体可以被细胞用作修复模板。然而,出于基因组编辑的目的,修复模板可以被供应为外源核酸,如质粒、双链体寡核苷酸、单链寡核苷酸或病毒核酸。利用外源供体模板,可以在同源的侧翼区域之间引入另外的核酸序列(如转基因)或修饰(如单或多碱基变化或缺失),使得另外的或改变的核酸序列还变得并入靶基因座中。MMEJ可能产生与NHEJ类似的遗传结果,类似之处在于在切割位点处可能发生小型缺失和***。MMEJ可以利用切割位点侧翼的几个碱基对的同源序列来驱动有利的末端连接DNA修复结果。在一些情况下,有可能可以基于对核酸酶靶区域中的潜在微同源性的分析来预测可能的修复结果。

因此,在一些情况下,可以使用同源重组将外源多核苷酸序列***到靶核酸切割位点中。外源多核苷酸序列在本文中被称为“供体多核苷酸”(或供体或供体序列)。供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或者供体多核苷酸的拷贝的一部分可以***到靶核酸切割位点中。供体多核苷酸可以是外源多核苷酸序列,即,并非天然存在于靶核酸切割位点处的序列。

由于NHEJ和/或HDR而产生的对靶DNA的修饰可能导致例如突变、缺失、改变、整合、基因校正、基因替换、基因标记、转基因***、核苷酸缺失、基因破坏、易位和/或基因突变。缺失基因组DNA和将非天然核酸整合到基因组DNA中的过程是基因组编辑的实例。

定点多肽可以包括与野生型示例性定点多肽[例如,来自化脓性链球菌的Cas9,US2014/0068797序列ID号8或Sapranauskas等人,《核酸研究(Nucleic Acids Res)》39(21):9275-9282(2011)]和各种其它定点多肽具有至少10%、至少15%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%的氨基酸序列一致性的氨基酸序列。在10个连续氨基酸内,定点多肽可以包括与野生型定点多肽(例如,来自化脓性链球菌的Cas9,同上)至少70%、75%、80%、85%、90%、95%、97%、99%或100%的一致性。在10个连续氨基酸内,定点多肽可以包括与野生型定点多肽(例如,来自化脓性链球菌的Cas9,同上)至多70%、75%、80%、85%、90%、95%、97%、99%或100%的一致性。在定点多肽的HNH核酸酶结构域中的10个连续氨基酸内,定点多肽可以包括与野生型定点多肽(例如,来自化脓性链球菌的Cas9,同上)至少70%、75%、80%、85%、90%、95%、97%、99%或100%的一致性。在定点多肽的HNH核酸酶结构域中的10个连续氨基酸内,定点多肽可以包括与野生型定点多肽(例如,来自化脓性链球菌的Cas9,同上)至多70%、75%、80%、85%、90%、95%、97%、99%或100%的一致性。在定点多肽的RuvC核酸酶结构域中的10个连续氨基酸内,定点多肽可以包括与野生型定点多肽(例如,来自化脓性链球菌的Cas9,同上)至少70%、75%、80%、85%、90%、95%、97%、99%或100%的一致性。在定点多肽的RuvC核酸酶结构域中的10个连续氨基酸内,定点多肽可以包括与野生型定点多肽(例如,来自化脓性链球菌的Cas9,同上)至多70%、75%、80%、85%、90%、95%、97%、99%或100%的一致性。

定点多肽可以包括野生型示例性定点多肽的修饰后形式。野生型示例性定点多肽的修饰后形式可以包括降低定点多肽的核酸切割活性的突变。野生型示例性定点多肽的修饰后形式可以具有野生型示例性定点多肽(例如,来自化脓性链球菌的Cas9,同上)的核酸切割活性的不到90%、不到80%、不到70%、不到于60%、不到50%、不到40%、不到30%、不到20%、不到10%、不到5%或不到1%。定点多肽的修饰后形式可以不具有实质的核酸切割活性。当定点多肽是不具有实质的核酸切割活性的修饰后形式时,其在本文中被称为是“酶失活”。

定点多肽的修饰后形式可以包括突变,使得突变可以在靶核酸上诱导单链断裂(SSB)(例如,通过对双链靶核酸的糖-磷酸主链中的仅一个进行切割)。在一些方面,突变可能导致野生型定点多肽(例如,来自化脓性链球菌的Cas9,同上)的所述多个核酸切割结构域中的一个或多个核酸切割结构域的核酸切割活性小于90%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%。在一些方面,突变可能导致所述多个核酸切割结构域中的一个或多个核酸切割结构域保留对靶核酸的互补链进行切割的能力,但是降低其对靶核酸的非互补链进行切割的能力。突变可能导致所述多个核酸切割结构域中的一个或多个核酸切割结构域保留对靶核酸的非互补链进行切割的能力,但是降低其对靶核酸的互补链进行切割的能力。例如,使野生型示例性化脓性链球菌Cas9多肽中的残基如Asp10、His840、Asn854和Asn856发生突变以使所述多个核酸切割结构域(例如,核酸酶结构域)中的一个或多个核酸切割结构域失活。待突变的残基可以对应于野生型示例性化脓性链球菌Cas9多肽中的残基Asp10、His840、Asn854和Asn856(例如,如通过序列和/或结构比对确定的)。突变的非限制性实例包含D10A、H840A、N854A或N856A。本领域技术人员将认识到,除了丙氨酸取代之外的突变可以是适合的。

在一些方面,D10A突变可以与H840A、N854A或N856A突变中的一个或多个突变组合以产生实质上缺少DNA切割活性的定点多肽。H840A突变可以与D10A、N854A或N856A突变中的一个或多个突变组合以产生实质上缺少DNA切割活性的定点多肽。N854A突变可以与H840A、D10A或N856A突变中的一个或多个突变组合以产生实质上缺少DNA切割活性的定点多肽。N856A突变可以与H840A、N854A或D10A突变中的一个或多个突变组合以产生实质上缺少DNA切割活性的定点多肽。包括一个基本上失活的核酸酶结构域的定点多肽被称为“切口酶”。

可以使用RNA引导的核酸内切酶例如Cas9的切口酶变体来增加CRISPR介导的基因组编辑的特异性。野生型Cas9通常由被设计成与靶序列中的指定的~20核苷酸序列(如内源基因组基因座)杂交的单个向导RNA来引导。然而,向导RNA与靶基因座之间可以容许有若干个错配,从而有效地将靶位点中的所需同源性的长度减小为例如小到13nt的同源性,并且由此使CRISPR/Cas9复合体在靶基因组中其它地方的结合和双链核酸切割—也被称为脱靶切割—的潜能提高。因为Cas9的切口酶变体各自仅对一个链进行切割,所以为了产生双链断裂,有必要使一对切口酶在靶核酸的相反链上紧密结合,由此产生相当于双链断裂的一对切口。这要求两个单独的向导RNA—每个切口酶一个向导RNA—必须在靶核酸的相反链上紧密结合。这一要求基本上使发生双链断裂所需的同源性的最小长度加倍,由此降低了将在基因组中的其它地方发生双链切割的可能性,其中这两个向导RNA位点—如果存在的话—不可能足够靠近彼此以使双链断裂能够形成。如本领域所描述的,切口酶还可以用于促进HDR与NHEJ。HDR可以用于通过使用有效地介导期望改变的特异性供体序列来将所选改变引入到基因组的靶位点中。

预期的突变可以包含取代、添加和缺失或其任何组合。突变将突变后氨基酸转换成丙氨酸。突变将突变后氨基酸转换成另一种氨基酸(例如,甘氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、脯氨酸、苯丙氨酸、酪氨酸、色氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺、组氨酸、赖氨酸或精氨酸)。突变将突变后氨基酸转换成非天然氨基酸(例如,硒代甲硫氨酸)。突变将突变后氨基酸转换成氨基酸模拟物(例如,磷酸模拟物)。突变可以是保守突变。例如,突变将突变后氨基酸转换成与突变后氨基酸的大小、形状、电荷、极性、构象和/或旋转异构体类似的氨基酸(例如,半胱氨酸/丝氨酸突变、赖氨酸/天冬酰胺突变、组氨酸/苯丙氨酸突变)。突变可以使阅读框移位和/或提前终止密码子产生。突变可以使基因的调节区域或影响一个或多个基因的表达的基因座改变。

定点多肽(例如,变体、突变后、酶失活和/或有条件酶失活的定点多肽)可以靶向核酸。定点多肽(例如,变体、突变后、酶失活和/或有条件酶失活的内切核糖核酸酶)可以靶向DNA。定点多肽(例如,变体、突变后、酶失活和/或有条件酶失活的内切核糖核酸酶)可以靶向RNA。

定点多肽可以包括一个或多个非天然序列(例如,定点多肽是融合蛋白)。

定点多肽可以包括包含与来自细菌(例如,化脓性链球菌)的Cas9至少15%的氨基酸一致性的氨基酸序列、核酸结合结构域、以及两个核酸切割结构域(即,HNH结构域和RuvC结构域)。

定点多肽可以包括包含与来自细菌(例如,化脓性链球菌)的Cas9至少15%的氨基酸一致性的氨基酸序列以及两个核酸切割结构域(即,HNH结构域和RuvC结构域)。

定点多肽可以包括包含与来自细菌(例如,化脓性链球菌)的Cas9至少15%的氨基酸一致性的氨基酸序列以及两个核酸切割结构域,其中所述核酸切割结构域中的一者或两者包括与来自细菌(例如,化脓性链球菌)的Cas9的核酸酶结构域至少50%的氨基酸一致性。

定点多肽可以包括包含与来自细菌(例如,化脓性链球菌)的Cas9至少15%的氨基酸一致性的氨基酸序列、两个核酸切割结构域(即,HNH结构域和RuvC结构域)、以及非天然序列(例如,核定位信号)或将定点多肽与非天然序列连接的接头。

定点多肽可以包括包含与来自细菌(例如,化脓性链球菌)的Cas9至少15%的氨基酸一致性的氨基酸序列、两个核酸切割结构域(即,HNH结构域和RuvC结构域),其中所述定点多肽包括核酸切割结构域中的一者或两者的突变,所述突变使核酸酶结构域的切割活性降低至少50%。

定点多肽可以包括包含与来自细菌(例如,化脓性链球菌)的Cas9至少15%的氨基酸一致性的氨基酸序列以及两个核酸切割结构域(即,HNH结构域和RuvC结构域),其中所述核酸酶结构域中的一个包括天冬氨酸10的突变,和/或其中所述核酸酶结构域中的一个包括组氨酸840的突变,并且其中所述突变使一个或多个核酸酶结构域的切割活性降低至少50%。

所述一个或多个定点多肽例如DNA核酸内切酶可以包括一起在基因组中的特异性基因座处实现一个双链断裂的两个切口酶或者一起在基因组中的特异性基因座处实现或引起两个双链断裂的四个切口酶。可替代地,一个定点多肽例如DNA核酸内切酶可以在基因组中的特异性基因座处实现或引起一个双链断裂。

来自其它细菌菌株的Cas9同源物的非限制性实例包含但不限于以下中鉴定出的Cas蛋白:深海单细胞蓝细菌(Acaryochloris marina)MBIC11017;***糖醋盐杆菌(Acetohalobium arabaticum)DSM 5501;喜温嗜酸硫杆菌(Acidithiobacillus caldus);嗜酸氧化亚铁硫杆菌(Acidithiobacillus ferrooxidans)ATCC 23270;酸热脂环酸芽孢杆菌(Alicyclobacillus acidocaldarius)LAA1;酸热脂环酸芽孢杆菌亚种酸热脂环酸芽孢杆菌(Alicyclobacillus acidocaldarius subsp.acidocaldarius)DSM 446;酒色异着色菌(Allochromatium vinosum)DSM 180;Ammonifex degensii KC4;鱼腥藻(nabaenavariabilis)ATCC 29413;极大节旋藻(Arthrospira maxima)CS-328;钝顶节旋藻菌株Paraca(Arthrospira platensis str.Paraca);节旋藻属PCC 8005;假蕈状芽孢杆菌(Bacillus pseudomycoides)DSM 12442;selenitireducens芽孢杆菌(Bacillusselenitireducens)MLS10;伯克霍尔德氏菌(Burkholderiales bacterium)1_1_47;becscii热解纤维素菌(Caldicelulosiruptor becscii)DSM 6725;金矿菌(CandidatusDesulforudis audaxviator)MP104C;水热热解纤维素菌(Caldicellulosiruptorhydrothermalis)_108;梭状芽胞杆菌噬菌体(Clostridium phage)c-st;肉毒梭状芽胞杆菌A3菌株(Clostridium botulinum A3str.)Loch Maree;肉毒梭状芽胞杆菌Ba4菌株657;艰难梭状芽胞杆菌(Clostridium difficile)QCD-63q42;瓦氏鳄球藻(Crocosphaerawatsonii)WH 8501;蓝丝菌属(Cyanothece sp.)ATCC 51142;蓝丝菌属CCY0110;蓝丝菌属PCC 7424;蓝丝菌属PCC 7822;戟叶鹅绒藤微小杆菌(Exiguobacterium sibiricum)255-15;大芬戈尔德菌(Finegoldia magna)ATCC 29328;消旋纤线杆菌(Ktedonobacterracemifer)DSM 44963;德氏乳酸杆菌亚种保加利亚乳杆菌(Lactobacillus delbrueckiisubsp.bulgaricus)PB2003/044-T3-4;唾液乳杆菌(Lactobacillus salivarius)ATCC11741;无害利斯特菌(Listeria innocua);林氏藻属(Lyngbya sp.)PCC 8106;海杆菌属(Marinobacter sp.)ELB17;evestigatum甲烷盐菌(Methanohalobium evestigatum)Z-7303;微胞藻属噬菌体(Microcystis phage)Ma-LMM01;铜绿微囊藻(Microcystisaeruginosa)NIES-843;海洋微颤菌(Microscilla marina)ATCC 23134;原型微鞘藻()PCC7420;脑膜炎奈瑟氏菌(Neisseria meningitidis);嗜盐亚硝化球菌(Nitrosococcushalophilus)Nc4;达松维尔拟诺卡氏菌亚种达松维尔(Nocardiopsis dassonvilleisubsp.dassonvillei)DSM 43111;泡沫节球藻(Nodularia spumigena)CCY9414;念珠藻属(Nostoc sp.)PCC 7120;颤藻属(Oscillatoria sp.)PCC 6506;Pelotomaculum_thermopropionicum_SI;mobilis石袍菌(Petrotoga mobilis)SJ95;萘降解极地单胞菌(Polaromonas naphthalenivorans)CJ2;单胞菌属(Polaromonas sp.)JS666;假交替单胞菌(Pseudoalteromonas haloplanktis)TAC125;始旋链霉菌(Streptomycespristinaespiralis)ATCC 25486;始旋链霉菌ATCC 25486;嗜热链球菌(Streptococcusthermophilus);绿产色链霉菌(Streptomyces viridochromogenes)DSM 40736;链孢囊菌(Streptosporangium roseum)DSM 43021;聚球藻属(Synechococcus sp.)PCC 7335;以及非洲栖热腔菌(Thermosipho africanus)TCF52B(Chylinski等人,《RNA生物学(RNABiol.)》2013;10(5):726-737)。

除了Cas9直系同源物之外,其它Cas9变体如无活dCas9的融合蛋白和具有不同功能的效应结构域可以充当遗传调制的平台。任何前述酶可以用于本公开中。

本公开中可以利用的核酸内切酶的另外的实例在SEQ ID NO:1-620中给出。这些蛋白质可以在使用前进行修饰或者可以编码在核酸序列如DNA、RNA或mRNA中或在载体构建体如本文所教导的质粒或AAV载体内。进一步地,这些蛋白质可以是经过密码子优化的。

SEQ ID NO:1-620公开了核酸内切酶序列的非穷举列表。

基因组靶向核酸

本公开提供了可以将相关多肽(例如,定点多肽)的活性指向靶核酸内的特异性靶序列的基因组靶向核酸。基因组靶向核酸可以是RNA。基因组靶向RNA在本文中被称为“向导RNA”或“gRNA”。向导RNA至少可以包括与关注的靶核酸序列杂交的间隔序列以及CRISPR重复序列。在II型系统中,gRNA还包括被称作tracrRNA序列的第二RNA。在II型向导RNA(gRNA)中,CRISPR重复序列和tracrRNA序列彼此杂交以形成双链体。在V型向导RNA(gRNA)中,crRNA形成双链体。在这两种系统中,双链体可以结合定点多肽,使得向导RNA和定点多肽形成复合体。基因组靶向核酸可以借助于其与定点多肽的缔合来提供对复合体的靶特异性。基因组靶向核酸因此可以指导定点多肽的活性。

示例性向导RNA包含15-200个碱基的间隔序列,其中基因组位置基于GRCh38人类基因组组装。ANGPTL3基因可以位于染色体1:62,597,486-62,606,304(基因组参考序列联合体(Genome Reference Consortium)-GRCh38)。

示例性向导RNA包含基于SEQ ID NO:5,305-17,018中呈现的DNA序列的RNA版本的间隔序列。如本领域普通技术人员所理解的,每个向导RNA可以被设计成包含与其基因组靶序列互补的间隔序列。例如,间隔序列中的每一个,例如SEQ ID NO:5,305-17,018中呈现的DNA序列的RNA版本,可以被放入单个RNA嵌合体或crRNA(连同对应的tracrRNA)中。参见,Jinek等人,《科学》337,816-821(2012)和Deltcheva等人,《自然》471,602-607(2011)。

基因组靶向核酸可以是双分子向导RNA。基因组靶向核酸可以是单分子向导RNA。

双分子向导RNA可以包括两个RNA链。第一链在5'到3'的方向上包括任选的间隔扩展序列、间隔序列和最小CRISPR重复序列。第二链可以包括最小tracrRNA序列(与最小CRISPR重复序列互补)、3'tracrRNA序列和任选的tracrRNA扩展序列。

II型系统中的单分子向导RNA(sgRNA)在5'到3'的方向上可以包括任选的间隔扩展序列、间隔序列、最小CRISPR重复序列、单分子向导接头、最小tracrRNA序列、3'tracrRNA序列和任选的tracrRNA扩展序列。任选的tracrRNA扩展可以包括对向导RNA的另外功能(例如,稳定性)有帮助的元素。单分子向导接头可以将最小CRISPR重复和最小tracrRNA序列连接形成发夹结构。任选的tracrRNA扩展可以包括一个或多个发夹。

sgRNA在sgRNA序列的5'端可以包括20个核苷酸的间隔序列。sgRNA在sgRNA序列的5'端可以包括少于20个核苷酸的间隔序列。sgRNA在sgRNA序列的5'端可以包括多于20个核苷酸的间隔序列。sgRNA在sgRNA序列的5'端可以包括具有17-30个核苷酸的可变长度间隔序列(参见表1)。

sgRNA在sgRNA序列的3'端可以不包括尿嘧啶,如表1的SEQ ID NO:17,051中的sgRNA序列。sgRNA可以在sgRNA序列的3'端包括一个或多个尿嘧啶,如表1中的SEQ ID NO:17,052中的sgRNA序列。例如,sgRNA在sgRNA序列的3'端可以包括1个尿嘧啶(U)。sgRNA在sgRNA序列的3'端可以包括2个尿嘧啶(UU)。sgRNA在sgRNA序列的3'端可以包括3个尿嘧啶(UUU)。sgRNA在sgRNA序列的3'端可以包括4个尿嘧啶(UUUU)。sgRNA在sgRNA序列的3'端可以包括5个尿嘧啶(UUUUU)。sgRNA在sgRNA序列的3'端可以包括6个尿嘧啶(UUUUUU)。sgRNA在sgRNA序列的3'端可以包括7个尿嘧啶(UUUUUUU)。sgRNA在sgRNA序列的3'端可以包括8个尿嘧啶(UUUUUUUU)。

sgRNA可以是未经修饰的或经过修饰的。例如,经过修饰的sgRNA可以包括一个或多个2'-O-甲基和/或2'-O-甲基硫代磷酸核苷酸。

表1.未经修饰的sgRNA

Figure BDA0002242567760000231

V型系统中的单分子向导RNA(sgRNA)在5'到3'的方向上可以包括最小CRISPR重复序列和间隔序列。

通过说明的方式,CRISPR/Cas9或CRISPR/Cpf1系统中使用的向导RNA或者其它更小的RNA可以通过化学手段容易地合成,如下文所说明并且在本领域中描述的。虽然化学合成程序不断扩展,但是在多核苷酸长度显著增大超过一百个核苷酸左右时,通过如高效液相色谱法(HPLC,其避免了使用如PAGE等凝胶)等程序来纯化这种RNA往往变得更具挑战性。用于生成更大长度的RNA的一种方式是产生连接在一起的两个或更多个分子。如对Cas9或Cpf1核酸内切酶进行编码的RNA等长得多的RNA更容易通过酶生成。可以在化学合成和/或酶生成RNA期间或之后引入各种类型的RNA修饰,例如增强稳定性、降低先天性免疫应答的可能性或程度和/或增强其它属性的修饰,如本领域所描述的。

间隔扩展序列

在基因组靶向核酸的一些实例中,间隔扩展序列可以修饰活性、提供稳定性和/或提供用于基因组靶向核酸修饰的位置。间隔扩展序列可以修饰中靶或脱靶活性或特异性。在一些实例中,可以提供间隔扩展序列。间隔扩展序列的长度可以大于1个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、120个、140个、160个、180个、200个、220个、240个、260个、280个、300个、320个、340个、360个、380个、400个、1000个、2000个、3000个、4000个、5000个、6000个或7000个或更多个核苷酸。间隔扩展序列的长度可以小于1个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、120个、140个、160个、180个、200个、220个、240个、260个、280个、300个、320个、340个、360个、380个、400个、1000个、2000个、3000个、4000个、5000个、6000个、7000个或更多个核苷酸的长度。间隔扩展序列的长度可以小于10个核苷酸。间隔扩展序列的长度可以在10-30个核苷酸之间。间隔扩展序列的长度可以在30-70个核苷酸之间。

间隔扩展序列可以包括另一部分(例如,稳定性控制序列、内切核糖核酸酶结合序列、核酶)。所述部分可以减少或增加核酸靶向核酸的稳定性。所述部分可以是转录终止子区段(即,转录终止序列)。所述部分可以在真核细胞中起作用。所述部分可以在原核细胞中起作用。所述部分可以在真核细胞和原核细胞两者中起作用。适合的部分的非限制性实例包含:5'帽(例如,7-甲基鸟苷酸帽(m7G))、核糖开关序列(例如,用于允许通过蛋白质和蛋白复合体来调节稳定性和/或调节可达性)、形成dsRNA双链体(即,发夹)的序列、使RNA靶向亚细胞位置(例如,细胞核、线粒体、叶绿体等)的序列、提供跟踪的修饰或序列(例如,到与荧光分子的直接缀合、与促进荧光检测的部分的缀合、允许荧光检测的序列等)、和/或为蛋白质(例如,作用于DNA上的蛋白质,包含转录激活子、转录抑制子、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰基转移酶、组蛋白脱乙酰基酶等)提供结合位点的修饰或序列。

间隔序列

间隔序列与关注的靶核酸中的序列杂交。基因组靶向核酸的间隔子可以以序列特异性方式经由杂交(即,碱基配对)与靶核酸相互作用。间隔子的核苷酸序列可以根据关注的靶核酸的序列而变化。

在本文的CRISPR/Cas系统中,间隔序列可以被设计成与位于系统中使用的Cas9酶的PAM的5'处的靶核酸杂交。间隔子可以与靶序列完美匹配或可以具有错配。每个Cas9酶具有其在靶DNA中鉴别出的特定PAM序列。例如,化脓性链球菌在靶核酸中鉴别出包括序列5'-NRG-3'的PAM,其中R包括A或G,其中N是任何核苷酸,并且N紧挨着由间隔序列靶向的靶核酸序列的3'。

靶核酸序列可以包括20个核苷酸。靶核酸可以包括少于20个核苷酸。靶核酸可以包括多于20个核苷酸。靶核酸可以包括至少5个、10个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个或更多个核苷酸。靶核酸可以包括至多5个、10个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个或更多个核苷酸。靶核酸序列可以包括紧挨着PAM的第一核苷酸的5'的20个碱基。例如,在包括5'-NNNNNNNNNNNNNNNNNNNNNRG-3'的序列(SEQ ID NO:17049)中,靶核酸可以包括与N相对应的序列,其中N是任何核苷酸并且带下划线的NRG序列是化脓性链球菌PAM。这个靶核酸序列常常被称为PAM链,并且互补核酸序列常常被称为非PAM链。本领域技术人员将认识到,间隔序列与靶核酸的非PAM链杂交(图1A和1B)。

与靶核酸杂交的间隔序列的长度可以为至少6个核苷酸(nt)。间隔序列可以为至少约6nt、至少约10nt、至少约15nt、至少约18nt、至少约19nt、至少约20nt、至少约25nt、至少约30nt、至少约35nt、或至少约40nt、约6nt到约80nt、约6nt到约50nt、约6nt到约45nt、约6nt到约40nt、约6nt到约35nt、约6nt到约30nt、约6nt到约25nt、约6nt到约20nt、约6nt到约19nt、约10nt到约50nt、约10nt到约45nt、约10nt到约40nt、约10nt到约35nt、约10nt到约30nt、约10nt到约25nt、约10nt到约20nt、约10nt到约19nt、约19nt到约25nt、约19nt到约30nt、约19nt到约35nt、约19nt到约40nt、约19nt到约45nt、约19nt到约50nt、约19nt到约60nt、约20nt到约25nt、约20nt到约30nt、约20nt到约35nt、约20nt到约40nt、约20nt到约45nt、约20nt到约50nt、或约20nt到约60nt。在一些实例中,间隔序列可以包括20个核苷酸。在一些实例中,间隔序列可以包括19个核苷酸。在一些实例中,间隔子可以包括18个核苷酸。在一些实例中,间隔子可以包括22个核苷酸。

在一些实例中,间隔序列与靶核酸的非PAM链之间的互补性百分比为至少约30%、至少约40%、至少约50%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%、至少约99%或100%。在一些实例中,间隔序列与靶核酸之间的互补性百分比为至多约30%、至多约40%、至多约50%、至多约60%、至多约65%、至多约70%、至多约75%、至多约80%、至多约85%、至多约90%、至多约95%、至多约97%、至多约98%、至多约99%或100%.在一些实例中,在靶核酸的互补链的靶序列的六个连续的最靠近5'的核苷酸内,间隔序列与靶核酸之间的互补性百分比为100%。在约20个连续核苷酸内,间隔序列与靶核酸之间的互补性百分比可以为至少60%。间隔序列和靶核酸的长度可以相差1到6个核苷酸,这可以被认为是一个或多个凸起。

可以使用计算机程序来设计或选择间隔序列。计算机程序可以使用如以下等变量:预测的熔融温度、二级结构形成、预测的退火温度、序列一致性、基因组背景、染色质可达性、GC%、基因组出现频率(例如,完全相同或类似但由于错配、***或缺失而在一个或多个斑点上有所不同的序列的基因组出现频率)、甲基化状态、SNP的存在等。

最小CRISPR重复序列

在一些方面,最小CRISPR重复序列是与参考CRISPR重复序列(例如,来自化脓性链球菌的crRNA)具有至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%序列一致性的序列。

在一些方面,最小CRISPR重复序列包括可以与细胞中的最小tracrRNA序列杂交的核苷酸。最小CRISPR重复序列和最小tracrRNA序列可以形成双链体,即,碱基配对双链结构。最小CRISPR重复序列和最小tracrRNA序列可以一起与定点多肽结合。最小CRISPR重复序列的至少一部分可以与最小tracrRNA序列杂交。在一些方面,最小CRISPR重复序列的至少一部分包括与最小tracrRNA序列至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%互补。最小CRISPR重复序列的至少一部分可以包括与最小tracrRNA序列至多约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%互补。

最小CRISPR重复序列的长度可以为约7个核苷酸到约100个核苷酸。例如,最小CRISPR重复序列的长度为约7个核苷酸(nt)到约50nt、约7nt到约40nt、约7nt到约30nt、约7nt到约25nt、约7nt到约20nt、约7nt到约15nt、约8nt到约40nt、约8nt到约30nt、约8nt到约25nt、约8nt到约20nt、约8nt到约15nt、约15nt到约100nt、约15nt到约80nt、约15nt到约50nt、约15nt到约40nt、约15nt到约30nt或约15nt到约25nt。在一些方面,最小CRISPR重复序列的长度为约9个核苷酸。在一些方面,最小CRISPR重复序列的长度为约12个核苷酸。

在一段至少6个、7个或8个连续核苷酸内,最小CRISPR重复序列可以与参考最小CRISPR重复序列(例如,来自化脓性链球菌的野生型crRNA)至少约60%相同。例如,在一段至少6个、7个或8个连续核苷酸内,最小CRISPR重复序列可以与参考最小CRISPR重复序列至少约65%相同、至少约70%相同、至少约75%相同、至少约80%相同、至少约85%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同或100%相同。

最小tracrRNA序列

最小tracrRNA重复序列可以是与参考tracrRNA序列(例如,来自化脓性链球菌的野生型tracrRNA)具有至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%序列一致性的序列。

最小tracrRNA序列可以包括与细胞中的最小CRISPR重复序列杂交的核苷酸。最小tracrRNA序列和最小CRISPR重复序列形成双链体,即,碱基配对双链结构。最小tracrRNA序列和最小CRISPR重复可以一起与定点多肽结合。最小tracrRNA序列的至少一部分可以与最小CRISPR重复序列杂交。最小tracrRNA序列可以与最小CRISPR重复序列至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%互补。

最小tracrRNA序列的长度可以为约7个核苷酸到约100个核苷酸。例如,最小tracrRNA序列的长度可以为约7个核苷酸(nt)到约50nt、约7nt到约40nt、约7nt到约30nt、约7nt到约25nt、约7nt到约20nt、约7nt到约15nt、约8nt到约40nt、约8nt到约30nt、约8nt到约25nt、约8nt到约20nt、约8nt到约15nt、约15nt到约100nt、约15nt到约80nt、约15nt到约50nt、约15nt到约40nt、约15nt到约30nt或约15nt到约25nt。最小tracrRNA序列的长度可以为约9个核苷酸。最小tracrRNA序列的长度可以为约12个核苷酸。最小tracrRNA可以由上文中Jinek等人所描述的tracrRNA组成,nt为23-48。

在一段至少6个、7个或8个连续核苷酸内,最小tracrRNA序列可以与参考最小tracrRNA(例如,来自化脓性链球菌的野生型tracrRNA)序列至少约60%相同。例如,在一段至少6个、7个或8个连续核苷酸内,最小tracrRNA序列可以与参考最小tracrRNA序列至少约65%相同、至少约70%相同、约75%相同、约80%相同、约85%相同、约90%相同、约95%相同、约98%相同、约99%相同或100%相同。

最小CRISPR RNA与最小tracrRNA之间的双链体可以包括双螺旋。最小CRISPR RNA与最小tracrRNA之间的双链体可以包括至少约1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个核苷酸。最小CRISPR RNA与最小tracrRNA之间的双链体可以包括至多约1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个核苷酸。

双链体可以包括错配(即,双链体的两个链并非100%互补)。双链体可以包括至少约1个、2个、3个、4个或5个或错配。双链体可以包括至多约1个、2个、3个、4个或5个或错配。双链体可以包括不多于2个错配。

凸起

在一些情况下,在最小CRISPR RNA与最小tracrRNA之间的双链体中可以存在“凸起”。凸起是双链体内的核苷酸的未配对区域。凸起可以有助于将双链体与定点多肽结合。凸起在双链体的一侧可以包括未配对的5'-rrrn-3'(SEQ ID NO:17,053)并且在双链体的另一侧包括未配对的核苷酸区域,其中r是任何嘌呤并且n包括可以与相反链上的核苷酸形成摇摆对的核苷酸。双链体的这两侧上的未配对核苷酸的数量可以是不同的。

在一个实例中,凸起在凸起的最小CRISPR重复链上可以包括未配对嘌呤(例如,腺嘌呤)。在一些实例中,凸起可以包括凸起的最小tracrRNA序列链的未配对5'-AAGn-3'(SEQID NO:17,067),其中n包括可以与最小CRISPR重复链上的核苷酸形成摇摆对的核苷酸。

双链体的最小CRISPR重复侧上的凸起可以包括至少1个、2个、3个、4个或5个或更多个未配对核苷酸。双链体的最小CRISPR重复侧上的凸起可以包括至多1个、2个、3个、4个或5个或更多个未配对核苷酸。双链体的最小CRISPR重复侧上的凸起可以包括1个未配对核苷酸。

双链体的最小tracrRNA序列侧上的凸起可以包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个未配对核苷酸。双链体的最小tracrRNA序列侧上的凸起可以包括至多1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个未配对核苷酸。双链体的第二侧(例如,双链体的最小tracrRNA序列侧)上的凸起可以包括4个未配对核苷酸。

凸起可以包括至少一个摇摆配对。在一些实例中,凸起可以包括至多一个摇摆配对。凸起可以包括至少一个嘌呤核苷酸。凸起可以包括至少3个嘌呤核苷酸。凸起序列可以包括至少5个嘌呤核苷酸。凸起序列可以包括至少一个鸟嘌呤核苷酸。在一些实例中,凸起序列可以包括至少一个腺嘌呤核苷酸。

发夹

在各个实例中,一个或多个发夹可以位于3'tracrRNA序列中最小tracrRNA的3'处。

从最小CRISPR重复和最小tracrRNA序列双链体中的最后一个配对核苷酸的3',发夹可以开始于约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个或20个或更多个核苷酸。从最小CRISPR重复和最小tracrRNA序列双链体中的最后一个配对核苷酸的3',发夹可以开始于至多约1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个核苷酸。

发夹可以包括至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个或20个或更多个连续核苷酸。发夹可以包括至多约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个或更多个连续核苷酸。

发夹可以包括CC二核苷酸(即,两个连续的胞嘧啶核苷酸)。

发夹可以包括双链体核苷酸(例如,发夹中杂交在一起的核苷酸)。例如,发夹可以包括与3'tracrRNA序列的发夹双链体中的GG二核苷酸杂交的CC二核苷酸。

发夹中的一个或多个发夹可以与定点多肽的向导RNA相互作用区域相互作用。

在一些实例中,存在两个或更多个发夹,并且在其它实例中,存在三个或更多个发夹。

3'tracrRNA序列

3'tracrRNA序列可以包括与参考tracrRNA序列(例如,来自化脓性链球菌的野生型tracrRNA)具有至少约30%、约40%、约50%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或100%序列一致性的序列。

3'tracrRNA序列的长度可以为约6个核苷酸到约100个核苷酸。例如,3'tracrRNA序列的长度可以为约6个核苷酸(nt)到约50nt、约6nt到约40nt、约6nt到约30nt、约6nt到约25nt、约6nt到约20nt、约6nt到约15nt、约8nt到约40nt、约8nt到约30nt、约8nt到约25nt、约8nt到约20nt、约8nt到约15nt、约15nt到约100nt、约15nt到约80nt、约15nt到约50nt、约15nt到约40nt、约15nt到约30nt或约15nt到约25nt。3'tracrRNA序列的长度可以为约14个核苷酸。

在一段至少6个、7个或8个连续核苷酸内,3'tracrRNA序列可以与参考3'tracrRNA序列(例如,来自化脓性链球菌的野生型3'tracrRNA序列)至少约60%相同。例如,在一段至少6个、7个或8个连续核苷酸内,3'tracrRNA序列可以与参考3'tracrRNA序列(例如,来自化脓性链球菌的野生型3'tracrRNA序列)至少约60%相同、约65%相同、约70%相同、约75%相同、约80%相同、约85%相同、约90%相同、约95%相同、约98%相同、约99%相同或100%相同。

3'tracrRNA序列可以包括多于一个双链体区域(例如,发夹、杂交区域)。3'tracrRNA序列可以包括两个双链体区域。

3'tracrRNA序列可以包括茎环结构。3'tracrRNA中的茎环结构可以包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个或20个或更多个核苷酸。3'tracrRNA中的茎环结构可以包括至多1个、2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个核苷酸。茎环结构可以包括功能部分。例如,茎环结构可以包括适配子、核酶、蛋白质相互作用发夹、CRISPR阵列、内含子或外显子。茎环结构可以包括至少约1个、2个、3个、4个或5个或更多个功能部分。茎环结构可以包括至多约1个、2个、3个、4个或5个或更多个功能部分。

3'tracrRNA序列中的发夹可以包括P结构域。在一些实例中,P结构域可以包括发夹中的双链区域。

tracrRNA扩展序列

无论tracrRNA是处于单分子向导还是双分子向导的背景下,都可以提供tracrRNA扩展序列。tracrRNA扩展序列的长度可以为约1个核苷酸到约400个核苷酸。tracrRNA扩展序列的长度可以大于1个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、120个、140个、160个、180个、200个、220个、240个、260个、280个、300个、320个、340个、360个、380个或400个核苷酸。tracrRNA扩展序列的长度可以为约20个到约5000个或更多个核苷酸。tracrRNA扩展序列的长度可以大于1000个核苷酸。tracrRNA扩展序列的长度可以小于1个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、120个、140个、160个、180个、200个、220个、240个、260个、280个、300个、320个、340个、360个、380个或400个核苷酸。tracrRNA扩展序列的长度可以小于1000个核苷酸。tracrRNA扩展序列的长度可以小于10个核苷酸。tracrRNA扩展序列的长度可以为10-30个核苷酸。tracrRNA扩展序列的长度可以为30-70个核苷酸。

tracrRNA扩展序列可以包括功能部分(例如,稳定性控制序列、核酶、内切核糖核酸酶结合序列)。功能部分可以包括转录终止子区段(即,转录终止序列)。功能部分的总长度可以为约10个核苷酸(nt)到约100个核苷酸、约10nt到约20nt、约20nt到约30nt、约30nt到约40nt、约40nt到约50nt、约50nt到约60nt、约60nt到约70nt、约70nt到约80nt、约80nt到约90nt、或约90nt到约100nt、约15nt到约80nt、约15nt到约50nt、约15nt到约40nt、约15nt到约30nt、或约15nt到约25nt。功能部分可以在真核细胞中起作用。功能部分可以在原核细胞中起作用。功能部分可以在真核细胞和原核细胞两者中起作用。

适合的tracrRNA扩展功能部分的非限制性实例包含:3'多腺苷酸化尾、核糖开关序列(例如,用于允许通过蛋白质和蛋白质合体来调节稳定性和/或调节可达性)、形成dsRNA双链体(即,发夹)的序列、使RNA靶向亚细胞位置(例如,细胞核、线粒体、叶绿体等)的序列、提供跟踪的修饰或序列(例如,与荧光分子的直接缀合、与促进荧光检测的部分的缀合、允许荧光检测的序列等)、和/或为蛋白质(例如,作用于DNA上的蛋白质,包含转录激活子、转录抑制子、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰基转移酶、组蛋白脱乙酰基酶等)提供结合位点的修饰或序列。tracrRNA扩展序列可以包括引物结合位点或分子指标(例如,条码序列)。tracrRNA扩展序列可以包括一个或多个亲和标签。

单分子向导接头序列

单分子向导核酸的接头序列的长度可以为约3个核苷酸到约100个核苷酸。例如,在上文中的Jinek等人,《科学》337(6096):816-821(2012)中,使用了简单的4核苷酸“四环”(-GAAA-)。说明性接头的长度为约3个核苷酸(nt)到约90nt、约3nt到约80nt、约3nt到约70nt、约3nt到约60nt、约3nt到约50nt、约3nt到约40nt、约3nt到约30nt、约3nt到约20nt、约3nt到约10nt。例如,接头的长度可以为约3nt到约5nt、约5nt到约10nt、约10nt到约15nt、约15nt到约20nt、约20nt到约25nt、约25nt到约30nt、约30nt到约35nt、约35nt到约40nt、约40nt到约50nt、约50nt到约60nt、约60nt到约70nt、约70nt到约80nt、约80nt到约90nt、或约90nt到约100nt。单分子向导核酸的接头可以在4个核苷酸与40个核苷酸之间。接头可以是至少约100个、500个、1000个、1500个、2000个、2500个、3000个、3500个、4000个、4500个、5000个、5500个、6000个、6500个或7000个或更多个核苷酸。接头可以是至多约100个、500个、1000个、1500个、2000个、2500个、3000个、3500个、4000个、4500个、5000个、5500个、6000个、6500个或7000个或更多个核苷酸。

接头可以包括各种序列中的任何序列,但是在一些实例中,接头将不包括大量与向导RNA的其它部分具有同源性的区域的序列,这可能引起可能干扰向导的其它功能区域的分子内结合。在上文中的Jinek等人,《科学》337(6096):816-821(2012)中,使用了简单的4核苷酸序列-GAAA-,但是同样可以使用包含较长序列在内的许多其它序列。

接头序列可以包括功能部分。例如,接头序列可以包括一个或多个特征,包含适配子、核酶、蛋白质相互作用发夹、蛋白结合位点、CRISPR阵列、内含子或外显子。接头序列可以包括至少约1个、2个、3个、4个或5个或更多个功能部分。在一些实例中,接头序列可以包括至多约1个、2个、3个、4个或5个或更多个功能部分。

核酸修饰(化学和结构修饰)

在一些方面,引入到细胞中的多核苷酸可以包括可以单独地或组合地用于例如提高活性、稳定性或特异性、改变递送、降低宿主细胞中的先天性免疫应答、或者用于其它增强的一种或多种修饰,如本文中进一步描述并且本领域中已知的。

在某些实例中,可以在CRISPR/Cas9或CRISPR/Cpf1系统中使用经过修饰的多核苷酸,在这种情况下,向导RNA(单分子向导或双分子向导)和/或对引入到细胞中的Cas9或Cpf1核酸内切酶进行编码的DNA或RNA可以经过修饰,如下文所描述和说明的。可以在CRISPR/Cas9或CRISPR/Cpf1系统中使用这种经过修饰的多核苷酸来编辑任何一个或多个基因组基因座。

出于非限制性地说明这种用途的目的使用CRISPR/Cas9或CRISPR/Cpf1系统,可以使用对向导RNA的修饰来增强包括向导RNA和Cas9或Cpf1核酸内切酶的CRISPR/Cas9或CRISPR/Cpf1基因组编辑复合体的形成和稳定性,所述向导RNA可以是单分子向导或双分子。对向导RNA的修饰还可以或可替代地用于增强基因组编辑复合体与基因组中的靶序列之间的相互作用的发起、稳定性或动力学,这可以例如用于提高中靶活性。对向导RNA的修饰还可以或可替代地用于增强特异性,例如,中靶位点处的基因组编辑相较于其它(脱靶)位点处的效应的相对速率。

修饰还可以或可替代地用于例如通过增加向导RNA被细胞中存在的核糖核酸酶(RNA酶)降解的抗性来提高向导RNA的稳定性,由此使向导RNA在细胞中的半衰期增加。在经由需要翻译生成核酸内切酶的RNA将Cas9或Cpf1核酸内切酶引入到待编辑的细胞中的方面,增强向导RNA半衰期的修饰会是特别有用的,这是因为增加在RNA对核酸内切酶进行编码的同时引入的向导RNA的半衰期可以用于增加向导RNA和所编码的Cas9或Cpf1核酸内切酶共存于细胞中的时间。

修饰还可以或可替代地用于降低引入到细胞中的RNA引起先天性免疫应答的可能性或程度。如下文和本领域中描述的已经在包含小干扰RNA(siRNA)在内的RNA干扰(RNAi)的背景下得到充分表征的这种应答往往与RNA的半衰期的降低相关和/或与细胞因子或和免疫应答相关的其它因子的引出相关。

还可以对引入到细胞中的对核酸内切酶进行编码的RNA进行一种或多种类型的修饰,包含但不限于增强RNA的稳定性的修饰(如通过提高细胞中存在的RNases对其进行的降解)、增强对所得产物(即,核酸内切酶)的翻译的修饰、和/或降低引入到细胞中的RNA引起先天性免疫应答的可能性或程度的修饰。

同样可以使用如前述和其它修饰等修饰的组合。例如,在CRISPR/Cas9或CRISPR/Cpf1的情况下,可以对向导RNA进行一种或多种类型的修饰(包含上文中例证的修饰)和/或可以对编码Cas核酸内切酶的RNA进行一种或多种类型的修饰(包含上文中例证的修饰)。

通过说明的方式,CRISPR/Cas9或CRISPR/Cpf1系统中使用的向导RNA或其它更小的RNA可以通过化学手段容易地合成,从而使许多修饰能够容易地并入,如在下文中说明并且在本领域中描述的。虽然化学合成程序不断扩展,但是在多核苷酸长度显著增大超过一百个核苷酸左右时,通过如高效液相色谱法(HPLC,其避免了使用如PAGE等凝胶)等程序来纯化这种RNA往往变得更具挑战性。可以用于生成更大长度的化学修饰RNA的一种方式是产生连接在一起的两个或更多个分子。如对Cas9核酸内切酶进行编码的RNA等长得多的RNA更容易通过酶生成。虽然较少类型的修饰可用于酶产生的RNA中,但是仍然存在可以用于例如增强稳定性、降低先天性免疫应答的可能性或程度和/或增强其它属性的修饰,如下文和本领域中进一步描述的;并且正在定期开发新类型的修饰。

通过说明各种类型的修饰的方式,特别是频繁地与较小化学合成RNA一起使用的那些修饰,修饰可以包括在糖的2'位置处修饰的一个或多个核苷酸,在一些方面,所述一个或多个核苷酸为2'-O-烷基、2'-O-烷基-O-烷基、或2'-氟修饰的核苷酸。在一些实例中,RNA修饰包含在RNA的3'端的嘧啶、无碱基残基或反向碱基的核糖上的2'-氟代、2'-氨基或2'-O-甲基修饰。这种修饰通常并入寡核苷酸中,并且这些寡核苷酸已经被示出为针对给定靶标具有比2'-脱氧寡核苷酸更高的Tm(即,更高的靶结合亲和力)。

许多核苷酸和核苷修饰已经被示出为使其所并入的寡核苷酸相比于天然寡核苷酸对核酸酶消化更具抗性;相比于未经修饰的寡核苷酸,这些经过修饰的寡核苷酸在更长的时间内保持完整。经过修饰的寡核苷酸的具体实例包含包括经修饰的主链的那些寡核苷酸,例如,硫代磷酸酯、磷酸三酯、甲基膦酸酯、短链烷基或环烷基糖间键、或者短链杂原子或杂环糖间键。一些寡核苷酸是具有硫代磷酸酯主链的寡核苷酸和具有杂原子主链的那些寡核苷酸,特别是CH2-NH-O-CH2、CH、~N(CH3)、~N(CH3)~O~CH2(被称为亚甲基(甲亚氨基)或MMI主链)、CH2-O-N(CH3)-CH2、CH2-N(CH3)-N(CH3)-CH2和O-N(CH3)-CH2-CH2主链,其中天然磷酸二酯主链表示为O-P-O-CH;氨基化合物主链[参见De Mesmaeker等人,《化学研究述评(Ace.Chem.Res)》28:366-374(1995)];吗啉代主链结构(参见Summerton和Weller,美国专利第5,034,506号);肽核酸(PNA)主链(其中寡核苷酸的磷酸二酯主链被替换为聚酰胺主链,核苷酸与聚酰胺主链的氮杂氮原子直接或间接结合,参见Nielsen等人,《科学》1991,254,1497)。含磷键包含但不限于:硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其它烷基膦酸酯(包括3'亚烷基膦酸酯和手性膦酸酯)、次膦酸酯、磷酰胺酯(包括3'-氨基磷酰胺酯和氨基烷基磷酰胺酯)、硫代羰基磷酰胺酯、硫代羰基烷基膦酸酯、硫代羰基烷基磷酸三酯、和具有正常3'-5'键的硼烷磷酸酯、这些酯的2'-5'连接类似物、以及具有反向极性的那些酯,其中相邻对的核苷单位以3'-5'至5'-3'或2'-5'至5'-2'来连接;参见美国专利第3,687,808号、第4,469,863号、第4,476,301号、第5,023,243号、第5,177,196号、第5,188,897号、第5,264,423号、第5,276,019号、第5,278,302号、第5,286,717号、第5,321,131号、第5,399,676号、第5,405,939号、第5,453,496号、第5,455,233号、第5,466,677号、第5,476,925号、第5,519,126号、第5,536,821号、第5,541,306号、第5,550,111号、第5,563,253号、第5,571,799号、第5,587,361号和第5,625,050号。

基于吗啉代的低聚化合物描述于以下中:Braasch和David Corey,《生物化学(Biochemistry)》41(14):4503-4510(2002);《遗传学(Genesis)》第30卷,第3期(2001);Heasman,《发育生物学(Dev.Biol.)》243:209-214(2002);Nasevicius等人,《自然遗传学(Nat.Genet.)》26:216-220(2000);Lacerra等人,《美国国家科学院院刊(Proc.Natl.Acad.Sci.)》,97:9591-9596(2000);以及1991年7月23日发布的美国专利第5,034,506号。

在Wang等人,《美国化学学会杂志(J.Am.Chem.Soc.)》122:8595-8602(2000)中描述了环己烯基核酸寡核苷酸模拟物。

其中不包含磷原子的经过修饰的寡核苷酸主链具有由以下形成的主链:短链烷基或环烷基核苷间键、混合杂原子和烷基或环烷基核苷间键或者一个或多个短链杂原子核苷间键或杂环核苷间键。这些主链包括:具有吗啉代键(部分地由核苷的糖部分形成)的那些主链;硅氧烷主链;硫化物、亚砜和砜主链;甲乙酰基(formacetyl)和硫代甲乙酰基(thioformacetyl)主链;亚甲基甲乙酰基和硫代甲乙酰基主链;含烯烃主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;以及混合了N、O、S和CH2组分部分的那些主链;参见美国专利第5,034,506号、第5,166,315号第5,185,444号第5,214,134号第5,216,141号第5,235,033号第5,264,562号第5,264,564号第5,405,938号第5,434,257号第5,466,677号第5,470,967号第5,489,677号第5,541,307号第5,561,225号第5,596,086号第5,602,240号第5,610,289号第5,602,240号第5,608,046号第5,610,289号第5,618,704号第5,623,070号第5,663,312号第5,633,360号第5,677,437号和第5,677,439号。

还可以包含一个或多个被取代的糖部分,例如,在2'位置处的以下中的一个:OH、SH、SCH3、F、OCN、OCH3、OCH3O(CH2)n CH3、O(CH2)n NH2或O(CH2)n CH3,其中n为1到约10;C1到C10低级烷基、烷氧基烷氧基、被取代的低级烷基、烷芳基或芳烷基;Cl;Br;CN;CF3;OCF3;O-、S-或N-烷基;O-、S-或N-烯基;SOCH3;SO2CH3;ONO2;NO2;N3;NH2;杂环烷基;杂环烷芳基;氨烷基氨基;聚烷氨基;被取代的甲硅烷基;RNA切割基团;报告基团;嵌入剂;用于改善寡核苷酸的药代动力学性质的基团;或者用于改善寡核苷酸的药效性质的基团、以及具有类似性质的其它取代基。在一些方面,修饰包含2'-甲氧基乙氧基(2'-O-CH2CH2OCH3,也称为2'-O-(2-甲氧乙基))(Martin等人,《HeIv化学学报(HeIv.Chim.Acta)》1995,78,486)。其它修饰包含2'-甲氧基(2'-OCH3)、2'-丙氧基(2'-OCH2CH2CH3)和2'-氟代(2'-F)。还可以在寡核苷酸上的其它位置处进行类似修饰,特别是是3'末端核苷酸上的糖的3'位置处以及5'末端核苷酸的5'位置处。寡核苷酸还可以具有糖模拟物,如替代戊呋喃糖基的环丁基。

在一些实例中,核苷酸单元的糖和核苷间键即主链可以被新颖基团替换。可以保持碱基单元与适当的核酸靶化合物杂交。一种此类低聚化合物,即已经显示具有优异杂交性质的寡核苷酸模拟物,被称作肽核酸(PNA)。在PNA化合物中,寡核苷酸的糖主链可以被替换为含酰胺主链,例如氨基乙基甘氨酸主链。核碱基可以保留并且与主链的酰胺部分的氮杂氮原子直接或间接地结合。教导制备PNA化合物的代表性美国专利包括但不限于美国专利第5,539,082号、第5,714,331号和第5,719,262号。可以在Nielsen等人,《科学》,254:1497-1500(1991)中找到PNA化合物的另外教导。

另外或可替代地,向导RNA还可以包含核碱基(在本领域中常简称为“碱基”)修饰或取代。如本文所使用的,“未经修饰的”或“天然”核碱基包含腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。经过修饰的核碱基包含仅很少或瞬时发现于天然核酸中的核碱基,例如,次黄嘌呤、6-甲基腺嘌呤、5-Me嘧啶(特别是5-甲基胞嘧啶(也被称为5-甲基-2'脱氧胞嘧啶并且在本领域中常被称为5-Me-C))、5-羟甲基胞嘧啶(HMC)、糖基HMC和龙胆二糖基HMC、以及合成的核碱基,例如2-氨基腺嘌呤、2-(甲氨基)腺嘌呤、2-(吲唑基甲基)腺嘌呤、2-(氨甲基氨基)腺嘌呤或其它杂取代的甲基腺嘌呤、2-硫尿嘧啶、2-硫胸腺嘧啶、5-溴尿嘧啶、5-羟甲基脲嘧啶、8-氮鸟嘌呤、7-脱氮鸟嘌呤、N6(6-氨基己基)腺嘌呤和2,6-二氨基嘌呤。Kornberg,A.,《DNA复制(DNA Replication)》,W.H.弗里曼公司(W.H.Freeman&Co.),旧金山,第75到77页(1980);Gebeyehu等人,《核酸研究(Nucl.Acids Res.)》15:4513(1997)。还可以包含本领域中已知的“通用(universal)”碱基,例如,肌苷。已经显示,5-Me-C取代使核酸双链体稳定性增加0.6-1.2℃(Sanghvi,Y.S.、Crooke,S.T.和Lebleu,B.编,《反义研究和应用(Antisense Research and Applications)》,CRC出版社,波卡拉顿,1993,第276到278页),并且属于碱基取代方面。

经过修饰的核碱基可以包括其它合成的和天然的核碱基,如5-甲基胞嘧啶(5-me-C);5-羟甲基胞嘧啶;黄嘌呤;次黄嘌呤;2-氨基腺嘌呤;腺嘌呤和鸟嘌呤的6-甲基和其它烷基衍生物;腺嘌呤和鸟嘌呤的2-丙基和其它烷基衍生物;2-硫尿嘧啶;2-硫胸腺嘧啶和2-硫胞嘧啶;5-卤尿嘧啶和胞嘧啶;5-丙炔基尿嘧啶和胞嘧啶;6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶;5-尿嘧啶(假尿嘧啶);4-硫尿嘧啶;8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其它8-取代的腺嘌呤和鸟嘌呤;5-卤代尤其是5-溴代、5-三氟甲基和其它5-取代的尿嘧啶和胞嘧啶;7-甲基鸟嘌呤和7-甲基腺嘌呤;8-氮鸟嘌呤和8-氮腺嘌呤;7-脱氮鸟嘌呤和7-脱氮腺嘌呤;以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。

进一步地,核碱基可以包括以下中公开的那些核碱基:美国专利第3,687,808号;聚合物科学与工程简明百科全书(The Concise Encyclopedia of Polymer Science AndEngineering),第858到859页,Kroschwitz,J.I.编,约翰威利父子公司(John Wiley&Sons),1990;;Englisch等人《应用化学(Angewandle Chemie)国际版》,1991,30,第613页;以及Sanghvi,Y.S.,第15章,《反义研究与应用》,第289到302页,Crooke,S.T.和Lebleu,B.编,CRC出版社,1993。这些核碱基中的某些核碱基对提高本公开的低聚化合物的结合亲和力特别有用。这些核碱基包含5-取代的嘧啶、6-氮杂嘧啶以及N-2、N-6和0-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。已经显示,5-甲基胞嘧啶取代使核酸双链体稳定性提高了0.6-1.2℃(Sanghvi,Y.S.、Crooke,S.T.和Lebleu,B.编,《反义研究与应用》,CRC出版社,波卡拉顿,1993,第276到278页),并且属于碱基取代方面,甚至更尤其是与2'-O-甲氧基乙基糖修饰组合时。经过修饰的核碱基描述于以下中:美国第3,687,808号以及第4,845,205号、第5,130,302号、第5,134,066号、第5,175,273号、第5,367,066号、第5,432,272号、第5,457,187号、第5,459,255号、第5,484,908号、第5,502,177号、第5,525,711号、第5,552,540号、第5,587,469号、第5,596,091号、第5,614,617号、第5,681,941号、第5,750,692号、第5,763,588号、第5,830,653号、第6,005,096号、以及美国专利申请公开2003/0158403。

因此,术语“经过修饰”是指并入向导RNA、核酸内切酶或向导RNA与核酸内切酶两者中的非天然糖、磷酸盐或碱基。不需要均匀地修饰给定寡核苷酸中的所有位置,并且事实上,可以将上述修饰中的多于一个修饰并入单个寡核苷酸中或甚至寡核苷酸内的单个核苷中。

对核酸内切酶进行编码的向导RNA和/或mRNA(或DNA)可以与增强寡核苷酸的活性、细胞分布或细胞摄取的一个或多个部分或缀合物化学连接。一些部分包括但不限于:脂质部分,如胆固醇部分[Letsinger等人,《美国国家科学院院刊》86:6553-6556(1989)];胆酸[Manoharan等人,《生物有机化学与医药化学快报(Bioorg.Med.Chem.Let.)》4:1053-1060(1994)];硫醚,例如己基-S-三苯甲基硫醇[Manoharan等人,《纽约科学院年鉴(Ann.N.Y.Acad.Sci.)》660:306-309(1992)以及Manoharan等人,《生物有机化学与医药化学快报》3:2765-2770(1993)];巯基胆固醇[Oberhauser等人,《核酸研究》20:533-538(1992)];脂肪链,例如十二烷基二醇或十一烷基残基[Kabanov等人,《FEBS快报(FEBSLett.)》259:327-330(1990)以及Svinarchuk等人,《生物化学(Biochimie)》75:49-54(1993)];磷脂,例如二-十六烷基-rac-甘油或三乙基铵1,2-二-O-十六烷基-rac-丙三基-3-H-磷酸酯[Manoharan等人,《四面体快报(Tetrahedron Lett.)》36:3651-3654(1995)以及Shea等人,《核酸研究》18:3777-3783(1990)];聚胺或聚乙二醇链[Mancharan等人,《核苷与核苷酸(Nucleosides&Nucleotides)》14:969-973(1995)];金刚烷乙酸[Manoharan等人,《四面体快报》36:3651-3654(1995)];棕榈基部分[Mishra等人,《生物化学与生物物理学学报(Biochim.Biophys.Acta)》1264:229-237(1995)];或者十八胺或己胺-羰基-t羟胆固醇部分[Crooke等人,《药理学与实验治疗学期刊(J.Pharmacol.Exp.Ther.)》277:923-937(1996)]。还参见美国专利第4,828,979号、第4,948,882号、第5,218,105号、第5,525,465号、第5,541,313号、第5,545,730号、第5,552,538号、第5,578,717号、第5,580,731号、第5,580,731号、第5,591,584号、第5,109,124号、第5,118,802号、第5,138,045号、第5,414,077号、第5,486,603号、第5,512,439号、第5,578,718号、第5,608,046号、第4,587,044号、第4,605,735号、第4,667,025号、第4,762,779号、第4,789,737号、第4,824,941号、第4,835,263号、第4,876,335号、第4,904,582号、第4,958,013号、第5,082,830号、第5,112,963号、第5,214,136号、第5,082,830号、第5,112,963号、第5,214,136号、第5,245,022号、第5,254,469号、第5,258,506号、第5,262,536号、第5,272,250号、第5,292,873号、第5,317,098号、第5,371,241号、第5,391,723号、第5,416,203号、第5,451,463号、第5,510,475号、第5,512,667号、第5,514,785号、第5,565,552号、第5,567,810号、第5,574,142号、第5,585,481号、第5,587,371号、第5,595,726号、第5,597,696号、第5,599,923号、第5,599、928号和第5,688,941号。

可以使用糖或其它部分来将如阳离子多核糖体和脂质体等包括核苷酸的蛋白质和复合体靶向特定位点。例如,可以经由脱唾液酸糖蛋白受体(ASGPR)介导肝细胞定向转移;参见例如Hu等人,《蛋白质和肽快报(Protein Pept Lett.)》21(10):1025-30(2014)。可以使用本领域中已知的和定期开发的其它系统来将本案例中使用的生物分子和/或其复合体靶向关注的特定靶细胞。

这些靶向分子或缀合物可以包含与功能基团共价结合的缀合物基团,所述功能基团如伯羟基基团或仲羟基基团。本公开的缀合物基包含嵌入剂、报告分子、聚胺、聚酰胺、聚乙二醇、聚醚、增强寡聚物的药效性质的基团、以及增强寡聚物的药代动力学性质的基团。典型的缀合物基团包含胆固醇、脂质、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素和染料。在本公开的背景下,增强药效性质的基团包含改善摄取、增强对降解的抗性和/或加强与靶核酸的序列特异性杂交的基团。在本公开的背景下,增强药代动力学性质的基团包含改善对本公开的化合物的摄取、分布、代谢或***的基团。1992年10月23日提交的国际专利申请第PCT/US92/09196号(公布为WO1993/007883)以及美国专利第6,287,860号中公开了代表性缀合物基团。缀合物部分包含但不限于如胆固醇部分等脂质部分、胆酸、硫醚(例如,己基-5-三苯甲基硫醇)、巯基胆固醇、脂肪链(例如,十二烷基二醇或十一基残基)、磷脂(例如,二-十六基-rac-甘油或1,2-二-O-十六基-rac-三丙基-3-H-膦酸三乙基铵)、聚胺或聚乙二醇链、或金刚烷乙酸、棕榈基部分、或十八烷基胺或己基氨基-羰基-羟胆固醇部分。参见例如美国专利第4,828,979号、第4,948,882号、第5,218,105号、第5,525,465号、第5,541,313号、第5,545,730号、第5,552,538号、第5,578,717号、第5,580,731号、第5,580,731号、第5,591,584号、第5,109,124号、第5,118,802号、第5,138,045号、第5,414,077号、第5,486,603号、第5,512,439号、第5,578,718号、第5,608,046号、第4,587,044号、第4,605,735号、第4,667,025号、第4,762,779号、第4,789,737号、第4,824,941号、第4,835,263号、第4,876,335号、第4,904,582号、第4,958,013号、第5,082,830号、第5,112,963号、第5,214,136号、第5,082,830号、第5,112,963号、第5,214,136号、第5,245,022号、第5,254,469号、第5,258,506号、第5,262,536号、第5,272,250号、第5,292,873号、第5,317,098号、第5,371,241号、第5,391,723号、第5,416,203号、第5,451,463号、第5,510,475号、第5,512,667号、第5,514,785号、第5,565,552号、第5,567,810号、第5,574,142号、第5,585,481号、第5,587,371号、第5,595,726号、第5,597,696号、第5,599,923号、第5,599,928号和第5,688,941号。

还可以通过各种手段对较不易于化学合成并且通常通过酶合成产生的较长多核苷酸进行修饰。这种修饰可以包含例如引入某些核苷酸类似物、在分子的5'端或3'端处并入特定序列或其它部分、以及其它修饰。通过说明的方式,对Cas9进行编码的mRNA的长度为约4kb并且可以通过体外转录来合成。可以应用对mRNA的修饰,以便例如提高其翻译或稳定性(如通过提高其对被细胞降解的抗性)或降低RNA引起通常在引入外源RNA特别是如对Cas9进行编码的RNA等较长RNA之后在细胞中观察到的先天性免疫应答的趋势。

本领域中已经描述了许多这种修饰,如聚A尾、5'帽类似物(例如,抗反向帽类似物(ARCA)或m7G(5')ppp(5')G(mCAP))、经过修饰的5'或3'非翻译区(UTR)、使用经过修饰的碱基(如假UTP、2-硫代-UTP、5-甲基胞苷-5'-三磷酸脂(5-甲基-CTP)或N6-甲基-ATP)、或用磷酸酶进行治疗以移除5'端磷酸酯。这些和其它修饰在本领域中是已知的,并且正在定期开发对RNA的新修饰。

经过修饰的RNA有许多商业供应商,包含例如TriLink Biotech、AxoLabs、Bio-Synthesis Inc.、Dharmacon等。例如,如TriLink所描述的,可以使用5-甲基-CTP来赋予期望特性,如核酸酶稳定性提高、翻译提高、或先天性免疫受体与经过体外转录的RNA的相互作用减少。已经显示,5-甲基胞苷-5'-三磷酸酯(5-甲基-CTP)、N6-甲基-ATP以及假UTP和2-硫代-UTP在培养时并且在体内也减少了先天性免疫刺激,同时增强了翻译,如下文中参考的Kormann等人和Warren等人的出版物中说明的。

已经显示,可以使用体内递送的化学修饰mRNA来实现改善的治疗效果;参见例如,Kormann等人,《自然生物技术(Nature Biotechnology)》29,154-157(2011)。这种修饰可以例如用于提高RNA分子的稳定性和/或降低其免疫原性。通过使用如假U、N6-甲基-A、2-硫代-U和5-甲基-C等化学修饰,发现,分别使用2-硫代-U和5-甲基-C来取代尿苷残基和胞苷残基的仅四分之一导致在小鼠中对mRNA进行的toll样受体(TLR)介导识别显著减少。通过减少激活先天性免疫系统,这些修饰可以用于有效地提高mRNA的体内稳定性和寿命;参见例如Kormann等人,同上。

还已经显示,重复施用并入了被设计成绕过先天性抗病毒应答的修饰的合成信使RNA可以将经过分化的人类细胞重新编程为具有多能性。参见例如Warren等人,《细胞干细胞(Cell Stem Cell)》7(5):618-30(2010)。充当原代重新编程蛋白质的这种经过修饰的mRNA会是对多种人细胞类型进行重新编程的高效手段。这种细胞被称为诱导性多能干细胞(iPSC),并且已经发现,可以使用并入了5-甲基-CTP、假UTP和抗反向帽类似物(ARCA)的酶合成RNA来有效地规避细胞的抗病毒应答;参见例如Warren等人,同上。

本领域中描述的其它多核苷酸修饰包含例如使用聚A尾、添加5'端帽类似物(如m7G(5')ppp(5')G(mCAP))、修饰5'或3'非翻译区(UTR)或用磷酸酶进行治疗以移除5'末端磷酸酯—并且正在定期开发新的方法。

已经结合对RNA干扰(RNAi)的修饰开发了适用于生成本文所使用的经过修饰的RNA的许多组合物和技术,包含小干扰RNA(siRNA)。siRNA在体内呈现出特定挑战,因为siRNA经由mRNA干扰对基因沉默的影响通常是短暂的,这会需要重复施用。另外,siRNA是双链RNA(dsRNA),并且哺乳动物细胞具有已经演化成检测并中和dsRNA的免疫应答,这常常是病毒感染的副产物。因此,存在如PKR(dsRNA应答性激酶)等哺乳动物酶和可以介导对dsRNA的细胞应答的可能的视黄酸诱导型基因I(RIG-I)以及可以响应于这种分子而触发诱导细胞因子的Toll样受体(如TLR3、TLR7和TLR8);参见例如,Angart等人的评述,《药物(Pharmaceuticals)》,(巴塞尔)6(4):440-468(2013);Kanasty等人,《分子疗法(MolecularTherapy)》20(3):513–524(2012);Burnett等人,《生物技术杂志(Biotechnol J.)》6(9):1130-46(2011);Judge和MacLachlan,《人类基因疗法(Hum Gene Ther)》19(2):111-24(2008);以及其中引用的参考文献。

大量修饰已经被开发并且应用于增强RNA稳定性、减少先天性免疫应答和/或结合将多核苷酸引入到人类细胞中实现会有用的其它益处,如本文所描述的;参见例如,Whitehead KA等人的评述,《化学与生物分子工程年评(Annual Review of Chemical andBiomolecular Engineering)》2:77-96(2011);Gaglione 和Messere,《药物化学短评(MiniRev Med Chem)》10(7):578-95(2010);Chernolovskaya等人,《分子疗法时论(Curr OpinMol Ther.)》12(2):158-67(2010);Deleavey等人,《核酸化学实验手册(Curr ProtocNucleic Acid Chem)》,第16章:第16.3单元(2009);Behlke,《寡核苷酸(Oligonucleotides)》18(4):305-19(2008);Fucini等人,《核酸疗法(Nucleic AcidTher)》22(3):205-210(2012);Bremsen等人,《遗传学前沿(Front Genet)》3:154(2012)。

如上所述,经过修饰的RNA有许多商业供应商,其中的许多供应商专门研究被设计成改善siRNA的有效性的修饰。基于文献中报告的各种发现提供了各种方法。例如,Dharmacon指出,用硫(硫代磷酸酯,PS)来替换非桥氧已经被广泛用于改善siRNA的核酸酶抗性,如Kole,《自然评论药物发现(Nature Reviews Drug Discovery)》11:125-140(2012)所报告的。据报告,对核糖的2'位置的修饰改善了核苷酸间磷酸键的核酸酶抗性,同时提高了双链体稳定性(Tm),这还已经显示提供了针对免疫激活的保护。中度PS主链修饰与小型耐受性良好的2'-取代(2'-O-甲基、2'-氟代、2'-氢)的组合与供体内应用的高度稳定siRNA相关,如Soutschek等人,《自然》432:173-178(2004)所报告的;并且据报告,2'-O-甲基修饰有效地改善了稳定性,如Volkov,《寡核苷酸》19:191-202(2009)所报告的。关于降低对先天性免疫应答的诱导,据报告,用2'-O-甲基、2'-氟代、2'-氢来修饰特异性序列减少了TLR7/TLR8相互作用,同时总体上保存了沉默活性;参见例如,Judge等人,《分子疗法(Mol.Ther.)》13:494-505(2006);以及Cekaite等人,《分子生物学杂志(J.Mol.Biol.)》365:90-108(2007)。还已经显示,如2-硫尿嘧啶、假尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶和N6-甲基腺苷等另外的修饰使通过TLR3、TLR7和TLR8介导的免疫效果最小化;参见例如,Kariko,K.等人,《免疫(Immunity)》23:165-175(2005)。

还如本领域中已知的并且可商够获得的,许多缀合物可以应用于如RNA等可以增强由细胞对其进行的递送和/或摄取的供本文中使用的多核苷酸,包含例如胆固醇、生育酚和叶酸、脂质、肽、聚合物、接头以及适配子;参见例如,Winkler的评述,《治疗递送(Ther.Deliv.)》4:791-809(2013)以及其中引用的参考文献。

密码子优化

根据本领域中用于在含有关注的靶DNA的细胞中进行表达的标准方法,可以对编码定点多肽的多核苷酸进行密码子优化。例如,如果预期靶核酸处于人类细胞中,则设想对Cas9进行编码的经过人类密码子优化的多核苷酸用于产生Cas9多肽。

基因组靶向核酸和定点多肽的复合体

基因组靶向核酸与定点多肽(例如,如Cas9等核酸引导的核酸酶)相互作用,由此形成复合体。基因组靶向核酸将定点多肽引导到靶核酸。

核糖核蛋白复合体(RNP)

定点多肽和基因组靶向核酸可以各自单独地施用于细胞或患者。另一方面,可以将定点多肽与一个或多个向导RNA或者一个或多个crRNA连同tracrRNA预先复合。然后可以将预先复合的材料施用于细胞或患者。这种预先复合的材料被称为核糖核蛋白颗粒(RNP)。RNP中的定点多肽可以是例如Cas9核酸内切酶或Cpf1核酸内切酶。定点多肽可以在N端、C端或N端和C端两者侧接一个或多个核定位信号(NLS)。例如,Cas9核酸内切酶可以侧接两个NLS,一个NLS位于N端并且第二个NLS位于C端。NLS可以是本领域中已知的任何NLS,如SV40NLS。RNP中基因组靶向核酸与定点多肽的重量比可以是1:1。例如,RNP中sgRNA与Cas9核酸内切酶的重量比可以是1:1。

核酸编码系统组分

本公开提供了包括对本公开的基因组靶向核酸、本公开的定点多肽和/或实施本公开的方法的各方面所需的任何核酸或蛋白质分子进行编码的核苷酸序列的核酸。

对本公开的基因组靶向核酸、本公开的定点多肽和/或实施本公开的方法的各方面所需的任何核酸或蛋白质分子进行编码的核酸可以包括载体(例如,重组表达载体)。

术语“载体”是指能够转运其已经连接的另一个核酸的核酸分子。一种类型的载体是“质粒”,所述质粒是指可以将另外的核酸区段连接到其中的圆形双链DNA环。另一种类型的载体是病毒载体,其中另外的核酸区段可以连接到病毒基因组中。某些载体能够在其被引入到其中的宿主细胞中进行自主复制(例如,具有细菌复制起点的细菌载体以及游离型哺乳动物载体)。其它载体(例如,非游离型哺乳动物载体)在引入到宿主细胞中时被整合到宿主细胞的基因组中,并且由此与宿主基因组一起复制。

在一些实例中,载体可以能够指导其所操作性地连接的核酸的表达。这种载体在本文中被称为“重组表达载体”或更简单地被称为“表达载体”,重组表达载体和表达载体提供同等功能。

术语“可操作地连接”意味着关注的核苷酸序列以允许表达核苷酸序列的方式与一个或多个调节序列连接。术语“调节序列”旨在包含例如启动子、增强子和其它表达控制元件(例如,多腺苷酸化信号)。这种调节序列是本领域所熟知的并且描述于例如以下中:Goeddel;《基因表达技术:酶学方法(Gene Expression Technology:Methods inEnzymology)》185,学术出版社(Academic Press),圣地亚哥,加利福尼亚州(1990)。调节序列包含指导核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异性调节序列)。本领域技术人员应了解,表达载体的设计可以取决于如靶细胞的选择、期望的表达水平等因素。

所设想的表达载体包含但不限于基于牛痘病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、SV40、单纯性疱疹病毒、人类免疫缺陷病毒、逆转录病毒(例如,鼠类白血病病毒、脾坏死病毒、以及源自于如劳斯肉瘤病毒、哈威肉瘤病毒、禽白血病病毒、慢病毒、人类免疫缺陷病毒、骨髓及外骨髓增生性肉瘤病毒和乳腺肿瘤病毒等逆转录病毒的载体)的病毒载体以及其它重组载体。设想用于真核靶细胞的其它载体包含但不限于载体pXT1、pSG5、pSVK3、pBPV、pMSG和pSVLSV40(法玛西亚公司(Pharmacia))。其它载体只要与宿主细胞相容就可以使用。

在一些实例中,载体可以包括一个或多个转录和/或翻译控制元件。根据所利用的宿主/载体系统,表达载体中可以使用许多适合的转录和翻译控制元件中的任何元件,包含组成型和诱导型启动子、转录增强子元件、转录终止子等。载体可以是使病毒序列或者CRISPR机构或其它元件的组分失活的自我失活型载体。

适合的真核启动子(即,在真核细胞中起作用的启动子)的非限制性实例包含来自以下的那些启动子:巨细胞病毒(CMV)立即早期、单纯性疱疹病毒(HSV)胸苷激酶、早期和晚期SV40、来自逆转录病毒的长末端重复(LTR)、人延伸因子-1启动子(EF1)、包括与鸡β-肌动蛋白启动子(CAG)融合的巨细胞病毒(CMV)增强子的混合构建体、鼠类干细胞病毒启动子(MSCV)、磷酸甘油酸激酶-1基因座启动子(PGK)、以及小鼠金属硫蛋白-I。

为了表达小型RNA(包含结合Cas核酸内切酶使用的向导RNA),如RNA聚合酶III启动子等各种启动子(包含例如U6和H1)会是有利的。对这种启动子的描述和用于增强这种启动子的使用的参数在本领域中是已知的,并且另外的信息和方法正在进行定期描述;参见例如,Ma,H.等人,《分子疗法-核酸(Molecular Therapy-Nucleic Acids)》,3,e161(2014年)doi:10.1038/mtna.2014.12。

表达载体还可以含有用于翻译起始的核糖体结合位点以及转录终止子。表达载体还可以包括用于放大表达的适当序列。表达载体还可以包含对与定点多肽融合由此产生融合蛋白非天然标签(例如,组氨酸标签、血球凝聚素标签、绿色荧光蛋白等)进行编码的核苷酸序列。

启动子可以是诱导型启动子(例如,热休克启动子、四环素调节的启动子、类固醇调节的启动子、金属调节的启动子、***受体调节的启动子等)。启动子可以是组成型启动子(例如,CMV启动子、UBC启动子)。在一些情况下,启动子可以是空间受限和/或时间受限启动子(例如,组织特异性启动子、细胞类型特异性启动子等)。

对本公开的基因组靶向核酸和/或定点多肽进行编码的核酸可以被包装到递送媒剂的表面中或上以便递送到细胞。所设想的递送媒剂包含但不限于纳米球、脂质体、量子点、纳米颗粒、聚乙二醇颗粒、水凝胶和胶束。如本领域中描述的,可以使用各种靶向部分来增强这种媒剂与期望的细胞类型或位置的优先相互作用。

将本公开的复合体、多核苷酸和核酸引入到细胞中可以通过以下方式发生:病毒或噬菌体感染、转染、缀合、原生质体融合、脂质转染、电穿孔、核转染、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE右旋糖酐介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微注射、纳米颗粒介导的核酸递送等。

治疗方法

本文提供了用于治疗患有血脂异常的患者的方法。这种方法的一方面是基于离体细胞的疗法。例如,对患者的肝脏执行活检。然后,从活检材料中分离肝脏特异性祖细胞或原代肝细胞。接下来,使用本文所描述的材料和方法校正这些祖细胞或原代肝细胞的染色体DNA。最后,将祖细胞或原代肝细胞植入到患者体内。任何来源或类型的细胞都可以用作祖细胞。

这种方法的另一方面是基于离体细胞的疗法。例如,可以产生患者特异性诱导性多能干细胞(iPSC)。然后,可以使用本文所描述的材料和方法来编辑这些iPS细胞的染色体DNA。接下来,可以将经过基因组编辑的iPSC分化成其它细胞。最后,将分化的细胞植入到患者体内。

这种方法的又另一方面是基于离体细胞的疗法。例如,可以从患者体内分离间充质干细胞,所述间充质干细胞可以从患者的骨髓或外周血中分离。接下来,可以使用本文所描述的材料和方法来编辑这些间充质干细胞的染色体DNA。接下来,可以将经过基因组编辑的间充质干细胞分化成任何类型的细胞,例如肝细胞。最后,将分化的细胞例如肝细胞植入到患者体内。

离体细胞治疗方式的一个优点在于能够在施用之前对治疗进行综合分析。基于核酸酶的治疗剂可以具有一定水平的脱靶效应。离体地执行基因编辑允许人们在植入之前表征编辑的细胞群。本公开包含对编辑的细胞的整个基因组进行测序以确保脱靶效应(如果有的话)可以处于与患者的最小风险相关的基因组位置。此外,可以在植入之前分离特异性细胞群,包含克隆群。

离体细胞疗法的另一个优点涉及与其它原代细胞来源相比iPSC的遗传修饰。iPSC是多产的,从而使获得基于细胞的疗法所需的大量细胞变得容易。此外,iPSC是用于执行克隆分离的理想细胞类型。这允许在无降低活力的风险的情况下筛选正确的基因组修饰。相比而言,如肝细胞等其它原代细胞只能存活几个传代并且难以以克隆方式扩增。因此,操纵iPSC治疗血脂异常会容易得多并且会缩短进行期望的遗传修饰所需的时间量。

方法还可以包含基于体内的疗法。使用本文所描述的材料和方法来编辑患者的细胞的染色体DNA。

虽然某些细胞针对离体治疗和疗法呈现出有吸引力的靶标,但是增加的递送功效可以允许直接体内递送到这种细胞。理想情况下,靶向和编辑将会针对相关细胞。通过使用仅在某些细胞和/或发育阶段中有活性的启动子,还可以防止其它细胞中的切割。另外的启动子是可诱导的并且因此可以在核酸酶作为质粒递送时在时间上控制。递送RNA和蛋白质留停留在细胞中的时间量还可以通过添加以改变半衰期的治疗或结构域来调整。体内治疗将会消除许多治疗步骤,但较低的递送速率会需要较高的编辑速率。体内治疗可以消除来自离体治疗和移植的问题和损耗。

体内基因疗法的优点可以是易于治疗剂产生和施用。相同的治疗方法和疗法将有可能被用于治疗多于一位患者,例如,共享相同或相似基因型或等位基因的多位患者。相比而言,离体细胞疗法通常需要使用患者自身的细胞,所述细胞被分离、操纵并且返回到同一患者体内。

本文还提供了用于通过基因组编辑来编辑细胞中的ANGPTL3基因的细胞方法。例如,可以从患者或动物体内分离细胞。然后,可以使用本文所描述的材料和方法来编辑细胞的染色体DNA。

本文所提供的方法,无论是细胞方法还是离体方法还是体内方法,都可以涉及通过在ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近引入一个或多个***、缺失或突变来减少(敲低)或消除(敲除)ANGPTL3基因的表达。

例如,敲低或敲除策略可以涉及通过引入由于不精确的NHEJ修复途径而产生的随机***或缺失(***缺失)来破坏ANGPTL3基因中的阅读框。这可以通过以下来实现:用一种或多种CRISPR内切酶以及gRNA(例如,crRNA+tracrRNA或者sgRNA)来诱导所关注基因中的一个单链断裂或双链断裂、或者用两种或更多种CRISPR内切酶和两种或更多种sgRNA来诱导所关注基因中的两个或更多个单链断裂或双链断裂。这个方法会需要开发和优化用于ANGPTL3基因的sgRNA。

可替代地,敲低或敲除策略还可以涉及缺失ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近的一个或多个区段。这个缺失策略需要能够与ANGPTL3基因和一个或多个CRISPR核酸内切酶内或附近的两个不同位点结合的至少一对gRNA(例如,crRNA+tracrRNA或者sgRNA)。配置有两个gRNA的CRISPR核酸内切酶在期望的位置处诱导两个双链断裂。在切割之后,这两端无论是平端还是具有突出都可以通过NHEJ进行连接,从而导致***区段缺失。NHEJ修复途径可能在连接处产生***、缺失或突变。

除了上述基因组编辑策略之外,另一种策略涉及通过在调节序列中进行编辑来调制ANGPTL3的表达、功能或活性。

除了上文列出的编辑选项之外,海可以使用Cas9或类似蛋白质来将效应结构域靶向可以鉴别出以用于编辑的相同靶位点或效应结构域范围内的另外的靶位点。可以使用一系列染色质修饰酶、甲基化酶或脱甲基酶来改变靶基因的表达。一种可能性是在突变导致不期望的活性时降低ANGPTL3蛋白的表达。这些类型的表观遗传调节具有一些优点,特别是在其在可能的脱靶效应方面受到限制时。

除了编码和剪接序列之外,还可以存在许多类型的基因组靶位点。

对转录和翻译的调节涉及与细胞蛋白质或核苷酸相互作用的多种不同类别的位点。转录因子或其它蛋白质的DNA结合位点常常可以靶向进行突变或缺失以研究位点的作用,但是还可以靶向改变基因表达。可以通过非同源末端连接NHEJ或通过同源定向修复(HDR)的直接基因组编辑来添加位点。对转录因子结合的基因组测序、RNA表达和全基因组研究的使用的增加已经增加了我们鉴别位点如何导致发育或时间基因调节的能力。这些控制系统可以是直接的或者可以涉及可能需要整合来自多个增强子的活性的广泛协同调节。转录因子通常结合6-12bp长的简并DNA序列。由个别位点提供的低特异性水平表明,结合和功能结果中涉及复杂的相互作用和规则。具有较少简并性的结合位点可以提供更简单的调节方式。人工转录因子可以被设计成指定在基因组中具有较少类似序列且具有较低脱靶切割可能性的较长序列。可以使这些类型的结合位点中的任何结合位点突变、缺失或甚至产生以实现基因调节或表达的改变(Canver,M.C.等人,《自然》(2015))。

具有这些特征的另一类基因调节区域是microRNA(miRNA)结合位点。miRNA是在转录后基因调节中起关键作用的非编码RNA。miRNA可以调节所有哺乳动物蛋白编码基因中30%的表达。发现了通过双链RNA(RNAi)进行的特异性和强效基因沉默以及另外的小型非编码RNA(Canver,M.C.等人,《自然》(2015))。对于基因沉默而言具有重要性的最大类非编码RNA是miRNA。在哺乳动物中,miRNA首先被转录为长RNA转录物,所述转录物可以是单独的转录单元、蛋白质内含子的一部分或者其它转录物。长转录物被称为包含不完美碱基配对发夹结构的初级miRNA(pri-miRNA)。这些pri-miRNA可以通过核中的蛋白质复合体(涉及Drosha)微处理器(Microprocessor)切割成一个或多个较短的前体miRNA(pre-miRNA)。

pre-miRNA是具有2-核苷酸3'突出的长度为约70个核苷酸的短茎环,所述短茎环被导出为成熟的19-25个核苷酸miRNA:miRNA*双链体。具有较低碱基配对稳定性的miRNA链(向导链)可以被加载到RNA诱导沉默复合体(RISC)上。随从链(标记为*)可以是功能性的,但是经常被降解。成熟的miRNA将RISC栓系到主要在3'非翻译区(UTR)内发现的靶mRNA中的部分互补序列基序,并且诱导转录后基因沉默(Bartel,D.P.,《细胞(Cell)》136,215-233(2009);Saj,A.和Lai,E.C.,《遗传学与发展时论(Curr Opin Genet Dev)》21,504-510(2011))。

miRNA会在发育、分化、细胞周期和生长控制以及哺乳动物和其它多细胞生物体的几乎所有生物途径中都具有重要性。miRNA还可以参与细胞周期控制、细胞凋亡和干细胞分化、造血、缺氧、肌肉发育、神经发生、胰岛素分泌、胆固醇代谢、老化、病毒复制和免疫应答。

单个miRNA可以靶向数百个不同的mRNA转录物,而单独的转录物可以被许多不同的mRNA靶向。最新版本的miRBase(v.21)中已经注释了多于28645个微RNA。一些miRNA可以由多个基因座编码,所述多个基因座中的一些可以从串联共转录簇中表达。特征允许复杂的调节网络具有多种途径和反馈控制。miRNA可以是这些反馈和调节电路的组成部分并且可以通过将蛋白质产量保持在一定限度内来帮助调节基因表达(Herranz,H.和Cohen,S.M.,《基因与发育(Genes Dev)》24,1339-1344(2010);Posadas,D.M.和Carthew,R.W.,《遗传与发展时论》27,1-6(2014))。

miRNA还会在与异常miRNA表达相关的大量人类疾病中具有重要性。这种相关强调了miRNA调节途径的重要性。最近的miRNA缺失研究已将miRNA与对免疫应答的调节联系起来(Stern-Ginossar,N.等人,《科学》317,376-381(2007))。

miRNA还与癌症有很强的联系并且可以在不同类型的癌症中发挥作用。已经发现,miRNA在许多肿瘤中进行下调。miRNA会在如细胞周期控制和DNA损伤应答等对关键癌症相关途径的调节方面具有重要性并且因此可以用于进行诊断并在临床上被靶向。微RNA可以微妙地调节血管生成的平衡,使得耗尽所有微RNA的实验抑制了肿瘤血管生成(Chen,S.等人,《基因与发育(Genes Dev)》28,1054-1067(2014))。

如已经针对蛋白质编码基因示出的,miRNA基因还可以经受与癌症一起发生的表观遗传变化。许多miRNA基因座可以与CpG岛相关联,从而增加了通过DNA甲基化对其进行调节的机会(Weber,B.,Stresemann,C.,Brueckner,B.和Lyko,F.,《细胞周期(Cell Cycle)》6,1001-1005(2007))。大多数研究已经使用了用染色质重塑药物进行的治疗来揭示表观遗传沉默的miRNA。

除了在RNA沉默中的作用外,miRNA还可以激活翻译(Posadas,D.M.和Carthew,R.W.,《遗传与发展时论》27,1-6(2014))。敲除miRNA位点可能导致靶向基因的表达减少,同时引入这些位点可能增加表达。

可以通过使种子序列(微RNA的碱基2-8)突变来最有效地敲除单独的miRNA,这对于结合特异性而言会是重要的。在这个区域进行切割、随后通过NHEJ进行错误修复可以通过阻断与靶位点的结合来有效地消除miRNA功能。还可以通过特异性地靶向回文序列附近的特殊环区来抑制miRNA。催化失活型Cas9也可以用于抑制shRNA表达(Zhao,Y.等人,《科学报告(Sci Rep)》4,3943(2014))。除了靶向miRNA之外,还可以靶向结合位点并使其突变以防止通过miRNA进行沉默。

根据本公开,任何微RNA(miRNA)或其结合位点均可以并入到本公开的组合物中。

组合物可以具有区域,如但不限于包括SEQ ID NO:632-4,715中列出的任何微RNA的序列、SEQ ID NO:632-4,715中列出的微RNA的反向补体或SEQ ID NO:632-4,715中列出的任何微RNA的微RNA抗种子区域的区域。

本公开的组合物可以包括一个或多个微RNA靶序列、微RNA序列或微RNA种子。这种序列可以对应于任何已知的微RNA,如美国出版物US2005/0261218和美国出版物US2005/0059005中教导的那些。作为非限制性实施例,已知的微RNA、其序列和其在人类基因组中的结合位点序列在下文列在SEQ ID NO:632-4,715中。

微RNA序列包括“种子”序列,即成熟微RNA的位置2-8区域中的序列,所述序列与miRNA靶序列具有完美的Watson-Crick互补性。微RNA种子可以包括成熟微RNA的位置2-8或位置2-7。在一些方面,微RNA种子可以包括7个核苷酸(例如,成熟微RNA的核苷酸2-8),其中对应的miRNA靶中的种子互补位点侧接与微RNA位置1相对的腺嘌呤(A)。在一些方面,微RNA种子可以包括6个核苷酸(例如,成熟微RNA的核苷酸2-7),其中对应的miRNA靶中的种子互补位点侧接与微RNA位置1相对的腺嘌呤(A)。参见例如Grimson A,Farh KK,Johnston WK,Garrett-Engele P,Lim LP,Bartel DP;《分子细胞(Mol.Cell.)》2007年7月6日;27(1):91-105。微RNA种子的碱基与靶序列完全互补。

已经报道了对微RNA、微RNA靶区域及其在生物学中的表达模式和作用的鉴别(Bonauer等人,《当代药物靶标(Curr Drug Targets)》2010 11:943-949;Anand和Cheresh,《血液学时论(Curr Opin Hematol)》2011 18:171-176;Contreras和Rao,《白血病(Leukemia)》2012 26:404-413(2011年12月20日,doi:10.1038/leu.2011.356);Bartel,《细胞》2009 136:215-233;Landgraf等人,《细胞》2007 129:1401-1414;Gentner和Naldini,《组织抗原(Tissue Antigens)》2012 80:393-403)。

例如,如果组合物不旨在被递送到肝脏而是在肝脏那里结束,则在肝脏中富含的微RNA miR-122的一个或多个靶位点被工程化到对所述靶序列进行编码的多核苷酸中时,miR-122可以抑制所递送序列的表达。可以工程化不同微RNA的一个或多个结合位点的引入以进一步减少寿命、稳定性和蛋白质翻译,从而提供另外的可防守层。

如本文所使用的,术语“微RNA位点”是指微RNA靶位点或微RNA识别位点或者微RNA结合或缔合的任何核苷酸序列。应当理解的是,“结合”可以遵循传统的Watson-Crick杂交规则或者可以反映微RNA与微RNA位点处或附近的靶序列的任何稳定缔合。

相反,出于本公开的组合物的目的,微RNA结合位点可以从其天然存在的序列中工程化出来(即从其中去除)以便增加特异性组织中的蛋白质表达。例如,可以去除miR-122结合位点以改善肝脏中的蛋白质表达。

具体地,已知微RNA在免疫细胞(还称为造血细胞)中差异表达,所述免疫细胞如抗原呈递细胞(APC)(例如,树突细胞和巨噬细胞)、巨噬细胞、单核细胞、B淋巴细胞、T淋巴细胞、粒细胞、自然杀伤细胞等。免疫细胞特异性微RNA参与免疫原性、自身免疫、对感染的免疫应答、炎症以及在基因治疗和组织/器官移植之后不需要的免疫应答。免疫细胞特异性微RNA还调节造血细胞(免疫细胞)的发育、增殖、分化和凋亡的许多方面。例如,miR-142和miR-146仅表达在免疫细胞中,特别富含在骨髓树突细胞中。将miR-142结合位点引入到本公开的多肽的3'-UTR中可以通过miR-142介导的mRNA降解来选择性地抑制抗原呈递细胞中的基因表达,从而限制专职性APC(例如,树突细胞)中的抗原呈递,并且由此在基因递送后防止抗原介导的免疫应答(参见Annoni A等人,《血液(blood)》2009,114,5152-5161)。

在一个实施例中,已知表达在免疫细胞特别是抗原呈递细胞中的微RNA结合位点可以被工程化到多核苷酸中以通过微RNA介导的RNA降解来抑制多核苷酸在APC中的表达,从而抑制抗原介导的免疫应答,同时在免疫细胞特异性微RNA不表达的非免疫细胞中维持多核苷酸的表达。

已经进行了许多微RNA表达研究并在本领域中进行了描述,以描述微RNA在各种癌细胞/组织和其它疾病中的差异表达。一些微RNA在某些癌细胞中异常过表达,而其它微RNA则表达不足。例如,微RNA差异表达在以下中:癌细胞(WO2008/154098、US2013/0059015、US2013/0042333、WO2011/157294);癌干细胞(US2012/0053224);胰腺癌和疾病(US2009/0131348、US2011/0171646、US2010/0286232、US8389210);哮喘和炎症(US8415096);***癌(US2013/0053264);肝细胞癌(WO2012/151212、US2012/0329672、WO2008/054828、US8252538);肺癌细胞(WO2011/076143、WO2013/033640、WO2009/070653、US2010/0323357);皮肤T细胞淋巴瘤(WO2013/011378);结肠直肠癌细胞(WO2011/0281756、WO2011/076142);癌性阳性***(WO2009/100430、US2009/0263803);鼻咽癌(EP2112235);慢性阻塞性肺病(US2012/0264626、US2013/0053263);甲状腺癌(WO2013/066678);卵巢癌细胞(US2012/0309645、WO2011/095623);乳腺癌细胞(WO2008/154098、WO2007/081740、US2012/0214699)、白血病和淋巴瘤(WO2008/073915、US2009/0092974、US2012/0316081、US2012/0283310、WO2010/018563)。

微RNA序列和靶向组织和/或细胞的非限制性实例描述于SEQ ID NO:632-4,715中。

基因组工程化策略

在一些方面,本公开的方法可以涉及编辑等位基因中的一者或两者。用于修饰一个或多个等位基因的基因编辑具有永久改变靶基因或基因产物的优点。

本公开的离体方法的步骤可以包括使用基因组工程化来编辑从患者体内分离的肝细胞。可替代地,本公开的离体方法的步骤可以包括编辑患者特异性iPSC或间充质干细胞。同样地,本公开的体内方法的步骤涉及使用基因组工程化来编辑血脂异常患者的细胞。类似地,本公开的细胞方法中的步骤可以包括通过基因组工程化来编辑人细胞中的ANGPTL3基因。

血脂异常患者可能在ANGPTL3基因中表现出不同的突变。可以在本公开的方法中使用任何CRISPR核酸内切酶,每个CRISPR核酸内切酶具有其自己的相关PAM,所述PAM可以具有或可以不具有疾病特异性。

例如,可以通过引入由于不精确的NHEJ修复途径而产生的随机***或缺失(***缺失)来破坏或消除ANGPTL3基因的表达。靶区域可以是ANGPTL3基因的编码序列(即,外显子)。将核苷酸***到或缺失到基因的编码序列中可能导致“读框移位”,其中正常的3字母密码子模式被扰乱。以此方式,可以减少或消除基因表达并且因此减少蛋白质产生。这个方法还可以用于靶向ANGPTL3基因的任何内含子、内含子:外显子接合或调节DNA元件,其中序列改变可能干扰ANGPTL3基因的表达。

作为另一个实例,NHEJ还可以用于直接地或通过靶向若干个位置的一个gRNA或若干个gRNA的切割改变剪接供体或受***点来使基因内或附近的片段缺失。这会在小型随机***缺失不足以敲除靶基因时是有用的。成对的向导链已经被用于这种类型的缺失。

在不存在供体的情况下,可以使用若干个非同源修复途径来连接来自DNA断裂的末端或来自不同断裂的末端,在所述若干个非同源修复途径中,DNA末端在接合处具有很少或不具有碱基配对的情况下连接。除了典型的NHEJ之外,还存在类似的修复机制,如替代性NHEJ。如果存在两个断裂,则可以使***片段缺失或倒置。NHEJ修复途径可能在连接处产生***、缺失或突变。

NHEJ还可能导致同源依赖性靶标整合。例如,在对供体和染色体两者进行体内核酸酶切割之后,使供体质粒上包含核酸酶靶位点可以促进转基因整合到染色体双链断裂中(Cristea,《生物技术与生物工程(Biotechnol Bioeng)》2013年3月;110(3):871-80)。在核酸酶切割之后,使用NHEJ将15-kb诱导型基因表达盒***到人类细胞系中的定义基因座中。(参见例如,Maresca,M.、Lin,V.G.、Guo,N.和Yang,Y.,《基因组研究(Genome Res)》23,539-546(2013);Cristea等人,《生物技术与生物工程(Biotechnology and Bioengineering)》2013,871-80,10.1002/bit.24733)。整合的序列可能破坏ANGPTL3基因的阅读框或改变基因的结构。

作为另一种替代方案,同源定向修复(HDR)也可以用于敲除基因或改变基因功能。HDR基本上是在DSB修复期间将所供应同源DNA序列用作模板的无错机制。HDR的速率是突变与切割位点之间的距离的函数,所以选择重叠或最近的靶位点很重要。模板可以包含同源区域侧翼的额外序列或者可以含有与基因组序列不同的序列,由此允许进行序列编辑。

例如,HDR敲除策略可以涉及通过将非功能性或无关序列***到基因中或用非功能性或无关序列替换基因的一部分来破坏ANGPTL3基因的结构或功能。这可以通过以下来实现:在外源性地引入以指导对HDR的细胞DSB响应的供体DNA模板存在的情况下(供体DNA模板可以是短的单链寡核苷酸、短的双链寡核苷酸、长的单链或双链DNA分子),用一种或多种CRISPR核酸内切酶以及gRNA(例如,crRNA+tracrRNA或者sgRNA)来诱导所关注基因中的一个单链断裂或双链断裂、或者用一种或多种CRISPR核酸内切酶和两种或更多种gRNA来诱导所关注基因中的两个或更多个单链断裂或双链断裂。这个方法会需要开发和优化用于ANGPTL3基因的gRNA和供体DNA分子。

同源定向修复是用于修复DSB的细胞机制。最常见的形式是同源重组。存在另外的HDR途径,包含单链退火和替代性HDR。基因组工程化工具允许研究者操纵细胞同源重组途径对基因组进行位点特异性修饰。已经发现,细胞可以使用反式提供的合成供体分子修复双链断裂。因此,通过在特异性突变附近引入双链断裂和提供适合的供体,可以在基因组中进行靶向改变。相比于1:106个单独接收同源供体的细胞的速率,特异性切割使HDR的速率增大超过1,000倍。特定核苷酸处的同源定向修复(HDR)的速率是到切割位点的距离的函数,所以选择重叠或最近的靶位点很重要。基因编辑相比于基因添加有优点,因为原位编辑留下了基因组的未扰动的其余部分。

用于通过HDR进行编辑的所供应供体显著变化但是可以含有具有用于允许对基因组DNA进行退火的小或大侧翼同源臂的预期序列。引入的基因变化侧翼的同源区可以为30bp或更小,或与可以含有启动子、cDNA等的多千碱基盒一样大。已经使用了单链寡核苷酸供体和双链寡核苷酸供体两者。这些寡核苷酸的大小范围为小于100nt到超过许多kb,但是还可以生成并使用较长的ssDNA。可以使用双链供体,包含PCR扩增子、质粒和迷你环。总体而言,已经发现,AAV载体可以是非常有效的供体模板递送方式,但是单独供体的包装限制为<5kb。供体的活跃转录使HDR增大三倍,从而表明包含启动子可以增加转换。相反,供体的CpG甲基化减少了基因表达和HDR。

除了如Cas9等野生型核酸内切酶之外,还存在使一个或另一个核酸酶结构域失活从而导致对仅一个DNA链进行切割的切口酶变体。可以从单独的Cas切口酶或使用靶区域侧翼的成对切口酶指导HDR。供体可以是单链的、带切口的或是dsDNA。

可以通过各种不同的方法将供体DNA与核酸酶一起供应或者独立供应,例如通过转染、纳米颗粒、微注射、或病毒转导。已经提出了一系列栓系选项以增大用于HDR的供体的可用性。实例包含将供体与核酸酶附接、与在附近结合的DNA结合蛋白附接或者与参与DNA末端结合或修复的蛋白质附接。

可以通过如影响细胞循环的培养条件等多种培养条件或通过靶向DNA修复和相关蛋白质来引导修复途径选择。例如,为了增加HDR,可以抑制关键NHEJ分子,如KU70、KU80或DNA连接酶IV。

除了通过NHEJ或HDR进行基因组编辑之外,已经进行了使用NHEJ途径和HDR两者的位点特异性基因***。在某些环境下,组合法可能是适用的,可能包含内含子/外显子边界。可以证明NHEJ对于内含子中的连接是有效的,而在编码区域中,无错HDR可能更适合。

ANGPTL3基因含有许多外显子,如表3所示。可以靶向这些外显子或附近内含子中的任何一个或多个以产生破坏阅读框并最终消除ANGPTL3蛋白活性的一个或多个***或缺失。

在一些实施例中,所述方法可以提供通过在侧接不需要的序列的位置处将基因切割两次来实现缺失的gRNA对。这个序列可以包含一个或多个外显子、内含子、内含子:外显子接合、对ANGPTL3基因的调节元件进行编码的其它DNA序列、或其组合。可以通过各自在基因组中进行DSB的一对DNA核酸内切酶或通过在基因组中一起进行DSB的多个切口酶来完成切割。

可替代地,所述方法可以提供一种gRNA以在编码或剪接序列内进行一次双链切割。可以通过单个DNA核酸内切酶或在基因组中一起进行DSB的多个切口酶来进行双链切割。

剪接供体和受体通常处于相邻内含子的100个碱基对内。在一些实例中,方法可以提供相对于关注的每个外显子/内含子接合切割约+/-100-3100bp的gRNA。

对于基因组编辑策略中的任何基因组编辑策略,可以通过测序或PCR分析来确认基因编辑。

靶序列选择

可以使用5'边界和/或3'边界相对于特定参考基因座的移位来促进或增强基因编辑的特定应用,这部分地取决于选择用于编辑的核酸内切酶系统,如本文中进一步描述和说明的。

在这种靶序列选择的第一非限制性实例中,许多核酸内切酶系统具有可以指引导潜在靶位点的初始选择以供切割的规则或标准,如在CRISPR II型或V型核酸内切酶的情况下,邻近DNA切割位点的特定位置中的PAM序列基序的要求。

在靶序列选择或优化的另一个非限制性实例中,可以相对于中靶活性频率来评估靶序列和基因编辑核酸内切酶的特定组合的脱靶活性频率(即,在除了所选靶序列之外的位点处发生DSB的频率)。在一些情况下,相对于其它细胞,已经在期望基因座处被正确编辑的细胞可以具有选择性优势。选择性优势的说明性但非限制性实例包含获取如以下等属性:增强的复制率、持久性、对某些条件的抗性、增强的成功移植率或者在引入到患者体内之后的体内持久性、以及与维持这种细胞或增大这种细胞的数量或活力相关的其它属性。在其它情况下,可以通过用于鉴别、分类或以其它方式选择已经被正确编辑的细胞的一种或多种筛选方法来肯定地选择已经在期望基因座处被正确编辑的细胞。选择性优势和定向选择方法两者可以利用与改变相关的表型。在一些情况下,可以对细胞进行两次或更多次编辑以产生第二修饰,所述第二修饰产生了用于选择或纯化预期细胞群的新表型。可以通过为可选择或可筛选标记物添加第二gRNA来产生这种第二修饰。在一些情况下,可以使用含有cDNA以及还有可选择标记物的DNA片段在期望的基因座处对细胞进行正确编辑。

无论任何选择性优势适用还是要在特定情况下应用任何定向选择,还可以通过考虑脱靶频率来引导靶序列选择,以便增强应用的效率和/或降低在除了期望靶之外的位点处发生不期望的改变的可能性。如本文中和本领域中进一步描述和说明的,脱靶活性的发生可以受许多因素以及所使用的特定核酸内切酶的影响,所述因素包含靶位点与各种脱靶位点之间的类似点和不同点。可获得辅助预测脱靶活性的生物信息学工具,并且这种工具也可以频繁用于鉴别最可能的脱靶活性位点,然后可以在实验环境中对所述位点进行评估以评价脱靶活性相对于中靶活性的频率,由此允许选择具有较高相对中靶活性的序列。本文提供了这种技术的说明性实例,并且其它技术在本领域中是已知的。

靶序列选择的另一方面涉及同源重组事件。共享同源性区域的序列可以充当导致***序列缺失的同源重组事件的焦点。这种重组事件发生在染色体和其它DNA序列的正常复制过程期间,并且还在合成DNA序列的其它时间发生,如在双链断裂(DSB)修复的情况下,所述DSB在正常细胞复制周期期间有规律地发生,但还可以通过各种事件(如UV光以及DNA断裂的其它诱导物)的发生或某些药剂(如各种化学诱导物)的存在得到增强。许多这种诱导物使DSB在基因组中任意地发生,并且DSB可以在正常细胞中有规律地诱导和修复。在修复期间,可以完全保真地重构原始序列,然而,在一些情况下,在DSB位点处引入小型***或缺失(被称为“***缺失”)。

还可以在特定位置处特异性地诱导DSB,如本文所描述的核酸内切酶系统的情况一样,DSB可以用于在所选染色***置处引起定向或优先基因修饰事件。可以在多种情形下利用同原序列在DNA修复(以及复制)的背景下经受重组的趋势,并且所述趋势是如CRISPR等基因编辑系统的一个应用的基础,在所述应用中,使用同源定向修复将通过使用“供体”多核苷酸提供的关注序列***到期望染色***置中。

还可以使用特定序列之间的区域来产生期望的缺失,所述区域可以是可以包括少到十个碱基对或更少的小型“微同源性”区域。例如,可以在表现出与附近序列具有微同源性的位点处引入单个DSB。在修复这种DSB的正常过程期间,高频率发生的结果是,由于DSB和伴随的细胞修复过程所促进的重组导致***序列缺失。

然而,在一些情形下,选择同源性区域内的靶序列还可能引起大得多的缺失,包含基因融合(当缺失处于编码区域中时),考虑到特定情形,所述缺失可以是期望的或者可以是不期望的。

本文所提供的实例进一步展示了对用于产生DSB的各种靶区域的选择以及对这种区域内的特异性靶序列的选择,所述DSB被设计成诱导导致ANGPTL3蛋白活性降低或消除的***、缺失或突变,所述特异性序列被设计成使脱靶事件相对于中靶事件最小化。

人类细胞

为了减轻血脂异常或与ANGPTL3相关联的任何病症,如本文所描述和展示的,基因编辑的主要靶标是人类细胞。例如,在离体方法中,人类细胞可以是体细胞,所述体细胞在使用如所描述的技术进行修饰之后可能产生分化细胞,例如肝细胞或祖细胞。例如,在体内方法中,人类细胞可以是肝细胞、肾细胞或来自其它受影响器官的细胞。

通过在源自并且因此已经与有需要的患者完全匹配的自体细胞中执行基因编辑,有可能生成可以被安全地重新引入到患者体内的细胞并且有效地产生将有效地减轻与患者的疾病相关的一个或多个临床病状的细胞群。

干细胞既能够进行增殖又能够产生更多祖细胞,这些祖细胞进而有能力产生大量母细胞,所述母细胞进而可以产生分化或可分化子细胞。可以诱导子细胞自身进行增殖并产生子代,所述子代随后分化成一个或多个成熟细胞类型,同时仍保留具有亲代发育潜力的一个或多个细胞。术语“干细胞”则是指在特定情形下有能力或有潜力分化成更特异化或分化的表型并且在某些情形下保留增殖而基本上不分化的能力的细胞。一方面,术语祖细胞或干细胞是指广义的母细胞,其后代(子代)经常在不同方向上通过分化而特异化,例如,通过获取完全独立的特征特性,如在胚细胞和组织的逐渐多样化中发生的。细胞分化是通常通过许多细胞***发生的复杂过程。分化细胞可以源自本身源自多潜能细胞的多潜能细胞等。尽管这些多潜能细胞中的每个多潜能细胞可以被视为干细胞,但是每个多潜能细胞可以产生的细胞类型的范围可以变化很大。一些分化细胞还有能力产生具有更大发育潜力的细胞。这种能力可以是天然的或者可以在用各种因子进行治疗时进行人工诱导。在许多生物学情况下,干细胞还可以是“多潜能的”,因为其可以产生多于一个不同细胞类型的子代,但是这对于“干性(stem-ness)”而言不是必需的。

自我更新可以是干细胞的另一个重要方面。理论上,自我更新可以通过两种主要机制中的任一种机制发生。干细胞可以不对称地***,一个子细胞保留干细胞状态并且另一个子细胞表达其它某种不同的特异性功能和表型。可替代地,群中的干细胞中的一些可以对称地***成两个干细胞,由此使群中的一些干细胞保持完整,而群中的其它细胞仅产生分化子代。“祖细胞”通常具有更原始的细胞表型(即,相比于完全分化的细胞,处于沿发育途径或进展的较早步骤)。祖细胞还经常具有显著的或非常高的增殖潜力。祖细胞可以产生多个不同的分化细胞类型或者单个分化细胞类型,这取决于发育途径并且取决于细胞发育和分化的环境。

在细胞个体发生的背景下,形容词“分化(differentiated)”或“分化(differentiating)”是相对术语。“分化细胞”是相比于其所比较的细胞已经在发育途径上进一步向下进展的细胞。因此,干细胞可以分化成谱系受限的前体细胞(如肌细胞祖细胞),所述前体细胞进而可以在途径上进一步向下分化成其它类型的前体细胞(如肌细胞前体)并且然后分化成如肌细胞等末期分化细胞,所述末期分化细胞在某种组织类型中起到特性作用并且可以保留或可以不保留进一步增殖的能力。

诱导性多能干细胞

本文所描述的基因工程化人类细胞可以是诱导性多能干细胞(iPSC)。使用iPSC的优点在于,可以从祖细胞要施用于的同一受试者体内得到细胞。也就是说,可以从受试者体内获得体细胞、将体细胞重新编程为诱导性多能干细胞并且然后重新分化成要施用于受试者的祖细胞(例如,自体细胞)。因为祖细胞基本上源自自体来源,所以相比于使用来自另一个受试者或受试者群组的细胞,可以降低移植排斥或过敏反应的风险。另外,使用iPSC消除了对从胚胎来源获得的细胞的需要。因此,一方面,在本公开方法中使用的干细胞不是胚胎干细胞。

虽然在生理学背景下分化通常是不可逆的,但是最近已经开发出了用于将体细胞重新编程为iPSC的若干种方法。示例性方法对于本领域的技术人员而言是已知的并且在下文进行简要描述。

术语“重新编程”是指改变或反转分化细胞(例如,体细胞)的分化状态的过程。换句话说,重新编程是指向后驱动细胞的分化至更未分化或更原始类型的细胞的过程。应当注意的是,对许多原代细胞进行培养可能导致完全分化特性有一定损失。因此,简单地培养包含在术语分化细胞中的这种细胞并未使这些细胞成为非分化细胞(例如,未分化细胞)或多能细胞。除了在培养中导致分化特性有部分损失的刺激物之外,分化细胞到多能性的转变还需要重新编程刺激物。相对于原代细胞亲代,经过重新编程的细胞还具有在不损失生长潜力的情况下进行延伸传代的能力的特性,所述原代细胞亲代通常在培养中具有仅有限数量的***的能力。

在重新编程之前,待重新编程细胞可以部分分化或者终末分化。重新编程可以涵盖将分化细胞(例如,体细胞)的分化状态完全反转为多能状态或多潜能状态。重新编程可以涵盖将分化细胞(例如,体细胞)的分化状态完全或部分地反转为未分化细胞(例如,胚胎状细胞)。重新编程可能导致由细胞表达特定基因,所述基因的表达进一步促进重新编程。在本文所描述的某些实例中,对分化细胞(例如,体细胞)的重新编程可以使分化细胞采取未分化状态(例如,为未分化细胞)。所产生的细胞被称为“经过重新编程的细胞”或“诱导性多能干细胞(iPSC或iPS细胞)”。

重新编程可以涉及改变例如反转在细胞分化期间发生的以下中的至少一些:核酸修饰(例如,甲基化)的可遗传模式、染色质凝聚、表观遗传变化、基因组印记等。重新编程不同于简单地维持已经多能的细胞的现有未分化状态或者维持已经是多潜能细胞(例如,肌原性干细胞)的细胞的现有的不到完全分化的状态。在一些实例中,虽然重新编程还不同于促进已经多能或多潜能的细胞的自我更新或增殖,但是本文所描述的组合物和方法还可以用于这种目的。

本领域中已知可以用于由体细胞产生多能干细胞的许多方法。将体细胞重新编程为多能表型的任何这种方法将会适于用于本文所描述的方法。

已经描述了用于使用转录因子的限定组合来产生多能细胞的重新编程方法。可以通过对Oct4、Sox2、Klf4和c-Myc的直接转导将小鼠体细胞转换为具有扩展发育潜力的ES细胞状细胞;参见例如Takahashi和Yamanaka,《细胞》126(4):663–76(2006)。iPSC类似ES细胞,这是由于其恢复多能性相关的转录电路系统和许多表观遗传景观。另外,小鼠iPSC满足针对多能性的所有标准测定:具体地,体外分化为三个胚层的细胞类型、畸胎瘤形成、对嵌合体的贡献、种系传递[参见例如,Maherali和Hochedlinger,《细胞干细胞》3(6):595-605(2008)]、以及四倍体互补。

人类iPSC可以使用类似的转导方法来获得,并且三重转录因子OCT4、SOX2和NANOG已经被建立为管理多能性的核心的一组转录因子;参见例如,Budniatzky和Gepstein,《干细胞转化医学(Stem Cells Transl Med.)》3(4):448-57(2014);Barrett等人,《干细胞转化医学》3:1-6sctm.2014-0121(2014);Focosi等人,《血液癌症杂志(Blood CancerJournal)》4:e211(2014);以及其中引用的参考文献。iPSC的产生可以通过历史上使用病毒载体将对干细胞相关基因进行编码的核酸序列引入到成年体细胞中来实现。

iPSC可以产生自或源自经过终末分化的体细胞以及成年体细胞或体干细胞。也就是说,可以通过重新编程使非多能祖细胞成为多能或多潜能的。在这种情况下,可能不必要包含与对终末分化细胞进行编程所需的一样多的重新编程因子。进一步地,重新编程可以通过对重新编程因子进行非病毒引入来诱导,例如,通过引入蛋白质本身或通过引入对重新编程因子进行编码的核酸或通过引入在翻译时产生重新编程因子的信使RNA(参见例如,Warren等人,《细胞干细胞》7(5):618-30(2010)。重新编程可以通过引入对干细胞相关基因进行编码的核酸的组合来实现,所述基因包含例如Oct-4(也被称为Oct-3/4或Pouf51)、Soxl、Sox2、Sox3、Sox 15、Sox 18、NANOG、Klfl、Klf2、Klf4、Klf5、NR5A2、c-Myc、1-Myc、n-Myc、Rem2、Tert和LIN28。使用本文所描述的方法和组合物进行的重新编程可以进一步包括将Oct-3/4、Sox家族的成员、Klf家族的成员和Myc家族的成员中的一个或多个引入到体细胞。本文所描述的方法和组合物可以进一步包括引入Oct-4、Sox2、Nanog、c-MYC和Klf4中的每一个中的一个或多个以进行重新编程。如上所述,用于重新编程的确切方法对于本文所描述的方法和组合物而言不一定是关键的。然而,当要在例如人类疗法中使用从经过重新编程的细胞分化的细胞时,一方面,重新编程并不通过改变基因组的方法来实现。因此,在这种实例中,重新编程可以是在例如不使用病毒载体或质粒载体的情况下实现的。

可以通过添加各种药剂例如小分子来增强源自一群起始细胞的重新编程效率(即,经过重新编程的细胞的数量),如以下所示出的:Shi等人,《细胞干细胞》2:525-528(2008);Huangfu等人,《自然生物技术》26(7):795-797(2008);以及Marson等人,《细胞干细胞》3:132-135(2008)。因此,增强诱导性多能干细胞产生的效率或速率的药剂或药剂的组合可以用于产生患者特异性或疾病特异性iPSC。增强重新编程效率的药剂的一些非限制性实例包含可溶Wnt、Wnt条件培养基、BIX-01294(G9a组蛋白甲基转移酶)、PD0325901(MEK抑制剂)、DNA甲基转移酶抑制剂、组蛋白脱乙酰酶(HDAC)抑制剂、丙戊酸、5'-氮杂胞苷、***(dexamethasone)、辛二酰苯胺异羟肟酸(SAHA)、维他命C和曲古抑菌素(TSA)等。

重新编程增强剂的其它非限制性实例包含:辛二酰苯胺异羟肟酸(SAHA(例如,MK0683、伏立诺他(vorinostat))和其它异羟肟酸)、BML-210、Depudecin(例如,(-)-Depudecin)、HC毒素、Nullscript(4-(l,3-二氧代-lH,3H-苯并[de]异喹啉-2-基)-N-羟基丁酰胺)、苯基丁酸(例如,苯丁酸钠)和丙戊酸((VP A)以及其它短链脂肪酸)、Scriptaid、苏拉明钠(Suramin Sodium)、曲古抑菌素A(TSA)、APHA化合物8、Apicidin、丁酸钠、新戊酰氧基甲基丁酸盐(Pivanex、AN-9)、曲普欣B(Trapoxin B)、Chlamydocin、缩酚酸肽(也被称为FR901228或FK228)、苯甲酰胺(例如,CI-994(例如,N-乙酰基地那林(N-acetyldinaline))和MS-27-275)、MGCD0103、NVP-LAQ-824、CBHA(m-羧基肉桂酸双异羟肟酸)、JNJ16241199、Tubacin、A-161906、proxamide、oxamflatin、3-Cl-UCHA(例如,6-(3-氯苯基脲基)己异羟肟酸)、AOE(2-氨基-8-氧代-9,10-环氧癸酸)、CHAP31、以及CHAP 50。其它重新编程增强剂包含例如HDAC(例如,催化失活形式)、HDAC的siRNA抑制剂和与HDAC特异性地结合的抗体的显性阴性形式。这种抑制剂可从例如BIOMOL国际(BIOMOL International)、深泽公司(Fukasawa)、默克生物科学公司(Merck Biosciences)、诺华公司(Novartis)、格洛斯特制药公司(Gloucester Pharmaceuticals)、泰坦制药公司(TitanPharmaceuticals)、MethylGene和西格玛奥德里奇公司(Sigma Aldrich)获得。

为了确认诱导出与本文所描述的方法一起使用的多能干细胞,可以对分离的克隆体进行关于干细胞标志物的表达的测试。在源自体细胞的细胞中的这种表达将细胞鉴别为诱导性多能干细胞。干细胞标志物可以选自包含以下的非限制性群组:SSEA3、SSEA4、CD9、Nanog、Fbxl5、Ecatl、Esgl、Eras、Gdf3、Fgf4、Cripto、Daxl、Zpf296、Slc2a3、Rexl、Utfl和Natl。在一种情况下,例如,表达Oct4或Nanog的细胞被鉴别为是多能的。用于检测这种标记物的表达的方法可以包含例如RT-PCR以及检测经过编码的多肽的存在的免疫学方法,如蛋白质印迹法(Western blot)或流式细胞术分析。检测不仅可以涉及RT-PCR,还可以包含蛋白质标记物的检测。细胞内标志物可以经由RT-PCR或如免疫细胞化学等蛋白质检测方法进行最佳鉴别,而细胞表面标志物很容易例如通过免疫细胞化学进行鉴别。

分离的细胞的多能干细胞特性可以通过测试进行确认,所述测试对iPSC分化成三个胚层中的每个胚层的细胞的能力进行评估。作为一个实例,裸鼠体内的畸胎瘤形成可以用于对分离的克隆体的多能特性进行评估。可以将细胞引入到裸鼠中,并且可以对细胞产生的肿瘤执行组织学和/或免疫组织化学。包括来自所有三个胚层的肿瘤的生长例如进一步表明细胞是多能干细胞。

肝细胞

在一些方面,本文所描述的基因工程化人类细胞是肝细胞。肝细胞是肝脏的主要实质组织的细胞。肝细胞占肝脏质量的70-85%。这些细胞参与:蛋白质合成;蛋白质储存;碳水化合物的转化;胆固醇、胆汁盐和磷脂的合成;外源性和内源性物质的解毒、改性和***;以及胆汁的形成和分泌的起始。

产生患者特异性iPSC

本公开的离体方法的一个步骤可以涉及产生患者特异性iPS细胞、多个患者特异性iPS细胞或者患者特异性iPS细胞系。本领域中存在用于产生患者特异性iPS细胞的许多既定方法,如以下所描述的:Takahashi和Yamanaka,2006;Takahashi、Tanabe等人,2007。例如,产生步骤可以包括:a)从患者体内分离体细胞,如皮肤细胞或成纤维细胞;以及b)将一组多能性相关基因引入到体细胞中,以便诱导细胞变成多能干细胞。所述组多能性相关基因可以是选自由OCT4、SOX1、SOX2、SOX3、SOX15、SOX18、NANOG、KLF1、KLF2、KLF4、KLF5、c-MYC、n-MYC、REM2、TERT和LIN28组成的组的基因中的一个或多个基因。

对患者的肝脏或骨髓执行活检或抽吸

活检或抽吸是从身体取得的组织或流体样本。存在许多不同种类的活检或抽吸。几乎所有活检或抽吸都涉及使用锋利工具去除少量组织。如果活检将在皮肤或其它敏感区域上进行,则可以首先施加麻痹药物。可以根据本领域中已知方法中的任何已知方法执行活检或抽吸。例如,在活检时,将针通过腹部皮肤注射到肝脏中,从而捕获肝脏组织。例如,在骨髓抽吸时,使用大针进入骨盆以收集骨髓。

分离肝脏特异性祖细胞或原代肝细胞

可以根据本领域已知的任何方法分离肝特异性祖细胞和原代肝细胞。例如,从新鲜手术标本中分离人肝细胞。使用健康的肝脏组织通过胶原酶消化来分离肝细胞。将获得的细胞悬浮液通过100-mm尼龙网过滤,并且在50g下的通过离心沉淀5分钟、重新悬浮并在冷洗介质中洗涤两次到三次。通过在严格条件下培养从新鲜肝脏制剂中获得的肝细胞而获得人肝干细胞。将接种在胶原包被的平板上的肝细胞培养2周。2周后,去除存活的细胞,并表征干细胞标志物的表达(Herrera等人,《干细胞(STEM CELLS)》2006;24:2840-2850)。

分离间充质干细胞

可以根据本领域已知的任何方法分离间充质干细胞,如从患者的骨髓或外周血中分离。例如,可以将骨髓抽吸物收集到具有肝素的注射器中。可以在珀可(Percoll)上对细胞进行洗涤并离心。可以将细胞培养在含有10%胎牛血清(FBS)的杜伯克改良伊格尔培养基(DMEM)(低糖)中(Pittinger MF,Mackay AM,Beck SC等人,《科学》1999;284:143–147)。

经过基因修饰的细胞

术语“经过基因修饰的细胞”是指包括通过基因组编辑(例如,使用CRISPR/Cas9或CRISPR/Cpf1系统)引入的至少一种基因修饰的细胞。在本文中的一些离体实例中,经过基因修饰的细胞可以是经过基因修饰的祖细胞。在本文中的一些体内实例中,经过基因修饰的细胞可以是经过基因修饰的肝细胞。本文中设想了包括外源基因组靶向核酸和/或对基因组靶向核酸进行编码的外源核酸的经过基因修饰的细胞。

术语“对照治疗群”描述了除了添加基因组编辑组分之外已经用相同培养基、病毒诱导、核酸序列、温度、汇合度、烧瓶大小、pH等治疗的细胞群。本领域已知的任何方法都可以用于测量ANGPTL3基因的转录或蛋白表达或活性,例如,ANGPTL3蛋白的蛋白质印迹分析或ANGPTL3mRNA的定量。

术语“分离的细胞”是指已经从其最初被发现的生物体中去除的细胞或这种细胞的后代。任选地,例如,在限定条件下或在存在其它细胞的情况下,细胞可以在体外进行培养。任选地,稍后将细胞引入到第二生物体中或重新引入到其(或遗传所述细胞的细胞)从中分离的生物体中。

关于分离的细胞群,术语“分离的群”是指已经从混合或非均质细胞群中去除和分离的细胞群。在一些情况下,相比于细胞从中分离或富集的非均质群,分离的群可以是基本上纯的细胞群。在一些情况下,相比于包括人类祖细胞以及得出人类祖细胞的细胞的非均质细胞群,分离的群可以是分离的人类祖细胞群,例如,基本上纯的人类祖细胞群。

关于特定细胞群,术语“大幅度增强”是指这样的细胞群:特定类型的细胞的出现相对于预先存在的或参考水平增大至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少20倍、至少50倍、至少100倍、至少400倍、至少1000倍、至少5000倍、至少20000倍、至少100000倍或更多倍,这例如取决于这种细胞用于减轻血脂异常的期望水平。

关于特定细胞群,术语“基本上富集的”是指相对于构成总细胞群的细胞,至少约10%、约20%、约30%、约40%、约50%、约60%、约70%或更多的细胞群。

关于特定细胞群,术语“基本上富集的”或“基本上纯的”是指相对于构成总细胞群的细胞,至少约75%、至少约85%、至少约90%或至少约95%纯度的细胞群。也就是说,关于祖细胞群,术语“基本上纯的”或“基本上纯化的”是指含有少于如本文中的术语定义的非祖细胞的细胞的约20%、约15%、约10%、约9%、约8%、约7%、约6%、约5%、约4%、约3%、约2%、约1%或小于1%的细胞群。

将经过基因组编辑的iPSC分化成其它细胞类型

本公开的离体方法的另一个步骤可以包括将经过基因组编辑的iPSC分化成肝细胞。可以根据本领域中已知的任何方法执行分化步骤。例如,使用各种治疗将hiPSC分化成定形内胚层,所述治疗包含激活素和B27补充物(生命科技公司(Life Technology))。将定形内胚层进一步分化成肝细胞,所述治疗包含:FGF4、HGF、BMP2、BMP4、制瘤素M、***等。(Duan等人,《干细胞》2010;28:674-686,Ma等人,《干细胞转化医学(STEM CELLSTRANSLATIONAL MEDICINE)》2013;2:409-419)。

将经过基因组编辑的间充质干细胞分化成肝细胞

本公开的离体方法的另一个步骤可以包括将经过基因组编辑的间充质干细胞分化成肝细胞。可以根据本领域中已知的任何方法执行分化步骤。例如,用各种因子和激素来治疗hMSC,包含胰岛素、转铁蛋白、FGF4、HGF、胆汁酸(Sawitza I等人,《科学报告(SciRep.)》2015;5:13320)。

将细胞植入到患者体内

本公开的离体方法的另一个步骤可以包括将肝细胞植入到患者体内。可以使用本领域中已知的任何植入方法完成这一植入步骤。例如,可以将经过基因修饰的细胞直接注射到患者的血液中或以其它方式施用于患者。

本公开的离体方法的另一个步骤涉及将祖细胞或原代肝细胞植入到患者体内。可以使用本领域中已知的任何植入方法完成这一植入步骤。例如,可以将经过基因修饰的细胞直接注射到患者的肝脏中或以其它方式施用于患者。

III.调配物和递送

药学上可接受的载剂

本文所设想的向受试者施用祖细胞的离体方法涉及使用包括祖细胞的治疗组合物。

治疗组合物可以含有生理学上可耐受的载剂连同细胞组合物以及任选的如本文所描述的在其中溶解或分散为活性成分的至少一种另外的生物活性剂。在一些情况下,当出于治疗目的施用于哺乳动物或人类患者时,治疗组合物基本上无免疫原性,除非这样期望。

本文所描述的祖细胞通常可以作为悬浮液与药学上可接受的载剂一起施用。本领域技术人员将认识到,待在细胞组合物中使用的药学上可接受的载剂将不包含实质上干扰待递送到受试者的细胞的活力的量的缓冲液、化合物、低温贮藏剂或其它药剂。包括细胞的调配物可以包含例如允许维持细胞膜完整性的渗透缓冲液以及任选的用于在施用时维持细胞活力或者增强移植的营养素。这种调配物和悬浮液对本领域技术人员而言是已知的和/或可以适于如本文所描述的使用常规实验与祖细胞一起使用。

细胞组合物还可以被乳化或呈现为脂质体组合物,条件是乳化程序不对细胞活力产生不利影响。细胞和任何其它活性成分可以与赋形剂混合,所述赋形剂是药学上可接受的并且与活性成分相容,并且采用适于在本文所描述的治疗方法中使用的量。

包含在细胞组合物中的另外的药剂可以包含其中的组分的药学上可接受的盐。药学上可接受的盐包含酸加成盐(由多肽的游离氨基形成),所述酸加成盐由无机酸如例如盐酸或磷酸或者有机酸如乙酸、酒石酸、扁桃酸等形成。由游离羧基形成的盐也可以源自无机碱如例如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁、以及这样的有机碱如异丙胺、三甲胺、2-乙胺乙醇、组氨酸、普鲁卡因(procaine)等。

生理学上可耐受的载剂是本领域中熟知的。示例性液体载剂是无菌水溶液,所述无菌水溶液除了活性成分和水之外不含任何物质或者含有处于生理pH值的磷酸钠等缓冲液、生理盐水或两者,如磷酸盐缓冲盐水。仍进一步地,水性载剂可以含有多于一种缓冲盐以及盐,如氯化钠和氯化钾、右旋糖、聚乙二醇和其它溶质。液体组合物还可以含有除了水之外并且排除水之外的液相。这种另外的液相的实例是甘油、如棉花籽油等植物油以及水油乳剂。细胞组合物中使用的在特定病症或病状的治疗中有效的活性化合物的量可以取决于病症或病状的性质并且可以通过标准临床技术来确定。

向导RNA调配物

本公开的向导RNA可以用如载剂、溶剂、稳定剂、佐剂、稀释剂等药学上可接受的赋形剂进行调配,这取决于特定施用模式和剂量形式。向导RNA组合物可以被调配以实现生理学上相容的pH,并且范围为约pH 3到约pH 11、约pH 3到约pH 7,这取决于调配物和施用途径。在一些情况下,可以将pH的范围调整到约pH 5.0到约pH 8。在一些情况下,组合物可以包括治疗有效量的如本文所描述的至少一种化合物连同一种或多种药学上可接受的赋形剂。任选地,组合物可以包括本文所描述的化合物的组合、或者可以包含在治疗或预防细菌生长方面有用的第二活性成分(例如但不限于抗菌剂或抗微生物剂)、或者可以包含本公开的试剂的组合。

适合的赋形剂包含例如载剂分子,所述载剂分子包含大型新陈代谢缓慢的大分子,如蛋白质、多糖、聚乳酸、聚乙醇酸、聚合的氨基酸、氨基酸共聚物和失活的病毒颗粒。其它示例性赋形剂可以包含抗氧化剂(例如但不限于抗坏血酸)、螯合剂(例如但不限于EDTA)、碳水化合物(例如但不限于糊精、羟烷基纤维素和羟烷基甲基纤维素)、硬脂酸、液体(例如但不限于油、水、盐水、甘油和乙醇)、润湿剂或乳化剂、pH缓冲物质等。

递送

可以通过本领域中已知的病毒递送媒剂或非病毒递送媒剂来递送向导RNA多核苷酸(RNA或DNA)和/或一个或多个核酸内切酶多核苷酸(RNA或DNA)。可替代地,可以通过本领域中已知的如电穿孔或脂质纳米颗粒等病毒递送媒剂或非病毒递送媒剂来递送一个或多个核酸内切酶多肽。在另外的可替代方面,DNA核酸内切酶可以作为一个或多个多肽单独地或以与一个或多个向导RNA或者一个或多个crRNA连同tracrRNA预先复合的方式递送。

可以通过非病毒递送媒剂来递送多核苷酸,所述非病毒递送媒剂包含但不限于纳米颗粒、脂质体、核糖核蛋白、带正电的肽、小分子RNA缀合物、适配子-RNA嵌合体以及RNA融合蛋白复合体。一些示例性非病毒递送媒剂描述于Peer和Lieberman,《基因疗法(GeneTherapy)》18:1127-1133(2011)(其集中于对递送其它多核苷酸有用的用于siRNA的非病毒递送媒剂)中。

对于本公开的多核苷酸,调配物可以选自例如国际申请PCT/US2012/069610中教导的那些中的任何一种。

可以通过脂质纳米颗粒(LNP)将如向导RNA、sgRNA和mRNA等对核酸内切酶进行编码的多核苷酸递送到细胞或患者。

LNP是指直径小于1000nm、500nm、250nm、200nm、150nm、100nm、75nm、50nm或25nm的任何颗粒。可替代地,纳米颗粒的大小范围可以为1-1000nm、1-500nm、1-250nm、25-200nm、25-100nm、35-75nm或25-60nm。

LNP可以由阳离子脂质、阴离子脂质或中性脂质制成。如融合性磷脂DOPE或膜组分胆固醇等中性脂质可以包含在LNP中作为“辅助脂质”以增强转染活性和纳米颗粒稳定性。阳离子脂质的限制包含由于稳定性差和快速清除以及炎症应答或抗炎应答的生成而产生的低功效。

LNP还可以由疏水脂质、亲水脂质或疏水脂质和亲水脂质两者构成。

可以使用本领域中已知的任何脂质或脂质组合来产生LNP。用于产生LNP的脂质的实例为:DOTMA、DOSPA、DOTAP、DMRIE、DC-胆固醇、DOTAP-胆固醇、GAP-DMORIE-DPyPE和GL67A-DOPE-DMPE-聚乙二醇(PEG)。阳离子脂质的实例为:98N12-5、C12-200、DLin-KC2-DMA(KC2)、DLin-MC3-DMA(MC3)、XTC、MD1和7C1。中性脂质的实例为:DPSC、DPPC、POPC、DOPE和SM。经过PEG修饰的脂质的实例为:PEG-DMG、PEG-CerC14和PEG-CerC20。

脂质可以以任何数量的摩尔比组合以产生LNP。另外,可以以广泛范围的摩尔比将一个或多个多核苷酸与一个或多个脂质组合以产生LNP。

如上所述,定点多肽和基因组靶向核酸各自可以单独地施用于细胞或患者。另一方面,可以将定点多肽与一个或多个向导RNA或者一个或多个crRNA连同tracrRNA预先复合。然后可以将预先复合的材料施用于细胞或患者。这种预先复合的材料被称为核糖核蛋白颗粒(RNP)。

RNA能够与RNA或DNA形成特异性相互作用。虽然在许多生物过程中利用了这一性质,但是这在核酸富集的细胞环境中还伴随有混杂相互作用的风险。这个问题的一种解决方案是形成核糖核蛋白颗粒(RNP),在所述RNP中,RNA与核酸内切酶预先复合。RNP的另一益处是保护RNA免于降解。

RNP中的核酸内切酶可以是经过修饰的或未经修饰的。同样地,gRNA、crRNA、tracrRNA或sgRNA可以是经过修饰的或未经修饰的。本领域中已知许多修饰,并且可以使用所述修饰。

通常可以以1:1的摩尔比将核酸内切酶与sgRNA组合。可替代地,通常可以以1:1:1的摩尔比将核酸内切酶、crRNA与tracrRNA组合。然而,可以使用广泛范围的摩尔比来产生RNP。

AAV(腺相关病毒)

可以使用重组的腺相关病毒(AAV)载体进行递送。用于产生rAAV颗粒的技术在本领域中是标准的,在所述技术中,向细胞提供包含待递送多核苷酸的待包装AAV基因组、rep和cap基因以及辅助病毒功能。产生rAAV通常要求在单个细胞(本文中被表示为包装细胞)内存在以下组分:rAAV基因组、与rAAV基因组分离(即,不在其中)的AAV rep和cap基因、以及辅助病毒功能。AAV rep和cap基因可以来自可以衍生重组病毒的任何AAV血清型并且可以来自与rAAV基因组ITR不同的AAV血清型,包含但不限于本文所描述的AAV血清型。假型rAAV的产生公开于例如国际专利申请公开第WO 01/83692号中。

AAV血清型

包装对本公开的组合物进行编码的多核苷酸(例如本公开的核酸内切酶、供体序列或RNA向导分子)的AAV颗粒可以包括或衍生自任何天然或重组AAV血清型。根据本公开,AAV颗粒可以利用或基于选自以下血清型中的任何一种的血清型及其变体,包含但不限于AAV1、AAV10、AAV106.1/hu.37、AAV11、AAV114.3/hu.40、AAV12、AAV127.2/hu.41、AAV127.5/hu.42、AAV128.1/hu.43、AAV128.3/hu.44、AAV130.4/hu.48、AAV145.1/hu.53、AAV145.5/hu.54、AAV145.6/hu.55、AAV16.12/hu.11、AAV16.3、AAV16.8/hu.10、AAV161.10/hu.60、AAV161.6/hu.61、AAV1-7/rh.48、AAV1-8/rh.49、AAV2、AAV2.5T、AAV2-15/rh.62、AAV223.1、AAV223.2、AAV223.4、AAV223.5、AAV223.6、AAV223.7、AAV2-3/rh.61、AAV24.1、AAV2-4/rh.50、AAV2-5/rh.51、AAV27.3、AAV29.3/bb.1、AAV29.5/bb.2、AAV2G9、AAV-2-pre-miRNA-101、AAV3、AAV3.1/hu.6、AAV3.1/hu.9、AAV3-11/rh.53、AAV3-3、AAV33.12/hu.17、AAV33.4/hu.15、AAV33.8/hu.16、AAV3-9/rh.52、AAV3a、AAV3b、AAV4、AAV4-19/rh.55、AAV42.12、AAV42-10、AAV42-11、AAV42-12、AAV42-13、AAV42-15、AAV42-1b、AAV42-2、AAV42-3a、AAV42-3b、AAV42-4、AAV42-5a、AAV42-5b、AAV42-6b、AAV42-8、AAV42-aa、AAV43-1、AAV43-12、AAV43-20、AAV43-21、AAV43-23、AAV43-25、AAV43-5、AAV4-4、AAV44.1、AAV44.2、AAV44.5、AAV46.2/hu.28、AAV46.6/hu.29、AAV4-8/r11.64、AAV4-8/rh.64、AAV4-9/rh.54、AAV5、AAV52.1/hu.20、AAV52/hu.19、AAV5-22/rh.58、AAV5-3/rh.57、AAV54.1/hu.21、AAV54.2/hu.22、AAV54.4R/hu.27、AAV54.5/hu.23、AAV54.7/hu.24、AAV58.2/hu.25、AAV6、AAV6.1、AAV6.1.2、AAV6.2、AAV7、AAV7.2、AAV7.3/hu.7、AAV8、AAV-8b、AAV-8h、AAV9、AAV9.11、AAV9.13、AAV9.16、AAV9.24、AAV9.45、AAV9.47、AAV9.61、AAV9.68、AAV9.84、AAV9.9、AAVA3.3、AAVA3.4、AAVA3.5、AAVA3.7、AAV-b、AAVC1、AAVC2、AAVC5、AAVCh.5、AAVCh.5R1、AAVcy.2、AAVcy.3、AAVcy.4、AAVcy.5、AAVCy.5R1、AAVCy.5R2、AAVCy.5R3、AAVCy.5R4、AAVcy.6、AAV-DJ、AAV-DJ8、AAVF3、AAVF5、AAV-h、AAVH-1/hu.1、AAVH2、AAVH-5/hu.3、AAVH6、AAVhE1.1、AAVhER1.14、AAVhEr1.16、AAVhEr1.18、AAVhER1.23、AAVhEr1.35、AAVhEr1.36、AAVhEr1.5、AAVhEr1.7、AAVhEr1.8、AAVhEr2.16、AAVhEr2.29、AAVhEr2.30、AAVhEr2.31、AAVhEr2.36、AAVhEr2.4、AAVhEr3.1、AAVhu.1、AAVhu.10、AAVhu.11、AAVhu.11、AAVhu.12、AAVhu.13、AAVhu.14/9、AAVhu.15、AAVhu.16、AAVhu.17、AAVhu.18、AAVhu.19、AAVhu.2、AAVhu.20、AAVhu.21、AAVhu.22、AAVhu.23.2、AAVhu.24、AAVhu.25、AAVhu.27、AAVhu.28、AAVhu.29、AAVhu.29R、AAVhu.3、AAVhu.31、AAVhu.32、AAVhu.34、AAVhu.35、AAVhu.37、AAVhu.39、AAVhu.4、AAVhu.40、AAVhu.41、AAVhu.42、AAVhu.43、AAVhu.44、AAVhu.44R1、AAVhu.44R2、AAVhu.44R3、AAVhu.45、AAVhu.46、AAVhu.47、AAVhu.48、AAVhu.48R1、AAVhu.48R2、AAVhu.48R3、AAVhu.49、AAVhu.5、AAVhu.51、AAVhu.52、AAVhu.53、AAVhu.54、AAVhu.55、AAVhu.56、AAVhu.57、AAVhu.58、AAVhu.6、AAVhu.60、AAVhu.61、AAVhu.63、AAVhu.64、AAVhu.66、AAVhu.67、AAVhu.7、AAVhu.8、AAVhu.9、AAVhu.t 19、AAVLG-10/rh.40、AAVLG-4/rh.38、AAVLG-9/hu.39、AAVLG-9/hu.39、AAV-LK01、AAV-LK02、AAVLK03、AAV-LK03、AAV-LK04、AAV-LK05、AAV-LK06、AAV-LK07、AAV-LK08、AAV-LK09、AAV-LK10、AAV-LK11、AAV-LK12、AAV-LK13、AAV-LK14、AAV-LK15、AAV-LK17、AAV-LK18、AAV-LK19、AAVN721-8/rh.43、AAV-PAEC、AAV-PAEC11、AAV-PAEC12、AAV-PAEC2、AAV-PAEC4、AAV-PAEC6、AAV-PAEC7、AAV-PAEC8、AAVpi.1、AAVpi.2、AAVpi.3、AAVrh.10、AAVrh.12、AAVrh.13、AAVrh.13R、AAVrh.14、AAVrh.17、AAVrh.18、AAVrh.19、AAVrh.2、AAVrh.20、AAVrh.21、AAVrh.22、AAVrh.23、AAVrh.24、AAVrh.25、AAVrh.2R、AAVrh.31、AAVrh.32、AAVrh.33、AAVrh.34、AAVrh.35、AAVrh.36、AAVrh.37、AAVrh.37R2、AAVrh.38、AAVrh.39、AAVrh.40、AAVrh.43、AAVrh.44、AAVrh.45、AAVrh.46、AAVrh.47、AAVrh.48、AAVrh.48、AAVrh.48.1、AAVrh.48.1.2、AAVrh.48.2、AAVrh.49、AAVrh.50、AAVrh.51、AAVrh.52、AAVrh.53、AAVrh.54、AAVrh.55、AAVrh.56、AAVrh.57、AAVrh.58、AAVrh.59、AAVrh.60、AAVrh.61、AAVrh.62、AAVrh.64、AAVrh.64R1、AAVrh.64R2、AAVrh.65、AAVrh.67、AAVrh.68、AAVrh.69、AAVrh.70、AAVrh.72、AAVrh.73、AAVrh.74、AAVrh.8、AAVrh.8R、AAVrh8R、AAVrh8R A586R突变体、AAVrh8R R533A突变体、BAAV、BNP61AAV、BNP62AAV、BNP63AAV、牛AAV、山羊AAV、日本AAV 10(Japanese AAV10)、理想型AAV(true type AAV)(ttAAV)、UPENN AAV 10、AAV-LK16、AAAV、AAV Shuffle100-1、AAV Shuffle 100-2、AAV Shuffle 100-3、AAV Shuffle 100-7、AAV Shuffle 10-2、AAV Shuffle 10-6、AAV Shuffle 10-8、AAV SM 100-10、AAV SM 100-3、AAV SM 10-1、AAVSM 10-2、和/或AAV SM 10-8。

在一些方面,如N Pulicherla等人(《分子疗法》19(6):1070-1078(2011))所描述的,AAV血清型可以是或具有AAV9序列中的突变,如但不限于AAV9.9、AAV9.11、AAV9.13、AAV9.16、AAV9.24、AAV9.45、AAV9.47、AAV9.61、AAV9.68、AAV9.84。

在一些方面,AAV血清型可以是或具有如美国专利第US 6156303号所描述的序列,如但不限于AAV3B(US 6156303的SEQ ID NO:1和10)、AAV6(US 6156303的SEQ ID NO:2、7和11)、AAV2(US 6156303的SEQ ID NO:3和8)、AAV3A(US 6156303的SEQ ID NO:4和9)或其衍生物。

在一些方面,血清型可以是AAVDJ或其变体,如AAVDJ8(或AAV-DJ8),如Grimm等人(《病毒学杂志(Journal of Virology)》82(12):5887-5911(2008))所描述的。AAVDJ8的氨基酸序列可以包括两个或更多个突变以去除肝素结合结构域(HBD)。作为非限制性实例,在美国专利第7,588,772号中被描述为SEQ ID NO:1的AAV-DJ序列可以包括两个突变:(1)R587Q,其中氨基酸587处的精氨酸(R;Arg)变为谷氨酰胺(Q;Gln);以及(2)R590T,其中氨基酸590处的精氨酸(R;Arg)变为苏氨酸(T;Thr)。作为非限制性实例可以包括三个突变:(1)K406R,其中氨基酸406处的赖氨酸(K;Lys)变为精氨酸(R;Arg);(2)R587Q,其中氨基酸587处的精氨酸(R;Arg)变为谷氨酰胺(Q;Gln);以及(3)R590T,其中氨基酸590处的精氨酸(R;Arg)变为苏氨酸(T;Thr)。

在一些实施例中,AAV血清型可以是或具有如在国际公开第WO2015121501号中描述的序列或其变体,如但不限于理想型AAV(ttAAV)(WO2015121501的SEQ ID NO:2)、“UPennAAV10”(WO2015/121501的SEQ ID NO:8)、“日本AAV10”(WO2015/121501的SEQ ID NO:9)。

根据本公开,AAV衣壳血清型的选择或使用可以来自多个物种。在一个实例中,AAV可以是禽类AAV(AAAV)。AAAV血清型可以是或具有如美国专利第US 9238800号中描述的序列或其变体,所述序列如但不限于AAAV(US 9,238,800中的SEQ ID NO:1、2、4、6、8、10、12和14)。

在一个实例中,AAV可以是牛AAV(BAAV)。BAAV血清型可以是或具有如美国专利第US 9,193,769号中描述的序列或其变体,所述序列如但不限于BAAV(US 9193769的SEQ IDNO:1和6)。BAAV血清型可以是或具有如美国专利第US7427396号中描述的序列或其变体,所述序列如但不限于BAAV(US7427396的SEQ ID NO:5和6)。

在一个实例中,AAV可以是山羊AAV。山羊AAV血清型可以是或具有如美国专利第US7427396号中描述的序列或其变体,所述序列如但不限于山羊AAV(US7427396的SEQ IDNO:3)。

在其它实例中,AAV可以被工程化为来自两个或更多个亲本血清型的杂合AAV。在一个实例中,AAV可以是AAV2G9,AAV2G9包括来自AAV2和AAV9的序列。AAV2G9AAV血清型可以是或具有如美国专利公开第US2016/0017005号中描述的序列。

在一个实例中,AAV可以是由如Pulicherla等人所描述的在氨基酸390-627(VP1编号)中具有突变的AAV9衣壳文库生成的血清型(《分子疗法》19(6):1070-1078(2011))。血清型和对应的核苷酸和氨基酸取代可以是但不限于,AAV9.1(G1594C;D532H)、AAV6.2(T1418A和T1436X;V473D和I479K)、AAV9.3(T1238A;F413Y)、AAV9.4(T1250C和A1617T;F417S)、AAV9.5(A1235G、A1314T、A1642G、C1760T;Q412R、T548A、A587V)、AAV9.6(T1231A;F411I)、AAV9.9(G1203A、G1785T;W595C)、AAV9.10(A1500G、T1676C;M559T)、AAV9.11(A1425T、A1702C、A1769T;T568P、Q590L)、AAV9.13(A1369C、A1720T;N457H、T574S)、AAV9.14(T1340A、T1362C、T1560C、G1713A;L447H)、AAV9.16(A1775T;Q592L)、AAV9.24(T1507C、T1521G;W503R)、AAV9.26(A1337G、A1769C;Y446C、Q590P)、AAV9.33(A1667C;D556A)、AAV9.34(A1534G、C1794T;N512D)、AAV9.35(A1289T、T1450A、C1494T、A1515T、C1794A、G1816A;Q430L、Y484N、N98K、V606I)、AAV9.40(A1694T、E565V)、AAV9.41(A1348T、T1362C;T450S)、AAV9.44(A1684C、A1701T、A1737G;N562H、K567N)、AAV9.45(A1492T、C1804T;N498Y、L602F)、AAV9.46(G1441C、T1525C、T1549G;G481R、W509R、L517V)、9.47(G1241A、G1358A、A1669G、C1745T;S414N、G453D、K557E、T582I)、AAV9.48(C1445T、A1736T;P482L、Q579L)、AAV9.50(A1638T、C1683T、T1805A;Q546H、L602H)、AAV9.53(G1301A、A1405C、C1664T;G1811T;R134Q、S469R、A555V、G604V)、AAV9.54(C1531A、T1609A;L511I、L537M)、AAV9.55(T1605A;F535L)、AAV9.58(C1475T、C1579A;T492I、H527N)、AAV.59(T1336C;Y446H)、AAV9.61(A1493T;N498I)、AAV9.64(C1531A、A1617T;L511I)、AAV9.65(C1335T、T1530C、C1568A;A523D)、AAV9.68(C1510A;P504T)、AAV9.80(G1441A;G481R)、AAV9.83(C1402A、A1500T;P468T、E500D)、AAV9.87(T1464C、T1468C;S490P)、AAV9.90(A1196T;Y399F)、AAV9.91(T1316G、A1583T、C1782G、T1806C;L439R、K528I)、AAV9.93(A1273G、A1421G、A1638C、C1712T、G1732A、A1744T、A1832T;S425G、Q474R、Q546H、P571L、G578R、T582S、D611V)、AAV9.94(A1675T;M559L)和AAV9.95(T1605A;F535L)。

在一个实例中,AAV可以是包括至少一个AAV衣壳CD8+T细胞表位的血清型。作为非限制性实例,血清型可以是AAV1、AAV2或AAV8。

在一个实例中,AAV可以是变体,如Deverman.2016.《自然生物技术》34(2):204-209中描述的PHP.A或PHP.B。

在一个实例中,AAV可以是选自SEQ ID NO:4,734-5,302和表2中发现的那些血清型中的任何血清型的血清型。

在一个实例中,AAV可以由如SEQ ID NO:4,734-5,302中描述的序列、片段或变体编码。

rAAV产生的一般原理在例如以下中进行了评论:Carter,1992,《生物技术时论(Current Opinions in Biotechnology)》1533-539;以及Muzyczka,1992,《微生物学与免疫学当前课题(Curr.Topics in Microbial.and Immunol.)》158:97-129)。各种方法描述于以下中:Ratschin等人,《分子细胞生物学(Mol.Cell.Biol.)》4:2072(1984);Hermonat等人,《美国国家科学院院刊》81:6466(1984);Tratschin等人,《分子细胞生物学》5:3251(1985);McLaughlin等人,《病毒学杂志(J.Virol.)》62:1963(1988);以及Lebkowski等人,1988,《分子细胞生物学》7:349(1988)。Samulski等人,(1989,《病毒学杂志》63:3822-3828);美国专利第5,173,414号;WO 95/13365和对应的美国专利第5,658,776号;WO 95/13392;WO 96/17947;PCT/US98/18600;WO 97/09441(PCT/US96/14423);WO 97/08298(PCT/US96/13872);WO 97/21825(PCT/US96/20777);WO 97/06243(PCT/FR96/01064);WO 99/11764;Perrin等人(1995)《疫苗(Vaccine)》13:1244-1250;Paul等人(1993)《人类基因疗法(Human Gene Therapy)》4:609-615;Clark等人(1996)《基因疗法(Gene Therapy)》3:1124-1132;美国专利第5,786,211号;美国专利第5,871,982号;以及美国专利第6,258,595号。

AAV载体表型可以与靶细胞类型相匹配。例如,以下示例性细胞类型可以通过所指示AAV表型等进行转导。

表2.组织/细胞类型与血清型

组织/细胞类型 血清型
AAV3、AAV5、AAV8、AAV9
骨骼肌 AAV1、AAV7、AAV6、AAV8、AAV9
中枢神经系统 AAV5、AAV1、AAV4、AAV9
RPE AAV5、AAV4
感光细胞 AAV5
AAV9
心脏 AAV8
胰腺 AAV8
AAV2、AAV8
造血干细胞 AAV6

除腺相关病毒载体外,还可以使用其它病毒载体。这种病毒载体包含但不限于慢病毒、甲病毒、肠道病毒、瘟疫病毒、杆状病毒、疱疹病毒、爱泼斯坦-巴尔病毒(EpsteinBarr virus)、乳多空病毒、痘病毒、牛痘病毒和单纯性疱疹病毒。

在一些方面,Cas9 mRNA、靶向ANGPTL3基因中的一个或两个基因座的sgRNA以及供体DNA可以各自单独调配成脂质纳米颗粒或全部一起调配成一个脂质纳米颗粒。

在一些方面,Cas9 mRNA可以被调配成脂质纳米颗粒,而sgRNA和供体DNA可以在AAV载体中递送。

可获得用于将Cas9核酸酶作为DNA质粒、作为mRNA或作为蛋白进行递送的选项。向导RNA可以从同一DNA中表达或者还可以作为RNA进行递送。可以对RNA进行化学修饰以改变或改善其半衰期或者降低免疫应答的可能性或程度。可以在递送之前将核酸内切酶蛋白与gRNA复合。病毒载体允许高效递送;可以将Cas9的***版本和Cas9的较小直向同源物包装在AAV中,如供体可以的那样以进行HDR。还存在可以递送这些组分中的每个组分的一系列非病毒递送方法,或者可以前后采用非病毒方法和病毒方法。例如,可以使用纳米颗粒来递送蛋白质和向导RNA,同时可以使用AAV来递送供体DNA。

IV.给药与施用

术语“施用”、“引入”和“植入”可在以下背景下可互换地使用:将细胞例如祖细胞通过某种方法或途径置于受试者体内,所述方法或途径导致引入的细胞至少部分地定位于期望的部位如损伤或修复部位,使得产生了一种或多种期望的效果。细胞例如祖细胞或其分化子代可以通过任何适当的途径施用,所述途径导致递送到受试者的期望位置,在所述期望位置,植入的细胞或细胞组分的至少一部分保持有活力。在施用于受试者之后细胞的活力周期可以短至几小时(例如二十四小时)到几天、到长达若干年或甚至患者的生命周期,即长期移植。例如,在本文所描述的一些方面,经由如腹膜内途径或静脉内途径等全身施用途径来施用有效量的肝脏祖细胞。

术语“个体”、“受试者”、“宿主”和“患者”在本文中可互换地使用并且是指期望进行诊断、治疗(treatment)或治疗(therapy)的任何受试者。在一些方面,受试者是哺乳动物。在一些方面,受试者是人。

当以预防方式提供时,本文所描述的祖细胞可以在有血脂异常的任何症状之前施用于受试者。因此,祖细胞群的预先施用用于预防血脂异常。

根据本文所描述的方法施用的祖细胞群可以包括从一个或多个供体获得的同种异体祖细胞。这种祖细胞可以是任何细胞或组织源,例如,肝脏、肌肉、心脏等。“同种异体”是指从同一物种的一个或多个不同供体获得的祖细胞或包括祖细胞的生物样本,其中一个或多个基因座处的基因不相同。例如,施用于受试者的肝脏祖细胞群可以源自一个或多个不相关的供体受试者或者源自一个或多个不相同的兄弟姐妹。在一些情况下,可以使用同基因祖细胞群,如从基因相同的动物或从同卵双胞胎获得的那些同基因祖细胞群。祖细胞可以是自体细胞;也就是说,祖细胞是从受试者获得或分离的并且施用于同一受试者,即,供体和受体是相同的。

术语“有效量”是指预防或减轻血脂异常的至少一个或多个体征或症状所需的祖细胞群或其子代的量,并且涉及足够量的组合物以提供期望的效果例如来治疗患有血脂异常的受试者。因此,术语“治疗有效量”是指祖细胞或包括祖细胞的组合物的当施用于如患有血脂异常或有血脂异常风险的人等典型受试者时足以促进特定效果的量。有效量还将会包含足以预防或延迟疾病症状的产生、改变疾病症状的过程(例如但不限于,减慢疾病症状的进展)或逆转疾病症状的量。应当理解的是,对于任何给定的情况,适当的“有效量”可以由本领域普通技术人员使用常规实验来确定。

为了在本文所描述的各方面使用,祖细胞的有效量包括至少102个祖细胞、至少5×102个祖细胞、至少103个祖细胞、至少5×103个祖细胞、至少104个祖细胞、至少5×104个祖细胞、至少105个祖细胞、至少2×105个祖细胞、至少3×105个祖细胞、至少4×105个祖细胞、至少5×105个祖细胞、至少6×105个祖细胞、至少7×105个祖细胞、至少8×105个祖细胞、至少9×105个祖细胞、至少1×106个祖细胞、至少2×106个祖细胞、至少3×106个祖细胞、至少4×106个祖细胞、至少5×106个祖细胞、至少6×106个祖细胞、至少7×106个祖细胞、至少8×106个祖细胞、至少9×106个祖细胞或其倍数。祖细胞可以从一个或多个供体得到或者可以从自体来源获得。在本文所描述的一些实例中,在施用于有需要的受试者之前,祖细胞可以在培养中扩增。

在患有ANGPTL3相关病症的患者的细胞中表达的ANGPTL3水平的适度和增量降低可能有益于减轻疾病的一种或多种症状、增加长期存活和/或减少与其它治疗相关的副作用。在向人类患者施用这种细胞后,产生降低水平的ANGPTL3的祖细胞的存在是有益的。在一些情况下,对受试者的有效治疗引起ANGPTL3水平相对于受治疗受试者中的总ANGPTL3降低至少约3%、5%或7%。在一些实例中,ANGPTL3的减少将为总ANGPTL3的至少约10%。在一些实例中,ANGPTL3的减少将为总ANGPTL3的至少约20%到30%。类似地,对具有显著降低的ANGPTL3水平的细胞的甚至相对有限的亚群的引入可能在各个患者中是有益的,因为在一些情形下,归一化细胞相对于患病细胞将具有选择性优势。然而,即使具有降低的ANGPTL3水平的适度水平的祖细胞也可以有益于减轻患者的血脂异常的一个或多个方面。在一些实例中,这种细胞所施用于的患者的肝脏祖细胞的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或更多产生了降低的ANGPTL3水平。

“施用”是指通过导致祖细胞组合物至少部分地定位于期望部位的方法或途径将细胞组合物递送到受试者。可以通过导致对受试者进行有效治疗的任何适当的途径施用细胞组合物,即导致递送到受试者的期望位置的施用,在所述期望位置,递送的组合物的至少一部分即至少1×104个细胞被递送到期望部位一段时间。

在所述方法的一方面,药物组合物可以经由如但不限于以下等途径施用:肠内(到肠中)、胃肠道、硬脑膜外(到硬脑膜中)、口服(通过口腔)、透皮、硬膜外、大脑内(到大脑中)、脑室内(到脑室中)、表皮(施加到皮肤上)、皮内(到皮肤本身中)、皮下(皮肤下)、鼻腔施用(穿过鼻子)、静脉内(到静脉中)、静脉团注、静脉滴注、动脉内(到动脉中)、肌内(到肌肉中)、心内(到心脏中)、骨内输注(到骨髓中)、鞘内(到椎管中)、腹膜内(输注或注射到腹膜中)、膀胱内输注、玻璃体内(穿过眼睛)、海绵窦内注射(到病理腔中)、腔内(到***根部中)、***内施用、子宫内、外羊膜施用、透皮(穿过完整的皮肤扩散以供全身分布)、透粘膜(穿过粘膜扩散)、经***、吹气(鼻吸)、舌下、唇下、灌肠、滴眼(到结膜上)、滴耳、耳(在耳朵中或通过耳朵)、颊(指向脸颊)、结膜、皮肤、牙齿(到一个或多个牙齿)、电渗、子宫颈内、鼻窦内(endosinusial)、气管内、体外、血液透析、浸润、间质、腹内、羊膜内、关节内、胆内、支气管内、囊内、软骨内(在软骨内)、尾内(在马尾内)、脑池内(在小脑延髓池(cisternamagna cerebellomedularis)内)、角膜内(在角膜内)、牙内(dental intracornal)、冠状动脉内(在冠状动脉内)、***海绵体内(在***海绵体的可膨胀空间内)、椎间盘内(在椎间盘内)、管内(在腺管内)、十二指肠内(在十二指肠内)、硬脑膜内(在硬脑膜内或下方)、表皮内(到表皮)、食道内(到食道)、胃内(在胃内)、龈内(在齿龈内)、回肠内(在小肠的远端部分内)、病灶内(在局部病变内或直接引入到局部病变)、管腔内(在管腔内)、***内(淋巴内)、髓内(在骨髓腔内)、脑膜内(在脑膜内)、心肌内(在心肌内)、眼内(在眼睛内)、卵巢内(卵巢内)、心包内(心包内)、胸膜内(在胸膜内)、***内(在***内)、肺内(在肺或其支气管内)、窦内(intrasinal)(在鼻或眶周窦内)、脊柱内(在脊柱内)、滑膜内(在关节的滑膜腔内)、腱内(在腱内)、睾丸内(在睾丸内)、鞘内(在脑脊髓轴的任何水平处的脑脊液内)、胸内(在胸内)、小管内(在器官小管内)、肿瘤内(在肿瘤内)、鼓室内(在aurus血管中层内)、血管内(在一个或多个血管内)、心室内(在心室内)、离子电渗疗法(通过电流的方式,其中可溶性盐的离子迁移到身体组织中)、灌洗(用于洗浴或冲洗开放性伤口或体腔)、喉部(直接在喉上)、鼻胃(穿过鼻子进入胃中)、封闭敷料技术(局部施用途径,然后用封闭所述区域的敷料进行覆盖)、眼(到外眼)、口咽(直接到口和咽)、肠胃外、经皮、关节周、硬膜外、神经周、牙周、直肠、呼吸道(在呼吸道内,通过口服或经鼻吸入以用于局部或全身效果)、眼球后(在脑桥后面或在眼球后面)、心肌内(进入心肌)、软组织、蛛网膜下、结膜下、粘膜下、局部、经胎盘(穿过胎盘或跨过胎盘)、经气管(穿过气管的壁)、经鼓室(跨过或穿过鼓室)、输尿管(到输尿管)、尿道(到尿道)、***、尾部阻滞、诊断、神经阻滞、胆道灌注、心脏灌注、光分离置换法、以及脊柱。

施用模式包含注射、输注、滴注和/或摄取。“注射”包含但不限于静脉内、肌内、动脉内、鞘内、心室内、囊内、眶内、心内、皮内、腹膜内、经气管、皮下、表皮下、关节内、被膜下、蛛网膜下、椎管内、脑脊髓内和胸骨内注射和输注。在一些实例中,途径是静脉内。为了递送细胞,施用可以通过注射或输注来进行。

细胞可以全身施用。短语“全身施用”、“全身地施用”、“外周施用”和“外周地施用”是指将祖细胞群并非直接施用到靶部位、组织或器官中,使得祖细胞群反而进入受试者的循环系统,并且因此经受新陈代谢和其它相似的过程。

包括用于治疗血脂异常的组合物的治疗的疗效可以由有经验的临床医生确定。然而,举个例子,如果ANGPTL3水平的体征或症状中的任何一个或所有体征或症状以有益的方式改变(例如,降低至少10%)或其它临床上接受的症状或疾病标记物得到改善或减轻,则治疗被认为是“有效治疗”。疗效还可以通过个体并未如通过住院治疗评估的那样恶化或需要医疗干预(例如,疾病的进展停止或至少减慢)来测量。测量这些指标的方法对本领域技术人员而言是已知的和/或在本文进行了描述。治疗包含对个体或动物(一些非限制性实例包含人类或哺乳动物)的疾病的任何治疗并且包含:(1)抑制疾病,例如阻止或减慢症状的进展;或(2)缓解疾病,例如使症状消退;以及(3)预防或减小症状发展的可能性。

根据本公开的治疗可以通过降低或改变个体中ANGPTL3的量来减轻与血脂异常相关的一种或多种症状。

V.血管生成素样3(ANGPTL3)基因的特征和性质

ANGPTL3与疾病和病症有关,如但不限于动脉硬化、动脉粥样硬化、心血管疾病、冠心病、糖尿病(Diabetes)、糖尿病(Diabetes Mellitus)、非胰岛素依赖型糖尿病、脂肪肝、高胰岛素血症、高脂血症、高甘油三酯血症、低β脂蛋白血症、炎症、胰岛素抗性、代谢性疾病、肥胖、口腔恶性肿瘤、脂质代谢紊乱、唇和口腔癌、血脂异常、代谢综合征X、低甘油三酯血症、奥皮茨三角头综合征(Opitz trigonocephaly syndrome)、缺血性中风、高甘油三酯血症结果、家族性低β脂蛋白血症2、家族性低脂蛋白血症和缺血性脑血管意外。使用本文所描述的任何方法编辑ANGPTL3基因可以用于治疗、预防和/或减缓本文所描述的疾病和病症的症状。

ANGPTL3基因对血管生成素样蛋白3进行编码,所述血管生成素样蛋白3是人类的高密度脂蛋白(HDL)水平的决定因素。血管生成素样蛋白3与血浆甘油三酯和HDL胆固醇呈正相关。ANGPTL3的活性主要表达在肝脏中。ANGPTL3与血脂异常相关联。血脂异常是一种遗传性疾病,其特征在于血液中脂质的水平升高,所述升高导致发生动脉阻塞(动脉粥样硬化)。这些脂质包含血浆胆固醇、甘油三酯或高密度脂蛋白。血脂异常会增加心脏病发作、中风或其它血液循环问题的风险。目前的管理包含改变生活方式,如进行运动和饮食修改以及使用如他汀类等降脂药物。非他汀类降脂药物包含胆汁酸螯合剂、胆固醇吸收抑制剂、纯合家族性高胆固醇血症药物、贝特类、烟酸、ω-3脂肪酸和/或组合产品。治疗选项通常取决于具体的脂质异常,但是不同的脂质异常常常共存。对儿童的治疗更具挑战性,因为饮食变化可能难以实施并且降脂疗法尚未被证实有效。

还已知ANGPTL3引起低β脂蛋白血症。低β脂蛋白血症是影响全世界1/1000与1/3000的人的遗传性疾病(常染色体隐性)。低β脂蛋白血症的常见症状包含低于第5百分位的LDL胆固醇或载脂蛋白B的血浆水平,这样损害了身体吸收和运输脂肪的能力并且可能导致视网膜变性、神经病变、凝血病或肝脏中脂肪积累异常(被称为肝脂肪变性)。在重度受影响的患者中,肝脂肪变性可能进展为慢性肝病(肝硬化)。目前对低β脂蛋白血症的治疗包含将长链脂肪酸严格限制到每天15克以改善脂肪吸收。在患有低β脂蛋白血症的婴儿中,短暂补充中链甘油三酯可能是有效的,但必须密切监测其量以避免肝脏毒性。用于治疗低β脂蛋白血症的另一选项是施用高剂量的维生素E以预防神经病学并发症。可替代地,如果升高的凝血酶原时间表明维生素K耗尽,则补充维生素A(10,000-25,000IU/d)可能是有效的。

在一个实例中,用于本文所描述的组合物和方法的靶组织是肝组织。

在一个实例中,基因是血管生成素样3(ANGPTL3),所述ANGPTL3还可以称为血管生成素5、ANGPT5、ANG-5、血管生成素样蛋白3、血管生成素-5、FHBL2和ANL3。ANGPTL3的细胞遗传学位置为1p31.3,并且基因组坐标为在正向链上的染色体1上、在位置62,597,487-62,606,159处。ANGPTL3的核苷酸序列示出为SEQ ID NO:5303。USP1是ANGPTL3在正向链上的上游基因,并且ATG4C是ANGPTL3在正向链上的下游基因。DOCK7是位于与ANGPTL3相反的反向链上的基因。ANGPTL3的NCBI基因ID为27329、UniprotID为Q9Y5C1并且Ensembl基因ID为ENSG00000132855。ANGPTL3具有2个SNP、9个内含子和12个外显子。来自Ensembl的外显子标识符以及内含子和外显子的起始/终止位点如表3所示。

表3.ANGPTL3的内含子和外显子

Figure BDA0002242567760000951

表4基于Ensembl数据库提供了关于ANGPTL3基因的所有转录物的信息。表4中提供了来自Ensembl的转录物ID和转录物的对应NCBI RefSeq ID、来自Ensembl的翻译ID和蛋白质的对应NCBI RefSeq ID、如由Ensembl分类的转录物序列的生物型以及基于表3中的信息,转录物中的外显子和内含子。

表4.ANGPTL3的转录物信息

Figure BDA0002242567760000952

ANGPTL3具有2个SNP,并且这个ANGPTL3基因的UniProt VAR编号为VAR_049071和VAR_067283。

在一个实例中,本公开中使用的向导RNA可以包括表5中列出的至少一个20核苷酸(nt)靶核酸序列。表5中提供了基因的基因符号和序列标识符(基因SEQ ID NO),基因序列包含在靶基因上游和/或下游的1-5千碱基对(扩展基因SEQ ID NO)以及20nt靶核酸序列(20nt靶序列SEQ ID NO)。在列出相应靶基因的序列中,针对20nt靶核酸序列(SEQ ID NO:5305-17018)中的每一个描述了用于靶向基因的链(在序列表中用(+)链或(-)链注释)、相关PAM类型和PAM序列。在本领域中应当理解的是,在“T”是“U”的情况下,间隔序列可以是对应于表5中列出的20nt序列的RNA序列。

表5.核酸序列

在一个实例中,本公开中使用的向导RNA可以包括在“T”是“U”的情况下可以是对应于20核苷酸(nt)靶序列的RNA序列的至少一个间隔序列,所述20nt靶序列如但不限于SEQID NO:5305-17018中的任何一个。

在一个实例中,本公开中使用的向导RNA可以包括在“T”是“U”的情况下是对应于20nt序列的RNA序列的至少一个间隔序列,所述20nt序列如但不限于SEQ ID NO:5305-17018中的任何一个。

在一个实例中,向导RNA可以包括与PAM类型相关联的20核苷酸(nt)靶核酸序列,所述PAM类型如但不限于NAAAAC、NNAGAAW、NNGRRT、NNNNGHTT、NRG或YTN。作为非限制性实例,用于特定靶基因和特定PAM类型的20nt靶核酸序列可以在“T”是“U”的情况下是对应于表6中的20nt核酸序列中的任何一个的RNA序列。

表6.根据PAM类型的核酸序列

Figure BDA0002242567760000971

在一个实例中,向导RNA可以包括与YTN PAM类型相关联的22核苷酸(nt)靶核酸序列。作为非限制性实例,用于特定靶基因的22nt靶核酸序列可以包括20nt核心序列,其中20nt核心序列在“T”是“U”的情况下可以是对应于SEQ ID NO:10172-17018的RNA序列。作为另一个非限制性实例,用于特定靶基因的22nt靶核酸序列可以包括核心序列,其中核心序列在“T”是“U”的情况下可以是对应于SEQ ID NO:10172-17018中的任何一个的RNA序列的片段、区段或区域。

VI.其它治疗方法

可以使用被工程化成靶特异性序列的核酸酶进行基因编辑。迄今为止,存在四种主要类型的核酸酶:大范围核酸酶及其衍生物、锌指核酸酶(ZFN)、转录激活子样效应核酸酶(TALEN)和CRISPR-Cas9核酸酶系统。核酸酶平台在设计难度、靶向密度和作用模式方面不同,特别是在ZFN和TALEN的特异性贯穿整个蛋白-DNA相互作用,而RNA-DNA相互作用主要引导Cas9时。

如Cas9等CRISPR核酸内切酶可以用于本公开的方法中。然而,本文所描述的教导如治疗靶位点可以应用于其它形式的核酸内切酶,如ZFN、TALEN、HE或MegaTAL,或使用核酸酶的组合。然而,为了将本公开的教导应用于这种核酸内切酶,除了其它方面之外,人们需要将针对特异性靶位点的蛋白质工程化。

另外的结合结构域可以与Cas9蛋白融合以增加特异性。这些构建体的靶位点将会映射到鉴定出的gRNA指定位点,但是将会需要另外的结合基序如用于锌指结构域。在Mega-TAL的情况下,大范围核酸酶可以与TALE DNA-结合结构域融合。大范围核酸酶结构域可以增加特异性并且提供切割。类似地,灭活的或死亡Cas9(dCas9)可以与切割结构域融合并且需要sgRNA/Cas9靶位点和邻近结合位点用于融合的DNA-结合结构域。除了催化灭活之外,这很可能将会需要工程化dCas9的一些蛋白以便在没有另外的结合位点的情况下减少结合。

锌指核酸酶

锌指核酸酶(ZFN)是包含与II型核酸内切酶FokI的催化结构域连接的工程化锌指DNA结合结构域的模块化蛋白质。因为FokI仅起到二聚体的作用,所以一对ZFN必须被工程化以与相反DNA链上的同源靶“半位点”序列结合并且在其之间具有精确间隔以使催化活性FokI二聚体能够形成。在二聚化本身不具有序列特异性的FokI结构域时,作为基因组编辑的初始步骤,在ZFN半位点之间产生DNA双链断裂。

每个ZFN的DNA结合结构域通常包含具有丰富的Cys2-His2架构的3-6个锌指,每个锌指主要识别靶DNA序列的一条链上的核甘酸三联体,但是与第四个核苷酸的跨链相互作用可能也很重要。锌指的氨基酸在与DNA进行关键接触的位置上的改变使给定锌指的序列特异性发生改变。因此,四指锌指蛋白将选择性地识别12bp靶序列,其中靶序列是由每个锌指贡献的三联体偏好的复合物,但是三联体偏好可以在不同程度上受邻近锌指的影响。ZFN的重要方面是,ZFN可以仅通过修饰单独的锌指容易地重新靶向几乎任何基因组地址,但是做好这一点需要相当多的专业知识。在ZFN的大多数应用中,使用了具有4-6个锌指的蛋白,从而分别识别出12-18bp。因此,一对ZFN将通常识别24-36bp的组合靶序列,不包含半位点之间的典型的5-7bp间隔。结合位点可以进一步以较大间隔分开,包含15-17bp。这种长度的靶序列可能在人类基因组中是唯一的,假设在设计过程期间不包含重复序列或基因同源物的话。然而,ZFN蛋白-DNA相互作用在其特异性上并非是绝对的,因此脱靶结合和切割事件作为这两个ZFN之间的异质二聚体或者作为ZFN中的一个或另一个的同源二聚体而发生。已经通过工程化FokI结构域的二聚化界面以创建“加”和“减”变体(也被称为专性异质二聚体变体)有效地消除了后一种可能性,所述专性异质二聚体变体仅可以彼此二聚化,而不与自身二聚化。强加专性异质二聚体防止形成同源二聚体。这大大增强了ZFN以及采用这些FokI变体的任何其它核酸酶的特异性。

本领域中已经描述了各种基于ZFN的系统,定期报告其修改,并且许多参考文献描述了用于引导ZFN设计的规则和参数。参见例如,Segal等人,《美国国家科学院院刊》96(6):2758-63(1999);Dreier B等人,《分子生物学杂志》303(4):489-502(2000);Liu Q等人,《生物化学杂志(J Biol Chem.)》277(6):3850-6(2002);Dreier等人,《生物化学杂志》280(42):35588-97(2005);以及Dreier等人,《生物化学杂志》276(31):29466-78(2001)。

转录激活子样效应核酸酶(TALEN)

TALEN表示模块化核酸酶的另一种格式,由此与ZFN一样,工程化的DNA结合结构域与FokI核酸酶结构域连接,并且一对TALEN前后操作以实现靶向DNA切割。与ZFN的主要区别是DNA结合结构域的性质以及关联的靶DNA序列识别性能。TALEN DNA结合结构域源自于起初在植物细菌性病原体黄单胞菌属(Xanthomonas sp.)中描述的TALE蛋白。TALE包含具有33-35个氨基酸重复的串联阵列,每个重复识别靶DNA序列中的单个碱基对,所述单个碱基对的长度通常高达20bp,从而给出了高达40bp的总靶序列长度。每个重复的核苷酸特异性由重复可变双残基(RVD)确定,所述RVD仅包含位置12和13处的两个氨基酸。碱基鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶主要分别由四种RVD识别:Asn-Asn、Asn-Ile、His-Asp和Asn-Gly。这构成了比针对锌指更简单的识别代码,并且因此表示针对核酸酶设计优于后者。然而,与ZFN一样,TALEN的蛋白-DNA相互作用在其特异性上并非是绝对的,并且TALEN还得益于使用FokI结构域的专性异质二聚体变体来减少脱靶活性。

已经产生了FokI结构域的在催化功能中灭活的另外变体。如果TALEN或ZFN对的一半含有失活FokI结构域,则仅单链DNA切割(切口)而非DSB将在靶位点处发生。结果与使用其中Cas9切割结构域之一已经被灭活的CRISPR/Cas9或CRISPR/Cpf1“切口酶”突变体相当。DNA切口可以用于由HDR驱动基因组编辑,但是比使用DSB效率更低。主要益处是脱靶切口被快速且准确地修复,不像DSB,DSB容易发生NHEJ介导的错误修复。

本领域中已经描述了各种基于TALEN的系统,并且定期报告其修改;参见例如,Boch,《科学》326(5959):1509-12(2009);Mak等人,《科学》335(6069):716-9(2012);以及Moscou等人,《科学》326(5959):1501(2009)。已经通过多个群组描述了基于“Golden Gate”平台或克隆方案对TALEN的使用;参见例如,Cermak等人,《核酸研究》39(12):e82(2011);Li等人,《核酸研究》39(14):6315-25(2011);Weber等人,《公共科学图书馆综合(PLoS One.)》6(2):e16765(2011);Wang等人,《遗传学与基因组学杂志(J Genet Genomics)》41(6):339-47,电子出版2014年5月17日(2014);以及Cermak T等人,《分子生物学方法(Methods MolBiol.)》1239:133-59(2015)。

归巢核酸内切酶

归巢核酸内切酶(HE)是序列特异性核酸内切酶,所述序列特异性核酸内切酶具有长识别序列(14-44个碱基对)并且经常在基因组中独特的位点处以高特异性切割DNA。存在至少六个如由其结构分类的已知HE家族,包含GIY-YIG、His-Cis盒、H-N-H、PD-(D/E)xK以及源自广泛范围的宿主的Vsr类,所述宿主包含真核生物、原生生物、细菌、古菌、蓝藻细菌和噬菌体。与ZFN和TALEN一样,HE可以用于作为基因组编辑中的初始步骤在靶基因座处产生DSB。另外,一些天然和工程化HE仅切断DNA的单链,由此充当位点特异性切口酶。HE的大靶序列和其提供的特异性使其成为用于产生位点特异性DSB的有吸引力的候选物。

本领域中已经描述了各种基于HE的系统,并且定期报告其修改;参见例如,Steentoft等人的评述,《糖生物学(Glycobiology)》24(8):663-80(2014);Belfort和Bonocora,《分子生物学方法》1123:1-26(2014);Hafez和Hausner,《基因组(Genome)》55(8):553-69(2012);以及其中引用的参考文献。

MegaTAL/Tev-mTALEN/MegaTev

如杂合核酸酶的进一步实例,MegaTAL平台和Tev-mTALEN平台使用了TALE DNA结合结构域与催化活性HE的融合物,从而利用了TALE的可调DNA结合和的特异性两者,连同HE的切割序列特异性;参见例如,Boissel等人,《NAR》42:2591-2601(2014);Kleinstiver等人,《G3》4:1155-65(2014);以及Boissel和Scharenberg,《分子生物学方法》1239:171-96(2015)。

在进一步变体中,MegaTev架构是大范围核酸酶(Mega)与源自GIY-YIG归巢核酸内切酶的核酸酶结构域的融合物I-TevI(Tev)。这两个活性位点被定位在DNA基质上相隔~30bp并且产生具有不相容的粘合末端的两个DSB;参见例如,Wolfs等人,《NAR》42,8816-29(2014)。预期现有的基于核酸酶的方法的其它组合将进化并且在实现本文所描述的靶向基因组修饰时有用。

dCas9-FokI或dCpf1-Fok1以及其它核酸酶

结合上述核酸酶平台的结构和功能性质提供了用于基因组编辑的另外方法,所述另外方法可以潜在地克服固有缺陷中的一些缺陷。作为实例,CRISPR基因组编辑系统通常使用单个Cas9核酸内切酶来产生DSB。靶向的特异性由经历与靶DNA的Watson-Crick碱基配对的向导RNA中的20或24核苷酸序列驱动(加上在来自化脓性链球菌的Cas9的情况下相邻NAG或NGG PAM序列中的另外2个碱基)。这种序列足够长以在人类基因组中是唯一的,然而,RNA/DNA相互作用的特异性并非是绝对的,极大的混杂有时是可耐受的,特别是在靶序列的一半处的5'端中,从而有效地减少了驱动特异性的碱基数量。对此的一种解决方案是将Cas9或Cpf1催化功能完全灭活—仅保留RNA引导的DNA结合功能—并且代替地将FokI结构域与灭活的Cas9融合;参见例如,Tsai等人,《自然生物技术》32:569-76(2014);以及Guilinger等人,《自然生物技术》32:577-82(2014)。因为FokI必须二聚化以变得具有催化活性,所以需要两个向导RNA来很靠近地拴系两个FokI融合物以形成二聚体并切割DNA。这本质上使组合的靶位点中的碱基数量加倍,由此增加了由基于CRISPR的系统进行的靶向的严格度。

作为进一步实例,TALE DNA结合结构域与催化活性HE的融合物如I-TevI利用了TALE的可调DNA结合和特异性两者以及I-TevI的切割序列特异性,期望可以进一步减少脱靶切割。

VII.试剂盒

本公开提供了用于实施本文所描述的方法的试剂盒。试剂盒可以包含以下中的一个或多个:基因组靶向核酸、对基因组靶向核酸进行编码的多核苷酸、定点多肽、对定点多肽进行编码的多核苷酸和/或实施本文所描述的方法的各方面所必需的任何核酸或蛋白质分子、或其组合。

试剂盒可以包括:(1)包括对基因组靶向核酸进行编码的核苷酸序列的载体;(2)定点多肽或包括对定点多肽进行编码的核苷酸序列的载体;以及(3)用于重构和/或稀释一个或多个载体和/或多肽的试剂。

试剂盒可以包括:(1)包括(i)对基因组靶向核酸进行编码的核苷酸序列和(ii)对定点多肽进行编码的核苷酸序列的载体;以及(2)用于重构和/或稀释载体的试剂。

在以上试剂盒中的任何试剂盒中,试剂盒可以包括单分子指导基因组靶向核酸。在以上试剂盒中的任何试剂盒中,试剂盒可以包括双分子基因组靶向核酸。在以上试剂盒中的任何试剂盒中,试剂盒可以包括两个或更多个双分子向导或单分子向导。试剂盒可以包括对核酸靶向核酸进行编码的载体。

在以上试剂盒中的任何试剂盒中,试剂盒可以进一步包括待***以实现期望的基因修饰的多核苷酸。

试剂盒的组分可以在单独容器中或组合到单个容器中。

上述任何试剂盒可以进一步包括一种或多种另外的试剂,其中这种另外的试剂选自缓冲液、用于将多肽或多核苷酸引入到细胞中的缓冲液、洗涤缓冲液、对照试剂、对照载体、对照RNA多核苷酸、用于在体外由DNA产生多肽的试剂、用于测序的衔接子等。缓冲液可以是稳定缓冲液、重构缓冲液、稀释缓冲液等。试剂盒还可以包括可以用于促进或增强中靶结合或通过核酸内切酶来切割DNA或改进靶向特异性的一种或多种组分。

除了以上提及的组分之外,试剂盒可以进一步包括用于使用试剂盒的组分实践所述方法的说明书。用于实践所述方法的说明书可以记录在适合的记录介质上。例如,说明书可以印刷在如纸或塑料等基底上。说明书可以作为包装插页、试剂盒的容器的标签或其部件(即与包装或次包装相关联)等存在于试剂盒中。说明书可以作为存在于适合的计算机可读存储介质上的电子存储数据文件而存在,所述适合的计算机可读存储介质例如CD-ROM、磁盘、闪存驱动器等。在一些情况下,实际说明书不存在于试剂盒中,但是可以提供用于从远程来源(例如经由互联网)获得说明书的手段。这种情况的实例是包括网址的试剂盒,可以在所述网址查看说明书和/或可以从所述网址下载说明书。正如说明书一样,用于获得说明的这一手段可以记录在适合的基底上。

VIII.具体方法和组合物

因此,本公开具体地涉及根据本公开的以下非限制性方法:在第一种方法即方法1中,本公开提供了用于通过基因组编辑来编辑细胞中的血管生成素样3(ANGPTL3)基因的方法,所述方法包括将一种或多种脱氧核糖核酸(DNA)核酸内切酶引入到细胞中以在ANGPTL3基因或ANGPTL3调节元件内或附近实现一个或多个单链断裂(SSB)或双链断裂(DSB)的步骤,所述步骤导致ANGPTL3基因内或附近至少一个核苷酸的一个或多个永久性***、缺失或突变,从而减少或消除了ANGPTL3基因产物的表达或功能。

在另一种方法即方法2中,本公开提供了用于治疗患有ANGPTL3相关病状或病症的患者的离体方法,所述方法包括以下步骤:从患者体内分离肝细胞;在肝细胞的ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近进行编辑;以及将经过基因组编辑的肝细胞植入到患者体内。

在另一种方法即方法3中,本公开提供了根据方法2所述的方法,其中编辑步骤包括将一种或多种脱氧核糖核酸(DNA)核酸内切酶引入到肝细胞中以在ANGPTL3基因或ANGPTL3调节元件内或附近实现一个或多个单链断裂(SSB)或双链断裂(DSB),所述引入导致ANGPTL3基因内或附近至少一个核苷酸的一个或多个永久性***、缺失或突变,从而减少或消除了ANGPTL3基因产物的表达或功能。

在另一种方法即方法4中,本公开提供了用于治疗患有ANGPTL3相关病状或病症的患者的离体方法,所述方法包括以下步骤:产生患者特异性诱导性多能干细胞(iPSC);在iPSC的ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近进行编辑;将经过基因组编辑的iPSC分化为肝细胞;以及将肝细胞植入到患者体内。

在另一种方法即方法5中,本公开提供了根据方法4所述的方法,其中编辑步骤包括将一种或多种脱氧核糖核酸(DNA)核酸内切酶引入到iPSC中以在ANGPTL3基因或ANGPTL3调节元件内或附近实现一个或多个单链断裂(SSB)或双链断裂(DSB),所述引入导致ANGPTL3基因内或附近至少一个核苷酸的一个或多个永久性***、缺失或突变,从而减少或消除了ANGPTL3基因产物的表达或功能。

在另一种方法即方法6中,本公开提供了用于治疗患有ANGPTL3相关病状或病症的患者的离体方法,所述方法包括以下步骤:从患者体内分离间充质干细胞;在间充质干细胞的ANGPTL3基因或对ANGPTL3基因的调节元件进行编码的其它DNA序列内或附近进行编辑;将经过基因组编辑的间充质干细胞分化为肝细胞;以及将肝细胞植入到患者体内。

在另一种方法即方法7中,本公开提供了根据方法6所述的方法,其中编辑步骤包括将一种或多种脱氧核糖核酸(DNA)核酸内切酶引入到间充质干细胞中以在ANGPTL3基因或ANGPTL3调节元件内或附近实现一个或多个单链断裂(SSB)或双链断裂(DSB),所述引入导致ANGPTL3基因内或附近至少一个核苷酸的一个或多个永久性***、缺失或突变,从而减少或消除了ANGPTL3基因产物的表达或功能。

在另一种方法即方法8中,本公开提供了用于治疗患有ANGPTL3相关病症的患者的体内方法,所述方法包括对患者细胞中的ANGPTL3基因进行编辑的步骤。

在另一种方法即方法9中,本公开提供了根据方法8所述的方法,其中编辑步骤包括将一种或多种脱氧核糖核酸(DNA)核酸内切酶引入到细胞中以在ANGPTL3基因或ANGPTL3调节元件内或附近实现一个或多个单链断裂(SSB)或双链断裂(DSB),所述引入导致ANGPTL3基因内或附近至少一个核苷酸的一个或多个永久性***、缺失或突变,从而减少或消除了ANGPTL3基因产物的表达或功能。

在另一种方法即方法10中,本公开提供了根据方法8到9中的任何一种方法所述的方法,其中细胞是肝细胞。

在另一种方法即方法11中,本公开提供了根据方法10所述的方法,其中通过局部注射、全身输注或其组合将所述一种或多种脱氧核糖核酸(DNA)核酸内切酶递送到肝细胞。

在另一种方法即方法12中,本公开提供了改变细胞中的ANGPTL3基因的连续基因组序列的方法,所述方法包括使细胞与一种或多种脱氧核糖核酸(DNA)核酸内切酶相接触以实现一个或多个单链断裂(SSB)或双链断裂(DSB)。

在另一种方法即方法13中,本公开提供了根据方法12所述的方法,其中连续基因组序列的改变发生在ANGPTL3基因的一个或多个外显子中。

在另一种方法即方法14中,本公开提供了根据方法1到13中的任何一种方法所述的方法,其中所述一种或多种脱氧核糖核酸(DNA)核酸内切酶选自SEQ ID NO:1-620中列出的那些序列中的任何一个序列和与SEQ ID NO:1-620中列出的那些序列中的任何一个序列有至少70%同源性的变体。

在另一种方法即方法15中,本公开提供了根据方法14所述的方法,其中所述一种或多种脱氧核糖核酸(DNA)核酸内切酶是一种或多种蛋白质或多肽。

在另一种方法即方法16中,本公开提供了根据方法14所述的方法,其中所述一种或多种脱氧核糖核酸(DNA)核酸内切酶是对所述一种或多种DNA核酸内切酶进行编码的一种或多种多核苷酸。

在另一种方法即方法17中,本公开提供了根据方法16所述的方法,其中所述一种或多种脱氧核糖核酸(DNA)核酸内切酶是对所述一种或多种DNA核酸内切酶进行编码的一种或多种核糖核酸(RNA)。

在另一种方法即方法18中,本公开提供了根据方法17所述的方法,其中所述一种或多种核糖核酸(RNA)是一种或多种经过化学修饰的RNA。

在另一种方法即方法19中,本公开提供了根据方法18所述的方法,其中所述一种或多种核糖核酸(RNA)在编码区域中进行化学修饰。

在另一种方法即方法20中,本公开提供了根据方法16到19中的任何一种方法所述的方法,其中所述一种或多种多核苷酸或者所述一种或多种核糖核酸(RNA)是经过密码子优化的。

在另一种方法即方法21中,本公开提供了根据方法1到20中的任何一种方法所述的方法,其中所述方法进一步包括将一种或多种gRNA或者一种或多种sgRNA引入到细胞中。

在另一种方法即方法22中,本公开提供了根据方法21所述的方法,其中所述一种或多种gRNA或者所述一种或多种sgRNA包括与ANGPTL3基因的编码序列的区段互补的间隔序列。

在另一种方法即方法23中,本公开提供了根据方法21所述的方法,其中所述一种或多种gRNA或者所述一种或多种sgRNA包括与ANGPTL3基因侧翼的序列或对ANGPTL3基因的调节元件进行编码的其它序列互补的间隔序列。

在另一种方法即方法24中,本公开提供了根据方法21到23中的任何一种方法所述的方法,其中所述一种或多种gRNA或者所述一种或多种sgRNA是经过化学修饰的。

在另一种方法即方法25中,本公开提供了根据方法21到24中的任何一种方法的方法,其中所述一种或多种gRNA或者所述一种或多种sgRNA与所述一种或多种脱氧核糖核酸(DNA)核酸内切酶预先复合。

在另一种方法即方法26中,本公开提供了根据方法25所述的方法,其中预先复合涉及所述一种或多种gRNA或者所述一种或多种sgRNA与所述一种或多种脱氧核糖核酸(DNA)核酸内切酶的共价附接。

在另一种方法即方法27中,本公开提供了根据方法14到26中的任何一种方法所述的方法,其中将所述一种或多种脱氧核糖核酸(DNA)核酸内切酶调配成脂质体或脂质纳米颗粒。

在另一种方法即方法28中,本公开提供了根据方法21到27中的任何一种方法所述的方法,其中将所述一种或多种脱氧核糖核酸(DNA)核酸内切酶调配成脂质体或脂质纳米颗粒,所述脂质体或脂质纳米颗粒还包括所述一种或多种gRNA或者所述一种或多种sgRNA。

在另一种方法即方法29中,本公开提供了根据方法12或21到23中的任何一种方法所述的方法,其中所述一种或多种脱氧核糖核酸(DNA)核酸内切酶在AAV载体颗粒中编码,其中AAV载体血清型选自SEQ ID NO:4,734-5,302和表2中列出的那些。

在另一种方法即方法30中,本公开提供了根据方法21到23中的任何一种方法所述的方法,其中所述一种或多种gRNA或者所述一种或多种sgRNA在AAV载体颗粒中编码,其中AAV载体血清型选自SEQ ID NO:4,734-5,302和表2中列出的那些。

在另一种方法即方法31中,本公开提供了根据方法21到23中的任何一种方法所述的方法,其中所述一种或多种脱氧核糖核酸(DNA)核酸内切酶在AAV载体颗粒中编码,所述AAV载体颗粒还对所述一种或多种gRNA或者所述一种或多种sgRNA进行编码,其中AAV载体血清型选自SEQ ID NO:4,734-5,302和表2中列出的那些。

本公开还提供了组合物即组合物1,组合物1包括单分子向导RNA,所述单分子向导RNA包括至少间隔序列,所述间隔序列是对应于SEQ ID NO:5305-17018中的任何一个的RNA序列。

在另一种组合物即组合物2中,本公开提供了根据组合物1所述的单分子向导RNA,其中单分子向导RNA进一步包括间隔延伸区。

在另一种组合物即组合物3中,本公开提供了根据组合物1所述的单分子向导RNA,其中单分子向导RNA进一步包括tracrRNA延伸区。

在另一种组合物即组合物4中,本公开提供了根据组合物1到3所述的单分子向导RNA,其中单分子向导RNA是经过化学修饰的。

在另一种组合物即组合物5中,本公开提供了根据组合物1到4所述的单分子向导RNA,其中单分子向导RNA与DNA核酸内切酶预先复合。

在另一种组合物即组合物6中,本公开提供了根据组合物5所述的单分子向导RNA,其中DNA核酸内切酶是Cas9或Cpf1核酸内切酶。

在另一种组合物即组合物7中,本公开提供了根据组合物6所述的单分子向导RNA,其中Cas9或Cpf1核酸内切酶选自化脓性链球菌Cas9、金黄色葡萄球菌Cas9、脑膜炎奈瑟氏菌Cas9、嗜热链球菌CRISPR1Cas9、嗜热链球菌CRISPR 3Cas9、齿垢密螺旋体Cas9、毛螺科菌ND2006Cpf1和氨基酸球菌属(Acidaminococcus sp.)BV3L6Cpf1以及与这些酶有至少70%同源性的变体。

在另一种组合物即组合物8中,本公开提供了根据组合物7所述的单分子向导RNA,其中Cas9或Cpf1酶包括一个或多个核定位信号(NLS)。

在另一种组合物即组合物9中,本公开提供了根据组合物8所述的单分子向导RNA,其中至少一个NLS位于Cas9或Cpf1核酸内切酶的氨基端的50个氨基酸处或内,和/或至少一个NLS位于Cas9或Cpf1核酸内切酶的羧基端的50个氨基酸处或内。

在另一种组合物即组合物10中,本公开提供了根据组合物9所述的单分子向导RNA,其中Cas9或Cpf1核酸内切酶经过密码子优化以表达在真核细胞中。

在另一种组合物即组合物11中,本公开提供了对根据组合物1到3所述的单分子向导RNA进行编码的DNA。

在另一种组合物即组合物12中,本公开提供了对根据组合物8到10所述的CRISPR/Cas系统进行编码的DNA。

在另一种组合物即组合物13中,本公开提供了包括根据组合物11或12所述的DNA的载体。

在另一种组合物即组合物14中,本公开提供了根据组合物13所述的载体,其中载体是质粒。

在另一种组合物即组合物15中,本公开提供了根据组合物13所述的载体,其中载体是AAV载体颗粒,并且AAV载体血清型选自SEQ ID NO:4,734-5,302和表2中列出的那些。

IX.定义

术语“包括”是参考对于本发明来说关键但可能包括未指定要素(无论是否关键)的组合物、方法及其一个或多个对应组分而使用的。

术语“基本上由…组成”是指给定方面所需的那些要素。所述术语允许并不实质影响本发明的所述方面的一个或多个基本且新颖或功能特性的另外要素存在。

术语“由…组成”是指如本文所描述的组合物、方法及其对应组分,所述组合物、方法及其对应组分不包括所述方面的所述描述中未叙述的任何要素。

除非上下文清楚地另外指明,否则单数形式“一个/种(a/an)”和“所述(the)”包含复数指示物。

本文中呈现的某些数值以术语“约”为先导。术语“约”意指在所叙述数值的±10%内的数值。

当本文中呈现了数值范围时,设想的是,在所述范围的下限与上限之间的每个中间值、作为所述范围的上限和下限的值、以及在所述范围内的所有所陈述值都涵盖于本公开内。本公开还设想了在所述范围的下限和上限内的所有可能子范围。

以下所附描述中阐述了本发明的一个或多个实施例的细节。虽然与本文所描述的那些材料和方法类似或等同的任何材料和方法均可以用于实践或测试本公开,但是现在描述了优选的材料和方法。根据描述,本发明的其它特征、目的和优点将变得显而易见。在描述中,除非上下文另有明确规定,否则单数形式还包含复数形式。除非另外定义,否则本文所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的含义相同的含义。在冲突的情况下,以本说明书为准。

本说明书中叙述的任何数值范围描述了包含在所叙述范围内的相同数值精度(即,具有相同数量的指定数字)的所有子范围。例如,所叙述范围“1.0到10.0”描述了在所叙述最小值1.0与所叙述最大值10.0之间(并且包含1.0和10.0)的所有子范围,如例如“2.4到7.6”,即使范围“2.4到7.6”在本说明书的文本中并未明确叙述。因此,申请人保留修改本说明书(包含权利要求书)的权利,以明确地叙述包含在本说明书中明确叙述的范围内的相同数值精度的任何子范围。本说明书中对所有这种范围进行了固有的描述,使得用于明确叙述任何这种子范围的修订将符合书面描述、描述的充分性和附加事项要求,包含35U.S.C.§112(a)和第123(2)EPC条规定的要求。此外,除非上下文明确指出或另有要求,否则本说明书中描述的所有数值参数(如表达值、范围、数量、百分比等的那些参数)可以被读作好像以词语“约”为前缀那样,即使词语“约”并未明确地出现在数字之前。另外,本说明书中描述的数值参数应当根据报告的有效数字的数量、数值精度和通过应用普通的舍入技术来解释。还应理解的是,本说明书中描述的数值参数必然具有用于确定参数的数值的基础测量技术的固有可变性特性。

以下所附描述中阐述了本公开的一个或多个方面的细节。虽然与本文所描述的那些材料和方法类似或等同的任何材料和方法均可以用于实践或测试本公开,但是现在描述了优选的材料和方法。根据描述,本公开的其它特征、目的和优点将变得显而易见。在描述中,除非上下文另有明确规定,否则单数形式还包含复数形式。除非另外定义,否则本文所使用的所有技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解的含义相同的含义。在冲突的情况下,以本说明书为准。

通过以下非限制性实例进一步展示本发明。

X.实例

通过参考以下实例将更完整地理解本发明,所述实例提供了本公开的说明性非限制性方面。

实例描述了使用CRISPR系统作为说明性基因组编辑技术在ANGPLT3基因中产生导致ANGPLT3基因永久性缺失或突变的定义的治疗性基因组缺失、***或替换,在本文中称为“基因组修饰”,所述基因组修饰减少或消除了ANGPLT3蛋白活性。对定义的治疗性修饰的引入表示用于潜在地减轻血脂异常的新颖治疗策略,如本文所描述和展示的。

实例1—ANGPTL3基因的CRISPR/SpCas9靶位点

对ANGPTL3基因的区域进行靶位点扫描。扫描每个区域的具有序列NRG的原型间隔邻近基序(PAM)。然后鉴别出对应于PAM的gRNA 20bp间隔序列,如序列表中的SEQ ID NO:6,634-10,171所示。

实例2—ANGPTL3基因的CRISPR/SaCas9靶位点

对ANGPTL3基因的区域进行靶位点扫描。扫描每个区域的具有序列NNGRRT的原型间隔邻近基序(PAM)。然后鉴别出对应于PAM的gRNA 20bp间隔序列,如序列表中的SEQ IDNO:5,596-6,079-10,171所示。

实例3—ANGPTL3基因的CRISPR/StCas9靶位点

对ANGPTL3基因的区域进行靶位点扫描。扫描每个区域的具有序列NNAGAAW的原型间隔邻近基序(PAM)。然后鉴别出对应于PAM的gRNA 20bp间隔序列,如序列表中的SEQ IDNO:5,399-5,595所示。

实例4—ANGPTL3基因的CRISPR/TdCas9靶位点

对ANGPTL3基因的区域进行靶位点扫描。扫描每个区域的具有序列NAAAAC的原型间隔邻近基序(PAM)。然后鉴别出对应于PAM的gRNA 20bp间隔序列,如序列表中的SEQ IDNO:5,305-5,398所示。

实例5—ANGPTL3基因的CRISPR/NmCas9靶位点

对ANGPTL3基因的区域进行靶位点扫描。扫描每个区域的具有序列NNNNGATT的原型间隔邻近基序(PAM)。然后鉴别出对应于PAM的gRNA 20bp间隔序列,如序列表中的SEQ IDNO:6,080-6,633所示。

实例6—ANGPTL3基因的CRISPR/Cpf1靶位点

对ANGPTL3基因的区域进行靶位点扫描。扫描每个区域的具有序列TTN或YTN的原型间隔邻近基序(PAM)。然后鉴别出对应于PAM的gRNA 22bp间隔序列,如序列表中的SEQ IDNO:10,172-17,018所示。

实例7—对向导链的生物信息学分析

然后,在单个过程或多步骤过程中筛选和选择候选向导,所述单个过程或所述多步骤过程涉及理论结合和实验评估的中靶位点和脱靶位点活性两者。通过说明的方式,使用如以下更详细地描述和展示的用于评估脱靶结合的各种生物信息学工具中的一种或多种工具,对具有将如ANGPTL3基因内的位点等特定中靶位点与相邻PAM相匹配的序列的候选向导在具有类似序列的脱靶位点处进行切割的可能性进行评估,以便评估除了预期染色***置之外的染色***置处的效果的可能性。

然后以实验方式对预测具有相对较低脱靶活性可能性的候选物进行评估以测量其中靶活性并且然后测量在各个位点处的脱靶活性。优选的向导具有足够高的中靶活性以在所选基因座处实现期望水平的基因编辑,并且具有相对较低的脱靶活性以降低在其它染色体基因座处发生改变的可能性。中靶活性与脱靶活性之比常被称为向导的“特异性”。

针对预测的脱靶活性的初始筛选,存在许多已知且公共可获得的生物学信息工具,所述生物学信息工具可以用于预测最可能的脱靶位点;并且由于与CRISPR/Cas9或CRISPR/Cpf1核酸酶系统中的靶位点的结合是由互补序列之间的Watson-Crick碱基配对驱动的,因此相异程度(以及因此降低的脱靶结合可能性)基本上与主要序列差异相关:错配和凸起即改变为非互补碱基的碱基、以及碱基相对于靶位点在潜在脱靶位点中的***或缺失。被称为COSMID(具有错配、***和缺失的CRISPR脱靶位点)(可在web上通过crispr.bme.gatech.edu获得)的示例性生物信息学工具符合这种相似性。其它生物信息学工具包含但不限于autoCOSMID和CCtop。

生物信息学被用于使脱靶切割最小化以便减少突变和染色体重排的有害作用。对CRISPR/Cas9系统的研究表明了由于向导链与具有碱基对错配和/或凸起、特别是在远离PAM区域的位置处具有碱基对错配和/或凸起的DNA序列的非特异性杂交而产生高脱靶活性的可能性。因此,重要的是具有这样的生物学信息工具,所述生物学信息工具可以鉴别出除了碱基对错配之外在RNA向导链与基因组序列之间具有***和/或缺失的潜在脱靶位点。基于脱靶预测算法的生物信息学工具CCTop被用于搜索潜在的CRISPR脱靶位点的基因组(CCTop可在web上通过crispr.cos.uni-heidelberg.de/获得)。COSMID基于错配的数量和位置输出经排序的潜在脱靶位点列表,从而允许对靶位点有更知情选择并且避免使用具有更可能发生脱靶切割的位点。

采用了考虑了区域中的gRNA靶向位点的估计中靶活性和/或脱靶活性的另外的生物信息学流水线。可以用于预测活性的其它特征包含关于所讨论细胞类型的信息、DNA可达性、染色质状态、转录因子结合位点、转录因子结合数据、以及其它CHIP-seq数据。考虑了预测编辑效率的另外的因子,如gRNA对的相对位置和方向、局部序列特征、以及微同源性。

CRISPR/Cas9靶位点的初始评估和筛选集中于ANGPTL3~200bp 5'上游序列、外显子1-6(7个外显子中)和内含子1-6的区域。评估全内含子序列,或者评估在外显子-内含子接合的近端的~100-300bp序列的大内含子。外显子序列内的gRNA可以用于产生通过改变蛋白质序列和/或截断蛋白质导致蛋白质功能丧失的***缺失。5'UTR序列中的gRNA可以单独地或与外显子内的gRNA组合地用于去除翻译起始位点并防止蛋白质合成。内含子中的gRNA可以单独地或与外显子内的gRNA组合地用于去除导致产生截短的蛋白质和随后功能丧失的剪接供体和受***点。

初始生物信息学分析鉴别出了靶向ANGPTL3基因的大约203个向导。进一步分析了这一向导子集。消除了具有预测的脱靶位点(1或2个错配)的向导,并且还消除了与次要等位基因频率>0.0002的SNP重叠的向导。我们还基于gRNA在Angptl3序列中的位置将gRNA优先化以进行筛选;优先考虑了靶向5'外显子的gRNA。这一分析使具有192个向导的池将用于基于体外转录的向导筛选方案的向导按优先顺序列出(表7)。

实例8—测试细胞中的优选向导的中靶活性

为了鉴别出能够编辑同源DNA靶区域的大范围的gRNA,进行了体外转录(IVT)gRNA筛选。提交了相关基因组序列以供使用gRNA设计软件进行分析。基于序列的唯一性(仅筛选了在基因组中的其它地方不具有最佳匹配的gRNA)和最小预测脱靶将所得gRNA列表缩减为具有约200个gRNA的列表。这组gRNA在体外被转录,并用Lipofectamine MessengerMAX转染到组成性地表达Cas9的HEK293T细胞中。在转染后48小时收集细胞,分离基因组DNA,并且用TIDE分析对切割效率进行评估(图2-4)。

从在HEK细胞中筛选的192个向导中,我们鉴别出了具有高编辑效率和低CCTop脱靶得分的向导(表7和图2-4)。

然后随访培养的细胞中具有显著活性的gRNA以测量ANGPTL3基因的变化(实例11-13)。具体地,选择特异性地靶向人类ANGPTL3序列的两个向导和靶向人类和猴子(交叉反应性)ANGPTL3(与可获得的食蟹猴和恒河猴ANGPTL3序列100%匹配)的两个gRNA用于下文所描述的体外编辑实验(参见例如表8)。可以再次跟踪脱靶事件。可以转染多种细胞,并且测量基因编辑水平和可能的脱靶事件。这些实验允许优化核酸酶和供体设计和递送。

表7.HEK293T细胞中的gRNA序列和切割效率(胸腺嘧啶可以用这些序列中的任何一个中的尿嘧啶取代,以生成对应的向导RNA序列)。

Figure BDA0002242567760001161

Figure BDA0002242567760001171

Figure BDA0002242567760001181

Figure BDA0002242567760001191

Figure BDA0002242567760001201

Figure BDA0002242567760001211

Figure BDA0002242567760001221

Figure BDA0002242567760001231

Figure BDA0002242567760001241

Figure BDA0002242567760001251

实例10—靶向ANGPTL3的gRNA在原代肝细胞中的交叉反应活性

这个实例展现了在通过包括Cas9 mRNA和gRNA的脂质体转染试剂(lipofectamine)转染复合物进行敲除后从食蟹猴和人供体分离的原代肝细胞中ANGPTL3gRNA的高效交叉反应活性。

将从人和食蟹猴(马里兰州体外ADMET实验室(In Vitro ADMET Laboratories,Maryland))分离的原代肝细胞铺板在汇合的单层中,并用靶向ANGPTL3的Cas9 mRNA和gRNA进行转染。靶向ANGPTL3的gRNA由AXOLabs合成,使用以下格式对gRNA进行化学修饰:n*n*n*NNNNNNNNNNNNNNNNNGUUUUAGAgcuaGAAAuagcAAGUUAAAAUAAGGCUAGUCCGUUAUCaacuuGAAAaaguggcaccgagucggugcu*u*u*U,其中

大写字母:未经修饰的核苷酸;小写字母:具有2'-O-甲基修饰的核苷酸;n或N:任何核苷酸;*:硫代磷酸键(SEQ ID NO:17,058)。表8中示出了经过修饰的gRNA。

简而言之,将细胞以0.35×106个细胞/孔在24孔I型胶原蛋白包被板(康宁(Corning)Biocoat胶原蛋白I多孔板,目录号356408)中铺板成汇合的单层,并在37°℃下、在5%CO2中、在InVitroGRO平板培养基(BioreclamationIVT,Z990003)中进行培育。将肝细胞单层用gRNA与Cas9 mRNA复合地铺板后3-5小时进行转染。用人特异性或物种交叉反应性gRNA转染人肝细胞,并用物种交叉反应性gRNA转染猴肝细胞。以200ng的最终gRNA量,根据制造商的方案,使用LipofectamineTM MessengerMaxTM转染试剂(赛默飞世尔公司(ThermoFisher),目录号LMRNA003)执行gRNA的转染。

还用Lipofectamine MessengerMax转染肝细胞,而不使用Cas9和gRNA,以生成“MOCK”样本。另外,用已知以每个肝细胞物种已知范围的编辑效率(例如,:人肝细胞中的C3gRNA或猴肝细胞中的PCSK9 gRNA)持续活跃的每种肝细胞的Cas9 mRNA和gRNA对照物转染肝细胞。细胞在转染后16小时接受新鲜InVitroGRO培养基的培养基更换,并与gRNA-脂质体转染试剂复合物一起培育48小时,细胞此时根据制造商的方案在prepGEM(ZyGem公司)中溶解。

通过分解跟踪***缺失法(Tracking of Indels by Decomposition)(TIDE)来分析用Cas9和ANGPTL3 gRNA转染的肝细胞与MOCK转染子(对照组)(Brinkman EK,Chen T,Amendola M,van Steensel B,通过序列跟踪分解对基因组编辑进行简单的定量评估(Easyquantitative assessment of genome editing by sequence trace decomposition).《核酸研究》2014年12月16日;42(22):e168.doi:10.1093/nar/gku936),简而言之,使用KAPA HiFi PCR试剂盒将基因组DNA用作PCR模板。

用AxyPrep Mag PCR清洁试剂盒(爱思进公司(Axygen))纯化PCR扩增子。使用分解算法对扩增子进行测序和分析。测量gRNA活性作为与化脓性链球菌Cas9的预测切割位点(即,在非靶链上的PAM(NGG)上游的核苷酸-4与-3之间以及在靶链上的PAM互补序列(CCN)下游的3个与4个核苷酸之间)相邻的具有各种***缺失(1到50nt的***或1到50nt的缺失)的等位基因之比。

TIDE分析表明,ANGPTL3 gRNA EX2、T6和T9在人肝细胞中诱导~50%-60%的***缺失,而EX1gRNA平均诱导了<20%的效率(参见图5A)。交叉反应性向导T6和T9是活跃的并且在猴肝细胞中诱导基因编辑。gRNA T6具有最高的编辑效率,在猴肝细胞中具有>60%的***缺失(参见图5B)。

表8—ANGPTL3gRNA序列

Figure BDA0002242567760001281

实例11—在经过基因编辑的原代人肝细胞中的ANGPTL3蛋白分泌

这个实例展现了T6 gRNA的高效基因编辑与原代人肝细胞中分泌的ANGPTL3蛋白的减少之间的相关性。

将原代人肝细胞(体外ADMET实验室)以0.35×106个细胞/孔在24孔I型胶原蛋白包被板(康宁Biocoat胶原蛋白I多孔板,目录号356408)中铺板成汇合的单层,并在37°℃下、在5%CO2中、在InVitroGRO平板培养基(BioreclamationIVT,Z990003)中进行培育。将肝细胞单层在用ANGPTL3 T6 gRNA或C3 gRNA(高效地敲除人C3但不编辑ANGPTL3基因的非相关gRNA)与Cas9-mRNA复合地铺板后3-5小时进行转染。以200ng的最终gRNA量,根据制造商的方案,使用Lipofectamine MessengerMax执行gRNA的转染。还用LipofectamineMessengerMax转染肝细胞,而不使用Cas9 mRNA和gRNA,以生成“MOCK”样本。细胞在转染后16小时接受新鲜InVitroGRO培养基的培养基更换。将样本与gRNA-脂质体转染试剂复合物一起培育48小时,此时收集上清液以进行人ANGPTL3蛋白分析并将细胞根据制造商的方案在prepGEM(ZyGem公司)中溶解。

通过TIDE分析用Cas9和T6 gRNA或Cas9和C3 gRNA转染的肝细胞与“MOCK”转染子(对照组)。TIDE分析表明,ANGPTL3是由T6 gRNA(***缺失~60%)编辑的(图6A)。类似地,C3gRNA高效地编辑了人C3基因,在同一人供体中***缺失频率为~55%(图6A)。

使用针对人ANGPTL3蛋白的Sandwich酶联免疫吸附测定(ELISA)(人ANGPTL3ELISA试剂盒,R&D Systems公司,目录号DY3829)来检测从经过基因编辑的样本中收集的上清液中ANGPTL3蛋白的浓度。结果表明,在通过T6 gRNA编辑ANGPTL3基因时效率为~60%的来自原代肝细胞的上清液含有少于1ng/mL的ANGPTL3蛋白,相对于对照组,ANGPTL3蛋白水平显著降低(图6B)。对照组“MOCK”和C3分别表现出类似的ANGPTL3蛋白水平~2.8ng/ml(图6B)和~2.6ng/mL(图6B)。这个研究展现出,ANGPTL3基因的有效编辑导致原代肝细胞中分泌的ANGPTL3蛋白具有功能性减少。

为了增加用于ANGPTL3蛋白敲低的检测窗口,培养共培养的原代人肝细胞并用gRNA和Cas9进行转染。

在分离的鼠类3T3成纤维细胞存在的情况下将原代人肝细胞(体外ADMET实验室)以共培养格式培养(SN Bhatia,UJ Balis,ML Yarmush,M Toner.“细胞-细胞相互作用对保存细胞表型的作用:肝细胞和非实质细胞的共培养(Effect of cell-cell interactionsin preservation of cellular phenotype:cocultivation of hepatocytes andnonparenchymal cells)”,《美国实验生物学联合会会刊(The FASEB Journal)》13(14),1883-1900,SN Bhatia,ML Yarmush,M Toner.“控制细胞相互作用在共培养物中的微缩成像:肝细胞和3T3成纤维细胞(Controlling cell interactions of micropatterning inco-cultures:hepatocytes and 3T3fibroblasts)”,《生物医学材料研究杂志(J.Biomedical Materials Research)》34(2),189-199)在24孔I型胶原蛋白包被板(康宁Biocoat胶原蛋白I多孔板,目录号356408)中,并在37°℃下、在5%CO2中、在InVitroGRO平板培养基(BioreclamationIVT,Z990003)中进行培育。在用gRNA(表8)和Cas9 mRNA开始培养后24小时转染肝细胞共培养物。以200ng的最终gRNA量,根据制造商的方案,使用Lipofectamine MessengerMax执行gRNA的转染。还用Lipofectamine MessengerMax转染肝细胞。细胞在用gRNA-脂质体转染试剂复合物转染后6小时接受新鲜InVitroGRO培养基的培养基更换,并且每24小时更换一次持续10天。

通过TIDE分析用Cas9和T6 gRNA或Cas9和C3gRNA转染的共培养原代肝细胞与“MOCK”转染子(对照组)。TIDE分析表明,ANGPTL3是由T6 gRNA(***缺失~60%)编辑的(图7A)。类似地,C3gRNA高效地编辑了人C3基因,在同一人供体中***缺失频率为~52%(图7A)。这些数据展现了单培养和共培养格式的原代人肝细胞的一致编辑图谱。

使用针对人ANGPTL3蛋白的Sandwich酶联免疫吸附测定(ELISA)(人ANGPTL3ELISA试剂盒,R&D Systems公司,目录号DY3829)来检测从经过基因编辑的样本中收集的上清液中ANGPTL3蛋白的浓度。结果表明,在通过T6 gRNA编辑ANGPTL3基因时效率为~60%的来自原代肝细胞的上清液含有~1ng/mL的ANGPTL3蛋白,相对于对照组,ANGPTL3蛋白水平显著降低(图7B)。对照组“MOCK”和C3分别表现出类似的ANGPTL3蛋白水平~29ng/ml和~31ng/mL。共培养的原代肝细胞与单培养的肝细胞相比分泌了高5倍水平的ANGPTL3蛋白并且展现出ANGPTL3基因的破坏导致分泌的ANGPTL3蛋白强烈减少。

实例12—在经过基因编辑的原代猴肝细胞中的ANGPTL3蛋白分泌

这个实例展现了T6 gRNA的高效基因编辑与原代猴肝细胞中分泌的ANGPTL3蛋白的减少之间的相关性。

原代猴肝细胞(体外ADMET实验室)以0.35×106个细胞/孔在24孔I型胶原蛋白包被板(康宁Biocoat胶原蛋白I多孔板,目录号356408)中铺板成汇合的单层,并在37°℃下、在5%CO2中、在InVitroGRO平板培养基(BioreclamationIVT,Z990003)中进行培育。将肝细胞单层在用ANGPTL3 T6gRNA或PCSK9 gRNA(高效地敲除猴基因组中的PCSK9基因但不编辑ANGPTL3基因的非相关gRNA)与Cas9 mRNA复合地铺板后3-5小时进行转染。以200ng的最终gRNA量,根据制造商的方案,使用Lipofectamine MessengerMax执行gRNA的转染。还用Lipofectamine MessengerMax转染肝细胞,而不使用Cas9 mRNA和gRNA,以生成“MOCK”样本。细胞在转染后16小时接受新鲜InVitroGRO培养基的培养基更换。将样本与gRNA-脂质体转染试剂复合物一起培育48小时,此时收集上清液以进行人ANGPTL3蛋白分析并将细胞根据制造商的方案在prepGEM(ZyGem公司)中溶解。

通过TIDE分析用Cas9和T6 gRNA、T9 gRNA或PCSK9 gRNA转染的猴肝细胞与“MOCK”转染子(对照组)。TIDE分析表明,ANGPTL3是由T6 gRNA(***缺失~67%)和T9 gRNA(***缺失~29%)编辑的(图5B)。类似地,PCSK9 gRNA高效地编辑了猴PCSK9基因,在同一猴供体中***缺失频率为~41%(图5B)。

使用针对猴ANGPTL3蛋白的Sandwich酶联免疫吸附测定(ELISA)(猴ANGPTL3ELISA试剂盒,生命周期生物公司(LifeSpan Bio),目录号LS_F38518)来检测从经过基因编辑的样本中收集的上清液中ANGPTL3蛋白的浓度。结果表明,在通过T6 gRNA编辑ANGPTL3基因时效率为~67%的来自原代肝细胞的上清液含有少于1ng/mL的ANGPTL3蛋白,相对于对照组,ANGPTL3蛋白水平显著降低(图8)。对照组“MOCK”和C3分别表现出类似的ANGPTL3蛋白水平~3ng/ml和~2.5ng/mL。这个研究展现出通过交叉反应性gRNA T6对ANGPTL3基因进行有效编辑导致原代猴肝细胞中分泌的ANGPTL3蛋白具有功能性减少。

实例13—相关动物模型中的体内测试

在评估了CRISPR-Cas9/向导组合之后,将在动物模型体内测试主要调配物。

将在原代人肝细胞中的ANGPTL3基因中产生高效缺失的跨物种ANGPTL3 gRNA组合即Cas9 mRNA与gRNA的复合物调配成脂质纳米颗粒以用于递送。

在利用用于ANGPTL3抑制的单克隆抗体和反义寡核苷酸疗法获取了临床前数据时,将使用食蟹猴作为大型动物模型。这些疗法目前正在完成I/II期临床试验,以评估ANGPTL3抑制与家族性高胆固醇血症患者的甘油三酯、LDL-胆固醇和HDL-胆固醇的降低之间的相关性。

将与Cas9 mRNA和T6 gRNA复合的脂质纳米颗粒输注到猴子体内,并且在给药后第一天内每小时收集全血样本且在14天的时间内每三天收集一次。在给药前,还将进行基线全血收集。对照组将包含输注有盐水的动物。

将在整个研究过程中监测体重,并且将监测血浆和血清样本的细胞因子以及补体激活(炎症应答)和临床脂质组(总胆固醇、HDL、LDL-C和甘油三酯)。在14天结束时,将收集肝组织并评估ANGPTL3基因的基因编辑。

从对照动物和给药动物对肝组织均质化,并通过TIDE分析来分析有效ANGPTL3基因编辑的证据。

在研究过程中TIDE分析和脂质化学的结果将产生***缺失频率与胆固醇水平修改之间的相关性,重点在于主要生物学标记物LDL-C减少。

如上所述,在人细胞中的培养还允许直接测试人靶标和本底人基因组。

另外,可以通过将经过修饰的小鼠或人肝细胞移植到小鼠模型中来观察临床前功效和安全性评估。可以在移植后的几个月中观察经过修饰的细胞。

实例14—测试细胞中的优选向导的脱靶活性

除了其它方法之外,还使用杂交捕获测定、向导测序(GUIDE Seq)和全基因组测序对上述实例中来自IVT筛选的具有最佳中靶活性的gRNA进行脱靶活性测试。

XI.等同物和范围

本领域技术人员应当认识到或仅使用常规实验就能够确定根据本文所描述的本发明的具体实施例的很多等同物。本发明的范围并不旨在限于以上说明书,而是如所附的权利要求书中阐述的那样。

如果一组成员中的一个、多于一个或全部成员存在于、使用于或以其他方式关联给定的产品或过程,则包含所述组中的一个或多个成员“或”在所述组中的一个或多个成员之间的权利要求或描述被认为得到满足,除非有相反的指明或另外从上下文明显可见。本公开包含实施例,在所述实施例中,所述组中的恰好一个成员存在于、使用于或以其它方式关联给定的产品或过程。本公开包含实施例,在所述实施例中,所述组中多于一个或全部成员存在于、使用于或以其它方式关联给定的产品或过程。

另外,应理解的是,本公开的落入现有技术内的任何特定实施例都可以明确地从权利要求书中的任何一个或多个权利要求中排除。由于这种实施例被认为对于本领域普通技术人员而言是已知的,因此即使本文中未明确地阐述排除,也可以排除所述实施例。本公开的组合物的任何特定实施例(例如,任何抗生素、治疗或活性成分;任何生产方法;任何使用方法等)可以出于任何原因从任何一个或多个权利要求中排除,无论是否与现有技术的存在有关。

应当理解,已经使用的词语是描述性而不是限制性词语,并且可以在所附权利要求书的范围内进行改变而不脱离本公开在更广泛方面的真实范围和精神。

尽管已经相对于几个所描述实施例以一定长度和一定特定性描述了本公开,但是本公开并不旨在应当限于任何这种细节或实施例或者任何特定实施例,而是应当参考所附权利要求书进行解释,以便根据现有技术提供对这种权利要求书的尽可能广泛的解释并且因此有效地涵盖本公开的预期范围。

关于说明性实例的注释

虽然本公开出于展示本公开的各个方面和/或本公开的潜在应用的目的提供了对各个具体方面的描述,但是应当理解的是,本领域技术人员将想到变化和修改。因此,本文中描述的一项或多项发明应当被理解为至少与要求对其进行保护的那样宽泛,并且不像本文中提供的特定说明性方面所定义的那样狭窄。

除非另外指明,否则本文中标识的任何专利、公开或其它公开材料通过全文引用的方式并入本说明书中,但是程度仅仅为所并入材料与本说明书中明确阐述的现有描述、定义、陈述或其它公开材料不冲突。如此并且在必要的程度上,如本说明书中阐述的明确公开取代通过引用的方式并入的任何冲突材料。被陈述为通过引用的方式并入本说明书中但与本文所阐述的现有定义、陈述或其它公开材料冲突的任何材料或其一部分仅仅是在这样的程度下并入:在所述并入材料与现有公开材料之间不产生冲突。申请人保留修改本说明书以明确叙述通过引用的方式并入本文中的任何主题或其一部分的权利。

91页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于细胞疗法的基于靶向性配体-有效负载的药物递送

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!