模板导向的核酸靶向型化合物

文档序号:991096 发布日期:2020-10-20 浏览:10次 >En<

阅读说明:本技术 模板导向的核酸靶向型化合物 (Template-directed nucleic acid-targeting compounds ) 是由 D·H·李 W-C·谢 R·巴哈尔 于 2018-12-21 设计创作,主要内容包括:本文描述的是包含末端芳香部分的基因识别试剂,其特异性地结合到模板核酸并连接。还提供了使用基因识别试剂的方法,例如,治疗或诊断重复扩张疾病,例如DM1。(Described herein are gene recognition reagents comprising a terminal aromatic moiety that specifically binds to and is linked to a template nucleic acid. Methods of using the gene recognition reagents, e.g., in the treatment or diagnosis of a repetitive dilation disease, e.g., DM1, are also provided.)

模板导向的核酸靶向型化合物

关于联邦资金的声明

本发明是在美国国家科学基金会授予的第CHE1039870号资助和美国国立卫生研究院授予的第R21NS098102号资助的政府支持下完成的。政府拥有本发明的某些权利。

相关申请的交叉引用

本申请要求2017年12月21日提交的共同待决的美国临时申请No.62/708,789的权益,其全部内容通过引用合并于此。

与本申请相关联的序列表通过EFS-Web以电子格式提交,并据此通过引用整体并入本说明书。包含序列表的文本文件的名称为6526-1807599_ST25.txt。文本文件的大小为404字节,该文本文件于2018年12月21日创建。

背景技术

1.技术领域

本文描述了使用核酸和核酸寡聚物组合物结合核酸的组合物和方法。还提供了一种治疗重复扩张疾病例如1型(DM1)和2型(DM2)肌强直性营养不良等的方法。

2.相关领域的描述

对于大多数生物,遗传信息以沃森-克里克碱基配对的形式编码在双链DNA中,其中腺嘌呤(A)与胸腺嘧啶(T)配对且胞嘧啶(C)与鸟嘌呤(G)配对。取决于通过转录和翻译解码该遗传信息的哪一组,将确定发育程序和生理状态。可量身设计分子的开发以与该遗传生物聚合物的任何部分发生序列特异性结合,从而能够控制遗传信息流以及评估和操纵基因组的结构和功能,这对于生物学和生物医学研究是重要的。这项工作对于遗传疾病的治疗和检测的医学和治疗应用也很重要。

与蛋白质相比,RNA分子更易于靶向,因为它们仅由四个结构单元(A,C,G,U)组成,它们的相互作用由沃森-克里克碱基配对的既定规则定义。与标准的双链DNA(或RNA)相比,RNA的二级结构通常在热力学上较不稳定,因此在能量上对结合的要求较低,因为除了经典的(完全匹配)碱基对外,它们中许多是非经典的(不匹配),并且包含单链环,凸起和结。这些局部相互作用域的存在对于“三级”相互作用以及将二级结构组装成紧凑的三维形状至关重要。这样,这些区域内相互作用模式或结合强度的细微变化将对RNA的整体三维折叠模式产生深远影响。因此,可用于调节RNA相互作用从而干扰RNA折叠行为的分子作为评估RNA功能的分子工具以及治疗和诊断试剂是重要的。

遗传疾病通常是由于DNA编码序列的突变或转录或翻译水平的失调而导致的异常蛋白质功能而导致的,从而导致蛋白质功能的丧失或获得。然而,在过去的三十年中,大量证据表明,大量的神经肌肉疾病,超过20种,包括I型肌强直性营养不良(DM1)和2型强直性肌营养不良(DM2),是由于不稳定重复扩张引起的。基因编码区的扩张可导致蛋白质功能改变,而在非编码区发生的扩张可引起疾病而不会通过RNA功能的毒性获得而干扰蛋白质序列,并且在某些情况下通过重复相关非-ATG(RAN)翻译会偶然产生有害多肽。

后一类遗传疾病的原型是DMI,它是一种使人衰弱的肌肉萎缩,全世界每8000名成年人中就有一个患病,对于该疾病尚无有效治疗方法。DMJ是由营养不良性肌强直蛋白激酶(DMPK)基因的3'-非翻译区(3'-UTR)中的CTG重复扩张引起的,从正常范围的5-35个重复到致病范围的80至>2500个。DMI的病因主要归因于RNA毒性。一旦转录,扩张的rCUG重复序列(rCUGexp)采用了不完善的发夹结构,该结构螯合肌盲样蛋白I(MBNL1),其为一种关键的RNA剪接调节剂。它们的缔合导致rCUGexp-MBNL1复合物被困在细胞核中,阻止了其输出到细胞质中以产生DMPK蛋白,以及阻止MBNL1执行其正常的生理功能。积累的证据表明,可以通过靶向突变体转录子为DM1并可能为其他相关的神经肌肉疾病开发治疗性干预措施。然而,挑战在于如何设计这样的分子,其将靶向扩张的转录子而不干扰野生型(wt),并且将能够从rCUGexp置换出非同源蛋白如MBNL1

对这一目标的追求导致了靶向rCUGexp的几类分子的开发,包括喷他脒,三氨基三嗪和拟肽。最近,Disney和他的同事报告了模块化类肽(peptioid)的发展,以及鉴定具有高亲和力和效力的几种小分子。还研究了利用吗啉代和2'-O-甲氧基乙基间隔子(gapmer)的反义方法,并且显示该方法对于破坏rCUGexp-MBNL1复合物和降解毒性RNA以及逆转动物模型中的DMI表型是有效的。最近,研究了使用TALEN和CRISPR/Cas9针对修饰受影响等位基因的反基因策略作为DMI和相关医学病症的可能疗法。尽管前景广阔,但对于许多这类设计分子-特别是反义剂,在一定程度上仍存在与识别特异性和/或选择性以及细胞递送相关的巨大挑战。迄今为止开发的大多数合成寡核苷酸分子的低至中等亲和力,以及缺乏实质性的结合协同作用,已阻止使用较短的探针,以更轻松地实现细胞递送,并更好地区分扩张(致病)的RNA重复转录子和野生型。

核酸相互作用,例如RNA-RNA和RNA-蛋白质相互作用在基因调控中起关键作用,包括复制,翻译,折叠和包装。选择性结合RNA二级结构中这些扰动区域的能力在操纵其生理功能中很重要。因此,需要能够选择性结合核酸的改进的试剂和方法。

在一方面,提供了基因识别试剂。该基因识别试剂包括:核酸或核酸类似物主链,其具有第一端和第二端,并且具有3到8个核糖、脱氧核糖或核酸类似物主链残基;相同或不同的核碱基,在与靶核酸互补的序列中与多个核糖、脱氧核糖或核酸类似物主链残基连接;第一芳基部分,其通过接头连接至所述核酸或核酸类似物主链的所述第一端;以及第二芳基部分,其任选地与第一芳基部分相同,其通过接头连接至所述核酸或核酸类似物主链的第二端,其中当识别试剂与靶核酸的相邻序列杂交时所述芳基部分与相邻识别试剂的芳基部分堆叠在一起。还提供了包含所述基因识别试剂和药学上可接受的载体的组合物。

在另一方面,提供了一种结合细胞中核酸的方法,所述方法包括使所述mRNA的靶序列与基因识别试剂接触,所述基因识别试剂包括:核酸或核酸类似物主链,其具有第一端和第二端,并且具有3到8个核糖、脱氧核糖或核酸类似物主链残基;相同或不同的核碱基,在与靶核酸互补的序列中与多个核糖、脱氧核糖或核酸类似物主链残基连接;第一芳基部分,其通过接头连接至所述核酸或核酸类似物主链的所述第一端;以及第二芳基部分,其任选地与第一芳基部分相同,通过接头连接至所述核酸或核酸类似物主链的第二端,其中当识别试剂与靶核酸的相邻序列杂交时所述芳基部分与相邻识别试剂的芳基部分堆叠在一起,并具有与靶序列互补的核碱基序列。

在另一方面,提供了一种敲低细胞中mRNA表达的方法,其包括使mRNA的靶序列与基因识别试剂接触,所述基因识别试剂包括:核酸或核酸类似物主链,其具有第一端和第二端,并且具有3到8个核糖、脱氧核糖或核酸类似物主链残基;相同或不同的核碱基,在与靶核酸互补的序列中与多个核糖、脱氧核糖或核酸类似物主链残基连接;第一芳基部分,其通过接头连接至所述核酸或核酸类似物主链的所述第一端;以及第二芳基部分,其任选地与第一芳基部分相同,通过接头连接至所述核酸或核酸类似物主链的第二端,其中当识别试剂与靶核酸的相邻序列杂交时所述芳基部分与相邻识别试剂的芳基部分堆叠在一起,并具有与靶序列互补的核碱基序列。

在另一方面,提供了一种鉴定样品中核酸的靶序列的方法。该方法包括:使包含核酸的样品与基因识别试剂接触,所述基因识别试剂包括核酸或核酸类似物主链,其具有第一端和第二端,并且具有3到8个核糖、脱氧核糖或核酸类似物主链残基;相同或不同的核碱基,在与靶核酸互补的序列中与多个核糖、脱氧核糖或核酸类似物主链残基连接;第一芳基部分,其通过接头连接至所述核酸或核酸类似物主链的所述第一端;以及第二芳基部分,其任选地与第一芳基部分相同,通过接头连接至所述核酸或核酸类似物主链的第二端,其中当识别试剂与靶核酸的相邻序列杂交时所述芳基部分与相邻识别试剂的芳基部分堆叠在一起,其中所述芳基部分在未连接至靶序列的情况下暴露于光的激发频率时会产生第一荧光发射,而在连接到靶序列的情况下当暴露于光的激发频率时产生与第一荧光发射不同的第二荧光发射,并且通过激发荧光芳香族部分并测量该荧光芳香族部分在样品中产生的所述第二荧光信号的量来确定样品中靶序列的存在。

附图简述

图1是说明本文所述的基因识别试剂的非限制性实例的协同结合的示意图。基因识别试剂的序列以3'至5'方向描述,以描述与含重复序列的RNA的结合(SEQ ID NO:1)。

图2(A-F)提供了核酸类似物的示例性结构。

图3提供了示例性核碱基的结构。

图4A-4C提供了示例性二价核碱基的结构。

图5提供了氨基酸侧链的实例。

图6描述了实施例中描述的化学结构单元(A,组A),MPγPNA寡聚物(B)和RNA靶标(C)。

图7.PI至P4与T6的UV熔融曲线。在生理相关缓冲液中制备的T6浓度为1μM,并且每个探针的浓度为6μM。利用P4清楚地观察到协同结合的证据。

图8.生理相关缓冲液中P4-RNA异源双链体在8μM链浓度下的UV熔融曲线。通过将8μMP4与以下浓度的相应RNA靶标在生理缓冲液中混合制备样品:T1=8.0μM,T2=4.0μM,T4=2.0μM,T6=1.3μM,T8=1.0μM,并退火在90℃放置5分钟,然后逐渐冷却至室温。

图9.RNA和包含完全匹配和错配序列的相应探针-RNA异源双链体的UV-熔融转变随所述靶标中r(CUGCUG)n-结合位点的数量变化。插图:RNA与分别包含单碱基错配和双碱基错配的P5和P6的UV熔融曲线。

图10.在37℃温育1小时后然后在345nm处激发,在等摩尔浓度(P4=1μM;T1=1μM,T2=1/2,T4 1/4,T6=1/6,T8 1/8)的P4-RNA双链体的荧光光谱。插图:将P4(1μM)添加到T8(1/8μM),将P4(1μM)添加到[T1(1μM)+T8(1/8μM)]之后,在37℃ 480nm处的荧光信号随时间变化。

图11.在用手持式UV灯照射时,如图10所示的用于荧光测量的样品的照片。各个成分的浓度如下:P4=1μM;T1=1μM,T2=1/2μM,T4=1/4μM,T6=1/6μM,T8=1/8μM。

图12.P4对r(CUGCUG)n-RNA转录子的选择性结合。通过将预退火的RNA与探针在37℃混合4个小时来制备样品。P4与总RNA结合位点的比率为0(泳道3),1/4(泳道4),1/2(泳道5),1/1(泳道6);对于不匹配的P5为1/1(泳道7)。

图13.通过P4将MBNL1从T48置换。在添加P4之前,允许P-T48与GST-MBNL1-F1形成复合物。在生理学相关的缓冲液中分别以25nM和400nM的最终T48和GST-MBNL1-F1的浓度制备样品。

发明详述

除非另外明确指出,否则在本申请中指定的各种范围内的数值的使用被表示为近似值,好像在所述范围内的最小值和最大值均以单词“约”开头。以这种方式,在所述范围之上和之下的微小变化可以用于获得与范围内的值基本相同的结果。另外,除非另外指出,否则范围的公开意图是包括最小值和最大值之间的每个值的连续范围。如本文所用,“一个”和“一种”是指一个或多个。

如本文中所使用的,术语“包括”是开放式的,并且可以与“包括”,“包含”或“特征在于”同义。术语“基本上由……组成”将权利要求的范围限制为指定的材料或步骤以及那些不会实质性地影响所要求保护的发明的基本和新颖特征的材料或步骤。术语“由...组成”不包括权利要求中未指定的任何要素,步骤或成分。如本文所使用的,“包括”一个或多个陈述的元素或步骤的实施方案还包括但不限于“基本上由这些陈述的元素或步骤组成”和“由这些陈述的元件或步骤组成”的实施方案。

本文提供了用于结合核酸中的靶序列,例如用于结合与涉及核酸序列的重复扩张的疾病相关的重复扩张的组合物和方法。图1是说明本文所述的识别试剂(基因识别试剂)的非限制性实例的协同结合的示意图,靶向如在DM1中所见的RNA发夹结构中的CUG重复。在该示例中,通过末端芳族基团(例如以下实施例中所述的示例性芘基团)促进了模块与相邻模块的协同结合,所述芳族基团在未堆叠时发射出380nm和480nm,而在堆叠时发射出480nm。多种识别试剂通过沃森-克里克(Watson-Crick)或沃森-克里克-样(Watson-Crick-like)协作碱基配对与模板核酸结合。在细胞中,模板核酸是RNA或DNA分子,尽管在体外,模板核酸可以是任何RNA或DNA,以及修饰的核酸或核酸类似物。足够接近的识别试剂,例如与模板核酸上的相邻序列结合将通过π-π堆积进行连接,从而连接主要形成更长的寡聚物或聚合物。下面提供了更多详细信息。

如本文所用,“患者”是动物,例如哺乳动物,包括灵长类动物(例如人,非人灵长类动物,例如猴子和黑猩猩),非灵长类动物(例如例如牛,猪,骆驼,骆驼,马,山羊,兔子,绵羊,仓鼠,豚鼠,猫,狗,大鼠,小鼠,马和鲸)或鸟(例如鸭或鹅)。

如本文所用,术语“治疗”或“疗法”是指有益或期望的结果,例如改善一种或多种肝功能或疾病症状。术语“治疗”或“疗法”还包括但不限于缓解或改善重复扩张疾病(例如DM1,DM2或亨廷顿舞蹈病)的一种或多种症状。“治疗”也可能意味着与未治疗时的预期生存期相比,生存期延长。

在疾病标记或症状的背景下,“降低”是指该水平的临床相关和/或统计学上明显的降低。降低可以是例如至少10%,至少20%,至少30%,至少40%或更多,降低到对于没有这种疾病的个体可接受的正常范围内的水平,或者低于检测的测定水平。在某些方面,该降低降低至对于没有这种病症的个体而言所接受的在正常范围内的水平,这也可以称为水平的正常化。在某些方面,减少是疾病的体征或症状水平的正常化,疾病体征的受试水平与所述疾病体征的正常水平之间差异的减少(例如,当必须减小受试者的值以达到正常值时,达到较高的正常水平,而当必须将受试者的值增加至正常值时,达到较低的正常水平)。在某些方面,所述方法包括临床上对重复扩张疾病例如DM1,DM2或亨廷顿氏病的mRNA表达的临床相关抑制,例如,如用本发明所述的识别试剂治疗受试者后的临床相关结果所证明的那样。

如本文所用,“治疗有效量”旨在包括如本文所描述的识别试剂的量,当将其施用于患有疾病的受试者时,该量足以实现疾病的治疗(例如,通过减少、改善或维持现有疾病或所述疾病的一种或多种症状)。“治疗有效量”可能会根据以下而变化:识别试剂(剂),给药方式,疾病及其严重程度以及病史,年龄,体重,家族史,遗传构成,既往治疗或伴随治疗的类型(如果有的话),以及要治疗的受试者的其他个体特征。

“治疗有效量”还包括一定量的药剂,该药剂以适用于任何治疗的合理的益处/风险比产生某些期望的局部或全身作用。本文所述方法中采用的识别试剂可以以足以产生适用于这种治疗的合理的受益/风险比的量施用。

本文所用的术语“药学上可接受的载体”是指药学上可接受的材料,组合物或媒介物,例如液体或固体填充剂,稀释剂,赋形剂,制造助剂(例如,润滑剂,滑石粉,镁,硬脂酸酯钙或锌,或硬脂酸)或溶剂封装材料,涉及将受试化合物从一个器官或身体的一部分携带或运输到另一器官或身体的一部分。每个载体在与制剂的其他成分相容且对被治疗的受试者无害的意义上必须是“可接受的”。可以用作药学上可接受的载体的材料的一些示例包括:(1)糖,例如乳糖,葡萄糖和蔗糖;(2)淀粉,例如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,例如羧甲基纤维素钠,乙基纤维素和醋酸纤维素;(4)黄芪粉;(5)麦芽;(6)明胶;(7)润滑剂,如镁态,月桂基硫酸钠和滑石粉;(8)赋形剂,例如可可脂和栓剂蜡;(九)花生油,棉籽油,红花油,芝麻油,橄榄油,玉米油,大豆油等油;(10)二醇,例如丙二醇;(11)多元醇,例如甘油,山梨糖醇,甘露糖醇和聚乙二醇;(12)酯,例如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,例如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格的解答;(19)乙醇;(20)pH缓冲溶液;(21)聚酯,聚碳酸酯和/或聚酐;(22)填充剂,例如多肽和氨基酸;(23)血清成分,例如血清白蛋白,HDL和LDL;(22)药物制剂中使用的其他无毒相容性物质。

如本文所用,术语“细胞”是指来自任何动物,例如但不限于大鼠,小鼠,猴和人的任何类型的细胞。例如但不限于,细胞可以是祖细胞,例如干细胞,或分化的细胞,例如内皮细胞,平滑肌细胞。在某些实施方案中,用于医疗程序的细胞可以从患者获得用于自体程序或从其他供体获得用于同种异体程序。

“表达”或“基因表达”是指来自基因的全部信息流(不限于,用于在细胞中产生基因产物的功能性遗传单位诸如RNA或蛋白质,或其他在核酸上编码的表达系统,其包含:转录启动子和其他顺式作用元件,例如应答元件和/或增强子;通常编码蛋白质(开放阅读框或ORF)或功能/结构RNA的表达序列,以及聚腺苷酸化序列,以产生基因产物(通常是蛋白质,可选地进行翻译后修饰或功能性/结构性RNA)。“在指定序列的转录控制下表达基因”,或者“受指定序列的控制”,是指含有可操作地连接(通常以顺式功能连接)该指定序列的基因的基因表达。所述指定序列可以是全部或部分转录元件(但不限于启动子,增强子和应答元件),并且可以全部或部分调节和/或影响基因的转录。“用于表达所述基因产物的基因”是当置于合适的环境中时,例如,当被转化,转染,转导等进入细胞并进行细胞表达时,并且在合适的表达条件下,能够表达所述基因产物的基因。在组成型启动子的情况下,“合适的条件”是指通常仅需将基因引入宿主细胞即可。在诱导型启动子的情况下,“合适的条件”是指将一定量的相应诱导剂施用给有效引起基因表达的表达系统(例如细胞)。

如本文所用,术语“敲低”是指相对于功能基因而言,生物体中一个或多个基因的表达通常明显降低,例如相对于治疗有效程度而言。基因敲低还包括完全的基因沉默。如本文所用,“基因沉默”是指基本上完全阻止基因的表达。敲低和基因沉默可能发生在转录阶段或翻译阶段。通过在翻译阶段敲低或沉默一个或多个基因,使用所述识别试剂靶向细胞中的RNA(例如mRNA)可以修饰基因表达。

如本文所用,术语“核酸”是指脱氧核糖核酸(DNA)和核糖核酸(RNA)。核酸类似物包括,例如但不限于:2'-O-甲基取代的RNA,锁定的核酸,解锁的核酸,***连接的DNA,肽核酸,吗啉代寡聚物,双脱氧核苷酸寡聚物,二醇核酸,苏糖核酸酸及其组合,包括任选的核糖核苷酸或脱氧核糖核苷酸残基。在本文中,关于核酸和核酸类似物,“核酸”和“寡核苷酸”是由上位核苷酸组成的短的单链结构,可以互换使用。寡核苷酸可以通过命名法“聚体(-mer)”通过链的长度(即核苷酸数)来指代。例如,具有22个核苷酸的寡核苷酸将被称为22聚体。

“核酸类似物”是包含排列在底物如聚合物主链上的核碱基序列的组合物,并且可以通过沃森-克里克杂交或沃森-克里克样氢键碱基配对而结合DNA和/或RNA。常见核酸类似物的非限制性实例包括肽核酸,例如γPNA,吗啉代核酸,硫代磷酸酯,锁核酸(2'-O-4'-C-亚甲基桥,包括其氧基,硫代或氨基版本),未锁定的核酸(C2'-C3'键被切割),2'-O-甲基取代的RNA,苏糖核酸,乙二醇核酸等。

构象预组织的核酸类似物是根据核酸主链的结构具有仅形成右手旋螺旋或左手旋螺旋的主链(预组织的主链)的核酸类似物。如本文所示,构象预组织的核酸类似物的一个例子是γPNA,其在γ碳上具有手性中心,并且取决于并由于在γ碳上的基团的手性,仅形成右手螺旋或左手螺旋。同样,锁定的核酸包含在2'氧和4'碳之间具有桥的核糖,其将所述核糖“锁定”为3'-内(北)构象。

在本公开的上下文中,“核苷酸”是指包含至少一个核碱基和主链元件(主链部分)的单体,其在核酸如RNA或DNA中是核糖或脱氧核糖。“核苷酸”通常还包含允许在特定条件下聚合的反应性基团。在天然DNA和RNA中,这些反应性基团是5'磷酸和3'羟基。为了化学合成核酸及其类似物,碱基和主链单体可以包含修饰的基团,例如本领域已知的封端的胺。“核苷酸残基”是指掺入寡核苷酸或多核苷酸中的单个核苷酸。同样,“核碱基残基”是指掺入核苷酸或核酸或其类似物中的核碱基。“基因识别试剂”一般是指包含核碱基序列的核酸或核酸类似物,所述核碱基序列能够通过协同碱基配对与互补核酸或核酸上的核酸类似物序列杂交,例如沃森-克里克碱基配对或沃森-克里克样碱基配对。

更详细地,用于RNA、DNA或核酸类似物的核苷酸具有结构A-B,其中A是主链单体部分,并且B是本文所述的核碱基。主链单体可以是任何合适的核酸主链单体,例如核糖三磷酸或脱氧核糖三磷酸,或核酸类似物的单体,例如肽核酸(PNA),例如γPNA(γPNA)。在一个实例中,所述主链单体是核糖单、二或三磷酸核糖或脱氧核糖单、二或三磷酸核糖,例如核糖或脱氧核糖的5'单磷酸、二磷酸或三磷酸。所述主链单体既包括结构上的“残基”成分,例如RNA中的核糖,也包括在将单体连接在一起时修饰的任何活性基团,例如核糖核苷酸的5'三磷酸和3'羟基,它们在修饰时会被聚合成RNA,留下磷酸二酯键。同样对于PNA,N-(2-氨基乙基)甘氨酸主链单体的C-末端羧基和N-末端胺活性基团在聚合过程中缩合以留下肽(酰胺)键。在另一方面,所述活性基团是可用于亚磷酰胺寡聚物合成的亚磷酰胺基团,如本领域广泛已知的。所述核苷酸还任选地包含一个或多个本领域已知的保护基,例如4,4’-二甲氧基三苯甲基(DMT),并且如本文所述。制备合成基因识别试剂的许多其他方法是已知的,并且取决于主链结构和碱基添加过程的特定化学过程。确定在核苷酸单体的连接中利用哪些活性基团以及在碱基中保护哪些基团,以及制备寡聚物所需的步骤是化学领域和核酸核酸类似物寡聚物的合成领域的普通技术人员的能力范围之内。

常见核酸类似物的非限制性实例包括肽核酸,例如γPNA,硫代磷酸酯(例如,图2(A)),锁定核酸(2'-O-4'-C-亚甲基桥,包括氧、硫或其氨基版本,例如,图2(B)),未锁定的核酸(C2'-C3'键被切割,例如,图2(C)),2'-O-甲基取代的RNA,吗啉代核酸(例如,图2(D)),苏糖核酸(例如,图2(E)),乙二醇核酸(例如,图2(F),显示R和S形式)等。图2(A-F)显示了核酸类似物的各种实例的单体结构。图2(A-F)每个显示掺入较长的链中的两个单体残基,如波浪线所示。掺入的单体在本文中被称为“残基”,并且核酸或核酸类似物的除了核碱基之外的部分被称为核酸或核酸类似物的“主链”。例如,对于RNA,示例性的核碱基是腺嘌呤,相应的单体是三磷酸腺苷,并且引入的残基是单磷酸腺苷残基。对于RNA,“主链”由通过磷酸酯连接的核糖亚基组成,因此所述主链单体在掺入前为三磷酸核糖,在掺入后为核糖单磷酸残基。像γPNA一样,锁定核酸(图2(B))在构象上是预组织的。

“部分”是分子的一部分,并且包括一类“残基”,其是在化合物或单体掺入所述较大分子后,例如掺入核酸的核苷酸或掺入多肽或蛋白质的氨基酸,该化合物或单体保留在较大分子如聚合物链中的部分。

术语“聚合物组合物”是包含一种或多种聚合物的组合物。作为一类,“聚合物”包括但不限于均聚物,杂聚物,共聚物,嵌段聚合物,嵌段共聚物,并且可以是天然的和合成的。均聚物包含一种类型的结构单元或单体,而共聚物包含一种以上类型的单体。“寡聚物”是包含少量单体,例如3至100个单体残基的聚合物。类似地,术语“聚合物”包括寡聚物。术语“核酸”和“核酸类似物”包括核酸以及核酸聚合物和寡聚物。

如果所述单体被掺入到聚合物中,则该聚合物“包含”或“衍生自”所述单体。因此,所述聚合物包含的引入的单体与引入聚合物之前的单体不同,因为至少在聚合过程中某些接头团被引入聚合物主链或某些基团被除去。如果该键存在于聚合物中,则称该聚合物包含特定类型的键。掺入的单体是“残基”。核酸或核酸类似物的常见单体称为核苷酸。

在化学成分例如分子,化合物,组成,基团,部分,离子等的上下文中,“非反应性”是指该成分在其预期用途中不与其他化学成分发生任何实质程度的反应。选择非反应性成分以不干扰或微不足道地干扰所述成分、部分或基团作为识别试剂的预期用途。在本文所述的接头部分的上下文中,它们是非反应性的,因为它们不干扰识别试剂与靶模板的结合,并且不干扰识别试剂在靶模板上的连接。

如本文所用,“烷基”是指直链,支链或环状烃基,包括例如1至约20个碳原子,例如但不限于C1-3、C1-6、C1-10基团,例如但不限于直链、支链烷基,例如甲基、乙基、丙基、丁基、戊基、己基、庚基、辛基、壬基、癸基、十一烷基、十二烷基等。“取代的烷基”是指在1个或多个,例如1、2、3、4、5或什至6个位置被取代的烷基,该取代基连接在任何可利用的原子上以产生稳定的化合物,如本文所述。“任选取代的烷基”是指烷基或取代的烷基。“卤素”,“卤化物”和“卤代”是指-F,-Cl,-Br和/或-I。“亚烷基”和“取代的亚烷基”分别是指二价烷基和二价取代的烷基,包括但不限于亚甲基、亚乙基、三亚甲基、四亚甲基、五亚甲基、六亚甲基、庚亚甲基、八亚甲基、九亚甲基或十亚甲基。“任选取代的亚烷基”是指亚烷基或取代的亚烷基。

“烯或烯基”是指直链、支链或环状烃基,包括例如2至约20个碳原子,例如但不限于C1-3、C1-6、C1-10基团,其具有一个或多个例如1、2、3、4或5个碳-碳双键。“取代的烯”是指在1个或多个,例如1、2、3、4或5个位置上取代的烯,其取代基连接在任何可利用的原子上以产生稳定的化合物,如本文所述。“任选取代的烯”是指烯烃或取代的烯烃。同样,“亚烯基”是指二价烯烃。亚烯基的实例包括但不限于亚乙烯基(-CH=CH-)及其所有立体异构和构象异构形式。“取代的亚烯基”是指二价取代的烯烃。“任选取代的亚烯基”是指亚烯基或取代的亚烯基。

“炔”或“炔基”是指具有指定数目的碳原子和至少一个三键的直链或支链不饱和烃。(C2-C8)炔基的实例包括但不限于乙炔基,丙炔基,1-丁炔基,2-丁炔基,1-戊炔基,2-戊炔基,1-己炔基,2-己炔基,3-己炔基,1-庚炔,2-庚炔,3-庚炔,1-辛炔,2-辛炔,3-辛炔和4-辛炔。炔基可以是未取代的或任选地被一个或多个下文所述的取代基取代。术语“亚炔基”是指二价炔烃。亚炔基的实例包括但不限于亚乙炔基,亚丙炔基。“取代的亚炔基”是指二价取代的炔基。

术语“烷氧基”是指具有指定碳原子数的-O-烷基。例如,(C1-C6)烷氧基包括-O-甲基(甲氧基),-O-乙基(乙氧基),-O-丙基(丙氧基),-O-异丙基(异丙氧基),-O-丁基(丁氧基),-O-仲丁基(仲丁氧基),-O-叔丁基(叔丁氧基),-O-戊基(戊氧基),-O-异戊基(异戊氧基),-O-新戊基(新戊氧基),-O-己基(己氧基),-O-异己基(异己氧基)和-O-新己基(新己氧基)。“羟基烷基”是指其中一个或多个烷基的氢原子被-OH基团取代的(C1-C10)烷基。羟烷基的实例包括但不限于-CH2OH,-CH2CH2OH,-CH2CH2CH2OH,-CH2CH2CH2CH2OH,-CH2CH2CH2CH2CH2OH,-CH2CH2CH2CH2CH2CH2OH及其分支形式。术语“醚”或“氧醚”是指其中一个或多个烷基的碳原子被-O-基团取代的烷基。术语醚包括-CH2-(OCH2-CH2)qOP1化合物,其中P1是保护基,-H或(C1-C10)烷基。示例性的醚包括聚乙二醇,二***,甲基己基醚等。

“PEG”是指聚乙二醇。“PEG化”是指包含部分的化合物,该部分包含两个或更多个连续的乙二醇部分。用于化合物的PEG化的PEG部分的非限制性实例包括1至50个乙二醇部分的链的一个或多个嵌段,例如–(O-CH2-CH2)n-.,–(CH2-CH2-O)n-,或–(O-CH2-CH2)n-OH,其中n为2到50。

“杂原子”是指N,O,P和S。含有N或S原子的化合物可以任选地被氧化成相应的N-氧化物,亚砜或砜化合物。“杂取代“是指本文任何实施方案所述的有机化合物,其中其中一个或多个碳原子被N,O,P或S取代。

“芳基”单独或组合是指芳香族环系统,例如苯基或萘基;“芳基”还包括任选地与环烷基环稠合的芳香族环系统。“取代的芳基”是这样的芳基,其独立地被在任何可用原子上连接的一个或多个取代基取代以产生稳定的化合物,其中所述取代基如本文所述。“任选取代的芳基”是指芳基或取代的芳基。“亚芳基”表示二价芳基,和“取代的亚芳基”是指二价取代的芳基。“任选取代的亚芳基“指亚芳基或取代的亚芳基。本文中使用的术语“多环芳基”和相关术语,例如“多环芳族基”是指由至少两个稠合芳族化合物组成的基团。“杂芳基”或“杂取代的芳基”是指被一个或多个杂原子如N,O,P和/或S取代的芳基。

“环烷基”是指单环、双环、三环或多环的3至14元环系统,其为饱和、不饱和或芳香族的。所述环烷基可以通过任何原子连接。环烷基也考虑稠合环,其中所述环烷基稠合于芳基或杂芳基环。环烷基的代表性实例包括但不限于环丙基,环丁基,环戊基和环己基。环烷基可以是未取代的或任选地被一个或多个下文所述的取代基取代。“亚环烷基”是指二价环烷基。术语“任选取代的亚环烷基”是指被1、2或3个取代基取代的亚环烷基,其连接在任何可利用的原子上以产生稳定的化合物,其中所述取代基如本文所述。

“羧基”或“羧基的”是指具有指定碳原子数的基团(如有指定),且其末端为-C(O)OH基团,因此具有-R-C(O)OH结构,其中R是包括直链、支链或环状烃的二价有机基团。这些的非限制性实例包括:C1-8羧基,例如乙醇酸,丙酸,2-甲基丙酸,丁酸,2,2-二甲基丙酸,戊酸等。“胺”或“氨基”是指具有指定数目碳原子的基团,且其末端为-NH2基团,因此具有-R-NH2结构,其中R为未取代或未取代的二价有机基团,例如包括直链,支链或环状烃,并且任选地包含一个或多个杂原子。

结合前述的术语是指前述的任何合适的组合,例如芳基烯基,芳基炔基,杂芳基烷基,杂芳基烯基,杂芳基炔基,杂环基烷基,杂环基烯基,杂环基炔基,芳基,杂芳基,杂环基,环烷基,环烯基,烷基芳基烷基,烷基芳基烯基,烷基芳基炔基,烯基芳基烷基,烯基芳基烯基,烯基芳基炔基,炔基芳基烷基,炔基芳基烯基,炔基芳基炔基,烷基杂芳基烷基,烷基杂芳基烯基,烷基杂芳基炔基,烯基杂芳基烷基,烯基杂芳基烯基,烯基杂芳基炔基,炔基杂芳基烷基,炔基杂芳基烯基,炔基杂芳基炔基,烷基杂环基烷基,烷基杂环基烯基,烷基杂环基炔基,烯基杂环基烷基,烯基杂环基烯基,烯基杂环基炔基,炔基杂环基烷基,炔基杂环基烯基,炔基杂环基炔基,烷基芳基,烯基芳基,炔基芳基,烷基杂芳基,烯基杂芳基,炔基杂芳基。例如,“芳基亚烷基”是指其中亚烷基中的一个或多个氢原子被芳基如(C3-C8)芳基取代的二价亚烷基。(C3-C8)芳基(C1-C6)亚烷基的实例包括但不限于1-苯基丁烯,苯基-2-丁烯,1-苯基-2-甲基丙烯,苯基亚甲基,苯基丙烯和萘乙烯。术语“(C3-C8)环烷基-(C1-C6)亚烷基”是指其中C1-C6亚烷基中的一个或多个氢原子被(C3-C8)环烷基取代的二价亚烷基。(C3-C8)环烷基-(C1-C6)亚烷基的实例包括但不限于1-环丙烯基丁烯,环丙烯基-2-丁烯,环戊基-1-苯基-2-甲基丙烯,环丁亚甲基和环己基丙烯。

“氨基酸”具有结构H2N-C(R)-C(O)OH,其中R是侧链,例如氨基酸侧链。“氨基酸残基”表示当掺入氨基酸链中时的氨基酸的其余部分,诸如当掺入本文公开的识别试剂中时,例如具有结构-NH-C(R)-C(O)-,H2N-C(R)-C(O)-(当在多肽的N端时),或-NH-C(R)-C(O)OH(当在多肽的C端时)。“氨基酸侧链”是氨基酸的侧链,包括蛋白原性或非蛋白原性氨基酸。氨基酸具有以下结构:

,其中R是氨基酸侧链。氨基酸侧链的非限制性实例显示在图5中。甘氨酸(H2N-CH2-C(O)OH)没有侧链。

“肽核酸”是指核酸类似物或DNA或RNA模拟物,其中DNA或RNA的糖磷酸二酯主链被N-(2-氨基乙基)甘氨酸单元替代。γPNA(γPNA)是具有以下结构的γ-改性N-(2-氨基乙基)甘氨酸单体的寡聚物或聚合物:

Figure BDA0002641565620000152

其中,连接至γ碳的R1或R2中的至少一个不是氢,使得γ碳是一个手性中心。当R1和R2是氢(N-(2-氨基乙基)-甘氨酸主链)或相同时,关于γ碳没有这种手性。结合的PNA或γPNA单体,在本文中称为PNA或γPNA“残基”,指整合到寡聚物中之后的剩余结构,其中每个残基具有与其碱基(核碱基)相同或不同的R基团,例如腺嘌呤,鸟嘌呤,胞嘧啶,胸腺嘧啶和尿嘧啶碱基,或其他碱基,例如本文所述的单价和二价碱基,使得PNA上的核碱基顺序是其“序列”,如DNA或RNA。核酸或核酸类似物寡聚物或聚合物(例如PNA或γPNA寡聚物或聚合物)中的核碱基序列与核酸或核酸类似物中的腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和/或尿嘧啶残基的互补序列通过核碱基配对以沃森-克里克或沃森-克里克样的方式结合,基本上与双链DNA或RNA一样。

可将“胍”或“胍盐”基团添加至识别试剂以增加溶解度和/或生物利用度。由于PNA的生产方式与合成肽相似,因此添加胍基的简单方法是在PNA的N末端和/或C末端添加一个或多个末端精氨酸(Arg)残基,例如γPNA,识别试剂。同样,精氨酸侧基,或含胍基的部分,例如,其中n例如但不限于,范围为1-5,或上述基团的盐,可以连接到本文所述的识别试剂主链上。含胍基是包含胍部分的基团,并且可以具有小于100个原子,小于50个原子,例如小于30个原子。在一个方面,含胍基具有以下结构:

Figure BDA0002641565620000163

其中L是根据本文所述的任何方面的接头,例如非反应性脂族烃基接头,例如亚甲基、亚乙基、三亚甲基、四亚甲基或五亚甲基接头。在一些方面,含胍基具有以下结构:其中n为1-5,例如,胍基可以是精氨酸。

“核碱基”包括一级核碱基:腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶和尿嘧啶、以及修饰的嘌呤和嘧啶碱基,例如但不限于次黄嘌呤、呫吨、7-甲基鸟嘌呤、5、6-二氢尿嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶。图3和4A-4C还描绘了核碱基的非限制性实例,包括单价核碱基(例如腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶或尿嘧啶,其与核酸或核酸类似物的一条链结合)和二价核碱基(例如本文所述的JB1-JB16),其同时结合两条DNA链上的互补核碱基,并“钳住”核碱基,例如“G-钳”,其以增强的强度结合互补核碱基。另外的嘌呤、嘌呤样、嘧啶和嘧啶样核碱基在本领域是已知的,例如,如美国专利号8,053,212、8,389,703和8,653,254中所公开的。对于图4A所示的二价核碱基JB1-JB16,表A显示了不同核碱基的特异性。值得注意的是,JB1-JB4系列结合互补碱基(C-G,G-C,A-T和T-A),而JB5-JB16结合错配,因此可用于结合两条碱基匹配和/或错配的碱基。二价核碱基在美国专利申请公开号20160083434A1和国际专利公开号WO 2018/058091中有更详细的描述,二者均通过引用并入本文。

表A:二价核碱基

Figure BDA0002641565620000171

*二氨基嘌呤,腺嘌呤类似物。

示例性的γPNA结构没有以本文所述的方式用芳基进行末端修饰,但是可以如本文所述在国际专利公开号WO 2012/138955中公开,其通过引用并入本文。

互补的是指多核苷酸(核酸)彼此杂交形成链间碱基对的能力。碱基对通过反平行多核苷酸链中核苷酸单元之间的氢键形成。互补的多核苷酸链可以以沃森-克里克方式(例如,A至T,A至U,C至G)或以允许形成双链体的任何其他方式进行碱基配对(杂交)。当使用RNA而不是DNA时,尿嘧啶而不是胸腺嘧啶是与腺苷互补的核碱基。如果包含互补序列的两个序列在下述条件形成双链体则它们可发生杂交:在指定条件下,例如在水,盐水(例如生理盐水或0.9%w/v盐水)或磷酸盐缓冲液中,或在其他严格条件下,例如但不限于,将0.1XSSC(盐水柠檬酸钠)稀释到10X SSC,其中1X SSC是水中的0.15M NaCl和0.015M柠檬酸钠。互补序列的杂交由例如盐浓度和温度决定,解链温度(Tm)降低则错配增加且严格性提高。完全匹配的序列被认为是“完全互补的”,尽管一个序列(例如,mRNA中的靶序列)可能比另一个更长,如本文所述的小型识别试剂与它们所连接的相关更长的靶标例如含有重复扩张的mRNA的情况。

含有扩张的三核苷酸重复序列的毒性RNA是许多神经肌肉疾病的原因,所述疾病之一是I型肌强直性营养不良(DMI)。DMI由DMP K基因3'-UTR中的CTG重复扩张触发,通过螯合MBNLI蛋白等导致RNA功能的毒性增加。本文描述了能够以序列特异性和选择性方式结合核酸序列,例如重复的核酸序列的短探针。例如,如实施例中所述,证明了长度为两个三联体重复的包含末端芘部分的短的PNA探针,能够以序列特异性和选择性的方式结合rCUG重复。该探针可以从野生型转录子中区分出致病性rCUGexp,并且能够破坏rCUGexp-MBNL1复合物。由此,在各方面中,本文描述了短核酸探针,称为基因识别试剂,用于靶向与DMI和其他相关神经肌肉疾病相关的RNA重复扩张。

本文所述的方法和组合物克服了目前面对常规反义和反基因(antigene)方法的三个主要障碍。第一个障碍涉及寡核苷酸合成的规模和成本。由于寡核苷酸传统上是在固体载体上以逐步方式合成的,因此难以扩大生产规模。这转化为对寡核苷酸治疗剂的高成本和未满足的需求。本文所述的方法和组合物克服了这一挑战,因为识别试剂的尺寸相对较小,长度为3至8个核苷酸,在小分子和仿生物的分子量边界。本文所述的化合物可以使用会聚的溶液相合成方法大规模生产,这将转化为更低的生产成本和将这些材料用于治疗的更大可及性。

第二个障碍涉及细胞递送-特别是如何使这些核酸探针穿过细胞膜的脂质双分子层并进入靶细胞的细胞质和细胞核。大多数寡核苷酸由于相对较大的分子量而不能渗透到细胞膜中。它们递送到细胞中将需要转染试剂或机械或电转导的帮助。尽管这些方法已成功用于将寡核苷酸和其他大分子转运到细胞中,但它们仅限于小规模的体外(组织培养)实验设置。在体内,全身递送(治疗遗传病和大多数传染性疾病的要求)仍然是一个问题,特别是对于中枢神经系统疾病。由于识别试剂的尺寸减小和化学修饰的灵活性,本发明克服了该限制。它们的尺寸相对较小的事实,使得它们更容易被细胞吸收,并且对核膜的渗透性更高。此外,关于PNA,例如γPNA,由于它们的合成灵活性,因为可以将任何化学基团掺入到PNA的主链中,这些识别试剂可以容易地用特定的化学官能团修饰以促进细胞摄取和全身递送。

第三个障碍涉及非特异性结合和细胞毒作用。当***细胞中时,合成或其他长度为10-30nt的裸露寡核苷酸寡核苷酸不仅会与其指定的靶标结合,而且还会与其他具有相关序列的DNA或RNA区域结合。这种非特异性结合会捕获探针,阻止探针自由扩散,寻找并结合其靶标。由于非特异性结合,探针有效浓度的降低将导致功效的降低。此外,由于基因表达的错误调节和/或其他关键蛋白的功能紊乱,这种非特异性结合也可能导致细胞毒性作用。实际上,非特异性结合已被认为是寡核苷酸治疗药物(以及小分子药物)副作用的主要原因,目前尚无解决方案。本发明通过利用短识别试剂(长度通常为3至8nt)与靶标之间的弱相互作用来克服该限制。这种微弱的“亲吻”相互作用使模块可以在细胞内环境中自由扩散,以寻找其靶标。在这种情况下,它的指定目标不同于“随机”,“单结合位点”,因为它包含重复的序列元素,这使模块可以通过相邻碱基堆叠以协同方式彼此相邻组装并开始进行“天然化学连接”反应,形成一系列不同长度的延伸寡聚物。

如表B所示,目前存在几种与核苷酸序列的不稳定重复扩张有关的已知遗传疾病。挑战在于,与蛋白质相比,靶标(在这种情况下为DNA或RNA)的三维结构是单调的。这使得小分子很难将特定位点与其他DNA或RNA序列区分开。

本发明相对于“小分子药物”方法的优点在于癌症的治疗以及与细菌,病毒和寄生虫感染的对抗,其中靶标由于突变的快速速率而迅速发展。致癌克隆以及细菌,病毒和寄生性病原体的基因组和转录组中有许多保守和重复的元素,可能会以这种方法和方法靶向。与“小分子-蛋白质识别”方法相比,这些肿瘤细胞或病原体逃避本文所述的这些识别试剂并变得具有抗药性的可能性不大,因为突变必须发生在DNA/RNA模板中的每个重复元件上。

本文描述的识别试剂被设计为化学惰性的,直到它们进入细胞的细胞质和/或细胞核为止,在这种条件下,识别试剂与核酸中的互补序列杂交,并且如果与序列相邻,则与之杂交与其杂交的另一种识别试剂,其相邻的芳族基团将堆叠,从而连接识别试剂。识别试剂通过协同沃森-克里克(或沃森-克里克样的氢键)碱基配对相互作用识别并结合其DNA或RNA靶标,由此相邻的模块通过π-π堆叠(“pi堆叠”)非共价连接末端芳基以头尾相接的方式形成扩张的级联寡聚物,例如如图1所示。识别试剂中分子内与分子间pi堆积的速率可以通过调节具有刚性的识别试剂主链的刚性来控制,例如构象预组织的主链,例如γPNA或LNA主链,其限制了末端芳香族基团的分子内π堆积,从而潜在地使识别试剂失活。也就是说,即使发生分子内pi堆积,当与靶序列杂交时,识别试剂也会“打开”。在靶序列的存在下,与所述靶序列的杂交和连接占主导。

本文所述的识别试剂结合了小分子的特征,例如,低分子量,易于大规模生产,生产成本低,细胞渗透性和所需的药代动力学,以及通过沃森-克里克碱基配对对寡核苷酸的序列特异性识别。已经根据几个实施例说明和描述了寡聚物识别试剂的连接,其旨在在所有方面进行说明而不是限制。因此,本发明在详细的实施方式上可以有许多变化。

本文所述的识别试剂的应用实例是在具有小序列的重复扩张的遗传疾病的治疗中,例如表B中列出的那些。

表B-与不稳定重复相关的遗传疾病

Figure BDA0002641565620000201

基于表B,靶向上述基因产物的识别试剂包括5'至3'方向的以下序列:GAA、CGG、CCG、CAG、CTG、CCTG、ATTCT和GGGGCC或与其互补的序列(例如,TTC、CCG、CGG、CTG、CAG、CAGG、AGAAT或GGCCCC),用于靶向RNA,或与包含以下重复序列的靶序列杂交:GAA、CGG、CCG、CAG、CTG、CCTG、ATTCT和GGGGCC、或与其互补的序列。

本发明的其他潜在应用是在治疗癌症(端粒),细菌感染(抗性菌株,靶向致病菌株独特的重复和保守元素),丙型肝炎(该疾病没有有效的治疗方法,影响世界人口的3%,本发明中通过靶向病毒RNA基因组中的重复元件),疟疾(靶向已证明在纤毛虫的复制和生命周期中必不可少的微卫星)和AIDS(这是一个快速发展的目标,通过在识别试剂中拨入相应的核碱基序列,可以追踪新的突变序列)。

因此,本文提供识别试剂-修饰的核酸-组装在核酸模板上并在模板上彼此相互结合并连接在一起。识别试剂是核酸或核酸类似物的寡聚物,例如3至10个碱基,例如3、4、5、6、7、8、9或10个碱基,或长度为3至8个碱基,包括末端芳族(芳基)基团,例如2-5个环的稠环多环芳族基团,或含有8-20个碳或环原子,位于其末端(例如,5'端和3'端,相对于核酸或核酸类似物)。稠环多环芳香族基团的非限制性实例包括:戊烯(pentalene),茚(indene),萘(naphthalene),甘菊蓝(azelene),庚烯(heptalene),联苯(biphenylene),as-茚烯(indacene)、s-茚烯,苊烯(acenaphthylene),芴(fluorine),萉(phenalene),菲(phenanthrene),蒽(anthracene),荧蒽(fluoranthene),醋菲烯(acehenanthrylene),醋蒽烯(aceanthrylene),苯并菲(triphenylene),芘(pyrene),

Figure BDA0002641565620000221

(chrysene),萘并萘(naphthacene)/并四苯(tetracene),七曜烯(pleiadene),苉(picene)或苝(perylene),所有这些在化学领域中都是众所周知的。芳香族基团在其结构中的任何合适的连接点处以任何合适的方式,例如使用接头,使用任何合适的连接化学,与识别试剂主链连接。例如,如以下示例所示,氨基酸或包含两个胺基的氨基酸,例如二氨基丁酸(Dab),鸟氨酸(Orn)或赖氨酸(Lys),可连接羧基-官能化的芳族化合物,诸如以芘为例,芘-1-羧酸,芘-2-羧酸,或芘-4-羧酸,芘-1-乙酸,芘-2-乙酸或芘-4-乙酸,在接头中形成酰胺键。

芳族基团可以是杂环或非杂环的,因为该芳族基团不包含杂原子,或在其任何环中包含一个或多个杂原子,例如,S,O或N。此外,所述芳香族基团可以被一个或多个非反应性基团取代,所述非反应性基团在与靶序列的杂交和连接中基本上不干扰所述识别试剂的功能。

另外,芳族基团除了具有用于连接识别试剂的用途以外,还可以具有功能。在一些方面,芳族基团是抗氧化剂,例如维生素或抗氧化剂,例如核黄素(维生素B2),芒果素(mangostin)或芒果苷(mangiferin),或其他天然芳香族抗氧化剂,存在于水果和蔬菜中,例如常用的膳食补充剂以抵抗氧化应激,炎症,癌症,衰老或其他疾病。

基因识别试剂在某些方面是刚性的或构象预组织的,如γPNA和锁定的核酸主链。除非另有说明,否则所有核苷酸序列均以从5'到3'的方向(从左到右)提供。在可以以平行或反平行方向杂交的PNA寡聚体的背景下,除非另有说明,其序列相对于其核碱基序列以5'至3'的方向描绘,相对于其与互补核酸链特定的沃森-克里克或与沃森-克里克样结合至互补核酸链。

化合物中的部分,例如芳基部分或核碱基共价连接至识别试剂主链,因此被称为“连接”至主链。取决于用于制备化合物的化学性质,连接可以是直接的,或通过“接头”直接连接,该“接头”是共价连接两个其他部分或基团的部分。一方面,末端芳族(芳基)基团通过接头连接至识别试剂。该接头是将芳族基团连接至识别试剂的主链的非反应性部分,并且在一些方面包括1-10个碳原子(C1-C10),其任选地被杂原子如N,S或O取代,或非反应性键,例如通过使胺与羧基反应形成的酰胺键(肽键)。C1-C10亚烷基的实例是直链或支链亚烷基(二价)部分,其任选地包含环状部分,例如亚甲基,亚乙基,三亚甲基,四亚甲基,五亚甲基,六亚甲基,庚亚甲基,八亚甲基,九亚甲基或十亚甲基部分(即,-CH2-[CH2]n-,其中n=1至9),任选地包含酰胺键。接头是非占位性的,因为它们在空间上不会阻碍或以其他方式在很大程度上干扰识别试剂与靶模板的结合,并且不会干扰识别试剂在靶模板上的连接。接头是由芳族基团和识别试剂的主链连接而产生的剩余部分,例如,或在一个非限制性实例中,

Figure BDA0002641565620000232

是由乙酸取代的芳基化合物(A)例如芘-1-乙酸与Dab(n=1),Orn(n=2)或Lys(n=3)残基的连接而产生的。

在其他方面,接头或接头基团是连接化合物的两个部分,例如,共价连接化合物的两个部分的有机部分,例如但不限于在本发明的上下文中,芳族基团与识别试剂的主链的连接,核碱基与核酸或核酸类似物主链的连接和/或胍基与识别试剂的连接。接头通常包含直接键或原子如氧或硫,单元如C(O),C(O)NH,SO,SO2,SO2NH或原子链,例如但不限于,取代或未取代的烷基,取代或未取代的烯基,取代或未取代的炔基,芳基烷基,芳基烯基,芳基炔基,杂芳基烷基,杂芳基烯基,杂芳基炔基,杂环基烷基,杂环基烯基,杂环基炔基,芳基,杂芳基,杂环基,环烷基,环烯基,烷基芳基烷基,烷基芳基烯基烯基芳基烷基,烯基芳基烯基,烯基芳基炔基,炔基芳基烷基,炔基芳基烯基,炔基芳基炔基,烷基杂芳基烷基,烷基杂芳基烯基,烷基杂芳基炔基,烯基杂芳基烷基,烯基杂芳基烯基,烯基杂芳基炔基,炔基杂芳基烷基,炔基杂芳基烯基,炔基杂芳基炔基,烷基杂环基烷基,烷基杂环基烯基,烷基杂环基炔基,烯基杂环基烷基,烯基杂环基烯基,烯基杂环基炔基,炔基杂环基烷基,炔基杂环基烯基,炔基杂环基炔基,烷基芳基,烯基芳基,炔基芳基,烷基杂芳基,烯基杂芳基,炔基异芳基,其中一个或多个碳原子例如亚甲基或次甲基(-CH=)任选被杂原子诸如O,S或N,取代或未取代的芳基,取代或未取代的杂芳基,取代或未取代的杂环中断或终止。一方面,所述接头包含约5至25个原子,例如5-20、5-10,例如5、6、7、8、9、10、11、12、13、14、15、16。17、18、19或20个原子,或总共1至10个,例如1、2、3、4、5、6、7、8、9或10个C原子和杂原子,例如O,P,N或S原子。

对于与PNA(例如γPNA)的键合,一种方便且可用的接头是使胺与羧基反应形成酰胺键的接头,例如,使用众所周知的肽合成化学方法将氨基酸添加至识别试剂,其中氨基酸可以用化学部分(例如芳基部分或胍基)进行预修饰,如以下实施例所示,并添加芳基修饰的氨基酸以连接所述芘芳基部分到所述识别试剂,并利用精氨酸提供胍基。与非肽核酸类似物的连接可以使用广为人知的任何合适的连接化学方法来实现,例如通过使用碳二亚胺化学方法实现,例如EDC(EDAC,1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐)例如通过末端磷酸酯将胺修饰的Ar基团连接至识别试剂。

在将芳族基团连接至识别试剂的主链上时,该接头具有适当的大小或长度,从而在靶核酸序列上该识别试剂的连接过程中,将芳族基团放置在π-π堆叠的位置,如本文所述。

根据本发明的一个方面,提供了一种识别试剂,其包括:核酸或核酸类似物主链,其具有第一端和第二端,由3个或更多个例如3至10个,或3、4、5、6、7、8、9或10或3到8个核酸或核酸类似物主链残基制备,其任选地是构象预组织的;核碱基序列,其可以相同或不同,在序列中附着或连接到多个核酸或核酸类似主链残基;第一芳基部分,其连接到核酸或核酸类似物主链的第一端;和任选地与所述第一芳基部分相同的第二芳基部分,连接到所述核酸或核酸类似物主链的第二端。所述芳基部分独立地是2至5环稠合的多环芳香族部分,例如具有2个至5个稠合环的取代或未取代的芳基或杂芳基部分,例如但不限于,未取代或取代的戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,

Figure BDA0002641565620000253

萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene),任选被一个或多个杂原子例如O,N和/或S取代,例如呫吨,核黄素(维生素B2),芒果素或芒果苷,并且可以相同或不同,并且在相同各方面,当识别试剂与靶核酸的相邻序列杂交时,每个均与相邻识别试剂的Ar基团堆叠。

根据本发明的一个方面,提供了一种识别试剂(识别模块),其结构为:

Figure BDA0002641565620000251

,其中R独立地是核碱基,并且R的每个实例可以相同或不同。

n是1至6的整数,例如1、2、3、4、5或6;

每个B独立地是核糖5'磷酸残基,脱氧核糖-5-磷酸残基或核酸类似物主链残基,并且在一方面,是构象预组织的核酸类似物的主链残基如γPNA或LNA;

L独立地是接头,例如,非反应性接头或非反应性,非占位性接头,并且L的每个实例可以相同或不同;和

Ar的每个实例独立地是2至5环稠合的多环芳香族部分,例如具有2至5个稠合环的取代或未取代的芳基或杂芳基部分,例如但不限于,未取代或取代的戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,

Figure BDA0002641565620000252

萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene),任选被一个或多个杂原子例如O,N和/或S取代,例如呫吨,核黄素(维生素B2),芒果素或芒果苷,并且可以相同或不同,并且在各方面相同。在一些方面中,当识别试剂与靶核酸的相邻序列杂交时,每个Ar均与相邻识别试剂的Ar基团堆叠。

一方面,所述识别试剂包括PNA主链,因此具有以下结构:

其中R独立地是核碱基,并且R的每个实例可以相同或不同。

n是1至6的整数,例如1、2、3、4、5或6;

L的每个实例独立地是接头,并且可以包含一个或多个氨基酸残基,或取代或未取代的烷基,取代或未取代的烯基,取代或未取代的炔基,芳基烷基,芳基烯基,芳基炔基,杂芳基烷基,杂芳基烯基,杂芳基炔基,杂环基烷基,杂环基烯基,杂环基炔基,芳基,杂芳基,杂环基,环烷基,环烯基,烷基芳基烷基,烷基芳基烯基,烷基芳基炔基,烯基芳基烷基,烯基芳基烯基,烯基芳基炔基,炔基芳基烷基,炔基芳基烯基,炔基芳基炔基,烷基杂芳基烷基,烷基杂芳基烯基,烷基杂芳基炔基,烯基杂芳基烷基,烯基杂芳基烯基,烯基杂芳基炔基,炔基杂芳基烷基,炔基杂芳基烯基,炔基杂芳基炔基,烷基杂环基烷基,烷基杂环基烯基,烷基杂环基炔基,烯基杂环基烷基,烯基杂环基烯基,烯基杂环基炔基,炔基杂环基烷基等炔基杂环基烯基,炔基杂环基炔基,烷基芳基,烯基芳基,炔基芳基,烷基杂芳基,烯基杂芳基,炔基异芳基,其中一个或多个碳原子,例如亚甲基或亚甲基(CH=)可选地被杂原子如O,S或N,取代或未取代的芳基,取代或未取代的杂芳基,取代或未取代的杂环所中断或终止,并且任选地包含含胍基,例如

其中n=1、2、3、4或5,和/或氨基酸侧链;

R3独立地是2至5环稠合的多环芳香族部分,例如具有2至5个稠合环的取代或未取代的芳基或杂芳基部分,例如但不限于,未取代或取代的戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene),任选被一个或多个杂原子例如O,N和/或S取代,例如呫吨,核黄素(维生素B2),芒果素或芒果苷,并且可以相同或不同,并且在各方面相同。在一些方面中,当识别试剂与靶核酸的相邻序列杂交时,每个均与相邻识别试剂的芳香部分堆叠;

R1和R2各自独立地为:H;含胍基,例如

Figure BDA0002641565620000271

其中n=1,2,3,4,或5,;氨基酸侧链诸如:

直链或支链(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C1-C8)羟烷基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基,(C3-C8)环烷基(C1-C6)亚烷基,任选地被包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;一方面,R1和R2不同,R1是H,R2不是H,或者R2是H,R1不是H。对于与天然核酸(例如RNA或DNA)的结合,R1是H,R2不是H,从而形成“右手”L-γPNA。R2是H而R1不是H的“左手”D-γPNA不结合天然核酸。一方面,所述接头包含约5至25个原子,例如5-20、5-10,例如5、6、7、8、9、10、11、12、13、14、15、16。17、18、19或20个原子,或总共1至10个,例如1、2、3、4、5、6、7、8、9或10个C原子和杂原子,例如O,P,N或S原子。一方面,R1或R2是被以下取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,而s是1到50的整数。

在另一方面,所述识别试剂具有以下结构:

Figure BDA0002641565620000281

其中,

R的每个实例独立地是核碱基,并且R的每个实例可以相同或不同。

Figure BDA0002641565620000282

其中n=1、2、3、4或5;氨基酸侧链,例如:

Figure BDA0002641565620000283

直链或支链(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C1-C8)羟烷基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基,(C3-C8)环烷基(C1-C6)亚烷基,任选地被包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1为H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1-50的整数,且s是1-50的整数。一方面,R1和R2不同,R1为H,R2不为H,或R2为H,R1不为H。

R4和R5之一,和R6,R7,R8之一是-L-R3,其中R3的每个实例独立地是2至5环稠合的多环芳香族部分,例如具有2至5个稠合环的取代或未取代的芳基或杂芳基部分,例如但不限于,未取代或取代的戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene),任选被一个或多个杂原子例如O,N和/或S取代,例如呫吨,核黄素(维生素B2),芒果素或芒果苷,并且可以相同或不同,并且在多个方面相同,并在一些实例中,当识别试剂与靶核酸的相邻序列杂交时,每个均与相邻识别试剂的R3基团堆叠,并且其中L是接头,例如非反应性接头或非反应性、非占位性接头,并且L的每个实例可以相同或不同,并且可以包含氨基酸残基,或取代或未取代的烷基,取代或未取代的烯基,取代或未取代的炔基,芳基烷基,芳基烯基,芳基炔基,杂芳基烷基,杂芳基烯基,杂芳基炔基,杂环基烷基,杂环基烯基,杂环基炔基,芳基,杂芳基,杂环基,环烷基,环烯基,烷基芳基烷基,烷基芳基烯基,烷基芳基烯基炔基,炔基,芳基烯基炔基烷基杂芳基烯基,烷基杂芳基炔基,烯基杂芳基烷基,烯基杂芳基烯基,烯基杂芳基炔基,炔基杂芳基烷基,炔基杂芳基烯基,炔基杂芳基炔基,烷基杂杂环基烷基,烷基杂杂环基烯基,烷基杂烷基烯基杂环基炔基,炔基杂环基烷基,炔基杂环基烯基,炔基杂环基炔基,烷基芳基,烯基芳基,炔基芳基,烷基杂芳基,烯基杂芳基,炔基异芳基,其中一个或多个碳原子,例如亚甲基或甲川(CH=)可选地被杂原子如O,S或N,取代或未取代的芳基,取代或未取代的杂芳基,取代或未取代的杂环,并且R4,R5,R6,R7,和R8各自独立为:H;一个或多个连续的氨基酸残基;含胍基例如

其中n=1、2、3、4或5;氨基酸侧链,例如:

Figure BDA0002641565620000302

直链或支链(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C1-C8)羟烷基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基,(C3-C8)环烷基(C1-C6)亚烷基,任选地被包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1为H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

在一方面,R4和R7是-L-Ar,并且在另一方面,R4和R7是-L-Ar并且R5和R8是Arg。一方面,所述接头包含约5至25个原子,例如5-20、5-10,例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个原子,或总共1至10个,例如1、2、3、4、5、6、7、8、9或10个C原子和杂原子,例如O,P,N或S原子。在另一方面,R1,R2,R4,R5,R6,R7,或R8中的一个或多个是被以下取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1为H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

在另一方面,所述识别试剂包含PNA主链,因此具有以下结构:

其中,

n为1-8的整数,包括1、2、3、4、5、6,,7或8;

m是1-5的整数,例如1-3,包括1、2、3、4或5;

R2为:含胍基,例如

其中n=1、2、3、4或5;氨基酸侧链,例如:

直链或支链(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C1-C8)羟烷基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基,(C3-C8)环烷基(C1-C6)亚烷基,任选地被包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1为H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;

R3是未取代的稠环多环芳香族部分,例如戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,

Figure BDA0002641565620000321

萘并萘/并四苯,七曜烯

其中n=1、2、3、4或5,氨基酸侧链,或一个或多个连续氨基酸残基,例如一个或多个Arg残基。一方面,R3是芘。

另一方面,R2是-CH2-(OCH2-CH2)r-OH,其中r是1-50的整数,例如1-10,例如1、2、3、4、5、6、7、8、9或10,并且在一个示例中为2。在另一个方面,R2、R5、R7或R8中的一个或多个是被以下基团取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1

-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1为H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

尽管先前的基于PNA的识别试剂显示为没有手性,但在一个示例中,伽马碳(R1和R2附着在其上)处于(R)方向,其中R2是H且R1不是H,或伽马碳原子处于(S)方向,其中R1是H且R2不是H。在一个示例中,当存在时,在R3,R4,R5,R6,R7和/或R8位置,一个或多个或全部手性氨基酸残基可以是L-氨基酸。在另一个实例中,当存在时,在R3,R4,R5,R6,R7和/或R8位置中,一个或多个或全部手性氨基酸残基可以是D-氨基酸。

在以上任何结构中,识别试剂的序列可以靶向扩张的重复序列,因此示例性核碱基序列包括(例如,在单个识别试剂中或在连接时)以下:TTC,CCG,CGG,CTG,CAG,CAGG,AGAAT或GGCCCC,用于靶向mRNA(有义)。这些序列仅是示例性的,并且用于靶向重复元件中的序列,例如“…CAGCAGCAG…”,重复序列的任何顺序组合可以包含在单个识别试剂中。例如,序列CTG将靶向互补的CAG重复,但是TGC和GCT及其二聚体,CTGCTG,TGCTGC和GCTGCT也将如此。因此,以下序列可用于靶向表B中所示的mRNA中的扩张的重复序列:TTC,TTCTTC,TCT,TCTTCT,CTT,CTTCTT,CCG,CCGCCG,CGC,CGCCGC,GCC,GCCGCC,CGG,CGGCGG,GCG,GCGGCG,GGC,GGCGGC,CTG,CTGCTG,TGC,TGCTGC,GCT,GCTGCT,CAG,CAGCAG,AGC,AGCAGC,GCA,GCAGCA,CAGG,CAGGCAGG,AGGC,AGGCAGGC,GGCA,GGCAGGCA,GCAG,GCAGGCAG,AGAAT,GAATA,AATA,ATAGA,TAGAA,GGCCCC,GCCCCG,CCCCGG,CCCGGC,CCGGCC和CGGCCC。前述序列5'至3'列出反平行于有义mRNA链,例如在γPNA中以C端至N端方向。

本文描述的识别试剂的R基团以与模板核酸中的核碱基序列互补的序列排列,使得组合物将与模板核酸中的核碱基序列结合。“模板核酸”包括任何核酸或核酸类似物。当模板在细胞内时,可能是核酸,例如DNA或RNA,例如沉默的mRNA。如果识别试剂是在体外组装的,则模板可以是允许与本文所述的识别试剂特异性杂交的核酸或其任何类似物。

除非另有说明,否则本文描述的识别试剂未针对任何特定的核碱基序列进行描述。本公开内容涉及连接描述的识别试剂的方法和组合物,例如基于γPNA主链的那些,并且不依赖于连接至其的碱基的身份和序列。预期连接至所述γPNA寡聚体主链的任何核苷碱基序列将通过沃森-克里克或类似沃森-克里克样氢键键合以预期的、特异性的方式与靶核酸或核酸类似物的互补核碱基序列杂交。本文所述的组合物和方法是与序列无关的,并且描述了新颖的、通用的方法和相关的组合物,用于从较短的γPNA(前体)序列进行模板定向的较长γPNA序列的组装。

本文所述识别试剂的核碱基设置在与模板核酸的靶序列互补的序列中,例如mRNA,例如含有扩张的重复序列的mRNA,使得如本文所述的两种或多种识别试剂通过碱基配对例如通过沃森-克里克或沃森-克里克样碱基配对结合模板核酸上的碱基序列并连接在一起。可以根据本文所述方法组装的识别试剂组合的非限制性实例是两种识别试剂,其中第一识别试剂具有与模板核酸或核酸类似物的第一序列互补的核碱基序列,并且第二识别试剂具有与模板上紧邻模板上第一序列的第二序列互补的核碱基序列,使得两种前体结合模板上的连续一系列碱基,例如如图1所示。可以以这种方式组装两种或更多种不同的识别试剂,每种识别试剂在模板核酸的较长连续序列中结合相邻的短序列,并与相邻的识别试剂连接在一起。在一个实例中,如图1所示,所述识别试剂具有与模板上的重复序列互补的单个核碱基序列,使得两个或多个相同的识别试剂串联结合模板上的连续重复序列。如上所述,基于表B,将靶向上述基因产物的识别试剂包括TTC,CCG,CGG,CTG,CAG,CAGG,AGAAT或GGCCCC。在另一个示例中,可以选择具有不同序列的两种或更多种不同的识别试剂以连接独特的非重复序列。例如,可以产生两种不同的六聚体识别试剂以在靶序列(例如mRNA)中存在的独特12个核苷酸序列上彼此相邻杂交。

如上所述,提供了产生串接的核酸或核酸类似物,例如构象预组织的核酸类似物如γPNA的方法,其包括根据上述任何方面将多个识别试剂结合到模板核酸或核酸类似物上。当末端芳基彼此接近时,组合物将连接。当芳基足够接近使得它们堆叠时,例如如图1所示,认为所述芳基彼此接近。

在另一种方法中,将如本文所述的识别试剂引入细胞中以获得治疗效果。适用于体外或体内使用的各种转染试剂适合于将本文所述的组合物递送至细胞,例如

Figure BDA0002641565620000341

或脂质体制剂(可从多种来源商购获得,参见Immordino等,“Stealthliposomes:review of the basic science,rationale,and clinical applications,existing and potential,”,(2006)Int'l J.Nanomedicine1(3):297-316)。一旦进入细胞内,所述识别试剂将连接在合适的核酸模板上,例如天然mRNA。当多于一种识别试剂与相同模板核酸杂交时,将所述末端芳基彼此靠近,例如,在连续序列中彼此相邻,由于近端芳基的π堆积,所述识别试剂将连接。不结合含有识别试剂序列的重复序列的核酸或与多于一种递送的识别试剂互补的相邻序列的化合物将从结合的核酸释放,因为例如3到8聚体的结合强度不足以将化合物维持在结合的核酸上。当多于一种识别试剂与靶核酸序列结合时,例如与相邻的重复序列结合时,它们将形成足够长度的连接结构,从而以足够强度结合核酸以保持与靶序列杂交,以实现期望的效果,例如基因沉默,其中组合物具有siRNA,miRNA,mirtron的序列或类似组合物。

一些方面中提供了治疗患有表B中列出疾病的患者的方法,例如1型肌强直性营养不良(DM1)和2型肌强直性营养不良(DM2)或亨廷顿舞蹈病。该方法包括根据本文所述的任何方面施用一定量的识别试剂,并其与患者mRNA中的重复扩张靶序列互补,有效地敲低包含患者中重复扩张靶序列的mRNA的表达。对于DM1,靶序列是(CTG)n,因此识别试剂具有序列:CTG,CTGCTG,TGC,TGCTGC,GCT或GCTGCT。对于DM2,靶序列是(CCTG)n,因此识别试剂具有序列:CAGG,CAGGCAGG,AGGC,AGGCAGGC,GGCA,GGCAGGCA,GCAG或GCAGGCAG。对于亨廷顿舞蹈病,靶序列是(CAG)n,因此识别试剂具有序列:CTG,CTGCTG,TGC,TGCTGC,GCT或GCTGCT。与上述序列互补的序列可用于结合含有扩张的重复序列的DNA反义链。

为了治疗患者,识别试剂可以通过任何有效的给药途径给药,例如但不限于:肠胃外给药,例如通过静脉内,腹膜内,器官内给药,例如递送至肝脏,或肌内注射;通过吸入,例如在喷雾或气溶胶计量吸入器中;局部,例如皮肤,透皮,耳或眼科递送;透粘膜,例如经***或口腔;或口服。组合物可以作为单独剂量或随时间以多剂量施用,以维持靶RNA的降低表达。

在一些方面中,本文提供药物组合物和制剂,其包括本文所述的识别试剂。在一个方面,本文提供了药物组合物,含有如本文所述的识别试剂和药学上可接受的载体。含有所述识别试剂的药物组合物可用于治疗疾病,例如重复扩张疾病,例如表B中列出。这种药物组合物基于递送模式配制。一个实例是配制用于通过肠胃外递送进行全身施用的组合物,例如通过静脉内(IV)或用于皮下递送。药物组合物可以以足以治疗疾病的剂量施用,例如通过敲低mRNA的表达,如对于重复扩张疾病。通常,合适的识别试剂剂量在每天接受者每公斤体重约0.001至约200.0毫克的范围内,通常在每天每公斤体重约1至50毫克的范围内。重复剂量方案可以包括定期施用治疗量的识别试剂,例如每隔一天或每年一次。在某些方面中,所述识别试剂约每月施用一次至约每季度施用一次(例如,约每三个月施用一次)。在初始治疗方案之后,可以降低治疗施用的频率。本领域技术人员将认识到,某些因素可以影响有效治疗受试者所需的剂量和时间,包括但不限于疾病或病症的严重程度、先前的治疗、受试者的一般健康和/或年龄以及存在其他疾病。而且,用治疗有效量的组合物治疗受试者可以包括单一治疗或系列治疗。本文涵盖的各个识别试剂的有效剂量和体内半衰期的估计可以使用常规方法或基于使用适当动物模型的体内测试来进行。

药物组合物可以以多种方式给药,这取决于是否需要局部或全身治疗以及待治疗的区域。给药可以是局部的(例如通过透皮贴剂)、经肺(例如通过吸入或吹入粉末或气溶胶,包括通过雾化器)、经气管内、经鼻内、经表皮和透皮,经口服或经肠胃外。肠胃外给药包括经静脉内,动脉内,皮下,腹膜内或肌内注射或输注;经真皮下,例如通过植入装置;或经颅内,例如通过实质内、鞘内或心室内给药。上述识别试剂可以以靶向特定组织例如肝脏(例如肝脏的肝细胞)的方式递送。

用于局部给药的药物组合物和制剂可以包括透皮贴剂,软膏剂,乳液,乳膏剂,凝胶剂,滴剂,栓剂剂,喷雾剂,液体和粉末。常规的药物载体,水性,粉末性或油性碱,增稠剂等可能是必需的或期望的。涂层避孕套,手套等也可能有用。合适的局部制剂包括其中识别试剂与局部递送剂例如脂质,脂质体,脂肪酸,脂肪酸酯,类固醇,螯合剂和表面活性剂混合的那些。合适的脂质和脂质体包括中性(例如二油酰磷脂酰DOPE乙醇胺,二肉豆蔻酰磷脂酰胆碱DMPC,二硬脂酰磷脂酰胆碱),阴性(例如二肉豆蔻酰磷脂酰甘油DMPG)和阳离子(例如二油酰四甲基氨基丙基DOTAP和二油酰磷脂酰乙醇胺DOTMA)。识别试剂可以包封在脂质体内或可以与其形成复合物,特别是与阳离子脂质体。或者,识别试剂可以与脂质复合,特别是与阳离子脂质复合。合适的脂肪酸和酯包括但不限于花生四烯酸,油酸,二十烷酸,月桂酸,辛酸,癸酸,肉豆蔻酸,棕榈酸,硬脂酸,亚油酸,亚麻酸,二癸酸酯,三癸酸酯,单油酸甘油酯,二月桂酸甘油酯,1-一癸酸甘油酯,1-十二烷基氮杂环庚烷-2-酮,酰基肉碱,酰基胆碱,或C1-20烷基酯(例如肉豆蔻酸异丙酯-IPM),甘油单酯或甘油二酯;或其药学上可接受的盐。局部制剂在美国专利No.6747014中详细描述。如本文所述,药物和复合技术人员可以制备用于递送识别试剂的合适制剂。

另一方面,提供了一种诊断方法,包括使包含核酸的样品与本文所述的基因识别试剂接触,并在含有基因识别试剂的靶序列的核酸存在下检测上述基因识别试剂的连接。在一个方面,核酸获自细胞,例如患者的细胞。如本文所述,核酸与基因识别试剂接触,荧光末端芳基在pi堆叠例如连接时产生不同的发射波长或发射强度。许多稠环多环芳香族化合物,例如芘,以这种方式用于荧光检测。基因识别试剂与核酸样品内的靶序列的结合将产生可检测的荧光发射,使得该发射的检测被认为是阳性反应,表明存在包含靶序列的核酸。这是检测核酸存在的简单方法,所述核酸包括序列的重复扩张,并且指示从中获得核酸样品的患者中的重复扩张疾病。

在一些实施方案中,本公开提供了一种化合物,其包含:a)肽核酸(PNA)单元系列,其中所述单元系列包括i)第一单元;ii)最后单元;和iii)第一单元和最后单元之间的至少一个中间单元,其中所述系列单元中的每个单元包括:a)主链部分,其中:1)所述第一单元的主链部分共价结合到另一单元的主链部分;2)最后单元的主链部分共价结合到另一单元的主链部分;3)每个中间单元的主链部分共价结合到另外两个单元的主链部分;b)与所述第一单元共价连接的第一芳基部分;和c)与所述最后单元共价连接的最后芳基部分。

在一些实施方案中,本公开提供了一种化合物,其包含:a)PNA单元系列,其中所述系列单元包括i)第一单元;ii)最后单元;和iii)第一单元和最后单元之间的至少一个中间单元,其中所述系列单元中的每个单元包括:a)主链部分,其中:1)第一单元的主链部分共价结合到另一单元的主链部分;2)最后单元的主链部分共价结合到另一单元的主链部分;3)每个中间单元的主链部分共价结合到另外两个单元的主链部分;和B)核碱基与所述主链部分共价结合;b)两个芳基部分,一个与所述第一单元共价连接,另一个与所述最后单元共价连接。

在一些实施方案中,本公开提供了一种化合物,其中所述第一芳基部分通过第一接头部分与所述第一单元共价连接,并且所述最后芳基部分通过最后接头部分与所述最后单元共价连接。在一些实施方案中,本公开提供了一种化合物,其中所述第一接头部分和所述最后接头部分各自独立地包含胍基。在一些实施方案中,本公开提供了一种化合物,其中所述第一接头部分和所述最后接头部分各自独立地包含氨基酸残基。在一些实施方案中,本公开提供了一种化合物,其中所述第一接头部分和所述最后接头部分各自独立地包含三个含胍的氨基酸残基。

在一些实施方案中,本公开提供了一种化合物,其中所述第一接头部分和所述最后接头部分各自独立地包含三个连续的精氨酸残基。

在一些实施方案中,本公开提供了其中所述系列单元为3至8个单元的化合物。在一些实施方案中,本公开提供了其中系列单元是γ-PNA的化合物。在一些实施方案中,本公开提供了一种化合物,其中所述第一芳基部分和所述最后芳基部分各自独立地为2至5环稠合的多环芳香族部分,例如聚芳烃如芘。在一些实施方案中,本公开提供了其中所述第一芳基部分和最后芳基部分相同的化合物。在一些实施方案中,本公开提供了进一步包含乙二醇单元的化合物,例如二甘醇单元。

在一些实施方案中,本公开提供了一种化合物,其中所述化合物以与靶核酸序列互补的顺序呈递核碱基。在一些实施方案中,本公开提供了其中靶核酸序列与重复扩张疾病相关的化合物。在一些实施方案中,本公开提供了其中重复扩张疾病是1型肌强直性营养不良(DM1)或2型肌强直性营养不良(DM2)的化合物。在一些实施方案中,本公开提供了化合物,其中当两种化合物与核酸杂交时,一种化合物的第一芳基部分和另一化合物的最后芳基部分堆叠。

在一些实施方案中,本公开提供了下式的化合物:H-LArg-CAGCAG-LArg-NH2(P1);H-LArg-LDab(Pyr)-CAGCAG-LOrn(Pyr)-LArg-NH2(P2);H-LArg-LOrn(Pyr)-CAGCAG-LOrn(Pyr)-LArg-NH2(P3);H-LArg-LLys(Pyr)-CAGCAG-LLys(Pyr)-LArg-NH2(P4);H-LArg-LLys(Pyr)-CATCAG-LLys(Pyr)-LArg-NH2(P5);或H-LArg-LLys(Pyr)-CTGCTG-LLys(Pyr)-LArg-NH2(P6),其中Orn是鸟氨酸,Dab是二氨基丁酸,Pyr是羧基官能化的芳族化合物,例如芘,例如芘-1-羧酸,芘-2-羧酸,芘-4-羧酸,芘-1-乙酸,芘-2-乙酸或芘-4-乙酸。

在一些实施方案中,本公开提供了结合核酸的方法,所述方法包括使所述核酸与本公开化合物接触,其中所述化合物在接触时与核酸结合。在一些实施方案中,本公开提供了一种敲低细胞中mRNA表达的方法,该方法包括使所述细胞与本公开化合物接触,其中所述化合物在结合细胞中对应于mRNA的DNA序列后敲低细胞中mRNA的表达。

在一些实施方案中,本公开提供了以下结构的化合物:

Figure BDA0002641565620000391

,其中每个B独立地是主链残基;n是1,2,3,4,5或6;每个R独立地是核碱基;每个L独立地是接头;并且每个Ar独立地是2至5环稠合的多环芳香族部分或其药学上可接受的盐。

在一些实施方案中,本公开提供了具有以下结构的化合物:

Figure BDA0002641565620000392

,其中每个R独立地是核碱基;n是1,2,3,4,5或6;每个L独立地是接头;每个R1和R2独立地是:H;含胍基团;氨基酸侧链;直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地被包含1到50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;每个R3独立地是2到5环稠合的多环芳香族部分,或其药学上可接受的盐。

在一些实施方案中,本公开提供了具有以下结构的化合物:

Figure BDA0002641565620000401

,其中每个R独立地为碱基;n为1、2、3、4、5或6;每个R1和R2独立地是:H;含胍基团;氨基酸侧链;直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地被包含1到50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;R4或R5中的一个,以及R6、R7或R8中的一个是-L-R3,并且R4、R5、R6、R7和R8的其余部分各自独立地为H,一个或多个邻接氨基酸残基、含胍基团、氨基酸侧链、直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地被包含1到50个乙二醇部分的乙二醇单元取代,-CH2-(OCH2-CH2)qOP1,-CH2-(OCH2-CH2)q-NHP1,-CH2-(OCH2-CH2)q-SP1,-CH2-(SCH2-CH2)q-SP1,-CH2-(OCH2-CH2)r-OH,-CH2-(OCH2-CH2)r-NH2,-CH2-(OCH2-CH2)r-NHC(NH)NH2,或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1选自H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基和(C3-C8)环烷基(C1-C6)亚烷基组成的组;q是0到50的整数;r是1到50的整数,且s是1到50的整数;每个R3独立地是2到5环稠合多环芳香族部分;并且每个L独立地是接头,或其药学上可接受的盐。

在一些实施方案中,本发明提供了具有以下结构的化合物:

,其中n是1、2、3、4、5、6、7或8;m是1、2、3、4或5;R2是:含胍基团;氨基酸侧链;直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地被包含1到50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;R3是戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene);且R5、R7和R8中的每一个独立地为H、氨基酸侧链、至少一个相邻氨基酸残基的链,或

Figure BDA0002641565620000412

,其中n是1、2、3、4或5,或其药学上可接受的盐。

在一些实施方案中,本发明提供了一种基因识别试剂,其包含:核酸或核酸类似物主链,其具有第一端和第二端,并且具有3到8个核糖-5-磷酸、脱氧核糖-5-磷酸或核酸类似主链残基;核碱基,可以相同或不同,连接到多个核糖-5-磷酸、脱氧核糖-5-磷酸或核酸类似主链残基;通过接头连接到核酸或核酸类似物主链的所述第一端的第一芳基部分;以及任选地与第一芳基部分相同的第二芳基部分,由接头连接到所述核酸或核酸类似物主链的第二端。

在一些实施方案中,本发明提供了一种检测方法,包括a)将第一探针核酸与靶核酸的第一重复部分杂交,所述第一探针核酸包括连接到第一发射极部分的第一端和连接到第二发射端部分的第二端;和b)将第二探针核酸与靶核酸的第二重复部分杂交,所述第二探针核酸包括连接到第三发射极部分的第一端和连接到第四发射端部分的第二末端;其中i)所述靶核酸的第一和第二重复部分与重复扩张疾病相关联;ii)所述第一探针核酸和第二探针核酸与靶的结合表明所述第一或第二发射极部分接近所述第三或第四发射极部分;以及iii)第一或第二发射极部分靠近所述第三或第四发射极部分的存在导致近距离发射极部分的发射波长的改变。

在一些实施方案中,所述检测方法还包括检测近距离发射部分的发射波长的变化。在一些实施方案中,将所述第一探针核酸与第一重复部分杂交增加第二探针核酸与第二重复部分的亲和力。在一些实施方案中,第一或第二发射极部分靠近所述第三或第四发射极部分的存在导致第一或第二发射极部分与第三或第四发射极部分之间的pi-pi堆叠相互作用。在一些实施方案中,所述靶核酸直接从生物样品中获得。

实施例

肽核酸(PNA)是一种随机折叠的核酸模拟物,包含一个假肽主链,可以预组织成右旋螺旋基序,并且可以通过在γ主链上安装(R)-二甘醇(miniPEG,或MP)单元来改善其水溶性和生物相容性(图6)。这种分子折叠体对DNA或RNA具有超高的亲和力和序列特异性。这些热力学性质支持开发相对较短的MPγPNA探针用于靶向重复扩张如rCUGexp的可行性。

方法

紫外熔融实验:所有紫外熔融样品均通过在生理模拟缓冲液(10mM NaPi(磷酸钠缓冲液)、150mM KCl、2mM MgCl2;pH 7-4)中以指定浓度将MPγPNA与RNA靶混合制备,并在90℃培养5分钟,然后逐渐冷却至室温。使用安捷伦卡里UV-vis300光谱仪采集紫外熔融曲线。收集紫外熔融光谱,其通过如下进行:监测260nm处的紫外吸收,在加热过程中从25℃到95℃,在冷却过程中从95℃到25℃,均以0.2℃/min的速率。冷却曲线和加热曲线几乎相同,表明杂交过程是可逆的。使用20点邻接平均算法对记录的光谱进行平滑处理。采用熔融曲线的一阶导数来确定双链体的熔化温度。

稳态荧光测量:所有稳态荧光样品均如下制备:通过在模拟生理缓冲液中以指定浓度混合P4-RNA双链体,并通过在90℃温育5分钟,随后逐渐冷却至37℃。在测量之前,样品在37℃温育1小时。用Cary-Eclipse荧光光谱仪采集37℃的稳态荧光数据。(εex=350nm和εem=480nm),具有狭缝尺寸。

实时荧光结合动力学:对于实时荧光动力学实验,样品制备如下:(1)P4单独制备,(2)测量前退火的P4、T1和T8,(3)在37℃将P4添加到T8中,以及(4)在等摩尔结合位置在存在T1的情况下将P4添加到T8。用Cary-Eclipse荧光光谱仪在37℃采集实时荧光数据。(εex=350nm和εem=480nm),具有狭缝尺寸。

竞争结合试验:T6购自IDT。T48,与r(CUG)96相同,如前所述制备,只是DNA模板为(CTG)96。T6和T48分别通过加热至90℃、5min并逐渐冷却至室温来退火。将探针和RNA靶在指定浓度混合,并在37℃的生理模拟缓冲液中在硅涂层的Eppendorf管中温育4小时。然后用三硼酸缓冲液将样品装载到含有IX-SYBR金的2%琼脂糖凝胶上,在100V电泳分离15分钟,用紫外透照仪观察条带。

通过探针对T48-MBNL1的破坏进行分析:T48和GST-MBNL1-F1如前所述制备。在含有50mM Tris、50mM NaCl、50mM KCI和1mM MgCl2(pH 8.0)的缓冲液中,用放射性同位素标记的T48在25℃温育30分钟。将指示浓度的P4加入到T48-MBNL1络合物中。立即将样品加载到具有1X三硼酸缓冲液的1.5%琼脂糖凝胶中,在100V电泳分离2小时。这些条带通过荧光成像显示,并用ImageQuant(分子动力学)定量。

我们合成了一系列长度为6个碱基的MPγPNA探针,包括末端芘(P2到P6,图6),以及P1对照物,并对其结合性质进行了表征。P2到P4包括连接芘到探针主干的不同接头长度(图6,Il)。P5和P6包含相应的单碱基和双基错配,旨在测试识别特异性。我们选择了一个串联的三联体重复序列,因为先前的研究表明,长度相似的MPγPNA能够在生理温度下与RNA靶发生短暂的相互作用。芘由于其扩张的芳香表面和二聚反应时发射光谱的较大向红位移而被作为促进结合协同性的模型化合物,并且Sugiyama及其同事在聚酰胺与DNA的协同结合中已经成功地证明了这一点。后者的光化学性质为监测探针杂交和芘-芘相互作用提供了方便的手段。单体是根据已公布的方案制备的。在HMBA树脂上合成探针,通过RP-HPLC纯化,并通过MALDI-TOF MS验证。选择一系列包含不同数量六聚体r(CUGCUG)-重复序列的模型RNA靶点进行结合研究(图6(C))。

所有实验均在生理相关离子强度(10mM NaPi、150mM KCI和2mM MgCl2,pH 7.4)下进行。制备RNA浓度,使每个样品中的r(CUGCUG)-重复次数相同。初步研究表明,在三个接头长度(图6,P2到P4)中,赖氨酸产生了最高程度的结合协同作用(图7)。基于这一发现,我们选择P4并对不同RNA靶点进行紫外熔融研究。我们的结果显示P4-RNA序列的熔融转变(Tms)随着靶点的数目单调增加(图8)。从P4-T6和P4-T8在40-70℃温度范围内的逆吸收曲线可以看出芘-芘相互作用。加热后,由于芘准分子在进一步加热后解离之前,相对于单体的振动跃迁,Ae°→°/Am°→°~0.6,因此憎溶剂效应变得更加明显。比较P4-RNA、P1-RNA和RNA三个序列的Tms,发现了一个不同的模式。P4-RNA序列的Tms呈正线性相关,Y=66+2X,X为靶点中结合位点的数量(图9)。然而,对于后两个系列,Tms在X~3处趋于稳定,这表明RNA中结合位点的数量增加超过3个并不一定使相应的发夹结构在热力学上更加稳定。与完全匹配的序列相比,不匹配的P5和P6探针在RNAs的Tms中没有观察到明显的差异(插图)。综上所述,这些结果表明P4与RNA重复靶点发生协同和序列特异性结合。PNA配体偶联物也观察到了这种现象。

为了进一步证实这些发现,我们在相同条件下进行了荧光测量。样品在340nm处激发,在345-650nm处记录到荧光信号。芘-芘准分子形成的特征是480nm处的发射(图10)。与紫外熔融数据一致,P4与RNA结合的协同程度随结合位点的数目而增加,在480nm处荧光强度逐渐增加。样品在紫外线照射下明显不同,因此可以用肉眼区分(图11)。动力学测量进一步显示,P4到T8的杂交在10分钟内几乎完成(图10,插图)。以与结合位点等摩尔比加入竞争的T1链,导致杂交延迟时间为2min,之后观察到P4和T8完全荧光恢复和结合。这一结果表明,在生理模拟条件下,P4与单结合位点RNA的相互作用是微弱和短暂的,并且在相同的时间内实现了探针与RNA重复序列的完全恢复和结合。

为了评估P4探针的识别选择性,我们进行了竞争结合分析。根据我们公布的方案制备的正常长度T6和致病性T48[r(CUG)96的等摩尔结合位点与不同浓度的P4在37℃温育16小时。用琼脂糖凝胶对所得混合物进行分析,并用SYBR-金染色进行可视化。对图12的检查表明P4能够区分致病性T48和wt-T12(比较泳道6和泳道3)。利用单碱基不匹配的P5探针没有观察到结合的迹象(比较泳道7和泳道3)。这些结果表明P4能够区分扩张的T48转录子和wt-T6,并且探针结合以序列特异的方式发生。

接下来,我们通过进行凝胶转移分析来确定P4是否可以破坏rCUGexp-MBNL1复合物。在生理相关条件下,将5'-32P标记的T48与MBNL1温育,制备RNA蛋白复合物。在确认其结合后,添加P4,并将所得混合物在37℃温育4小时,然后通过非变性聚丙烯酰胺凝胶电泳和放射自显影法进行分析。T48-MBNL1络合物的形成可从图13的泳道2到4中观察到的涂抹模式证实。P4的加入导致了一个位移带的形成,随着探针浓度的增加(泳道5到7)其变得更加明显。我们将这一结果作为证据,证明P4能够破坏rCUGexp-MBNL1复合物,导致T48-P4异源双链体的形成,并使所有MBNL1蛋白从RNA转录子中移位。这种能力对DMI疾病途径的干扰至关重要。

与常规反义剂(通常长度在15-30个核苷酸范围内)或包含所有锁定核酸(LNA)的较短版本相比,MPγPNA在合成上更灵活。它的结构和化学功能可以很容易地改变,以满足现有的应用要求。较小的探针尺寸为生物和生物医学应用提供了几个明显的好处,包括更容易进行化学合成和规模放大,以及提高识别特异性和选择性(可能还有药代动力学特性)。芘具有良好的化学和光物理性质,被选为诱导分子间π-π相互作用的模型化合物。然而,在实际的生物和生物医学应用中,这种芳香族侧基很容易被更具生物良性的或提供健康益处的天然产品所取代,如核黄素(维生素B2)、芒果素或芒果苷,所有这些都可以因芳香族、熔环结构而促进π-π相互作用(下图)。这些都是天然的抗氧化剂,存在于水果和蔬菜中,常用作饮食补充剂来对抗氧化应激、炎症、癌症、衰老和其他疾病。

这个例子表明,相对较短的核酸探针(长度为两个三联体重复序列,包含末端芳香部分)可以将致病性rCUGexp与包含短CUG重复序列的转录子区分开来,并且能够破坏rCUGexp-MBNL1复合物。除了体积小的优点外,MPγPNA探针的模块化设计、高识别特异性和选择性可以靶向RNA重复扩张,并且不仅适用于rCUGexp,而且适用于其他广泛的重复序列,作为DM1以及其他一些相关的神经肌肉和神经退行性疾病的可能治疗方法。

以下编号的项目提供了本发明各个方面的非限制性示例:

第1项.一种基因识别试剂,其包含:核酸或核酸类似物主链,具有第一端和第二端,并且具有3到8个核糖、脱氧核糖或核酸类似物主链残基;核碱基,其可以相同或不同,在与靶核酸互补的序列中连接到多个核糖、脱氧核糖或核酸类似主链残基;第一芳基部分,通过接头连接到所述核酸或核酸类似物主链的第一端;和任选地与所述第一芳基部分相同的第二芳基部分,通过接头连接到所述核酸或核酸类似物主链的第二端,其中当识别试剂与靶核酸的相邻序列杂交时,该芳基部分与所述相邻识别试剂的芳基部分堆叠。

第2项.第1项所述的基因识别试剂,其结构为:

Figure BDA0002641565620000462

其中,

n是1到6的整数;

R的每个实例独立地是一个核碱基,产生核碱基的序列,其任选与所述靶核酸互补;

B是核糖、脱氧核糖或核酸类似主链残基;

L独立地是接头;和

Ar的每一实例独立地是2到5环稠合的多环芳香族部分。

第3项.第1项或者第2项所述的基因识别试剂,其中所述核酸或核酸类似物主链残基为核酸类似物主链残基。

第4项.第3项所述的基因识别试剂,其中所述核酸类似物主链残基包括构象预组织残基。

第5项.第4项所述的基因识别试剂,其中所述构象预组织核酸主链残基为γPNA、LNA或乙二醇核酸主链残基。

第6项.第4项所述的基因识别试剂,其中所述构象预组织的核酸类似物主链残基为γPNA主链残基。

第7项.第6项所述的基因识别试剂,其中所述γPNA主链残基中的一个或多个被包含具有1到100个乙二醇残基的乙二醇单元的基团取代,例如:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H、(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数,并且任选地通过(C1-C6)二价烃基接头连接到一个或多个γPNA主链残基。

第8项。第4项所述的基因识别试剂,其中构象预组织的核酸类似物主链残基为L-γPNA。

第9项.第1-8项之一所述的基因识别试剂,其结构为:

Figure BDA0002641565620000481

其中,

R独立地是核碱基;

n是1到6之间的整数,例如1、2、3、4、5或6;

L独立地是接头;

R1和R2各自连接到伽马碳上,并且独立地为:H;含胍基团;氨基酸侧链;直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地用包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;以及

R3独立地为2至5环稠合的多环芳香族部分,

或其药学上可接受的盐。

第10项.第9项中的基因识别试剂,其中每个接头独立地包含一个或多个含胍基、一个或多个氨基酸侧链或一个或多个相邻氨基酸残基。

第11项.第9项所述的基因识别试剂,其中所述L的每一实例包括第一氨基酸残基,其具有侧基

,其中n的范围为1到5,并且n-末端和C-末端精氨酸残基都附着到每个所述第一氨基酸残基上。

第12项第11项中的基因识别试剂,其中n的范围为1到3。

第13项第1-12项之一所述的基因识别试剂,其结构为:

Figure BDA0002641565620000491

其中,

R独立地是核碱基;

n是1到6之间的整数,例如1、2、3、4、5或6;

R1和R2各自连接到伽马碳上,并且独立地为:H;含胍基团;氨基酸侧链;直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地用包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;

R4或R5中的一个以及R6、R7或R8中的一个是-L-R3,其中R3独立地是2至5环稠合的多环芳香族部分,且L是接头,且R4、R5、R6、R7和R8的其余部分各自独立地是:H;一个或多个相邻氨基酸残基;含胍基;氨基酸侧链;直链或支链(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C1-C8)羟基烷基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基,(C3-C8)环烷基(C1-C6)亚烷基,任选地用包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数,

或其药学上可接受的盐。

第14项.根据第13项所述的基因识别试剂,其特征在于,其中R1、R2、R3、R4、R5、R6、R7或R8中的一个或多个是以下取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2;其中,P1为H、(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基,(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

第15项.根据第13或14项所述的基因识别试剂,其中R4及R7是–L-R3

第16项.根据第13-15项之一所述的基因识别试剂,其中R5及R8包含精氨酸残基。

第17项.第1-16项之一的基因识别试剂,其结构为:

n是1到8的整数;

m是1到5的整数;

R2连接到伽马碳上,并且是:含胍基;氨基酸侧链;直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地用包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;

R3是未经取代的稠环多环芳香族部分,例如戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,

Figure BDA0002641565620000511

萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene);以及

R5、R7和R8中的每一个独立地为H,含胍基团例如

其中n=1、2、3、4或5,氨基酸侧链或一个或多个相邻氨基酸残基,

或其药学上可接受的盐。

第18项.根据第17项所述的基因识别试剂,其中所述R1、R2、R4、R4、R5、R6、R7或R8中的一个或多个是以下取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2;其中,P1为H、(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基,(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

第19项.根据第17项所述的基因识别试剂,其中R2是-CH2-O-CH2-O-CH2-CH2-OH,R8是H,R5是Arg-Dab(芘)-、Arg-Orn(芘)-,或Arg-Lys(芘)-;R7为–Dab(芘)-Arg、-Orn(芘)-Arg或-Lys(芘)-Arg,任选地,其中Arg、Dab、Orn和Lys的手性中心为L-Arg、LDab、L-Orn和L-Lys。

第20项.根据第2-19项之一所述的基因识别试剂,其中所述2至5环稠合多环芳香族部分的两个实例是相同的。

第21项.根据第2-20项之一所述的基因识别试剂,其中所述2至5环稠合的多环芳香族部分中的一个或两个是未经取代或取代的戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,

Figure BDA0002641565620000522

萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene),可任选地用一个或多个杂原子例如O、N、P和/或S取代。

第22项.根据第2-21项之一所述的基因识别试剂,其中所述2-5环稠合多环芳香部分中的一个或两个包含核黄素(维生素B2)、芒果素(mangostin)或芒果苷(mangiferin)。

第23项.根据第9-27项之一所述的基因识别试剂,其中R1和R2在两个或多个伽马碳中不同。

第24项.根据第23项所述的基因识别试剂,其中R1是其中R1和R2不同的所述两个或多个伽马碳中的H。

第25项.根据第23项所述的基因识别试剂,其中R2是其中R1和R2不同的所述两个或多个伽马碳中的H。

第26项.根据第1-25项之一所述的基因识别试剂,其包含胍部分。

第27项.根据第1-26项之一所述的基因识别试剂,其包含含胍基

其中n=1、2、3、4或5。

第28项.根据第9-27项之一所述的基因识别试剂,其中,R2是-CH2-(OCH2-CH2)r-OH,其中r是1到50的整数、1到10的整数或2。

第29项.根据第9-27项之一所述的基因识别试剂,其中,R2为-CH2-O-CH2-CH2-O-CH2-OH,和/或R3为芘。

第30项.根据第1-29项之一所述的基因识别试剂,其中所述接头包含5至25个原子,或总计1至10个总C、O、P、N及S原子。

第31项.根据第1-30项之一所述的基因识别试剂,其中所述碱基序列与具有与重复扩张疾病相关联的扩张的重复序列的核酸完全互补,例如FRDA、FRAXA、FRAXE、SCA1、SCA2、SCA3(MJD)、SCA6、SCA7、SCA17、DRPLA、SBMA、HD、MD1、MD2、FXTAS、SCA8、SCA10、SCA12、HDL2或ALS。

第32项.根据第31项所述的基因识别试剂,其中所述扩张的重复序列具有以下序列之一:(GAA)n,(CGG)n,(CCG)n,(CAG)n,(CTG)n,(CCTG)n,(ATTCT)n,或(GGGGCC)n,其中n至少为3。

第33项.一种结合核酸的方法,包括将具有靶标序列的核酸与第1-32项之一所述的基因识别试剂接触。

第34项.根据第33项所述的方法,其中所述基因识别试剂的碱基序列与具有与重复扩张疾病相关联的扩张的重复序列的核酸完全互补,例如FRDA、FRAXA、FRAXE、SCA1、SCA2、SCA3(MJD)、SCA6、SCA7、SCA17、DRPLA、SBMA、HD、MD1、MD2、FXTAS、SCA8、SCA10、SCA12、HDL2或ALS。

第35项.根据第34项所述的方法,其中所述扩张的重复序列具有以下序列之一:(GAA)n,(CGG)n,(CCG)n,(CAG)n,(CTG)n,(CCTG)n,(ATTCT)n,或(GGGGCC)n,其中n至少为3。

第36项.一种在细胞中敲低mRNA表达的方法,包括将所述mRNA的靶标序列与具有与靶标序列互补的核碱基序列的根据第1-32项之一所述的基因识别试剂接触。

第37项.根据第36项所述的方法,其中所述基因识别试剂的碱基序列与具有与重复扩张疾病相关联的扩张的重复序列的核酸完全互补,例如FRDA、FRAXA、FRAXE、SCA1、SCA2、SCA3(MJD)、SCA6、SCA7、SCA17、DRPLA、SBMA、HD、MD1、MD2、FXTAS、SCA8、SCA10、SCA12、HDL2或ALS。

第38项.根据第37项所述的方法,其中所述扩张的重复序列具有以下序列之一:(GAA)n,(CGG)n,(CCG)n,(CAG)n,(CTG)n,(CCTG)n,(ATTCT)n,或(GGGGCC)n,其中n至少为3。

第39项.一种识别样品中核酸的靶标序列的方法,包括:将包含核酸的样品与第1项所述的基因识别试剂接触,其中芳基部分当未连接到靶标序列上当暴露于光的激发频率时产生第一荧光发射,以及当连接到目标序列上时的当暴露于光的激发频率时产生不同于第一荧光发射的第二荧光发射,以及通过激发荧光芳香族部分并测量由荧光芳香族部分在样品中产生的第二荧光信号的量来确定靶标序列在样品中的存在。

第40项.根据第39项所述的方法,其中该荧光芳香族部分是芘。

第41项.根据第39项所述的方法,其中所述基因识别试剂的碱基序列与具有与重复扩张疾病相关联的扩张的重复序列的核酸完全互补,例如FRDA、FRAXA、FRAXE、SCA1、SCA2、SCA3(MJD)、SCA6、SCA7、SCA17、DRPLA、SBMA、HD、MD1、MD2、FXTAS、SCA8、SCA10、SCA12、HDL2或ALS。

第42项.根据第39项所述的方法,其中所述扩张的重复序列具有以下序列之一:(GAA)n,(CGG)n,(CCG)n,(CAG)n,(CTG)n,(CCTG)n,(ATTCT)n,或(GGGGCC)n,其中n至少为3。

第43项.组合物,其包含根据第1-32项之一所述的基因识别试剂及药学上可接受的载体。

本发明已参照某些示例性实施方案、可分散组合物及其用途来描述。然而,本领域技术人员将认识到,在不脱离本发明的精神和范围的情况下,可以进行任何示例性实施例的各种替换、修改或组合。因此,本发明不受示例性实施例的描述的限制。

序列表

<110> ***梅隆大学

<120> 模板导向的核酸靶向型化合物

<130> 6526-1807599

<150> US 62/708,789

<151> 2017-12-21

<160> 1

<170> PatentIn version 3.5

<210> 1

<211> 18

<212> RNA

<213> 人

<400> 1

cugcugcugc ugcugcug 18

54页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:受体抑制剂、包含其的药物组合物及其用途

相关技术

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类