二价核酸配体及其用途

文档序号:1047712 发布日期:2020-10-09 浏览:8次 >En<

阅读说明:本技术 二价核酸配体及其用途 (Bivalent nucleic acid ligand and use thereof ) 是由 D·H·李 S·A·撒德克 J·D·R·佩雷拉 于 2018-12-21 设计创作,主要内容包括:提供包含二价核碱基的基因识别试剂,其结合核酸的两条链,例如与扩张性重复疾病相关的扩张性重复序列。在一个示例中,所述扩张性重复疾病是polyQ疾病,例如亨廷顿舞蹈病。提供了所述试剂的使用方法,包括结合核酸的方法,所述核酸例如与扩张性重复疾病相关的扩张性重复序列,鉴定包含扩张性重复的核酸的存在的方法,以及治疗扩张性重复疾病的方法。(Gene recognition agents comprising divalent nucleobases are provided that bind to both strands of a nucleic acid, such as the distensible repeat sequences associated with distensible repeat disease. In one example, the dilated repeat disease is a polyQ disease, such as huntington&#39;s disease. Methods of using the agents are provided, including methods of binding nucleic acids, such as the distensible repeat sequences associated with distensible repeat disease, methods of identifying the presence of nucleic acids comprising a distensible repeat, and methods of treating distensible repeat disease.)

二价核酸配体及其用途

关于联邦资金的声明

本发明是在美国国立卫生研究院授予的R21NS098102资助和国家科学基金会授予的CHE1039870资助的政府支持下完成的。政府拥有本发明的某些权利。

相关申请的交叉引用

本申请要求2017年12月21日提交的共同未决的美国临时申请No.62/708,783和2018年2月14日提交的共同未决的美国临时申请No.62/710,262的权益,其每一个都以其全文整体并入本申请中。

与本申请相关联的序列表通过EFS-Web以电子格式提交,并据此通过引用整体并入本说明书。包含序列表的文本文件的名称为6526_1807597_ST25.txt。文本文件的大小为444字节,该文本文件于2018年12月21日创建。

背景技术

1.发明领域

本文描述了使用核酸和核酸寡聚物组合物结合核酸的组合物。还提供了一种治疗扩张性重复疾病的方法,例如,诸如亨廷顿氏病的PolyQ疾病。

2.相关技术的描述

RNA重复的扩张在神经肌肉疾病(或疾病)中普遍存在。亨廷顿氏病(HD)是一个这样的例子,它是一种常染色体显性遗传疾病,会影响肌肉协调,并导致行为改变、认知能力下降和痴呆。HD通常在中年出现,发病后10至20年死亡。它是由亨廷顿(htt)基因第一个外显子中CAG重复序列的扩张引起的,从正常范围的6-29扩大到病原范围的40-180。CAG重复扩张的长度(CAGexp)与发病年龄成反比。Htt编码一种348kDa蛋白,该蛋白广泛表达,但最主要在CNS的神经元中表达,具有多种生理作用,包括胚胎发育和神经保护作用。CAG重复序列在Htt的N端区域翻译为多聚谷氨酰胺(polyQ)序列。尽管对分子功能障碍和临床表现有广泛的了解,但尚不完全了解CAGexp引起HD的确切机制。然而,越来越多的证据表明这是一种多变量疾病。

蛋白质功能的丧失可能导致HD的发病,但是由于CAGexp的杂合子和纯合子患者具有相似的临床特征,因此不太可能是首要原因。此外,已经鉴定出尽管由于htt等位基因之一的缺失而使正常Htt蛋白水平降低50%,却没有表现出异常表型的个体。同样,对于httnull突变杂合的小鼠也没有显示HD的临床特征,而且纯合子在早期胚胎发生中死亡。这些发现强调了Htt在胚胎发育中的重要性,但在HD的发病机理中却没有。越来越多的证据表明,有害的功能获得是该疾病更合理的原因。该推测被以下观察证实,即不相关基因中超过相似阈值(30-40个单元)的CAG重复还可以导致HD之外的多种神经肌肉疾病,包括DRPLA(齿龈-睑板肌萎缩症),SBMA(脊髓和延髓)肌萎缩症),SCA1(脊髓小脑性共济失调1型),SCA2(脊髓小脑性共济失调2型),SCA3(脊髓小脑性共济失调3型或Machado-Joseph疾病),SCA6(脊髓小脑性共济失调6型),SCA7(脊髓小脑性共济失调7型),SCA17(脊髓小脑共济失调17型)。这些被称为polyQ疾病的疾病具有许多特征,包括皮质下和皮质萎缩,以及HD共有的核聚集体。

已经针对HD和其他polyQ疾病提出了三种主要的细胞毒性机制。首先是polyQ毒性。PolyQ具有聚集其他含polyQ的蛋白质并与之相互作用以形成大型淀粉样结构的倾向。这些关键蛋白的结合和螯合将导致其生理功能丧失,从而导致一系列分子和细胞事件失调。第二个是RNA功能的毒性增益。转录后,rCAGexp采用不完善的发夹结构,该结构隔离了肌盲样蛋白1(MBNL1),另一种RNA剪接调节剂和其他关键蛋白。尽管正常的rCAG重复序列也可以采用发夹基序,但它与扩张版本的序列上下文不同。rCAGexp与MBNL 1的缔合导致复合物以核病灶的形式被捕获在细胞核中,从而阻止了其向细胞质中输出以产生Htt蛋白。由于MBNL1的丢失而被错误剪接的基因转录物是多样的。第三种致病机理是蛋白质毒性。已经显示,在没有ATG起始密码子的情况下,可以通过重复相关的非ATG(RAN)翻译来翻译超过一定长度(>42个单元)的rCAG重复序列,从而导致产生有毒的polyQ和聚丙氨酸(poly A)蛋白质,以及聚丝氨酸(polyS)。后两种机制得到以下发现的进一步支持:在动物模型中,长段未翻译的rCAG重复的表达有害,其行为表现型与HD相似。

总的来说,这些发现表明HD是由RNA和蛋白质功能的毒性增加引起的多变量疾病。这样,治疗HD的一种可能策略是选择性地靶向扩张的转录本,因为这将干扰所有三种疾病途径。本文描述了用于识别rCAG重复序列和其他RNA重复序列的二价核酸配体。

在一方面,提供了基因识别试剂。该试剂包含核酸或核酸类似物主链,该核酸或核酸类似物主链包含三个或更多个核糖、脱氧核糖或核酸类似物主链残基,连接于所述主链残基的二价核碱基序列,其中该二价核碱基序列结合两条核酸链上的重复扩张疾病的扩张性重复的单元靶序列或单元靶序列的一个或多个连续性迭代(sequential iteration)。在另一方面,提供了包含基因识别试剂和药学上可接受的载体的组合物。

另一方面,还提供了结合核酸的方法,该核酸包含与扩张性重复疾病相关的扩张性重复。该方法包括使包含扩张性重复序列的核酸与基因识别试剂接触,所述基因识别试剂包含核酸或核酸类似物主链,所述核酸或核酸类似物主链包含三个或更多个核糖、脱氧核糖或核酸类似物主链残基,连接于所述主链残基的二价核碱基序列,其中二价核碱基的序列结合两条核酸链上的重复扩张疾病的扩张性重复的单元靶序列或单元靶序列的一个或多个连续性迭代。

在另一方面,提供了一种在从患者获得的样品中鉴定包含与扩张性重复疾病相关的扩张性重复的核酸的存在的方法。该方法包括使从患者获得的核酸样品与基因识别试剂接触,该基因识别试剂包含核酸或核酸类似物主链,该核酸或核酸类似物主链包含三个或更多个核糖、脱氧核糖或核酸类似物主链残基,连接至该主链残基的二价核碱基序列,其中二价核碱基的序列结合两条核酸链上的重复扩张疾病的扩张性重复的单元靶序列或单元重复序列的一个或多个连续性迭代,并确定所述基因识别试剂的结合和连接是否出现,其表明样品包含含有与扩张性重复疾病相关的扩张性重复的核酸,并任选治疗患者所述扩张性重复疾病。所述核酸或核酸类似物主链包含第一端和第二端,并且还包含连接至主链第一端的第一连接基团,连接至第二端的第二连接基团,其与第一个连接基团非共价结合或自结合。

在另一个实施方案中,提供了一种在细胞中敲低含有与扩张的重复疾病相关的扩张的重复的基因的表达的方法。该方法包括使包含扩张性重复序列的核酸(例如RNA)与基因识别试剂接触,该基因识别试剂包含含有三个或更多个核糖、脱氧核糖核酸或或核酸类似物主链残基,连接至所述主链残基的二价核碱基序列,其中所述二价核碱基的序列结合两条核酸链上的重复扩张疾病的扩张性重复的单元靶序列或单元靶序列的一个或多个连续性迭代。

附图简述

图1(A)(图1,图(A))用于靶向rCAGexp-发夹结构的JB-MPγPNA配体LG1,LG2和LG3的设计。K:L-赖氨酸,箭头:N-末端。(B)在优选的反平行方向(N-末端面对Watson链的3'-末端)的LG2的代表性结合模式。(C)E,I和F与RNA的相应C-G,A-A和G-C碱基对的H键相互作用。(D)J碱基共价连接的MPγPNA主链的化学结构。(E)通过NMR和X射线测定,γPNAs和γPNA-DNA双链体和PNA[作为PNA-DNA双链体]的假设。

图2.图A-F提供了核酸类似物的示例性结构。

图3描述了氨基酸侧链的各种示例。

图4提供了示例性核碱基的结构。

图5A-5C提供了示例性二价核碱基的结构,其中R是指核苷酸或核苷酸类似物主链单体或残基。

图6.LG1与包含序列r(CAG)4/r(CAG)4的RNA双链体结合的MD模拟结果。LG1:NH2-EIF-H,其中γ-侧链为甲基。(A)在模拟之前(t=0)和之后(t=100ns)具有四个单独的LG1配体和包含四个CAG重复的RNA双链体的结合复合物的表面表示。(B)模拟后,CEG,AJA和GFC三元组的氢键相互作用。(C)LG1的RNA碱基和J碱基之间的每个三元组的H键数,(D)LG1-RNA复合体的回转半径,和(E)LG1-RNA的均方根偏差(RMSD)相对于初始结构的RNA复合物。

图7显示E,I和FJB-MPγPNA单体的结构。

图8和9分别示出了E(15)和F(26)的合成方案。

图10显示了将E(15),F(26)和I(27)偶联到MPγPNA主链的方案。

图11显示了选择用于结合实施例中所述研究的模型RNA靶标(SEQ ID NO:1)。

图12.用R11A的LG2 CD滴定。R11A的浓度为0.5μM,而LG2的浓度为X:0、1.5、2.5、3.5、4.5、5.5、6.5、8.5和11.5μM。将LG2添加到R11A中后,将混合物在37℃温育30min,然后在25℃采集数据。

图13.LG2的CD光谱,所述LG2具有(A)错配的R11U,(B)单链WS和CS和(C)含有单个结合位点的双链HP以及,(D)带有R11A的LG2P的CD光谱。RNA(实线)和[RNA+配体]混合物(虚线)的CD光谱。

图14.配体取向(LG2P)、错配的R11U和单链靶标(WS+CS)的作用。插图:添加2.5μM喷他脒后相应样品的荧光光谱。

图15.用R11A的LG2 NMR滴定。R11A的浓度为0.1mM。将指定摩尔比的LG2等分试样添加到R11A中,并在数据采集之前在37℃温育15分钟。溶剂可交换的质子由虚线表示,不可交换的质子由垂直实线表示。

图16示意性地显示了天然化学连接,如实施例中所述。

图17在37℃添加4MP后母体化合物M的反应进程。(A)反应顺序的概述。最初形成M#和M##中间体,然后转化为反应性LG2N*中间体,并最后转化为环状产物cLG2N。(B)M的MALDI-TOF MS谱图,加入4MP并在37℃温育0、15和60分钟。在0.1X PBS缓冲液中制备样品。

图18.(A)[LG2N+R11A],(B)[LG2N+R11U]和(C)LG2N的MALDI-TOF谱图,与2ME在37℃温育16小时。在进行MS分析之前,将样品用4mM氯化胍复溶并在95℃热变性5分钟。LG2N,R11A,R11U和2ME的浓度分别为22、1、1和500μM。在阳性模式下,未在MALDI-TOF谱中观察到RNA分子。(B)和(C)中的Y轴与(A)中的相同;省略它们以节省空间。

图19.竞争性结合测定。R24A,R127A和R96U的浓度分别为100、18和22nM,每个包含1.1μM结合位点;第2-6和8道LG2N的为11、22、44、88、88和88μM;4MP和TCEP的浓度分别为500和100μM(按该顺序排列)。如所示的结合位点与配体的比例。在0.1X PBS缓冲液中制备样品,并在37℃温育24h,然后用2%琼脂糖凝胶分离,并用SYBR-Gold染色。

图20.在生理模拟的离子强度下的凝胶移位测定。除了缓冲液是PS(10mM NaPi,150mM KCl,2mM MgCl2 pH 7.4)以外,以与图9中所示相同的方式制备样品。R24A,R127A和R96U的浓度分别为100、18和22nM,每个包含1.1μM结合位点;第2-6和8道中的LG2N分别为11、22、44、88、88和88μM;4MP和TCEP的分别为500和100μM(按该顺序排列)。结合位点与配体的比率如所示。样品在37℃温育24小时,然后用2%琼脂糖凝胶分离,并用SYBR-Gold染色。

图21.显示了合成本文所述配体的一般方法。

发明详述

除非另外明确指出,否则在本申请中指定的各个范围内的数值的使用被表示为近似值,好像在所述范围内的最小值和最大值均以单词“约”开头。以这种方式,在所述范围之上和之下的微小变化可用于获得与范围内的值基本相同的结果。另外,除非另外指出,否则范围的公开意图是包括最小值和最大值之间的每个值的连续范围。如本文所用,“一个”和“一种”是指一个或多个。

如本文所用,术语“包括”是开放式的,并且可以与“包括”,“包含”或“特征在于”同义。术语“基本上由...组成”将权利要求的范围限制为指定的材料或步骤以及那些不会实质性影响所要求保护的发明的基本和新颖特征的材料或步骤。术语“由...组成”不包括权利要求中未指定的任何要素,步骤或成分。如本文所用,“包括”一个或多个所述元件或步骤的实施方案还包括但不限于“基本上由这些元件或步骤组成”和“由这些元件或步骤组成”的实施例。

本文提供了用于结合核酸中的靶序列,例如用于结合与涉及核酸序列的重复扩张的疾病相关的重复扩张的组合物和方法。图1是示意图,其图示了本文描述的识别试剂的非限制性实例(基因识别试剂,配体)的结合,其针对在HD和其他PolyQ疾病中所见的RNA发夹结构中的CAG重复。末端自合(self-ligating)基团或π-堆积的芳族基团,例如下文实施例中所述的示例性自合基团,以及如在美国专利申请公开号No.2016/0083433,其通过引用并入本文。在核酸链上或在两条核酸链之间(如果包含二价)的自合基团、pi堆积基团和类似基团共同地共价连接或非共价结合相邻的识别试剂核碱基在本文中统称为“连接基团(concatenating group)”。多种识别试剂通过沃森-克里克(Watson-Crick)或沃森-克里克-样(Watson-Crick-like)协作碱基对结合(杂交)至模板核酸。在细胞中,模板核酸是RNA或DNA分子,尽管在体外,模板核酸可以是任何RNA或DNA,以及修饰的核酸或核酸类似物。足够接近的识别试剂(例如与模板核酸上的相邻序列结合)将自合或π-π堆叠,从而连接基本上形成更长的寡聚物或聚合物。下面提供了更多详细信息。

如本文所用,“患者”是动物,例如哺乳动物,包括灵长类动物(例如人,非人灵长类动物,例如猴子和黑猩猩),非灵长类动物(例如例如牛,猪,骆驼,骆驼,马,山羊,兔子,绵羊,仓鼠,豚鼠,猫,狗,大鼠,小鼠,马和鲸)或鸟(例如鸭或鹅)。

如本文所用,术语“治疗”或“疗法”是指有益的或期望的结果,例如改善一种或多种疾病的症状,术语“治疗”或“疗法”还包括,但不限于减轻或改善重复扩张疾病的一种或多种症状,例如PolyQ重复扩张疾病,例如亨廷顿氏病。“治疗”也可以意味着在没有治疗的情况下延长生存期。

在疾病标记或症状的背景下,“降低”是指该水平的临床相关和/或统计学上明显的降低。降低可以是例如至少10%,至少20%,至少30%,至少40%或更多,降低到对于没有这种疾病的个体可接受的正常范围内的水平,或者低于检测的测定水平。在某些方面,该降低降低至对于没有这种病症的个体而言所接受的在正常范围内的水平,这也可以称为水平的正常化。在某些方面,减少是疾病的体征或症状水平的正常化,疾病体征的受试水平与所述疾病体征的正常水平之间差异的减少(例如,当必须减小受试者的值以达到正常值时,达到较高的正常水平,而当必须将受试者的值增加至正常值时,达到较低的正常水平)。在某些方面,所述方法包括临床上对PolyQ重复扩张疾病例如亨廷顿氏病的mRNA表达的临床相关抑制,例如,如用本发明所述的识别试剂治疗受试者后的临床相关结果所证明的那样。

如本文所用,“治疗有效量”旨在包括如本文所描述的识别试剂的量,当将其施用于患有疾病的受试者时,该量足以实现疾病的治疗(例如,通过减少、改善或维持现有疾病或所述疾病的一种或多种症状)。“治疗有效量”可能会根据以下而变化:识别试剂(剂),给药方式,疾病及其严重程度以及病史,年龄,体重,家族史,遗传构成,既往治疗或伴随治疗的类型(如果有的话),以及要治疗的受试者的其他个体特征。在本文所述的基因识别试剂的情况下,示例性剂量范围,每剂量范围为0.1pg至1mg。

“治疗有效量”还包括一定量的药剂,该药剂以适用于任何治疗的合理的益处/风险比产生某些期望的局部或全身作用。本文所述方法中采用的识别试剂可以以足以产生适用于这种治疗的合理的受益/风险比的量施用。

本文所用的术语“药学上可接受的载体”是指药学上可接受的材料,组合物或媒介物,例如液体或固体填充剂,稀释剂,赋形剂,制造助剂(例如润滑剂,滑石粉,镁,钙或锌)硬脂酸酯或硬脂酸)或溶剂封装材料,涉及将主题化合物从一个器官或身体的一部分运载或运输到另一器官或身体的一部分。每个载体在与制剂的其他成分相容并且对被治疗的受试者无害的意义上必须是“可接受的”。可以用作药学上可接受的载体的材料的一些示例包括:(1)糖,例如乳糖,葡萄糖和蔗糖;(2)淀粉,例如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,例如羧甲基纤维素钠,乙基纤维素和乙酸纤维素;(4)黄芪粉;(5)麦芽;(6)明胶;(7)润滑剂,如镁态,月桂基硫酸钠和滑石粉;(8)赋形剂,例如可可脂和栓剂蜡;(9)花生油,棉籽油,红花油,芝麻油,橄榄油,玉米油,大豆油等油;(10)二醇,例如丙二醇;(11)多元醇,例如甘油,山梨糖醇,甘露糖醇和聚乙二醇;(12)酯,例如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,例如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格的解答;(19)乙醇;(20)pH缓冲溶液;(21)聚酯,聚碳酸酯和/或聚酐;(22)填充剂,例如多肽和氨基酸;(23)血清成分,例如血清白蛋白,HDL和LDL以及(22)药物制剂中使用的其他无毒相容性物质。

如本文所用,术语“细胞”是指来自任何动物,例如但不限于大鼠,小鼠,猴和人的任何类型的细胞。例如但不限于,细胞可以是祖细胞,例如干细胞,或分化的细胞,例如内皮细胞,平滑肌细胞。

“表达”或“基因表达”是指来自基因的全部信息流(不限于,用于在细胞中产生基因产物的功能性遗传单元诸如RNA或蛋白质,或其他在核酸上编码的表达系统,其包含:转录启动子和其他顺式作用元件,例如应答元件和/或增强子;通常编码蛋白质(开放阅读框或ORF)或功能/结构RNA的表达序列,以及聚腺苷酸化序列,以产生基因产物(通常是蛋白质,可选地进行翻译后修饰或功能性/结构性RNA)。“在指定序列的转录控制下表达基因”,或者“受指定序列的控制”,是指含有可操作地连接(通常以顺式功能连接)该指定序列的基因的基因表达。所述指定序列可以是全部或部分转录元件(但不限于启动子,增强子和应答元件),并且可以全部或部分调节和/或影响基因的转录。“用于表达所述基因产物的基因”是当置于合适的环境中时,例如,当被转化,转染,转导等进入细胞并进行细胞表达时,并且在合适的表达条件下,能够表达所述基因产物的基因。在组成型启动子的情况下,“合适的条件”是指通常仅需将基因引入宿主细胞即可。在诱导型启动子的情况下,“合适的条件”是指将一定量的相应诱导剂施用给有效引起基因表达的表达系统(例如细胞)。

如本文所用,术语“敲低”是指相对于功能基因而言,生物体中一个或多个基因的表达通常明显降低,例如相对于治疗有效程度而言。基因敲低还包括完全的基因沉默。如本文所用,“基因沉默”是指基本上完全阻止基因的表达。敲低和基因沉默可能发生在转录阶段或翻译阶段。通过在翻译阶段敲低或沉默一个或多个基因,使用所述识别试剂靶向细胞中的RNA(例如mRNA)可以修饰基因表达。

如本文所用,术语“核酸”是指脱氧核糖核酸(DNA)和核糖核酸(RNA)。核酸类似物包括,例如但不限于:2'-O-甲基取代的RNA,锁核酸,解锁核酸,***连接的DNA,肽核酸,吗啉代寡聚物,双脱氧核苷酸寡聚物,二醇核酸,苏糖核酸酸及其组合,包括任选的核糖核苷酸或脱氧核糖核苷酸残基。在本文中,关于核酸和核酸类似物,“核酸”和“寡核苷酸”是由上位核苷酸组成的短的单链结构,可以互换使用。寡核苷酸可以通过命名法“聚体(-mer)”通过链的长度(即核苷酸数)来指代。例如,具有22个核苷酸的寡核苷酸将被称为22聚体。

“核酸类似物”是包含排列在底物如聚合物主链上的核碱基序列的组合物,并且可以通过沃森-克里克杂交或沃森-克里克样氢键碱基配对而结合DNA和/或RNA。常见核酸类似物的非限制性实例包括肽核酸,例如γPNA,吗啉代核酸,硫代磷酸酯,锁核酸(2'-O-4'-C-亚甲基桥,包括其氧基,硫代或氨基版本),解锁(unlocked)核酸(C2'-C3'键被切割),2'-O-甲基取代的RNA,苏糖核酸,乙二醇核酸等。

构象预组织的核酸类似物是根据核酸主链的结构具有仅形成右手旋螺旋或左手旋螺旋的主链(预组织的主链)的核酸类似物。如本文所示,构象预组织的核酸类似物的一个例子是γPNA,其在γ碳上具有手性中心,并且取决于并由于在γ碳上的基团的手性,仅形成右手螺旋或左手螺旋。同样,锁核酸包含在2'氧和4'碳之间具有桥的核糖,其将所述核糖“锁定”为3'-内(北)构象。

在本公开的上下文中,“核苷酸”是指包含至少一个核碱基和主链元件(主链部分)的单体,其在核酸如RNA或DNA中是核糖或脱氧核糖。“核苷酸”通常还包含允许在特定条件下聚合的反应性基团。在天然DNA和RNA中,这些反应性基团是5'磷酸和3'羟基。为了化学合成核酸及其类似物,碱基和主链单体可以包含修饰的基团,例如本领域已知的封端的胺。“核苷酸残基”是指掺入寡核苷酸或多核苷酸中的单个核苷酸。同样,“核碱基残基”是指掺入核苷酸或核酸或其类似物中的核碱基。“基因识别试剂”一般是指包含核碱基序列的核酸或核酸类似物,所述核碱基序列能够通过协同碱基配对与互补核酸或核酸上的核酸类似物序列杂交,例如沃森-克里克碱基配对或沃森-克里克-样碱基配对。

更详细地,用于RNA、DNA或核酸类似物的核苷酸具有结构A-B,其中A是主链单体部分,并且B是本文所述的核碱基。主链单体可以是任何合适的核酸主链单体,例如核糖三磷酸或脱氧核糖三磷酸,或核酸类似物的单体,例如肽核酸(PNA),例如γPNA(γPNA)。在一个实例中,所述主链单体是核糖单、二或三磷酸核糖或脱氧核糖单、二或三磷酸核糖,例如核糖或脱氧核糖的5'单磷酸、二磷酸或三磷酸。所述主链单体既包括结构上的“残基”成分,例如RNA中的核糖,也包括在将单体连接在一起时修饰的任何活性基团,例如核糖核苷酸的5'三磷酸和3'羟基,它们在修饰时会被聚合成RNA,留下磷酸二酯键。同样对于PNA,N-(2-氨基乙基)甘氨酸主链单体的C-末端羧基和N-末端胺活性基团在聚合过程中缩合以留下肽(酰胺)键。在另一方面,所述活性基团是可用于亚磷酰胺寡聚物合成的亚磷酰胺基团,如本领域广泛已知的。所述核苷酸还任选地包含一个或多个本领域已知的保护基,例如4,4’-二甲氧基三苯甲基(DMT),并且如本文所述。制备合成基因识别试剂的许多其他方法是已知的,并且取决于主链结构和碱基添加过程的特定化学过程。确定在核苷酸单体的连接中利用哪些活性基团以及在碱基中保护哪些基团,以及制备寡聚物所需的步骤是化学领域和核酸核酸类似物寡聚物的合成领域的普通技术人员的能力范围之内。

常见核酸类似物的非限制性实例包括肽核酸,例如γPNA,硫代磷酸酯(例如,图2(A)),锁核酸(2'-O-4'-C-亚甲基桥,包括氧、硫或其氨基版本,例如,图2(B)),解锁核酸(C2'-C3'键被切割,例如,图2(C)),2'-O-甲基取代的RNA,吗啉代核酸(例如,图2(D)),苏糖核酸(例如,图2(E)),乙二醇核酸(例如,图2(F),显示R和S形式)等。图2(A-F)显示了核酸类似物的各种实例的单体结构。图2(A-F)每个显示掺入较长的链中的两个单体残基,如波浪线所示。掺入的单体在本文中被称为“残基”,并且核酸或核酸类似物的除了核碱基之外的部分被称为核酸或核酸类似物的“主链”。例如,对于RNA,示例性的核碱基是腺嘌呤,相应的单体是三磷酸腺苷,并且引入的残基是单磷酸腺苷残基。对于RNA,“主链”由通过磷酸酯连接的核糖亚基组成,因此所述主链单体在掺入前为三磷酸核糖,在掺入后为核糖单磷酸残基。像γPNA一样,锁核酸(图2(B))在构象上是预组织的。

“部分”是分子的一部分,并且包括一类“残基”,其是在化合物或单体掺入所述较大分子后,例如掺入核酸的核苷酸或掺入多肽或蛋白质的氨基酸,该化合物或单体保留在较大分子如聚合物链中的部分。

术语“聚合物组合物”是包含一种或多种聚合物的组合物。作为一类,“聚合物”包括但不限于均聚物,杂聚物,共聚物,嵌段聚合物,嵌段共聚物,并且可以是天然的和合成的。均聚物包含一种类型的结构单元或单体,而共聚物包含一种以上类型的单体。“寡聚物”是包含少量单体,例如3至100个单体残基的聚合物。类似地,术语“聚合物”包括寡聚物。术语“核酸”和“核酸类似物”包括核酸以及核酸聚合物和寡聚物。

如果所述单体被掺入到聚合物中,则该聚合物“包含”或“衍生自”所述单体。因此,所述聚合物包含的引入的单体与引入聚合物之前的单体不同,因为至少在聚合过程中某些接头团被引入聚合物主链或某些基团被除去。如果该键存在于聚合物中,则称该聚合物包含特定类型的键。掺入的单体是“残基”。核酸或核酸类似物的常见单体称为核苷酸。

在化学成分例如分子,化合物,组成,基团,部分,离子等的上下文中,“非反应性”是指该成分在其预期用途中不与其他化学成分发生任何实质程度的反应。选择非反应性成分以不干扰或微不足道地干扰所述成分、部分或基团作为识别试剂的预期用途。在本文所述的接头部分的上下文中,它们是非反应性的,因为它们不干扰识别试剂与靶模板的结合,并且不干扰识别试剂在靶模板上的连接。

如本文所用,“烷基”是指直链,支链或环状烃基,包括例如1至约20个碳原子,例如但不限于C1-3、C1-6、C1-10基团,例如但不限于直链、支链烷基,例如甲基、乙基、丙基、丁基、戊基、己基、庚基、辛基、壬基、癸基、十一烷基、十二烷基等。“取代的烷基”是指在1个或多个,例如1、2、3、4、5或什至6个位置被取代的烷基,该取代基连接在任何可利用的原子上以产生稳定的化合物,如本文所述。“任选取代的烷基”是指烷基或取代的烷基。“卤素”,“卤化物”和“卤代”是指-F,-Cl,-Br和/或-I。“亚烷基”和“取代的亚烷基”分别是指二价烷基和二价取代的烷基,包括但不限于亚甲基、亚乙基、三亚甲基、四亚甲基、五亚甲基、六亚甲基、庚亚甲基、八亚甲基、九亚甲基或十亚甲基。“任选取代的亚烷基”是指亚烷基或取代的亚烷基。

“烯”或“烯基”是指直链、支链或环状烃基,包括例如2至约20个碳原子,例如但不限于C1-3、C1-6、C1-10基团,其具有一个或多个例如1、2、3、4或5个碳-碳双键。“取代的烯”是指在1个或多个,例如1、2、3、4或5个位置上取代的烯,其取代基连接在任何可利用的原子上以产生稳定的化合物,如本文所述。“任选取代的烯”是指烯烃或取代的烯烃。同样,“亚烯基”是指二价烯烃。亚烯基的实例包括但不限于亚乙烯基(-CH=CH-)及其所有立体异构和构象异构形式。“取代的亚烯基”是指二价取代的烯烃。“任选取代的亚烯基”是指亚烯基或取代的亚烯基。

“炔”或“炔基”是指具有指定数目的碳原子和至少一个三键的直链或支链不饱和烃。(C2-C8)炔基的实例包括但不限于乙炔基,丙炔基,1-丁炔基,2-丁炔基,1-戊炔基,2-戊炔基,1-己炔基,2-己炔基,3-己炔基,1-庚炔,2-庚炔,3-庚炔,1-辛炔,2-辛炔,3-辛炔和4-辛炔。炔基可以是未取代的或任选地被一个或多个下文所述的取代基取代。术语“亚炔基”是指二价炔烃。亚炔基的实例包括但不限于亚乙炔基,亚丙炔基。“取代的亚炔基”是指二价取代的炔基。

术语“烷氧基”是指具有指定碳原子数的-O-烷基。例如,(C1-C6)烷氧基包括-O-甲基(甲氧基),-O-乙基(乙氧基),-O-丙基(丙氧基),-O-异丙基(异丙氧基),-O-丁基(丁氧基),-O-仲丁基(仲丁氧基),-O-叔丁基(叔丁氧基),-O-戊基(戊氧基),-O-异戊基(异戊氧基),-O-新戊基(新戊氧基),-O-己基(己氧基),-O-异己基(异己氧基)和-O-新己基(新己氧基)。“羟基烷基”是指其中一个或多个烷基的氢原子被-OH基团取代的(C1-C10)烷基。羟烷基的实例包括但不限于-CH2OH,-CH2CH2OH,-CH2CH2CH2OH,-CH2CH2CH2CH2OH,-CH2CH2CH2CH2CH2OH,-CH2CH2CH2CH2CH2CH2OH及其分支形式。术语“醚”或“氧醚”是指其中一个或多个烷基的碳原子被-O-基团取代的烷基。术语醚包括-CH2-(OCH2-CH2)qOP1化合物,其中P1是保护基,-H或(C1-C10)烷基。示例性的醚包括聚乙二醇,二***,甲基己基醚等。

“杂原子”是指N,O,P和S。含有N或S原子的化合物可以任选地被氧化成相应的N-氧化物,亚砜或砜化合物。“杂取代“是指本文任何实施方案所述的有机化合物,其中其中一个或多个碳原子被N,O,P或S取代。

“芳基”单独或组合是指芳香族环系统,例如苯基或萘基;“芳基”还包括任选地与环烷基环稠合的芳香族环系统。“取代的芳基”是这样的芳基,其独立地被在任何可用原子上连接的一个或多个取代基取代以产生稳定的化合物,其中所述取代基如本文所述。“任选取代的芳基”是指芳基或取代的芳基。“亚芳基”表示二价芳基,和“取代的亚芳基”是指二价取代的芳基。“任选取代的亚芳基“指亚芳基或取代的亚芳基。本文中使用的术语“多环芳基”和相关术语,例如“多环芳族基”是指由至少两个稠合芳族化合物组成的基团。“杂芳基”或“杂取代的芳基”是指被一个或多个杂原子如N,O,P和/或S取代的芳基。

“环烷基”是指单环、双环、三环或多环的3至14元环系统,其为饱和、不饱和或芳香族的。所述环烷基可以通过任何原子连接。环烷基也考虑稠合环,其中所述环烷基稠合于芳基或杂芳基环。环烷基的代表性实例包括但不限于环丙基,环丁基,环戊基和环己基。环烷基可以是未取代的或任选地被一个或多个下文所述的取代基取代。“亚环烷基”是指二价环烷基。术语“任选取代的亚环烷基”是指被1、2或3个取代基取代的亚环烷基,其连接在任何可利用的原子上以产生稳定的化合物,其中所述取代基如本文所述。

“羧基”或“羧基的”是指具有指定碳原子数的基团(如有指定),且其末端为-C(O)OH基团,因此具有-R-C(O)OH结构,其中R是包括直链、支链或环状烃的二价有机基团。这些的非限制性实例包括:C1-8羧基,例如乙醇酸,丙酸,2-甲基丙酸,丁酸,2,2-二甲基丙酸,戊酸等。“胺”或“氨基”是指具有指定数目碳原子的基团,且其末端为-NH2基团,因此具有-R-NH2结构,其中R为未取代或未取代的二价有机基团,例如包括直链,支链或环状烃,并且任选地包含一个或多个杂原子。

组合前述的术语是指前述的任何合适的组合,例如芳基烯基,芳基炔基,杂芳基烷基,杂芳基烯基,杂芳基炔基,杂环基烷基,杂环基烯基,杂环基炔基,芳基,杂芳基,杂环基,环烷基,环烯基,烷基芳基烷基,烷基芳基烯基,烷基芳基炔基,烯基芳基烷基,烯基芳基烯基,烯基芳基炔基,炔基芳基烷基,炔基芳基烯基,炔基芳基炔基,烷基杂芳基烷基,烷基杂芳基烯基,烷基杂芳基炔基,烯基杂芳基烷基,烯基杂芳基烯基,烯基杂芳基炔基,炔基杂芳基烷基,炔基杂芳基烯基,炔基杂芳基炔基,烷基杂环基烷基,烷基杂环基烯基,烷基杂环基炔基,烯基杂环基烷基,烯基杂环基烯基,烯基杂环基炔基,炔基杂环基烷基,炔基杂环基烯基,炔基杂环基炔基,烷基芳基,烯基芳基,炔基芳基,烷基杂芳基,烯基杂芳基,炔基杂芳基。例如,“芳基亚烷基”是指其中亚烷基中的一个或多个氢原子被芳基如(C3-C8)芳基取代的二价亚烷基。(C3-C8)芳基(C1-C6)亚烷基的实例包括但不限于1-苯基丁烯,苯基-2-丁烯,1-苯基-2-甲基丙烯,苯基亚甲基,苯基丙烯和萘乙烯。术语“(C3-C8)环烷基-(C1-C6)亚烷基”是指其中C1-C6亚烷基中的一个或多个氢原子被(C3-C8)环烷基取代的二价亚烷基。(C3-C8)环烷基-(C1-C6)亚烷基的实例包括但不限于1-环丙烯基丁烯,环丙烯基-2-丁烯,环戊基-1-苯基-2-甲基丙烯,环丁亚甲基和环己基丙烯。

“氨基酸”具有结构H2N-C(R)-C(O)OH,其中R是侧链,例如氨基酸侧链。“氨基酸残基”表示当掺入氨基酸链中时的氨基酸的其余部分,诸如当掺入本文公开的识别试剂中时,例如具有结构-NH-C(R)-C(O)-,H2N-C(R)-C(O)-(当在多肽的N端时),或-NH-C(R)-C(O)OH(当在多肽的C端时)。“氨基酸侧链”是氨基酸的侧链,包括蛋白原性或非蛋白原性氨基酸。氨基酸具有以下结构:

Figure BDA0002641634620000151

,其中R是氨基酸侧链。氨基酸侧链的非限制性实例显示在图3中。甘氨酸(H2N-CH2-C(O)OH)没有侧链。

“肽核酸”是指核酸类似物或DNA或RNA模拟物,其中DNA或RNA的糖磷酸二酯主链被N-(2-氨基乙基)甘氨酸单元替代。γPNA(γPNA)是具有以下结构的γ-改性N-(2-氨基乙基)甘氨酸单体的寡聚物或聚合物:

其中,连接至γ碳的R1或R2中的至少一个不是氢,使得γ碳是一个手性中心。当R1和R2是氢(N-(2-氨基乙基)-甘氨酸主链)或相同时,关于γ碳没有这种手性。结合的PNA或γPNA单体,

在本文中称为PNA或γPNA“残基”,指整合到寡聚物中之后的剩余结构,其中每个残基具有与其碱基(核碱基)相同或不同的R基团,例如腺嘌呤,鸟嘌呤,胞嘧啶,胸腺嘧啶和尿嘧啶碱基,或其他碱基,例如本文所述的单价和二价碱基,使得PNA上的核碱基顺序是其“序列”,如DNA或RNA。核酸或核酸类似物寡聚物或聚合物(例如PNA或γPNA寡聚物或聚合物)中的核碱基序列与核酸或核酸类似物中的腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和/或尿嘧啶残基的互补序列通过核碱基配对以沃森-克里克或沃森-克里克-样的方式结合,基本上与双链DNA或RNA一样。

可将“胍”或“胍盐”基团添加至识别试剂以增加溶解度和/或生物利用度。由于PNA的生产方式与合成肽相似,因此添加胍基的简单方法是在PNA的N末端和/或C末端添加一个或多个末端精氨酸(Arg)残基,例如γPNA,识别试剂。同样,精氨酸侧基,或含胍基的部分,例如,

Figure BDA0002641634620000163

其中n例如但不限于,范围为1-5,或上述基团的盐,可以连接到本文所述的识别试剂主链上。含胍基是包含胍部分的基团,并且可以具有小于100个原子,小于50个原子,例如小于30个原子。在一个方面,含胍基具有以下结构:

Figure BDA0002641634620000164

其中L是根据本文所述的任何方面的接头,例如非反应性脂族烃基接头,例如亚甲基、亚乙基、三亚甲基、四亚甲基或五亚甲基接头。在一些方面,含胍基具有以下结构:其中n为1-5,例如,胍基可以是精氨酸。

“核碱基”包括一级核碱基:腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶和尿嘧啶、以及修饰的嘌呤和嘧啶碱基,例如但不限于次黄嘌呤、呫吨、7-甲基鸟嘌呤、5、6-二氢尿嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶。图4和5A-5C还描绘了核碱基的非限制性实例,包括单价核碱基(例如腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶或尿嘧啶,其与核酸或核酸类似物的一条链结合)和二价核碱基(例如本文所述的JB1-JB16),其同时结合两条DNA链上的互补核碱基,并“钳住”核碱基,例如“G-钳”,其以增强的强度结合互补核碱基。另外的嘌呤、嘌呤样、嘧啶和嘧啶样核碱基在本领域是已知的,例如,如美国专利号8,053,212、8,389,703和8,653,254中所公开的。对于图4A所示的二价核碱基JB1-JB16,表A显示了不同核碱基的特异性。值得注意的是,JB1-JB4系列结合互补碱基(C-G,G-C,A-T和T-A),而JB5-JB16结合错配,因此可用于结合两条碱基匹配和/或错配的碱基。二价核碱基在美国专利申请公开号20160083434A1和国际专利公开号WO 2018/058091中有更详细的描述,二者均通过引用并入本文。

表A:二价核碱基

*二氨基嘌呤,腺嘌呤类似物。

如本文所用,“JB#核碱基”,例如“JB4核碱基”,是指具有JB4名称的所有碱基,代表C/G(结合G/C),包括JB4、JB4b、JB4c、JB4d和JB4e。未按本文所述方式用芳基进行端修饰但可以如本文所述的示例性γPNA结构,已在第WO 2012/138955号国际公开文本中公开,并通过引用并入本文中。如本文所示,miniPEGγPNA包括一个或多个包含聚乙二醇(PEG,聚氧乙烯)部分的基团。

互补的是指多核苷酸(核酸)彼此杂交形成链间碱基对的能力。碱基对通过反平行多核苷酸链中核苷酸单元之间的氢键形成。互补的多核苷酸链可以以沃森-克里克方式(例如,A至T,A至U,C至G)或以允许形成双链体的任何其他方式进行碱基配对(杂交)。当使用RNA而不是DNA时,尿嘧啶而不是胸腺嘧啶是与腺苷互补的核碱基。如果包含互补序列的两个序列在下述条件形成双链体则它们可发生杂交:在指定条件下,例如在水,盐水(例如生理盐水或0.9%w/v盐水)或磷酸盐缓冲液中,或在其他严格条件下,例如但不限于,将0.1XSSC(盐水柠檬酸钠)稀释到10X SSC,其中1X SSC是水中的0.15M NaCl和0.015M柠檬酸钠。互补序列的杂交由例如盐浓度和温度决定,解链温度(Tm)降低则错配增加且严格性提高。完全匹配的序列被认为是“完全互补的”,尽管一个序列(例如,mRNA中的靶序列)可能比另一个更长,如本文所述的小型识别试剂与它们所连接的相关更长的靶标例如含有重复扩张的mRNA的情况。两条互补的核酸链以反平行方向结合,一条链以5'至3'方向结合,另一条链以3'至5'方向结合。PNA允许平行和反平行定向,尽管对于γPNA,反平行结合是优选的。

根据本发明的一个方面,提供了一种基因识别试剂。在各方面中,识别试剂是自连接的(self-concatenating),这意味着它包含连接基团,即当与靶核酸上的相邻序列杂交时共价连接或非共价连接例如通过pi堆叠的端基。所述识别试剂包含三个或多个,例如3-10或3-8个连续的核酸或核酸类似物单体残基,其末端基团例如可自合或pi堆叠,并且为了靶向双链RNA发夹序列,包含与与重复扩张疾病相关的重复扩张序列杂交(结合)的核碱基序列。在polyQ疾病的情况下,由rCAGexp序列形成的发夹的双链序列是靶标序列,并且所述试剂具有选自以下的二价核碱基序列:EIF或(EIF)n,其中n是两个或多个整数,例如2、3、4或5,例如EIFEIF;IFE或(IFE)n,其中n是两个或多个整数,例如2、3、4或5,例如IFEIFE;或FEI,或(FEI)n,其中n是两个以上的整数,例如2、3、4或5,例如FEIFEI,其中E是结合C/G的二价核碱基,例如JB3或JB3b(沃森链/克里克链),F是结合G/C的二价核碱基,例如JB4,JB4b,JB4c,JB4d或JB4e,而I是结合A/A的二价核碱基,例如JB6或JB6b,因此能够结合由CAG重复序列形成的发夹的两条杂交链,如图1所示。

本文所述的识别试剂组合了小分子的特征,例如,低分子量,易于大规模生产,生产成本低,细胞渗透性和所需的药代动力学,以及通过沃森-克里克碱基配对对寡核苷酸的序列特异性识别。已经证明了寡聚物识别试剂的连接可用于自连接和π-堆积连接方法,并根据实施例进行描述,其旨在在所有方面进行说明而不是限制。因此,本发明能够在详细的实现方式上有许多变化,这可以从本领域的普通技术人员从这里包含的描述中得出。

本文所述的识别试剂的应用实例是在具有小序列的重复扩张的遗传疾病的治疗中,例如表B中列出的那些。

表B–与扩张性重复相关的遗传疾病

Figure BDA0002641634620000191

Figure BDA0002641634620000201

基于表B,在表C中提供了将靶向所述基因产物的识别试剂的二价核碱基的示例性序列,包括相对于有义链的5'至3'方向的序列。应当理解,取决于它们的序列,并非所有重复序列在正常条件下都会形成发夹结构,但可以通过所列的识别试剂诱导为三链“发夹”结构。而且,表C中列出的序列仅是示例性的,并且取决于天然发夹结构或由识别试剂诱导的发夹结构中的折叠序列的比对,预期其他序列会形成三链体结构。同样,序列的重复性质要求对于三碱基重复,每个序列都可以使用三个不同的移码(请参见表C,(GAA)n为第三列),对于四碱基重复,则可以使用四个不同的移码。是有用的。因此,对于三碱基序列,双链结合比对的排列组合以及在每个比对内移动所述识别试剂的框架的能力(例如,图1中所示rCAGexp序列内比对的EIF,IFE和FEI)造成所述单元识别试剂的9种排列组合方式,其可以在识别试剂中重复。例如,对于序列(GAA)n,在正常条件下不会预期折叠比对形成发夹双链,但是预期三种不同的序列能够形成三链体结构。在表C中,显示所有排列组合的唯一重复序列是(GAA)n的序列,对于其他重复,仅提供示例性序列。值得注意的是,由于所述重复的结构,表C中提供的任何序列可以重复,例如从2-5X,例如G/A-A/A-A/G,也指G/A-A/A-A/G-G/A-A/A-A/G和13-6-14(JB13系列-JB6系列-JB14系列)还包括13-6-14-13-6-14。在表C中,核碱基序列首先由它们结合的靶核碱基进行识别(例如JB4结合G/C,并且也由“JB”参考编号标识,例如,“4”是指“JB4”,包括JB4,JB4b,JB4c,JB4d和JB4e。

表C-识别试剂示例

Figure BDA0002641634620000211

Figure BDA0002641634620000221

在表C中,所述单元识别试剂靶序列(结合的碱基)将所述识别试剂的单个二价核碱基结合的两条链的每个碱基对列为“B1/B2”,其中B1是第一个碱基链,且B2是第二条链的碱基,由所述识别试剂的二价核碱基结合。这样,对于序列(CAG)n,单元靶序列的序列是C/G-A/A-G/C,是指序列5'-CAG-3'的反平行比对,而对于序列(CCG)n,靶序列第二比对的序列C/G-G/C-C/C,指5'-CGC-3'与5'-CCG-3'反平行的比对,而序列C/G-C/C-G/C是指序列5'-CCG-3'的反平行比对。

在识别试剂结合的情况下,“单元靶序列”是这样的最短重复序列,其见于以下中:靶核苷酸序列的重复核碱基序列,或双链序列中包括错配的重复双链核碱基序列,或相同或不同的核酸分子的双链,其当在三链体结构中被二价识别试剂结合时对齐,如本发明所述。

在一个方面,提供了一种识别试剂,其包括:肽核酸或γ肽核酸主链,其具有第一端和第二端,由3个或更多个,例如3至10或3、4、5、6、7、8、9或10,或3-8个PNA或γPNA主链残基制备;在序列中附着或连接至多个核酸或核酸类似物主链残基的核碱基序列;在所述主链第一端的-SH,-OH或-S-S-Lg部分,和在所述主链第二端的-C(O)-S-Lg或C(O)-O-Lg部分(离去基团Lg,通过酯或硫酯键连接到所述主链上),其中核碱基的序列与核酸中的靶序列内的单元靶序列或单元靶序列的两个或多个连续性迭代(指定序列的两个或多个直接重复,无间隔)互补,例如当多个识别模块与所述靶序列的相邻序列结合时,它们彼此接合。一方面,Lg是生物相容的和/或无毒的。Lg的非限制性实例包括取代或未取代的(C1-C8)烷基,取代或未取代的(C3-C8)芳基,(C3-C8)芳基(C1-C6)亚烷基,(C1-C8)羧基,任选被氨基酸侧链取代,或含胍基,或

Figure BDA0002641634620000241

,其中o是1-20,R6的每个实例独立地是氨基酸侧链,并且R7是-OH或-NH2

在另一方面,提供了一种识别试剂,其包括:核酸或核酸类似物主链,其具有由三个或更多个,例如3个或更多个分子制备的第一端和第二端,例如从3至10个或3、4、5、6、7、8、9或10,或3-8个核酸或核酸类似物主链残基制备,其任选地是构象预组织的;在序列中附着或连接至多个核酸或核酸类似物主链残基的核碱基序列;连接至所述核酸或核酸主链的第一端的第一芳基部分;以及第二芳基部分,其任选地与第一芳基部分相同,其连接至所述核酸或核酸主链的第二末端。所述芳基部分独立地是2至5环稠合的多环芳族部分,例如具有2至5个稠合的环的取代或未取代的芳基或杂芳基部分,例如但不限于,未取代或取代的戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉,菲,蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,

Figure BDA0002641634620000242

萘并萘/并四苯,七曜烯,苉或苝,任选被一个或多个杂原子如O,N和/或S取代,例如,呫吨,核黄素(维生素B2),芒果素或芒果苷,并且可以相同或不同,并且在多个方面相同,只要当识别试剂与靶核酸的相邻序列杂交时,其每一个能够与相邻识别试剂的芳基部分堆叠。所述识别试剂能够结合由扩张性重复序列形成的发夹的两条链,所述扩张性重复序列例如与表B中所列的扩张性重复疾病相关,例如PolyQ疾病。一方面,为了结合CAG重复序列,如上所述,具有序列EIF或(EIF)n,其中n是两个以上的整数,例如2、3、4或5,例如EIFEIF;IFE或(IFE)n,其中n是两个或多个整数,例如2、3、4或5,例如IFEIFE;或FEI,或(FEI)n,其中n是两个以上的整数,例如2、3、4或5,例如FEIFEI。

一方面,所述识别试剂是自合的,并具有以下结构:

其中,X为S或O;n是1到6之间的整数,包括1和6;m是0到4之间的整数;包括0和4。R1和R2各自独立地为:H;含胍基,例如

Figure BDA0002641634620000252

其中n=1、2、3、4或5;氨基酸侧链,例如:

Figure BDA0002641634620000253

直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地用包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数,包括0和50;r和s各自独立地是1到50的整数,包括1和50;

R3是H或离去基团,并且在一方面是生物相容性和/或无毒的,例如取代或未取代的(C1-C8)烷基,取代或未取代的(C3-C8)芳基,(C3-C8)芳基(C1-C6)亚烷基,(C1-C8)羧基,可任选被氨基酸侧链取代,或含胍基

,其中o是1-20,R6的每个实例独立地是氨基酸侧链,并且R7是-OH或-NH2;R4是(C1-C10)二价烃或被一个或多个N或O部分取代的(C1-C10)二价烃,例如-O-,-OH,-C(O)-,-NH-,-NH2,-C(O)NH-;R5是-OH,-SH或二硫键保护基;并且R的每个实例独立地是核碱基,其产生与靶核酸中的核碱基的靶序列互补的核碱基序列,使得多个识别模块中的每一个与模板核酸上的核碱基的靶序列结合互相结合。一方面,R5具有-SH,-OH或-S-S-R8的结构,其中R8是一个或多个氨基酸残基,氨基酸侧链,直链、支链或杂取代的(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C1-C8)羟烷基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基,(C3-C8)环烷基(C1-C6)亚烷基。一方面,R1或R2是氨基酸侧链或含胍基,例如

Figure BDA0002641634620000262

其中n=1、2、3、4或5。一方面,R1和R2不同,R1是H且R2不是H,或R2是H且R1不是H。对于结合天然核酸,例如RNA或DNA,R1可以是H且R2不是H,从而形成“右手”L-γPNA。其中例如R2是H而R1不是H的“左手”D-γPNA不结合天然核酸。一方面,识别试剂被一个或多个含胍基取代,例如

其中n=1、2、3、4或5。

一方面,R1或R2是被以下取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,而s是1到50的整数。

端基为芳基的识别试剂具有作为紧邻杂交识别试剂的芳基的非共价结合例如pi堆叠的结果而连接的能力。因此,在另一方面,提供了一种识别试剂(识别模块),其结构为:

Figure BDA0002641634620000271

,其中R独立地是核碱基,并且R的每个实例可以相同或不同;

n是1至6的整数,例如1、2、3、4、5或6;

每个B独立地是核糖5'磷酸残基,脱氧核糖-5-磷酸残基或核酸类似物主链残基,并且在一方面,是构象预组织的核酸类似物的主链残基如γPNA或LNA;

L独立地是接头,例如,非反应性接头或非反应性、非占位性接头,并且L的每个实例可以相同或不同;和

Ar的每个实例独立地是2至5环稠合的多环芳香族部分,例如具有2至5个稠合的环的取代或未取代的芳基或杂芳基部分,例如但不限于,未取代或取代的戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene),任选被一个或多个杂原子例如O,N和/或S取代,例如呫吨,核黄素(维生素B2),芒果素或芒果苷,并且可以相同或不同,并且在方面中相同。在一些方面中,当识别试剂与靶核酸的相邻序列杂交时,每个Ar均与相邻识别试剂的Ar基团堆叠。

化合物中的部分,例如芳基部分或核碱基共价连接至识别试剂主链,因此被称为“连接”至主链。取决于用于制备化合物的化学性质,连接可以是直接的,或通过“接头”直接连接,该“接头”是共价连接两个其他部分或基团的部分。一方面,末端芳族(芳基)基团通过接头连接至识别试剂。该接头是将芳族基团连接至识别试剂的主链的非反应性部分,并且在一些方面包括1-10个碳原子(C1-C10),其任选地被杂原子如N,S或O取代,或非反应性键,例如通过使胺与羧基反应形成的酰胺键(肽键)。C1-C10亚烷基的实例是直链或支链亚烷基(二价)部分,其任选地包含环状部分,例如亚甲基,亚乙基,三亚甲基,四亚甲基,五亚甲基,六亚甲基,庚亚甲基,八亚甲基,九亚甲基或十亚甲基部分(即,-CH2-[CH2]n-,其中n=1至9),任选地包含酰胺键。接头是非占位性的,因为它们在空间上不会阻碍或以其他方式在很大程度上干扰识别试剂与靶模板的结合,并且不会干扰识别试剂在靶模板上的连接。接头是由芳族基团和识别试剂的主链连接而产生的剩余部分,例如,

Figure BDA0002641634620000281

或在一个非限制性实例中,

Figure BDA0002641634620000282

是由乙酸取代的芳基化合物(A)例如芘-1-乙酸与Dab(n=1),Orn(n=2)或Lys(n=3)残基的连接而产生的。

在其他方面,接头或接头基团是连接化合物的两个部分,例如,共价连接化合物的两个部分的有机部分,例如但不限于在本发明的上下文中,芳族基团与识别试剂的主链的连接,核碱基与核酸或核酸类似物主链的连接和/或胍基与识别试剂的连接。接头通常包含直接键或原子如氧或硫,单元如C(O),C(O)NH,SO,SO2,SO2NH或原子链,例如但不限于,取代或未取代的烷基,取代或未取代的烯基,取代或未取代的炔基,芳基烷基,芳基烯基,芳基炔基,杂芳基烷基,杂芳基烯基,杂芳基炔基,杂环基烷基,杂环基烯基,杂环基炔基,芳基,杂芳基,杂环基,环烷基,环烯基,烷基芳基烷基,烷基芳基烯基烯基芳基烷基,烯基芳基烯基,烯基芳基炔基,炔基芳基烷基,炔基芳基烯基,炔基芳基炔基,烷基杂芳基烷基,烷基杂芳基烯基,烷基杂芳基炔基,烯基杂芳基烷基,烯基杂芳基烯基,烯基杂芳基炔基,炔基杂芳基烷基,炔基杂芳基烯基,炔基杂芳基炔基,烷基杂环基烷基,烷基杂环基烯基,烷基杂环基炔基,烯基杂环基烷基,烯基杂环基烯基,烯基杂环基炔基,炔基杂环基烷基,炔基杂环基烯基,炔基杂环基炔基,烷基芳基,烯基芳基,炔基芳基,烷基杂芳基,烯基杂芳基,炔基异芳基,其中一个或多个碳原子例如亚甲基或次甲基(-CH=)任选被杂原子诸如O,S或N,取代或未取代的芳基,取代或未取代的杂芳基,取代或未取代的杂环中断或终止。一方面,所述接头包含约5至25个原子,例如5-20、5-10,例如5、6、7、8、9、10、11、12、13、14、15、16。17、18、19或20个原子,或总共1至10个,例如1、2、3、4、5、6、7、8、9或10个C原子和杂原子,例如O,P,N或S原子。

对于与PNA(例如γPNA)的键合,一种方便且可用的接头是使胺与羧基反应形成酰胺键的接头,例如,使用众所周知的肽合成化学方法将氨基酸添加至识别试剂,其中氨基酸可以用化学部分(例如芳基部分或胍基)进行预修饰,如以下实施例所示,并添加芳基修饰的氨基酸以连接所述芘芳基部分到所述识别试剂,并利用精氨酸提供胍基。与非肽核酸类似物的连接可以使用广为人知的任何合适的连接化学方法来实现,例如通过使用碳二亚胺化学方法实现,例如EDC(EDAC,1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐)例如通过末端磷酸酯将胺修饰的Ar基团连接至识别试剂。

在将芳族基团连接至识别试剂的主链上时,该接头具有适当的大小或长度,从而在靶核酸序列上该识别试剂的连接过程中,将芳族基团放置在π-π堆叠的位置,如本文所述。

在另一方面,识别试剂具有以下结构:

Figure BDA0002641634620000291

其中,

R的每个实例独立地是核碱基,并且R的每个实例可以相同或不同。

n为1-6的整数,例如1、2、3、4、5或6;

R1和R2各自独立地是:H,含胍基,例如

Figure BDA0002641634620000301

其中n=1、2、3、4或5为氨基酸侧链,例如:

Figure BDA0002641634620000302

未取代或取代的(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C1-C8)羟基烷基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基,(C3-C8)环烷基(C1-C6)亚烷基;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(OCH2-CH2-0)q-SP1;-CH2-(SCH2-CH2)q-SP1,-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数;并且一方面,R1和R2不同,R1是H且R2不是H,或者R2是H且R1不是H;

R10或R11中的一个以及R12、R13或R14中的一个是-L-R3,其中R3的每个实例独立地是2至5环稠合的多环芳香族部分,例如具有2至5个稠合的环的取代或未取代的芳基或杂芳基部分,例如但不限于,未取代或取代的戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene),任选被一个或多个杂原子例如O,N和/或S取代,例如呫吨,核黄素(维生素B2),芒果素或芒果苷,并且可以相同或不同,并且在多个方面相同,并在一些实例中,当识别试剂与靶核酸的相邻序列杂交时,每个均与相邻识别试剂的R3基团堆叠,并且其中L是接头,例如非反应性接头或非反应性、非占位性接头,并且L的每个实例可以相同或不同,并且可以包含氨基酸残基,或取代或未取代的烷基,取代或未取代的烯基,取代或未取代的炔基,芳基烷基,芳基烯基,芳基炔基,杂芳基烷基,杂芳基烯基,杂芳基炔基,杂环基烷基,杂环基烯基,杂环基炔基,芳基,杂芳基,杂环基,环烷基,环烯基,烷基芳基烷基,烷基芳基烯基,烷基芳基烯基炔基,炔基,芳基烯基炔基烷基杂芳基烯基,烷基杂芳基炔基,烯基杂芳基烷基,烯基杂芳基烯基,烯基杂芳基炔基,炔基杂芳基烷基,炔基杂芳基烯基,炔基杂芳基炔基,烷基杂杂环基烷基,烷基杂杂环基烯基,烷基杂烷基烯基杂环基炔基,炔基杂环基烷基,炔基杂环基烯基,炔基杂环基炔基,烷基芳基,烯基芳基,炔基芳基,烷基杂芳基,烯基杂芳基,炔基异芳基,其中一个或多个碳原子,例如亚甲基或甲川(CH=)可选地被杂原子如O,S或N,取代或未取代的芳基,取代或未取代的杂芳基,取代或未取代的杂环,以及R10,R11,R12,R13和R14的其余部分分别独立地为:H;一个或多个连续的氨基酸残基;含胍基;氨基酸侧链;直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地用包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

在一方面,R4和R7是-L-R3,并且在另一方面,R4和R7是-L-R3,并且R11和R14是Arg。一方面,所述接头包含约5至25个原子,例如5-20、5-10,例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个原子,或总计1至10个,例如1、2、3、4、5、6、7、8、9或10个C和杂原子,例如O、P、N或S原子。在另一方面,R1,R2,R10,R11,R12,R13,或R14中的一个或多个是被以下取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1为H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

在另一方面,所述识别试剂包含PNA主链,因此具有以下结构:

其中,

n为1-8的整数,包括1、2、3、4、5、6,7或8;

m是1-5的整数,例如1-3,包括1、2、3、4或5;

R2为:含胍基,例如

Figure BDA0002641634620000322

其中n=1、2、3、4或5;氨基酸侧链,例如:

Figure BDA0002641634620000323

未取代或取代的(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C1-C8)羟烷基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基,或(C3-C8)环烷基(C1-C6)亚烷基;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(OCH2-CH2-0)q-SP1;-CH2-(SCH2-CH2)q-SP1,-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1为H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数,包括0和50;r和s各自独立地是1到50的整数,包括1和50;

R3是未取代的稠环多环芳香族部分,例如戊烯,茚,萘,甘菊蓝,庚烯,联苯,as-茚烯、s-茚烯,苊烯,芴,萉(phenalene),菲(phenanthrene),蒽,荧蒽,醋菲烯,醋蒽烯,苯并菲,芘,萘并萘/并四苯,七曜烯(pleiadene),苉(picene)或苝(perylene);且

R11,R13和R14各自独立地为H,含胍基,例如

其中n=1、2、3、4或5,氨基酸侧链,或一个或多个连续氨基酸残基,例如一个或多个Arg残基。一方面,R3是芘。

另一方面,R2是-CH2-(OCH2-CH2)r-OH,其中r是1-50的整数,例如1-10,例如1、2、3、4、5、6、7、8、9或10,并且在一个示例中为2。在另一个方面,R2、R5、R7或R8中的一个或多个是被以下基团取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1为H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

尽管先前的基于PNA的识别试剂显示为没有手性,但在一个示例中,伽马碳(R1和R2附着在其上)处于(R)方向,其中R2是H且R1不是H,或伽马碳原子处于(S)方向,其中R1是H且R2不是H。此外,在一个示例中,当存在时,在R10,R11,R12,R13和/或R14位置,一个或多个或全部手性氨基酸残基可以是L-氨基酸。在另一个实例中,当存在时,在R10,R11,R12,R13和/或R14位置中,一个或多个或全部手性氨基酸残基可以是D-氨基酸。

还提供了前述任一项的药学上可接受的盐。

本文描述的任何化合物的药学上可接受的盐也可以用于本文描述的方法中。本文所述化合物的药学上可接受的盐形式可以通过药学领域已知的常规方法来制备,并且包括兽用可接受的盐类。例如但不限于,在化合物包含羧酸基的情况下,可以通过使化合物与合适的碱反应以提供相应的碱加成盐来形成其合适的盐。非限制性实例包括:碱金属氢氧化物,例如氢氧化钾,氢氧化钠和氢氧化锂;碱土金属氢氧化物,例如氢氧化钡和氢氧化钙;碱金属醇盐,例如乙醇钾和丙醇钠;以及各种有机碱,例如哌啶,二乙醇胺和N-甲基谷氨酰胺。

药学上可接受的碱式盐的非限制性实例包括:铝,铵,钙,铜,铁,亚铁,锂,镁,锰,锰,钾,钠和锌盐。衍生自药学上可接受的有机无毒碱的盐包括但不限于:伯胺,仲胺和叔胺的盐,取代胺(包括天然存在的取代胺),环胺和碱性离子交换树脂,例如精氨酸,甜菜碱,咖啡因,氯普鲁卡因,胆碱,N,N'-二苄基乙二胺(苯甲硫氨酸),二环己胺,二乙醇胺,二乙胺,2-二乙基氨基乙醇,2-二甲基氨基乙醇,乙醇胺,乙二胺,N-乙基吗啉,N-乙基哌啶,葡糖胺,葡糖胺,组氨酸,联苯胺,异-丙胺,利多卡因,赖氨酸,葡甲胺,N-甲基-D-葡萄糖胺,吗啉,哌嗪,哌啶,多胺树脂,普鲁卡因,嘌呤,可可碱,三乙醇胺,三乙胺,三甲胺,三丙胺和三-(羟甲基)-甲胺(三甲胺)。

药学上可接受的酸盐的非限制性实例包括:乙酸盐,己二酸盐,藻酸盐,精氨酸盐,天冬氨酸盐,苯甲酸盐,苯磺酸盐(苯磺酸盐),硫酸氢盐,亚硫酸氢盐,溴化物,丁酸盐,樟脑酸盐,樟脑磺酸盐,辛酸盐,氯化物,氯苯甲酸盐,柠檬酸,环戊烷丙酸酯,二葡萄糖酸酯,磷酸二氢酯,二硝基苯甲酸酯,十二烷基硫酸酯,乙磺酸酯,富马酸酯,半乳糖酸酯,半乳糖醛酸酯,葡庚酸酸酯,葡萄糖酸酯,谷氨酸酯,甘油磷酸酯,半琥珀酸酯,半硫酸酯,庚二酸,氢溴酸二氢盐,氢己二酸二氢盐,己二酸二氢盐,己二酸二氢羟乙磺酸盐,异丁酸盐,乳酸盐,乳酸盐,苹果酸盐,马来酸盐,丙二酸盐,扁桃酸盐,偏磷酸盐,甲磺酸盐,甲基苯甲酸盐,磷酸一氢盐,2-萘磺酸盐,烟酸盐,硝酸盐,草酸盐,油酸盐,棕榈酸盐,果胶酸盐,过硫酸盐,苯乙酸丙酯,乙酸丙酯磷酸盐,膦酸盐和邻苯二甲酸盐。

多种盐形式也被认为是药学上可接受的盐。多种盐形式的常见的非限制性实例包括:酒石酸氢盐,二乙酸盐,二富马酸盐,二葡甲胺,二磷酸盐,二钠和三盐酸盐。

这样,本文所用的“药学上可接受的盐”旨在表示包含本文所述的任何化合物的盐形式的活性成分(药物)。盐形式优选赋予本文所述化合物的改善的和/或期望的药代动力学/药效学性质。

本文所述的组合物可以通过任何有效途径施用。递送途径的实例包括但不限于:局部的,例如经表皮、吸入、灌肠、经眼、经耳和经鼻内的递送;经肠,例如,口服、经胃饲管和经直肠;和肠胃外,例如静脉内,动脉内,肌内,心内,皮下,骨内,真皮内,鞘内,腹膜内,透皮,离子电渗疗法,透粘膜,硬膜外和玻璃体内注射,在许多情况下首选口服、静脉内、肌内和透皮方法。合适的剂型可以包括单剂量或多剂量的小瓶或其他容器,例如医用注射器,其包含包含用于治疗重复扩增疾病的活性成分的组合物,如本文所述。

可以调整剂量方案以提供最佳的期望反应(例如,治疗或预防反应)。例如,可以施用单次推注,可以随时间施用数个分开的剂量,或者可以连续或以脉冲方式施用组合物,其中以规则间隔施用剂量或部分剂量,例如每10、15、20、30、45、60、90或120分钟,每天每2到12小时,或每隔一天等,根据治疗情况的要求按比例减少或增加。在一些情况下,以剂量单位形式配制组合物,例如肠胃外或吸入组合物可能是特别有利的,以易于给药和剂量均匀。剂量单位形式的使用规范直接取决于(a)活性化合物的独特特性和要实现的具体治疗或预防作用,以及(b)配制诸如针对个体敏感性进行治疗的活性化合物的技术领域固有的局限性。

有用的剂型包括:静脉内,肌内或腹膜内溶液,口服片剂或液体,局部软膏或乳膏和透皮装置(例如贴剂)。一方面,该化合物是无菌溶液,其包含活性成分(药物或化合物)和溶剂,例如水,盐水,乳酸林格氏液或磷酸盐缓冲盐水(PBS)。所述溶液中可包含其他赋形剂,例如聚乙二醇,乳化剂,盐和缓冲剂。

治疗/药物组合物的制备根据可接受的药学方法进行,例如在以下中描述:《雷明 顿:科学与实践药学》(第21版,编辑),Paul Beringer等人,Lippincott,Williams&Wilkins,Baltimore,MD Easton,Pa.(2005)(参见例如第37、39、41、42和45章中的粉末,液体,肠胃外,静脉内和口服固体的示例性制剂及其制备方法)。

可以调整剂量方案以提供最佳的期望反应(例如,治疗或预防反应)。例如,可以施用单次推注,可以随时间施用数个分开的剂量,或者可以连续或以脉冲方式施用组合物,其中以规则间隔施用剂量或部分剂量,例如每10、15、20、30、45、60、90或120分钟,每天每2到12小时,或每隔一天等,根据治疗情况的要求按比例减少或增加。在一些情况下,以剂量单位形式配制组合物,例如肠胃外或吸入组合物可能是特别有利的,以易于给药和剂量均匀。剂量单位形式的使用规范直接取决于(a)活性化合物的独特特性和要实现的具体治疗或预防作用,以及(b)配制诸如针对个体敏感性进行治疗的活性化合物的技术领域固有的局限性。

有用的剂型包括:静脉内,肌内或腹膜内溶液,口服片剂或液体,局部软膏或乳膏和透皮装置(例如贴剂)。一方面,该化合物是无菌溶液,其包含活性成分(药物或化合物)和溶剂,例如水,盐水,乳酸林格氏液或磷酸盐缓冲盐水(PBS)。所述溶液中可包含其他赋形剂,例如聚乙二醇,乳化剂,盐和缓冲剂。

除基因识别试剂外,本发明的各方面还提供了结合包含与扩张性重复疾病相关的扩张性重复的核酸的方法,包括使包含扩张性重复的核酸与本文任何方面所述的基因识别试剂接触。一方面,所述方法在体外或离体进行。在另一方面,所述方法通过以有效敲低具有扩张性重复的基因的表达或治疗患者的量向患者施用包含所述基因识别试剂的合适药物制剂在体内进行。

在另一方面,提供了一种在从患者获得的样品中鉴定包含与扩张性重复疾病相关的扩张性重复的核酸的存在的方法,例如(CAG)n。该方法包括使从患者获得的核酸样品与根据本文所述的任何方面的基因识别试剂接触。接下来,在样品中的核酸中存在靶序列的情况下发生基因识别试剂的结合和连接,使得结合和连接指示样品中的核酸中靶序列的存在。可以使用任何有效方法来检测和/或定量基因识别试剂的结合和连接。在靶序列中包含扩张性重复序列的核酸的存在与扩张性重复疾病相关,在这一点上,可以例如通过向患者施用包含如本文所述的基因识别试剂的药物剂型来治疗所述患者的扩张性重复疾病。

这样,提供了一种治疗患有与核苷酸序列的扩张性重复相关的疾病的患者的方法。疾病的例子是表B中列出的疾病,或PolyQ疾病,例如亨廷顿氏病,DRRPA(齿弓-睑板肌萎缩症),SBMA(脊髓和延髓性肌萎缩症),SCA1(脊髓小脑性共济失调类型1),SCA2(脊髓小脑性共济失调类型)2),SCA3(脊髓小脑性共济失调3型或Machado-Joseph病),SCA6(脊髓小脑性共济失调6型),SCA7(脊髓小脑性共济失调7型)和SCA17(脊髓小脑性共济失调7型)。通过向患者施用包含本文所述的基因识别试剂的组合物或药物剂型来治疗该疾病,所述基因识别试剂经选择以结合特定疾病的特征性重复序列,例如针对polyQ疾病例如亨廷顿氏病的(CAG)n。药物剂型的组合物以有效治疗疾病的量和剂量方案给予患者。这样,还提供了包含如本文所述的基因识别试剂的组合物的用途,用于治疗与核苷酸序列的扩大的重复序列相关的疾病,例如PolyQ疾病,例如亨廷顿氏病,DRPLA(齿-睑-卢氏肌萎缩症),SBMA(脊髓和延髓性肌萎缩症),SCA1(脊髓小脑性共济失调1型),SCA2(脊髓小脑性共济失调2型),SCA3(脊髓小脑性共济失调3型或Machado-Joseph病),SCA6(脊髓小脑性共济失调6型),SCA7脊髓小脑性共济失调7型)和SCA17(脊髓小脑性共济失调17型)。

在一些实施方案中,本公开提供了一种化合物,其包含:a)肽核酸(PNA)单元系列,其中所述单元系列包括i)第一单元;ii)最后单元;和iii)第一单元和最后单元之间的至少一个中间单元,其中所述系列单元中的每个单元包括:a)主链部分,其中:1)所述第一单元的主链部分共价结合到另一单元的主链部分;2)所述最后单元的主链部分与另一单元的主链部分共价结合;和3)每个中间单元的主链部分与另外两个单元的主链部分共价连接;和B)二价核碱基与所述主链部分共价结合;b)与所述第一单元共价连接的第一芳基部分;和c)与所述最后单元共价连接的最后芳基部分。

在一些实施方案中,本公开提供了一种化合物,其包含:a)PNA单元系列,其中所述系列单元包括i)第一单元;ii)最后单元;和iii)第一单元和最后单元之间的至少一个中间单元,其中所述系列单元中的每个单元包括:a)主链部分,其中:1)第一单元的主链部分共价结合到另一单元的主链部分;2)最后单元的主链部分共价结合到另一单元的主链部分;3)每个中间单元的主链部分共价结合到另外两个单元的主链部分;和B)二价核碱基与所述主链部分共价结合;b)两个芳基部分,一个与所述第一单元共价连接,另一个与所述最后单元共价连接。

在一些实施方案中,本公开提供了一种化合物,其中所述第一芳基部分通过第一接头部分与所述第一单元共价连接,并且所述最后芳基部分通过最后接头部分与所述最后单元共价连接。在一些实施方案中,本公开提供了一种化合物,其中所述第一接头部分和所述最后接头部分各自独立地包含胍基。在一些实施方案中,本公开提供了一种化合物,其中所述第一接头部分和所述最后接头部分各自独立地包含氨基酸残基。在一些实施方案中,本公开提供了一种化合物,其中所述第一接头部分和所述最后接头部分各自独立地包含三个含胍的氨基酸残基。

在一些实施方案中,本公开提供了一种化合物,其中所述第一接头部分和所述最后接头部分各自独立地包含三个连续的精氨酸残基。在一些实施方案中,本公开提供了其中所述系列单元为3至8个单元的化合物。在一些实施方案中,本公开提供了其中系列单元是γ-PNA的化合物。在一些实施方案中,本公开提供了一种化合物,其中所述第一芳基部分和所述最后芳基部分各自独立地为2至5环稠合的多环芳香族部分,例如聚芳烃如芘。在一些实施方案中,本公开提供了其中所述第一芳基部分和最后芳基部分相同的化合物。在一些实施方案中,本公开提供了进一步包含乙二醇单元的化合物,例如二甘醇单元。

在一些实施方案中,本公开提供了一种化合物,其中所述化合物以与靶核酸序列互补的顺序呈递核碱基。在一些实施方案中,本公开提供了其中靶核酸序列与重复扩张疾病相关的化合物。在一些实施方案中,本公开提供了其中重复扩张疾病是1型肌强直性营养不良(DM1)或2型肌强直性营养不良(DM2)的化合物。在一些实施方案中,本公开提供了化合物,其中当两种化合物与核酸杂交时,一种化合物的第一芳基部分和另一化合物的最后芳基部分堆叠。

在一些实施方案中,本公开提供了下式的化合物:

H-LArg-CAGCAG-LArg-NH2(P1);

H-LArg-LDab(Pyr)-CAGCAG-LOrn(Pyr)-LArg-NH2(P2);

H-LArg-LOrn(Pyr)-CAGCAG-LOrn(Pyr)-LArg-NH2(P3);

H-LArg-LLys(Pyr)-CAGCAG-LLys(Pyr)-LArg-NH2(P4);

H-LArg-LLys(Pyr)-CATCAG-LLys(Pyr)-LArg-NH2(P5);或

H-LArg-LLys(Pyr)-CTGCTG-LLys(Pyr)-LArg-NH2(P6),其中Orn是鸟氨酸,Dab是二氨基丁酸,Pyr是羧基官能化的芳族化合物,例如芘,例如芘-1-羧酸,芘-2-羧酸,芘-4-羧酸,芘-1-乙酸,芘-2-乙酸或芘-4-乙酸。

在一些实施方案中,本公开提供了结合核酸的方法,所述方法包括使所述核酸与本公开的化合物接触,其中所述化合物在接触时与核酸结合。在一些实施方案中,本公开提供了一种敲低细胞中mRNA表达的方法,该方法包括使所述细胞与本公开化合物接触,其中所述化合物在结合细胞中对应于mRNA的DNA序列时敲低细胞中mRNA的表达。

在一些实施方案中,本公开提供了一种基因识别试剂,其包括:核酸或核酸类似物主链,具有第一端和第二端,并且具有三至八个核糖-5-磷酸、脱氧核糖5-磷酸或核酸类似物主链残基;与多个5-磷酸核糖、5-磷酸脱氧核糖或核酸类似物主链残基连接的相同或不同的二价核碱基;通过接头连接至核酸或核酸类似物主链的第一端的第一芳基部分;第二芳基部分和任选地与第一芳基部分相同的第二芳基部分通过连接子连接至核酸或核酸类似物主链的第二端。

在一些实施方案中,本发明提供了一种检测方法,包括a)将第一探针核酸与靶核酸的第一重复部分杂交,所述第一探针核酸包括连接到第一发射极部分的第一端和连接到第二发射端部分的第二端;和b)将第二探针核酸与靶核酸的第二重复部分杂交,所述第二探针核酸包括连接到第三发射极部分的第一端和连接到第四发射端部分的第二末端;其中i)所述靶核酸的第一和第二重复部分与重复扩张疾病相关联;ii)所述第一探针核酸和第二探针核酸与靶的结合表明所述第一或第二发射极部分接近所述第三或第四发射极部分;以及iii)第一或第二发射极部分靠近所述第三或第四发射极部分的存在导致近距离发射极部分的发射波长的改变。

在一些实施方案中,所述检测方法还包括检测近距离发射部分的发射波长的变化。在一些实施方案中,将所述第一探针核酸与第一重复部分杂交增加第二探针核酸与第二重复部分的亲和力。在一些实施方案中,第一或第二发射极部分靠近所述第三或第四发射极部分的存在导致第一或第二发射极部分与第三或第四发射极部分之间的pi-pi堆叠相互作用。在一些实施方案中,所述靶核酸直接从生物样品中获得。

实施例1

NMR、X射线和生化研究表明,与标准RNA双链体相比,rCAG-发夹结构是相对动态的,其中A-A内部凸起表现出大的运动幅度。这种分子支架在每两个规范的G-C/C-G碱基对中都包含内部A-A错配(图1(A)),类似于道路上的“坑洞”,为外源性配体提供了独特且可行的受体样结合位点。开发了靶向rCAG-发夹结构的相对较短的核酸配体(图1(B))。使用Janus碱基(J碱基或JBs),E,I和F(图1(C)),它们能够与以下形成二价H键相互作用:RNA双螺旋的两条链中的核碱基,构象预组织的MPyPNA主链(图1(D和E))。本文所述的J碱基是一组更大的双面核酸识别元件的一部分,总共16个,旨在结合所有16种可能的RNA碱基对组合(图5A-5C)。它们与包括“Janus-wedges”在内的其他J-碱基的不同之处在于,它们的形状,大小和化学功能均相同,因此,它们可以以模块形式组合以识别RNA碱基对的任何组合。

分子动力学(MD)模拟。为了评估二价识别设计概念的可行性,我们对与包含四个rCAG重复序列的RNA双链体结合的配体LG1进行了MD模拟。省略了C端赖氨酸残基,并用甲基(MeγPNA)代替了MP侧链,以简化计算模型。CEO,AIA和GFC三元组通过6-31基集构建和优化,并嫁接到各自的RNA和MeγPNA主链上。使用Ambertools的NAB模块产生结合的RNA-LG1-RNA复合物的结构。最终结构被水分子和离子溶剂化,能量最小化,并模拟了100ns。在整个模拟过程中,所得的复合物保持相当稳定,四个单独的LG 1配体紧密地装配在两条RNA链之间(图6(A))。在整个模拟过程中,H键的数量保持不变,CEO和GFC三元组中的每个为五个,AIA为四个(图6(B))。然而,尝试模拟少于四个LG 1配体的结合是不成功的。由于末端碱基对的磨损(图6(D和E)),复合物被分解,并形成了一些扭曲的结构。

化学结构单元和配体的合成。我们合成了J-碱基E和F,以及相应的JB-MPγPNA单体1至3(图7)。J-碱基I尚未准备好,因为它可以从市场上买到。E和F分别根据方案1(图8)和方案2(图9)合成。发现化合物5至9中的Boc保护/脱保护序列对于提高NBS反应的化学产率和抑制随后的缩合和环化步骤中的副反应是优选的。发现为了使Stille耦合顺利进行,优选进一步保护12。这是通过在升高的温度下进行的Boc-酸酐来完成的。尽管有明显的体积,我们在将E偶联到MPγPNA主链上或在MBHA树脂上组装相应的单体时都没有问题。F,4-氨基-2-(甲硫基)吡啶-5-甲腈(17)的核心结构是根据公开的方案制备的。随后将氰基转化为脒,然后进行Boc保护,得到21。但是,在各种条件下尝试用大量过量的Boc-酸酐完全保护环外胺是不成功的,因为这导致在其上形成多个斑点,其具有难以通过柱色谱法分离的Boc-基团数量不同的TLC。为了应对这一挑战,我们分两步实施了Boc保护。将22进行氧化和水解,然后进行烷基化和氢解,得到F。一旦制备,E(15),F(26)和I(27)偶联到MPγPNA主链上(图10,方案3)。去除Alloc保护基产生所需的单体1至3。配体LG1,LG2和LG3以及与LG2P相反(平行)取向的LG2P,是使用PAL-接头和HBTU作为偶联剂在MBHA树脂上制备的。LG2P被包括作为阴性对照,因为亲代LG2配体显示出最有可能结合rCAG重复序列。在C末端掺入赖氨酸残基以改善水溶性。最后一次单体偶联完成后,将配体从树脂上裂解下来,用***沉淀,通过RP-HPLC纯化,并通过MALDI-TOF质谱法确认(表D)。

表D:LG1,LG2,LG3,LG2P和母体化合物M的分子量

Figure BDA0002641634620000411

*含Na,

Figure BDA0002641634620000422

靶标选择和样品制备。选择了一系列模型RNA靶标进行结合研究(图11)。R11X系列包含24个rCXG重复序列(图11(A)),采用第二个发夹结构后,可为配体提供11个结合位点(图11(B))。R11A包含完美匹配(A-A),而R11U和R11C包含各自的U-U和C-C不匹配的配体结合。R11G(X=G)尚未确定,因为它已显示能够形成G-四链体和发夹结构,这可能会混淆实验结果的解释。带有LG2结合位点的下划线的单链RNA靶标(WS(Watson链)和CS(Crick链))(图11(C)),以及包含单个配体结合位点的双链发夹HP(图11(D)),也进行了检查。通过将预退火的RNA与各自的配体在37℃的0.1X PBS缓冲液(1mM NaPi,13.7mM NaCl,0.27mM KCl;pH7.4)中温育来制备样品。根据我们的初始筛选选择了这种特定的缓冲液,其中我们发现R11A采用了稳定的发夹结构,并且配体能够结合。

配体结合的光谱表征。UV-Vis和圆二色性(CD)的组合用于确定配体的结合特性。UV-Vis测量显示,所有三个配体均能够结合R11A。它们相互作用的证据可以从[R11A+配体]在252和330nm吸收处的低色性和红移转变中收集。275-375nm范围内的紫外线吸收量对应于E基的π-π*跃迁。CD数据证实了这一发现,该数据显示~270nm处信号明显增加和红移。在该系列中,LG2在CD振幅方面表现出最大的差异。用R11A进行的LG2CD滴定达到了11:1的饱和点,与R11A的配体结合位点的预测数目一致(图12)。我们假定R11A采用均匀的发夹结构,因为在添加配体之前先对其进行了热退火;然而,分子内和分子间折叠的其他组合也是可能的。相反,将LG2与错配的R11U(图13(A))和R11C(数据未显示)、单链WS和CS(图13(B))、包含单个结合位点的双链HP(图13(C))或LG2P与R11A的错配方向(图13(D))一起温育后,在CD信号中未观察到显著差异。由于R11U和R11C不匹配的结果在各个方面都几乎相同,因此从此刻开始,所有关于碱基不匹配的讨论都集中在R11U上。综上所述,这些结果表明配体与RNA之间的相互作用以序列和方向特异性的方式发生,相对于单链RNA靶标其优先选择双链,而相对于孤立的单个位点而言则优先选择具有多个连续结合位点的靶标。

通过荧光测量确认配体结合。为了进一步证实UV-Vis和CD的发现,我们在330nm(E碱基的λmax)激发后,测量了有和没有RNA靶标的配体的荧光信号。我们观察到与LG1和LG2相比,LG3有明显的荧光猝灭。荧光信号的这种急剧降低可能归因于光诱导的电子转移猝灭,这对于LG3有望是最有效的,因为荧光团(E)堆叠在其他两个J碱基之间。该解释与观察到LG3的荧光信号在加热时完全恢复的观察结果一致(数据未显示)。对于所有三个配体,添加R11A后发射信号进一步降低,但最显著的是LG2,相比LG1和LG3分别降低的35%和33%,LG2降低了60%。我们将LG2与R11U,[WS+CS]、HP和LG2P与R11A一起温育后观察到类似的荧光猝灭模式(图14),尽管与带有R11A的LG2相比没有那么剧烈。对相关类别的双环嘧啶类似物进行了类似的观察,表明这些稠环荧光团的荧光产量对局部环境高度敏感。为了检验配体与RNA的非特异性结合可能导致荧光猝灭的假说,我们在加入LG2之前先将各自的RNA靶与喷他脒温育,反之亦然。数据显示,带有R11U和[WS+CS]的LG2以及带有R11A的LG2P的荧光信号已完全恢复,但带有R11A的LG2仍然被抑制(图14,插图)。此结果与LG2通过与喷他脒不同的模式结合R11A一致,推定是通过规定的二价H键相互作用(图1B和C)。

NMR滴定。为了深入了解LG2的结合模式,我们对LG2,R11A及其组合进行了一系列多核和多维NMR实验。在与之前相同的0.1X PBS缓冲液中制备样品,其中含有9:1的H2O:D2O体积比。在300、200和100毫秒的混合时间收集NOESY数据以获得质子-质子距离,同时进行COZY实验进行绘制每个残基的质子自旋系统的图。预期LG2和R11A之间的氢键相互作用将导致规范的G-C/C-G对的亚氨基质子信号由于碱基对的开放而发生线展宽和低场化学位移,并出现了一组新的亚氨基质子信号是由于配体和RNA之间形成了H键。与CD数据一致,1H-NMR实验表明R11A在0.1X PBS缓冲液中采用了稳定的发夹结构,这在12.35ppm处有清晰的亚氨基质子信号。可变温度测量进一步支持了这种化学位移的分配,显示出峰强度随温度升高而逐渐衰减,而不可交换质子的峰强度保持相当恒定。核碱基质子的部分分配是通过NOESY实验进行的。如预料的那样,加入LG2后,R11A的亚氨基质子信号逐渐加宽并向场下偏移(图15)。而且,C4-NH和G2-NH的化学位移受到显著影响,表明它们与配体的相互作用。尽管付出了很多努力,但由于重复序列的简并性,我们无法在滴定LG2对R11A时分配并监测A6-NH的化学位移。然而,该结果表明G-C/C-G碱基对开口是由配体介导的。但是,我们没有在10-20ppm的范围内观察到任何新的亚氨基质子信号,正如预期配体与RNA之间将形成H键。

模板指导的天然化学连接(NCL)。如用LG2和R11A所观察到的,配体与RNA的弱而短暂的相互作用不太可能产生有意义的生物学反应。为了进一步提高LG2的结合亲和力,我们合成了第二种LG2衍生物LG2N(图16(A)),其中包含一个C端硫酯和N端胱氨酸。使用第二代N-酰基脲接头制备该配体。双功能探针设计利用MPγPNA的构象预组织来防止两个官能团在二硫键还原时自发地相互反应。胱氨酸组用于在探针处理中提供更大的控制。先前的研究表明,包含所有天然核碱基的相同长度的配体在生理温度(37℃)具有约1小时的降低的(无环)半衰期。我们期望LG2N*具有类似的半衰期。图16(B)描绘了二硫键还原后LG2N的反应途径,这是还原性细胞内环境中LG2N的预期化学状态。在存在RNA靶标的情况下,由于分子间碱基的堆积,预期配体会与RNA靶标的核碱基形成彼此相邻的瞬时二价H键相互作用(步骤2)。二硫键断裂后,配体将经历模板导向的NCL形成连接产物,从而更紧密地结合RNA模板(步骤3)。在没有RNA靶标的情况下,配体会通过分子内NCL反应形成环产物而自失活(步骤4)。

为了证实在进行环化反应之前,二硫化物键还原后LG2N在一段有限的时间内将保持稳定的预测,我们监测了原位衍生LG2N*的母体化合物M的反应进程(图17(A))。我们选择MALDI-TOF而不是HPLC和其他分析技术来定量反应产物,因为分子内NCL的时间范围相对较短,用前者可以在不到5分钟的时间内完成。在进行HPLC分析之前,尝试用亲电试剂淬灭反应。然而,由于配体的快速分子内反应,这种努力没有成功。研究了4-巯基苯酚(4MP)和2-巯基乙醇(2ME)作为可能的还原剂。两者对于母体化合物M均产生相似的动力学曲线;但是,前者产生的中间体的质荷比(m/z)与水解母体化合物的重叠,因此难以区分。由于这个原因,我们在通过MALDI-TOF进行的反应监测和凝胶迁移分析中选择了4MP,而由于其在核碱基吸收区域的透明性,在随后的熔解实验中采用了2ME。我们的数据表明,向母体化合物M中添加4MP后,最初形成了两个与酯交换(M#)和C端硫酯(M##)相对应的反应性种类(图17(A))。它们持续<15分钟,然后转化为反应性LG2N*中间体,最后转化为环状产物(cLG2N)(图17(B))。LG2N*在生理温度下稳定。它在减少1小时的时间点作为主要产品存在,约占混合物中总产品的75%,其余25%主要是cLG2N。LG2N*的半衰期约为3小时,约为自然寿命的三倍。我们将LG2N*的化学稳定性归因于E碱扩张的芳环尺寸,它提供了更好的碱基堆积相互作用,从而使配体的构象柔性降低。

接下来,我们进行了UV熔融实验,以确定模板指导的NCL对RNA的热稳定性的影响。样品是在0.1X PBS缓冲液中以LG2N与R11A结合位点的数量之比为2:1制备的,并在进行UV熔融分析之前,在37℃温育16h。如预期的那样,没有还原剂,LG2N对R11A的熔融转变(Tm)的影响最小,ΔTm最高为~+1℃。LG2也有类似的发现,它既不包含C端硫酯,也不包含N端半胱氨酸。但是,在2ME存在下,无论[LG2N+R11A]的温育是在环境温度还是在37℃进行的,结果都是相似的。在两种情况下,R11A的Tm均显著提高,范围为59-68℃。熔解曲线的导数显示出宽的S形分布,表明存在一系列形成的并与RNA模板结合的级联产物。预期该发现可用于模板指导的合成。尽管Tm相似,但两条熔解曲线的图谱却截然不同,其中一个在高温下温育,显示出在25-50℃范围内的反向吸光率。这种熔融行为是疏水/芳族相互作用的特征,这种现象先前已经在嗜热性折叠剂和其他芳族体系(例如苝和芘)中观察到。我们将强度反强度分布归因于级联产物的J基相互作用,据推测,其在37℃时比在环境温度下形成的量更大。加热后,疏水相互作用在某个特定点(约50℃)变得更明显,超过此点便产生排斥。R11A的热稳定性增强与NCL产物的形成及其与RNA模板的结合相一致。

为了确认R11A的Tm增强是由于模板指导的级联以及所得产物与RNA模板的结合,我们在加热之前对UV熔融样品进行了MALDI-TOF分析。级联产物的形成从新峰的出现而显而易见,所述新峰具有逐渐增大的m/z值的,步长为~1319道尔顿,对应于配体的质量(图18(A))。但是,在没有靶标的情况下,只有错配的R11U(图18(B))或单独的LG2N(图18(C))未观察到这些连接的产物。同样,没有证据表明所述连接的产物是由单链[WS+CS]或双链HP形成的(数据未显示)。该结果与由R11A发夹结构介导的、模板指导的合成的发生是一致的。

连接配体的选择性结合。为了确定LG2N是否可以将rCAGexp与正常重复区分开,我们进行了竞争结合试验。采用两个含有在正常(R24A,n=24,与R11A相同)和致病性(R127A,n=127)范围内的r(CAG)n重复RNA靶,以及不匹配的r(CUG)96对照(使用R96U)。在采用各自的发夹基序后,这些RNA转录物将为LG2N提供11、62和47个结合位点。制备了两组样品,一组在0.1X PBS中,另一组在生理相关的缓冲液(10mM NaPi,150mM KCl,2mM MgCl2;pH 7.4)中。在两组中,将R24A(100nM链浓度,1.1μM结合位点)和R127 A(18nM链浓度,1.1μM结合位点)的等摩尔混合物与各种浓度的LG2N以及4MP,以及TCEP在37℃温育24小时。包括TCEP以确保二硫键被完全还原。通过琼脂糖凝胶分析反应混合物,并用SYBR-Gold染色以进行可视化。对图19的检查表明,LG2N比R24A优先结合R127A,这一点由第2条至第5条泳道中最上面的两个条带的消失速率比最下面的条带的消失速率要快而证实。这种结合事件仅出现在存在还原剂和具有完全匹配的RNA靶标的情况下,因为在没有4MP和TCEP(将泳道6与泳道1比较)和具有不匹配的R96U(将泳道8与泳道7比较)下,未观察到结合的迹象。我们没有观察到形成任何移位的条带,正如配体与RNA的复合所预期的那样,这表明SYBRGold无法***RNA-配体复合体。考虑到已知配体结合会导致RNA构象发生巨大变化,因此这一发现不足为奇(图6)。相反,我们没有观察到任何在生理上相关的离子强度下发生配体结合的迹象(图20),这表明在这种条件下RNA发夹无法介导模板指导的配体寡聚。

许多神经肌肉疾病,超过20种,包括HD,强直性营养不良1型(DM1)和2型(DM2),脊髓小脑共济失调(SCAs),脆性X综合征(FXS),弗里德里希共济失调(FRDA)和肌萎缩性侧索硬化症(ALS或Lou Gehrig病)的亚群,是由于不稳定的重复扩增导致的。基因编码区的扩增可导致蛋白质功能发生变化,而非编码区发生的扩增可引起疾病,而不会通过RNA功能的毒性增加和/或通过RAN翻译无意产生有害多肽而干扰蛋白质序列。这些遗传性疾病中有许多是常染色体显性遗传,只需要在一个等位基因中扩增(或突变)即可引起疾病。因此,干扰这种疾病途径的一种方法是靶向受影响的等位基因或相应的基因转录本。在这两者之间,由于后者倾向于采用不完善的发夹结构,后者为外源分子提供了更大的可及性,并为二价配体(如JB-MPyPNA)提供了更大的识别特异性。

由于rCAG重复在HD以及其他神经退行性疾病中包括但不限于MJD,SBMA,DRPLA和SCA的广泛的遗传渗透,我们将精力集中在rCAG重复上。选择性结合突变型htt转录物并干扰上述疾病途径的分子不仅可以用于治疗HD,而且可以用于治疗其他相关的遗传疾病。本文所述的核酸配体在几个方面与常规反义剂不同。首先,它们通过二价氢键相互作用结合CAG-RNA发夹基序。其次,它们的尺寸相对较小,长度为一个三联重复单元。因此,与固相化学相反,它们更容易通过溶液化学合成,结构修饰和放大。第三,由于小分子外缘具有分子量,因此这种“分子”系统通常比典型的反义剂具有更有利的药代动力学特性。第四,基于J的识别更具序列特异性和选择性。更具体地说,因为通常会在天然核碱基的一个面上发生的单碱基错配会在J碱基的两个面上发生;而且它具有更高的选择性,比起单链RNA靶标,更倾向于双链靶标,因为两种最终产物的结合自由能差异很大。但是,与小分子或核糖开关不同,J碱基的识别遵循一整套定义的规则,即通过二价Watson-Crick H键相互作用,而不是吸引力的更多种组合。此外,JB-配体设计是模块化的。这样,可以制备和修饰配体以结合任何RNA重复序列。在初始设计阶段,低盐浓度下JB-配体与正常长度的rCAG重复序列之间的弱和短暂相互作用是理想的,因为这将允许通过调整配体的结合亲和力和通过调节缓冲液的离子强度来进一步提高识别选择性。

材料和方法

UV熔融分析。所有UV熔融样品如下制备:通过将配体与指定浓度的RNA靶标在0.1XPBS缓冲液中混合,并通过在90℃温育5分钟进行退火,然后逐渐冷却至室温。使用配备有热电控制的多样品池支架的Agilent Cary UV-Vis 300光谱仪收集UV熔融曲线。通过监测加热运行中25至95℃和冷却运行中95至25℃在260nm处的UV吸收来收集UV熔融光谱,二者的速率均为每分钟1℃。冷却和加热曲线几乎相同,表明杂交过程是可逆的。使用20点相邻平均算法对记录的光谱进行平滑处理。采用熔融曲线的一阶导数来确定复合物的熔融温度。

CD分析。在0.1X PBS缓冲液中制备样品。所有光谱代表在25℃的1厘米光程比色皿中,以100nm/min的速率在200至375nm之间收集的至少十五次扫描的平均值。从样品光谱中减去缓冲溶液的CD光谱,然后通过五点相邻平均算法对其进行平滑处理。稳态荧光测量。通过将配体与指定浓度的RNA在0.1lX PBS缓冲液中混合,并通过在90℃温育5分钟进行退火,然后逐渐冷却至37℃,来制备所有稳态荧光样品。在测量之前,将样品在37℃温育1小时。通过Cary Eclipse荧光光谱仪在25℃收集稳态荧光数据。(εex=330nm,εem=340-600nm),具有狭缝尺寸。

竞争性结合测定R24A购自IDT。如前所述制备R127A[r(CAG)127]和R96U[r(CUG)96]。在0.1X PBS缓冲液中制备R24A,R126A和R96U,并通过加热到90℃持续5分钟然后逐渐冷却到室温使其退火。将配体和RNA以指定的浓度混合,并在37℃温育24小时。然后将样品上样至含1X Tris-硼酸盐缓冲液的2%琼脂糖凝胶中,并在100V电泳分离25分钟。凝胶用SYBR-Gold染色,并通过UV-Transilluminator可视化。

MD模拟,配体合成和单体合成:该过程在所附的补充信息中提供,并在此并入本文。

通用技术

除非另有说明,所有起始原料和化学制品均购自商业供应商,且无需进一步纯化即可使用。除非另有说明,所有反应均在氮气气氛下用干燥溶剂在无水条件下进行。真空除去溶剂是指使用连接至高真空泵的旋转蒸发仪进行蒸馏。将获得的固体,糖浆或液体产品在高真空下干燥。分析薄层色谱法是在预涂硅胶板上进行的(60F-254,厚度为0.25mm);化合物的可视化通过紫外光或用茚三酮或碘染色,或加热作为显影剂。以CDCl3,DMSO和D2O为溶剂,以TMS作为内标,在300或500MHz上记录NMR光谱。以下缩写用于解释多重性:s=单峰,d=二重峰,t=三重峰,q=四重峰,m=多重峰,ddt=三重峰的二重峰的二重峰,dt=三重峰的二重峰td=二重峰的三重峰,ABq=AB四重峰,dd=二重峰的二重峰,tt=三重峰的三重峰,br=宽,wtc。使用ESI-ESI-TOF质量分析仪和DART分析仪进行高分辨率质谱(HRMS)。使用ESI-离子阱-MS质量分析仪执行低分辨率质谱(LRMS)。除非另有说明,使用C18(15cm x2.1mm,5μm颗粒)色谱柱,从95%H2O(0.01%TFA)到95%MeCN(0.01%TFA)在40分钟内进行线性梯度洗脱(方法A),以1.0mL/min的流速在RP-HPLC上纯化低聚物。使用TOF/TOF光谱仪测量MALDI光谱。吸收曲线在UV-Vis分光光度计上记录。圆二色性(CD)光谱记录在分光旋光仪上。在荧光分光光度计上记录荧光(发射)。

MD模拟

从γPNA省略了C-末端赖氨酸残基,并且所述MP侧链被甲基取代(MeγPNA,公开的X射线晶体结构,PDB-ID 3PA0)。CEG,AIA和GFC三元组是使用chimera1构建的,并通过高斯(Gaussain)中建立的HF/6-31G*基础进行了优化。使用Ambertools的NAB模块从三元组创建结合的RNA-HD1-RNA复合物的螺旋结构,并将来自晶体结构的修饰的MeγPNA主链嫁接到螺旋结构上(如图2A所示,初始结构)。产生了四个这样的RNA-HD1-RNA复合物,其中RNA是包含四个rCAG重复序列的双链体,与RNA结合的HD1配体的数量从一到四个不等。将每种RNA-(HD1)n-RNA复合物用TIP3P4水分子溶剂化,并添加离子以中和所述电荷。将系统的能量降至最低,然后在对RNA和HD1配体原子的

Figure BDA0002641634620000491

的谐波抑制下加热至300K。然后,通过一系列六个简短的模拟逐步释放所述抑制,最后分别使用Nose-Hoover恒温器和Parinello-Rahman恒压器在300K和1bar的压力下100ns运行不受抑制的NPT模拟。使用粒子网格Ewald方法处理静电相互作用,并使用具有χOL3修饰的GROMACS Amber99-parmbsc0力场对RNA进行所有模拟,并使用通用琥珀色力场创建HD1配体的力场参数。

树脂装载[(MP)(PAL)]

(1)加载MP。将1g MBHA树脂(1mmol/g,Peptide International,RMB-2100-PI)在反应容器中的DCM中浸泡1小时,然后用DCM(3X)和5%DIEA的DCM(3X)溶液洗涤,参见图21。通过Kaiser-test确认胺基已被中和(蓝色)后,在15mL的标准管中依次添加以下溶液:3.5mL NMP,450μL溶液A,460μL溶液B,和550μL溶液C。将混合物涡旋10秒钟,静置3分钟,然后添加到反应容器中的树脂中。轻轻摇动使反应进行1小时。在正气压下弃去反应混合物,并用DMF(3X),DCM(3X),在DCM中的5%DIEA(1X)和DCM(3X)洗涤树脂。通过向反应容器中加入封端溶液来封端树脂,并轻轻搅拌容器45分钟(2X)。丢弃最后的封端溶液后,用DCM(3X)洗涤树脂,并通过Kaiser-test(浅黄色)确认封端完成。

溶液A:在500μLNMP(0.200M)中的43mg Fmoc-MP

溶液B:913μL吡啶中的87μLDIEA(0.500M)

溶液C:750μLNMP(0.201M)中的55mg HATU

封端溶液(Ac2O/NMP/吡啶:112/2):2mL Ac2O,4mL NMP和4mL吡啶

(2)加载PAL和Lys(1g以上树脂)。通过用DMF(2X)中的20%哌啶溶液分别处理树脂7分钟,然后用DMF(3X)和DCM(3X)洗涤来除去Fmoc保护基。确认已通过Kaiser-test成功去除Fmoc(蓝色)后,通过混合以下材料制备偶联溶液:3mL的0.2M单体溶液,1.5mL的0.52MDIEA溶液和1.5mL的0.39M HBTU溶液。将混合物活化3分钟,然后添加到树脂中。在反应容器的温和搅拌下,使反应进行30分钟。通过Kaiser试验(浅黄色)确认反应完成。树脂用DMF(3X),5%DIEA溶液(1X)和DCM(1X)洗涤,然后通过将封端溶液添加到树脂中来封端未反应的胺,并轻轻搅拌反应容器30分钟。除去封端溶液后,树脂用20%哌啶(2X),DMF(2X)和DCM(2X)洗涤。

单体溶液:3mL NMP中的303mg Fmoc-PAL(0.200M)3mL NMP中的281mg Fmoc-Lys(Boc)-OH(0.200M)

DIEA溶液:3.6638mL DMF中的364μLDIEA(0.52M)

HBTU溶液:5mL DMF中的740mg HBTU(0.39M)

封端溶液:(Ac2O/NMP/吡啶:1/25/25体积)

Fmoc-脱保护通过用在DMF(2X)中的20%哌啶(0.5mL,50mg树脂)溶液处理树脂各7分钟,然后用DMF(3X)和DCM(3X)洗涤来除去Fmoc保护基。通过Kaiser-test(蓝色)确认了Fmoc的脱保护。

单体偶联确认通过Kaiser试验成功除去Fmoc(蓝色)后,用DMF(4X)和DCM(5X)洗涤树脂。通过混合以下材料来制备偶联溶液:150μL的0.2M单体溶液,75μL的0.52M DIEA溶液和75μL的0.39M HBTU溶液。将混合物活化10分钟。在将单体溶液加入树脂之前,用吡啶(1X)洗涤树脂。在反应容器的温和搅拌下,使反应进行2-4小时。通过Kaiser试验(浅黄色)确认反应完成。用DMF(3X)和DCM(3X)洗涤树脂。

封端将未反应的胺用新鲜制备的封端溶液封端。将封端溶液(1:25:25;乙酸酐:NMP:Py)添加至树脂,并将反应容器搅拌4分钟。用DMF(4X)和DCM(5X)洗涤树脂。

切割在最后的Fmoc脱保护步骤之后,用DMF(5X)和DCM(8X)洗涤树脂。树脂在真空下干燥15分钟。向干燥的树脂中,添加新鲜制备的95%TFA:5%间甲酚(对于50mg树脂为0.6mL),并将反应容器保持在待机模式。在室温下1小时后,将TFA溶液收集在离心管中。再次,将裂解溶液(对于50mg树脂为0.5mL)加入树脂中,并使反应容器静置30分钟。将TFA溶液与先前收集的溶液合并。

沉淀向收集的TFA溶液中,加入冷的干燥***(-60℃,14mL)并摇动。30分钟内出现沉淀。通过离心收集沉淀的低聚物,并用冷***(2x)洗涤。

纯化将粗低聚物溶于0.5mL的95%的水,5%的乙腈和0.1%的TFA中。所得溶液通过反相分析柱纯化。

实施例2-单体合成

单体E(1):在室温将四(三苯基膦)钯(28.22mg,24.42μmol)添加到苯基硅烷(0.12mL,0.98mmol)和烯丙基单体29a(0.60g,0.49mmol)在无水二氯甲烷(10mL)的混合物中。通过TLC(洗脱液:EA:Hex(SO:SO);29a的Rf为0.6;产物Rf=0.0(dragging))在15h中观察到原料完全转化为相应的酸。在室温向反应混合物中加入硅胶,并在旋转蒸发仪上除去溶剂。通过快速硅胶色谱法纯化粗制硅胶吸收产物,得到所需产物。产率:0.44g,7S%。1HNMR(S00.13 MHz,DMSO-d6,旋转异构体):δ1.08/1.09(s/s,9H),1.25-1.28(m,18H),1.37-1.38(m,18H),1.41/1.6S(s/s,9H),3.12-3.64(m,13H),3.77-3.90(m,2H),3.90-4.00(m,2H),3.99-4.4.34(m,4H),7.21-7.49(m,5H),7.54-7.79(m,2H),7.89(d,J=7.2Hz,2H),8.55/8.64(s/s,1H);13C NMR(125.77MHz,DMSO-d6,旋转异构体):δ27.2-27.6(18C,tBu),35.8,46.7,54.9,59.7,60.6/60.6(2C),65.6/65.6,69.6/69.6,69.8/69.9,70.4/70.4,72.2/72.2,82.1(3C),82.2,83.2,83.4,86.2,108.1,120.1(2C),125.2,127.0(4C),127.6(4C),140.7(2C),143.8/143.8,147.9,149.2/149.3,149.3,149.5,149.7,155.0/155.9,156.3/156.5,162.3,166.6/166.6;HRMS:[C61H85N7O17+H]的m/z计算值:1188.6080,实测值:1188.6071。

Figure BDA0002641634620000521

单体I(2):所述化合物利用化合物1的上述过程,以化合物29b(3.10g,4.39mmol)为起始原料制备。TLC(洗脱液:MeOH:DCM(5.95);29b的Rr=0.2;2的Rf=0.0)。产率:2.22g,76%。1H NMR(300.13MHz,DMSO-d6):δ1.09(bs,9H),3.11-3.52(m,15H),3.87-3.96(m,2H),4.24(dd,J=13.4,5.4Hz,4H),7.19-7.44(m,SH),7.69(d,J=7.5Hz,2H),7.89(d,J=7.4Hz,2H),10.71-10.75(m,1H),11.06(bs,1H),12.46(bs,1H);13C NMR(126MHz,DMSO-d6,旋转异构体s):δ27.8(3C),47.2/47.2,61.1(3C),65.6/66.0,70.1(2C),70.3/70.4,70.9(3C),72.7,107.8,120.6-128.1(10C),139.7/140.1,141.2(2C),144.3,151.8,156.3,164.6,170.9;HRMS:[C34H42N4O10+H]的m/z计算值:667.2979,实测值:667.2988。

Figure BDA0002641634620000531

单体F(3):所述化合物利用化合物1的上述过程,以化合物29c(2.50g,2.00mmol)为起始原料制备。TLC(洗脱液:EA∶Hex(50∶50);29c的Rf=0.6;3的Rf=0.0(dragging))。产率:1.94g,80%。1H NMR(300.13MHz,DMSO-d6,旋转异构体):δ1.08(s,9H),1.35(s,9H),1.36(s,9H),1.41/1.42(s/s,18H),3.20-3.62(m,20H),3.77-4.15(m,4H),4.18-4.34(m,4H),4.82–5.35(m,2H),7.17-7.46(m,5H),7.70(d,J=7.0Hz,2H),7.88(d,J=7.5Hz,2H),8.93/8.95(s/s,1H);13C NMR(125.77MHz,DMSO-d6,旋转异构体):δ27.3-27.5(18C,tBu),46.7/46.7,60.6(2C),60.7(2C),69.6(2C),69.7,69.9,70.4(3C),72.2,82.1,82.1,82.9,82.9,83.3,83.4,108.0,110.8,118.4,120.1(2C),123.1,125.2/125.3,127.0(4C),127.6(4C),140.7(2C),143.8,146.9,149.5,156.6,157.1,162.4/162.4.HRMS:[C60H85N7O19+H]的m/z计算值:1208.5980,实测值:1208.5959。

Figure BDA0002641634620000532

(4-氯-吡啶-2-基)-氨基甲酸叔丁酯((4-chloro-pyridin-2-yl)-carbamic acidtert-butyl ester)(5):在10min内、惰性气氛中,向冰浴中的2-氨基-4-氯吡啶(1)(50.00g,0.39mol)在556mL无水THF中的搅拌溶液逐滴添加Et3N(81.37mL,0.58mol)。在相同温度再搅拌10分钟后,在30分钟内滴加Boc2O(84.88g,0.39mol)的THF(100mL)溶液,然后滴加催化量的DMAP(4.75g,0.04mol)。在室温搅拌过夜后,将反应混合物用乙酸乙酯(200mL)稀释。合并的有机层通过烧结漏斗过滤,滤液用饱和NaHCO3溶液洗涤,并用Na2SO4干燥。在旋转蒸发仪上除去溶剂,得到纯净产物。产率:67.59g,76%。1H NMR(300.13MHz,CDCl3):δ1.54(s,9H),6.95(dd,J=5.5,1.8Hz,1H),8.12(d,J=1.9Hz,1H),8.24(d,J=5.5Hz,1H),9.96(s,1H);13C NMR(125.77MHz,CDCl3):δ28.5(3C),81.5,112.9,118.7,146.2,148.3,152.6,153.8;ESI-MS:[C10H13ClN2O2+H]的m/z计算值:229.1,实测值:229.2。

Figure BDA0002641634620000541

2-((叔丁氧基羰基)氨基)-4-氯烟酸乙酯(Ethyl 2-((tert-butoxycarbonyl)amino)-4-chloronicotinate)(6):在1h内、惰性气氛中,向干冰丙酮浴(-78℃)中的(4-氯-吡啶-2-基)氨基甲酸叔丁酯(30.50g,0.13mol)在534mL无水THF中的搅拌溶液逐滴添加n-BuLi(24.86mL,0.27mol,11M)。在-78℃再搅拌30分钟后,在10分钟的过程中逐滴加入ClCO2Et(13.93mL,0.15mol)。用TLC检查反应进程。原料完全消耗后,将反应混合物用1%HCl(200mL)缓慢淬灭。将所得反应混合物转移至含有10%HCl(50mL)和EA(200mL)的分液漏斗中。用EA从水溶液层中萃取粗产物,合并的有机层经Na2SO4干燥。在旋转蒸发仪上除去所得的溶剂,并将所得的粗产物通过柱色谱法纯化,得到淡黄色固体状的2-((叔丁氧基羰基)氨基)-4-氯烟酸乙酯。产率:29.68g,74%。1H NMR(500.13MHz,CDCl3):δ1.40(t,J=7.2Hz,3H),1.50(s,9H),4.41(q,J 7.2Hz,2H),7.08(d,J=5.2Hz,1H),8.31(d,J=5.2Hz,1H),8.62(s,1H);13C NMR(125.77MHz,CDCl3):δ14.1,28.3(3C),62.3,81.8,120.8,144.7,149.9,150.0,151.3,151.8,164.9;HRMS:[C13H17ClN2O4+Na]的m/z计算值:323.0774,实测值:323.0777。

2-氨基-4-氯烟酸乙酯(Ethyl 2-amino-4-chloronicotinate)(7):在室温,将1,2-((叔丁氧羰基)氨基)-4-氯烟酸乙酯(29.00g,0.10mol)添加到浓缩HCl(52.60mL,0.58mol)和二氯甲烷(64mL)的混合物中(缓慢添加)。在室温2小时后,通过TLC监测起始原料的完成,然后将反应混合物冷却至0℃并用2N NaOH溶液中和。将反应混合物转移至含有100mL二氯甲烷的分液漏斗中,并将化合物从水溶液层中萃取至有机层中。合并的二氯甲烷层经无水Na2SO4干燥并浓缩。用硅胶柱色谱法纯化粗物质,得到纯的2-氨基-4-氯烟酸乙酯,为白色固体。产率:18.38g,95%。1H NMR(500.13MHz,CDCl3):δ1.41(t,J=7.1Hz,3H),4.42(q,J=7.1Hz,2H),6.13(bs,2H),6.68(d,J=5.3Hz,1H),7.97(d,J=5.4Hz,1H);13C NMR(125.77MHz,CDCCl3):δ14.2,61.8,108.3,115.9,145.6,151.2,159.9,166.4;HRMS:[C8H9ClN2O2+H]的m/z计算值:201.0431,实测值:201.0422。

2-氨基-4-氯-5-溴烟碱乙酯(Ethyl 2-amino-4-chloro-5-bromonicotinate)(8):在室温分批向7(18.00g,0.09mol)的无水DMF溶液中加入NBS(18.36g,0.10mol)。通过TLC分析所得溶液显示4小时后8已完全消耗。用水(100mL)淬灭所得混合物,并用乙酸乙酯(EA,2×100mL)萃取。合并的有机层用盐水洗涤,用无水硫酸钠(Na 2SO 4)干燥,过滤并浓缩。所得残余物通过硅胶柱色谱法(100-200目)纯化,仅得到2-氨基-4-氯-5-溴烟酸乙酯(8),为浅黄色固体。产量:22.07g,88%。1H NMR(500.13MHz,CDCl3):δ1.41(t,J=7.1Hz,3H),4.43(q,J=7.1Hz,2H),5.86(s,2H),8.24(s,1H);13C NMR(125.77MHz,CDCl3):δ14.2,62.3,109.7,110.4,144.4,152.8,158.0,165.9.HRMS:[C8H8BrClN2O2+H]的m/z计算值:278.9536,实测值:278.9541。

2-((叔丁氧羰基)氨基)-4-氯-5-溴烟酸乙酯(Ethyl 2-((tert-butoxycarbonyl)amino)-4-chloro-5-Bromonicotinate)(9):向8(20.00g,71.55mmol)的无水二氯甲烷(CH2Cl2)冰***液添加二异丙基乙胺(DIEA,27.42mL,157.41mmol),然后是三光气(7.64g,25.76mmol)。在0℃、1小时后,在5分钟的过程中加入叔丁醇(33.96mL,357.76mmol),并除去冰浴。通过TLC监测反应进程,并且在室温24小时后,起始原料已被完全消耗。用水淬灭所得混合物,并用二氯甲烷(CH2Cl2,2×100mL)萃取。收集的有机层用盐水、碳酸氢钠饱和溶液(NaHCO3)洗涤,用无水硫酸钠干燥,过滤并浓缩。将获得的粗物质通过硅胶柱色谱法(100-200目)纯化,得到2-(((叔丁氧基羰基)氨基)氨基-4-氯-5-溴烟酸乙酯(9),为白色固体。产率:13.58g,50%。1H NMR(500.13MHz,CDCl3):δ1.41(t,J=7.2Hz,3H),1.50(s,9H),4.42(q,J 7.2Hz,2H),8.37(s,1H),8.57(s,1H);13C NMR(125.77MHz,CDCl3):δ14.1,28.3(3C),62.6,82.2,113.9,116.3,119.9,144.0,149.5,151.7,164.2;HRMS:[C13H16BrClN2O4+H]的m/z计算值:379.0060,实测值:379.0063。

5-溴-2-((叔丁氧基羰基)氨基)-4-氯烟酸(5-Bromo-2-((tert-butoxycarbonyl)amino)-4-chloronicotinic acid)(10):在0℃于15分钟内将41.41mL的1M氢氧化钠(118.53mmol)添加至9在乙醇:THF(3:1,76mL)中的混合物(10.00g,26.34mmol)。通过TLC监测原料完全消耗后,将反应混合物浓缩。将获得的粗物质转移至含有水(200mL)的分液漏斗中,并用EA(1×100mL)萃取,并丢弃有机层。向水层中小心加入10%HCl(200mL)和EA(100mL)(pH~3-5)。将该化合物在EA层中萃取,并用无水硫酸钠干燥并浓缩,得到浅黄色固体状的纯5-溴-2-((叔丁氧基羰基)氨基)-4-氯烟酸(10)。产率:6.02g,65%。1H NMR(500.13MHz,DMSO-d6):δ1.43(s,9H),8.69(s,1H),9.88(s,1H);13C NMR(125.77MHz,DMSO-d6):δ27.9(3C),80.1,116.3,124.5,141.2,148.8,150.8,152.6,164.1;HRMS:calculatedm/z for[C11H12BrClN2O4+H]的m/z计算值:350.9747,实测值:350.9712。

Figure BDA0002641634620000571

(11)难以通过柱色谱法纯化该化合物。因此,我们无需进行任何纯化或分析即可进行下一步。HRMS:[C17H23BrClN5O5+H]的m/z计算值:492.0649,实测值:492.0655。

二叔丁基(8-溴-4-氧代-3,4-二氢吡啶[4,3-d]嘧啶-2,5-二基)二氨基甲酸酯(Di-tert-butyl(8-bromo-4-oxo-3,4-dihydropyrido[4,3-d]pyrimidine-2,5-diyl)dicarbamate)(12):在10(5.00g,11.07mmol)在无水二甲基甲酰胺(DMF,28mL)的冰***液中加入N-甲基吗啉(NMM,1.64mL,14.94mmol),然后加入氯甲酸乙酯(1.63mL,13.84mmol)。在0℃1小时后,一次加入Boc-胍(2.38g,14.94mmol),并移去冰浴。通过TLC监测反应进程;反应过程通过HPLC进行。在室温放置24小时后,原料已被完全消耗。将所得混合物浓缩至干,得到Boc-胍加合物,为粗混合物,向其中加入水并在室温搅拌10分钟。通过滤纸过滤获得的固体,并在真空下干燥过夜。向所得固体在无水DMF中的冰***液中小心地添加NaH(60%,1.77g,44.28mmol)。24小时后,真空除去DMF,并小心加入水。过滤收集所得固体,并真空干燥。所获得的粗产物通过硅胶柱色谱法(100-200目)纯化,得到12,为黄色固体。产率:3.64g,72%(分两步)。1H NMR(500.13MHz,DMSO-d6):δ1.48(s,9H),1.50(s,9H),8.54(s,1H),10.85(s,1H),11.58(s,1H),11.78(s,1H);13C NMR(125.77MHz,DMSO-d6):δ27.7(3C),27.8(3C),80.3,83.2,103.2,109.2,149.0,150.4,152.0,152.6,153.7,154.2,161.7;HRMS:[C17H22BrN5O5+H]的m/z计算值:456.0883,实测值:456.0890。

Figure BDA0002641634620000581

二叔丁基(8-溴-4-(叔丁氧基)吡啶基[4,3-d]嘧啶-2,5-二基)双((叔丁氧基羰基)-氨基甲酸酯)(Di-tert-butyl(8-bromo-4-(tert-butoxy)pyrido[4,3-d]pyrimidine-2,5-diyl)bis((tert-butoxycarbonyl)-carbamate))(13):在室温向12(3.10g,6.79mmol)在无水THF的溶液中添加DIEA(3.50mL,20.38mmol)和DMAP(0.17g,1.36mmol),然后添加Boc2O(5.93g,27.18mmol)。在室温4小时后,加入Boc2O(2.97g,13.59mmol),并将反应混合物加热至50℃。通过TLC监测起始原料的消耗,并且在24小时后,将反应混合物用NaHCO3和EA的饱和溶液稀释。将有机层与水层分离,并用硫酸钠干燥。真空除去溶剂,并将获得的粗物质通过硅胶柱色谱纯化,得到纯的13,为白色固体。产量:3.15g,65%。1H NMR(500.13MHz,DMSO-d6):δ1.27(s,18H),1.45(s,18H),1.65(s,9H),9.06(s,1H);13C NMR(125.77MHz,DMSO-d6):δ27.2(6C),27.4(6C),27.5(3C),82.7(2C),83.8(2C),87.6,109.7,118.2,148.7,148.8(2C),149.6(2C),150.8,155.0,156.4,166.5;HRMS:[C31H46BrN5O9+H]的m/z计算值:712.2557,实测值:712.2540。

二叔丁基(8-烯丙基-4-(叔丁氧基)吡啶基-4,3-嘧啶-2,5-二基)双((叔丁氧基羰基)氨基甲酸酯)(Di-tert-butyl(8-allyl-4-(tert-butoxy)pyridor-4,3-dlpyrimidine-2,5-diyl)bis((tert-butoxycarbonyl)carbamate))(14):在室温,向13在无水甲苯(21mL)的搅拌并脱气的溶液(3.00g,4.21mmol)中加入烯丙基三丁基锡(2.79g,8.42mmol),然后加入四三苯基膦钯(0)(0.49g,0.42mmol)。将所得溶液用氩气冲洗以形成惰性气氛,并将溶液在125℃回流15小时。将得到的混合物冷却至室温,加入硅胶,在真空除去溶剂,并将浆液装载在硅胶柱色谱上,得到14,为浅黄色固体。产率:1.70g,60%。1H NMR(500.13MHz,CDCl3):δ1.32(s,18H),1.47(s,18H),1.71(s,9H),3.78(dq,J=6.6,1.3Hz,2H),4.94-5.15(m,2H),6.09(ddt,J=16.7,10.1,6.4Hz,1H),8.49(s,1H);13C NMR(125.77MHz,CDCl3):δ27.8(6C),27.9(6C),28.2(3C),32.4,82.4(2C),83.3(2C),86.3,108.8,116.5,131.4,136.0,148.1(2C),149.8(2C),150.3(2C),155.6,156.8,167.1;HRMS:for[C34H51N5O9+H]的m/z计算值:674.3765,实测值:674.3746。

Figure BDA0002641634620000591

2-(2,5-双(双(叔丁氧基羰基)氨基)-4-(叔丁氧基)吡啶基[4,3-d]嘧啶-8-基)乙酸(2-(2,5-bis(bis(tert-butoxycarbonyl)amino)-4-(tert-butoxy)pyrido[4,3-d]pyrimidin-8-yl)acetic acid)(15,E):向14在CH3CN:CCl4:H2O(23:23:34mL)的冰冷的搅拌溶液(1.00g,1.48mmol)中加入NalO4(2.54g,11.87mmol),然后加入氯化钌(III)水合物(0.07g,0.30mmol)。在0℃、2小时后,将反应混合物通过硅藻土床过滤,并在35℃真空浓缩至3/4体积。在25℃向该混合物中加入水(20mL)和EA(20mL)。将有机层与水层分离,并用硫酸钠干燥。在真空下除去所得的溶剂,并将所获得的粗物质通过硅胶柱色谱法纯化,得到15(E),为浅棕色固体。产率:0.51g 50%。1H NMR(300.13MHz,CDCl3):δ1.34(s,18H),1.56(s,18H),1.71(s,9H),4.03(s,2H),8.62(s,1H);13C NMR(125.77MHz,CDCl3):δ28.0(6C),28.1(6C),28.3(3C),37.1,83.2(2C),85.1(2C),87.7,109.0,124.5,149.6,149.9(2C),150.1,155.9(2C),156.5(2C),167.4,170.4;HRMS:[C33H49N5O11+H]的m/z计算值:692.3507,实测值:692.3491。

Figure BDA0002641634620000601

4-氨基-2-(甲硫基)嘧啶-5-碳腈(4-amino-2-(methylthio)pyrimidine-5-carbonitrile)(17):2-(乙氧基亚甲基)丙二腈(100.00g,0.82mol),S-甲基异硫脲半硫酸盐(73.81g,0.82mol)和三乙胺(370.92mL,2.66mol)在无水乙醇(819mL)中的混合物在室温搅拌。2天后,真空除去溶剂,并将所得残余物用水洗涤,得到所需化合物,为白色固体。产率:122.48g,90%。1H NMR(500.13MHz,DMSO-d6):δ2.45(s,3H),7.87(s,2H),8.43(s,1H);13C NMR(125.77MHz,DMSO-d6):δ13.4,85.3,115.6,160.5,161.4,174.6;ESI-MS:[C6H6N4S+H]的m/z计算值:167.0,实测值:167.1。

Figure BDA0002641634620000602

4-氨基-N'-羟基-2-(甲硫基)嘧啶-5-羧酰亚胺酰胺(4-amino-N'-hydroxy-2-(methylthio)pyrimidine-5-carboximidamide)(18):17(50.00g,0.30mol),盐酸羟胺(24.04g,0.35mol)和三乙胺(83.92mL,0.60mol)在甲醇(602mL)中的混合物在75℃回流。2天后,将反应混合物冷却至室温,并通过过滤收集沉淀的固体,并用甲醇和己烷洗涤,得到浅黄色固体形式的18。产率:46.15g,77%。1H NMR(500.13MHz,DMSO-d6):δ2.43(s,3H),5.96(s,2H),7.59(s,1H),8.10(s,1H),8.35(s,1H),9.87(s,1H);13C NMR(125.77MHz,DMSO-d6):δ13.2,103.6,149.9,152.8,159.6,169.3;ESI-MS:[C6H9N5OS+H]的m/z计算值:200.1,实测值:200.0。

(E)-N'-乙酰氧基-4-氨基-2-(甲硫基)嘧啶-5-羧酰亚胺酰胺((E)-N'-acetoxy-4-amino-2-(methylthio)pyrimidine-5-carboximidamide)(19):在室温向18(31.00g,0.16mol)的冰乙酸溶液中加入乙酸酐(51.48mL,0.55mol)。通过TLC分析得到的溶液显示15小时后18已经完全消耗掉。在真空下除去乙酸,并向该粗物质中加入饱和碳酸氢钠溶液和EA(各200mL)(pH-8-9)。用EA将水层萃取两次,并将有机层用硫酸钠干燥。真空除去EA,得到纯的19,为白色固体。产率:28.02g,90%。1H NMR(500.13MHz,DMSO-d6):δ2.15(s,3H),2.45(s,3H),6.89(s,2H),7.78(s,1H),7.96(s,1H),8.40(s,1H);13C NMR(125.77MHz,DMSO-d6):δ13.3,19.5,102.4,154.5,154.6,159.8,167.9,171.3;HRMS:[C8H11N5O2S+H]的m/z计算值:242.0712,实测值:242.0718。

Figure BDA0002641634620000612

4-氨基-2-(甲硫基)嘧啶-5-羧酰亚胺酰胺(4-amino-2-(methylthio)pyrimidine-5-carboximidamide)(20):19(25.00g,0.10mol)、甲酸(97.73mL,2.59mol)和钯/炭(10%,5.51g,5.18mmol)在甲醇(130mL)中的混合物在80℃回流。15小时后,将反应混合物冷却至室温,并真空除去溶剂,得到所需产物的甲酸盐。产物的甲酸盐产率:29.96g,80%。(用于NMR分析:向所得的粗产物(1g)中加入甲醇(10mL)和TEA(5mL,pH-9-10)并搅拌15min。通过过滤收集所得的固体,并用己烷洗涤。)1H NMR(500.13MHz,DMSO-d6):δ2.43(s,3H),5.96(s,2H),7.59(s,1H),8.11(s,1H),8.36(s,1H),9.87(s,1H);13C NMR(125.77MHz,DMSO-d6):δ13.3,103.6,149.9,152.9,159.6,169.4;HRMS:[C6H9N5S+H]的m/z计算值:184.0657,实测值:184.0664。

叔丁基((4-氨基-2-(甲硫基)嘧啶-5-基)(亚胺基)甲基)氨基甲酸酯(tert-Butyl((4-amino-2-(methylthio)pyrimidin-5-yl)(imino)methyl)carbamate)(21):向甲酸盐形式的20(22.00g,68.47mmol)在THF∶水(100∶125mL)的冰冷搅拌溶液中逐份添加碳酸氢钠(34.51mL,0.41mol)。当所得溶液的pH达到8-9时,缓慢加入在25ml THF中的苯乙酸酐(17.19g,78.74mmol)。通过TLC分析所得溶液表明24小时后20已完全消耗。将反应混合物转移至包含100mL水和200mL EA的分液漏斗中。用EA(2X)萃取水层,并将合并的EA层经硫酸钠干燥。在真空下除去EA,并通过硅胶柱色谱法纯化混合物,得到纯的21,为白色固体。产量:15.71g,81%。1H NMR(300.13MHz,CDCl3):δ1.51(s,9H),2.50(s,3H),7.61(s,2H),8.42(s,1H);13C NMR(125.77MHz,CDCl3):δ13.9,28.1(3C),79.6,104.6,155.2(2C),161.1(2C),173.9;HRMS:[C11H17N5O2S+H]的m/z计算值:284.1181,实测值:284.1189。

叔丁基(Z)-((4-(双(叔丁氧基羰基)氨基)-2-(甲硫基)嘧啶-5-基)((叔丁氧基羰基亚氨基)甲基)(叔丁氧基羰基)氨基甲酸酯(tert-butyl(Z)-((4-(bis(tert-butoxycarbonyl)amino)-2-(methylthio)pyrimidin-5-yl)((tert-butoxycarbonyl)imino)methyl)(tert-butoxycarbonyl)carbamate)(22)向21(15.00g,52.94mmol)在THF(106mL)中的冰冷搅拌溶液中,添加一份DIPEA(46.11mL,264.69mmol)和DMAP(1.29g,10.59mmol),然后加入Boc-酸酐(57.77g,264.69mmol)在25ml THF中的溶液(缓慢加入)。通过TLC监测反应进程,结果表明24小时后21已经完全消耗掉。将反应混合物转移至包含200mL水和100mL EA的分液漏斗中。将混合物用EA萃取(2X),并将合并的EA层经硫酸钠干燥。真空除去EA,并将粗混合物通过硅胶柱色谱法纯化,得到纯的22,为白色固体。产率:28.96g,80%。1H NMR(500.13MHz,CDCl3):δ1.44(s,l 8H),1.45(s,18H),1.51(s,9H),2.61(s,3H),8.69(s,1H);13C NMR(125.77MHz,CDCl3):δ14.6,28.0(6C),28.1(6C),28.1(3C),83.2,83.7(2C),84.9(2C),119.2,148.3,150.1,157.3(2C),158.8,159.5(2C),160.4,176.1;HRMS:[C31H50N5O10S+H]的m/z计算值:684.3278,实测值:684.3275。

化合物(23):向22(15.00g,21.94mmol)在DCM(55mL)中的冰冷搅拌溶液中分批加入mCPBA(10.60g,61.42mmol)。通过TLC分析反应进程,其显示3小时后22已被完全消耗。将反应混合物转移至包含200mL的碳酸氢钠饱和溶液和100mL的DCM的分液漏斗中。将混合物用DCM(2X)萃取,并将合并的DCM层用硫酸钠干燥。真空除去DCM,并将粗混合物不经进一步纯化用于下一步。

Figure BDA0002641634620000632

叔丁基(Z)-(4-(双(叔丁氧羰基)氨基)-2-氧代-1,2-二氢嘧啶-5-基)((叔丁氧羰基)亚胺基)甲基)(叔丁氧羰基)氨基甲酸酯(tert-butyl(Z)-((4-(bis(tert-butoxycarbonyl)amino)-2-oxo-1,2-dihydro-pyrimidin-5-yl)((tert-butoxycarbonyl)imino)methyl)(tert-butoxycarbonyl)carbamate)(24):向粗制23(15.00g)在THF(55mL)的冰冷搅拌溶液中,缓慢加入2N NaOH(54.84mL,109.68mmol)。通过TLC监测原料消耗。30分钟后,将反应混合物转移至包含200mL的1%HCl和100mL的EA的分液漏斗中。用EA(2X)萃取水层,并将合并的EA层在硫酸钠上干燥。真空除去EA,并将粗物质通过硅胶柱色谱法纯化。产率:10.75g,两步法得到75%。1H NMR(300.13MHz,DMSO-d6):δ1.37(s,18H),1.39(s,18H),1.41(s,9H),8.65(s,1H),12.80(s,1H);13C NMR(125.77MHz,DMSO-d6):δ27.4(15C),82.0,82.9(2C),83.5(2C),108.0,145.2,147.5(2C),149.1(2C),152.8,155.0,157.0,162.9;HRMS:[C30H47N5O11+H]的m/z计算值:654.3350,实测值:654.3359。

苄基(Z)-2-(4-(双(叔丁氧羰基)氨基)-2-氧代-5-(N,N,N’-三(叔丁氧羰基)氨基甲酰胺基)嘧啶-1(2H)-基)乙酸酯(Benzyl(Z)-2-(4-(bis(tert-butoxycarbonyl)amino)-2-oxo-5-(N,N,N'-tris(tert-butoxycarbonyl)carbamimidoyl)pyrimidin-1(2H)-yl)acetate)(25):在10min内,向化合物24(10.00g,15.30mmol)和K2CO3(4.23g,30.59mmol)在无水DMF(75mL)中的混合物中逐滴加入乙酸苄基-2-溴乙酸酯(2.42mL,15.30mmol)。通过TLC监测反应进程,发现其在4小时后完成。将反应混合物通过烧结漏斗过滤,并将DMF在真空下蒸发。向所得的粗物质中加入水,并搅拌5分钟。过滤收集获得的沉淀,并用水和己烷洗涤,得到纯的化合物25,为白色固体。(注意:如果化合物沉淀得不好,则可以采用萃取的方法来获得该化合物,如果需要,可以用短床色谱柱来获得纯的化合物)。产率:10.92g,89%。1HNMR(500.13MHz,CDCl3):δ1.46(s,18H),1.48(s,18H),1.50(s,9H),4.75(s,2H),5.22(s,2H),7.27-7.47(m,5H),7.95(s,1H);13C NMR(125.77MHz,CDCl3):δ27.8(6C),27.9(6C),28.0(3C),51.0,68.2,83.0,83.7(2C),85.2(2C),110.6,128.6(3C),128.7(2C),128.8,134.5,148.2,149.5(2C),152.0(2C),154.4,157.1,163.9,166.1;HRMS:[C39H55N5O13+H]的m/z计算值:802.3875,实测值:802.3882。

Figure BDA0002641634620000651

(Z)-2-(4-(双(叔丁氧基羰基)氨基)-2-氧代-5-(N,N,N'-三(叔丁氧基羰基)氨基甲酰基)嘧啶-1(2H)-基)乙酸((Z)-2-(4-(bis(tert-butoxycarbonyl)amino)-2-oxo-5-(N,N,N'-tris(tert-butoxycarbonyl)carbamimidoyl)pyrimidi-1(2H)-yl)acetic acid)(26,F):在氩气气球下,将钯/炭(10%载量,0.66g,0.62mmol)小心地添加到25(5.00g,6.24mmol)的EA(50mL)溶液中。5分钟后,用氢气球代替氩气球,并将反应混合物在相同的气氛下再搅拌1小时。起始原料的完全耗尽通过TLC评估。将得到的反应混合物小心地通过硅藻土床过滤,并将滤液在旋转蒸发仪上蒸发,得到纯的化合物26,为白色固体。产量:3.99g,90%。1H NMR(500.13MHz,DMSO-d6):δ1.36(s,18H),1.41(s,18H),1.42(s,9H),4.85(s,2H),9.10(s,1H),13.45(s,1H);13C NMR(125.77MHz,DMSO-d6):0 27.4(6C),27.4(6C),27.5(3C),50.9,82.2,83.0(2C),83.3(2C),108.3,145.1,146.9(2C),149.4(2C),154.1,156.1,157.0,162.5,168.4;HRMS:

[C32H49N5O13+H]的m/z计算值:712.3405,实测值:712.3386。

Figure BDA0002641634620000652

2-(2,4-二氧代-1,2,3,4-四氢嘧啶-5-基)乙酸(2-(2,4-dioxo-1,2,3,4-tetrahydropyrimidin-5-yl)acetic acid)(27):该化合物购自可商购的来源。

Figure BDA0002641634620000661

烯丙基(R)-(2-((((9H-氟-9-基)甲氧基)羰基)氨基)-3-(2-(叔丁氧基)乙氧基)乙氧基)丙基)甘氨酸酯(Allyl(R)-(2-((((9H-fluoren-9-yl)methoxy)carbonyl)amino)-3-(2-(2-(tert-butoxy)ethoxy)ethoxy)propyl)glycinate)(28):向N-Fmoc(O-MP(叔丁基)-L-丝氨醇(5.00g,10.93mmol)的饱和的DCM:水(28mL)冷却溶液中加入戴斯-马丁试剂(9.96g,23.49)。将反应混合物在相同温度下再搅拌30分钟,在室温搅拌1小时,以使醇完全转化为醛。用***、碳酸氢钠饱和溶液、10%硫代硫酸钠稀释反应混合物,搅拌5min。将全部反应混合物转移至分液漏斗中,用***萃取(2x)有机化合物。将醚层用硫酸钠干燥,用旋转蒸发仪除去,得到粗醛。该醛无需进一步纯化即可用于下一步骤,向该醛的无水DCM(44mL)溶液中加入甘氨酸烯丙酸PTSA盐(6.28g,21.86mmol)和DIEA(5.90mL,33.89mmol),并使其反应1小时。将一份NaB(OAc)3H(5.79g,27.33mmol)加入反应混合物中。在室温搅拌过夜后,将反应混合物用DCM(100mL)和碳酸氢钠饱和溶液稀释。将反应混合物转移至分液漏斗,并将该层与水层分离。合并的有机层经硫酸钠干燥并在旋转蒸发仪上除去,并将粗混合物通过快速硅胶柱色谱法纯化。产量:4.85g,85%。1HNMR(500.13MHz,CDCl3):δ1.19(s,9H),2.77-2.92(m,2H),3.49-3.69(m,13H),3.88(bs,1H),4.23(t,J=6.9Hz,1H),4.39(d,J=7.5Hz,2H),4.64(dt,J=5.9,1.4Hz,2H),5.23-5.36(m,2H),5.73(d,J=8.4Hz,1H),5.92(ddt,J=17.3,10.4,5.8Hz,1H),7.32(td,J=7.5,1.2Hz,2H),7.36-7.43(m,2H),7.60-7.68(m,2H),7.74-7.79(m,2H);13C NMR(125.77MHz,CDCl3):δ27.5(3C),47.3,50.3,50.5,50.6,50.7,61.2,65.5,66.7,70.5,70.8,71.2,71.4,73.1,118.7,119.9,120.0,120.0,125.2,127.0,127.6,127.7,131.8,141.3,144.0,144.0,156.4,171.8,174.3;ESI-MS:[C31H42N2O71+H]的m/z计算值:555.3,实测值:555.3。

烯丙基单体(29a):在室温向在无水DMF(6mL)中的15(E)(0.50g,0.72mmol)和DIEA(163.67μL,0.94mmol)的混合物中加入一份HBTU(0.32g,0.83mmol)。在室温10分钟后,将主链28(0.60g,1.08mmol)的DMF(4mL)溶液加入上述反应混合物中。通过TLC监测的反应进程(洗脱液:EA:Hex(50:50);主链的Rf=0.2;产物的Rf=0.6;E的Rf=0.1)。原料完全消耗完后,在45℃真空除去DMF。向所得粗物质中加入1%HCl(20ml)和EA(20ml),并使用分液漏斗将有机层(2x)与水层分离。将合并的有机层干燥,除去,并将获得的粗产物通过快速硅胶柱色谱法纯化。产率:0.62g,70%。1H NMR(500.13MHz,DMSO-d6,旋转异构体):δ1.08/1.09(s,9H),1.21 1.33(m,18H),1.36/1.38(s,18H),1.41/1.65(s,9H),3.36-3.70(m,10H),3.82-4.27(m,8H),4.32(bs,2H),4.41-4.71(m,2H),5.13-5.41(m,2H),5.81-6.01(m,1H),7.30-7.57(m,5H),7.71/7.73(d,J=9.7Hz,2H),7.89/7.99(d,J=7.5Hz,2H),8.56/8.60(s,1H);13C NMR(125.77MHz,DMSO-d6,旋转异构体):δ27.2-27.6(18C),46.7,59.7,60.6/60.6,64.7,65.3,65.5,69.6,69.6,69.8,70.0,70.4,70.4,72.2,81.8-86.3(6C),108.1,117.7,118.2,120.l(2C),125.1,127.0(2C),127.3,127.6(2C),127.8/127.9,132.1,132.3,140.7,143.8,147.9,149.3,149.5,149.6,155.0/155.1,155.9,156.5,166.6,168.8,169.2,170.2;HRMS:[C64H89N7O17+H]的m/z计算值:1228.6393,实测值:1228.6398。

Figure BDA0002641634620000681

烯丙基单体(29b):使用化合物27(1.00g,5.88mmol)和主链28(4.08g,7.35mmol)作为起始原料,使用化合物29a的上述步骤制备该化合物。TLC(洗脱液:5%MeOH:DCM(5:95);主链的Rf=0.6;产物的Rf=0.2;27的Rf=0.0)。产率:3.5g,84%。1H NMR(500.13MHz,DMSO-d6,旋转异构体):δ1.10/1.10(s,9H),3.30-3.59(m,14H),3.74 4.13(m,2H),4.174.42(m,4H),4.60(dd,J=33.4,4.8Hz,2H),5.00-5.44(m,2H),5.82-6.01(m,1H),7.10-7.55(m,6H),7.69(d,J=7.4Hz,2H),7.89(d,J=7.5Hz,2H),10.75(bs,1H),11.08(s,1H);13C NMR(125.77MHz,DMSO-d6,旋转异构体)δ27.2(3C),46.7,60.6(2C),64.7,65.2,65.5,69.6,69.8,69.9,70.4(2C),72.2,107.2,117.7,118.1,120.1(2C),125.2,127.0(2C),127.3,127.6(2C),132.2/132.3,139.2,139.7,140.7,143.8/143.8,151.2/151.3,155.8,164.1/164.1,168.9,169.4,170.6;HRMS:[C37H46N4O10+H]的m/z计算值:707.3292,实测值:707.3290。

Figure BDA0002641634620000682

烯丙基单体(29c):使用化合物26(3.50g,4.92mmol)和主链28(3.41g,6.15mmol)作为起始原料,用化合物29a的上述步骤制备该化合物。TLC(洗脱液:EA:己烷(40∶60);主链的Rf=0.1;产品的Rf=0.7;26的Rf=0.1)。产率:4.80g,78%。1HNMR(300MHz,DMSO-d6):δ1.09(bs,9H),1.34/13.6(s,18H),1.41/1.42(s,27H),3.35-3.59(m,14H),4.07-4.49(m,4H),4.61(dd,J=37.6,5.4Hz,3H),4.97-5.42(m,3H),5.77-6.04(m,1H),7.32(t,J=7.5Hz,2H),7.50-7.57(m,3H),7.89(d,J=7.5Hz,2H),7.99(d,J=8.4Hz,2H),8.94/8.96(s,1H);13C NMR(125.77MHz,DMSO-d6,旋转异构体):δ27.2-27.5(18C),46.7,60.2/60.7(2C),64.7,65.5,69.5,69.6,69.8,69.9,70.4/70.4(2C),72.2,82.2-83.4(6C),108.1,117.7,120.1(2C),124.4,125.1,127.0(2C),127.4,127.6(2C),127.8,132.2(2C),140.7(2C),143.8(2C),145.1,146.9(2C),149.5(2C),157.0,162.5,166.5,168.4;HRMS:[C63H89N7O19+H]的m/z计算值:1248.6291,实测值:1248.6256。

以下编号的项目描述了本发明的非限制性方面:

第1项.一种基因识别试剂,其包含核酸或核酸类似物主链并包含3个或更多个核糖、脱氧核糖或核酸类似物主链残基,连接至所述主链残基的二价核碱基序列,其中所述二价核碱基的序列结合至两个核酸链上重复扩张疾病的扩张性重复的单元靶序列,或单元靶序列的一个或多个连续性迭代。

第2项.第1项的基因识别试剂,其中所述核酸或核酸类似物主链包含第一端和第二端,并且还包含连接至所述主链第一端的第一连接基团,连接至所述第二端的第二连接基团,其与所述第一连接基团非共价结合或自合。

第3项.第1项或2所述的基因识别试剂,其中当所述两条链以反平行方向排列时,所述二价核碱基的序列结合两条链的每条上的重复扩张疾病的扩张性重复的单元靶序列或所述单元靶序列的两个或更多个连续性迭代。

第4项.第1-3项之一的基因识别试剂,其中所述单元靶序列是通过所述两条链上的连续性迭代(GAA)n,(CGG)n,(CCG)n,(CAG)n,(CTG)n,(CCTG)n,(ATTCT)n,或(GGGGCC)n或者与前述任何序列互补的序列形成的。

第5项.第1-4项之一的基因识别试剂,其中所述单元靶序列是C/G-A/A-G/C。

第6项.第1-5项之一的基因识别试剂,其具有核碱基序列,顺序为:

JB3核碱基,JB6核碱基和JB4核碱基;

JB6核碱基,JB4核碱基和JB3核碱基;

或JB4核碱基,JB3核碱基和JB6核碱基;

,或前述的两个或多个连续性迭代。

第7项.第6项的基因识别试剂,其具有核碱基序列,顺序为:

JB3或JB3b;JB6或JB6b;和JB4,JB4b,JB4c,JB4d或JB4e;

JB6或JB6b;JB4,JB4b,JB4c,JB4d或JB4e;和JB3或JB3b;

JB4,JB4b,JB4c,JB4d或JB4e;JB3或JB3b;和JB6或JB6b,

或前述的两个或多个连续性迭代。

第8项.第1-5项之一的基因识别试剂,其具有核碱基序列,顺序为:

JB3,JB6和JB4;

JB6,JB4和JB3;或

JB4,JB3和JB6,

或前述的两个或多个连续性迭代。

第9项.第1-3项之一的基因识别试剂,其具有表C中列出的单元识别试剂序列的核碱基序列。

第10项.第1-9项之一的基因识别试剂,其中所述两条链均为相同的核酸分子。

第11项.第1-10项之一的基因识别试剂,其中所述两条链均为RNA。

第12项.第1-11项之一的基因识别试剂,其由3至8个核碱基例如3、4、5、6、7或8个核碱基的序列组成。

第13项.第1-12项之一的基因识别试剂,其中所述主链残基是核酸类似物主链残基。

第14项.第13项的基因识别试剂,其中所述主链残基是构象预组织的。

第15项.第14项的基因识别试剂,其中所述主链残基是锁核酸残基。

第16项.第14项的基因识别试剂,其中所述主链残基是肽核酸(PNA)残基。

第17项.第14项的基因识别试剂,其中所述主链残基是γPNA残基。

第18项.第1-14项之一所述的基因识别试剂,其具有以下结构:

其中,X为S或O;n是1到6之间的整数,包括1和6;m是0到4之间的整数;包括0和4;R1和R2各自独立地为:H;含胍基例如

其中n=1,2,3,4或5;氨基酸侧链,例如

直链或支链(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基,任选地用包含1至50个乙二醇部分的乙二醇单元取代;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(SCH2-CH2)q-SP1;-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数,包括0和50;且r和s是各自独立地为1到50的整数;

R3是H或离去基团,例如直链或支链(C1-C8)烷基,取代或未取代的(C3-C8)芳基,(C3-C8)芳基(C1-C6)亚烷基,(C1-C8)羧基,其任选地被氨基酸侧链或含胍基取代,或其中o是1-20,R6的每个实例独立地是氨基酸侧链,并且R7是-OH或-NH2

R4是(C1-C10)二价烃或被一个或多个N或O部分取代的(C1-C10)二价烃,例如-O-,-OH,-C(O)-,-NH-,-NH2,-C(O)NH-;

R5是-OH,-SH或二硫键保护基;和

R的每个实例独立地是核碱基,其产生与一个或多个靶核酸中的核碱基的单元靶序列互补的核碱基序列,从而所述多个识别模块中的每一个都结合到模板核酸上的核碱基的靶序列上并且彼此连接,

或其药学上可接受的盐。

第19项.第18项所述的基因识别试剂,其中R1或R2是以下取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2;其中,P1为H、(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基,(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

第20项.第18项所述的基因识别试剂,其中R5是-SH,-OH,或-S-S-R8,其中是R8是一个或多个氨基酸残基,氨基酸侧链,含胍基,未取代或取代的(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基。

第21项.第18项所述的基因识别试剂,其中R1是H且R2不是H,或者R2是H且R1不是H。

第22项.第18项所述的基因识别试剂,其中R1是H且R2包括聚氧乙烯部分。

第23项.第18项所述的基因识别试剂,其中R5是-SH;且X是S。

第24项.第18项所述的基因识别试剂,其中R5包括赖氨酸残基、精氨酸残基或含胍基。

第25项.第18项所述的基因识别试剂,其中R4是亚甲基,R5是-SH,X是S,且R5是羟基取代的(C1-C8)烷基,例如-CH2-CH2-OH。

第26项.第2-14项之一所述的基因识别试剂,其中所述第一连接基团和所述第二连接基团独立地是2至5环稠合的多环芳香族部分,其中当识别试剂与靶核酸的相邻序列杂交时,该部分与所述相邻识别试剂的芳基部分堆叠。

第27项.第26项所述的基因识别试剂,其中所述2至5环稠合的多环芳香族部分是未取代或取代的戊烯、茚、萘、甘菊蓝、庚烯、联苯、as-茚烯、s-茚烯、苊烯、芴、萉、菲、蒽、荧蒽、醋菲烯、醋蒽烯、苯并菲、芘、萘并萘/并四苯、七曜烯、苉或苝,任选被一个或多个杂原子如O,N和/或S取代,例如呫吨、核黄素(维生素B2)、芒果素或芒果苷。

第28项.第26或27项所述的基因识别试剂,其中所述2至5环稠合的多环芳香族部分是相同的。

第29项.第2项所述的基因识别试剂,其中所述识别试剂具有以下结构:

Figure BDA0002641634620000732

其中,R的每个实例独立地是核碱基,并且R的每个实例可以是相同或不同的核碱基;

N是范围1-6的整数,诸如1、2、3、4、5或6;

R1和R2各自独立地为:H;含胍基,例如

其中n=1,2,3,4或5;氨基酸侧链,例如

Figure BDA0002641634620000734

未取代或取代的(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(OCH2-CH2-0)q-SP1;-CH2-(SCH2-CH2)q-SP1,-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数,包括0和50;r和s各自独立地是1到50的整数,包括1和50;

R10或R11中的一个以及R12、R13或R14中的一个是-L-R3,其中R3的每个实例独立地是2至5环稠合的多环芳香族部分,例如未取代或取代的戊烯、茚、萘、甘菊蓝、庚烯、联苯、as-茚烯、s-茚烯、苊烯、芴、萉、菲、蒽、荧蒽、醋菲烯、醋蒽烯、苯并菲、芘、萘并萘/并四苯、七曜烯、苉或苝,任选被一个或多个杂原子如O,N和/或S取代,例如呫吨、核黄素(维生素B2)、芒果素或芒果苷,其中当识别试剂与靶核酸的相邻序列杂交时,每一个均能够与所述相邻识别试剂的R3基团堆叠;

L是接头;和

R10、R11、R12、R13或R14的剩余部分各自独立地是H,一或多个相邻氨基酸残基,例如一个或多个Arg残基,含胍基,例如

Figure BDA0002641634620000741

其中n=1,2,3,4或5;氨基酸侧链,例如

Figure BDA0002641634620000742

未取代或取代的(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基、(C1-C8)羟基烷基、(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基、(C3-C8)环烷基(C1-C6)亚烷基;-CH2-(OCH2-CH2)qOP1;-CH2-(OCH2-CH2)q-NHP1;-CH2-(OCH2-CH2-0)q-SP1;-CH2-(SCH2-CH2)q-SP1,-CH2-(OCH2-CH2)r-OH;-CH2-(OCH2-CH2)r-NH2;-CH2-(OCH2-CH2)r-NHC(NH)NH2;或-CH2-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2,其中P1是H,(C1-C8)烷基,(C2-C8)烯基,(C2-C8)炔基,(C3-C8)芳基,(C3-C8)环烷基,(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数,包括0和50;r和s各自独立地是1到50的整数;

或其药学上可接受的盐。

第30项.第29项所述的基因识别试剂,其中R1、R2、R10、R11、R12、R13或R14中的一个或多个是以下取代的(C1-C6)烷基:-(OCH2-CH2)qOP1;-(OCH2-CH2)q-NHP1;-(SCH2-CH2)q-SP1;-(OCH2-CH2)r-OH;-(OCH2-CH2)r-NH2;-(OCH2-CH2)r-NHC(NH)NH2;或-(OCH2-CH2)r-S-S[CH2CH2]sNHC(NH)NH2;其中,P1为H、(C1-C8)烷基、(C2-C8)烯基、(C2-C8)炔基,(C3-C8)芳基、(C3-C8)环烷基、(C3-C8)芳基(C1-C6)亚烷基或(C3-C8)环烷基(C1-C6)亚烷基;q是0到50的整数;r是1到50的整数,且s是1到50的整数。

第31项.第29项所述的基因识别试剂,其中R4和R7是-L-R3

第32项.第29项所述的基因识别试剂,其中,所述接头包含约5至25个原子,例如5-20、5-10,例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个原子,或总计1到10个,例如1、2、3、4、5、6、7、8、9或10个C和杂原子,例如O,P,N或S原子。

第33项.第29项所述的基因识别试剂,其中R3的两个实例均包含相同的2至5环稠合的多环芳香族部分。

第34项.第1-33项之一所述的基因识别试剂,包含含胍基,例如

其中n=1,2,3,4或5。

第35项.一种结合包含与扩张性重复疾病相关的扩张性重复的核酸的方法,包括使包含所述扩张性重复的核酸与第1-32项之一的基因识别试剂接触。

第36项.第35项的方法,其中所述所述核酸包含通过所述两条链上的(GAA)n、(CGG)n、(CCG)n、(CAG)n、(CTG)n、(CCTG)n、(ATTCT)n、或(GGGGCC)n的连续性迭代形成的单元靶序列,或者与前述任何序列互补的序列。

第37项.第35项的方法,其中所述核酸包含通过所述两条链上的(CAG)n的连续性迭代形成的单元靶序列,或者与前述任何序列互补的序列。

第38项.第35项所述的方法,其中所述核酸获自患有重复扩张疾病的患者。

第39项.一种在从患者获得的样品中鉴定包含与扩张性重复疾病相关的扩张性重复的核酸的存在的方法,该方法包括使从患者获得的核酸样品与第2-34项之一所述的基因识别试剂接触,并确定是否发生所述基因识别试剂的结合和连接,其表明所述样品包含含有与扩张性重复疾病相关的扩张性重复的核酸,并任选地治疗所述患者的所述扩张性重复疾病。

第40项.一种组合物,其包含第1-34项之一所述的基因识别试剂和药学上可接受的载体。

第41项.一种敲低细胞中含有与扩张性重复疾病相关的扩张性重复的基因的表达的方法,包括使包含所述扩张性重复的核酸如RNA与第1-34项之一所述的基因识别试剂接触。

已经参考某些示例性实施方案、可分散组合物及其用途描述了本发明。然而,本领域普通技术人员将认识到,在不脱离本发明的精神和范围的情况下,可以对任何示例性实施例进行各种替换,修改或组合。因此,本发明不受示例性实施例的描述的限制,而是由提交的所附原始权利要求限制。

序列表

<110> ***梅隆大学

<120> 二价核酸配体及其用途

<130> 6526-1807597

<150> US 62/708,783

<151> 2017-12-21

<150> US 62/710,262

<151> 2018-02-14

<160> 1

<170> PatentIn version 3.5

<210> 1

<211> 22

<212> RNA

<213> 人

<400> 1

cgccagcgca gcagcgcagg cg 22

78页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:包含二硫代磷酸酯核苷间连接的寡核苷酸

相关技术

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类