用于密码子扩展的突变tRNA

文档序号:23879 发布日期:2021-09-21 浏览:40次 >En<

阅读说明:本技术 用于密码子扩展的突变tRNA (Mutant tRNAs for codon expansion ) 是由 筱原正次郎 谷口贵昭 美细津美树 西村香绪梨 岩桥万奈 江村岳 中野効彦 田中正彦 于 2019-12-26 设计创作,主要内容包括:在一些实施方案中,本公开涉及其中反密码子的第一个字母已被替换为赖胞苷或胍丁胞苷的突变tRNA,以及包含突变tRNA的翻译系统。在具体实施方案中,本公开提供了能够选择性翻译密码子NNA的突变tRNA。在另一个实施方案中,本公开提供了能够从单个密码子盒翻译两种或三种类型的氨基酸的翻译系统。在又一个实施方案中,本公开提供用于合成赖胞苷二磷酸、胍丁胞苷二磷酸及其衍生物的新方法。(In some embodiments, the disclosure relates to a mutant tRNA in which the first letter of the anticodon has been replaced with lysytidine or guanadine, and a translation system comprising the mutant tRNA. In particular embodiments, the disclosure provides mutant trnas capable of selectively translating codon NNA. In another embodiment, the present disclosure provides a translation system capable of translating two or three types of amino acids from a single codon cassette. In yet another embodiment, the present disclosure provides a novel method for the synthesis of lysine cytidine diphosphate, guanadine cytidine diphosphate, and derivatives thereof.)

用于密码子扩展的突变tRNA

技术领域

本公开涉及tRNA和翻译系统,以及其使用方法。

背景技术

展示文库是一种非常有用的技术,通过它可以以进化工程的方式有效地获得与靶蛋白结合的分子。为了使用展示文库获得对任意靶分子表现出高结合能力的分子,或者获得多个分别结合不同表位的分子,需要对高度多样化的文库进行淘选。为了构建高度多样化的文库,可以增加文库的结构单元的数量或种类;然而,当从膜透性的角度对分子量有限制时,结构单元的数量也会受到限制。因此,增加结构单元多样性的策略对于增加文库多样性很重要。

在重构的无细胞翻译系统如PURESYSTEM(非专利文献(NPL)1)中,由于氨基酸、tRNA和氨酰tRNA合成酶(ARS)等成分的浓度可以调整,天然密码子-氨基酸对应关系可能会发生改变。此类翻译系统的使用使得能够构建展示文库,其中引入了20种或更多不同种的任意结构单元。然而,在使用三碱基密码子的大肠杆菌(Escherichia coli)翻译系统中,由于摇摆法则,原则上最多只能引入32种不同的结构单元。为了给出更具体的解释,除了Watson-Crick碱基对,密码子的第三个字母和反密码子的第一个字母的配对存在一些“摇摆(play)”,这允许G和U之间的配对,称为摆动碱基对。因此,反密码子GNN解码NNU和NNC密码子,反密码子UNN解码NNA和NNG密码子。因此,区分这些密码子是不可能的,将可以引入一个密码子框的不同氨基酸的最大数量限制为两个(非专利文献2)。

另一方面,在自然界中,有方法能够区分AUA和AUG密码子。一个这样的例子是在第34位(反密码子的第一个字母)处引入大肠杆菌tRNA Ile2的赖胞苷修饰。已知这种修饰使tRNA Ile2仅解码AUA密码子,而不解码AUG密码子(非专利文献3)。这种修饰是通过异亮氨酸tRNA-赖胞苷合成酶(tRNAIle-赖胞苷合成酶;TilS)引入的(非专利文献4)。由于其底物tRNA仅为tRNA Ile2,因此将赖胞苷引入其他tRNA中并不容易(非专利文献5)。

引用列表

[非专利文献]

[非专利文献1]Shimizu et al.,Nat Biotechnol.2001 Aug;19(8):751-755

[非专利文献2]Iwane et al.,Nat Chem.2016 Apr;8(4):317-325

[非专利文献3]Grosjean et al.,Trends Biochem Sci.2004 Apr;29(4):165-168

[非专利文献4]Suzuki T et al.,FEBS Lett.2010 Jan 21;584(2):272-277

[非专利文献5]Lajoie et al.,J Mol Biol.2016 Feb 27;428(5 Pt B):1004-1021

发明内容

技术问题

如上所述,在第34位(反密码子的第一个字母)将赖胞苷引入tRNA Ile2能够区分AUA和AUG密码子。然而,自然界中没有其他用赖胞苷修饰的tRNA。此外,还没有报道区分NNA和NNG密码子的人工手段。本发明是鉴于这种情况而完成的。本公开的目的是提供能够区分NNA和NNG密码子的新方法。

解决问题的方案

在本文中,本发明人通过酶促反应将化学合成的tRNA片段与赖胞苷(也称为2-赖氨酰胞苷)连接以制备tRNA,其中在34位引入了赖胞苷,并且在35和36位(反密码子的第二个和第三个字母)具有不同的序列。当重构包含这些tRNA的翻译系统并进行氨基酸翻译时,发现这些翻译系统中的任何一个都能够区分NNA和NNG密码子。此外,在这些检查过程中发现,虽然具有UNN反密码子的tRNA不仅解码NNA和NNG密码子,还解码NNU密码子,但引入赖胞苷的tRNA显著减少了NNU密码子的这种误读。

本发明基于这样的发现,具体包括以下举例说明的实施方案:

[1]通过改造tRNA产生的突变tRNA,其中所述改造包括改造使得在以N1N2N3表示的反密码子中,改造后的第一个字母核苷N1为赖胞苷(k2C)、赖胞苷衍生物、胍丁胞苷(agmatidine)(agm2C)和胍丁胞苷(agmatidine)衍生物中的任一个,其中N2和N3分别为反密码子的第二个字母和第三个字母的任意核苷;

[2]根据[1]所述的突变tRNA,其中改造前的N1是胞苷(C),并且从所述胞苷(C)改造为赖胞苷(k2C)不能被赖胞苷合成酶(tRNAIle-赖胞苷合成酶;TilS)催化,所述赖胞苷合成酶具有SEQ ID NO:51的氨基酸序列;

[3]根据[1]所述的突变tRNA,其中改造前的N1是胞苷(C),并且从所述胞苷(C)改造为胍丁胞苷(agmatidine)(agm2C)不能被胍丁胞苷(agmatidine)合成酶(tRNAIle-胍丁胞苷(agmatidine)合成酶;TiaS)催化,所述胍丁胞苷(agmatidine)合成酶具有SEQ ID NO:52的氨基酸序列;

[4]根据[1]至[3]中任一项所述的突变tRNA,包含与M1M2A表示的密码子互补的反密码子(其中M1和M2分别表示密码子的第一个和第二个字母的核苷;M1和M2各自选自腺苷(A)、鸟苷(G)、胞苷(C)和尿苷(U)中的任一种;第三个字母的核苷对应于腺苷);

[5]根据[4]所述的突变tRNA,其中所述反密码子由k2CN2N3或agm2CN2N3表示(其中所述反密码子第一个字母的核苷是赖胞苷(k2C)或胍丁胞苷(agmatidine)(agm2C),第二个字母(N2)的核苷和第三个字母(N3)的核苷分别与M2和M1互补);

[6]根据[5]所述的突变tRNA,其中N2和N3各自选自腺苷(A)、鸟苷(G)、胞苷(C)和尿苷(U)中的任一种;

[7]根据[1]至[6]中任一项所述的突变tRNA,其中所述tRNA是起始tRNA或延长子tRNA;

[8]根据[1]至[7]中任一项所述的突变tRNA,其中所述tRNA来源于原核生物或真核生物;

[9]根据[4]至[8]中任一项所述的突变tRNA,其中M1和M2选自构成密码子盒的密码子,其中第三个字母核苷为A的密码子和第三个字母核苷为G的密码子均在天然遗传密码表中编码相同的氨基酸;

[10]根据[4]至[8]中任一项所述的突变tRNA,其中M1和M2选自构成密码子盒的密码子,其中第三个字母核苷为U的密码子和第三个字母核苷为A的密码子均在天然遗传密码表中编码相同的氨基酸;

[11]根据[4]至[8]中任一项所述的突变tRNA,其中M1和M2选自构成密码子盒的密码子,其中第三个字母核苷为U的密码子、第三个字母核苷为C的密码子、第三个字母核苷为A的密码子和第三个字母核苷为G的密码子均在天然遗传密码表中编码相同的氨基酸;

[12]根据[4]至[8]中任一项所述的突变tRNA,其中M1和M2选自构成密码子盒的密码子,其中第三个字母核苷为A的密码子和第三个字母核苷为G的密码子在天然遗传密码表中编码不同的氨基酸;

[13]根据[4]至[8]中任一项所述的突变tRNA,其中M1和M2选自构成密码子盒的密码子,其中第三个字母核苷为A的密码子和/或第三个字母核苷为G的密码子为在天然遗传密码表中的终止密码子;

[14]根据[4]至[8]中任一项所述的突变tRNA,其中M1是尿苷(U),M2是胞苷(C);

[15]根据[4]至[8]中任一项所述的突变tRNA,其中M1是胞苷(C),M2是尿苷(U);

[16]根据[4]至[8]中任一项所述的突变tRNA,其中M1是胞苷(C),M2是胞苷(C);

[17]根据[4]至[8]中任一项所述的突变tRNA,其中M1是胞苷(C),M2是鸟苷(G);

[18]根据[4]至[8]中任一项所述的突变tRNA,其中M1是腺苷(A),M2是尿苷(U);

[19]根据[4]至[8]中任一项所述的突变tRNA,其中M1是鸟苷(G),M2是尿苷(U);

[20]根据[4]至[8]中任一项所述的突变tRNA,其中M1是鸟苷(G),M2是胞苷(C);

[21]根据[4]至[8]中任一项所述的突变tRNA,其中M1是鸟苷(G),M2是鸟苷(G);

[22]根据[14]所述的突变tRNA,其中N2是鸟苷(G),N3是腺苷(A);

[23]根据[15]所述的突变tRNA,其中N2是腺苷(A),N3是鸟苷(G);

[24]根据[16]所述的突变tRNA,其中N2是鸟苷(G),N3是鸟苷(G);

[25]根据[17]所述的突变tRNA,其中N2是胞苷(C),N3是鸟苷(G);

[26]根据[18]所述的突变tRNA,其中N2是腺苷(A),N3是尿苷(U);

[27]根据[19]所述的突变tRNA,其中N2是腺苷(A),N3是胞苷(C);

[28]根据[20]所述的突变tRNA,其中N2是鸟苷(G),N3是胞苷(C);

[29]根据[21]所述的突变tRNA,其中N2是胞苷(C),N3是胞苷(C);

[30]根据[1]至[29]中任一项所述的突变tRNA,其中氨基酸或氨基酸类似物连接至3'末端;

[31]根据[30]所述的突变tRNA,其中所述氨基酸是天然氨基酸或非天然氨基酸;

[32]根据[31]所述的突变tRNA,其中所述天然氨基酸选自由甘氨酸(Gly)、丙氨酸(Ala)、丝氨酸(Ser)、苏氨酸(Thr)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile)、苯丙氨酸(Phe)、酪氨酸(Tyr)、色氨酸(Trp)、组氨酸(His)、谷氨酸(Glu)、天冬氨酸(Asp)、谷氨酰胺(Gln)、天冬酰胺(Asn)、半胱氨酸(Cys)、甲硫氨酸(Met)、赖氨酸(Lys)、精氨酸(Arg)和脯氨酸(Pro)组成的组中;

[33]根据[32]所述的突变tRNA,其中所述天然氨基酸选自由甘氨酸(Gly)、丙氨酸(Ala)、丝氨酸(Ser)、苏氨酸(Thr)、缬氨酸(Val)、亮氨酸(Leu)、苯丙氨酸(Phe)、酪氨酸(Tyr)、色氨酸(Trp)、组氨酸(His)、谷氨酸(Glu)、天冬氨酸(Asp)、谷氨酰胺(Gln)、天冬酰胺(Asn)、半胱氨酸(Cys)、赖氨酸(Lys)、精氨酸(Arg)和脯氨酸(Pro)组成的组中;

[34]包含多种不同tRNA的翻译系统,其中所述系统包含根据[1]至[33]中任一项所述的突变tRNA;

[35]根据[34]所述的翻译系统,其中M1M2A表示的密码子可以比与M1M2A表示的密码子不同的密码子更选择性地被所述突变tRNA翻译,并且所述突变tRNA可以比所述突变的tRNA以外的tRNA更选择性地翻译M1M2A表示的密码子;

[36]根据[34]或[35]所述的翻译系统,其包含(a)[1]至[33]中任一项所述的突变tRNA,和(b)包含与由M1M2G表示的密码子互补的反密码子的tRNA;

[37]根据[36]所述的翻译系统,其中根据[36](b)的tRNA的反密码子是CN2N3、ac4CN2N3或CmN2N3(其中ac4C代表N4-乙酰胞苷,Cm代表2’-O-甲基胞苷);

[38]根据[36]或[37]所述的翻译系统,其中M1M2G表示的密码子可以比与M1M2G代表的密码子不同的密码子更选择性地被[36](b)所述tRNA翻译,并且[36](b)所述tRNA可以比[36](b)所述tRNA以外的tRNA更选择性地翻译M1M2G表示的密码子;

[39]根据[36]至[38]中任一项所述的翻译系统,其中连接至[36](a)和[36](b)的tRNA的氨基酸或氨基酸类似物彼此不同;

[40]根据[39]所述的翻译系统,其中两个氨基酸可以从M1M2A和M1M2G密码子翻译;

[41]根据[39]所述的翻译系统,其中M1M2A和M1M2G密码子可以编码彼此不同的氨基酸或氨基酸类似物;

[42]根据[34]至[41]中任一项所述的翻译系统,还包含(c)包含与由M1M2U或M1M2C表示的密码子互补的反密码子的tRNA;

[43]根据[42]所述的翻译系统,其中[42](c)的tRNA的反密码子选自由AN2N3、GN2N3、QN2N3和GluQN2N3组成的组中(其中Q代表辫苷(queuosine),GluQ代表谷氨酰-辫苷);

[44]根据[42]或[43]所述的翻译系统,其中M1M2U或M1M2C表示的密码子可以比与M1M2U或M1M2C表示的密码子不同的密码子更选择性地被[42](c)所述tRNA翻译,并且[42](c)所述tRNA可以比[42](c)所述tRNA以外的tRNA更选择性地翻译M1M2U或M1M2C代表的密码子;

[45]根据[42]至[44]中任一项所述的翻译系统,其中连接至[36](a)、[36](b)和[42](c)的tRNA的氨基酸或氨基酸类似物彼此不同;

[46]根据[45]所述的翻译系统,其中三个氨基酸可以从由M1M2U、M1M2C、M1M2A和M1M2G组成的密码子盒翻译;

[47]根据[45]所述的翻译系统,其中在由M1M2U、M1M2C、M1M2A和M1M2G组成的密码子盒中;

(i)M1M2A、M1M2G和M1M2U可以编码彼此不同的氨基酸或氨基酸类似物,或

(ii)M1M2A、M1M2G和M1M2C可以编码彼此不同的氨基酸或氨基酸类似物;

[48]根据[45]至[47]中任一项所述的翻译系统,其中非天然氨基酸连接至[36](a)、[36](b)和[42](c)的tRNA中的至少一个;

[49]根据[34]至[48]中任一项所述的翻译系统,其可翻译超过20种氨基酸;

[50]根据[34]至[49]中任一项所述的翻译系统,其是无细胞翻译系统;

[51]根据[50]所述的翻译系统,其是重建的无细胞翻译系统;

[52]根据[50]或[51]所述的翻译系统,其包含源自大肠杆菌的核糖体;

[53]生产肽的方法,其包括使用根据[34]至[52]中任一项所述的翻译系统翻译核酸;

[54]根据[53]所述的方法,其中所述肽具有环状部分;

[55]肽,其通过根据[53]或[54]所述的方法生产;

[56]生产肽文库的方法,其包括使用根据[34]至[52]中任一项所述的翻译系统翻译核酸文库;

[57]肽文库,其通过根据[56]所述的方法生产;

[58]鉴定对靶分子具有结合活性的肽的方法,其包括使靶分子与根据[57]所述的肽文库接触;

[59]包含肽和编码所述肽的核酸的核酸-肽复合物,其中编码所述肽的核酸包含以下(A)或(B)的三个密码子:

(A)M1M2U,M1M2A和M1M2G;

(A)M1M2C,M1M2A和M1M2G;

并且其中对应于三个密码子的氨基酸在肽上都不同。

[60]包含根据[59]所述的核酸-肽复合物的文库;

[61]下列化合物或其盐:

[62]生产根据tRNA编号规则在第34位具有赖胞苷的突变tRNA的方法,其包括通过酶促反应连接根据[61]所述的化合物和构成tRNA的核酸片段;

[63]生产根据tRNA编号规则在34位具有赖胞苷并且具有连接到3'末端的氨基酸或氨基酸类似物的突变tRNA的方法,其包括通过酶促反应连接根据[61]所述的化合物、构成tRNA的一种或多种核酸片段和氨基酸或氨基酸类似物;

[64]下列化合物或其盐:

[65]生产根据tRNA编号规则在第34位具有胍丁胞苷(agmatidine)的突变tRNA的方法,其包括通过酶促反应连接根据[64]所述的化合物和构成tRNA的核酸片段;

[66]生产根据tRNA编号规则在34位具有胍丁胞苷(agmatidine)并且具有连接到3'末端的氨基酸或氨基酸类似物的突变tRNA的方法,其包括通过酶促反应连接根据[64]所述的化合物、构成tRNA的一种或多种核酸片段和氨基酸或氨基酸类似物;

[67]根据[63]或[66]所述的方法,其中所述氨基酸是甲硫氨酸(Met)和异亮氨酸(Ile)以外的氨基酸;

[68]突变tRNA,其通过根据[62]或[65]所述的方法生产;

[69]具有连接到3'末端的氨基酸或氨基酸类似物的突变tRNA,其通过根据[63]、[66]或[67]所述的方法生产;

[70]包含根据[68]和/或[69]所述的突变tRNA的翻译系统;

[71]生产肽的方法,其包括使用根据[70]所述的翻译系统翻译核酸;

[72]生产由下式A表示的赖胞苷二磷酸或其衍生物,或胍丁胞苷(agmatidine)二磷酸或其衍生物的方法,

(其中:

R1和R2各自独立地为H或C1-C3烷基,

L是C2-C6直链亚烷基或C2-C6直链亚烯基,任选被一个或多个选自由羟基和C1-C3烷基组成的组的取代基取代,其中C2-C6直链亚烷基的碳原子任选地被一个氧原子或硫原子取代,

M是单键

其中波浪线表示与碳原子的连接点,*表示与氢原子的连接点,**表示与氮原子的连接点,前提是当M是单键,连接到M的H不存在时),

所述方法包括以下步骤:

分子内环化由下式B1表示的化合物:

(其中PG11为氨基的保护基)

以获得由下式C1表示的化合物:

(其中PG11同上);

引入由下式D1表示的胺:

(其中,R1、R2、L、M同上)

或由式C1表示的化合物的盐,以获得由下式E1表示的化合物:

(其中,R1、R2、L、M、PG11同上);

将PG12和/或PG13引入式E1表示的化合物,以获得下式F1A或F1B表示的化合物:

(其中:

R2是C1-C3烷基,

PG12是氨基的保护基团,

PG13是羧基或亚氨基的保护基团,和

R1、L、M和PG11同上,

前提是当M是单键时,不存在PG13时);

将式F1A或F1B表示的化合物中的丙酮化合物除去,引入PG14和PG15,得到下式G1A或G1B表示的化合物:

(其中:

R2是C1-C3烷基,

PG14是羟基的保护基团,

PG15是羟基的保护基团,和

R1、L、M、PG11、PG12、PG13同上);

将PG16引入式G1A或G1B表示的化合物中,得到下式H1A或H1B表示的化合物:

(其中:

R2是C1-C3烷基,

PG16是羟基和/或氨基的保护基团,和

R1、L、M、PG11、PG12、PG13、PG14、PG15同上);

从式H1A或H1B表示的化合物中去除PG14和PG15,得到式I1A或I1B表示的化合物:

(其中:

R2是C1-C3烷基,和

R1、L、M、PG11、PG12、PG13、PG16同上);

将式I1A或I1B表示的化合物亚磷酸酯化,然后氧化,得到下式J1A或J1B表示的化合物:

(其中:

R2是C1-C3烷基,

PG17是羟基的保护基团,和

R1、L、M、PG11、PG12、PG13和PG16同上);

从式J1A表示的化合物中去除PG11、PG12、PG13和PG17,或从式J1B表示的化合物中去除PG11、PG13和PG17,得到下式K1表示的化合物:

(其中:

R2是H或C1-C3烷基,并且

R1、R2、L、M和PG16同上);和

从式K1所表示的化合物中去除PG16,得到式A所表示的化合物;

[73]根据[72]所述的方法,其中式A表示的化合物是赖胞苷二磷酸:

,或胍丁胞苷(agmatidine)二磷酸:

[74]根据[72]所述的方法,其中PG11是对溴苯甲酰基,任选地取代的苯甲酰基、吡啶羰基或乙酰基;

[75]根据[72]所述的方法,其中PG12是Fmoc;

[76]根据[72]所述的方法,其中当M是

PG13是甲基、乙基或任选取代的苄基,并且当M是

PG13是任选取代的苄基、Cbz或任选取代的苄氧羰基;

[77]根据[72]所述的方法,其中PG14和PG15一起形成二叔丁基甲硅烷基;

[78]根据[72]所述的方法,其中PG16是TOM;

[79]根据[72]所述的方法,其中PG17是氰乙基;

[80]根据[72]所述的方法,其中在偶氮二甲酸二异丙酯和三苯基膦存在下进行分子内环化;

[81]根据[72]所述的方法,其中式D1表示的胺或其盐的引入在氯化锂和DBU的存在下进行;

[82]根据[72]所述的方法,其中PG12为Fmoc,用于引入PG12的试剂为(2,5-二氧代吡咯烷-1-基)(9H-芴-9-基)甲基碳酸酯和碳酸钠;

[83]根据[72]所述的方法,其中PG13是甲基,用于引入PG13的试剂是N,N’-二异丙基碳二亚胺、甲醇和N,N-二甲基-4-氨基吡啶;

[84]根据[72]所述的方法,其中用于去除丙酮化合物的试剂是TFA;

[85]根据[72]所述的方法,其中PG14和PG15一起形成二叔丁基甲硅烷基,用于引入二叔丁基甲硅烷基的试剂是二叔丁基甲硅烷基双(三氟甲磺酸酯);

[86]根据[72]所述的方法,其中PG16为TOM,用于引入PG16的试剂是DIPEA和(三异丙基甲硅烷氧基)甲基氯;

[87]根据[72]所述的方法,其中用于去除PG14和PG15的试剂是氟化氢吡啶络合物;

[88]根据[72]所述的方法,其中用于亚磷酸酯化的试剂是双(2-氰乙基)-N,N-二异丙基氨基亚磷酰胺;

[89]根据[72]所述的方法,其中用于氧化的试剂是叔丁基过氧化氢;

[90]根据[72]所述的方法,其中用于去除PG11、PG12、PG13和PG17的试剂是双-(三甲基甲硅烷基)乙酰胺和DBU;

[91]根据[72]所述的方法,其中用于去除PG16的试剂是氟化铵;

[92]根据[72]所述的方法,其中R1是H;

[93]根据[72]所述的方法,其中R2是H;

[94]根据[72]所述的方法,其中C2-C6直链亚烷基或C2-C6直链亚烯基是C4-C5直链亚烷基或C4-C5直链亚烯基;

[95]根据[72]所述的方法,其中L是-(CH2)3-、-(CH2)4-、-(CH2)5、-(CH2)2-O-CH2-、-(CH2)2-S-CH2-、-CH2CH(OH)(CH2)2-或-CH2CH=CH-(顺式或反式);

[96]生产由下式A表示的赖胞苷二磷盐或其衍生物,或胍丁胞苷(agmatidine)二磷酸或其衍生物的方法,

(其中:

R1和R2各自独立地为H或C1-C3烷基,

L是C2-C6直链亚烷基或任选被一个或多个选自由羟基和C1-C3烷基组成的组的取代基取代的C2-C6直链亚烯基,其中C2-C6直链亚烷基的碳原子被一个氧原子或硫原子取代,

M是单键,

其中波浪线表示与碳原子的连接点,*表示与氢原子的连接点,**表示与氮原子的连接点,前提是当M是单键时,连接到M的H不存在),

所述方法包括以下步骤:

分子内环化由下式B2表示的化合物:

(其中PG21为氨基的保护基团)

以获得由下式C2表示的化合物:

(其中PG21同上);

引入由下式D2A或D2B表示的胺:

(其中:

R2是C1-C3烷基,

PG22是氨基的保护基团,

PG23是羧基或亚氨基的保护基团,和

R1、L和M同上,

前提是当M是单键时,不存在PG13);

或由式C2表示的化合物的盐,以获得由下式E2A或E2B表示的化合物:

(其中:

R2是C1-C3烷基,和

R1、L、M、PG21、PG22和PG23同上);

从式E2A或E2B表示的化合物中去除丙酮化合物,引入PG24和PG25,得到下式F2A或F2B表示的化合物:

(其中:

R2是C1-C3烷基,

PG24是羟基的保护基团,

PG25是羟基的保护基团,和

R1、R2、L、M、PG21、PG22和PG23同上);

将PG26引入式F2A或F2B表示的化合物中,得到下式G2A或G2B表示的化合物:

(其中:

R2是C1-C3烷基,

PG26是羟基的保护基团,和

R1、R2、L、M、PG21、PG22、PG23、PG24和PG25同上);

从式G2A或G2B表示的化合物中去除PG24和PG25,得到式H2A或H2B表示的化合物:

(其中:

R2是C1-C3烷基,和

R1、L、M、PG21、PG22、PG23和PG26同上);

将式H2A或H2B表示的化合物亚磷酸酯化,然后氧化,得到下式I2A或I2B表示的化合物:

(其中:

R2是C1-C3烷基,

PG27是羟基的保护基团,和

R1、L、M、PG21、PG22、PG23和PG26同上);

从式I2A表示的化合物中去除PG21、PG22、PG23和PG27,或从式I2B表示的化合物中去除PG21、PG23和PG27,得到下式J2表示的化合物:

(其中:

R2是H或C1-C3烷基,并且

R1、L、M和PG26同上);和

从式J2所表示的化合物中去除PG26,得到式A所表示的化合物;

[97]根据[96]所述的方法,其中式A表示的化合物是赖胞苷二磷酸:

,或

或胍丁胞苷(agmatidine)二磷酸:

[98]根据[96]所述的方法,其中PG21是Cbz,任选地取代的苄氧羰基或任选地取代的苄基;

[99]根据[96]所述的方法,其中PG22是Cbz,任选地取代的苄氧羰基或任选地取代的苄基;

[100]根据[96]所述的方法,其中当M是

PG23是任选地取代的苄基,且当M是

PG23是任选地取代的苄基、Cbz或任选地取代的苄氧羰基;

[101]根据[96]所述的方法,其中PG24和PG25一起形成二叔丁基甲硅烷基;

[102]根据[96]所述的方法,其中PG26是四氢吡喃基、四氢呋喃基或甲氧基甲基;

[103]根据[96]所述的方法,其中PG27是苄基;

[104]根据[96]所述的方法,其中在偶氮二甲酸二异丙酯和三苯基膦存在下进行分子内环化;

[105]根据[96]所述的方法,其中式D2表示的胺或其盐的引入在氯化锂和DBU的存在下进行;

[106]根据[96]所述的方法,其中用于去除丙酮化合物的试剂是TFA;

[107]根据[96]所述的方法,其中PG24和PG25一起形成二叔丁基甲硅烷基,用于引入二叔丁基甲硅烷基的试剂是二叔丁基甲硅烷基双(三氟甲磺酸酯);

[108]根据[96]所述的方法,其中PG26是四氢吡喃基,用于引入PG26的试剂是TFA和3,4-二氢-2H-吡喃;

[109]根据[96]所述的方法,其中用于去除PG24和PG25的试剂是四丁基氟化铵;

[110]根据[96]所述的方法,其中用于亚磷酸酯化的试剂是二苄基N,N-二异丙基亚磷酰胺;

[111]根据[96]所述的方法,其中用于氧化的试剂是Dess-Martin periodinane;

[112]根据[96]所述的方法,其中通过催化氢化除去PG21、PG22、PG23和PG27

[113]根据[96]所述的方法,其中用于除去PG26的试剂是盐酸;

[114]根据[96]所述的方法,其中R1是H;

[115]根据[96]所述的方法,其中R2是H;

[116]根据[96]所述的方法,其中C2-C6直链亚烷基或C2-C6直链亚烯基是C4-C5直链亚烷基或C4-C5直链亚烯基;和

[117]根据[96]所述的方法,其中L是-(CH2)3-、-(CH2)4-、-(CH2)5、-(CH2)2-O-CH2-、-(CH2)2-S-CH2-、-CH2CH(OH)(CH2)2-或-CH2CH=CH-(顺式或反式)。

附图说明

图1示出了如实施例10中所述的通过使用连接反应制备的tRNA(Glu)uga-CA(UR-1)的RNase片段化形成的产物的质谱图。上图示出了具有CCCUUGp序列的片段的结果,下图示出了具有CCCUGp序列的片段的结果。

图2示出了如实施例10中所述通过使用连接反应制备的tRNA(Glu)Lga-CA(LR-1)的RNase片段化形成的产物的质谱图。上图示出了具有CCCULGp序列的片段的结果,中间图示出了具有CCCUGp序列的片段的结果,下图示出了具有CCCUUGp序列的片段的结果。

图3示出了如实施例10中所述通过使用连接反应制备的tRNA(Glu)Lag-CA(LR-2)的RNase片段化形成的产物的质谱图。上图示出了具有CCCULAGp序列的片段的结果,中间图示出了具有CCCUAGp序列的片段的结果,下图示出了具有CCCUUAGp序列的片段的结果。

图4示出了如实施例10中所述通过使用连接反应制备的tRNA(Glu)Lac-CA(LR-3)的RNase片段化形成的产物的质谱图。上图示出了具有CCCULACACGp(SEQ ID NO:197)序列的片段的结果,中间图示出了具有CCCUACACGp序列的片段的结果,下图示出了具有CCCUUACACGp(SEQ ID NO:198)序列的片段的结果。

图5示出了如实施例10中所述通过使用连接反应制备的tRNA(Glu)Lcc-CA(LR-4)的RNase片段化形成的产物的质谱图。上图示出了具有CCCULCCACGp(SEQ ID NO:199)序列的片段的结果,中间图示出了具有CCCUCCACGp序列的片段的结果,下图示出了具有CCCUUCCACGp(SEQ ID NO:200)序列的片段的结果。

图6示出了如实施例10中所述通过使用连接反应制备的tRNA(Asp)Lag-CA(LR-5)的质谱图。上图示出了具有序列pGGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUULAGGUGCAGGGGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC(SEQ ID NO:134)(目标物质)的核酸的结果,中间图示出了具有序列pGGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUUAGGUGCAGGGGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC(SEQ ID NO:201)(当未连接pLp时形成的副产物)的核酸的结果,下图示出了具有序列pGGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUUUAGGUGCAG GGGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC(SEQ ID NO:154)(当pUp而不是pLp连接时形成的副产物)的核酸的结果。

图7示出了如实施例10中所述通过使用连接反应制备的tRNA(AsnE2)Lag-CA(LR-6)的RNase片段化形成的产物的质谱图。上图示出了具有AUULAGp序列的片段的结果,中间图示出了具有AUUAGp序列的片段的结果,下图示出了具有AUUUAGp序列的片段的结果。

图8示出了如实施例10中所述通过使用连接反应制备的tRNA(Glu)Lcg-CA(LR-7)的RNase片段化形成的产物的质谱图。上图示出了具有CCCULCGp序列的片段的结果,中间图示出了具有CCCUCGp序列的片段的结果,下图示出了具有CCCUUCGp序列的片段的结果。

图9示出了如实施例10中所述通过使用连接反应制备的tRNA(Glu)Lau-CA(LR-8)的RNase片段化形成的产物的质谱图。上图示出了具有CCCULAUACGp(SEQ ID NO:202)序列的片段的结果,中间图示出了具有CCCUAUACGp序列的片段的结果,下图示出了具有CCCUUAUACGp(SEQ ID NO:203)序列的片段的结果。

图10示出了如实施例10中所述通过使用连接反应制备的tRNA(Agm)ag-CA(AR-1)的RNase片段化形成的产物的质谱图。上图示出了具有CCCU(Agm)AGp序列的片段的结果,中间图示出了具有CCCUAGp序列的片段的结果,下图示出了具有CCCUUAGp序列的片段的结果。

图11是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的图。评估的密码子是UCU、UCA和UCG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽的量(对于具体测量值,参见表12)。

(图的左侧)

tRNA:化合物AAtR-1(反密码子:aga;氨基酸:dA)

化合物AAtR-2(反密码子:uga;氨基酸:SPh2Cl)

化合物AAtR-5(反密码子:cga;氨基酸:nBuG)

mRNA:mR-1(包含UCU密码子)

mR-2(包含UCA密码子)

mR-3(包含UCG密码子)

(图的中间侧)

tRNA:化合物AAtR-1(反密码子:aga;氨基酸:dA)

化合物AAtR-3(反密码子:uga;氨基酸:SPh2Cl)

化合物AAtR-5(反密码子:cga;氨基酸:nBuG)

mRNA:mR-1(包含UCU密码子)

mR-2(包含UCA密码子)

mR-3(包含UCG密码子)

(图的右侧)

tRNA:化合物AAtR-1(反密码子:aga;氨基酸:dA)

化合物AAtR-4(反密码子:Lga;氨基酸:SPh2Cl)

化合物AAtR-5(反密码子:cga;氨基酸:nBuG)

mRNA:mR-1(包含UCU密码子)

mR-2(包含UCA密码子)

mR-3(包含UCG密码子)

图12是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是CUU、CUA和CUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表13)。

(图的左侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-7(反密码子:uag;氨基酸:Pic2)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

(图的右侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-8(反密码子:Lag;氨基酸:Pic2)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

图13是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的结果的影响的图。评估的密码子是GUU、GUA和GUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表14)。

(图的左侧)

tRNA:化合物AAtR-10(反密码子:aac;氨基酸:nBuG)

化合物AAtR-11(反密码子:uac;氨基酸:Pic2)

化合物AAtR-13(反密码子:cac;氨基酸:dA)

mRNA:mR-7(包含GUU密码子)

mR-8(包含GUA密码子)

mR-9(包含GUG密码子)

(图的右侧)

tRNA:化合物AAtR-10(反密码子:aac;氨基酸:nBuG)

化合物AAtR-12(反密码子:Lac;氨基酸:Pic2)

化合物AAtR-13(反密码子:cac;氨基酸:dA)

mRNA:mR-7(包含GUU密码子)

mR-8(包含GUA密码子)

mR-9(包含GUG密码子)

图14是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的。评估的密码子是GGU、GGA和GGG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表15)。

(图的左侧)

tRNA:化合物AAtR-14(反密码子:gcc;氨基酸:dA)

化合物AAtR-15(反密码子:ucc;氨基酸:Pic2)

化合物AAtR-17(反密码子:ccc;氨基酸:MeHph)

mRNA:MR-10(包含GGU密码子)

MR-11(包含GGA密码子)

MR-12(包含GGG密码子)

(图的右侧)

tRNA:化合物AAtR-14(反密码子:gcc;氨基酸:dA)

化合物AAtR-16(反密码子:Lcc;氨基酸:Pic2)

化合物AAtR-17(反密码子:ccc;氨基酸:MeHph)

mRNA:mR-10(包含GGU密码子)

mR-11(包含GGA密码子)

mR-12(包含GGG密码子)

图15是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是CUU、CUA和CUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表16)。

(图的左侧)

tRNA:化合物AAtR-19(反密码子:aag;氨基酸:nBuG)

化合物AAtR-20(反密码子:uag;氨基酸:SPh2Cl)

化合物AAtR-22(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

(图的右侧)

tRNA:化合物AAtR-19(反密码子:aag;氨基酸:nBuG)

化合物AAtR-21(反密码子:Lag;氨基酸:SPh2Cl)

化合物AAtR-22(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

图16是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是CUU、CUA和CUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表17)。

(图的左侧)

tRNA:化合物AAtR-23(反密码子:aag;氨基酸:nBuG)

化合物AAtR-24(反密码子:uag;氨基酸:SPh2Cl)

化合物AAtR-26(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

(图的右侧)

tRNA:化合物AAtR-23(反密码子:aag;氨基酸:nBuG)

化合物AAtR-25(反密码子:Lag;氨基酸:SPh2Cl)

化合物AAtR-26(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

图17是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是CUU、CUA和CUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表18)。

(图的左侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-27(反密码子:uag;氨基酸:MeHph)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

(图的右侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-28(反密码子:Lag;氨基酸:MeHph)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

图18是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是CUU、CUA和CUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表19)。

(图的左侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-29(反密码子:uag;氨基酸:F3Cl)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

(图的右侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-30(反密码子:Lag;氨基酸:F3Cl)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

图19是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是CUU、CUA和CUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表20)。

(图的左侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-31(反密码子:uag;氨基酸:SiPen)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

(图的右侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-32(反密码子:Lag;氨基酸:SiPen)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

图20是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是CGU、CGA和CGG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表21)。tRNA:化合物AAtR-33(反密码子:gcg;氨基酸:dA)

化合物AAtR-34(反密码子:Lcg;氨基酸:Pic2)

化合物AAtR-35(反密码子:ccg;氨基酸:nBuG)

mRNA:mR-13(包含CGU密码子)

mR-14(包含CGA密码子)

mR-15(包含CGG密码子)

图21是示出如实施例12至13中所述评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是AUU、AUA和AUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表22)。

tRNA:化合物AAtR-36(反密码子:aau;氨基酸:nBuG)

化合物AAtR-37(反密码子:Lau;氨基酸:Pic2)

化合物AAtR-38(反密码子:cau;氨基酸:dA)

mRNA:mR-16(包含AUU密码子)

mR-17(包含AUA密码子)

mR-18(包含AUG密码子)

图22是示出如实施例12至13中所述评估存在或不存在胍丁胞苷(agmatidine)修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的图。评估的密码子是CUU、CUA和CUG。图的垂直轴示出使用下面描述的tRNA和mRNA的每个组合进行翻译时翻译的肽量(对于具体测量值,参见表23)。

(图的左侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-39(反密码子:uag;氨基酸:SPh2Cl)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

(图的右侧)

tRNA:化合物AAtR-6(反密码子:aag;氨基酸:nBuG)

化合物AAtR-40(反密码子:(Agm)ag;氨基酸:SPh2Cl)

化合物AAtR-9(反密码子:cag;氨基酸:dA)

mRNA:mR-4(包含CUU密码子)

mR-5(包含CUA密码子)

mR-6(包含CUG密码子)

具体实施方式

I.定义

为了解释本说明书的目的,将应用以下定义,并且只要适用,以单数形式使用的术语也将包括复数,反之亦然。应当理解,本文使用的术语仅用于描述特定实施方案的目的,而不是限制性的。如果以下任何定义与通过引用纳入本文的任何文件冲突,则以以下定义为准。

“密码子”是指当活体中的遗传信息被翻译成蛋白质时,对应于每个氨基酸的一组三个核苷(三联体)。对于DNA,使用四种碱基,腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。对于mRNA,使用四种碱基,腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。示出每个密码子与氨基酸对应关系的表格称为遗传密码表或密码子表,将20种氨基酸分配给61个密码子,不包括终止密码子(表1)。表1所示的遗传密码表几乎适用于所有真核生物和原核生物(真细菌和古细菌);因此,它被称为标准遗传密码表或通用遗传密码表。在本公开中,用于天然存在的生物体的遗传密码表被称为天然遗传密码表,它区别于人工重编程的遗传密码表(密码子和氨基酸之间的对应关系被改造)。在遗传密码表中,通常将第一个和第二个字母相同而仅第三个字母不同的四个密码子分组到一个盒内,该组称为密码子盒。

[表1]

在本公开中,mRNA中的密码子可以表示为“M1M2M3”。本文中,M1、M2和M3分别代表密码子第一个字母、第二个字母和第三个字母的核苷。

“反密码子”是指tRNA上三个连续的核苷,对应于mRNA上的密码子。与mRNA类似,反密码子使用四种碱基,腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。此外,可以使用通过修饰这些碱基获得的修饰碱基。当密码子被反密码子特异性识别时,mRNA上的遗传信息被读取并翻译成蛋白质。mRNA上5’到3’方向的密码子序列与tRNA上5’到3’方向的反密码子序列互补结合;因此,在密码子的第一个、第二个和第三个字母的核苷与反密码子的第三个、第二个和第一个字母的核苷之间分别形成互补的核苷酸对。

在本公开中,tRNA中的反密码子可以用“N1N2N3”表示。其中,N1、N2和N3分别代表反密码子第一个字母、第二个字母和第三个字母的核苷。根据下面描述的tRNA编号规则,N1、N2和N3分别编号为tRNA的第34、35和36位。

在本公开中,能够形成热力学稳定碱基对的核酸的组合被称为彼此“互补”。除了沃森-克里克碱基对,如腺苷和尿苷(A-U)以及鸟苷和胞苷(G-C),形成非沃森-克里克碱基对的核酸组合,如鸟苷和尿苷(G-U)、肌苷和尿苷(I-U))、肌苷和腺苷(I-A)以及肌苷和胞苷(I-C)也可以包括在本公开的“互补”核酸组合中。特别是,密码子的第一个字母和反密码子的第三个字母之间,以及密码子的第二个字母和反密码子的第二个字母之间,只允许形成沃森-克里克碱基对,而密码子的第三个字母和反密码子的第一个字母之间的空间有一些波动(摆动);因此,可以允许形成非沃森-克里克碱基对,例如上述那些(摆动假说)。

“信使RNA(mRNA)”是指携带可翻译成蛋白质的遗传信息的RNA。遗传信息以密码子的形式在mRNA上编码,这些密码子中的每一个都对应于所有20种不同氨基酸中的一种。蛋白质翻译从起始密码子开始,到终止密码子结束。原则上,真核生物中的起始密码子是AUG,但在原核生物(真细菌和古细菌)中,除了AUG外,GUG和UUG也可以用作起始密码子。AUG是编码甲硫氨酸(Met)的密码子,在真核生物和古细菌中,直接从甲硫氨酸开始翻译。另一方面,在真细菌中,只有起始密码子AUG对应于N-甲酰甲硫氨酸(fMet);因此,翻译是从甲酰甲硫氨酸开始的。终止密码子共有三个:UAA(赭色)、UAG(琥珀色)和UGA(乳白色)。当终止密码子被称为翻译终止因子(释放因子(RF))的蛋白质识别时,合成到该点的肽链与tRNA解离,翻译过程结束。

“转移RNA(tRNA)”是指以mRNA为模板介导肽合成的100个或更少碱基的短RNA。在二级结构方面,它具有由三个茎环(D臂、反密码子臂和T臂)和一个茎(受体茎)组成的三叶草状结构。根据tRNA,可能会包含额外的可变环。反密码子臂具有由三个连续核苷组成的区域,称为反密码子,当反密码子与mRNA上的密码子形成碱基对时,密码子就被识别出来。同时,在tRNA的3'末端存在由胞苷-胞苷-腺苷组成的核酸序列(CCA序列),氨基酸添加到末端的腺苷残基(具体为腺苷残基的核糖的2位或3位羟基与氨基酸的羧基形成酯键)上。添加了氨基酸的tRNA称为氨酰tRNA。在本公开中,氨酰tRNA也包括在tRNA的定义中。此外,如后面所述,已知从tRNA的CCA序列中去除2个末端残基(C和A),然后将其用于氨酰基-tRNA的合成的方法。这样的3’端CA序列已被去除的tRNA也包括在本公开中tRNA的定义中。在体内通过称为氨酰-tRNA合成酶(aaRS或ARS)的酶向tRNA添加氨基酸。通常,每个氨基酸具有一个氨酰-tRNA合成酶,每个氨酰-tRNA合成酶仅特异性识别一种特定的tRNA作为多种tRNA的底物;因此,tRNA和氨基酸之间的对应关系受到严格控制。

tRNA中的每个核苷都根据tRNA编号规则进行编号(Sprinzl et al.,NucleicAcids Res(1998)26:148-153)。例如,反密码子编号为34至36位,CCA序列编号为74至76位。

“起始子tRNA”是在mRNA翻译开始时使用的特定tRNA。连接至起始子氨基酸上的起始子tRNA由翻译起始因子(IF)催化,引入核糖体,并与mRNA上的起始密码子结合,从而启动翻译。由于作为甲硫氨酸密码子的AUG通常用作起始密码子,因此起始子tRNA具有对应于AUG的反密码子,并具有连接至起始氨基酸的甲硫氨酸(原核生物的甲酰甲硫氨酸)作为起始子氨基酸。起始子tRNA的实例包括tRNA fMet(SEQ ID NO:10和11)。

“延长子tRNA”是翻译过程中用于肽链延伸反应的tRNA。在肽合成中,氨基酸连接的延长子tRNA被GTP结合的翻译延伸因子(EF)EF-Tu/eEF-1依次转运到核糖体,这促进了肽链的延伸反应。延长子tRNA的实例包括对应于各种氨基酸的tRNA(SEQ ID NO:1至9和12至50)。

“赖胞苷”是一种修饰的核苷,也称为2-赖氨酰胞苷(k2C或L)。赖胞苷用作与真细菌中的异亮氨酸(tRNA Ile2)对应的tRNA中反密码子的第一个字母核苷。tRNA Ile 2以携带反密码子CAU的前体状态合成,然后反密码子第一个字母的胞苷(C)被称为tRNA Ile-赖胞苷合成酶(TilS)的酶改造(转化)为赖胞苷(k2C)。结果,提供了携带反密码子k2CAU的tRNA Ile2(Muramatsu et al.,J Biol Chem(1988)263:9261-9267;和Suzuki et al.,FEBS Lett(2010)584:272-277)。已知反密码子k2CAU仅特异性识别异亮氨酸的AUA密码子。此外,据信异亮氨酰-tRNA合成酶将tRNA Ile2识别为底物,并且仅当反密码子被改造为k2CAU时才会发生tRNA Ile2的氨酰化(向其添加异亮氨酸)。大肠杆菌TilS的氨基酸序列见SEQ ID NO:51。

“胍丁胞苷(agmatidine)”是一种修饰的核苷,也称为2-胍丁酰胞苷(2-agmatinylcytidine)(agm2C或Agm)。胍丁胞苷(agmatidine)用作古细菌中对应于异亮氨酸(tRNA Ile2)的tRNA中反密码子的第一个字母核苷。tRNA Ile2以携带反密码子CAU的前体状态合成,然后反密码子第一个字母的胞苷(C)被称为tRNAIle-胍丁胞苷(agmatidine)合成酶(TiaS)的酶改造(转化)为胍丁胞苷(agmatidine)(agm2C)。结果,提供了携带反密码子agm2CAU的tRNAIle2(Ikeuchi et al.,Nat Chem Biol(2010)6(4):277-282)。已知反密码子agm2CAU仅特异性识别异亮氨酸的AUA密码子。此外,据信异亮氨酰-tRNA合成酶将tRNAIle2识别为底物,并且仅当反密码子被改造为agm2CAU时才会发生tRNAIle2的氨酰化(向其添加异亮氨酸)。古细菌乙酸甲烷八叠球菌(Methanosarcina acetivorans)的TiaS的氨基酸序列示出为SEQ ID NO:52。

<取代基等的定义>

在本公开中,“烷基”是指脂肪族烃除去一个任意的氢原子而衍生的单价基团;其骨架中不含杂原子或不饱和碳-碳键;并且它具有包含氢和碳原子的烃基或烃基团结构的子集。碳链长度n的范围在1到20之间。烷基的实例包括C2-C10烷基、C1-C6烷基和C1-C3烷基,具体实例包括甲基、乙基、丙基、丁基、戊基、己基、异丙基、叔丁基、仲丁基、1-甲基丙基、1,1-二甲基丙基、2,2-二甲基丙基、1,2-二甲基丙基、1,1,2-三甲基丙基、1,2,2-三甲基丙基、1,1,2,2-四甲基丙基、1-甲基丁基、2-甲基丁基、3-甲基丁基、1,1-二甲基丁基、1,2-二甲基丁基、1,3-二甲基丁基、2,2-二甲基丁基、2,3-二甲基丁基、3,3-二甲基丁基、1-乙基丁基、2-乙基丁基、异戊基和新戊基。

在本公开中,“环烷基”是指饱和或部分饱和的环状单价脂肪族烃基,包括单环、双环和螺环。环烷基的实例包括C3-C10环烷基,具体实例包括环丙基、环丁基、环戊基、环己基、环庚基、环辛基和双环[2.2.1]庚基。

在本公开中,“烯基”是具有至少一个双键(两个相邻的SP2碳原子)的单价基团。根据双键和取代基(如果存在)的排列,双键的几何构型可以是反式(entgegen)(E)或顺式(zusammen)(Z),以及顺式或反式构型。它可以是直链或支链烯基,包括含有内烯烃的直链烯基。烯基的实例包括C2-C10烯基和C2-C6烯基,具体实例包括乙烯基、烯丙基、1-丙烯基、2-丙烯基、1-丁烯基、2-丁烯基(包括顺式和反式)、3-丁烯基、戊烯基,和己烯基。

在本公开中,“炔基”是具有至少一个三键(两个相邻的SP碳原子)的单价基团。它可以是直链或支链炔基,并包括内亚烷基。炔基的实例包括C2-C10炔基和C2-C6炔基,具体实例包括乙炔基、1-丙炔基、炔丙基、3-丁炔基、戊炔基、己炔基、3-苯基-2-丙炔基、3-(2'-氟苯基))-2-丙炔基、2-羟基-2-丙炔基、3-(3-氟苯基)-2-丙炔基和3-甲基-(5-苯基)-4-戊炔基。

在本公开中,“芳基”是指单价芳烃环。芳基的实例包括C6-C10芳基,具体实例包括苯基和萘基(例如1-萘基和2-萘基)。

在本公开中,“杂芳基”是指在构成环的原子中含有杂原子的单价芳环基团,并且可以部分饱和。该环可以是单环或稠合的双环(例如与苯或单环杂芳基稠合形成的双环杂芳基)。构成环的原子数例如为5至10(5至10元杂芳基)。构成环的原子中所含的杂原子数例如为1至5。杂芳基的具体实例包括呋喃基、噻吩基、吡咯基、咪唑基、吡唑基、噻唑基、异噻唑基、噁唑基、异噁唑基、噁二唑基、噻二唑基、三唑基、四唑基、吡啶基、嘧啶基、哒嗪基、吡嗪基、三嗪基、苯并呋喃基、苯并噻吩基、苯并噻二唑基、苯并噻唑基、苯并噁唑基、苯并噁二唑基、苯并咪唑基、吲哚基、异吲哚基、吲唑基、喹啉基、异喹啉基、肉桂基、喹唑啉基、喹喔啉基、苯并二氧戊环、吲嗪基和咪唑并吡啶基。

在本公开中,“芳基烷基(芳烷基)”是包含芳基和烷基的基团,并且例如是指其中上述烷基的至少一个氢原子被芳基取代的基团。芳烷基的实例包括C5-C10芳基C1-C6烷基,具体实例包括苄基。

在本公开中,“亚烷基”是指通过进一步从上述“烷基”去除一个任意氢原子而衍生的二价基团,并且可以是线性的或支链的。直链亚烷基的实例包括C2-C6直链亚烷基、C4-C5直链亚烷基等。具体实例包括-CH2-、-(CH2)2-、-(CH2)3-、-(CH2)4-、-(CH2)5-和-(CH2)6-。支链亚烷基的实例包括C2-C6支链亚烷基和C4-C5支链亚烷基。具体实例包括-CH(CH3)CH2-、-C(CH3)2-、-CH(CH3)CH2CH2-、-C(CH3)2CH2-、-CH2CH(CH3)CH2-、CH2C(CH3)2-、和-CH2CH2CH(CH3)-。

在本公开中,“亚烯基”是指通过进一步从上述“烯基”中去除一个任意氢原子而衍生的二价基团,并且可以是线性或支链的。根据双键和取代基(如果存在)的排列,它可以采用反式(entgegen)(E)或顺式(zusammen)(Z)的形式,以及顺式或反式构型。直链亚烯基的实例包括C2-C6直链亚烯基和C4-C5直链亚烯基。具体实例包括-CH=CH-、-CH=CHCH2-、-CH2CH=CH-、-CH=CHCH2CH2-、-CH2CH=CHCH2-、-CH2CH2CH=CH-、-CH=CHCH2CH2CH2-、-CH2CH=CHCH2CH2-、-CH2CH2CH=CHCH2-和-CH2CH2CH2CH=CH-。

在本公开中,“亚芳基”是指通过从上述芳基进一步去除一个任意氢原子而衍生的二价基团。该环可以是单环或稠环。构成环的原子数没有特别限制,例如为6至10个(C6-C10亚芳基)。亚芳基的具体实例包括亚苯基和亚萘基。

在本公开中,“杂亚芳基”是指通过从上述杂芳基进一步去除一个任意氢原子而衍生的二价基团。该环可以是单环或稠环。构成环的原子数没有特别限制,但是例如为5至10(5至10元杂亚芳基)。作为杂亚芳基,具体实例包括吡咯二基、咪唑二基、吡唑二基、吡啶二基、哒嗪二基、嘧啶二基、吡嗪二基、三唑二基、三嗪二基、异噁唑二基、噁唑二基、噁二唑二基、异噻唑二基、噻唑二基、噻二唑二基、呋喃二基和噻吩二基。

本公开中的“翻译系统”定义为包括翻译肽的方法和翻译肽的试剂盒两者的概念。翻译系统通常包含作为构成成分的核糖体、翻译因子、tRNA、氨基酸、氨酰-tRNA合成酶(aaRS)和肽翻译反应所需的因子,例如ATP和GTP。翻译系统的主要类型包括利用活细胞的翻译系统和利用细胞提取溶液的翻译系统(无细胞翻译系统)。作为利用活细胞的翻译系统,已知的实例是通过显微注射法或脂质转染法将所需的氨酰-tRNA和mRNA导入非洲爪蟾卵母细胞和哺乳动物细胞等活细胞中以进行肽翻译的系统(Nowak et al.,Science(1995)268:439-442)。无细胞翻译系统的已知实例包括利用来自大肠杆菌(Chen et al.,MethodsEnzymol(1983)101:674-690)、酵母(Gasior et al.,J Biol Chem(1979)254:3965-3969)、小麦胚芽(Erickson et al.,Methods Enzymol(1983)96:38-50)、兔网织红细胞(Jacksonet al.,Methods Enzymol(1983)96:50-74)、HeLa细胞(Barton et al.,Methods Enzymol(1996)275:35-57),或昆虫细胞(Swerdel et al.,Comp Biochem Physiol B(1989)93:803-806)等的提取溶液的翻译系统。可以通过本领域技术人员已知的方法或类似方法适当地制备这样的翻译系统。无细胞翻译系统还包括通过分离和纯化肽翻译和重构所需的每种因子而构建的翻译系统(重建的无细胞翻译系统)(Shimizu et al.,Nat Biotech(2001)19:751-755)。重建的无细胞翻译系统可通常包括核糖体、氨基酸、tRNA、氨酰-tRNA合成酶(aaRS)、翻译起始因子(例如,IF1、IF2和IF3)、翻译延伸因子(例如,EF-Tu、EF-Ts和EF-G)、翻译终止因子(例如RF1、RF2和RF3)、核糖体循环因子(RRF)、作为能源、能量再生系统以及翻译所需的其他因子的NTP。当还进行从DNA的转录反应时,可以进一步包括RNA聚合酶等。可以通过本领域技术人员公知的方法分离和纯化无细胞翻译系统中包含的各种因子,并且可以使用它们适当地构建重建的无细胞翻译系统。或者,可以使用市售的重建无细胞翻译系统,例如来自Gene Frontier的或来自New England BioLabs的对于重建的无细胞翻译系统,可以通过仅重建翻译系统组件中的必要组件来构建所需的翻译系统。

氨酰-tRNA由氨基酸、tRNA和氨酰-tRNA合成酶的特定组合合成,用于肽翻译。代替上述组合,氨酰-tRNA可以直接用作翻译系统的组成成分。特别地,当难以用氨酰-tRNA合成酶氨酰化的氨基酸如非天然氨基酸用于翻译时,需要使用预先用非天然氨基酸氨酰化的tRNA作为组成成分。

翻译是通过将mRNA添加到翻译系统开始的。mRNA通常包含编码目标肽的序列,并且可以进一步包含用于提高翻译反应效率的序列(例如,原核生物中的Shine-Dalgarno(SD)序列,或真核生物中的Kozac序列)。预转录的mRNA可以直接加入系统中,也可以代替mRNA,将含有启动子的模板DNA和适合DNA的RNA聚合酶(例如,T7启动子和T7 RNA聚合酶)添加到系统中,因此mRNA将从模板DNA转录。

II.组合物和方法

<突变tRNA>

一方面,本公开提供改造的tRNA。具体而言,本发明提供了通过改造tRNA产生的突变tRNA。待改造的tRNA可以是来源于任何生物体(例如大肠杆菌)的天然tRNA,也可以是通过人工合成不同于天然tRNA序列的序列获得的非天然tRNA。或者,它们可以是通过人工合成与天然tRNA序列相同的序列而获得的tRNA。在本公开中,任何引入tRNA的改造都是人工改造,任何通过改造产生的突变tRNA都具有自然界不存在的核酸序列。

在一些实施方案中,本公开中的tRNA改造是指将选自以下组的至少一种改造引入构成tRNA的一个或多个核苷中:(i)添加(向现有tRNA添加任何新核苷),(ii)缺失(从现有tRNA缺失任何核苷),(iii)替换(用另一个任意核苷替换现有tRNA中的任意核苷),(iv)插入(在现有tRNA中的任意两个核苷之间添加新的任意核苷),和(v)修饰(将现有tRNA中任意核苷的部分结构(例如,核苷酸或糖部分)更改为另一种结构)。可以对tRNA的任意结构(例如,D臂、反密码子臂、T臂、受体茎、可变环等)进行改造。在某些实施方案中,对包含在反密码子臂中的反密码子进行本公开中的tRNA改造。在进一步的实施方案中,对反密码子的第一个、第二个和第三个字母的核苷中的至少一个进行本公开中的tRNA改造。根据tRNA中的核苷编号规则,反密码子的第一个、第二个和第三个字母的核苷分别对应于tRNA的第34、35和36位。在本文中,反密码子的第一个、第二个和第三个字母的核苷可以分别表示为N1、N2和N3。在某些实施方案中,本公开中的tRNA改造包括对反密码子第一个字母的核苷进行改造。在本公开的tRNA中改造的核苷的数目可以是不小于1的任何数目。在一些实施方案中,在本公开的tRNA中改造的核苷的数目为20个或更少、15个或更少、10个或更少、9个或更少、8个或更少、7个或更少、6个或更少、5个或更少、4个或更少,3个或更少,2个或更少,或1个。在另一个实施方案中,改造tRNA的核酸序列与改造前的核酸序列相比具有80%或更多、85%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多、或99%或更多的序列同一性。

在具体的实施方案中,本公开中的tRNA改造是指替换构成tRNA的核苷的一个或多个。关于核苷的类型,取代核苷可以是天然tRNA中存在的任何核苷或天然tRNA中不存在的任何核苷(人工合成的核苷)。除了四种典型的核苷腺苷、鸟苷、胞苷和尿苷外,天然tRNA还包括通过修饰这四种核苷(修饰核苷)获得的改造形式。在一些实施方案中,存在于天然tRNA中的核苷可选自以下核苷:腺苷(A);胞苷(C);鸟苷(G);尿苷(U);1-甲基腺苷(m1A);2-甲基腺苷(m2A);N6-异戊烯基腺苷(i6A);2-甲硫基-N6-异戊烯基腺苷(ms2i6A);N6-甲基腺苷(m6A);N6-苏氨酰氨基甲酰腺苷(t6A);N6-甲基-N6-苏氨酰氨基甲酰腺苷(m6t6A);2-甲硫基-N6-苏氨酰氨基甲酰腺苷(ms2t6A);2'-O-甲基腺苷(Am);肌苷(I);1-甲基肌苷(m1I);2'-O-核糖基腺苷(磷酸)(Ar(p));N6-(顺式-羟基异戊烯基)腺苷(io6A);2-硫胞苷(s2C);2'-O-甲基胞苷(Cm);N4-乙酰胞苷(ac4C);5-甲基胞苷(m5C);3-甲基胞苷(m3C);赖胞苷(k2C);5-甲酰胞苷(f5C);2'-O-甲基-5-甲酰胞苷(f5Cm);胍丁胞苷(agmatidine)(agm2C);2'-O-核糖基鸟苷(磷酸)(Gr(p));1-甲基鸟苷(m1G);N2-甲基鸟苷(m2G);2'-O-甲基鸟苷(Gm);N2,N2-二甲基鸟苷(m22G);N2,N2,2'-O-三甲基鸟苷(m22Gm);7-甲基鸟苷(m7G);古嘌苷(G*);辫苷(Q);甘露糖基辫苷(manQ);半乳糖基辫苷(galQ);怀丁苷(yW);过氧怀丁苷(o2yW);5-甲基氨基甲基尿苷(mnm5U);2-硫尿苷(s2U);2'-O-甲基尿苷(Um);4-硫尿苷(s4U);5-氨基甲酰甲基尿苷(ncm5U);5-甲氧羰基甲基尿苷(mcm5U);5-甲基氨基甲基-2-硫尿苷(mnm5s2U);5-甲氧羰基甲基-2-硫尿苷(mcm5s2U);尿苷5-羟乙酸(cmo5U);5-甲氧基尿苷(mo5U);5-羧甲基氨基甲基尿苷(cmnm5U);5-羧甲基氨基甲基-2-硫尿苷(cmnm5s2U);3-(3-氨基-3-羧丙基)尿苷(acp3U);5-(羧基羟甲基)尿苷甲酯(mchm5U);5-羧甲基氨基甲基-2'-O-甲基尿苷(cmnm5Um);5-氨基甲酰基甲基-2'-O-甲基尿苷(ncm5Um);二氢尿苷(D);假尿苷(Ψ);1-甲基假尿苷(m1Ψ);2'-O-甲基假尿苷(Ψm);5-甲基尿苷(m5U);5-甲基-2-硫尿苷(m5s2U);和5,2'-O-二甲基尿苷(m5Um)。在某些实施方案中,构成本公开的tRNA的一种或多种核苷被赖胞苷或胍丁胞苷(agmatidine)替代。通过修饰上述天然tRNA中存在的核苷结构的一部分(例如,核苷酸部分)获得的核苷衍生物也可以用于取代。在某些实施方案中,构成本公开的tRNA的一种或多种核苷被赖胞苷衍生物或胍丁胞苷(agmatidine)衍生物替代。

本公开中改造的tRNA可以适当地选自具有任意核酸序列的tRNA。在一些实施方案中,tRNA是tRNA Ala、tRNA Arg、tRNA Asn、tRNA Asp、tRNA Cys、tRNA Gln、tRNA Glu、tRNAGly、tRNA His、tRNA Ile、tRNA Leu、tRNA Lys、tRNA Met、tRNAPhe、tRNA Pro、tRNA Ser、tRNA Thr、tRNA Trp、tRNA Tyr和tRNA Val中的任意一种。除了上述20种tRNA之外,还可以使用tRNA fMet、tRNA Sec(硒代半胱氨酸)、tRNA Pyl(吡咯赖氨酸)、tRNA AsnE2等。在特定的实施方案中,tRNA是tRNA Glu、tRNA Asp、tRNA AsnE2中的任意一种。对于一些tRNA,示例性核酸序列显示在SEQ ID NO:1至50中。术语“tRNA体”有时用于指tRNA的主要部分(结构的主要部分,由核酸组成)。

此外,在本公开中,tRNA可以如下表达。

-“tRNA Xxx”或“tRNA(Xxx)”......表示对应于氨基酸Xxx的tRNA(全长)(例如,tRNA Glu或tRNA(Glu))。

-“tRNA(Xxx)nnn”......表示对应于氨基酸Xxx的tRNA,是反密码子序列为nnn的tRNA(全长)(例如tRNA(Glu)uga或tRNA(Glu)Lga))。

-“tRNA(Xxx)nnn-CA”......表示氨基酸Xxx对应的tRNA,是反密码子序列为nnn(例如tRNA(Glu)uga-CA和tRNA(Glu)Lga-CA)的tRNA(3’末端的CA序列已去除)。

在某些实施方案中,本公开中的tRNA改造包括将反密码子的第一个字母的核苷(N1)替换为赖胞苷、赖胞苷衍生物、胍丁胞苷或胍丁胞苷衍生物中的任一种的改造。本文中,赖胞苷衍生物是指通过修饰赖胞苷的一部分结构(例如核苷酸部分)而产生的分子,当用作反密码子的一部分时,它具有与赖胞苷相同的密码子区分能力(形成互补碱基对的能力)。此外,胍丁胞苷衍生物是指通过修饰胍丁胞苷的一部分结构(例如核苷酸部分)而产生的分子,当用作反密码子的一部分时,它具有与胍丁胞苷相同的密码子区分能力(形成互补碱基对的能力)。

天然tRNA中的赖胞苷是通过称为tRNA Ile-赖胞苷合成酶(TilS)的酶的作用合成的。TilS具有特异性识别异亮氨酸对应的tRNA(tRNA Ile2)作为底物的活性,并将其反密码子的第一个字母(N1)处的胞苷(C)改造(转化)为赖胞苷(k2C)。本公开的tRNA中的赖胞苷可以是在有或没有TilS介导的情况下合成的赖胞苷。

在前一种情况下(当赖胞苷通过TilS合成时),本公开的tRNA可以被TilS识别为底物。也就是说,当改造前tRNA中的N1是胞苷时,可以通过TilS将胞苷改造为赖胞苷。tRNA的N1处的胞苷是否可以通过TilS改造为赖胞苷,可以通过例如通过基因重组技术制备TilS或从生物材料中提取TilS,将其与其中N1为胞苷的tRNA在适当的条件下反应,然后检测反应产物中的赖胞苷来确认(参见,例如,Suzuki et al.,FEBS Lett(2010)584:272-277)。或者,可以通过将其中N1为胞苷的tRNA引入内源性表达TilS的细胞或通过基因重组技术表达TilS的细胞中,在适当条件下使引入的tRNA与细胞内TilS反应,然后检测tRNA中含有的赖胞苷进行确认。在本公开的一个实施方案中,当改造前tRNA中的N1为胞苷时,可以通过TilS催化将胞苷改造为赖胞苷。

另一方面,在后一种情况下(当赖胞苷在没有TilS介导的情况下合成时),本公开的tRNA不能被TilS识别为底物。也就是说,即使改造前tRNA中的N1是胞苷,TilS也不能将胞苷改造为赖胞苷。在这种情况下,赖胞苷和含有赖胞苷的tRNA可以通过不使用TilS的方法(例如,化学合成方法)合成。这种合成方法的实例显示在后面描述的实施例中。在本公开的一个实施方案中,如果改造前tRNA中的N1为胞苷,则不能通过TilS催化将胞苷改造为赖胞苷。TilS不能催化胞苷改造为赖胞苷的条件可以表示为以下条件:当10μg/mLTilS与1μMtRNA在37℃,在100mM Hepes-KOH(pH 8.0)、10mM KCl、10mM MgCl2、2mM DTT、2mM ATP和100μM赖氨酸中反应2小时时,如果将天然底物tRNA Ile2的胞苷改造为赖胞苷的活性为1,则TilS改造靶tRNA的胞苷为赖胞苷的活性减少了10倍或更多、20倍或更多、40倍或更多、100倍或更多、200倍或更多、或400倍或更多。当TilS的催化活性降低时,只能得到含有大量其中N1仍为胞苷的非改造tRNA的低纯度目标产物;因此,通过不使用TilS的方法(例如,化学合成法)而不是通过使用TilS的方法合成赖胞苷可能更有利。在特定的实施方案中,TilS是来自大肠杆菌的TilS。在另一个实施方案中,TilS是来自大肠杆菌的野生型TilS,具有SEQID NO:51的氨基酸序列。

此外,据报道,即使在tRNA Ile2中的一些核苷已被改造为其他核苷之后,TilS仍保持一定量的tRNA赖胞苷合成能力(Ikeuchi et al.,Mol Cell(2005)19:235-246)。

天然tRNA中的胍丁胞苷是通过称为tRNA Ile-胍丁胞苷合成酶(TiaS)的酶的作用合成的。TiaS特异性识别异亮氨酸对应的tRNA(tRNA Ile2)作为底物,并具有将其反密码子第一个字母(N1)中的胞苷(C)改造(转化)为胍丁胞苷(agm2C)的活性。本公开的tRNA中的胍丁胞苷可以是在有或没有TiaS介导的情况下合成的胍丁胞苷。

在前一种情况下(当胍丁胞苷通过TiaS合成时),本公开的tRNA可以被TiaS识别为底物。也就是说,当改造前tRNA中的N1是胞苷时,可以通过TiaS将胞苷改造为胍丁胞苷。tRNA的N1处的胞苷是否可以通过TiaS改造为胍丁胞苷,可以通过例如通过基因重组技术制备TiaS或从生物材料中提取TiaS,将TiaS与其中N1为胞苷的tRNA在适当的条件下反应,然后检测反应产物中的胍丁胞苷来确认(参见,例如,Ikeuchi et al.,Nat Chem Biol(2010)6(4):277-282)。或者,可以通过将其中N1为胞苷的tRNA引入内源性表达TiaS的细胞或通过基因重组技术使其表达TiaS的细胞中,在适当条件下使引入的tRNA与细胞内TiaS反应,然后检测tRNA中含有的胍丁胞苷进行确认。在本发明的一个实施方案中,当改造前tRNA中的N1为胞苷时,可以通过TiaS催化将胞苷改造为胍丁胞苷。

另一方面,在后一种情况下(当胍丁胞苷在没有TiaS介导的情况下合成时),本公开的tRNA不能被TiaS识别为底物。也就是说,即使改造前tRNA中的N1是胞苷,TiaS也不能将胞苷改造为胍丁胞苷。在这种情况下,胍丁胞苷和含有胍丁胞苷的tRNA可以通过不使用TiaS的方法(例如,化学合成方法)合成。在本公开的一个实施方案中,如果改造前tRNA中的N1为胞苷,则不能通过TiaS催化将胞苷改造为胍丁胞苷。TiaS不能催化胞苷改造为胍丁胞苷的条件可以表示为以下条件:当TiaS将天然底物tRNA Ile2的胞苷改造为胍丁胞苷的活性为1,则TiaS改造靶tRNA的胞苷为胍丁胞苷的活性减少了10倍或更多、20倍或更多、40倍或更多、100倍或更多、200倍或更多、或400倍或更多。当TiaS的催化活性降低时,只能得到含有大量其中N1仍为胞苷的非改造tRNA的低纯度目标产物;因此,通过不使用TiaS的方法(例如,化学合成法)而不是通过使用TiaS的方法合成胍丁胞苷可能更有利。在特定的实施方案中,TiaS是来自古细菌的TiaS。在进一步的实施方案中,TiaS是来自古细菌乙酸甲烷八叠球菌(Methanosarcina acetivorans)的野生型TiaS,具有SEQ ID NO:52的氨基酸序列。

此外,据报道,即使在tRNAIle2中的一些核苷已被改造为其他核苷之后,TiaS仍保持一定量的tRNA的胍丁胞苷合成能力(Osawa et al.,Nat Struct Mol Biol(2011)18:1275-1280)。

在一些实施方案中,本公开的突变tRNA是起始子tRNA或延长子tRNA。突变的tRNA可以通过对起始子tRNA或延长子tRNA进行改造来产生,或者通过改造产生的突变tRNA可以具有作为起始子tRNA或延长子tRNA的功能。当RNA用于翻译系统时,可以通过观察tRNA(i)是否通过IF2引入核糖体,以及(ii)tRNA上连接的氨基酸是否可以作为起始子氨基酸开始肽翻译来判断某个tRNA是否具有作为起始子的功能。此外,当tRNA用于翻译系统时,可以通过观察tRNA(i)是否通过EF-Tu引入核糖体,以及(ii)是否连接到tRNA上的氨基酸可以掺入肽链以延长肽链,来确定某个tRNA是否具有作为延长子tRNA的功能。

在一些实施方案中,本公开的突变tRNA是原核生物衍生的tRNA或真核生物衍生的tRNA。突变tRNA可以通过对原核生物衍生的tRNA或真核生物衍生的tRNA进行改造而产生,改造产生的突变tRNA可以与原核生物衍生的tRNA或真核生物衍生的tRNA具有最高的核酸序列同一性。真核生物进一步分为动物、植物、真菌和原生生物。本公开的突变tRNA可以是例如人源的tRNA。原核生物进一步分为真细菌和古细菌。真细菌的实例包括大肠杆菌、枯草芽孢杆菌(Bacillus subtilis)、乳酸菌和哈夫尼脱硫杆菌(Desulfitobacteriumhafniense)。古细菌的实例包括嗜盐菌、嗜热菌或甲烷细菌(例如,马氏甲烷八叠球菌(Methanosarcina mazei)、巴氏甲烷八叠球菌(Methanosarcina barkeri)和詹氏甲烷球菌(Methanocaldococcus jannaschii))。本公开的突变tRNA可以是例如源自大肠杆菌、哈夫尼脱硫杆菌(Desulfitobacterium hafniense)或马氏甲烷八叠球菌(Methanosarcinamazei)的tRNA。

在一些实施方案中,本公开的突变tRNA可以翻译由M1M2A代表的密码子。本文中,密码子的第一个字母的核苷(M1)和第二个字母的核苷(M2)各自独立地选自腺苷(A)、鸟苷(G)、胞苷(C)或尿苷(U)中的任一个,第三个字母的核苷是腺苷。在另一个实施方案中,本公开的突变tRNA具有与M1M2A代表的特定密码子互补的反密码子。在某些实施方案中,本公开的突变tRNA具有由k2CN2N3或agm2CN2N3表示的反密码子。本文中,反密码子的第一个字母的核苷是赖胞苷(k2C)或胍丁胞苷(agm2C),第二个字母的核苷(N2)和第三个字母的第三个核苷(N3)是分别与上述M1和M2互补的核苷。已知赖胞苷和胍丁胞苷都是与腺苷互补结合的核苷。在进一步的实施方案中,N2和N3中的每一个可以独立地选自腺苷(A)、鸟苷(G)、胞苷(C)和尿苷(U)中的任一种。具体而言,当M2(或M1)为腺苷时,N2(或N3)为尿苷。当M2(或M1)是鸟苷时,N2(或N3)是胞苷。当M2(或M1)为胞苷时,N2(或N3)为鸟苷。当M2(或M1)为尿苷时,N2(或N3)为腺苷。

在本公开的上下文中,“某种tRNA能够翻译特定密码子”的实施方案实质上包括“某种tRNA具有与特定密码子互补的反密码子”的实施方案,只要提及tRNA上反密码子的序列之一,这些表达就可以互换使用。

本公开的突变tRNA可翻译的密码子的第一个字母的核苷(M1)和第二个字母的核苷(M2)可以分别选自构成遗传密码表中特定密码子盒的密码子的第一个字母的核苷(M1)和第二个字母的核苷(M2)。在特定实施方案中,遗传密码表是标准遗传密码表。在另一个实施方案中,遗传密码表是天然遗传密码表。

在一个实施方案中,M1和M2可分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中具有A作为第三个字母的密码子和具有G作为第三个字母的密码子编码相同的氨基酸。例如,在密码子以UUN表示的密码子盒中,第三个字母为A的密码子(UUA)和第三个字母为G的密码子(UUG)都编码相同的氨基酸(Leu);因此,构成该密码子盒的密码子中第一个字母的核苷(U)和第二个字母的核苷(U)可以分别选择为M1和M2

在一个实施方案中,M1和M2可分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中具有U作为第三个字母的密码子和具有A作为第三个字母的密码子编码相同的氨基酸。例如,在密码子以AUN表示的密码子盒中,第三个字母为U的密码子(AUU)和第三个字母为A的密码子(AUA)都编码相同的氨基酸(Ile);因此,构成该密码子盒的密码子中第一个字母的核苷(A)和第二个字母的核苷(U)可以分别选择为M1和M2

在一个实施方案中,M1和M2可分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中具有U的密码子、具有C作为第三个字母的密码子、具有A作为第三个字母的密码子,以及具有G作为第三个字母的密码子都编码相同的氨基酸。例如,在密码子以UCN表示的密码子盒中,第三个字母为U的密码子(UCU)、第三个字母为C的密码子(UCC)、第三个字母为A的密码子(UCA)和第三个字母为G的密码子(UCG)都编码相同的氨基酸(Ser);因此,构成该密码子盒的密码子中第一个字母的核苷(U)和第二个字母的核苷(C)可以分别选择为M1和M2

在一个实施方案中,M1和M2可分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中具有A作为第三个字母的密码子和具有G作为第三个字母的密码子编码彼此不同的氨基酸。例如,在密码子以AUN表示的密码子盒中,第三个字母为A的密码子(AUA)和第三个字母为G的密码子(AUG)都编码彼此不同的氨基酸(Ile和Met);因此,构成该密码子盒的密码子中第一个字母的核苷(A)和第二个字母的核苷(U)可以分别选择为M1和M2

在一个实施方案中,M1和M2可分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中具有A作为第三个字母的密码子和/或具有G作为第三个字母的密码子是终止密码子。例如,在密码子以UGN表示的密码子盒中,第三个字母为A的密码子(UGA)是终止密码子(opal);因此,构成该密码子盒的密码子中第一个字母的核苷(U)和第二个字母的核苷(G)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由UNN表示。具体地,密码子中第一个字母的核苷(U)和第二个字母的核苷(U)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由UCN表示。具体地,密码子中第一个字母的核苷(U)和第二个字母的核苷(C)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由UAN表示。具体地,密码子中第一个字母的核苷(U)和第二个字母的核苷(A)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由UGN表示。具体地,密码子中第一个字母的核苷(U)和第二个字母的核苷(G)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由CUN表示。具体地,密码子中第一个字母的核苷(C)和第二个字母的核苷(U)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由CCN表示。具体地,密码子中第一个字母的核苷(C)和第二个字母的核苷(C)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由CAN表示。具体地,密码子中第一个字母的核苷(C)和第二个字母的核苷(A)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由CGN表示。具体地,密码子中第一个字母的核苷(C)和第二个字母的核苷(G)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由AUN表示。具体地,密码子中第一个字母的核苷(A)和第二个字母的核苷(U)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由ACN表示。具体地,密码子中第一个字母的核苷(A)和第二个字母的核苷(C)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由AAN表示。具体地,密码子中第一个字母的核苷(A)和第二个字母的核苷(A)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由AGN表示。具体地,密码子中第一个字母的核苷(A)和第二个字母的核苷(G)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由GUN表示。具体地,密码子中第一个字母的核苷(G)和第二个字母的核苷(U)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由GCN表示。具体地,密码子中第一个字母的核苷(G)和第二个字母的核苷(C)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由GAN表示。具体地,密码子中第一个字母的核苷(G)和第二个字母的核苷(A)可以分别选择为M1和M2

在进一步的实施方案中,M1和M2可以分别选自在构成密码子盒的密码子中的M1和M2,密码子盒中的密码子由GGN表示。具体地,密码子中第一个字母的核苷(G)和第二个字母的核苷(G)可以分别选择为M1和M2

本公开的突变tRNA中反密码子的第三个字母的核苷(N3)和第二个字母的核苷(N2)可以分别选择为与M1和M2互补的核苷。

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(U)和第二个字母的核苷(U)互补的核苷,密码子盒中的密码子由UUN表示。具体而言,A可以选择为N3,A可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(U)和第二个字母的核苷(C)互补的核苷,密码子盒中的密码子由UCN表示。具体而言,A可以选择为N3,G可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(U)和第二个字母的核苷(A)互补的核苷,密码子盒中的密码子由UAN表示。具体而言,A可以选择为N3,U可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(U)和第二个字母的核苷(G)互补的核苷,密码子盒中的密码子由UGN表示。具体而言,A可以选择为N3,C可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(C)和第二个字母的核苷(U)互补的核苷,密码子盒中的密码子由CUN表示。具体而言,C可以选择为N3,A可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(C)和第二个字母的核苷(C)互补的核苷,密码子盒中的密码子由CCN表示。具体而言,G可以选择为N3,G可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(C)和第二个字母的核苷(A)互补的核苷,密码子盒中的密码子由CAN表示。具体而言,G可以选择为N3,U可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(C)和第二个字母的核苷(G)互补的核苷,密码子盒中的密码子由CGN表示。具体而言,G可以选择为N3,C可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(A)和第二个字母的核苷(U)互补的核苷,密码子盒中的密码子由AUN表示。具体而言,U可以选择为N3,A可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(A)和第二个字母的核苷(C)互补的核苷,密码子盒中的密码子由ACN表示。具体而言,U可以选择为N3,G可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(A)和第二个字母的核苷(A)互补的核苷,密码子盒中的密码子由AAN表示。具体而言,U可以选择为N3,U可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(A)和第二个字母的核苷(G)互补的核苷,密码子盒中的密码子由AGN表示。具体而言,U可以选择为N3,C可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(G)和第二个字母的核苷(U)互补的核苷,密码子盒中的密码子由GUN表示。具体而言,G可以选择为N3,A可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(G)和第二个字母的核苷(C)互补的核苷,密码子盒中的密码子由GCN表示。具体而言,C可以选择为N3,G可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(G)和第二个字母的核苷(A)互补的核苷,密码子盒中的密码子由GAN表示。具体而言,C可以选择为N3,U可以选择为N2

在一个实施方案中,N3和N2可以被选择为分别与构成密码子盒的密码子中的第一个字母的核苷(G)和第二个字母的核苷(G)互补的核苷,密码子盒中的密码子由GGN表示。具体而言,C可以选择为N3,C可以选择为N2

在一些实施方案中,氨基酸或氨基酸类似物连接到本公开的突变tRNA。氨基酸或氨基酸类似物通常连接到tRNA的3'末端,或更具体地说,连接到3'末端的CCA序列的腺苷残基。与突变tRNA连接的氨基酸或氨基酸类似物的具体类型可适当地选自以下氨基酸或氨基酸类似物。

本公开中的氨基酸包括α-氨基酸、β-氨基酸和γ-氨基酸。关于三维结构,包括L型氨基酸和D型氨基酸。此外,本公开中的氨基酸包括天然和非天然氨基酸。在特定实施方案中,天然氨基酸由以下20种α-氨基酸组成:甘氨酸(Gly)、丙氨酸(Ala)、丝氨酸(Ser)、苏氨酸(Thr)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile)、苯丙氨酸(Phe)、酪氨酸(Tyr)、色氨酸(Trp)、组氨酸(His)、谷氨酸(Glu)、天冬氨酸(Asp)、谷氨酰胺(Gln)、天冬酰胺(Asn)、半胱氨酸(Cys)、甲硫氨酸(Met)、赖氨酸(Lys)、精氨酸(Arg)和脯氨酸(Pro)。或者,本公开中的天然氨基酸可以是从上述20种氨基酸中去除任意一个或多个氨基酸后得到的氨基酸。在一个实施方案中,天然氨基酸由19种氨基酸组成,不包括异亮氨酸。在一个实施方案中,天然氨基酸由19种氨基酸组成,不包括甲硫氨酸。在另一个实施方案中,天然氨基酸由18种氨基酸组成,不包括异亮氨酸和甲硫氨酸。天然氨基酸通常是L型氨基酸。

在本公开中,非天然氨基酸是指除上述由20种α-氨基酸组成的天然氨基酸以外的所有氨基酸。非天然氨基酸的实例包括β-氨基酸、γ-氨基酸、D-型氨基酸、侧链与天然氨基酸不同的α-氨基酸、α,α-二取代氨基酸和主链氨基基团具有取代基的氨基酸(N-取代的氨基酸)。非天然氨基酸的侧链没有特别限制,但除了氢原子之外,还可以具有例如烷基、烯基、炔基、芳基、杂芳基、芳烷基和环烷基。此外,在α,α-二取代氨基酸的情况下,两个侧链可以形成环。此外,这些侧链可以具有一个或多个取代基。在特定的实施方案中,取代基可以选自包含卤素原子、O原子、S原子、N原子、B原子、Si原子或P原子的任何官能团。例如,在本公开中,“具有卤素作为取代基的C1-C6烷基”是指烷基中至少一个氢原子被卤素原子取代的“C1-C6烷基”,具体的实例包括,三氟甲基、二氟甲基、氟甲基、五氟乙基、四氟乙基、三氟乙基、二氟乙基、氟乙基、三氯甲基、二氯甲基、氯甲基、五氯乙基、四氯乙基、三氯乙基、二氯乙基和氯乙基。另外,例如,“具有取代基的C5-C10芳基C1-C6烷基”是指芳基和/或烷基中的至少一个氢原子被取代基取代的“C5-C10芳基C1-C6烷基”。此外,短语“具有两个或多个取代基”的含义包括具有某个官能团(例如,包含S原子的官能团)作为取代基,并且该官能团具有另一个取代基(例如,诸如氨基或卤素的取代基)。非天然氨基酸的具体实例可以参考WO2013/100132、WO2018/143145等。

非天然氨基酸主链的氨基可以是未经取代的氨基(NH2基团)或取代的氨基(NHR基团)。本文中,R表示任选地具有取代基的烷基、烯基、炔基、芳基、杂芳基、芳烷基或环烷基。此外,与脯氨酸一样,与主链氨基的N原子和α位碳原子连接的碳链可以形成环。取代基可以选自包含卤素原子、O原子、S原子、N原子、B原子、Si原子或P原子的任何官能团。氨基的烷基取代的实例包括N-甲基化、N-乙基化、N-丙基化和N-丁基化,并且氨基的芳烷基取代的实例包括N-苄基化。N-甲基氨基酸的具体实例包括N-甲基丙氨酸、N-甲基甘氨酸、N-甲基苯丙氨酸、N-甲基酪氨酸、N-甲基-3-氯苯丙氨酸、N-甲基-4-氯苯丙氨酸、N-甲基-4-甲氧基苯丙氨酸、N-甲基-4-噻唑丙氨酸、N-甲基组氨酸、N-甲基丝氨酸和N-甲基天冬氨酸。

含有卤素原子的取代基的实例包括氟(-F)、氯(-Cl)、溴(-Br)和碘(-I)。

包含O原子的取代基的实例包括羟基(-OH)、氧基(-OR)、羰基(-C=O-R)、羧基(-CO2H)、氧羰基(-C=O-OR)、羰基氧基(-O–C=O–R)、硫代羰基(–C=O–SR)、羰基硫代(–S–C=O–R)、氨基羰基(–C=O–NHR)、羰基氨基(–NH–C=O–R)、氧羰基氨基(–NH–C=O–OR)、磺酰基氨基(–NH–SO2-R)、氨基磺酰基(–SO2–NHR)、氨磺酰基氨基(–NH–SO2–NHR)、硫代羧基(–C(=O)–SH)、羧基羰基(–C(=O)–CO2H)。

氧基(-OR)的实例包括烷氧基、环烷氧基、烯氧基、炔氧基、芳氧基、杂芳氧基和芳烷氧基。

羰基(-C=O-R)的实例包括甲酰基(-C=O-H)、烷基羰基、环烷基羰基、烯基羰基、炔基羰基、芳基羰基、杂芳基羰基和芳烷基羰基。

氧羰基(-C=O-OR)的实例包括烷氧羰基、环烷氧羰基、烯氧羰基、炔氧羰基、芳氧羰基、杂芳氧羰基和芳烷氧羰基。

羰基氧基(-O-C=O-R)的实例包括烷基羰基氧基、环烷基羰基氧基、烯基羰基氧基、炔基羰基氧基、芳基羰基氧基、杂芳基羰基氧基和芳烷基羰基氧基。

硫代羰基(-C=O-SR)的实例包括烷基硫代羰基、环烷基硫代羰基、烯基硫代羰基、炔基硫代羰基、芳基硫代羰基、杂芳基硫代羰基和芳烷基硫代羰基。

羰基硫基(-S-C=O-R)的实例包括烷基羰基硫基、环烷基羰基硫基、烯基羰基硫基、炔基羰基硫基、芳基羰基硫基、杂芳基羰基硫基和芳烷基羰基硫基。

氨基羰基(-C=O-NHR)的实例包括烷基氨基羰基、环烷基氨基羰基、烯基氨基羰基、炔基氨基羰基、芳基氨基羰基、杂芳基氨基羰基和芳烷基氨基羰基。此外,-C=O-NHR中与N原子连接的H原子可以被选自由烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组的取代基取代。

羰基氨基(-NH-C=O-R)的实例包括烷基羰基氨基、环烷基羰基氨基、烯基羰基氨基、炔基羰基氨基、芳基羰基氨基、杂芳基羰基氨基和芳烷基羰基氨基。此外,与-NH-C=O-R中的N原子连接的H原子可以被选自由烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组的取代基取代。

氧羰基氨基(-NH-C=O-OR)的实例包括烷氧羰基氨基、环烷氧羰基氨基、烯氧羰基氨基、炔氧羰基氨基、芳氧羰基氨基、杂芳氧羰基氨基和芳烷氧羰基氨基。此外,-NH-C=O-OR中与N原子连接的H原子可以被选自由烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组的取代基取代。

磺酰氨基(-NH-SO2-R)的实例包括烷基磺酰氨基、环烷基磺酰氨基、烯基磺酰氨基、炔基磺酰氨基、芳基磺酰氨基、杂芳基磺酰氨基和芳烷基磺酰氨基。此外,与-NH-SO2-R中的N原子连接的H原子可以被选自由烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组的取代基取代。

氨基磺酰基(-SO2-NHR)的实例包括烷基氨基磺酰基、环烷基氨基磺酰基、烯基氨基磺酰基、炔基氨基磺酰基、芳基氨基磺酰基、杂芳基氨基磺酰基和芳烷基氨基磺酰基。此外,-SO2-NHR中与N原子连接的H原子可以被选自由烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组的取代基取代。

氨磺酰氨基(-NH-SO2-NHR)的实例包括烷基氨磺酰氨基、环烷基氨磺酰氨基、烯基氨磺酰氨基、炔基氨磺酰氨基、芳基氨磺酰氨基、杂芳基氨磺酰氨基和芳烷基氨磺酰氨基。此外,与-NH-SO2-NHR中的N原子连接的两个H原子中的至少一个可以被选自由烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组的取代基取代。当两个H原子都被取代时,取代基可以各自独立地选择,或者这两个取代基可以形成环。

含有S原子的取代基的实例包括硫醇(–SH)、硫代(–S–R)、亚磺酰基(–S=O–R)、磺酰基(–S(O)2–R)和磺基(–SO3H)。

硫代(-S-R)的实例包括烷硫基、环烷硫基、烯硫基、炔硫基、芳硫醇、杂芳硫基和芳烷硫基。

亚磺酰基(-S=O-R)的实例包括烷基亚磺酰基、环烷基亚磺酰基、烯基亚磺酰基、炔基亚磺酰基、芳基亚磺酰基、杂芳基亚磺酰基和芳烷基亚磺酰基。

磺酰基(-S(O)2-R)的实例包括烷基磺酰基、环烷基磺酰基、烯基磺酰基、炔基磺酰基、芳基磺酰基、杂芳基磺酰基和芳烷基磺酰基。

包含N原子的取代基的实例包括叠氮(-N3)、氰基(-CN)、伯氨基(-NH2)、仲氨基(-NH-R)、叔氨基(-NR(R'))、脒基(-C(=NH)-NH2)、取代的脒基(-C(=NR)-NR'R”)、胍基(-NH=C(=NH)-NH2)、取代的胍基(-NR-C(=NR’”)-NR’R”)和氨基羰基氨基(-NR-CO-NR'R”)。

仲氨基(-NH-R)的实例包括烷基氨基、环烷基氨基、烯基氨基、炔基氨基、芳基氨基、杂芳基氨基和芳烷基氨基。

叔氨基(-NR(R’))中N原子上的两个取代基R和R’可各自独立地选自由烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组。叔氨基的实例包括例如烷基(芳烷基)氨基。这两个取代基可以形成环。

取代的脒基(–C(=NR)–NR'R”)中N原子上的三个取代基R、R'和R”可各自独立地选自由氢原子、烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组。取代的脒基的实例包括烷基(芳烷基)(芳基)脒基。这些取代基可以一起形成环。

取代的胍基(-NR-C(=NR'”)–NR'R”)中N原子上的四个取代基R、R'、R”和R’”可各自独立地选自由氢原子、烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组。这些取代基可以一起形成环。

氨基羰基氨基(-NR-CO-NR'R")中N原子上的三个取代基R、R'和R"可各自独立地选自由氢原子、烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组。这些取代基可以一起形成环。

含有B原子的取代基的实例包括硼基(-BR(R’))和二氧硼基(-B(OR)(OR’))。B原子上的两个取代基R和R’可各自独立地选自由氢原子、烷基、环烷基、烯基、炔基、芳基、杂芳基和芳烷基组成的组。这些取代基可以一起形成环。

本公开中的氨基酸类似物的实例包括羟基羧酸(羟基酸)。羟基羧酸包括α-羟基羧酸、β-羟基羧酸和γ-羟基羧酸。与氨基酸一样,除了氢原子之外的侧链可以连接到羟基羧酸中α-位的碳上。关于三维结构,可以包括L型和D型。侧链的结构可以与上述天然氨基酸或非天然氨基酸的侧链类似地定义。羟基羧酸的实例包括羟基乙酸、乳酸和苯基乳酸。

本公开中的氨基酸可以是可翻译的氨基酸,氨基酸类似物可以是可翻译的氨基酸类似物。如本文所用,“可翻译”氨基酸或氨基酸类似物(可统称为氨基酸等)是指可以通过翻译合成(例如,使用本公开中描述的翻译系统)掺入肽中的氨基酸等。某个氨基酸等是否可翻译可以通过使用连接有氨基酸等的tRNA的翻译合成实验来确认。可以在翻译合成实验中使用重建的无细胞翻译系统(参见例如,WO2013100132)。

根据本公开的非天然氨基酸或氨基酸类似物可以通过常规已知的化学合成方法、稍后讨论的实施例中描述的合成方法或与其类似的合成方法来制备。

<tRNA的制备>

可以合成tRNA,例如,通过制备编码所需tRNA基因的DNA,然后在DNA上游放置合适的启动子如T7、T3或SP6,并使用DNA作为模板使用适应每个启动子的RNA聚合酶进行转录反应。此外,tRNA也可以通过从生物材料中纯化来制备。例如,可以通过从含有tRNA的材料例如细胞制备提取溶液并向其中加入含有与tRNA的核酸序列互补的序列的探针来回收tRNA。在这种情况下,制备材料可以是用能够表达所需tRNA的表达载体转化的细胞。通常,体外转录合成的tRNA仅含有四种典型的核苷:腺苷、鸟苷、胞苷和尿苷。另一方面,在细胞中合成的tRNA可能含有由典型核苷修饰产生的修饰核苷。认为天然tRNA中的修饰核苷(例如赖胞苷)在通过转录合成tRNA之后通过用于该修饰的酶(例如TilS)的作用而特异性地引入该tRNA中。或者,tRNA也可以通过转录合成的片段或化学合成的片段或诸如以下实施例中所述的通过酶促反应连接的方法来制备。

氨酰基-tRNA也可以通过化学和/或生物合成方法制备。例如,可以使用氨酰-tRNA合成酶(ARS)将氨基酸连接到tRNA上合成氨酰-tRNA。氨基酸可以是天然氨基酸,也可以是非天然氨基酸,只要能作为ARS的底物即可。或者,可以将天然氨基酸连接到tRNA上,然后进行化学修饰。此外,由于有许多报道称在ARS中引入氨基酸突变增强了它们对非天然氨基酸的作用(参见例如WO2006/135096、WO2007/061136、WO2007/103307、WO2008/001947、WO2010/141851和WO2015/120287),此类突变ARS可用于将氨基酸连接到tRNA。除了使用ARS的方法外,还可以通过例如从tRNA的3'末端去除CA序列,并使用RNA连接酶将氨酰化的pdCpA(由脱氧胞苷和腺苷组成的二核苷酸)连接到其上来合成氨酰-tRNA(pdCpA 方法;Hecht et al.,J Biol Chem(1978)253:4517-4520)。使用pCpA(由胞苷和腺苷组成的二核苷酸)代替pdCpA的方法也是已知的(pCpA方法;Wang et al.,ACS Chem Biol(2015)10:2187-2192)。此外,还可以通过使用人工RNA催化剂(flexizyme)将之前通过酯化活化的非天然氨基酸连接到tRNA来合成氨酰基-tRNA(WO2007/066627)。

<翻译系统>

一方面,本公开提供了一组适用于肽翻译的tRNA。一组tRNA包含多种不同的tRNA,并且可以从这些tRNA翻译出多种不同的氨基酸。一方面,本公开提供了包含多种适用于肽翻译的不同tRNA的组合物。在另一方面,本公开提供了翻译肽的方法,包括提供适合于肽翻译的多种不同的tRNA。一方面,本公开提供了翻译系统,其包含多种适用于肽翻译的不同tRNA。在某些方面,上述多种不同的tRNA包括本公开的突变tRNA。以下描述涉及适用于肽翻译的这些tRNA、组合物、翻译方法和翻译系统。

在一个实施方案中,本发明的突变tRNA在反密码子的第一个字母(N1)处具有赖胞苷(k2C)、赖胞苷衍生物、胍丁胞苷(agm2C)或胍丁胞苷衍生物中的任一种。由于赖胞苷和胍丁胞苷与腺苷(A)形成互补碱基对,因此它们在密码子中的作用可能与尿苷(U)的作用相对应。在一些实施方案中,本公开的突变tRNA可以相对于其他密码子选择性地翻译由M1M2A代表的密码子。其他密码子可以是与M1M2A代表的密码子不同的密码子;例如,由M1M2U、M1M2C或M1M2G表示的密码子。在某些实施方案中,本公开的突变tRNA可以相对于由M1M2U、M1M2C和M1M2G代表的所有密码子选择性地翻译由M1M2A代表的密码子。

在本公开的一个实施方案中,“突变tRNA可以选择性地翻译M1M2A密码子”是指[tRNA对M1M2A密码子的翻译量]例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[tRNA对另一个密码子的翻译量]。例如,某个突变tRNA是否可以选择性翻译由CUA所代表的密码子,可以通过[tRNA对CUA密码子的翻译量]是否例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[tRNA对CUG密码子的翻译量]来判断。

比较特定密码子(例如M1M2A)的翻译量和另一个密码子(例如M1M2G)的翻译量可以通过例如制备包含M1M2A密码子的肽编码mRNA和另一种与上述mRNA具有相同核酸序列只是将M1M2A密码子替换为M1M2G密码子的mRNA,在相同条件下翻译这两种mRNA,比较得到的两种合成肽的量来进行。

在本公开的另一个实施方案中,“突变tRNA能够选择性翻译M1M2A密码子”是指[tRNA对M1M2A以外的密码子的翻译量]减少到例如不超过1/2、不超过1/3、不超过1/4、不超过1/5、不超过1/6、不超过1/7、不超过1/8、不超过1/9,不超过1/10,不超过1/15,不超过1/20,不超过1/30,不超过1/40,不超过1/50,不超过1/60,不超过1/70、不超过1/80、不超过1/90或不超过1/100[具有UN2N3反密码子的tRNA对M1M2A以外的密码子的翻译量]。本文中,UN2N3反密码子代表反密码子的第一个字母(N1)为尿苷,反密码子的第二个字母(N2)和第三个字母(N3)分别为与M2和M1互补的核苷的反密码子。由于赖胞苷和胍丁胞苷在反密码子中的作用对应于尿苷,这里选择尿苷进行比较。此外,M1M2A以外的密码子可以是由M1M2U、M1M2C或M1M2G表示的密码子中的任何一种。例如,某个突变tRNA是否可以选择性翻译CUA所代表的密码子,可以通过[tRNA对CUG密码子的翻译量]是否降低到例如不超过1/2,不超过1/3,不超过1/4,不超过1/5,不超过1/6,不超过1/7,不超过1/8,不超过1/9,不超过1/10,不超过1/15,不超过1/20,不超过1/30,不超过1/40,不超过1/50,不超过1/60,不超过1/70、不超过1/80、不超过1/90或不超过1/100[具有UN2N3反密码子的tRNA在CUG密码子上的翻译量]来判断。

在另一个实施方案中,M1M2A代表的密码子可以比其他tRNA更选择性地由本公开的突变tRNA翻译。其他tRNA可以是能够翻译不同于M1M2A所代表的密码子的密码子的tRNA,例如能够翻译M1M2U、M1M2C或M1M2G密码子的tRNA。在特定的实施方案中,M1M2A代表的密码子可以由本公开的突变tRNA选择性地翻译,而不是被能够翻译M1M2U密码子的tRNA、能够翻译M1M2C密码子的tRNA和能够翻译M1M2G密码子的tRNA选择性地翻译。

在本公开的一个实施方案中,“M1M2A代表的密码子可以由突变tRNA选择性翻译”是指[tRNA对M1M2A密码子的翻译量]例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[其它tRNA对M1M2A密码子的翻译量]。例如,由CUA所代表的密码子是否可由某个突变tRNA选择性翻译,可以通过[tRNA对CUA密码子的翻译量]是否例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[能够翻译CUG密码子的tRNA(例如,具有CAG反密码子的tRNA)对CUA密码子的翻译量]来判断。

包含本公开的突变tRNA的翻译系统可以同时具有上述两个特征。即,在特定的实施方案中,在本公开的翻译系统中,(i)突变tRNA可以比其他密码子选择性地翻译由M1M2A表示的密码子,和(ii)由M1M2A表示的密码子可以由本公开的突变tRNA相对应其他tRNA选择性地翻译。当建立这种关系时,在本公开的翻译系统中,使用本公开的突变tRNA的肽翻译和使用其他tRNA的肽翻译处于独立的关系,其中它们彼此不相互作用;换句话说,处于正交关系。自然界生物的翻译系统本质上是在密码子和氨基酸之间建立了严格的对应关系;因此,向其中添加非正交的突变的tRNA可能会扰乱这些对应关系,并对翻译系统的功能产生致命影响。因此,在本公开的翻译系统中,本公开的突变tRNA与其他tRNA之间建立的正交性可能是重要特征之一。

在一实施方案中,本公开的翻译系统还包括具有与M1M2G表示的密码子互补的反密码子的tRNA(以下,该tRNA也称为“tRNA-G”)。在一些实施方案中,本公开中的翻译系统包含至少两种tRNA:(a)本公开中描述的突变tRNA和(b)本公开中描述的tRNA-G。在特定实施方案中,与M1M2G表示的密码子互补的反密码子是例如CN2N3、ac4CN2N3或CmN2N3。本文中,每个反密码子的第一个字母的核苷是胞苷(C)、N4-乙酰胞苷(ac4C)或2'-O-甲基胞苷(Cm),第二个字母(N2)的核苷和第三个字母(N3)的核苷分别是与上述M2和M1互补的核苷。本发明所述的突变tRNA和tRNA-G除了反密码子外可以具有相同的核酸序列,或可以具有不同的核酸序列。当反密码子以外的核酸序列相同时,这两种tRNA的理化性质可能彼此相似;因此,可以构建具有更均匀和稳定反应性的翻译系统。

在一些实施方案中,本公开的tRNA-G可以相对于其他密码子选择性地翻译由M1M2G表示的密码子。其他密码子可以是与M1M2G表示的密码子不同的密码子;例如,由M1M2U、M1M2C或M1M2A表示的密码子。在某些实施方案中,本公开的tRNA-G可以相对于由M1M2U、M1M2C和M1M2A表示的任何密码子选择性地翻译由M1M2G表示的密码子。

在本公开的一个实施方案中,某个tRNA可以选择性地翻译M1M2G密码子是指[tRNA对M1M2G密码子的翻译量]例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[tRNA对另一个密码子的翻译量]。例如,某个突变tRNA是否可以选择性翻译由CUG所表示的密码子,可以通过观察[tRNA对CUG密码子的翻译量]是否例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[tRNA对CUA密码子的翻译量]来判断。

在另一个实施方案中,M1M2G表示的密码子可以比其他tRNA更选择性地由本公开的tRNA-G翻译。其他tRNA可以是能够翻译不同于M1M2G所表示的密码子的密码子的tRNA,例如能够翻译M1M2U、M1M2C或M1M2A密码子的任意一种的tRNA。在特定的实施方案中,M1M2G表示的密码子可以由本公开的tRNA-G选择性地翻译,而不是被能够翻译M1M2U密码子的tRNA、能够翻译M1M2C密码子的tRNA和能够翻译M1M2A密码子的tRNA中的任意一种选择性地翻译。

在本公开的一个实施方案中,M1M2G表示的密码子可以由某个tRNA选择性地翻译是指[tRNA对M1M2G密码子的翻译量]例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[其它tRNA对M1M2G密码子的翻译量]。例如,由CUG所代表的密码子是否可由某个tRNA选择性翻译,可以通过观察[tRNA对CUG密码子的翻译量]是否例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[能够翻译CUA密码子的tRNA(例如,具有k2CAG反密码子的tRNA)对CUG密码子的翻译量]来判断。

包含本公开的tRNA-G的翻译系统可以具有以上两个特征的组合。即,在特定的实施方案中,在本公开的翻译系统中,(i)tRNA-G可以比其他密码子选择性地翻译由M1M2G表示的密码子,和(ii)由M1M2G表示的密码子可以由本公开的tRNA-G相对应其他tRNA选择性地翻译。当建立这种关系时,在本公开的翻译系统中,使用tRNA-G的肽翻译和使用其他tRNA的肽翻译是独立的,彼此不相互作用;换句话说,具有正交关系。在本公开的翻译系统中,在tRNA-G与其他tRNA之间建立的正交性可能是重要特征之一。

在另一个实施方案中,本公开的与突变tRNA连接的氨基酸(下文中,该氨基酸也称为“氨基酸-A”)和与tRNA-G连接的氨基酸(下文中,该氨基酸也称为“氨基酸-G”)可以彼此不同。对于本公开中突变tRNA和tRNA-G,当建立上述正交关系时,M1M2A密码子与氨基酸-A、M1M2G密码子与氨基酸-G各自在目前的翻译系统中一一对应。即,在本公开的翻译系统中,可以从在同一密码子盒中的两个密码子(i)M1M2A和(ii)M1M2G翻译两种不同的氨基酸。

在一实施方案中,本公开的翻译系统还包括具有与M1M2U或M1M2C代表的密码子互补的反密码子的tRNA(以下,该tRNA也称为“tRNA-U/C”)。在一些实施方案中,本公开中的翻译系统包含至少三个tRNA,其是(a)本公开中描述的突变tRNA,(b)本公开中描述的tRNA-G,和(c)本公开中描述的tRNA-U/C。在特定实施方案中,与M1M2U代表的密码子互补的反密码子是例如AN2N3、GN2N3、QN2N3或GluQN2N3。本文中,每个反密码子的第一个字母的核苷都是腺苷(A)、鸟苷(G)、辫苷(Q)或谷氨酰辫苷(GluQ),第二个字母(N2)的核苷和第三个字母(N3)的核苷分别是与上述M2和M1互补的核苷。在另一个实施方案中,与M1M2C代表的密码子互补的反密码子是例如GN2N3、QN2N3或GluQN2N3。由于与M1M2U和M1M2C密码子互补的许多反密码子彼此重叠,这两个密码子在本公开中可被视为单个密码子。在特定实施方案中,与由M1M2U或M1M2C代表的密码子互补的反密码子是例如AN2N3、GN2N3、QN2N3或GluQN2N3。本公开所述的突变tRNA、tRNA-G和tRNA-U/C除了反密码子外,可以具有相同的核酸序列,或可以具有彼此不同的核酸序列。当反密码子以外的核酸序列相同时,这三种tRNA的理化性质可能彼此相似;因此,可以构建具有更均匀和稳定反应性的翻译系统。

在一些实施方案中,本公开的tRNA-U/C可以相对于其他密码子选择性地翻译由M1M2U或M1M2C代表的密码子。其他密码子可以是与M1M2U或M1M2C代表的密码子不同的密码子;例如,它们可以是由M1M2A或M1M2G代表的密码子。在具体实施方案中,本公开的tRNA-U/C可以相对于由M1M2A和M1M2G代表的密码子选择性地翻译由M1M2U或M1M2C代表的密码子。

在本公开的一个实施方案中,某个tRNA可以选择性地翻译M1M2U或M1M2C密码子是指[tRNA对M1M2U或M1M2C密码子的翻译量]例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[tRNA对其它密码子的翻译量]。例如,某个tRNA是否可以选择性翻译由CUU或CUC所表示的密码子,可以通过观察[tRNA对CUU或CUC密码子的翻译量]是否例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[tRNA对CUA密码子的翻译量]来判断。

在另一个实施方案中,M1M2U或M1M2C表示的密码子可以比其他tRNA更选择性地由本公开的tRNA-U/C翻译。其他tRNA可以是能够翻译不同于M1M2U或M1M2C所表示的密码子的密码子的tRNA,例如能够翻译M1M2A或M1M2G密码子的任意一种的tRNA。在特定的实施方案中,M1M2U或M1M2C表示的密码子可以由本公开的tRNA-U/C选择性地翻译,而不是被能够翻译M1M2A密码子的tRNA和能够翻译M1M2G密码子的tRNA中的任意一种选择性地翻译。

在本公开的一个实施方案中,M1M2U或M1M2C表示的密码子可以由某个tRNA选择性地翻译是指[tRNA对M1M2U或M1M2C密码子的翻译量]例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[其它tRNA对M1M2U或M1M2C密码子的翻译量]。例如,由CUU或CUC所代表的密码子是否可由某个tRNA选择性翻译,可以通过观察[tRNA对CUU或CUC密码子的翻译量]是否例如不少于两倍,不少于3倍,不少于4倍,不少于5倍,不少于6倍,不少于7倍,不少于8倍,不少于9倍,不少于10倍,不少于15倍,不少于20倍、不少于30倍、不少于40倍、不少于50倍、不少于60倍、不少于70倍、不少于80倍、不少于90倍、或不少于100倍[能够翻译CUA密码子的tRNA(例如,具有k2CAG反密码子的tRNA)对CUU或CUC密码子的翻译量]来判断。

包含本公开的tRNA-U/C的翻译系统可以具有以上两个特征的组合。即,在特定的实施方案中,在本公开的翻译系统中,(i)tRNA-U/C可以比其他密码子选择性地翻译由M1M2U或M1M2C表示的密码子,和(ii)由M1M2U或M1M2C表示的密码子可以由本公开的tRNA-U/C相对于其他tRNA选择性地翻译。当建立这种关系时,在本公开的翻译系统中,使用tRNA-U/C的肽翻译和使用其他tRNA的肽翻译是独立的,彼此不相互作用;换句话说,它们具有正交关系。在本公开的翻译系统中,在tRNA-U/C与其他tRNA之间建立正交性可能是重要特征之一。

在另一个实施方案中,本公开的与突变tRNA连接的氨基酸(“氨基酸-A”)、与tRNA-G连接的氨基酸(“氨基酸-G”)和与tRNA-U/C连接的氨基酸(下文中,将该氨基酸称为“氨基酸-U/C”)可以彼此不同。对于本公开中突变tRNA、tRNA-G和tRNA-U/C,当建立上述正交关系时,M1M2A密码子与氨基酸-A、M1M2G密码子与氨基酸-G、M1M2U或M1M2C密码子与氨基酸-U/C各自在目前的翻译系统中一一对应。即,在本公开的翻译系统中,可以从在同一密码子盒中的三个密码子(i)M1M2A、(ii)M1M2G和(iii)M1M2U或M1M2C翻译三种不同的氨基酸。或者,在本公开的翻译系统中,可以从由M1M2U、M1M2C、M1M2A和M1M2G组成的密码子盒翻译三种不同的氨基酸。

在一些实施方案中,非天然氨基酸可连接至本公开的突变的tRNA、tRNA-G和tRNA-U/C中的至少一种。

在一些实施方案中,本公开的突变tRNA可以分配给构成遗传密码表中的至少一个密码子盒的密码子。在进一步的实施方案中,本公开的突变tRNA可以分配给构成遗传密码表中的多个密码子盒的密码子。多个密码子盒可以是例如2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个密码子盒。除了突变tRNA外,tRNA-G可能会被分配给构成相同密码子盒的其他密码子(与被分配突变tRNA的密码子不同的密码子),或者tRNA-U/C可能会被分配给构成相同的密码子盒的其他密码子(与突变tRNA分配的密码子和tRNA-G分配的密码子不同的密码子)。每个tRNA将分配给哪个构成密码子盒的密码子由tRNA携带的反密码子的第二个字母(N2)的核苷和第三个字母(N3)的核苷决定。分配给构成不同密码子盒的密码子的tRNA具有不同的N2和N3。此外,分配给构成不同密码子盒的密码子的tRNA除了反密码子之外可以具有相同的核酸序列,或者它们可以具有彼此不同的核酸序列。当反密码子以外的核酸序列相同时,这些tRNA的理化性质可能相似;因此,可以构建具有更均匀和稳定反应性的翻译系统。

在一些实施方案中,一种、两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种、十二种、十三种、14种、15种、16种、17种、18种、19种或20种氨基酸可以是翻译自本公开的翻译系统。或者,通过使用本公开的突变tRNA区分单个密码子盒中的M1M2A和M1M2G密码子,可以翻译超过20种氨基酸。在另一个实施方案中,例如,21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47或48种氨基酸可以从本公开的翻译系统翻译。

在一些实施方案中,本公开的翻译系统是无细胞翻译系统。在进一步的实施方案中,本公开的翻译系统是重建的无细胞翻译系统。作为无细胞翻译系统中的细胞提取溶液和肽翻译所需的因子(例如,核糖体),可以使用来自各种生物材料的那些。这种生物材料的实例包括大肠杆菌、酵母、小麦胚芽、兔网织红细胞、HeLa细胞和昆虫细胞。

一方面,本公开提供了产生肽的方法,包括使用本公开中所述的翻译系统翻译核酸。本公开的肽可以包括其中两个或更多个氨基酸通过酰胺键连接的化合物。此外,本公开的肽还可以包括其中氨基酸类似物例如羟基羧酸代替氨基酸由酯键连接的化合物。肽中所含的氨基酸或氨基酸类似物的数量没有特别限制,只要其为2个或更多,例如2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、或11个或更多,以及100个或更少、80个或更少、50个或更少、30个或更少、25个或更少、20个或更少、19个或更少,18个或更少、17个或更少、16个或更少、15个或更少、14个或更少、13个或更少、或12个或更少。或者,数字可以选自9、10、11和12。

一方面,本公开的肽可以含有N-取代的氨基酸,肽中包含的N-取代的氨基酸的数目可以是例如2、3、4、5、6、6、7、8、9或10。在另一个实施方案中,本公开的肽可以包含未被N-取代的氨基酸,并且N-未取代的氨基酸的数目可以是例如1、2、3或4。在进一步的实施方案中,本公开的肽可以包含N-取代的和N-未取代的氨基酸。

在一些实施方案中,本公开的肽可以是线性肽或包含环状部分的肽。包含环状部分的肽是指其中存在于肽链上的氨基酸或氨基酸类似物的主链或侧链连接到存在于相同肽链上的另一个氨基酸或氨基酸类似物的主链或侧链,在分子中形成环状结构。具有环状部分的肽可以仅由环状部分构成,或者可以包含环状部分和线性部分两者。环状部分所包含的氨基酸或氨基酸类似物的数目例如为4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、或9个或更多、和14个或更少、13个或更少,12个或更少,或11个或更少。或者,数字可以选自9、10和11。包含在线性部分中的氨基酸或氨基酸类似物的数目例如为0个或更多,并且可以为8个或更少、7个或更少、6个或更少、5个或更少或4个或更少。或者,数字可以选自0、1、2和3。

作为用于形成环状部分的键,例如,可以使用由氨基和羧基形成的肽键。此外,还可以使用酰胺键、二硫键、醚键、硫醚键、酯键、硫酯键、碳碳键、烷基键、烯基键、膦酸醚键、偶氮键、胺键、C=N-C键、内酰胺桥、氨基甲酰基键、脲键、硫脲键、硫代酰胺键、亚磺酰基键、磺酰基键、三唑键、苯并噁唑键以及由适当官能团的组合形成的这些键。碳-碳键可以通过过渡金属催化的反应例如铃木反应(Suzuki reaction)、赫克反应(Heck reaction)和Sonogashira反应形成。在一个实施方案中,本公开的肽含有至少一组能够在分子中形成上述键的官能团。环状部分的形成可以通过使用本公开的翻译系统产生线性肽然后单独进行用于将上述官能团彼此连接的反应来进行。关于具有环状部分的肽的合成,可参见WO2013/100132、WO2012/026566、WO2012/033154、WO2012/074130、WO2015/030014、W02018/05020、Comb Chem High Throughput Screen(2010)13:75-87、Nat Chem Biol(2009)5:502-507,Nat Chem Biol(2009)5:888-90,Bioconjug Chem(2007)18:469-476,Chem Bio Chem(2009)10:787-99、Chem.Commun.(Camb)(2011)47:9946-9958等。

在一些实施方案中,在本公开的翻译系统中翻译的核酸是mRNA。可以在mRNA中编码具有所需氨基酸序列的肽。通过向本公开的翻译系统添加mRNA,可以将mRNA翻译成肽。另一方面,当翻译系统中含有用于将DNA转录成mRNA的RNA聚合酶时,通过将DNA加入本发明的翻译系统中,可以将DNA转录成mRNA与mRNA翻译成肽结合进行。

甲硫氨酸通常作为起始子氨基酸存在于翻译肽的N端,但已经报道了一些将甲硫氨酸以外的氨基酸引入N端的方法。它们可以与本公开中描述的生产肽的方法组合使用。这种方法的实例包括使用被除甲硫氨酸以外的氨基酸氨酰化的起始子tRNA,从所需氨基酸开始翻译肽的方法(起始抑制)。尤其是翻译起始时对外源氨基酸的耐受程度高于肽链延长时;因此,在N-末端,甚至可以使用结构与天然氨基酸大不相同的氨基酸(Goto&Suga,J AmChem Soc(2009)131(14):5040-5041)。另一种方法包括,例如,通过从翻译系统中去除起始甲硫氨酰tRNA或通过用除甲硫氨酸以外的具有低翻译效率的氨基酸替换起始氨基酸来从第二个或后续密码子开始翻译肽的方法(起始通读;跳过起始密码子)。另一种方法包括,例如,通过使酶例如肽去甲酰酶和甲硫氨酸氨肽酶起作用来去除肽的N-末端的甲硫氨酸(Meinnelet al.,Biochimie(1993)75:1061-1075)。制备以甲硫氨酸为起始的肽库,使上述酶作用于肽库,制备以N端随机氨基酸为起始的肽库。

另一方面,本公开提供了通过本公开中描述的生产肽的方法生产的肽。通过对本公开所述方法生产的肽进行进一步化学修饰得到的肽也包括在本公开提供的肽中。

一方面,本公开提供了产生肽文库的方法,包括使用本公开中描述的翻译系统翻译核酸文库。通过制备各自编码肽且富含核酸序列多样性的多个核酸分子,然后将它们中的每一个翻译成肽,可以产生富含氨基酸序列多样性的多个肽分子。文库的大小没有特别限制,并且可以是例如106个或更多、107个或更多、108个或更多、109个或更多、1010个或更多、1011个或更多、1012个或更多、1013个或更多,或1014个或更多。核酸可以是DNA或RNA。RNA通常是mRNA。DNA通过转录成mRNA被翻译成肽。这种核酸文库可以通过本领域技术人员已知的方法或类似方法来制备。通过在合成核酸文库时在所需位置使用混合碱基,可以容易地制备富含核酸序列多样性的多个核酸分子。使用混合碱基的密码子的实例是,例如NNN(其中N代表4种碱基A、T、G和C的混合物)、NNW(其中W代表2种碱基A和T的混合物)、NNM(其中W代表两种碱基A和C的混合物)、NNK(其中K代表两种碱基G和T的混合物)和NNS(其中S代表两种碱基C和G的混合物)。或者,通过将密码子的第三个字母中使用的碱基限制为A、T、G和C中的任意一个,可以合成其中仅编码一些特定氨基酸的核酸文库。此外,当制备含有混合碱基的密码子时,可以通过将多个碱基以不同比例而不是等比例混合来任意调整可由密码子获得的氨基酸的出现频率。通过将以上述密码子作为一个单元,制备多个不同的密码子单元,然后按照需要的顺序连接起来,就可以设计出控制所含氨基酸出现位置和出现频率的文库。

在一些实施方案中,本公开所述的肽文库是肽展示在核酸上的文库(核酸展示文库,或简称展示文库)。展示文库是这样的文库,其中通过将肽连接到编码所述肽的核酸而形成单一复合物,表型和基因型彼此关联。主要展示文库的实例包括通过mRNA展示方法(Roberts和Szostak,Proc Natl Acad Sci USA(1997)94:12297-12302)、体外病毒方法(Nemoto et al.,FEBS Lett(1997)414:405-408)、cDNA展示方法(Yamaguchi et al.,Nucleic Acids Res(2009)37:e108)、核糖体展示方法(Mattheakis et al,Proc NatlAcad Sci USA(1994)91:9022-9026),共价展示方法(Reiersen et.al.,Nucleic AcidsRes(2005)33:e10)、CIS显示方法(Odegrip et.al.,Proc Natl Acad Sci USA(2004)101:2806-2810)等制备的文库。或者,可以提及通过使用体外区室化方法(Tawfik andGriffiths,Nat Biotechnol(1998)16:652-656)制备的文库作为展示文库的一个实施方案。

另一方面,本公开提供了通过本公开所述的用于产生肽文库的方法产生的肽文库。

一方面,本公开提供了鉴定对靶分子具有结合活性的肽的方法,包括使靶分子与本公开所述的肽文库接触。靶分子没有特别限制并且可以适当地选自例如低分子量化合物、高分子量化合物、核酸、肽、蛋白质、糖和脂质。靶分子可以是存在于细胞外的分子或存在于细胞内的分子。或者,它可以是存在于细胞膜中的分子,在这种情况下,细胞外结构域、跨膜结构域和细胞内结构域中的任何一个都可以是靶标。在靶分子与肽文库接触的步骤中,靶分子通常被固定在某种固相载体上(例如,微量滴定板或微珠)。然后,通过去除未连接到靶分子的肽并仅回收连接到靶分子的肽,可以选择性地浓缩对靶分子具有结合活性的肽(淘选方法)。当使用的肽文库是核酸展示文库时,回收的肽具有与其连接的编码其各自遗传信息的核酸;因此,编码回收的肽的核酸序列和氨基酸序列可以通过分离和分析它们来容易地鉴定。此外,基于获得的核酸序列或氨基酸序列,可以通过化学合成或基因重组技术单独产生鉴定的肽。

一方面,本公开提供了核酸-肽复合物,其包含肽和编码所述肽的核酸,其中所述复合物具有以下特征:

(i)编码肽的核酸序列包含两个密码子,M1M2A和M1M2G;和

(ii)在肽的氨基酸序列中,M1M2A密码子对应的氨基酸与M1M2G密码子对应的氨基酸不同。

本文中,M1和M2分别代表特定密码子的第一个和第二个字母(但不包括M1为A和M2为U的密码子)。

另一方面,本公开提供了核酸-肽复合物,其包含肽和编码所述肽的核酸,其中所述复合物具有以下特征:

(i)编码肽的核酸序列包含三个密码子,M1M2U、M1M2A和M1M2G;和

(ii)在肽的氨基酸序列中,M1M2U密码子对应的氨基酸、M1M2A密码子对应的氨基酸、M1M2G密码子对应的氨基酸都不同。

在本文中,M1和M2分别代表特定密码子的第一个和第二个字母。

另一方面,本公开提供了核酸-肽复合物,其包含肽和编码所述肽的核酸,其中所述复合物具有以下特征:

(i)编码肽的核酸序列包含三个密码子,M1M2C、M1M2A和M1M2G;和

(ii)在肽的氨基酸序列中,M1M2C密码子对应的氨基酸、M1M2A密码子对应的氨基酸、M1M2G密码子对应的氨基酸彼此不同。

在本文中,M1和M2分别代表特定密码子的第一个和第二个字母。

在一些实施方案中,上述核酸-肽复合物可以包含在肽文库中作为构成文库的元件之一(特别是核酸展示文库)。一方面,本公开提供了包含本公开中所述的核酸-肽复合物的文库(肽文库或核酸展示文库)。在某些实施方案中,上述核酸-肽复合物和文库可以使用本公开所述的突变tRNA或本公开所述的翻译系统来制备。

一方面,本公开提供了以下化合物,即赖胞苷二磷酸(pLp)或其盐。

这种化合物可用于制备引入了赖胞苷的突变tRNA。因此,本公开涉及使用赖胞苷二磷酸产生其中引入了赖胞苷的突变tRNA的方法,以及通过该方法产生的突变tRNA。本公开还涉及使用赖胞苷二磷酸产生其中引入了赖胞苷的突变tRNA的方法,其中突变tRNA具有与其连接的氨基酸或氨基酸类似物(氨酰基突变tRNA),以及所述方法产生的氨酰基突变tRNA。此类突变tRNA和/或氨酰基突变tRNA可用于本公开的翻译系统中。因此,本公开涉及包含此类突变tRNA和/或氨酰基突变tRNA的翻译系统。本公开还提供了使用所述翻译系统产生肽或肽文库的方法。本公开还提供了通过所述方法产生的肽或肽文库。

在本公开中,可以在tRNA的34位引入赖胞苷(基于tRNA编号规则)。在一个实施方案中,根据tRNA编号规则在34位引入赖胞苷的突变tRNA可以通过制备一种或多种(例如2、3、4、5或更多)tRNA核酸片段和赖胞苷-二磷酸,并通过本领域技术人员已知的方法连接它们来获得。具体地,例如,由tRNA赖胞苷二磷酸的1至33位的碱基组成的核酸片段,以及由tRNA的35至76位(或tRNA的35至75位,或tRNA的第35至74位)的碱基组成的核酸片段从5'侧按此顺序连接。3'端的CA序列可去除。

一方面,本公开提供了以下化合物,即胍丁胞苷-二磷酸(p(Agm)p)或其盐。

这种化合物可用于制备引入了胍丁胞苷的突变tRNA。因此,本公开涉及使用胍丁胞苷二磷酸产生其中引入了胍丁胞苷的突变tRNA的方法,以及通过该方法产生的突变tRNA。本公开还涉及使用胍丁胞苷二磷酸生产其中引入胍丁胞苷的突变tRNA的方法,其中所述突变tRNA具有与其连接的氨基酸或氨基酸类似物(氨酰基突变tRNA),以及通过所述方法产生的氨酰基突变的tRNA。此类突变tRNA和/或氨酰基突变tRNA可用于本公开的翻译系统中。因此,本公开涉及包含此类突变tRNA和/或氨酰基突变tRNA的翻译系统。本公开还提供了使用所述翻译系统产生肽或肽文库的方法。本公开还提供了通过所述方法产生的肽或肽文库。

在本公开中,可以在tRNA的34位引入胍丁胞苷(基于tRNA编号规则)。在一个实施方案中,根据tRNA编号规则在34位引入胍丁胞苷的突变tRNA可以通过制备一种或多种(例如2、3、4、5或更多)tRNA核酸片段和胍丁胞苷-二磷酸,并通过本领域技术人员已知的方法连接它们来获得。具体地,例如,由tRNA胍丁胞苷二磷酸的1至33位的碱基组成的核酸片段,以及由tRNA的35至76位(或tRNA的35至75位,或tRNA的第35至74位)的碱基组成的核酸片段从5'侧按此顺序连接。3'端的CA序列可去除。

本公开的化合物可以是游离体或盐。本公开的化合物的盐的实例包括以下:盐酸盐;氢溴酸盐;氢碘酸盐;磷酸盐;膦酸盐;硫酸盐;磺酸盐例如甲磺酸盐、对甲苯磺酸盐;羧酸盐例如乙酸盐、柠檬酸盐、苹果酸盐、酒石酸盐、琥珀酸盐、水杨酸盐;碱金属盐,如钠盐和钾盐;碱土金属盐例如镁盐、钙盐;铵盐,例如铵盐、烷基铵盐、二烷基铵盐、三烷基铵盐和四烷基铵盐。本公开的化合物的盐例如通过使本公开的化合物与酸或碱接触而制备。本公开的化合物可以是水合物,并且这样的水合物也包括在本公开的化合物的盐中。此外,本发明化合物可以是溶剂化物,此类溶剂化物也包括在本公开化合物的盐中。

一方面,本发明涉及制备由下式A表示的赖胞苷二磷酸或其衍生物,或胍丁胞苷二磷酸或其衍生物的方法。

在式A中,R1和R2各自独立地为H或C1-C3烷基,优选R1和R2均为H。

在式A中,L是C2-C6直链亚烷基或C2-C6直链亚烯基,任选被一个或多个选自由羟基和C1-C3烷基组成的组的取代基取代,其中C2-C6直链亚烷基的碳原子任选地被一个氧原子或硫原子取代。C2-C6直链亚烷基优选为C4-C5直链亚烷基,C2-C6直链亚烯基优选为C4-C5直链亚烯基。这样的L的具体实例包括-(CH2)3-、-(CH2)4-、-(CH2)5、-(CH2)2-O-CH2-、-(CH2)2-S-CH2-、-CH2CH(OH)(CH2)2-和-CH2CH=CH-(顺式或反式)。

在式A中,M是单键,

其中波浪线表示与碳原子的连接点,*表示与氢原子的连接点,**表示与氮原子的连接点。当M为单键时,与M相连的H不存在。例如,当M是

式A化合物可表示如下:

当M是

式A化合物可表示如下:

当M为单键时,式A化合物可表示为:

式A表示的化合物优选为赖胞苷二磷酸、胍丁胞苷二磷酸或其盐。

在一些实施方案中,式A化合物可根据如下所示的方案1制备。

方案I:

方案1的步骤1为将式B1表示的化合物分子内环化得到式C1表示的化合物的步骤。该步骤可以通过在溶剂中的分子内环化试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,将反应混合物搅拌15分钟至48小时来进行。

由式B1表示的化合物可以从商业供应商处获得,或者它们可以使用文献中已知的方法生产。式B1中的PG11为氨基的保护基团,只要不干扰根据上述方案1的反应进程,任何保护基团都可以使用;例如,优选不被酸或氟离子脱保护的保护基团。PG11的具体实例包括对溴苯甲酰基、任选取代的苯甲酰基、吡啶羰基和乙酰基。

分子内环化试剂没有特别限制,但可以优选使用偶氮二羧酸二异丙酯和三苯基膦。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂和酮溶剂,并且可以优选使用二氯甲烷。

方案1的步骤2为将式D1表示的胺引入式C1表示的化合物中,得到式E1表示的化合物的步骤。该步骤可以通过在溶剂中引入胺的试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,将反应混合物搅拌15分钟至48小时来进行。

胺引入试剂没有特别限制,但可以优选使用氯化锂和DBU。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂和酮溶剂,并且在该步骤中优选使用四氢呋喃。

方案1的步骤3A和3B为将PG12和/或PG13引入式E1表示的化合物中,得到式F1A或F1B表示的化合物的步骤。当式E1的R2为烷基时,仅引入PG13得到式F1A;当式E1的R2为氢时,引入PG12和PG13得到式F1B。该步骤可以通过在用于在溶剂中引入保护基团的试剂的存在下,在-20℃至大约溶剂沸点的温度,优选在0℃至180℃,将反应混合物搅拌15分钟至48小时来进行。

PG12为氨基的保护基团,PG13为羧基或亚氨基的保护基团。这些保护基团可以使用任何保护基团,只要它不干扰根据上述方案1的反应进程;例如,优选不被酸或氟离子脱保护的保护基团。Fmoc优选用作PG12;当M是

甲基、乙基或任选取代的苄基优选用作PG13,并且当M是

任选取代的苄基、Cbz或任选取代的苄氧羰基优选用作PG13。PG12和PG13可以同时或顺序引入。当它们依次引入时,可以先引入PG12或PG13,但优选先引入PG12,然后引入PG13。对于保护基团的引入,例如可以使用“Greene's,“Protective Groups in OrganicSynthesis”(第5版,John Wiley&Sons 2014)”中描述的方法;并且,当PG12为Fmoc时,优选使用(2,5-二氧代吡咯烷-1-基)(9H-芴-9-基)甲基碳酸酯和碳酸钠引入Fmoc,当PG13为甲基时,优选使用N,N'-二异丙基碳二亚胺、甲醇和N,N-二甲基-4-氨基吡啶引入甲基。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂和酮溶剂。引入Fmoc时优选使用二氧杂环己烷,引入甲基时优选使用二氯甲烷。

方案1的步骤4A和4B为从式F1A或F1B表示的化合物中去除丙酮化合物并引入PG14和PG15得到式G1A或G1B表示的化合物的步骤。可以在酸的存在下去除丙酮化合物,并且可以在用于引入保护基团的试剂的存在下通过在-20℃至大约溶剂沸点的温度,优选0℃至180℃下在溶剂中搅拌反应混合物15分钟至48小时来引入保护基团。

PG14和PG15各自独立地为羟基的保护基团,只要不干扰根据上述方案1的反应进程,任何保护基团都可以使用;例如,优选使用被氟离子脱保护的甲硅烷基保护基团。优选PG14和PG15一起形成二价保护基团,这种保护基团的具体实例包括二叔丁基甲硅烷基。对于丙酮化合物的去除和保护基团的引入,例如可以使用“Greene's,“Protective Groups inOrganic Synthesis”(第5版,John Wiley&Sons 2014)”中描述的方法;用于去除丙酮化合物的酸优选为TFA。当PG14和PG15一起形成二叔丁基甲硅烷基时,优选通过使用二叔丁基甲硅烷基双(三氟甲磺酸酯)引入二叔丁基甲硅烷基。

作为用于去除丙酮化合物的溶剂,实例包括水和羧酸溶剂,优选使用水和TFA的混合溶剂。此外,作为用于引入PG14和PG15的溶剂,实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和酰胺溶剂,优选使用DMF。

方案1的步骤5A和5B为将PG16引入式G1A或G1B表示的化合物中,得到式H1A或H1B表示的化合物的步骤。PG16可以通过在用于在溶剂中引入保护基团的试剂的存在下,在-20℃至大约溶剂沸点的温度,优选0℃至180℃的温度下,搅拌反应混合物15分钟至48小时来引入。

PG16是羟基和/或氨基的保护基团,只要不干扰根据上述方案1的反应进程,任何保护基团都可以使用;例如,优选使用不被氟离子脱保护的保护基团。TOM优选用于PG16。对于保护基团的引入,例如可以使用“Greene's,“Protective Groups in Organic Synthesis”(第5版,John Wiley&Sons 2014)”中描述的方法;当PG16为TOM时,优选使用DIPEA和(三异丙基甲硅烷氧基)甲基氯引入TOM。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和酰胺溶剂,优选使用二氯甲烷。

方案1的步骤6A和6B为从式G1A或G1B表示的化合物中去除PG14和PG15得到式I1A或I1B表示的化合物的步骤。PG14和PG15可以通过在溶剂中脱保护试剂的存在下,在-20℃至大约溶剂沸点的温度下,优选在0℃至180℃下搅拌反应混合物15分钟至48小时来去除。

任何试剂都可以用作脱保护试剂,只要能仅选择性去除PG14和PG15即可;然而,当PG14和PG15一起形成二叔丁基甲硅烷基时,优选使用产生氟离子的试剂,或更具体地,例如氟化氢吡啶络合物将其除去。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和酰胺溶剂,优选使用THF。

方案1的步骤7A和7B为式I1A或I1B表示的化合物的亚磷酸酯化,随后氧化得到式J1A或J1B表示的化合物的步骤。亚磷酸酯化可以通过在溶剂中亚磷酸酯化试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,搅拌反应混合物15分钟至48小时来进行。氧化可通过在溶剂中氧化剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,搅拌反应混合物15分钟至48小时来进行。可以在亚磷酸酯化后分离该化合物,但优选在一锅中进行亚磷酸酯化反应和氧化反应。

式J1A或J1B中,PG17为羟基的保护基团,只要不干扰根据上述方案1的反应进程,可以使用任何保护基团;例如,可以与PG11、PG12和PG13同时脱保护的保护基团是优选的。PG17的具体实例包括氰乙基。可以使用羟基被保护基团保护的亚磷酸酯化试剂,或者可以使用未保护的亚磷酸酯化试剂,然后可以将保护基团引入羟基。对于保护基团的引入,例如可以使用“Greene's,“Protective Groups in Organic Synthesis”(第5版,John Wiley&Sons2014)”中描述的方法。当使用具有被氰乙基保护的羟基的亚磷酸酯化试剂时,优选使用双(2-氰乙基)-N,N-二异丙基氨基亚磷酰胺作为亚磷酸酯化试剂。亚磷酸酯化后的氧化中使用的氧化剂没有特别限制,优选使用叔丁基过氧化氢。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和腈溶剂,优选使用乙腈。

方案1的步骤8A和8B为从式J1A表示的化合物中去除PG11、PG12、PG13和PG17,或从式J1B表示的化合物中去除PG11、PG13和PG17,得到式K1表示的化合物的步骤。这些保护基团可以通过在溶剂中脱保护试剂的存在下,在-20℃至大约溶剂沸点,优选在0℃至180℃下的温度下搅拌反应混合物15分钟至48小时来去除。

任何试剂均可用作脱保护试剂,只要它能够选择性地去除上述保护基团即可。这种试剂的具体实例包括组合使用双-(三甲基甲硅烷基)乙酰胺和DBU。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂、腈溶剂和胺溶剂,优选使用吡啶。

方案1的步骤9为从式K1表示的化合物中去除PG16得到式A表示的化合物的步骤。PG16可以通过在溶剂中脱保护剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下将反应混合物搅拌15分钟至48小时来去除。

脱保护试剂可以使用任何试剂,只要能够选择性地仅去除PG16即可,优选使用氟化铵。

溶剂的实例包括水、卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和腈溶剂,并且可以优选使用由水和乙腈组成的组合溶剂。

在某一实施方案中,式A的化合物可根据如下所示的方案2制备。

方案2:

方案2的步骤1为将式B2表示的化合物分子内环化得到式C2表示的化合物的步骤。该步骤可以通过在溶剂中分子内环化试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,将反应混合物搅拌15分钟至48小时来进行。

由式B2表示的化合物可以从商业供应商处获得,或者它们可以使用文献中已知的方法生产。式B2中的PG21为氨基的保护基团,只要不影响根据上述方案2的反应进程,任何保护基团都可以使用;例如,优选不被酸或氟离子脱保护的保护基团。PG21的具体实例包括Cbz、任选取代的苄氧羰基和任选取代的苄基。

分子内环化试剂没有特别限制,但可以优选使用偶氮二羧酸二异丙酯和三苯基膦。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂和酮溶剂,并且可以优选使用二氯甲烷。

方案2的步骤2为将式D2A或D2B表示的胺引入式C2表示的化合物中,得到式E2A或E2B表示的化合物的步骤。该步骤可以通过在溶剂中引入胺的试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,将反应混合物搅拌15分钟至48小时来进行。

胺引入试剂没有特别限制,但可以优选使用氯化锂和DBU。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂和酮溶剂,并且在该步骤中优选使用THF。

方案2的步骤3A和3B为从式E2A或E2B表示的化合物中去除丙酮化合物并引入PG24和PG25得到式F2A或F2B表示的化合物的步骤。可以在酸的存在下去除丙酮化合物,可以在溶剂中用于引入保护基团的试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,将反应混合物搅拌15分钟至48小时,引入保护基团。

PG24和PG25各自独立地为羟基的保护基团,只要不干扰根据上述方案2的反应进程,任何保护基团都可以使用;例如,优选使用被氟离子脱保护的甲硅烷基保护基团。优选PG24和PG25一起形成二价保护基团,这种保护基团的具体实例包括二叔丁基甲硅烷基。对于丙酮化合物的去除和保护基团的引入,例如可以使用“Greene's,“Protective Groups inOrganic Synthesis”(第5版,John Wiley&Sons 2014)”中描述的方法;用于去除丙酮化合物的酸优选为TFA。当PG24和PG25一起形成二叔丁基甲硅烷基时,优选通过使用二叔丁基甲硅烷基双(三氟甲磺酸酯)引入二叔丁基甲硅烷基。

作为用于去除丙酮化合物的溶剂,实例包括水和羧酸溶剂,优选使用水和TFA的混合溶剂。作为用于引入PG24和PG25的溶剂,实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和酰胺溶剂,优选使用DMF。

方案2的步骤4A和4B为将PG26引入式F2A或F2B表示的化合物中,得到式G2A或G2B表示的化合物的步骤。PG26可以通过在溶剂中用于引入保护基团的试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,搅拌反应混合物15分钟至48小时来引入。

PG26是羟基的保护基团,只要不影响根据上述方案2的反应进程,任何保护基团都可以使用;例如,没有被氟离子脱保护的保护基团是优选的。PG26优选四氢吡喃基、四氢呋喃基或甲氧基甲基。对于保护基团的引入,例如可以使用“Greene's,“Protective Groups inOrganic Synthesis”(第5版,John Wiley&Sons 2014)”中描述的方法;当PG16是四氢吡喃基时,优选使用TFA和3,4-二氢-2H-吡喃引入四氢吡喃基。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和酰胺溶剂,优选使用二氯甲烷。

方案2的步骤5A和5B为从式G2A或G2B表示的化合物中去除PG24和PG25得到式H2A或H2B表示的化合物的步骤。PG24和PG25可以通过在溶剂脱保护试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下搅拌反应混合物15分钟至48小时来去除。

脱保护试剂可以使用任何试剂,只要其能仅选择性去除PG24和PG25;然而,当PG24和PG25一起形成二叔丁基甲硅烷基时,优选使用产生氟离子的试剂,或更具体地,例如四丁基氟化铵来去除。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和酰胺溶剂,优选使用THF。

方案2的步骤6A和6B为式H2A或H2B表示的化合物的亚磷酸酯化,随后氧化得到式I2A或I2B表示的化合物的步骤。亚磷酸酯化可以通过在溶剂中亚磷酸酯化试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,搅拌反应混合物15分钟至48小时来进行。氧化可通过在溶剂中氧化试剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下,搅拌反应混合物15分钟至48小时来进行。可以在亚磷酸酯化后分离该化合物,但优选在一锅中进行亚磷酸酯化反应和氧化反应。

式I2A或I2B中,PG27为羟基的保护基团,只要不干扰根据上述方案2的反应进程,任何保护基团均可使用,优选可以与PG21、PG22和PG23同时脱保护的保护基团。PG27的具体实例包括苄基。可以使用羟基被保护基团保护的亚磷酸酯化试剂,或者可以使用未保护的亚磷酸酯化试剂,然后可以将保护基团引入羟基。对于保护基团的引入,例如可以使用“Greene's,“Protective Groups in Organic Synthesis”(第5版,John Wiley&Sons 2014)”中描述的方法。当使用具有被苄基保护的羟基的亚磷酸酯化试剂时,优选使用二苄基-N,N-二异丙基亚磷酰胺作为亚磷酸酯化试剂。亚磷酸酯化后的氧化中使用的氧化剂没有特别限制,但优选使用戴斯-马丁periodinane(Dess-Martin periodinane)。

溶剂的实例包括卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和腈溶剂,优选使用乙腈。

方案2的步骤7A和7B为从式I2A表示的化合物中去除PG21、PG22、PG23和PG27,或者从式I2B表示的化合物中去除PG21、PG23和PG27,得到式J2表示的化合物的步骤。这些保护基团可以通过在溶剂中脱保护试剂的存在下,在-20℃至大约溶剂沸点,优选在0℃至180℃下的温度下搅拌反应混合物15分钟至48小时来去除。

任何方法都可以用于脱保护,只要可以选择性地去除上述保护基团即可。这种方法的具体实例包括催化氢化。对于催化氢化,可以优选使用Pd催化剂,例如钯-碳。

溶剂的实例包括水、醇溶剂、卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂、腈溶剂和胺溶剂,优选使用由水和甲醇组成的组合溶剂。

方案2的步骤8为从式J2表示的化合物中去除PG26得到式A表示的化合物的步骤。PG26可以通过在溶剂中脱保护剂的存在下,在-20℃至大约溶剂沸点,优选0℃至180℃的温度下将反应混合物搅拌15分钟至48小时来去除。

脱保护试剂可以使用任何试剂,只要能够选择性地去除PG26即可,优选使用盐酸。

溶剂的实例包括水、卤化溶剂、醚溶剂、苯溶剂、酯溶剂、酮溶剂和腈溶剂,并且可以优选使用水。

本说明书中引用的所有现有技术文献均通过引用纳入本文。

实施例

本发明通过以下实施例进一步说明,但不限于此。

在实施例中使用了以下缩写。

AA:乙酸铵

CH2CN:氰甲基

DBU:1,8-二氮杂二环[5.4.0]-7-十一碳烯

DCM:二氯甲烷

DIC:N,N-二异丙基碳二亚胺

DIPEA:N,N-二异丙基乙胺

DMF:二甲基甲酰胺

DMSO:二甲基亚砜

FA:甲酸

Fmoc:9-芴基甲氧羰基基团

F-Pnaz:4-(2-(4-氟苯基)乙酰氨基)苄氧羰基基团

HFIP:1,1,1,3,3,3-六氟-2-丙醇

MeCN:乙腈

NMP:N-甲基-2-吡咯烷酮

TEA:三乙胺

TFA:三氟乙酸

TFE:2,2,2-三氟乙醇

THF:四氢呋喃

在该实施例中使用了以下缩写。Gly或G(甘氨酸)、Ile或I(异亮氨酸)、Leu或L(亮氨酸)、Phe或F(苯丙氨酸)、Pro或P(脯氨酸)、Thr或T(苏氨酸)。除此之外,还使用了表2中所示的缩写。

[表2]

LCMS分析条件如下表3所示。

[表3]

实施例1通过连接法在tRNA片段的3'末端引入尿苷单元的尿苷二磷酸的合成

为了通过连接法在tRNA片段的3'末端引入尿苷单元,参考文献(Nucleic AcidsResearch 2003,31(22),e145)中记载的方法合成了尿苷二磷酸(SS01,pUp)。

((2R,3S,4R,5R)-5-(2,4-二氧-3,4-二氢嘧啶-1(2H)-基)-4-羟基-3-(膦酰氧基) 四氢呋喃-2-基)甲基二氢磷酸酯(化合物SS02)和((2R,3R,4R,5R)-5-(2,4-二氧-3,4-二氢 嘧啶-1(2H)-基))-3-羟基-4-(膦酰氧基)四氢呋喃-2-基)甲基二氢磷酸酯(化合物SS03)的 混合物(化合物SS01,pUp)的合成

1-((2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮(10mg,0.041mmol)和焦磷酸四氯化物(56.6μL,0.409mmol)在冰浴中混合。在0℃下搅拌反应混合物5小时后,在冰冷却下加入冰冷却的纯水(38mL)和三乙基碳酸氢铵缓冲液(1M,2mL)。混合物通过DEAE-Sephadex A-25柱层析(0.05M三乙基碳酸氢铵缓冲液→1M三乙基碳酸氢铵缓冲液)纯化,并将收集的溶液减压浓缩。将得到的残渣用反相硅胶柱色谱法(15mM TEA和400mM HFIP的水溶液/15mM TEA和400mM HFIP的甲醇溶液)纯化,得到((2R,3S,4R,5R)-5-(2,4-二氧-3,4-二氢嘧啶-1(2H)-基)-4-羟基-3-(膦酰氧基)四氢呋喃-2-基)甲基二氢磷酸酯(化合物SS02)和((2R,3R,4R,5R)-5-(2,4-二氧-3,4-二氢嘧啶-1(2H)-基)-3-羟基-4-(膦酰氧基)四氢呋喃-2-基)甲基二氢磷酸酯(化合物SS03)(100μL,40.30mM)的混合物(化合物SS01,pUp)的水溶液。

LCMS(ESI)m/z=403(M-H)-

保留时间:1.79分钟、1.89分钟(分析条件LTQTEA/HFIP05_01)

实施例2通过连接法在tRNA片段的3'末端引入赖胞苷单元的赖胞苷二磷酸的合成

为了通过连接方法在tRNA片段的3'末端引入赖胞苷单位,合成了赖胞苷的二磷酸。更具体地,根据以下方案合成赖胞苷二磷酸(SS04,pLp)。

N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基四氢呋 喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2(1H)-亚基)-L-赖氨酸2,2,2-三氟乙酸盐 (化合物SS05)的合成

在氮气氛下,将THF(6.7mL)加入(((9H-芴-9-基)甲氧基)羰基)-L-赖氨酸盐酸盐(813mg,2.01mmol)、氯化锂(213mg,5.02mmol)和通过文献(Org.Lett.2012,14(16),4118-4121)中描述的方法在室温合成的N4-对溴苯甲酰基-2',3'-O-异亚丙基-O2,5'-环胞苷(300mg,0.067mmol)的混合物中。在冰浴中冷却混合物后,加入DBU(1.50mL,10.04mmol)。反应混合物在0℃搅拌1小时,然后通过反相硅胶柱色谱法(0.1%FA水溶液/0.1%FA-乙腈溶液)纯化得到N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基四氢呋喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2(1H)-亚基)-L-赖氨酸2,2,2-三氟乙酸盐(化合物SS05)(335.6mg,71%)。

LCMS(ESI)m/z=594(M+H)+

保留时间:0.41分钟(分析条件SQDFA05_01)

N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R, 6aR)-6-(羟甲基)2,2-二甲基四氢呋喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2 (1H)-亚基)-L-赖氨酸2,2,2-三氟乙酸盐(化合物SS06)的合成

N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基四氢呋喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2(1H)-亚基)-L-赖氨酸2,2,2-三氟乙酸盐(化合物SS05)(311.12mg,0.44mmol)和(2,5-二氧代吡咯烷-1-基)(9H-芴-9-基)甲基碳酸酯(148.09mg,0.44mmol)在室温下溶解在1,4-二噁烷(2.75mL)和超纯水(1.65mL)的混合溶剂中。用冰浴冷却混合物后,加入碳酸钠(186.22mg,1.76mmol),然后将混合物升温至室温并在室温下搅拌2小时。浓缩反应溶液,残渣用反相硅胶柱色谱法(0.05%TFA水溶液/0.05%TFA-乙腈溶液)纯化,得到N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基四氢呋喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2(1H)-亚基)-L-赖氨酸2,2,2-三氟乙酸盐(化合物SS06)(328.78mg,80%)。

LCMS(ESI)m/z=816(M+H)+

保留时间:0.68分钟(分析条件SQDFA05_01)

N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R, 6aR)-6-(羟甲基)-2,2-二甲基四氢呋喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2 (1H)-亚基)-L-赖氨酸甲酯2,2,2-三氟乙酸盐(化合物SS07)的合成

在氮气氛下,将N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R,6aR)-6-(羟甲基))-2,2-二甲基四氢呋喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2(1H)-亚基)-L-赖氨酸2,2,2-三氟乙酸盐(化合物SS06)(438.60mg,0.47mmol)在室温下溶解在DCM(4.71mL)中。在冰浴中冷却混合物后,加入N,N'-二异丙基碳二亚胺(221.40μL,1.41mmol)、甲醇(382.07μL,9.42mmol)和N,N-二甲基-4-氨基吡啶(11.51mg,0.09mmol),然后将混合物温热至室温,并在室温下搅拌2小时。浓缩反应溶液,残渣用反相硅胶柱色谱法(0.05%TFA水溶液/0.05%TFA-乙腈溶液)纯化,得到N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基四氢呋喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯2,2,2-三氟乙酸盐(化合物SS07)(405.00mg,91%)。

LCMS(ESI)m/z=828(M-H)-

保留时间:0.76分钟(分析条件SQDFA05_02)

N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((2R,3R,4S,5R)- 3,4-二羟基-5-(羟甲基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯2,2,2-三氟乙 酸盐(化合物SS08)的合成

将N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基四氢呋喃并[3,4-d][1,3]间二氧杂环戊烷-4-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯2,2,2-三氟乙酸盐(化合物SS07)(308.70mg,0.33mmol)溶解在TFA(8.71mL)和超纯水(4.36mL)的混合溶剂中,同时在冰浴中冷却,并将混合物在室温下搅拌45分钟。将反应溶液浓缩得到粗产物,N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯2,2,2-三氟乙酸盐(化合物SS08)(296.00mg)。所得粗产物N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯2,2,2-三氟乙酸酯(化合物SS08)直接用于下一步骤。

LCMS(ESI)m/z=790(M+H)+

保留时间:0.70分钟(分析条件SQDFA05_02)

N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((4aR,6R,7R, 7aS)-2,2-二叔丁基-7-羟基四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷 (dioxasilin)-6-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS09)的合成

在氮气氛下,将上一步骤得到的粗产物,N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲基2,2,2--三氟乙酸盐(化合物SS08)(296.00mg(0.33mmol),在室温下溶解在DMF(3.27mL)中。在冰浴中冷却混合物后,加入二叔丁基甲硅烷基双(三氟甲磺酸酯)(211.80μL,0.65mmol),并将混合物在冰浴中搅拌1小时。进一步加入二叔丁基甲硅烷基双(三氟甲磺酸酯)(158.85μL,0.49mmol),并将混合物在冰浴中搅拌30分钟。反应溶液中加入饱和碳酸氢钠水溶液,所得混合物用DCM进行萃取操作,有机层用饱和盐水洗涤。得到的有机层用无水硫酸钠干燥,过滤,然后减压浓缩。所得残渣通过正相硅胶柱色谱法(正己烷/乙酸乙酯、二氯甲烷/甲醇)纯化,得到N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((4aR,6R,7R,7aS)-2,2-二叔丁基-7-羟基四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxasilin)-6-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS09)(273.80mg,90%,2步)。

LCMS(ESI)m/z=928.5(M-H)-

保留时间:0.92分钟(分析条件SQDFA05_02)

N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴-N-(((三异丙基甲硅烷基)氧基) 甲基)苯甲酰氨基)-1-((4aR,6R,7R,7aR)-2,2-二叔丁基-7-((((三异丙基甲硅烷基)氧基) 甲氧基)四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxasilin)-6-基)嘧啶-2 (1H)-亚基)-L-赖氨酸甲酯(化合物SS10))的合成

在氮气氛下,将N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴苯甲酰氨基)-1-((4aR,6R,7R,7aS)-2,2-二叔丁基-7-羟基四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxasilin)-6-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS09)(386.15mg,0.42mmol)在室温下溶解在DCM(8.30mL)中,并加入DIPEA(722.88μL,4.15mmol)和(三异丙基甲硅烷氧基)甲基氯(481.40μL,2.07mmol)。将反应混合物在45℃下搅拌三小时,然后回到室温,加入DIPEA(722.88μL,4.15mmol)和(三异丙基甲硅烷氧基)甲基氯(481.40μL,2.07mmol),并将反应混合物在45℃搅拌四个小时。将混合物返回至室温后,加入DMSO,通氮气除去DCM,所得DMSO溶液经反相硅胶柱色谱(0.05%TFA水溶液/0.05%TFA-乙腈溶液)纯化。所得级分用饱和碳酸氢钠中和,目标化合物用乙酸乙酯萃取。得到的有机层用无水硫酸钠干燥,过滤,然后减压浓缩得到N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴-N-((((三异丙基甲硅烷基)氧基)甲基)苯甲酰氨基)-1-((4aR,6R,7R,7aR)-2,2-二叔丁基-7-(((三异丙基甲硅烷基)氧基)甲氧基)四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxasilin)-6-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS10)(291.55mg,54%)。

LCMS(ESI)m/z=1303(M+H)+

保留时间:0.84分钟(分析条件SQDFA50)

N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴-N-(((三异丙基甲硅烷基)氧基) 甲基)苯甲酰氨基)-1-((2R,3R,4R,5R)-4-羟基-5-(羟甲基)-3-((((三异丙基甲硅烷基)氧 基)甲氧基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS11)的合成

在氮气氛下,将N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴-N-((((三异丙基甲硅烷基)氧基)甲基)苯甲酰氨基)-1-((4aR,6R,7R,7aR)-2,2-二叔丁基-7-(((三异丙基甲硅烷基)氧基)甲氧基)四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxasilin)-6-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS10)(141.55mg,0.11mmol)溶解在THF(2.17mL)中,并冷却至-80℃。在-80℃下加入用吡啶(134.41μL)稀释的氟化氢吡啶复合物(约30%吡啶,约70%氟化氢)(9.85μL),并将反应混合物在-15℃下搅拌15分钟。冷却至-80℃后,加入甲氧基三甲基硅烷(7.0mL),所得混合物通过反相硅胶柱色谱法(0.05%TFA水溶液/0.05%TFA-乙腈溶液)纯化。所得级分用饱和碳酸氢钠中和,目标化合物用乙酸乙酯萃取。得到的有机层用无水硫酸钠干燥,过滤,然后加入甲苯,减压浓缩所述混合物得到粗产物,N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴-N-(((三异丙基甲硅烷基)氧基)甲基)苯甲酰氨基)-1-((2R,3R,4R,5R)-4-羟基-5-(羟甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS11)(61.53mg)。所得粗产物N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴-N-(((三异丙基甲硅烷基)氧基)甲基)苯甲酰氨基)-1-((2R,3R,4R,5R)-4-羟基-5-(羟甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS11)直接用于下一步骤。

LCMS(ESI)m/z=1162.8(M+H)+

保留时间:3.69分钟(分析条件SQDFA05long)

N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(1-((2R,3R,4R,5R)-4-((双(2-氰基乙氧 基)磷酰基)氧基)-5-((((双(2-氰基乙氧基)磷酰基)氧基)甲基)-3-((((三异丙基甲硅烷 基)氧基)甲氧基)四氢呋喃-2-基)-4-(4-溴-N-(((三异丙基甲硅烷基)氧基)甲基)苯甲酰 氨基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS12)的合成

在氮气氛下,将粗产物N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(4-(4-溴-N-(((三异丙基甲硅烷基)氧基)甲基)苯甲酰氨基)-1-((2R,3R,4R,5R)-4-羟基-5-(羟甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS11)(61.53mg,0.053mmol)和1H-四唑(44.48mg,0.64mmol)在室温下溶解在乙腈(3.53mL)中。冰浴冷却混合物后,加入双(2-氰乙基)-N,N-二异丙基氨基亚磷酰胺(82.77μL,0.32mmol),将混合物升温至室温,室温搅拌3小时。室温下加入叔丁基过氧化氢5-6M的癸烷溶液(303.92μL,3.17mmol),搅拌10分钟后,浓缩反应溶液,所得残渣经正相硅胶柱色谱(正己烷/乙酸乙酯、二氯甲烷/甲醇)纯化得到粗产物,N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(1-((2R,3R,4R,5R)-4-(((双(2-氰基乙氧基)磷酰基)氧基)-5-((((双(2-氰基乙氧基)磷酰基)氧基)甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2-基)-4-(4-溴-N-(((三异丙基甲硅烷基)氧基)甲基)苯甲酰氨基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS12)(54.33mg)。所得粗产物N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(1-((2R,3R,4R,5R)-4-((双(2-氰基乙氧基)磷酰基)氧基)-5-(((双(2-氰基乙氧基)磷酰基)氧基)甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2-基)-4-(4-溴-N-(((三异丙基甲硅烷基)氧基)甲基)苯甲酰氨基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS12)直接用于下一步骤。

LCMS(ESI)m/z=1534.9(M+H)+

保留时间:3.62分钟(分析条件SQDFA05long)

N6-(1-((2R,3R,4R,5R)-4-(膦酰氧基)-5-((膦酰氧基)甲基)-3-((((三异丙基甲 硅烷基)氧基)甲氧基)四氢呋喃-2-基)-4-((((三异丙基甲硅烷基)氧基)甲基)氨基)嘧啶- 2(1H)-亚基)-L-赖氨酸(化合物SS13)的合成

在氮气氛下,将粗产物N2-(((9H-芴-9-基)甲氧基)羰基)-N6-(1-((2R,3R,4R,5R)-4-((双(2-氰基乙氧基)磷酰基)氧基)-5-((((双(2-氰基乙氧基)磷酰基)氧基)甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2-基)-4-(4-溴-N-(((三异丙基甲硅烷基)氧基)甲基)苯甲酰氨基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS12)(54.33mg,0.035mmol),在室温下溶解在吡啶(2.36mL)中,加入双(三甲基甲硅烷基)乙酰胺(345.98μL,1.42mmol)和DBU(84.64μL,0.57mmol),将混合物在室温搅拌45分钟。向反应溶液中加入超纯水,用乙醚和正己烷洗涤。将所得水层加入甲苯和乙腈,减压浓缩得到粗产物,N6-(1-((2R,3R,4R,5R)-4-(膦酰氧基)-5-((膦酰氧基)甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2-基)-4-(((((三异丙基甲硅烷基)氧基)甲基)氨基)嘧啶-2(1H)-亚基)-L-赖氨酸(化合物SS13)。所得粗产物N6-(1-((2R,3R,4R,5R)-4-(膦酰氧基)-5-((膦酰氧基)甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2)-基)-4-(((((三异丙基甲硅烷基)氧基)甲基)氨基)嘧啶-2(1H)-亚基)-L-赖氨酸(化合物SS13)直接用于下一步骤。

LCMS(ESI)m/z=904.7(M+H)+

保留时间:0.79分钟(分析条件SQDFA05_02)

N6-(4-氨基-1-((2R,3R,4S,5R)-3-羟基-4-(膦酰氧基)-5-((膦酰氧基)甲基)四 氢呋喃-2-基)嘧啶2(1H)-亚基)-L-赖氨酸(化合物SS04,pLp)的合成

将粗产物N6-(1-((2R,3R,4R,5R)-4-(膦酰氧基)-5-((膦酰氧基)甲基)-3-((((三异丙基甲硅烷基)氧基)甲氧基)四氢呋喃-2-基)-4-(((((三异丙基甲硅烷基)氧基)甲基)氨基)嘧啶-2(1H)-亚基)-L-赖氨酸甲酯(化合物SS13),在室温溶解在乙腈(885μL)和超纯水的混合溶剂中(885μL),加入氟化铵(15.73mg,0.43mmol),将混合物在60℃搅拌2.5小时。将混合物恢复至室温后,加入另外的氟化铵(15.73mg,0.43mmol),并将混合物在60℃下搅拌1小时。返回室温后,通氮气除去乙腈,所得水溶液经反相硅胶柱色谱纯化(15mM TEA和400mM HFIP的水溶液/15mM TEA和400mM HFIP的甲醇溶液)得到N6-(4-氨基-1-((2R,3R,4S,5R)-3-羟基-4-(膦酰氧基)-5-((膦酰氧基)甲基)四氢呋喃-2-基)嘧啶-2(1H)-亚基)-L-赖氨酸(化合物SS04,pLp)(100μL,17.20mM)的水溶液。

LCMS(ESI)m/z=530(M-H)-

保留时间:1.64分钟(分析条件LTQTEA/HFIP05_02)

实施例3通过连接法在tRNA片段的3'末端引入赖胞苷单元的赖胞苷二磷酸的合 成——备选方法

改进了通过连接法合成用于在tRNA片段的3'末端引入赖胞苷单元的赖胞苷的二磷酸酯的方法。更具体地,根据以下方案合成赖胞苷二磷酸(SS04,pLp)。

苄基((3aR,4R,12R,12aR)-2,2-二甲基-3a,4,12,12a-四氢-5H,8H-4,12-环氧[1, 3]间二氧杂环戊烷并(dioxolo)[4,5-e]嘧啶并[2,1-b][1,3]氧杂环辛烷(oxazocin)-8-亚 基)氨基甲酸酯(化合物SS24)的合成

在氮气氛下,在室温下,将DCM(17.2mL)加入到2',3'-O-异亚丙基-4-N-(苄基-氧基-羰基)-胞苷(718.2mg,1.72mmol)和三苯基膦(474mg,1.81mmol)的混合物中,2',3'-O-异亚丙基-4-N-(苄基-氧基-羰基)-胞苷是文献(Antiviral Chemistry&Chemotherapy,2003,14(4),183-194)-已知化合物。在冰浴中冷却混合物后,加入偶氮二碳酸二异丙酯(385μL,1.98mmol),然后将混合物温热至室温,并在室温下搅拌1.5小时。浓缩反应溶液,加入甲苯(20mL),然后通过过滤回收产生的沉淀物。所得固体用甲苯洗涤3次,得到苄基((3aR,4R,12R,12aR)-2,2-二甲基-3a,4,12,12a-四氢-5H,8H-4,12-环氧[1,3]间二氧杂环戊烷并(dioxolo)[4,5-e]嘧啶并[2,1-b][1,3]氧杂环辛烷(oxazocin)-8-亚基)氨基甲酸酯(化合物SS24)(525.7mg,76%)。

LCMS(ESI)m/z=400.3(M+H)+

保留时间:0.48分钟(分析条件SQDFA05_02)

苄基(2S)-6-[[1-[(3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基-3a,4,6,6a-四氢 呋喃并[3,4-d][1,3]二氧杂环戊烷-4-基]-4-(苄氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄 氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS25)的合成

在氮气氛下,在室温下,将THF(7.5)加入苄基((3aR,4R,12R,12aR)-2,2-二甲基-3a,4,12,12a-四氢-5H,8H-4,12-环氧[1,3]间二氧杂环戊烷并(dioxolo)[4,5-e]嘧啶并[2,1-b][1,3]氧杂环辛烷(oxazocin)-8-亚基)氨基甲酸酯(化合物SS24)(300mg,0.75mmol)和氯化锂(159mg,3.76mmol)的混合物中,将混合物在冰浴中冷却。在冰浴中向该混合物中加入((苄氧基)羰基)-L-赖氨酸苯磺酸酯(813mg,2.01mmol)和加入THF(7.5mL)的DBU(673μL,4.51mmol)的混合物,并将反应混合物在0℃搅拌30分钟。在冰浴中向反应溶液中加入DMSO,将混合物温热至室温,然后将反应溶液浓缩以除去THF。残渣用反相硅胶柱色谱法(0.05%TFA水溶液/0.05%TFA-乙腈溶液)纯化,定量得到苄基(2S)-6-[[1-[(3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基-3a,4,6,6a-四氢呋喃并[3,4-d][1,3]二氧杂环戊烷-4-基]-4-(苄氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS25)(726.6mg)。

LCMS(ESI)m/z=768.6(M-H)-

保留时间:0.74分钟(分析条件SQDFA05_02)

苄基(2S)-2-(苄氧基羰基氨基)-6-[[4-(苄氧羰基氨基)-1-[(2R,3R,4S,5R)-3, 4-二羟基-5-(羟甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸酯;2,2,2-三氟乙酸(化合 物SS26)的合成

将苄基(2S)-6-[[1-[(3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基-3a,4,6,6a-四氢呋喃并[3,4-d][1,3]二氧杂环戊烷-4-基]-4-(苄氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS25)(281.1mg,0.318mmol)溶解在TFA(4.24mL)和超纯水(2.12mL)的混合溶剂中,冰浴冷却,将混合物在室温下搅拌50分钟。加入甲苯和乙腈,浓缩反应溶液。该操作重复多次,蒸出水和TFA,得到粗产物苄基(2S)-2-(苄氧基羰基氨基)-6-[[4-(苄氧羰基氨基)-1-[(2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸酯;2,2,2-三氟乙酸(化合物SS26)(272.6毫克)。所得粗产物苄基(2S)-2-(苄氧羰基氨基)-6-[[4-(苄氧羰基氨基)-1-[(2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸酯;2,2,2-三氟乙酸(化合物SS26)直接用于下一步骤。

LCMS(ESI)m/z=728.5(M-H)-

保留时间:0.69分钟(分析条件SQDFA05_02)

苄基(2S)-6-[[1-[(4aR,6R,7R,7aS)-2,2-二叔丁基-7-羟基-4a,6,7,7a-四氢- 4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxasilin)-6-基]-4-苄氧羰基氨基)嘧 啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS27)的合成

在氮气氛下,上一步骤得到的粗产物,苄基(2S)-2-(苄氧基羰基氨基)-6-[[4-(苄氧羰基氨基)-1-[(2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸酯;2,2,2-三氟乙酸(化合物SS26)(258mg,0.306mmol)溶解在DMF(3.06mL)中。将混合物在冰浴中冷却后,加入二叔丁基甲硅烷基双(三氟甲磺酸酯)(396μL,1.22mmol),并将混合物在冰浴中搅拌2小时。在冰浴中,向反应溶液中加入饱和碳酸氢钠水溶液,所得混合物经反相硅胶柱色谱(0.05%TFA水溶液/0.05%TFA-乙腈溶液)纯化,得到苄基(2S)-6-[[1-[(4aR,6R,7R,7aS)-2,2-二叔丁基-7-羟基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxasilin)-6-基]-4-(苄氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS27)(234.0毫克,78%,两步)。

LCMS(ESI)m/z=868.8(M-H)-

保留时间:0.88分钟(分析条件SQDFA05_02)

苄基(2S)-6-[[1-[(4aR,6R,7R,7aR)-2,2-二叔丁基-7-四氢吡喃-2-基氧基-4a, 6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxacillin)-6-基]-4-(苄 氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物 SS28)的合成

在氮气氛下,在室温下,将苄基(2S)-6-[[1-[(4aR,6R,7R,7aS)-2,2-二叔丁基-7-羟基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxasilin)-6-基]-4-(苄氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS27)(30mg,0.03mmol)和TFA(6.98μL,0.09mmol)溶解在DCM(610μL)中,加入3,4-二氢-2H-吡喃(83μL,0.915mmol)。将反应混合物在室温下搅拌13小时后,加入甲苯,将反应溶液浓缩得到粗产物,苄基(2S)-6-[[1-[(4aR,6R,7R,7aR)-2,2-二叔丁基-7-四氢吡喃-2-基氧基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxacillin)-6-基]-4-(苄氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS28),作为衍生自THP保护基团上的不对称碳的非对映异构体的混合物。所得粗产物苄基(2S)-6-[[1-[(4aR,6R,7R,7aR)-2,2-二叔丁基-7-四氢吡喃-2-基氧基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxacillin)-6-基]-4-(苄氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS28)直接用于下一步骤。

LCMS(ESI)m/z=952.8(M-H)-

保留时间:3.17分钟、3.38分钟(分析条件SQDAA05long)

苄基(2S)-2-(苄氧羰基氨基)-6-[[4-(苄氧羰基氨基)-1-[(2R,3R,4R,5R)-4-羟 基-5-(羟甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸酯(化合 物SS29)的合成

在氮气氛下,上一步得到的粗产物苄基(2S)-6-[[1-[(4aR,6R,7R,7aR)-2,2-二叔丁基-7-四氢吡喃-2-基氧基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxacillin)-6-基]-4-(苄氧羰基氨基)嘧啶-2-亚基]氨基]-2-(苄氧羰基氨基)己酸酯;2,2,2-三氟乙酸(化合物SS28),在室温溶解于THF(610μL),室温下加入四丁基氟化铵(约1mol/L的四氢呋喃溶液)(305μL,约0.305mmol),反应混合物在室温下搅拌30分钟。向反应溶液中加入DMSO,然后浓缩以蒸馏出THF。残渣经反相硅胶柱色谱(10mM AA水溶液/10mMAA-乙腈溶液)纯化得到苄基(2S)-2-(苄氧羰基氨基)-6-[[4-(苄氧羰基氨基)-1-[(2R,3R, 4R,5R)-4-羟基-5-(羟甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基] 己酸酯(化合物SS29)(21.51mg,87%,两步),作为衍生自THP保护基团上的不对称碳的非对映异构体的混合物。

LCMS(ESI)m/z=812.7(M-H)-

保留时间:1.74分钟(分析条件SQDAA05long)

苄基(2S)-2-(苄氧羰基氨基)-6-[[4-(苄氧羰基氨基)-1-[(2R,3R,4R,5R)-4-二 苄氧基磷酰氧基-5-(二苄氧基磷酰氧基甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧 啶-2-亚基]氨基]己酸酯(化合物SS30)的合成

在氮气氛下,将苄基(2S)-2-(苄氧羰基氨基)-6-[[4-(苄氧羰基氨基)-1-[(2R, 3R,4R,5R)-4-羟基-5-(羟甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨 基]己酸酯(化合物SS29)(21.51mg,0.026mmol)和1H-四唑(22.22mg,0.317mmol)在室温下溶解在乙腈(1.06mL)中,加入二苄基N,N-二异丙基亚磷酰胺(53.2μL,0.159mmol),并将混合物在室温下搅拌1小时。混合物加入戴斯-马丁Periodinane(135mg,0.317mmol),室温搅拌15分钟,反应溶液经反相硅胶柱色谱纯化(乙腈中的10mM AA水溶液/10mM AA溶液)定量得到苄基(2S)-2-(苄氧基羰基氨基)-6-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4R,5R)-4-二苄氧基磷酰氧基-5-(二苄氧基磷酰氧基甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸酯(化合物SS30)(36.59mg,两步骤),作为衍生自THP保护基团上的不对称碳的非对映异构体的混合物。

LCMS(ESI)m/z=1332.8(M-H)-

保留时间:3.08分钟、3.11分钟(分析条件SQDAA05long)

(2S)-2-氨基-6-[[4-氨基-1-[(2R,3R,4S,5R)-3-羟基-4-膦酰氧基-5-(膦酰氧基 甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸(化合物SS04,pLp)的合成

将苄基(2S)-2-(苄氧基羰基氨基)-6-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4R,5R)-4-二苄氧基磷酰氧基-5-(二苄氧基磷酰氧基甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸酯(化合物SS30)(36.59mg,0.027mmol)在室温下溶解在甲醇(649μL)和超纯水(152μL)的混合溶剂中,并在氮气氛下加入钯碳(10%Pd)(5.84mg,5.48μmol)。在氢气气氛下,将该混合物在室温下搅拌18小时。反应溶液经硅藻土过滤,用超纯水洗涤数次。向得到的滤液(24.66mL)中加入1mol/L氯化氢(2.74mL,2.74mmol),在室温下静置1小时。反应溶液经硅藻土过滤,用超纯水洗涤数次。滤液冻干后,用超纯水(1.52mL)重新溶解所得粉末,然后离心,回收上清液,得到(2S)-2-氨基-6-[[4-氨基-1-[(2R,3R,4S,5R)- 3-羟基-4-膦酰氧基-5-(膦酰氧基甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]己酸(化合物 SS04,pLp)的水溶液(1.37mL,17.47mM,87%,两步骤)。

LCMS(ESI)m/z=530.1(M-H)-

保留时间:1.60分钟(分析条件LTQTEA/HFIP05_02)

在分析实施例2中合成的化合物SS04之后和分析实施例3中合成的化合物SS04之前的时间期间进行柱交换。对实施例2合成的化合物SS04进行柱交换后再次分析,确认与实施例3合成的SS04化合物相同。结果如下所示。

LCMS(ESI)m/z=530.1(M-H)-

保留时间:1.60分钟(分析条件LTQTEA/HFIP05_02)

实施例4通过连接法在tRNA片段的3'末端引入胍丁胞苷单元的胍丁胞苷二磷酸的 合成

为了通过连接法在tRNA片段的3'末端引入胍丁胞苷单元,合成了胍基胞苷二磷酸。更具体地,根据以下方案合成胍丁胞苷-二磷酸(SS31,p(Agm)p)。

苄基N-[(4-氨基丁基氨基)-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;盐酸盐(化合 物SS32)的合成

在氮气氛下,将苄基N-[苄氧基羰基氨基-[4-(叔丁氧基羰基氨基)丁基氨基]亚甲基]氨基甲酸酯(241mg,0.483mmol)(这是文献(Chemistry A European Journal,2015,21(26),9370-9379)-已知化合物),在冰浴中加入4N-HCl/1,4-二噁烷(3.63mL)中,升温至室温,然后搅拌20分钟。加入正己烷后,浓缩反应溶液,定量获得苄基N-[(4-氨基丁基氨基)-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;盐酸盐(化合物SS32)(256.5mg)。

LCMS(ESI)m/z=399.4(M+H)+

保留时间:0.61分钟(分析条件SQDFA05_02)

苄基N-[[4-[[1-[(3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基-3a,4,6,6a-四氢呋 喃并[3,4-d][1,3]二氧杂环戊烷-4-基]-4-(苄氧基羰基氨基)嘧啶-2-亚基]氨基]丁基氨 基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS33)的合成

在氮气氛下,将THF(0.998mL)在室温下加入苄基N-[(4-氨基丁基氨基)-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;盐酸盐(SS32)(65.1mg,0.150mmol)和DBU(112μL,0.748mmol)的混合物中,然后在冰浴中冷却。向该混合物中,在冰浴中加入苄基((3aR,4R,12R,12aR)-2,2-二甲基-3a,4,12,12a-四氢-5H,8H-4,12-环氧基[1,3]间二氧杂环戊烷并(dioxolo)[4,5-e]嘧啶并[2,1-b][1,3]氧杂环辛烷(oxazocin)-8-亚基)氨基甲酸酯(化合物SS24)(49.8mg,0.125mmol)和加入了THF(1.497mL)的氯化锂(26.4mg,0.624mmol)的混合物,反应混合物用超声波清洗机粉碎,然后在冰浴中搅拌60分钟。在冰浴中向反应溶液中加入DMSO,升温至室温,然后将反应溶液浓缩以除去THF。残渣用反相硅胶柱色谱法(0.05%TFA水溶液/0.05%TFA-乙腈溶液)纯化,得到苄基N-[[4-[[1-[(3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基-3a,4,6,6a-四氢呋喃并[3,4-d][1,3]二氧杂环戊烷-4-基]-4-(苄氧基羰基氨基)嘧啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS33)(74.0毫克,65%)。

LCMS(ESI)m/z=796.6(M-H)-

保留时间:0.78分钟(分析条件SQDFA05_02)

苄基N-(苄氧基羰基氨基)-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4S,5R)-3,4- 二羟基-5-(羟甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨基]亚甲基]氨基甲酸酯;2, 2,2-三氟乙酸(化合物SS34)的合成

将苄基N-[[4-[[1-[(3aR,4R,6R,6aR)-6-(羟甲基)-2,2-二甲基-3a,4,6,6a-四氢呋喃并[3,4-d][1,3]二氧杂环戊烷-4-基]-4-(苄氧基羰基氨基)嘧啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS33)(109.5mg,0.120mmol)溶解在TFA(1.60mL)和超纯水(0.80mL)的混合溶剂中,冰浴冷却,混合物在室温下搅拌45分钟。重复加入甲苯和浓缩反应溶液的操作数次,蒸出水和TFA,得到粗产物苄基 N-(苄氧基羰基氨基)-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4S,5R)-3,4-二羟基-5-(羟 甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨基]亚甲基]氨基甲酸酯;2,2,2-三氟乙酸 (化合物SS34)(105mg)。所得粗产物苄基N-(苄氧基羰基氨基)-[4-[[4-(苄氧基羰基氨基)- 1-[(2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨 基]亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS34)直接用于下一步。

LCMS(ESI)m/z=756.5(M-H)-

保留时间:0.71分钟(分析条件SQDFA05_02)

苄基N-[[4-[[1-[(4aR,6R,7R,7aS)-2,2-二叔丁基-7-羟基-4a,6,7,7a-四氢-4H- 呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxacillin)-6-基]-4-(苄氧基羰基氨基)嘧 啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化 合物SS35)的合成

在氮气氛下,将上一步骤得到的粗产物,苄基N-[苄氧基羰基氨基-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4S,5R)-3,4-二羟基-5-(羟甲基)四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨基]亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS34)(105mg,0.120mmol)溶解在DMF(1.20mL)中,冰浴冷却混合物,加入二叔丁基甲硅烷基双(三氟甲磺酸酯)(78μL,0.241mmol),冰浴搅拌1小时。添加额外的二叔丁基甲硅烷基双(三氟甲磺酸酯)(78μL,0.241mmol),并在冰浴中搅拌30分钟。进一步加入额外的二叔丁基甲硅烷基双(三氟甲磺酸酯)(19.5μL,0.060mmol),并在冰浴中搅拌15分钟。在冰浴中,向反应溶液中加入饱和碳酸氢钠水溶液,所得混合物经反相硅胶柱色谱(0.05%TFA水溶液/0.05%TFA-乙腈溶液)纯化,得到苄基N-[[4-[[1-[(4aR,6R,7R,7aS)-2,2-二叔丁基-7-羟基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxacillin)-6-基]-4-(苄氧基羰基氨基)嘧啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS35)(108.02mg,89%,两步骤)。

LCMS(ESI)m/z=896.7(M-H)-

保留时间:0.91分钟(分析条件SQDFA05_02)

苄基N-[[4-[[1-[(4aR,6R,7R,7aR)-2,2-二叔丁基-7-四氢吡喃-2-基氧基-4a,6, 7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷-6-基]-4-(苄氧基羰基氨基)嘧 啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化 合物SS36)的合成

在氮气氛下,将苄基N-[[4-[[1-[(4aR,6R,7R,7aS)-2,2-二叔丁基-7-羟基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷(dioxacillin)-6-基]-4-(苄氧基羰基氨基)嘧啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS35)(64.51mg,0.064mmol)和3,4-二氢-2H-吡喃(173μL,1.912mmol)溶解在DCM(1.28mL)中,在冰浴中冷却混合物后,加入TFA(14.60μL,0.191mmol)。将反应混合物升温至室温并搅拌22.5小时,然后加入甲苯,将反应溶液浓缩得到粗产物苄基N-[[4-[[1-[(4aR,6R,7R,7aR)-2,2-二叔丁基-7-四氢吡喃-2-基氧基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷-6-基]-4-(苄氧基羰基氨基)嘧啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS36),作为衍生自THP保护基团上的不对称碳的非对映异构体的混合物。所得粗产物苄基N-[[4-[[1-[(4aR,6R,7R,7aR)-2,2-二叔丁基-7-四氢吡喃-2-基氧基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷-6-基]-4-(苄氧基羰基氨基)嘧啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS36)直接用于下一步。

LCMS(ESI)m/z=980.9(M-H)-

保留时间:3.51分钟、3.72分钟(分析条件SQDAA50long)

苄基N-[苄氧基羰基氨基-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4R,5R)-4-羟 基-5-(羟甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨基]亚 甲基]氨基甲酸酯(化合物SS37)的合成

在氮气氛下,在室温下将上一步骤得到的粗产物苄基N-[[4-[[1-[(4aR,6R,7R,7aR)-2,2-二叔丁基-7-四氢吡喃-2-基氧基-4a,6,7,7a-四氢-4H-呋喃并[3,2-d][1,3,2]二氧杂硅杂环己烷-6-基]-4-(苄氧基羰基氨基)嘧啶-2-亚基]氨基]丁基氨基]-(苄氧基羰基氨基)亚甲基]氨基甲酸酯;2,2,2-三氟乙酸(化合物SS36)溶解在THF(1.28mL)中,将混合物在冰浴中冷却,加入四丁基氟化铵(在四氢呋喃中约1mol/L的溶液)(638μL,约0.638mmol)。将反应混合物升温至室温并搅拌30分钟,然后将DMSO加入到反应溶液中,浓缩以蒸馏出THF。残渣用反相硅胶柱色谱(10mM AA水溶液/10mM AA-乙腈溶液)纯化,得到苄基N-[苄氧基羰基氨基-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4R,5R)-4-羟基-5-(羟甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨基]亚甲基]氨基甲酸酯(化合物SS37)(40.62mg,76%,两步),作为衍生自THP保护基团上的不对称碳的非对映异构体的混合物。

LCMS(ESI)m/z=840.7(M-H)-

保留时间:2.27分钟(分析条件SQDAA50long)

苄基N-[苄氧基羰基氨基-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4R,5R)-4-二苄 氧基磷酰氧基-5-(二苄氧基磷酰氧基甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶- 2-亚基]氨基]丁基氨基]亚甲基]氨基甲酸酯(化合物SS38)的合成

在氮气氛下,将苄基N-[苄氧基羰基氨基-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4R,5R)-4-羟基-5-(羟甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨基]亚甲基]氨基甲酸酯(化合物SS37)(40.62mg,0.048mmol)和1H-四唑(40.6mg,0.579mmol)溶解在甲苯中。将残渣在室温下溶于乙腈(1.93mL)中,将混合物在冰浴中冷却,然后加入二苄基N,N-二异丙基亚磷酰胺(97μL,0.289mmol),将反应混合物温热至室温并搅拌2.5小时。加入戴斯-马丁Periodinane(246mg,0.579mmol),室温搅拌15分钟,反应溶液经反相硅胶柱色谱(10mM AA水溶液/10mM AA-乙腈溶液)纯化,得到苄基N-[苄氧基羰基氨基-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4R,5R)-4-二苄氧基磷酰氧基-5-(二苄氧基磷酰氧基甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨基]亚甲基]氨基甲酸酯(化合物SS38)(59.66mg,91%,两步),作为衍生自THP保护基团上的不对称碳的非对映异构体的混合物。

LCMS(ESI)m/z=1363.0(M+H)+

保留时间:4.11分钟、4.14分钟(分析条件SQDAA05long)

[(2R,3S,4R,5R)-5-[4-氨基-2-(4-胍丁亚氨基)嘧啶-1-基]-4-羟基-2-(膦酰基 氧基甲基)四氢呋喃-3-基]磷酸二氢酯(化合物SS31,p(Agm)p)的合成

将苄基N-[苄氧基羰基氨基-[4-[[4-(苄氧基羰基氨基)-1-[(2R,3R,4R,5R)-4-二苄氧基磷酰氧基-5-(二苄氧基磷酰氧基甲基)-3-四氢吡喃-2-基氧基-四氢呋喃-2-基]嘧啶-2-亚基]氨基]丁基氨基]亚甲基]氨基甲酸酯(化合物SS38)(30.59mg,0.022mmol)在室温下溶解在甲醇(727μL)和超纯水(171μL)的混合溶剂中,并在氮气氛下加入钯碳(10%Pd)(4.78mg,4.49μmol)。在氢气氛下,将混合物在室温下搅拌七小时。反应溶液经硅藻土过滤,用超纯水洗涤数次。在得到的滤液(25mL)中加入1mol/L氯化氢(2.78mL、2.78mmol),在室温下静置45分钟。将反应溶液冷冻干燥,然后用超纯水溶解得到的粉末,通过硅藻土过滤,用超纯水洗涤数次。滤液冻干后,用超纯水(1.7mL)溶解所得粉末,离心溶液,回收上清液,得到[(2R,3S,4R,5R)-5-[4-氨基-2-(4-胍丁亚氨基)嘧啶-1-基]-4-羟基-2-(膦酰基氧基甲 基)四氢呋喃-3-基]磷酸二氢酯(化合物SS31,p(Agm)p)水溶液(1.61mL,12.11mM,87%,两步)。

LCMS(ESI)m/z=514.1(M-H)-

保留时间:1.58分钟(分析条件LTQTEA/HFIP05_02)

实施例5用于无细胞翻译系统的pCpA-氨基酸的合成

根据以下方案合成氨酰化的pCpA(SS14、SS15、SS16、SS39和SS40)。

(S)-1-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)哌啶-2-羧酸(化合物 SS17,F-Pnaz-Pic2-OH)的合成

在氮气氛下,将DMF(330μL)加入(S)-哌啶-2-羧酸(42.6mg,0.33mmol)和(4-硝基苯基)-4-(2-(4-氟苯基)乙酰氨基)苄基碳酸酯(化合物ts11)(140mg,0.44mmol)(通过专利文献(WO2018143145A1)的方法在室温下合成)的混合物中。在室温下搅拌该混合物五分钟后,在0℃下加入三乙胺(105.6μL,2.25mmol)。反应混合物在室温下搅拌30分钟,然后通过反相硅胶柱色谱法(0.1%甲酸水溶液/0.1%甲酸-乙腈溶液)纯化得到(S)-1-(((4-(2-(4- 氟苯基)乙酰氨基)苄基)氧基)羰基)哌啶-2-羧酸(化合物SS17,F-Pnaz-Pic2-OH)(92mg,67%)。

LCMS(ESI)m/z=413(M-H)-

保留时间:0.70分钟(分析条件SQDFA05_01)

1-(4-(2-(4-氟苯基)乙酰氨基)苄基)2-(氰甲基)(S)-哌啶-1,2-二羧酸酯(混合 物SS18,F-Pnaz-Pic2-OCH2CN)的合成

在氮气氛下,将(S)-1-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)哌啶-2- 羧酸(化合物SS17,F-Pnaz-Pic2-OH)(30mg,0.072mmol)和N-乙基-异丙基丙-2-胺(DIPEA)(20.23μL,0.116mmol)溶解在乙腈(90μL)中,在0℃加入2-溴乙腈(5.34μL,0.080mmol),混合物在室温下搅拌两小时。将反应溶液浓缩得到粗产物1-(4-(2-(4-氟苯基)乙酰氨基)苄基)2-(氰甲基)(S)-哌啶-1,2-二羧酸酯(混合物SS18,F-Pnaz-Pic2-OCH2CN)。将所得粗产物溶解于乙腈(2.00mL)中,直接用于下一步骤。

LCMS(ESI)m/z=452(M-H)-

保留时间:0.79分钟(分析条件SQDFA05_01)

1-(4-(2-(4-氟苯基)乙酰氨基)苄基)2-((2R,3S,4R,5R)-2-((((((2R,3S,4R, 5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-4-羟基-2-(((膦酰氧基)甲基)四氢呋喃-3-基)氧 基)(羟基)磷酰基)氧基)甲基)-5-(6-氨基-9H-嘌呤-9-基)-4-羟基四氢呋喃-3-基)(2S)- 哌啶-1,2-二羧酸酯(化合物SS14,F-Pnaz-Pic2-pCpA)的合成

将通过文献(Helv.Chim.Acta,90,297-310)中描述的方法合成的((2R,3R,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-3-((((((2R,3S,4R,5R)-5-(6)-氨基-9H-嘌呤-9-基)-3,4-二羟基四氢呋喃-2-基)甲氧基)(羟基)磷酰基)氧基)-4-((四氢呋喃-2-基)氧基)四氢呋喃-2-基)甲基磷酸二氢酯(化合物pc01)(113mg,0.156mmol)溶解在缓冲液A(40mL)中,加入1-(4-(2-(4-氟苯基)乙酰氨基)苄基)2-(氰甲基)(S)-哌啶-1,2-二羧酸酯(化合物SS18,F-Pnaz-Pic2-OCH2CN)(35.4mg,0.078mmol)的乙腈溶液(2.00mL),并将混合物在室温下搅拌150分钟。将反应溶液冷却至0℃,然后加入三氟乙酸(2.00mL)。在0℃搅拌反应溶液45分钟,通过反相硅胶柱色谱(0.05%三氟乙酸水溶液/0.05%三氟乙酸-乙腈)纯化,得到标题化合物(化合物SS14,F-Pnaz-Pic2-pCpA)(6.0mg,7.3%)。

LCMS(ESI)m/z=1047.5(M-H)-

保留时间:0.50分钟(分析条件SQDFA05_01)

缓冲液A如下制备。

将乙酸加入N,N,N-三甲基十六烷基-1-氯化铵(6.40g,20mmol)和咪唑(6.81g,100mmol)的水溶液中,得到20mM N,N,N-三甲基十六烷基-1-铵和100mM咪唑的缓冲液A(1L),pH8。

O-(2-氯苯基)-N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-L-丝氨酸(化 合物SS19,F-Pnaz-SPh2Cl-OH)的合成

在氮气氛下,在室温下,将DMSO(15mL)和三乙胺(0.95g,9.42mmol)加入到专利文献(WO2018225864)中描述的方法合成的O-(2-氯苯基)-L-丝氨酸(化合物aa63)(1.25g,5.80mmol)和通过专利文献(WO2018143145A1)中描述的方法合成的(4-硝基苯基)-4-(2-(4-氟苯基)乙酰氨基)苄基碳酸酯(化合物ts11)(2g,4.71mmol)的混合物中。反应混合物在室温下搅拌16小时,然后通过反相硅胶柱色谱法(0.1%甲酸水溶液/0.1%甲酸-乙腈溶液)纯化,得到O-(2-氯苯基)-N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-L-丝氨酸(化合物SS19,F-Pnaz-SPh2Cl-OH)(1.8g,73%)。

LCMS(ESI)m/z=523(M+Na)+

保留时间:1.26分钟(分析条件SMD方法1)

氰甲基O-(2-氯苯基)-N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-L-丝 氨酸酯(化合物SS20,F-Pnaz-SPh2Cl-OCH2CN)的合成

在氮气氛下,将O-(2-氯苯基)-N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-L-丝氨酸(化合物SS19,F-Pnaz-SPh2Cl-OH)(800mg,1.60mmol)和N-乙基-异丙基丙-2-胺(DIPEA)(0.412g,3.19mmol)溶解在DCM(15mL)中,室温下加入2-溴乙腈(760mg,6.34mmol),混合物在室温下搅拌16小时。反应溶液浓缩,经反相硅胶柱色谱(0.1%甲酸水溶液/0.1%甲酸-乙腈溶液)纯化,得到氰甲基O-(2-氯苯基)-N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-L-丝氨酸酯(化合物SS20,F-Pnaz-SPh2Cl-OCH2CN)(((((220mg,26%)。将所得产物溶解在乙腈(5mL)中,用于下一步骤。

LCMS(ESI)m/z=562(M+Na)+

保留时间:1.15分钟(分析条件SMD方法2)

(2R,3S,4R,5R)-2-((((((2R,3S,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-4-羟 基-2-(((膦酰氧基)甲基)四氢呋喃-3-基)氧基)(羟基)磷酰基)氧基)甲基)-5-(6-氨基- 9H-嘌呤-9-基)-4-羟基四氢呋喃-3-基O-(2-氯苯基)-N-(((4-(2-(4-氟苯基)乙酰氨基)苄 基)氧基)羰基)-L-丝氨酸酯(化合物SS15,F-Pnaz-SPh2Cl-pCpA)

将((2R,3R,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-3-((((((2R,3S,4R,5R)-5-(6)-氨基-9H-嘌呤-9-基)-3,4-二羟基四氢呋喃-2-基)甲氧基)(羟基)磷酰基)氧基)-4-((四氢呋喃-2-基)氧基)四氢呋喃-2-基)甲基磷酸二氢酯(化合物pc01)(400mg,0.55mmol)溶解在缓冲液A(100mL)中,使用注射泵在15分钟或更长时间内逐滴加入氰甲基O-(2-氯苯基)-N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-L-丝氨酸酯(化合物SS20,F-Pnaz-SPh2Cl-OCH2CN)(220mg,0.41mmol)的乙腈(5mL)溶液,并在室温下搅拌5分钟。接着,将三氟乙酸(2.3mL)加入到反应溶液中。反应溶液冷冻干燥后,经反相硅胶柱色谱(0.05%三氟乙酸水溶液/0.05%三氟乙酸-乙腈)纯化,得到标题化合物(化合物SS15,F-Pnaz-SPh2Cl-pCpA)(20.7mg,2%)。

LCMS(ESI)m/z=1133.4(M-H)-

保留时间:0.55分钟(分析条件SQDFA05_01)

((S)-2-(甲基氨基)-4-苯基丁酸(化合物SS21,MeHph-OH)的合成

在室温下,将DCM(903μL)、水(903μL)和哌啶(178μL,1.805mmol)添加到通过专利文献(WO2018225864)中记载的方法合成的(S)-2-(((((9H-芴-9-基)甲氧基)羰基)(甲基)氨基)-4-苯基丁酸(化合物aa11)(150mg,0.361mmol)中。反应混合物在室温下搅拌30分钟,然后通过反相硅胶柱色谱法(0.1%甲酸水溶液/0.1%甲酸-乙腈溶液)纯化,得到((S)-2-(甲基氨基)-4-苯基丁酸(化合物SS21,MeHph-OH)(55mg,79%)。

LCMS(ESI)m/z=192(M-H)-

保留时间:0.15分钟(分析条件SQDFA05_02)

(S)-2-((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)(甲基)氨基)-4-苯基丁 酸(化合物SS22,F-Pnaz-MeHph-OH)的合成

在氮气氛下,在室温下,将DMSO(727μL)加入((S)-2-(甲基氨基)-4-苯基丁酸(化合物SS21,MeHph-OH)(35.1mg,0.182mmol)和通过专利文献(WO2018143145A1)中描述的方法合成的(4-硝基苯基)-4-(2-(4-氟苯基)乙酰氨基)苄基碳酸酯(化合物ts11)(85mg,0.20mmol)的混合物中。在50℃加入三乙胺(76μL,0.545mmol)。将反应混合物在40℃搅拌16小时,然后通过反相硅胶柱色谱法(0.1%甲酸水溶液/0.1%甲酸-乙腈溶液)纯化,得到(S)-2-((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)(甲基)氨基)-4-苯基丁酸(化合物SS22,F-Pnaz-MeHph-OH)(80mg,92%)。

LCMS(ESI)m/z=477(M-H)-

保留时间:0.85分钟(分析条件SQDFA05_02)

氰甲基(S)-2-(((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)(甲基)氨基)- 4-苯基丁酸酯(化合物SS23,F-Pnaz-MeHph-OCH2CN)的合成

在氮气氛下,在室温下,将乙腈(533μL)加入(S)-2-((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)(甲基)氨基)-4-苯基丁酸(化合物SS22,F-Pnaz-MeHph-OH)(77mg,0.16mmol)和N-乙基-异丙基丙-2-胺(DIPEA)(31μL,0.176mmol)的混合物中。然后,在室温下加入2-溴乙腈(86μL,1.280mmol),并将反应混合物在40℃下搅拌1小时。将反应溶液浓缩得到粗产物氰甲基(S)-2-(((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)(甲基)氨基)-4-苯基丁酸酯(化合物SS23,F-Pnaz-MeHph-OCH2CN)。将所得粗产物溶解于乙腈(5.00mL)中,直接用于下一步骤。

LCMS(ESI)m/z=516(M-H)-

保留时间:0.92分钟(分析条件SQDFA05_02)

(2R,3S,4R,5R)-2-((((((2R,3S,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-4-羟 基-2-((膦酰氧基)甲基)四氢呋喃-3-基)氧基)(羟基)磷酰基)氧基)甲基)-5-(6-氨基-9H- 嘌呤-9-基)-4-羟基四氢呋喃-3-基(2S)-2-((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰 基)(甲基)氨基)-4-苯基丁酸酯(化合物SS16,F-Pnaz-MeHph-pCpA)的合成

将((2R,3R,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-3-((((((2R,3S,4R,5R)-5-(6)-氨基-9H-嘌呤-9-基)-3,4-二羟基四氢呋喃-2-基)甲氧基)羟基)磷酰基)氧基)-4-(((四氢呋喃-2-基)氧基)四氢呋喃-2-基)甲基磷酸二氢酯(化合物pc01)(127mg,0.176mmol)溶解在缓冲液A(100mL)中,加入氰甲基(S)-2-((((4-(2-(4-氟苯基)乙酰氨基)苄基)-氧基)羰基)(甲基)氨基)-4-苯基丁酸酯(化合物SS23,F-Pnaz-MeHph-OCH2CN)(83mg,0.16mmol)的乙腈(5.00mL)溶液中,并将混合物在室温下搅拌一小时。将反应溶液冷却至0℃,然后加入三氟乙酸(5.00mL)。在0℃搅拌反应溶液1小时,反相硅胶柱色谱纯化(0.05%三氟乙酸水溶液/0.05%三氟乙酸-乙腈),反相硅胶柱色谱进一步纯化(0.1%甲酸水溶液/0.1%甲酸乙腈溶液),得到标题化合物(化合物SS16,F-Pnaz-MeHph-pCpA)(26mg,14.6%)。

LCMS(ESI)m/z=1111.5(M-H)-

保留时间:0.64分钟(分析条件SQDFA05_02)

(S)-3-(3-氯苯基)-2-(((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)氨基) 丙酸(化合物SS41,F-Pnaz-F3Cl-OH)的合成

在氮气氛下,在室温下,将DMSO(15mL)和三乙胺(1.43g,14.13mmol)添加到通过专利文献(WO2018225864)中描述的方法合成的(S)-2-氨基-3-(3-氯苯基)丙酸(H-Phe(3-Cl)-OH)(2.17g,10.87mmol)和通过专利文献(WO2018143145A1)中描述的方法合成的(4-硝基苯基)-4-(2-(4-氟苯基)乙酰氨基)苄基碳酸酯(化合物ts11)(3.0g,7.07mmol)的混合物中。将反应混合物在室温下搅拌16小时,然后通过反相硅胶柱色谱法(0.1%甲酸水溶液/0.1%甲酸-乙腈溶液)纯化,得到(S)-3-(3-氯苯基)-2-(((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)氨基)丙酸(化合物SS41,F-Pnaz-F3Cl-OH)(0.7g,20%)。

LCMS(ESI)m/z=507(M+Na)+

保留时间:1.06分钟(分析条件SMD方法3)

氰甲基(S)-3-(3-氯苯基)-2-(((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基) 氨基)丙酸酯(化合物SS42,F-Pnaz-F3Cl-OCH2CN)的合成

在氮气氛下,将(S)-3-(3-氯苯基)-2-(((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)氨基)丙酸(化合物SS41,F-Pnaz-F3Cl-OH)(650mg,1.34mmol)和N-乙基-异丙基丙-2-胺(DIPEA)(0.346g,2.68mmol)溶解在DCM(28mL)中,在室温下加入2-溴乙腈(640mg,5.34mmol),并将混合物在室温下搅拌48小时。浓缩反应溶液,经正相硅胶柱色谱(乙酸乙酯/石油醚)浓缩纯化,得到氰甲基(S)-3-(3-氯苯基)-2-((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)氨基)丙酸酯(化合物SS42,F-Pnaz-F3Cl-OCH2CN)(330mg,47%)。

LCMS(ESI)m/z=546(M+Na)+

保留时间:1.13分钟(分析条件SMD方法3)

(2R,3S,4R,5R)-2-((((((2R,3S,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-4-羟 基-2-(((膦酰氧基)甲基)四氢呋喃-3-基)氧基)(羟基)磷酰基)氧基)甲基)-5-(6-氨基- 9H-嘌呤-9-基)-4-羟基四氢呋喃-3-基(2S)-(3-氯苯基)-N-(((4-(2-(4-氟苯基)乙酰氨 基)苄基)氧基)羰基)-氨基)丙酸酯(混合物SS39,F-Pnaz-F3Cl-pCpA)的合成

将通过文献(Helv.Chim.Acta,90,297-310)中描述的方法合成的((2R,3R,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-3-((((((2R,3S,4R,5R)-5-(6)-氨基-9H-嘌呤-9-基)-3,4-二羟基四氢呋喃-2-基)甲氧基)羟基)磷酰基)氧基)-4-(((四氢呋喃-2-基)氧基)四氢呋喃-2-基)甲基磷酸二氢酯(化合物pc01)(552mg,0.76mmol)溶解在缓冲液A(100mL)中,使用注射泵经15分钟或更长时间逐滴加入氰甲基(S)-3-(3-氯苯基)-2-((((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)氨基)丙酸酯(化合物SS42,F-Pnaz-F3Cl-OCH2CN)((200mg,0.38mmol)的乙腈(5mL)溶液,并将其在室温下搅拌30分钟。将三氟乙酸(2.3mL)加入到反应溶液中。将反应溶液冷冻干燥后,经反相硅胶柱色谱(0.05%三氟乙酸水溶液/0.05%三氟乙酸-乙腈)纯化,得到标题化合物(化合物39,F-Pnaz-F3Cl-pCpA)(25.3mg,1%)。

LCMS(ESI)m/z=1117.4(M-H)-

保留时间:0.55分钟(分析条件SQDFA05_01)

N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-O-异戊基-L-丝氨酸(化合物 SS43,F-Pnaz-SiPen-OH)的合成

在氮气氛下,在室温下,将DMSO(15mL)和三乙胺(1.3mL,9.42mmol)加入到专利文献(WO2018225864)中描述的O-异戊基-L-丝氨酸(H-Ser(iPen)-OH)(1g,5.71mmol)和通过专利文献(WO2018143145A1)中描述的方法合成的(4-硝基苯基)-4-(2-(4-氟苯基)乙酰氨基)苄基碳酸酯(化合物ts11)(2g,4.71mmol)的混合物中。将反应混合物在室温下搅拌16小时,然后通过反相硅胶柱色谱法(0.1%甲酸水溶液/0.1%甲酸-乙腈溶液)纯化,得到N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-O-异戊基-L-丝氨酸(化合物SS43,F-Pnaz-SiPen-OH)(1.8g,83%)。

LCMS(ESI)m/z=483(M+Na)+

保留时间:1.04分钟(分析条件SMD方法3)

氰甲基N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-O-异戊基-L-丝氨酸 酯(化合物SS44,F-Pnaz-SiPen-OCH2CN)的合成

在氮气氛下,将N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-O-异戊基-L-丝氨酸(化合物SS43,F-Pnaz-SiPen-OH)(1.8g 3.91mmol)和N-乙基-异丙基丙-2-胺(DIPEA)(1g,7.74mmol)溶解在DCM(40mL)中,在室温下加入2-溴乙腈(1.9g,15.84mmol),并将混合物在室温下搅拌48小时。浓缩反应溶液,经正相硅胶柱色谱(乙酸乙酯/石油醚)纯化,得到氰甲基N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-O-异戊基-L-丝氨酸酯(化合物SS44,F-Pnaz-SiPen-OCH2CN)(1.6g,82%)。

LCMS(ESI)m/z=522(M+Na)+

保留时间:1.35分钟(分析条件SMD方法4)

(2R,3S,4R,5R)-2-((((((2R,3S,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-4-羟 基-2-(((膦酰氧基)甲基)四氢呋喃-3-基)氧基)(羟基)磷酰基)氧基)甲基)-5-(6-氨基- 9H-嘌呤-9-基)-4-羟基四氢呋喃-3-基N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰 基)-O-异戊基-L-丝氨酸酯(化合物SS40,F-Pnaz-SiPen-pCpA)的合成

将通过文献(Helv.Chim.Acta,90,297-310)中描述的方法合成的((2R,3R,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-3-((((((2R,3S,4R,5R)-5-(6)-氨基-9H-嘌呤-9-基)-3,4-二羟基四氢呋喃-2-基)甲氧基)(羟基)磷酰基)氧基)-4-((四氢呋喃-2-基)氧基)四氢呋喃-2-基)甲基磷酸二氢酯(化合物pc01)(400mg,0.55mmol)溶解在缓冲液A(100mL)中,使用注射泵经15分钟或更长时间向其中逐滴加入氰甲基N-(((4-(2-(4-氟苯基)乙酰氨基)苄基)氧基)羰基)-O-异戊基-L-丝氨酸酯(化合物SS44,F-Pnaz-SiPen-OCH2CN)(139mg,0.28mmol)的乙腈(5mL)溶液,并在室温下搅拌3小时。将三氟乙酸(2.3mL)加入到反应溶液中。将反应溶液冷冻干燥后,经反相硅胶柱色谱(0.05%三氟乙酸水溶液/0.05%三氟乙酸-乙腈)纯化,得到标题化合物(化合物SS40,F-Pnaz-SiPen-pCpA)(39.5mg,3%)。

LCMS(ESI)m/z=1093.5(M-H)-

保留时间:0.55分钟(分析条件SQDFA05_01)

实施例6 BdpFL-Phe-pCpA(MT01)的合成

(3-(5,5-二氟-7,9-二甲基-5H-4λ4,5λ4-二吡咯并[1,2-c:2',1'-f][1,3,2]二氮 杂硼杂环己烯-3-基)丙酰基)-L-苯丙氨酸(化合物MT02 BdpFL-Phe-OH)的合成

在氮气氛下,在室温下,将DIC(0.128mL,0.822mmol)加入到3-(2-羧乙基)-5,5-二氟-7,9-二甲基-5H-5λ4-二吡咯并[1,2-c:2',1'-f][1,3,2]二氮杂硼杂环己烷-4-鎓(200mg,0.685mmol)和1-羟基吡咯烷-2,5-二酮(87mg,0.753mmol)的NMP(4.5mL)溶液中,然后将混合物在40℃下搅拌过夜。恢复至室温后,向反应溶液中加入L-苯丙氨酸(113mg,0.685mmol)和TEA(0.191mL,1.369mmol),40℃搅拌过夜。反应溶液经反相柱色谱(0.1%FA-MeCN/H2O)纯化得到(3-(5,5-二氟-7,9-二甲基-5H-4λ4,5λ4-二吡咯并[1,2-c:2',1'-f][1, 3,2]二氮杂硼杂环己烯-3-基)丙酰基)-L-苯丙氨酸(化合物MT02,BdpFL-Phe-OH)(102mg,34%产率)。

LCMS(ESI)m/z=438.3(M-H)-

保留时间:0.78分钟(分析条件SQDFA05_02)

(3-(5,5-二氟-7,9-二甲基-5H-4λ4,5λ4-二吡咯并[1,2-c:2',1'-f][1,3,2]二氮 杂硼杂环己烯-3-基)丙酰基)-L-苯丙氨酸氰甲基酯(化合物MT03,BdpFL-Phe-OCH2CN)的合

在氮气氛下,将(3-(5,5-二氟-7,9-二甲基-5H-4λ4,5λ4-二吡咯并[1,2-c:2',1'-f][1,3,2]二氮杂硼杂环己烯-3-基)丙酰基)-L-苯丙氨酸(50mg,0.114mmol)和N-乙基-异丙基丙-2-胺(DIPEA)(31.0μL,0.177mmol)溶解在乙腈(500μL)中,在0℃下加入2-溴乙腈(12μL,0.177mmol),然后将混合物在40℃下搅拌3小时。将反应溶液浓缩得到(3-(5,5-二氟-7,9-二甲基-5H-4λ4,5λ4-二吡咯并[1,2-c:2',1'-f][1,3,2]二氮杂硼杂环己烯-3-基)丙酰基)-L-苯丙氨酸氰甲基酯(化合物MT02,BdpFL-Phe-OCH2CN)作为粗产物。所得粗产物直接用于下一步骤。

LCMS(ESI)m/z=477.3(M-H)-

保留时间:0.86分钟(分析条件SQDFA05_01)

3-(3-(((2S)-1-(((2R,3S,4R,5R)-2-(((((2R,3S,4R,5R)-5-(4-氨基)-2-氧嘧 啶-1(2H)-基)-4-羟基-2-((膦酰氧基)甲基)四氢呋喃-3-基)氧基)(羟基)磷酰基)氧基)甲 基)-5-(6-氨基-9H-嘌呤-9-基)-4-羟基四氢呋喃-3-基)氧基)-1-氧代-3-苯基丙酰-2-基) 氨基)-3-氧丙基)-5,5-二氟-7,9-二甲基-5H-5λ4-二吡咯并[1,2-c:2',1'-f][1,3,2]二氮 杂硼杂环己烯-4-鎓(化合物MT01,BdpFL-Phe-pCpA)

将((2R,3R,4R,5R)-5-(4-氨基-2-氧嘧啶-1(2H)-基)-3-((((((2R,3S,4R,5R)-5-(6)-氨基-9H-嘌呤-9-基)-3,4-二羟基四氢呋喃-2-基)甲氧基)(羟基)磷酰基)氧基)-4-((四氢呋喃-2-基)氧基)四氢呋喃-2-基)甲基磷酸二氢酯(化合物pc01)(33.2mg,0.046mmol)溶解在缓冲液A(11.3mL)中,加入(3-(5,5-二氟-7,9-二甲基-5H-4λ4,5λ4-二吡咯并[1,2-c:2',1'-f][1,3,2]二氮杂硼杂环己烯-3-基)丙酰基)-L-苯丙氨酸氰甲基酯(化合物MT03,BdpFL-Phe-OCH2CN)(11mg,0.023mmol)的乙腈(0.13mL)溶液,然后将混合物在室温下搅拌45分钟。在0℃下向反应溶液中加入TFA(0.56mL)并搅拌5分钟,然后在室温下搅拌10分钟。通过反相硅胶柱色谱法(0.05%TFA-MeCN/H2O)纯化反应溶液,获得标题化合物(化合物MT01,BdpFL-Phe-pCpA)(2.1mg,8.5%产率)。

LCMS(ESI)m/z=1072.5(M-H)-

保留时间:0.56分钟(分析条件SQDFA05_02)

实施例7(2S,3R)-2-((((9H-芴-9-基)甲氧基)羰基)氨基)-3-((四氢-2H-吡喃-2- 基)氧基)丁酸(Fmoc-Thr(THP)-OH)的合成,用于肽合成仪对LCT-12的肽合成

将甲苯(50mL)添加到(2S,3R)-2-(((((9H-芴-9-基)甲氧基)羰基)氨基)-3-羟基丁酸一水合物(Fmoc-Thr-OH的一水合物,购自Tokyo Chemical Industry,5.0g,13.9mmol)和对甲苯磺酸吡啶鎓(PPTS,0.175g,0.70mmol)的混合物中,通过减压蒸馏除去甲苯,共沸除去包含的水。将超脱水四氢呋喃(THF,28mL)和3,4-二氢-2H-吡喃(8.8mL,97mmol)加入到所得残渣中,并将其在氮气氛下在50℃下搅拌4小时。通过LCMS(SQDFA05)确认原料消失后,将混合物冷却至25℃,加入乙酸乙酯(30mL)。接着,加入饱和氯化钠水溶液(30mL)洗涤有机层,水层用乙酸乙酯(30mL)萃取。合并所有获得的有机层,并将其进一步用饱和氯化钠水溶液(30mL)洗涤两次。有机层用硫酸钠干燥,减压蒸馏除去溶剂,得到粗产物(9.3g)。

将所得粗产物中的4.65g溶解在四氢呋喃(THF,30mL)中,然后加入1.0M磷酸盐缓冲液(30mL)调节至pH8.0。将该混合物在50℃下搅拌四小时。冷却至25℃后,加入乙酸乙酯(30mL),分离有机层和水层。水层中加入乙酸乙酯(30mL)萃取,合并所有获得的有机层,用饱和氯化钠水溶液(30mL)洗涤2次。将有机层用硫酸钠干燥,减压蒸馏除去溶剂,进一步在25℃下用泵减压干燥30分钟。

将所得残渣溶解在乙醚(50mL)中,然后加入庚烷(50mL)。在受控减压(约100hPa)下,仅蒸馏出乙醚,并将所得混合物过滤以获得固体。用庚烷重复该洗涤操作两次。将得到的固体用泵在25℃下减压干燥2小时,得到Fmoc-Thr(THP)-OH的钠盐(2.80g,6.26mmol)。

向所得Fmoc-Thr(THP)-OH的钠盐总量中加入pH2.1的乙酸乙酯(50mL)和0.05M磷酸水溶液(140mL),将混合物在25℃搅拌5分钟,然后分离有机层和水层。向水层中加入乙酸乙酯(50mL)进行萃取,将所有获得的有机层混合,然后用饱和氯化钠水溶液(50mL)洗涤两次。有机层用硫酸钠干燥,减压蒸馏除去溶剂。将残渣用泵在25℃下减压干燥2小时后,将所得固体溶解于叔丁基甲基醚(TBME、50mL)中,减压蒸馏除去溶剂。此外,通过使用泵在25℃下减压干燥1小时,获得(2S,3R)-2-(((((9H-芴-9-基)甲氧基)羰基)氨基)-3-((四氢-2H-吡喃-2-基)氧基)丁酸(Fmoc-Thr(THP)-OH,2.70g,30mol%的叔丁基甲基醚(TBME)残留),作为衍生自THP保护基团上的不对称碳的非对映异构体的混合物。将得到的Fmoc-Thr(THP)-OH保存在-25℃的冰箱中。

LCMS(ESI)m/z=424.2(M-H)-

保留时间:0.84分钟、0.85分钟(分析条件SQDFA05_01)

实施例8在N末端具有BdpFL的肽(LCT-12)的合成,用作LC/MS的标准品

使用带有Fmoc-Ala-OH(100mg)的2-氯三苯甲基树脂,并使用Fmoc-Gly-OH、Fmoc-Thr(THP)-OH、Fmoc-Ile-OH、Fmoc-Phe-OH和Fmoc-Pro OH为Fmoc氨基酸,在肽合成仪上进行肽延伸(氨基酸的缩写在本说明书中单独描述)。根据使用Fmoc方法的肽合成方法(WO2013100132B2)进行肽延伸。肽延伸后,在肽合成仪上去除N端Fmoc基团,然后用DCM洗涤树脂。

将TFE/DCM(1:1,v/v,2mL)加入树脂中并振荡1小时,然后从树脂上切下肽。反应完成后,将管内溶液通过合成柱过滤除去树脂,用TFE/DCM(1:1,v/v,1mL)洗涤树脂两次。混合所有提取物,加入DMF(2mL),然后将混合物减压浓缩。将得到的残渣溶解在NMP(0.5mL)中,将其中的四分之一(125μL)用于下一步反应。在室温下向NMP中的肽溶液中加入调节至76.5mM的BdpFL琥珀酰亚胺酯(140μL),在40℃下搅拌过夜,然后减压浓缩。将所得残渣溶解在0.05M四甲基硫酸氢铵的HFIP(1.2mL,0.060mmol)溶液中,并在室温下搅拌2小时。反应溶液通过反相硅胶柱色谱法(0.1%FA MeCN/H2O)纯化,得到标题化合物(LCT-12)(0.3mg)。LCT-12的氨基酸序列如SEQ ID NO:53所示。

LCMS(ESI)m/z=1972.9(M-H)-

保留时间:0.74分钟(分析条件SQDFA05_01)

实施例9通过连接反应生产tRNA-CA

通过下述步骤,使用连接反应连接tRNA5’片段、pNp(pUp、pLp或p(Agm)p)和tRNA3’片段以产生各种tRNA-CA。tRNA 5’片段和tRNA 3’片段使用化学合成产物(Gene DesignCo.,Ltd.)。每个tRNA片段及其全长序列,以及用于连接的样品组合(表4)如下所示。

SEQ ID NO:54(FR-1)

tRNA(Glu)5’RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCU

SEQ ID NO:55(FR-2)

tRNA(Glu)3’ga RNA序列

GAACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:56(UR-1)

lig-tRNA(Glu)uga-CA RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUUGAACGGCGGU

AACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:57(LR-1)

tRNA(Glu)Lga-CA RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCULGAACGGCGGU

AACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:58(FR-3)

tRNA(Glu)3’ag RNA序列

AGACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:59(LR-2)

tRNA(Glu)Lag-CA RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCULAGACGGCGGU

AACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:60(FR-4)

tRNA(Glu)3’ac RNA序列

ACACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:61(LR-3)

tRNA(Glu)Lac-CA RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCULACACGGCGGU

AACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:62(FR-5)

tRNA(Glu)3’cc RNA序列

CCACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:63(LR-4)

tRNA(Glu)Lcc-CA RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCULCCACGGCGGU

AACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:132(FR-6)

tRNA(Asp)5’RNA序列

GGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUU

SEQ ID NO:133(FR-7)

tRNA(Asp)3’ag RNA序列

AGGUGCAGGGGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC

SEQ ID NO:134(LR-5)

tRNA(Asp)Lag-CA RNA序列

GGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUULAGGUGCAGG

GGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC

SEQ ID NO:135(FR-8)

tRNA(AsnE2)5’RNA序列

GGCUCUGUAGUUCAGUCGGUAGAACGGCGGAUU

SEQ ID NO:136(FR-9)

tRNA(AsnE2)3’ag RNA序列

AGGUUCCGUAUGUCACUGGUUCGAGUCCAGUCAGAGCCGC

SEQ ID NO:137(LR-6)

tRNA(AsnE2)Lag-CA RNA序列

GGCUCUGUAGUUCAGUCGGUAGAACGGCGGAUULAGGUUCCGUA

UGUCACUGGUUCGAGUCCAGUCAGAGCCGC

SEQ ID NO:139(FR-10)

tRNA(Glu)3’cg RNA序列

CGACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:140(LR-7)

tRNA(Glu)Lcg-CA RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCULCGACGGCGGU

AACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:141(FR-11)

tRNA(Glu)3’au RNA序列

AUACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:142(LR-8)

tRNA(Glu)Lau-CA RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCULAUACGGCGGU

AACAGGGGUUCGAAUCCCCUAGGGGACGC

SEQ ID NO:138(AR-1)

tRNA(Glu)(Agm)ag-CA RNA序列

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCU(Agm)AGACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

表4

由50mM HEPES-KOH(pH 7.5)、20mM MgCl2、1mM ATP、0.125-0.25mM pNp(pUp、pLp或p(Agm)p)、25μM tRNA 5'片段、0.6U/L T4 RNA连接酶(New England Biolabs)和10%DMSO组成的反应溶液在15℃下静置过夜,以进行tRNA 5'片段和pNp(pUp、pLp或p(Agm)p)之间的连接反应。连接产物用苯酚-氯仿萃取,通过乙醇沉淀回收。

为了防止未反应的tRNA 5'片段被带到下一个连接反应中,使用高碘酸钠(NaIO4)切割在tRNA 5'片段的3'末端的核糖。具体而言,在10mM高碘酸钠存在下,将10μM连接产物在黑暗中放置在冰上30分钟,进行切割。反应后,加入十分之一体积的100mM葡萄糖,将其在冰上在黑暗中放置30分钟以分解过量的高碘酸钠。通过乙醇沉淀收集反应产物。

高碘酸处理后,进行T4多核苷酸激酶(T4 PNK)处理以磷酸化连接产物的5'末端和去磷酸化连接产物的3'末端。由10μM高碘酸处理后的连接产物、50mM Tris-HCl(pH 8.0)、10mM MgCl2、5mM DTT、300μM ATP和0.5U/μL T4 PNK(TaKaRa)组成的反应溶液通过在37℃下静置30至60分钟进行反应。反应产物用苯酚-氯仿萃取,通过乙醇沉淀收集。

在PNK处理后的反应产物和tRNA 3'片段之间进行连接反应。首先,将由10μM PNK处理的反应产物、10μM tRNA 3'片段、50mM HEPES-KOH(pH 7.5)和15mM MgCl2组成的溶液在65℃下加热7钟,然后在室温静置30分钟至1小时,使PNK处理的反应产物和tRNA 3'片段退火。接下来,进行T4 PNK处理以磷酸化tRNA 3'片段的5'末端。通过向退火溶液中加入DTT(终浓度3.5mM)、ATP(终浓度300μM)和T4 PNK(终浓度0.5U/μL)并在37℃静置30分钟来进行T4 PNK处理。接着,将T4 RNA连接酶(New England Biolabs)以0.9U/μL的终浓度添加到该溶液中,将该混合物在37℃下放置30至40分钟进行连接反应。连接产物用苯酚-氯仿萃取,通过乙醇沉淀收集。

通过高效反相色谱(HPLC)(15mM TEA和400mM HFIP的水溶液/15mM TEA和400mMHFIP的甲醇溶液)对通过连接方法产生的tRNA-CA进行制备性纯化,然后进行变性尿素-10%聚丙烯酰胺电泳,以确认它们是否具有所需的长度。

实施例10分析由RNaseT1切割的tRNA片段

使用连接反应制备的各种tRNA-CA被RNase片段化并分析以确认由pUp、pLp或p(Agm)p引入的U、L和(Agm)中的每一个是否已被引入所需的位点。

下表5中显示了每个tRNA-CA的SEQ ID NO和包含由pUp、pLp或p(Agm)p引入的U、L或(Agm)的RNA片段的序列的组合。

[表5]

将含有10μM tRNA-CA、5U/μL RNaseT1(Epicentre或ThermoFisher Scientific)和10mM乙酸铵(pH 5.3)的反应溶液在37℃下静置1小时,以在G碱基的3'侧特异性切割RNA,并分析包含由pUp、pLp或p(Agm)p引入的U、L或(Agm)的RNA片段。

CCCUUGp

LCMS(ESI)m/z=944((M-2H)/2)-

保留时间:4.22分钟(分析条件LTQTEA/HFIP05_03)

与未连接pUp时预期的片段(CCCUGp)的质谱图进行比较,确认大部分pUp连接发生(图1)。

CCCULGp

LCMS(ESI)m/z=1008((M-2H)/2)-

保留时间:2.34分钟(分析条件LTQTEA/HFIP05_03)

与未连接pUp时预期的片段(CCCUGp)和存在尿苷而不是赖胞苷时预期的片段(CCCUUGp)的质谱图进行比较,证实大部分pLp连接发生(图2)。

CCCULAGp

LCMS(ESI)m/z=1172((M-2H)/2)-

保留时间:3.81分钟(分析条件LTQTEA/HFIP05_03)

与未连接pLp时预期的片段(CCCUAGp)和存在尿苷而不是赖胞苷时预期的片段(CCCUUAGp)的质谱图进行比较,证实大部分pLp连接发生(图3)。

CCCULACACGp(SEQ ID NO:197)

LCMS(ESI)m/z=1642((M-2H)/2)-

保留时间:5.78分钟(分析条件LTQTEA/HFIP05_03)

与未连接pLp时预期的片段(CCCUACACGp)和存在尿苷而不是赖胞苷时预期的片段(CCCUUACACGp/SEQ ID NO:198)的质谱图进行比较,证实大部分pLp连接发生(图4)。

CCCULCCACGp(SEQ ID NO:199)

LCMS(ESI)m/z=1630((M-2H)/2)-

保留时间:5.64分钟(分析条件LTQTEA/HFIP05_03)

与未连接pLp时预期的片段(CCCUCCACGp)和存在尿苷而不是赖胞苷时预期的片段(CCCUUCCACGp/SEQ ID NO:200)的质谱图进行比较,证实大部分pLp连接发生(图5)。

CUULAGp

LCMS(ESI)m/z=1020((M-2H)/2)-

保留时间:3.84分钟(分析条件LTQTEA/HFIP05_03)

由于未连接pLp时预期的片段(CUUAGp)和源自RNA另一部分的片段(UUCAGp)具有相同的分子量,因此也分析了未片段化的RNA。

pGGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUULAGGUGCAGGGGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC(SEQ ID NO:134)

LCMS(ESI)m/z=1109((M-22H)/22)-

保留时间:3.92分钟(分析条件LTQTEA/HFIP05_01)

与未连接pLp时预期的RNA和存在尿苷而不是赖胞苷时预期的RNA的质谱图进行比较,证实大部分pLp连接发生(图6)。

AUULAGp

LCMS(ESI)m/z=1032((M-2H)/2)-

保留时间:4.16分钟(分析条件LTQTEA/HFIP05_03)

与未连接pLp时预期的片段(AUUAGp)和存在尿苷而不是赖胞苷时预期的片段(AUUUAGp)的质谱图进行比较,证实大部分pLp连接发生(图7)。

CCCULCGp

LCMS(ESI)m/z=1160((M-2H)/2)-

保留时间:4.21分钟(分析条件LTQTEA/HFIP05_03)

与未连接pLp时预期的片段(CCCUCGp)和存在尿苷而不是赖胞苷时预期的片段(CCCUUCGp)的质谱图进行比较,证实大部分pLp连接发生(图8)。

CCCULAUACGp(SEQ ID NO:202)

LCMS(ESI)m/z=1642((M-2H)/2)-

保留时间:5.95分钟(分析条件LTQTEA/HFIP05_03)

与未连接pLp时预期的片段(CCCUAUACGp)和存在尿苷而不是赖胞苷时预期的片段(CCCUUAUACGp/SEQ ID NO:203)的质谱图进行比较,证实大部分pLp连接发生(图9)。

CCCU(Agm)AGp

LCMS(ESI)m/z=1164((M-2H)/2)-

保留时间:4.02分钟(分析条件LTQTEA/HFIP05_03)

与未连接p(Agm)p时预期的片段(CCCUAGp)和存在尿苷而不是胍丁胞苷时预期的片段(CCCUUAGp)的质谱图进行比较,证实大部分p(Agm)p连接发生(图10)。

实施例11氨酰tRNA的合成

从模板DNA(SEQ ID NO:64(D-1)至SEQ ID NO:76(D-13),SEQ ID NO:143(D-26)至SEQ ID NO:152(D-35)),通过使用T7 RNA聚合酶进行体外转录反应合成了tRNA(SEQ IDNO:77(TR-1)至SEQ ID NO:89(TR-13),SEQ ID NO:153(TR-14)至SEQ ID NO:162(TR-23)),并通过RNeasy试剂盒(Qiagen)进行纯化。

模板DNA SEQ ID NO:64(D-1)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTAGAACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:65(D-2)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTTGAACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:66(D-3)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTCGAACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:67(D-4)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTAAGACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:68(D-5)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTTAGACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:69(D-6)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTCAGACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:70(D-7)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTAACACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:71(D-8)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTTACACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:72(D-9)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTCACACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:73(D-10)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTGCCACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:74(D-11)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTTCCACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:75(D-12)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTCCCACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:76(D-13)

DNA序列:

GGCGTAATACGACTCACTATAGGCGGGGTGGAGCAGCCTGGTAGCTCGTCGGGCTCATAACCCGAAGATCGTCGGTTCAAATCCGGCCCCCGCAAC

模板DNA SEQ ID NO:143(D-26)

DNA序列:

GGCGTAATACGACTCACTATAGGAGCGGTAGTTCAGTCGGTTAGAATACCTGCTTaagGTGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCC

GC

模板DNA SEQ ID NO:144(D-27)

DNA序列:

GGCGTAATACGACTCACTATAGGAGCGGTAGTTCAGTCGGTTAGAATACCTGCTTTagGTGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGC

模板DNA SEQ ID NO:145(D-28)

DNA序列:

GGCGTAATACGACTCACTATAGGAGCGGTAGTTCAGTCGGTTAGAATACCTGCTTcagGTGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGC

模板DNA SEQ ID NO:146(D-29)

DNA序列:

GGCGTAATACGACTCACTATAGGCTCTGTAGTTCAGTCGGTAGAACGGCGGATTaagGTTCCGTATGTCACTGGTTCGAGTCCAGTCAGAGCCGC

模板DNA SEQ ID NO:147(D-30)

DNA序列:

GGCGTAATACGACTCACTATAGGCTCTGTAGTTCAGTCGGTAGAACGGCGGATTtagGTTCCGTATGTCACTGGTTCGAGTCCAGTCAGAGCCGC

模板DNA SEQ ID NO:148(D-31)

DNA序列:

GGCGTAATACGACTCACTATAGGCTCTGTAGTTCAGTCGGTAGAACGGCGGATTcagGTTCCGTATGTCACTGGTTCGAGTCCAGTCAGAGCCGC

模板DNA SEQ ID NO:149(D-32)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTgcgACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:150(D-33)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTccgACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:151(D-34)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTaauACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

模板DNA SEQ ID NO:152(D-35)

DNA序列:

GGCGTAATACGACTCACTATAGTCCCCTTCGTCTAGAGGCCCAGGACACCGCCCTcauACGGCGGTAACAGGGGTTCGAATCCCCTAGGGGACGC

tRNA SEQ ID NO:77(TR-1)

tRNA(Glu)aga-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUAGAACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:78(TR-2)

tRNA(Glu)uga-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUUGAACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:79(TR-3)

tRNA(Glu)cga-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUCGAACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:80(TR-4)

tRNA(Glu)aag-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUAAGACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:81(TR-5)

tRNA(Glu)uag-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUUAGACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:82(TR-6)

tRNA(Glu)cag-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUCAGACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:83(TR-7)

tRNA(Glu)aac-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUAACACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:84(TR-8)

tRNA(Glu)uac-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUUACACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:85(TR-9)

tRNA(Glu)cac-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUCACACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:86(TR-10)

tRNA(Glu)gcc-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUGCCACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:87(TR-11)

tRNA(Glu)ucc-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUUCCACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:88(TR-12)

tRNA(Glu)ccc-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUCCCACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:89(TR-13)

tRNA(fMet)cau-CA RNA序列:

GGCGGGGUGGAGCAGCCUGGUAGCUCGUCGGGCUCAUAACCCGAAGAUCGUCGGUUCAAAUCCGGCCCCCGCAA

tRNA SEQ ID NO:153(TR-14)

tRNA(Asp)aag-CA RNA序列:

GGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUUaagGUGCAGGGGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC

tRNA SEQ ID NO:154(TR-15)

tRNA(Asp)uag-CA RNA序列:

GGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUUuagGUGCAGGGGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC

tRNA SEQ ID NO:155(TR-16)

tRNA(Asp)cag-CA RNA序列:

GGAGCGGUAGUUCAGUCGGUUAGAAUACCUGCUUcagGUGCAGGGGGUCGCGGGUUCGAGUCCCGUCCGUUCCGC

tRNA SEQ ID NO:156(TR-17)

tRNA(AsnE2)aag-CA RNA序列:

GGCUCUGUAGUUCAGUCGGUAGAACGGCGGAUUaagGUUCCGUAUGUCACUGGUUCGAGUCCAGUCAGAGCCGC

tRNA SEQ ID NO:157(TR-18)

tRNA(AsnE2)uag-CA RNA序列:

GGCUCUGUAGUUCAGUCGGUAGAACGGCGGAUUuagGUUCCGUAUGUCACUGGUUCGAGUCCAGUCAGAGCCGC

tRNA SEQ ID NO:158(TR-19)

tRNA(AsnE2)cag-CA RNA序列:

GGCUCUGUAGUUCAGUCGGUAGAACGGCGGAUUcagGUUCCGUAUGUCACUGGUUCGAGUCCAGUCAGAGCCGC

tRNA SEQ ID NO:159(TR-20)

tRNA(Glu)gcg-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUgcgACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:160(TR-21)

tRNA(Glu)ccg-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUccgACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:161(TR-22)

tRNA(Glu)aau-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUaauACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

tRNA SEQ ID NO:162(TR-23)

tRNA(Glu)cau-CA RNA序列:

GUCCCCUUCGUCUAGAGGCCCAGGACACCGCCCUcauACGGCGGUAACAGGGGUUCGAAUCCCCUAGGGGACGC

使用氨酰pCpA制备混合氨酰tRNA溶液

通过加入无核酸酶的水将溶液调节至25μM转录的tRNA(Glu)aga-CA(SEQ ID NO:77(TR-1))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(NewEngland Biolabs)和0.25mM氨酰pCpA(通过专利文献(WO2018143145A1)中描述的方法合成的化合物TS24的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

向连接反应液中加入乙酸钠使浓度为0.3M,进行苯酚-氯仿萃取制备化合物AAtR-1。

类似地,通过上述方法将转录的tRNA(Glu)uga-CA(SEQ ID NO:78(TR-2))与氨酰pCpA(SS15)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-2。

类似地,通过上述方法将lig-tRNA(Glu)uga-CA(SEQ ID NO:56(UR-1))连接至氨酰pCpA(SS15)。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-3。

类似地,通过上述方法将tRNA(Glu)Lga-CA(SEQ ID NO:57(LR-1))与氨酰pCpA(SS15)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-4。

类似地,通过上述方法将转录的tRNA(Glu)uga-CA(SEQ ID NO:79(TR-3))与氨酰pCpA(ts14;通过专利文献(WO2018143145A1)中描述的方法合成)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-5。

将三种化合物:化合物AAtR-1、化合物AAtR-2和化合物AAtR-5的苯酚-氯仿萃取物等量混合,并将混合的氨酰tRNA溶液(化合物AAtR-1、化合物AAtR-2和化合物AAtR-5的混合溶液)进行乙醇沉淀以回收化合物。

将三种化合物:化合物AAtR-1、化合物AAtR-3和化合物AAtR-5的苯酚-氯仿萃取物等量混合,并将混合的氨酰tRNA溶液(化合物AAtR-1、化合物AAtR-3和化合物AAtR-5的混合溶液)进行乙醇沉淀以回收化合物。

将三种化合物:化合物AAtR-1、化合物AAtR-4和化合物AAtR-5的苯酚-氯仿萃取物等量混合,并将混合的氨酰tRNA溶液(化合物AAtR-1、化合物AAtR-4和化合物AAtR-5的混合溶液)进行乙醇沉淀以回收化合物。

通过加入无核酸酶的水将反应溶液调节至25μM转录的tRNA(Glu)aag-CA(SEQ IDNO:80(TR-4))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(New England Biolabs)和0.25mM氨酰化pCpA(ts14的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰化pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

向连接反应溶液中加入乙酸钠使浓度为0.3M,进行苯酚-氯仿萃取制备化合物AAtR-6。

类似地,通过上述方法将转录的tRNA(Glu)uag-CA(SEQ ID NO:81(TR-5))与氨酰化pCpA(SS14)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-7。

类似地,通过上述方法将tRNA(Glu)Lag-CA(SEQ ID NO:59(LR-2))与氨酰化pCpA(SS14)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-8。

类似地,通过上述方法将tRNA(Glu)cag-CA(SEQ ID NO:82(TR-6))与氨酰化pCpA(TS124)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-9。

将三种化合物:化合物AAtR-6、化合物AAtR-7和化合物AAtR-9的苯酚-氯仿萃取物等量混合,并将混合氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-7和化合物AAtR-9的混合溶液)进行乙醇沉淀以回收化合物。

将三种化合物:化合物AAtR-6、化合物AAtR-8和化合物AAtR-9的苯酚-氯仿萃取物等量混合,并将混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-8和化合物AAtR-9的混合溶液)进行乙醇沉淀以回收化合物。

通过加入无核酸酶的水将溶液调节至25μM转录的tRNA(Glu)aac-CA(SEQ ID NO:83(TR-7))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(NewEngland Biolabs)和0.25mM氨酰化pCpA(ts14的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰化pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

向连接反应溶液中加入乙酸钠使浓度为0.3M,进行苯酚-氯仿萃取制备化合物AAtR-10。

类似地,通过上述方法将转录的tRNA(Glu)uac-CA(SEQ ID NO:84(TR-8))与氨酰化pCpA(SS14)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-11。

类似地,通过上述方法将tRNA(Glu)Lac-CA(SEQ ID NO:61(LR-3))与氨酰化pCpA(SS14)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-12。

类似地,通过上述方法将tRNA(Glu)cac-CA(SEQ ID NO:85(TR-9))与氨酰化pCpA(TS24)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-13。

将三种化合物:化合物AAtR-10、化合物AAtR-11和化合物AAtR-13的苯酚-氯仿萃取物等量混合,并将混合的氨酰化tRNA溶液(化合物AAtR-10、化合物AAtR-11和化合物AAtR-13的混合溶液)进行乙醇沉淀以回收化合物。

将三种化合物:化合物AAtR-10、化合物AAtR-12和化合物AAtR-13的苯酚-氯仿萃取物等量混合,并将混合的氨酰tRNA溶液(化合物AAtR-10、化合物AAtR-12和化合物AAtR-13的混合溶液)进行乙醇沉淀以回收化合物。

通过加入无核酸酶的水将溶液调节至25μM转录的tRNA(Glu)gcc-CA(SEQ ID NO:86(TR-10))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(New England Biolabs)和0.25mM氨酰化pCpA(TS24的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰化pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

向连接反应溶液中加入乙酸钠使浓度为0.3M,进行苯酚-氯仿萃取制备化合物AAtR-14。

类似地,通过上述方法将转录的tRNA(Glu)ucc-CA(SEQ ID NO:87(TR-11))与氨酰化pCpA(SS14)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-15。

类似地,通过上述方法将tRNA(Glu)Lcc-CA(SEQ ID NO:63(LR-4))与氨酰化pCpA(SS14)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-16。

类似地,通过上述方法将tRNA(Glu)ccc-CA(SEQ ID NO:88(TR-12))与氨酰化pCpA(TS16)连接。向连接反应溶液中加入乙酸钠至0.3M,进行苯酚-氯仿萃取制备化合物AAtR-17。

将三种化合物:化合物AAtR-14、化合物AAtR-15和化合物AAtR-17的苯酚-氯仿萃取物以1:2:1的比例混合,并将混合的氨酰化tRNA溶液(化合物AAtR-14、化合物AAtR-15和化合物AAtR-17的混合溶液)进行乙醇沉淀以回收化合物。

将三种化合物:化合物AAtR-14、化合物AAtR-16和化合物AAtR-17的苯酚-氯仿萃取物以1:2:1的比例混合,并将混合的氨酰化tRNA溶液(化合物AAtR-14、化合物AAtR-16和化合物AAtR-17的混合溶液)进行乙醇沉淀以回收化合物。

在加入翻译混合物之前,将混合的氨酰化tRNA溶液立即溶解在1mM乙酸钠中。

为了制备化合物AAt-19,通过加入无核酸酶的水将溶液调节至25μM转录的tRNA(Asp)aag-CA(SEQ ID NO:153(TR-14))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(New England Biolabs)和0.25mM氨酰化pCpA(通过专利文献(WO2018143145A1)中描述的方法合成的化合物ts14的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰化pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

类似地,通过上述方法将转录的tRNA(Asp)uag-CA(SEQ ID NO:154(TR-15))与氨酰化pCpA(SS15)连接,以制备化合物AAtR-20。

类似地,通过上述方法将转录的tRNA(Asp)Lag-CA(SEQ ID NO:134(TR-5))与氨酰化pCpA(SS15)连接,以制备化合物AAtR-21。

类似地,通过上述方法将转录的tRNA(Asp)cag-CA(SEQ ID NO:155(TR-16))与氨酰化pCpA(TS24)连接,以制备化合物AAtR-22。

在各连接液中加入0.3M乙酸钠和苯酚-氯仿溶液,混合连接产物,用苯酚-氯仿萃取混合物,通过乙醇沉淀收集。

具体而言,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物:化合物AAtR-19、化合物AAtR-20和化合物AAtR-22中,将它们等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-19、化合物AAtR-20和化合物AAtR-22的混合溶液)。

类似地,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物:化合物AAtR-19、化合物AAtR-21和化合物AAtR-22中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-19、化合物AAtR-21和化合物AAtR-22的混合溶液)。

为了制备化合物AAtR-23,通过加入无核酸酶的水将溶液调节至25μM转录的tRNA(AsnE2)aag-CA(SEQ ID NO:156(TR-17))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(New England Biolabs)和0.25mM氨酰化pCpA(通过专利文献(WO2018143145A1)中描述的方法合成的化合物ts14的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰化pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

类似地,通过上述方法将转录的tRNA(AsnE2)uag-CA(SEQ ID NO:157(TR-18))与氨酰化pCpA(SS15)连接,以制备化合物AAtR-24。

类似地,通过上述方法将tRNA(AsnE2)Lag-CA(SEQ ID NO:137(TR-6))与氨酰化pCpA(SS15)连接,以制备化合物AAtR-25。

类似地,通过上述方法将转录的tRNA(AsnE2)cag-CA(SEQ ID NO:158(TR-19))与氨酰化pCpA(TS24)连接,以制备化合物AAtR-26。

在各连接溶液中加入0.3M乙酸钠和苯酚-氯仿溶液后,混合连接产物,用苯酚-氯仿萃取混合物,通过乙醇沉淀收集。

具体而言,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物化合物AAtR-23、化合物AAtR-24和化合物AAtR-26中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-23、化合物AAtR-24和化合物AAtR-26的混合溶液)。

类似地,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物化合物AAtR-23、化合物AAtR-25和化合物AAtR-26中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-23、化合物AAtR-25和化合物AAtR-26的混合溶液)。

为了制备化合物AAtR-6,通过加入无核酸酶的水将溶液调节至25μM转录的tRNA(Glu)aag-CA(SEQ ID NO:80(TR-4))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(New England Biolabs)和0.25mM氨酰化pCpA(ts14的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰化pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

类似地,通过上述方法将转录的tRNA(Glu)cag-CA(SEQ ID NO:82(TR-6))与氨酰化pCpA(TS24)连接,以制备化合物AAtR-9。

类似地,通过上述方法将tRNA(Glu)uag-CA(SEQ ID NO:81(TR-5))与氨酰化pCpA(SS16)连接,以制备化合物AAtR-27。

类似地,通过上述方法将转录的tRNA(Glu)Lag-CA(SEQ ID NO:59(LR-2))与氨酰化pCpA(SS16)连接,以制备化合物AAtR-28。

类似地,通过上述方法将转录的tRNA(Glu)uag-CA(SEQ ID NO:81(TR-5))与氨酰化pCpA(SS39)连接,以制备化合物AAtR-29。

类似地,通过上述方法将tRNA(Glu)Lag-CA(SEQ ID NO:59(LR-2))与氨酰化pCpA(SS39)连接,以制备化合物AAtR-30。

类似地,通过上述方法将转录的tRNA(Glu)uag-CA(SEQ ID NO:81(TR-5))与氨酰化pCpA(SS40)连接,以制备化合物AAtR-31。

类似地,通过上述方法将tRNA(Glu)Lag-CA(SEQ ID NO:59(LR-2))与氨酰化pCpA(SS40)连接,以制备化合物AAtR-32。

在各连接溶液中加入0.3M乙酸钠和苯酚-氯仿溶液后,混合连接产物,用苯酚-氯仿萃取混合物,通过乙醇沉淀收集。

具体而言,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物:化合物AAtR-6、化合物AAtR-27和化合物AAtR-9中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-28和化合物AAtR-9的混合溶液)。

类似地,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物:化合物AAtR-6、化合物AAtR-28和化合物AAtR-9中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-28和化合物AAtR-9的混合溶液)。

类似地,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物:化合物AAtR-6、化合物AAtR-29和化合物AAtR-9中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-29和化合物AAtR-9的混合溶液)。

类似地,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物:化合物AAtR-6、化合物AAtR-30和化合物AAtR-9中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-30和化合物AAtR-9的混合溶液)。

类似地,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物:化合物AAtR-6、化合物AAtR-31和化合物AAtR-9中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-31和化合物AAtR-9的混合溶液)。

类似地,将0.3M乙酸钠和苯酚-氯仿溶液加入到三种连接产物:化合物AAtR-6、化合物AAtR-32和化合物AAtR-9中,将这些等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-32和化合物AAtR-9的混合溶液)。

在连接产物化合物AAtR-9中加入0.3M乙酸钠和苯酚-氯仿溶液,混合物用苯酚-氯仿提取,通过乙醇沉淀收集,制备氨酰化tRNA。

为了制备化合物AAtR-33,通过加入无核酸酶的水将溶液调节至25μM转录的tRNA(Glu)gcg-CA(SEQ ID NO:159(TR-20))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(New England Biolabs)和0.25mM氨酰化pCpA(通过专利文献(WO2018143145A1)中描述的方法合成的化合物TS24的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰化pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

类似地,通过上述方法将tRNA(Glu)Lcg-CA(SEQ ID NO:140(LR-7))与氨酰化pCpA(SS14)连接,以制备化合物AAtR-34。

类似地,通过上述方法将转录的tRNA(Glu)ccg-CA(SEQ ID NO:160(LR-21))与氨酰化pCpA(ts14)连接,以制备化合物AAtR-35。

类似地,通过上述方法将转录的tRNA(Glu)aau-CA(SEQ ID NO:161(LR-22))与氨酰化pCpA(ts14)连接,以制备化合物AAtR-36。

类似地,通过上述方法将tRNA(Glu)Lau-CA(SEQ ID NO:142(LR-8))与氨酰化pCpA(SS14)连接,以制备化合物AAtR-37。

类似地,通过上述方法将转录的tRNA(Glu)cau-CA(SEQ ID NO:162(TR-23))与氨酰化pCpA(TS24)连接,以制备化合物AAtR-38。

在各连接溶液中加入0.3M乙酸钠和苯酚-氯仿溶液后,混合连接产物,用苯酚-氯仿萃取混合物,通过乙醇沉淀收集。

具体而言,将0.3M乙酸钠和苯酚-氯仿溶液加入到两种连接产物化合物AAtR-33和化合物AAtR-35中,这些以等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-33和化合物AAtR-35的混合溶液)。

类似地,将0.3M乙酸钠和苯酚-氯仿溶液加入到两种连接产物化合物AAtR-36和化合物AAtR-38中,将这些以等量混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-36和化合物AAtR-38的混合溶液)。

在连接产物化合物AAtR-37中加入0.3M乙酸钠和苯酚-氯仿溶液,混合物用苯酚-氯仿萃取,乙醇沉淀收集,以制备氨酰化tRNA。

通过上述方法将转录的tRNA(Glu)aag-CA(SEQ ID NO:80(TR-4))与氨酰化pCpA(ts14)连接,以制备化合物AAtR-6。

类似地,通过上述方法将tRNA(Glu)cag-CA(SEQ ID NO:82(TR-6))与氨酰化pCpA(TS24)连接,以制备化合物AAtR-9。

在各连接溶液中加入0.3M乙酸钠和苯酚-氯仿溶液后,混合连接产物,用苯酚-氯仿萃取混合物,通过乙醇沉淀收集。

具体而言,将0.3M乙酸钠和苯酚-氯仿溶液加入到两种连接产物化合物AAtR-6和化合物AAtR-9中,将这些以1:2的比例混合。然后用苯酚-氯仿萃取混合物并通过乙醇沉淀收集,以制备混合的氨酰化tRNA溶液(化合物AAtR-6和化合物AAtR-9的混合溶液)。

通过上述方法将转录的tRNA(Glu)uag-CA(SEQ ID NO:81(TR-5))与氨酰化pCpA(SS15)连接,以制备化合物AAtR-39。

类似地,通过上述方法将tRNA(Glu)(Agm)ag-CA(SEQ ID NO:138(AR-1))与氨酰化pCpA(SS15)连接,以制备化合物AAtR-40。

向各连接反应溶液中加入0.3M乙酸钠和苯酚-氯仿溶液,然后进行苯酚-氯仿萃取和乙醇沉淀进行回收。

使用氨酰pCpA制备起始子氨酰化tRNA

通过加入无核酸酶的水将溶液调节至25μM转录的tRNA(fMet)cau-CA(SEQ ID NO:89(TR-13))、50mM HEPES-KOH pH7.5、20mM MgCl2、1mM ATP、0.6单位/μL T4 RNA连接酶(New England Biolabs)和0.25mM氨酰化pCpA(MT01的DMSO溶液)制备反应溶液,连接反应在15℃进行45分钟。需要注意的是,在加入T4 RNA连接酶和氨酰化pCpA之前,将反应溶液加热至95℃2分钟,然后在室温下静置5分钟,以预先重新折叠tRNA。

向连接反应溶液中加入乙酸钠使浓度为0.3M,进行苯酚-氯仿萃取,通过乙醇沉淀回收起始子氨酰基tRNA(化合物AAtR-18)。

在加入翻译混合物之前,立即将起始子氨酰化tRNA溶解在1mM乙酸钠中。

化合物AAtR-1SEQ ID NO:90

dA-tRNA(Glu)aga

化合物AAtR-2SEQ ID NO:91

SPh2Cl-tRNA(Glu)uga

化合物AAtR-3SEQ ID NO:92

SPh2Cl-lig-tRNA(Glu)uga

化合物AAtR-4SEQ ID NO:93

SPh2Cl-tRNA(Glu)Lga

化合物AAtR-5SEQ ID NO:94

nBuG-tRNA(Glu)cga

化合物AAtR-6SEQ ID NO:95

nBuG-tRNA(Glu)aag

化合物AAtR-7SEQ ID NO:96

Pic2-tRNA(Glu)uag

化合物AAtR-8SEQ ID NO:97

Pic2-tRNA(Glu)Lag

化合物AAtR-9SEQ ID NO:98

dA-tRNA(Glu)cag

化合物AAtR-10SEQ ID NO:99

nBuG-tRNA(Glu)aac

化合物AAtR-11SEQ ID NO:100

Pic2-tRNA(Glu)uac

化合物AAtR-12SEQ ID NO:101

Pic2-tRNA(Glu)Lac

化合物AAtR-13SEQ ID NO:102

dA-tRNA(Glu)cac

化合物AAtR-14SEQ ID NO:103

dA-tRNA(Glu)gcc

化合物AAtR-15SEQ ID NO:104

Pic2-tRNA(Glu)ucc

化合物AAtR-16SEQ ID NO:105

Pic2-tRNA(Glu)Lcc

化合物AAtR-17SEQ ID NO:106

MeHph-tRNA(Glu)ccc

化合物AAtR-18SEQ ID NO:107

BdpFL-Phe-tRNA(fMet)cau

化合物AAtR-19SEQ ID NO:175

nBuG-tRNA(Asp)aag

化合物AAtR-20SEQ ID NO:176

SPh2Cl-tRNA(Asp)uag

化合物AAtR-21SEQ ID NO:177

SPh2Cl-tRNA(Asp)Lag

化合物AAtR-22SEQ ID NO:178

dA-tRNA(Asp)cag

化合物AAtR-23SEQ ID NO:179

nBuG-tRNA(AsnE2)aag

化合物AAtR-24SEQ ID NO:180

SPh2Cl-tRNA(AsnE2)uag

化合物AAtR-25SEQ ID NO:181

SPh2Cl-tRNA(AsnE2)Lag

化合物AAtR-26SEQ ID NO:182

dA-tRNA(AsnE2)cag

化合物AAtR-27SEQ ID NO:183

MeHph-tRNA(Glu)uag

化合物AAtR-28SEQ ID NO:184

MeHph-tRNA(Glu)Lag

化合物AAtR-29SEQ ID NO:185

F3Cl-tRNA(Glu)uag

化合物AAtR-30SEQ ID NO:186

F3Cl-tRNA(Glu)Lag

化合物AAtR-31SEQ ID NO:187

SiPen-tRNA(Glu)uag

化合物AAtR-32SEQ ID NO:188

SiPen-tRNA(Glu)Lag

化合物AAtR-33SEQ ID NO:189

dA-tRNA(Glu)gcg

化合物AAtR-34SEQ ID NO:190

Pic2-tRNA(Glu)Lcg

化合物AAtR-35SEQ ID NO:191

nBuG-tRNA(Glu)ccg

化合物AAtR-36SEQ ID NO:192

nBuG-tRNA(Glu)aau

化合物AAtR-37SEQ ID NO:193

Pic2-tRNA(Glu)Lau

化合物AAtR-38SEQ ID NO:194

dA-tRNA(Glu)cau

化合物AAtR-39SEQ ID NO:195

SPh2Cl-tRNA(Glu)uag

化合物AAtR-40SEQ ID NO:196

SPh2Cl-tRNA(Glu)(Agm)ag

实施例12肽的翻译合成

接下来,进行实验以确认在存在三种氨酰化tRNA的情况下区分一个密码子盒中的三个氨基酸。具体地,使用不含赖胞苷修饰的tRNA的混合的氨酰化tRNA溶液(化合物AAtR-1、化合物AAtR-2和化合物AAtR-5的混合溶液;化合物AAtR-1、化合物AAtR-3和化合物AAtR-5的混合溶液;化合物AAtR-6、化合物AAtR-7和化合物AAtR-9的混合溶液;化合物AAtR-10、化合物AAtR-11和化合物AAtR-13的混合溶液;和化合物AAtR-14、化合物AAtR-15和化合物AAtR-17的混合溶液)或使用含有赖胞苷修饰的tRNA的混合的氨酰化tRNA溶液(化合物AAtR-1、化合物AAtR-4和化合物AAtR-5的混合溶液;化合物AAtR-6、化合物AAtR-8和化合物AAtR-9的混合溶液;化合物AAtR-10、化合物AAtR-12和化合物AAtR-13的混合溶液;和化合物AAtR-14、化合物AAtR-16和化合物AAtR-17的混合溶液),翻译含有在同一密码子盒的三个密码子中的任何一个且其余序列(SEQ ID NO:120(mR-1)至SEQ ID NO:131(mR-12)的模板mRNA)具有相同序列的模板mRNA,以翻译合成肽化合物。

使用的翻译系统是PURE系统,一种原核生物衍生的重建无细胞蛋白质合成系统。具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:120(mR-1)、SEQ ID NO:121(mR-2)或SEQ ID NO:122(mR-3)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μM EF-G、0.24μM RF2、0.17μM RF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、54μM EF-Ts,1μM EF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mM PGA,0.09μMGlyRS,0.4μM IleRSμM、0.68μM PheRS、0.16μM ProRS和0.09μM ThrRS)中,将混合的氨酰化tRNA溶液(化合物AAtR-1、化合物AAtR-2和化合物AAtR-5的混合溶液;化合物AAtR-1、化合物AAtR-3和化合物AAtR-5的混合溶液;或化合物AAtR-1、化合物AAtR-4和化合物AAtR-5的混合溶液)以30μM添加到翻译反应混合物中,并在37℃下放置1小时。

还对其他序列(SEQ ID NO:123(mR-4)、SEQ ID NO:124(mR-5)或SEQ ID NO:125(mR-6))进行了无细胞翻译。

具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:123(mR-4)、SEQ ID NO:124(mR-5)或SEQ ID NO:125(mR-6)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μM EF-G、0.24μM RF2、0.17μM RF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、35μM EF-Ts,1μM EF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mM PGA,0.09μM GlyRS,0.4μM IleRS、0.68μM PheRS、0.16μM ProRS和0.09μM ThrRS)中,将混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-7和化合物AAtR-9的混合溶液;或化合物AAtR-6、化合物AAtR-8和化合物AAtR-9的混合溶液)以30μM添加到翻译反应混合物中,并在37℃下放置1小时。

还对其他序列(SEQ ID NO:126(mR-7)、SEQ ID NO:127(mR-8)或SEQ ID NO:128(mR-9))进行了无细胞翻译。

具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:126(mR-7)、SEQ ID NO:127(mR-8)或SEQ ID NO:128(mR-9)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μM EF-G、0.24μM RF2、0.17μM RF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、35μM EF-Ts,1μM EF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mM PGA,0.09μM GlyRS,0.4μM IleRS、0.68μM PheRS、0.16μM ProRS和0.09μM ThrRS)中,将混合的氨酰化tRNA溶液(化合物AAtR-10、化合物AAtR-11和化合物AAtR-13的混合溶液;或化合物AAtR-10、化合物AAtR-12和化合物AAtR-13的混合溶液)以30μM添加到翻译反应混合物中,并在37℃下放置1小时。

还对其他序列(SEQ ID NO:129(mR-10)、SEQ ID NO:130(mR-11)或SEQ ID NO:131(mR-12))进行了无细胞翻译。

具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:129(mR-10)、SEQ ID NO:130(mR-11)或SEQ ID NO:131(mR-12)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰化tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μM EF-G、0.24μMRF2、0.17μM RF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、54μM EF-Ts,1μMEF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mMPGA,0.4μM IleRS、0.04μM LeuRS、0.68μM PheRS、0.16μM ProRS和0.09μM ThrRS)中,将混合的氨酰化tRNA溶液(化合物AAtR-14、化合物AAtR-15和化合物AAtR-17的混合溶液;或化合物AAtR-14、化合物AAtR-16和化合物AAtR-17的混合溶液)以40μM添加到翻译反应混合物中,并在37℃下放置1小时。

模板mRNA、预期的翻译的肽化合物和肽的分子量(计算值)在下表6中示出。

[表6]

接下来,通过使用主体序列与上一节的tRNA主体序列不同的tRNA,进行实验以确认在存在三种氨酰化tRNA的情况下,一个密码子盒中的三种氨基酸的区分。具体地,使用不含赖胞苷修饰的tRNA的混合的氨酰化tRNA溶液(化合物AAtR-19、化合物AAtR-20和化合物AAtR-22的混合溶液;和化合物AAtR-23、化合物AAtR-24和化合物AAtR-26的混合溶液)或使用含有赖胞苷修饰的tRNA的混合氨酰tRNA溶液(化合物AAtR-19、化合物AAtR-21和化合物AAtR-22的混合溶液;以及化合物AAtR-23、化合物AAtR-25和化合物AAtR-26的混合溶液),将包含在同一密码子盒中的三个密码子中的任何一个且其余序列的序列相同的的模板mRNA(SEQ ID NO:123(mR-4)、SEQ ID NO:124(mR-5)和SEQ ID NO:125(mR-6)的模板mRNA)进行翻译,以翻译合成肽化合物。

使用的翻译系统是PURE系统,一种原核生物衍生的重建无细胞蛋白质合成系统。具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:123(mR-4)、SEQ ID NO:124(mR-5)或SEQ ID NO:125(mR-6)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰化tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μM EF-G、0.24μM RF2、0.17μMRF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、54μM EF-Ts,1μM EF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mM PGA,0.09μMGlyRS,0.4μM IleRSμM、0.68μM PheRS、0.16μM ProRS和0.09μM ThrRS)中,将混合的氨酰化tRNA溶液(化合物AAtR-19、化合物AAtR-20和化合物AAtR-22的混合溶液;化合物AAtR-19、化合物AAtR-21和化合物AAtR-22的混合溶液;化合物AAtR-23、化合物AAtR-24和化合物AAtR-26的混合溶液或化合物AAtR-23、化合物AAtR-25和化合物AAtR-26的混合溶液)以30μM添加到翻译反应混合物中,并在37℃下放置1小时。

模板mRNA、预期的翻译的肽化合物和肽的分子量(计算值)在下表7中示出。

[表7]

接下来,将除上节赖胞苷修饰的tRNA中氨酰化的氨基酸以外的氨基酸在赖胞苷修饰的tRNA中进行氨酰化,并进行翻译实验以确认在存在氨酰化tRNA的情况下,一个密码子盒中三种氨基酸的区分。具体地,使用不含赖胞苷修饰的tRNA的混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-27和化合物AAtR-9的混合溶液;化合物AAtR-6、化合物AAtR-29和化合物AAtR-9的混合溶液;和化合物AAtR-6、化合物AAtR-31和化合物AAtR-9的混合溶液)或使用含有赖胞苷修饰的tRNA的混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-28和化合物AAtR-9的混合溶液;化合物AAtR-6、化合物AAtR-30和化合物AAtR-9的混合溶液;化合物AAtR-6、化合物AAtR-32和化合物AAtR-9的混合溶液),将包含在同一密码子盒中的三个密码子中的任何一个且其余序列的序列相同的模板mRNA(SEQ ID NO:123(mR-4)、SEQ IDNO:124(mR-5)和SEQ ID NO:125(mR-6)的模板mRNA)进行翻译,以翻译合成肽化合物。

使用的翻译系统是PURE系统,一种原核生物衍生的重建无细胞蛋白质合成系统。具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:123(mR-4)、SEQ ID NO:124(mR-5)或SEQ ID NO:125(mR-6)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μM EF-G、0.24μM RF2、0.17μM RF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、49.3μM EF-Ts,1μM EF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mM PGA,0.09μMGlyRS,0.4μM IleRS、0.68μM PheRS、0.16μM ProRS和0.09μM ThrRS)中,将混合的氨酰化tRNA溶液(化合物AAtR-6、化合物AAtR-27和化合物AAtR-9的混合溶液;或化合物AAtR-6、化合物AAtR-28和化合物AAtR-9的混合溶液)以30μM添加到翻译反应混合物中,并在37℃下放置1小时。

类似地,将30μM化合物AAtR-6、化合物AAtR-29和化合物AAtR-9的混合溶液或化合物AAtR-6、化合物AAtR-30和化合物AAtR-9的混合溶液,和10μM化合物AAtR-9添加到上述最多含有起始子氨酰化tRNA的翻译反应混合物中,并在37℃下放置一小时。

类似地,将30μM化合物AAtR-6、化合物AAtR-31和化合物AAtR-9的混合溶液或化合物AAtR-6、化合物AAtR-32和化合物AAtR-9的混合溶液,和10μM化合物AAtR-9添加到上述最多含有起始子氨酰化tRNA的翻译反应混合物中,并在37℃下放置一小时。

模板mRNA、预期的翻译的肽化合物和肽的分子量(计算值)在下表8中示出。

[表8]

进一步扩大了感兴趣的密码子盒,并进行了实验以评估赖胞苷修饰的tRNA的区分效果。

具体地,使用含有赖胞苷修饰的tRNA的混合的氨酰化tRNA溶液和不含赖胞苷修饰的tRNA的混合的氨酰化tRNA溶液,翻译含有在同一密码子盒中的三个密码子中的任何一个且其余序列相同的模板mRNA(SEQ ID NO:169(mR-13)、SEQ ID NO:170(mR-14),和SEQ IDNO:171(mR-15),或SEQ ID NO:172(mR-16)、SEQ ID NO:173(mR-17)和SEQ ID NO:174(mR-18)的模板mRNA),以翻译合成肽化合物。

使用的翻译系统是PURE系统,一种原核生物衍生的重建无细胞蛋白质合成系统。具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:169(mR-13)、SEQ ID NO:170(mR-14)或SEQ ID NO:171(mR-15)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μM EF-G、0.24μM RF2、0.17μMRF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、49.3μM EF-Ts,1μM EF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mM PGA,0.09μM GlyRS,0.4μM IleRS、0.68μM PheRS、0.16μM ProRS和0.09μM ThrRS)中,将30μM的混合的氨酰化tRNA溶液(化合物AAtR-33和化合物AAtR-35的混合溶液)和10μM的氨酰tRNA(化合物AAtR-34)添加到翻译反应混合物中,并在37℃下放置1小时。

类似地,对于其他的密码子盒,使用的翻译系统是PURE系统,一种原核生物衍生的重建无细胞蛋白质合成系统。具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:172(mR-16)、SEQ ID NO:173(mR-17)或SEQ ID NO:174(mR-18)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μMEF-G、0.24μM RF2、0.17μM RF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、49.3μM EF-Ts,1μM EF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mM PGA,0.09μM GlyRS,0.4μM IleRS、0.68μM PheRS、0.16μM ProRS、0.09μMThrRS、0.02μM ValRS、2.73μM AlaRS、0.04μM LeuRS和0.04μM SerRS)中,将30μM的氨酰化tRNA混合溶液(化合物AAtR-36和化合物AAtR-38的混合溶液)和10μM的氨酰化tRNA(化合物AAtR-37)添加到翻译反应混合物中,并在37℃下放置1小时。

模板mRNA、预期的翻译的肽化合物和肽的分子量(计算值)在下表9中示出。

[表9]

接下来,为了确认胍丁胞苷修饰的效果,进行实验以确认在存在三种制备的氨酰化tRNA的情况下,对单个密码子盒中的三种氨基酸的区分。具体地,含有在同一密码子盒中的三个密码子中的任何一个并且其余序列相同的模板mRNA(SEQ ID NO:123(mR-4)、SEQ IDNO:124(mR-5)和SEQ ID NO:125(mR-6)的模板mRNA)在翻译系统中反应,在该系统中已将氨酰化tRNA(AAtR-39)或氨酰化胍丁胞苷修饰的tRNA(AAtR-40)添加到混合的氨酰化tRNA溶液(化合物AAtR-6和化合物AAtR-9的混合溶液)中,以翻译合成肽化合物。

使用的翻译系统是PURE系统,一种原核生物衍生的重建无细胞蛋白质合成系统。具体地,合成如下进行:将1μM模板mRNA(SEQ ID NO:123(mR-4)、SEQ ID NO:124(mR-5)或SEQ ID NO:125(mR-6)),一组分别为0.25mM的在各自的模板mRNA中编码的天然氨基酸和10μM的起始子氨酰tRNA(化合物AAtR-18)添加到翻译溶液(1mM GTP、1mM ATP、20mM磷酸肌酸、50mM HEPES-KOH pH7.6、100mM乙酸钾、10mM乙酸镁、2mM亚精胺、1mM二硫苏糖醇、1.5mg/mL大肠杆菌MRE600(RNase阴性)衍生的tRNA(罗氏)、0.26μM EF-G、0.24μM RF2、0.17μM RF3、0.5μM RRF、4μg/mL肌酸激酶、3μg/mL肌激酶、2单位/mL无机焦磷酸酶、1.1μg/mL核苷二磷酸激酶、2.7μM IF1、0.4μM IF2、1.5μM IF3、40μM EF-Tu、49.3μM EF-Ts,1μM EF-P-Lys,0.4单位/μL RNasein核糖核酸酶抑制剂(Promega,N2111),1.2μM核糖体,0.5mM PGA,0.09μMGlyRS,0.4μM IleRS、0.68μM PheRS、0.16μM ProRS和0.09μM ThrRS)中,将30μM的氨酰化tRNA混合溶液(化合物AAtR-6和化合物AAtR-9的混合溶液)和20μM的氨酰化tRNA(化合物AAtR-39或化合物AAtR-40)添加到翻译反应混合物中,并在37℃下放置1小时。

模板mRNA、预期的翻译的肽化合物和肽的分子量(计算值)在下表10中示出。

[表10]

从模板DNA(SEQ ID NO:108(D-14)至SEQ ID NO:119(D-25),和SEQ ID NO:163(D-36)至SEQ ID NO:168(D-41)),通过使用RiboMAX大规模RNA生产系统T7(Promega,P1300)进行体外转录反应合成了模板mRNA(SEQ ID NO:120(mr-1)至SEQ ID NO:131(mr-12),和SEQID NO:169(mr-13)至SEQ ID NO:174(mr-18)),并通过RNeasy Mini试剂盒(Qiagen)进行纯化。

模板DNA SEQ ID NO:108(D-14)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTTCTATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:109(D-15)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTTCAATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:110(D-16)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTTCGATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:111(D-17)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTCTTATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:112(D-18)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTCTAATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:113(D-19)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTCTGATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:114(D-20)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTGTTATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:115(D-21)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTGTAATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:116(D-22)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTGTGATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:117(D-23)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTCTATTTGGTATTATTCCGATTCTATAAGCTTCG

模板DNA SEQ ID NO:118(D-24)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTCTATTTGGAATTATTCCGATTCTATAAGCTTCG模板DNA SEQ ID NO:119(D-25)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTCTATTTGGGATTATTCCGATTCTATAAGCTTCG

模板DNA SEQ ID NO:163(D-36)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTCGTATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:164(D-37)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTCGAATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:165(D-38)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTATTATTGGTTTTCGGATTATTCCGATTGGTTAAGCTTCG

模板DNA SEQ ID NO:166(D-39)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTCTACTAGGTTTTATTCTACTACCGCTAGGTTAAGCTTCG

模板DNA SEQ ID NO:167(D-40)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTCTACTAGGTTTTATACTACTACCGCTAGGTTAAGCTTCG

模板DNA SEQ ID NO:168(D-41)

DNA序列:

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGACTTTTCTACTAGGTTTTATGCTACTACCGCTAGGTTAAGCTTCG

模板mRNA SEQ ID NO:120(mR-1)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUUCUAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:121(mR-2)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUUCAAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:122(mR-3)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUUCGAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:123(mR-4)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUCUUAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:124(mR-5)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUCUAAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:125(mR-6)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUCUGAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:126(mR-7)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUGUUAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNASEQ ID NO:127(mR-8)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUGUAAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:128(mR-9)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUGUGAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:129(mR-10)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUCUAUUUGGUAUUAUUCCGAUUCUAUAAGCUUCG

模板mRNA SEQ ID NO:130(mR-11)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUCUAUUUGGAAUUAUUCCGAUUCUAUAAGCUUCG

模板mRNA SEQ ID NO:131(mR-12)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUCUAUUUGGGAUUAUUCCGAUUCUAUAAGCUUCG

模板mRNA SEQ ID NO:169(mR-13)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUCGUAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:170(mR-14)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUCGAAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:171(mR-15)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUAUUAUUGGUUUUCGGAUUAUUCCGAUUGGUUAAGCUUCG

模板mRNA SEQ ID NO:172(mR-16)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUCUACUAGGUUUUAUUCUACUACCGCUAGGUUAAGCUUCG

模板mRNA SEQ ID NO:173(mR-17)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUCUACUAGGUUUUAUACUACUACCGCUAGGUUAAGCUUCG

模板mRNA SEQ ID NO:174(mR-18)

RNA序列:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGACUUUUCUACUAGGUUUUAUGCUACUACCGCUAGGUUAAGCUUCG

实施例13翻译的肽的分析

将实施例12中制备的非天然肽翻译溶液稀释十倍,然后使用LC-FLR-MS系统进行分析。通过从MS数据确定目标翻译肽的保留时间,并量化在相关保留时间处的荧光峰,从分析数据评估翻译的肽的量。在定量评估中,以实施例8合成的LCT12为标准品,制作校准曲线,通过相对定量计算含量。通过根据目标样品选择最佳条件,根据下表11中所示的条件分析LC-MS。

[表11]

作为评估的结果,仅在使用含有赖胞苷或胍丁胞苷修饰的tRNA的氨酰化tRNA混合溶液的翻译条件下,在单个密码子盒中区分了三种氨基酸。针对多个密码子盒示出了区分赖胞苷修饰的效果(图11至14、图20、图21、表12至15、表21和表22)。当将tRNA主体的核苷酸序列替换为另一个序列时,也可以证实区分效果(图15、图16、表16和表17)。此外,当将与tRNA连接的氨基酸替换为其他氨基酸时,也可以证实类似的效果(图17至19和表18至20)。经证实,胍丁胞苷修饰的tRNA也能产生与赖胞苷修饰的tRNA相同的区分效果(图22和表23)。

[表12]

这是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:UCU、UCA和UCG)。

[表13]

这是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:CUU、CUA和CUG)。

[表14]

这是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响的结果的表格(评估的密码子:GUU、GUA和GUG)。

[表15]

该是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:GGU、GGA和GGG)。

[表16]

这是示出使用Asp-tRNA主体序列,评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:CUU、CUA和CUG)。

[表17]

这是示出使用AsnE2-tRNA主体序列,评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:CUU、CUA和CUG)。

[表18]

这是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:CUU、CUA和CUG)。

[表19]

这是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:CUU、CUA和CUG)。

[表20]

这是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:CUU、CUA和CUG)。

[表21]

这是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:CGU、CGA和CGG)。

[表22]

这是示出评估存在或不存在赖胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:AUU、AUA和AUG)。

[表23]

这是示出评估存在或不存在胍丁胞苷修饰对区分在单个密码子盒中的三种氨基酸的翻译的影响结果的表格(评估的密码子:CUU、CUA和CUG)。

尽管为了便于清楚理解,已经使用实施例和说明详细描述了上述发明,但是这里的描述和说明不应被解释为限制本发明的范围。本文引用的所有专利文献和科学文献的公开内容特此通过引用整体纳入本文。

[工业适用性]

在一个实施方案中,本公开的突变tRNA的有用之处在于它们可以区分NNA密码子和NNG密码子,而根据天然遗传密码表它们没有区分。在一个实施方案中,本公开的翻译系统是有用的,因为它们比使用天然遗传密码表的翻译系统可以翻译更多种类的氨基酸(密码子扩展)。

193页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于生成纤维的交变场电极系统和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!