遗传编码的噬菌体展示的环状肽文库及其制备方法

文档序号:1909090 发布日期:2021-11-30 浏览:19次 >En<

阅读说明:本技术 遗传编码的噬菌体展示的环状肽文库及其制备方法 (Genetically encoded phage-displayed cyclic peptide libraries and methods of making the same ) 是由 W·刘 于 2019-05-20 设计创作,主要内容包括:本公开的实施方式涉及选择与靶标结合的环状肽的方法,所述方法通过将带有多种核酸的噬菌体展示文库转化进细菌宿主细胞中来进行,其中所述核酸包括具有编码至少一个半胱氨酸和至少一个非经典氨基酸的组合区域的噬菌体衣壳蛋白基因。转化导致产生具有噬菌体衣壳蛋白的噬菌体颗粒,其中半胱氨酸和非经典氨基酸相互偶联以形成环状肽文库。然后针对所需的靶标筛选噬菌体颗粒以选择结合的环状肽。然后鉴定所选择的环状肽的氨基酸序列。其他实施方式涉及构建编码所述环状肽的噬菌体展示文库的方法。本公开的进一步实施方式涉及所生产的环状肽、噬菌体展示文库和噬菌体颗粒。(Embodiments of the present disclosure relate to methods of selecting cyclic peptides that bind to a target by transforming a phage display library with a plurality of nucleic acids into a bacterial host cell, wherein the nucleic acids comprise a phage capsid protein gene having a combined region encoding at least one cysteine and at least one non-canonical amino acid. Transformation results in the production of phage particles with phage coat proteins in which cysteine and non-classical amino acids are coupled to each other to form a cyclic peptide library. The phage particles are then screened against the desired target to select for bound cyclic peptides. The amino acid sequence of the selected cyclic peptide is then identified. Other embodiments relate to methods of constructing phage display libraries encoding the cyclic peptides. Further embodiments of the disclosure relate to the cyclic peptides, phage display libraries, and phage particles produced.)

遗传编码的噬菌体展示的环状肽文库及其制备方法

关于联邦资助研究的说明

本发明是在政府支持下由国家卫生研究院(National Institutes of Health)授予的基金号R01CA161158资助完成。政府对本发明拥有一定的权利。

背景技术

由于环状肽优于其线性对应物的改进的特性,人们认为环状肽具有作为治疗剂使用的潜在用途。为了鉴定作为治疗靶标的环状肽配体,从噬菌体展示肽文库进行选择,其中半胱氨酸通过二硫键或有机接头共价偶联,这已被广泛采用并取得巨大成功。然而,这种方法有很多技术缺陷,例如体内用途有限,以及噬菌体活力有限。本公开的各种实施方式解决了上述限制。

本发明的开发由韦尔奇基金会(the Welch Foundation)部分资助,资助号为A-1715。

发明内容

在一些实施方式中,本公开涉及选择与所需靶标结合的环状肽的方法。在一些实施方式中,本公开的方法包括将带有多种核酸的噬菌体展示文库转化进细菌宿主细胞中,其中所述核酸包括具有编码至少一个半胱氨酸和至少一个非经典氨基酸的组合区域的噬菌体衣壳蛋白基因。转化导致产生含有噬菌体衣壳蛋白的噬菌体颗粒,所述噬菌体衣壳蛋白具有相互偶联以形成环状肽的半胱氨酸和非经典氨基酸。

随后,针对所需靶标对噬菌体颗粒进行筛选,从而选择出具有与所需靶标结合的环状肽的噬菌体颗粒。然后鉴定所选择的噬菌体颗粒的环状肽的氨基酸序列。

本发明的其他实施方式涉及构建编码环状肽的噬菌体展示文库的方法。在一些实施方式中,这种方法包括提供原始噬菌体展示文库,该文库具有包含组合区域的噬菌体衣壳蛋白基因的核酸,并将表达至少一个半胱氨酸和至少一个非经典氨基酸的密码子引入组合区域。随后,产生的核酸可被转化进细菌宿主细胞中,以产生噬菌体颗粒,该噬菌体颗粒含有具有组合区域中偶联的半胱氨酸和非经典氨基酸的噬菌体衣壳蛋白。

本公开的其他实施方式涉及噬菌体展示文库,其编码噬菌体衣壳蛋白的组合区域中的环状肽,其中所述环状肽在组合区域包含至少一个半胱氨酸和至少一个非经典氨基酸,它们相互偶联以形成环状肽。

本公开的其他实施方式涉及包含环状肽的噬菌体颗粒。噬菌体颗粒包括具有组合区域的噬菌体衣壳蛋白质,所述组合区域含有至少一个半胱氨酸和至少一个非经典氨基酸,它们相互偶联以形成环状肽。

本公开的其他实施方式涉及包含相互偶联的至少一个半胱氨酸和至少一个非经典氨基酸的环状肽。在一些实施方式中,本公开的环状肽抑制酶,例如TEV蛋白酶或HDAC8。

附图说明

图1阐释了代表性的、已有的和提出的用于噬菌体展示肽的环化策略。图1A显示通过半胱氨酸之间的二硫键进行环化。图1B显示了通过半胱氨酸与有机接头的共价偶联环化。图1C显示了用于半胱氨酸偶联以产生单环状肽和双环状肽的代表性有机接头。图1D显示了提出的半胱氨酸和亲电的非经典氨基酸(ncAA)之间的邻近驱动的环化。图1E显示了基于琥珀抑制性连接表型ncAA与基因型TAG突变的途径。在大肠杆菌细胞中生产在其展示肽的编码区具有TAG突变的噬菌体,该大肠杆菌细胞中具有进化的氨酰基-tRNA合成酶和琥珀抑制性tRNA,用于指定ncAA的基因纳入。

图2提供了选择与所需靶标结合的环状肽(图2A)和构建编码环状肽的噬菌体展示文库(图2B)的方法的方案。

图2C和2D提供了可以被纳入环状肽的多种非经典氨基酸的结构。

图3显示了通过半胱氨酸和经遗传方式引入的Nε-丙烯酰基-赖氨酸(AcrK)之间的迈克尔(Michael)加成环化噬菌体展示肽。图3A显示了说明半胱氨酸和缺电子的ncAA之间邻近驱动的肽环化的示意图。图3B显示了AcrK和HZC1的结构,其水中的解离产物是与丙烯酰胺选择性反应以显示强蓝色荧光的腈亚胺(nitrilimine)。图3C显示了两个超折叠体(superfolder)绿色荧光蛋白(sfGFP)衍生物,一个具有N-末端CA5X肽,另一个具有N-末端A6X肽,以及它们的荧光标记(采用HZC1)。X表示AcrK。首先蛋白质被变性,然后用SDS-PAGE分析。记录在365nm处激发的蓝色区域的凝胶内荧光。图3D显示了两个噬菌体衍生物,一个具有N-末端CA5X肽,另一个具有N-末端A6X肽,以及它们的荧光标记(采用HZC1)。噬菌体被沉淀,然后在UV光下进行荧光成像。

图4显示了所选择的TEV蛋白酶-结合性环状肽和其Kd测量。图4A显示了用于生产噬菌体-展示的6-聚环肽文库的噬菌粒结构的示意图。图4B显示了5FAM-CycTev1的结构。CycTev1是从噬菌体展示中选择的。图4C显示了5FAM-CycTev1结合TEV蛋白酶的荧光偏振分析。还包括了用无接头的5FAM-CycTev1的线性对应物的数据。图4D显示了FITC-CycTev2的结构。图4E显示了5FAM-CycTev2结合TEV蛋白酶的荧光偏振分析。还包括了无接头的5FAM-CycTev2的线性对应物的数据。

图5显示了来自噬菌体展示文库的20个分离的克隆的序列。

图6显示了针对TEV蛋白酶的每一轮选择后洗脱的噬菌体。

图7显示了HDAC8-结合的克隆的DNA测序结果和它们汇聚的肽序列。

图8显示了HDAC8-结合的克隆的其他DNA测序结果和它们汇聚的肽序列。

图9显示了所选择的环状肽配体CycH8a及其对HDAC8的结合和抑制。图9A显示了5FAM-CycH8a的结构。CycH8a的序列是从噬菌体展示中选择的。图9B显示了5FAM-CycH8a与HDAC8结合的荧光偏振分析。还包括了5FAM-CycH8a的线性对应物的数据。图9C示出了显示荧光HDAC8活性试验方案的示意图。图9D显示了使用C中所示的试验测定5FAM-CycH8a对HDAC8的抑制的IC50

图10显示了CycH8a与HDAC8二聚体结合的分子对接结果。上图显示了在HDAC8二聚体界面的两个沟处结合的不同CycH8a的构象(conforms)。下图显示了在每个沟处结合的CycH8a的最有利构象。

图11显示了A6X-sfGFP和CA5X-sfGFP的表达。

图12显示了M13KO7-g3TAA中pIII敲除的确认。将表达M13KO7-g3TAA或野生型M13KO7和CM13的大肠杆菌培养物的上清点样在含有大肠杆菌Top10 F’的顶部琼脂覆盖物上。野生型M13KO7和CM13点中斑块的存在表明有活噬菌体的存在。M13KO7-g3TAA点中斑块的缺乏证明了宿主感染所需的pIII的缺失。

图13显示了M13KO7-g3TAA噬菌粒互补试验。大肠杆菌Top10 F’被来自表达野生型pIII(左)或具有框内琥珀突变的pIII(右)的培养物上清感染。用野生型pIII上清感染的细胞的生长证实了M13KO7-g3TAA对携带有活力的pIII的噬菌粒的补充能力。

图14显示了TEV蛋白酶的表达。

图15显示了纯化的HAC8的SDS-PAGE分析。

图16显示了固相肽合成的一般过程。

图17显示了CWRDYLIX-K-5FAM(SEQ ID NO:1)的MALDI-TOF谱(计算分子量:1634.7Da)。

图18显示了CWRDYLIK-K-5FAM(SEQ ID NO:4)的MALDI-TOF谱(计算分子量:1580.7Da)。

图19显示了CWRDYLIX-K-5FAM(SEQ ID NO:1)的MALDI-TOF谱(计算分子量:1629.7Da)。

具体实施方式

应理解,上述的一般性描述和以下的详细描述都是说明性和解释性的,不对要求专利保护的主题构成限制。在本申请中,单数形式的使用包括复数形式,词语“一个”或“一种”表示“至少一个/一种”,“或”字的使用表示“和/或”,除非另有具体说明。此外,使用术语“包括”以及其它形式,如“包含”和“含有”不是限制性的。同时,除非另外具体说明,术语如“元件”或“组件”包括一个单元的元件或组件以及包括超过一个单元的元件或组件。

本文所用章节标题用于组织目的,而不应理解为限制所述内容。本申请引用的包括但不限于专利、专利申请、文章、书籍和条约在内的所有文件或文件的部分,在此通过引用全文纳入本文以用于任何目的。当一篇或多篇所结合的文献及类似材料对术语的定义与本申请对该术语的定义相抵触时,以本申请为准。

传统上,治疗药物由精确结合其受体的小分子组成。然而,由于它们的体积小,小分子在靶向涉及大的、相对平坦的、与其他分子相互作用的表面的蛋白质方面不太成功。随着重组蛋白表达技术的发展,出现了一类新的蛋白质药物,称为生物制剂。由于其体积较大,与小分子药物相比,生物制剂显示出远为优越的靶亲和性和选择性。然而,它们增大的尺寸和基于蛋白质的成分导致了较差的组织渗透性和代谢稳定性。

肽的大小介于小分子和生物制剂之间,为这两类成熟的药物提供了一个有希望的替代方案。由于比小分子药物大,肽提供了更强的效力和靶标选择性,同时保持了细胞渗透性的潜力,并且比生物制剂的制造成本低。肽也非常容易筛选。使用肽展示技术,如噬菌体展示,这一技术将展示的肽表型与基因型连接起来,一个研究人员可能在几天内筛选超过1010种独特肽的文库。尽管有这些优点,基于肽的抑制剂长期以来一直被回避,原因有二。

首先,肽在溶液中通常是非结构化的,这导致了与靶标结合时的熵罚(entropicpenalty)。第二,肽在体内应用时极易受到蛋白质水解的影响。众所周知,大环化(macrocyclization)可以帮助克服肽的一些缺点。

大环化赋予非结构化肽一定程度的构象刚性,这通常会增加肽对于其靶标的结合亲和性。环状肽对于蛋白质水解的抵抗明显更强。在一些情况下,这也导致了肽如此稳定,以至于它们已经成功地用于口服递送。

尽管肽环化通常会导致更好的药理学特性,但是环化通过筛选鉴定的线性肽可能对该肽结合靶蛋白的能力有未知的影响。目前,直接筛选环状肽文库的选择很少。

有两种方法已经被报道用于噬菌体展示肽文库的环化。一种是在两个半胱氨酸残基之间形成二硫键(图1A)。有许多关于采取这种策略生产二硫化环化肽的实例,其对靶蛋白的亲和性比其线性对应物高。虽然对一些体外应用有益,但是以这种方式环化的肽不能用于体内,因为它们不能承受还原性的细胞环境。

另一种策略是依靠亲核硫醇对小分子有机接头的反应性共价连接两个半胱氨酸(图1B)。这种策略已经成功地用于形成单环和双环的噬菌体展示肽文库,并用于选择抑制常数低至2nM的配体(图1C)。虽然在形成环化肽文库方面有效,但是这种方法修改了原始的噬菌体半胱氨酸,导致噬菌体活性低。

已经尝试构建没有表面半胱氨酸的噬菌体株。然而,这些噬菌体活性低,限制了噬菌体的生产。由于偶联半胱氨酸时的非选择性性质,目前所有的有机接头都是对称且非手性的,以避免噬菌体展示环状肽中的异质性,这对后续合成和表征所选择的环状肽提出了重大挑战。用于环化不对称的、手性的肽的对称、非手性有机接头还导致结构上的限制,这在某些情况下可能是不希望的。

因此,需要有更有效的方法以生产环状肽并针对所需要的靶标筛选它们。本公开的各种实施方式解决了这一需求。

在一些实施方式中,本公开涉及选择与所需靶标结合的环状肽的方法。在图2A中说明的一些实施方式中,本公开的方法包括将带有多个核酸的噬菌体展示文库转化进细菌宿主细胞,其中所述核酸包括具有编码至少一个半胱氨酸和至少一个非经典氨基酸的组合区域的噬菌体衣壳蛋白基因(步骤10)。转化导致产生含有噬菌体衣壳蛋白的噬菌体颗粒,所述噬菌体衣壳蛋白具有相互偶联以形成环状肽的半胱氨酸和非经典氨基酸(步骤12)。

随后,针对所需靶标对噬菌体颗粒进行筛选(步骤14),从而选择出具有与所需靶标结合的环状肽的噬菌体颗粒(步骤16)。然后鉴定所选择的噬菌体颗粒的环状肽的氨基酸序列(步骤18)。

在一些实施方式中,该筛选包括再筛选步骤,其中把所选择的噬菌体颗粒转化进细菌宿主细胞中(步骤19),以允许生产(步骤12)和筛选其他噬菌体颗粒(步骤14、16和18)。在一些实施方式中,该进一步筛选重复多次。

本公开的其他实施方式涉及构建编码环状肽的噬菌体展示文库的方法。在图2B中说明的一些实施方式中,这种方法包括:提供原始噬菌体展示文库,其具有包含组合区域的噬菌体衣壳蛋白基因的核酸(步骤20);并将表达半胱氨酸的第一密码子和表达非经典氨基酸的第二密码子中的至少一个引入组合区域(步骤22)。在其他实施方式中,包含环状肽的噬菌体颗粒是通过将噬菌体展示文库转化进细菌宿主细胞生产的(步骤24),以生产含有具有环状肽的噬菌体衣壳蛋白的噬菌体颗粒(步骤26)。

本公开的其他实施方式涉及编码环状肽的噬菌体展示文库。噬菌体展示文库包括多个具有噬菌体衣壳蛋白基因的核酸,这些基因包括具有表达至少一个半胱氨酸和至少一个非经典氨基酸的密码子的组合区域。组合区域中的半胱氨酸和非经典氨基酸相互偶联以形成环状肽。

本公开的其他实施方式涉及包含环状肽的噬菌体颗粒(如图1E中所说明的噬菌体颗粒)。噬菌体颗粒包括具有组合区域的噬菌体衣壳蛋白质,所述组合区域含有至少一个半胱氨酸和至少一个非经典氨基酸,它们相互偶联以形成环状肽。

本公开的其他实施方式涉及包含相互偶联的至少一个半胱氨酸和至少一个非经典氨基酸的环状肽。在一些实施方式中,本公开的环状肽抑制酶,例如TEV蛋白酶或HDAC8。

如本文更详细描述的,本公开的方法、环状肽、噬菌体展示文库和噬菌体颗粒可以有许多实施方式。具体地,可以利用多种方法选择环状肽。此外,可以利用多种方法构建编码多种环状肽的多种噬菌体展示文库。此外,噬菌体展示文库、噬菌体颗粒和环状肽可以编码和含有多种类型的非经典氨基酸。

核酸

本公开的噬菌体展示文库可以包括多种类型的核酸。例如,在一些实施方式中,核酸是以噬菌粒的形式存在。在一些实施方式中,核酸被封装在噬菌体中。

噬菌体衣壳蛋白基因

本公开的环状肽可由多种噬菌体衣壳蛋白基因的组合区域编码。例如,在一些实施方式中,噬菌体衣壳蛋白基因是PIII基因。

可以利用多种方法将半胱氨酸和非经典氨基酸引入噬菌体衣壳蛋白基因的组合区域。例如,在一些实施方式中,通过定点诱变引入。

在一些实施方式中,将表达半胱氨酸的第一密码子和表达非经典氨基酸的第二密码子的至少其中之一引入组合区域。在一些实施方式中(如在其中组合区域已经含有表达非经典氨基酸的密码子的实施方式中),只将表达半胱氨酸的第一密码子引入组合区域。在一些实施方式中(如在其中组合区域已经含有表达半胱氨酸的密码子的实施方式中),只将表达非经典氨基酸的第二密码子引入组合区域。在一些实施方式中(如在其中组合区域不含有表达半胱氨酸或非经典氨基酸的密码子的实施方式中),将表达半胱氨酸的第一密码子和表达非经典氨基酸的第二密码子引入组合区域。

在一些实施方式中,噬菌体衣壳蛋白基因位于IPTG-诱导型启动子附近。因此,在一些实施方式中,通过将细菌宿主细胞暴露于IPTG表达噬菌体衣壳蛋白。

针对所需靶标筛选噬菌体颗粒

本公开的环状肽选择方法可以利用各种方法来针对所需靶标筛选噬菌体颗粒。例如,在一些实施方式中,针对所需靶标通过亲和性选择进行筛选。在一些实施方式中,进行筛选通过以下方式进行:(a)用固定在表面上的所需靶标孵育噬菌体颗粒;(b)将未结合的噬菌体颗粒与结合所需靶标的噬菌体颗粒分开;以及(c)分离结合的噬菌体颗粒。在一些实施方式中,分开步骤可能通过将未结合的噬菌体颗粒从结合所需靶标的噬菌体颗粒洗去来进行。

在一些实施方式中,所需靶标可被生物素化并固定在链霉亲和素表面。在一些这种实施方式中,进行筛选可通过以下方式进行:(1)将噬菌体颗粒与固定在链霉亲和素表面的所需靶标孵育;(2)通过洗涤步骤将未结合的噬菌体颗粒与结合所需靶标的噬菌体颗粒分开;以及(3)通过利用生物素竞争性地洗脱已结合的噬菌体颗粒,或通过添加酸性缓冲液(例如,pH 2)以释放结合的噬菌体颗粒,来分离结合的噬菌体颗粒。

在一些实施方式中,筛选的结果是选择与所需靶标的配体结合位点结合的具有环状肽的噬菌体颗粒。在一些实施方式中,环状肽作为配体将噬菌体衣壳组合区域引导到所需靶标的配体结合位点。

鉴定环状肽氨基酸序列

本公开的环状肽选择方法还可以利用多种方法来鉴定环状肽氨基酸序列。例如,在一些实施方式中,通过测序所选择的噬菌体颗粒的组合区域进行鉴定。在一些实施方式中,进行鉴定通过以下方式进行:(a)纯化所选择的噬菌体颗粒;(b)将核酸从所选择的噬菌体颗粒中分离;以及(c)测序所述核酸的组合区域。

细菌宿主细胞

本公开的方法可以利用多种类型的细菌宿主细胞以生产噬菌体颗粒。在一些实施方式中,本公开的细菌宿主细胞能够翻译噬菌体衣壳蛋白基因的组合区域。在一些实施方式中,用不表达噬菌体衣壳蛋白基因的敲除辅助噬菌体共同感染细菌宿主细胞。在一些实施方式中,辅助噬菌体是CM13辅助噬菌体。在一些实施方式中,细菌宿主细胞包括带有F性菌毛的大肠杆菌。

在一些实施方式中(例如,在其中至少一个非经典氨基酸由至少一个框内琥珀密码子编码的实施方式中),细菌宿主细胞包括琥珀抑制性细菌宿主菌株。在一些实施方式中,细菌宿主细胞包含琥珀抑制子tRNA,该琥珀抑制子tRNA已经通过同源的氨酰基-tRNA合成酶由编码的非经典氨基酸氨酰基化。

在更具体的实施方式中,细菌宿主细胞是已经被三个质粒转化的细菌:(1)编码噬菌体衣壳蛋白基因的质粒,该基因在组合区域中具有至少一个框内琥珀密码子;(2)编码琥珀抑制子tRNA和同源氨酰基-tRNA合成酶的质粒,该酶能将所需非经典氨基酸连接到抑制子tRNA上;以及(3)编码除了含有组合区域的噬菌体衣壳蛋白之外的所有必需的噬菌体蛋白质的辅助噬菌体。

环状肽

本公开的环状肽一般包括与至少一个半胱氨酸偶联的至少一个非经典氨基酸。本公开的环状肽可以包括多种类型的非经典氨基酸。例如,在一些实施方式中,非经典氨基酸包括能够与环状肽中的半胱氨酸的硫基反应的亲电部分。

在一些实施方式中,非经典氨基酸包括但不限于苯丙氨酸衍生的非经典氨基酸、赖氨酸衍生的非经典氨基酸,及其组合。

在一些实施方式中,至少一个非经典氨基酸包括但不限于含烯烃的非经典氨基酸、含炔烃的非经典氨基酸、含卤代烷的非经典氨基酸,及其组合。

在一些实施方式中,至少一个非经典氨基酸包括含烯烃的非经典氨基酸。在一些实施方式中,烯烃包括缺电子的烯烃。

在一些实施方式中,至少一个非经典氨基酸包括含炔烃的非经典氨基酸。在一些实施方式中,炔烃包括缺电子的炔烃。

在一些实施方式中,至少一个非经典氨基酸包括含卤代烷的非经典氨基酸。在一些实施方式中,含卤代烷的非经典氨基酸包括但不限于氯化物、溴化物、碘化物,及其组合。

非经典氨基酸的示例性结构示于图2C-D。在一些实施方式中,非经典氨基酸包括但不限于N6-丙烯酰基-L-赖氨酸、N6-巴豆酰基-L-赖氨酸、N6-乙烯磺酰基-L-赖氨酸、对-丙烯酰氨基-L-苯丙氨酸、对-乙烯磺酰基氨基-L-苯丙氨酸、间-丙烯酰氨基-L-苯丙氨酸、间-乙烯磺酰基氨基-L-苯丙氨酸、N6-(2-氟乙酰基)-L-赖氨酸、对-氯甲基-苯丙氨酸、间-氯甲基-L-苯丙氨酸、对-溴甲基-L-苯丙氨酸、间-溴甲基-L-苯丙氨酸、N6-(2-氯丙酰基)-L-赖氨酸、N6-(2-氯-2-甲基丙酰基)-L-赖氨酸、N6-(2-溴丙酰基)-L-赖氨酸、N6-(2-溴-2-甲基丙酰基)-L-赖氨酸、N6(2-氯乙酰基)-L-赖氨酸、N6-(3-氯丙酰基)-L-赖氨酸、N6-(4-氯丁酰)-L-赖氨酸、N6-(5-氯戊酰基)-L-赖氨酸、N6-(6-氯己酰基)-L-赖氨酸、N6-(7-氯庚酰基)-L-赖氨酸、N6-(8-氯辛酰基)-L-赖氨酸、N6-(9-氯壬酰基)-L-赖氨酸、N6-(2-溴乙酰基)-L-赖氨酸、N6-(3-溴丙酰基)-L-赖氨酸、N6-(4-溴丁酰)-L-赖氨酸、N6-(5-溴戊酰基)-L-赖氨酸、N6-(6-溴己酰基)-L-赖氨酸、N6-(7-溴庚酰基)-L-赖氨酸、N6-(8-溴辛酰基)-L-赖氨酸、N6-(9-溴壬酰基)-L-赖氨酸、N6-(2-碘乙酰基)-L-赖氨酸、N6-(3-碘丙酰基)-L-赖氨酸、N6-(4-碘丁酰)-L-赖氨酸、N6-(5-碘戊酰基)-L-赖氨酸、N6-(6-碘己酰基)-L-赖氨酸、N6-(7-碘庚酰基)-L-赖氨酸、N6-(8-碘辛酰基)-L-赖氨酸、N6-(9-碘壬酰基)-L-赖氨酸、对-(2-氯乙酰氨基)-L-苯丙氨酸、对-(3-氯丙酰氨基)-L-苯丙氨酸、对-(4-氯丁酰氨基)-L-苯丙氨酸、对-(5-氯戊酰氨基)-L-苯丙氨酸、对-(6-氯己酰氨基)-L-苯丙氨酸、对-(7-氯庚酰氨基)-L-苯丙氨酸、对-(8-氯辛酰氨基)-L-苯丙氨酸、对-(9-氯壬酰氨基)-L-苯丙氨酸、对-(2-溴乙酰氨基)-L-苯丙氨酸、对-(3-溴丙酰氨基)-L-苯丙氨酸、对-(4-溴丁酰氨基)-L-苯丙氨酸、对-(5-溴戊酰氨基)-L-苯丙氨酸、对-(6-溴己酰氨基)-L-苯丙氨酸、对-(7-溴庚酰氨基)-L-苯丙氨酸、对-(8-溴辛酰氨基)-L-苯丙氨酸、对-(9-溴壬酰氨基)-L-苯丙氨酸、对-(2-碘乙酰氨基)-L-苯丙氨酸、对-(3-碘丙酰氨基)-L-苯丙氨酸、对-(4-碘丁酰氨基)-L-苯丙氨酸、对-(5-碘戊酰氨基)-L-苯丙氨酸、对-(6-碘己酰氨基)-L-苯丙氨酸、对-(7-碘庚酰氨基)-L-苯丙氨酸、对-(8-碘辛酰氨基)-L-苯丙氨酸、对-(9-碘壬酰氨基)-L-苯丙氨酸、间-(2-氯乙酰氨基)-L-苯丙氨酸、间-(3-氯丙酰氨基)-L-苯丙氨酸、间-(4-氯丁酰氨基)-L-苯丙氨酸、间-(5-氯戊酰氨基)-L-苯丙氨酸、间-(6-氯己酰氨基)-L-苯丙氨酸、间-(7-氯庚酰氨基)-L-苯丙氨酸、间-(8-氯辛酰氨基)-L-苯丙氨酸、间-(9-氯壬酰氨基)-L-苯丙氨酸、间-(2-溴乙酰氨基)-L-苯丙氨酸、间-(3-溴丙酰氨基)-L-苯丙氨酸、间-(4-溴丁酰氨基)-L-苯丙氨酸、间-(5-溴戊酰氨基)-L-苯丙氨酸、间-(6-溴己酰氨基)-L-苯丙氨酸、间-(7-溴庚酰氨基)-L-苯丙氨酸、间-(8-溴辛酰氨基)-L-苯丙氨酸、间-(9-溴壬酰氨基)-L-苯丙氨酸、间-(2-碘乙酰氨基)-L-苯丙氨酸、间-(3-碘丙酰氨基)-L-苯丙氨酸、间-(4-碘丁酰氨基)-L-苯丙氨酸、间-(5-碘戊酰氨基)-L-苯丙氨酸、间-(6-碘己酰氨基)-L-苯丙氨酸、间-(7-碘庚酰氨基)-L-苯丙氨酸、间-(8-碘辛酰氨基)-L-苯丙氨酸、间-(9-碘壬酰氨基)-L-苯丙氨酸、对-((氯甲基)亚磺酰氨基)-L-苯丙氨酸、对-((2-氯乙基)亚磺酰氨基)-L-苯丙氨酸、对-((3-氯丙基)亚磺酰氨基)-L-苯丙氨酸、对-((4-氯丁基)亚磺酰氨基)-L-苯丙氨酸、对-((5-氯戊基)亚磺酰氨基)-L-苯丙氨酸、对-((6-氯己基)亚磺酰氨基)-L-苯丙氨酸、对-((7-氯庚基)亚磺酰氨基)-L-苯丙氨酸、对-((8-氯辛基)亚磺酰氨基)-L-苯丙氨酸、间-((氯甲基)亚磺酰氨基)-L-苯丙氨酸、间-((2-氯乙基)亚磺酰氨基)-L-苯丙氨酸、间-((3-氯丙基)亚磺酰氨基)-L-苯丙氨酸、间-((4-氯丁基)亚磺酰氨基)-L-苯丙氨酸、间-((5-氯戊基)亚磺酰氨基)-L-苯丙氨酸、间-((6-氯己基)亚磺酰氨基)-L-苯丙氨酸、间-((7-氯庚基)亚磺酰氨基)-L-苯丙氨酸、间-((8-氯辛基)亚磺酰氨基)-L-苯丙氨酸、对-((溴甲基)亚磺酰氨基)-L-苯丙氨酸、对-((2-溴乙基)亚磺酰氨基)-L-苯丙氨酸、对-((3-溴丙基)亚磺酰氨基)-L-苯丙氨酸、对-((4-溴丁基)亚磺酰氨基)-L-苯丙氨酸、对-((5-溴戊基)亚磺酰氨基)-L-苯丙氨酸、对-((6-溴己基)亚磺酰氨基)-L-苯丙氨酸、对-((7-溴庚基)亚磺酰氨基)-L-苯丙氨酸、对-((8-溴辛基)亚磺酰氨基)-L-苯丙氨酸、对-((碘甲基)亚磺酰氨基)-L-苯丙氨酸、对-((2-碘乙基)亚磺酰氨基)-L-苯丙氨酸、对-((3-碘丙基)亚磺酰氨基)-L-苯丙氨酸、对-((4-碘丁基)亚磺酰氨基)-L-苯丙氨酸、对-((5-碘戊基)亚磺酰氨基)-L-苯丙氨酸、对-((6-碘己基)亚磺酰氨基)-L-苯丙氨酸、对-((7-碘庚基)亚磺酰氨基)-L-苯丙氨酸、对-((8-碘辛基)亚磺酰氨基)-L-苯丙氨酸、间-((溴甲基)亚磺酰氨基)-L-苯丙氨酸、间-((2-溴乙基)亚磺酰氨基)-L-苯丙氨酸、间-((3-溴丙基)亚磺酰氨基)-L-苯丙氨酸、间-((4-溴丁基)亚磺酰氨基)-L-苯丙氨酸、间-((5-溴戊基)亚磺酰氨基)-L-苯丙氨酸、间-((6-溴己基)亚磺酰氨基)-L-苯丙氨酸、间-((7-溴庚基)亚磺酰氨基)-L-苯丙氨酸、间-((8-溴辛基)亚磺酰氨基)-L-苯丙氨酸、间-((碘甲基)亚磺酰氨基)-L-苯丙氨酸、间-((2-碘乙基)亚磺酰氨基)-L-苯丙氨酸、间-((3-碘丙基)亚磺酰氨基)-L-苯丙氨酸、间-((4-碘丁基)亚磺酰氨基)-L-苯丙氨酸、间-((5-碘戊基)亚磺酰氨基)-L-苯丙氨酸、间-((6-碘己基)亚磺酰氨基)-L-苯丙氨酸、间-((7-碘庚基)亚磺酰氨基)-L-苯丙氨酸、间-((8-碘辛基)亚磺酰氨基)-L-苯丙氨酸,及其组合。

在一些实施方式中,非经典氨基酸是N6-丙烯酰赖氨酸(AcrK)。其他非经典氨基酸也可以被设想。

本公开的非经典氨基酸可以由多种密码子编码。例如,在一些实施方式中,非经典氨基酸被包括但不限于框内琥珀密码子、框内赭石密码子、框内蛋白石密码子、稀有密码子和四碱基密码子编码。

在一些实施方式中,非经典氨基酸由框内琥珀密码子编码。在一些实施方式中,非经典氨基酸由稀有密码子编码。在一些实施方式中,稀有密码子是AGA。在一些实施方式中,稀有密码子是AGG。

在一些实施方式中,非经典氨基酸由四碱基密码子编码。在一些实施方式中,四碱基密码子是AGGA。

在一些实施方式中,非经典氨基酸由终止密码子编码。在一些实施方式中,终止密码子包括框内琥珀密码子。在一些实施方式中,终止密码子包括框内赭石密码子。在一些实施方式中,终止密码子包括框内蛋白石密码子。

本公开的非经典氨基酸和半胱氨酸可以位于环状肽或噬菌体衣壳蛋白组合区域的各个位置上。例如,在一些实施方式中,非经典氨基酸在组合区域或环状肽的一个末端,半胱氨酸在组合区域或环状肽的另一个末端。

非经典氨基酸和半胱氨酸可以以多种方式彼此分开。例如,在一些实施方式中,非经典氨基酸和半胱氨酸被至少4个氨基酸分隔。在一些实施方式中,非经典氨基酸和半胱氨酸被约4-10个氨基酸分隔。在一些实施方式中,非经典氨基酸和半胱氨酸被约4-6个氨基酸分隔。在一些实施方式中,非经典氨基酸和半胱氨酸被约10个氨基酸分隔。

本公开的非经典氨基酸和半胱氨酸可以以多种方式相互偶联以形成环状肽。例如,在一些实施方式中,半胱氨酸和非经典氨基酸通过半胱氨酸和非经典氨基酸的亲电区域之间的迈克尔加成反应相互偶联(如图1D所示偶联反应)。在一些实施方式中,半胱氨酸和非经典氨基酸通过半胱氨酸和非经典氨基酸的亲电区域之间的亲核取代反应相互偶联。在一些实施方式中,半胱氨酸和非经典氨基酸通过共价键相互偶联。在一些实施方式中,半胱氨酸和非经典氨基酸通过排除二硫键的键相互偶联。

环状肽靶标

本公开的环状肽可与多种所需靶标结合并针对多种所需靶标选择。例如,在一些实施方式中,所需靶标包括但不限于肽、蛋白质、酶、小分子、细胞受体、抗原、所需靶标的配体结合位点、所需靶标的活性位点、蛋白质的活性位点、蛋白质的变构位点、DNA、RNA,及其组合。

在一些实施方式中,所需靶标是酶。在一些实施方式中,本公开的环状肽抑制酶的活性。在一些实施方式中,所述酶包括但不限于蛋白酶、组蛋白去乙酰化酶,及其组合。在一些实施方式中,酶是TEV蛋白酶。在一些实施方式中,酶是HDAC8。

在一些实施方式中,环状肽是TEV蛋白酶的抑制剂。在一些实施方式中,TEV蛋白酶的环状肽抑制剂包括但不限于CWRDYLIX(CycTev1)(SEQ ID NO:1)、CQWFSHRX(CycTev2)(SEQ ID NO:2)或其组合,其中X是与半胱氨酸偶联的非经典氨基酸。

在一些实施方式中,环状肽是HDAC8的抑制剂。在一些实施方式中,HDAC8的抑制剂环状肽是CQSLWMNX(CycH8a)(SEQ ID NO:3),其中X是与半胱氨酸偶联的非经典氨基酸。

在一些实施方式中,本公开的环状肽以高亲和性与所需靶标结合。例如,在一些实施方式中,本公开的环状肽与所需靶标结合的亲和性显著高于其线性对应物。在一些实施方式中,本公开的环状肽结合所需靶标的Kd值比其线性对应物的Kd值低至少两倍。在一些实施方式中,本公开的环状肽结合所需靶标的Kd值比其线性对应物的Kd值低至少5倍。在一些实施方式中,本公开的环状肽结合所需靶标的Kd值比其线性对应物的Kd值低至少6倍。在一些实施方式中,本公开的环状肽结合所需靶标的Kd值比其线性对应物的Kd值低至少10倍。

在一些实施方式中,本公开的环状肽结合所需靶标的Kd值为10μm或更低。在一些实施方式中,本公开的环状肽结合所需靶标的Kd值为5μm或更低。在一些实施方式中,本公开的环状肽结合所需靶标的Kd值为1μm或更低。在一些实施方式中,本公开的环状肽结合所需靶标的Kd值为500nm或更低。

应用与优势

在一些实施方式中,通过本公开的方法形成的环状肽对所需靶标的亲和性增强。例如,在一些实施方式中,本公开的环状肽与其蛋白质靶标结合的亲和性比其线性对应物强六倍。

此外,申请人设想本公开的方法将在许多领域找到广泛的应用,例如药物发现。例如,在一些实施方式中,本公开的方法可用于为许多治疗靶标(如表面受体和酶)选择有效配体。

此外,本公开的方法提供了自动工艺,避免了传统方法中使用的化学处理。此外,在一些实施方式中,本公开的噬菌体颗粒与传统方法相比具有更高的活性。

现将参考本公开的更具体的实施方式和为这些实施方式提供支持的实验数据。但是,申请人注意到以下公开仅用于说明目的,并不意在以任何方式限制所要求保护的主题的范围。

实施例1.遗传编码的、噬菌体展示的环状肽文库

在这个实施例中,申请人描述了新型噬菌体展示技术,其中它展示的肽是通过在半胱氨酸和琥珀密码子编码的Nε-丙烯酰基-赖氨酸(AcrK)之间邻近驱动的迈克尔加成反应环化的。使用随机的6聚体文库,其中肽在两端通过半胱氨酸-AcrK接头环化,申请人证明成功选择了TEV蛋白酶和HDAC8的有效配体。所有选择的环状肽配体对它们的蛋白质靶标的亲和性比其线性对应物强6倍。

更具体地,申请人设想,亲电非经典氨基酸(ncAA)和半胱氨酸可以经遗传方式以邻近关系被装载于噬菌体展示肽内,供于肽环化(图1D)。ncAA纳入噬菌体可以通过在大肠杆菌细胞中抑制噬菌体展示的肽编码区的琥珀突变来实现,这些细胞中含有ncAA特异性的氨基酰-tRNA合成酶-琥珀抑制子tRNA对,并在ncAA存在下生长(图1E)。使用这种新方法构建的噬菌体展示文库将提供遗传编码的噬菌体展示的环状肽文库,其自发的肽环化既不需要使用没有表面半胱氨酸的噬菌体株,也不需要用于环化的有机接头。

吡咯赖氨酸(Pyl)是天然存在的第22个蛋白质的氨基酸,由琥珀密码子遗传编码。它的纳入是通过吡咯赖氨酰基(pyrrolysyl)-tRNA合成酶(PylRS)和tRNAPyl CUA介导的。在过去的十年中,许多研究团队已经把PylRS进化为供于将超过100种ncAA(包括赖氨酸和苯丙氨酸衍生物)遗传纳入到大肠杆菌中的蛋白质中。这些ncAA其中之一是Nε-丙烯酰基-赖氨酸(AcrK),迈克尔受体。

申请人先前证明了AcrK与硫醇在生理条件下反应缓慢(二阶速率常数为0.004M- 1s-1),但可以使用进化的PylRS突变体(PrKRS)和在大肠杆菌中稳定地纳入蛋白质中。AcrK和半胱氨酸之间的缓慢反应是理想的,因为它避免了与常规蛋白质半胱氨酸的非特异性反应,但是当AcrK和半胱氨酸在肽中位置邻近时,允许快速偶联。

通过在噬菌体展示肽的两端安装半胱氨酸和AcrK,预计肽自动环化(图3A)。由AcrK作用还有优点。它的丙烯酰胺部分与非荧光的二苯基腈亚胺部分选择性地进行Huisgen 1,3-环加成反应以形成强蓝色荧光最终产物。使用在水中经历快速脱氯化氢作用(dehydrocholoration)以释放二苯腈的HZC1(图3B),具有完整AcrK的蛋白质或噬菌体可以很容易地被标记和可视化。

但是,在肽中AcrK和半胱氨酸之间的邻近驱动的迈克尔加成反应将湮灭丙烯酰胺部分,产生不能被HZC1标记的环状肽。为了证明蛋白质中经遗传方式纳入的AcrK和相邻的半胱氨酸之间的邻近驱动的环化,申请人表达了N-末端CA5X肽的超折叠体绿色荧光蛋白(sfGFP)(X表示AcrK并由琥珀密码子编码)。为了表达该蛋白,申请人用两个质粒转化了大肠杆菌BL21(DE3)细胞。一个是先前描述的含有PrKRS和基因的pEVOL-PrKRS质粒,另一个是包含编码CA5X-sfGFP蛋白质的基因的pETduet质粒。在AcrK存在的情况下生长转化细胞提供CA5X-sfGFP。用HZC1标记该蛋白质的结果是没有蓝色荧光产物。

但是,申请人表达了类似于CA5X-sfGFP的具有N-末端A6X肽的对照sfGFP蛋白,并与HZC1反应,SDS-PAGE凝胶中提供了强蓝色荧光蛋白质条带(图3C)。平行地,申请人生成了两个噬菌体,一个带有CA5X肽,另一个在衣壳蛋白pIII的N-末端带有A6X肽。为了构建CA5X噬菌体,申请人在pADLg3噬菌粒载体中的PelB前导肽编码区域和噬菌体pIII(gIII)编码基因之间插入了编码CA5X的DNA片段,载体由申请人购自抗体设计实验室(Antibody DesignLabs)。

申请人使用提供的噬菌粒pADLg3-CA5X转化大肠杆菌Top10细胞,该细胞也携带质粒pEVOL-PrKRS-CloDF和突变的辅助噬菌体质粒M13K07-g3TAA。pEVOL-PrKRS-CloDF衍生自pEVOL-PrKRS,通过将复制起点从p15a转换为CloDF以使其与复制起点通常为p15a的辅助噬菌体质粒相容使用。申请人通过在M13K07辅助噬菌体的gIII基因中Q350编码位点处引入有害赭石突变构建了M13K07-g3TAA。由于M13K07-g3TAA具有非功能性gIII基因,它与PADLg3-CA5X的共同使用驱动了含有仅由后一质粒表达的pIII的噬菌体的合成。在AcrK存在的情况下生长转化细胞提供CA5X噬菌体。

申请人使用类似的方法生产对照A6X噬菌体。在它们分开后,申请人用HZC1对两种噬菌体进行标记。在UV光下,A6X噬菌体展示出比CA5X噬菌体高得多的荧光,表明在CA5X噬菌体中半胱氨酸和AcrK之间的环化(图3D)。CA5X噬菌体相对较高的背景是来自固体沉淀的噬菌体的衍射造成的。

这些结果表明,使用AcrK和邻近的半胱氨酸可以在蛋白质和噬菌体表面上有效地生成环状肽。在体外标记结果的鼓励下,申请人推进构建了噬菌体展示的6-聚环状肽文库。为了提供用于生产具有展示环状肽的噬菌体的噬菌粒文库,申请人在pADLg3噬菌粒的PelB前导肽编码编码区域和gIII基因之间插入了24碱基对的DNA片段,该片段编码了6个随机化氨基酸,侧接N-末端半胱氨酸和C-末端AcrK(图4A)。测序来自该文库的20个克隆以确认文库多样性(图5)。

申请人使用该噬菌粒文库转化大肠杆菌Top10细胞,该细胞还含有pEVOL-PrKRS-CloDF和M13K07-g3TAA,以提供接近109个转化体,然后在AcrK存在下培养转化的细胞以生产噬菌体。为了证明使用该文库为蛋白质靶标选择环状肽配体的可行性,申请人首先在模型蛋白上测试,申请人将TEV蛋白酶与生物素偶联,用于装载到链霉亲和素磁珠上以进行选择。

申请人进行了三轮基于亲和性的选择。每一轮后洗脱的噬菌体显然被富集了(图6)。第三轮后,申请人对25个噬菌体克隆进行测序,这些克隆只汇聚到三条肽序列,CycTev1、CycTev2和CycTev3(图7)。使用固相肽合成,申请人合成了5-FAM-偶联的CycTev1、CycTev2以及它们的线性对应物,然后使用荧光偏振分析测量它们与TEV蛋白酶的结合亲和性。申请人的结果示于图4B-E和表1,表明CycTev1和CycTev2都与TEV蛋白酶结合,解离常数为个位数μM,两种环状肽与TEV蛋白酶结合显著优于它们的线性对应物(>6倍)。

[a]X表示AcrK。

表1.所选择的环状肽及其线性对应物与其蛋白质靶标结合时的测定Kd和IC50值。

这些结果确立了使用申请人的遗传编码噬菌体展示环状肽文库鉴定蛋白质靶标的有效配体的可行性,并证明了环化有助于结合。

HDAC8是Zn2+依赖性组蛋白去乙酰化酶,已经被认为是多种疾病的治疗靶标,包括癌症、X-连锁智力障碍和寄生虫感染。为了鉴定有效的HDAC8抑制剂已经做了许多努力。为了鉴定HDAC8的新型环状肽配体,申请人从其遗传编码的噬菌体展示6-聚环状肽文库中进行了与TEV蛋白酶类似的选择。在申请人随后测序的所选克隆中,其中大部分汇聚于单一的序列CycH8a(表1和图8)。

为了确定CycH8a对HDAC8的亲和性,申请人合成了5-FAM-偶联的CycH8a(图9A),然后用荧光偏振分析表征了它与HDAC8的结合。结果表明解离常数为7.1μM(图9B)。

申请人还合成了5-FAM-偶联的LinH8a(CycH8a的线性对应物)并测试了它与HDAC8的结合。但是,LinH8a与HDAC8的结合非常弱。由于HDAC8在高于100μM的浓度下聚集,申请人无法收集足够的数据以精确地确定LinH8a的Kd,尽管估计它高于50μM。因此,期望环化为CycH8a与HDAC8的结合提供高效力。

对于通过与蛋白质靶标的直接结合而从文库中选出配体,它不一定能结合到蛋白质的活性部位进行直接抑制。为了测试CycH8a是否能直接抑制HDAC8的去乙酰化活性,申请人采用了如图9C所示的HDAC8活性试验,并合成了底物Boc-AcK-AMC。在该实验中,HDAC8催化了Boc-AcK-AMC的去乙酰化,以得到Boc-K-AMC,其与偶联性酶胰蛋白酶反应释放荧光AMC,申请人可以在荧光板读板器中容易地追踪这一化合物。如图9D所示,向试验提供CycH8a抑制了HDAC8对Boc-AcK-AMC的去乙酰化。在5μM HDAC8和50μM Boc-AcK-AMC条件下测定的IC50值为9.7μM,接近于测定的Kd值。鉴于IC50不是直接的结合亲和性指标,并受所使用的底物的协调作用的影响,其略高于Kd的值是预期的。

总之,图9中的结果证明,使用申请人的遗传编码噬菌体展示环状肽文库在鉴定用于治疗性蛋白质靶标的有效环状肽抑制剂方面的成功应用。

为了进一步了解CycH8a如何与HDAC8相互作用,申请人将CysH8a与HDAC8进行虚拟对接。HDAC8天然以二聚体形式存在。因此,申请人研究了单体和二聚体的HDAC8作为对接的受体。对接结果表明CycH8a与单体HDAC8结合较弱,但是在HDAC8的二聚体界面处且邻近两个活性位点的两个沟中配合良好(图10)。一些已发表的HDAC8-底物复合物晶体结构显示,两个二聚体界面沟也是结合性肽底物的通道的部分。

CycH8a在两沟处的结合将阻止肽底物进入两个活性位点,这为CycH8a抑制HDAC8提供了解释。鉴于对接表明CycH8a在HDAC8的活性位点通道附近结合,而许多强效的小分子HDAC8抑制剂包括一些异羟肟酸(hydroxamate)衍生物直接在活性位点通道内结合,开发更强效的HDAC8抑制剂的一种可能性是将活性位点靶向抑制剂和CycH8a偶联,形成紧密结合的双配位配体(bidentate ligand)。

总之,申请人开发了新型噬菌体展示技术,其允许构建遗传编码的噬菌体展示环状肽文库。噬菌体展示肽的环化是通过半胱氨酸和侧接随机化6-聚肽序列的AcrK之间的邻近驱动的迈克尔加成反应实现的。AcrK是由琥珀密码子编码的,它在噬菌体中的纳入是通过大肠杆菌中进化的对介导的。将开发的文库应用于针对TEV蛋白酶和HDAC8的选择,得到的环状肽配体与它们的蛋白质靶标结合,其Kd值为个位数μM,显著优于其线性对应物。

作为概念验证,本实施例涉及较小的肽,仅随机化了6个残基。预计具有更大随机化肽的文库将提供更有效配体的选择。鉴于许多亲电ncAA已经使用琥珀抑制诱变方法被纳入蛋白质,它们都有可能被用来构建遗传编码的噬菌体展示环状肽文库。由于这些ncAA在结构上是多样的,它们的使用将为噬菌体展示环状肽赋予不同的结构约束,这将会为选择提供不同的结构多样性。作为噬菌体展示技术的新型补充,申请人预期所开发的技术将在鉴定许多表面受体的有效配体和酶及蛋白-蛋白/DNA/RNA结合互作的强力抑制剂方面找到广泛的应用。

实施例1.1.AcrK的合成

AcrK的合成示于方案1。

方案1.AcrK的合成途径。

向N-羟基琥珀酰亚胺(1.3g,11.3mmol)在无水二氯甲烷(25mL)中的溶液中,申请人在冰浴中加入N,N-二异丙基乙胺(1.5mL,8.9mmol),然后是丙烯酰氯(0.8mL,9.3mmol)。将混合物在室温下搅拌10小时。申请人用乙酸乙酯提取该混合物,用饱和的NH4Cl溶液和盐水洗涤,并用无水MgSO4干燥。申请人过滤该溶液,并在真空下蒸发,获得黄色油状物2(1.5g)。申请人将2直接用于下一步合成,无需进一步纯化。

向五水硫酸铜(II)(1.0g,4.0mmol)的水溶液(50mL)中,申请人加入赖氨酸盐酸盐(1.5g,8.0mmol)和碳酸氢钠(1.9g,22.4mmol)。申请人在室温下搅拌混合物20分钟。申请人向该混合物中加入化合物2的丙酮溶液(20mL)。申请人将得到的反应混合物再搅拌8小时。申请人过滤该蓝色混合物,用水和丙酮洗涤蓝色滤饼,将其溶解于水和氯仿(v/v=1:1,100mL),并将所得溶液在室温下搅拌5分钟。

然后,申请人向该悬浮液中加入8-羟基喹啉(1.6g,11.0mmol),然后让其在室温下搅拌30分钟。申请人过滤该绿色悬浮液,用氯仿洗涤滤液,在减压下浓缩,然后使其经过离子交换色谱法进一步纯化以得到白色粉末AcrK(1.2g,两步60%)。

1H NMR(D2O,300MHz)δ6.2-5.43(m,2H),5.59(dd,1H,J=11.4,1.8Hz),3.58(t,1H,J=6Hz,),3.13(t,2H,J=6.9Hz),1.71(m,2H),1.46(m,2H),1.24(m,2H).13C NMR(75MHz,D2O)δ175.4,169.1,130.6,127.7,55.3,39.6,30.7,28.6,22.4.

实施例1.2.CA5X-sfGFP和A6X-sfGFP表达以及用HCZ1对它们进行标记

CA5X-sfGFP的DNA序列如下:

atgtgtgctgcagcggctgcatagaaaggagaagaacttttcactggagttgtcccaattcttgttgaattagatggtgatgttaatgggcacaaattttctgtccgtggagagggtgaaggtgatgctacaaacggaaaactcacccttaaatttatttgcactactggaaaactacctgttccgtggccaacacttgtcactactctgacctatggtgttcaatgcttttcccgttatccggatcacatgaaacggcatgactttttcaagagtgccatgcccgaaggttatgtacaggaacgcactatatctttcaaagatgacgggacctacaagacgcgtgctgaagtcaagtttgaaggtgatacccttgttaatcgtatcgagttaaagggtattgattttaaagaagatggaaacattcttggacacaaactcgagtacaactttaactcacacaatgtatacatcacggcagacaaacaaaagaatggaatcaaagctaacttcaaaattcgccacaacgttgaagatggttccgttcaactagcagaccattatcaacaaaatactccaattggcgatggccctgtccttttaccagacaaccattacctgtcgacacaatctgtcctttcgaaagatcccaacgaaaagcgtgaccacatggtccttcttgagtttgtaactgctgctgggattacacatggcatggatgagctctacaaaggatcccatcaccatcaccatcactaa(SEQ ID NO:7).带下划线的核苷酸编码CA5X。

A6X-sfGFP的DNA序列如下:

atggctgctgcagcggctgcatagaaaggagaagaacttttcactggagttgtcccaattcttgttgaattagatggtgatgttaatgggcacaaattttctgtccgtggagagggtgaaggtgatgctacaaacggaaaactcacccttaaatttatttgcactactggaaaactacctgttccgtggccaacacttgtcactactctgacctatggtgttcaatgcttttcccgttatccggatcacatgaaacggcatgactttttcaagagtgccatgcccgaaggttatgtacaggaacgcactatatctttcaaagatgacgggacctacaagacgcgtgctgaagtcaagtttgaaggtgatacccttgttaatcgtatcgagttaaagggtattgattttaaagaagatggaaacattcttggacacaaactcgagtacaactttaactcacacaatgtatacatcacggcagacaaacaaaagaatggaatcaaagctaacttcaaaattcgccacaacgttgaagatggttccgttcaactagcagaccattatcaacaaaatactccaattggcgatggccctgtccttttaccagacaaccattacctgtcgacacaatctgtcctttcgaaagatcccaacgaaaagcgtgaccacatggtccttcttgagtttgtaactgctgctgggattacacatggcatggatgagctctacaaaggatcccatcaccatcaccatcactaa(SEQ ID NO:8).带下划线的核苷酸编码A6X。

实施例1.3.pETduet-CA5X-sfGFP和pETduet-A6X-sfGFP的构建

申请人使用了先前构建的质粒pETtrio-PylRS-sfGFP-TAA(Ala)5TAG-PylT作为模板。申请人使用PCR使用两条引物扩增有N-末端CA5X肽的sfGFP:(1)CA5X-F:5’-GAGATATACCATGTGTGCTG CAGCGGCTGC-3’(SEQ ID NO:9);和(2)CA5X-R:5’-GCAGCCGCTG CAGCACACATGGTATATCTC-3’(SEQ ID NO:10)。接下来,申请人用AflIII和KpnI限制性酶消化该PCR产物。申请人将消化后的产物克隆到空的petDuet-1载体中的AflIII和KpnI位点,得到pETduet-CA5X-sfGFP。申请人遵循相同的方案构建pETduet-A6X-sfGFP,使用两条引物:(1)CA5X-F:5’-GAGATATACC ATGGCTGCTG CAGCGGCTGC-3’(SEQ ID NO:11);和(2)CA5X-R:5’-GCAGCCGCTG CAGCAGCCAT GGTATATCTC-3’(SEQ ID NO:12)。

实施例1.4.蛋白质表达与纯化

为了表达CA5X-sfGFP,申请人使用先前报道的质粒pEVOL-PrKRS和pETduet-CA5X-sfGFP转化BL21(DE3)细胞,并将转化的细胞铺在含有氨苄青霉素(100μg/mL)和氯霉素(34μg/mL)的LB-琼脂平板上。申请人挑选一个单克隆接种到补充有100μg/mL氨苄青霉素和34μg/mL氯霉素的5mL LB培养基中。申请人用该过夜培养物接种100mL LB培养基并在37℃的孵育摇床(250rpm)中让其生长。当OD600达到0.8时,申请人加入1mM AcrK、1mM IPTG和0.2%阿拉伯糖来诱导蛋白质表达。8小时的诱导后,申请人通过将细胞培养基在4000g离心15分钟收集细胞,然后将细胞重悬于裂解缓冲液(50mM NaH2PO4、250mM NaCl、10mM咪唑,pH 8.0)中,申请人在冰浴中将其超声处理6次(每次脉冲2分钟,5分钟间隔用于冷却)。申请人通过在1000g离心60分钟(4℃)澄清细胞裂解液,收集上清,并将其与1mL Ni-NTA树脂(Qiagen)孵育(1.5h,4℃)。申请人用含有50mM NaH2PO4、250mM NaCl和10mM咪唑的50mL洗涤缓冲液(pH 8.0)洗涤蛋白质-树脂混合物,然后用含有50mM NaH2PO4、250mM NaCl和250mM咪唑的洗脱缓冲液(pH 8.0)洗脱CA5X-sfGFP。申请人浓缩经纯化的蛋白质,并将其针对含有10mM碳酸氢铵的缓冲液透析。

申请人通过15%SDS-PAGE分析最终纯化的蛋白并把它储存在-80℃(图11)。除了申请人将质粒pETduet-CA5X-sfGFP换成了质粒pETduet-A6X-sfGFP之外,A6X-sfGFP的表达和纯化遵循完全相同的方案。

实施例1.5.用HCZ1标记CA5X-sfGFP和A6X-sfGFP

申请人根据先前的公开文本合成了HCZ1。为了标记CA5X-sfGFP和A6X-sfGFP,申请人将HZC1(5mM,15μL)加入到CA5X-sfGFP和A6X-sfGFP(5μM,500μL)在1:1乙腈-50mM磷酸盐缓冲液(pH 10不含氯化物)中的两种不同的溶液中,将混合物孵育10分钟,然后通过加入500mM丙烯酰胺淬灭反应。申请人使用Ni-NTA树脂(5μL)纯化标记后的蛋白,将蛋白质结合的树脂旋降下来(10分钟,13.4K),然后用水洗涤它4次。在6×蛋白质上样缓冲液(375mMTris-HCl、10%SDS、30%甘油、0.03%溴酚蓝、600mM DTT)中煮沸该树脂,过滤以除去沉淀后,申请人洗脱了结合的蛋白质并对它们进行了15%SDS-PAGE分析。申请人使用伯乐(BioRad)ChemiDoc XRS+成像系统进行凝胶内荧光检测,然后申请人用考马斯蓝对凝胶进行染色。

实施例1.6.pADLg3-CA5X和pADLg3-A6X噬菌体的表达以及用HCZ1对它们进行标记

申请人通过进行Quik-Change诱变从M13K07衍生了M13K07-g3TAA辅助噬菌体质粒。申请人使用了两条引物:(1)M13K07g3TAA-F:5’-gttgaaagtt gtttagcaTa accccatacagaaaattc-3’(SEQ ID NO:13);和(2)M13K07TAA-R:5’-gaattttctg tatggggttAtgctaaacaa ctttcaac-3’(SEQ ID NO:14)。

申请人遵循Pfu-催化的标准Quik-Change方案,将单TAA突变引入gIII基因的K10编码位点。

申请人进行了两个实验来验证M13KO7-g3TAA作为多价展示的辅助噬菌体。为了确认pIII的表型敲除,申请人在大肠杆菌Top10 F’中表达了辅助噬菌体,在含有25μg·mL-1卡那霉素的2xYT中于37℃过夜。次日,沉淀细胞并将上清在65℃孵育15分钟以杀死剩余的细菌。然后将热杀(heat-killed)的上清(10μL)点样在含有10μg·mL-1四环素的琼脂上的顶部琼脂中的大肠杆菌Top10F’覆盖物上,并在37℃孵育过夜。作为阳性对照,申请人表达并点样了野生型M13KO7和CM13噬菌体(抗体设计实验室)。过夜孵育后,对应于野生型M13KO7和CM13的接种斑点呈现延迟细胞生长区,表明存在有活力的噬菌体。相比之下,对应于M13KO7-g3TAA的接种斑点观察到无延迟的生长,证实了宿主感染所需的pIII功能性丧失(图12)。

接下来,申请人证实了M13KO7-g3TAA补充负载pIII的噬菌粒并产生有活性的时噬菌体的能力。为此,申请人用M13KO7(pIII)和两种噬菌粒之一:pADL-10b(抗体设计实验室公司)或pADL-g3TAG共同转化了大肠杆菌Top10F’。pADL-10b包含编码野生型pIII的基因,而pADL-g3TAG包含在pelB编码序列之后的G1编码位点具有框内琥珀突变的野生型pIII。转化细胞在含有100μg·mL-1氨苄青霉素和25μg·mL-1卡那霉素的2xYT培养基中生长至OD600为0.8,此时加入IPTG诱导pIII的表达。过夜孵育后,上清经收集和热杀(如上所述),且10μL的热杀上清被用于感染90μL对数期大肠杆菌Top10 F’持续45分钟。感染的培养物被铺在含有100μg·mL-1氨苄青霉素的琼脂选择板上并在37℃生长过夜。用来自pADL-g3TAG的上清感染的细胞没有生长,因为噬菌粒和辅助噬菌体都含有pIII无义突变。然而,用来自pADL-10b的上清感染的细胞出现了密集的细胞生长,证实了M13KO7-g3TAA补充负载pIII的噬菌粒并生产功能性噬菌粒颗粒的能力(图13)。

为了将Cys-Ala5-AcrK序列引入噬菌体,使用Phusion高保真DNA聚合酶PCR扩增先前构建的质粒pADL-NcoI-g3-AAKAA(由pADL-10b修饰得来),使用5’-端引物,pADL-NcoI-Cys-Ala5-TAG-g3-F:5’-GCTTCCATGG CCTGCGCAGC AGCAGCAGCA TAGGCGGCGA AAGCGG-3’(SEQ ID NO:15)和3’-端引物,pADL-NcoI-Cys-Ala5-TAG-R:5’-GCTTCCATGG CCGGCTGGGCCGC-3’(SEQ ID NO:16)。PCR产物用DpnI和NcoI消化,然后用T4 DNA连接酶连接,然后用于转化大肠杆菌Top10。类似如上所述地构建pADLg3-A6X,用5’-端引物,pADL-NcoI-Ala6-TAG-g3-F:5’-GCTTCCATGG CCGCAGCAGC AGCAGCAGCA TAGGCGGCGA AAGCGG-3’(SEQ ID NO:17)和3’-端引物,pADL-NcoI-Ala6-TAG-R:5’-GCTTCCATGG CCGGCTGGGC CGC-3’(SEQ ID NO:18)。

申请人从pEVOL-PrKRS衍生出质粒pEVOL-PrKRS-CloDF。来自pEVOL-PrKRS的原件具有p15a复制起点,与pADLg3在同一细胞宿主中的使用不兼容。为了将p15a复制原点与CloDF复制原点调换,申请人使用了两条引物ColDF-F:5’-ttggcgcgcc caaatagctagctcactcgg tc-3’(SEQ ID NO:19),和ColDF-R:5’-tgttcctagg gataaattgc actgaaatctag-3’(SEQ ID NO:20)来扩增来自诺瓦基公司(Novagen)的pCDFDuetTM-1质粒的CloDF基因,另外两条引物pEVOL-F:5’-tgttcctagg tcttcaaatg tagcacctga ag-3’(SEQ ID NO:21),和pEVOL-R:5’-ttggcgcgcc ccttttttct cctgccacat g-3’(SEQ ID NO:22)来扩增无p15a区域的pEVOL-PrKRS骨架结构。

申请人用限制性酶AscI和AvrII消化两个PCR产物,纯化消化产物,然后使用T4DNA连接酶将它们连接在一起。申请人用连接产物转化大肠杆菌Top10细胞,然后通过测序整个质粒确认了所得到的质粒。

pADLg3-CA5X和pADLg3-A6X被电穿孔进入大肠杆菌Top10感受态细胞中,其中含有M13KO7-g3TAA和pEVOL-PrKRS-ColDF。然后将细胞接种到100mL含有氨苄青霉素、氯霉素和卡那霉素的2YT培养基中,并在OD600达到0.5时加入0.2%阿拉伯糖、1mM IPTG和5mM AcrK诱导pIII表达。诱导12小时后,收集培养物,通过离心澄清,并收集上清液。然后在上清液中加入冷冻的聚乙二醇溶液以沉淀噬菌体。然后对混合物进行离心(30分钟,10,000g,4℃),将噬菌体沉淀重新悬浮在PBS缓冲液中并再次离心。然后收集上清液并加热到65℃持续15分钟以杀死所有剩余的细胞。

为了用HCZ1标记pADLg3-CA5X和pADLg3-A6X噬菌体,将90uL的CA5X和A6X噬菌体溶液加入90uL的乙腈中,无论是否存在20uM HZC1。混合物孵育2小时,然后加入聚乙二醇溶液,离心(30分钟,10,000g,4℃)以获得噬菌体沉淀。使用默认的EtBr方案,由ChemiDOC成像系统记录这些沉淀。

实施例1.7.TEV蛋白酶的表达

申请人用含有编码N-末端带His标签的TEV蛋白酶的基因的pTEV质粒转化BL21(DE3)细胞。申请人挑取单克隆,并在37℃的5mL LB培养基中进行培养。申请人用该过夜的培养物接种到500mL补充有氨苄青霉素(100μg/mL)的2xYT培养基中,并在37℃的孵育摇床(250rpm)中培养细胞。当OD600达到0.4~0.6时,申请人加入0.8mM IPTG以诱导TEV蛋白酶的表达。诱导4小时后,申请人通过4000g离心15分钟收获细胞,并将沉淀的细胞重悬于裂解缓冲液(50mM NaH2PO4,250mM NaCl,10mM咪唑,pH 8.0)中。申请人在冰浴中超声处理重悬的细胞6次(每次脉冲2分钟,5分钟间隔用于冷却),并通过1000g离心60分钟(4℃)澄清细胞裂解液。申请人收集上清液并与1mL Ni-NTA树脂孵育(1.5h,4℃)。申请人用含有50mM NaH2PO4、250mM NaCl和10mM咪唑的50mL洗涤缓冲液(pH 8.0)洗涤蛋白质-树脂混合物,然后用含有50mM NaH2PO4、250mM NaCl和250mM咪唑的洗脱缓冲液(pH 8.0)洗脱。申请人浓缩了洗脱的蛋白质,并将其针对含有10mM碳酸氢铵的缓冲液透析。申请人通过15%SDS-PAGE分析蛋白质(图14)并储存在-80℃。

实施例1.8.HDAC8的表达

申请人用pHD4-HDAC8-TEV-His6转化BL21(DE3)CodonPlus细胞,并挑取单克隆,在补充有氨苄青霉素(Amp)(100μg/mL)的5mL 2xYT培养基中生长过夜。申请人将该过夜培养物接种到500mL自动诱导TB培养基(24g/L酵母提取物,12g/L胰蛋白胨,8g/L tris,4g/L乳糖,1g/L甘油,pH 7.5),补充100μg/mL氨苄青霉素和200μM ZnSO4。申请人在37℃的孵育摇床(250rpm)中培养细胞。诱导20小时后,申请人通过4000g离心15分钟收获细胞,并将收集的细胞重悬于裂解缓冲液(50mM NaH2PO4,250mM NaCl,10mM咪唑,pH 8.0)中。申请人在冰浴中超声处理重悬的细胞6次(每次脉冲3分钟,6分钟间隔用于冷却),并通过1000g离心60分钟(4℃)澄清细胞裂解液。申请人通过倾析收集上清并与1mL Ni-NTA树脂孵育(1.5h,4℃)。申请人用含有50mM NaH2PO4、250mM NaCl和10mM咪唑的50mL洗涤缓冲液(pH 8.0)洗涤蛋白质-树脂混合物,然后用含有50mM NaH2PO4、250mM NaCl和250mM咪唑的洗脱缓冲液(pH 8.0)洗脱蛋白质。申请人将洗脱的组分合并,浓缩,然后让它经过Q Sepharose FPLC色谱(GE医疗公司(GE Healthcare))进一步纯化。申请人针对透析缓冲液(25mM Tris-HCl,300mMNaCl,200μM ZnSO4,5μM KCl,pH7.5)透析最终纯化的蛋白质,通过15%SDS-PAGE进行分析(图15),并将蛋白质以5μM等分试样的形式储存在-80℃。

实施例1.9.具有随机化的6编码位点的噬菌粒文库的构建以及它们作为噬菌体文 库的表达

pADLg3-TGC-(NNK)6-TAG噬菌粒文库的DNA序列如下:

gcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcgcttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgacccgacaccatcgaatggcgcaaaacctttcgcggtatggcatgatagcgcccggaagagagtcaattcagggtggtgaatgtgaaaccagtaacgttatacgatgtcgcagagtatgccggtgtctcttatcagaccgtttcccgcgtggtgaaccaggccagccacgtttctgcgaaaacgcgggaaaaagtggaagcggcgatggcggagctgaattacattcccaaccgcgtggcacaacaactggcgggcaaacagtcgttgctgattggcgttgccacctccagtctggccctgcacgcgccgtcgcaaattgtcgcggcgattaaatctcgcgccgatcaactgggtgccagcgtggtggtgtcgatggtagaacgaagcggcgtcgaagcctgtaaagcggcggtgcacaatcttctcgcgcaacgcgtcagtgggctgatcattaactatccgctggatgaccaggatgccattgctgtggaagctgcctgcactaatgttccggcgttatttcttgatgtctctgaccagacacccatcaacagtattattttctcccatgaagacggtacgcgactgggcgtggagcatctggtcgcattgggtcaccagcaaatcgcgctgttagcgggcccattaagttctgtctcggcgcgtctgcgtctggctggctggcataaatatctcactcgcaatcaaattcagccgatagcggaacgggaaggcgactggagtgccatgtccggttttcaacaaaccatgcaaatgctgaatgagggcatcgttcccactgcgatgctggttgccaacgatcagatggcgctgggcgcaatgcgcgccattaccgagtccgggctgcgcgttggtgcggacatctcggtagtgggatacgacgataccgaagacagctcatgttatatcccgccgttaaccaccatcaaacaggattttcgcctgctggggcaaaccagcgtggaccgcttgctgcaactctctcagggccaggcggtgaagggcaatcagctgttgcccgtctcactggtgaaaagaaaaaccaccctggcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcggtacccgataaaagcggcttcctgacaggaggccgttttgttttgcagcccacctcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgaatttctagataacgagggcaaatcatgaaatacctattgcctacggcggccgctggattgttattactcgcggcccagccggccatggcctgcnnkn nknnknnknnknnktagggcccgggaggccaaggcggtggttctgagggtggtggctccctcgagggcgcgccagccgaaactgttgaaagttgtttagcaaaacctcatacagaaaattcatttactaacgtctggaaagacgacaaaactttagatcgttacgctaactatgagggctgtctgtggaatgctacaggcgttgtggtttgtactggtgacgaaactcagtgttacggtacatgggttcctattgggcttgctatccctgaaaatgagggtggtggctctgagggtggcggttctgagggtggcggttctgagggtggcggtactaaacctcctgagtacggtgatacacctattccgggctatacttatatcaaccctctcgacggcacttatccgcctggtactgagcaaaaccccgctaatcctaatccttctcttgaggagtctcagcctcttaatactttcatgtttcagaataataggttccgaaataggcagggtgcattaactgtttatacgggcactgttactcaaggcactgaccccgttaaaacttattaccagtacactcctgtatcatcaaaagccatgtatgacgcttactggaacggtaaattcagagactgcgctttccattctggctttaatgaggatccattcgtttgtgaatatcaaggccaatcgtctgacctgcctcaacctcctgtcaatgctggcggcggctctggtggtggttctggtggcggctctgagggtggcggctctgagggtggcggttctgagggtggcggctctgagggtggcggttccggtggcggctccggttccggtgattttgattatgaaaaaatggcaaacgctaataagggggctatgaccgaaaatgccgatgaaaacgcgctacagtctgacgctaaaggcaaacttgattctgtcgctactgattacggtgctgctatcgatggtttcattggtgacgtttccggccttgctaatggtaatggtgctactggtgattttgctggctctaattcccaaatggctcaagtcggtgacggtgataattcacctttaatgaataatttccgtcaatatttaccttctttgcctcagtcggttgaatgtcgcccttatgtctttggcgctggtaaaccatatgaattttctattgattgtgacaaaataaacttattccgtggtgtctttgcgtttcttttatatgttgccacctttatgtatgtattttcgacgtttgctaacatactgcgtaataaggagtcttaatcaagctttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggttgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttggggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtcaggtg(SEQ ID NO:23)。

突变的位点用粗体下划线。n表示a、g、c、t之中的任一项,k表示g或t。

申请人通过进行PCR直接扩增pADL-10b质粒构建噬菌粒文库,使用两条引物pADL-F:5'-GGTCCGTCCA TGGCCTGCNN KNNKNNKNNK NNKNNKTAGG GCCCGGG-3'(SEQ ID NO:24),和pADL-R:5'-CCACGGCCAT GGCCGGCTG GGCCGCG-3'(SEQ ID NO:25)。申请人用NcoI限制性酶消化PCR产物,并用T4 DNA连接酶连接消化后的产物。DpnI也被用来去除模板噬菌粒。然后申请人将连接好的质粒电穿孔进入感受态大肠杆菌Top10细胞中,将转化体在1mL LB培养基中孵育,然后将其接种到含有100μg/mL氨苄青霉素的50mL LB培养基中。在OD600达到1.0后,申请人收集了0.5mL细胞培养物,与50%的甘油混合,并储存在-80℃。制作数个等分试样以使总体覆盖超过1011cfu。为了收集噬菌粒,申请人将细胞储存量归一化,以保证每个等分试样中的噬菌粒的量相等。申请人从该文库中分离出20个克隆,并对它们进行DNA测序。测序数据示于图5。在这20个克隆中,16个含有设计的序列,2个是原始的pADL-10b噬菌粒,2个是可能由DNA引物的合成错误导致的有害克隆产物。在所有16个设计的克隆中,所有的位点都是随机化的,没有向某些密码子富集。

实施例1.10.噬菌体的表达

申请人将从之前的步骤构建的噬菌粒文库电穿孔到含有M13KO7-g3TAA和pEVOL-PrKRS-ColDF的大肠杆菌Top10感受态细胞中。申请人将转化的细胞接种到100mL 2YT培养基中,并在OD600达到0.5时通过加入0.2%阿拉伯糖、0.5mM IPTG和2mM AcrK诱导噬菌粒中的pIII表达。诱导12小时后,申请人通过离心旋降细胞并收集上清。然后申请人通过加入冷冻的聚乙二醇沉淀含有噬菌体的上清,然后将溶液进行离心(15分钟,10,000g,4℃)。申请人收集噬菌体颗粒并将其溶解在PBS缓冲液中。

申请人通过以下步骤计算噬菌体的总量:申请人将10uL噬菌体溶液在65℃的水浴中孵育15分钟,以杀死里面所有的大肠杆菌Top10细胞,用得到的噬菌体溶液感染90uLTop10F’(OD600=1.0)细胞,对感染的细胞进行系列稀释,并将稀释后的细胞铺到含有100μg/mL氨苄青霉素的琼脂板上,以选择感染的细胞。每100mL LB培养基的总产量约为1010cfu,足以涵盖文库多样性(6-聚文库的理论多样性为206=6.4x106)。

实施例1.11.针对TEV蛋白酶和HDAC8的噬菌体选择

申请人使用链霉亲和素磁珠进行选择。为了在水性溶液中产生生物素化蛋白质,申请人使用生物素磺基琥珀酰亚胺酯试剂盒(赛默飞世尔科技公司(thermos fisherscientific))偶联TEV蛋白酶和HDAC8。申请人将15μM纯化的靶标蛋白与30μM生物素磺基琥珀酰亚胺酯在50mM磷酸盐缓冲液中室温孵育2小时。申请人加入10mM赖氨酸淬灭反应,并使溶液用BioRAD公司的蛋白纯化试剂盒处理。申请人将纯化的生物素化蛋白与链霉亲和素磁珠(皮尔斯(Pierce))在PBS缓冲液中孵育1小时,并洗去未反应的蛋白。

在选择中,为了去除能够非特异性结合的个体,申请人在每一轮选择中只用链霉蛋白磁珠孵育噬菌体库,收集未结合的噬菌体,然后使其与蛋白结合的链霉蛋白磁珠结合10分钟。申请人用含有吐温-20的PBS缓冲液(8mM Na2HPO4,150mM NaCl,3mM KCl,2mMKH2PO4,0.05%吐温-20,pH 7.4)洗涤珠子10次,用甘氨酸-HCl缓冲液(pH 2.2)洗脱结合的噬菌体,然后用Tris缓冲液(pH 9.1)中和洗脱液。申请人用洗脱的噬菌体感染Top10F’细胞来计算噬菌体颗粒的量。为了扩增所选择的噬菌体文库,申请人用洗脱液感染Top10F’细胞,并繁殖感染的细胞以扩增它们负载的噬菌粒。

申请人重复了细胞转化、噬菌体表达和噬菌体选择,连续进行了三轮。为了更好地进行比较,申请人还在每轮选择中加入了与链霉亲和素磁珠背景结合的噬菌体作为对照。申请人还表征了洗脱的噬菌体克隆数。如图6所示,每一轮后洗脱的噬菌体数量急剧增加,表明优选的紧密结合克隆的富集。

对于TEV蛋白酶和HDAC8,申请人将选择的与它们结合的25个克隆分离出来进行DNA测序,其结果示于图7-8。

实施例1.12.所选肽的合成

申请人使用如图16的固相肽合成法合成了从C-末端到N-末端的所有肽。树脂被用来逐个偶联氨基酸。申请人在合成中使用了Fmoc保护的核苷酸。使用活化偶联试剂将每个N-脱保护的树脂偶联肽的氨基酸与Fmoc-保护的氨基酸进行偶联,通常需要大约几分钟到几小时。申请人用DMF和二氯甲烷洗涤未反应的试剂和副产物。申请人用95%的TFA将最终合成的肽从树脂中切割下来,用冷醚沉淀,并对它们进行进一步表征。为了监测偶联过程,申请人使用了Kaiser试验。

为了将第一个赖氨酸与树脂偶联,申请人在DMF中加入200mg Rink酰胺MBHA树脂(Novabiochem)到一个聚合物容器(poly vessel)中膨胀1小时。然后申请人通过在DMF中提供20%(v/v)哌啶对树脂的Fmoc基团进行脱保护30分钟,随后用DMF、二氯甲烷(DCM)和甲醇洗涤树脂。申请人将Fmoc-Lys(mtt)-OH(4当量)、四甲基脲六氟磷酸盐(HBTU,4当量)和二异丙基乙胺(DIEA,10当量)溶解在DMF中,然后在氮气下将此溶液加入反应容器中,与树脂混合。当Kaiser-茚三酮试验变为阴性时,申请人认为偶联完成。

为了将5-羧基荧光素(5-FAM)与第一个赖氨酸偶联,申请人通过在DCM(v/v)中用1%的TFA和5%的三异丙基硅烷(TIS)重复洗涤树脂来去除第一个赖氨酸的mtt保护基。脱保护后,申请人在DMF中加入5-FAM(2当量)和DIEA(5当量)到树脂中,进行偶联反应,直到Kaiser测试变为阴性。

为了将第二个赖氨酸和其余的氨基酸与树脂偶联,申请人通过在DMF中加入20%的哌啶持续30分钟将树脂偶联肽中的Fmoc基团脱保护,随后用DMF、二氯甲烷(DCM)和甲醇洗涤树脂。申请人将Fmoc-保护氨基酸(4当量)、四甲基脲六氟磷酸盐(HBTU,4当量)和二异丙基乙胺(DIEA,10当量)溶解在DMF(10mL)中,在氮气下将此溶液加入反应容器中,与树脂混合。申请人持续反应直到Kaiser-茚三酮试验变为阴性。对于最后一个氨基酸,申请人使用Boc-Cys(trt)-OH。在最后的偶联之后,没有额外的脱保护步骤。

为了合成N-琥珀酰亚胺-丙烯酸酯,申请人向N-羟基琥珀酰亚胺(1.3g,11.3mmol)在无水二氯甲烷(25mL)中的溶液中加入N,N-二异丙基乙胺(1.5mL,8.9mmol)。随后在冰浴中滴加丙烯酰氯(0.8mL,9.3mmol)。申请人将该混合物在室温下搅拌10小时。然后申请人用乙酸乙酯提取该混合物,用饱和NH4Cl溶液和盐水洗涤,并用无水MgSO4干燥。申请人过滤该溶液,并在真空下蒸发,获得黄色油状物N-琥珀酰亚胺-丙烯酸酯(1.5g)。该产物无需进一步纯化即可用于下一步骤。

为了将N-琥珀酰亚胺-丙烯酸酯与第二个赖氨酸偶联,申请人在二氯甲烷(v/v)中使用1%TFA和5%三异丙基硅烷(TIS)除去半胱氨酸偶联后的mtt基团。然后申请人在DMF中将N-琥珀酰亚胺丙烯酸酯(2当量)和DIEA(5当量)加入到树脂中,进行偶联,直到Kaiser测试变为阴性。

为了将肽从树脂上切割下来,申请人将200mg树脂与含有92.5%TFA、2.5%TIS、2.5%水和2.5%1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDC)的4mL切割溶液孵育2~3小时。然后用10体积的冷乙醚沉淀肽产物。申请人通过离心收集切割的肽,用冷的乙醚洗涤,并通过HPLC纯化。冻干纯化的产物并进行MALDI-TOF分析(图17-19)。

为了制备环状肽,申请人将纯化的肽溶解在PBS缓冲液中,并将其在室温下孵育4小时,然后对其进行HPLC色谱。申请人收集洗脱的肽并将其冻干,得到白色粉末。NMR分析表明没有烯基氢的峰,证明这些肽中的半胱氨酸侧链与AcrK的丙烯酰基部分成功环化。

实施例1.13.荧光偏振测量

申请人将25nM 5-FAM偶联环状肽和不同浓度的靶标蛋白(160nM至160μM)在黑色96孔板中孵育,总体积为200μL,体积通过添加PBS缓冲液调整。在酶标仪中在Ex/Em=490nm/520nm处测量荧光偏振。

实施例1.14.IC50值测量

为了合成Boc-Kac-AMC,申请人将Boc-Kac-OH(2.0mmol,576.7mg)和7-氨基-4-甲基香豆素(2.0mmol,350.4mg)溶解在冰冷的无水THF(50mL)中,然后向溶液中滴加吡啶(20.0mmol,1.6mL),接着加入磷酰氯(8.4mmol,0.8mL)。申请人将混合物在冰水浴中搅拌3小时,并通过加入饱和碳酸氢钠溶液(50mL)淬灭反应。申请人在减压下将混合物浓缩至50mL,用25mL二氯甲烷萃取三次,然后用25mL饱和NaCl溶液和0.5M HCl溶液(4x50mL)洗涤。申请人将合并的二氯甲烷萃取物在无水MgSO4上干燥,减压浓缩,并溶于HCl/MeOH(1:4v/v)。申请人将该溶液在室温下搅拌24小时,并在减压下浓缩,得到所需的黄色粉末产物(489.1mg,两步为55%)。

方案2阐述了上述合成。

方案2.Boc-Kac-AMC的合成。

实施例1.15.IC50测量

申请人将不同浓度(1nM–1000μM)的5FAM-cycH8a和5nM HDAC8加入黑色96孔板(皮尔斯),并另提供PBS缓冲液以调整每个孔的最终体积为200μL。该板在30℃孵育10分钟。接下来,申请人向每个孔中加入50μM Boc-Kac-AMC。在30摄氏度孵育1小时后,申请人提供曲古抑菌素A(TSA,1μM)以终止HDAC催化的去乙酰化,然后向反应溶液中加入胰蛋白酶(0.5mg/mL)。在30℃下再孵育1小时后,申请人在酶标仪中以Ex/Em=360nm/460nm测量香豆素的荧光。所有测量重复3次。

实施例1.16.分子对接

使用Autodock工具制作了HDAC8受体(PDB码5FCW)的单体和二聚体形式的晶体结构。也用同样的程序制作了配体CycH8a。选择对接搜索框使其包含整个蛋白质结构。使用Autodock vina进行对接,并使用UCSF Chimera对位姿(pose)可视化以供分析。

无需进一步阐述,据信本领域技术人员可以通过本文的描述,最充分地利用本发明的内容。本文所述的实施方式应被理解为说明性的,而不是以任何方式限制本公开的其余部分。虽然示出并描述了实施方式,但是本领域技术人员可以在不偏离本发明的精神和教导的情况下可以对其进行许多变化和修改。因此,保护范围不受上述描述的限制,而只受权利要求的限制,包括权利要求主题的所有等同物。本文中列举的所有专利、专利申请和出版物的公开内容都通过引用纳入本文,在此范围内它们提供程序或其他细节与本文所述的相符并对其进行补充。

序列表

<110> 得克萨斯A&M大学系统(The Texas A&M University System)

Liu, Wenshe

<120> 遗传编码的噬菌体展示的环状肽文库及其制备方法

<130> 13260-P190WO

<160> 57

<170> PatentIn version 3.5

<210> 1

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> CycTev1

<220>

<221> MISC_特征

<222> (8)..(8)

<223> X是非经典氨基酸

<400> 1

Cys Trp Arg Asp Tyr Leu Ile Xaa

1 5

<210> 2

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> CycTev2

<220>

<221> MISC_特征

<222> (8)..(8)

<223> X是非经典氨基酸

<400> 2

Cys Gln Trp Phe Ser His Arg Xaa

1 5

<210> 3

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> CycH8a

<220>

<221> MISC_特征

<222> (8)..(8)

<223> X是非经典氨基

<400> 3

Cys Gln Ser Leu Trp Met Asn Xaa

1 5

<210> 4

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> LinTev1

<400> 4

Cys Trp Arg Asp Tyr Leu Ile Lys

1 5

<210> 5

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> LinTev2

<400> 5

Cys Gln Trp Phe Ser His Arg Lys

1 5

<210> 6

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> LinH8a

<400> 6

Cys Gln Ser Leu Trp Met Asn Lys

1 5

<210> 7

<211> 759

<212> DNA

<213> 人工序列

<220>

<223> CA5X-sfGFP

<400> 7

atgtgtgctg cagcggctgc atagaaagga gaagaacttt tcactggagt tgtcccaatt 60

cttgttgaat tagatggtga tgttaatggg cacaaatttt ctgtccgtgg agagggtgaa 120

ggtgatgcta caaacggaaa actcaccctt aaatttattt gcactactgg aaaactacct 180

gttccgtggc caacacttgt cactactctg acctatggtg ttcaatgctt ttcccgttat 240

ccggatcaca tgaaacggca tgactttttc aagagtgcca tgcccgaagg ttatgtacag 300

gaacgcacta tatctttcaa agatgacggg acctacaaga cgcgtgctga agtcaagttt 360

gaaggtgata cccttgttaa tcgtatcgag ttaaagggta ttgattttaa agaagatgga 420

aacattcttg gacacaaact cgagtacaac tttaactcac acaatgtata catcacggca 480

gacaaacaaa agaatggaat caaagctaac ttcaaaattc gccacaacgt tgaagatggt 540

tccgttcaac tagcagacca ttatcaacaa aatactccaa ttggcgatgg ccctgtcctt 600

ttaccagaca accattacct gtcgacacaa tctgtccttt cgaaagatcc caacgaaaag 660

cgtgaccaca tggtccttct tgagtttgta actgctgctg ggattacaca tggcatggat 720

gagctctaca aaggatccca tcaccatcac catcactaa 759

<210> 8

<211> 759

<212> DNA

<213> 人工序列

<220>

<223> A6X-sfGFP

<400> 8

atggctgctg cagcggctgc atagaaagga gaagaacttt tcactggagt tgtcccaatt 60

cttgttgaat tagatggtga tgttaatggg cacaaatttt ctgtccgtgg agagggtgaa 120

ggtgatgcta caaacggaaa actcaccctt aaatttattt gcactactgg aaaactacct 180

gttccgtggc caacacttgt cactactctg acctatggtg ttcaatgctt ttcccgttat 240

ccggatcaca tgaaacggca tgactttttc aagagtgcca tgcccgaagg ttatgtacag 300

gaacgcacta tatctttcaa agatgacggg acctacaaga cgcgtgctga agtcaagttt 360

gaaggtgata cccttgttaa tcgtatcgag ttaaagggta ttgattttaa agaagatgga 420

aacattcttg gacacaaact cgagtacaac tttaactcac acaatgtata catcacggca 480

gacaaacaaa agaatggaat caaagctaac ttcaaaattc gccacaacgt tgaagatggt 540

tccgttcaac tagcagacca ttatcaacaa aatactccaa ttggcgatgg ccctgtcctt 600

ttaccagaca accattacct gtcgacacaa tctgtccttt cgaaagatcc caacgaaaag 660

cgtgaccaca tggtccttct tgagtttgta actgctgctg ggattacaca tggcatggat 720

gagctctaca aaggatccca tcaccatcac catcactaa 759

<210> 9

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> CA5X-F 引物

<400> 9

Gly Ala Gly Ala Thr Ala Thr Ala Cys Cys Ala Thr Gly Thr Gly Thr

1 5 10 15

Gly Cys Thr Gly Cys Ala Gly Cys Gly Gly Cys Thr Gly Cys

20 25 30

<210> 10

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> CA5X-R 引物

<400> 10

Gly Cys Ala Gly Cys Cys Gly Cys Thr Gly Cys Ala Gly Cys Ala Cys

1 5 10 15

Ala Cys Ala Thr Gly Gly Thr Ala Thr Ala Thr Cys Thr Cys

20 25 30

<210> 11

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> CA5X-F 引物

<400> 11

Gly Ala Gly Ala Thr Ala Thr Ala Cys Cys Ala Thr Gly Gly Cys Thr

1 5 10 15

Gly Cys Thr Gly Cys Ala Gly Cys Gly Gly Cys Thr Gly Cys

20 25 30

<210> 12

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> CA5X-R 引物

<400> 12

Gly Cys Ala Gly Cys Cys Gly Cys Thr Gly Cys Ala Gly Cys Ala Gly

1 5 10 15

Cys Cys Ala Thr Gly Gly Thr Ala Thr Ala Thr Cys Thr Cys

20 25 30

<210> 13

<211> 38

<212> PRT

<213> 人工序列

<220>

<223> M13K07g3TAA-F 引物

<400> 13

Gly Thr Thr Gly Ala Ala Ala Gly Thr Thr Gly Thr Thr Thr Ala Gly

1 5 10 15

Cys Ala Thr Ala Ala Cys Cys Cys Cys Ala Thr Ala Cys Ala Gly Ala

20 25 30

Ala Ala Ala Thr Thr Cys

35

<210> 14

<211> 38

<212> PRT

<213> 人工序列

<220>

<223> M13K07TAA-R 引物

<400> 14

Gly Ala Ala Thr Thr Thr Thr Cys Thr Gly Thr Ala Thr Gly Gly Gly

1 5 10 15

Gly Thr Thr Ala Thr Gly Cys Thr Ala Ala Ala Cys Ala Ala Cys Thr

20 25 30

Thr Thr Cys Ala Ala Cys

35

<210> 15

<211> 46

<212> PRT

<213> 人工序列

<220>

<223> pADL-NcoI-Cys-Ala5-TAG-g3-F 引物

<400> 15

Gly Cys Thr Thr Cys Cys Ala Thr Gly Gly Cys Cys Thr Gly Cys Gly

1 5 10 15

Cys Ala Gly Cys Ala Gly Cys Ala Gly Cys Ala Gly Cys Ala Thr Ala

20 25 30

Gly Gly Cys Gly Gly Cys Gly Ala Ala Ala Gly Cys Gly Gly

35 40 45

<210> 16

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> pADL-NcoI-Cys-Ala5-TAG-R 引物

<400> 16

Gly Cys Thr Thr Cys Cys Ala Thr Gly Gly Cys Cys Gly Gly Cys Thr

1 5 10 15

Gly Gly Gly Cys Cys Gly Cys

20

<210> 17

<211> 46

<212> PRT

<213> 人工序列

<220>

<223> pADL-NcoI-Ala6-TAG-g3-F 引物

<400> 17

Gly Cys Thr Thr Cys Cys Ala Thr Gly Gly Cys Cys Gly Cys Ala Gly

1 5 10 15

Cys Ala Gly Cys Ala Gly Cys Ala Gly Cys Ala Gly Cys Ala Thr Ala

20 25 30

Gly Gly Cys Gly Gly Cys Gly Ala Ala Ala Gly Cys Gly Gly

35 40 45

<210> 18

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> pADL-NcoI-Ala6-TAG-R 引物

<400> 18

Gly Cys Thr Thr Cys Cys Ala Thr Gly Gly Cys Cys Gly Gly Cys Thr

1 5 10 15

Gly Gly Gly Cys Cys Gly Cys

20

<210> 19

<211> 32

<212> PRT

<213> 人工序列

<220>

<223> ColDF-F 引物

<400> 19

Thr Thr Gly Gly Cys Gly Cys Gly Cys Cys Cys Ala Ala Ala Thr Ala

1 5 10 15

Gly Cys Thr Ala Gly Cys Thr Cys Ala Cys Thr Cys Gly Gly Thr Cys

20 25 30

<210> 20

<211> 32

<212> PRT

<213> 人工序列

<220>

<223> ColDF-R 引物

<400> 20

Thr Gly Thr Thr Cys Cys Thr Ala Gly Gly Gly Ala Thr Ala Ala Ala

1 5 10 15

Thr Thr Gly Cys Ala Cys Thr Gly Ala Ala Ala Thr Cys Thr Ala Gly

20 25 30

<210> 21

<211> 32

<212> PRT

<213> 人工序列

<220>

<223> pEVOL-F 引物

<400> 21

Thr Gly Thr Thr Cys Cys Thr Ala Gly Gly Thr Cys Thr Thr Cys Ala

1 5 10 15

Ala Ala Thr Gly Thr Ala Gly Cys Ala Cys Cys Thr Gly Ala Ala Gly

20 25 30

<210> 22

<211> 31

<212> PRT

<213> 人工序列

<220>

<223> pEVOL-R 引物

<400> 22

Thr Thr Gly Gly Cys Gly Cys Gly Cys Cys Cys Cys Thr Thr Thr Thr

1 5 10 15

Thr Thr Cys Thr Cys Cys Thr Gly Cys Cys Ala Cys Ala Thr Gly

20 25 30

<210> 23

<211> 5012

<212> DNA

<213> 人工序列

<220>

<223> pADLg3-TGC-(NNK)6-TAG

<220>

<221> MISC_特征

<222> (3257)..(3258)

<223> n是a, c, g或t

<220>

<221> MISC_特征

<222> (3260)..(3261)

<223> n是a, c, g或t

<220>

<221> MISC_特征

<222> (3263)..(3264)

<223> n是a, c, g或t

<220>

<221> MISC_特征

<222> (3266)..(3267)

<223> n是a, c, g或t

<220>

<221> MISC_特征

<222> (3269)..(3270)

<223> n是a, c, g或t

<220>

<221> MISC_特征

<222> (3272)..(3273)

<223> n是a, c, g或t

<220>

<221> MISC_特征

<222> (4122)..(4141)

<223> n是a, g, c或t; k是g或t

<400> 23

gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 60

atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 120

agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 180

ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 240

gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 300

gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 360

tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 420

acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 480

aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 540

cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 600

gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 660

cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 720

tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 780

tgcgctcggc gcttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 840

ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 900

tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 960

gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 1020

ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1080

tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1140

agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1200

aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1260

cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1320

agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1380

tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1440

gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1500

gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1560

ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1620

gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1680

ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1740

ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1800

acatgacccg acaccatcga atggcgcaaa acctttcgcg gtatggcatg atagcgcccg 1860

gaagagagtc aattcagggt ggtgaatgtg aaaccagtaa cgttatacga tgtcgcagag 1920

tatgccggtg tctcttatca gaccgtttcc cgcgtggtga accaggccag ccacgtttct 1980

gcgaaaacgc gggaaaaagt ggaagcggcg atggcggagc tgaattacat tcccaaccgc 2040

gtggcacaac aactggcggg caaacagtcg ttgctgattg gcgttgccac ctccagtctg 2100

gccctgcacg cgccgtcgca aattgtcgcg gcgattaaat ctcgcgccga tcaactgggt 2160

gccagcgtgg tggtgtcgat ggtagaacga agcggcgtcg aagcctgtaa agcggcggtg 2220

cacaatcttc tcgcgcaacg cgtcagtggg ctgatcatta actatccgct ggatgaccag 2280

gatgccattg ctgtggaagc tgcctgcact aatgttccgg cgttatttct tgatgtctct 2340

gaccagacac ccatcaacag tattattttc tcccatgaag acggtacgcg actgggcgtg 2400

gagcatctgg tcgcattggg tcaccagcaa atcgcgctgt tagcgggccc attaagttct 2460

gtctcggcgc gtctgcgtct ggctggctgg cataaatatc tcactcgcaa tcaaattcag 2520

ccgatagcgg aacgggaagg cgactggagt gccatgtccg gttttcaaca aaccatgcaa 2580

atgctgaatg agggcatcgt tcccactgcg atgctggttg ccaacgatca gatggcgctg 2640

ggcgcaatgc gcgccattac cgagtccggg ctgcgcgttg gtgcggacat ctcggtagtg 2700

ggatacgacg ataccgaaga cagctcatgt tatatcccgc cgttaaccac catcaaacag 2760

gattttcgcc tgctggggca aaccagcgtg gaccgcttgc tgcaactctc tcagggccag 2820

gcggtgaagg gcaatcagct gttgcccgtc tcactggtga aaagaaaaac caccctggcg 2880

cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 2940

caggtttccc gactggaaag cgggcagtga gcggtacccg ataaaagcgg cttcctgaca 3000

ggaggccgtt ttgttttgca gcccacctca acgcaattaa tgtgagttag ctcactcatt 3060

aggcacccca ggctttacac tttatgcttc cggctcgtat gttgtgtgga attgtgagcg 3120

gataacaatt tcacacagga aacagctatg accatgatta cgaatttcta gataacgagg 3180

gcaaatcatg aaatacctat tgcctacggc ggccgctgga ttgttattac tcgcggccca 3240

gccggccatg gcctgcnnkn nknnknnknn knnktagggc ccgggaggcc aaggcggtgg 3300

ttctgagggt ggtggctccc tcgagggcgc gccagccgaa actgttgaaa gttgtttagc 3360

aaaacctcat acagaaaatt catttactaa cgtctggaaa gacgacaaaa ctttagatcg 3420

ttacgctaac tatgagggct gtctgtggaa tgctacaggc gttgtggttt gtactggtga 3480

cgaaactcag tgttacggta catgggttcc tattgggctt gctatccctg aaaatgaggg 3540

tggtggctct gagggtggcg gttctgaggg tggcggttct gagggtggcg gtactaaacc 3600

tcctgagtac ggtgatacac ctattccggg ctatacttat atcaaccctc tcgacggcac 3660

ttatccgcct ggtactgagc aaaaccccgc taatcctaat ccttctcttg aggagtctca 3720

gcctcttaat actttcatgt ttcagaataa taggttccga aataggcagg gtgcattaac 3780

tgtttatacg ggcactgtta ctcaaggcac tgaccccgtt aaaacttatt accagtacac 3840

tcctgtatca tcaaaagcca tgtatgacgc ttactggaac ggtaaattca gagactgcgc 3900

tttccattct ggctttaatg aggatccatt cgtttgtgaa tatcaaggcc aatcgtctga 3960

cctgcctcaa cctcctgtca atgctggcgg cggctctggt ggtggttctg gtggcggctc 4020

tgagggtggc ggctctgagg gtggcggttc tgagggtggc ggctctgagg gtggcggttc 4080

cggtggcggc tccggttccg gtgattttga ttatgaaaaa atggcaaacg ctaataaggg 4140

ggctatgacc gaaaatgccg atgaaaacgc gctacagtct gacgctaaag gcaaacttga 4200

ttctgtcgct actgattacg gtgctgctat cgatggtttc attggtgacg tttccggcct 4260

tgctaatggt aatggtgcta ctggtgattt tgctggctct aattcccaaa tggctcaagt 4320

cggtgacggt gataattcac ctttaatgaa taatttccgt caatatttac cttctttgcc 4380

tcagtcggtt gaatgtcgcc cttatgtctt tggcgctggt aaaccatatg aattttctat 4440

tgattgtgac aaaataaact tattccgtgg tgtctttgcg tttcttttat atgttgccac 4500

ctttatgtat gtattttcga cgtttgctaa catactgcgt aataaggagt cttaatcaag 4560

ctttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat tttttaacca 4620

ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagaccgaga tagggttgag 4680

tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca acgtcaaagg 4740

gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccct aatcaagttt 4800

tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc cccgatttag 4860

agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc 4920

gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc 4980

gcttaatgcg ccgctacagg gcgcgtcagg tg 5012

<210> 24

<211> 47

<212> PRT

<213> 人工序列

<220>

<223> pADL-F 引物

<400> 24

Gly Gly Thr Cys Cys Gly Thr Cys Cys Ala Thr Gly Gly Cys Cys Thr

1 5 10 15

Gly Cys Asn Asn Lys Asn Asn Lys Asn Asn Lys Asn Asn Lys Asn Asn

20 25 30

Lys Asn Asn Lys Thr Ala Gly Gly Gly Cys Cys Cys Gly Gly Gly

35 40 45

<210> 25

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> pADL-R 引物

<400> 25

Cys Cys Ala Cys Gly Gly Cys Cys Ala Thr Gly Gly Cys Cys Gly Gly

1 5 10 15

Cys Thr Gly Gly Gly Cys Cys Gly Cys Gly

20 25

<210> 26

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<220>

<221> MISC_特征

<222> (10)..(27)

<223> n是a, g, c或t; k是g或t

<400> 26

atggcctgcn nknnknnknn knnknnktag ggccc 35

<210> 27

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 27

atggcctgct tgtgtttgcc gattacgtag ggccc 35

<210> 28

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 28

atggcctgcg cgcgtccggt ttgtagttag ggccc 35

<210> 29

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 29

atggcctgct ttccggtgtt ttcgggttag ggccc 35

<210> 30

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 30

atggcctgcc cttcggctac gattgattag ggccc 35

<210> 31

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 31

atggcctgcg ataggggtag tgggacttag ggccc 35

<210> 32

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 32

atggcctgct ttggtaagta gtggtgttag ggccc 35

<210> 33

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 33

atggcctgct tgtctcggac tagtgagtag ggccc 35

<210> 34

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 34

atggcctgcg ttcttactag ggtgccgtag ggccc 35

<210> 35

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 35

atggcctgcc ctggtcatcg ggtttggtag ggccc 35

<210> 36

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 36

atggcctgcc tgggtgttac tcatgcgtag ggccc 35

<210> 37

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 37

atggcctgcc ttgtttatat ttggggttag ggccc 35

<210> 38

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 38

atggcctgcg tgggtcgtta gcggtattag ggccc 35

<210> 39

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 39

atggcctgct ttaatgggca tccttggtag ggccc 35

<210> 40

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 40

atggcctgcc ttggtattgt ttcgccgtag ggccc 35

<210> 41

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 41

atggcctgct gtgttatggt gtgtttgtag ggccc 35

<210> 42

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 42

atggcctgcg ttaggtattc tgatgtttag ggccc 35

<210> 43

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 43

atggccgcgg cgaaagcggc cggccc 26

<210> 44

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 44

atggcggggt agggccc 17

<210> 45

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 45

atggcctgct tggtggtctt gggagttaag gccc 34

<210> 46

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 从噬菌粒文库中分离的克隆

<400> 46

atggccgcgg cgaaagcggc cggccc 26

<210> 47

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 肽

<400> 47

Cys Gly Thr Trp Leu Lys Phe

1 5

<210> 48

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> pADL-突变的

<220>

<221> MISC_特征

<222> (10)..(29)

<223> n是a, g, c或t; k是g或t

<400> 48

atggcctgcn nknnknnknn knnknnktag 30

<210> 49

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> CQWFSHR-AcrK

<400> 49

atggcctgcc agtggtttag tcatcgttag 30

<210> 50

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> CGTWLKF-AcrK

<400> 50

atggcctgcg ggacttggct gaagttttag 30

<210> 51

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> CWRDYLI-AcrK

<400> 51

atggcctgct ggcgtgatta tcttatttag 30

<210> 52

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> DNA序列

<400> 52

atggcctgcc ggcgttgtaa tcatatttag 30

<210> 53

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 肽

<400> 53

Cys Lys His Ser Leu Trp Val

1 5

<210> 54

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 肽

<400> 54

Cys Leu Ser Asp Cys Arg Val

1 5

<210> 55

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> CQSLWMN-AcrK

<400> 55

atggcctgcc agagtctttg gatgaattag 30

<210> 56

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> CKHSLWV-AcrK

<400> 56

atggcctgca agcatagttt gtgggtttag 30

<210> 57

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> CLSCDRV-AcrK

<400> 57

atggcctgcc tgagttgtga tagggtgtag 30

73页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:CBM用途

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!