包封免疫刺激性核酸的自组装蛋白纳米粒子

文档序号:1660960 发布日期:2019-12-27 浏览:27次 >En<

阅读说明:本技术 包封免疫刺激性核酸的自组装蛋白纳米粒子 (Self-assembling protein nanoparticles encapsulating immunostimulatory nucleic acids ) 是由 卡罗琳·库兰加拉 萨拉·玛丽亚·保罗 马特奥·普拉扎 森蒂尔·库马尔·拉曼 彼得·布克哈德 于 2018-02-22 设计创作,主要内容包括:本发明涉及包封免疫刺激性核酸的自组装蛋白纳米粒子。此外,本发明涉及这些纳米粒子用于疫苗接种的用途。(The present invention relates to self-assembling protein nanoparticles encapsulating immunostimulatory nucleic acids. Furthermore, the invention relates to the use of these nanoparticles for vaccination.)

包封免疫刺激性核酸的自组装蛋白纳米粒子

技术领域

本发明涉及包封免疫刺激性核酸的自组装蛋白纳米粒子。此外,本发明涉及这些纳米粒子用于疫苗接种的用途。

背景技术

CpG–TLR9

含有胞嘧啶紧随其后是鸟嘌呤的短单链合成DNA分子被称为CpG寡脱氧核苷酸(或CpG ODN)。所述“p”是指两个连续核苷酸之间的磷酸二酯键,这与双链DNA中的CG碱基配对完全不同,尽管一些合成的ODN代之以具有修饰的硫代磷酸酯骨架以提高它们的体内稳定性。当这些CpG基序的胞嘧啶未甲基化时,它们可以充当免疫刺激性分子。由于它们在微生物基因组中的丰富性与它们在脊椎动物基因组中的相对稀有性形成鲜明对比——在哺乳动物中所有CpG配对中的约70%至80%的胞嘧啶是甲基化的,因此CpG基序被认为是与病原体相关的分子模式(PAMP)。所述CpG PAMP被所谓的模式识别受体Toll样受体9(TLR9)识别。TLR9是识别来自于细菌和病毒两者的DNA的toll样受体,而TLR3、TLR7和TLR8识别病原体来源的RNA。TLR9仅在高等灵长类动物和人中的浆细胞样树突状细胞和B细胞中组成性表达,因此在人中未甲基化的CpG二核苷酸位点可以被这些细胞上的TLR9检测。这被免疫系统用于检测细胞内感染。

RNA

病原体来源的RNA也被toll样受体识别。TLR3识别主要来自于带有双链RNA基因组的病毒的双链RNA和多聚I:C(poly I:C);TLR7识别来自于RNA病毒的单链RNA,而TLR8识别小的合成化合物、单链病毒RNA和被吞噬的细菌RNA。

TLR3

最常用的实验性TLR3激动剂是polyI:polyC(pIC)。pIC是一种模拟双链RNA(dsRNA)的大的合成聚合复合物。pIC的制备物在链长的分布、溶解性和其他生物学性质包括毒性方面各不相同。

实验研究显示,TLR3可以在癌细胞中触发凋亡。此外,在细胞质中存在其他结合dsRNA的受体例如MDA5和RIG-I,它们在癌细胞中也可以结合pIC并对凋亡有贡献。TLR3诱导凋亡并在同时活化免疫系统的能力,使TLR3配体例如pIC成为用于癌症治疗的有吸引力的治疗选项。

TLR7和TLR8

1.位于胞内体中的TLR7和TLR8识别单链RNA(ssRNA)。这是被免疫细胞例如巨噬细胞或树突状细胞内化的ssRNA病毒例如流感病毒、仙台病毒和柯萨奇B型病毒的基因组的共同特点。尽管TLR7可以识别富含GU的ssRNA,但ssRNA中富含GU的序列的存在不足以刺激TLR7。咪喹莫特是一种通过与TLR7相互作用充当免疫应答调节剂的处方药。咪喹莫特被用于治疗表浅性基底细胞癌、生殖器疣和光化性角化病。瑞喹莫德(R-848)和嘎德莫特是咪喹莫特的衍生物。

第一方面,本发明涉及一种用于在对象中诱导免疫应答的组合物,其包含:

(a)由多个下式(I)的构件构成的自组装蛋白纳米粒子(SAPN),

X1–ND1–L1–ND2–Y1 (I),

所述式(I)的构件由包含卷曲螺旋寡聚化结构域ND1、连接物L1、卷曲螺旋寡聚化结构域ND2和其他取代基X1和Y1的连续链构成,其中

ND1是包含m个亚基ND1的寡聚物(ND1)m的卷曲螺旋寡聚化结构域,

ND2是包含n个亚基ND2的寡聚物(ND2)n的卷曲螺旋寡聚化结构域,

m和n各自为2至10之间的数字,前提是m不等于n并且不是n的倍数,并且n不是m的倍数,

L1是在生理条件下具有至少+2的总正电荷的肽连接物,

X1不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

Y1不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

其中所述多个式(I)的构件任选地与多个下式(II)的构件共同组装,

X2–ND3–L2–ND4–Y2 (II)

所述式(II)的构件由包含卷曲螺旋寡聚化结构域ND3、连接物L2、卷曲螺旋寡聚化结构域ND4和其他取代基X2和Y2的连续链构成,其中

ND3是包含y个亚基ND3的寡聚物(ND3)y的卷曲螺旋寡聚化结构域,

ND4是包含z个亚基ND4的寡聚物(ND4)z的卷曲螺旋寡聚化结构域,

y和z各自为2至10之间的数字,前提是y不等于z并且不是z的倍数,并且z不是y的倍数,并且其中

ND3与ND1一致,或者ND4与ND2一致,或者ND3和ND4两者分别与ND1和ND2一致,

L2是在生理条件下具有至少+2的总正电荷的肽连接物,

X2不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

Y2不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

(b)免疫刺激性物质,其中所述免疫刺激性物质是核酸衍生物,其中所述核酸衍生物被包封在所述SAPN中。

第二方面,本发明涉及一种疫苗接种人或非人动物的方法,所述方法包括向需要这种疫苗接种的对象给药有效量的本文中所描述的组合物。

第三方面,本发明涉及一种生产本文中所描述的SAPN的方法,所述方法包括:i)向包含核酸衍生物的缓冲液添加SAPN,和ii)使用常规的重折叠流程在所述核酸衍生物存在下重折叠所述SAPN。

附图说明

图1:包封CpG的纳米粒子的单体的示意图。

下面是所述单体的构件:

·X1是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列。

·ND1是形成m个亚基ND1的寡聚物(ND1)m的卷曲螺旋,

·L1是具有+3的总正电荷的肽连接物,

·ND2是形成n个亚基ND2的寡聚物(ND2)n的卷曲螺旋,

·Y1不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列。

图2:DEDDLI-RR的分子模型。

A)带有相应激动剂的TLR5和TLR9受体的X-射线晶体结构:TLR5二聚体与两个鞭毛蛋白分子(黄色和洋红色)相互作用,而TLR9与CpG相互作用。B)左侧:自组装蛋白的单体构件,由his标签(X1)、五聚卷曲螺旋(ND1)、二聚卷曲螺旋(ND2)和鞭毛蛋白的D0和D1结构域(X2)构成。所述两个卷曲螺旋寡聚化结构域ND1和ND2通过具有三个正电荷的连接物(L1)联结。右侧:CpG分子。C)组装的蛋白质纳米粒子,其具有60个蛋白质链和包封在中央空腔中的约36个CpG分子。为更清晰起见,圆圈内部的蛋白质链(代表正电荷)未示出,以使粒子内(带负电荷的)CpG分子可见。注意,图A)、B)和C)中不是所有的结构都按尺寸绘制。

图3:pPEP-T的载体图谱。

“prom”:启动子;“term”:终止子;“ori”:原点;“bp”:碱基对;“amp”:氨苄青霉素抗性基因。

图4:构建物DEDDLI-RR的SDS-PAGE。

该构建物具有44.8kDa的理论分子量。

A)两种不同浓度的下述样品的表达水平

UI–未诱导的

I–诱导的

B)来自于FPLC的洗脱曲线。蛋白质用120至122mM咪唑洗脱。

C)Ni亲和纯化后的纯度。第1道:Mw标志物;CL:澄清的裂解液;第3至9道:流通液;第15至20道:洗脱峰。

D)将NHS-烟碱偶联到DEDDLI-RR之前(下图)和之后(上图)的质谱分析。

图5:包封和未包封在构建物DEDDLI-RR中的荧光标记的ODN1826F的相对荧光单位(RFU)。

单独的CpG-ODN1826F(黑色柱)和包封在SAPN DEDDLI-RR中的CpG-ODN1826F(虚线柱)的RFU值随不断提高的包封比的变化。注明了DEDDLI-RR的蛋白质链与ODN1826F的DNA链的摩尔比。

图6:荧光标记的ODN1826F在构建物DEDDLI-RR中包封后相对荧光单位(RFU)的差异。

单独的CpG-ODN1826F(黑色菱形)和对应于包封在DEDDLI-RR中的CpG的样品中的游离CpG的差值(虚线正方形)的RFU值随不断提高的包封比的变化。所述两条曲线近似重叠。

-RFU的差异值被计算为来自于以给定CpG包封比包封由CpG的DEDDLI-RR的信号减去1:0.6的包封比下的信号。

-“差值”曲线(虚线正方形)的比率值被计算为比率减去0.6。

图7:DEDDLI-RR的透射电子显微照片

在重组表达的蛋白质的重折叠和共同组装后,将样品吸附在碳涂层的网上并用2%乙酸双氧铀负染色。所述纳米粒子具有实施例1中描述的序列SEQ ID NO:1。上图和下图的条分别代表200nm和500nm。

图8:含有和不含包封的ODN1826的DEDDLI-RR的免疫应答。

在10μg和30μg两种蛋白质浓度下的三种注射方式(IM、IN和IV)各自具有它们相应的抗体滴度。对于10μg和30μg剂量来说,包封了0.85μg和2.56μg的CpG,其分别用“+”或“-”符合指示。抗体滴度在包被有BSA-烟碱、即共价偶联到BSA的烟碱的板上通过ELISA结合测定法来确定。在来自于免疫接种中包封的CpG的样品中可以观察到抗体滴度的显著提高。

图9:包封和未包封在构建物DEDDLI-RR、2RR和3RR中的荧光标记的ODN1826F的相对荧光单位(RFU)。

单独的CpG-ODN1826F(菱形)和包封在SAPN DEDDLI-RR(正方形)、2RR(三角形)和3RR(圆形)中的CpG-ODN1826F的RFU值随不断提高的包封比的变化。注明了DEDDLI-RR的蛋白质链与ODN1826F的DNA链的摩尔比。

◆单独的CpG(即未包封)

■DEDDLI-RR

▲2RR

●3RR

图10:包封和未包封有ODN1826的基于LIVELI的构建物的免疫应答。

将5只Balb/C小鼠的组各自用30μg的包封有(LIVELI1-RR和LIVELI2-RR)或未包封有CpG(LIVELI1和LIVELI2)的蛋白质药剂免疫接种。所述LIVELI1-RR和LIVELI2-RR药剂中包封的CpG的量为约2.5μg。提供三次肌肉内注射,各自相隔两周。在来自于包封的CpG的样品中可以观察到抗体滴度的显著提高。

图11:LIVELI1、LIVELI2、LIVELI1-RR和LIVELI2-RR的透射电子显微照片

在重组表达的蛋白质的重折叠和共同组装后,将样品吸附在碳涂层的网上并用2%乙酸双氧铀负染色。所述纳米粒子对应于A)LIVELI1、B)LIVELI2、C)LIVELI1-RR和D)LIVELI2-RR,并分别具有在实施例10中描述的序列SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:18和SEQ ID NO:19。所有图中的条都表示200nm。

图12:包封和未包封在构建物CC-RR中的荧光标记的ODN1826F的相对荧光单位(RFU)。

单独的CpG-ODN1826F(黑色柱)和包封在SAPN CC-RR中的CpG-ODN1826F(虚线柱)的RFU值随不断提高的包封比的变化。注明了DEDDLI-RR的蛋白质链与ODN1826F的DNA链的摩尔比。

图13:CC-RR-NN的分子模型。

A)第一自组装蛋白链的单体构件由his标签和CelTOS(X1)、第一卷曲螺旋结构域(ND1)、第二卷曲螺旋结构域(ND2)和第二CelTOS分子(Y1)构成,其中所述两个卷曲螺旋结构域通过具有三个正电荷的短肽连接物(L1)联结。B)第二自组装蛋白链的单体构件由his标签和CelTOS(X2)、第一卷曲螺旋结构域(ND3)、第二卷曲螺旋结构域(ND4)和鞭毛蛋白的D0和D1结构域(Y2)构成,其中所述两个卷曲螺旋结构域通过具有三个正电荷的短肽连接物(L2)联结。C)CpG分子(对于图A和B来说不是按尺寸绘制的)。在重折叠期间,共同组装和包封同时发生。D)组装的蛋白质纳米粒子具有第一和第二蛋白质链的共同组装比为58:2的60个蛋白质链和包封在中央空腔中的约36个CpG分子。为更清晰起见,圆圈内部的蛋白质链(代表正电荷)未示出,以使粒子内(带负电荷的)CpG分子可见。E)包封有CpG的共同组装的SAPN的透射电子显微照片。条表示100nm。

图14:RR-SSIEF的透射电子显微照片。

在重组表达的蛋白质的重折叠后,将样品吸附在碳涂层的网上并用2%乙酸双氧铀负染色。所述纳米粒子对应于RR-SSIEF,具有实施例12中描述的序列SEQ ID NO:34,并包封有CpGODN1585(SEQ ID NO:39)。条表示200nm。

发明详述

在本发明中,描述了内置在SAPN的结构体系中,旨在将核酸包封在所述SAPN中的DNA和/或RNA结合位点。所述SAPN被描述在例如Raman S.K.等,Nanomed 2006,2(2):95-102;Pimentel T.A.等,Chem Biol Drug Des.2009.73(1):53-61;Indelicato,G.等,Biophys J.2016,110(3):646-660;Karch,C.P.等,Nanomedicine 2016,13(1):241-251中。所述SAPN也被描述在WO2004071493、WO2009109428和WO2015104352中。第一方面,本发明涉及一种用于在对象中诱导免疫应答的组合物,所述组合物包含:

(a)由多个下式(I)的构件构成的自组装蛋白纳米粒子(SAPN),

X1–ND1–L1–ND2–Y1 (I),

所述式(I)的构件由包含卷曲螺旋寡聚化结构域ND1、连接物L1、卷曲螺旋寡聚化结构域ND2和其他取代基X1和Y1的连续链构成,其中

ND1是包含m个亚基ND1的寡聚物(ND1)m的卷曲螺旋寡聚化结构域,

ND2是包含n个亚基ND2的寡聚物(ND2)n的卷曲螺旋寡聚化结构域,

m和n各自为2至10之间的数字,前提是m不等于n并且不是n的倍数,并且n不是m的倍数,

L1是在生理条件下具有至少+2的总正电荷的肽连接物,

X1不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

Y1不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

其中所述多个式(I)的构件任选地与多个式(II)的构件共同组装,

X2–ND3–L2–ND4–Y2 (II)

所述式(II)的构件由包含卷曲螺旋寡聚化结构域ND3、连接物L2、卷曲螺旋寡聚化结构域ND4和其他取代基X2和Y2的连续链构成,其中

ND3是包含y个亚基ND3的寡聚物(ND3)y的卷曲螺旋寡聚化结构域,

ND4是包含z个亚基ND4的寡聚物(ND4)z的卷曲螺旋寡聚化结构域,

y和z各自为2至10之间的数字,前提是y不等于z并且不是z的倍数,并且z不是y的倍数,并且其中

ND3与ND1一致,或者ND4与ND2一致,或者ND3和ND4两者分别与ND1和ND2一致,

L2是在生理条件下具有至少+2的总正电荷的肽连接物,

X2不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

Y2不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

(b)免疫刺激性物质,其中所述免疫刺激性物质是核酸衍生物,其中所述核酸衍生物被包封在所述SAPN中。

现在已令人吃惊地发现,如果将所述SAPN的两个寡聚化结构域相连接的连接物含有带正电荷的氨基酸区段,由此为所述连接物提供至少+2的总电荷,则带负电荷的核酸可以被包封在所述SAPN内。这是因为所述带有正电荷的连接物被方便地定向到所述SAPN的中央空腔,由此为所述中央空腔提供了带正电荷的表面包层,类似于病毒衣壳的包封病毒的基因组材料的带正电荷的空腔。然而,这是出人意料的,因为在具有T1二十面体对称的SAPN中,60个蛋白质链组装成所述SAPN,因此使用每个连接物至少两个正电荷时,多达120个正电荷将排列成所述中央空腔的相对小的空间,产生显著的排斥力,阻碍重折叠期间SAPN的形成。

值得注意的是,这种核酸在SAPN中的包封不需所述核酸与所述SAPN的任何特殊的化学附连。当在重折叠之前向重折叠缓冲液添加所述核酸,然后使用常规的重折叠流程在所述核酸存在下重折叠所述SAPN时,发生所述核酸的包封。

可以包封在所述SAPN中的具体核酸可能具有免疫刺激性质。例如,在免疫接种流程中使用包封有CpG的SAPN,显著提高了总体免疫应答。因此,本发明的SAPN提供了高效增强免疫应答以及因此基于SAPN的疫苗的免疫原性的简洁方式。

单体构件

肽(或多肽或蛋白质)是通过酰胺键共价连接的氨基酸的链或序列。肽可以是天然的、修饰的天然的、部分合成的或全合成的。修饰的天然的、部分合成的或全合成的被理解为意味着在自然界中不存在。术语氨基酸涵盖了选自20种必需的天然α–L-氨基酸的天然存在的氨基酸、合成的氨基酸例如α–D-氨基酸、6-氨基己酸、正亮氨酸、高半胱氨酸等,以及以某些方式进行修饰以改变某些性质如电荷的天然存在的氨基酸,例如磷酸丝氨酸或磷酸酪氨酸或其他修饰例如n-辛酰基-丝氨酸等。氨基酸的衍生物是其中例如形成酰胺键的氨基被烷基化,或侧链氨基、羟基或巯基被烷基化或酰化,或侧链羧基被酰胺化或酯化的氨基酸。优选地,本发明的肽或蛋白质包含选自20种必需的天然α–L-氨基酸的氨基酸。

粗略来说,肽与蛋白质可以在它们的尺寸的基础上区分开,即大约50个或更少氨基酸的链可以被认为是肽,而更长的链可以被认为是蛋白质。因此,当在本文中使用时,术语“肽”是指50个或更少氨基酸的氨基酸链,优选地是指2至50个氨基酸的氨基酸链,当在本文中使用时,术语“蛋白质”是指超过50个氨基酸的氨基酸链,优选地是指51至10000个氨基酸的氨基酸链。二肽是最短的肽,并由通过单个肽键连接的两个氨基酸构成。同样地,三肽由三个氨基酸构成,四肽由四个氨基酸构成,等等。多肽是长的、连续的且无分支的肽链。在文献中,区分肽与蛋白质的尺寸界限多少有些模糊。有时长的“肽”例如β淀粉样肽被当作蛋白质,并且反过来较小的蛋白质例如胰岛素被称为肽。

根据本发明的寡聚化结构域是卷曲螺旋。卷曲螺旋是具有主要疏水的残基被3和4个残基隔开的邻近模式的蛋白质序列,其组装以形成多聚体螺旋束,正如将在下文中更详细解释的。

式(I)的单体构件的组分ND1、ND2、X1和Y1和/或式(II)的单体构件的组分(ND3、ND4、X2和Y2),可能任选地被靶向实体或加强所述纳米粒子的辅助性质的取代基进一步取代。取代意味着将所述单体构件上的一个化学基团用另一个化学基团代替,产生共价连接到所述单体构件的取代基。这些取代基可以是免疫刺激性核酸,优选为含有脱氧肌苷的寡脱氧核苷酸、含有脱氧尿苷的寡脱氧核苷酸、含有CG基序的寡脱氧核苷酸、CpG、咪喹莫特、瑞喹莫德、嘎德莫特、含有肌苷和胞苷的核酸分子等。被当作取代基的特定靶向基团是靶向ER的信号,即引起蛋白质或肽向内质网(ER)的运输的信号肽。

在优选实施方式中,所述式(I)或(II)的构件包含取代基X1或取代基Y1或取代基X2或取代基Y2。

在另一个优选实施方式中,所述式(I)或(II)的构件包含取代基X1和Y1或取代基X2和Y2。因此,在最优选实施方式中,所述取代基X1、X2、Y1或Y2是代表了蛋白质链通常在一个末端处、优选地在两个末端处的延长的肽或蛋白质取代基,例如X1–ND1–L1–ND2–Y1或X2–ND3–L2–ND4–Y2,以产生组合的单一连续蛋白质序列。方便的是,这种单一连续蛋白质链可以在重组蛋白表达系统中作为单一分子表达。彼此独立地形成的取代基X1、Y1、X2和Y2是包含1至1000个氨基酸的肽或蛋白质序列,优选为对应于完全折叠的蛋白质或蛋白质结构域作为B-细胞表位或鞭毛蛋白或其如WO2015104352中所描述的4个结构域的子集被用于增强免疫应答的序列。

鞭毛蛋白具有由4个结构域D0、D1、D2和D3构成的分子结构体系。所述蛋白质链始于D0结构域中的N-端并通过结构域D1、D2和D3运行一大圈到达所述分子的顶端,在那里它折返并运行通过D3、D2和D1,以将它在D0结构域中的C-端末端带到非常靠近于所述N-端末端。鞭毛蛋白具有两种先天性免疫系统的活化方式。第一种方式是主要通过它的D1结构域的高度保守的部分结合到TLR5受体(Yoon等,同前)。另一种活化方式是主要通过它的D0结构域的高度保守的C-端部分与炎性体相互作用(Lightfield K.L.等,Nat Immunol.2008,9:1171-8)。

因此,在优选实施方式中,取代基X1、Y1、X2和Y2中的至少一者是全长鞭毛蛋白例如全长鼠伤寒沙门氏菌(Salmonella typhimurium)鞭毛蛋白或只包含2或3个结构域的鞭毛蛋白,优选为至少包含TLR5结合结构域D1的鞭毛蛋白,更优选为包含D0和D1结构域的鞭毛蛋白,特别是SEQ ID NO:6中所示的鞭毛蛋白。丢失的结构域可以被联结剩余鞭毛蛋白序列的两个末端的1至20个氨基酸的柔性连接物区段取代,或者它们可以被完全折叠的蛋白质抗原代替。在优选实施方式中,所述柔性连接物包含如SEQ ID NO:9中所示的氨基酸序列。所述柔性连接物区可以含有适合的附连位点,用于抗原的共价偶联。因此,缺少鞭毛蛋白的D2和D3结构域的鞭毛蛋白衍生构建物可以简单地通过在所述D1和D2结构域的接口处连接所述蛋白质链,很容易地工程化。类似地,顶端结构域(D3,或D2与D3合在一起)可以被蛋白质抗原代替,只要该具有N-和C-端的蛋白质抗原可以在D1与D2之间的接口处连接到所述N-和C-端即可。所述顶端结构域D2和D3也可以被具有用于抗原分子的共价偶联的适合残基的肽序列代替。

在另一个优选实施方式中,X1、Y1、X2和Y2也可以彼此独立地包含一串一个或多个CD4或CD8表位。在另一个优选实施方式中,X1、Y1、X2和Y2可以彼此独立地包含一种或多种这些类型的免疫相关肽和蛋白质序列的组合。

形成寡聚物的倾向性意味着这些蛋白质可以根据条件形成寡聚物,例如在变性条件下它们是单体,而在生理条件下它们可能形成例如二聚体、三聚体、四聚体或五聚体。在预定条件下,它们采取纳米粒子形成所需的单一寡聚化状态。然而,在改变条件后它们的寡聚化状态可能改变,例如在降低盐浓度后从三聚体变成二聚体(Burkhard P.等,ProteinScience 2000,9:2294-2301)或在降低pH后从五聚体变成单体。

式(I)或(II)的构件结构体系明显有别于病毒衣壳蛋白。病毒衣壳或者由单一蛋白质构成,其形成60或其倍数的寡聚物,例如乙肝病毒粒子(EP 1 262 555、EP 0 201416),或者由超过一种蛋白质构成,它们共同组装以形成病毒衣壳结构,其取决于病毒的类型也可以采取二十面体之外的其他几何形状(Fender P.等,Nature Biotechnology 1997,15:52-56)。本发明的SAPN也明显有别于病毒样粒子,因为它们(a)由病毒衣壳蛋白之外的蛋白质构造而成,并且(b)所述纳米粒子中间的空腔太小而不能容纳整个病毒基因组的DNA/RNA。

蛋白质寡聚化结构域是公知的(Burkhard P.等,Trends Cell Biol 2001,11:82-88)。在本发明中,所述寡聚化结构域是卷曲螺旋结构域。卷曲螺旋是具有主要疏水的残基被3和4个残基隔开的连续模式的蛋白质序列,通常在7个氨基酸(七肽重复序列)或11个氨基酸(十一肽重复序列)的序列中,其组装(折叠)以形成多聚体螺旋束。也设想了具有包括所述3和4个残基间隔的一些不规则分布的序列的卷曲螺旋。疏水残基具体来说是疏水性氨基酸Val、Ile、Leu、Met、Tyr、Phe和Trp。主要疏水意味着至少50%的所述残基必须选自提到的疏水性氨基酸。

七肽重复序列和卷曲螺旋

例如,在式(I)和/或(II)的优选单体构件中,ND1、ND2、ND3和/或ND4包含七肽重复序列或十一肽重复序列,更优选为七肽重复序列,特别是任何下式的蛋白质:

[aa(a)-aa(b)-aa(c)-aa(d)-aa(e)-aa(f)-aa(g)]X (IIIa),

[aa(b)-aa(c)-aa(d)-aa(e)-aa(f)-aa(g)-aa(a)]X (IIIb),

[aa(c)-aa(d)-aa(e)-aa(f)-aa(g)-aa(a)-aa(b)]X (IIIc),

[aa(d)-aa(e)-aa(f)-aa(g)-aa(a)-aa(b)-aa(c)]X (IIId),

[aa(e)-aa(f)-aa(g)-aa(a)-aa(b)-aa(c)-aa(d)]X (IIIe),

[aa(f)-aa(g)-aa(a)-aa(b)-aa(c)-aa(d)-aa(e)]X (IIIf),

[aa(g)-aa(a)-aa(b)-aa(c)-aa(d)-aa(e)-aa(f)]X (IIIg),

其中aa意味着氨基酸或其衍生物,aa(a)、aa(b)、aa(c)、aa(d)、aa(e)、aa(f)和aa(g)是相同或不同的氨基酸或其衍生物,优选地aa(a)和aa(d)是相同或不同的疏水性氨基酸或其衍生物;并且x是2至20之间、优选地3至10之间的数字。

七肽是式aa(a)-aa(b)-aa(c)-aa(d)-aa(e)-aa(f)-aa(g)(IIIa)或其式(IIIb)至(IIIg)的排列的任一者的七肽。

优选的是式(I)或(II)的单体构件,其中所述寡聚化结构域ND1、ND2、ND3和/或ND4包含:

(1)式(IIIa)至(IIIg)任一者的蛋白质,其中x是3,并且aa(a)和aa(d)选自20种天然α–L-氨基酸,使得这6个氨基酸的来自于表1的评分之和为至少14,并且这些蛋白质包含至多17个另外的七肽;或

(2)式(IIIa)至(IIIg)任一者的蛋白质,其中x是3,并且aa(a)和aa(d)选自20种天然α–L-氨基酸,使得这6个氨基酸的来自于表1的评分之和为至少12,前提是一个氨基酸aa(a)是能够与相邻七肽的氨基酸aa(d)或aa(g)形成螺旋间盐桥的带电荷氨基酸,或者一个氨基酸aa(d)是能够与相邻七肽的氨基酸aa(a)或aa(e)形成螺旋间盐桥的带电荷氨基酸,并且这些蛋白质包含至多2个其他七肽。能够与相邻七肽的氨基酸形成螺旋间盐桥的带电荷氨基酸是例如Asp或Glu,如果所述另一个氨基酸是氨基酸Lys、Arg或His的话;或正好相反。

表1:用于确定偏好性(卷曲螺旋倾向性)的氨基酸的评分

此外,优选的是式(I)或(II)的单体构件,其中所述蛋白质寡聚化结构域ND1、ND2、ND3和/或ND4包含选自下述优选蛋白质的蛋白质:

(11)式(IIIa)至(IIIg)任一者的蛋白质,其中

aa(a)选自Val、Ile、Leu和Met及其衍生物,并且

aa(d)选自Leu、Met、Val和Ile及其衍生物。

(12)式(IIIa)至(IIIg)任一者的蛋白质,其中一个aa(a)是Asn并且其他aa(a)选自Asn、Ile和Leu,并且aa(d)是Leu。这种蛋白质通常是二聚化结构域。

(13)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)和aa(d)两者都是Leu或两者都是Ile。这种蛋白质通常是三聚化结构域。

(14)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)和aa(d)两者都是Trp。这种蛋白质通常是五聚化结构域。

(15)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)和aa(d)两者都是Phe。这种蛋白质通常是四聚化结构域。

(16)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)和aa(d)两者是Trp或Phe。这种蛋白质通常是五聚化结构域。

(17)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)是Leu或Ile,并且一个aa(d)是Gln,并且其他aa(d)选自Gln、Leu和Met。这种蛋白质具有成为五聚化结构域的潜力。

其他优选的蛋白质是如上文中所定义的蛋白质(1)、(2)、(11)、(12)、(13)、(14)、(15)、(16)和(17),并且其中另外地:

(18)至少一个aa(g)选自Asp和Glu,并且后一个七肽中的aa(e)是Lys、Arg或His;和/或

(19)至少一个aa(g)选自Lys、Arg和His,并且后一个七肽中的aa(e)是Asp或Glu;和/或

(20)至少一个aa(a至g)选自Lys、Arg和His,并且所述序列中相隔3或4个氨基酸的aa(a至g)是Asp或Glu。这样的成对氨基酸aa(a至g)是例如aa(b)与aa(e)或aa(f)。

卷曲螺旋预测程序例如PCOILS(http://toolkit.tuebingen.mpg.de/pcoils;Gruber M.等,J.Struct.Biol.2006,155(2):140-5)或MULTICOIL(http:// groups.csail.mit.edu/cb/multicoil/cgi-bin/multicoil.cgi)可以预测形成卷曲螺旋的蛋白质序列。因此,在式(I)或(II)的单体构件中,ND1、ND2、ND3和/或ND4包括含有至少一个2个七肽重复序列长的序列的蛋白质,所述序列通过卷曲螺旋预测程序PCOILS预测对于它的具有至少一个14、21或28的窗口尺寸的所有氨基酸来说,以高于0.9的概率形成卷曲螺旋。

在更优选的式(I)或(II)的单体构件中,ND1、ND2、ND3和/或ND4包括含有至少一个3个七肽重复序列长的序列的蛋白质,所述序列通过卷曲螺旋预测程序PCOILS预测对于它的具有至少一个14、21或28的窗口尺寸的所有氨基酸来说,以高于0.9的概率形成卷曲螺旋。

在另一个更优选的式(I)或(II)的单体构件中,ND1、ND2、ND3和/或ND4包括含有至少两个分开的2个七肽重复序列长的序列的蛋白质,所述序列通过卷曲螺旋预测程序PCOILS预测对于它的具有至少一个14、21或28的窗口尺寸的所有氨基酸来说,以高于0.9的概率形成卷曲螺旋。

RCSB结构数据库

已知的卷曲螺旋序列可以从数据库例如RCSB蛋白质数据库(http://www.rcsb.org)检索。

五聚卷曲螺旋

五聚卷曲螺旋可以通过使用识别名称“蛋白质对称性是环状-C5”搜索生物组装中的对称性并与文本搜索“卷曲”或“拉链”相组合,从RCSB数据库(http://www.rcsb.org/pdb/)检索。适合的条目的名单含有4PN8、4PND、4WBA、3V2N、3V2P、3V2Q、3V2R、4EEB、4EED、3MIW、1MZ9、1FBM、1VDF、2GUV、2HYN、1ZLL、1T8Z。

四聚、三聚和二聚卷曲螺旋

同样地,四聚卷曲螺旋可以使用“蛋白质对称性是环状-C4”来检索,三聚卷曲螺旋可以使用“蛋白质对称性是环状-C3”来检索,并且二聚卷曲螺旋使用“蛋白质对称性是环状-C2”来检索,其各自与文本搜索“卷曲”或“拉链”相组合。

对于四聚卷曲螺旋来说,得到下述适合的条目:5D60,5D5Y,5AL6,4WB4,4BHV,4C5Q,4GJW,4H7R,4H8F,4BXT,4LTO,4LTP,4LTQ,4LTR,3ZDO,3RQA,3R4A,3R4H,3TSI,3K4T,3F6N,2O6N,2OVC,2O1J,2O1K,2AG3,2CCE,1YBK,1U9F,1U9G,1U9H,1USD,1USE,1UNT,1UNU,1UNV,1UNW,1UNX,1UNY,1UNZ,1UO0,1UO1,1UO2,1UO3,1UO4,1UO5,1W5I,1W5L,1FE6,1G1I,1G1J,1EZJ,1RH4,1GCL。

对于三聚卷曲螺旋来说,得到下述适合的条目:5TOH,5TOI,5K92,5KB0,5KB1,5KB2,5KKV,5EFM,2N64,5ABS,5IEA,5APP,5APQ,5APS,5APY,5APZ,5D5Z,4YPC,4YV3,4CGB,4CGC,4CJD,4R0R,4UW0,4P67,4OXM,3W8V,3W92,3W93,4I2L,4K8U,4JBZ,3VTQ,4L1R,4JDO,4J4A,4E52,3VYI,3ZMF,3VU5,3VU6,2YNY,2YNZ,2YO0,2YO1,2YO2,4G1A,4GIF,3TQ2,4DZK,4DZL,4DZN,3TE3,3R48,3SWF,3SWY,3PR7,2YKO,2YKP,2YKQ,3NTN,3PP5,3MKO,3MGN,3NWA,3NWD,3NWF,3L35,3L36,3L37,3M9B,3M9D,2X6P,3LJM,3AHA,3H7X,3H7Z,3LT6,3LT7,3GJP,2KP8,3KPE,2WPR,2WPS,2WPY,2WPZ,2WQ0,2WQ1,2WQ2,2WQ3,3HFC,3HFE,3HRN,3HRO,3H5F,3H5G,2WG5,2WG6,2W6B,2JJL,2VRS,3EFG,3DUZ,2OT5,2Z2T,2QIH,3BK6,2O7H,2R32,2JGO,2Q7C,2Q3I,2Q5U,2IBL,1ZV8,1ZVB,2FXP,1WT6,2AKF,1TGG,1SLQ,1S9Z,1PW9,1PWB,1M7L,1GZL,1KYC,1KFM,1KFN,1IJ0,1IJ1,1IJ2,1IJ3,1HQJ,1QU1,1B08,1CZQ,1CUN,1SVF,1CE0,1PIQ,1AQ5,1AVY,1HTN,1AA0,1ZIJ,1ZIM,1COI,1SWI,1GCM,1HUP。

对于二聚卷曲螺旋来说,得到下述适合的条目:5M97,5M9E,5FIY,5F4Y,5D3A,5HMO,5EYA,5IX1,5IX2,5JHF,5JVM,5JVP,5JVR,5JVS,5JVU,5JX1,5FCN,5HHE,2N9B,4ZRY,4Z6Y,4YTO,4ZI3,5AJS,5F3K,5F5R,5HUZ,5DJN,5DJO,5CHX,5CJ0,5CJ1,5CJ4,5C9N,5CFF,4WHV,3WUT,3WUU,3WUV,4ZQA,4XA3,4XA4,4PXJ,4YVC,4YVE,5BML,5AL7,4WOT,4CG4,5AMO,4WII,4WIK,4RSJ,4CFG,4R3Q,4WID,4CKG,4CKH,4NSW,4W7P,4QQ4,4OJK,4TL1,4OH9,4LPZ,4Q62,4L2W,4M3L,4CKM,4CKN,4N6J,4LTB,4LRZ,2MAJ,2MAK,4NAD,4HW0,4BT8,4BT9,4BTA,4HHD,4M8M,4J3N,4L6Q,4C1A,4C1B,4GDO,4BWK,4BWP,4BWX,4HU5,4HU6,4L9U,4G0U,4G0V,4G0W,4L3I,4G79,4GEU,4GEX,4GFA,4GFC,4BL6,4JMR,4JNH,2YMY,4HAN,3VMY,3VMZ,3VN0,4ABX,3W03,2LW9,4DZM,4ETO,3TNU,3THF,4E8U,3VMX,4E61,3VEM,3VBB,4DJG,3TV7,3STQ,3V8S,3Q8T,3U1C,3QH9,3AZD,3ONX,3OKQ,3QX3,3SJA,3SJB,3SJC,2L2L,3QFL,3QKT,2XV5,2Y3W,3Q0X,3AJW,3NCZ,3NI0,2XU6,3M91,3NMD,3LLL,3LX7,3ME9,3MEU,3MEV,3ABH,3ACO,3IAO,3HLS,2WMM,3A6M,3A7O,2WVR,3ICX,3ID5,3ID6,3HNW,3I1G,2K6S,3GHG,3G1E,2W6A,2V51,3ERR,3E1R,2VY2,2ZR2,2ZR3,3CL3,3D9V,2Z17,2JEE,3BBP,3BAS,3BAT,2QM4,2V71,2NO2,2PON,2V0O,2DQ0,2DQ3,2Q2F,2NRN,2E7S,2H9V,2FXM,2HJD,2GZD,2GZH,2FV4,2F2U,2EUL,2ESM,2ETK,2ETR,1ZXA,1YIB,1YIG,1XSX,1RFY,1U0I,1XJA,1T3J,1T6F,1R7J,1UII,1PL5,1S1C,1P9I,1R48,1URU,1OV9,1UIX,1NO4,1NYH,1MV4,1LR1,1L8D,1LJ2,1KQL,1GXK,1GXL,1GK6,1JR5,1GMJ,1JAD,1JCH,1JBG,1JTH,1JY2,1JY3,1IC2,1HCI,1HF9,1HBW,1FXK,1D7M,1QUU,1CE9,2A93,1BM9,1A93,1TMZ,2AAC,1ZII,1ZIK,1ZIL,2ARA,2ARC,1JUN,1YSA,2ZTA。然而,这个二聚结构的名单也含有反平行的卷曲螺旋,因为具有环状双重对称的二聚卷曲螺旋选择平行和反平行卷曲螺旋。所述结构的目测检查可以容易地将平行与反平行二聚卷曲螺旋区分开。

这些五聚、四聚、三聚和二聚卷曲螺旋条目中的某些也含有其他的蛋白质结构域,但是在目测检查后,那些其他的结构域可以被容易地检测并移除。

作为可替选方案,网站http://coiledcoils.chm.bris.ac.uk/ccplus/search/ periodic_table/提供了卷曲螺旋结构的周期表,从其可以检索二聚、三聚、四聚和五聚(例如2GUV)卷曲螺旋。

也设想了这些五聚、四聚、三聚和二聚卷曲螺旋结构域的氨基酸修饰。这些修饰可以是例如在所述寡聚物外部在aa(e)、aa(g)、aa(b)、aa(c)或aa(f)位置处,优选地在aa(b)、aa(c)或aa(f)位置处,最优选地在aa(f)位置中,作为非核心残基(aa(a)和aa(d))的氨基酸的取代。可能的修饰是取代为带电荷的残基以使这些寡聚物更加可溶。此外,设想了这些结构域的更短的构建物。

其他氨基酸修饰可以是例如出于使所述寡聚物稳定的目的取代核心位置处的氨基酸(aa(a)和aa(d)),即通过将不太有利的核心残基用更有利残基代替,即一般而言,如果它们不改变所述卷曲螺旋的寡聚化状态的话,可以将核心位置处根据表1具有较低卷曲螺旋倾向性的残基用具有较高卷曲螺旋倾向性的残基代替。

本文中使用的术语“氨基酸修饰”包括多肽序列中的氨基酸取代、***和/或缺失。本文中的“氨基酸取代”或“取代”意味着将母体多肽序列中特定位置处的氨基酸用另一个氨基酸代替。例如,取代R94K是指变体多肽,其中第94位处的精氨酸被赖氨酸代替。处于本文的目的,多个取代通常用斜线隔开。例如,R94K/L78V是指包含取代R94K和L78V的双重变体。当在本文中使用时,“氨基酸***”或“***”意味着在母体多肽序列中的特定位置处氨基酸的添加。例如***-94是指在在第94位处的***。当在本文中使用时,“氨基酸缺失”或“缺失”意味着在母体多肽序列中的特定位置处氨基酸的移除。例如,R94-是指在第94位处精氨酸的缺失。

含有本文中所描述的氨基酸修饰的肽或蛋白质优选地与母体(未修饰的)肽或蛋白质具有至少约80%、最优选地至少约90%、更优选地至少约95%、特别是99%的氨基酸序列同一性。优选地,所述氨基酸修饰是保守修饰。

当在本文中使用时,术语“保守修饰”或“保守的序列修饰”打算是指不显著影响或改变含有所述氨基酸序列的抗体的结合特性的氨基酸修饰。这些保守修饰包括氨基酸取代、***和缺失。可以通过本领域中已知的标准技术例如定点突变和PCR介导的突变将修饰引入到本发明的蛋白质中。保守氨基酸取代是其中将氨基酸残基用具有相似侧链的氨基酸残基代替的取代。具有相似侧链的氨基酸残基的家族在本领域中已被定义。这些家族包括具有碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、色氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸)、β分支侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。

具体的卷曲螺旋

最优选的是在实施例中描述的卷曲螺旋序列和单体构件。

连接物

所述连接物将所述两个卷曲螺旋寡聚化结构域从所述第一寡聚化结构域的最后一个核心残基(aa(a)或aa(d))连接到所述第二卷曲螺旋寡聚化结构域的第一个核心残基(aa(a)或aa(d))。

肽连接物L1和/或L2通常由具有3至50个氨基酸、优选地具有3至10个氨基酸、更优选地具有4至9个氨基酸的肽链构成。在优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由至少2个氨基酸、至少4个氨基酸、至少5个氨基酸、至少6个氨基酸、至少7个氨基酸、至少8个氨基酸、至少9个氨基酸或至少10个氨基酸构成。在更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由至少4个氨基酸、至少7个氨基酸或至少9个氨基酸构成。在甚至更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由至少4个氨基酸构成。

在另一个优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由2个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸或10个氨基酸构成。在更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由4个氨基酸、7个氨基酸或9个氨基酸构成。在甚至更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由4个氨基酸构成。

在特定实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地包含选自SEQID NO:4中所示的氨基酸序列、SEQ ID NO:12中所示的氨基酸序列、SEQ ID NO:14中所示的氨基酸序列和SEQ ID NO:15中所示的氨基酸序列的氨基酸序列,优选为SEQ ID NO:4中所示的氨基酸序列和SEQ ID NO:12中所示的氨基酸序列,更优选为SEQ ID NO:4中所示的氨基酸序列。

所述肽连接物L1和/或L2通常彼此独立地在生理条件下含有2至10个之间、优选地3至7个之间的正电荷。生理条件对应于在水性溶液中,6.5至8.5的pH,优选地约7.0至7.6的pH的条件。在优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有至少2个正电荷、至少3个正电荷、至少4个正电荷、至少5个正电荷、至少6个正电荷、至少7个正电荷、至少8个正电荷、至少9个正电荷或至少10个正电荷。在更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有至少3个正电荷、至少5个正电荷或至少7个正电荷。在甚至更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有至少3个正电荷。

在另一个优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有2个正电荷、3个正电荷、4个正电荷、5个正电荷、6个正电荷、7个正电荷、8个正电荷、9个正电荷或10个正电荷。在更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有3个正电荷、5个正电荷或7个正电荷。在甚至更优选的实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有3个正电荷。

在优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有至少一个甘氨酸残基例如RRGR(SEQ ID NO:4)或KKGK(SEQ ID NO:12)。

在优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由至少4个氨基酸构成,并且在生理条件下具有至少+3的总正电荷。

在优选实施方式中,所述肽连接物L1和肽连接物L2是一致的。

核酸衍生物

当在本文中使用时,术语核酸衍生物包括含有胞嘧啶紧随其后是鸟嘌呤(其中所述胞嘧啶核苷酸是未甲基化的)的单链DNA、来自于RNA病毒的单链RNA、来自于RNA病毒的双链RNA和模拟来自于RNA病毒的双链RNA的聚合复合物。

模拟双链RNA(dsRNA)的聚合复合物是例如polyI:polyC(pIC),其是优选的。pIC是模拟双链RNA(dsRNA)的大的合成聚合复合物。pIC的制备物在链长分布、溶解性和其他生物学性质包括毒性方面各不相同。

含有胞嘧啶紧随其后是鸟嘌呤(其中所述胞嘧啶核苷酸是未甲基化的)的单链DNA通常是CpG寡脱氧核苷酸(CpG ODN)。

作为合成分子的CpG寡脱氧核苷酸(CpG ODN)与天然的微生物DNA的差异在于代替典型的磷酸二酯骨架,它们具有完全或部分硫代磷酸酯骨架和任选地在5'末端、3'末端具有poly G尾。所述poly G尾形成分子间四联体,其产生高分子量聚集体,从而提高细胞摄取,而使用硫代磷酸酯的修饰保护所述ODN免于被体内核酸酶例如DNase降解。

已显示出许多不同的序列刺激TLR9,它们在CpG二聚体的数目和位置以及所述CpG二聚体侧翼的具体碱基序列方面各不相同。它们可以被分类为5个非正式的CpG ODN类别或门类。这些类别是基于它们的序列、二级结构和对人外周血单核细胞(PBMC)的效应,并被称为A类(D型)、B类(K型)、C类、P类和S类。

A类ODN与B类ODN的明显差异在于它刺激产生大量的I型干扰素,最重要的是IFNα,并诱导浆细胞样树突状细胞的成熟。A类ODN通过间接细胞因子信号传导,也是NK细胞的强活化剂。另一方面,B类ODN是人单核细胞和B细胞成熟的强刺激剂。尽管它们也刺激浆细胞样树突状细胞的成熟,但它们的这种作用的程度低于A类ODN。它们也刺激非常少量的IFNα。

A类

ODN 2216是一种A类CpG ODN,并且是人TLR9选择的配体。它是20mer,具有序列5’-ggGGGACGA:TCGTCgggggg-3’(SEQ ID NO:43)。用大写字母示出的碱基是磷酸二酯,用小写字母示出的是抗核酸酶的硫代磷酸酯。回文序列加下划线。ODN 2336是另一种A类CpG ODN,对人TLR9具有偏好性。它是21mer,具有序列5’-gggGACGAC:GTCGTGgggggg-3’(SEQ ID NO:44)。

B类

ODN 1826是一种对鼠类TLR9特异的B类CpG ODN。它是20mer,具有序列5’-tccatgacgttcctgacgtt-3’(SEQ ID NO:13)。所有碱基都是抗核酸酶的硫代磷酸酯。ODN2006是一种B类CpG ODN,并且是人TLR9选择的配体。它是24mer,具有序列5’-tcgtcgttttgtcgttttgtcgtt-3’(SEQ ID NO:42)。ODN BW006是另一种B类CpG ODN,并含有两份人中的最优基序GTCGTT。它是23mer,具有序列5’-tcgacgttcgtcgttcgtcgttc-3’(SEQID NO:45)。另一种B类CpG是ODN D-SL01。它是多样的脊椎动物物种即人、小鼠、大鼠、兔、猪和狗中的TLR9激动剂,并具有序列5’-tcgcgacgttcgcccgacgttcggta-3’(SEQ ID NO:49)(26mer)。

C类

ODN 2395是一种对人和小鼠TLR9特异的C类CpG ODN。作为C类CpG ODN,它含有完全硫代磷酸酯骨架和含有CpG的回文基序。C类CpG ODN诱导IFN-α从pDC的强烈生产和B细胞刺激。它是22mer,具有序列5’-tcgtcgttttcggcgc:gcgccg-3’(SEQ ID NO:46)。所有碱基都是硫代磷酸酯,并且回文序列加下划线。ODN M362是另一种对人和小鼠TLR9特异的C类CpGODN。它是25mer,具有序列5’-tcgtcgtcgttc:gaacgacgttgat-3’(SEQ ID NO:47)。另一种C类CpG ODN是ODN D-SL03。它是多样的脊椎动物物种即人、小鼠、大鼠、兔、猪和狗中的TLR9激动剂。ODN D-SL03由双份茎环,硫代磷酸酯骨架和两个回文序列构成,并且在每个环中具有AACGTT基序和TTCGAA基序。ODN D-SL03是IFN-α的强诱导物,这明显是由于所述回文序列的存在。已显示出D-SL03强力活化人B细胞、NK细胞和单核细胞以及从多样的脊椎动物物种即小鼠、大鼠、兔、猪和狗获得的PBMC/脾细胞。ODN D-SL03在患有建立的乳腺癌的小鼠中证实了抗肿瘤活性。它是29mer,具有序列5’-tcgcgaacgttcgccgcgttcgaac gcgg-3’(SEQ IDNO:48)。

在优选实施方式中,所述核酸衍生物是CpG寡脱氧核苷酸(CpG ODN)。在优选实施方式中,所述核酸衍生物是CpG寡脱氧核苷酸(CpG ODN),其中CpG基序中的至少一个核苷酸、优选地至少一个胞嘧啶核苷酸是未甲基化的。在优选实施方式中,所述核酸衍生物是CpG寡脱氧核苷酸(CpG ODN),其中CpG基序中1至10个之间、优选地2至8个之间、更优选地2至5个之间的胞嘧啶核苷酸是未甲基化的。

在甚至更优选实施方式中,所述核酸衍生物是选自A类CpG ODN、B类CpG ODN和C类CpG ODN的CpG寡脱氧核苷酸(CpG ODN)。在特别优选的实施方式中,所述核酸衍生物是选自SEQ ID NO:13、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48和SEQ ID NO:49中所示的核苷酸序列的CpG寡脱氧核苷酸(CpG ODN),特别地,所述核酸衍生物是选自SEQ ID NO:13中所示的核苷酸序列和SEQ ID NO:39中所示的核苷酸序列的CpG寡脱氧核苷酸(CpG ODN)。

在本发明的组合物中,所述核酸衍生物不被共价结合到所述SAPN,即所述核酸衍生物通过离子相互作用结合到所述SAPN。通常,所述核酸衍生物通过离子相互作用结合到所述肽连接物L1和/或L2。

自组装蛋白质纳米粒子:LCM单元

SAPN从任选地与式(II)的单体构件共同组装的式(I)的单体构件形成。如果这些构件组装,它们将形成所谓的“LCM单元”。将要组装在这种LCM单元中的单体构件的数目由最小公倍数(LCM)确定。因此,如果例如所述单体构件的寡聚化结构域形成五聚体(ND1)5(m=5)和三聚体(ND2)3(n=3),则15个单体将形成LCM单元。如果所述连接物区段L1和L2具有适合的长度,则这个LCM单元可能以球状蛋白质纳米粒子的形式组装。SAPN可以由仅仅一个或超过一个LCM单元的组装形成(表2)。这些SAPN代表拓扑学上相近的结构。

规则多面体

存在着5种规则多面体,即四面体、立方体、八面体、十二面体和二十面体。它们具有不同的内部旋转对称元件。四面体具有2次轴和两个3次轴,立方体和八面体具有2次、3次和4次旋转对称轴,并且十二面体和二十面体具有2次、3次和5次旋转对称轴。在立方体中,这些轴的空间取向与在八面体中完全相同,并且在十二面体和二十面体中,这些轴相对于彼此的空间取向也完全相同。因此,出于本发明的SAPN的目的,十二面体和二十面体可以被当作是一致的。十二面体/二十面体由60个一致的三维构件构造而成(表1)。这些构件是所述多面体的不对称单位(AU)。它们是角锥体,并且角锥体的边对应于旋转对称轴之一,因此这些AU将在它们的边处带有2次、3次和5次对称元。如果这些对称元从蛋白质寡聚化结构域产生,则这些AU由如上所示的单体构件构造。将两个寡聚化结构域ND1和ND2或ND3和ND4沿着所述AU的两个对称轴对齐就已足够。如果这两个寡聚化结构域形成稳定的寡聚物,则沿着第三对称轴的对称界面将自动产生,并且可以通过优化沿着该界面的相互作用例如疏水、亲水或离子相互作用或共价键例如二硫桥而使它稳定。

在优选实施方式中,所述寡聚化结构域ND1、ND2、ND3和ND4中的至少一者,优选地式(I)或(II)的ND1和/或ND3或ND2和/或ND4,包含二聚、三聚、四聚和/或五聚结构域,更优选地二聚、四聚和/或五聚结构域,甚至更优选地二聚和/或五聚结构域。

在更优选实施方式中,式(I)或(II)的寡聚化结构域ND1、ND2、ND3和/或ND4之一,更优选地ND1和/或ND3或ND2和/或ND4,包含选自4PN8、4PND、4WBA、3V2N、3V2P、3V2Q、3V2R、4EEB、4EED、3MIW、1MZ9、1FBM、1VDF、2GUV、2HYN、1ZLL和1T8Z的五聚卷曲螺旋,或选自含有氨基酸修饰和/或在任一或两个末端处缩短的4PN8、4PND、4WBA、3V2N、3V2P、3V2Q、3V2R、4EEB、4EED、3MIW、1MZ9、1FBM、1VDF、2GUV、2HYN、1ZLL和1T8Z的五聚卷曲螺旋,其中每个卷曲螺旋按照RCSB蛋白质数据库(RCSB PDB)的pdb编目号注明。甚至更优选地,ND1是选自色氨酸拉链五聚化结构域(pdb条目:1T8Z)或含有氨基酸修饰和/或在任一或两个末端处缩短的色氨酸拉链五聚化结构域(pdb条目:1T8Z)的五聚卷曲螺旋,特别是包含SEQ ID NO:3或SEQ IDNO:25的五聚卷曲螺旋或具有氨基酸修饰和/或在任一或两个末端处缩短的包含SEQ IDNO:3或SEQ ID NO:25的五聚卷曲螺旋。

在另一个更优选实施方式中,式(I)或(II)的寡聚化结构域ND1、ND2、ND3和ND4中的至少一者,更优选地ND1和/或ND3或ND2和/或ND4,包含选自四聚卷曲螺旋5D60、5D5Y、5AL6、4WB4、4BHV、4C5Q、4GJW、4H7R、4H8F、4BXT、4LTO、4LTP、4LTQ、4LTR、3ZDO、3RQA、3R4A、3R4H、3TSI、3K4T、3F6N、2O6N、2OVC、2O1J、2O1K、2AG3、2CCE、1YBK、1U9F、1U9G、1U9H、1USD、1USE、1UNT、1UNU、1UNV、1UNW、1UNX、1UNY、1UNZ、1UO0、1UO1、1UO2、1UO3、1UO4、1UO5、1W5I、1W5L、1FE6、1G1I、1G1J、1EZJ、1RH4、1GCL的四聚卷曲螺旋,或选自含有氨基酸修饰和/或在任一或两个末端处缩短的5D60、5D5Y、5AL6、4WB4、4BHV、4C5Q、4GJW、4H7R、4H8F、4BXT、4LTO、4LTP、4LTQ、4LTR、3ZDO、3RQA、3R4A、3R4H、3TSI、3K4T、3F6N、2O6N、2OVC、2O1J、2O1K、2AG3、2CCE、1YBK、1U9F、1U9G、1U9H、1USD、1USE、1UNT、1UNU、1UNV、1UNW、1UNX、1UNY、1UNZ、1UO0、1UO1、1UO2、1UO3、1UO4、1UO5、1W5I、1W5L、1FE6、1G1I、1G1J、1EZJ、1RH4、1GCL的四聚卷曲螺旋,其中每个卷曲螺旋按照RCSB蛋白质数据库(RCSB PDB)的pdb编目号注明。

在最优选实施方式中,所述四聚卷曲螺旋来自于四臂(tetrabrachion)(pdb条目编码1FE6),或者所述四聚卷曲螺旋来自于含有氨基酸修饰和/或在任一或两个末端处缩短的四臂(tetrabrachion)(pdb条目编码1FE6),其中每个SHB按照RCSB蛋白质数据库(RCSBPDB)的pdb编目号注明。

在另一个更优选实施方式中,所述式(I)或(II)的寡聚化结构域ND1、ND2、ND3和ND4之一,更优选地ND1和/或ND3或ND2和/或ND4包含选自三聚卷曲螺旋5TOH、5TOI、5K92、5KB0、5KB1、5KB2、5KKV、5EFM、2N64、5ABS、5IEA、5APP、5APQ、5APS、5APY、5APZ、5D5Z、4YPC、4YV3、4CGB、4CGC、4CJD、4R0R、4UW0、4P67、4OXM、3W8V、3W92、3W93、4I2L、4K8U、4JBZ、3VTQ、4L1R、4JDO、4J4A、4E52、3VYI、3ZMF、3VU5、3VU6、2YNY、2YNZ、2YO0、2YO1、2YO2、4G1A、4GIF、3TQ2、4DZK、4DZL、4DZN、3TE3、3R48、3SWF、3SWY、3PR7、2YKO、2YKP、2YKQ、3NTN、3PP5、3MKO、3MGN、3NWA、3NWD、3NWF、3L35、3L36、3L37、3M9B、3M9D、2X6P、3LJM、3AHA、3H7X、3H7Z、3LT6、3LT7、3GJP、2KP8、3KPE、2WPR、2WPS、2WPY、2WPZ、2WQ0、2WQ1、2WQ2、2WQ3、3HFC、3HFE、3HRN、3HRO、3H5F、3H5G、2WG5、2WG6、2W6B、2JJL、2VRS、3EFG、3DUZ、2OT5、2Z2T、2QIH、3BK6、2O7H、2R32、2JGO、2Q7C、2Q3I、2Q5U、2IBL、1ZV8、1ZVB、2FXP、1WT6、2AKF、1TGG、1SLQ、1S9Z、1PW9、1PWB、1M7L、1GZL、1KYC、1KFM、1KFN、1IJ0、1IJ1、1IJ2、1IJ3、1HQJ、1QU1、1B08、1CZQ、1CUN、1SVF、1CE0、1PIQ、1AQ5、1AVY、1HTN、1AA0、1ZIJ、1ZIM、1COI、1SWI、1GCM、1HUP的三聚卷曲螺旋,或选自氨基酸修饰和/或在任一或两个末端处缩短的5TOH、5TOI、5K92、5KB0、5KB1、5KB2、5KKV、5EFM、2N64、5ABS、5IEA、5APP、5APQ、5APS、5APY、5APZ、5D5Z、4YPC、4YV3、4CGB、4CGC、4CJD、4R0R、4UW0、4P67、4OXM、3W8V、3W92、3W93、4I2L、4K8U、4JBZ、3VTQ、4L1R、4JDO、4J4A、4E52、3VYI、3ZMF、3VU5、3VU6、2YNY、2YNZ、2YO0、2YO1、2YO2、4G1A、4GIF、3TQ2、4DZK、4DZL、4DZN、3TE3、3R48、3SWF、3SWY、3PR7、2YKO、2YKP、2YKQ、3NTN、3PP5、3MKO、3MGN、3NWA、3NWD、3NWF、3L35、3L36、3L37、3M9B、3M9D、2X6P、3LJM、3AHA、3H7X、3H7Z、3LT6、3LT7、3GJP、2KP8、3KPE、2WPR、2WPS、2WPY、2WPZ、2WQ0、2WQ1、2WQ2、2WQ3、3HFC、3HFE、3HRN、3HRO、3H5F、3H5G、2WG5、2WG6、2W6B、2JJL、2VRS、3EFG、3DUZ、2OT5、2Z2T、2QIH、3BK6、2O7H、2R32、2JGO、2Q7C、2Q3I、2Q5U、2IBL、1ZV8、1ZVB、2FXP、1WT6、2AKF、1TGG、1SLQ、1S9Z、1PW9、1PWB、1M7L、1GZL、1KYC、1KFM、1KFN、1IJ0、1IJ1、1IJ2、1IJ3、1HQJ、1QU1、1B08、1CZQ、1CUN、1SVF、1CE0、1PIQ、1AQ5、1AVY、1HTN、1AA0、1ZIJ、1ZIM、1COI、1SWI、1GCM、1HUP的三聚卷曲螺旋,其中每个卷曲螺旋按照RCSB蛋白质数据库(RCSB PDB)的pdb编目号注明。

在另一个更优选实施方式中,所述式(I)或(II)的寡聚化结构域ND1、ND2、ND3和ND4之一,更优选地ND1和/或ND3或ND2和/或ND4,包含选自二聚卷曲螺旋5M97、5M9E、5FIY、5F4Y、5D3A、5HMO、5EYA、5IX1、5IX2、5JHF、5JVM、5JVP、5JVR、5JVS、5JVU、5JX1、5FCN、5HHE、2N9B、4ZRY、4Z6Y、4YTO、4ZI3、5AJS、5F3K、5F5R、5HUZ、5DJN、5DJO、5CHX、5CJ0、5CJ1、5CJ4、5C9N、5CFF、4WHV、3WUT、3WUU、3WUV、4ZQA、4XA3、4XA4、4PXJ、4YVC、4YVE、5BML、5AL7、4WOT、4CG4、5AMO、4WII、4WIK、4RSJ、4CFG、4R3Q、4WID、4CKG、4CKH、4NSW、4W7P、4QQ4、4OJK、4TL1、4OH9、4LPZ、4Q62、4L2W、4M3L、4CKM、4CKN、4N6J、4LTB、4LRZ、2MAJ、2MAK、4NAD、4HW0、4BT8、4BT9、4BTA、4HHD、4M8M、4J3N、4L6Q、4C1A、4C1B、4GDO、4BWK、4BWP、4BWX、4HU5、4HU6、4L9U、4G0U、4G0V、4G0W、4L3I、4G79、4GEU、4GEX、4GFA、4GFC、4BL6、4JMR、4JNH、2YMY、4HAN、3VMY、3VMZ、3VN0、4ABX、3W03、2LW9、4DZM、4ETO、3TNU、3THF、4E8U、3VMX、4E61、3VEM、3VBB、4DJG、3TV7、3STQ、3V8S、3Q8T、3U1C、3QH9、3AZD、3ONX、3OKQ、3QX3、3SJA、3SJB、3SJC、2L2L、3QFL、3QKT、2XV5、2Y3W、3Q0X、3AJW、3NCZ、3NI0、2XU6、3M91、3NMD、3LLL、3LX7、3ME9、3MEU、3MEV、3ABH、3ACO、3IAO、3HLS、2WMM、3A6M、3A7O、2WVR、3ICX、3ID5、3ID6、3HNW、3I1G、2K6S、3GHG、3G1E、2W6A、2V51、3ERR、3E1R、2VY2、2ZR2、2ZR3、3CL3、3D9V、2Z17、2JEE、3BBP、3BAS、3BAT、2QM4、2V71、2NO2、2PON、2V0O、2DQ0、2DQ3、2Q2F、2NRN、2E7S、2H9V、2FXM、2HJD、2GZD、2GZH、2FV4、2F2U、2EUL、2ESM、2ETK、2ETR、1ZXA、1YIB、1YIG、1XSX、1RFY、1U0I、1XJA、1T3J、1T6F、1R7J、1UII、1PL5、1S1C、1P9I、1R48、1URU、1OV9、1UIX、1NO4、1NYH、1MV4、1LR1、1L8D、1LJ2、1KQL、1GXK、1GXL、1GK6、1JR5、1GMJ、1JAD、1JCH、1JBG、1JTH、1JY2、1JY3、1IC2、1HCI、1HF9、1HBW、1FXK、1D7M、1QUU、1CE9、2A93、1BM9、1A93、1TMZ、2AAC、1ZII、1ZIK、1ZIL、2ARA、2ARC、1JUN、1YSA、2ZTA的二聚卷曲螺旋,或选自氨基酸修饰和/或在任一或两个末端处缩短的5M97、5M9E、5FIY、5F4Y、5D3A、5HMO、5EYA、5IX1、5IX2、5JHF、5JVM、5JVP、5JVR、5JVS、5JVU、5JX1、5FCN、5HHE、2N9B、4ZRY、4Z6Y、4YTO、4ZI3、5AJS、5F3K、5F5R、5HUZ、5DJN、5DJO、5CHX、5CJ0、5CJ1、5CJ4、5C9N、5CFF、4WHV、3WUT、3WUU、3WUV、4ZQA、4XA3、4XA4、4PXJ、4YVC、4YVE、5BML、5AL7、4WOT、4CG4、5AMO、4WII、4WIK、4RSJ、4CFG、4R3Q、4WID、4CKG、4CKH、4NSW、4W7P、4QQ4、4OJK、4TL1、4OH9、4LPZ、4Q62、4L2W、4M3L、4CKM、4CKN、4N6J、4LTB、4LRZ、2MAJ、2MAK、4NAD、4HW0、4BT8、4BT9、4BTA、4HHD、4M8M、4J3N、4L6Q、4C1A、4C1B、4GDO、4BWK、4BWP、4BWX、4HU5、4HU6、4L9U、4G0U、4G0V、4G0W、4L3I、4G79、4GEU、4GEX、4GFA、4GFC、4BL6、4JMR、4JNH、2YMY、4HAN、3VMY、3VMZ、3VN0、4ABX、3W03、2LW9、4DZM、4ETO、3TNU、3THF、4E8U、3VMX、4E61、3VEM、3VBB、4DJG、3TV7、3STQ、3V8S、3Q8T、3U1C、3QH9、3AZD、3ONX、3OKQ、3QX3、3SJA、3SJB、3SJC、2L2L、3QFL、3QKT、2XV5、2Y3W、3Q0X、3AJW、3NCZ、3NI0、2XU6、3M91、3NMD、3LLL、3LX7、3ME9、3MEU、3MEV、3ABH、3ACO、3IAO、3HLS、2WMM、3A6M、3A7O、2WVR、3ICX、3ID5、3ID6、3HNW、3I1G、2K6S、3GHG、3G1E、2W6A、2V51、3ERR、3E1R、2VY2、2ZR2、2ZR3、3CL3、3D9V、2Z17、2JEE、3BBP、3BAS、3BAT、2QM4、2V71、2NO2、2PON、2V0O、2DQ0、2DQ3、2Q2F、2NRN、2E7S、2H9V、2FXM、2HJD、2GZD、2GZH、2FV4、2F2U、2EUL、2ESM、2ETK、2ETR、1ZXA、1YIB、1YIG、1XSX、1RFY、1U0I、1XJA、1T3J、1T6F、1R7J、1UII、1PL5、1S1C、1P9I、1R48、1URU、1OV9、1UIX、1NO4、1NYH、1MV4、1LR1、1L8D、1LJ2、1KQL、1GXK、1GXL、1GK6、1JR5、1GMJ、1JAD、1JCH、1JBG、1JTH、1JY2、1JY3、1IC2、1HCI、1HF9、1HBW、1FXK、1D7M、1QUU、1CE9、2A93、1BM9、1A93、1TMZ、2AAC、1ZII、1ZIK、1ZIL、2ARA、2ARC、1JUN、1YSA、2ZTA的二聚卷曲螺旋,其中每个卷曲螺旋按照RCSB蛋白质数据库(RCSB PDB)的pdb编目号注明。

在优选实施方式中,X1选自包含His标签的氨基酸序列、如SEQ ID NO:29中所示包含His标签的氨基酸序列、包含His标签和疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:30中所示包含His标签和疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:2中所示的氨基酸序列、如SEQ ID NO:29中所示的氨基酸序列、如SEQ ID NO:24中所示的氨基酸序列,以及如SEQ ID NO:2、SEQ ID NO:30、SEQ ID NO:29或SEQ ID NO:24中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。更优选地,X1选自如SEQ ID NO:2中所示的氨基酸序列、如SEQ ID NO:29中所示的氨基酸序列、如SEQ ID NO:24中所示的氨基酸序列,以及如SEQ IDNO:2、SEQ ID NO:29或SEQ ID NO:24中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,X2选自包含His标签的氨基酸序列、如SEQ ID NO:29中所示包含His标签的氨基酸序列、包含His标签和疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:30中所示包含His标签和疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:2中所示的氨基酸序列、如SEQ ID NO:29中所示的氨基酸序列、如SEQ ID NO:24中所示的氨基酸序列,以及如SEQ ID NO:2、SEQ ID NO:30、SEQ ID NO:29或SEQ ID NO:24中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。更优选地,X2选自如SEQ ID NO:2中所示的氨基酸序列、如SEQ ID NO:29中所示的氨基酸序列、如SEQ ID NO:24中所示的氨基酸序列,以及如SEQ IDNO:2、SEQ ID NO:29或SEQ ID NO:24中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,Y1选自包含疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:27中所示的氨基酸序列,以及如SEQ ID NO:27中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,Y2是包含鞭毛蛋白的D0和D1结构域的氨基酸序列、如SEQ IDNO:28或SEQ ID NO:6中所示的氨基酸序列,或如SEQ ID NO:28或SEQ ID NO:6中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述肽连接物L1由至少3个氨基酸构成,并且所述式(I)的构件的至少一个、优选地至少两个、更优选地至少三个、甚至更优选地所有的X1、ND1、ND2和Y1选自如SEQ ID NO:2或SEQ ID NO:24中所示的X1,如SEQ ID NO:3或SEQ ID NO:25中所示的ND1,如SEQ ID NO:5或SEQ ID NO:26中所示的ND2,和如SEQ ID NO:6或SEQ ID NO:27中所示的Y1,或者所述肽连接物L1由至少3个氨基酸构成,并且所述式(I)的构件的至少一个、优选地至少两个、更优选地至少三个、甚至更优选地所有的X1、ND1、ND2和Y1选自如SEQ IDNO:2或SEQ ID NO:24中所示的X1,如SEQ ID NO:3或SEQ ID NO:25中所示的ND1,如SEQ IDNO:5或SEQ ID NO:26中所示的ND2,和如SEQ ID NO:6或SEQ ID NO:27中所示的Y1,其中SEQID NO:2、SEQ ID NO:24、SEQ ID NO:3、SEQ ID NO:25、SEQ ID NO:5、SEQ ID NO:26、SEQ IDNO:6或SEQ ID NO:27中的至少一者含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述肽连接物L2由至少3个氨基酸构成,并且所述式(I)的构件的至少一个、优选地至少两个、更优选地至少三个、甚至更优选地所有的X2、ND3、ND4和Y2选自如SEQ ID NO:24中所示的X2,如SEQ ID NO:25中所示的ND3,如SEQ ID NO:26中所示的ND4,和如SEQ ID NO:28中所示的Y2,或者其中所述肽连接物L2由至少3个氨基酸构成,并且所述式(I)的构件的至少一个、优选地至少两个、更优选地至少三个、甚至更优选地所有的X2、ND3、ND4和Y2选自如SEQ ID NO:24中所示的X2,如SEQ ID NO:25中所示的ND3,如SEQ IDNO:26中所示的ND4,和如SEQ ID NO:28中所示的Y2,其中SEQ ID NO:24、SEQ ID NO:25、SEQID NO:26或SEQ ID NO:28中的至少一者含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述式(I)的构件包含选自如SEQ ID NO:1中所示的氨基酸序列、如SEQ ID NO:16中所示的氨基酸序列、如SEQ ID NO:17中所示的氨基酸序列、如SEQ IDNO:18中所示的氨基酸序列、如SEQ ID NO:19中所示的氨基酸序列、如SEQ ID NO:22中所示的氨基酸序列,和如SEQ ID NO:34中所示的氨基酸序列的氨基酸连续链,或者所述式(I)的构件包含选自如SEQ ID NO:1中所示的氨基酸序列、如SEQ ID NO:16中所示的氨基酸序列、如SEQ ID NO:17中所示的氨基酸序列、如SEQ ID NO:18中所示的氨基酸序列、如SEQ IDNO:19中所示的氨基酸序列、如SEQ ID NO:22中所示的氨基酸序列和如SEQ ID NO:34中所示的氨基酸序列的氨基酸连续链,SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:22或SEQ ID NO:34中的至少一者含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述式(II)的构件包含如SEQ ID NO:23中所示的氨基酸的连续链,或者所述式(II)的构件包含如SEQ ID NO:23中所示的氨基酸的连续链,其中如SEQID NO:23中所示的氨基酸含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述由多个式(I)的构件、多个式(II)的构件或多个共同组装的式(I)和式(II)的构件构成的SAPN的蛋白质链、更优选地由多个式(I)的构件构成的SAPN的蛋白质链与所述核酸衍生物的摩尔比,为约1比约0.4至0.8,优选为约1比约0.6。

在优选实施方式中,所述组合物包含由与多个式(II)的构件共同组装的多个式(I)的构件构成的SAPN。

在优选实施方式中,所述包含多个式(I)的构件和多个式(II)的构件的共同组装的SAPN,更优选地所述包含多个式(I)的构件和多个式(II)的构件的包含本文中所描述的鞭毛蛋白的共同组装的SAPN,具有约48至约59个所述包含式(I)的构件的连续链与约12至约1个所述包含式(II)的构件的连续链的共同组装比,更优选地约55至约58个所述包含式(I)的构件的连续链与约5至约2个所述包含式(II)的构件的连续链给共同组装比,例如约55个所述包含式(I)的构件的连续链与约5个所述包含式(II)的构件的连续链的共同组装比、约56个所述包含式(I)的构件的连续链与约4个所述包含式(II)的构件的连续链的共同组装比、约57个所述包含式(I)的构件的连续链与约3个所述包含式(II)的构件的连续链的共同组装比或约58个所述包含式(I)的构件的连续链与约2个所述包含式(II)的构件的连续链的共同组装比,甚至更优选地约58个所述包含式(I)的构件的连续链与约2个所述包含式(II)的构件的连续链的共同组装比。

组装成具有规则多面体对称性的自组装蛋白纳米粒子(SAPN)

为了产生具有规则几何形状(十二面体、二十面体、八面体、立方体和四面体)的自组装蛋白纳米粒子(SAPN),需要超过一个LCM单元。例如为了从含有三聚和五聚寡聚化结构域的单体形成二十面体,需要4个LCM单元,各自由15个单体构件构成,即所述具有规则几何形状的蛋白质纳米粒子将由60个单体构件构成。需要的所述两种寡聚化结构域的寡聚化状态的组合和形成相应多面体的LCM单元的数目,列于下表2中。

表2:在规则多面体形成中寡聚化状态的可能组合

所述LCM单元是否将进一步组装以形成由超过一个LCM单元构成的规则多面体,取决于两个寡聚化结构域ND1和ND2和两个寡聚化结构域ND3和ND4分别相对于彼此的几何对准,特别是两个寡聚化结构域的旋转对称轴之间的角度。这主要由下述因素控制:i)纳米粒子中相邻结构域之间的相互作用,ii)连接物区段L1和L2的长度,iii)各个寡聚化结构域的形状。与规则多面体中的排列相比,在LCM单元中这个角度更大。此外,与规则多面体相反,在单体构件中这个角度不相同。

如果所述两个寡聚化结构域之间的角度足够小(甚至小于具有二十面体对称的规则多面体中的角度),则大量(几百个)蛋白质链可以组装成蛋白质纳米粒子。具有三聚体-五聚体结构体系的SAPN的生物物理和数学分析最近已发表(Indelicato,G.等,Biophys J2016,110(3):646-660)。

优选地,将在所述SAPN上的环构象中展示的抗原选自:(a)适合于诱导针对癌细胞的免疫应答的蛋白质或肽;(b)适合于诱导针对传染病的免疫应答的蛋白质或肽;(c)适合于诱导针对过敏原的免疫应答的蛋白质或肽;(d)适合于诱导用于治疗人疾病的免疫应答的蛋白质或肽。

包含这些蛋白质或肽的SAPN可能适合于在人中或在家畜和宠物中诱导免疫应答。

另一方面,本发明涉及如上所定义的式(I)或(II)的单体构件。

另一方面,本发明涉及一种适合作为疫苗的包含本文中所描述的蛋白质纳米粒子的组合物,例如用作疫苗的包含本文中所描述的蛋白质纳米粒子的组合物。优选的疫苗组合物包含在水性缓冲溶液中的所述蛋白质纳米粒子,并且还可以包含例如源自于糖的赋形剂(例如甘油、海藻糖、蔗糖等)或源自于氨基酸的赋形剂(例如精氨酸、脯氨酸、谷氨酸等)或阴离子型、阳离子型、非离子型或两性离子型去污剂(例如胆酸盐、脱氧胆酸盐、吐温等)或用于调节所述溶液的离子强度的任何种类的盐(例如NaCl、MgCl2等)。

另一方面,本发明涉及一种疫苗接种人或非人动物的方法,所述方法包括向需要这种疫苗接种的对象给药有效量的上文中所描述的组合物。所述需要这种疫苗接种的对象通常是人或非人动物。

还提供了一种如上文中所描述的组合物,其用于疫苗接种人或非人动物的方法中,所述方法包括向需要这种疫苗接种的人或非人动物给药有效量的所述组合物。

还提供了如上文中所描述的组合物的用途,其用于制造用于疫苗接种人或非人动物的药物。

还提供了如上文中所描述的组合物的用途,其用于疫苗接种人或非人动物。

术语“个体”、“对象”或“患者”在本文中可互换使用。在某些实施方式中,所述对象是哺乳动物。哺乳动物包括但不限于灵长类动物(包括人和非人灵长类动物)。在优选实施方式中,所述对象是人。另一方面,本发明涉及一种生产本文中所描述的SAPN的方法,所述方法包括:i)向包含核酸衍生物的缓冲液添加SAPN,和ii)使用常规的重折叠流程在所述核酸衍生物存在下重折叠所述SAPN。

CpG-SAPN(包封CpG的自组装蛋白质纳米粒子)的设计

本发明的CpG-SAPN的具体实例是下述构建物“DEDDLI-RR”,其对应于具有下述序列的式(I):

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:1)。

这是一种由下述分结构构成的构建物:

X1:MGDKHHHHHHHHHHKDGSDKGS(SEQ ID NO:2)

ND1:WEEWNARWDEWENDWNDWREDWQAWRDDWARWRA TW(SEQ ID NO:3)

L1:RRGR(SEQ ID NO:4)

ND2:LLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQ NAELERRLEEL(SEQ ID NO:5)

Y1:ARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRI NSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:6)

为了易于纯化,DEDDLI-RR始于如式(I)中所定义的序列X1:

MGDKHHHHHHHHHHKDGSDKGS(SEQ ID NO:2)

其含有用于镍亲和纯化的His标签,并在DNA水平上含有用于进一步亚克隆的限制性位点(NcoI和BamHI)。

对于ND1来说,选择五聚化结构域(m=5)。所述具体的五聚卷曲螺旋是pdb条目号1T8Z的色氨酸拉链五聚化结构域的新的修饰(Liu,J.等,Proc Natl Acad Sci USA 2004,101(46):16156-16161)。

原始的色氨酸拉链五聚化结构域具有下述序列

SSNAKWDQWSSDWQTWNAKWDQWSNDWNAWRSDWQAWKDDWARWNQRWDNWAT(SEQ ID NO:7)。

所述用于DEDDLI-RR的五聚化结构域的修饰的卷曲螺旋序列始于第13位,结束于第49位,并在C-端末端处含有序列变异(RATW(SEQ ID NO:36)代替NQRW(SEQ ID NO:37)),并且出于溶解性目的,在所述卷曲螺旋的非核心位置处含有几个电荷修饰,但保持与原始序列中相同的核心位置处色氨酸残基的七肽重复序列模式(SEQ ID NO:8)。此外,将两个赖氨酸残基改变成精氨酸残基,以避免半抗原分子偶联到所述五聚卷曲螺旋。aa(a)和aa(d)位置处的卷曲螺旋核心残基用粗体指示并加下划线:

然后将这个序列用具有序列RRGR(SEQ ID NO:4)的短连接物L1延长,以与卷曲螺旋序列ND2相连。L1在所述纳米粒子的两个卷曲螺旋部分之间含有柔性残基G(甘氨酸)。它含有三个带正电荷的精氨酸氨基酸,提供与带负电荷的包封的核酸的相互作用。

L1后面跟随具有下述序列的第二卷曲螺旋结构域ND2:

它是重新设计的卷曲螺旋,旨在形成三个核心aa(a)位置被天冬酰胺残基占据的二聚卷曲螺旋,这种结构有利于二聚卷曲螺旋形成。aa(a)和aa(d)位置处的卷曲螺旋核心残基用粗体指示并加下划线。它含有泛DR结合性CD4表位串ELRRLLQLIRHENRMVLQFVRALSMQNA(SEQ ID NO:7),其本身含有混杂的CD4/CD8表位IRHENRMVL(SEQ ID NO:8)(Parida R.等,Vaccine 2007,25:7530–7539),所述表位对应于具有序列ID BAA01449.1的甲型流感病毒的基质蛋白1的第173位至第181位残基。

Y1区段具有下述序列:

ARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:6)。

它含有带有XmaI限制性位点的序列ARG,后面紧跟鞭毛蛋白的片段,并且由鼠伤寒沙门氏菌鞭毛蛋白的D0和D1结构域构成(与专利US 8,420,102中相同),其被进一步修饰,使得未表面暴露的赖氨酸侧链被突变成精氨酸,而在具有序列DGDKGDDK(SEQ ID NO:9)的连接鞭毛蛋白的将D0和D1结构域连接的环中内置了4个赖氨酸残基,用于共价偶联半抗原分子例如烟碱、***、咖啡因等的目的。这个环是表面暴露的。

以下序列对应于鞭毛生物合成蛋白FliC的P06175.2的第1位至第180位残基,其中第20、42、59、136和161位残基从赖氨酸突变成精氨酸,而第172位残基从苏氨酸突变成谷氨酰胺,以在DNA水平上***MfeI限制性位点:

MAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYK(SEQ ID NO:10)。

以下序列对应于P06175.2的第403位至第493位残基,其中第409位残基从赖氨酸突变成精氨酸。它还含有突变T419A、T446S和S447E:

TENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:11)。

DEDDLI-RR单体的模型以其单体和二十面体形式示出在图2中,假设T=1二十面体对称。DEDDLI-RR的EM照片示出在图7中。

实施例

下面的实施例可用于进一步解释本发明,但绝不限制本发明的范围。

实施例1–DEDDLI-RR的分子克隆

编码所述纳米粒子构建物的DNA使用标准的分子生物学程序制备。含有编码以下蛋白质序列DEDDLI-RR的DNA的质粒通过克隆到基础SAPN表达构建物pPEP-T的NcoI/EcoRI限制性位点中来构建(图3):

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:12)。疫苗免疫原通过使用烟碱的活化形式NHS-烟碱将表位烟碱共价附连到载体的赖氨酸残基来产生。

这种具有X1–ND1–L1–ND2–Y1体系结构的构建物的序列在上文中详细描述。简短来说,这个构建物由通过具有序列RRGR(SEQ ID NO:4)的连接物L1连接到所述重新设计的二聚卷曲螺旋(ND2)的五聚卷曲螺旋色氨酸拉链(ND1)构成,其在所述五聚卷曲螺旋的最后一个核心位置与所述二聚卷曲螺旋的第一个核心位置之间含有3个正电荷。N-端处的序列X1含有His标签和3个半抗原/烟碱结合位点(赖氨酸),而序列Y1含有鼠伤寒沙门氏菌鞭毛蛋白的片段,并由鞭毛蛋白的修饰的D0和D1结构域构成。

实施例2-表达

将所述质粒转化到大肠杆菌Tuner(DE3)细胞中,将其在抗生素氨苄青霉素存在下生长在Hyper Broth中(图4A)。所述预培养物在28℃下生长。第二天,将1:500稀释的预培养物接种到1L表达培养基中,并将细胞在5L Erlenmeyer摇瓶中在37℃振摇生长,直至达到OD600为约0.8-0.9。然后将所述细胞培养物用IPTG(终浓度为1mM)诱导。在诱导后,将培养物在37℃下振摇生长3小时。然后通过以4,000x g离心15min来收获细胞。将细胞沉淀物储存在-20℃下。将所述沉淀物在冰上融化,并悬浮在由6M盐酸胍、300mM NaH2PO4、20mM咪唑构成的pH 8.0的裂解缓冲液中。

实施例3–纯化

使用下述纯化缓冲液:

1.高浓度磷酸盐裂解缓冲液:6M盐酸胍,300mM NaH2PO4,20mM咪唑,pH 8.0

2.低浓度磷酸盐清洗缓冲液:6M盐酸胍,20mM NaH2PO4,20mM咪唑,pH 8.0

3.用于除去内毒素的清洗缓冲液:10mM Tris pH 8.0,60%(v/v)异丙醇

4.洗脱缓冲液:低浓度磷酸盐缓冲液,6M盐酸胍,20mM NaH2PO4,pH 8.0,具有可变浓度的咪唑

对每克细胞沉淀物使用5至10mL体积的裂解缓冲液(6M GuHCl,300mM NaH2PO4,20mM咪唑,pH 8.0)。将25mL裂解缓冲液在冰上超声处理3分钟。使用15K rpm下45min的离心将裂解液澄清。在离心后,将澄清的裂解液使用0.45μm滤器(Sartorius)过滤,并在2*5mLHis-trap HP亲和柱上纯化。

首先,按照下述流程将所述蛋白质结合到柱,然后进行清洗步骤:

1.用高浓度磷酸盐裂解缓冲液平衡柱

2.将过滤过的澄清裂解液(CL)结合到柱

3.使用高浓度磷酸盐裂解缓冲液(5倍柱体积)的清洗1

4.使用低浓度磷酸盐缓冲液(5倍柱体积)的清洗2

5.使用10mM Tris pH 8.0中的60%异丙醇(10倍柱体积)的清洗3

6.使用低浓度磷酸盐缓冲液(15倍柱体积)的清洗4

进行步骤3是为了除去核酸片段,而步骤5被用于除去内毒素。

随后,按照下述流程使用120至132mM咪唑的逐渐升高的咪唑浓度进行逐步洗脱(图4B):

1.使用低浓度磷酸盐缓冲液的柱清洗(5倍柱体积)

2.使用120mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

3.使用122mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

4.使用124mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

5.使用126mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

6.使用128mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

7.使用130mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

8.使用132mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

9.使用250mM咪唑的洗脱(4倍柱体积–级分大小为6mL)

10.使用低浓度磷酸盐缓冲液的柱清洗(10倍柱体积)

纯化的DEDDLI-RR的SDS-PAGE示出在图4C中,并表明了纯蛋白质的高得率。

实施例4–烟碱的偶联

将DEDDLI-RR和LIVELI1-RR的合并的洗脱级分首先用5mM EDTA温浴至少1小时以除去任何淋滤的金属离子。然后使用所述合并的洗脱级分的切向流过滤针对由6M盐酸胍、100mM HEPES pH 7.2、150mM NaCl构成的偶联缓冲液进行透析。将Spectra-Por 6-8kDa截留膜用于透析。

将12mg浓度为11.03mg/mL的DEDDLI-RR用于偶联,其对应于1090μL的体积。蛋白质与NHS-烟碱的摩尔比为1:50。因此,为了这个比率,使用下述量的蛋白质和NHS-烟碱:

DEDDLI-RR:0.267微摩尔(12mg)

对映体纯的NHS-烟碱:13.35微摩尔

所述偶联反应在室温下,在暗处(即用铝箔覆盖),在使用磁力搅拌器搅拌下进行3小时。在偶联反应后,将样品通过PD minitrap G-25预装柱以除去未偶联的NHS-烟碱,并将缓冲液更换为由8M尿素、20mM Tris pH8.5、150mM NaCl和10%海藻糖构成的预重折叠缓冲液(图4D)。所述构建物在偶联之前和之后的分子质量被分别测定为44527.31和46838.55Da,对应于平均每个蛋白质链8.9个烟碱分子,即所有8个赖氨酸侧链和N-端胺几乎完全与NHS-烟碱偶联(图4D)。

实施例5–重折叠

制备最终的重折叠缓冲液,其含有用于免疫接种实验的CpG或用于包封研究的荧光标记的CpG。小鼠特异性CpG(1826)具有序列其中DNA骨架中的碱基通过硫代磷酸酯键(由符号*指示)相连。CpG 1826的分子量为6362.7g/mol。荧光标记的CpG ODN1826F具有6899.7g/mol的分子量。ODN1826是B类CpG序列并含有两个未甲基化的CpG二核苷酸,它们用粗体强调并加下划线。B类CpG在防止快速降解的全硫代磷酸酯骨架内含有一个或多个CpG二核苷酸。它们强烈活化B细胞但微弱地刺激IFN-α分泌。

与哺乳动物DNA相比,这些未甲基化的CpG二核苷酸在细菌DNA中以高20倍的频率存在。这个小鼠特异性ODN1826序列中的这些基序被小鼠Toll样受体9识别,其随后导致强烈的免疫刺激效应。

在快速重折叠后,最终蛋白质浓度为0.05mg/mL,对应于0.31纳摩尔的蛋白质。对于包封实验来说,准备了不同的蛋白质与CpG的摩尔比。为不同的最终重折叠缓冲液准备了下述量的CpG:0.06,0.09,0.14,0.186,0.233,0.031,0.451和0.62纳摩尔,对应于1:0.2、1:0.3、1:0.45、1:0.6、1:0.75、1:1、1:1.5和1:2的DEDDLI-RR:ODN1826F比。

然后将所述预重折叠缓冲液中的蛋白质在那些含有20mM Tris pH 8.0、50mMNaCl、10%海藻糖并含有不同量的ODN1826的最终重折叠缓冲液中逐滴稀释。所述快速重折叠过程如下进行:将含有CpG的最终重折叠缓冲液恒定地保持搅拌。将蛋白质DEDDLI-RR逐滴添加到所述最终重折叠缓冲液(含有CpG)中,以启动重折叠过程。在所述蛋白质添加后,允许所述重折叠过程在恒定搅拌下继续进行5分钟。

实施例6–包封

在快速重折叠后,在过滤之前测量总相对荧光单位(RFU)。然后,使用总体积为300μL的DEDDLI-RR:ODN1826F,通过将所述蛋白质浓缩2.5倍(即将截留物从300μL减少到约120μL)进行第一过滤步骤。所述过滤步骤使用100kDa截留值的离心式滤器进行,其允许游离CpG通过但保留含有可能包封的CpG的组装的SAPN。在所述第一过滤步骤后,测量流通液和截留物的RFU。

表3:包封后的荧光

重要的是认识到,由于荧光淬灭,荧光读数的信号(RFU)相对于浓度是高度非线性的。因此,在柱“流通液”级分中可以最好地观察到成功的包封。如果CpG被包封在SAPN中,则它将不通过滤器并且在“流通液”中不给出信号。在直至1:0.6的包封比,在含有SAPN的样品(DEDDLI-RR:ODN1826F)的“流通液”中几乎不能检测到任何荧光,而在不含SAPN的样品(仅仅ODN1826F)中,在这些对应于较低包封比1:0.3、1:0.45和1:0.6的浓度下存在荧光强度的快速提高(图5)。在更高比例下,所有荧光(即CpG)不再可以被SAPN保留,因此在含有SAPN的样品(DEDDLI-RR:ODN1826F)的“流通液”中荧光信号显著增加。这意味着所述SAPN可以包封对应于0.6倍的蛋白质链的摩尔比的量的CpG,即假设所述具有60个蛋白质链的SAPN为T1二十面体对称,则粗略地每个纳米粒子包封总共36个CpG分子。

假设在NaCl缓冲液中DNA的密度为1.8g/cm3并且分子量为6899.7g/mol,则36个ODN1826F分子占据直径为7.6nm的球体。这与基于SAPN的计算机模型的中央空腔的体积非常密切地相符。

如果添加比可以被所述SAPN包封的更多的CpG,则附加的CpG将通过膜,导致流通液中的荧光强度提高。这种由未包封的CpG造成的流通液中荧光强度的提高,与从相应CpG浓度下的仅CpG的样品测量到的信号良好地相关(图6)。因此,在含有SAPN的样品中从未包封的CpG检测到的信号与来自于仅CpG的样品的信号非常相近,并且浓度依赖性曲线几乎重叠(图6)。

实施例7–电子显微术

包封有ODN1826的DEDDLI-RR的透射电子显微镜分析显示出非常好的、无聚集的纳米粒子形成(图7)。

实施例8-小鼠免疫接种实验

对于免疫接种实验来说,使用1:0.6的DEDDLI-RR:ODN1826的摩尔比。在快速重折叠后,将含有包封有CpG的重折叠的DEDDLI-RR的溶液透析并过滤。然后使用100kDa截留值的离心式滤器(Millipore)将所述样品浓缩。最后的无菌过滤步骤在无菌通风橱中使用0.2μm注射器滤器(Sartorius)进行。

将5只Balb/C小鼠的组各自用含有或不含包封的CpG的10μg和30μg蛋白质的两种不同剂量免疫接种。那些药剂中CpG的量分别为0.85μg和2.56μg。对于肌肉内(IM)、鼻内(IN)和静脉内(IV)注射这三种不同的免疫接种方案来说,提供各自相隔两周的三次注射。对于所述三种免疫接种方案中的每一种来说,当CpG被包封在免疫原的SAPN中时可以观察到抗体滴度的显著提高(表3,图8)。

-尽管对于IM免疫接种来说10μg剂量的免疫接种在含有和不含CpG时在抗体滴度方面显示出相同强度的免疫应答,但对30μg剂量来说,与没有CpG的样品相比含有包封的CpG的样品可以观察到236%的提高。

-对于IN免疫接种来说,包封的CpG在10μg蛋白质(对应于0.85μg CpG)的较低剂量下已经将免疫应答提高161%。对于30μg蛋白质剂量(2.56μg CpG)来说,所述提高高达319%。

-尽管对于IM免疫接种来说免疫应答通常最强,但CpG的流感更加温和,对于10μg和30μg蛋白质(0.85μg和2.56μg CpG)的低和高剂量来说提高18%和87%。

表3:具有和没有CpG包封的免疫应答

实施例9–试验连接物L1的不同长度和总电荷

预期具有较长连接物L1并带

有比总电荷为+3的DEDDLI-RR更多的正电荷的SAPN将更加高效地包封带负电荷的核酸,即它们可以携带更大的核酸有效载荷。为了试验这种假设,设计了两种新的粒子,它们分别具有RRGRRGR(SEQ ID NO:14)和RRGRRGRRGR(SEQ ID NO:15)的连接物L1。第一种构建物(被称为2RR)的连接物L1的长度为7个氨基酸,具有5个正电荷(精氨酸),而第二种构建物(被称为3RR)具有9个氨基酸长的连接物L1,具有总共7个正电荷(精氨酸)。

所述修饰的连接物的基本原理是增加所述连接物L1的长度允许两个寡聚化结构域ND1和ND2相隔更远,从而增加了中央空腔的尺寸,为货物装载提供了更大空间。向所述连接物添加另外的电荷允许所述蛋白质与作为有效载荷的带负电荷的核酸之间更好的电荷补偿。

由于重折叠行为关键取决于蛋白质链的总电荷以及因此粒子本身的总电荷,因此2RR和3RR的连接物L1中另外的正电荷被在X1的紧接五聚体ND1的起点之前的末端处带负电荷的谷氨酸的***所补偿,并且对于3RR来说,被接近五聚体ND1的C-端末端的精氨酸残基改变成带负电荷的天冬氨酸所补偿。这将2RR和3RR的蛋白质链的总电荷保持在-7,与DEDDLI-RR的总电荷相同。因此,2RR和3RR的序列分别是:MGDKHHHHHHHHHHKDGSDKGSEEWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ IDNO:16)

MGDKHHHHHHHHHHKDGSDKGSEEWEEWNARWDEWENDWNDWREDWQAWRDDWARWDATWRRGRRGRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:17)。2RR和3RR的计算分子量分别为45431.93Da和Mw 45760.26Da。

如实施例1、2和3中所述,将两种构建物克隆、表达并纯化。重折叠和同时的包封如实施例5中对DEDDLI-RR所述来进行,对包封比使用的蛋白质的量进行了略微修改,以将与DEDDLI-RR相比略微不同的分子量考虑在内。

根据图9,令人吃惊的发现是2RR和3RR的更长且带更多正电荷的连接物不允许更多CpG被包封。尽管与仅仅CpG的样品相比仍存在非常明显的保留在上清液中并且没有通过滤膜进入流通液中的CpG,但它略微低于DEDDLI-RR的包封效率。

实施例10–在没有TLR5背景免疫刺激的情况下试验TLR9活化

在构建物DEDDLI-RR中,鞭毛蛋白分子的D0/D1结构域活化TLR5以诱导强烈免疫应答。这将覆盖由CpG结合到TLR9引起的免疫应答。为了试验主要源自于TLR9活化的免疫应答,对DEDDLI-RR中的TLR5相互作用位点进行修饰,以废除与所述受体的相互作用。将TLR5/鞭毛蛋白相互作用位点处的精氨酸残基(Yoon S.I.等,Science 2012,335:859-64)突变成赖氨酸。此外,也将鞭毛蛋白的C-端末端处的炎性体相互作用位点突变以破坏与炎性体的相互作用(Lightfield K.L.等,Nat Immunol.2008,9:1171-8)。所述两个蛋白质序列的名称是LIVELI1-RR和LIVELI2-RR,并且相应的序列是:

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQKVKELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALKSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVAAAAR(SEQ ID NO:18)

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQKVKELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQKIDAALAQVDALKSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVAAAAR(SEQ ID NO:19)。

在构建物LIVELI1-RR中,构建物DEDDLI-RR的第206位、第208位和第322位精氨酸残基被突变成赖氨酸,而在LIVELI2-RR中,也将DEDDLI-RR的第135位、第174位、第251位和第310位精氨酸残基改变成赖氨酸。在赖氨酸残基的伯胺处偶联半抗原烟碱,在鞭毛蛋白与TLR5之间的界面处***了大体积的组成部分,从而抑制了复合物形成以及因此基于toll样受体的免疫刺激。在两种构建物LIVELI1-RR和LIVELI2-RR中,对鞭毛蛋白的D0结构域的炎性体相互作用位点进行修饰,以将DEDDLI-RR的第390位至第393位残基(LSLL)用4个丙氨酸(AAAA)(SEQ ID NO:40)代替。这种修饰将抑制所述两种构建物LIVELI1-RR和LIVELI2-RR的炎性体活化(Lightfield K.L.等,Nat Immunol.2008,9:1171-8)。

由于对于具有带正电荷的连接物的构建物来说在不含包封的CpG时的重折叠不能良好地工作,因此制备了一对构建物,其中将带正电荷的连接物RRGR(SEQ ID NO:4)用序列MGGR(SEQ ID NO:41)代替,从而除去了连接物L1中的3个正电荷中的2个。那些被命名为LIVELI1和LIVELI2的构建物被用于不含包封的CpG时的免疫接种,并具有总体序列:

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWMGGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQKVKELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALKSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVAAAAR(SEQ ID NO:20)

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWMGGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQKVKELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQKIDAALAQVDALKSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVAAAAR(SEQ ID NO:21)。

将所述两对构建物LIVELI1/LIVELI1-RR和LIVELI2/LIVELI2-RR如实施例1、2和3中所述进行克隆、表达和纯化。重折叠和同时的包封如实施例5中对DEDDLI-RR所述来进行,对包封比使用的蛋白质的量进行了略微修改,以将与DEDDLI-RR相比略微不同的分子量考虑在内。对于免疫接种实验来说,使用1:0.6的蛋白质:ODN1826的摩尔比。在快速重折叠后,将含有包封有CpG的重折叠的纳米粒子的溶液透析并过滤。然后使用100kDa截留值的离心式滤器(Millipore)将所述样品浓缩。最后的无菌过滤步骤在无菌通风橱中使用0.2μm注射器滤器(Sartorius)进行。

将5只Balb/C小鼠的组各自用含有(LIVELI1-RR和LIVELI2-RR)或不含包封的CpG(LIVELI1和LIVELI2)的30μg蛋白质的剂量免疫接种。在LIVELI1-RR和LIVELI2-RR药剂中包封的CpG的量为约2.5μg。在免疫接种方案中,提供各自相隔两周的三次肌肉内注射。对于两对免疫原来说,当CpG被包封在免疫原的SAPN中时可以观察到抗体滴度的显著提高(图10)。对于LIVELI1和LIVELI2免疫原来说,没有ODN1826时的抗体滴度分别为576.3和367.6,而在LIVELI1-RR和LIVELI2-RR中包封的CpG将抗体滴度分别提高到10958.0和7618.4,对应于近20倍的提高。

实施例11–通过与含有鞭毛蛋白的蛋白质链(CC-RR)共同组装获得的疟疾疫苗

本发明的CpG-SAPN的另一个实例是下述构建物“CC-RR”,其中两个不同的蛋白质链被共同组装,对应于具有下述序列的式(I)和(II):

对于式(I)来说:MGHHHHHHHHHHTFRGNNGHNSSSSLYNGS QFIEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFDASGSAKFVAAWTLKAAASGSWERWNAKWDEWRNDQNDWREDWQAWRDDWAYWTLTWRRGRLYSRLARIERRVEELRRLLQLIRHENRMVLQFVRALSMQARRLEALIDYNKAALSKFKEDARGTFRGNNGHNSSSSLYNGSQFIEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFD(SEQ ID NO:22)

以及

对于式(II)来说:MGHHHHHHHHHHTFRGNNGHNSSSSLYNGSQ FIEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFDASGSAKFVAAWTLKAAASGSWERWNAKWDEWRNDQNDWREDWQAWRDDWAYWTLTWRRGRLYSRLARIERRVEELRRLLQLIRHENRMVLQFVRALSMQARRLERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:23)。

所述第一构建物对应于式X1–ND1–L1–ND2–Y1(I)),其具有下述分结构:

X1:MGHHHHHHHHHHTFRGNNGHNSSSSLYNGSQFIEQLNNSF TSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFDASGSAKFVAAWTLKAAASGS(SEQ ID NO:24)

ND1:WERWNAKWDEWRNDQNDWREDWQAWRDDWAYWTL TW(SEQ ID NO:25)

L1:RRGR(SEQ ID NO:4)

ND2:LYSRLARIERRVEELRRLLQLIRHENRMVLQFVRALSMQ ARRL(SEQ ID NO:26)

Y1:EALIDYNKAALSKFKEDARGTFRGNNGHNSSSSLYNGSQF IEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFD(SEQ ID NO:27)。

所述第二构建物对应于式X2–ND3–L2–ND4–Y2(II),其具有下述分结构:

X2:MGHHHHHHHHHHTFRGNNGHNSSSSLYNGSQFIEQLNNSF TSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFDASGSAKFVAAWTLKAAASGS(SEQ ID NO:24)

ND3:WERWNAKWDEWRNDQNDWREDWQAWRDDWAYWTL TW(SEQ ID NO:25)

L2:RRGR(SEQ ID NO:4)

ND4:LYSRLARIERRVEELRRLLQLIRHENRMVLQFVRALSMQ ARRL(SEQ ID NO:26)

Y2:ERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIER LSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQID NO:28)。

具体来说,这些构建物中的不同片段如下:X1含有His标签(HHHHHHHHHH)(SEQ IDNO:29),紧随其后是疟疾抗原CelTOS(TFRGNNGHNSSSSLYNGSQFIEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFD)(SEQ ID NO:30)和泛DR结合表位PADRE(AKFVAAWTLKAAA)(SEQ ID NO:31),其两侧带有编码限制性位点NcoI、NheI和BamHI的肽序列(MG、ASGS和SGS)并被它们隔开。

ND1是源自于色氨酸拉链的五聚卷曲螺旋(Liu J等,Proc Natl Acad Sci U SA2004;101(46):16156-61,pdb条目编号1T8Z,SEQ ID NO:7),并具有一些电荷修饰。它与具有SEQ ID NO:3的DEDDLI-RR的ND1结构域相似。

L1是与DEDDLI-RR中相同的连接物,具有序列RRGR和SEQ ID NO:4。

ND2是具有与构建物DEDDLI-RR中的ND2(SEQ ID NO:5)非常相似的序列的卷曲螺旋结构域,也含有混杂的CD4/CD8表位IRHENRMVL(SEQ ID NO:8)(Parida R.等,Vaccine2007,25:7530–7539),对应于具有序列ID BAA01449.1的甲型流感病毒的基质蛋白1的第173位至第181位残基。

Y1始于含有来自于淋巴细胞性脉络丛脑膜炎哺乳类沙粒病毒病毒的糖蛋白的CD4表位的序列LIDYNKAALSKFKED(SEQ ID NO:32),后面跟有第二个疟疾抗原拷贝CelTOS(TFRGNNGHNSSSSLYNGSQF IEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFD)(SEQ ID NO:30),其两侧带有在DNA水平上编码限制性位点XhoI和XmaI的肽序列(LE和ARG)并被它们隔开。所述XhoI限制性位点与片段ND2共享。.

所述第一与第二构建物之间的唯一差异是分结构Y1和Y2中的差异,即在所述两个构建物之间其他片段是一致的,这意味着X1等于X2,ND1等于ND3,L1等于L2,并且ND2等于ND4。因此,所述两种构建物可以共同组装,因为两种构建物的卷曲螺旋寡聚化结构域是相同的。这是在专利WO2015/104352A1中已经描述过的概念,其中将含有鞭毛蛋白的蛋白质链与带有蛋白质链的B-细胞表位共同组装。

与所述第一构建物的Y1形成对比,所述第二构建物的Y2含有鞭毛蛋白的D0和D1结构域。它始于所述鞭毛蛋白序列之前的小α-螺旋区段(ERRLEEL)(SEQ ID NO:33),所述区段将ND4的卷曲螺旋延长了一点。Y2也在两侧带有编码限制性位点XhoI和XmaI的肽序列(LE和ARG)并被它们隔开,其中XhoI限制性位点与片段ND4共享。

所述两种构建物的共同组装形成在两个卷曲螺旋上都展示B-细胞表位CelTOS的SAPN,同时取决于所述第一与第二构建物之间的共同组装比,少量鞭毛蛋白分子被并入到所述SAPN中。带正电荷的连接物L1和L2也位于所述SAPN的中央空腔处,因此允许与带负电荷的CpG的离子相互作用。同样地,CpG ODN1826在重折叠期间被包封在所述SAPN中。

将所述两种构建物如实施例1、2和3中所述进行克隆、表达和纯化。重折叠和同时的包封如实施例5中对DEDDLI-RR所述来进行,对相同的1:0.6(蛋白质:CpG)的包封比使用的蛋白质量进行了修改,以将与DEDDLI-RR相比不同的分子量考虑在内。与DEDDLI-RR构建物相似,对于蛋白质链与CpG ODN1826F分子的比例来说,包封效率为约1:0.6,正如上文描述的荧光过滤实验的保留比所证实的。CC-RR能够在高达1:0.6的共同组装比下保留荧光ODN1826F分子(图12)。

对于58:2的第一和第二蛋白质链的共同组装比来说,描述SAPN的分子结构体系、共同组装/包封程序的过程和EM显微照片的图示出在图13中。

实施例12–具有CD4和CD8表位的HSV小鼠免疫原“RR-SSIEF”

对DEDDLI-RR构建物(实施例1),使用标准的分子生物学程序制备编码RR-SSIEF的DNA。含有编码如下蛋白质序列RR-SSIEF的DNA的质粒通过克隆到基础SAPN表达构建物pPEP-T的NcoI/EcoRI限制性位点中来构建(图3):

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQAKFVAAWTLKAAASSIEFARLQFDDTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:34)。

这个具有结构体系X1–ND1–L1–ND2–Y1的构建物的序列与上文详细描述的DEDDLI-RR的序列相似。简短来说,这个构建物由通过具有序列RRGR的连接物L1连接到所述重新设计的二聚卷曲螺旋(ND2)的五聚卷曲螺旋色氨酸拉链(ND1)构成,其在所述五聚卷曲螺旋的最后一个核心位置与所述二聚卷曲螺旋的第一个核心位置之间含有3个正电荷。N-端处的序列X1含有His标签,而序列Y1含有鼠伤寒沙门氏菌鞭毛蛋白的片段,并由鞭毛蛋白的修饰的D0和D1结构域构成。连接鞭毛蛋白的D0和D1结构域的肽序列在MfeI和PstI限制性位点之间具有序列QLNVQQAKFVAAWTLKAAASSIEFARLQF DDTENPLQ(SEQ ID NO:35)。这个连接片段含有泛DR结合性CD4表位PADRE以及人α疱疹病毒2的包膜糖蛋白B的小鼠特异性(单倍型H-2k)CD8表位SSIEFARL。与MHC-I分子复合的这种肽的晶体结构保存在Brookhaven数据库,条目编码为1T0M。

为了诱导Th1免疫应答,使用A类CpG ODN1585代替B类ODN1826。ODN1585具有序列5’-ggGGTCAACGTTGAgggggg-3’(SEQ ID NR:39),其中采用大写字母的碱基表示磷酸二酯键,而采用小写字母的碱基在碱基之间含有硫代磷酸酯键。

将构建物RR-SSIEF如实施例1、2和3中所述进行克隆、表达和纯化。重折叠和同时的包封如实施例5中对DEDDLI-RR所述来进行,对包封比使用的蛋白质量进行了略微修改,以将RR-SSIEF与DEDDLI-RR相比略微不同的分子量和ODN1585与ODN1826的不同分子量考虑在内。对于免疫接种实验来说,使用1:0.6的蛋白质:ODN1585的摩尔比。在快速重折叠后,将含有包封有CpG的重折叠的纳米粒子的溶液透析并过滤。然后使用100kDa截留值的离心式滤器(Millipore)将所述样品浓缩。最后的无菌过滤步骤在无菌通风橱中使用0.2μm注射器滤器(Sartorius)进行。包封有ODN1585的RR-SSIEF的透射电子显微镜分析显示出形成非常良好的无聚集的纳米粒子(图14)。

SEQUENCE LISTING

<110> ALPHA-O PEPTIDES

<120> Self-assembling protein nanoparticles encapsulating

immunostimulatory nucleid acids

<130> P5288EP00

<160> 49

<170> PatentIn version 3.5

<210> 1

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> DEDDLI-RR

<400> 1

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Leu Ser Leu Leu Arg

385 390

<210> 2

<211> 22

<212> PRT

<213> Artificial Sequence

<220>

<223> His-tag

<400> 2

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser

20

<210> 3

<211> 36

<212> PRT

<213> Artificial Sequence

<220>

<223> Pentameric coiled coil

<400> 3

Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu Trp Glu Asn Asp Trp Asn

1 5 10 15

Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg Asp Asp Trp Ala Arg Trp

20 25 30

Arg Ala Thr Trp

35

<210> 4

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 4

Arg Arg Gly Arg

1

<210> 5

<211> 50

<212> PRT

<213> Artificial Sequence

<220>

<223> Trimeric coiled coil

<400> 5

Leu Leu Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg

1 5 10 15

Arg Leu Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe

20 25 30

Val Arg Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu

35 40 45

Glu Leu

50

<210> 6

<211> 282

<212> PRT

<213> Artificial Sequence

<220>

<223> D0D1 of flagellin

<400> 6

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

1 5 10 15

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

20 25 30

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

35 40 45

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

50 55 60

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

65 70 75 80

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg

85 90 95

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

100 105 110

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

115 120 125

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

130 135 140

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

145 150 155 160

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

165 170 175

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

180 185 190

Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

195 200 205

Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

210 215 220

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

225 230 235 240

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

245 250 255

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

260 265 270

Val Pro Gln Asn Val Leu Ser Leu Leu Arg

275 280

<210> 7

<211> 53

<212> PRT

<213> Artificial Sequence

<220>

<223> Trp-zipper

<400> 7

Ser Ser Asn Ala Lys Trp Asp Gln Trp Ser Ser Asp Trp Gln Thr Trp

1 5 10 15

Asn Ala Lys Trp Asp Gln Trp Ser Asn Asp Trp Asn Ala Trp Arg Ser

20 25 30

Asp Trp Gln Ala Trp Lys Asp Asp Trp Ala Arg Trp Asn Gln Arg Trp

35 40 45

Asp Asn Trp Ala Thr

50

<210> 8

<211> 9

<212> PRT

<213> Influenza virus

<400> 8

Ile Arg His Glu Asn Arg Met Val Leu

1 5

<210> 9

<211> 8

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker replacing D2 and D3 of flagellin

<400> 9

Asp Gly Asp Lys Gly Asp Asp Lys

1 5

<210> 10

<211> 180

<212> PRT

<213> Salmonella typhimurium

<400> 10

Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn

1 5 10 15

Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu

20 25 30

Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala Ala Gly Gln

35 40 45

Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu Thr Gln Ala

50 55 60

Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly

65 70 75 80

Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala

85 90 95

Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile

100 105 110

Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly

115 120 125

Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp Asn Thr Leu

130 135 140

Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu

145 150 155 160

Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu Asn Val Gln

165 170 175

Gln Lys Tyr Lys

180

<210> 11

<211> 91

<212> PRT

<213> Salmonella typhimurium

<400> 11

Thr Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp

1 5 10 15

Ala Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala

20 25 30

Ile Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser

35 40 45

Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg

50 55 60

Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn

65 70 75 80

Gln Val Pro Gln Asn Val Leu Ser Leu Leu Arg

85 90

<210> 12

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 12

Lys Lys Gly Lys

1

<210> 13

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> CpG ODN 1826

<220>

<221> misc_feature

<222> (1)..(20)

<223> all phosphorothioates bonds

<400> 13

tccatgacgt tcctgacgtt 20

<210> 14

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 14

Arg Arg Gly Arg Arg Gly Arg

1 5

<210> 15

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 15

Arg Arg Gly Arg Arg Gly Arg Arg Gly Arg

1 5 10

<210> 16

<211> 399

<212> PRT

<213> Artificial Sequence

<220>

<223> 2RR

<400> 16

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Glu Glu Trp Glu Glu Trp Asn Ala Arg Trp

20 25 30

Asp Glu Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala

35 40 45

Trp Arg Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg

50 55 60

Arg Gly Arg Leu Leu Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu

65 70 75 80

Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu Asn Arg Met Val

85 90 95

Leu Gln Phe Val Arg Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg

100 105 110

Arg Leu Glu Glu Leu Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn

115 120 125

Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala

130 135 140

Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser

145 150 155 160

Ala Arg Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala

165 170 175

Asn Ile Arg Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile

180 185 190

Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn

195 200 205

Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn

210 215 220

Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu

225 230 235 240

Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg

245 250 255

Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp

260 265 270

Gly Glu Thr Ile Asp Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu

275 280 285

Gly Leu Asp Gln Leu Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys

290 295 300

Gly Asp Asp Lys Thr Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu

305 310 315 320

Ala Gln Val Asp Ala Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg

325 330 335

Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser

340 345 350

Glu Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser

355 360 365

Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu

370 375 380

Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu Arg

385 390 395

<210> 17

<211> 402

<212> PRT

<213> Artificial Sequence

<220>

<223> 3RR

<400> 17

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Glu Glu Trp Glu Glu Trp Asn Ala Arg Trp

20 25 30

Asp Glu Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala

35 40 45

Trp Arg Asp Asp Trp Ala Arg Trp Asp Ala Thr Trp Arg Arg Gly Arg

50 55 60

Arg Gly Arg Arg Gly Arg Leu Leu Ser Arg Leu Glu Arg Leu Glu Arg

65 70 75 80

Arg Asn Glu Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu Asn

85 90 95

Arg Met Val Leu Gln Phe Val Arg Ala Leu Ser Met Gln Asn Ala Glu

100 105 110

Leu Glu Arg Arg Leu Glu Glu Leu Ala Arg Gly Met Ala Gln Val Ile

115 120 125

Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Arg Ser

130 135 140

Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg

145 150 155 160

Ile Asn Ser Ala Arg Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg

165 170 175

Phe Thr Ala Asn Ile Arg Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn

180 185 190

Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile

195 200 205

Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn

210 215 220

Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr

225 230 235 240

Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn

245 250 255

Gly Val Arg Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly

260 265 270

Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Arg Gln Ile Asn Ser

275 280 285

Gln Thr Leu Gly Leu Asp Gln Leu Asn Val Gln Gln Lys Tyr Lys Asp

290 295 300

Gly Asp Lys Gly Asp Asp Lys Thr Glu Asn Pro Leu Gln Arg Ile Asp

305 310 315 320

Ala Ala Leu Ala Gln Val Asp Ala Leu Arg Ser Asp Leu Gly Ala Val

325 330 335

Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn

340 345 350

Asn Leu Ser Glu Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr

355 360 365

Glu Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr

370 375 380

Ser Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu

385 390 395 400

Leu Arg

<210> 18

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> LIVELI1-RR

<400> 18

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Lys Val Lys

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Lys Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Ala Ala Ala Ala Arg

385 390

<210> 19

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> LIVELI2-RR

<400> 19

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Lys Val Lys

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Lys Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Ala Ala Ala Ala Arg

385 390

<210> 20

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> LIVELI1

<400> 20

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Met Gly Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Lys Val Lys

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Lys Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Ala Ala Ala Ala Arg

385 390

<210> 21

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> LIVELI2

<400> 21

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Met Gly Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Lys Val Lys

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Lys Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Ala Ala Ala Ala Arg

385 390

<210> 22

<211> 453

<212> PRT

<213> Artificial Sequence

<220>

<223> CC-RR

<400> 22

Met Gly His His His His His His His His His His Thr Phe Arg Gly

1 5 10 15

Asn Asn Gly His Asn Ser Ser Ser Ser Leu Tyr Asn Gly Ser Gln Phe

20 25 30

Ile Glu Gln Leu Asn Asn Ser Phe Thr Ser Ala Phe Leu Glu Ser Gln

35 40 45

Ser Met Asn Lys Ile Gly Asp Asp Leu Ala Glu Thr Ile Ser Asn Glu

50 55 60

Leu Val Ser Val Leu Gln Lys Asn Ser Pro Thr Phe Leu Glu Ser Ser

65 70 75 80

Phe Asp Ile Lys Ser Glu Val Lys Lys His Ala Lys Ser Met Leu Lys

85 90 95

Glu Leu Ile Lys Val Gly Leu Pro Ser Phe Glu Asn Leu Val Ala Glu

100 105 110

Asn Val Lys Pro Pro Lys Val Asp Pro Ala Thr Tyr Gly Ile Ile Val

115 120 125

Pro Val Leu Thr Ser Leu Phe Asn Lys Val Glu Thr Ala Val Gly Ala

130 135 140

Lys Val Ser Asp Glu Ile Trp Asn Tyr Asn Ser Pro Asp Val Ser Glu

145 150 155 160

Ser Glu Glu Ser Leu Ser Asp Asp Phe Phe Asp Ala Ser Gly Ser Ala

165 170 175

Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala Ser Gly Ser Trp

180 185 190

Glu Arg Trp Asn Ala Lys Trp Asp Glu Trp Arg Asn Asp Gln Asn Asp

195 200 205

Trp Arg Glu Asp Trp Gln Ala Trp Arg Asp Asp Trp Ala Tyr Trp Thr

210 215 220

Leu Thr Trp Arg Arg Gly Arg Leu Tyr Ser Arg Leu Ala Arg Ile Glu

225 230 235 240

Arg Arg Val Glu Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu

245 250 255

Asn Arg Met Val Leu Gln Phe Val Arg Ala Leu Ser Met Gln Ala Arg

260 265 270

Arg Leu Glu Ala Leu Ile Asp Tyr Asn Lys Ala Ala Leu Ser Lys Phe

275 280 285

Lys Glu Asp Ala Arg Gly Thr Phe Arg Gly Asn Asn Gly His Asn Ser

290 295 300

Ser Ser Ser Leu Tyr Asn Gly Ser Gln Phe Ile Glu Gln Leu Asn Asn

305 310 315 320

Ser Phe Thr Ser Ala Phe Leu Glu Ser Gln Ser Met Asn Lys Ile Gly

325 330 335

Asp Asp Leu Ala Glu Thr Ile Ser Asn Glu Leu Val Ser Val Leu Gln

340 345 350

Lys Asn Ser Pro Thr Phe Leu Glu Ser Ser Phe Asp Ile Lys Ser Glu

355 360 365

Val Lys Lys His Ala Lys Ser Met Leu Lys Glu Leu Ile Lys Val Gly

370 375 380

Leu Pro Ser Phe Glu Asn Leu Val Ala Glu Asn Val Lys Pro Pro Lys

385 390 395 400

Val Asp Pro Ala Thr Tyr Gly Ile Ile Val Pro Val Leu Thr Ser Leu

405 410 415

Phe Asn Lys Val Glu Thr Ala Val Gly Ala Lys Val Ser Asp Glu Ile

420 425 430

Trp Asn Tyr Asn Ser Pro Asp Val Ser Glu Ser Glu Glu Ser Leu Ser

435 440 445

Asp Asp Phe Phe Asp

450

<210> 23

<211> 563

<212> PRT

<213> Artificial Sequence

<220>

<223> CC-RR-D0D1

<400> 23

Met Gly His His His His His His His His His His Thr Phe Arg Gly

1 5 10 15

Asn Asn Gly His Asn Ser Ser Ser Ser Leu Tyr Asn Gly Ser Gln Phe

20 25 30

Ile Glu Gln Leu Asn Asn Ser Phe Thr Ser Ala Phe Leu Glu Ser Gln

35 40 45

Ser Met Asn Lys Ile Gly Asp Asp Leu Ala Glu Thr Ile Ser Asn Glu

50 55 60

Leu Val Ser Val Leu Gln Lys Asn Ser Pro Thr Phe Leu Glu Ser Ser

65 70 75 80

Phe Asp Ile Lys Ser Glu Val Lys Lys His Ala Lys Ser Met Leu Lys

85 90 95

Glu Leu Ile Lys Val Gly Leu Pro Ser Phe Glu Asn Leu Val Ala Glu

100 105 110

Asn Val Lys Pro Pro Lys Val Asp Pro Ala Thr Tyr Gly Ile Ile Val

115 120 125

Pro Val Leu Thr Ser Leu Phe Asn Lys Val Glu Thr Ala Val Gly Ala

130 135 140

Lys Val Ser Asp Glu Ile Trp Asn Tyr Asn Ser Pro Asp Val Ser Glu

145 150 155 160

Ser Glu Glu Ser Leu Ser Asp Asp Phe Phe Asp Ala Ser Gly Ser Ala

165 170 175

Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala Ser Gly Ser Trp

180 185 190

Glu Arg Trp Asn Ala Lys Trp Asp Glu Trp Arg Asn Asp Gln Asn Asp

195 200 205

Trp Arg Glu Asp Trp Gln Ala Trp Arg Asp Asp Trp Ala Tyr Trp Thr

210 215 220

Leu Thr Trp Arg Arg Gly Arg Leu Tyr Ser Arg Leu Ala Arg Ile Glu

225 230 235 240

Arg Arg Val Glu Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu

245 250 255

Asn Arg Met Val Leu Gln Phe Val Arg Ala Leu Ser Met Gln Ala Arg

260 265 270

Arg Leu Glu Arg Arg Leu Glu Glu Leu Ala Arg Gly Met Ala Gln Val

275 280 285

Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Arg

290 295 300

Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu

305 310 315 320

Arg Ile Asn Ser Ala Arg Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn

325 330 335

Arg Phe Thr Ala Asn Ile Arg Gly Leu Thr Gln Ala Ser Arg Asn Ala

340 345 350

Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu

355 360 365

Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala

370 375 380

Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile

385 390 395 400

Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe

405 410 415

Asn Gly Val Arg Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val

420 425 430

Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Arg Gln Ile Asn

435 440 445

Ser Gln Thr Leu Gly Leu Asp Gln Leu Asn Val Gln Gln Lys Tyr Lys

450 455 460

Asp Gly Asp Lys Gly Asp Asp Lys Thr Glu Asn Pro Leu Gln Arg Ile

465 470 475 480

Asp Ala Ala Leu Ala Gln Val Asp Ala Leu Arg Ser Asp Leu Gly Ala

485 490 495

Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val

500 505 510

Asn Asn Leu Ser Glu Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala

515 520 525

Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly

530 535 540

Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser

545 550 555 560

Leu Leu Arg

<210> 24

<211> 191

<212> PRT

<213> Artificial Sequence

<220>

<223> substituent

<400> 24

Met Gly His His His His His His His His His His Thr Phe Arg Gly

1 5 10 15

Asn Asn Gly His Asn Ser Ser Ser Ser Leu Tyr Asn Gly Ser Gln Phe

20 25 30

Ile Glu Gln Leu Asn Asn Ser Phe Thr Ser Ala Phe Leu Glu Ser Gln

35 40 45

Ser Met Asn Lys Ile Gly Asp Asp Leu Ala Glu Thr Ile Ser Asn Glu

50 55 60

Leu Val Ser Val Leu Gln Lys Asn Ser Pro Thr Phe Leu Glu Ser Ser

65 70 75 80

Phe Asp Ile Lys Ser Glu Val Lys Lys His Ala Lys Ser Met Leu Lys

85 90 95

Glu Leu Ile Lys Val Gly Leu Pro Ser Phe Glu Asn Leu Val Ala Glu

100 105 110

Asn Val Lys Pro Pro Lys Val Asp Pro Ala Thr Tyr Gly Ile Ile Val

115 120 125

Pro Val Leu Thr Ser Leu Phe Asn Lys Val Glu Thr Ala Val Gly Ala

130 135 140

Lys Val Ser Asp Glu Ile Trp Asn Tyr Asn Ser Pro Asp Val Ser Glu

145 150 155 160

Ser Glu Glu Ser Leu Ser Asp Asp Phe Phe Asp Ala Ser Gly Ser Ala

165 170 175

Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala Ser Gly Ser

180 185 190

<210> 25

<211> 36

<212> PRT

<213> Artificial Sequence

<220>

<223> oligomerization domain

<400> 25

Trp Glu Arg Trp Asn Ala Lys Trp Asp Glu Trp Arg Asn Asp Gln Asn

1 5 10 15

Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg Asp Asp Trp Ala Tyr Trp

20 25 30

Thr Leu Thr Trp

35

<210> 26

<211> 43

<212> PRT

<213> Artificial Sequence

<220>

<223> oligomerization domain

<400> 26

Leu Tyr Ser Arg Leu Ala Arg Ile Glu Arg Arg Val Glu Glu Leu Arg

1 5 10 15

Arg Leu Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe

20 25 30

Val Arg Ala Leu Ser Met Gln Ala Arg Arg Leu

35 40

<210> 27

<211> 179

<212> PRT

<213> Artificial Sequence

<220>

<223> substituent

<400> 27

Glu Ala Leu Ile Asp Tyr Asn Lys Ala Ala Leu Ser Lys Phe Lys Glu

1 5 10 15

Asp Ala Arg Gly Thr Phe Arg Gly Asn Asn Gly His Asn Ser Ser Ser

20 25 30

Ser Leu Tyr Asn Gly Ser Gln Phe Ile Glu Gln Leu Asn Asn Ser Phe

35 40 45

Thr Ser Ala Phe Leu Glu Ser Gln Ser Met Asn Lys Ile Gly Asp Asp

50 55 60

Leu Ala Glu Thr Ile Ser Asn Glu Leu Val Ser Val Leu Gln Lys Asn

65 70 75 80

Ser Pro Thr Phe Leu Glu Ser Ser Phe Asp Ile Lys Ser Glu Val Lys

85 90 95

Lys His Ala Lys Ser Met Leu Lys Glu Leu Ile Lys Val Gly Leu Pro

100 105 110

Ser Phe Glu Asn Leu Val Ala Glu Asn Val Lys Pro Pro Lys Val Asp

115 120 125

Pro Ala Thr Tyr Gly Ile Ile Val Pro Val Leu Thr Ser Leu Phe Asn

130 135 140

Lys Val Glu Thr Ala Val Gly Ala Lys Val Ser Asp Glu Ile Trp Asn

145 150 155 160

Tyr Asn Ser Pro Asp Val Ser Glu Ser Glu Glu Ser Leu Ser Asp Asp

165 170 175

Phe Phe Asp

<210> 28

<211> 289

<212> PRT

<213> Artificial Sequence

<220>

<223> substituent

<400> 28

Glu Arg Arg Leu Glu Glu Leu Ala Arg Gly Met Ala Gln Val Ile Asn

1 5 10 15

Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Arg Ser Gln

20 25 30

Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg Ile

35 40 45

Asn Ser Ala Arg Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg Phe

50 55 60

Thr Ala Asn Ile Arg Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn Asp

65 70 75 80

Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile Asn

85 90 95

Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn Ser

100 105 110

Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr Gln

115 120 125

Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn Gly

130 135 140

Val Arg Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly Ala

145 150 155 160

Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Arg Gln Ile Asn Ser Gln

165 170 175

Thr Leu Gly Leu Asp Gln Leu Asn Val Gln Gln Lys Tyr Lys Asp Gly

180 185 190

Asp Lys Gly Asp Asp Lys Thr Glu Asn Pro Leu Gln Arg Ile Asp Ala

195 200 205

Ala Leu Ala Gln Val Asp Ala Leu Arg Ser Asp Leu Gly Ala Val Gln

210 215 220

Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn

225 230 235 240

Leu Ser Glu Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu

245 250 255

Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser

260 265 270

Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu

275 280 285

Arg

<210> 29

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<223> His-tag

<400> 29

His His His His His His His His His His

1 5 10

<210> 30

<211> 159

<212> PRT

<213> Artificial Sequence

<220>

<223> CelTOS

<400> 30

Thr Phe Arg Gly Asn Asn Gly His Asn Ser Ser Ser Ser Leu Tyr Asn

1 5 10 15

Gly Ser Gln Phe Ile Glu Gln Leu Asn Asn Ser Phe Thr Ser Ala Phe

20 25 30

Leu Glu Ser Gln Ser Met Asn Lys Ile Gly Asp Asp Leu Ala Glu Thr

35 40 45

Ile Ser Asn Glu Leu Val Ser Val Leu Gln Lys Asn Ser Pro Thr Phe

50 55 60

Leu Glu Ser Ser Phe Asp Ile Lys Ser Glu Val Lys Lys His Ala Lys

65 70 75 80

Ser Met Leu Lys Glu Leu Ile Lys Val Gly Leu Pro Ser Phe Glu Asn

85 90 95

Leu Val Ala Glu Asn Val Lys Pro Pro Lys Val Asp Pro Ala Thr Tyr

100 105 110

Gly Ile Ile Val Pro Val Leu Thr Ser Leu Phe Asn Lys Val Glu Thr

115 120 125

Ala Val Gly Ala Lys Val Ser Asp Glu Ile Trp Asn Tyr Asn Ser Pro

130 135 140

Asp Val Ser Glu Ser Glu Glu Ser Leu Ser Asp Asp Phe Phe Asp

145 150 155

<210> 31

<211> 13

<212> PRT

<213> Artificial Sequence

<220>

<223> PADRE

<400> 31

Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala

1 5 10

<210> 32

<211> 15

<212> PRT

<213> Lymphocytic choriomeningitis virus

<400> 32

Leu Ile Asp Tyr Asn Lys Ala Ala Leu Ser Lys Phe Lys Glu Asp

1 5 10 15

<210> 33

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> alpha-helical segment

<400> 33

Glu Arg Arg Leu Glu Glu Leu

1 5

<210> 34

<211> 408

<212> PRT

<213> Artificial Sequence

<220>

<223> RR-SSIEF

<400> 34

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala

290 295 300

Ala Ser Ser Ile Glu Phe Ala Arg Leu Gln Phe Asp Asp Thr Glu Asn

305 310 315 320

Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala Leu Arg

325 330 335

Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn

340 345 350

Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg Ile Glu

355 360 365

Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile

370 375 380

Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro

385 390 395 400

Gln Asn Val Leu Ser Leu Leu Arg

405

<210> 35

<211> 37

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker replacing D2 and D3 of flagellin

<400> 35

Gln Leu Asn Val Gln Gln Ala Lys Phe Val Ala Ala Trp Thr Leu Lys

1 5 10 15

Ala Ala Ala Ser Ser Ile Glu Phe Ala Arg Leu Gln Phe Asp Asp Thr

20 25 30

Glu Asn Pro Leu Gln

35

<210> 36

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Modification of pentamer

<400> 36

Arg Ala Thr Trp

1

<210> 37

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified sequence in Trp-zipper

<400> 37

Asn Gln Arg Trp

1

<210> 38

<211> 28

<212> PRT

<213> Artificial Sequence

<220>

<223> Pan DR binding CD4 epitope string

<400> 38

Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu Asn Arg Met Val

1 5 10 15

Leu Gln Phe Val Arg Ala Leu Ser Met Gln Asn Ala

20 25

<210> 39

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> CpG ODN1585

<220>

<221> misc_feature

<222> (1)..(20)

<223> phosphorothioate bond between residues 1 and 2, between residues

15 and 16, between residues 16 and 17, between residues 17 and

18, between residues 18 and 19, and between residues 19 and 20

<400> 39

ggggtcaacg ttgagggggg 20

<210> 40

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Alanines

<400> 40

Ala Ala Ala Ala

1

<210> 41

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 41

Met Gly Gly Arg

1

<210> 42

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> CpG ODN 2006 (ODN 7909)

<220>

<221> misc_feature

<222> (1)..(24)

<223> all phosphorothioates bonds

<400> 42

tcgtcgtttt gtcgttttgt cgtt 24

<210> 43

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN 2216

<220>

<221> misc_feature

<222> (1)..(20)

<223> phosphorothioate bond between residues 1 and 2, between residues

15 and 16, between residues 16 and 17, between residues 17 and

18, between residues 18 and 19, and between residues 19 and 20

<400> 43

gggggacgat cgtcgggggg 20

<210> 44

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN 2336

<220>

<221> misc_feature

<222> (1)..(21)

<223> phosphorothioate bond between residues 1 and 2, etween residues 2

and 3, between residues 16 and 17, between residues 17 and 18,

between residues 18 and 19, between residues 19 and 20, and

between residues 20 and 21

<400> 44

ggggacgacg tcgtgggggg g 21

<210> 45

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN BW006

<220>

<221> misc_feature

<222> (1)..(23)

<223> all phosphorothioates bonds

<400> 45

tcgacgttcg tcgttcgtcg ttc 23

<210> 46

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN 2395

<220>

<221> misc_feature

<222> (1)..(22)

<223> all phosphorothioates bonds

<400> 46

tcgtcgtttt cggcgcgcgc cg 22

<210> 47

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN M362

<220>

<221> misc_feature

<222> (1)..(25)

<223> all phosphorothioates bonds

<400> 47

tcgtcgtcgt tcgaacgacg ttgat 25

<210> 48

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN D-SL03

<220>

<221> misc_feature

<222> (1)..(29)

<223> all phosphorothioates bonds

<400> 48

tcgcgaacgt tcgccgcgtt cgaacgcgg 29

<210> 49

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN D-SL01

<220>

<221> misc_feature

<222> (1)..(26)

<223> all phosphorothioates bonds

<400> 49

tcgcgacgtt cgcccgacgt tcggta 26

具体实施方式

图1:包封CpG的纳米粒子的单体的示意图。

下面是所述单体的构件:

·X1是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列。

·ND1是形成m个亚基ND1的寡聚物(ND1)m的卷曲螺旋,

·L1是具有+3的总正电荷的肽连接物,

·ND2是形成n个亚基ND2的寡聚物(ND2)n的卷曲螺旋,

·Y1不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列。

图2:DEDDLI-RR的分子模型。

A)带有相应激动剂的TLR5和TLR9受体的X-射线晶体结构:TLR5二聚体与两个鞭毛蛋白分子(黄色和洋红色)相互作用,而TLR9与CpG相互作用。B)左侧:自组装蛋白的单体构件,由his标签(X1)、五聚卷曲螺旋(ND1)、二聚卷曲螺旋(ND2)和鞭毛蛋白的D0和D1结构域(X2)构成。所述两个卷曲螺旋寡聚化结构域ND1和ND2通过具有三个正电荷的连接物(L1)联结。右侧:CpG分子。C)组装的蛋白质纳米粒子,其具有60个蛋白质链和包封在中央空腔中的约36个CpG分子。为更清晰起见,圆圈内部的蛋白质链(代表正电荷)未示出,以使粒子内(带负电荷的)CpG分子可见。注意,图A)、B)和C)中不是所有的结构都按尺寸绘制。

图3:pPEP-T的载体图谱。

“prom”:启动子;“term”:终止子;“ori”:原点;“bp”:碱基对;“amp”:氨苄青霉素抗性基因。

图4:构建物DEDDLI-RR的SDS-PAGE。

该构建物具有44.8kDa的理论分子量。

A)两种不同浓度的下述样品的表达水平

UI–未诱导的

I–诱导的

B)来自于FPLC的洗脱曲线。蛋白质用120至122mM咪唑洗脱。

C)Ni亲和纯化后的纯度。第1道:Mw标志物;CL:澄清的裂解液;第3至9道:流通液;第15至20道:洗脱峰。

D)将NHS-烟碱偶联到DEDDLI-RR之前(下图)和之后(上图)的质谱分析。

图5:包封和未包封在构建物DEDDLI-RR中的荧光标记的ODN1826F的相对荧光单位(RFU)。

单独的CpG-ODN1826F(黑色柱)和包封在SAPN DEDDLI-RR中的CpG-ODN1826F(虚线柱)的RFU值随不断提高的包封比的变化。注明了DEDDLI-RR的蛋白质链与ODN1826F的DNA链的摩尔比。

图6:荧光标记的ODN1826F在构建物DEDDLI-RR中包封后相对荧光单位(RFU)的差异。

单独的CpG-ODN1826F(黑色菱形)和对应于包封在DEDDLI-RR中的CpG的样品中的游离CpG的差值(虚线正方形)的RFU值随不断提高的包封比的变化。所述两条曲线近似重叠。

-RFU的差异值被计算为来自于以给定CpG包封比包封由CpG的DEDDLI-RR的信号减去1:0.6的包封比下的信号。

-“差值”曲线(虚线正方形)的比率值被计算为比率减去0.6。

图7:DEDDLI-RR的透射电子显微照片

在重组表达的蛋白质的重折叠和共同组装后,将样品吸附在碳涂层的网上并用2%乙酸双氧铀负染色。所述纳米粒子具有实施例1中描述的序列SEQ ID NO:1。上图和下图的条分别代表200nm和500nm。

图8:含有和不含包封的ODN1826的DEDDLI-RR的免疫应答。

在10μg和30μg两种蛋白质浓度下的三种注射方式(IM、IN和IV)各自具有它们相应的抗体滴度。对于10μg和30μg剂量来说,包封了0.85μg和2.56μg的CpG,其分别用“+”或“-”符合指示。抗体滴度在包被有BSA-烟碱、即共价偶联到BSA的烟碱的板上通过ELISA结合测定法来确定。在来自于免疫接种中包封的CpG的样品中可以观察到抗体滴度的显著提高。

图9:包封和未包封在构建物DEDDLI-RR、2RR和3RR中的荧光标记的ODN1826F的相对荧光单位(RFU)。

单独的CpG-ODN1826F(菱形)和包封在SAPN DEDDLI-RR(正方形)、2RR(三角形)和3RR(圆形)中的CpG-ODN1826F的RFU值随不断提高的包封比的变化。注明了DEDDLI-RR的蛋白质链与ODN1826F的DNA链的摩尔比。

◆单独的CpG(即未包封)

■DEDDLI-RR

▲2RR

●3RR

图10:包封和未包封有ODN1826的基于LIVELI的构建物的免疫应答。

将5只Balb/C小鼠的组各自用30μg的包封有(LIVELI1-RR和LIVELI2-RR)或未包封有CpG(LIVELI1和LIVELI2)的蛋白质药剂免疫接种。所述LIVELI1-RR和LIVELI2-RR药剂中包封的CpG的量为约2.5μg。提供三次肌肉内注射,各自相隔两周。在来自于包封的CpG的样品中可以观察到抗体滴度的显著提高。

图11:LIVELI1、LIVELI2、LIVELI1-RR和LIVELI2-RR的透射电子显微照片

在重组表达的蛋白质的重折叠和共同组装后,将样品吸附在碳涂层的网上并用2%乙酸双氧铀负染色。所述纳米粒子对应于A)LIVELI1、B)LIVELI2、C)LIVELI1-RR和D)LIVELI2-RR,并分别具有在实施例10中描述的序列SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:18和SEQ ID NO:19。所有图中的条都表示200nm。

图12:包封和未包封在构建物CC-RR中的荧光标记的ODN1826F的相对荧光单位(RFU)。

单独的CpG-ODN1826F(黑色柱)和包封在SAPN CC-RR中的CpG-ODN1826F(虚线柱)的RFU值随不断提高的包封比的变化。注明了DEDDLI-RR的蛋白质链与ODN1826F的DNA链的摩尔比。

图13:CC-RR-NN的分子模型。

A)第一自组装蛋白链的单体构件由his标签和CelTOS(X1)、第一卷曲螺旋结构域(ND1)、第二卷曲螺旋结构域(ND2)和第二CelTOS分子(Y1)构成,其中所述两个卷曲螺旋结构域通过具有三个正电荷的短肽连接物(L1)联结。B)第二自组装蛋白链的单体构件由his标签和CelTOS(X2)、第一卷曲螺旋结构域(ND3)、第二卷曲螺旋结构域(ND4)和鞭毛蛋白的D0和D1结构域(Y2)构成,其中所述两个卷曲螺旋结构域通过具有三个正电荷的短肽连接物(L2)联结。C)CpG分子(对于图A和B来说不是按尺寸绘制的)。在重折叠期间,共同组装和包封同时发生。D)组装的蛋白质纳米粒子具有第一和第二蛋白质链的共同组装比为58:2的60个蛋白质链和包封在中央空腔中的约36个CpG分子。为更清晰起见,圆圈内部的蛋白质链(代表正电荷)未示出,以使粒子内(带负电荷的)CpG分子可见。E)包封有CpG的共同组装的SAPN的透射电子显微照片。条表示100nm。

图14:RR-SSIEF的透射电子显微照片。

在重组表达的蛋白质的重折叠后,将样品吸附在碳涂层的网上并用2%乙酸双氧铀负染色。所述纳米粒子对应于RR-SSIEF,具有实施例12中描述的序列SEQ ID NO:34,并包封有CpGODN1585(SEQ ID NO:39)。条表示200nm。

发明详述

在本发明中,描述了内置在SAPN的结构体系中,旨在将核酸包封在所述SAPN中的DNA和/或RNA结合位点。所述SAPN被描述在例如Raman S.K.等,Nanomed 2006,2(2):95-102;Pimentel T.A.等,Chem Biol Drug Des.2009.73(1):53-61;Indelicato,G.等,Biophys J.2016,110(3):646-660;Karch,C.P.等,Nanomedicine 2016,13(1):241-251中。所述SAPN也被描述在WO2004071493、WO2009109428和WO2015104352中。第一方面,本发明涉及一种用于在对象中诱导免疫应答的组合物,所述组合物包含:

(a)由多个下式(I)的构件构成的自组装蛋白纳米粒子(SAPN),

X1–ND1–L1–ND2–Y1 (I),

所述式(I)的构件由包含卷曲螺旋寡聚化结构域ND1、连接物L1、卷曲螺旋寡聚化结构域ND2和其他取代基X1和Y1的连续链构成,其中

ND1是包含m个亚基ND1的寡聚物(ND1)m的卷曲螺旋寡聚化结构域,

ND2是包含n个亚基ND2的寡聚物(ND2)n的卷曲螺旋寡聚化结构域,

m和n各自为2至10之间的数字,前提是m不等于n并且不是n的倍数,并且n不是m的倍数,

L1是在生理条件下具有至少+2的总正电荷的肽连接物,

X1不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

Y1不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

其中所述多个式(I)的构件任选地与多个式(II)的构件共同组装,

X2–ND3–L2–ND4–Y2 (II)

所述式(II)的构件由包含卷曲螺旋寡聚化结构域ND3、连接物L2、卷曲螺旋寡聚化结构域ND4和其他取代基X2和Y2的连续链构成,其中

ND3是包含y个亚基ND3的寡聚物(ND3)y的卷曲螺旋寡聚化结构域,

ND4是包含z个亚基ND4的寡聚物(ND4)z的卷曲螺旋寡聚化结构域,

y和z各自为2至10之间的数字,前提是y不等于z并且不是z的倍数,并且z不是y的倍数,并且其中

ND3与ND1一致,或者ND4与ND2一致,或者ND3和ND4两者分别与ND1和ND2一致,

L2是在生理条件下具有至少+2的总正电荷的肽连接物,

X2不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

Y2不存在,或者是包含可以被进一步取代的1至1000个氨基酸的肽或蛋白质序列,

(b)免疫刺激性物质,其中所述免疫刺激性物质是核酸衍生物,其中所述核酸衍生物被包封在所述SAPN中。

现在已令人吃惊地发现,如果将所述SAPN的两个寡聚化结构域相连接的连接物含有带正电荷的氨基酸区段,由此为所述连接物提供至少+2的总电荷,则带负电荷的核酸可以被包封在所述SAPN内。这是因为所述带有正电荷的连接物被方便地定向到所述SAPN的中央空腔,由此为所述中央空腔提供了带正电荷的表面包层,类似于病毒衣壳的包封病毒的基因组材料的带正电荷的空腔。然而,这是出人意料的,因为在具有T1二十面体对称的SAPN中,60个蛋白质链组装成所述SAPN,因此使用每个连接物至少两个正电荷时,多达120个正电荷将排列成所述中央空腔的相对小的空间,产生显著的排斥力,阻碍重折叠期间SAPN的形成。

值得注意的是,这种核酸在SAPN中的包封不需所述核酸与所述SAPN的任何特殊的化学附连。当在重折叠之前向重折叠缓冲液添加所述核酸,然后使用常规的重折叠流程在所述核酸存在下重折叠所述SAPN时,发生所述核酸的包封。

可以包封在所述SAPN中的具体核酸可能具有免疫刺激性质。例如,在免疫接种流程中使用包封有CpG的SAPN,显著提高了总体免疫应答。因此,本发明的SAPN提供了高效增强免疫应答以及因此基于SAPN的疫苗的免疫原性的简洁方式。

单体构件

肽(或多肽或蛋白质)是通过酰胺键共价连接的氨基酸的链或序列。肽可以是天然的、修饰的天然的、部分合成的或全合成的。修饰的天然的、部分合成的或全合成的被理解为意味着在自然界中不存在。术语氨基酸涵盖了选自20种必需的天然α–L-氨基酸的天然存在的氨基酸、合成的氨基酸例如α–D-氨基酸、6-氨基己酸、正亮氨酸、高半胱氨酸等,以及以某些方式进行修饰以改变某些性质如电荷的天然存在的氨基酸,例如磷酸丝氨酸或磷酸酪氨酸或其他修饰例如n-辛酰基-丝氨酸等。氨基酸的衍生物是其中例如形成酰胺键的氨基被烷基化,或侧链氨基、羟基或巯基被烷基化或酰化,或侧链羧基被酰胺化或酯化的氨基酸。优选地,本发明的肽或蛋白质包含选自20种必需的天然α–L-氨基酸的氨基酸。

粗略来说,肽与蛋白质可以在它们的尺寸的基础上区分开,即大约50个或更少氨基酸的链可以被认为是肽,而更长的链可以被认为是蛋白质。因此,当在本文中使用时,术语“肽”是指50个或更少氨基酸的氨基酸链,优选地是指2至50个氨基酸的氨基酸链,当在本文中使用时,术语“蛋白质”是指超过50个氨基酸的氨基酸链,优选地是指51至10000个氨基酸的氨基酸链。二肽是最短的肽,并由通过单个肽键连接的两个氨基酸构成。同样地,三肽由三个氨基酸构成,四肽由四个氨基酸构成,等等。多肽是长的、连续的且无分支的肽链。在文献中,区分肽与蛋白质的尺寸界限多少有些模糊。有时长的“肽”例如β淀粉样肽被当作蛋白质,并且反过来较小的蛋白质例如胰岛素被称为肽。

根据本发明的寡聚化结构域是卷曲螺旋。卷曲螺旋是具有主要疏水的残基被3和4个残基隔开的邻近模式的蛋白质序列,其组装以形成多聚体螺旋束,正如将在下文中更详细解释的。

式(I)的单体构件的组分ND1、ND2、X1和Y1和/或式(II)的单体构件的组分(ND3、ND4、X2和Y2),可能任选地被靶向实体或加强所述纳米粒子的辅助性质的取代基进一步取代。取代意味着将所述单体构件上的一个化学基团用另一个化学基团代替,产生共价连接到所述单体构件的取代基。这些取代基可以是免疫刺激性核酸,优选为含有脱氧肌苷的寡脱氧核苷酸、含有脱氧尿苷的寡脱氧核苷酸、含有CG基序的寡脱氧核苷酸、CpG、咪喹莫特、瑞喹莫德、嘎德莫特、含有肌苷和胞苷的核酸分子等。被当作取代基的特定靶向基团是靶向ER的信号,即引起蛋白质或肽向内质网(ER)的运输的信号肽。

在优选实施方式中,所述式(I)或(II)的构件包含取代基X1或取代基Y1或取代基X2或取代基Y2。

在另一个优选实施方式中,所述式(I)或(II)的构件包含取代基X1和Y1或取代基X2和Y2。因此,在最优选实施方式中,所述取代基X1、X2、Y1或Y2是代表了蛋白质链通常在一个末端处、优选地在两个末端处的延长的肽或蛋白质取代基,例如X1–ND1–L1–ND2–Y1或X2–ND3–L2–ND4–Y2,以产生组合的单一连续蛋白质序列。方便的是,这种单一连续蛋白质链可以在重组蛋白表达系统中作为单一分子表达。彼此独立地形成的取代基X1、Y1、X2和Y2是包含1至1000个氨基酸的肽或蛋白质序列,优选为对应于完全折叠的蛋白质或蛋白质结构域作为B-细胞表位或鞭毛蛋白或其如WO2015104352中所描述的4个结构域的子集被用于增强免疫应答的序列。

鞭毛蛋白具有由4个结构域D0、D1、D2和D3构成的分子结构体系。所述蛋白质链始于D0结构域中的N-端并通过结构域D1、D2和D3运行一大圈到达所述分子的顶端,在那里它折返并运行通过D3、D2和D1,以将它在D0结构域中的C-端末端带到非常靠近于所述N-端末端。鞭毛蛋白具有两种先天性免疫系统的活化方式。第一种方式是主要通过它的D1结构域的高度保守的部分结合到TLR5受体(Yoon等,同前)。另一种活化方式是主要通过它的D0结构域的高度保守的C-端部分与炎性体相互作用(Lightfield K.L.等,Nat Immunol.2008,9:1171-8)。

因此,在优选实施方式中,取代基X1、Y1、X2和Y2中的至少一者是全长鞭毛蛋白例如全长鼠伤寒沙门氏菌(Salmonella typhimurium)鞭毛蛋白或只包含2或3个结构域的鞭毛蛋白,优选为至少包含TLR5结合结构域D1的鞭毛蛋白,更优选为包含D0和D1结构域的鞭毛蛋白,特别是SEQ ID NO:6中所示的鞭毛蛋白。丢失的结构域可以被联结剩余鞭毛蛋白序列的两个末端的1至20个氨基酸的柔性连接物区段取代,或者它们可以被完全折叠的蛋白质抗原代替。在优选实施方式中,所述柔性连接物包含如SEQ ID NO:9中所示的氨基酸序列。所述柔性连接物区可以含有适合的附连位点,用于抗原的共价偶联。因此,缺少鞭毛蛋白的D2和D3结构域的鞭毛蛋白衍生构建物可以简单地通过在所述D1和D2结构域的接口处连接所述蛋白质链,很容易地工程化。类似地,顶端结构域(D3,或D2与D3合在一起)可以被蛋白质抗原代替,只要该具有N-和C-端的蛋白质抗原可以在D1与D2之间的接口处连接到所述N-和C-端即可。所述顶端结构域D2和D3也可以被具有用于抗原分子的共价偶联的适合残基的肽序列代替。

在另一个优选实施方式中,X1、Y1、X2和Y2也可以彼此独立地包含一串一个或多个CD4或CD8表位。在另一个优选实施方式中,X1、Y1、X2和Y2可以彼此独立地包含一种或多种这些类型的免疫相关肽和蛋白质序列的组合。

形成寡聚物的倾向性意味着这些蛋白质可以根据条件形成寡聚物,例如在变性条件下它们是单体,而在生理条件下它们可能形成例如二聚体、三聚体、四聚体或五聚体。在预定条件下,它们采取纳米粒子形成所需的单一寡聚化状态。然而,在改变条件后它们的寡聚化状态可能改变,例如在降低盐浓度后从三聚体变成二聚体(Burkhard P.等,ProteinScience 2000,9:2294-2301)或在降低pH后从五聚体变成单体。

式(I)或(II)的构件结构体系明显有别于病毒衣壳蛋白。病毒衣壳或者由单一蛋白质构成,其形成60或其倍数的寡聚物,例如乙肝病毒粒子(EP 1 262 555、EP 0 201416),或者由超过一种蛋白质构成,它们共同组装以形成病毒衣壳结构,其取决于病毒的类型也可以采取二十面体之外的其他几何形状(Fender P.等,Nature Biotechnology 1997,15:52-56)。本发明的SAPN也明显有别于病毒样粒子,因为它们(a)由病毒衣壳蛋白之外的蛋白质构造而成,并且(b)所述纳米粒子中间的空腔太小而不能容纳整个病毒基因组的DNA/RNA。

蛋白质寡聚化结构域是公知的(Burkhard P.等,Trends Cell Biol 2001,11:82-88)。在本发明中,所述寡聚化结构域是卷曲螺旋结构域。卷曲螺旋是具有主要疏水的残基被3和4个残基隔开的连续模式的蛋白质序列,通常在7个氨基酸(七肽重复序列)或11个氨基酸(十一肽重复序列)的序列中,其组装(折叠)以形成多聚体螺旋束。也设想了具有包括所述3和4个残基间隔的一些不规则分布的序列的卷曲螺旋。疏水残基具体来说是疏水性氨基酸Val、Ile、Leu、Met、Tyr、Phe和Trp。主要疏水意味着至少50%的所述残基必须选自提到的疏水性氨基酸。

七肽重复序列和卷曲螺旋

例如,在式(I)和/或(II)的优选单体构件中,ND1、ND2、ND3和/或ND4包含七肽重复序列或十一肽重复序列,更优选为七肽重复序列,特别是任何下式的蛋白质:

[aa(a)-aa(b)-aa(c)-aa(d)-aa(e)-aa(f)-aa(g)]X (IIIa),

[aa(b)-aa(c)-aa(d)-aa(e)-aa(f)-aa(g)-aa(a)]X (IIIb),

[aa(c)-aa(d)-aa(e)-aa(f)-aa(g)-aa(a)-aa(b)]X (IIIc),

[aa(d)-aa(e)-aa(f)-aa(g)-aa(a)-aa(b)-aa(c)]X (IIId),

[aa(e)-aa(f)-aa(g)-aa(a)-aa(b)-aa(c)-aa(d)]X (IIIe),

[aa(f)-aa(g)-aa(a)-aa(b)-aa(c)-aa(d)-aa(e)]X (IIIf),

[aa(g)-aa(a)-aa(b)-aa(c)-aa(d)-aa(e)-aa(f)]X (IIIg),

其中aa意味着氨基酸或其衍生物,aa(a)、aa(b)、aa(c)、aa(d)、aa(e)、aa(f)和aa(g)是相同或不同的氨基酸或其衍生物,优选地aa(a)和aa(d)是相同或不同的疏水性氨基酸或其衍生物;并且x是2至20之间、优选地3至10之间的数字。

七肽是式aa(a)-aa(b)-aa(c)-aa(d)-aa(e)-aa(f)-aa(g)(IIIa)或其式(IIIb)至(IIIg)的排列的任一者的七肽。

优选的是式(I)或(II)的单体构件,其中所述寡聚化结构域ND1、ND2、ND3和/或ND4包含:

(1)式(IIIa)至(IIIg)任一者的蛋白质,其中x是3,并且aa(a)和aa(d)选自20种天然α–L-氨基酸,使得这6个氨基酸的来自于表1的评分之和为至少14,并且这些蛋白质包含至多17个另外的七肽;或

(2)式(IIIa)至(IIIg)任一者的蛋白质,其中x是3,并且aa(a)和aa(d)选自20种天然α–L-氨基酸,使得这6个氨基酸的来自于表1的评分之和为至少12,前提是一个氨基酸aa(a)是能够与相邻七肽的氨基酸aa(d)或aa(g)形成螺旋间盐桥的带电荷氨基酸,或者一个氨基酸aa(d)是能够与相邻七肽的氨基酸aa(a)或aa(e)形成螺旋间盐桥的带电荷氨基酸,并且这些蛋白质包含至多2个其他七肽。能够与相邻七肽的氨基酸形成螺旋间盐桥的带电荷氨基酸是例如Asp或Glu,如果所述另一个氨基酸是氨基酸Lys、Arg或His的话;或正好相反。

表1:用于确定偏好性(卷曲螺旋倾向性)的氨基酸的评分

此外,优选的是式(I)或(II)的单体构件,其中所述蛋白质寡聚化结构域ND1、ND2、ND3和/或ND4包含选自下述优选蛋白质的蛋白质:

(11)式(IIIa)至(IIIg)任一者的蛋白质,其中

aa(a)选自Val、Ile、Leu和Met及其衍生物,并且

aa(d)选自Leu、Met、Val和Ile及其衍生物。

(12)式(IIIa)至(IIIg)任一者的蛋白质,其中一个aa(a)是Asn并且其他aa(a)选自Asn、Ile和Leu,并且aa(d)是Leu。这种蛋白质通常是二聚化结构域。

(13)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)和aa(d)两者都是Leu或两者都是Ile。这种蛋白质通常是三聚化结构域。

(14)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)和aa(d)两者都是Trp。这种蛋白质通常是五聚化结构域。

(15)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)和aa(d)两者都是Phe。这种蛋白质通常是四聚化结构域。

(16)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)和aa(d)两者是Trp或Phe。这种蛋白质通常是五聚化结构域。

(17)式(IIIa)至(IIIg)任一者的蛋白质,其中aa(a)是Leu或Ile,并且一个aa(d)是Gln,并且其他aa(d)选自Gln、Leu和Met。这种蛋白质具有成为五聚化结构域的潜力。

其他优选的蛋白质是如上文中所定义的蛋白质(1)、(2)、(11)、(12)、(13)、(14)、(15)、(16)和(17),并且其中另外地:

(18)至少一个aa(g)选自Asp和Glu,并且后一个七肽中的aa(e)是Lys、Arg或His;和/或

(19)至少一个aa(g)选自Lys、Arg和His,并且后一个七肽中的aa(e)是Asp或Glu;和/或

(20)至少一个aa(a至g)选自Lys、Arg和His,并且所述序列中相隔3或4个氨基酸的aa(a至g)是Asp或Glu。这样的成对氨基酸aa(a至g)是例如aa(b)与aa(e)或aa(f)。

卷曲螺旋预测程序例如PCOILS(http://toolkit.tuebingen.mpg.de/pcoils;Gruber M.等,J.Struct.Biol.2006,155(2):140-5)或MULTICOIL(http:// groups.csail.mit.edu/cb/multicoil/cgi-bin/multicoil.cgi)可以预测形成卷曲螺旋的蛋白质序列。因此,在式(I)或(II)的单体构件中,ND1、ND2、ND3和/或ND4包括含有至少一个2个七肽重复序列长的序列的蛋白质,所述序列通过卷曲螺旋预测程序PCOILS预测对于它的具有至少一个14、21或28的窗口尺寸的所有氨基酸来说,以高于0.9的概率形成卷曲螺旋。

在更优选的式(I)或(II)的单体构件中,ND1、ND2、ND3和/或ND4包括含有至少一个3个七肽重复序列长的序列的蛋白质,所述序列通过卷曲螺旋预测程序PCOILS预测对于它的具有至少一个14、21或28的窗口尺寸的所有氨基酸来说,以高于0.9的概率形成卷曲螺旋。

在另一个更优选的式(I)或(II)的单体构件中,ND1、ND2、ND3和/或ND4包括含有至少两个分开的2个七肽重复序列长的序列的蛋白质,所述序列通过卷曲螺旋预测程序PCOILS预测对于它的具有至少一个14、21或28的窗口尺寸的所有氨基酸来说,以高于0.9的概率形成卷曲螺旋。

RCSB结构数据库

已知的卷曲螺旋序列可以从数据库例如RCSB蛋白质数据库(http://www.rcsb.org)检索。

五聚卷曲螺旋

五聚卷曲螺旋可以通过使用识别名称“蛋白质对称性是环状-C5”搜索生物组装中的对称性并与文本搜索“卷曲”或“拉链”相组合,从RCSB数据库(http://www.rcsb.org/pdb/)检索。适合的条目的名单含有4PN8、4PND、4WBA、3V2N、3V2P、3V2Q、3V2R、4EEB、4EED、3MIW、1MZ9、1FBM、1VDF、2GUV、2HYN、1ZLL、1T8Z。

四聚、三聚和二聚卷曲螺旋

同样地,四聚卷曲螺旋可以使用“蛋白质对称性是环状-C4”来检索,三聚卷曲螺旋可以使用“蛋白质对称性是环状-C3”来检索,并且二聚卷曲螺旋使用“蛋白质对称性是环状-C2”来检索,其各自与文本搜索“卷曲”或“拉链”相组合。

对于四聚卷曲螺旋来说,得到下述适合的条目:5D60,5D5Y,5AL6,4WB4,4BHV,4C5Q,4GJW,4H7R,4H8F,4BXT,4LTO,4LTP,4LTQ,4LTR,3ZDO,3RQA,3R4A,3R4H,3TSI,3K4T,3F6N,2O6N,2OVC,2O1J,2O1K,2AG3,2CCE,1YBK,1U9F,1U9G,1U9H,1USD,1USE,1UNT,1UNU,1UNV,1UNW,1UNX,1UNY,1UNZ,1UO0,1UO1,1UO2,1UO3,1UO4,1UO5,1W5I,1W5L,1FE6,1G1I,1G1J,1EZJ,1RH4,1GCL。

对于三聚卷曲螺旋来说,得到下述适合的条目:5TOH,5TOI,5K92,5KB0,5KB1,5KB2,5KKV,5EFM,2N64,5ABS,5IEA,5APP,5APQ,5APS,5APY,5APZ,5D5Z,4YPC,4YV3,4CGB,4CGC,4CJD,4R0R,4UW0,4P67,4OXM,3W8V,3W92,3W93,4I2L,4K8U,4JBZ,3VTQ,4L1R,4JDO,4J4A,4E52,3VYI,3ZMF,3VU5,3VU6,2YNY,2YNZ,2YO0,2YO1,2YO2,4G1A,4GIF,3TQ2,4DZK,4DZL,4DZN,3TE3,3R48,3SWF,3SWY,3PR7,2YKO,2YKP,2YKQ,3NTN,3PP5,3MKO,3MGN,3NWA,3NWD,3NWF,3L35,3L36,3L37,3M9B,3M9D,2X6P,3LJM,3AHA,3H7X,3H7Z,3LT6,3LT7,3GJP,2KP8,3KPE,2WPR,2WPS,2WPY,2WPZ,2WQ0,2WQ1,2WQ2,2WQ3,3HFC,3HFE,3HRN,3HRO,3H5F,3H5G,2WG5,2WG6,2W6B,2JJL,2VRS,3EFG,3DUZ,2OT5,2Z2T,2QIH,3BK6,2O7H,2R32,2JGO,2Q7C,2Q3I,2Q5U,2IBL,1ZV8,1ZVB,2FXP,1WT6,2AKF,1TGG,1SLQ,1S9Z,1PW9,1PWB,1M7L,1GZL,1KYC,1KFM,1KFN,1IJ0,1IJ1,1IJ2,1IJ3,1HQJ,1QU1,1B08,1CZQ,1CUN,1SVF,1CE0,1PIQ,1AQ5,1AVY,1HTN,1AA0,1ZIJ,1ZIM,1COI,1SWI,1GCM,1HUP。

对于二聚卷曲螺旋来说,得到下述适合的条目:5M97,5M9E,5FIY,5F4Y,5D3A,5HMO,5EYA,5IX1,5IX2,5JHF,5JVM,5JVP,5JVR,5JVS,5JVU,5JX1,5FCN,5HHE,2N9B,4ZRY,4Z6Y,4YTO,4ZI3,5AJS,5F3K,5F5R,5HUZ,5DJN,5DJO,5CHX,5CJ0,5CJ1,5CJ4,5C9N,5CFF,4WHV,3WUT,3WUU,3WUV,4ZQA,4XA3,4XA4,4PXJ,4YVC,4YVE,5BML,5AL7,4WOT,4CG4,5AMO,4WII,4WIK,4RSJ,4CFG,4R3Q,4WID,4CKG,4CKH,4NSW,4W7P,4QQ4,4OJK,4TL1,4OH9,4LPZ,4Q62,4L2W,4M3L,4CKM,4CKN,4N6J,4LTB,4LRZ,2MAJ,2MAK,4NAD,4HW0,4BT8,4BT9,4BTA,4HHD,4M8M,4J3N,4L6Q,4C1A,4C1B,4GDO,4BWK,4BWP,4BWX,4HU5,4HU6,4L9U,4G0U,4G0V,4G0W,4L3I,4G79,4GEU,4GEX,4GFA,4GFC,4BL6,4JMR,4JNH,2YMY,4HAN,3VMY,3VMZ,3VN0,4ABX,3W03,2LW9,4DZM,4ETO,3TNU,3THF,4E8U,3VMX,4E61,3VEM,3VBB,4DJG,3TV7,3STQ,3V8S,3Q8T,3U1C,3QH9,3AZD,3ONX,3OKQ,3QX3,3SJA,3SJB,3SJC,2L2L,3QFL,3QKT,2XV5,2Y3W,3Q0X,3AJW,3NCZ,3NI0,2XU6,3M91,3NMD,3LLL,3LX7,3ME9,3MEU,3MEV,3ABH,3ACO,3IAO,3HLS,2WMM,3A6M,3A7O,2WVR,3ICX,3ID5,3ID6,3HNW,3I1G,2K6S,3GHG,3G1E,2W6A,2V51,3ERR,3E1R,2VY2,2ZR2,2ZR3,3CL3,3D9V,2Z17,2JEE,3BBP,3BAS,3BAT,2QM4,2V71,2NO2,2PON,2V0O,2DQ0,2DQ3,2Q2F,2NRN,2E7S,2H9V,2FXM,2HJD,2GZD,2GZH,2FV4,2F2U,2EUL,2ESM,2ETK,2ETR,1ZXA,1YIB,1YIG,1XSX,1RFY,1U0I,1XJA,1T3J,1T6F,1R7J,1UII,1PL5,1S1C,1P9I,1R48,1URU,1OV9,1UIX,1NO4,1NYH,1MV4,1LR1,1L8D,1LJ2,1KQL,1GXK,1GXL,1GK6,1JR5,1GMJ,1JAD,1JCH,1JBG,1JTH,1JY2,1JY3,1IC2,1HCI,1HF9,1HBW,1FXK,1D7M,1QUU,1CE9,2A93,1BM9,1A93,1TMZ,2AAC,1ZII,1ZIK,1ZIL,2ARA,2ARC,1JUN,1YSA,2ZTA。然而,这个二聚结构的名单也含有反平行的卷曲螺旋,因为具有环状双重对称的二聚卷曲螺旋选择平行和反平行卷曲螺旋。所述结构的目测检查可以容易地将平行与反平行二聚卷曲螺旋区分开。

这些五聚、四聚、三聚和二聚卷曲螺旋条目中的某些也含有其他的蛋白质结构域,但是在目测检查后,那些其他的结构域可以被容易地检测并移除。

作为可替选方案,网站http://coiledcoils.chm.bris.ac.uk/ccplus/search/ periodic_table/提供了卷曲螺旋结构的周期表,从其可以检索二聚、三聚、四聚和五聚(例如2GUV)卷曲螺旋。

也设想了这些五聚、四聚、三聚和二聚卷曲螺旋结构域的氨基酸修饰。这些修饰可以是例如在所述寡聚物外部在aa(e)、aa(g)、aa(b)、aa(c)或aa(f)位置处,优选地在aa(b)、aa(c)或aa(f)位置处,最优选地在aa(f)位置中,作为非核心残基(aa(a)和aa(d))的氨基酸的取代。可能的修饰是取代为带电荷的残基以使这些寡聚物更加可溶。此外,设想了这些结构域的更短的构建物。

其他氨基酸修饰可以是例如出于使所述寡聚物稳定的目的取代核心位置处的氨基酸(aa(a)和aa(d)),即通过将不太有利的核心残基用更有利残基代替,即一般而言,如果它们不改变所述卷曲螺旋的寡聚化状态的话,可以将核心位置处根据表1具有较低卷曲螺旋倾向性的残基用具有较高卷曲螺旋倾向性的残基代替。

本文中使用的术语“氨基酸修饰”包括多肽序列中的氨基酸取代、***和/或缺失。本文中的“氨基酸取代”或“取代”意味着将母体多肽序列中特定位置处的氨基酸用另一个氨基酸代替。例如,取代R94K是指变体多肽,其中第94位处的精氨酸被赖氨酸代替。处于本文的目的,多个取代通常用斜线隔开。例如,R94K/L78V是指包含取代R94K和L78V的双重变体。当在本文中使用时,“氨基酸***”或“***”意味着在母体多肽序列中的特定位置处氨基酸的添加。例如***-94是指在在第94位处的***。当在本文中使用时,“氨基酸缺失”或“缺失”意味着在母体多肽序列中的特定位置处氨基酸的移除。例如,R94-是指在第94位处精氨酸的缺失。

含有本文中所描述的氨基酸修饰的肽或蛋白质优选地与母体(未修饰的)肽或蛋白质具有至少约80%、最优选地至少约90%、更优选地至少约95%、特别是99%的氨基酸序列同一性。优选地,所述氨基酸修饰是保守修饰。

当在本文中使用时,术语“保守修饰”或“保守的序列修饰”打算是指不显著影响或改变含有所述氨基酸序列的抗体的结合特性的氨基酸修饰。这些保守修饰包括氨基酸取代、***和缺失。可以通过本领域中已知的标准技术例如定点突变和PCR介导的突变将修饰引入到本发明的蛋白质中。保守氨基酸取代是其中将氨基酸残基用具有相似侧链的氨基酸残基代替的取代。具有相似侧链的氨基酸残基的家族在本领域中已被定义。这些家族包括具有碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、色氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸)、β分支侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。

具体的卷曲螺旋

最优选的是在实施例中描述的卷曲螺旋序列和单体构件。

连接物

所述连接物将所述两个卷曲螺旋寡聚化结构域从所述第一寡聚化结构域的最后一个核心残基(aa(a)或aa(d))连接到所述第二卷曲螺旋寡聚化结构域的第一个核心残基(aa(a)或aa(d))。

肽连接物L1和/或L2通常由具有3至50个氨基酸、优选地具有3至10个氨基酸、更优选地具有4至9个氨基酸的肽链构成。在优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由至少2个氨基酸、至少4个氨基酸、至少5个氨基酸、至少6个氨基酸、至少7个氨基酸、至少8个氨基酸、至少9个氨基酸或至少10个氨基酸构成。在更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由至少4个氨基酸、至少7个氨基酸或至少9个氨基酸构成。在甚至更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由至少4个氨基酸构成。

在另一个优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由2个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸或10个氨基酸构成。在更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由4个氨基酸、7个氨基酸或9个氨基酸构成。在甚至更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由4个氨基酸构成。

在特定实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地包含选自SEQID NO:4中所示的氨基酸序列、SEQ ID NO:12中所示的氨基酸序列、SEQ ID NO:14中所示的氨基酸序列和SEQ ID NO:15中所示的氨基酸序列的氨基酸序列,优选为SEQ ID NO:4中所示的氨基酸序列和SEQ ID NO:12中所示的氨基酸序列,更优选为SEQ ID NO:4中所示的氨基酸序列。

所述肽连接物L1和/或L2通常彼此独立地在生理条件下含有2至10个之间、优选地3至7个之间的正电荷。生理条件对应于在水性溶液中,6.5至8.5的pH,优选地约7.0至7.6的pH的条件。在优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有至少2个正电荷、至少3个正电荷、至少4个正电荷、至少5个正电荷、至少6个正电荷、至少7个正电荷、至少8个正电荷、至少9个正电荷或至少10个正电荷。在更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有至少3个正电荷、至少5个正电荷或至少7个正电荷。在甚至更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有至少3个正电荷。

在另一个优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有2个正电荷、3个正电荷、4个正电荷、5个正电荷、6个正电荷、7个正电荷、8个正电荷、9个正电荷或10个正电荷。在更优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有3个正电荷、5个正电荷或7个正电荷。在甚至更优选的实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有3个正电荷。

在优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地含有至少一个甘氨酸残基例如RRGR(SEQ ID NO:4)或KKGK(SEQ ID NO:12)。

在优选实施方式中,所述肽连接物L1和/或肽连接物L2彼此独立地由至少4个氨基酸构成,并且在生理条件下具有至少+3的总正电荷。

在优选实施方式中,所述肽连接物L1和肽连接物L2是一致的。

核酸衍生物

当在本文中使用时,术语核酸衍生物包括含有胞嘧啶紧随其后是鸟嘌呤(其中所述胞嘧啶核苷酸是未甲基化的)的单链DNA、来自于RNA病毒的单链RNA、来自于RNA病毒的双链RNA和模拟来自于RNA病毒的双链RNA的聚合复合物。

模拟双链RNA(dsRNA)的聚合复合物是例如polyI:polyC(pIC),其是优选的。pIC是模拟双链RNA(dsRNA)的大的合成聚合复合物。pIC的制备物在链长分布、溶解性和其他生物学性质包括毒性方面各不相同。

含有胞嘧啶紧随其后是鸟嘌呤(其中所述胞嘧啶核苷酸是未甲基化的)的单链DNA通常是CpG寡脱氧核苷酸(CpG ODN)。

作为合成分子的CpG寡脱氧核苷酸(CpG ODN)与天然的微生物DNA的差异在于代替典型的磷酸二酯骨架,它们具有完全或部分硫代磷酸酯骨架和任选地在5'末端、3'末端具有poly G尾。所述poly G尾形成分子间四联体,其产生高分子量聚集体,从而提高细胞摄取,而使用硫代磷酸酯的修饰保护所述ODN免于被体内核酸酶例如DNase降解。

已显示出许多不同的序列刺激TLR9,它们在CpG二聚体的数目和位置以及所述CpG二聚体侧翼的具体碱基序列方面各不相同。它们可以被分类为5个非正式的CpG ODN类别或门类。这些类别是基于它们的序列、二级结构和对人外周血单核细胞(PBMC)的效应,并被称为A类(D型)、B类(K型)、C类、P类和S类。

A类ODN与B类ODN的明显差异在于它刺激产生大量的I型干扰素,最重要的是IFNα,并诱导浆细胞样树突状细胞的成熟。A类ODN通过间接细胞因子信号传导,也是NK细胞的强活化剂。另一方面,B类ODN是人单核细胞和B细胞成熟的强刺激剂。尽管它们也刺激浆细胞样树突状细胞的成熟,但它们的这种作用的程度低于A类ODN。它们也刺激非常少量的IFNα。

A类

ODN 2216是一种A类CpG ODN,并且是人TLR9选择的配体。它是20mer,具有序列5’-ggGGGACGA:TCGTCgggggg-3’(SEQ ID NO:43)。用大写字母示出的碱基是磷酸二酯,用小写字母示出的是抗核酸酶的硫代磷酸酯。回文序列加下划线。ODN 2336是另一种A类CpG ODN,对人TLR9具有偏好性。它是21mer,具有序列5’-gggGACGAC:GTCGTGgggggg-3’(SEQ ID NO:44)。

B类

ODN 1826是一种对鼠类TLR9特异的B类CpG ODN。它是20mer,具有序列5’-tccatgacgttcctgacgtt-3’(SEQ ID NO:13)。所有碱基都是抗核酸酶的硫代磷酸酯。ODN2006是一种B类CpG ODN,并且是人TLR9选择的配体。它是24mer,具有序列5’-tcgtcgttttgtcgttttgtcgtt-3’(SEQ ID NO:42)。ODN BW006是另一种B类CpG ODN,并含有两份人中的最优基序GTCGTT。它是23mer,具有序列5’-tcgacgttcgtcgttcgtcgttc-3’(SEQID NO:45)。另一种B类CpG是ODN D-SL01。它是多样的脊椎动物物种即人、小鼠、大鼠、兔、猪和狗中的TLR9激动剂,并具有序列5’-tcgcgacgttcgcccgacgttcggta-3’(SEQ ID NO:49)(26mer)。

C类

ODN 2395是一种对人和小鼠TLR9特异的C类CpG ODN。作为C类CpG ODN,它含有完全硫代磷酸酯骨架和含有CpG的回文基序。C类CpG ODN诱导IFN-α从pDC的强烈生产和B细胞刺激。它是22mer,具有序列5’-tcgtcgttttcggcgc:gcgccg-3’(SEQ ID NO:46)。所有碱基都是硫代磷酸酯,并且回文序列加下划线。ODN M362是另一种对人和小鼠TLR9特异的C类CpGODN。它是25mer,具有序列5’-tcgtcgtcgttc:gaacgacgttgat-3’(SEQ ID NO:47)。另一种C类CpG ODN是ODN D-SL03。它是多样的脊椎动物物种即人、小鼠、大鼠、兔、猪和狗中的TLR9激动剂。ODN D-SL03由双份茎环,硫代磷酸酯骨架和两个回文序列构成,并且在每个环中具有AACGTT基序和TTCGAA基序。ODN D-SL03是IFN-α的强诱导物,这明显是由于所述回文序列的存在。已显示出D-SL03强力活化人B细胞、NK细胞和单核细胞以及从多样的脊椎动物物种即小鼠、大鼠、兔、猪和狗获得的PBMC/脾细胞。ODN D-SL03在患有建立的乳腺癌的小鼠中证实了抗肿瘤活性。它是29mer,具有序列5’-tcgcgaacgttcgccgcgttcgaac gcgg-3’(SEQ IDNO:48)。

在优选实施方式中,所述核酸衍生物是CpG寡脱氧核苷酸(CpG ODN)。在优选实施方式中,所述核酸衍生物是CpG寡脱氧核苷酸(CpG ODN),其中CpG基序中的至少一个核苷酸、优选地至少一个胞嘧啶核苷酸是未甲基化的。在优选实施方式中,所述核酸衍生物是CpG寡脱氧核苷酸(CpG ODN),其中CpG基序中1至10个之间、优选地2至8个之间、更优选地2至5个之间的胞嘧啶核苷酸是未甲基化的。

在甚至更优选实施方式中,所述核酸衍生物是选自A类CpG ODN、B类CpG ODN和C类CpG ODN的CpG寡脱氧核苷酸(CpG ODN)。在特别优选的实施方式中,所述核酸衍生物是选自SEQ ID NO:13、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48和SEQ ID NO:49中所示的核苷酸序列的CpG寡脱氧核苷酸(CpG ODN),特别地,所述核酸衍生物是选自SEQ ID NO:13中所示的核苷酸序列和SEQ ID NO:39中所示的核苷酸序列的CpG寡脱氧核苷酸(CpG ODN)。

在本发明的组合物中,所述核酸衍生物不被共价结合到所述SAPN,即所述核酸衍生物通过离子相互作用结合到所述SAPN。通常,所述核酸衍生物通过离子相互作用结合到所述肽连接物L1和/或L2。

自组装蛋白质纳米粒子:LCM单元

SAPN从任选地与式(II)的单体构件共同组装的式(I)的单体构件形成。如果这些构件组装,它们将形成所谓的“LCM单元”。将要组装在这种LCM单元中的单体构件的数目由最小公倍数(LCM)确定。因此,如果例如所述单体构件的寡聚化结构域形成五聚体(ND1)5(m=5)和三聚体(ND2)3(n=3),则15个单体将形成LCM单元。如果所述连接物区段L1和L2具有适合的长度,则这个LCM单元可能以球状蛋白质纳米粒子的形式组装。SAPN可以由仅仅一个或超过一个LCM单元的组装形成(表2)。这些SAPN代表拓扑学上相近的结构。

规则多面体

存在着5种规则多面体,即四面体、立方体、八面体、十二面体和二十面体。它们具有不同的内部旋转对称元件。四面体具有2次轴和两个3次轴,立方体和八面体具有2次、3次和4次旋转对称轴,并且十二面体和二十面体具有2次、3次和5次旋转对称轴。在立方体中,这些轴的空间取向与在八面体中完全相同,并且在十二面体和二十面体中,这些轴相对于彼此的空间取向也完全相同。因此,出于本发明的SAPN的目的,十二面体和二十面体可以被当作是一致的。十二面体/二十面体由60个一致的三维构件构造而成(表1)。这些构件是所述多面体的不对称单位(AU)。它们是角锥体,并且角锥体的边对应于旋转对称轴之一,因此这些AU将在它们的边处带有2次、3次和5次对称元。如果这些对称元从蛋白质寡聚化结构域产生,则这些AU由如上所示的单体构件构造。将两个寡聚化结构域ND1和ND2或ND3和ND4沿着所述AU的两个对称轴对齐就已足够。如果这两个寡聚化结构域形成稳定的寡聚物,则沿着第三对称轴的对称界面将自动产生,并且可以通过优化沿着该界面的相互作用例如疏水、亲水或离子相互作用或共价键例如二硫桥而使它稳定。

在优选实施方式中,所述寡聚化结构域ND1、ND2、ND3和ND4中的至少一者,优选地式(I)或(II)的ND1和/或ND3或ND2和/或ND4,包含二聚、三聚、四聚和/或五聚结构域,更优选地二聚、四聚和/或五聚结构域,甚至更优选地二聚和/或五聚结构域。

在更优选实施方式中,式(I)或(II)的寡聚化结构域ND1、ND2、ND3和/或ND4之一,更优选地ND1和/或ND3或ND2和/或ND4,包含选自4PN8、4PND、4WBA、3V2N、3V2P、3V2Q、3V2R、4EEB、4EED、3MIW、1MZ9、1FBM、1VDF、2GUV、2HYN、1ZLL和1T8Z的五聚卷曲螺旋,或选自含有氨基酸修饰和/或在任一或两个末端处缩短的4PN8、4PND、4WBA、3V2N、3V2P、3V2Q、3V2R、4EEB、4EED、3MIW、1MZ9、1FBM、1VDF、2GUV、2HYN、1ZLL和1T8Z的五聚卷曲螺旋,其中每个卷曲螺旋按照RCSB蛋白质数据库(RCSB PDB)的pdb编目号注明。甚至更优选地,ND1是选自色氨酸拉链五聚化结构域(pdb条目:1T8Z)或含有氨基酸修饰和/或在任一或两个末端处缩短的色氨酸拉链五聚化结构域(pdb条目:1T8Z)的五聚卷曲螺旋,特别是包含SEQ ID NO:3或SEQ IDNO:25的五聚卷曲螺旋或具有氨基酸修饰和/或在任一或两个末端处缩短的包含SEQ IDNO:3或SEQ ID NO:25的五聚卷曲螺旋。

在另一个更优选实施方式中,式(I)或(II)的寡聚化结构域ND1、ND2、ND3和ND4中的至少一者,更优选地ND1和/或ND3或ND2和/或ND4,包含选自四聚卷曲螺旋5D60、5D5Y、5AL6、4WB4、4BHV、4C5Q、4GJW、4H7R、4H8F、4BXT、4LTO、4LTP、4LTQ、4LTR、3ZDO、3RQA、3R4A、3R4H、3TSI、3K4T、3F6N、2O6N、2OVC、2O1J、2O1K、2AG3、2CCE、1YBK、1U9F、1U9G、1U9H、1USD、1USE、1UNT、1UNU、1UNV、1UNW、1UNX、1UNY、1UNZ、1UO0、1UO1、1UO2、1UO3、1UO4、1UO5、1W5I、1W5L、1FE6、1G1I、1G1J、1EZJ、1RH4、1GCL的四聚卷曲螺旋,或选自含有氨基酸修饰和/或在任一或两个末端处缩短的5D60、5D5Y、5AL6、4WB4、4BHV、4C5Q、4GJW、4H7R、4H8F、4BXT、4LTO、4LTP、4LTQ、4LTR、3ZDO、3RQA、3R4A、3R4H、3TSI、3K4T、3F6N、2O6N、2OVC、2O1J、2O1K、2AG3、2CCE、1YBK、1U9F、1U9G、1U9H、1USD、1USE、1UNT、1UNU、1UNV、1UNW、1UNX、1UNY、1UNZ、1UO0、1UO1、1UO2、1UO3、1UO4、1UO5、1W5I、1W5L、1FE6、1G1I、1G1J、1EZJ、1RH4、1GCL的四聚卷曲螺旋,其中每个卷曲螺旋按照RCSB蛋白质数据库(RCSB PDB)的pdb编目号注明。

在最优选实施方式中,所述四聚卷曲螺旋来自于四臂(tetrabrachion)(pdb条目编码1FE6),或者所述四聚卷曲螺旋来自于含有氨基酸修饰和/或在任一或两个末端处缩短的四臂(tetrabrachion)(pdb条目编码1FE6),其中每个SHB按照RCSB蛋白质数据库(RCSBPDB)的pdb编目号注明。

在另一个更优选实施方式中,所述式(I)或(II)的寡聚化结构域ND1、ND2、ND3和ND4之一,更优选地ND1和/或ND3或ND2和/或ND4包含选自三聚卷曲螺旋5TOH、5TOI、5K92、5KB0、5KB1、5KB2、5KKV、5EFM、2N64、5ABS、5IEA、5APP、5APQ、5APS、5APY、5APZ、5D5Z、4YPC、4YV3、4CGB、4CGC、4CJD、4R0R、4UW0、4P67、4OXM、3W8V、3W92、3W93、4I2L、4K8U、4JBZ、3VTQ、4L1R、4JDO、4J4A、4E52、3VYI、3ZMF、3VU5、3VU6、2YNY、2YNZ、2YO0、2YO1、2YO2、4G1A、4GIF、3TQ2、4DZK、4DZL、4DZN、3TE3、3R48、3SWF、3SWY、3PR7、2YKO、2YKP、2YKQ、3NTN、3PP5、3MKO、3MGN、3NWA、3NWD、3NWF、3L35、3L36、3L37、3M9B、3M9D、2X6P、3LJM、3AHA、3H7X、3H7Z、3LT6、3LT7、3GJP、2KP8、3KPE、2WPR、2WPS、2WPY、2WPZ、2WQ0、2WQ1、2WQ2、2WQ3、3HFC、3HFE、3HRN、3HRO、3H5F、3H5G、2WG5、2WG6、2W6B、2JJL、2VRS、3EFG、3DUZ、2OT5、2Z2T、2QIH、3BK6、2O7H、2R32、2JGO、2Q7C、2Q3I、2Q5U、2IBL、1ZV8、1ZVB、2FXP、1WT6、2AKF、1TGG、1SLQ、1S9Z、1PW9、1PWB、1M7L、1GZL、1KYC、1KFM、1KFN、1IJ0、1IJ1、1IJ2、1IJ3、1HQJ、1QU1、1B08、1CZQ、1CUN、1SVF、1CE0、1PIQ、1AQ5、1AVY、1HTN、1AA0、1ZIJ、1ZIM、1COI、1SWI、1GCM、1HUP的三聚卷曲螺旋,或选自氨基酸修饰和/或在任一或两个末端处缩短的5TOH、5TOI、5K92、5KB0、5KB1、5KB2、5KKV、5EFM、2N64、5ABS、5IEA、5APP、5APQ、5APS、5APY、5APZ、5D5Z、4YPC、4YV3、4CGB、4CGC、4CJD、4R0R、4UW0、4P67、4OXM、3W8V、3W92、3W93、4I2L、4K8U、4JBZ、3VTQ、4L1R、4JDO、4J4A、4E52、3VYI、3ZMF、3VU5、3VU6、2YNY、2YNZ、2YO0、2YO1、2YO2、4G1A、4GIF、3TQ2、4DZK、4DZL、4DZN、3TE3、3R48、3SWF、3SWY、3PR7、2YKO、2YKP、2YKQ、3NTN、3PP5、3MKO、3MGN、3NWA、3NWD、3NWF、3L35、3L36、3L37、3M9B、3M9D、2X6P、3LJM、3AHA、3H7X、3H7Z、3LT6、3LT7、3GJP、2KP8、3KPE、2WPR、2WPS、2WPY、2WPZ、2WQ0、2WQ1、2WQ2、2WQ3、3HFC、3HFE、3HRN、3HRO、3H5F、3H5G、2WG5、2WG6、2W6B、2JJL、2VRS、3EFG、3DUZ、2OT5、2Z2T、2QIH、3BK6、2O7H、2R32、2JGO、2Q7C、2Q3I、2Q5U、2IBL、1ZV8、1ZVB、2FXP、1WT6、2AKF、1TGG、1SLQ、1S9Z、1PW9、1PWB、1M7L、1GZL、1KYC、1KFM、1KFN、1IJ0、1IJ1、1IJ2、1IJ3、1HQJ、1QU1、1B08、1CZQ、1CUN、1SVF、1CE0、1PIQ、1AQ5、1AVY、1HTN、1AA0、1ZIJ、1ZIM、1COI、1SWI、1GCM、1HUP的三聚卷曲螺旋,其中每个卷曲螺旋按照RCSB蛋白质数据库(RCSB PDB)的pdb编目号注明。

在另一个更优选实施方式中,所述式(I)或(II)的寡聚化结构域ND1、ND2、ND3和ND4之一,更优选地ND1和/或ND3或ND2和/或ND4,包含选自二聚卷曲螺旋5M97、5M9E、5FIY、5F4Y、5D3A、5HMO、5EYA、5IX1、5IX2、5JHF、5JVM、5JVP、5JVR、5JVS、5JVU、5JX1、5FCN、5HHE、2N9B、4ZRY、4Z6Y、4YTO、4ZI3、5AJS、5F3K、5F5R、5HUZ、5DJN、5DJO、5CHX、5CJ0、5CJ1、5CJ4、5C9N、5CFF、4WHV、3WUT、3WUU、3WUV、4ZQA、4XA3、4XA4、4PXJ、4YVC、4YVE、5BML、5AL7、4WOT、4CG4、5AMO、4WII、4WIK、4RSJ、4CFG、4R3Q、4WID、4CKG、4CKH、4NSW、4W7P、4QQ4、4OJK、4TL1、4OH9、4LPZ、4Q62、4L2W、4M3L、4CKM、4CKN、4N6J、4LTB、4LRZ、2MAJ、2MAK、4NAD、4HW0、4BT8、4BT9、4BTA、4HHD、4M8M、4J3N、4L6Q、4C1A、4C1B、4GDO、4BWK、4BWP、4BWX、4HU5、4HU6、4L9U、4G0U、4G0V、4G0W、4L3I、4G79、4GEU、4GEX、4GFA、4GFC、4BL6、4JMR、4JNH、2YMY、4HAN、3VMY、3VMZ、3VN0、4ABX、3W03、2LW9、4DZM、4ETO、3TNU、3THF、4E8U、3VMX、4E61、3VEM、3VBB、4DJG、3TV7、3STQ、3V8S、3Q8T、3U1C、3QH9、3AZD、3ONX、3OKQ、3QX3、3SJA、3SJB、3SJC、2L2L、3QFL、3QKT、2XV5、2Y3W、3Q0X、3AJW、3NCZ、3NI0、2XU6、3M91、3NMD、3LLL、3LX7、3ME9、3MEU、3MEV、3ABH、3ACO、3IAO、3HLS、2WMM、3A6M、3A7O、2WVR、3ICX、3ID5、3ID6、3HNW、3I1G、2K6S、3GHG、3G1E、2W6A、2V51、3ERR、3E1R、2VY2、2ZR2、2ZR3、3CL3、3D9V、2Z17、2JEE、3BBP、3BAS、3BAT、2QM4、2V71、2NO2、2PON、2V0O、2DQ0、2DQ3、2Q2F、2NRN、2E7S、2H9V、2FXM、2HJD、2GZD、2GZH、2FV4、2F2U、2EUL、2ESM、2ETK、2ETR、1ZXA、1YIB、1YIG、1XSX、1RFY、1U0I、1XJA、1T3J、1T6F、1R7J、1UII、1PL5、1S1C、1P9I、1R48、1URU、1OV9、1UIX、1NO4、1NYH、1MV4、1LR1、1L8D、1LJ2、1KQL、1GXK、1GXL、1GK6、1JR5、1GMJ、1JAD、1JCH、1JBG、1JTH、1JY2、1JY3、1IC2、1HCI、1HF9、1HBW、1FXK、1D7M、1QUU、1CE9、2A93、1BM9、1A93、1TMZ、2AAC、1ZII、1ZIK、1ZIL、2ARA、2ARC、1JUN、1YSA、2ZTA的二聚卷曲螺旋,或选自氨基酸修饰和/或在任一或两个末端处缩短的5M97、5M9E、5FIY、5F4Y、5D3A、5HMO、5EYA、5IX1、5IX2、5JHF、5JVM、5JVP、5JVR、5JVS、5JVU、5JX1、5FCN、5HHE、2N9B、4ZRY、4Z6Y、4YTO、4ZI3、5AJS、5F3K、5F5R、5HUZ、5DJN、5DJO、5CHX、5CJ0、5CJ1、5CJ4、5C9N、5CFF、4WHV、3WUT、3WUU、3WUV、4ZQA、4XA3、4XA4、4PXJ、4YVC、4YVE、5BML、5AL7、4WOT、4CG4、5AMO、4WII、4WIK、4RSJ、4CFG、4R3Q、4WID、4CKG、4CKH、4NSW、4W7P、4QQ4、4OJK、4TL1、4OH9、4LPZ、4Q62、4L2W、4M3L、4CKM、4CKN、4N6J、4LTB、4LRZ、2MAJ、2MAK、4NAD、4HW0、4BT8、4BT9、4BTA、4HHD、4M8M、4J3N、4L6Q、4C1A、4C1B、4GDO、4BWK、4BWP、4BWX、4HU5、4HU6、4L9U、4G0U、4G0V、4G0W、4L3I、4G79、4GEU、4GEX、4GFA、4GFC、4BL6、4JMR、4JNH、2YMY、4HAN、3VMY、3VMZ、3VN0、4ABX、3W03、2LW9、4DZM、4ETO、3TNU、3THF、4E8U、3VMX、4E61、3VEM、3VBB、4DJG、3TV7、3STQ、3V8S、3Q8T、3U1C、3QH9、3AZD、3ONX、3OKQ、3QX3、3SJA、3SJB、3SJC、2L2L、3QFL、3QKT、2XV5、2Y3W、3Q0X、3AJW、3NCZ、3NI0、2XU6、3M91、3NMD、3LLL、3LX7、3ME9、3MEU、3MEV、3ABH、3ACO、3IAO、3HLS、2WMM、3A6M、3A7O、2WVR、3ICX、3ID5、3ID6、3HNW、3I1G、2K6S、3GHG、3G1E、2W6A、2V51、3ERR、3E1R、2VY2、2ZR2、2ZR3、3CL3、3D9V、2Z17、2JEE、3BBP、3BAS、3BAT、2QM4、2V71、2NO2、2PON、2V0O、2DQ0、2DQ3、2Q2F、2NRN、2E7S、2H9V、2FXM、2HJD、2GZD、2GZH、2FV4、2F2U、2EUL、2ESM、2ETK、2ETR、1ZXA、1YIB、1YIG、1XSX、1RFY、1U0I、1XJA、1T3J、1T6F、1R7J、1UII、1PL5、1S1C、1P9I、1R48、1URU、1OV9、1UIX、1NO4、1NYH、1MV4、1LR1、1L8D、1LJ2、1KQL、1GXK、1GXL、1GK6、1JR5、1GMJ、1JAD、1JCH、1JBG、1JTH、1JY2、1JY3、1IC2、1HCI、1HF9、1HBW、1FXK、1D7M、1QUU、1CE9、2A93、1BM9、1A93、1TMZ、2AAC、1ZII、1ZIK、1ZIL、2ARA、2ARC、1JUN、1YSA、2ZTA的二聚卷曲螺旋,其中每个卷曲螺旋按照RCSB蛋白质数据库(RCSB PDB)的pdb编目号注明。

在优选实施方式中,X1选自包含His标签的氨基酸序列、如SEQ ID NO:29中所示包含His标签的氨基酸序列、包含His标签和疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:30中所示包含His标签和疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:2中所示的氨基酸序列、如SEQ ID NO:29中所示的氨基酸序列、如SEQ ID NO:24中所示的氨基酸序列,以及如SEQ ID NO:2、SEQ ID NO:30、SEQ ID NO:29或SEQ ID NO:24中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。更优选地,X1选自如SEQ ID NO:2中所示的氨基酸序列、如SEQ ID NO:29中所示的氨基酸序列、如SEQ ID NO:24中所示的氨基酸序列,以及如SEQ IDNO:2、SEQ ID NO:29或SEQ ID NO:24中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,X2选自包含His标签的氨基酸序列、如SEQ ID NO:29中所示包含His标签的氨基酸序列、包含His标签和疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:30中所示包含His标签和疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:2中所示的氨基酸序列、如SEQ ID NO:29中所示的氨基酸序列、如SEQ ID NO:24中所示的氨基酸序列,以及如SEQ ID NO:2、SEQ ID NO:30、SEQ ID NO:29或SEQ ID NO:24中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。更优选地,X2选自如SEQ ID NO:2中所示的氨基酸序列、如SEQ ID NO:29中所示的氨基酸序列、如SEQ ID NO:24中所示的氨基酸序列,以及如SEQ IDNO:2、SEQ ID NO:29或SEQ ID NO:24中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,Y1选自包含疟原虫动合子和子孢子的细胞穿越蛋白(CelTOS)的氨基酸序列、如SEQ ID NO:27中所示的氨基酸序列,以及如SEQ ID NO:27中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,Y2是包含鞭毛蛋白的D0和D1结构域的氨基酸序列、如SEQ IDNO:28或SEQ ID NO:6中所示的氨基酸序列,或如SEQ ID NO:28或SEQ ID NO:6中所示的氨基酸序列,其中所述氨基酸序列含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述肽连接物L1由至少3个氨基酸构成,并且所述式(I)的构件的至少一个、优选地至少两个、更优选地至少三个、甚至更优选地所有的X1、ND1、ND2和Y1选自如SEQ ID NO:2或SEQ ID NO:24中所示的X1,如SEQ ID NO:3或SEQ ID NO:25中所示的ND1,如SEQ ID NO:5或SEQ ID NO:26中所示的ND2,和如SEQ ID NO:6或SEQ ID NO:27中所示的Y1,或者所述肽连接物L1由至少3个氨基酸构成,并且所述式(I)的构件的至少一个、优选地至少两个、更优选地至少三个、甚至更优选地所有的X1、ND1、ND2和Y1选自如SEQ IDNO:2或SEQ ID NO:24中所示的X1,如SEQ ID NO:3或SEQ ID NO:25中所示的ND1,如SEQ IDNO:5或SEQ ID NO:26中所示的ND2,和如SEQ ID NO:6或SEQ ID NO:27中所示的Y1,其中SEQID NO:2、SEQ ID NO:24、SEQ ID NO:3、SEQ ID NO:25、SEQ ID NO:5、SEQ ID NO:26、SEQ IDNO:6或SEQ ID NO:27中的至少一者含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述肽连接物L2由至少3个氨基酸构成,并且所述式(I)的构件的至少一个、优选地至少两个、更优选地至少三个、甚至更优选地所有的X2、ND3、ND4和Y2选自如SEQ ID NO:24中所示的X2,如SEQ ID NO:25中所示的ND3,如SEQ ID NO:26中所示的ND4,和如SEQ ID NO:28中所示的Y2,或者其中所述肽连接物L2由至少3个氨基酸构成,并且所述式(I)的构件的至少一个、优选地至少两个、更优选地至少三个、甚至更优选地所有的X2、ND3、ND4和Y2选自如SEQ ID NO:24中所示的X2,如SEQ ID NO:25中所示的ND3,如SEQ IDNO:26中所示的ND4,和如SEQ ID NO:28中所示的Y2,其中SEQ ID NO:24、SEQ ID NO:25、SEQID NO:26或SEQ ID NO:28中的至少一者含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述式(I)的构件包含选自如SEQ ID NO:1中所示的氨基酸序列、如SEQ ID NO:16中所示的氨基酸序列、如SEQ ID NO:17中所示的氨基酸序列、如SEQ IDNO:18中所示的氨基酸序列、如SEQ ID NO:19中所示的氨基酸序列、如SEQ ID NO:22中所示的氨基酸序列,和如SEQ ID NO:34中所示的氨基酸序列的氨基酸连续链,或者所述式(I)的构件包含选自如SEQ ID NO:1中所示的氨基酸序列、如SEQ ID NO:16中所示的氨基酸序列、如SEQ ID NO:17中所示的氨基酸序列、如SEQ ID NO:18中所示的氨基酸序列、如SEQ IDNO:19中所示的氨基酸序列、如SEQ ID NO:22中所示的氨基酸序列和如SEQ ID NO:34中所示的氨基酸序列的氨基酸连续链,SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:22或SEQ ID NO:34中的至少一者含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述式(II)的构件包含如SEQ ID NO:23中所示的氨基酸的连续链,或者所述式(II)的构件包含如SEQ ID NO:23中所示的氨基酸的连续链,其中如SEQID NO:23中所示的氨基酸含有氨基酸修饰和/或在任一或两个末端处缩短。

在优选实施方式中,所述由多个式(I)的构件、多个式(II)的构件或多个共同组装的式(I)和式(II)的构件构成的SAPN的蛋白质链、更优选地由多个式(I)的构件构成的SAPN的蛋白质链与所述核酸衍生物的摩尔比,为约1比约0.4至0.8,优选为约1比约0.6。

在优选实施方式中,所述组合物包含由与多个式(II)的构件共同组装的多个式(I)的构件构成的SAPN。

在优选实施方式中,所述包含多个式(I)的构件和多个式(II)的构件的共同组装的SAPN,更优选地所述包含多个式(I)的构件和多个式(II)的构件的包含本文中所描述的鞭毛蛋白的共同组装的SAPN,具有约48至约59个所述包含式(I)的构件的连续链与约12至约1个所述包含式(II)的构件的连续链的共同组装比,更优选地约55至约58个所述包含式(I)的构件的连续链与约5至约2个所述包含式(II)的构件的连续链给共同组装比,例如约55个所述包含式(I)的构件的连续链与约5个所述包含式(II)的构件的连续链的共同组装比、约56个所述包含式(I)的构件的连续链与约4个所述包含式(II)的构件的连续链的共同组装比、约57个所述包含式(I)的构件的连续链与约3个所述包含式(II)的构件的连续链的共同组装比或约58个所述包含式(I)的构件的连续链与约2个所述包含式(II)的构件的连续链的共同组装比,甚至更优选地约58个所述包含式(I)的构件的连续链与约2个所述包含式(II)的构件的连续链的共同组装比。

组装成具有规则多面体对称性的自组装蛋白纳米粒子(SAPN)

为了产生具有规则几何形状(十二面体、二十面体、八面体、立方体和四面体)的自组装蛋白纳米粒子(SAPN),需要超过一个LCM单元。例如为了从含有三聚和五聚寡聚化结构域的单体形成二十面体,需要4个LCM单元,各自由15个单体构件构成,即所述具有规则几何形状的蛋白质纳米粒子将由60个单体构件构成。需要的所述两种寡聚化结构域的寡聚化状态的组合和形成相应多面体的LCM单元的数目,列于下表2中。

表2:在规则多面体形成中寡聚化状态的可能组合

所述LCM单元是否将进一步组装以形成由超过一个LCM单元构成的规则多面体,取决于两个寡聚化结构域ND1和ND2和两个寡聚化结构域ND3和ND4分别相对于彼此的几何对准,特别是两个寡聚化结构域的旋转对称轴之间的角度。这主要由下述因素控制:i)纳米粒子中相邻结构域之间的相互作用,ii)连接物区段L1和L2的长度,iii)各个寡聚化结构域的形状。与规则多面体中的排列相比,在LCM单元中这个角度更大。此外,与规则多面体相反,在单体构件中这个角度不相同。

如果所述两个寡聚化结构域之间的角度足够小(甚至小于具有二十面体对称的规则多面体中的角度),则大量(几百个)蛋白质链可以组装成蛋白质纳米粒子。具有三聚体-五聚体结构体系的SAPN的生物物理和数学分析最近已发表(Indelicato,G.等,Biophys J2016,110(3):646-660)。

优选地,将在所述SAPN上的环构象中展示的抗原选自:(a)适合于诱导针对癌细胞的免疫应答的蛋白质或肽;(b)适合于诱导针对传染病的免疫应答的蛋白质或肽;(c)适合于诱导针对过敏原的免疫应答的蛋白质或肽;(d)适合于诱导用于治疗人疾病的免疫应答的蛋白质或肽。

包含这些蛋白质或肽的SAPN可能适合于在人中或在家畜和宠物中诱导免疫应答。

另一方面,本发明涉及如上所定义的式(I)或(II)的单体构件。

另一方面,本发明涉及一种适合作为疫苗的包含本文中所描述的蛋白质纳米粒子的组合物,例如用作疫苗的包含本文中所描述的蛋白质纳米粒子的组合物。优选的疫苗组合物包含在水性缓冲溶液中的所述蛋白质纳米粒子,并且还可以包含例如源自于糖的赋形剂(例如甘油、海藻糖、蔗糖等)或源自于氨基酸的赋形剂(例如精氨酸、脯氨酸、谷氨酸等)或阴离子型、阳离子型、非离子型或两性离子型去污剂(例如胆酸盐、脱氧胆酸盐、吐温等)或用于调节所述溶液的离子强度的任何种类的盐(例如NaCl、MgCl2等)。

另一方面,本发明涉及一种疫苗接种人或非人动物的方法,所述方法包括向需要这种疫苗接种的对象给药有效量的上文中所描述的组合物。所述需要这种疫苗接种的对象通常是人或非人动物。

还提供了一种如上文中所描述的组合物,其用于疫苗接种人或非人动物的方法中,所述方法包括向需要这种疫苗接种的人或非人动物给药有效量的所述组合物。

还提供了如上文中所描述的组合物的用途,其用于制造用于疫苗接种人或非人动物的药物。

还提供了如上文中所描述的组合物的用途,其用于疫苗接种人或非人动物。

术语“个体”、“对象”或“患者”在本文中可互换使用。在某些实施方式中,所述对象是哺乳动物。哺乳动物包括但不限于灵长类动物(包括人和非人灵长类动物)。在优选实施方式中,所述对象是人。另一方面,本发明涉及一种生产本文中所描述的SAPN的方法,所述方法包括:i)向包含核酸衍生物的缓冲液添加SAPN,和ii)使用常规的重折叠流程在所述核酸衍生物存在下重折叠所述SAPN。

CpG-SAPN(包封CpG的自组装蛋白质纳米粒子)的设计

本发明的CpG-SAPN的具体实例是下述构建物“DEDDLI-RR”,其对应于具有下述序列的式(I):

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:1)。

这是一种由下述分结构构成的构建物:

X1:MGDKHHHHHHHHHHKDGSDKGS(SEQ ID NO:2)

ND1:WEEWNARWDEWENDWNDWREDWQAWRDDWARWRA TW(SEQ ID NO:3)

L1:RRGR(SEQ ID NO:4)

ND2:LLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQ NAELERRLEEL(SEQ ID NO:5)

Y1:ARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRI NSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:6)

为了易于纯化,DEDDLI-RR始于如式(I)中所定义的序列X1:

MGDKHHHHHHHHHHKDGSDKGS(SEQ ID NO:2)

其含有用于镍亲和纯化的His标签,并在DNA水平上含有用于进一步亚克隆的限制性位点(NcoI和BamHI)。

对于ND1来说,选择五聚化结构域(m=5)。所述具体的五聚卷曲螺旋是pdb条目号1T8Z的色氨酸拉链五聚化结构域的新的修饰(Liu,J.等,Proc Natl Acad Sci USA 2004,101(46):16156-16161)。

原始的色氨酸拉链五聚化结构域具有下述序列

SSNAKWDQWSSDWQTWNAKWDQWSNDWNAWRSDWQAWKDDWARWNQRWDNWAT(SEQ ID NO:7)。

所述用于DEDDLI-RR的五聚化结构域的修饰的卷曲螺旋序列始于第13位,结束于第49位,并在C-端末端处含有序列变异(RATW(SEQ ID NO:36)代替NQRW(SEQ ID NO:37)),并且出于溶解性目的,在所述卷曲螺旋的非核心位置处含有几个电荷修饰,但保持与原始序列中相同的核心位置处色氨酸残基的七肽重复序列模式(SEQ ID NO:8)。此外,将两个赖氨酸残基改变成精氨酸残基,以避免半抗原分子偶联到所述五聚卷曲螺旋。aa(a)和aa(d)位置处的卷曲螺旋核心残基用粗体指示并加下划线:

然后将这个序列用具有序列RRGR(SEQ ID NO:4)的短连接物L1延长,以与卷曲螺旋序列ND2相连。L1在所述纳米粒子的两个卷曲螺旋部分之间含有柔性残基G(甘氨酸)。它含有三个带正电荷的精氨酸氨基酸,提供与带负电荷的包封的核酸的相互作用。

L1后面跟随具有下述序列的第二卷曲螺旋结构域ND2:

它是重新设计的卷曲螺旋,旨在形成三个核心aa(a)位置被天冬酰胺残基占据的二聚卷曲螺旋,这种结构有利于二聚卷曲螺旋形成。aa(a)和aa(d)位置处的卷曲螺旋核心残基用粗体指示并加下划线。它含有泛DR结合性CD4表位串ELRRLLQLIRHENRMVLQFVRALSMQNA(SEQ ID NO:7),其本身含有混杂的CD4/CD8表位IRHENRMVL(SEQ ID NO:8)(Parida R.等,Vaccine 2007,25:7530–7539),所述表位对应于具有序列ID BAA01449.1的甲型流感病毒的基质蛋白1的第173位至第181位残基。

Y1区段具有下述序列:

ARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:6)。

它含有带有XmaI限制性位点的序列ARG,后面紧跟鞭毛蛋白的片段,并且由鼠伤寒沙门氏菌鞭毛蛋白的D0和D1结构域构成(与专利US 8,420,102中相同),其被进一步修饰,使得未表面暴露的赖氨酸侧链被突变成精氨酸,而在具有序列DGDKGDDK(SEQ ID NO:9)的连接鞭毛蛋白的将D0和D1结构域连接的环中内置了4个赖氨酸残基,用于共价偶联半抗原分子例如烟碱、***、咖啡因等的目的。这个环是表面暴露的。

以下序列对应于鞭毛生物合成蛋白FliC的P06175.2的第1位至第180位残基,其中第20、42、59、136和161位残基从赖氨酸突变成精氨酸,而第172位残基从苏氨酸突变成谷氨酰胺,以在DNA水平上***MfeI限制性位点:

MAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYK(SEQ ID NO:10)。

以下序列对应于P06175.2的第403位至第493位残基,其中第409位残基从赖氨酸突变成精氨酸。它还含有突变T419A、T446S和S447E:

TENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:11)。

DEDDLI-RR单体的模型以其单体和二十面体形式示出在图2中,假设T=1二十面体对称。DEDDLI-RR的EM照片示出在图7中。

实施例

下面的实施例可用于进一步解释本发明,但绝不限制本发明的范围。

实施例1–DEDDLI-RR的分子克隆

编码所述纳米粒子构建物的DNA使用标准的分子生物学程序制备。含有编码以下蛋白质序列DEDDLI-RR的DNA的质粒通过克隆到基础SAPN表达构建物pPEP-T的NcoI/EcoRI限制性位点中来构建(图3):

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:12)。疫苗免疫原通过使用烟碱的活化形式NHS-烟碱将表位烟碱共价附连到载体的赖氨酸残基来产生。

这种具有X1–ND1–L1–ND2–Y1体系结构的构建物的序列在上文中详细描述。简短来说,这个构建物由通过具有序列RRGR(SEQ ID NO:4)的连接物L1连接到所述重新设计的二聚卷曲螺旋(ND2)的五聚卷曲螺旋色氨酸拉链(ND1)构成,其在所述五聚卷曲螺旋的最后一个核心位置与所述二聚卷曲螺旋的第一个核心位置之间含有3个正电荷。N-端处的序列X1含有His标签和3个半抗原/烟碱结合位点(赖氨酸),而序列Y1含有鼠伤寒沙门氏菌鞭毛蛋白的片段,并由鞭毛蛋白的修饰的D0和D1结构域构成。

实施例2-表达

将所述质粒转化到大肠杆菌Tuner(DE3)细胞中,将其在抗生素氨苄青霉素存在下生长在Hyper Broth中(图4A)。所述预培养物在28℃下生长。第二天,将1:500稀释的预培养物接种到1L表达培养基中,并将细胞在5L Erlenmeyer摇瓶中在37℃振摇生长,直至达到OD600为约0.8-0.9。然后将所述细胞培养物用IPTG(终浓度为1mM)诱导。在诱导后,将培养物在37℃下振摇生长3小时。然后通过以4,000x g离心15min来收获细胞。将细胞沉淀物储存在-20℃下。将所述沉淀物在冰上融化,并悬浮在由6M盐酸胍、300mM NaH2PO4、20mM咪唑构成的pH 8.0的裂解缓冲液中。

实施例3–纯化

使用下述纯化缓冲液:

1.高浓度磷酸盐裂解缓冲液:6M盐酸胍,300mM NaH2PO4,20mM咪唑,pH 8.0

2.低浓度磷酸盐清洗缓冲液:6M盐酸胍,20mM NaH2PO4,20mM咪唑,pH 8.0

3.用于除去内毒素的清洗缓冲液:10mM Tris pH 8.0,60%(v/v)异丙醇

4.洗脱缓冲液:低浓度磷酸盐缓冲液,6M盐酸胍,20mM NaH2PO4,pH 8.0,具有可变浓度的咪唑

对每克细胞沉淀物使用5至10mL体积的裂解缓冲液(6M GuHCl,300mM NaH2PO4,20mM咪唑,pH 8.0)。将25mL裂解缓冲液在冰上超声处理3分钟。使用15K rpm下45min的离心将裂解液澄清。在离心后,将澄清的裂解液使用0.45μm滤器(Sartorius)过滤,并在2*5mLHis-trap HP亲和柱上纯化。

首先,按照下述流程将所述蛋白质结合到柱,然后进行清洗步骤:

1.用高浓度磷酸盐裂解缓冲液平衡柱

2.将过滤过的澄清裂解液(CL)结合到柱

3.使用高浓度磷酸盐裂解缓冲液(5倍柱体积)的清洗1

4.使用低浓度磷酸盐缓冲液(5倍柱体积)的清洗2

5.使用10mM Tris pH 8.0中的60%异丙醇(10倍柱体积)的清洗3

6.使用低浓度磷酸盐缓冲液(15倍柱体积)的清洗4

进行步骤3是为了除去核酸片段,而步骤5被用于除去内毒素。

随后,按照下述流程使用120至132mM咪唑的逐渐升高的咪唑浓度进行逐步洗脱(图4B):

1.使用低浓度磷酸盐缓冲液的柱清洗(5倍柱体积)

2.使用120mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

3.使用122mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

4.使用124mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

5.使用126mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

6.使用128mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

7.使用130mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

8.使用132mM咪唑的洗脱(2倍柱体积–级分大小为3mL)

9.使用250mM咪唑的洗脱(4倍柱体积–级分大小为6mL)

10.使用低浓度磷酸盐缓冲液的柱清洗(10倍柱体积)

纯化的DEDDLI-RR的SDS-PAGE示出在图4C中,并表明了纯蛋白质的高得率。

实施例4–烟碱的偶联

将DEDDLI-RR和LIVELI1-RR的合并的洗脱级分首先用5mM EDTA温浴至少1小时以除去任何淋滤的金属离子。然后使用所述合并的洗脱级分的切向流过滤针对由6M盐酸胍、100mM HEPES pH 7.2、150mM NaCl构成的偶联缓冲液进行透析。将Spectra-Por 6-8kDa截留膜用于透析。

将12mg浓度为11.03mg/mL的DEDDLI-RR用于偶联,其对应于1090μL的体积。蛋白质与NHS-烟碱的摩尔比为1:50。因此,为了这个比率,使用下述量的蛋白质和NHS-烟碱:

DEDDLI-RR:0.267微摩尔(12mg)

对映体纯的NHS-烟碱:13.35微摩尔

所述偶联反应在室温下,在暗处(即用铝箔覆盖),在使用磁力搅拌器搅拌下进行3小时。在偶联反应后,将样品通过PD minitrap G-25预装柱以除去未偶联的NHS-烟碱,并将缓冲液更换为由8M尿素、20mM Tris pH8.5、150mM NaCl和10%海藻糖构成的预重折叠缓冲液(图4D)。所述构建物在偶联之前和之后的分子质量被分别测定为44527.31和46838.55Da,对应于平均每个蛋白质链8.9个烟碱分子,即所有8个赖氨酸侧链和N-端胺几乎完全与NHS-烟碱偶联(图4D)。

实施例5–重折叠

制备最终的重折叠缓冲液,其含有用于免疫接种实验的CpG或用于包封研究的荧光标记的CpG。小鼠特异性CpG(1826)具有序列其中DNA骨架中的碱基通过硫代磷酸酯键(由符号*指示)相连。CpG 1826的分子量为6362.7g/mol。荧光标记的CpG ODN1826F具有6899.7g/mol的分子量。ODN1826是B类CpG序列并含有两个未甲基化的CpG二核苷酸,它们用粗体强调并加下划线。B类CpG在防止快速降解的全硫代磷酸酯骨架内含有一个或多个CpG二核苷酸。它们强烈活化B细胞但微弱地刺激IFN-α分泌。

与哺乳动物DNA相比,这些未甲基化的CpG二核苷酸在细菌DNA中以高20倍的频率存在。这个小鼠特异性ODN1826序列中的这些基序被小鼠Toll样受体9识别,其随后导致强烈的免疫刺激效应。

在快速重折叠后,最终蛋白质浓度为0.05mg/mL,对应于0.31纳摩尔的蛋白质。对于包封实验来说,准备了不同的蛋白质与CpG的摩尔比。为不同的最终重折叠缓冲液准备了下述量的CpG:0.06,0.09,0.14,0.186,0.233,0.031,0.451和0.62纳摩尔,对应于1:0.2、1:0.3、1:0.45、1:0.6、1:0.75、1:1、1:1.5和1:2的DEDDLI-RR:ODN1826F比。

然后将所述预重折叠缓冲液中的蛋白质在那些含有20mM Tris pH 8.0、50mMNaCl、10%海藻糖并含有不同量的ODN1826的最终重折叠缓冲液中逐滴稀释。所述快速重折叠过程如下进行:将含有CpG的最终重折叠缓冲液恒定地保持搅拌。将蛋白质DEDDLI-RR逐滴添加到所述最终重折叠缓冲液(含有CpG)中,以启动重折叠过程。在所述蛋白质添加后,允许所述重折叠过程在恒定搅拌下继续进行5分钟。

实施例6–包封

在快速重折叠后,在过滤之前测量总相对荧光单位(RFU)。然后,使用总体积为300μL的DEDDLI-RR:ODN1826F,通过将所述蛋白质浓缩2.5倍(即将截留物从300μL减少到约120μL)进行第一过滤步骤。所述过滤步骤使用100kDa截留值的离心式滤器进行,其允许游离CpG通过但保留含有可能包封的CpG的组装的SAPN。在所述第一过滤步骤后,测量流通液和截留物的RFU。

表3:包封后的荧光

重要的是认识到,由于荧光淬灭,荧光读数的信号(RFU)相对于浓度是高度非线性的。因此,在柱“流通液”级分中可以最好地观察到成功的包封。如果CpG被包封在SAPN中,则它将不通过滤器并且在“流通液”中不给出信号。在直至1:0.6的包封比,在含有SAPN的样品(DEDDLI-RR:ODN1826F)的“流通液”中几乎不能检测到任何荧光,而在不含SAPN的样品(仅仅ODN1826F)中,在这些对应于较低包封比1:0.3、1:0.45和1:0.6的浓度下存在荧光强度的快速提高(图5)。在更高比例下,所有荧光(即CpG)不再可以被SAPN保留,因此在含有SAPN的样品(DEDDLI-RR:ODN1826F)的“流通液”中荧光信号显著增加。这意味着所述SAPN可以包封对应于0.6倍的蛋白质链的摩尔比的量的CpG,即假设所述具有60个蛋白质链的SAPN为T1二十面体对称,则粗略地每个纳米粒子包封总共36个CpG分子。

假设在NaCl缓冲液中DNA的密度为1.8g/cm3并且分子量为6899.7g/mol,则36个ODN1826F分子占据直径为7.6nm的球体。这与基于SAPN的计算机模型的中央空腔的体积非常密切地相符。

如果添加比可以被所述SAPN包封的更多的CpG,则附加的CpG将通过膜,导致流通液中的荧光强度提高。这种由未包封的CpG造成的流通液中荧光强度的提高,与从相应CpG浓度下的仅CpG的样品测量到的信号良好地相关(图6)。因此,在含有SAPN的样品中从未包封的CpG检测到的信号与来自于仅CpG的样品的信号非常相近,并且浓度依赖性曲线几乎重叠(图6)。

实施例7–电子显微术

包封有ODN1826的DEDDLI-RR的透射电子显微镜分析显示出非常好的、无聚集的纳米粒子形成(图7)。

实施例8-小鼠免疫接种实验

对于免疫接种实验来说,使用1:0.6的DEDDLI-RR:ODN1826的摩尔比。在快速重折叠后,将含有包封有CpG的重折叠的DEDDLI-RR的溶液透析并过滤。然后使用100kDa截留值的离心式滤器(Millipore)将所述样品浓缩。最后的无菌过滤步骤在无菌通风橱中使用0.2μm注射器滤器(Sartorius)进行。

将5只Balb/C小鼠的组各自用含有或不含包封的CpG的10μg和30μg蛋白质的两种不同剂量免疫接种。那些药剂中CpG的量分别为0.85μg和2.56μg。对于肌肉内(IM)、鼻内(IN)和静脉内(IV)注射这三种不同的免疫接种方案来说,提供各自相隔两周的三次注射。对于所述三种免疫接种方案中的每一种来说,当CpG被包封在免疫原的SAPN中时可以观察到抗体滴度的显著提高(表3,图8)。

-尽管对于IM免疫接种来说10μg剂量的免疫接种在含有和不含CpG时在抗体滴度方面显示出相同强度的免疫应答,但对30μg剂量来说,与没有CpG的样品相比含有包封的CpG的样品可以观察到236%的提高。

-对于IN免疫接种来说,包封的CpG在10μg蛋白质(对应于0.85μg CpG)的较低剂量下已经将免疫应答提高161%。对于30μg蛋白质剂量(2.56μg CpG)来说,所述提高高达319%。

-尽管对于IM免疫接种来说免疫应答通常最强,但CpG的流感更加温和,对于10μg和30μg蛋白质(0.85μg和2.56μg CpG)的低和高剂量来说提高18%和87%。

表3:具有和没有CpG包封的免疫应答

实施例9–试验连接物L1的不同长度和总电荷

预期具有较长连接物L1并带

有比总电荷为+3的DEDDLI-RR更多的正电荷的SAPN将更加高效地包封带负电荷的核酸,即它们可以携带更大的核酸有效载荷。为了试验这种假设,设计了两种新的粒子,它们分别具有RRGRRGR(SEQ ID NO:14)和RRGRRGRRGR(SEQ ID NO:15)的连接物L1。第一种构建物(被称为2RR)的连接物L1的长度为7个氨基酸,具有5个正电荷(精氨酸),而第二种构建物(被称为3RR)具有9个氨基酸长的连接物L1,具有总共7个正电荷(精氨酸)。

所述修饰的连接物的基本原理是增加所述连接物L1的长度允许两个寡聚化结构域ND1和ND2相隔更远,从而增加了中央空腔的尺寸,为货物装载提供了更大空间。向所述连接物添加另外的电荷允许所述蛋白质与作为有效载荷的带负电荷的核酸之间更好的电荷补偿。

由于重折叠行为关键取决于蛋白质链的总电荷以及因此粒子本身的总电荷,因此2RR和3RR的连接物L1中另外的正电荷被在X1的紧接五聚体ND1的起点之前的末端处带负电荷的谷氨酸的***所补偿,并且对于3RR来说,被接近五聚体ND1的C-端末端的精氨酸残基改变成带负电荷的天冬氨酸所补偿。这将2RR和3RR的蛋白质链的总电荷保持在-7,与DEDDLI-RR的总电荷相同。因此,2RR和3RR的序列分别是:MGDKHHHHHHHHHHKDGSDKGSEEWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ IDNO:16)

MGDKHHHHHHHHHHKDGSDKGSEEWEEWNARWDEWENDWNDWREDWQAWRDDWARWDATWRRGRRGRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:17)。2RR和3RR的计算分子量分别为45431.93Da和Mw 45760.26Da。

如实施例1、2和3中所述,将两种构建物克隆、表达并纯化。重折叠和同时的包封如实施例5中对DEDDLI-RR所述来进行,对包封比使用的蛋白质的量进行了略微修改,以将与DEDDLI-RR相比略微不同的分子量考虑在内。

根据图9,令人吃惊的发现是2RR和3RR的更长且带更多正电荷的连接物不允许更多CpG被包封。尽管与仅仅CpG的样品相比仍存在非常明显的保留在上清液中并且没有通过滤膜进入流通液中的CpG,但它略微低于DEDDLI-RR的包封效率。

实施例10–在没有TLR5背景免疫刺激的情况下试验TLR9活化

在构建物DEDDLI-RR中,鞭毛蛋白分子的D0/D1结构域活化TLR5以诱导强烈免疫应答。这将覆盖由CpG结合到TLR9引起的免疫应答。为了试验主要源自于TLR9活化的免疫应答,对DEDDLI-RR中的TLR5相互作用位点进行修饰,以废除与所述受体的相互作用。将TLR5/鞭毛蛋白相互作用位点处的精氨酸残基(Yoon S.I.等,Science 2012,335:859-64)突变成赖氨酸。此外,也将鞭毛蛋白的C-端末端处的炎性体相互作用位点突变以破坏与炎性体的相互作用(Lightfield K.L.等,Nat Immunol.2008,9:1171-8)。所述两个蛋白质序列的名称是LIVELI1-RR和LIVELI2-RR,并且相应的序列是:

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQKVKELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALKSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVAAAAR(SEQ ID NO:18)

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQKVKELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQKIDAALAQVDALKSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVAAAAR(SEQ ID NO:19)。

在构建物LIVELI1-RR中,构建物DEDDLI-RR的第206位、第208位和第322位精氨酸残基被突变成赖氨酸,而在LIVELI2-RR中,也将DEDDLI-RR的第135位、第174位、第251位和第310位精氨酸残基改变成赖氨酸。在赖氨酸残基的伯胺处偶联半抗原烟碱,在鞭毛蛋白与TLR5之间的界面处***了大体积的组成部分,从而抑制了复合物形成以及因此基于toll样受体的免疫刺激。在两种构建物LIVELI1-RR和LIVELI2-RR中,对鞭毛蛋白的D0结构域的炎性体相互作用位点进行修饰,以将DEDDLI-RR的第390位至第393位残基(LSLL)用4个丙氨酸(AAAA)(SEQ ID NO:40)代替。这种修饰将抑制所述两种构建物LIVELI1-RR和LIVELI2-RR的炎性体活化(Lightfield K.L.等,Nat Immunol.2008,9:1171-8)。

由于对于具有带正电荷的连接物的构建物来说在不含包封的CpG时的重折叠不能良好地工作,因此制备了一对构建物,其中将带正电荷的连接物RRGR(SEQ ID NO:4)用序列MGGR(SEQ ID NO:41)代替,从而除去了连接物L1中的3个正电荷中的2个。那些被命名为LIVELI1和LIVELI2的构建物被用于不含包封的CpG时的免疫接种,并具有总体序列:

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWMGGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQKVKELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALKSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVAAAAR(SEQ ID NO:20)

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWMGGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQKVKELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQKIDAALAQVDALKSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVAAAAR(SEQ ID NO:21)。

将所述两对构建物LIVELI1/LIVELI1-RR和LIVELI2/LIVELI2-RR如实施例1、2和3中所述进行克隆、表达和纯化。重折叠和同时的包封如实施例5中对DEDDLI-RR所述来进行,对包封比使用的蛋白质的量进行了略微修改,以将与DEDDLI-RR相比略微不同的分子量考虑在内。对于免疫接种实验来说,使用1:0.6的蛋白质:ODN1826的摩尔比。在快速重折叠后,将含有包封有CpG的重折叠的纳米粒子的溶液透析并过滤。然后使用100kDa截留值的离心式滤器(Millipore)将所述样品浓缩。最后的无菌过滤步骤在无菌通风橱中使用0.2μm注射器滤器(Sartorius)进行。

将5只Balb/C小鼠的组各自用含有(LIVELI1-RR和LIVELI2-RR)或不含包封的CpG(LIVELI1和LIVELI2)的30μg蛋白质的剂量免疫接种。在LIVELI1-RR和LIVELI2-RR药剂中包封的CpG的量为约2.5μg。在免疫接种方案中,提供各自相隔两周的三次肌肉内注射。对于两对免疫原来说,当CpG被包封在免疫原的SAPN中时可以观察到抗体滴度的显著提高(图10)。对于LIVELI1和LIVELI2免疫原来说,没有ODN1826时的抗体滴度分别为576.3和367.6,而在LIVELI1-RR和LIVELI2-RR中包封的CpG将抗体滴度分别提高到10958.0和7618.4,对应于近20倍的提高。

实施例11–通过与含有鞭毛蛋白的蛋白质链(CC-RR)共同组装获得的疟疾疫苗

本发明的CpG-SAPN的另一个实例是下述构建物“CC-RR”,其中两个不同的蛋白质链被共同组装,对应于具有下述序列的式(I)和(II):

对于式(I)来说:MGHHHHHHHHHHTFRGNNGHNSSSSLYNGS QFIEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFDASGSAKFVAAWTLKAAASGSWERWNAKWDEWRNDQNDWREDWQAWRDDWAYWTLTWRRGRLYSRLARIERRVEELRRLLQLIRHENRMVLQFVRALSMQARRLEALIDYNKAALSKFKEDARGTFRGNNGHNSSSSLYNGSQFIEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFD(SEQ ID NO:22)

以及

对于式(II)来说:MGHHHHHHHHHHTFRGNNGHNSSSSLYNGSQ FIEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFDASGSAKFVAAWTLKAAASGSWERWNAKWDEWRNDQNDWREDWQAWRDDWAYWTLTWRRGRLYSRLARIERRVEELRRLLQLIRHENRMVLQFVRALSMQARRLERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:23)。

所述第一构建物对应于式X1–ND1–L1–ND2–Y1(I)),其具有下述分结构:

X1:MGHHHHHHHHHHTFRGNNGHNSSSSLYNGSQFIEQLNNSF TSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFDASGSAKFVAAWTLKAAASGS(SEQ ID NO:24)

ND1:WERWNAKWDEWRNDQNDWREDWQAWRDDWAYWTL TW(SEQ ID NO:25)

L1:RRGR(SEQ ID NO:4)

ND2:LYSRLARIERRVEELRRLLQLIRHENRMVLQFVRALSMQ ARRL(SEQ ID NO:26)

Y1:EALIDYNKAALSKFKEDARGTFRGNNGHNSSSSLYNGSQF IEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFD(SEQ ID NO:27)。

所述第二构建物对应于式X2–ND3–L2–ND4–Y2(II),其具有下述分结构:

X2:MGHHHHHHHHHHTFRGNNGHNSSSSLYNGSQFIEQLNNSF TSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFDASGSAKFVAAWTLKAAASGS(SEQ ID NO:24)

ND3:WERWNAKWDEWRNDQNDWREDWQAWRDDWAYWTL TW(SEQ ID NO:25)

L2:RRGR(SEQ ID NO:4)

ND4:LYSRLARIERRVEELRRLLQLIRHENRMVLQFVRALSMQ ARRL(SEQ ID NO:26)

Y2:ERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIER LSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQKYKDGDKGDDKTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQID NO:28)。

具体来说,这些构建物中的不同片段如下:X1含有His标签(HHHHHHHHHH)(SEQ IDNO:29),紧随其后是疟疾抗原CelTOS(TFRGNNGHNSSSSLYNGSQFIEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFD)(SEQ ID NO:30)和泛DR结合表位PADRE(AKFVAAWTLKAAA)(SEQ ID NO:31),其两侧带有编码限制性位点NcoI、NheI和BamHI的肽序列(MG、ASGS和SGS)并被它们隔开。

ND1是源自于色氨酸拉链的五聚卷曲螺旋(Liu J等,Proc Natl Acad Sci U SA2004;101(46):16156-61,pdb条目编号1T8Z,SEQ ID NO:7),并具有一些电荷修饰。它与具有SEQ ID NO:3的DEDDLI-RR的ND1结构域相似。

L1是与DEDDLI-RR中相同的连接物,具有序列RRGR和SEQ ID NO:4。

ND2是具有与构建物DEDDLI-RR中的ND2(SEQ ID NO:5)非常相似的序列的卷曲螺旋结构域,也含有混杂的CD4/CD8表位IRHENRMVL(SEQ ID NO:8)(Parida R.等,Vaccine2007,25:7530–7539),对应于具有序列ID BAA01449.1的甲型流感病毒的基质蛋白1的第173位至第181位残基。

Y1始于含有来自于淋巴细胞性脉络丛脑膜炎哺乳类沙粒病毒病毒的糖蛋白的CD4表位的序列LIDYNKAALSKFKED(SEQ ID NO:32),后面跟有第二个疟疾抗原拷贝CelTOS(TFRGNNGHNSSSSLYNGSQF IEQLNNSFTSAFLESQSMNKIGDDLAETISNELVSVLQKNSPTFLESSFDIKSEVKKHAKSMLKELIKVGLPSFENLVAENVKPPKVDPATYGIIVPVLTSLFNKVETAVGAKVSDEIWNYNSPDVSESEESLSDDFFD)(SEQ ID NO:30),其两侧带有在DNA水平上编码限制性位点XhoI和XmaI的肽序列(LE和ARG)并被它们隔开。所述XhoI限制性位点与片段ND2共享。.

所述第一与第二构建物之间的唯一差异是分结构Y1和Y2中的差异,即在所述两个构建物之间其他片段是一致的,这意味着X1等于X2,ND1等于ND3,L1等于L2,并且ND2等于ND4。因此,所述两种构建物可以共同组装,因为两种构建物的卷曲螺旋寡聚化结构域是相同的。这是在专利WO2015/104352A1中已经描述过的概念,其中将含有鞭毛蛋白的蛋白质链与带有蛋白质链的B-细胞表位共同组装。

与所述第一构建物的Y1形成对比,所述第二构建物的Y2含有鞭毛蛋白的D0和D1结构域。它始于所述鞭毛蛋白序列之前的小α-螺旋区段(ERRLEEL)(SEQ ID NO:33),所述区段将ND4的卷曲螺旋延长了一点。Y2也在两侧带有编码限制性位点XhoI和XmaI的肽序列(LE和ARG)并被它们隔开,其中XhoI限制性位点与片段ND4共享。

所述两种构建物的共同组装形成在两个卷曲螺旋上都展示B-细胞表位CelTOS的SAPN,同时取决于所述第一与第二构建物之间的共同组装比,少量鞭毛蛋白分子被并入到所述SAPN中。带正电荷的连接物L1和L2也位于所述SAPN的中央空腔处,因此允许与带负电荷的CpG的离子相互作用。同样地,CpG ODN1826在重折叠期间被包封在所述SAPN中。

将所述两种构建物如实施例1、2和3中所述进行克隆、表达和纯化。重折叠和同时的包封如实施例5中对DEDDLI-RR所述来进行,对相同的1:0.6(蛋白质:CpG)的包封比使用的蛋白质量进行了修改,以将与DEDDLI-RR相比不同的分子量考虑在内。与DEDDLI-RR构建物相似,对于蛋白质链与CpG ODN1826F分子的比例来说,包封效率为约1:0.6,正如上文描述的荧光过滤实验的保留比所证实的。CC-RR能够在高达1:0.6的共同组装比下保留荧光ODN1826F分子(图12)。

对于58:2的第一和第二蛋白质链的共同组装比来说,描述SAPN的分子结构体系、共同组装/包封程序的过程和EM显微照片的图示出在图13中。

实施例12–具有CD4和CD8表位的HSV小鼠免疫原“RR-SSIEF”

对DEDDLI-RR构建物(实施例1),使用标准的分子生物学程序制备编码RR-SSIEF的DNA。含有编码如下蛋白质序列RR-SSIEF的DNA的质粒通过克隆到基础SAPN表达构建物pPEP-T的NcoI/EcoRI限制性位点中来构建(图3):

MGDKHHHHHHHHHHKDGSDKGSWEEWNARWDEWENDWNDWREDWQAWRDDWARWRATWRRGRLLSRLERLERRNEELRRLLQLIRHENRMVLQFVRALSMQNAELERRLEELARGMAQVINTNSLSLLTQNNLNRSQSALGTAIERLSSGLRINSARDDAAGQAIANRFTANIRGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVRVLAQDNTLTIQVGANDGETIDIDLRQINSQTLGLDQLNVQQAKFVAAWTLKAAASSIEFARLQFDDTENPLQRIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR(SEQ ID NO:34)。

这个具有结构体系X1–ND1–L1–ND2–Y1的构建物的序列与上文详细描述的DEDDLI-RR的序列相似。简短来说,这个构建物由通过具有序列RRGR的连接物L1连接到所述重新设计的二聚卷曲螺旋(ND2)的五聚卷曲螺旋色氨酸拉链(ND1)构成,其在所述五聚卷曲螺旋的最后一个核心位置与所述二聚卷曲螺旋的第一个核心位置之间含有3个正电荷。N-端处的序列X1含有His标签,而序列Y1含有鼠伤寒沙门氏菌鞭毛蛋白的片段,并由鞭毛蛋白的修饰的D0和D1结构域构成。连接鞭毛蛋白的D0和D1结构域的肽序列在MfeI和PstI限制性位点之间具有序列QLNVQQAKFVAAWTLKAAASSIEFARLQF DDTENPLQ(SEQ ID NO:35)。这个连接片段含有泛DR结合性CD4表位PADRE以及人α疱疹病毒2的包膜糖蛋白B的小鼠特异性(单倍型H-2k)CD8表位SSIEFARL。与MHC-I分子复合的这种肽的晶体结构保存在Brookhaven数据库,条目编码为1T0M。

为了诱导Th1免疫应答,使用A类CpG ODN1585代替B类ODN1826。ODN1585具有序列5’-ggGGTCAACGTTGAgggggg-3’(SEQ ID NR:39),其中采用大写字母的碱基表示磷酸二酯键,而采用小写字母的碱基在碱基之间含有硫代磷酸酯键。

将构建物RR-SSIEF如实施例1、2和3中所述进行克隆、表达和纯化。重折叠和同时的包封如实施例5中对DEDDLI-RR所述来进行,对包封比使用的蛋白质量进行了略微修改,以将RR-SSIEF与DEDDLI-RR相比略微不同的分子量和ODN1585与ODN1826的不同分子量考虑在内。对于免疫接种实验来说,使用1:0.6的蛋白质:ODN1585的摩尔比。在快速重折叠后,将含有包封有CpG的重折叠的纳米粒子的溶液透析并过滤。然后使用100kDa截留值的离心式滤器(Millipore)将所述样品浓缩。最后的无菌过滤步骤在无菌通风橱中使用0.2μm注射器滤器(Sartorius)进行。包封有ODN1585的RR-SSIEF的透射电子显微镜分析显示出形成非常良好的无聚集的纳米粒子(图14)。

SEQUENCE LISTING

<110> ALPHA-O PEPTIDES

<120> Self-assembling protein nanoparticles encapsulating

immunostimulatory nucleid acids

<130> P5288EP00

<160> 49

<170> PatentIn version 3.5

<210> 1

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> DEDDLI-RR

<400> 1

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Leu Ser Leu Leu Arg

385 390

<210> 2

<211> 22

<212> PRT

<213> Artificial Sequence

<220>

<223> His-tag

<400> 2

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser

20

<210> 3

<211> 36

<212> PRT

<213> Artificial Sequence

<220>

<223> Pentameric coiled coil

<400> 3

Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu Trp Glu Asn Asp Trp Asn

1 5 10 15

Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg Asp Asp Trp Ala Arg Trp

20 25 30

Arg Ala Thr Trp

35

<210> 4

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 4

Arg Arg Gly Arg

1

<210> 5

<211> 50

<212> PRT

<213> Artificial Sequence

<220>

<223> Trimeric coiled coil

<400> 5

Leu Leu Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg

1 5 10 15

Arg Leu Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe

20 25 30

Val Arg Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu

35 40 45

Glu Leu

50

<210> 6

<211> 282

<212> PRT

<213> Artificial Sequence

<220>

<223> D0D1 of flagellin

<400> 6

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

1 5 10 15

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

20 25 30

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

35 40 45

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

50 55 60

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

65 70 75 80

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg

85 90 95

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

100 105 110

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

115 120 125

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

130 135 140

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

145 150 155 160

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

165 170 175

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

180 185 190

Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

195 200 205

Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

210 215 220

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

225 230 235 240

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

245 250 255

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

260 265 270

Val Pro Gln Asn Val Leu Ser Leu Leu Arg

275 280

<210> 7

<211> 53

<212> PRT

<213> Artificial Sequence

<220>

<223> Trp-zipper

<400> 7

Ser Ser Asn Ala Lys Trp Asp Gln Trp Ser Ser Asp Trp Gln Thr Trp

1 5 10 15

Asn Ala Lys Trp Asp Gln Trp Ser Asn Asp Trp Asn Ala Trp Arg Ser

20 25 30

Asp Trp Gln Ala Trp Lys Asp Asp Trp Ala Arg Trp Asn Gln Arg Trp

35 40 45

Asp Asn Trp Ala Thr

50

<210> 8

<211> 9

<212> PRT

<213> Influenza virus

<400> 8

Ile Arg His Glu Asn Arg Met Val Leu

1 5

<210> 9

<211> 8

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker replacing D2 and D3 of flagellin

<400> 9

Asp Gly Asp Lys Gly Asp Asp Lys

1 5

<210> 10

<211> 180

<212> PRT

<213> Salmonella typhimurium

<400> 10

Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn

1 5 10 15

Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu

20 25 30

Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala Ala Gly Gln

35 40 45

Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu Thr Gln Ala

50 55 60

Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly

65 70 75 80

Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala

85 90 95

Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile

100 105 110

Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly

115 120 125

Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp Asn Thr Leu

130 135 140

Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu

145 150 155 160

Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu Asn Val Gln

165 170 175

Gln Lys Tyr Lys

180

<210> 11

<211> 91

<212> PRT

<213> Salmonella typhimurium

<400> 11

Thr Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp

1 5 10 15

Ala Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala

20 25 30

Ile Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser

35 40 45

Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg

50 55 60

Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn

65 70 75 80

Gln Val Pro Gln Asn Val Leu Ser Leu Leu Arg

85 90

<210> 12

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 12

Lys Lys Gly Lys

1

<210> 13

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> CpG ODN 1826

<220>

<221> misc_feature

<222> (1)..(20)

<223> all phosphorothioates bonds

<400> 13

tccatgacgt tcctgacgtt 20

<210> 14

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 14

Arg Arg Gly Arg Arg Gly Arg

1 5

<210> 15

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 15

Arg Arg Gly Arg Arg Gly Arg Arg Gly Arg

1 5 10

<210> 16

<211> 399

<212> PRT

<213> Artificial Sequence

<220>

<223> 2RR

<400> 16

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Glu Glu Trp Glu Glu Trp Asn Ala Arg Trp

20 25 30

Asp Glu Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala

35 40 45

Trp Arg Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg

50 55 60

Arg Gly Arg Leu Leu Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu

65 70 75 80

Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu Asn Arg Met Val

85 90 95

Leu Gln Phe Val Arg Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg

100 105 110

Arg Leu Glu Glu Leu Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn

115 120 125

Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala

130 135 140

Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser

145 150 155 160

Ala Arg Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala

165 170 175

Asn Ile Arg Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile

180 185 190

Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn

195 200 205

Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn

210 215 220

Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu

225 230 235 240

Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg

245 250 255

Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp

260 265 270

Gly Glu Thr Ile Asp Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu

275 280 285

Gly Leu Asp Gln Leu Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys

290 295 300

Gly Asp Asp Lys Thr Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu

305 310 315 320

Ala Gln Val Asp Ala Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg

325 330 335

Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser

340 345 350

Glu Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser

355 360 365

Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu

370 375 380

Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu Arg

385 390 395

<210> 17

<211> 402

<212> PRT

<213> Artificial Sequence

<220>

<223> 3RR

<400> 17

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Glu Glu Trp Glu Glu Trp Asn Ala Arg Trp

20 25 30

Asp Glu Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala

35 40 45

Trp Arg Asp Asp Trp Ala Arg Trp Asp Ala Thr Trp Arg Arg Gly Arg

50 55 60

Arg Gly Arg Arg Gly Arg Leu Leu Ser Arg Leu Glu Arg Leu Glu Arg

65 70 75 80

Arg Asn Glu Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu Asn

85 90 95

Arg Met Val Leu Gln Phe Val Arg Ala Leu Ser Met Gln Asn Ala Glu

100 105 110

Leu Glu Arg Arg Leu Glu Glu Leu Ala Arg Gly Met Ala Gln Val Ile

115 120 125

Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Arg Ser

130 135 140

Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg

145 150 155 160

Ile Asn Ser Ala Arg Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg

165 170 175

Phe Thr Ala Asn Ile Arg Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn

180 185 190

Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile

195 200 205

Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn

210 215 220

Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr

225 230 235 240

Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn

245 250 255

Gly Val Arg Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly

260 265 270

Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Arg Gln Ile Asn Ser

275 280 285

Gln Thr Leu Gly Leu Asp Gln Leu Asn Val Gln Gln Lys Tyr Lys Asp

290 295 300

Gly Asp Lys Gly Asp Asp Lys Thr Glu Asn Pro Leu Gln Arg Ile Asp

305 310 315 320

Ala Ala Leu Ala Gln Val Asp Ala Leu Arg Ser Asp Leu Gly Ala Val

325 330 335

Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn

340 345 350

Asn Leu Ser Glu Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr

355 360 365

Glu Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr

370 375 380

Ser Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu

385 390 395 400

Leu Arg

<210> 18

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> LIVELI1-RR

<400> 18

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Lys Val Lys

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Lys Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Ala Ala Ala Ala Arg

385 390

<210> 19

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> LIVELI2-RR

<400> 19

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Lys Val Lys

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Lys Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Ala Ala Ala Ala Arg

385 390

<210> 20

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> LIVELI1

<400> 20

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Met Gly Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Lys Val Lys

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Lys Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Ala Ala Ala Ala Arg

385 390

<210> 21

<211> 394

<212> PRT

<213> Artificial Sequence

<220>

<223> LIVELI2

<400> 21

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Met Gly Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Lys Val Lys

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Lys Tyr Lys Asp Gly Asp Lys Gly Asp Asp Lys Thr

290 295 300

Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Ala

305 310 315 320

Leu Lys Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile

325 330 335

Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg

340 345 350

Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala

355 360 365

Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln

370 375 380

Val Pro Gln Asn Val Ala Ala Ala Ala Arg

385 390

<210> 22

<211> 453

<212> PRT

<213> Artificial Sequence

<220>

<223> CC-RR

<400> 22

Met Gly His His His His His His His His His His Thr Phe Arg Gly

1 5 10 15

Asn Asn Gly His Asn Ser Ser Ser Ser Leu Tyr Asn Gly Ser Gln Phe

20 25 30

Ile Glu Gln Leu Asn Asn Ser Phe Thr Ser Ala Phe Leu Glu Ser Gln

35 40 45

Ser Met Asn Lys Ile Gly Asp Asp Leu Ala Glu Thr Ile Ser Asn Glu

50 55 60

Leu Val Ser Val Leu Gln Lys Asn Ser Pro Thr Phe Leu Glu Ser Ser

65 70 75 80

Phe Asp Ile Lys Ser Glu Val Lys Lys His Ala Lys Ser Met Leu Lys

85 90 95

Glu Leu Ile Lys Val Gly Leu Pro Ser Phe Glu Asn Leu Val Ala Glu

100 105 110

Asn Val Lys Pro Pro Lys Val Asp Pro Ala Thr Tyr Gly Ile Ile Val

115 120 125

Pro Val Leu Thr Ser Leu Phe Asn Lys Val Glu Thr Ala Val Gly Ala

130 135 140

Lys Val Ser Asp Glu Ile Trp Asn Tyr Asn Ser Pro Asp Val Ser Glu

145 150 155 160

Ser Glu Glu Ser Leu Ser Asp Asp Phe Phe Asp Ala Ser Gly Ser Ala

165 170 175

Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala Ser Gly Ser Trp

180 185 190

Glu Arg Trp Asn Ala Lys Trp Asp Glu Trp Arg Asn Asp Gln Asn Asp

195 200 205

Trp Arg Glu Asp Trp Gln Ala Trp Arg Asp Asp Trp Ala Tyr Trp Thr

210 215 220

Leu Thr Trp Arg Arg Gly Arg Leu Tyr Ser Arg Leu Ala Arg Ile Glu

225 230 235 240

Arg Arg Val Glu Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu

245 250 255

Asn Arg Met Val Leu Gln Phe Val Arg Ala Leu Ser Met Gln Ala Arg

260 265 270

Arg Leu Glu Ala Leu Ile Asp Tyr Asn Lys Ala Ala Leu Ser Lys Phe

275 280 285

Lys Glu Asp Ala Arg Gly Thr Phe Arg Gly Asn Asn Gly His Asn Ser

290 295 300

Ser Ser Ser Leu Tyr Asn Gly Ser Gln Phe Ile Glu Gln Leu Asn Asn

305 310 315 320

Ser Phe Thr Ser Ala Phe Leu Glu Ser Gln Ser Met Asn Lys Ile Gly

325 330 335

Asp Asp Leu Ala Glu Thr Ile Ser Asn Glu Leu Val Ser Val Leu Gln

340 345 350

Lys Asn Ser Pro Thr Phe Leu Glu Ser Ser Phe Asp Ile Lys Ser Glu

355 360 365

Val Lys Lys His Ala Lys Ser Met Leu Lys Glu Leu Ile Lys Val Gly

370 375 380

Leu Pro Ser Phe Glu Asn Leu Val Ala Glu Asn Val Lys Pro Pro Lys

385 390 395 400

Val Asp Pro Ala Thr Tyr Gly Ile Ile Val Pro Val Leu Thr Ser Leu

405 410 415

Phe Asn Lys Val Glu Thr Ala Val Gly Ala Lys Val Ser Asp Glu Ile

420 425 430

Trp Asn Tyr Asn Ser Pro Asp Val Ser Glu Ser Glu Glu Ser Leu Ser

435 440 445

Asp Asp Phe Phe Asp

450

<210> 23

<211> 563

<212> PRT

<213> Artificial Sequence

<220>

<223> CC-RR-D0D1

<400> 23

Met Gly His His His His His His His His His His Thr Phe Arg Gly

1 5 10 15

Asn Asn Gly His Asn Ser Ser Ser Ser Leu Tyr Asn Gly Ser Gln Phe

20 25 30

Ile Glu Gln Leu Asn Asn Ser Phe Thr Ser Ala Phe Leu Glu Ser Gln

35 40 45

Ser Met Asn Lys Ile Gly Asp Asp Leu Ala Glu Thr Ile Ser Asn Glu

50 55 60

Leu Val Ser Val Leu Gln Lys Asn Ser Pro Thr Phe Leu Glu Ser Ser

65 70 75 80

Phe Asp Ile Lys Ser Glu Val Lys Lys His Ala Lys Ser Met Leu Lys

85 90 95

Glu Leu Ile Lys Val Gly Leu Pro Ser Phe Glu Asn Leu Val Ala Glu

100 105 110

Asn Val Lys Pro Pro Lys Val Asp Pro Ala Thr Tyr Gly Ile Ile Val

115 120 125

Pro Val Leu Thr Ser Leu Phe Asn Lys Val Glu Thr Ala Val Gly Ala

130 135 140

Lys Val Ser Asp Glu Ile Trp Asn Tyr Asn Ser Pro Asp Val Ser Glu

145 150 155 160

Ser Glu Glu Ser Leu Ser Asp Asp Phe Phe Asp Ala Ser Gly Ser Ala

165 170 175

Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala Ser Gly Ser Trp

180 185 190

Glu Arg Trp Asn Ala Lys Trp Asp Glu Trp Arg Asn Asp Gln Asn Asp

195 200 205

Trp Arg Glu Asp Trp Gln Ala Trp Arg Asp Asp Trp Ala Tyr Trp Thr

210 215 220

Leu Thr Trp Arg Arg Gly Arg Leu Tyr Ser Arg Leu Ala Arg Ile Glu

225 230 235 240

Arg Arg Val Glu Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu

245 250 255

Asn Arg Met Val Leu Gln Phe Val Arg Ala Leu Ser Met Gln Ala Arg

260 265 270

Arg Leu Glu Arg Arg Leu Glu Glu Leu Ala Arg Gly Met Ala Gln Val

275 280 285

Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Arg

290 295 300

Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu

305 310 315 320

Arg Ile Asn Ser Ala Arg Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn

325 330 335

Arg Phe Thr Ala Asn Ile Arg Gly Leu Thr Gln Ala Ser Arg Asn Ala

340 345 350

Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu

355 360 365

Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala

370 375 380

Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile

385 390 395 400

Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe

405 410 415

Asn Gly Val Arg Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val

420 425 430

Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Arg Gln Ile Asn

435 440 445

Ser Gln Thr Leu Gly Leu Asp Gln Leu Asn Val Gln Gln Lys Tyr Lys

450 455 460

Asp Gly Asp Lys Gly Asp Asp Lys Thr Glu Asn Pro Leu Gln Arg Ile

465 470 475 480

Asp Ala Ala Leu Ala Gln Val Asp Ala Leu Arg Ser Asp Leu Gly Ala

485 490 495

Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val

500 505 510

Asn Asn Leu Ser Glu Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala

515 520 525

Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly

530 535 540

Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser

545 550 555 560

Leu Leu Arg

<210> 24

<211> 191

<212> PRT

<213> Artificial Sequence

<220>

<223> substituent

<400> 24

Met Gly His His His His His His His His His His Thr Phe Arg Gly

1 5 10 15

Asn Asn Gly His Asn Ser Ser Ser Ser Leu Tyr Asn Gly Ser Gln Phe

20 25 30

Ile Glu Gln Leu Asn Asn Ser Phe Thr Ser Ala Phe Leu Glu Ser Gln

35 40 45

Ser Met Asn Lys Ile Gly Asp Asp Leu Ala Glu Thr Ile Ser Asn Glu

50 55 60

Leu Val Ser Val Leu Gln Lys Asn Ser Pro Thr Phe Leu Glu Ser Ser

65 70 75 80

Phe Asp Ile Lys Ser Glu Val Lys Lys His Ala Lys Ser Met Leu Lys

85 90 95

Glu Leu Ile Lys Val Gly Leu Pro Ser Phe Glu Asn Leu Val Ala Glu

100 105 110

Asn Val Lys Pro Pro Lys Val Asp Pro Ala Thr Tyr Gly Ile Ile Val

115 120 125

Pro Val Leu Thr Ser Leu Phe Asn Lys Val Glu Thr Ala Val Gly Ala

130 135 140

Lys Val Ser Asp Glu Ile Trp Asn Tyr Asn Ser Pro Asp Val Ser Glu

145 150 155 160

Ser Glu Glu Ser Leu Ser Asp Asp Phe Phe Asp Ala Ser Gly Ser Ala

165 170 175

Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala Ser Gly Ser

180 185 190

<210> 25

<211> 36

<212> PRT

<213> Artificial Sequence

<220>

<223> oligomerization domain

<400> 25

Trp Glu Arg Trp Asn Ala Lys Trp Asp Glu Trp Arg Asn Asp Gln Asn

1 5 10 15

Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg Asp Asp Trp Ala Tyr Trp

20 25 30

Thr Leu Thr Trp

35

<210> 26

<211> 43

<212> PRT

<213> Artificial Sequence

<220>

<223> oligomerization domain

<400> 26

Leu Tyr Ser Arg Leu Ala Arg Ile Glu Arg Arg Val Glu Glu Leu Arg

1 5 10 15

Arg Leu Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe

20 25 30

Val Arg Ala Leu Ser Met Gln Ala Arg Arg Leu

35 40

<210> 27

<211> 179

<212> PRT

<213> Artificial Sequence

<220>

<223> substituent

<400> 27

Glu Ala Leu Ile Asp Tyr Asn Lys Ala Ala Leu Ser Lys Phe Lys Glu

1 5 10 15

Asp Ala Arg Gly Thr Phe Arg Gly Asn Asn Gly His Asn Ser Ser Ser

20 25 30

Ser Leu Tyr Asn Gly Ser Gln Phe Ile Glu Gln Leu Asn Asn Ser Phe

35 40 45

Thr Ser Ala Phe Leu Glu Ser Gln Ser Met Asn Lys Ile Gly Asp Asp

50 55 60

Leu Ala Glu Thr Ile Ser Asn Glu Leu Val Ser Val Leu Gln Lys Asn

65 70 75 80

Ser Pro Thr Phe Leu Glu Ser Ser Phe Asp Ile Lys Ser Glu Val Lys

85 90 95

Lys His Ala Lys Ser Met Leu Lys Glu Leu Ile Lys Val Gly Leu Pro

100 105 110

Ser Phe Glu Asn Leu Val Ala Glu Asn Val Lys Pro Pro Lys Val Asp

115 120 125

Pro Ala Thr Tyr Gly Ile Ile Val Pro Val Leu Thr Ser Leu Phe Asn

130 135 140

Lys Val Glu Thr Ala Val Gly Ala Lys Val Ser Asp Glu Ile Trp Asn

145 150 155 160

Tyr Asn Ser Pro Asp Val Ser Glu Ser Glu Glu Ser Leu Ser Asp Asp

165 170 175

Phe Phe Asp

<210> 28

<211> 289

<212> PRT

<213> Artificial Sequence

<220>

<223> substituent

<400> 28

Glu Arg Arg Leu Glu Glu Leu Ala Arg Gly Met Ala Gln Val Ile Asn

1 5 10 15

Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Arg Ser Gln

20 25 30

Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg Ile

35 40 45

Asn Ser Ala Arg Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg Phe

50 55 60

Thr Ala Asn Ile Arg Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn Asp

65 70 75 80

Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile Asn

85 90 95

Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn Ser

100 105 110

Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr Gln

115 120 125

Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn Gly

130 135 140

Val Arg Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly Ala

145 150 155 160

Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Arg Gln Ile Asn Ser Gln

165 170 175

Thr Leu Gly Leu Asp Gln Leu Asn Val Gln Gln Lys Tyr Lys Asp Gly

180 185 190

Asp Lys Gly Asp Asp Lys Thr Glu Asn Pro Leu Gln Arg Ile Asp Ala

195 200 205

Ala Leu Ala Gln Val Asp Ala Leu Arg Ser Asp Leu Gly Ala Val Gln

210 215 220

Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn

225 230 235 240

Leu Ser Glu Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu

245 250 255

Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser

260 265 270

Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu

275 280 285

Arg

<210> 29

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<223> His-tag

<400> 29

His His His His His His His His His His

1 5 10

<210> 30

<211> 159

<212> PRT

<213> Artificial Sequence

<220>

<223> CelTOS

<400> 30

Thr Phe Arg Gly Asn Asn Gly His Asn Ser Ser Ser Ser Leu Tyr Asn

1 5 10 15

Gly Ser Gln Phe Ile Glu Gln Leu Asn Asn Ser Phe Thr Ser Ala Phe

20 25 30

Leu Glu Ser Gln Ser Met Asn Lys Ile Gly Asp Asp Leu Ala Glu Thr

35 40 45

Ile Ser Asn Glu Leu Val Ser Val Leu Gln Lys Asn Ser Pro Thr Phe

50 55 60

Leu Glu Ser Ser Phe Asp Ile Lys Ser Glu Val Lys Lys His Ala Lys

65 70 75 80

Ser Met Leu Lys Glu Leu Ile Lys Val Gly Leu Pro Ser Phe Glu Asn

85 90 95

Leu Val Ala Glu Asn Val Lys Pro Pro Lys Val Asp Pro Ala Thr Tyr

100 105 110

Gly Ile Ile Val Pro Val Leu Thr Ser Leu Phe Asn Lys Val Glu Thr

115 120 125

Ala Val Gly Ala Lys Val Ser Asp Glu Ile Trp Asn Tyr Asn Ser Pro

130 135 140

Asp Val Ser Glu Ser Glu Glu Ser Leu Ser Asp Asp Phe Phe Asp

145 150 155

<210> 31

<211> 13

<212> PRT

<213> Artificial Sequence

<220>

<223> PADRE

<400> 31

Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala

1 5 10

<210> 32

<211> 15

<212> PRT

<213> Lymphocytic choriomeningitis virus

<400> 32

Leu Ile Asp Tyr Asn Lys Ala Ala Leu Ser Lys Phe Lys Glu Asp

1 5 10 15

<210> 33

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> alpha-helical segment

<400> 33

Glu Arg Arg Leu Glu Glu Leu

1 5

<210> 34

<211> 408

<212> PRT

<213> Artificial Sequence

<220>

<223> RR-SSIEF

<400> 34

Met Gly Asp Lys His His His His His His His His His His Lys Asp

1 5 10 15

Gly Ser Asp Lys Gly Ser Trp Glu Glu Trp Asn Ala Arg Trp Asp Glu

20 25 30

Trp Glu Asn Asp Trp Asn Asp Trp Arg Glu Asp Trp Gln Ala Trp Arg

35 40 45

Asp Asp Trp Ala Arg Trp Arg Ala Thr Trp Arg Arg Gly Arg Leu Leu

50 55 60

Ser Arg Leu Glu Arg Leu Glu Arg Arg Asn Glu Glu Leu Arg Arg Leu

65 70 75 80

Leu Gln Leu Ile Arg His Glu Asn Arg Met Val Leu Gln Phe Val Arg

85 90 95

Ala Leu Ser Met Gln Asn Ala Glu Leu Glu Arg Arg Leu Glu Glu Leu

100 105 110

Ala Arg Gly Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu

115 120 125

Thr Gln Asn Asn Leu Asn Arg Ser Gln Ser Ala Leu Gly Thr Ala Ile

130 135 140

Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn Ser Ala Arg Asp Asp Ala

145 150 155 160

Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Arg Gly Leu

165 170 175

Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr

180 185 190

Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg

195 200 205

Glu Leu Ala Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu

210 215 220

Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg

225 230 235 240

Val Ser Gly Gln Thr Gln Phe Asn Gly Val Arg Val Leu Ala Gln Asp

245 250 255

Asn Thr Leu Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp

260 265 270

Ile Asp Leu Arg Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Gln Leu

275 280 285

Asn Val Gln Gln Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala

290 295 300

Ala Ser Ser Ile Glu Phe Ala Arg Leu Gln Phe Asp Asp Thr Glu Asn

305 310 315 320

Pro Leu Gln Arg Ile Asp Ala Ala Leu Ala Gln Val Asp Ala Leu Arg

325 330 335

Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn

340 345 350

Leu Gly Asn Thr Val Asn Asn Leu Ser Glu Ala Arg Ser Arg Ile Glu

355 360 365

Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile

370 375 380

Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro

385 390 395 400

Gln Asn Val Leu Ser Leu Leu Arg

405

<210> 35

<211> 37

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker replacing D2 and D3 of flagellin

<400> 35

Gln Leu Asn Val Gln Gln Ala Lys Phe Val Ala Ala Trp Thr Leu Lys

1 5 10 15

Ala Ala Ala Ser Ser Ile Glu Phe Ala Arg Leu Gln Phe Asp Asp Thr

20 25 30

Glu Asn Pro Leu Gln

35

<210> 36

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Modification of pentamer

<400> 36

Arg Ala Thr Trp

1

<210> 37

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Modified sequence in Trp-zipper

<400> 37

Asn Gln Arg Trp

1

<210> 38

<211> 28

<212> PRT

<213> Artificial Sequence

<220>

<223> Pan DR binding CD4 epitope string

<400> 38

Glu Leu Arg Arg Leu Leu Gln Leu Ile Arg His Glu Asn Arg Met Val

1 5 10 15

Leu Gln Phe Val Arg Ala Leu Ser Met Gln Asn Ala

20 25

<210> 39

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> CpG ODN1585

<220>

<221> misc_feature

<222> (1)..(20)

<223> phosphorothioate bond between residues 1 and 2, between residues

15 and 16, between residues 16 and 17, between residues 17 and

18, between residues 18 and 19, and between residues 19 and 20

<400> 39

ggggtcaacg ttgagggggg 20

<210> 40

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Alanines

<400> 40

Ala Ala Ala Ala

1

<210> 41

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<223> Linker

<400> 41

Met Gly Gly Arg

1

<210> 42

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> CpG ODN 2006 (ODN 7909)

<220>

<221> misc_feature

<222> (1)..(24)

<223> all phosphorothioates bonds

<400> 42

tcgtcgtttt gtcgttttgt cgtt 24

<210> 43

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN 2216

<220>

<221> misc_feature

<222> (1)..(20)

<223> phosphorothioate bond between residues 1 and 2, between residues

15 and 16, between residues 16 and 17, between residues 17 and

18, between residues 18 and 19, and between residues 19 and 20

<400> 43

gggggacgat cgtcgggggg 20

<210> 44

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN 2336

<220>

<221> misc_feature

<222> (1)..(21)

<223> phosphorothioate bond between residues 1 and 2, etween residues 2

and 3, between residues 16 and 17, between residues 17 and 18,

between residues 18 and 19, between residues 19 and 20, and

between residues 20 and 21

<400> 44

ggggacgacg tcgtgggggg g 21

<210> 45

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN BW006

<220>

<221> misc_feature

<222> (1)..(23)

<223> all phosphorothioates bonds

<400> 45

tcgacgttcg tcgttcgtcg ttc 23

<210> 46

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN 2395

<220>

<221> misc_feature

<222> (1)..(22)

<223> all phosphorothioates bonds

<400> 46

tcgtcgtttt cggcgcgcgc cg 22

<210> 47

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN M362

<220>

<221> misc_feature

<222> (1)..(25)

<223> all phosphorothioates bonds

<400> 47

tcgtcgtcgt tcgaacgacg ttgat 25

<210> 48

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN D-SL03

<220>

<221> misc_feature

<222> (1)..(29)

<223> all phosphorothioates bonds

<400> 48

tcgcgaacgt tcgccgcgtt cgaacgcgg 29

<210> 49

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> ODN D-SL01

<220>

<221> misc_feature

<222> (1)..(26)

<223> all phosphorothioates bonds

<400> 49

tcgcgacgtt cgcccgacgt tcggta 26

83页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:使二硫键还原最小化的抗体生产方法

相关技术

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类