胞外囊泡缀合物及其用途

文档序号:1926227 发布日期:2021-12-03 浏览:21次 >En<

阅读说明:本技术 胞外囊泡缀合物及其用途 (Extracellular vesicle conjugates and uses thereof ) 是由 拉塞尔·E·麦克康纳尔 斯里拉姆·萨提亚那拉雅南 于 2020-03-20 设计创作,主要内容包括:本公开涉及包含经由马来酰亚胺部分共价连接至所述胞外囊泡的生物活性分子的胞外囊泡(例如,外泌体),所述胞外囊泡可以用作预防或治疗癌症和其他疾病的药剂。本文还提供了用于产生所述胞外囊泡的方法和用于使用所述胞外囊泡来治疗疾病或障碍的方法。(The present disclosure relates to extracellular vesicles (e.g., exosomes) comprising a biologically active molecule covalently attached to the extracellular vesicles via a maleimide moiety, which can be used as agents for preventing or treating cancer and other diseases. Also provided herein are methods for producing the extracellular vesicles and methods for using the extracellular vesicles to treat diseases or disorders.)

胞外囊泡缀合物及其用途

相关申请的交叉引用

本PCT申请要求2019年3月21日提交的美国临时申请号62/822,014和2019年4月17日提交的美国临时申请号62/835,439的优先权权益,每个临时申请均以引用的方式整体并入本文。

通过EFS-WEB以电子方式提交的序列表的引用

在本申请中提交的以电子方式提交的序列表(名称:4000_037PC03_SL_ST25.txt;大小:235,506字节;以及创建日期:2020年3月20日)的内容以引用的方式整体并入本文。

技术领域

本发明提供了胞外囊泡(EV)(例如,外泌体),所述胞外囊泡包含至少一种经由马来酰亚胺部分共价连接至胞外囊泡(例如,外泌体)的生物活性分子,所述胞外囊泡可以用作预防或治疗癌症和其他疾病的药剂。

背景技术

很多生物活性化合物具有有治疗意义的有效生物活性。然而,这些化合物通常在非靶标器官中表现出毒性。限制非靶标组织暴露的一种方式是将小分子化学缀合至基于亲和力的试剂,诸如抗体,这可以将治疗化合物引导至特定细胞类型(Dosio,F.等人,Toxins(Basel)3(7):848-883(2011)),但是这种方法受到可以连接至抗体的所关注的化合物的分子的数量(通常每个抗体2-6个分子)以及特异性结合至被靶向的相关患病/效应细胞而不结合至非靶标细胞的抗体的可用性/存在的限制。这两个问题分别通过降低效力和增加全身毒性来限制抗体-药物缀合物(ADC)的使用。因此,需要具有比ADC更高的有效负载的递送系统,所述递送系统可以选择性地靶向特定组织或器官,同时限制治疗化合物的总体全身暴露。

EV(例如,外泌体)是细胞间通讯的重要介质。它们也是很多疾病(诸如癌症)的诊断和预后的重要生物标志物。作为药物递送载体,EV(例如,外泌体)在很多治疗领域作为一种新型治疗方式,与传统的药物递送方法(例如,肽免疫、DNA疫苗)相比,具有很多优点。然而,虽然具有优点,但是很多EV(例如,外泌体)的临床功效有限。例如,在不能手术的非小细胞肺癌(NSCLC)患者的一线化疗后,将树突细胞源性外泌体(DEX)在II期临床试验中作为维持免疫疗法进行了研究。然而,由于未达到主要终点(至少50%的患者在化疗停止后具有4个月的无进展存活期(PFS)),试验被终止。Besse,B.等人,Onco immunology 5(4):e1071008(2015)。

因此,必需新型和更有效的经工程化的EV(例如,外泌体)来更好地实现基于EV的技术的治疗用途和其他应用。

发明内容

本公开提供了一种胞外囊泡(例如,外泌体),所述胞外囊泡包含经由马来酰亚胺部分共价连接至EV(例如,外泌体)的生物活性分子。在一些方面,所述马来酰亚胺部分具有式(I):

其中

R1选自由以下各项组成的组:-C1-10亚烷基-、-C3-8碳环-、-O-(C1-8亚烷基)-、-亚芳基-、-C1-10亚烷基-亚芳基-、-亚芳基-C1-10亚烷基-、-C1-10亚烷基-(C3-8碳环)-、-(C3-8碳环)-C1-10亚烷基-、-C3-8杂环-、-C1-10亚烷基-(C3-8杂环)-、-(C3-8杂环)-C1-10亚烷基-、-(CH2CH2O)r-和-(CH2CH2O)r-CH2-;

r为1至10的整数;

*表示所述马来酰亚胺部分与所述EV(例如,外泌体)的共价连接位点;并且,

波浪线表示所述马来酰亚胺部分与所述生物活性分子的连接位点。

在一些方面,R1是-(CH2)s-,其中s为4、5或6。在一些方面,所述马来酰亚胺部分具有式(II),其中R1是-(CH2)5-:

在一些方面,所述马来酰亚胺部分具有式(III),其中R1是-(CH2CH2O)r-CH2-,其中r为2:

在一些方面,所述马来酰亚胺部分共价连接至存在于所述EV(例如,外泌体)上的官能团,其中所述官能团是巯基基团。在一些方面,所述巯基基团在所述EV(例如,外泌体)表面的蛋白质上。在一些方面,所述马来酰亚胺部分通过接头连接至所述生物活性分子。在一些方面,所述接头包括可切割的接头。在一些方面,所述可切割的接头被蛋白酶切割。在一些方面,所述蛋白酶是组织蛋白酶。在一些方面,所述接头是还原敏感型接头或酸不稳定型接头。

在一些方面,所述接头具有式(IV):

-Aa-Yy- (IV),

其中每个-A-独立地是氨基酸单元,a独立地为1至12的整数;-Y-是间隔基单元,和y为0、1或2。

在一些方面,-Aa-是二肽、三肽、四肽、五肽或六肽。在一些方面,a为2,并且-Aa-选自由以下各项组成的组:缬氨酸-丙氨酸、缬氨酸-瓜氨酸、苯丙氨酸-赖氨酸、N-甲基缬氨酸-瓜氨酸、环己基丙氨酸-赖氨酸和β-丙氨酸-赖氨酸。在一些方面,-Aa-是缬氨酸-丙氨酸或缬氨酸-瓜氨酸。在一些方面,y为1。

在一些方面,-Y-是自分解间隔基。在一些方面,-Yy-具有式(V):

其中每个R2独立地是C1-8烷基、-O-(C1-8烷基)、卤素、硝基或氰基;并且m为0至4的整数。

在一些方面,m为0、1或2。在一些方面,m为0。在一些方面,所述可切割的接头是缬氨酸-丙氨酸-对氨基苄基氨基甲酸根或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸根。在一些方面,-Y-是非自分解间隔基。在一些方面,所述非自分解间隔基是-Gly-或-Gly-Gly-。

在一些方面,所述接头是“酸不稳定型接头”。在一些方面,所述酸不稳定型接头包括顺式乌头酸接头、酰肼接头、硫代氨基甲酰基接头或它们的任何组合。在一些方面,所述酸不稳定型接头包含将所述生物活性分子连接至所述酸不稳定型接头的间隔基单元。

在一些方面,所述间隔基单元具有式(V):

其中每个R2独立地是C1-8烷基、-O-(C1-8烷基)、卤素、硝基或氰基;并且m为0至4的整数。

在一些方面,所述接头是不可切割的接头。在一些方面,所述不可切割的接头包含四乙二醇(TEG)、聚乙二醇(PEG)、琥珀酰亚胺或它们的任何组合。在一些方面,所述不可切割的接头包含将所述生物活性分子连接至所述不可切割的接头的间隔基单元。在一些方面,所述间隔基单元具有式(V):

其中每个R2独立地是C1-8烷基、-O-(C1-8烷基)、卤素、硝基或氰基;并且m为0至4的整数。

本公开还提供了一种包含生物活性分子和可切割的接头的EV(例如,外泌体),其中所述可切割的接头将所述EV(例如,外泌体)连接至所述生物活性分子,并且所述可切割的接头包括缬氨酸-丙氨酸-对氨基苄基氨基甲酸根或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸根。在一些方面,所述EV(例如,外泌体)还包含马来酰亚胺部分,所述马来酰亚胺部分经由存在于所述EV(例如,外泌体)上的官能团将所述EV(例如,外泌体)连接至所述可切割的接头。

在一些方面,所述马来酰亚胺部分具有式(I):

其中

R1选自由以下各项组成的组:-C1-10亚烷基-、-C3-8碳环-、-O-(C1-8亚烷基)-、-亚芳基-、-C1-10亚烷基-亚芳基-、-亚芳基-C1-10亚烷基-、-C1-10亚烷基-(C3-8碳环)-、-(C3-8碳环)-C1-10亚烷基-、-C3-8杂环-、-C1-10亚烷基-(C3-8杂环)-、-(C3-8杂环)-C1-10亚烷基-、-(CH2CH2O)r-和-(CH2CH2O)r-CH2-;

r为1至10的整数;并且

*表示所述马来酰亚胺部分与所述EV(例如,外泌体)的共价连接位点;并且,

波浪线表示所述马来酰亚胺部分与所述生物活性分子的连接位点。

在一些方面,R1是-(CH2)s-,其中s为4、5或6。在一些方面,所述马来酰亚胺部分具有式(II),其中R1是-(CH2)5-:

在一些方面,所述马来酰亚胺部分具有式(III),其中R1是-(CH2CH2O)r-CH2-,其中r为2:

在一些方面,所述马来酰亚胺部分共价连接至存在于所述EV(例如,外泌体)上的官能团。在一些方面,所述官能团在所述EV(例如,外泌体)上的聚糖上。在一些方面,所述官能团是巯基(硫醇)。在一些方面,所述官能团在所述EV(例如,外泌体)表面的蛋白质上。在一些方面,所述蛋白质是支架部分。在一些方面,所述蛋白质是PTGFRN多肽、BSG多肽、IGSF2多肽、IGSF3多肽、IGSF8多肽、ITGB1多肽、ITGA4多肽、SLC3A2多肽、ATP转运蛋白多肽或它们的片段。

本公开还提供了一种包含马来酰亚胺部分、可切割的接头和生物活性分子的EV(例如,外泌体),其中所述马来酰亚胺部分将所述EV(例如,外泌体)连接至所述可切割的接头,并且所述可切割的接头将所述马来酰亚胺部分连接至所述生物活性分子。

在一些方面,所述生物活性分子是多肽、肽、多核苷酸(DNA和/或RNA)、化学化合物或它们的任何组合。在一些方面,所述生物活性分子是化学化合物。在一些方面,所述化学化合物是小分子。在一些方面,所述小分子是蛋白水解靶向嵌合体(PROTAC)。

在一些方面,所述生物活性分子是核苷酸,其中所述核苷酸是干扰素基因刺激蛋白(STING)激动剂。在一些方面,所述STING激动剂包括环状二核苷酸STING激动剂或非环状二核苷酸STING激动剂。

在一些方面,所述EV包含具有式(VI)或(VII)的(马来酰亚胺部分)-(可切割的接头)-(生物活性分子):

或它们的药用盐。

在一些方面,所述EV包含具有式(VIII)、(IX)、(X)或(XI)的(马来酰亚胺部分)-(可切割的接头)-(生物活性分子):

或它们的药用盐。

在一些方面,所述EV(例如,外泌体)被修饰以暴露共价连接所述马来酰亚胺部分的表面上的官能团。在一些方面,所述官能团是巯基基团。在一些方面,所述官能团通过用还原剂处理所述EV(例如,外泌体)来暴露。在一些方面,所述还原剂包括TCEP(三(2-羧乙基)膦)、DTT(二硫苏糖醇)、BME(2-巯基乙醇)、硫醇化剂或它们的任何组合。在一些方面,所述硫醇化剂包括Traut试剂(2-亚氨基硫杂环戊烷)。

在多个方面,本公开的EV包括外泌体。

本公开还提供了一种包含本文公开的EV(例如,外泌体)和药学上可接受的载剂的药物组合物。

本公开还提供了一种将生物活性分子缀合至EV(例如,外泌体)的方法,所述方法包括将马来酰亚胺部分连接至所述EV(例如,外泌体)。在一些方面,所述连接包括用还原剂处理所述EV(例如,外泌体)。在一些方面,所述还原剂是包括TCEP(三(2-羧乙基)膦)、DTT(二硫苏糖醇)、BME(2-巯基乙醇)、硫醇化剂或它们的任何组合。在一些方面,所述硫醇化剂包括Traut试剂(2-亚氨基硫杂环戊烷)。在一些方面,所述连接还包括使减少的EV(例如,外泌体)接触所述马来酰亚胺部分。在一些方面,所述马来酰亚胺部分在连接至所述EV(例如,外泌体)之前化学连接至生物活性分子。在一些方面,所述马来酰亚胺部分化学连接至接头,以将所述马来酰亚胺部分连接至所述生物活性分子。

本公开还提供了一种包括本文公开的EV(例如,外泌体)和使用说明的试剂盒。还提供了一种包括将生物活性分子缀合至EV(例如,外泌体)的试剂和进行所述缀合从而制备本公开的EV(例如,外泌体)的说明的试剂盒。

本公开还提供了一种治疗或预防有需要的受试者的疾病或病症的方法,所述方法包括将本公开的EV(例如,外泌体)施用于所述受试者。在一些方面,所述疾病或病症是癌症、炎性病症、神经退行性病症、中枢神经疾病或代谢疾病。在一些方面,所述EV(例如,外泌体)静脉内、腹膜内、经鼻、经口、肌肉内、皮下、肠胃外、鞘内、眼内或瘤内施用。

在一些方面,本公开提供了一种包含至少一种经由马来酰亚胺部分共价连接至支架部分的生物活性分子的胞外囊泡(EV)。在一些方面,所述马来酰亚胺部分是双官能分子。在一些方面,所述马来酰亚胺部分包含至少一个接头或间隔基。在一些方面,所述接头是可切割的接头。在一些方面,所述支架部分是支架蛋白或支架脂质。在一些方面,所述支架蛋白是支架X蛋白。在一些方面,所述支架X蛋白是PTGFRN多肽、BSG多肽、IGSF2多肽、IGSF3多肽、IGSF8多肽、ITGB1多肽、ITGA4多肽、SLC3A2多肽、ATP转运蛋白多肽或它们的片段。在一些方面,所述生物活性分子包括疫苗抗原、疫苗佐剂或它们的任何组合。在一些方面,所述生物活性分子包括STING、ASO、合成抗肿瘤剂(例如,MMAE)、细胞因子释放抑制剂(例如,MCC950)、mTOR抑制剂(例如,雷帕霉素)、自分泌运动因子抑制剂(例如,PAT409)、LPA1拮抗剂(例如,AM152)或它们的任何组合。在一些方面,所述胞外囊泡还包含靶向部分、向性部分、抗吞噬信号或它们的任何组合。在一些方面,所述靶向部分、向性部分、抗吞噬信号或它们的组合经由马来酰亚胺部分连接至所述胞外囊泡。

附图说明

图1A是显示如何使用马来酰亚胺化学将生物活性分子(BAM)化学连接至EV(例如,外泌体),例如经由本文所述的支架部分(例如,支架X蛋白或其片段或脂质)化学连接的示意图。图中描绘的接头是任选的,并且当存在时可以包括接头(例如,可切割的接头)或它们的组合。

图1B显示了可以连接至EV的STING激动剂化合物的实例:CP227(连接至马来酰亚胺部分的Val-Ala)、CP229(连接至马来酰亚胺部分的Val-Cit)、CP238(连接至胆固醇的Val-Ala)、CP246(连接至马来酰亚胺的Val-Ala)、CP240(无接头)、CP249(连接至马来酰亚胺部分的Val-Ala)、CP250(连接至马来酰亚胺部分的Val-Ala)、CP260(连接至马来酰亚胺部分的Val-Cit)和CP261(连接至马来酰亚胺部分的Val-Cit)。

图2显示了评估巯基或胺反应性化合物的STING激动作用(IFN-β)的PBMC测定法的结果。对游离的STING激动剂化合物(实心圆圈)和加载在外泌体上的STING激动剂化合物(空心圆圈)的活性进行了测试。Exo CP227是经由连接至马来酰亚胺部分的Val-Ala缀合至EV的CP227;Exo-CP229是经由连接至马来酰亚胺部分的Val-Cit缀合至EV的CP229;Exo-CP232是无任何接头的缀合至EV的CP232;Exo-CP246是经由连接至琥珀酰亚胺的Val-Cit缀合至EV的CP246;并且Exo-CP250是经由连接至马来酰亚胺部分的Val-Cit缀合至EV的CP250。使500,000个PBMC/孔与外泌体一起温育过夜。使用ELISA来测量释放至细胞培养物上清液中的干扰素β(IFNβ)。

图3A-3C显示了针对加载STING激动剂比较巯基反应性和脂质缔合化学的PBMC测定法的结果(中心图形)。图3A显示了CP227和ExoCP227的IFNβ释放和EC50比较,后者是经由连接至马来酰亚胺部分的Val-Ala缀合至EV的CP227。图3B显示了CP229和ExoCP229的IFNβ释放和EC50比较,后者是经由连接至马来酰亚胺部分的Val-Cit缀合至EV的CP229。图3C显示了CP238和ExoCP238的IFNβ释放和EC50比较,后者是经由连接至胆固醇的Val-Ala缀合至EV的CP238。

图4A显示了ADUS100和ExoADUS100之间的PBMC测定法中的IFNβ释放的比较数据,后者是包封在EV中(腔体中)的ADUS100。图4B显示了CL656和ExoCL656之间的PBMC测定法中的IFNβ释放的比较数据,后者是包封在EV中(腔体中)的CL656。图4C显示了图3A-3C和4A-4B中描述的各种STING激动剂和Exo-STING激动剂的EC50。

图5A显示了EV的加载效率:exoCP227、exoCP229、exoCP250、exoCP238、exoCP232和exoCP246。上文描述了EV的结构。显示了在两个实验中每个EV上加载的STING激动剂的数量。图5B显示了各种STING激动剂和EV的EC50比较:CP227、exo-CP227、CP229、exo-CP229、CP238、exo-CP238、ADUS100、exoADUS100、CL656、exoCL656和exoCP250。

图6显示了单甲基澳瑞他汀E(MMAE)和马来酰亚胺-Val-Cit-PABC-MMAE(vc-MMAE)的结构。

图7显示了针对RAW264.7(RAW)细胞(人巨噬细胞系)评估的MMAE细胞毒性。MMAE对RAW细胞生长的剂量反应作用显示在显微照片(上)、细胞生长测量值(左下)和汇合(右下)中。

图8A提供了比较游离形式的MMAE(MMAE)或具有马来酰亚胺-Val-Cit-PABC接头的MMAE(vc-MMAE)的效力的汇合数据。

图8B提供了测量在外泌体与游离的MMAE一起温育之后外泌体清除后MMAE的效力的汇合数据。外泌体用浓度在0.1M和2M之间的盐酸胍洗涤。

图8C提供了测量在外泌体与Val-Cit-MMAE一起温育之后外泌体清除后MMAE的效力的汇合数据。外泌体用浓度在0.1M和2M之间的盐酸胍洗涤。

图8D提供了测量在还原或非还原条件下在外泌体与Val-Cit-MMAE或游离的MMAE一起温育后MMAE的效力的汇合数据。在存在或不存在5mM TCEP的情况下,将外泌体与Val-Cit-MMAE或MMAE一起温育。

图9A显示了还原条件(0mM TCEP至50mM TCEP)、化合物的负载浓度(10μM至100μMvc-MMAE)和盐酸胍的存在或不存在(0M或1M)对加载有Val-Cit-MMAE的外泌体的效力的作用。图9B显示了还原条件(0mM TCEP至50mM TCEP)、化合物的负载浓度(100μM或300μM vc-MMAE)和盐酸胍的存在或不存在(0M或1M)对加载有Val-Cit-MMAE的外泌体的效力的作用。

图10A显示了PROTAC(蛋白水解靶向嵌合体)的示意图。

图10B显示了PROTAC的作用机制的示意图。

图10C显示了对应于包含VHL(E3连接酶)结合配体部分、接头和TBK1(TANK结合激酶1)靶向配体的PROTAC的式。该式显示了VHL(E3连接酶)结合配体部分上的潜在位点(以星形表示),这些位点易于使用马来酰亚胺接头来进行衍生化,以将PROTAC化学连接至胞外囊泡(例如,外泌体)。

图11是CLIPTAC的作用机制的示意图。

图12显示了AM152(环丙烷甲酸,1-[4'-[3-甲基-4-[[[(1R)-1-苯基乙氧基]羰基]氨基]-5-异噁唑基][1,1'-联苯]-4-基]-)和AM095(1,1'-联苯]-4-乙酸,4'-[3-甲基-4-[[[(1R)-1-苯基乙氧基]羰基]氨基]-5-异噁唑基[]-)的化学结构。以1和2标记的箭头表示适用于衍生化以引入马来酰亚胺反应性基团的位置(甲酸和氨基甲酸根)。AM152中指示的相应位点也存在于AM095中。

图13是显示LPA1拮抗剂(AM152)与外泌体缀合以产生在表面上含有多个LPA1拮抗剂分子的外泌体群的示意图。

图14显示了如何将马来酰亚胺反应性基团经由其羧酸基团添加至AM152的实例。该实例显示了作为反应性复合物的一部分的马来酰亚胺基团,所述反应性复合物包含Ala-Val可切割的接头以及插入马来酰亚胺基团和羧酸反应性氯甲基苯基团之间的C5间隔基。

图15显示了可用于衍生化AM152的两种示例性试剂。上面的试剂包含(i)可以与AM152的羧酸基团反应的氯甲基苯基团和(ii)马来酰亚胺基团。可切割的Cit-Val二肽和C5间隔基插入(i)和(ii)之间。下面的试剂包含(i)可以与AM152的羧酸基团反应的氯甲基苯基团和(ii)马来酰亚胺基团,并且可切割的Ala-Val二肽和C5间隔基插入(i)和(ii)之间。

图16显示了由切割缀合产物中的Cit-Val或Ala-Val二肽(例如,通过组织蛋白酶B)产生的产物。该产物AM152苯胺酯可以通过内源性酯酶进一步加工以产生游离酸AM152产物。

图17和18显示了包含游离的马来酰亚胺基团和不同的间隔基组合的若干AM152衍生物。

图19显示了在羧酸基团的保护之后,可以使用用于衍生化羧酸基团的相同试剂以在氨基甲酸根基团处衍生化AM152。随后使所得的产物脱保护以释放羧酸基团。

图20显示了其中具有马来酰亚胺基团的复合物经由接头化学连接至AM152的氨基甲酸根基团的展示实例。合适的接头包括本说明书中公开的接头中的任一者。

图21显示了AM152可以化学连接至衍生化的支架部分,而不是衍生化并且随后经由反应性马来酰亚胺基团连接至支架部分。

图22显示了(i)MCC950、(ii)可以用于衍生化MCC950以引入马来酰亚胺反应性基团的双官能试剂和(iii)包含马来酰亚胺反应性基团的MCC950衍生物的结构。双官能试剂的苯基团(**)可以与MCC950的氨基甲酸根基团(*)反应以产生所描述的MCC950衍生物。

具体实施方式

本公开涉及胞外囊泡(EV)(例如,外泌体),所述胞外囊泡包含至少一种经由马来酰亚胺部分共价连接至EV(例如,外泌体)的生物活性分子以及它们的用途。与常规部分(例如,胆固醇或琥珀酰亚胺)相比,包含经由马来酰亚胺部分连接的生物活性分子的EV(例如,外泌体)显示出优异的性质。在本公开中显示了各个方面的非限制性实例。

在更详细地描述本公开之前,应当理解,本发明不限于所描述的特定组合物或过程步骤,因此当然可以变化。本领域技术人员在阅读本公开后将明白,本文描述和展示的每个单个的方面都具有离散的组分和特征,所述离散的组分和特征可以在不脱离本发明的范围或精神的情况下,容易地与另外几个方面中的任一个的特征分离或组合。任何列举的方法都可以按照列举的事件的顺序或逻辑上可能的任何其他顺序进行。

本文提供的标题不限制本公开的各个方面,可以通过整体参考本说明书而定义。还应当理解,本文所用的术语仅用于描述具体方面的目的,而不旨在进行限制,因为本公开的范围将仅由所附权利要求限定。

因此,如下直接定义的术语通过整体参考说明书被更详细地定义。

I.定义

为了更容易理解本说明,首先定义某些术语。在整个具体实施方式中阐述了另外的定义。

需要注意的是,术语“一个(a或an)”实体是指一个或多个该实体;例如,“核苷酸序列”被理解为表示一个或多个核苷酸序列。因此,术语“一个(a或an)”、“一个或多个”和“至少一个”在本文中可以互换使用。应进一步注意,权利要求可拟订成不包括任何任选的元素。因此,此陈述意图用作与权利要求要素的描述联合使用此类排他性术语如“单独地”、“仅仅”等或使用“否定(negative)”限制的在先基础。

此外,本文使用的“和/或”应被视为具体地公开两个指定特征或组分中的每个与或不与另一个一起存在。因此,如在诸如“A和/或B”的短语中使用的术语“和/或”旨在包括“A和B”、“A或B”、“A”(单独的)和“B”(单独的)。同样,如在诸如“A、B和/或C”的短语中使用术语“和/或”旨在包括以下方面的每一方面:A、B和C;A、B或C;A或C;A或B;B或C;A和C;A和B;B和C;A(单独的);B(单独的);和C(单独的)。

应当理解,本文无论在何处用措辞“包含/包括(comprising)”来描述方面,都还提供了以“由......组成”和/或“基本上由......组成”描述的其他类似方面。

除非另有定义,否则本文使用的所有技术和科学术语具有与本公开相关的领域的普通技术人员通常理解的相同的含义。例如,the Concise Dictionary of Biomedicineand Molecular Biology,Juo,Pei-Show,第2版,2002,CRC Press;The Dictionary ofCell and Molecular Biology,第3版,1999,Academic Press;和the Oxford DictionaryOf Biochemistry And Molecular Biology,Revised,2000,Oxford University Press为技术人员提供了本公开中使用的许多术语的通用词典。

单位、前缀和符号以它们的国际单位制(Système International de Unites)(SI)认可的形式表示。数值范围包括定义范围的数值。在列举值范围的情况下,应当理解,还具体公开了该范围的所列举的上限与下限之间的每个中间整数值及其每个分数,以及此类值之间的每个子范围。任何范围的上限和下限可以独立地包括在该范围内或从该范围中排除,并且包括两个限值中的任一个、两个限值都不包括或两个限制都包括在内的每个范围也涵盖在本公开中。因此,本文所列举的范围应理解为该范围内所有值(包括所列举端点)的简写。例如,1至10的范围被理解为包括来自由1、2、3、4、5、6、7、8、9和10组成的组中的任何数值、数值组合或子范围。

在明确列举值的情况下,应当理解,在数量或量上与所列举的值大致相同的值也在本公开的范围内。在公开组合的情况下,该组合的要素的每个子组合也被具体公开,并且在本公开的范围内。相反,在单个地公开不同要素或要素组的情况下,也公开了所述要素或要素组的组合。在本公开的任何要素被公开为具有多个备选方案的情况下,其中每个备选方案被单独排除或者与其他备选方案的任何组合被排除的本公开的实例也由此而被公开;超过一个本公开的要素可具有此类排除,并且具有此类排除的要素的所有组合均特此被公开。

核苷酸以其普遍接受的单字母代码提及。除非另有说明,否则核苷酸序列从左至右以5’至3’方向书写。核苷酸在本文中以其由IUPAC-IUB生物化学命名委员会推荐的众所周知的单字母符号提及。因此,A代表腺嘌呤,C代表胞嘧啶,G代表鸟嘌呤,T代表胸腺嘧啶,U代表尿嘧啶。

氨基酸序列从左至右以氨基至羧基的方向书写。氨基酸可以在本文中由其通常已知的三字母符号或由IUPAC-IUB生物化学命名委员会推荐的单字母符号来表示。

术语“约”在本文中用于意指大致近似地、左右或在......范围内。当术语“约”与数值范围结合使用时,它通过扩展所示的数值的上限和下限来修饰该范围。一般而言,术语“约”可以通过例如10%、之上或之下(更高或更低)的方差来修饰大于和小于所述值的数值。

术语“施用(administration、administering)”及其语法变型是指经由药学上可接受的途径将本公开的组合物(诸如EV(例如,外泌体))引入受试者。通过任何合适的途径将本公开的组合物(诸如EV(例如,外泌体))引入受试者,所述途径包括瘤内、口服、肺内、鼻内、肠胃外(静脉内、动脉内、肌肉内、腹膜内或皮下)、直肠内、淋巴内、鞘内、眼周或局部途径。施用包括自我施用和由其他人施用。合适施用途径允许组合物或剂执行其预期功能。例如,如果合适的途径是静脉内途径,则通过将组合物或试剂引入受试者的静脉来施用组合物。

如本文中所用,术语“激动剂”是指结合受体并活化受体以产生生物反应的分子。受体可被内源性或外源性激动剂活化。内源性激动剂的非限制性实例包括激素、神经递质和环状二核苷酸。外源性激动剂的非限制性实例包括药物、小分子和环状二核苷酸。激动剂可以是完全、部分或反向激动剂。

术语“氨基酸置换”是指将亲本序列或参考序列(例如,野生型序列)中存在的一个氨基酸残基替换为另一个氨基酸残基。例如,经由化学肽合成或通过本领域已知的重组方法,可以在亲本或参考序列(例如,野生型多肽序列)中置换氨基酸。因此,提及“在X位置换”是指X位存在的氨基酸被另一个氨基酸残基置换。在一些方面,置换模式可以根据模式AnY来描述,其中A是对应于天然或最初存在于n位的氨基酸的单字母代码,并且Y是置换氨基酸残基。在其他方面,置换模式可以根据模式An(YZ)来描述,其中A是对应于置换天然或最初存在于n位的氨基酸的氨基酸残基的单字母代码,并且Y和Z是置换可以替换A的氨基酸残基的替代选择。

如本文中所用,术语“拮抗剂”是指阻断或抑制激动剂介导的反应的分子,而不是在与受体结合时自身引发生物反应的分子。许多拮抗剂通过与受体上结构确定的结合位点上的内源性配体或底物竞争来实现其效力。拮抗剂的非限制性实例包括α阻断剂、β阻断剂和钙通道阻断剂。拮抗剂可以是竞争性、非竞争性拮抗剂或无竞争性拮抗剂。

如本文所用,术语“抗体”涵盖不论天然或部分或全部以合成方式产生的免疫球蛋白及其片段。该术语还涵盖任何具有与免疫球蛋白结合结构域同源的结合结构域的蛋白质。“抗体”还包括多肽,所述多肽包含来自免疫球蛋白基因或其片段的特异性结合和识别抗原的框架区。术语抗体的使用意在包括完全抗体、多克隆抗体、单克隆抗体和重组抗体、它们的片段,并且还包括单链抗体、人源化抗体、鼠抗体、嵌合单克隆抗体、小鼠-人类单克隆抗体、小鼠-灵长类动物单克隆抗体、灵长类动物-人类单克隆抗体、抗独特型抗体、抗体片段(诸如(例如)scFv、(scFv)2、Fab、Fab'和F(ab')2、F(ab1)2、Fv、dAb和Fd片段)、双体和抗体相关多肽。抗体包括双特异性抗体和多特异性抗体,只要它们表现出所需的生物活性或功能。在本公开的一些方面,生物活性分子是抗体或包含其抗原结合片段的分子。

术语“抗体-药物缀合物”和“ADC”可互换使用,是指连接(例如,共价连接)至一种或多种治疗剂(本文有时称为药剂、药物或活性药物成分)的抗体。在本公开的一些方面,生物活性分子是抗体-药物缀合物。

如本文所用,当应用于一个或多个目的值时,术语“大约”是指与所述参考值相似的值。在某些方面,术语“大约”是指落入所述参考值任一方向(大于或小于)中的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更少的一系列值,除非另有说明或从上下文中另外显而易见的(除非该数字超过可能值的100%)。

术语“芳基”是指碳环芳族基团。芳基基团的实例包括但不限于苯基、萘基和蒽基。碳环芳族基团可以是未取代的或被一个或多个基团取代,所述一个或多个基团包括但不限于-C1-8烷基、-O-(C1-8烷基)、-芳基、-C(O)R'、-OC(O)R’、-C(O)OR'、-C(O)NH2、-C(O)NHR'、-C(O)N(R')2-、-NHC(O)R'、-S(O)2R’、-S(O)R'、-OH、-卤素、-N3、-NH2、-NH(R')、-N(R')2和-CN,其中每个R'独立地是H、-C1-8烷基或芳基。

术语“亚芳基”是指具有两个共价键的芳基基团,可以是邻位、间位或对位构型,如以下结构所示:

其中苯基基团可以是未取代的或被最多四个基团取代,所述基团包括但不限于-C1-8烷基、-O-(C1-8烷基)、-芳基、-C(O)R'、-OC(O)R'、-C(O)OR'、-C(O)NH2、-C(O)NHR'、-C(O)N(R')2-、-NHC(O)R'、-S(O)2R'、-S(O)R'、-OH、-卤素、-N3、-NH2、-NH(R')、-N(R')2和-CN,其中每个R'独立地是H、-C1-8烷基或芳基。

如本文所用,术语“生物活性分子”是指可以连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的任何分子,其中所述分子可以在有需要的受试者中具有治疗或预防作用,或者用于诊断目的。因此,例如,术语生物活性分子包括蛋白质(例如,抗体、蛋白质、多肽及其衍生物、片段和变体)、脂质及其衍生物、碳水化合物(例如,糖蛋白中的聚糖部分)或小分子。在一些方面,生物活性分子是放射性同位素。在一些方面,生物活性分子是可检测部分,例如,放射性核素、荧光分子或造影剂。

如本文所用,术语“C1-8烷基”是指具有1至8个碳原子的直链或支链饱和烃。代表性“C1-8烷基”基团包括但不限于甲基、乙基、正丙基、正丁基、正戊基、正己基、正庚基、正辛基、异丙基、仲丁基、异丁基、叔丁基、异戊基和2-甲基丁基。

术语“C1-10亚烷基”是指式-(CH2)1-10-的饱和直链烃基。C1-10亚烷基的实例包括亚甲基、亚乙基、亚丙基、亚丁基、亚戊基、亚己基、亚庚基、亚辛基、亚壬基和亚癸基。

术语“C3-8碳环”是指3元、4元、5元、6元、7元或8元饱和或不饱和非芳族碳环。代表性C3-8碳环包括但不限于环丙基、环丁基、环戊基、环戊二烯基、环己基、环己烯基、1,3-环己二烯基、1,4-环己二烯基、环庚基、1,3-环庚二烯基、1,3,5-环庚三烯基、环辛基和环辛二烯基。C3-8碳环基团可以是未取代的或被一个或多个基团取代,所述基团包括但不限于-C1-8烷基、-O-(C1-8烷基)、芳基、-C(O)R'、-OC(O)R’、-C(O)OR'、-C(O)NH2、-C(O)NHR'、-C(O)N(R')2-、NHC(O)R'、-S(O)2R'、-S(O)R'、-OH、-卤素、-N3、-NH2、-NH(R')、-N(R')2和-CN,其中每个R'独立地是H、-C1-8烷基或芳基。

术语“C3-8碳环”是指上文定义的C3-8碳环基团,其中碳环的氢原子中的一个或多个被键取代。

术语“C3-8杂环”是指芳族或非芳族C3-8碳环,其中环碳原子中的一个至四个独立地被杂原子取代,所述杂原子选自由以下各项组成的组:O、S和N。C3-8杂环的代表性实例包括但不限于苯并呋喃基、苯并噻吩、吲哚基、苯并吡唑基、香豆素基、异喹啉基、吡咯基、噻吩基、呋喃基、噻唑基、咪唑基、吡唑基、三唑基、喹啉基、嘧啶基、吡啶基、吡啶酮基、吡嗪基、哒嗪基、异噻唑基、异噁唑基和四唑基。C3-8杂环可以是未取代的或被最多七个基团取代,所述基团包括但不限于-C1-8烷基、-O-(C1-8烷基)、-芳基、-C(O)R'、-OC(O)R'、-C(O)OR'、-C(O)NH2、-C(O)NHR'、-C(O)N(R')2、-NHC(O)R'、-S(O)2R'、-S(O)R'、-OH、-卤素、-N3、-NH2、-NH(R')、-N(R')2和-CN,其中每个R'独立地是H、-C1-8烷基或芳基。

术语“C3-8杂环”是指上文定义的C3-8杂环基团,其中杂环基团的氢原子中的一个被键取代。C3-8杂环可以是未取代的或被最多六个基团取代,所述基团包括但不限于-C1-8烷基、-O-(C1-8烷基)、-芳基、-C(O)R'、-OC(O)R'、-C(O)OR'、-C(O)NH2、-C(O)NHR'、-C(O)N(R')2、-NHC(O)R'、-S(O)2R'、-S(O)R'、-OH、-卤素、-N3、-NH2、-NH(R')、-N(R')2和-CN,其中每个R'独立地是H、-C1-8烷基或芳基。

“保守的氨基酸置换”是氨基酸残基被具有相似侧链的氨基酸残基替代。本领域已经定义了具有相似侧链的氨基酸残基家族,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果多肽中的一个氨基酸被来自同一侧链家族的另一个氨基酸替代,则这种取代被认为是保守的。在另一个方面,氨基酸串可以被侧链家族成员的顺序和/或组成不同而结构上类似的串保守取代。

如本文所用,术语“保守的”分别指多核苷酸序列或多肽序列的核苷酸或氨基酸残基,它们是在被比较的两个或更多个序列的相同位置上未改变的那些。相对保守的核苷酸或氨基酸是在比序列中别处存在的核苷酸或氨基酸更相关的序列中保守的核苷酸或氨基酸。

在一些方面,如果两个或更多个序列彼此100%相同,则它们被称为“完全保守的”或“相同的”。在一些方面,如果两个或更多个序列彼此至少约70%相同、至少约80%相同、至少约90%相同或至少约95%相同,则它们被称为“高度保守的”。在一些方面,如果两个或更多个序列彼此至少约30%相同、至少约40%相同、至少约50%相同、至少约60%相同、至少约70%相同、至少约80%相同、至少约90%相同或至少约95%相同,则它们被称为“保守的”。序列的保守性可以适用于多核苷酸或多肽的全长或者可以适用于它们的部分、区域或特征。

如本文所用,术语“常规EV蛋白”意指此前已知富集于EV中的蛋白质。

如本文所用,术语“常规外泌体蛋白”意指此前已知富集于外泌体中的蛋白质,所述蛋白质包括但不限于CD9、CD63、CD81、PDGFR、GPI蛋白、乳凝集素LAMP2和LAMP2B、它们的片段、或与它们结合的肽。

如本文所用,术语“衍生物”是指EV(例如,外泌体)、组分(例如,支架蛋白,诸如支架X和/或支架Y、脂质或碳水化合物)或生物活性分子(例如,多肽、多核苷酸、脂质、碳水化合物、抗体或它们的片段、PROTAC等),所述生物活性分子已经被化学修饰为引入反应性马来酰亚胺基团或易于与马来酰亚胺基团反应的硫醇基团。例如,用双官能试剂修饰的抗体可以产生包含反应性马来酰亚胺基团的抗体衍生物,所述双官能试剂包含(i)例如与游离的氨基基团反应的基团,和(ii)马来酰亚胺基团,所述反应性马来酰亚胺基团可以与EV(例如,外泌体)上的支架X蛋白中游离的硫醇基团反应。相反,EV(例如,外泌体)上的支架X可以用双官能试剂修饰,以产生包含反应性马来酰亚胺基团的支架X衍生物,所述双官能试剂包含(i)例如与游离的氨基基团反应的基团,和(ii)马来酰亚胺基团,所述反应性马来酰亚胺基团可以与生物活性分子(例如,抗体)中游离的硫醇基团反应。

术语“赋形剂”和“载剂”可互换使用,是指添加至药物组合物中以进一步促进化合物的施用的惰性物质。

如本文所用,术语“胞外囊泡”、“EV”以及它们的语法变型可互换使用,是指包含包封内部空间的膜的细胞源性囊泡。胞外囊泡包括所有与膜结合的囊泡(例如,外泌体、纳米囊泡),其直径小于其所源自的细胞的直径。在一些方面,胞外囊泡的直径在20nm至1000nm的范围内,并且可包含在内部空间(即,腔体)内、展示在胞外囊泡的外表面上和/或跨膜的各种大分子有效负载。在一些方面,有效负载可以包括腺相关病毒(AAV)、核酸(例如,DNA或RNA,诸如反义寡核苷酸、siRNA、shRNA或mRNA)、吗啉、蛋白质、碳水化合物、脂质、小分子、抗原、疫苗、疫苗佐剂和/或它们的组合。另外的有效负载在下文有所详细描述。在一些方面,EV(例如,外泌体)可以另外包含靶向部分、向性部分或它们的组合。在一些方面,术语胞外囊泡或EV是指胞外囊泡(EV)群。

在某些方面,胞外媒介物包含支架部分。举例而言并且非限制性地,胞外囊泡包括凋亡小体、细胞片段、通过直接或间接操纵(例如,通过连续挤出或用碱性溶液进行的处理)而来源于细胞的囊泡、含有小囊的胞器和由活细胞产生(例如,通过直接质膜出芽(plasmamembrane budding)或融合晚期胞内体与质膜)的囊泡。胞外囊泡可源自活的或死的生物体、外植组织或器官、原核或真核细胞和/或培养的细胞。在一些方面,胞外囊泡由表达一种或多种转基因产物的细胞产生。

如本文所用,术语“外泌体”是指直径在20-300nm之间(例如,在40-200nm之间)的胞外囊泡。外泌体包含包封内部空间(即,腔体)的膜,并且在一些方面,可以通过直接质膜出芽或通过晚期胞内体与质膜的融合从细胞(例如,生产细胞)产生。在某些方面,外泌体包含支架部分。如下文所述,外泌体可以来源于生产细胞,并且基于其尺寸、密度、生物化学参数或它们的组合从生产细胞中分离。在一些方面,本公开的外泌体由表达一种或多种转基因产物的细胞产生。在一些方面,术语外泌体是指外泌体群。

在一些方面,本公开的EV(例如,外泌体,例如,纳米囊泡)通过将至少一种生物活性分子(例如,蛋白质,诸如抗体或ADC、RNA或DNA(诸如反义寡核苷酸)、小分子药物、毒素、PROTAC、AAV或吗啉)经由马来酰亚胺部分化学连接至EV(例如,外泌体,例如,纳米囊泡)来工程化。在一些方面,马来酰亚胺部分是双官能试剂的一部分。

在一些方面,本公开的EV(例如,外泌体)或纳米囊泡可以包含在内部空间(即,腔体)内、显示在EV的外部(外)表面或内部(腔体)表面上和/或跨膜的各种大分子有效负载。在一些方面,有效负载可以包括例如核酸、蛋白质、碳水化合物、脂质、小分子和/或它们的组合。在某些方面,EV(例如,外泌体)包含支架部分,例如支架X蛋白或它们的片段。EV(例如,外泌体)可以来源于活的或死的生物体、外植组织或器官、原核或真核细胞和/或培养的细胞。在一些方面,EV(例如,外泌体)由表达一种或多种转基因产物的细胞产生。在其他方面,本公开的EV是但不限于纳米囊泡、微粒体、微囊泡、胞外体或凋亡小体。

如本文所用,术语蛋白质(例如,生物活性分子,诸如治疗性蛋白质或支架蛋白(诸如支架X蛋白或其片段或者支架Y蛋白或其片段))的“片段”是指与天然存在的蛋白质相比,蛋白质的氨基酸序列比天然存在的序列更短、N-末端和/或C-末端缺失或蛋白质的任何部分缺失。

如本文中所用,术语“功能性片段”是指保留蛋白质功能的蛋白质片段。因此,在一些方面,支架蛋白的功能片段(例如,支架X蛋白的片段)保留了将部分(例如,生物活性分子)连接或附接(例如,经由马来酰亚胺部分)在EV(例如,外泌体)的腔体表面或外表面上的能力。类似地,在某些方面,支架Y蛋白的功能片段保留了将部分(例如,生物活性分子)附接(例如,经由马来酰亚胺部分)在EV(例如,外泌体)的腔体表面上的能力。

片段是否是功能片段可以通过任何本领域已知的测定EV(例如,外泌体)的蛋白质含量的方法来评估,所述方法包括蛋白质印迹、FACS分析和片段与自发荧光蛋白(如例如GFP)的融合。在某些方面,支架X蛋白的功能片段保留了天然存在的支架X蛋白将生物活性分子附接(例如,经由马来酰亚胺部分)在EV(例如,外泌体)的腔体或外表面上的能力的例如至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约100%。

如本文所用,术语将生物活性分子“连接”或“附接”至本公开的EV(例如,外泌体)的腔体或外表面包括(i)将生物活性分子“化学连接”或“缀合”,例如经由化学接头(诸如马来酰亚胺部分),以及(ii)将生物活性分子“非化学连接”,也称为“融合(fusing或fusion)”(例如,经由肽键、氨基酸接头和/或支架蛋白)至EV(例如,外泌体)或者定位于EV(例如,外泌体)的腔体或外表面上的支架蛋白的一部分。

如本文所用,术语将生物活性分子经由例如支架蛋白“融合(fusing、fused、fusion)”或“非化学连接”在本公开的EV(例如,外泌体)的腔体或外表面上是指将生物活性分子分别连接至定位于EV(例如,外泌体)的腔体或外表面上的支架分子(例如,蛋白质)的一部分。在一些方面,生物活性分子之间的融合可以经由遗传融合(即,嵌合表达)来进行。

如本文所用,术语“化学连接”和“缀合”可互换使用,各自指使用化学部分(例如,马来酰亚胺部分)进行的两个或更多个部分的共价连接,每个部分包含例如EV、支架部分、生物活性部分、一个或多个接头、靶向部分和/或向性部分或者它们的任何组合。因此,第一部分(例如,支架(诸如支架X蛋白)或脂质(诸如胆固醇))将经由一个部分中存在的马来酰亚胺基团和另一个部分中存在的巯基基团之间的反应形成的硫醚键“化学连接”至第二部分(例如,生物活性部分)。

如本文所用,术语“胞外”可以与术语“外”、“外部”和“囊外”互换使用,其中每个术语是指包封EV(例如,外泌体)的膜外元件。如本文所用,术语“胞内”可以与术语“内”、“内部”和“囊内”互换使用,其中每个术语是指包封EV(例如,外泌体)的膜内元件。术语“腔体”是指包封EV(例如,外泌体)的膜内部空间。因此,EV(例如,外泌体)的腔体内元件在本文中可以称为“定位于腔体中”或“在腔体中”。

如本文所用,术语“同源性”是指聚合物分子之间,例如核酸分子(例如DNA分子和/或RNA分子)之间和/或多肽分子之间的总相关性。通常,术语“同源性”意味着两个分子之间的进化关系。因此,同源的两个分子将具有共同的进化祖先。在本公开的上下文中,术语同源性涵盖同一性和相似性。

在一些方面,如果聚合物分子中至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或至少约99%的单体相同(完全相同的单体)或相似(保守置换),则所述聚合物分子被认为是彼此“同源的”。术语“同源的”必然是指至少两个序列(多核苷酸或多肽序列)之间的比较。

在本公开的上下文中,置换(即使它们被称为氨基酸置换)在核酸水平上进行,即氨基酸残基被替代性氨基酸残基置换通过将编码第一氨基酸的密码子置换为编码第二氨基酸的密码子来进行。

如本文所用,术语“同一性”是指聚合分子之间,例如多肽分子或多核苷酸分子(例如DNA分子和/或RNA分子)之间的总单体保守性。无任何附加限定词的术语“相同”,例如蛋白质A与蛋白质B相同,意味着序列100%相同(100%序列同一性)。将两个序列描述为例如“70%相同”相当于将它们描述为具有例如“70%序列同一性”。

例如,两个多肽序列的同一性百分比的计算可以通过出于最佳比较目的而对两个序列进行的比对来进行(例如,可以在第一多肽序列和第二多肽序列中的一者或二者中引入空位以实现最佳比对,出于比较目的,可以忽略不相同的序列)。在某些方面,出于比较目的而比对的序列的长度为参考序列长度的至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%或约100%。然后比较相应氨基酸位置的氨基酸。

当第一序列中的一个位置被与第二序列中的相应位置相同的氨基酸占据时,则该位置的分子是相同的。两个序列之间的同一性百分比是序列共有的相同位置数量的函数,考虑到缺口的数量和每个缺口的长度,需要引入空位以实现两个序列的最佳比对。序列的比较和两个序列之间的同一性百分比的确定可以使用数学算法来完成。

合适的软件程序可以从各种来源获得,并且可用于蛋白质和核苷酸序列二者的比对。确定序列同一性百分比的一种合适的程序是bl2seq,它是可从美国政府的国立生物技术信息中心(U.S.government's National Center for Biotechnology Information)BLAST网站(blast.ncbi.nlm.nih.gov)获得的BLAST程序组(suite of program)的一部分。Bl2seq使用BLASTN或BLASTP算法在两个序列之间进行比较。BLASTN用于比较核酸序列,而BLASTP用于比较氨基酸序列。其他合适的程序是,例如,Needle、Stretcher、Water或Matcher、生物信息学程序的EMBOSS套件的一部分,并且也可在www.ebi.ac.uk/Tools/psa.上从欧洲生物信息学研究所(EBI)获得。

序列比对可以使用本领域已知的方法(诸如MAFFT、Clustal(ClustalW、Clustal X或Clustal Omega)、MUSCLE等)进行。

与多核苷酸或多肽参考序列比对的单个多核苷酸或多肽靶序列内的不同区域可以各自具有它们自己的序列同一性百分比。请注意,序列同一性百分比值四舍五入到十分位。例如,80.11、80.12、80.13和80.14向下舍入到80.1,而80.15、80.16、80.17、80.18和80.19向上舍入到80.2。还应注意,长度值将始终是整数。

在某些方面,第一氨基酸序列(或核酸序列)与第二氨基酸序列(或核酸序列)的同一性百分比(%ID)的计算式为%ID=100×(Y/Z),其中Y是在第一和第二序列比对(如通过目测或特殊的序列比对程序比对)中被评分为相同匹配的氨基酸残基(或核碱基)数并且Z是第二序列中的残基总数。如果第一序列的长度长于第二序列,则第一序列与第二序列的同一性百分比将高于第二序列与第一序列的同一性百分比。

本领域技术人员将理解,用于计算序列同一性百分比的序列比对的生成不限于仅由一级序列数据驱动的二进制序列-序列比较。还应当理解,序列比对可通过将序列数据与来自异构源的数据(诸如结构数据(例如,晶体学蛋白质结构)、功能数据(例如,突变的位置)或系统发育数据)整合而产生。整合异构数据以生成多重序列比对的合适程序是可在www.tcoffee.org上获得,以及另选地可以例如从EBI获得的T-Coffee。还应当理解,用于计算百分比序列同一性的最终比对可以自动或手动辅助(curated)。

如本文所用,术语“免疫调节剂”是指作用于与EV(例如,外泌体)接触的靶标(例如,靶细胞)并且调节免疫系统的药剂。可以引入EV(例如,外泌体)和/或生产细胞的免疫调节剂的非限制性实例包括诸如检查点抑制剂的调节剂、检查点抑制剂的配体、细胞因子、它们的衍生物或它们的任何组合的药剂。免疫调节剂还可以包括激动剂、拮抗剂、抗体、抗原结合片段、多核苷酸(诸如siRNA、miRNA、lncRNA、mRNA或DNA)或小分子。在本公开的一些方面,生物活性分子是免疫调节剂。

如本文所用,“免疫应答”是指脊椎动物体内针对外来因子或异常细胞(例如,癌细胞)的生物反应,所述生物反应保护生物体免受这些因子和由它们引起的疾病的影响。免疫应答由免疫系统的一个或多个细胞(例如,T淋巴细胞、B淋巴细胞、自然杀伤(NK)细胞、巨噬细胞、嗜酸性粒细胞、肥大细胞、树突细胞或中性粒细胞)和由这些细胞或肝脏中的任一者产生的可溶性大分子(包括抗体、细胞因子和补体)的作用介导,所述作用导致选择性靶向、结合、破坏、破坏和/或从脊椎动物体内消除入侵的病原体、病原体、癌细胞或其他异常细胞感染的细胞或组织,或者就自身免疫或病理性炎症而言,正常的人体细胞或组织。免疫反应包括例如T细胞(例如,效应T细胞、Th细胞、CD4+细胞、CD8+T细胞或Treg细胞)的活化或抑制,或者免疫系统的任何其他细胞(例如,NK细胞)的活化或抑制。因此,免疫应答可以包括体液免疫应答(例如,由B细胞介导)、细胞免疫应答(例如,由T细胞介导)或体液免疫应答和细胞免疫应答二者。在本公开的一些方面,生物活性分子是能够引发免疫应答的分子。

在一些方面,免疫应答是“抑制性”免疫应答。抑制性免疫应答是阻断或减弱刺激物(例如,抗原)的作用的免疫应答。在某些方面,抑制性免疫应答包括针对刺激物的抑制性抗体的产生。在一些方面,免疫应答是“刺激性”免疫应答。刺激性免疫应答是导致产生效应细胞(例如,细胞毒性T淋巴细胞)的免疫应答,所述效应细胞可以破坏和清除靶抗原(例如,肿瘤抗原或病毒)。

如本文所用,术语“免疫缀合物”是指包含结合分子(例如,抗体)和一个或多个化学缀合至结合分子的部分(例如,治疗或诊断部分)的化合物。通常,免疫缀合物由以下通式定义:A-(LM)n,其中A是结合分子(例如,抗体),L是任选的接头,M是异源性部分,它可以是例如治疗剂、可检测标记等,并且n是整数。在一些方面,多个异源性部分可以化学缀合至相同的结合分子(例如,抗体)中的不同连接点。在其他方面,多个异源性部分可以串连和连接至结合分子(例如,抗体)中的连接点。在一些方面,多个异源性部分(相同的或不同的)可以缀合至结合分子(例如,抗体)。

免疫缀合物还可以由所述通式以相反的顺序定义。在一些方面,免疫缀合物是“抗体-药物缀合物”(“ADC”)。在本公开的上下文中,术语“免疫缀合物”不限于化学或酶促缀合分子。本公开中使用的术语“免疫缀合物”还包括遗传融合。在本公开的一些方面,生物活性分子是免疫缀合物。

如本文所用,术语“分离的”、“纯化的”、“提取的”及其语法变型可互换使用,是指已经经历一个或多个纯化过程(例如,所期望的EV(例如,外泌体)的选择或富集)、制备的所期望的EV(例如,多个已知或未知量的和/或浓度的EV)的制备物的状态。在一些方面,如本文所用的分离或纯化是从含有生产细胞的样品中除去、部分除去(例如,一部分)EV(例如,外泌体)的过程。在一些方面,分离的EV(例如,外泌体)组合物不具有可检测的非所需活性,或可替代地,非所需活性的水平或量等于或低于可接受的水平或量。在其他方面,分离的EV(例如,外泌体)组合物具有等于或大于可接受的量和/或浓度的所期望的EV(例如,外泌体)的量和/或浓度。在其他方面,与从中获得组合物的起始材料(例如,生产细胞制备物)相比,分离的EV(例如,外泌体)组合物是富集的。与起始材料相比,这种富集可以富集至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或大于99.9999%。在一些方面,分离的EV(例如,外泌体)制备物基本上不含残留的生物产物。在一些方面,分离的EV(例如,外泌体)制备物100%不含、至少约99%不含、至少约98%不含、至少约97%不含、至少约96%不含、至少约95%%不含、至少约94%不含、至少约93%不含、至少约92%不含、至少约91%不含或至少约90%不含任何污染性生物物质。残留生物产物可以包括非生物材料(包括化学物质)或不合需要的核酸、蛋白质、脂类或代谢物。基本上不含残留的生物产物还可以意味着EV(例如,外泌体)组合物不含可检测的生产细胞,并且只有EV(例如,外泌体)是可检测的。

如本文所用,术语“腔体工程化的EV”是指EV(例如,外泌体)的膜腔体表面或腔体的组成被修饰的EV(例如,外泌体),以使得经工程化的EV(例如,外泌体)的腔体表面或腔体不同于修饰前的EV(例如,外泌体)或天然存在的EV(例如,外泌体)。

所述工程化可以直接在腔体内(即,EV内的空隙)或在EV(例如,外泌体)的膜中,特别是在EV的腔体表面,以使得EV(例如,外泌体)的腔体和/或腔体表面被改变。例如,膜在其蛋白质、脂质、小分子、碳水化合物等的组成方面被修饰,以使得EV(例如,外泌体)的腔体表面被修饰。类似地,腔体中的内容物可以被修饰。组成可以通过化学、物理或生物方法来改变,或者通过由预先通过化学、物理或生物方法修饰的细胞产生而改变。具体而言,组成可以通过基因工程来改变,或者通过由预先通过基因工程修饰的细胞产生而改变。在一些方面,腔体工程化的EV(例如腔体工程化的外泌体)包含外源性蛋白质(即,EV(例如,外泌体)不天然表达的蛋白质)或者它们的片段或变体,它们可以暴露于EV(例如,外泌体)的腔体表面或腔体上,或者可以将部分连接至EV(例如,外泌体)的腔体表面、连接至EV。在其他方面,腔体工程化的EV(例如,腔体工程化的外泌体)包含更高表达的天然EV(例如,外泌体)、蛋白质(例如,支架X或支架Y)或者它们的片段或变体,它们可以是暴露于EV(例如,外泌体)的腔体,或者可以将部分连接至EV(例如,外泌体)的腔体表面。

如本文所用,术语“大分子”是指核酸、蛋白质、脂质、碳水化合物、代谢物或它们的组合。

如本文所用,术语“马来酰亚胺部分”或“MM”是指将EV(例如,外泌体)连接至接头或生物活性分子的化学部分,并且包含马来酰亚胺基团:

其中*表示与EV(例如,外泌体)上的任何硫醇基团的连接点(例如,支架X蛋白中存在的游离的硫醇),并且波浪线表示与马来酰亚胺部分的其余部分的连接位点。

在一些方面,*表示与抗体、PROTAC或任何其他生物活性分子上的任何硫醇基团的连接点,波浪线表示马来酰亚胺部分的其余部分与EV(例如,外泌体)的连接位点(例如,支架X蛋白)。

如本文所用,术语“大分子”是指核酸、蛋白质、脂质、碳水化合物、代谢物或它们的组合。

术语“经修饰的”,当在本文所述的EV(例如,外泌体)的上下文中使用时,是指EV(例如,外泌体)和/或其生产细胞的改变或工程化,以使得经修饰的EV(例如,外泌体)不同于天然存在的EV(例如,外泌体)。在一些方面,本文所述的经修饰的EV(例如,外泌体)包含与天然存在的EV(例如,外泌体)的膜相比,在蛋白质、脂质、小分子、碳水化合物等的组成方面不同的膜。例如,膜包含更高密度或数量的天然EV(例如,外泌体)、蛋白质,和/或膜包含非天然存在于EV(例如,外泌体)中的蛋白质。在某些方面,对膜的这种修饰改变了EV(例如,外泌体)的外表面(例如,本文所述的表面工程化的EV和外泌体)。在某些方面,对膜的这种修饰改变了EV(例如,外泌体)的腔体表面(例如,本文所述的腔体工程化的EV和外泌体)。

如本文所用,术语“经修饰的蛋白质”或“蛋白质修饰”是指与蛋白质的非突变氨基酸序列具有至少约15%同一性的蛋白质。蛋白质的修饰包括蛋白质的片段或变体。蛋白质的修饰还可以包括对蛋白质的片段或变体的化学或物理修饰。

如本文所用,术语“调节”、“修饰”及其语法变型,当应用于特定浓度、水平、表达、功能或行为时,通常指通过增加或减少,例如直接或间接促进/刺激/上调或干扰/抑制/下调特定浓度、水平、表达、功能或行为,例如,作为拮抗剂或激动剂来改变的能力。在一些情况下,相对于对照,或相对于通常可预期的平均活性水平,或相对于对照活性水平,调节剂可以增加和/或减少一定的浓度、水平、活性或功能。

如本文所用,术语“纳米囊泡”是指直径在约20nm和约250nm之间(例如,在约30nm和约150nm之间)的胞外囊泡,并且通过直接或间接操纵从细胞(例如,生产细胞)产生,以使得未操纵的细胞不会产生纳米囊泡。为了产生纳米囊泡而对细胞进行的适当操纵包括但不限于连续挤出、用碱性溶液进行的处理、超声处理或它们的组合。在一些方面,纳米囊泡的产生可以导致生产细胞的破坏。在一些方面,本文所述的纳米囊泡群基本上不含通过从质膜直接出芽或晚期胞内体与质膜的融合而衍生自细胞的囊泡。在某些方面,纳米囊泡包含支架部分,例如支架X蛋白或其片段和/或支架Y蛋白或其片段。一旦纳米囊泡来源于生产细胞,则它们即可基于其尺寸、密度、生物化学参数或它们的组合从生产细胞中分离。

如本文所用,术语“有效负载”是指作用于与本公开的EV(例如,外泌体)接触的靶标(例如,靶细胞)的生物活性分子(例如,治疗剂)。可以引入EV(例如,外泌体)中的有效负载的非限制性实例包括治疗剂,诸如核苷酸(例如,包含可检测部分或毒素或破坏转录的核苷酸)、核酸(例如,编码多肽诸如酶的DNA或mRNA分子,或具有调控功能的RNA分子诸如miRNA、dsDNA、lncRNA和siRNA)、氨基酸(例如,包含可检测部分或毒素或破坏翻译的氨基酸)、多肽(例如,酶)、脂质、碳水化合物和小分子(例如,小分子药物和毒素)。在某些方面,有效负载包括抗原。如本文所用,术语“抗原”是指当引入受试者时引发针对自身的免疫应答(细胞或体液)的任何试剂。在一些方面,抗原用于引发免疫应答,即作为疫苗。在其他方面,有效负载包括佐剂。在一些方面,有效负载分子经由马来酰亚胺部分共价连接至EV(例如,外泌体)。

术语“药学上可接受的载剂”或“药学上可接受的赋形剂”及其语法变型涵盖美国联邦政府监管机构批准的或美国药典中列出的用于包括人在内的动物的任何试剂,以及不会导致产生以至于禁止将组合物施用于受试者的程度的不期望的生理效应并且不会消除所施用的化合物的生物活性和性质的任何载体或稀释剂。包括可用于制备药物组合物的赋形剂和载剂,它们通常是安全、无毒和所期望的。

如本文所用,术语“药物组合物”是指与一种或多种其他化学组分混合或掺和或悬浮于一种或多种其他化学组分(诸如药学上可接受的载剂和赋形剂)中的一种或多种本文所述的化合物,例如EV,诸如本公开的外泌体。药物组合物的一个目的是促进EV制备物(例如,外泌体)向有需要的受试者的施用。

如本文所用,术语“多核苷酸”是指任何长度的核苷酸的聚合物,包括核糖核苷酸、脱氧核糖核苷酸、它们的类似物或它们的混合物。该术语是指分子的一级结构。因此,该术语包括三链、双链和单链脱氧核糖核酸(“DNA”),以及三链、双链和单链核糖核酸(“RNA”)。它还包括经修饰的,例如通过烷基化和/或通过加帽修饰,以及未经修饰的多核苷酸形式。具体而言,术语“多核苷酸”包括聚脱氧核糖核苷酸(含有2-脱氧-D-核糖)、聚核糖核苷酸(含有D-核糖),包括tRNA、rRNA、hRNA、siRNA和mRNA,无论是剪接的还是未剪接的,任何其他类型的多核苷酸(它是嘌呤或嘧啶碱基的N-或C-糖苷),以及其他含有正核苷酸骨架的聚合物,例如聚酰胺(例如,肽核酸“PNA”)和多吗啉聚合物,以及其他合成序列特异性核酸聚合物(前提条件是聚合物含有核碱基,所述核碱基的构型允许碱基配对和碱基堆积,诸如存在于DNA和RNA中)。在本公开的一些方面,经由马来酰亚胺部分连接至EV(例如,外泌体)的生物活性分子是多核苷酸,例如反义寡核苷酸。在特定方面,多核苷酸包括mRNA。在其他方面,mRNA是合成mRNA。在一些方面,合成mRNA包含至少一种非天然核碱基。在一些方面,某类核碱基中的所有都已被非天然核碱基替换(例如,本文公开的多核苷酸中的所有尿苷都可以被非天然核碱基,例如5-甲氧基尿苷替换)。在本公开的一些方面,生物活性分子是多核苷酸。

在一些方面,本文公开的多核苷酸可以被修饰以引入可用于与马来酰亚胺部分反应的硫醇基团。在一些方面,本文公开的多核苷酸可以被修饰以引入可用于与硫醇基团反应的马来酰亚胺部分基团。

术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,是指任何长度的氨基酸的聚合物。聚合物可以包含经修饰的氨基酸。这些术语还涵盖已被天然修饰或通过介入修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰(诸如与标记成分缀合)。该定义还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸,诸如高半胱氨酸、鸟氨酸、对乙酰苯丙氨酸、D-氨基酸和肌酸)的多肽,以及本领域已知的其他修饰。在本公开的一些方面,经由马来酰亚胺部分连接至EV(例如,外泌体)的生物活性分子是多肽,例如抗体或其衍生物,诸如ADC、PROTAC、毒素、融合蛋白或酶。

如本文所用,术语“多肽”是指任何大小、结构或功能的蛋白质、多肽和肽。多肽包括基因产物、天然存在的多肽、合成多肽、同源物、直系同源物、旁系同源物、片段以及前述物质的其他等同物、变体和类似物。多肽可以是单个多肽或可以是多分子复合物,诸如二聚体、三聚体或四聚体。它们还可以包括单链或多链多肽。最常见的二硫键存在于多链多肽中。术语多肽还可以适用于氨基酸聚合物,其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物。在一些方面,“肽”可以小于或等于50个氨基酸长度,例如约5、10、15、20、25、30、35、40、45或50个氨基酸长度。

在一些方面,本文公开的多肽可以被修饰以引入可用于与马来酰亚胺部分反应的硫醇基团。在一些方面,本文公开的多肽可以被修饰以引入可用于与硫醇基团反应的马来酰亚胺部分。

如本文所用,术语“预防(prevent、preventing)”及其变型是指部分或完全延迟疾病、病症和/或病状的发作;部分或完全延迟特定疾病、病症和/或病状的一个或多个症状、特征或临床表现的发作;部分或完全延迟特定疾病、病症和/或病状的一个或多个症状、特征或表现的发作;部分或完全延迟特定疾病、病症和/或病状的进展;以及/或者降低发展与疾病、病症和/或病状相关的病理的风险。在一些方面,通过预防性治疗来实现预防结局。

如本文中所用,术语“生产细胞”是指用于产生EV(例如,外泌体)的细胞。生产细胞可以是体外培养的细胞,也可以是体内细胞。生产细胞包括但不限于已知能够有效产生EV(例如,外泌体)的细胞,例如,HEK293细胞、中国仓鼠卵巢(CHO)细胞、间充质干细胞(MSC)、BJ人包皮成纤维细胞、fHDF成纤维细胞、神经元前体细胞、羊水细胞、脂肪间充质干细胞、RPTEC/TERT1细胞。在某些方面,生产细胞不是抗原呈递细胞。在一些方面,生产细胞不是树突细胞、B细胞、肥大细胞、巨噬细胞、中性粒细胞、Kupffer-Browicz细胞、来源于这些细胞中的任一者的细胞或它们的任何组合。

如本文所用,“预防性”是指用于预防疾病或病状的发作,或者预防或延迟与疾病或病状相关的症状的治疗或作用过程。

如本文所用,“预防”是指为维持健康和预防或延迟出血发作的发病,或者预防或延迟与疾病或病状相关的症状而采取的措施。

“重组”多肽或蛋白质是指通过重组DNA技术产生的多肽或蛋白质。为了本公开的目的而分离的在经工程化的宿主细胞中表达的重组产生的多肽和蛋白质被认为是已通过任何合适的技术分离、分馏或者部分或基本上纯化的天然或重组多肽。本文公开的多肽可以使用本领域已知的方法重组产生。或者,本文公开的蛋白质和肽可以化学合成。在本公开的一些方面,存在于EV(例如,外泌体)中的支架X蛋白和/或支架Y蛋白可以通过在生产细胞中过表达支架蛋白来重组生产,从而所得的EV(例如,外泌体)中的支架蛋白的水平相对于不过表达此类支架蛋白的生产细胞的EV(例如,外泌体)中存在的支架蛋白的水平显著增加。

如本文所用,术语“支架部分”是指在EV(例如,外泌体)的腔体表面(诸如,支架Y蛋白)或外表面(诸如,支架X蛋白)上,可用于将有效负载(例如,生物活性分子)或任何其他所关注的化合物(例如,AAV)连接至EV(例如,外泌体)的分子,例如蛋白质或其片段(例如,其功能片段)。在一些方面,支架蛋白是不天然存在于EV(例如,外泌体)中的多肽。在某些方面,支架部分包含合成分子。在一些方面,支架部分包含非多肽部分。在其他方面,支架部分包含例如天然存在于EV(例如,外泌体)中的脂质、碳水化合物、蛋白质或它们的组合(例如,糖蛋白或蛋白脂质)。在一些方面,支架部分包含不天然存在于EV(例如,外泌体)中的脂质、碳水化合物或蛋白质。在一些方面,支架部分包含天然存在于EV(例如,外泌体)中,但是相对于基础/天然/野生型水平,已经富集于EV(例如,外泌体)中的脂质或碳水化合物。在一些方面,支架部分包含天然存在于EV(例如,外泌体)中,但是相对于基础/天然/野生型水平,已经富集于EV(例如,外泌体)中,例如通过在生产细胞中重组过表达的蛋白质。在某些方面,支架部分是支架X蛋白或其片段。在一些方面,支架部分是支架Y蛋白或其片段。在其他方面,EV包含支架X蛋白或其片段以及支架Y蛋白或其片段。

如本文所用,术语“支架X”是指已经在EV(例如,外泌体)的表面上鉴定到的EV(例如,外泌体)蛋白,并且可以被工程化为在EV中过表达。参见,例如,美国专利第10,195,290号,其通过引用整体并入本文。支架X蛋白的非限制性实例包括:前列腺素F2受体负调节因子(“PTGFRN”);基础免疫球蛋白(“BSG”);免疫球蛋白超家族成员2(“IGSF2”);免疫球蛋白超家族成员3(“IGSF3”);免疫球蛋白超家族成员8(“IGSF8”);整合素β-1(“ITGB1”);整合素α-4(“ITGA4”);4F2细胞表面抗原重链(“SLC3A2”);和一类ATP转运蛋白(“ATP1A1”、“ATP1A2”、“ATP1A3”、“ATP1A4”、“ATP1B3”、“ATP2B1”、“ATP2B2”、“ATP2B3”、“ATP2B”)它们的片段,以及它们的任何组合。在一些实施方案中,支架X蛋白可以是完整的蛋白质或其片段(例如,功能性片段,例如,能够将另一个部分连接在EV(例如,外泌体)的外表面上或腔体表面上的最小片段)。在一些方面,支架X可以将生物活性分子连接至EV(例如,外泌体)的外表面或腔体。在本公开的一些方面,生物活性分子可以经由马来酰亚胺部分化学连接至支架X蛋白或其片段。在一些方面,生物活性分子可以经由EV(例如,外泌体)的腔体表面上的马来酰亚胺部分化学连接至支架X蛋白或其片段。可以用于本公开的其他支架部分的非限制性实例包括:氨基肽酶N(CD13);脑啡肽酶(膜金属内肽酶;MME);外核苷酸焦磷酸酶/磷酸二酯酶家族成员1(ENPP1);神经纤毛蛋白-1(NRP1);CD9、CD63、CD81、PDGFR、GPI蛋白、乳凝集素、LAMP2和LAMP2B、它们的片段,以及它们的任何组合。

在一些方面,支架部分(例如,在美国专利号10,195,290中描述的EV蛋白,该专利以引用的方式整体并入本文)与结合配偶体(例如,抗原结合结构域、衣壳蛋白、Fc受体、化学诱导的二聚体的结合配偶体或它们的任何组合)一起形成融合体,所述结合配偶体可以用于结合另一个分子(即,第二结合配偶体)。

如本文所用,术语“结合配偶体”是指相互相互作用以形成多聚体(例如,二聚体)的至少两个元件中的一个成员。在一些方面,结合配偶体是第一结合配偶体,所述第一结合配偶体与第二结合配偶体相互作用。在一些方面,结合配偶体是第一结合配偶体,所述第一结合配偶体与第二结合配偶体和/或第三结合配偶体相互作用。任何结合配偶体均可用于本文公开的组合物和方法。在一些方面,结合配偶体可以是多肽、多核苷酸、脂肪酸、小分子或它们的任何组合。在某些方面,结合配偶体(例如,第一结合配偶体和/或第二结合配偶体)选自化学诱导的二聚体的第一和第二结合配偶体。

如本文所用,术语“支架Y”是指已经在EV(例如,外泌体)的腔体内鉴定到的EV(例如,外泌体)蛋白,并且可以被工程化为在EV中过表达。参见,例如,国际申请第PCT/US2018/061679号,其通过引用整体并入本文。支架Y蛋白的非限制性实例包括:富含肉豆蔻酰化丙氨酸的蛋白激酶C底物(“MARCKS”);富含肉豆蔻酰化丙氨酸的蛋白激酶C底物样1(“MARCKSL1”);和脑酸可溶性蛋白1(“BASP1”)、它们的片段,以及它们的任何组合。在一些方面,支架Y蛋白可以是完整蛋白质或其片段(例如,功能性片段,例如,能够将一个部分连接至EV(例如,外泌体)的腔体表面的最小片段)。在一些方面,支架Y蛋白或其片段可以将部分连接至EV(例如,外泌体)的腔体表面。在本公开的一些方面,部分(例如,生物活性分子)可以连接(例如,化学连接)至支架Y蛋白或其片段。在一些方面,部分(例如,生物活性分子)可以连接(例如,化学连接)至EV(例如,外泌体)的腔体表面上的支架Y蛋白或其片段。

在某些方面,支架蛋白包含EV蛋白的片段。在一些方面,支架蛋白包含MARCKS、MARCKSL1或BASP1的片段。在一些方面,支架蛋白包含氨基酸序列GGKLSKK(SEQ ID NO:17)。在一些方面,支架蛋白包含氨基酸序列GGKLSKK(SEQ ID NO:17),其中C-末端甘氨酸残基是肉豆蔻酰化的。

在一些方面,支架蛋白是跨膜蛋白。如本文所用,“跨膜蛋白”是指包含胞外结构域(例如,至少一个定位于EV(例如,外泌体)膜外,例如,囊外的氨基酸)、跨膜结构域(例如,至少一个定位于EV膜内,例如,外泌体膜内的氨基酸)和胞内结构域(例如,至少一个定位于EV(例如,外泌体)膜内部的氨基酸)的任何蛋白质。在一些方面,本文所述的支架蛋白是I型跨膜蛋白,其中跨膜蛋白的N-末端定位于胞外空间,例如,包封EV(例如,外泌体)的膜外,例如,囊外。在一些方面,本文所述的支架蛋白是II型跨膜蛋白,其中跨膜蛋白的N-末端定位于胞内空间,例如,包封EV(例如,外泌体)的膜内,例如膜的腔体侧上,例如,囊内。

如本文所用,术语“自分解间隔基”是指如下文所定义的间隔基:即如果所述间隔基与第一部分(例如,可切割的接头)的键被切割,则它将自发地与第二部分(例如,生物活性分子)分离。

如本文所用,术语“相似性”是指聚合分子之间,例如多核苷酸分子(例如DNA分子和/或RNA分子)之间和/或多肽分子之间的总相关性。聚合物分子彼此之间的相似性百分比的计算可以与同一性百分比的计算相同的方式进行,不同之处在于相似性百分比的计算考虑了本领域所理解的保守置换。应当理解,相似性百分比取决于所使用的比较尺度,即是否比较氨基酸,例如根据它们的进化近似度、电荷、体积、柔性、极性、疏水性、芳香性、等电点、抗原性或它们的组合。

如本文所用,术语“间隔基”是指能够将两个间隔开的部分(例如,可切割的接头和生物活性分子)共价连接在一起形成通常稳定的二元分子的双官能化学部分。

除非另有说明,否则提及具有一个或多个立体中心的化合物意欲指其每种立体异构体及立体异构体的所有组合。

术语“受试者”、“患者”、“个体”和“宿主”及其变型在本文中可互换使用,是指需要诊断、治疗或医治的任何哺乳动物受试者,包括但不限于人类、家畜(例如,狗、猫等等)、农场动物(例如,奶牛、绵羊、猪、马等等)和实验室动物(例如,猴、大鼠、小鼠、兔、豚鼠等等),特别是人类。本文描述的方法适用于人的疗法和兽医应用。

如本文所用,术语“基本上不含”是指包含EV(例如,外泌体)的样品包含按质量/体积(m/v)百分比浓度计小于10%的大分子(例如,污染物)。一些级分可含有小于约0.001%、小于约0.01%、小于约0.05%、小于约0.1%、小于约0.2%、小于约0.3%、小于约0.4%、小于约0.5%、小于约0.6%、小于约0.7%、小于约0.8%、小于约0.9%、小于约1%、小于约2%、小于约3%、小于约4%、小于约5%、小于约6%、小于约7%、小于约8%、小于约9%或小于约10%(m/v)的大分子。

如本文所用,术语“表面工程化的EV”(例如,支架X工程化的外泌体)是指EV的膜或EV的表面在组成上被修饰,以使得工程化的EV的表面不同于修改前的EV或天然存在的EV。

如本文所用,术语“表面工程化的外泌体”(例如,支架X工程化的外泌体)是指外泌体的膜或外泌体的表面(外表面或腔体表面)在组成上被修饰,以使得经工程化的外泌体的表面不同于修饰前的外泌体或天然存在的外泌体。

工程化可以在EV(例如,外泌体)的表面上,或在EV(例如,外泌体)的膜中,从而EV(例如,外泌体)的表面被改变。例如,可以对膜的组成,例如蛋白质、脂质、小分子、碳水化合物或它们的组合进行修饰。组成可以通过化学、物理或生物方法来改变,或者通过由预先或同时通过化学、物理或生物方法修饰的细胞产生而改变。具体而言,组成可以通过基因工程来改变,或者通过由预先通过基因工程修饰的细胞产生而改变。在一些方面,表面工程化的EV(例如,外泌体)包含外源性蛋白质(即,EV(例如,外泌体)不天然表达的蛋白质)或其片段或变体,它们可以暴露于EV(例如,外泌体)的表面,或者可以将部分连接至EV(例如,外泌体)的表面。在其他方面,表面工程化的EV(例如,外泌体)包含更高表达(例如,更高数量)的天然EV(例如,外泌体)蛋白(例如,支架X蛋白)或其片段或变体,它们可以暴露于EV(例如,外泌体)的表面,或者可以将部分连接至EV(例如,外泌体)的表面。在一个特定方面,表面工程化的EV(例如,外泌体)包含一种或多种膜组分的修饰,例如蛋白质(诸如支架X蛋白或其片段)、脂质、小分子、碳水化合物或它们的任何组合,其中至少一种组分连接(例如化学连接,例如经由马来酰亚胺部分化学连接)至生物活性分子。

如本文所用,术语“治疗有效量”是足以对有需要的受试者产生期望的治疗效果、药理学和/或生理学效果的包含本公开的EV或外泌体的试剂或药物化合物的量。治疗有效量可以是“预防有效量”,因为预防可以被认为是治疗。

如本文所用,术语“治疗(treat、treatment或treating)”是指例如疾病或病状的严重度降低;病程持续时间的缩短;与疾病或病状相关的一种或多种症状的改善或消除;向患有疾病或病状的受试者提供有益作用,但不一定治愈疾病或病状;或者它们的任何组合。该术语还包括疾病或病状或其症状的防御或预防。在一个方面,术语“治疗(treating或treatment)”是指在有需要的受试者中诱导针对抗原的免疫应答,例如通过在EV(例如,外泌体)的外表面上施用包含抗原(疫苗抗原)和任选地佐剂的EV(例如,外泌体)。

如本文中所用,术语分子(例如,功能性分子、抗原、佐剂、支架X蛋白或其片段以及/或者支架Y蛋白或其片段)的“变体”是指通过本领域已知的方法进行比较后与另一个分子共有某些结构和功能同一性的分子。例如,一种蛋白质的变体可以包括另一种蛋白质中的置换、插入、缺失、移码或重排。

在一些方面,支架X的变体或衍生物包括与全长、成熟PTGFRN、BSG、IGSF2、IGSF3、IGSF8、ITGB1、ITGA4、SLC3A2或ATP转运蛋白或者PTGFRN、BSG、IGSF2、IGSF3、IGSF8、ITGB1、ITGA4、SLC3A2或ATP转运蛋白的片段(例如,功能性片段)具有至少约70%同一性的支架X变体。

在一些方面,本文公开的支架X蛋白的变体或片段变体或其衍生物保留了特异性靶向EV(例如,外泌体)的能力。在一些方面,支架X或支架X衍生物包含一个或多个突变,例如保守氨基酸置换。

在一些方面,支架Y的变体或其衍生物包含与MARCKS、MARCKSL1、BASP1或者MARCKS、MARCKSL1或BASP1的片段具有至少70%同一性的变体。

在一些方面,支架Y蛋白的变体或片段变体或其衍生物保留了特异性靶向EV(例如,外泌体)的腔体表面的能力。在一些方面,支架Y包含一个或多个突变,例如保守氨基酸置换。

天然存在的变体被称为“等位基因变体”,是指占据生物体的染色体上给定基因座的基因的几种替代形式之一(Genes II,Lewin,B.,编辑,John Wiley&Sons,New York(1985))。这些等位基因变体可在多核苷酸和/或多肽水平上变化,并且包含在本公开中。或者,非天然存在的变体可通过诱变技术或直接合成产生。

使用蛋白质工程和重组DNA技术的已知方法,能产生变体来改善或改变多肽的特征。例如,可从分泌蛋白质的N-末端或C-末端使一个或多个氨基酸缺失,而基本上不损失生物功能。Ron等人,J.Biol.Chem.268:2984-2988(1993)(通过引用整体并入本文)报道了变体KGF蛋白即便是在删除3个、8个或27个氨基末端氨基酸残基之后仍具有肝素结合活性。类似地,干扰素γ在从该蛋白的羧基端删除8-10个氨基酸残基后显示出高达十倍的活性。(Dobeli等人,J.Biotechnology 7:199-216(1988),通过引用整体并入本文)。

此外,大量的证据表明,变体通常保留着与天然存在的蛋白质相似的生物活性。例如,Gayle及同事(J.Biol.Chem 268:22105-22111(1993),通过引用整体并入本文)对人细胞因子IL-1a进行了广泛的突变分析。他们利用随机诱变生成了3,500多种单独的IL-1a突变体,在分子的整个长度上每种变体平均有2.5个氨基酸的变化。在每个可能的氨基酸位置都检查到多重突变。研究人员发现,“大多数分子可被改变,而对[结合或生物活性]几乎没有影响。”(见摘要)。事实上,在检查的3,500多个核苷酸序列中,只有23个独特的氨基酸序列产生了与野生型活性显著不同的蛋白质。

如上所述,变体或衍生物包括例如经修饰的多肽。在一些方面,例如多肽、多核苷酸、脂质、糖蛋白的变体或衍生物是化学修饰和/或内源性修饰的结果。在一些方面,变体或衍生物是体内修饰的结果。在一些方面,变体或衍生物是体外修饰的结果。在另外其他方面,变体或衍生物是生产细胞中的胞内修饰的结果。

变体和衍生物中存在的修饰包括,例如,乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、二硫键形成、去甲基化、共价交联的形成、半胱氨酸的形成、焦谷氨酸盐的形成、甲酰化、γ-羧化、糖基化、糖基磷脂酰肌醇(GPI)的共价连接、羟基化、碘化、甲基化、肉豆蔻酰化、氧化、聚乙二醇化(Mei等人,Blood116:270-79(2010),该文献通过引用整体并入本文)、蛋白水解加工、磷酸化、异戊烯化、外消旋化、硒化、硫酸化、转运RNA介导的向蛋白质中添加氨基酸,诸如精氨酰化和泛素化。

在一些方面,支架X蛋白和/或支架Y蛋白可以在任何方便的位置进行修饰。在一些方面,生物活性分子可以在任何方便的位置修饰。在本公开的特定方面,EV(例如,外泌体)、组分(例如,蛋白质诸如支架X蛋白、支架Y蛋白、脂质、聚糖或它们的组合)和/或生物活性分子(例如,抗体或ADC、PROTAC、小分子(诸如环状二核苷酸)、毒素(诸如MMAE)、STING激动剂、耐受剂、反义寡核苷酸、抗原(诸如疫苗抗原)、佐剂、靶向部分、向性部分或它们的任何组合)可以被修饰以产生包含至少一个马来酰亚胺部分的衍生物。

II.缀合的EV(例如,外泌体)

胞外囊泡(EV)的直径通常为20nm至1000nm;例如,外泌体是小胞外囊泡,直径通常为100至200nm。EV(例如,外泌体)由限制性脂质双层和多种蛋白质和核酸组成(Maas,S.L.N.等人,Trends.Cell Biol.27(3):172-188(2017))。EV(例如,外泌体)在离散的细胞类型和组织中表现出优先摄取,并且可以通过在其表面添加与靶细胞表面上的受体相互作用的蛋白质来引导它们的向性(Alvarez-Erviti,L.等人,Nat.Biotechnol.29(4):341-345(2011))。

与抗体不同,EV(例如,外泌体)可以容纳大量连接在其表面的分子,每个EV(例如,外泌体)大约有数千到数万个分子。因此,EV(例如,外泌体)-药物缀合物代表了一种可将高浓度的治疗性化合物递送到离散细胞类型,同时限制对化合物的整体全身暴露,从而降低脱靶毒性的平台。

本公开提供了通过使包含游离的硫醇基团的第一分子实体与包含马来酰亚胺基团的第二分子实体反应而设计的EV(例如,外泌体),其中所述马来酰亚胺部分将第一分子实体(例如,EV,例如外泌体或其组分(例如支架X蛋白或脂质))经由马来酰亚胺部分共价连接至第二分子实体(例如,生物活性分子),如图1A所示。

可以经由马来酰亚胺部分连接至EV(例如,外泌体)的生物活性分子的非限制性实例包括药剂,诸如核苷酸(例如,包含可检测部分或毒素或破坏转录的核苷酸)、核酸(例如,编码多肽(诸如酶)的DNA或mRNA分子,或具有调节功能的RNA分子,诸如miRNA、dsDNA、lncRNA或siRNA)、吗啉、氨基酸(例如,包含可检测部分的氨基酸或破坏翻译的毒素)、多肽(例如,酶)、脂质、碳水化合物、小分子(例如,小分子药物和毒素)、抗原(例如,疫苗抗原)、佐剂(例如,疫苗佐剂)等。

在一些方面,本公开的EV(例如,外泌体)可以包含多于一种类型的生物活性分子。在一些方面,生物活性分子可以是例如小分子(诸如环状二核苷酸)、毒素(诸如澳瑞他汀(例如,单乙基澳瑞他汀E、MMAE))、抗体(例如,裸抗体或抗体-药物缀合物)、STING激动剂、耐受剂、反义寡核苷酸、PROTAC、吗啉、溶血磷脂酸受体拮抗剂(例如,LPA1拮抗剂)或它们的任何组合。在一些方面,本公开的EV(例如,外泌体)可以包含例如疫苗抗原和任选地疫苗佐剂。在一些方面,本公开的EV(例如,外泌体)可以包含治疗有效负载(例如,STING或下文公开的一种有效负载)和靶向部分和/或向性部分。

因此,本文公开的方法可以产生如图1A所示的分子实体,其中EV(例如,外泌体)或其任何分子组分,诸如定位于EV(例如,外泌体)上的多肽(例如,支架X蛋白或其片段)、脂质、脂蛋白、糖蛋白、或者天然存在的或非天然存在的蛋白质的任何变体或衍生物,可以经由马来酰亚胺部分化学连接至生物活性分子,例如治疗有效负载、靶向部分、向性部分或它们的任何组合。如图1A所示,在一些方面,包含巯基(硫醇)基团的EV(例如,外泌体)或其分子组分可以与连接至生物活性部分的马来酰亚胺基团反应。在其他方面,包含马来酰亚胺基团的EV(例如,外泌体)或其分子组分可以与存在于生物活性部分中的巯基(硫醇)基团反应。在这两种情况下,最终产品都是经由硫醚键化学连接至EV(例如,外泌体)的生物活性分子。

II.A.马来酰亚胺部分

马来酰亚胺部分可以是包含马来酰亚胺基团的任何化学部分(例如,双官能化学部分,它将EV(例如,外泌体)连接至接头,例如肽):

其中

(i)*表示与存在于EV(例如,外泌体)上的任何可用的马来酰亚胺反应性基团的连接点,例如支架X蛋白的游离的硫醇基团;并且,

(ii)波浪线表示与马来酰亚胺部分的其余部分的连接位点。

在一些方面,马来酰亚胺部分连接至与EV(例如,外泌体)连接的硫原子,例如硫醇基团中天然存在的硫原子或者经由化学修饰或经由突变引入的硫原子。

在一些方面,所述马来酰亚胺部分具有式(I):

其中

(i)R1选自由以下各项组成的组:-C1-10亚烷基-、-C3-8碳环-、-O-(C1-8亚烷基)-、-亚芳基-、-C1-10亚烷基-亚芳基-、-亚芳基-C1-10亚烷基-、-C1-10亚烷基-(C3-8碳环)-、-(C3-8碳环)-C1-10亚烷基-、-C3-8杂环-、-C1-10亚烷基-(C3-8杂环)-、-(C3-8杂环)-C1-10亚烷基-、-(CH2CH2O)r-和-(CH2CH2O)r-CH2-;

(ii)r为整数,例如1至10;

(iii)*表示与任何可用的反应性硫原子的连接点,例如,存在于EV(例如,外泌体)上的硫醇基团中的硫;并且,

(iv)波浪线表示所述马来酰亚胺部分与所述生物活性分子的连接位点。

在一些方面,R1是-C1-8亚烷基-、-C3-6碳环-、-O-(C1-6亚烷基)-、-亚芳基-、-C1-8亚烷基-亚芳基-、-亚芳基-C1-8亚烷基-、-C1-8亚烷基-(C3-6碳环)-、-(C3-6碳环)-C1-8亚烷基-、-C3-6杂环-、-C1-8亚烷基-(C3-6杂环)-、-(C3-6杂环)-C1-8亚烷基-、-(CH2CH2O)r-和-(CH2CH2O)r-CH2-;其中r为整数,例如1至10;

在一些方面中,R1是–(CH2)s-、环戊基、环己基、-O-(CH2)s-、苯基、-CH2-苯基-、苯基-CH2-、-CH2环戊基、环戊基CH2-、-CH2-环己基、环己基-CH2-、-(CH2CH2O)r-、和-(CH2CH2O)r-CH2-;其中r为整数,例如1至6。

在一些方面,R1是-(CH2)s-,其中s为例如4、5或6。

在一些方面,马来酰亚胺部分具有式(II),其中R1是-(CH2)5-:

在一些方面,马来酰亚胺部分具有式(III),其中R1是-(CH2CH2O)r-CH2-,并且其中r为2:

在一些方面,马来酰亚胺部分共价连接至存在于EV(例如,外泌体)上的官能团,其中所述官能团是巯基(硫醇)基团。在一个方面,巯基基团在EV(例如,外泌体)表面的蛋白质上,例如支架X蛋白或其片段或变体。例如,在一些方面,巯基可以存在于硫醇脂质上,例如胆固醇-SH、DSPE-SH或其衍生物,例如胆固醇-PEG-SH或DSPE-PEG-SH。

在其他方面,马来酰亚胺部分共价连接至EV(例如,外泌体)上存在的官能团,所述官能团已被化学衍生化以提供马来酰亚胺部分。例如,在一个方面,存在于EV(例如,外泌体)上的胺官能团(例如,赖氨酸或精氨酸,或蛋白质的末端胺基团的侧链上的胺)可以用包含例如琥珀酰亚胺部分和马来酰亚胺部分的双官能试剂衍生化。

在其他方面,存在于EV(例如,外泌体)上的羧基官能团(例如,谷氨酸或天冬氨酸,或蛋白质的末端羧基基团的侧链上的羧基)可以用包含例如异氰酸酯部分和马来酰亚胺部分的双官能试剂衍生化。在另外其他方面,EV(例如,外泌体)上存在的羰基(氧化的碳水化合物)可以用包含例如肼部分和马来酰亚胺部分的双官能试剂衍生化。

一般而言,本文公开的方法可以使用任何试剂实施,例如双官能或多官能试剂,它在与存在于EV(例如,外泌体)的表面(外表面或腔体表面)上的分子(例如,蛋白质、脂质、糖)反应时将共价或非共价修饰该分子,以产生包含至少一个马来酰亚胺部分的经修饰的分子。EV(例如,外泌体)的表面(外表面或腔体表面)上存在的分子可以是天然存在的,也可以是非天然存在的,即它已经被修饰,例如经由化学修饰,与包含非天然存在的分子的组合物一起温育,或经由突变(例如,经由突变将一个或多个半胱氨酸氨基酸引入蛋白质中)。

包含马来酰亚胺部分的双官能试剂、其中许多含马来酰亚胺单元可以多聚化的试剂、或者可以经由马来酰亚胺基团添加功能性部分(例如,PEG)的含马来酰亚胺的试剂包括,例如,包含肼部分和马来酰亚胺部分的双官能试剂、包含异氰酸酯部分和马来酰亚胺部分的双官能试剂、包含N-羟基琥珀酰亚胺酯部分和马来酰亚胺部分的双官能试剂、包含琥珀酰亚胺部分和马来酰亚胺部分的双官能试剂、生物素-马来酰亚胺、链霉亲和素-马来酰亚胺、N-4-马来酰亚胺丁酸、N-(4-马来酰亚胺丁氧基)琥珀酰亚胺、N-[5-(3'-马来酰亚胺丙基酰胺)-1-羧基戊基]亚氨基二乙酸、马来酰亚胺-PEG-琥珀酰亚胺酯(例如,马来酰亚胺-PEG12-琥珀酰亚胺酯、马来酰亚胺-PEG2-琥珀酰亚胺酯、马来酰亚胺-PEG2000-琥珀酰亚胺酯、马来酰亚胺-PEG5000-琥珀酰亚胺酯、或马来酰亚胺-PEGn-琥珀酰亚胺酯(其中1<n<5000))、马来酰亚胺-PEG-马来酰亚胺(例如,马来酰亚胺-PEG12-马来酰亚胺、马来酰亚胺-PEG2-马来酰亚胺、马来酰亚胺-PEG2000-马来酰亚胺、马来酰亚胺-PEG5000-马来酰亚胺、或马来酰亚胺-PEGn-马来酰亚胺(其中1<n<5000))、马来酰亚胺-OH、马来酰亚胺-PEGn-OH(其中1<n<5000)、马来酰亚胺-聚(乙二醇)-b-聚(ε-己内酯)、(S)-(-)-N-(1-苯乙基)马来酰亚胺、N-(4-氯苯基)马来酰亚胺、N-(1-芘基)马来酰亚胺、甲氧基聚乙二醇马来酰亚胺、聚(乙二醇)甲基醚马来酰亚胺、N-(4,4,5,5,6,6,7,7,8,8,9,9,10,10,11,11,11-十七氟十一烷基)马来酰亚胺、去铁胺-马来酰亚胺(即,螯合剂-马来酰亚胺)、马来酰亚胺缩水甘油醚、双官能马来酰亚胺DTPA、双官能NOTA-马来酰亚胺螯合剂、同双官能马来酰亚胺交联剂(即,每个末端具有马来酰亚胺基团的那些)、双马来酰亚胺聚亚烷基二醇、DBCO-马来酰亚胺、苯并三唑马来酰亚胺、炔烃马来酰亚胺、马来酰亚胺官能化脂质、马来酰亚胺官能化PEG脂质、以及通常包含至少一个马来酰亚胺部分、至少一个附加反应性部分(例如,马来酰亚胺或另一个反应性基团)和一个或多个任选的接头(例如,PEG或另一个聚合物,例如聚甘油)的任何分子。

II.B.接头

本公开的EV(例如,外泌体)可以包含一个或多个将马来酰亚胺部分连接(即,联接)至生物活性分子或EV(例如,外泌体)的接头。在一些方面,马来酰亚胺部分通过接头连接至生物活性分子。接头可以是能够例如将马来酰亚胺部分(例如,式(II)或(III))连接至生物活性分子的任何化学部分。在一些方面,马来酰亚胺部分可以包含一个或多个接头。在一些方面,本文公开的接头或它们的组合可以用于连接例如马来酰亚胺部分与生物活性分子、第一生物活性部分与第二生物活性部分、EV(例如膜脂质或其支架蛋白)与马来酰亚胺部分,或EV(例如,膜脂质或其支架蛋白)与生物活性部分。

在一些方面,术语“接头”是指肽或多肽序列(例如,合成肽或多肽序列)或非多肽,例如烷基链。在一些方面,可将两个或更多个接头串联连接。当本文公开的马来酰亚胺部分中存在多个接头时,每个接头可以相同或不同。一般来说,接头提供了灵活性或防止/改善了空间障碍。接头通常不被切割;然而,在某些方面,这种切割可以是想要的。因此,在一些方面,接头可包含一个或多个蛋白酶可切割位点,其可以位于接头序列内或接头序列任一端的接头侧翼。

在一些方面,接头是肽接头。在一些方面,肽接头可包含至少约两个、至少约三个、至少约四个、至少约五个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80、至少约85、至少约90、至少约95或至少约100个氨基酸。

在一些方面,肽接头可以包含至少约110、至少约120、至少约130、至少约140、至少约150、至少约160、至少约170、至少约180、至少约190个或至少约200个氨基酸。

在其他方面,肽接头可以包含至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、或至少约1,000个氨基酸。肽接头可以包含1个至约5个氨基酸、1个至约10个氨基酸、1个至约20个氨基酸、约10个至约50个氨基酸、约50个至约100个氨基酸、约100个至约200个氨基酸、约200个至约300个氨基酸、约300个至约400个氨基酸、约400个至约500个氨基酸、约500个至约600个氨基酸、约600个至约700个氨基酸、约700个至约800个氨基酸、约800个至约900个氨基酸或约900个至约1000个氨基酸。

在一些方面,接头是甘氨酸/丝氨酸接头。在一些方面,肽接头是根据式[(Gly)n-Ser]m(SEQ ID NO:46)的甘氨酸/丝氨酸接头,其中n是1至100的任何整数,并且m是1至100的任何整数。在其他方面,甘氨酸/丝氨酸接头是根据式[(Gly)x-Sery]z(SEQ ID NO:47)的接头,其中x为1至4的整数,y为0或1,z为1至50的整数。在一些方面,肽接头包含序列Gn(SEQID NO:48),其中n可以为1至100的整数。在一些方面,肽接头可以包含序列(GlyAla)n(SEQID NO:49),其中n为在1和100之间的整数。在其他方面,肽接头可以包含序列(GlyGlySer)n(SEQ ID NO:50),其中n为在1和100之间的整数。

在一个具体方面,肽接头的序列是GGGG(SEQ ID NO:30)。

在一些方面,肽接头可以包含序列(GlyAla)n,其中n为在1和100之间的整数。在其他方面,肽接头可以包含序列(GlyGlySer)n,其中n为在1和100之间的整数。

在其他方面,肽接头包含序列(GGGS)n(SEQ ID NO:31)。在另外其他方面,肽接头包含序列(GGS)n(GGGGS)n(SEQ ID NO:217)。在这些情况下,n可以是1至100的整数。在其他情况下,n可以是一至20的整数,即1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一些方面,n是1至100的整数。

接头的另外实例包括但不限于GGG、SGGSGGS(SEQ ID NO:218)、GGSGGSGGSGGSGGG(SEQ ID NO:219)、GGSGGSGGGGSGGGGS(SEQ ID NO:220)、GGSGGSGGSGGSGGSGGS(SEQ ID NO:221)或GGGGSGGGGSGGGGS(SEQ ID NO:222)。在一些方面,接头是多聚G序列(GGGG)n(SEQ IDNO:223),其中n可以是1-100的整数。

在一些方面,肽接头是合成的,即非天然存在的。在一个方面,肽接头包括肽(或多肽)(例如,天然或非天然存在的肽),其包含将第一线性氨基酸序列与第二线性氨基酸序列连接或遗传融合,所述第一线性氨基酸序列在自然界中与所述第二线性氨基酸序列不是天然连接或遗传融合的。例如,在一个方面,肽接头可包含非天然存在的多肽,其是天然存在的多肽的修饰形式(例如,包含突变诸如添加、取代或缺失)。

在其他方面,肽接头可以包含非天然存在的氨基酸。在另外其他方面,肽接头可包含天然存在的氨基酸,其存在于不存在于自然界的直链序列中。在另外其他,肽接头可以包含天然存在的多肽序列。

在一些方面,接头包括非肽接头。在其他方面,接头由非肽接头组成。在一些方面,非肽接头可以是例如马来酰亚胺基己酰基(MC)、马来酰亚胺基丙酰基(MP)、甲氧基聚乙二醇(MPEG)、4-(N-马来酰亚胺基甲基)-环己烷-1-羧酸琥珀酰亚胺基酯(SMCC)、间马来酰亚胺基苯甲酰基-N-羟基琥珀酰亚胺酯(MBS)、4-(对马来酰亚胺基苯基)丁酸琥珀酰亚胺基酯(SMPB)、N-琥珀酰亚胺基(4-碘乙酰基)氨基苯甲酸酯(SIAB)、6-[3-(2-吡啶基二硫)-丙酰胺]己酸琥珀酰亚胺基酯(LC-SPDP)、4-琥珀酰亚胺基氧基羰基-α-甲基-α-(2-吡啶基二硫)甲苯(SMPT)等(参见,例如,美国专利号7,375,078)。

使用本领域已知的技术(例如,化学缀合、重组技术或肽合成)可以将接头引入马来酰亚胺部分。在一些方面,使用重组技术可引入接头。在其他方面,使用固相肽合成可引入接头。在某些方面,本文公开的马来酰亚胺部分可同时含有已使用重组技术引入的一个或多个接头和已使用固相肽合成或本领域已知的化学缀合方法引入的一个或多个接头。

接头可以对切割敏感(“可切割的接头”),从而促进生物活性分子的释放。因此,在一些方面,本文公开的马来酰亚胺部分可包含可切割的接头。在生物活性分子保持活性的条件下,此类可切割的接头可以对例如酸诱导的切割、光诱导的切割、肽酶诱导的切割、酯酶诱导的切割和二硫键切割敏感。或者,接头可以基本上抗切割(“不可切割的接头”)。

一些可切割的接头被蛋白酶切割(“蛋白酶可切割的接头”)。只有某些肽容易在细胞内或细胞外切割。参见,例如,Trout等人,79 Proc.Natl.Acad.Sci.USA,626-629(1982)和Umemoto等人43 Int.J.Cancer,677-684(1989)。可切割的接头可包含由α-氨基酸单元和肽键组成的可切割位点,它们在化学上是一个氨基酸的羧酸和第二个氨基酸的氨基基团之间的酰胺键。其他酰胺键,诸如羧酸和赖氨酸的α-氨基酸基团之间的键,被理解为不是肽键并且被认为是不可切割的。

在一些方面,蛋白酶可切割的接头包含蛋白酶的切割位点:例如,中性溶酶(CALLA或CDIO)、甲拌磷寡肽酶(TOP)、白三烯A4水解酶、内皮缩血管肽转化酶、ste24蛋白酶、溶神经素、线粒体中间肽酶、间质胶原酶、胶原酶、溶基质素、巨噬细胞弹性酶、基质溶解因子、明胶酶、跨膜肽酶(meprins)、前胶原C-内肽酶、前胶原N-内肽酶、ADAM和ADAMT金属蛋白酶、髓磷脂相关的金属蛋白酶、釉质溶素(enamelysin)、肿瘤坏死因子α-转换酶、胰岛素溶酶(insulysin)、nardilysin、线粒体处理肽酶、magnolysin、dactylysin样金属蛋白酶、嗜中性粒细胞胶原酶、基质金属蛋白酶、膜型基质金属蛋白酶、SP2内肽酶、前列腺特异性抗原(PSA)、纤溶酶、尿激酶、人成纤维细胞活化蛋白质(FAPα)、胰蛋白酶、糜蛋白酶、降钙蛋白酶(caldecrin)、胰弹性蛋白酶、胰内肽酶、肠肽酶、白细胞弹性蛋白酶、成髓细胞、糜蛋白酶类(chymases)、类胰蛋白酶、粒酶、角质层糜蛋白酶、顶体蛋白酶、激肽释放酶、补体成分和因子、替代补体途径c3/c5转换酶、甘露糖结合蛋白相关的丝氨酸蛋白酶、凝固因子、凝血酶、蛋白c、u和t型纤溶酶原活性剂、组织蛋白酶G、肝丝酶(hepsin)、丝氨酸蛋白水解酶(prostasin)、肝细胞生长因子活化内肽酶、枯草杆菌蛋白酶/kexin型前蛋白转化酶、弗林蛋白酶、前蛋白转化酶、脯氨酰肽酶、酰基氨基酰基肽酶、肽基-glycaminase、信号肽酶、n-末端亲核试剂氨基水解酶、20s蛋白酶体、γ-谷氨酰转肽基酶、线粒体内肽酶、线粒体内肽酶Ia、htra2肽酶、蛋白裂解酶(matriptase)、位点1蛋白酶、天冬酰胺内肽酶(legumain)、组织蛋白酶、半胱氨酸组织蛋白酶、钙蛋白酶、泛素异肽酶T、胱天蛋白酶、糖基磷脂酰肌醇蛋白转酰胺基酶、癌症促凝血剂、激素原硫醇蛋白酶、γ-谷氨酰基水解酶、博莱霉素水解酶、成纤维细胞活化蛋白(seprase)、组织蛋白酶B、组织蛋白酶D、组织蛋白酶L、组织蛋白酶M、组织蛋白酶K、胃蛋白酶(pepsins)、凝乳酶(chymosyn)、胃亚蛋白酶(gastricsin)、肾素、酵母天冬酶(yapsin)和/或memapsin、前列腺特异性抗原(PSA)或一般的任何Asp-N,Glu-C,Lys-C or Arg-C蛋白酶。参见,例如,Cancer Res.77(24):7027-7037(2017),该文献以引用的方式整体并入本文。在一些方面,可切割的接头组分包括含有一至十个氨基酸残基的肽。在这些方面,肽允许通过蛋白酶对接头进行切割,从而在暴露于细胞内蛋白酶(诸如溶酶体酶)时促进生物活性分子的释放(Doronina等人(2003)Nat.Biotechnol.21:778-784)。示例性的肽包括但不限于二肽、三肽、四肽、五肽和六肽。示例性的二肽包括但不限于缬氨酸-丙氨酸(val-ala)、缬氨酸-瓜氨酸(val-cit)、苯丙氨酸-赖氨酸(phe-lys)、N-甲基-缬氨酸-瓜氨酸、环己基丙氨酸-赖氨酸和β-丙氨酸-赖氨酸。示例性三肽包括但不限于甘氨酸-缬氨酸-瓜氨酸(gly-val-cit)和甘氨酸-甘氨酸-甘氨酸(gly-gly-gly)。

肽可包含天然存在的和/或非天然的氨基酸残基。术语“天然存在的氨基酸”是指Ala、Asp、Cys、Glu、Phe、Gly、His、He、Lys、Leu、Met、Asn、Pro、Gin、Arg、Ser、Thr、Val、Trp和Tyr。“非天然氨基酸”(即,氨基酸不是天然存在的)包括,作为非限制性实例,高丝氨酸、高精氨酸、瓜氨酸、苯基甘氨酸、牛磺酸、碘酪氨酸、硒代半胱氨酸、正亮氨酸(“Nle”)、正缬氨酸(“Nva”)、β-丙氨酸、L-或D-萘氨酸、鸟氨酸(“Orn”)等。肽可被设计和优化以供特定酶进行酶促裂解,所述特定酶例如,肿瘤相关的蛋白酶、组织蛋白酶B、C和D或纤维蛋白溶酶蛋白酶。

氨基酸还包括天然和非天然氨基酸的D型。“D-”表示具有“D”(右旋)构型的氨基酸,与天然存在的(“L-”)氨基酸中的构型相反。天然和非天然氨基酸可以商购获得(SigmaChemical Co.,Advanced Chemtech)或使用本领域已知的方法合成。

一些接头被酯酶切割(“酯酶可切割的接头”)。只有某些酯可以被细胞内外存在的酯酶切割。酯是由羧酸和醇缩合形成的。简单酯是用简单醇(诸如脂肪醇)和小环和小芳香醇产生的酯。

在一些方面,接头是“还原敏感型接头”。在一些方面,还原敏感型接头含有二硫键。在一些方面,接头是“酸不稳定型接头”。在一些方面,酸不稳定型接头含有腙。合适的酸不稳定型接头还包括,例如,顺式乌头酸接头、酰肼接头、硫代氨甲酰基接头或其任意组合。

在一些方面,接头包含不可切割的接头。不可切割的接头是能够以稳定的共价方式将马来酰亚胺部分连接至生物活性分子的任何化学部分,并且不属于上面列出的可切割的接头的类别。因此,不可切割的接头基本上耐受酸诱导的切割、光诱导的切割、肽酶诱导的切割、酯酶诱导的切割和二硫键切割。此外,不可切割是指在环状二核苷酸和/或抗体不失去其活性的条件下,接头中或与接头相邻的化学键承受由酸、光不稳定切割剂、肽酶、酯酶或切割二硫键的化学或生理化合物诱导的切割的能力。在一些方面,生物活性分子经由间隔基与接头连接。在一个方面,间隔基是自分解间隔基。在另一个方面,间隔基是非自分解间隔基。

在一些方面,接头包括不可切割的接头,所述不可切割的接头包括例如四乙二醇(TEG)、六乙二醇(HEG)、聚乙二醇(PEG)、琥珀酰亚胺或它们的任何组合。在一些方面,所述不可切割的接头包含将所述生物活性分子连接至所述不可切割的接头的间隔基单元。在一些方面,一个或多个不可切割的接头包含连接在一起的较小单元(例如,HEG、TEG、甘油、C2至C12烷基等)。在一个方面,键是酯键(例如,磷酸二酯或硫代磷酸酯)或其他键。

II.B.1乙二醇(HEG、TEG、PEG)接头

在一些方面,接头包括不可切割的接头,其中所述不可切割的接头包含聚乙二醇(PEG),其特征在于式R3-(O-CH2-CH2)n-或R3-(0-CH2-CH2)n-O-,其中R3是氢、甲基或乙基,并且n的值为2至200。在一些方面,接头包含间隔基,其中间隔基是PEG。

在一些方面,PEG接头是低聚乙二醇,例如二乙二醇、三乙二醇、四乙二醇(TEG)、五乙二醇或六乙二醇(HEG)接头。

在一些方面,n的值为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17,18,19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、189、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或200。

在一些方面,n在2和10之间、在10和20之间、在20和30之间、在30和40之间、在40和50之间、在50和60之间、在60和70之间、在70和80之间、在80和90之间、在90和100之间、在100和110之间、在110和120之间、在120和130之间、在130和140之间、在140和150之间、在150和160之间、在160和170之间、在170和180之间、在180和190之间或在190和200之间。

在一些特定方面,n的值为3至200、3至20、10至30或9至45。

在一些方面,PEG是支链PEG。支链PEG具有三至十条从一个中央核心基团发出的PEG链。

在某些方面,PEG部分是单分散聚乙二醇。在本公开的上下文中,单分散聚乙二醇(mdPEG)是具有单一的、确定的链长和分子量的PEG。mdPEG通常通过色谱法从聚合混合物中分离产生。在某些式中,单分散PEG部分被指定为缩写mdPEG。

在一些方面,PEG是星形PEG。星形PEG具有10至100条从一个中央核心基团发出的PEG链。

在一些方面,PEG是梳状PEG。梳状PEG具有多个通常接枝到聚合物主链上的PEG链。

在某些方面,PEG的摩尔质量在100g/mol和3000g/mol之间,特别是在100g/mol和2500g/mol之间,更特别是约100g/mol至2000g/mol。在某些方面,PEG的摩尔质量在200g/mol和3000g/mol之间,特别是在300g/mol和2500g/mol之间,更特别是约400g/mol至2000g/mol。

在一些方面,PEG是PEG100、PEG200、PEG300、PEG400、PEG500、PEG600、PEG700、PEG800、PEG900、PEG1000、PEG1100、PEG1200、PEG1300、PEG1400、PEG1500、PEG1600、PEG1700、PEG1800、PEG1900、PEG2000、PEG2100、PEG2200、PEG2300、PEG2400、PEG2500、PEG1600、PEG1700、PEG1800、PEG1900、PEG2000、PEG2100、PEG2200、PEG2300、PEG2400、PEG2500、PEG2600、PEG2700、PEG2800、PEG2900或PEG3000。在一个特定方面,PEG是PEG400。在另一个特定方面,PEG是PEG2000

在一些方面,本公开的接头可包含数个PEG接头,例如侧接PEG、HEG或TEG接头的可切割的接头。

在一些方面,接头包含(HEG)n和/或(TEG)n,其中n是在1和50之间的整数,并且每个单元例如经由磷酸酯接头、硫代磷酸酯键或它们的组合连接。

II.B.2甘油和聚甘油(PG)

在一些方面,接头包含不可切割的接头,所述不可切割的接头包含甘油单元或由式((R3-O-(CH2-CHOH-CH2O)n-)描述的聚甘油(PG),其中R3是氢、甲基或乙基,并且n的值为3至200。在一些方面,n的值为3至20。在一些方面,n的值为10至30。

在一些方面,PG接头是双甘油、三甘油、四甘油(TG)、五甘油或六甘油(HG)接头。

在一些方面,n的值为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17,18,19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、189、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或200。

在一些方面,n在2和10之间、在10和20之间、在20和30之间、在30和40之间、在40和50之间、在50和60之间、在60和70之间、在70和80之间、在80和90之间、在90和100之间、在100和110之间、在110和120之间、在120和130之间、在130和140之间、在140和150之间、在150和160之间、在160和170之间、在170和180之间、在180和190之间或在190和200之间。

在这些方面的一些替代方案中,n的值为9至45。在一些方面,异源性部分是由式(R3-O-(CH2-CHOR5-CH2-O)n-)描述的支链聚甘油,其中R5是氢或由式(R3-O-(CH2-CHOH-CH2-O)n-)描述的直链甘油链,并且R3为氢、甲基或乙基。在一些方面,异源性部分是由式(R3-O-(CH2-CHOR5-CH2-O)n-)描述的超支链聚甘油,其中R5是氢或由式(R3-O-(CH2-CHOR6-CH2-O)n-)描述的甘油链,其中R6是氢或由式(R3-O-(CH2-CHOR7-CH2-O)n-)描述的甘油链,其中R7是氢或由式(R3-O-(CH2-CHOH-CH2-O)n-)描述的线性甘油链,并且R3是氢、甲基或乙基。超支链甘油及其合成方法在Oudshorn等人(2006)Biomaterials 27:5471-5479;Wilms等人(20100Acc.Chem.Res.43,129-41和本文引用的参考文献中有所描述。

在某些方面,PG的摩尔质量在100g/mol和3000g/mol之间,特别是在100g/mol和2500g/mol之间,更特别是约100g/mol至2000g/mol。在某些方面,PG的摩尔质量在200g/mol和3000g/mol之间,特别是在300g/mol和2500g/mol之间,更特别是约400g/mol至2000g/mol。

在一些方面,PG是PG100、PG200、PG300、PG400、PG500、PG600、PG700、PG800、PG900、PG1000、PG1100、PG1200、PG1300、PG1400、PG1500、PG1600、PG1700、PG1800、PG1900、PG2000、PG2100、PG2200、PG2300、PG2400、PG2500、PG1600、PG1700、PG1800、PG1900、PG2000、PG2100、PG2200、PG2300、PG2400、PG2500、PG2600、PG2700、PG2800、PG2900或PG3000。在一个特定方面,PG是PG400。在另一个特定方面,PG是PG2000

在一些方面,接头包含(甘油)n、和/或(HG)n和/或(TG)n,其中n是在1和50之间的整数,并且每个单元例如经由磷酸酯接头、硫代磷酸酯键或它们的组合连接。

II.B.3脂族(烷基)接头

在一些方面,接头包含至少一个脂族(烷基)接头,例如丙基、丁基、己基或C2-C12烷基(诸如C2-C10烷基或C2-C6烷基)。

在一些方面,接头包含烷基链,例如未取代的烷基。在一些方面,接头组合包含取代的或未取代的烯基、取代的或未取代的炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、杂环烷基烷基、杂环烷基烯基、杂环烷基炔基、芳基、杂芳基、杂环基、环烯基、烷基芳基烷基、烷基芳基烯基、烷基芳基炔基、烯基芳基烷基、烯基芳基烯基、烯基芳基炔基、炔基芳基烷基、炔基芳基烯基、炔基芳基炔基、烷基杂芳基烷基、烷基杂芳基烷基、烷基杂芳基烯基、烷基杂芳基烯基、烷基杂芳基炔基、烯基杂芳基烷基、烯基杂芳基烯基、烯基杂芳基炔基、炔基杂芳基烷基、炔基杂芳基烯基、炔基杂芳基炔基、烷基杂环基烷基、烷基杂环基烯基、烷基杂环基炔基、烯基杂环基烷基、烯基杂环基烯基或烯基杂环基炔基。

任选地,这些组件是取代的。取代基包括醇、烷氧基(诸如甲氧基、乙氧基和丙氧基)、直链或支链烷基(诸如C1-C12烷基)、胺、氨基烷基(诸如氨基C1-C12烷基)、亚磷酰胺、磷酸酯、氨基磷酸酯、二硫代磷酸酯、硫代磷酸酯、酰肼、肼、卤素(诸如F、Cl、Br或I)、酰胺、烷基酰胺(诸如酰胺C1-C12烷基)、羧酸、羧酸酯、羧酸酐、羧酸卤化物、醚、磺酰卤、亚氨酸酯、异氰酸酯、异硫氰酸酯、卤代甲酸酯、碳二亚胺加合物、醛、酮、巯基、卤代乙酰基、卤代烷、烷基磺酸酯、C(=O)CH=CHC(=O)(马来酰亚胺)、硫醚、氰基、糖(诸如甘露糖、半乳糖和葡萄糖)、α,β-不饱和羰基、烷基汞或α,β-不饱和砜。

除非另有说明,否则本身或作为另一个取代基的部分的术语“烷基”意指具有指定碳原子数的直链或支链烃基(例如,C1-C10意指一至十个碳原子)。通常,烷基将具有1至24个碳原子,例如具有1至10个碳原子、1至8个碳原子或1至6个碳原子。“低级烷基”为具有1至4个碳原子的烷基。术语“烷基”包括二价和多价基团。例如,在合适的情况下,例如,当该式表示烷基是二价时或者当取代基连接在一起形成环时,术语“烷基”包括“亚烷基”。烷基基团的实例包括但不限于甲基、乙基、正丙基、异丙基、正丁基、叔丁基、异丁基、仲丁基以及例如正戊基、正己基、正庚基和正辛基的同源物和异构体。

术语“亚烷基”本身或作为另一个取代基的一部分是指二价(双基)烷基基团,其中烷基如本文所定义。“亚烷基”例如但不限于-CH2CH2CH2CH2-。通常,“亚烷基”基团将具有1至24个碳原子,例如具有10个或更少的碳原子(例如,1至8个或1至6个碳原子)。“低级亚烷基”为具有1至4个碳原子的亚烷基。

术语“链烯基”,本身或作为另一个取代基的一部分,是指具有2至24个碳原子和至少一个双键的直链或支链烃基。典型的链烯基具有2至10个碳原子和至少一个双键。在一个方面,链烯基具有2至8个碳原子或2至6个碳原子和1至3个双键。示例性链烯基包括乙烯基、2-丙烯基、1-丁-3-烯基、巴豆基、2-(丁二烯基)、2,4-戊二烯基、3-(1,4-戊二烯基)、2-异戊烯基、1-戊-3-烯基、1-己-5-烯基等。

术语“炔基”,本身或作为另一个取代基的一部分,是指具有2至24个碳原子和至少一个三键的直链或支链、不饱和或多不饱和烃基。典型的“炔基”具有2至10个碳原子和至少一个三键。在本发明的一个方面,炔基具有2至6个碳原子和至少一个三键。示例性炔基包括丙-1-炔基、丙-2-炔基(即,炔丙基)、乙炔基和3-丁炔基。

术语“烷氧基”、“烷基氨基”和“烷硫基”(或硫代烷氧基)以其常规含义使用,并且是指分别通过氧原子、氨基或硫原子连接至分子的其余部分的烷基。

本身或与另一个术语联用的术语“杂烷基”意指由指定数目的碳原子(例如,C2-C10或C2-C8)和选自例如N、O、S、Si、B和P(在一个实施方案中,N、O和S)的至少一个杂原子组成的稳定的、直链或支链烃基团,其中氮、硫和磷原子任选被氧化,并且一个(多个)氮原子任选被季铵化。一个(多个)杂原子被置于杂烷基的任何内部位置。杂烷基的实例包括但不限于-CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3)-CH3、-CH2-S-CH2-CH3、-CH2-CH2-S(O)-CH3、-CH2-CH2-S(O)2-CH3、-CH=CH-O-CH3、-CH2-Si(CH3)3、-CH2-CH=N-OCH3和-CH=CH-N(CH3)-CH3。至多两个杂原子可以是连续的,诸如例如-CH2-NH-OCH3和–CH2-O-Si(CH3)3

类似地,否则本身或作为另一个取代基的一部分的术语“杂亚烷基”意指从杂烷基衍生的二价基,例如但不限于-CH2-CH2-S-CH2-CH2-和-CH2-S-CH2-CH2-NH-CH2-。通常,杂烷基将具有3至24个原子(碳和杂原子,不包括氢)(3至24元杂烷基)。在另一个实例中,杂烷基总共具有3至10个原子(3-至10-元杂烷基)或3至8个原子(3-至8-元杂烷基)。在合适的情况下,例如,当该式表示杂烷基是二价时或者当取代基连接在一起形成环时,术语“杂烷基”包括“杂亚烷基”。

术语“环烷基”本身或与其他术语组合表示具有3至24个碳原子,例如具有3至12个碳原子(例如,C3-C8环烷基或C3-C6环烷基)。环烃基的实例包括但不限于环丙基、环丁基、环戊基、环己基、环庚基、1-环己烯基、3-环己烯基、环庚基等。术语“环烃基”也包括桥连的、多环(例如,双环)结构,诸如降冰片基、金刚烷基和双环[2.2.1]庚基。“环烃基”可以与至少一个(例如,1至3个)选自芳基(例如,苯基)、杂芳基(例如,吡啶基)和非芳族(例如,碳环或杂环)环的其他环稠合。当“环烃基”包括稠合的芳基、杂芳基或杂环时,则“环烃基”通过碳环连接至分子的其余部分。

本身或与其他术语联用的术语“杂环烃基”、“杂环的”、“杂环”或“杂环基”表示本领域技术人员已知的稳定组合的含有至少一个并且多达5个选自例如,N、O、S、Si、B和P(例如,N、O和S)的杂原子的碳环非芳环(例如,3-至8-元环和例如,4-、5-、6-或7-元环),其中氮、硫和磷原子任选被氧化,并且一个(多个)氮原子任选被季铵化(例如,1至4个选自氮、氧和硫的杂原子),或含有至少一个并且多达10个杂原子(例如,1至5个选自N、O和S的杂原子)的4-至8-元环的稠环系统。示例性的杂环烃基包括稠合的苯基环。当“杂环”基包括稠合的芳基、杂芳基或环烃基环时,则“杂环”基通过杂环连接至分子的其余部分。杂原子可以占据杂环与分子的其余部分连接的位置。

本发明的示例性杂环烃基或杂环基包括吗啉基、硫代吗啉基、硫代吗啉基S-氧化物、硫代吗啉基S,S-二氧化物、哌嗪基、高哌嗪基、吡咯烷基、吡咯啉基、咪唑烷基、四氢吡喃基、哌啶基、四氢呋喃基、四氢噻吩基、哌啶基、高哌啶基、高吗啉基、高硫代吗啉基(homothiomorpholinyl)、高硫代吗啉基S,S-二氧化物、噁唑烷酮基、二氢吡唑基、二氢吡咯基、二氢吡唑基、二氢吡啶基、二氢嘧啶基、二氢呋喃基、二氢吡喃基、四氢噻吩基S-氧化物、四氢噻吩基S,S-二氧化物、高硫代吗啉基S-氧化物、1-(1,2,5,6-四氢吡啶基)、1-哌啶基、2-哌啶基、3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、四氢噻吩-3-基、1-哌嗪基、2-哌嗪基等。

“芳基”意指具有单环(例如,苯基)或稠合到其他芳族或非芳族环(例如,1至3个其他环)的5-、6-或7-元芳族碳环基。当“芳基”包括非芳环(诸如在1,2,3,4-四氢萘基中)或杂芳基时,则“芳基”通过芳环(例如,苯环)连接至分子的其余部分。芳基为任选取代的(例如,具有本文所述的1至5个取代基)。在一个实例中,芳基具有6至10个碳原子。芳基的非限制性实例包括苯基、1-萘基、2-萘基、喹啉、茚满基、茚基、二氢萘基、芴基、四氢萘基、苯并[d][1,3]二氧杂环戊烯基或6,7,8,9-四氢-5H-苯并[a]环庚烯基。在一个方面,芳基选自苯基、苯并[d][1,3]二氧杂环戊烯基和萘基。在又一个方面,芳基为苯基。

术语“芳基烷基(arylalkyl)”或“芳烷基(aralkyl)”旨在包括其中芳基或杂芳基与烷基连接以生成基团-烷基-芳基和-烷基-杂芳基(其中烷基、芳基和杂芳基如本文所定义)的那些基团。示例性的“芳基烷基”或“芳烷基”包括苄基、苯乙基、吡啶基甲基等。

“芳氧基”意指基团-O-芳基,其中芳基如本文所定义。在一个实例中,芳氧基的芳基部分是苯基或萘基。在一个方面,芳氧基的芳基部分为苯基。

术语“杂芳基”或“杂芳族”是指含有至少一个选自N、O、S、Si和B(例如,N、O和S)的杂原子(例如,1至5个杂原子,诸如1-3个杂原子)的多不饱和的5-、6-或7-元芳族部分,其中氮和硫原子任选被氧化,并且一个(多个)氮原子任选被季铵化。“杂芳基”可以是单环或与其他芳基、杂芳基、环烃基或杂环烃基环(例如,1至3个其他环)稠合。当“杂芳基”包括稠合的芳基、环烃基或杂环烃基环时,则“杂芳基”通过杂芳环连接至分子的其余部分。杂芳基基团可以通过碳或杂原子连接至分子的其余部分。

在一个实例中,杂芳基基团具有4至10个碳原子和1至5个选自O、S和N的杂原子。杂芳基的非限制性实例包括吡啶基、嘧啶基、喹啉基、苯并噻吩基、吲哚基、二氢吲哚基、哒嗪基、吡嗪基、异吲哚基、异喹啉基、喹唑啉基、喹喔啉基、酞嗪基、咪唑基、异噁唑基、吡唑基、噁唑基、噻唑基、吲哚嗪基、吲唑基、苯并噻唑基、苯并咪唑基、苯并呋喃基、呋喃基、噻吩基、吡咯基、噁二唑基、噻二唑基、三唑基、四唑基、异噻唑基、萘啶基、异色满基、色满基、四氢异喹啉基、异二氢吲哚基、异苯并四氢呋喃基、异苯并四氢噻吩基、异苯并噻吩基、苯并噁唑基、吡啶并吡啶基、苯并四氢呋喃基、苯并四氢噻吩基、嘌呤基、苯并间二氧杂环戊烯基(benzodioxolyl)、三嗪基、蝶啶基、苯并噻唑基、咪唑并吡啶基、咪唑并噻唑基、二氢苯并异噁嗪基(dihydrobenzisoxazinyl)、苯并异噁嗪基(benzisoxazinyl)、苯并噁嗪基、二氢苯并异噻嗪基(dihydrobenzisothiazinyl)、苯并吡喃基、苯并噻喃基、色酮基、色满酮基(chromanonyl)、吡啶基-N-氧化物、四氢喹啉基、二氢喹啉基、二氢喹啉酮基、二氢异喹啉酮基、二氢香豆素基、二氢异香豆素基、异二氢吲哚酮基(isoindolinonyl)、苯并二噁烷基、苯并噁唑啉酮基(benzoxazolinonyl)、吡咯基N-氧化物、嘧啶基N-氧化物、哒嗪基N-氧化物、吡嗪基-N-氧化物、喹啉基-N-氧化物、吲哚基N-氧化物、二氢吲哚基N-氧化物、异喹啉基N-氧化物、喹唑啉基N-氧化物、喹喔啉基N-氧化物、酞嗪基N-氧化物、咪唑基N-氧化物、异噁唑基N-氧化物、噁唑基N-氧化物、噻唑基N-氧化物、吲哚嗪基N-氧化物、吲唑基N-氧化物、苯并噻唑基N-氧化物、苯并咪唑基N-氧化物、吡咯基N-氧化物、噁二唑基N-氧化物、噻二唑基N-氧化物、三唑基N-氧化物、四唑基N-氧化物、苯并噻喃基S-氧化物、苯并噻喃基S,S-二氧化物。示例性杂芳基包括咪唑基、吡唑基、噻二唑基、三唑基、异噁唑基、异噻唑基、咪唑基、噻唑基、噁二唑基和吡啶基。其他示例性杂芳基包括1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪唑基、4-咪唑基、吡嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异噁唑基、4-异噁唑基、5-异噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩基、3-噻吩基、2-吡啶基、3-吡啶基、吡啶-4-基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5-喹喔啉基、3-喹啉基、6-喹啉基。以上所提到的芳环和杂芳环体系中每个的取代基选自由以下所述的可接受的芳基基团取代基组成的组。

脂族接头的实例包括以下结构:—O—CO—O—,—NH—CO—O—、—NH—CO—NH—、—NH—(CH2)n1—、—S—(CH2)n1—、—CO—(CH2)n1—CO—、—CO—(CH2)n1—NH—、—NH—(CH2)n1—NH—、—CO—NH—(CH2)n1—NH—CO—、—C(═S)—NH—(CH2)n1—NH—CO—、—C(═S)—NH—(CH2)n1—NH—C—(═S)—、—CO—O—(CH2)n1—O—CO—、—C(═S)—O—(CH2)n1—O—CO—、—C(═S)—O—(CH2)n1—O—C—(═S)—、—CO—NH—(CH2)n1—O—CO—、—C(═S)—NH—(CH2)n1—O—CO—、—C(═S)—NH—(CH2)n1—O—C—(═S)—、—CO—NH—(CH2)n1—O—CO—、—C(═S)—NH—(CH2)n1—CO—、—C(═S)—O—(CH2)n1—NH—CO—、—C(═S)—NH—(CH2)n1—O—C—(═S)—、—NH—(CH2CH2O)n2—CH(CH2OH)—、—NH—(CH2CH2O)n2—CH2—、—NH—(CH2CH2O)n2—CH2—CO—、—O—(CH2)n3—S—S—(CH2)n4—O—P(═O)2—、—CO—(CH2)n3—O—CO—NH—(CH2)n4—、—CO—(CH2)n3—CO—NH—(CH2)n4—、—(CH2)n1NH—、—C(O)(CH2)n1NH—、—C(O)—(CH2)n1-C(O)—、—C(O)—(CH2)n1-C(O)O—、—C(O)—O—、—C(O)—(CH2)n1-NH—C(O)—、—C(O)—(CH2)n1—、—C(O)—NH—、—C(O)—、—(CH2)n1-C(O)—、—(CH2)n1-C(O)O—、—(CH2)n1—、—(CH2)n1-NH—C(O)—,其中n1是在1和40之间的整数(例如,2至20,或2至12);n2是在1和20之间的整数(例如,1至10,或1至6);n3和n4可以相同或不同,并且是在1至20之间的整数(例如,1至10或1至6)。

在一些方面,接头包含(C3)n、(C4)n、(C5)n、(C6)n、(C7)n或(C8)n或它们的组合,其中n是在1和50之间的整数,并且每个单元例如经由磷酸酯接头、硫代磷酸酯键或它们的组合连接。

II.B.4可切割的接头

在一些方面,接头可以是可切割的接头。术语可切割的接头是指包含至少一个可断裂或切割的键或化学键的接头。如本文所用,术语切割是指以产生两个或更多个相对较小分子的方式破坏相对大分子中的一个或多个化学键。切割可以由例如核酸酶、肽酶、蛋白酶、磷酸酶、氧化酶或还原酶介导,例如,或由特定的物理化学条件介导,例如氧化还原环境、pH、活性氧物质的存在或特定波长的光。

在一些方面,如本文所用,术语“可切割的”是指例如可快速降解的接头,例如,磷酸二酯和二硫键,而术语“不可切割的”是指例如更稳定的连接,例如,抗核酸酶的硫代磷酸酯。在一些方面,可切割的接头是二核苷酸或三核苷酸接头、二硫化物、亚胺、硫缩酮、val-cit二肽或它们的任何组合。在一些方面,可切割的接头包含缬氨酸-丙氨酸-对氨基苄基氨基甲酸根或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸根。

II.B.4.a氧化还原可切割的接头

在一些方面,接头包含氧化还原可切割的接头。作为非限制性实例,一种类型的可切割的接头是在还原或氧化时切割的氧化还原可切割的连接基团。在一些方面,氧化还原可切割的接头包含二硫键,即,它是二硫键可切割的接头。氧化还原可切割的接头可以被还原,例如,通过胞内硫醇、氧化酶或还原酶。

II.B.4.b活性氧物质(ROS)可切割的接头

在一些方面,接头可包含可切割的接头,它可被活性氧物质(ROS),诸如超氧化物(O2-)或过氧化氢(H2O2)切,例如由炎症过程诸如活化的中性粒细胞产生。在一些方面,ROS可切割的接头是硫缩酮可切割的接头。参见,例如,美国专利8,354,455B2,其以引用的方式整体并入本文。

II.B.4.c pH依赖性可切割的接头

在一些方面,接头是包含酸可切割的连接基团的“酸不稳定型接头”,所述酸可切割的连接基团是在酸性条件(pH<7)下选择性切割的连接基团。作为非限制性实例,酸可切割的连接基团在酸性环境中被切割,例如约6.0、5.5、5.0或更小。在一些方面,pH值为约6.5或更小。在一些方面,接头被试剂诸如酶切割,所述酶可以充当通用酸,例如肽酶(其可以是底物特异性的)或磷酸酶。在细胞内,某些低pH细胞器,诸如胞内体和溶酶体可以为酸可切割的连接基团提供切割环境。虽然人血清的pH值为7.4,但细胞内的平均pH值略低,约为7.1至7.3。内体也具有酸性pH值,范围从5.5至6.0,而溶酶体在更酸性的pH值下约为5.0。因此,本领域有时将pH依赖性可切割的接头称为胞内体不稳定的接头。

酸可切割的基团可具有通式-C=NN-、C(O)O或-OC(O)。在另一个非限制性实例中,当碳连接至酯氧(烷氧基)时,它连接至芳基、取代的烷基或叔烷基基团,例如二甲基戊基或叔丁基。酸可切割的连接基团的实例包括但不限于胺、亚胺、氨基酯、苯甲亚胺、二原酸酯、聚磷酸酯、聚磷腈、乙缩醛、乙烯基醚、腙、顺乌头酸酯、酰肼、硫代氨基甲酰基、亚胺、叠氮甲基-甲基马来酸酸酐、硫代丙酸盐、掩蔽的胞内体溶解剂、柠康基或它们的任何组合。二硫键也易受pH影响。

在一些方面,接头包含低pH不稳定的腙键。此类酸不稳定键已广泛用于缀合物领域,例如抗体-药物缀合物。参见,例如,Zhou等人(2011)Biomacromolecules 12:1460-7;Yuan等人(2008)Acta Biomater.4:1024-37;Zhang等人(2008)Acta Biomater.6:838-50;Yang等人(2007)J.Pharmacol.Exp.Ther.321:462-8;Reddy等人(2006)CancerChemother.Pharmacol.58:229-36;Doronina等人(2003)Nature Biotechnol.21:778-84,这些文献均以引用的方式整体并入本文。

在某些方面,接头包含选自以下的低pH不稳定键:在酸性环境(例如,pH小于7,大于约4)中不稳定以形成二醇和酮的缩酮;在酸性环境(例如,pH小于7,大于约4)中不稳定形成二醇和醛的缩醛;在酸性环境(例如,pH小于7,大于约4)中不稳定形成胺和醛或酮的亚胺或亚胺鎓;在酸性条件下不稳定的硅-氧-碳键;硅-氮(硅氮烷)键;硅-碳键(例如,芳基硅烷、乙烯基硅烷和烯丙基硅烷);马来酸酯(由马来酸酐衍生物和胺合成的酰胺键);原酸酯;腙;被设计用于进行酸催化水解的活化羧酸衍生物(例如,酯、酰胺);或乙烯基醚。

另外的实例可见于美国专利号9,790,494B2和8,137,695B2,这两个专利的内容以引用的方式整体并入本文。

II.B.4.d酶促可切割的接头

在一些方面,接头可包含可由胞内或胞外酶(例如蛋白酶、酯酶、核酸酶、酰胺酶)切割的接头。可以切割接头组合中特定接头的酶的范围取决于接头的特定键和化学结构。因此,肽接头可以被例如肽酶切割,含有酯键的接头可以被例如酯酶切割;含有酰胺键的接头可以被例如酰胺酶切割;等等。

II.B.4.e蛋白酶可切割的接头

在一些方面,接头包括蛋白酶可切割的接头,即,可以被内源性蛋白酶切割的接头。只有某些肽容易在细胞内或细胞外切割。参见,例如,Trout等人,(1982)Proc.Natl.Acad.Sci.USA 79:626-629和Umemoto等人(1989)Int.J.Cancer 43:677-684。可切割的接头可包含由α-氨基酸单元和肽键组成的可切割位点,它们在化学上是一个氨基酸的羧酸和第二个氨基酸的氨基基团之间的酰胺键。其他酰胺键,诸如羧酸和赖氨酸的α-氨基酸基团之间的键,被理解为不是肽键并且被认为是不可切割的。

在一些方面,蛋白酶可切割的接头包含蛋白酶的切割位点:例如,中性溶酶(CALLA或CDIO)、甲拌磷寡肽酶(TOP)、白三烯A4水解酶、内皮缩血管肽转化酶、ste24蛋白酶、溶神经素、线粒体中间肽酶、间质胶原酶、胶原酶、溶基质素、巨噬细胞弹性酶、基质溶解因子、明胶酶、跨膜肽酶(meprins)、前胶原C-内肽酶、前胶原N-内肽酶、ADAM和ADAMT金属蛋白酶、髓磷脂相关的金属蛋白酶、釉质溶素(enamelysin)、肿瘤坏死因子α-转换酶、胰岛素溶酶(insulysin)、nardilysin、线粒体处理肽酶、magnolysin、dactylysin样金属蛋白酶、嗜中性粒细胞胶原酶、基质金属蛋白酶、膜型基质金属蛋白酶、SP2内肽酶、前列腺特异性抗原(PSA)、纤溶酶、尿激酶、人成纤维细胞活化蛋白质(FAPα)、胰蛋白酶、糜蛋白酶、降钙蛋白酶(caldecrin)、胰弹性蛋白酶、胰内肽酶、肠肽酶、白细胞弹性蛋白酶、成髓细胞、糜蛋白酶类(chymases)、类胰蛋白酶、粒酶、角质层糜蛋白酶、顶体蛋白酶、激肽释放酶、补体成分和因子、替代补体途径c3/c5转换酶、甘露糖结合蛋白相关的丝氨酸蛋白酶、凝固因子、凝血酶、蛋白c、u和t型纤溶酶原活性剂、组织蛋白酶G、肝丝酶(hepsin)、丝氨酸蛋白水解酶(prostasin)、肝细胞生长因子活化内肽酶、枯草杆菌蛋白酶/kexin型前蛋白转化酶、弗林蛋白酶、前蛋白转化酶、脯氨酰肽酶、酰基氨基酰基肽酶、肽基-glycaminase、信号肽酶、n-末端亲核试剂氨基水解酶、20s蛋白酶体、γ-谷氨酰转肽基酶、线粒体内肽酶、线粒体内肽酶Ia、htra2肽酶、蛋白裂解酶(matriptase)、位点1蛋白酶、天冬酰胺内肽酶(legumain)、组织蛋白酶、半胱氨酸组织蛋白酶、钙蛋白酶、泛素异肽酶T、胱天蛋白酶、糖基磷脂酰肌醇蛋白转酰胺基酶、癌症促凝血剂、激素原硫醇蛋白酶、γ-谷氨酰基水解酶、博莱霉素水解酶、成纤维细胞活化蛋白(seprase)、组织蛋白酶B、组织蛋白酶D、组织蛋白酶L、组织蛋白酶M、组织蛋白酶K、胃蛋白酶(pepsins)、凝乳酶(chymosyn)、胃亚蛋白酶(gastricsin)、肾素、酵母天冬酶(yapsin)和/或memapsin、前列腺特异性抗原(PSA)或一般的任何Asp-N、Glu-C、Lys-C或Arg-C蛋白酶。参见,例如,Cancer Res.77(24):7027-7037(2017),该文献以引用的方式整体并入本文。在一些方面,可切割的接头组分包括含有一至十个氨基酸残基的肽。在这些方面,肽允许通过蛋白酶对接头进行切割,从而在暴露于细胞内蛋白酶(诸如溶酶体酶)时促进生物活性分子的释放(Doronina等人(2003)Nat.Biotechnol.21:778-784)。示例性的肽包括但不限于二肽、三肽、四肽、五肽和六肽。

肽可包含天然存在的和/或非天然的氨基酸残基。术语“天然存在的氨基酸”是指Ala、Asp、Cys、Glu、Phe、Gly、His、He、Lys、Leu、Met、Asn、Pro、Gin、Arg、Ser、Thr、Val、Trp和Tyr。“非天然氨基酸”(即,氨基酸不是天然存在的)包括,作为非限制性实例,高丝氨酸、高精氨酸、瓜氨酸、苯基甘氨酸、牛磺酸、碘酪氨酸、硒代半胱氨酸、正亮氨酸(“Nle”)、正缬氨酸(“Nva”)、β-丙氨酸、L-或D-萘氨酸、鸟氨酸(“Orn”)等。肽可被设计和优化以供特定酶进行酶促裂解,所述特定酶例如,肿瘤相关的蛋白酶、组织蛋白酶B、C和D或纤维蛋白溶酶蛋白酶。

氨基酸还包括天然和非天然氨基酸的D型。“D-”表示具有“D”(右旋)构型的氨基酸,与天然存在的(“L-”)氨基酸中的构型相反。天然和非天然氨基酸可以商购获得(SigmaChemical Co.,Advanced Chemtech)或使用本领域已知的方法合成。

示例性的二肽包括但不限于缬氨酸-丙氨酸、缬氨酸-瓜氨酸、苯丙氨酸-赖氨酸、N-甲基-缬氨酸-瓜氨酸、环己基丙氨酸-赖氨酸和β-丙氨酸-赖氨酸。示例性三肽包括但不限于甘氨酸-缬氨酸-瓜氨酸(gly-val-cit)和甘氨酸-甘氨酸-甘氨酸(gly-gly-gly)。

II.B.4.f酯酶可切割的接头

一些接头被酯酶切割(“酯酶可切割的接头”)。只有某些酯可以被细胞内外存在的酯酶和酰胺酶切割。酯是由羧酸和醇缩合形成的。简单酯是用简单醇(诸如脂肪醇)和小环和小芳香醇产生的酯。基于酯的可切割的连接基团的实例包括但不限于亚烷基、亚烯基和亚炔基的酯。酯可切割的连接基团具有通式-C(O)O-或-OC(O)-。

II.B.4.g磷酸酶可切割的接头

在一些方面,接头组合可以包括由降解或水解磷酸基团的试剂切割的基于磷酸酯的可切割连接基团。切割胞内磷酸基团的试剂的实例是诸如胞内磷酸酶。基于磷酸盐的连接基团的实例是—O—P(O)(ORk)—O—、—O—P(S)(ORk)—O—、—O—P(S)(SRk)—O-、-S-P(O)(ORk)-O-、-O-P(O)(ORk)-S-、-S-P(O)(ORk)-S-、-O-P(S)(ORk)-S-、-SP(S)(ORk)-O-、-OP(O)(Rk)-O-、-OP(S)(Rk)-O-、-SP(O)(Rk)-O-、-SP(S)(Rk)-O-、-SP(O)(Rk)-S-或-OP(S)(Rk)-S-,其中Rk是NH2、BH3、CH3、C1-6烷基、C6-10芳基、C1-6烷氧基或C6-10芳氧基。在一些方面,C1-6烷基和C6-10芳基是未取代的。另外的非限制性实例是-O-P(O)(OH)-O-、-O-P(S)(OH)-O-、-O-P(S)(SH)-O-、-S-P(O)(OH)-O-、-O-P(O)(OH)-S-、-S-P(O)(OH)-S-、-O-P(S)(OH)-S-、-S-P(S)(OH)-O-、-O-P(O)(H)-O-、-O-P(S)(H)-O-、-S-P(O)(H)-O-、-SP(S)(H)-O-、-SP(O)(H)-S-、-OP(S)(H)-S-或-O-P(O)(OH)-O-。

II.B.4.h光活化的可切割的接头

在一些方面,组合包含光活化的可切割的接头,例如硝基苄基接头或包含硝基苄基反应性基团的接头。

II.C自分解间隔基

在一些方面,本公开的EV(例如,外泌体)中的自分解间隔基在蛋白酶可切割的接头的酶促切割之后经历1,4消除。在一些方面,本公开的EV(例如,外泌体)中的自分解间隔基在蛋白酶可切割的接头的酶促切割之后经历1,6消除。在一些方面,自分解间隔基是例如对氨基苄基氨基甲酸根(PABC)、对氨基苄基醚(PABE)、碳酸对氨基苄基酯或它们的组合。

在某些方面,自分解间隔基包含芳基。在一些方面,芳基选自苄基、肉桂基、萘基和联苯基。在一些方面,芳基是杂环的。在其他方面,芳基包含至少一个取代基。在一些方面,至少一个取代基选自由以下各项组成的组:F、Cl、I、Br、OH、甲基、甲氧基、NO2、NH2、NO3+、NHCOCH3、N(CH3)2、NHCOCF3、烷基、卤代烷基、C1-C8烷基卤、羧酸酯、硫酸酯、氨基磺酸酯和磺酸酯。

在其他方面,芳族基团中的至少一个C被N、O或CR”取代,其中R”独立地选自H、F、Cl、I、Br、OH、甲基、甲氧基、NO2、NH2、NO3+、NHCOCH3、N(CH3)2、NHCOCF3、烷基、卤代烷基、C1-C8烷基卤、羧酸酯、硫酸酯、氨基磺酸酯和磺酸酯。

在一些方面,自分解间隔基包含氨基甲酸氨基苄酯基团、氨基苄基醚基或碳酸氨基苄酯基团。在一个方面,自分解间隔基是氨基甲酸对氨基苄酯(PABC)。P-氨基氨基甲酸苄酯(PABC)是用于自分解位点特异性前药活化的最有效和最广泛的连接子连接(参见,例如,Carl等人(1981)J.Med.Chem.24:479-480;WO 1981/001145;Rautio等人(2008)NatureReviews Drug Discovery 7:255-270;Simplicio等人(2008)Molecules 13:519-547,这些文献的全部内容以引用的方式整体并入本文)。PABC允许在切割时通过蛋白酶和1,6自发断裂释放任何胺类药物、肽和蛋白质。

在一些方面,自分解间隔基将生物活性分子(例如,抗体)连接至蛋白酶可切割的底物。在特定方面,PABC自分解间隔基的氨基甲酸根基团连接至生物活性分子(例如,抗体)的N-末端,并且PABC自解离基的氨基基团连接至蛋白酶-可切割的底物。

氨基苄基的芳环可任选地被芳环上的一个或多个(例如,R1和/或R2)取代基取代,其替代连接至形成环的四个未取代的碳中的一个的氢。本文使用的符号“Rx”(例如,R1、R2、R3、R4)是表示如本文所述取代基的一般缩写。

取代基可以改善对氨基苄基的自分解能力。参见Hay等人(1999)J.Chem Soc.,Perkin Trans.1:2759-2770;另外参见Sykes等人J.(2000)Chem.Soc.,Perkin Trans.1:1601-1608。

可以例如通过1,4消除、1,6消除(例如,PABC)、1,8消除(例如,对氨基肉桂醇)、β-消除、环化消除(例如,4-氨基丁醇酯和乙二胺)、环化/内酯化、环化/内酯化等。参见,例如,Singh等人(2008)Curr.Med.Chem.15:1802-1826and Greenwald等人(2000)J.Med.Chem.43:475-487。

在一些方面,自分解间隔基可以包含例如肉桂基、萘基或联苯基(参见,例如,Blencowe等人(2011)Polym.Chem.2:773-790)。在一些方面,自分解间隔基包含杂环(参见,例如,美国专利号7,375,078、7,754,681)。许多基于同芳族(参见,例如,Carl等人(1981)J.Med.Chem.24:479;Senter等人(1990)J.Org.Chem.55:2975;Taylor等人(1978)J.Org.Chem.43:1197;Andrianomenjanahary等人(1992)Bioorg.Med.Chem.Lett.2:1903)和香豆素(参见,例如,Weinstein等人(2010)Chem.Commun.46:553)、呋喃、噻吩、噻唑、噁唑、异噁唑、吡咯、吡唑(参见,例如,Hay等人(2003)J.Med.Chem.46:5533)、吡啶(参见,例如,Perry-Feigenbaum等人(2009)Org.Biomol.Chem.7:4825)、咪唑(参见,例如,Nailor等人(1999)Bioorg.Med.Chem.Lett.Z:1267;Hay和Denny(1997)Tetrahedron Lett.38:8425)和三唑(参见,例如,Bertrand和Gesson(2007)J.Org.Chem.72:3596)的杂芳族基团在水和生理学条件下是自分解的,并且是本领域已知的。另外参见,美国专利号7,691,962、7,091,186和美国专利公开号US2006/0269480、US2010/0092496、US2010/0145036、US2003/0130189和US2005/0256030,这些专利的全部内容均以引用的方式整体并入。

在一些方面,本文公开的马来酰亚胺部分包含多于一个串联的自分解间隔基,例如两个或更多个PABC单元。参见,例如,de Groot等人(2001)J.Org.Chem.66:8815-8830。在一些方面,本文公开的马来酰亚胺部分可包含与荧光探针连接的自分解间隔基(例如,对羧基苯甲醛或乙醛酸的对氨基苯甲醇或半硫氨基衍生物)(参见,例如,Meyer等人(2010)Org.Biomol.Chem.8:1777-1780)。

当自分解性接头中的取代基由其从左到右书写的常规化学式指定时,其同样包括将由从右向左书写结构引起的化学上相同的取代基。例如,“-CH2O-”也旨在称为“-OCH2-”。

如上文所讨论的自分解例如对氨基苄基自分解接头中的R1和/或R2取代基中的取代基基团可以包括例如烷基、亚烷基、烯基、炔基、烷氧基、烷基氨基、烷硫基、杂烷基、环烷基、杂环烷基、芳基、芳烷基、芳氧基、杂芳基等。当本公开的化合物包含多于一个取代基时,则独立地选择每个取代基。

在一些具体方面,接头具有式(IV):

-Aa-Yy- (IV),

其中每个-A-独立地是氨基酸单元,a独立地为1至12的整数;-Y-是间隔基单元,y为0、1或2。在一些方面,-Aa-是二肽、三肽、四肽、五肽或六肽。在一些方面,-Aa-选自由以下各项组成的组:缬氨酸-丙氨酸、缬氨酸-瓜氨酸、苯丙氨酸-赖氨酸、N-甲基缬氨酸-瓜氨酸、环己基丙氨酸-赖氨酸和β-丙氨酸-赖氨酸。在一些方面,-Aa-是缬氨酸-丙氨酸或缬氨酸-瓜氨酸。在一些方面,y为1。在一些方面,-Y-是自分解间隔基。

在一些方面,自分解间隔基-Yy-具有式(V):

其中每个R2独立地是C1-8烷基、-O-(C1-8烷基)、卤素、硝基或氰基;并且m为0至4的整数。在一些方面,m为0、1或2。在一些方面,m为0。

在一些方面,式(IV)的可切割的接头是缬氨酸-丙氨酸-对氨基苄基氨基甲酸根或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸根。在一些方面,间隔基单元-Y-是非自分解间隔基,例如-Gly-或-Gly-Gly-。

在一些方面,所述接头是“酸不稳定型接头”。在一些方面,所述酸不稳定型接头包括顺式乌头酸接头、酰肼接头、硫代氨基甲酰基接头或它们的任何组合。在一些方面,所述酸不稳定型接头包含将所述生物活性分子连接至所述酸不稳定型接头的间隔基单元。合适的间隔基单元是上文结合-Yy-描述的那些。

在一些方面,接头是不可切割的接头,包括例如四乙二醇(TEG)、聚乙二醇(PEG)、琥珀酰亚胺或它们的任何组合。在一些方面,所述不可切割的接头包含将所述生物活性分子连接至所述不可切割的接头的间隔基单元。

在一些方面,本公开提供了一种包含生物活性分子和可切割的接头的EV(例如,外泌体),其中所述可切割的接头将所述EV(例如,外泌体)连接至生物活性分子,并且所述可切割的接头包括缬氨酸-丙氨酸-对氨基苄基氨基甲酸根或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸根。在一些方面,所述EV(例如,外泌体)还包含马来酰亚胺部分,所述马来酰亚胺部分经由存在于所述EV(例如,外泌体)上的官能团将所述EV(例如,外泌体)连接至所述可切割的接头。合适的马来酰亚胺部分是上文所述的那些,例如,式(I)、(II)和(III)的马来酰亚胺部分。在一些方面,马来酰亚胺部分与存在于EV(例如,外泌体)上的官能团共价连接,其中所述官能团是巯基(硫醇),其中所述巯基基团在EV(例如,外泌体)表面的蛋白质上,例如EV(例如,外泌体)的外表面。

本公开还提供了一种包含马来酰亚胺部分、可切割的接头和生物活性分子的EV(例如,外泌体),其中所述马来酰亚胺部分将所述EV(例如,外泌体)连接至所述可切割的接头,并且所述可切割的接头将所述马来酰亚胺部分连接至所述生物活性分子。

II.D生物活性分子

在一些方面,本文公开的EV(例如,外泌体)能够将有效负载(例如,经由马来酰亚胺部分化学连接至EV(例如,外泌体)的生物活性分子)递送至靶标。有效负载是作用于与EV(例如,外泌体)接触的靶标(例如,靶细胞)的试剂。接触可出现在体外或受试者体内。可以连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的有效负载的非限制性实例包括药剂,诸如核苷酸(例如,包含可检测部分或毒素或破坏转录的核苷酸)、核酸(例如,编码多肽(诸如酶)的DNA或mRNA分子,或具有调节功能的RNA分子,诸如miRNA、dsDNA、lncRNA或siRNA)、吗啉、氨基酸(例如,包含可检测部分的氨基酸或破坏翻译的毒素)、多肽(例如,酶)、脂质、碳水化合物、小分子(例如,小分子药物和毒素)、抗原(例如,疫苗抗原)、佐剂或它们的组合。

在一些方面,EV(例如,外泌体)可以包含多于一个有效负载,例如在EV(例如,外泌体)的腔体溶液中的第一有效负载以及经由马来酰亚胺部分连接至例如EV(例如,外泌体)的外表面的第二有效负载。在一些方面,有效负载包括小分子。在一些方面,有效负载包括肽。在一些方面,有效负载包含抗原,例如疫苗抗原。在一些方面,有效负载包括疫苗佐剂。

II.D.1靶向抗原和疫苗抗原的有效负载

在一些方面,有效负载与抗原,例如肿瘤抗原相互作用。在一些方面,抗原(例如肿瘤抗原)的生物学功能通过与有效负载的相互作用来调节(例如,如果抗原是受体,则有效负载可以是受体激动剂或受体拮抗剂)。在其他方面,有效负载包含能够诱导免疫反应的抗原(即,疫苗抗原)。在一些方面,有效负载可包含能够诱导免疫反应的抗原(即,疫苗抗原)和佐剂(即,疫苗佐剂)。在一些方面,疫苗抗原和疫苗佐剂可以在相同的EV(例如,外泌体)上。在其他方面,疫苗和疫苗佐剂可以在不同的EV(例如,外泌体)中。

肿瘤抗原的非限制性实例包括:甲胎蛋白(AFP)、癌胚抗原(CEA)、上皮肿瘤抗原(ETA)、粘蛋白1(MUC1)、Tn-MUC1、粘蛋白16(MUC16)、酪氨酸酶、黑素瘤相关抗原(MAGE)、肿瘤蛋白p53(p53)、CD4、CD8、CD45、CD80、CD86、程序性死亡配体1(PD-L1)、程序性死亡配体2(PD-L2)、NY-ESO-1、PSMA、TAG-72、HER2、GD2、cMET、EGFR、间皮素、VEGFR、α叶酸受体、CE7R、IL-3、癌症-睾丸抗原(CTA)、MART-1gp100、TNF相关细胞凋亡诱导配体或它们的组合。

与肿瘤抗原相互作用以及例如调节其生物学功能的有效负载包括例如抗体及其结合片段、适体、抗体药物缀合物(ADC)和小分子。

在一些方面,抗原是通用肿瘤抗原。如本文所用,术语“通用肿瘤抗原”是指免疫原性分子,诸如蛋白质,即,通常在肿瘤细胞中的表达水平高于非肿瘤细胞中的表达,并且也在不同来源的肿瘤中表达。在一些方面,通用肿瘤抗原在超过约30%、约40%、约50%、约60%、约70%、约80%、约90%或更多的癌症(例如,人类癌症)中表达。在一些方面,通用肿瘤抗原可以在非肿瘤细胞(例如,正常细胞)中表达但其水平低于其在肿瘤细胞中的表达水平。在某些方面,与非肿瘤细胞相比,通用肿瘤抗原在肿瘤细胞上的表达水平大约1倍、约2倍、约3倍、约4倍、约5倍、约6倍、约7倍、约8倍、约9倍、约10倍或更多。在某些方面,通用肿瘤抗原不在正常细胞中表达而仅在肿瘤细胞中表达。可与本公开一起使用的通用肿瘤抗原的非限制性实例包括肿瘤脉管系统中的内皮抗原、生存素、肿瘤蛋白D52(TPD52)、雄激素受体表位、肝配蛋白A型受体2(EphA2)、人端粒酶逆转录酶(hTERT)、生存素、小鼠双分钟2同源物(MDM2)、细胞色素P450 1B1(CYP1B)、HER2/neu、Wilms肿瘤基因1(WT1)、livin、甲胎蛋白(AFP)、癌胚抗原(CEA)、粘蛋白16(MUC16)、MUC1、前列腺特异性膜抗原(PSMA)、p53或细胞周期蛋白(D1)。

在其他方面,抗原可以包括新抗原。如本文所用,术语“新抗原”是指由肿瘤特异性突变基因编码的抗原。

在一些方面,抗原来源于细菌、病毒、真菌、原生动物或它们的任何组合。在一些方面,抗原来源于致癌病毒(本文也称为癌症相关病毒(CAV))。在其他方面,抗原来源于包括以下各项的组:人类γ疱疹病毒4(即,爱泼斯坦-巴尔(Epstein Barr)病毒(EBV))、甲型流感病毒、乙型流感病毒、巨细胞病毒、金黄色葡萄球菌(staphylococcus aureus)、结核分枝杆菌(mycobacterium tuberculosis)、沙眼衣原体(chlamydia trachomatis)、HIV-1、HIV-2、冠状病毒(例如,COVID-19、MERS-CoV和SARS CoV)、丝状病毒(例如,马尔堡和埃博拉)、酿脓链球菌(Streptococcus pyogenes)、肺炎链球菌(Streptococcus pneumoniae)、疟原虫物种(例如,间日疟原虫和恶性疟原虫)、基孔肯雅病毒、人乳头状瘤病毒(HPV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、人T淋巴细胞病毒(HTLV1)、人疱疹病毒8(HHV8)、默克尔细胞多瘤病毒(MCV)、单纯疱疹病毒2(HSV-2)、克雷伯氏菌属某种(Klebsiella sp.)、铜绿假单胞菌(Pseudomonas aeruginosa)、肠球菌属某种(Enterococcus sp.)、变形杆菌属某种(Proteus sp.)、肠杆菌属某种(Enterobacter sp.)、放线菌属某种(Actinobacter sp.)、凝固酶阴性葡萄球菌(CoNS)、支原体属某种(Mycoplasma sp.)、腺病毒、腺相关病毒(AAV)或它们的组合。

在一些方面,来源于EBV的抗原是BZLF1。BZLF1(也称为Zta或EB1)是EBV的即刻早期病毒基因,可诱导癌症并且主要感染95%人群的B细胞。该基因(以及其他基因)在疾病进展的其他阶段导致其他EBV基因的表达,并且参与将病毒从潜伏形式转化为裂解形式。ZEBRA(BamHI Z爱泼斯坦-巴尔病毒复制活化剂,也称为Zta和BZLF1)是由BZLF1编码的EBV的早期裂解蛋白。参见Hartlage等人(2015)Cancer Immunol.Res.3(7):787-94,和Rist等人(2015)J.Virology 70:703-12,这两个文献均以引用的方式整体并入本文。包含EBV抗原(例如BZLF1)的本文公开的EV(例如,外泌体)可用于例如治疗移植后淋巴组织增生性疾病(PTLD)。这种EV可以施用于接受EBV阳性移植的EBV阴性患者。BZLF1是一种显性T细胞抗原,与PTLD患者的持久缓解相关。本文公开的包含BZLF1的EV(例如,外泌体)可以引发针对BZLF1的有效CD8T细胞介导的免疫。因此,粘膜免疫和组织驻留记忆细胞可以保护患者免于发展PTLDF。非限制性示例性抗原包括但不限于美国专利号8617564B2中公开的抗原。

在一些方面,抗原来源于结核分枝杆菌以诱导细胞和/或体液免疫应答。在一些方面,抗原包含结核分枝杆菌的一个或多个表位(TB抗原)。多个抗原与结核分枝杆菌感染有关,包括ESAT-6、TB10.4、CFP10、Rv2031(hspX)、Rv2654c(TB7.7)和Rv1038c(EsxJ)。参见,例如,Lindestam等人,J.Immunol.188(10):5020-31(2012),该文献整体并入本文。在一些方面,可用于本公开的抗原包含ESAT6的一个或多个表位。在一些方面,可用于本公开的抗原包含TB10.4的一个或多个表位。在一些方面,可用于本公开的抗原包含CFP10的一个或多个表位。在一些方面,可用于本公开的抗原包含Rv2031(hspX)的一个或多个表位。在一些方面,可用于本公开的抗原包含Rv2654c(TB7.7)的一个或多个表位。在一些方面,可用于本公开的抗原包含Rv1038c(EsxJ)的一个或多个表位。在一些方面,可用于本公开的抗原包含选自由以下各项组成的组的表位:ESAT6、TB10.4(ESAT-6样蛋白EsxH;cfp7)、CFP10、Rv2031(hspX)、Rv2654c(TB7.7)、Rv1038c(EsxJ)及它们的任何组合。

在一些方面,TB抗原包含TB抗原的特定表位,例如ESAT6或TB10.4的特定表位。在一些方面,ESAT6抗原包含具有MTEQQWNFAGIEAAASAIQGNVTSIHSLLDEGKQSLTKLAAAWGGSGSEAYQGVQQKWDATATELNNALQNLARTISEAGQAMASTEGNVTGMFA(SEQ ID NO:230;GenBank:AWM98862.1)所示的氨基酸序列的至少三个氨基酸、至少四个氨基酸、至少五个氨基酸、至少六个氨基酸、至少七个氨基酸、至少八个氨基酸、至少九个氨基酸、至少十个氨基酸、至少十一个氨基酸、至少十二个氨基酸、至少十三个氨基酸、至少十四个氨基酸、至少十五个氨基酸的表位。在一些方面,其中TB10.4抗原包含具有以下序列所示的氨基酸序列的至少三个氨基酸、至少四个氨基酸、至少五个氨基酸、至少六个氨基酸、至少七个氨基酸、至少八个氨基酸、至少九个氨基酸、至少十个氨基酸、至少十一个氨基酸、至少十二个氨基酸、至少十三个氨基酸、至少十四个氨基酸、至少十五个氨基酸的表位:MSQIMYNYPAMLGHAGDMAGYAGTLQSLGAEIAVEQAALQSAWQGDTGITYQAWQAQWNQAMEDLVRAYHAMSSTHEANTMAMMARDPAEAAKWGG(SEQID NO:231;NCBI参考序列:WP_057308237.1)。

在一些方面,抗原包括自身抗原。如本文所用,术语“自身抗原”是指由宿主细胞或组织表达的抗原。在正常健康状态下,这些抗原被身体识别为自身,不会引发免疫应答。然而,在某些疾病条件下,身体自身的免疫系统可以将自身抗原识别为外来物并针对它们发起免疫应答,从而导致自身免疫。在某些方面,本公开的EV(例如,外泌体)可以包含自身抗原(即,T细胞反应已被诱导并且导致自身免疫的自身(种系)蛋白)。这种EV(例如,外泌体)可用于靶向自身反应性T细胞并且抑制其活性。自身抗原(包括相关疾病或病症)的非限制性实例包括:(i)β细胞蛋白、胰岛素、胰岛抗原2(IA-2)、谷氨酸脱羧酶(GAD65)和锌转运蛋白8(ZNT8)(I型糖尿病),(ii)髓磷脂少突胶质细胞糖蛋白(MOG)、髓磷脂碱性蛋白(MBP)、蛋白脂质蛋白(PLP)和髓磷脂相关糖蛋白(MAG)(多发性硬化),(iii)瓜氨酸抗原和滑膜蛋白(类风湿性关节炎),(iv)水通道蛋白-4(AQP4)(视神经脊髓炎),(v)烟碱型乙酰胆碱受体(nAChRs)(重症肌无力),(vi)桥粒芯糖蛋白-1(DSG1)和桥粒芯糖蛋白-2(DSG2)(寻常天疱疮),(v)促甲状腺激素受体(格雷夫斯病),(vi)IV型胶原蛋白(古德帕斯丘综合征),(vii)甲状腺球蛋白、甲状腺过氧化物酶和促甲状腺激素受体(TSHR)(桥本甲状腺炎)或(viii)它们的组合。

II.D.2 PROTAC

在一些方面,有效负载包含蛋白水解靶向嵌合体(PROTAC)。PROTAC是异双官能分子,由靶标蛋白的配体、E3泛素化连接酶的配体和连接两个配体的接头组成。一旦形成靶标:PROTAC:E3三元复合物,E2泛素缀合酶即可将泛素转移到靶标蛋白表面的赖氨酸残基上。在一些方面,PROTAC靶标是例如ERα、BCR-ABL、BRD4、PDE4、ERRα、RIPK2、C-ABL、BRD2、BRD3、BRD4、FKBP12、TBK1、BRD9、EGFR、c-Met、Sirt2、CDK9、FLT3、BTK、ALK、AR、TRIM24、SMAD3、RAR、PI3K、PCAF、METAP2、HER2、HDAC6、GCN5、ERK1/2、DHODH、CRABP-II、FLT4或CK2。在一些方面,PROTAC靶标配体是例如4-OHT、达沙替尼、JQ1、PDE4抑制剂、JQ1、氯烷烃、基于噻唑烷二酮的配体、RIPK2抑制剂、博舒替尼、JQ1衍生物、OTX015、钢因子、TBK1抑制剂、BI-7273、拉帕替尼、吉非替尼、阿法替尼、福林替尼、Sirt2抑制剂3b、HJB97、SNS-032、氨基吡唑类似物、AC220、RN-486、色瑞替尼、AR拮抗剂、IACS-7e或依鲁替尼衍生物。在一些方面,PROTAC E3配体是例如LCL161衍生物、VHL1、羟脯氨酸衍生物、泊马度胺、沙利度胺、HIF-1α源性(R)-羟脯氨酸、VHL配体2、VH032衍生物、来那度胺、沙利度胺衍生物或VL-269。在一些方面,E3连接酶是例如IAP、VHL或CRBN。参见,例如,An&Fu(2018)EBioMedicine 36:553-562,该文献以引用的方式整体并入本文。

PROTAC和可以根据本文公开的方法使用的相关技术在例如以下专利至有所公开WO2018106870、US2018155322、WO2018098288、WO2018098280、WO2018098275、WO2018089736、WO2018085247、US20180125821、US20180099940、WO2018064589、WO2018053354、WO2017223452、WO2017201449、WO2017197056、WO2017197051、WO2017197046、WO2017185036、WO2017185034、WO2017185031、WO2017185023、WO2017182418、US20170305901、WO2017176708、US20170281784、WO2017117474、WO2017117473、WO2017079723、US9938264、US20170065719、WO2017024319、WO2017024318、WO2017024317、US20170037004、US20170008904、US20180147202、WO2018051107、WO2018033556、US20160272639、US20170327469、WO2017212329、WO2017211924、US20180085465、US20160045607、US20160022642、WO2017046036、US20160058872、US20180134688、US20180118733、US20180050021、US9855273、US20140255361、US9115184、US20180093990、US20150119435、US20140356322、US20140112922、US9765019、US20180100001、US7390656或US7208157,这些专利的全部内容均以引用的方式整体缤纷如本文。

在一些方面,当若干PROTAC存在于EV(例如,外泌体)上时,此类PROTAC可以相同或不同。在一些方面,当若干PROTAC存在于本文公开的EV(例如,外泌体)上时,此类PROTAC可以相同或不同。在一些方面,本公开的EV(例如,外泌体)组合物可以包含两个或更多个EV(例如,外泌体)群,其中每个EV(例如,外泌体)群包含不同的PROTAC或它们的组合。

在一些方面,PROTAC包含至少一个巯基,其中马来酰亚胺部分将EV(例如,外泌体)连接至PROTAC。在一些方面,巯基定位于PROTAC的E3连接酶配体部分上。在一些方面,巯基定位于PROTAC的靶蛋白配体部分上。在一些方面,巯基定位于PROTAC的接头部分上。在一些方面,巯基基团是PROTAC中天然存在的反应性基团。

在其他方面,马来酰亚胺部分被引入PROTAC中,例如,经由化学衍生化。在一些方面,化学衍生化经由双官能接头(双官能试剂)发生,所述双官能接头包含能够与存在于PROTAC中的化学基团反应的部分,包含能够与本文公开的马来酰亚胺部分反应的部分的部分。

在一些方面,E3连接酶配体通过可切割的接头(例如PABC)与PROTAC连接。在其他方面,靶标配体通过可切割的接头(例如,PABC)连接至PROTAC。在其他方面,E3连接酶配体和靶标配体均通过可切割的接头连接至PROTAC。在一些方面,两个可切割的接头可以是相同的可切割的接头。在其他方面,两个可切割的接头是不同的。

可以根据本领域已知的体外和体内方法评估PROTAC(例如,连接至EV(例如本文公开的外泌体)的PROTAC)的功能。例如,由于PROTAC诱导泛素介导的靶蛋白降解,PROTAC活性可以使用直接测量靶蛋白降解(例如,蛋白质印迹)或测量靶蛋白介导的功能活性(例如,如果靶标蛋白是蛋白激酶,则磷酸化或磷酸化介导的细胞信号传导的变化)的测定法来测定。

在一些特定方面,PROTAC包含TBK1靶向配体、接头和VHL(E3连接酶)结合配体(参见,例如,图10C)。

在其他方面,EV(例如,外泌体)包含用于形成CLIPTAC(点击形成的PROTAC)的两个前体。因此,EV(例如,本公开的外泌体)可以包含经由马来酰亚胺部分连接至EV的两个CLIPTAC前体群。在紫外线与靶细胞结合后,CLIPTAC前体可以通过生物正交点击组合在胞内组合,以产生异双官能PROTAC。参见Lebraud等人(2016)ACSCent.Sci.2:927-934,该文献以引用的方式整体并入本文。

通常,PROTAC可以根据式[ULM]-[L]-[PTM]描述,其中[ULM]是泛素-L结合部分(第一配体),[L]是接头,并且[PTM]是蛋白质靶向部分(第二配体)。示例性PROTAC显示在下表中。该表显示了[ULM]及其对应的[ULM]配体所靶向的泛素化酶,以及[PTM]及其对应的[ULM]配体所靶向的蛋白质。

表1:示例性PROTAC

上表中公开的所有其他专利申请和专利均以引用的方式整体并入。

可以在PROTAC中使用的特定接头在例如美国专利申请公开US20180050021A1、US20180118733A1、US20180009779A1、US20180085465A1、US20180134684A1和US20180134688A1、美国专利号US9694084B2、US9821068B2、US9770512B2和US9750816B2以及国际申请公开WO2018085247A1中有所公开,其全部内容以引用的方式并入本文。WO2017212329A1公开了包含经由点击反应生成的接头的PROTAC的形成。

II.D.3干扰素基因刺激蛋白(STING)激动剂

在一些方面,有效负载包含核苷酸,其中所述核苷酸是干扰素基因刺激蛋白(STING)激动剂。STING是通常由细菌产生的环状二核苷酸的胞质传感器。在活化后,其会导致I型干扰素的产生并引发免疫应答。

在一些方面,本公开的EV(例如,外泌体)包含一种或多种与EV(例如,外泌体)连接的STING激动剂,例如,经由马来酰亚胺部分化学连接。在一些方面,所述STING激动剂包括环状核苷酸STING激动剂或非环状二核苷酸STING激动剂。

已知环状嘌呤二核苷酸,诸如但不限于cGMP、环状二-GMP(c-二-GMP)、cAMP、环状二-AMP(c-二-AMP)、环-二-GMP-AMP(cGAMP)、环状二-IMP(c-二-IMP)、环状AMP-IMP(cAIMP)及其任何类似物,可刺激或增强患者的免疫或炎症反应。CDN可以具有连接环状二核苷酸的2'2'、2'3'、2'5'、3'3'或3'5'键,或其任意组合。

环状嘌呤二核苷酸可以通过标准有机化学技术进行修饰,以产生嘌呤二核苷酸的类似物。合适的嘌呤二核苷酸包括但不限于腺嘌呤、鸟嘌呤、肌苷、次黄嘌呤、黄嘌呤、异鸟嘌呤或本领域已知的任何其他合适的嘌呤二核苷酸。环状二核苷酸可以是经修饰的类似物。可使用本领域已知的任何合适的修饰,包括但不限于硫代磷酸酯、双硫代磷酸酯(biphosphorothioate)、氟化和二氟化修饰。

还可使用非环状二核苷酸激动剂,诸如5,6-二甲基呫吨酮-4-乙酸(DMXAA),或本领域已知的任何其他非环状二核苷酸激动剂。

预计可使用任何STING激动剂。STING激动剂中有DMXAA、STING激动剂-1、ML RR-S2CDA、ML RR-S2c-di-GMP、ML-RR-S2cGAMP、2’3’-c-di-AM(PS)2、2’3’-cGAMP、2’3’-cGAMPdFHS、3'3'-cGAMP、3'3'-cGAMPdFSH、cAIMP、cAIM(PS)2、3’3’-cAIMP、3’3’-cAIMPdFSH、2’2’-cGAMP、2’3’-cGAM(PS)2、3'3'-cGAMP、c-di-AMP、2'3'-c-di-AMP、2’3’-c-di-AM(PS)2、c-di-GMP、2’3’-c-di-GMP、c-di-IMP、c-di-UMP或其任意组合。在一个特定方面,STING激动剂是3'3'-cAIMPdFSH,另选地命名为3-3cAIMPdFSH。还可以使用本领域已知的其他STING激动剂。

在一些方面,可用于本公开的STING激动剂包括选自由以下组成的组的化合物:

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中:

X1为H、OH或F;

X2为H、OH或F;

Z为OH、OR1、SH或SR1,其中:

R1是Na或NH4,或者

R1是在体内提供OH或SH的酶不稳定基团,诸如新戊酰氧基甲基;

Bi和B2是选自以下的碱基:

前提条件是:

-在式1中:X1和X2不是OH,

-在式2中:当X1和X2是OH时,B1不是腺嘌呤并且B2不是鸟嘌呤,以及

-在式3中:当X1和X2为OH时,B1不是腺嘌呤,B2不是鸟嘌呤并且Z不是OH。参见WO2016/096174,其内容通过引用整体并入本文。

在一些方面,可用于本公开的STING激动剂包括:

其药学上可接受的盐。参见WO 2016/096174A1。

在其他方面,可用于本公开的STING激动剂包括具有下式的化合物:

或其任何药学上可接受的盐。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个符号在WO 2014/093936(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基在WO 2014/189805(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基在WO 2015/077354(其内容通过引用整体并入本文)中进行了定义。另外参见Cell reports 11,1018-1030(2015)。

在一些方面,可用于本公开的STING激动剂包括c-di-AMP、c-di-GMP、c-di-IMP、c-AMP-GMP、c-AMP-IMP和c-GMP-IMP,如WO2013/185052和Sci.Transl.Med.283,283ra52(2015)(所述文献通过引用整体并入本文)中所述。

在一些方面,可用于本公开的STING激动剂包括具有选自下式的化合物

其中每个取代基(即,R1、R2、R3、R4和X)在WO 2014/189806(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基(即,R1、R2、R3、R4、R5、R6、Y1和Y2)在WO 2015/185565(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括选自下式的化合物:

其中每个取代基(即,X和Y)在WO 2014/179760(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式之一的化合物:

其中每个取代基(即,R1、R2、R3、R4、R5、R6、R7、R8、R9、R10、R11、Xa、Xa1、Xb、Xb1、Xc、Xd、Xe和Xf)在WO 2014/179335(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

它在WO 2015/017652(其内容通过引用整体并入本文)中有所描述。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

它在WO 2016/096577(其内容通过引用整体并入本文)中有所描述。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基(即,R1、R2、R3、R4、R5和R6)在WO2011/003025(其内容通过引用整体并入本文)中有所描述。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基(即,R1、R2、R3、R4、R5和R6)在WO2016/145102(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基在WO 2017/027646(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基在WO 2017/075477(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基在WO 2017/027645(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基在WO 2018/100558(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基在WO 2017/175147(其内容通过引用整体并入本文)中进行了定义。

在一些方面,可用于本公开的STING激动剂包括具有下式的化合物:

其中每个取代基在WO 2017/175156(其内容通过引用整体并入本文)中进行了定义。

在一些方面,EV(例如,外泌体)包含环状二核苷酸STING激动剂和/或非环状二核苷酸STING激动剂。在一些方面,当几种环状二核苷酸STING激动剂存在于本文公开的EV(例如,外泌体)上时,此类STING激动剂可以是相同的,或者它们可以是不同的。在一些方面,当存在几种非环状二核苷酸STING激动剂时,此类STING激动剂可以是相同的,或者它们可以是不同的。在一些方面,本公开的EV(例如,外泌体)组合物可以包含两个或更多个EV(例如,外泌体)群,其中每个EV(例如,外泌体)群包含不同的STING激动剂或它们的组合。

在一些具体方面,本公开的EV(例如,外泌体)包含具有式(IV)的(MM)-(接头)-(生物活性分子):

在一些具体方面,本公开的EV(例如,外泌体)包含具有式(V)的(MM)-(接头)-(生物活性分子):

在一些具体方面,本公开的EV(例如,外泌体)包含具有式(VI)的化合物(CP249):

在一些具体方面,本公开的EV(例如,外泌体)包含具有式(VII)的化合物(CP250):

在一些具体方面,本公开的EV(例如,外泌体)包含具有式(VIII)的化合物(CP260):

在一些具体方面,本公开的EV(例如,外泌体)包含具有式(IX)的化合物(CP261):

在一些方面,可用于本发明EV缀合物的STING激动剂包括但不限于CP247、CP250、CP260、CP261或其药学上可接受的盐。在一些方面,可用于本发明EV缀合物的STING激动剂包括CP247或其药学上可接受的盐。在一些方面,可用于本发明EV缀合物的STING激动剂包括CP250或其药学上可接受的盐。在一些方面,可用于本发明EV缀合物的STING激动剂包括CP260或其药学上可接受的盐。在一些方面,可用于本发明EV缀合物的STING激动剂包括CP261或其药学上可接受的盐。

在其他方面,可用于本发明EV缀合物的STING激动剂包括但不限于CP227、CP229或其药学上可接受的盐。在其他方面,可用于本发明EV缀合物的STING激动剂包括CP227或其药学上可接受的盐。在其他方面,可用于本发明EV缀合物的STING激动剂包括但不限于CP229或其药学上可接受的盐。

II.D.4 TLR激动剂

在一些方面,有效负载包括TLR激动剂。TLR激动剂的非限制性实例包括:TLR2激动剂(例如,脂磷壁酸、非典型LPS、MALP-2和MALP-404、OspA、孔蛋白、LcrV、脂化甘露聚糖、GPI、溶血磷脂酰丝氨酸、脂磷聚糖(LPG)、糖磷脂酰肌醇(GPI)、酵母聚糖、hsp60、gH/gL糖蛋白、血球凝集素)、TLR3激动剂(例如,双链RNA,例如,多聚(I:C))、TLR4激动剂(例如,脂多糖(LPS)、脂磷壁酸、β-防御素2、纤连蛋白EDA、HMGB1、snapin、腱生蛋白C)、TLR5激动剂(例如,鞭毛蛋白)、TLR6激动剂、TLR7/8激动剂(例如,单链RNA、CpG-A、多聚G10、多聚G3、雷西莫特)、TLR9激动剂(例如,未甲基化的CpG DNA)以及它们的组合。TLR激动剂的非限制性实例可见于WO2008115319A2、US20130202707A1、US20120219615A1、US20100029585A1、WO2009030996A1、WO2009088401A2和WO2011044246A1,这些专利中的每个均以引用的方式整体并入。

II.D.5抗体

在一些方面,有效负载包含抗体或其抗原结合片段。在一些方面,有效负载包含ADC。在一些方面,有效负载包含含有合成抗肿瘤剂(例如,单甲基澳瑞他汀E(MMAE)(vedotin))的小分子、细胞因子释放抑制剂(例如,MCC950)、mTOR抑制剂(例如,雷帕霉素及其类似物(Rapalog)、自分泌运动因子抑制剂(例如,PAT409)、溶血磷脂酸受体拮抗剂(例如,AM152,也称为BMS-986020)或它们的任何组合。

II.D.6靶向巨噬细胞的生物活性分子

在一些方面,有效负载包含靶向巨噬细胞的生物活性分子。在其他方面,有效负载包含诱导巨噬细胞极化的生物活性分子。巨噬细胞极化是巨噬细胞经由其而采用响应于来自巨噬细胞微环境的信号的不同功能性程序的方法。此能力与巨噬细胞在生物体中的多种作用有关:巨噬细胞是先天性免疫系统的有力效应细胞,还在细胞碎片去除、胚胎发展和组织修复中至关重要。

通过简化分类,巨噬细胞表型已分为2组:M1(经典活化巨噬细胞)和M2(替代活化巨噬细胞)。这种粗略分类是基于体外研究,在所述体外研究中将培养的巨噬细胞用刺激其表型转换成特定状态的分子进行处理。除了化学刺激外,已经表明巨噬细胞生长的底层基质的硬度可以指导极化状态、功能作用和迁移模式。M1巨噬细胞被描述为促炎性类型,在直接抗病原体的宿主防御(诸如促炎性细胞因子和杀微生物分子的吞噬和分泌)中起重要作用。M2巨噬细胞被描述为具有完全相反功能:调节炎症的消退期和修复受损组织。后来,更广泛的体外和离体研究表明,巨噬细胞表型更加多样化,在基因表达和功能方面相互重叠,这揭示了这些许多混合状态形成了依赖于微环境的连续活化状态。此外,在体内,不同组织巨噬细胞群体之间的基因表达谱具有高度多样性。因此,巨噬细胞活化谱被认为是更广泛的,涉及对来自环境的过多不同信号作出反应的复杂调节途径。巨噬细胞表型的多样性仍有待在体内充分表征。

巨噬细胞类型的不平衡与许多免疫相关疾病有关。例如,增加的M1/M2比率可能与炎性肠病的发展以及小鼠肥胖相关。在另一个方面,体外实验表明M2巨噬细胞是组织纤维化的主要介质。多项研究已将M2巨噬细胞的纤维化特征与系统性硬化的发病机制联系起来。靶向生物活性分子的巨噬细胞的非限制性实例是:PI3Kγ(磷脂酰肌醇-4,5-二磷酸3-激酶催化亚基γ)、RIP1(受体相互作用蛋白(RIP)激酶1,RIPK1)、HIF-1α(缺氧诱导因子1-α)、AHR1(粘附和菌丝调节因子1)、miR146a、miR155、IRF4(干扰素调节因子4)、PPARγ(过氧化物酶体增殖物活化受体γ)、IL-4RA(白介素4受体亚基α)、TLR8(Toll样受体8)和TGF-β1(转化生长因子β-1前蛋白)。

在一些方面,有效负载包含靶向PI3Kγ蛋白或转录物的生物活性分子(PI3Kγ拮抗剂)。在一些方面,PI3Kγ拮抗剂是反义寡核苷酸。在其他方面,PI3Kγ拮抗剂是小分子。在一些方面,ASO靶向编码PI3Kγ的转录物,例如mRNA。PI3Kγ基因的序列可见于染色体位置7q22.3和公开获得的GenBank登录号NC_000007.14(106865282..106908980),它以引用的方式整体并入。人PI3Kγ蛋白的序列可见于公开获得的UniProt登录号P48736,它以引用的方式整体并入本文。

在一些方面,有效负载包含靶向RIP1蛋白或转录物的生物活性分子(RIP1拮抗剂)。在一些方面,RIP1拮抗剂是反义寡核苷酸。在其他方面,RIP1拮抗剂是小分子。在一些方面,ASO靶向编码RIP1的转录物,例如mRNA。RIP1基因的序列可见于染色体位置6p25.2和公开获得的GenBank登录号NC_000006.12(3063967..3115187),它以引用的方式整体并入。人RIP1蛋白的序列可见于公开获得的UniProt登录号Q13546,它以引用的方式整体并入本文。

在一些方面,有效负载包含靶向HIF-1α蛋白或转录物的生物活性分子(HIF-1α拮抗剂)。在一些方面,HIF-1α拮抗剂是反义寡核苷酸。在其他方面,HIF-1α拮抗剂是小分子。在一些方面,ASO靶向编码HIF-1α的转录物,例如mRNA。HIF-1α基因的序列可见于染色体位置14q23.2和公开获得的GenBank登录号NC_000014.9(61695513..61748259),它以引用的方式整体并入。人HIF-1α蛋白的序列可见于公开获得的UniProt登录号Q16665,它以引用的方式整体并入本文。在一些方面,ASO靶向编码HIF-2α的mRNA。HIF-2α基因的序列可见于染色体位置2p21和公开获得的GenBank登录号NC_000002.12(46297407..46386697),它以引用的方式整体并入。人HIF-2α蛋白的序列可见于公开获得的UniProt登录号Q99814,它以引用的方式整体并入本文。

在一些方面,有效负载包含靶向AHR1蛋白或转录物的生物活性分子(AHR1拮抗剂)。在其他方面,AHR1拮抗剂是小分子。

在一些方面,有效负载包含靶向miR146a的生物活性分子(miR146a安塔够妙)。在一些方面,miR146a安塔够妙是反义寡核苷酸。在一些方面,ASO结合至miR146a-5p(ugagaacugaauuccauggguu)(SEQ ID NO:226)。在一些方面,ASO结合至miR146a-3p(ccucugaaauucaguucuucag)(SEQ ID NO:227)。

在一些方面,有效负载包含模拟miR155的生物活性分子(miR155模拟物)。在一些方面,miR155模拟物是RNA或DNA。在一些方面,miR155模拟物包含miR155-5p的核苷酸序列(uuaaugcuaaucgugauaggggu)(SEQ ID NO:228)。在一些方面,miR155模拟物包含miR155-3p的核苷酸序列(cuccuacauauuagcauuaaca)(SEQ ID NO:229)。

在一些方面,有效负载包含靶向IRF-4蛋白或转录物的生物活性分子(IRF4拮抗剂)。在一些方面,IRF4拮抗剂是反义寡核苷酸。在一些方面,ASO靶向编码IRF-4的转录物,例如mRNA。IRF-4基因的序列可见于染色体位置6p25.3和公开获得的GenBank登录号NC_000006.12(391739..411443),它以引用的方式整体并入。人IRF-4蛋白的序列可见于公开获得的UniProt登录号Q15306,它以引用的方式整体并入本文。

在一些方面,有效负载包含靶向PPARγ蛋白或转录物的生物活性分子(PPARγ拮抗剂)。在一些方面,PPARγ拮抗剂是反义寡核苷酸。在其他方面,PPARγ拮抗剂是小分子。在一些方面,ASO靶向编码PPARγ的转录物,例如mRNA。PPARγ基因的序列可见于染色体位置3p25.2和公开获得的GenBank登录号NC_000003.12(12287485..12434356),它以引用的方式整体并入。人PPARγ蛋白的序列可见于公开获得的UniProt登录号P37231,它以引用的方式整体并入本文。

在一些方面,有效负载包含靶向IL-4RA蛋白或转录物的生物活性分子(IL-4RA拮抗剂)。在一些方面,IL-4RA拮抗剂是反义寡核苷酸。在一些方面,ASO靶向编码IL-4RA的转录物,例如mRNA。IL-4RA基因的序列可见于染色体位置16p12.1和公开获得的GenBank登录号NC_000016.10(27313668..27364778),它以引用的方式整体并入。人IL-4RA蛋白的序列可见于公开获得的UniProt登录号P24394,它以引用的方式整体并入本文。

在一些方面,有效负载包含作为Toll样受体8(TLR8)的激动剂的生物活性分子。TLR8也称为CD288。TLR8是先天和适应性免疫的关键组分。TLR(Toll样受体)通过识别微生物特有的分子模式来控制宿主对病原体的免疫应答。它通过MYD88和TRAF6发挥作用,导致NF-κ-B活化、细胞因子分泌和炎性反应。人TLR8蛋白的序列可见于公开获得的UniProt登录号Q9NR97,它以引用的方式整体并入本文。

在一些方面,有效负载包含靶向TGF-β1蛋白或转录物的生物活性分子(TGF-β1拮抗剂)。在一些方面,TGF-β1拮抗剂是反义寡核苷酸。在一些方面,ASO靶向编码TGF-β1的转录物,例如mRNA。TGF-β1基因的序列可见于染色体位置19q13.2和公开获得的GenBank登录号NC_000019.10(41330323..41353922,互补序列),它以引用的方式整体并入。人TGF-β1蛋白的序列可见于公开获得的UniProt登录号P01137,它以引用的方式整体并入本文。ASO可以包含一种或多种具有经修饰的糖部分的核苷,即当与在DNA和RNA中存在的核糖部分相比时糖部分的修饰。已经制备了具有许多核糖部分修饰的核苷,主要目的是改善寡核苷酸的某些性质,诸如亲和力和/或核酸酶抗性。此类修饰包括其中核糖环结构被修饰的那些,例如通过用己糖环(HNA)或双环替代(它通常在核糖环(LNA)上的C2'和C4'碳之间具有双自由基桥),或者未连接的核糖环(它通常在C2'和C3'碳之间缺乏键(例如,UNA))。其他糖修饰的核苷包括例如双环己糖核酸(WO2011/017521)或三环核酸(WO2013/154798)。经修饰的核苷还包括其中糖部分被非糖部分替代的核苷,例如在肽核酸(PNA)或吗啉核酸的情况下。糖修饰还包括通过将核糖环上的取代基更改为除氢以外的基团或RNA核苷中天然存在的2'-OH基团进行的修饰。例如,可以在2'、3'、4'或5'位置引入取代基。具有经修饰的糖部分的核苷还包括2'修饰的核苷,诸如2'取代的核苷。事实上,很多注意力都集中在开发2’取代的核苷上,并且发现许多2'取代的核苷在掺入寡核苷酸时具有有益的性质,诸如增强的核苷抗性和增强的亲和力。2’糖修饰核苷是在2'位置具有除H或-OH之外的取代基(2’取代核苷)或包含2'连接双自由基的核苷,并且包括2'取代核苷和LNA(2'-4'双自由基桥接)核苷。例如,2'修饰的糖可以提供增强的结合亲和力(例如,增强亲和力的2'糖修饰的核苷)和/或增强的对寡核苷酸的核酸酶抗性。2'取代的经修饰的核苷的实例是2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2'-氨基-DNA、2'-氟-RNA、2'-氟-DNA、阿拉伯核酸(ANA)和2'-氟-ANA核苷。对于另外的实例,参见,例如,Freier&Altmann;Nucl.Acid Res.,1997,25,4429-4443;Uhlmann,Curr.Opinion in Drug Development,2000,3(2),293-213;和Deleavey and Damha,Chemistry and Biology 2012,19,937。下面是一些2'取代的经修饰的核苷的图示。

LNA核苷是经修饰的核苷,它在核苷的核糖环(即,2'-4’桥)的C2'和C4'之间包含接头基团(称为双自由基或桥),它限制或锁定核糖环的构象。这些核苷在文献中也称为桥接核酸或双环核酸(BNA)。当LNA掺入互补RNA或DNA分子的寡核苷酸中时,核糖构象的锁定与增强的杂交亲和力(双链稳定)有关。这可以通过测量寡核苷酸/互补双链的解链温度来常规确定。

非限制性示例性LNA核苷在WO 99/014226、WO 00/66604、WO 98/039352、WO 2004/046160、WO 00/047599、WO 2007/134181、WO 2010/077578、WO 2010/036698、WO 2007/090071、WO 2009/006478、WO 2011/156202、WO 2008/154401、WO 2009/067647、WO 2008/150729,Morita等人,Bioorganic&Med.Chem.Lett.12,73-76,Seth等人,J.Org.Chem.2010,第75(5)卷,第1569-81页和Mitsuoka等人,Nucleic Acids Research 2009,37(4),1225-1238中有所公开。

在一些方面,本公开的ASO的经修饰的核苷或LNA核苷具有式I或II的通式结构:

其中

W选自-O-、-S-、-N(Ra)-、-C(RaRb)-,特别是-O-;

B是核碱基或经修饰的核碱基部分;

Z是与相邻的核苷或5'-末端基团的核苷间键;

Z*是与相邻的核苷或3'-末端基团的核苷间键;

R1、R2、R3、R5和R5*独立地选自氢、卤素、烷基、烯基、炔基、羟基、烷氧基、烷氧基烷基、烯氧基、羧基、烷氧基羰基、烷基羰基、甲酰基、叠氮、杂环和芳基;并且

X、Y、Ra和Rb如本文所定义。

II.D.7寡核苷酸

在一些方面,有效负载包括反义寡核苷酸、二酰胺磷吗啉寡聚体(PMO)或肽缀合的二酰胺基吗啉寡聚体(PPMO)、反义寡核苷酸(ASO)、siRNA、miRNA、shRNA、核酸或它们的任何组合。

在一些方面,ASO是PI3Kγ拮抗剂。在一些方面,ASO靶向编码PI3Kγ的转录物,例如mRNA。PI3Kγ基因的序列可见于染色体位置7q22.3和公开获得的GenBank登录号NC_000007.14(106865282..106908980),它以引用的方式整体并入。人PI3Kγ蛋白的序列可见于公开获得的UniProt登录号P48736,它以引用的方式整体并入本文。

在一些方面,ASO是RIP1拮抗剂。在一些方面,ASO靶向编码RIP1的转录物,例如mRNA。RIP1基因的序列可见于染色体位置6p25.2和公开获得的GenBank登录号NC_000006.12(3063967..3115187),它以引用的方式整体并入。人RIP1蛋白的序列可见于公开获得的UniProt登录号Q13546,它以引用的方式整体并入本文。

在一些方面,ASO是HIF-1α拮抗剂。在一些方面,ASO靶向编码HIF-1α的转录物,例如mRNA。HIF-1α基因的序列可见于染色体位置14q23.2和公开获得的GenBank登录号NC_000014.9(61695513..61748259),它以引用的方式整体并入。人HIF-1α蛋白的序列可见于公开获得的UniProt登录号Q16665,它以引用的方式整体并入本文。在一些方面,ASO靶向编码HIF-2α的mRNA。HIF-2α基因的序列可见于染色体位置2p21和公开获得的GenBank登录号NC_000002.12(46297407..46386697),它以引用的方式整体并入。人HIF-2α蛋白的序列可见于公开获得的UniProt登录号Q99814,它以引用的方式整体并入本文。

在一些方面,ASO是IRF4拮抗剂。在一些方面,ASO靶向编码IRF-4的转录物,例如mRNA。IRF-4基因的序列可见于染色体位置6p25.3和公开获得的GenBank登录号NC_000006.12(391739..411443),它以引用的方式整体并入。人IRF-4蛋白的序列可见于公开获得的UniProt登录号Q15306,它以引用的方式整体并入本文。

在一些方面,ASO是PPARγ拮抗剂。在一些方面,ASO靶向编码PPARγ的转录物,例如mRNA。PPARγ基因的序列可见于染色体位置3p25.2和公开获得的GenBank登录号NC_000003.12(12287485..12434356),它以引用的方式整体并入。人PPARγ蛋白的序列可见于公开获得的UniProt登录号P37231,它以引用的方式整体并入本文。

在一些方面,ASO是IL-4RA拮抗剂。在一些方面,ASO靶向编码IL-4RA的转录物,例如mRNA。IL-4RA基因的序列可见于染色体位置16p12.1和公开获得的GenBank登录号NC_000016.10(27313668..27364778),它以引用的方式整体并入。人IL-4RA蛋白的序列可见于公开获得的UniProt登录号P24394,它以引用的方式整体并入本文。

在一些方面,ASO是TGF-β1拮抗剂。在一些方面,ASO靶向编码TGF-β1的转录物,例如mRNA。TGF-β1基因的序列可见于染色体位置19q13.2和公开获得的GenBank登录号NC_000019.10(41330323..41353922,互补序列),它以引用的方式整体并入。人TGF-β1蛋白的序列可见于公开获得的UniProt登录号P01137,它以引用的方式整体并入本文。

在一些方面,ASO靶向转录物,所述转录物是STAT6转录物、CEBP/β转录物、STAT3转录物、KRAS转录物、NRAS转录物、NLPR3转录物或它们的任何组合。

STAT6(STAT6)也称为信号转导子和转录活化子6。STAT6/STAT6的同义词是已知的,包括IL-4STAT;STAT、白介素4诱导;转录因子IL-4STAT;STAT6B;STAT6C;和D12S1644。人STAT6基因的序列可见于公开获得的GenBank登录号NC_000012.12:c57111413-57095404。人STAT6基因可见于染色体位置12q13.3的57111413-57095404,互补序列。

CEBP/β(CEBP/β)也称为CCAAT/增强子结合蛋白β。CEBP/β/CEBP/β的同义词是已知的,包括C/EBPβ;肝活化蛋白;LAP;肝富集的抑制蛋白;LIP;核因子NF-IL6;转录因子5;TCF-5;CEBP;CEBPb;CEBPβ;CEBP/B;和TCF5。人CEBP/β基因的序列可见于公开获得的GenBank登录号NC_000020.11(50190583..50192690)。人CEBP/β基因可见于染色体位置20q13.13的50190583-50192690。

NRas是编码膜蛋白的致癌基因,所述膜蛋白在高尔基体和质膜之间穿梭。编码NRas的基因组DNA可见于染色体位置1p13.2(即,GenBank登录号NG_007572的核苷酸5001至17438)。N-ras突变已在黑素瘤、甲状腺癌、畸胎癌、纤维肉瘤、神经母细胞瘤、横纹肌肉瘤、伯基特淋巴瘤、急性早幼粒细胞白血病、T细胞白血病和慢性粒细胞白血病中有所描述。致癌性N-Ras可在小鼠中诱发急性骨髓性白血病(AML)或慢性髓单核细胞白血病(CMML)样疾病。神经母细胞瘤RAS病毒癌基因(NRas)在本领域中有多个名称。此类名称包括:GTPaseNRas、N-ras蛋白第4部分、神经母细胞瘤RAS病毒(v-ras)致癌基因同源物神经母细胞瘤RAS病毒致癌基因同源物、转化蛋白N-Ras和v-ras神经母细胞瘤RAS病毒致癌基因同源物。

信号转导子和转录活化子3(STAT3)是可将信号从细胞表面受体传输到细胞核的信号转导子和转录活化子。STAT3在许多人类癌症中经常被过度活化。编码STAT3的基因组DNA可见于染色体位置17q21.2(即,GenBank登录号NG_007370.1的核苷酸5,001至80,171)。

NLRP3(NLRP3)也称为含NLR家族pyrin结构域3。NLRP3/NLRP3的同义词是已知的,包括NLRP3;C1orf7;CIAS1;NALP3;PYPAF1;核苷酸结合的寡聚化结构域、富含亮氨酸的重复序列和含pyrin结构域3;冷诱导的自身炎性综合征1蛋白;冷冻蛋白;含NACHT、LRR和PYD结构域的蛋白3;血管紧张素/加压素受体AII/AVP样;毛虫蛋白1.1;CLR1.1;冷诱导的自身炎性综合征1蛋白;和含PYRIN的APAF1样蛋白1。人NLRP3基因的序列可见于公开获得的GenBank登录号NC_000001.11:247416156-247449108。人NLRP3基因可见于染色体位置1q44的247,416,156-247,449,108。

KRAS在本领域中有多个名称。这些名称包括:KRAS原癌基因、GTPase;V-Ki-Ras2Kirsten大鼠肉瘤2病毒致癌基因同源物;GTP酶KRas;C-Ki-Ras;K-Ras 2;KRAS2;RASK2;V-Ki-Ras2Kirsten大鼠肉瘤病毒致癌基因同源物;Kirsten大鼠肉瘤病毒原癌基因;细胞转化原癌基因;细胞C-Ki-Ras2原癌基因;转化蛋白P21;PR310C-K-Ras致癌基因;C-Kirsten-Ras蛋白;K-Ras P21蛋白;和致癌基因KRAS2。人KRAS基因的序列可见于染色体位置12p12.1和公开获得的GenBank登录号NC_000012(25,204,789–25,250,936)。人野生型KRAS转录物的基因组序列对应于NC_000012的残基25,204,789–25,250,936的反向互补序列

II.D.8转运肽

在一些方面,有效负载包括细胞转运肽、细胞穿透肽或融合肽。如本文所用,术语“转运肽”是指促进任何附接的货物在一个或多个细胞内运动的任何肽序列,包括促进货物穿过细胞的细胞膜、货物从细胞或EV的分泌,以及货物从细胞或EV中的释放,以及其他细胞运动方式的肽序列。在具体但非限制性的实例中,转运肽可以是来源于细胞穿透肽的序列、非经典分泌序列、胞内体释放结构域、受体结合结构域和融合肽。

如本文所用,术语“细胞穿透肽”是指促进任何附接的货物穿过脂双层,诸如细胞膜或EV膜移动的任何肽序列。如本文所用,术语“非经典分泌序列”是指提供通过ER-高尔基体独立途径从细胞分泌任何附接的货物的任何蛋白质或肽序列。如本文所用,术语“胞内体释放结构域”是指促进任何附接的货物从细胞或EV的胞内体释放的任何肽序列。如本文所用,术语“受体结合结构域”是指能够与表面结合的细胞受体相互作用的任何RNA或蛋白质结构域。如本文所用,术语“融合肽”是指促进货物从EV或细胞排出的任何肽序列。

在一些方面,本公开的EV(例如,外泌体)包含转运肽和第二有效负载,例如,另一种生物活性分子,诸如多核苷酸(例如,反义寡核苷酸或干扰RNA)。

II.D.9腺相关病毒(AAV)

在一些方面,有效负载包含腺相关病毒(AAV)。在一些方面,AAV连接(例如,经由马来酰亚胺部分化学连接)至EV的腔体表面。在一些方面,AAV连接(例如,经由马来酰亚胺部分化学连接)至EV的外表面。在一些方面,AAV连接(例如,经由马来酰亚胺部分化学连接)至支架,例如蛋白质支架,诸如蛋白质X支架或其片段,或者连接至脂质支架(例如,胆固醇)。在一些方面,AAV经由AAV衣壳蛋白上存在的马来酰亚胺基团和支架上存在的巯基基团(例如,天然存在或通过接头或双官能试剂引入)之间的反应化学连接至支架部分。在一些方面,AAV经由AAV衣壳蛋白上存在的巯基基团(例如,天然存在或通过接头或双官能试剂引入)和支架部分上存在的马来酰亚胺基团之间的反应化学连接至支架部分。

在一些方面,AAV包含遗传盒。在一些方面,遗传盒编码选自由以下组成的组的蛋白质:分泌蛋白、受体、结构蛋白、信号蛋白、感觉蛋白、调节蛋白、转运蛋白、储存蛋白、防御蛋白、运动蛋白、凝血因子、生长因子、抗氧化剂、细胞因子、趋化因子、酶、肿瘤抑制基因、DNA修复蛋白、结构蛋白、低密度脂蛋白受体、α葡糖苷酶、囊性纤维化跨膜传导调节因子或它们的任何组合。在一些方面,遗传盒编码因子VIII蛋白或因子IX蛋白。在一些方面,因子VIII蛋白是野生型因子VIII、B结构域缺失的因子VIII、因子VIII融合蛋白或它们的任何组合。

在一些方面,AAV选自由以下各项组成的组:AAV 1型、AAV2型、AAV 3A型、AAV 3B型、AAV 4型、AAV 5型、AAV 6型、AAV 7型、AAV 8型、AAV 9型、AAV 10型、AAV 11型、AAV 12型、AAV 13型、蛇AAV、禽AAV、牛AAV、犬AAV、马AAV、羊AAV、山羊AAV、虾AAV、合成AAV、它们的任何组合。

II.D.10免疫调节剂

在一些方面,有效负载包含免疫调节剂。在某些方面,免疫调节剂连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的外表面上或EV(例如,外泌体)的腔体表面上的支架部分,例如支架X蛋白或其片段。在一些方面,免疫调节剂连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的腔体表面上的支架部分,例如支架Y蛋白或其片段。在其他方面,免疫调节剂在EV(例如,外泌体)的腔体中。

在一些方面,免疫调节剂包括负检查点调节剂的抑制剂或负检查点调节剂的结合配偶体的抑制剂。在某些方面,负检查点调节剂包括:细胞毒性T淋巴细胞相关蛋白4(CTLA-4)、程序性细胞死亡蛋白1(PD-1)、淋巴细胞活化基因3(LAG-3)、含T细胞免疫球蛋白粘蛋白的蛋白3(TIM-3)、B和T淋巴细胞衰减子(BTLA)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、T细胞活化的V结构域Ig抑制子(VISTA)、腺苷A2a受体(A2aR)、杀伤细胞免疫球蛋白样受体(KIR)、吲哚胺2,3-双加氧酶(IDO)、CD20、CD39、CD73或它们的任何组合。

在一些方面,免疫调节剂包括正共刺激分子的活化剂或正共刺激分子的结合配偶体的活化剂。在某些方面,正共刺激分子是TNF受体超家族成员(例如,CD120a、CD120b、CD18、OX40、CD40、Fas受体、M68、CD27、CD30、4-1BB、TRAILR1、TRAILR2、TRAILR3、TRAILR4、RANK、OCIF、TWEAK受体、TACI、BAFF受体、ATAR、CD271、CD269、AITR、TROY、CD358、TRAMP和XEDAR)。在一些方面,正共刺激分子的活化剂是TNF超家族成员(例如,TNFα、TNF-C、OX40L、CD40L、FasL、LIGHT、TL1A、CD27L、Siva、CD153、4-1BB配体、TRAIL、RANKL、TWEAK、APRIL、BAFF、CAMLG、NGF、BDNF、NT-3、NT-4、GITR配体和EDA-2)。在其他方面,正共刺激分子是CD28超家族共刺激分子(例如,ICOS或CD28)。在一些方面,正共刺激分子的活化剂是ICOSL、CD80或CD86。

在一些方面,免疫调节剂包括细胞因子或细胞因子的结合配偶体。在某些方面,细胞因子包括IL-2、IL-4、IL-7、IL-10、IL-12、IL-15、IL-21或它们的组合。

在一些方面,免疫调节剂包括支持生发中心反应所需的胞内相互作用的蛋白质。在某些方面,支持生发中心反应所需的胞内相互作用的蛋白质包括信号传导淋巴细胞活化分子(SLAM)家族成员或SLAM相关蛋白(SAP)。在一些方面,SLAM家族成员包括SLAM家族成员1、CD48、CD229(Ly9)、Ly108、2B4、CD84、NTB-A、CRACC、BLAME、CD2F-10或它们的组合。

II.D.10溶血磷脂酸(LPA)抑制剂

在一些方面,有效负载包括溶血磷脂酸(LPA)抑制剂,例如LPA-1抑制剂。在某些方面,LPA-1抑制剂连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的外表面上或EV(例如,外泌体)的腔体表面上的支架部分,例如支架X蛋白或其片段。在一些方面,LPA-1抑制剂连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的腔体表面上的支架部分,例如支架Y蛋白或其片段。在其他方面,LPA-1抑制剂在EV(例如,外泌体)的腔体中。

LPA是一种保护和拯救细胞免于程序性细胞死亡的高效的内源性脂质介质。LPA通过其高亲和力的LPA-1受体的作用作为纤维发生的重要介质。因此,LPA抑制剂可以起到抗纤维化剂的作用。

在一些方面,LPA-1抑制剂包含AM095,它是LPA-1的有效和口服生物可利用的拮抗剂,对小鼠或重组人LPA-1的IC50值分别为0.73和0.98μM。在体外,AM095已显示出抑制LPA-1诱导的小鼠LPA-1/CHO细胞和人A2058黑素瘤细胞的趋化性,IC50值为0.78μM和0.23μM。在体内,AM095可以剂量依赖性地阻断LPA诱导的组胺释放,在小鼠中的ED50值为8.3mg/kg。此外,已发现AM095可显著减少肺中的BALF胶原蛋白和蛋白质,ED50值为10mg/kg。AM095还显示出可以减少小鼠中由博莱霉素诱导的巨噬细胞和淋巴细胞浸润。参见Swaney等人(2018)Mol.Can.Res.16:1601-1613,该文献以引用的方式整体并入本文。

在一些方面,LPA-1抑制剂包括AM152(也称为BMS-986020)。AM152是一种高亲和力LPA-1拮抗剂,可抑制胆汁酸和磷脂转运蛋白,对BSEP、MRP4和MDR3的IC50分别为4.8μM、6.2μM和7.5μM。AM152可用于治疗特发性肺纤维化(IPF)。参见Kihara等人(2015)Exp.CellRes.333:171-7;Rosen等人(2017)European Respiratory Journal 50:PA1038;和Palmer等人(2018)Chest 154:1061-1069,这些文献以引用的方式整体并入本文。由于胆囊毒性和肝毒性肝脏转运蛋白(2种特定转运蛋白)的早期迹象,AM152的2期研究(在Palmer 2018中有所描述)提前终止。

在本公开别处提供了与包含LPA-1抑制剂的EV(例如,外泌体)有关的其他公开内容(参见,例如,实施例5)。

II.D.11 NLRP3抑制剂

在一些方面,有效负载包括炎症小体抑制剂,例如NLRP3抑制剂。在某些方面,NLRP3抑制剂连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的外表面上或EV(例如,外泌体)的腔体表面上的支架部分,例如支架X蛋白或其片段。在一些方面,NLRP3抑制剂连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的腔体表面上的支架部分,例如支架Y蛋白或其片段。在其他方面,NLRP3抑制剂在EV(例如,外泌体)的腔体中。

NLRP3,也称为NALP3、NACHT或冷炎素,是一种在人类中由NLRP3基因编码的蛋白质。NLRP3主要在巨噬细胞中表达,是炎症小体的组分。NLRP3感知病原体衍生的、环境的和宿主来源的因子,并促使炎症小体的形成,炎症小体是与许多炎症性疾病有关的复合物。NLRP3炎症小体是一种先天免疫传感器,在组装后活化半胱天冬酶-1并且介导IL-1β的加工和释放。许多疾病的小鼠模型已经显示出通过NLRP3炎症小体的缺失来改善,包括痛风、2型糖尿病、多发性硬化、阿尔茨海默病和动脉粥样硬化。NLRP3炎症小体在痛风和神经炎症的发病机制中发挥作用,例如在蛋白质错误折叠疾病,诸如阿尔茨海默病、帕金森病和朊病毒病中。Liu-Bryan(2010)Immunology and Cell Biology 88:20-23;Heneka等人(2013)Nature 493:674-678;Shi等人(2015)Life Sciences 135:9-14;Levy等人(2015)NatureMedicine 21:213-215。

在一些方面,NLPR3抑制剂是含二芳基磺酰脲的化合物。在一些方面,含二芳基磺酰脲的化合物是MCC950或其衍生物。

MCC950(N-[[(1,2,3,5,6,7-六氢-对称-引达省-4-基)氨基]羰基]-4-(1-羟基-1-甲基乙基)-2-呋喃磺酰胺),也称为CP-456773,是NLRP3(含NOD样受体(NLR)pyrin结构域的蛋白3)炎症小体的有效和选择性抑制剂。MCC950通过阻止炎症小体衔接蛋白ASC(含CARD的凋亡相关斑点样蛋白)的寡聚化来阻断由NLRP3活化剂(诸如ATP、MSU和尼日利亚菌素)诱导的IL-1β的释放。Coll等人(2015)Nature Med.21:248-255。MCC950阻断巨噬细胞中IL-1β的释放,巨噬细胞由LPS引发并且被ATP或尼日利亚菌素活化,IC50为约7.5nM。虽然MCC950会阻止NLRP3诱导的IL-1β的释放,但MCC950不会抑制NLRC4、AIM2或NLRP1炎症小体。此外,MCC950不抑制TLR2信号传导或NLRP3的引发。

MCC950在体内具有活性,从而阻断IL-1β的产生并提高多发性硬化小鼠模型的存活率。MCC950还在心肌梗塞模型中抑制NLRP3诱导的IL-1β产生。van Hout等人(2015)Eur.Heart J.ehw247。MCC950在来自穆克勒-韦尔斯综合征个体的离体样品中也具有活性。MCC950是治疗NLRP3相关综合征(包括自身炎症和自身免疫性疾病)的潜在治疗剂。

II.E生物分布调节剂

在一些方面,EV(例如,外泌体)包含生物分布调节剂。如本文所用,术语“生物分布调节剂”是指可以在体内或体外(例如,在不同品种细胞的混合培养物中)调节胞外囊泡(例如,外泌体、纳米囊泡)的分布的药剂(即,有效负载)。在一些方面,术语“靶向部分”可以与术语生物分布调节剂互换使用。在一些方面,靶向部分改变EV(例如,外泌体)的向性(“向性部分”)。如本文所用,术语“向性部分”是指当在EV(例如,外泌体)上表达时改变和/或增强EV的自然运动的靶向部分。例如,在一些方面,向性部分可以促进EV被特定细胞、组织或器官吸收。可与本公开一起使用的向性部分的非限制性实例包括可结合在树突细胞(例如,Clec9A或DEC205)或T细胞(例如,CD3)上特异性表达的标志物的那些。除非另外说明,否则本文所用的术语“靶向部分”包括向性部分。

在一些方面,EV(例如,外泌体)包含靶向部分,即,将本公开的EV(例如,外泌体)引导至特定细胞类型或组织的生物活性分子,它包含靶标(例如,靶蛋白,诸如受体),其中另一种有效负载(例如,另一种生物活性分子)可以具有治疗、预防或诊断作用。在某些方面,靶向部分连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)外表面上的支架部分,例如支架X蛋白或其片段。

在一些方面,靶向部分是外源性靶向部分,是例如抗体或其抗原结合部分、特异性结合至存在于靶细胞或组织的表面上的蛋白质(例如,受体)的蛋白质或肽。

在一些方面,靶向部分特异性结合至树突细胞的标志物。在某些方面,标志物仅存在于树突细胞上。在一些方面,树突细胞包括浆细胞样树突细胞(pDC)、骨髓/常规树突细胞1(cDC1)、骨髓/常规树突细胞2(cDC2)或它们的任何组合。在某些方面,树突细胞是cDC1。在其他方面,标志物包括C型凝集素域家族9成员A(Clec9a)蛋白、树突细胞特异性胞间粘附分子-3-抓取非整合素(DC-SIGN)、CD207、CD40、Clec6、树突细胞免疫受体(DCIR)、DEC-205、凝集素样氧化低密度脂蛋白受体-1(LOX-1)、MARCO、Clec12a、DC-去唾液酸糖蛋白受体(DC-ASGPR)、DC免疫受体2(DCIR2)、Dectin-1、巨噬细胞甘露糖受体(MMR)、BDCA-1(CD303、Clec4c)、Dectin-2、Bst-2(CD317)或它们的任何组合。在某些方面,标志物是Clec9a蛋白。

在一些方面,本公开的EV(例如,外泌体)可以包含增加EV(例如,外泌体)对特定组织或细胞的向性的组织或细胞特异性配体,即向性部分。因此,在一些方面,可以通过将细胞类型引导的向性的部分(例如,靶向存在于某种神经细胞类型表面上的抗原的免疫亲和性配体)连接至EV(例如,外泌体)来改善EV(例如,外泌体)至特定组织或细胞类型的递送。在某些方面,向性部分连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)外表面上的支架部分,例如支架X蛋白或其片段。

向性可以通过将抗吞噬信号(例如,CD47和/或CD24)、半衰期延长部分(例如,白蛋白或PEG)或它们的任何组合连接至本公开的EV(例如,外泌体)的外表面来进一步改善。在某些方面,抗吞噬信号连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)外表面上的支架部分,例如支架X蛋白或其片段。

还可以通过选择合适的施用途径(例如,鞘内施用或眼内施用,以改善对中枢神经系统的向性)来实现药代动力学、生物分布,特别是向性和在所期望的组织或解剖位置中的滞留。

在一些方面,当对中枢神经系统的向性是所期望的时,本公开的EV(例如,外泌体)可以包含增加EV(例如,外泌体)对特定中枢神经系统组织或细胞的向性的组织或细胞特异性靶配体。在一些方面,细胞是神经胶质细胞。在一些方面,神经胶质细胞是少突胶质细胞、星形胶质细胞、室管膜细胞、小神经胶质细胞、雪旺氏细胞、卫星神经胶质细胞、嗅鞘细胞或它们的组合。在一些方面,细胞是神经干细胞。在一些方面,增加EV(例如,外泌体)对雪旺氏细胞的向性的细胞特异性靶配体结合至雪旺氏细胞表面标志物,诸如髓鞘碱性蛋白(MBP)、髓鞘蛋白零(P0)、P75NTR、NCAM、PMP22和它们的任何组合。在一些方面,细胞特异性向性部分包含抗体或其抗原结合部分、适体或在雪旺氏细胞表面上表达的受体的激动剂或拮抗剂。

原则上,包含可以将EV(例如,外泌体)引导至特定靶细胞或组织(例如,外周神经中的雪旺氏细胞)的至少一个向性部分的本公开的EV(例如,外泌体),可以使用本领域已知的任何合适施用方法(例如,静脉注射或输注)施用,因为向性部分的存在(单独或与抗吞噬信号的存在和特定施用途径的使用组合)将诱导EV(例如,外泌体)朝向所期望的靶细胞或组织的向性。

在一些方面,本文公开的靶向部分和/或向性部分可以通过支架部分(例如,支架X蛋白部分或其片段,或脂质部分)连接至本公开的EV(例如,外泌体),其中靶向和/或向性部分经由马来酰亚胺部分和任选地一个或多个接头(例如,可切割的接头)化学连接至支架部分。

II.F EV(例如,外泌体)

本公开的EV(例如,外泌体)可以具有在约20和约300nm之间的直径。在某些方面,本公开的EV(例如,外泌体)具有在约20和约290nm之间、在约20和约280nm之间、在约20和约270nm之间、在约20和约260nm之间、在约20和约250nm之间、在约20和约240nm之间、在约20和约230nm之间、在约20和约220nm之间、在约20和约210nm之间、在约20和约200nm之间、在约20和约190nm之间、在约20和约180nm之间、在约20和约170nm之间、在约20和约160nm之间、在约20和约150nm之间、在约20和约140nm之间、在约20和约130nm之间、在约20和约120nm之间、在约20和约110nm之间、在约20和约100nm之间、在约20和约90nm之间、在约20和约80nm之间、在约20和约70nm之间、在约20和约60nm之间、在约20和约50nm之间、在约20和约40nm之间、在约20和约30nm之间、在约30和约300nm之间、在约30和约290nm之间、在约30和约280nm之间、在约30和约270nm之间、在约30和约260nm之间、在约30和约250nm之间、在约30和约240nm之间、在约30和约230nm之间、在约30和约220nm之间、在约30和约210nm之间、在约30和约200nm之间、在约30和约190nm之间、在约30和约180nm之间、在约30和约170nm之间、在约30和约160nm之间、在约30和约150nm之间、在约30和约140nm之间、在约30和约130nm之间、在约30和约120nm之间、在约30和约110nm之间、在约30和约100nm之间、在约30和约90nm之间、在约30和约80nm之间、在约30和约70nm之间、在约30和约60nm之间、在约30和约50nm之间、在约30和约40nm之间、在约40和约300nm之间、在约40和约290nm之间、在约40和约280nm之间、在约40和约270nm之间、在约40和约260nm之间、在约40和约250nm之间、在约40和约240nm之间、在约40和约230nm之间、在约40和约220nm之间、在约40和约210nm之间、在约40和约200nm之间、在约40和约190nm之间、在约40和约180nm之间、在约40和约170nm之间、在约40和约160nm之间、在约40和约150nm之间、在约40和约140nm之间、在约40和约130nm之间、在约40和约120nm之间、在约40和约110nm之间、在约40和约100nm之间、在约40和约90nm之间、在约40和约80nm之间、在约40和约70nm之间、在约40和约60nm之间、在约40和约50nm之间、在约50和约300nm之间、在约50和约290nm之间、在约50和约280nm之间、在约50和约270nm之间、在约50和约260nm之间、在约50和约250nm之间、在约50和约240nm之间、在约50和约230nm之间、在约50和约220nm之间、在约50和约210nm之间、在约50和约200nm之间、在约50和约190nm之间、在约50和约180nm之间、在约50和约170nm之间、在约50和约160nm之间、在约50和约150nm之间、在约50和约140nm之间、在约50和约130nm之间、在约50和约120nm之间、在约50和约110nm之间、在约50和约100nm之间、在约50和约90nm之间、在约50和约80nm之间、在约50和约70nm之间、在约50和约60nm之间、在约60和约300nm之间、在约60和约290nm之间、在约60和约280nm之间、在约60和约270nm之间、在约60和约260nm之间、在约60和约250nm之间、在约60和约240nm之间、在约60和约230nm之间、在约60和约220nm之间、在约60和约210nm之间、在约60和约200nm之间、在约60和约190nm之间、在约60和约180nm之间、在约60和约170nm之间、在约60和约160nm之间、在约60和约150nm之间、在约60和约140nm之间、在约60和约130nm之间、在约60和约120nm之间、在约60和约110nm之间、在约60和约100nm之间、在约60和约90nm之间、在约60和约80nm之间、在约60和约70nm之间、在约70和约300nm之间、在约70和约290nm之间、在约70和约280nm之间、在约70和约270nm之间、在约70和约260nm之间、在约70和约250nm之间、在约70和约240nm之间、在约70和约230nm之间、在约70和约220nm之间、在约70和约210nm之间、在约70和约200nm之间、在约70和约190nm之间、在约70和约180nm之间、在约70和约170nm之间、在约70和约160nm之间、在约70和约150nm之间、在约70和约140nm之间、在约70和约130nm之间、在约70和约120nm之间、在约70和约110nm之间、在约70和约100nm之间、在约70和约90nm之间、在约70和约80nm之间、在约80和约300nm之间、在约80和约290nm之间、在约80和约280nm之间、在约80和约270nm之间、在约80和约260nm之间、在约80和约250nm之间、在约80和约240nm之间、在约80和约230nm之间、在约80和约220nm之间、在约80和约210nm之间、在约80和约200nm之间、在约80和约190nm之间、在约80和约180nm之间、在约80和约170nm之间、在约80和约160nm之间、在约80和约150nm之间、在约80和约140nm之间、在约80和约130nm之间、在约80和约120nm之间、在约80和约110nm之间、在约80和约100nm之间、在约80和约90nm之间、在约90和约300nm之间、在约90和约290nm之间、在约90和约280nm之间、在约90和约270nm之间、在约90和约260nm之间、在约90和约250nm之间、在约90和约240nm之间、在约90和约230nm之间、在约90和约220nm之间、在约90和约210nm之间、在约90和约200nm之间、在约90和约190nm之间、在约90和约180nm之间、在约90和约170nm之间、在约90和约160nm之间、在约90和约150nm之间、在约90和约140nm之间、在约90和约130nm之间、在约90和约120nm之间、在约90和约110nm之间、在约90和约100nm之间、在约100和约300nm之间、在约110和约290nm之间、在约120和约280nm之间、在约130和约270nm之间、在约140和约260nm之间、在约150和约250nm之间、在约160和约240nm之间、在约170和约230nm之间、在约180和约220nm之间或在约190和约210nm之间的直径。可根据本领域已知的方法测量本文所述的EV(例如,外泌体)的大小。本公开的EV包括外泌体、微囊泡、凋亡小体或它们的任何组合。在一些方面,本公开的EV包含外泌体和/或微囊泡群。

本公开的EV(例如,外泌体)包含双脂膜(“外泌体膜”或“EV膜”),它包含内表面(腔体表面)和外表面(例如,胞外表面)。内表面面向EV(例如,外泌体)的内核,即EV的腔体。在某些方面,外表面可以与胞内体、多泡体或生产细胞的膜/细胞质接触。

在一些方面,EV(例如,外泌体)膜包含双脂膜,例如脂双层。在一些方面,EV(例如,外泌体)膜包含脂质和脂肪酸。在一些方面,EV(例如,外泌体)膜包含脂质,所述脂质包括磷脂、糖脂、脂肪酸、鞘脂、磷酸甘油酯、甾醇、胆固醇和磷脂酰丝氨酸。在一些方面,EV(例如,外泌体)膜包含内小叶和外小叶。内部小叶和外部小叶的组成可通过本领域中已知的跨双层分布测定来确定,参见例如Kuypers等人Biohim Biophys Acta 1985 819:170。

在一些方面,外部小叶的组成为在约70%-90%之间的胆碱磷脂、在约0%-15%之间的酸性磷脂和在约5%-30%之间的磷脂酰乙醇胺。在一些方面,内部小叶的组成为在约15%-40%之间的胆碱磷脂、在约10%-50%之间的酸性磷脂和在约30%-60%之间的磷脂酰乙醇胺。在一些方面,EV或外泌体膜包含一种或多种多糖,诸如聚糖。EV或外泌体表面上的聚糖可以作为马来酰亚胺部分的连接部或连接聚糖和马来酰亚胺部分的接头。聚糖可以存在于EV(例如,外泌体)表面上的一种或多种蛋白质上,例如支架X,诸如PTGFRN多肽,或在EV(例如,外泌体)的脂质膜上。聚糖可以被修饰为具有硫岩藻糖,所述硫岩藻糖可以作为将马来酰亚胺部分连接至聚糖上的官能团。在一些方面,可以修饰支架X以表达大量聚糖以允许在EV(例如,外泌体)上进行另外的连接。

II.G.支架部分

在一些方面,生物活性分子与EV(例如,外泌体)的外表面或腔体表面连接。在一些方面,生物活性分子连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的外表面或腔体表面上的支架部分(例如,支架X)。在一些方面,生物活性分子经由马来酰亚胺部分连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)的外表面或腔体表面上的支架部分(例如,胆固醇部分)。

例如,全长成熟PTGRN包含16个半胱氨酸,即它含有16个巯基,其中14个位于蛋白质的胞外部分,其中2个位于其胞内部分。PTGRN具有6个二硫键,全都是胞外的。因此,PTGRN具有2个胞外巯基和2个胞内巯基。因此,在一些方面,生物活性部分可以通过存在于生物活性部分上的马来酰亚胺反应性基团与存在于支架X蛋白(例如,PTGRN或其片段)上的巯基之一之间的反应,经由马来酰亚胺部分化学连接至支架X蛋白(例如,PTGRN或其片段)。相反,包含马来酰亚胺反应性基团的支架X蛋白(例如,PTGRN或其片段)是通过双官能试剂(诸如SMCC(琥珀酰亚胺基-4-(N-马来酰亚胺甲基)环己烷-1-羧酸酯))和支架X蛋白的赖氨酸侧链之间的反应引入的。所述支架X蛋白可以与生物活性分子中存在的巯基反应。

在某些方面,可以通过转染将一个或多个部分引入EV(例如,外泌体)。在一些方面,可以使用合成大分子(诸如阳离子脂质和聚合物)将一个或多个部分引入EV(例如,外泌体)(Papapetrou等人,Gene Therapy 12:S118-S130(2005))。在某些方面,诸如磷酸钙、环糊精或聚芳烃等的化学物质可用于将一个或多个部分引入EV(例如,外泌体)。

在一些方面,一个或多个支架部分可以是CD47、CD55、CD49、CD40、CD133、CD59、glypican-1、CD9、CD63、CD81、整合素、选择蛋白、凝集素、钙粘蛋白、本领域的技术人员已知的其他类似多肽或它们的任何组合。

在其他方面,通过在生产细胞中重组表达支架部分,一种或多种支架部分在EV(例如,外泌体)的膜中表达。从生产细胞中获得的EV(例如,外泌体)可以进一步修饰以与马来酰亚胺部分或接头缀合。在其他方面,支架部分(例如支架X)是去糖基化的。在一些方面,支架部分(例如支架X)是高度糖基化的,例如在相同条件下高于天然存在的支架X。

II.G.1跨膜支架部分(例如,支架X)

支架部分的各种修饰或片段可用于本公开的方面。例如,经修饰而对结合剂具有增强的亲和力的支架部分可用于产生可使用结合剂纯化的表面工程化EV(例如,外泌体)。可使用经修饰而更有效地靶向EV(例如,外泌体)和/或膜的支架部分。还可使用经修饰而包含特异性且有效地靶向EV(例如,外泌体)膜所需的最小片段的支架部分。在一些方面,支架部分可以连接至本文所述的马来酰亚胺部分。在其他方面,支架部分不连接至马来酰亚胺部分。

支架部分可以通过合成或重组方式进行工程化,例如表达为融合蛋白,例如支架X与另一个部分的融合蛋白,所述部分可以与另一个分子上的马来酰亚胺(例如,蛋白质接头、包含反应性基团(例如,巯基)的蛋白质序列,或它们的组合)反应。例如,融合蛋白可以包含本文公开的支架部分(例如,支架X,例如PTGFRN、BSG、IGSF2、IGSF3、IGSF8、ITGB1、ITGA4、SLC3A2、ATP转运蛋白或者其片段或变体),所述支架部分连接至另一个部分。在融合蛋白的情况下,第二部分可以是天然肽、重组肽、合成肽或它们的任何组合。在其他方面,支架部分可以是CD9、CD63、CD81、PDGFR、GPI蛋白、乳粘素、LAMP2或LAMP2B或它们的任何组合。可用于本公开的其他支架部分的非限制性实例包括:氨肽酶N(CD13);脑啡肽酶,又名膜金属内肽酶(MME);外核苷酸焦磷酸酶/磷酸二酯酶家族成员1(ENPP1);Neuropilin-1(NRP1);或它们的任何组合。

在一些方面,融合分子可以包含本文公开的支架蛋白(例如,PTGFRN、BSG、IGSF2、IGSF3、IGSF8、ITGB1、ITGA4、SLC3A2、ATP转运蛋白或其片段或变体),所述支架蛋白直接或通过中间体(例如,化学诱导型二聚体、抗原结合结构域或受体)连接(例如,经由马来酰亚胺部分化学连接)至生物活性分子。在一些方面,融合分子可以化学连接至例如靶向部分或经由马来酰亚胺部分连接至向性部分。

在一些方面,与本领域已知的EV(例如,外泌体)相比,本文所述的表面(例如,支架X)工程化的EV(例如,外泌体)表现出优异的特征。例如,与天然存在的EV(例如,外泌体)或使用常规EV(例如,外泌体)蛋白产生的EV(例如,外泌体)相比,表面(例如,支架X)工程化包含在EV(例如,外泌体)的外表面或腔体表面上更高度富集的经修饰的蛋白。此外,本公开的表面(例如,支架X)工程化的EV(例如,外泌体),与天然存在的EV(例如,外泌体)或使用常规EV(例如,外泌体)蛋白产生的EV(例如,外泌体)相比,可以具有更大、更特异或更可控的生物活性。

在一些方面,支架部分(例如支架X蛋白)包含前列腺素F2受体负调节剂(PTGFRN多肽)。PTGFRN多肽也可称为CD9配偶体1(CD9P-1)、含Glu-Trp-Ile EWI基序的蛋白F(EWI-F)、前列腺素F2-α受体调节蛋白、前列腺素F2-α受体相关蛋白或CD315。人PTGFRN多肽的全长氨基酸序列(Uniprot登录号Q9P2B2)在表2中显示为SEQ ID NO:1。PTGFRN多肽包含信号肽(SEQ ID NO:1的氨基酸1至25)、胞外结构域(SEQ ID NO:1的氨基酸26至832)、跨膜结构域(SEQ ID NO:1的氨基酸833至853)和胞质结构域(SEQ ID NO:1的氨基酸854至879)。成熟PTGFRN多肽由无信号肽的SEQ ID NO:1,即SEQ ID NO:1的氨基酸26至879组成。在一些方面,可用于本公开的PTGFRN多肽片段包含PTGFRN多肽的跨膜结构域。在其他方面,可用于本公开的PTGFRN多肽片段包含PTGFRN多肽的跨膜结构域并且(i)在跨膜结构域的N-末端包含至少约五个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约40个、至少约50个、至少约70个、至少约80个、至少约90个、至少约100个、至少约110个、至少约120个、至少约130个、至少约140个、至少约150个氨基酸,(ii)在跨膜结构域的C-末端包含至少约五个、至少约10个、至少约15个、至少约20个或至少约25个氨基酸,或(i)和(ii)两者。

在一些方面,PTGFRN多肽的片段缺少一个或多个功能性或结构性结构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含与SEQ ID NO:1的氨基酸26至879具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架部分(例如,支架X)包含与SEQ ID NO:2(PTGFRN多肽的片段)(对应于SEQ ID NO:1的第687至878位)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。

在其他方面,除一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变外,支架部分(例如,支架X)包含SEQ ID NO:2的氨基酸序列。突变可以是取代、插入、缺失或其任何组合。在一些方面,支架部分(例如,支架X)包含SEQ ID NO:2的氨基酸序列并且在SEQ ID NO:2的N-末端和/或C-末端包含1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。

在其他方面,支架部分(例如,支架X)包含与SEQ ID NO:1的氨基酸26至879、SEQID NO:1的氨基酸833至853、SEQ ID NO:2或SEQ ID NO:1具有至少约至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或约100%同一性的氨基酸序列。在其他方面,支架X包含SEQ ID NO:1的氨基酸26至879、SEQ ID NO:1的氨基酸833至853、SEQ ID NO:2或SEQ ID NO:1的氨基酸序列,但是具有一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变。突变可以是取代、插入、缺失或其任何组合。

在一些方面,支架部分(例如,支架X)包含SEQ ID NO:1的氨基酸26至879、SEQ IDNO:1的氨基酸833至853、SEQ ID NO:2或SEQ ID NO:1的氨基酸序列,以及在SEQ ID NO:1的氨基酸26至879、SEQ ID NO:1的氨基酸833至853、SEQ ID NO:2或SEQ ID NO:1的氨基酸序列的N-末端和/或C-末端处的1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸或20个氨基酸或更长。

在其他方面,支架部分(例如,支架X)包含与SEQ ID NO:186、187、188、189、190或191具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,除一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变外,支架部分(例如,支架X)包含SEQ ID NO:186、187、188、189、190或191的氨基酸序列。突变可以是取代、插入、缺失或其任何组合。在一些方面,支架部分(例如,支架X)包含SEQ ID NO:186、187、188、189、190或191的氨基酸序列并且在SEQ ID NO:186、187、188、189、190或191的N-末端和/C-末端包含1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。

表2.示例性支架蛋白序列

在其他实施方案中,支架部分(例如,支架X)包含BSG蛋白、IGSF8蛋白、IGSF3蛋白、ITGB1蛋白、SLC3A2蛋白、ITGA4蛋白、ATP1A1蛋白、ATP1A2蛋白、ATP1A3蛋白、ATP1A4蛋白、ATP1A5蛋白、ATP2B1蛋白、ATP2B2蛋白、ATP2B3蛋白、ATP2B4蛋白或IGSF2蛋白,它包含与对应的成熟BSG蛋白、IGSF8蛋白、IGSF3蛋白、ITGB1蛋白、SLC3A2蛋白、ITGA4蛋白、ATP1A1蛋白、ATP1A2蛋白、ATP1A3蛋白、ATP1A4蛋白、ATP1A5蛋白、ATP2B1蛋白、ATP2B2蛋白、ATP2B3蛋白、ATP2B4蛋白或IGSF2蛋白(无信号肽)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,BSG蛋白、IGSF8蛋白、IGSF3蛋白、ITGB1蛋白、SLC3A2蛋白、ITGA4蛋白、ATP1A1蛋白、ATP1A2蛋白、ATP1A3蛋白、ATP1A4蛋白、ATP1A5蛋白、ATP2B1蛋白、ATP2B2蛋白、ATP2B3蛋白、ATP2B4蛋白或IGSF2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

其他支架X蛋白的非限制性实例可见于2019年2月5日发布的美国专利号US 10,195,290B1,该专利以引用的方式整体并入,ATP转运蛋白:ATP1A1、ATP1A2、ATP1A3、ATP1A4、ATP1B3、ATP2B1、ATP2B2和ATP2B4)、CD9、CD63、CD81、PDGFR、GPI蛋白、乳凝集素、LAMP2和LAMP2B。

在一些方面,支架部分(例如,支架X)包含基础免疫球蛋白(BSG蛋白)。BSG蛋白也称为5F7、胶原蛋白酶刺激因子、胞外基质金属蛋白酶诱导物(EMMPRIN)、白细胞活化抗原M6、OK血型抗原、肿瘤细胞源性胶原蛋白酶刺激因子(TCSF)或CD147。人BSG蛋白的Uniprot编号是P35613。BSG蛋白的信号肽是SEQ ID NO:3的氨基酸1至21。SEQ ID NO:3的氨基酸138-323是胞外结构域,SEQ ID NO:3的氨基酸324至344是跨膜结构域,SEQ ID NO:3的氨基酸345至385是BSG的胞质结构域。

在其他方面,支架部分(例如,支架X)包含与人BSG蛋白的氨基酸22至385(SEQ IDNO:3)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,Basigin多肽的片段缺乏一个或多个功能性或结构性结构域,诸如IgV,例如人BSG蛋白的氨基酸221至315。

在其他方面,支架部分(例如,支架X)包含与SEQ ID NO:193、194或195具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,除一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变外,支架部分(例如,支架X)包含SEQ ID NO:193、194或195的氨基酸序列。突变可以是取代、插入、缺失或其任何组合。在一些方面,支架部分(例如,支架X)包含SEQ ID NO:193、194或195的氨基酸序列并且在SEQ ID NO:193、194或195的N-末端和/C-末端包含1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。

在一些方面,支架部分(例如,支架X)包含免疫球蛋白超家族成员8(IgSF8或IGSF8蛋白),其也被称为CD81配偶体3、含Glu-Trp-Ile EWI基序的蛋白2(EWI-2)、角质形成细胞相关跨膜蛋白4(KCT-4)、LIR-D1、前列腺素调控样蛋白(PGRL)或CD316。全长人IGSF8蛋白在Uniprot中的登录号为Q969P0,在本文中显示为SEQ ID NO:4。人IGSF8蛋白具有信号肽(人IGSF8蛋白的氨基酸1至27;SEQ ID NO:4)、胞外结构域(人IGSF8蛋白的氨基酸28至579;SEQID NO:4)、跨膜结构域(人IGSF8蛋白的氨基酸580至600;SEQ ID NO:4)和胞质结构域(人IGSF8蛋白的氨基酸601至613;SEQ ID NO:4)。

在其他方面,支架部分(例如,支架X)包含与人IGSF8蛋白的氨基酸28至613(SEQID NO:4)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,IGSF8蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。在其他方面,除一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变外,支架部分(例如,支架X)包含人IGSF8蛋白的氨基酸序列(SEQ ID NO:4)。突变可以是取代、插入、缺失或其任何组合。在一些方面,支架部分(例如,支架X)包含人IGSF8蛋白(SEQ ID NO:4)的氨基酸序列并且在人IGSF8蛋白(SEQ ID NO:4)的N-末端和/或C-末端包含1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。

在一些方面,支架部分(例如,支架X)包含与SEQ ID NO:197、198、199或200具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,除一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变外,支架部分(例如,支架X)包含SEQ ID NO:197、198、199或200的氨基酸序列。突变可以是取代、插入、缺失或其任何组合。在一些方面,支架部分(例如,支架X)包含SEQ ID NO:197、198、199或200的氨基酸序列并且在SEQ ID NO:197、198、199或200的N-末端和/C-末端包含1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。

在一些方面,用于本公开的支架部分(例如,支架X)包含免疫球蛋白超家族成员3(IgSF3或IGSF3蛋白),其也被称为含Glu-Trp-Ile EWI基序的蛋白3(EWI-3),并显示为SEQID NO:203的氨基酸序列。人IGSF3蛋白具有信号肽(SEQ ID NO:203的IGSF3蛋白的氨基酸1至19)、胞外结构域(SEQ ID NO:203的IGSF3蛋白的氨基酸20至1124)、跨膜结构域(IGSF3蛋白的氨基酸1125至1145)和胞质结构域(SEQ ID NO:203的IGSF3蛋白的氨基酸1146至1194)。

在其他方面,支架部分(例如,支架X)包含与IGSF3蛋白(SEQ ID NO:203)的氨基酸28至613具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,IGSF3蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在一些方面,用于本公开的支架部分(例如,支架X)包含整合素β-1(ITGB1蛋白),它也称为纤连蛋白受体亚基β、糖蛋白IIa(GPIIA)、VLA-4亚基β或CD29,并且显示为SEQ IDNO:5的氨基酸序列。人ITGB1蛋白具有信号肽(SEQ ID NO:5的人ITGB1蛋白的氨基酸1至20)、胞外结构域(SEQ ID NO:5的人ITGB1蛋白的氨基酸21至728)、跨膜结构域(SEQ ID NO:5的人ITGB1蛋白的氨基酸729至751)和胞质结构域(SEQ ID NO:5的人ITGB1蛋白的氨基酸752至798)。

在其他方面,支架部分(例如,支架X)包含与人ITGB1蛋白(SEQ ID NO:5)的氨基酸21至798具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ITGB1蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ITGA4蛋白,它包含与无信号肽的SEQ IDNO:6的人ITGB1蛋白(SEQ ID NO:6的人ITGB1蛋白的氨基酸1至33)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ITGA4蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含SLC3A2蛋白,它包含与无信号肽的SEQID NO:7的SLC3A2蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,SLC3A2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP1A1蛋白,它包含与无信号肽的SEQID NO:204的ATP1A1蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP1A1蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP1A2蛋白,它包含与无信号肽的SEQID NO:205的ATP1A2蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP1A2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP1A3蛋白,它包含与无信号肽的SEQID NO:206的ATP1A3蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP1A3蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP1A4蛋白,它包含与无信号肽的SEQID NO:207的ATP1A4蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP1A4蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP1B3蛋白,它包含与无信号肽的SEQID NO:208的ATP1B3蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP1B3蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP2B1蛋白,它包含与无信号肽的SEQID NO:209的ATP2B1蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP2B1蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP2B2蛋白,它包含与无信号肽的SEQID NO:210的ATP2B2蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP2B2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP2B3蛋白,它包含与无信号肽的SEQID NO:211的ATP2B3蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP2B3蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含ATP2B4蛋白,它包含与无信号肽的SEQID NO:212的ATP2B4蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ATP2B4蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

在其他方面,支架部分(例如,支架X)包含IGSF2蛋白,它包含与无信号肽的IGSF2蛋白(SEQ ID NO:202)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,IGSF2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。

其他支架部分(例如,支架X蛋白)的非限制性实例可见于2019年2月5日发布的美国专利号US10195290B1,该专利以引用的方式整体并入。

在一些方面,所述序列编码从天然蛋白的N-末端开始缺少至少约5、至少约10、至少约50、至少约100、至少约200、至少约300、至少约400、至少约500、至少约600、至少约700个或至少约800个氨基酸的支架部分的片段。在一些方面,所述序列编码从天然蛋白的C-末端开始缺少至少约5、至少约10、至少约50、至少约100、至少约200、至少约300、至少约400、至少约500、至少约600、至少约700个或至少约800个氨基酸的支架部分的片段。在一些方面,所述序列编码从天然蛋白的N-末端和C-末端开始缺少至少约5、至少约10、至少约50、至少约100、至少约200、至少约300、至少约400、至少约500、至少约600、至少约700个或至少约800个氨基酸的支架部分的片段。在一些方面,所述序列编码缺少天然蛋白的一个或多个功能性或结构性结构域的支架部分的片段。

在一些方面,支架部分(例如,支架X),例如PTGFRN蛋白,与一个或多个异源性蛋白连接。一个或多个异源性蛋白可以连接至支架部分的N-末端。一个或多个异源性蛋白可以连接至支架部分的C-末端。在一些方面,一个或多个异源性蛋白与支架部分的N-末端和C-末端连接。在一些方面,异源性蛋白是哺乳动物蛋白。在一些方面,异源性蛋白是人类蛋白。

在一些方面,支架部分(例如,支架X)可用于同时将任何部分连接至EV(例如,外泌体)的腔体表面和外表面。例如,PTGFRN多肽可用于将一个或多个生物活性分子通过马来酰亚胺部分间接连接或者直接连接至马来酰亚胺部分或者连接至EV(例如,外泌体)的腔体表面以及外表面的接头。因此,在某些方面,支架X可以用于双重目的。

在其他方面,与天然存在的EV(例如,外泌体)相比,本公开的EV(例如,外泌体)包含更多数量的支架X蛋白。在一些方面,本公开的EV(例如,外泌体)包含的支架X(例如,PTGFRN多肽)的数量比天然存在的EV(例如,外泌体)高至少约5倍、至少约10倍、至少约20倍、至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、至少约200倍、至少约210倍、至少约220倍、至少约230倍、至少约240倍、至少约250倍、至少约260倍、至少约270倍。

本公开的EV(例如,外泌体)上的支架部分(例如,支架X,诸如,PTGFRN多肽)的数量为至少约100、至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、至少约1000、至少约1100、至少约1200、至少约1300、至少约1400、至少约1500、至少约1600、至少约1700、至少约1800、至少约1900、至少约2000、至少约2100、至少约2200、至少约2300、至少约2400、至少约2500、至少约2600、至少约2700、至少约2800、至少约2900、至少约3000、至少约4000、至少约5000、至少约6000、至少约7000、至少约8000、至少约9000、或至少约10000。

在一些方面,本公开的EV(例如,外泌体)上的支架部分(例如,支架X,诸如,PTGFRN多肽)的数量为从约100至约100,000、从约200至约9000、从约300至约9000、从约400至约9000、从约500至约9000、从约600至约8000、从约800至约8000、从约900至约8000、从约1000至约8000、从约1100至约8000、从约1200至约8000、从约1300至约8000、从约1400至约8000、从约1500至约8000、从约1600至约8000、从约1700至约8000、从约1800至约8000、从约1900至约8000、从约2000至约8000、从约2100至约8000、从约2200至约8000、从约2300至约8000、从约2400至约8000、从约2500至约8000、从约2600、从约2700至约8000、从约2800至约8000、从约2900至约8000、从约3000至约8000、从约4000至约8000、从约5000至约8000、从约6000至约8000、从约7000至约8000、从约8000、从7000至约9000或从约6000至约10000。

在一些方面,本公开的EV(例如,外泌体)上的支架部分(例如,支架X,诸如,PTGFRN多肽)的数量为从约5000至约8000,例如,约5000、约6000、约7000或约8000。在一些方面,本公开的EV(例如,外泌体)上的支架部分(例如,支架X,诸如,PTGFRN多肽)的数量为从约6000至约8000,例如,约6000、约7000或约8000。在一些方面,本公开的EV(例如,外泌体)上的支架部分(例如,支架X,诸如,PTGFRN多肽)的数量为从约4000至约9000,例如,约4000、约5000、约6000、约7000、约8000或约9000。

II.G.2腔体支架部分(例如,支架Y)

在一些方面,本公开的EV(例如,外泌体)包括不同于天然存在的EV(例如,外泌体)的内部空间的内部空间(即,腔体)。例如,可改变EV(例如,外泌体),使得EV(例如,外泌体)的腔体表面上的组成具有与天然存在的EV(例如,外泌体)的蛋白质、脂质或聚糖含量不同的蛋白质、脂质或聚糖含量。

在一些方面,可从用编码支架部分(例如,外泌体蛋白,例如,支架Y)或改变外泌体的腔体表面的组成或内容物的支架部分的修饰或片段的外源序列转化的细胞产生工程化EV(例如,外泌体)。可在EV(例如,外泌体)的腔体表面上表达的EV(例如,外泌体)蛋白的各种修饰或片段可用于本公开的方面。

在一些方面,可以改变EV(例如,外泌体)的腔体表面的EV(例如,外泌体)蛋白包括但不限于MARCKS蛋白、MARCKSL1蛋白、BASP1蛋白或它们的任何组合。在一些方面,支架部分(例如,支架Y)包含脑酸可溶性蛋白1(BASP1蛋白)。BASP1蛋白也称为22kDa神经元组织富集的酸性蛋白或神经元轴突膜蛋白NAP-22。全长人BASP1蛋白质序列(异构体1)显示于表3中。通过可变剪接产生的异构体缺少表3中的BASP1蛋白的氨基酸88至141(异构体1)。

表3.示例性支架蛋白序列

在一些方面,支架部分(例如,支架Y)包含选自由以下各项组成的组的蛋白质:MARCKS、MARKSL1、BASP1、它们的任何功能片段、变体或它们的衍生物或它们的任何组合。在一些方面,支架部分(例如,支架Y)包含Src蛋白或其片段。在一些方面,支架部分(例如,支架Y)包含在例如美国专利号9,611,481中公开的序列。

在一些方面,本公开的支架部分(例如,支架Y)包含MARCKS蛋白、或其片段、变体或衍生物。MARCKS蛋白(Uniprot登录号P29966)也称为蛋白激酶C底物、80kDa蛋白、轻链。全长人MARCKS蛋白的长度为332个氨基酸,并在氨基酸残基152-176处包含钙调素结合结构域。在一些方面,本公开的支架部分(例如,支架Y)包含成熟的MARCKS蛋白(即,无N-末端甲硫氨酸)。在一些方面,本公开的支架部分(例如,支架Y)来源于成熟的MARCKS蛋白,即,它是成熟的MARCKS蛋白的片段、变体或衍生物,因此它缺乏存在于非成熟蛋白质中的N-末端蛋白。

在一些方面,本公开的支架部分(例如,支架Y)包含MARCKSL1蛋白(Uniprot登录号P49006),也称为MARCKS样蛋白1和巨噬细胞肉豆蔻酰化的富含丙氨酸的C激酶底物。全长人MARCKSL1蛋白的长度为195个氨基酸。MARCKSL1蛋白在氨基酸残基87-110处具有参与脂质结合和钙调蛋白结合的效应结构域。在一些方面,本公开的支架部分(例如,支架Y)包含成熟的MARCKSL1蛋白(即,无N-末端甲硫氨酸)。在一些方面,本公开的支架部分(例如,支架Y)来源于成熟的MARCKSL1蛋白,即,它是成熟的MARCKSL1的片段、变体或衍生物,因此它缺乏存在于非成熟蛋白质中的N-末端蛋白。

在一些方面,本公开的支架部分(例如,支架Y)包含BASP1蛋白(Uniprot登录号P80723),也称为22kDa富含神经元组织的酸性蛋白或神经元轴突膜蛋白NAP-22。全长人BASP1蛋白质序列(异构体1)的长度为227个氨基酸。通过可变剪接产生的异构体缺少异构体1的氨基酸88至141。在一些方面,本公开的支架部分(例如,支架Y)包含成熟的BASP1蛋白(即,无N-末端甲硫氨酸)。在一些方面,本公开的支架部分(例如,支架Y)来源于成熟的BASP1蛋白,即,它是成熟的BASP1的片段、变体或衍生物,因此它缺乏存在于非成熟蛋白质中的N-末端蛋白。成熟BASP1蛋白序列缺少SEQ ID NO:10的第一个Met,因此含有SEQ IDNO:10的氨基酸2至227。

在其他方面,可用于本公开的支架部分(例如,支架Y)包含与SEQ ID NO:10,即BASP1的成熟形式(即,无SEQ ID NO:10中存在的N-末端甲硫氨酸氨基酸)的氨基酸2至227具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架部分(例如,支架X蛋白)包含与SEQ ID NO:10(BASP1)(即,无SEQ ID NO:10中存在的N-末端甲硫氨酸氨基酸)的成熟形式的功能片段具有至少约至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,除一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变外,可用于本公开的支架部分(例如,支架Y)包含SEQ ID NO:10的氨基酸序列。突变可以是取代、插入、缺失或其任何组合。在一些方面,可用于本公开的支架部分(例如,支架Y)包含SEQID NO:10的氨基酸序列并且在SEQ ID NO:10的N-末端和/或C-末端包含1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸或20个氨基酸或更多个氨基酸。

在其他方面,可用于本公开的支架部分(例如,支架Y)包含与SEQ ID NO:9(MARCKSL1)的成熟形式(即,无SEQ ID NO:9中存在的N-末端甲硫氨酸氨基酸)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架部分(例如,支架Y)包含与SEQ ID NO:9(MARCKSL1)(即,无SEQ ID NO:9中存在的N-末端甲硫氨酸氨基酸)的成熟形式的功能片段具有至少约至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,除一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变外,可用于本公开的支架部分(例如,支架Y)包含SEQ ID NO:9的氨基酸序列。突变可以是取代、插入、缺失或其任何组合。在一些方面,可用于本公开的支架部分(例如,支架Y)包含SEQ ID NO:9的氨基酸序列并且在SEQ ID NO:9的N-末端和/或C-末端包含1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸或20个氨基酸或更多个氨基酸。

在其他方面,可用于本公开的支架部分(例如,支架Y)包含与SEQ ID NO:8(MARCKS)的成熟形式(即,无SEQ ID NO:8中存在的N-末端甲硫氨酸氨基酸)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架部分(例如,支架Y)包含与SEQ ID NO:8(MARCKS)(即,无SEQ ID NO:8中存在的N-末端甲硫氨酸氨基酸)的成熟形式的功能片段具有至少约至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,除一个氨基酸突变、两个氨基酸突变、三个氨基酸突变、四个氨基酸突变、五个氨基酸突变、六个氨基酸突变或七个氨基酸突变外,可用于本公开的支架部分(例如,支架Y)包含SEQ ID NO:8的氨基酸序列。突变可以是取代、插入、缺失或其任何组合。在一些方面,可用于本公开的支架部分(例如,支架Y)包含SEQ ID NO:8的氨基酸序列并且在SEQ ID NO:8的N-末端和/或C-末端包含1个氨基酸、两个氨基酸、三个氨基酸、四个氨基酸、五个氨基酸、六个氨基酸、七个氨基酸、八个氨基酸、九个氨基酸、十个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸或20个氨基酸或更多个氨基酸。

在某些方面,PCT/US2018/061679中公开的任何SEQ ID NO:1-109的蛋白质序列足以作为本公开的支架Y(例如,与接头连接的支架部分)。

在某些方面,可用于本公开的支架部分(例如,支架Y)包含具有MGXKLSKKK(SEQ IDNO:224)或GXKLSKKK(SEQ ID NO:225)的肽,其中X是丙氨酸或任何其他氨基酸。在一些方面,EV(例如,外泌体)包含具有序列(M)(G)(π)(ξ)(Φ/π)(S/A/G/N)(+)(+)或(G)(π)(ξ)(Φ/π)(S/A/G/N)(+)(+)的肽,其中每个括号位置代表氨基酸,并且其中π为选自由(Pro、Gly、Ala、Ser)组成的组的任意氨基酸,ξ为选自由(Asn、Gln、Ser、Thr、Asp、Glu、Lys、His、Arg)组成的组的任意氨基酸,Φ为选自由(Val、Ile、Leu、Phe、Trp、Tyr、Met)组成的组的任意氨基酸,并且(+)为选自由(Lys、Arg、His)组成的组的任意氨基酸;并且其中第五位不是(+)并且第六位既不是(+)也不是(Asp或Glu)。在其他方面,本文所述的EV(例如,外泌体)(例如,经工程化的外泌体)包含具有序列(M)(G)(π)(X)(Φ/π)(π)(+)(+)或(G)(π)(X)(Φ/π)(π)(+)(+)的肽,其中每个括号位置代表氨基酸,并且其中π为选自由(Pro、Gly、Ala、Ser)组成的组的任意氨基酸,X为任意氨基酸,Φ为选自由(Val、Ile、Leu、Phe、Trp、Tyr、Met)组成的组的任意氨基酸,并且(+)为选自由(Lys、Arg、His)组成的组的任意氨基酸;并且其中第五位不是(+)并且第六位既不是(+)也不是(Asp或Glu)。氨基酸命名参见Aasland等人,FEBS Letters 513(2002)141-144。

在其他方面,支架部分(例如,支架Y)包含与2019年2月5日公布的US 10,195,290B1中公开的序列中的任一者具有至少约至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。

本文所述的支架Y工程化的外泌体可从用PCT/US2018/061679中所示的任何序列(PCT/US2018/061679的SEQ ID NO:4-109)转化的细胞产生。

在其他方面,与天然存在的EV(例如,外泌体)相比,本公开的EV(例如,外泌体)包含更多数量的支架Y蛋白。在一些方面,本公开的EV(例如,外泌体)包含的支架Y(例如,BASP-1多肽)的数量比天然存在的EV(例如,外泌体)高至少约5倍、至少约10倍、至少约20倍、至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、至少约200倍、至少约210倍、至少约220倍、至少约230倍、至少约240倍、至少约250倍、至少约260倍、至少约270倍。本公开的EV(例如,外泌体)上的支架Y(例如,BASP-1多肽)的数量为至少约100、至少约200、至少约300、至少约400、至少约500、至少约600、至少约700、至少约800、至少约900、至少约1000、至少约1100、至少约1200、至少约1300、至少约1400、至少约1500、至少约1600、至少约1700、至少约1800、至少约1900、至少约2000、至少约2100、至少约2200、至少约2300、至少约2400、至少约2500、至少约2600、至少约2700、至少约2800、至少约2900、至少约3000、至少约4000、至少约5000、至少约6000、至少约7000、至少约8000、至少约9000、或至少约10000。在一些方面,本公开的EV(例如,外泌体)上的支架Y(例如,BASP-1多肽)的数量为从约100至约100,000、从约200至约9000、从约300至约9000、从约400至约9000、从约500至约9000、从约600至约8000、从约800至约8000、从约900至约8000、从约1000至约8000、从约1100至约8000、从约1200至约8000、从约1300至约8000、从约1400至约8000、从约1500至约8000、从约1600至约8000、从约1700至约8000、从约1800至约8000、从约1900至约8000、从约2000至约8000、从约2100至约8000、从约2200至约8000、从约2300至约8000、从约2400至约8000、从约2500至约8000、从约2600、从约2700至约8000、从约2800至约8000、从约2900至约8000、从约3000至约8000、从约4000至约8000、从约5000至约8000、从约6000至约8000、从约7000至约8000、从约8000、从7000至约9000或从约6000至约10000。在一些方面,本公开的EV(例如,外泌体)上的支架Y(例如,BASP-1多肽)的数量为从约5000至约8000,例如约5000、约6000、约7000或约8000。在一些方面,本公开的EV(例如,外泌体)上的支架Y(例如,BASP-1多肽)的数量为从约6000至约8000,例如约6000、约7000或约8000。在一些方面,本公开的E V(例如,外泌体)上的支架Y(例如,BASP-1多肽)的数量为从约4000至约9000,例如约4000、约5000、约6000、约7000、约8000、约9000。

在一些方面,可用于本公开的支架部分(例如,支架Y)包含“N-末端结构域”(ND)和“效应结构域”(ED),其中ND和/或ED与EV(例如,外泌体)的腔体表面相关。在一些方面,可用于本公开的支架部分(例如,支架Y)包含胞内结构域、跨膜结构域和胞外结构域;其中胞内结构域包括“N-末端结构域”(ND)和“效应结构域”(ED);其中ND和/或ED与EV(例如,外泌体)的腔体表面缔合。如本文所用,术语“与……缔合”是指本公开的支架蛋白与EV(例如,外泌体)的腔体表面之间的相互作用,它不涉及与膜组分的共价连接。例如,可用于本公开的支架部分可以与EV的腔体表面缔合,例如通过脂质(例如,肉豆蔻酸)和/或与带负电荷的膜磷脂头部静电相互作用的多元结构域。在其他方面,支架部分(例如,支架Y)包含N-末端结构域(ND)和效应结构域(ED),其中ND通过离子相互作用与EV的腔体表面缔合,而ED与EV的腔体表面缔合,其中ED依次包含至少两个、至少三个、至少四个、至少五个、至少六个或至少七个连续的碱性氨基酸,例如赖氨酸(Lys)。

在其他方面,支架部分(例如,支架Y)包含N-末端结构域(ND)和效应结构域(ED),其中ND通过离子相互作用与EV的腔体表面缔合,而ED与EV的腔体表面缔合,其中ED依次包含至少两个、至少三个、至少四个、至少五个、至少六个或至少七个连续的赖氨酸(Lys)。

在其他方面,ED还包含一个或多个低复杂性区域,例如PEST基序。PEST序列是富含脯氨酸(P)、谷氨酸(E)、丝氨酸(S)和苏氨酸(T)的肽序列。在一些方面,ED还包含带负电荷的残基(例如,Glu)和许多经历瞬时磷酸化的Ser和Thr(因此,二者都向ED之外的区域添加负电荷)。

在一些方面,ND通过脂化,例如通过肉豆蔻酰化与EV(例如,外泌体)的腔体表面缔合。在一些方面,ND在N-末端具有Gly。在一些方面,N-末端Gly是肉豆蔻酰化的。

在一些方面,ED通过离子相互作用与EV(例如,外泌体)的腔体表面缔合。在一些方面,ED通过静电相互作用,特别是吸引静电相互作用,与EV(例如,外泌体)的腔体表面缔合。

在一些方面,ED在多肽序列中包含(i)碱性氨基酸(例如,赖氨酸),或(ii)两个或更多个彼此相邻的碱性氨基酸(例如,赖氨酸)。在一些方面,碱性氨基酸是赖氨酸(Lys;K)、精氨酸(Arg,R)或组氨酸(His,H)。在一些方面,碱性氨基酸是(Lys)n,其中n是在1和10之间的整数。

在一些方面,ED包含(i)ED中的赖氨酸重复或(ii)具有ND的赖氨酸重复,例如ND中C-末端的K和ED中N-末端的K,其中ND和ED直接连接,即通过肽键连接。在一些方面,能够连接EV(例如,外泌体)的腔体中的异源性部分(例如,生物活性分子)的氨基酸的最小数量为例如约七至约15、约七至约14、约七至约13、约七至约12、约七至约11、约七至约10、约七至约9或约七至约8个氨基酸片段。

在其他方面,如果ED的N-末端与ND的C-末端的赖氨酸直接连接,即,赖氨酸在ED的N-末端并且与ND的C-末端的赖氨酸融合,则ED至少包含赖氨酸,并且ND包含C-末端的赖氨酸ED。在其他方面,当ED的N-末端与ND的C-末端通过接头(例如,一个或多个氨基酸)连接时,ED包含至少两个赖氨酸、至少三个赖氨酸、至少四个赖氨酸、至少五个赖氨酸、至少六个赖氨酸或至少七个赖氨酸。在一些方面,ED依次包含至少两个连续的赖氨酸(Lys)。

在一些方面,ED包含K、KK、KKK、KKKK(SEQ ID NO:11)、KKKKK(SEQ ID NO:12)、R、RR、RRR、RRRR(SEQ ID NO:13);RRRRR(SEQ ID NO:14)、KR、RK、KKR、KRK、RKK、KRR、RRK、(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:15)、(K/R)(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:16)或它们的任何组合。在一些方面,ED包含KK、KKK、KKKK(SEQ ID NO:11)、KKKKK(SEQ ID NO:12)或它们的任何组合。在一些方面,ND包含如G:X2:X3:X4:X5:X6中所示的氨基酸序列,其中G代表Gly;其中“:”代表肽键;其中X2至X6中的每个独立地代表氨基酸;其中X6代表碱性氨基酸。在一些方面,X6氨基酸选自由以下各项组成的组:Lys、Arg和His。在一些方面,X5氨基酸选自由以下各项组成的组:Pro、Gly、Ala和Ser。在一些方面,X2氨基酸选自由以下各项组成的组:Pro、Gly、Ala和Ser。在一些方面,X4选自由以下各项组成的组:Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Gln和Met。

在一些方面,支架部分(例如,支架Y)包含N-末端结构域(ND)和效应结构域(ED),其中ND包含如G:X2:X3:X4:X5:X6中所示的氨基酸序列,其中G代表Gly;其中“:”代表肽键;其中X2至X6中的每个独立地为氨基酸;其中X6包含碱性氨基酸,并且其中ED通过肽键与X6连接,并且在ED的N-末端包含至少一个赖氨酸。

在一些方面,支架部分(例如,支架Y)的ND包含氨基酸序列G:X2:X3:X4:X5:X6,其中G代表Gly;“:”代表肽键;X2代表选自由Pro、Gly、Ala和Ser组成的组的氨基酸;X3代表任何氨基酸;X4代表选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Gln和Met组成的组的氨基酸;X5代表选自由Pro、Gly、Ala和Ser组成的组的氨基酸;X6代表选自由Lys、Arg和His组成的组的氨基酸。

在一些方面,X3氨基酸选自由以下各项组成的组:Asn、Gln、Ser、Thr、Asp、Glu、Lys、His和Arg。

在一些方面,ND和ED通过接头连接。在一些方面,接头包含一个或多个氨基酸。在一些方面,术语“接头”是指肽或多肽序列(例如,合成肽或多肽序列)或非多肽,例如烷基链。在一些方面,可将两个或更多个接头串联连接。一般来说,接头提供了灵活性或防止/改善了空间障碍。接头通常不被切割;然而,在某些方面,这种切割可以是想要的。因此,在一些方面,接头可包含一个或多个蛋白酶可切割位点,其可以位于接头序列内或接头序列任一端的接头侧翼。当ND和ED通过接头连接时,ED包含至少两个赖氨酸、至少三个赖氨酸、至少四个赖氨酸、至少五个赖氨酸、至少六个赖氨酸或至少七个赖氨酸。可用于连接ND和ED的接头在本说明书的别处公开。

在一些方面,接头是肽接头。在一些方面,肽接头可包含至少约两个、至少约三个、至少约四个、至少约五个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80、至少约85、至少约90、至少约95或至少约100个氨基酸。

在一些方面,接头是甘氨酸/丝氨酸接头。在一些方面,肽接头是根据式[(Gly)n-Ser]m(SEQ ID NO:46)的甘氨酸/丝氨酸接头,其中n是1至100的任何整数,并且m是1至100的任何整数。在其他方面,甘氨酸/丝氨酸接头是根据式[(Gly)x-Sery]z(SEQ ID NO:47)的接头,其中x为1至4的整数,y为0或1,z为1至50的整数。在一些方面,肽接头包含序列Gn(SEQID NO:48),其中n可以为1至100的整数。在一些方面,肽接头可以包含序列(GlyAla)n(SEQID NO:49),其中n为在1和100之间的整数。在其他方面,肽接头可以包含序列(GlyGlySer)n(SEQ ID NO:50),其中n为在1和100之间的整数。

在一些方面,肽接头是合成的,即非天然存在的。在一个方面,肽接头包括肽(或多肽)(例如,天然或非天然存在的肽),其包含将第一线性氨基酸序列与第二线性氨基酸序列连接或遗传融合,所述第一线性氨基酸序列在自然界中与所述第二线性氨基酸序列不是天然连接或遗传融合的。例如,在一个方面,肽接头可包含非天然存在的多肽,其是天然存在的多肽的修饰形式(例如,包含突变诸如添加、取代或缺失)。

在其他方面,肽接头可以包含非天然存在的氨基酸。在另外其他方面,肽接头可包含天然存在的氨基酸,其存在于不存在于自然界的直链序列中。在另外其他,肽接头可以包含天然存在的多肽序列。

在一些方面,支架部分(例如,支架Y)包含ND-ED,其中:ND包含G:X2:X3:X4:X5:X6;其中:G代表Gly;“:”代表肽键;X2代表选自由Pro、Gly、Ala和Ser组成的组的氨基酸;X3代表任何氨基酸;X4代表选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Glu和Met组成的组的氨基酸;X5代表选自由Pro、Gly、Ala和Ser组成的组的氨基酸;X6代表选自由Lys、Arg和His组成的组的氨基酸;“—”代表任选的接头;ED是效应结构域,包含(i)至少两个连续赖氨酸(Lys),它们通过肽键或一个或多个氨基酸与X6连接,或(ii)至少一个赖氨酸,它通过肽键直接连接至X6。

在一些方面,X2氨基酸选自由Gly和Ala组成的组。在一些方面,X3氨基酸是Lys。在一些方面,X4氨基酸是Leu或Glu。在一些方面,X5氨基酸选自由Ser和Ala组成的组。在一些方面,X6氨基酸是Lys。在一些方面,X2氨基酸是Gly、Ala或Ser;X3氨基酸是Lys或Glu;X4氨基酸是Leu、Phe、Ser或Glu;X5氨基酸是Ser或Ala;X6氨基酸是Lys。在一些方面,“—”接头包含肽键或者一个或多个氨基酸。

在一些方面,支架部分中的ED包含Lys(K)、KK、KKK、KKKK(SEQ ID NO:11)、KKKKK(SEQ ID NO:12)、Arg(R)、RR、RRR、RRRR(SEQ ID NO:13);RRRRR(SEQ ID NO:14)、KR、RK、KKR、KRK、RKK、KRR、RRK、(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:15)、(K/R)(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:16)或它们的任何组合。

在一些方面,支架部分(例如,支架Y)包含选自由以下各项组成的组的氨基酸序列:(i)GGKLSKK(SEQ ID NO:17)、(ii)GAKLSKK(SEQ ID NO:18)、(iii)GGKQSKK(SEQ ID NO:19),(iv)GGKLAKK(SEQ ID NO:20),或(v)它们的任何组合。

在一些方面,支架部分(例如,支架Y)中的ND包含选自由以下各项组成的组的氨基酸序列:(i)GGKLSK(SEQ ID NO:51)、(ii)GAKLSK(SEQ ID NO:52)、(iii)GGKQSK(SEQ IDNO:53)、(iv)GGKLAK(SEQ ID NO:54)以及(v)它们的任何组合;并且支架蛋白中的ED包含选自由以下各项组成的组的氨基酸序列:K、KK、KKK、KKKG(SEQ ID NO:55)、KKKGY(SEQ ID NO:56)、KKKGYN(SEQ ID NO:57)、KKKGYNV(SEQ ID NO:58)、KKKGYNVN(SEQ ID NO:59)、KKKGYS(SEQ ID NO:60)、KKKGYG(SEQ ID NO:61)、KKKGYGG(SEQ ID NO:62)、KKKGS(SEQ ID NO:63)、KKKGSG(SEQ ID NO:64)、KKKGSGS(SEQ ID NO:66)、KKKS(SEQ ID NO:67)、KKKSG(SEQID NO:68)、KKKSGG(SEQ ID NO:69)、KKKSGGS(SEQ ID NO:70)、KKKSGGSG(SEQ ID NO:71)、KKSGGSGG(SEQ ID NO:72)、KKKSGGSGGS(SEQ ID NO:73)、KRFSFKKS(SEQ ID NO:241)以及它们的任何组合。

在一些方面,可用于本公开的支架Y的多肽序列由选自由以下各项组成的组的氨基酸序列组成:(i)GGKLSKK(SEQ ID NO:21)、(ii)GAKLSKK(SEQ ID NO:18)、(iii)GGKQSKK(SEQ ID NO:19),(iv)GGKLAKK(SEQ ID NO:20),或(v)它们的任何组合。

在一些方面,支架部分(例如,支架Y)包含选自由以下各项组成的组的氨基酸序列:(i)GGKLSKKK(SEQ ID NO:22)、(ii)GGKLSKKS(SEQ ID NO:23)、(iii)GAKLSKKK(SEQ IDNO:24)、(iv)GAKLSKKS(SEQ ID NO:25)、(v)GGKQSKKK(SEQ ID NO:26)、(vi)GGKQSKKS(SEQID NO:27)、(vii)GGKLAKKK(SEQ ID NO:28)、(viii)GGKLAKKS(SEQ ID NO:29)以及(ix)它们的任何组合。

在一些方面,可用于本公开的支架部分(例如,支架Y)的多肽序列由选自由以下各项组成的组的氨基酸序列组成:(i)GGKLSKKK(SEQ ID NO:22)、(ii)GGKLSKKS(SEQ ID NO:23)、(iii)GAKLSKKK(SEQ ID NO:24)、(iv)GAKLSKKS(SEQ ID NO:25)、(v)GGKQSKKK(SEQ IDNO:26)、(vi)GGKQSKKS(SEQ ID NO:27)、(vii)GGKLAKKK(SEQ ID NO:28)、(viii)GGKLAKKS(SEQ ID NO:29)以及(ix)它们的任何组合。在一些方面,本公开的支架蛋白依次包含至少两个连续的赖氨酸(Lys)。

在一些方面,支架部分(例如,支架Y)的长度为至少约8、至少约9、至少约10、至少约11、至少约12、至少约13、至少约14、至少约15、至少约16、至少约17、至少约18、至少约19、至少约20、至少约21、至少约22、至少约23、至少约24、至少约25、至少约26、至少约27、至少约28、至少约29、至少约30、至少约31、至少约32、至少约33、至少约34、至少约35、至少约36、至少约37、至少约38、至少约39、至少约39、至少约40、至少约41、至少约42、至少约43、至少约44、至少约45、至少约46、至少约47、至少约48、至少约49、至少约50、至少约55、至少约60、至少约65、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95、至少约100、至少约105、至少约110、至少约115、至少约120、至少约125、至少约130、至少约135、至少约140、至少约145、至少约150、至少约155、至少约160、至少约165、至少约170、至少约175、至少约180、至少约185、至少约190、至少约195、至少约200、至少约205、至少约210、至少约215、至少约220、至少约225、至少约230、至少约235、至少约240、至少约245、至少约250、至少约255、至少约260、至少约265、至少约270、至少约275、至少约280、至少约285、至少约290、至少约295、至少约300、至少约305、至少约310、至少约315、至少约320、至少约325、至少约330、至少约335、至少约340、至少约345或至少约350个氨基酸。

在一些方面,支架部分(例如,支架Y)的长度在约5和约10个氨基酸之间、在约10和约20个氨基酸之间、在约20和约30个氨基酸之间、在约30和约40个氨基酸之间、在约40和约50个氨基酸之间、在约50和约60个氨基酸之间、在约60和约70个氨基酸之间、在约70和约80个氨基酸之间、在约80和约90个氨基酸之间、在约90和约100个氨基酸之间、在约100和约110个氨基酸之间、在约110和约120个氨基酸之间、在约120和约130个氨基酸之间、在约130和约140个氨基酸之间、在约140和约150个氨基酸之间、在约150和约160个氨基酸之间、在约160和约170个氨基酸之间、在约170和约180个氨基酸之间、在约180和约190个氨基酸之间、在约190和约200个氨基酸之间、在约200和约210个氨基酸之间、在约210和约220个氨基酸之间、在约220和约230个氨基酸之间、在约230和约240个氨基酸之间、在约240和约250个氨基酸之间、在约250和约260个氨基酸之间、在约260和约270个氨基酸之间、在约270和约280个氨基酸之间、在约280和约290个氨基酸之间、在约290和约300个氨基酸之间、在约300和约310个氨基酸之间、在约310和约320个氨基酸之间、在约320和约330个氨基酸之间、在约330和约340个氨基酸之间或者在约340和约250个氨基酸之间。

在一些方面,支架部分(例如,支架Y)包含(i)GGKLSKKKKGYNVN(SEQ ID NO:32)、(ii)GAKLSKKKKGYNVN(SEQ ID NO:33)、(iii)GGKQSKKKKGYNVN(SEQ ID NO:34)、(iv)GGKLAKKKKGYNVN(SEQ ID NO:35)、(v)GGKLSKKKKGYSGG(SEQ ID NO:36)、(vi)GGKLSKKKKGSGGS(SEQ ID NO:37)、(vii)GGKLSKKKKSGGSG(SEQ ID NO:38)、(viii)GGKLSKKKSGGSGG(SEQ ID NO:39)、(ix)GGKLSKKSGGSGGS(SEQ ID NO:40)、(x)GGKLSKSGGSGGSV(SEQ ID NO:41)或(xi)GAKKSKKRFSFKKS(SEQ ID NO:42)。

在一些方面,用于本公开的支架部分(例如,支架Y)的多肽序列由(i)GGKLSKKKKGYNVN(SEQ ID NO:32)、(ii)GAKLSKKKKGYNVN(SEQ ID NO:33)、(iii)GGKQSKKKKGYNVN(SEQ ID NO:34)、(iv)GGKLAKKKKGYNVN(SEQ ID NO:35)、(v)GGKLSKKKKGYSGG(SEQ ID NO:36)、(vi)GGKLSKKKKGSGGS(SEQ ID NO:37)、(vii)GGKLSKKKKSGGSG(SEQ ID NO:38)、(viii)GGKLSKKKSGGSGG(SEQ ID NO:39)、(ix)GGKLSKKSGGSGGS(SEQ ID NO:40)、(x)GGKLSKSGGSGGSV(SEQ ID NO:41)或(xi)GAKKSKKRFSFKKS(SEQ ID NO:42)组成。

下面列出了可用于本公开的支架部分(例如,支架Y)的非限制性实例。在一些方面,支架部分(例如,支架Y)包含表4中列出的氨基酸序列组。在一些方面,支架部分(例如,支架Y)由表4中列出的氨基酸序列组组成。

表4.示例性支架部分

在一些方面,可用于本公开的支架部分(例如,支架Y)不包含N-末端Met。在一些方面,支架部分(例如,支架Y)在支架蛋白的N-末端包含脂化的氨基酸,例如肉豆蔻酰化的氨基酸,它可用作脂质。在一些方面,支架蛋白的N-末端的氨基酸残基是Gly。N-末端甘氨酸的存在是N-肉豆蔻酰化的绝对要求。在一些方面,支架蛋白的N-末端的氨基酸残基是合成的。在一些方面,支架蛋白的N-末端的氨基酸残基是甘氨酸类似物,例如烯丙基甘氨酸、丁基甘氨酸或炔丙基甘氨酸。

在其他方面,脂质可以是本领域已知的任何脂质,例如棕榈酸或糖基磷脂酰肌醇。在不寻常的情况下,例如,通过使用限制肉豆蔻酸的培养基,一些其他脂肪酸,包括短链和不饱和脂肪酸,可以连接至N-末端甘氨酸。例如,在BK通道中,据报道肉豆蔻酸酯在翻译后通过羟基酯键连接至内部丝氨酸/苏氨酸或酪氨酸残基。可用作本领域已知的支架部分的膜部分列于下表中。

表5:修饰基团

II.G.3支架蛋白融合构建体

在一些方面,支架部分与一个或多个异源性蛋白连接。一个或多个异源性蛋白可以连接至支架部分的N-末端。一个或多个异源性蛋白可以连接至支架部分的C-末端。在一些方面,一个或多个异源性蛋白与支架部分的N-末端和C-末端连接。在一些方面,异源性蛋白是哺乳动物蛋白。在一些方面,异源性蛋白是人类蛋白。

在一些方面,支架部分可用于将任何部分连接至外泌体的腔体表面和/或外表面。例如,除了EV(例如,外泌体)的外表面之外,PTGFRN多肽还可用于连接腔体内部(例如,腔体表面上)的生物活性分子。因此,在某些方面,支架部分可用于双重目的,例如,EV(例如,外泌体)的腔体表面上的生物活性分子和外表面上的第二生物活性分子或其他有效负载,或者外泌体的外表面上的生物活性分子和EV(例如,外泌体)的腔体表面上的第二生物活性分子或其他有效负载。

II.G.4脂质

能够通过与马来酰亚胺部分的化学连接将生物活性分子连接至EV(例如,外泌体)表面的合适的支架部分包括例如甾醇(例如,胆固醇)、磷脂、溶血磷脂、脂肪酸或脂溶性维生素,如下文所详述。

在一些方面,支架部分可以是脂质。脂质支架部分可以是本领域已知的任何脂质,例如棕榈酸或糖基磷脂酰肌醇。在一些方面,脂质是脂肪酸、磷脂、磷脂(例如,磷脂酰胆碱、磷脂酰丝氨酸或磷脂酰乙醇胺)或它们的类似物(例如,磷脂酰胆碱、卵磷脂、磷脂酰乙醇胺、脑磷脂或磷脂酰丝氨酸或者它们的类似物或部分,诸如它们的部分水解的部分)。

支架部分可以使用马来酰亚胺部分连接(例如,化学连接)至生物活性分子。这种连接可以是直接或间接通过接头或接头组合,在任何化学上可行的位置,例如在例如生物活性分子(例如,ASO)的核苷酸序列的5’和/或3’末端的连接。在一个方面,支架部分仅连接(例如,经由马来酰亚胺部分化学连接)至生物活性分子的3'末端。在一个方面,支架部分仅连接(例如,经由马来酰亚胺部分化学连接)至例如生物活性分子(例如,ASO)的核苷酸序列的5'末端。在一个方面,支架部分既不在例如生物活性分子(例如,ASO)的核苷酸序列的3’末端的位置处也不在5’末端的位置处连接(例如,经由马来酰亚胺部分化学连接)。

在一些方面,生物活性分子可以连接(例如,经由马来酰亚胺部分化学连接),经由接头直接或间接连接至例如上文公开的任何脂质(例如,棕榈酸、肉豆蔻酸、脂肪酸、法呢基、香叶基-香叶基或胆固醇)。在一些方面,支架部分可包含本文公开的两种或更多种类型的支架部分。例如,在一些方面,支架部分可以包含两种脂质,例如,一种磷脂和一种脂肪酸,或两种磷脂,或两种脂肪酸,或一种脂质和一种维生素,或一种胆固醇和一种维生素等。它们共同具有6-80个碳原子(即,约6至约80的当量碳数(ECN))。

在一些方面,支架部分的组合,例如,脂质(例如,脂肪酸)的组合具有的ECN为约6至约80、约8至约80、约10至约80、约12至约80、约14至约80、约16至约80、约18至约80、约20至约80、约22至约80、约24至约80、约26至约80、约28至约80、约30至约80、约4至约76、约6至约76、约8至约76、约10至约76、约12至约76、约14至约76、约16至约76、约18至约76、约20至约76、约22至约76、约24至约76、约26至约76、约28至约76、约30至约76、约6至约72、约8至约72、约10至约72、约12至约72、约14至约72、约16至约72、约18至约72、约20至约72、约22至约72、约24至约72、约26至约72、约28至约72、约30至约72、约6至约68、约8至约68、约10至约68、约12至约68、约14至约68、约16至约68、1约8至约68、约20至约68、约22至约68、约24至约68、约26至约68、约28至约68、约30至约68、约6至约64、约8至约64、约10至约64、约12至约64、约14至约64、约16至约64、约18至约64、约20至约64、约22至约64、约24至约64、约26至约64、约28至约64、约30至约64、约6至约60、约8至约60、约10至约60、约12至约56、约14至约56、约16至约56、约18至约56、约20至约56、约22至约56、约24至约56、约26至约56、约28至约56、约30至约56、约6至约52、约8至约52、约10至约52、约12至约52、约14至约52、约16至约52、约18至约52、约20至约52、约22至约52、约24至约52、约26至约52、约28至约52、约30至约52、约6至约48、约8至约48、约10至约48、约12至约48、约14至约48、1约6至约48、1约8至约48、约20至约48、2约2至约48、约24至约48、约26至约48、约28至约48、约30至约48、约6至约44、约8至约44、约10至约44、约12至约44、约14至约44、约16至约44、约18至约44、约20至约44、约22至约44、约24至约44、2约6至约44、约28至约44、约30至约44、约6至约40、约8至约40、约10至约40、约12至约40、约14至约40、约16至约40、约18至约40、约20至约40、2约2至约40、约24至约40、约26至约40、2约8至约40、约30至约40、约6至约36、约8至约36、约10至约36、约12至约36、约14至约36、约16至约36、约18至约36、约20至约36、约22至约36、约24至约36、约26至约36、约28至约36、约30至约36、约6至约32、约8至约32、1约0至约32、约12至约32、约14至约32、1约6至约32、1约8至约32、约20至约32、约22至约32、约24至约32、约26至约32、28至约32或约30至约32。

II.G.3.a胆固醇和其他甾醇

在一些方面,支架部分包含甾醇、类固醇、藿烷、羟基类固醇、开环甾体或它们的具有亲脂性的类似物。在一些方面,支架部分包含甾醇,诸如植物甾醇、霉菌甾醇或动物甾醇。示例性动物甾醇包括胆固醇和24S-羟基胆固醇;示例性植物甾醇包括麦角甾醇(mycosterol)、菜油甾醇、谷甾醇和豆甾醇。在一些方面,甾醇选自麦角甾醇、7-脱氢胆固醇、胆固醇、24S-羟基胆固醇、羊毛甾醇、环木蒿醇、岩藻甾醇、沙林甾醇、菜油甾醇、β-谷甾醇、谷甾烷醇、粪甾烷醇、燕麦甾醇或豆甾醇。甾醇可以以游离甾醇、酰化(甾醇酯)、烷基化(甾醇烷基醚)、硫酸化(甾醇硫酸盐)存在或连接至糖苷部分(甾醇糖苷),糖苷部分本身可以被酰化(酰化甾醇糖苷)。

在一些方面,支架部分包含类固醇。在一些方面,类固醇选自二氢睾酮、乌苏醇、龙舌兰皂苷配基、薯蓣皂苷配基、黄体酮或皮质醇。

例如,甾醇可以直接或通过在甾醇的可用的-OH基团处的接头组合与生物活性分子缀合。示例性甾醇具有如下所示的一般骨架:

作为另一个实例,麦角甾醇具有以下结构:

胆固醇具有以下结构:

因此,在一些方面,甾醇或类固醇的游离—OH基团用于将生物活性分子(例如,ASO)直接或通过接头组合缀合至甾醇(例如,胆固醇)或类固醇。

II.G.3.b脂肪酸

在一些方面,支架部分包含脂肪酸。在一些方面,脂肪酸是短链、中链或长链脂肪酸。在一些方面,脂肪酸是饱和脂肪酸。在一些方面,脂肪酸是不饱和脂肪酸。在一些方面,脂肪酸是单不饱和脂肪酸。在一些方面,脂肪酸是多不饱和脂肪酸,诸如ω-3(omega-3)或ω-6(omega-6)脂肪酸。

在一些方面,脂质(例如,脂肪酸)具有C2-C60链。在一些方面,脂质(例如,脂肪酸)具有C2-C28链。在一些方面,脂肪酸具有C2-C40链。在一些方面,脂肪酸具有C2-C12或C4-C12链。在一些方面,脂肪酸具有C4-C40链。在一些方面,脂肪酸具有C4-C40、C2-C38、C2-C36、C2-C34、C2-C32、C2-C30、C4-C30、C2-C28、C4-C28、C2-C26、C4-C26、C2-C24、C4-C24、C6-C24、C8-C24、C10-C24、C2-C22、C4-C22、C6-C22、C8-C22、C10-C22、C2-C20、C4-C20、C6-C20、C8-C20、C10-C20、C2-C18、C4-C18、C6-C18、C8-C18、C10-C18、C12-C18、C14-C18、C16-C18、C2-C16、C4-C16、C6-C16、C8-C16、C10-C16、C12-C16、C14-C16、C2-C15、C4-C15、C6-C15、C8-C15、C9-C15、C10-C15、C11-C15、C12-C15、C13-C15、C2-C14、C4-C14、C6-C14、C8-C14、C9-C14、C10-C14、C11-C14、C12-C14、C2-C13、C4-C13、C6-C13、C7-C13、C8-C13、C9-C13、C10-C13、C10-C13、C11-C13、C2-C12、C4-C12、C6-C12、C7-C12、C8-C12、C9-C12、C10-C12、C2-C11、C4-C11、C6-C11、C7-C11、C8-C11、C9-C11、C2-C10、C4-C10、C2-C9、C4-C9、C2-C8、C2-C7、C4-C7、C2-C6或C4-C6链。在一些方面,脂肪酸具有C2、C3、C4、C5、C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25、C26、C27、C28、C29、C30、C31、C32、C33、C34、C35、C36、C37、C38、C39、C40、C41、C42、C43、C44、C45、C46、C47、C48、C49、C50、C51、C52、C53、C54、C55、C56、C57、C58、C59或C60链。

在一些方面,支架部分包含两种脂肪酸,其中每种独立地选自具有含有前述碳原子数范围或数量中的任一者的链的脂肪酸。在一些方面,脂肪酸之一独立地是具有C6-C21链的脂肪酸,并且一种脂肪酸独立地是具有C12-C36链的脂肪酸。在一些方面,每种脂肪酸独立地具有约11、约12、约13、约14、约15、约16、约17或约18个碳原子的链。

合适的脂肪酸包括饱和直链脂肪酸、饱和支链脂肪酸、不饱和脂肪酸、羟基脂肪酸和多元羧酸。在一些方面,此类脂肪酸具有多达约32个碳原子。

可用的饱和直链脂肪酸的实例包括具有偶数个碳原子的那些,诸如丁酸、己酸、辛酸、癸酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸、花生酸、山萮酸、木蜡酸、二十六碳酸、二十八碳酸、三十碳酸和正三十二碳酸,以及具有奇数个碳原子的那些,诸如丙酸、正戊酸、庚酸、壬酸、十一碳酸、十三碳酸、十五碳酸、十七碳酸、十九碳酸、二十一碳酸、二十三碳酸、二十五碳酸和二十七碳酸。

合适的饱和支链脂肪酸的实例包括异丁酸、异己酸、异辛酸、异癸酸、异月桂酸、11-甲基十二碳酸、异肉豆蔻酸、13-甲基-十四碳酸、异棕榈酸、15-甲基-十六碳酸、异硬脂酸、17-甲基十八碳酸、异花生酸、19-甲基-二十碳酸、α-乙基-己酸、α-己基癸酸、α-庚基十一碳酸、2-癸基十四碳酸、2-十一烷基十四碳酸、2-癸基十五碳酸、2-十一烷基十五碳酸和Fine oxocol 1800acid(Nissan Chemical Industries,Ltd.的产品)。合适的饱和奇数碳支链脂肪酸包括以异丁基封端的反异脂肪酸,诸如6-甲基-辛酸、8-甲基-癸酸、10-甲基-十二碳酸、12-甲基-十四碳酸、14-甲基-十六碳酸、16-甲基-十八碳酸、18-甲基-二十碳酸、20-甲基-二十二碳酸、22-甲基-二十四碳酸、24-甲基-二十六碳酸和26-甲基-二十八碳酸。

合适的不饱和脂肪酸的实例包括4-癸烯酸、己酸、4-十二碳烯酸、5-十二碳烯酸、月桂油酸、4-十四碳烯酸、5-十四碳烯酸、9-十四碳烯酸、棕榈油酸、6-十八碳烯酸、油酸、9-十八碳烯酸、11-十八碳烯酸、9-二十碳烯酸、顺-11-二十碳烯酸、鲸蜡油酸、13-二十二碳烯酸、15-二十四碳烯酸、17-二十六碳烯酸、6,9,12,15-十六碳四烯酸、亚油酸、亚麻酸、α-桐酸、β-桐酸、石榴酸、6,9,12,15-十八碳四烯酸、十八碳四烯酸、5,8,11,14-二十碳四烯酸、5,8,11,14,17-二十碳五烯酸、7,10,13,16,19-二十二碳五烯酸、4,7,10,13,16,19-二十二碳六烯酸等。

合适的羟基脂肪酸的实例包括α-羟基月桂酸、α-羟基肉豆蔻酸、α-羟基棕榈酸、α-羟基硬脂酸、ω-羟基月桂酸、α-羟基花生酸、9-羟基-12-十八碳烯酸、蓖麻油酸、α-羟基二十二碳酸、9-羟基-反式-10,12-十八碳二烯酸、甘草酸、异丙酸、9,10-二羟基硬脂酸、12-羟基硬脂酸等。

合适的多元羧酸的实例包括草酸、丙二酸、琥珀酸、戊二酸、己二酸、庚二酸、辛二酸、壬二酸、癸二酸、D,L-苹果酸等。

在一些方面,每种脂肪酸独立地选自丙酸、丁酸、戊酸、己酸、庚酸、辛酸、壬酸、癸酸、十一碳酸、月桂酸、十三碳酸、肉豆蔻酸、十五碳酸、棕榈酸、十七碳酸、硬脂酸、十九碳酸、花生酸、二十二碳酸、山萮酸、二十三碳酸、木蜡酸、二十五碳酸、蜡酸、二十七碳酸、褐煤酸、二十九碳酸、蜂花酸、三十一碳酸、木香酸、三十三碳酸、蜡质酸、三十六碳酸、三十七碳酸或三十八碳酸。

在一些方面,每种脂肪酸独立地选自α-亚麻酸、十八碳四烯酸、二十碳五烯酸、二十二碳六烯酸、亚油酸、γ-亚油酸、二高-γ-亚油酸、花生四烯酸、二十二碳四烯酸、棕榈油酸、异油酸、桐酸、油酸、反油酸、二十碳烯酸、芥酸、神经酸、米德酸、肾上腺素酸、伯色五烯酸、奧佐朋德酸、沙丁鱼酸、鲱鱼酸、二十二碳六烯酸或二十四醇五烯酸或者其他单不饱和或多不饱和脂肪酸。

在一些方面,一种或两种脂肪酸是必需脂肪酸。鉴于某些必需脂肪酸的有益健康作用,可通过在治疗剂中包含此类脂肪酸来增加所公开的负载治疗剂的外泌体的治疗益处。在一些方面,必需脂肪酸是选自由以下各项组成的组的n-6或n-3必需脂肪酸:亚麻酸、γ-亚麻酸、二高-γ-亚麻酸、花生四烯酸、肾上腺素酸、二十二碳五烯n-6酸、α-亚麻酸、硬脂酸、20:4n-3酸、二十碳五烯酸、二十二碳五烯n-3酸或二十二碳六烯酸。

在一些方面,每种脂肪酸独立地选自全顺-7,10,13-十六碳三烯酸、α-亚麻酸、十八碳四烯酸、二十碳三烯酸、二十碳四烯酸、二十碳五烯酸(EPA)、二十二碳五烯酸、二十二碳六烯酸(DHA)、二十四碳五烯酸、二十四碳六烯酸或硫辛酸。在其他方面,脂肪酸选自二十碳五烯酸、二十二碳六烯酸或硫辛酸。脂肪酸的其他实例包括全顺-7,10,13-十六碳三烯酸、α-亚麻酸(ALA或全顺-9,12,15-十八碳三烯酸)、硬脂酸(STD或全顺-6,9,12,15-十八碳四烯酸)、二十碳三烯酸(ETE或全顺-11,14,17-二十碳三烯酸)、二十碳四烯酸(ETA或全顺-8,11,14,17-二十碳四烯酸)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA、二十二碳五烯酸或全顺-7,10,13,16,19-二十二碳五烯酸)、二十二碳六烯酸(DHA或全顺-4,7,10,13,16,19-二十二碳六烯酸)、二十碳五烯酸(全顺-9,12,15,18,21-二十二碳六烯酸)或二十二碳六烯酸(壬二酸或全顺-6,9,12,15,18,21-二十四碳烯酸)。在一些方面,脂肪酸是中链脂肪酸,诸如硫辛酸。

脂肪酸链的链长差异很大,可以根据链长进行分类,例如从短到很长。短链脂肪酸(SCFA)是具有约五个或更少个碳链的脂肪酸(例如,丁酸)。在一些方面,脂肪酸是SCFA。中链脂肪酸(MCFA)包括具有约6-12个碳链的脂肪酸,可形成中链甘油三酯。在一些方面,脂肪酸是MCFA。长链脂肪酸(LCFA)包括具有13-21个碳链的脂肪酸。在一些方面,脂肪酸是LCFA。在一些方面,脂肪酸是LCFA。极长链脂肪酸(VLCFA)包括具有22个或更多个碳链的脂肪酸,诸如在约22和约60之间、在约22和约50之间、或在约22和约40之间。在一些方面,脂肪酸是VLCFA。

II.G.3.c磷脂

在一些方面,支架部分包含磷脂。磷脂是一类作为所有细胞膜的主要组分的脂质。由于它们的两亲特征,它们可以形成脂质双层。磷脂分子的结构一般由两个疏水性脂肪酸“尾部”和一个由磷酸基团组成的亲水性“头部”组成。例如,磷脂可以是根据下式的脂质:

其中Rp代表磷脂部分,R1和R2代表具有或不具有相同或不同不饱和度的脂肪酸部分。

磷脂部分可以选自例如由磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰甘油、磷脂酰丝氨酸、磷脂酸、2-溶血磷脂酰胆碱和鞘磷脂组成的非限制性组。

特定的磷脂可以促进与脂质双层的融合,例如,外泌体膜的脂质双层。例如,阳离子磷脂可以与膜的一种或多种带负电荷的磷脂相互作用。磷脂与膜的融合可允许含脂质组合物的一种或多种组分与膜结合或穿过膜。

脂肪酸部分可以选自例如由月桂酸、肉豆蔻酸、肉豆蔻油酸、棕榈酸、棕榈油酸、硬脂酸、油酸、亚油酸、α-亚麻酸、芥酸、植烷酸、花生酸、花生四烯酸、二十碳五烯酸、山萮酸、二十二碳五烯酸和二十二碳六烯酸组成的非限制性组。

在本公开中用作支架部分的磷脂可以是天然或非天然磷脂。还设想了非天然磷脂种类,它包括具有修饰和取代的天然种类,包括支链、氧化、环化和炔烃。例如,磷脂可以用一种或多种炔烃(例如,其中一个或多个双键被三键取代的烯基)官能化或交联。在适当的反应条件下,炔基基团可以在暴露于叠氮化物时发生铜催化的环加成反应。

磷脂包括但不限于甘油磷脂,诸如磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷脂酰甘油和磷脂酸。

可用于本文公开的支架部分的磷脂的实例包括

·磷脂酰乙醇胺:例如,二月桂酰磷脂酰乙醇胺、二肉豆蔻酰磷脂酰乙醇胺、二棕榈酰磷脂酰乙醇胺、二硬脂酰磷脂酰乙醇胺、二油酰磷脂酰乙醇胺、1-棕榈酰-2-油酰磷脂酰乙醇胺、1-油酰-2棕榈酰磷脂酰乙醇胺和二芥酸酰磷脂酰乙醇胺;

·磷脂酰甘油:例如,二月桂酰磷脂酰甘油、二肉豆蔻酰磷脂酰甘油、二棕榈酰磷脂酰甘油、二硬脂酰磷脂酰甘油、二油酰磷脂酰甘油、1-棕榈酰-2-油酰-磷脂酰甘油、1-油酰-2-棕榈酰-磷脂酰甘油和二芥酸酰磷脂酰甘油;

·磷脂酰丝氨酸:例如,二月桂酰磷脂酰丝氨酸、二肉豆蔻酰磷脂酰丝氨酸、二棕榈酰磷脂酰丝氨酸、二硬脂酰磷脂酰丝氨酸、二油酰磷脂酰丝氨酸、1-棕榈酰-2-油酰-磷脂酰丝氨酸、1-油酰-2-棕榈酰-磷脂酰丝氨酸和二芥酸酰磷脂酰丝氨酸;

·磷脂酸:例如,二月桂酰磷脂酸、二肉豆蔻酰磷脂酸、二棕榈酰磷脂酸、二硬脂酰磷脂酸、二油酰磷脂酸、1-棕榈酰-2-油酰磷脂酸、1-油酰-2-棕榈酰磷脂酸和二芥酸酰磷脂酸;以及

·磷脂酰肌醇:例如,二月桂酰磷脂酰肌醇、二肉豆蔻酰磷脂酰肌醇、二棕榈酰磷脂酰肌醇、二硬脂酰磷脂酰肌醇、二油酰磷脂酰肌醇、1-棕榈酰-2-油酰-磷脂酰肌醇、1-油酰-2-棕榈酰磷脂酰肌醇和二芥酸酰磷脂酰肌醇。

磷脂可以是对称的或不对称的类型。如本文所用,术语“对称磷脂”包括具有匹配脂肪酸部分的甘油磷脂和鞘脂,其中可变脂肪酸部分和鞘氨醇主链的烃链包括相当数量的碳原子。如本文所用,术语“不对称磷脂”包括溶血脂、具有不同脂肪酸部分(例如,具有不同碳原子数和/或不饱和度(例如,双键)的脂肪酸部分)的甘油磷脂和鞘脂,其中可变脂肪酸部分和鞘氨醇主链的烃链包括不同数量的碳原子(例如,可变脂肪酸部分包括比烃链多至少两个碳原子或比烃链少至少两个碳原子)。

在一些方面,支架部分包含至少一种对称磷脂。对称磷脂可以选自由以下各项组成的非限制性组:

1,2-二丙酰-sn-甘油-3-磷酸胆碱(03:0 PC)、

1,2-二丁酰-sn-甘油-3-磷酸胆碱(04:0 PC)、

1,2-二戊酰-sn-甘油-3-磷酸胆碱(05:0 PC)、

1,2-二己酰-sn-甘油-3-磷酸胆碱(06:0 PC)、

1,2-二庚酰-sn-甘油-3-磷酸胆碱(07:0 PC)、

1,2-二辛酰-sn-甘油-3-磷酸胆碱(08:0 PC)、

1,2-二壬酰-sn-甘油-3-磷酸胆碱(09:0 PC)、

1,2-二癸酰-sn-甘油-3-磷酸胆碱(10:0 PC)、

1,2-二-十一碳酰-sn-甘油-3-磷酸胆碱(11:0 PC、DUPC)、

1,2-二月桂酰-sn-甘油-3-磷酸胆碱(12:0 PC)、

1,2-二-十三碳酰-sn-甘油-3-磷酸胆碱(13:0 PC)、

1,2-二豆蔻酰-sn-甘油-3-磷酸胆碱(14:0 PC、DMPC)、

1,2-二-十五碳酰-sn-甘油-3-磷酸胆碱(15:0 PC)、

1,2-二棕榈酰-sn-甘油-3-磷酸胆碱(16:0 PC、DPPC)、

1,2-二植烷酰-sn-甘油-3-磷酸胆碱(4ME 16:0 PC)、

1,2-二-十七碳酰-sn-甘油-3-磷酸胆碱(17:0 PC)、

1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(18:0 PC、DSPC)、

1,2-二-十九碳酰-sn-甘油-3-磷酸胆碱(19:0 PC)、

1,2-二花生四烯酰-sn-甘油-3-磷酸胆碱(20:0 PC)、

1,2-二-二十一碳酰-sn-甘油-3-磷酸胆碱(21:0 PC)、

1,2-二-二十二碳酰-sn-甘油-3-磷酸胆碱(22:0 PC)、

1,2-二-二十三碳酰-sn-甘油-3-磷酸胆碱(23:0 PC)、

1,2-二-木蜡酰-sn-甘油-3-磷酸胆碱(24:0 PC)、

1,2-二豆蔻顺油酰-sn-甘油-3-磷酸胆碱(14:1(Δ9-Cis)PC)、

1,2-二豆蔻反油酰-sn-甘油-3-磷酸胆碱(14:1(Δ9-Trans)PC)、

1,2-二棕榈顺油酰-sn-甘油-3-磷酸胆碱(16:1(Δ9-Cis)PC)、

1,2-二棕榈反油酰-sn-甘油-3-磷酸胆碱(16:1(Δ9-Trans)PC)、

1,2-二石油烯酰-sn-甘油-3-磷酸胆碱(18:1(Δ6-Cis)PC)、

1,2-二顺油酰-sn-甘油-3-磷酸胆碱(18:1(Δ9-Cis)PC、DOPC)、

1,2-二反油酰-sn-甘油-3-磷酸胆碱(18:1(Δ9-Trans)PC)、

1,2-二亚油酰-sn-甘油-3-磷酸胆碱(18:2(Cis)PC、DLPC)、

1,2-二亚油烯酰-sn-甘油-3-磷酸胆碱(18:3(Cis)PC、DLnPC)、

1,2-二-二十碳烯酰-sn-甘油-3-磷酸胆碱(20:1(Cis)PC)、

1,2-二花生四烯酰-sn-甘油-3-磷酸胆碱(20:4(Cis)PC、DAPC)、

1,2-二芥酸酰-sn-甘油-3-磷酸胆碱(22:1(Cis)PC)、

1,2-二-二十二碳六烯酰-sn-甘油-3-磷酸胆碱(22:6(Cis)PC、DHAPC)、

1,2-二神经酰-sn-甘油-3-磷酸胆碱(24:1(Cis)PC)、

1,2-二己酰-sn-甘油-3-磷酸乙醇胺(06:0PE)、

1,2-二辛酰-sn-甘油-3-磷酸乙醇胺(08:0 PE)、

1,2-二癸酰-sn-甘油-3-磷酸乙醇胺(10:0 PE)、

1,2-二月桂酰-sn-甘油-3-磷酸乙醇胺(12:0 PE)、

1,2-二豆蔻酰-sn-甘油-3-磷酸乙醇胺(14:0 PE)、

1,2-二-十五碳酰-sn-甘油-3-磷酸乙醇胺(15:0 PE)、

1,2-二棕榈酰-sn-甘油-3-磷酸乙醇胺(16:0 PE)、

1,2-二植酰-sn-甘油-3-磷酸乙醇胺(4ME 16:0 PE)、

1,2-二-十七碳酰-sn-甘油-3-磷酸乙醇胺(17:0 PE)、

1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺(18:0 PE、DSPE)、

1,2-二棕榈油酰-sn-甘油-3-磷酸乙醇胺(16:1 PE)、

1,2-二顺油酰-sn-甘油-3-磷酸乙醇胺(18:1(Δ9-Cis)PE、DOPE)、

1,2-二反油酰-sn-甘油-3-磷酸乙醇胺(18:1(Δ9-Trans)PE)、

1,2-二亚油酰-sn-甘油-3-磷酸乙醇胺(18:2 PE、DLPE)、

1,2-二亚油烯酰-sn-甘油-3-磷酸乙醇胺(18:3 PE、DLnPE)、

1,2-二花生四烯酰-sn-甘油-3-磷酸乙醇胺(20:4 PE、DAPE)、

1,2-二十二碳六烯酰-sn-甘油-3-磷酸乙醇胺(22:6 PE、DHAPE)、

1,2-二-O-十八碳烯基-sn-甘油-3-磷酸胆碱(18:0 二醚PC)、

1,2-二油酰-sn-甘油-3-磷酸-rac-(1-甘油)钠盐(DOPG)以及它们的任何组合。

在一些方面,支架部分包含至少一种选自由以下各项组成的非限制性组的对称磷脂:DLPC、DMPC、DOPC、DPPC、DSPC、DUPC、18:0二醚PC、DLnPC、DAPC、DHAPC、DOPE、4ME 16:0PE、DSPE、DLPE、DLnPE、DAPE、DHAPE、DOPG以及它们的任何组合。

在一些方面,支架部分包含至少一种不对称磷脂。不对称磷脂可以选自由以下各项组成的非限制性组:

1-豆蔻酰-2-棕榈酰-sn-甘油-3-磷酸胆碱(14:0-16:0 PC、MPPC)、

1-豆蔻酰-2-硬脂酰-sn-甘油-3-磷酸胆碱(14:0-18:0 PC、MSPC)、

1-棕榈酰-2-乙酰-sn-甘油-3-磷酸胆碱(16:0-02:0 PC)、

1-棕榈酰-2-豆蔻酰-sn-甘油-3-磷酸胆碱(16:0-14:0 PC、PMPC)、

1-棕榈酰-2-硬脂酰-sn-甘油-3-磷酸胆碱(16:0-18:0 PC、PSPC)、

1-棕榈酰-2-油酰-sn-甘油-3-磷酸胆碱(16:0-18:1 PC、POPC)、

1-棕榈酰-2-亚油酰-sn-甘油-3-磷酸胆碱(16:0-18:2 PC、PLPC)、

1-棕榈酰-2-花生四烯酰-sn-甘油-3-磷酸胆碱(16:0-20:4 PC)、

1-棕榈酰-2-二十二碳六烯酰-sn-甘油-3-磷酸胆碱(14:0-22:6 PC)、1-硬脂酰-2-肉豆蔻酰-sn-甘油-3-磷酸胆碱(18:0-14:0 PC、SMPC)、1-硬脂酰-2-棕榈酰-sn-甘油-3-磷酸胆碱(18:0-16:0 PC、SPPC)、

1-硬脂酰-2-油酰-sn-甘油-3-磷酸胆碱(18:0-18:1 PC、SOPC)、

1-硬脂酰-2-亚油酰-sn-甘油-3-磷酸胆碱(18:0-18:2 PC)、

1-硬脂酰-2-花生四烯酰-sn-甘油-3-磷酸胆碱(18:0-20:4 PC)、

1-硬脂酰-2-二十二碳六烯酰-sn-甘油-3-磷酸胆碱(18:0-22:6 PC)、

1-油酰-2-豆蔻酰-sn-甘油-3-磷酸胆碱(18:1-14:0 PC、OMPC)、

1-油酰-2-棕榈酰-sn-甘油-3-磷酸胆碱(18:1-16:0 PC、OPPC)、

1-油酰-2-硬脂酰-sn-甘油-3-磷酸胆碱(18:1-18:0 PC、OSPC)、

1-棕榈酰-2-油酰-sn-甘油-3-磷酸乙醇胺(16:0-18:1 PE、POPE)、

1-棕榈酰-2-亚油酰-sn-甘油-3-磷酸乙醇胺(16:0-18:2 PE)、

1-棕榈酰-2-花生四烯酰-sn-甘油-3-磷酸乙醇胺(16:0-20:4 PE)、

1-棕榈酰-2-二十二碳六烯酰-sn-甘油-3-磷酸乙醇胺(16:0-22:6 PE)、

1-硬脂酰-2-油酰-sn-甘油-3-磷酸乙醇胺(18:0-18:1 PE)、

1-硬脂酰-2-亚油酰-sn-甘油-3-磷酸乙醇胺(18:0-18:2 PE)、

1-硬脂酰-2-花生四烯酰-sn-甘油-3-磷酸乙醇胺(18:0-20:4 PE)、

1-硬脂酰-2-二十二碳六烯酰-sn-甘油-3-磷酸乙醇胺(18:0-22:6 PE)、

1-油酰-2-胆固醇半琥珀酰-sn-甘油-3-磷酸胆碱(OChemsPC)以及

它们的任何组合。

为了提供更显著的核酸酶抗性、细胞摄取效率和更显著的RNA干扰效果,可以使用磷脂酰乙醇胺作为支架部分,例如二豆蔻酰磷脂酰乙醇胺、二棕榈酰磷脂酰乙醇胺、1-棕榈酰-2-油酰-磷脂酰乙醇胺和二油酰磷脂酰乙醇胺。

可以根据脂质和接头或生物活性分子的类型适当地选择脂质(例如,磷脂)和接头或生物活性分子(例如,ASO)的结合位点。除脂质疏水基团以外的任何位置都可以通过化学键与接头或生物活性分子连接。例如,当使用磷脂酰乙醇胺时,可以通过在磷脂酰乙醇胺的氨基与接头或生物活性分子之间形成酰胺键等来形成连接。

当使用磷脂酰甘油时,可以通过在甘油残基的羟基与接头或生物活性分子之间形成酯键、醚键等来形成连接。

当使用磷脂酰丝氨酸时,可以通过在丝氨酸残基的氨基或羧基与接头或生物活性分子之间形成酰胺键或酯键等来形成连接。

当使用磷脂酸时,可以通过在磷酸残基和接头或生物活性分子之间形成磷酸酯键等来形成连接。

当使用磷脂酰肌醇时,可以通过在肌醇残基的羟基与接头或生物活性分子之间形成酯键、醚键等来形成连接。

II.G.3.d溶血脂(如溶血磷脂)

在一些方面,支架部分包含溶血脂,例如溶血磷脂。溶血脂是脂质的衍生物,其中一个或两个脂肪酰基链通常通过水解除去。溶血磷脂是磷脂的衍生物,其中一个或两个脂肪酰基链通过水解除去。

在一些方面,支架部分包含上文公开的任何磷脂,其中一个或两个酰基链通过水解除去,因此所得的溶血磷脂包含一个脂肪酸酰基链或不包含脂肪酸酰基链。

在一些方面,支架部分包含溶血甘油磷脂、溶血糖鞘脂、溶血磷脂酰胆碱、溶血磷脂酰乙醇胺、溶血磷脂酰肌醇或溶血磷脂酰丝氨酸。

在一些方面,支架部分包含选自由以下各项组成的非限制性组的溶血脂:

1-己酰-2-羟基-sn-甘油-3-磷酸胆碱(06:0 Lyso PC)、

1-庚酰-2-羟基-sn-甘油-3-磷酸胆碱(07:0 Lyso PC)、

1-辛酰-2-羟基-sn-甘油-3-磷酸胆碱(08:0 Lyso PC)、

1-壬酰-2-羟基-sn-甘油-3-磷酸胆碱(09:0 Lyso PC)、

1-癸酰-2-羟基-sn-甘油-3-磷酸胆碱(10:0 Lyso PC)、

1-十一碳酰-2-羟基-sn-甘油-3-磷酸胆碱(11:0 Lyso PC)、

1-月桂酰-2-羟基-sn-甘油-3-磷酸胆碱(12:0 Lyso PC)、

1-十三碳酰-2-羟基-sn-甘油-3-磷酸胆碱(13:0 Lyso PC)、

1-豆蔻酰-2-羟基-sn-甘油-3-磷酸胆碱(14:0 Lyso PC)、

1-十五碳酰-2-羟基-sn-甘油-3-磷酸胆碱(15:0 Lyso PC)、

1-棕榈酰-2-羟基-sn-甘油-3-磷酸胆碱(16:0 Lyso PC)、

1-十七碳酰-2-羟基-sn-甘油-3-磷酸胆碱(17:0 Lyso PC)、

1-硬脂酰-2-羟基-sn-甘油-3-磷酸胆碱(18:0 Lyso PC)、

1-油酰-2-羟基-sn-甘油-3-磷酸胆碱(18:1 Lyso PC)、

1-十九碳酰-2-羟基-sn-甘油-3-磷酸胆碱(19:0 Lyso PC)、

1-二十碳酰-2-羟基-sn-甘油-3-磷酸胆碱(20:0 Lyso PC)、

1-二十二碳酰-2-羟基-sn-甘油-3-磷酸胆碱(22:0 Lyso PC)、

1-二十四碳酰-2-羟基-sn-甘油-3-磷酸胆碱(24:0 Lyso PC)、

1-二十六碳酰-2-羟基-sn-甘油-3-磷酸胆碱(26:0 Lyso PC)、

1-豆蔻酰-2-羟基-sn-甘油-3-磷酸乙醇胺(14:0 Lyso PE)、

1-棕榈酰-2-羟基-sn-甘油-3-磷酸乙醇胺(16:0 Lyso PE)、

1-硬脂酰-2-羟基-sn-甘油-3-磷酸乙醇胺(18:0 Lyso PE)、

1-油酰-2-羟基-sn-甘油-3-磷酸乙醇胺(18:1 Lyso PE)、

1-十六烷基-sn-甘油-3-磷酸胆碱(C16 Lyso PC)以及

它们的任何组合。

II.G.3.e维生素

在一些方面,支架部分包含亲脂性维生素,例如叶酸、维生素A、维生素E或维生素K。

在一些方面,支架部分包含维生素A。维生素A是一组不饱和营养有机化合物,包括视黄醇、视黄醛、视黄酸和几种维生素A原类胡萝卜素(最显著的是β-胡萝卜素)。在一些方面,支架部分包含视黄醇。在一些方面,支架部分包含类维生素A。类维生素A是一类作为维生素A的同效维生素或与其有化学关系的化合物。在一些方面,支架部分包含第一代类维生素A(例如,视黄醇、维甲酸、异维甲酸或阿利维甲酸)、第二代类维生素A(例如,依维A酯或阿维A酸)、第三代类维生素A(例如,阿达帕林、贝沙罗汀、或他扎罗汀)或它们的任何组合。

第一代类维生素A

视黄醇

第二代类维生素A

依曲替酯

阿曲汀

第三代类维生素A

阿达帕林

贝沙罗汀

他扎罗汀

在一些方面,支架部分包含维生素E。生育酚是一类甲基化酚,其中许多具有维生素E活性。因此,在一些方面,支架部分包含α-生育酚、β-生育酚、γ-生育酚、δ-生育酚或它们的组合。

α生育酚

β生育酚

γ生育酚

δ生育酚

生育三烯酚也具有维生素E活性。生育三烯酚和生育酚之间的关键化学结构差异在于生育三烯酚具有具有三个碳-碳双键的不饱和类异戊二烯侧链,而生育酚的侧链则是饱和的。在一些方面,支架部分包含α-生育三烯酚、β-生育三烯酚、γ-生育三烯酚、δ-生育三烯酚或它们的组合。生育三烯酚可用下式表示

alpha(α)-生育三烯酚:R1=Me,R2=Me,R3=Me;

beta(β)-生育三烯酚:R1=Me,R2=H,R3=Me;

gamma(γ)-生育三烯酚:R1=H,R2=Me,R3=Me;

delta(δ)-生育三烯酚:R1=H,R2=H,R3=Me。

在一些方面,支架部分包含维生素K。在化学上,维生素K家族包含2-甲基-1.4-萘醌(3-)衍生物。维生素K包括两种天然维生素:维生素K1和维生素K2。维生素K1(也称为植物酮二酮、叶绿醌或(E)-植物酮二酮)的结构以存在植基为特征。维生素K2(甲基萘醌)的结构以分子中存在的聚异戊二烯基侧链为标志,所述侧链可包含六至13个异戊二烯基单元。因此,维生素K2由许多相关的化学亚型组成,具有由类异戊二烯原子基团构成的不同长度的碳侧链。MK-4是最常见的维生素K2形式。长链形式,诸如MK-7、MK-8和MK-9在发酵食品中占主导地位。较长链形式的维生素K2(诸如MK-10至MK-13)是由细菌合成的,但它们吸收不好,几乎没有生物学功能。除天然形式的维生素K外,还有多种合成形式的维生素K,诸如维生素K3(甲萘醌;2-甲基萘-1,4-二酮)、维生素K4和维生素K5

因此,在一些方面,支架部分包含维生素K1、K2(例如,MK-4、MK-5、MK-6、MK-7、MK-8、MK-9、MK-10、MK-11、MK-12或MK-13)、K3、K4、K5或它们的任何组合。

II.G.5化学诱导的二聚体

在一些方面,支架部分(例如,支架蛋白)连接至化学诱导的二聚体的结合配偶体。在某些方面,支架部分(例如,支架蛋白)与化学诱导的二聚体的结合配偶体连接,并且生物活性分子连接至相应的结合配偶体。在这些方面,支架部分(例如,支架蛋白)和生物活性分子在诱导结合配偶体二聚化的化学物质的存在下彼此结合。在一些方面,结合配偶体连接至支架部分的N-末端。在一些方面,结合配偶体连接至支架部分(例如,支架蛋白)的C-末端。在一些方面,结合配偶体连接至支架部分(例如,支架蛋白)的腔体结构域。

在某些方面,支架部分(例如,支架蛋白)连接至亲和剂。在一些方面,亲和剂连接至支架部分(例如,支架蛋白)的N-末端。在一些方面,亲和剂连接至支架部分(例如,支架蛋白)的C-末端。在一些方面,亲和剂连接至支架部分(例如,支架蛋白)的腔体结构域。在一些方面,亲和剂包含能够结合至生物活性分子的多肽。在一些方面,亲和剂包含受体。在一些方面,亲和剂包含抗体或抗原结合结构域,如本文所公开。在一些方面,亲和剂结合至一种或多种生物活性分子。

在一些方面,亲和剂和生物活性分子之间的相互作用是瞬时的。在一些方面,生物活性分子在某些条件下与亲和剂解离。在某些方面,亲和剂对生物活性分子的亲和力取决于pH。在一些方面,生物活性分子在至少约3、至少约4、至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约11或至少约12的pH下从亲和剂解离。在一些方面,亲和剂对生物活性分子的亲和力取决于包含生物活性分子和亲和剂的溶液中的钙、镁、硫酸盐、磷酸盐或它们的任何组合的浓度。在一些方面,亲和剂对生物活性分子的亲和力取决于包含生物活性分子和亲和剂的溶液的盐浓度和/或离子强度。在一些方面,生物活性分子和亲和剂在还原条件下是可解离的。

在一些方面,支架部分(例如,支架蛋白)与可结合至生物活性分子的多肽连接。在一些方面,结合多肽连接至支架部分(例如,支架蛋白)的N-末端。在一些方面,结合多肽连接至支架部分(例如,支架蛋白)的C-末端。在一些方面,结合多肽连接至支架部分(例如,支架蛋白)的腔体结构域

在一些方面,结合多肽包含抗原结合结构域。在一些方面,抗原结合结构域包含抗体的抗原结合片段。在一些方面,抗原结合结构域包含单链抗体或其抗原结合片段。在一些方面,抗原结合结构域包含人源化抗体或其抗原结合片段。在一些方面,抗原结合结构域包含鼠抗体或其抗原结合片段。在一些方面,抗原结合结构域包含嵌合抗体(例如,小鼠-人、小鼠-灵长类或灵长类-人单克隆抗体)或其抗原结合片段。在一些方面,抗原结合结构域包含骆驼科动物抗体、鲨鱼IgNAR或抗独特型抗体的抗原结合片段。在一些方面,抗原结合结构域包含骆驼科动物抗体或其抗原结合片段。在一些方面,抗原结合结构域包含鲨鱼IgNAR或其抗原结合片段。在一些方面,抗原结合结构域包含抗独特型抗体或其抗原结合片段。

在一些方面,抗原结合结构域包含单链抗体。在一些方面,抗原结合结构域包含scFv。在一些方面,抗原结合结构域包含(scFv)2。在一些方面,抗原结合结构域包含Fab。在一些方面,抗原结合结构域包含Fab'。在一些方面,抗原结合结构域包含F(ab')2。在一些方面,抗原结合结构域包含F(ab1)2。在一些方面,抗原结合结构域包含Fv。在一些方面,抗原结合结构域包含dAb。在一些方面,抗原结合结构域包含单链Fab。在一些方面,抗原结合结构域包含Fd片段。

在一些方面,抗原结合结构域包含双体。在一些方面,抗原结合结构域包含微型抗体。在一些方面,抗原结合结构域包含抗体相关多肽。在特定方面,抗原结合结构域包含纳米抗体。

在一些方面,支架部分(例如,支架蛋白)与Fc受体连接,并且生物活性分子与Fc连接。在某些方面,Fc受体是选自Fcγ受体I(FcγR1)、FcγRIIA、FcγIIB、FcγIIIA和FcγIIIB的Fcγ受体;Fc是IgG的Fc。在某些方面,Fc受体是FcγR1,Fc是IgG的Fc。在一些方面,Fc受体是Fcα受体I(FcαR1),并且其中Fc是IgA的Fc。在一些方面,Fc受体是选自Fcε受体I(FcεRI)和FcεRII的Fcε受体,并且其中Fc是IgE的Fc。

在一些方面,支架部分(例如,支架蛋白)连接至纳米抗体;并且生物活性分子连接免疫球蛋白恒定区(Fc)。在某些方面,纳米抗体与Fc特异性结合。

III.制备方法

本公开的EV(例如,外泌体)可以通过化学合成、重组DNA技术、较大分子的生物化学或酶促片段化、上述的组合或通过任何其它方法来生产。在一个方面,本公开提供了一种将生物活性分子与EV(例如,外泌体)缀合的方法。所述方法包括通过如上所述的马来酰亚胺部分将生物活性分子连接至EV(例如,外泌体)。

除胺反应性化合物外,那些具有与巯基(-SH)形成键的化学基团的化合物是蛋白质和其他生物缀合技术最常见的交联剂和修饰试剂。巯基,也称为硫醇,存在于蛋白质中的半胱氨酸(Cys,C)氨基酸的侧链中。半胱氨酸巯基对通常通过多肽链内或多肽链之间的二硫键(–S–S–)连接,作为天然三级或四级蛋白质结构的基础。通常,只有游离或还原的巯基(-SH)[而不是二硫键中的硫原子]可用于与硫醇反应性化合物反应。

巯基是蛋白质缀合和标记的有用靶标。首先,巯基存在于大多数蛋白质中,但不如伯胺多;因此,通过巯基进行交联更具选择性和精确性。其次,蛋白质中的巯基通常与二硫键有关,因此这些位点的交联通常不会显著改变潜在的蛋白质结构或阻断结合位点。第三,可用的(即,游离的)巯基的数量可以很容易地控制或修改;它们可以通过天然二硫键的还原产生,也可以通过使用巯基加成试剂(诸如,2-亚氨基硫醇(Traut试剂)、SATA、SATP或SAT(PEG))与伯胺反应而引入分子中。最后,将巯基反应性基团与胺反应性基团组合以制备异双官能交联剂,可提供更大的灵活性和对交联程序的控制。例如,使用含有马来酰亚胺基团和NHS酯的3-马来酰亚胺丙酸NHS酯,NHS酯可用于标记蛋白质的伯胺(-NH2)、胺修饰的寡核苷酸和其他含胺分子。马来酰亚胺基团将与硫醇基团反应形成共价键,使生物分子与硫醇键连接。

当反应混合物的pH值在6.5-7.5之间时,马来酰亚胺基团与巯基特异性反应;结果是形成不可逆的稳定硫醚键(即,键不能用还原剂切割)。在更具碱性的条件下(pH>8.5),反应有利于伯胺,也增加了马来酰亚胺基团水解成非反应性马来酰胺酸的速率。马来酰亚胺不与酪氨酸、组氨酸或甲硫氨酸反应。

含硫醇的化合物(诸如二硫苏糖醇(DTT)和β-巯基乙醇(BME))必须从与马来酰亚胺一起使用的反应缓冲液中排除,因为它们会竞争缀合位点。例如,如果使用DTT还原蛋白质中的二硫键以使巯基可用于缀合,则必须在开始马来酰亚胺反应之前使用脱盐柱彻底除去DTT。有趣的是,二硫键还原剂TCEP不含硫醇,在涉及马来酰亚胺试剂的反应之前不必除去。

过量的马来酰亚胺可以在反应结束时通过添加游离的硫醇来淬灭。EDTA可以包含在缀合缓冲液中,以螯合杂散的二价金属,否则会促进巯基的氧化(非反应性)。

在一个方面,连接包括用还原剂处理EV(例如,外泌体)。合适的还原剂包括例如TCEP(三(2-羧乙基)膦)、DTT(二硫苏糖醇)、BME(2-巯基乙醇)、硫醇化剂以及它们的任何组合。硫醇化剂可以包括例如Traut试剂(2-亚氨基硫醇)。

在用还原剂处理之后,连接反应还包括使还原的EV(例如,外泌体)与马来酰亚胺部分接触。在一个方面,马来酰亚胺部分在连接至EV(例如,外泌体)之前连接至生物活性分子。在一些方面,马来酰亚胺部分还连接至接头,以将马来酰亚胺部分连接至生物活性分子。因此,在一些方面,一个或多个接头或间隔基插入马来酰亚胺部分和生物活性分子之间。

IV.治疗用途

本公开提供了治疗有需要的受试者的疾病或病症的方法,包括将包含本公开的EV(例如,外泌体)的组合物施用于受试者。本公开还提供了预防或改善有需要的受试者的疾病或病症的症状的方法,所述方法包括将包含本公开的EV(例如,外泌体)的组合物施用于受试者。还提供了诊断有需要的受试者的疾病或病症的方法,所述方法包括将包含本公开的EV(例如,外泌体)的组合物施用于受试者。

在一个方面,疾病或障碍是癌症、炎性疾病、神经退行性疾病、中枢神经疾病或代谢疾病。

本公开还提供了预防和/或治疗有需要的受试者的疾病或障碍的方法,所述方法包括将本文公开的EV(例如,外泌体)施用于受试者。在一些方面,可以用本方法治疗的疾病或障碍包括癌症、移植物抗宿主病(GvHD)、自身免疫性疾病、传染病或纤维化疾病。在一些方面,治疗是预防性的。在其他方面,用于本公开的EV(例如,外泌体)用于诱导免疫应答。在其他方面,用于本公开的EV(例如,外泌体)用于给受试者接种疫苗。

在一些方面,疾病或障碍是癌症。当施用于患有癌症的受试者时,在某些方面,本公开的EV(例如,外泌体)可以上调免疫应答并且增强受试者免疫系统的肿瘤靶向。在一些方面,所治疗的癌症的特征在于白细胞(T细胞、B细胞、巨噬细胞、树突细胞、单核细胞)向肿瘤微环境或所谓的“热肿瘤”或“炎性肿瘤”中的浸润。在一些方面,所治疗的癌症的特征在于低水平或不可检测的水平的白细胞至肿瘤微环境的浸润,或所谓的“冷肿瘤(coldtumor)”或“非炎性肿瘤”。在一些方面,以足以将“冷肿瘤”转化为“热肿瘤”的量和持续时间施用EV(例如,外泌体),即,所述施用导致白细胞(诸如T细胞)至肿瘤微环境的浸润。在某些方面,癌症包括膀胱癌、宫颈癌、肾细胞癌、睾丸癌、结直肠癌、肺癌、头颈癌以及卵巢癌、淋巴瘤、肝癌、胶质母细胞瘤、黑素瘤、骨髓瘤、白血病、胰腺癌或其组合。在其他方面,术语“远端肿瘤(distal tumor)”或“远处肿瘤(distant tumor)”是指从原始(或原发)肿瘤扩散到远处器官或远处组织例如淋巴结的肿瘤。在一些方面,本公开的EV(例如,外泌体)治疗转移扩散后的肿瘤。

在一些方面,疾病或障碍是移植物抗宿主病(GvHD)。在一些方面,可以用本公开治疗的疾病或障碍是自身免疫性疾病。自身免疫性疾病的非限制性实例包括:多发性硬化、周围神经炎、干燥综合征、类风湿性关节炎、脱发、自身免疫性胰腺炎、白塞氏病、大疱性类天疱疮、乳糜泻、德维克氏病(视神经脊髓炎)、肾小球肾炎、IgA肾病、血管炎、硬皮病、糖尿病、动脉炎、白斑病、溃疡性结肠炎、肠易激综合征、牛皮癣、葡萄膜炎、系统性红斑狼疮以及它们的组合。

在一些方面,疾病或障碍是传染病。在某些方面,疾病或障碍是致癌病毒。在一些方面,可以用本公开治疗的传染病包括但不限于人类γ疱疹病毒4(爱泼斯坦-巴尔病毒)、甲型流感病毒、乙型流感病毒、巨细胞病毒、金黄色葡萄球菌、结核分枝杆菌、沙眼衣原体、HIV-1、HIV-2、冠状病毒(例如,MERS-CoV和SARS CoV)、丝状病毒(例如,马尔堡病毒和埃博拉病毒)、化脓性链球菌、肺炎链球菌、疟原虫(例如,间日疟原虫和恶性疟原虫)、基孔加病毒,人乳头瘤病毒(HPV)、乙型肝炎、丙型肝炎、人类疱疹病毒8、单纯疱疹病毒2(HSV2)、克雷伯菌属、铜绿假单胞菌、肠球菌属、变形杆菌属、肠杆菌属、放线菌属、凝固酶阴性葡萄球菌(CoNS)、支原体或它们的组合。

在一些方面,EV(例如,外泌体)通过静脉内施用至受试者的循环系统。在一些方面,EV(例如,外泌体)输注到合适的液体中并且施用到受试者的静脉中。

在一些方面,EV(例如,外泌体)动脉内施用至受试者的循环系统。在一些方面,EV(例如,外泌体)输注到合适的液体中并且施用到受试者的动脉中。

在一些方面,EV(例如,外泌体)通过鞘内施用来施用于受试者。在一些方面,EV(例如,外泌体)通过注射到椎管或蛛网膜下腔体中以使其到达脑脊液(CSF)来施用。

在一些方面,EV(例如,外泌体)瘤内施用到受试者的一个或多个肿瘤中。

在一些方面,EV(例如,外泌体)通过鼻内施用来施用于受试者。在一些方面,EV(例如,外泌体)可以以局部施用或全身施用的形式通过鼻子吹入。在某些方面,EV(例如,外泌体)作为鼻喷雾剂施用。

在一些方面,EV(例如,外泌体)通过腹膜内施用来施用于受试者。在一些方面,EV(例如,外泌体)输注到合适的液体并且注射到受试者的腹膜中。在一些方面,腹膜内施用导致EV(例如,外泌体)分布到淋巴。在一些方面,腹膜内施用导致EV(例如,外泌体)分布到胸腺、脾和/或骨髓。在一些方面,腹膜内施用导致EV(例如,外泌体)分布到一个或多个淋巴结。在一些方面,腹膜内施用导致EV(例如,外泌体)分布至颈淋巴结、腹股沟淋巴结、纵隔淋巴结或胸骨淋巴结中的一个或多个。在一些方面,腹膜内施用导致EV(例如,外泌体)分布到胰腺。

在一些方面,EV(例如,外泌体)通过眼周施用来施用于受试者。在一些方面,EV(例如,外泌体)注射到眼周组织中。眼周药物施用包括结膜下、前房眼球筋膜囊下、后房眼球筋膜囊下和眼球后施用途径。

在一些方面,EV(例如,外泌体)眼内施用。因此,本公开提供了治疗有需要的受试者的眼部疾病或障碍的方法,所述方法包括将有效量的包含本公开的胞外囊泡(EV)(例如,外泌体)的组合物施用于受试者,所述组合物包含有效负载(例如,AVV),其中所述组合物的施用是眼内施用。

在一些方面,眼内施用选自由以下各项组成的组:玻璃体内施用、前房内施用、结膜下施用、视网膜下施用、巩膜下施用、脉络膜内施用以及它们的任何组合。在一些方面,眼内施用包括注射本公开的EV(例如,外泌体)。在一些方面,眼内施用是玻璃体内注射。

V.药物组合物和施用方法

本公开还提供了适用于施用于受试者的包含本文所述的EV(例如,外泌体)的药物组合物。药物组合物通常包含多个EV(例如,外泌体),所述EV包含经由马来酰亚胺部分共价连接至所述多个EV(例如,外泌体)的生物活性分子和适合施用于受试者的形式的药学上可接受的赋形剂或载剂。药学上可接受的赋形剂或载剂部分地由所施用的特定组合物以及用于施用该组合物的特定方法决定。因此,有很多种合适的药物组合物制剂,其包含多种EV(例如,外泌体)。(参见,例如,Remington's Pharmaceutical Sciences,Mack PublishingCo.,Easton,Pa.第18版(1990))。

药物组合物通常是无菌配制的,完全符合美国食品和药物管理局的所有良好生产规范(GMP)规程。在一些方面,药物组合物包含一种或多种化合物,例如,共价连接至EV(例如,外泌体)的小分子,如本文所述。

在一些方面,药物组合物包含一种或多种治疗剂和EV(例如,外泌体),如本文所述。在某些方面,EV(例如,外泌体)与一种或多种其他治疗剂在药学上可接受的载剂中共同施用。在一些方面,包含EV(例如,外泌体)的药物组合物在施用另外的治疗剂之前施用。在其他方面,包含EV(例如,外泌体)的药物组合物在施用另外的治疗剂之后施用。在其他方面,包含EV(例如,外泌体)的药物组合物与另外的治疗剂同时施用。

本文提供了药物组合物,所述药物组合物包含具有所需纯度的本公开的EV(例如,外泌体),以及药学上可接受的载剂或赋形剂,所述药物组合物呈适合施用于受试者的形式。药学上可接受的赋形剂或载体部分可以由所施用的特定组合物以及由用于施用组合物的特定方法决定。因此,存在多种多样的包含多个胞外囊泡的药物组合物的合适制剂。(参见例如Remington's Pharmaceutical Sciences,Mack Publishing Co.,Easton,Pa.第21版(2005))。药物组合物通常是无菌配制的,完全符合美国食品和药物管理局的所有良好生产规范(GMP)规程。

在一些方面,药物组合物包含一种或多种治疗剂和EV(例如,外泌体),如本文所述。在某些方面,EV(例如,外泌体)与一种或多种其他治疗剂在药学上可接受的载剂中共同施用。在一些方面,包含EV(例如,外泌体)的药物组合物在施用另外的治疗剂之前施用。在其他方面,包含EV(例如,外泌体)的药物组合物在施用另外的治疗剂之后施用。在其他方面,包含EV(例如,外泌体)的药物组合物与另外的治疗剂同时施用。

可接受的载体、赋形剂或稳定剂在采用的剂量和浓度下对接受者(例如,动物或人)是无毒的,并且包括缓冲液如磷酸盐、柠檬酸盐和其他有机酸;抗氧化剂(包括抗坏血酸和甲硫氨酸);防腐剂(例如十八烷基二甲基苄基氯化铵;氯化六甲双铵;苯扎氯铵;苄索氯铵;苯酚、丁基或苄基醇;对羟基苯甲酸烷基酯如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯;儿茶酚;间苯二酚;环己醇;3-戊醇;和间甲酚);低分子量(小于约10个残基)的多肽;蛋白质如血清白蛋白、明胶或免疫球蛋白;亲水性聚合物如聚乙烯吡咯烷酮;氨基酸如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸;单糖、二糖(例如,蔗糖或海藻糖)及其他碳水化合物(包括葡萄糖、甘露糖或糊精);螯合剂如EDTA;糖醇(例如,甘露糖醇或山梨糖醇);成盐抗衡离子如钠离子;金属络合物(如Zn-蛋白质络合物);和/或非离子型表面活性剂如TWEENTM、PLURONICSTM或聚乙二醇(PEG)。

载剂或稀释剂的实例包括但不限于水、盐水、林格氏溶液、右旋糖溶液和5%人血清白蛋白。此类介质和化合物用于药学活性物质的用途在本领域中众所周知。除非任何常规介质或化合物与本文所述的胞外囊泡不相容,否则考虑其在组合物中的使用。还可将补充治疗剂掺入组合物中。通常,将药物组合物配制成可与其预期施用途径相容。本公开的EV(例如,外泌体)可以通过肠胃外、局部、静脉内、口服、皮下、动脉内、皮内、透皮、直肠、颅内、腹膜内、鼻内、瘤内、肌肉内途径或作为吸入剂施用。在某些方面,静脉内施用(例如通过注射)包含EV(例如,外泌体)的药物组合物。可将EV(例如,外泌体)任选地与在治疗所述EV(例如,外泌体)所要治疗的疾病、病症或病症方面至少部分有效的其他治疗剂联合施用。

溶液或悬浮液可以包括以下组分:诸如水、盐水溶液、固定油、聚乙二醇、甘油、丙二醇或其他合成溶剂的无菌稀释剂;诸如苄醇或对羟基苯甲酸甲酯的抗菌化合物;诸如抗坏血酸或亚硫酸氢钠的抗氧化剂;诸如乙二胺四乙酸(EDTA)的螯合化合物;诸如乙酸酯、柠檬酸酯或磷酸酯的缓冲剂;以及诸如氯化钠或右旋糖的用于调整张力的化合物。pH可用诸如盐酸或氢氧化钠的酸或碱来调整。制剂可封闭在安瓿、一次性注射器或由玻璃或塑料制成的多剂量小瓶中。

适用于可注射用途的药物组合物包括无菌水溶液(如果是水溶性)或分散液和无菌散剂。对于静脉内施用,合适载体包括生理盐水、抑菌水、Cremophor ELTM(BASF,Parsippany,N.J.)或磷酸盐缓冲盐水(PBS)。组合物通常是无菌的并且具有达到容易注射的程度的流动性。载剂可以是含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)以及它们的合适混合物的溶剂或分散介质。可例如通过使用诸如卵磷脂的包衣、通过在分散液的情况下维持所需粒度以及通过使用表面活性剂来维持适当的流动性。微生物作用的预防可通过各种抗菌和抗真菌化合物(例如,对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸、硫柳汞等)来实现。如果需要,可将例如糖、多元醇(诸如甘露糖醇、山梨糖醇)和氯化钠的等张化合物添加至组合物中。可注射组合物的延长吸收可通过在组合物中包含延迟吸收的化合物(例如,单硬脂酸铝和明胶)来实现。

可按需要,通过将有效量的本公开的EV(例如,外泌体)在合适的溶剂中与本文列举的组分之一或其组合混合来制备无菌注射溶液。一般地,通过将EV(例如,外泌体)并入含有基础分散介质和任何所需其他组分的无菌媒介物中来制备分散体。在用于制备无菌注射溶液的无菌粉末的情况下,制备方法是真空干燥和冷冻干燥,所述方法从其预先无菌过滤的溶液中产生活性组分加上任何另外的所需组分的粉末。可将EV(例如,外泌体)以贮库注射或植入制剂的形式施用,所述制剂可以以允许EV(例如,外泌体)的持续或脉冲释放的方式配制。

本公开的包含EV(例如,外泌体)的组合物的全身施用也可以通过经粘膜方式进行。对于经粘膜施用,在制剂中使用适合于待渗透的障壁的渗透剂。此类渗透剂在本领域中是公知的,并且对于经粘膜施用,包括例如清洁剂、胆汁盐和梭链孢酸衍生物。经粘膜施用可经由使用例如鼻喷剂来实现。

在某些方面,将包含本公开的EV(例如,外泌体)的药物组合物静脉内施用于将受益于该药物组合物的受试者。在某些其他方面,例如通过淋巴管内注射或通过结节内注射(参见例如Senti等人,PNAS105(46):17908(2008))或通过肌内注射、通过皮下施用、通过瘤内注射、通过直接注射至胸腺中或至肝脏中来将组合物施用至淋巴系统。

在某些方面,包含本公开的EV(例如,外泌体)的药物组合物作为液体混悬剂施用。在某些方面,将药物组合物以能够在施用后形成贮库的制剂的形式施用。在某些优选的方面,贮库缓慢释放EV(例如,外泌体),进入循环,或保持贮库形式。

通常,药学上可接受的组合物被高度纯化为不含污染物,具有生物相容性并且不具有毒性,并且适合于施用于受试者。如果水是载剂的组分,则水经高度纯化并且被处理为不含例如内毒素的污染物。

药学上可接受的载体可以是乳糖、右旋糖、蔗糖、山梨糖醇、甘露糖醇、淀粉、阿拉伯树胶、磷酸钙、藻酸盐、明胶、硅酸钙、微晶纤维素、聚乙烯吡咯啶酮、纤维素、水、糖浆、甲基纤维素、苯甲酸甲基羟酯、苯甲酸丙基羟酯、滑石、硬脂酸镁和/或矿物油,但不限于此。药物组合物可还包含润滑剂、润湿剂、甜味剂、香味增强剂、乳化剂、悬浮剂和/或防腐剂。

本文所述的药物组合物包含本文所述的EV(例如,外泌体)和任选地药物活性剂或治疗剂。治疗剂可以是生物剂、小分子剂或核酸剂。

提供了包含药物组合物的剂型,所述药物组合物包含本文所述的EV(例如,外泌体)。在一些方面,剂型被配制为液体悬浮液以用于静脉内注射。在一些方面,剂型被配制为液体混悬剂以用于瘤内注射。

在某些方面,本公开的EV(例如,外泌体)的制备物经受辐射,例如X射线、γ射线、β粒子、α粒子、中子、质子、元素核、紫外线,以破坏残留具有复制能力的核酸。

在某些方面,使用大于约1、约5、约10、约15、约20、约25、约30、约35、约40、约50、约60、约70、约80、约90、约100或大于100kGy的辐射剂量,使本公开的EV(例如,外泌体)的制备物经受γ辐射。

在某些方面,使用大于约0.1、约0.5、约1、约5、约10、约15、约20、约25、约30、约35、约40、约50、约60、约70、约80、约90、约100、约200、约300、约400、约500、约600、约700、约800、约900、约1000、约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000或约10000的辐射剂量,使本公开的EV(例如,外泌体)的制备物经受X射线辐射。

本公开的EV(例如,外泌体)可以与其他药物同时使用。具体而言,本发明的EV(例如,外泌体)可以与药物(诸如激素治疗剂、化学治疗剂、免疫治疗剂、抑制细胞生长因子或细胞生长因子受体作用的药物等)一起使用。

VI.试剂盒

本公开还提供了试剂盒或制造产品,所述试剂盒或制造产品包括本公开的一种或多种EV(例如,外泌体)和任选的使用说明。在一些方面,试剂盒或制造产品包含本文所述的药物组合物,所述药物组合物包含至少一种本公开的EV(例如,外泌体)和使用说明。在一些方面,试剂盒或制造产品包含在一个或多个容器中的至少一种本公开的EV(例如,外泌体)或包含EV(例如,外泌体)的药物组合物。本领域的技术人员将容易地认识到,本公开的EV(例如,外泌体)、包含本公开的EV(例如,外泌体)的药物组合物或它们的组合可以容易地掺入已建立的试剂盒形式之一中,所述试剂盒格式是本领域熟知的。

在一些方面,试剂盒或制造产品包含EV(例如,外泌体)、一种或多种生物活性分子、经由马来酰亚胺部分将一种或多种生物活性分子共价连接至EV(例如,外泌体)的试剂或它们的任何组合,以及进行反应以经由马来酰亚胺部分将一种或多种生物活性分子共价连接至EV(例如,外泌体)的说明。

在一些方面,试剂盒包含经由马来酰亚胺部分将生物活性分子与EV(例如,外泌体)缀合的试剂,以及进行缀合的说明书。

除非另外指明,否则本公开的实践将采用细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术,这些技术在本领域的技术范围内。这些技术在文献中有充分的解释。参见,例如,Sambrook等人编,(1989)Molecular Cloning ALaboratory Manual(第2版;Cold Spring Harbor Laboratory Press);Sambrook等人编,(1992)Molecular Cloning:A Laboratory Manual,(Cold Springs Harbor Laboratory,NY);D.N.Glover编,(1985)DNA Cloning,Volumes I and II;Gait编,(1984)Oligonucleotide Synthesis;Mullis等人,美国专利号4,683,195;Hames和Higgins编,(1984)Nucleic Acid Hybridization;Hames和Higgins编,(1984)Transcription AndTranslation;Freshney(1987)Culture Of Animal Cells(Alan R.Liss,Inc.);Immobilized Cells And Enzymes(IRL Press)(1986);Perbal(1984)A Practical GuideTo Molecular Cloning;the treatise,Methods In Enzymology(Academic Press,Inc.,N.Y.);Miller和Calos编(1987)Gene Transfer Vectors For Mammalian Cells,(ColdSpring Harbor Laboratory);Wu等人编,Methods In Enzymology,第154和155卷;Mayer和Walker编,(1987)Immunochemical Methods In Cell And Molecular Biology(AcademicPress,London);Weir和Blackwell编,(1986)Handbook Of Experimental Immunology,第I-IV卷;Manipulating the Mouse Embryo,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,(1986);Crooke,Antisense drug Technology:Principles,Strategies and Applications,第2版CRC Press(2007)以及Ausubel等人(1989)CurrentProtocols in Molecular Biology(John Wiley and Sons,Baltimore,Md.)。

上文引用的所有参考文献以及本文引用的所有参考文献全文以引用的方式并入本文。

以下实施例以说明方式而不是限制方式提供。

实施例

以下实施例仅用于说明目的,不应解释为以任何方式限制本发明的范围或内容。除非另有说明,否则本发明的实践将采用本领域技术范围内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法。此类技术在文献中有充分的解释。参见,例如T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freeman andCompany,1993);Green和Sambrook等人,Molecular Cloning:A Laboratory Manual,第4版(Cold Spring Harbor Laboratory Press,2012);Colowick和Kaplan,Methods InEnzymology(Academic Press);Remington:The Science and Practice of Pharmacy,第22版(Pharmaceutical Press,2012);Sundberg和Carey,Advanced Organic Chemistry:A和B部分,第5版(Springer,2007)。

实施例1

外泌体分离和加载

外泌体分离:在7-9天后从HEK293SF细胞高密度悬浮培养物的上清液中收集外泌体。细胞培养基连续离心,前次离心的上清液作为后续离心的输入:细胞培养基以5,000×g离心30分钟,收集上清液并弃去沉淀;然后将上清液以16,000×g离心30分钟,收集上清液并丢弃沉淀;然后将上清液以133,900×g离心3小时,弃去上清液,收集沉淀并重悬于1mLPBS中。重悬的133,900×g颗粒通过在OPTIPREPTM碘克沙醇梯度中运行进一步纯化:4层无菌梯度通过将3mL OPTIPREPTM(60%碘克沙醇)与1mL重悬的沉淀混合以产生4mL45%碘克沙醇来制备,然后用3mL 30%碘克沙醇、2mL 22.5%碘克沙醇、2mL 17.5%碘克沙醇和1mL PBS连续覆盖在12mL Ultra-Clear(344059)管中,以用于SW 41Ti转子。梯度在4℃下以150,000×g超速离心16小时。超速离心产生已知含有外泌体的顶部馏分、含有中度密度的细胞碎片的中间馏分和含有高密度聚集物和细胞碎片的底部馏分。然后从管的顶部约2mL轻轻收集外泌体层。

外泌体部分在38.5mL Ultra-Clear(344058)管中的约32mL PBS中稀释,并以10,000×g离心30分钟,收集上清液并在4℃下以133,900×g超速离心3小时,以沉淀纯化的外泌体。接着,将沉淀的外泌体重悬浮于最小体积的PBS(约200μL)中并且储存在4℃下。使用纳米粒子追踪分析(NTA)确定外泌体的最终纯化浓度。

外泌体加载:为了使用马来酰亚胺缀合物加载外泌体,使用浓度为1至50mM的TCEP(盐酸三(2-羧乙基)膦)对外泌体进行化学还原;在一些情况下,还原步骤包括或在此之前用1-2M盐酸胍在室温下处理一小时。通过在PBS中稀释至1mL,以100,000×g离心20分钟(TLA 120.2转子,Beckman)将外泌体交换到PBS中,以沉淀外泌体,除去并丢弃上清液,并将沉淀重悬于1mL PBS中;重复一次以确保完全更换缓冲液。最终外泌体沉淀重悬于0.1mLPBS中,向其中加入待加载的化合物至终浓度高达300μM。外泌体在4℃下温育过夜,然后用PBS洗涤以除去未缀合至外泌体的化合物(在PBS中稀释至1mL,以100,000×g离心20分钟(TLA 120.2转子,Beckman)以沉淀外泌体,除去并丢弃上清液,并将沉淀重悬于1mL PBS中;重复一次至确保完全的缓冲液交换)。

实施例2

游离的和外泌体连接的STING激动剂的功效

图1B提供了在PBMC测定法中测试的STING激动剂化合物。化合物在Sygnature合成。使用采用Ficoll-Hypaque密度梯度的标准方案从肝素化人血中分离PBMC。对于待测试的每个条件,将500,000个PBMC接种在96孔板的一个孔中,并与测试样品一起培养过夜。第二天,将细胞在板中离心(500×g,10分钟)并收集上清液。使用ELISA来测量释放至细胞培养物上清液中的干扰素β(IFNβ)。图2.

图2显示了通过PBMC测定法评估的巯基或胺反应性化合物的STING激动作用。来自三个不同健康人类供体的PBMC用于测定游离的化合物(实心圆圈)或加载在外泌体上的化合物(空心圆圈)的活性。当与外泌体相关时,所有具有马来酰亚胺连接化学物质的化合物(CP227、CP229、CP250)均显示出3-4倍对数的效力增加。通过被动加载(CP232)的外泌体结合显示出大约2倍对数的效力增加。值得注意的是,琥珀酰亚胺连接导致加载量低,并且在加载外泌体的样品(CP246)中未检测到IFNβ释放的诱导。

图3A-3C显示了加载STING激动剂的巯基反应性和脂质缔合化学的比较。来自两个不同健康人供体的PBMC用于测定三种化合物的活性:CP227、CP229和CP238。这些化合物以游离的(蓝色圆圈/线)或加载在外泌体上(绿色圆圈/线)测试。含有巯基反应性马来酰亚胺连接化学物质的两种化合物(CP227和CP229)在连接至外泌体时都表现出超过3倍对数的效力增加。相比之下,当与外泌体缀合时,含有脂质结合胆固醇化学物质的化合物显示出小于1倍对数的效力变化。因此,马来酰亚胺连接优于胆固醇。

图4A-4C显示了加载STING激动剂的未经修饰和巯基反应性化学物质的比较。将被动加载环状二核苷酸STING激动剂(ADUS100和CL656)的外泌体与化学连接至具有马来酰亚胺化学物质的外泌体的激动剂进行比较(马来酰亚胺化合物的数据与图2中的相同;即,测试的化合物是CP227、CP229和CP238)。两种加载类型的EC50值在图4所示的表中进行了比较。通常,与未经修饰的化合物相比,马来酰亚胺缀合的化合物的外泌体介导的效力增加10倍以上。因此,马来酰亚胺与外泌体的连接优于被动加载。

图5A和5B显示了不同的STING激动剂的加载和活性的比较。通过质谱法来定量使用不同连接化学物质加载到外泌体上的STING激动剂的量。STING激动剂EC50值是根据人PBMC测定法计算的。结果表明STING激动剂加载/活性因方法而异。

实施例3

外泌体连接的MMAE的功效

图6显示了单甲基澳瑞他汀E(MMAE)和马来酰亚胺-vc-PABC-MMAE(vc-MMAE)的结构。这两种化合物用于测试细胞毒性化合物(MMAE)在外泌体上的加载。两种化合物都可商购获得,并且从MedChemExpress订购。

在RAW264.7(RAW)细胞上评估MMAE细胞毒性。参见图7。RAW细胞是人巨噬细胞系。在96孔板的每个孔中接种10,000个RAW细胞,并使用IncuCyte仪器监测细胞生长,在大约5天的时间内对细胞进行成像。在一定浓度范围内将游离的MMAE或DMSO(载体对照)添加至RAW细胞中,当MMAE浓度大于1.1nM时,观察到有效的生长抑制和细胞死亡。DMSO对照显示出对细胞活力或生长无影响。图像显示了用指定剂量的MMAE或DMSO处理5天后的细胞;从用MMAE处理后细胞数量的减少可以明显看出生长抑制,而细胞死亡则由细胞的疏松状态表示(在10、100和300nM图像中可见)。MMAE具有陡峭的剂量反应曲线。

在存在或不存在马来酰亚胺-Val-Cit-PABC接头的情况下,MMAE效力的差异如图8A所示。RAW细胞用指定浓度的未经修饰的MMAE或vc-MMAE处理。当作为游离的药物施用于细胞时,vc-MMAE的毒性似乎比未经修饰的MMAE低约100倍。因此,MMAE与vc接头的连接导致效力降低。

图8B显示了与MMAE一起温育后的外泌体清理。外泌体与MMAE在4℃下温育过夜,然后通过超速离心洗涤两次(以100,000×g离心20分钟沉淀,在PBS中重悬,然后第二次沉淀,然后再悬浮)。在无测试的条件下,据发现用MMAE处理的外泌体在添加至RAW细胞时会诱导任何生长抑制或毒性。这表明游离的MMAE不会与外泌体显著结合,并且清理程序会从外泌体中除去MMAE。

图8C示出了加载有vc-MMAE的外泌体表现出有效的生物活性。外泌体用TCEP(5mM)和浓度范围为0.1至2M的盐酸胍(Gdn)进行化学还原。外泌体通过超速离心清理(以100,000×g离心20分钟沉淀,在PBS中重悬,然后沉淀第二次,然后重悬),然后以指定的MOI(每个细胞的外泌体数量)添加至RAW细胞中。通过在培养5天后测量细胞生长抑制来评估毒性。在用加载有vc-MMAE的外泌体处理后,RAW细胞表现出剂量依赖性的增殖降低。因此,vc-MMAE显著连接在外泌体上并且不会被离液剂和离心洗涤。此外,连接在外泌体上的MMAE对细胞生长表现出有效的抑制作用。

图8D显示了vc-MMAE活性需要外泌体的化学还原。外泌体保持在PBS中,或者用含有5mM TCEP的PBS处理,然后与MMAE或vc-MMAE一起温育。样品通过超速离心清理,然后添加至RAW细胞中。细胞生长仅被与vc-MMAE(深红色三角形)一起温育的TCEP减少的外泌体显著抑制。这表明,vc-MMAE化合物上的马来酰亚胺基团与化学还原后外泌体上产生的巯基缀合。

图9A显示了化合物的还原条件和加载浓度对外泌体效力的影响。外泌体用一系列还原条件(0-50mM TCEP,含或不含1M盐酸胍)处理,通过超速离心清理,然后与10或100μMvc-MMAE一起在4℃下温育过夜。通过超速离心清理外泌体,然后添加至RAW细胞中以测试它们对细胞生长的影响。未通过TCEP处理而化学还原的外泌体对细胞生长无影响。在还原条件下比较,与加载10μM vc-MMAE相比,加载100μM vc-MMAE导致效力显著增加。在存在1MGdn的情况下,所有浓度的TCEP都产生相似的效力,但最高浓度的TCEP(50mM)除外,它显示出效力降低。在不存在盐酸胍的情况下,将TCEP的浓度从1.5mM增加至15mM会导致效力增加;在不存在盐酸胍的情况下,50mM TCEP也显示出效力降低。

与图9A类似,图9B显示了化合物的还原条件和加载浓度对外泌体效力的影响,但在更高的vc-MMAE浓度下。使用与图9A所示的实验相同的实验条件,但使用100和300μM vc-MMAE作为加载浓度。与使用10和100μM vc-MMAE观察到的情况类似,将加载浓度增加到300μM vc-MMAE进一步增加了效力。重要的是,在300μM vc-MMAE下,在15mM TCEP的0和1M Gdn条件之间观察到相当的效力;这表明只要优化还原条件和加载浓度,就可以在不存在盐酸胍的情况下进行加载。

MMAE实验展示了TCEP、盐酸胍和Val-Cit-MMAE的浓度之间复杂的相互作用,并显示出很多相互作用相互作用(即1M Gdn优于2M,图8B;15mM TCEP优于50mM,图9A和9B;将TCEP浓度从1.5mM增加到15mM在不存在Gdn的情况下增加了效力,但在1M Gdn中无差异,图9B)。

实施例4

外泌体连接的PROTAC

根据图10C,TBK1PROTAC根据以上公开的方法连接至外泌体。PROTAC包含TBK1靶向配体、接头和能够与VHL E3泛素连接酶结合的配体。

PROTAC经由马来酰亚胺部分(直接或间接通过接头)连接至外泌体,例如,外泌体膜的外表面和/或腔体表面。PROTAC可以通过马来酰亚胺-VA-PABC可切割的接头连接至外泌体。PROTAC可以通过VHL(E3连接酶)结合配体连接至外泌体。

可以使用体外或体内方法来确定连接至本公开的外泌体的TBK1PROTAC的功能。体外方法包括蛋白质印迹法,以(i)直接测量细胞系中的TBK1降解,(ii)确定用STING激动剂(多聚I:C、CL656、LPS等)刺激后对IRF3磷酸化的抑制,或(iii)确定人单核细胞中的TBK1蛋白敲低。另一种体外测定法可以确定对STING激动作用的抑制,例如,使用B16IRF报告细胞系(例如,用外泌体-PROTAC缀合物预处理,用STING激动剂刺激,并测量报告反应)或人单核细胞(例如,测量IFBβ释放)。

确定本公开的外泌体-PROTAC缀合物的功能的体内测定法包括例如确定以下各项的测定法:(i)腹膜巨噬细胞中的TBK1蛋白敲低(例如,用外泌体-PROTAC缀合物进行腹膜内施用,收集腹膜巨噬细胞,以及通过蛋白质印迹或流式细胞术测量敲低),(ii)抑制STING激动作用诱导的血清细胞因子(例如,用外泌体-PROTAC缀合物进行腹膜内预处理,用STING激动剂进行腹膜内刺激,并在某些时间点测量血浆/血清细胞因子),或(iii)抑制STING激动作用诱导的磷酸IRF3(例如,如果敲低是非常有选择性的并且没有观察到血清细胞因子的减少,则确定不同细胞类型中的pIRF3水平,例如,使用抗pIRF抗体和流式细胞术可以帮助显示选择性)。

实施例5

外泌体相关的LPA1抑制剂-ExoAM152

溶血磷脂酸(LPA)是一种保护和拯救细胞免于程序性细胞死亡的高效的内源性脂质介质。LPA通过其高亲和力的LPA1受体的作用作为纤维发生的重要介质。

AM152(也称为BMS-986020)是一种特异性LPA1抑制剂。AM152是一种高亲和力LPA1拮抗剂,可抑制胆汁酸和磷脂转运蛋白,对BSEP、MRP4和MDR3的IC50分别为4.8μM、6.2μM和7.5μM。LPA1抑制剂AM152和AM095的化学结构提供于图12中。该图显示了含马来酰亚胺的试剂可以与AM152的羧酸和/或氨基甲酸根基团缀合。由于AM095中存在相同的反应性基团,因此可以使用相同的方法来衍生化AM095。

LPA1拮抗剂(诸如AM095和AM152)可以使用本说明书中公开的方法化学连接至外泌体的表面。结果将是EV(例如,外泌体)的表面包含多个拮抗剂分子。参见图13。

图14显示了如何将马来酰亚胺反应性基团经由酸基团添加至AM152的实例。该实例显示了作为复合物的一部分的马来酰亚胺基团,所述复合物包含ala-val可切割的接头,所述接头插入马来酰亚胺基团和羧酸反应性氯甲基苯基团之间。图15显示了可用于衍生化AM152的两种示例性试剂。上面的试剂包含(i)可以与AM152的羧酸基团反应的氯甲基苯基团和(ii)马来酰亚胺基团;并且插入它们之间的是可切割的cit-val二肽和C5间隔基。下面的试剂包含(i)可以与AM152的羧酸基团反应的氯甲基苯基团和(ii)马来酰亚胺基团,并且可切割的ala-val二肽和C5间隔基插入它们之间。随后马来酰亚胺基团将用于将AM152(或AM095)连接,例如经由一个或多个间隔基或接头直接或间接连接至支架部分。

图16显示了将由切割缀合产物中的cit-val或ala-val二肽(例如,通过组织蛋白酶B)产生的产物。该产物AM152苯胺酯可以通过内源性酯酶进一步加工以产生游离酸AM152产物。

图17显示了包含游离的马来酰亚胺基团和不同的间隔基组合的若干AM152衍生物。另外的衍生物显示于图18中。

图19显示了在羧酸基团的保护之后,可以使用用于衍生化羧酸基团的相同试剂在氨基甲酸根基团处衍生化AM152。随后使所得的产物脱保护以释放羧酸基团。

图20展示了其中具有马来酰亚胺基团的复合物经由接头连接至AM152的氨基甲酸根基团的实例。合适的接头包括本说明书中公开的接头中的任一者。

本实施例中公开的过程涉及包含游离的马来酰亚胺反应性基团的AM152或AM095衍生物的产生,所述接头随后可通过一个或多个间隔基或接头直接或间接与支架部分反应。结果,AM152或AM095将连接至EV(例如,外泌体)的外表面。

然而,本发明还可以通过以下步骤来实施:首先衍生化支架部分,例如用包含马来酰亚胺的双官能团,然后使衍生化的支架部分(例如,具有游离的氯甲基苯基团)与羧酸或AM152的氨基甲酸根基团反应,如图21所示。

在一些方面,经由马来酰亚胺部分将AM152(或AM095)化学连接至EV(例如,外泌体)的表面改善了未缀合的AM152(或AM095)的至少一个有益性质和/或减少未缀合的AM152或AM095的至少一个有害性质(例如,毒性,诸如,胆囊毒性和/或肝脏毒性)。在一些方面,经由马来酰亚胺部分将AM152(或AM095)化学连接至EV(例如,外泌体)改善了AM512或AM095(与游离的AM152或游离的AM095相比)在治疗纤维化疾病(例如,肺纤维化,诸如,IPF)中的功效。

实施例6

外泌体相关的NLRP3抑制剂–ExoMCC950

MCC950(N-[[(1,2,3,5,6,7-六氢-对称-茚并二烯-4-基)氨基]羰基]-4-(1-羟基-1-甲基乙基)-2-呋喃磺酰胺)是NLRP3(含NOD样受体(NLR)pyrin结构域的蛋白3)炎症小体的有效和选择性抑制剂。MCC950通过阻止炎症小体衔接蛋白ASC(含CARD的凋亡相关斑点样蛋白)的寡聚化来阻断由NLRP3活化剂(诸如ATP、MSU和尼日利亚菌素)诱导的IL-1β的释放。Coll等人(2015)Nature Med.21:248-255。MCC950阻断巨噬细胞中IL-1β的释放,巨噬细胞由LPS引发并且被ATP或尼日利亚菌素活化,IC50为约7.5nM。虽然MCC950会阻止NLRP3诱导的IL-1β的释放,但MCC950不会抑制NLRC4、AIM2或NLRP1炎症小体。此外,MCC950不抑制TLR2信号传导或NLRP3的引发。

MCC950在体内具有活性,可阻断IL-1β的产生并提高多发性硬化小鼠模型的存活率。MCC950还在心肌梗塞模型中抑制NLRP3诱导的IL-1β产生。van Hout等人(2015)Eur.Heart J.ehw247。MCC950在来自穆克勒-韦尔斯综合征个体的离体样品中也具有活性。因此,MCC950是治疗NLRP3相关综合征(包括自身炎症和自身免疫性疾病)的潜在治疗剂。

图22显示了MCC950的结构、可以用于衍生化MCC950以引入马来酰亚胺反应性基团的双官能试剂和包含马来酰亚胺反应性基团的MCC950衍生物。双官能试剂的苯基团(**)可以与MCC950的氨基甲酸根基团(*)反应,产生图22中描绘的MCC950衍生物。

本实施例中公开的过程涉及包含游离的马来酰亚胺反应性基团的MCC950衍生物的产生,以及任选地多个接头(例如,可切割的接头和/或一个或多个间隔基)之一插入MCC950部分和马来酰亚胺基团之间,所述接头随后可以通过一个或多个间隔基或接头直接或间接与支架部分反应。结果,MCC950将连接至EV(例如,外泌体)的外表面。

本发明还可以通过以下步骤来实施:首先衍生化支架部分,例如用包含马来酰亚胺的双官能团,然后将衍生化的支架部分(例如,具有游离的氯甲基苯基团或苯基团)与MCC950的氨基甲酸根基团或另一个合适的可衍生基团反应。

在一些方面,经由马来酰亚胺部分将MCC950化学连接至EV(例如,外泌体)的表面改善了未缀合的MCC950的至少一个有益性质和/或减少未缀合的MCC950的至少一个有害性质(例如,毒性,诸如,胆囊毒性和/或肝脏毒性)。在一些方面,经由马来酰亚胺部分将MCC950化学连接至EV(例如,外泌体)改善了MCC950(与游离的MCC950相比)在治疗NLRP3炎症小体相关疾病或障碍(诸如多发性硬化、2型糖尿病、阿尔茨海默病、动脉粥样硬化、神经炎症、帕金森病、朊病毒病、心肌梗塞引起的心脏损伤、痛风,以及一般的任何NLRP3相关综合征,包括自身炎症和自身免疫性疾病)中的功效。

***

应当了解,意在详述部分而非概述以及摘要部分用于对权利要求书进行解释。发明内容和说明书摘要部分可以阐明如发明人所构想的本发明的一个或多个但非所有的示例性方面,并且因此,并不意图通过任何方式对本公开和所附权利要求书进行限制。

本公开已在上文中借助示出特定功能和其关系的实现的功能构建块来描述。为了方便描述,本文已对这些功能构建块的边界进行任意界定。只要合适执行特定功能和其关系,就可界定替代边界。

特定方面的前述描述将会完全地揭示本发明的一般性质,以使他人可以在不背离本发明的一般概念的情况下通过应用本领域的技术范围内的知识来容易地修改和/或改编此类特定方面以用于各种应用。因此,基于本文所呈现的教导内容以及指导内容,此类改编以及修改意图在所公开的方面的等同物的范围内。应当理解,本文的措词或术语目的在于说明而非限制,因此技术人员将会根据教导内容以及指导内容来对本说明书的术语或措词进行解释。

本公开的宽度以及范围不应限于上述示例性方面,而应仅仅根据所附权利要求和它们的等同物来界定。

出于任何目的,本申请中可能引用的所有引用的参考文献(包括参考文献、专利、专利申请和网站)的内容据此明确地以引用的方式整体并入,其中引用的参考文献也是如此。

序列表

<110> 科迪亚克生物科学公司

<120> 胞外囊泡缀合物及其用途

<130> 4000.037PC03

<150> US 62/822,014

<151> 2019-03-21

<150> US 62/835,439

<151> 2019-04-17

<160> 231

<170> PatentIn version 3.5

<210> 1

<211> 879

<212> PRT

<213> 智人(Homo sapiens)

<400> 1

Met Gly Arg Leu Ala Ser Arg Pro Leu Leu Leu Ala Leu Leu Ser Leu

1 5 10 15

Ala Leu Cys Arg Gly Arg Val Val Arg Val Pro Thr Ala Thr Leu Val

20 25 30

Arg Val Val Gly Thr Glu Leu Val Ile Pro Cys Asn Val Ser Asp Tyr

35 40 45

Asp Gly Pro Ser Glu Gln Asn Phe Asp Trp Ser Phe Ser Ser Leu Gly

50 55 60

Ser Ser Phe Val Glu Leu Ala Ser Thr Trp Glu Val Gly Phe Pro Ala

65 70 75 80

Gln Leu Tyr Gln Glu Arg Leu Gln Arg Gly Glu Ile Leu Leu Arg Arg

85 90 95

Thr Ala Asn Asp Ala Val Glu Leu His Ile Lys Asn Val Gln Pro Ser

100 105 110

Asp Gln Gly His Tyr Lys Cys Ser Thr Pro Ser Thr Asp Ala Thr Val

115 120 125

Gln Gly Asn Tyr Glu Asp Thr Val Gln Val Lys Val Leu Ala Asp Ser

130 135 140

Leu His Val Gly Pro Ser Ala Arg Pro Pro Pro Ser Leu Ser Leu Arg

145 150 155 160

Glu Gly Glu Pro Phe Glu Leu Arg Cys Thr Ala Ala Ser Ala Ser Pro

165 170 175

Leu His Thr His Leu Ala Leu Leu Trp Glu Val His Arg Gly Pro Ala

180 185 190

Arg Arg Ser Val Leu Ala Leu Thr His Glu Gly Arg Phe His Pro Gly

195 200 205

Leu Gly Tyr Glu Gln Arg Tyr His Ser Gly Asp Val Arg Leu Asp Thr

210 215 220

Val Gly Ser Asp Ala Tyr Arg Leu Ser Val Ser Arg Ala Leu Ser Ala

225 230 235 240

Asp Gln Gly Ser Tyr Arg Cys Ile Val Ser Glu Trp Ile Ala Glu Gln

245 250 255

Gly Asn Trp Gln Glu Ile Gln Glu Lys Ala Val Glu Val Ala Thr Val

260 265 270

Val Ile Gln Pro Ser Val Leu Arg Ala Ala Val Pro Lys Asn Val Ser

275 280 285

Val Ala Glu Gly Lys Glu Leu Asp Leu Thr Cys Asn Ile Thr Thr Asp

290 295 300

Arg Ala Asp Asp Val Arg Pro Glu Val Thr Trp Ser Phe Ser Arg Met

305 310 315 320

Pro Asp Ser Thr Leu Pro Gly Ser Arg Val Leu Ala Arg Leu Asp Arg

325 330 335

Asp Ser Leu Val His Ser Ser Pro His Val Ala Leu Ser His Val Asp

340 345 350

Ala Arg Ser Tyr His Leu Leu Val Arg Asp Val Ser Lys Glu Asn Ser

355 360 365

Gly Tyr Tyr Tyr Cys His Val Ser Leu Trp Ala Pro Gly His Asn Arg

370 375 380

Ser Trp His Lys Val Ala Glu Ala Val Ser Ser Pro Ala Gly Val Gly

385 390 395 400

Val Thr Trp Leu Glu Pro Asp Tyr Gln Val Tyr Leu Asn Ala Ser Lys

405 410 415

Val Pro Gly Phe Ala Asp Asp Pro Thr Glu Leu Ala Cys Arg Val Val

420 425 430

Asp Thr Lys Ser Gly Glu Ala Asn Val Arg Phe Thr Val Ser Trp Tyr

435 440 445

Tyr Arg Met Asn Arg Arg Ser Asp Asn Val Val Thr Ser Glu Leu Leu

450 455 460

Ala Val Met Asp Gly Asp Trp Thr Leu Lys Tyr Gly Glu Arg Ser Lys

465 470 475 480

Gln Arg Ala Gln Asp Gly Asp Phe Ile Phe Ser Lys Glu His Thr Asp

485 490 495

Thr Phe Asn Phe Arg Ile Gln Arg Thr Thr Glu Glu Asp Arg Gly Asn

500 505 510

Tyr Tyr Cys Val Val Ser Ala Trp Thr Lys Gln Arg Asn Asn Ser Trp

515 520 525

Val Lys Ser Lys Asp Val Phe Ser Lys Pro Val Asn Ile Phe Trp Ala

530 535 540

Leu Glu Asp Ser Val Leu Val Val Lys Ala Arg Gln Pro Lys Pro Phe

545 550 555 560

Phe Ala Ala Gly Asn Thr Phe Glu Met Thr Cys Lys Val Ser Ser Lys

565 570 575

Asn Ile Lys Ser Pro Arg Tyr Ser Val Leu Ile Met Ala Glu Lys Pro

580 585 590

Val Gly Asp Leu Ser Ser Pro Asn Glu Thr Lys Tyr Ile Ile Ser Leu

595 600 605

Asp Gln Asp Ser Val Val Lys Leu Glu Asn Trp Thr Asp Ala Ser Arg

610 615 620

Val Asp Gly Val Val Leu Glu Lys Val Gln Glu Asp Glu Phe Arg Tyr

625 630 635 640

Arg Met Tyr Gln Thr Gln Val Ser Asp Ala Gly Leu Tyr Arg Cys Met

645 650 655

Val Thr Ala Trp Ser Pro Val Arg Gly Ser Leu Trp Arg Glu Ala Ala

660 665 670

Thr Ser Leu Ser Asn Pro Ile Glu Ile Asp Phe Gln Thr Ser Gly Pro

675 680 685

Ile Phe Asn Ala Ser Val His Ser Asp Thr Pro Ser Val Ile Arg Gly

690 695 700

Asp Leu Ile Lys Leu Phe Cys Ile Ile Thr Val Glu Gly Ala Ala Leu

705 710 715 720

Asp Pro Asp Asp Met Ala Phe Asp Val Ser Trp Phe Ala Val His Ser

725 730 735

Phe Gly Leu Asp Lys Ala Pro Val Leu Leu Ser Ser Leu Asp Arg Lys

740 745 750

Gly Ile Val Thr Thr Ser Arg Arg Asp Trp Lys Ser Asp Leu Ser Leu

755 760 765

Glu Arg Val Ser Val Leu Glu Phe Leu Leu Gln Val His Gly Ser Glu

770 775 780

Asp Gln Asp Phe Gly Asn Tyr Tyr Cys Ser Val Thr Pro Trp Val Lys

785 790 795 800

Ser Pro Thr Gly Ser Trp Gln Lys Glu Ala Glu Ile His Ser Lys Pro

805 810 815

Val Phe Ile Thr Val Lys Met Asp Val Leu Asn Ala Phe Lys Tyr Pro

820 825 830

Leu Leu Ile Gly Val Gly Leu Ser Thr Val Ile Gly Leu Leu Ser Cys

835 840 845

Leu Ile Gly Tyr Cys Ser Ser His Trp Cys Cys Lys Lys Glu Val Gln

850 855 860

Glu Thr Arg Arg Glu Arg Arg Arg Leu Met Ser Met Glu Met Asp

865 870 875

<210> 2

<211> 192

<212> PRT

<213> 智人(Homo sapiens)

<400> 2

Gly Pro Ile Phe Asn Ala Ser Val His Ser Asp Thr Pro Ser Val Ile

1 5 10 15

Arg Gly Asp Leu Ile Lys Leu Phe Cys Ile Ile Thr Val Glu Gly Ala

20 25 30

Ala Leu Asp Pro Asp Asp Met Ala Phe Asp Val Ser Trp Phe Ala Val

35 40 45

His Ser Phe Gly Leu Asp Lys Ala Pro Val Leu Leu Ser Ser Leu Asp

50 55 60

Arg Lys Gly Ile Val Thr Thr Ser Arg Arg Asp Trp Lys Ser Asp Leu

65 70 75 80

Ser Leu Glu Arg Val Ser Val Leu Glu Phe Leu Leu Gln Val His Gly

85 90 95

Ser Glu Asp Gln Asp Phe Gly Asn Tyr Tyr Cys Ser Val Thr Pro Trp

100 105 110

Val Lys Ser Pro Thr Gly Ser Trp Gln Lys Glu Ala Glu Ile His Ser

115 120 125

Lys Pro Val Phe Ile Thr Val Lys Met Asp Val Leu Asn Ala Phe Lys

130 135 140

Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser Thr Val Ile Gly Leu Leu

145 150 155 160

Ser Cys Leu Ile Gly Tyr Cys Ser Ser His Trp Cys Cys Lys Lys Glu

165 170 175

Val Gln Glu Thr Arg Arg Glu Arg Arg Arg Leu Met Ser Met Glu Met

180 185 190

<210> 3

<211> 385

<212> PRT

<213> 智人(Homo sapiens)

<400> 3

Met Ala Ala Ala Leu Phe Val Leu Leu Gly Phe Ala Leu Leu Gly Thr

1 5 10 15

His Gly Ala Ser Gly Ala Ala Gly Phe Val Gln Ala Pro Leu Ser Gln

20 25 30

Gln Arg Trp Val Gly Gly Ser Val Glu Leu His Cys Glu Ala Val Gly

35 40 45

Ser Pro Val Pro Glu Ile Gln Trp Trp Phe Glu Gly Gln Gly Pro Asn

50 55 60

Asp Thr Cys Ser Gln Leu Trp Asp Gly Ala Arg Leu Asp Arg Val His

65 70 75 80

Ile His Ala Thr Tyr His Gln His Ala Ala Ser Thr Ile Ser Ile Asp

85 90 95

Thr Leu Val Glu Glu Asp Thr Gly Thr Tyr Glu Cys Arg Ala Ser Asn

100 105 110

Asp Pro Asp Arg Asn His Leu Thr Arg Ala Pro Arg Val Lys Trp Val

115 120 125

Arg Ala Gln Ala Val Val Leu Val Leu Glu Pro Gly Thr Val Phe Thr

130 135 140

Thr Val Glu Asp Leu Gly Ser Lys Ile Leu Leu Thr Cys Ser Leu Asn

145 150 155 160

Asp Ser Ala Thr Glu Val Thr Gly His Arg Trp Leu Lys Gly Gly Val

165 170 175

Val Leu Lys Glu Asp Ala Leu Pro Gly Gln Lys Thr Glu Phe Lys Val

180 185 190

Asp Ser Asp Asp Gln Trp Gly Glu Tyr Ser Cys Val Phe Leu Pro Glu

195 200 205

Pro Met Gly Thr Ala Asn Ile Gln Leu His Gly Pro Pro Arg Val Lys

210 215 220

Ala Val Lys Ser Ser Glu His Ile Asn Glu Gly Glu Thr Ala Met Leu

225 230 235 240

Val Cys Lys Ser Glu Ser Val Pro Pro Val Thr Asp Trp Ala Trp Tyr

245 250 255

Lys Ile Thr Asp Ser Glu Asp Lys Ala Leu Met Asn Gly Ser Glu Ser

260 265 270

Arg Phe Phe Val Ser Ser Ser Gln Gly Arg Ser Glu Leu His Ile Glu

275 280 285

Asn Leu Asn Met Glu Ala Asp Pro Gly Gln Tyr Arg Cys Asn Gly Thr

290 295 300

Ser Ser Lys Gly Ser Asp Gln Ala Ile Ile Thr Leu Arg Val Arg Ser

305 310 315 320

His Leu Ala Ala Leu Trp Pro Phe Leu Gly Ile Val Ala Glu Val Leu

325 330 335

Val Leu Val Thr Ile Ile Phe Ile Tyr Glu Lys Arg Arg Lys Pro Glu

340 345 350

Asp Val Leu Asp Asp Asp Asp Ala Gly Ser Ala Pro Leu Lys Ser Ser

355 360 365

Gly Gln His Gln Asn Asp Lys Gly Lys Asn Val Arg Gln Arg Asn Ser

370 375 380

Ser

385

<210> 4

<211> 613

<212> PRT

<213> 智人(Homo sapiens)

<400> 4

Met Gly Ala Leu Arg Pro Thr Leu Leu Pro Pro Ser Leu Pro Leu Leu

1 5 10 15

Leu Leu Leu Met Leu Gly Met Gly Cys Trp Ala Arg Glu Val Leu Val

20 25 30

Pro Glu Gly Pro Leu Tyr Arg Val Ala Gly Thr Ala Val Ser Ile Ser

35 40 45

Cys Asn Val Thr Gly Tyr Glu Gly Pro Ala Gln Gln Asn Phe Glu Trp

50 55 60

Phe Leu Tyr Arg Pro Glu Ala Pro Asp Thr Ala Leu Gly Ile Val Ser

65 70 75 80

Thr Lys Asp Thr Gln Phe Ser Tyr Ala Val Phe Lys Ser Arg Val Val

85 90 95

Ala Gly Glu Val Gln Val Gln Arg Leu Gln Gly Asp Ala Val Val Leu

100 105 110

Lys Ile Ala Arg Leu Gln Ala Gln Asp Ala Gly Ile Tyr Glu Cys His

115 120 125

Thr Pro Ser Thr Asp Thr Arg Tyr Leu Gly Ser Tyr Ser Gly Lys Val

130 135 140

Glu Leu Arg Val Leu Pro Asp Val Leu Gln Val Ser Ala Ala Pro Pro

145 150 155 160

Gly Pro Arg Gly Arg Gln Ala Pro Thr Ser Pro Pro Arg Met Thr Val

165 170 175

His Glu Gly Gln Glu Leu Ala Leu Gly Cys Leu Ala Arg Thr Ser Thr

180 185 190

Gln Lys His Thr His Leu Ala Val Ser Phe Gly Arg Ser Val Pro Glu

195 200 205

Ala Pro Val Gly Arg Ser Thr Leu Gln Glu Val Val Gly Ile Arg Ser

210 215 220

Asp Leu Ala Val Glu Ala Gly Ala Pro Tyr Ala Glu Arg Leu Ala Ala

225 230 235 240

Gly Glu Leu Arg Leu Gly Lys Glu Gly Thr Asp Arg Tyr Arg Met Val

245 250 255

Val Gly Gly Ala Gln Ala Gly Asp Ala Gly Thr Tyr His Cys Thr Ala

260 265 270

Ala Glu Trp Ile Gln Asp Pro Asp Gly Ser Trp Ala Gln Ile Ala Glu

275 280 285

Lys Arg Ala Val Leu Ala His Val Asp Val Gln Thr Leu Ser Ser Gln

290 295 300

Leu Ala Val Thr Val Gly Pro Gly Glu Arg Arg Ile Gly Pro Gly Glu

305 310 315 320

Pro Leu Glu Leu Leu Cys Asn Val Ser Gly Ala Leu Pro Pro Ala Gly

325 330 335

Arg His Ala Ala Tyr Ser Val Gly Trp Glu Met Ala Pro Ala Gly Ala

340 345 350

Pro Gly Pro Gly Arg Leu Val Ala Gln Leu Asp Thr Glu Gly Val Gly

355 360 365

Ser Leu Gly Pro Gly Tyr Glu Gly Arg His Ile Ala Met Glu Lys Val

370 375 380

Ala Ser Arg Thr Tyr Arg Leu Arg Leu Glu Ala Ala Arg Pro Gly Asp

385 390 395 400

Ala Gly Thr Tyr Arg Cys Leu Ala Lys Ala Tyr Val Arg Gly Ser Gly

405 410 415

Thr Arg Leu Arg Glu Ala Ala Ser Ala Arg Ser Arg Pro Leu Pro Val

420 425 430

His Val Arg Glu Glu Gly Val Val Leu Glu Ala Val Ala Trp Leu Ala

435 440 445

Gly Gly Thr Val Tyr Arg Gly Glu Thr Ala Ser Leu Leu Cys Asn Ile

450 455 460

Ser Val Arg Gly Gly Pro Pro Gly Leu Arg Leu Ala Ala Ser Trp Trp

465 470 475 480

Val Glu Arg Pro Glu Asp Gly Glu Leu Ser Ser Val Pro Ala Gln Leu

485 490 495

Val Gly Gly Val Gly Gln Asp Gly Val Ala Glu Leu Gly Val Arg Pro

500 505 510

Gly Gly Gly Pro Val Ser Val Glu Leu Val Gly Pro Arg Ser His Arg

515 520 525

Leu Arg Leu His Ser Leu Gly Pro Glu Asp Glu Gly Val Tyr His Cys

530 535 540

Ala Pro Ser Ala Trp Val Gln His Ala Asp Tyr Ser Trp Tyr Gln Ala

545 550 555 560

Gly Ser Ala Arg Ser Gly Pro Val Thr Val Tyr Pro Tyr Met His Ala

565 570 575

Leu Asp Thr Leu Phe Val Pro Leu Leu Val Gly Thr Gly Val Ala Leu

580 585 590

Val Thr Gly Ala Thr Val Leu Gly Thr Ile Thr Cys Cys Phe Met Lys

595 600 605

Arg Leu Arg Lys Arg

610

<210> 5

<211> 748

<212> PRT

<213> 智人(Homo sapiens)

<400> 5

Met Asn Leu Gln Pro Ile Phe Trp Ile Gly Leu Ile Ser Ser Val Cys

1 5 10 15

Cys Val Phe Ala Gln Thr Asp Glu Asn Arg Cys Leu Lys Ala Asn Ala

20 25 30

Lys Ser Cys Gly Glu Cys Ile Gln Ala Gly Pro Asn Cys Gly Trp Cys

35 40 45

Thr Asn Ser Thr Phe Leu Gln Glu Gly Met Pro Thr Ser Ala Arg Cys

50 55 60

Asp Asp Leu Glu Ala Leu Lys Lys Lys Gly Cys Pro Pro Asp Asp Ile

65 70 75 80

Glu Asn Pro Arg Gly Ser Lys Asp Ile Lys Lys Asn Lys Asn Val Thr

85 90 95

Asn Arg Ser Lys Gly Thr Ala Glu Lys Leu Lys Pro Glu Asp Ile Thr

100 105 110

Gln Ile Gln Pro Gln Gln Leu Val Leu Arg Leu Arg Ser Gly Glu Pro

115 120 125

Gln Thr Phe Thr Leu Lys Phe Lys Arg Ala Glu Asp Tyr Pro Ile Asp

130 135 140

Leu Tyr Tyr Leu Met Asp Leu Ser Tyr Ser Met Lys Asp Asp Leu Glu

145 150 155 160

Asn Val Lys Ser Leu Gly Thr Asp Leu Met Asn Glu Met Arg Arg Ile

165 170 175

Thr Ser Asp Phe Arg Ile Gly Phe Gly Ser Phe Val Glu Lys Thr Val

180 185 190

Met Pro Tyr Ile Ser Thr Thr Pro Ala Lys Leu Arg Asn Pro Cys Thr

195 200 205

Ser Glu Gln Asn Cys Thr Ser Pro Phe Ser Tyr Lys Asn Val Leu Ser

210 215 220

Leu Thr Asn Lys Gly Glu Val Phe Asn Glu Leu Val Gly Lys Gln Arg

225 230 235 240

Ile Ser Gly Asn Leu Asp Ser Pro Glu Gly Gly Phe Asp Ala Ile Met

245 250 255

Gln Val Ala Val Cys Gly Ser Leu Ile Gly Trp Arg Asn Val Thr Arg

260 265 270

Leu Leu Val Phe Ser Thr Asp Ala Gly Phe His Phe Ala Gly Asp Gly

275 280 285

Lys Leu Gly Gly Ile Val Leu Pro Asn Asp Gly Gln Cys His Leu Glu

290 295 300

Asn Asn Met Tyr Thr Met Ser His Tyr Tyr Asp Tyr Pro Ser Ile Ala

305 310 315 320

His Leu Val Gln Lys Leu Ser Glu Asn Asn Ile Gln Thr Ile Phe Ala

325 330 335

Val Thr Glu Glu Phe Gln Pro Val Tyr Lys Glu Leu Lys Asn Leu Ile

340 345 350

Pro Lys Ser Ala Val Gly Thr Leu Ser Ala Asn Ser Ser Asn Val Ile

355 360 365

Gln Leu Ile Ile Asp Ala Tyr Asn Ser Leu Ser Ser Glu Val Ile Leu

370 375 380

Glu Asn Gly Lys Leu Ser Glu Gly Val Thr Ile Ser Tyr Lys Ser Tyr

385 390 395 400

Cys Lys Asn Gly Val Asn Gly Thr Gly Glu Asn Gly Arg Lys Cys Ser

405 410 415

Asn Ile Ser Ile Gly Asp Glu Val Gln Phe Glu Ile Ser Ile Thr Ser

420 425 430

Asn Lys Cys Pro Lys Lys Asp Ser Asp Ser Phe Lys Ile Arg Pro Leu

435 440 445

Gly Phe Thr Glu Glu Val Glu Val Ile Leu Gln Tyr Ile Cys Glu Cys

450 455 460

Glu Cys Gln Ser Glu Gly Ile Pro Glu Ser Pro Lys Cys His Glu Gly

465 470 475 480

Asn Gly Thr Phe Glu Cys Gly Ala Cys Arg Cys Asn Glu Gly Arg Val

485 490 495

Gly Arg His Cys Glu Cys Ser Thr Asp Glu Val Asn Ser Glu Asp Met

500 505 510

Asp Ala Tyr Cys Arg Lys Glu Asn Ser Ser Glu Ile Cys Ser Asn Asn

515 520 525

Gly Glu Cys Val Cys Gly Gln Cys Val Cys Arg Lys Arg Asp Asn Thr

530 535 540

Asn Glu Ile Tyr Ser Gly Ala Ser Asn Gly Gln Ile Cys Asn Gly Arg

545 550 555 560

Gly Ile Cys Glu Cys Gly Val Cys Lys Cys Thr Asp Pro Lys Phe Gln

565 570 575

Gly Gln Thr Cys Glu Met Cys Gln Thr Cys Leu Gly Val Cys Ala Glu

580 585 590

His Lys Glu Cys Val Gln Cys Arg Ala Phe Asn Lys Gly Glu Lys Lys

595 600 605

Asp Thr Cys Thr Gln Glu Cys Ser Tyr Phe Asn Ile Thr Lys Val Glu

610 615 620

Ser Arg Asp Lys Leu Pro Gln Pro Val Gln Pro Asp Pro Val Ser His

625 630 635 640

Cys Lys Glu Lys Asp Val Asp Asp Cys Trp Phe Tyr Phe Thr Tyr Ser

645 650 655

Val Asn Gly Asn Asn Glu Val Met Val His Val Val Glu Asn Pro Glu

660 665 670

Cys Pro Thr Gly Pro Asp Ile Ile Pro Ile Val Ala Gly Val Val Ala

675 680 685

Gly Ile Val Leu Ile Gly Leu Ala Leu Leu Leu Ile Trp Lys Leu Leu

690 695 700

Met Ile Ile His Asp Arg Arg Glu Phe Ala Lys Phe Glu Lys Glu Lys

705 710 715 720

Met Asn Ala Lys Trp Asp Thr Gly Glu Asn Pro Ile Tyr Lys Ser Ala

725 730 735

Val Thr Thr Val Val Asn Pro Lys Tyr Glu Gly Lys

740 745

<210> 6

<211> 1032

<212> PRT

<213> 智人(Homo sapiens)

<400> 6

Met Ala Trp Glu Ala Arg Arg Glu Pro Gly Pro Arg Arg Ala Ala Val

1 5 10 15

Arg Glu Thr Val Met Leu Leu Leu Cys Leu Gly Val Pro Thr Gly Arg

20 25 30

Pro Tyr Asn Val Asp Thr Glu Ser Ala Leu Leu Tyr Gln Gly Pro His

35 40 45

Asn Thr Leu Phe Gly Tyr Ser Val Val Leu His Ser His Gly Ala Asn

50 55 60

Arg Trp Leu Leu Val Gly Ala Pro Thr Ala Asn Trp Leu Ala Asn Ala

65 70 75 80

Ser Val Ile Asn Pro Gly Ala Ile Tyr Arg Cys Arg Ile Gly Lys Asn

85 90 95

Pro Gly Gln Thr Cys Glu Gln Leu Gln Leu Gly Ser Pro Asn Gly Glu

100 105 110

Pro Cys Gly Lys Thr Cys Leu Glu Glu Arg Asp Asn Gln Trp Leu Gly

115 120 125

Val Thr Leu Ser Arg Gln Pro Gly Glu Asn Gly Ser Ile Val Thr Cys

130 135 140

Gly His Arg Trp Lys Asn Ile Phe Tyr Ile Lys Asn Glu Asn Lys Leu

145 150 155 160

Pro Thr Gly Gly Cys Tyr Gly Val Pro Pro Asp Leu Arg Thr Glu Leu

165 170 175

Ser Lys Arg Ile Ala Pro Cys Tyr Gln Asp Tyr Val Lys Lys Phe Gly

180 185 190

Glu Asn Phe Ala Ser Cys Gln Ala Gly Ile Ser Ser Phe Tyr Thr Lys

195 200 205

Asp Leu Ile Val Met Gly Ala Pro Gly Ser Ser Tyr Trp Thr Gly Ser

210 215 220

Leu Phe Val Tyr Asn Ile Thr Thr Asn Lys Tyr Lys Ala Phe Leu Asp

225 230 235 240

Lys Gln Asn Gln Val Lys Phe Gly Ser Tyr Leu Gly Tyr Ser Val Gly

245 250 255

Ala Gly His Phe Arg Ser Gln His Thr Thr Glu Val Val Gly Gly Ala

260 265 270

Pro Gln His Glu Gln Ile Gly Lys Ala Tyr Ile Phe Ser Ile Asp Glu

275 280 285

Lys Glu Leu Asn Ile Leu His Glu Met Lys Gly Lys Lys Leu Gly Ser

290 295 300

Tyr Phe Gly Ala Ser Val Cys Ala Val Asp Leu Asn Ala Asp Gly Phe

305 310 315 320

Ser Asp Leu Leu Val Gly Ala Pro Met Gln Ser Thr Ile Arg Glu Glu

325 330 335

Gly Arg Val Phe Val Tyr Ile Asn Ser Gly Ser Gly Ala Val Met Asn

340 345 350

Ala Met Glu Thr Asn Leu Val Gly Ser Asp Lys Tyr Ala Ala Arg Phe

355 360 365

Gly Glu Ser Ile Val Asn Leu Gly Asp Ile Asp Asn Asp Gly Phe Glu

370 375 380

Asp Val Ala Ile Gly Ala Pro Gln Glu Asp Asp Leu Gln Gly Ala Ile

385 390 395 400

Tyr Ile Tyr Asn Gly Arg Ala Asp Gly Ile Ser Ser Thr Phe Ser Gln

405 410 415

Arg Ile Glu Gly Leu Gln Ile Ser Lys Ser Leu Ser Met Phe Gly Gln

420 425 430

Ser Ile Ser Gly Gln Ile Asp Ala Asp Asn Asn Gly Tyr Val Asp Val

435 440 445

Ala Val Gly Ala Phe Arg Ser Asp Ser Ala Val Leu Leu Arg Thr Arg

450 455 460

Pro Val Val Ile Val Asp Ala Ser Leu Ser His Pro Glu Ser Val Asn

465 470 475 480

Arg Thr Lys Phe Asp Cys Val Glu Asn Gly Trp Pro Ser Val Cys Ile

485 490 495

Asp Leu Thr Leu Cys Phe Ser Tyr Lys Gly Lys Glu Val Pro Gly Tyr

500 505 510

Ile Val Leu Phe Tyr Asn Met Ser Leu Asp Val Asn Arg Lys Ala Glu

515 520 525

Ser Pro Pro Arg Phe Tyr Phe Ser Ser Asn Gly Thr Ser Asp Val Ile

530 535 540

Thr Gly Ser Ile Gln Val Ser Ser Arg Glu Ala Asn Cys Arg Thr His

545 550 555 560

Gln Ala Phe Met Arg Lys Asp Val Arg Asp Ile Leu Thr Pro Ile Gln

565 570 575

Ile Glu Ala Ala Tyr His Leu Gly Pro His Val Ile Ser Lys Arg Ser

580 585 590

Thr Glu Glu Phe Pro Pro Leu Gln Pro Ile Leu Gln Gln Lys Lys Glu

595 600 605

Lys Asp Ile Met Lys Lys Thr Ile Asn Phe Ala Arg Phe Cys Ala His

610 615 620

Glu Asn Cys Ser Ala Asp Leu Gln Val Ser Ala Lys Ile Gly Phe Leu

625 630 635 640

Lys Pro His Glu Asn Lys Thr Tyr Leu Ala Val Gly Ser Met Lys Thr

645 650 655

Leu Met Leu Asn Val Ser Leu Phe Asn Ala Gly Asp Asp Ala Tyr Glu

660 665 670

Thr Thr Leu His Val Lys Leu Pro Val Gly Leu Tyr Phe Ile Lys Ile

675 680 685

Leu Glu Leu Glu Glu Lys Gln Ile Asn Cys Glu Val Thr Asp Asn Ser

690 695 700

Gly Val Val Gln Leu Asp Cys Ser Ile Gly Tyr Ile Tyr Val Asp His

705 710 715 720

Leu Ser Arg Ile Asp Ile Ser Phe Leu Leu Asp Val Ser Ser Leu Ser

725 730 735

Arg Ala Glu Glu Asp Leu Ser Ile Thr Val His Ala Thr Cys Glu Asn

740 745 750

Glu Glu Glu Met Asp Asn Leu Lys His Ser Arg Val Thr Val Ala Ile

755 760 765

Pro Leu Lys Tyr Glu Val Lys Leu Thr Val His Gly Phe Val Asn Pro

770 775 780

Thr Ser Phe Val Tyr Gly Ser Asn Asp Glu Asn Glu Pro Glu Thr Cys

785 790 795 800

Met Val Glu Lys Met Asn Leu Thr Phe His Val Ile Asn Thr Gly Asn

805 810 815

Ser Met Ala Pro Asn Val Ser Val Glu Ile Met Val Pro Asn Ser Phe

820 825 830

Ser Pro Gln Thr Asp Lys Leu Phe Asn Ile Leu Asp Val Gln Thr Thr

835 840 845

Thr Gly Glu Cys His Phe Glu Asn Tyr Gln Arg Val Cys Ala Leu Glu

850 855 860

Gln Gln Lys Ser Ala Met Gln Thr Leu Lys Gly Ile Val Arg Phe Leu

865 870 875 880

Ser Lys Thr Asp Lys Arg Leu Leu Tyr Cys Ile Lys Ala Asp Pro His

885 890 895

Cys Leu Asn Phe Leu Cys Asn Phe Gly Lys Met Glu Ser Gly Lys Glu

900 905 910

Ala Ser Val His Ile Gln Leu Glu Gly Arg Pro Ser Ile Leu Glu Met

915 920 925

Asp Glu Thr Ser Ala Leu Lys Phe Glu Ile Arg Ala Thr Gly Phe Pro

930 935 940

Glu Pro Asn Pro Arg Val Ile Glu Leu Asn Lys Asp Glu Asn Val Ala

945 950 955 960

His Val Leu Leu Glu Gly Leu His His Gln Arg Pro Lys Arg Tyr Phe

965 970 975

Thr Ile Val Ile Ile Ser Ser Ser Leu Leu Leu Gly Leu Ile Val Leu

980 985 990

Leu Leu Ile Ser Tyr Val Met Trp Lys Ala Gly Phe Phe Lys Arg Gln

995 1000 1005

Tyr Lys Ser Ile Leu Gln Glu Glu Asn Arg Arg Asp Ser Trp Ser

1010 1015 1020

Tyr Ile Asn Ser Lys Ser Asn Asp Asp

1025 1030

<210> 7

<211> 630

<212> PRT

<213> 智人(Homo sapiens)

<400> 7

Met Glu Leu Gln Pro Pro Glu Ala Ser Ile Ala Val Val Ser Ile Pro

1 5 10 15

Arg Gln Leu Pro Gly Ser His Ser Glu Ala Gly Val Gln Gly Leu Ser

20 25 30

Ala Gly Asp Asp Ser Glu Leu Gly Ser His Cys Val Ala Gln Thr Gly

35 40 45

Leu Glu Leu Leu Ala Ser Gly Asp Pro Leu Pro Ser Ala Ser Gln Asn

50 55 60

Ala Glu Met Ile Glu Thr Gly Ser Asp Cys Val Thr Gln Ala Gly Leu

65 70 75 80

Gln Leu Leu Ala Ser Ser Asp Pro Pro Ala Leu Ala Ser Lys Asn Ala

85 90 95

Glu Val Thr Gly Thr Met Ser Gln Asp Thr Glu Val Asp Met Lys Glu

100 105 110

Val Glu Leu Asn Glu Leu Glu Pro Glu Lys Gln Pro Met Asn Ala Ala

115 120 125

Ser Gly Ala Ala Met Ser Leu Ala Gly Ala Glu Lys Asn Gly Leu Val

130 135 140

Lys Ile Lys Val Ala Glu Asp Glu Ala Glu Ala Ala Ala Ala Ala Lys

145 150 155 160

Phe Thr Gly Leu Ser Lys Glu Glu Leu Leu Lys Val Ala Gly Ser Pro

165 170 175

Gly Trp Val Arg Thr Arg Trp Ala Leu Leu Leu Leu Phe Trp Leu Gly

180 185 190

Trp Leu Gly Met Leu Ala Gly Ala Val Val Ile Ile Val Arg Ala Pro

195 200 205

Arg Cys Arg Glu Leu Pro Ala Gln Lys Trp Trp His Thr Gly Ala Leu

210 215 220

Tyr Arg Ile Gly Asp Leu Gln Ala Phe Gln Gly His Gly Ala Gly Asn

225 230 235 240

Leu Ala Gly Leu Lys Gly Arg Leu Asp Tyr Leu Ser Ser Leu Lys Val

245 250 255

Lys Gly Leu Val Leu Gly Pro Ile His Lys Asn Gln Lys Asp Asp Val

260 265 270

Ala Gln Thr Asp Leu Leu Gln Ile Asp Pro Asn Phe Gly Ser Lys Glu

275 280 285

Asp Phe Asp Ser Leu Leu Gln Ser Ala Lys Lys Lys Ser Ile Arg Val

290 295 300

Ile Leu Asp Leu Thr Pro Asn Tyr Arg Gly Glu Asn Ser Trp Phe Ser

305 310 315 320

Thr Gln Val Asp Thr Val Ala Thr Lys Val Lys Asp Ala Leu Glu Phe

325 330 335

Trp Leu Gln Ala Gly Val Asp Gly Phe Gln Val Arg Asp Ile Glu Asn

340 345 350

Leu Lys Asp Ala Ser Ser Phe Leu Ala Glu Trp Gln Asn Ile Thr Lys

355 360 365

Gly Phe Ser Glu Asp Arg Leu Leu Ile Ala Gly Thr Asn Ser Ser Asp

370 375 380

Leu Gln Gln Ile Leu Ser Leu Leu Glu Ser Asn Lys Asp Leu Leu Leu

385 390 395 400

Thr Ser Ser Tyr Leu Ser Asp Ser Gly Ser Thr Gly Glu His Thr Lys

405 410 415

Ser Leu Val Thr Gln Tyr Leu Asn Ala Thr Gly Asn Arg Trp Cys Ser

420 425 430

Trp Ser Leu Ser Gln Ala Arg Leu Leu Thr Ser Phe Leu Pro Ala Gln

435 440 445

Leu Leu Arg Leu Tyr Gln Leu Met Leu Phe Thr Leu Pro Gly Thr Pro

450 455 460

Val Phe Ser Tyr Gly Asp Glu Ile Gly Leu Asp Ala Ala Ala Leu Pro

465 470 475 480

Gly Gln Pro Met Glu Ala Pro Val Met Leu Trp Asp Glu Ser Ser Phe

485 490 495

Pro Asp Ile Pro Gly Ala Val Ser Ala Asn Met Thr Val Lys Gly Gln

500 505 510

Ser Glu Asp Pro Gly Ser Leu Leu Ser Leu Phe Arg Arg Leu Ser Asp

515 520 525

Gln Arg Ser Lys Glu Arg Ser Leu Leu His Gly Asp Phe His Ala Phe

530 535 540

Ser Ala Gly Pro Gly Leu Phe Ser Tyr Ile Arg His Trp Asp Gln Asn

545 550 555 560

Glu Arg Phe Leu Val Val Leu Asn Phe Gly Asp Val Gly Leu Ser Ala

565 570 575

Gly Leu Gln Ala Ser Asp Leu Pro Ala Ser Ala Ser Leu Pro Ala Lys

580 585 590

Ala Asp Leu Leu Leu Ser Thr Gln Pro Gly Arg Glu Glu Gly Ser Pro

595 600 605

Leu Glu Leu Glu Arg Leu Lys Leu Glu Pro His Glu Gly Leu Leu Leu

610 615 620

Arg Phe Pro Tyr Ala Ala

625 630

<210> 8

<211> 332

<212> PRT

<213> 智人(Homo sapiens)

<400> 8

Met Gly Ala Gln Phe Ser Lys Thr Ala Ala Lys Gly Glu Ala Ala Ala

1 5 10 15

Glu Arg Pro Gly Glu Ala Ala Val Ala Ser Ser Pro Ser Lys Ala Asn

20 25 30

Gly Gln Glu Asn Gly His Val Lys Val Asn Gly Asp Ala Ser Pro Ala

35 40 45

Ala Ala Glu Ser Gly Ala Lys Glu Glu Leu Gln Ala Asn Gly Ser Ala

50 55 60

Pro Ala Ala Asp Lys Glu Glu Pro Ala Ala Ala Gly Ser Gly Ala Ala

65 70 75 80

Ser Pro Ser Ala Ala Glu Lys Gly Glu Pro Ala Ala Ala Ala Ala Pro

85 90 95

Glu Ala Gly Ala Ser Pro Val Glu Lys Glu Ala Pro Ala Glu Gly Glu

100 105 110

Ala Ala Glu Pro Gly Ser Pro Thr Ala Ala Glu Gly Glu Ala Ala Ser

115 120 125

Ala Ala Ser Ser Thr Ser Ser Pro Lys Ala Glu Asp Gly Ala Thr Pro

130 135 140

Ser Pro Ser Asn Glu Thr Pro Lys Lys Lys Lys Lys Arg Phe Ser Phe

145 150 155 160

Lys Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys

165 170 175

Glu Ala Gly Glu Gly Gly Glu Ala Glu Ala Pro Ala Ala Glu Gly Gly

180 185 190

Lys Asp Glu Ala Ala Gly Gly Ala Ala Ala Ala Ala Ala Glu Ala Gly

195 200 205

Ala Ala Ser Gly Glu Gln Ala Ala Ala Pro Gly Glu Glu Ala Ala Ala

210 215 220

Gly Glu Glu Gly Ala Ala Gly Gly Asp Pro Gln Glu Ala Lys Pro Gln

225 230 235 240

Glu Ala Ala Val Ala Pro Glu Lys Pro Pro Ala Ser Asp Glu Thr Lys

245 250 255

Ala Ala Glu Glu Pro Ser Lys Val Glu Glu Lys Lys Ala Glu Glu Ala

260 265 270

Gly Ala Ser Ala Ala Ala Cys Glu Ala Pro Ser Ala Ala Gly Pro Gly

275 280 285

Ala Pro Pro Glu Gln Glu Ala Ala Pro Ala Glu Glu Pro Ala Ala Ala

290 295 300

Ala Ala Ser Ser Ala Cys Ala Ala Pro Ser Gln Glu Ala Gln Pro Glu

305 310 315 320

Cys Ser Pro Glu Ala Pro Pro Ala Glu Ala Ala Glu

325 330

<210> 9

<211> 195

<212> PRT

<213> 智人(Homo sapiens)

<400> 9

Met Gly Ser Gln Ser Ser Lys Ala Pro Arg Gly Asp Val Thr Ala Glu

1 5 10 15

Glu Ala Ala Gly Ala Ser Pro Ala Lys Ala Asn Gly Gln Glu Asn Gly

20 25 30

His Val Lys Ser Asn Gly Asp Leu Ser Pro Lys Gly Glu Gly Glu Ser

35 40 45

Pro Pro Val Asn Gly Thr Asp Glu Ala Ala Gly Ala Thr Gly Asp Ala

50 55 60

Ile Glu Pro Ala Pro Pro Ser Gln Gly Ala Glu Ala Lys Gly Glu Val

65 70 75 80

Pro Pro Lys Glu Thr Pro Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

85 90 95

Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg Asn Arg Lys Glu Gly

100 105 110

Gly Gly Asp Ser Ser Ala Ser Ser Pro Thr Glu Glu Glu Gln Glu Gln

115 120 125

Gly Glu Ile Gly Ala Cys Ser Asp Glu Gly Thr Ala Gln Glu Gly Lys

130 135 140

Ala Ala Ala Thr Pro Glu Ser Gln Glu Pro Gln Ala Lys Gly Ala Glu

145 150 155 160

Ala Ser Ala Ala Ser Glu Glu Glu Ala Gly Pro Gln Ala Thr Glu Pro

165 170 175

Ser Thr Pro Ser Gly Pro Glu Ser Gly Pro Thr Pro Ala Ser Ala Glu

180 185 190

Gln Asn Glu

195

<210> 10

<211> 227

<212> PRT

<213> 智人(Homo sapiens)

<400> 10

Met Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp

1 5 10 15

Glu Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu Gly Ala Ala Thr Glu

20 25 30

Glu Glu Gly Thr Pro Lys Glu Ser Glu Pro Gln Ala Ala Ala Glu Pro

35 40 45

Ala Glu Ala Lys Glu Gly Lys Glu Lys Pro Asp Gln Asp Ala Glu Gly

50 55 60

Lys Ala Glu Glu Lys Glu Gly Glu Lys Asp Ala Ala Ala Ala Lys Glu

65 70 75 80

Glu Ala Pro Lys Ala Glu Pro Glu Lys Thr Glu Gly Ala Ala Glu Ala

85 90 95

Lys Ala Glu Pro Pro Lys Ala Pro Glu Gln Glu Gln Ala Ala Pro Gly

100 105 110

Pro Ala Ala Gly Gly Glu Ala Pro Lys Ala Ala Glu Ala Ala Ala Ala

115 120 125

Pro Ala Glu Ser Ala Ala Pro Ala Ala Gly Glu Glu Pro Ser Lys Glu

130 135 140

Glu Gly Glu Pro Lys Lys Thr Glu Ala Pro Ala Ala Pro Ala Ala Gln

145 150 155 160

Glu Thr Lys Ser Asp Gly Ala Pro Ala Ser Asp Ser Lys Pro Gly Ser

165 170 175

Ser Glu Ala Ala Pro Ser Ser Lys Glu Thr Pro Ala Ala Thr Glu Ala

180 185 190

Pro Ser Ser Thr Pro Lys Ala Gln Gly Pro Ala Ala Ser Ala Glu Glu

195 200 205

Pro Lys Pro Val Glu Ala Pro Ala Ala Asn Ser Asp Gln Thr Val Thr

210 215 220

Val Lys Glu

225

<210> 11

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 11

Lys Lys Lys Lys

1

<210> 12

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 12

Lys Lys Lys Lys Lys

1 5

<210> 13

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 13

Arg Arg Arg Arg

1

<210> 14

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 14

Arg Arg Arg Arg Arg

1 5

<210> 15

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MOD_RES

<222> (1)..(4)

<223> X = Lys或Arg

<400> 15

Xaa Xaa Xaa Xaa

1

<210> 16

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> misc_feature

<222> (1)..(5)

<223> Xaa可以是任何天然存在的氨基酸

<400> 16

Xaa Xaa Xaa Xaa Xaa

1 5

<210> 17

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 17

Gly Gly Lys Leu Ser Lys Lys

1 5

<210> 18

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 18

Gly Ala Lys Leu Ser Lys Lys

1 5

<210> 19

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 19

Gly Gly Lys Gln Ser Lys Lys

1 5

<210> 20

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 20

Gly Gly Lys Leu Ala Lys Lys

1 5

<210> 21

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 21

Gly Gly Lys Leu Ser Lys Lys

1 5

<210> 22

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 22

Gly Gly Lys Leu Ser Lys Lys Lys

1 5

<210> 23

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 23

Gly Gly Lys Leu Ser Lys Lys Ser

1 5

<210> 24

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 24

Gly Ala Lys Leu Ser Lys Lys Lys

1 5

<210> 25

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 25

Gly Ala Lys Leu Ser Lys Lys Ser

1 5

<210> 26

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 26

Gly Gly Lys Gln Ser Lys Lys Lys

1 5

<210> 27

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 27

Gly Gly Lys Gln Ser Lys Lys Ser

1 5

<210> 28

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 28

Gly Gly Lys Leu Ala Lys Lys Lys

1 5

<210> 29

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 29

Gly Gly Lys Leu Ala Lys Lys Ser

1 5

<210> 30

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 30

Gly Gly Gly Gly

1

<210> 31

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> misc_feature

<222> (1)..(4)

<223> 接头;可以包含1至100个序列重复

<400> 31

Gly Gly Gly Ser

1

<210> 32

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 32

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn

1 5 10

<210> 33

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 33

Gly Ala Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn

1 5 10

<210> 34

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 34

Gly Gly Lys Gln Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn

1 5 10

<210> 35

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 35

Gly Gly Lys Leu Ala Lys Lys Lys Lys Gly Tyr Asn Val Asn

1 5 10

<210> 36

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 36

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Ser Gly Gly

1 5 10

<210> 37

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 37

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Ser Gly Gly Ser

1 5 10

<210> 38

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 38

Gly Gly Lys Leu Ser Lys Lys Lys Lys Ser Gly Gly Ser Gly

1 5 10

<210> 39

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 39

Gly Gly Lys Leu Ser Lys Lys Lys Ser Gly Gly Ser Gly Gly

1 5 10

<210> 40

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 40

Gly Gly Lys Leu Ser Lys Lys Ser Gly Gly Ser Gly Gly Ser

1 5 10

<210> 41

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 41

Gly Gly Lys Leu Ser Lys Ser Gly Gly Ser Gly Gly Ser Val

1 5 10

<210> 42

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 42

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser

1 5 10

<210> 43

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> SEQ44的453至459

<400> 43

Gly Thr Thr Thr Gln Ser Arg

1 5

<210> 44

<211> 735

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV2 VP1 (病毒)

<400> 44

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr

435 440 445

Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln

450 455 460

Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn

485 490 495

Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys

530 535 540

Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr

580 585 590

Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 45

<211> 653

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> REP1

<400> 45

Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr

1 5 10 15

Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg

20 25 30

Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala

35 40 45

Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu

50 55 60

Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu

65 70 75 80

Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln

85 90 95

His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val

100 105 110

Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala

115 120 125

Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu

130 135 140

Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser

145 150 155 160

Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly

165 170 175

Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser

180 185 190

Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu

195 200 205

Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly

210 215 220

Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly

225 230 235 240

Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu

245 250 255

Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu

260 265 270

Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr

275 280 285

Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu

290 295 300

Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe

305 310 315 320

Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile

325 330 335

Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile

340 345 350

Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr

355 360 365

Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro

370 375 380

Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu

385 390 395 400

Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys

405 410 415

Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe

420 425 430

Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln

435 440 445

Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu

450 455 460

Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu

465 470 475 480

Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr

485 490 495

Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser

500 505 510

Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe

515 520 525

Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro

530 535 540

Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile

545 550 555 560

Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser

565 570 575

Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu

580 585 590

Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro

595 600 605

Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu

610 615 620

Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys

625 630 635 640

Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu

645 650

<210> 46

<211> 2

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (1)..(2)

<223> [(Gly)n-Ser]m接头的最短实例,其中n为

从1至100的任何整数,并且m为从1至100的任何整数

<400> 46

Gly Ser

1

<210> 47

<211> 2

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (1)..(2)

<223> [(Gly)x-Sery]z接头的最短实例,其中x为

从1至4的整数,y为0或1,并且z为从1至

50的整数

<400> 47

Gly Ser

1

<210> 48

<211> 1

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (2)..(2)

<223> Gn接头的最短实例,其中n可以为从

1至100的整数

<400> 48

Gly

1

<210> 49

<211> 2

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (1)..(2)

<223> (GlyAla)n接头的最短实例,其中n为

在1和100之间的整数

<400> 49

Gly Ala

1

<210> 50

<211> 3

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (1)..(3)

<223> 接头;可以包含1至100个序列重复

<400> 50

Gly Gly Ser

1

<210> 51

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 51

Gly Gly Lys Leu Ser Lys

1 5

<210> 52

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 52

Gly Ala Lys Leu Ser Lys

1 5

<210> 53

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 53

Gly Gly Lys Gln Ser Lys

1 5

<210> 54

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 54

Gly Gly Lys Leu Ala Lys

1 5

<210> 55

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 55

Lys Lys Lys Gly

1

<210> 56

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 56

Lys Lys Lys Gly Tyr

1 5

<210> 57

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 57

Lys Lys Lys Gly Tyr Asn

1 5

<210> 58

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 58

Lys Lys Lys Gly Tyr Asn Val

1 5

<210> 59

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 59

Lys Lys Lys Gly Tyr Asn Val Asn

1 5

<210> 60

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 60

Lys Lys Lys Gly Tyr Ser

1 5

<210> 61

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 61

Lys Lys Lys Gly Tyr Gly

1 5

<210> 62

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 62

Lys Lys Lys Gly Tyr Gly Gly

1 5

<210> 63

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 63

Lys Lys Lys Gly Ser

1 5

<210> 64

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 64

Lys Lys Lys Gly Ser Gly

1 5

<210> 65

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 65

Lys Lys Lys Gly Ser Gly

1 5

<210> 66

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 66

Lys Lys Lys Gly Ser Gly Ser

1 5

<210> 67

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 67

Lys Lys Lys Ser

1

<210> 68

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 68

Lys Lys Lys Ser Gly

1 5

<210> 69

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 69

Lys Lys Lys Ser Gly Gly

1 5

<210> 70

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 70

Lys Lys Lys Ser Gly Gly Ser

1 5

<210> 71

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 71

Lys Lys Lys Ser Gly Gly Ser Gly

1 5

<210> 72

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 72

Lys Lys Ser Gly Gly Ser Gly Gly

1 5

<210> 73

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 73

Lys Lys Lys Ser Gly Gly Ser Gly Gly Ser

1 5 10

<210> 74

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 74

Lys Arg Phe Ser Phe Lys Lys Ser

1 5

<210> 75

<211> 29

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 75

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu Gly Ala Ala

20 25

<210> 76

<211> 28

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 76

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu Gly Ala

20 25

<210> 77

<211> 27

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 77

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu Gly

20 25

<210> 78

<211> 26

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 78

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu

20 25

<210> 79

<211> 25

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 79

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys Asp Lys Lys Ala

20 25

<210> 80

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 80

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys Asp Lys Lys

20

<210> 81

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 81

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys Asp Lys

20

<210> 82

<211> 22

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 82

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys Asp

20

<210> 83

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 83

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu Lys

20

<210> 84

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 84

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys Glu

20

<210> 85

<211> 19

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 85

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala Lys

<210> 86

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 86

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys Ala

<210> 87

<211> 17

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 87

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

Lys

<210> 88

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 88

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu

1 5 10 15

<210> 89

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 89

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp

1 5 10 15

<210> 90

<211> 13

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 90

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val

1 5 10

<210> 91

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 91

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn

1 5 10

<210> 92

<211> 11

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 92

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr

1 5 10

<210> 93

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 93

Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly

1 5 10

<210> 94

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 94

Gly Gly Lys Leu Ser Lys Lys Lys Lys

1 5

<210> 95

<211> 29

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 95

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys Glu Ala

20 25

<210> 96

<211> 28

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 96

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys Glu

20 25

<210> 97

<211> 27

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 97

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys

20 25

<210> 98

<211> 26

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 98

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys

20 25

<210> 99

<211> 25

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 99

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn

20 25

<210> 100

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 100

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys

20

<210> 101

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 101

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys

20

<210> 102

<211> 22

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 102

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe

20

<210> 103

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 103

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser

20

<210> 104

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 104

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe

20

<210> 105

<211> 19

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 105

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly

<210> 106

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 106

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser

<210> 107

<211> 17

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 107

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu

<210> 108

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 108

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

<210> 109

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 109

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe

1 5 10 15

<210> 110

<211> 13

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 110

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys

1 5 10

<210> 111

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 111

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys

1 5 10

<210> 112

<211> 11

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 112

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe

1 5 10

<210> 113

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 113

Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser

1 5 10

<210> 114

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 114

Gly Ala Lys Lys Ser Lys Lys Arg Phe

1 5

<210> 115

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 115

Gly Ala Lys Lys Ser Lys Lys Arg

1 5

<210> 116

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 116

Gly Ala Lys Lys Ser Lys Lys

1 5

<210> 117

<211> 29

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 117

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys Glu Ala

20 25

<210> 118

<211> 28

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 118

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys Glu

20 25

<210> 119

<211> 27

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 119

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys

20 25

<210> 120

<211> 26

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 120

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys

20 25

<210> 121

<211> 25

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 121

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys Asn

20 25

<210> 122

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 122

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys Lys

20

<210> 123

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 123

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe Lys

20

<210> 124

<211> 22

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 124

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser Phe

20

<210> 125

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 125

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe Ser

20

<210> 126

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 126

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly Phe

20

<210> 127

<211> 19

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 127

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser Gly

<210> 128

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 128

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu Ser

<210> 129

<211> 17

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 129

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

Leu

<210> 130

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 130

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys

1 5 10 15

<210> 131

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 131

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe

1 5 10 15

<210> 132

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 132

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser

1 5 10

<210> 133

<211> 13

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 133

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys

1 5 10

<210> 134

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 134

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys

1 5 10

<210> 135

<211> 11

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 135

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe

1 5 10

<210> 136

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 136

Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser

1 5 10

<210> 137

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 137

Gly Ala Lys Lys Ala Lys Lys Arg Phe

1 5

<210> 138

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 138

Gly Ala Lys Lys Ala Lys Lys Arg

1 5

<210> 139

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 139

Gly Ala Lys Lys Ala Lys Lys

1 5

<210> 140

<211> 28

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 140

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe Lys Lys

20 25

<210> 141

<211> 27

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 141

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe Lys

20 25

<210> 142

<211> 26

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 142

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe

20 25

<210> 143

<211> 25

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 143

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys Leu Ser Gly Phe Ser

20 25

<210> 144

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 144

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys Leu Ser Gly Phe

20

<210> 145

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 145

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys Leu Ser Gly

20

<210> 146

<211> 22

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 146

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys Leu Ser

20

<210> 147

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 147

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys Leu

20

<210> 148

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 148

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe Lys

20

<210> 149

<211> 19

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 149

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser Phe

<210> 150

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 150

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys Ser

<210> 151

<211> 17

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 151

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

Lys

<210> 152

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 152

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys

1 5 10 15

<210> 153

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 153

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe

1 5 10 15

<210> 154

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 154

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser

1 5 10

<210> 155

<211> 13

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 155

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe

1 5 10

<210> 156

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 156

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg

1 5 10

<210> 157

<211> 11

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 157

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys

1 5 10

<210> 158

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 158

Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys

1 5 10

<210> 159

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 159

Gly Ala Gln Glu Ser Lys Lys Lys Lys

1 5

<210> 160

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 160

Gly Ala Gln Glu Ser Lys Lys Lys

1 5

<210> 161

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 161

Gly Ala Gln Glu Ser Lys Lys

1 5

<210> 162

<211> 30

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 162

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg Asn Arg Lys

20 25 30

<210> 163

<211> 29

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 163

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg Asn Arg

20 25

<210> 164

<211> 28

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 164

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg Asn

20 25

<210> 165

<211> 27

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 165

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg

20 25

<210> 166

<211> 26

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 166

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys

20 25

<210> 167

<211> 25

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 167

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly Leu Ser Phe

20 25

<210> 168

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 168

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly Leu Ser

20

<210> 169

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 169

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly Leu

20

<210> 170

<211> 22

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 170

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser Gly

20

<210> 171

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 171

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu Ser

20

<210> 172

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 172

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys Leu

20

<210> 173

<211> 19

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 173

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe Lys

<210> 174

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 174

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro Phe

<210> 175

<211> 17

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 175

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

Pro

<210> 176

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 176

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys

1 5 10 15

<210> 177

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 177

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys

1 5 10 15

<210> 178

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 178

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe

1 5 10

<210> 179

<211> 13

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 179

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser

1 5 10

<210> 180

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 180

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe

1 5 10

<210> 181

<211> 11

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 181

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys

1 5 10

<210> 182

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 182

Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys

1 5 10

<210> 183

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 183

Gly Ser Gln Ser Ser Lys Lys Lys Lys

1 5

<210> 184

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 184

Gly Ser Gln Ser Ser Lys Lys Lys

1 5

<210> 185

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 185

Gly Ser Gln Ser Ser Lys Lys

1 5

<210> 186

<211> 731

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 186

Pro Ser Ala Arg Pro Pro Pro Ser Leu Ser Leu Arg Glu Gly Glu Pro

1 5 10 15

Phe Glu Leu Arg Cys Thr Ala Ala Ser Ala Ser Pro Leu His Thr His

20 25 30

Leu Ala Leu Leu Trp Glu Val His Arg Gly Pro Ala Arg Arg Ser Val

35 40 45

Leu Ala Leu Thr His Glu Gly Arg Phe His Pro Gly Leu Gly Tyr Glu

50 55 60

Gln Arg Tyr His Ser Gly Asp Val Arg Leu Asp Thr Val Gly Ser Asp

65 70 75 80

Ala Tyr Arg Leu Ser Val Ser Arg Ala Leu Ser Ala Asp Gln Gly Ser

85 90 95

Tyr Arg Cys Ile Val Ser Glu Trp Ile Ala Glu Gln Gly Asn Trp Gln

100 105 110

Glu Ile Gln Glu Lys Ala Val Glu Val Ala Thr Val Val Ile Gln Pro

115 120 125

Ser Val Leu Arg Ala Ala Val Pro Lys Asn Val Ser Val Ala Glu Gly

130 135 140

Lys Glu Leu Asp Leu Thr Cys Asn Ile Thr Thr Asp Arg Ala Asp Asp

145 150 155 160

Val Arg Pro Glu Val Thr Trp Ser Phe Ser Arg Met Pro Asp Ser Thr

165 170 175

Leu Pro Gly Ser Arg Val Leu Ala Arg Leu Asp Arg Asp Ser Leu Val

180 185 190

His Ser Ser Pro His Val Ala Leu Ser His Val Asp Ala Arg Ser Tyr

195 200 205

His Leu Leu Val Arg Asp Val Ser Lys Glu Asn Ser Gly Tyr Tyr Tyr

210 215 220

Cys His Val Ser Leu Trp Ala Pro Gly His Asn Arg Ser Trp His Lys

225 230 235 240

Val Ala Glu Ala Val Ser Ser Pro Ala Gly Val Gly Val Thr Trp Leu

245 250 255

Glu Pro Asp Tyr Gln Val Tyr Leu Asn Ala Ser Lys Val Pro Gly Phe

260 265 270

Ala Asp Asp Pro Thr Glu Leu Ala Cys Arg Val Val Asp Thr Lys Ser

275 280 285

Gly Glu Ala Asn Val Arg Phe Thr Val Ser Trp Tyr Tyr Arg Met Asn

290 295 300

Arg Arg Ser Asp Asn Val Val Thr Ser Glu Leu Leu Ala Val Met Asp

305 310 315 320

Gly Asp Trp Thr Leu Lys Tyr Gly Glu Arg Ser Lys Gln Arg Ala Gln

325 330 335

Asp Gly Asp Phe Ile Phe Ser Lys Glu His Thr Asp Thr Phe Asn Phe

340 345 350

Arg Ile Gln Arg Thr Thr Glu Glu Asp Arg Gly Asn Tyr Tyr Cys Val

355 360 365

Val Ser Ala Trp Thr Lys Gln Arg Asn Asn Ser Trp Val Lys Ser Lys

370 375 380

Asp Val Phe Ser Lys Pro Val Asn Ile Phe Trp Ala Leu Glu Asp Ser

385 390 395 400

Val Leu Val Val Lys Ala Arg Gln Pro Lys Pro Phe Phe Ala Ala Gly

405 410 415

Asn Thr Phe Glu Met Thr Cys Lys Val Ser Ser Lys Asn Ile Lys Ser

420 425 430

Pro Arg Tyr Ser Val Leu Ile Met Ala Glu Lys Pro Val Gly Asp Leu

435 440 445

Ser Ser Pro Asn Glu Thr Lys Tyr Ile Ile Ser Leu Asp Gln Asp Ser

450 455 460

Val Val Lys Leu Glu Asn Trp Thr Asp Ala Ser Arg Val Asp Gly Val

465 470 475 480

Val Leu Glu Lys Val Gln Glu Asp Glu Phe Arg Tyr Arg Met Tyr Gln

485 490 495

Thr Gln Val Ser Asp Ala Gly Leu Tyr Arg Cys Met Val Thr Ala Trp

500 505 510

Ser Pro Val Arg Gly Ser Leu Trp Arg Glu Ala Ala Thr Ser Leu Ser

515 520 525

Asn Pro Ile Glu Ile Asp Phe Gln Thr Ser Gly Pro Ile Phe Asn Ala

530 535 540

Ser Val His Ser Asp Thr Pro Ser Val Ile Arg Gly Asp Leu Ile Lys

545 550 555 560

Leu Phe Cys Ile Ile Thr Val Glu Gly Ala Ala Leu Asp Pro Asp Asp

565 570 575

Met Ala Phe Asp Val Ser Trp Phe Ala Val His Ser Phe Gly Leu Asp

580 585 590

Lys Ala Pro Val Leu Leu Ser Ser Leu Asp Arg Lys Gly Ile Val Thr

595 600 605

Thr Ser Arg Arg Asp Trp Lys Ser Asp Leu Ser Leu Glu Arg Val Ser

610 615 620

Val Leu Glu Phe Leu Leu Gln Val His Gly Ser Glu Asp Gln Asp Phe

625 630 635 640

Gly Asn Tyr Tyr Cys Ser Val Thr Pro Trp Val Lys Ser Pro Thr Gly

645 650 655

Ser Trp Gln Lys Glu Ala Glu Ile His Ser Lys Pro Val Phe Ile Thr

660 665 670

Val Lys Met Asp Val Leu Asn Ala Phe Lys Tyr Pro Leu Leu Ile Gly

675 680 685

Val Gly Leu Ser Thr Val Ile Gly Leu Leu Ser Cys Leu Ile Gly Tyr

690 695 700

Cys Ser Ser His Trp Cys Cys Lys Lys Glu Val Gln Glu Thr Arg Arg

705 710 715 720

Glu Arg Arg Arg Leu Met Ser Met Glu Met Asp

725 730

<210> 187

<211> 611

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 187

Val Ala Thr Val Val Ile Gln Pro Ser Val Leu Arg Ala Ala Val Pro

1 5 10 15

Lys Asn Val Ser Val Ala Glu Gly Lys Glu Leu Asp Leu Thr Cys Asn

20 25 30

Ile Thr Thr Asp Arg Ala Asp Asp Val Arg Pro Glu Val Thr Trp Ser

35 40 45

Phe Ser Arg Met Pro Asp Ser Thr Leu Pro Gly Ser Arg Val Leu Ala

50 55 60

Arg Leu Asp Arg Asp Ser Leu Val His Ser Ser Pro His Val Ala Leu

65 70 75 80

Ser His Val Asp Ala Arg Ser Tyr His Leu Leu Val Arg Asp Val Ser

85 90 95

Lys Glu Asn Ser Gly Tyr Tyr Tyr Cys His Val Ser Leu Trp Ala Pro

100 105 110

Gly His Asn Arg Ser Trp His Lys Val Ala Glu Ala Val Ser Ser Pro

115 120 125

Ala Gly Val Gly Val Thr Trp Leu Glu Pro Asp Tyr Gln Val Tyr Leu

130 135 140

Asn Ala Ser Lys Val Pro Gly Phe Ala Asp Asp Pro Thr Glu Leu Ala

145 150 155 160

Cys Arg Val Val Asp Thr Lys Ser Gly Glu Ala Asn Val Arg Phe Thr

165 170 175

Val Ser Trp Tyr Tyr Arg Met Asn Arg Arg Ser Asp Asn Val Val Thr

180 185 190

Ser Glu Leu Leu Ala Val Met Asp Gly Asp Trp Thr Leu Lys Tyr Gly

195 200 205

Glu Arg Ser Lys Gln Arg Ala Gln Asp Gly Asp Phe Ile Phe Ser Lys

210 215 220

Glu His Thr Asp Thr Phe Asn Phe Arg Ile Gln Arg Thr Thr Glu Glu

225 230 235 240

Asp Arg Gly Asn Tyr Tyr Cys Val Val Ser Ala Trp Thr Lys Gln Arg

245 250 255

Asn Asn Ser Trp Val Lys Ser Lys Asp Val Phe Ser Lys Pro Val Asn

260 265 270

Ile Phe Trp Ala Leu Glu Asp Ser Val Leu Val Val Lys Ala Arg Gln

275 280 285

Pro Lys Pro Phe Phe Ala Ala Gly Asn Thr Phe Glu Met Thr Cys Lys

290 295 300

Val Ser Ser Lys Asn Ile Lys Ser Pro Arg Tyr Ser Val Leu Ile Met

305 310 315 320

Ala Glu Lys Pro Val Gly Asp Leu Ser Ser Pro Asn Glu Thr Lys Tyr

325 330 335

Ile Ile Ser Leu Asp Gln Asp Ser Val Val Lys Leu Glu Asn Trp Thr

340 345 350

Asp Ala Ser Arg Val Asp Gly Val Val Leu Glu Lys Val Gln Glu Asp

355 360 365

Glu Phe Arg Tyr Arg Met Tyr Gln Thr Gln Val Ser Asp Ala Gly Leu

370 375 380

Tyr Arg Cys Met Val Thr Ala Trp Ser Pro Val Arg Gly Ser Leu Trp

385 390 395 400

Arg Glu Ala Ala Thr Ser Leu Ser Asn Pro Ile Glu Ile Asp Phe Gln

405 410 415

Thr Ser Gly Pro Ile Phe Asn Ala Ser Val His Ser Asp Thr Pro Ser

420 425 430

Val Ile Arg Gly Asp Leu Ile Lys Leu Phe Cys Ile Ile Thr Val Glu

435 440 445

Gly Ala Ala Leu Asp Pro Asp Asp Met Ala Phe Asp Val Ser Trp Phe

450 455 460

Ala Val His Ser Phe Gly Leu Asp Lys Ala Pro Val Leu Leu Ser Ser

465 470 475 480

Leu Asp Arg Lys Gly Ile Val Thr Thr Ser Arg Arg Asp Trp Lys Ser

485 490 495

Asp Leu Ser Leu Glu Arg Val Ser Val Leu Glu Phe Leu Leu Gln Val

500 505 510

His Gly Ser Glu Asp Gln Asp Phe Gly Asn Tyr Tyr Cys Ser Val Thr

515 520 525

Pro Trp Val Lys Ser Pro Thr Gly Ser Trp Gln Lys Glu Ala Glu Ile

530 535 540

His Ser Lys Pro Val Phe Ile Thr Val Lys Met Asp Val Leu Asn Ala

545 550 555 560

Phe Lys Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser Thr Val Ile Gly

565 570 575

Leu Leu Ser Cys Leu Ile Gly Tyr Cys Ser Ser His Trp Cys Cys Lys

580 585 590

Lys Glu Val Gln Glu Thr Arg Arg Glu Arg Arg Arg Leu Met Ser Met

595 600 605

Glu Met Asp

610

<210> 188

<211> 485

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 188

Ser Pro Ala Gly Val Gly Val Thr Trp Leu Glu Pro Asp Tyr Gln Val

1 5 10 15

Tyr Leu Asn Ala Ser Lys Val Pro Gly Phe Ala Asp Asp Pro Thr Glu

20 25 30

Leu Ala Cys Arg Val Val Asp Thr Lys Ser Gly Glu Ala Asn Val Arg

35 40 45

Phe Thr Val Ser Trp Tyr Tyr Arg Met Asn Arg Arg Ser Asp Asn Val

50 55 60

Val Thr Ser Glu Leu Leu Ala Val Met Asp Gly Asp Trp Thr Leu Lys

65 70 75 80

Tyr Gly Glu Arg Ser Lys Gln Arg Ala Gln Asp Gly Asp Phe Ile Phe

85 90 95

Ser Lys Glu His Thr Asp Thr Phe Asn Phe Arg Ile Gln Arg Thr Thr

100 105 110

Glu Glu Asp Arg Gly Asn Tyr Tyr Cys Val Val Ser Ala Trp Thr Lys

115 120 125

Gln Arg Asn Asn Ser Trp Val Lys Ser Lys Asp Val Phe Ser Lys Pro

130 135 140

Val Asn Ile Phe Trp Ala Leu Glu Asp Ser Val Leu Val Val Lys Ala

145 150 155 160

Arg Gln Pro Lys Pro Phe Phe Ala Ala Gly Asn Thr Phe Glu Met Thr

165 170 175

Cys Lys Val Ser Ser Lys Asn Ile Lys Ser Pro Arg Tyr Ser Val Leu

180 185 190

Ile Met Ala Glu Lys Pro Val Gly Asp Leu Ser Ser Pro Asn Glu Thr

195 200 205

Lys Tyr Ile Ile Ser Leu Asp Gln Asp Ser Val Val Lys Leu Glu Asn

210 215 220

Trp Thr Asp Ala Ser Arg Val Asp Gly Val Val Leu Glu Lys Val Gln

225 230 235 240

Glu Asp Glu Phe Arg Tyr Arg Met Tyr Gln Thr Gln Val Ser Asp Ala

245 250 255

Gly Leu Tyr Arg Cys Met Val Thr Ala Trp Ser Pro Val Arg Gly Ser

260 265 270

Leu Trp Arg Glu Ala Ala Thr Ser Leu Ser Asn Pro Ile Glu Ile Asp

275 280 285

Phe Gln Thr Ser Gly Pro Ile Phe Asn Ala Ser Val His Ser Asp Thr

290 295 300

Pro Ser Val Ile Arg Gly Asp Leu Ile Lys Leu Phe Cys Ile Ile Thr

305 310 315 320

Val Glu Gly Ala Ala Leu Asp Pro Asp Asp Met Ala Phe Asp Val Ser

325 330 335

Trp Phe Ala Val His Ser Phe Gly Leu Asp Lys Ala Pro Val Leu Leu

340 345 350

Ser Ser Leu Asp Arg Lys Gly Ile Val Thr Thr Ser Arg Arg Asp Trp

355 360 365

Lys Ser Asp Leu Ser Leu Glu Arg Val Ser Val Leu Glu Phe Leu Leu

370 375 380

Gln Val His Gly Ser Glu Asp Gln Asp Phe Gly Asn Tyr Tyr Cys Ser

385 390 395 400

Val Thr Pro Trp Val Lys Ser Pro Thr Gly Ser Trp Gln Lys Glu Ala

405 410 415

Glu Ile His Ser Lys Pro Val Phe Ile Thr Val Lys Met Asp Val Leu

420 425 430

Asn Ala Phe Lys Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser Thr Val

435 440 445

Ile Gly Leu Leu Ser Cys Leu Ile Gly Tyr Cys Ser Ser His Trp Cys

450 455 460

Cys Lys Lys Glu Val Gln Glu Thr Arg Arg Glu Arg Arg Arg Leu Met

465 470 475 480

Ser Met Glu Met Asp

485

<210> 189

<211> 343

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 189

Lys Pro Val Asn Ile Phe Trp Ala Leu Glu Asp Ser Val Leu Val Val

1 5 10 15

Lys Ala Arg Gln Pro Lys Pro Phe Phe Ala Ala Gly Asn Thr Phe Glu

20 25 30

Met Thr Cys Lys Val Ser Ser Lys Asn Ile Lys Ser Pro Arg Tyr Ser

35 40 45

Val Leu Ile Met Ala Glu Lys Pro Val Gly Asp Leu Ser Ser Pro Asn

50 55 60

Glu Thr Lys Tyr Ile Ile Ser Leu Asp Gln Asp Ser Val Val Lys Leu

65 70 75 80

Glu Asn Trp Thr Asp Ala Ser Arg Val Asp Gly Val Val Leu Glu Lys

85 90 95

Val Gln Glu Asp Glu Phe Arg Tyr Arg Met Tyr Gln Thr Gln Val Ser

100 105 110

Asp Ala Gly Leu Tyr Arg Cys Met Val Thr Ala Trp Ser Pro Val Arg

115 120 125

Gly Ser Leu Trp Arg Glu Ala Ala Thr Ser Leu Ser Asn Pro Ile Glu

130 135 140

Ile Asp Phe Gln Thr Ser Gly Pro Ile Phe Asn Ala Ser Val His Ser

145 150 155 160

Asp Thr Pro Ser Val Ile Arg Gly Asp Leu Ile Lys Leu Phe Cys Ile

165 170 175

Ile Thr Val Glu Gly Ala Ala Leu Asp Pro Asp Asp Met Ala Phe Asp

180 185 190

Val Ser Trp Phe Ala Val His Ser Phe Gly Leu Asp Lys Ala Pro Val

195 200 205

Leu Leu Ser Ser Leu Asp Arg Lys Gly Ile Val Thr Thr Ser Arg Arg

210 215 220

Asp Trp Lys Ser Asp Leu Ser Leu Glu Arg Val Ser Val Leu Glu Phe

225 230 235 240

Leu Leu Gln Val His Gly Ser Glu Asp Gln Asp Phe Gly Asn Tyr Tyr

245 250 255

Cys Ser Val Thr Pro Trp Val Lys Ser Pro Thr Gly Ser Trp Gln Lys

260 265 270

Glu Ala Glu Ile His Ser Lys Pro Val Phe Ile Thr Val Lys Met Asp

275 280 285

Val Leu Asn Ala Phe Lys Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser

290 295 300

Thr Val Ile Gly Leu Leu Ser Cys Leu Ile Gly Tyr Cys Ser Ser His

305 310 315 320

Trp Cys Cys Lys Lys Glu Val Gln Glu Thr Arg Arg Glu Arg Arg Arg

325 330 335

Leu Met Ser Met Glu Met Asp

340

<210> 190

<211> 217

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 190

Val Arg Gly Ser Leu Trp Arg Glu Ala Ala Thr Ser Leu Ser Asn Pro

1 5 10 15

Ile Glu Ile Asp Phe Gln Thr Ser Gly Pro Ile Phe Asn Ala Ser Val

20 25 30

His Ser Asp Thr Pro Ser Val Ile Arg Gly Asp Leu Ile Lys Leu Phe

35 40 45

Cys Ile Ile Thr Val Glu Gly Ala Ala Leu Asp Pro Asp Asp Met Ala

50 55 60

Phe Asp Val Ser Trp Phe Ala Val His Ser Phe Gly Leu Asp Lys Ala

65 70 75 80

Pro Val Leu Leu Ser Ser Leu Asp Arg Lys Gly Ile Val Thr Thr Ser

85 90 95

Arg Arg Asp Trp Lys Ser Asp Leu Ser Leu Glu Arg Val Ser Val Leu

100 105 110

Glu Phe Leu Leu Gln Val His Gly Ser Glu Asp Gln Asp Phe Gly Asn

115 120 125

Tyr Tyr Cys Ser Val Thr Pro Trp Val Lys Ser Pro Thr Gly Ser Trp

130 135 140

Gln Lys Glu Ala Glu Ile His Ser Lys Pro Val Phe Ile Thr Val Lys

145 150 155 160

Met Asp Val Leu Asn Ala Phe Lys Tyr Pro Leu Leu Ile Gly Val Gly

165 170 175

Leu Ser Thr Val Ile Gly Leu Leu Ser Cys Leu Ile Gly Tyr Cys Ser

180 185 190

Ser His Trp Cys Cys Lys Lys Glu Val Gln Glu Thr Arg Arg Glu Arg

195 200 205

Arg Arg Leu Met Ser Met Glu Met Asp

210 215

<210> 191

<211> 66

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 191

Ser Lys Pro Val Phe Ile Thr Val Lys Met Asp Val Leu Asn Ala Phe

1 5 10 15

Lys Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser Thr Val Ile Gly Leu

20 25 30

Leu Ser Cys Leu Ile Gly Tyr Cys Ser Ser His Trp Cys Cys Lys Lys

35 40 45

Glu Val Gln Glu Thr Arg Arg Glu Arg Arg Arg Leu Met Ser Met Glu

50 55 60

Met Asp

65

<210> 192

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 192

Met Gly Arg Leu Ala Ser Arg Pro Leu Leu Leu Ala Leu Leu Ser Leu

1 5 10 15

Ala Leu Cys Arg Gly

20

<210> 193

<211> 247

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 193

Pro Gly Thr Val Phe Thr Thr Val Glu Asp Leu Gly Ser Lys Ile Leu

1 5 10 15

Leu Thr Cys Ser Leu Asn Asp Ser Ala Thr Glu Val Thr Gly His Arg

20 25 30

Trp Leu Lys Gly Gly Val Val Leu Lys Glu Asp Ala Leu Pro Gly Gln

35 40 45

Lys Thr Glu Phe Lys Val Asp Ser Asp Asp Gln Trp Gly Glu Tyr Ser

50 55 60

Cys Val Phe Leu Pro Glu Pro Met Gly Thr Ala Asn Ile Gln Leu His

65 70 75 80

Gly Pro Pro Arg Val Lys Ala Val Lys Ser Ser Glu His Ile Asn Glu

85 90 95

Gly Glu Thr Ala Met Leu Val Cys Lys Ser Glu Ser Val Pro Pro Val

100 105 110

Thr Asp Trp Ala Trp Tyr Lys Ile Thr Asp Ser Glu Asp Lys Ala Leu

115 120 125

Met Asn Gly Ser Glu Ser Arg Phe Phe Val Ser Ser Ser Gln Gly Arg

130 135 140

Ser Glu Leu His Ile Glu Asn Leu Asn Met Glu Ala Asp Pro Gly Gln

145 150 155 160

Tyr Arg Cys Asn Gly Thr Ser Ser Lys Gly Ser Asp Gln Ala Ile Ile

165 170 175

Thr Leu Arg Val Arg Ser His Leu Ala Ala Leu Trp Pro Phe Leu Gly

180 185 190

Ile Val Ala Glu Val Leu Val Leu Val Thr Ile Ile Phe Ile Tyr Glu

195 200 205

Lys Arg Arg Lys Pro Glu Asp Val Leu Asp Asp Asp Asp Ala Gly Ser

210 215 220

Ala Pro Leu Lys Ser Ser Gly Gln His Gln Asn Asp Lys Gly Lys Asn

225 230 235 240

Val Arg Gln Arg Asn Ser Ser

245

<210> 194

<211> 168

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 194

His Gly Pro Pro Arg Val Lys Ala Val Lys Ser Ser Glu His Ile Asn

1 5 10 15

Glu Gly Glu Thr Ala Met Leu Val Cys Lys Ser Glu Ser Val Pro Pro

20 25 30

Val Thr Asp Trp Ala Trp Tyr Lys Ile Thr Asp Ser Glu Asp Lys Ala

35 40 45

Leu Met Asn Gly Ser Glu Ser Arg Phe Phe Val Ser Ser Ser Gln Gly

50 55 60

Arg Ser Glu Leu His Ile Glu Asn Leu Asn Met Glu Ala Asp Pro Gly

65 70 75 80

Gln Tyr Arg Cys Asn Gly Thr Ser Ser Lys Gly Ser Asp Gln Ala Ile

85 90 95

Ile Thr Leu Arg Val Arg Ser His Leu Ala Ala Leu Trp Pro Phe Leu

100 105 110

Gly Ile Val Ala Glu Val Leu Val Leu Val Thr Ile Ile Phe Ile Tyr

115 120 125

Glu Lys Arg Arg Lys Pro Glu Asp Val Leu Asp Asp Asp Asp Ala Gly

130 135 140

Ser Ala Pro Leu Lys Ser Ser Gly Gln His Gln Asn Asp Lys Gly Lys

145 150 155 160

Asn Val Arg Gln Arg Asn Ser Ser

165

<210> 195

<211> 66

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 195

Ser His Leu Ala Ala Leu Trp Pro Phe Leu Gly Ile Val Ala Glu Val

1 5 10 15

Leu Val Leu Val Thr Ile Ile Phe Ile Tyr Glu Lys Arg Arg Lys Pro

20 25 30

Glu Asp Val Leu Asp Asp Asp Asp Ala Gly Ser Ala Pro Leu Lys Ser

35 40 45

Ser Gly Gln His Gln Asn Asp Lys Gly Lys Asn Val Arg Gln Arg Asn

50 55 60

Ser Ser

65

<210> 196

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 196

Met Ala Ala Ala Leu Phe Val Leu Leu Gly Phe Ala Leu Leu Gly Thr

1 5 10 15

His Gly

<210> 197

<211> 456

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 197

Ala Pro Pro Gly Pro Arg Gly Arg Gln Ala Pro Thr Ser Pro Pro Arg

1 5 10 15

Met Thr Val His Glu Gly Gln Glu Leu Ala Leu Gly Cys Leu Ala Arg

20 25 30

Thr Ser Thr Gln Lys His Thr His Leu Ala Val Ser Phe Gly Arg Ser

35 40 45

Val Pro Glu Ala Pro Val Gly Arg Ser Thr Leu Gln Glu Val Val Gly

50 55 60

Ile Arg Ser Asp Leu Ala Val Glu Ala Gly Ala Pro Tyr Ala Glu Arg

65 70 75 80

Leu Ala Ala Gly Glu Leu Arg Leu Gly Lys Glu Gly Thr Asp Arg Tyr

85 90 95

Arg Met Val Val Gly Gly Ala Gln Ala Gly Asp Ala Gly Thr Tyr His

100 105 110

Cys Thr Ala Ala Glu Trp Ile Gln Asp Pro Asp Gly Ser Trp Ala Gln

115 120 125

Ile Ala Glu Lys Arg Ala Val Leu Ala His Val Asp Val Gln Thr Leu

130 135 140

Ser Ser Gln Leu Ala Val Thr Val Gly Pro Gly Glu Arg Arg Ile Gly

145 150 155 160

Pro Gly Glu Pro Leu Glu Leu Leu Cys Asn Val Ser Gly Ala Leu Pro

165 170 175

Pro Ala Gly Arg His Ala Ala Tyr Ser Val Gly Trp Glu Met Ala Pro

180 185 190

Ala Gly Ala Pro Gly Pro Gly Arg Leu Val Ala Gln Leu Asp Thr Glu

195 200 205

Gly Val Gly Ser Leu Gly Pro Gly Tyr Glu Gly Arg His Ile Ala Met

210 215 220

Glu Lys Val Ala Ser Arg Thr Tyr Arg Leu Arg Leu Glu Ala Ala Arg

225 230 235 240

Pro Gly Asp Ala Gly Thr Tyr Arg Cys Leu Ala Lys Ala Tyr Val Arg

245 250 255

Gly Ser Gly Thr Arg Leu Arg Glu Ala Ala Ser Ala Arg Ser Arg Pro

260 265 270

Leu Pro Val His Val Arg Glu Glu Gly Val Val Leu Glu Ala Val Ala

275 280 285

Trp Leu Ala Gly Gly Thr Val Tyr Arg Gly Glu Thr Ala Ser Leu Leu

290 295 300

Cys Asn Ile Ser Val Arg Gly Gly Pro Pro Gly Leu Arg Leu Ala Ala

305 310 315 320

Ser Trp Trp Val Glu Arg Pro Glu Asp Gly Glu Leu Ser Ser Val Pro

325 330 335

Ala Gln Leu Val Gly Gly Val Gly Gln Asp Gly Val Ala Glu Leu Gly

340 345 350

Val Arg Pro Gly Gly Gly Pro Val Ser Val Glu Leu Val Gly Pro Arg

355 360 365

Ser His Arg Leu Arg Leu His Ser Leu Gly Pro Glu Asp Glu Gly Val

370 375 380

Tyr His Cys Ala Pro Ser Ala Trp Val Gln His Ala Asp Tyr Ser Trp

385 390 395 400

Tyr Gln Ala Gly Ser Ala Arg Ser Gly Pro Val Thr Val Tyr Pro Tyr

405 410 415

Met His Ala Leu Asp Thr Leu Phe Val Pro Leu Leu Val Gly Thr Gly

420 425 430

Val Ala Leu Val Thr Gly Ala Thr Val Leu Gly Thr Ile Thr Cys Cys

435 440 445

Phe Met Lys Arg Leu Arg Lys Arg

450 455

<210> 198

<211> 320

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 198

Ala His Val Asp Val Gln Thr Leu Ser Ser Gln Leu Ala Val Thr Val

1 5 10 15

Gly Pro Gly Glu Arg Arg Ile Gly Pro Gly Glu Pro Leu Glu Leu Leu

20 25 30

Cys Asn Val Ser Gly Ala Leu Pro Pro Ala Gly Arg His Ala Ala Tyr

35 40 45

Ser Val Gly Trp Glu Met Ala Pro Ala Gly Ala Pro Gly Pro Gly Arg

50 55 60

Leu Val Ala Gln Leu Asp Thr Glu Gly Val Gly Ser Leu Gly Pro Gly

65 70 75 80

Tyr Glu Gly Arg His Ile Ala Met Glu Lys Val Ala Ser Arg Thr Tyr

85 90 95

Arg Leu Arg Leu Glu Ala Ala Arg Pro Gly Asp Ala Gly Thr Tyr Arg

100 105 110

Cys Leu Ala Lys Ala Tyr Val Arg Gly Ser Gly Thr Arg Leu Arg Glu

115 120 125

Ala Ala Ser Ala Arg Ser Arg Pro Leu Pro Val His Val Arg Glu Glu

130 135 140

Gly Val Val Leu Glu Ala Val Ala Trp Leu Ala Gly Gly Thr Val Tyr

145 150 155 160

Arg Gly Glu Thr Ala Ser Leu Leu Cys Asn Ile Ser Val Arg Gly Gly

165 170 175

Pro Pro Gly Leu Arg Leu Ala Ala Ser Trp Trp Val Glu Arg Pro Glu

180 185 190

Asp Gly Glu Leu Ser Ser Val Pro Ala Gln Leu Val Gly Gly Val Gly

195 200 205

Gln Asp Gly Val Ala Glu Leu Gly Val Arg Pro Gly Gly Gly Pro Val

210 215 220

Ser Val Glu Leu Val Gly Pro Arg Ser His Arg Leu Arg Leu His Ser

225 230 235 240

Leu Gly Pro Glu Asp Glu Gly Val Tyr His Cys Ala Pro Ser Ala Trp

245 250 255

Val Gln His Ala Asp Tyr Ser Trp Tyr Gln Ala Gly Ser Ala Arg Ser

260 265 270

Gly Pro Val Thr Val Tyr Pro Tyr Met His Ala Leu Asp Thr Leu Phe

275 280 285

Val Pro Leu Leu Val Gly Thr Gly Val Ala Leu Val Thr Gly Ala Thr

290 295 300

Val Leu Gly Thr Ile Thr Cys Cys Phe Met Lys Arg Leu Arg Lys Arg

305 310 315 320

<210> 199

<211> 179

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 199

Arg Glu Glu Gly Val Val Leu Glu Ala Val Ala Trp Leu Ala Gly Gly

1 5 10 15

Thr Val Tyr Arg Gly Glu Thr Ala Ser Leu Leu Cys Asn Ile Ser Val

20 25 30

Arg Gly Gly Pro Pro Gly Leu Arg Leu Ala Ala Ser Trp Trp Val Glu

35 40 45

Arg Pro Glu Asp Gly Glu Leu Ser Ser Val Pro Ala Gln Leu Val Gly

50 55 60

Gly Val Gly Gln Asp Gly Val Ala Glu Leu Gly Val Arg Pro Gly Gly

65 70 75 80

Gly Pro Val Ser Val Glu Leu Val Gly Pro Arg Ser His Arg Leu Arg

85 90 95

Leu His Ser Leu Gly Pro Glu Asp Glu Gly Val Tyr His Cys Ala Pro

100 105 110

Ser Ala Trp Val Gln His Ala Asp Tyr Ser Trp Tyr Gln Ala Gly Ser

115 120 125

Ala Arg Ser Gly Pro Val Thr Val Tyr Pro Tyr Met His Ala Leu Asp

130 135 140

Thr Leu Phe Val Pro Leu Leu Val Gly Thr Gly Val Ala Leu Val Thr

145 150 155 160

Gly Ala Thr Val Leu Gly Thr Ile Thr Cys Cys Phe Met Lys Arg Leu

165 170 175

Arg Lys Arg

<210> 200

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 200

Val Ala Leu Val Thr Gly Ala Thr Val Leu Gly Thr Ile Thr Cys Cys

1 5 10 15

Phe Met Lys Arg Leu Arg Lys Arg

20

<210> 201

<211> 27

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 201

Met Gly Ala Leu Arg Pro Thr Leu Leu Pro Pro Ser Leu Pro Leu Leu

1 5 10 15

Leu Leu Leu Met Leu Gly Met Gly Cys Trp Ala

20 25

<210> 202

<211> 1021

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 202

Met Ala Gly Ile Ser Tyr Val Ala Ser Phe Phe Leu Leu Leu Thr Lys

1 5 10 15

Leu Ser Ile Gly Gln Arg Glu Val Thr Val Gln Lys Gly Pro Leu Phe

20 25 30

Arg Ala Glu Gly Tyr Pro Val Ser Ile Gly Cys Asn Val Thr Gly His

35 40 45

Gln Gly Pro Ser Glu Gln His Phe Gln Trp Ser Val Tyr Leu Pro Thr

50 55 60

Asn Pro Thr Gln Glu Val Gln Ile Ile Ser Thr Lys Asp Ala Ala Phe

65 70 75 80

Ser Tyr Ala Val Tyr Thr Gln Arg Val Arg Ser Gly Asp Val Tyr Val

85 90 95

Glu Arg Val Gln Gly Asn Ser Val Leu Leu His Ile Ser Lys Leu Gln

100 105 110

Met Lys Asp Ala Gly Glu Tyr Glu Cys His Thr Pro Asn Thr Asp Glu

115 120 125

Lys Tyr Tyr Gly Ser Tyr Ser Ala Lys Thr Asn Leu Ile Val Ile Pro

130 135 140

Asp Thr Leu Ser Ala Thr Met Ser Ser Gln Thr Leu Gly Lys Glu Glu

145 150 155 160

Gly Glu Pro Leu Ala Leu Thr Cys Glu Ala Ser Lys Ala Thr Ala Gln

165 170 175

His Thr His Leu Ser Val Thr Trp Tyr Leu Thr Gln Asp Gly Gly Gly

180 185 190

Ser Gln Ala Thr Glu Ile Ile Ser Leu Ser Lys Asp Phe Ile Leu Val

195 200 205

Pro Gly Pro Leu Tyr Thr Glu Arg Phe Ala Ala Ser Asp Val Gln Leu

210 215 220

Asn Lys Leu Gly Pro Thr Thr Phe Arg Leu Ser Ile Glu Arg Leu Gln

225 230 235 240

Ser Ser Asp Gln Gly Gln Leu Phe Cys Glu Ala Thr Glu Trp Ile Gln

245 250 255

Asp Pro Asp Glu Thr Trp Met Phe Ile Thr Lys Lys Gln Thr Asp Gln

260 265 270

Thr Thr Leu Arg Ile Gln Pro Ala Val Lys Asp Phe Gln Val Asn Ile

275 280 285

Thr Ala Asp Ser Leu Phe Ala Glu Gly Lys Pro Leu Glu Leu Val Cys

290 295 300

Leu Val Val Ser Ser Gly Arg Asp Pro Gln Leu Gln Gly Ile Trp Phe

305 310 315 320

Phe Asn Gly Thr Glu Ile Ala His Ile Asp Ala Gly Gly Val Leu Gly

325 330 335

Leu Lys Asn Asp Tyr Lys Glu Arg Ala Ser Gln Gly Glu Leu Gln Val

340 345 350

Ser Lys Leu Gly Pro Lys Ala Phe Ser Leu Lys Ile Phe Ser Leu Gly

355 360 365

Pro Glu Asp Glu Gly Ala Tyr Arg Cys Val Val Ala Glu Val Met Lys

370 375 380

Thr Arg Thr Gly Ser Trp Gln Val Leu Gln Arg Lys Gln Ser Pro Asp

385 390 395 400

Ser His Val His Leu Arg Lys Pro Ala Ala Arg Ser Val Val Met Ser

405 410 415

Thr Lys Asn Lys Gln Gln Val Val Trp Glu Gly Glu Thr Leu Ala Phe

420 425 430

Leu Cys Lys Ala Gly Gly Ala Glu Ser Pro Leu Ser Val Ser Trp Trp

435 440 445

His Ile Pro Arg Asp Gln Thr Gln Pro Glu Phe Val Ala Gly Met Gly

450 455 460

Gln Asp Gly Ile Val Gln Leu Gly Ala Ser Tyr Gly Val Pro Ser Tyr

465 470 475 480

His Gly Asn Thr Arg Leu Glu Lys Met Asp Trp Ala Thr Phe Gln Leu

485 490 495

Glu Ile Thr Phe Thr Ala Ile Thr Asp Ser Gly Thr Tyr Glu Cys Arg

500 505 510

Val Ser Glu Lys Ser Arg Asn Gln Ala Arg Asp Leu Ser Trp Thr Gln

515 520 525

Lys Ile Ser Val Thr Val Lys Ser Leu Glu Ser Ser Leu Gln Val Ser

530 535 540

Leu Met Ser Arg Gln Pro Gln Val Met Leu Thr Asn Thr Phe Asp Leu

545 550 555 560

Ser Cys Val Val Arg Ala Gly Tyr Ser Asp Leu Lys Val Pro Leu Thr

565 570 575

Val Thr Trp Gln Phe Gln Pro Ala Ser Ser His Ile Phe His Gln Leu

580 585 590

Ile Arg Ile Thr His Asn Gly Thr Ile Glu Trp Gly Asn Phe Leu Ser

595 600 605

Arg Phe Gln Lys Lys Thr Lys Val Ser Gln Ser Leu Phe Arg Ser Gln

610 615 620

Leu Leu Val His Asp Ala Thr Glu Glu Glu Thr Gly Val Tyr Gln Cys

625 630 635 640

Glu Val Glu Val Tyr Asp Arg Asn Ser Leu Tyr Asn Asn Arg Pro Pro

645 650 655

Arg Ala Ser Ala Ile Ser His Pro Leu Arg Ile Ala Val Thr Leu Pro

660 665 670

Glu Ser Lys Leu Lys Val Asn Ser Arg Ser Gln Val Gln Glu Leu Ser

675 680 685

Ile Asn Ser Asn Thr Asp Ile Glu Cys Ser Ile Leu Ser Arg Ser Asn

690 695 700

Gly Asn Leu Gln Leu Ala Ile Ile Trp Tyr Phe Ser Pro Val Ser Thr

705 710 715 720

Asn Ala Ser Trp Leu Lys Ile Leu Glu Met Asp Gln Thr Asn Val Ile

725 730 735

Lys Thr Gly Asp Glu Phe His Thr Pro Gln Arg Lys Gln Lys Phe His

740 745 750

Thr Glu Lys Val Ser Gln Asp Leu Phe Gln Leu His Ile Leu Asn Val

755 760 765

Glu Asp Ser Asp Arg Gly Lys Tyr His Cys Ala Val Glu Glu Trp Leu

770 775 780

Leu Ser Thr Asn Gly Thr Trp His Lys Leu Gly Glu Lys Lys Ser Gly

785 790 795 800

Leu Thr Glu Leu Lys Leu Lys Pro Thr Gly Ser Lys Val Arg Val Ser

805 810 815

Lys Val Tyr Trp Thr Glu Asn Val Thr Glu His Arg Glu Val Ala Ile

820 825 830

Arg Cys Ser Leu Glu Ser Val Gly Ser Ser Ala Thr Leu Tyr Ser Val

835 840 845

Met Trp Tyr Trp Asn Arg Glu Asn Ser Gly Ser Lys Leu Leu Val His

850 855 860

Leu Gln His Asp Gly Leu Leu Glu Tyr Gly Glu Glu Gly Leu Arg Arg

865 870 875 880

His Leu His Cys Tyr Arg Ser Ser Ser Thr Asp Phe Val Leu Lys Leu

885 890 895

His Gln Val Glu Met Glu Asp Ala Gly Met Tyr Trp Cys Arg Val Ala

900 905 910

Glu Trp Gln Leu His Gly His Pro Ser Lys Trp Ile Asn Gln Ala Ser

915 920 925

Asp Glu Ser Gln Arg Met Val Leu Thr Val Leu Pro Ser Glu Pro Thr

930 935 940

Leu Pro Ser Arg Ile Cys Ser Ser Ala Pro Leu Leu Tyr Phe Leu Phe

945 950 955 960

Ile Cys Pro Phe Val Leu Leu Leu Leu Leu Leu Ile Ser Leu Leu Cys

965 970 975

Leu Tyr Trp Lys Ala Arg Lys Leu Ser Thr Leu Arg Ser Asn Thr Arg

980 985 990

Lys Glu Lys Ala Leu Trp Val Asp Leu Lys Glu Ala Gly Gly Val Thr

995 1000 1005

Thr Asn Arg Arg Glu Asp Glu Glu Glu Asp Glu Gly Asn

1010 1015 1020

<210> 203

<211> 1195

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 203

Met Lys Cys Phe Phe Pro Val Leu Ser Cys Leu Ala Val Leu Gly Val

1 5 10 15

Val Ser Ala Gln Arg Gln Val Thr Val Gln Glu Gly Pro Leu Tyr Arg

20 25 30

Thr Glu Gly Ser His Ile Thr Ile Trp Cys Asn Val Ser Gly Tyr Gln

35 40 45

Gly Pro Ser Glu Gln Asn Phe Gln Trp Ser Ile Tyr Leu Pro Ser Ser

50 55 60

Pro Glu Arg Glu Val Gln Ile Val Ser Thr Met Asp Ser Ser Phe Pro

65 70 75 80

Tyr Ala Ile Tyr Thr Gln Arg Val Arg Gly Gly Lys Ile Phe Ile Glu

85 90 95

Arg Val Gln Gly Asn Ser Thr Leu Leu His Ile Thr Asp Leu Gln Ala

100 105 110

Arg Asp Ala Gly Glu Tyr Glu Cys His Thr Pro Ser Thr Asp Lys Gln

115 120 125

Tyr Phe Gly Ser Tyr Ser Ala Lys Met Asn Leu Val Val Ile Pro Asp

130 135 140

Ser Leu Gln Thr Thr Ala Met Pro Gln Thr Leu His Arg Val Glu Gln

145 150 155 160

Asp Pro Leu Glu Leu Thr Cys Glu Val Ala Ser Glu Thr Ile Gln His

165 170 175

Ser His Leu Ser Val Ala Trp Leu Arg Gln Lys Val Gly Glu Lys Pro

180 185 190

Val Glu Val Ile Ser Leu Ser Arg Asp Phe Met Leu His Ser Ser Ser

195 200 205

Glu Tyr Ala Gln Arg Gln Ser Leu Gly Glu Val Arg Leu Asp Lys Leu

210 215 220

Gly Arg Thr Thr Phe Arg Leu Thr Ile Phe His Leu Gln Pro Ser Asp

225 230 235 240

Gln Gly Glu Phe Tyr Cys Glu Ala Ala Glu Trp Ile Gln Asp Pro Asp

245 250 255

Gly Ser Trp Tyr Ala Met Thr Arg Lys Arg Ser Glu Gly Ala Val Val

260 265 270

Asn Val Gln Pro Thr Asp Lys Glu Phe Thr Val Arg Leu Glu Thr Glu

275 280 285

Lys Arg Leu His Thr Val Gly Glu Pro Val Glu Phe Arg Cys Ile Leu

290 295 300

Glu Ala Gln Asn Val Pro Asp Arg Tyr Phe Ala Val Ser Trp Ala Phe

305 310 315 320

Asn Ser Ser Leu Ile Ala Thr Met Gly Pro Asn Ala Val Pro Val Leu

325 330 335

Asn Ser Glu Phe Ala His Arg Glu Ala Arg Gly Gln Leu Lys Val Ala

340 345 350

Lys Glu Ser Asp Ser Val Phe Val Leu Lys Ile Tyr His Leu Arg Gln

355 360 365

Glu Asp Ser Gly Lys Tyr Asn Cys Arg Val Thr Glu Arg Glu Lys Thr

370 375 380

Val Thr Gly Glu Phe Ile Asp Lys Glu Ser Lys Arg Pro Lys Asn Ile

385 390 395 400

Pro Ile Ile Val Leu Pro Leu Lys Ser Ser Ile Ser Val Glu Val Ala

405 410 415

Ser Asn Ala Ser Val Ile Leu Glu Gly Glu Asp Leu Arg Phe Ser Cys

420 425 430

Ser Val Arg Thr Ala Gly Arg Pro Gln Gly Arg Phe Ser Val Ile Trp

435 440 445

Gln Leu Val Asp Arg Gln Asn Arg Arg Ser Asn Ile Met Trp Leu Asp

450 455 460

Arg Asp Gly Thr Val Gln Pro Gly Ser Ser Tyr Trp Glu Arg Ser Ser

465 470 475 480

Phe Gly Gly Val Gln Met Glu Gln Val Gln Pro Asn Ser Phe Ser Leu

485 490 495

Gly Ile Phe Asn Ser Arg Lys Glu Asp Glu Gly Gln Tyr Glu Cys His

500 505 510

Val Thr Glu Trp Val Arg Ala Val Asp Gly Glu Trp Gln Ile Val Gly

515 520 525

Glu Arg Arg Ala Ser Thr Pro Ile Ser Ile Thr Ala Leu Glu Met Gly

530 535 540

Phe Ala Val Thr Ala Ile Ser Arg Thr Pro Gly Val Thr Tyr Ser Asp

545 550 555 560

Ser Phe Asp Leu Gln Cys Ile Ile Lys Pro His Tyr Pro Ala Trp Val

565 570 575

Pro Val Ser Val Thr Trp Arg Phe Gln Pro Val Gly Thr Val Glu Phe

580 585 590

His Asp Leu Val Thr Phe Thr Arg Asp Gly Gly Val Gln Trp Gly Asp

595 600 605

Arg Ser Ser Ser Phe Arg Thr Arg Thr Ala Ile Glu Lys Ala Glu Ser

610 615 620

Ser Asn Asn Val Arg Leu Ser Ile Ser Arg Ala Ser Asp Thr Glu Ala

625 630 635 640

Gly Lys Tyr Gln Cys Val Ala Glu Leu Trp Arg Lys Asn Tyr Asn Asn

645 650 655

Thr Trp Thr Arg Leu Ala Glu Arg Thr Ser Asn Leu Leu Glu Ile Arg

660 665 670

Val Leu Gln Pro Val Thr Lys Leu Gln Val Ser Lys Ser Lys Arg Thr

675 680 685

Leu Thr Leu Val Glu Asn Lys Pro Ile Gln Leu Asn Cys Ser Val Lys

690 695 700

Ser Gln Thr Ser Gln Asn Ser His Phe Ala Val Leu Trp Tyr Val His

705 710 715 720

Lys Pro Ser Asp Ala Asp Gly Lys Leu Ile Leu Lys Thr Thr His Asn

725 730 735

Ser Ala Phe Glu Tyr Gly Thr Tyr Ala Glu Glu Glu Gly Leu Arg Ala

740 745 750

Arg Leu Gln Phe Glu Arg His Val Ser Gly Gly Leu Phe Ser Leu Thr

755 760 765

Val Gln Arg Ala Glu Val Ser Asp Ser Gly Ser Tyr Tyr Cys His Val

770 775 780

Glu Glu Trp Leu Leu Ser Pro Asn Tyr Ala Trp Tyr Lys Leu Ala Glu

785 790 795 800

Glu Val Ser Gly Arg Thr Glu Val Thr Val Lys Gln Pro Asp Ser Arg

805 810 815

Leu Arg Leu Ser Gln Ala Gln Gly Asn Leu Ser Val Leu Glu Thr Arg

820 825 830

Gln Val Gln Leu Glu Cys Val Val Leu Asn Arg Thr Ser Ile Thr Ser

835 840 845

Gln Leu Met Val Glu Trp Phe Val Trp Lys Pro Asn His Pro Glu Arg

850 855 860

Glu Thr Val Ala Arg Leu Ser Arg Asp Ala Thr Phe His Tyr Gly Glu

865 870 875 880

Gln Ala Ala Lys Asn Asn Leu Lys Gly Arg Leu His Leu Glu Ser Pro

885 890 895

Ser Pro Gly Val Tyr Arg Leu Phe Ile Gln Asn Val Ala Val Gln Asp

900 905 910

Ser Gly Thr Tyr Ser Cys His Val Glu Glu Trp Leu Pro Ser Pro Ser

915 920 925

Gly Met Trp Tyr Lys Arg Ala Glu Asp Thr Ala Gly Gln Thr Ala Leu

930 935 940

Thr Val Met Arg Pro Asp Ala Ser Leu Gln Val Asp Thr Val Val Pro

945 950 955 960

Asn Ala Thr Val Ser Glu Lys Ala Ala Phe Gln Leu Asp Cys Ser Ile

965 970 975

Val Ser Arg Ser Ser Gln Asp Ser Arg Phe Ala Val Ala Trp Tyr Ser

980 985 990

Leu Arg Thr Lys Ala Gly Gly Lys Arg Ser Ser Pro Gly Leu Glu Glu

995 1000 1005

Gln Glu Glu Glu Arg Glu Glu Glu Glu Glu Glu Glu Glu Asp Asp

1010 1015 1020

Asp Asp Asp Asp Pro Thr Glu Arg Thr Ala Leu Leu Ser Val Gly

1025 1030 1035

Pro Asp Ala Val Phe Gly Pro Glu Gly Ser Pro Trp Glu Gly Arg

1040 1045 1050

Leu Arg Phe Gln Arg Leu Ser Pro Val Leu Tyr Arg Leu Thr Val

1055 1060 1065

Leu Gln Ala Ser Pro Gln Asp Thr Gly Asn Tyr Ser Cys His Val

1070 1075 1080

Glu Glu Trp Leu Pro Ser Pro Gln Lys Glu Trp Tyr Arg Leu Thr

1085 1090 1095

Glu Glu Glu Ser Ala Pro Ile Gly Ile Arg Val Leu Asp Thr Ser

1100 1105 1110

Pro Thr Leu Gln Ser Ile Ile Cys Ser Asn Asp Ala Leu Phe Tyr

1115 1120 1125

Phe Val Phe Phe Tyr Pro Phe Pro Ile Phe Gly Ile Leu Ile Ile

1130 1135 1140

Thr Ile Leu Leu Val Arg Phe Lys Ser Arg Asn Ser Ser Lys Asn

1145 1150 1155

Ser Asp Gly Lys Asn Gly Val Pro Leu Leu Trp Ile Lys Glu Pro

1160 1165 1170

His Leu Asn Tyr Ser Pro Thr Cys Leu Glu Pro Pro Val Leu Ser

1175 1180 1185

Ile His Pro Gly Ala Ile Asp

1190 1195

<210> 204

<211> 1023

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 204

Met Gly Lys Gly Val Gly Arg Asp Lys Tyr Glu Pro Ala Ala Val Ser

1 5 10 15

Glu Gln Gly Asp Lys Lys Gly Lys Lys Gly Lys Lys Asp Arg Asp Met

20 25 30

Asp Glu Leu Lys Lys Glu Val Ser Met Asp Asp His Lys Leu Ser Leu

35 40 45

Asp Glu Leu His Arg Lys Tyr Gly Thr Asp Leu Ser Arg Gly Leu Thr

50 55 60

Ser Ala Arg Ala Ala Glu Ile Leu Ala Arg Asp Gly Pro Asn Ala Leu

65 70 75 80

Thr Pro Pro Pro Thr Thr Pro Glu Trp Ile Lys Phe Cys Arg Gln Leu

85 90 95

Phe Gly Gly Phe Ser Met Leu Leu Trp Ile Gly Ala Ile Leu Cys Phe

100 105 110

Leu Ala Tyr Ser Ile Gln Ala Ala Thr Glu Glu Glu Pro Gln Asn Asp

115 120 125

Asn Leu Tyr Leu Gly Val Val Leu Ser Ala Val Val Ile Ile Thr Gly

130 135 140

Cys Phe Ser Tyr Tyr Gln Glu Ala Lys Ser Ser Lys Ile Met Glu Ser

145 150 155 160

Phe Lys Asn Met Val Pro Gln Gln Ala Leu Val Ile Arg Asn Gly Glu

165 170 175

Lys Met Ser Ile Asn Ala Glu Glu Val Val Val Gly Asp Leu Val Glu

180 185 190

Val Lys Gly Gly Asp Arg Ile Pro Ala Asp Leu Arg Ile Ile Ser Ala

195 200 205

Asn Gly Cys Lys Val Asp Asn Ser Ser Leu Thr Gly Glu Ser Glu Pro

210 215 220

Gln Thr Arg Ser Pro Asp Phe Thr Asn Glu Asn Pro Leu Glu Thr Arg

225 230 235 240

Asn Ile Ala Phe Phe Ser Thr Asn Cys Val Glu Gly Thr Ala Arg Gly

245 250 255

Ile Val Val Tyr Thr Gly Asp Arg Thr Val Met Gly Arg Ile Ala Thr

260 265 270

Leu Ala Ser Gly Leu Glu Gly Gly Gln Thr Pro Ile Ala Ala Glu Ile

275 280 285

Glu His Phe Ile His Ile Ile Thr Gly Val Ala Val Phe Leu Gly Val

290 295 300

Ser Phe Phe Ile Leu Ser Leu Ile Leu Glu Tyr Thr Trp Leu Glu Ala

305 310 315 320

Val Ile Phe Leu Ile Gly Ile Ile Val Ala Asn Val Pro Glu Gly Leu

325 330 335

Leu Ala Thr Val Thr Val Cys Leu Thr Leu Thr Ala Lys Arg Met Ala

340 345 350

Arg Lys Asn Cys Leu Val Lys Asn Leu Glu Ala Val Glu Thr Leu Gly

355 360 365

Ser Thr Ser Thr Ile Cys Ser Asp Lys Thr Gly Thr Leu Thr Gln Asn

370 375 380

Arg Met Thr Val Ala His Met Trp Phe Asp Asn Gln Ile His Glu Ala

385 390 395 400

Asp Thr Thr Glu Asn Gln Ser Gly Val Ser Phe Asp Lys Thr Ser Ala

405 410 415

Thr Trp Leu Ala Leu Ser Arg Ile Ala Gly Leu Cys Asn Arg Ala Val

420 425 430

Phe Gln Ala Asn Gln Glu Asn Leu Pro Ile Leu Lys Arg Ala Val Ala

435 440 445

Gly Asp Ala Ser Glu Ser Ala Leu Leu Lys Cys Ile Glu Leu Cys Cys

450 455 460

Gly Ser Val Lys Glu Met Arg Glu Arg Tyr Ala Lys Ile Val Glu Ile

465 470 475 480

Pro Phe Asn Ser Thr Asn Lys Tyr Gln Leu Ser Ile His Lys Asn Pro

485 490 495

Asn Thr Ser Glu Pro Gln His Leu Leu Val Met Lys Gly Ala Pro Glu

500 505 510

Arg Ile Leu Asp Arg Cys Ser Ser Ile Leu Leu His Gly Lys Glu Gln

515 520 525

Pro Leu Asp Glu Glu Leu Lys Asp Ala Phe Gln Asn Ala Tyr Leu Glu

530 535 540

Leu Gly Gly Leu Gly Glu Arg Val Leu Gly Phe Cys His Leu Phe Leu

545 550 555 560

Pro Asp Glu Gln Phe Pro Glu Gly Phe Gln Phe Asp Thr Asp Asp Val

565 570 575

Asn Phe Pro Ile Asp Asn Leu Cys Phe Val Gly Leu Ile Ser Met Ile

580 585 590

Asp Pro Pro Arg Ala Ala Val Pro Asp Ala Val Gly Lys Cys Arg Ser

595 600 605

Ala Gly Ile Lys Val Ile Met Val Thr Gly Asp His Pro Ile Thr Ala

610 615 620

Lys Ala Ile Ala Lys Gly Val Gly Ile Ile Ser Glu Gly Asn Glu Thr

625 630 635 640

Val Glu Asp Ile Ala Ala Arg Leu Asn Ile Pro Val Ser Gln Val Asn

645 650 655

Pro Arg Asp Ala Lys Ala Cys Val Val His Gly Ser Asp Leu Lys Asp

660 665 670

Met Thr Ser Glu Gln Leu Asp Asp Ile Leu Lys Tyr His Thr Glu Ile

675 680 685

Val Phe Ala Arg Thr Ser Pro Gln Gln Lys Leu Ile Ile Val Glu Gly

690 695 700

Cys Gln Arg Gln Gly Ala Ile Val Ala Val Thr Gly Asp Gly Val Asn

705 710 715 720

Asp Ser Pro Ala Leu Lys Lys Ala Asp Ile Gly Val Ala Met Gly Ile

725 730 735

Ala Gly Ser Asp Val Ser Lys Gln Ala Ala Asp Met Ile Leu Leu Asp

740 745 750

Asp Asn Phe Ala Ser Ile Val Thr Gly Val Glu Glu Gly Arg Leu Ile

755 760 765

Phe Asp Asn Leu Lys Lys Ser Ile Ala Tyr Thr Leu Thr Ser Asn Ile

770 775 780

Pro Glu Ile Thr Pro Phe Leu Ile Phe Ile Ile Ala Asn Ile Pro Leu

785 790 795 800

Pro Leu Gly Thr Val Thr Ile Leu Cys Ile Asp Leu Gly Thr Asp Met

805 810 815

Val Pro Ala Ile Ser Leu Ala Tyr Glu Gln Ala Glu Ser Asp Ile Met

820 825 830

Lys Arg Gln Pro Arg Asn Pro Lys Thr Asp Lys Leu Val Asn Glu Arg

835 840 845

Leu Ile Ser Met Ala Tyr Gly Gln Ile Gly Met Ile Gln Ala Leu Gly

850 855 860

Gly Phe Phe Thr Tyr Phe Val Ile Leu Ala Glu Asn Gly Phe Leu Pro

865 870 875 880

Ile His Leu Leu Gly Leu Arg Val Asp Trp Asp Asp Arg Trp Ile Asn

885 890 895

Asp Val Glu Asp Ser Tyr Gly Gln Gln Trp Thr Tyr Glu Gln Arg Lys

900 905 910

Ile Val Glu Phe Thr Cys His Thr Ala Phe Phe Val Ser Ile Val Val

915 920 925

Val Gln Trp Ala Asp Leu Val Ile Cys Lys Thr Arg Arg Asn Ser Val

930 935 940

Phe Gln Gln Gly Met Lys Asn Lys Ile Leu Ile Phe Gly Leu Phe Glu

945 950 955 960

Glu Thr Ala Leu Ala Ala Phe Leu Ser Tyr Cys Pro Gly Met Gly Val

965 970 975

Ala Leu Arg Met Tyr Pro Leu Lys Pro Thr Trp Trp Phe Cys Ala Phe

980 985 990

Pro Tyr Ser Leu Leu Ile Phe Val Tyr Asp Glu Val Arg Lys Leu Ile

995 1000 1005

Ile Arg Arg Arg Pro Gly Gly Trp Val Glu Lys Glu Thr Tyr Tyr

1010 1015 1020

<210> 205

<211> 240

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 205

Met Gly Arg Gly Ala Gly Arg Glu Tyr Ser Pro Ala Ala Thr Thr Ala

1 5 10 15

Glu Asn Gly Gly Gly Lys Lys Lys Gln Lys Glu Lys Glu Leu Asp Glu

20 25 30

Leu Lys Lys Glu Val Ala Met Asp Asp His Lys Leu Ser Leu Asp Glu

35 40 45

Leu Gly Arg Lys Tyr Gln Val Asp Leu Ser Lys Gly Leu Thr Asn Gln

50 55 60

Arg Ala Gln Asp Val Leu Ala Arg Asp Gly Pro Asn Ala Leu Thr Pro

65 70 75 80

Pro Pro Thr Thr Pro Glu Trp Val Lys Phe Cys Arg Gln Leu Phe Gly

85 90 95

Gly Phe Ser Ile Leu Leu Trp Ile Gly Ala Ile Leu Cys Phe Leu Ala

100 105 110

Tyr Gly Ile Gln Ala Ala Met Glu Asp Glu Pro Ser Asn Asp Asn Leu

115 120 125

Tyr Leu Gly Val Val Leu Ala Ala Val Val Ile Val Thr Gly Cys Phe

130 135 140

Ser Tyr Tyr Gln Glu Ala Lys Ser Ser Lys Ile Met Asp Ser Phe Lys

145 150 155 160

Asn Met Val Pro Gln Gln Ala Leu Val Ile Arg Glu Gly Glu Lys Met

165 170 175

Gln Ile Asn Ala Glu Glu Val Val Val Gly Asp Leu Val Glu Val Lys

180 185 190

Gly Gly Asp Arg Val Pro Ala Asp Leu Arg Ile Ile Ser Ser His Gly

195 200 205

Cys Lys Val Asp Asn Ser Ser Leu Thr Gly Glu Ser Glu Pro Gln Thr

210 215 220

Arg Ser Pro Glu Phe Thr His Glu Asn Pro Leu Glu Thr Arg Asn Ile

225 230 235 240

<210> 206

<211> 780

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 206

Cys Phe Phe Ser Thr Asn Cys Val Glu Gly Thr Ala Arg Gly Ile Val

1 5 10 15

Ile Ala Thr Gly Asp Arg Thr Val Met Gly Arg Ile Ala Thr Leu Ala

20 25 30

Ser Gly Leu Glu Val Gly Arg Thr Pro Ile Ala Met Glu Ile Glu His

35 40 45

Phe Ile Gln Leu Ile Thr Gly Val Ala Val Phe Leu Gly Val Ser Phe

50 55 60

Phe Val Leu Ser Leu Ile Leu Gly Tyr Ser Trp Leu Glu Ala Val Ile

65 70 75 80

Phe Leu Ile Gly Ile Ile Val Ala Asn Val Pro Glu Gly Leu Leu Ala

85 90 95

Thr Val Thr Val Cys Leu Thr Leu Thr Ala Lys Arg Met Ala Arg Lys

100 105 110

Asn Cys Leu Val Lys Asn Leu Glu Ala Val Glu Thr Leu Gly Ser Thr

115 120 125

Ser Thr Ile Cys Ser Asp Lys Thr Gly Thr Leu Thr Gln Asn Arg Met

130 135 140

Thr Val Ala His Met Trp Phe Asp Asn Gln Ile His Glu Ala Asp Thr

145 150 155 160

Thr Glu Asp Gln Ser Gly Ala Thr Phe Asp Lys Arg Ser Pro Thr Trp

165 170 175

Thr Ala Leu Ser Arg Ile Ala Gly Leu Cys Asn Arg Ala Val Phe Lys

180 185 190

Ala Gly Gln Glu Asn Ile Ser Val Ser Lys Arg Asp Thr Ala Gly Asp

195 200 205

Ala Ser Glu Ser Ala Leu Leu Lys Cys Ile Glu Leu Ser Cys Gly Ser

210 215 220

Val Arg Lys Met Arg Asp Arg Asn Pro Lys Val Ala Glu Ile Pro Phe

225 230 235 240

Asn Ser Thr Asn Lys Tyr Gln Leu Ser Ile His Glu Arg Glu Asp Ser

245 250 255

Pro Gln Ser His Val Leu Val Met Lys Gly Ala Pro Glu Arg Ile Leu

260 265 270

Asp Arg Cys Ser Thr Ile Leu Val Gln Gly Lys Glu Ile Pro Leu Asp

275 280 285

Lys Glu Met Gln Asp Ala Phe Gln Asn Ala Tyr Met Glu Leu Gly Gly

290 295 300

Leu Gly Glu Arg Val Leu Gly Phe Cys Gln Leu Asn Leu Pro Ser Gly

305 310 315 320

Lys Phe Pro Arg Gly Phe Lys Phe Asp Thr Asp Glu Leu Asn Phe Pro

325 330 335

Thr Glu Lys Leu Cys Phe Val Gly Leu Met Ser Met Ile Asp Pro Pro

340 345 350

Arg Ala Ala Val Pro Asp Ala Val Gly Lys Cys Arg Ser Ala Gly Ile

355 360 365

Lys Val Ile Met Val Thr Gly Asp His Pro Ile Thr Ala Lys Ala Ile

370 375 380

Ala Lys Gly Val Gly Ile Ile Ser Glu Gly Asn Glu Thr Val Glu Asp

385 390 395 400

Ile Ala Ala Arg Leu Asn Ile Pro Met Ser Gln Val Asn Pro Arg Glu

405 410 415

Ala Lys Ala Cys Val Val His Gly Ser Asp Leu Lys Asp Met Thr Ser

420 425 430

Glu Gln Leu Asp Glu Ile Leu Lys Asn His Thr Glu Ile Val Phe Ala

435 440 445

Arg Thr Ser Pro Gln Gln Lys Leu Ile Ile Val Glu Gly Cys Gln Arg

450 455 460

Gln Gly Ala Ile Val Ala Val Thr Gly Asp Gly Val Asn Asp Ser Pro

465 470 475 480

Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Met Gly Ile Ser Gly Ser

485 490 495

Asp Val Ser Lys Gln Ala Ala Asp Met Ile Leu Leu Asp Asp Asn Phe

500 505 510

Ala Ser Ile Val Thr Gly Val Glu Glu Gly Arg Leu Ile Phe Asp Asn

515 520 525

Leu Lys Lys Ser Ile Ala Tyr Thr Leu Thr Ser Asn Ile Pro Glu Ile

530 535 540

Thr Pro Phe Leu Leu Phe Ile Ile Ala Asn Ile Pro Leu Pro Leu Gly

545 550 555 560

Thr Val Thr Ile Leu Cys Ile Asp Leu Gly Thr Asp Met Val Pro Ala

565 570 575

Ile Ser Leu Ala Tyr Glu Ala Ala Glu Ser Asp Ile Met Lys Arg Gln

580 585 590

Pro Arg Asn Ser Gln Thr Asp Lys Leu Val Asn Glu Arg Leu Ile Ser

595 600 605

Met Ala Tyr Gly Gln Ile Gly Met Ile Gln Ala Leu Gly Gly Phe Phe

610 615 620

Thr Tyr Phe Val Ile Leu Ala Glu Asn Gly Phe Leu Pro Ser Arg Leu

625 630 635 640

Leu Gly Ile Arg Leu Asp Trp Asp Asp Arg Thr Met Asn Asp Leu Glu

645 650 655

Asp Ser Tyr Gly Gln Glu Trp Thr Tyr Glu Gln Arg Lys Val Val Glu

660 665 670

Phe Thr Cys His Thr Ala Phe Phe Ala Ser Ile Val Val Val Gln Trp

675 680 685

Ala Asp Leu Ile Ile Cys Lys Thr Arg Arg Asn Ser Val Phe Gln Gln

690 695 700

Gly Met Lys Asn Lys Ile Leu Ile Phe Gly Leu Leu Glu Glu Thr Ala

705 710 715 720

Leu Ala Ala Phe Leu Ser Tyr Cys Pro Gly Met Gly Val Ala Leu Arg

725 730 735

Met Tyr Pro Leu Lys Val Thr Trp Trp Phe Cys Ala Phe Pro Tyr Ser

740 745 750

Leu Leu Ile Phe Ile Tyr Asp Glu Val Arg Lys Leu Ile Leu Arg Arg

755 760 765

Tyr Pro Gly Gly Trp Val Glu Lys Glu Thr Tyr Tyr

770 775 780

<210> 207

<211> 1026

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 207

Met Gly Ser Gly Gly Ser Asp Ser Tyr Arg Ile Ala Thr Ser Gln Asp

1 5 10 15

Lys Lys Asp Asp Lys Asp Ser Pro Lys Lys Asn Lys Gly Lys Glu Arg

20 25 30

Arg Asp Leu Asp Asp Leu Lys Lys Glu Val Ala Met Thr Glu His Lys

35 40 45

Met Ser Val Glu Glu Val Cys Arg Lys Tyr Asn Thr Asp Cys Val Gln

50 55 60

Gly Leu Thr His Ser Lys Ala Gln Glu Ile Leu Ala Arg Asp Gly Pro

65 70 75 80

Asn Ala Leu Thr Pro Pro Pro Thr Thr Pro Glu Trp Val Lys Phe Cys

85 90 95

Arg Gln Leu Phe Gly Gly Phe Ser Ile Leu Leu Trp Ile Gly Ala Ile

100 105 110

Leu Cys Phe Leu Ala Tyr Gly Ile Gln Ala Gly Thr Glu Asp Asp Pro

115 120 125

Ser Gly Asp Asn Leu Tyr Leu Gly Ile Val Leu Ala Ala Val Val Ile

130 135 140

Ile Thr Gly Cys Phe Ser Tyr Tyr Gln Glu Ala Lys Ser Ser Lys Ile

145 150 155 160

Met Glu Ser Phe Lys Asn Met Val Pro Gln Gln Ala Leu Val Ile Arg

165 170 175

Glu Gly Glu Lys Met Gln Val Asn Ala Glu Glu Val Val Val Gly Asp

180 185 190

Leu Val Glu Ile Lys Gly Gly Asp Arg Val Pro Ala Asp Leu Arg Ile

195 200 205

Ile Ser Ala His Gly Cys Lys Val Asp Asn Ser Ser Leu Thr Gly Glu

210 215 220

Ser Glu Pro Gln Thr Arg Ser Pro Asp Cys Thr His Asp Asn Pro Leu

225 230 235 240

Glu Thr Arg Asn Ile Thr Phe Phe Ser Thr Asn Cys Val Glu Gly Thr

245 250 255

Ala Arg Gly Val Val Val Ala Thr Gly Asp Arg Thr Val Met Gly Arg

260 265 270

Ile Ala Thr Leu Ala Ser Gly Leu Glu Val Gly Lys Thr Pro Ile Ala

275 280 285

Ile Glu Ile Glu His Phe Ile Gln Leu Ile Thr Gly Val Ala Val Phe

290 295 300

Leu Gly Val Ser Phe Phe Ile Leu Ser Leu Ile Leu Gly Tyr Thr Trp

305 310 315 320

Leu Glu Ala Val Ile Phe Leu Ile Gly Ile Ile Val Ala Asn Val Pro

325 330 335

Glu Gly Leu Leu Ala Thr Val Thr Val Cys Leu Thr Leu Thr Ala Lys

340 345 350

Arg Met Ala Arg Lys Asn Cys Leu Val Lys Asn Leu Glu Ala Val Glu

355 360 365

Thr Leu Gly Ser Thr Ser Thr Ile Cys Ser Asp Lys Thr Gly Thr Leu

370 375 380

Thr Gln Asn Arg Met Thr Val Ala His Met Trp Phe Asp Asn Gln Ile

385 390 395 400

His Glu Ala Asp Thr Thr Glu Asp Gln Ser Gly Thr Ser Phe Asp Lys

405 410 415

Ser Ser His Thr Trp Val Ala Leu Ser His Ile Ala Gly Leu Cys Asn

420 425 430

Arg Ala Val Phe Lys Gly Gly Gln Asp Asn Ile Pro Val Leu Lys Arg

435 440 445

Asp Val Ala Gly Asp Ala Ser Glu Ser Ala Leu Leu Lys Cys Ile Glu

450 455 460

Leu Ser Ser Gly Ser Val Lys Leu Met Arg Glu Arg Asn Lys Lys Val

465 470 475 480

Ala Glu Ile Pro Phe Asn Ser Thr Asn Lys Tyr Gln Leu Ser Ile His

485 490 495

Glu Thr Glu Asp Pro Asn Asp Asn Arg Tyr Leu Leu Val Met Lys Gly

500 505 510

Ala Pro Glu Arg Ile Leu Asp Arg Cys Ser Thr Ile Leu Leu Gln Gly

515 520 525

Lys Glu Gln Pro Leu Asp Glu Glu Met Lys Glu Ala Phe Gln Asn Ala

530 535 540

Tyr Leu Glu Leu Gly Gly Leu Gly Glu Arg Val Leu Gly Phe Cys His

545 550 555 560

Tyr Tyr Leu Pro Glu Glu Gln Phe Pro Lys Gly Phe Ala Phe Asp Cys

565 570 575

Asp Asp Val Asn Phe Thr Thr Asp Asn Leu Cys Phe Val Gly Leu Met

580 585 590

Ser Met Ile Asp Pro Pro Arg Ala Ala Val Pro Asp Ala Val Gly Lys

595 600 605

Cys Arg Ser Ala Gly Ile Lys Val Ile Met Val Thr Gly Asp His Pro

610 615 620

Ile Thr Ala Lys Ala Ile Ala Lys Gly Val Gly Ile Ile Ser Glu Gly

625 630 635 640

Asn Glu Thr Val Glu Asp Ile Ala Ala Arg Leu Asn Ile Pro Val Ser

645 650 655

Gln Val Asn Pro Arg Asp Ala Lys Ala Cys Val Ile His Gly Thr Asp

660 665 670

Leu Lys Asp Phe Thr Ser Glu Gln Ile Asp Glu Ile Leu Gln Asn His

675 680 685

Thr Glu Ile Val Phe Ala Arg Thr Ser Pro Gln Gln Lys Leu Ile Ile

690 695 700

Val Glu Gly Cys Gln Arg Gln Gly Ala Ile Val Ala Val Thr Gly Asp

705 710 715 720

Gly Val Asn Asp Ser Pro Ala Leu Lys Lys Ala Asp Ile Gly Val Ala

725 730 735

Met Gly Ile Ala Gly Ser Asp Val Ser Lys Gln Ala Ala Asp Met Ile

740 745 750

Leu Leu Asp Asp Asn Phe Ala Ser Ile Val Thr Gly Val Glu Glu Gly

755 760 765

Arg Leu Ile Phe Asp Asn Leu Lys Lys Ser Ile Ala Tyr Thr Leu Thr

770 775 780

Ser Asn Ile Pro Glu Ile Thr Pro Phe Leu Leu Phe Ile Met Ala Asn

785 790 795 800

Ile Pro Leu Pro Leu Gly Thr Ile Thr Ile Leu Cys Ile Asp Leu Gly

805 810 815

Thr Asp Met Val Pro Ala Ile Ser Leu Ala Tyr Glu Ala Ala Glu Ser

820 825 830

Asp Ile Met Lys Arg Gln Pro Arg Asn Pro Arg Thr Asp Lys Leu Val

835 840 845

Asn Glu Arg Leu Ile Ser Met Ala Tyr Gly Gln Ile Gly Met Ile Gln

850 855 860

Ala Leu Gly Gly Phe Phe Ser Tyr Phe Val Ile Leu Ala Glu Asn Gly

865 870 875 880

Phe Leu Pro Gly Asn Leu Val Gly Ile Arg Leu Asn Trp Asp Asp Arg

885 890 895

Thr Val Asn Asp Leu Glu Asp Ser Tyr Gly Gln Gln Trp Thr Tyr Glu

900 905 910

Gln Arg Lys Val Val Glu Phe Thr Cys His Thr Ala Phe Phe Val Ser

915 920 925

Ile Val Val Val Gln Trp Ala Asp Leu Ile Ile Cys Lys Thr Arg Arg

930 935 940

Asn Ser Val Phe Gln Gln Gly Met Lys Asn Lys Ile Leu Ile Phe Gly

945 950 955 960

Leu Phe Glu Glu Thr Ala Leu Ala Ala Phe Leu Ser Tyr Cys Pro Gly

965 970 975

Met Asp Val Ala Leu Arg Met Tyr Pro Leu Lys Pro Ser Trp Trp Phe

980 985 990

Cys Ala Phe Pro Tyr Ser Phe Leu Ile Phe Val Tyr Asp Glu Ile Arg

995 1000 1005

Lys Leu Ile Leu Arg Arg Asn Pro Gly Gly Trp Val Glu Lys Glu

1010 1015 1020

Thr Tyr Tyr

1025

<210> 208

<211> 1029

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 208

Met Gly Leu Trp Gly Lys Lys Gly Thr Val Ala Pro His Asp Gln Ser

1 5 10 15

Pro Arg Arg Arg Pro Lys Lys Gly Leu Ile Lys Lys Lys Met Val Lys

20 25 30

Arg Glu Lys Gln Lys Arg Asn Met Glu Glu Leu Lys Lys Glu Val Val

35 40 45

Met Asp Asp His Lys Leu Thr Leu Glu Glu Leu Ser Thr Lys Tyr Ser

50 55 60

Val Asp Leu Thr Lys Gly His Ser His Gln Arg Ala Lys Glu Ile Leu

65 70 75 80

Thr Arg Gly Gly Pro Asn Thr Val Thr Pro Pro Pro Thr Thr Pro Glu

85 90 95

Trp Val Lys Phe Cys Lys Gln Leu Phe Gly Gly Phe Ser Leu Leu Leu

100 105 110

Trp Thr Gly Ala Ile Leu Cys Phe Val Ala Tyr Ser Ile Gln Ile Tyr

115 120 125

Phe Asn Glu Glu Pro Thr Lys Asp Asn Leu Tyr Leu Ser Ile Val Leu

130 135 140

Ser Val Val Val Ile Val Thr Gly Cys Phe Ser Tyr Tyr Gln Glu Ala

145 150 155 160

Lys Ser Ser Lys Ile Met Glu Ser Phe Lys Asn Met Val Pro Gln Gln

165 170 175

Ala Leu Val Ile Arg Gly Gly Glu Lys Met Gln Ile Asn Val Gln Glu

180 185 190

Val Val Leu Gly Asp Leu Val Glu Ile Lys Gly Gly Asp Arg Val Pro

195 200 205

Ala Asp Leu Arg Leu Ile Ser Ala Gln Gly Cys Lys Val Asp Asn Ser

210 215 220

Ser Leu Thr Gly Glu Ser Glu Pro Gln Ser Arg Ser Pro Asp Phe Thr

225 230 235 240

His Glu Asn Pro Leu Glu Thr Arg Asn Ile Cys Phe Phe Ser Thr Asn

245 250 255

Cys Val Glu Gly Thr Ala Arg Gly Ile Val Ile Ala Thr Gly Asp Ser

260 265 270

Thr Val Met Gly Arg Ile Ala Ser Leu Thr Ser Gly Leu Ala Val Gly

275 280 285

Gln Thr Pro Ile Ala Ala Glu Ile Glu His Phe Ile His Leu Ile Thr

290 295 300

Val Val Ala Val Phe Leu Gly Val Thr Phe Phe Ala Leu Ser Leu Leu

305 310 315 320

Leu Gly Tyr Gly Trp Leu Glu Ala Ile Ile Phe Leu Ile Gly Ile Ile

325 330 335

Val Ala Asn Val Pro Glu Gly Leu Leu Ala Thr Val Thr Val Cys Leu

340 345 350

Thr Leu Thr Ala Lys Arg Met Ala Arg Lys Asn Cys Leu Val Lys Asn

355 360 365

Leu Glu Ala Val Glu Thr Leu Gly Ser Thr Ser Thr Ile Cys Ser Asp

370 375 380

Lys Thr Gly Thr Leu Thr Gln Asn Arg Met Thr Val Ala His Met Trp

385 390 395 400

Phe Asp Met Thr Val Tyr Glu Ala Asp Thr Thr Glu Glu Gln Thr Gly

405 410 415

Lys Thr Phe Thr Lys Ser Ser Asp Thr Trp Phe Met Leu Ala Arg Ile

420 425 430

Ala Gly Leu Cys Asn Arg Ala Asp Phe Lys Ala Asn Gln Glu Ile Leu

435 440 445

Pro Ile Ala Lys Arg Ala Thr Thr Gly Asp Ala Ser Glu Ser Ala Leu

450 455 460

Leu Lys Phe Ile Glu Gln Ser Tyr Ser Ser Val Ala Glu Met Arg Glu

465 470 475 480

Lys Asn Pro Lys Val Ala Glu Ile Pro Phe Asn Ser Thr Asn Lys Tyr

485 490 495

Gln Met Ser Ile His Leu Arg Glu Asp Ser Ser Gln Thr His Val Leu

500 505 510

Met Met Lys Gly Ala Pro Glu Arg Ile Leu Glu Phe Cys Ser Thr Phe

515 520 525

Leu Leu Asn Gly Gln Glu Tyr Ser Met Asn Asp Glu Met Lys Glu Ala

530 535 540

Phe Gln Asn Ala Tyr Leu Glu Leu Gly Gly Leu Gly Glu Arg Val Leu

545 550 555 560

Gly Phe Cys Phe Leu Asn Leu Pro Ser Ser Phe Ser Lys Gly Phe Pro

565 570 575

Phe Asn Thr Asp Glu Ile Asn Phe Pro Met Asp Asn Leu Cys Phe Val

580 585 590

Gly Leu Ile Ser Met Ile Asp Pro Pro Arg Ala Ala Val Pro Asp Ala

595 600 605

Val Ser Lys Cys Arg Ser Ala Gly Ile Lys Val Ile Met Val Thr Gly

610 615 620

Asp His Pro Ile Thr Ala Lys Ala Ile Ala Lys Gly Val Gly Ile Ile

625 630 635 640

Ser Glu Gly Thr Glu Thr Ala Glu Glu Val Ala Ala Arg Leu Lys Ile

645 650 655

Pro Ile Ser Lys Val Asp Ala Ser Ala Ala Lys Ala Ile Val Val His

660 665 670

Gly Ala Glu Leu Lys Asp Ile Gln Ser Lys Gln Leu Asp Gln Ile Leu

675 680 685

Gln Asn His Pro Glu Ile Val Phe Ala Arg Thr Ser Pro Gln Gln Lys

690 695 700

Leu Ile Ile Val Glu Gly Cys Gln Arg Leu Gly Ala Val Val Ala Val

705 710 715 720

Thr Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Lys Lys Ala Asp Ile

725 730 735

Gly Ile Ala Met Gly Ile Ser Gly Ser Asp Val Ser Lys Gln Ala Ala

740 745 750

Asp Met Ile Leu Leu Asp Asp Asn Phe Ala Ser Ile Val Thr Gly Val

755 760 765

Glu Glu Gly Arg Leu Ile Phe Asp Asn Leu Lys Lys Ser Ile Met Tyr

770 775 780

Thr Leu Thr Ser Asn Ile Pro Glu Ile Thr Pro Phe Leu Met Phe Ile

785 790 795 800

Ile Leu Gly Ile Pro Leu Pro Leu Gly Thr Ile Thr Ile Leu Cys Ile

805 810 815

Asp Leu Gly Thr Asp Met Val Pro Ala Ile Ser Leu Ala Tyr Glu Ser

820 825 830

Ala Glu Ser Asp Ile Met Lys Arg Leu Pro Arg Asn Pro Lys Thr Asp

835 840 845

Asn Leu Val Asn His Arg Leu Ile Gly Met Ala Tyr Gly Gln Ile Gly

850 855 860

Met Ile Gln Ala Leu Ala Gly Phe Phe Thr Tyr Phe Val Ile Leu Ala

865 870 875 880

Glu Asn Gly Phe Arg Pro Val Asp Leu Leu Gly Ile Arg Leu His Trp

885 890 895

Glu Asp Lys Tyr Leu Asn Asp Leu Glu Asp Ser Tyr Gly Gln Gln Trp

900 905 910

Thr Tyr Glu Gln Arg Lys Val Val Glu Phe Thr Cys Gln Thr Ala Phe

915 920 925

Phe Val Thr Ile Val Val Val Gln Trp Ala Asp Leu Ile Ile Ser Lys

930 935 940

Thr Arg Arg Asn Ser Leu Phe Gln Gln Gly Met Arg Asn Lys Val Leu

945 950 955 960

Ile Phe Gly Ile Leu Glu Glu Thr Leu Leu Ala Ala Phe Leu Ser Tyr

965 970 975

Thr Pro Gly Met Asp Val Ala Leu Arg Met Tyr Pro Leu Lys Ile Thr

980 985 990

Trp Trp Leu Cys Ala Ile Pro Tyr Ser Ile Leu Ile Phe Val Tyr Asp

995 1000 1005

Glu Ile Arg Lys Leu Leu Ile Arg Gln His Pro Asp Gly Trp Val

1010 1015 1020

Glu Arg Glu Thr Tyr Tyr

1025

<210> 209

<211> 279

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 209

Met Thr Lys Asn Glu Lys Lys Ser Leu Asn Gln Ser Leu Ala Glu Trp

1 5 10 15

Lys Leu Phe Ile Tyr Asn Pro Thr Thr Gly Glu Phe Leu Gly Arg Thr

20 25 30

Ala Lys Ser Trp Gly Leu Ile Leu Leu Phe Tyr Leu Val Phe Tyr Gly

35 40 45

Phe Leu Ala Ala Leu Phe Ser Phe Thr Met Trp Val Met Leu Gln Thr

50 55 60

Leu Asn Asp Glu Val Pro Lys Tyr Arg Asp Gln Ile Pro Ser Pro Gly

65 70 75 80

Leu Met Val Phe Pro Lys Pro Val Thr Ala Leu Glu Tyr Thr Phe Ser

85 90 95

Arg Ser Asp Pro Thr Ser Tyr Ala Gly Tyr Ile Glu Asp Leu Lys Lys

100 105 110

Phe Leu Lys Pro Tyr Thr Leu Glu Glu Gln Lys Asn Leu Thr Val Cys

115 120 125

Pro Asp Gly Ala Leu Phe Glu Gln Lys Gly Pro Val Tyr Val Ala Cys

130 135 140

Gln Phe Pro Ile Ser Leu Leu Gln Ala Cys Ser Gly Met Asn Asp Pro

145 150 155 160

Asp Phe Gly Tyr Ser Gln Gly Asn Pro Cys Ile Leu Val Lys Met Asn

165 170 175

Arg Ile Ile Gly Leu Lys Pro Glu Gly Val Pro Arg Ile Asp Cys Val

180 185 190

Ser Lys Asn Glu Asp Ile Pro Asn Val Ala Val Tyr Pro His Asn Gly

195 200 205

Met Ile Asp Leu Lys Tyr Phe Pro Tyr Tyr Gly Lys Lys Leu His Val

210 215 220

Gly Tyr Leu Gln Pro Leu Val Ala Val Gln Val Ser Phe Ala Pro Asn

225 230 235 240

Asn Thr Gly Lys Glu Val Thr Val Glu Cys Lys Ile Asp Gly Ser Ala

245 250 255

Asn Leu Lys Ser Gln Asp Asp Arg Asp Lys Phe Leu Gly Arg Val Met

260 265 270

Phe Lys Ile Thr Ala Arg Ala

275

<210> 210

<211> 1258

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 210

Met Gly Asp Met Ala Asn Asn Ser Val Ala Tyr Ser Gly Val Lys Asn

1 5 10 15

Ser Leu Lys Glu Ala Asn His Asp Gly Asp Phe Gly Ile Thr Leu Ala

20 25 30

Glu Leu Arg Ala Leu Met Glu Leu Arg Ser Thr Asp Ala Leu Arg Lys

35 40 45

Ile Gln Glu Ser Tyr Gly Asp Val Tyr Gly Ile Cys Thr Lys Leu Lys

50 55 60

Thr Ser Pro Asn Glu Gly Leu Ser Gly Asn Pro Ala Asp Leu Glu Arg

65 70 75 80

Arg Glu Ala Val Phe Gly Lys Asn Phe Ile Pro Pro Lys Lys Pro Lys

85 90 95

Thr Phe Leu Gln Leu Val Trp Glu Ala Leu Gln Asp Val Thr Leu Ile

100 105 110

Ile Leu Glu Ile Ala Ala Ile Val Ser Leu Gly Leu Ser Phe Tyr Gln

115 120 125

Pro Pro Glu Gly Asp Asn Ala Leu Cys Gly Glu Val Ser Val Gly Glu

130 135 140

Glu Glu Gly Glu Gly Glu Thr Gly Trp Ile Glu Gly Ala Ala Ile Leu

145 150 155 160

Leu Ser Val Val Cys Val Val Leu Val Thr Ala Phe Asn Asp Trp Ser

165 170 175

Lys Glu Lys Gln Phe Arg Gly Leu Gln Ser Arg Ile Glu Gln Glu Gln

180 185 190

Lys Phe Thr Val Ile Arg Gly Gly Gln Val Ile Gln Ile Pro Val Ala

195 200 205

Asp Ile Thr Val Gly Asp Ile Ala Gln Val Lys Tyr Gly Asp Leu Leu

210 215 220

Pro Ala Asp Gly Ile Leu Ile Gln Gly Asn Asp Leu Lys Ile Asp Glu

225 230 235 240

Ser Ser Leu Thr Gly Glu Ser Asp His Val Lys Lys Ser Leu Asp Lys

245 250 255

Asp Pro Leu Leu Leu Ser Gly Thr His Val Met Glu Gly Ser Gly Arg

260 265 270

Met Val Val Thr Ala Val Gly Val Asn Ser Gln Thr Gly Ile Ile Phe

275 280 285

Thr Leu Leu Gly Ala Gly Gly Glu Glu Glu Glu Lys Lys Asp Glu Lys

290 295 300

Lys Lys Glu Lys Lys Asn Lys Lys Gln Asp Gly Ala Ile Glu Asn Arg

305 310 315 320

Asn Lys Ala Lys Ala Gln Asp Gly Ala Ala Met Glu Met Gln Pro Leu

325 330 335

Lys Ser Glu Glu Gly Gly Asp Gly Asp Glu Lys Asp Lys Lys Lys Ala

340 345 350

Asn Leu Pro Lys Lys Glu Lys Ser Val Leu Gln Gly Lys Leu Thr Lys

355 360 365

Leu Ala Val Gln Ile Gly Lys Ala Gly Leu Leu Met Ser Ala Ile Thr

370 375 380

Val Ile Ile Leu Val Leu Tyr Phe Val Ile Asp Thr Phe Trp Val Gln

385 390 395 400

Lys Arg Pro Trp Leu Ala Glu Cys Thr Pro Ile Tyr Ile Gln Tyr Phe

405 410 415

Val Lys Phe Phe Ile Ile Gly Val Thr Val Leu Val Val Ala Val Pro

420 425 430

Glu Gly Leu Pro Leu Ala Val Thr Ile Ser Leu Ala Tyr Ser Val Lys

435 440 445

Lys Met Met Lys Asp Asn Asn Leu Val Arg His Leu Asp Ala Cys Glu

450 455 460

Thr Met Gly Asn Ala Thr Ala Ile Cys Ser Asp Lys Thr Gly Thr Leu

465 470 475 480

Thr Met Asn Arg Met Thr Val Val Gln Ala Tyr Ile Asn Glu Lys His

485 490 495

Tyr Lys Lys Val Pro Glu Pro Glu Ala Ile Pro Pro Asn Ile Leu Ser

500 505 510

Tyr Leu Val Thr Gly Ile Ser Val Asn Cys Ala Tyr Thr Ser Lys Ile

515 520 525

Leu Pro Pro Glu Lys Glu Gly Gly Leu Pro Arg His Val Gly Asn Lys

530 535 540

Thr Glu Cys Ala Leu Leu Gly Leu Leu Leu Asp Leu Lys Arg Asp Tyr

545 550 555 560

Gln Asp Val Arg Asn Glu Ile Pro Glu Glu Ala Leu Tyr Lys Val Tyr

565 570 575

Thr Phe Asn Ser Val Arg Lys Ser Met Ser Thr Val Leu Lys Asn Ser

580 585 590

Asp Gly Ser Tyr Arg Ile Phe Ser Lys Gly Ala Ser Glu Ile Ile Leu

595 600 605

Lys Lys Cys Phe Lys Ile Leu Ser Ala Asn Gly Glu Ala Lys Val Phe

610 615 620

Arg Pro Arg Asp Arg Asp Asp Ile Val Lys Thr Val Ile Glu Pro Met

625 630 635 640

Ala Ser Glu Gly Leu Arg Thr Ile Cys Leu Ala Phe Arg Asp Phe Pro

645 650 655

Ala Gly Glu Pro Glu Pro Glu Trp Asp Asn Glu Asn Asp Ile Val Thr

660 665 670

Gly Leu Thr Cys Ile Ala Val Val Gly Ile Glu Asp Pro Val Arg Pro

675 680 685

Glu Val Pro Asp Ala Ile Lys Lys Cys Gln Arg Ala Gly Ile Thr Val

690 695 700

Arg Met Val Thr Gly Asp Asn Ile Asn Thr Ala Arg Ala Ile Ala Thr

705 710 715 720

Lys Cys Gly Ile Leu His Pro Gly Glu Asp Phe Leu Cys Leu Glu Gly

725 730 735

Lys Asp Phe Asn Arg Arg Ile Arg Asn Glu Lys Gly Glu Ile Glu Gln

740 745 750

Glu Arg Ile Asp Lys Ile Trp Pro Lys Leu Arg Val Leu Ala Arg Ser

755 760 765

Ser Pro Thr Asp Lys His Thr Leu Val Lys Gly Ile Ile Asp Ser Thr

770 775 780

Val Ser Asp Gln Arg Gln Val Val Ala Val Thr Gly Asp Gly Thr Asn

785 790 795 800

Asp Gly Pro Ala Leu Lys Lys Ala Asp Val Gly Phe Ala Met Gly Ile

805 810 815

Ala Gly Thr Asp Val Ala Lys Glu Ala Ser Asp Ile Ile Leu Thr Asp

820 825 830

Asp Asn Phe Thr Ser Ile Val Lys Ala Val Met Trp Gly Arg Asn Val

835 840 845

Tyr Asp Ser Ile Ser Lys Phe Leu Gln Phe Gln Leu Thr Val Asn Val

850 855 860

Val Ala Val Ile Val Ala Phe Thr Gly Ala Cys Ile Thr Gln Asp Ser

865 870 875 880

Pro Leu Lys Ala Val Gln Met Leu Trp Val Asn Leu Ile Met Asp Thr

885 890 895

Leu Ala Ser Leu Ala Leu Ala Thr Glu Pro Pro Thr Glu Ser Leu Leu

900 905 910

Leu Arg Lys Pro Tyr Gly Arg Asn Lys Pro Leu Ile Ser Arg Thr Met

915 920 925

Met Lys Asn Ile Leu Gly His Ala Phe Tyr Gln Leu Val Val Val Phe

930 935 940

Thr Leu Leu Phe Ala Gly Glu Lys Phe Phe Asp Ile Asp Ser Gly Arg

945 950 955 960

Asn Ala Pro Leu His Ala Pro Pro Ser Glu His Tyr Thr Ile Val Phe

965 970 975

Asn Thr Phe Val Leu Met Gln Leu Phe Asn Glu Ile Asn Ala Arg Lys

980 985 990

Ile His Gly Glu Arg Asn Val Phe Glu Gly Ile Phe Asn Asn Ala Ile

995 1000 1005

Phe Cys Thr Ile Val Leu Gly Thr Phe Val Val Gln Ile Ile Ile

1010 1015 1020

Val Gln Phe Gly Gly Lys Pro Phe Ser Cys Ser Glu Leu Ser Ile

1025 1030 1035

Glu Gln Trp Leu Trp Ser Ile Phe Leu Gly Met Gly Thr Leu Leu

1040 1045 1050

Trp Gly Gln Leu Ile Ser Thr Ile Pro Thr Ser Arg Leu Lys Phe

1055 1060 1065

Leu Lys Glu Ala Gly His Gly Thr Gln Lys Glu Glu Ile Pro Glu

1070 1075 1080

Glu Glu Leu Ala Glu Asp Val Glu Glu Ile Asp His Ala Glu Arg

1085 1090 1095

Glu Leu Arg Arg Gly Gln Ile Leu Trp Phe Arg Gly Leu Asn Arg

1100 1105 1110

Ile Gln Thr Gln Met Asp Val Val Asn Ala Phe Gln Ser Gly Ser

1115 1120 1125

Ser Ile Gln Gly Ala Leu Arg Arg Gln Pro Ser Ile Ala Ser Gln

1130 1135 1140

His His Asp Val Thr Asn Ile Ser Thr Pro Thr His Ile Arg Val

1145 1150 1155

Val Asn Ala Phe Arg Ser Ser Leu Tyr Glu Gly Leu Glu Lys Pro

1160 1165 1170

Glu Ser Arg Ser Ser Ile His Asn Phe Met Thr His Pro Glu Phe

1175 1180 1185

Arg Ile Glu Asp Ser Glu Pro His Ile Pro Leu Ile Asp Asp Thr

1190 1195 1200

Asp Ala Glu Asp Asp Ala Pro Thr Lys Arg Asn Ser Ser Pro Pro

1205 1210 1215

Pro Ser Pro Asn Lys Asn Asn Asn Ala Val Asp Ser Gly Ile His

1220 1225 1230

Leu Thr Ile Glu Met Asn Lys Ser Ala Thr Ser Ser Ser Pro Gly

1235 1240 1245

Ser Pro Leu His Ser Leu Glu Thr Ser Leu

1250 1255

<210> 211

<211> 1272

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 211

Met Gly Asp Met Thr Asn Ser Asp Phe Tyr Ser Lys Asn Gln Arg Asn

1 5 10 15

Glu Ser Ser His Gly Gly Glu Phe Gly Cys Thr Met Glu Glu Leu Arg

20 25 30

Ser Leu Met Glu Leu Arg Gly Thr Glu Ala Val Val Lys Ile Lys Glu

35 40 45

Thr Tyr Gly Asp Thr Glu Ala Ile Cys Arg Arg Leu Lys Thr Ser Pro

50 55 60

Val Glu Gly Leu Pro Gly Thr Ala Pro Asp Leu Glu Lys Arg Lys Gln

65 70 75 80

Ile Phe Gly Gln Asn Phe Ile Pro Pro Lys Lys Pro Lys Thr Phe Leu

85 90 95

Gln Leu Val Trp Glu Ala Leu Gln Asp Val Thr Leu Ile Ile Leu Glu

100 105 110

Ile Ala Ala Ile Ile Ser Leu Gly Leu Ser Phe Tyr His Pro Pro Gly

115 120 125

Glu Gly Asn Glu Gly Cys Ala Thr Ala Gln Gly Gly Ala Glu Asp Glu

130 135 140

Gly Glu Ala Glu Ala Gly Trp Ile Glu Gly Ala Ala Ile Leu Leu Ser

145 150 155 160

Val Ile Cys Val Val Leu Val Thr Ala Phe Asn Asp Trp Ser Lys Glu

165 170 175

Lys Gln Phe Arg Gly Leu Gln Ser Arg Ile Glu Gln Glu Gln Lys Phe

180 185 190

Thr Val Val Arg Ala Gly Gln Val Val Gln Ile Pro Val Ala Glu Ile

195 200 205

Val Val Gly Asp Ile Ala Gln Val Lys Tyr Gly Asp Leu Leu Pro Ala

210 215 220

Asp Gly Leu Phe Ile Gln Gly Asn Asp Leu Lys Ile Asp Glu Ser Ser

225 230 235 240

Leu Thr Gly Glu Ser Asp Gln Val Arg Lys Ser Val Asp Lys Asp Pro

245 250 255

Met Leu Leu Ser Gly Thr His Val Met Glu Gly Ser Gly Arg Met Leu

260 265 270

Val Thr Ala Val Gly Val Asn Ser Gln Thr Gly Ile Ile Phe Thr Leu

275 280 285

Leu Gly Ala Gly Gly Glu Glu Glu Glu Lys Lys Asp Lys Lys Gly Val

290 295 300

Lys Lys Gly Asp Gly Leu Gln Leu Pro Ala Ala Asp Gly Ala Ala Ala

305 310 315 320

Ser Asn Ala Ala Asp Ser Ala Asn Ala Ser Leu Val Asn Gly Lys Met

325 330 335

Gln Asp Gly Asn Val Asp Ala Ser Gln Ser Lys Ala Lys Gln Gln Asp

340 345 350

Gly Ala Ala Ala Met Glu Met Gln Pro Leu Lys Ser Ala Glu Gly Gly

355 360 365

Asp Ala Asp Asp Arg Lys Lys Ala Ser Met His Lys Lys Glu Lys Ser

370 375 380

Val Leu Gln Gly Lys Leu Thr Lys Leu Ala Val Gln Ile Gly Lys Ala

385 390 395 400

Gly Leu Val Met Ser Ala Ile Thr Val Ile Ile Leu Val Leu Tyr Phe

405 410 415

Thr Val Asp Thr Phe Val Val Asn Lys Lys Pro Trp Leu Pro Glu Cys

420 425 430

Thr Pro Val Tyr Val Gln Tyr Phe Val Lys Phe Phe Ile Ile Gly Val

435 440 445

Thr Val Leu Val Val Ala Val Pro Glu Gly Leu Pro Leu Ala Val Thr

450 455 460

Ile Ser Leu Ala Tyr Ser Val Lys Lys Met Met Lys Asp Asn Asn Leu

465 470 475 480

Val Arg His Leu Asp Ala Cys Glu Thr Met Gly Asn Ala Thr Ala Ile

485 490 495

Cys Ser Asp Lys Thr Gly Thr Leu Thr Thr Asn Arg Met Thr Val Val

500 505 510

Gln Ala Tyr Val Gly Asp Val His Tyr Lys Glu Ile Pro Asp Pro Ser

515 520 525

Ser Ile Asn Thr Lys Thr Met Glu Leu Leu Ile Asn Ala Ile Ala Ile

530 535 540

Asn Ser Ala Tyr Thr Thr Lys Ile Leu Pro Pro Glu Lys Glu Gly Ala

545 550 555 560

Leu Pro Arg Gln Val Gly Asn Lys Thr Glu Cys Gly Leu Leu Gly Phe

565 570 575

Val Leu Asp Leu Lys Gln Asp Tyr Glu Pro Val Arg Ser Gln Met Pro

580 585 590

Glu Glu Lys Leu Tyr Lys Val Tyr Thr Phe Asn Ser Val Arg Lys Ser

595 600 605

Met Ser Thr Val Ile Lys Leu Pro Asp Glu Ser Phe Arg Met Tyr Ser

610 615 620

Lys Gly Ala Ser Glu Ile Val Leu Lys Lys Cys Cys Lys Ile Leu Asn

625 630 635 640

Gly Ala Gly Glu Pro Arg Val Phe Arg Pro Arg Asp Arg Asp Glu Met

645 650 655

Val Lys Lys Val Ile Glu Pro Met Ala Cys Asp Gly Leu Arg Thr Ile

660 665 670

Cys Val Ala Tyr Arg Asp Phe Pro Ser Ser Pro Glu Pro Asp Trp Asp

675 680 685

Asn Glu Asn Asp Ile Leu Asn Glu Leu Thr Cys Ile Cys Val Val Gly

690 695 700

Ile Glu Asp Pro Val Arg Pro Glu Val Pro Glu Ala Ile Arg Lys Cys

705 710 715 720

Gln Arg Ala Gly Ile Thr Val Arg Met Val Thr Gly Asp Asn Ile Asn

725 730 735

Thr Ala Arg Ala Ile Ala Ile Lys Cys Gly Ile Ile His Pro Gly Glu

740 745 750

Asp Phe Leu Cys Leu Glu Gly Lys Glu Phe Asn Arg Arg Ile Arg Asn

755 760 765

Glu Lys Gly Glu Ile Glu Gln Glu Arg Ile Asp Lys Ile Trp Pro Lys

770 775 780

Leu Arg Val Leu Ala Arg Ser Ser Pro Thr Asp Lys His Thr Leu Val

785 790 795 800

Lys Gly Ile Ile Asp Ser Thr His Thr Glu Gln Arg Gln Val Val Ala

805 810 815

Val Thr Gly Asp Gly Thr Asn Asp Gly Pro Ala Leu Lys Lys Ala Asp

820 825 830

Val Gly Phe Ala Met Gly Ile Ala Gly Thr Asp Val Ala Lys Glu Ala

835 840 845

Ser Asp Ile Ile Leu Thr Asp Asp Asn Phe Ser Ser Ile Val Lys Ala

850 855 860

Val Met Trp Gly Arg Asn Val Tyr Asp Ser Ile Ser Lys Phe Leu Gln

865 870 875 880

Phe Gln Leu Thr Val Asn Val Val Ala Val Ile Val Ala Phe Thr Gly

885 890 895

Ala Cys Ile Thr Gln Asp Ser Pro Leu Lys Ala Val Gln Met Leu Trp

900 905 910

Val Asn Leu Ile Met Asp Thr Phe Ala Ser Leu Ala Leu Ala Thr Glu

915 920 925

Pro Pro Thr Glu Thr Leu Leu Leu Arg Lys Pro Tyr Gly Arg Asn Lys

930 935 940

Pro Leu Ile Ser Arg Thr Met Met Lys Asn Ile Leu Gly His Ala Val

945 950 955 960

Tyr Gln Leu Ala Leu Ile Phe Thr Leu Leu Phe Val Gly Glu Lys Met

965 970 975

Phe Gln Ile Asp Ser Gly Arg Asn Ala Pro Leu His Ser Pro Pro Ser

980 985 990

Glu His Tyr Thr Ile Ile Phe Asn Thr Phe Val Met Met Gln Leu Phe

995 1000 1005

Asn Glu Ile Asn Ala Arg Lys Ile His Gly Glu Arg Asn Val Phe

1010 1015 1020

Asp Gly Ile Phe Arg Asn Pro Ile Phe Cys Thr Ile Val Leu Gly

1025 1030 1035

Thr Phe Ala Ile Gln Ile Val Ile Val Gln Phe Gly Gly Lys Pro

1040 1045 1050

Phe Ser Cys Ser Pro Leu Gln Leu Asp Gln Trp Met Trp Cys Ile

1055 1060 1065

Phe Ile Gly Leu Gly Glu Leu Val Trp Gly Gln Val Ile Ala Thr

1070 1075 1080

Ile Pro Thr Ser Arg Leu Lys Phe Leu Lys Glu Ala Gly Arg Leu

1085 1090 1095

Thr Gln Lys Glu Glu Ile Pro Glu Glu Glu Leu Asn Glu Asp Val

1100 1105 1110

Glu Glu Ile Asp His Ala Glu Arg Glu Leu Arg Arg Gly Gln Ile

1115 1120 1125

Leu Trp Phe Arg Gly Leu Asn Arg Ile Gln Thr Gln Ile Glu Val

1130 1135 1140

Val Asn Thr Phe Lys Ser Gly Ala Ser Phe Gln Gly Ala Leu Arg

1145 1150 1155

Arg Gln Ser Ser Val Thr Ser Gln Ser Gln Asp Ile Arg Val Val

1160 1165 1170

Lys Ala Phe Arg Ser Ser Leu Tyr Glu Gly Leu Glu Lys Pro Glu

1175 1180 1185

Ser Arg Thr Ser Ile His Asn Phe Met Ala His Pro Glu Phe Arg

1190 1195 1200

Ile Glu Asp Ser Gln Pro His Ile Pro Leu Ile Asp Asp Thr Asp

1205 1210 1215

Leu Glu Glu Asp Ala Ala Leu Lys Gln Asn Ser Ser Pro Pro Ser

1220 1225 1230

Ser Leu Asn Lys Asn Asn Ser Ala Ile Asp Ser Gly Ile Asn Leu

1235 1240 1245

Thr Thr Asp Thr Ser Lys Ser Ala Thr Ser Ser Ser Pro Gly Ser

1250 1255 1260

Pro Ile His Ser Leu Glu Thr Ser Leu

1265 1270

<210> 212

<211> 874

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 212

Met Gly Asp Met Ala Asn Ser Ser Ile Glu Phe His Pro Lys Pro Gln

1 5 10 15

Gln Gln Arg Asp Val Pro Gln Ala Gly Gly Phe Gly Cys Thr Leu Ala

20 25 30

Glu Leu Arg Thr Leu Met Glu Leu Arg Gly Ala Glu Ala Leu Gln Lys

35 40 45

Ile Glu Glu Ala Tyr Gly Asp Val Ser Gly Leu Cys Arg Arg Leu Lys

50 55 60

Thr Ser Pro Thr Glu Gly Leu Ala Asp Asn Thr Asn Asp Leu Glu Lys

65 70 75 80

Arg Arg Gln Ile Tyr Gly Gln Asn Phe Ile Pro Pro Lys Gln Pro Lys

85 90 95

Thr Phe Leu Gln Leu Val Trp Glu Ala Leu Gln Asp Val Thr Leu Ile

100 105 110

Ile Leu Glu Val Ala Ala Ile Val Ser Leu Gly Leu Ser Phe Tyr Ala

115 120 125

Pro Pro Gly Glu Glu Ser Glu Ala Cys Gly Asn Val Ser Gly Gly Ala

130 135 140

Glu Asp Glu Gly Glu Ala Glu Ala Gly Trp Ile Glu Gly Ala Ala Ile

145 150 155 160

Leu Leu Ser Val Ile Cys Val Val Leu Val Thr Ala Phe Asn Asp Trp

165 170 175

Ser Lys Glu Lys Gln Phe Arg Gly Leu Gln Ser Arg Ile Glu Gln Glu

180 185 190

Gln Lys Phe Thr Val Ile Arg Asn Gly Gln Leu Leu Gln Val Pro Val

195 200 205

Ala Ala Leu Val Val Gly Asp Ile Ala Gln Val Lys Tyr Gly Asp Leu

210 215 220

Leu Pro Ala Asp Gly Val Leu Ile Gln Ala Asn Asp Leu Lys Ile Asp

225 230 235 240

Glu Ser Ser Leu Thr Gly Glu Ser Asp His Val Arg Lys Ser Ala Asp

245 250 255

Lys Asp Pro Met Leu Leu Ser Gly Thr His Val Met Glu Gly Ser Gly

260 265 270

Arg Met Val Val Thr Ala Val Gly Val Asn Ser Gln Thr Gly Ile Ile

275 280 285

Phe Thr Leu Leu Gly Ala Gly Gly Glu Glu Glu Glu Lys Lys Asp Lys

290 295 300

Lys Gly Lys Gln Gln Asp Gly Ala Met Glu Ser Ser Gln Thr Lys Ala

305 310 315 320

Lys Lys Gln Asp Gly Ala Val Ala Met Glu Met Gln Pro Leu Lys Ser

325 330 335

Ala Glu Gly Gly Glu Met Glu Glu Arg Glu Lys Lys Lys Ala Asn Ala

340 345 350

Pro Lys Lys Glu Lys Ser Val Leu Gln Gly Lys Leu Thr Lys Leu Ala

355 360 365

Val Gln Ile Gly Lys Ala Gly Leu Val Met Ser Ala Ile Thr Val Ile

370 375 380

Ile Leu Val Leu Tyr Phe Val Ile Glu Thr Phe Val Val Glu Gly Arg

385 390 395 400

Thr Trp Leu Ala Glu Cys Thr Pro Val Tyr Val Gln Tyr Phe Val Lys

405 410 415

Phe Phe Ile Ile Gly Val Thr Val Leu Val Val Ala Val Pro Glu Gly

420 425 430

Leu Pro Leu Ala Val Thr Ile Ser Leu Ala Tyr Ser Val Lys Lys Met

435 440 445

Met Lys Asp Asn Asn Leu Val Arg His Leu Asp Ala Cys Glu Thr Met

450 455 460

Gly Asn Ala Thr Ala Ile Cys Ser Asp Lys Thr Gly Thr Leu Thr Thr

465 470 475 480

Asn Arg Met Thr Val Val Gln Ser Tyr Leu Gly Asp Thr His Tyr Lys

485 490 495

Glu Ile Pro Ala Pro Ser Ala Leu Thr Pro Lys Ile Leu Asp Leu Leu

500 505 510

Val His Ala Ile Ser Ile Asn Ser Ala Tyr Thr Thr Lys Ile Leu Pro

515 520 525

Pro Glu Lys Glu Gly Ala Leu Pro Arg Gln Val Gly Asn Lys Thr Glu

530 535 540

Cys Ala Leu Leu Gly Phe Val Leu Asp Leu Lys Arg Asp Phe Gln Pro

545 550 555 560

Val Arg Glu Gln Ile Pro Glu Asp Lys Leu Tyr Lys Val Tyr Thr Phe

565 570 575

Asn Ser Val Arg Lys Ser Met Ser Thr Val Ile Arg Met Pro Asp Gly

580 585 590

Gly Phe Arg Leu Phe Ser Lys Gly Ala Ser Glu Ile Leu Leu Lys Lys

595 600 605

Cys Thr Asn Ile Leu Asn Ser Asn Gly Glu Leu Arg Gly Phe Arg Pro

610 615 620

Arg Asp Arg Asp Asp Met Val Arg Lys Ile Ile Glu Pro Met Ala Cys

625 630 635 640

Asp Gly Leu Arg Thr Ile Cys Ile Ala Tyr Arg Asp Phe Ser Ala Gly

645 650 655

Gln Glu Pro Asp Trp Asp Asn Glu Asn Glu Val Val Gly Asp Leu Thr

660 665 670

Cys Ile Ala Val Val Gly Ile Glu Asp Pro Val Arg Pro Glu Val Pro

675 680 685

Glu Ala Ile Arg Lys Cys Gln Arg Ala Gly Ile Thr Val Arg Met Val

690 695 700

Thr Gly Asp Asn Ile Asn Thr Ala Arg Ala Ile Ala Ala Lys Cys Gly

705 710 715 720

Ile Ile Gln Pro Gly Glu Asp Phe Leu Cys Leu Glu Gly Lys Glu Phe

725 730 735

Asn Arg Arg Ile Arg Asn Glu Lys Gly Glu Ile Glu Gln Glu Arg Leu

740 745 750

Asp Lys Val Trp Pro Lys Leu Arg Val Leu Ala Arg Ser Ser Pro Thr

755 760 765

Asp Lys His Thr Leu Val Lys Gly Ile Ile Asp Ser Thr Thr Gly Glu

770 775 780

Gln Arg Gln Val Val Ala Val Thr Gly Asp Gly Thr Asn Asp Gly Pro

785 790 795 800

Ala Leu Lys Lys Ala Asp Val Gly Phe Ala Met Gly Ile Ala Gly Thr

805 810 815

Asp Val Ala Lys Glu Ala Ser Asp Ile Ile Leu Thr Asp Asp Asn Phe

820 825 830

Thr Ser Ile Val Lys Ala Val Met Trp Gly Arg Asn Val Tyr Asp Ser

835 840 845

Ile Ser Lys Phe Leu Gln Phe Gln Leu Thr Val Asn Val Val Ala Val

850 855 860

Ile Val Ala Phe Thr Gly Ala Cys Ile Thr

865 870

<210> 213

<211> 28

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 213

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys

20 25

<210> 214

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 214

Thr Val Phe Leu Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro

1 5 10 15

Lys Arg

<210> 215

<211> 415

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 215

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

405 410 415

<210> 216

<211> 415

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 216

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Leu Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

405 410 415

<210> 217

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (1)..(8)

<223> (GGS)n(GGGGS)n接头的最短实例,其中n为

在1和100之间的整数

<400> 217

Gly Gly Ser Gly Gly Gly Gly Ser

1 5

<210> 218

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 218

Ser Gly Gly Ser Gly Gly Ser

1 5

<210> 219

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 219

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly

1 5 10 15

<210> 220

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 220

Gly Gly Ser Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 221

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 221

Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly

1 5 10 15

Gly Ser

<210> 222

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 222

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 223

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (1)..(4)

<223> (GGGG)n接头的最短实例,其中n为

在1和100之间的整数

<400> 223

Gly Gly Gly Gly

1

<210> 224

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (3)..(3)

<223> X=任何氨基酸

<400> 224

Met Gly Xaa Lys Leu Ser Lys Lys Lys

1 5

<210> 225

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<220>

<221> MISC_FEATURE

<222> (2)..(2)

<223> X=是任何氨基酸

<400> 225

Gly Xaa Lys Leu Ser Lys Lys Lys

1 5

<210> 226

<211> 22

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 226

ugagaacuga auuccauggg uu 22

<210> 227

<211> 22

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 227

ccucugaaau ucaguucuuc ag 22

<210> 228

<211> 23

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 228

uuaaugcuaa ucgugauagg ggu 23

<210> 229

<211> 22

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 229

cuccuacaua uuagcauuaa ca 22

<210> 230

<211> 95

<212> PRT

<213> 结核分枝杆菌(Mycobacterium tuberculosis)

<400> 230

Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser

1 5 10 15

Ala Ile Gln Gly Asn Val Thr Ser Ile His Ser Leu Leu Asp Glu Gly

20 25 30

Lys Gln Ser Leu Thr Lys Leu Ala Ala Ala Trp Gly Gly Ser Gly Ser

35 40 45

Glu Ala Tyr Gln Gly Val Gln Gln Lys Trp Asp Ala Thr Ala Thr Glu

50 55 60

Leu Asn Asn Ala Leu Gln Asn Leu Ala Arg Thr Ile Ser Glu Ala Gly

65 70 75 80

Gln Ala Met Ala Ser Thr Glu Gly Asn Val Thr Gly Met Phe Ala

85 90 95

<210> 231

<211> 96

<212> PRT

<213> 结核分枝杆菌(Mycobacterium tuberculosis)

<400> 231

Met Ser Gln Ile Met Tyr Asn Tyr Pro Ala Met Leu Gly His Ala Gly

1 5 10 15

Asp Met Ala Gly Tyr Ala Gly Thr Leu Gln Ser Leu Gly Ala Glu Ile

20 25 30

Ala Val Glu Gln Ala Ala Leu Gln Ser Ala Trp Gln Gly Asp Thr Gly

35 40 45

Ile Thr Tyr Gln Ala Trp Gln Ala Gln Trp Asn Gln Ala Met Glu Asp

50 55 60

Leu Val Arg Ala Tyr His Ala Met Ser Ser Thr His Glu Ala Asn Thr

65 70 75 80

Met Ala Met Met Ala Arg Asp Pro Ala Glu Ala Ala Lys Trp Gly Gly

85 90 95

309页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于肌肉表达的杂合启动子

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类