包含用于结合结构域和可分泌肽的基因的重组载体

文档序号:1865985 发布日期:2021-11-19 浏览:18次 >En<

阅读说明:本技术 包含用于结合结构域和可分泌肽的基因的重组载体 (Recombinant vector comprising a gene for a binding domain and a secretable peptide ) 是由 艾米·H·林 道格拉斯·J·乔利 于 2019-11-13 设计创作,主要内容包括:本公开提供了经修饰的重组逆转录病毒,其包含编码具有异源分泌信号的蛋白质、含有可操作地连接至异源多核苷酸的2A-肽或肽样编码序列的转基因。本公开还涉及表达或包含此类载体的细胞和载体,以及在疾病和病症治疗中使用此类经修饰的载体的方法。(The present disclosure provides modified recombinant retroviruses comprising a transgene encoding a protein having a heterologous secretion signal comprising a 2A-peptide or peptide-like coding sequence operably linked to a heterologous polynucleotide. The disclosure also relates to cells and vectors expressing or comprising such vectors, and methods of using such modified vectors in the treatment of diseases and disorders.)

包含用于结合结构域和可分泌肽的基因的重组载体

相关申请的交叉引用

本申请要求2018年11月13日提交的美国临时申请序列号No.62/760,912和2019年8月29日提交的美国临时申请序列号No.62/893,673的优先权,其公开内容通过引用并入本文。

参考序列表

本申请与电子格式的序列表一起提交。序列表以名为Sequence-Listi ng_ST25.txt的文件提供,创建日期为2019年11月13日,大小为408,816字节。序列表的电子格式信息通过引用整体并入本文。

技术领域

本公开涉及病毒载体。本公开还涉及此类病毒载体用于在细胞中递送和表达异源核酸的用途及其表达和分泌。

背景技术

将基因和异源核酸递送至细胞和受试者的有效方法已经成为研究人员进行科学开发以及对疾病和病症进行可能治疗的目标。

发明内容

本公开提供了包含2A-肽盒的病毒,所述2A-肽盒在2A-肽下游和待分泌的异源基因上游含有分泌肽编码序列。进一步的实施方式包含异源基因,其编码抗体、单链抗体或其它抗体相关结构、衍生自非免疫球蛋白支架蛋白的结合蛋白等。在进一步的实施方式中,抗体相关肽或非免疫球蛋白结合蛋白包含导致结合蛋白多聚化的序列,以提供对靶标实体的更高结合亲和力。又进一步的实施方式包括包含异源基因的病毒,所述异源基因在待分泌的异源基因产物的上游具有对病毒和基因的异源分泌信号。

本公开进一步描述了免疫球蛋白(Ig)和非免疫球蛋白(非-Ig)支架蛋白的多肽亚基,每个亚基包括抗原结合结构域、多聚化结构域(例如二聚化、三聚化和五聚化结构域)和任选的IgG Fc结构域的融合多肽,其能够形成稳定的同源蛋白和二聚蛋白。非-Ig支架蛋白的寡聚复合物也可通过单个或多个Gly-Ser接头形成。

本公开包括工程化的Ig支架蛋白,其包括来源于人类、小鼠、骆驼(骆驼科)、鲨鱼和牛的重链可变结构域(Curr Opin Struct Biol.2017Aug;45:10-16.doi:10.1016/j.sbi.2016.10.019,通过引用并入本文)、(Nat Biotechnol.2017Dec 8;35(12):1115-1117.doi:10.1038/nbt1217-1115,通过引用并入本文),以及非-Ig支架蛋白(参见,例如:Skrlec et al.,Trends Biotechnol.,33(7):408-18,Jul.2015;和Simeon&Chen Protein&Cell 9:2-14,2018;两者通过引用并入本文),其包括Adnectins、亲合体(Affibodies)、Affilins、Affimers、抗运载蛋白(Anticalins)、Atrimers、Avimers、Centryrins、DARPins、Bynomers、Cys-knots、Kunitz结构域、OBodies、Pronectins、Tn3s、Hcks、NPHP1s、Tecs、Amphs、RIMBP#3、IRIKS、SNX33、Eps8L1、FISH#5、CMS#1和OSTF1,所有这些都可以可操作地连接到人类IgG Fc的N-末端部分,从而允许单体或寡聚支架蛋白通过二硫键形成而二聚化,以形成高度复杂的寡聚蛋白。

提供了有用于通过病毒载体递送的癌症免疫疗法的组合物和方法,所述病毒载体包括逆转录病毒复制载体和逆转录病毒非复制载体、其它病毒载体、溶瘤病毒载体和非病毒表达载体。

在一个实施方式中,非-Ig支架是人类来源的,以使抗-支架蛋白免疫应答最小化。

在一个实施方式中,非-Ig支架蛋白的抗原特异性结合亚基用作激动剂或拮抗剂,其靶向CTLA-4、PD-1、PDL1、GITR、ICOS、LAG-3、TIM-3、OX40、CD40L、CD137/4-1BB、CD27、TIGIT、VISTA、BTLA、IL-2Rα、IL-2Rβ、IL-2Rγ、IL-15Rα、IL-15Rβ、或IL-15Rγ,CD19、CD20、间皮素、神经节苷脂GD2、成纤维细胞相关蛋白FAP、BCMA、CD3、FOXP3、IL-12Rα或β、CD47、SIRPα、CD94/NKG2、CD244/2B4、腺苷受体A2A、EGFR、EGF、VEGFR、VEGF、PDGFR、PDGF、HGFR/MET、HGF、IGF-IR、IGF-1、HER-1、HER-2、HER-3、CEA、EB-D、TRAILR1/DR4、TRAILR2/DR5、外结构域B(ED-B)、IL-10和IL-35。

在另一个实施方式中,非-Ig支架蛋白的抗原特异性结合亚基用作激动剂或拮抗剂,其靶向白介素1至38中的至少一种,白介素1至38由大于60个现有成员组成;以及它们的受体,例如IL-2家族的IL-10和IL-35受体,其由IL-2、IL-4、IL-7、IL-9、IL-15和IL-21组成(这些受体含有共同的细胞因子受体γ链(CD132、γc));IL-13R与IL-4共享IL-4Rα,IL-4和IL-13的受体由2个受体链组成-IL-4和IL-13与IL-4R结合,IL-4R由IL-4Rα(CD124)和IL-13Rα1链组成,并且IL-13R由2个亚基IL-13Rα1和IL-13Rα2组成,并且信号传导通过II型IL-4R复合物发生,其由IL-4Rα和IL-13Rα组成;TSLPR(CRFlR-2)与IL-7共享IL-7R;IL-3、IL-5和GM-CSF的受体,GM-CSF是具有独特α链和共同β链(βc,CD131)亚基的异二聚体;IL-10家族成员(IL-10、IL-19、IL-20、IL-22、IL-24、IL-26、IL-28和IL-29)和共享共同受体亚基的相应受体,如所示;TNF-α及其受体TNFRI和TNFR2;TGF-β及其由TGF-βR1和TGF-βR2组成的异二聚体受体;IL12及其受体IL-12R,受体IL-12R由2个亚基组成:IL-12Rβ1和IL-12Rβ3。IL-23和/或其异二聚体受体亚基IL-12Rβ1和IL-23R;IFN-α和IFN-β和/或它们的由IFNAR1和IFNAR2组成的异二聚体受体;IFN-γ和/或其异二聚体受体亚基IFN-γR1和IFN-γR2。

在一个实施方式中,非-Ig支架蛋白的抗原结合结构域是融合蛋白,其各自包括抗原结合非-Ig支架蛋白、甘氨酸-丝氨酸接头、功能性多聚化结构域,其中非-Ig支架蛋白可自组装成同源二聚体、同源三聚体、同源五聚体蛋白复合物、同源六聚体或其它类型的蛋白复合物,包括异聚复合物。

在一个实施方式中,同源六聚体非-Ig支架蛋白复合物是融合蛋白,其包括6个抗原结合非-Ig支架蛋白,每个由非-Ig支架蛋白、甘氨酸-丝氨酸接头、功能性三聚化结构域和IgG Fc结构域组成。

在一个实施方式中,同源十聚体非-Ig支架蛋白复合物是融合蛋白,其包括10个抗原结合非-Ig支架蛋白,每个由非-Ig支架蛋白、甘氨酸-丝氨酸接头、功能性五聚体结构域和IgG Fc结构域组成。

在另一个实施方式中,非-Ig支架蛋白的抗原结合结构域是多价融合蛋白复合物,其包括不同的抗原结合非-Ig支架蛋白、甘氨酸-丝氨酸接头,其中所述非-Ig支架蛋白可自组装成异源二聚体、异源三聚体或异源多聚体蛋白。

在一个实施方式中,提供了促进抗原-经历的T细胞和/或活化的NK细胞和用于新抗原引发的树突细胞存活或增殖的方法,其中所述寡聚形式的非-Ig支架蛋白可特异性结合肿瘤细胞、T细胞、NK细胞、树突细胞、髓样细胞、肿瘤相关的成纤维细胞、B细胞的表面上的抗原。

在进一步的实施方式中,转基因编码前药激活蛋白,该前药激活蛋白被制成可分泌的肽或蛋白质。在进一步的实施方式中,所述前药激活转基因是酵母来源的胞嘧啶脱氨酶。

在附图和以下描述中阐述了本公开的一个或多个实施方式的细节。从说明书和附图以及从权利要求书,其它特征、目的和优点将是显而易见的。

附图说明

图1显示了口蹄疫病毒(F2A)、马鼻炎A病毒(E2A)、明脉扁刺蛾β四体病毒(Thoseaasigna virus)(T2A)和猪特斯科病毒-1(P2A)的2A区的氨基酸序列的序列对比(SEQ IDNo:55至58)。

图2显示了存在于不同种类病毒中的2A肽序列的序列比对(SEQ ID No:59至125)。

图3是RRV-scFv-PDL1质粒DNA的示意图。(A)在pAC3 RRV主链中编码了两对靶向PD-L1的单链可变片段(scFv)。一对由scFv组成,具有和不具有来自人类IgG1的Fc,分别命名为pAC3-scFv-PDL1和pAC3-scFvFc-PDL1。另一对由scFv-PDL1和scFvFc-PDL1组成,在C-末端掺入了HA和Flag表位,命名为pAC3-scFv-HF-PDL1,pAC3-scFvFc-HF-PDL1。实心灰色矩形表示位于env基因下游的2A肽、IRES或小型启动子;实心黑色矩形(SP=信号肽,表A)表示分泌/前导序列,例如源自人类IL-2。

图4A-B显示了瞬时转染的293T细胞中PDL1scFv和PDL1scFvFc蛋白的表达以及Env-scFv和Env-ScFvFc多蛋白的分离效率。(A)用pAC3-GSG-T2A-PDL1scFv、pAC3-GSG-T2A-PDL1scFvFc、pAC3-GSG-T2A-PDL1scFv-标签、pAC3-GSG-T2A-PDL1scFvFc-标签瞬时转染的HEK293T细胞对scFv-标签(~30KDa)和scFvFc-标签(~55Kd)蛋白的表达。(B)瞬时转染的293T细胞的细胞裂解物的抗-2A免疫印迹。在~110KDa以上检测到的蛋白质条带代表Env-scFv和Env-ScFvFc融合多蛋白。在~85KDa检测到的蛋白质条带代表从融合多蛋白分离的Pr85病毒包膜蛋白,和在~15KDa检测到的蛋白质条带代表从Pr85病毒包膜蛋白加工的p15E-2A蛋白。

图5显示了在瞬时转染的293T细胞中产生的病毒包膜蛋白的Western印迹分析。每孔上样二十微克总蛋白裂解物。将膜与(左图)抗-HA或(右图)抗-2A肽抗体一起孵育,所述抗-HA检测HA-和Flag-标记的scFv-PD-L1和scF vFc-PD-L1,所述抗-2A肽抗体检测Env-scFv多蛋白(Env-scFv)、从Env-scFv多蛋白分离的未加工的病毒前体包膜蛋白(Env-2A)和在C-末端用2A肽标记的经加工的病毒包膜蛋白(p15E-2A)。抗-GAPDH抗体(左下图)作为上样对照,其中包括管家蛋白GAPDH。

图6A-B显示了通过竞争性ELISA检测与PD-L1的结合的scFv PD-L1。96-孔微量滴定板中的孔用(A)重组人类或(B)小鼠PD-L1-Fc包被,然后与His-标记的重组PD-1-Fc共孵育,与上清液的未定义的scFv PD-L1(scFv)和scFvFcPD-L1(scFvFc)蛋白进行竞争,后者分别从用RRV-scFv-PDL1和RRV-scFvFc-PDL1最大感染的CT26细胞浓缩收集。包括抗-PD-L1抗体作为阳性对照。抗-6X His标签抗体用于检测结合的His-标记的PD-1-Fc。在450nm测量光密度。相对于来自在竞争中使用的用RRV-GFP(非-scFv-PD-L1)最大感染的CT26的上清液,计算抑制百分比。误差条指示数据集的标准偏差。

图7A-B显示了对旁观者细胞的细胞表面上的PD-L1的scFv PD-L1反式结合活性。将用RRV-scFv-HF PDL 1(HA-标记的scFv-PD-L1)或RRV-GFP最大感染的IFNγ-处理的EMT6细胞以指定比例分成2组。(A)一组细胞用Alexa Flu or 647-偶联的抗-HA抗体染色,和(B)第二组细胞用PE-偶联的抗-小鼠PD-L1抗体染色。通过流式细胞术分析测量HA-阳性、PD-L1-阳性和GFP-阳性细胞群。

图8A-D显示了表达展示出剂量依赖性抗肿瘤活性的scFv PD-L1和scFv Fc PD-L1的预转导肿瘤细胞。(A)将原位乳腺癌模型植入8周龄BALB/c雌性小鼠的乳腺脂肪垫中(每组n=10),所述原位乳腺癌模型以预定比率使用用RRV-scFv-PDL1或RRV-scFvFc-PDL1预转导的EMT6肿瘤细胞与用RRV-GFP预转导的肿瘤细胞的混合。监测存活90天。包括抗-PD-1抗体作为对照,并且在第10天(每只小鼠300μg)、第13天、第16天和第19天(每只小鼠200μg)腹膜内给药。对于0%scFv/scFv vFc相对于抗PD-1,*p=0.2529;0%相对于2%,**P=0.2529;0%相对于30%,***P=0.0919;0%相对于100%,****P=0.1674。图上的十字叉(Ticks)指示由于肿瘤坏死而被检查并终止的小鼠;这些小鼠没有被评分为死亡,并且不从图中排除。(B-D)在侧翼上用1×106个EMT6肿瘤细胞挑战来自RRV-scFv-PDL1和RRV-scFvFc-PDL1处理组(n=5)的最初肿瘤植入物存活的小鼠,并随时间监测肿瘤生长。包括初始动物(n=5)作为对照。误差条表示数据集的SEM。

图9A-B显示了来自原位神经胶质瘤模型的数据,其颅内注射RRV-scFv-PDL1,表现出了剂量依赖性抗肿瘤活性。(A)将雌性B6C3F1小鼠(8周龄;每组n=10)i.c.植入1×104个Tu-2449细胞。监测存活分析90天。在肿瘤植入后第4天,向实验组的小鼠注射1×105或1×106转导单位(TU)的纯化RRV-scFv-PDL1。对照组是携带100%预转导的scFv-PD-L1表达肿瘤细胞的小鼠和用抗PD-1抗体或同种型对照处理的小鼠。将用表达scFv PD-L1和抗-PD-1抗体的RRV-scFv-PDL1 100%预转导的Tu-2449细胞(在第4天每只小鼠腹膜内诱导300μg;在第10、14和17天每只小鼠维持剂量200μg)作为对照。存活数据用Kaplan-Meier方法作图。通过对数秩(Mantel-Cox)确定用同种型处理的小鼠与用RRV-scFv-PD-L1 100%预转导的小鼠或注射处理的RRV-scFv-PDL1组之间的存活统计学显著性。(B)从RRV-scFv-PDL1处理组的最初肿瘤植入中存活的小鼠,在右侧翼用2×106个Tu-2449细胞进行挑战。随时间监测肿瘤生长和测量。误差条表示数据集的SEM。

图10显示了通过直接免疫印迹和免疫沉淀从pAC3-gT2A-Affimer-SQT瞬时转染的293T细胞的上清液检测表位-标记的Affimer-SQT蛋白。

图11A-B显示了通过直接免疫印迹和免疫沉淀从(A)中显示的pAC3-gT2A-Hck和(B)中箭头所示的pAC3-IRES-Hck瞬时转染的293T细胞的上清液检测表位-标记的Hck蛋白质。

图12显示了RRV-支架质粒DNA的示意图。衍生自非-Ig支架的抗原结合结构域[0066]编码在pAC3-2A、pAC3-IRES或pAC3-微型启动子主链中。实心灰色矩形表示置于env基因下游以指导转基因表达的2A肽、IRES或微型启动子;实心黑色矩形表示前导序列(表A)。可将寡聚化结构域(表4、5和6)与接头一起置于非-Ig支架的N-末端或C-末端以形成寡聚物。最后两行中还显示了导致分泌双特异性和三特异性结合分子的构型,所述双特异性和三特异性结合分子具有用于针对两个或三个靶的连接应答性质,如双特异性或三特异性抗体(Labrijn et al.,Nature Rev.Drug Disc.18:585-608 2019)。

图13显示了RRV-syCD2质粒DNA的示意图。分泌形式的yCD2编码于pAC3-2A、pAC3-IRES、pAC3-微型启动子主链中。实心灰色矩形表示置于env基因下游以指导转基因表达的2A肽、IRES或微型启动子;实心黑色矩形表示信号肽(SP)(表A)。

具体实施方式

如本文和所附权利要求中所用,单数形式“一(a)”、“一(an)”和“该/所述(the)”包括复数指代物,除非上下文另外明确指出。因此,例如,提及“一个细胞”包括多个这样的细胞,并且提及“所述载体”包括提及一个或多个载体,等等。

此外,除非另有说明,否则“或”的使用意味着“和/或”。类似地,“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”是可互换的,并且不旨在限制。

还应当理解的是,在各种实施方式的描述使用术语“包含”的情况下,本领域技术人员将理解,在一些特定情况下,实施方式可以替代地使用语言“基本上由……组成”或“由……组成”来描述。

除非另外定义,否则本文所用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同的含义。尽管与本文所述的方法和材料类似或等同的方法和材料可用于所公开的方法和组合物的实践中,但本文描述了示例性方法、装置和材料。

描述本文有用的分子生物学技术(包括载体、启动子和许多其它相关主题的用途)的一般教科书包括:Berger and Kimmel,Guide to Molecular Cloning Techniques,Methods in Enzymology Volume 152,(Academic Press,Inc.,San Diego,Calif.)("Berger");Sambrook et al.,Molecular Cloning--A Laboratory Manual,2d ed.,Vol.1-3,Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.,1989("Sambrook");Current Protocols in Molecular Biology,F.M.Ausubel et al.,eds.,CurrentProtocols,a joint venture between Greene Publishing Associates,Inc.and JohnWiley&Sons,Inc.,(suppleme nted through 1999)("Ausubel");和S.Carson,H.B.Miller&D.S.Witherow and Molecular Biology Techniques:A ClassroomLaboratory Manual,Third Edition,Elsevier,San Diego(2012)。足以指导技术人员通过体外扩增方法例如以产生本公开的同源核酸的协议实例,包括聚合酶链反应(PCR)、连接酶链反应(LCR)、Oβ-复制酶扩增和其它RNA聚合酶介导的技术(例如NASBA),见Berger、Sambrook和Ausubel,以及Mullis et al.(1987)美国专利号No.4,683,202;Innis et al.,eds.(1990)PCR Protocols:A Guide to Methods and Applications(Academic PressInc.San Diego,Calif.)("Innis");Arnheim&Levinson(1990年10月1日)C&EN 36-47;TheJournal Of NIH Research(1991)3:81-94;Kwoh et al.(1989)Proc.Natl.Acad.Sci.USA86:1173;Guatelli et al.(1990)Proc.Nat'l.Acad.Sci.USA 87:1874;Lomell et al.(1989)J.Clin.Chem 35:1826;Landegren et al.(1988)Science 241:1077-1080;VanBrunt(1990)Biotechnology 8:291-294;Wu and Wallace(1989)Gene 4:560;Barringeret al.(1990)Gene 89:117;和Sooknanan and Malek(1995)Biotechnology 13:563-564。在Wallace et al.的美国专利号No.5,426,039中描述了克隆体外扩增的核酸的改进方法。通过PCR扩增大核酸的改进方法总结于Cheng et al.(1994)Nature 369:684-685和其中引用的参考文献中,其中产生了高达40kb的PCR扩增子。本领域技术人员将理解,基本上任何RNA都可以被转化为适于限制性消化、PCR扩增和使用逆转录酶和聚合酶测序的双链DNA。参见例如Ausubel、Sambrook和Berger,全部同上。

提供本文中讨论的出版物仅仅是为了在本申请的提交日期之前公开其内容。本文中的任何内容均不得解释为承认发明人无权凭借在先公开而早于该公开。

术语“表达(express)”和“表达(expression)”是指允许或引起基因或DNA序列中的信息变得显现,例如通过激活参与相应基因或DNA序列的转录和翻译的细胞功能来产生蛋白质,或在抑制剂RNA(RNAi)的情况下,转录RNAi分子以便其被加工并能够抑制靶基因的表达。

DNA序列在细胞中或由细胞表达以形成“表达产物”,例如多肽或蛋白质。表达产物本身,例如所得多肽或蛋白质,也可被称为由细胞“表达”。例如,当多核苷酸或多肽在外源或天然启动子控制下在外源宿主细胞中表达或产生时,或在外源启动子控制下在天然宿主细胞中表达或产生时,所述多核苷酸或多肽被重组表达。

如上所述,在一些情况下,术语“表达”包括产生抑制性RNA分子(RNAi)。此类分子的表达不涉及细胞的翻译机制,而是利用细胞中的机制来修改宿主细胞的基因表达。在一些实施方式中,本公开的重组病毒载体可以被修饰以将编码序列(例如多肽或蛋白质)、RNAi分子、或编码序列(例如表达多肽或蛋白质)和RNAi分子两者递送至宿主细胞,所述宿主细胞然后可以表达所述编码序列和/或RNAi分子。

“2A肽或2A肽样序列”是指具有SEQ ID NO:1的共有序列的肽,该序列与图1和2中的任何序列具有97%的同一性,并且其含有SEQ ID NO:1的共有序列。“编码”2A肽或2A肽样序列的序列是编码具有例如SEQ ID NO:1的共有序列的2A肽或肽样序列的多核苷酸序列。在一个实施方式中,所述编码序列可操作地连接至并放置在ENV和异源序列之间,使得一旦序列被转录,其被转录为单一转录物(例如,多mRNA),并且当转录物被翻译时,产生两个多肽(例如,ENV和异源多肽)。

内部核糖体进入位点(“IRES”)是指在翻译编码序列(通常3'至IRES)的过程中促进核糖体进入或保留的核酸片段。在一些实施方式中,IRES可包含剪接受体/供体位点,然而,优选IRES缺乏剪接受体/供体位点。通常,核糖体进入信使RNA是通过位于所有真核mRNA的5'末端的帽进行的。然而,这种通用规则有例外。在一些病毒mRNA中不存在帽,表明存在允许核糖体进入这些RNA的内部位点的替代结构。迄今为止,在未加帽的病毒mRNA的5'非编码区中已鉴定了许多这些结构,根据其功能而命名为IRES,例如小核糖核酸病毒,特别是脊髓灰质炎病毒(Pelletier et al.,1988,Mol.Cell.Biol.,8,1103-1112)和EMCV病毒(脑心肌炎病毒(Jang et al.,J.Virol.,62,2636-2643 1988;B.T.Baranick et al.,Proc NatlAcad Sci U S A.105:4733-8,2008)。本公开提供了IRES在具有复制能力的逆转录病毒载体的背景下的用途。

本文所用术语“启动子区”在一般意义上是指包含DNA调控序列的核苷酸区,其中调控序列来自能结合RNA聚合酶并启动下游(3'-方向)编码序列转录的基因。调控序列与所需基因序列可以是同源或异源的。例如,可以使用广泛的启动子,包括病毒或哺乳动物启动子。

术语“调控核酸序列”共同指代启动子序列/区域、聚腺苷酸化信号、转录终止序列、上游调控结构域、复制起点、增强子等,它们共同提供编码序列在受体细胞中的复制、转录和翻译。并非所有这些控制序列都需要总是存在,只要所选编码序列能够在适当的宿主细胞中复制、转录和翻译即可。本领域技术人员可以容易地从公共数据库和材料中鉴定调控核酸序列。此外,本领域技术人员可以鉴定适用于预期用途(例如体内、离体或体外)的调控序列。

如本文所用,术语“RNA干扰”(RNAi)是指由短干扰核酸(siRNA或微RNA(miRNA))介导的序列特异性转录后基因沉默的过程。术语“能够介导RNA干扰的试剂”指siRNA以及当在细胞内转录时编码siRNA的DNA和RNA载体。术语siRNA或miRNA意在包括能够介导序列特异性RNA干扰的任何核酸分子,例如短干扰RNA(siRNA)、双链RNA(dsRNA)、微RNA(miRNA)、短发夹RNA(shRNA)、短干扰寡核苷酸、短干扰核酸、短干扰修饰的寡核苷酸、化学修饰的siRNA、转录后基因沉默RNA(ptgsRNA)等。

术语“分泌信号结构域”或“分泌信号肽”(SSP)或“信号肽”是指通常位于N-末端作为前体蛋白序列一部分的短肽。真核细胞中的翻译机制利用这些短肽将蛋白质分选至靶向目的地。SSP的一般特征由三个结构域组成:(1)N-区域:带正电荷的结构域,(2)H-区域:疏水核和(3)C-区:切割位点(Owji et al.,Euro J.of Cell Biol.,2018)。内切蛋白酶SPaseI将SSP从其客运蛋白或多肽上切下。多肽或蛋白表达水平不仅与翻译效率有关,而且与由分泌机制和SSP所决定的易位效率有关。SSP的序列可以影响易位效率,并因此可以在核酸水平上工程化与客运多肽或蛋白质连接的异源SSP的组合,以调节分泌蛋白质的水平(Kober et al.,2013;Zamani et al.,2015;Negahdaripour et al.,2017;Mousavi etal.,2017)。此外,存在设计用于增强原核和真核系统中蛋白质分泌的人工SSP(Barash etal.,Biochem and Biophy Res Com m.,2002;Clérico et al.,Biopolymers,2008)。尽管数十年来,SSP的存在和一般功能已为人所知,但以前并没有描述过SSP具有使功能性非天然表达的基因产物能够从宿主细胞分泌的能力,特别是当与其它膜蛋白(如逆转录病毒载体的ENV蛋白和2A表达系统)结合时。

术语“载体”、“载体构建体”和“表达载体”是指载体,通过该载体可以将DNA或RNA序列(例如外源基因)引入宿主细胞,以便转化宿主并促进所引入序列的表达(例如转录和翻译)。载体通常包含DNA或RNA,其中通过限制酶技术插入了编码蛋白质、多肽、核酸等的外源DNA。常见类型的载体是“质粒”,其通常是双链DNA的自含式分子,其可以容易地接受另外的(外源)DNA并且可以容易地引入合适的宿主细胞中。已经描述了大量载体(包括质粒和真菌载体)用于在多种真核和原核宿主中复制和/或表达。非限制性实例包括pKK质粒(Clonetech)、pUC质粒、pET质粒(Novagen,Inc.,Madison,Wis.)、pRSET或pREP质粒(Invitrogen,San Diego,Calif.)或pMAL质粒(New England Biolabs,Beverly,Mass.)。许多合适的宿主细胞,使用本文公开或引用的方法或相关领域技术人员已知的其它方法,已经用于这种转染。重组克隆载体通常包括一个或多个用于克隆或表达的复制系统、一个或多个用于在宿主中选择的标志物(例如抗生素抗性)和一个或多个表达盒。

本公开提供了有用于将基因或蛋白质递送至细胞或受试者的方法和组合物。在一个此类实施方式中,所述方法和组合物使得所述蛋白质或多肽可从已经摄取编码所述蛋白质或多肽的基因的细胞分泌。此种方法和组合物可以用于治疗受试者中的各种疾病和病症,包括癌症和其它细胞增殖性疾病和病症。本公开提供了用于将基因递送至细胞的具有复制能力的病毒载体,并且在一个实施方式中,所述病毒载体是具有复制能力的逆转录病毒载体。

本公开提供了病毒载体,其含有编码例如胞嘧啶脱氨酶或其突变体、miRNA或siRNA、细胞因子、抗原结合结构域(例如抗体或抗体片段;或非抗体结合结构域)、非免疫球蛋白(Ig)支架蛋白、或编码序列的组合等的异源多核苷酸,其可以被递送至细胞或受试者。病毒载体可以是腺病毒载体、麻疹载体、疱疹载体、逆转录病毒载体(包括α-、β-、γ-、δ-逆转录病毒载体、泡沫病毒载体如猿泡沫病毒(SFV)或人泡沫病毒(HFV)或慢病毒载体)、弹状病毒载体如水疱性口炎病毒载体、呼肠孤病毒载体、塞内卡山谷病毒载体、痘病毒载体(包括动物痘或牛痘衍生的载体)、细小病毒载体(包括AAV载体)、甲病毒载体或本领域技术人员已知的其它病毒载体(还参见例如Concepts in Gen etic Medicine,ed.Boro Dropulicand Barrie Carter,Wiley,2008,Hoboken,NJ.;The Development of Human GeneTherapy,ed.Theodore Friedmann,Cold Springs Harbor Laboratory Press,Coldsprings Harbor,New York,1999;Gene and Cell Therapy,ed.Nancy Smyth Templeton,Marcel Dekker Inc.,New York,New York,2000;和Gene&Cell Therapy:TherapeuticMechan ism and Strategies,3rd.ed.,ed.Nancy Smyth Templetone,CRC Press,Boc aRaton,FL,2008;其公开内容通过引用并入本文)。

如下所述,本公开的RRV可衍生自(即亲本核苷酸序列获自)MLV、Mo MLV、GALV、FELV等,并被工程化以含有与异源核苷酸序列可操作地连接的2A肽或2A样肽(本文有时称为“2A-肽盒”)。在某些情况下,所述2A肽或2A样肽通过编码分泌信号肽的寡核苷酸与异源核苷酸序列分隔开。

重组的具有复制能力的逆转录病毒载体或逆转录病毒复制载体(RRV)是指基于逆转录病毒科病毒的成员的载体。如下更充分描述的,对逆转录病毒的结构进行了充分表征。逆转录病毒已经以各种方式分类,但是在过去十年中命名法已经标准化(参见万维网(www)ncbi.nlm.nih.gov/ICTVdb/ICTVdB/上的ICTVdB-The Universal Virus Database,v 4,和教科书“Retroviruses”Eds.Coffin,Hughs and Varmus,Cold Spring Harbor Press1997;其公开内容通过引用并入本文)。这种载体可以用重组遗传技术进行工程化,通过插入异源基因或序列将亲本病毒修饰成非天然存在的RRV。这种修饰可以为载体提供属性,使其能够在体外或体内将待表达的基因递送至宿主细胞。

逆转录病毒通过其复制自身遗传物质的方式来定义。在复制过程中,病毒的RNA基因组被转化为DNA(称为前病毒DNA)。感染细胞后,通过称为逆转录的分子过程,由病毒颗粒中携带的两个RNA分子产生双链DNA分子。DNA形式作为前病毒共价整合在宿主细胞基因组中,借助于细胞和/或病毒因子从中表达病毒RNA。表达的病毒RNA被包装到颗粒中并作为感染性病毒体释放。

逆转录病毒颗粒由两个相同的RNA分子组成。每个野生型基因组具有正义单链RNA分子,其在5'末端加帽并在3'尾端聚腺苷酸化。二倍体病毒颗粒含有与gag蛋白、病毒酶(pol基因产物)和宿主tRNA分子复合的两条RNA链,所述宿主tRNA分子在gag蛋白的‘核’结构内。包围和保护该衣壳的是脂质双层(脂质包膜),其源自宿主细胞膜并含有病毒包膜(env)蛋白。env蛋白结合到病毒的细胞受体上,并且颗粒通常通过受体-介导的胞吞作用和/或膜融合进入宿主细胞。

在病毒颗粒释放到靶细胞中后,外包膜脱落,病毒RNA通过逆转录被复制到DNA中。这是由pol区编码的逆转录酶催化的,并使用包装到病毒体中的宿主细胞tRNA作为DNA合成的引物。以这种方式,RNA基因组被转化为更复杂的DNA基因组。

通过逆转录产生的双链线性DNA可能必须或可能不必在核中环化。现在前病毒在两端具有两个相同的重复,称为长末端重复(LTR)。两个LTR序列的末端产生被pol产物--整合酶蛋白--识别的位点,其催化整合,使得前病毒总是从LTR末端与宿主DNA两个碱基对(bp)连接。在两个LTR的末端都可见细胞序列的复制,让人想到转座遗传元件的整合模式。逆转录病毒可以在宿主DNA中的许多位点整合其DNA,但不同的逆转录病毒具有不同的整合位点偏好。HIV-1和猿猴免疫缺陷病毒DNA优先整合到表达的基因中,鼠白血病病毒(MLV)DNA优先整合到转录起始位点(TSS)附近,并且禽肉瘤白血病病毒(ASLV)和人类T细胞白血病病毒(HTLV)DNA几乎随机整合,显示对基因的轻微偏好(Derse D,et al.(2007),J Virol81:6731–6741;Lewinski MK,et al.(2006),PLoS Pathog 2:e601)。

整合的病毒DNA的转录、RNA剪接和翻译由宿主细胞蛋白介导。产生了各种剪接的转录物。在人类逆转录病毒的情况下,也使用HIV-1/2和HTLV-I/II病毒蛋白来调控基因表达。细胞和病毒因子之间的相互作用是控制病毒潜伏期和病毒基因表达的时间顺序的因素。

逆转录病毒可以水平和垂直传播。逆转录病毒的有效感染性传播需要在靶细胞上表达特异性识别病毒包膜蛋白的受体,尽管病毒可以以低效率使用受体非依赖性的非特异性进入途径。通常,因为受体掩蔽或下调,病毒感染导致每个细胞只有单个或几个病毒基因组拷贝,这反过来导致对超感染的抗性(在“逆转录病毒”中的Ch3 p104,JM Coffin,SHHughes,&HE Varmus,1997,Cold Spring Harbor Laboratory Press,Cold Spring HarborNY;Fan et al.J.Virol 28:802,1978)。通过操纵组织培养中的情况,可以获得一定水平的多重感染,但这通常小于5个拷贝/二倍体基因组。此外,靶细胞类型必须能够在病毒结合和穿透后支持复制周期的所有阶段。当病毒基因组整合到宿主的种系中时,发生垂直传播。然后前病毒将从一代传递到另一代,就像它是细胞基因一样。因此,建立了通常潜伏的内源性前病毒,但当宿主暴露于适当的试剂时,其可以被激活。

术语“慢病毒”以其常规含义用于描述含有逆转录酶的病毒属。慢病毒包括“免疫缺陷病毒”,其包括人类免疫缺陷病毒(HIV)1型和2型(HIV-1和HIV-2)以及猿猴免疫缺陷病毒(SIV)。

在历史上,基于如在病毒成熟过程中在电子显微镜下所看到的颗粒形态学,致癌病毒已经被进一步细分为A、B、C和D组。A型颗粒代表在感染细胞的细胞质中见到的B型和D型病毒的不成熟颗粒。这些颗粒没有感染性。B型颗粒通过胞浆内A型颗粒的包被从质膜上出芽为成熟的病毒体。在膜上,它们具有75nm的环形核心,长糖蛋白刺突从该核突出。在出芽后,B型颗粒含有偏心定位的电子致密核。原型B型病毒是小鼠乳腺肿瘤病毒(MMTV)。在感染C型病毒的细胞中没有观察到胞质内颗粒。相反,成熟颗粒通过新月‘C’-形凝结直接从细胞表面出芽,然后其自身闭合并被质膜包围。包膜糖蛋白刺突连同均匀的电子-致密核可以是可见的。出芽可从表面质膜发生或直接进入细胞内液泡。C型病毒是最常研究的,包括许多禽类和鼠白血病病毒(MLV)。牛白血病病毒(BLV)和人类T细胞白血病病毒I和II型(HTLV-I/II)由于它们从细胞表面出芽的形态学而被类似地分类为C型颗粒。然而,它们也具有规则的六边形形态和比原型C型病毒如鼠白血病病毒(MLV)更复杂的基因组结构。D型颗粒类似于B型颗粒,因为它们在感染的细胞质中显示为环状结构,其从细胞表面出芽,但病毒体掺入短的表面糖蛋白刺突。电子致密核也偏心地位于颗粒内。梅森·辉瑞猴病毒(MPMV)是原型D-型病毒。

在许多治疗上使用重组具有复制能力的逆转录病毒的情况下,具有高水平由该重组具有复制能力的逆转录病毒编码的转基因表达是有利的。例如,对于前药激活基因如胞嘧啶脱氨酶基因,在细胞中具有更高水平的CD蛋白表达是有利的,以便前药5-FC向5-FU的转化更有效。类似地,siRNA或shRNA的高水平表达导致更有效地抑制靶基因表达。还对于细胞因子或多肽结合结构域(例如单链抗体(scAbs)等),通常表达高水平的细胞因子或结合结构域是有利的。此外,在载体的一些拷贝中存在失活或损害载体或转基因的活性的突变的情况下,在靶细胞中具有载体的多个拷贝是有利的,因为这提供了完整转基因的高效表达的高可能性。

如上所述,整合的DNA中间体被称为前病毒。现有的基因疗法或基因递送系统使用的方法和逆转录病毒,需要前病毒转录并同时在存在合适辅助病毒或在含有合适序列的细胞系中组装成感染性病毒,所述序列能够使衣壳化而不同时产生污染性辅助病毒。类似的方法(互补辅助病毒或细胞系)已经用于产生无辅助病毒的病毒载体制剂,例如来自腺病毒、疱疹病毒、腺相关病毒(AAV)的那些。如下所述,辅助病毒不是本发明重组逆转录病毒生产所必需的,因为用于衣壳化的序列在基因组中提供,从而提供了用于基因递送或治疗的具有复制能力的逆转录病毒载体。类似地,对于其它具有复制能力的病毒载体,例如衍生自腺病毒、疱疹病毒、弹状病毒、麻疹、脊髓灰质炎病毒、新城疫病毒、甲病毒、牛痘或其它痘病毒的那些,不需要特定的工程化互补细胞系,通过感染正常宿主细胞制得所述病毒载体,并收获所得病毒。

本公开的逆转录病毒基因组和前病毒DNA具有至少三个基因:gag、pol和env,这些基因的侧翼可以是一个或两个长末端重复(LTR),或者在原病毒中,侧翼是两个长末端重复(LTR)和含有顺式作用序列如psi的序列。gag基因编码内部结构(基质、衣壳和核壳)蛋白;pol基因编码RNA-指导的DNA聚合酶(逆转录酶)、蛋白酶和整合酶;并且env基因编码病毒包膜糖蛋白。5'和/或3'LTR用于促进病毒体RNA的转录和多聚腺苷酸化。LTR含有病毒复制所需的所有其它顺式作用序列。慢病毒具有其它基因,包括vif、vpr、tat、rev、vpu、nef和vpx(在HIV-1、HIV-2和/或SIV中)。本领域技术人员将认识到,逆转录病毒基因组是RNA基因组,因此提及任何逆转录病毒基因组序列隐含地是指其中“T”是“U”的序列。因此,当提及逆转录病毒基因组时,提及具有含有T的特定序列的gag核酸序列隐含地指T被U替换。

与5'LTR相邻的是基因组逆转录(tRNA引物结合位点)和病毒RNA有效衣壳化成颗粒(psi位点)所需的序列。如果衣壳化(或逆转录病毒RNA包装到感染性病毒体中)所需的序列从病毒基因组中缺失,结果是顺式缺陷,其阻止基因组病毒RNA的衣壳化。这种类型的修饰载体是通常用于现有基因递送系统(即缺乏病毒体衣壳化所需元件的系统)中作为“辅助”元件的载体,其提供包装非复制但可包装的RNA基因组的反式病毒蛋白。

本公开提供了经修饰的逆转录病毒载体。所述经修饰的逆转录病毒载体可以衍生自逆转录病毒科家族的成员,并被工程化以含有ENV-2A-SSP-转基因盒。如上所述,逆转录病毒科由三组组成:泡沫病毒(或泡沫病毒)如人类泡沫病毒(HFV);慢病毒以及绵羊的维斯纳病病毒;以及致癌病毒(尽管并非该组中的所有病毒都是致癌的)。

在一个实施方式中,病毒载体可以是能够仅感染分裂哺乳动物细胞的具有复制能力的逆转录病毒载体。在一个实施方式中,具有复制能力的逆转录病毒载体包含2A肽或2A肽样序列,其刚好位于逆转录病毒包膜的下游并与之可操作地连接,并且刚好位于分泌信号肽(SSP)的编码序列的上游,所述分泌信号肽的编码序列又与待表达的异源核酸序列连接。在某些实施方式中,载体可附加地包括IRES盒或polII(或微型启动子)或polIII盒。异源多核苷酸可编码例如胞嘧啶脱氨酶、硝基还原酶、细胞因子、受体、抗体、抗体片段、结合结构域(例如非抗体结合结构域或非-Ig多肽)等。当包括polIII启动子时,载体可进一步表达miRNA、siRNA或其它RNAi序列。

在另一个实施方式中,本公开提供了一种ENV-2A-SSP-异源基因盒。所述盒可以包含选自双嗜性、泛嗜性、异嗜性、10A1、GALV、狒狒内源性病毒、RD114、弹状病毒、甲病毒、麻疹和流感病毒包膜中的一种的包膜。2A肽或2A肽样编码序列可以是图1或2中所示的任何序列,其可操作地连接至包膜编码序列的C-末端。在另一个实施方式中,2A肽或2A肽样编码序列通过GSG接头序列(例如ggaagcgga(SEQ ID NO:3))连接。在另一个实施方式中,GSG-2A肽或肽样编码序列连接至SSP编码序列。异源基因可操作地连接到SSP编码序列的C-末端。异源基因可以是任何要递送到靶细胞中并在其中表达的所需基因。在一个实施方式中,异源基因包含500-1500bp长或其间的任何数值(例如1000bp、1100bp、1200bp、1300bp、1400bp等)。在另一个实施方式中,异源基因包含>1500bp长。在另一个实施方式中,所述盒包含两个异源基因,它们被SSP肽编码序列上游的2A肽或2A肽样编码序列分隔开。在又另一个实施方式中,所述盒可包含编码2A肽或2A肽样序列的多核苷酸,所述多核苷酸可操作地连接在ENV的C-末端和SSP序列的N-末端之间,所述SSP序列与异源基因的N-末端连接,其中所述异源基因后接第二盒,所述第二盒包含与第二异源序列连接的IRES或启动子。

所述异源核酸序列与编码SSP肽的序列可操作地连接,所述SSP肽与2A肽或2A肽样序列可操作地连接并位于其下游。如本文所用,术语“异源”核酸序列或转基因是指(i)在野生型逆转录病毒中通常不存在的序列,(ii)源自外来物种的序列,或(iii)如果来自相同物种,则其可从其原始形式被实质性修饰。或者,通常不在细胞中表达的未改变的核酸序列是异源核酸序列。

根据本公开的逆转录病毒载体的预期用途,可以将任何数目的异源多核苷酸或核酸序列插入逆转录病毒载体中。例如,对于体外研究,可以使用常用的标记基因或报道基因,包括抗生素抗性和荧光分子(例如GFP)或发光分子。编码任何期望的多肽序列的附加多核苷酸序列也可以插入本公开的载体中。

当寻求异源核酸序列的体内递送时,可以使用治疗性和非治疗性序列。本公开的RRV可包含至少一个含有SSP结构域的盒。通常SSP结构域在要从感染了RRV的细胞分泌的特定多肽或蛋白质的上游。在一个实施方式中,所述SSP的生物学效应可以通过测量与缺少SSP的相同多肽相比,当被翻译时所述SSP所附接的分泌多肽的量来确定。

在一些实施方式中,-2A-SSP-转基因盒之后可以是微型启动子盒、polIII-RNAi盒或IRES盒。例如,当使用微型启动子或polIII盒时,所述盒可包含异源序列,包括针对与细胞增殖性病症或其它基因相关疾病或病症有关的特定基因的miRNA、siRNA等。在其它实施方式中,SSP肽编码序列或IRES下游的异源基因可以是自杀基因(例如HSV-tk或PNP或具有胞嘧啶脱氨酶活性的多肽;经修饰的或未修饰的)、生长因子或治疗性蛋白(例如因子IX、IL2等)。适用于本公开的其它治疗性蛋白质在本领域中容易鉴定。在某些实施方式中,在异源基因编码待分泌的蛋白质或多肽的情况下,所述异源序列之前是SSP肽的编码序列。例如,在抗体、抗体片段或结合结构域由异源基因编码的情况下,治疗盒包含2A-肽或肽样编码序列,随后是SSP编码序列,接着是编码待分泌的多肽或肽(例如抗体、抗体片段或结合结构域)的异源多核苷酸序列。在某些实施方式中,待分泌的多肽不是胸苷激酶。在一些实施方式中,RRV可包含两个盒,一个盒包含待分泌的多肽且在SSP结构域之前,第二盒包含不被分泌的多肽或部分。例如,这种双盒可以包含:

-2A-SSP-(待分泌的多肽)-(2A或IRES或微型启动子或polIII)-(多肽或miRNA)-。

在一个实施方式中,载体内的异源多核苷酸包含已经被优化用于在人类细胞中表达的胞嘧啶脱氨酶或胸苷激酶。在进一步的实施方式中,胞嘧啶脱氨酶包含已经对人类密码子优化的序列,并且包含与野生型胞嘧啶脱氨酶相比增加胞嘧啶脱氨酶稳定性(例如降解减少或热稳定性增加)的突变和/或将色氨酸密码子改变为非色氨酸编码密码子的突变。在另一个实施方式中,异源多核苷酸编码融合构建体,该融合构建体包含具有胞嘧啶脱氨酶活性的多肽(人类密码子优化或非优化的,突变或非突变的),该多肽与编码具有UPRT或OPRT活性的多肽的多核苷酸可操作地连接。

抗体(及其片段)是重要的一类治疗剂。它们的特异性结合和功能性质决定了它们的作用模式。大多数FDA批准的抗体是拮抗剂,并且对其靶标具有高结合亲和力。或者,已经开始开发源自天然内源蛋白的非免疫球蛋白(非-Ig)支架蛋白以替代抗体。使用非-Ig蛋白的优点是它们可以实现高结合亲和力,并且它们与抗体相比相对较小,因此可以更有效地穿透组织。它们也可被工程化为多价的和/或多靶特异性的。

本公开描述了具有GSG-连接的2A肽构型的RRV中的天然或人工信号肽用于产生分泌的蛋白质或多肽的用途,所述分泌的蛋白质或多肽包括但不限于前药激活基因、细胞因子或受体配体或它们的类似物、免疫球蛋白(Ig)和非-Ig衍生的蛋白质。本公开还描述了其它RRV构型,例如具有IRES或小/微型启动子的RRV构型,用于表达具有异源分泌信号肽的异源转基因。

通常,本公开的重组具有复制能力的病毒载体被修饰以包括“盒”,其通常含有待递送并在宿主细胞中表达的异源基因或序列。所述异源基因或序列与允许有效表达的元件(例如允许异源序列转录和翻译的启动子、IRES或通读元件)可操作地连接。

转基因(例如待表达的异源序列)可以在许多位置插入逆转录病毒基因组,包括插入长末端重复(LTR)、插入包膜下游和剪接受体后、与病毒gag或pol蛋白融合、内部IRES序列或包膜编码序列下游的小内部启动子。将转基因插入LTR和引入额外的剪接受体导致载体基因组快速失稳,而IRES和其它方法已显示出更大的前景。通过关键序列的明智变化,例如隐蔽剪接受体的消除和转基因序列的人源化,可以至少部分地影响转基因的表达和构成(参见例如美国专利号No.8,722,867,其公开内容通过引用并入本文)。转基因的大小也可以对载体的稳定性有影响。例如,在某些载体中,随着转基因大小的增加,病毒变得不稳定,并迅速缺失至少部分异源基因或序列。在一些情况下,这种限制由于需要包括表达使能序列如IRES(通常约600bp,参见例如美国专利号No.8,722,867)或小启动子(通常约250-300bp,参见例如国际申请公开号No.WO 2014/066700,其通过引用结合到本文中)而加剧,可能在例如MLV中仅留下900至1200bp的异源基因或序列插入物。因此,能够使可用的转基因大小最大化以包括转基因或多个转基因的更多选择将是非常有用的。

在人类细胞中有效复制的逆转录病毒的一些实例包括鼠白血病病毒(MLV)的双嗜性、泛嗜性、异嗜性和10A1株以及长臂猿白血病病毒(GALV)、狒狒内源病毒和猫病毒RD114。同样地,已经被修饰以含有非亲嗜性包膜基因的MLV的亲嗜性株(如双嗜性假型RRV)也可在多种待处理的物种和细胞类型中有效复制。然而,逆转录病毒包膜也可以被非逆转录病毒包膜(如弹状病毒、甲病毒、麻疹或流感病毒包膜)替代。

包括小核糖核酸病毒和脑心肌炎病毒在内的多种病毒在其基因组中编码2A或2A样肽,以便从单个开放阅读框(ORF)介导多蛋白表达。2A肽通常在序列上为约16-18个氨基酸,并共有基序:D[V/I]EXNPGP(SEQ ID NO:1),其中X是任何氨基酸。当2A肽在人工多顺反子mRNA中的ORF之间编码时,它引起核糖体在翻译多肽中终止于2A肽的C-末端,从而导致源自每个ORF的多肽的分离(Doronina et al.,2008)。分离点在2A的C-末端,下游ORF的第一个氨基酸是脯氨酸(参见例如,图1)。2A肽的独特特征已导致其被用作从单一多顺反子mRNA构型表达多蛋白的分子工具。

2A肽存在于小核糖核酸病毒科病毒(如口蹄疫病毒和马鼻炎A病毒)和其它病毒(如猪特斯科病毒-1和昆虫病毒明脉扁刺蛾β四体病毒)的病毒基因组中(图1)。2A肽在其天然环境中具有接近100%的“分离”效率,并且当它们被引入非天然序列中时通常具有较低的“分离”效率。在不同类别病毒中发现的其它2A样序列也已显示在非天然序列中达到~85%的“分离”效率(Donnelly et al.,1997)。有大量2A样序列(图2)可用于本公开的方法和组合物中用以表达转基因。

尽管已知存在2A序列已有约20年,但它们在非天然设置中起作用的能力受到质疑。特别地,2A序列在先前翻译的蛋白质的C-末端留下大约17-22个额外的氨基酸,并在下游蛋白质的N-末端添加脯氨酸,因此可能影响在前蛋白质发挥功能的能力。如果蛋白质需要在内质和高尔基体中和/或病毒体成熟期间进行翻译后修饰,如许多病毒包膜蛋白质的情形(T.Murakami,Mol Biol Int.,2012),则存在先前蛋白质功能丧失的进一步风险。

通常,天然MLV包膜蛋白的加工涉及前体蛋白Pr85裂解为gp70(SU)和p15E(TM)亚基,其发生在感染的宿主细胞中。在从宿主细胞出芽的过程中,为了将病毒包膜蛋白有效掺入病毒颗粒中,需要切割Pr85。随着病毒体从宿主细胞膜出芽,病毒体经历成熟过程以变得有感染性。MLV病毒体成熟的过程之一涉及通过病毒蛋白酶去除位于包膜蛋白TM亚基C-末端的R-肽。除了最后一个氨基酸残基脯氨酸(Pro)之外的2A肽在R-肽的下游表达,使得R肽的长度为16个氨基酸到至少32个氨基酸,这取决于2A肽的序列。尽管通过添加2A肽序列延长了R-肽的长度,理论上,2A肽将随R肽的切割同时被去除,产生功能性包膜蛋白。

如果包膜序列是无功能的或减毒的,则病毒载体可能是无用的。已经尝试在具有仅感染小鼠的特定包膜(亲嗜性)的逆转录病毒构建体中使用特定2A序列(来自猪特斯科病毒-1,“P2A”)(S.Stavrou et al.,PLoS Pathog 10(5):e1004145,2014;和E.P.Browne,J.Virol.89:155-64,2015)。然而,这些病毒不感染人类细胞,并且没有预期已经解决了一般的蛋白质加工问题。此外,如此构建的病毒被设计为表达促进病毒体内复制的基因,而不是表示实现治疗效果的基因。

在一些情况下,希望从感染的细胞分泌通过重组逆转录病毒载体递送至宿主细胞的蛋白质或多肽。也就是说,将携带含有编码多肽或蛋白质的异源多核苷酸的盒的RRV工程化,以从感染的靶细胞分泌,其中将所得RRV的前病毒DNA掺入到靶细胞的基因组中。如上所述,分泌信号肽可被工程化在多肽或蛋白质的上游,以便使从细胞分泌多肽或蛋白质。在这种情况下,分泌信号肽编码序列被工程化以位于2A-或2A-样肽与待分泌的多肽或蛋白质之间。因此,在这种RRV中的盒可位于env编码序列和具有以下一般结构的3'LTR之间:--(env)--(2A)-(SSP)-(多肽或蛋白质)—(LTR)。从上述一般结构可以看出,所述盒可以被看作是模块化的,并且可以改变/改组各种2A或2A样序列、SSP序列和多肽或蛋白质序列。

单克隆抗体仍然是诊断和癌症治疗中人类治疗的主流。它们具有长的血清半衰期、二价性和免疫效应子功能。尽管它们的部分或完全人类性质使免疫原性最小化,但是单克隆抗体是具有多个结构域的复杂蛋白质,需要适当的二硫键形成和糖基化过程,因此其生产仅限于在可放大性有限的真核细胞中。单克隆抗体的另一个重要的潜在限制是,据信150KDa大小的完整抗体也可能具有有限的组织穿透和细胞内可达性。已经通过开发片段化抗体(如单链可变区片段(scFv)或Fab)克服这些限制中的一些。进一步的开发还利用了骆驼和软骨鱼的结合蛋白,其包含缺乏轻链的仅重链同种型。

已经开发了用于生物治疗的非免疫球蛋白(Ig)支架蛋白,其使用随机化策略来鉴定抗原结合序列(U.H Wiedle et al.,Cancer Genomics&Proteomics 10:155-168,2013;K.Skrlec et al.,Trends in Biotechnology,33:408-418,2015)。非-Ig支架蛋白是来自人类和其它物种的天然蛋白的结构域-源性亚基,或是人工的,并且它们的大小范围为6-20kDa,可以由单一多肽表达。它们在α-螺旋或β片层框架中具有表面暴露的环或氨基酸,可以耐受插入、缺失和取代,其通过随机化、噬菌体展示筛选和亲和力成熟过程产生可以作为拮抗剂或激动剂而发挥功能的抗原结合支架蛋白。迄今为止,已经为治疗鉴定和开发了超过50种不同种类的非-Ig支架蛋白作为支架结合剂。由于它们的大小,这些蛋白质面临的一个主要挑战是快速的肾清除,导致循环半衰期短。提高这些非-Ig支架蛋白的半衰期的一种常见解决方案涉及使用融合蛋白,其含有与IgG的Fc区连接的支架蛋白。另一个挑战是它们通常具有比单克隆抗体更低的结合亲和力(KD 1-100nM)并且与快速解离速率相关。对这些支架蛋白进行遗传修饰以包括多聚化结构域可以增加空间位阻-介导的阻断或亲和力,其中在某些信号传导途径中可以导致生物学功能和治疗效果。已经提出了多种方法,并且至少部分地使用融合蛋白进行了测试,所述融合蛋白含有与IgG的Fc区连接的支架蛋白,或含有通过接头连接以生成二聚体的支架蛋白的两个重复单元。除了连接肽和IgG的Fc区之外,已经利用二聚体-、三聚体-和五聚体-多聚化结构域来表达以寡聚体状态存在的所需蛋白质的胞外结构域,或用来加强蛋白质-蛋白质相互作用。

本公开提供了使用结合结构域的组合物和方法,所述结合结构域包含由支架结构域连接的重链和/或轻链CDR的组合(例如,Adhiron支架;来自人类Stefin A的支架-参见EP22792058B1和WO2019/008335,其公开内容通过引用并入本文)。在一些实施方式中,结合结构域的编码序列被可操作地连接在2A或2A样肽编码序列的下游。在另一个实施方式中,结合结构域的编码序列与分泌信号肽的编码序列可操作地连接。在又另一个实施方式中,结合结构域的编码序列可操作地连接在2A或2A样肽编码序列的下游,所述2A或2A样肽编码序列又与分泌信号肽编码序列连接,使得核酸盒具有以下一般结构:--2A—SSP—结合结构域---。在其它实施方式中,本公开提供了IgG的Fc区、IgA和IgM的Fc区的部分、甘氨酸-丝氨酸接头和多聚化结构域的组合物以及它们用于形成寡聚抗原结合支架蛋白的用途。前述任何一种均可与具有序列优化的RRV组合使用,以使Apobec3-介导的超突变最小化,从而增强蛋白质稳定性和/或亲合力以及表达,以获得潜在更好的生物学功能和治疗效果。本公开还提供了表达载体和使用方法,特别是具有高肿瘤-靶向特异性的病毒载体,以在肿瘤微环境中递送治疗有效载荷,以抵消这些抗原结合非-Ig支架蛋白在循环中的快速清除,并且当静脉内施用时使脱靶效应和毒性最小化。表1、2、3、4和5提供了可用于本公开组合物和方法中的序列。请注意,由于本公开考虑了RNA,所以在以下核酸序列中,“T”可以是“U”。

表1:可作为抗原结合蛋白发挥功能的一些非-Ig支架蛋白的氨基酸序列

表2:可作为抗原结合蛋白发挥功能的非-Ig支架蛋白的核酸序列

表3:甘氨酸-丝氨酸接头的氨基酸和核酸序列

表4:人类IgG Fc和IgM Cμ4tp的氨基酸序列

表5:人类IgG Fc和IgM Cμ4tp的核酸序列

表6:多聚化结构域的氨基酸序列

表7:多聚化结构域的核酸序列

本公开的RRV可以被工程化以改变它们的稳定性和/或表达。例如,表达的变化可以是由当复制型逆转录病毒载体在肿瘤组织中逐渐复制时失活或减毒突变积累的频率所致。研究显示,最频繁的事件之一是G至A突变(对应于逆转录步骤中来自第一复制步骤的负链单链DNA中C至T特征性ApoBec介导的突变)。这可以引起RRV蛋白的氨基酸组成的变化和从TGG(色氨酸)到终止密码子(TAG或TGA)的破坏性变化。在一个实施方式中,通过用具有相似化学或结构性质的其它氨基酸(如苯丙氨酸或酪氨酸)的密码子代替色氨酸密码子的工程化来避免这种失活改变。

因此,除了2A-肽-SSP盒之外,RRV可以包括多个额外的突变,其改善构建体在宿主细胞中的表达和/或稳定性。这种突变可包括GAG、POL和/或ENV编码序列中一个或多个密码子的修饰,其将色氨酸密码子改变为可维持GAG、POL和/或ENV结构域的生物活性的容许密码子。本领域已知色氨酸的密码子是UGG(DNA中的TGG)。此外,本领域已知“终止密码子”是UAA、UAG或UGA(DNA中的TAA、TAG或TGA)。色氨酸密码子中的单点突变可引起非天然终止密码子(例如UGG->UAG或UGG->UGA)。还已知人类APOB EC3GF(hA3G/F)通过G->A超突变抑制逆转录病毒复制(Neogi et al.,J.Int.AIDS Soc.,16(1):18472,2013年2月25日)。此外,如下所述,通过避免在编码序列中使用色氨酸密码子,可以提高长期表达和病毒稳定性,从而避免由于hA3G/F引起的超突变而导致掺入非天然终止密码子。例如,在一个实施方式中,MLV来源的核酸序列包含GAG、POL和ENV编码区,该编码区可以包含含有表A中鉴定的核苷酸的密码子修饰(参考SEQ ID NO:2的核苷酸编号),位于色氨酸密码子中,可以提供hA3G/F抗性RRV。

表A.导致色氨酸至终止密码子改变的复发性G至A突变的汇总。核苷酸是SEQ IDNO:2RRV基因组中的位置,“基因”是所述核苷酸所位于其中的基因,并且AA是多肽中的氨基酸位置。

核苷酸 基因 AA
1306 GAG 35
5299 POL 718
5557 POL 804
5806 POL 887
6193 POL 1016
6232 POL 1029
6298 POL 1051
6801 ENV 148
6978 ENV 207
7578 ENV 407

因此,在本公开的一个实施方式中,提供了重组具有复制能力的逆转录病毒,其在色氨酸密码子中包含一个或多个突变,其中所述突变将密码子改变为除色氨酸以外的氨基酸的密码子,并且其提供生物相容的密码子(即不破坏载体功能的密码子)。这种载体在本文中有时称为“ApoBec失活抗性载体”或“ApoBec抗性载体”。重组ApoBec失活抗性载体可以包含IRES盒、启动子盒和/或2A肽-SSP盒。

如上所述,人类APOBEC3G导致病毒载体序列中转化G->A的超突变(Ho gan etal.,Can.Res.,2018)。因此,包含在2A-SSP肽盒中的异源多核苷酸中的色氨酸密码子易于被hAPOBEC3转化为终止密码子。为了避免这种突变,可以用其它氨基酸的生物学允许的密码子替换色氨酸密码子。例如,在一个实施方式中,本公开的2A-SSP盒可以包含编码具有胞嘧啶脱氨酶活性的多肽的多核苷酸,其中所述多核苷酸包含以下序列:

(或前述其中“t”是“u”)。

这一序列包含两个色氨酸密码子(粗体/下划线)。在本公开的一个实施方式中,这些密码子被独立地改变为提供选自D、M、T、E、S、Q、N、F、Y、A、K、H、P、R、V、L、G、I和C中的氨基酸的密码子。所得的多肽包含序列:

其中所述多肽包含胞嘧啶脱氨酶活性,其中X是除色氨酸之外的任何氨基酸。在一个实施方式中,SEQ ID NO:29中的X各自独立地选自F、D、M、L、S或R。

在另一个实施方式中,具有复制能力的逆转录病毒载体可以包含编码含有胞嘧啶脱氨酶(如本文所述)的多肽的异源多核苷酸,并且可以进一步包含含有miRNA或siRNA分子的多核苷酸,所述miRNA或siRNA分子作为来自病毒启动子的初级转录物的一部分或与启动子连接,所述启动子可以是细胞类型或组织特异的。在又另一个实施方式中,所述miRNA或siRNA之前可以为pol III启动子。

微小RNA(miRNA)是小的非编码RNA。它们位于编码或非编码基因的内含子、非编码基因的外显子或基因间区域。miRNA编码序列通过RNA聚合酶III转录,其产生称为初级前体miRNA(pri-miRNA)的前体多核苷酸。核中的pri-miRNA由核糖核酸酶Drosha加工以产生形成短发夹结构的miRNA前体(前-miRNA)。随后,前-miRNA通过输出蛋白5转运到细胞质,并通过称为Dicer的另一种核糖核酸酶进一步加工以产生活性的成熟miRNA。siRNA序列之前没有SSP编码序列,而是siRNA为病毒载体中治疗盒中存在的第二盒的一部分。

成熟miRNA的长度为约21个核苷酸。它通过结合靶基因mRNA的3'非翻译区并通过抑制蛋白质翻译或mRNA降解来抑制蛋白质表达,从而发挥功能。miRNA参与包括发育、细胞增殖、分化和癌症进展的生物学过程。miRNA谱研究表明,一些miRNA表达是组织特异性的或在某些组织中富集。例如,已证明miR-142-3p、miR-181和miR-223表达在人类和小鼠的造血组织中富集(Baskerville et al.,2005 RNA 11,241-247;Chen et al.,2004Science303,83-86)。

已经观察到一些miRNA在多种肿瘤中上调(致癌miRNA)或下调(阻抑物)(Spizzoet al.,2009Cell 137,586e1)。例如,miR-21在成胶质细胞瘤、乳腺癌、肺癌、前列腺癌、结肠癌、胃癌、食道癌和宫颈癌、子宫平滑肌肉瘤、DLBCL、头颈癌中过表达。相反,已报道let-7的成员在成胶质细胞瘤、肺癌、乳腺癌、胃癌、卵巢癌、前列腺癌和结肠癌中下调。癌症中miRNA表达的内稳态的重建是抑制或逆转癌症进展的必要机制。

在癌症中下调的miRNA可以用作抗癌剂。实例包括mir-128-1、let-7、miR-26、miR-124和miR-137(Esquela-Kerscher et al.,2008Cell Cycle 7,759–764;Kumar et al.,2008Proc Natl Acad Sci USA 105,3903–3908;Kota et al.,2009Cell 137,1005-1017;Silber et al.,2008BMC Medicine 6:141-17)。据报道,miR-128表达在中枢神经系统中富集,并已观察到在成胶质细胞瘤中下调(Sempere et al.,2004Genome Biology 5:R13.5-11;Godlewski et al.,2008Cancer Res 68:(22)9125-9130)。miR-128由两个不同的基因miR-128-1和miR-128-2编码。两者被加工成相同的成熟序列。Bmi-1和E2F3a已被报道是miR-128的直接靶标(Godlewski et al.,2008Cancer Res 68:(22)9125-9130;Zhang etal.,2009J.Mol Med 87:43-51)。此外,已观察到Bmi-1表达在多种人类癌症中上调,包括神经胶质瘤、套细胞淋巴瘤、非小细胞肺癌、B细胞非霍奇金淋巴瘤、乳腺癌、结肠直肠癌和前列腺癌。此外,Bmi-1已被证明是从不同组织自我更新干细胞所必需的,所述组织包括神经元干细胞以及神经胶质瘤中的“干细胞样”细胞群。

设计发夹双链体的茎长度的合适范围包括20-30个核苷酸、30-50个核苷酸、50-100个核苷酸、100-150个核苷酸、150-200个核苷酸、200-300个核苷酸、300-400个核苷酸、400-500个核苷酸、500-600个核苷酸和600-700个核苷酸的茎长度。设计发夹双链体的环长度的合适范围包括4-25个核苷酸、25-50个核苷酸的环长度,或者如果发夹双链体的茎长度相当大则更长。在某些情况下,不管环序列和长度如何,具有长于21个核苷酸的双链体区的发夹结构可以促进有效的siRNA-指导的沉默。

在又另一个或进一步的实施方式中,异源多核苷酸可以包含细胞因子,例如白介素、干扰素γ等。可以从本公开的逆转录病毒载体表达的细胞因子包括但不限于IL-1α、IL-1β、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、IL-19、IL-20、IL-21、1L-22、IL-23、IL-24、IL-25、IL-26、IL-27、IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IL-34、IL-35、IL-36、IL-37、IL-38、抗-CD40、CD40L、IFN-γ和TNF-α、可溶形式的TNF-α、淋巴毒素-α(LT-α,也称为TNF-β)、LT-β(见于复合异源三聚体LT-α2-β)、OPGL、FasL、CD27L、CD30L、4-1BBL、DcR3、OX40L、TNF-γ(国际公开No.WO 96/14328)、AIM-I(国际公开No.WO 97/33899)、内分泌因子-α(国际公开No.WO 98/07880)、OPG和neutrokine-α(国际公开No.WO 98/18921)、OX40和神经生长因子(NGF)和可溶形式的Fas、CD30、CD27、CD40和4-IBB,TR2(国际公开No.WO 96/34095)、DR3(国际公开No.WO 97/33904)、DR4(国际公开No.WO 98/32856)、TR5(国际公开No.WO98/30693)、TRANK、TR9(国际公开No.WO 98/56892)、TR10(国际公开No.WO 98/54202)、312C2(国际公开No.WO98/06842)和TR12以及可溶形式的CD154、CD70和CD153。在一些实施方式中,血管生成蛋白可以用于特别地从细胞系产生蛋白质。这样的血管生成因子包括但不限于神经胶质瘤衍生生长因子(GDGF)、血小板衍生生长因子-A(PDGF-A)、血小板衍生生长因子-B(PDGF-B)、胎盘生长因子(PIGF)、胎盘生长因子-2(PIGF-2)、血管内皮生长因子(VEGF)、血管内皮生长因子-A(VEGF-A)、血管内皮生长因子-2(VEGF-2)、血管内皮生长因子B(VEGF-3)、血管内皮生长因子B-1 86(VEGF-B186)、血管内皮生长因子-D(VEGF-D)、血管内皮生长因子-D(VEGF-D)和血管内皮生长因子-E(VEGF-E)。成纤维细胞生长因子可以由本公开的载体递送,并且包括但不限于FGF-1、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10、FGF-11、FGF-12、FGF-13、FGF-14和FGF-15。造血生长因子可以使用本公开的载体递送,此类生长因子包括但不限于粒细胞巨噬细胞集落刺激因子(GM-CSF)(沙格司亭)、粒细胞集落刺激因子(G-CSF)(非格司亭)、巨噬细胞集落刺激因子(M-CSF,CSF-1)促红细胞生成素(阿法依泊汀)、干细胞因子(SCF,c-kit配体,钢因子)、巨核细胞集落刺激因子、PIXY321(GMCSF/IL-3)融合蛋白等。

异源核酸序列通常受病毒LTR启动子-增强子元件的控制。因此,本公开的重组逆转录病毒载体、所需序列、基因和/或基因片段可以插入在在多个位点处并且在不同调控序列下。例如,用于插入的位点可以是病毒增强子/启动子近端位点(即,5'LTR-驱动的基因座)。

在一个实施方式中,本公开的逆转录病毒基因组含有SSP编码序列上游的2A肽或2A肽样编码序列,其中所述SSP编码序列后接下游克隆位点,用于插入所需/异源多核苷酸。在一个实施方式中,2A肽或2A肽样编码序列位于逆转录病毒载体中env基因的3'端,但位于所述SSP编码序列和所需异源多核苷酸的5'端。因此,编码所需多肽的异源多核苷酸与2A肽或2A肽样–SSP编码序列可操作地连接。

在另一个实施方式中,靶向多核苷酸序列作为本公开重组逆转录病毒载体的一部分被包括。靶向多核苷酸序列是靶向配体(例如肽激素如调蛋白、单链抗体、受体或受体的配体)、组织特异性或细胞类型特异性调控元件(例如组织特异性或细胞类型特异性启动子或增强子)、或靶向配体与组织特异性/细胞类型特异性调控元件的组合。优选地,靶向配体可操作地连接至或存在于逆转录病毒的env蛋白中,产生嵌合逆转录病毒env蛋白。病毒GAG、病毒POL和病毒ENV蛋白可衍生自任何合适的逆转录病毒(例如MLV或慢病毒源性的)。在另一个实施方式中,病毒ENV蛋白是非逆转录病毒源性的(例如CMV或VSV)。

在一个实施方式中,本公开的重组逆转录病毒以这样的方式被遗传修饰,该方法使得病毒靶向特定细胞类型(例如平滑肌细胞、肝细胞、肾细胞、成纤维细胞、角质形成细胞、间充质干细胞、骨髓细胞、软骨细胞、上皮细胞、肠细胞、乳腺细胞、赘生性细胞、神经胶质瘤细胞、神经元细胞和本领域已知的其它细胞),使得逆转录病毒载体的重组基因组被递送至靶非分裂细胞、靶分裂细胞或具有细胞增殖性病症的靶细胞。

在一个实施方式中,本公开提供了能够感染非分裂细胞、分裂细胞或具有细胞增殖性病症的细胞的重组逆转录病毒。本公开的重组具有复制能力的逆转录病毒包含编码病毒GAG、病毒POL、病毒ENV、2A肽或2A肽样编码序列的多核苷酸序列和可操作地连接至异源基因并包封在病毒体内的SSP编码序列,所述多核苷酸序列紧邻病毒ENV序列的下游(例如下游1至50个核苷酸之间,例如1-10、10-15、15-20、20-25、25-30、30-35、35-40、40-45、45-50或其间的任何整数)。

短语“非分裂”细胞是指不进行有丝分裂的细胞。非分裂细胞可以在细胞周期的任何点(例如G0/G1、G1/S、G2/M)被阻断,只要细胞不是活跃分裂。对于离体感染,可以通过本领域技术人员使用的标准技术(包括辐射、蚜肠霉素处理、血清饥饿和接触抑制)处理分裂细胞,以阻断细胞分裂。然而,应当理解的是,由于许多细胞已经被阻滞(例如终末分化的细胞),所以通常在不阻断细胞的情况下进行离体感染。例如,重组慢病毒载体能够感染非分裂细胞。体内预先存在的非分裂细胞的实例包括神经元、肌肉、肝脏、皮肤、心脏、肺和骨髓细胞,以及它们的衍生物。对于分裂细胞,可以使用γ逆转录病毒载体,因为这种类型的逆转录病毒仅生产性地感染分裂细胞,并且这种性质有助于这种载体类别的肿瘤选择性。

“分裂”细胞是指经历主动有丝分裂或减数分裂的细胞。此类分裂细胞包括干细胞、皮肤细胞(例如成纤维细胞和角质形成细胞)、内皮细胞、配子和本领域已知的其它分裂细胞。术语分裂细胞特别关注并且包括的是具有细胞增殖性病症的细胞,例如赘生性细胞。术语“细胞增殖性病症”是指特征在于异常数量细胞分裂的善。所述状况可包括肥大(细胞的连续增殖导致组织内细胞群的过度生长)和营养不良(组织内细胞的缺乏或不足)细胞生长或细胞过度流入或迁移到身体的区域中。细胞群不一定是转化的、致瘤的或恶性的细胞,但也可以包括正常细胞。细胞增殖性病症包括与结缔组织过度生长相关的疾病,例如各种纤维变性状况,包括硬皮病、关节炎和肝硬化。细胞增殖性病症包括肿瘤病症,例如头颈癌。头颈癌可以包括例如口腔癌、食道癌、喉癌、甲状腺癌、舌癌、唇癌、唾液腺癌、鼻癌、鼻旁窦癌、鼻咽癌、上鼻腔癌和鼻窦肿瘤、感觉神经母细胞瘤、鳞状细胞癌、恶性黑色素瘤、鼻窦未分化癌(SNUC)、脑癌(包括成胶质细胞瘤,例如多形性成胶质细胞瘤)或血癌。还包括局部淋巴结癌,包括颈淋巴结、咽前淋巴结、肺近食管淋巴结和下颌下淋巴结(Harrison'sPrinciples of Internal Medicine(eds.,Isselbacher,et al.,McGraw-Hill,Inc.,13thEdition,ppl850-1853,1994)。其它癌症类型,包括但不限于肺癌、结肠直肠癌、乳腺癌、前列腺癌、尿道癌、子宫癌淋巴瘤、口腔癌、胰腺癌、白血病、黑素瘤、胃癌、皮肤癌和卵巢癌。细胞增殖性疾病还包括类风湿性关节炎(O’Dell NEJM 350:2591 2004)和其它自身免疫疾病(Mackay et al NEJM 345:340 2001),其特征通常在于免疫系统细胞的不适当增殖。

在一个实施方式中,通过与细胞外表面上具有分子的细胞结合,使逆转录病毒载体靶向细胞。靶向逆转录病毒的这种方法利用逆转录病毒表面上的靶向配体的表达,来协助将病毒靶向具有与逆转录病毒表面上的靶向配体相互作用的受体或结合分子的细胞或组织。在细胞被病毒感染后,病毒将其核酸递送到细胞中,并且在完成逆转录后,逆转录病毒遗传物质可整合到宿主细胞基因组中。

通过将目的异源多核苷酸与编码例如特定靶细胞上受体的配体的另一基因一起插入本公开的病毒载体中,载体现在是靶特异性的。病毒载体可以通过连接例如糖、糖脂或蛋白而被制成靶特异性的。本领域技术人员将知道或能够容易地确定,可以插入病毒基因组中的特定多核苷酸序列或可以附着于病毒包膜的蛋白质,从而允许含有目的核酸序列的病毒载体的靶特异性递送。

因此,在一个实施方式中,本公开包括嵌合ENV蛋白,其包含与靶向多肽可操作连接的逆转录病毒ENV蛋白。所述靶向多肽可以是细胞特异性受体分子、细胞特异性受体的配体、针对细胞特异性抗原表位的抗体或抗体片段、或本领域容易鉴定的能够与靶细胞结合或相互作用的任何其它配体。应当注意的是,形成嵌合ENV的抗体、抗体片段或结合结构域与2A或2A样肽编码序列下游的异源基因是分开的和不同的,具有或不具有可以包括抗体、抗体片段或结合结构域的编码序列的SSP。靶向多肽或分子的实例包括使用生物素-链霉亲和素作为接头的二价抗体(Etienne-Julan et al.,J.Of General Virol.,73,3251-3255(1992);Roux et al.,Proc.Natl.Acad.Sci USA 86,9079-9083(1989)),在包膜中含有编码针对半抗原的单链抗体可变区的序列的重组病毒(Russell et al.,Nucleic AcidsResearch,21,1081-1085(1993)),将肽激素配体克隆到逆转录病毒包膜中(Kasahara etal.,Science,266,1373-1376(1994)),嵌合EPO/env构建体(Kasahara et al.,1994),导致表达LDL受体的HeLa细胞被特异性感染的针对亲嗜性MLV包膜中低密度脂蛋白(LDL)的单链抗体(Somia et al.,Proc.Natl.Acad.Sci USA,92,7570-7574(1995)),类似地,可以通过整合整联蛋白配体来改变ALV的宿主范围,从而使病毒现在可以跨物种以特异性感染大鼠胶质母细胞瘤细胞(Valsesia-Wittmann et al.,J.Virol.68,4609-4619(1994)),并且Dornberg和合作者(Chu and Dornbur g,J.Virol 69,2659-2663(1995);M.Engelstadteret al.Gene Therapy 8,1202–1206(2001))已经报道了使用含有针对肿瘤标志物的单链抗体的包膜来组织特异性靶向脾脏坏死病毒(SNV)(一种禽类逆转录病毒)。

本公开提供了一种产生能够感染靶细胞的重组逆转录病毒的方法,包含用以下物质转染合适的宿主细胞:载体,该载体包含编码病毒gag、病毒pol和病毒env的多核苷酸序列、2A肽或2A肽样编码序列、可操作地连接在2A肽或2A肽样编码序列与异源多核苷酸之间的SSP编码序列,其中所述2A肽或2A肽样编码序列在所述env、包装和psi序列的下游,以及回收所述重组病毒。

本公开的逆转录病毒和方法提供了一种具有复制能力的逆转录病毒,其不需要辅助病毒或额外的核酸序列或蛋白即可增殖和产生病毒体。例如,本公开的逆转录病毒的核酸序列分别编码一组特异性抗原和逆转录酶(以及成熟和逆转录所必需的整合酶和蛋白酶-酶),如上所述。病毒gag和pol可以衍生自慢病毒,例如HIV,或致癌逆转录病毒或γ逆转录病毒,例如MoMLV。此外,本公开的逆转录病毒的核酸基因组包括编码病毒包膜(ENV)蛋白的序列。env基因可以来自任何逆转录病毒。env可以是允许转导人类和其它物种的细胞的双嗜性包膜蛋白,或者可以是仅能够转导小鼠和大鼠细胞的亲嗜性包膜蛋白。此外,可能需要通过将包膜蛋白与抗体或特定配体连接来靶向重组病毒,以靶向特定细胞类型的受体。如上所述,可以通过插入例如糖脂或蛋白使逆转录病毒载体具有靶特异性。靶向通常通过使用抗体将逆转录病毒载体靶向特定细胞类型(例如在某些组织中发现的细胞类型,或癌细胞类型)上的抗原来实现。本领域技术人员将知道或无需过多实验即可容易地确定,将逆转录病毒载体递送至特定靶的特定方法。在一个实施方式中,env基因源自非逆转录病毒(例如CMV或VSV)。逆转录病毒源性的env基因的实例包括但不限于:莫洛尼鼠白血病病毒(MoMuLV)、哈维鼠肉瘤病毒(HaMuSV)、鼠乳腺肿瘤病毒(MuMTV)、长臂猿白血病病毒(GaLV)、人类免疫缺陷病毒(HIV)和劳斯肉瘤病毒(RSV)。也可使用其它env基因,如水泡性口炎病毒(VSV)(蛋白G)、巨细胞病毒包膜(CMV)或流感病毒血凝素(HA)。

在一个实施方式中,逆转录病毒基因组来源于致癌逆转录病毒,且更特别地来源于哺乳动物致癌逆转录病毒。在另一个实施方式中,逆转录病毒基因组来源于γ逆转录病毒,且更特别地来源于哺乳动物γ逆转录病毒。“来源于”是指亲本多核苷酸序列是野生型致癌病毒,其已经通过插入或去除天然存在的序列而被修饰(例如插入2A肽或2A肽样编码序列、SSP编码序列和编码多肽的异源多核苷酸以及任选地分别与另一异源多核苷酸或目的抑制性核酸连接的一个或多个IRES或polIII启动子)。

在另一个实施方式中,本公开提供了使用调控序列靶向的逆转录病毒载体。细胞或组织特异性调控序列(例如启动子)可用于靶向特定细胞群中的基因序列的表达。本公开合适的哺乳动物和病毒启动子在本文别处描述。因此,在一个实施方式中,本公开提供了在逆转录病毒基因组的5'末端具有组织特异性启动子元件的逆转录病毒。通常,组织特异性调控元件/序列位于逆转录病毒基因组的LTR的U3区,包括例如针对肿瘤细胞的细胞-或组织-特异性启动子和增强子(例如肿瘤细胞特异性增强子和启动子)和诱导型启动子(例如四环素)。

本公开的转录控制序列还可以包括与编码超抗原、细胞因子或趋化因子的基因天然相关的天然存在的转录控制序列。

在一些情况下,可能需要调节表达。例如,根据所需的表达水平,可以使用具有不同活性强度的不同病毒启动子。在哺乳动物细胞中,CMV立即早期启动子经常被用来提供强转录激活。当需要降低转基因表达水平时,也已使用效力较低的CMV启动子的修饰版本。当需要在造血细胞中表达转基因时,可以使用逆转录病毒启动子,如来自MLV或MMTV的LTR。可使用的其它病毒启动子包括SV40、RSV LTR、HIV-1和HIV-2LTR、腺病毒启动子(如来自E1A、E2A或MLP区、AAV LTR、花椰菜花叶病毒、HSV-TK和禽类肉瘤病毒的启动子)。

类似地,组织特异性或选择性启动子可用于在特定组织或细胞中实现转录,以便降低对非靶向组织的潜在毒性或不期望的作用。例如,启动子如PSA、probasin、前列腺酸磷酸酶或前列腺特异性腺激肽释放酶(hK2)可用于靶向前列腺中的基因表达。乳清辅助蛋白(WAP)可以用于乳腺组织表达(Andres et al.,PNAS 84:1299-1303,1987)。可以使用的其它启动子/调控结构域如下所述。

“组织特异性调控元件”是能够在一种组织中驱动基因转录而在其它组织类型中大部分保持“沉默”的调控元件(例如启动子)。然而,应当理解的是,组织特异性启动子在预期沉默的那些组织中可具有可检测量的“背景”或“碱基”活性。启动子在靶组织中被选择性激活的程度可以表示为选择性比率(靶组织中的活性/对照组织中的活性)。在这一方面,用于本公开实践中的组织特异性启动子通常具有大于约5的选择性比率。优选地,所述选择性比率大于约15。

在某些适应症中,可能需要在施用本公开的重组具有复制能力的逆转录病毒(RRV)后的特定时间激活转录。这可以用可被激素或细胞因子调控的启动子来完成。例如,在适应症是性腺组织的治疗应用中,其中产生或发送特定的类固醇,使用雄激素或雌激素调控的启动子可能是有利的。激素可调节的启动子包括MMTV、MT-1、蜕皮激素和RuBisco。可以使用其它激素调控的启动子,例如对甲状腺、垂体和肾上腺激素有响应的那些。可以使用的细胞因子和炎性蛋白应答启动子包括K和T激肽原(Kageyama et al.,1987)、C-f os、TNF-α、C-反应蛋白(Arcone et al.,1988)、触珠蛋白(Oliviero et al.,1987)、血清淀粉样蛋白A2、C/EBPα、IL-1、IL-6(Poli和Cortese,1989)、补体C3(Wilson et al.,1990)、IL-8、α-1酸性糖蛋白(Prowse和Baumann,1988)、α-1抗胰蛋白酶、脂蛋白脂肪酶(Zechner etal.,1988)、血管紧张素原(Ron et al.,1990)、纤维蛋白原、c-jun(可被佛波醇酯、TNF-α、UV辐射、视黄酸和过氧化氢诱导)、胶原酶(可被佛波醇酯和视黄酸诱导)、金属硫蛋白(可被重金属和糖皮质激素诱导)、基质溶素(可被佛波醇酯、白介素-1和EGF诱导)、α-2巨球蛋白和α-1抗胰凝乳蛋白酶。肿瘤特异性启动子如骨钙蛋白、低氧应答元件(HRE)、MAGE-4、CEA、甲胎蛋白、GRP78/BiP和酪氨酸酶也可用于调控肿瘤细胞中的基因表达。

此外,启动子的这一列表不应被解释为是穷举的或限制性的,本领域技术人员将知道可与本文公开的启动子和方法结合使用的其它启动子。

表8.组织特异性启动子

还应理解的是,某些启动子虽然活性不限于单一组织类型,但仍可能表现出选择性,因为它们在一组组织中可能是活性的,而在另一组中活性较低或沉默。此类启动子也称为“组织特异性的”,并且预期用于本公开。例如,在各种中枢神经系统(CNS)神经元中有活性的启动子在治疗上可用于保护免受由于中风引起的损伤,所述损伤可影响脑的许多不同区域中的任一个。因此,本公开中使用的组织特异性调控元件适用于调控异源蛋白,以及适用于作为本逆转录病毒载体中的靶向多核苷酸序列。

在又另一个实施方式中,本公开提供了包含重组逆转录病毒衍生的构建体的质粒。质粒可直接导入靶细胞或细胞培养物如HT1080、NIH 3T3或其它组织培养细胞。所得细胞将逆转录病毒载体释放到培养基中。

本公开提供了一种多核苷酸构建体,其从5'至3'包含:用于启动转录的启动子或调控区;psi封装信号;gag编码核酸序列,pol编码核酸序列;env编码核酸序列;2A肽或2A肽样编码序列;SSP编码序列;编码标志物、治疗性或诊断性多肽的异源多核苷酸;任选的IRES或polIII盒;和LTR核酸序列。如上所述,gag、pol和env核酸结构域可以被修饰以除去色氨酸密码子,所述色氨酸密码子被ApoBec3转化为终止密码子。在某些其它实施方式中,所述载体还可包含在所述异源多核苷酸下游和所述3'LTR上游的polIII盒或IRES盒。如本文别处和如下所述,部分地根据所需宿主细胞、表达时机或量以及异源多核苷酸,对本公开的多核苷酸构建体(例如重组具有复制能力的逆转录病毒多核苷酸)的各种区段进行工程化改造。本公开的具有复制能力的逆转录病毒构建体可被分成许多可由本领域技术人员单独修饰的结构域。

SEQ ID NO:2中提供了用于产生本公开的重组逆转录病毒的示例性DN A序列,所述启动子可包含具有如SEQ ID NO:2中从核苷酸1至约核苷酸582所示的序列的CMV启动子,且可包括对一个或多个(例如2-5、5-10、10-20、20-30、30-50、50-100或更多个)核酸碱基的修饰,只要经修饰的启动子能够引导并启动转录即可。在一个实施方式中,启动子或调控区包含CMV-R-U5结构域多核苷酸。CMV-R-U5结构域包含与MLV R-U5区连接的来自人类巨细胞病毒的立即早期启动子。在一实施方式中,CMV-R-U5结构域多核苷酸包含SEQ ID NO:2中所示从约核苷酸1至约核苷酸1202的序列或与SEQ ID NO:2中所示序列具有至少95%同一性的序列,其中所述多核苷酸促进与其可操作地连接的核酸分子的转录。所述多核苷酸的gag结构域可来源于任何数目的逆转录病毒,但一般来源于致癌逆转录病毒,且更特别地来源于哺乳动物致癌逆转录病毒如MLV。在一个实施方式中,所述gag结构域包含SEQ ID NO:2的从约核苷酸编号1203到约核苷酸2819的序列,或者与其具有至少95%、98%、99%或99.8%(四舍五入到最近的十分之一)同一性的序列。所述多核苷酸的pol结构域可源自任何数目的逆转录病毒,但通常源自γ逆转录病毒,且更特别地源自哺乳动物γ逆转录病毒如MLV。在一个实施方式中,所述pol结构域包含SEQ ID NO:2的从约核苷酸编号2820至约核苷酸6358的序列或与其具有至少95%、98%、99%或99.9%(四舍五入至最接近的十分之一)同一性的序列。所述多核苷酸的env结构域可源自任何数目的逆转录病毒,但通常源自γ-逆转录病毒,且更特别地源自哺乳动物γ-逆转录病毒如MLV。在一些实施方式中,env编码结构域包含双嗜性env结构域。在一个实施方式中,env结构域包含SEQ ID NO:2的从约核苷酸编号6359至约核苷酸8323的序列或与其具有至少95%、98%、99%或99.8%(四舍五入至最接近的十分之一)同一性的序列。2A肽或2A肽样/SSP盒被插入到env结构域之后(例如在约核苷酸8324处)并继续至异源多核苷酸的末端。表B和C中提供了合适SSP肽的实例,异源结构域之后可以是富含聚嘌呤的结构域,或者可以是IRES盒或polIII盒。3'LTR可源自任何数目的逆转录病毒,通常是γ逆转录病毒,并且更通常是哺乳动物γ逆转录病毒,如MLV。在一个实施方式中,3'LTR包含U3-R-U5结构域。在又另一个实施方式中,LTR包含如SEQ ID NO:2中所示的从约核苷酸9111至约11654的序列或与其具有至少95%、98%或99.5%(四舍五入至最近的十分之一)同一性的序列。

表B:通过HMM核对天然真核生物信号肽进行排名。

表C:通过HMM得分对人工信号肽进行排名

逆转录病毒载体可用于治疗多种疾病和病症,包括多种细胞增殖性疾病和病症(参见,例如,美国专利号No.4,405,712和4,650,764;Friedmann,1989,Science,244:1275-1281;Mulligan,1993,Science,260:926-932,R.Crys tal,1995,Science 270:404-410,它们各自的内容通过引用以其整体并入本文,还参见:The Development of Human GeneTherapy,Theodore Friedmann,Ed.,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,1999.ISBN 0-87969-528-5;Concepts in Genetic Medicine,ed.Boro Dropulic and Barrie Carter,Wiley,2008,Hoboken,NJ.;Gene&Cell Therapy-Therapeutic Mechanism and Strategies,3rd edition ed.Nancy Smyth Templeton,CRCPress,Boca Raton FL 2008;Xavier et al.,Annu.Rev.Med.70:273-88,2019,它们各自的内容通过引用以其整体并入本文)。

本公开还提供了用于治疗细胞增殖性病症的基因疗法。通过将合适的治疗性多核苷酸(例如编码抗原结合蛋白/多肽、细胞因子、配体、反义物、核酶、前药活化酶、siRNA)引入患有增殖性病症的受试者的细胞中,或引入同种异体间充质干细胞(MSC)、神经干细胞(NSC)或已知能够靶向炎症或肿瘤位点的其它细胞类型中,此类治疗可实现其治疗效果。多核苷酸构建体的递送可以使用本公开的重组逆转录病毒载体来实现,特别是如果其基于MLV或其他γ逆转录病毒,能够感染分裂细胞。

此外,本文所述的治疗方法(例如基因疗法或基因递送方法)可以在体内或离体进行。优选在基因治疗前,例如手术或通过放射切除大部分肿瘤。在一些方面,逆转录病毒疗法可以在手术、化学疗法或放射疗法之前或之后。

因此,本公开提供一种能够感染非分裂细胞、分裂细胞或肿瘤细胞的重组逆转录病毒,其中该重组逆转录病毒包含病毒GAG;病毒POL;病毒ENV;与2A肽或肽样编码序列可操作连接的异源核酸;和包装、逆转录和整合所需的顺式作用核酸序列。重组逆转录病毒可以是慢病毒,如HIV,或者可以是γ逆转录病毒。

本公开还提供了一种将核酸转移到靶细胞以提供特定核酸(例如异源序列)的表达的方法。因此,在另一个实施方式中,本公开提供了一种在靶细胞中导入和表达异源核酸的方法,包含用本公开的重组病毒感染靶细胞并在靶细胞中表达异源核酸,其中所述异源核酸被工程化到所述重组病毒载体中在env结构域的下游并可操作地连接到2A或2A样肽-SSP构建体。如上所述,所述靶细胞可以是任何细胞类型,包括分裂、非分裂、肿瘤性的、永生化的、修饰的和本领域技术人员所知的其它细胞类型,只要它们能够被逆转录病毒感染即可。

可能需要将编码生物响应调节剂(例如细胞因子)的核酸转移到细胞或受试者中。包括在这个类别中的是免疫增强剂,包括编码分类为“白介素”的许多细胞因子的核酸。这些包括例如白介素1至38,以及本文其它地方所述的其它响应调节剂和因子。干扰素且特别是γ干扰素、肿瘤坏死因子(TNF)和粒细胞-巨噬细胞-集落刺激因子(GM-CSF)也包括在这一类别中,尽管不一定按照相同的机制起作用。其它多肽包括例如血管生成因子和抗血管生成因子。可能需要将此类核酸递送至骨髓细胞或巨噬细胞,以治疗酶缺乏或免疫缺陷。编码生长因子、毒肽、配体、受体或其它生理学上重要的蛋白质的核酸也可被引入特定的靶细胞中。将任何前述生物响应调节剂工程化到本公开的RRV下游,并与2A或2A样肽-SSP构建体可操作地连接。

本公开可用于递送促进药物特异性靶向和效果的异源多核苷酸。例如,EGF受体家族成员HER2是药物曲妥珠单抗(HerceptinTM,Genentech)结合的靶标。曲妥珠单抗是抗体依赖性细胞毒性(ADCC)的介体。活性优先靶向通过免疫组织化学的具有2+和3+过表达水平的HER2表达细胞,而不是1+和非表达细胞(Herceptin处方信息,Crommelin 2002)。通过在HER2低肿瘤中引入表达HER2或截短的HER2(仅表达胞外和跨膜结构域)的载体来增强HER2的表达,可促进ADCC的最佳触发,并克服临床使用中观察到的对Herceptin的快速发展的抗性。在这些情况下,所述异源基因可编码HER2。

在另一个实例中,CD20是结合药物利妥昔单抗(RituxanTM,Genentech)的靶标。利妥昔单抗是补体依赖性细胞毒性(CDC)和ADCC的介体。通过流式细胞术测定具有更高平均荧光强度的细胞显示对利妥昔单抗的增强敏感性(van Meerten et al.,Clin Cancer Res2006;12(13):4027-4035,2006)。通过在CD20低B细胞中引入表达CD20的载体来增强CD20的表达,可促进ADCC的最佳触发。在这种情况下,异源基因编码CD20。

本公开提供了治疗细胞增殖性病症如癌症和肿瘤的方法,包括施用本公开的RRV载体,然后用化疗剂或抗癌剂治疗。在一个实施方式中,在施用化疗剂或抗癌剂之前,将RRV载体施用于患者一段时间,以使RRV感染并复制。然后用化疗剂或抗癌剂治疗受试者一段时间和剂量,以减少癌细胞增殖或杀死癌细胞。在一个实施方式中,如果用化疗剂或抗癌剂进行的治疗减少了但不杀死癌症/肿瘤(例如部分缓解或暂时缓解),那么可以用无毒治疗剂(例如5-FC)治疗受试者,所述无毒治疗剂在表达来自RRV的细胞毒性基因(例如胞嘧啶脱氨酶)的细胞中被转化为毒性治疗剂。

使用此类方法,本公开的RRV载体在肿瘤细胞复制过程中扩散,然后通过用抗癌或化疗剂治疗可杀死这些细胞,并使用本文所述的RRV治疗方法可进行进一步杀伤。

在本公开的又另一个实施方式中,异源基因可包含靶抗原(例如癌抗原)的编码序列。在该实施方式中,用包含编码靶抗原的异源多核苷酸的RRV感染包含细胞增殖性病症的细胞,以提供靶抗原的表达(例如癌抗原的过表达)。然后将包含与靶抗原特异性相互作用的靶向同源部分的抗癌剂施用于受试者。靶向同源部分可以可操作地连接至细胞毒性剂,或者其自身可以是抗癌剂。因此,被包含靶向抗原编码序列的RRV感染的癌细胞增加了癌细胞上靶的表达,导致细胞毒性靶向的效率/功效增加。

在又另一个实施方式中,本公开的RRV包含含有结合结构域(例如抗体、抗体片段、抗体结构域、非抗体结合结构域或受体配体)的编码序列,所述结合结构域与同源抗原或配体特异性相互作用。然后,可以将包含结合结构域的编码序列的RRV用于感染包含细胞增殖性病症的受试者中的细胞,例如癌细胞或赘生性细胞。然后,被感染的细胞可表达结合结构域或抗体。然后,可以将与细胞毒性剂可操作地连接或本身具有细胞毒性的抗原或同源物施用于受试者。然后,细胞毒性同源物将选择性地杀伤表达所述结合结构域的感染细胞。或者,所述结合结构域本身可以是例如与免疫系统相互作用的抗癌剂,例如抗-PD-L1或抗-CTLA-4。

本公开提供了一种治疗患有细胞增殖性病症的受试者的方法。所述受试者可以是任何哺乳动物,包括人类。使所述受试者与本公开的重组具有复制能力的逆转录病毒载体接触。所述接触可以是体内或离体的。施用本公开的逆转录病毒载体的方法是本领域已知的,并且包括例如全身施用、局部施用、腹膜内施用、肌内施用、颅内、脑脊髓施用以及直接在肿瘤或细胞增殖性病症的部位施用。也可使用本领域已知的其它给药途径。

因此,本公开包括用于治疗细胞增殖性病症的各种药物组合物。通过使用载体、赋形剂和添加剂或辅助剂,将根据本公开含有用于治疗或调节细胞增殖性病症的异源多核苷酸序列的逆转录病毒载体变成适于向受试者施用的形式,来制备根据本公开的药物组合物。常用的载体或辅助剂包括碳酸镁、二氧化钛、乳糖、甘露醇和其它糖、滑石、乳蛋白、明胶、淀粉、维生素、纤维素及其衍生物、动物油和植物油、聚乙二醇和溶剂(如无菌水、醇、甘油和多元醇)。静脉内载体包括流体和营养补充剂。防腐剂包括抗微生物剂、抗氧化剂、螯合剂和惰性气体。其它药学上可接受的载体包括水溶液、无毒赋形剂,包括盐、防腐剂、缓冲剂等,例如Remington's Pharmaceutical Sciences,15th ed.Easton:Mack PublishingCo.,1405-1412,1461-1487(1975)和The National Formulary XIV.,14thed.Washington:American Pharmaceutical Association(1975)中所述,其内容在此通过引用并入。药物组合物的pH和各种组分的确切浓度根据本领域的常规技术进行调节。参见Goodman and Gilman's The Pharmacological Basis for Therapeutics(第7版)。

在其它实施方式中,提供了用本公开具有复制能力的逆转录病毒载体转染的宿主细胞。宿主细胞包括真核细胞,例如酵母细胞、昆虫细胞或动物细胞。宿主细胞也包括原核细胞,例如细菌细胞。

还提供了用本文提供的载体(例如具有复制能力的逆转录病毒载体)转导(转化或转染)的工程化宿主细胞。可以在常规营养培养基中培养工程化的宿主细胞,所述培养基被修改以适于激活启动子、选择转化体或扩增编码多核苷酸。培养条件,如温度、pH等,是先前用于选择表达的宿主细胞的那些,并且对于本领域技术人员而言和在本文引用的参考文献(Sambrook,Ausubel and Berger,以及例如Freshney(1994)Culture of Animal Cells:AManual of Basic Technique,3rd ed.(Wiley-Liss,New York)及其中引用的参考文献)中是显而易见的。

合适的表达宿主的实例包括:细菌细胞,如大肠杆菌、枯草芽孢杆菌、链霉菌和鼠伤寒沙门氏菌;真菌细胞,如酿酒酵母、巴斯德毕赤酵母和粗糙脉孢菌;昆虫细胞,例如果蝇和草地夜蛾;哺乳动物细胞,例如CHO、COS、BHK、HEK 293或Bowes黑素瘤细胞;或植物细胞或外植体等。通常使用人类细胞或细胞系;然而,可能期望将本公开的载体和多核苷酸克隆到非人类宿主细胞中,以用于测序、扩增和克隆的目的。

以下实施例旨在说明而非限制本公开。虽然这些例子是可以使用的典型例子,但是可以替代地使用本领域技术人员已知的其它程序。

实施例

实施例1:RRV-2A-GFPm、RRV-GSG-2A、RRV-2A-yCD2和RRV-GSG-2A-yCD2的设计。

RRV-yCD2和RRV-GFP是基于莫洛尼MLV的RRV,其具有双嗜性包膜基因和env基因下游的脑心肌炎病毒内部核糖体进入位点(IRES)-转基因盒(Perez et al,2012)。RRV-2A-GFP(aka pAC3-2A-GFP)和RRV-2A-yCD2(pAC3-2A-yCD2)载体基于RRV-GFP和RRV-yCD2,但IRES区已被与双嗜性包膜蛋白和转基因(GFP或yCD2)同框的多种不同的2A肽所替换。先前已经描述过RRV-2A-GFP和RRV-yCD2载体的克隆方案(Hofacre et al Hum.Gene Ther.29:437-4512018)。简单地,首先使用含有2个DNA片段以及用BstB I和Not I位点消化的pAC3-emd骨架的Gibson装配克隆试剂盒(NEB)产生pAC3-T2A-GFP构建体。首先,合成以5'-至-3'顺序含有双嗜性evn的3'端的序列、来自明脉扁刺蛾β四体病毒的2A肽(T2A)和GFP的5'的一对有义和反义寡核苷酸(IDT)并杂交,以产生DNA片段2A-G。Gibson装配中的第二个DNA片段是FP片段。通过PCR使用下列引物产生FP片段:GFP-F-Gib(5’-GAAGTTCGAGGGCGACAC-3’(SEQID NO:303))和GFP-R-Gib(5’-TAAAATCTTTTATTTTATCTGCGGCCGCAC-3’(SEQ ID NO:304))。

在2A-G片段中,5'含有与pAC3骨架的双嗜性env中BstBI位点重叠的序列;3'含有与FP DNA片段的5'重叠的序列。此外,AscI限制酶位点置于T2A的3'-末端,正在第二个转基因GFP的起始密码子的上游。包含AscI位点是为了随后用其它2A肽替换T2A肽。将AscI限制位点与额外的核苷酸T包括在一起,随后是AscI位点,导致在T2A肽中最后一个脯氨酸残基上额外增加了3个氨基酸(甘氨酸-丙氨酸-脯氨酸)C-末端。在共翻译过程中,由T2A肽介导的GFP蛋白与包膜蛋白的分离导致在GFP的N-末端增加额外的4个氨基酸P、G、A和P。在FP片段中,FP片段的5'-端含有与2A-G片段的3'-端重叠24个核苷酸的序列,并且FP片段的3'-端与跨越Not I位点的pAC3-GFP骨架的5'-端重叠26个核苷酸。将由Gibson装配克隆所得的质粒DNA命名为pAC3-T2A-GFP。

随后合成了另外的RRV-2A-GFP载体,其以两种不同的构型含有三种其它常用的2A肽(IDT),所述2A肽源自猪特斯科病毒-1(P2A)、口蹄疫病毒(F2A)和马鼻炎A病毒(E2A)。每个DNA片段含有双嗜性env基因3'的序列以及在BstBI和AscI位点上替代pAC3-T2A-GFP骨架的T2A的指定2A肽。将得到的质粒DNA命名为pAC3-P2A-GFP、pAC3-F2A-GFP、pAC3-E2A-GFP、pAC3-GSG-T2A-GFP、pAC3-GSG-P2A-GFP、pAC3-GSG-F2A-GFP和pAC3-GSG-E2A-GFP。

随后确定所描述的RRV-2A-GFP质粒DNA(pAC3-E2A-GFP、pAC3-F2A-GFP、pAC3-P2A-GFP、pAC3-T2A-GFP、pAC3-GSG-E2A-GFP、pAC3-GSG-F2A-GFP、pAC3-GSG-P2A-GFP和pAC3-GSG-T2A-GFP)在GFP的3'-端都含有终止密码子突变。当产生所述FP PCR片段时,突变被引入GFP-R-Gib引物(5’-TAAAATCTTTTATTTTATCTGCGGCCGCAC-3’(SEQ ID NO:4))。来自PCR的GFP中的终止密码子突变导致在到达终止密码子之前,通读了GFP ORF的额外11个氨基酸(C-A-A-A-D-K-I-K-D-F-I(SEQ ID NO:5))。将质粒DNA重新命名为pAC3-E2A-GFPm、pAC3-F2A-GFPm、pAC3-P2A-GFPm、pAC3-T2A-GFPm、pAC3-GSG-E2A-GFPm、pAC3-GSG-F2A-GFPm、pAC3-GSG-P2A-GFPm和pAC3-GSG-T2A-GFPm。以下,两种命名法pAC3-E2A-GFP/pAC3-E2A-GFPm、pAC3-F2A-GFP/pAC3-F2A-GFPm、pAC3-P2A-GFP/pAC3-P2A-GFPm、pAC3-T2A-GFP/pAC3-T2A-GFPm、pAC3-GSG-E2A-GFP/pAC3-GSG-E2A-GFPm、pAC3-GSG-F2A-GFP/pAC3-GSG-F2A-GFPm、pAC3-GSG-P2A-GFP/pAC3-GSG-P2A-GFPm和pAC3-GSG-T2A-GFP/pAC3-GSG-T2A-GFPm可以互换使用。

通过在pAC3-P2A-GFPm、pAC3-GSG-P2A-GFPm、pAC3-T2A-GFPm和pAC3-GSG-T2A-GFPm质粒DNA的各2A肽版本中,用yCD2 ORF替换GFPm开放阅读框,产生等价的一组4个RRV-2A-yCD2载体。使用以下引物从pAC3-yCD2质粒DNA产生AscI-yCD2-NotI PCR片段:AscI-yCD2-F(5’-GATCGGCGCGCCTATGGTGACCGGCGGCATGGC-3’(SEQ ID NO:6)和3-37(5’-CCCCTTTTTCTGGAGACTAAATAA-3’(SEQ ID NO:7)。用AscI和NotI限制酶消化PCR产物和所述四个pAC3-2A-GFPm质粒DNA的每一个,并将AscI-yCD2-NotI消化的PCR产物亚克隆代替GFPm,以产生pAC3-P2A-yCD2、pAC3-GSG-P2A-yCD2、pAC3-T2A-yCD2和pAC3-GSG-T2A-yCD2(表D)。

表D:序列、2A肽的来源、和RRV质粒-2A肽-转基因名称。

实施例2:从293T细胞产生的RRV-2A-GFPm和RRV-GSG-2A-GFPm载体具有感染性并表达GFP蛋白。

在转染前18至20小时,以每10cm板2e6个细胞接种HEK293T细胞。第二天,使用磷酸钙方法,在细胞接种后20小时,将pAC3-2A-GFPm和pAC3-GSG-2A-GFPm质粒用于瞬时转染20μg质粒DNA。转染十八小时后,用DMEM完全培养基洗涤细胞三次,并与新鲜的完全培养基一起温育。在转染后约42小时,收集病毒上清液,并通过0.45μm注射过滤器过滤。如前所述(Perez et al.,2012),测定来自HEK293T细胞瞬时转染的RRV-2A-GFPm、RRV-GSG-2A-GFPm和RRV-IRES-GFP的病毒滴度。简言之,通过载体的单循环感染在PC3细胞上测定载体制剂滴度。感染后24小时,通过叠氮胸苷处理保证单循环感染,随后是在感染48小时之后,对病毒载体DNA具有特异性的靶细胞基因组DNA进行定量PCR(qPCR)(MLV LTR引物集;5-MLV-U3-R(5’-AGCCCACAACCCCTCACTC-3’(SEQ ID NO:20)),3-MLV-Psi(5’-TCTCCCGATCCCGGACGA-3’(SEQ ID NO:21))和探针(5’-FAM-CCCCAAATGAAAGACCCCCGCTGACG-BHQ1-3’(SEQ ID NO:22)),以定量每细胞基因组的病毒DNA拷贝数。通过计算阈循环(CT)值确定以每毫升转导单位(TU)的病毒滴度(TU/mL),该阈循环(CT)值由质粒DNA的2×107拷贝至2×101拷贝的标准曲线和已知量的基因组DNA输入、细胞数和每反应混合物的病毒原液稀释度导出。表E显示,由HEK293T细胞产生的RRV-2A-GFPm和RRV-GSG-2A-GFPm的滴度与RRV-IRES-GFP的相当。

表E:由293T细胞产生的RRV-2A-GFPm和RRV-GSG-2A-GFPm载体的滴度

TU/mL Stdv
pAC3-E2A-GFP 1.15E+06 2.55E+05
pAC3-F2A-GFP 1.63E+06 2.58E+05
pAC3-P2A-GFP 1.81E+06 3.11E+05
pAC3-T2A-GFP 3.31E+06 1.32E+05
pAC3-GSG-E2A-GFP 1.65E+06 2.76E+05
pAC3-GSG-F2A-GFP 1.32E+06 7.57E+04
pAC3-GSG-P2A-GFP 1.31E+06 1.22E+05
pAC3-GSG-T2A-GFP 2.66E+06 2.14E+05
pAC3emd 1.65E+06 2.12E+05

然后用由HEK293T细胞产生的RRV-2A-GFPm病毒以0.01的感染复数(MOI)感染U87-MG。将U87-MG细胞以1×105个细胞接种在6-孔板中用于初始感染。将细胞传代到6-孔板的新孔中,每次传代的稀释度为1-4,并且收集每个样品的剩余细胞,通过使用BD FACS CantoII(BD Biosciences)测量表达GFPm的细胞的百分比和GFPm平均荧光强度来评估病毒传播。绘制在每一代的GFP-阳性细胞的百分比。进行测定的长度直到所有RRV-2A-GFP病毒达到最大感染性(~95%或更多的GFP-阳性细胞)。在感染的U87-MG细胞中,除了RRV-P2A-GFPm、RRV-T2A-GFPm和RRV-GSG-F2A-GFPm表现出滞后之外,RRV-2A-GFPm和RRV-GSG-2A-GFPm中病毒传播的速率与RRV-IRES-GFP类似。尽管如此,它们在18天内达到最大感染性。在RRV-2A-GFPm和RRV-GSG-2A-GFPm载体中,GFPm表达水平也不同,但是都是RRV-IRES-GFP感染的U87-MG细胞表达的约20至50%。

实施例3:RRV-2A-GFPm和RRV-GSG-2A-GFPm载体在U87-MG细胞中是稳定的。

为了确保RRV-2A-GFPm和RRV-GSG-2A-GFPm感染的U87-MG细胞中降低的GFP表达不是由于病毒基因组中GFP基因的缺失引起的,使用跨越前病毒DNA的3'env和3'UTR区域的引物集,通过终点PCR评估2A-GFPm区域的完整性。在U87-MG细胞的最大感染性下,随后在T75烧瓶中培养细胞达到汇合,此时用新鲜培养基替换培养基,然后收集含病毒的上清液并在培养基更换后18-24小时进行0.45μM过滤。将收集的细胞上清液等分并储存在-80℃下,直到被用于免疫印迹和再感染实验。同时,将细胞分成两个部分;1/10用于分离基因组DNA,且9/10用于分离总细胞裂解物。通过重悬于400μL 1X PBS中并使用Promega Maxwell 16细胞DNA纯化试剂盒(Promega)分离,从细胞团块中提取基因组DNA。然后将一百纳克基因组DNA用作模板,用下列引物集进行PCR:IRES-F(5’-CTGATCTTACTCTTTGGACCTTG-3’(SEQ ID NO:23))和IRES-R(5’-CCCCTTTTTCTGGAGACTAAATAA-3’(SEQ ID NO:24))。在1%琼脂糖凝胶上分析得到的PCR产物。数据显示,在病毒复制的时间过程中,RRV-2A-GFPm和RRV-GSG-2A-GFPm载体的前病毒DNA中的2A-GFPm和GSG-2A-GFPm区域在U87-MG细胞中是稳定的。

实施例4:由最大感染的U87-MG细胞产生的RRV-2A-GFPm和RRV-GSG-2A-GFPm在后续感染循环中保持感染性。

由于长期感染性是维持通过RRV递送的治疗效果的许多重要标准之一,因此通过在初始U87-MG细胞中进行额外的感染循环来评估由最大限度感染的U87-MG细胞产生的RRV-2A-GFPm和RRV-GSG-2A-GFPm的感染性。首先,如所描述的,滴定从最大感染的U87-MG细胞收集的病毒上清液,然后以0.01的MOI再感染回初始U87-MG细胞。由最大感染的U87-MG细胞产生的滴度与从瞬时转染的HEK293T细胞获得的滴度相似,在RRV-2A-GFPm、RRV-GSG-2A-GFPm载体以及RRV-IRES-GFP载体之间是相当的。

如所描述的,在每个细胞传代中监测RRV-2A-GFPm和RRV-GSG-2A-GFPm的病毒传播。与使用由瞬时转染的HEK293T细胞产生的病毒上清液在第一感染循环中观察到的病毒传播速率相反,所有载体以与RRV-IRES-GFP相当的速率传播。然而,如先前所观察到的,在该感染循环中,来自RRV-2A-GFPm和RRV-GSG-2A-GFPm感染的U87-MG细胞的GFP表达水平保持为由RRV-IRES-GFP细胞表达的水平的20至50%。

实施例5:RRV-2A-GFPm和RRV-GSG-2A-GFPm载体的病毒包膜和GFPm蛋白在感染的U87-MG细胞中以不同的效率加工。

为了评估GFPm表达、GFPm与病毒包膜蛋白的分离效率以及病毒包膜蛋白的适当加工,从感染的U87-MG细胞产生细胞裂解物。在U87-MG细胞处于最大感染性时,在1×PBS中将汇合细胞单层洗涤一次,用TrpZean(Sigma)解离,重悬于完全DMEM中,再次在1×PBS中洗涤,随后在冰上在200μL RIPA裂解缓冲液(Thermo Scientific)中将细胞裂解30分钟。通过在4℃下以14,000rpm离心15分钟来澄清裂解物中的细胞碎片,收集上清液并转移到新的试管中。然后使用BCA沉淀测定法(Thermo Scientific)测定细胞裂解物中的蛋白质浓度,并将20μg蛋白质进行SDS-PAGE。将蛋白质在200伏特下在4-12%XT-Tris SDS-PAGE凝胶(BioRad)上解析45分钟。随后,使用iBlot干燥印迹系统在20伏特下将蛋白质转移至PVDF膜(Life Technologies)上7分钟。使用抗-gp70(大鼠抗-gp70,克隆83A25;1:500稀释度)和抗-GFP(兔抗-GFP;1:1000稀释度),测定膜的包膜蛋白的gp70亚基和GFPm的表达。使用缀合至辣根过氧化物酶的相应第二抗体检测蛋白质表达。结果显示,使用抗-GFP抗体,如~120KDa高分子量的env-2A-GFPm融合蛋白所示,来自RRV-F2A-GFPm、RRV-P2A-GFPm以及RRV-T2A-GFPm、RRV-GSG-F2A-GFPm和RRV-GSG-F2A-GFPm的GFPm蛋白与病毒包膜蛋白的分离效率低下。相反,与RRV-IRES-GFP相比,对于RRV-E2A-GFPm、RRV-GSG-P2A-GFPm和RRV-GSG-T2A-GFPm载体,GFPm与病毒包膜蛋白的分离相对有效。与此同时,用抗-gp70抗体检查了感染的U87-MG中病毒包膜蛋白的加工。结果显示在所有RRV-2A-GFPm和RRV-GSG-2A-GFPm载体中均检测到了以前体(Pr85)或加工形式(gp70)包膜的病毒,表明了如在抗-GFP免疫印迹中所看到的病毒包膜蛋白与GFPm的分离。此外,在抗-gp70印迹中观察到的分离效率与在抗-GFP免疫印迹中观察到的分离效率有点一致。尽管融合多蛋白Env-GFPm的蛋白表达在RRV-2A-GFPm和RRV-GSG-2A-GFPm载体之间不同,但RRV-GSG-P2A-GFPm和RRV-T2A-GFPm似乎具有最有效的分离,如在抗-GFP和抗-gp70免疫印迹中均未检测到病毒包膜-GFPm融合多蛋白所表明的。

实施例6:正确加工的病毒包膜蛋白的掺入水平与病毒包膜和GFPm蛋白之间的分离效率相关。

在4℃下通过20%蔗糖梯度以14000rpm将RRV-2A-GFPm和RRV-GSG-2A-GFPm最大感染的U87-MG细胞的病毒上清液团粒化30分钟,随后重悬于20μL含有5%2-巯基乙醇的1XLaemmli缓冲液中,并且在4-20%Tris甘氨酸凝胶(BioRad)上进行SDS PAGE。如所述进行电泳和蛋白质转移。用抗-gp70(大鼠产生的抗-gp70,克隆83A25;1:500稀释度)和抗-p15E(小鼠产生的抗-TM,克隆372;1:250稀释度)检测正确加工的病毒体-相关病毒包膜蛋白表达。使用缀合至辣根过氧化物酶的相应第二抗体检测蛋白质表达。数据表明,除了RRV-P2A-GFPm和RRV-T2A-GFPm载体之外,在病毒体中以与RRV-IRES-GFP相当的水平检测到RRV-2A-GFPm和RRV-GSG-2A-GFPm载体的正确加工的包膜蛋白gp70和P12E/P15E。如所预期的,显示最低水平的病毒体-相关包膜蛋白的RRV-GSG-P2A-GFPm和RRV-T2A-GFPm在细胞裂解物中表达了最高水平的融合多蛋白。与公开的数据一致,该数据支持了以下见解:未加工的包膜蛋白前体蛋白Pr85或在这种情况下病毒包膜-GFPm融合多蛋白不被掺入病毒体中。此外,携带2A肽的R肽的裂解导致“促进融合的”p12E,其在病毒体成熟期间似乎也足以产生感染性病毒颗粒,如由最大感染的U87-MG细胞产生的滴度所示。p15E/p12E比率的性质及其在感染期间在膜融合中的作用尚不清楚。总之,数据表明,病毒包膜蛋白掺入的水平与在靶细胞中测量的滴度值不相关。载体(特别是RRV-GSG-P2A-GFPm和RRV-T2A-GFPm载体)之间的滴度值出乎意料的缺乏差异,表明在不影响这些细胞的滴度的情况下,在RRV颗粒上可以耐受一系列包膜表达水平。

实施例7:由293T细胞产生的RRV-P2A-yCD2和RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2载体具有感染性并表达yCD2蛋白。

在转染前18至20小时,以每10cm板2e 6个细胞接种HEK293T细胞。第二天,使用pAC3-P2A-yCD2、pAC3-T2A-yCD2、pAC3-GSG-P2A-yCD2和pAC3-GSG-T2A-yCD2质粒,在细胞接种后20小时,使用磷酸钙方法瞬时转染20μg质粒DNA。转染后十八小时,用DMEM完全培养基洗涤细胞三次,并用新鲜的完全培养基温育。在转染后约42小时,收集病毒上清液,并通过0.45μm注射过滤器过滤。如先前所述(Perez et al.,2012),测定来自瞬时转染的HEK293T细胞的RRV-P2A-yCD2、RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2的病毒滴度。简言之,通过载体的单循环感染,在PC3细胞上测定载体制剂滴度。感染后24小时,通过叠氮胸苷处理确保单循环感染,随后在感染后48小时,对病毒载体DNA具有特异性的靶细胞基因组DNA进行定量PCR(qPCR)(MLV LTR引物集;5-MLV-U3-R(5’-AGCCCACAACCCCTCACTC-3’(SEQID NO:20))、3-MLV-Psi(5’-TCTCCCGATCCCGGACGA-3’(SEQ ID NO:21))和探针(5’-FAM-CCCCAAATGAAAGACCCCCGCTGACG-BHQ1-3’(SEQ ID NO:22)),以定量每细胞基因组的病毒DNA拷贝数。通过计算阈值循环(CT)值来确定以每毫升转导单位(TU)报道的病毒滴度(TU/mL),所述阈值循环(CT)值从2×107个拷贝至2×101个拷贝质粒DNA的标准曲线和已知量的基因组DNA输入、细胞数以及每反应混合物的病毒原液稀释度导出。表F显示,由HEK293T细胞产生的RRV-P2A-yCD2、RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2的滴度与RRV-IRES-yCD2的相当。

表F:由293T细胞产生的RRV-P2A-yCD2、RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2载体的滴度

此外,如所描述的,滴定从最大感染的U87-MG细胞收集的病毒上清液,以确保它们保持感染性。用于滴度的引物集与含有5-MLV-U3-R、3-MLV-Psi引物和探针的引物集具有相似的引发效率。用于滴定来自感染的U87-MG细胞RRV-P2A-yCD2、RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2载体的引物集是:Env2为:5’-ACCCTCAACCTCCCCTACAAGT-3’(SEQ ID NO:25),Env2 Rev:5’-GTTAAGCGCCTGATAGGCTC-3’(SEQ ID NO:26)和探针5’-FAM-CCCCAAATGAAAGACCCCCGCTGACG-BHQ1-3’(SEQ ID NO:27)。从最大感染的U87-MG细胞产生的滴度与从瞬时转染的HEK293T细胞获得的相似,并且在RRV-IRES-yCD2载体之间是相当的。

实施例8:在感染的U87-MG细胞中,RRV-P2A-yCD2和RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2载体的病毒包膜和yCD2蛋白以不同的效率处理。

为了评估yCD2表达、yCD2蛋白与病毒包膜蛋白的分离效率、以及病毒包膜蛋白的正确加工,从感染的U87-MG细胞产生细胞裂解物。在U87-MG细胞处于最大感染性时,在1XPBS中将汇合的细胞单层洗涤一次,用TrpZ ean(Sigma)解离,重悬于完全DMEM中,再次在1XPBS中洗涤,随后在冰上在200μL RIPA裂解缓冲液(Thermo Scientific)中裂解细胞30分钟。通过在4℃下以14,000rpm离心15分钟来澄清裂解物的细胞碎片,收集上清液并转移到新试管中。然后使用BCA沉淀测定法(Thermo Scientific)测定细胞裂解物的蛋白质浓度,并使20μg蛋白质进行SDS-PAGE。在200伏特下在4-12%XT-Tris SDS-PAGE凝胶(BioRad)上将蛋白质解析45分钟。随后,使用iBlot干燥印迹系统在20伏特下将蛋白质转移至PVDF膜(Life Technologies)上7分钟。使用抗-gp70(大鼠抗-gp70,克隆83A25;1:500稀释度)和抗-yCD2(小鼠抗-yCD2;1:1000稀释度),测定膜的包膜蛋白的gp70亚基和yCD2的表达。使用缀合至辣根过氧化物酶的相应第二抗体检测蛋白质表达。结果显示,使用抗-yCD2抗体,如env-2A-yCD2融合多蛋白在~110KDa的高分子量所示,来自RRV-P2A-yCD2和RRV-T2A-yCD2的yCD2蛋白与病毒包膜蛋白的分离效率低下。相反,与RRV-IRES-yCD2相比,从病毒包膜蛋白分离yCD2蛋白对于RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2相对有效。与此同时,用抗-gp70抗体检查了感染的U87-MG中病毒包膜蛋白的加工。结果表明,在RRV-GSG-P2A-yCD2、RRV-GSG-T2A-yCD2载体中可容易地检测到以前体(Pr85)或加工形式(gp70)包被的病毒,但在RRV-P2A-yCD2和RRV-T2A-yCD2载体中,检测水平低得多。此外,Pr85/gp70病毒包膜蛋白的水平与在抗-yCD2免疫印迹中观察到的水平有些一致。然而,与RRV-2A-GFPm或RRV-GSG-2A-GFPm载体不同,使用抗-gp70抗体或抗-2A抗体(Cat#ABS31,EMD Millipore)不能检测到病毒包膜-yCD2融合多蛋白。在4种载体中,RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2载体显示出融合多蛋白的最有效分离,如在抗-yCD2免疫印迹中未检测到病毒包膜-yCD2融合多蛋白所示。总之,数据表明,GSG-P2A和GSG-T2A构型在RRV包膜蛋白开放阅读框的背景下产生了最有效的多蛋白分离。

实施例9:RRV-G2G-P2A-YCD2和RRV-GSG-T2A-yCD2在U87-MG细胞中具有长期稳定性。

进行了连续感染以评价RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2在U87-MG细胞中的长期载体稳定性。将接种在6-孔板中的约105个初始U87-MG细胞用病毒载体以0.1的MOI进行最初感染,并培养1周,以完成单个感染循环。将来自完全感染细胞的2ml病毒上清液的100μL用于感染105个初始细胞,并且重复多达16个循环。通过重悬于400μL 1X PBS,并使用Promega Maxwell 16细胞DNA纯化试剂盒(Promega)分离,从小团块中提取基因组DNA。然后使用一百纳克基因组DNA作为模板,用跨越转基因盒的引物对进行PCR;IRES-F(5’-CTGATCTTACTCTTTGGACCTTG-3’(SEQ ID NO:23))和IRES-R(5’-CCCCTTTTTCTGGAGACTAAATAA-3’(SEQ ID NO:24))。通过从感染的细胞中PCR扩增整合的前病毒来评价2A-yCD2区域的载体稳定性。预期的PCR产物大小约为0.73kb。任何小于0.73kb的条带的出现表明了2A-yCD2区中的缺失。如先前报道的(Perez et al.,2012),RRV-yCD2中的IRES-yCD2(1.2Kb)区稳定至感染循环16。同样地,RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2中的2A-yCD2区域也保持稳定至感染循环16。然而,RRV-GSG-T2A-yCD2中的2A-yCD2区域的稳定性稍低于RRV-GSG-P2A-yCD2,因为在感染循环13中出现缺失(0.4kb),但在整个循环16中保持稳定。

实施例10:正确加工的病毒包膜蛋白的掺入与用RRV-P2A-yCD2和RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2载体感染的U87-MG细胞中病毒包膜和yCD2蛋白之间的分离效率相关。

通过20%蔗糖梯度在4℃下,以14,000rpm将由RRV-2A-yCD2和RRV-GSG-2A-yCD2最大感染的U87-MG细胞产生的病毒上清液团粒化30分钟,随后重悬于20μL含有5%2-巯基乙醇的1X Laemmli缓冲液中,并在4-20%Tris甘氨酸凝胶(BioRad,Hercules CA)上进行SDSPAGE。如所述进行电泳和蛋白质转移。使用抗-gp70(大鼠产生的抗-gp70,克隆83A25;1:500稀释度)和抗-p15E(小鼠产生的抗TM,克隆372;1:250稀释度)测定正确加工的病毒体病毒包膜蛋白表达和成熟。使用缀合至辣根过氧化物酶的相应第二抗体检测蛋白质表达。数据显示,在病毒体中,以与RRV-IRES-yCD2相当的水平检测到正确加工的包膜蛋白,即RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2的gp70,但不是RRV-P2A-yCD2和RRV-T2A-yCD2的gp70。

重要的是,数据表明,正确加工的病毒包膜蛋白的掺入水平与滴度值不相关。

实施例11:yCD2蛋白表达水平在RRV-P2A-yCD2和RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2感染的U87-MG细胞中不同,但表现出与RRV-IRES-yCD2感染的U87-MG细胞相当的5-FC敏感性

由于RRV-P2A-yCD2和RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2的免疫印迹显示,在感染的U87-MG细胞中,作为与病毒包膜蛋白分离的蛋白或作为融合多蛋白表达的yCD2蛋白的量不同,因此通过进行LD50实验测量了它们的5-FC敏感性。将用RRV-P2A-yCD2和RRV-T2A-yCD2、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2载体最大感染的U87-MG细胞用于通过MTS测定法确定它们的5-FC LD50。对于每个感染或未感染的U87-MG细胞系,将1×103个细胞/孔/100μL培养基一式三份接种于96-孔板中。用以从0.00001mM-1mM的1:10系列稀释度的5-FC(cat#F7129,Sigma)处理细胞。不包括5-FC处理作为对照。在铺板后1天,加入5-FC,然后每2天补充添加了5-FC的完全培养基。包括初始U87-MG细胞作为对照以确定5-FC的非-5-FU介导的细胞毒性效应。在7天的温育时间内监测细胞,并且通过使用CellTiter96AQueous单溶液细胞增殖测定系统(Promega),每2天测量细胞死亡。加入MTS后,在MTS温育60分钟时,使用Infinite M200(Tecan)读板仪获得490nm下的OD值。将每个样品一式三份的平均OD值转化为相对于未处理但RRV-感染的细胞的细胞存活百分比。随后,使用GraphPad Prim以对数标度将百分比值对5-FC浓度作图,以产生LD50图谱。通过软件使用获得的数据点的非线性四参数拟合计算LD50值。数据表明,尽管“分离的”yCD2蛋白的水平在RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2感染的U87-MG细胞中比在RRV-P2A-yCD2和RRV-T2A-yCD2感染的U87-MG细胞中更高,但在RRV-P2A-yCD2和RRV-T2A-yCD2感染的U87-MG细胞中观察到的病毒包膜-yCD2融合多蛋白在将5-FC转化为5-FU中具有酶活性,从而在与RRV-IRES-yCD2相似的LC50浓度下实现了细胞毒性作用。

实施例12:RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2感染的Tu2449细胞表现出与RRV-IRES-yCD2相当的5-FC敏感性

如所描述的,将用RRV-GSG-P2A-GMCSF-T2A-yCD2最大感染的Tu2449细胞用于通过MTS测定法确定其5-FC LD50。包括RRV-IRES-yCD2作为对照。使用以从0.00001mM-1mM的1:10系列稀释度的5-FC(cat#F7129,Sigma)处理。未包括5-FC处理作为对照。在铺板后1天加入5-FC,然后每2天补充添加了5-FC的完全培养基。包括初始Tu2449细胞作为对照,以确定5-FC的非-5-FU介导的细胞毒性效应。在7天的温育时间内监测细胞,并且通过使用CellTiter 96 Aqueous单溶液细胞增殖测定系统(Promega)每2天测量细胞死亡。加入MTS后,在MTS温育60分钟时,使用Infinite M200(Tecan)读板仪获得490nm下的OD值。将每个样品一式三份的平均OD值转化为相对于未处理但RRV-感染的细胞的细胞存活百分比。使用GraphPad Prim以对数标度将百分比值对5-FC浓度作图,以产生LD50图谱。通过软件使用获得的数据点的非线性四参数拟合计算LD50值。数据表明,由RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2感染的Tu-2449细胞表达的yCD2蛋白在将5-FC转化为5-FU中具有酶活性,从而在与RRV-IRES-yCD2相似的LC50浓度下实现了细胞毒性作用。

实施例13:RRV-GSG-T2A-yCD2治疗的皮下同基因神经胶质瘤小鼠显示与RRV-IRES-yCD2相当的延迟的肿瘤生长。

在B6C3F1小鼠中将同源细胞系Tu-2449用作原位脑肿瘤模型(Ostertag et al.,2012)。建立了用于皮下肿瘤建模的Tu-2449细胞亚系(Tu-2449SQ)。在体外制备了98%初始Tu-2449 SQ细胞和2%RRV-GSG-T2A-yCD2感染的Tu-2449SQ细胞的混合物,并重悬于磷酸盐缓冲盐水(PBS;Hyclone)中,用于皮下肿瘤植入。包括98%初始Tu-2449SQ细胞和2%RRV-IRES-yCD2感染的Tu-2449SQ细胞的混合物作为阳性对照以及比较物。在第0天,每组中的B6C3F1小鼠(每组n=10)进行皮下植入1×106个肿瘤细胞,在肿瘤植入后第12天(此时约>75%的肿瘤被RRV感染),连续45天向小鼠施用PBS或5-FC(500mg/kg体重/剂量,腹腔注射,每日两次),接着是2天不施用药物以允许载体从剩余的感染细胞中扩散。再重复两次5天药物治疗、2天无药物治疗的循环。每天进行肿瘤体积测量。结果表明,携带带有RRV-IRES-yCD2或RRV-GSG-T2A的肿瘤但不经5-FC处理的小鼠继续生长。相反,携带带有RRV-GSG-T2A的肿瘤的小鼠用5-FC处理后延迟了预先建立的肿瘤的生长,并且与用RRV-IRES-yCD2+5-FC处理的小鼠相当。数据表明,在皮下同源神经胶质瘤小鼠模型中,RRV-GSG-T2A-yCD2具有与RRV-IRES-yCD2相当的治疗效力。

实施例14:由HEK293T细胞产生的RRV-GSG-T2A-GMCSF-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2-GSG-PS2-GMCSF载体表达GMCSF和yCD2蛋白,并且具有感染性。

通过将分别在5'和3'端存在AscI和NotI限制性位点的化学合成的人类GMCSF-GSG-P2A-yCD2和yCD2-GSG-P2A-GMCSF盒(Genewiz)克隆到用AscI和NotI限制性酶消化的pAC3-GSG-T2A-yCD2主链中,产生pAC3-GSG-T2A-GMCSF-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2-GSG-P2A-GMCSF。所得的GMCSF-GSG-P2A-yCD2和yCD2-GSG-P2A-GMCSF盒在该盒的N-末端(AscI限制性位点的5'上游)与GSG-T2A同框。

转染前18至20小时,以每10cm板2e6个细胞接种HEK293T细胞。第二天,在细胞接种后20小时,用磷酸钙法,将20μg pAC3-GSG-T2A-GMCSF-GSG-P2A-yCD2或pAC3-GSG-T2A-yCD2-GSG-P2A-GMCSF质粒用于瞬时转染。转染后十八小时,用CMEM培养基洗涤细胞三次,并用新鲜的完全培养基温育。转染后约42小时,收集病毒上清液,并通过0.45μm注射过滤器过滤。如所描述的,测定来自HEK293T细胞瞬时转染的RRV-GSG-T2A-GMCSF-GSG-P2A-yCD2的病毒滴度。数据显示,RRV-GSG-T2A-GMCSF-GSG-P2A-yCD2和pAC3-GSG-T2A-yCD2-GSG-P2A-GMCSF的滴度(~2E6 TU/mL)与RRV-IRES-yCD2的滴度相当。

为了评估yCD2蛋白表达,从pAC3-GSG-P2A-GMCSF-GSG-T2A-yCD2或pAC3-GSG-T2A-yCD2-GSG-P2A-GMCSF瞬时转染的293T细胞产生细胞裂解物。在该实验中,还包括pAC3-IRES-yCD2和pAC3-IRES-GMCSF作为对照。对于GMCSF表达,收集瞬时转染293T细胞的上清液,用于通过ELISA(Cat#DGM00,R&D Systems)测量。如所述的,测定全细胞裂解物的yCD2蛋白表达。抗-yCD2结果表明,来自pAC3-GSG-P2A-GMCSF-GSG-T2A-yCD2或pAC3-GSG-T2A-yCD2-GSG-P2A-GMCSF的yCD2蛋白与GMCSF有效分离,如~15KDa条带所示。然而,在两种构型中,由2A肽介导的yCD2与GMCSF(pAC3-GSG-P2A-GMCSF-GSG-T2A-yCD2)或与病毒包膜蛋白(pAC3-GSG-T2A-yCD2-GSG-P2A-GMCSF)的分离有显著差异,yCD2蛋白与GMCSF正确分离,如yCD2的大小与来自RRV-IRES-yCD2的yCD2相比所指示的。相反,与病毒env分离的yCD2蛋白具有稍高的分子量,与RRV-GSG-P2A-GFP、RRV-GSG-T2A-GFP、RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2构建体的一致。数据表明,yCD2与env的分离可能不是精确地发生在理论预期的氨基酸序列上。但当yCD2置于另一分泌蛋白(即GMCSF)的下游时,观察到yCD2蛋白的正确分离。然而,重要的是要注意,由RRV-GSG-P2A-yCD2和RRV-GSG-T2A-yCD2表达的2A-yCD2蛋白的酶活性似乎不影响5-FC在体外和体内的敏感性和细胞毒性效应。

尽管未确定在pAC3-GSG-P2A-GMCSF-GSG-T2A-yCD2构建体中GMCSF蛋白与病毒包膜蛋白的分离效率,或者在pAC3-GSG-T2A-yCD2-GSG-P2A-GMCSF构建体中GMCSF蛋白与yCD2的分离效率,但是GMCSF ELISA结果表明,对于RRV-GSG-P2A-GMCSF-GSG-T2A-yCD2,分泌的GMCSF的量为~500ng/mL,而对于RRV-GSG-T2A-yCD2-GSG-P2A-GMCSF,分泌的GMCSF的量为~760ng/mL。在两种情况下,GMCSF的表达量都比RRV-IRES-GMCSF(25ng/mL)的高约20-30倍。与此同时,使用抗-gp70抗体检查了感染的U87-MG中病毒包膜蛋白的加工。结果表明,前体(Pr85)或加工形式(gp70)的病毒包膜蛋白可容易地检测到。总之,这些数据表明,Env-GSG-T2A-GMCSF-GSG-P2A-yCD2和Env-GSG-T2A-yCD2-GSG-P2A-GMCSF多蛋白构型均可表达GMCSF和yCD2蛋白。

此外,如所述的,滴定从最大感染的U87-MG细胞收集的病毒上清液,以确保病毒保持感染性。数据显示,由最大感染的U87-MG细胞产生的滴度(~3E6 TU/mL)与由瞬时转染的HEK293T细胞获得的滴度相似,且与RRV-IRES-yCD2相当。

实施例15:RRV-GSG-T2A-GMCSF-P2A-yCD2和RRV-GSG-T2A-yCD2-P2A-GMCSF载体表现出与RRV-IRES-yCD2感染的U87-MG细胞相当的5-FC敏感性。

如所述的,将用RRV-GSG-T2A-GMCSF-GSG-P2A-yCD2或RRV-GSG-T2A-yCD2-GSG-P2A-GMCSF最大感染的U87-MG细胞用于通过MTS测定确定其5-FCLD50。包括RRV-IRES-yCD2作为对照。数据表明,在感染的U87-MG细胞中检测到的“分离的”yCD2蛋白的量在0.008mM的LD50浓度下能够实现细胞毒性效应,这与RRV-IRES-yCD2的相似。

实施例16:RRV-GSG-T2A-GMCSF-RSV-yCD2以及由HEK293T细胞和最大感染的U87-MG细胞产生的载体具有感染性,并表达GMCSF和yCD2蛋白。

通过将在5'和3'端分别存在AscI和NotI限制位点的化学合成的人类GM CSF-RSV-yCD2盒(Genewiz)克隆到经AscI和NotI限制酶消化的pAC3-GSG-T2A-yCD2主链中,产生了pAC3-GSG-T2A-GMCSF-RSV-yCD2。化学合成的GMCSF-RSV-yCD2盒在GMCSF ORF的3'端含有终止密码子。

转染前18至20小时,以每10cm板2e6个细胞接种HEK293T细胞。第二天,在细胞接种后20小时,使用磷酸钙方法,将20μg pAC3-GSG-T2A-GMCSF-RSV-yCD2质粒用于瞬时转染。转染后十八小时,用DMEM培养基洗涤细胞三次,并用新鲜的完全培养基温育。在转染后约42小时,收集病毒上清液,并通过0.45μm注射过滤器过滤。如所述的,测定来自HEK293T细胞瞬时转染的RRV-GSG-T2A-GMCSF-RSV-yCD2的病毒滴度。数据显示,RRV-GSG-T2A-GMCSF-RSV-yCD2的滴度(~2E6 TU/mL)与RRV-IRES-yCD2的相当。

此外,滴定从最大感染的U87-MG细胞收集的病毒上清液以确保病毒保持感染性。数据显示,由最大感染的U87-MG细胞产生的滴度(~2E6 TU/mL)与由瞬时转染的HEK293T细胞获得的滴度相似,且与RRV-IRES-yCD2相当。

为了评估GMCSF和yCD2蛋白表达,从RRV-GSG-T2A-GMCSF-RSV-yCD2感染的U87-MG细胞产生细胞裂解物。在该实验中,包括RRV-IRES-yCD2和RRV-IRES-GMCSF作为对照。收集最大感染的U87-MG细胞的上清液,通过ELISA(R&D Systems)测量GMCSF的蛋白质表达水平。如所述的,测定全细胞裂解物的yCD2蛋白表达。抗-yCD2免疫印迹结果表明,来自RRV-GSG-T2A-GMCSF-RSV-yCD2感染的U87-MG细胞的yCD2蛋白的表达水平比RRV-IRES-yCD2的低约2-3倍。与此同时,使用抗-gp70抗体检查了感染的U87-MG中病毒包膜蛋白的加工。结果显示,前体(Pr85)或加工形式(gp70)的病毒包膜蛋白可容易地检测。如所预期的,使用抗-gp70抗体在细胞裂解物中也检测到病毒包膜-GMCSF融合多蛋白。尽管未确定GMCSF蛋白与病毒包膜蛋白的分离,但GMCSF ELISA结果表明,分泌的GMCSF的量为~300ng/mL,并且比RRV-IRES-GMCSF(30ng/mL)的多约10倍。总之,这些数据表明,病毒包膜蛋白-GSG-T2A-GMCSF-RSV-yCD2多蛋白构型在RRV背景下可产生感染性病毒以及GMCSF和yCD2蛋白。

实施例17:RRV-GSG-T2A-GMCSF-RSV-yCD2载体表现出与RRV-IRES-yCD2感染的U87-MG细胞相当的5-FC敏感性。

如所述的,将用RRV-GSG-T2A-GMCSF-RSV-yCD2载体最大感染的U87-MG细胞用于通过MTS测定确定其5-FC LD50。在该实验中,包括RRV-IRES-yCD2作为对照。数据表明,在感染的U87-MG细胞中表达的yCD2蛋白的量在0.010mM的LD50浓度下能够实现细胞毒性效应,并与RRV-IRES-yCD2的相当。

实施例18:由293T细胞和感染的U87-MG细胞产生的RRV-GSG-P2A-yCD2-RSV-PDL1miR30shRNA载体具有感染性,并且表达yCD2蛋白。

通过将在5'和3'端分别存在AscI和NotI限制性位点的化学合成的人类yCD2-RSV-miRPDL1盒(Genewiz)克隆到经AscI和NotI限制酶消化的pAC3-GSG-T2A-yCD2主链中,产生pAC3-GSG-T2A-yCD2-RSV-miRPDL1。化学合成的yCD2-RSV-miRPDL1盒在yCD2 ORF的末端含有终止密码子。

转染前18至20小时,以每10cm板2e6个细胞接种HEK293T细胞。第二天,在细胞接种后20小时,使用磷酸钙方法,将20μg pAC3-GSG-T2A-yCD2-RSV-miRPDL1质粒用于瞬时转染。转染后十八小时,用DMEM培养基洗涤细胞三次,并用新鲜的完全培养基温育。在转染后约42小时,收集病毒上清液,并通过0.45μm注射过滤器过滤。如所述的,测定来自HEK293T细胞瞬时转染的RRV-GSG-T2A-yCD2-RSV-mrRPDL1的病毒滴度。数据显示,RRV-GSG-T2A-yCD2-RSV-miRPDL1的滴度(~2E6 TU/mL)与RRV-IRES-yCD2的相当。

此外,滴定从最大感染的U87-MG细胞收集的病毒上清液,以确保病毒保持感染性。数据显示,由最大感染的U87-MG细胞产生的滴度(~2E6 TU/mL)与从瞬时转染的HEK293T细胞获得的滴度相似,且与RRV-IRES-yCD2相当。

为了测量yCD2蛋白的表达和PDL1细胞表面表达,收获最大感染的U87-MG细胞,并如所述的,测定全细胞裂解物的yCD2蛋白表达。抗-yCD2免疫印迹结果表明,如使用抗-yCD2抗体的~15KDa条带所示,来自RRV-GSG-T2A-yCD2-RSV-miRPDL1感染的U87-MG细胞的yCD2蛋白与病毒包膜蛋白有效地分离。如所预期的,使用抗-yCD2和抗-gp70抗体,在细胞裂解物中也检测到病毒包膜-yCD2融合多蛋白。与此同时,使用抗-gp70抗体检查了感染的U87-MG中病毒包膜蛋白的加工。结果显示,前体(Pr85)或加工形式(gp70)的病毒包膜蛋白可容易地检测。此外,如在抗-yCD2免疫印迹中所见,检测到融合多蛋白。

实施例19:RRV-GSG-T2A-yCD2-RSV-miRPDL1感染的U87-MG细胞表现出与RRV-IRES-yCD2感染的U87-MG细胞相当的5-FC敏感性。

如所述的,将用RRV-GSG-T2A-yCD2-RSV-miRPDL1载体最大感染的U87-MG细胞用于通过MTS测定法确定其5-FC LD50。在该实验中,包括RRV-IRES-yCD2作为对照。数据表明,在感染的U87-MG细胞中检测到的“分离的”yCD2蛋白的量在与RRV-IRES-yCD2相当的LD50浓度(0.008mM)下能够实现细胞毒性效应。

实施例20:RRV-GSG-P2A-yCD2-RSV-miRPDL1感染的MDA-MB231细胞在细胞表面上表现出有效的PD-L1敲低。

为了评价RRV-GSG-T2A-yCD2-RSV-miRPDL1的PDL1敲低活性,使用0.1的MOI来感染已显示表达显著水平PDL1的MDA-MB231细胞。在本实验中,包括RRV-RSV-miRPDL1作为评估PDL1敲低活性的阳性对照。大约在感染后第14天,收获细胞并进行细胞表面染色,以通过FACS测量PDL1蛋白的水平。数据显示,用RRV-GSG-T2A-yCD2-RSV-miRPDL1感染的MDA-MB231细胞中PDL1的细胞表面表达降低了约75%,并且与RRV-RSV-miRPDL1的相当。总之,这些数据表明,病毒包膜蛋白-GSG-T2A-yCD2-RSV-miRPDL1构型可以在RRV背景下产生感染性病毒、yCD2蛋白和miRPDL1。

实施例21:由HEK293T细胞和最大感染的U87-MG细胞产生的RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO载体具有感染性并且表达TKO蛋白

通过将具有人类密码子优化(TKO)(见国际申请公开号No.WO2014/066700,通过引用并入本文)盒的Sr39-tk(Black et al.,Cancer Res.,61:3022–3026,2001;Kokoris etal.,Protein Science 11:2267–2272,2002)克隆到pAC3-2A主链中,产生了pAC3-P2A-TKO、pAC3-GSG-P2A-TKO、pAC3-T2A-TKO和pAC3-GSG-T2A-TKO。TKO的序列是化学合成的(Genewiz),在5'和3'端分别存在AscI和NotI限制性位点,克隆到用AscI和NotI限制性内切酶消化的pAC3-GSG-P2A-yCD2或pAC3-GSG-T2A-yCD2主链中。

转染前18至20小时,以每10cm板2e6个细胞接种HEK293T细胞。第二天,在细胞接种后20小时,使用磷酸钙方法,将20μg pAC3-GSG-P2A-TKO或pAC3-GSG-T2A-TKO质粒用于瞬时转染。转染后十八小时,用DMEM培养基洗涤细胞三次,并用新鲜的完全培养基温育。在转染后约42小时,收集病毒上清液,并通过0.45μm注射过滤器过滤。如所述的,测定来自HEK293T细胞瞬时转染的RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO的病毒滴度。数据显示,滴度与RRV-IRES-yCD2的相当(表G)。

表G:由HER293T细胞产生的RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO载体的滴度

此外,如所述的,滴定从最大感染的U87-MG细胞收集的病毒上清液,以确保病毒保持感染性。数据显示,最大感染的U87-MG细胞产生的滴度与从瞬时转染HEK293T细胞获得的相当。

为了评估TKO蛋白表达,从RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO感染的U87-MG细胞产生细胞裂解物。使用抗-HSV-tk抗体(Cat#sc28037,SantaCruz Biotech Inc)以1:200测定全细胞裂解物的TKO蛋白表达。结果显示,如先前用GFP和yCD2转基因所看到的,来自RRV-P2A-TKO和RRV-T2A-TKO感染的U87-MG细胞的TKO蛋白的分离效率低于RRV-GSG-P2A-TKO和RRV-GSG-T2A-TKO。

实施例22:RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO载体在U87-MG细胞中是稳定的。

为了评价载体在最大感染的U87-MG细胞中的稳定性,使用Promega Maxwell 16细胞DNA纯化试剂盒(Promega)从细胞中提取基因组DNA。然后使用一百纳克基因组DNA作为模板,用跨越转基因盒的引物对进行PCR;如前所述的IRES-F(5’-CTGATCTTACTCTTTGGACCTTG-3’(SEQ ID NO:23))和IRES-R(5’-CCCCTTTTTCTGGAGACTAAATAA-3’(SEQ ID NO:24))。所有RRV-2A-TKO构建体的预期PCR产物为1.4kb。数据表明,在病毒复制的时间过程中,前病毒DNA RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO载体中的2A-TKO和GSG-2A-TKO区域在U87-MG细胞中是稳定的。

实施例23:RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO感染的U87-MG细胞表现出比RRV-S1-TKO的更好的GCV敏感性

用RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO最大感染U87-MG细胞,通过MTS测定法确定其GCV LD50。包括RRV-S1-TKO作为对照,其TKO表达由合成最小启动子驱动(参见国际专利公开号No.WO2014/066700,通过引用并入本文)。以0.0001μM-0.5μM的一系列1:2稀释液进行用GCV(cat#345700-50MG,EMD Millipore)处理。未包括GCV处理作为对照。在铺板后1天加入GCV,然后每2天补充添加了GCV的完全培养基。包括初始U87-MG细胞作为对照,以确定GCV的细胞毒性效应。在7天的温育时间内监测细胞,并且通过使用CellTiter 96Aqueous单溶液细胞增殖测定系统(Promega)每2天测量细胞死亡。加入MTS后,在MTS温育60分钟时,使用Infinite M200(Tecan)读板仪获得在490nm下的OD值。将每个样品一式三份的平均OD值转化为相对于未处理但RRV感染的细胞的存活百分比。使用GraphPad Prim以对数标度将百分比值对GCV浓度作图以产生LD50图。通过软件使用获得的数据点的非线性四参数拟合计算LD50值。数据表明,RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO表达的TKO蛋白在十分之一毫摩尔范围内将GCV转化为细胞毒性GCV中具有酶活性,从而实现细胞毒性效应。与RRV-S1-TKO相比,RRV-P2A-TKO、RRV-GSG-P2A-TKO、RRV-T2A-TKO和RRV-GSG-T2A-TKO显示高出12.5-20倍的GCV敏感性。此外,尽管TKO与Env-TKO融合多蛋白之间的分离有差异,但GCV LD50在RRV-P2A-TKO对RRV-GSG-P2A-TKO或RRV-T2A-TKO对RRV-GSG-T2A-TKO之间没有显著差异。类似于2A-yCD2,数据表明,细胞中表达的TKO蛋白的量足以将GCV转化为细胞毒性GCV。

实施例24:RRV-GSG-P2A-TKO和RRV-GSG-T2A-TKO皮下处理的同基因神经胶质瘤小鼠表现出与RRV-IRES-yCD2相当的肿瘤生长延迟。

在B6C3F1小鼠中,将同源细胞系Tu-2449用作原位脑肿瘤模型(Ostertag et al.,2012)。在Tocagen建立了用于皮下肿瘤模型的Tu-2449细胞亚系(Tu-2449SQ)。体外制备了98%初始Tu-2449SQ细胞和2%RRV-GSG-P2A-TKO、RRV-GSG-T2A-TKO或RRV-S1-TKO感染的Tu-2449SQ细胞的混合物,并且重悬于磷酸盐缓冲盐水(PBS;Hyclone)中,用于皮下肿瘤植入。包括98%初始Tu-2449SQ细胞和2%RRV-IRES-yCD2感染的Tu-2449SQ细胞的混合物作为阳性对照以及比较物。每组中的B6C3F1小鼠(每组n=10)在第0天皮下植入1×106个肿瘤细胞。在肿瘤植入后第12天(此时,约>75%的肿瘤被RRV感染),小鼠连续5天施用PBS、5-FC(500mg/kg体重/剂量,腹膜内)或GCV(50mg/kg体重/剂量,腹腔注射,每日两次),接着2天不给予药物以允许载体从剩余的感染细胞中扩散。再重复5天施用、2天不施用药物治疗的循环两次。每天进行肿瘤体积测量。结果表明,携带带有RRV-GSG-P2A-TKO、RRV-GSG-T2A-TKO或RRV-S1-TKO而无GCV或RRV-IRES-yCD2的肿瘤的小鼠在未经5-FC处理时继续生长。相反,RRV-GSG-P2A-TKO、RRV-GSG-T2A-TKO+GCV处理的携带肿瘤的小鼠延迟了预先建立的肿瘤的肿瘤生长。此外,用RRV-S1-TKO+GCV处理的携带肿瘤的小鼠也表现出肿瘤生长的延迟,但与用RRV-GSG-P2A-TKO、RRV-GSG-T2A-TKO+GCV处理的肿瘤相比,延迟的程度较小且时间较长,这可能是由于TKO表达降低导致的。总之,数据表明,RRV-GSG-P2A-TKO+GCV和RRV-GSG-T2A-TKO+GCV的肿瘤生长延迟与用RRV-IRES-yCD2+5-FC处理的相当。数据表明,在皮下同源神经胶质瘤小鼠模型中,RRV-GSG-P2A-TKO和RRV-GSG-T2A-TKO具有与RRV-IRES-yCD2相当的治疗效力。

实施例25:由HEK293T细胞和最大感染的U87-MG细胞产生的RRV-GSG-T2A-PDL1scFv和RRV-GSG-T2A-PDL1scFvFc载体具有感染性,并表达scFv和scFvFc蛋白。

产生了pAC3-T2A-PDL1scFv、pAC3-T2A-PDL1scFv-标签、pAC3-T2A-PDL1scFvFc和pAC3-T2A-PDL1scFvFc-标签,以充当针对人类和小鼠PDL1的阻断单链可变片段(scFv)。设计的PDL1scFv盒具有或不具有人类IgG1的可结晶片段(Fc)区。此外,还产生了具有掺入scFv或ScFvFc的C-末端的HA和Flag表位标签的匹配盒,用于检测scFv或ScFvFc蛋白表达。化学合成(Genewiz)了每个盒(PDL1scFv,PDL1scFv-标签、PDL1scFvFc和PDL1scFvFC-标签)的序列,在5'和3'端分别存在AscI和NotI限制性位点,并且克隆到用AscI和NotI限制性内切酶消化的pAC3-GSG-T2A-yCD2主链中。

转染前18至20小时,以每10cm板2e6个细胞接种HEK293T细胞。第二天,在细胞接种后20小时,使用磷酸钙方法,将20μg pAC3-T2A-PDL1scFv、pAC3-T2A-PDL1scFv-标签、pAC3-T2A-PDL1scFvFc和pAC3-T2A-PDL1scFvFc-标签质粒用于瞬时转染。转染后十八小时,用DMEM培养基洗涤细胞三次,并用新鲜的完全培养基温育。在转染后约42小时,收集病毒上清液,并通过0.45μm注射过滤器过滤。如所述的,测定来自HEK293T细胞瞬时转染的RRV-GSG-T2A-GMCSF-GSG-P2A-yCD2的病毒滴度。数据显示,RRV-GSG-T2A-PDL1scFv、RRV-GSG-T2A-PDL1scFvFc、RRV-GSG-T2A-PDL1scFv-标签、RRV-GSG-T2A-PDL1scFvFc-标签的滴度值与RRV-IRES-yCD2相当(表H)。

表H:来自瞬时转染的HEK293T细胞的RRV-GSG-T2A-PDL1scFv、RRV-GSG-T2A-PDL1scFvFc、RRV-GSG-T2A-PDL1scFv-标签、RRV-GSG-T2A-PDL1scFvFc-标签的滴度值

TU/mL Std Dev
RRV-PDL 1scFv 2.09E+06 4.80E+05
RRV-PDL 1scFv Fc 1.98E+06 4.38E+05
RRV-PDL 1scFv-Tag 2.08E+06 6.73E+05
RRV-PDL 1scFv Fc-Tag 1.29E+06 1.87E+05

为了评价scFv蛋白表达,从RRV-GSG-T2A-PDL1scFv和RRV-GSG-T2A-PDL1scFvFc转染的HEK293T细胞产生细胞裂解物。使用抗-Flag和抗-HA抗体(Cat#1804和Cat#H3663,Sigma Aldrich)以1:1,000测定全细胞裂解物的scFv蛋白表达。结果显示,如先前用GFP和yCD2和TKO转基因所看到的,来自RRV-GSG-T2A-PDL1scFv-标签、RRV-GSG-T2A-PDL1scFvFc-标签瞬时转染的HEK293T细胞的PDL1scFv-标签和PDL1scFvFc-标签蛋白表达与Env-scFv多蛋白分离(图4A)。

与此同时,用抗-2A抗体检查了HEK293T细胞中病毒包膜蛋白的加工。结果显示,在所有4个载体中检测到了含有2A肽序列的以前体(Pr85)或加工形式(p15E)包被的病毒(图4B),表明病毒包膜蛋白与scFv和scFvFc蛋白分离,如在抗-Flag和抗-HA免疫印迹中所看到的。尽管在细胞裂解物中检测到了融合多蛋白Env-scFv或Env-scFvFc的表达,但通过来自细胞裂解物和上清液的免疫印迹显示,从融合多蛋白分离了显著量的PDL1scFv和PDL1scFvFc蛋白。

类似地,通过用抗-Flag抗体免疫沉淀,随后用抗-HA检测,在瞬时转染的HEK293T细胞的上清液中也检测到了丰富的scFv-标签和scFvFc-标签蛋白表达,反之亦然。此外,还检测了来自最大感染的MDA-MB231(人乳腺癌细胞系)和CT26(鼠结肠直肠癌细胞系)细胞的细胞裂解物以及上清液的scFv-标签和scFvFc-标签蛋白表达,其水平比瞬时转染的HEK293T细胞低约2-3倍。

实施例26:RRV-GSG-T2A-PDL1scFv和RRV-GSG-T2A-PDL1scFvFc恢复PHA-刺激的T细胞活化并显示体外PDL1阻断抗体的等效性。

为了确定通过RRV-GSG-T2A-PDL1scFv或RRV-GSG-T2A-PDL1scFvFc对肿瘤细胞的PDL1阻断是否可以减轻PDL1-介导的T细胞抑制,我们进行了PDL1-介导的反式抑制共培养实验。此处,我们评价了调节各种肿瘤细胞系上PDL1表达是否可以改变健康供体PBMC的PHA-刺激的活化,如通过IFNγ的细胞内表达或IFNγ释放到上清液中所测量的。为了消除IFNγ预处理在反式抑制共培养测定中的潜在多效性作用,我们使用具有高PDL1基底细胞表面表达水平的人类乳腺癌细胞系MDA-MB-231建立了共培养体系。为了确认在该测定中需要PDL1参与,还包括了抗-PDL1阻断抗体。在抗-PDL1阻断抗体存在下,PDL1+肿瘤细胞MDA-MB-231细胞不能抑制CD8+T细胞的活化,如IFNγ+/CD8+T细胞的频率增加所示。类似地,用RRV-GSG-T2A-scFv或RRV-GSG-T2A-scFvFc感染的MDA-MB-231细胞同样恢复了CD8+T细胞活化。数据表明,通过PDL1阻断scFv破坏肿瘤细胞和淋巴细胞上的PDL1:PD1轴显示出与抗-PDL1阻断抗体相当的活性,并提供了证明RRV-GSG-T2A-PDL1scFv和RRV-GSG-T2A-PDL1scFvFc的实质免疫学益处的证据。

实施例27:RRV,TOCA-511,突变谱。

各种肿瘤类型可变地能够支持RRV的快速复制,并且这种可变性可改变不同肿瘤对基于RRV的治疗性治疗的敏感性,例如RRV Toca 511(又名T5.0002)和前药Toca FC治疗高级别胶质瘤(T.F.Cloughsey et al.,Sci Transl Med.,8(341):341ra75,June 1,2016,doi:10.1126/scitranslmed.aad9784.)。这种可变性可归因于各种因素,但从我们已从患者血液或肿瘤中回收的编码改良酵母胞嘧啶脱氨酶的RRV的测序数据来看,似乎相关的是APOBEC功能的改变,特别是APOBEC3B和APOBEC3G的功能的改变(B.P.Doehle et al.,J.Virol.79:8201-8207,2005)。表达的改变是从当复制型逆转录病毒载体在肿瘤组织中进行性复制时,失活或减毒突变在该复制型逆转录病毒载体中积累的频率推断出来的。研究显示,最频繁的事件之一是G到A突变,其对应于APOBEC介导的突变的C到T转换特征,该APOBEC介导的突变在逆转录步骤中的第一复制步骤的负链单链DNA上。这些突变可以引起RRV蛋白的氨基酸组成的变化,例如从TGG(色氨酸)到终止密码子(TAG、TGA或TAA)的破坏性变化。已经表明,一些肿瘤(特别是膀胱癌、宫颈癌、肺癌(腺癌和鳞状细胞癌)、头颈癌和乳腺癌,APOBEC3B活性上调,并且这种上调与突变负荷增加相关,这些变化与APOBEC3B活性一致(MB.Burns et al.,Nature Geneti cs 45:977-83,2013;doi:10.1038/ng.2701)。提出这种上调背后的驱动是较高的突变率有利于肿瘤进化和肿瘤有利基因型和表型的选择。在一些实施方式中,通过将密码子替换为其它具有相似化学或结构特性的氨基酸(例如不会被APOBEC转化的苯丙氨酸或酪氨酸)来避免病毒的失活变化。Toca 511是MLV衍生的RRV,编码与IRES连接的热稳定密码子优化酵母胞嘧啶脱氨酶,催化前药5-FC转化为细胞毒性5-FU。在Toca 511治疗过程中,由于逆转录错误和细胞抗病毒防御机制(如APOBEC介导的胞苷脱氨酶),Toca 511容易发生突变。APOBEC蛋白靶向单链DNA,主要是在Toca 511RNA基因组逆转录期间,表现为G到A点。

通过对来自从肿瘤和血液分离的临床样品的Toca 511的高通量测序来绘制Toca511序列突变谱。G到A点突变是Toca 511中最常见的突变类型,与APOBEC活性一致。这是通过高通量测序来自人类样品的γ-逆转录病毒基因治疗突变谱的第一次表征。对G到A突变的分析显示,这些突变通常导致编码序列中的非同义改变。在编码胞嘧啶脱氨酶多肽的基因内,在来自多位患者的样品中存在两个具有复发性G至A突变的位置(表I)。这些突变将编码色氨酸的密码子TGG转变为TGA、TAG或TAA终止密码子,从而在仅九个氨基酸后终止CD翻译。这些结果强调,色氨酸密码子是逆转录病毒基因治疗失活的潜在来源。

表I.Toca 511的重组胞嘧啶脱氨酶(SEQ ID NO:28-29)中点突变的总结。位置是CD蛋白内的氨基酸位置。样品指示了来自血液或肿瘤的显示突变的临床样品的数目。密码子和变化显示了原始密码子序列和随后的改变。AA是由原始密码子编码的原始氨基酸,并且变化显示了在密码子突变后氨基酸变成了什么。

因此,将色氨酸密码子改变成编码与蛋白质功能相容的氨基酸的替代密码子可以减轻APOBEC介导的逆转录病毒基因疗法的失活。

为了测试突变对稳定性的影响,将Toca 511基因组序列(参见例如美国专利号No.8,722,867,‘867专利的SEQ ID NO:19、20和22,其通过引用并入本文)工程化以将显示ApoBec超突变的密码子改变为编码保持稳定性和功能的替代氨基酸的密码子(例如将色氨酸的密码子改变为一些其它允许的氨基酸)。具有胞嘧啶脱氨酶活性的Toca 511多肽(参见SEQ ID NO:29)与天然存在的真菌胞嘧啶脱氨酶蛋白密切相关,并且可以获得这种胞嘧啶脱氨酶的高分辨率结构。因此,可以利用来自系统发育多样的真菌CD蛋白的结构和多个序列比对的组合来鉴定不会对生物功能具有不利影响的潜在氨基酸取代,例如使用ROSETTA、Provean、PSIpred或类似程序。然后通过改变To ca 511基因组并测量酶和生物活性、溶解性、溶液中的热稳定性以及在细胞培养试验和小鼠肿瘤模型中发挥功能的能力(例如5-FC转化为5-FU、启动细胞死亡和激活针对肿瘤的免疫应答以实现持久应答),测试了一组假定的氨基酸取代。类似的分析可用于GAG、POL和ENV序列以修饰这些序列,从而除去对ApoBec超突变敏感的密码子。

实施例28:APOBEC-抗性yCD病毒载体在裸鼠的颅内人类异种移植物(T98G)中是治疗性的。

建立了使用高表达APOBEC的T98G人类神经胶质瘤细胞系的颅内异种移植模型,以测试RRV载体扩散和生物分布以及APOBEC-抗性RCR-载体介导的胞嘧啶脱氨酶自杀基因疗法在高APOBEC活性条件下在裸鼠宿主中的治疗功效。

适应环境后,将小鼠随机分配到9个治疗组之一(参见下文的组描述)。八组在第0天对每只小鼠进行1×105个T98G细胞的右纹状体颅内给药。第9组小鼠不植入肿瘤。在第5天,仅给小鼠注射9×105TU/5μl的配方缓冲液、9×105TU/5μl的T5.0002(表达yCD的APOBEC-敏感性RRV;组3)、或9x105TU/5μl、9x104TU/5μl或9x103TU/5μl的APOBEC-抗性RCR载体(T5.002A)。随机的5-FC给药以500mg/kg/天进行,作为单次IP注射给药,在第19天开始,或者一些组不给予5-FC(组1、4、8)。接受中等剂量载体的小鼠都接受5-FC(即该剂量没有单独的对照组)。5-FC每天给药连续7天,随后15天不进行治疗。重复药物加休息的循环直至4个循环。将除了组8之外的每组的10只小鼠随机分配到存活分析类别。根据预定的时间表处死剩余的小鼠。

组分配和剂量水平

通过注射到尾静脉进行静脉内给药。腹腔内给药通过注射到腹部进行,小心避开膀胱。对于颅内注射,用异氟烷麻醉小鼠,并将其放置在具有钝耳杆的立体定位装置中。剃光皮肤并使用必妥碘处理头皮以准备手术部位。将动物置于加热垫上,在无菌条件下使用解剖刀以穿过皮肤形成中线切口。皮肤的收缩和在切口部位的筋膜的反射将允许颅骨的可视化。将具有3mm突出部的导向套管与具有3.5mm突出部的帽配合,通过颅骨中的小钻孔插入,并用牙科粘固剂和三个小螺钉将其附着到颅骨上。在接合剂硬化之后,用缝合线缝合皮肤。投影的立体定位坐标为AP=0.5-1.0mm,ML=1.8-2.0mm,DV=3.0mm。在试点实验(2-3只动物)中,通过注射染料并确定其位置来确定动物群组的精确立体定位坐标。在麻醉恢复期间监测动物。在该手术结束之前皮下(SC)施用镇痛药丁丙诺啡,然后大约每12小时施用丁丙诺啡长达3天。每天监测动物。通过注射套管将细胞或载体颅内输注,其中通过导向套管插入3.5mm的突出物。用装有Hamilton注射器和柔性管的注射泵控制速率。对于细胞注射,以0.2微升每分钟的流速递送1微升细胞(总共5分钟)。对于载体注射,以0.33微升/分钟的流速递送5微升载体(总共15分钟)。

APOBEC-抗性载体被递送到小鼠并计算为每克脑重量的转化单位(TU)。使用这种计算,可以计算包括人类在内的其它哺乳动物的剂量的转化。APOBEC-抗性载体显示有效的剂量响应,而对APOBEC活性敏感的载体显示减弱的有效响应。在移植到异种移植物模型中的U87细胞系中进行了相同的实验,该细胞系用人类APOBEC3G或APOBEC3B的表达载体转染,其表达这些蛋白质的水平比U87天然水平高至少3倍。这些实验表明,设计为APOBEC-抗性的修饰密码子病毒在U87系中具有复制和/或治疗应答优势,其APOBEC水平比没有APOBEC抗性密码子修饰的原始RRV增加了。

实施例29:APOBEC-抗性yCD病毒载体在脑癌的同基因小鼠模型中是治疗性的。

进行了附加实验以在同基因动物模型中展示本公开的方法和组合物。

建立了在同基因BALB/c小鼠中使用稳定转染的CT26结直肠癌细胞系产生鼠APOBEC3的颅内植入物模型,以测试APOBEC-抗性RRV载体的扩散和生物分布以及RRV-载体介导的胞嘧啶脱氨酶自杀基因治疗的治疗效力及其免疫学影响。

本研究包括129只动物,0只雄性,119只雌性和10只偶发动物(10只雌性)。适应环境后,将小鼠随机分配到9个治疗组之一(参见下文的组描述)。八组在第0天对每只小鼠进行1×104APOBEC-表达CT26细胞的右纹状体颅内给药。第9组小鼠不植入肿瘤。在第4天,仅给小鼠注射配方缓冲液、9×105TU/5μl对APOBEC(T5.0002)仍然敏感的对照载体、或9×105TU/5μl、9×104TU/5μl或9×103TU/5μl的APOBEC-抗性载体(T5.0002A)。将未接受载体的小鼠,或接受9×105TU/5μl或9×103TU/5μl载体的小鼠随机接受5-FC(500mg/kg/BID),在第13天开始通过IP注射施用,或如所示的不施用5-FC(PBS)。接收中等剂量载体的小鼠接受5-FC(即该剂量没有单独的对照组)。5-FC每天给药连续7天,随后10天不进行治疗。重复药物加休息的循环直至4个循环。将除了组9之外的每组的10只小鼠随机分配到存活分析类别。根据预定的时间表处死剩余的小鼠。

将初始前哨小鼠与预定的处死动物共同饲养,并在相同时间点取下,以通过脱落评估载体的传输。

组分配和剂量水平

通过注射到尾静脉进行静脉内给药。腹腔内给药通过注射到腹部进行,小心避开膀胱。对于颅内给药,使用带有植入右侧纹状体的3.2mm突出物的引导套管的小鼠,并使用带有3.7mm突出物的帽。投影的立体定位坐标是AP=0.5-1.0mm,ML=1.8-2.0mm,DV=3.2mm(来自前囟)。通过注射套管将细胞或载体颅内输注,其中通过导向套管插入3.7mm突出物。用装有Hamilton注射器和柔性管的注射泵控制速率。

对于细胞注射,以0.2微升/分钟的流速递送1微升细胞(总共5分钟)。对于载体注射,以0.33微升/分钟的流速递送5微升载体(总共15分钟)。

将载体递送至小鼠并计算为每克脑重量的转化单位(TU)。使用这种计算,可以计算包括人类在内的其它哺乳动物的剂量的转化。该研究的结果表明,APOBEC-抗性病毒扩散到整个肿瘤,维持yCD完整性,并且当与APOBEC-敏感性RRV相比时,与5FC联合治疗肿瘤方面更有效。APOBEC-抗性RRV也不水平地扩散到初始的笼伴侣。

如上所述,RRV含有“2A盒”。例如,SEQ ID NO:2、43-53和54提供了含有2A盒的一般构建体。该盒可以用许多不同的盒替换。例如,可以制备下列盒并将其克隆到SEQ ID NO:2、43-53或54载体主链中的任何一个中,替换那些特定构建体中的盒。

使用本文提供的方法和序列,设计了如下许多载体:

pAC3-T2A-GFPm(SEQ ID NO:43)

pAC3-GSG-T2A-GFPm(SEQ ID NO:44)

pAC3-P2A-GFPm(SEQ ID NO:45)

pAC3-GSG-P2A-GFPm(SEQ ID NO:46)

pAC3-E2A-GFP(SEQ ID NO:47)

pAC3-GSG-E2A-GFPm(SEQ ID NO:48)

pAC3-F2A-GFPm(SEQ ID NO:49)

pAC3-GSG-F2A-GFPm(SEQ ID NO:50)

pAC3-T2A-yCD2(SEQ ID NO:51)

pAC3-GSG-T2A-yCD2(SEQ ID NO:52)

pAC3-P2A-yCD2(SEQ ID NO:53)

pAC3-GSG-P2A-yCD2(SEQ ID NO:54)

实施例30:缺少信号肽序列的scFv PD-L1的分泌可通过在N-末端插入异源信号肽来实现。

RRV-scFv-PDL1质粒DNA的构建。设计了两对针对PD-L1的两种不同构型的单链可变区片段(scFv)。一对由具有和不具有来自人类IgG1的Fc的scFv组成,分别命名为scFv-PDL1和scFvFc-PDL1。另一对由在C-末端掺入了HA和Flag表位的scFv-PDL1和ScFvFc-PDL1组成,命名为scFv-HF-PDL1和scFvFc-HF-PDL1。每种构型的编码序列含有病毒包膜基因的3'编码序列,随后是gT2A肽序列并且用Asc I和Not I限制性位点合成,用于亚克隆到pAC3-gT2A-yCD2中的相应位点上,以替换g2A-yCD2转基因盒,产生pAC3-scFv-PDL1、pAC3-scFvFc-PDL1、pAC3-scFv-HF-PDL1、pAC3-scFvFc-HF-PDL1。对于所有scFv-PDL1变体,在N-末端掺入来自人类IL-2的信号肽以允许分泌scFv PDL1。

表达并正确加工以RRV-2A构型编码的scFv PD-L1。如图3所示,可以通过不同于2A序列的方式,例如使用IRES序列或小启动子,表达具有异源信号肽的scFv PD-L1,并获得表达可分泌形式scFV PD-L1的载体。然而,我们在此描述了RRV构型,其利用病毒衍生的“自裂解”2A肽进行转基因表达,证明了RRV-2A构型可以耐受高达1.2kb的转基因插入。在本研究中,我们设计了两种不同构型针对PD-L1的单链可变片段(scFv)。一种由单独的scFv组成,且另一种由scFv与来自人类IgG1的Fc组成,分别命名为pAC3-scFvP DL1和pAC3-scFvFc-PDL1。由于不存在针对scFv PD-L1蛋白的抗体,我们产生了具有在转基因的C-末端掺入的HA和FLAG表位的构建体的匹配对,命名为pAC3-scFv-HF-PDL1和pAC3-scFvFc-HF-PDL1(图3)。

靶向不同细胞区室的转基因与RRV-2A构型的病毒包膜(Env)蛋白同框编码,有效地与Env-转基因多蛋白分离(Hofacre et al.,2018)。因为表位标记和未标记的scFv PD-L1和scFvFc PD-L1蛋白都被设计成与病毒Env蛋白分离并由细胞分泌,我们使用了瞬时转染系统以高度过表达所述转基因蛋白,以帮助检测表位标记的scFv PD-L1和scFvFc蛋白。在SDS-PAGE上解析瞬时转染的293T细胞的细胞裂解物,并用抗-HA和抗-Flag抗体检测,以分别确认scFv PD-L1的存在及其由2A肽介导的分离效率。此外,还包括抗-2A抗体以确认来自多蛋白的病毒Env蛋白的正确加工。图5显示,scFv-HF PD-L1和scFvFc-HF PD-L1都被检测到,并如预期的与多蛋白分离,并且如15E-2A的检测所示,病毒Env蛋白被正确加工成其亚基。检测到的残留未分离的多蛋白也是预期的,因为细胞裂解物来自瞬时转染系统,其中蛋白质高度过表达,且先前已显示,此类未分离的多蛋白未掺入病毒粒子中。此外,Western检测到细胞内表位标记的scFv PD-L1,表明该蛋白可能没有达到最大分泌。

由RRV-scFv-PDL1和RRV-scFvFc-PDL1感染的细胞分泌的scFv PD-L1和scFvFcPD-L1与PD-1竞争PD-L1结合。在确认RRV-scFv-PDL1和RRV-scFvFc-PDL1的转基因蛋白表达和病毒功能后,我们评价了scFv PD-L1和scFvFc PD-L1的结合特征。使用基于ELISA的竞争测定法评估了scFv PD-L1和scFvFc PD-L1蛋白阻断PD-1/PD-L1相互作用的效力,以定量在PD-1与scFv PD-L1或scFvFc PD-L1共温育之后保持与PD-L1结合的His-标记的PD-1的量。尽管上清液中scFv PD-L1和scFvFc PD-L1的浓度不明确,但它们以剂量依赖方式特异性结合人类PD-L1和小鼠PD-L1。使用100μL上清液的抑制水平与封闭抗体对照的抑制水平相当,在scFv PD-L1和scFvFc PD-L1之间没有显著差异(图6A)。scFv PD-L1和scFvFc PD-L1在阻断小鼠PD-1/PD-L1相互作用上的效力似乎是有效的,尽管比人类对应物的效力稍低,但比抗-小鼠PD-L1抗体对照更有效(图6B)。我们使用表面等离子体共振系统进一步评价了scFvPD-L1与人类和小鼠PD-L1的结合动力学。将scFv PD-L1 cDNA克隆到CMV-驱动的表达载体中,用于瞬时转染,随后纯化以获得>85%的纯度。scFv PD-L1对重组人类PD-L1和小鼠PD-L1的平衡解离常数(KD)分别确定为0.426nM和4.78nM,表J。由于较慢的Koff导致对人类PD-L1的结合亲和力高约10倍,这可解释在竞争性ELISA中观察到的scFv PD-L1阻断人类PD-1/PD-L1相互作用的较高效力,尽管事实上人类和小鼠PD-L1在其氨基酸序列中具有接近80%的同源性。

表J

实施例31:由RRV-scFv-PDL1感染的细胞分泌的scFv PD-L1表现出对细胞表面上PD-L1的旁观者反式结合活性。由于目前任何基于病毒的治疗方法(包括RRV)都无法在原位感染100%的患者肿瘤细胞,我们设计了具有结合邻近未感染细胞上的PD-L1能力的分泌的转基因产物。这里,我们采用基于细胞的测定法,通过流式细胞术确认scFv PD-L1或scFvFcPD-L1的抗原特异性结合。在该实验中,由于缺乏抗体来检测细胞表面上结合的scFv PD-L1和scFvFc PD-L1的存在,我们使用表位标记的scFv PD-L1和scFvFc PD-L1(scFv-HF PD-L1和scFvFcR-HF PD-L1),随后使用抗-HA抗体进行检测。这些数据显示,scFv-HF PD-L1和scFvFc-HF PD-L1结合在人类和小鼠细胞系中的细胞表面上表达的PD-L1,如用抗-HA抗体的平均荧光强度(MFI)的显著偏移所示。在测试的人类和小鼠细胞系中,用scFvFc-HF PD-L1观察到的MFI的更高偏移,可能是由于scFvFc-HF PD-L1的二价二聚体通过Fc区之间的二硫键形成而形成二聚体所导致的,因此仅反映了在细胞表面上更多的抗-HA抗体结合scFvFc-HF PD-L1,而不是增加的结合亲和力,因为在ELISA中scFvFc PD-L1没有比scFvPDL1更有效地竞争(图5)。此外,当与抗-HA抗体共温育时,通过阻断抗-PD-L1阻断抗体对细胞表面PD-L1的可及性,证明了抗原结合特异性,导致用抗-PD-L1抗体的MFI显著降低。与竞争性ELISA中观察到的数据一致,scFv-HF PD-L1和scFvFc-HF PD-L1特异性结合细胞表面上的PD-L1并阻断抗-PD-L1抗体结合PD-L1,表明scFv-HF PD-L1和scFvFc-HF PD-L1的表位与抗-PD-L1抗体的表位重叠或接近。此外,使用抗-PD-L1抗体的MFI的显著降低也表明细胞表面上的完全受体(PD-L1)占据。

为了评价RRV-scFv-PD-L1在体外的旁观者效应,我们测试了在肿瘤细胞上实现完全受体占据所需的最小转导水平。在该实验中,将用RRV-scFv-HF-PD-L1最大感染的EMT6小鼠乳腺癌细胞与用RRV-GFP最大感染的EMT6细胞以不同比例混合共培养,以使用抗-HA和抗-PD-L1抗体测量细胞表面上的结合scFv-HF PD-L1和未结合PD-L1。我们的数据显示,当仅5%的细胞表达scFv-HF PD-L1时,在所有细胞表面上都检测到了结合的scFv-HF PD-L1,图7A。PD-L1的完全占据与细胞表面上PD-L1信号的降低以剂量依赖性方式负相关(图7B),表明scFv PD-L1可以以最低水平的转导达到100%旁观者效应。

实施例32:scFv PD-L1和scFvFc PD-L1处理以剂量依赖性方式导致肿瘤生长抑制,并在同基因肿瘤模型中引发免疫记忆应答。我们已经证明,从低至5%的转导前细胞分泌的体外scFv PD-L1表现出旁观者反式结合活性,导致在表达非-scFv PD-L1表达细胞的细胞表面上完全的PD-L1占据。接着,我们评价了scFv PD-L1在同基因原位EMT6乳腺癌模型中抗肿瘤活性的剂量响应,已经报道该模型对检查点抑制剂有响应。为了评价scFv PD-L1和scFvFc PD-L1在更临床相关的情景下的抗肿瘤活性,我们试图使用不同比例的用RRV-scFv-PDL1、RRV-scFvFc-PDL1或RRV-GFP载体最大预转导的EMT6细胞,确定scFv PD-L1实现抗肿瘤活性所需的最小转导水平。这些细胞对由于受体下调所致的经由双嗜性包膜蛋白介导的进一步RRV感染具有抗性。在该实验中,以所示比例将用RRV-scFv-PDL1或RRV-GFP转导的EMT6肿瘤细胞的混合物,植入BALB/c小鼠的乳腺脂肪垫中。监测存活90天,并进行Kaplan-Meier存活分析以评价scFv PD-L1的抗肿瘤活性。按照动物使用协议,将携带坏死性肿瘤的小鼠进行安乐死,并检查分析结果(在图6A中用勾号表示;这些小鼠不被评分为死亡,并且不从图中排除)。将携带表达相同比例scFv PD-L1或scFvFc PD-L1的肿瘤的小鼠分组在一起用于存活分析。这些数据显示,与未处理的动物相比,携带具有2%、30%和100%scFv PD-L1或scFv Fc PD-L1表达肿瘤细胞的肿瘤的小鼠具有生存获益趋势,尽管在统计学上不显著(图8A)(0%scFv/scFvFc相对于抗-PD-1,p=0.2529;0%相对于2%,p=0.2529;0%相对于30%,p=0.0919;0%相对于100%,p=0.1674)。我们进一步试图研究从原发性肿瘤存活下来的小鼠是否通过在胁腹上的初始EM T6肿瘤细胞重新挑战它们而建立了抗肿瘤免疫记忆应答。图8B显示,在初次设置中用scFv/scFvFc治疗清除肿瘤的小鼠在重新挑战设置中表现出中度延迟的肿瘤生长,表明在这些小鼠中建立了抗肿瘤免疫应答。总之,数据表明,表达scFv PD-L1或scFvFc PD-L1的肿瘤细胞可导致抗肿瘤活性,其似乎优于用商业抗体的治疗。

在B6C3F1小鼠中测试Tu-2449SC肿瘤模型,以确定scFv PD-L1发挥抗肿瘤活性所需的最小转导水平。图8C显示,在Tu-2449SC肿瘤模型中,携带具有低至2%的表达scFv PD-L1的Tu-2449SC细胞的肿瘤的小鼠导致与抗-PD-1抗体治疗相当的肿瘤进展延迟,并且当与对照小鼠相比时,显示朝向优势的强烈趋势(图8C)。使用30%预转导的细胞,如在具有100%预转导的细胞的肿瘤的小鼠中也看到的,肿瘤进展被完全抑制。

实施例33:颅内注射RRV-scFv-PDL1延长同源原位胶质瘤模型的存活。

在先前报道的对Toca 511和Toca FC治疗有响应的原位同源神经胶质瘤模型中研究了scFv PD-L1抗肿瘤活性。采用了先前建立的肿瘤内RRV递送方法(Ostertag et al.,2012)。在体外确认了最大感染的Tu-2449细胞中RRV-scF v-PDL1病毒功能和基因组稳定性。在该实验中,在肿瘤植入后4天,通过单次肿瘤内注射递送两种不同剂量的RRV-scFv-PDL1(1E5和1E6 TU)。数据显示,单次施用1E6 TU的RRV-scFv-PDL1与用RRV-scFv-PDL1最大预转导的TU-2449细胞同等有效,其被包括作为对照和作为比较物(图9A)。与在先前实验中进行的观察一致,在离原发性肿瘤的远处部位皮下重新挑战Tu-2449SC肿瘤细胞显示出全身性抗肿瘤免疫应答,导致与初始小鼠相比肿瘤生长显著延迟(图9B)。总之,这些发现表明,scFv PD-L1在神经胶质瘤肿瘤模型中具有抗肿瘤活性,并代表响应作为单一疗法检查点抑制剂的第二神经胶质瘤小鼠模型。

实施例34:用来自胱抑素S的信号肽和人工信号肽AP1置换RRV-scFv-PDL1中编码的scFvPD-L1中的IL-2信号肽,增加了scFv PD-L1蛋白质的体外分泌,并且在多种鼠肿瘤模型中增强了旁观者效应和肿瘤活性。

为了进一步增加可以导致增强的抗肿瘤功效的scFv PD-L1的旁观者效应,用来自胱抑素S的信号肽和预测具有高水平分泌的人工信号肽(来自表B的ASP1)代替IL-2信号肽。体外旁观者实验揭示,表达携带来自胱抑素S(RRV-CSscFv-PDL1)和ASP1(RRV-AP1scFv-PDL1)的信号肽的表位标记的scFv PD-L1的受感染细胞,在相邻旁观者细胞上显示出对PD-L1的较高的反式结合活性。尽管需要5-10%的RRV-scFv-PDL1细胞来饱和旁观者细胞上的所有细胞表面PD-L1,但仅需要2-4%的RRV-CSscFv-PDL1感染的或RRV-AP1scFv-PDL1感染的细胞以达到旁观者细胞上完全的PD-L1受体占据。

将具有2%预转导肿瘤的Tu2449SC肿瘤模型用于比较用RRV-scFv-PD-L1、RRV-CSscFv-PD-L1和RRV-AP1scFv-PD-L1感染的肿瘤之间的抗肿瘤活性。由于2%转导水平先前已经显示不如用RRV-scFv-PD-L1感染的30%预转导肿瘤有效,我们预期在体外用RRV-CSscFv-PD-L1和RRV-AP1scFv-PD-L1观察到的更大的旁观者效应将在2%预转导设置中显示更大的抗肿瘤活性。我们的数据揭示,由RRV-CSscFv-PD-L1和RRV-AP1scFv-PD-L1感染的肿瘤产生的scFv PD-L1的抗肿瘤效应显著高于由RRV-scFv-PDL1产生的scFv PD-L1。我们的数据支持这样的注释,即信号肽的选择也可以调节蛋白分泌水平,导致增强的抗肿瘤活性。

实施例35:在源自支架蛋白的抗原特异性结合剂(ASB)的N-末端掺入有效的信号肽也可通过RRV表达。

RRV-ASB-PDL1质粒DNA的构建。针对PD-L1设计了一对相同构型的ASB。一个由ASB组成,另一个具有在C-末端掺入的HA和FLAG表位,命名为ASB-HF-PDL1和ASB-HF-PDL1。每种构型的编码序列含有病毒包膜基因的3'编码序列,其后是gT2A肽序列,并且用Asc I和NotI限制性位点合成,用于亚克隆到pAC3-gT2A-yCD2中的相应位点上以替换g 2A-yCD2转基因盒,产生pAC3-ASB-PDL1和pAC3-ASB-HF-PDL1。对于所有ASB-PDL1变体,在N-末端掺入来自人类IL-2的信号肽以允许分泌ASB PD-L1或ASB-HF PD-L1。

体外旁观者实验显示,表达表位标记的ASB PD-L1的感染细胞表现出对相邻旁观者细胞上PD-L1的反式结合活性,这与scFv PD-L1相当,其中需要5%RRV-scFv-PDL1感染细胞或5%RRV-ABS-PdL1感染细胞来饱和旁观者细胞上所有的细胞表面PD-L1。

随后,在同基因Tu2449SC皮下模型中,平行于scFv PD-L1,评价ASB PD-L1的抗肿瘤活性的剂量响应。体内数据表明,ASB PD-L1具有抗肿瘤活性。携带具有低至2%表达ASBPD-L1的Tu-2449SC细胞的肿瘤的小鼠导致肿瘤进展的延迟,其与表达scFv PD-L1或抗-PD-1抗体处理的2%Tu-2449SC细胞相当,但与对照小鼠相比不具有统计学显著性。使用30%预转导细胞,肿瘤进展被完全抑制,如在携带具有100%预转导细胞的肿瘤的小鼠中也看到的。

实施例36:颅内注射RRV-scFv-PDL1-yCD2延长同基因原位神经胶质瘤模型的存活。研究了scFv PD-L1抗肿瘤活性与yCD2和5FC的组合,以评价它们在原位同基因神经胶质瘤模型中的协同作用。设计了具有由人类IL-2信号肽、与gP2A-yCD2连接的scFv-PDL1组成的盒的双载体。合成该片段并克隆到RRV-gT2A主链的AscI和NotI位点。将得到的载体命名为pAC3-scFv-PDL1-yCD2。体外表征数据显示,scFv PDL1和yCD2蛋白由RRV-scFv-PDL1-yCD2感染的细胞表达,并保留了其生物学功能(即scFv PD-L1结合PD-L1,且yCD2将5-FC转化为5-FU)。产生纯化的RRV-scFv-PDL1和RRV-scFv-PDL1-yCD2载体用于体内研究。在此实验中,在肿瘤植入后4天,通过单次瘤内注射递送1E5 TU作为单一疗法的显示次优抗肿瘤活性的RRV-scFv-PDL1(图9A)和1E5TU的RRVscFvPDL1-yCD2。10天允许scFv PD-L1的病毒传播和抗肿瘤活性后,然后用PBS或5-FC(500mg/kg)IP治疗小鼠每天一次,7天治疗和7天不治疗。我们的数据显示,单次施用1E5 TU的用5-FC处理的RRV-scFv-PDL-yCD2优于用PBS处理的RRV-scFv-PDL1和RRV-scFv-PDL-yCD2。与先述实验中所观察到的一致,在远离原发性肿瘤的位点皮下重新挑战Tu-2449SC肿瘤细胞显示出全身性抗肿瘤免疫应答,导致与初始小鼠相比肿瘤生长显著延迟。一些重新挑战的小鼠长达90天无肿瘤。这些数据表明,在神经胶质瘤肿瘤模型中,scFv PD-L1和yCD2/5FC的联合疗法比scFv PD-L1单一疗法具有更好的抗肿瘤活性。

实施例37:由293T细胞产生的RRV-g T2A-Affimer-SQT具有感染性,并表达可分泌形式的Affimer-SQT蛋白。

Affimer的SQT变体的编码区获自Stadler et al.(Protein Engineering,Designand Selection,24(9)751-763,2011)。为了检测Affimer-SQT蛋白表达,在Affimer-SQT的N-末端(信号肽之前)、L1和L2处分别插入HA、AU1和Myc表位。将来自人类IL-2的信号肽置于Affimer-SQT编码区的N-末端。合成DNA片段并克隆到RRV gT2A主链中的AscI和Not I位点。将得到的构建体命名为pAC3-gT2A-Affimer-SQT。

在转染前一天,以每10cm板2e6个细胞接种HEK293T细胞。第二天,使用20μg质粒DNA进行磷酸钙转染。转染后十八小时,用DMEM洗涤细胞两次,并用完全培养基更换。在培养基更换后约24小时,收集病毒上清液,并通过0.45μm注射器过滤器过滤。如先前所述的,确定RRV-g T2A-Affimer-SQT的病毒滴度(Perez et al.,2012)。表K表明,由HEK293T细胞产生的RRV-g T2A-Affimer-SQT的滴度与RRV-GFP的相当。

pAC3-gT2A-Affimer-SQT中编码的Affimer-SQT蛋白被设计为分泌到上清液中。由于上清液中存在Affimer-SQT蛋白量的不确定性,通过使用抗-HA抗体(Sigma Cat#H6908,1:1000)直接免疫印迹15μL上清液,或通过在4℃下将1mL上清液与10μg抗-myc抗体(AbcamCat#ab206486)温育16 18小时进行免疫沉淀后用抗-HA抗体和HPR-缀合的第二抗体进行免疫印迹,进行上清液中Affimer-SQT蛋白的检测。图10显示,Affimer SQT在上清液中大量表达,预期分子量为~15kDa。

表K:由瞬时转染的293T细胞产生的RRV-gT2A-Affimer-SQT的滴度。

TU/mL
RRV-GFP 3.36E+6
RRV-gT2A-Affimer-SQT 3.70E+6

实施例38:由293T细胞产生的RRV-gT2A-Hck和RRV-IRES-Hck具有感染性,并表达Hck蛋白。

Hck的编码区从专利WO2017009533A1中获得。为了检测Hck蛋白表达,将Flag和His表位标签插入Hck的C-末端,并将衍生自人类IL-2的信号肽置于Hck编码区的N-末端。合成具有AscI和Not I位点的DNA片段并克隆到RRV-gT2A主链中的AscI和Not I位点,合成具有PsiI和Not I位点的DNA片段并克隆到RRV-IRES主链中的PsiI和Not I位点,得到分别命名为pAC3-gT2A-Hck和pAC3-IRES-Hck的构建体。

如所述的,在HEK293T细胞中产生RRV病毒上清液和Hck蛋白。表L显示,由HEK293T细胞产生的RRV-gT2A-Hck的滴度与RRV-GFP的相当。

表L:由瞬时转染的293T细胞产生的RRV-gT2A-Hck和RRV-IRES-Hck的滴度。

TU/mL
RRV-GFP 3.36E+6
RRV-gT2A-Hck 6.07E+6
RRV-IRES-Hck 2.00E+6

pAC3-gT2A-Hck中编码的Hck蛋白被设计为分泌到上清液中。检测上清液中的Hck蛋白通过使用抗-Flag M2抗体(Sigma Cat#F1804,1:1000)和HPR-缀合的第二抗体对15μL上清液进行直接免疫印迹来进行。图11显示,Hck蛋白在上清液中大量表达,预期分子量为~7kDa。

实施例39:由293T细胞产生的RRV-gT2A-抗运载蛋白具有感染性,并表达抗运载蛋白蛋白质。

抗运载蛋白-Lcn2的编码区获自Gebauer et al.,2013(JMB 425(4)780-802)。为了检测抗运载蛋白-Lcn2蛋白表达,将Flag和His表位标签插入抗运载蛋白-Lcn2的C-末端,并将源自人类IL-2的信号肽置于抗运载蛋白-Lcn2编码区的N-末端。合成DNA片段并克隆到RRV-gT2A主链中的AscI和Not I位点。将得到的构建体命名为pAC3-gT2A-抗运载蛋白-Lcn2。

pAC3-gT2A-抗运载蛋白-Lcn2中编码的抗运载蛋白-Lcn2蛋白被设计为分泌到上清液中。上清液中的抗运载蛋白-Lcn2蛋白的检测通过使用抗-Flag M2抗体(Sigma Cat#F1804,1:1000)和HPR缀合的第二抗体对15μL上清液进行直接免疫印迹来进行。数据显示,抗运载蛋白-Lcn2蛋白上清液中大量表达,预期分子量为~20kDa。

实施例40:主链构架氨基酸残基和参与抗原结合的表面暴露的氨基酸残基以及寡聚化结构域中的氨基酸残基可以被优化以变成Apobec-抗性的。

支架蛋白的一个重要方面是维持支架的整体完整性或结构。为了避免在病毒感染期间可导致编码无义/终止密码子(核酸TGA、TAA和TAG)的Apobec3介导的突变,通过用其它19种氨基酸替换支架主链框架和/或参与抗原结合的表面暴露的氨基酸中存在的选择性或所有色氨酸残基,以避免由Apobec3介导的无义/终止密码子超突变,从而引入使治疗性转基因编码序列Apobec3-抗性的核酸取代。

衍生自Lcn2的抗运载蛋白(Gebauer et al.,2012 J Mol Biol 425(4):780-802)含有两个色氨酸残基:一个存在于β-链A中,另一个存在于β-链D中。此外,ED-B结合剂抗运载蛋白N7A在β-链D和环3/β-链F中含有3个附加的色氨酸残基。使用计算算法(Parthibanet al.,BMC Sturctural Biology 2007 7:54;Bywate,PLoS 2016 11(3):e150769),并且生成用于所选色氨酸残基的19种氨基酸的组合诱变文库(Yáňez et al.,Nucleic AcidsReseasrch 32(20)e158,2004),以评价和测试其表达、抗原结合亲和力。我们的数据显示,存在于抗运载蛋白N7A的主链构架和抗原结合环中涉及结构完整性的色氨酸残基可被保守氨基酸残基(如酪氨酸和苯丙氨酸)置换。当在RRV-gT2A主链中编码时,Apobec-抗性N7A变体显示出与亲本N7A蛋白相当的蛋白表达水平。最重要的是,当通过远紫外圆二色性光谱分析时,在293F细胞中由pcDNA3.1载体表达的纯化的Apobec-抗性N7A蛋白显示出相当的二级结构,并且通过SPR-基生物传感器分析显示出与EB-D相似的结合亲和力。

在Hck蛋白中也证明了在支架框架中用酪氨酸或苯丙氨酸替换色氨酸的耐受性,其中邻近src-环存在的两个连续色氨酸残基可以替换为两个苯丙氨酸(FF)、两个酪氨酸(YY)、酪氨酸-苯丙氨酸(YF)或苯丙氨酸-酪氨酸(FY),而不损害其表达。此外,我们还表明,I型脱碘酶二聚化基序中的色氨酸残基可以被苯丙氨酸和酪氨酸取代而不损害其二聚化功能。

实施例41:使用人类IgG的Fc区,可以在RRV-gT2A主链中以同源二聚体形式表达表位标记的Affimer-SQT。

为了表达Affimer-SQT的同源二聚体,除了在N-末端掺入人类IL-2信号肽之外,将Affimer-SQT的编码序列与(G4S)3甘氨酸-丝氨酸接头连接,随后与IgG4 Fc区连接。编码这种类型的非-IG结合蛋白的载体的设计连同包含编码允许形成多聚体的结合蛋白的基因的其它类型的修饰一起,或多重结合特异性以形成双特异性抗体或抗体样双特异性或三特异性分子的其它类型的修饰一起,显示于图12中。将合成的片段克隆到RRV gT2A主链中的AscI位点和NotI位点。将得到的一种构建体命名为pAC3-gT2A-Affimer-SQT-Fc。数据显示,在非还原条件下,使用抗人IgG4 Fc抗体检测到二聚体形式Affimer-SQT,预期分子大小为~50kDa。

实施例42:可以使用二聚化结构域以同源二聚体形式表达表位标记的Affimer-SQT。

为了表达Affimer-SQT的同源二聚体,除了在Affimer-SQT的N-末端掺入人类IL-2信号肽和在Affimer-SQT的C-末端掺入表位标签外,将在N-和C-末端均与GGGG甘氨酸接头连接的I型脱碘酶的二聚化结构域(表6)置于信号肽的下游,随后是Affimer-SQT。在另一种构型中,将人类IL-2信号肽和表位标签置于Affimer-SQT的N-末端,并且将在N-和C-末端均与GGGG甘氨酸接头连接的二聚化结构域置于Affimer-SQT的C-末端。将合成的片段克隆到RRVgT2A主链中的AscI位点和Not I位点。将得到的构建体分别命名为pAC3-gT2A-2Affimer-SQT和pAC3-gT2A-Affimer-SQT2。

蛋白质表达数据显示,在非还原条件下,检测到超过85%的2 Affimer SQT和Affimer SQT2蛋白质为二聚体形式,预期分子大小为~32kDa。

实施例43:可使用三聚结构域以同源三聚形式表达表位标记的Affimer-SQT。

为了表达Affimer-SQT的同源三聚体,除了在Affimer-SQT的N-末端掺入人类IL-2信号肽和在Affimer-SQT的C-末端掺入表位标签外,将在N-和C-末端都具有GGGG甘氨酸接头的冠蛋白1a的三聚化结构域(表6)置于信号肽的下游,随后置于Affimer-SQT。在另一种构型中,将人类IL-2信号肽和表位标签置于Affimer-SQT的N-末端,并且将在N-和C-末端与GGGG甘氨酸-接头连接的三聚化结构域置于Affimer-SQT的C-末端。将合成的片段克隆到RRV gT2A主链中的AscI位点和Not I位点。将得到的构建体分别命名为pAC3-gT2A-3Affimer-SQT和pAC3-gT2A-Affimer-SQT3。

蛋白质表达数据表明,在非还原条件下,检测到超过85%的3 Affimer SQT和Affimer SQT3蛋白质为三聚体形式,预期分子大小为~56kDa。

实施例44:使用四聚化结构域,可以以同源四聚体形式表达表位标记的Affimer-SQT。

为了表达Affimer-SQT的同源四聚体形式,除了在Affimer-SQT的N-末端掺入人类IL-2信号肽和在Affimer-SQT的C-末端掺入表位标签外,将在N-和C-末端均与GGGG甘氨酸接头连接的软骨基质蛋白(CMP)CMP(R27Q)四聚化结构域(表6)置于信号肽的下游,随后是Affimre-SQT。在另一种构型中,将人类IL-2信号肽和表位标签置于Affimer-SQT的N-末端,并且将在N-和C-末端均与GGGG甘氨酸-接头连接的四聚化结构域置于Affimer-SQT的C-末端。将合成的片段克隆到RRV gT2A主链中的AscI位点和Not I位点。将得到的构建体分别命名为pAC3-gT2A-4Affimer-SQT和pAC3-gT2A-Affimer-SQT4。

蛋白质表达数据显示,在非还原条件下,检测到超过85%的4Affimer SQT和Affimer SQT4蛋白质为四聚体形式,预期分子大小为~56kDa。

实施例45:使用五聚化结构域,可以以同源五聚化形式表达表位标记的Affimer-SQT。

为了表达Affimer-SQT的同源五聚体,除了在Affimer-SQT的N-末端掺入人类IL-2信号肽和在Affimer-SQT的C-末端掺入表位标签外,将在N-和C-末端上与GGGG甘氨酸接头连接的软骨寡聚基质蛋白(COM P)五聚化结构域(表6)置于信号肽的下游,随后是Affimer-SQT。在另一种构型中,将人类IL-2信号肽和表位标签置于Affimer-SQT的N-末端并且将在N-和C-末端均与GGGG甘氨酸-接头连接的五聚化结构域置于Affimer-SQT的C-末端。将合成的片段克隆到RRV gT2A主链中的AscI位点和Not I位点。将得到的构建体分别命名为pAC3-gT2A-5Affimer-SQT和pAC3-gT2A-Affimer-SQT5。

蛋白质表达数据显示,在非还原条件下,检测到超过85%的5Affimer SQT和Affimer SQT5蛋白质为四聚体形式,预期分子大小为~100kDa。

实施例46:使用来源于IgM的六聚化结构域,可以以同源六聚体形式表达表位标记的Affimer-SQT。

为了表达Affimer-SQT的同源六聚体,除了在Affimer-SQT的N-末端掺入人类IL-2信号肽和在Affimer-SQT的C-末端掺入表位标签之外,将在N-和C-末端均与GGGG甘氨酸接头连接的人类IgM Cμ4tp六聚化结构域(表4)置于信号肽的下游,随后是Affimer-SQT。在另一种构型中,将人类IL-2信号肽和表位标签置于Affimer-SQT的N-末端,并且将在N-和C-末端均与GGGG甘氨酸-接头连接的六聚化结构域置于Affimer-SQT的C-末端。将合成的片段克隆到RRV gT2A主链中的AscI位点和Not I位点。将得到的构建体分别命名为pAC3-gT2A-6Affimer-SQT和pAC3-gT2A-Affimer-SQT6。

蛋白质表达数据显示,在非还原条件下,检测到超过95%的6Affimer SQT和Affimer SQT6蛋白质为四聚体形式,预期分子大小为~175kDa。

实施例47:使用(G4)3甘氨酸-丝氨酸接头4S,可在RRV gT2A主链中以异二聚体形式表达表位标记的Affimer-SQT和Hck。

为了表达异二聚化的Affimer-SQT和Hck,将Affimer-SQT和Hck的编码序列以两种可能的构型(Affimer-SQT-g-Hck和Hck-g-Affimer-SQT)用(GGGGS)3甘氨酸-丝氨酸接头连接,其中在“融合”蛋白的N-末端掺入人类IL-2信号肽并且在C-末端掺入表位标签。将合成的片段克隆到RRV gT2A主链中的AscI位点和Not I位点。将得到的构建体分别命名为pAC3-gT2A-Affimer-SQT-g-Hck和pAC3-gT2A-Hck-g-Affimer-SQT。

蛋白质表达数据显示,检测到异二聚形式的Affimer-SQT-g-Hck和Hck-g-Affimer-SQT,预期分子大小为~23kDa。

实施例48:使用(G4S)3甘氨酸-丝氨酸接头,可在RRV gT2A主链中以异二聚体形式表达表位标记的Affimer-SQT和抗运载蛋白。

为了表达异二聚化的Affimer-SQT和抗运载蛋白,将Affimer-SQT和抗运载蛋白的编码序列以两种可能的构型(Affimer-SQT-g-抗运载蛋白和抗运载蛋白-g-Affimer-SQT)用(GGGGS)3甘氨酸-丝氨酸接头连接,其中在“融合”蛋白的N-末端掺入人类IL-2信号肽并在C-末端掺入表位标签。将合成的片段克隆到RRV gT2A主链中的AscI位点和Not I位点。所得构建体分别命名为pAC3-gT2A-Affimer-SQT-g-抗运载蛋白和pAC3-gT2A-抗运载蛋白-g-Affimer-SQT。

蛋白质表达数据显示,检测到异二聚形式的Affimer-SQT-g-抗运载蛋白和抗运载蛋白-g-Affimer-SQT,预期分子大小为~36kDa。

实施例49:使用(G4S)3甘氨酸-丝氨酸接头,可在RRV gT2A主链中以异二聚体形式表达表位标记的抗运载蛋白和Hck。

为了表达异二聚化的Hck和抗运载蛋白,将Hck和抗运载蛋白的编码序列以两种可能的构型(Hck-g-抗运载蛋白和抗运载蛋白-g-Hck)用(GGGGS)3甘氨酸-丝氨酸接头连接,其中在“融合”蛋白的N-末端掺入人类IL-2信号肽并在C-末端掺入表位标签。将合成的片段克隆到RRV gT2A主链中的AscI位点和Not I位点。所得构建体分别命名为pAC3-gT2A-Hck-g-抗运载蛋白和pAC3-gT2A-抗运载蛋白-g-Hck。

蛋白表达数据显示,检测到异二聚形式的Hck-g-抗运载蛋白和抗运载蛋白-g-Hck,预期分子大小为~28kDa。

实施例50:使用(G4S)3甘氨酸-丝氨酸接头,可在RRV gT2A主链中以异三聚体形式表达表位标记的Affimer-SQT、Hck和抗运载蛋白。

为了表达异三聚化的AFfimer-SQT、Hck和抗运载蛋白,将Affimer-SQT、Hck和抗运载蛋白的编码序列用(GGGGS)3甘氨酸-丝氨酸接头连接,在“融合”蛋白的N-末端掺入人类IL-2信号肽并且在C-末端掺入表位标签。合成了具有六种可能组合的片段(Hck-g-Affimer-SQT-g-抗运载蛋白、Hck-g-抗运载蛋白-g-Affimer-SQT、Affimer-SQT-g-Hck-g-抗运载蛋白、Affimer-SQT-g-抗运载蛋白-g-Hck、抗运载蛋白-g-Hck-g-Affimer-SQT和抗运载蛋白-g-Affimer-SQT-g-Hck),并克隆到RRV gT2A主链中的AscI和Not I位点。将得到的构建体分别命名为pAC3-gT2A-Hck-g-Affimer-SQT-g-抗运载蛋白和pAC3-gT2A-Hck-g-抗运载蛋白-g-Affimer-SQT、pAC3-gT2A-Affimer-SQT-g-Hck-g-抗运载蛋白、pAC3-gT2A-Affimer-SQT-g-抗运载蛋白-g-Hck、pAC3-gT2A-抗运载蛋白-g-Hck-g-Affimer-SQT以及pAC3-gT2A-抗运载蛋白-g-Affimer-SQT-g-Hck。

蛋白表达数据显示,检测到异三聚形式的Hck-g-Affimer-SQT-g-抗运载蛋白、Hck-g-抗运载蛋白-g-Affimer-SQT、Affimer-SQT-g-Hck-g-抗运载蛋白、Affimer-SQT-g-抗运载蛋白-g-Hck、抗运载蛋白-g-Hck-g-Affimer-SQT和抗运载蛋白-g-Affimer-SQT-g-Hck,预期分子大小为~43kDa。

实施例51:由293T细胞产生的RRV-S1-抗运载蛋白具有感染性,并表达由核心启动子介导的抗运载蛋白蛋白质。

抗运载蛋白-Lcn2的编码区获自Gebauer et al.,2013(JMB 425(4)780-802)。为了检测抗运载蛋白-Lcn2蛋白表达,将Flag和His表位标签插入抗运载蛋白-Lcn2的C-末端,并将源自人类IL-2的信号肽置于抗运载蛋白-Lcn2编码区的N-末端和核心启动子的下游。这些核心启动子(但不限于)基于腺病毒主要晚期(AdML)和巨细胞病毒(CMV)主要立即早期基因,和合成的“超级核心启动子”SCP1(也参见美国专利公开No.2015/0273029A1,其公开内容通过引用整体并入本文)。合成含有核心启动子AdML-抗运载蛋白-Lcn2、CMV-抗运载蛋白-Lcn2和SCP1-抗运载蛋白-Lcn2的DNA片段,并克隆到pAC3-衍生的RRV主链中,得到分别命名为pAC3-A1-抗运载蛋白-Lcn2、pAC3-C1-抗运载蛋白-Lcn2和pAC3-S1-抗运载蛋白-Lcn2的构建体。

pAC3-A1-抗运载蛋白-Lcn2、pAC3-C1-抗运载蛋白-Lcn2和pAC3-S1-抗运载蛋白-Lcn2中编码的抗运载蛋白-Lcn2蛋白被设计分泌到上清液中。上清液中的抗运载蛋白-Lcn2蛋白的检测通过使用抗-Flag M2抗体(Sigma Cat#F1804,1:1000)和HPR-缀合的第二抗体对15μL上清液进行直接免疫印迹来进行。我们的数据显示,抗运载蛋白-Lcn2蛋白在上清液中大量表达,预期分子量为~20kDa。

实施例52:与RRV-GSG-T2A-yCD2相比,RRV-GSG-T2A-syCD2(分泌的经修饰的酵母胞质蛋白脱氨酶)感染的Tu2449-MG细胞显示延迟的5FU细胞毒性,但具有更大的旁观者效应。

产生pAC3-IRES-syCD2和pAC3-GSG-T2A-syCD2以表达分泌的yCD2(syCD2)。先前已经研究了在非复制型腺病毒载体中由细菌分泌的胞嘧啶脱氨酶(Rehemtulla etal.antixcan Res.,23:1393-1400 2004),因为担心采用非分泌形式,在发生大量旁观者杀伤之前,转导的细胞被局部产生的5-FU杀死。Rehemtulla与本文所述的研究之间存在若干显著差异。这些包括:1)Rehemtulla正在研究细菌胞嘧啶脱氨酶(bCD),与野生型酵母胞嘧啶相比,其具有低20倍的对5-FC的亲和力(Kievet et al.Can Res.59:1417-1421 1999);动物模型数据显示,与酵母来源的yCD2相比,分泌的和胞质bCD的肿瘤抑制效率低下(Rhemtulla et al.;Ostertag et al NeuroOnc 2012);Rehemtulate使用的载体是非复制型的,这与RRV编码的yCD2不同,后者在细胞间传播。因此,对细胞杀伤和旁观者效应的影响更复杂,并且不能从Rehemulla的bCD数据预测yCD。

设计IRES-scyCD2和GSG-T2A-syCD2盒,以便对于pAC3-IRES-syCD2,将来源于人类IL-2的SSP同框置于yCD2的N-末端,或者对于pAC3-GSG-T2A-syCD2,将其置于GSG-T2A和yCD2之间。用pAC3-IRES-syCD2的PsiI和Not I位点以及pAC3-GSG-T2A-syCD2的AscI和NotI位点化学合成(Genewiz)盒,并克隆到pAC3中分别作为pAC3-IRES-syCD2和pAC3-GSG-T2A-yCD2主链,以替换yCD2。使用抗-yCD2抗体,从转染的HEK293T细胞收集的细胞裂解物和上清液中评价syCD2蛋白表达。与源自IRES-yCD2和GSG-T2A-yCD2的yCD2的细胞内表达相反,结果证明,在IRES-syCD2和GSG-T2A-syCD2中包含人类IL2SSP导致在上清液中检测到syCD2的强表达,而在细胞裂解物中检测到较低或未检测到。如在免疫印迹测定中最小输入10μL上清液所示,两种构建体中syCD2的分泌是有效的。此外,与其亲本构建体(pAC3-IRES-yCD2和pAC3-GSG-T2A-yCD2)相比,细胞外形式的syCD2大小相似。此外,从瞬时转染的HEK293T细胞收集的RRV-IRES-syCD2和RRV-GSG-T2A-syCD2的病毒上清液显示的滴度值为0.5-5E6 TU/mL,并且分别与RRV-IRES-syCD2(1.5E6 TU/mL)和RRV-GSG-T2A-yCD2(2E6 TU/mL)的相当。

将用Tu2449/RRV-IRES-syCD2和Tu2449/RRV-GSG-T2A-syCD2最大感染的Tu2449细胞中的胞外5-FU浓度分别与Tu24449/RRV-IRES-yCD2和Tu2449/RRV-GSG-T2A-yCD2进行比较。数据表明,在与过量5-FC反应1小时后,在培养基中,在添加5-FC后存在于来自Tu2449/RRV-IRES-syCD2和Tu2449/RRV-GSG-T2A-syCD2细胞上清液中的5-FU浓度随细胞生长时间而增加,并从最初的细胞接种到第2-6天达到最大水平。存在于Tu2449/RRV-IRES-syCD2和Tu2449/RRV-GSG-T2A-syCD2的上清液中的5-FU浓度比Tu2449/RRV-IRES-yCD2和Tu2449/RRV-GSG-T2A-yCD2的上清液中的5-FU浓度高出4-log量级。随后,通过产生以3/97、15/85和30/70比率的RRV-IRES-yCD2/RRV-IRES-GFP和RRV-IRES-syCD2/RRV-IRES-GFP、RRV-GSG-T2A-yCD2/RRV-GSG-T2A-GFP以及RRV-GSG-T2A-syCD2/RRV-GSG-T2A-GFP感染的RRV-转导的Tu2449细胞的匹配对,并用5-FC处理培养物,在组织培养物中评价5FU旁观者效应的有效性。在这些实验中,GFP载体感染的细胞被阻断免于进一步感染,因此没有CD编码载体的进一步病毒传播发生。在3/97和15/85设定比率下的体外细胞杀伤数据表明,RRV-IRES-syCD2和RRV-GSG-T2A-syCD2均具有比RRV-IRES-yCD2和RRV-GSG-T2A-yCD2更多的旁观者-介导的细胞毒性效应。分别与RRV-IRES-yCD2以及RRV-GSG-T2A-yCD2相比,IRES-syCD2和RRV-GSG-T2A-syCD2显示更有效的细胞杀伤。

实施例53:用RRV-GSG-T2A-syCD2或RRV-IRES-syCD2治疗的小鼠皮下同基因神经胶质瘤肿瘤显示出延迟的肿瘤生长,分别与RRV-GSG-T2A-yCD2或RRV-GSG-T2A-yCD2的相当。

为了测试由感染的肿瘤细胞分泌的syCD2是否导致体内提高的抗肿瘤应答,使用Tu2449细胞在B6C3F1小鼠中建立同基因原位神经胶质瘤模型。如前所述,产生以3/97、15/85和30/70比率的RRV-IRES-yCD2/RRV-IRES-GFP以及RRV-IRES-syCD2/RRV-IRES-GFP、RRV-GSG-T2A-yCD2/RRV-GSG-T2A-GFP和RRV-GSG-T2A-syCD2/RRV-GSG-T2A-GFP感染的RRV-转导的Tu2449细胞的匹配对。在RRV-IRES-yCD2/RRV-IRES-GFP、RRV-IRES-syCD2/RRV-IRES-GFP、RRV-GSG-T2A-yCD2/RRV-GSG-T2A-GFP和RRV-GSG-T2A-syCD2/RRV-GSG-T2A-GFP的各亚组内观察到与没有5-FC处理的动物相比,剂量依赖性存活益处。然而,当在3/97和15/85以及30/70比率下比较RRV-IRES-yCD2和RRV-IRES-syCD2组之间以及RRV-GSG-T2A-yCD2和RRV-GSG-T2A-syCD2组之间在90天期间的存活数据时,数据表明,在两种情况下,携带用syCD2变体转导的肿瘤的小鼠比携带用yCD2版本转导的肿瘤的小鼠具有显著更高的存活益处。这在较低比率的syCD感染细胞时被更清楚地看到。我们的数据表明,分泌的前药活化酶的表达是有利的。这可能是由于多个因素引起的,包括:避免立即高浓度的胞内5-FC导致产生病毒的细胞的早期耗竭,从而阻碍进一步的病毒传播;和/或CD蛋白的进一步扩散,并因此进一步扩散致死浓度的5-FU。

序列表

<110> 托卡根公司(Tocagen Inc.)

<120> 包含用于结合结构域和可分泌肽的基因的重组载体

<130> 00014-034WO1

<140> 尚未分配

<141> 2019-11-13

<150> US 62/760,912

<151> 2018-11-13

<150> US 62/893,673

<151> 2019-08-29

<160> 304

<170> PatentIn version 3.5

<210> 1

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 2A肽共有序列

<220>

<221> MISC_FEATURE

<222> (2)..(2)

<223> Xaa为V或I

<220>

<221> MISC_FEATURE

<222> (4)..(4)

<223> Xaa是任何氨基酸

<400> 1

Asp Xaa Glu Xaa Asn Pro Gly Pro

1 5

<210> 2

<211> 11654

<212> DNA

<213> 人工序列

<220>

<223> 含有2A-盒的RRV载体

<400> 2

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca gtgaaacaga ctttgaattt 8340

tgaccttctc aagttggcgg gagacgtgga gtccaaccct ggacctggcg cgcctatggc 8400

cagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 8460

cgtaaacggc cacaagttca gcgtgtccgg cgaaggagag ggcgatgcca cctacggcaa 8520

gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 8580

gaccaccttg acctacggcg tgcagtgctt cgcccgctac cccgaccaca tgaagcagca 8640

cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 8700

ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 8760

ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 8820

ggagtacaac tacaacagcc acaaggtcta tatcaccgcc gacaagcaga agaacggcat 8880

caaggtgaac ttcaagaccc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 8940

ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 9000

gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 9060

ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtgtgcggc 9120

cgcagataaa ataaaagatt ttatttagtc tccagaaaaa ggggggaatg aaagacccca 9180

cctgtaggtt tggcaagcta gcttaagtaa cgccattttg caaggcatgg aaaaatacat 9240

aactgagaat agagaagttc agatcaaggt caggaacaga tggaacagct gaatatgggc 9300

caaacaggat atctgtggta agcagttcct gccccggctc agggccaaga acagatggaa 9360

cagctgaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 9420

caagaacaga tggtccccag atgcggtcca gccctcagca gtttctagag aaccatcaga 9480

tgtttccagg gtgccccaag gacctgaaat gaccctgtgc cttatttgaa ctaaccaatc 9540

agttcgcttc tcgcttctgt tcgcgcgctt ctgctccccg agctcaataa aagagcccac 9600

aacccctcac tcggggcgcc agtcctccga ttgactgagt cgcccgggta cccgtgtatc 9660

caataaaccc tcttgcagtt gcatccgact tgtggtctcg ctgttccttg ggagggtctc 9720

ctctgagtga ttgactaccc gtcagcgggg gtctttcatt acatgtgagc aaaaggccag 9780

caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 9840

cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 9900

taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 9960

ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc 10020

tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 10080

gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 10140

ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 10200

aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 10260

aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 10320

agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 10380

cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 10440

gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 10500

atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 10560

gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 10620

tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 10680

gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 10740

ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 10800

actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 10860

ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt gtcacgctcg 10920

tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 10980

cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 11040

ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 11100

ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 11160

tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac cgcgccacat 11220

agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 11280

atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 11340

gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 11400

aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 11460

tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 11520

aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 11580

gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 11640

cttcaagaat tcat 11654

<210> 3

<211> 9

<212> DNA

<213> 人工序列

<220>

<223> GSG接头序列

<400> 3

ggaagcgga 9

<210> 4

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> GFP-R-Gib引物

<400> 4

taaaatcttt tattttatct gcggccgcac 30

<210> 5

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 肽通读序列

<400> 5

Cys Ala Ala Ala Asp Lys Ile Lys Asp Phe Ile

1 5 10

<210> 6

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> Ascl-yCD2正向引物

<400> 6

gatcggcgcg cctatggtga ccggcggcat ggc 33

<210> 7

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 3-37引物

<400> 7

cccctttttc tggagactaa ataa 24

<210> 8

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 8

gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccct 54

<210> 9

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 9

ggaagcggag agggcagagg aagtcttcta acatgcggtg acgtggagga gaatcccggc 60

cct 63

<210> 10

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 10

gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57

<210> 11

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 11

ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60

ggacct 66

<210> 12

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 12

gtgaaacaga ctttgaattt tgaccttctc aagttggcgg gagacgtgga gtccaaccct 60

ggacct 66

<210> 13

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 13

ggaagcggag tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60

tccaaccctg gacct 75

<210> 14

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 14

cagtgtacta attatgctct cttgaaattg gctggagatg ttgagagcaa ccctggacct 60

<210> 15

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 15

ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60

cctggacct 69

<210> 16

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 16

gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccct 54

<210> 17

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 17

ggaagcggag agggcagagg aagtcttcta acatgcggtg acgtggagga gaatcccggc 60

cct 63

<210> 18

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 18

gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57

<210> 19

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 2A肽序列

<400> 19

ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60

ggacct 66

<210> 20

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 5-MLV-U3-R引物

<400> 20

agcccacaac ccctcactc 19

<210> 21

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 3-MLV-Psi引物序列

<400> 21

tctcccgatc ccggacga 18

<210> 22

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 探针序列

<400> 22

ccccaaatga aagacccccg ctgacg 26

<210> 23

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> IRES正向引物

<400> 23

ctgatcttac tctttggacc ttg 23

<210> 24

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> IRES反向引物

<400> 24

cccctttttc tggagactaa ataa 24

<210> 25

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> ENV正向引物

<400> 25

accctcaacc tcccctacaa gt 22

<210> 26

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> ENV反向引物

<400> 26

gttaagcgcc tgataggctc 20

<210> 27

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> Env 探针序列

<400> 27

ccccaaatga aagacccccg ctgacg 26

<210> 28

<211> 477

<212> DNA

<213> 人工序列

<220>

<223> 人类密码子优化的热稳定CD编码序列

<400> 28

atggtgaccg gcggcatggc ctccaagtgg gatcaaaagg gcatggatat cgcttacgag 60

gaggccctgc tgggctacaa ggagggcggc gtgcctatcg gcggctgtct gatcaacaac 120

aaggacggca gtgtgctggg caggggccac aacatgaggt tccagaaggg ctccgccacc 180

ctgcacggcg agatctccac cctggagaac tgtggcaggc tggagggcaa ggtgtacaag 240

gacaccaccc tgtacaccac cctgtcccct tgtgacatgt gtaccggcgc tatcatcatg 300

tacggcatcc ctaggtgtgt gatcggcgag aacgtgaact tcaagtccaa gggcgagaag 360

tacctgcaaa ccaggggcca cgaggtggtg gttgttgacg atgagaggtg taagaagctg 420

atgaagcagt tcatcgacga gaggcctcag gactggttcg aggatatcgg cgagtaa 477

<210> 29

<211> 158

<212> PRT

<213> 人工序列

<220>

<223> 热稳定的 APOBEC 修饰的 CD 多肽

<220>

<221> MISC_FEATURE

<222> (10)..(10)

<223> Xaa是任何氨基酸

<220>

<221> MISC_FEATURE

<222> (152)..(152)

<223> Xaa是任何氨基酸

<400> 29

Met Val Thr Gly Gly Met Ala Ser Lys Xaa Asp Gln Lys Gly Met Asp

1 5 10 15

Ile Ala Tyr Glu Glu Ala Leu Leu Gly Tyr Lys Glu Gly Gly Val Pro

20 25 30

Ile Gly Gly Cys Leu Ile Asn Asn Lys Asp Gly Ser Val Leu Gly Arg

35 40 45

Gly His Asn Met Arg Phe Gln Lys Gly Ser Ala Thr Leu His Gly Glu

50 55 60

Ile Ser Thr Leu Glu Asn Cys Gly Arg Leu Glu Gly Lys Val Tyr Lys

65 70 75 80

Asp Thr Thr Leu Tyr Thr Thr Leu Ser Pro Cys Asp Met Cys Thr Gly

85 90 95

Ala Ile Ile Met Tyr Gly Ile Pro Arg Cys Val Ile Gly Glu Asn Val

100 105 110

Asn Phe Lys Ser Lys Gly Glu Lys Tyr Leu Gln Thr Arg Gly His Glu

115 120 125

Val Val Val Val Asp Asp Glu Arg Cys Lys Lys Leu Met Lys Gln Phe

130 135 140

Ile Asp Glu Arg Pro Gln Asp Xaa Phe Glu Asp Ile Gly Glu

145 150 155

<210> 30

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 2A肽编码序列

<400> 30

gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccct 54

<210> 31

<211> 1062

<212> DNA

<213> 人工序列

<220>

<223> pAC3-T2A-GFPm的BstBI-env-T2A-GFPm

<400> 31

ttcgaagggc tgtttaatag atccccctgg tttaccacct taatctccac catcatggga 60

cctctaatag tactcttact gatcttactc tttggacctt gcattctcaa tcgattggtc 120

caatttgtta aagacaggat ctcagtggtc caggctctgg ttttgactca gcaatatcac 180

cagctaaaac ccatagagta cgagccagag ggcagaggaa gtcttctaac atgcggtgac 240

gtggaggaga atcccggccc tggcgcgcct atggccagca agggcgagga gctgttcacc 300

ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa gttcagcgtg 360

tccggcgaag gagagggcga tgccacctac ggcaagctga ccctgaagtt catctgcacc 420

accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccttgaccta cggcgtgcag 480

tgcttcgccc gctaccccga ccacatgaag cagcacgact tcttcaagtc cgccatgccc 540

gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta caagacccgc 600

gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac 660

ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa cagccacaag 720

gtctatatca ccgccgacaa gcagaagaac ggcatcaagg tgaacttcaa gacccgccac 780

aacatcgagg acggcagcgt gcagctcgcc gaccactacc agcagaacac ccccatcggc 840

gacggccccg tgctgctgcc cgacaaccac tacctgagca cccagtccgc cctgagcaaa 900

gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc 960

actctcggca tggacgagct gtacaagtgt gcggccgcag ataaaataaa agattttatt 1020

tagtctccag aaaaaggggg gaatgaaaga ccccacctgt ag 1062

<210> 32

<211> 1026

<212> DNA

<213> 人工序列

<220>

<223> pAC3-P2A-GFPm的BstBI-env-P2A-GFPm

<400> 32

ttcgaagggc tgtttaatag atccccctgg tttaccacct taatctccac catcatggga 60

cctctaatag tactcttact gatcttactc tttggacctt gcattctcaa tcgattggtc 120

caatttgtta aagacaggat ctcagtggtc caggctctgg ttttgactca gcaatatcac 180

cagctaaaac ccatagagta cgagccagct actaacttca gcctgctgaa gcaggctgga 240

gacgtggagg agaaccctgg acctggcgcg cctatggcca gcaagggcga ggagctgttc 300

accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 360

gtgtccggcg aaggagaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc 420

accaccggca agctgcccgt gccctggccc accctcgtga ccaccttgac ctacggcgtg 480

cagtgcttcg cccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 540

cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 600

cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 660

gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 720

aaggtctata tcaccgccga caagcagaag aacggcatca aggtgaactt caagacccgc 780

cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc 840

ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc 900

aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 960

atcactctcg gcatggacga gctgtacaag tgtgcggccg cagataaaat aaaagatttt 1020

atttag 1026

<210> 33

<211> 1029

<212> DNA

<213> 人工序列

<220>

<223> pAC3-E2A-GFPm的BstBI-env-E2A-GFPm

<400> 33

ttcgaagggc tgtttaatag atccccctgg tttaccacct taatctccac catcatggga 60

cctctaatag tactcttact gatcttactc tttggacctt gcattctcaa tcgattggtc 120

caatttgtta aagacaggat ctcagtggtc caggctctgg ttttgactca gcaatatcac 180

cagctaaaac ccatagagta cgagccacag tgtactaatt atgctctctt gaaattggct 240

ggagatgttg agagcaaccc tggacctggc gcgcctatgg ccagcaaggg cgaggagctg 300

ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 360

agcgtgtccg gcgaaggaga gggcgatgcc acctacggca agctgaccct gaagttcatc 420

tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccacctt gacctacggc 480

gtgcagtgct tcgcccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 540

atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 600

acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 660

atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 720

cacaaggtct atatcaccgc cgacaagcag aagaacggca tcaaggtgaa cttcaagacc 780

cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 840

atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 900

agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 960

gggatcactc tcggcatgga cgagctgtac aagtgtgcgg ccgcagataa aataaaagat 1020

tttatttag 1029

<210> 34

<211> 1035

<212> DNA

<213> 人工序列

<220>

<223> pAC3-F2A-GFPm的BstBI-env-F2A-GFPm

<400> 34

ttcgaagggc tgtttaatag atccccctgg tttaccacct taatctccac catcatggga 60

cctctaatag tactcttact gatcttactc tttggacctt gcattctcaa tcgattggtc 120

caatttgtta aagacaggat ctcagtggtc caggctctgg ttttgactca gcaatatcac 180

cagctaaaac ccatagagta cgagccagtg aaacagactt tgaattttga ccttctcaag 240

ttggcgggag acgtggagtc caaccctgga cctggcgcgc ctatggccag caagggcgag 300

gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 360

aagttcagcg tgtccggcga aggagagggc gatgccacct acggcaagct gaccctgaag 420

ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccttgacc 480

tacggcgtgc agtgcttcgc ccgctacccc gaccacatga agcagcacga cttcttcaag 540

tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 600

tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 660

aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 720

aacagccaca aggtctatat caccgccgac aagcagaaga acggcatcaa ggtgaacttc 780

aagacccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 840

acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 900

gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 960

gccgccggga tcactctcgg catggacgag ctgtacaagt gtgcggccgc agataaaata 1020

aaagatttta tttag 1035

<210> 35

<211> 1032

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-T2A-GFPm的BstBI-env-GSG-T2A-GFPm

<400> 35

ttcgaagggc tgtttaatag atccccctgg tttaccacct taatctccac catcatggga 60

cctctaatag tactcttact gatcttactc tttggacctt gcattctcaa tcgattggtc 120

caatttgtta aagacaggat ctcagtggtc caggctctgg ttttgactca gcaatatcac 180

cagctaaaac ccatagagta cgagccagga agcggagagg gcagaggaag tcttctaaca 240

tgcggtgacg tggaggagaa tcccggccct ggcgcgccta tggccagcaa gggcgaggag 300

ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag 360

ttcagcgtgt ccggcgaagg agagggcgat gccacctacg gcaagctgac cctgaagttc 420

atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cttgacctac 480

ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc 540

gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac 600

aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag 660

ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac 720

agccacaagg tctatatcac cgccgacaag cagaagaacg gcatcaaggt gaacttcaag 780

acccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca gcagaacacc 840

cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac ccagtccgcc 900

ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc 960

gccgggatca ctctcggcat ggacgagctg tacaagtgtg cggccgcaga taaaataaaa 1020

gattttattt ag 1032

<210> 36

<211> 1035

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-P2A-GFPm的BstBI-env-GSG-P2A-GFPm

<400> 36

ttcgaagggc tgtttaatag atccccctgg tttaccacct taatctccac catcatggga 60

cctctaatag tactcttact gatcttactc tttggacctt gcattctcaa tcgattggtc 120

caatttgtta aagacaggat ctcagtggtc caggctctgg ttttgactca gcaatatcac 180

cagctaaaac ccatagagta cgagccagga agcggagcta ctaacttcag cctgctgaag 240

caggctggag acgtggagga gaaccctgga cctggcgcgc ctatggccag caagggcgag 300

gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 360

aagttcagcg tgtccggcga aggagagggc gatgccacct acggcaagct gaccctgaag 420

ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccttgacc 480

tacggcgtgc agtgcttcgc ccgctacccc gaccacatga agcagcacga cttcttcaag 540

tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 600

tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 660

aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 720

aacagccaca aggtctatat caccgccgac aagcagaaga acggcatcaa ggtgaacttc 780

aagacccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 840

acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 900

gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 960

gccgccggga tcactctcgg catggacgag ctgtacaagt gtgcggccgc agataaaata 1020

aaagatttta tttag 1035

<210> 37

<211> 1044

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-F2A-GFPm的BstBI-env-GSG-F2A-GFPm

<400> 37

ttcgaagggc tgtttaatag atccccctgg tttaccacct taatctccac catcatggga 60

cctctaatag tactcttact gatcttactc tttggacctt gcattctcaa tcgattggtc 120

caatttgtta aagacaggat ctcagtggtc caggctctgg ttttgactca gcaatatcac 180

cagctaaaac ccatagagta cgagccagga agcggagtga aacagacttt gaattttgac 240

cttctcaagt tggcgggaga cgtggagtcc aaccctggac ctggcgcgcc tatggccagc 300

aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 360

aacggccaca agttcagcgt gtccggcgaa ggagagggcg atgccaccta cggcaagctg 420

accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 480

accttgacct acggcgtgca gtgcttcgcc cgctaccccg accacatgaa gcagcacgac 540

ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 600

gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 660

atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 720

tacaactaca acagccacaa ggtctatatc accgccgaca agcagaagaa cggcatcaag 780

gtgaacttca agacccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 840

cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 900

acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 960

ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagtg tgcggccgca 1020

gataaaataa aagattttat ttag 1044

<210> 38

<211> 1038

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-E2A-GFPm的BstBI-env-GSG-E2A-GFPm

<400> 38

ttcgaagggc tgtttaatag atccccctgg tttaccacct taatctccac catcatggga 60

cctctaatag tactcttact gatcttactc tttggacctt gcattctcaa tcgattggtc 120

caatttgtta aagacaggat ctcagtggtc caggctctgg ttttgactca gcaatatcac 180

cagctaaaac ccatagagta cgagccagga agcggacagt gtactaatta tgctctcttg 240

aaattggctg gagatgttga gagcaaccct ggacctggcg cgcctatggc cagcaagggc 300

gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga cgtaaacggc 360

cacaagttca gcgtgtccgg cgaaggagag ggcgatgcca cctacggcaa gctgaccctg 420

aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt gaccaccttg 480

acctacggcg tgcagtgctt cgcccgctac cccgaccaca tgaagcagca cgacttcttc 540

aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa ggacgacggc 600

aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa ccgcatcgag 660

ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct ggagtacaac 720

tacaacagcc acaaggtcta tatcaccgcc gacaagcaga agaacggcat caaggtgaac 780

ttcaagaccc gccacaacat cgaggacggc agcgtgcagc tcgccgacca ctaccagcag 840

aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct gagcacccag 900

tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct ggagttcgtg 960

accgccgccg ggatcactct cggcatggac gagctgtaca agtgtgcggc cgcagataaa 1020

ataaaagatt ttatttag 1038

<210> 39

<211> 548

<212> DNA

<213> 人工序列

<220>

<223> pAC3-T2A-yCD2的T2A-AscI-yCD2

<400> 39

gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccctggcgcg 60

cctatggtga ccggcggcat ggcctccaag tgggatcaaa agggcatgga tatcgcttac 120

gaggaggccc tgctgggcta caaggagggc ggcgtgccta tcggcggctg tctgatcaac 180

aacaaggacg gcagtgtgct gggcaggggc cacaacatga ggttccagaa gggctccgcc 240

accctgcacg gcgagatctc caccctggag aactgtggca ggctggaggg caaggtgtac 300

aaggacacca ccctgtacac caccctgtcc ccttgtgaca tgtgtaccgg cgctatcatc 360

atgtacggca tccctaggtg tgtgatcggc gagaacgtga acttcaagtc caagggcgag 420

aagtacctgc aaaccagggg ccacgaggtg gtggttgttg acgatgagag gtgtaagaag 480

ctgatgaagc agttcatcga cgagaggcct caggactggt tcgaggatat cggcgagtaa 540

gcggccgc 548

<210> 40

<211> 551

<212> DNA

<213> 人工序列

<220>

<223> pAC3-P2A-yCD2的P2A-AscI-yCD2

<400> 40

gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacctggc 60

gcgcctatgg tgaccggcgg catggcctcc aagtgggatc aaaagggcat ggatatcgct 120

tacgaggagg ccctgctggg ctacaaggag ggcggcgtgc ctatcggcgg ctgtctgatc 180

aacaacaagg acggcagtgt gctgggcagg ggccacaaca tgaggttcca gaagggctcc 240

gccaccctgc acggcgagat ctccaccctg gagaactgtg gcaggctgga gggcaaggtg 300

tacaaggaca ccaccctgta caccaccctg tccccttgtg acatgtgtac cggcgctatc 360

atcatgtacg gcatccctag gtgtgtgatc ggcgagaacg tgaacttcaa gtccaagggc 420

gagaagtacc tgcaaaccag gggccacgag gtggtggttg ttgacgatga gaggtgtaag 480

aagctgatga agcagttcat cgacgagagg cctcaggact ggttcgagga tatcggcgag 540

taagcggccg c 551

<210> 41

<211> 557

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-T2A-yCD2的GSG-T2A-AscI-yCD2

<400> 41

ggaagcggag agggcagagg aagtcttcta acatgcggtg acgtggagga gaatcccggc 60

cctggcgcgc ctatggtgac cggcggcatg gcctccaagt gggatcaaaa gggcatggat 120

atcgcttacg aggaggccct gctgggctac aaggagggcg gcgtgcctat cggcggctgt 180

ctgatcaaca acaaggacgg cagtgtgctg ggcaggggcc acaacatgag gttccagaag 240

ggctccgcca ccctgcacgg cgagatctcc accctggaga actgtggcag gctggagggc 300

aaggtgtaca aggacaccac cctgtacacc accctgtccc cttgtgacat gtgtaccggc 360

gctatcatca tgtacggcat ccctaggtgt gtgatcggcg agaacgtgaa cttcaagtcc 420

aagggcgaga agtacctgca aaccaggggc cacgaggtgg tggttgttga cgatgagagg 480

tgtaagaagc tgatgaagca gttcatcgac gagaggcctc aggactggtt cgaggatatc 540

ggcgagtaag cggccgc 557

<210> 42

<211> 560

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-P2A-yCD2的GSG-P2A-AscI-yCD2

<400> 42

ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60

ggacctggcg cgcctatggt gaccggcggc atggcctcca agtgggatca aaagggcatg 120

gatatcgctt acgaggaggc cctgctgggc tacaaggagg gcggcgtgcc tatcggcggc 180

tgtctgatca acaacaagga cggcagtgtg ctgggcaggg gccacaacat gaggttccag 240

aagggctccg ccaccctgca cggcgagatc tccaccctgg agaactgtgg caggctggag 300

ggcaaggtgt acaaggacac caccctgtac accaccctgt ccccttgtga catgtgtacc 360

ggcgctatca tcatgtacgg catccctagg tgtgtgatcg gcgagaacgt gaacttcaag 420

tccaagggcg agaagtacct gcaaaccagg ggccacgagg tggtggttgt tgacgatgag 480

aggtgtaaga agctgatgaa gcagttcatc gacgagaggc ctcaggactg gttcgaggat 540

atcggcgagt aagcggccgc 560

<210> 43

<211> 11642

<212> DNA

<213> 人工序列

<220>

<223> pAC3-T2A-GFPm

<400> 43

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca gagggcagag gaagtcttct 8340

aacatgcggt gacgtggagg agaatcccgg ccctggcgcg cctatggcca gcaagggcga 8400

ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 8460

caagttcagc gtgtccggcg aaggagaggg cgatgccacc tacggcaagc tgaccctgaa 8520

gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccttgac 8580

ctacggcgtg cagtgcttcg cccgctaccc cgaccacatg aagcagcacg acttcttcaa 8640

gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 8700

ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 8760

gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 8820

caacagccac aaggtctata tcaccgccga caagcagaag aacggcatca aggtgaactt 8880

caagacccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 8940

cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 9000

cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 9060

cgccgccggg atcactctcg gcatggacga gctgtacaag tgtgcggccg cagataaaat 9120

aaaagatttt atttagtctc cagaaaaagg ggggaatgaa agaccccacc tgtaggtttg 9180

gcaagctagc ttaagtaacg ccattttgca aggcatggaa aaatacataa ctgagaatag 9240

agaagttcag atcaaggtca ggaacagatg gaacagctga atatgggcca aacaggatat 9300

ctgtggtaag cagttcctgc cccggctcag ggccaagaac agatggaaca gctgaatatg 9360

ggccaaacag gatatctgtg gtaagcagtt cctgccccgg ctcagggcca agaacagatg 9420

gtccccagat gcggtccagc cctcagcagt ttctagagaa ccatcagatg tttccagggt 9480

gccccaagga cctgaaatga ccctgtgcct tatttgaact aaccaatcag ttcgcttctc 9540

gcttctgttc gcgcgcttct gctccccgag ctcaataaaa gagcccacaa cccctcactc 9600

ggggcgccag tcctccgatt gactgagtcg cccgggtacc cgtgtatcca ataaaccctc 9660

ttgcagttgc atccgacttg tggtctcgct gttccttggg agggtctcct ctgagtgatt 9720

gactacccgt cagcgggggt ctttcattac atgtgagcaa aaggccagca aaaggccagg 9780

aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 9840

cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 9900

gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 9960

tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg 10020

tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 10080

cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 10140

gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 10200

ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 10260

ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 10320

ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 10380

agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 10440

aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 10500

atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 10560

tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 10620

tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 10680

tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 10740

gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 10800

tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 10860

ttgcgcaacg ttgttgccat tgctgcaggc atcgtggtgt cacgctcgtc gtttggtatg 10920

gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 10980

aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 11040

ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 11100

tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 11160

ccgagttgct cttgcccggc gtcaacacgg gataataccg cgccacatag cagaacttta 11220

aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 11280

ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 11340

ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 11400

agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 11460

tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 11520

ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt 11580

atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct tcaagaattc 11640

at 11642

<210> 44

<211> 11651

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-T2A-GFPm

<400> 44

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca ggaagcggag agggcagagg 8340

aagtcttcta acatgcggtg acgtggagga gaatcccggc cctggcgcgc ctatggccag 8400

caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 8460

aaacggccac aagttcagcg tgtccggcga aggagagggc gatgccacct acggcaagct 8520

gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 8580

caccttgacc tacggcgtgc agtgcttcgc ccgctacccc gaccacatga agcagcacga 8640

cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 8700

cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 8760

catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 8820

gtacaactac aacagccaca aggtctatat caccgccgac aagcagaaga acggcatcaa 8880

ggtgaacttc aagacccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 8940

ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 9000

cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 9060

gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt gtgcggccgc 9120

agataaaata aaagatttta tttagtctcc agaaaaaggg gggaatgaaa gaccccacct 9180

gtaggtttgg caagctagct taagtaacgc cattttgcaa ggcatggaaa aatacataac 9240

tgagaataga gaagttcaga tcaaggtcag gaacagatgg aacagctgaa tatgggccaa 9300

acaggatatc tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gatggaacag 9360

ctgaatatgg gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa 9420

gaacagatgg tccccagatg cggtccagcc ctcagcagtt tctagagaac catcagatgt 9480

ttccagggtg ccccaaggac ctgaaatgac cctgtgcctt atttgaacta accaatcagt 9540

tcgcttctcg cttctgttcg cgcgcttctg ctccccgagc tcaataaaag agcccacaac 9600

ccctcactcg gggcgccagt cctccgattg actgagtcgc ccgggtaccc gtgtatccaa 9660

taaaccctct tgcagttgca tccgacttgt ggtctcgctg ttccttggga gggtctcctc 9720

tgagtgattg actacccgtc agcgggggtc tttcattaca tgtgagcaaa aggccagcaa 9780

aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 9840

gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 9900

agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 9960

cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcaatgctca 10020

cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 10080

ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 10140

gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 10200

tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 10260

acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 10320

tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 10380

attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 10440

gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 10500

ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 10560

taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 10620

ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 10680

ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 10740

gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 10800

ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 10860

gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg 10920

tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 10980

atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 11040

gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 11100

tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 11160

atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc gccacatagc 11220

agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 11280

ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 11340

tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 11400

aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 11460

tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 11520

aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 11580

accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctt 11640

caagaattca t 11651

<210> 45

<211> 11645

<212> DNA

<213> 人工序列

<220>

<223> pAC3-P2A-GFPm

<400> 45

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca gctactaact tcagcctgct 8340

gaagcaggct ggagacgtgg aggagaaccc tggacctggc gcgcctatgg ccagcaaggg 8400

cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg 8460

ccacaagttc agcgtgtccg gcgaaggaga gggcgatgcc acctacggca agctgaccct 8520

gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccacctt 8580

gacctacggc gtgcagtgct tcgcccgcta ccccgaccac atgaagcagc acgacttctt 8640

caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg 8700

caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga 8760

gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa 8820

ctacaacagc cacaaggtct atatcaccgc cgacaagcag aagaacggca tcaaggtgaa 8880

cttcaagacc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca 8940

gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca 9000

gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt 9060

gaccgccgcc gggatcactc tcggcatgga cgagctgtac aagtgtgcgg ccgcagataa 9120

aataaaagat tttatttagt ctccagaaaa aggggggaat gaaagacccc acctgtaggt 9180

ttggcaagct agcttaagta acgccatttt gcaaggcatg gaaaaataca taactgagaa 9240

tagagaagtt cagatcaagg tcaggaacag atggaacagc tgaatatggg ccaaacagga 9300

tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatgga acagctgaat 9360

atgggccaaa caggatatct gtggtaagca gttcctgccc cggctcaggg ccaagaacag 9420

atggtcccca gatgcggtcc agccctcagc agtttctaga gaaccatcag atgtttccag 9480

ggtgccccaa ggacctgaaa tgaccctgtg ccttatttga actaaccaat cagttcgctt 9540

ctcgcttctg ttcgcgcgct tctgctcccc gagctcaata aaagagccca caacccctca 9600

ctcggggcgc cagtcctccg attgactgag tcgcccgggt acccgtgtat ccaataaacc 9660

ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 9720

attgactacc cgtcagcggg ggtctttcat tacatgtgag caaaaggcca gcaaaaggcc 9780

aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 9840

catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 9900

caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 9960

ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt 10020

aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 10080

gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 10140

cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 10200

ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 10260

tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 10320

tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 10380

cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 10440

tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 10500

tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 10560

tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 10620

cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 10680

ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 10740

tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 10800

gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 10860

agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc gtcgtttggt 10920

atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 10980

tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 11040

gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 11100

agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 11160

cgaccgagtt gctcttgccc ggcgtcaaca cgggataata ccgcgccaca tagcagaact 11220

ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 11280

ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 11340

actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 11400

ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 11460

atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 11520

caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt 11580

attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg tcttcaagaa 11640

ttcat 11645

<210> 46

<211> 11654

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-P2A-GFPm

<400> 46

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca ggaagcggag ctactaactt 8340

cagcctgctg aagcaggctg gagacgtgga ggagaaccct ggacctggcg cgcctatggc 8400

cagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 8460

cgtaaacggc cacaagttca gcgtgtccgg cgaaggagag ggcgatgcca cctacggcaa 8520

gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 8580

gaccaccttg acctacggcg tgcagtgctt cgcccgctac cccgaccaca tgaagcagca 8640

cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 8700

ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 8760

ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 8820

ggagtacaac tacaacagcc acaaggtcta tatcaccgcc gacaagcaga agaacggcat 8880

caaggtgaac ttcaagaccc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 8940

ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 9000

gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 9060

ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtgtgcggc 9120

cgcagataaa ataaaagatt ttatttagtc tccagaaaaa ggggggaatg aaagacccca 9180

cctgtaggtt tggcaagcta gcttaagtaa cgccattttg caaggcatgg aaaaatacat 9240

aactgagaat agagaagttc agatcaaggt caggaacaga tggaacagct gaatatgggc 9300

caaacaggat atctgtggta agcagttcct gccccggctc agggccaaga acagatggaa 9360

cagctgaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 9420

caagaacaga tggtccccag atgcggtcca gccctcagca gtttctagag aaccatcaga 9480

tgtttccagg gtgccccaag gacctgaaat gaccctgtgc cttatttgaa ctaaccaatc 9540

agttcgcttc tcgcttctgt tcgcgcgctt ctgctccccg agctcaataa aagagcccac 9600

aacccctcac tcggggcgcc agtcctccga ttgactgagt cgcccgggta cccgtgtatc 9660

caataaaccc tcttgcagtt gcatccgact tgtggtctcg ctgttccttg ggagggtctc 9720

ctctgagtga ttgactaccc gtcagcgggg gtctttcatt acatgtgagc aaaaggccag 9780

caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 9840

cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 9900

taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 9960

ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc 10020

tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 10080

gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 10140

ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 10200

aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 10260

aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 10320

agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 10380

cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 10440

gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 10500

atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 10560

gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 10620

tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 10680

gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 10740

ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 10800

actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 10860

ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt gtcacgctcg 10920

tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 10980

cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 11040

ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 11100

ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 11160

tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac cgcgccacat 11220

agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 11280

atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 11340

gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 11400

aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 11460

tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 11520

aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 11580

gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 11640

cttcaagaat tcat 11654

<210> 47

<211> 11648

<212> DNA

<213> 人工序列

<220>

<223> pAC3-E2A-GFP

<400> 47

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca cagtgtacta attatgctct 8340

cttgaaattg gctggagatg ttgagagcaa ccctggacct ggcgcgccta tggccagcaa 8400

gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa 8460

cggccacaag ttcagcgtgt ccggcgaagg agagggcgat gccacctacg gcaagctgac 8520

cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 8580

cttgacctac ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc agcacgactt 8640

cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 8700

cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 8760

cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 8820

caactacaac agccacaagg tctatatcac cgccgacaag cagaagaacg gcatcaaggt 8880

gaacttcaag acccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 8940

gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 9000

ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 9060

cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtgtg cggccgcaga 9120

taaaataaaa gattttattt agtctccaga aaaagggggg aatgaaagac cccacctgta 9180

ggtttggcaa gctagcttaa gtaacgccat tttgcaaggc atggaaaaat acataactga 9240

gaatagagaa gttcagatca aggtcaggaa cagatggaac agctgaatat gggccaaaca 9300

ggatatctgt ggtaagcagt tcctgccccg gctcagggcc aagaacagat ggaacagctg 9360

aatatgggcc aaacaggata tctgtggtaa gcagttcctg ccccggctca gggccaagaa 9420

cagatggtcc ccagatgcgg tccagccctc agcagtttct agagaaccat cagatgtttc 9480

cagggtgccc caaggacctg aaatgaccct gtgccttatt tgaactaacc aatcagttcg 9540

cttctcgctt ctgttcgcgc gcttctgctc cccgagctca ataaaagagc ccacaacccc 9600

tcactcgggg cgccagtcct ccgattgact gagtcgcccg ggtacccgtg tatccaataa 9660

accctcttgc agttgcatcc gacttgtggt ctcgctgttc cttgggaggg tctcctctga 9720

gtgattgact acccgtcagc gggggtcttt cattacatgt gagcaaaagg ccagcaaaag 9780

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 9840

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 9900

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 9960

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 10020

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 10080

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 10140

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 10200

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 10260

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 10320

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 10380

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 10440

cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 10500

acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 10560

acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 10620

tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 10680

ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 10740

ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 10800

tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 10860

aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt 10920

ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 10980

ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 11040

gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 11100

gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 11160

cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga 11220

actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 11280

ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 11340

tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 11400

ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 11460

agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 11520

aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 11580

attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtcttcaa 11640

gaattcat 11648

<210> 48

<211> 11657

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-E2A-GFPm

<400> 48

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca ggaagcggac agtgtactaa 8340

ttatgctctc ttgaaattgg ctggagatgt tgagagcaac cctggacctg gcgcgcctat 8400

ggccagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 8460

cgacgtaaac ggccacaagt tcagcgtgtc cggcgaagga gagggcgatg ccacctacgg 8520

caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 8580

cgtgaccacc ttgacctacg gcgtgcagtg cttcgcccgc taccccgacc acatgaagca 8640

gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 8700

caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 8760

gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 8820

gctggagtac aactacaaca gccacaaggt ctatatcacc gccgacaagc agaagaacgg 8880

catcaaggtg aacttcaaga cccgccacaa catcgaggac ggcagcgtgc agctcgccga 8940

ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 9000

cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 9060

gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtgtgc 9120

ggccgcagat aaaataaaag attttattta gtctccagaa aaagggggga atgaaagacc 9180

ccacctgtag gtttggcaag ctagcttaag taacgccatt ttgcaaggca tggaaaaata 9240

cataactgag aatagagaag ttcagatcaa ggtcaggaac agatggaaca gctgaatatg 9300

ggccaaacag gatatctgtg gtaagcagtt cctgccccgg ctcagggcca agaacagatg 9360

gaacagctga atatgggcca aacaggatat ctgtggtaag cagttcctgc cccggctcag 9420

ggccaagaac agatggtccc cagatgcggt ccagccctca gcagtttcta gagaaccatc 9480

agatgtttcc agggtgcccc aaggacctga aatgaccctg tgccttattt gaactaacca 9540

atcagttcgc ttctcgcttc tgttcgcgcg cttctgctcc ccgagctcaa taaaagagcc 9600

cacaacccct cactcggggc gccagtcctc cgattgactg agtcgcccgg gtacccgtgt 9660

atccaataaa ccctcttgca gttgcatccg acttgtggtc tcgctgttcc ttgggagggt 9720

ctcctctgag tgattgacta cccgtcagcg ggggtctttc attacatgtg agcaaaaggc 9780

cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 9840

ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 9900

ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 9960

ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa 10020

tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 10080

cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 10140

aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 10200

gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 10260

agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 10320

ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 10380

cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 10440

tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 10500

aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 10560

tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 10620

atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 10680

cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 10740

gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 10800

gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 10860

tcgccagtta atagtttgcg caacgttgtt gccattgctg caggcatcgt ggtgtcacgc 10920

tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 10980

tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 11040

aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 11100

atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 11160

tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca 11220

catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 11280

aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 11340

tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 11400

gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 11460

tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 11520

tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc 11580

taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt 11640

cgtcttcaag aattcat 11657

<210> 49

<211> 11654

<212> DNA

<213> 人工序列

<220>

<223> pAC3-F2A-GFPm

<400> 49

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca gtgaaacaga ctttgaattt 8340

tgaccttctc aagttggcgg gagacgtgga gtccaaccct ggacctggcg cgcctatggc 8400

cagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 8460

cgtaaacggc cacaagttca gcgtgtccgg cgaaggagag ggcgatgcca cctacggcaa 8520

gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 8580

gaccaccttg acctacggcg tgcagtgctt cgcccgctac cccgaccaca tgaagcagca 8640

cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 8700

ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 8760

ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 8820

ggagtacaac tacaacagcc acaaggtcta tatcaccgcc gacaagcaga agaacggcat 8880

caaggtgaac ttcaagaccc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 8940

ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 9000

gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 9060

ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtgtgcggc 9120

cgcagataaa ataaaagatt ttatttagtc tccagaaaaa ggggggaatg aaagacccca 9180

cctgtaggtt tggcaagcta gcttaagtaa cgccattttg caaggcatgg aaaaatacat 9240

aactgagaat agagaagttc agatcaaggt caggaacaga tggaacagct gaatatgggc 9300

caaacaggat atctgtggta agcagttcct gccccggctc agggccaaga acagatggaa 9360

cagctgaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 9420

caagaacaga tggtccccag atgcggtcca gccctcagca gtttctagag aaccatcaga 9480

tgtttccagg gtgccccaag gacctgaaat gaccctgtgc cttatttgaa ctaaccaatc 9540

agttcgcttc tcgcttctgt tcgcgcgctt ctgctccccg agctcaataa aagagcccac 9600

aacccctcac tcggggcgcc agtcctccga ttgactgagt cgcccgggta cccgtgtatc 9660

caataaaccc tcttgcagtt gcatccgact tgtggtctcg ctgttccttg ggagggtctc 9720

ctctgagtga ttgactaccc gtcagcgggg gtctttcatt acatgtgagc aaaaggccag 9780

caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 9840

cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 9900

taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 9960

ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc 10020

tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 10080

gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 10140

ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 10200

aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 10260

aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 10320

agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 10380

cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 10440

gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 10500

atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 10560

gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 10620

tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 10680

gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 10740

ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 10800

actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 10860

ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt gtcacgctcg 10920

tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 10980

cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 11040

ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 11100

ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 11160

tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac cgcgccacat 11220

agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 11280

atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 11340

gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 11400

aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 11460

tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 11520

aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 11580

gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 11640

cttcaagaat tcat 11654

<210> 50

<211> 11663

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-F2A-GFPm

<400> 50

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca ggaagcggag tgaaacagac 8340

tttgaatttt gaccttctca agttggcggg agacgtggag tccaaccctg gacctggcgc 8400

gcctatggcc agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct 8460

ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gaaggagagg gcgatgccac 8520

ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc 8580

caccctcgtg accaccttga cctacggcgt gcagtgcttc gcccgctacc ccgaccacat 8640

gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat 8700

cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac 8760

cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg 8820

gcacaagctg gagtacaact acaacagcca caaggtctat atcaccgccg acaagcagaa 8880

gaacggcatc aaggtgaact tcaagacccg ccacaacatc gaggacggca gcgtgcagct 8940

cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa 9000

ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat 9060

ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa 9120

gtgtgcggcc gcagataaaa taaaagattt tatttagtct ccagaaaaag gggggaatga 9180

aagaccccac ctgtaggttt ggcaagctag cttaagtaac gccattttgc aaggcatgga 9240

aaaatacata actgagaata gagaagttca gatcaaggtc aggaacagat ggaacagctg 9300

aatatgggcc aaacaggata tctgtggtaa gcagttcctg ccccggctca gggccaagaa 9360

cagatggaac agctgaatat gggccaaaca ggatatctgt ggtaagcagt tcctgccccg 9420

gctcagggcc aagaacagat ggtccccaga tgcggtccag ccctcagcag tttctagaga 9480

accatcagat gtttccaggg tgccccaagg acctgaaatg accctgtgcc ttatttgaac 9540

taaccaatca gttcgcttct cgcttctgtt cgcgcgcttc tgctccccga gctcaataaa 9600

agagcccaca acccctcact cggggcgcca gtcctccgat tgactgagtc gcccgggtac 9660

ccgtgtatcc aataaaccct cttgcagttg catccgactt gtggtctcgc tgttccttgg 9720

gagggtctcc tctgagtgat tgactacccg tcagcggggg tctttcatta catgtgagca 9780

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 9840

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 9900

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 9960

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 10020

tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 10080

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 10140

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 10200

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 10260

tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 10320

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 10380

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 10440

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 10500

tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 10560

agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 10620

tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 10680

acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 10740

tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 10800

ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 10860

agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctgcagg catcgtggtg 10920

tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 10980

acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 11040

agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 11100

actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 11160

tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaacacg ggataatacc 11220

gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 11280

ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 11340

tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 11400

aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 11460

tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 11520

tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 11580

gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg 11640

ccctttcgtc ttcaagaatt cat 11663

<210> 51

<211> 11399

<212> DNA

<213> 人工序列

<220>

<223> pAC3-T2A-yCD2

<400> 51

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca gagggcagag gaagtcttct 8340

aacatgcggt gacgtggagg agaatcccgg ccctggcgcg cctatggtga ccggcggcat 8400

ggcctccaag tgggatcaaa agggcatgga tatcgcttac gaggaggccc tgctgggcta 8460

caaggagggc ggcgtgccta tcggcggctg tctgatcaac aacaaggacg gcagtgtgct 8520

gggcaggggc cacaacatga ggttccagaa gggctccgcc accctgcacg gcgagatctc 8580

caccctggag aactgtggca ggctggaggg caaggtgtac aaggacacca ccctgtacac 8640

caccctgtcc ccttgtgaca tgtgtaccgg cgctatcatc atgtacggca tccctaggtg 8700

tgtgatcggc gagaacgtga acttcaagtc caagggcgag aagtacctgc aaaccagggg 8760

ccacgaggtg gtggttgttg acgatgagag gtgtaagaag ctgatgaagc agttcatcga 8820

cgagaggcct caggactggt tcgaggatat cggcgagtaa gcggccgcag ataaaataaa 8880

agattttatt tagtctccag aaaaaggggg gaatgaaaga ccccacctgt aggtttggca 8940

agctagctta agtaacgcca ttttgcaagg catggaaaaa tacataactg agaatagaga 9000

agttcagatc aaggtcagga acagatggaa cagctgaata tgggccaaac aggatatctg 9060

tggtaagcag ttcctgcccc ggctcagggc caagaacaga tggaacagct gaatatgggc 9120

caaacaggat atctgtggta agcagttcct gccccggctc agggccaaga acagatggtc 9180

cccagatgcg gtccagccct cagcagtttc tagagaacca tcagatgttt ccagggtgcc 9240

ccaaggacct gaaatgaccc tgtgccttat ttgaactaac caatcagttc gcttctcgct 9300

tctgttcgcg cgcttctgct ccccgagctc aataaaagag cccacaaccc ctcactcggg 9360

gcgccagtcc tccgattgac tgagtcgccc gggtacccgt gtatccaata aaccctcttg 9420

cagttgcatc cgacttgtgg tctcgctgtt ccttgggagg gtctcctctg agtgattgac 9480

tacccgtcag cgggggtctt tcattacatg tgagcaaaag gccagcaaaa ggccaggaac 9540

cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 9600

aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 9660

tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 9720

ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 9780

ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 9840

cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 9900

ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 9960

gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 10020

atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 10080

aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 10140

aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 10200

gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 10260

cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 10320

gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 10380

tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 10440

ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 10500

ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 10560

atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 10620

cgcaacgttg ttgccattgc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct 10680

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 10740

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 10800

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 10860

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 10920

agttgctctt gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa 10980

gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 11040

agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 11100

accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 11160

gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 11220

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 11280

ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc 11340

atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtcttca agaattcat 11399

<210> 52

<211> 11408

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-T2A-yCD2

<400> 52

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca ggaagcggag agggcagagg 8340

aagtcttcta acatgcggtg acgtggagga gaatcccggc cctggcgcgc ctatggtgac 8400

cggcggcatg gcctccaagt gggatcaaaa gggcatggat atcgcttacg aggaggccct 8460

gctgggctac aaggagggcg gcgtgcctat cggcggctgt ctgatcaaca acaaggacgg 8520

cagtgtgctg ggcaggggcc acaacatgag gttccagaag ggctccgcca ccctgcacgg 8580

cgagatctcc accctggaga actgtggcag gctggagggc aaggtgtaca aggacaccac 8640

cctgtacacc accctgtccc cttgtgacat gtgtaccggc gctatcatca tgtacggcat 8700

ccctaggtgt gtgatcggcg agaacgtgaa cttcaagtcc aagggcgaga agtacctgca 8760

aaccaggggc cacgaggtgg tggttgttga cgatgagagg tgtaagaagc tgatgaagca 8820

gttcatcgac gagaggcctc aggactggtt cgaggatatc ggcgagtaag cggccgcaga 8880

taaaataaaa gattttattt agtctccaga aaaagggggg aatgaaagac cccacctgta 8940

ggtttggcaa gctagcttaa gtaacgccat tttgcaaggc atggaaaaat acataactga 9000

gaatagagaa gttcagatca aggtcaggaa cagatggaac agctgaatat gggccaaaca 9060

ggatatctgt ggtaagcagt tcctgccccg gctcagggcc aagaacagat ggaacagctg 9120

aatatgggcc aaacaggata tctgtggtaa gcagttcctg ccccggctca gggccaagaa 9180

cagatggtcc ccagatgcgg tccagccctc agcagtttct agagaaccat cagatgtttc 9240

cagggtgccc caaggacctg aaatgaccct gtgccttatt tgaactaacc aatcagttcg 9300

cttctcgctt ctgttcgcgc gcttctgctc cccgagctca ataaaagagc ccacaacccc 9360

tcactcgggg cgccagtcct ccgattgact gagtcgcccg ggtacccgtg tatccaataa 9420

accctcttgc agttgcatcc gacttgtggt ctcgctgttc cttgggaggg tctcctctga 9480

gtgattgact acccgtcagc gggggtcttt cattacatgt gagcaaaagg ccagcaaaag 9540

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 9600

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 9660

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 9720

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 9780

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 9840

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 9900

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 9960

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 10020

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 10080

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 10140

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 10200

cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 10260

acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 10320

acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 10380

tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 10440

ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 10500

ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 10560

tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 10620

aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt 10680

ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 10740

ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 10800

gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 10860

gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 10920

cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga 10980

actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 11040

ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 11100

tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 11160

ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 11220

agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 11280

aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 11340

attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtcttcaa 11400

gaattcat 11408

<210> 53

<211> 11402

<212> DNA

<213> 人工序列

<220>

<223> pAC3-P2A-yCD2

<400> 53

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca gctactaact tcagcctgct 8340

gaagcaggct ggagacgtgg aggagaaccc tggacctggc gcgcctatgg tgaccggcgg 8400

catggcctcc aagtgggatc aaaagggcat ggatatcgct tacgaggagg ccctgctggg 8460

ctacaaggag ggcggcgtgc ctatcggcgg ctgtctgatc aacaacaagg acggcagtgt 8520

gctgggcagg ggccacaaca tgaggttcca gaagggctcc gccaccctgc acggcgagat 8580

ctccaccctg gagaactgtg gcaggctgga gggcaaggtg tacaaggaca ccaccctgta 8640

caccaccctg tccccttgtg acatgtgtac cggcgctatc atcatgtacg gcatccctag 8700

gtgtgtgatc ggcgagaacg tgaacttcaa gtccaagggc gagaagtacc tgcaaaccag 8760

gggccacgag gtggtggttg ttgacgatga gaggtgtaag aagctgatga agcagttcat 8820

cgacgagagg cctcaggact ggttcgagga tatcggcgag taagcggccg cagataaaat 8880

aaaagatttt atttagtctc cagaaaaagg ggggaatgaa agaccccacc tgtaggtttg 8940

gcaagctagc ttaagtaacg ccattttgca aggcatggaa aaatacataa ctgagaatag 9000

agaagttcag atcaaggtca ggaacagatg gaacagctga atatgggcca aacaggatat 9060

ctgtggtaag cagttcctgc cccggctcag ggccaagaac agatggaaca gctgaatatg 9120

ggccaaacag gatatctgtg gtaagcagtt cctgccccgg ctcagggcca agaacagatg 9180

gtccccagat gcggtccagc cctcagcagt ttctagagaa ccatcagatg tttccagggt 9240

gccccaagga cctgaaatga ccctgtgcct tatttgaact aaccaatcag ttcgcttctc 9300

gcttctgttc gcgcgcttct gctccccgag ctcaataaaa gagcccacaa cccctcactc 9360

ggggcgccag tcctccgatt gactgagtcg cccgggtacc cgtgtatcca ataaaccctc 9420

ttgcagttgc atccgacttg tggtctcgct gttccttggg agggtctcct ctgagtgatt 9480

gactacccgt cagcgggggt ctttcattac atgtgagcaa aaggccagca aaaggccagg 9540

aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 9600

cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 9660

gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 9720

tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg 9780

tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 9840

cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 9900

gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 9960

ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 10020

ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 10080

ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 10140

agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 10200

aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 10260

atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 10320

tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 10380

tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 10440

tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 10500

gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 10560

tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 10620

ttgcgcaacg ttgttgccat tgctgcaggc atcgtggtgt cacgctcgtc gtttggtatg 10680

gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 10740

aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 10800

ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 10860

tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 10920

ccgagttgct cttgcccggc gtcaacacgg gataataccg cgccacatag cagaacttta 10980

aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 11040

ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 11100

ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 11160

agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 11220

tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 11280

ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt 11340

atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct tcaagaattc 11400

at 11402

<210> 54

<211> 11411

<212> DNA

<213> 人工序列

<220>

<223> pAC3-GSG-P2A-yCD2

<400> 54

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctgg tttagtgaac cggcgccagt cctccgattg 600

actgagtcgc ccgggtaccc gtgtatccaa taaaccctct tgcagttgca tccgacttgt 660

ggtctcgctg ttccttggga gggtctcctc tgagtgattg actacccgtc agcgggggtc 720

tttcatttgg gggctcgtcc gggatcggga gacccctgcc cagggaccac cgacccacca 780

ccgggaggta agctggccag caacttatct gtgtctgtcc gattgtctag tgtctatgac 840

tgattttatg cgcctgcgtc ggtactagtt agctaactag ctctgtatct ggcggacccg 900

tggtggaact gacgagttcg gaacacccgg ccgcaaccct gggagacgtc ccagggactt 960

cgggggccgt ttttgtggcc cgacctgagt ccaaaaatcc cgatcgtttt ggactctttg 1020

gtgcaccccc cttagaggag ggatatgtgg ttctggtagg agacgagaac ctaaaacagt 1080

tcccgcctcc gtctgaattt ttgctttcgg tttgggaccg aagccgcgcc gcgcgtcttg 1140

tctgctgcag catcgttctg tgttgtctct gtctgactgt gtttctgtat ttgtctgaga 1200

atatgggcca gactgttacc actcccttaa gtttgacctt aggtcactgg aaagatgtcg 1260

agcggatcgc tcacaaccag tcggtagatg tcaagaagag acgttgggtt accttctgct 1320

ctgcagaatg gccaaccttt aacgtcggat ggccgcgaga cggcaccttt aaccgagacc 1380

tcatcaccca ggttaagatc aaggtctttt cacctggccc gcatggacac ccagaccagg 1440

tcccctacat cgtgacctgg gaagccttgg cttttgaccc ccctccctgg gtcaagccct 1500

ttgtacaccc taagcctccg cctcctcttc ctccatccgc cccgtctctc ccccttgaac 1560

ctcctcgttc gaccccgcct cgatcctccc tttatccagc cctcactcct tctctaggcg 1620

ccaaacctaa acctcaagtt ctttctgaca gtggggggcc gctcatcgac ctacttacag 1680

aagacccccc gccttatagg gacccaagac cacccccttc cgacagggac ggaaatggtg 1740

gagaagcgac ccctgcggga gaggcaccgg acccctcccc aatggcatct cgcctacgtg 1800

ggagacggga gccccctgtg gccgactcca ctacctcgca ggcattcccc ctccgcgcag 1860

gaggaaacgg acagcttcaa tactggccgt tctcctcttc tgacctttac aactggaaaa 1920

ataataaccc ttctttttct gaagatccag gtaaactgac agctctgatc gagtctgttc 1980

tcatcaccca tcagcccacc tgggacgact gtcagcagct gttggggact ctgctgaccg 2040

gagaagaaaa acaacgggtg ctcttagagg ctagaaaggc ggtgcggggc gatgatgggc 2100

gccccactca actgcccaat gaagtcgatg ccgcttttcc cctcgagcgc ccagactggg 2160

attacaccac ccaggcaggt aggaaccacc tagtccacta tcgccagttg ctcctagcgg 2220

gtctccaaaa cgcgggcaga agccccacca atttggccaa ggtaaaagga ataacacaag 2280

ggcccaatga gtctccctcg gccttcctag agagacttaa ggaagcctat cgcaggtaca 2340

ctccttatga ccctgaggac ccagggcaag aaactaatgt gtctatgtct ttcatttggc 2400

agtctgcccc agacattggg agaaagttag agaggttaga agatttaaaa aacaagacgc 2460

ttggagattt ggttagagag gcagaaaaga tctttaataa acgagaaacc ccggaagaaa 2520

gagaggaacg tatcaggaga gaaacagagg aaaaagaaga acgccgtagg acagaggatg 2580

agcagaaaga gaaagaaaga gatcgtagga gacatagaga gatgagcaag ctattggcca 2640

ctgtcgttag tggacagaaa caggatagac agggaggaga acgaaggagg tcccaactcg 2700

atcgcgacca gtgtgcctac tgcaaagaaa aggggcactg ggctaaagat tgtcccaaga 2760

aaccacgagg acctcgggga ccaagacccc agacctccct cctgacccta gatgactagg 2820

gaggtcaggg tcaggagccc ccccctgaac ccaggataac cctcaaagtc ggggggcaac 2880

ccgtcacctt cctggtagat actggggccc aacactccgt gctgacccaa aatcctggac 2940

ccctaagtga taagtctgcc tgggtccaag gggctactgg aggaaagcgg tatcgctgga 3000

ccacggatcg caaagtacat ctagctaccg gtaaggtcac ccactctttc ctccatgtac 3060

cagactgtcc ctatcctctg ttaggaagag atttgctgac taaactaaaa gcccaaatcc 3120

actttgaggg atcaggagcc caggttatgg gaccaatggg gcagcccctg caagtgttga 3180

ccctaaatat agaagatgag catcggctac atgagacctc aaaagagcca gatgtttctc 3240

tagggtccac atggctgtct gattttcctc aggcctgggc ggaaaccggg ggcatgggac 3300

tggcagttcg ccaagctcct ctgatcatac ctctgaaagc aacctctacc cccgtgtcca 3360

taaaacaata ccccatgtca caagaagcca gactggggat caagccccac atacagagac 3420

tgttggacca gggaatactg gtaccctgcc agtccccctg gaacacgccc ctgctacccg 3480

ttaagaaacc agggactaat gattataggc ctgtccagga tctgagagaa gtcaacaagc 3540

gggtggaaga catccacccc accgtgccca acccttacaa cctcttgagc gggctcccac 3600

cgtcccacca gtggtacact gtgcttgatt taaaggatgc ctttttctgc ctgagactcc 3660

accccaccag tcagcctctc ttcgcctttg agtggagaga tccagagatg ggaatctcag 3720

gacaattgac ctggaccaga ctcccacagg gtttcaaaaa cagtcccacc ctgtttgatg 3780

aggcactgca cagagaccta gcagacttcc ggatccagca cccagacttg atcctgctac 3840

agtacgtgga tgacttactg ctggccgcca cttctgagct agactgccaa caaggtactc 3900

gggccctgtt acaaacccta gggaacctcg ggtatcgggc ctcggccaag aaagcccaaa 3960

tttgccagaa acaggtcaag tatctggggt atcttctaaa agagggtcag agatggctga 4020

ctgaggccag aaaagagact gtgatggggc agcctactcc gaagacccct cgacaactaa 4080

gggagttcct agggacggca ggcttctgtc gcctctggat ccctgggttt gcagaaatgg 4140

cagccccctt gtaccctctc accaaaacgg ggactctgtt taattggggc ccagaccaac 4200

aaaaggccta tcaagaaatc aagcaagctc ttctaactgc cccagccctg gggttgccag 4260

atttgactaa gccctttgaa ctctttgtcg acgagaagca gggctacgcc aaaggtgtcc 4320

taacgcaaaa actgggacct tggcgtcggc cggtggccta cctgtccaaa aagctagacc 4380

cagtagcagc tgggtggccc ccttgcctac ggatggtagc agccattgcc gtactgacaa 4440

aggatgcagg caagctaacc atgggacagc cactagtcat tctggccccc catgcagtag 4500

aggcactagt caaacaaccc cccgaccgct ggctttccaa cgcccggatg actcactatc 4560

aggccttgct tttggacacg gaccgggtcc agttcggacc ggtggtagcc ctgaacccgg 4620

ctacgctgct cccactgcct gaggaagggc tgcaacacaa ctgccttgat atcctggccg 4680

aagcccacgg aacccgaccc gacctaacgg accagccgct cccagacgcc gaccacacct 4740

ggtacacgga tggaagcagt ctcttacaag agggacagcg taaggcggga gctgcggtga 4800

ccaccgagac cgaggtaatc tgggctaaag ccctgccagc cgggacatcc gctcagcggg 4860

ctgaactgat agcactcacc caggccctaa agatggcaga aggtaagaag ctaaatgttt 4920

atactgatag ccgttatgct tttgctactg cccatatcca tggagaaata tacagaaggc 4980

gtgggttgct cacatcagaa ggcaaagaga tcaaaaataa agacgagatc ttggccctac 5040

taaaagccct ctttctgccc aaaagactta gcataatcca ttgtccagga catcaaaagg 5100

gacacagcgc cgaggctaga ggcaaccgga tggctgacca agcggcccga aaggcagcca 5160

tcacagagac tccagacacc tctaccctcc tcatagaaaa ttcatcaccc tacacctcag 5220

aacattttca ttacacagtg actgatataa aggacctaac caagttgggg gccatttatg 5280

ataaaacaaa gaagtattgg gtctaccaag gaaaacctgt gatgcctgac cagtttactt 5340

ttgaattatt agactttctt catcagctga ctcacctcag cttctcaaaa atgaaggctc 5400

tcctagagag aagccacagt ccctactaca tgctgaaccg ggatcgaaca ctcaaaaata 5460

tcactgagac ctgcaaagct tgtgcacaag tcaacgccag caagtctgcc gttaaacagg 5520

gaactagggt ccgcgggcat cggcccggca ctcattggga gatcgatttc accgagataa 5580

agcccggatt gtatggctat aaatatcttc tagtttttat agataccttt tctggctgga 5640

tagaagcctt cccaaccaag aaagaaaccg ccaaggtcgt aaccaagaag ctactagagg 5700

agatcttccc caggttcggc atgcctcagg tattgggaac tgacaatggg cctgccttcg 5760

tctccaaggt gagtcagaca gtggccgatc tgttggggat tgattggaaa ttacattgtg 5820

catacagacc ccaaagctca ggccaggtag aaagaatgaa tagaaccatc aaggagactt 5880

taactaaatt aacgcttgca actggctcta gagactgggt gctcctactc cccttagccc 5940

tgtaccgagc ccgcaacacg ccgggccccc atggcctcac cccatatgag atcttatatg 6000

gggcaccccc gccccttgta aacttccctg accctgacat gacaagagtt actaacagcc 6060

cctctctcca agctcactta caggctctct acttagtcca gcacgaagtc tggagacctc 6120

tggcggcagc ctaccaagaa caactggacc gaccggtggt acctcaccct taccgagtcg 6180

gcgacacagt gtgggtccgc cgacaccaga ctaagaacct agaacctcgc tggaaaggac 6240

cttacacagt cctgctgacc acccccaccg ccctcaaagt agacggcatc gcagcttgga 6300

tacacgccgc ccacgtgaag gctgccgacc ccgggggtgg accatcctct agactgacat 6360

ggcgcgttca acgctctcaa aaccccctca agataagatt aacccgtgga agcccttaat 6420

agtcatggga gtcctgttag gagtagggat ggcagagagc ccccatcagg tctttaatgt 6480

aacctggaga gtcaccaacc tgatgactgg gcgtaccgcc aatgccacct ccctcctggg 6540

aactgtacaa gatgccttcc caaaattata ttttgatcta tgtgatctgg tcggagagga 6600

gtgggaccct tcagaccagg aaccgtatgt cgggtatggc tgcaagtacc ccgcagggag 6660

acagcggacc cggacttttg acttttacgt gtgccctggg cataccgtaa agtcggggtg 6720

tgggggacca ggagagggct actgtggtaa atgggggtgt gaaaccaccg gacaggctta 6780

ctggaagccc acatcatcgt gggacctaat ctcccttaag cgcggtaaca ccccctggga 6840

cacgggatgc tctaaagttg cctgtggccc ctgctacgac ctctccaaag tatccaattc 6900

cttccaaggg gctactcgag ggggcagatg caaccctcta gtcctagaat tcactgatgc 6960

aggaaaaaag gctaactggg acgggcccaa atcgtgggga ctgagactgt accggacagg 7020

aacagatcct attaccatgt tctccctgac ccggcaggtc cttaatgtgg gaccccgagt 7080

ccccataggg cccaacccag tattacccga ccaaagactc ccttcctcac caatagagat 7140

tgtaccggct ccacagccac ctagccccct caataccagt tacccccctt ccactaccag 7200

tacaccctca acctccccta caagtccaag tgtcccacag ccacccccag gaactggaga 7260

tagactacta gctctagtca aaggagccta tcaggcgctt aacctcacca atcccgacaa 7320

gacccaagaa tgttggctgt gcttagtgtc gggacctcct tattacgaag gagtagcggt 7380

cgtgggcact tataccaatc attccaccgc tccggccaac tgtacggcca cttcccaaca 7440

taagcttacc ctatctgaag tgacaggaca gggcctatgc atgggggcag tacctaaaac 7500

tcaccaggcc ttatgtaaca ccacccaaag cgccggctca ggatcctact accttgcagc 7560

acccgccgga acaatgtggg cttgcagcac tggattgact ccctgcttgt ccaccacggt 7620

gctcaatcta accacagatt attgtgtatt agttgaactc tggcccagag taatttacca 7680

ctcccccgat tatatgtatg gtcagcttga acagcgtacc aaatataaaa gagagccagt 7740

atcattgacc ctggcccttc tactaggagg attaaccatg ggagggattg cagctggaat 7800

agggacgggg accactgcct taattaaaac ccagcagttt gagcagcttc atgccgctat 7860

ccagacagac ctcaacgaag tcgaaaagtc aattaccaac ctagaaaagt cactgacctc 7920

gttgtctgaa gtagtcctac agaaccgcag aggcctagat ttgctattcc taaaggaggg 7980

aggtctctgc gcagccctaa aagaagaatg ttgtttttat gcagaccaca cggggctagt 8040

gagagacagc atggccaaat taagagaaag gcttaatcag agacaaaaac tatttgagac 8100

aggccaagga tggttcgaag ggctgtttaa tagatccccc tggtttacca ccttaatctc 8160

caccatcatg ggacctctaa tagtactctt actgatctta ctctttggac cttgcattct 8220

caatcgattg gtccaatttg ttaaagacag gatctcagtg gtccaggctc tggttttgac 8280

tcagcaatat caccagctaa aacccataga gtacgagcca ggaagcggag ctactaactt 8340

cagcctgctg aagcaggctg gagacgtgga ggagaaccct ggacctggcg cgcctatggt 8400

gaccggcggc atggcctcca agtgggatca aaagggcatg gatatcgctt acgaggaggc 8460

cctgctgggc tacaaggagg gcggcgtgcc tatcggcggc tgtctgatca acaacaagga 8520

cggcagtgtg ctgggcaggg gccacaacat gaggttccag aagggctccg ccaccctgca 8580

cggcgagatc tccaccctgg agaactgtgg caggctggag ggcaaggtgt acaaggacac 8640

caccctgtac accaccctgt ccccttgtga catgtgtacc ggcgctatca tcatgtacgg 8700

catccctagg tgtgtgatcg gcgagaacgt gaacttcaag tccaagggcg agaagtacct 8760

gcaaaccagg ggccacgagg tggtggttgt tgacgatgag aggtgtaaga agctgatgaa 8820

gcagttcatc gacgagaggc ctcaggactg gttcgaggat atcggcgagt aagcggccgc 8880

agataaaata aaagatttta tttagtctcc agaaaaaggg gggaatgaaa gaccccacct 8940

gtaggtttgg caagctagct taagtaacgc cattttgcaa ggcatggaaa aatacataac 9000

tgagaataga gaagttcaga tcaaggtcag gaacagatgg aacagctgaa tatgggccaa 9060

acaggatatc tgtggtaagc agttcctgcc ccggctcagg gccaagaaca gatggaacag 9120

ctgaatatgg gccaaacagg atatctgtgg taagcagttc ctgccccggc tcagggccaa 9180

gaacagatgg tccccagatg cggtccagcc ctcagcagtt tctagagaac catcagatgt 9240

ttccagggtg ccccaaggac ctgaaatgac cctgtgcctt atttgaacta accaatcagt 9300

tcgcttctcg cttctgttcg cgcgcttctg ctccccgagc tcaataaaag agcccacaac 9360

ccctcactcg gggcgccagt cctccgattg actgagtcgc ccgggtaccc gtgtatccaa 9420

taaaccctct tgcagttgca tccgacttgt ggtctcgctg ttccttggga gggtctcctc 9480

tgagtgattg actacccgtc agcgggggtc tttcattaca tgtgagcaaa aggccagcaa 9540

aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 9600

gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 9660

agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 9720

cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcaatgctca 9780

cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 9840

ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 9900

gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 9960

tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 10020

acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 10080

tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 10140

attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 10200

gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 10260

ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 10320

taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 10380

ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 10440

ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 10500

gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 10560

ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 10620

gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg 10680

tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 10740

atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 10800

gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 10860

tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 10920

atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc gccacatagc 10980

agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 11040

ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 11100

tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 11160

aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 11220

tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 11280

aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 11340

accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctt 11400

caagaattca t 11411

<210> 55

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 马鼻炎A病毒2A肽

<400> 55

Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 56

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫2A肽

<400> 56

Pro Val Lys Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp

1 5 10 15

Val Glu Ser Asn Pro Gly Pro

20

<210> 57

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 猪特斯科病毒-1 2A肽

<400> 57

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15

Pro Gly Pro

<210> 58

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> Thosea asigna病毒2A肽

<400> 58

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15

Gly Pro

<210> 59

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 脑心肌炎病毒-B 2A肽

<400> 59

Gly Ile Phe Asn Ala His Tyr Ala Gly Tyr Phe Ala Asp Leu Leu Ile

1 5 10 15

His Asp Ile Glu Thr Asn Pro Gly Pro

20 25

<210> 60

<211> 17

<212> PRT

<213> 人工序列

<220>

<223> 脑心肌炎病毒-D 2A肽

<400> 60

Gly Tyr Phe Ala Asp Leu Leu Ile His Asp Ile Glu Thr Asn Pro Gly

1 5 10 15

Pro

<210> 61

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 脑心肌炎病毒-PV21 2A肽

<400> 61

Arg Ile Phe Asn Ala His Tyr Ala Gly Tyr Phe Ala Asp Leu Leu Ile

1 5 10 15

His Asp Ile Glu Thr Asn Pro Gly Pro

20 25

<210> 62

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 门戈病毒2A肽

<400> 62

His Val Phe Glu Thr His Tyr Ala Gly Tyr Phe Ser Lys Leu Leu Ile

1 5 10 15

His Asp Val Glu Thr Asn Pro Gly Pro

20 25

<210> 63

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 泰勒脑脊髓炎病毒-GD7 2A肽

<400> 63

Lys Ala Val Arg Gly Tyr His Ala Asp Tyr Tyr Lys Gln Arg Leu Ile

1 5 10 15

His Asp Val Glu Met Asn Pro Gly Pro

20 25

<210> 64

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 泰勒脑脊髓炎病毒-DA 2A肽

<400> 64

Arg Ala Val Arg Ala Tyr His Ala Asp Tyr Tyr Lys Gln Arg Leu Ile

1 5 10 15

His Asp Val Glu Met Asn Pro Gly Pro

20 25

<210> 65

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 泰勒脑脊髓炎病毒-BEAN 2A肽

<400> 65

Lys Ala Val Arg Gly Tyr His Ala Asp Tyr Tyr Arg Gln Arg Leu Ile

1 5 10 15

His Asp Val Glu Thr Asn Pro Gly Pro

20 25

<210> 66

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 泰勒氏样病毒2A肽

<400> 66

Lys His Val Arg Glu Tyr His Ala Ala Tyr Tyr Lys Gln Arg Leu Met

1 5 10 15

His Asp Val Glu Thr Asn Pro Gly Pro

20 25

<210> 67

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> Ljungan病毒-174F 2A肽

<400> 67

Met His Ser Asp Glu Met Asp Phe Ala Gly Gly Lys Phe Leu Asn Gln

1 5 10 15

Cys Gly Asp Val Glu Thr Asn Pro Gly Pro

20 25

<210> 68

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> Ljungan病毒-145SL 2A肽

<400> 68

Met His Asn Asp Glu Met Asp Tyr Ser Gly Gly Lys Phe Leu Asn Gln

1 5 10 15

Cys Gly Asp Val Glu Ser Asn Pro Gly Pro

20 25

<210> 69

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> Ljungan病毒-(87-012) 2A肽

<400> 69

Met His Ser Asp Glu Met Asp Phe Ala Gly Gly Lys Phe Leu Asn Gln

1 5 10 15

Cys Gly Asp Val Glu Thr Asn Pro Gly Pro

20 25

<210> 70

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> Ljungan病毒 - (M1146) 2A肽

<400> 70

Tyr His Asp Lys Asp Met Asp Tyr Ala Gly Gly Lys Phe Leu Asn Gln

1 5 10 15

Cys Gly Asp Val Glu Thr Asn Pro Gly Pro

20 25

<210> 71

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒2A肽

<400> 71

Ala Pro Ala Lys Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 72

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒-A12 2A肽

<400> 72

Ala Pro Gly Lys Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 73

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒-C1 2A肽

<400> 73

Ala Pro Ala Lys Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 74

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒-O1G 2A肽

<400> 74

Ala Pro Val Lys Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Met Glu Ser Asn Pro Gly Pro

20

<210> 75

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒O1K 2A肽

<400> 75

Ala Pro Val Lys Gln Leu Thr Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 76

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒 - O (台湾) 2A肽

<400> 76

Ala Pro Ala Lys Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 77

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒 - O/SK 2A肽

<400> 77

Ala Pro Val Lys Gln Leu Leu Ser Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 78

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒 - SAT3 2A肽

<400> 78

Lys Pro Asp Lys Gln Met Cys Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 79

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 口蹄疫病毒 - SAT2 2A肽

<400> 79

Gly Val Ala Lys Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 80

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> 马鼻炎A病毒2A肽

<400> 80

Asn Ile Asn Lys Gln Cys Thr Asn Tyr Ser Leu Leu Lys Leu Ala Gly

1 5 10 15

Asp Val Glu Ser Asn Pro Gly Pro

20

<210> 81

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 马鼻炎B病毒2A肽

<400> 81

Thr Ile Leu Ser Glu Gly Ala Thr Asn Phe Ser Leu Leu Lys Leu Ala

1 5 10 15

Gly Asp Val Glu Leu Asn Pro Gly Pro

20 25

<210> 82

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 内源性逆转录病毒-3 2A肽

<400> 82

Asn Leu Leu Ser Gln Gly Ala Thr Asn Phe Asp Leu Leu Lys Leu Ala

1 5 10 15

Gly Asp Val Glu Ser Asn Pro Gly Pro

20 25

<210> 83

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-1 2A肽

<400> 83

Val Met Ala Phe Gln Gly Pro Gly Ala Thr Asn Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 84

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-2 2A肽

<400> 84

Thr Met Met Leu Gln Gly Pro Gly Ala Thr Asn Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 85

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-3 2A肽

<400> 85

Thr Met Ser Phe Gln Gly Pro Gly Ala Ser Ser Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 86

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-4 2A肽

<400> 86

Thr Met Met Leu Gln Gly Pro Gly Ala Ser Asn Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 87

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-5 2A肽

<400> 87

Thr Met Leu Phe Gln Gly Pro Gly Ala Ala Asn Phe Ser Leu Leu Arg

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 88

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-6 2A肽

<400> 88

Thr Met Ser Phe Gln Gly Pro Gly Ala Thr Asn Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 89

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-7 2A肽

<400> 89

Val Val Ser Phe Gln Gly Pro Gly Ala Thr Asn Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 90

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-8 2A肽

<400> 90

Thr Met Ser Leu Gln Gly Pro Gly Ala Thr Asn Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Ile Glu Glu Asn Pro Gly Pro

20 25

<210> 91

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-9 2A肽

<400> 91

Thr Met Ala Phe Gln Gly Pro Gly Ala Thr Asn Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 92

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-10 2A肽

<400> 92

Thr Leu Ser Phe Gln Gly Pro Gly Ala Thr Asn Phe Ser Leu Leu Lys

1 5 10 15

Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 93

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> 蓬塔托罗病毒-11 2A肽

<400> 93

Arg Met Ser Phe Gln Gly Pro Gly Ala Thr Asn Phe Ser Leu Leu Lys

1 5 10 15

Arg Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 94

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 蟋蟀麻痹病毒2A肽

<400> 94

Phe Leu Arg Lys Arg Thr Gln Leu Leu Met Ser Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 95

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 果蝇C病毒2A肽

<400> 95

Glu Ala Ala Arg Gln Met Leu Leu Leu Leu Ser Gly Asp Val Glu Thr

1 5 10 15

Asn Pro Gly Pro

20

<210> 96

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 急性蜜蜂麻痹病毒 2A 肽

<400> 96

Gly Ser Trp Thr Asp Ile Leu Leu Leu Leu Ser Gly Asp Val Glu Thr

1 5 10 15

Asn Pro Gly Pro

20

<210> 97

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 急性蜜蜂麻痹病毒波兰 1 分离株 2A 肽

<400> 97

Gly Ser Trp Thr Asp Ile Leu Leu Leu Leu Ser Gly Asp Val Glu Thr

1 5 10 15

Asn Pro Gly Pro

20

<210> 98

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 急性蜜蜂麻痹病毒匈牙利 1 分离株 2A 肽

<400> 98

Gly Ser Trp Thr Asp Ile Leu Leu Leu Trp Ser Gly Asp Val Glu Thr

1 5 10 15

Asn Pro Gly Pro

20

<210> 99

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 传染性软化病病毒2A肽

<400> 99

Thr Arg Ala Glu Ile Glu Asp Glu Leu Ile Arg Ala Gly Ile Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 100

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 番茄不孕病毒2A肽

<400> 100

Arg Ala Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu

1 5 10 15

Asn Pro Gly Pro

20

<210> 101

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 马脑病病毒2A肽

<400> 101

Gln Gly Ala Gly Arg Gly Ser Leu Val Thr Cys Gly Asp Val Glu Glu

1 5 10 15

Asn Pro Gly Pro

20

<210> 102

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 禽多瘤病毒2A肽

<400> 102

Asn Tyr Pro Met Pro Glu Ala Leu Gln Lys Ile Ile Asp Leu Glu Ser

1 5 10 15

Asn Pro Pro Pro

20

<210> 103

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 克什米尔蜜蜂病毒2A肽

<400> 103

Gly Thr Trp Glu Ser Val Leu Asn Leu Leu Ala Gly Asp Ile Glu Leu

1 5 10 15

Asn Pro Gly Pro

20

<210> 104

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 佩里纳光壳稻小RNA样病毒(a)2A肽

<400> 104

Ala Gln Gly Trp Val Pro Asp Leu Thr Val Asp Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 105

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 佩里纳光壳稻小RNA样病毒 (b) 2A肽

<400> 105

Ile Gly Gly Gly Gln Lys Asp Leu Thr Gln Asp Gly Asp Ile Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 106

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 茶尺蠖小RNA样病毒(a) 2A肽

<400> 106

Ala Gln Gly Trp Ala Pro Asp Leu Thr Gln Asp Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 107

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 茶尺蠖小RNA样病毒(b) 2A肽

<400> 107

Ile Gly Gly Gly Gln Arg Asp Leu Thr Gln Asp Gly Asp Ile Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 108

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 普罗维登斯病毒(a) 2A肽

<400> 108

Val Gly Asp Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Ser Asn

1 5 10 15

Pro Gly Pro

<210> 109

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 普罗维登斯病毒(b) 2A肽

<400> 109

Gly Asp Pro Ile Glu Asp Leu Thr Asp Asp Gly Asp Ile Glu Lys Asn

1 5 10 15

Pro Gly Pro

<210> 110

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 普罗维登斯病毒(c) 2A肽

<400> 110

Ser Gly Gly Arg Gly Ser Leu Leu Thr Ala Gly Asp Val Glu Lys Asn

1 5 10 15

Pro Gly Pro

<210> 111

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 牛轮状病毒2A肽

<400> 111

Ser Lys Phe Gln Ile Asp Arg Ile Leu Ile Ser Gly Asp Ile Glu Leu

1 5 10 15

Asn Pro Gly Pro

20

<210> 112

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 猪轮状病毒2A肽

<400> 112

Ala Lys Phe Gln Ile Asp Lys Ile Leu Ile Ser Gly Asp Val Glu Leu

1 5 10 15

Asn Pro Gly Pro

20

<210> 113

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 人轮状病毒2A肽

<400> 113

Ser Lys Phe Gln Ile Asp Lys Ile Leu Ile Ser Gly Asp Ile Glu Leu

1 5 10 15

Asn Pro Gly Pro

20

<210> 114

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 家蚕呼肠孤病毒2A肽

<400> 114

Phe Arg Ser Asn Tyr Asp Leu Leu Lys Leu Cys Gly Asp Ile Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 115

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 舞毒蛾呼肠孤病毒2A肽

<400> 115

Phe Arg Ser Asn Tyr Asp Leu Leu Lys Leu Cys Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 116

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 点状松毛虫呼肠孤病毒 2A 肽

<400> 116

Phe Arg Ser Asn Tyr Asp Leu Leu Lys Leu Cys Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 117

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 布鲁氏锥虫 TSR1 2A 肽

<400> 117

Ser Ser Ile Ile Arg Thr Lys Met Leu Val Ser Gly Asp Val Glu Glu

1 5 10 15

Asn Pro Gly Pro

20

<210> 118

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 锥虫属 CAB95325.1 2A 肽

<400> 118

Ser Ser Ile Ile Arg Thr Lys Met Leu Leu Ser Gly Asp Val Glu Glu

1 5 10 15

Asn Pro Gly Pro

20

<210> 119

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 锥虫属 CAB95559.1 2A 肽

<400> 119

Ser Ser Ile Ile Arg Thr Lys Ile Leu Leu Ser Gly Asp Val Glu Glu

1 5 10 15

Asn Pro Gly Pro

20

<210> 120

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 克鲁兹锥虫 2A 肽

<400> 120

Cys Asp Ala Gln Arg Gln Lys Leu Leu Leu Ser Gly Asp Ile Glu Gln

1 5 10 15

Asn Pro Gly Pro

20

<210> 121

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> T. maritima aguA 2A肽

<400> 121

Tyr Ile Pro Asp Phe Gly Gly Phe Leu Val Lys Ala Asp Ser Glu Phe

1 5 10 15

Asn Pro Gly Pro

20

<210> 122

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 支气管败血鲍特菌 2A肽

<400> 122

Val His Cys Ala Gly Arg Gly Gly Pro Val Arg Leu Leu Asp Lys Glu

1 5 10 15

Gly Asn Pro Gly Pro

20

<210> 123

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 鼠mor-1F 2A肽

<400> 123

Asp Leu Glu Leu Glu Thr Val Gly Ser His Gln Ala Asp Ala Glu Thr

1 5 10 15

Asn Pro Gly Pro

20

<210> 124

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 黑腹果蝇 mod(mdg4) 2A 肽

<400> 124

Thr Ala Ala Asp Lys Ile Gln Gly Ser Trp Lys Met Asp Thr Glu Gly

1 5 10 15

Asn Pro Gly Pro

20

<210> 125

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 构巢曲菌Ca通过MID1 2A肽

<400> 125

Pro Ile Thr Asn Arg Pro Arg Asn Ser Gly Leu Ile Asp Thr Glu Ile

1 5 10 15

Asn Pro Gly Pro

20

<210> 126

<211> 288

<212> DNA

<213> 人工序列

<220>

<223> Adnectins (10Fn3)序列

<220>

<221> CDS

<222> (1)..(288)

<400> 126

gtg agc gac gtg ccc aga aag ctg gag gtg gtg gcc gcc acc ccc acc 48

Val Ser Asp Val Pro Arg Lys Leu Glu Val Val Ala Ala Thr Pro Thr

1 5 10 15

agc ctg ctg atc agc tgg gac gcc ccc gcc gtg acc gtg aga tac tac 96

Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Arg Tyr Tyr

20 25 30

aga atc acc tac ggc gag acc ggc ggc aac agc ccc gtg cag gag ttc 144

Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe

35 40 45

acc gtg ccc ggc agc aag agc acc gcc acc atc agc ggc ctg aag ccc 192

Thr Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro

50 55 60

ggc gtg gac tac acc atc acc gtg tac gcc gtg acc ggc aga ggc gac 240

Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Gly Arg Gly Asp

65 70 75 80

agc ccc gcc agc agc aag ccc atc agc aac tac aga acc gcc ctg gag 288

Ser Pro Ala Ser Ser Lys Pro Ile Ser Asn Tyr Arg Thr Ala Leu Glu

85 90 95

<210> 127

<211> 96

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 127

Val Ser Asp Val Pro Arg Lys Leu Glu Val Val Ala Ala Thr Pro Thr

1 5 10 15

Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Arg Tyr Tyr

20 25 30

Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe

35 40 45

Thr Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro

50 55 60

Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Gly Arg Gly Asp

65 70 75 80

Ser Pro Ala Ser Ser Lys Pro Ile Ser Asn Tyr Arg Thr Ala Leu Glu

85 90 95

<210> 128

<211> 303

<212> DNA

<213> 人工序列

<220>

<223> Adnectin 1

<220>

<221> CDS

<222> (1)..(303)

<400> 128

gtg agc gac gtg ccc aga aag ctg gag gtg gtg gcc gcc acc ccc acc 48

Val Ser Asp Val Pro Arg Lys Leu Glu Val Val Ala Ala Thr Pro Thr

1 5 10 15

agc ctg ctg atc agc tgg gac agc ggc aga ggc agc tac aga tac tac 96

Ser Leu Leu Ile Ser Trp Asp Ser Gly Arg Gly Ser Tyr Arg Tyr Tyr

20 25 30

aga atc acc tac ggc gag acc ggc ggc aac agc ccc gtg cag gag ttc 144

Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe

35 40 45

acc gtg ccc ggc ccc gtg cac acc gcc acc atc agc ggc ctg aag ccc 192

Thr Val Pro Gly Pro Val His Thr Ala Thr Ile Ser Gly Leu Lys Pro

50 55 60

ggc gtg gac tac acc atc acc gtg tac gcc gtg acc gac cac aag ccc 240

Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Asp His Lys Pro

65 70 75 80

cac gcc gac ggc ccc cac acc tac cac gag agc ccc atc agc aac tac 288

His Ala Asp Gly Pro His Thr Tyr His Glu Ser Pro Ile Ser Asn Tyr

85 90 95

aga acc gcc ctg gag 303

Arg Thr Ala Leu Glu

100

<210> 129

<211> 101

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 129

Val Ser Asp Val Pro Arg Lys Leu Glu Val Val Ala Ala Thr Pro Thr

1 5 10 15

Ser Leu Leu Ile Ser Trp Asp Ser Gly Arg Gly Ser Tyr Arg Tyr Tyr

20 25 30

Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe

35 40 45

Thr Val Pro Gly Pro Val His Thr Ala Thr Ile Ser Gly Leu Lys Pro

50 55 60

Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Asp His Lys Pro

65 70 75 80

His Ala Asp Gly Pro His Thr Tyr His Glu Ser Pro Ile Ser Asn Tyr

85 90 95

Arg Thr Ala Leu Glu

100

<210> 130

<211> 288

<212> DNA

<213> 人工序列

<220>

<223> Adnectin 2

<220>

<221> CDS

<222> (1)..(288)

<400> 130

gtg agc gac gtg ccc aga aag ctg gag gtg gtg gcc gcc acc ccc acc 48

Val Ser Asp Val Pro Arg Lys Leu Glu Val Val Ala Ala Thr Pro Thr

1 5 10 15

agc ctg ctg atc agc tgg gag cac gac tac ccc tac aga aga tac tac 96

Ser Leu Leu Ile Ser Trp Glu His Asp Tyr Pro Tyr Arg Arg Tyr Tyr

20 25 30

aga atc acc tac ggc gag acc ggc ggc aac agc ccc gtg cag gag ttc 144

Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe

35 40 45

acc gtg ccc aag gac gtg gac acc gcc acc atc agc ggc ctg aag ccc 192

Thr Val Pro Lys Asp Val Asp Thr Ala Thr Ile Ser Gly Leu Lys Pro

50 55 60

ggc gtg gac tac acc atc acc gtg tac gcc gtg acc agc agc tac aag 240

Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Ser Ser Tyr Lys

65 70 75 80

tac gac atg cag tac agc ccc atc agc aac tac aga acc gcc ctg gag 288

Tyr Asp Met Gln Tyr Ser Pro Ile Ser Asn Tyr Arg Thr Ala Leu Glu

85 90 95

<210> 131

<211> 96

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 131

Val Ser Asp Val Pro Arg Lys Leu Glu Val Val Ala Ala Thr Pro Thr

1 5 10 15

Ser Leu Leu Ile Ser Trp Glu His Asp Tyr Pro Tyr Arg Arg Tyr Tyr

20 25 30

Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe

35 40 45

Thr Val Pro Lys Asp Val Asp Thr Ala Thr Ile Ser Gly Leu Lys Pro

50 55 60

Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Ser Ser Tyr Lys

65 70 75 80

Tyr Asp Met Gln Tyr Ser Pro Ile Ser Asn Tyr Arg Thr Ala Leu Glu

85 90 95

<210> 132

<211> 276

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (1Fn3)

<220>

<221> CDS

<222> (1)..(276)

<400> 132

agc ggc ccc gtg gag gtg ttc atc acc gag acc ccc agc cag ccc aac 48

Ser Gly Pro Val Glu Val Phe Ile Thr Glu Thr Pro Ser Gln Pro Asn

1 5 10 15

agc cac ccc atc cag tgg aac gcc ccc cag ccc agc cac atc agc aag 96

Ser His Pro Ile Gln Trp Asn Ala Pro Gln Pro Ser His Ile Ser Lys

20 25 30

tac atc ctg aga tgg aga ccc aag aac agc gtg ggc aga tgg aag gag 144

Tyr Ile Leu Arg Trp Arg Pro Lys Asn Ser Val Gly Arg Trp Lys Glu

35 40 45

gcc acc atc ccc ggc cac ctg aac agc tac acc atc aag ggc ctg aag 192

Ala Thr Ile Pro Gly His Leu Asn Ser Tyr Thr Ile Lys Gly Leu Lys

50 55 60

ccc ggc gtg gtg tac gag ggc cag ctg atc agc atc cag cag tac ggc 240

Pro Gly Val Val Tyr Glu Gly Gln Leu Ile Ser Ile Gln Gln Tyr Gly

65 70 75 80

cac cag gag gtg acc aga ttc gac ttc acc acc acc 276

His Gln Glu Val Thr Arg Phe Asp Phe Thr Thr Thr

85 90

<210> 133

<211> 92

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 133

Ser Gly Pro Val Glu Val Phe Ile Thr Glu Thr Pro Ser Gln Pro Asn

1 5 10 15

Ser His Pro Ile Gln Trp Asn Ala Pro Gln Pro Ser His Ile Ser Lys

20 25 30

Tyr Ile Leu Arg Trp Arg Pro Lys Asn Ser Val Gly Arg Trp Lys Glu

35 40 45

Ala Thr Ile Pro Gly His Leu Asn Ser Tyr Thr Ile Lys Gly Leu Lys

50 55 60

Pro Gly Val Val Tyr Glu Gly Gln Leu Ile Ser Ile Gln Gln Tyr Gly

65 70 75 80

His Gln Glu Val Thr Arg Phe Asp Phe Thr Thr Thr

85 90

<210> 134

<211> 270

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (2Fn3)

<220>

<221> CDS

<222> (1)..(270)

<400> 134

agc ccc ctg gtg gcc acc agc gag agc gtg acc gag atc acc gcc agc 48

Ser Pro Leu Val Ala Thr Ser Glu Ser Val Thr Glu Ile Thr Ala Ser

1 5 10 15

agc ttc gtg gtg agc tgg gtg agc gcc agc gac acc gtg agc ggc ttc 96

Ser Phe Val Val Ser Trp Val Ser Ala Ser Asp Thr Val Ser Gly Phe

20 25 30

aga gtg gag tac gag ctg agc gag gag ggc gac gag ccc cag tac ctg 144

Arg Val Glu Tyr Glu Leu Ser Glu Glu Gly Asp Glu Pro Gln Tyr Leu

35 40 45

gac ctg ccc agc acc gcc acc agc gtg aac atc ccc gac ctg ctg ccc 192

Asp Leu Pro Ser Thr Ala Thr Ser Val Asn Ile Pro Asp Leu Leu Pro

50 55 60

ggc aga aag tac atc gtg aac gtg tac cag agc gag gac ggc gag cag 240

Gly Arg Lys Tyr Ile Val Asn Val Tyr Gln Ser Glu Asp Gly Glu Gln

65 70 75 80

agc ctg atc ctg agc acc agc cag acc acc 270

Ser Leu Ile Leu Ser Thr Ser Gln Thr Thr

85 90

<210> 135

<211> 90

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 135

Ser Pro Leu Val Ala Thr Ser Glu Ser Val Thr Glu Ile Thr Ala Ser

1 5 10 15

Ser Phe Val Val Ser Trp Val Ser Ala Ser Asp Thr Val Ser Gly Phe

20 25 30

Arg Val Glu Tyr Glu Leu Ser Glu Glu Gly Asp Glu Pro Gln Tyr Leu

35 40 45

Asp Leu Pro Ser Thr Ala Thr Ser Val Asn Ile Pro Asp Leu Leu Pro

50 55 60

Gly Arg Lys Tyr Ile Val Asn Val Tyr Gln Ser Glu Asp Gly Glu Gln

65 70 75 80

Ser Leu Ile Leu Ser Thr Ser Gln Thr Thr

85 90

<210> 136

<211> 282

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (3Fn3)

<220>

<221> CDS

<222> (1)..(282)

<400> 136

gcc ccc gac gcc ccc ccc gac ccc acc gtg gac cag gtg gac gac acc 48

Ala Pro Asp Ala Pro Pro Asp Pro Thr Val Asp Gln Val Asp Asp Thr

1 5 10 15

agc atc gtg gtg aga tgg agc aga ccc cag gcc ccc atc acc ggc tac 96

Ser Ile Val Val Arg Trp Ser Arg Pro Gln Ala Pro Ile Thr Gly Tyr

20 25 30

aga atc gtg tac agc ccc agc gtg gag ggc agc agc acc gag ctg aac 144

Arg Ile Val Tyr Ser Pro Ser Val Glu Gly Ser Ser Thr Glu Leu Asn

35 40 45

ctg ccc gag acc gcc aac agc gtg acc ctg agc gac ctg cag ccc ggc 192

Leu Pro Glu Thr Ala Asn Ser Val Thr Leu Ser Asp Leu Gln Pro Gly

50 55 60

gtg cag tac aac atc acc atc tac gcc gtg gag gag aac cag gag agc 240

Val Gln Tyr Asn Ile Thr Ile Tyr Ala Val Glu Glu Asn Gln Glu Ser

65 70 75 80

acc ccc gtg gtg atc cag cag gag acc acc ggc acc ccc aga 282

Thr Pro Val Val Ile Gln Gln Glu Thr Thr Gly Thr Pro Arg

85 90

<210> 137

<211> 94

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 137

Ala Pro Asp Ala Pro Pro Asp Pro Thr Val Asp Gln Val Asp Asp Thr

1 5 10 15

Ser Ile Val Val Arg Trp Ser Arg Pro Gln Ala Pro Ile Thr Gly Tyr

20 25 30

Arg Ile Val Tyr Ser Pro Ser Val Glu Gly Ser Ser Thr Glu Leu Asn

35 40 45

Leu Pro Glu Thr Ala Asn Ser Val Thr Leu Ser Asp Leu Gln Pro Gly

50 55 60

Val Gln Tyr Asn Ile Thr Ile Tyr Ala Val Glu Glu Asn Gln Glu Ser

65 70 75 80

Thr Pro Val Val Ile Gln Gln Glu Thr Thr Gly Thr Pro Arg

85 90

<210> 138

<211> 270

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (4Fn3)

<220>

<221> CDS

<222> (1)..(270)

<400> 138

acc gtg ccc agc ccc aga gac ctg cag ttc gtg gag gtg acc gac gtg 48

Thr Val Pro Ser Pro Arg Asp Leu Gln Phe Val Glu Val Thr Asp Val

1 5 10 15

aag gtg acc atc atg tgg acc ccc ccc gag agc gcc gtg acc ggc tac 96

Lys Val Thr Ile Met Trp Thr Pro Pro Glu Ser Ala Val Thr Gly Tyr

20 25 30

aga gtg gac gtg atc ccc gtg aac ctg ccc ggc gag cac ggc cag aga 144

Arg Val Asp Val Ile Pro Val Asn Leu Pro Gly Glu His Gly Gln Arg

35 40 45

ctg ccc atc agc aga aac acc ttc gcc gag gtg acc ggc ctg agc ccc 192

Leu Pro Ile Ser Arg Asn Thr Phe Ala Glu Val Thr Gly Leu Ser Pro

50 55 60

ggc gtg acc tac tac ttc aag gtg ttc gcc gtg agc cac ggc aga gag 240

Gly Val Thr Tyr Tyr Phe Lys Val Phe Ala Val Ser His Gly Arg Glu

65 70 75 80

agc aag ccc ctg acc gcc cag cag acc acc 270

Ser Lys Pro Leu Thr Ala Gln Gln Thr Thr

85 90

<210> 139

<211> 90

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 139

Thr Val Pro Ser Pro Arg Asp Leu Gln Phe Val Glu Val Thr Asp Val

1 5 10 15

Lys Val Thr Ile Met Trp Thr Pro Pro Glu Ser Ala Val Thr Gly Tyr

20 25 30

Arg Val Asp Val Ile Pro Val Asn Leu Pro Gly Glu His Gly Gln Arg

35 40 45

Leu Pro Ile Ser Arg Asn Thr Phe Ala Glu Val Thr Gly Leu Ser Pro

50 55 60

Gly Val Thr Tyr Tyr Phe Lys Val Phe Ala Val Ser His Gly Arg Glu

65 70 75 80

Ser Lys Pro Leu Thr Ala Gln Gln Thr Thr

85 90

<210> 140

<211> 270

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (5Fn3)

<220>

<221> CDS

<222> (1)..(270)

<400> 140

aag ctg gac gcc ccc acc aac ctg cag ttc gtg aac gag acc gac agc 48

Lys Leu Asp Ala Pro Thr Asn Leu Gln Phe Val Asn Glu Thr Asp Ser

1 5 10 15

acc gtg ctg gtg aga tgg acc ccc ccc aga gcc cag atc acc ggc tac 96

Thr Val Leu Val Arg Trp Thr Pro Pro Arg Ala Gln Ile Thr Gly Tyr

20 25 30

aga ctg acc gtg ggc ctg acc aga aga ggc cag ccc aga cag tac aac 144

Arg Leu Thr Val Gly Leu Thr Arg Arg Gly Gln Pro Arg Gln Tyr Asn

35 40 45

gtg ggc ccc agc gtg agc aag tac ccc ctg aga aac ctg cag ccc gcc 192

Val Gly Pro Ser Val Ser Lys Tyr Pro Leu Arg Asn Leu Gln Pro Ala

50 55 60

agc gag tac acc gtg agc ctg gtg gcc atc aag ggc aac cag gag agc 240

Ser Glu Tyr Thr Val Ser Leu Val Ala Ile Lys Gly Asn Gln Glu Ser

65 70 75 80

ccc aag gcc acc ggc gtg ttc acc acc ctg 270

Pro Lys Ala Thr Gly Val Phe Thr Thr Leu

85 90

<210> 141

<211> 90

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 141

Lys Leu Asp Ala Pro Thr Asn Leu Gln Phe Val Asn Glu Thr Asp Ser

1 5 10 15

Thr Val Leu Val Arg Trp Thr Pro Pro Arg Ala Gln Ile Thr Gly Tyr

20 25 30

Arg Leu Thr Val Gly Leu Thr Arg Arg Gly Gln Pro Arg Gln Tyr Asn

35 40 45

Val Gly Pro Ser Val Ser Lys Tyr Pro Leu Arg Asn Leu Gln Pro Ala

50 55 60

Ser Glu Tyr Thr Val Ser Leu Val Ala Ile Lys Gly Asn Gln Glu Ser

65 70 75 80

Pro Lys Ala Thr Gly Val Phe Thr Thr Leu

85 90

<210> 142

<211> 258

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (6Fn3)

<220>

<221> CDS

<222> (1)..(258)

<400> 142

cag ccc ggc agc agc atc ccc ccc tac aac acc gag gtg acc gag acc 48

Gln Pro Gly Ser Ser Ile Pro Pro Tyr Asn Thr Glu Val Thr Glu Thr

1 5 10 15

acc atc gtg atc acc tgg acc ccc gcc ccc aga ctg ggc ttc aag ctg 96

Thr Ile Val Ile Thr Trp Thr Pro Ala Pro Arg Leu Gly Phe Lys Leu

20 25 30

ggc gtg aga ccc agc cag ggc ggc gag gcc ccc aga gag gtg acc agc 144

Gly Val Arg Pro Ser Gln Gly Gly Glu Ala Pro Arg Glu Val Thr Ser

35 40 45

gac agc ggc agc gtg gtg agc ggc ctg acc ccc ggc gtg gag tac gtg 192

Asp Ser Gly Ser Val Val Ser Gly Leu Thr Pro Gly Val Glu Tyr Val

50 55 60

tac acc atc cag gtg ctg aga gac ggc cag gag aga gac gcc ccc atc 240

Tyr Thr Ile Gln Val Leu Arg Asp Gly Gln Glu Arg Asp Ala Pro Ile

65 70 75 80

gtg aac aag gtg gtg acc 258

Val Asn Lys Val Val Thr

85

<210> 143

<211> 86

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 143

Gln Pro Gly Ser Ser Ile Pro Pro Tyr Asn Thr Glu Val Thr Glu Thr

1 5 10 15

Thr Ile Val Ile Thr Trp Thr Pro Ala Pro Arg Leu Gly Phe Lys Leu

20 25 30

Gly Val Arg Pro Ser Gln Gly Gly Glu Ala Pro Arg Glu Val Thr Ser

35 40 45

Asp Ser Gly Ser Val Val Ser Gly Leu Thr Pro Gly Val Glu Tyr Val

50 55 60

Tyr Thr Ile Gln Val Leu Arg Asp Gly Gln Glu Arg Asp Ala Pro Ile

65 70 75 80

Val Asn Lys Val Val Thr

85

<210> 144

<211> 282

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (7Fn3)

<220>

<221> CDS

<222> (1)..(282)

<400> 144

ccc ctg agc ccc ccc acc aac ctg cac ctg gag gcc aac ccc gac acc 48

Pro Leu Ser Pro Pro Thr Asn Leu His Leu Glu Ala Asn Pro Asp Thr

1 5 10 15

ggc gtg ctg acc gtg agc tgg gag aga agc acc acc ccc gac atc acc 96

Gly Val Leu Thr Val Ser Trp Glu Arg Ser Thr Thr Pro Asp Ile Thr

20 25 30

ggc tac aga atc acc acc acc ccc acc aac ggc cag cag ggc aac agc 144

Gly Tyr Arg Ile Thr Thr Thr Pro Thr Asn Gly Gln Gln Gly Asn Ser

35 40 45

ctg gag gag gtg gtg cac gcc gac cag agc agc tgc acc ttc gac aac 192

Leu Glu Glu Val Val His Ala Asp Gln Ser Ser Cys Thr Phe Asp Asn

50 55 60

ctg agc ccc ggc ctg gag tac aac gtg agc gtg tac acc gtg aag gac 240

Leu Ser Pro Gly Leu Glu Tyr Asn Val Ser Val Tyr Thr Val Lys Asp

65 70 75 80

gac aag gag agc gtg ccc atc agc gac acc atc atc ccc tga 282

Asp Lys Glu Ser Val Pro Ile Ser Asp Thr Ile Ile Pro

85 90

<210> 145

<211> 93

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 145

Pro Leu Ser Pro Pro Thr Asn Leu His Leu Glu Ala Asn Pro Asp Thr

1 5 10 15

Gly Val Leu Thr Val Ser Trp Glu Arg Ser Thr Thr Pro Asp Ile Thr

20 25 30

Gly Tyr Arg Ile Thr Thr Thr Pro Thr Asn Gly Gln Gln Gly Asn Ser

35 40 45

Leu Glu Glu Val Val His Ala Asp Gln Ser Ser Cys Thr Phe Asp Asn

50 55 60

Leu Ser Pro Gly Leu Glu Tyr Asn Val Ser Val Tyr Thr Val Lys Asp

65 70 75 80

Asp Lys Glu Ser Val Pro Ile Ser Asp Thr Ile Ile Pro

85 90

<210> 146

<211> 276

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (8Fn3)

<220>

<221> CDS

<222> (1)..(276)

<400> 146

gcc gtg ccc ccc ccc acc gac ctg aga ttc acc aac atc ggc ccc gac 48

Ala Val Pro Pro Pro Thr Asp Leu Arg Phe Thr Asn Ile Gly Pro Asp

1 5 10 15

acc atg aga gtg acc tgg gcc ccc ccc ccc agc atc gac ctg acc aac 96

Thr Met Arg Val Thr Trp Ala Pro Pro Pro Ser Ile Asp Leu Thr Asn

20 25 30

ttc ctg gtg aga tac agc ccc gtg aag aac gag gag gac gtg gcc gag 144

Phe Leu Val Arg Tyr Ser Pro Val Lys Asn Glu Glu Asp Val Ala Glu

35 40 45

ctg agc atc agc ccc agc gac aac gcc gtg gtg ctg acc aac ctg ctg 192

Leu Ser Ile Ser Pro Ser Asp Asn Ala Val Val Leu Thr Asn Leu Leu

50 55 60

ccc ggc acc gag tac gtg gtg agc gtg agc agc gtg tac gag cag cac 240

Pro Gly Thr Glu Tyr Val Val Ser Val Ser Ser Val Tyr Glu Gln His

65 70 75 80

gag agc acc ccc ctg aga ggc aga cag aag acc tga 276

Glu Ser Thr Pro Leu Arg Gly Arg Gln Lys Thr

85 90

<210> 147

<211> 91

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 147

Ala Val Pro Pro Pro Thr Asp Leu Arg Phe Thr Asn Ile Gly Pro Asp

1 5 10 15

Thr Met Arg Val Thr Trp Ala Pro Pro Pro Ser Ile Asp Leu Thr Asn

20 25 30

Phe Leu Val Arg Tyr Ser Pro Val Lys Asn Glu Glu Asp Val Ala Glu

35 40 45

Leu Ser Ile Ser Pro Ser Asp Asn Ala Val Val Leu Thr Asn Leu Leu

50 55 60

Pro Gly Thr Glu Tyr Val Val Ser Val Ser Ser Val Tyr Glu Gln His

65 70 75 80

Glu Ser Thr Pro Leu Arg Gly Arg Gln Lys Thr

85 90

<210> 148

<211> 273

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (9Fn3)

<220>

<221> CDS

<222> (1)..(273)

<400> 148

ggc ctg gac agc ccc acc ggc atc gac ttc agc gac atc acc gcc aac 48

Gly Leu Asp Ser Pro Thr Gly Ile Asp Phe Ser Asp Ile Thr Ala Asn

1 5 10 15

agc ttc acc gtg cac tgg atc gcc ccc aga gcc acc atc acc ggc tac 96

Ser Phe Thr Val His Trp Ile Ala Pro Arg Ala Thr Ile Thr Gly Tyr

20 25 30

aga atc aga cac cac ccc gag cac ttc agc ggc aga ccc aga gag gac 144

Arg Ile Arg His His Pro Glu His Phe Ser Gly Arg Pro Arg Glu Asp

35 40 45

aga gtg ccc cac agc aga aac agc atc acc ctg acc aac ctg acc ccc 192

Arg Val Pro His Ser Arg Asn Ser Ile Thr Leu Thr Asn Leu Thr Pro

50 55 60

ggc acc gag tac gtg gtg agc atc gtg gcc ctg aac ggc aga gag gag 240

Gly Thr Glu Tyr Val Val Ser Ile Val Ala Leu Asn Gly Arg Glu Glu

65 70 75 80

agc ccc ctg ctg atc ggc cag cag agc acc tga 273

Ser Pro Leu Leu Ile Gly Gln Gln Ser Thr

85 90

<210> 149

<211> 90

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 149

Gly Leu Asp Ser Pro Thr Gly Ile Asp Phe Ser Asp Ile Thr Ala Asn

1 5 10 15

Ser Phe Thr Val His Trp Ile Ala Pro Arg Ala Thr Ile Thr Gly Tyr

20 25 30

Arg Ile Arg His His Pro Glu His Phe Ser Gly Arg Pro Arg Glu Asp

35 40 45

Arg Val Pro His Ser Arg Asn Ser Ile Thr Leu Thr Asn Leu Thr Pro

50 55 60

Gly Thr Glu Tyr Val Val Ser Ile Val Ala Leu Asn Gly Arg Glu Glu

65 70 75 80

Ser Pro Leu Leu Ile Gly Gln Gln Ser Thr

85 90

<210> 150

<211> 279

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (10Fn3)

<220>

<221> CDS

<222> (1)..(279)

<400> 150

gtg agc gac gtg ccc aga gac ctg gtg gtg gcc gcc acc ccc acc agc 48

Val Ser Asp Val Pro Arg Asp Leu Val Val Ala Ala Thr Pro Thr Ser

1 5 10 15

ctg ctg atc agc tgg gac gcc ccc gcc gtg acc gtg aga tac tac aga 96

Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Arg Tyr Tyr Arg

20 25 30

atc acc tac ggc gag acc ggc ggc aac agc ccc gtg cag gag ttc acc 144

Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe Thr

35 40 45

gtg ccc ggc agc aag agc acc gcc acc atc agc ggc ctg aag ccc ggc 192

Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro Gly

50 55 60

gtg gac tac acc atc acc gtg tac gcc gtg acc ggc aga ggc gac agc 240

Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Gly Arg Gly Asp Ser

65 70 75 80

ccc gcc agc agc aag ccc atc agc atc aac tac aga acc 279

Pro Ala Ser Ser Lys Pro Ile Ser Ile Asn Tyr Arg Thr

85 90

<210> 151

<211> 93

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 151

Val Ser Asp Val Pro Arg Asp Leu Val Val Ala Ala Thr Pro Thr Ser

1 5 10 15

Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Arg Tyr Tyr Arg

20 25 30

Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu Phe Thr

35 40 45

Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro Gly

50 55 60

Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Gly Arg Gly Asp Ser

65 70 75 80

Pro Ala Ser Ser Lys Pro Ile Ser Ile Asn Tyr Arg Thr

85 90

<210> 152

<211> 270

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (11Fn3)

<220>

<221> CDS

<222> (1)..(270)

<400> 152

gag atc gac aag ccc agc cag atg cag gtg acc gac gtg cag gac aac 48

Glu Ile Asp Lys Pro Ser Gln Met Gln Val Thr Asp Val Gln Asp Asn

1 5 10 15

agc atc agc gtg aag tgg ctg ccc agc agc agc ccc gtg acc ggc tac 96

Ser Ile Ser Val Lys Trp Leu Pro Ser Ser Ser Pro Val Thr Gly Tyr

20 25 30

aga gtg acc acc acc ccc aag aac ggc ccc ggc ccc acc aag acc aag 144

Arg Val Thr Thr Thr Pro Lys Asn Gly Pro Gly Pro Thr Lys Thr Lys

35 40 45

acc gcc ggc ccc gac cag acc gag atg acc atc gag ggc ctg cag ccc 192

Thr Ala Gly Pro Asp Gln Thr Glu Met Thr Ile Glu Gly Leu Gln Pro

50 55 60

acc gtg gag tac gtg gtg agc gtg tac gcc cag aac ccc agc ggc gag 240

Thr Val Glu Tyr Val Val Ser Val Tyr Ala Gln Asn Pro Ser Gly Glu

65 70 75 80

agc cag ccc ctg gtg cag acc gcc gtg acc 270

Ser Gln Pro Leu Val Gln Thr Ala Val Thr

85 90

<210> 153

<211> 90

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 153

Glu Ile Asp Lys Pro Ser Gln Met Gln Val Thr Asp Val Gln Asp Asn

1 5 10 15

Ser Ile Ser Val Lys Trp Leu Pro Ser Ser Ser Pro Val Thr Gly Tyr

20 25 30

Arg Val Thr Thr Thr Pro Lys Asn Gly Pro Gly Pro Thr Lys Thr Lys

35 40 45

Thr Ala Gly Pro Asp Gln Thr Glu Met Thr Ile Glu Gly Leu Gln Pro

50 55 60

Thr Val Glu Tyr Val Val Ser Val Tyr Ala Gln Asn Pro Ser Gly Glu

65 70 75 80

Ser Gln Pro Leu Val Gln Thr Ala Val Thr

85 90

<210> 154

<211> 273

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (12Fn3)

<220>

<221> CDS

<222> (1)..(273)

<400> 154

aac atc gac aga ccc aag ggc ctg gcc ttc acc gac gtg gac gtg gac 48

Asn Ile Asp Arg Pro Lys Gly Leu Ala Phe Thr Asp Val Asp Val Asp

1 5 10 15

agc atc aag atc gcc tgg gag agc ccc cag ggc cag gtg agc aga tac 96

Ser Ile Lys Ile Ala Trp Glu Ser Pro Gln Gly Gln Val Ser Arg Tyr

20 25 30

aga gtg acc tac agc agc ccc gag gac ggc atc cac gag ctg ttc ccc 144

Arg Val Thr Tyr Ser Ser Pro Glu Asp Gly Ile His Glu Leu Phe Pro

35 40 45

gcc ccc gac ggc gag gag gac acc gcc gag ctg cag ggc ctg aga ccc 192

Ala Pro Asp Gly Glu Glu Asp Thr Ala Glu Leu Gln Gly Leu Arg Pro

50 55 60

ggc agc gag tac acc gtg agc gtg gtg gcc ctg cac gac gac atg gag 240

Gly Ser Glu Tyr Thr Val Ser Val Val Ala Leu His Asp Asp Met Glu

65 70 75 80

agc cag ccc ctg atc ggc acc cag agc acc tga 273

Ser Gln Pro Leu Ile Gly Thr Gln Ser Thr

85 90

<210> 155

<211> 90

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 155

Asn Ile Asp Arg Pro Lys Gly Leu Ala Phe Thr Asp Val Asp Val Asp

1 5 10 15

Ser Ile Lys Ile Ala Trp Glu Ser Pro Gln Gly Gln Val Ser Arg Tyr

20 25 30

Arg Val Thr Tyr Ser Ser Pro Glu Asp Gly Ile His Glu Leu Phe Pro

35 40 45

Ala Pro Asp Gly Glu Glu Asp Thr Ala Glu Leu Gln Gly Leu Arg Pro

50 55 60

Gly Ser Glu Tyr Thr Val Ser Val Val Ala Leu His Asp Asp Met Glu

65 70 75 80

Ser Gln Pro Leu Ile Gly Thr Gln Ser Thr

85 90

<210> 156

<211> 276

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (13Fn3)

<220>

<221> CDS

<222> (1)..(276)

<400> 156

gcc atc ccc gcc ccc acc gac ctg aag ttc acc cag gtg acc ccc acc 48

Ala Ile Pro Ala Pro Thr Asp Leu Lys Phe Thr Gln Val Thr Pro Thr

1 5 10 15

agc ctg agc gcc cag tgg acc ccc ccc aac gtg cag ctg acc ggc tac 96

Ser Leu Ser Ala Gln Trp Thr Pro Pro Asn Val Gln Leu Thr Gly Tyr

20 25 30

aga gtg aga gtg acc ccc aag gag aag acc ggc ccc atg aag gag atc 144

Arg Val Arg Val Thr Pro Lys Glu Lys Thr Gly Pro Met Lys Glu Ile

35 40 45

aac ctg gcc ccc gac agc agc agc gtg gtg gtg agc ggc ctg atg gtg 192

Asn Leu Ala Pro Asp Ser Ser Ser Val Val Val Ser Gly Leu Met Val

50 55 60

gcc acc aag tac gag gtg agc gtg tac gcc ctg aag gac acc ctg acc 240

Ala Thr Lys Tyr Glu Val Ser Val Tyr Ala Leu Lys Asp Thr Leu Thr

65 70 75 80

agc aga ccc gcc cag ggc gtg gtg acc acc ctg gag 276

Ser Arg Pro Ala Gln Gly Val Val Thr Thr Leu Glu

85 90

<210> 157

<211> 92

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 157

Ala Ile Pro Ala Pro Thr Asp Leu Lys Phe Thr Gln Val Thr Pro Thr

1 5 10 15

Ser Leu Ser Ala Gln Trp Thr Pro Pro Asn Val Gln Leu Thr Gly Tyr

20 25 30

Arg Val Arg Val Thr Pro Lys Glu Lys Thr Gly Pro Met Lys Glu Ile

35 40 45

Asn Leu Ala Pro Asp Ser Ser Ser Val Val Val Ser Gly Leu Met Val

50 55 60

Ala Thr Lys Tyr Glu Val Ser Val Tyr Ala Leu Lys Asp Thr Leu Thr

65 70 75 80

Ser Arg Pro Ala Gln Gly Val Val Thr Thr Leu Glu

85 90

<210> 158

<211> 264

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (14Fn3)

<220>

<221> CDS

<222> (1)..(264)

<400> 158

aac gtg agc ccc ccc aga aga gcc aga gtg acc gac gcc acc gag acc 48

Asn Val Ser Pro Pro Arg Arg Ala Arg Val Thr Asp Ala Thr Glu Thr

1 5 10 15

acc atc acc atc agc tgg aga acc aag acc gag acc atc acc ggc ttc 96

Thr Ile Thr Ile Ser Trp Arg Thr Lys Thr Glu Thr Ile Thr Gly Phe

20 25 30

cag gtg gac gcc gtg ccc gcc aac ggc cag acc ccc atc cag aga acc 144

Gln Val Asp Ala Val Pro Ala Asn Gly Gln Thr Pro Ile Gln Arg Thr

35 40 45

atc aag ccc gac gtg aga agc tac acc atc acc ggc ctg cag ccc ggc 192

Ile Lys Pro Asp Val Arg Ser Tyr Thr Ile Thr Gly Leu Gln Pro Gly

50 55 60

acc gac tac aag atc tac ctg tac acc ctg aac gac aac gcc aga agc 240

Thr Asp Tyr Lys Ile Tyr Leu Tyr Thr Leu Asn Asp Asn Ala Arg Ser

65 70 75 80

agc gtg gtg atc gac gcc agc acc 264

Ser Val Val Ile Asp Ala Ser Thr

85

<210> 159

<211> 88

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 159

Asn Val Ser Pro Pro Arg Arg Ala Arg Val Thr Asp Ala Thr Glu Thr

1 5 10 15

Thr Ile Thr Ile Ser Trp Arg Thr Lys Thr Glu Thr Ile Thr Gly Phe

20 25 30

Gln Val Asp Ala Val Pro Ala Asn Gly Gln Thr Pro Ile Gln Arg Thr

35 40 45

Ile Lys Pro Asp Val Arg Ser Tyr Thr Ile Thr Gly Leu Gln Pro Gly

50 55 60

Thr Asp Tyr Lys Ile Tyr Leu Tyr Thr Leu Asn Asp Asn Ala Arg Ser

65 70 75 80

Ser Val Val Ile Asp Ala Ser Thr

85

<210> 160

<211> 270

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (15Fn3)

<220>

<221> CDS

<222> (1)..(270)

<400> 160

gcc atc gac gcc ccc agc aac ctg aga ttc ctg gcc acc acc ccc aac 48

Ala Ile Asp Ala Pro Ser Asn Leu Arg Phe Leu Ala Thr Thr Pro Asn

1 5 10 15

agc ctg ctg gtg agc tgg cag ccc ccc aga gcc aga atc acc ggc tac 96

Ser Leu Leu Val Ser Trp Gln Pro Pro Arg Ala Arg Ile Thr Gly Tyr

20 25 30

atc atc aag tac gag aag ccc ggc agc ccc ccc aga gag gtg gtg ccc 144

Ile Ile Lys Tyr Glu Lys Pro Gly Ser Pro Pro Arg Glu Val Val Pro

35 40 45

aga ccc aga ccc ggc gtg acc gag gcc acc atc acc ggc ctg gag ccc 192

Arg Pro Arg Pro Gly Val Thr Glu Ala Thr Ile Thr Gly Leu Glu Pro

50 55 60

ggc acc gag tac acc atc tac gtg atc gcc ctg aag aac aac cag aag 240

Gly Thr Glu Tyr Thr Ile Tyr Val Ile Ala Leu Lys Asn Asn Gln Lys

65 70 75 80

agc gag ccc ctg atc ggc aga aag aag acc 270

Ser Glu Pro Leu Ile Gly Arg Lys Lys Thr

85 90

<210> 161

<211> 90

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 161

Ala Ile Asp Ala Pro Ser Asn Leu Arg Phe Leu Ala Thr Thr Pro Asn

1 5 10 15

Ser Leu Leu Val Ser Trp Gln Pro Pro Arg Ala Arg Ile Thr Gly Tyr

20 25 30

Ile Ile Lys Tyr Glu Lys Pro Gly Ser Pro Pro Arg Glu Val Val Pro

35 40 45

Arg Pro Arg Pro Gly Val Thr Glu Ala Thr Ile Thr Gly Leu Glu Pro

50 55 60

Gly Thr Glu Tyr Thr Ile Tyr Val Ile Ala Leu Lys Asn Asn Gln Lys

65 70 75 80

Ser Glu Pro Leu Ile Gly Arg Lys Lys Thr

85 90

<210> 162

<211> 264

<212> DNA

<213> 人工序列

<220>

<223> Pronectins (16Fn3)

<220>

<221> CDS

<222> (1)..(264)

<400> 162

ccc ggc ctg aac ccc aac gcc agc acc ggc cag gag gcc ctg agc cag 48

Pro Gly Leu Asn Pro Asn Ala Ser Thr Gly Gln Glu Ala Leu Ser Gln

1 5 10 15

acc acc atc agc tgg gcc ccc ttc cag gac acc agc gag tac atc atc 96

Thr Thr Ile Ser Trp Ala Pro Phe Gln Asp Thr Ser Glu Tyr Ile Ile

20 25 30

agc tgc cac ccc gtg ggc acc gac gag gag ccc ctg cag ttc aga gtg 144

Ser Cys His Pro Val Gly Thr Asp Glu Glu Pro Leu Gln Phe Arg Val

35 40 45

ccc ggc acc agc acc agc gcc acc ctg acc ggc ctg acc aga ggc gcc 192

Pro Gly Thr Ser Thr Ser Ala Thr Leu Thr Gly Leu Thr Arg Gly Ala

50 55 60

acc tac aac atc atc gtg gag gcc ctg aag gac cag cag aga cac aag 240

Thr Tyr Asn Ile Ile Val Glu Ala Leu Lys Asp Gln Gln Arg His Lys

65 70 75 80

gtg aga gag gag gtg gtg acc gtg 264

Val Arg Glu Glu Val Val Thr Val

85

<210> 163

<211> 88

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 163

Pro Gly Leu Asn Pro Asn Ala Ser Thr Gly Gln Glu Ala Leu Ser Gln

1 5 10 15

Thr Thr Ile Ser Trp Ala Pro Phe Gln Asp Thr Ser Glu Tyr Ile Ile

20 25 30

Ser Cys His Pro Val Gly Thr Asp Glu Glu Pro Leu Gln Phe Arg Val

35 40 45

Pro Gly Thr Ser Thr Ser Ala Thr Leu Thr Gly Leu Thr Arg Gly Ala

50 55 60

Thr Tyr Asn Ile Ile Val Glu Ala Leu Lys Asp Gln Gln Arg His Lys

65 70 75 80

Val Arg Glu Glu Val Val Thr Val

85

<210> 164

<211> 276

<212> DNA

<213> 人工序列

<220>

<223> Adhiron

<220>

<221> CDS

<222> (1)..(276)

<400> 164

gcc acc ggc gtg aga gcc gtg ccc ggc aac gag aac agc ctg gag atc 48

Ala Thr Gly Val Arg Ala Val Pro Gly Asn Glu Asn Ser Leu Glu Ile

1 5 10 15

gag gag ctg gcc aga ttc gcc gtg gac gag cac aac aag aag gag aac 96

Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His Asn Lys Lys Glu Asn

20 25 30

gcc ctg ctg gag ttc gtg aga gtg gtg aag gcc aag gag cag gtg gtg 144

Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala Lys Glu Gln Val Val

35 40 45

gcc ggc acc atg tac tac ctg acc ctg gag gcc aag gac ggc ggc aag 192

Ala Gly Thr Met Tyr Tyr Leu Thr Leu Glu Ala Lys Asp Gly Gly Lys

50 55 60

aag aag ctg tac gag gcc aag gtg tgg gtg aag ccc tgg gag aac ttc 240

Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys Pro Trp Glu Asn Phe

65 70 75 80

aag gag ctg cag gag ttc aag ccc gtg ggc gac gcc 276

Lys Glu Leu Gln Glu Phe Lys Pro Val Gly Asp Ala

85 90

<210> 165

<211> 92

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 165

Ala Thr Gly Val Arg Ala Val Pro Gly Asn Glu Asn Ser Leu Glu Ile

1 5 10 15

Glu Glu Leu Ala Arg Phe Ala Val Asp Glu His Asn Lys Lys Glu Asn

20 25 30

Ala Leu Leu Glu Phe Val Arg Val Val Lys Ala Lys Glu Gln Val Val

35 40 45

Ala Gly Thr Met Tyr Tyr Leu Thr Leu Glu Ala Lys Asp Gly Gly Lys

50 55 60

Lys Lys Leu Tyr Glu Ala Lys Val Trp Val Lys Pro Trp Glu Asn Phe

65 70 75 80

Lys Glu Leu Gln Glu Phe Lys Pro Val Gly Asp Ala

85 90

<210> 166

<211> 177

<212> DNA

<213> 人工序列

<220>

<223> 亲合体

<220>

<221> CDS

<222> (1)..(177)

<400> 166

gtg gac aac aag ttc aac aag gag cag cag aac gcc ttc tac gag atc 48

Val Asp Asn Lys Phe Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile

1 5 10 15

ctg cac ctg ccc aac ctg aac gag gag cag aga aac gcc ttc atc cag 96

Leu His Leu Pro Asn Leu Asn Glu Glu Gln Arg Asn Ala Phe Ile Gln

20 25 30

agc ctg aag gac gac ccc agc cag agc gcc aac ctg ctg gcc gag gcc 144

Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala

35 40 45

aag aag ctg aac gac gcc cag gcc ccc aag tga 177

Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys

50 55

<210> 167

<211> 58

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 167

Val Asp Asn Lys Phe Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile

1 5 10 15

Leu His Leu Pro Asn Leu Asn Glu Glu Gln Arg Asn Ala Phe Ile Gln

20 25 30

Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala

35 40 45

Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys

50 55

<210> 168

<211> 522

<212> DNA

<213> 人工序列

<220>

<223> Affilins (γ-B-晶状体蛋白)

<220>

<221> CDS

<222> (1)..(522)

<400> 168

ggc aag atc acc ttc tac gag gac aga gcc ttc cag ggc aga agc tac 48

Gly Lys Ile Thr Phe Tyr Glu Asp Arg Ala Phe Gln Gly Arg Ser Tyr

1 5 10 15

gag tgc acc acc gac tgc ccc aac ctg cag ccc tac ttc agc aga tgc 96

Glu Cys Thr Thr Asp Cys Pro Asn Leu Gln Pro Tyr Phe Ser Arg Cys

20 25 30

aac agc atc aga gtg gag agc ggc tgc tgg atg atc tac gag aga ccc 144

Asn Ser Ile Arg Val Glu Ser Gly Cys Trp Met Ile Tyr Glu Arg Pro

35 40 45

aac tac cag ggc cac cag tac ttc ctg aga aga ggc gag tac ccc gac 192

Asn Tyr Gln Gly His Gln Tyr Phe Leu Arg Arg Gly Glu Tyr Pro Asp

50 55 60

tac cag cag tgg atg ggc ctg agc gac agc atc aga agc tgc tgc ctg 240

Tyr Gln Gln Trp Met Gly Leu Ser Asp Ser Ile Arg Ser Cys Cys Leu

65 70 75 80

atc ccc ccc cac agc ggc gcc tac aga atg aag atc tac gac aga gac 288

Ile Pro Pro His Ser Gly Ala Tyr Arg Met Lys Ile Tyr Asp Arg Asp

85 90 95

gag ctg aga ggc cag atg agc gag ctg acc gac gac tgc atc agc gtg 336

Glu Leu Arg Gly Gln Met Ser Glu Leu Thr Asp Asp Cys Ile Ser Val

100 105 110

cag gac aga ttc cac ctg acc gag atc cac agc ctg aac gtg ctg gag 384

Gln Asp Arg Phe His Leu Thr Glu Ile His Ser Leu Asn Val Leu Glu

115 120 125

ggc agc tgg atc ctg tac gag atg ccc aac tac aga ggc aga cag tac 432

Gly Ser Trp Ile Leu Tyr Glu Met Pro Asn Tyr Arg Gly Arg Gln Tyr

130 135 140

ctg ctg aga ccc ggc gag tac aga aga ttc ctg gac tgg ggc gcc ccc 480

Leu Leu Arg Pro Gly Glu Tyr Arg Arg Phe Leu Asp Trp Gly Ala Pro

145 150 155 160

aac gcc aag gtg ggc agc ctg aga aga gtg atg gac ctg tac 522

Asn Ala Lys Val Gly Ser Leu Arg Arg Val Met Asp Leu Tyr

165 170

<210> 169

<211> 174

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 169

Gly Lys Ile Thr Phe Tyr Glu Asp Arg Ala Phe Gln Gly Arg Ser Tyr

1 5 10 15

Glu Cys Thr Thr Asp Cys Pro Asn Leu Gln Pro Tyr Phe Ser Arg Cys

20 25 30

Asn Ser Ile Arg Val Glu Ser Gly Cys Trp Met Ile Tyr Glu Arg Pro

35 40 45

Asn Tyr Gln Gly His Gln Tyr Phe Leu Arg Arg Gly Glu Tyr Pro Asp

50 55 60

Tyr Gln Gln Trp Met Gly Leu Ser Asp Ser Ile Arg Ser Cys Cys Leu

65 70 75 80

Ile Pro Pro His Ser Gly Ala Tyr Arg Met Lys Ile Tyr Asp Arg Asp

85 90 95

Glu Leu Arg Gly Gln Met Ser Glu Leu Thr Asp Asp Cys Ile Ser Val

100 105 110

Gln Asp Arg Phe His Leu Thr Glu Ile His Ser Leu Asn Val Leu Glu

115 120 125

Gly Ser Trp Ile Leu Tyr Glu Met Pro Asn Tyr Arg Gly Arg Gln Tyr

130 135 140

Leu Leu Arg Pro Gly Glu Tyr Arg Arg Phe Leu Asp Trp Gly Ala Pro

145 150 155 160

Asn Ala Lys Val Gly Ser Leu Arg Arg Val Met Asp Leu Tyr

165 170

<210> 170

<211> 294

<212> DNA

<213> 人工序列

<220>

<223> Affimers

<220>

<221> CDS

<222> (1)..(294)

<400> 170

atg atc ccc aga ggc ctg agc gag gcc aag ccc gcc acc ccc gag atc 48

Met Ile Pro Arg Gly Leu Ser Glu Ala Lys Pro Ala Thr Pro Glu Ile

1 5 10 15

cag gag atc gtg gac aag gtg aag ccc cag ctg gag gag aag acc aac 96

Gln Glu Ile Val Asp Lys Val Lys Pro Gln Leu Glu Glu Lys Thr Asn

20 25 30

gag acc tac ggc aag ctg gag gcc gtg cag tac aag acc cag gtg ctg 144

Glu Thr Tyr Gly Lys Leu Glu Ala Val Gln Tyr Lys Thr Gln Val Leu

35 40 45

gcc agc acc aac tac tac atc aag gtg aga gcc ggc gac aac aag tac 192

Ala Ser Thr Asn Tyr Tyr Ile Lys Val Arg Ala Gly Asp Asn Lys Tyr

50 55 60

atg cac ctg aag gtg ttc aac ggc ccc ccc ggc cag aac gcc gac aga 240

Met His Leu Lys Val Phe Asn Gly Pro Pro Gly Gln Asn Ala Asp Arg

65 70 75 80

gtg ctg acc ggc tac cag gtg gac aag aac aag gac gac gag ctg acc 288

Val Leu Thr Gly Tyr Gln Val Asp Lys Asn Lys Asp Asp Glu Leu Thr

85 90 95

ggc ttc 294

Gly Phe

<210> 171

<211> 98

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 171

Met Ile Pro Arg Gly Leu Ser Glu Ala Lys Pro Ala Thr Pro Glu Ile

1 5 10 15

Gln Glu Ile Val Asp Lys Val Lys Pro Gln Leu Glu Glu Lys Thr Asn

20 25 30

Glu Thr Tyr Gly Lys Leu Glu Ala Val Gln Tyr Lys Thr Gln Val Leu

35 40 45

Ala Ser Thr Asn Tyr Tyr Ile Lys Val Arg Ala Gly Asp Asn Lys Tyr

50 55 60

Met His Leu Lys Val Phe Asn Gly Pro Pro Gly Gln Asn Ala Asp Arg

65 70 75 80

Val Leu Thr Gly Tyr Gln Val Asp Lys Asn Lys Asp Asp Glu Leu Thr

85 90 95

Gly Phe

<210> 172

<211> 462

<212> DNA

<213> 人工序列

<220>

<223> 抗运载蛋白(脂质运载蛋白Lcn1)

<220>

<221> CDS

<222> (1)..(462)

<400> 172

atc gcc agc gac gag gag atc cag gac gtg agc ggc acc tgg tac ctg 48

Ile Ala Ser Asp Glu Glu Ile Gln Asp Val Ser Gly Thr Trp Tyr Leu

1 5 10 15

aag gcc atg acc gtg gac aga gag ttc ccc gag atg aac ctg gag agc 96

Lys Ala Met Thr Val Asp Arg Glu Phe Pro Glu Met Asn Leu Glu Ser

20 25 30

gtg acc ccc atg acc ctg acc acc ctg gag ggc ggc aac ctg gag gcc 144

Val Thr Pro Met Thr Leu Thr Thr Leu Glu Gly Gly Asn Leu Glu Ala

35 40 45

aag gtg acc atg ctg atc agc ggc aga tgc cag gag gtg aag gcc gtg 192

Lys Val Thr Met Leu Ile Ser Gly Arg Cys Gln Glu Val Lys Ala Val

50 55 60

ctg gag aag acc gac gag ccc ggc aag tac acc gcc gac ggc ggc aag 240

Leu Glu Lys Thr Asp Glu Pro Gly Lys Tyr Thr Ala Asp Gly Gly Lys

65 70 75 80

cac gtg gcc tac atc atc aga agc cac gtg aag gac cac tac atc ttc 288

His Val Ala Tyr Ile Ile Arg Ser His Val Lys Asp His Tyr Ile Phe

85 90 95

tac agc gag ggc gag ctg cac ggc aag ccc gtg aga ggc gtg aag ctg 336

Tyr Ser Glu Gly Glu Leu His Gly Lys Pro Val Arg Gly Val Lys Leu

100 105 110

gtg ggc aga gac ccc aag aac aac ctg gag gcc ctg ctg gac ttc gag 384

Val Gly Arg Asp Pro Lys Asn Asn Leu Glu Ala Leu Leu Asp Phe Glu

115 120 125

aag gcc gcc ggc gcc aga ggc ctg agc acc gag agc atc ctg atc ccc 432

Lys Ala Ala Gly Ala Arg Gly Leu Ser Thr Glu Ser Ile Leu Ile Pro

130 135 140

aga cag agc gag acc tgc agc ccc ggc agc 462

Arg Gln Ser Glu Thr Cys Ser Pro Gly Ser

145 150

<210> 173

<211> 154

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 173

Ile Ala Ser Asp Glu Glu Ile Gln Asp Val Ser Gly Thr Trp Tyr Leu

1 5 10 15

Lys Ala Met Thr Val Asp Arg Glu Phe Pro Glu Met Asn Leu Glu Ser

20 25 30

Val Thr Pro Met Thr Leu Thr Thr Leu Glu Gly Gly Asn Leu Glu Ala

35 40 45

Lys Val Thr Met Leu Ile Ser Gly Arg Cys Gln Glu Val Lys Ala Val

50 55 60

Leu Glu Lys Thr Asp Glu Pro Gly Lys Tyr Thr Ala Asp Gly Gly Lys

65 70 75 80

His Val Ala Tyr Ile Ile Arg Ser His Val Lys Asp His Tyr Ile Phe

85 90 95

Tyr Ser Glu Gly Glu Leu His Gly Lys Pro Val Arg Gly Val Lys Leu

100 105 110

Val Gly Arg Asp Pro Lys Asn Asn Leu Glu Ala Leu Leu Asp Phe Glu

115 120 125

Lys Ala Ala Gly Ala Arg Gly Leu Ser Thr Glu Ser Ile Leu Ile Pro

130 135 140

Arg Gln Ser Glu Thr Cys Ser Pro Gly Ser

145 150

<210> 174

<211> 534

<212> DNA

<213> 人工序列

<220>

<223> 抗运载蛋白(脂质运载蛋白Lcn2)

<220>

<221> CDS

<222> (1)..(534)

<400> 174

cag gac agc acc agc gac ctg atc ccc gcc ccc ccc ctg agc aag gtg 48

Gln Asp Ser Thr Ser Asp Leu Ile Pro Ala Pro Pro Leu Ser Lys Val

1 5 10 15

ccc ctg cag cag aac ttc cag gac aac cag ttc cag ggc aag tgg tac 96

Pro Leu Gln Gln Asn Phe Gln Asp Asn Gln Phe Gln Gly Lys Trp Tyr

20 25 30

gtg gtg ggc ctg gcc ggc aac gcc atc ctg aga gag gac aag gac ccc 144

Val Val Gly Leu Ala Gly Asn Ala Ile Leu Arg Glu Asp Lys Asp Pro

35 40 45

cag aag atg tac gcc acc atc tac gag ctg aag gag gac aag agc tac 192

Gln Lys Met Tyr Ala Thr Ile Tyr Glu Leu Lys Glu Asp Lys Ser Tyr

50 55 60

aac gtg acc agc gtg ctg ttc aga aag aag aag tgc gac tac tgg atc 240

Asn Val Thr Ser Val Leu Phe Arg Lys Lys Lys Cys Asp Tyr Trp Ile

65 70 75 80

aga acc ttc gtg ccc ggc tgc cag ccc ggc gag ttc acc ctg ggc aac 288

Arg Thr Phe Val Pro Gly Cys Gln Pro Gly Glu Phe Thr Leu Gly Asn

85 90 95

atc aag agc tac ccc ggc ctg acc agc tac ctg gtg aga gtg gtg agc 336

Ile Lys Ser Tyr Pro Gly Leu Thr Ser Tyr Leu Val Arg Val Val Ser

100 105 110

acc aac tac aac cag cac gcc atg gtg ttc ttc aag aag gtg agc cag 384

Thr Asn Tyr Asn Gln His Ala Met Val Phe Phe Lys Lys Val Ser Gln

115 120 125

aac aga gag tac ttc aag atc acc ctg tac ggc aga acc aag gag ctg 432

Asn Arg Glu Tyr Phe Lys Ile Thr Leu Tyr Gly Arg Thr Lys Glu Leu

130 135 140

acc agc gag ctg aag gag aac ttc atc aga ttc agc aag agc ctg ggc 480

Thr Ser Glu Leu Lys Glu Asn Phe Ile Arg Phe Ser Lys Ser Leu Gly

145 150 155 160

ctg ccc gag aac cac atc gtg ttc ccc gtg ccc atc gac cag tgc atc 528

Leu Pro Glu Asn His Ile Val Phe Pro Val Pro Ile Asp Gln Cys Ile

165 170 175

gac ggc 534

Asp Gly

<210> 175

<211> 178

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 175

Gln Asp Ser Thr Ser Asp Leu Ile Pro Ala Pro Pro Leu Ser Lys Val

1 5 10 15

Pro Leu Gln Gln Asn Phe Gln Asp Asn Gln Phe Gln Gly Lys Trp Tyr

20 25 30

Val Val Gly Leu Ala Gly Asn Ala Ile Leu Arg Glu Asp Lys Asp Pro

35 40 45

Gln Lys Met Tyr Ala Thr Ile Tyr Glu Leu Lys Glu Asp Lys Ser Tyr

50 55 60

Asn Val Thr Ser Val Leu Phe Arg Lys Lys Lys Cys Asp Tyr Trp Ile

65 70 75 80

Arg Thr Phe Val Pro Gly Cys Gln Pro Gly Glu Phe Thr Leu Gly Asn

85 90 95

Ile Lys Ser Tyr Pro Gly Leu Thr Ser Tyr Leu Val Arg Val Val Ser

100 105 110

Thr Asn Tyr Asn Gln His Ala Met Val Phe Phe Lys Lys Val Ser Gln

115 120 125

Asn Arg Glu Tyr Phe Lys Ile Thr Leu Tyr Gly Arg Thr Lys Glu Leu

130 135 140

Thr Ser Glu Leu Lys Glu Asn Phe Ile Arg Phe Ser Lys Ser Leu Gly

145 150 155 160

Leu Pro Glu Asn His Ile Val Phe Pro Val Pro Ile Asp Gln Cys Ile

165 170 175

Asp Gly

<210> 176

<211> 255

<212> DNA

<213> 人工序列

<220>

<223> (C426)靶向c-MET的Avimers

<220>

<221> CDS

<222> (1)..(255)

<400> 176

tgc gag agc ggc gag ttc cag tgc cac agc acc ggc aga tgc atc ccc 48

Cys Glu Ser Gly Glu Phe Gln Cys His Ser Thr Gly Arg Cys Ile Pro

1 5 10 15

cag gag tgg gtg tgc gac ggc gac aac gac tgc gag gac agc agc gac 96

Gln Glu Trp Val Cys Asp Gly Asp Asn Asp Cys Glu Asp Ser Ser Asp

20 25 30

gag gcc ccc gac ctg tgc gcc agc gcc gag ccc acc tgc ccc agc ggc 144

Glu Ala Pro Asp Leu Cys Ala Ser Ala Glu Pro Thr Cys Pro Ser Gly

35 40 45

gag ttc cag tgc aga agc acc aac aga tgc atc ccc gag acc tgg ctg 192

Glu Phe Gln Cys Arg Ser Thr Asn Arg Cys Ile Pro Glu Thr Trp Leu

50 55 60

tgc gac ggc gac aac gac tgc gag gac ggc agc gac gag gag agc tgc 240

Cys Asp Gly Asp Asn Asp Cys Glu Asp Gly Ser Asp Glu Glu Ser Cys

65 70 75 80

acc ccc ccc acc tga 255

Thr Pro Pro Thr

<210> 177

<211> 84

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 177

Cys Glu Ser Gly Glu Phe Gln Cys His Ser Thr Gly Arg Cys Ile Pro

1 5 10 15

Gln Glu Trp Val Cys Asp Gly Asp Asn Asp Cys Glu Asp Ser Ser Asp

20 25 30

Glu Ala Pro Asp Leu Cys Ala Ser Ala Glu Pro Thr Cys Pro Ser Gly

35 40 45

Glu Phe Gln Cys Arg Ser Thr Asn Arg Cys Ile Pro Glu Thr Trp Leu

50 55 60

Cys Asp Gly Asp Asn Asp Cys Glu Asp Gly Ser Asp Glu Glu Ser Cys

65 70 75 80

Thr Pro Pro Thr

<210> 178

<211> 267

<212> DNA

<213> 人工序列

<220>

<223> Centyrins (腱生蛋白的Fn3结构域)

<220>

<221> CDS

<222> (1)..(267)

<400> 178

ctg ccc gcc ccc aag aac ctg gtg gtg agc gag gtg acc gag gac agc 48

Leu Pro Ala Pro Lys Asn Leu Val Val Ser Glu Val Thr Glu Asp Ser

1 5 10 15

gcc aga ctg agc tgg acc gcc ccc gac gcc gcc ttc gac agc ttc ctg 96

Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe Leu

20 25 30

atc ggc tac ggc gag agc gag aag gtg ggc gag gcc atc gtg ctg acc 144

Ile Gly Tyr Gly Glu Ser Glu Lys Val Gly Glu Ala Ile Val Leu Thr

35 40 45

gtg ccc ggc agc gag aga agc tac gac ctg acc ggc ctg aag ccc ggc 192

Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly

50 55 60

acc gag tac acc gtg agc atc tac ggc gtg aag ggc ggc cac aga agc 240

Thr Glu Tyr Thr Val Ser Ile Tyr Gly Val Lys Gly Gly His Arg Ser

65 70 75 80

aac ccc ctg agc gcc atc ttc acc acc 267

Asn Pro Leu Ser Ala Ile Phe Thr Thr

85

<210> 179

<211> 89

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 179

Leu Pro Ala Pro Lys Asn Leu Val Val Ser Glu Val Thr Glu Asp Ser

1 5 10 15

Ala Arg Leu Ser Trp Thr Ala Pro Asp Ala Ala Phe Asp Ser Phe Leu

20 25 30

Ile Gly Tyr Gly Glu Ser Glu Lys Val Gly Glu Ala Ile Val Leu Thr

35 40 45

Val Pro Gly Ser Glu Arg Ser Tyr Asp Leu Thr Gly Leu Lys Pro Gly

50 55 60

Thr Glu Tyr Thr Val Ser Ile Tyr Gly Val Lys Gly Gly His Arg Ser

65 70 75 80

Asn Pro Leu Ser Ala Ile Phe Thr Thr

85

<210> 180

<211> 171

<212> DNA

<213> 人工序列

<220>

<223> Kunitz结构域/BPTI

<220>

<221> CDS

<222> (1)..(171)

<400> 180

gtg aga gag gtg tgc agc gag cag gcc gag acc ggc ccc tgc aga gcc 48

Val Arg Glu Val Cys Ser Glu Gln Ala Glu Thr Gly Pro Cys Arg Ala

1 5 10 15

atg atc agc aga tgg tac ttc gac gtg acc gag ggc aag tgc gcc ccc 96

Met Ile Ser Arg Trp Tyr Phe Asp Val Thr Glu Gly Lys Cys Ala Pro

20 25 30

ttc ttc tac ggc ggc tgc tgc ggc ggc aac aga aac aac ttc gac acc 144

Phe Phe Tyr Gly Gly Cys Cys Gly Gly Asn Arg Asn Asn Phe Asp Thr

35 40 45

gag gag tac tgc atg gcc gtg tgc ggc 171

Glu Glu Tyr Cys Met Ala Val Cys Gly

50 55

<210> 181

<211> 57

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 181

Val Arg Glu Val Cys Ser Glu Gln Ala Glu Thr Gly Pro Cys Arg Ala

1 5 10 15

Met Ile Ser Arg Trp Tyr Phe Asp Val Thr Glu Gly Lys Cys Ala Pro

20 25 30

Phe Phe Tyr Gly Gly Cys Cys Gly Gly Asn Arg Asn Asn Phe Asp Thr

35 40 45

Glu Glu Tyr Cys Met Ala Val Cys Gly

50 55

<210> 182

<211> 516

<212> DNA

<213> 人工序列

<220>

<223> Obodies (人类AspRS)

<220>

<221> CDS

<222> (1)..(516)

<400> 182

gag atc atg gac gcc gcc gag gac tac gcc aag gag aga tac ggc atc 48

Glu Ile Met Asp Ala Ala Glu Asp Tyr Ala Lys Glu Arg Tyr Gly Ile

1 5 10 15

agc agc atg atc cag agc cag gag aag ccc gac aga gtg ctg gtg aga 96

Ser Ser Met Ile Gln Ser Gln Glu Lys Pro Asp Arg Val Leu Val Arg

20 25 30

gtg aga gac ctg acc atc cag aag gcc gac gag gtg gtg tgg gtg aga 144

Val Arg Asp Leu Thr Ile Gln Lys Ala Asp Glu Val Val Trp Val Arg

35 40 45

gcc aga gtg cac acc agc aga gcc aag ggc aag cag tgc ttc ctg gtg 192

Ala Arg Val His Thr Ser Arg Ala Lys Gly Lys Gln Cys Phe Leu Val

50 55 60

ctg aga cag cag cag ttc aac gtg cag gcc ctg gtg gcc gtg ggc gac 240

Leu Arg Gln Gln Gln Phe Asn Val Gln Ala Leu Val Ala Val Gly Asp

65 70 75 80

cac gcc agc aag cag atg gtg aag ttc gcc gcc aac atc aac aag gag 288

His Ala Ser Lys Gln Met Val Lys Phe Ala Ala Asn Ile Asn Lys Glu

85 90 95

agc atc gtg gac gtg gag ggc gtg gtg aga aag gtg aac cag aag atc 336

Ser Ile Val Asp Val Glu Gly Val Val Arg Lys Val Asn Gln Lys Ile

100 105 110

ggc agc tgc acc cag cag gac gtg gag ctg cac gtg cag aag atc tac 384

Gly Ser Cys Thr Gln Gln Asp Val Glu Leu His Val Gln Lys Ile Tyr

115 120 125

gtg atc agc ctg gcc gag ccc aga ctg ccc ctg cag ctg gac gac gcc 432

Val Ile Ser Leu Ala Glu Pro Arg Leu Pro Leu Gln Leu Asp Asp Ala

130 135 140

gtg aga ccc gag gcc gag ggc gag gag gag ggc aga gcc acc gtg aac 480

Val Arg Pro Glu Ala Glu Gly Glu Glu Glu Gly Arg Ala Thr Val Asn

145 150 155 160

cag gac acc aga ctg gac aac aga gtg atc gac ctg 516

Gln Asp Thr Arg Leu Asp Asn Arg Val Ile Asp Leu

165 170

<210> 183

<211> 172

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 183

Glu Ile Met Asp Ala Ala Glu Asp Tyr Ala Lys Glu Arg Tyr Gly Ile

1 5 10 15

Ser Ser Met Ile Gln Ser Gln Glu Lys Pro Asp Arg Val Leu Val Arg

20 25 30

Val Arg Asp Leu Thr Ile Gln Lys Ala Asp Glu Val Val Trp Val Arg

35 40 45

Ala Arg Val His Thr Ser Arg Ala Lys Gly Lys Gln Cys Phe Leu Val

50 55 60

Leu Arg Gln Gln Gln Phe Asn Val Gln Ala Leu Val Ala Val Gly Asp

65 70 75 80

His Ala Ser Lys Gln Met Val Lys Phe Ala Ala Asn Ile Asn Lys Glu

85 90 95

Ser Ile Val Asp Val Glu Gly Val Val Arg Lys Val Asn Gln Lys Ile

100 105 110

Gly Ser Cys Thr Gln Gln Asp Val Glu Leu His Val Gln Lys Ile Tyr

115 120 125

Val Ile Ser Leu Ala Glu Pro Arg Leu Pro Leu Gln Leu Asp Asp Ala

130 135 140

Val Arg Pro Glu Ala Glu Gly Glu Glu Glu Gly Arg Ala Thr Val Asn

145 150 155 160

Gln Asp Thr Arg Leu Asp Asn Arg Val Ile Asp Leu

165 170

<210> 184

<211> 267

<212> DNA

<213> 人工序列

<220>

<223> Tn3A

<220>

<221> CDS

<222> (1)..(267)

<400> 184

gcc atc gag gtg aag gac gtg acc gac acc acc gcc ctg atc acc tgg 48

Ala Ile Glu Val Lys Asp Val Thr Asp Thr Thr Ala Leu Ile Thr Trp

1 5 10 15

agc gac gag ttc ggc cac gac tac gac ggc tgc gag ctg acc tac ggc 96

Ser Asp Glu Phe Gly His Asp Tyr Asp Gly Cys Glu Leu Thr Tyr Gly

20 25 30

atc aag gac gtg ccc ggc gac aga acc acc atc gac ctg tgg tgg cac 144

Ile Lys Asp Val Pro Gly Asp Arg Thr Thr Ile Asp Leu Trp Trp His

35 40 45

agc gcc tgg tac agc atc ggc aac ctg aag ccc gac acc gag gac gtg 192

Ser Ala Trp Tyr Ser Ile Gly Asn Leu Lys Pro Asp Thr Glu Asp Val

50 55 60

agc ctg atc tgc tac acc gac cag gag gcc ggc aac ccc gcc aag gag 240

Ser Leu Ile Cys Tyr Thr Asp Gln Glu Ala Gly Asn Pro Ala Lys Glu

65 70 75 80

acc ttc acc acc ggc ctg gtg ccc aga 267

Thr Phe Thr Thr Gly Leu Val Pro Arg

85

<210> 185

<211> 89

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 185

Ala Ile Glu Val Lys Asp Val Thr Asp Thr Thr Ala Leu Ile Thr Trp

1 5 10 15

Ser Asp Glu Phe Gly His Asp Tyr Asp Gly Cys Glu Leu Thr Tyr Gly

20 25 30

Ile Lys Asp Val Pro Gly Asp Arg Thr Thr Ile Asp Leu Trp Trp His

35 40 45

Ser Ala Trp Tyr Ser Ile Gly Asn Leu Lys Pro Asp Thr Glu Asp Val

50 55 60

Ser Leu Ile Cys Tyr Thr Asp Gln Glu Ala Gly Asn Pro Ala Lys Glu

65 70 75 80

Thr Phe Thr Thr Gly Leu Val Pro Arg

85

<210> 186

<211> 276

<212> DNA

<213> 人工序列

<220>

<223> Tn3B

<220>

<221> CDS

<222> (1)..(276)

<400> 186

gcc atc gag gtg gag gac gtg acc gac acc acc gcc ctg atc acc tgg 48

Ala Ile Glu Val Glu Asp Val Thr Asp Thr Thr Ala Leu Ile Thr Trp

1 5 10 15

acc aac aga agc agc tac agc aac ctg cac ggc tgc gag ctg gcc tac 96

Thr Asn Arg Ser Ser Tyr Ser Asn Leu His Gly Cys Glu Leu Ala Tyr

20 25 30

ggc atc aag gac gtg ccc ggc gac aga acc acc atc gac ctg aac cag 144

Gly Ile Lys Asp Val Pro Gly Asp Arg Thr Thr Ile Asp Leu Asn Gln

35 40 45

ccc tac gtg cac tac agc atc ggc aac ctg aag ccc gac acc gag tac 192

Pro Tyr Val His Tyr Ser Ile Gly Asn Leu Lys Pro Asp Thr Glu Tyr

50 55 60

gag gtg agc ctg atc tgc ctg acc acc gac ggc acc tac aac aac ccc 240

Glu Val Ser Leu Ile Cys Leu Thr Thr Asp Gly Thr Tyr Asn Asn Pro

65 70 75 80

gcc aag gag acc ttc acc acc ggc ctg gtg ccc aga 276

Ala Lys Glu Thr Phe Thr Thr Gly Leu Val Pro Arg

85 90

<210> 187

<211> 92

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 187

Ala Ile Glu Val Glu Asp Val Thr Asp Thr Thr Ala Leu Ile Thr Trp

1 5 10 15

Thr Asn Arg Ser Ser Tyr Ser Asn Leu His Gly Cys Glu Leu Ala Tyr

20 25 30

Gly Ile Lys Asp Val Pro Gly Asp Arg Thr Thr Ile Asp Leu Asn Gln

35 40 45

Pro Tyr Val His Tyr Ser Ile Gly Asn Leu Lys Pro Asp Thr Glu Tyr

50 55 60

Glu Val Ser Leu Ile Cys Leu Thr Thr Asp Gly Thr Tyr Asn Asn Pro

65 70 75 80

Ala Lys Glu Thr Phe Thr Thr Gly Leu Val Pro Arg

85 90

<210> 188

<211> 177

<212> DNA

<213> 人工序列

<220>

<223> Hckomers

<220>

<221> CDS

<222> (1)..(177)

<400> 188

acc ctg ttc gtg gcc ctg tac gac tac gag gcc aga acc gag gac gag 48

Thr Leu Phe Val Ala Leu Tyr Asp Tyr Glu Ala Arg Thr Glu Asp Glu

1 5 10 15

ctg agc ttc cac aag ggc gag aag ttc cag atc ctg aac agc agc gag 96

Leu Ser Phe His Lys Gly Glu Lys Phe Gln Ile Leu Asn Ser Ser Glu

20 25 30

ggc gac tgg tgg gag gcc aga gac agc ctg acc acc ggc gag acc ggc 144

Gly Asp Trp Trp Glu Ala Arg Asp Ser Leu Thr Thr Gly Glu Thr Gly

35 40 45

tac atc ccc agc aac tac gtg gcc ccc gtg gac 177

Tyr Ile Pro Ser Asn Tyr Val Ala Pro Val Asp

50 55

<210> 189

<211> 59

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 189

Thr Leu Phe Val Ala Leu Tyr Asp Tyr Glu Ala Arg Thr Glu Asp Glu

1 5 10 15

Leu Ser Phe His Lys Gly Glu Lys Phe Gln Ile Leu Asn Ser Ser Glu

20 25 30

Gly Asp Trp Trp Glu Ala Arg Asp Ser Leu Thr Thr Gly Glu Thr Gly

35 40 45

Tyr Ile Pro Ser Asn Tyr Val Ala Pro Val Asp

50 55

<210> 190

<211> 174

<212> DNA

<213> 人工序列

<220>

<223> NPHP1

<220>

<221> CDS

<222> (1)..(174)

<400> 190

gag gag tac atc gcc gtg ggc gac ttc gac acc gcc cag cag gtg ggc 48

Glu Glu Tyr Ile Ala Val Gly Asp Phe Asp Thr Ala Gln Gln Val Gly

1 5 10 15

gac ctg acc ttc aag aag ggc gag atc ctg ctg gtg atc gag aag aag 96

Asp Leu Thr Phe Lys Lys Gly Glu Ile Leu Leu Val Ile Glu Lys Lys

20 25 30

ccc gac ggc tgg tgg atc gcc aag gac gcc aag ggc aac gag ggc ctg 144

Pro Asp Gly Trp Trp Ile Ala Lys Asp Ala Lys Gly Asn Glu Gly Leu

35 40 45

gtg ccc aga acc tac ctg gag ccc tac agc 174

Val Pro Arg Thr Tyr Leu Glu Pro Tyr Ser

50 55

<210> 191

<211> 58

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 191

Glu Glu Tyr Ile Ala Val Gly Asp Phe Asp Thr Ala Gln Gln Val Gly

1 5 10 15

Asp Leu Thr Phe Lys Lys Gly Glu Ile Leu Leu Val Ile Glu Lys Lys

20 25 30

Pro Asp Gly Trp Trp Ile Ala Lys Asp Ala Lys Gly Asn Glu Gly Leu

35 40 45

Val Pro Arg Thr Tyr Leu Glu Pro Tyr Ser

50 55

<210> 192

<211> 171

<212> DNA

<213> 人工序列

<220>

<223> Tec

<220>

<221> CDS

<222> (1)..(171)

<400> 192

gag atc gtg gtg gcc atg tac gac ttc cag gcc gcc gag ggc cac gac 48

Glu Ile Val Val Ala Met Tyr Asp Phe Gln Ala Ala Glu Gly His Asp

1 5 10 15

ctg aga ctg gag aga cag gag tac ctg atc ctg gag aag aac gac gtg 96

Leu Arg Leu Glu Arg Gln Glu Tyr Leu Ile Leu Glu Lys Asn Asp Val

20 25 30

cac tgg tgg aga gcc aga gac aag tac ggc aac gag ggc tac atc ccc 144

His Trp Trp Arg Ala Arg Asp Lys Tyr Gly Asn Glu Gly Tyr Ile Pro

35 40 45

agc aac tac gtg acc ggc aag aag tga 171

Ser Asn Tyr Val Thr Gly Lys Lys

50 55

<210> 193

<211> 56

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 193

Glu Ile Val Val Ala Met Tyr Asp Phe Gln Ala Ala Glu Gly His Asp

1 5 10 15

Leu Arg Leu Glu Arg Gln Glu Tyr Leu Ile Leu Glu Lys Asn Asp Val

20 25 30

His Trp Trp Arg Ala Arg Asp Lys Tyr Gly Asn Glu Gly Tyr Ile Pro

35 40 45

Ser Asn Tyr Val Thr Gly Lys Lys

50 55

<210> 194

<211> 171

<212> DNA

<213> 人工序列

<220>

<223> Hck

<220>

<221> CDS

<222> (1)..(171)

<400> 194

atc atc gtg gtg gcc ctg tac gac tac gag gcc atc cac cac gag gac 48

Ile Ile Val Val Ala Leu Tyr Asp Tyr Glu Ala Ile His His Glu Asp

1 5 10 15

ctg agc ttc cag aag ggc gac cag atg gtg gtg ctg gag gag agc ggc 96

Leu Ser Phe Gln Lys Gly Asp Gln Met Val Val Leu Glu Glu Ser Gly

20 25 30

gag tgg tgg aag gcc aga agc ctg gcc acc aga aag gag ggc tac atc 144

Glu Trp Trp Lys Ala Arg Ser Leu Ala Thr Arg Lys Glu Gly Tyr Ile

35 40 45

ccc agc aac tac gtg gcc aga gtg gac 171

Pro Ser Asn Tyr Val Ala Arg Val Asp

50 55

<210> 195

<211> 57

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 195

Ile Ile Val Val Ala Leu Tyr Asp Tyr Glu Ala Ile His His Glu Asp

1 5 10 15

Leu Ser Phe Gln Lys Gly Asp Gln Met Val Val Leu Glu Glu Ser Gly

20 25 30

Glu Trp Trp Lys Ala Arg Ser Leu Ala Thr Arg Lys Glu Gly Tyr Ile

35 40 45

Pro Ser Asn Tyr Val Ala Arg Val Asp

50 55

<210> 196

<211> 213

<212> DNA

<213> 人工序列

<220>

<223> Amph

<220>

<221> CDS

<222> (1)..(213)

<400> 196

tac aag gtg gag acc ctg cac gac ttc gag gcc gcc aac agc gac gag 48

Tyr Lys Val Glu Thr Leu His Asp Phe Glu Ala Ala Asn Ser Asp Glu

1 5 10 15

ctg acc ctg cag aga ggc gac gtg gtg ctg gtg gtg ccc agc gac agc 96

Leu Thr Leu Gln Arg Gly Asp Val Val Leu Val Val Pro Ser Asp Ser

20 25 30

gag gcc gac cag gac gcc ggc tgg ctg gtg ggc gtg aag gag agc gac 144

Glu Ala Asp Gln Asp Ala Gly Trp Leu Val Gly Val Lys Glu Ser Asp

35 40 45

tgg ctg cag tac aga gac ctg gcc acc tac aag ggc ctg ttc ccc gag 192

Trp Leu Gln Tyr Arg Asp Leu Ala Thr Tyr Lys Gly Leu Phe Pro Glu

50 55 60

aac ttc acc aga aga ctg gac 213

Asn Phe Thr Arg Arg Leu Asp

65 70

<210> 197

<211> 71

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 197

Tyr Lys Val Glu Thr Leu His Asp Phe Glu Ala Ala Asn Ser Asp Glu

1 5 10 15

Leu Thr Leu Gln Arg Gly Asp Val Val Leu Val Val Pro Ser Asp Ser

20 25 30

Glu Ala Asp Gln Asp Ala Gly Trp Leu Val Gly Val Lys Glu Ser Asp

35 40 45

Trp Leu Gln Tyr Arg Asp Leu Ala Thr Tyr Lys Gly Leu Phe Pro Glu

50 55 60

Asn Phe Thr Arg Arg Leu Asp

65 70

<210> 198

<211> 192

<212> DNA

<213> 人工序列

<220>

<223> RIMBP#3

<220>

<221> CDS

<222> (1)..(192)

<400> 198

aag atc atg atc gcc gcc ctg gac tac gac ccc ggc gac ggc cag atg 48

Lys Ile Met Ile Ala Ala Leu Asp Tyr Asp Pro Gly Asp Gly Gln Met

1 5 10 15

ggc ggc cag ggc aag ggc aga ctg gcc ctg aga gcc ggc gac gtg gtg 96

Gly Gly Gln Gly Lys Gly Arg Leu Ala Leu Arg Ala Gly Asp Val Val

20 25 30

atg gtg tac ggc ccc atg gac gac cag ggc ttc tac tac ggc gag ctg 144

Met Val Tyr Gly Pro Met Asp Asp Gln Gly Phe Tyr Tyr Gly Glu Leu

35 40 45

ggc ggc cac aga ggc ctg gtg ccc gcc cac ctg ctg gac cac atg agc 192

Gly Gly His Arg Gly Leu Val Pro Ala His Leu Leu Asp His Met Ser

50 55 60

<210> 199

<211> 64

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 199

Lys Ile Met Ile Ala Ala Leu Asp Tyr Asp Pro Gly Asp Gly Gln Met

1 5 10 15

Gly Gly Gln Gly Lys Gly Arg Leu Ala Leu Arg Ala Gly Asp Val Val

20 25 30

Met Val Tyr Gly Pro Met Asp Asp Gln Gly Phe Tyr Tyr Gly Glu Leu

35 40 45

Gly Gly His Arg Gly Leu Val Pro Ala His Leu Leu Asp His Met Ser

50 55 60

<210> 200

<211> 180

<212> DNA

<213> 人工序列

<220>

<223> IRIKS

<220>

<221> CDS

<222> (1)..(180)

<400> 200

cag aag gtg aag acc atc ttc ccc cac acc gcc ggc agc aac aag acc 48

Gln Lys Val Lys Thr Ile Phe Pro His Thr Ala Gly Ser Asn Lys Thr

1 5 10 15

ctg ctg agc ttc gcc cag ggc gac gtg atc acc ctg ctg atc ccc gag 96

Leu Leu Ser Phe Ala Gln Gly Asp Val Ile Thr Leu Leu Ile Pro Glu

20 25 30

gag aag gac ggc tgg ctg tac ggc gag cac gac gtg agc aag gcc aga 144

Glu Lys Asp Gly Trp Leu Tyr Gly Glu His Asp Val Ser Lys Ala Arg

35 40 45

ggc tgg ttc ccc agc agc tac acc aag ctg ctg gag 180

Gly Trp Phe Pro Ser Ser Tyr Thr Lys Leu Leu Glu

50 55 60

<210> 201

<211> 60

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 201

Gln Lys Val Lys Thr Ile Phe Pro His Thr Ala Gly Ser Asn Lys Thr

1 5 10 15

Leu Leu Ser Phe Ala Gln Gly Asp Val Ile Thr Leu Leu Ile Pro Glu

20 25 30

Glu Lys Asp Gly Trp Leu Tyr Gly Glu His Asp Val Ser Lys Ala Arg

35 40 45

Gly Trp Phe Pro Ser Ser Tyr Thr Lys Leu Leu Glu

50 55 60

<210> 202

<211> 174

<212> DNA

<213> 人工序列

<220>

<223> SNX33

<220>

<221> CDS

<222> (1)..(174)

<400> 202

ctg aag ggc aga gcc ctg tac gac ttc cac agc gag aac aag gag gag 48

Leu Lys Gly Arg Ala Leu Tyr Asp Phe His Ser Glu Asn Lys Glu Glu

1 5 10 15

atc agc atc cag cag gac gag gac ctg gtg atc ttc agc gag acc agc 96

Ile Ser Ile Gln Gln Asp Glu Asp Leu Val Ile Phe Ser Glu Thr Ser

20 25 30

ctg gac ggc tgg ctg cag ggc cag aac agc aga ggc gag acc ggc ctg 144

Leu Asp Gly Trp Leu Gln Gly Gln Asn Ser Arg Gly Glu Thr Gly Leu

35 40 45

ttc ccc gcc agc tac gtg gag atc gtg aga 174

Phe Pro Ala Ser Tyr Val Glu Ile Val Arg

50 55

<210> 203

<211> 58

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 203

Leu Lys Gly Arg Ala Leu Tyr Asp Phe His Ser Glu Asn Lys Glu Glu

1 5 10 15

Ile Ser Ile Gln Gln Asp Glu Asp Leu Val Ile Phe Ser Glu Thr Ser

20 25 30

Leu Asp Gly Trp Leu Gln Gly Gln Asn Ser Arg Gly Glu Thr Gly Leu

35 40 45

Phe Pro Ala Ser Tyr Val Glu Ile Val Arg

50 55

<210> 204

<211> 168

<212> DNA

<213> 人工序列

<220>

<223> Eps8L1

<220>

<221> CDS

<222> (1)..(168)

<400> 204

aag tgg gtg ctg tgc aac tac gac ttc cag gcc aga aac agc agc gag 48

Lys Trp Val Leu Cys Asn Tyr Asp Phe Gln Ala Arg Asn Ser Ser Glu

1 5 10 15

ctg agc gtg aag cag aga gac gtg ctg gag gtg ctg gac gac agc aga 96

Leu Ser Val Lys Gln Arg Asp Val Leu Glu Val Leu Asp Asp Ser Arg

20 25 30

aag tgg tgg aag gtg aga gac ccc gcc ggc cag gag ggc tac gtg ccc 144

Lys Trp Trp Lys Val Arg Asp Pro Ala Gly Gln Glu Gly Tyr Val Pro

35 40 45

tac aac atc ctg acc ccc tac ccc 168

Tyr Asn Ile Leu Thr Pro Tyr Pro

50 55

<210> 205

<211> 56

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 205

Lys Trp Val Leu Cys Asn Tyr Asp Phe Gln Ala Arg Asn Ser Ser Glu

1 5 10 15

Leu Ser Val Lys Gln Arg Asp Val Leu Glu Val Leu Asp Asp Ser Arg

20 25 30

Lys Trp Trp Lys Val Arg Asp Pro Ala Gly Gln Glu Gly Tyr Val Pro

35 40 45

Tyr Asn Ile Leu Thr Pro Tyr Pro

50 55

<210> 206

<211> 177

<212> DNA

<213> 人工序列

<220>

<223> FISH#5

<220>

<221> CDS

<222> (1)..(177)

<400> 206

gac gtg tac gtg agc atc gcc gac tac gag ggc gac gag gag acc gcc 48

Asp Val Tyr Val Ser Ile Ala Asp Tyr Glu Gly Asp Glu Glu Thr Ala

1 5 10 15

ggc ttc cag gag ggc gtg agc atg gag gtg ctg gag aga aac ccc aac 96

Gly Phe Gln Glu Gly Val Ser Met Glu Val Leu Glu Arg Asn Pro Asn

20 25 30

ggc tgg tgg tac tgc cag atc ctg gac ggc gtg aag ccc ttc aag ggc 144

Gly Trp Trp Tyr Cys Gln Ile Leu Asp Gly Val Lys Pro Phe Lys Gly

35 40 45

tgg gtg ccc agc aac tac ctg gag aag aag aac 177

Trp Val Pro Ser Asn Tyr Leu Glu Lys Lys Asn

50 55

<210> 207

<211> 59

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 207

Asp Val Tyr Val Ser Ile Ala Asp Tyr Glu Gly Asp Glu Glu Thr Ala

1 5 10 15

Gly Phe Gln Glu Gly Val Ser Met Glu Val Leu Glu Arg Asn Pro Asn

20 25 30

Gly Trp Trp Tyr Cys Gln Ile Leu Asp Gly Val Lys Pro Phe Lys Gly

35 40 45

Trp Val Pro Ser Asn Tyr Leu Glu Lys Lys Asn

50 55

<210> 208

<211> 171

<212> DNA

<213> 人工序列

<220>

<223> CMS#1

<220>

<221> CDS

<222> (1)..(171)

<400> 208

gtg gac tac atc gtg gag tac gac tac gac gcc gtg cac gac gac gag 48

Val Asp Tyr Ile Val Glu Tyr Asp Tyr Asp Ala Val His Asp Asp Glu

1 5 10 15

ctg acc atc aga gtg ggc gag atc atc aga aac gtg aag aag ctg cag 96

Leu Thr Ile Arg Val Gly Glu Ile Ile Arg Asn Val Lys Lys Leu Gln

20 25 30

gag gag ggc tgg ctg gag ggc gag ctg aac ggc aga aga ggc atg ttc 144

Glu Glu Gly Trp Leu Glu Gly Glu Leu Asn Gly Arg Arg Gly Met Phe

35 40 45

ccc gac aac ttc gtg aag gag atc aag 171

Pro Asp Asn Phe Val Lys Glu Ile Lys

50 55

<210> 209

<211> 57

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 209

Val Asp Tyr Ile Val Glu Tyr Asp Tyr Asp Ala Val His Asp Asp Glu

1 5 10 15

Leu Thr Ile Arg Val Gly Glu Ile Ile Arg Asn Val Lys Lys Leu Gln

20 25 30

Glu Glu Gly Trp Leu Glu Gly Glu Leu Asn Gly Arg Arg Gly Met Phe

35 40 45

Pro Asp Asn Phe Val Lys Glu Ile Lys

50 55

<210> 210

<211> 168

<212> DNA

<213> 人工序列

<220>

<223> OSTF1

<220>

<221> CDS

<222> (1)..(168)

<400> 210

aag gtg ttc aga gcc ctg tac acc ttc gag ccc aga acc ccc gac gag 48

Lys Val Phe Arg Ala Leu Tyr Thr Phe Glu Pro Arg Thr Pro Asp Glu

1 5 10 15

ctg tac ttc gag gag ggc gac atc atc tac atc acc gac atg agc gac 96

Leu Tyr Phe Glu Glu Gly Asp Ile Ile Tyr Ile Thr Asp Met Ser Asp

20 25 30

acc aac tgg tgg aag ggc acc agc aag ggc aga acc ggc ctg atc ccc 144

Thr Asn Trp Trp Lys Gly Thr Ser Lys Gly Arg Thr Gly Leu Ile Pro

35 40 45

agc aac tac gtg gcc gag cag gcc 168

Ser Asn Tyr Val Ala Glu Gln Ala

50 55

<210> 211

<211> 56

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 211

Lys Val Phe Arg Ala Leu Tyr Thr Phe Glu Pro Arg Thr Pro Asp Glu

1 5 10 15

Leu Tyr Phe Glu Glu Gly Asp Ile Ile Tyr Ile Thr Asp Met Ser Asp

20 25 30

Thr Asn Trp Trp Lys Gly Thr Ser Lys Gly Arg Thr Gly Leu Ile Pro

35 40 45

Ser Asn Tyr Val Ala Glu Gln Ala

50 55

<210> 212

<211> 34

<212> PRT

<213> 人工序列

<220>

<223> Cys-knots/扭结菌素(SOTI Var. 1)

<400> 212

Cys Ser Pro Ser Gly Ala Ile Cys Ser Gly Phe Gly Pro Pro Glu Gln

1 5 10 15

Cys Cys Ser Ala Gly Cys Val Leu Asn Arg Arg Ala Arg Ser Trp Arg

20 25 30

Cys Gln

<210> 213

<211> 35

<212> PRT

<213> 人工序列

<220>

<223> Cys-knots/扭结菌素(SOTI-III)

<400> 213

Cys Ser Pro Ser Gly Ala Ile Cys Ser Gly Phe Gly Pro Pro Glu Gln

1 5 10 15

Cys Cys Ser Ala Gly Ala Cys Val Pro His Pro Ile Leu Arg Ile Phe

20 25 30

Val Cys Gln

35

<210> 214

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> Kalata B1

<400> 214

Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly Thr Cys Asn Thr

1 5 10 15

Pro Gly Cys Thr Cys Ser Trp Pro Val Cys Thr Arg Asn

20 25

<210> 215

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> Kalata B1

<400> 215

Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly Thr Cys Asn Thr

1 5 10 15

Pro Gly Cys Thr Cys Ser Trp Pro Val Cys Thr Arg Asn

20 25

<210> 216

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> Kalata B2

<400> 216

Gly Leu Pro Val Cys Gly Glu Thr Cys Phe Gly Gly Thr Cys Asn Thr

1 5 10 15

Pro Gly Cys Ser Cys Thr Trp Pro Ile Cys Thr Arg Asp

20 25

<210> 217

<211> 34

<212> PRT

<213> 人工序列

<220>

<223> MCoTI-I

<400> 217

Gly Gly Val Cys Pro Lys Ile Leu Gln Arg Cys Arg Arg Asp Ser Asp

1 5 10 15

Cys Pro Gly Ala Cys Ile Cys Arg Gly Asn Gly Tyr Cys Gly Ser Gly

20 25 30

Ser Asp

<210> 218

<211> 34

<212> PRT

<213> 人工序列

<220>

<223> MCoTI-II

<400> 218

Gly Gly Val Cys Pro Lys Ile Leu Lys Lys Cys Arg Arg Asp Ser Asp

1 5 10 15

Cys Pro Gly Ala Cys Ile Cys Arg Gly Asn Gly Tyr Cys Gly Ser Gly

20 25 30

Ser Asp

<210> 219

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(12)

<400> 219

ggc ggc ggc ggc 12

Gly Gly Gly Gly

1

<210> 220

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 220

Gly Gly Gly Gly

1

<210> 221

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(12)

<400> 221

ggc ggc ggc agc 12

Gly Gly Gly Ser

1

<210> 222

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 222

Gly Gly Gly Ser

1

<210> 223

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(24)

<400> 223

ggc ggc ggc agc ggc ggc ggc aga 24

Gly Gly Gly Ser Gly Gly Gly Arg

1 5

<210> 224

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 224

Gly Gly Gly Ser Gly Gly Gly Arg

1 5

<210> 225

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(36)

<400> 225

ggc ggc ggc agc ggc ggc ggc agc ggc ggc ggc aga 36

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Arg

1 5 10

<210> 226

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 226

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Arg

1 5 10

<210> 227

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(48)

<400> 227

ggc ggc ggc agc ggc ggc ggc agc ggc ggc ggc aga ggc ggc ggc aga 48

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Arg Gly Gly Gly Arg

1 5 10 15

<210> 228

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 228

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Arg Gly Gly Gly Arg

1 5 10 15

<210> 229

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(60)

<400> 229

ggc ggc ggc agc ggc ggc ggc agc ggc ggc ggc aga ggc ggc ggc aga 48

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Arg Gly Gly Gly Arg

1 5 10 15

ggc ggc ggc aga 60

Gly Gly Gly Arg

20

<210> 230

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 230

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Arg Gly Gly Gly Arg

1 5 10 15

Gly Gly Gly Arg

20

<210> 231

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(15)

<400> 231

ggc ggc ggc ggc agc 15

Gly Gly Gly Gly Ser

1 5

<210> 232

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 232

Gly Gly Gly Gly Ser

1 5

<210> 233

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(30)

<400> 233

ggc ggc ggc ggc agc ggc ggc ggc ggc agc 30

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10

<210> 234

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 234

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10

<210> 235

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(45)

<400> 235

ggc ggc ggc ggc agc ggc ggc ggc ggc agc ggc ggc ggc ggc agc 45

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 236

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 236

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 237

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(36)

<400> 237

ggc ggc ggc agc ggc ggc ggc ggc agc ggc ggc agc 36

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Ser

1 5 10

<210> 238

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 238

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Ser

1 5 10

<210> 239

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(12)

<400> 239

ggc ggc agc ggc 12

Gly Gly Ser Gly

1

<210> 240

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 240

Gly Gly Ser Gly

1

<210> 241

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(24)

<400> 241

ggc ggc agc ggc ggc ggc agc ggc 24

Gly Gly Ser Gly Gly Gly Ser Gly

1 5

<210> 242

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 242

Gly Gly Ser Gly Gly Gly Ser Gly

1 5

<210> 243

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(36)

<400> 243

ggc ggc agc ggc ggc ggc agc ggc ggc ggc agc ggc 36

Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly

1 5 10

<210> 244

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 244

Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly

1 5 10

<210> 245

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(21)

<400> 245

agc ggc ggc ggc ggc atc ggc 21

Ser Gly Gly Gly Gly Ile Gly

1 5

<210> 246

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 246

Ser Gly Gly Gly Gly Ile Gly

1 5

<210> 247

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(36)

<400> 247

agc ggc ggc ggc ggc agc ggc ggc ggc ggc atc ggc 36

Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ile Gly

1 5 10

<210> 248

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 248

Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ile Gly

1 5 10

<210> 249

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 接头

<220>

<221> CDS

<222> (1)..(15)

<400> 249

agc ggc ggc ggc ggc 15

Ser Gly Gly Gly Gly

1 5

<210> 250

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 250

Ser Gly Gly Gly Gly

1 5

<210> 251

<211> 681

<212> DNA

<213> 人类

<220>

<221> CDS

<222> (1)..(681)

<400> 251

gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa ctc ctg ggg 48

Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly

1 5 10 15

gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac acc ctc atg 96

Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met

20 25 30

atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac gtg agc cac 144

Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His

35 40 45

gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc gtg gag gtg 192

Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val

50 55 60

cat aat gcc aag aca aag ccg cgg gag gag cag tac aac agc acg tac 240

His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr

65 70 75 80

cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg ctg aat ggc 288

Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly

85 90 95

aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca gcc ccc atc 336

Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile

100 105 110

gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa cca cag gtg 384

Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val

115 120 125

tac acc ctg ccc cca tcc cgg gag gag atg acc aag aac cag gtc agc 432

Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser

130 135 140

ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc gcc gtg gag 480

Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu

145 150 155 160

tgg gag agc aat ggg cag ccg gag aac aac tac aag acc acg cct ccc 528

Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro

165 170 175

gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag ctc acc gtg 576

Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val

180 185 190

gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc tcc gtg atg 624

Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met

195 200 205

cac gag gct ctg cac aac cac tac acg cag aag agc ctc tcc ctg tct 672

His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser

210 215 220

ccg ggt aaa 681

Pro Gly Lys

225

<210> 252

<211> 227

<212> PRT

<213> 人类

<400> 252

Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly

1 5 10 15

Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met

20 25 30

Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His

35 40 45

Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val

50 55 60

His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr

65 70 75 80

Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly

85 90 95

Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile

100 105 110

Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val

115 120 125

Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser

130 135 140

Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu

145 150 155 160

Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro

165 170 175

Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val

180 185 190

Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met

195 200 205

His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser

210 215 220

Pro Gly Lys

225

<210> 253

<211> 669

<212> DNA

<213> 人类

<220>

<221> CDS

<222> (1)..(669)

<400> 253

gtg gag tgc cca cct tgc cca gca cca cct gtg gca gga cct tca gtc 48

Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val

1 5 10 15

ttc ctc ttc ccc cca aaa ccc aag gac acc ctg atg atc tcc aga acc 96

Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr

20 25 30

cct gag gtc acg tgc gtg gtg gtg gac gtg agc cac gaa gac ccc gag 144

Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu

35 40 45

gtc cag ttc aac tgg tac gtg gac ggc atg gag gtg cat aat gcc aag 192

Val Gln Phe Asn Trp Tyr Val Asp Gly Met Glu Val His Asn Ala Lys

50 55 60

aca aag cca cgg gag gag cag ttc aac agc acg ttc cgt gtg gtc agc 240

Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser

65 70 75 80

gtc ctc acc gtc gtg cac cag gac tgg ctg aac ggc aag gag tac aag 288

Val Leu Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys

85 90 95

tgc aag gtc tcc aac aaa ggc ctc cca gcc ccc atc gag aaa acc atc 336

Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile

100 105 110

tcc aaa acc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc 384

Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro

115 120 125

cca tcc cgg gag gag atg acc aag aac cag gtc agc ctg acc tgc ctg 432

Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu

130 135 140

gtc aaa ggc ttc tac ccc agc gac atc gcc gtg gag tgg gag agc aat 480

Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn

145 150 155 160

ggg cag ccg gag aac aac tac aag acc aca cct ccc atg ctg gac tcc 528

Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser

165 170 175

gac ggc tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc agg 576

Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg

180 185 190

tgg cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg 624

Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu

195 200 205

cac aac cac tac aca cag aag agc ctc tcc ctg tct ccg ggt aaa 669

His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

210 215 220

<210> 254

<211> 223

<212> PRT

<213> 人类

<400> 254

Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val

1 5 10 15

Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr

20 25 30

Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu

35 40 45

Val Gln Phe Asn Trp Tyr Val Asp Gly Met Glu Val His Asn Ala Lys

50 55 60

Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser

65 70 75 80

Val Leu Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys

85 90 95

Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile

100 105 110

Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro

115 120 125

Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu

130 135 140

Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn

145 150 155 160

Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser

165 170 175

Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg

180 185 190

Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu

195 200 205

His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

210 215 220

<210> 255

<211> 681

<212> DNA

<213> 人类

<220>

<221> CDS

<222> (1)..(681)

<400> 255

gac aca cct ccc ccg tgc cca agg tgc cca gca cct gaa ctc ctg gga 48

Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro Ala Pro Glu Leu Leu Gly

1 5 10 15

gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gat acc ctt atg 96

Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met

20 25 30

att tcc cgg acc cct gag gtc acg tgc gtg gtg gtg gac gtg agc cac 144

Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His

35 40 45

gaa gac ccc gag gtc cag ttc aag tgg tac gtg gac ggc gtg gag gtg 192

Glu Asp Pro Glu Val Gln Phe Lys Trp Tyr Val Asp Gly Val Glu Val

50 55 60

cat aat gcc aag aca aag ccg cgg gag gag cag tac aac agc acg ttc 240

His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Phe

65 70 75 80

cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg ctg aac ggc 288

Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly

85 90 95

aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca gcc ccc atc 336

Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile

100 105 110

gag aaa acc atc tcc aaa acc aaa gga cag ccc cga gaa cca cag gtg 384

Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val

115 120 125

tac acc ctg ccc cca tcc cgg gag gag atg acc aag aac cag gtc agc 432

Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser

130 135 140

ctg acc tgc ctg gtc aaa ggc ttc tac ccc agc gac atc gcc gtg gag 480

Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu

145 150 155 160

tgg gag agc agc ggg cag ccg gag aac aac tac aac acc acg cct ccc 528

Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Asn Thr Thr Pro Pro

165 170 175

atg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag ctc acc gtg 576

Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val

180 185 190

gac aag agc agg tgg cag cag ggg aac atc ttc tca tgc tcc gtg atg 624

Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser Cys Ser Val Met

195 200 205

cat gag gct ctg cac aac cgc ttc acg cag aag agc ctc tcc ctg tct 672

His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser Leu Ser Leu Ser

210 215 220

ccg ggt aaa 681

Pro Gly Lys

225

<210> 256

<211> 227

<212> PRT

<213> 人类

<400> 256

Asp Thr Pro Pro Pro Cys Pro Arg Cys Pro Ala Pro Glu Leu Leu Gly

1 5 10 15

Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met

20 25 30

Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His

35 40 45

Glu Asp Pro Glu Val Gln Phe Lys Trp Tyr Val Asp Gly Val Glu Val

50 55 60

His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Phe

65 70 75 80

Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly

85 90 95

Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile

100 105 110

Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val

115 120 125

Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser

130 135 140

Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu

145 150 155 160

Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Asn Thr Thr Pro Pro

165 170 175

Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val

180 185 190

Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser Cys Ser Val Met

195 200 205

His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser Leu Ser Leu Ser

210 215 220

Pro Gly Lys

225

<210> 257

<211> 672

<212> DNA

<213> 人类

<220>

<221> CDS

<222> (1)..(672)

<400> 257

ccc cca tgc cca tca tgc cca gca cct gag ttc ctg ggg gga cca tca 48

Pro Pro Cys Pro Ser Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser

1 5 10 15

gtc ttc ctg ttc ccc cca aaa ccc aag gac act ctc atg atc tcc cgg 96

Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

20 25 30

acc cct gag gtc acg tgc gtg gtg gtg gac gtg agc cag gaa gac ccc 144

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro

35 40 45

gag gtc cag ttc aac tgg tac gtg gat ggc gtg gag gtg cat aat gcc 192

Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala

50 55 60

aag aca aag ccg cgg gag gag cag ttc aac agc acg tac cgt gtg gtc 240

Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val

65 70 75 80

agc gtc ctc acc gtc ctg cac cag gac tgg ctg aac ggc aag gag tac 288

Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr

85 90 95

aag tgc aag gtc tcc aac aaa ggc ctc ccg tcc tcc atc gag aaa acc 336

Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr

100 105 110

atc tcc aaa gcc aaa ggg cag ccc cga gag cca cag gtg tac acc ctg 384

Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu

115 120 125

ccc cca tcc cag gag gag atg acc aag aac cag gtc agc ctg acc tgc 432

Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys

130 135 140

ctg gtc aaa ggc ttc tac ccc agc gac atc gcc gtg gag tgg gag agc 480

Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser

145 150 155 160

aat ggg cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac 528

Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp

165 170 175

tcc gac ggc tcc ttc ttc ctc tac agc agg cta acc gtg gac aag agc 576

Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser

180 185 190

agg tgg cag gag ggg aat gtc ttc tca tgc tcc gtg atg cat gag gct 624

Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala

195 200 205

ctg cac aac cac tac aca cag aag agc ctc tcc ctg tct ccg ggt aaa 672

Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

210 215 220

<210> 258

<211> 224

<212> PRT

<213> 人类

<400> 258

Pro Pro Cys Pro Ser Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser

1 5 10 15

Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

20 25 30

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro

35 40 45

Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala

50 55 60

Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val

65 70 75 80

Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr

85 90 95

Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr

100 105 110

Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu

115 120 125

Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys

130 135 140

Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser

145 150 155 160

Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp

165 170 175

Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser

180 185 190

Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala

195 200 205

Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

210 215 220

<210> 259

<211> 387

<212> DNA

<213> 人工序列

<220>

<223> 人类IgM C-mu-4tp

<220>

<221> CDS

<222> (1)..(387)

<400> 259

aag cac ccc ccc gcc gtg tac ctg ctg ccc ccc gcc aga gag cag ctg 48

Lys His Pro Pro Ala Val Tyr Leu Leu Pro Pro Ala Arg Glu Gln Leu

1 5 10 15

aac ctg aga gag agc gcc acc gtg acc tgc ctg gtg aag ggc ttc agc 96

Asn Leu Arg Glu Ser Ala Thr Val Thr Cys Leu Val Lys Gly Phe Ser

20 25 30

ccc gcc gac atc agc gtg cag tgg ctg cag aga ggc cag ctg ctg ccc 144

Pro Ala Asp Ile Ser Val Gln Trp Leu Gln Arg Gly Gln Leu Leu Pro

35 40 45

cag gag aag tac gtg acc agc gcc ccc atg ccc gag ccc ggc gcc ccc 192

Gln Glu Lys Tyr Val Thr Ser Ala Pro Met Pro Glu Pro Gly Ala Pro

50 55 60

ggc ttc tac ttc acc cac agc atc ctg acc gtg acc gag gag gag tgg 240

Gly Phe Tyr Phe Thr His Ser Ile Leu Thr Val Thr Glu Glu Glu Trp

65 70 75 80

aac agc ggc gag acc tac acc tgc gtg gtg ggc cac gag gcc ctg ccc 288

Asn Ser Gly Glu Thr Tyr Thr Cys Val Val Gly His Glu Ala Leu Pro

85 90 95

cac ctg gtg acc gag aga acc gtg gac aag agc acc ggc aag ccc acc 336

His Leu Val Thr Glu Arg Thr Val Asp Lys Ser Thr Gly Lys Pro Thr

100 105 110

ctg tac aac gtg agc ctg atc atg agc gac acc ggc ggc acc tgc tac 384

Leu Tyr Asn Val Ser Leu Ile Met Ser Asp Thr Gly Gly Thr Cys Tyr

115 120 125

tga 387

<210> 260

<211> 128

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 260

Lys His Pro Pro Ala Val Tyr Leu Leu Pro Pro Ala Arg Glu Gln Leu

1 5 10 15

Asn Leu Arg Glu Ser Ala Thr Val Thr Cys Leu Val Lys Gly Phe Ser

20 25 30

Pro Ala Asp Ile Ser Val Gln Trp Leu Gln Arg Gly Gln Leu Leu Pro

35 40 45

Gln Glu Lys Tyr Val Thr Ser Ala Pro Met Pro Glu Pro Gly Ala Pro

50 55 60

Gly Phe Tyr Phe Thr His Ser Ile Leu Thr Val Thr Glu Glu Glu Trp

65 70 75 80

Asn Ser Gly Glu Thr Tyr Thr Cys Val Val Gly His Glu Ala Leu Pro

85 90 95

His Leu Val Thr Glu Arg Thr Val Asp Lys Ser Thr Gly Lys Pro Thr

100 105 110

Leu Tyr Asn Val Ser Leu Ile Met Ser Asp Thr Gly Gly Thr Cys Tyr

115 120 125

<210> 261

<211> 390

<212> DNA

<213> 人工序列

<220>

<223> 人类IgA C-α-3tp

<220>

<221> CDS

<222> (1)..(390)

<400> 261

acc ttc ccc ccc cag gtg cac ctg ctg ccc ccc ccc agc gag gag ctg 48

Thr Phe Pro Pro Gln Val His Leu Leu Pro Pro Pro Ser Glu Glu Leu

1 5 10 15

gcc ctg aac gag ctg ctg agc ctg acc tgc ctg gtg aga gcc ttc aac 96

Ala Leu Asn Glu Leu Leu Ser Leu Thr Cys Leu Val Arg Ala Phe Asn

20 25 30

ccc aag gag gtg ctg gtg aga tgg ctg cac ggc aac gag gag ctg agc 144

Pro Lys Glu Val Leu Val Arg Trp Leu His Gly Asn Glu Glu Leu Ser

35 40 45

ccc gag agc tac ctg gtg ttc gag ccc ctg aag gag ccc ggc gag ggc 192

Pro Glu Ser Tyr Leu Val Phe Glu Pro Leu Lys Glu Pro Gly Glu Gly

50 55 60

gcc acc acc tac ctg gtg acc agc gtg ctg aga gtg agc gcc gag acc 240

Ala Thr Thr Tyr Leu Val Thr Ser Val Leu Arg Val Ser Ala Glu Thr

65 70 75 80

tgg aag cag ggc gac cag tac agc tgc atg gtg ggc cac gag gcc ctg 288

Trp Lys Gln Gly Asp Gln Tyr Ser Cys Met Val Gly His Glu Ala Leu

85 90 95

ccc atg aac ttc acc cag aag acc atc gac aga ctg agc ggc aag ccc 336

Pro Met Asn Phe Thr Gln Lys Thr Ile Asp Arg Leu Ser Gly Lys Pro

100 105 110

acc aac gtg agc gtg agc gtg atc atg agc gag ggc gac ggc atc tgc 384

Thr Asn Val Ser Val Ser Val Ile Met Ser Glu Gly Asp Gly Ile Cys

115 120 125

tac tga 390

Tyr

<210> 262

<211> 129

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 262

Thr Phe Pro Pro Gln Val His Leu Leu Pro Pro Pro Ser Glu Glu Leu

1 5 10 15

Ala Leu Asn Glu Leu Leu Ser Leu Thr Cys Leu Val Arg Ala Phe Asn

20 25 30

Pro Lys Glu Val Leu Val Arg Trp Leu His Gly Asn Glu Glu Leu Ser

35 40 45

Pro Glu Ser Tyr Leu Val Phe Glu Pro Leu Lys Glu Pro Gly Glu Gly

50 55 60

Ala Thr Thr Tyr Leu Val Thr Ser Val Leu Arg Val Ser Ala Glu Thr

65 70 75 80

Trp Lys Gln Gly Asp Gln Tyr Ser Cys Met Val Gly His Glu Ala Leu

85 90 95

Pro Met Asn Phe Thr Gln Lys Thr Ile Asp Arg Leu Ser Gly Lys Pro

100 105 110

Thr Asn Val Ser Val Ser Val Ile Met Ser Glu Gly Asp Gly Ile Cys

115 120 125

Tyr

<210> 263

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 二聚化基序

<220>

<221> CDS

<222> (1)..(60)

<400> 263

gtg gcc gac ttc ctg atc atc tac atc gag gag gcc cac gcc acc gac 48

Val Ala Asp Phe Leu Ile Ile Tyr Ile Glu Glu Ala His Ala Thr Asp

1 5 10 15

ggc tgg gcc ctg 60

Gly Trp Ala Leu

20

<210> 264

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 264

Val Ala Asp Phe Leu Ile Ile Tyr Ile Glu Glu Ala His Ala Thr Asp

1 5 10 15

Gly Trp Ala Leu

20

<210> 265

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 三聚化基序GCN4

<220>

<221> CDS

<222> (1)..(84)

<400> 265

atc aag cag atc gag gac aag atc gag gag atc ctg agc aag atc tac 48

Ile Lys Gln Ile Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Ile Tyr

1 5 10 15

cac atc gag aac gag atc gcc aga atc aag aag ctg 84

His Ile Glu Asn Glu Ile Ala Arg Ile Lys Lys Leu

20 25

<210> 266

<211> 28

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 266

Ile Lys Gln Ile Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Ile Tyr

1 5 10 15

His Ile Glu Asn Glu Ile Ala Arg Ile Lys Lys Leu

20 25

<210> 267

<211> 117

<212> DNA

<213> 人工序列

<220>

<223> 三聚化基序母系蛋白 1

<220>

<221> CDS

<222> (1)..(117)

<400> 267

tgc gcc tgc gag agc ctg gtg aag ttc cag gcc aag gtg gag ggc ctg 48

Cys Ala Cys Glu Ser Leu Val Lys Phe Gln Ala Lys Val Glu Gly Leu

1 5 10 15

ctg cag gcc ctg acc aga aag ctg gag gcc gtg agc aag aga ctg gcc 96

Leu Gln Ala Leu Thr Arg Lys Leu Glu Ala Val Ser Lys Arg Leu Ala

20 25 30

atc ctg gag aac acc gtg gtg 117

Ile Leu Glu Asn Thr Val Val

35

<210> 268

<211> 39

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 268

Cys Ala Cys Glu Ser Leu Val Lys Phe Gln Ala Lys Val Glu Gly Leu

1 5 10 15

Leu Gln Ala Leu Thr Arg Lys Leu Glu Ala Val Ser Lys Arg Leu Ala

20 25 30

Ile Leu Glu Asn Thr Val Val

35

<210> 269

<211> 96

<212> DNA

<213> 人工序列

<220>

<223> 三聚化基序冠蛋白1a

<220>

<221> CDS

<222> (1)..(96)

<400> 269

gtg agc aga ctg gag gag gag atg aga aag ctg cag gcc acc gtg cag 48

Val Ser Arg Leu Glu Glu Glu Met Arg Lys Leu Gln Ala Thr Val Gln

1 5 10 15

gag ctg cag aag aga ctg gac aga ctg gag gag acc gtg cag gcc aag 96

Glu Leu Gln Lys Arg Leu Asp Arg Leu Glu Glu Thr Val Gln Ala Lys

20 25 30

<210> 270

<211> 32

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 270

Val Ser Arg Leu Glu Glu Glu Met Arg Lys Leu Gln Ala Thr Val Gln

1 5 10 15

Glu Leu Gln Lys Arg Leu Asp Arg Leu Glu Glu Thr Val Gln Ala Lys

20 25 30

<210> 271

<211> 108

<212> DNA

<213> 人工序列

<220>

<223> 三聚生化基序CMP

<220>

<221> CDS

<222> (1)..(108)

<400> 271

gag agc ctg gtg aag ttc cag gcc aag gtg gag ggc ctg ctg cag gcc 48

Glu Ser Leu Val Lys Phe Gln Ala Lys Val Glu Gly Leu Leu Gln Ala

1 5 10 15

ctg acc aga aag ctg gag gcc gtg agc aag aga ctg gcc atc ctg gag 96

Leu Thr Arg Lys Leu Glu Ala Val Ser Lys Arg Leu Ala Ile Leu Glu

20 25 30

aac acc gtg gtg 108

Asn Thr Val Val

35

<210> 272

<211> 36

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 272

Glu Ser Leu Val Lys Phe Gln Ala Lys Val Glu Gly Leu Leu Gln Ala

1 5 10 15

Leu Thr Arg Lys Leu Glu Ala Val Ser Lys Arg Leu Ala Ile Leu Glu

20 25 30

Asn Thr Val Val

35

<210> 273

<211> 210

<212> DNA

<213> 人工序列

<220>

<223> 三聚化基序DMPK

<220>

<221> CDS

<222> (1)..(210)

<400> 273

gag gcc gag gcc gag gtg acc ctg aga gag ctg cag gag gcc ctg gag 48

Glu Ala Glu Ala Glu Val Thr Leu Arg Glu Leu Gln Glu Ala Leu Glu

1 5 10 15

gag gag gtg ctg acc aga cag agc ctg agc aga gag atg gag gcc atc 96

Glu Glu Val Leu Thr Arg Gln Ser Leu Ser Arg Glu Met Glu Ala Ile

20 25 30

aga acc gac aac cag aac ttc gcc agc cag ctg aga gag gcc gag gcc 144

Arg Thr Asp Asn Gln Asn Phe Ala Ser Gln Leu Arg Glu Ala Glu Ala

35 40 45

aga aac aga gac ctg gag gcc cac gtg aga cag ctg cag gag aga atg 192

Arg Asn Arg Asp Leu Glu Ala His Val Arg Gln Leu Gln Glu Arg Met

50 55 60

gag ctg ctg cag gcc gag 210

Glu Leu Leu Gln Ala Glu

65 70

<210> 274

<211> 70

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 274

Glu Ala Glu Ala Glu Val Thr Leu Arg Glu Leu Gln Glu Ala Leu Glu

1 5 10 15

Glu Glu Val Leu Thr Arg Gln Ser Leu Ser Arg Glu Met Glu Ala Ile

20 25 30

Arg Thr Asp Asn Gln Asn Phe Ala Ser Gln Leu Arg Glu Ala Glu Ala

35 40 45

Arg Asn Arg Asp Leu Glu Ala His Val Arg Gln Leu Gln Glu Arg Met

50 55 60

Glu Leu Leu Gln Ala Glu

65 70

<210> 275

<211> 99

<212> DNA

<213> 人工序列

<220>

<223> 三聚化基序Langerin

<220>

<221> CDS

<222> (1)..(99)

<400> 275

gcc agc gcc ctg aac acc aag atc aga gcc ctg cag ggc agc ctg gag 48

Ala Ser Ala Leu Asn Thr Lys Ile Arg Ala Leu Gln Gly Ser Leu Glu

1 5 10 15

aac atg agc aag ctg ctg aag aga cag aac gac atc ctg cag gtg gtg 96

Asn Met Ser Lys Leu Leu Lys Arg Gln Asn Asp Ile Leu Gln Val Val

20 25 30

agc 99

Ser

<210> 276

<211> 33

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 276

Ala Ser Ala Leu Asn Thr Lys Ile Arg Ala Leu Gln Gly Ser Leu Glu

1 5 10 15

Asn Met Ser Lys Leu Leu Lys Arg Gln Asn Asp Ile Leu Gln Val Val

20 25 30

Ser

<210> 277

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 三聚基序 Surfectin 蛋白SP-D

<220>

<221> CDS

<222> (1)..(87)

<400> 277

gac gtg gcc agc ctg aga cag cag gtg gag gcc ctg cag ggc cag gtg 48

Asp Val Ala Ser Leu Arg Gln Gln Val Glu Ala Leu Gln Gly Gln Val

1 5 10 15

cag cac ctg cag gcc gcc ttc agc cag tac aag aag gtg 87

Gln His Leu Gln Ala Ala Phe Ser Gln Tyr Lys Lys Val

20 25

<210> 278

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 278

Asp Val Ala Ser Leu Arg Gln Gln Val Glu Ala Leu Gln Gly Gln Val

1 5 10 15

Gln His Leu Gln Ala Ala Phe Ser Gln Tyr Lys Lys Val

20 25

<210> 279

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 三聚基团生腱蛋白 -C

<220>

<221> CDS

<222> (1)..(90)

<400> 279

gcc tgc ggc tgc gcc gcc gcc ccc gac gtg aag gag ctg ctg agc aga 48

Ala Cys Gly Cys Ala Ala Ala Pro Asp Val Lys Glu Leu Leu Ser Arg

1 5 10 15

ctg gag gag ctg gag aac ctg gtg agc agc ctg aga gag cag 90

Leu Glu Glu Leu Glu Asn Leu Val Ser Ser Leu Arg Glu Gln

20 25 30

<210> 280

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 280

Ala Cys Gly Cys Ala Ala Ala Pro Asp Val Lys Glu Leu Leu Ser Arg

1 5 10 15

Leu Glu Glu Leu Glu Asn Leu Val Ser Ser Leu Arg Glu Gln

20 25 30

<210> 281

<211> 93

<212> DNA

<213> 人工序列

<220>

<223> 三聚基团生腱蛋白 -R

<220>

<221> CDS

<222> (1)..(93)

<400> 281

gcc tgc ccc tgc gcc agc agc gcc cag gtg ctg cag gag ctg ctg agc 48

Ala Cys Pro Cys Ala Ser Ser Ala Gln Val Leu Gln Glu Leu Leu Ser

1 5 10 15

aga atc gag atg ctg gag aga gag gtg agc gtg ctg aga gac cag 93

Arg Ile Glu Met Leu Glu Arg Glu Val Ser Val Leu Arg Asp Gln

20 25 30

<210> 282

<211> 31

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 282

Ala Cys Pro Cys Ala Ser Ser Ala Gln Val Leu Gln Glu Leu Leu Ser

1 5 10 15

Arg Ile Glu Met Leu Glu Arg Glu Val Ser Val Leu Arg Asp Gln

20 25 30

<210> 283

<211> 111

<212> DNA

<213> 人工序列

<220>

<223> 三聚基团生腱蛋白 -X

<220>

<221> CDS

<222> (1)..(111)

<400> 283

ggc tgc ggc tgc ccc ccc ggc acc gag ccc ccc gtg ctg gcc agc gag 48

Gly Cys Gly Cys Pro Pro Gly Thr Glu Pro Pro Val Leu Ala Ser Glu

1 5 10 15

gtg cag gcc ctg aga gtg aga ctg gag atc ctg gag gag ctg gtg aag 96

Val Gln Ala Leu Arg Val Arg Leu Glu Ile Leu Glu Glu Leu Val Lys

20 25 30

ggc ctg aag gag cag 111

Gly Leu Lys Glu Gln

35

<210> 284

<211> 37

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 284

Gly Cys Gly Cys Pro Pro Gly Thr Glu Pro Pro Val Leu Ala Ser Glu

1 5 10 15

Val Gln Ala Leu Arg Val Arg Leu Glu Ile Leu Glu Glu Leu Val Lys

20 25 30

Gly Leu Lys Glu Gln

35

<210> 285

<211> 108

<212> DNA

<213> 人工序列

<220>

<223> 四聚基序CMP (R27Q)

<220>

<221> CDS

<222> (1)..(108)

<400> 285

gag agc ctg gtg aag ttc cag gcc aag gtg gag ggc ctg ctg cag gcc 48

Glu Ser Leu Val Lys Phe Gln Ala Lys Val Glu Gly Leu Leu Gln Ala

1 5 10 15

ctg acc aga aag ctg gag gcc gtg agc aag cag ctg gcc atc ctg gag 96

Leu Thr Arg Lys Leu Glu Ala Val Ser Lys Gln Leu Ala Ile Leu Glu

20 25 30

aac acc gtg gtg 108

Asn Thr Val Val

35

<210> 286

<211> 36

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 286

Glu Ser Leu Val Lys Phe Gln Ala Lys Val Glu Gly Leu Leu Gln Ala

1 5 10 15

Leu Thr Arg Lys Leu Glu Ala Val Ser Lys Gln Leu Ala Ile Leu Glu

20 25 30

Asn Thr Val Val

35

<210> 287

<211> 135

<212> DNA

<213> 人工序列

<220>

<223> 五聚基序(COMP)

<220>

<221> CDS

<222> (1)..(135)

<400> 287

gac ctg gcc ccc cag atg ctg aga gag ctg cag gag acc aac gcc gcc 48

Asp Leu Ala Pro Gln Met Leu Arg Glu Leu Gln Glu Thr Asn Ala Ala

1 5 10 15

ctg cag gac gtg aga gag ctg ctg aga cag cag gtg aag gag atc acc 96

Leu Gln Asp Val Arg Glu Leu Leu Arg Gln Gln Val Lys Glu Ile Thr

20 25 30

ttc ctg aag aac acc gtg atg gag tgc gac gcc tgc ggc 135

Phe Leu Lys Asn Thr Val Met Glu Cys Asp Ala Cys Gly

35 40 45

<210> 288

<211> 45

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 288

Asp Leu Ala Pro Gln Met Leu Arg Glu Leu Gln Glu Thr Asn Ala Ala

1 5 10 15

Leu Gln Asp Val Arg Glu Leu Leu Arg Gln Gln Val Lys Glu Ile Thr

20 25 30

Phe Leu Lys Asn Thr Val Met Glu Cys Asp Ala Cys Gly

35 40 45

<210> 289

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP1

<400> 289

Met Trp Trp Arg Leu Trp Trp Leu Leu Leu Leu Leu Leu Leu Leu Trp

1 5 10 15

Pro Met Val Ala

20

<210> 290

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP2

<400> 290

Met Arg Pro Thr Trp Ala Trp Trp Leu Phe Leu Val Leu Leu Leu Ala

1 5 10 15

Leu Trp Ala Pro Gly

20

<210> 291

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP3

<400> 291

Met Lys Val Gln Trp Leu Leu Leu Trp Val Leu Leu Leu Leu Val Leu

1 5 10 15

Phe Cys Ser Arg Gly

20

<210> 292

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP4

<400> 292

Met Arg Pro Trp Thr Trp Val Leu Leu Leu Leu Leu Leu Ile Cys Ala

1 5 10 15

Pro Ser Tyr Ala

20

<210> 293

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP5

<400> 293

Met Met Trp Leu Trp Leu Val Leu Leu Leu Leu Cys Leu Ala Gly Asn

1 5 10 15

Val Gln Ala

<210> 294

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP6

<400> 294

Met Pro Pro Lys Lys Cys Leu Leu Leu Leu Leu Thr Leu Leu Leu Leu

1 5 10 15

Ile Ser Thr Thr Phe Gly

20

<210> 295

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 信号肽 ASP7

<400> 295

Met Ala Gly Gly Val Ala Gly Leu Leu Leu Ala Leu Leu Leu Pro Ser

1 5 10 15

Ala Leu Ser

<210> 296

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP8

<400> 296

Met Lys Leu Leu Leu Ile Phe Phe Val Leu Val Val Trp Met Gly Pro

1 5 10 15

Ala His Arg

<210> 297

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP 9

<400> 297

Met Val Arg Gly Val Leu Ala Leu Leu Leu Met Ala Leu Gln Met Asp

1 5 10 15

Ala Ser Ser Gly

20

<210> 298

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP10

<400> 298

Met Ser Ala Asp Cys Ser Trp Gly Ala Ala Phe Gly Ala Leu Leu Pro

1 5 10 15

Leu Ala Ala Gly

20

<210> 299

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP11

<400> 299

Met Thr Lys His Leu Gly Val Leu Phe Ala Gly Phe Thr Ser Ala Asp

1 5 10 15

Val Ser Ala

<210> 300

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP12

<400> 300

Met Ile Phe Asn Pro Met Val Val Phe Leu Phe Cys Val Ser Asn His

1 5 10 15

Ala Leu Arg

<210> 301

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP13

<400> 301

Met Asp Leu Val Ser Trp Thr Phe Met Glu Val Ser Thr Leu Val Leu

1 5 10 15

Pro Lys Arg Pro

20

<210> 302

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 信号肽ASP14

<400> 302

Met Leu Ala Ala Leu Arg Arg Ala Cys Thr Ser Ala Cys Arg Val Pro

1 5 10 15

Ile Lys Pro Thr His Leu Ala Gln Gly

20 25

<210> 303

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> GFP正向引物

<400> 303

gaagttcgag ggcgacac 18

<210> 304

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> GFP反向引物

<400> 304

taaaatcttt tattttatct gcggccgcac 30

277页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:治疗BIETTI晶体营养不良的组合物和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!