一种编码新型冠状病毒抗原的核苷酸序列及其应用

文档序号:775869 发布日期:2021-04-09 浏览:31次 >En<

阅读说明:本技术 一种编码新型冠状病毒抗原的核苷酸序列及其应用 (Nucleotide sequence for coding novel coronavirus antigen and application thereof ) 是由 俞庆龄 赵干 何悦 张世杰 侯佳望 程鑫 程渊 江秉谕 吴宗圣 睢诚 董爱华 于 2020-12-29 设计创作,主要内容包括:本发明提供了一种编码新型冠状病毒抗原的核苷酸序列及其应用。本发明将编码SARS-CoV-2病毒表面蛋白Spike的野生型DNA序列进行优化,并将其野生型基因信号肽优化后插入真核表达载体,将其导入宿主细胞,使其在宿主细胞内高效表达病毒Spike抗原,经过抗原提呈后系统地激活抗病毒体液免疫应答及细胞免疫应答。激活的体液免疫应答所产生的抗体可以预防SARS-CoV-2病毒的侵入,激活的细胞免疫应答可进一步清除受病毒感染的细胞,并调节由于ADE的潜在副作用而引发的不良反应。(The invention provides a nucleotide sequence for coding a novel coronavirus antigen and application thereof. The invention optimizes the wild DNA sequence of the surface protein Spike of SARS-CoV-2 virus, optimizes the signal peptide of the wild gene and inserts the optimized signal peptide into the eukaryotic expression vector, introduces the eukaryotic expression vector into host cells, leads the eukaryotic expression vector to efficiently express the virus Spike antigen in the host cells, and systematically activates the antiviral humoral immune response and the cellular immune response after the antigen presentation. The antibodies generated by the activated humoral immune response can prevent the invasion of SARS-CoV-2 virus, and the activated cellular immune response can further eliminate virus infected cells and modulate adverse reactions due to the potential side effects of ADE.)

一种编码新型冠状病毒抗原的核苷酸序列及其应用

技术领域

本发明涉及疫苗技术领域,具体涉及一种编码新冠病毒抗原的核苷酸序列及 其应用,具体为在制备疫苗中的应用。

背景技术

冠状病毒(Coronaviruses)是一种包膜型无节段阳性RNA病毒,属于冠状 病毒科(Coronaviridae)和无节段病毒目(Nidovirales),是目前已知最大的正 链RNA病毒。根据病毒的血清学和基因组特点,可将冠状病毒亚科分别为α、β、 γ、δ四个属,其中β-冠状病毒又分为A、B、C、D四系。新型冠状病毒SARS-CoV-2 (Severe acute respiratory syndromecoronavirus 2)属于β属的冠状病毒,主要经 呼吸道飞沫传播,也可通过接触传播引起肺炎(Novel Coronavirus-infected Pneumonia,NCP),人群普遍易感。

2020年1月30日,世界卫生组织宣布本次疫情升级为“国际关注的突发公 共卫生事件”(Public Health Emergency of International Concern,PHEIC),至 今这种公共卫生危害还不断在延续弥漫。虽然目前国内病毒传播得到了有效控制, 但世界其他国家仍处于疫情的高发乃至二次大流行期。据流行病学统计数据显示, 新冠感染确诊患者中20%需要住院治疗,其中ICU的需求比为1:16000,65岁以 下患者的病死率为0.6-2.8%,70岁以上患者的病死率为5.4-16.6%。截至2020 年11月,世界卫生组织公布全球新冠肺炎确诊病例约6300万例,死亡病146万 例。

这些数据说明,新冠病毒至今仍然严重威胁人类健康,而目前尚无针对此类 疾病的有效的预防和治疗手段,研制有效的预防性疫苗是除了物理隔离以外缓解 疫情的有效手段。以SARS-CoV-2病毒表面蛋白Spike(刺突蛋白)即S蛋白为 抗原的疫苗,包括核酸疫苗,亚单位疫苗和病毒载体疫苗,其S蛋白的表达水平、 蛋白结构决定了疫苗的有效性。

目前已经有一些新型冠状病毒疫苗的相关研究,如CN111218459B公开了一 种以人5型复制缺陷腺病毒为载体的新型冠状病毒疫苗,可在短时间内诱导机体 产生细胞及体液免疫反应,具有良好的免疫保护效果。该专利中的新冠疫苗为病 毒载体疫苗。

而核酸疫苗被称为“第三代疫苗”,具有以下优点:1.全方位诱导体液及细 胞免疫应答,能够起到良好的预防作用;2.生产工艺简单、保存稳定性好且无须 冷链运输,适宜于大规模应用及分发。目前已有相关核酸疫苗存在,如专利 CN110951756B公开了一种表达SARS-CoV-2病毒抗原肽的核酸序列,可在人体 细胞中有效表达,诱导相应的免疫保护反应,可开发成SARS-CoV-2疫苗,其通 过去除潜在的可变剪切位点,保证蛋白表达的唯一性,减少蛋白后续纯化的困难, 并通过降低GC含量,对其密码子进一步优化,得到优化后的核酸序列得到的疫 苗,其表达量高。

由于现有的SARS-CoV-2核酸疫苗种类较少,若能够通过采用与专利CN110951756B不同的优化策略,如提高核苷酸序列中的GC含量,提高密码子 适应指数,增加简并密码子尾端G或C比例等,得到一种表达量高,免疫力强 的核酸疫苗用于预防或治疗新型冠状病毒,将会极大地推动新型冠状病毒肺炎治 疗领域的发展。

发明内容

针对上述不足,本发明提供了一种用于编码新型冠状病毒(SARS-CoV-2)S 蛋白的核苷酸序列,所述的核苷酸序列可用于制备相应的核酸疫苗。通过密码子 优化设计,本发明所述的核酸疫苗能够提高其抗原蛋白在体内的表达量,激发出 更为高效的免疫反应,从而提高对SARS-CoV-2病毒的预防和/或治疗效果。

为了实现上述发明目的,本发明的技术方案如下:

一方面,本发明提供了一种编码新冠病毒抗原的核苷酸序列。

具体地,所述的核苷酸序列包括SARS-CoV-2病毒S蛋白(SARS-CoV-2病 毒表面蛋白Spike)的编码序列。

进一步具体地,所述的SARS-CoV-2病毒S蛋白的编码序列与S蛋白野生 型的核苷酸序列具有同源性,所述S蛋白野生型的核苷酸序列如SEQ ID NO:1 所示。

进一步具体地,所述的SARS-CoV-2病毒S蛋白的编码序列与S蛋白野生 型的核苷酸序列具有65-80%的同源性。

优选地,所述的SARS-CoV-2病毒S蛋白的编码序列与S蛋白野生型的核 苷酸序列具有70-75%的同源性。

进一步具体地,所述SARS-CoV-2病毒S蛋白的编码序列中密码子的第三位 碱基由A替换为C或G、T替换为C或G。

优选地,所述的SARS-CoV-2病毒S蛋白的编码序列的GC含量为40-80%。

优选地,所述的SARS-CoV-2病毒S蛋白的编码序列的GC含量为45-70%, 优选为50-60%。

进一步具体地,所述的SARS-CoV-2病毒S蛋白的编码序列如SEQ ID NO:3、 SEQ IDNO:4或SEQ ID NO:5所示。

具体地,所述的核苷酸序列还包括如SEQID NO:2所示的信号肽序列。

进一步具体地,将信号肽序列经优化后,可通过增强翻译后蛋白在细胞器间 的转运,进一步增加翻译后蛋白的表达量,从而增强核酸疫苗免疫原性。未经优 化的S蛋白野生型的信号肽序列如SEQ ID NO:10所示。

具体地,所述的核苷酸序列如SEQ ID NO:6、SEQ ID NO:7或SEQ ID NO:8 所示。

具体地,所述的SARS-CoV-2病毒S蛋白的氨基酸序列如SEQ ID NO:9所 示。

另一方面,本发明提供了一种载体,所述的载体包含上述核苷酸序列。

具体地,所述的载体包括但不限于质粒、病毒、噬菌体、RNA,优选为质粒 DNA。

进一步具体地,所述的载体能够表达SARS-CoV-2病毒S蛋白,所述的S 蛋白能够在哺乳动物体内引起免疫反应。

又一方面,本发明提供了上述核苷酸序列或载体在制备SARS-CoV-2核酸疫 苗中的应用。

又一方面,本发明提供了一种SARS-CoV-2核酸疫苗,所述的疫苗包含上述 核苷酸序列或载体。

又一方面,本发明提供了上述核苷酸序列、载体或SARS-CoV-2核酸疫苗在 制备预防和/或治疗SARS-CoV-2病毒相关疾病的药物中的应用。

与现有技术相比,本发明的积极和有益效果在于:

本发明通过对SARS-CoV-2表面蛋白Spike的编码核苷酸序列进行优化,提 高了核苷酸序列中的GC含量,进一步提高了核苷酸5'端的GC含量;同时改变 宿主偏好性的密码子频度,提高CAI指数(密码子适应指数);增加简并密码 子尾端G或C比例,减少形成RNA二级结构自由能,减少Negative CIS元件比 例,降低序列中重复序列比例;并且将其野生型基因信号肽优化,从而能够进一 步提高其表达量,获得优化后的核苷酸序列,增加翻译后蛋白量的表达量,从而 增强核酸疫苗的免疫原性。实验表明,将优化后的核苷酸序列制成核酸疫苗,与 野生型序列相比,极大地提高了抗原蛋白的基因转录和表达,免疫实验动物后可 诱导更高效的体液及细胞免疫反应。

具体地,将优化后的核苷酸序列插入真核表达载体,再将其导入宿主细胞, 使其在宿主细胞内及表面高效表达病毒Spike抗原,经过抗原提呈后系统地激活 抗病毒体液免疫应答及细胞免疫应答。激活的体液免疫应答所产生的抗体可以预 防病毒的侵入,激活的细胞免疫应答可进一步清除受病毒感染的细胞,同时激活 的细胞免疫可以降低由于“抗体依赖性增强”(ADE)的潜在副作用引发的不良 反应。

附图说明

图1为本发明实施例2中的核酸疫苗候选工程菌质粒的酶切验证结果,其中, A为野生型DNA质粒pVAX1-S(WT)的BamHI/EcoRV酶切结果,B为DNA 质粒pVAX1-ADV400的BamHI/XhoI酶切结果,C为DNA质粒pVAX1-ADV401 的BamHI/XhoI酶切结果,D为DNA质粒pVAX1-ADV402的BamHI/XhoI酶切 结果;

具体条带如下:1.pVAX1-S(WT),2.酶切后的pVAX1-S(WT), 3.pVAX1-ADV400,4.酶切后的pVAX1-ADV400,5.pVAX1-ADV401,6.酶切后 的pVAX1-ADV401,7.pVAX1-ADV402,8.酶切后的pVAX1-ADV402。

图2为本发明候选核酸疫苗在哺乳动物细胞中qPCR转录检测图,其中,A 为pVAX1-ADV400检测结果,B为pVAX1-ADV401检测结果,C为 pVAX1-ADV402检测结果。

图3为本发明候选核酸疫苗哺乳动物细胞抗原蛋白表达检测图,其中,A为 流式检测流程图,B为流式检测结果图,C为流式检测结果统计图。

图4为本发明候选核酸疫苗体液免疫反应检测图,其中,A为 pVAX1-ADV400检测结果,B为pVAX1-ADV401检测结果,C为pVAX1-ADV402 检测结果。

图5为本发明候选核酸疫苗细胞免疫反应ELISPOT检测图,其中,A为 pVAX1-ADV400检测结果,B为pVAX1-ADV401检测结果,C为pVAX1-ADV402 检测结果。

图6为本发明候选核酸疫苗细胞免疫反应流式检测图,其中,A为流式检测 流程图,B为流式检测结果图,C为流式检测结果统计图。

具体实施方式

下面结合具体实施例,对本发明作进一步详细的阐述,下述实施例不用于限 制本发明,仅用于说明本发明。以下实施例中所使用的实验方法如无特殊说明, 实施例中未注明具体条件的实验方法,通常按照常规条件,下述实施例中所使用 的材料、试剂等,如无特殊说明,均可从商业途径得到。

除非特别指明,本文中的“SARS-CoV-2”均指“新型冠状病毒”。

除非特别指明,本文中的“S蛋白”均指“SARS-CoV-2病毒表面蛋白Spike (刺突蛋白)”。

除非特别指明,本文中的“SFU”均指“斑点形成单位”。

实施例1:S蛋白编码核酸的优化及载体构建

1.核酸序列优化原理为:(1)根据宿主细胞对于核酸密码子的偏好性对简 并密码子进行优化,使优化后的序列含有更多利于宿主细胞识别的核酸密码子; (2)在密码子偏好优化的基础上进一步优化核酸序列中的GC含量,使GC含 量优化后的序列能够表达出更多的靶蛋白;(3)优化核酸序列使其能够转录出 更加稳定的mRNA,利于靶蛋白的翻译;(4)改变宿主偏好性的密码子频度, 提高CAI指数(密码子适应指数)。

优化目的:增加靶蛋白在宿主细胞中的蛋白表达。

优化策略:将氨基酸编码密码子第三位碱基由A优化为C或者G、或T优 化为C或者G;增加简并密码子尾端G或C比例,减少形成RNA二级结构自 由能,减少Negative CIS元件比例,降低序列中重复序列比例。

优化结果:只改变核酸序列,未改变氨基酸序列。

优化步骤:选取SARS-CoV-2病毒表面蛋白Spike(S蛋白)作为抗原,其 氨基酸序列如SEQ ID NO:9所示,将所示氨基酸序列对应的野生型核酸编码序 列S WT(SEQ ID NO:1)进行优化,得到如SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5所示的核苷酸序列,并将优化后的序列与优化后的信号肽序列(SEQ ID NO:2)连接,得到分别命名为ADV400(SEQ ID NO:6)、ADV401(SEQ ID NO:7) 或ADV402(SEQ ID NO:8)的3个核苷酸序列,再将优化后的序列进行合成。

通过优化得到的序列,在GC含量方面,ADV400、ADV401、ADV402序 列在DNA 5'端提升了GC含量(60%),而野生型序列同位点GC含量小于50%。

2.将上述获得的3个核苷酸序列,及S蛋白的野生型编码序列分别转化构建 入pVAX1载体(ThermoFisher,货号:V26020)中,分别得到质粒DNA:pVAX1-S (WT)、pVAX1-ADV400、pVAX1-ADV401和pVAX1-ADV402。

实施例2:核酸疫苗(各优化后序列)构建

1.核酸疫苗候选序列转化

(1)从-70℃冰箱中取100μL感受态细胞(如DH5α)悬液,冰上解冻。

(2)将实施例1中制得的质粒DNA溶液(体积不超过10μL):pVAX1-S (WT)、pVAX1-ADV400、pVAX1-ADV401和pVAX1-ADV402分别加入感受 态细胞中,轻轻摇匀,冰上放置30min。

(3)42℃水浴中热激90s,迅速置于冰上冷却5min。

(4)向管中加入1mL的LB液体培养基(不含抗生素),混匀后37℃振荡 培养45min,使细菌恢复正常生长状态。

(5)将上述菌液摇匀后取100μL涂布于含适当抗生素的筛选平板上,正面 向上放置,待菌液完全被培养基吸收后倒置培养皿,37℃培养8-16h。

(6)挑选边缘均匀菌体单克隆,使用移液器头将克隆挑取后置入5mL LB 选择培养基中37℃过夜培养。

2.核酸疫苗候选工程菌质粒提取:

(1)12000rpm离心5min收集菌体。

(2)加入1mL溶液I(25mMTris-HCl,pH8.0,Sigma,cat.No:T1819;10 mMEDTA,Sigma,cat.No:T3913),使菌体完全、均匀地溶于溶液中。

(3)按溶液II:溶液I=1:1的比例加入溶液II(0.4N NaOH,Beijing ChemicalReagents Company,cat.No:10019792;2%SDS,Sigma,cat.No:L5750),小心 转动离心管,使溶液充分混匀。

(4)加入溶液I体积1.5倍的溶液III(3M KAc,5M HAc,Beijing ChemicalReagents Company,cat.No:30154592,cat.No:10000292),轻轻震荡混匀。

(5)12000rpm离心10min,取上清加入60%体积的异丙醇,上下颠倒混匀, 室温静置15min。

(6)12000rpm离心10min,弃上清,粗提结束。

(7)70%乙醇洗涤后吹干,用适量TE溶解沉淀。

3.核酸疫苗候选工程菌质粒酶切鉴定:

将步骤2提取的候选质粒pVAX1-ADV400、pVAX1-ADV401和 pVAX1-ADV402以内切酶BamHI/XhoI双酶切进行特异性酶切片段鉴定, pVAX1-S(WT)以BamHI/EcoRV双酶切进行特异性酶切片段鉴定;酶切体系 如下表1,37℃酶切反应4h。酶切结束后,以1%琼脂糖凝胶电泳。

表1双酶切反应体系

试剂 体积(μL)
pVAX1-ADV 10
BamHI 0.5
XhoI或EcoRV 0.5
10×buffer 2
去离子水 7
总体积 20

结果如图1所示,本发明所述的核酸疫苗构建的质粒pVAX1-ADV400、 pVAX1-ADV401和pVAX1-ADV402均正确。

实施例3:候选核酸疫苗哺乳动物细胞转录鉴定

1.核酸疫苗体外转染

(1)从液氮中取出冻存的HEK293细胞株(ATCC,CRL-3216),37℃水 浴后1000rpm离心5min除去DMSO;

(2)加入无血清的DMEM培养液洗涤一次,于含10%小牛血清的DMEM 培养液5mL中,37℃,5%CO2培养。转染前24h,37℃胰酶(0.25%)消化细胞 5min并终止后,以(1-3)×105个细胞/孔的密度平铺于6孔板或35mm培养皿, 加2mL生长培养基与37℃、5%CO2培养箱中培养20-24h,至细胞密度为50-80%;

(3)将pVAX1-ADV400、pVAX1-ADV401和pVAX1-ADV40,以及野生 型pVAX1-S(WT),空质粒pVAX1,同时进行转化进行平行试验,具体地, 分别将前述5个质粒取2μg无菌质粒,然后各自加入100μL无血清DMEM培养 基中,轻轻混匀,室温放置10min;

(4)将2μL的阳离子脂质体于100μL无血清DMEM培养基中,轻轻混匀, 室温放置10min;

(5)将上述质粒和脂质体混合,轻轻混匀,室温放置15-30min。

(6)吸去培养板/皿中的培养基,用2mL无血清培养基清洗一次,在每一 孔或35mm培养皿中加入0.8mL无血清培养基,然后逐滴加入上述DNA质粒/ 脂质体复合物,并使之均匀分布。于37℃,5%CO2培养箱中孵育4-8h,一般为 6h。

(7)培养6h后移除混合液,加入完全培养基继续孵育24h。

2.转染后RNA提取

(1)收集转染消化后细胞,4000rpm离心5min,弃上清后50μL PBS重悬 细胞;

(2)加1mLTRIzol颠倒混匀10下,室温孵育5min;

(3)加氯仿1/5体积(0.2mL),颠倒混匀15s,室温孵育5min;

(4)4℃12000rpm离心15min,转上层水相(约400μL)于另一1.5mL EP 管中。

(5)加等体积异丙醇混匀室温10min,4℃12000rpm离心10min。

(6)弃上清,加入冰预冷的75%乙醇(用DEPC水配)1mL,4℃12000rpm 离心5min。

(7)弃上清,空气干燥5-10min,加入20μL无RNA酶灭菌水溶解RNA。

3.RNA反转录、qPCR反应

(1)根据所需PCR数为n(n=样本数+1管阴性对照+1管阳性对照)配制 溶液。

(2)配制下表2反应体系。

表2反应体系

试剂 体积(μL)
RT Buffer 5× 4
dNTP mixture(10μM each) 0.5
Oligo dT 1
Total RNA 5
RTase 1
无RNA酶灭菌水 8.5

(3)按照如下表3反应程序进行反转录。

表3反应程序

温度 时间
30℃ 10min
42℃ 1h
99℃ 5min
4℃ store

(4)反转录结束后按下表4配制反应体系。

表4反应体系

(5)按照下表5扩增程序进行qPCR反应。

表5反应程序

结果如图2所示,由图2可知,本发明中的优化后的核苷酸序列ADV400、 ADV401和ADV402制得的核酸疫苗,即pVAX1-ADV400、pVAX1-ADV401和 pVAX1-ADV402,相比野生型核苷酸序列制得的核酸疫苗pVAX1-S(WT),及 空质粒pVAX1,在哺乳动物细胞中转录效果明显升高。

实施例4:候选核酸疫苗哺乳动物细胞抗原蛋白表达鉴定

1.按与实施例3中步骤1相同的操作进行转染,转染24h后,去除转染后的 培养液,用预冷的PBS洗一遍,弃去PBS。

2.单细胞悬液制备,计数后将细胞按照1×106个细胞/孔的数量将细胞铺在96 孔圆底板中,待用于染色。

3.将单细胞悬液所在的96孔板进行离心,1500rpm/min离心3min,弃上清。

4.将配置好的细胞死活染料按照对应用量加入染色缓冲液中,染色缓冲液为 2%FBS/PBS,染色体积为50μL每孔。轻轻吹吸3-5次。常温避光染色15min。

5.将单细胞悬液所在的96孔板进行离心,1500rpm/min离心3min,弃上清。

6.将针对细胞表面的抗Spike流式抗体加入染色缓冲液中,染色体积为50μL 每孔。表面抗体对96孔板中细胞进行重悬,轻轻吹吸3-5次。常温避光染色45min。

7.每孔加入200μL染色缓冲液进行染色终止,避光,将单细胞悬液所在的 96孔板进行离心,1500rpm/min离心3min,弃上清。

8.每孔加入200μL染色缓冲液重悬,轻轻吹吸3-5次,将单细胞悬液所在的 96孔板进行离心,1500rpm/min离心3min,弃上清。

9.每孔加入200μL染色缓冲液重悬,轻轻吹吸3-5次,等待流式细胞仪检测 上样。

10.当有大颗粒浑浊时,应在上样前,再次通过200目铜网进行过滤后上机。

检测结果如图3所示,从图3可以看出,本发明中的优化后的核苷酸序列 ADV400、ADV401和ADV402,制得的核酸疫苗,即pVAX1-ADV400、 pVAX1-ADV401和pVAX1-ADV402,相比野生型核苷酸序列制得的核酸疫苗 pVAX1-S(WT),在哺乳动物细胞中抗原蛋白表达量明显升高。

实施例5:候选核酸疫苗免疫原性验证

为了验证实施例2制备的核酸疫苗的免疫原性,用制备的核酸疫苗每两周一 次共两次免疫小鼠,采用的免疫方法为肌肉注射电脉冲,同时采用对照缓冲液免 疫小鼠。将疫苗免疫第一天计为0天。同时采用缓冲液作为对照,记为SSC。

为了进一步评估核酸疫苗引发的抗原特异性细胞应答,预测并合成了S抗原 特异性的肽池MHC-I/MHC-II表位肽(S peptide),并用该肽池刺激了从疫苗免 疫后小鼠中分离到的脾细胞或淋巴结细胞。本实验例中使用的小鼠为6-8周的 BALB/c小鼠,均从北京华阜康公司购买。部分实验方法或条件列举如下:

酶联免疫吸附测定体液免疫反应:第14天采集小鼠血液样品,用ELISA法 测定血清的特异性抗体滴度。当需要定量检测小鼠血清中的抗体浓度时,在常规 ELISA的基础上增加标准曲线,根据标准曲线的浓度来判定小鼠血清中抗体的浓 度。

检测结果如图4所示,从图4可以看出本发明中的优化后的核苷酸序列 ADV400、ADV401和ADV402,制得的核酸疫苗,即pVAX1-ADV400、 pVAX1-ADV401和pVAX1-ADV402,相比野生型核苷酸序列制得的核酸疫苗 pVAX1-S(WT),在小鼠血清中抗体的浓度明显升高。

免疫细胞特异性刺激检测细胞免疫反应:无菌环境中进行,将小鼠脱颈,安 乐死,取出脾脏或淋巴结,研磨成单细胞悬液;离心收获细胞,红细胞裂解液重 悬后裂解含FBS的PBS终止裂解;过滤,对制备好的单细胞悬液计数,并用1×106个细胞/孔铺板;分别按照ELISPOT及流式细胞术加入相应特异性多肽池进行体 外刺激,ELISPOT在37℃,5%CO2培养24h后进行检测。流式检测在37℃,5%CO2培养6h,离心收集刺激完的细胞。流式细胞计数检测。

ELISPOT检测结果如图5所示,流式检测结果如图6所示,表明本发明中 的优化后的核苷酸序列ADV400、ADV401和ADV402,制得的核酸疫苗,即pVAX1-ADV400、pVAX1-ADV401和pVAX1-ADV402,相比野生型核苷酸序列 制得的核酸疫苗pVAX1-S(WT),Spike抗原特异性明显升高。

综上,本发明通过对SARS-CoV-2表面蛋白Spike的编码核苷酸序列进行优 化,提高其中核苷酸序列中的GC含量,并进一步提高核苷酸5'端的GC含量; 同时改变宿主偏好性的密码子频度,提高CAI指数;增加简并密码子尾端G或 C比例,减少形成RNA二级结构自由能,减少Negative CIS元件比例,降低序 列中重复序列比例,此外还将野生型基因信号肽优化,从而能够进一步提高其表 达量,得到优化后的核苷酸序列,并将其制成核酸疫苗。并通过试验表明,优化 后的核苷酸序列制得的核酸疫苗与野生型序列相比,极大地提高了抗原蛋白的基 因转录和表达,免疫实验动物后可诱导更高效的体液及细胞免疫反应。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的 普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进, 这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求 为准。

序列表

<110> 艾棣维欣(苏州)生物制药有限公司

<120> 一种编码新型冠状病毒抗原的核苷酸序列及其应用

<130> 20201221

<160> 10

<170> SIPOSequenceListing 1.0

<210> 1

<211> 3822

<212> DNA

<213> 人工序列(artificial sequence)

<400> 1

atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60

agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120

aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180

aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240

aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300

ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360

aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420

ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480

tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540

ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600

tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660

tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720

ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780

ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840

gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900

tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960

caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020

gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080

tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140

ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200

gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260

tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320

cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380

ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440

aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500

aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560

ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620

ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680

cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740

acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800

ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860

cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920

aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980

gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040

cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100

gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160

agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220

tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280

acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340

gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400

aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460

ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520

cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580

ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640

acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700

caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760

aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820

acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880

acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940

ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000

cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060

tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120

gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180

gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240

atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300

cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360

tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420

ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480

tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540

aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600

caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660

atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720

tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780

tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822

<210> 2

<211> 63

<212> DNA

<213> 人工序列(artificial sequence)

<400> 2

atgtggtggc gcctgtggtg gctgctgctg ctgctgctgc tgctgtggcc catggtgtgg 60

gcc 63

<210> 3

<211> 3789

<212> DNA

<213> 人工序列(artificial sequence)

<400> 3

tctcagtgcg tgaacctgac caccagaacc cagctgcctc ctgcttacac caactcgttc 60

acacggggag tgtactaccc cgacaaggtg ttcaggagct cagtgctgca tagcacccaa 120

gacctgttcc tgccattctt cagcaacgtc acgtggttcc acgccatcca cgtgtctgga 180

accaacggca ccaagagatt cgacaacccc gtgctgcctt tcaacgatgg agtgtacttc 240

gctagcaccg agaagagcaa catcatccgg ggctggatct tcggcaccac actggactcc 300

aagacacaga gtctgctgat cgtgaacaac gccaccaacg tcgtgatcaa ggtgtgtgag 360

ttccagttct gcaacgatcc tttcctcggc gtttactacc acaagaacaa caagagctgg 420

atggaatcag aatttagggt atattcttct gccaataact gtacgtttga atacgtgtct 480

cagcctttcc taatggacct ggaaggcaaa cagggcaact ttaagaacct gagagaattc 540

gtgtttaaga acatcgacgg ctatttcaag atctacagta agcacacccc tatcaacctg 600

gtgcgggacc tgccccaggg gttttccgcc cttgaacctc tggtggacct gcccattggc 660

atcaatatca caagattcca gaccctgctg gccctgcaca gaagctacct gacccctggc 720

gacagcagca gcggatggac cgccggcgcc gccgcctact acgtgggata cctgcagcct 780

agaaccttcc tactgaaata caacgaaaac ggtaccatca ccgacgccgt ggattgcgct 840

ctggaccctc tgagcgaaac caagtgcacc ctgaaaagct ttaccgtgga gaagggcatt 900

tatcagacaa gcaactttcg ggtgcagcct accgagagca tcgtgagatt ccctaacatc 960

accaacctgt gtcctttcgg cgaggtgttc aatgccacac ggttcgccag cgtgtacgcc 1020

tggaaccgga agcggatcag caactgcgtg gccgactaca gcgtgctgta taatagcgcc 1080

agcttcagca cattcaagtg ctacggcgtg agccccacca agctgaatga tctgtgcttt 1140

accaacgtgt atgccgatag ctttgtgatc cggggggacg aggtaagaca gattgcccca 1200

ggacagacag gcaaaatcgc agattacaac tacaaactgc ctgacgactt caccggctgc 1260

gttatcgcct ggaactccaa caacctggac agcaaggtgg gaggaaacta caactacctg 1320

taccgactgt tcagaaagag caacctgaag ccattcgaga gagatatttc gacagagatc 1380

taccaggccg gaagcacacc ttgcaacggc gtggaaggct tcaactgcta cttccccctg 1440

cagagctacg gctttcagcc cacaaacggc gtcggctacc agccttacag agtggtggtg 1500

ctgagcttcg agctgctgca tgcccctgcc accgtgtgcg ggcctaagaa gtccacaaat 1560

ctggtaaaga ataagtgtgt gaacttcaat ttcaatggcc tgaccggaac gggtgtgctg 1620

accgaatcta ataagaagtt cctgcctttc cagcagttcg gccgtgatat cgccgacacc 1680

accgacgctg tccgcgatcc tcaaaccctg gaaatcctgg acattacacc ttgcagcttc 1740

ggcggcgtgt ccgtgatcac accaggcaca aacaccagca accaggtggc tgtgctgtac 1800

caggacgtga actgtacaga ggtgcctgtg gccatccacg ccgaccagct gacacctaca 1860

tggagagtgt attcaacagg cagcaacgtc ttccagacca gagcaggatg cctgatcggc 1920

gctgagcatg tgaacaactc ctacgagtgc gacatcccta tcggcgccgg catctgcgct 1980

agttaccaga ctcaaaccaa ctctcctcgg cgggctagaa gcgtcgcctc ccagagcatc 2040

atcgcttata ccatgtctct gggcgccgag aacagcgtgg cctacagcaa caactccatc 2100

gccattccta ccaacttcac gatctcagtt accaccgaga tcctgcctgt gagcatgaca 2160

aagaccagcg tcgactgcac catgtacatc tgcggcgatt ccacagaatg ctccaacctg 2220

ctgctccagt acggctcttt ctgtacccag ctgaacagag ccctgacagg catcgccgtg 2280

gaacaggata agaacactca ggaggtgttc gcccaggtga agcagatcta caagacccct 2340

ccaatcaagg actttggcgg ctttaatttc agccaaatcc tcccagatcc tagcaagccc 2400

agcaagagaa gcttcatcga ggacctgctg ttcaacaagg tcaccctggc tgacgccggc 2460

ttcatcaagc agtatggcga ctgcctgggc gatatcgccg cgagggatct aatttgtgct 2520

cagaagttca acggcctgac cgtgctgccc cccctgctga cagacgaaat gatcgctcag 2580

tacacatctg ccctgctggc cggcaccatc acgagcggct ggaccttcgg agccggcgcc 2640

gccctgcaga tccccttcgc tatgcagatg gcctatagat tcaacggcat cggcgtgacc 2700

cagaacgtgc tgtacgagaa ccaaaaactg attgccaatc aatttaattc cgcgatcgga 2760

aagatccagg actctctgag ctctactgcc agcgccctgg gcaagctgca agacgtggtg 2820

aaccagaatg ctcaagccct gaacaccctg gtgaagcagc tgagcagcaa tttcggagca 2880

atcagctctg tcctcaacga cattctgtct agactagaca aggtggaagc cgaagtgcag 2940

atcgatcggc ttatcaccgg aagactgcag agcctgcaga catatgttac acagcagctg 3000

atcagagccg ccgagatcag agccagcgcc aacctggcag ccacaaaaat gtccgagtgc 3060

gtcctcggcc aatctaagcg ggttgatttc tgtggcaaag gctaccacct gatgagcttc 3120

ccccaaagcg ctcctcacgg cgtggtgttt ctgcacgtca cctacgtgcc cgcccaagag 3180

aagaacttca ccaccgcccc cgctatctgc cacgacggca aggcccactt ccctcgggaa 3240

ggcgtgttcg tgagtaacgg tacacactgg tttgtgaccc aaagaaactt ctacgagcct 3300

cagatcatca ccaccgataa cacctttgtg agcggcaact gcgatgtggt gatcggcatc 3360

gtgaacaaca cagtatacga ccccctgcag cccgagctgg acagctttaa agaggagctc 3420

gataagtact tcaagaacca cacatctcca gacgtggacc tgggcgacat cagcggcatc 3480

aacgccagtg ttgtgaacat ccagaaagaa atcgatagac tgaacgaagt ggccaagaat 3540

ctgaacgaga gcctgatcga cctgcaggag ctgggcaaat acgagcagta catcaagtgg 3600

ccttggtaca tctggctggg ctttatcgcc ggcctgatcg ccattgtgat ggtgacaatc 3660

atgctgtgct gtatgacctc ttgctgctcc tgcctgaaag gctgttgtag ttgcggcagc 3720

tgctgtaaat tcgatgagga tgactccgag ccggtcctca aaggcgtcaa gctgcactac 3780

acctgataa 3789

<210> 4

<211> 3789

<212> DNA

<213> 人工序列(artificial sequence)

<400> 4

tcgcagtgcg tgaacctgac cacacggacc cagctgcctc cagcttacac aaatagcttc 60

accagaggcg tgtactaccc ggacaaggtg ttccggtcct ctgtgctgca cagcacccag 120

gacctcttcc tgcccttttt cagcaacgtg acctggttcc acgctatcca cgtgtctggc 180

acaaacggaa ccaaaagatt cgataacccc gtgctgcctt tcaatgatgg agtctacttc 240

gcctctaccg aaaagagcaa catcatccgc ggctggatct tcggcaccac cctggacagt 300

aagacccaga gcctgctcat cgtgaacaac gccacgaacg tggtgatcaa ggtgtgtgaa 360

ttccaatttt gcaacgaccc ctttctcggc gtgtactacc acaagaacaa taaatcttgg 420

atggaaagcg agtttagagt gtacagctct gctaacaact gcactttcga gtacgtgtcc 480

cagccattcc tgatggacct ggaaggcaag cagggcaatt tcaagaacct gagagaattc 540

gtgtttaaga acatcgacgg ctacttcaaa atctattcta agcacacccc aatcaacctg 600

gtccgggacc tgccacaagg cttcagcgcc ctggaacctc tggtggacct gcctatcgga 660

atcaacatca cccggttcca gaccctgctg gccctgcata gaagctacct gacacctggc 720

gacagcagct ctggctggac cgccggcgct gccgcatatt acgtcggcta cttgcaacct 780

aggaccttcc tgctgaaata caacgagaac ggcaccatca cagatgccgt tgattgcgcc 840

ctggaccccc tgagcgaaac caagtgtacc ctgaaatcct tcaccgtgga aaagggcatc 900

taccagacca gcaactttag agtacagcct acagaatcta tcgttcggtt tccaaacatt 960

accaacctgt gtcctttcgg cgaggtgttt aacgccacac ggttcgccag cgtgtatgcc 1020

tggaatagaa agcggatcag caactgtgtg gccgactact ccgtgctgta caatagcgcc 1080

agcttctcta catttaagtg ctacggcgtg tcccctacaa agctgaacga cctgtgcttc 1140

acaaacgtgt atgccgatag cttcgtgatc cggggcgatg aggtccggca gatcgctcct 1200

ggccagacag gcaagattgc cgactacaac tacaagctgc ccgatgactt caccggatgt 1260

gtgatagcct ggaacagcaa caacctggat agcaaggtgg gcggcaacta caactacctg 1320

taccgactgt ttagaaagag caacctgaaa ccttttgagc gggacatcag cacagagatc 1380

taccaagccg gctctacccc ttgtaacggc gtggaaggct tcaactgtta cttccctctg 1440

cagtcttacg gattccagcc tacaaacggc gtgggatacc agccctatag agtggtggtg 1500

ctgtcattcg agctgctaca tgcccctgcc accgtgtgcg gccctaagaa gtctaccaac 1560

ctcgtgaaga acaagtgcgt gaattttaac ttcaatggac tgacaggcac aggcgtgctg 1620

acagagagca acaaaaagtt cctgcccttc cagcagtttg gcagagatat cgctgacacc 1680

acagacgccg tgcgcgatcc tcagaccctg gagatcctgg acatcacccc ttgctccttt 1740

ggaggagtgt ccgtgatcac acctggaacg aacaccagca accaggttgc cgtgctgtac 1800

caggacgtga actgcacaga agttcctgtg gccatccatg ccgatcagct gacgcccacg 1860

tggcgggtgt actctaccgg cagcaatgtg ttccagacca gagccggctg ccttattggc 1920

gctgagcacg tgaataatag ctatgaatgc gatatcccaa tcggagccgg catttgcgcc 1980

agctaccaga cccagacaaa tagtcctaga agagccagat ctgtggcctc ccagagcatc 2040

atcgcatata ccatgagcct aggagctgaa aacagcgtcg cctattccaa caatagcatc 2100

gccatcccga caaacttcac catcagcgtg accaccgaaa tcctgcccgt gagcatgacc 2160

aagacaagcg tggactgtac aatgtacatc tgtggagact ccaccgagtg cagcaacctg 2220

ctgctgcagt acggcagctt ctgcacccag ctgaacagag ccctgacagg gatcgccgtg 2280

gaacaggata agaacaccca agaggtgttc gcccaagtga agcagatcta taagactcca 2340

cctattaagg actttggcgg cttcaacttc agccaaatcc tgcccgatcc tagcaagcca 2400

agcaagcggt ccttcatcga ggacctgctg ttcaacaagg tgaccctggc cgacgccggc 2460

ttcatcaagc agtatggcga ctgtctgggc gatatcgccg ctagagacct gatctgcgcc 2520

cagaagttca atggcctgac cgtgctccca cctctgctca ccgacgagat gatcgcccag 2580

tacacctctg ccctgctggc cggcaccatc accagcgggt ggacattcgg ggctggagct 2640

gctctgcaaa tccccttcgc catgcagatg gcctacagat tcaacggcat cggcgttacc 2700

cagaatgtgc tgtatgaaaa ccagaaactg atagctaacc agttcaacag cgccataggc 2760

aaaatccagg atagtctgag ctctacagcc agcgccctgg gaaaactgca ggatgtggtg 2820

aatcagaacg cccaggccct gaatacactg gtgaaacaac tgagcagcaa tttcggcgcc 2880

atcagcagcg tgctgaatga tatcctgtct agactggata aggtcgaggc cgaggtgcag 2940

atcgatagac tgatcaccgg cagactgcag tccctgcaga catacgtgac tcaacagctg 3000

atcagagccg ctgagatcag agcttctgct aatttggctg ccacaaagat gagcgagtgc 3060

gtgctgggcc agagcaaaag agtggacttc tgcggcaagg gctaccacct gatgagcttc 3120

ccccagagcg cccctcacgg cgtcgtgttc ctgcacgtga cttacgtgcc tgcccaagag 3180

aagaacttca ccaccgcccc tgccatctgc cacgacggca aggcccactt cccccgggag 3240

ggcgtgttcg tgagcaatgg cacccactgg ttcgtgaccc aaagaaactt ttacgagccc 3300

cagattatca ccaccgacaa caccttcgtg tcaggcaact gcgacgtggt gatcggcatc 3360

gtgaacaaca ctgtgtacga ccctctgcag cctgagctgg acagcttcaa ggaggaactg 3420

gacaagtact tcaaaaacca cacatctcct gacgtggacc tgggcgatat cagcggcatt 3480

aacgcctctg tggtgaacat ccagaaggaa atcgacagac tgaacgaggt ggccaagaac 3540

ctgaatgaga gcctgatcga cctgcaggag ctgggcaagt acgagcagta catcaagtgg 3600

ccttggtaca tctggctggg ctttatcgcc ggcctgatcg ccatcgtgat ggtcaccatc 3660

atgctgtgct gcatgaccag ctgttgcagc tgcctgaaag gctgttgcag ctgcggaagt 3720

tgctgcaagt ttgacgagga cgactctgag cctgtgctga agggcgtcaa gctgcactac 3780

acatgataa 3789

<210> 5

<211> 3789

<212> DNA

<213> 人工序列(artificial sequence)

<400> 5

agtcagtgtg taaacttgac cacaaggaca caactcccgc ctgcatatac taatagcttt 60

accagaggcg tatactatcc ggacaaggtc ttcaggtctt ctgtgctcca ttcaactcag 120

gatctttttc tccctttctt cagtaacgtt acttggtttc acgcaataca tgtttcagga 180

actaatggca cgaagaggtt tgacaaccct gtacttccct ttaatgacgg agtttatttc 240

gctagcaccg aaaaatcaaa tatcataagg ggatggatct tcgggaccac gctggacagc 300

aaaacgcaat ccttgttgat cgtaaacaat gctaccaatg ttgtaataaa ggtttgcgaa 360

tttcaattct gcaatgaccc gtttctcggt gtgtactatc ataaaaacaa caaaagttgg 420

atggaaagtg agtttagagt ctactccagt gcaaacaatt gtacatttga atatgtctcc 480

caaccctttt tgatggactt ggagggcaaa caggggaatt tcaaaaacct tcgagagttt 540

gtattcaaaa acatcgatgg atacttcaaa atatattcta aacacactcc catcaacttg 600

gttagagact tgccacaagg gttttcagct ctggaacctt tggtcgacct ccccattgga 660

ataaacatca cacgcttcca gaccctgctg gcgttgcata ggagctatct gaccccgggc 720

gacagttcta gtgggtggac tgcgggcgca gctgcctatt atgtgggcta ccttcaacct 780

cgaacattcc tcttgaaata taacgagaat ggaaccatca ccgacgcggt agactgtgca 840

cttgacccgt tgagtgaaac taagtgcacg ttgaagagct tcacagtaga aaagggaata 900

taccagacat caaacttccg agttcaacct accgaaagca tcgttcggtt cccgaatata 960

acgaatcttt gcccgttcgg cgaagtattc aacgcgacga gattcgctag tgtctacgcg 1020

tggaaccgca agcgaataag caattgtgta gctgattact ctgtgttgta taattcagca 1080

agtttcagta ctttcaagtg ttacggggtc tctcccacaa aacttaatga tctttgtttc 1140

acaaacgtat atgcagactc tttcgtaata cgcggcgatg aagtacgcca gatcgcgcca 1200

ggtcagaccg ggaagattgc agattataac tataaactcc cagacgattt caccggttgt 1260

gttattgcct ggaattctaa caatcttgac tcaaaagtag gtggcaacta taactatctg 1320

tatcgattgt ttagaaaatc aaatctcaag cctttcgaga gagacattag tacagaaata 1380

tatcaggcgg gatctactcc ctgcaatggt gtagagggat ttaattgtta tttcccactt 1440

caatcttacg gttttcaacc gactaatggg gtcgggtacc aaccttatag agtggtggtc 1500

ttgtctttcg aactgctgca tgctcccgcc acagtttgtg gtcccaagaa gagtactaat 1560

cttgtcaaga ataagtgcgt taatttcaac tttaatggcc tcaccggaac aggagttttg 1620

acggaatcta ataagaaatt cctcccattc caacagtttg gccgcgacat cgctgacacg 1680

actgatgcgg tgagagaccc tcagacgctt gagattctcg atatcacccc gtgttctttt 1740

ggcggagtat ccgtcataac accggggacg aacacgagca atcaggtagc ggtcctctat 1800

caggatgtta attgcaccga agttcccgtc gcaattcatg cagatcagct gacaccgact 1860

tggcgggttt attcaaccgg atctaatgtg ttccagaccc gcgccggatg tctgattggc 1920

gcggaacatg tgaacaatag ttacgaatgt gatattccta taggggcggg catttgcgcg 1980

tcataccaaa cgcagaccaa ctccccacgg cgggccagat cagttgctag tcaatcaatc 2040

atcgcgtata cgatgagcct tggagccgag aacagcgttg cttactcaaa caatagcatc 2100

gctattccga ccaactttac aatatccgtg accactgaaa tcttgccggt ctcaatgacc 2160

aagacgtccg tcgactgcac aatgtacata tgcggcgact caacggaatg ctctaatttg 2220

ttgctgcagt atggctcatt ctgcacgcaa ctcaatagag cccttacagg aattgcggta 2280

gagcaagaca agaatacgca ggaggtcttt gcacaagtga agcagatata taagacaccg 2340

cctataaaag atttcggtgg tttcaatttc tcccaaatac ttcccgatcc gtcaaaaccc 2400

tctaaaagaa gttttattga ggacttgctt ttcaataagg tgactttggc cgatgcgggc 2460

ttcataaagc aatatggtga ctgcctggga gacatcgcag ccagggacct tatatgtgcc 2520

cagaaattta atggtttgac tgttctccct ccgctcttga ctgacgaaat gatcgctcaa 2580

tacaccagcg cccttctcgc cggcactatc acgtccgggt ggacgttcgg cgctggtgcc 2640

gctctccaaa ttccttttgc tatgcaaatg gcatatcggt ttaatggcat aggggtaact 2700

cagaacgtac tgtatgaaaa tcaaaaactg attgccaacc agtttaattc cgctataggc 2760

aaaatccagg actctctgtc aagtaccgcg agcgctttgg gaaaactgca agatgtagtt 2820

aaccaaaacg cgcaggcttt gaacacactg gtaaaacaac ttagtagcaa ctttggggca 2880

atctcatcag tacttaacga tatactctct aggctcgaca aggtagaggc cgaggtacaa 2940

attgaccggc tgatcactgg gcgcctccaa tcattgcaga catatgtcac gcagcaactt 3000

atacgagcgg cggaaattag agcaagtgcg aacctggcgg caaccaaaat gtcagaatgc 3060

gtcctgggac aaagtaaaag agtagacttc tgcgggaagg gctaccattt gatgtccttt 3120

ccacagtcag caccacacgg ggttgtcttc ctgcacgtca cttacgtacc tgcgcaggag 3180

aagaacttca caactgctcc ggcgatttgc cacgatggaa aggcgcactt cccgagggag 3240

ggtgttttcg tctccaatgg cacacattgg ttcgttactc agaggaactt ttacgaaccc 3300

cagataataa ccaccgacaa cacatttgtg tctggaaatt gtgacgttgt tatcggcata 3360

gtgaacaaca ccgtgtacga cccccttcag ccagaactgg acagtttcaa agaggagctg 3420

gataaatatt ttaaaaatca tacgagtcca gatgttgacc ttggtgatat tagtggtatt 3480

aacgcgtctg ttgtcaatat tcagaaagaa atcgaccgac tgaacgaggt agcgaagaac 3540

ttgaacgagt ccttgataga tctgcaggaa cttggtaaat atgaacaata tataaagtgg 3600

ccttggtaca tatggttggg tttcattgca ggcttgattg caatcgtaat ggtgacgatt 3660

atgctctgct gtatgacatc atgctgctca tgtcttaaag gatgctgcag ctgcggtagc 3720

tgctgcaaat ttgatgagga cgattctgag cccgtcctga aaggtgtgaa gctccattac 3780

acgtagtaa 3789

<210> 6

<211> 3852

<212> DNA

<213> 人工序列(artificial sequence)

<400> 6

atgtggtggc gcctgtggtg gctgctgctg ctgctgctgc tgctgtggcc catggtgtgg 60

gcctctcagt gcgtgaacct gaccaccaga acccagctgc ctcctgctta caccaactcg 120

ttcacacggg gagtgtacta ccccgacaag gtgttcagga gctcagtgct gcatagcacc 180

caagacctgt tcctgccatt cttcagcaac gtcacgtggt tccacgccat ccacgtgtct 240

ggaaccaacg gcaccaagag attcgacaac cccgtgctgc ctttcaacga tggagtgtac 300

ttcgctagca ccgagaagag caacatcatc cggggctgga tcttcggcac cacactggac 360

tccaagacac agagtctgct gatcgtgaac aacgccacca acgtcgtgat caaggtgtgt 420

gagttccagt tctgcaacga tcctttcctc ggcgtttact accacaagaa caacaagagc 480

tggatggaat cagaatttag ggtatattct tctgccaata actgtacgtt tgaatacgtg 540

tctcagcctt tcctaatgga cctggaaggc aaacagggca actttaagaa cctgagagaa 600

ttcgtgttta agaacatcga cggctatttc aagatctaca gtaagcacac ccctatcaac 660

ctggtgcggg acctgcccca ggggttttcc gcccttgaac ctctggtgga cctgcccatt 720

ggcatcaata tcacaagatt ccagaccctg ctggccctgc acagaagcta cctgacccct 780

ggcgacagca gcagcggatg gaccgccggc gccgccgcct actacgtggg atacctgcag 840

cctagaacct tcctactgaa atacaacgaa aacggtacca tcaccgacgc cgtggattgc 900

gctctggacc ctctgagcga aaccaagtgc accctgaaaa gctttaccgt ggagaagggc 960

atttatcaga caagcaactt tcgggtgcag cctaccgaga gcatcgtgag attccctaac 1020

atcaccaacc tgtgtccttt cggcgaggtg ttcaatgcca cacggttcgc cagcgtgtac 1080

gcctggaacc ggaagcggat cagcaactgc gtggccgact acagcgtgct gtataatagc 1140

gccagcttca gcacattcaa gtgctacggc gtgagcccca ccaagctgaa tgatctgtgc 1200

tttaccaacg tgtatgccga tagctttgtg atccgggggg acgaggtaag acagattgcc 1260

ccaggacaga caggcaaaat cgcagattac aactacaaac tgcctgacga cttcaccggc 1320

tgcgttatcg cctggaactc caacaacctg gacagcaagg tgggaggaaa ctacaactac 1380

ctgtaccgac tgttcagaaa gagcaacctg aagccattcg agagagatat ttcgacagag 1440

atctaccagg ccggaagcac accttgcaac ggcgtggaag gcttcaactg ctacttcccc 1500

ctgcagagct acggctttca gcccacaaac ggcgtcggct accagcctta cagagtggtg 1560

gtgctgagct tcgagctgct gcatgcccct gccaccgtgt gcgggcctaa gaagtccaca 1620

aatctggtaa agaataagtg tgtgaacttc aatttcaatg gcctgaccgg aacgggtgtg 1680

ctgaccgaat ctaataagaa gttcctgcct ttccagcagt tcggccgtga tatcgccgac 1740

accaccgacg ctgtccgcga tcctcaaacc ctggaaatcc tggacattac accttgcagc 1800

ttcggcggcg tgtccgtgat cacaccaggc acaaacacca gcaaccaggt ggctgtgctg 1860

taccaggacg tgaactgtac agaggtgcct gtggccatcc acgccgacca gctgacacct 1920

acatggagag tgtattcaac aggcagcaac gtcttccaga ccagagcagg atgcctgatc 1980

ggcgctgagc atgtgaacaa ctcctacgag tgcgacatcc ctatcggcgc cggcatctgc 2040

gctagttacc agactcaaac caactctcct cggcgggcta gaagcgtcgc ctcccagagc 2100

atcatcgctt ataccatgtc tctgggcgcc gagaacagcg tggcctacag caacaactcc 2160

atcgccattc ctaccaactt cacgatctca gttaccaccg agatcctgcc tgtgagcatg 2220

acaaagacca gcgtcgactg caccatgtac atctgcggcg attccacaga atgctccaac 2280

ctgctgctcc agtacggctc tttctgtacc cagctgaaca gagccctgac aggcatcgcc 2340

gtggaacagg ataagaacac tcaggaggtg ttcgcccagg tgaagcagat ctacaagacc 2400

cctccaatca aggactttgg cggctttaat ttcagccaaa tcctcccaga tcctagcaag 2460

cccagcaaga gaagcttcat cgaggacctg ctgttcaaca aggtcaccct ggctgacgcc 2520

ggcttcatca agcagtatgg cgactgcctg ggcgatatcg ccgcgaggga tctaatttgt 2580

gctcagaagt tcaacggcct gaccgtgctg ccccccctgc tgacagacga aatgatcgct 2640

cagtacacat ctgccctgct ggccggcacc atcacgagcg gctggacctt cggagccggc 2700

gccgccctgc agatcccctt cgctatgcag atggcctata gattcaacgg catcggcgtg 2760

acccagaacg tgctgtacga gaaccaaaaa ctgattgcca atcaatttaa ttccgcgatc 2820

ggaaagatcc aggactctct gagctctact gccagcgccc tgggcaagct gcaagacgtg 2880

gtgaaccaga atgctcaagc cctgaacacc ctggtgaagc agctgagcag caatttcgga 2940

gcaatcagct ctgtcctcaa cgacattctg tctagactag acaaggtgga agccgaagtg 3000

cagatcgatc ggcttatcac cggaagactg cagagcctgc agacatatgt tacacagcag 3060

ctgatcagag ccgccgagat cagagccagc gccaacctgg cagccacaaa aatgtccgag 3120

tgcgtcctcg gccaatctaa gcgggttgat ttctgtggca aaggctacca cctgatgagc 3180

ttcccccaaa gcgctcctca cggcgtggtg tttctgcacg tcacctacgt gcccgcccaa 3240

gagaagaact tcaccaccgc ccccgctatc tgccacgacg gcaaggccca cttccctcgg 3300

gaaggcgtgt tcgtgagtaa cggtacacac tggtttgtga cccaaagaaa cttctacgag 3360

cctcagatca tcaccaccga taacaccttt gtgagcggca actgcgatgt ggtgatcggc 3420

atcgtgaaca acacagtata cgaccccctg cagcccgagc tggacagctt taaagaggag 3480

ctcgataagt acttcaagaa ccacacatct ccagacgtgg acctgggcga catcagcggc 3540

atcaacgcca gtgttgtgaa catccagaaa gaaatcgata gactgaacga agtggccaag 3600

aatctgaacg agagcctgat cgacctgcag gagctgggca aatacgagca gtacatcaag 3660

tggccttggt acatctggct gggctttatc gccggcctga tcgccattgt gatggtgaca 3720

atcatgctgt gctgtatgac ctcttgctgc tcctgcctga aaggctgttg tagttgcggc 3780

agctgctgta aattcgatga ggatgactcc gagccggtcc tcaaaggcgt caagctgcac 3840

tacacctgat aa 3852

<210> 7

<211> 3852

<212> DNA

<213> 人工序列(artificial sequence)

<400> 7

atgtggtggc gcctgtggtg gctgctgctg ctgctgctgc tgctgtggcc catggtgtgg 60

gcctcgcagt gcgtgaacct gaccacacgg acccagctgc ctccagctta cacaaatagc 120

ttcaccagag gcgtgtacta cccggacaag gtgttccggt cctctgtgct gcacagcacc 180

caggacctct tcctgccctt tttcagcaac gtgacctggt tccacgctat ccacgtgtct 240

ggcacaaacg gaaccaaaag attcgataac cccgtgctgc ctttcaatga tggagtctac 300

ttcgcctcta ccgaaaagag caacatcatc cgcggctgga tcttcggcac caccctggac 360

agtaagaccc agagcctgct catcgtgaac aacgccacga acgtggtgat caaggtgtgt 420

gaattccaat tttgcaacga cccctttctc ggcgtgtact accacaagaa caataaatct 480

tggatggaaa gcgagtttag agtgtacagc tctgctaaca actgcacttt cgagtacgtg 540

tcccagccat tcctgatgga cctggaaggc aagcagggca atttcaagaa cctgagagaa 600

ttcgtgttta agaacatcga cggctacttc aaaatctatt ctaagcacac cccaatcaac 660

ctggtccggg acctgccaca aggcttcagc gccctggaac ctctggtgga cctgcctatc 720

ggaatcaaca tcacccggtt ccagaccctg ctggccctgc atagaagcta cctgacacct 780

ggcgacagca gctctggctg gaccgccggc gctgccgcat attacgtcgg ctacttgcaa 840

cctaggacct tcctgctgaa atacaacgag aacggcacca tcacagatgc cgttgattgc 900

gccctggacc ccctgagcga aaccaagtgt accctgaaat ccttcaccgt ggaaaagggc 960

atctaccaga ccagcaactt tagagtacag cctacagaat ctatcgttcg gtttccaaac 1020

attaccaacc tgtgtccttt cggcgaggtg tttaacgcca cacggttcgc cagcgtgtat 1080

gcctggaata gaaagcggat cagcaactgt gtggccgact actccgtgct gtacaatagc 1140

gccagcttct ctacatttaa gtgctacggc gtgtccccta caaagctgaa cgacctgtgc 1200

ttcacaaacg tgtatgccga tagcttcgtg atccggggcg atgaggtccg gcagatcgct 1260

cctggccaga caggcaagat tgccgactac aactacaagc tgcccgatga cttcaccgga 1320

tgtgtgatag cctggaacag caacaacctg gatagcaagg tgggcggcaa ctacaactac 1380

ctgtaccgac tgtttagaaa gagcaacctg aaaccttttg agcgggacat cagcacagag 1440

atctaccaag ccggctctac cccttgtaac ggcgtggaag gcttcaactg ttacttccct 1500

ctgcagtctt acggattcca gcctacaaac ggcgtgggat accagcccta tagagtggtg 1560

gtgctgtcat tcgagctgct acatgcccct gccaccgtgt gcggccctaa gaagtctacc 1620

aacctcgtga agaacaagtg cgtgaatttt aacttcaatg gactgacagg cacaggcgtg 1680

ctgacagaga gcaacaaaaa gttcctgccc ttccagcagt ttggcagaga tatcgctgac 1740

accacagacg ccgtgcgcga tcctcagacc ctggagatcc tggacatcac cccttgctcc 1800

tttggaggag tgtccgtgat cacacctgga acgaacacca gcaaccaggt tgccgtgctg 1860

taccaggacg tgaactgcac agaagttcct gtggccatcc atgccgatca gctgacgccc 1920

acgtggcggg tgtactctac cggcagcaat gtgttccaga ccagagccgg ctgccttatt 1980

ggcgctgagc acgtgaataa tagctatgaa tgcgatatcc caatcggagc cggcatttgc 2040

gccagctacc agacccagac aaatagtcct agaagagcca gatctgtggc ctcccagagc 2100

atcatcgcat ataccatgag cctaggagct gaaaacagcg tcgcctattc caacaatagc 2160

atcgccatcc cgacaaactt caccatcagc gtgaccaccg aaatcctgcc cgtgagcatg 2220

accaagacaa gcgtggactg tacaatgtac atctgtggag actccaccga gtgcagcaac 2280

ctgctgctgc agtacggcag cttctgcacc cagctgaaca gagccctgac agggatcgcc 2340

gtggaacagg ataagaacac ccaagaggtg ttcgcccaag tgaagcagat ctataagact 2400

ccacctatta aggactttgg cggcttcaac ttcagccaaa tcctgcccga tcctagcaag 2460

ccaagcaagc ggtccttcat cgaggacctg ctgttcaaca aggtgaccct ggccgacgcc 2520

ggcttcatca agcagtatgg cgactgtctg ggcgatatcg ccgctagaga cctgatctgc 2580

gcccagaagt tcaatggcct gaccgtgctc ccacctctgc tcaccgacga gatgatcgcc 2640

cagtacacct ctgccctgct ggccggcacc atcaccagcg ggtggacatt cggggctgga 2700

gctgctctgc aaatcccctt cgccatgcag atggcctaca gattcaacgg catcggcgtt 2760

acccagaatg tgctgtatga aaaccagaaa ctgatagcta accagttcaa cagcgccata 2820

ggcaaaatcc aggatagtct gagctctaca gccagcgccc tgggaaaact gcaggatgtg 2880

gtgaatcaga acgcccaggc cctgaataca ctggtgaaac aactgagcag caatttcggc 2940

gccatcagca gcgtgctgaa tgatatcctg tctagactgg ataaggtcga ggccgaggtg 3000

cagatcgata gactgatcac cggcagactg cagtccctgc agacatacgt gactcaacag 3060

ctgatcagag ccgctgagat cagagcttct gctaatttgg ctgccacaaa gatgagcgag 3120

tgcgtgctgg gccagagcaa aagagtggac ttctgcggca agggctacca cctgatgagc 3180

ttcccccaga gcgcccctca cggcgtcgtg ttcctgcacg tgacttacgt gcctgcccaa 3240

gagaagaact tcaccaccgc ccctgccatc tgccacgacg gcaaggccca cttcccccgg 3300

gagggcgtgt tcgtgagcaa tggcacccac tggttcgtga cccaaagaaa cttttacgag 3360

ccccagatta tcaccaccga caacaccttc gtgtcaggca actgcgacgt ggtgatcggc 3420

atcgtgaaca acactgtgta cgaccctctg cagcctgagc tggacagctt caaggaggaa 3480

ctggacaagt acttcaaaaa ccacacatct cctgacgtgg acctgggcga tatcagcggc 3540

attaacgcct ctgtggtgaa catccagaag gaaatcgaca gactgaacga ggtggccaag 3600

aacctgaatg agagcctgat cgacctgcag gagctgggca agtacgagca gtacatcaag 3660

tggccttggt acatctggct gggctttatc gccggcctga tcgccatcgt gatggtcacc 3720

atcatgctgt gctgcatgac cagctgttgc agctgcctga aaggctgttg cagctgcgga 3780

agttgctgca agtttgacga ggacgactct gagcctgtgc tgaagggcgt caagctgcac 3840

tacacatgat aa 3852

<210> 8

<211> 3852

<212> DNA

<213> 人工序列(artificial sequence)

<400> 8

atgtggtggc gcctgtggtg gctgctgctg ctgctgctgc tgctgtggcc catggtgtgg 60

gccagtcagt gtgtaaactt gaccacaagg acacaactcc cgcctgcata tactaatagc 120

tttaccagag gcgtatacta tccggacaag gtcttcaggt cttctgtgct ccattcaact 180

caggatcttt ttctcccttt cttcagtaac gttacttggt ttcacgcaat acatgtttca 240

ggaactaatg gcacgaagag gtttgacaac cctgtacttc cctttaatga cggagtttat 300

ttcgctagca ccgaaaaatc aaatatcata aggggatgga tcttcgggac cacgctggac 360

agcaaaacgc aatccttgtt gatcgtaaac aatgctacca atgttgtaat aaaggtttgc 420

gaatttcaat tctgcaatga cccgtttctc ggtgtgtact atcataaaaa caacaaaagt 480

tggatggaaa gtgagtttag agtctactcc agtgcaaaca attgtacatt tgaatatgtc 540

tcccaaccct ttttgatgga cttggagggc aaacagggga atttcaaaaa ccttcgagag 600

tttgtattca aaaacatcga tggatacttc aaaatatatt ctaaacacac tcccatcaac 660

ttggttagag acttgccaca agggttttca gctctggaac ctttggtcga cctccccatt 720

ggaataaaca tcacacgctt ccagaccctg ctggcgttgc ataggagcta tctgaccccg 780

ggcgacagtt ctagtgggtg gactgcgggc gcagctgcct attatgtggg ctaccttcaa 840

cctcgaacat tcctcttgaa atataacgag aatggaacca tcaccgacgc ggtagactgt 900

gcacttgacc cgttgagtga aactaagtgc acgttgaaga gcttcacagt agaaaaggga 960

atataccaga catcaaactt ccgagttcaa cctaccgaaa gcatcgttcg gttcccgaat 1020

ataacgaatc tttgcccgtt cggcgaagta ttcaacgcga cgagattcgc tagtgtctac 1080

gcgtggaacc gcaagcgaat aagcaattgt gtagctgatt actctgtgtt gtataattca 1140

gcaagtttca gtactttcaa gtgttacggg gtctctccca caaaacttaa tgatctttgt 1200

ttcacaaacg tatatgcaga ctctttcgta atacgcggcg atgaagtacg ccagatcgcg 1260

ccaggtcaga ccgggaagat tgcagattat aactataaac tcccagacga tttcaccggt 1320

tgtgttattg cctggaattc taacaatctt gactcaaaag taggtggcaa ctataactat 1380

ctgtatcgat tgtttagaaa atcaaatctc aagcctttcg agagagacat tagtacagaa 1440

atatatcagg cgggatctac tccctgcaat ggtgtagagg gatttaattg ttatttccca 1500

cttcaatctt acggttttca accgactaat ggggtcgggt accaacctta tagagtggtg 1560

gtcttgtctt tcgaactgct gcatgctccc gccacagttt gtggtcccaa gaagagtact 1620

aatcttgtca agaataagtg cgttaatttc aactttaatg gcctcaccgg aacaggagtt 1680

ttgacggaat ctaataagaa attcctccca ttccaacagt ttggccgcga catcgctgac 1740

acgactgatg cggtgagaga ccctcagacg cttgagattc tcgatatcac cccgtgttct 1800

tttggcggag tatccgtcat aacaccgggg acgaacacga gcaatcaggt agcggtcctc 1860

tatcaggatg ttaattgcac cgaagttccc gtcgcaattc atgcagatca gctgacaccg 1920

acttggcggg tttattcaac cggatctaat gtgttccaga cccgcgccgg atgtctgatt 1980

ggcgcggaac atgtgaacaa tagttacgaa tgtgatattc ctataggggc gggcatttgc 2040

gcgtcatacc aaacgcagac caactcccca cggcgggcca gatcagttgc tagtcaatca 2100

atcatcgcgt atacgatgag ccttggagcc gagaacagcg ttgcttactc aaacaatagc 2160

atcgctattc cgaccaactt tacaatatcc gtgaccactg aaatcttgcc ggtctcaatg 2220

accaagacgt ccgtcgactg cacaatgtac atatgcggcg actcaacgga atgctctaat 2280

ttgttgctgc agtatggctc attctgcacg caactcaata gagcccttac aggaattgcg 2340

gtagagcaag acaagaatac gcaggaggtc tttgcacaag tgaagcagat atataagaca 2400

ccgcctataa aagatttcgg tggtttcaat ttctcccaaa tacttcccga tccgtcaaaa 2460

ccctctaaaa gaagttttat tgaggacttg cttttcaata aggtgacttt ggccgatgcg 2520

ggcttcataa agcaatatgg tgactgcctg ggagacatcg cagccaggga ccttatatgt 2580

gcccagaaat ttaatggttt gactgttctc cctccgctct tgactgacga aatgatcgct 2640

caatacacca gcgcccttct cgccggcact atcacgtccg ggtggacgtt cggcgctggt 2700

gccgctctcc aaattccttt tgctatgcaa atggcatatc ggtttaatgg cataggggta 2760

actcagaacg tactgtatga aaatcaaaaa ctgattgcca accagtttaa ttccgctata 2820

ggcaaaatcc aggactctct gtcaagtacc gcgagcgctt tgggaaaact gcaagatgta 2880

gttaaccaaa acgcgcaggc tttgaacaca ctggtaaaac aacttagtag caactttggg 2940

gcaatctcat cagtacttaa cgatatactc tctaggctcg acaaggtaga ggccgaggta 3000

caaattgacc ggctgatcac tgggcgcctc caatcattgc agacatatgt cacgcagcaa 3060

cttatacgag cggcggaaat tagagcaagt gcgaacctgg cggcaaccaa aatgtcagaa 3120

tgcgtcctgg gacaaagtaa aagagtagac ttctgcggga agggctacca tttgatgtcc 3180

tttccacagt cagcaccaca cggggttgtc ttcctgcacg tcacttacgt acctgcgcag 3240

gagaagaact tcacaactgc tccggcgatt tgccacgatg gaaaggcgca cttcccgagg 3300

gagggtgttt tcgtctccaa tggcacacat tggttcgtta ctcagaggaa cttttacgaa 3360

ccccagataa taaccaccga caacacattt gtgtctggaa attgtgacgt tgttatcggc 3420

atagtgaaca acaccgtgta cgaccccctt cagccagaac tggacagttt caaagaggag 3480

ctggataaat attttaaaaa tcatacgagt ccagatgttg accttggtga tattagtggt 3540

attaacgcgt ctgttgtcaa tattcagaaa gaaatcgacc gactgaacga ggtagcgaag 3600

aacttgaacg agtccttgat agatctgcag gaacttggta aatatgaaca atatataaag 3660

tggccttggt acatatggtt gggtttcatt gcaggcttga ttgcaatcgt aatggtgacg 3720

attatgctct gctgtatgac atcatgctgc tcatgtctta aaggatgctg cagctgcggt 3780

agctgctgca aatttgatga ggacgattct gagcccgtcc tgaaaggtgt gaagctccat 3840

tacacgtagt aa 3852

<210> 9

<211> 1261

<212> PRT

<213> 人工序列(artificial sequence)

<400> 9

Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr

1 5 10 15

Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg

20 25 30

Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser

35 40 45

Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr

50 55 60

Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe

65 70 75 80

Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr

85 90 95

Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr

100 105 110

Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe

115 120 125

Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu

130 135 140

Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser

145 150 155 160

Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn

165 170 175

Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr

180 185 190

Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe

195 200 205

Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr

210 215 220

Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly

225 230 235 240

Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly

245 250 255

Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr

260 265 270

Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys

275 280 285

Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser

290 295 300

Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile

305 310 315 320

Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala

325 330 335

Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp

340 345 350

Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr

355 360 365

Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr

370 375 380

Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro

385 390 395 400

Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp

405 410 415

Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys

420 425 430

Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn

435 440 445

Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly

450 455 460

Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu

465 470 475 480

Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr

485 490 495

Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val

500 505 510

Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn

515 520 525

Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn

530 535 540

Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr

545 550 555 560

Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr

565 570 575

Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr

580 585 590

Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val

595 600 605

Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr

610 615 620

Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly

625 630 635 640

Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala

645 650 655

Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala

660 665 670

Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly

675 680 685

Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr

690 695 700

Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr

705 710 715 720

Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu

725 730 735

Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn

740 745 750

Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu

755 760 765

Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp

770 775 780

Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro

785 790 795 800

Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu

805 810 815

Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile

820 825 830

Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val

835 840 845

Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala

850 855 860

Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala

865 870 875 880

Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly

885 890 895

Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala

900 905 910

Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser

915 920 925

Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala

930 935 940

Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala

945 950 955 960

Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu

965 970 975

Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu

980 985 990

Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala

995 1000 1005

Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln

1010 1015 1020

Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe

1025 1030 1035 1040

Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val

1045 1050 1055

Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp

1060 1065 1070

Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr

1075 1080 1085

His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr

1090 1095 1100

Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile

1105 1110 1115 1120

Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe

1125 1130 1135

Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val

1140 1145 1150

Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln

1155 1160 1165

Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser

1170 1175 1180

Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp

1185 1190 1195 1200

Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val

1205 1210 1215

Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu

1220 1225 1230

Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp

1235 1240 1245

Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr

1250 1255 1260

<210> 10

<211> 12

<212> PRT

<213> 人工序列(artificial sequence)

<400> 10

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser

1 5 10

33页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:洋葱γ-谷氨酰半胱氨酸连接酶AcGCL基因在提高植物耐重金属中的应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!