mRNA或mRNA组合物及其制备方法和应用

文档序号:1871917 发布日期:2021-11-23 浏览:16次 >En<

阅读说明:本技术 mRNA或mRNA组合物及其制备方法和应用 (mRNA or mRNA composition, preparation method and application thereof ) 是由 朱涛 王浩猛 李荩 晏巧玲 莘春林 邵忠琦 李军强 宇学峰 巢守柏 于 2021-05-14 设计创作,主要内容包括:本发明提供了mRNA或mRNA组合物以及包含mRNA或mRNA组合物的mRNA疫苗。所述的mRNA或mRNA组合物包含编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列以及编码S蛋白中的RBD或其变体的mRNA序列。本发明还提供了mRNA或mRNA组合物以及包含mRNA或mRNA组合物的mRNA疫苗在制备预防和/或治疗新型冠状病毒SARS-CoV-2感染导致的疾病的药物(尤其是疫苗)中的应用。(The invention provides mrnas or mRNA compositions and mRNA vaccines comprising mrnas or mRNA compositions. The mRNA or mRNA composition comprises an mRNA sequence encoding the S protein of the novel coronavirus SARS-CoV-2 or a variant thereof and an mRNA sequence encoding the RBD in the S protein or a variant thereof. The invention also provides the mRNA or mRNA composition and the application of the mRNA vaccine containing the mRNA or mRNA composition in the preparation of medicaments (especially vaccines) for preventing and/or treating diseases caused by the infection of the novel coronavirus SARS-CoV-2.)

mRNA或mRNA组合物及其制备方法和应用

技术领域

本发明涉及疫苗研制技术领域,具体涉及包含编码新型冠状病毒SARS-CoV-2的刺突蛋白(S蛋 白)或其变体的mRNA序列以及编码S蛋白中的受体结合域(RBD)或其变体的mRNA序列。本发明涉及 包含一种或两种mRNA的组合物。以及所述mRNA或组合物在制备预防和/或治疗新型冠状病毒 SARS-CoV-2感染的药物(尤其是疫苗)中的应用。

背景技术

冠状病毒为不分节段的单股正链RNA病毒,属于巢病毒(Nidovirales)冠状病毒(Coronaviridae) 正冠状病毒亚科(Orthocoronavirinae),根据血清型和基因组特点冠状病毒亚科被分为α、β、γ和 δ四个属。迄今为止,共有7种冠状病毒可感染人类:包括α属的229E和NL63,β属的OC43和HKU1、 中东呼吸综合征相关冠状病毒(MERSr-CoV)、严重急性呼吸综合征相关冠状病毒(SARSr-CoV)和新型冠 状病毒(SARS-CoV-2)。其中只有后三种会导致严重的人类疾病甚至死亡。

冠状病毒有包膜,颗粒呈圆形或椭圆形,经常为多形性,直径通常为50~200nm。S蛋白位于病 毒表面形成棒状结构,作为病毒的主要抗原蛋白之一,是用于分型的主要基因。N蛋白包裹病毒基因 组,可用作诊断抗原。对冠状病毒理化特性的认识多来自对SARS-CoV和MERS-CoV的研究。基于 SARS-CoV的全长S蛋白设计的疫苗被报道会诱导大量非中和抗体,在动物模型上攻毒失败且引起严重 的副反应,比如增加发病率,引起肝部组织强烈炎症反应及肝损伤(参见文献:“Evaluation of modified vaccinia virus ankara basedrecombinant SARS vaccine in ferrets”,Vaccine 23, 2273-2279.)。因此,在疫苗设计中避免暴露能具有免疫优势的非中和表位是保障疫苗安全性的基础。

SARS-CoV和MERS-CoV的RBD都由两部分组成:一个高度相似的核心结构和一段差异极大的受体 结合基序(RBM)。RBM的不同使得SARS-CoV和MERS-CoV分别识别不同的受体:SARS-CoV识别血管紧 张素转化酶2(ACE2),而MERS-CoV识别二肽基肽酶4(DPP4)。

目前SARS-CoV和MERS-CoV疫苗研发所涉及到的疫苗平台有:病毒载体疫苗、DNA疫苗、亚单位 疫苗、类病毒颗粒(VLP)疫苗、全病毒灭活疫苗和减毒疫苗。

虽然全病毒灭活疫苗理论上可以快速生产应对新型冠状病毒SARS-CoV-2疫情的爆发,但是一方 面病毒的培养需要生物安全三级实验室,疫苗企业一般很难满足其生产要求;另一方面安全性可能也 存在问题,研发中的SARS-CoV和MERS-CoV的全病毒灭活疫苗均有报道在小鼠模型上攻毒后会在肺部 发现过敏型病理现象(参见文献:“Immunizationwith inactivated middle east respiratory syndrome coronavirus vaccine leadsto lung immunopathology on challenge with live virus”,Hum.Vaccin.Immunother.12,2351-2356.),因此全病毒灭活疫苗的形式并不是研发用于COVID-19疫苗的最佳选 择。

由于老年人以及免疫力低下的人群,也是SARS-CoV-2感染的宿主,而减毒活苗平台制备得到的 疫苗不适合老年人及免疫力低下个体,因此不适合用于COVID-19疫苗的研发。

DNA疫苗和病毒载体疫苗都是将DNA递送至疫苗接种者的细胞内表达,虽然诸如基于腺病毒载体 的疫苗目前并没有整合重组进基因组的报导,但是也不能完全排除此种可能,仍有一定安全风险。亚 单位疫苗和VLP疫苗则是需要建立优化表达、纯化方法,并且一般需要选择搭配适合的佐剂,需要的 研究时间往往以年计算,难以用于应对快速发展的疫情。

近年来RNA分子领域相关技术突破性进展,mRNA疫苗在流感病毒、埃博拉病毒和寨卡病毒等多 种传染病上取得了一定的研究成果,mRNA疫苗将mRNA传递至细胞,表达产生蛋白,从而使机体获得 免疫保护。与传统的重组蛋白疫苗、灭活疫苗和减毒疫苗相比,mRNA疫苗制备步骤简单,对于传染性 疾病的控制有着重大意义。此外,mRNA疫苗比传统重组疫苗更耐高温也更加稳定。同时,mRNA疫苗能 够引起强烈的CD4+或CD8+的T细胞应答,与DNA免疫接种不同,在动物体内mRNA疫苗通过一两次低 剂量接种就能够产生抗体。

因此,本发明提供了一种安全可靠的mRNA疫苗,避免了其他疫苗平台的缺陷。

发明内容

本发明的第一方面,提供了mRNA或mRNA组合物,所述的mRNA或mRNA组合物包含编码新 型冠状病毒SARS-CoV-2的S蛋白(刺突蛋白)或其变体的mRNA序列以及编码S蛋白中的RBD(受 体结合域)或其变体的mRNA序列。

其中,所述的编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列与编码S蛋白 中的RBD或其变体的mRNA序列来源于相同的SARS-CoV-2突变株或不同的SARS-CoV-2突变株。

优选的,所述的S蛋白或其变体包含野生型全长S蛋白或固定在融合前构象的全长S蛋白。

进一步优选的,为稳定构象,所述的固定在融合前构象的全长S蛋白包含682RRAR685位 突变和/或将986KV987位突变,以使S蛋白固定到融合前构象。最为优选的,所述的固定在融合 前构象的全长S蛋白为将野生型全长S蛋白的682RRAR685突变为GSAG和/或将986KV987突变为 PP。

同时,现有专利中公开的部分内容也支持了本发明的技术方案,例如在接近第一段七肽重 复区域或在第一段七肽重复区域中将一个或两个氨基酸替换为脯氨酸可极有效率地稳定构象(见 美国专利,申请号20200061185,PREFUSION CORONAVIRUS SPIKEPROTEINS and THEIR USE)。

在本发明的一个

具体实施方式

中,所述的野生型全长S蛋白的氨基酸序列如SEQID NO:1 或与SEQ ID NO:1具有70%、75%、80%、85%、90%、95%、99%同一性的氨基酸序列。

在本发明的一个具体实施方式中,所述的固定在融合前构象的全长S蛋白的氨基酸序列如 SEQ ID NO:2、SEQ ID NO:15或与SEQ ID NO:2或15具有70%、75%、80%、85%、90%、95%、99%同一性的氨基酸序列。

优选的,所述的S蛋白或其变体不包含信号肽、包含野生型S蛋白的信号肽或包含野生型 S蛋白的信号肽及在其前添加强信号肽,所述的强信号肽优选为组织型纤溶酶原激活剂(tPA) 的信号肽或血清免疫球蛋白E(lgE)的信号肽。

在本发明的一个具体实施方式中,编码不含信号肽的野生型2019-nCoV S蛋白的核苷酸序 列如SEQ ID NO:6所示。

在本发明的一个具体实施方式中,所述的RBD的氨基酸序列如SEQ ID NO:3、SEQID NO: 13、或与SEQ ID NO:3或13具有70%、75%、80%、85%、90%、95%、99%同一性的氨基酸序列。

优选的,所述的RBD或其变体不包含信号肽、包含野生型S蛋白的信号肽或包含野生型S 蛋白的信号肽及在其前添加强信号肽,所述的强信号肽优选为组织型纤溶酶原激活剂(tPA)的 信号肽或血清免疫球蛋白E(lgE)的信号肽。

在本发明的一个具体实施方式中,编码含IgE信号肽的野生型SARS-CoV-2的RBD的核苷 酸序列如SEQ ID NO:7、9-11任一所示。

优选的,所述的mRNA为单顺反子、双顺反子或多顺反子mRNA。所述的双顺反子或多顺反 子mRNA即含有两个及以上编码区的mRNA。

优选的,所述的编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列与编码S蛋 白中的RBD或其变体的mRNA序列为分别的两条mRNA序列或连接为一条mRNA序列。

进一步优选的,连接为一条mRNA序列从5’至3’的连接顺序为:先编码新型冠状病毒 SARS-CoV-2的S蛋白或其变体的mRNA序列、后编码S蛋白中的RBD或其变体的mRNA序列,或 者为先编码S蛋白中的RBD或其变体的mRNA序列、后编码新型冠状病毒SARS-CoV-2的S蛋白或 其变体的mRNA序列。再进一步优选的,编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA 序列与编码S蛋白中的RBD或其变体的mRNA序列之间通过内部核糖体进入位点(IRES)连接。

其中,所述的IRES可以用于分隔两个编码区。

在本发明的一个具体实施方式中,所述的IRES序列包括但不限于小RNA病毒(例如FMDV)、 瘟病毒(例如CFFV)、脊髓灰质炎病毒(例如PV)、脑心肌炎病毒(例如ECMV)、口蹄疫病毒(例如 FMDV)、丙肝病毒(例如HCV)、古典猪瘟病毒(例如CSFV)、小鼠角膜白斑病毒(例如MLV)、猿免 疫缺陷病毒(例如SIV)或蟋蟀麻痹病毒(例如CrPV)。

优选的,所述的mRNA或mRNA组合物还包含5’帽子结构、5’非编码区和多聚腺苷酸尾。

进一步优选的,所述的mRNA或mRNA组合物还包含5’保守序列元素、RNA复制酶编码区、 亚基因组启动子、3’保守序列元素或3’非编码区中的一种或两种以上的组合。

优选的,所述的mRNA为传统mRNA、自主扩增型mRNA或反式扩增型mRNA。

在本发明的一个具体实施方式中,所述的mRNA为传统mRNA,即所述的mRNA除包含编码新 型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列以及编码S蛋白中的RBD或其变体的mRNA 序列外,还包含5’帽子结构,5’非编码区,3’非编码区和/或多聚腺苷酸尾的mRNA序列。

在本发明的一个具体实施方式中,所述的mRNA为自主扩增型mRNA,即所述的mRNA除包含 编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列以及编码S蛋白中的RBD或其变体 的mRNA序列外,还包括5’帽子结构,5’保守序列元素,RNA复制酶编码区,亚基因组启动子, 3’保守序列元素和多聚腺苷酸尾构成。其中,可使用的RNA复制酶编码区包括但不限于甲病毒 (例如SFV)、小RNA病毒(例如FMDV)、黄病毒(例如DENV)、副粘病毒(例如HMPV)或杯状病毒(例 如NV)。

在本发明的一个具体实施方式中,所述的mRNA为反式扩增型mRNA,即所述的编码目的基因 的mRNA除包含编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列以及编码S蛋白中 的RBD或其变体的mRNA序列外,还包括5’帽子结构,5’保守序列元素,亚基因组启动子,3’ 保守序列元素和多聚腺苷酸尾构成;RNA复制酶由单独的传统mRNA编码。

在本发明的一个具体实施方式中,所述的mRNA或mRNA组合物包括编码新型冠状病毒SARS-CoV-2 的S蛋白或其变体的mRNA序列与编码S蛋白中的RBD或其变体的mRNA序列连接构成的一条mRNA序列, 其选自下列任一组:

A)由5’帽子结构,5’非编码区,编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序 列,编码S蛋白中的RBD或其变体的mRNA序列,3’非编码区和多聚腺苷酸尾构成;

B)由5’帽子结构,5’非编码区,编码S蛋白中的RBD或其变体的mRNA序列,编码新型冠状 病毒SARS-CoV-2的S蛋白或其变体的mRNA序列,3’非编码区和多聚腺苷酸尾构成;

C)由5’帽子结构,5’非编码区,编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序 列,内部核糖体进入位点(IRES),编码S蛋白中的RBD或其变体的mRNA序列,3’非编码区和多聚 腺苷酸尾构成;

D)由5’帽子结构,5’非编码区,编码S蛋白中的RBD或其变体的mRNA序列,IRES,编码新 型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列,3’非编码区和多聚腺苷酸尾构成;

E)由5’帽子结构,5’保守序列元素,RNA复制酶编码区,亚基因组启动子,编码S蛋白中的 RBD或其变体的mRNA序列,编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列,3’保守 序列元素和多聚腺苷酸尾构成;

F)由5’帽子结构,5’保守序列元素,RNA复制酶编码区,亚基因组启动子,编码新型冠状病 毒SARS-CoV-2的S蛋白或其变体的mRNA序列,编码S蛋白中的RBD或其变体的mRNA序列,3’保守 序列元素和多聚腺苷酸尾构成;

G)由5’帽子结构,5’保守序列元素,RNA复制酶编码区,亚基因组启动子,编码S蛋白中的 RBD或其变体的mRNA序列,IRES,编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列,3’ 保守序列元素和多聚腺苷酸尾构成;或

H)由5’帽子结构,5’保守序列元素,RNA复制酶编码区,亚基因组启动子,编码新型冠状病 毒SARS-CoV-2的S蛋白或其变体的mRNA序列,IRES,编码S蛋白中的RBD或其变体的mRNA序列,3’ 保守序列元素和多聚腺苷酸尾构成。

在本发明的一个具体实施方式中,所述的mRNA或mRNA组合物包括两条mRNA序列的组合,其选 自下列任一组:

a)由5’帽子结构,5’非编码区,编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序 列,3’非编码区和多聚腺苷酸尾构成的mRNA,组合由5’帽子结构,5’非编码区,编码S蛋 白中的RBD或其变体的mRNA序列,3’非编码区和多聚腺苷酸尾构成的mRNA;

b)由5’帽子结构,5’保守序列元素,RNA复制酶编码区,亚基因组启动子,编码S蛋白 中的RBD或其变体的mRNA序列,3’保守序列元素和多聚腺苷酸尾构成的mRNA,组合由5’帽子 结构,5’保守序列元素,RNA复制酶编码区,亚基因组启动子,编码新型冠状病毒SARS-CoV-2 的S蛋白或其变体的mRNA序列,3’保守序列元素和多聚腺苷酸尾构成的mRNA;

c)由5’帽子结构,5’保守序列元素,亚基因组启动子,编码新型冠状病毒SARS-CoV-2 的S蛋白或其变体的mRNA序列,IRES,编码S蛋白中的RBD或其变体的mRNA序列,3’保守序 列元素和多聚腺苷酸尾构成的mRNA,组合由5’帽子结构,5’非编码区,RNA复制酶编码区,3’ 非编码区和多聚腺苷酸尾构成的mRNA;

d)由5’帽子结构,5’保守序列元素,亚基因组启动子,编码S蛋白中的RBD或其变体的 mRNA序列,IRES,编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列,3’保守序列 元素和多聚腺苷酸尾构成的mRNA,组合由5’帽子结构,5’非编码区,RNA复制酶编码区,3’ 非编码区和多聚腺苷酸尾构成的mRNA;

e)由5’帽子结构,5’保守序列元素,亚基因组启动子,编码新型冠状病毒SARS-CoV-2 的S蛋白或其变体的mRNA序列,编码S蛋白中的RBD或其变体的mRNA序列,3’保守序列元素 和多聚腺苷酸尾构成的mRNA,组合由5’帽子结构,5’非编码区,RNA复制酶编码区,3’非编 码区和多聚腺苷酸尾构成的mRNA;或

f)由5’帽子结构,5’保守序列元素,亚基因组启动子,编码S蛋白中的RBD或其变体的 mRNA序列,编码新型冠状病毒SARS-CoV-2的S蛋白或其变体的mRNA序列,3’保守序列元素和 多聚腺苷酸尾构成的mRNA,组合由5’帽子结构,5’非编码区,RNA复制酶编码区,3’非编码 区和多聚腺苷酸尾构成的mRNA。

在本发明的一个具体实施方式中,所述的mRNA或mRNA组合物中包含的mRNA序列包含 SEQ ID NO:16-19中的任一个或两个以上的组合。

优选的,所述的mRNA或mRNA组合物还包括阳离子或聚阳离子化合物。

优选的,所述的阳离子或聚阳离子化合物游离或者与mRNA结合。

在本发明的一个具体实施方式中,为了使得所述mRNA或mRNA组合物更稳定选择阳离子或聚 阳离子化合物与所述mRNA结合的形式。

优选的,所述的mRNA或mRNA组合物中还包含脂质。

进一步优选的,所述的脂质包括但不限于能够促进自组装形成病毒大小的颗粒(~100nm) 的脂质体、使得mRNA从内涵体中释放到胞内的脂质体、支撑磷脂双分子层结构的脂质体或用作 稳定剂的脂质体。

更优选的,为了增加LNP(脂质纳米颗粒)的半衰期,所述的脂质还可以包含PEG化脂质。

在本发明的一个具体实施方式中,所述的脂质包含阳离子脂质、PEG化脂质、胆固醇和/或 磷脂。

本发明所述的mRNA或mRNA组合物可以为脂质体、脂质复合物或脂质纳米粒子。所述的脂质体可 以为以下形式制备得到的脂质体:1,2-二油烯基氧基-N,N-二甲基氨基丙烷(DODMA)脂质体、1,2- 二亚油基氧基-3-二甲基氨基丙烷(DLin-DMA)、2,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧杂 环戊烷(DLin-KC2-DMA)脂质体。所述脂质复合物或脂质纳米粒子可以由选自以下的脂质形成:DLin-DMA、 DLin-K-DMA、98N12-5、C12-200、DLin-MC3-DMA、DLin-KC2-DMA、DODMA、PLGA、PEG、PEG-DMG、聚乙 二醇化脂质和氨基醇脂质。

本发明所述的mRNA或mRNA组合物还可以包含药学上可接受的赋形剂。所述药学上可接受的赋形 剂可以是载体、稀释剂、佐剂或编码佐剂核苷酸序列、增溶剂、粘合剂、润滑剂、助悬剂、转染促进 剂等。所述转染促进剂包括但不限于表面活性剂如免疫刺激复合物、费氏(Freunds)不完全佐剂、LPS 类似物(例如单磷酰酯A)、胞壁肽、苯醌类似物、角鲨烯、透明质酸、脂质、脂质体、钙离子、病毒 蛋白质、阳离子、聚阳离子(例如聚-L-谷氨酸(LGS))或纳米粒子或其他已知的转染促进剂。所述的编 码佐剂的核苷酸序列为编码如下至少一种佐剂的核苷酸序列:GM-CSF、IL-17、IFNg、IL-15、IL-21、 抗PD1/2、乳铁蛋白、鱼精蛋白、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、 IL-12、INF-α、INF-γ、Lymphotoxin-α、hGH、MCP-1、MIP-1a、MIP-1p、IL-8、RANTES、L-选择蛋 白、P-选择蛋白、E-选择蛋白、CD34、GlyCAM-1、MadCAM-1、LFA-1、VLA-1、Mac-1、pl50.95、PECAM、 ICAM-1、ICAM-2、ICAM-3、CD2、LFA-3、M-CSF、CD40、CD40L、血管生长因子、成纤维细胞生长因子、 神经生长因子、血管内皮生长因子、Apo-1、p55、WSL-1、DR3、TRAMP、Apo-3、AIR、LARD、NGRF、DR4、 DR5、KILLER、TRAIL-R2、TRICK2、DR6、半胱天冬酶ICE、Fos、c-jun、Sp-1、Ap-1、Ap-2、p38、p65Rel、MyD88、IRAK、TRAF6、IkB、无活性的NIK、SAP K、SAP-1、JNK、NFkB、Bax、TRAIL、TRAILrec、TRAILrecDRC5、 TRAIL-R3、TRAIL-R4、RANK、RANK LIGAND、Ox40、Ox40LIGAND、NKG2D、MICA、MICB、NKG2A、NKG2B、 NKG2C、NKG2E、NKG2F、TAP1、TAP2以及其功能性片段。

本发明的第二方面,提供了一种mRNA疫苗,所述的mRNA疫苗包括本发明任一所述的mRNA 或mRNA组合物。

优选的,所述的mRNA疫苗中编码的新型冠状病毒SARS-CoV-2的S蛋白或其变体与编码S蛋 白中的RBD或其变体的序列分别来自于不同SARS-CoV-2突变株,从而免疫产生对不同SARS-CoV-2 突变株的交叉保护。在本发明的一个具体实施方式中,所述的mRNA疫苗中编码含IgE信号肽的 野生型SARS-CoV-2的RBD中含有501Y.V2谱系的K417N、E484K和N501Y突变,优选其氨基酸序 列如SEQ ID NO:13所示;编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前 构象的全长S蛋白的序列来自Wuhan-Hu-1isolate,其中含有501Y.V2谱系的L18F、D80A、D215G、 L242-L244删除突变(L242-244del)、R246I、K417N、E484K、N501Y和A701V,优选其氨基酸 序列为SEQ ID NO:15所示。

在本发明的一个具体实施方式中,所述的mRNA疫苗包含编码新型冠状病毒SARS-CoV-2的S 蛋白或其变体的mRNA序列以及编码S蛋白中的RBD或其变体的mRNA序列,其中,新型冠状病毒 SARS-CoV-2的S蛋白或其变体的氨基酸序列如SEQ ID NO:15所示,S蛋白中的RBD或其变体如 SEQ ID NO:13所示。

在本发明的另一个具体实施方式中,所述的mRNA疫苗包含编码新型冠状病毒SARS-CoV-2的 S蛋白或其变体的mRNA序列以及编码S蛋白中的RBD或其变体的mRNA序列,其中,新型冠状病 毒SARS-CoV-2的S蛋白或其变体的氨基酸序列如SEQ ID NO:2所示,S蛋白中的RBD或其变体 如SEQ ID NO:13所示。

在本发明的另一个具体实施方式中,所述的mRNA疫苗包含编码新型冠状病毒SARS-CoV-2的 S蛋白或其变体的mRNA序列以及编码S蛋白中的RBD或其变体的mRNA序列,其中,新型冠状病 毒SARS-CoV-2的S蛋白或其变体的氨基酸序列如SEQ ID NO:2所示,S蛋白中的RBD或其变体 如SEQ ID NO:3所示。优选的,所述的mRNA疫苗中编码新型冠状病毒SARS-CoV-2的S蛋白或 其变体的mRNA与编码S蛋白中的RBD或其变体的mRNA的质量比为(1-5):(1-5)。

在本发明的一个具体实施方式中,所述的mRNA疫苗中编码含IgE信号肽的野生型SARS-CoV-2 的RBD的mRNA和编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的全 长S蛋白的mRNA的质量比为(1-2):(1-2)。

优选的,所述的mRNA疫苗还包括阳离子或聚阳离子化合物。

优选的,所述的阳离子或聚阳离子化合物游离或者与mRNA结合。

在本发明的一个具体实施方式中,为了使得所述mRNA疫苗更稳定选择阳离子或聚阳离子化 合物与所述mRNA结合的形式。

优选的,所述的mRNA疫苗中还包含脂质。

进一步优选的,所述的脂质包括但不限于能够促进自组装形成病毒大小的颗粒(~100nm) 的脂质体、使得mRNA从内涵体中释放到胞内的脂质体、支撑磷脂双分子层结构的脂质体或用作 稳定剂的脂质体。

更优选的,为了增加LNP的半衰期,所述的脂质还可以包含PEG化脂质。

在本发明的一个具体实施方式中,所述的脂质包含阳离子脂质、PEG化脂质、胆固醇和/或 磷脂。

本发明所述的mRNA疫苗可以为脂质体、脂质复合物或脂质纳米粒子。所述的脂质体可以为以下 形式制备得到的脂质体:1,2-二油烯基氧基-N,N-二甲基氨基丙烷(DODMA)脂质体、1,2-二亚油基氧 基-3-二甲基氨基丙烷(DLin-DMA)、2,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧杂环戊烷 (DLin-KC2-DMA)脂质体。所述脂质复合物或脂质纳米粒子可以由选自以下的脂质形成:DLin-DMA、 DLin-K-DMA、98N12-5、C12-200、DLin-MC3-DMA、DLin-KC2-DMA、DODMA、PLGA、PEG、PEG-DMG、聚乙 二醇化脂质和氨基醇脂质。

本发明所述的mRNA疫苗还可以包含药学上可接受的赋形剂。所述药学上可接受的赋形剂可 以是载体、稀释剂、佐剂或编码佐剂核苷酸序列、增溶剂、粘合剂、润滑剂、助悬剂、转染促进 剂等。所述转染促进剂包括但不限于表面活性剂如免疫刺激复合物、费氏(Freunds)不完全佐剂、 LPS类似物(例如单磷酰酯A)、胞壁肽、苯醌类似物、角鲨烯、透明质酸、脂质、脂质体、钙离 子、病毒蛋白质、阳离子、聚阳离子(例如聚-L-谷氨酸(LGS))或纳米粒子或其他已知的转染促进 剂。所述的编码佐剂的核苷酸序列为编码如下至少一种佐剂的核苷酸序列:GM-CSF、IL-17、IFNg、 IL-15、IL-21、抗PD1/2、乳铁蛋白、鱼精蛋白、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、 IL-8、IL-9、IL-10、IL-12、INF-α、INF-γ、Lymphotoxin-α、hGH、MCP-1、MIP-1a、MIP-1p、 IL-8、RANTES、L-选择蛋白、P-选择蛋白、E-选择蛋白、CD34、GlyCAM-1、MadCAM-1、LFA-1、 VLA-1、Mac-1、pl50.95、PECAM、ICAM-1、ICAM-2、ICAM-3、CD2、LFA-3、M-CSF、、CD40、CD40L、 血管生长因子、成纤维细胞生长因子、神经生长因子、血管内皮生长因子、Apo-1、p55、WSL-1、 DR3、TRAMP、Apo-3、AIR、LARD、NGRF、DR4、DR5、KILLER、TRAIL-R2、TRICK2、DR6、半胱天 冬酶ICE、Fos、c-jun、Sp-1、Ap-1、Ap-2、p38、p65Rel、MyD88、IRAK、TRAF6、IkB、无活性 的NIK、SAP K、SAP-1、JNK、NFkB、Bax、TRAIL、TRAILrec、TRAILrecDRC5、TRAIL-R3、TRAIL-R4、 RANK、RANK LIGAND、Ox40、Ox40LIGAND、NKG2D、MICA、MICB、NKG2A、NKG2B、NKG2C、NKG2E、 NKG2F、TAP1、TAP2以及其功能性片段。

本发明的第三方面,提供了一种mRNA或mRNA组合物的制备方法,包括将mRNA与阳离子或聚阳 离子化合物混合后用脂质包装。

优选的,所述的脂质包括但不限于能够促进自组装形成病毒大小的颗粒(~100nm)的脂质体、 使得mRNA从内涵体中释放到胞内的脂质体、支撑磷脂双分子层结构的脂质体或用作稳定剂的脂质体。 更优选的,为了增加LNP的半衰期,所述的脂质还可以包含PEG化脂质。

在本发明的一个具体实施方式中,所述的脂质包含阳离子脂质、PEG化脂质、胆固醇和/或磷脂。

本发明的第四方面,提供了一种mRNA疫苗的制备方法,所述的制备方法包括将本发明任一 所述的mRNA或mRNA组合物与阳离子或聚阳离子化合物混合后用脂质包装。优选的,包装成脂质 纳米颗粒。

优选的,所述的脂质包括但不限于能够促进自组装形成病毒大小的颗粒(~100nm)的脂质体、 使得mRNA从内涵体中释放到胞内的脂质体、支撑磷脂双分子层结构的脂质体或用作稳定剂的脂质体。 更优选的,为了增加LNP的半衰期,所述的脂质还可以包含PEG化脂质。

在本发明的一个具体实施方式中,所述的脂质包含阳离子脂质、PEG化脂质、胆固醇和/或磷脂。

本发明的第五方面,提供了一种本发明任一所述的mRNA或mRNA组合物或mRNA疫苗在预防 和/或治疗新型冠状病毒SARS-CoV-2感染导致的疾病的应用。

优选的,所述的新型冠状病毒SARS-CoV-2感染导致的疾病包括但不限于COVID-19。

本发明的第六方面,提供了一种本发明任一所述的mRNA或mRNA组合物或mRNA疫苗在抗新 型冠状病毒SARS-CoV-2感染中的应用。

本发明的第七方面,提供了一种本发明任一所述的mRNA或mRNA组合物或mRNA疫苗在制备 预防和/或治疗新型冠状病毒SARS-CoV-2感染导致的疾病的药物中的应用。

优选的,所述的新型冠状病毒SARS-CoV-2感染导致的疾病包括但不限于COVID-19。

本发明的第八方面,提供了一种本发明任一所述的mRNA或mRNA组合物或mRNA疫苗在制备 抗新型冠状病毒SARS-CoV-2感染的药物中的应用。

本发明的第九方面,提供了一种治疗和/或预防新型冠状病毒SARS-CoV-2感染导致的疾病的 方法,包括向个体施加有效量的本发明任一所述的mRNA或mRNA组合物,或者mRNA疫苗。

本发明的第十方面,提供了一种预防新型冠状病毒SARS-CoV-2感染的方法,包括向未感染 新型冠状病毒SARS-CoV-2的个体施加有效量的本发明所述的mRNA疫苗。

本发明的第十一方面,提供了一种治疗新型冠状病毒SARS-CoV-2感染的方法,包括向感染新型 冠状病毒SARS-CoV-2的个体施加有效量的本发明所述的mRNA或包含mRNA的组合物或mRNA疫苗,以 使得个体体内产生中和抗体抵制新型冠状病毒SARS-CoV-2。

本发明的第十二方面,提供了一种抗体筛选的方法,所述的方法包括向个体施加有效量的本 发明任一所述的mRNA或mRNA组合物,或者mRNA疫苗的步骤。

其中,所述的抗体筛选的方法不是治疗方法。该方法用来筛选中和抗体,对抗体的药效进行检测 和比较,以确定哪些抗体可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度, 即治疗效果不是必然的,只是一种可能性。

本发明的第十三方面,提供了一种诱导个体中和抗原特异性免疫应答的方法,所述的方法包括向 个体施加本发明任一所述的mRNA或mRNA组合物,或者mRNA疫苗。

优选的,所述的抗原特异性免疫应答包括T细胞应答和/或B细胞应答。

本发明的第十四方面,提供了本发明所述的mRNA或mRNA组合物编码的蛋白。

优选的,所述的蛋白为固定在融合前构象的全长S蛋白。进一步优选的,所述的固定在融合前构 象的全长S蛋白包含682RRAR685位突变和/或将986KV987位突变,以使S蛋白固定到融合前构象。最 为优选的,所述的固定在融合前构象的全长S蛋白为将野生型全长S蛋白的682RRAR685突变为GSAG 和/或将986KV987突变为PP。

本发明的第十五方面,提供了一种编码本发明所述蛋白的核苷酸序列。

本发明的第十六方面,提供了一种包含本发明所述核苷酸序列的载体。

本发明的第十七方面,提供了一种包含本发明所述的蛋白、所述的核苷酸序列和/或所述的载体 的细胞。

本发明所述的mRNA或mRNA组合物以及包含mRNA或mRNA组合物的mRNA疫苗具备的优势在于:1、 体外合成,无需细胞培养,无动物源污染的风险;2、研发、生产较快,标准化生产,易于量产和质量 控制,同一生产流程适用于多个不同产品;3、可以在一段时间内持续表达,延长抗原暴露时间从而提 高免疫反应的强度和质量;4、模拟天然感染的过程,在人体细胞内被翻译、修饰,可以被MHC I类分 子呈递,诱发更强的细胞免疫;5、支持多种蛋白形式,包括胞内蛋白、跨膜蛋白、VLP等,且可避开 VLP产量低而造成的纯化问题;6、具有自佐剂效应,无需进行佐剂筛选;7、无感染、基因组整合风 险;8、无预存免疫,可多次免疫。

本发明所述的mRNA或mRNA组合物的表达产物包含RBD或其变体以及S蛋白或其变体,其中,RBD 中包含了主要的中和表位,可以诱发高水平的中和抗体滴度;而且,非中和表位相对较少,安全性高。 全长S蛋白可诱导出高水平的特异性细胞免疫,配合针对性诱导中和抗体的RBD,可以产生极为优异 的免疫效果。进一步的,实施例也证实了本发明所述的mRNA或mRNA组合物的表达产物能够在人体中 诱发高水平中和抗体和细胞因子的产生。

同时,现有技术中公开的部分内容也支持了本发明的技术方案,例如通过对SARS-CoV-2的RBD 的序列分析,以及对其结构的模拟预测,认为SARS-CoV-2的S蛋白维持了SARS-CoV的S蛋白和ACE2 相互作用的结构构象。通过比对MERS-CoV的RBD的不同片段,确定蛋白片段377-588为关键中和域, 即可以在小鼠和兔子模型中引起最高的中和抗体滴度;而且此关键中和域仍可以和受体hDPP4结合, 证明其保持了结构构象,不止可以提供线性表位,也可以提供结构表位(见Cuiqing,M等(2014), Searching for an ideal vaccinecandidate among different MERS coronavirus receptor-binding fragments--theimportance of immunofocusing in subunit vaccine design,Vaccine. 32(46):6170-6176.)。

本发明所述的“个体”包括哺乳动物和人。所述的哺乳动物包括但不限于啮齿类动物(例如小鼠、 大鼠)、猴子、斑马鱼、猪、鸡、兔子等等。

本发明所述的“预防”指在疾病开始发展之前或之后通过施用本发明所述的产品来避免症状或者 延缓特定症状紧张的所有行为;优选的,所述的预防包括将本发明所述的mRNA或包含mRNA的组合物 用作疫苗。

本发明所述的“治疗”指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预; 优选的,所述的治疗包括筛选与本发明所述的mRNA或包含mRNA的组合物结合的抗体,并将其用于治 疗。

本发明所述的“有效量”是指在以单个或多个剂量给予至患者或器官之后提供所希望的治疗或预 防的本发明所述产品的量或剂量。

本发明所述的“S蛋白”为组成新型冠状病毒SARS-CoV-2的结构蛋白,名称为刺突蛋白。

本发明所述的“RBD”为组成新型冠状病毒SARS-CoV-2的结构蛋白,名称为刺突蛋白受体结合域。

本发明所述的“同一性”是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员可以根据 实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%, 2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%, 22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%, 58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9% 的相似度,且依然具有与原氨基酸序列或核苷酸序列相同或类似的功能,例如与原序列具有同一性的 氨基酸序列依然具有在体内诱发中和抗体和产生细胞因子的功能,与原序列具有同一性的mRNA序列表 达产物依然具有在体内诱发中和抗体和产生细胞因子的功能。

附图说明

以下,结合附图来详细说明本发明的实施例,其中:

图1:编码含tPA信号肽的野生型SARS-CoV-2的RBD的序列测序结果。

图2:图2A和图2B的拼接为编码野生型SARS-CoV-2的S蛋白的序列测序结果。

图3:含有T7启动子,5’UTR,3’UTR,和polyA尾的基础质粒模板序列图。

图4:用甲醛变性胶检测加帽纯化后的mRNA,其中,M为Marker,1为编码含tPA信号肽的野生 型SARS-CoV-2的RBD的mRNA,2为编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合 前构象的全长S蛋白的mRNA。

图5:WB(Western Blot,蛋白质印迹法)检测结果,其中1为编码含tPA信号肽的野生型SARS-CoV-2 的RBD的mRNA的表达上清,2为阴性对照。

图6:免疫荧光结果。

图7:DLS(Dynamic Light Scattering,动态光散射)检测mRNA-LNP的粒径和粒径分布结果, 其中,A代表RBD+S-1-LNP,B代表RBD+S-2-LNP,C代表RBD+S-3-LNP,D代表RBD-LNP,E代表S-LNP。

图8:甲醛变性胶检测包装后样品的mRNA完整性结果,其中1为编码含tPA信号肽的野生型 SARS-CoV-2的RBD的mRNA,2为RBD+S-1,3为RBD+S-2,4为RBD+S-3,5为编码682RRAR685突变为 GSAG和986KV987突变为PP的固定在融合前构象的全长S蛋白的mRNA。

图9:一免、二免后的S蛋白特异性抗体滴度,其中,Negative为阴性对照。

图10:用ELISpot(酶联免疫斑点法)检测干扰素γ(IFN-γ)的结果,其中,纵坐标为每百万 脾细胞的点形成单位(spot forming unit,SFU),Negative为阴性对照。

图11:CD4 CK胞内染色法(ICS)检测IFN-γ、白细胞介素-2(IL-2)和肿瘤坏死因子-α(TNF- α)的结果。

图12:CD8 CK胞内染色法(ICS)检测IFN-γ、白细胞介素-2(IL-2)和肿瘤坏死因子-α(TNF- α)的结果。

图13:用甲醛变性胶检测加帽纯化后的mRNA,其中,M为Marker,1为实施例1制备的编码 682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的全长S蛋白的mRNA,2为编码 682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的501Y.V2谱系的全长S蛋白的 mRNA,3为编码含IgE信号肽的501Y.V2谱系的野生型SARS-CoV-2的RBD序列的mRNA。结果显示,mRNA 的大小正确且基本无降解。

图14:WB检测结果,其中1为编码含IgE信号肽的501Y.V2谱系的野生型SARS-CoV-2的RBD序 列的mRNA的表达上清,2为编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象 的501Y.V2谱系的全长S蛋白的mRNA的表达上清,3为阴性对照的细胞上清,4为编码含IgE信号肽 的501Y.V2谱系的野生型SARS-CoV-2的RBD序列的mRNA的表达细胞沉淀,5为编码682RRAR685突变 为GSAG和986KV987突变为PP的固定在融合前构象的501Y.V2谱系的全长S蛋白的mRNA的表达细胞 沉淀,6为阴性对照的细胞沉淀。

图15:DLS(Dynamic Light Scattering,动态光散射)检测mRNA-LNP的粒径和粒径分布结果。

图16:一免、二免后针对501Y.V2谱系的S蛋白特异性抗体滴度。

图17:一免、二免后针对Wuhan-Hu-1isolate的S蛋白特异性抗体滴度。

图18:替代性中和抗体滴度结果,左边4组为针对Wuhan-Hu-1isolate的替代性中和抗体滴度, 右边4组为针对501Y.V2谱系的替代性中和抗体滴度。

图19:CD4+T细胞Th1类细胞免疫反应检测结果。

图20:CD8+T细胞Th1类细胞免疫反应检测结果。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然, 所描述的实施例仅是本发明的部分实施例,而不是全部。基于本发明中的实施例,本领域普通技术人 员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例中使用的试剂来源:

替代性中和抗体检测是检测的疫苗免疫小鼠血清中的中和抗体,利用的是ACE2蛋白和RBD蛋白的 竞争结合。

特异性抗体体检测是检测的疫苗免疫小鼠血清中的特异性抗体,利用的是RBD蛋白。

检测针对Wuhan-Hu-1isolate用到的RBD蛋白为野生型RBD蛋白(厂家:金斯瑞,货号:Z03483-1)。

检测针对501Y.V2谱系用到的RBD蛋白为含501Y.V2谱系突变的RBD蛋白(厂家:近岸,货号: DRA125)。

实施例1:mRNA的制备与检测

1、分别人工合成抗原设计的基因序列。

2、通过固相亚磷酰胺三酯法合成短核苷酸链(引物)。

3、引物互为模板进行PCR扩增。

4、将步骤3扩增的产物连接到pUC57载体上,转化测序。

5、经测序验证,序列与预期一致,结果见图1-2所示。具体的,图1显示了编码含tPA信号肽的 野生型SARS-CoV-2的RBD的序列测序结果,其核苷酸序列如SEQ ID NO:4所示,氨基酸序列如SEQ ID NO:3所示。图2显示编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的全 长S蛋白的序列测序结果,其核苷酸序列如SEQ ID NO:5所示,氨基酸序列如SEQ ID NO:2所示。

6、准备含有T7启动子,5’UTR,3’UTR,和polyA尾的基础质粒模板,序列如图3(SEQID NO: 8)所示。

7、用含有与基础质粒模板同源的引物进行PCR,结果显示正确。

基础质粒模板用限制性核酸内切酶BsmBI线性化。将PCR产物分别通过同源重组的方式分别连到 基础质粒模板上,分别转化到Xl1-Blue菌株中,并进行测序确认序列正确,转录模板构建成功。用摇 瓶发酵菌株,用无内毒素质粒大提试剂盒纯化获得转录模板。

将转录模板用限制性核酸内切酶BbsI线性化。用T7体外转录试剂盒进行转录,分别获得SEQ ID NO:4-5的未加帽的mRNA(mRNA具体序列分别为SEQ ID NO:16-17)。分别用DNaseI消化转录模板, 并用沉淀法纯化mRNA。用Cap1加帽试剂盒给mRNA加帽,并分别用mRNA纯化试剂盒对加帽后的mRNA 进行纯化。将纯化后的mRNA溶解于酸性柠檬酸钠缓冲液中,待用。

用甲醛变性胶检测加帽纯化后的mRNA,如图4所示,其中1为编码含tPA信号肽的野生型 SARS-CoV-2的RBD的mRNA,2为编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前 构象的全长S蛋白的mRNA。结果显示,mRNA的大小正确且基本无降解。

用24孔板铺3个孔的HEK293细胞,其中1、2号孔分别用lipofectamine 2000转染0.5μg加帽 纯化后的编码含tPA信号肽的野生型SARS-CoV-2的RBD的mRNA,和编码682RRAR685突变为GSAG和 986KV987突变为PP的固定在融合前构象的全长S蛋白的mRNA,3号孔作为阴性对照加入lipofectamine 2000转染试剂。转染24h后,取1、3号孔的细胞上清进行WB检测,2、3号孔的细胞固定后用抗S 蛋白多抗进行免疫荧光检测。WB检测结果如图5所示,其中1为编码含tPA信号肽的野生型SARS-CoV-2 的RBD的mRNA的表达上清,2为阴性对照。结果显示表达出来的蛋白大小正确。免疫荧光结果如图6 所示,证明编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的全长S蛋白的mRNA可以正常表达。

实施例2:mRNA疫苗的制备与免疫

1、原料准备

1)将阳离子脂质D-Lin-MC3-DMA、二硬脂酰基磷脂酰胆碱DSPC、胆固醇、PEG化脂质PEG-DMG四 个组分按摩尔比50:10:38.5:1.5在乙醇中溶解、混合。

2)实施例1制备的编码含tPA信号肽的野生型SARS-CoV-2的RBD的mRNA和编码682RRAR685突 变为GSAG和986KV987突变为PP的固定在融合前构象的全长S蛋白的mRNA,将这两种mRNA分别按质 量比1:1、2:1、1:2进行混合,得到混合后的mRNA,简写为RBD+S-1、RBD+S-2和RBD+S-3。

2、试验步骤

以脂质混合物:mRNA流速比1:3,在Precision Nanosystems的纳米颗粒制备仪器Ignite中分别 混合包装RBD+S-1、RBD+S-2、RBD+S-3、编码含tPA信号肽的野生型SARS-CoV-2的RBD的mRNA和编 码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的全长S蛋白的mRNA。将包装 好的mRNA-LNP(LNP为脂质纳米颗粒)透析并超滤浓缩到DPBS中,无菌过滤后获得用于后续动物实验 的样品。用DLS检测mRNA-LNP的粒径和粒径分布,检测结果如图7所示,包装后样品的粒径大小均在 70nm-100nm,PDI均小于0.2。其中,RBD+S-1-LNP:粒径平均值77.15nm,PDI值0.038,截距(intercept) 0.958,具体见表1;RBD+S-2-LNP:粒径平均值77.04nm,PDI值0.055,截距(intercept)0.959, 具体见表2;RBD+S-3-LNP:粒径平均值91.43nm,PDI值0.049,截距(intercept)0.974,具体见表 3;RBD-LNP:粒径平均值77.92nm,PDI值0.036,截距(intercept)0.954,具体见表4;S-LNP:粒 径平均值76.89nm,PDI值0.031,截距(intercept)0.977,具体见表5。

表1:RBD+S-1-LNP

粒径(nm) 强度(%) 标准差
峰1 81.06 100 18.64
峰2 0 0 0
峰3 0 0 0

表2:RBD+S-2-LNP

表3:RBD+S-3-LNP

粒径(nm) 强度(%) 标准差
峰1 97 100 24.54
峰2 0 0 0
峰3 0 0 0

表4:RBD-LNP

粒径(nm) 强度(%) 标准差
峰1 82.01 100 19.41
峰2 0 0 0
峰3 0 0 0

表5:S-LNP

粒径(nm) 强度(%) 标准差
峰1 80.72 100 18.76
峰2 0 0 0
峰3 0 0 0

用甲醛变性胶检测包装后样品的mRNA完整性,结果如图8所示,其中1为编码含tPA信号肽的野 生型SARS-CoV-2的RBD的mRNA,2为RBD+S-1,3为RBD+S-2,4为RBD+S-3,5为编码682RRAR685 突变为GSAG和986KV987突变为PP的固定在融合前构象的全长S蛋白的mRNA。可见mRNA基本无降解。

6周龄左右的BALB/c雌性小鼠随机6只一组,分为6组。分别在第0天和第28天免疫后腿肌肉 接种10ug,在第28天和第42天检测S蛋白特异性抗体滴度,在第42天杀鼠检测细胞因子。

3、实验结果

一免、二免后的S蛋白特异性抗体滴度如图9所示,可以看到单S全长免疫二免后的特异性抗体 滴度显著低于单RBD免疫,而三组S与RBD的组合免疫,其中两组与单RBD免疫的特异性抗体滴度无 显著性差异,RBD+S-1出现了协同增益的效果,特异性抗体滴度显著高于单RBD免疫。用ELISpot检 测干扰素γ(IFN-γ)的结果如图10所示,可以看到单S全长免疫引起的IFN-γ分泌水平显著高于 单RBD免疫,而三组S与RBD的组合免疫,其中两组与单S全长免疫的IFN-γ分泌水平无显著性差异, RBD+S-3出现了协同增益的效果,IFN-γ分泌水平显著高于单S全长免疫。用CK胞内染色法(ICS) 检测IFN-γ、白细胞介素-2(IL-2)和肿瘤坏死因子-α(TNF-α)的结果如图11和图12所示。CD4+T 细胞的反应较低,个体差异较大,指导意义较小;而CD8+T细胞的检测结果与ELISpot的检测结果基 本一致,三组S与RBD的组合免疫,其中两组与单S全长免疫在IFN-γ、IL-2和TNF-α的分泌水平 上无显著性差异,而RBD+S-3出现了显著性的协同增益的效果。证明S全长和RBD的组合不仅可以结 合S全长的细胞免疫优势和RBD的体液免疫优势,而且可以达到协同增益的效果,可在2019-nCoV型 冠状病毒感染的预防上取得更为优异的效果。

实施例3:序列来源于不同SARS-CoV-2突变株的mRNA的制备与检测

1、通过引物互为模板扩增合成编码含IgE信号肽的的野生型SARS-CoV-2的RBD序列,其中含有 501Y.V2谱系的K417N、E484K和N501Y突变,其核苷酸序列如SEQ ID NO:12所示,氨基酸序列如SEQ ID NO:13所示。

2、通过引物互为模板扩增合成编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合 前构象的501Y.V2谱系的全长S蛋白的序列,其中含有501Y.V2谱系的L18F、D80A、D215G、L242-L244 删除突变(L242-244del)、R246I、K417N、E484K、N501Y和A701V,其核苷酸序列如SEQ ID NO:14 所示,氨基酸序列如SEQ ID NO:15所示。

3、准备含有T7启动子,5’UTR,3’UTR,和polyA尾的基础质粒模板,序列如图3(SEQID NO: 8)所示。

4、用含有与基础质粒模板同源的引物进行PCR,结果显示正确。

基础质粒模板用限制性核酸内切酶BsmBI线性化。将PCR产物分别通过同源重组的方式分别连到 基础质粒模板上,分别转化到Xl1-Blue菌株中,并进行测序确认序列正确,转录模板构建成功。用摇 瓶发酵菌株,用无内毒素质粒大提试剂盒纯化获得转录模板。

将转录模板用限制性核酸内切酶BbsI线性化。用T7体外转录试剂盒进行转录,分别获得SEQ ID NO:12、14的未加帽的mRNA(mRNA具体序列分别为SEQ ID NO:18、19)。分别用DNaseI消化转录模 板,并用沉淀法纯化mRNA。用Cap1加帽试剂盒给mRNA加帽,并分别用mRNA纯化试剂盒对加帽后的 mRNA进行纯化。将纯化后的mRNA溶解于酸性柠檬酸钠缓冲液中,待用。

用甲醛变性胶检测加帽纯化后的mRNA,如图13所示,其中1为实施例1制备的编码682RRAR685 突变为GSAG和986KV987突变为PP的固定在融合前构象的全长S蛋白的mRNA,2为编码682RRAR685 突变为GSAG和986KV987突变为PP的固定在融合前构象的501Y.V2谱系的全长S蛋白的mRNA,3为编 码含IgE信号肽的501Y.V2谱系的野生型SARS-CoV-2的RBD序列的mRNA。结果显示,mRNA的大小正 确且基本无降解。

用24孔板铺3个孔的HEK293细胞,其中1、2号孔分别用lipofectamine 2000转染0.5μg加帽 纯化后的编码含IgE信号肽的501Y.V2谱系的野生型SARS-CoV-2的RBD序列的mRNA,和编码 682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的501Y.V2谱系的全长S蛋白的 mRNA,3号孔作为阴性对照。转染24h后,离心获得细胞上清和细胞沉淀分别进行WB检测。WB检测结 果如图14所示,其中1为编码含IgE信号肽的501Y.V2谱系的野生型SARS-CoV-2的RBD序列的mRNA 的表达上清,2为编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的501Y.V2 谱系的全长S蛋白的mRNA的表达上清,3为阴性对照的细胞上清,4为编码含IgE信号肽的501Y.V2 谱系的野生型SARS-CoV-2的RBD序列的mRNA的表达细胞沉淀,5为编码682RRAR685突变为GSAG和 986KV987突变为PP的固定在融合前构象的501Y.V2谱系的全长S蛋白的mRNA的表达细胞沉淀,6为 阴性对照的细胞沉淀。结果显示表达出来的蛋白大小正确。

实施例4:序列来源于不同SARS-CoV-2突变株的mRNA组合疫苗的制备与免疫

1、原料准备

1)将阳离子脂质D-Lin-MC3-DMA、二硬脂酰基磷脂酰胆碱DSPC、胆固醇、PEG化脂质PEG-DMG四 个组分按摩尔比50:10:38.5:1.5在乙醇中溶解、混合。

2)准备实施例1制备的编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象 的全长S蛋白的mRNA,实施例3制备的编码682RRAR685突变为GSAG和986KV987突变为PP的固定在 融合前构象的501Y.V2谱系的全长S蛋白的mRNA,和实施例3制备的编码含IgE信号肽的501Y.V2谱 系的野生型SARS-CoV-2的RBD序列的mRNA。

3)将实施例3制备的编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的 501Y.V2谱系的全长S蛋白的mRNA和实施例3制备的编码含IgE信号肽的501Y.V2谱系的野生型 SARS-CoV-2的RBD序列的mRNA按质量比1:2进行混合,得到混合后的mRNA,简写为combo A。

4)将实施例1制备的编码682RRAR685突变为GSAG和986KV987突变为PP的固定在融合前构象的 全长S蛋白的mRNA和实施例3制备的编码含IgE信号肽的501Y.V2谱系的野生型SARS-CoV-2的RBD 序列的mRNA按质量比1:2进行混合,得到混合后的mRNA,简写为combo B。

2、试验步骤

以脂质混合物:mRNA流速比1:3,在Precision Nanosystems的纳米颗粒制备仪器Ignite中分别 混合包装combo A、combo B、实施例3制备的编码682RRAR685突变为GSAG和986KV987突变为PP的 固定在融合前构象的501Y.V2谱系的全长S蛋白的mRNA,和实施例3制备的编码含IgE信号肽的 501Y.V2谱系的野生型SARS-CoV-2的RBD序列的mRNA,得到包装好的mRNA-LNP,分别简写为combo A-LNP,combo B-LNP,S-SA-LNP和RBD-SA-LNP。将包装好的mRNA-LNP透析并超滤浓缩到DPBS中,无 菌过滤后获得用于后续动物实验的样品。用DLS检测mRNA-LNP的粒径和粒径分布,检测结果如图15 所示,包装后样品的粒径大小均在70nm-100nm,PDI均小于0.2。其中,combo A-LNP:粒径平均值79.87nm, PDI值0.132,截距(intercept)0.962,具体见表6;combo B-LNP:粒径平均值80.61nm,PDI值0.123, 截距(intercept)0.958,具体见表7;S-SA-LNP:粒径平均值81.13nm,PDI值0.159,截距(intercept) 0.939,具体见表8;RBD-SA-LNP:粒径平均值82.74nm,PDI值0.112,截距(intercept)0.960,具 体见表9。

表6:combo A-LNP

粒径(nm) 强度(%) 标准差
峰1 91.43 100 32.02
峰2 0 0 0
峰3 0 0 0

表7:comboB-LNP

粒径(nm) 强度(%) 标准差
峰1 91.05 100 30.06
峰2 0 0 0
峰3 0 0 0

表8:S-SA-LNP

粒径(nm) 强度(%) 标准差
峰1 93.36 100 33.28
峰2 0 0 0
峰3 0 0 0

表9:RBD-SA-LNP

粒径(nm) 强度(%) 标准差
峰1 92.91 100 30.56
峰2 0 0 0
峰3 0 0 0

6周龄左右的BALB/c雌性小鼠随机6只一组,分为5组。分别在第0天和第14天免疫后腿肌肉 接种5ug,在第14天和第28天检测S蛋白特异性抗体滴度,在第28天杀鼠检测细胞因子。

3、实验结果

一免、二免后针对501Y.V2谱系的S蛋白特异性抗体滴度如图16所示,各组之间没有显著性差异。 一免、二免后针对Wuhan-Hu-1isolate的S蛋白特异性抗体滴度如图17所示,结果显示,两组S与 RBD组合免疫引起的特异性抗体滴度无显著性差异,但单S全长和单RBD二免后的特异性抗体滴度均 显著低于来源于不同SARS-CoV-2突变株的mRNA组合(combo B)。而替代性中和抗体滴度结果也显示 (如图18,左边4组为针对Wuhan-Hu-1isolate的替代性中和抗体滴度,右边4组为针对501Y.V2 谱系的替代性中和抗体滴度),combo B针对Wuhan-Hu-1isolate的替代性中和抗体滴度显著高于来 源于相同SARS-CoV-2突变株(501Y.V2谱系)的mRNA组合(combo A)、单S全长和单RBD;combo B 针对501Y.V2谱系的替代性中和抗体滴度则和combo A及单RBD无显著性差异,显著高于单S全长。 说明S全长和RBD的组合相对于单S全长有体液免疫优势,且来源于不同SARS-CoV-2突变株的mRNA 组合在体液免疫方面相比于来源于相同SARS-CoV-2突变株的mRNA组合可以提供更好地交叉保护效果。

CD4+T细胞Th1类细胞免疫反应检测结果如图19所示,CD8+T细胞Th1类细胞免疫反应检测结果 如图20所示,结果显示,S全长和RBD的组合相对于单RBD有细胞免疫优势。再次验证了S全长和RBD 的组合设计在疫苗应用方面的优越性。

以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在 本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明 的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可 以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说 明。

序列表

<110> 康希诺生物股份公司

<120> mRNA或mRNA组合物及其制备方法和应用

<130> 1

<150> 2020104199842

<151> 2020-05-18

<160> 19

<170> SIPOSequenceListing 1.0

<210> 1

<211> 1273

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 1

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu

1010 1015 1020

Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val

1025 1030 1035 1040

Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala

1045 1050 1055

Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu

1060 1065 1070

Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His

1075 1080 1085

Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val

1090 1095 1100

Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr

1105 1110 1115 1120

Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr

1125 1130 1135

Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu

1140 1145 1150

Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp

1155 1160 1165

Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp

1170 1175 1180

Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu

1185 1190 1195 1200

Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile

1205 1210 1215

Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile

1220 1225 1230

Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val

1250 1255 1260

Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 2

<211> 1273

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser

245 250 255

Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro

260 265 270

Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala

275 280 285

Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys

290 295 300

Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val

305 310 315 320

Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys

325 330 335

Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala

340 345 350

Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu

355 360 365

Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro

370 375 380

Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe

385 390 395 400

Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly

405 410 415

Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys

420 425 430

Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn

435 440 445

Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe

450 455 460

Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys

465 470 475 480

Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly

485 490 495

Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val

500 505 510

Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys

515 520 525

Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn

530 535 540

Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu

545 550 555 560

Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val

565 570 575

Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe

580 585 590

Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val

595 600 605

Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile

610 615 620

His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser

625 630 635 640

Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val

645 650 655

Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala

660 665 670

Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala

675 680 685

Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser

690 695 700

Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile

705 710 715 720

Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val

725 730 735

Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu

740 745 750

Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr

755 760 765

Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln

770 775 780

Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe

785 790 795 800

Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser

805 810 815

Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly

820 825 830

Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp

835 840 845

Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu

850 855 860

Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly

865 870 875 880

Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile

885 890 895

Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr

900 905 910

Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn

915 920 925

Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala

930 935 940

Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn

945 950 955 960

Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val

965 970 975

Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln

980 985 990

Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val

995 1000 1005

Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu

1010 1015 1020

Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val

1025 1030 1035 1040

Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala

1045 1050 1055

Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu

1060 1065 1070

Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His

1075 1080 1085

Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val

1090 1095 1100

Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr

1105 1110 1115 1120

Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr

1125 1130 1135

Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu

1140 1145 1150

Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp

1155 1160 1165

Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp

1170 1175 1180

Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu

1185 1190 1195 1200

Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile

1205 1210 1215

Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile

1220 1225 1230

Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys

1235 1240 1245

Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val

1250 1255 1260

Leu Lys Gly Val Lys Leu His Tyr Thr

1265 1270

<210> 3

<211> 198

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe

1 5 10 15

Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala

20 25 30

Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys

35 40 45

Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val

50 55 60

Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala

65 70 75 80

Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp

85 90 95

Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser

100 105 110

Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser

115 120 125

Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala

130 135 140

Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro

145 150 155 160

Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro

165 170 175

Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr

180 185 190

Val Cys Gly Pro Lys Lys

195

<210> 4

<211> 666

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atggacgcca tgaagagggg actgtgctgc gtgctgctgc tgtgcggagc cgtgttcgtg 60

agcaactcca tcaccaacct gtgccccttc ggcgaggtgt ttaacgccac acgctttgcc 120

tccgtgtatg cctggaaccg gaagagaatc tccaattgcg tggccgacta ttctgtgctg 180

tacaattctg ccagcttctc cacctttaag tgctatggcg tgtctcctac caagctgaac 240

gacctgtgct tcacaaacgt gtacgccgac agctttgtga tccggggcga tgaggtgaga 300

cagatcgcac caggacagac cggcaagatc gcagactaca actataagct gcccgacgat 360

ttcacaggct gcgtgatcgc ctggaattct aacaatctgg atagcaaagt gggcggcaac 420

tacaattatc tgtacaggct gttccgcaag agcaacctga agccttttga gcgggacatc 480

agcaccgaga tctaccaggc cggctccaca ccatgcaacg gcgtggaggg cttcaattgt 540

tattttccac tgcagtccta cggcttccag cccaccaatg gcgtgggcta tcagccttac 600

cgggtggtgg tgctgtcttt tgagctgctg cacgcaccag caacagtgtg cggacctaag 660

aagtga 666

<210> 5

<211> 3786

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

tcccagtgcg tgaacctgac cacaaggacc cagctgccac ctgcctatac caatagcttc 60

acaagaggcg tgtactatcc tgacaaggtg tttcgctcta gcgtgctgca ctctacacag 120

gatctgtttc tgccattctt tagcaacgtg acctggttcc acgccatcca cgtgtccggc 180

accaatggca caaagagatt cgacaatcca gtgctgccct ttaacgatgg cgtgtacttc 240

gctagcaccg agaagtccaa catcatccgc ggctggatct ttggcaccac actggactct 300

aagacacaga gcctgctgat cgtgaacaat gccaccaacg tggtcatcaa ggtgtgcgag 360

ttccagtttt gtaatgatcc cttcctgggc gtgtactatc acaagaacaa taagtcctgg 420

atggagtctg agtttagggt gtattcctct gccaacaatt gcacatttga gtacgtgtcc 480

cagcctttcc tgatggacct ggagggcaag cagggcaatt tcaagaacct gcgggagttc 540

gtgtttaaga atatcgatgg ctacttcaag atctactcca agcacacccc tatcaacctg 600

gtgagggacc tgccacaggg cttctctgcc ctggagcctc tggtggatct gccaatcggc 660

atcaacatca ccagatttca gacactgctg gctctgcacc gcagctacct gacacccggc 720

gacagctcct ctggatggac cgctggagct gctgcttact atgtgggcta tctgcagcct 780

cggaccttcc tgctgaagta caacgagaat ggcaccatca cagacgctgt ggattgcgcc 840

ctggatcctc tgagcgagac caagtgtaca ctgaagtcct ttaccgtgga gaagggcatc 900

tatcagacat ccaatttccg ggtgcagcca accgagtcta tcgtgaggtt tccaaatatc 960

acaaacctgt gcccctttgg cgaggtgttc aacgctacca ggttcgccag cgtgtacgct 1020

tggaatagaa agcgcatctc taactgcgtg gctgactata gcgtgctgta caacagcgcc 1080

tccttctcta cctttaagtg ctatggcgtg agccctacaa agctgaatga cctgtgcttt 1140

accaacgtgt acgccgattc cttcgtgatc agaggcgacg aggtgcgcca gatcgctcca 1200

ggacagacag gcaagatcgc cgactacaat tataagctgc ccgacgattt caccggctgc 1260

gtgatcgcct ggaactccaa caatctggat tctaaagtgg gcggcaacta caattatctg 1320

taccggctgt ttaggaagtc caatctgaag cccttcgagc gggacatctc tacagagatc 1380

taccaggccg gcagcacccc ttgcaatggc gtggagggct ttaactgtta tttccccctg 1440

cagtcttacg gcttccagcc tacaaacggc gtgggctatc agccatacag ggtggtggtg 1500

ctgtcttttg agctgctgca cgctccagct acagtgtgcg gacctaagaa gagcaccaat 1560

ctggtgaaga acaagtgcgt gaacttcaac ttcaacggac tgaccggaac aggcgtgctg 1620

accgagtcta acaagaagtt cctgccattt cagcagttcg gccgggacat cgccgatacc 1680

acagacgctg tgagggaccc ccagaccctg gagatcctgg atatcacacc ttgcagcttc 1740

ggcggcgtgt ccgtgatcac accaggaacc aatacaagca accaggtggc cgtgctgtat 1800

caggacgtga attgtaccga ggtgccagtg gctatccacg ccgatcagct gacccccaca 1860

tggagagtgt actctaccgg cagcaacgtg tttcagacaa gggctggatg tctgatcgga 1920

gctgagcacg tgaacaatag ctatgagtgc gacatcccaa tcggcgccgg catctgtgct 1980

tcctaccaga cccagacaaa ctctccaggc tccgccggca gcgtggctag ccagtccatc 2040

atcgcttata ccatgtccct gggcgccgag aattctgtgg cttactccaa caattctatc 2100

gccatcccca ccaacttcac aatcagcgtg accacagaga tcctgcccgt gagcatgacc 2160

aagacaagcg tggactgcac aatgtatatc tgtggcgata gcaccgagtg ctccaacctg 2220

ctgctgcagt acggctcctt ttgtacccag ctgaatcgcg ccctgacagg catcgctgtg 2280

gagcaggata agaacacaca ggaggtgttc gcccaggtga agcagatcta caagacccca 2340

cccatcaagg actttggcgg cttcaatttt tcccagatcc tgcccgatcc tagcaagcct 2400

tccaagagat cttttatcga ggacctgctg ttcaacaagg tgaccctggc tgatgccggc 2460

ttcatcaagc agtatggcga ttgcctgggc gacatcgctg ctagggacct gatctgtgct 2520

cagaagttta atggcctgac cgtgctgcct ccactgctga cagatgagat gatcgctcag 2580

tacacaagcg ccctgctggc tggaaccatc acatccggat ggaccttcgg cgctggagct 2640

gccctgcaga tcccatttgc catgcagatg gcttatagat tcaacggcat cggcgtgacc 2700

cagaatgtgc tgtacgagaa ccagaagctg atcgccaatc agtttaactc cgctatcggc 2760

aagatccagg acagcctgag cagcacagct tccgccctgg gcaagctgca ggatgtggtg 2820

aatcagaacg ctcaggccct gaataccctg gtgaagcagc tgtctagcaa cttcggcgct 2880

atctcctctg tgctgaatga tatcctgagc cggctggacc ctccagaggc tgaggtgcag 2940

atcgaccggc tgatcacagg caggctgcag tccctgcaga cctatgtgac acagcagctg 3000

atcagagctg ccgagatccg cgcttctgcc aatctggctg ccaccaagat gtccgagtgc 3060

gtgctgggcc agtctaagcg cgtggacttt tgtggcaagg gctatcacct gatgtctttc 3120

ccacagagcg ccccacacgg agtggtgttt ctgcacgtga cctacgtgcc tgcccaggag 3180

aagaacttca ccacagctcc agccatctgc cacgatggca aggcccactt tccacgggag 3240

ggcgtgttcg tgagcaacgg cacccactgg tttgtgacac agaggaattt ctacgagccc 3300

cagatcatca ccacagacaa taccttcgtg agcggcaact gtgacgtggt catcggcatc 3360

gtgaacaata ccgtgtatga tcctctgcag ccagagctgg actcttttaa ggaggagctg 3420

gataagtact tcaagaatca caccagcccc gacgtggatc tgggcgacat ctccggcatc 3480

aatgcttctg tggtgaacat ccagaaggag atcgaccgcc tgaacgaggt ggccaagaat 3540

ctgaacgaga gcctgatcga tctgcaggag ctgggcaagt atgagcagta catcaagtgg 3600

ccctggtata tctggctggg cttcatcgcc ggcctgatcg ccatcgtgat ggtgaccatc 3660

atgctgtgct gtatgacaag ctgctgttcc tgcctgaagg gctgctgttc ttgtggcagc 3720

tgctgtaagt ttgatgagga cgatagcgag cctgtgctga agggcgtgaa gctgcactac 3780

acctga 3786

<210> 6

<211> 3786

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

tcccagtgcg tgaacctgac cacaaggacc cagctgcccc ctgcctatac caattccttc 60

acacggggcg tgtactatcc cgacaaggtg tttagatcta gcgtgctgca ctccacacag 120

gatctgtttc tgcctttctt ttctaacgtg acctggttcc acgccatcca cgtgagcggc 180

accaatggca caaagcggtt cgacaatcca gtgctgccct ttaacgatgg cgtgtacttc 240

gcctccaccg agaagtctaa catcatcaga ggctggatct ttggcaccac actggacagc 300

aagacacagt ccctgctgat cgtgaacaat gccaccaacg tggtcatcaa ggtgtgcgag 360

ttccagtttt gtaatgatcc attcctgggc gtgtactatc acaagaacaa taagtcttgg 420

atggagagcg agtttcgcgt gtattcctct gccaacaatt gcacatttga gtacgtgtcc 480

cagcccttcc tgatggacct ggagggcaag cagggcaatt tcaagaacct gagggagttc 540

gtgtttaaga atatcgatgg ctacttcaag atctactcca agcacacccc aatcaacctg 600

gtgcgcgacc tgccacaggg cttctctgcc ctggagccac tggtggatct gcccatcggc 660

atcaacatca cccggtttca gacactgctg gccctgcaca gaagctacct gacaccaggc 720

gacagctcct ctggatggac cgcaggagca gcagcctact atgtgggcta tctgcagccc 780

aggaccttcc tgctgaagta caacgagaat ggcaccatca cagacgccgt ggattgcgcc 840

ctggatcccc tgtctgagac caagtgtaca ctgaagagct ttaccgtgga gaagggcatc 900

tatcagacaa gcaatttcag ggtgcagcct accgagtcca tcgtgcgctt tcccaatatc 960

acaaacctgt gcccttttgg cgaggtgttc aacgcaacca ggttcgcaag cgtgtacgca 1020

tggaatagga agcgcatctc caactgcgtg gccgactatt ctgtgctgta caacagcgcc 1080

tccttctcta cctttaagtg ctatggcgtg agccccacaa agctgaatga cctgtgcttt 1140

accaacgtgt acgccgattc cttcgtgatc aggggcgacg aggtgcgcca gatcgcacca 1200

ggacagacag gcaagatcgc agactacaat tataagctgc ctgacgattt caccggctgc 1260

gtgatcgcct ggaactctaa caatctggat agcaaagtgg gcggcaacta caattatctg 1320

taccggctgt ttagaaagtc taatctgaag ccattcgaga gggacatctc cacagagatc 1380

taccaggccg gctctacccc ctgcaatggc gtggagggct ttaactgtta tttccctctg 1440

cagagctacg gcttccagcc aacaaacggc gtgggctatc agccctaccg cgtggtggtg 1500

ctgtcttttg agctgctgca cgcacctgca acagtgtgcg gaccaaagaa gagcaccaat 1560

ctggtgaaga acaagtgcgt gaacttcaac ttcaacggac tgaccggaac aggcgtgctg 1620

accgagtcca acaagaagtt cctgcctttt cagcagttcg gcagggacat cgcagatacc 1680

acagacgccg tgcgcgaccc tcagaccctg gagatcctgg acatcacacc atgctccttc 1740

ggcggcgtgt ctgtgatcac accaggcacc aatacaagca accaggtggc cgtgctgtat 1800

caggacgtga attgtaccga ggtgccagtg gcaatccacg cagatcagct gacccctaca 1860

tggcgggtgt actctaccgg cagcaacgtg ttccagacaa gagcaggatg cctgatcgga 1920

gcagagcacg tgaacaatag ctatgagtgc gacatcccta tcggcgccgg catctgtgcc 1980

tcctaccaga cccagacaaa ctccccaagg agagcacggt ctgtggcaag ccagtccatc 2040

atcgcctata ccatgagcct gggcgccgag aattccgtgg cctactccaa caattctatc 2100

gccatcccta ccaacttcac aatctccgtg accacagaga tcctgccagt gagcatgacc 2160

aagacatccg tggactgcac aatgtatatc tgtggcgatt ccaccgagtg ctctaacctg 2220

ctgctgcagt acggctcttt ttgtacccag ctgaatagag ccctgacagg catcgccgtg 2280

gagcaggaca agaacacaca ggaggtgttc gcccaggtga agcagatcta caagacccca 2340

cccatcaagg actttggcgg cttcaacttc agccagatcc tgcccgatcc tagcaagcca 2400

tccaagcggt cttttatcga ggacctgctg ttcaacaagg tgaccctggc cgatgccggc 2460

ttcatcaagc agtatggcga ttgcctgggc gacatcgccg ccagagacct gatctgtgcc 2520

cagaagttta atggcctgac cgtgctgcct ccactgctga cagatgagat gatcgcccag 2580

tacacatctg ccctgctggc aggaaccatc acaagcggat ggaccttcgg cgcaggagcc 2640

gccctgcaga tcccctttgc catgcagatg gcctatcggt tcaacggcat cggcgtgacc 2700

cagaatgtgc tgtacgagaa ccagaagctg atcgccaatc agtttaactc cgccatcggc 2760

aagatccagg actctctgag ctccacagca agcgccctgg gcaagctgca ggatgtggtg 2820

aatcagaacg cccaggccct gaataccctg gtgaagcagc tgtctagcaa cttcggcgcc 2880

atctcctctg tgctgaatga catcctgagc aggctggaca aggtggaggc agaggtgcag 2940

atcgaccggc tgatcacagg cagactgcag tccctgcaga cctacgtgac acagcagctg 3000

atcagggcag cagagatcag ggcatctgcc aatctggccg ccaccaagat gagcgagtgc 3060

gtgctgggcc agtccaagag agtggacttt tgtggcaagg gctatcacct gatgagcttc 3120

ccacagtccg cccctcacgg agtggtgttt ctgcacgtga cctacgtgcc agcccaggag 3180

aagaacttca ccacagcacc agcaatctgc cacgatggca aggcacactt tcctagggag 3240

ggcgtgttcg tgagcaacgg cacccactgg tttgtgacac agcgcaattt ctacgagcca 3300

cagatcatca ccacagacaa tacattcgtg tccggcaact gtgacgtggt catcggcatc 3360

gtgaacaata ccgtgtatga tcctctgcag ccagagctgg actcttttaa ggaggagctg 3420

gataagtact tcaagaatca caccagcccc gacgtggatc tgggcgacat ctctggcatc 3480

aatgccagcg tggtgaacat ccagaaggag atcgacaggc tgaacgaggt ggccaagaat 3540

ctgaacgagt ccctgatcga tctgcaggag ctgggcaagt atgagcagta catcaagtgg 3600

ccctggtata tctggctggg cttcatcgcc ggcctgatcg ccatcgtgat ggtgaccatc 3660

atgctgtgct gtatgacaag ctgctgttcc tgcctgaagg gctgctgttc ttgtggcagc 3720

tgctgtaagt ttgatgagga cgatagcgag cctgtgctga agggcgtgaa gctgcactac 3780

acctga 3786

<210> 7

<211> 651

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

atggattgga cgtggatctt gttcctggtg gcggcggcca ccagggtaca ttccatcacc 60

aatctatgcc cgtttggcga ggtgttcaac gccacgcgat ttgcctcagt ttacgcctgg 120

aatcgcaagc gaatcagcaa ttgcgtcgca gattattcag ttttgtacaa ctcggcatcc 180

tttagcacgt tcaagtgcta tggggtgtcg cccacaaaac tgaatgatct gtgtttcacc 240

aacgtatatg ctgattcgtt tgtgattcgg ggcgatgaag tgaggcagat cgcgcctggc 300

cagacgggca agatcgccga ctacaactac aagttgccgg acgattttac aggctgtgtg 360

attgcgtgga acagtaacaa cctcgactcc aaggtagggg gtaactacaa ctacctgtat 420

agactctttc gaaagtccaa cttgaagcca ttcgagcggg acatttcgac agagatctat 480

caggcaggta gtaccccctg caatggagtc gagggcttca attgttactt tccactgcag 540

tcatacggct tccaacctac taatggggtc gggtaccagc cgtaccgcgt ggtggtgctc 600

agctttgagc tcctccacgc gccggctacg gtatgcggcc ccaagaagta g 651

<210> 8

<211> 319

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (308)..(312)

<223> n is a, c, g, t or u

<400> 8

taatacgact cactataggg aaataagaga gaaaagaaga gtaagaagaa atataagagc 60

caccggagac ggattgattg ccgtctcctg ataataggct ggagcctcgg tggccatgct 120

tcttgcccct tgggcctccc cccagcccct cctccccttc ctgcacccgt acccccgtgg 180

tctttgaata aagtctgagt gggcggcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300

aaaaaaannn nnggtcttc 319

<210> 9

<211> 651

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

atggactgga cctggatcct cttcctcgtg gccgccgcca cccgcgtgca cagcatcacc 60

aacctgtgcc ccttcggcga ggtgtttaac gccacacgct ttgcctccgt gtatgcctgg 120

aaccggaaga gaatctccaa ttgcgtggcc gactattctg tgctgtacaa ttctgccagc 180

ttctccacct ttaagtgcta tggcgtgtct cctaccaagc tgaacgacct gtgcttcaca 240

aacgtgtacg ccgacagctt tgtgatccgg ggcgatgagg tgagacagat cgcaccagga 300

cagaccggca agatcgcaga ctacaactat aagctgcccg acgatttcac aggctgcgtg 360

atcgcctgga attctaacaa tctggatagc aaagtgggcg gcaactacaa ttatctgtac 420

aggctgttcc gcaagagcaa cctgaagcct tttgagcggg acatcagcac cgagatctac 480

caggccggct ccacaccatg caacggcgtg gagggcttca attgttattt tccactgcag 540

tcctacggct tccagcccac caatggcgtg ggctatcagc cttaccgggt ggtggtgctg 600

tcttttgagc tgctgcacgc accagcaaca gtgtgcggac ctaagaagtg a 651

<210> 10

<211> 651

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

atggactgga cctggatcct cttcctcgtg gccgccgcca cccgggtgca cagcatcacc 60

aacctctgcc ccttcgggga ggtcttcaac gccacccgct tcgccagcgt ctacgcctgg 120

aaccgcaagc gcatctccaa ctgcgtggcc gactacagcg tgctgtacaa cagcgcctcc 180

ttctccacct tcaagtgcta cggggtcagc cccaccaagc tgaacgacct ctgcttcacc 240

aacgtctacg cggactcctt cgtcatccgg ggggacgagg tgcggcagat cgccccgggc 300

cagacgggca agatcgccga ctacaactac aagctgccgg acgacttcac gggctgcgtc 360

atcgcctgga acagcaacaa cctggacagc aaggtgggcg gcaactacaa ctacctgtac 420

cgcctcttcc gcaagtccaa cctgaagccc ttcgagcggg acatctccac ggagatctac 480

caggcgggct ccaccccctg caacggggtg gagggcttca actgctactt ccccctgcag 540

agctacggct tccagcccac caacggggtg ggctaccagc cctaccgggt ggtggtgctg 600

tccttcgagc tgctgcacgc gccggccacc gtgtgcgggc ccaagaagtg a 651

<210> 11

<211> 651

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

atggactgga cctggatcct cttcctggtg gccgccgcca cccgggtgca cagcatcacc 60

aacctctgcc ccttcgggga ggtcttcaac gccacccgct tcgccagcgt ctacgcctgg 120

aaccgcaagc gcatctccaa ctgcgtggcc gactacagcg tgctgtacaa cagcgcctcc 180

ttctccacct tcaagtgcta cggggtcagc cccaccaagc tgaacgacct ctgcttcacc 240

aacgtctacg cggactcctt cgtcatccgg ggggacgagg tgcggcagat cgccccgggc 300

cagacgggca agatcgccga ctacaactac aagctgccgg acgacttcac gggctgcgtc 360

atcgcctgga acagcaacaa cctggacagc aaggtgggcg gcaactacaa ctacctctac 420

cgcctcttcc gcaagtccaa cctgaagccc ttcgagcggg acatctccac ggagatctac 480

caggcgggct ccaccccctg caacggggtg gagggcttca actgctactt ccccctgcag 540

agctacggct tccagcccac caacggggtg ggctaccagc cctaccgggt ggtggtgctg 600

tccttcgagc tgctgcacgc gccggccacc gtgtgcgggc ccaagaagtg a 651

<210> 12

<211> 726

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

atggactgga cctggatcct gttcctggtc gccgctgcca cccgggtgca cagcagagtg 60

cagcccaccg agtctatcgt gcggtttccc aacatcacca acctctgtcc tttcggcgaa 120

gtctttaacg ccacaagatt cgccagcgtt tacgcctgga ataggaaaag aatcagcaat 180

tgcgtggccg actacagcgt gctgtacaac agcgcctctt tcagcacctt caagtgttac 240

ggagtgtccc ctacaaagct gaacgacctg tgcttcacaa acgtgtacgc tgattctttt 300

gtgattagag gcgacgaggt gcggcagatc gcccctggcc agaccggcaa catcgctgat 360

tacaactata agctgcctga cgacttcacc ggatgtgtga tcgcctggaa cagcaataac 420

ctggactcca aggtgggagg caattacaac tacctgtacc ggctgttcag aaagtccaac 480

ctgaagccct tcgaaagaga tatcagcaca gagatctacc aggccggcag caccccatgc 540

aacggcgtga agggcttcaa ctgctacttc cccctgcaga gctacggctt tcagcctacc 600

tacggcgtgg gttatcaacc atacagagtg gtggtcctga gcttcgagct gctgcacgcc 660

cctgccaccg tgtgcggccc taagaaatct acaaatctgg tgaaaaacaa gtgcgtgaac 720

ttctaa 726

<210> 13

<211> 241

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 13

Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val

1 5 10 15

His Ser Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile

20 25 30

Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala

35 40 45

Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp

50 55 60

Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr

65 70 75 80

Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr

85 90 95

Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro

100 105 110

Gly Gln Thr Gly Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp

115 120 125

Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys

130 135 140

Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn

145 150 155 160

Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly

165 170 175

Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu

180 185 190

Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr

195 200 205

Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val

210 215 220

Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn

225 230 235 240

Phe

<210> 14

<211> 3813

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

atgttcgtgt ttctggtgct gctgcccctg gtgagctccc agtgcgtgaa tttcaccacc 60

agaacccagc tgccacctgc ctataccaac agtttcacca gaggcgtgta ctaccccgat 120

aaggtgttta gatccagcgt gctgcacagc acccaagacc tgtttctgcc cttcttcagc 180

aacgtgacct ggttccacgc tatccacgtg agcggcacca acggcactaa gaggttcgcc 240

aatcctgtgc tgcctttcaa cgacggcgta tattttgcca gcaccgaaaa gagcaacatc 300

atcagaggat ggatcttcgg aaccaccctg gacagcaaga cccagagcct gctgatcgtg 360

aacaacgcca ccaacgtggt gatcaaggtg tgtgaattcc aattctgcaa cgaccctttc 420

ctgggagtct actaccacaa gaacaacaag agctggatgg aatccgagtt cagagtgtac 480

tctagcgcta ataactgcac ctttgagtac gtgagccagc cattcctgat ggacctggaa 540

ggcaagcaag gcaacttcaa gaatttgcgg gaattcgtct tcaaaaacat cgacggctac 600

ttcaagatct acagcaagca cacccccatc aacctggtca gaggactgcc tcaaggcttt 660

tctgctctgg aacctctagt tgacctgcct atcggcatta acatcacaag attccagaca 720

ctgcacatca gctacctgac ccctggagat agctctagcg gatggacagc cggcgctgcc 780

gcctactacg tgggatatct gcagcccaga acattcctgc tgaaatacaa cgagaacggt 840

acaatcaccg acgccgtgga ctgcgccctg gaccctctgt ctgagacaaa gtgcacgctg 900

aagtccttca cagtggaaaa gggcatctat cagaccagca atttccgcgt gcagcctacc 960

gagagcatag tgcggttccc caacatcacc aacctgtgtc cttttggcga ggtgttcaat 1020

gccacacggt tcgcctccgt gtacgcctgg aacagaaagc ggatcagcaa ttgcgtggcc 1080

gactactccg tgctgtacaa cagcgccagc ttcagcacct tcaagtgcta cggcgtgtcc 1140

cctacgaaac tgaacgatct gtgcttcacc aacgtgtacg ccgacagctt cgtgatccga 1200

ggcgacgagg tgagacagat cgcccctggc cagaccggca acatcgccga ttacaactac 1260

aagctgcctg acgacttcac cggctgcgtg atcgcctgga atagcaacaa cctggattct 1320

aaagtgggcg gcaattacaa ctacctgtac agactgttca gaaagtcgaa cctgaaacct 1380

ttcgagagag atatctctac cgagatctac caggccggca gcaccccctg caatggcgtc 1440

aaaggcttca actgttactt ccctctgcag agctacggct ttcagccaac ctacggcgtc 1500

ggctaccagc catacagagt ggtagtgctc agcttcgagc tgctgcatgc ccccgccaca 1560

gtttgtggcc ctaagaaaag cacaaatctg gtgaagaaca agtgcgtgaa cttcaacttc 1620

aacggcctga caggcaccgg agtgctcacc gagagcaaca aaaagttcct gcctttccag 1680

cagtttggga gagatatcgc agacaccaca gatgccgtgc gggaccccca gaccctcgaa 1740

atcctggaca tcacaccttg tagctttgga ggcgtgtctg tgattacacc tggcacaaac 1800

acaagcaacc aggtggctgt gctgtaccaa ggcgtcaact gcaccgaagt gcccgtggct 1860

atccacgccg accagctgac cccgacctgg cgggtgtaca gcacaggcag taatgtgttt 1920

cagacccggg ccggctgtct gatcggagcc gagcacgtga acaacagcta cgagtgcgac 1980

atccccatcg gcgccggcat ctgcgcctct tatcagacac agacaaacag ccccggatct 2040

gctggcagcg ttgctagcca gtctatcatt gcctacacca tgtccctggg cgtggagaat 2100

tctgtggctt actccaacaa ttctatcgcc atccccacca acttcacaat cagcgtgacc 2160

acagagatcc tgcccgtgag catgaccaag acaagcgtgg actgcacaat gtatatctgt 2220

ggcgacagca ccgagtgctc caacctgctg ctgcagtacg gctccttttg tacccagctg 2280

aatcgcgccc tgacaggcat cgctgtggag caggacaaga acacacagga ggtgttcgcc 2340

caggtgaagc agatctacaa gaccccaccc atcaaggact ttggcggctt caatttttcc 2400

cagatcctgc ccgatcccag caagccttcc aagagatctt ttatcgagga cctgctgttc 2460

aacaaggtga ccctggccga tgccggcttc atcaagcagt atggcgattg cctgggcgac 2520

atcgctgcca gggacctgat ctgtgctcag aagttcaatg gcctgaccgt gctgcctcca 2580

ctgctgacag acgagatgat cgctcagtac acaagcgccc tgctggctgg aaccatcaca 2640

tccggctgga ccttcggcgc tggagctgcc ctgcagatcc catttgccat gcagatggct 2700

tacagattca acggcatcgg cgtgacccag aatgtgctgt acgagaacca gaagctgatc 2760

gccaatcagt tcaactccgc tatcggcaag atccaggaca gcctgagcag cacagcttcc 2820

gccctgggca agctgcagga tgtggtgaat cagaacgctc aggccctgaa taccctggtg 2880

aagcagctgt cgagcaactt cggcgctatc tcctctgtgc tgaacgatat cctgagccgg 2940

ctggaccctc cagaggcgga ggtgcagatc gaccggctga tcacaggcag gctgcagtcc 3000

ctgcagacct atgtgacaca gcagctgatc agagctgccg agatccgcgc ttctgccaat 3060

ctggctgcca ccaagatgtc cgagtgcgtg ctgggccagt cgaagcgcgt ggacttttgt 3120

ggcaagggct atcacctgat gtctttccca cagagcgccc cacacggagt ggtgtttctg 3180

cacgtgacct acgtgcctgc ccaggagaag aacttcacca cagctccagc catctgccac 3240

gatggcaagg cccactttcc acgggagggc gtgttcgtga gcaacggcac ccactggttt 3300

gtgacacaga ggaatttcta cgagccccag atcatcacca cagacaatac cttcgtgagc 3360

ggcaactgcg acgtggtcat cggcatcgtg aacaataccg tgtacgatcc tctgcagcca 3420

gagctggact ctttcaagga ggagctggac aagtacttca agaatcacac cagccccgac 3480

gtggatctgg gcgacatctc cggcatcaat gcttctgtgg tgaacatcca gaaggagatc 3540

gaccgcctga acgaggtggc caagaatctg aacgagagcc tgatcgatct gcaggagctg 3600

ggcaagtacg agcagtacat caagtggccc tggtatatct ggctgggctt catcgccggc 3660

ctgatcgcca tcgtgatggt gaccatcatg ctgtgctgta tgacaagctg ctgttcctgc 3720

ctgaagggct gctgttcttg tggcagctgc tgcaagttcg acgaggacga cagcgagcct 3780

gtgctgaagg gcgtgaagct gcactacacc taa 3813

<210> 15

<211> 1270

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 15

Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val

1 5 10 15

Asn Phe Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe

20 25 30

Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu

35 40 45

His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp

50 55 60

Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Ala

65 70 75 80

Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu

85 90 95

Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser

100 105 110

Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile

115 120 125

Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr

130 135 140

Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr

145 150 155 160

Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu

165 170 175

Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe

180 185 190

Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr

195 200 205

Pro Ile Asn Leu Val Arg Gly Leu Pro Gln Gly Phe Ser Ala Leu Glu

210 215 220

Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr

225 230 235 240

Leu His Ile Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr

245 250 255

Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe

260 265 270

Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys

275 280 285

Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr

290 295 300

Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr

305 310 315 320

Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly

325 330 335

Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg

340 345 350

Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser

355 360 365

Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu

370 375 380

Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg

385 390 395 400

Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala

405 410 415

Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala

420 425 430

Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr

435 440 445

Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp

450 455 460

Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val

465 470 475 480

Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro

485 490 495

Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe

500 505 510

Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr

515 520 525

Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr

530 535 540

Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln

545 550 555 560

Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro

565 570 575

Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val

580 585 590

Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu

595 600 605

Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp

610 615 620

Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe

625 630 635 640

Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser

645 650 655

Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln

660 665 670

Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala Ser Gln Ser

675 680 685

Ile Ile Ala Tyr Thr Met Ser Leu Gly Val Glu Asn Ser Val Ala Tyr

690 695 700

Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr

705 710 715 720

Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr

725 730 735

Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln

740 745 750

Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala

755 760 765

Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln

770 775 780

Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser

785 790 795 800

Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu

805 810 815

Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys

820 825 830

Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys

835 840 845

Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp

850 855 860

Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr

865 870 875 880

Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala

885 890 895

Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val

900 905 910

Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile

915 920 925

Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys

930 935 940

Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val

945 950 955 960

Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp

965 970 975

Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg

980 985 990

Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln

995 1000 1005

Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr

1010 1015 1020

Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys

1025 1030 1035 1040

Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly

1045 1050 1055

Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe

1060 1065 1070

Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg

1075 1080 1085

Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg

1090 1095 1100

Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser

1105 1110 1115 1120

Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp

1125 1130 1135

Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr

1140 1145 1150

Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly

1155 1160 1165

Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn

1170 1175 1180

Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu

1185 1190 1195 1200

Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly

1205 1210 1215

Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys

1220 1225 1230

Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly

1235 1240 1245

Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly

1250 1255 1260

Val Lys Leu His Tyr Thr

1265 1270

<210> 16

<211> 930

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 16

ggggaaauaa gagagaaaag aagaguaaga agaaauauaa gagccaccau ggacgccaug 60

aagaggggac ugugcugcgu gcugcugcug ugcggagccg uguucgugag caacuccauc 120

accaaccugu gccccuucgg cgagguguuu aacgccacac gcuuugccuc cguguaugcc 180

uggaaccgga agagaaucuc caauugcgug gccgacuauu cugugcugua caauucugcc 240

agcuucucca ccuuuaagug cuauggcgug ucuccuacca agcugaacga ccugugcuuc 300

acaaacgugu acgccgacag cuuugugauc cggggcgaug aggugagaca gaucgcacca 360

ggacagaccg gcaagaucgc agacuacaac uauaagcugc ccgacgauuu cacaggcugc 420

gugaucgccu ggaauucuaa caaucuggau agcaaagugg gcggcaacua caauuaucug 480

uacaggcugu uccgcaagag caaccugaag ccuuuugagc gggacaucag caccgagauc 540

uaccaggccg gcuccacacc augcaacggc guggagggcu ucaauuguua uuuuccacug 600

caguccuacg gcuuccagcc caccaauggc gugggcuauc agccuuaccg ggugguggug 660

cugucuuuug agcugcugca cgcaccagca acagugugcg gaccuaagaa gugauaauag 720

gcuggagccu cgguggccau gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 780

uuccugcacc cguacccccg uggucuuuga auaaagucug agugggcggc aaaaaaaaaa 840

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 900

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 930

<210> 17

<211> 4086

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 17

ggggaaauaa gagagaaaag aagaguaaga agaaauauaa gagccaccau guucguguuu 60

cuggugcugc ugccccuggu gagcucccag ugcgugaacc ugaccacaag gacccagcug 120

ccaccugccu auaccaauag cuucacaaga ggcguguacu auccugacaa gguguuucgc 180

ucuagcgugc ugcacucuac acaggaucug uuucugccau ucuuuagcaa cgugaccugg 240

uuccacgcca uccacguguc cggcaccaau ggcacaaaga gauucgacaa uccagugcug 300

cccuuuaacg auggcgugua cuucgcuagc accgagaagu ccaacaucau ccgcggcugg 360

aucuuuggca ccacacugga cucuaagaca cagagccugc ugaucgugaa caaugccacc 420

aacgugguca ucaaggugug cgaguuccag uuuuguaaug aucccuuccu gggcguguac 480

uaucacaaga acaauaaguc cuggauggag ucugaguuua ggguguauuc cucugccaac 540

aauugcacau uugaguacgu gucccagccu uuccugaugg accuggaggg caagcagggc 600

aauuucaaga accugcggga guucguguuu aagaauaucg auggcuacuu caagaucuac 660

uccaagcaca ccccuaucaa ccuggugagg gaccugccac agggcuucuc ugcccuggag 720

ccucuggugg aucugccaau cggcaucaac aucaccagau uucagacacu gcuggcucug 780

caccgcagcu accugacacc cggcgacagc uccucuggau ggaccgcugg agcugcugcu 840

uacuaugugg gcuaucugca gccucggacc uuccugcuga aguacaacga gaauggcacc 900

aucacagacg cuguggauug cgcccuggau ccucugagcg agaccaagug uacacugaag 960

uccuuuaccg uggagaaggg caucuaucag acauccaauu uccgggugca gccaaccgag 1020

ucuaucguga gguuuccaaa uaucacaaac cugugccccu uuggcgaggu guucaacgcu 1080

accagguucg ccagcgugua cgcuuggaau agaaagcgca ucucuaacug cguggcugac 1140

uauagcgugc uguacaacag cgccuccuuc ucuaccuuua agugcuaugg cgugagcccu 1200

acaaagcuga augaccugug cuuuaccaac guguacgccg auuccuucgu gaucagaggc 1260

gacgaggugc gccagaucgc uccaggacag acaggcaaga ucgccgacua caauuauaag 1320

cugcccgacg auuucaccgg cugcgugauc gccuggaacu ccaacaaucu ggauucuaaa 1380

gugggcggca acuacaauua ucuguaccgg cuguuuagga aguccaaucu gaagcccuuc 1440

gagcgggaca ucucuacaga gaucuaccag gccggcagca ccccuugcaa uggcguggag 1500

ggcuuuaacu guuauuuccc ccugcagucu uacggcuucc agccuacaaa cggcgugggc 1560

uaucagccau acaggguggu ggugcugucu uuugagcugc ugcacgcucc agcuacagug 1620

ugcggaccua agaagagcac caaucuggug aagaacaagu gcgugaacuu caacuucaac 1680

ggacugaccg gaacaggcgu gcugaccgag ucuaacaaga aguuccugcc auuucagcag 1740

uucggccggg acaucgccga uaccacagac gcugugaggg acccccagac ccuggagauc 1800

cuggauauca caccuugcag cuucggcggc guguccguga ucacaccagg aaccaauaca 1860

agcaaccagg uggccgugcu guaucaggac gugaauugua ccgaggugcc aguggcuauc 1920

cacgccgauc agcugacccc cacauggaga guguacucua ccggcagcaa cguguuucag 1980

acaagggcug gaugucugau cggagcugag cacgugaaca auagcuauga gugcgacauc 2040

ccaaucggcg ccggcaucug ugcuuccuac cagacccaga caaacucucc aggcuccgcc 2100

ggcagcgugg cuagccaguc caucaucgcu uauaccaugu cccugggcgc cgagaauucu 2160

guggcuuacu ccaacaauuc uaucgccauc cccaccaacu ucacaaucag cgugaccaca 2220

gagauccugc ccgugagcau gaccaagaca agcguggacu gcacaaugua uaucuguggc 2280

gauagcaccg agugcuccaa ccugcugcug caguacggcu ccuuuuguac ccagcugaau 2340

cgcgcccuga caggcaucgc uguggagcag gauaagaaca cacaggaggu guucgcccag 2400

gugaagcaga ucuacaagac cccacccauc aaggacuuug gcggcuucaa uuuuucccag 2460

auccugcccg auccuagcaa gccuuccaag agaucuuuua ucgaggaccu gcuguucaac 2520

aaggugaccc uggcugaugc cggcuucauc aagcaguaug gcgauugccu gggcgacauc 2580

gcugcuaggg accugaucug ugcucagaag uuuaauggcc ugaccgugcu gccuccacug 2640

cugacagaug agaugaucgc ucaguacaca agcgcccugc uggcuggaac caucacaucc 2700

ggauggaccu ucggcgcugg agcugcccug cagaucccau uugccaugca gauggcuuau 2760

agauucaacg gcaucggcgu gacccagaau gugcuguacg agaaccagaa gcugaucgcc 2820

aaucaguuua acuccgcuau cggcaagauc caggacagcc ugagcagcac agcuuccgcc 2880

cugggcaagc ugcaggaugu ggugaaucag aacgcucagg cccugaauac ccuggugaag 2940

cagcugucua gcaacuucgg cgcuaucucc ucugugcuga augauauccu gagccggcug 3000

gacccuccag aggcugaggu gcagaucgac cggcugauca caggcaggcu gcagucccug 3060

cagaccuaug ugacacagca gcugaucaga gcugccgaga uccgcgcuuc ugccaaucug 3120

gcugccacca agauguccga gugcgugcug ggccagucua agcgcgugga cuuuuguggc 3180

aagggcuauc accugauguc uuucccacag agcgccccac acggaguggu guuucugcac 3240

gugaccuacg ugccugccca ggagaagaac uucaccacag cuccagccau cugccacgau 3300

ggcaaggccc acuuuccacg ggagggcgug uucgugagca acggcaccca cugguuugug 3360

acacagagga auuucuacga gccccagauc aucaccacag acaauaccuu cgugagcggc 3420

aacugugacg uggucaucgg caucgugaac aauaccgugu augauccucu gcagccagag 3480

cuggacucuu uuaaggagga gcuggauaag uacuucaaga aucacaccag ccccgacgug 3540

gaucugggcg acaucuccgg caucaaugcu ucugugguga acauccagaa ggagaucgac 3600

cgccugaacg agguggccaa gaaucugaac gagagccuga ucgaucugca ggagcugggc 3660

aaguaugagc aguacaucaa guggcccugg uauaucuggc ugggcuucau cgccggccug 3720

aucgccaucg ugauggugac caucaugcug ugcuguauga caagcugcug uuccugccug 3780

aagggcugcu guucuugugg cagcugcugu aaguuugaug aggacgauag cgagccugug 3840

cugaagggcg ugaagcugca cuacaccuga uaauaggcug gagccucggu ggccaugcuu 3900

cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 3960

cuuugaauaa agucugagug ggcggcaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4020

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4080

aaaaaa 4086

<210> 18

<211> 990

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 18

ggggaaauaa gagagaaaag aagaguaaga agaaauauaa gagccaccau ggacuggacc 60

uggauccugu uccuggucgc cgcugccacc cgggugcaca gcagagugca gcccaccgag 120

ucuaucgugc gguuucccaa caucaccaac cucuguccuu ucggcgaagu cuuuaacgcc 180

acaagauucg ccagcguuua cgccuggaau aggaaaagaa ucagcaauug cguggccgac 240

uacagcgugc uguacaacag cgccucuuuc agcaccuuca aguguuacgg aguguccccu 300

acaaagcuga acgaccugug cuucacaaac guguacgcug auucuuuugu gauuagaggc 360

gacgaggugc ggcagaucgc cccuggccag accggcaaca ucgcugauua caacuauaag 420

cugccugacg acuucaccgg augugugauc gccuggaaca gcaauaaccu ggacuccaag 480

gugggaggca auuacaacua ccuguaccgg cuguucagaa aguccaaccu gaagcccuuc 540

gaaagagaua ucagcacaga gaucuaccag gccggcagca ccccaugcaa cggcgugaag 600

ggcuucaacu gcuacuuccc ccugcagagc uacggcuuuc agccuaccua cggcgugggu 660

uaucaaccau acagaguggu gguccugagc uucgagcugc ugcacgcccc ugccaccgug 720

ugcggcccua agaaaucuac aaaucuggug aaaaacaagu gcgugaacuu cugauaauag 780

gcuggagccu cgguggccau gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 840

uuccugcacc cguacccccg uggucuuuga auaaagucug agugggcggc aaaaaaaaaa 900

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 960

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 990

<210> 19

<211> 4077

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 19

ggggaaauaa gagagaaaag aagaguaaga agaaauauaa gagccaccau guucguguuu 60

cuggugcugc ugccccuggu gagcucccag ugcgugaauu ucaccaccag aacccagcug 120

ccaccugccu auaccaacag uuucaccaga ggcguguacu accccgauaa gguguuuaga 180

uccagcgugc ugcacagcac ccaagaccug uuucugcccu ucuucagcaa cgugaccugg 240

uuccacgcua uccacgugag cggcaccaac ggcacuaaga gguucgccaa uccugugcug 300

ccuuucaacg acggcguaua uuuugccagc accgaaaaga gcaacaucau cagaggaugg 360

aucuucggaa ccacccugga cagcaagacc cagagccugc ugaucgugaa caacgccacc 420

aacgugguga ucaaggugug ugaauuccaa uucugcaacg acccuuuccu gggagucuac 480

uaccacaaga acaacaagag cuggauggaa uccgaguuca gaguguacuc uagcgcuaau 540

aacugcaccu uugaguacgu gagccagcca uuccugaugg accuggaagg caagcaaggc 600

aacuucaaga auuugcggga auucgucuuc aaaaacaucg acggcuacuu caagaucuac 660

agcaagcaca cccccaucaa ccuggucaga ggacugccuc aaggcuuuuc ugcucuggaa 720

ccucuaguug accugccuau cggcauuaac aucacaagau uccagacacu gcacaucagc 780

uaccugaccc cuggagauag cucuagcgga uggacagccg gcgcugccgc cuacuacgug 840

ggauaucugc agcccagaac auuccugcug aaauacaacg agaacgguac aaucaccgac 900

gccguggacu gcgcccugga cccucugucu gagacaaagu gcacgcugaa guccuucaca 960

guggaaaagg gcaucuauca gaccagcaau uuccgcgugc agccuaccga gagcauagug 1020

cgguucccca acaucaccaa ccuguguccu uuuggcgagg uguucaaugc cacacgguuc 1080

gccuccgugu acgccuggaa cagaaagcgg aucagcaauu gcguggccga cuacuccgug 1140

cuguacaaca gcgccagcuu cagcaccuuc aagugcuacg gcgugucccc uacgaaacug 1200

aacgaucugu gcuucaccaa cguguacgcc gacagcuucg ugauccgagg cgacgaggug 1260

agacagaucg ccccuggcca gaccggcaac aucgccgauu acaacuacaa gcugccugac 1320

gacuucaccg gcugcgugau cgccuggaau agcaacaacc uggauucuaa agugggcggc 1380

aauuacaacu accuguacag acuguucaga aagucgaacc ugaaaccuuu cgagagagau 1440

aucucuaccg agaucuacca ggccggcagc acccccugca auggcgucaa aggcuucaac 1500

uguuacuucc cucugcagag cuacggcuuu cagccaaccu acggcgucgg cuaccagcca 1560

uacagagugg uagugcucag cuucgagcug cugcaugccc ccgccacagu uuguggcccu 1620

aagaaaagca caaaucuggu gaagaacaag ugcgugaacu ucaacuucaa cggccugaca 1680

ggcaccggag ugcucaccga gagcaacaaa aaguuccugc cuuuccagca guuugggaga 1740

gauaucgcag acaccacaga ugccgugcgg gacccccaga cccucgaaau ccuggacauc 1800

acaccuugua gcuuuggagg cgugucugug auuacaccug gcacaaacac aagcaaccag 1860

guggcugugc uguaccaagg cgucaacugc accgaagugc ccguggcuau ccacgccgac 1920

cagcugaccc cgaccuggcg gguguacagc acaggcagua auguguuuca gacccgggcc 1980

ggcugucuga ucggagccga gcacgugaac aacagcuacg agugcgacau ccccaucggc 2040

gccggcaucu gcgccucuua ucagacacag acaaacagcc ccggaucugc uggcagcguu 2100

gcuagccagu cuaucauugc cuacaccaug ucccugggcg uggagaauuc uguggcuuac 2160

uccaacaauu cuaucgccau ccccaccaac uucacaauca gcgugaccac agagauccug 2220

cccgugagca ugaccaagac aagcguggac ugcacaaugu auaucugugg cgacagcacc 2280

gagugcucca accugcugcu gcaguacggc uccuuuugua cccagcugaa ucgcgcccug 2340

acaggcaucg cuguggagca ggacaagaac acacaggagg uguucgccca ggugaagcag 2400

aucuacaaga ccccacccau caaggacuuu ggcggcuuca auuuuuccca gauccugccc 2460

gaucccagca agccuuccaa gagaucuuuu aucgaggacc ugcuguucaa caaggugacc 2520

cuggccgaug ccggcuucau caagcaguau ggcgauugcc ugggcgacau cgcugccagg 2580

gaccugaucu gugcucagaa guucaauggc cugaccgugc ugccuccacu gcugacagac 2640

gagaugaucg cucaguacac aagcgcccug cuggcuggaa ccaucacauc cggcuggacc 2700

uucggcgcug gagcugcccu gcagauccca uuugccaugc agauggcuua cagauucaac 2760

ggcaucggcg ugacccagaa ugugcuguac gagaaccaga agcugaucgc caaucaguuc 2820

aacuccgcua ucggcaagau ccaggacagc cugagcagca cagcuuccgc ccugggcaag 2880

cugcaggaug uggugaauca gaacgcucag gcccugaaua cccuggugaa gcagcugucg 2940

agcaacuucg gcgcuaucuc cucugugcug aacgauaucc ugagccggcu ggacccucca 3000

gaggcggagg ugcagaucga ccggcugauc acaggcaggc ugcagucccu gcagaccuau 3060

gugacacagc agcugaucag agcugccgag auccgcgcuu cugccaaucu ggcugccacc 3120

aagauguccg agugcgugcu gggccagucg aagcgcgugg acuuuugugg caagggcuau 3180

caccugaugu cuuucccaca gagcgcccca cacggagugg uguuucugca cgugaccuac 3240

gugccugccc aggagaagaa cuucaccaca gcuccagcca ucugccacga uggcaaggcc 3300

cacuuuccac gggagggcgu guucgugagc aacggcaccc acugguuugu gacacagagg 3360

aauuucuacg agccccagau caucaccaca gacaauaccu ucgugagcgg caacugcgac 3420

guggucaucg gcaucgugaa caauaccgug uacgauccuc ugcagccaga gcuggacucu 3480

uucaaggagg agcuggacaa guacuucaag aaucacacca gccccgacgu ggaucugggc 3540

gacaucuccg gcaucaaugc uucuguggug aacauccaga aggagaucga ccgccugaac 3600

gagguggcca agaaucugaa cgagagccug aucgaucugc aggagcuggg caaguacgag 3660

caguacauca aguggcccug guauaucugg cugggcuuca ucgccggccu gaucgccauc 3720

gugaugguga ccaucaugcu gugcuguaug acaagcugcu guuccugccu gaagggcugc 3780

uguucuugug gcagcugcug caaguucgac gaggacgaca gcgagccugu gcugaagggc 3840

gugaagcugc acuacaccug auaauaggcu ggagccucgg uggccaugcu ucuugccccu 3900

ugggccuccc cccagccccu ccuccccuuc cugcacccgu acccccgugg ucuuugaaua 3960

aagucugagu gggcggcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4020

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 4077

64页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于突变的VHL基因的单基因高血压基因检测试剂盒

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!