一种人***瘤病毒66型l1蛋白的突变体

文档序号：1690654 发布日期：2019-12-10 浏览：14次 >En<

阅读说明：本技术 一种人***瘤病毒66型l1蛋白的突变体 (mutant of human papilloma virus 66 type L1 protein ) 是由李少伟柳欣林杨与柔陈洁王大宁夏宁邵于 2019-06-04 设计创作，主要内容包括：本发明涉及一种突变的HPV66 L1蛋白(或其变体),其编码序列和制备方法,以及包含其的病毒样颗粒,所述蛋白(或其变体)和病毒样颗粒能够诱发抗至少两个型别的HPV(例如,HPV66和HPV56,或者HPV66、HPV56和HPV53)的中和抗体,从而可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如宫颈癌和尖锐湿疣。本发明还涉及上述蛋白和病毒样颗粒用于制备药物组合物或疫苗的用途,所述药物组合物或疫苗可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如宫颈癌和尖锐湿疣。(The present invention relates to a mutated HPV66L1 protein (or a variant thereof), a coding sequence and a preparation method thereof, and virus-like particles comprising the same, which are capable of inducing neutralizing antibodies against at least two types of HPV (e.g., HPV66 and HPV56, or HPV66, HPV56 and HPV53), thereby being useful for preventing infection by the at least two types of HPV and diseases caused by the infection, such as cervical cancer and condyloma acuminatum. The invention also relates to the use of the above proteins and virus-like particles for the preparation of a pharmaceutical composition or vaccine useful for the prevention of HPV infections of said at least two types and diseases caused by said infections, such as cervical cancer and condyloma acuminata.)

一种人***瘤病毒66型L1蛋白的突变体

本申请是以CN申请号为201810563504.2，申请日为2018年6月4日的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本发明涉及分子病毒学和免疫学领域。具体地，本发明涉及一种突变的HPV66 L1蛋白(或其变体)，其编码序列和制备方法，以及包含其的病毒样颗粒，所述蛋白(或其变体)和病毒样颗粒能够诱发抗至少两个型别的HPV(例如，HPV66和HPV56，或者HPV66、HPV56和HPV53)的中和抗体，从而可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如***和***。本发明还涉及上述蛋白和病毒样颗粒用于制备药物组合物或疫苗的用途，所述药物组合物或疫苗可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如***和***。

背景技术

人***瘤病毒(Human Papillomavirus，HPV)主要引起皮肤和粘膜的疣状病变。根据其与肿瘤发生的关系，HPV可分为高危型与低危型，其中高危型的HPV感染被证实是诱发包括女性***在内的生殖器癌症的主要原因；低危型则主要引起***。预防与控制HPV感染的最有效方式是施用HPV疫苗，特别是针对能引起***的高危型HPV的疫苗。

HPV的主要衣壳蛋白L1具有自组装为空心病毒样颗粒(Virus-Like Particle,VLP)的特性。HPV VLP是由72个主要衣壳蛋白L1的五聚体构成的20面体立体对称结构(Doorbar,J.and P.H.Gallimore.1987.J Virol,61(9)：2793-9)。HPV VLP的结构与天然HPV高度相似，保留了天然病毒的绝大多数中和表位，可诱导高滴度的中和抗体(Kirnbauer，R.，F.Booy，et al.1992 Proc Natl Acad Sci U S A 89(24):12180-4)。

然而，现有的研究显示，HPV VLP主要诱导针对同型HPV的中和抗体，产生针对同型HPV的保护性免疫，而仅在一些同源性高的型别之间存在低的交叉保护作用(SaraL.Bissett,Giada Mattiuzzo,et al.2014Vaccine.32:6548-6555)。因此，现有的HPV疫苗的保护范围非常有限。通常，一个型别的HPV VLP只能用于预防该型别的HPV感染。在这种情况下，如果要扩大HPV疫苗的保护范围，那就只能在疫苗中增加更多型别的HPV VLP。目前已上市的HPV疫苗，包括Merck公司的(其为针对HPV16，18，6和11的四价疫苗)，GSK公司的(其为针对HPV16，18的二价疫苗)和Merck公司的(其为针对HPV6，11，16，18，31，33，45，52，58的九价疫苗)，均是通过混合多个型别的HPV VLP而制成的。然而，这种方案将导致HPV疫苗的生产成本大大提高，并且可能因为免疫剂量的增加而导致潜在的安全性问题。

因此，本领域需要开发能够诱导针对多个型别的HPV的保护性中和抗体的HPV病毒样颗粒，以更经济、有效地预防多个型别的HPV感染和由此导致的疾病例如***和***。

发明内容

本发明至少部分基于发明人的下述出人意料的发现：将人***瘤病毒(HPV)66型L1蛋白中的一个特定区段置换为第二型别的HPV(例如HPV56)L1蛋白的相应区段后，所获得的突变的HPV66 L1蛋白能够诱导机体产生针对HPV66和第二型别的HPV(例如HPV56)的高滴度中和抗体，其保护效果与混合的HPV66 VLP和第二型别的HPV VLP相当，并且其针对HPV66的保护效果与单独的HPV66 VLP相当，且针对第二型别的HPV(例如HPV56)的保护效果与单独的第二型别的HPV VLP相当。

此外，在上述置换的基础上，还可以将HPV66 L1蛋白中的另一个或两个特定区段进一步置换为第三型别的HPV(例如HPV53)L1蛋白的相应区段，由此所获得的含有双置换的突变的HPV66 L1蛋白能够诱导机体产生针对HPV66、第二型别的HPV(例如HPV56)和第三型别的HPV(例如HPV53)的高滴度中和抗体，其保护效果与混合的HPV66 VLP、第二型别的HPVVLP和第三型别的HPV VLP相当；并且，其针对HPV66的保护效果与单独的HPV66 VLP相当，针对第二型别的HPV(例如HPV56)的保护效果与单独的第二型别的HPV VLP相当，且针对第三型别的HPV(例如HPV53)的保护效果与单独的第三型别的HPV VLP相当。

因此，在一个方面，本发明提供了一种突变的HPV66 L1蛋白或其变体，其中，所述突变的HPV66 L1蛋白与野生型HPV66 L1蛋白相比，具有下述突变：

(1)N端截短了1-20个氨基酸，例如1-20个氨基酸，例如1-5个、3-8个、5-10个、9-13个、10-15个、12-18个或15-20个氨基酸；和

(2)(a)位于野生型HPV66 L1蛋白第265-283位的氨基酸残基被替换为第二型别的野生型HPV的L1蛋白的相应位置的氨基酸残基；或

(b)位于野生型HPV66 L1蛋白第347-357位的氨基酸残基被替换为第二型别的野生型HPV的L1蛋白的相应位置的氨基酸残基；

并且，所述变体与所述突变的HPV66 L1蛋白相异仅在于一个或几个(例如，1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或11个)氨基酸的置换(优选保守置换)、添加或缺失，且保留了所述突变的HPV66 L1蛋白的功能，即，能够诱导针对至少两个型别的HPV(例如，HPV66和HPV56，或者HPV66、HPV56和HPV53)的中和抗体。

在某些优选的实施方案中，所述突变的HPV66 L1蛋白具有(2)(b)中所定义的突变，并且任选地，还具有下述突变：

(3)位于野生型HPV66 L1蛋白第51-60位的氨基酸残基被替换为第三型别的野生型HPV L1蛋白的相应位置的氨基酸残基；或

(4)位于野生型HPV66 L1蛋白第114-150位的氨基酸残基被替换为第三型别的野生型HPV L1蛋白的相应位置的氨基酸残基；或

(5)位于野生型HPV66 L1蛋白第259-283位的氨基酸残基被替换为第三型别的野生型HPV L1蛋白的相应位置的氨基酸残基。

在某些优选的实施方案中，所述突变的HPV66 L1蛋白具有(2)(b)和(4)中所定义的突变，并且任选地，还具有下述突变：

(6)位于野生型HPV66 L1蛋白第172-181位的氨基酸残基被替换为第三型别的野生型HPV L1蛋白的相应位置的氨基酸残基。

在某些优选的实施方案中，所述突变的HPV66 L1蛋白与野生型HPV66 L1蛋白相比，N端截短了3个、5个、8个、10个、12个、15个、18个氨基酸。

在某些优选的实施方案中，所述突变的HPV66 L1蛋白与野生型HPV66 L1蛋白相比，N端截短了5个氨基酸。

在某些优选的实施方案中，所述第二型别的野生型HPV为HPV56。在某些优选的实施方案中，(2)(a)中所述的相应位置的氨基酸残基为野生型HPV56 L1蛋白第265-283位的氨基酸残基。在某些优选的实施方案中，(2)(b)中所述的相应位置的氨基酸残基为野生型HPV56 L1蛋白第347-357位的氨基酸残基。

在某些优选的实施方案中，所述第三型别的野生型HPV为HPV53。在某些优选的实施方案中，(3)中所述的相应位置的氨基酸残基为野生型HPV53 L1蛋白第51-59位的氨基酸残基。在某些优选的实施方案中，(4)中所述的相应位置的氨基酸残基为野生型HPV53 L1蛋白第113-149位的氨基酸残基。在某些优选的实施方案中，(5)中所述的相应位置的氨基酸残基为野生型HPV53 L1蛋白第258-282位的氨基酸残基。在某些优选的实施方案中，(6)中所述的相应位置的氨基酸残基为野生型HPV53 L1蛋白第171-180位的氨基酸残基

在某些优选的实施方案中，所述野生型HPV66 L1蛋白具有如SEQ ID NO:1或28所示的氨基酸序列。

在某些优选的实施方案中，所述野生型HPV56 L1蛋白具有如SEQ ID NO:2所示的氨基酸序列。

在某些优选的实施方案中，所述野生型HPV53 L1蛋白具有如SEQ ID NO:3或31所示的氨基酸序列。

在某些优选的实施方案中，所述野生型HPV56 L1蛋白第347-357位的氨基酸残基的序列如SEQ ID NO:23所示。

在某些优选的实施方案中，所述野生型HPV53 L1蛋白第51-59位的氨基酸残基的序列如SEQ ID NO:24所示。

在某些优选的实施方案中，所述野生型HPV53 L1蛋白第113-149位的氨基酸残基的序列如SEQ ID NO:25所示。

在某些优选的实施方案中，所述野生型HPV53 L1蛋白第171-180位的氨基酸残基的序列如SEQ ID NO:65所示。

在某些优选的实施方案中，所述野生型HPV53 L1蛋白第258-282位的氨基酸残基的序列如SEQ ID NO:26所示。

在某些优选的实施方案中，所述突变的HPV66 L1蛋白具有选自下列的氨基酸序列：SEQ ID NO:7、8、9、10、11和63。

在另一个方面，本发明提供了一种分离的核酸，其编码如上所述的突变的HPV66L1蛋白或其变体。在另一个方面，本发明提供了一种载体，其包含所述分离的核酸。在某些优选的实施方案中，本发明的分离的核酸具有选自下列的核苷酸序列：SEQ ID NO:18、19、20、21、22和64。

可用于***目的多核苷酸的载体是本领域公知的，包括但不限于克隆载体和表达载体。在一个实施方案中，载体是例如质粒，粘粒，噬菌体等等。

在另一个方面，本发明还涉及包含上述分离的核酸或载体的宿主细胞。此类宿主细胞包括但不限于，原核细胞例如大肠杆菌细胞，以及真核细胞例如酵母细胞，昆虫细胞，植物细胞和动物细胞(如哺乳动物细胞，例如小鼠细胞、人细胞等)。本发明的宿主细胞还可以是细胞系，例如293T细胞。

在另一个方面，本发明涉及一种HPV病毒样颗粒，其中该病毒样颗粒含有本发明的突变的HPV66 L1蛋白或其变体，或者由本发明的突变的HPV66 L1蛋白或其变体组成或形成。

在某些优选的实施方案中，本发明的HPV病毒样颗粒包含突变的HPV66 L1蛋白，其与野生型HPV66 L1蛋白相比，N端截短了1-20个氨基酸，例如1-20个氨基酸，例如1-5个、3-8个、5-10个、9-13个、10-15个、12-18个或15-20个氨基酸，并且位于野生型HPV66 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基，并且位于野生型HPV66 L1蛋白第51-60位的氨基酸残基被替换为野生型HPV53 L1蛋白第51-59位的氨基酸残基。

在某些优选的实施方案中，本发明的HPV病毒样颗粒包含突变的HPV66 L1蛋白，其与野生型HPV66 L1蛋白相比，N端截短了1-20个氨基酸，例如1-20个氨基酸，例如1-5个、3-8个、5-10个、9-13个、10-15个、12-18个或15-20个氨基酸，并且位于野生型HPV66 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基，并且位于野生型HPV66 L1蛋白第114-150位的氨基酸残基被替换为野生型HPV53 L1蛋白第113-149位的氨基酸残基。

在某些优选的实施方案中，本发明的HPV病毒样颗粒包含突变的HPV66 L1蛋白，其与野生型HPV66 L1蛋白相比，N端截短了1-20个氨基酸，例如1-20个氨基酸，例如1-5个、3-8个、5-10个、9-13个、10-15个、12-18个或15-20个氨基酸，并且位于野生型HPV66 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基，并且位于野生型HPV66 L1蛋白第259-283位的氨基酸残基被替换为野生型HPV53 L1蛋白第258-282位的氨基酸残基。

在某些优选的实施方案中，本发明的HPV病毒样颗粒包含突变的HPV66 L1蛋白，其与野生型HPV66 L1蛋白相比，N端截短了1-20个氨基酸，例如1-20个氨基酸，例如1-5个、3-8个、5-10个、9-13个、10-15个、12-18个或15-20个氨基酸，并且位于野生型HPV66 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基，并且位于野生型HPV66 L1蛋白第114-150位的氨基酸残基被替换为野生型HPV53 L1蛋白第113-149位的氨基酸残基，并且位于野生型HPV66 L1蛋白第172-181位的氨基酸残基被替换为野生型HPV53 L1蛋白第171-180位的氨基酸残基。

在一个特别优选的实施方案中，本发明的HPV病毒样颗粒包含突变的HPV66 L1蛋白，其具有SEQ ID NO:7、8、9、10、11和63所示的序列。

在另一个方面，本发明还涉及包含上述突变的HPV66 L1蛋白或其变体，或上述分离的核酸或载体或宿主细胞或HPV病毒样颗粒的组合物。在某些优选的实施方案中，所述组合物包含本发明的突变的HPV66 L1蛋白或其变体。在某些优选的实施方案中，所述组合物包含本发明的HPV病毒样颗粒。

在另一个方面，本发明还涉及一种药物组合物或疫苗，其包含本发明的HPV病毒样颗粒，任选地还包含药学可接受的载体和/或赋形剂。本发明的药物组合物或疫苗可以用于预防HPV感染或由HPV感染所导致的疾病例如***和***。

在某些优选的实施方案中，所述HPV病毒样颗粒以预防HPV感染或由HPV感染导致的疾病的有效量存在。在某些优选的实施方案中，所述HPV感染是一个或多个型别的HPV感染(例如，HPV56感染、HPV66感染和/或HPV53感染)。在某些优选的实施方案中，所述由HPV感染所导致的疾病选自***和***。

本发明的药物组合物或疫苗可通过本领域公知的方法进行施用，例如但不限于通过口服或者注射进行施用。在本发明中，特别优选的施用方式是注射。

在某些优选的实施方案中，本发明的药物组合物或疫苗以单位剂量形式进行施用。例如但不意欲限定本发明，每单位剂量中包含的HPV病毒样颗粒的量为5μg－80μg，优选20μg－40μg。

在另一个方面，本发明涉及一种制备如上所述的突变的HPV66 L1蛋白或其变体的方法，其包括，在宿主细胞中表达所述突变的HPV66 L1蛋白或其变体，然后从所述宿主细胞的培养物中回收所述突变的HPV66 L1蛋白或其变体。

在某些优选的实施方案中，所述宿主细胞为大肠杆菌。

在某些优选的实施方案中，所述方法包括步骤：在大肠杆菌中表达所述突变的HPV66 L1蛋白或其变体，然后从所述大肠杆菌的裂解上清中纯化得到所述突变的HPV66 L1蛋白或其变体。在某些优选的实施方案中，通过色谱法(例如，阳离子交换色谱，羟基磷灰石色谱和/或疏水相互作用色谱)，从所述大肠杆菌的裂解上清中回收所述突变的HPV66 L1蛋白或其变体。

在另一个方面，本发明涉及一种制备疫苗的方法，其包括将本发明的HPV病毒样颗粒与药学可接受的载体和/或赋形剂混合。

在另一个方面，本发明涉及一种预防HPV感染或由HPV感染所导致的疾病的方法，其包括将预防有效量的根据本发明的HPV病毒样颗粒或药物组合物或疫苗施用给受试者。在一个优选的实施方案中，所述HPV感染是一个或多个型别的HPV感染(例如，HPV66感染、HPV56感染和/或HPV53感染)。在另一个优选的实施方案中，所述由HPV感染所导致的疾病包括但不限于，***和***。在另一个优选的实施方案中，所述受试者是哺乳动物，例如人。

在另一个方面，本发明还涉及本发明的突变的HPV66 L1蛋白或其变体或HPV病毒样颗粒在制备药物组合物或疫苗中的用途，所述药物组合物或疫苗用于预防HPV感染或由HPV感染所导致的疾病。在一个优选的实施方案中，所述HPV感染是一个或多个型别的HPV感染(例如，HPV66感染、HPV56感染和/或HPV53感染)。在另一个优选的实施方案中，所述由HPV感染所导致的疾病包括但不限于，***和***。

在另一个方面，本发明还涉及本发明的突变的HPV66 L1蛋白或其变体或HPV病毒样颗粒，其用于预防HPV感染或由HPV感染所导致的疾病。在一个优选的实施方案中，所述HPV感染是一个或多个型别的HPV感染(例如，HPV66感染、HPV56感染和/或HPV53感染)。在另一个优选的实施方案中，所述由HPV感染所导致的疾病包括但不限于，***和***。

本发明中相关术语的说明及解释

在本发明中，除非另有说明，否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且，本文中所用的细胞培养、分子遗传学、核酸化学、免疫学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时，为了更好地理解本发明，下面提供相关术语的定义和解释。

根据本发明，术语“第二型别的野生型HPV”是指，不同于HPV66的另一型别的野生型HPV。在本发明中，第二型别的野生型HPV优选为野生型HPV56。

根据本发明，术语“第三型别的野生型HPV”是指，不同于HPV66，且不同于第二型别的野生型HPV的另一型别的野生型HPV。在本发明中，第三型别的野生型HPV优选为野生型HPV53。

根据本发明，表述“相应位置”是指，当对序列进行最优比对时，即当序列进行比对以获得最高百分数同一性时，进行比较的序列中的等同位置。

根据本发明，术语“野生型HPV66 L1蛋白”是指，天然存在于人***瘤病毒66型(HPV66)中的主要衣壳蛋白L1。野生型HPV66 L1蛋白的序列是本领域公知的，并且可参见各种公共数据库(例如NCBI数据库登录ABO76865.1、Q80961.1、ABO76858.1和ALT54961.1等)。

在本发明中，当提及野生型HPV66 L1蛋白的氨基酸序列时，参照SEQ ID NO：1所示的序列来进行描述。例如，表述“野生型HPV66 L1蛋白的第53-56位氨基酸残基”是指，SEQID NO：1所示的多肽的第53-56位氨基酸残基。然而，本领域技术人员理解，野生型HPV66可包括多种分离株，并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步，本领域技术人员理解，尽管可能存在着序列差异，但是HPV66的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95％，例如高于96％，高于97％，高于98％，或高于99％)，并且具有实质上相同的生物学功能。因此，在本发明中，术语“野生型HPV66 L1蛋白”不仅包括SEQ ID NO:1所示的蛋白，而且应包括各种HPV66分离株的L1蛋白(例如ABO76865.1、Q80961.1、ABO76858.1和ALT54961.1等所示的HPV66 L1蛋白)。并且，当描述野生型HPV66 L1蛋白的序列片段时，其不仅包括SEQ ID NO：1的序列片段，还包括各种HPV66分离株的L1蛋白中的相应序列片段。例如，表述“野生型HPV66 L1蛋白的第53-56位氨基酸残基”包括，SEQ ID NO：1的第53-56位氨基酸残基，以及各种HPV66分离株的L1蛋白中的相应片段。

根据本发明，术语“野生型HPV56 L1蛋白”是指，天然存于人***瘤病毒56型(HPV56)中的主要衣壳蛋白L1。野型HPV56 L1蛋白的序列是本领域公知的，并且可参见各种公共数据库(例如NCBI数据库登录号ALT54892.1、ALT54864.1、P36743.1和ABO76830.1等)。

在本发明中，当提及野生型HPV56 L1蛋白的氨基酸序列时，参照SEQ ID NO：2所示的序列来进行描述。例如，表述“野生型HPV56 L1蛋白的第347-357位氨基酸残基”是指，SEQID NO：2所示的多肽的第347-357位氨基酸残基。然而，本领域技术人员理解，野生型HPV56可包括多种分离株，并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步，本领域技术人员理解，尽管可能存在着序列差异，但是HPV56的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95％，例如高于96％，高于97％，高于98％，或高于99％)，并且具有实质上相同的生物学功能。因此，在本发明中，术语“野生型HPV56 L1蛋白”不仅包括SEQ ID NO:2所示的蛋白，而且应包括各种HPV56分离株的L1蛋白(例如ALT54892.1、ALT54864.1、P36743.1和ABO76830.1等所示的HPV56 L1蛋白)。并且，当描述野生型HPV56 L1蛋白的序列片段时，其不仅包括SEQ ID NO：2的序列片段，还包括各种HPV56分离株的L1蛋白中的相应序列片段。例如，表述“野生型HPV56 L1蛋白的第347-357位氨基酸残基”包括，SEQ ID NO：2的第347-357位氨基酸残基，以及各种HPV56分离株的L1蛋白中的相应片段。

根据本发明，术语“野生型HPV53 L1蛋白”是指，天然存在于人***瘤病毒53型(HPV53)中的主要衣壳蛋白L1。野生型HPV53 L1蛋白的序列是本领域公知的，并且可参见各种公共数据库(例如NCBI数据库登录号NP041848.1、ANY26596.1、ABU54090.1和ALJ32506.1等)。

在本发明中，当提及野生型HPV53 L1蛋白的氨基酸序列时，参照SEQ ID NO：3所示的序列来进行描述。例如，表述“野生型HPV53 L1蛋白的第51-59位氨基酸残基”是指，SEQID NO：3所示的多肽的第51-59位氨基酸残基。然而，本领域技术人员理解，野生型HPV53可包括多种分离株，并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步，本领域技术人员理解，尽管可能存在着序列差异，但是HPV53的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95％，例如高于96％，高于97％，高于98％，或高于99％)，并且具有实质上相同的生物学功能。因此，在本发明中，术语“野生型HPV53 L1蛋白”不仅包括SEQ ID NO:3所示的蛋白，而且应包括各种HPV53分离株的L1蛋白(例如NP041848.1、ANY26596.1、ABU54090.1和ALJ32506.1所示的HPV53 L1蛋白)。并且，当描述野生型HPV53 L1蛋白的序列片段时，其不仅包括SEQ ID NO：3的序列片段，还包括各种HPV53分离株的L1蛋白中的相应序列片段。例如，表述“野生型HPV53 L1蛋白的第51-59位氨基酸残基”包括，SEQ ID NO：3的第51-59位氨基酸残基，以及各种HPV53分离株的L1蛋白中的相应片段。

根据本发明，表述“相应序列片段”或“相应片段”是指，当对序列进行最优比对时，即当序列进行比对以获得最高百分数同一性时，进行比较的序列中位于等同位置的片段。

根据本发明，表述“N端截短了X个氨基酸”是指，用起始密码子(用于起始蛋白质翻译)编码的甲硫氨酸残基置换蛋白质N末端的第1－X位氨基酸残基。例如，N端截短了5个氨基酸的HPV66 L1蛋白是指，用起始密码子编码的甲硫氨酸残基置换野生型HPV66 L1蛋白N末端的第1－5位氨基酸残基所获得的蛋白质。

根据本发明，术语“变体”是指这样的蛋白，其氨基酸序列与本发明的突变的HPV66L1蛋白(如SEQ ID NO：7、8、9、10和11所示的蛋白)的氨基酸序列相比，具有一个或几个(例如，1个、2个、3个、4个、5个、6个、7个、8个或9个)氨基酸的置换(优选保守置换)、添加或缺失，或者具有至少90％，95％，96％，97％，98％，或99％的同一性，并且其保留了所述突变的HPV66 L1蛋白的功能。在本发明中，术语“突变的HPV66 L1蛋白的功能”是指：能够诱导机体产生针对至少两个型别的HPV(例如，HPV66和HPV56，或者HPV66、HPV56和HPV53)的中和抗体。术语“同一性”是对核苷酸序列或氨基酸序列的相似性的量度。通常将序列排列起来，以获得最大限度的匹配。“同一性”本身具有本领域公知的意义并且可用公开的算法(例如BLAST)来计算。

根据本发明，术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如，两个DNA分子的每一个中的某个位置都被腺嘌呤占据，或两个多肽的每一个中的某个位置都被赖氨酸占据)，那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如，如果两个序列的10个位置中有6个匹配，那么这两个序列具有60％的同一性。例如，DNA序列CTGACT和CAGGTT共有50％的同一性(总共6个位置中有3个位置匹配)。通常，在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用，例如，可通过计算机程序例如Align程序(DNAstar,Inc)方便地进行的Needleman等人(1970)J.Mol.Biol.48：443-453的方法来实现。还可使用已整合入ALIGN程序(版本2.0)的E.Meyers和W.Miller(Comput.ApplBiosci.，4:11-17(1988))的算法，使用PAM120权重残基表(weight residue table)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此外，可使用已整合入GCG软件包(可在www.gcg.com上获得)的GAP程序中的Needleman和Wunsch(J MoIBiol.48:444-453(1970))算法，使用Blossum 62矩阵或PAM250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。

如本文中使用的，术语“保守置换”意指不会不利地影响或改变包含氨基酸序列的蛋白/多肽的必要特性的氨基酸置换。例如，可通过本领域内已知的标准技术例如定点诱变和PCR介导的诱变引入保守置换。保守氨基酸置换包括用具有相似侧链的氨基酸残基替代氨基酸残基的置换，例如用在物理学上或功能上与相应的氨基酸残基相似(例如具有相似大小、形状、电荷、化学性质，包括形成共价键或氢键的能力等)的残基进行的置换。已在本领域内定义了具有相似侧链的氨基酸残基的家族。这些家族包括具有碱性侧链(例如，赖氨酸、精氨酸和组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、色氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸)、β分支侧链(例如，苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如，酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。因此，保守置换通常是指，用来自相同侧链家族的另一个氨基酸残基替代相应的氨基酸残基。鉴定氨基酸保守置换的方法在本领域内是熟知的(参见，例如，Brummell等人，Biochem.32:1180-1187(1993)；Kobayashi等人Protein Eng.12(10):879-884(1999)；和Burks等人Proc.Natl Acad.Set USA 94:412-417(1997)，其通过引用并入本文)。

根据本发明，术语“大肠杆菌表达系统”是指由大肠杆菌(菌株)与载体组成的表达系统，其中大肠杆菌(菌株)来源于市场上可得到的菌株，例如但不限于：ER2566，BL21(DE3)，B834(DE3)，BLR(DE3)。

根据本发明，术语“载体(vector)”是指，可将多核苷酸***其中的一种核酸运载工具。当载体能使***的多核苷酸所编码的蛋白获得表达时，载体称为表达载体。载体可以通过转化，转导或者转染导入宿主细胞，使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的，包括但不限于：质粒；噬菌体；柯斯质粒等等。

根据本发明，术语“药学可接受的载体和/或赋形剂”是指在药理学和/或生理学上与受试者和活性成分相容的载体和/或赋形剂，其是本领域公知的(参见例如Remington'sPharmaceutical Sciences.Edited by Gennaro AR,19th ed.Pennsylvania:MackPublishing Company,1995)，并且包括但不限于：pH调节剂，表面活性剂，佐剂，离子强度增强剂。例如，pH调节剂包括但不限于磷酸盐缓冲液；表面活性剂包括但不限于阳离子，阴离子或者非离子型表面活性剂，例如Tween-80；佐剂包括但不限于铝佐剂(例如氢氧化铝)，弗氏佐剂(例如完全弗氏佐剂)；离子强度增强剂包括但不限于氯化钠。

根据本发明，术语“有效量”是指能够有效实现预期目的的量。例如，预防疾病(例如HPV感染)有效量是指，能够有效预防，阻止，或延迟疾病(例如HPV感染)的发生的量。测定这样的有效量在本领域技术人员的能力范围之内。

根据本发明，术语“色谱层析”包括但不限于：离子交换色谱(例如阳离子交换色谱)、疏水相互作用色谱、吸附层析法(例如羟基磷灰石色谱)、凝胶过滤(凝胶排阻)层析、亲和层析法。

根据本发明，术语“裂解上清”是指通过下述步骤所产生的溶液：将宿主细胞(例如大肠杆菌)在裂解液中破碎，然后将含有经破碎的宿主细胞的裂解液中的不溶物去除。各种裂解液是本领域技术人员公知的，包括但不限于Tris缓冲液，磷酸盐缓冲液，HEPES缓冲液，MOPS缓冲液等等。此外，可通过本领域技术人员熟知的各种方法来实现宿主细胞的破碎，包括但不限于匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理等等。去除裂解液中的不溶物的方法也是本领域技术人员公知的，包括但不限于过滤和离心。

发明的有益效果

研究表明，虽然HPV66和其他型别的HPV(例如HPV56和HPV53)之间存在一定的交叉保护，但是这种交叉保护的能力很低，通常低于自身型别的VLP的保护水平的百分之一，甚至低于千分之一。因此，对于接种了HPV66疫苗的受试者来说，其感染其他型别的HPV(例如HPV56和HPV53)的风险依然很高。

本发明提供了一种突变的HPV66 L1蛋白以及由其形成的HPV病毒样颗粒。本发明的HPV病毒样颗粒能够在HPV66和其他型别的HPV(例如HPV56和HPV53)之间提供显著的交叉保护能力。特别地，在同等免疫剂量下，本发明的HPV病毒样颗粒能够诱发机体产生针对至少两个型别的HPV(例如，HPV66和HPV56，或者HPV66、HPV56和HPV53)的高滴度中和抗体，并且其效果与多个型别的HPV VLP的混合物(例如，HPV66 VLP和HPV56 VLP的混合物，或者HPV66 VLP、HPV56 VLP和HPV53 VLP的混合物)相当。因此，本发明的HPV病毒样颗粒能够用于同时预防至少两个型别的HPV(例如，HPV66和HPV56，或者HPV66、HPV56和HPV53)的感染以及与此相关的疾病，具有显著的有利技术效果。这在扩大HPV疫苗的保护范围和降低HPV疫苗的生产成本等方面具有特别显著的优势。

下面将结合附图和实施例对本发明的实施方案进行详细描述，但是本领域技术人员将理解，下列附图和实施例仅用于说明本发明，而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述，本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。

附图说明

图1显示了实施例1中经纯化的突变蛋白的SDS聚丙烯酰胺凝胶电泳的结果。泳道1：蛋白分子量标记；泳道2:HPV66N5(N端截短了5个氨基酸的HPV66 L1蛋白)；泳道3:HPV56N0(全长的HPV56 L1蛋白)；泳道4:H66N5-56T1；泳道5:H66N5-56T2；泳道6:H66N5-56T3；泳道7:H66N5-56T4；泳道8:H66N5-56T5；泳道9:蛋白分子量标记；泳道10:H66N5-56T5；泳道11:HPV53N5(N端截短了5个氨基酸的HPV53L1蛋白)；泳道12:H66N5-56T5-53S1；泳道13:H66N5-56T5-53S2；泳道14:H66N5-56T5-53S4；泳道15:蛋白分子量标记；泳道16:H66N5-56T5-53S2-53S3；结果显示，经过色谱纯化后，H66N5-56T1、H66N5-56T2、H66N5-56T3、H66N5-56T4、H66N5-56T5、H66N5-56T5-53S1、H66N5-56T5-53S2、H66N5-56T5-53S4蛋白的纯度均达到90％左右,H66N5-56T5-53S2-53S3蛋白的纯度75％左右。

图2显示了用HPV L1广谱抗体4B3检测实施例1中制备的突变蛋白H66N5-56T1、H66N5-56T2、H66N5-56T3、H66N5-56T4、H66N5-56T5、H66N5-56T5-53S1、H66N5-56T5-53S2、H66N5-56T5-53S4的蛋白质免疫印迹检测的结果。泳道1:HPV66N5(N端截短了5个氨基酸的HPV66 L1蛋白)；泳道2:HPV56N0(全长的HPV56 L1蛋白)；泳道3:H66N5-56T1；泳道4:H66N5-56T2；泳道5:H66N5-56T3；泳道6:H66N5-56T4；泳道7:H66N5-56T5；泳道8:H66N5-56T5；泳道9:HPV53N5(N端截短了5个氨基酸的HPV53L1蛋白)；泳道10:H66N5-56T5-53S1；泳道11:H66N5-56T5-53S2；泳道12:H66N5-56T5-53S4结果显示，突变蛋白H66N5-56T1、H66N5-56T2、H66N5-56T3、H66N5-56T4、H66N5-56T5、H66N5-56T5-53S1、H66N5-56T5-53S2、H66N5-56T5-53S4均能够被广谱抗体4B3特异性识别。

图3显示了包含蛋白H66N5-56T1、H66N5-56T2、H66N5-56T3、H66N5-56T4、H66N5-56T5、HPV56N0和HPV66N5(N端截短了5个氨基酸的HPV66L1蛋白)的样品的分子筛层析分析的结果。结果显示，包含蛋白H66N5-56T1、H66N5-56T2、H66N5-56T3、H66N5-56T4、H66N5-56T5的样品最先出现的蛋白峰均在13-14min左右，与HPV56N0和HPV66N5 VLP相当。这表明这些蛋白均可组装成VLP。

图4显示了包含蛋白H66N5-56T5、HPV53N5、H66N5-56T5-53S1、H66N5-56T5-53S2、H66N5-56T5-53S4、H66N5-56T5-53S2-53S3的样品的分子筛层析分析的结果。结果显示，包含蛋白H66N5-56T5和H66N5-56T5-53S4的样品最先出现的蛋白峰在13-14min左右，与HPV53N5相当。而H66N5-56T5-53S1和H66N5-56T5-53S2的峰形不对称，且H66N5-56T5-53S1的出峰时间在15min左右，表明H66N5-56T5-53S1形成的VLP颗粒直径较小，H66N5-56T5-53S2和H66N5-56T5-53S2-53S3形成的颗粒不均一。

图5显示了H66N5-56T1 VLP、H66N5-56T2 VLP、H66N5-56T3VLP、H66N5-56T4 VLP、H66N5-56T5 VLP、HPV56N0 VLP和HPV66N5 VLP的沉降速率分析的结果。结果显示，H66N5-56T1 VLP、H66N5-56T2 VLP、H66N5-56T3 VLP、H66N5-56T4 VLP、H66N5-56T5VLP的沉降系数分别为126S、125S、126S、127S和128S，而HPV56N0VLP和HPV66N5 VLP的沉降系数分别为134S和141S。这表明，H66N5-56T1 VLP、H66N5-56T2 VLP、H66N5-56T3 VLP、H66N5-56T4 VLP和H66N5-56T5 VLP能够组装成大小、形态与野生型VLP相似的病毒样颗粒。

图6显示了H66N5-56T5 VLP、HPV53N5 VLP、H66N5-56T5-53S1VLP、H66N5-56T5-53S2 VLP、H66N5-56T5-53S4 VLP和H66N5-56T5-53S2-53S3的沉降速率分析的结果。结果显示，H66N5-56T5 VLP、HPV53N5 VLP、H66N5-56T5-53S1 VLP、H66N5-56T5-53S2 VLP和H66N5-56T5-53S4 VLP的沉降系数分别为128S、130S、93S、106S和116S，H66N5-56T5-53S2-53S3VLP的沉降系数为53S和107S两个组分。这表明，H66N5-56T5-53S4 VLP能够组装成大小、形态与野生型VLP相似的病毒样颗粒；而H66N5-56T5-53S1、H66N5-56T5-53S2VLP和H66N5-56T5-53S2-53S3VLP形成的病毒样颗粒直径较小，且H66N5-56T5-53S2和H66N5-56T5-53S2-53S3形成的颗粒不均一。

图7A-图7L显示了各种VLP样品的透射电镜观察结果(放大倍数为100,000倍，Bar＝0.1μm)。图7A，由HPV66N5组装的VLP；图7B，由HPV56N0组装的VLP；图7C，由H66N5-56T1组装的VLP；图7D，由H66N5-56T2形成的VLP；图7E，由H66N5-56T3组装的VLP；图7F，由H66N5-56T4组装的VLP；图7G，由H66N5-56T5组装的VLP；图7H，由HPV53N5组装的VLP；图7I，由H66N5-56T5-53S1组装的VLP，颗粒直径较小；图7J，由H66N5-56T5-53S2组装的VLP；图7K，由H66N5-56T5-53S4组装的VLP；图7L，由H66N5-56T5-53S2-53S3组装的VLP。结果显示，H66N5-56T1、H66N5-56T2、H66N5-56T3、H66N5-56T4、H66N5-56T5、H66N5-56T5-53S2、H66N5-56T5-53S4、H66N5-56T5-53S2-53S3与HPV56N0、HPV66N5和HPV53N5类似，都能够组装成半径为25nm左右的VLP，但H66N5-56T5-53S2和H66N5-56T5-53S2-53S3形成的颗粒中也含有直径20nm左右的小颗粒；而H66N5-56T5-53S1能形成半径为10-20nm左右的颗粒不规则的VLP。

图8A-图8C显示了实验组H66N5-56T1 VLP、H66N5-56T2 VLP、H66N5-56T3 VLP、H66N5-56T4 VLP、H66N5-56T5 VLP、和对照组HPV56N0 VLP和HPV66N5 VLP以及混合的HPV56/HPV66 VLP在小鼠体内的免疫保护性的评价结果。结果显示，H66N5-56T4 VLP、H66N5-56T5 VLP各自可在小鼠体内诱导高滴度的针对HPV66和HPV56的中和抗体；并且其针对HPV66的保护效果与单独的HPV66N5 VLP相当，且显著高于单独的HPV56N0VLP；并且其针对HPV56的保护效果与单独的HPV56N0 VLP相当，且显著高于单独的HPV66N5 VLP。这表明，H66N5-56T4 VLP、H66N5-56T5 VLP可用作预防HPV66感染和HPV56感染的有效疫苗，可用于代替含有HPV66 VLP和HPV56VLP的混合疫苗。

图9A-图9B显示了实验组H66N5-56T5-53S1 VLP、H66N5-56T5-53S2 VLP和H66N5-56T5-53S4 VLP以及对照组HPV66N5 VLP、HPV56N0 VLP、HPV53N5 VLP和混合的HPV66/56/53VLP在小鼠体内的免疫保护性的评价结果。结果显示，H66N5-56T5-53S1 VLP、H66N5-56T5-53S2 VLP和H66N5-56T5-53S4 VLP可在小鼠体内诱导高滴度的针对HPV66、HPV56和HPV53的中和抗体；并且其针对HPV66的保护效果与单独的HPV66N5 VLP、混合的HPV66/56/53 VLP相当，且显著高于单独的HPV56N0VLP和单独的HPV53N5VLP；并且其针对HPV56的保护效果与单独的HPV56N0 VLP、混合的HPV66/56/53 VLP相当，且显著高于单独的HPV66N5 VLP和单独的HPV53N5 VLP；并且其针对HPV53的保护效果与单独的HPV53N5 VLP、混合的HPV66/56/53VLP相当，且显著高于单独的HPV66N5 VLP和单独的HPV56N0 VLP。这表明，H66N5-56T5-53S1VLP、H66N5-56T5-53S2 VLP和H66N5-56T5-53S4VLP可用作预防HPV66感染、HPV56感染和HPV53感染的有效疫苗，可用于代替含有HPV66VLP、HPV56 VLP和HPV53 VLP的混合疫苗。

图10显示了实验组H66N5-56T5-53S2-53S3 VLP和对照组HPV66N5VLP、HPV56N0VLP、HPV53N5 VLP以及混合的HPV66/56/53 VLP在小鼠体内的免疫保护性的评价结果。结果显示，H66N5-56T5-53S2-53S3VLP可在小鼠体内诱导高滴度的针对HPV66、HPV56和HPV53的中和抗体；并且其针对HPV66的保护效果与单独的HPV66N5 VLP、混合的HPV66/56/53 VLP相当，且显著高于单独的HPV56N0VLP和单独的HPV53N5VLP；其针对HPV56的保护效果稍弱于单独的HPV56N0 VLP、单独的HPV66N5 VLP、混合的HPV66/56/53 VLP，但显著高于单独的HPV53N5 VLP；其针对HPV53的保护效果稍弱于单独的HPV53N5 VLP、混合的HPV66/56/53VLP，但显著高于单独的HPV66N5 VLP和单独的HPV56N0 VLP。这表明，H66N5-56T5-53S2-53S3 VLP可用作预防HPV66感染、HPV56感染和HPV53感染的有效疫苗，可用于代替含有HPV66VLP、HPV56 VLP和HPV53 VLP的混合疫苗。

序列信息

本发明涉及的部分序列的信息提供于下面的表1中。

表1：序列的描述

序列1(SEQ ID NO:1)：

MAMWRPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列2(SEQ ID NO:2)：

MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.

序列3(SEQ ID NO:3)：

MAVWRPSDSKVYLPPTPVSKVITTDAYVKRTTIFYHAGSSRLLTVGHPYYPISKSGKADIPKVSAFQYRVFRVRLPDPNKFGLPDTNIFNPDQERLVWACVGLEIGRGQPLGVGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDPKQTQLCIIGCAPAIGEHWTKGTACRSTPTTAGDCPPLELINSPIEDGDMVDTGFGALNFKALQESKSDVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFTRHFFNRAGVIGEEIPNDLYIKGSNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWNNQLFVTVVDTTRNTNMTLSATTQSMSTYNSKQIKQYVRHAEEYELQFVFQLCKISLSAEVMAYLHTMNSTLLEDWNIGLSPPVATSLEDKYRYVKSAAITCQKDQPPPEKQDPLSKYKFWEVNLQNSFSADLDQFPLGRKFLMQVGVRTKPPVSSKKRSASTTSTSAPSSKRKRK.

序列4(SEQ ID NO:4)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列5(SEQ ID NO:5)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列6(SEQ ID NO:6)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTQVTTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列7(SEQ ID NO:7)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列8(SEQ ID NO:8)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列9(SEQ ID NO:9)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYPISKSGKADIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列10(SEQ ID NO:10)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGVGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDPKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列11(SEQ ID NO:11)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHFFNRAGVIGEEIPNDLYIKGSNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列12(SEQ ID NO:12)：

ATGGCCATGTGGAGGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列13(SEQ ID NO:13)：

ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA

序列14(SEQ ID NO:14)：

ATGGCCGTGTGGAGGCCCAGCGACAGCAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGATCACCACCGACGCCTACGTGAAGAGGACCACCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGACCGTGGGCCACCCCTACTACCCCATCAGCAAGAGCGGCAAGGCCGACATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGAGGCTGCCCGACCCCAACAAGTTCGGCCTGCCCGACACCAACATCTTCAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGATCGGCAGGGGCCAGCCCCTGGGCGTGGGCGTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGAGCAGCAGCATCGCCATCCAGGACACCGCCCCCGACAGCAGGGACAACGTGAGCGTGGACCCCAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCGCCATCGGCGAGCACTGGACCAAGGGCACCGCCTGCAGGAGCACCCCCACCACCGCCGGCGACTGCCCCCCCCTGGAGCTGATCAACAGCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCCTGAACTTCAAGGCCCTGCAGGAGAGCAAGAGCGACGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCACCAGGCACTTCTTCAACAGGGCCGGCGTGATCGGCGAGGAGATCCCCAACGACCTGTACATCAAGGGCAGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCGTGACCGTGGTGGACACCACCAGGAACACCAACATGACCCTGAGCGCCACCACCCAGAGCATGAGCACCTACAACAGCAAGCAGATCAAGCAGTACGTGAGGCACGCCGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCAGCCTGAGCGCCGAGGTGATGGCCTACCTGCACACCATGAACAGCACCCTGCTGGAGGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACGTGAAGAGCGCCGCCATCACCTGCCAGAAGGACCAGCCCCCCCCCGAGAAGCAGGACCCCCTGAGCAAGTACAAGTTCTGGGAGGTGAACCTGCAGAACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGGTGGGCGTGAGGACCAAGCCCCCCGTGAGCAGCAAGAAGAGGAGCGCCAGCACCACCAGCACCAGCGCCCCCAGCAGCAAGAGGAAGAGGAAGTAA

序列15(SEQ ID NO:15)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列16(SEQ ID NO:16)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列17(SEQ ID NO:17)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列18(SEQ ID NO:18)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列19(SEQ ID NO:19)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列20(SEQ ID NO:20)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACCCCATCAGCAAGAGCGGCAAGGCCGACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列21(SEQ ID NO:21)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCGTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGAGCAGCAGCATCGCCATCCAGGACACCGCCCCCGACAGCAGGGACAACGTGAGCGTGGACCCCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列22(SEQ ID NO:22)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTTCTTCAACAGGGCCGGCGTGATCGGCGAGGAGATCCCCAACGACCTGTACATCAAGGGCAGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列23(SEQ ID NO:23)：

TEQLSKYDARK

序列24(SEQ ID NO:24)：

PISKSGKAD

序列25(SEQ ID NO:25)：

VGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDP

序列26(SEQ ID NO:26)：

FFNRAGVIGEEIPNDLYIKGSNGRD

序列27SEQ ID NO:27)：

TKDN

序列28(SEQ ID NO:28)：

MPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK

序列29(SEQ ID NO:29)：

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列30(SEQ ID NO:30)：

QVT

序列31(SEQ ID NO:31)：

MPSDSKVYLPPTPVSKVITTDAYVKRTTIFYHAGSSRLLTVGHPYYPISKSGKADIPKVSAFQYRVFRVRLPDPNKFGLPDTNIFNPDQERLVWACVGLEIGRGQPLGVGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDPKQTQLCIIGCAPAIGEHWTKGTACRSTPTTAGDCPPLELINSPIEDGDMVDTGFGALNFKALQESKSDVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFTRHFFNRAGVIGEEIPNDLYIKGSNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWNNQLFVTVVDTTRNTNMTLSATTQSMSTYNSKQIKQYVRHAEEYELQFVFQLCKISLSAEVMAYLHTMNSTLLEDWNIGLSPPVATSLEDKYRYVKSAAITCQKDQPPPEKQDPLSKYKFWEVNLQNSFSADLDQFPLGRKFLMQVGVRTKPPVSSKKRSASTTSTSAPSSKRKRK

序列32(SEQ ID NO:32)：

ATGCCCAGCGACAGCAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGATCACCACCGACGCCTACGTGAAGAGGACCACCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGACCGTGGGCCACCCCTACTACCCCATCAGCAAGAGCGGCAAGGCCGACATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGAGGCTGCCCGACCCCAACAAGTTCGGCCTGCCCGACACCAACATCTTCAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGATCGGCAGGGGCCAGCCCCTGGGCGTGGGCGTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGAGCAGCAGCATCGCCATCCAGGACACCGCCCCCGACAGCAGGGACAACGTGAGCGTGGACCCCAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCGCCATCGGCGAGCACTGGACCAAGGGCACCGCCTGCAGGAGCACCCCCACCACCGCCGGCGACTGCCCCCCCCTGGAGCTGATCAACAGCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCCTGAACTTCAAGGCCCTGCAGGAGAGCAAGAGCGACGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCACCAGGCACTTCTTCAACAGGGCCGGCGTGATCGGCGAGGAGATCCCCAACGACCTGTACATCAAGGGCAGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCGTGACCGTGGTGGACACCACCAGGAACACCAACATGACCCTGAGCGCCACCACCCAGAGCATGAGCACCTACAACAGCAAGCAGATCAAGCAGTACGTGAGGCACGCCGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCAGCCTGAGCGCCGAGGTGATGGCCTACCTGCACACCATGAACAGCACCCTGCTGGAGGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACGTGAAGAGCGCCGCCATCACCTGCCAGAAGGACCAGCCCCCCCCCGAGAAGCAGGACCCCCTGAGCAAGTACAAGTTCTGGGAGGTGAACCTGCAGAACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGGTGGGCGTGAGGACCAAGCCCCCCGTGAGCAGCAAGAAGAGGAGCGCCAGCACCACCAGCACCAGCGCCCCCAGCAGCAAGAGGAAGAGGAAGTAA

序列33(SEQ ID NO:33)：

SSNLANNNVIEDSRDNISVDG

序列34(SEQ ID NO:34)：

KVGETIPAELYLKGSNGRE

序列63(SEQ ID NO:63)：

MAMWRPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGVGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDPKQTQLCIVGCAPALGEHWTKGTACRSTPTTAGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAT INQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列64(SEQ ID NO:64)：

ATGGCCATGTGGAGGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCGTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGAGCAGCAGCATCGCCATCCAGGACACCGCCCCCGACAGCAGGGACAACGTGAGCGTGGACCCCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCACCGCCTGCAGGAGCACCCCCACCACCGCCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列65(SEQ ID NO:65)：

TACRSTPTTA

具体实施方式

现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。

除非特别指明，本发明中所使用的分子生物学实验方法和免疫检测法，基本上参照J.Sambrook等人，分子克隆：实验室手册，第2版，冷泉港实验室出版社，1989，以及F.M.Ausubel等人，精编分子生物学实验指南，第3版，John Wiley&Sons，Inc.，1995中所述的方法进行；限制性内切酶的使用依照产品制造商推荐的条件。本领域技术人员知晓，实施例以举例方式描述本发明，且不意欲限制本发明所要求保护的范围。

实施例1.突变的HPV66 L1蛋白的表达与纯化

表达载体的构建

采用多点突变PCR反应来构建编码含有来源于HPV56 L1蛋白的区段的突变的HPV66 L1蛋白的表达载体，其中，所使用的初始模板为pTO-T7-HPV66N5C质粒(其编码N端截短了5个氨基酸的HPV66 L1蛋白；在表2中简写为66L1N5)。用于各个PCR反应的模板和引物见表2，并且，PCR反应的扩增条件设为：94℃变性2分钟；30个循环的(98℃变性10秒，指定温度退火一定时间，58℃延伸6分30秒)；最后68℃延伸10分钟。退火温度和时间列于表2。所使用的PCR引物的具体序列列于表3。

向扩增产物(50μL)中加入2μL DpnI限制性内切酶(Fermentas(MBI)，货号：FD1704，2500U/管)，并在37℃温育60min。取10μL酶切产物，用于转化40μL以氯化钙法制备的感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)。将经转化的大肠杆菌涂布于含卡那霉素(终浓度25μg/mL，下同)的固体LB培养基(LB培养基成分：10g/L蛋白胨，5g/L酵母粉，10g/L氯化钠，下同)，并在37℃静置培养10-12小时，直至单菌落清晰可辨。挑取单菌落至含有4mL液体LB培养基(含卡那霉素)的试管中，并在37℃ 220转/分钟下振荡培养10小时。随后，取1mL菌液于-70℃保存。从大肠杆菌中提取质粒，并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示，所构建的各个质粒(表达载体)中***的目的片段的核苷酸序列为SEQ ID NO：15、17，其编码的氨基酸序列为SEQ ID NO：4、6(所对应的蛋白分别命名为H66N5-56T1和H66N5-56T3)。

突变蛋白H66N5-56T1与HPV66N5的区别在于：位于野生型HPV66L1蛋白第53-56位的氨基酸残基被替换为野生型HPV56 L1蛋白第53-56位的氨基酸残基。突变蛋白H66N5-56T3与HPV66N5的区别在于：位于野生型HPV66 L1蛋白第178-180位的氨基酸残基被替换为野生型HPV56L1蛋白第178-180位的氨基酸残基。

采用Gibson装配(Gibson DG,Young L,Chuang RY,Venter JC,Hutchison CA,Smith HO.Enzymatic assembly of DNA molecules up to several hundredkilobases.Nat Methods.2009；6:343-5.doi:10.1038/nmeth.1318)来构建编码其他的突变HPV66 L1蛋白的表达载体，所述突变的HPV66 L1蛋白含有来源于HPV56 L1的特定区段和/或来源于HPV53 L1的特定区段。简言之，首先采用PCR反应来获得一个包含突变的短片段和一个不包含突变的长片段，然后再采用Gibson装配体系将这两个片段连接成环。所使用的初始模板包括pTO-T7-HPV66L1N5质粒(其编码N端截短了5个氨基酸的HPV66 L1蛋白；在表2中简写为66L1N5)及pTO-T7-HPV53N0质粒(其编码全长的HPV56 L1蛋白；在表2中简写为56L1N0)、pTO-T7-H66N5-56T5质粒(其编码突变蛋白H66N5-56T5；在表2中简写为H66N5-56T5)和pTO-T7-HPV53N5质粒(其编码N端截短了5个氨基酸的HPV53 L1蛋白；在表2中简写为53L1N5)。用于各个PCR反应的模板和引物见表2，并且，用于扩增短片段的PCR反应的扩增条件设为：94℃变性10分钟；25个循环的(94℃变性50秒，指定温度退火一定时间，72℃延伸1分钟)；最后72℃延伸10分钟。用于扩增长片段的PCR反应的扩增条件设为：94℃变性10分钟；25个循环的(94℃变性50秒，指定温度退火一定时间，72℃延伸7分30秒)；最后72℃延伸10分钟。所使用的PCR引物的具体序列列于表3。将扩增产物进行电泳，随后使用DNA回收试剂盒(BEYOTIME(碧云天)，货号：D0033)回收目的片段并测定其浓度。按2:1的摩尔比将扩增得到的短片段和长片段混合(总体积3μL)，随后添加3μL 2X Gibson装配预混试剂(2XGibson Assembly Master Mix，购自NEB，包含T5exonuclease，Phusion DNA polymerase，Taq DNA ligase)，并在50℃反应1小时。

用装配后的产物(6μL)转化40μL以氯化钙法制备的感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)。将经转化的大肠杆菌涂布于含卡那霉素的固体LB培养基，并在37℃静置培养10-12小时，直至单菌落清晰可辨。挑取单菌落至含有4mL液体LB培养基(含卡那霉素)的试管中，并在37℃ 220转/分钟下振荡培养10小时。随后，取1mL菌液于-70℃保存。从大肠杆菌中提取质粒，并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示，所构建的各个质粒(表达载体)中***的目的片段的核苷酸序列分别为SEQ ID NO：16、18、19、20、21、22，其编码的氨基酸序列为SEQ ID NO：5、7、8、9、10、11(所对应的蛋白分别命名为H66N5-56T2，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S1，H66N5-56T5-53S2，H66N5-56T5-53S4)。

H66N5-56T5-53S2-53S3基因由上海生工生物公司合成，将合成后含有HPV66N5-56T5-53S2-53S3基因的质粒用NdeI和SalI进行酶切(37℃，12小时)，酶切后将目的基因用DNA回收试剂盒(BEYOTIME(碧云天)，货号：D0033)进行回收，将酶切后的H66N5-56T5-53S2-53S3基因与pTO-T7载体在16℃下连接12小时，随后转化感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)细菌。将经转化的大肠杆菌涂布于含卡那霉素的固体LB培养基，并37℃静置培养10-12小时，直至单菌落清晰可辨。挑取单菌落至含4mL液体LB培养基(含卡那霉素)的试管，在37℃220转/分钟下振荡培养10小时，从中取1mL菌液于-70℃保存。从大肠杆菌中提取质粒，并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示，所构建的各个质粒(表达载体)中***的目的片段的核苷酸序列分别为SEQ ID NO：64，其编码的氨基酸序列为SEQ ID NO：63(所对应的蛋白命名为H66N5-56T5-53S2-53S3)。

突变蛋白H66N5-56T2与HPV66N5的区别在于：位于野生型HPV66L1蛋白第130-150位的氨基酸残基被替换为野生型HPV56 L1蛋白第130-150位的氨基酸残基。突变蛋白H66N5-56T4与HPV66N5的区别在于：位于野生型HPV66 L1蛋白第265-283位的氨基酸残基被替换为野生型HPV56 L1蛋白第265-283位的氨基酸残基。突变蛋白H66N5-56T5与HPV66N5的区别在于：位于野生型HPV66 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基。

突变蛋白H66N5-56T5-53S1与HPV66N5的区别在于：位于野生型HPV66 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基，并且位于野生型HPV66 L1蛋白第51-60位的氨基酸残基被替换为野生型HPV53 L1蛋白的第51-59位的氨基酸残基。突变蛋白H66N5-56T5-53S2与HPV66N5的区别在于：位于野生型HPV39L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基，并且位于野生型HPV66 L1蛋白第114-150位的氨基酸残基被替换为野生型HPV53 L1蛋白的第113-149位的氨基酸残基。突变蛋白H66N5-56T5-53S4与HPV66N5的区别在于：位于野生型HPV66L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基，并且位于野生型HPV66 L1蛋白第259-283位的氨基酸残基被替换为野生型HPV53L1蛋白的第258-282位的氨基酸残基。

突变蛋白H66N5-56T5-53S2-53S3与HPV66N5的区别在于：位于野生型HPV66 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV56 L1蛋白第347-357位的氨基酸残基，并且位于野生型HPV66 L1蛋白第114-150位的氨基酸残基被替换为野生型HPV53 L1蛋白的第113-149位的氨基酸残基,并且位于野生型HPV66 L1蛋白第172-181位的氨基酸残基被替换为野生型HPV53 L1蛋白的第171-180位的氨基酸残基。

表2.用于构建表达载体的PCR反应的模板和引物

表3：所使用的引物的具体序列(SEQ ID NO:35-62)

突变蛋白的大量表达

从-70℃冰箱中取出携带重组质粒pTO-T7-H66N5-56T1、pTO-T7-H66N5-56T2、pTO-T7-H66N5-56T3、pTO-T7-H66N5-56T4、pTO-T7-H66N5-56T5、pTO-T7-H66N5-56T5-53S1、pTO-T7-H66N5-56T5-53S2、pTO-T7-H66N5-56T5-53S4、pTO-T7-H66N5-56T5-53S2-53S3的大肠杆菌菌液，分别接种入100ml含卡那霉素的LB液体培养基中，在200rpm，37℃下培养大约8小时；然后分别转接入500ml含卡那霉素的LB培养基中(接入1ml菌液)，并继续进行培养。当细菌浓度达到OD₆₀₀为0.6左右时，将培养温度降至25℃，并向各培养瓶中加入500μL IPTG，继续培养8小时。培养结束后，离心收集菌体。获得表达了H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S1，H66N5-56T5-53S2，H66N5-56T5-53S4，H66N5-56T5-53S2-53S3蛋白的菌体。

表达突变蛋白的菌体破碎

按1g菌体对应10mL裂解液(20mM Tris缓冲液，pH7.2，300mM NaCl)的比例重悬上述得到的菌体。用超声波仪破碎菌体30min。以13500rpm(30000g)离心含有经破碎的菌体的裂解液15min，留取上清(即，菌体破碎上清)。

突变蛋白的色谱纯化

仪器系统：GE Healthcare公司(原Amershan Pharmacia公司)生产的AKTAexplorer 100型制备型液相色谱系统。

层析介质：SP Sepharose 4Fast Flow(GE Healthcare公司)、CHT-Ⅱ(购自Bio－RAD)和Butyl Sepharose 4Fast Flow(GE Healthcare公司)。

缓冲液：缓冲液A(20mM磷酸盐缓冲液，pH8.0，20mM DTT)；以及缓冲液B(20mM磷酸盐缓冲液，pH8.0，20mM DTT，2M NaCl)。下面的洗脱程序中用到的含有不同浓度NaCl的缓冲液是由缓冲液A和B按比例混合配置而成。

样品：如上获得的含有H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S1，H66N5-56T5-53S2，H66N5-56T5-53S4，H66N5-56T5-53S2-53S3的菌体破碎上清。

洗脱程序为：

(1)用SP Sepharose 4 Fast Flow对菌体破碎上清进行阳离子交换纯化：将样品上柱，然后用含有400mM NaCl的缓冲液(80％缓冲液A+20％缓冲液B)洗脱杂蛋白，然后用含有800mM NaCl的缓冲液(60％缓冲液A+40％缓冲液B)洗脱目的蛋白，并收集由含有800mMNaCl的缓冲液洗脱的级分；

(2)用CHTⅡ(羟基磷灰石色谱)对前一步获得的洗脱级分进行色谱纯化：对前一步骤获得的洗脱级分进行稀释，以使得NaCl的浓度降至0.5M；将样品上柱，然后用含有500mMNaCl的缓冲液(75％缓冲液A+25％缓冲液B)洗脱杂蛋白，然后用含有1000mM NaCl的缓冲液(50％缓冲液A+50％缓冲液B)洗脱目的蛋白，并收集由含有1000mM NaCl的缓冲液洗脱的级分；

(3)用HIC(疏水相互作用色谱)对前一步骤获得的洗脱级分进行色谱纯化：将样品上柱，然后用含有1000mM NaCl的缓冲液洗脱杂蛋白，然后用含有200mM NaCl的缓冲液(90％缓冲液A+10％缓冲液B)洗脱目的蛋白，并收集由含有200mM NaCl的缓冲液洗脱的级分。

取步骤(3)获得的洗脱级分150μL，加入30μL 6X Loading Buffer(1L中含有1M TB6.8 300ml、100％甘油600ml、SDS 120g、溴酚蓝6g、β-巯基乙醇50ml)中，混匀，并于80℃水浴中温育10min。然后取10μl样品于10％SDS-聚丙烯酰胺凝胶中以120V电压电泳120min；然后以考马斯亮兰染色显示电泳条带。电泳结果示于图1中。结果显示，经过上述纯化步骤后，H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S1，H66N5-56T5-53S2，H66N5-56T5-53S4蛋白的纯度均约90％，H66N5-56T5-53S2-53S3蛋白的纯度为75％左右。

通过类似的方法，使用大肠杆菌和pTO-T7-HPV66N5质粒制备和纯化了HPV66N5蛋白；使用大肠杆菌和pTO-T7-HPV56L1N0质粒制备和纯化了HPV56N0蛋白；使用大肠杆菌和pTO-T7-HPV53N5质粒制备和纯化了HPV53N5蛋白。

突变蛋白的免疫印迹实验

按上述方法对经纯化的H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S1，H66N5-56T5-53S2，H66N5-56T5-53S4蛋白进行电泳。电泳结束后，使用抗HPV L1蛋白的广谱抗体4B3进行Western Blot检测，结果示于图2中。结果显示，突变蛋白H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S1，H66N5-56T5-53S2，H66N5-56T5-53S4均能够被广谱抗体4B3特异性识别。

实施例2：HPV病毒样颗粒的组装与颗粒形态学检测

HPV病毒样颗粒的组装

取一定体积(约2ml)的蛋白H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S1，H66N5-56T5-53S2，H66N5-56T5-53S4，H66N5-56T5-53S2-53S3分别依次透析至(1)2L储存缓冲液(20mM磷酸钠缓冲液pH 6.5，0.5M NaCl)；(2)2L复性缓冲液(50mM磷酸钠缓冲液pH 6.0，2mM CaCl₂，2mM MgCl₂，0.5M NaCl)；和(3)20mM磷酸钠缓冲液pH 7.0，0.5M NaCl中。在三种缓冲液中各自进行透析12h。

通过类似的方法，将HPV66N5、HPV56N0和HPV53N5蛋白分别组装为HPV66N5 VLP、HPV56N0 VLP和HPV53N5 VLP。

分子筛层析分析

用美国安捷伦公司的1120 Compact LC高效液相色谱系统对经透析的样品进行分子筛层析分析，其中，所使用的分析柱为TSK Gel PW5000xl7.8x300mm。分析结果如图3和图4所示。结果显示，包含蛋白H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S4的样品最先出现的蛋白峰均在13-14min左右，与HPV66N5 VLP、HPV56N0 VLP以及HPV53N5 VLP相当，这表明，这些蛋白均可组装成VLP；H66N5-56T5-53S2-53S3 VLP、H66N5-56T5-53S1和H66N5-56T5-53S2的峰形不对称，且H66N5-56T5-53S1的出峰时间在15min左右，表明H66N5-56T5-53S1形成的VLP颗粒直径较小，H66N5-56T5-53S2和H66N5-56T5-53S2-53S3形成的颗粒不均一。

沉降速率分析

沉降速率分析所使用的仪器为Beckman XL-A分析型超速离心机，其配有光学检测系统及An-50Ti和An-60Ti转头。采用沉降速率法分析H66N5-56T1 VLP、H66N5-56T2 VLP、H66N5-56T3 VLP、H66N5-56T4VLP、H66N5-56T5 VLP、H66N5-56T5-53S1 VLP、H66N5-56T5-53S2VLP、H66N5-56T5-53S4 VLP和H66N5-56T5-53S2-53S3 VLPHPV56N0VLP、HPV66N5 VLP和HPV53N5 VLP的沉降系数。结果如图5和图6所示：结果显示，H66N5-56T1 VLP、H66N5-56T2VLP、H66N5-56T3VLP、H66N5-56T4 VLP、H66N5-56T5 VLP、H66N5-56T5-53S1 VLP、H66N5-56T5-53S2 VLP和H66N5-56T5-53S4 VLP的沉降系数分别为126S、125S、126S、127S、128S、93S、106S和116S，H66N5-56T5-53S2-53S3VLP的沉降系数为53S和107S，HPV56N0 VLP、HPV66N5 VLP和HPV53N5 VLP的沉降系数分别为134S和141S和130S。这表明，H66N5-56T1VLP、H66N5-56T2 VLP、H66N5-56T3 VLP、H66N5-56T4 VLP、H66N5-56T5 VLP和H66N5-56T5-53S4 VLP各自能够组装成大小、形态与野生型VLP(HPV56N0 VLP、HPV66N5 VLP和HPV53N5VLP)相似的病毒样颗粒；而H66N5-56T5-53S1、H66N5-56T5-53S2 VLP和H66N5-56T5-53S2-53S3 VLP的直径较小，且H66N5-56T5-53S2 VLP和H66N5-56T5-53S2-53S3 VLP的颗粒大小不均一。

病毒样颗粒的形态学检测

取100μL含有VLP的样品进行透射电镜观察。所使用的仪器为日本电子公司生产的100kV透射电镜，放大倍数为100,000倍。简言之，取13.5μL样品，用2％磷钨酸pH7.0进行负染，并固定于喷碳的铜网上，然后进行透射电镜观察。观察结果如图7A-7L所示。结果显示，H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S2，H66N5-56T5-53S4，H66N5-56T5-53S2-53S3均可组装成病毒样颗粒。此外，结果还显示，H66N5-56T1，H66N5-56T2，H66N5-56T3，H66N5-56T4，H66N5-56T5，H66N5-56T5-53S4所组装形成的颗粒的半径均在25nm左右，大小均一，这表明，这些突变蛋白与HPV66、HPV56和HPV53的L1蛋白类似，能够形成大小均一的VLP。H66N5-56T5-53S2和H66N5-56T5-53S2-53S3也能够形成半径在25nm左右病毒样颗粒，但其中含有直径为20nm左右的小颗粒；而H66N5-56T5-53S1能形成半径为10-20nm左右的颗粒不规则的VLP。

实施例3：用病毒样颗粒免疫后小鼠血清中的中和抗体滴度的评价1

本实验中，所用病毒样颗粒为：H66N5-56T1 VLP，H66N5-56T2VLP，H66N5-56T3VLP，H66N5-56T4 VLP，H66N5-56T5 VLP。

在本实验中，免疫方案如表4所示。将所有小鼠(6周龄BalB/c雌性小鼠)分为3个组：铝佐剂组1(免疫剂量为5μg，使用铝佐剂)，铝佐剂组2(免疫剂量为1μg，使用铝佐剂)，和铝佐剂组3(免疫剂量为0.2μg，使用铝佐剂)。各个组又细分为8个亚组，对照亚组1和2分别用单独的HPV66N5 VLP和单独的HPV56N0 VLP进行免疫，对照亚组3用混合的HPV66/HPV56VLP(即，HPV66N5 VLP和HPV56N0 VLP的混合物，其中每种VLP均以指定的免疫剂量施用)进行免疫。实验亚组1、2、3、4、5分别用H66N5-56T1VLP、H66N5-56T2VLP、H66N5-56T3VLP、H66N5-56T4VLP、H66N5-56T5 VLP进行免疫。

对于铝佐剂组1-3，采用腹腔注射方式免疫5只小鼠/亚组，免疫剂量分别为5μg、1μg、0.2μg，注射体积为1ml。所有小鼠均在第0周进行初次免疫，然后在第2和4周各自进行加强免疫一次。在第6周对小鼠进行眼眶采血，并分析血清中的抗HPV66和HPV56抗体的滴度。分析结果如图8A-8C所示。结果显示，H66N5-56T4 VLP和H66N5-56T5 VLP能诱导小鼠产生高滴度的针对HPV66的中和抗体，其保护效果与同剂量的单独的HPV66N5 VLP相当，且显著优于同剂量的单独的HPV56N0 VLP；并且其能诱导小鼠产生高滴度的针对HPV56的中和抗体，其保护效果与同剂量的单独的HPV56N0 VLP相当，且显著优于同剂量的单独的HPV66N5VLP。这表明，H66N5-56T4 VLP和H66N5-56T5 VLP对HPV66和HPV56具有良好的交叉免疫原性和交叉保护性。

表4免疫方案

实施例4：病毒样颗粒诱导血清转换的ED₅₀的评价

本实验中，所用病毒样颗粒为H66N5-56T4 VLP和H66N5-56T5 VLP。

采用铝佐剂、单次腹腔注射方式对6周龄的BalB/c雌鼠(8只)进行免疫，其中，实验组使用H66N5-56T4 VLP和H66N5-56T5 VLP，对照组使用单独的HPV56N0 VLP或单独的HPV66N5 VLP或混合的HPV66/HPV56 VLP(即，HPV66N5 VLP与HPV56N0 VLP的混合物)；免疫剂量为0.900μg、0.300μg、0.100μg、0.033μg或0.011μg；免疫体积为1mL。另外，还将用于稀释疫苗的稀释液用作空白对照。每组免疫8只小鼠，并且在免疫后第五周，抽取眼球静脉血，检测血清中的HPV抗体，并通过Reed-Muench法(Reed LJ MH.A simple method ofestimating fifty percent endpoints.Am J Hyg.1938；27:493-7)来计算各个样品诱导血清转换(即，诱导小鼠产生抗体)的ED₅₀。结果如表5-9所示。

表5.HPV66N5 VLP诱导小鼠产生抗HPV66、

抗HPV56抗体(血清转换)的ED₅₀

表6.HPV56N0 VLP诱导小鼠产生抗HPV66、

抗HPV56抗体(血清转换)的ED₅₀

表7.H66N5-56T4 VLP诱导小鼠产生抗HPV66、

抗HPV56抗体(血清转换)的ED₅₀

表8.H66N5-56T5 VLP诱导小鼠产生抗HPV66、

抗HPV56抗体(血清转换)的ED₅₀

表9.混合的HPV66/HPV56 VLP诱导小鼠产生抗HPV66、

抗HPV56抗体(血清转换)的ED₅₀

结果显示，在免疫小鼠5周后，H66N5-56T5 VLP诱导小鼠产生抗HPV66抗体的ED₅₀与单独的HPV66N5 VLP相当，且显著优于单独的HPV56N0 VLP；并且，其诱导小鼠产生抗HPV56抗体的ED₅₀虽稍弱于单独的HPV56N0 VLP，但显著优于单独的HPV66N5 VLP。这表明，H66N5-56T5 VLP对HPV66和HPV56具有良好的交叉免疫原性和交叉保护性。

实施例5：用病毒样颗粒免疫后小鼠血清中的中和抗体滴度的评价2

本实验中，所用的病毒颗粒为H66N5-56T5-53S1 VLP、H66N5-56T5-53S2 VLP、H66N5-56T5-53S4 VLP。

在本实验中，免疫方案如表10所示。将所有小鼠(6周龄BalB/c雌性小鼠)分为2个组：铝佐剂组1(免疫剂量为5μg，使用铝佐剂)和铝佐剂组2(免疫剂量为1μg，使用铝佐剂)。各个组再细分为7个亚组，对照亚组1、2、3分别用单独的HPV66N5 VLP、单独的HPV56N0 VLP、单独的HPV53N5 VLP进行免疫，对照亚组4用混合的HPV66/56/53 VLP(即，HPV66N5 VLP、HPV56N0 VLP和HPV53N5 VLP的混合物，其中每种VLP均以指定的免疫剂量施用)进行免疫。实验亚组1、2、3分别用H66N5-56T5-53S1 VLP、H66N5-56T5-53S2 VLP、H66N5-56T5-53S4VLP进行免疫。

对于铝佐剂组1-2，采用腹腔注射方式免疫5只小鼠/亚组，免疫剂量分别为5μg、1μg，注射体积为1ml。所有小鼠均在第0周进行初次免疫，然后在第2和4周各自进行加强免疫一次。在第6周对小鼠进行眼眶采血，并分析血清中的抗HPV66、HPV56和HPV53抗体的滴度。分析结果如图9A-9B所示。结果显示H66N5-56T5-53S1、H66N5-56T5-53S2和H66N5-56T5-53S4 VLP都能诱导小鼠产生高滴度的针对HPV66的中和抗体，其保护效果虽然略微弱于同剂量的单独的HPV66N5 VLP以及混合的HPV66/56/53 VLP，但仍显著优于同剂量的单独的HPV56N0 VLP或单独的HPV53N5 VLP；并且其能诱导小鼠产生高滴度的针对HPV56的中和抗体，其保护效果与同剂量的单独的HPV56N0 VLP以及混合的HPV66/56/53 VLP相当，且显著优于同剂量的单独的HPV66N5 VLP或单独的HPV53N5 VLP；并且其能诱导小鼠产生高滴度的针对HPV53的中和抗体，其保护效果与同剂量的单独的HPV53N5 VLP以及混合的HPV66/56/53 VLP相当，且显著优于同剂量的单独的HPV66N5 VLP或单独的HPV56N0 VLP。这表明H66N5-56T5-53S1 VLP、H66N5-56T5-53S2VLP和H66N5-56T5-53S4 VLP对HPV66、HPV56和HPV53具有良好的交叉免疫原性和交叉保护性。

表10免疫方案

实施例6：用病毒样颗粒免疫后小鼠血清中的中和抗体滴度的评价3

本实验中，所用的病毒颗粒为H66N5-56T5-53S2-53S3 VLP。

在本实验中，免疫方案如表11所示。将所有小鼠(6周龄BalB/c雌性小鼠)分为2个组：实验组(免疫剂量为5μg，使用铝佐剂)和对照组(免疫剂量为5μg，使用铝佐剂)。其中对照组又分为4个亚组，对照亚组1、2、3分别用单独的HPV66N5 VLP、单独的HPV56N0 VLP、单独的HPV53N5 VLP进行免疫，对照亚组4用混合的HPV66/56/53 VLP(即，HPV66N5 VLP、HPV56N0VLP和HPV53N5 VLP的混合物，其中每种VLP均以指定的免疫剂量施用)进行免疫。实验组用H66N5-56T5-53S2-53S3 VLP进行免疫。

采用腹腔注射方式免疫5只小鼠/亚组，免疫剂量分别为5μg，注射体积为1ml。所有小鼠均在第0周进行初次免疫，然后在第2和4周各自进行加强免疫一次。在第6周对小鼠进行眼眶采血，并分析血清中的抗HPV66、HPV56和HPV53抗体的滴度。分析结果如图10所示。结果显示H66N5-56T5-53S2-53S3 VLP能诱导小鼠产生高滴度的针对HPV66的中和抗体，其保护效果与同剂量的单独的HPV66N5 VLP以及混合的HPV66/56/53 VLP相当，且显著优于同剂量的单独的HPV56N0 VLP或单独的HPV53N5 VLP；并且其能诱导小鼠产生高滴度的针对HPV56的中和抗体，其保护效果虽稍弱于同剂量的单独的HPV56N0 VLP、单独的HPV66N5 VLP以及混合的HPV66/56/53 VLP，但显著优于同剂量的单独的HPV53N5 VLP；并且其能诱导小鼠产生高滴度的针对HPV53的中和抗体，其保护效果虽稍弱于同剂量的单独的HPV53N5 VLP以及混合的HPV66/56/53 VLP，但显著优于同剂量的单独的HPV66N5 VLP或单独的HPV56N0VLP。这表明H66N5-56T5-53S2-53S3 VLP对HPV66、HPV56和HPV53具有良好的交叉免疫原性和交叉保护性。H66N5-56T5-53S2-53S3 VLP可用作预防HPV66感染、HPV56感染和HPV53感染的有效疫苗，可用于代替含有HPV66VLP、HPV56 VLP和HPV53 VLP的混合疫苗。

表11免疫方案

尽管本发明的具体实施方式已经得到详细的描述，本领域技术人员将会理解，根据已经公开的所有教导，可以对那些细节进行各种修改和替换，这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。

SEQUENCE LISTING

<110> 厦门大学

厦门万泰沧海生物技术有限公司

<120> 一种人***瘤病毒66型L1蛋白的突变体

<130> IDC180136

<150> CN201810563504.2

<151> 2018-06-04

<160> 65

<170> PatentIn version 3.5

<210> 1

<211> 502

<212> PRT

<213> Human papillomavirus type 66

<400> 1

Met Ala Met Trp Arg Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Val Ser Asn Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Ala Pro Ala Leu Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Pro Gly Asn Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Leu Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr

260 265 270

Asp Leu Tyr Trp Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys

340 345 350

Tyr Asp Ala Arg Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Ile Lys Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Ala Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser

465 470 475 480

Val Ser Ala Ser Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser

485 490 495

Pro Ala Lys Arg Lys Lys

500

<210> 2

<211> 499

<212> PRT

<213> Human papillomavirus type 56

<400> 2

Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala

260 265 270

Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys

340 345 350

Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr

465 470 475 480

Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg

485 490 495

Lys Arg Arg

<210> 3

<211> 499

<212> PRT

<213> Human papillomavirus type 53

<400> 3

Met Ala Val Trp Arg Pro Ser Asp Ser Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Ile Thr Thr Asp Ala Tyr Val Lys Arg Thr Thr

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Thr Val Gly His Pro

35 40 45

Tyr Tyr Pro Ile Ser Lys Ser Gly Lys Ala Asp Ile Pro Lys Val Ser

50 55 60

Ala Phe Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys

65 70 75 80

Phe Gly Leu Pro Asp Thr Asn Ile Phe Asn Pro Asp Gln Glu Arg Leu

85 90 95

Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly

100 105 110

Val Gly Val Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu

115 120 125

Ser Ser Ser Ile Ala Ile Gln Asp Thr Ala Pro Asp Ser Arg Asp Asn

130 135 140

Val Ser Val Asp Pro Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys Ala

145 150 155 160

Pro Ala Ile Gly Glu His Trp Thr Lys Gly Thr Ala Cys Arg Ser Thr

165 170 175

Pro Thr Thr Ala Gly Asp Cys Pro Pro Leu Glu Leu Ile Asn Ser Pro

180 185 190

Ile Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Ala Leu Asn Phe

195 200 205

Lys Ala Leu Gln Glu Ser Lys Ser Asp Val Pro Leu Asp Ile Val Gln

210 215 220

Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr

225 230 235 240

Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Thr Arg

245 250 255

His Phe Phe Asn Arg Ala Gly Val Ile Gly Glu Glu Ile Pro Asn Asp

260 265 270

Leu Tyr Ile Lys Gly Ser Asn Gly Arg Asp Pro Pro Pro Ser Ser Val

275 280 285

Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu

290 295 300

Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly

305 310 315 320

Ile Cys Trp Asn Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr Arg

325 330 335

Asn Thr Asn Met Thr Leu Ser Ala Thr Thr Gln Ser Met Ser Thr Tyr

340 345 350

Asn Ser Lys Gln Ile Lys Gln Tyr Val Arg His Ala Glu Glu Tyr Glu

355 360 365

Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Ser Leu Ser Ala Glu Val

370 375 380

Met Ala Tyr Leu His Thr Met Asn Ser Thr Leu Leu Glu Asp Trp Asn

385 390 395 400

Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg

405 410 415

Tyr Val Lys Ser Ala Ala Ile Thr Cys Gln Lys Asp Gln Pro Pro Pro

420 425 430

Glu Lys Gln Asp Pro Leu Ser Lys Tyr Lys Phe Trp Glu Val Asn Leu

435 440 445

Gln Asn Ser Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys

450 455 460

Phe Leu Met Gln Val Gly Val Arg Thr Lys Pro Pro Val Ser Ser Lys

465 470 475 480

Lys Arg Ser Ala Ser Thr Thr Ser Thr Ser Ala Pro Ser Ser Lys Arg

485 490 495

Lys Arg Lys

<210> 4

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> H66N5-56T1

<400> 4

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Val Ser Asn

115 120 125

Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val

130 135 140

Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe

245 250 255

Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp

260 265 270

Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys Tyr Asp Ala Arg

340 345 350

Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 5

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> H66N5-56T2

<400> 5

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Ser Ser Asn

115 120 125

Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val

130 135 140

Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe

245 250 255

Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp

260 265 270

Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys Tyr Asp Ala Arg

340 345 350

Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 6

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> H66N5-56T3

<400> 6

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Val Ser Asn

115 120 125

Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val

130 135 140

Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Gln Val Thr

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe

245 250 255

Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp

260 265 270

Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys Tyr Asp Ala Arg

340 345 350

Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 7

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> H66N5-56T4

<400> 7

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Val Ser Asn

115 120 125

Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val

130 135 140

Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe

245 250 255

Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala Glu Leu Tyr Leu

260 265 270

Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys Tyr Asp Ala Arg

340 345 350

Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 8

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> H66N5-56T5

<400> 8

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Val Ser Asn

115 120 125

Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val

130 135 140

Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe

245 250 255

Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp

260 265 270

Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Thr Glu Gln Leu Ser Lys Tyr Asp Ala Arg

340 345 350

Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 9

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> H66N5-56T5-53S1

<400> 9

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Val Ser Asn

115 120 125

Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val

130 135 140

Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe

245 250 255

Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp

260 265 270

Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Thr Glu Gln Leu Ser Lys Tyr Asp Ala Arg

340 345 350

Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 10

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> H66N5-56T5-53S2

<400> 10

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Val

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Ser Ser Ser

115 120 125

Ile Ala Ile Gln Asp Thr Ala Pro Asp Ser Arg Asp Asn Val Ser Val

130 135 140

Asp Pro Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe

245 250 255

Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp

260 265 270

Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Thr Glu Gln Leu Ser Lys Tyr Asp Ala Arg

340 345 350

Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 11

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> H66N5-56T5-53S4

<400> 11

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Val Ser Asn

115 120 125

Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val

130 135 140

Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Phe Phe

245 250 255

Asn Arg Ala Gly Val Ile Gly Glu Glu Ile Pro Asn Asp Leu Tyr Ile

260 265 270

Lys Gly Ser Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Thr Glu Gln Leu Ser Lys Tyr Asp Ala Arg

340 345 350

Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 12

<211> 1509

<212> DNA

<213> Human papillomavirus type 66

<400> 12

atggccatgt ggaggcccag cgacaacaag gtgtacctgc cccccacccc cgtgagcaag 60

gtggtggcca ccgacaccta cgtgaagagg accagcatct tctaccacgc cggcagcagc 120

aggctgctgg ccgtgggcca cccctactac agcgtgagca agagcggcac caagaccaac 180

atccccaagg tgagcgccta ccagtacagg gtgttcaggg tgaggctccc cgaccccaac 240

aagttcggcc tgcccgaccc cagcttctac aaccccgacc aggagaggct ggtgtgggcc 300

tgcgtgggcc tggaggtggg caggggccag cccctgggcg ccggcctgag cggccacccc 360

ctgttcaaca ggctggacga caccgaggtg agcaacctgg ccggcaacaa cgtgatcgag 420

gacagcaggg acaacatcag cgtggactgc aagcagaccc agctgtgcat cgtgggctgc 480

gcccccgccc tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccccggcaac 540

accggcgact gcccccccct ggccctggtg aacaccccca tcgaggacgg cgacatggtg 600

gacaccggct tcggcgccat ggacttcaag ctgctgcagg agagcaaggc cgaggtgccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgagg agggagcagc tgttcgccag gcactacttc 780

aacagggccg gcaacgtggg cgaggccatc cccaccgacc tgtactggaa gggcggcaac 840

ggcagggacc ccccccccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcaga gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca ggtgttcgtg accgtggtgg acaccaccag gagcaccaac 1020

atgaccatca acgccgccaa gagcaccctg accaagtacg acgccaggga gatcaaccag 1080

tacctgaggc acgtggagga gtacgagctg cagttcgtgt tccagctgtg caagatcacc 1140

ctgaccgccg aggtgatggc ctacctgcac aacatgaaca acaccctgct ggacgactgg 1200

aacatcggcc tgagcccccc cgtggccacc agcctggagg acaagtacag gtacatcaag 1260

agcaccgcca tcacctgcca gagggagcag ccccccgccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggaggt gaacctgcag gacagcttca gcgccgacct ggaccagttc 1380

cccctgggca ggaagttcct gatgcagctg ggccccaggc cccccaggcc caaggccagc 1440

gtgagcgcca gcaagaggag ggccgccccc accagcagca gcagcagccc cgccaagagg 1500

aagaagtaa 1509

<210> 13

<211> 1500

<212> DNA

<213> Human papillomavirus type 56

<400> 13

atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60

gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120

agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180

atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240

aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300

tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360

ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420

gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480

acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540

accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600

gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780

aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840

ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020

atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080

tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140

ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200

aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260

agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380

cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440

agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500

<210> 14

<211> 1500

<212> DNA

<213> Human papillomavirus type 53

<400> 14

atggccgtgt ggaggcccag cgacagcaag gtgtacctgc cccccacccc cgtgagcaag 60

gtgatcacca ccgacgccta cgtgaagagg accaccatct tctaccacgc cggcagcagc 120

aggctgctga ccgtgggcca cccctactac cccatcagca agagcggcaa ggccgacatc 180

cccaaggtga gcgccttcca gtacagggtg ttcagggtga ggctgcccga ccccaacaag 240

ttcggcctgc ccgacaccaa catcttcaac cccgaccagg agaggctggt gtgggcctgc 300

gtgggcctgg agatcggcag gggccagccc ctgggcgtgg gcgtgagcgg ccaccccctg 360

ttcaacaggc tggacgacac cgagagcagc agcatcgcca tccaggacac cgcccccgac 420

agcagggaca acgtgagcgt ggaccccaag cagacccagc tgtgcatcat cggctgcgcc 480

cccgccatcg gcgagcactg gaccaagggc accgcctgca ggagcacccc caccaccgcc 540

ggcgactgcc cccccctgga gctgatcaac agccccatcg aggacggcga catggtggac 600

accggcttcg gcgccctgaa cttcaaggcc ctgcaggaga gcaagagcga cgtgcccctg 660

gacatcgtgc agagcacctg caagtacccc gactacctga agatgagcgc cgacgcctac 720

ggcgacagca tgtggttcta cctgaggagg gagcagctgt tcaccaggca cttcttcaac 780

agggccggcg tgatcggcga ggagatcccc aacgacctgt acatcaaggg cagcaacggc 840

agggaccccc cccccagcag cgtgtacgtg gccaccccca gcggcagcat gatcaccagc 900

gaggcccagc tgttcaacaa gccctactgg ctgcagaggg cccagggcca caacaacggc 960

atctgctgga acaaccagct gttcgtgacc gtggtggaca ccaccaggaa caccaacatg 1020

accctgagcg ccaccaccca gagcatgagc acctacaaca gcaagcagat caagcagtac 1080

gtgaggcacg ccgaggagta cgagctgcag ttcgtgttcc agctgtgcaa gatcagcctg 1140

agcgccgagg tgatggccta cctgcacacc atgaacagca ccctgctgga ggactggaac 1200

atcggcctga gcccccccgt ggccaccagc ctggaggaca agtacaggta cgtgaagagc 1260

gccgccatca cctgccagaa ggaccagccc ccccccgaga agcaggaccc cctgagcaag 1320

tacaagttct gggaggtgaa cctgcagaac agcttcagcg ccgacctgga ccagttcccc 1380

ctgggcagga agttcctgat gcaggtgggc gtgaggacca agccccccgt gagcagcaag 1440

aagaggagcg ccagcaccac cagcaccagc gcccccagca gcaagaggaa gaggaagtaa 1500

<210> 15

<211> 1497

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码H66N5-56T1的DNA序列

<400> 15

atgcccagcg acaacaaggt gtacctgccc cccacccccg tgagcaaggt ggtggccacc 60

gacacctacg tgaagaggac cagcatcttc taccacgccg gcagcagcag gctgctggcc 120

gtgggccacc cctactacag cgtgaccaag gacaacacca agaccaacat ccccaaggtg 180

tccgcctacc agtacagggt gttcagggtg aggctccccg accccaacaa gttcggcctg 240

cccgacccca gcttctacaa ccccgaccag gagaggctgg tgtgggcctg cgtgggcctg 300

gaggtgggca ggggccagcc cctgggcgcc ggcctgagcg gccaccccct gttcaacagg 360

ctggacgaca ccgaggtgag caacctggcc ggcaacaacg tgatcgagga cagcagggac 420

aacatcagcg tggactgcaa gcagacccag ctgtgcatcg tgggctgcgc ccccgccctg 480

ggcgagcact ggaccaaggg cgccgtgtgc aagagcaccc ccggcaacac cggcgactgc 540

ccccccctgg ccctggtgaa cacccccatc gaggacggcg acatggtgga caccggcttc 600

ggcgccatgg acttcaagct gctgcaggag agcaaggccg aggtgcccct ggacatcgtg 660

cagagcacct gcaagtaccc cgactacctg aagatgagcg ccgacgccta cggcgacagc 720

atgtggttct acctgaggag ggagcagctg ttcgccaggc actacttcaa cagggccggc 780

aacgtgggcg aggccatccc caccgacctg tactggaagg gcggcaacgg cagggacccc 840

ccccccagca gcgtgtacgt ggccaccccc agcggcagca tgatcaccag cgaggcccag 900

ctgttcaaca agccctactg gctgcagagg gcccagggcc acaacaacgg catctgctgg 960

ggcaaccagg tgttcgtgac cgtggtggac accaccagga gcaccaacat gaccatcaac 1020

gccgccaaga gcaccctgac caagtacgac gccagggaga tcaaccagta cctgaggcac 1080

gtggaggagt acgagctgca gttcgtgttc cagctgtgca agatcaccct gaccgccgag 1140

gtgatggcct acctgcacaa catgaacaac accctgctgg acgactggaa catcggcctg 1200

agcccccccg tggccaccag cctggaggac aagtacaggt acatcaagag caccgccatc 1260

acctgccaga gggagcagcc ccccgccgag aagcaggacc ccctggccaa gtacaagttc 1320

tgggaggtga acctgcagga cagcttcagc gccgacctgg accagttccc cctgggcagg 1380

aagttcctga tgcagctggg ccccaggccc cccaggccca aggccagcgt gagcgccagc 1440

aagaggaggg ccgcccccac cagcagcagc agcagccccg ccaagaggaa gaagtaa 1497

<210> 16

<211> 1497

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码H66N5-56T2的DNA序列

<400> 16

atgcccagcg acaacaaggt gtacctgccc cccacccccg tgagcaaggt ggtggccacc 60

gacacctacg tgaagaggac cagcatcttc taccacgccg gcagcagcag gctgctggcc 120

gtgggccacc cctactacag cgtgagcaag agcggcacca agaccaacat ccccaaggtg 180

agcgcctacc agtacagggt gttcagggtg aggctccccg accccaacaa gttcggcctg 240

cccgacccca gcttctacaa ccccgaccag gagaggctgg tgtgggcctg cgtgggcctg 300

gaggtgggca gaggccagcc tctgggagct ggcctgagcg gccaccccct gttcaaccgg 360

ctggacgaca ccgagagcag caacctggcc aacaacaacg tgatcgagga cagccgggac 420

aacatcagcg tggacggcaa gcagacccag ctgtgcatcg tgggctgcgc ccccgccctg 480