一种人***瘤病毒56型l1蛋白的突变体

文档序号:1690657 发布日期:2019-12-10 浏览:11次 >En<

阅读说明:本技术 一种人***瘤病毒56型l1蛋白的突变体 (mutant of human papilloma virus 56 type L1 protein ) 是由 俞海 王大宁 魏双萍 郑清炳 李少伟 夏宁邵 于 2019-06-04 设计创作,主要内容包括:本发明涉及一种突变的HPV56L1蛋白(或其变体),其编码序列和制备方法,以及包含其的病毒样颗粒,所述蛋白(或其变体)和病毒样颗粒能够诱发抗至少两个型别的HPV(例如,HPV56和HPV66,或者HPV56、HPV53和HPV66)的中和抗体,从而可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如宫颈癌和尖锐湿疣。本发明还涉及上述蛋白和病毒样颗粒用于制备药物组合物或疫苗的用途,所述药物组合物或疫苗可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如宫颈癌和尖锐湿疣。(The present invention relates to a mutated HPV56L1 protein (or a variant thereof), a coding sequence and a preparation method thereof, and virus-like particles comprising the same, which are capable of inducing neutralizing antibodies against at least two types of HPV (e.g., HPV56 and HPV66, or HPV56, HPV53 and HPV66), thereby being useful for preventing infection by the at least two types of HPV and diseases caused by the infection, such as cervical cancer and condyloma acuminata. The invention also relates to the use of the above proteins and virus-like particles for the preparation of a pharmaceutical composition or vaccine useful for the prevention of HPV infections of said at least two types and diseases caused by said infections, such as cervical cancer and condyloma acuminata.)

一种人***瘤病毒56型L1蛋白的突变体

本申请是以CN申请号为201810566209.2,申请日为2018年6月4日的申请为基础,并主张其优先权,该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本发明涉及分子病毒学和免疫学领域。具体地,本发明涉及一种突变的HPV56 L1蛋白(或其变体),其编码序列和制备方法,以及包含其的病毒样颗粒,所述蛋白(或其变体)和病毒样颗粒能够诱发抗至少两个型别的HPV(例如,HPV66和HPV56,或者HPV66、HPV56和HPV53)的中和抗体,从而可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如***和***。本发明还涉及上述蛋白和病毒样颗粒用于制备药物组合物或疫苗的用途,所述药物组合物或疫苗可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如***和***。

背景技术

人***瘤病毒(Human Papillomavirus,HPV))主要引起皮肤,粘膜的疣状病变。根据其与肿瘤发生的关系,HPV可分为高危型与低危型,其中高危型的HPV感染被证实是诱发包括女性***在内的生殖器癌症主要原因;低危型则主要引起***。预防与控制HPV感染的最有效方式是HPV疫苗,特别是能引起***的高危型HPV疫苗。

HPV的主要衣壳蛋白L1具有自组装为空心病毒样颗粒(Virus-Like Particle,VLP)的特性。HPV VLP是由72个主要衣壳蛋白L1的五聚体相互作用构成的二十面体立体对称结构(Doorbar,J.and P.H.Gallimore.1987.J Virol,61(9):2793-9)。HPV VLP结构与天然HPV高度相似,保留了天然病毒的绝大多数中和表位,可诱导高滴度的中和抗体(Kirnbauer,R.,F.Booy,et al.1992Proc Natl Acad Sci U S A 89(24):12180-4)。

现有的研究发现,HPV VLP主要诱导针对同型HPV的中和抗体,产生针对同型HPV的保护性免疫,仅在一些同源性高的型别之间存在较低的交叉保护(Sara L.Bissett,GiadaMattiuzzo,et al.2014Vaccine.32:6548-6555)。因此,现有的HPV疫苗的保护范围非常有限。通常,一个型别的HPV VLP只能用于预防该型别的HPV感染。在这种情况下,如果要扩大HPV疫苗的保护范围,只能在疫苗中增加更多型别的HPV VLP型别。目前已上市的HPV疫苗,包括Merck公司的(其为针对HPV16、18、6和11的四价疫苗)和(其为针对HPV6、11、16、18、31、33、45、52和58的九价疫苗)和GSK公司的(其为针对HPV16和18的二价疫苗),均是通过混合单独型别的HPV VLP制备而成的。然而,这种方案将导致HPV疫苗的生产成本大大提高,并且可能因为免疫剂量的增加而导致潜在的安全性问题。

因此,本领域仍然需要开发能够诱导针对多个型别的HPV的保护性中和抗体的HPV病毒样颗粒,以更经济、有效地预防多个型别的HPV感染和由此导致的疾病例如***和***。

发明内容

本发明至少部分基于发明人的下述出人意料的发现:将人***瘤病毒(HPV)56型L1蛋白中的特定区段置换为第二型别的HPV(例如HPV66)L1蛋白的相应区段后,所获得的突变的HPV56 L1蛋白能够诱导机体产生针对HPV56和第二型别的HPV(例如HPV66)的高滴度中和抗体,其保护效果与混合的HPV56VLP和第二型别的HPV VLP相当,并且针对HPV56的保护效果与单独的HPV56VLP相当,且针对第二型别的HPV(例如HPV66)的保护效果与单独的第二型别的HPV VLP相当。

此外,在上述置换的基础上,还可以将HPV56 L1蛋白中的另一个特定区段进一步置换为第三型别的HPV(例如HPV53)L1蛋白的相应区段,由此所获得的含有双置换的突变的HPV56 L1蛋白能够诱导机体产生针对HPV56、第二型别的HPV(例如HPV66)和第三型别的HPV(例如HPV53)的高滴度中和抗体,其保护效果与混合的HPV56VLP、第二型别的HPV VLP和第三型别的HPV VLP相当;并且,其针对HPV56的保护效果与单独的HPV56VLP相当,针对第二型别的HPV(例如HPV66)的保护效果与单独的第二型别的HPV VLP相当,且针对第三型别的HPV(例如HPV53)的保护效果与单独的第三型别的HPV VLP相当。

因此,在一个方面,本发明提供了一种突变的HPV56 L1蛋白或其变体,其中,所述突变的HPV56 L1蛋白与野生型HPV56 L1蛋白相比,具有下述突变:

(1)位于野生型HPV56 L1蛋白第130-150位的氨基酸残基被替换为第二型别的野生型HPV L1蛋白的相应位置的氨基酸残基;或

(2)位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为第二型别的野生型HPV L1蛋白的相应位置的氨基酸残基;

或者,所述突变的HPV56 L1蛋白与野生型HPV56 L1蛋白相比,具有(2)中所定义的突变,并且还具有下述突变:

(3)位于野生型HPV56 L1蛋白第53-56位的氨基酸残基被替换为第二型别的野生型HPV L1蛋白的相应位置的氨基酸残基,并且

(4)位于野生型HPV56 L1蛋白第172-181位的氨基酸残基被替换为第三型别的野生型HPV L1蛋白的相应位置的氨基酸残基;

并且,所述变体与所述突变的HPV56 L1蛋白相异仅在于一个或几个(例如,1个、2个、3个、4个、5个、6个、7个、8或9个)氨基酸的置换(优选保守置换)、添加或缺失,且保留了所述突变的HPV56 L1蛋白的功能,即,能够诱导针对至少两个型别的HPV(例如,HPV56和HPV66或HPV56、HPV66和HPV53)的中和抗体。

在某些优选的实施方案中,所述第二型别的野生型HPV为HPV66。在某些优选的实施方案中,(1)中所述的相应位置的氨基酸残基为野生型HPV66 L1蛋白第130-150位的氨基酸残基。在某些优选的实施方案中,(2)中所述的相应位置的氨基酸残基为野生型HPV66 L1蛋白第347-357位的氨基酸残基。在某些优选的实施方案中,(3)中所述的相应位置的氨基酸残基为野生型HPV66 L1蛋白第53-56位的氨基酸残基。

在某些优选的实施方案中,所述第三型别的野生型HPV为HPV53。在某些优选的实施方案中,(4)中所述的相应位置的氨基酸残基为野生型HPV53 L1蛋白第171-180位的氨基酸残基。

在某些优选的实施方案中,所述野生型HPV56 L1蛋白具有如SEQ ID NO:1所示的氨基酸序列。

在某些优选的实施方案中,所述野生型HPV66 L1蛋白具有如SEQ ID NO:2或3所示的氨基酸序列。

在某些优选的实施方案中,所述野生型HPV53 L1蛋白具有如SEQ ID NO:40或42所示的氨基酸序列。

在某些优选的实施方案中,所述野生型HPV66 L1蛋白第130-150位的氨基酸残基的序列如SEQ ID NO:16所示。

在某些优选的实施方案中,所述野生型HPV66 L1蛋白第347-357位的氨基酸残基的序列如SEQ ID NO:17所示。

在某些优选的实施方案中,所述野生型HPV66 L1蛋白第53-56位的氨基酸残基的序列如SEQ ID NO:20所示。

在某些优选的实施方案中,所述野生型HPV53 L1蛋白第171-180位的氨基酸残基的序列如SEQ ID NO:44所示。

在某些优选的实施方案中,所述突变的HPV56 L1蛋白具有选自下列的氨基酸序列:SEQ ID NO:5、8和38。

在另一个方面,本发明提供了一种分离的核酸,其编码如上所述的突变的HPV56L1蛋白或其变体。在另一个方面,本发明提供了一种载体,其包含所述分离的核酸。在某些优选的实施方案中,本发明的分离的核酸具有选自下列的核苷酸序列:SEQ ID NO:12、15和39。

可用于***目的多核苷酸的载体是本领域公知的,包括但不限于克隆载体和表达载体。在一个实施方案中,载体是例如质粒,粘粒,噬菌体等等。

在另一个方面,本发明还涉及包含上述分离的核酸或载体的宿主细胞。此类宿主细胞包括但不限于,原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例如小鼠细胞、人细胞等)。本发明的宿主细胞还可以是细胞系,例如293T细胞。

在另一个方面,本发明涉及一种HPV病毒样颗粒,其中该病毒样颗粒含有本发明的突变的HPV56L1蛋白或其变体,或者由本发明的突变的HPV56 L1蛋白或其变体组成或形成。

在某些优选的实施方案中,本发明的HPV病毒样颗粒包含突变的HPV56L1蛋白,其与野生型HPV56 L1蛋白相比,位于野生型HPV56 L1蛋白第130-150位的氨基酸残基被替换为野生型HPV66 L1蛋白第130-150位的氨基酸残基。

在某些优选的实施方案中,本发明的HPV病毒样颗粒包含突变的HPV56 L1蛋白,其与野生型HPV56 L1蛋白相比,位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV66 L1蛋白第347-357位的氨基酸残基。

在某些优选的实施方案中,本发明的HPV病毒样颗粒包含突变的HPV56 L1蛋白,其与野生型HPV56 L1蛋白相比,位于野生型HPV56 L1蛋白第53-56位的氨基酸残基被替换为野生型HPV66 L1蛋白第53-56位的氨基酸残基,且位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV66 L1蛋白第347-357位的氨基酸残基,且位于野生型HPV56L1蛋白第172-181位的氨基酸残基被替换为野生型HPV53 L1蛋白第171-180位的氨基酸残基。

在一个特别优选的实施方案中,本发明的HPV病毒样颗粒包含突变的HPV56 L1蛋白,其具有SEQ ID NO:5、8或38所示的序列。

在另一个方面,本发明还涉及包含上述突变的HPV56 L1蛋白或其变体,或上述分离的核酸或载体或宿主细胞或HPV病毒样颗粒的组合物。在某些优选的实施方案中,所述组合物包含本发明的突变的HPV56 L1蛋白或其变体。在某些优选的实施方案中,所述组合物包含本发明的HPV病毒样颗粒。

在另一个方面,本发明还涉及一种药物组合物或疫苗,其包含本发明的HPV病毒样颗粒,任选地还包含药学可接受的载体和/或赋形剂。本发明的药物组合物或疫苗可以用于预防HPV感染或由HPV感染所导致的疾病例如***和***。

在某些优选的实施方案中,所述HPV病毒样颗粒以预防HPV感染或由HPV感染导致的疾病的有效量存在。在某些优选的实施方案中,所述HPV感染是一个或多个型别的HPV感染(例如,HPV56感染、HPV53感染和/或HPV66感染)。在某些优选的实施方案中,所述由HPV感染所导致的疾病选自***和***。

本发明的药物组合物或疫苗可通过本领域公知的方法进行施用,例如但不限于通过口服或者注射进行施用。在本发明中,特别优选的施用方式是注射。

在某些优选的实施方案中,本发明的药物组合物或疫苗以单位剂量形式进行施用。例如但不意欲限定本发明,每单位剂量中包含的HPV病毒样颗粒的量为5μg-80μg,优选20μg-40μg。

在另一个方面,本发明涉及一种制备如上所述的突变的HPV56 L1蛋白或其变体的方法,其包括,在宿主细胞中表达所述突变的HPV56 L1蛋白或其变体,然后从所述宿主细胞的培养物中回收所述突变的HPV56 L1蛋白或其变体。

在某些优选的实施方案中,所述宿主细胞为大肠杆菌。

在某些优选的实施方案中,所述方法包括步骤:在大肠杆菌中表达所述突变的HPV56 L1蛋白或其变体,然后从所述大肠杆菌的裂解上清中纯化得到所述突变的HPV56 L1蛋白或其变体。在某些优选的实施方案中,通过色谱法(例如,阳离子交换色谱,羟基磷灰石色谱和/或疏水相互作用色谱),从所述大肠杆菌的裂解上清中回收所述突变的HPV56 L1蛋白或其变体。

在另一个方面,本发明涉及一种制备疫苗的方法,其包括将本发明的HPV病毒样颗粒与药学可接受的载体和/或赋形剂混合。

在另一个方面,本发明涉及一种预防HPV感染或由HPV感染所导致的疾病的方法,其包括将预防有效量的根据本发明的HPV病毒样颗粒或药物组合物或疫苗施用给受试者。在一个优选的实施方案中,所述HPV感染是一个或多个型别的HPV感染(例如,HPV56感染、HPV53感染和/或HPV66感染)。在另一个优选的实施方案中,所述由HPV感染所导致的疾病包括但不限于,***和***。在另一个优选的实施方案中,所述受试者是哺乳动物,例如人。

在另一个方面,还涉及本发明的突变的HPV56 L1蛋白或其变体或HPV病毒样颗粒在制备药物组合物或疫苗中的用途,所述药物组合物或疫苗用于预防HPV感染或由HPV感染所导致的疾病。在一个优选的实施方案中,所述HPV感染是一个或多个型别的HPV感染(例如,HPV56感染、HPV53感染和/或HPV66感染)。在另一个优选的实施方案中,所述由HPV感染所导致的疾病包括但不限于,***和***。

在另一个方面,本发明还涉及本发明的突变的HPV56 L1蛋白或其变体或HPV病毒样颗粒,其用于预防HPV感染或由HPV感染所导致的疾病。在一个优选的实施方案中,所述HPV感染是一个或多个型别的HPV感染(例如,HPV56感染、HPV53感染和/或HPV66感染)。在另一个优选的实施方案中,所述由HPV感染所导致的疾病包括但不限于,***和***。

本发明中相关术语的说明及解释

在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的细胞培养、分子遗传学、核酸化学、免疫学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。

根据本发明,术语“第二型别的野生型HPV”是指,不同于HPV56的另一型别的野生型HPV。在本发明中,第二型别的野生型HPV优选为野生型HPV66。

根据本发明,术语“第三型别的野生型HPV”是指,不同于HPV56,且不同于第二型别的野生型HPV的另一型别的野生型HPV。在本发明中,第三型别的野生型HPV优选为野生型HPV53。

根据本发明,表述“相应位置”是指,当对序列进行最优比对时,即当序列进行比对以获得最高百分数同一性时,进行比较的序列中的等同位置。根据本发明,术语“野生型HPV56 L1蛋白”是指,天然存在于人***瘤病毒56型(HPV56)中的主要衣壳蛋白L1。野生型HPV56 L1蛋白的序列是本领域公知的,并且可参见各种公共数据库(例如NCBI数据库登录号ALT54892.1、ALT54864.1、ASN77877.1和P36743.1等)。

在本发明中,当提及野生型HPV56 L1蛋白的氨基酸序列时,参照SEQ ID NO:1所示的序列来进行描述。例如,表述“野生型HPV56 L1蛋白的第130-150位氨基酸残基”是指,SEQID NO:1所示的多肽的第130-150位氨基酸残基。“野生型HPV56 L1蛋白的第347-357位氨基酸残基”是指,SEQ ID NO:1所示的多肽的第347-357位氨基酸残基。然而,本领域技术人员理解,野生型HPV56可包括多种分离株,并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步,本领域技术人员理解,尽管可能存在着序列差异,但是HPV56的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95%,例如高于96%,高于97%,高于98%,或高于99%),并且具有实质上相同的生物学功能。因此,在本发明中,术语“野生型HPV56 L1蛋白”不仅包括SEQ ID NO:1所示的蛋白,而且应包括各种HPV56分离株的L1蛋白(例如ALT54892.1、ALT54864.1、ASN77877.1和P36743.1所示的HPV56 L1蛋白)。并且,当描述野生型HPV56 L1蛋白的序列片段时,其不仅包括SEQ ID NO:1的序列片段,还包括各种HPV56分离株的L1蛋白中的相应序列片段。例如,表述“野生型HPV56 L1蛋白的第130-150位氨基酸残基”包括,SEQ ID NO:1的第130-150位氨基酸残基,以及各种HPV56分离株的L1蛋白中的相应片段。

根据本发明,术语“野生型HPV66 L1蛋白”是指,天然存在于人***瘤病毒66型(HPV66)中的主要衣壳蛋白L1。野生型HPV66 L1蛋白的序列是本领域公知的,并且可参见各种公共数据库(例如NCBI数据库登录号ABO76865.1、Q80961.1、和ALT54961.1等)。

在本发明中,当提及野生型HPV66 L1蛋白的氨基酸序列时,参照SEQ ID NO:2所示的序列来进行描述。例如,表述“野生型HPV66 L1蛋白的第130-150位氨基酸残基”是指,SEQID NO:2所示的多肽的第130-150位氨基酸残基;表述“野生型HPV66 L1蛋白的第347-357位氨基酸残基”是指,SEQ ID NO:2所示的多肽的第347-357位氨基酸残基。然而,本领域技术人员理解,野生型HPV66可包括多种分离株,并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步,本领域技术人员理解,尽管可能存在着序列差异,但是HPV66的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95%,例如高于96%,高于97%,高于98%,或高于99%),并且具有实质上相同的生物学功能。因此,在本发明中,术语“野生型HPV66 L1蛋白”不仅包括SEQ ID NO:2所示的蛋白,而且应包括各种HPV66分离株的L1蛋白(例如ABO76865.1、Q80961.1、和ALT54961.1等所示的HPV66 L1蛋白)。并且,当描述野生型HPV66 L1蛋白的序列片段时,其不仅包括SEQ ID NO:2的序列片段,还包括各种HPV66分离株的L1蛋白中的相应序列片段。例如,表述“野生型HPV66 L1蛋白的第130-150位氨基酸残基”包括,SEQ ID NO:2的第130-150位氨基酸残基,以及各种HPV66分离株的L1蛋白中的相应片段。

根据本发明,术语“野生型HPV53 L1蛋白”是指,天然存在于人***瘤病毒53型(HPV53)中的主要衣壳蛋白L1。野生型HPV53 L1蛋白的序列是本领域公知的,并且可参见各种公共数据库(例如NCBI数据库登录号NP041848.1、ANY26596.1、ABU54090.1和ALJ32506.1等)。

在本发明中,当提及野生型HPV53 L1蛋白的氨基酸序列时,参照SEQ ID NO:40所示的序列来进行描述。例如,表述“野生型HPV53 L1蛋白的第171-180位氨基酸残基”是指,SEQ ID NO:40所示的多肽的第171-180位氨基酸残基。然而,本领域技术人员理解,野生型HPV53可包括多种分离株,并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步,本领域技术人员理解,尽管可能存在着序列差异,但是HPV53的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95%,例如高于96%,高于97%,高于98%,或高于99%),并且具有实质上相同的生物学功能。因此,在本发明中,术语“野生型HPV53 L1蛋白”不仅包括SEQ ID NO:40所示的蛋白,而且应包括各种HPV53分离株的L1蛋白(例如NP041848.1、ANY26596.1、ABU54090.1和ALJ32506.1所示的HPV53 L1蛋白)。并且,当描述野生型HPV53 L1蛋白的序列片段时,其不仅包括SEQ ID NO:40的序列片段,还包括各种HPV53分离株的L1蛋白中的相应序列片段。例如,表述“野生型HPV53 L1蛋白的第171-180位氨基酸残基”包括,SEQ ID NO:40的第171-180位氨基酸残基,以及各种HPV53分离株的L1蛋白中的相应片段。

根据本发明,表述“相应序列片段”或“相应片段”是指,当对序列进行最优比对时,即当序列进行比对以获得最高百分数同一性时,进行比较的序列中位于等同位置的片段。

根据本发明,表述“N端截短了X个氨基酸”是指,用起始密码子(用于起始蛋白质翻译)编码的甲硫氨酸残基置换蛋白质N末端的第1-X位氨基酸残基。例如,N端截短了5个氨基酸的HPV66 L1蛋白是指,用起始密码子编码的甲硫氨酸残基置换野生型HPV66 L1蛋白N末端的第1-5位氨基酸残基所获得的蛋白质。

根据本发明,术语“变体”是指这样的蛋白,其氨基酸序列与本发明的突变的HPV56L1蛋白(如SEQ ID NO:5或8所示的蛋白)的氨基酸序列相比,具有一个或几个(例如,1个、2个、3个、4个、5个或6个)氨基酸的置换(优选保守置换)、添加或缺失,或者具有至少90%,95%,96%,97%,98%,或99%的同一性,并且其保留了所述突变的HPV56 L1蛋白的功能。在本发明中,术语“突变的HPV56 L1蛋白的功能”是指:能够诱导机体产生针对至少两个型别的HPV(例如,HPV56和HPV66)的中和抗体。术语“同一性”是对核苷酸序列或氨基酸序列的相似性的量度。通常将序列排列起来,以获得最大限度的匹配。“同一性”本身具有本领域公知的意义并且可用公开的算法(例如BLAST)来计算。

根据本发明,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如Align程序(DNAstar,Inc)方便地进行的Needleman等人(1970)J.Mol.Biol.48:443-453的方法来实现。还可使用已整合入ALIGN程序(版本2.0)的E.Meyers和W.Miller(Comput.ApplBiosci.,4:11-17(1988))的算法,使用PAM120权重残基表(weight residue table)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此外,可使用已整合入GCG软件包(可在www.gcg.com上获得)的GAP程序中的Needleman和Wunsch(J MoIBiol.48:444-453(1970))算法,使用Blossum 62矩阵或PAM250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。

如本文中使用的,术语“保守置换”意指不会不利地影响或改变包含氨基酸序列的蛋白/多肽的必要特性的氨基酸置换。例如,可通过本领域内已知的标准技术例如定点诱变和PCR介导的诱变引入保守置换。保守氨基酸置换包括用具有相似侧链的氨基酸残基替代氨基酸残基的置换,例如用在物理学上或功能上与相应的氨基酸残基相似(例如具有相似大小、形状、电荷、化学性质,包括形成共价键或氢键的能力等)的残基进行的置换。已在本领域内定义了具有相似侧链的氨基酸残基的家族。这些家族包括具有碱性侧链(例如,赖氨酸、精氨酸和组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、色氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸)、β分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。因此,保守置换通常是指,用来自相同侧链家族的另一个氨基酸残基替代相应的氨基酸残基。鉴定氨基酸保守置换的方法在本领域内是熟知的(参见,例如,Brummell等人,Biochem.32:1180-1187(1993);Kobayashi等人Protein Eng.12(10):879-884(1999);和Burks等人Proc.Natl Acad.Set USA 94:412-417(1997),其通过引用并入本文)。

根据本发明,术语“大肠杆菌表达系统”是指由大肠杆菌(菌株)与载体组成的表达系统,其中大肠杆菌(菌株)来源于市场上可得到的菌株,例如但不限于:ER2566,BL21(DE3),B834(DE3),BLR(DE3)。

根据本发明,术语“载体(vector)”是指,可将多核苷酸***其中的一种核酸运载工具。当载体能使***的多核苷酸所编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌体;柯斯质粒等等。

根据本发明,术语“药学可接受的载体和/或赋形剂”是指在药理学和/或生理学上与受试者和活性成分相容的载体和/或赋形剂,其是本领域公知的(参见例如Remington'sPharmaceutical Sciences.Edited by Gennaro AR,19th ed.Pennsylvania:MackPublishing Company,1995),并且包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂包括但不限于磷酸盐缓冲液;表面活性剂包括但不限于阳离子,阴离子或者非离子型表面活性剂,例如Tween-80;佐剂包括但不限于铝佐剂(例如氢氧化铝),弗氏佐剂(例如完全弗氏佐剂);离子强度增强剂包括但不限于氯化钠。

根据本发明,术语“有效量”是指能够有效实现预期目的的量。例如,预防疾病(例如HPV感染)有效量是指,能够有效预防,阻止,或延迟疾病(例如HPV感染)的发生的量。测定这样的有效量在本领域技术人员的能力范围之内。

根据本发明,术语“色谱层析”包括但不限于:离子交换色谱(例如阳离子交换色谱)、疏水相互作用色谱、吸附层析法(例如羟基磷灰石色谱)、凝胶过滤(凝胶排阻)层析、亲和层析法。

根据本发明,术语“裂解上清”是指通过下述步骤所产生的溶液:将宿主细胞(例如大肠杆菌)在裂解液中破碎,然后将含有经破碎的宿主细胞的裂解液中的不溶物去除。各种裂解液是本领域技术人员公知的,包括但不限于Tris缓冲液,磷酸盐缓冲液,HEPES缓冲液,MOPS缓冲液等等。此外,可通过本领域技术人员熟知的各种方法来实现宿主细胞的破碎,包括但不限于匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理等等。去除裂解液中的不溶物的方法也是本领域技术人员公知的,包括但不限于过滤和离心。

发明的有益效果

研究表明,虽然HPV56和其他型别的HPV(例如HPV66)之间存在一定的交叉保护,但是这种交叉保护的能力很低,通常低于自身型别的VLP的保护水平的百分之一,甚至低于千分之一。因此,对于接种了HPV56疫苗的受试者来说,其感染其他型别的HPV(例如HPV66)的风险依然很高。

本发明提供了一种突变的HPV56 L1蛋白以及由其形成的HPV病毒样颗粒。本发明的HPV病毒样颗粒能够在HPV56和其他型别的HPV(例如HPV66)之间提供显著的交叉保护能力。特别地,在同等免疫剂量下,本发明的HPV病毒样颗粒能够诱发机体产生针对至少两个型别的HPV(例如,HPV56和HPV66,或者HPV56、HPV66和HPV53)的高滴度中和抗体,并且其效果与多个型别的HPV VLP的混合物(例如,HPV56VLP和HPV66VLP的混合物,或者HPV56VLP、HPV66VLP和HPV53VLP的混合物)相当。因此,本发明的HPV病毒样颗粒能够用于同时预防两个或三个型别的HPV(例如HPV56和HPV66,或者HPV56、HPV66和HPV53)的感染以及与此相关的疾病,具有显著的有利技术效果。这在扩大HPV疫苗的保护范围和降低HPV疫苗的生产成本等方面具有特别显著的优势。

下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。

附图说明

图1显示了实施例1中经纯化的突变蛋白的SDS聚丙烯酰胺凝胶电泳的结果。泳道1:蛋白分子量标记;泳道2:HPV56N0(全长的HPV56 L1蛋白);泳道3:HPV66N5(N端截短5个氨基酸的HPV66 L1蛋白);泳道4:H56N0-66T1;泳道5:H56N0-66T2;泳道6:H56N0-66T3;泳道7:H56N0-66T4;泳道8:H56N0-66T5;泳道9:蛋白分子量标记;泳道8:H56N0-66T1-66T5-53S3。结果显示,经过色谱纯化后,突变蛋白H56N0-66T1、H56N0-66T2、H56N0-66T3、H56N0-66T4、H56N0-66T5的纯度达到90%左右,H56N0-66T1-66T5-53S3的纯度达到80%左右。

图2显示了用HPV L1广谱抗体4B3检测实施例1中制备的H56N0-66T1、H56N0-66T2、H56N0-66T3、H56N0-66T4、H56N0-66T5的蛋白质免疫印迹检测的结果。泳道1:HPV56N0(全长的HPV56 L1蛋白);泳道2:HPV66N5(N端截短5个氨基酸的HPV66 L1蛋白);泳道3:H56N0-66T1;泳道4:H56N0-66T2;泳道5:H56N0-66T3;泳道6:H56N0-66T4;泳道7:H56N0-66T5。结果显示,突变蛋白H56N0-66T1、H56N0-66T2、H56N0-66T3、H56N0-66T4、H56N0-66T5能够被广谱抗体4B3特异性识别。

图3显示了包含蛋白H56N0-66T1、H56N0-66T2、H56N0-66T3、H56N0-66T4、H56N0-66T5、H56N0-66T1-66T5-53S3的样品的分子筛层析分析的结果。结果显示,包含蛋白H56N0-66T1、H56N0-66T2、H56N0-66T4、H56N0-66T5、H56N0-66T1-66T5-53S3的样品最先出现的蛋白峰均在13-14min左右,与HPV56N0相当;H56N0-66T3的主峰时间为15min左右,肩缝时间为14min,说明H56N0-66T3形成的VLP颗粒大小不均一。结果表明除突变蛋白H56N0-66T3外,其余突变蛋白均可形成均一的VLP。

图4显示了突变的H56N0-66T1VLP、H56N0-66T2VLP、H56N0-66T3VLP、H56N0-66T4VLP、H56N0-66T5VLP、H56N0-66T1-66T5-53S3VLP的沉降速率分析的结果。结果显示,H56N0-66T1VLP、H56N0-66T2VLP、H56N0-66T3VLP、H56N0-66T4VLP、H56N0-66T5VLP、H56N0-66T1-66T5-53S3VLP的沉降系数分别为135S、139S、78S、136S、139S和135S。这表明,如上制备的6种突变的HPV56 L1蛋白除H56N0-66T3外其余均能够组装成大小、形态与野生型VLP(HPV56N0VLP,134S)相似的病毒样颗粒。

图5A至图5H显示了各种VLP样品的透射电镜观察结果(放大倍数为100,000倍,Bar=0.1μm)。图5A:HPV56N0VLP;图5B:H56N0-66T1VLP;图5C:HPV56N0-66T2VLP;图5D:H56N0-66T3VLP;图5E:H56N0-66T4VLP;图5F:H56N0-66T5VLP;图5G:H56N0-66T1-66T5-53S3VLP;图5H:HPV66N5VLP。结果显示,H56N0-66T1VLP、H56N0-66T2VLP、H56N0-66T4VLP、H56N0-66T5VLP、H56N0-66T1-66T5-53S3VLP与HPV56N0类似,都能够组装成半径为25nm左右的VLP;H56N0-66T3VLP组装的颗粒不均一,半径在15-25nm之间。

图6A-图6C显示了用H56N0-66T1VLP、H56N0-66T2VLP、H56N0-66T3VLP、H56N0-66T4VLP和H56N0-66T5VLP免疫小鼠后小鼠血清中的中和抗体滴度的评价结果。图6A:铝佐剂组1(免疫剂量为5.0μg,使用铝佐剂);图6B:铝佐剂组2(免疫剂量为1μg,使用铝佐剂);图6C:铝佐剂组3(免疫剂量为0.2μg,使用铝佐剂)。结果显示,H56N0-66T2VLP和H56N0-66T5VLP能诱导小鼠产生高滴度的针对HPV56的中和抗体,其保护效果与同剂量的单独的HPV56N0VLP、混合的HPV56/HPV66VLP相当,且显著优于同剂量的单独的HPV66N5VLP;H56N0-66T2VLP和H56N0-66T5VLP也能诱导小鼠产生较高滴度的针对HPV66的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV66N5VLP、混合的HPV56/HPV66VLP,但显著优于同剂量的单独的HPV56N0VLP。这表明,H56N0-66T2VLP和H56N0-66T5VLP对HPV56和HPV66具有良好的交叉免疫原性和交叉保护性。

图7显示了实验组H56N0-66T1-66T5-53S3VLP和对照组HPV56N0VLP、HPV66N5VLP、HPV53N5VLP以及混合的HPV66/56/53VLP在小鼠体内的免疫保护性的评价结果。结果显示,H56N0-66T1-66T5-53S3VLP可在小鼠体内诱导高滴度的针对HPV56、HPV66和HPV53的中和抗体;并且其针对HPV56的保护效果稍弱于单独的HPV56N0VLP以及混合的HPV56/66/53VLP,且显著高于单独的HPV66N5VLP和单独的HPV53N5VLP;其针对HPV66的保护效果稍弱于单独的HPV66N0VLP和混合的HPV66/56/53VLP,但显著高于单独的HPV56N0VLP和单独的HPV53N5VLP;其针对HPV53的保护效果稍弱于单独的HPV53N5VLP、混合的HPV66/56/53VLP,但显著高于单独的HPV66N5VLP和单独的HPV56N0VLP。这表明,H56N0-66T1-66T5-53S3VLP可用作预防HPV56感染、HPV66感染和HPV53感染的有效疫苗,可用于代替含有HPV56VLP、HPV66VLP和HPV53VLP的混合疫苗。

序列信息

本发明涉及的部分序列的信息提供于下面的表1中。

表1:序列的描述

序列1(SEQ ID NO:1):

MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.

序列2(SEQ ID NO:2):

MAMWRPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.序列3(SEQ ID NO:3):

MPSDNKVYLPPTPVSKVVATDTYVKRTS IFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.

序列4(SEQ ID NO:4):

MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.

序列5(SEQ ID NO:5):

MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.

序列6(SEQ ID NO:6):

MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTPGNTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.

序列7(SEQ ID NO:7):

MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.

序列8(SEQ ID NO:8):

MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.

序列9(SEQ ID NO:9):

ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA

序列10(SEQ ID NO:10):

ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA

序列11(SEQ ID NO:11):

ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA

序列12(SEQ ID NO:12):

ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA

序列13(SEQ ID NO:13):

ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA

序列14(SEQ ID NO:14):

ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA

序列15(SEQ ID NO:15):

ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA.

序列16(SEQ ID NO:16):

VSNLAGNNVIEDSRDNISVDC

序列17(SEQ ID NO:17):

KSTLTKYDARE

序列18(SEQ ID NO:18):

PGN

序列19(SEQ ID NO:19):

NVGEAIPTDLYWKGGNGRD

序列20(SEQ ID NO:20):

SKSG

序列37(SEQ ID NO:37):

ATGGCCATGTGGAGGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA.

序列38(SEQ ID NO:38):

MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGTACRSTPTTAGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR

序列39(SEQ ID NO:39):

ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCACCGCTTGCCGTTCTACCCCGACCACCGCTGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCAAATCTACCCTGACCAAATACGACGCTCGTGAAATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA

序列40(SEQ ID NO:40):

MAVWRPSDSKVYLPPTPVSKVITTDAYVKRTTIFYHAGSSRLLTVGHPYYPISKSGKADIPKVSAFQYRVFRVRLPDPNKFGLPDTNIFNPDQERLVWACVGLEIGRGQPLGVGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDPKQTQLCI IGCAPAIGEHWTKGTACRSTPTTAGDCPPLELINSPIEDGDMVDTGFGALNFKALQESKSDVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFTRHFFNRAGVIGEEIPNDLYIKGSNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWNNQLFVTVVDTTRNTNMTLSATTQSMSTYNSKQIKQYVRHAEEYELQFVFQLCKISLSAEVMAYLHTMNSTLLEDWNIGLSPPVATSLEDKYRYVKSAAITCQKDQPPPEKQDPLSKYKFWEVNLQNSFSADLDQFPLGRKFLMQVGVRTKPPVSSKKRSASTTSTSAPSSKRKRK.

序列41(SEQ ID NO:41):

ATGGCCGTGTGGAGGCCCAGCGACAGCAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGATCACCACCGACGCCTACGTGAAGAGGACCACCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGACCGTGGGCCACCCCTACTACCCCATCAGCAAGAGCGGCAAGGCCGACATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGAGGCTGCCCGACCCCAACAAGTTCGGCCTGCCCGACACCAACATCTTCAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGATCGGCAGGGGCCAGCCCCTGGGCGTGGGCGTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGAGCAGCAGCATCGCCATCCAGGACACCGCCCCCGACAGCAGGGACAACGTGAGCGTGGACCCCAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCGCCATCGGCGAGCACTGGACCAAGGGCACCGCCTGCAGGAGCACCCCCACCACCGCCGGCGACTGCCCCCCCCTGGAGCTGATCAACAGCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCCTGAACTTCAAGGCCCTGCAGGAGAGCAAGAGCGACGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCACCAGGCACTTCTTCAACAGGGCCGGCGTGATCGGCGAGGAGATCCCCAACGACCTGTACATCAAGGGCAGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCGTGACCGTGGTGGACACCACCAGGAACACCAACATGACCCTGAGCGCCACCACCCAGAGCATGAGCACCTACAACAGCAAGCAGATCAAGCAGTACGTGAGGCACGCCGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCAGCCTGAGCGCCGAGGTGATGGCCTACCTGCACACCATGAACAGCACCCTGCTGGAGGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACGTGAAGAGCGCCGCCATCACCTGCCAGAAGGACCAGCCCCCCCCCGAGAAGCAGGACCCCCTGAGCAAGTACAAGTTCTGGGAGGTGAACCTGCAGAACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGGTGGGCGTGAGGACCAAGCCCCCCGTGAGCAGCAAGAAGAGGAGCGCCAGCACCACCAGCACCAGCGCCCCCAGCAGCAAGAGGAAGAGGAAGTAA

序列42(SEQ ID NO:42):

MPSDSKVYLPPTPVSKVITTDAYVKRTTIFYHAGSSRLLTVGHPYYPISKSGKADIPKVSAFQYRVFRVRLPDPNKFGLPDTNIFNPDQERLVWACVGLEIGRGQPLGVGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDPKQTQLCIIGCAPAIGEHWTKGTACRSTPTTAGDCPPLELINSPIEDGDMVDTGFGALNFKALQESKSDVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFTRHFFNRAGVIGEEIPNDLYIKGSNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWNNQLFVTVVDTTRNTNMTLSATTQSMSTYNSKQIKQYVRHAEEYELQFVFQLCKISLSAEVMAYLHTMNSTLLEDWNIGLSPPVATSLEDKYRYVKSAAITCQKDQPPPEKQDPLSKYKFWEVNLQNSFSADLDQFPLGRKFLMQVGVRTKPPVSSKKRSASTTSTSAPSSKRKRK

序列43(SEQ ID NO:43):

ATGCCCAGCGACAGCAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGATCACCACCGACGCCTACGTGAAGAGGACCACCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGACCGTGGGCCACCCCTACTACCCCATCAGCAAGAGCGGCAAGGCCGACATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGAGGCTGCCCGACCCCAACAAGTTCGGCCTGCCCGACACCAACATCTTCAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGATCGGCAGGGGCCAGCCCCTGGGCGTGGGCGTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGAGCAGCAGCATCGCCATCCAGGACACCGCCCCCGACAGCAGGGACAACGTGAGCGTGGACCCCAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCGCCATCGGCGAGCACTGGACCAAGGGCACCGCCTGCAGGAGCACCCCCACCACCGCCGGCGACTGCCCCCCCCTGGAGCTGATCAACAGCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCCTGAACTTCAAGGCCCTGCAGGAGAGCAAGAGCGACGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCACCAGGCACTTCTTCAACAGGGCCGGCGTGATCGGCGAGGAGATCCCCAACGACCTGTACATCAAGGGCAGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCGTGACCGTGGTGGACACCACCAGGAACACCAACATGACCCTGAGCGCCACCACCCAGAGCATGAGCACCTACAACAGCAAGCAGATCAAGCAGTACGTGAGGCACGCCGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCAGCCTGAGCGCCGAGGTGATGGCCTACCTGCACACCATGAACAGCACCCTGCTGGAGGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACGTGAAGAGCGCCGCCATCACCTGCCAGAAGGACCAGCCCCCCCCCGAGAAGCAGGACCCCCTGAGCAAGTACAAGTTCTGGGAGGTGAACCTGCAGAACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGGTGGGCGTGAGGACCAAGCCCCCCGTGAGCAGCAAGAAGAGGAGCGCCAGCACCACCAGCACCAGCGCCCCCAGCAGCAAGAGGAAGAGGAAGTAA

序列44(SEQ ID NO:44):

TACRSTPTTA

具体实施方式

现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。

除非特别指明,本发明中所使用的分子生物学实验方法和免疫检测法,基本上参照J.Sambrook等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,John Wiley&Sons,Inc.,1995中所述的方法进行;限制性内切酶的使用依照产品制造商推荐的条件。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。

实施例1.突变的HPV56 L1蛋白的表达与纯化

表达载体的构建

采用多点突变PCR反应构建编码含有来源于HPV66 L1蛋白的特定区段的突变的HPV56 L1蛋白的表达载体,其中,所使用的初始模板为pTO-T7-HPV56L1N0C质粒(其编码全长的HPV56 L1蛋白;在表2中简写为56L1N0)。用于各个PCR反应的模板、引物见表2,并且,PCR反应扩增条件设为:94℃变性10分钟,25个循环的“94℃变性50秒,指定温度退火一定时间,72℃延伸7分30秒”,最后72℃延伸10分钟。退火温度和时间列于表2。所使用的PCR引物的序列列于表3。

点突变得到的PCR扩增得到产物(50μL)加入2μL DpnI限制性内切酶(Fermentas(MBI),货号:FD1704,2500U/管),在37℃温育60min。取10μL酶切产物,用于转化40μL以氯化钙法制备的感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)。将经转化的大肠杆菌涂布于含卡那霉素(终浓度25μg/mL,下同)的固体LB培养基(LB培养基成分:10g/L蛋白胨,5g/L酵母粉,10g/L氯化钠,下同),并37℃静置培养10-12小时,直至单菌落清晰可辨。挑取单菌落至含4mL液体LB培养基(含卡那霉素)的试管,并在37℃220转/分钟下振荡培养10小时。随后,取1mL菌液于-70℃保存。从大肠杆菌中提取质粒,并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示,所构建的质粒(表达载体)中***的目的片段的核苷酸序列分别为SEQ ID NO:11和13,其编码的氨基酸序列为SEQ ID NO:4和6(所对应的蛋白分别命名为H56N0-66T1和H56N0-66T3)。

突变蛋白H56N0-66T1与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第53-56位的氨基酸残基被替换为野生型HPV66 L1蛋白第53-56位的氨基酸残基。突变蛋白H56N0-66T3与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第178-180位的氨基酸残基被替换为野生型HPV66 L1蛋白第178-180位的氨基酸残基。

采用Gibson装配(Gibson DG,Young L,Chuang RY,Venter JC,Hutchison CA,Smith HO.Enzymatic assembly of DNA molecules up to several hundredkilobases.Nat Methods.2009;6:343–5.doi:10.1038/nmeth.1318.)来构建编码其他的突变的HPV56 L1蛋白的表达载体,所述突变的HPV56 L1蛋白含有来源于HPV66 L1的特定区段。简言之,即首先采用PCR反应来获得包含突变的短片段和不包含突变的长片段,再采用Gibson装配体系将两片段连接成环。使用的初始模板包括pTO-T7-HPV56N0C质粒(其编码全长的HPV56 L1蛋白;在表2中简写为56L1N0)和pTO-T7-HPV66N5C质粒(其编码N端截短了5个氨基酸的HPV66 L1蛋白;在表2中简写为66L1N5)。用于各个PCR反应的模板、引物见表2,用于扩增短片段的PCR反应扩增条件设为:94℃变性10分钟,25个循环的“94℃变性50秒,指定温度退火一定时间,72℃延伸1分钟”,最后72℃延伸10分钟;用于扩增长片段的PCR反应扩增条件设为:94℃变性10分钟,25个循环的“94℃变性50秒,指定温度退火一定时间,72℃延伸7分30秒”,最后72℃延伸10分钟。所使用的PCR引物的序列列于表3。将PCR产物电泳后使用DNA回收试剂盒(BEYOTIME(碧云天),货号:D0033)回收目的片段并测定浓度。按摩尔比2:1比例混合短片段和长片段,总体积3μL;与3μL 2X Gibson装配预混试剂(2X GibsonAssembly Master Mix,购自NEB,包含T5exonuclease,Phusion DNA polymerase,Taq DNAligase)混合,50℃反应1小时。

用装配后产物6μL转化40μL以氯化钙法制备的感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)细菌。将转化的大肠杆菌涂布于含卡那霉素的固体LB培养基,并37℃静置培养10-12小时,直至单菌落清晰可辨。挑取单菌落至含4mL液体LB培养基(含卡那霉素)的试管,在37℃220转/分钟下振荡培养10小时,从中取1mL菌液于-70℃保存。从大肠杆菌中提取质粒,并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示,所构建的各个质粒(表达载体)中***的目的片段的核苷酸序列分别为SEQ ID NO:12、14、15,其编码的氨基酸序列为SEQ ID NO:5、7、8(所对应的蛋白分别命名为H56N0-66T2、H56N0-66T4、H56N0-66T5VLP)。

突变蛋白H56N0-66T2与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第130-150位的氨基酸残基被替换为野生型HPV66 L1蛋白第130-150位的氨基酸残基。突变蛋白H56N0-66T4与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第268-283位的氨基酸残基被替换为野生型HPV66 L1蛋白第265-283位的氨基酸残基。突变蛋白H56N0-66T5与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV66 L1蛋白第347-357位的氨基酸残基。

表2用于构建表达载体的PCR反应的模板和引物

表3:所使用的引物的具体序列(SEQ ID NO:21-36)

H56N0-66T1-66T5-53S3基因由上海生工生物公司合成,将合成后含有HPV56N0-66T1-66T5-53S3基因的质粒用NdeI和SalI进行酶切(37℃,12小时),酶切后将目的基因用DNA回收试剂盒(BEYOTIME(碧云天),货号:D0033)进行回收,将酶切后的H56N0-66T1-66T5-53S3基因与pTO-T7载体在16℃下连接12小时,随后转化感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)细菌。将经转化的大肠杆菌涂布于含卡那霉素的固体LB培养基,并37℃静置培养10-12小时,直至单菌落清晰可辨。挑取单菌落至含4mL液体LB培养基(含卡那霉素)的试管,在37℃220转/分钟下振荡培养10小时,从中取1mL菌液于-70℃保存。从大肠杆菌中提取质粒,并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示,所构建的各个质粒(表达载体)中***的目的片段的核苷酸序列分别为SEQ ID NO:39,其编码的氨基酸序列为SEQ ID NO:38(所对应的蛋白命名为H56N0-66T1-66T5-53S3)。

突变蛋白H56N0-66T1-66T5-53S3与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第53-56位的氨基酸残基被替换为野生型HPV66 L1蛋白第53-56位的氨基酸残基,位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV66 L1蛋白第347-357位的氨基酸残基,位于野生型HPV56 L1蛋白第172-181位的氨基酸残基被替换为野生型HPV53L1蛋白第171-180位的氨基酸残基的序列。

突变蛋白的大量表达

从-70℃冰箱中取出携带重组质粒pTO-T7-H56N0-66T1、pTO-T7-H56N0-66T2、pTO-T7-H56N0-66T3、pTO-T7-H56N0-66T4、pTO-T7-H56N0-66T5、pTO-H56N0-66T1-66T5-53S3的大肠杆菌菌液,分别接种入100ml含卡那霉素的LB液体培养基中,在200rpm,37℃下培养大约8小时;然后分别转接入500ml含卡那霉素的LB培养基中(接入1ml菌液),并继续进行培养。当细菌浓度达到OD600为0.6左右时,将培养温度降至25℃,并向各培养瓶中加入500μLIPTG,继续培养8小时。培养结束后,离心收集菌体。获得表达了H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5,H56N0-66T1-66T5-53S3蛋白的菌体。

表达突变蛋白的菌体破碎

按1g菌体对应10mL裂解液(20mM Tris缓冲液,pH7.2,300mM NaCl)的比例重悬上述得到的菌体。用超声波仪破碎菌体30min。以13500rpm(30000g)离心含有经破碎的菌体的裂解液15min,留取上清(即,菌体破碎上清)。

突变蛋白的色谱纯化

仪器系统:GE Healthcare公司(原Amershan Pharmacia公司)生产的AKTAexplorer 100型制备型液相色谱系统。

层析介质:SP Sepharose 4Fast Flow(GE Healthcare公司)、CHT-Ⅱ(购自Bio-RAD)和Butyl Sepharose 4Fast Flow(GE Healthcare公司)。下面的洗脱程序中用到的含有不同浓度NaCl的缓冲液是由缓冲液A和B按比例混合配置而成。

缓冲液:缓冲液A(20mM磷酸盐缓冲液,pH8.0,20mM DTT);以及,缓冲液B(20mM磷酸盐缓冲液,pH8.0,20mM DTT,2M NaCl)。

样品:如上获得的含有H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5,H56N0-66T1-66T5-53S3的菌体破碎上清。

洗脱程序为:

(1)用SP Sepharose 4Fast Flow对菌体破碎上清进行阳离子交换纯化:将样品上柱,然后用含有400mM NaCl的缓冲液(80%缓冲液A+20%缓冲液B)洗脱杂蛋白,然后用含有800mM NaCl的缓冲液(60%缓冲液A+40%缓冲液B)洗脱目的蛋白,并收集由含有800mMNaCl的缓冲液洗脱的级分;

(2)用CHTⅡ(羟基磷灰石色谱)对前一步获得的洗脱级分进行色谱纯化:对前一步骤获得的洗脱级分进行稀释,以使得NaCl的浓度降至0.5M;将样品上柱,然后用含有500mMNaCl的缓冲液(75%缓冲液A+25%缓冲液B)洗脱杂蛋白,然后用含有1000mM NaCl的缓冲液(50%缓冲液A+50%缓冲液B)洗脱目的蛋白,并收集由含有1000mM NaCl的缓冲液洗脱的级分;

(3)用HIC(疏水相互作用色谱)对前一步骤获得的洗脱级分进行色谱纯化:将样品上柱,然后用含有1000mM NaCl的缓冲液洗脱杂蛋白,然后用含有200mM NaCl的缓冲液(90%缓冲液A+10%缓冲液B)洗脱目的蛋白,并收集由含有200mM NaCl的缓冲液洗脱的级分。

取步骤(3)获得的洗脱级分150μL,加入30μL 6X Loading Buffer(1L中含有1M TB6.8 300ml、100%甘油600ml、SDS 120g、溴酚蓝6g、β-巯基乙醇50ml)中,混匀,并于80℃水浴中温育10min。然后取10μl样品于10%SDS-聚丙烯酰胺凝胶中以120V电压电泳120min;然后以考马斯亮兰染色显示电泳条带。电泳结果示于图1中。结果显示,经过上述纯化步骤后,H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5蛋白的纯度均在90%左右,H56N0-66T1-66T5-53S3蛋白纯度为80%左右。

通过类似的方法,使用大肠杆菌和pTO-T7-HPV56N0质粒制备和纯化了HPV56N0蛋白;使用大肠杆菌和pTO-T7-HPV66L1N5质粒制备和纯化了HPV66N5蛋白;使用大肠杆菌和pTO-T7-HPV53L1N5质粒制备和纯化了HPV53N5蛋白。

突变蛋白的免疫印迹实验

按上述方法对经纯化的H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5蛋白进行电泳。电泳结束后,使用抗HPV L1蛋白的广谱抗体4B3进行WesternBlot检测,结果示于图2中。结果显示,H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5都能够被广谱抗体4B3特异性识别。

实施例2:HPV病毒样颗粒的组装与颗粒形态学检测

HPV病毒样颗粒的组装

取一定体积(约2ml)的蛋白H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5,H56N0-66T1-66T5-53S3分别依次透析至(1)2L储存缓冲液(20mM磷酸钠缓冲液pH 6.5,0.5M NaCl);(2)2L复性缓冲液(50mM磷酸钠缓冲液pH 6.0,2mM CaCl2,2mM MgCl2,0.5M NaCl);和(3)20mM磷酸钠缓冲液pH 7.0,0.5M NaCl中。在三种缓冲液中各自进行透析12h。

通过类似的方法,将HPV56N0、HPV66N5和HPV53N5蛋白分别组装为HPV56N0 VLP、HPV66N5 VLP和HPV53N5VLP。

分子筛层析分析

用美国安捷伦公司的1120Compact LC高效液相色谱系统对经透析的样品进行分子筛层析分析,其中,所使用的分析柱为TSK Gel PW5000xl 7.8x300mm。分析结果如图3所示,结果显示,包含H56N0-66T1VLP、H56N0-66T2、H56N0-66T4 VLP、H56N0-66T5 VLP、H56N0-66T1-66T5-53S3的样品最先出现的蛋白峰均在13-14min左右,与HPV56N0 VLP相当;H56N0-66T3 VLP的主峰时间为15min左右,肩峰时间为14min,说明H56N0-66T3 VLP颗粒大小不均一。结果表明除突变蛋白H56N0-66T3 VLP外,其余突变蛋白均可形成均一的VLP。

沉降速率分析

沉降速率分析所使用的仪器为Beckman XL-A分析型超速离心机,其配有光学检测系统及An-50Ti和An-60Ti转头。采用沉降速率法分析HPV56N0 VLP、HPV66N5 VLP、H56N0-66T1 VLP、H56N0-66T2 VLP、H56N0-66T3 VLP、H56N0-66T4 VLP、H56N0-66T5 VLP、H56N0-66T1-66T5-53S3的沉降系数。结果如图4所示。结果显示,H56N0-66T1 VLP、H56N0-66T2VLP、H56N0-66T3 VLP、H56N0-66T4 VLP、H56N0-66T5 VLP、H56N0-66T1-66T5-53S3的沉降系数分别为135S、139S、78S、136S、139S和135S。这表明,如上制备的6种突变的HPV56 L1蛋白除H56N0-66T3外其余均能够组装成大小、形态与野生型VLP(HPV56N0 VLP,134S)相似的病毒样颗粒。

病毒样颗粒的形态学检测

取100μL含有VLP的样品进行透射电镜观察。所使用的仪器为日本电子公司生产的100kV透射电镜,放大倍数为100,000倍。简言之,取13.5μL样品,用2%磷钨酸pH7.0进行负染,并固定于喷炭的铜网上,然后进行透射电镜观察。观察结果如图5A-5G所示。结果显示,H56N0-66T1 VLP、H56N0-66T2、H56N0-66T4 VLP、H56N0-66T5 VLP、H56N0-66T1-66T5-53S3与HPV56N0类似,都能够组装成半径为25nm左右的VLP;H56N0-66T3 VLP组装的颗粒不均一,半径在15-25nm之间。

实施例3:用病毒样颗粒免疫后小鼠血清中的中和抗体滴度的评价1

本实验中,所用病毒样颗粒为:H56N0-66T1 VLP,H56N0-66T2 VLP,H56N0-66T3VLP,H56N0-66T4 VLP,H56N0-66T5VLP。

在本实验中,免疫方案如表4所示。将所有小鼠(6周龄BalB/c雌性小鼠)分为3个组:铝佐剂组1(免疫剂量为5μg,使用铝佐剂),铝佐剂组2(免疫剂量为1μg,使用铝佐剂),和铝佐剂组3(免疫剂量为0.2μg,使用铝佐剂)。各个组又细分为8个亚组,对照亚组1和2分别用单独的HPV56N0 VLP和单独的HPV66N5 VLP进行免疫,对照亚组3用混合的HPV56/HPV66VLP(即,HPV56N0 VLP和HPV66N5 VLP的混合物,其中每种VLP均以指定的免疫剂量施用)进行免疫。实验亚组1、2、3、4、5分别用H56N0-66T1 VLP,H56N0-66T2 VLP,H56N0-66T3 VLP,H56N0-66T4 VLP,H56N0-66T5 VLP进行免疫。

对于铝佐剂组1-3,采用腹腔注射方式免疫5只小鼠/亚组,免疫剂量分别为5μg、1μg、0.2μg,注射体积为1ml。所有小鼠均在第0周进行初次免疫,然后在第2和4周各自进行加强免疫一次。在第8周对小鼠进行眼眶采血,并分析血清中的抗HPV56和HPV66抗体的滴度。分析结果如图6A-6C所示,结果显示,H56N0-66T2 VLP和H56N0-66T5 VLP能诱导小鼠产生高滴度的针对HPV56的中和抗体,其保护效果与同剂量的单独的HPV56N0 VLP、混合的HPV56/HPV66 VLP相当,且显著优于同剂量的单独的HPV66N5 VLP;H56N0-66T2 VLP和H56N0-66T5VLP也能诱导小鼠产生较高滴度的针对HPV66的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV66N5 VLP、混合的HPV56/HPV66 VLP,但显著优于同剂量的单独的HPV56N0 VLP。这表明,H56N0-66T2 VLP和H56N0-66T5 VLP对HPV56和HPV66具有良好的交叉免疫原性和交叉保护性。

表4免疫方案

实施例4:用病毒样颗粒免疫后小鼠血清中的中和抗体滴度的评价2

本实验中,所用的病毒样颗粒为H56N0-66T1-66T5-53S3VLP。

在本实验中,免疫方案如表5所示。将所有小鼠(6周龄BalB/c雌性小鼠)分为2个组:实验组(免疫剂量为5μg,使用铝佐剂)和对照组(免疫剂量为5μg,使用铝佐剂)。其中对照组又分为4个亚组,对照亚组1、2、3分别用单独的HPV56N0 VLP、单独的HPV66N5 VLP、单独的HPV53N5 VLP进行免疫,对照亚组4用混合的HPV56/66/53 VLP(即,HPV56N0 VLP、HPV66N5VLP和HPV53N5 VLP的混合物,其中每种VLP均以指定的免疫剂量施用)进行免疫。实验用H56N0-66T1-66T5-53S3 VLP进行免疫。

表4免疫方案

采用腹腔注射方式免疫5只小鼠/亚组,免疫剂量分别为5μg,注射体积为1ml。所有小鼠均在第0周进行初次免疫,然后在第2和4周各自进行加强免疫一次。在第6周对小鼠进行眼眶采血,并分析血清中的抗HPV56、HPV66和HPV53抗体的滴度。分析结果如图7所示。结果显示H56N0-66T1-66T5-53S3 VLP都能诱导小鼠产生高滴度的针对HPV56的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV56N0 VLP以及混合的HPV66/56/53 VLP,且显著优于同剂量的单独的HPV66N5 VLP或单独的HPV53N5 VLP;并且其能诱导小鼠产生高滴度的针对HPV66的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV66N5 VLP以及混合的HPV66/56/53 VLP,但显著优于同剂量的单独的HPV56N0 VLP或单独的HPV53N5 VLP;并且其能诱导小鼠产生高滴度的针对HPV53的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV53N5VLP以及混合的HPV66/56/53 VLP,但显著优于同剂量的单独的HPV66N5VLP或单独的HPV56N0 VLP。这表明HPV56N0-66T1-66T5-53S3 VLP对HPV66、HPV56和HPV53具有良好的交叉免疫原性和交叉保护性。H56N0-66T1-66T5-53S3 VLP可用作预防HPV56感染、HPV66感染和HPV53感染的有效疫苗,可用于代替含有HPV56VLP、HPV66 VLP和HPV53 VLP的混合疫苗。

尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解,根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。

SEQUENCE LISTING

<110> 厦门大学

厦门万泰沧海生物技术有限公司

<120> 一种人***瘤病毒56型L1蛋白的突变体

<130> IDC180137

<150> CN201810566209.2

<151> 2018-06-04

<160> 44

<170> PatentIn version 3.5

<210> 1

<211> 499

<212> PRT

<213> Human papillomavirus type 56

<400> 1

Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala

260 265 270

Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys

340 345 350

Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr

465 470 475 480

Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg

485 490 495

Lys Arg Arg

<210> 2

<211> 502

<212> PRT

<213> Human papillomavirus type 66

<400> 2

Met Ala Met Trp Arg Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Val Ser Asn Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Ala Pro Ala Leu Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Pro Gly Asn Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Leu Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr

260 265 270

Asp Leu Tyr Trp Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys

340 345 350

Tyr Asp Ala Arg Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Ile Lys Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Ala Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser

465 470 475 480

Val Ser Ala Ser Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser

485 490 495

Pro Ala Lys Arg Lys Lys

500

<210> 3

<211> 498

<212> PRT

<213> Human papillomavirus type 66

<400> 3

Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val

35 40 45

Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln

50 55 60

Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu

65 70 75 80

Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala

85 90 95

Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu

100 105 110

Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Val Ser Asn

115 120 125

Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val

130 135 140

Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu

145 150 155 160

Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn

165 170 175

Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp

180 185 190

Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu

195 200 205

Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys

210 215 220

Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser

225 230 235 240

Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe

245 250 255

Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp

260 265 270

Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala

275 280 285

Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys

290 295 300

Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp

305 310 315 320

Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn

325 330 335

Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys Tyr Asp Ala Arg

340 345 350

Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe

355 360 365

Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr

370 375 380

Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu

385 390 395 400

Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys

405 410 415

Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln

420 425 430

Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser

435 440 445

Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met

450 455 460

Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser

465 470 475 480

Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg

485 490 495

Lys Lys

<210> 4

<211> 499

<212> PRT

<213> Artificial Sequence

<220>

<223> H56N0-66T1

<400> 4

Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala

260 265 270

Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys

340 345 350

Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr

465 470 475 480

Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg

485 490 495

Lys Arg Arg

<210> 5

<211> 499

<212> PRT

<213> Artificial Sequence

<220>

<223> H56N0-66T2

<400> 5

Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Val Ser Asn Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala

260 265 270

Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys

340 345 350

Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr

465 470 475 480

Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg

485 490 495

Lys Arg Arg

<210> 6

<211> 499

<212> PRT

<213> Artificial Sequence

<220>

<223> H56N0-66T3

<400> 6

Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Pro Gly Asn Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala

260 265 270

Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys

340 345 350

Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr

465 470 475 480

Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg

485 490 495

Lys Arg Arg

<210> 7

<211> 499

<212> PRT

<213> Artificial Sequence

<220>

<223> H56N0-66T4

<400> 7

Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr

260 265 270

Asp Leu Tyr Trp Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys

340 345 350

Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr

465 470 475 480

Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg

485 490 495

Lys Arg Arg

<210> 8

<211> 499

<212> PRT

<213> Artificial Sequence

<220>

<223> H56N0-66T5

<400> 8

Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser

165 170 175

Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala

260 265 270

Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Lys Ser Thr Leu Thr Lys

340 345 350

Tyr Asp Ala Arg Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr

465 470 475 480

Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg

485 490 495

Lys Arg Arg

<210> 9

<211> 1500

<212> DNA

<213> Human papillomavirus type 56

<400> 9

atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60

gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120

agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180

atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240

aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300

tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360

ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420

gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480

acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540

accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600

gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780

aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840

ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020

atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080

tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140

ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200

aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260

agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380

cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440

agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500

<210> 10

<211> 1497

<212> DNA

<213> Human papillomavirus type 66

<400> 10

atgcccagcg acaacaaggt gtacctgccc cccacccccg tgagcaaggt ggtggccacc 60

gacacctacg tgaagaggac cagcatcttc taccacgccg gcagcagcag gctgctggcc 120

gtgggccacc cctactacag cgtgagcaag agcggcacca agaccaacat ccccaaggtg 180

agcgcctacc agtacagggt gttcagggtg aggctccccg accccaacaa gttcggcctg 240

cccgacccca gcttctacaa ccccgaccag gagaggctgg tgtgggcctg cgtgggcctg 300

gaggtgggca ggggccagcc cctgggcgcc ggcctgagcg gccaccccct gttcaacagg 360

ctggacgaca ccgaggtgag caacctggcc ggcaacaacg tgatcgagga cagcagggac 420

aacatcagcg tggactgcaa gcagacccag ctgtgcatcg tgggctgcgc ccccgccctg 480

ggcgagcact ggaccaaggg cgccgtgtgc aagagcaccc ccggcaacac cggcgactgc 540

ccccccctgg ccctggtgaa cacccccatc gaggacggcg acatggtgga caccggcttc 600

ggcgccatgg acttcaagct gctgcaggag agcaaggccg aggtgcccct ggacatcgtg 660

cagagcacct gcaagtaccc cgactacctg aagatgagcg ccgacgccta cggcgacagc 720

atgtggttct acctgaggag ggagcagctg ttcgccaggc actacttcaa cagggccggc 780

aacgtgggcg aggccatccc caccgacctg tactggaagg gcggcaacgg cagggacccc 840

ccccccagca gcgtgtacgt ggccaccccc agcggcagca tgatcaccag cgaggcccag 900

ctgttcaaca agccctactg gctgcagagg gcccagggcc acaacaacgg catctgctgg 960

ggcaaccagg tgttcgtgac cgtggtggac accaccagga gcaccaacat gaccatcaac 1020

gccgccaaga gcaccctgac caagtacgac gccagggaga tcaaccagta cctgaggcac 1080

gtggaggagt acgagctgca gttcgtgttc cagctgtgca agatcaccct gaccgccgag 1140

gtgatggcct acctgcacaa catgaacaac accctgctgg acgactggaa catcggcctg 1200

agcccccccg tggccaccag cctggaggac aagtacaggt acatcaagag caccgccatc 1260

acctgccaga gggagcagcc ccccgccgag aagcaggacc ccctggccaa gtacaagttc 1320

tgggaggtga acctgcagga cagcttcagc gccgacctgg accagttccc cctgggcagg 1380

aagttcctga tgcagctggg ccccaggccc cccaggccca aggccagcgt gagcgccagc 1440

aagaggaggg ccgcccccac cagcagcagc agcagccccg ccaagaggaa gaagtaa 1497

<210> 11

<211> 1500

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码H56N0-66T1的DNA序列

<400> 11

atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60

gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120

agactgctgg ccgtgggcca cccctactac agcgtgagca agagcggcac caagaccaac 180

atccccaagg tgagcgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240

aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300

tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360

ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420

gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480

acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540

accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600

gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780

aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840

ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020

atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080

tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140

ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200

aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260

agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380

cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440

agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500

<210> 12

<211> 1500

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码H56N0-66T2的DNA序列

<400> 12

atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60

gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120

agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180

atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240

aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300

tgcgtgggcc tggaagtggg caggggccag cccctgggcg ccggcctgag cggccacccc 360

ctgttcaaca ggctggacga caccgaggtg agcaacctgg ccggcaacaa cgtgatcgag 420

gacagcaggg acaacatcag cgtggactgc aagcagaccc agctgtgcat cgtgggctgc 480

acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540

accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600

gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780

aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840

ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020

atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080

tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140

ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200

aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260

agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380

cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440

agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500

<210> 13

<211> 1500

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码H56N0-66T3的DNA序列

<400> 13

atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60

gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120

agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180

atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240

aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300

tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360

ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420

gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480

acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccccggcaac 540

accggcgact gcccccccct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600

gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780

aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840

ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020

atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080

tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140

ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200

aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260

agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380

cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440

agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500

<210> 14

<211> 1500

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码H56N0-66T4的DNA序列

<400> 14

atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60

gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120

agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180

atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240

aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300

tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360

ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420

gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480

acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540

accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600

gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780

aacagggccg gcaacgtggg cgaggccatc cccaccgacc tgtactggaa gggcggcaac 840

ggcagggacc ccccccccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020

atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080

tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140

ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200

aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260

agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380

cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440

agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500

<210> 15

<211> 1500

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码H56N0-66T5的DNA序列

<400> 15

atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60

gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120

agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180

atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240

aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300

tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360

ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420

gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480

acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540

accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600

gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780

aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840

ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020

atgaccatca gcaccgccaa gagcaccctg accaagtacg acgccaggga gatcaaccag 1080

tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140

ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200

aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260

agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380

cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440

agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500

<210> 16

<211> 21

<212> PRT

<213> Human papillomavirus type 66

<400> 16

Val Ser Asn Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn

1 5 10 15

Ile Ser Val Asp Cys

20

<210> 17

<211> 11

<212> PRT

<213> Human papillomavirus type 66

<400> 17

Lys Ser Thr Leu Thr Lys Tyr Asp Ala Arg Glu

1 5 10

<210> 18

<211> 3

<212> PRT

<213> Human papillomavirus type 66

<400> 18

Pro Gly Asn

1

<210> 19

<211> 19

<212> PRT

<213> Human papillomavirus type 66

<400> 19

Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp Lys Gly Gly Asn

1 5 10 15

Gly Arg Asp

<210> 20

<211> 4

<212> PRT

<213> Human papillomavirus type 66

<400> 20

Ser Lys Ser Gly

1

<210> 21

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 21

tacagcgtga gcaagagcgg caccaagacc aacatcccca ag 42

<210> 22

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 22

cttggtgccg ctcttgctca cgctgtagta ggggtggccc ac 42

<210> 23

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 23

cacttccagg cccacgcagg ccca 24

<210> 24

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 24

aagcagaccc agctgtgcat cgtg 24

<210> 25

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 25

agcacccccg gcaacaccgg cgactgcccc cccctggccc tg 42

<210> 26

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 26

gccggtgttg ccgggggtgc tcttgcacac ggcgcccttg gt 42

<210> 27

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 27

gtgccgggcg aacagctgct cccg 24

<210> 28

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 28

gccaccccca gcggcagcat gatc 24

<210> 29

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 29

ggcggtgctg atggtcatgt tggt 24

<210> 30

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 30

atcaaccagt acctgcggca cgtg 24

<210> 31

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 31

tgggcctgcg tgggcctgga agtgggcagg ggccagcccc tgggc 45

<210> 32

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 32

cacgatgcac agctgggtct gcttgcagtc cacgctgatg ttgtc 45

<210> 33

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 33

cgggagcagc tgttcgcccg gcactacttc aacagggccg gcaac 45

<210> 34

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 34

gatcatgctg ccgctggggg tggccacgta cacgctgctg ggggg 45

<210> 35

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 35

accaacatga ccatcagcac cgccaagagc accctgacca agtac 45

<210> 36

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 引物

<400> 36

cacgtgccgc aggtactggt tgatctccct ggcgtcgtac ttggt 45

<210> 37

<211> 1509

<212> DNA

<213> Human papillomavirus type 66

<400> 37

atggccatgt ggaggcccag cgacaacaag gtgtacctgc cccccacccc cgtgagcaag 60

gtggtggcca ccgacaccta cgtgaagagg accagcatct tctaccacgc cggcagcagc 120

aggctgctgg ccgtgggcca cccctactac agcgtgagca agagcggcac caagaccaac 180

atccccaagg tgagcgccta ccagtacagg gtgttcaggg tgaggctccc cgaccccaac 240

aagttcggcc tgcccgaccc cagcttctac aaccccgacc aggagaggct ggtgtgggcc 300

tgcgtgggcc tggaggtggg caggggccag cccctgggcg ccggcctgag cggccacccc 360

ctgttcaaca ggctggacga caccgaggtg agcaacctgg ccggcaacaa cgtgatcgag 420

gacagcaggg acaacatcag cgtggactgc aagcagaccc agctgtgcat cgtgggctgc 480

gcccccgccc tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccccggcaac 540

accggcgact gcccccccct ggccctggtg aacaccccca tcgaggacgg cgacatggtg 600

gacaccggct tcggcgccat ggacttcaag ctgctgcagg agagcaaggc cgaggtgccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgagg agggagcagc tgttcgccag gcactacttc 780

aacagggccg gcaacgtggg cgaggccatc cccaccgacc tgtactggaa gggcggcaac 840

ggcagggacc ccccccccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcaga gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca ggtgttcgtg accgtggtgg acaccaccag gagcaccaac 1020

atgaccatca acgccgccaa gagcaccctg accaagtacg acgccaggga gatcaaccag 1080

tacctgaggc acgtggagga gtacgagctg cagttcgtgt tccagctgtg caagatcacc 1140

ctgaccgccg aggtgatggc ctacctgcac aacatgaaca acaccctgct ggacgactgg 1200

aacatcggcc tgagcccccc cgtggccacc agcctggagg acaagtacag gtacatcaag 1260

agcaccgcca tcacctgcca gagggagcag ccccccgccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggaggt gaacctgcag gacagcttca gcgccgacct ggaccagttc 1380

cccctgggca ggaagttcct gatgcagctg ggccccaggc cccccaggcc caaggccagc 1440

gtgagcgcca gcaagaggag ggccgccccc accagcagca gcagcagccc cgccaagagg 1500

aagaagtaa 1509

<210> 38

<211> 499

<212> PRT

<213> Artificial Sequence

<220>

<223> H56N0-66T1-66T5-53S3

<400> 38

Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro

35 40 45

Tyr Tyr Ser Val Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val

50 55 60

Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn

65 70 75 80

Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg

85 90 95

Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu

100 105 110

Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr

115 120 125

Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp

130 135 140

Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys

145 150 155 160

Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Thr Ala Cys Arg Ser

165 170 175

Thr Pro Thr Thr Ala Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr

180 185 190

Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp

195 200 205

Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val

210 215 220

Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala

225 230 235 240

Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala

245 250 255

Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala

260 265 270

Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser

275 280 285

Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln

290 295 300

Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn

305 310 315 320

Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr

325 330 335

Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Lys Ser Thr Leu Thr Lys

340 345 350

Tyr Asp Ala Arg Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr

355 360 365

Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu

370 375 380

Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp

385 390 395 400

Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr

405 410 415

Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro

420 425 430

Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn

435 440 445

Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg

450 455 460

Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr

465 470 475 480

Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg

485 490 495

Lys Arg Arg

<210> 39

<211> 1500

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码SEQ ID NO:38的DNA序列

<400> 39

atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60

gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120

agactgctgg ccgtgggcca cccctactac agcgtgagca agagcggcac caagaccaac 180

atccccaagg tgagcgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240

aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300

tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360

ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420

gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480

acacccgcca tgggcgagca ctggaccaag ggcaccgctt gccgttctac cccgaccacc 540

gctggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600

gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660

ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720

tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780

aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840

ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900

agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960

ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020

atgaccatca gcaccgccaa atctaccctg accaaatacg acgctcgtga aatcaaccag 1080

tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140

ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200

aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260

agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320

aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380

cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440

agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500

<210> 40

<211> 499

<212> PRT

<213> Human papillomavirus type 53

<400> 40

Met Ala Val Trp Arg Pro Ser Asp Ser Lys Val Tyr Leu Pro Pro Thr

1 5 10 15

Pro Val Ser Lys Val Ile Thr Thr Asp Ala Tyr Val Lys Arg Thr Thr

20 25 30

Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Thr Val Gly His Pro

35 40 45

Tyr Tyr Pro Ile Ser Lys Ser Gly Lys Ala Asp Ile Pro Lys Val Ser

50 55 60

Ala Phe Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys

65 70 75 80

Phe Gly Leu Pro Asp Thr Asn Ile Phe Asn Pro Asp Gln Glu Arg Leu

85 90 95

Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly

100 105 110

Val Gly Val Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu

115 120 125

Ser Ser Ser Ile Ala Ile Gln Asp Thr Ala Pro Asp Ser Arg Asp Asn

130 135 140

Val Ser Val Asp Pro Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys Ala

145 150 155 160

Pro Ala Ile Gly Glu His Trp Thr Lys Gly Thr Ala Cys Arg Ser Thr

165 170 175

Pro Thr Thr Ala Gly Asp Cys Pro Pro Leu Glu Leu Ile Asn Ser Pro

180 185 190

Ile Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Ala Leu Asn Phe

195 200 205

Lys Ala Leu Gln Glu Ser Lys Ser Asp Val Pro Leu Asp Ile Val Gln

210 215 220

Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr

225 230 235 240

Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Thr Arg

245 250 255

His Phe Phe Asn Arg Ala Gly Val Ile Gly Glu Glu Ile Pro Asn Asp

260 265 270

Leu Tyr Ile Lys Gly Ser Asn Gly Arg Asp Pro Pro Pro Ser Ser Val

275 280 285

Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu

290 295 300

Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly

305 310 315 320

Ile Cys Trp Asn Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr Arg

325 330 335

Asn Thr Asn Met Thr Leu Ser Ala Thr Thr Gln Ser Met Ser Thr Tyr

340 345 350

Asn Ser Lys Gln Ile Lys Gln Tyr Val Arg His Ala Glu Glu Tyr Glu

355 360 365

Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Ser Leu Ser Ala Glu Val

370 375 380

Met Ala Tyr Leu His Thr Met Asn Ser Thr Leu Leu Glu Asp Trp Asn

385 390 395 400

Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg

405 410 415

Tyr Val Lys Ser Ala Ala Ile Thr Cys Gln Lys Asp Gln Pro Pro Pro

420 425 430

Glu Lys Gln Asp Pro Leu Ser Lys Tyr Lys Phe Trp Glu Val Asn Leu

435 440 445

Gln Asn Ser Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys

450 455 460

Phe Leu Met Gln Val Gly Val Arg Thr Lys Pro Pro Val Ser Ser Lys

465 470 475 480

Lys Arg Ser Ala Ser Thr Thr Ser Thr Ser Ala Pro Ser Ser Lys Arg

485 490 495

Lys Arg Lys

<210> 41

<211> 1500

<212> DNA

<213> Human papillomavirus type 53

<400> 41

atggccgtgt ggaggcccag cgacagcaag gtgtacctgc cccccacccc cgtgagcaag 60

gtgatcacca ccgacgccta cgtgaagagg accaccatct tctaccacgc cggcagcagc 120

aggctgctga ccgtgggcca cccctactac cccatcagca agagcggcaa ggccgacatc 180

cccaaggtga gcgccttcca gtacagggtg ttcagggtga ggctgcccga ccccaacaag 240

ttcggcctgc ccgacaccaa catcttcaac cccgaccagg agaggctggt gtgggcctgc 300

gtgggcctgg agatcggcag gggccagccc ctgggcgtgg gcgtgagcgg ccaccccctg 360

ttcaacaggc tggacgacac cgagagcagc agcatcgcca tccaggacac cgcccccgac 420

agcagggaca acgtgagcgt ggaccccaag cagacccagc tgtgcatcat cggctgcgcc 480

cccgccatcg gcgagcactg gaccaagggc accgcctgca ggagcacccc caccaccgcc 540

ggcgactgcc cccccctgga gctgatcaac agccccatcg aggacggcga catggtggac 600

accggcttcg gcgccctgaa cttcaaggcc ctgcaggaga gcaagagcga cgtgcccctg 660

gacatcgtgc agagcacctg caagtacccc gactacctga agatgagcgc cgacgcctac 720

ggcgacagca tgtggttcta cctgaggagg gagcagctgt tcaccaggca cttcttcaac 780

agggccggcg tgatcggcga ggagatcccc aacgacctgt acatcaaggg cagcaacggc 840

agggaccccc cccccagcag cgtgtacgtg gccaccccca gcggcagcat gatcaccagc 900

gaggcccagc tgttcaacaa gccctactgg ctgcagaggg cccagggcca caacaacggc 960

atctgctgga acaaccagct gttcgtgacc gtggtggaca ccaccaggaa caccaacatg 1020

accctgagcg ccaccaccca gagcatgagc acctacaaca gcaagcagat caagcagtac 1080

gtgaggcacg ccgaggagta cgagctgcag ttcgtgttcc agctgtgcaa gatcagcctg 1140

agcgccgagg tgatggccta cctgcacacc atgaacagca ccctgctgga ggactggaac 1200

atcggcctga gcccccccgt ggccaccagc ctggaggaca agtacaggta cgtgaagagc 1260

gccgccatca cctgccagaa ggaccagccc ccccccgaga agcaggaccc cctgagcaag 1320

tacaagttct gggaggtgaa cctgcagaac agcttcagcg ccgacctgga ccagttcccc 1380

ctgggcagga agttcctgat gcaggtgggc gtgaggacca agccccccgt gagcagcaag 1440

aagaggagcg ccagcaccac cagcaccagc gcccccagca gcaagaggaa gaggaagtaa 1500

<210> 42

<211> 495

<212> PRT

<213> Human papillomavirus type 53

<400> 42

Met Pro Ser Asp Ser Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys

1 5 10 15

Val Ile Thr Thr Asp Ala Tyr Val Lys Arg Thr Thr Ile Phe Tyr His

20 25 30

Ala Gly Ser Ser Arg Leu Leu Thr Val Gly His Pro Tyr Tyr Pro Ile

35 40 45

Ser Lys Ser Gly Lys Ala Asp Ile Pro Lys Val Ser Ala Phe Gln Tyr

50 55 60

Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro

65 70 75 80

Asp Thr Asn Ile Phe Asn Pro Asp Gln Glu Arg Leu Val Trp Ala Cys

85 90 95

Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Val Ser

100 105 110

Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Ser Ser Ser Ile

115 120 125

Ala Ile Gln Asp Thr Ala Pro Asp Ser Arg Asp Asn Val Ser Val Asp

130 135 140

Pro Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Ala Ile Gly

145 150 155 160

Glu His Trp Thr Lys Gly Thr Ala Cys Arg Ser Thr Pro Thr Thr Ala

165 170 175

Gly Asp Cys Pro Pro Leu Glu Leu Ile Asn Ser Pro Ile Glu Asp Gly

180 185 190

Asp Met Val Asp Thr Gly Phe Gly Ala Leu Asn Phe Lys Ala Leu Gln

195 200 205

Glu Ser Lys Ser Asp Val Pro Leu Asp Ile Val Gln Ser Thr Cys Lys

210 215 220

Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser Met

225 230 235 240

Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Thr Arg His Phe Phe Asn

245 250 255

Arg Ala Gly Val Ile Gly Glu Glu Ile Pro Asn Asp Leu Tyr Ile Lys

260 265 270

Gly Ser Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala Thr

275 280 285

Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys Pro

290 295 300

Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn

305 310 315 320

Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr Arg Asn Thr Asn Met

325 330 335

Thr Leu Ser Ala Thr Thr Gln Ser Met Ser Thr Tyr Asn Ser Lys Gln

340 345 350

Ile Lys Gln Tyr Val Arg His Ala Glu Glu Tyr Glu Leu Gln Phe Val

355 360 365

Phe Gln Leu Cys Lys Ile Ser Leu Ser Ala Glu Val Met Ala Tyr Leu

370 375 380

His Thr Met Asn Ser Thr Leu Leu Glu Asp Trp Asn Ile Gly Leu Ser

385 390 395 400

Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Val Lys Ser

405 410 415

Ala Ala Ile Thr Cys Gln Lys Asp Gln Pro Pro Pro Glu Lys Gln Asp

420 425 430

Pro Leu Ser Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asn Ser Phe

435 440 445

Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met Gln

450 455 460

Val Gly Val Arg Thr Lys Pro Pro Val Ser Ser Lys Lys Arg Ser Ala

465 470 475 480

Ser Thr Thr Ser Thr Ser Ala Pro Ser Ser Lys Arg Lys Arg Lys

485 490 495

<210> 43

<211> 1488

<212> DNA

<213> Human papillomavirus type 53

<400> 43

atgcccagcg acagcaaggt gtacctgccc cccacccccg tgagcaaggt gatcaccacc 60

gacgcctacg tgaagaggac caccatcttc taccacgccg gcagcagcag gctgctgacc 120

gtgggccacc cctactaccc catcagcaag agcggcaagg ccgacatccc caaggtgagc 180

gccttccagt acagggtgtt cagggtgagg ctgcccgacc ccaacaagtt cggcctgccc 240

gacaccaaca tcttcaaccc cgaccaggag aggctggtgt gggcctgcgt gggcctggag 300

atcggcaggg gccagcccct gggcgtgggc gtgagcggcc accccctgtt caacaggctg 360

gacgacaccg agagcagcag catcgccatc caggacaccg cccccgacag cagggacaac 420

gtgagcgtgg accccaagca gacccagctg tgcatcatcg gctgcgcccc cgccatcggc 480

gagcactgga ccaagggcac cgcctgcagg agcaccccca ccaccgccgg cgactgcccc 540

cccctggagc tgatcaacag ccccatcgag gacggcgaca tggtggacac cggcttcggc 600

gccctgaact tcaaggccct gcaggagagc aagagcgacg tgcccctgga catcgtgcag 660

agcacctgca agtaccccga ctacctgaag atgagcgccg acgcctacgg cgacagcatg 720

tggttctacc tgaggaggga gcagctgttc accaggcact tcttcaacag ggccggcgtg 780

atcggcgagg agatccccaa cgacctgtac atcaagggca gcaacggcag ggaccccccc 840

cccagcagcg tgtacgtggc cacccccagc ggcagcatga tcaccagcga ggcccagctg 900

ttcaacaagc cctactggct gcagagggcc cagggccaca acaacggcat ctgctggaac 960

aaccagctgt tcgtgaccgt ggtggacacc accaggaaca ccaacatgac cctgagcgcc 1020

accacccaga gcatgagcac ctacaacagc aagcagatca agcagtacgt gaggcacgcc 1080

gaggagtacg agctgcagtt cgtgttccag ctgtgcaaga tcagcctgag cgccgaggtg 1140

atggcctacc tgcacaccat gaacagcacc ctgctggagg actggaacat cggcctgagc 1200

ccccccgtgg ccaccagcct ggaggacaag tacaggtacg tgaagagcgc cgccatcacc 1260

tgccagaagg accagccccc ccccgagaag caggaccccc tgagcaagta caagttctgg 1320

gaggtgaacc tgcagaacag cttcagcgcc gacctggacc agttccccct gggcaggaag 1380

ttcctgatgc aggtgggcgt gaggaccaag ccccccgtga gcagcaagaa gaggagcgcc 1440

agcaccacca gcaccagcgc ccccagcagc aagaggaaga ggaagtaa 1488

<210> 44

<211> 10

<212> PRT

<213> Human papillomavirus type 53

<400> 44

Thr Ala Cys Arg Ser Thr Pro Thr Thr Ala

1 5 10

72页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种人乳头瘤病毒68型L1蛋白的突变体

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!