一种人***瘤病毒56型l1蛋白的突变体
阅读说明:本技术 一种人***瘤病毒56型l1蛋白的突变体 (mutant of human papilloma virus 56 type L1 protein ) 是由 俞海 王大宁 魏双萍 郑清炳 李少伟 夏宁邵 于 2019-06-04 设计创作,主要内容包括:本发明涉及一种突变的HPV56L1蛋白(或其变体),其编码序列和制备方法,以及包含其的病毒样颗粒,所述蛋白(或其变体)和病毒样颗粒能够诱发抗至少两个型别的HPV(例如,HPV56和HPV66,或者HPV56、HPV53和HPV66)的中和抗体,从而可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如宫颈癌和尖锐湿疣。本发明还涉及上述蛋白和病毒样颗粒用于制备药物组合物或疫苗的用途,所述药物组合物或疫苗可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如宫颈癌和尖锐湿疣。(The present invention relates to a mutated HPV56L1 protein (or a variant thereof), a coding sequence and a preparation method thereof, and virus-like particles comprising the same, which are capable of inducing neutralizing antibodies against at least two types of HPV (e.g., HPV56 and HPV66, or HPV56, HPV53 and HPV66), thereby being useful for preventing infection by the at least two types of HPV and diseases caused by the infection, such as cervical cancer and condyloma acuminata. The invention also relates to the use of the above proteins and virus-like particles for the preparation of a pharmaceutical composition or vaccine useful for the prevention of HPV infections of said at least two types and diseases caused by said infections, such as cervical cancer and condyloma acuminata.)
本申请是以CN申请号为201810566209.2,申请日为2018年6月4日的申请为基础,并主张其优先权,该CN申请的公开内容在此作为整体引入本申请中。
技术领域
本发明涉及分子病毒学和免疫学领域。具体地,本发明涉及一种突变的HPV56 L1蛋白(或其变体),其编码序列和制备方法,以及包含其的病毒样颗粒,所述蛋白(或其变体)和病毒样颗粒能够诱发抗至少两个型别的HPV(例如,HPV66和HPV56,或者HPV66、HPV56和HPV53)的中和抗体,从而可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如***和***。本发明还涉及上述蛋白和病毒样颗粒用于制备药物组合物或疫苗的用途,所述药物组合物或疫苗可用于预防所述至少两个型别的HPV感染以及由所述感染所导致的疾病例如***和***。
背景技术
人***瘤病毒(Human Papillomavirus,HPV))主要引起皮肤,粘膜的疣状病变。根据其与肿瘤发生的关系,HPV可分为高危型与低危型,其中高危型的HPV感染被证实是诱发包括女性***在内的生殖器癌症主要原因;低危型则主要引起***。预防与控制HPV感染的最有效方式是HPV疫苗,特别是能引起***的高危型HPV疫苗。
HPV的主要衣壳蛋白L1具有自组装为空心病毒样颗粒(Virus-Like Particle,VLP)的特性。HPV VLP是由72个主要衣壳蛋白L1的五聚体相互作用构成的二十面体立体对称结构(Doorbar,J.and P.H.Gallimore.1987.J Virol,61(9):2793-9)。HPV VLP结构与天然HPV高度相似,保留了天然病毒的绝大多数中和表位,可诱导高滴度的中和抗体(Kirnbauer,R.,F.Booy,et al.1992Proc Natl Acad Sci U S A 89(24):12180-4)。
现有的研究发现,HPV VLP主要诱导针对同型HPV的中和抗体,产生针对同型HPV的保护性免疫,仅在一些同源性高的型别之间存在较低的交叉保护(Sara L.Bissett,GiadaMattiuzzo,et al.2014Vaccine.32:6548-6555)。因此,现有的HPV疫苗的保护范围非常有限。通常,一个型别的HPV VLP只能用于预防该型别的HPV感染。在这种情况下,如果要扩大HPV疫苗的保护范围,只能在疫苗中增加更多型别的HPV VLP型别。目前已上市的HPV疫苗,包括Merck公司的(其为针对HPV16、18、6和11的四价疫苗)和(其为针对HPV6、11、16、18、31、33、45、52和58的九价疫苗)和GSK公司的(其为针对HPV16和18的二价疫苗),均是通过混合单独型别的HPV VLP制备而成的。然而,这种方案将导致HPV疫苗的生产成本大大提高,并且可能因为免疫剂量的增加而导致潜在的安全性问题。
因此,本领域仍然需要开发能够诱导针对多个型别的HPV的保护性中和抗体的HPV病毒样颗粒,以更经济、有效地预防多个型别的HPV感染和由此导致的疾病例如***和***。
发明内容
本发明至少部分基于发明人的下述出人意料的发现:将人***瘤病毒(HPV)56型L1蛋白中的特定区段置换为第二型别的HPV(例如HPV66)L1蛋白的相应区段后,所获得的突变的HPV56 L1蛋白能够诱导机体产生针对HPV56和第二型别的HPV(例如HPV66)的高滴度中和抗体,其保护效果与混合的HPV56VLP和第二型别的HPV VLP相当,并且针对HPV56的保护效果与单独的HPV56VLP相当,且针对第二型别的HPV(例如HPV66)的保护效果与单独的第二型别的HPV VLP相当。
此外,在上述置换的基础上,还可以将HPV56 L1蛋白中的另一个特定区段进一步置换为第三型别的HPV(例如HPV53)L1蛋白的相应区段,由此所获得的含有双置换的突变的HPV56 L1蛋白能够诱导机体产生针对HPV56、第二型别的HPV(例如HPV66)和第三型别的HPV(例如HPV53)的高滴度中和抗体,其保护效果与混合的HPV56VLP、第二型别的HPV VLP和第三型别的HPV VLP相当;并且,其针对HPV56的保护效果与单独的HPV56VLP相当,针对第二型别的HPV(例如HPV66)的保护效果与单独的第二型别的HPV VLP相当,且针对第三型别的HPV(例如HPV53)的保护效果与单独的第三型别的HPV VLP相当。
因此,在一个方面,本发明提供了一种突变的HPV56 L1蛋白或其变体,其中,所述突变的HPV56 L1蛋白与野生型HPV56 L1蛋白相比,具有下述突变:
(1)位于野生型HPV56 L1蛋白第130-150位的氨基酸残基被替换为第二型别的野生型HPV L1蛋白的相应位置的氨基酸残基;或
(2)位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为第二型别的野生型HPV L1蛋白的相应位置的氨基酸残基;
或者,所述突变的HPV56 L1蛋白与野生型HPV56 L1蛋白相比,具有(2)中所定义的突变,并且还具有下述突变:
(3)位于野生型HPV56 L1蛋白第53-56位的氨基酸残基被替换为第二型别的野生型HPV L1蛋白的相应位置的氨基酸残基,并且
(4)位于野生型HPV56 L1蛋白第172-181位的氨基酸残基被替换为第三型别的野生型HPV L1蛋白的相应位置的氨基酸残基;
并且,所述变体与所述突变的HPV56 L1蛋白相异仅在于一个或几个(例如,1个、2个、3个、4个、5个、6个、7个、8或9个)氨基酸的置换(优选保守置换)、添加或缺失,且保留了所述突变的HPV56 L1蛋白的功能,即,能够诱导针对至少两个型别的HPV(例如,HPV56和HPV66或HPV56、HPV66和HPV53)的中和抗体。
在某些优选的实施方案中,所述第二型别的野生型HPV为HPV66。在某些优选的实施方案中,(1)中所述的相应位置的氨基酸残基为野生型HPV66 L1蛋白第130-150位的氨基酸残基。在某些优选的实施方案中,(2)中所述的相应位置的氨基酸残基为野生型HPV66 L1蛋白第347-357位的氨基酸残基。在某些优选的实施方案中,(3)中所述的相应位置的氨基酸残基为野生型HPV66 L1蛋白第53-56位的氨基酸残基。
在某些优选的实施方案中,所述第三型别的野生型HPV为HPV53。在某些优选的实施方案中,(4)中所述的相应位置的氨基酸残基为野生型HPV53 L1蛋白第171-180位的氨基酸残基。
在某些优选的实施方案中,所述野生型HPV56 L1蛋白具有如SEQ ID NO:1所示的氨基酸序列。
在某些优选的实施方案中,所述野生型HPV66 L1蛋白具有如SEQ ID NO:2或3所示的氨基酸序列。
在某些优选的实施方案中,所述野生型HPV53 L1蛋白具有如SEQ ID NO:40或42所示的氨基酸序列。
在某些优选的实施方案中,所述野生型HPV66 L1蛋白第130-150位的氨基酸残基的序列如SEQ ID NO:16所示。
在某些优选的实施方案中,所述野生型HPV66 L1蛋白第347-357位的氨基酸残基的序列如SEQ ID NO:17所示。
在某些优选的实施方案中,所述野生型HPV66 L1蛋白第53-56位的氨基酸残基的序列如SEQ ID NO:20所示。
在某些优选的实施方案中,所述野生型HPV53 L1蛋白第171-180位的氨基酸残基的序列如SEQ ID NO:44所示。
在某些优选的实施方案中,所述突变的HPV56 L1蛋白具有选自下列的氨基酸序列:SEQ ID NO:5、8和38。
在另一个方面,本发明提供了一种分离的核酸,其编码如上所述的突变的HPV56L1蛋白或其变体。在另一个方面,本发明提供了一种载体,其包含所述分离的核酸。在某些优选的实施方案中,本发明的分离的核酸具有选自下列的核苷酸序列:SEQ ID NO:12、15和39。
可用于***目的多核苷酸的载体是本领域公知的,包括但不限于克隆载体和表达载体。在一个实施方案中,载体是例如质粒,粘粒,噬菌体等等。
在另一个方面,本发明还涉及包含上述分离的核酸或载体的宿主细胞。此类宿主细胞包括但不限于,原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例如小鼠细胞、人细胞等)。本发明的宿主细胞还可以是细胞系,例如293T细胞。
在另一个方面,本发明涉及一种HPV病毒样颗粒,其中该病毒样颗粒含有本发明的突变的HPV56L1蛋白或其变体,或者由本发明的突变的HPV56 L1蛋白或其变体组成或形成。
在某些优选的实施方案中,本发明的HPV病毒样颗粒包含突变的HPV56L1蛋白,其与野生型HPV56 L1蛋白相比,位于野生型HPV56 L1蛋白第130-150位的氨基酸残基被替换为野生型HPV66 L1蛋白第130-150位的氨基酸残基。
在某些优选的实施方案中,本发明的HPV病毒样颗粒包含突变的HPV56 L1蛋白,其与野生型HPV56 L1蛋白相比,位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV66 L1蛋白第347-357位的氨基酸残基。
在某些优选的实施方案中,本发明的HPV病毒样颗粒包含突变的HPV56 L1蛋白,其与野生型HPV56 L1蛋白相比,位于野生型HPV56 L1蛋白第53-56位的氨基酸残基被替换为野生型HPV66 L1蛋白第53-56位的氨基酸残基,且位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV66 L1蛋白第347-357位的氨基酸残基,且位于野生型HPV56L1蛋白第172-181位的氨基酸残基被替换为野生型HPV53 L1蛋白第171-180位的氨基酸残基。
在一个特别优选的实施方案中,本发明的HPV病毒样颗粒包含突变的HPV56 L1蛋白,其具有SEQ ID NO:5、8或38所示的序列。
在另一个方面,本发明还涉及包含上述突变的HPV56 L1蛋白或其变体,或上述分离的核酸或载体或宿主细胞或HPV病毒样颗粒的组合物。在某些优选的实施方案中,所述组合物包含本发明的突变的HPV56 L1蛋白或其变体。在某些优选的实施方案中,所述组合物包含本发明的HPV病毒样颗粒。
在另一个方面,本发明还涉及一种药物组合物或疫苗,其包含本发明的HPV病毒样颗粒,任选地还包含药学可接受的载体和/或赋形剂。本发明的药物组合物或疫苗可以用于预防HPV感染或由HPV感染所导致的疾病例如***和***。
在某些优选的实施方案中,所述HPV病毒样颗粒以预防HPV感染或由HPV感染导致的疾病的有效量存在。在某些优选的实施方案中,所述HPV感染是一个或多个型别的HPV感染(例如,HPV56感染、HPV53感染和/或HPV66感染)。在某些优选的实施方案中,所述由HPV感染所导致的疾病选自***和***。
本发明的药物组合物或疫苗可通过本领域公知的方法进行施用,例如但不限于通过口服或者注射进行施用。在本发明中,特别优选的施用方式是注射。
在某些优选的实施方案中,本发明的药物组合物或疫苗以单位剂量形式进行施用。例如但不意欲限定本发明,每单位剂量中包含的HPV病毒样颗粒的量为5μg-80μg,优选20μg-40μg。
在另一个方面,本发明涉及一种制备如上所述的突变的HPV56 L1蛋白或其变体的方法,其包括,在宿主细胞中表达所述突变的HPV56 L1蛋白或其变体,然后从所述宿主细胞的培养物中回收所述突变的HPV56 L1蛋白或其变体。
在某些优选的实施方案中,所述宿主细胞为大肠杆菌。
在某些优选的实施方案中,所述方法包括步骤:在大肠杆菌中表达所述突变的HPV56 L1蛋白或其变体,然后从所述大肠杆菌的裂解上清中纯化得到所述突变的HPV56 L1蛋白或其变体。在某些优选的实施方案中,通过色谱法(例如,阳离子交换色谱,羟基磷灰石色谱和/或疏水相互作用色谱),从所述大肠杆菌的裂解上清中回收所述突变的HPV56 L1蛋白或其变体。
在另一个方面,本发明涉及一种制备疫苗的方法,其包括将本发明的HPV病毒样颗粒与药学可接受的载体和/或赋形剂混合。
在另一个方面,本发明涉及一种预防HPV感染或由HPV感染所导致的疾病的方法,其包括将预防有效量的根据本发明的HPV病毒样颗粒或药物组合物或疫苗施用给受试者。在一个优选的实施方案中,所述HPV感染是一个或多个型别的HPV感染(例如,HPV56感染、HPV53感染和/或HPV66感染)。在另一个优选的实施方案中,所述由HPV感染所导致的疾病包括但不限于,***和***。在另一个优选的实施方案中,所述受试者是哺乳动物,例如人。
在另一个方面,还涉及本发明的突变的HPV56 L1蛋白或其变体或HPV病毒样颗粒在制备药物组合物或疫苗中的用途,所述药物组合物或疫苗用于预防HPV感染或由HPV感染所导致的疾病。在一个优选的实施方案中,所述HPV感染是一个或多个型别的HPV感染(例如,HPV56感染、HPV53感染和/或HPV66感染)。在另一个优选的实施方案中,所述由HPV感染所导致的疾病包括但不限于,***和***。
在另一个方面,本发明还涉及本发明的突变的HPV56 L1蛋白或其变体或HPV病毒样颗粒,其用于预防HPV感染或由HPV感染所导致的疾病。在一个优选的实施方案中,所述HPV感染是一个或多个型别的HPV感染(例如,HPV56感染、HPV53感染和/或HPV66感染)。在另一个优选的实施方案中,所述由HPV感染所导致的疾病包括但不限于,***和***。
本发明中相关术语的说明及解释
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的细胞培养、分子遗传学、核酸化学、免疫学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
根据本发明,术语“第二型别的野生型HPV”是指,不同于HPV56的另一型别的野生型HPV。在本发明中,第二型别的野生型HPV优选为野生型HPV66。
根据本发明,术语“第三型别的野生型HPV”是指,不同于HPV56,且不同于第二型别的野生型HPV的另一型别的野生型HPV。在本发明中,第三型别的野生型HPV优选为野生型HPV53。
根据本发明,表述“相应位置”是指,当对序列进行最优比对时,即当序列进行比对以获得最高百分数同一性时,进行比较的序列中的等同位置。根据本发明,术语“野生型HPV56 L1蛋白”是指,天然存在于人***瘤病毒56型(HPV56)中的主要衣壳蛋白L1。野生型HPV56 L1蛋白的序列是本领域公知的,并且可参见各种公共数据库(例如NCBI数据库登录号ALT54892.1、ALT54864.1、ASN77877.1和P36743.1等)。
在本发明中,当提及野生型HPV56 L1蛋白的氨基酸序列时,参照SEQ ID NO:1所示的序列来进行描述。例如,表述“野生型HPV56 L1蛋白的第130-150位氨基酸残基”是指,SEQID NO:1所示的多肽的第130-150位氨基酸残基。“野生型HPV56 L1蛋白的第347-357位氨基酸残基”是指,SEQ ID NO:1所示的多肽的第347-357位氨基酸残基。然而,本领域技术人员理解,野生型HPV56可包括多种分离株,并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步,本领域技术人员理解,尽管可能存在着序列差异,但是HPV56的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95%,例如高于96%,高于97%,高于98%,或高于99%),并且具有实质上相同的生物学功能。因此,在本发明中,术语“野生型HPV56 L1蛋白”不仅包括SEQ ID NO:1所示的蛋白,而且应包括各种HPV56分离株的L1蛋白(例如ALT54892.1、ALT54864.1、ASN77877.1和P36743.1所示的HPV56 L1蛋白)。并且,当描述野生型HPV56 L1蛋白的序列片段时,其不仅包括SEQ ID NO:1的序列片段,还包括各种HPV56分离株的L1蛋白中的相应序列片段。例如,表述“野生型HPV56 L1蛋白的第130-150位氨基酸残基”包括,SEQ ID NO:1的第130-150位氨基酸残基,以及各种HPV56分离株的L1蛋白中的相应片段。
根据本发明,术语“野生型HPV66 L1蛋白”是指,天然存在于人***瘤病毒66型(HPV66)中的主要衣壳蛋白L1。野生型HPV66 L1蛋白的序列是本领域公知的,并且可参见各种公共数据库(例如NCBI数据库登录号ABO76865.1、Q80961.1、和ALT54961.1等)。
在本发明中,当提及野生型HPV66 L1蛋白的氨基酸序列时,参照SEQ ID NO:2所示的序列来进行描述。例如,表述“野生型HPV66 L1蛋白的第130-150位氨基酸残基”是指,SEQID NO:2所示的多肽的第130-150位氨基酸残基;表述“野生型HPV66 L1蛋白的第347-357位氨基酸残基”是指,SEQ ID NO:2所示的多肽的第347-357位氨基酸残基。然而,本领域技术人员理解,野生型HPV66可包括多种分离株,并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步,本领域技术人员理解,尽管可能存在着序列差异,但是HPV66的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95%,例如高于96%,高于97%,高于98%,或高于99%),并且具有实质上相同的生物学功能。因此,在本发明中,术语“野生型HPV66 L1蛋白”不仅包括SEQ ID NO:2所示的蛋白,而且应包括各种HPV66分离株的L1蛋白(例如ABO76865.1、Q80961.1、和ALT54961.1等所示的HPV66 L1蛋白)。并且,当描述野生型HPV66 L1蛋白的序列片段时,其不仅包括SEQ ID NO:2的序列片段,还包括各种HPV66分离株的L1蛋白中的相应序列片段。例如,表述“野生型HPV66 L1蛋白的第130-150位氨基酸残基”包括,SEQ ID NO:2的第130-150位氨基酸残基,以及各种HPV66分离株的L1蛋白中的相应片段。
根据本发明,术语“野生型HPV53 L1蛋白”是指,天然存在于人***瘤病毒53型(HPV53)中的主要衣壳蛋白L1。野生型HPV53 L1蛋白的序列是本领域公知的,并且可参见各种公共数据库(例如NCBI数据库登录号NP041848.1、ANY26596.1、ABU54090.1和ALJ32506.1等)。
在本发明中,当提及野生型HPV53 L1蛋白的氨基酸序列时,参照SEQ ID NO:40所示的序列来进行描述。例如,表述“野生型HPV53 L1蛋白的第171-180位氨基酸残基”是指,SEQ ID NO:40所示的多肽的第171-180位氨基酸残基。然而,本领域技术人员理解,野生型HPV53可包括多种分离株,并且各种分离株的L1蛋白的氨基酸序列之间可能存在着差异。进一步,本领域技术人员理解,尽管可能存在着序列差异,但是HPV53的不同分离株的L1蛋白在氨基酸序列上具有极高的同一性(通常高于95%,例如高于96%,高于97%,高于98%,或高于99%),并且具有实质上相同的生物学功能。因此,在本发明中,术语“野生型HPV53 L1蛋白”不仅包括SEQ ID NO:40所示的蛋白,而且应包括各种HPV53分离株的L1蛋白(例如NP041848.1、ANY26596.1、ABU54090.1和ALJ32506.1所示的HPV53 L1蛋白)。并且,当描述野生型HPV53 L1蛋白的序列片段时,其不仅包括SEQ ID NO:40的序列片段,还包括各种HPV53分离株的L1蛋白中的相应序列片段。例如,表述“野生型HPV53 L1蛋白的第171-180位氨基酸残基”包括,SEQ ID NO:40的第171-180位氨基酸残基,以及各种HPV53分离株的L1蛋白中的相应片段。
根据本发明,表述“相应序列片段”或“相应片段”是指,当对序列进行最优比对时,即当序列进行比对以获得最高百分数同一性时,进行比较的序列中位于等同位置的片段。
根据本发明,表述“N端截短了X个氨基酸”是指,用起始密码子(用于起始蛋白质翻译)编码的甲硫氨酸残基置换蛋白质N末端的第1-X位氨基酸残基。例如,N端截短了5个氨基酸的HPV66 L1蛋白是指,用起始密码子编码的甲硫氨酸残基置换野生型HPV66 L1蛋白N末端的第1-5位氨基酸残基所获得的蛋白质。
根据本发明,术语“变体”是指这样的蛋白,其氨基酸序列与本发明的突变的HPV56L1蛋白(如SEQ ID NO:5或8所示的蛋白)的氨基酸序列相比,具有一个或几个(例如,1个、2个、3个、4个、5个或6个)氨基酸的置换(优选保守置换)、添加或缺失,或者具有至少90%,95%,96%,97%,98%,或99%的同一性,并且其保留了所述突变的HPV56 L1蛋白的功能。在本发明中,术语“突变的HPV56 L1蛋白的功能”是指:能够诱导机体产生针对至少两个型别的HPV(例如,HPV56和HPV66)的中和抗体。术语“同一性”是对核苷酸序列或氨基酸序列的相似性的量度。通常将序列排列起来,以获得最大限度的匹配。“同一性”本身具有本领域公知的意义并且可用公开的算法(例如BLAST)来计算。
根据本发明,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如Align程序(DNAstar,Inc)方便地进行的Needleman等人(1970)J.Mol.Biol.48:443-453的方法来实现。还可使用已整合入ALIGN程序(版本2.0)的E.Meyers和W.Miller(Comput.ApplBiosci.,4:11-17(1988))的算法,使用PAM120权重残基表(weight residue table)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此外,可使用已整合入GCG软件包(可在www.gcg.com上获得)的GAP程序中的Needleman和Wunsch(J MoIBiol.48:444-453(1970))算法,使用Blossum 62矩阵或PAM250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。
如本文中使用的,术语“保守置换”意指不会不利地影响或改变包含氨基酸序列的蛋白/多肽的必要特性的氨基酸置换。例如,可通过本领域内已知的标准技术例如定点诱变和PCR介导的诱变引入保守置换。保守氨基酸置换包括用具有相似侧链的氨基酸残基替代氨基酸残基的置换,例如用在物理学上或功能上与相应的氨基酸残基相似(例如具有相似大小、形状、电荷、化学性质,包括形成共价键或氢键的能力等)的残基进行的置换。已在本领域内定义了具有相似侧链的氨基酸残基的家族。这些家族包括具有碱性侧链(例如,赖氨酸、精氨酸和组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、色氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸)、β分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。因此,保守置换通常是指,用来自相同侧链家族的另一个氨基酸残基替代相应的氨基酸残基。鉴定氨基酸保守置换的方法在本领域内是熟知的(参见,例如,Brummell等人,Biochem.32:1180-1187(1993);Kobayashi等人Protein Eng.12(10):879-884(1999);和Burks等人Proc.Natl Acad.Set USA 94:412-417(1997),其通过引用并入本文)。
根据本发明,术语“大肠杆菌表达系统”是指由大肠杆菌(菌株)与载体组成的表达系统,其中大肠杆菌(菌株)来源于市场上可得到的菌株,例如但不限于:ER2566,BL21(DE3),B834(DE3),BLR(DE3)。
根据本发明,术语“载体(vector)”是指,可将多核苷酸***其中的一种核酸运载工具。当载体能使***的多核苷酸所编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌体;柯斯质粒等等。
根据本发明,术语“药学可接受的载体和/或赋形剂”是指在药理学和/或生理学上与受试者和活性成分相容的载体和/或赋形剂,其是本领域公知的(参见例如Remington'sPharmaceutical Sciences.Edited by Gennaro AR,19th ed.Pennsylvania:MackPublishing Company,1995),并且包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂包括但不限于磷酸盐缓冲液;表面活性剂包括但不限于阳离子,阴离子或者非离子型表面活性剂,例如Tween-80;佐剂包括但不限于铝佐剂(例如氢氧化铝),弗氏佐剂(例如完全弗氏佐剂);离子强度增强剂包括但不限于氯化钠。
根据本发明,术语“有效量”是指能够有效实现预期目的的量。例如,预防疾病(例如HPV感染)有效量是指,能够有效预防,阻止,或延迟疾病(例如HPV感染)的发生的量。测定这样的有效量在本领域技术人员的能力范围之内。
根据本发明,术语“色谱层析”包括但不限于:离子交换色谱(例如阳离子交换色谱)、疏水相互作用色谱、吸附层析法(例如羟基磷灰石色谱)、凝胶过滤(凝胶排阻)层析、亲和层析法。
根据本发明,术语“裂解上清”是指通过下述步骤所产生的溶液:将宿主细胞(例如大肠杆菌)在裂解液中破碎,然后将含有经破碎的宿主细胞的裂解液中的不溶物去除。各种裂解液是本领域技术人员公知的,包括但不限于Tris缓冲液,磷酸盐缓冲液,HEPES缓冲液,MOPS缓冲液等等。此外,可通过本领域技术人员熟知的各种方法来实现宿主细胞的破碎,包括但不限于匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理等等。去除裂解液中的不溶物的方法也是本领域技术人员公知的,包括但不限于过滤和离心。
发明的有益效果
研究表明,虽然HPV56和其他型别的HPV(例如HPV66)之间存在一定的交叉保护,但是这种交叉保护的能力很低,通常低于自身型别的VLP的保护水平的百分之一,甚至低于千分之一。因此,对于接种了HPV56疫苗的受试者来说,其感染其他型别的HPV(例如HPV66)的风险依然很高。
本发明提供了一种突变的HPV56 L1蛋白以及由其形成的HPV病毒样颗粒。本发明的HPV病毒样颗粒能够在HPV56和其他型别的HPV(例如HPV66)之间提供显著的交叉保护能力。特别地,在同等免疫剂量下,本发明的HPV病毒样颗粒能够诱发机体产生针对至少两个型别的HPV(例如,HPV56和HPV66,或者HPV56、HPV66和HPV53)的高滴度中和抗体,并且其效果与多个型别的HPV VLP的混合物(例如,HPV56VLP和HPV66VLP的混合物,或者HPV56VLP、HPV66VLP和HPV53VLP的混合物)相当。因此,本发明的HPV病毒样颗粒能够用于同时预防两个或三个型别的HPV(例如HPV56和HPV66,或者HPV56、HPV66和HPV53)的感染以及与此相关的疾病,具有显著的有利技术效果。这在扩大HPV疫苗的保护范围和降低HPV疫苗的生产成本等方面具有特别显著的优势。
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
附图说明
图1显示了实施例1中经纯化的突变蛋白的SDS聚丙烯酰胺凝胶电泳的结果。泳道1:蛋白分子量标记;泳道2:HPV56N0(全长的HPV56 L1蛋白);泳道3:HPV66N5(N端截短5个氨基酸的HPV66 L1蛋白);泳道4:H56N0-66T1;泳道5:H56N0-66T2;泳道6:H56N0-66T3;泳道7:H56N0-66T4;泳道8:H56N0-66T5;泳道9:蛋白分子量标记;泳道8:H56N0-66T1-66T5-53S3。结果显示,经过色谱纯化后,突变蛋白H56N0-66T1、H56N0-66T2、H56N0-66T3、H56N0-66T4、H56N0-66T5的纯度达到90%左右,H56N0-66T1-66T5-53S3的纯度达到80%左右。
图2显示了用HPV L1广谱抗体4B3检测实施例1中制备的H56N0-66T1、H56N0-66T2、H56N0-66T3、H56N0-66T4、H56N0-66T5的蛋白质免疫印迹检测的结果。泳道1:HPV56N0(全长的HPV56 L1蛋白);泳道2:HPV66N5(N端截短5个氨基酸的HPV66 L1蛋白);泳道3:H56N0-66T1;泳道4:H56N0-66T2;泳道5:H56N0-66T3;泳道6:H56N0-66T4;泳道7:H56N0-66T5。结果显示,突变蛋白H56N0-66T1、H56N0-66T2、H56N0-66T3、H56N0-66T4、H56N0-66T5能够被广谱抗体4B3特异性识别。
图3显示了包含蛋白H56N0-66T1、H56N0-66T2、H56N0-66T3、H56N0-66T4、H56N0-66T5、H56N0-66T1-66T5-53S3的样品的分子筛层析分析的结果。结果显示,包含蛋白H56N0-66T1、H56N0-66T2、H56N0-66T4、H56N0-66T5、H56N0-66T1-66T5-53S3的样品最先出现的蛋白峰均在13-14min左右,与HPV56N0相当;H56N0-66T3的主峰时间为15min左右,肩缝时间为14min,说明H56N0-66T3形成的VLP颗粒大小不均一。结果表明除突变蛋白H56N0-66T3外,其余突变蛋白均可形成均一的VLP。
图4显示了突变的H56N0-66T1VLP、H56N0-66T2VLP、H56N0-66T3VLP、H56N0-66T4VLP、H56N0-66T5VLP、H56N0-66T1-66T5-53S3VLP的沉降速率分析的结果。结果显示,H56N0-66T1VLP、H56N0-66T2VLP、H56N0-66T3VLP、H56N0-66T4VLP、H56N0-66T5VLP、H56N0-66T1-66T5-53S3VLP的沉降系数分别为135S、139S、78S、136S、139S和135S。这表明,如上制备的6种突变的HPV56 L1蛋白除H56N0-66T3外其余均能够组装成大小、形态与野生型VLP(HPV56N0VLP,134S)相似的病毒样颗粒。
图5A至图5H显示了各种VLP样品的透射电镜观察结果(放大倍数为100,000倍,Bar=0.1μm)。图5A:HPV56N0VLP;图5B:H56N0-66T1VLP;图5C:HPV56N0-66T2VLP;图5D:H56N0-66T3VLP;图5E:H56N0-66T4VLP;图5F:H56N0-66T5VLP;图5G:H56N0-66T1-66T5-53S3VLP;图5H:HPV66N5VLP。结果显示,H56N0-66T1VLP、H56N0-66T2VLP、H56N0-66T4VLP、H56N0-66T5VLP、H56N0-66T1-66T5-53S3VLP与HPV56N0类似,都能够组装成半径为25nm左右的VLP;H56N0-66T3VLP组装的颗粒不均一,半径在15-25nm之间。
图6A-图6C显示了用H56N0-66T1VLP、H56N0-66T2VLP、H56N0-66T3VLP、H56N0-66T4VLP和H56N0-66T5VLP免疫小鼠后小鼠血清中的中和抗体滴度的评价结果。图6A:铝佐剂组1(免疫剂量为5.0μg,使用铝佐剂);图6B:铝佐剂组2(免疫剂量为1μg,使用铝佐剂);图6C:铝佐剂组3(免疫剂量为0.2μg,使用铝佐剂)。结果显示,H56N0-66T2VLP和H56N0-66T5VLP能诱导小鼠产生高滴度的针对HPV56的中和抗体,其保护效果与同剂量的单独的HPV56N0VLP、混合的HPV56/HPV66VLP相当,且显著优于同剂量的单独的HPV66N5VLP;H56N0-66T2VLP和H56N0-66T5VLP也能诱导小鼠产生较高滴度的针对HPV66的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV66N5VLP、混合的HPV56/HPV66VLP,但显著优于同剂量的单独的HPV56N0VLP。这表明,H56N0-66T2VLP和H56N0-66T5VLP对HPV56和HPV66具有良好的交叉免疫原性和交叉保护性。
图7显示了实验组H56N0-66T1-66T5-53S3VLP和对照组HPV56N0VLP、HPV66N5VLP、HPV53N5VLP以及混合的HPV66/56/53VLP在小鼠体内的免疫保护性的评价结果。结果显示,H56N0-66T1-66T5-53S3VLP可在小鼠体内诱导高滴度的针对HPV56、HPV66和HPV53的中和抗体;并且其针对HPV56的保护效果稍弱于单独的HPV56N0VLP以及混合的HPV56/66/53VLP,且显著高于单独的HPV66N5VLP和单独的HPV53N5VLP;其针对HPV66的保护效果稍弱于单独的HPV66N0VLP和混合的HPV66/56/53VLP,但显著高于单独的HPV56N0VLP和单独的HPV53N5VLP;其针对HPV53的保护效果稍弱于单独的HPV53N5VLP、混合的HPV66/56/53VLP,但显著高于单独的HPV66N5VLP和单独的HPV56N0VLP。这表明,H56N0-66T1-66T5-53S3VLP可用作预防HPV56感染、HPV66感染和HPV53感染的有效疫苗,可用于代替含有HPV56VLP、HPV66VLP和HPV53VLP的混合疫苗。
序列信息
本发明涉及的部分序列的信息提供于下面的表1中。
表1:序列的描述
序列1(SEQ ID NO:1):
MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.
序列2(SEQ ID NO:2):
MAMWRPSDNKVYLPPTPVSKVVATDTYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.序列3(SEQ ID NO:3):
MPSDNKVYLPPTPVSKVVATDTYVKRTS IFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDPSFYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCAPALGEHWTKGAVCKSTPGNTGDCPPLALVNTPIEDGDMVDTGFGAMDFKLLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQVFVTVVDTTRSTNMTINAAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLTAEVMAYLHNMNNTLLDDWNIGLSPPVATSLEDKYRYIKSTAITCQREQPPAEKQDPLAKYKFWEVNLQDSFSADLDQFPLGRKFLMQLGPRPPRPKASVSASKRRAAPTSSSSSPAKRKK.
序列4(SEQ ID NO:4):
MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.
序列5(SEQ ID NO:5):
MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTEVSNLAGNNVIEDSRDNISVDCKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.
序列6(SEQ ID NO:6):
MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTPGNTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.
序列7(SEQ ID NO:7):
MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGNVGEAIPTDLYWKGGNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTATEQLSKYDARKINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.
序列8(SEQ ID NO:8):
MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVTKDNTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGAVCKSTQVTTGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR.
序列9(SEQ ID NO:9):
ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA
序列10(SEQ ID NO:10):
ATGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA
序列11(SEQ ID NO:11):
ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA
序列12(SEQ ID NO:12):
ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA
序列13(SEQ ID NO:13):
ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA
序列14(SEQ ID NO:14):
ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCACCGAGCAGCTGTCCAAGTACGACGCCCGGAAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA
序列15(SEQ ID NO:15):
ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGACCAAGGACAACACCAAGACCAACATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCAGGTCACCACCGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA.
序列16(SEQ ID NO:16):
VSNLAGNNVIEDSRDNISVDC
序列17(SEQ ID NO:17):
KSTLTKYDARE
序列18(SEQ ID NO:18):
PGN
序列19(SEQ ID NO:19):
NVGEAIPTDLYWKGGNGRD
序列20(SEQ ID NO:20):
SKSG
序列37(SEQ ID NO:37):
ATGGCCATGTGGAGGCCCAGCGACAACAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGGTGGCCACCGACACCTACGTGAAGAGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACAGGGTGTTCAGGGTGAGGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAGCTTCTACAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGCCGGCCTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGGTGAGCAACCTGGCCGGCAACAACGTGATCGAGGACAGCAGGGACAACATCAGCGTGGACTGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCGCCCCCGCCCTGGGCGAGCACTGGACCAAGGGCGCCGTGTGCAAGAGCACCCCCGGCAACACCGGCGACTGCCCCCCCCTGGCCCTGGTGAACACCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCATGGACTTCAAGCTGCTGCAGGAGAGCAAGGCCGAGGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCGCCAGGCACTACTTCAACAGGGCCGGCAACGTGGGCGAGGCCATCCCCACCGACCTGTACTGGAAGGGCGGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGGTGTTCGTGACCGTGGTGGACACCACCAGGAGCACCAACATGACCATCAACGCCGCCAAGAGCACCCTGACCAAGTACGACGCCAGGGAGATCAACCAGTACCTGAGGCACGTGGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCACCCTGACCGCCGAGGTGATGGCCTACCTGCACAACATGAACAACACCCTGCTGGACGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACATCAAGAGCACCGCCATCACCTGCCAGAGGGAGCAGCCCCCCGCCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGAGGTGAACCTGCAGGACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGCTGGGCCCCAGGCCCCCCAGGCCCAAGGCCAGCGTGAGCGCCAGCAAGAGGAGGGCCGCCCCCACCAGCAGCAGCAGCAGCCCCGCCAAGAGGAAGAAGTAA.
序列38(SEQ ID NO:38):
MATWRPSENKVYLPPTPVSKVVATDSYVKRTSIFYHAGSSRLLAVGHPYYSVSKSGTKTNIPKVSAYQYRVFRVRLPDPNKFGLPDTNIYNPDQERLVWACVGLEVGRGQPLGAGLSGHPLFNRLDDTESSNLANNNVIEDSRDNISVDGKQTQLCIVGCTPAMGEHWTKGTACRSTPTTAGDCPPLALINTPIEDGDMIDTGFGAMDFKVLQESKAEVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFARHYFNRAGKVGETIPAELYLKGSNGREPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWGNQLFVTVVDTTRSTNMTISTAKSTLTKYDAREINQYLRHVEEYELQFVFQLCKITLSAEVMAYLHNMNANLLEDWNIGLSPPVATSLEDKYRYVRSTAITCQREQPPTEKQDPLAKYKFWDVNLQDSFSTDLDQFPLGRKFLMQLGTRSKPAVATSKKRSAPTSTSTPAKRKRR
序列39(SEQ ID NO:39):
ATGGCCACCTGGCGGCCCAGCGAGAACAAGGTGTACCTGCCCCCCACCCCCGTGTCCAAGGTGGTGGCCACCGACAGCTACGTGAAGCGGACCAGCATCTTCTACCACGCCGGCAGCAGCAGACTGCTGGCCGTGGGCCACCCCTACTACAGCGTGAGCAAGAGCGGCACCAAGACCAACATCCCCAAGGTGAGCGCCTACCAGTACCGGGTGTTCAGAGTGCGGCTGCCTGACCCTAACAAGTTCGGCCTGCCCGACACCAATATCTACAACCCCGACCAGGAACGGCTGGTCTGGGCCTGCGTGGGCCTGGAAGTGGGCAGAGGCCAGCCTCTGGGAGCTGGCCTGAGCGGCCACCCCCTGTTCAACCGGCTGGACGACACCGAGAGCAGCAACCTGGCCAACAACAACGTGATCGAGGACAGCCGGGACAACATCAGCGTGGACGGCAAGCAGACCCAGCTGTGCATCGTGGGCTGCACACCCGCCATGGGCGAGCACTGGACCAAGGGCACCGCTTGCCGTTCTACCCCGACCACCGCTGGCGACTGCCCCCCTCTGGCCCTGATCAACACCCCCATCGAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCAAGGTGCTGCAGGAAAGCAAGGCCGAGGTCCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTACTTCAACAGAGCCGGCAAAGTGGGCGAGACAATCCCCGCCGAGCTGTACCTGAAGGGCAGCAACGGACGGGAGCCTCCTCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGCGGGCCCAGGGCCACAACAACGGCATCTGCTGGGGCAACCAGCTGTTCGTGACCGTCGTGGACACTACCCGGTCCACCAACATGACCATCAGCACCGCCAAATCTACCCTGACCAAATACGACGCTCGTGAAATCAACCAGTACCTGCGGCACGTGGAGGAATATGAGCTGCAGTTCGTCTTTCAGCTGTGCAAGATCACCCTGAGCGCCGAAGTGATGGCCTACCTGCACAACATGAACGCCAACCTGCTGGAAGATTGGAACATCGGCCTGAGCCCCCCTGTGGCTACCTCTCTGGAAGATAAGTACAGATACGTGCGGAGCACCGCCATCACCTGCCAGAGAGAGCAGCCCCCCACCGAGAAGCAGGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGAACCTGCAGGACAGCTTCAGCACCGACCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGATGCAGCTGGGCACCAGATCCAAGCCCGCCGTGGCCACAAGCAAGAAGCGGAGCGCCCCCACAAGCACCAGCACCCCCGCCAAGCGGAAGCGGAGATGA
序列40(SEQ ID NO:40):
MAVWRPSDSKVYLPPTPVSKVITTDAYVKRTTIFYHAGSSRLLTVGHPYYPISKSGKADIPKVSAFQYRVFRVRLPDPNKFGLPDTNIFNPDQERLVWACVGLEIGRGQPLGVGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDPKQTQLCI IGCAPAIGEHWTKGTACRSTPTTAGDCPPLELINSPIEDGDMVDTGFGALNFKALQESKSDVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFTRHFFNRAGVIGEEIPNDLYIKGSNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWNNQLFVTVVDTTRNTNMTLSATTQSMSTYNSKQIKQYVRHAEEYELQFVFQLCKISLSAEVMAYLHTMNSTLLEDWNIGLSPPVATSLEDKYRYVKSAAITCQKDQPPPEKQDPLSKYKFWEVNLQNSFSADLDQFPLGRKFLMQVGVRTKPPVSSKKRSASTTSTSAPSSKRKRK.
序列41(SEQ ID NO:41):
ATGGCCGTGTGGAGGCCCAGCGACAGCAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGATCACCACCGACGCCTACGTGAAGAGGACCACCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGACCGTGGGCCACCCCTACTACCCCATCAGCAAGAGCGGCAAGGCCGACATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGAGGCTGCCCGACCCCAACAAGTTCGGCCTGCCCGACACCAACATCTTCAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGATCGGCAGGGGCCAGCCCCTGGGCGTGGGCGTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGAGCAGCAGCATCGCCATCCAGGACACCGCCCCCGACAGCAGGGACAACGTGAGCGTGGACCCCAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCGCCATCGGCGAGCACTGGACCAAGGGCACCGCCTGCAGGAGCACCCCCACCACCGCCGGCGACTGCCCCCCCCTGGAGCTGATCAACAGCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCCTGAACTTCAAGGCCCTGCAGGAGAGCAAGAGCGACGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCACCAGGCACTTCTTCAACAGGGCCGGCGTGATCGGCGAGGAGATCCCCAACGACCTGTACATCAAGGGCAGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCGTGACCGTGGTGGACACCACCAGGAACACCAACATGACCCTGAGCGCCACCACCCAGAGCATGAGCACCTACAACAGCAAGCAGATCAAGCAGTACGTGAGGCACGCCGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCAGCCTGAGCGCCGAGGTGATGGCCTACCTGCACACCATGAACAGCACCCTGCTGGAGGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACGTGAAGAGCGCCGCCATCACCTGCCAGAAGGACCAGCCCCCCCCCGAGAAGCAGGACCCCCTGAGCAAGTACAAGTTCTGGGAGGTGAACCTGCAGAACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGGTGGGCGTGAGGACCAAGCCCCCCGTGAGCAGCAAGAAGAGGAGCGCCAGCACCACCAGCACCAGCGCCCCCAGCAGCAAGAGGAAGAGGAAGTAA
序列42(SEQ ID NO:42):
MPSDSKVYLPPTPVSKVITTDAYVKRTTIFYHAGSSRLLTVGHPYYPISKSGKADIPKVSAFQYRVFRVRLPDPNKFGLPDTNIFNPDQERLVWACVGLEIGRGQPLGVGVSGHPLFNRLDDTESSSIAIQDTAPDSRDNVSVDPKQTQLCIIGCAPAIGEHWTKGTACRSTPTTAGDCPPLELINSPIEDGDMVDTGFGALNFKALQESKSDVPLDIVQSTCKYPDYLKMSADAYGDSMWFYLRREQLFTRHFFNRAGVIGEEIPNDLYIKGSNGRDPPPSSVYVATPSGSMITSEAQLFNKPYWLQRAQGHNNGICWNNQLFVTVVDTTRNTNMTLSATTQSMSTYNSKQIKQYVRHAEEYELQFVFQLCKISLSAEVMAYLHTMNSTLLEDWNIGLSPPVATSLEDKYRYVKSAAITCQKDQPPPEKQDPLSKYKFWEVNLQNSFSADLDQFPLGRKFLMQVGVRTKPPVSSKKRSASTTSTSAPSSKRKRK
序列43(SEQ ID NO:43):
ATGCCCAGCGACAGCAAGGTGTACCTGCCCCCCACCCCCGTGAGCAAGGTGATCACCACCGACGCCTACGTGAAGAGGACCACCATCTTCTACCACGCCGGCAGCAGCAGGCTGCTGACCGTGGGCCACCCCTACTACCCCATCAGCAAGAGCGGCAAGGCCGACATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGAGGCTGCCCGACCCCAACAAGTTCGGCCTGCCCGACACCAACATCTTCAACCCCGACCAGGAGAGGCTGGTGTGGGCCTGCGTGGGCCTGGAGATCGGCAGGGGCCAGCCCCTGGGCGTGGGCGTGAGCGGCCACCCCCTGTTCAACAGGCTGGACGACACCGAGAGCAGCAGCATCGCCATCCAGGACACCGCCCCCGACAGCAGGGACAACGTGAGCGTGGACCCCAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCGCCATCGGCGAGCACTGGACCAAGGGCACCGCCTGCAGGAGCACCCCCACCACCGCCGGCGACTGCCCCCCCCTGGAGCTGATCAACAGCCCCATCGAGGACGGCGACATGGTGGACACCGGCTTCGGCGCCCTGAACTTCAAGGCCCTGCAGGAGAGCAAGAGCGACGTGCCCCTGGACATCGTGCAGAGCACCTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACGCCTACGGCGACAGCATGTGGTTCTACCTGAGGAGGGAGCAGCTGTTCACCAGGCACTTCTTCAACAGGGCCGGCGTGATCGGCGAGGAGATCCCCAACGACCTGTACATCAAGGGCAGCAACGGCAGGGACCCCCCCCCCAGCAGCGTGTACGTGGCCACCCCCAGCGGCAGCATGATCACCAGCGAGGCCCAGCTGTTCAACAAGCCCTACTGGCTGCAGAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCGTGACCGTGGTGGACACCACCAGGAACACCAACATGACCCTGAGCGCCACCACCCAGAGCATGAGCACCTACAACAGCAAGCAGATCAAGCAGTACGTGAGGCACGCCGAGGAGTACGAGCTGCAGTTCGTGTTCCAGCTGTGCAAGATCAGCCTGAGCGCCGAGGTGATGGCCTACCTGCACACCATGAACAGCACCCTGCTGGAGGACTGGAACATCGGCCTGAGCCCCCCCGTGGCCACCAGCCTGGAGGACAAGTACAGGTACGTGAAGAGCGCCGCCATCACCTGCCAGAAGGACCAGCCCCCCCCCGAGAAGCAGGACCCCCTGAGCAAGTACAAGTTCTGGGAGGTGAACCTGCAGAACAGCTTCAGCGCCGACCTGGACCAGTTCCCCCTGGGCAGGAAGTTCCTGATGCAGGTGGGCGTGAGGACCAAGCCCCCCGTGAGCAGCAAGAAGAGGAGCGCCAGCACCACCAGCACCAGCGCCCCCAGCAGCAAGAGGAAGAGGAAGTAA
序列44(SEQ ID NO:44):
TACRSTPTTA
具体实施方式
现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。
除非特别指明,本发明中所使用的分子生物学实验方法和免疫检测法,基本上参照J.Sambrook等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,John Wiley&Sons,Inc.,1995中所述的方法进行;限制性内切酶的使用依照产品制造商推荐的条件。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。
实施例1.突变的HPV56 L1蛋白的表达与纯化
表达载体的构建
采用多点突变PCR反应构建编码含有来源于HPV66 L1蛋白的特定区段的突变的HPV56 L1蛋白的表达载体,其中,所使用的初始模板为pTO-T7-HPV56L1N0C质粒(其编码全长的HPV56 L1蛋白;在表2中简写为56L1N0)。用于各个PCR反应的模板、引物见表2,并且,PCR反应扩增条件设为:94℃变性10分钟,25个循环的“94℃变性50秒,指定温度退火一定时间,72℃延伸7分30秒”,最后72℃延伸10分钟。退火温度和时间列于表2。所使用的PCR引物的序列列于表3。
点突变得到的PCR扩增得到产物(50μL)加入2μL DpnI限制性内切酶(Fermentas(MBI),货号:FD1704,2500U/管),在37℃温育60min。取10μL酶切产物,用于转化40μL以氯化钙法制备的感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)。将经转化的大肠杆菌涂布于含卡那霉素(终浓度25μg/mL,下同)的固体LB培养基(LB培养基成分:10g/L蛋白胨,5g/L酵母粉,10g/L氯化钠,下同),并37℃静置培养10-12小时,直至单菌落清晰可辨。挑取单菌落至含4mL液体LB培养基(含卡那霉素)的试管,并在37℃220转/分钟下振荡培养10小时。随后,取1mL菌液于-70℃保存。从大肠杆菌中提取质粒,并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示,所构建的质粒(表达载体)中***的目的片段的核苷酸序列分别为SEQ ID NO:11和13,其编码的氨基酸序列为SEQ ID NO:4和6(所对应的蛋白分别命名为H56N0-66T1和H56N0-66T3)。
突变蛋白H56N0-66T1与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第53-56位的氨基酸残基被替换为野生型HPV66 L1蛋白第53-56位的氨基酸残基。突变蛋白H56N0-66T3与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第178-180位的氨基酸残基被替换为野生型HPV66 L1蛋白第178-180位的氨基酸残基。
采用Gibson装配(Gibson DG,Young L,Chuang RY,Venter JC,Hutchison CA,Smith HO.Enzymatic assembly of DNA molecules up to several hundredkilobases.Nat Methods.2009;6:343–5.doi:10.1038/nmeth.1318.)来构建编码其他的突变的HPV56 L1蛋白的表达载体,所述突变的HPV56 L1蛋白含有来源于HPV66 L1的特定区段。简言之,即首先采用PCR反应来获得包含突变的短片段和不包含突变的长片段,再采用Gibson装配体系将两片段连接成环。使用的初始模板包括pTO-T7-HPV56N0C质粒(其编码全长的HPV56 L1蛋白;在表2中简写为56L1N0)和pTO-T7-HPV66N5C质粒(其编码N端截短了5个氨基酸的HPV66 L1蛋白;在表2中简写为66L1N5)。用于各个PCR反应的模板、引物见表2,用于扩增短片段的PCR反应扩增条件设为:94℃变性10分钟,25个循环的“94℃变性50秒,指定温度退火一定时间,72℃延伸1分钟”,最后72℃延伸10分钟;用于扩增长片段的PCR反应扩增条件设为:94℃变性10分钟,25个循环的“94℃变性50秒,指定温度退火一定时间,72℃延伸7分30秒”,最后72℃延伸10分钟。所使用的PCR引物的序列列于表3。将PCR产物电泳后使用DNA回收试剂盒(BEYOTIME(碧云天),货号:D0033)回收目的片段并测定浓度。按摩尔比2:1比例混合短片段和长片段,总体积3μL;与3μL 2X Gibson装配预混试剂(2X GibsonAssembly Master Mix,购自NEB,包含T5exonuclease,Phusion DNA polymerase,Taq DNAligase)混合,50℃反应1小时。
用装配后产物6μL转化40μL以氯化钙法制备的感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)细菌。将转化的大肠杆菌涂布于含卡那霉素的固体LB培养基,并37℃静置培养10-12小时,直至单菌落清晰可辨。挑取单菌落至含4mL液体LB培养基(含卡那霉素)的试管,在37℃220转/分钟下振荡培养10小时,从中取1mL菌液于-70℃保存。从大肠杆菌中提取质粒,并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示,所构建的各个质粒(表达载体)中***的目的片段的核苷酸序列分别为SEQ ID NO:12、14、15,其编码的氨基酸序列为SEQ ID NO:5、7、8(所对应的蛋白分别命名为H56N0-66T2、H56N0-66T4、H56N0-66T5VLP)。
突变蛋白H56N0-66T2与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第130-150位的氨基酸残基被替换为野生型HPV66 L1蛋白第130-150位的氨基酸残基。突变蛋白H56N0-66T4与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第268-283位的氨基酸残基被替换为野生型HPV66 L1蛋白第265-283位的氨基酸残基。突变蛋白H56N0-66T5与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV66 L1蛋白第347-357位的氨基酸残基。
表2用于构建表达载体的PCR反应的模板和引物
表3:所使用的引物的具体序列(SEQ ID NO:21-36)
H56N0-66T1-66T5-53S3基因由上海生工生物公司合成,将合成后含有HPV56N0-66T1-66T5-53S3基因的质粒用NdeI和SalI进行酶切(37℃,12小时),酶切后将目的基因用DNA回收试剂盒(BEYOTIME(碧云天),货号:D0033)进行回收,将酶切后的H56N0-66T1-66T5-53S3基因与pTO-T7载体在16℃下连接12小时,随后转化感受态大肠杆菌ER2566(购自新英格兰生物实验室公司)细菌。将经转化的大肠杆菌涂布于含卡那霉素的固体LB培养基,并37℃静置培养10-12小时,直至单菌落清晰可辨。挑取单菌落至含4mL液体LB培养基(含卡那霉素)的试管,在37℃220转/分钟下振荡培养10小时,从中取1mL菌液于-70℃保存。从大肠杆菌中提取质粒,并利用T7引物对质粒中***的目的片段的核苷酸序列进行测序。测序结果显示,所构建的各个质粒(表达载体)中***的目的片段的核苷酸序列分别为SEQ ID NO:39,其编码的氨基酸序列为SEQ ID NO:38(所对应的蛋白命名为H56N0-66T1-66T5-53S3)。
突变蛋白H56N0-66T1-66T5-53S3与HPV56N0的区别在于:位于野生型HPV56 L1蛋白第53-56位的氨基酸残基被替换为野生型HPV66 L1蛋白第53-56位的氨基酸残基,位于野生型HPV56 L1蛋白第347-357位的氨基酸残基被替换为野生型HPV66 L1蛋白第347-357位的氨基酸残基,位于野生型HPV56 L1蛋白第172-181位的氨基酸残基被替换为野生型HPV53L1蛋白第171-180位的氨基酸残基的序列。
突变蛋白的大量表达
从-70℃冰箱中取出携带重组质粒pTO-T7-H56N0-66T1、pTO-T7-H56N0-66T2、pTO-T7-H56N0-66T3、pTO-T7-H56N0-66T4、pTO-T7-H56N0-66T5、pTO-H56N0-66T1-66T5-53S3的大肠杆菌菌液,分别接种入100ml含卡那霉素的LB液体培养基中,在200rpm,37℃下培养大约8小时;然后分别转接入500ml含卡那霉素的LB培养基中(接入1ml菌液),并继续进行培养。当细菌浓度达到OD600为0.6左右时,将培养温度降至25℃,并向各培养瓶中加入500μLIPTG,继续培养8小时。培养结束后,离心收集菌体。获得表达了H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5,H56N0-66T1-66T5-53S3蛋白的菌体。
表达突变蛋白的菌体破碎
按1g菌体对应10mL裂解液(20mM Tris缓冲液,pH7.2,300mM NaCl)的比例重悬上述得到的菌体。用超声波仪破碎菌体30min。以13500rpm(30000g)离心含有经破碎的菌体的裂解液15min,留取上清(即,菌体破碎上清)。
突变蛋白的色谱纯化
仪器系统:GE Healthcare公司(原Amershan Pharmacia公司)生产的AKTAexplorer 100型制备型液相色谱系统。
层析介质:SP Sepharose 4Fast Flow(GE Healthcare公司)、CHT-Ⅱ(购自Bio-RAD)和Butyl Sepharose 4Fast Flow(GE Healthcare公司)。下面的洗脱程序中用到的含有不同浓度NaCl的缓冲液是由缓冲液A和B按比例混合配置而成。
缓冲液:缓冲液A(20mM磷酸盐缓冲液,pH8.0,20mM DTT);以及,缓冲液B(20mM磷酸盐缓冲液,pH8.0,20mM DTT,2M NaCl)。
样品:如上获得的含有H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5,H56N0-66T1-66T5-53S3的菌体破碎上清。
洗脱程序为:
(1)用SP Sepharose 4Fast Flow对菌体破碎上清进行阳离子交换纯化:将样品上柱,然后用含有400mM NaCl的缓冲液(80%缓冲液A+20%缓冲液B)洗脱杂蛋白,然后用含有800mM NaCl的缓冲液(60%缓冲液A+40%缓冲液B)洗脱目的蛋白,并收集由含有800mMNaCl的缓冲液洗脱的级分;
(2)用CHTⅡ(羟基磷灰石色谱)对前一步获得的洗脱级分进行色谱纯化:对前一步骤获得的洗脱级分进行稀释,以使得NaCl的浓度降至0.5M;将样品上柱,然后用含有500mMNaCl的缓冲液(75%缓冲液A+25%缓冲液B)洗脱杂蛋白,然后用含有1000mM NaCl的缓冲液(50%缓冲液A+50%缓冲液B)洗脱目的蛋白,并收集由含有1000mM NaCl的缓冲液洗脱的级分;
(3)用HIC(疏水相互作用色谱)对前一步骤获得的洗脱级分进行色谱纯化:将样品上柱,然后用含有1000mM NaCl的缓冲液洗脱杂蛋白,然后用含有200mM NaCl的缓冲液(90%缓冲液A+10%缓冲液B)洗脱目的蛋白,并收集由含有200mM NaCl的缓冲液洗脱的级分。
取步骤(3)获得的洗脱级分150μL,加入30μL 6X Loading Buffer(1L中含有1M TB6.8 300ml、100%甘油600ml、SDS 120g、溴酚蓝6g、β-巯基乙醇50ml)中,混匀,并于80℃水浴中温育10min。然后取10μl样品于10%SDS-聚丙烯酰胺凝胶中以120V电压电泳120min;然后以考马斯亮兰染色显示电泳条带。电泳结果示于图1中。结果显示,经过上述纯化步骤后,H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5蛋白的纯度均在90%左右,H56N0-66T1-66T5-53S3蛋白纯度为80%左右。
通过类似的方法,使用大肠杆菌和pTO-T7-HPV56N0质粒制备和纯化了HPV56N0蛋白;使用大肠杆菌和pTO-T7-HPV66L1N5质粒制备和纯化了HPV66N5蛋白;使用大肠杆菌和pTO-T7-HPV53L1N5质粒制备和纯化了HPV53N5蛋白。
突变蛋白的免疫印迹实验
按上述方法对经纯化的H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5蛋白进行电泳。电泳结束后,使用抗HPV L1蛋白的广谱抗体4B3进行WesternBlot检测,结果示于图2中。结果显示,H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5都能够被广谱抗体4B3特异性识别。
实施例2:HPV病毒样颗粒的组装与颗粒形态学检测
HPV病毒样颗粒的组装
取一定体积(约2ml)的蛋白H56N0-66T1,H56N0-66T2,H56N0-66T3,H56N0-66T4,H56N0-66T5,H56N0-66T1-66T5-53S3分别依次透析至(1)2L储存缓冲液(20mM磷酸钠缓冲液pH 6.5,0.5M NaCl);(2)2L复性缓冲液(50mM磷酸钠缓冲液pH 6.0,2mM CaCl2,2mM MgCl2,0.5M NaCl);和(3)20mM磷酸钠缓冲液pH 7.0,0.5M NaCl中。在三种缓冲液中各自进行透析12h。
通过类似的方法,将HPV56N0、HPV66N5和HPV53N5蛋白分别组装为HPV56N0 VLP、HPV66N5 VLP和HPV53N5VLP。
分子筛层析分析
用美国安捷伦公司的1120Compact LC高效液相色谱系统对经透析的样品进行分子筛层析分析,其中,所使用的分析柱为TSK Gel PW5000xl 7.8x300mm。分析结果如图3所示,结果显示,包含H56N0-66T1VLP、H56N0-66T2、H56N0-66T4 VLP、H56N0-66T5 VLP、H56N0-66T1-66T5-53S3的样品最先出现的蛋白峰均在13-14min左右,与HPV56N0 VLP相当;H56N0-66T3 VLP的主峰时间为15min左右,肩峰时间为14min,说明H56N0-66T3 VLP颗粒大小不均一。结果表明除突变蛋白H56N0-66T3 VLP外,其余突变蛋白均可形成均一的VLP。
沉降速率分析
沉降速率分析所使用的仪器为Beckman XL-A分析型超速离心机,其配有光学检测系统及An-50Ti和An-60Ti转头。采用沉降速率法分析HPV56N0 VLP、HPV66N5 VLP、H56N0-66T1 VLP、H56N0-66T2 VLP、H56N0-66T3 VLP、H56N0-66T4 VLP、H56N0-66T5 VLP、H56N0-66T1-66T5-53S3的沉降系数。结果如图4所示。结果显示,H56N0-66T1 VLP、H56N0-66T2VLP、H56N0-66T3 VLP、H56N0-66T4 VLP、H56N0-66T5 VLP、H56N0-66T1-66T5-53S3的沉降系数分别为135S、139S、78S、136S、139S和135S。这表明,如上制备的6种突变的HPV56 L1蛋白除H56N0-66T3外其余均能够组装成大小、形态与野生型VLP(HPV56N0 VLP,134S)相似的病毒样颗粒。
病毒样颗粒的形态学检测
取100μL含有VLP的样品进行透射电镜观察。所使用的仪器为日本电子公司生产的100kV透射电镜,放大倍数为100,000倍。简言之,取13.5μL样品,用2%磷钨酸pH7.0进行负染,并固定于喷炭的铜网上,然后进行透射电镜观察。观察结果如图5A-5G所示。结果显示,H56N0-66T1 VLP、H56N0-66T2、H56N0-66T4 VLP、H56N0-66T5 VLP、H56N0-66T1-66T5-53S3与HPV56N0类似,都能够组装成半径为25nm左右的VLP;H56N0-66T3 VLP组装的颗粒不均一,半径在15-25nm之间。
实施例3:用病毒样颗粒免疫后小鼠血清中的中和抗体滴度的评价1
本实验中,所用病毒样颗粒为:H56N0-66T1 VLP,H56N0-66T2 VLP,H56N0-66T3VLP,H56N0-66T4 VLP,H56N0-66T5VLP。
在本实验中,免疫方案如表4所示。将所有小鼠(6周龄BalB/c雌性小鼠)分为3个组:铝佐剂组1(免疫剂量为5μg,使用铝佐剂),铝佐剂组2(免疫剂量为1μg,使用铝佐剂),和铝佐剂组3(免疫剂量为0.2μg,使用铝佐剂)。各个组又细分为8个亚组,对照亚组1和2分别用单独的HPV56N0 VLP和单独的HPV66N5 VLP进行免疫,对照亚组3用混合的HPV56/HPV66VLP(即,HPV56N0 VLP和HPV66N5 VLP的混合物,其中每种VLP均以指定的免疫剂量施用)进行免疫。实验亚组1、2、3、4、5分别用H56N0-66T1 VLP,H56N0-66T2 VLP,H56N0-66T3 VLP,H56N0-66T4 VLP,H56N0-66T5 VLP进行免疫。
对于铝佐剂组1-3,采用腹腔注射方式免疫5只小鼠/亚组,免疫剂量分别为5μg、1μg、0.2μg,注射体积为1ml。所有小鼠均在第0周进行初次免疫,然后在第2和4周各自进行加强免疫一次。在第8周对小鼠进行眼眶采血,并分析血清中的抗HPV56和HPV66抗体的滴度。分析结果如图6A-6C所示,结果显示,H56N0-66T2 VLP和H56N0-66T5 VLP能诱导小鼠产生高滴度的针对HPV56的中和抗体,其保护效果与同剂量的单独的HPV56N0 VLP、混合的HPV56/HPV66 VLP相当,且显著优于同剂量的单独的HPV66N5 VLP;H56N0-66T2 VLP和H56N0-66T5VLP也能诱导小鼠产生较高滴度的针对HPV66的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV66N5 VLP、混合的HPV56/HPV66 VLP,但显著优于同剂量的单独的HPV56N0 VLP。这表明,H56N0-66T2 VLP和H56N0-66T5 VLP对HPV56和HPV66具有良好的交叉免疫原性和交叉保护性。
表4免疫方案
实施例4:用病毒样颗粒免疫后小鼠血清中的中和抗体滴度的评价2
本实验中,所用的病毒样颗粒为H56N0-66T1-66T5-53S3VLP。
在本实验中,免疫方案如表5所示。将所有小鼠(6周龄BalB/c雌性小鼠)分为2个组:实验组(免疫剂量为5μg,使用铝佐剂)和对照组(免疫剂量为5μg,使用铝佐剂)。其中对照组又分为4个亚组,对照亚组1、2、3分别用单独的HPV56N0 VLP、单独的HPV66N5 VLP、单独的HPV53N5 VLP进行免疫,对照亚组4用混合的HPV56/66/53 VLP(即,HPV56N0 VLP、HPV66N5VLP和HPV53N5 VLP的混合物,其中每种VLP均以指定的免疫剂量施用)进行免疫。实验用H56N0-66T1-66T5-53S3 VLP进行免疫。
表4免疫方案
采用腹腔注射方式免疫5只小鼠/亚组,免疫剂量分别为5μg,注射体积为1ml。所有小鼠均在第0周进行初次免疫,然后在第2和4周各自进行加强免疫一次。在第6周对小鼠进行眼眶采血,并分析血清中的抗HPV56、HPV66和HPV53抗体的滴度。分析结果如图7所示。结果显示H56N0-66T1-66T5-53S3 VLP都能诱导小鼠产生高滴度的针对HPV56的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV56N0 VLP以及混合的HPV66/56/53 VLP,且显著优于同剂量的单独的HPV66N5 VLP或单独的HPV53N5 VLP;并且其能诱导小鼠产生高滴度的针对HPV66的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV66N5 VLP以及混合的HPV66/56/53 VLP,但显著优于同剂量的单独的HPV56N0 VLP或单独的HPV53N5 VLP;并且其能诱导小鼠产生高滴度的针对HPV53的中和抗体,其保护效果虽稍弱于同剂量的单独的HPV53N5VLP以及混合的HPV66/56/53 VLP,但显著优于同剂量的单独的HPV66N5VLP或单独的HPV56N0 VLP。这表明HPV56N0-66T1-66T5-53S3 VLP对HPV66、HPV56和HPV53具有良好的交叉免疫原性和交叉保护性。H56N0-66T1-66T5-53S3 VLP可用作预防HPV56感染、HPV66感染和HPV53感染的有效疫苗,可用于代替含有HPV56VLP、HPV66 VLP和HPV53 VLP的混合疫苗。
尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解,根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
SEQUENCE LISTING
<110> 厦门大学
厦门万泰沧海生物技术有限公司
<120> 一种人***瘤病毒56型L1蛋白的突变体
<130> IDC180137
<150> CN201810566209.2
<151> 2018-06-04
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 499
<212> PRT
<213> Human papillomavirus type 56
<400> 1
Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr
115 120 125
Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp
130 135 140
Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys
145 150 155 160
Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser
165 170 175
Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala
225 230 235 240
Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala
260 265 270
Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser
275 280 285
Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys
340 345 350
Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr
355 360 365
Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu
370 375 380
Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp
385 390 395 400
Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr
405 410 415
Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro
420 425 430
Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn
435 440 445
Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg
450 455 460
Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr
465 470 475 480
Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg
485 490 495
Lys Arg Arg
<210> 2
<211> 502
<212> PRT
<213> Human papillomavirus type 66
<400> 2
Met Ala Met Trp Arg Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Tyr Ser Val Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr
115 120 125
Glu Val Ser Asn Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp
130 135 140
Asn Ile Ser Val Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys
145 150 155 160
Ala Pro Ala Leu Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser
165 170 175
Thr Pro Gly Asn Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Lys Leu Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala
225 230 235 240
Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Tyr Phe Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr
260 265 270
Asp Leu Tyr Trp Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser
275 280 285
Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys
340 345 350
Tyr Asp Ala Arg Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr
355 360 365
Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu
370 375 380
Val Met Ala Tyr Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp
385 390 395 400
Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr
405 410 415
Arg Tyr Ile Lys Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro
420 425 430
Ala Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn
435 440 445
Leu Gln Asp Ser Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg
450 455 460
Lys Phe Leu Met Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser
465 470 475 480
Val Ser Ala Ser Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser
485 490 495
Pro Ala Lys Arg Lys Lys
500
<210> 3
<211> 498
<212> PRT
<213> Human papillomavirus type 66
<400> 3
Met Pro Ser Asp Asn Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys
1 5 10 15
Val Val Ala Thr Asp Thr Tyr Val Lys Arg Thr Ser Ile Phe Tyr His
20 25 30
Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Tyr Ser Val
35 40 45
Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val Ser Ala Tyr Gln
50 55 60
Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu
65 70 75 80
Pro Asp Pro Ser Phe Tyr Asn Pro Asp Gln Glu Arg Leu Val Trp Ala
85 90 95
Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Ala Gly Leu
100 105 110
Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Val Ser Asn
115 120 125
Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn Ile Ser Val
130 135 140
Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys Ala Pro Ala Leu
145 150 155 160
Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser Thr Pro Gly Asn
165 170 175
Thr Gly Asp Cys Pro Pro Leu Ala Leu Val Asn Thr Pro Ile Glu Asp
180 185 190
Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met Asp Phe Lys Leu Leu
195 200 205
Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val Gln Ser Thr Cys
210 215 220
Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser
225 230 235 240
Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala Arg His Tyr Phe
245 250 255
Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp
260 265 270
Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala
275 280 285
Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys
290 295 300
Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp
305 310 315 320
Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn
325 330 335
Met Thr Ile Asn Ala Ala Lys Ser Thr Leu Thr Lys Tyr Asp Ala Arg
340 345 350
Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr Glu Leu Gln Phe
355 360 365
Val Phe Gln Leu Cys Lys Ile Thr Leu Thr Ala Glu Val Met Ala Tyr
370 375 380
Leu His Asn Met Asn Asn Thr Leu Leu Asp Asp Trp Asn Ile Gly Leu
385 390 395 400
Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Ile Lys
405 410 415
Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro Ala Glu Lys Gln
420 425 430
Asp Pro Leu Ala Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asp Ser
435 440 445
Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met
450 455 460
Gln Leu Gly Pro Arg Pro Pro Arg Pro Lys Ala Ser Val Ser Ala Ser
465 470 475 480
Lys Arg Arg Ala Ala Pro Thr Ser Ser Ser Ser Ser Pro Ala Lys Arg
485 490 495
Lys Lys
<210> 4
<211> 499
<212> PRT
<213> Artificial Sequence
<220>
<223> H56N0-66T1
<400> 4
Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Tyr Ser Val Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr
115 120 125
Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp
130 135 140
Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys
145 150 155 160
Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser
165 170 175
Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala
225 230 235 240
Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala
260 265 270
Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser
275 280 285
Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys
340 345 350
Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr
355 360 365
Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu
370 375 380
Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp
385 390 395 400
Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr
405 410 415
Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro
420 425 430
Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn
435 440 445
Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg
450 455 460
Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr
465 470 475 480
Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg
485 490 495
Lys Arg Arg
<210> 5
<211> 499
<212> PRT
<213> Artificial Sequence
<220>
<223> H56N0-66T2
<400> 5
Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr
115 120 125
Glu Val Ser Asn Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp
130 135 140
Asn Ile Ser Val Asp Cys Lys Gln Thr Gln Leu Cys Ile Val Gly Cys
145 150 155 160
Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser
165 170 175
Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala
225 230 235 240
Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala
260 265 270
Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser
275 280 285
Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys
340 345 350
Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr
355 360 365
Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu
370 375 380
Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp
385 390 395 400
Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr
405 410 415
Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro
420 425 430
Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn
435 440 445
Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg
450 455 460
Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr
465 470 475 480
Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg
485 490 495
Lys Arg Arg
<210> 6
<211> 499
<212> PRT
<213> Artificial Sequence
<220>
<223> H56N0-66T3
<400> 6
Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr
115 120 125
Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp
130 135 140
Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys
145 150 155 160
Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser
165 170 175
Thr Pro Gly Asn Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala
225 230 235 240
Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala
260 265 270
Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser
275 280 285
Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys
340 345 350
Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr
355 360 365
Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu
370 375 380
Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp
385 390 395 400
Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr
405 410 415
Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro
420 425 430
Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn
435 440 445
Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg
450 455 460
Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr
465 470 475 480
Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg
485 490 495
Lys Arg Arg
<210> 7
<211> 499
<212> PRT
<213> Artificial Sequence
<220>
<223> H56N0-66T4
<400> 7
Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr
115 120 125
Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp
130 135 140
Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys
145 150 155 160
Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser
165 170 175
Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala
225 230 235 240
Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Tyr Phe Asn Arg Ala Gly Asn Val Gly Glu Ala Ile Pro Thr
260 265 270
Asp Leu Tyr Trp Lys Gly Gly Asn Gly Arg Asp Pro Pro Pro Ser Ser
275 280 285
Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Thr Glu Gln Leu Ser Lys
340 345 350
Tyr Asp Ala Arg Lys Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr
355 360 365
Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu
370 375 380
Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp
385 390 395 400
Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr
405 410 415
Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro
420 425 430
Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn
435 440 445
Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg
450 455 460
Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr
465 470 475 480
Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg
485 490 495
Lys Arg Arg
<210> 8
<211> 499
<212> PRT
<213> Artificial Sequence
<220>
<223> H56N0-66T5
<400> 8
Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Tyr Ser Val Thr Lys Asp Asn Thr Lys Thr Asn Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr
115 120 125
Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp
130 135 140
Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys
145 150 155 160
Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Ala Val Cys Lys Ser
165 170 175
Thr Gln Val Thr Thr Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala
225 230 235 240
Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala
260 265 270
Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser
275 280 285
Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Lys Ser Thr Leu Thr Lys
340 345 350
Tyr Asp Ala Arg Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr
355 360 365
Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu
370 375 380
Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp
385 390 395 400
Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr
405 410 415
Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro
420 425 430
Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn
435 440 445
Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg
450 455 460
Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr
465 470 475 480
Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg
485 490 495
Lys Arg Arg
<210> 9
<211> 1500
<212> DNA
<213> Human papillomavirus type 56
<400> 9
atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60
gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120
agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180
atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240
aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300
tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360
ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420
gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480
acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540
accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600
gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660
ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720
tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780
aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840
ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900
agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960
ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020
atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080
tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140
ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200
aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260
agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320
aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380
cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440
agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500
<210> 10
<211> 1497
<212> DNA
<213> Human papillomavirus type 66
<400> 10
atgcccagcg acaacaaggt gtacctgccc cccacccccg tgagcaaggt ggtggccacc 60
gacacctacg tgaagaggac cagcatcttc taccacgccg gcagcagcag gctgctggcc 120
gtgggccacc cctactacag cgtgagcaag agcggcacca agaccaacat ccccaaggtg 180
agcgcctacc agtacagggt gttcagggtg aggctccccg accccaacaa gttcggcctg 240
cccgacccca gcttctacaa ccccgaccag gagaggctgg tgtgggcctg cgtgggcctg 300
gaggtgggca ggggccagcc cctgggcgcc ggcctgagcg gccaccccct gttcaacagg 360
ctggacgaca ccgaggtgag caacctggcc ggcaacaacg tgatcgagga cagcagggac 420
aacatcagcg tggactgcaa gcagacccag ctgtgcatcg tgggctgcgc ccccgccctg 480
ggcgagcact ggaccaaggg cgccgtgtgc aagagcaccc ccggcaacac cggcgactgc 540
ccccccctgg ccctggtgaa cacccccatc gaggacggcg acatggtgga caccggcttc 600
ggcgccatgg acttcaagct gctgcaggag agcaaggccg aggtgcccct ggacatcgtg 660
cagagcacct gcaagtaccc cgactacctg aagatgagcg ccgacgccta cggcgacagc 720
atgtggttct acctgaggag ggagcagctg ttcgccaggc actacttcaa cagggccggc 780
aacgtgggcg aggccatccc caccgacctg tactggaagg gcggcaacgg cagggacccc 840
ccccccagca gcgtgtacgt ggccaccccc agcggcagca tgatcaccag cgaggcccag 900
ctgttcaaca agccctactg gctgcagagg gcccagggcc acaacaacgg catctgctgg 960
ggcaaccagg tgttcgtgac cgtggtggac accaccagga gcaccaacat gaccatcaac 1020
gccgccaaga gcaccctgac caagtacgac gccagggaga tcaaccagta cctgaggcac 1080
gtggaggagt acgagctgca gttcgtgttc cagctgtgca agatcaccct gaccgccgag 1140
gtgatggcct acctgcacaa catgaacaac accctgctgg acgactggaa catcggcctg 1200
agcccccccg tggccaccag cctggaggac aagtacaggt acatcaagag caccgccatc 1260
acctgccaga gggagcagcc ccccgccgag aagcaggacc ccctggccaa gtacaagttc 1320
tgggaggtga acctgcagga cagcttcagc gccgacctgg accagttccc cctgggcagg 1380
aagttcctga tgcagctggg ccccaggccc cccaggccca aggccagcgt gagcgccagc 1440
aagaggaggg ccgcccccac cagcagcagc agcagccccg ccaagaggaa gaagtaa 1497
<210> 11
<211> 1500
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码H56N0-66T1的DNA序列
<400> 11
atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60
gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120
agactgctgg ccgtgggcca cccctactac agcgtgagca agagcggcac caagaccaac 180
atccccaagg tgagcgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240
aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300
tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360
ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420
gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480
acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540
accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600
gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660
ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720
tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780
aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840
ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900
agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960
ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020
atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080
tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140
ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200
aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260
agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320
aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380
cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440
agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500
<210> 12
<211> 1500
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码H56N0-66T2的DNA序列
<400> 12
atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60
gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120
agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180
atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240
aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300
tgcgtgggcc tggaagtggg caggggccag cccctgggcg ccggcctgag cggccacccc 360
ctgttcaaca ggctggacga caccgaggtg agcaacctgg ccggcaacaa cgtgatcgag 420
gacagcaggg acaacatcag cgtggactgc aagcagaccc agctgtgcat cgtgggctgc 480
acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540
accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600
gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660
ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720
tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780
aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840
ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900
agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960
ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020
atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080
tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140
ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200
aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260
agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320
aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380
cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440
agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500
<210> 13
<211> 1500
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码H56N0-66T3的DNA序列
<400> 13
atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60
gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120
agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180
atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240
aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300
tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360
ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420
gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480
acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccccggcaac 540
accggcgact gcccccccct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600
gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660
ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720
tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780
aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840
ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900
agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960
ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020
atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080
tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140
ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200
aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260
agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320
aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380
cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440
agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500
<210> 14
<211> 1500
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码H56N0-66T4的DNA序列
<400> 14
atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60
gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120
agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180
atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240
aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300
tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360
ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420
gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480
acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540
accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600
gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660
ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720
tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780
aacagggccg gcaacgtggg cgaggccatc cccaccgacc tgtactggaa gggcggcaac 840
ggcagggacc ccccccccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900
agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960
ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020
atgaccatca gcaccgccac cgagcagctg tccaagtacg acgcccggaa gatcaaccag 1080
tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140
ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200
aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260
agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320
aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380
cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440
agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500
<210> 15
<211> 1500
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码H56N0-66T5的DNA序列
<400> 15
atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60
gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120
agactgctgg ccgtgggcca cccctactac agcgtgacca aggacaacac caagaccaac 180
atccccaagg tgtccgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240
aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300
tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360
ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420
gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480
acacccgcca tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccaggtcacc 540
accggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600
gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660
ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720
tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780
aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840
ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900
agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960
ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020
atgaccatca gcaccgccaa gagcaccctg accaagtacg acgccaggga gatcaaccag 1080
tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140
ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200
aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260
agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320
aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380
cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440
agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500
<210> 16
<211> 21
<212> PRT
<213> Human papillomavirus type 66
<400> 16
Val Ser Asn Leu Ala Gly Asn Asn Val Ile Glu Asp Ser Arg Asp Asn
1 5 10 15
Ile Ser Val Asp Cys
20
<210> 17
<211> 11
<212> PRT
<213> Human papillomavirus type 66
<400> 17
Lys Ser Thr Leu Thr Lys Tyr Asp Ala Arg Glu
1 5 10
<210> 18
<211> 3
<212> PRT
<213> Human papillomavirus type 66
<400> 18
Pro Gly Asn
1
<210> 19
<211> 19
<212> PRT
<213> Human papillomavirus type 66
<400> 19
Asn Val Gly Glu Ala Ile Pro Thr Asp Leu Tyr Trp Lys Gly Gly Asn
1 5 10 15
Gly Arg Asp
<210> 20
<211> 4
<212> PRT
<213> Human papillomavirus type 66
<400> 20
Ser Lys Ser Gly
1
<210> 21
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 21
tacagcgtga gcaagagcgg caccaagacc aacatcccca ag 42
<210> 22
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 22
cttggtgccg ctcttgctca cgctgtagta ggggtggccc ac 42
<210> 23
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 23
cacttccagg cccacgcagg ccca 24
<210> 24
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 24
aagcagaccc agctgtgcat cgtg 24
<210> 25
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 25
agcacccccg gcaacaccgg cgactgcccc cccctggccc tg 42
<210> 26
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 26
gccggtgttg ccgggggtgc tcttgcacac ggcgcccttg gt 42
<210> 27
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 27
gtgccgggcg aacagctgct cccg 24
<210> 28
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 28
gccaccccca gcggcagcat gatc 24
<210> 29
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 29
ggcggtgctg atggtcatgt tggt 24
<210> 30
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 30
atcaaccagt acctgcggca cgtg 24
<210> 31
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 31
tgggcctgcg tgggcctgga agtgggcagg ggccagcccc tgggc 45
<210> 32
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 32
cacgatgcac agctgggtct gcttgcagtc cacgctgatg ttgtc 45
<210> 33
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 33
cgggagcagc tgttcgcccg gcactacttc aacagggccg gcaac 45
<210> 34
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 34
gatcatgctg ccgctggggg tggccacgta cacgctgctg ggggg 45
<210> 35
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 35
accaacatga ccatcagcac cgccaagagc accctgacca agtac 45
<210> 36
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 36
cacgtgccgc aggtactggt tgatctccct ggcgtcgtac ttggt 45
<210> 37
<211> 1509
<212> DNA
<213> Human papillomavirus type 66
<400> 37
atggccatgt ggaggcccag cgacaacaag gtgtacctgc cccccacccc cgtgagcaag 60
gtggtggcca ccgacaccta cgtgaagagg accagcatct tctaccacgc cggcagcagc 120
aggctgctgg ccgtgggcca cccctactac agcgtgagca agagcggcac caagaccaac 180
atccccaagg tgagcgccta ccagtacagg gtgttcaggg tgaggctccc cgaccccaac 240
aagttcggcc tgcccgaccc cagcttctac aaccccgacc aggagaggct ggtgtgggcc 300
tgcgtgggcc tggaggtggg caggggccag cccctgggcg ccggcctgag cggccacccc 360
ctgttcaaca ggctggacga caccgaggtg agcaacctgg ccggcaacaa cgtgatcgag 420
gacagcaggg acaacatcag cgtggactgc aagcagaccc agctgtgcat cgtgggctgc 480
gcccccgccc tgggcgagca ctggaccaag ggcgccgtgt gcaagagcac ccccggcaac 540
accggcgact gcccccccct ggccctggtg aacaccccca tcgaggacgg cgacatggtg 600
gacaccggct tcggcgccat ggacttcaag ctgctgcagg agagcaaggc cgaggtgccc 660
ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720
tacggcgaca gcatgtggtt ctacctgagg agggagcagc tgttcgccag gcactacttc 780
aacagggccg gcaacgtggg cgaggccatc cccaccgacc tgtactggaa gggcggcaac 840
ggcagggacc ccccccccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900
agcgaggccc agctgttcaa caagccctac tggctgcaga gggcccaggg ccacaacaac 960
ggcatctgct ggggcaacca ggtgttcgtg accgtggtgg acaccaccag gagcaccaac 1020
atgaccatca acgccgccaa gagcaccctg accaagtacg acgccaggga gatcaaccag 1080
tacctgaggc acgtggagga gtacgagctg cagttcgtgt tccagctgtg caagatcacc 1140
ctgaccgccg aggtgatggc ctacctgcac aacatgaaca acaccctgct ggacgactgg 1200
aacatcggcc tgagcccccc cgtggccacc agcctggagg acaagtacag gtacatcaag 1260
agcaccgcca tcacctgcca gagggagcag ccccccgccg agaagcagga ccccctggcc 1320
aagtacaagt tctgggaggt gaacctgcag gacagcttca gcgccgacct ggaccagttc 1380
cccctgggca ggaagttcct gatgcagctg ggccccaggc cccccaggcc caaggccagc 1440
gtgagcgcca gcaagaggag ggccgccccc accagcagca gcagcagccc cgccaagagg 1500
aagaagtaa 1509
<210> 38
<211> 499
<212> PRT
<213> Artificial Sequence
<220>
<223> H56N0-66T1-66T5-53S3
<400> 38
Met Ala Thr Trp Arg Pro Ser Glu Asn Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Val Ala Thr Asp Ser Tyr Val Lys Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Tyr Ser Val Ser Lys Ser Gly Thr Lys Thr Asn Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Thr Asn Ile Tyr Asn Pro Asp Gln Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Leu Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ala Gly Leu Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr
115 120 125
Glu Ser Ser Asn Leu Ala Asn Asn Asn Val Ile Glu Asp Ser Arg Asp
130 135 140
Asn Ile Ser Val Asp Gly Lys Gln Thr Gln Leu Cys Ile Val Gly Cys
145 150 155 160
Thr Pro Ala Met Gly Glu His Trp Thr Lys Gly Thr Ala Cys Arg Ser
165 170 175
Thr Pro Thr Thr Ala Gly Asp Cys Pro Pro Leu Ala Leu Ile Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Lys Val Leu Gln Glu Ser Lys Ala Glu Val Pro Leu Asp Ile Val
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala
225 230 235 240
Tyr Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Tyr Phe Asn Arg Ala Gly Lys Val Gly Glu Thr Ile Pro Ala
260 265 270
Glu Leu Tyr Leu Lys Gly Ser Asn Gly Arg Glu Pro Pro Pro Ser Ser
275 280 285
Val Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Met Thr Ile Ser Thr Ala Lys Ser Thr Leu Thr Lys
340 345 350
Tyr Asp Ala Arg Glu Ile Asn Gln Tyr Leu Arg His Val Glu Glu Tyr
355 360 365
Glu Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Thr Leu Ser Ala Glu
370 375 380
Val Met Ala Tyr Leu His Asn Met Asn Ala Asn Leu Leu Glu Asp Trp
385 390 395 400
Asn Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr
405 410 415
Arg Tyr Val Arg Ser Thr Ala Ile Thr Cys Gln Arg Glu Gln Pro Pro
420 425 430
Thr Glu Lys Gln Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asn
435 440 445
Leu Gln Asp Ser Phe Ser Thr Asp Leu Asp Gln Phe Pro Leu Gly Arg
450 455 460
Lys Phe Leu Met Gln Leu Gly Thr Arg Ser Lys Pro Ala Val Ala Thr
465 470 475 480
Ser Lys Lys Arg Ser Ala Pro Thr Ser Thr Ser Thr Pro Ala Lys Arg
485 490 495
Lys Arg Arg
<210> 39
<211> 1500
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码SEQ ID NO:38的DNA序列
<400> 39
atggccacct ggcggcccag cgagaacaag gtgtacctgc cccccacccc cgtgtccaag 60
gtggtggcca ccgacagcta cgtgaagcgg accagcatct tctaccacgc cggcagcagc 120
agactgctgg ccgtgggcca cccctactac agcgtgagca agagcggcac caagaccaac 180
atccccaagg tgagcgccta ccagtaccgg gtgttcagag tgcggctgcc tgaccctaac 240
aagttcggcc tgcccgacac caatatctac aaccccgacc aggaacggct ggtctgggcc 300
tgcgtgggcc tggaagtggg cagaggccag cctctgggag ctggcctgag cggccacccc 360
ctgttcaacc ggctggacga caccgagagc agcaacctgg ccaacaacaa cgtgatcgag 420
gacagccggg acaacatcag cgtggacggc aagcagaccc agctgtgcat cgtgggctgc 480
acacccgcca tgggcgagca ctggaccaag ggcaccgctt gccgttctac cccgaccacc 540
gctggcgact gcccccctct ggccctgatc aacaccccca tcgaggacgg cgacatgatc 600
gacaccggct tcggcgccat ggacttcaag gtgctgcagg aaagcaaggc cgaggtcccc 660
ctggacatcg tgcagagcac ctgcaagtac cccgactacc tgaagatgag cgccgacgcc 720
tacggcgaca gcatgtggtt ctacctgcgg cgggagcagc tgttcgcccg gcactacttc 780
aacagagccg gcaaagtggg cgagacaatc cccgccgagc tgtacctgaa gggcagcaac 840
ggacgggagc ctcctcccag cagcgtgtac gtggccaccc ccagcggcag catgatcacc 900
agcgaggccc agctgttcaa caagccctac tggctgcagc gggcccaggg ccacaacaac 960
ggcatctgct ggggcaacca gctgttcgtg accgtcgtgg acactacccg gtccaccaac 1020
atgaccatca gcaccgccaa atctaccctg accaaatacg acgctcgtga aatcaaccag 1080
tacctgcggc acgtggagga atatgagctg cagttcgtct ttcagctgtg caagatcacc 1140
ctgagcgccg aagtgatggc ctacctgcac aacatgaacg ccaacctgct ggaagattgg 1200
aacatcggcc tgagcccccc tgtggctacc tctctggaag ataagtacag atacgtgcgg 1260
agcaccgcca tcacctgcca gagagagcag ccccccaccg agaagcagga ccccctggcc 1320
aagtacaagt tctgggacgt gaacctgcag gacagcttca gcaccgacct ggaccagttc 1380
cccctgggcc ggaagttcct gatgcagctg ggcaccagat ccaagcccgc cgtggccaca 1440
agcaagaagc ggagcgcccc cacaagcacc agcacccccg ccaagcggaa gcggagatga 1500
<210> 40
<211> 499
<212> PRT
<213> Human papillomavirus type 53
<400> 40
Met Ala Val Trp Arg Pro Ser Asp Ser Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Lys Val Ile Thr Thr Asp Ala Tyr Val Lys Arg Thr Thr
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Thr Val Gly His Pro
35 40 45
Tyr Tyr Pro Ile Ser Lys Ser Gly Lys Ala Asp Ile Pro Lys Val Ser
50 55 60
Ala Phe Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys
65 70 75 80
Phe Gly Leu Pro Asp Thr Asn Ile Phe Asn Pro Asp Gln Glu Arg Leu
85 90 95
Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly
100 105 110
Val Gly Val Ser Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu
115 120 125
Ser Ser Ser Ile Ala Ile Gln Asp Thr Ala Pro Asp Ser Arg Asp Asn
130 135 140
Val Ser Val Asp Pro Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys Ala
145 150 155 160
Pro Ala Ile Gly Glu His Trp Thr Lys Gly Thr Ala Cys Arg Ser Thr
165 170 175
Pro Thr Thr Ala Gly Asp Cys Pro Pro Leu Glu Leu Ile Asn Ser Pro
180 185 190
Ile Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Ala Leu Asn Phe
195 200 205
Lys Ala Leu Gln Glu Ser Lys Ser Asp Val Pro Leu Asp Ile Val Gln
210 215 220
Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr
225 230 235 240
Gly Asp Ser Met Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Thr Arg
245 250 255
His Phe Phe Asn Arg Ala Gly Val Ile Gly Glu Glu Ile Pro Asn Asp
260 265 270
Leu Tyr Ile Lys Gly Ser Asn Gly Arg Asp Pro Pro Pro Ser Ser Val
275 280 285
Tyr Val Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu
290 295 300
Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly
305 310 315 320
Ile Cys Trp Asn Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr Arg
325 330 335
Asn Thr Asn Met Thr Leu Ser Ala Thr Thr Gln Ser Met Ser Thr Tyr
340 345 350
Asn Ser Lys Gln Ile Lys Gln Tyr Val Arg His Ala Glu Glu Tyr Glu
355 360 365
Leu Gln Phe Val Phe Gln Leu Cys Lys Ile Ser Leu Ser Ala Glu Val
370 375 380
Met Ala Tyr Leu His Thr Met Asn Ser Thr Leu Leu Glu Asp Trp Asn
385 390 395 400
Ile Gly Leu Ser Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg
405 410 415
Tyr Val Lys Ser Ala Ala Ile Thr Cys Gln Lys Asp Gln Pro Pro Pro
420 425 430
Glu Lys Gln Asp Pro Leu Ser Lys Tyr Lys Phe Trp Glu Val Asn Leu
435 440 445
Gln Asn Ser Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys
450 455 460
Phe Leu Met Gln Val Gly Val Arg Thr Lys Pro Pro Val Ser Ser Lys
465 470 475 480
Lys Arg Ser Ala Ser Thr Thr Ser Thr Ser Ala Pro Ser Ser Lys Arg
485 490 495
Lys Arg Lys
<210> 41
<211> 1500
<212> DNA
<213> Human papillomavirus type 53
<400> 41
atggccgtgt ggaggcccag cgacagcaag gtgtacctgc cccccacccc cgtgagcaag 60
gtgatcacca ccgacgccta cgtgaagagg accaccatct tctaccacgc cggcagcagc 120
aggctgctga ccgtgggcca cccctactac cccatcagca agagcggcaa ggccgacatc 180
cccaaggtga gcgccttcca gtacagggtg ttcagggtga ggctgcccga ccccaacaag 240
ttcggcctgc ccgacaccaa catcttcaac cccgaccagg agaggctggt gtgggcctgc 300
gtgggcctgg agatcggcag gggccagccc ctgggcgtgg gcgtgagcgg ccaccccctg 360
ttcaacaggc tggacgacac cgagagcagc agcatcgcca tccaggacac cgcccccgac 420
agcagggaca acgtgagcgt ggaccccaag cagacccagc tgtgcatcat cggctgcgcc 480
cccgccatcg gcgagcactg gaccaagggc accgcctgca ggagcacccc caccaccgcc 540
ggcgactgcc cccccctgga gctgatcaac agccccatcg aggacggcga catggtggac 600
accggcttcg gcgccctgaa cttcaaggcc ctgcaggaga gcaagagcga cgtgcccctg 660
gacatcgtgc agagcacctg caagtacccc gactacctga agatgagcgc cgacgcctac 720
ggcgacagca tgtggttcta cctgaggagg gagcagctgt tcaccaggca cttcttcaac 780
agggccggcg tgatcggcga ggagatcccc aacgacctgt acatcaaggg cagcaacggc 840
agggaccccc cccccagcag cgtgtacgtg gccaccccca gcggcagcat gatcaccagc 900
gaggcccagc tgttcaacaa gccctactgg ctgcagaggg cccagggcca caacaacggc 960
atctgctgga acaaccagct gttcgtgacc gtggtggaca ccaccaggaa caccaacatg 1020
accctgagcg ccaccaccca gagcatgagc acctacaaca gcaagcagat caagcagtac 1080
gtgaggcacg ccgaggagta cgagctgcag ttcgtgttcc agctgtgcaa gatcagcctg 1140
agcgccgagg tgatggccta cctgcacacc atgaacagca ccctgctgga ggactggaac 1200
atcggcctga gcccccccgt ggccaccagc ctggaggaca agtacaggta cgtgaagagc 1260
gccgccatca cctgccagaa ggaccagccc ccccccgaga agcaggaccc cctgagcaag 1320
tacaagttct gggaggtgaa cctgcagaac agcttcagcg ccgacctgga ccagttcccc 1380
ctgggcagga agttcctgat gcaggtgggc gtgaggacca agccccccgt gagcagcaag 1440
aagaggagcg ccagcaccac cagcaccagc gcccccagca gcaagaggaa gaggaagtaa 1500
<210> 42
<211> 495
<212> PRT
<213> Human papillomavirus type 53
<400> 42
Met Pro Ser Asp Ser Lys Val Tyr Leu Pro Pro Thr Pro Val Ser Lys
1 5 10 15
Val Ile Thr Thr Asp Ala Tyr Val Lys Arg Thr Thr Ile Phe Tyr His
20 25 30
Ala Gly Ser Ser Arg Leu Leu Thr Val Gly His Pro Tyr Tyr Pro Ile
35 40 45
Ser Lys Ser Gly Lys Ala Asp Ile Pro Lys Val Ser Ala Phe Gln Tyr
50 55 60
Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro
65 70 75 80
Asp Thr Asn Ile Phe Asn Pro Asp Gln Glu Arg Leu Val Trp Ala Cys
85 90 95
Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Val Ser
100 105 110
Gly His Pro Leu Phe Asn Arg Leu Asp Asp Thr Glu Ser Ser Ser Ile
115 120 125
Ala Ile Gln Asp Thr Ala Pro Asp Ser Arg Asp Asn Val Ser Val Asp
130 135 140
Pro Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Ala Ile Gly
145 150 155 160
Glu His Trp Thr Lys Gly Thr Ala Cys Arg Ser Thr Pro Thr Thr Ala
165 170 175
Gly Asp Cys Pro Pro Leu Glu Leu Ile Asn Ser Pro Ile Glu Asp Gly
180 185 190
Asp Met Val Asp Thr Gly Phe Gly Ala Leu Asn Phe Lys Ala Leu Gln
195 200 205
Glu Ser Lys Ser Asp Val Pro Leu Asp Ile Val Gln Ser Thr Cys Lys
210 215 220
Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Ala Tyr Gly Asp Ser Met
225 230 235 240
Trp Phe Tyr Leu Arg Arg Glu Gln Leu Phe Thr Arg His Phe Phe Asn
245 250 255
Arg Ala Gly Val Ile Gly Glu Glu Ile Pro Asn Asp Leu Tyr Ile Lys
260 265 270
Gly Ser Asn Gly Arg Asp Pro Pro Pro Ser Ser Val Tyr Val Ala Thr
275 280 285
Pro Ser Gly Ser Met Ile Thr Ser Glu Ala Gln Leu Phe Asn Lys Pro
290 295 300
Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn
305 310 315 320
Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr Arg Asn Thr Asn Met
325 330 335
Thr Leu Ser Ala Thr Thr Gln Ser Met Ser Thr Tyr Asn Ser Lys Gln
340 345 350
Ile Lys Gln Tyr Val Arg His Ala Glu Glu Tyr Glu Leu Gln Phe Val
355 360 365
Phe Gln Leu Cys Lys Ile Ser Leu Ser Ala Glu Val Met Ala Tyr Leu
370 375 380
His Thr Met Asn Ser Thr Leu Leu Glu Asp Trp Asn Ile Gly Leu Ser
385 390 395 400
Pro Pro Val Ala Thr Ser Leu Glu Asp Lys Tyr Arg Tyr Val Lys Ser
405 410 415
Ala Ala Ile Thr Cys Gln Lys Asp Gln Pro Pro Pro Glu Lys Gln Asp
420 425 430
Pro Leu Ser Lys Tyr Lys Phe Trp Glu Val Asn Leu Gln Asn Ser Phe
435 440 445
Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Met Gln
450 455 460
Val Gly Val Arg Thr Lys Pro Pro Val Ser Ser Lys Lys Arg Ser Ala
465 470 475 480
Ser Thr Thr Ser Thr Ser Ala Pro Ser Ser Lys Arg Lys Arg Lys
485 490 495
<210> 43
<211> 1488
<212> DNA
<213> Human papillomavirus type 53
<400> 43
atgcccagcg acagcaaggt gtacctgccc cccacccccg tgagcaaggt gatcaccacc 60
gacgcctacg tgaagaggac caccatcttc taccacgccg gcagcagcag gctgctgacc 120
gtgggccacc cctactaccc catcagcaag agcggcaagg ccgacatccc caaggtgagc 180
gccttccagt acagggtgtt cagggtgagg ctgcccgacc ccaacaagtt cggcctgccc 240
gacaccaaca tcttcaaccc cgaccaggag aggctggtgt gggcctgcgt gggcctggag 300
atcggcaggg gccagcccct gggcgtgggc gtgagcggcc accccctgtt caacaggctg 360
gacgacaccg agagcagcag catcgccatc caggacaccg cccccgacag cagggacaac 420
gtgagcgtgg accccaagca gacccagctg tgcatcatcg gctgcgcccc cgccatcggc 480
gagcactgga ccaagggcac cgcctgcagg agcaccccca ccaccgccgg cgactgcccc 540
cccctggagc tgatcaacag ccccatcgag gacggcgaca tggtggacac cggcttcggc 600
gccctgaact tcaaggccct gcaggagagc aagagcgacg tgcccctgga catcgtgcag 660
agcacctgca agtaccccga ctacctgaag atgagcgccg acgcctacgg cgacagcatg 720
tggttctacc tgaggaggga gcagctgttc accaggcact tcttcaacag ggccggcgtg 780
atcggcgagg agatccccaa cgacctgtac atcaagggca gcaacggcag ggaccccccc 840
cccagcagcg tgtacgtggc cacccccagc ggcagcatga tcaccagcga ggcccagctg 900
ttcaacaagc cctactggct gcagagggcc cagggccaca acaacggcat ctgctggaac 960
aaccagctgt tcgtgaccgt ggtggacacc accaggaaca ccaacatgac cctgagcgcc 1020
accacccaga gcatgagcac ctacaacagc aagcagatca agcagtacgt gaggcacgcc 1080
gaggagtacg agctgcagtt cgtgttccag ctgtgcaaga tcagcctgag cgccgaggtg 1140
atggcctacc tgcacaccat gaacagcacc ctgctggagg actggaacat cggcctgagc 1200
ccccccgtgg ccaccagcct ggaggacaag tacaggtacg tgaagagcgc cgccatcacc 1260
tgccagaagg accagccccc ccccgagaag caggaccccc tgagcaagta caagttctgg 1320
gaggtgaacc tgcagaacag cttcagcgcc gacctggacc agttccccct gggcaggaag 1380
ttcctgatgc aggtgggcgt gaggaccaag ccccccgtga gcagcaagaa gaggagcgcc 1440
agcaccacca gcaccagcgc ccccagcagc aagaggaaga ggaagtaa 1488
<210> 44
<211> 10
<212> PRT
<213> Human papillomavirus type 53
<400> 44
Thr Ala Cys Arg Ser Thr Pro Thr Thr Ala
1 5 10
- 上一篇:一种医用注射器针头装配设备
- 下一篇:一种人乳头瘤病毒68型L1蛋白的突变体