使用编码具有增加的表达的重组fviii变体的病毒载体的a型血友病的基因疗法

文档序号:939419 发布日期:2021-03-05 浏览:43次 >En<

阅读说明:本技术 使用编码具有增加的表达的重组fviii变体的病毒载体的a型血友病的基因疗法 (Gene therapy for hemophilia A using viral vectors encoding recombinant FVIII variants with increased expression ) 是由 H·罗滕施泰纳 W·赫尔里格尔 于 2019-07-15 设计创作,主要内容包括:本公开尤其提供编码在哺乳动物细胞中表达的因子VIII变体的密码子改变的多核苷酸。在一些实施方案中,本公开还提供用于治疗A型血友病的哺乳动物基因疗法载体和方法。在一些实施方案中,本公开提供用于向A型血友病患者给予编码因子VIII多肽的多核苷酸,例如密码子改变的多核苷酸的方法。(The present disclosure provides, inter alia, polynucleotides encoding codon alterations of factor VIII variants expressed in mammalian cells. In some embodiments, the present disclosure also provides mammalian gene therapy vectors and methods for treating hemophilia a. In some embodiments, the disclosure provides methods for administering a polynucleotide, e.g., a codon altered polynucleotide, encoding a factor VIII polypeptide to a hemophilia a patient.)

使用编码具有增加的表达的重组FVIII变体的病毒载体的A型 血友病的基因疗法

相关申请的交叉引用

本申请要求2018年7月16日提交的美国临时专利申请序列号62/698,680的优先权,并且要求2019年6月26日提交的美国临时专利申请序列号62/867,171的优先权,所述临时专利申请两者均特此以引用的方式整体并入。

序列表

本申请含有已经以电子方式以ASCII格式提交并且特此以引用的方式整体并入的序列表。2019年7月15日创建的所述ASCII拷贝名称为008073_5202_WO_Sequence_Listing.txt且大小为85,000字节。

发明背景

血液凝固经由称为凝固级联(cascade)的相互依赖生物化学反应的复杂和动态生物路径进行。在级联中凝血因子VIII(FVIII)为关键组分。因子VIII被募集至出血位点,并且与活化因子IX(FIXa)和因子X(FX)形成Xase复合物。Xase复合物活化FX,其进而将凝血酶原活化成凝血酶,所述凝血酶随后活化凝固级联中的其他组分以生成稳定凝块(在Saenko等人,Trends Cardiovasc.Med.,9:185-192(1999);Lenting等人,Blood,92:3983-3996(1998)中综述)。

A型血友病为先天性X连锁出血病症,其特征在于缺乏因子VIII活性。减弱的因子VIII活性抑制凝固级联中的正反馈回路。这造成不完全凝固,其显示为持续时间增加的出血发作、大面积淤血、口腔和鼻部自发性出血、关节僵硬和慢性疼痛,并且在严重情况下可能显示为内部出血和贫血(Zhang等人,Clinic.Rev.Allerg.Immunol.,37:114-124(2009))。

常规地,A型血友病由因子VIII替代疗法来治疗,所述疗法由向患有A型血友病的个体施用因子VIII蛋白(例如血浆源性或以重组方式产生的因子VIII)组成。预防性施用因子VIII以响应于急性出血发作而预防出血发作或降低出血发作的频率,和/或在手术前后施用因子VIII以控制手术期间的出血。然而,因子VIII替代疗法存在若干非所需特征。

首先,因子VIII替代疗法用于治疗或控制A型血友病,但不治愈潜在因子VIII缺乏。由于这一点,患有A型血友病的受试者在其生命周期里需要因子VIII替代疗法。连续治疗为昂贵的且需要受试者维持严格的顺应性,因为对于患有重度A型血友病的受试者而言,仅少量预防性剂量的遗漏就可具有严重后果。

第二,因为因子VIII具有相对较短体内半衰期,常规预防性因子VIII替代疗法需要每两天或三天施用。这为受试者带来在其全部生命中维持顺应性的负担。虽然第三代“长效”因子VIII药物可降低施用频率,但使用这些药物的预防性因子FVIII替代疗法仍然需要永久地每月、每周或更频繁地施用。举例而言,使用ELOCTATETM[抗血友病因子(重组型),Fc融合蛋白]的预防性治疗需要每三至五天施用(ELOCTATETM处方信息,Biogen Idec公司,(2015))。此外,尚未完全了解经化学修饰的生物制剂(例如聚乙二醇化多肽)的长期作用。

第三,介于15%与30%之间的所有接受因子VIII替代疗法的受试者形成抗因子VIII抑制子抗体,从而使得所述疗法效率低下。因子VIII旁路疗法(例如施用血浆源性或以重组方式产生的凝血酶原复合浓缩物)可用于治疗形成抑制子抗体的个体的血友病。然而,因子VIII旁路疗法不如因子VIII替代疗法有效(Mannucci P.M.,J Thromb Haemost.,1(7):1349-55(2003)),并且可能与增加的心血管并发症风险相关(Luu和Ewenstein,Haemophilia,增刊10 2:10-16(2004))。

体细胞基因疗法对于治疗A型血友病具有较大前景,因为其弥补潜在低表达功能性因子VIII活性(例如由于错义或无义突变),而非向个体提供因子VIII活性的单次剂量。由于作用机制方面的这种差异,相较于因子VIII替代疗法,单次施用因子VIII基因疗法载体可为个体提供因子VIII若干年,从而降低治疗成本并消除持续患者顺应性的需要。

已有效使用凝固因子IX(FIX)基因疗法来治疗患有B型血友病的受试者(特征为减弱的因子IX活性的相关血液凝固疾患)(Manno C.S.,等人,Nat Med.,12(3):342-47(2006))。然而,因子VIII基因疗法呈现若干独特的挑战。举例而言,全长野生型因子VIII多肽(2351个氨基酸;UniProt登录号P00451)比全长野生型因子IX多肽(461个氨基酸;UniProt登录号P00740)大五倍。因而,野生型因子VIII的编码序列为7053个碱基对,其太大而不能封装于常规AAV基因疗法载体中。此外,因子VIII的B结构域缺失变体(BDD-FVIII)的所报告重组表达较差。因此,若干组已尝试改变BDD-FVIII构建体的密码子使用,但成功有限。

发明内容

因此,需要因子VIII变体,其编码序列更有效封装于基因疗法载体中且经由基因疗法载体传递。还需要更有效地表达因子VIII的合成密码子改变的核酸。此类因子VIII变体和密码子改变的核酸可改善因子VIII缺乏(例如A型血友病)的治疗。上文缺乏和与因子VIII缺乏(例如A型血友病)的治疗相关的其他问题由所公开的密码子改变的因子VIII变体减少或消除。

根据一些实施方案,本公开提供编码因子VIII变体的核酸,所述核酸与所公开的因子VIII重链(例如CS04-HC-NA)和轻链(例如CS04-LC-NA)的密码子改变的序列具有高序列同一性。在一些实施方案中,这些核酸在编码因子VIII重链和轻链的序列之间进一步包括编码代替天然因子VIII B结构域的接头序列(例如包含弗林蛋白酶(furin)裂解位点的接头序列)的序列。

在一个方面中,本公开提供一种包括编码因子VIII多肽的核苷酸序列的多核苷酸。因子VIII多肽包括轻链、重链和连接所述重链的C末端与所述轻链的N末端的多肽接头。因子VIII多肽的重链由与CS04-HC-NA(SEQ ID NO:3)具有至少95%同一性的第一核苷酸序列编码。因子FVIII多肽的轻链由与CS04-LC-NA(SEQ ID NO:4)具有至少95%同一性的第二核苷酸序列编码。多肽接头包含弗林蛋白酶裂解位点。

在上文所描述的多核苷酸的一个实施方案中,多肽接头由与BDLO04(SEQ ID NO:5)具有至少95%同一性的第三核苷酸序列编码。

在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与对应重链序列(例如CS04-HC-NA(SEQ ID NO:3))具有至少96%同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与对应轻链序列(例如CS04-LC-NA(SEQ ID NO:4))具有至少96%同一性。

在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与对应重链序列(例如CS04-HC-NA(SEQ ID NO:3))具有至少97%同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与对应轻链序列(例如CS04-LC-NA(SEQ ID NO:4))具有至少97%同一性。

在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与对应重链序列(例如CS04-HC-NA(SEQ ID NO:3))具有至少98%同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与对应轻链序列(例如CS04-LC-NA(SEQ ID NO:4))具有至少98%同一性。

在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与对应重链序列(例如CS04-HC-NA(SEQ ID NO:3))具有至少99%同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与对应轻链序列(例如CS04-LC-NA(SEQ ID NO:4))具有至少99%同一性。

在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与对应重链序列(例如CS04-HC-NA(SEQ ID NO:3))具有至少99.5%同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与对应轻链序列(例如CS04-LC-NA(SEQ IDNO:4))具有至少99.5%同一性。

在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与对应重链序列(例如CS04-HC-NA(SEQ ID NO:3))具有至少99.9%同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与对应轻链序列(例如CS04-LC-NA(SEQ IDNO:4))具有至少99.9%同一性。

在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列为CS04-HC-NA(SEQ ID NO:3),并且编码因子FVIII多肽的轻链的第二核苷酸序列为CS04-LC-NA(SEQ ID NO:4)。

在一个方面中,本公开提供一种多核苷酸,所述多核苷酸包含与CS04-FL-NA具有至少95%同一性的核苷酸序列,其中所述多核苷酸编码因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与对应全长多核苷酸序列(例如CS04-FL-NA(SEQ ID NO:1))具有至少96%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与对应全长多核苷酸序列(例如CS04-FL-NA(SEQ ID NO:1))具有至少97%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与对应全长多核苷酸序列(例如CS04-FL-NA(SEQ ID NO:1))具有至少98%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与对应全长多核苷酸序列(例如CS04-FL-NA(SEQ ID NO:1))具有至少99%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与对应全长多核苷酸序列(例如CS04-FL-NA(SEQ ID NO:1))具有至少99.5%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与对应全长多核苷酸序列(例如CS04-FL-NA(SEQ ID NO:1))具有至少99.9%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS04-FL-NA(SEQ IDNO:1)。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AA(SEQ ID NO:2)具有至少95%同一性的氨基酸序列的因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AA(SEQ ID NO:2)具有至少96%同一性的氨基酸序列的因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AA(SEQ ID NO:2)具有至少97%同一性的氨基酸序列的因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AA(SEQ ID NO:2)具有至少98%同一性的氨基酸序列的因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AA(SEQ ID NO:2)具有至少99%同一性的氨基酸序列的因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AA(SEQ ID NO:2)具有至少99.5%同一性的氨基酸序列的因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AA(SEQ ID NO:2)具有至少99.9%同一性的氨基酸序列的因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含CS04-FL-AA(SEQID NO:2)的氨基酸序列的因子VIII多肽。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由CS04-FL-NA、CS04-HC-NA和CS04-LC-NA组成的组的序列具有至少95%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由CS04-FL-NA、CS04-HC-NA和CS04-LC-NA组成的组的序列具有至少96%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由CS04-FL-NA、CS04-HC-NA和CS04-LC-NA组成的组的序列具有至少97%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由CS04-FL-NA、CS04-HC-NA和CS04-LC-NA组成的组的序列具有至少98%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由CS04-FL-NA、CS04-HC-NA和CS04-LC-NA组成的组的序列具有至少99%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由CS04-FL-NA、CS04-HC-NA和CS04-LC-NA组成的组的序列具有至少99.5%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由CS04-FL-NA、CS04-HC-NA和CS04-LC-NA组成的组的序列具有至少99.5%同一性。

在上文所描述的多核苷酸的一个实施方案中,核苷酸序列选自由CS04-FL-NA、CS04-HC-NA和CS04-LC-NA组成的组。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸还包括可操作地连接至编码因子VIII多肽的多核苷酸的启动子元件。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸还包括可操作地连接至编码因子VIII多肽的多核苷酸的增强子元件。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸还包括可操作地连接至编码因子VIII多肽的多核苷酸的聚腺苷酸化元件。

在上文所描述的多核苷酸的一个实施方案中,多核苷酸还包括以操作方式连接至编码因子VIII多肽的核苷酸序列的内含子。

在上文所描述的多核苷酸的一个实施方案中,内含子位于编码因子VIII多肽的核苷酸序列的启动子元件与翻译起始位点(例如,第一编码ATG)之间。

在另一方面中,本公开提供一种包含如上文所描述的多核苷酸的哺乳动物基因疗法载体。

在上文所描述的哺乳动物基因疗法载体的一个实施方案中,哺乳动物基因疗法载体为腺相关病毒(AAV)载体。

在上文所描述的哺乳动物基因疗法载体的一个实施方案中,AAV载体为AAV-8载体。

在另一方面中,本公开提供一种用于治疗A型血友病的方法,所述方法包括向有需要的患者施用如上文所描述的哺乳动物基因疗法载体。

在另一方面中,本公开提供一种如上文所描述的哺乳动物基因疗法载体,其用于治疗A型血友病。

在另一方面中,本公开提供如上文所描述的哺乳动物基因疗法载体用于制造用于治疗A型血友病的药物的用途。

附图说明

图1示出野生型和ReFacto型人因子VIII蛋白构建体的示意性说明。

图2A和2B示出根据一些实施方案的编码因子VIII变体的CS04密码子改变的核苷酸序列(SEQ ID NO:1)(对于全长编码序列,“CS04-FL-NA”)。

图3示出根据一些实施方案的由CS04密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQ ID NO:2)(对于全长氨基酸序列,“CS04-FL-AA”)。

图4示出根据一些实施方案的编码因子VIII变体的重链的CS04密码子改变的核苷酸序列(SEQ ID NO:3)(“CS04-HC-NA”)的部分。

图5示出根据一些实施方案的编码因子VIII变体的轻链的CS04密码子改变的核苷酸序列(SEQ ID NO:4)(“CS04-LC-NA”)的部分。

图6示出根据一些实施方案的B结构域经取代接头的示例性编码序列(SEQ ID NO:5)。BDLO04(SEQ ID NO:5)为编码B结构域经取代接头的CS04密码子改变的核苷酸序列的对应部分。

图7A、7B和7C示出根据一些实施方案的含有CS04密码子改变的核苷酸序列的AAV载体序列(SEQ ID NO:8)(“CS04-AV-NA”)。

图8A和8B示出根据一些实施方案的编码因子VIII变体的CS08密码子改变的核苷酸序列(SEQ ID NO:7)(“CS08-FL-NA”)。

图9A和9B示出根据一些实施方案的编码因子VIII变体的CS10密码子改变的核苷酸序列(SEQ ID NO:8)(“CS10-FL-NA”)。

图10A和10B示出根据一些实施方案的编码因子VIII变体的CS11密码子改变的核苷酸序列(SEQ ID NO:9)(“CS11-FL-NA”)。

图11A和11B示出根据一些实施方案的CS40野生型ReFacto编码序列(SEQ ID NO:10)(“CS40-FL-NA”)。

图12A和12B示出根据一些实施方案的编码因子VIII变体的CH25密码子改变的核苷酸序列(SEQ ID NO:11)(“CH25-FL-NA”)。

图13示出根据一些实施方案的野生型人因子VIII氨基酸序列(SEQ ID NO:12)(“FVIII-FL-AA”)。

图14说明通过将合成Refacto型BDD-FVIII DNA序列经由Ascl和Notl限制位点插入载体主链pCh-BBO1中克隆pCS40、pCS04、pCS08、pCS1O、pCS11和pCh25构建体的流程。

图15示出如通过琼脂糖凝胶电泳所分析,AAV载体基因组制剂的完整性。泳道1,DNA标记;泳道2,vCS40;泳道4,vCS04。AAV载体均具有相同大小的基因组,迁移于大约5kb处(右侧箭头)。左侧上的刻度指示以千碱基(kb)为单位的DNA片段的大小。

图16示出通过PAGE和银染色的AAV载体制剂的蛋白分析。泳道1,蛋白质标记(M);泳道2,vCS40;和泳道4,vCS04。构建体均具有相同的由VP1、VP2和VP3(右侧箭头)组成的AAV8衣壳。左侧上的刻度指示以千道尔顿(kDa)为单位的蛋白质标记的大小。

图17示出全身性施用如实施例3中所描述的基于(r)AAV8的基因疗法载体后的FVIII活性,所述基因疗法载体含有CS04因子VIII密码子优化构建体。cp,载体衣壳颗粒;FVIII,因子VIII;LLOQ,定量下限。14、28、42和56天时间点示出于图示中的左侧至右侧。

图18示出在尾尖出血测定中,在全身性施用如实施例3中所描述的基于(r)AAV8的基因疗法载体之后失血量减少,所述基因疗法载体含有CS04因子VIII密码子优化构建体。cp,载体衣壳颗粒。

图19A、19B和19C示出在全身性施用之后含有CS04因子VIII密码子优化的构建体DNA的基于(r)AAV8的基因疗法载体的生物分布。1902=肝脏;1904=淋巴结;1906=骨胳肌;1908=心脏;1910=肾脏;1912=脾脏;1914=肺;1916=睪丸;1918=脑部。

具体实施方式

I.引言

基于AAV的基因疗法对于治疗血友病患者具有较大前景。对于B型血友病,第一临床数据令人鼓舞地为可在至少一些患者中维持约10%的FIX水平超过1年。然而对于A型血友病,出于各种原因获得AAV载体的5%-10%治疗表达水平仍然具挑战性。首先,对于常规基于AAV的载体而言因子VIII编码序列过大。第二,经工程改造的B结构域缺失或截短的因子VIII构建体受体内较差表达的影响,即使当密码子优化时也如此。第三,这些B结构域缺失或截短的因子VIII变体构建体在体内具有短半衰期,从而加重了较差表达的影响。第四,即使当表达时,FVIII也不如其他凝血因子(诸如因子IX)般有效地从细胞分泌。因此,对于A型血友病患者而言,需要改善FVIII表达的策略来使得FVIII基因疗法成为切实可行的治疗选择。

本公开涉及对解决这些和与因子VIII基因疗法相关的其他问题的密码子改变的因子VIII变体编码序列的发现。举例而言,本文所公开的多核苷酸在哺乳动物细胞中提供明显改善的表达,并且由于稳定化的填充相互作用,显示改善的病毒粒子封装。在一些实施方案中,这些优点通过使用与密码子改变的CS04构建体具有高序列同一性(例如与CS04-HC重链编码序列具有高序列同一性且与CS04-LC轻链编码序列具有高序列同一性)的因子VIII的重链和轻链的编码序列实现。

在一些实施方案中,由本文中所描述的多核苷酸编码的因子VIII分子已通过截短、缺失或代替野生型B结构域而缩短。因而,多核苷酸更适合于经由常规基因疗法载体表达因子VIII,所述常规基因疗法载体低效地表达较大多肽,诸如野生型因子VIII。

有利地,本文示出CS04密码子改变的因子VIII变体编码序列提供B结构域缺失的因子VIII构建体的体内优异表达。举例而言,实施例2和表4中证实,在因子VIII基因敲除小鼠中静脉内施用具有CS04(SEQ ID NO:1)编码序列的基于AAV的基因疗法载体相对于用野生型多核苷酸序列(SEQ ID NO:10)编码的对应CS40构建体提供因子VIII表达的74倍增加(表4)。

此外,本文还示出CS04密码子改变的因子VIII变体编码序列提供优异的病毒粒子封装和病毒产生。举例而言,实施例1中证实当从相同量的细胞小球分离时,相对于用野生型多核苷酸序列编码的对应CS40构建体,含有CS04构建体的AAV载体构建体提供大5至7倍的病毒产量。

II.定义

如本文所用,除非另外规定,否则以下术语具有归属于其的含义。

如本文所用,术语“因子VIII”和“FVIII”可互换使用,并且是指具有因子VIII活性的任何蛋白质(例如活性FVIII,通常称为FVIIIa)或具有因子VIII活性、尤其因子IXa辅因子活性的蛋白质的蛋白质前体(例如原蛋白或前原蛋白)。在一个示例性实施方案中,因子VIII多肽是指具有与野生型因子VIII多肽的重链和轻链具有高序列同一性(例如至少70%、75%、80%、85%、90%、95%、99%或更高)的序列的多肽。在一些实施方案中,因子VIII多肽的B结构域经缺失、截短或被接头多肽代替以减小编码因子VIII多肽的多核苷酸的大小。在一个示例性实施方案中,CS04-FL-AA的氨基酸20-1457构成因子VIII多肽。

野生型因子VIII多肽的非限制性实例包括人前原因子VIII(例如GenBank登录号AAA52485、CAA25619、AAA58466、AAA52484、AAA52420、AAV85964、BAF82636、BAG36452、CAI41660、CAI41666、CAI41672、CAI43241、CA003404、EAW72645、AAH22513、AAH64380、AAH98389、AAI11968、AAI11970或AAB61261)、对应原因子VIII及其天然变体;猪前原因子VIII(例如UniProt登录号F1RZ36或K7GSZ5)、对应原因子VIII及其天然变体;小鼠前原因子VIII(例如GenBank登录号AAA37385、CAM15581、CAM26492或EDL29229)、对应原因子VIII及其天然变体;大鼠前原因子VIII(例如GenBank登录号AAQ21580)、对应原因子VIII及其天然变体;大鼠前原因子VIII;以及其他哺乳动物因子VIII同源物(例如猴、猿、仓鼠、豚鼠等)。

如本文所用,因子VIII多肽包括具有因子IX辅因子活性的天然变体和人工构建体。如本公开中所用,因子VIII涵盖保留一些基本因子IX辅因子活性(例如对应野生型活性的至少5%、10%、25%、50%、75%或更大)的任何天然变体、替代序列、同种型或突变蛋白。存在于人群体中的因子VIII氨基酸变体(相对于FVIII-FL-AA(SEQ ID NO:12))的实例包括但不限于:S19R、R22T、Y24C、Y25C、L26P/R、E30V、W33G、Y35C/H、G41C、R48C/K、K67E/N、L69P、E72K、D75E/V/Y、P83R、G89D/V、G92A/V、A97P、E98K、V99D、D101G/H/V、V104D、K108T、M110V、A111T/V、H113R/Y、L117F/R、G121S、E129V、G130R、E132D、Y133C、D135G/Y、T137A/I、S138R、E141K、D145H、V147D、Y155H、V159A、N163K、G164D/V、P165S、C172W、S176P、S179P、V181E/M、K185T、D186G/N/Y、S189L、L191F、G193R、L195P、C198G、S202N/R、F214V、L217H、A219D/T、V220G、D222V、E223K、G224W、T252I、V253F、N254I、G255V、L261P、P262L、G263S、G266F、C267Y、W274C、H275L、G278R、G280D、E284K、V285G、E291G/K、T294I、F295L、V297A、N299I、R301C/H/L、A303E/P、I307S、S308L、F312S、T314A/I、A315V、G323E、L326P、L327P/V、C329F、133IV、M339T、E340K、V345A/L、C348R/S/Y、Y365C、R391C/H/P、S392L/P、A394S、W401G、I405F/S、E409G、W412G/R、K427I、L431F/S、R437P/W、I438F、G439D/S/V、Y442C、K444R、Y450D/N、T454I、F455C、G466E、P470L/R/T、G474E/R/V、E475K、G477V、D478N、T479R、F484C、A488G、R490G、Y492C/H、Y492H、I494T、P496R、G498R、R503H、G513S/V、I522Y、K529E、W532G、P540T、T541S、D544N、R546W、R550C/G/H、S553P、S554C/G、V556D、R560T、D561G/H/Y、I567T、P569R、S577F、V578A、D579A/H、N583S、Q584H/K/R、I585R/T、M586V、D588G/Y、L594Q、S596P、N601D/K、R602G、S603I/R、W604C、Y605H/S、N609I、R612C、N631K/S、M633I、S635N、N637D/I/S、Y639C、L644V、L650F、V653A/M、L659P、A663V、Q664P、F677L、M681I、V682F、Y683C/N、T686R、F698L、M699T/V、M701I、G705V、G710W、N713I、R717L/W、G720D/S、M721I/L、A723T、L725Q、V727F、E739K、Y742C、R795G、P947R、V1012L、E1057K、H1066Y、D1260E、K1289Q、Q1336K、N1460K、L1481P、A1610S、I1698T、Y1699C/F、E1701K、Q1705H、R1708C/H、T1714S、R1715G、A1720V、E1723K、D1727V、Y1728C、R1740G、K1751Q、F1762L、R1768H、G1769R、L1771P、L1775F/V、L1777P、G1779E/R、P1780L、I1782R、D1788H、M1791T、A1798P、S1799H、R1800C/G/H、P1801A、Y1802C、S1803Y、F1804S、L1808F、M1842I、P1844S、T1845P、E1848G、A1853T/V、S1858C、K1864E、D1865N/Y、H1867P/R、G1869D/V、G1872E、P1873R、L1875P、V1876L、C1877R/Y、L1882P、R1888I、E1894G、I1901F、E1904D/K、S1907C/R、W1908L、Y1909C、A1939T/V、N1941D/S、G1942A、M1945V、L1951F、R1960L/Q、L1963P、S1965I、M1966I/V、G1967D、S1968R、N1971T、H1973L、G1979V、H1980P/Y、F1982I、R1985Q、L1994P、Y1998C、G2000A、T2004R、M2007I、G2013R、W2015C、R2016P/W、E2018G、G2022D、G2028R、S2030N、V2035A、Y2036C、N2038S、2040Y、G2045E/V、I2051S、I2056N、A2058P、W2065R、P2067L、A2070V、S2082N、S2088F、D2093G/Y、H2101D、T2105N、Q2106E/P/R、G2107S、R2109C、I2117F/S、Q2119R、F2120C/L、Y2124C、R2135P、S2138Y、T2141N、M2143V、F2145C、N2148S、N2157D、P2162L、R2169C/H、P2172L/Q/R、T2173A/I、H2174D、R2178C/H/L、R2182C/H/P、M2183R/V、L2185S/W、S2192I、C2193G、P2196R、G2198V、E2200D、I2204T、I2209N、A2211P、A2220P、P2224L、R2228G/L/P/Q、L2229F、V2242M、W2248C/S、V2251A/E、M2257V、T2264A、Q2265R、F2279C/I、I2281T、D2286G、W2290L、G2304V、D2307A、P2319L/S、R2323C/G/H/L、R2326G/L/P/Q、Q2330P、W2332R、I2336F、R2339T、G2344C/D/S和C2345S/Y。因子VIII蛋白还包括含有翻译后修饰的多肽。

一般而言,编码因子VIII的多核苷酸编码无活性单链多肽(例如前原蛋白),其经历翻译后加工以形成活性因子VIII蛋白(例如FVIIIa)。举例而言,参考图1,野生型人因子VIII前原蛋白首先裂解以释放所编码的信号肽(未示出),从而形成第一单链原蛋白(示出为“人野生型FVIII”)。随后原蛋白在B结构域与A3结构域之间裂解以形成包含因子VIII重链(例如A1和A2结构域)和B结构域的第一多肽,和包含因子VIII轻链(例如包括A3、C1和C3结构域)的第二多肽。第一多肽进一步裂解以移除B结构域,并且还分离A1与A2结构域,其在成熟因子Villa蛋白中保持与因子VIII轻链缔合。对于因子VIII成熟方法的综述,参见Graw等人,Nat Rev Genet.,6(6):488-501(2005),其内容出于所有目的以引用的方式整体并入本文中。

然而,在一些实施方案中,因子VIII多肽为单链因子VIII多肽。单链因子VIII多肽经工程改造以移除天然裂解位点,并且任选地移除、截短或代替因子VIII的B结构域。因而,其因裂解(除任选的信号和/或前导肽的裂解以外)而不成熟,并且作为单链为活性的。单链因子VIII多肽的非限制性实例描述于Zollner等人(Thromb Res,134(1):125-31(2014))和Donath等人(Biochem I.,312(1):49-55(1995))中,其公开内容出于所有目的以引用的方式整体并入本文中。

如本文所用,术语“因子VIII重链”或简单地“重链”是指因子VIII多肽的A1和A2结构域的聚集体。在一个示例性实施方案中,CS04-FL-AA(SEQ ID NO:2)的氨基酸20-759构成因子VIII重链。

如本文所用,术语“因子VIII轻链”或简单地“轻链”是指因子VIII多肽的A3、C1和C2结构域的聚集体。在一个示例性实施方案中,CS04-FL-AA(SEQ ID NO:2)的氨基酸774-1457构成因子VIII轻链。在一些实施方案中,因子VIII轻链不包括在成熟期间在体内释放的酸性a3肽。

一般而言,因子VIII重链和轻链表达为单一多肽链,例如连同任选的的B结构域或B结构域经取代接头一起。然而,在一些实施方案中,因子VIII重链和因子VIII轻链表达为单独的多肽链(例如共表达的),并且经重建以形成因子VIII蛋白(例如体内或体外)。

如本文所用,术语“B结构域经取代接头”和“因子VIII接头”可互换使用,并且是指野生型因子VIII B结构域的截短型式(例如FVIII-FL-AA(SEQ ID NO:12)的氨基酸760-1667),或经工程改造以代替因子VIII多肽的B结构域的肽。如本文所用,在根据一些实施方案的因子VIII变体多肽中,因子VIII接头位于因子VIII重链的C末端与因子VIII轻链的N末端之间。B结构域经取代接头的非限制性实例公开于以下中:美国专利号4,868,112、5,112,950、5,171,844、5,543,502、5,595,886、5,610,278、5,789,203、5,972,885、6,048,720、6,060,447、6,114,148、6,228,620、6,316,226、6,346,513、6,458,563、6,924,365、7,041,635和7,943,374;美国专利申请公布号2013/024960、2015/0071883和2015/0158930;和PCT公布号WO 2014/064277和WO 2014/127215,其公开内容出于所有目的以引用的方式整体并入本文中。

除非本文另外规定,否则因子VIII氨基酸的编号是指全长野生型人因子VIII序列(FVIII-FL-AA)(在图13中呈现为SEQ ID NO:12)中的对应氨基酸。因而,当提及本文所公开的因子VIII变体蛋白中的氨基酸取代时,所列举的氨基酸编号是指全长野生型因子VIII序列中的类似(例如结构上或功能上等效)和/或同源(例如在一级氨基酸序列中进化保守的)氨基酸。举例而言,T2105N氨基酸取代是指在全长野生型人因子VIII序列(FVIII-FL-AA;SEQ ID NO:12)的位置2105处的T至N取代基和在由CS04(CS04-FL-AA;SEQ ID NO:2)编码的因子VIII变体蛋白的位置1211处的T至N取代基。

如本文所描述,因子VIII氨基酸编号系统取决于是否包含因子VIII信号肽(例如全长野生型人因子VIII序列的氨基酸1至19)。在包含信号肽时,编号称为“信号肽包含”或“SPI”。在不包含信号肽时,编号称为“信号肽排除”或“SPE”。举例而言,对于与SPE编号中的F309S相同的氨基酸,F328S为SPI编号。除非另有指示,否则所有氨基酸编号是指全长野生型人因子VIII序列(FVIII-FL-AA)(在图13中呈现为SEQ ID NO:12)中的对应氨基酸。

如本文所描述,相较于由天然编码的因子VIII构建体(例如使用野生型人密码子编码相同因子VIII构建体的多核苷酸)提供的因子VIII表达水平,密码子改变的多核苷酸提供体内转基因因子VIII的增加的表达(例如当作为基因疗法载体的部分施用时)。如本文所用,术语“增加的表达”是指相较于施用天然编码的因子VIII构建体的动物血液中的转基因因子VIII活性水平,施用编码因子VIII的密码子改变的多核苷酸的动物血液中的转基因因子VIII活性的增加的水平。可使用本领域中已知的任何因子VIII活性测量活性水平。用于确定因子VIII活性的示例性测定为Technochrome FVIII测定(Technoclone,Vienna,Austria)。

在一些实施方案中,增加的表达是指相较于施用天然编码的因子VIII多核苷酸的动物血液中的转基因因子VIII活性水平,施用密码子改变的因子VIII多核苷酸的动物血液中大至少25%的转基因因子VIII活性。在一些实施方案中,增加的表达是指相较于施用天然编码的因子VIII多核苷酸的动物血液中的转基因因子VIII活性水平,施用密码子改变的因子VIII多核苷酸的动物血液中大至少50%、大至少75%、大至少100%、大至少3倍、大至少4倍、大至少5倍、大至少6倍、大至少7倍、大至少8倍、大至少9倍、大至少1O倍、大至少15倍、大至少20倍、大至少25倍、大至少30倍、大至少40倍、大至少50倍、大至少60倍、大至少70倍、大至少80倍、大至少90倍、大至少1OO倍、大至少125倍、大至少150倍、大至少175倍、大至少200倍、大至少225倍或大至少250倍的转基因因子VIII活性。

如本文所描述,相较于由天然编码的因子VIII构建体(例如使用野生型人密码子编码相同因子VIII构建体的多核苷酸)提供的载体产生水平,密码子改变的多核苷酸提供增加的载体产生。如本文所用,术语“增加的病毒产生”是指相较于接种有天然编码的因子VIII构建体的细胞培养物中的载体产量,接种有编码因子VIII的密码子改变的多核苷酸的细胞培养物中的增加的载体产量(例如效价/升培养物)。可使用本领域中已知的任何载体效价测定测量载体产量。用于确定载体产量(例如AAV载体的载体产量)的示例性测定为靶向AAV2反向末端重复序列的qPCR(Aurnhammer,Human Gene Therapy Methods:Part B 23:18-28(2012))。

在一些实施方案中,增加的病毒产生是指在相同类型培养物中,相较于天然编码的因子VIII构建体的产量,大至少25%的密码子改变的载体产量。在一些实施方案中,增加的载体产生是指在相同类型的培养物中,相较于天然编码的因子VIII构建体的产量,大至少50%、大至少75%、大至少100%、大至少3倍、大至少4倍、大至少5倍、大至少6倍、大至少7倍、大至少8倍、大至少9倍、大至少1O倍、大至少15倍或大至少20倍的密码子改变的载体产量。

如本文所用,术语“血友病”是指大致特征为减少的血液凝结或凝固的一组疾病状态。血友病可指A型、B型或C型血友病,或指所有三种疾病类型的复合。A型血友病(A型血友病(hemophilia A))由因子VIII(FVIII)活性的降低或缺失造成且为最重要的血友病子类型。B型血友病(B型血友病(hemophilia B))由因子IX(FIX)凝结功能的缺失或降低引起。C型血友病(C型血友病(hemophilia C))为因子XI(FXI)凝结活性的缺失或降低之后果。A型和B型血友病为X连锁疾病,而C型血友病为常染色体的。针对血友病的常规治疗包括预防性和按需求施用凝结因子,诸如FVIII、FIX(包括-VH)和FXI,以及FEIBA-VH、去氨加压素和血浆输注。

如本文所用,术语“FVIII基因疗法”包括向患者提供编码因子VIII的核酸以缓解、减弱或预防与血友病相关的一种或多种症状(例如临床因素)的复发的任何治疗方法。所述术语涵盖施用包含编码因子VIII分子(包括因子VIII的任何经修饰形式(例如因子VIII变体))的核酸的任何化合物、药物、程序或方案,以维持或改善患有血友病的个体的健康状态。本领域技术人员应了解可例如基于根据本公开获得的结果来改变FVIII疗法的过程或FVIII治疗剂的剂量。

如本文所用,术语“旁路疗法”包括向患者提供非因子VIII止血剂、化合物或凝血因子以缓解、减轻或预防与血友病相关的一种或多种症状(例如临床因素)的复发的任何治疗方法。非因子VIII化合物和凝血因子包括但不限于因子VIII抑制子旁路活性(FEIBA)、重组活化的因子VII(FVIIa)、凝血酶原复合浓缩物和活化凝血酶原复合浓缩物。这些非因子VIII化合物和凝血因子可为重组或血浆源性。本领域技术人员应了解可例如基于根据本发明获得的结果改变旁路疗法的过程或旁路疗法的剂量。

如本文所用,包括施用编码因子VIII分子的核酸和常规A型血友病治疗剂的“组合疗法”包括向患者提供编码因子VIII分子的核酸与因子VIII分子和/或非因子VIII止血剂(例如旁路治疗剂)以缓解、减轻或预防与血友病相关的一种或多种症状(例如临床因素)的复发的任何治疗方法。所述术语涵盖施用包括编码因子VIII分子(包括因子VIII的任何经修饰形式)的核酸的任何化合物、药物、程序或方案,其适用于维持或改善患有血友病的受试者的健康状态且包括本文所描述的任一治疗剂。

术语“治疗有效量或剂量”或“治疗足够量或剂量”或“有效或足够量或剂量”是指产生施用其所欲产生的治疗效果的剂量。举例而言,适用于治疗血友病的药物的治疗有效量可为能够预防或缓解与血友病相关的一种或多种症状的量。精确剂量将取决于治疗的目的,并且将可由本领域技术人员使用已知技术来确定(参见例如Lieberman,Pharmaceutical Dosage Forms(第1卷至第3卷,1992);Lloyd,The Art,Science andTechnology of Pharmaceutical Compounding(1999);Pickar,Dosage Calculations(1999);和Remington:The Science and Practice of Pharmacy,第20版,2003,Gennaro编,Lippincott,Williams&Wilkins)。

如本文所用,术语“基因”是指编码多肽链的DNA分子的区段(例如编码区)。在一些实施方案中,基因通过紧接在编码区之前、在编码区之后和/或插入编码区的区域定位,所述区域涉及产生多肽链(例如调控元件,诸如启动子、增强子、聚腺苷酸化序列、5'非翻译区、3'非翻译区或内含子)。

如本文所用,术语“调控元件”是指提供细胞中编码序列的表达的核苷酸序列,诸如启动子、增强子、终止子、聚腺苷酸化序列、内含子等。

如本文所用,术语“启动子元件”是指帮助控制编码序列的表达的核苷酸序列。一般而言,启动子元件位于基因的翻译起始位点的5'。然而,在某些实施方案中,启动子元件可位于内含子序列内或编码序列的3'。在一些实施方案中,适用于基因疗法载体的启动子来源于目标蛋白的内源基因(例如因子VIII启动子)。在一些实施方案中,适用于基因疗法载体的启动子对目标生物体的特定细胞或组织中的表达具有特异性(例如肝脏特异性启动子)。在其他实施方案中,多个充分表征的启动子元件中的一者用于本文所描述的基因疗法载体。充分表征的启动子元件的非限制性实例包括CMV早期启动子、β-肌动蛋白启动子和甲基CpG结合蛋白2(MeCP2)启动子。在一些实施方案中,启动子为组成型启动子,其实质上驱动目标蛋白的恒定表达。在其他实施方案中,启动子为诱导型启动子,其驱动响应于特定刺激(例如暴露于特定治疗或剂)的目标蛋白的表达。对于针对AAV介导的基因疗法设计启动子的综述,参见Gray等人(Human Gene Therapy 22:1143-53(2011)),其内容出于所有目的明确地以引用的方式整体并入。

如本文所用,术语“载体”是指用以将核酸(例如编码因子VIII基因疗法构建体)转移至宿主细胞中的任何媒介物。在一些实施方案中,载体包括复制子,其用于连同目标核酸一起复制媒介物。适用于基因疗法的载体的非限制性实例包括质粒、噬菌体、粘粒、人工染色体和病毒,其在体内用作复制的自主单元。在一些实施方案中,载体为用于引入目标核酸(例如编码因子VIII变体的密码子改变的多核苷酸)的病毒媒介物。许多适用于基因疗法的经修饰的真核病毒为本领域中已知的。举例而言,腺相关病毒(AAV)尤其较适用于人基因疗法,因为人为所述病毒的天然宿主,尚不知所述天然病毒促成任何疾病,并且所述病毒引起轻度免疫应答。

如本文所用,术语“CpG岛”是指具有统计学上较高密度的CpG二核苷酸的多核苷酸内的区域。如本文所用,如果在200个碱基对窗内:(i)区域具有大于50%的GC含量,和(ii)如通过以下关系所定义,所观察的CpG二核苷酸/预期CpG二核苷酸的比率为至少0.6,则多核苷酸(例如编码密码子改变的因子VIII蛋白的多核苷酸)的区域为CpG岛:

对于用于鉴定CpG岛的方法的额外信息,参见Gardiner-Garden M.等人,J MolBiol.,196(2):261-82(1987),其内容出于所有目的明确地以引用的方式整体并入本文中。

如本文所用,术语“核酸”是指呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物以及其互补序列。术语涵盖含有合成的、天然存在的和非天然存在的已知核苷酸类似物或经修饰主链残基或键的核酸,其具有与参考核酸相似的结合特性,并且其以与参考核苷酸相似的方式代谢。此类类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、膦酸甲酯、手性膦酸甲酯、2-O-甲基核糖核苷酸和肽核酸(PNA)。

术语“氨基酸”是指天然存在的和非天然的氨基酸,包括以与天然存在的氨基酸相似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸包括由遗传密码编码的那些氨基酸,以及稍后经修饰的那些氨基酸,例如羟基脯氨酸、y-羧基谷氨酸和O-磷酸丝氨酸。天然存在的氨基酸可包括例如D-氨基酸和L-氨基酸。本文所用的氨基酸还可包括非天然氨基酸。氨基酸类似物是指具有与天然存在的氨基酸相同的基本化学结构(即与氢、羧基、氨基和R基团结合的任何碳)的化合物,例如高丝氨酸、正亮氨酸、甲硫氨酸亚砜或甲硫氨酸甲基锍。此类类似物具有经修饰的R基团(例如正亮氨酸)或经修饰的肽主链,但保留与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指具有不同于氨基酸的一般化学结构的结构但以与天然存在的氨基酸相似的方式起作用的化学化合物。氨基酸在本文中可由其通常已知的三字母符号或由IUPAC-IUB生物化学命名法委员会(BiochemicalNomenclature Commission)所推荐的单字母符号来指称。同样,核苷酸可由其通常可接受的单字母代码提及。

关于氨基酸序列,本领域普通技术人员应认知到改变、添加或缺失所编码序列中的单个氨基酸或较小百分比的氨基酸的核酸或肽序列的个别取代、缺失或添加为“经保守修饰的变体”,其中所述改变使得氨基酸经化学上相似的氨基酸取代。提供功能上相似的氨基酸的保守取代表为本领域中所熟知。此类经保守修饰的变体另外为且不排除本发明的多形性变体、种间同源物和等位基因。

提供功能上相似的氨基酸的保守氨基酸取代为本领域中所熟知。取决于特定氨基酸(例如催化、结构或空间重要氨基酸)的功能性,氨基酸的不同分组可视为彼此保守取代的。表1基于氨基酸的电荷和极性、氨基酸的疏水性、氨基酸的表面暴露/结构性质和氨基酸的二级结构倾向提供视为保守取代的氨基酸的分组。

表1.基于蛋白质中的残基的功能性的保守氨基酸取代的分组。

在两个或更多个核酸或肽序列的情形下,术语“相同”或“同一性”百分比是指如使用例如具有下文所描述的默认参数的BLAST或BLAST 2.0序列比较算法或通过人工比对和目视检查所测量为相同或具有指定百分比的相同氨基酸残基或核苷酸(即当比较和比对比较窗或指定区内的最大对应性时,指定区内约60%同一性,优选地65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性)的两个或更多个序列或子序列。

如本领域中已知,多种不同程序可用以鉴定蛋白质(或如下文所论述的核酸)与已知序列是否具有序列同一性或相似性。使用本领域中已知的标准技术、优选使用默认设定或通过检查来确定序列同一性和/或相似性,所述标准技术包括但不限于Smith和Waterman,Adv.Appl.Math.,2:482(1981)的局部序列同一性算法;Needleman和Wunsch,J.Mol.Biol.,48:443(1970)的序列同一性比对算法;Pearson和Lipman,Proc.Natl.Acad.Sci.U.S.A.,85:2444(1988)的相似性方法的检索;这些算法的计算机化实现方式(Wisconsin Genetics软件包中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputer Group,575Science Drive,Madison,WI);由Devereux等人,Nucl.Acid Res.,12:387-395(1984)所描述的Best Fit序列程序。优选地,同一性百分比是通过FastDB基于以下参数计算:错配罚分1;空位罚分1;空位大小罚分0.33;和连接罚分30,“Current Methodsin Sequence Comparison and Analysis”,Macromolecule Sequencing and Synthesis,Selected Methods and Applications,第127-149页(1988),Alan R.Liss,公司,以上全部以引用的方式并入。

适用算法的一哥实例为PILEUP。PILEUP使用渐进式逐个成对比对从一组相关序列产生多序列比对。其还可绘制示出用以产生比对的丛集关系的树形图。PILEEIP使用Feng和Doolittle,J.Mol.Evol.35:351-360(1987)的渐进式比对方法的简化;所述方法与由Higgins和Sharp CABIOS 5:151-153(1989)所描述的方法相似,两者均以引用的方式并入。适用PILEEIP参数包括默认空位权重3.00、默认空位长度权重0.10和加权末端空位。

适用算法的另一实例为BLAST算法,其描述于以下中:Altschul等人,J.Mol.Biol.215,403-410,(1990);Altschul等人,Nucleic Acids Res.25:3389-3402(1997);和Karlin等人,Proc.Natl.Acad.Sci.U.S.A.90:5873-5787(1993),两者均以引用的方式并入。尤其适用的BLAST程序为WU-BLAST-2程序,其获自Altschul等人,Methods inEnzymology,266:460-480(1996);http://blast.wustl/edu/blast/README.html。WU-BLAST-2使用若干检索参数,其中大部分设定成默认值。使用以下值设定可调节参数:重叠间隔=1、重叠分数=0.125、词阈值(T)=11。HSP S和HSP S2参数为动态值且通过程序本身根据特定序列的组成和检索相关序列所对照的特定数据库的组成而确立;然而可调节所述值以提高灵敏度。

如由以引用的方式并入的Altschul等人,Nucl.Acids Res.,25:3389-3402所报告,其他适用算法为空位BLAST。空位BLAST使用BLOSUM-62取代得分;阈值T参数设定为9;二击法用于触发无空位延伸部分,加入空位长度k,代价为1O+k;Xu设定为16,并且Xg对于数据库检索阶段设定为40且对于算法的输出阶段设定为67。空位比对通过对应于约22位(bit)的得分触发。

通过匹配相同残基的数量除以比对区域中“更长”序列的残基的总数量来确定氨基酸序列同一性%值。“更长”序列为比对区域中具有大多数实际残基的一者(忽略通过WU-Blast-2引入以最大化比对得分的空位)。以相似方式,关于所鉴定的多肽的编码序列,“核酸序列同一性百分比(%)”定义为与细胞循环蛋白的编码序列中的核苷酸残基相同的候选序列中的核苷酸残基的百分比。优选方法利用设定为默认参数的WU-BLAST-2的BLASTN模块,其中重叠间隔和重叠分数分别设定为1和0.125。

比对可包括将空位引入待比对的序列中。此外,对于含有比由图2的序列(SEQ IDNO:1)编码的蛋白更多或更少氨基酸的序列,应理解在一个实施方案中,序列同一性百分比将基于相同氨基酸或核苷酸的数量相对于氨基酸或核苷酸的总数量而确定。因此,举例而言,在一个实施方案中,如下文所论述比图2中所示出的序列(SEQ ID NO:1)更短的序列的序列同一性将使用更短序列中的核苷酸的数量确定。在同一性百分比计算中,未将相对权重赋予序列变型的各种表达,诸如插入、缺失、取代等。

在一个实施方案中,仅同一性得正分(+1)且包括空位的序列变型的所有形式赋值为“0”,其避免对用于序列相似性计算的如下文所描述的加权评分或参数的需要。可例如通过匹配的相同残基的数量除以比对区域中“更短”序列的残基的总数量且乘以100来计算序列同一性百分比。“更长”序列为比对区域中具有大多数实际残基的一者。

术语“等位基因变体”是指特定基因座处的基因的多形性形式以及来源于基因的mRNA转录物的cDNA和由其编码的多肽。术语“优选哺乳动物密码子”是指编码最常用于哺乳动物细胞中所表达的蛋白质的氨基酸的密码子集合当中的密码子子集,如选自以下清单:Gly(GGC,GGG);Glu(GAG);Asp(GAC);Val(GTG,GTC);Ala(GCC,GCT);Ser(AGC,TCC);Lys(AAG);Asn(AAC);Met(ATG);Ile(ATC);Thr(ACC);Tip(TGG);Cys(TGC);Tyr(TAT,TAC);Leu(CTG);Phe(TTC);Arg(CGC,AGG,AGA);Gln(CAG);His(CAC);和Pro(CCC)。

如本文所用,术语密码子改变是指编码多肽(例如因子VIII变体蛋白)的多核苷酸序列,其中编码多肽的天然多核苷酸的至少一个密码子已经改变以改善多核苷酸序列的性质。在一些实施方案中,经改善性质促进编码多肽的mRNA的转录增加,mRNA的稳定性增加(例如mRNA半衰期增加)、多肽的翻译增加和/或载体内的多核苷酸封装增加。可用于实现改善的性质的改变的非限制性实例包括改变用于特定氨基酸的密码子的使用和/或分布、调整整体和/或局部GC含量、移除富AT序列、移除重复序列元件、调整整体和/或局部CpG二核苷酸含量、移除隐性调控元件(例如TATA框和CCAAT框元件)、移除内含子/外显子剪接位点、提高调控序列(例如引入Kozak共有序列)和移除能够在经转录mRNA中形成二级结构(例如茎-环)的序列元件。

如本文所论述,本文存在各种命名法来指代本发明的组分。“CS-编号”(例如“CS04”)是指编码FVIII多肽的密码子改变的多核苷酸和/或经编码多肽,包括变体。举例而言,CS04-FL是指由CS04多核苷酸序列编码的全长密码子改变的CS04多核苷酸序列或氨基酸序列(有时在本文中对于氨基酸序列而言称为“CS04-FL-AA”而对于核酸序列而言称为“CS04-FL-NA”)。相似地,“CS04-LC”是指编码FVIII多肽的轻链的密码子改变的核酸序列(“CS04-LC-NA”)或由CS04多核苷酸序列编码的FVIII轻链的氨基酸序列(在本文中有时还称为“CS04-LC-AA”)。同样,对于FVIII重链而言CS04-HC、CS04-HC-AA和CS04-HC-NA为相同的。如将由本领域技术人员所了解,对于仅密码子改变的构建体,诸如CS04(例如其相较于Refacto不含有其他氨基酸取代),氨基酸序列将相同,因为氨基酸序列不因密码子优化而改变。因此,本公开的序列构建体包括但不限于CS04-FL-NA、CS04-FL-AA、CS04-LC-NA、CS04-LC-AA、CS04-HC-AA和CS04-HC-NA。

III.密码子改变的因子VIII变体

在一些实施方案中,本公开提供编码因子VIII变体的密码子改变的多核苷酸。当在基于AAV的基因疗法构建体中施用时,这些密码子改变的多核苷酸提供明显改善的因子VIII表达。相较于常规密码子优化构建体,密码子改变的多核苷酸还展现改善的AAV病毒粒子封装。如实施例2和表4中所展现,申请人已经由编码因子VIII多肽的密码子改变的多核苷酸(CS04-FL-NA)的发现实现这些优点,所述因子VIII多肽具有人野生型因子VIII重链和轻链以及含有弗林蛋白酶裂解位点以促进活性FVIIIa蛋白体内成熟的短的、14个氨基酸、B结构域经取代接头(“SQ”接头)。

在一个实施方案中,本文所提供的密码子改变的多核苷酸具有与至少编码因子VIII重链和因子VIII轻链的CS04(SEQ ID NO:1)内的序列具有高序列同一性的核苷酸序列。如本领域中已知,因子VIII的B结构域对于体内活性非必需。因此,在一些实施方案中,本文中所提供的密码子改变的多核苷酸完全缺少因子VIII B结构域。在一些实施方案中,天然因子VIII B结构域经含有弗林蛋白酶裂解位点的短氨基酸接头代替,所述短氨基酸接头例如由CS04(SEQ ID NO 2)构建体的氨基酸760-773组成的“SQ”接头。“SQ”接头还称为BDLO04(对于氨基酸序列而言为BDLO04-AA,而对于核苷酸序列而言为BDLO04-NA)。

在一个实施方案中,由密码子改变的多核苷酸编码的因子VIII重链和轻链分别为人因子VIII重链和轻链。在其他实施方案中,密码子改变的多核苷酸编码的因子VIII重链和轻链为来自另一哺乳动物的重链和轻链序列(例如猪因子VIII)。在其他实施方案中,因子VIII重链和轻链为嵌合重链和轻链(例如人和第二哺乳动物序列的组合)。在其他实施方案中,因子VIII重链和轻链为来自另一哺乳动物的重链和轻链的人源化型式,例如来自其中人残基在选择位置处经取代以在向人施用时减少所得肽的免疫原性的另一哺乳动物的重链和轻链序列。

人基因的GC含量从低于25%至高于90%广泛变化。然而,一般而言,具有更高GC含量的人基因以更高水平表达。举例而言,Kudla等人(PLoS Biol.,4(6):80(2006))证实增加基因的GC含量主要通过增加转录且实现更高稳态水平的mRNA转录而增加所编码多肽的表达。一般而言,密码子优化的基因构建体的所需GC含量为等于或高于60%。然而,天然AAV基因组的GC含量为大约56%。

因此,在一些实施方案中,本文中所提供的密码子改变的多核苷酸的CG含量更接近地匹配天然AAV病毒粒子的GC含量(例如,大约56%GC),其低于常规经密码子优化以用于哺乳动物细胞中表达的多核苷酸的优选CG含量(例如处于或高于60%GC)。如实施例1中所概述,相较于具有更高GC含量的相似密码子改变的编码序列,GC含量为约56%的CS04-FL-NA(SEQ ID NO:1)具有改善的病毒粒子封装。

因此,在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量低于60%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量低于59%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量低于58%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量低于57%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量不超过56%。

在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为54%至59%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为55%至59%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56%至59%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为54%至58%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为55%至58%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56%至58%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为54%至57%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为55%至57%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56%至57%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为54%至56%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为55%至56%。

在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56±0.5%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56±0.4%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56±0.3%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56±0.2%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56±0.1%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总体GC含量为56%。

A.因子VIII B结构域经取代接头

在一些实施方案中,进一步改变FVIII重链与轻链之间的连接(例如野生型因子VIII中的B结构域)。由于AAV封装能力的大小限制,B结构域缺失、截短和或接头经取代的变体应提高FVIII基因疗法构建体的功效。最常规使用的B结构域经取代接头为SQ FVIII的接头,其仅保留B结构域的14个氨基酸作为接头序列。猪VIII的另一变体(描述于美国专利号6,458,563中的“OBI-1”)在CHO细胞中良好表达,并且具有24个氨基酸的稍微更长的接头。在一些实施方案中,由本文所描述的密码子改变的多核苷酸编码的因子VIII构建体包括SQ型B结构域接头序列。在其他实施方案中,由本文所描述的密码子改变的多核苷酸编码的因子VIII构建体包括OBI-1型B结构域接头序列。

在一些实施方案中,本文所描述的经编码因子VIII多肽包括SQ型B结构域接头(SFSQNPPVLKRHQR;BDL-SQ-AA;SEQ ID NO:13),所述SQ型B结构域接头包括野生型人因子VIII B结构域的氨基酸760-762/1657-1667(FVIII-FL-AA;SEQ ID NO:12)(Sandberg等人Thromb.Haemost.85:93(2001))。在一些实施方案中,相对于对应野生型序列,SQ型B结构域接头具有一个氨基酸取代。在一些实施方案中,相对于对应野生型序列,SQ型B结构域接头具有两个氨基酸取代。

在一些实施方案中,本文所描述的经编码因子VIII多肽包括Greengene型B结构域接头,所述Greengene型B结构域接头包括野生型人因子VIII B结构域的氨基酸760/1582-1667(FVIII-FL-AA;SEQ ID NO:12)(Oh等人,Biotechnol.Prog.,17:1999(2001))。在一些实施方案中,相对于对应野生型序列,Greengene型B结构域接头具有一个氨基酸取代。在一些实施方案中,相对于对应野生型序列,Greengene型B结构域接头具有两个氨基酸取代。

在一些实施方案中,本文所描述的经编码因子VIII多肽包括延长的SQ型B结构域接头,所述延长的SQ型B结构域接头包括野生型人因子VIII B结构域的氨基酸760-769/1657-1667(FVIII-FL-AA;SEQ ID NO:12)(Thim等人,Haemophilia,16:349(2010))。在一些实施方案中,相对于对应野生型序列,延长的SQ型B结构域接头具有一个氨基酸取代。在一些实施方案中,相对于对应野生型序列,延长的SQ型B结构域接头具有两个氨基酸取代。

在一些实施方案中,本文所描述的经编码因子VIII多肽包括猪OBI-1型B结构域接头,所述OBI-1型B结构域接头包括来自野生型猪因子VIII B结构域的氨基酸SFAQNSRPPSASAPKPPVLRRHQR(SEQ ID NO:14)(Toschi等人,Curr.Opin.Mol.Ther.12:517(2010))。在一些实施方案中,相对于对应野生型序列,猪OBI-1型B结构域接头具有一个氨基酸取代。在一些实施方案中,相对于对应野生型序列,猪OBI-1型B结构域接头具有两个氨基酸取代。

在一些实施方案中,本文所描述的经编码因子VIII多肽包括人OBI-1型B结构域接头,所述人OBI-1型B结构域接头包括野生型人因子VIII B结构域的氨基酸760-772/1655-1667(FVIII-FL-AA;SEQ ID NO:12)。在一些实施方案中,相对于对应野生型序列,人OBI-1型B结构域接头具有一个氨基酸取代。在一些实施方案中,相对于对应野生型序列,人OBI-1型B结构域接头具有两个氨基酸取代。

在一些实施方案中,本文所描述的经编码因子VIII多肽包括08型B结构域接头,所述08型B结构域接头包括来自野生型猪因子VIII B结构域的氨基酸SFSQNSRHQAYRYRRG(SEQID NO:15)(Toschi等人,Curr.Opin.Mol.Ther.12:517(2010))。在一些实施方案中,相对于对应野生型序列,猪OBI-1型B结构域接头具有一个氨基酸取代。在一些实施方案中,相对于对应野生型序列,猪OBI-1型B结构域接头具有两个氨基酸取代。

B.编码具有可裂解接头的因子VIII变体的密码子改变的多核苷酸

CS04密码子改变的多核苷酸

在一个实施方案中,本文中所提供的密码子改变的多核苷酸包括编码具有体内可裂解的接头的因子VIII变体多肽的核苷酸序列。因子VIII多肽包括因子VIII轻链、因子VIII重链和连接重链的C末端与轻链的N末端的多肽接头。因子VIII多肽的重链由与CS04-HC-NA(SEQ ID NO:3)具有高序列同一性的第一核苷酸序列编码,所述CS04-HC-NA(SEQ IDNO:3)为编码因子VIII重链的CS04-FL-NA(SEQ ID NO:1)的部分。因子VIII多肽的轻链由与CS04-LC-NA(SEQ ID NO:4)具有高序列同一性的第二核苷酸序列编码,所述CS04-LC-NA(SEQ ID NO:4)为编码因子VIII轻链的CS04-FL-NA(SEQ ID NO:1)的部分。多肽接头包括弗林蛋白酶裂解位点,其引起体内成熟(例如在体内表达或施用前体多肽之后)。

在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQID NO 3和4)具有至少95%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少96%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少97%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少98%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99.5%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99.9%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)相同。

在一些实施方案中,因子VIII构建体的多肽接头由与BDLO04(SEQ ID NO:5)具有高序列同一性的第三核苷酸序列编码,所述BDLO04(SEQ ID NO:5)编码对应于CS04-FL-AA(SEQ ID NO:2)的氨基酸760-773的14氨基酸接头。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少95%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少96%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQID NO:5)具有至少97%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少98%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)相同。

在一些实施方案中,密码子改变的多核苷酸具有与CS04-FL-NA(SEQ ID NO:1)具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少95%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少96%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少97%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少98%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99.5%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99.9%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)相同。

在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与CS04-FL-AA(SEQ ID NO:2)具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少97%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少98%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少99%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQID NO:2)具有至少99.5%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ IDNO:2)具有至少99.9%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)相同。

C.因子VIII表达载体

在一些实施方案中,本文所描述的密码子改变的多核苷酸整合于表达载体中。表达载体的非限制性实例包括病毒载体(例如适用于基因疗法的载体)、质粒载体、噬菌体载体、粘粒、噬菌粒、人工染色体及其类似物。

病毒载体的非限制性实例包括:逆转录病毒,例如莫罗尼(Moloney)鼠类白血病病毒(MMLV)、哈维(Harvey)鼠类肉瘤病毒、鼠类乳腺肿瘤病毒和劳斯(Rous)肉瘤病毒;腺病毒、腺相关病毒;SV40型病毒;多瘤病毒;爱泼斯坦-巴尔(Epstein-Barr)病毒;乳头状瘤病毒;疱疹病毒;牛痘病毒和脊髓灰质炎病毒。

在一些实施方案中,本文所描述的密码子改变的多核苷酸整合于基因疗法载体中。在一些实施方案中,基因疗法载体为逆转录病毒,并且尤其为复制缺陷型逆转录病毒。用于产生复制缺陷型逆转录病毒的方案为本领域中已知。关于综述,参见Kriegler,M.,Gene Transfer and Expression,A Laboratory Manual,W.H.Freeman Co.,New York(1990)和Murry,E.J.,Methods in Molecular Biology,第7卷,Humana Press,Inc.,Cliffton,N.J.(1991)。

在一个实施方案中,基因疗法载体为基于腺相关病毒(AAV)的基因疗法载体。AAV系统先前已描述且一般为本领域所熟知(Kelleher和Vos,Biotechniques,17(6):1110-17(1994);Cotten等人,Proc Natl Acad Sci USA,89(13):6094-98(1992);Curiel,NatImmun,13(2-3):141-64(1994);Muzyczka,Curr Top Microbiol Immunol,158:97-129(1992);和Asokan A等人,Mol.Ther.,20(4):699-708(2012),各自出于所有目的以引用的方式整体并入本文中)。关于rAAV载体的产生和使用的细节描述于例如美国专利号5,139,941和4,797,368中,各自出于所有目的以引用的方式并入本文中。在特定实施方案中,AAV载体为AAV-8载体。

在一些实施方案中,本文所描述的密码子改变的多核苷酸整合于逆转录病毒表达载体中。这些系统先前已描述且一般为本领域中所熟知(Mann等人,Cell,33:153-159,1983;Nicolas和Rubinstein,于:Vectors:A survey of molecular cloning vectors andtheir uses中,Rodriguez和Denhardt编,Stoneham:Butterworth,第494-513页,1988;Temin,于:Gene Transfer中,Kucherlapati(编),New York:Plenum Press,第149-188页,1986)。在特定实施方案中,逆转录病毒载体为慢病毒载体(参见例如Naldini等人,Science,272(5259):263-267,1996;Zufferey等人,Nat Biotechnol,15(9):871-875,1997;Blomer等人,J Virol,71(9):6641-6649,1997;美国专利号6,013,516和5,994,136)。

广泛多种载体可用于在细胞培养物中从密码子改变的多肽表达因子VIII多肽,包括真核和原核表达载体。在某些实施方案中,涵盖质粒载体以用于在细胞培养物中表达因子VIII多肽。一般而言,将含有来源于与宿主细胞相容的物种的复制子和控制序列的质粒载体与这些宿主结合使用。载体可携带复制位点以及能够在转化细胞中提供表型选择的标记序列。质粒将包括可操作地连接至一个或多个控制序列(例如启动子)的编码因子VIII多肽的密码子改变的多核苷酸。

用于原核表达的载体的非限制性实例包括质粒,诸如pRSET、pET、pBAD等,其中用于原核表达载体的启动子包括lac、trc、trp、recA、araBAD等。用于真核表达的载体的实例包括:(i)用于在酵母中表达,使用诸如AOX1、GAP、GAL1、AETG1等的启动子的载体,诸如pAO、pPIC、pYES、pMET;(ii)用于在昆虫细胞中表达,使用诸如PH、p1O、MT、Ac5、OpIE2、gp64、polh等的启动子的载体,诸如pMT、pAc5、pIB、pMIB、pBAC等;和(iii)用于在哺乳动物细胞中表达,使用诸如CMV、SV40、EF-1、UbC、RSV、ADV、BPV和β-肌动蛋白的启动子的诸如pSVL、pCMV、pRc/RSV、pcDNA3、pBPV等的载体和来源于病毒系统的载体,病毒系统为诸如牛痘病毒、腺相关病毒、疱疹病毒、逆转录病毒等。

D.给药

本发明提供向已诊断患有A型血友病的人患者(“A型血友病患者”或“患者”)施用本发明的密码子优化的构建体。一般而言,如本文所概述,施用是使用含有本发明的密码子优化的构建体的AAV颗粒进行。此外,如下文所更全面描述,施用本发明的构建体可通过也施用泼尼松龙或泼尼松扩充。

2×1012个腺相关病毒(AAV)颗粒/千克体重

在一个方面中,本发明提供一种用于治疗A型血友病的方法,所述方法包括向A型血友病患者静脉内输注(例如通过周边静脉内输注)2×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量,其中AAV颗粒包括编码因子VIII多肽且与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性的密码子改变的多核苷酸。

在一个实施方案中,以2×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量向人患者施用的与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性的密码子改变的多核苷酸编码因子VIII变体多肽,所述因子VIII变体多肽具有体内可裂解的接头。因子VIII多肽包括因子VIII轻链、因子VIII重链和连接重链的C末端与轻链的N末端的多肽接头。因子VIII多肽的重链由与CS04-HC-NA(SEQ ID NO:3)具有高序列同一性的第一核苷酸序列编码,所述CS04-HC-NA(SEQ ID NO:3)为编码因子VIII重链的CS04-FL-NA(SEQ ID NO:1)的部分。因子VIII多肽的轻链由与CS04-LC-NA(SEQ ID NO:4)具有高序列同一性的第二核苷酸序列编码,所述CS04-LC-NA(SEQ ID NO:4)为编码因子VIII轻链的CS04-FL-NA(SEQ ID NO:1)的部分。多肽接头包括弗林蛋白酶裂解位点,其引起体内成熟(例如在体内表达或施用前体多肽之后)。

在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQID NO 3和4)具有至少95%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少96%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少97%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少98%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99.5%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99.9%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)相同。在这些实施方案中,由这些核苷酸序列编码的氨基酸序列与CS04-HC-AA和CS04-LC-AA相同。

在一些实施方案中,因子VIII构建体的多肽接头由与BDLO04(SEQ ID NO:5)具有高序列同一性的第三核苷酸序列编码,所述BDLO04(SEQ ID NO:5)编码对应于CS04-FL-AA(SEQ ID NO:2)的氨基酸760-773的14氨基酸接头。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少95%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少96%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQID NO:5)具有至少97%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少98%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)相同。在这些实施方案中,由这些核苷酸序列编码的氨基酸序列与CS04-FL-AA(SEQ ID NO:2)的氨基酸760-773相同。在一些实施方案中,以2×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量向人患者施用的密码子改变的多核苷酸具有与CS04-FL-NA(SEQ ID NO:1)具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少95%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少96%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少97%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少98%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99.5%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99.9%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)相同。在这些实施方案中,由这些核苷酸序列编码的氨基酸序列与CS04-FL-AA相同。

在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与CS04-FL-AA(SEQ ID NO:2)具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少97%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少98%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少99%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQID NO:2)具有至少99.5%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ IDNO:2)具有至少99.9%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)相同。

因此,在一个实施方案中,本发明提供一种用于治疗A型血友病的方法,所述方法包括向A型血友病患者静脉内输注2×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量,其中AAV颗粒包括具有SEQ ID NO:1(CS04-FL-NA)的核酸序列的多核苷酸。

在一些实施方案中,通过静脉内输注(例如至患者的手臂中的静脉中)以单次剂量施用AAV颗粒。在一些实施方案中,施用单次剂量的部分,监测患者对施用的不良反应体征短暂时间段(例如30分钟),并且随后(例如如果未出现不良反应体征)向患者施用单次剂量的剩余部分。

在一些实施方案中,施用AAV颗粒的人患者患有严重A型血友病。举例而言,在一些实施方案中,当未接受因子VIII替代疗法时,患者在其血流中具有低于参考血液样品中所存在的因子VIII活性量的2%或多个确定未患有A型血友病的受试者的血液样品中所存在的平均因子VIII活性的因子VIII活性水平,所述参考血液样品为例如具有正常因子VIII活性的血液样品(例如来自确定未患有A型血友病的受试者的血液样品)。在一些实施方案中,当未接受因子VIII替代疗法时,受试者在其血流中具有低于参考血液样品中所存在的因子VIII活性量的2%的因子VIII活性水平。

在一些实施方案中,施用AAV颗粒的人患者不具有FVIII抑制子(例如因子VIII抑制子抗体)、不具有除严重A型血友病以外的止血缺陷、不具有慢性肝功能障碍和/或不具有严重肾损伤。

因此,在一些实施方案中,本文所描述的方法包括鉴定患者以便施用2×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量的步骤,其中AAV颗粒包括编码因子VIII多肽且与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性的密码子改变的多核苷酸。所述方法包括在患者未接受因子VIII替代疗法时测定的血流中因子VIII活性水平,和鉴定患者以便在患者的血流中因子VIII活性水平低于参考样品中因子VIII水平的约2%或低于参考样品中因子VIII水平的约1%时施用AAV颗粒。在一些实施方案中,所述方法包括确定患者是否具有一种或多种FVIII抑制子(例如因子VIII抑制子抗体)、除严重A型血友病以外的止血缺陷、慢性肝功能障碍和严重肾损伤,和如果患者具有所列举疾患中的任一者则淘汰所述患者。

6×1012个腺相关病毒(AAV)颗粒/千克体重

在一个方面中,本发明提供一种用于治疗A型血友病的方法,所述方法包括向A型血友病患者静脉内输注(例如通过周边静脉内输注)6×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量,其中AAV颗粒包括编码因子VIII多肽且与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性的密码子改变的多核苷酸。

在一个实施方案中,以6×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量向人患者施用的与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性的密码子改变的多核苷酸编码因子VIII变体多肽,所述因子VIII变体多肽具有体内可裂解的接头。因子VIII多肽包括因子VIII轻链、因子VIII重链和连接重链的C末端与轻链的N末端的多肽接头。因子VIII多肽的重链由与CS04-HC-NA(SEQ ID NO:3)具有高序列同一性的第一核苷酸序列编码,所述CS04-HC-NA(SEQ ID NO:3)为编码因子VIII重链的CS04-FL-NA(SEQ ID NO:1)的部分。因子VIII多肽的轻链由与CS04-LC-NA(SEQ ID NO:4)具有高序列同一性的第二核苷酸序列编码,所述CS04-LC-NA(SEQ ID NO:4)为编码因子VIII轻链的CS04-FL-NA(SEQ ID NO:1)的部分。多肽接头包括弗林蛋白酶裂解位点,其引起体内成熟(例如在体内表达或施用前体多肽之后)。

在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQID NO 3和4)具有至少95%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少96%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少97%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少98%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99.5%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)具有至少99.9%序列同一性。在一些实施方案中,第一和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NA(SEQ ID NO 3和4)相同。在这些实施方案中,由这些核苷酸序列编码的氨基酸序列与CS04-HC-AA和CS04-LC-AA相同。

在一些实施方案中,因子VIII构建体的多肽接头由与BDLO04(SEQ ID NO:5)具有高序列同一性的第三核苷酸序列编码,所述BDLO04(SEQ ID NO:5)编码对应于CS04-FL-AA(SEQ ID NO:2)的氨基酸760-773的14氨基酸接头。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少95%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少96%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQID NO:5)具有至少97%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)具有至少98%同一性。在一些实施方案中,第三核苷酸序列与BDLO04(SEQ ID NO:5)相同。在这些实施方案中,由这些核苷酸序列编码的氨基酸序列与CS04-FL-AA(SEQ ID NO:2)的氨基酸760-773相同。

在一些实施方案中,以6×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量向人患者施用的密码子改变的多核苷酸具有与CS04-FL-NA(SEQ ID NO:1)具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少95%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少96%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少97%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少98%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99.5%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)具有至少99.9%同一性。在一些实施方案中,核苷酸序列与CS04-FL-NA(SEQ ID NO:1)相同。在这些实施方案中,由这些核苷酸序列编码的氨基酸序列与CS04-FL-AA相同。

在一些实施方案中,密码子改变的多核苷酸编码的因子VIII变体具有与CS04-FL-AA(SEQ ID NO:2)具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少97%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少98%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)具有至少99%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQID NO:2)具有至少99.5%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ IDNO:2)具有至少99.9%同一性。在一些实施方案中,氨基酸序列与CS04-FL-AA(SEQ ID NO:2)相同。

因此,在一个实施方案中,本发明提供一种用于治疗A型血友病的方法,所述方法包括向A型血友病患者静脉内输注6×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量,其中AAV颗粒包括具有SEQ ID NO:1(CS04-FL-NA)的核酸序列的多核苷酸。

在一些实施方案中,通过静脉内输注(例如至患者的手臂中的静脉中)以单次剂量施用AAV颗粒。在一些实施方案中,施用单次剂量的部分,监测患者对施用的不良反应体征短暂时间段(例如30分钟),并且随后(例如如果未出现不良反应体征)向患者施用单次剂量的剩余部分。

在一些实施方案中,施用AAV颗粒的人患者患有严重A型血友病。举例而言,在一些实施方案中,当未接受因子VIII替代疗法时,患者在其血流中具有低于参考血液样品中所存在的因子VIII活性量的2%或多个确定未患有A型血友病的受试者的血液样品中所存在的平均因子VIII活性的因子VIII活性水平,所述参考血液样品为例如具有正常因子VIII活性的血液样品(例如来自确定未患有A型血友病的受试者的血液样品)。在一些实施方案中,当未接受因子VIII替代疗法时,受试者在其血流中具有低于参考血液样品中所存在的因子VIII活性量的2%的因子VIII活性水平。

在一些实施方案中,施用AAV颗粒的人患者不具有FVIII抑制子(例如因子VIII抑制子抗体)、不具有除严重A型血友病以外的止血缺陷、不具有慢性肝功能障碍和/或不具有严重肾损伤。

因此,在一些实施方案中,本文所描述的方法包括鉴定患者以便施用6×1012个腺相关病毒(AAV)颗粒/千克人患者体重的剂量的步骤,其中AAV颗粒包括编码因子VIII多肽且与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性的密码子改变的多核苷酸。所述方法包括在患者未接受因子VIII替代疗法时测定的血流中因子VIII活性水平,和鉴定患者以便在患者的血流中因子VIII活性水平低于参考样品中因子VIII水平的约2%或低于参考样品中因子VIII水平的约1%时施用AAV颗粒。在一些实施方案中,所述方法包括确定患者是否具有一个或多个FVIII抑制子(例如因子VIII抑制子抗体)、除严重A型血友病以外的止血缺陷、慢性肝功能障碍和严重肾损伤,和如果患者具有所列举疾患中的任一者则淘汰所述患者。

与泼尼松龙或泼尼松共施用

在一些实施方案中,上文所描述的通过以任一剂量施用AAV颗粒治疗A型血友病的方法还包括向人患者施用泼尼松龙或泼尼松的疗程(例如)以例如通过降低受试者的细胞因子和/或趋化因子产生来降低炎症反应水平。与基因疗法共施用泼尼松龙或泼尼松的实例方法描述于例如国际专利申请公布号WO 2008/069942中,其内容出于所有目的以引用的方式整体并入本文中。

在一些实施方案中,在施用具有多核苷酸的腺相关病毒(AAV)颗粒之前向人患者施用泼尼松龙或泼尼松,所述多核苷酸与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性且编码因子VIII多肽。举例而言,在一些实施方案中,在向患者施用AAV颗粒之前约一周或约一或两天施用泼尼松龙或泼尼松。在一些实施方案中,在施用AAV颗粒之前约一周或约一或两天开始施用泼尼松龙或泼尼松的疗程,并且在施用AAV颗粒之后继续。

在一些实施方案中,当施用具有多核苷酸的腺相关病毒(AAV)颗粒时向人受试者共施用泼尼松龙或泼尼松,所述多核苷酸编码因子VIII多肽且与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性。举例而言,在一些实施方案中,在同一天(例如在施用AAV颗粒之前或之后立即)施用泼尼松龙或泼尼松。在一些实施方案中,在施用AAV颗粒的同一天施用泼尼松龙或泼尼松的疗程,并且在施用AAV颗粒之后继续。

在一些实施方案中,在施用具有多核苷酸的腺相关病毒(AAV)颗粒之后向患者施用泼尼松龙或泼尼松,所述多核苷酸编码因子VIII多肽且与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性。举例而言,在一些实施方案中,在向患者施用AAV颗粒之后约一或两天第一次施用泼尼松龙或泼尼松。

应注意泼尼松龙或泼尼松为经口施用(但其还可静脉内施用)的小分子药物,并且因此在此情形下“共施用”不需要含有两种药物的单一溶液。

在一些实施方案中,在至少两周的时间段内(例如)每天或每两天向患者施用泼尼松龙或泼尼松的疗程。在一些实施方案中,在至少三周的时间段内施用泼尼松龙或泼尼松的疗程。在一些实施方案中,在疗程期间泼尼松龙或泼尼松的剂量减少。举例而言,在一个实施方案中,疗程以施用约60mg泼尼松龙或泼尼松/天开始,并且随着疗程进行减少。

在一个实施方案中,疗程包括在疗程的第一周期间向人患者施用约60mg泼尼松龙或泼尼松/天,在疗程的第二周期间向患者施用约40mg泼尼松龙或泼尼松/天和在输注AAV颗粒后紧接着第三周期间向患者施用约30mg泼尼松龙或泼尼松/天。

在一些实施方案中,疗程包括在第三周之后进一步逐渐减少泼尼松龙或泼尼松的施用,例如施用逐渐减少剂量的泼尼松龙或泼尼松。在一个实施方案中,逐渐减少剂量的泼尼松龙或泼尼松包括依次施用约20mg泼尼松龙或泼尼松/天、约15mg泼尼松龙或泼尼松/天、约10mg泼尼松龙或泼尼松/天和约5mg泼尼松龙或泼尼松/天的剂量(例如一个或多个各浓度的剂量)。

在一个实施方案中,逐渐减少剂量的泼尼松龙或泼尼松包括在完成泼尼松龙或泼尼松的初始疗程后连续5天(例如紧接着)向患者施用约20mg泼尼松龙或泼尼松/天,向患者施用20mg泼尼松龙或泼尼松5天后连续3天(例如紧接着)向患者施用约15mg泼尼松龙或泼尼松/天,向患者施用15mg泼尼松龙或泼尼松3天后连续3天(例如紧接着)向患者施用约10mg泼尼松龙或泼尼松/天和向患者施用10mg泼尼松龙或泼尼松后3天连续3天(例如紧接着)连续3天向患者施用约5mg泼尼松龙或泼尼松/天。

在一个实施方案中,逐渐减少剂量的泼尼松龙或泼尼松包括在完成泼尼松龙或泼尼松的初始疗程后紧接着连续7天向患者施用约30mg泼尼松龙或泼尼松/天,向患者施用30mg泼尼松龙或泼尼松7天后紧接着连续7天向患者施用约20mg泼尼松龙或泼尼松/天,向人受试者施用20mg泼尼松龙或泼尼松后7天紧接着连续5天向患者施用约15mg泼尼松龙或泼尼松/天,向患者施用15mg泼尼松龙或泼尼松5天后紧接着连续5天向患者施用约10mg泼尼松龙或泼尼松/天和向患者施用10mg泼尼松龙或泼尼松5天后紧接着连续5天向患者施用约5mg泼尼松龙或泼尼松/天。

在一些实施方案中,向患者施用逐渐减少剂量的泼尼松龙或泼尼松的时长是基于,在泼尼松龙或泼尼松的初始疗程结束时,患者是否仍然显示肝炎体征(例如如由因子VIII水平(例如因子VIII效价或因子VIII活性)降低或肝酶增加所指示)而确定。

举例而言,在一个实施方案中,在向患者施用包括编码因子VIII蛋白的多核苷酸腺相关病毒(AAV)颗粒后,测定患者的血流中(例如从患者收集的血液样品中)的因子VIII第一水平(例如效价或活性)且同时患者接受糖皮质激素类固醇治疗的初始疗程。在完成糖皮质激素类固醇治疗的初始疗程之后,测定患者的血流中的因子VIII第二水平(例如效价或活性)。随后将因子VIII第二水平与因子VIII第一水平比较。当因子VIII第二水平未降低时(例如当因子VIII第二水平不低于因子VIII第一水平或不低于小于因子VIII第一水平的阈值量时),向患者施用第一逐渐减少剂量的糖皮质激素类固醇不超过三周的时间段。当因子VIII第二水平降低时(例如当因子VIII第二水平低于因子VIII第一水平或低于小于因子VIII第一水平的阈值量时),向患者施用第二逐渐减少剂量的糖皮质激素类固醇超过三周的时间段。

相似地,在一些实施方案中,在向患者施用包括编码因子VIII蛋白的多核苷酸的腺相关病毒(AAV)颗粒之前(例如或之后不久)测定患者的血流中的肝酶第一水平(例如肝酶效价或活性)。在完成糖皮质激素类固醇治疗的初始疗程之后,测定患者的血流中的肝酶水平的第二水平(例如肝酶效价或活性)。随后将肝酶第二水平与肝酶第一水平比较。当肝酶第二水平未增加时(例如当肝酶第二水平不超过肝酶第一水平或不超过大于肝酶第一水平的阈值量时),向患者施用第一逐渐减少剂量的糖皮质激素类固醇不超过三周的时间段。当肝酶第二水平增加时(例如当肝酶第二水平超过肝酶第一水平或超过大于肝酶第一水平的阈值量时),向患者施用第二逐渐减少剂量的糖皮质激素类固醇超过三周的时间段。

在一些实施方案中,第一逐渐减少剂量的泼尼松龙或泼尼松包括在完成泼尼松龙或泼尼松的初始疗程后连续5天(例如紧接着)向患者施用约20mg泼尼松龙或泼尼松/天,向患者施用20mg泼尼松龙或泼尼松5天后连续3天(例如紧接着)向患者施用约15mg泼尼松龙或泼尼松/天,向人受试者施用15mg泼尼松龙或泼尼松3天后连续3天(例如紧接着)向患者施用约10mg泼尼松龙或泼尼松/天和向患者施用10mg泼尼松龙或泼尼松后3天连续3天(例如紧接着)连续3天向患者施用约5mg泼尼松龙或泼尼松/天。

在一些实施方案中,第二逐渐减少剂量的泼尼松龙或泼尼松包括在完成泼尼松龙或泼尼松的初始疗程后紧接着连续7天向患者施用约30mg泼尼松龙或泼尼松/天,向患者施用30mg泼尼松龙或泼尼松7天后紧接着连续7天向患者施用约20mg泼尼松龙或泼尼松/天,向患者施用20mg泼尼松龙或泼尼松后7天紧接着连续5天向患者施用约15mg泼尼松龙或泼尼松/天,向患者施用15mg泼尼松龙或泼尼松5天后紧接着连续5天向患者施用约10mg泼尼松龙或泼尼松/天和向患者施用10mg泼尼松龙或泼尼松5天后紧接着连续5天向患者施用约5mg泼尼松龙或泼尼松/天。

在一些实施方案中,在施用AAV颗粒后在患者中检测到免疫应答的迹象之后施用泼尼松龙或泼尼松的疗程。在一些实施方案中,在患者中检测到肝炎的迹象之后施用泼尼松龙或泼尼松的疗程。举例而言,在一些实施方案中,在施用AAV颗粒后监测患者的肝炎,并且在检测到肝炎后向患者施用泼尼松龙或泼尼松的疗程。

在一些实施方案中,患者的血流中因子VIII表达或因子VIII活性的迅速或较大降低指示受试者的肝炎。在一些实施方案中,有可能可观察到因子VIII活性的早期峰值随后少量和/或逐渐降低,其后在稍微更低水平下形成因子VIII蛋白,而不需要施用泼尼松龙或泼尼松的疗程。举例而言,在一些实施方案中,在施用AAV颗粒后监测患者血流中因子VIII的量(例如因子VIII效价或因子VIII活性水平),并且如果检测到因子VIII的量迅速或较大降低(例如相较于施用AAV颗粒后患者血流中的水平超过因子VIII效价或因子VIII活性水平的阈值降低),则向受试者施用泼尼松龙或泼尼松的疗程。

在一些实施方案中,患者中的肝酶水平增加指示受试者的肝炎。举例而言,在一些实施方案中,在施用AAV颗粒后监测患者中的肝酶水平,并且如果检测到肝酶水平的增加(例如,(例如)相较于施用AAV颗粒之前或施用AAV颗粒之后不久患者中的肝酶基线水平,超过肝酶的量的阈值增加),则向患者施用泼尼松龙或泼尼松的疗程。

施用后监测

在一些实施方案中,提供用于在施用腺相关病毒(AAV)颗粒后监测患者的不良反应和/或治疗功效的方法,所述腺相关病毒(AAV)颗粒具有编码因子VIII多肽的多核苷酸,例如与SEQ ID NO:1(CS04-FL-NA)具有高序列同一性的多核苷酸。在一些实施方案中,针对以下中的一或多者监测患者:(a)肝炎的迹象(例如经由因子VIII水平(例如效价或活性)的迅速或较大降低和/或肝酶(例如效价或活性)的增加),(b)患者的血流中因子VIII抑制子抗体的增加,(c)患者的血流中衣壳蛋白的增加,(d)患者的血流中抗衣壳蛋白抗体的增加,和(e)患者的血流中编码因子VIII多肽的多核苷酸或其片段的增加。在一些实施方案中,在检测到一个或多个不良反应和/或治疗无效后进一步治疗受试者。

举例而言,在一个实施方案中,提供用于监测使用腺相关病毒(AAV)颗粒的A型血友病的因子VIII基因疗法的功效的方法,所述腺相关病毒(AAV)颗粒包括编码因子VIII多肽的多核苷酸。所述方法包括在向患者施用AAV颗粒之后,确定在患者的血流中(例如在自患者收集的血液样品中)是否存在因子VIII抑制子抗体。在一些实施方案中,当在患者的血流中检测到因子VIII抑制子抗体时(例如,当相较于施用AAV颗粒之前患者中的水平,检测到因子VIII抑制子抗体水平的增加时),所述方法包括向患者施用替代性剂用于治疗A型血友病。

在一些实施方案中,用于治疗A型血友病的替代性剂为因子VIII的替代形式(例如不包括或通过所检测到的因子VIII抑制子抗体掩蔽靶向表位中的一或多者的一种替代形式)。在一些实施方案中,因子VIII的替代形式为经化学修饰的因子VIII蛋白(例如经化学修饰的人或猪因子VIII蛋白)。在一些实施方案中,因子VIII的替代形式为来源于非人因子VIII蛋白的因子VIII蛋白,例如猪因子VIII蛋白。在一些实施方案中,用于治疗A型血友病的替代性剂为因子VIII旁路疗法,例如包括因子II、因子IX和因子X的治疗剂。举例而言,在一些实施方案中,因子VIII旁路疗法为因子VIII抑制子旁路活性(FEIBA)复合物、重组活化因子VII(FVIIa)、凝血酶原复合浓缩物或活化凝血酶原复合浓缩物。

在一个实施方案中,提供用于在施用AAV颗粒后监测患者的血流中编码因子VIII多肽的多核苷酸或其片段的水平的方法。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用腺相关病毒(AAV)颗粒/千克患者体重的剂量,其中AAV颗粒包括编码因子VIII蛋白的多核苷酸。所述方法还包括在稍后时间点测量患者的血流中编码因子VIII蛋白的多核苷酸或其片段的水平,其中所述稍后时间点为7天或更长。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用2×1012个腺相关病毒(AAV)颗粒/千克患者体重的剂量,其中AAV颗粒包括具有SEQ ID NO:1(CS04-FL-NA)的核酸序列的多核苷酸。所述方法还包括在稍后时间点测量患者的血流中SEQ ID NO:1的核酸或其片段的水平,其中稍后时间点为7天或更长。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用6×1012个腺相关病毒(AAV)颗粒/千克患者体重的剂量,其中AAV颗粒包括具有SEQID NO:1(CS04-FL-NA)的核酸序列的多核苷酸。所述方法还包括在稍后时间点测量患者的血流中SEQ ID NO:1的核酸或其片段的水平,其中稍后时间点为7天或更长。在方法的一些实施方案中,稍后时间点为稍后至少14天或稍后至少21天。在一些实施方案中,稍后时间点为施用AAV颗粒之后7天、14天或21天时。

在一个实施方案中,提供用于在施用AAV颗粒后监测患者的血流中衣壳蛋白水平的方法。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用2×1012个腺相关病毒(AAV)颗粒/千克所述患者体重的剂量,其中AAV颗粒包括衣壳蛋白和多核苷酸,所述多核苷酸包括SEQ ID NO:1(CS04-FL-NA)的核酸序列。所述方法还包括在稍后时间点测量所述患者的血流中的衣壳蛋白水平,其中稍后时间点为7天或更长。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用6×1012个腺相关病毒(AAV)颗粒/千克患者体重的剂量,其中AAV颗粒包括衣壳蛋白和多核苷酸,所述多核苷酸包括SEQ ID NO:1(CS04-FL-NA)的核酸序列。所述方法还包括在稍后时间点测量所述患者的血流中的衣壳蛋白水平,其中稍后时间点为7天或更长。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用腺相关病毒(AAV)颗粒/千克所述患者体重的剂量,其中AAV颗粒包括衣壳蛋白和编码因子VIII蛋白的多核苷酸。所述方法还包括在稍后时间点测量所述患者的血流中的衣壳蛋白水平,其中稍后时间点为7天或更长。在方法的一些实施方案中,稍后时间点为稍后至少14天或稍后至少21天。在一些实施方案中,稍后时间点为施用AAV颗粒之后7天、14天或21天时。

在一个实施方案中,提供用于在施用AAV颗粒后监测患者的血流中的因子VIII抑制子抗体水平的方法。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用2×1012个腺相关病毒(AAV)颗粒/千克患者体重的剂量,其中AAV颗粒包括多核苷酸,所述多核苷酸包括SEQ ID NO:1(CS04-FL-NA)的核酸序列。所述方法还包括在稍后时间点测量患者的血流中的抗因子VIII抗体水平,其中稍后时间点为7天或更长。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用6×1012个腺相关病毒(AAV)颗粒/千克患者体重的剂量,其中AAV颗粒包括多核苷酸,所述多核苷酸包括SEQ ID NO:1(CS04-FL-NA)的核酸序列。所述方法还包括在稍后时间点测量患者的血流中的抗因子VIII抗体水平,其中所述稍后时间点为7天或更长。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用腺相关病毒(AAV)颗粒的剂量,其中AAV颗粒包括编码因子VIII蛋白的多核苷酸。所述方法还包括在稍后时间点测量患者的血流中的抗因子VIII抗体水平,其中所述稍后时间点为7天或更长。在方法的一些实施方案中,稍后时间点为稍后至少14天或稍后至少21天。在一些实施方案中,稍后时间点为施用AAV颗粒之后7天、14天或21天时。

在一个实施方案中,提供用于在施用AAV颗粒后监测受试者的血流中的抗衣壳蛋白抗体水平的方法。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用2×1012个腺相关病毒(AAV)颗粒/千克所述患者体重的剂量,其中AAV颗粒包括衣壳蛋白和多核苷酸,所述多核苷酸包括SEQ ID NO:1(CS04-FL-NA)的核酸序列。所述方法还包括在稍后时间点测量患者的血流中的抗衣壳蛋白抗体水平,其中稍后时间点为7天或更长。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用6×1012个腺相关病毒(AAV)颗粒/千克患者体重的剂量,其中AAV颗粒包括衣壳蛋白和多核苷酸,所述多核苷酸包括SEQID NO:1(CS04-FL-NA)的核酸序列。所述方法还包括在稍后时间点测量所述患者的血流中的抗衣壳蛋白抗体水平,其中稍后时间点为7天或更长。在一个实施方案中,所述方法包括在第一时间点向A型血友病患者施用腺相关病毒(AAV)颗粒/千克所述患者体重的剂量,其中AAV颗粒包括衣壳蛋白和编码因子VIII蛋白的多核苷酸。所述方法还包括在稍后时间点测量所述患者的血流中的抗衣壳蛋白抗体水平,其中稍后时间点为7天或更长。在方法的一些实施方案中,稍后时间点为稍后至少14天或稍后至少21天。在一些实施方案中,稍后时间点为施用AAV颗粒之后7天、14天或21天时。

IV.实施例

实施例1-构建密码子改变的因子VIII变体表达序列

必须克服两个障碍以创造出对A型血友病的基因疗法有效的因子VIII编码序列。第一,归因于常规基因疗法递送载体(例如AAV病毒粒子)的基因组大小限制,必须大大缩短所编码的因子VIII多肽。第二,必须改变编码序列以:(i)稳定化递送载体内的封装相互作用,(ii)稳定化mRNA中间物,和(iii)改善mRNA的转录/翻译的稳固性。

为实现第一目标,申请人以在本文中称为“FVIII-BDD-SQ”的B结构域缺失的因子VIII变体构建体开始。在此构建体中,用称为“SQ”序列的十四氨基酸序列代替B结构域。重组FVIII-BDD-SQ以商标名出售,并且已示出为对控制A型血友病有效。然而,包括因子VIII重链和轻链的人野生型核酸序列的FVIII-BDD-SQ的天然编码序列不能在基因疗法载体中有效表达。

为解决天然FVIII-BDD-SQ的较差表达,将如Ward等人(Blood,117:798(2011))和McIntosh等人(Blood,121,3335-3344(2013))中所描述而修改的描述于Fath等人(PLoSONE,6:e17596(2011))中的密码子优化算法应用于FVIII-BDD-SQ序列以形成第一中间编码序列CS04a。然而,申请人认识到使用经修改算法形成的CS04a序列可通过进一步修饰所述序列而改善。因此,申请人重新引入CpG二核苷酸,重新引入精氨酸的CGC密码子,改变亮氨酸和丝氨酸密码子分布,重新引入高度保守的密码子对,并且移除隐性TATA框、CCAAT框和剪接位点元件,同时避免CpG岛和富AT和富GC伸长段的局部过表达。

第一,经修改算法用非CpG二核苷酸密码子系统地代替含有CpG二核苷酸的密码子(例如精氨酸密码子),并且消除/避免由相邻密码子形成的CpG二核苷酸。通常进行对CpG二核苷酸的此严格避免以防止在肌肉内注射DNA疫苗之后TLR诱导的免疫。然而,如此进行限制密码子优化的可能性。举例而言,经修改算法排除使用CGX精氨酸密码子的完整集合。这在用于人细胞中的表达的基因编码中尤其具有破坏性,因为在高度表达的人基因中CGC为最常使用的精氨酸密码子。另外,避免由相邻密码子形成CpG进一步限制优化可能性(例如限制可共同使用的密码子对的数量)。

由于不预期TLR诱导的免疫为与基于AAV的肝脏定向基因疗法相关的问题,因此将包括CpG的密码子和形成CpG的相邻密码子重新引入中间编码序列CS04a中,优选地引入编码因子VIII轻链的序列中(例如在FVIII-BDD-SQ编码序列的3'端处)。这允许更频繁地使用优选人密码子,尤其用于精氨酸的密码子。然而注意避免形成CpG岛,其为具有高频率CpG位点的编码序列的区域。这与Krinner等人(Nucleic Acids Res.,42(6):3551-64(2014))的教示相反,其提出转录起始位点下游的CpG域促进高水平的基因表达。

第二,经修改算法排他性地应用某些密码子,诸如用于亮氨酸的CTG、用于缬氨酸的GTG和用于谷氨酰胺的CAG。然而,例如如Haas等人(Current Biology,6(3):315-24(1996))所提议,这违反了平衡密码子使用的原则。考虑到因经修改算法过度使用优选密码子,在由应用于密码子改变(例如CpG频率和GC含量)的其他法则允许时重新引入替代性亮氨酸密码子。

第三,当符合某些准则(例如存在CG二核苷酸)时,经修改算法代替密码子对而不考虑其在自然界中如何保守。考虑对可能已因进化而保留的有益特性,在由应用于密码子改变(例如CpG频率和GC含量)的其他法则允许时,分析且调整由算法代替的大部分保守密码子对和大部分保守优选密码子对,例如如Tats等人(BMC Genomics 9:463(2008))中所描述。

第四,还重新工程改造用于中间编码序列的丝氨酸密码子。具体而言,将AGC、TCC和TCT丝氨酸密码子以更高频率引入经修饰编码序列中以更好地整体匹配以供人密码子使用(Haas等人,见上文)。

第五,筛选且从经修饰编码序列移除TATA框、CCAAT框元件和内含子/外显子剪接位点。当修饰编码序列时,注意避免富AT或富GC伸长段的局部过表达。

最后,除在编码序列内优化密码子使用以外,当进一步优化中间编码序列CS04a时考虑潜在AAV病毒粒子的结构要求。AAV载体(例如AAV病毒粒子的核酸部分)作为单股DNA分子封装于其衣壳中(对于综述,参见Daya和Berns,Clin.Microbiol Rev.,21(4):583-93(2008))。因而载体的GC含量可能影响基因组的封装且因此在产生期间影响载体产量。如许多算法,本文使用的经修改算法形成GC含量为至少60%的优化基因序列(参见Fath等人,PLoS One,6(3):e17596(2011)(勘误于:PLoS One,(6)3(2011)中)。然而,AAV8衣壳蛋白由具有约56%的更低GC含量的核苷酸序列编码。因此,为更好地模拟天然AAV8衣壳蛋白编码序列,将中间编码序列CS04a的GC含量减少至56%。

图2中所示出的所得CS04编码序列的总体GC含量为56%。所述序列的CpG二核苷酸含量为适中的。然而,CpG二核苷酸主要在编码序列的下游部分(例如编码因子VIII轻链的部分)中。CS04序列与野生型因子VIII(Genbank登录号M14113)中的对应编码序列具有79.77%核苷酸序列同一性。

出于比较目的,制备若干其他密码子优化ReFacto构建体。如Radcliff P.M.等人,Gene Therapy,15:289-97(2008)中所描述,将CS08ReFacto构建体密码子优化,出于所有目的所述文献的内容特此明确地以引用的方式整体并入本文中。CS10密码子优化的ReFacto构建体获自Eurofms Genomics(Ebersberg,Germany)。CS11密码子优化的ReFacto构建体获自Integrated DNA Technologies公司(Coralville,ETSA)。CH25密码子优化ReFacto构建体获自ThermoFischer Scientific的GeneArt服务(Regensburg,Germany)。CS40 ReFacto构建体由野生型因子VIII编码序列组成。ReFacto编码序列中的每一者之间共有的序列同一性示出于下表2中。

表2-密码子改变的因子VIII构建体的同一性百分比矩阵。

CS04 CS08 CS10 CS11 CS40 CH25
CS04 100%
CS08 82.2.% 100%
CS10 79.4% 78.4% 100%
CS11 78.3% 78.1% 77.5% 100%
CS40 79.8% 76.7% 77.6% 75.4% 100%
CH25 85.1% 85.0% 79.9% 79.4% 75.8% 100%

各构建体的质粒通过将不同合成DNA片段克隆至相同载体主链质粒(pCh-BBO1)中来构建。由ThermoFischer Scientific(Regensburg,Germany)进行具有侧接AscI和NotI酶限制位点的Refacto型BDD-FVIII片段的DNA合成。载体主链含有两个侧接AAV2源性反向末端重复序列(ITR),其涵盖来源于肝脏特异性鼠类甲状腺素运载蛋白基因的启动子/增强子序列;用于插入相应Refacto型BDD-FVIII的AscI和NotI酶限制位点和合成polyA位点。连接所制备载体主链且经由AscI和NotI位点插入后,以毫克规模扩增所得质粒。通过直接定序(Microsynth,Balgach,Switzerland)验证构建体的Refacto型BDD-FVIII序列。克隆产生命名为pCS40、pCS04、pCS08、pCS1O、pCS11和pCh25的七种不同的质粒构建体(图14)。构建体具有相同载体主链且编码相同B结构域缺失的FVIII蛋白(Refacto型BDD-FVIII),但其FVIII编码序列不同。

如Grieger JC等人(Virus Vectors Using Suspension HEK293 Cells andContinuous Harvest of Vector From the Culture Media for GMP FIX and FLT1Clinical Vector,Mol Ther.,10月6日(2015)doi:10.1038/mt.2015.187.[打印之前电子出版])中所描述,通过三种质粒转染方法制备基于AAV8的载体,出于所有目的所述文献的内容特此明确地以全文引用的方式并入本文中。将HEK293悬浮液细胞用于使用对应FVIII载体质粒、辅助质粒pXX6-80(携带腺病毒辅助基因)和封装质粒pGSK2/8(贡献rep2和cap8基因)的质粒转染。为分离AAV8构建体,如Grieger等人(2015,见上文)中所描述,使用碘克沙醇梯度处理一升培养物的细胞小球。程序产生称为vCS04、vCS08、vCS10、vCS11和vCH25的载体制剂。通过qPCR使用靶向AAV2反向末端重复序列的通用qPCR程序定量载体(Aurnhammer,Human Gene Therapy Methods:Part B 23:18-28(2012))。携带AAV2反向末端重复序列的对照载体质粒用于制备标准曲线。所得vCS04构建体在图7A-7C中呈现为SEQID NO:8。

通过AAV琼脂糖凝胶电泳分析载体基因组的完整性。如Fagone等人,Human GeneTherapy Methods 23:1-7(2012)中所描述执行电泳。简言之,在75℃下在0.5%SDS存在下孵育AAV载体制剂10分钟且随后将其冷却至室温。在1%1xTAE琼脂糖凝胶上每泳道负载大致1.5E10个载体基因组(vg),并且在7V/cm凝胶长度下电泳60分钟。随后将凝胶在2xGelRed(Biotium目录号41003)溶液中染色且通过ChemiDocTMMP(Biorad)成像。通过5kb范围内的相异条带所指示,图15中所示出的结果证实vCS04和vCS40病毒载体具有相同大小的基因组(图15,泳道2-4)。尽管载体大小为大致5.2kb,但基因组为确认稍微过大基因组(相对于4.7kb的AAV野生型基因组)的正确封装的均匀条带。所有其他vCS载体制剂示出相同的基因组大小(数据未示出)。

为了确认衣壳蛋白的预期模式,用载体vCS04和vCS40执行SDS PAGE继而银染色(图16)。如图中所示出,下游纯化程序产生呈现VP1、VP2和VP3的预期蛋白模式的高度纯化物质(图16,泳道2-4)。在所有其他病毒制剂下看到相同模式(未示出)。根据标准程序进行AAV制剂的SDS-PAGE程序。各泳道含有1E10个相应病毒构建体的vg,并且在4-12%Bis-Tris(Novex,Life Technologies)凝胶上按照制造商的说明分离。用SilverQuestTM试剂盒(Novex,Life Technologies)根据制造商的说明执行银染色。

出人意料地,相较于vCS40野生型编码构建体及其他密码子优化构建体,通过AAV病毒产生中的更高产量测量,AAV载体vCS04具有更高病毒粒子封装。如表3中所示出,vCS04载体实质上比vCS40复制地更好,在AAV效价方面提供5-7倍的产量增加。

表3-如从细胞小球纯化,用AAV载体构建体vCS04和vCD40获得的产量/升细胞培养物。

实施例2-密码子改变的因子VIII变体表达序列的体内表达

为测试密码子改变的因子VIII变体序列的生物效能,向缺乏因子VIII的小鼠施用实施例1中所描述的ReFacto型FVIII构建体。简言之,在C57B1/6FVIII基因敲除(ko)小鼠(每组6-8只动物)中通过尾部静脉注射4E12个载体基因组(vg)/千克小鼠体重来执行分析。注射后14天通过眶后穿刺抽出血液,并且使用标准程序制备并冷冻血浆。选择第14天时的表达水平,因为此时抑制性抗体的影响最小,其在稍后时间在此小鼠模型的一些动物中可见。如制造商(奥地利,维也纳,Technoclone)所建议,使用仅执行微小修改的TechnochromeFVIII测定来测定小鼠血浆中的FVIII活性。为了测定,将血浆样品适当稀释且与含有凝血酶、活化因子IX(FIXa)、磷脂、因子X和钙的测定试剂混合。通过凝血酶活化FVIII后,形成具有FIXa、磷脂和钙的复合物。此复合物将FX活化成活化FX(FXa),其转而自发色受质裂解对硝基苯胺(pNA)。在405nm下测量pNA形成的动力学。速率与样品中的FVIII浓度成正比。自参考曲线读取FVIII浓度且结果以IU FVIII/毫升形式提供。

呈现于下表4中的结果证实相较于野生型BDD-因子VIII构建体(CS40),使用商业算法设计的密码子改变的序列(CS10、CS11和CH25)仅使BDD-因子VIII适度增加(3-4倍)。相似地,如Radcliffe等人中所描述制备的密码子经改变BDD-因子VIII构建体(CS08)仅使BDD-FVIII表达增加3-4倍。此结果与Radcliff等人中所报告的结果相同。出人意料地,在体内生物效能测定中CS04构建体提供高得多的BDD-FVIII表达(例如增加74倍)。

表4-通过不同AAV载体构建体诱导的FVIII基因敲除小鼠的血浆中的FVIII表达。

实施例3-小鼠中人FVIII基因疗法载体的非临床功效和毒理学评估

A型血友病为由缺少因子VIII(FVIII)或缺陷性因子VIII(FVIII)所引起的遗传性出血病症且其用血浆源性或重组因子浓缩物治疗。这些浓缩物需要定期输注以维持适当FVIII水平来控制和预防出血现象。鉴于蛋白替代疗法的难题,基因疗法可提供用于患A型血友病的患者的替代性治疗方法。通过将功能性F8基因复本引入目标肝细胞中以诱导内源性FVIII表达,可不再需要频繁输注凝血因子。

基于腺相关病毒(AAV)的基因疗法可能在患A型血友病的患者中提供临床益处。设计含有CS04因子VIII密码子优化构建体的基于重组(r)AAV8的基因疗法载体以在肝脏特异性甲状腺素运载蛋白启动子的控制下递送人密码子优化B结构域缺失的FVIII(BDDFVIII)转基因。此构建体用于检验F8基因敲除(ko)小鼠中FVIII活性的剂量-反应关系且用于评估单次静脉内施用后的毒性。

简言之为了测试治疗的功效,向每组12个雄性FVIII基因敲除小鼠施用3.0×1011、1.2×1012或3.0×1012个载体衣壳颗粒(cp)/kg或10mL/kg缓冲液的单次静脉内剂量。在8周内每隔一周采集眶后血液样品且使用发色测定来分析所述血液样品的FVIII。获自最终生命中血液取样的血浆样品还用于FVIII结合和中和抗体的分析。在观察周期结束时,使用尾尖出血测定评估止血控制。

在研究结束时,除结合和中和抗体测试为阳性的4只动物(用3.0×1012个cp/kg载体处理)的外所有样品的抗BDD-FVIII结合抗体均为阴性。这些动物从FVIII活性水平的统计分析和尾尖出血中的失血量测定排除。施用1.2×1012或3.0×1012个cp/kg载体引起平均血浆FVIII活性的剂量依赖型增加,分别增加至在研究周期内所计算的0.6和1.9IU/mL,但在用缓冲液或3.0×1011个cp/kg载体处理的小鼠中FVIII活性低于定量下限(LLOQ)(图17)。

在第63天在尾尖出血测定中评估功效。以mg/g体重为单位的60分钟内的失血量呈现于图18中。用缓冲液或3.0×1011个cp/kg基因疗法载体处理的动物示出相似失血量(分别为6.1mg/g和7.5mg/g),与不存在可检测FVIII活性相同。更高剂量的基因疗法载体以剂量依赖型方式显著减少失血量(1.2×1012:0.6mg/g,3.0×1012:0.4mg/g;琼克希尔-特普斯特拉(Jonckheere-Terpstra)测试:1-侧P值<0.001)。

为了测试构建体的毒理学,向雄性C57BL/6J小鼠(n=20/组)静脉内注射1×1013、3×1013或5×1013个cp/kg载体的单次剂量或调配物缓冲液(表5)。基于临床体征、体重、食物摄取、眼科学以及临床和解剖病理学评估毒性。对5只来自各组的动物执行完整尸体剖检,并且记录肉眼可见结果、器官重量和显微检验结果。自另外5只来自各组的动物收集组织用于通过定量聚合酶链反应评估生物分布。在给药之前和尸体解剖时收集血液。分析FVIII活性、BDD-FVIII抗原、结合抗BDD-FVIII抗体、中和抗BDD-FVIII抗体和结合抗AAV8抗体。

表5-毒性研究的设计。

发现以至多5×1013个cp/kg单次静脉内推注施用基因疗法载体具有良好耐受性。在研究期间未发生死亡且无临床体征或给药后观察结果视为与施用载体相关。未观察到阴性眼科结果。未观察到对体重或食物摄取的影响。未观察到临床化学、血液学或尿分析参数的改变。且无毒理学相关肉眼可见或显微结果与施用基因疗法载体相关。

FVIII活性和BDD-FVIII抗原评估有广泛变异倾向,最可能由于生成人BDD-FVIII的中和抗体。然而,在第3天以及第3周和第18周所有载体组中的单独动物均具有高于一般基线水平的活性(数据未示出)。在所采集的组织样品中,载体DNA主要在肝脏中检测到。肝脏及其他组织的生物分布为剂量相关,并且一般在最早时间点最高并随时间推移而降低。脑部和睪丸中载体DNA的存在度随时间推移显著降低,并且在第18周在许多动物中低于测定的LLOQ(图19)。

综合而言,结果示出当以剂量≥1.2×1012个cp/kg向FVIII基因敲除小鼠施用时密码子优化的BDD-FVII基因疗法为有效的。无观察到的不良影响水平视为5.0><1013个cp/kg,毒性研究中所测试的最高剂量。

在一些实施方案中,向小鼠施用的剂量可根据“成年健康志愿者的治疗剂初始临床试验中的最大安全起始剂量的行业估算指南(Guidance for Industry-Estimating theMaximum Safe Starting Dose in Initial Clinical Trials for Therapeutics inAdult Healthy Volunteers)”,美国卫生和公共服务部(U.S.Department of Health andHuman Services),食品与药物管理局(Food and Drug Administration),药物评估和研究中心(Center for Drug Evaluation and Research,CDER),2005年7月,药理学和毒理学(Pharmacology and Toxicology)中所提供的指导转化成人剂量,其内容出于所有目的以引用的方式整体并入本文中。

应理解,本文中所述的实施例和实施方案仅出于说明性目的,并且根据其的各种修改或变化将由本领域技术人员建议且包括在本申请的精神和范围内和所附申请专利范围的范围内。出于所有目的,本文所引用的所有公布、专利和专利申请特此以引用的方式整体并入本文中。

序列表

<110> 百深公司(BAXALTA INCORPORATED)

百深有限责任公司(BAXALTA GMBH)

<120> 使用编码具有增加的表达的重组FVIII变体的病毒载体的A型血友病的基因疗法

<130> 008073-5202-WO

<140>

<141>

<150> 62/698,680

<151> 2018-07-16

<150> 62/867,171

<151> 2019-06-26

<160> 15

<170> PatentIn version 3.5

<210> 1

<211> 4374

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 1

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60

accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120

ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180

acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240

gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300

gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360

ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420

gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc 480

aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat 540

gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600

ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660

tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720

gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780

ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840

acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900

agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960

gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag 1020

gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080

gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140

gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200

tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260

cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320

aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380

attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440

ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500

gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560

cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620

accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680

gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740

aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800

aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860

cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920

tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980

attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040

atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100

atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160

atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220

agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccaggagc 2280

ttcagccaga atccacctgt cctgaaacgc caccagaggg agatcaccag gaccaccctc 2340

cagtctgacc aggaggagat tgactatgat gacaccattt ctgtggagat gaagaaagag 2400

gactttgaca tctatgacga ggacgagaac cagagcccaa ggagcttcca gaagaagacc 2460

aggcactact tcattgctgc tgtggagcgc ctgtgggact atggcatgag ctccagcccc 2520

catgtcctca ggaacagggc ccagtctggc tctgtgccac agttcaagaa agtggtcttc 2580

caagagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac 2640

ctgggactcc tgggcccata catcagggct gaggtggagg acaacatcat ggtgaccttc 2700

cgcaaccagg cctccaggcc ctacagcttc tacagctccc tcatcagcta tgaggaggac 2760

cagaggcagg gggctgagcc acgcaagaac tttgtgaaac ccaatgaaac caagacctac 2820

ttctggaaag tccagcacca catggccccc accaaggatg agtttgactg caaggcctgg 2880

gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggcccactc 2940

ctggtctgcc acaccaacac cctgaaccct gcccatggaa ggcaagtgac tgtgcaggag 3000

tttgccctct tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg 3060

gagcgcaact gcagggcccc atgcaacatt cagatggagg accccacctt caaagagaac 3120

taccgcttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggcc 3180

caggaccaga ggatcaggtg gtacctgctt tctatgggct ccaatgagaa cattcactcc 3240

atccacttct ctgggcatgt cttcactgtg cgcaagaagg aggagtacaa gatggccctg 3300

tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360

tggagggtgg agtgcctcat tggggagcac ctgcatgctg gcatgagcac cctgttcctg 3420

gtctacagca acaagtgcca gacccccctg ggaatggcct ctggccacat cagggacttc 3480

cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctccactac 3540

tctggatcca tcaatgcctg gagcaccaag gagccattca gctggatcaa agtggacctg 3600

ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttctccagc 3660

ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaaatg gcagacctac 3720

agaggcaact ccactggaac actcatggtc ttctttggca atgtggacag ctctggcatc 3780

aagcacaaca tcttcaaccc cccaatcatc gccagataca tcaggctgca ccccacccac 3840

tacagcatcc gcagcaccct caggatggag ctgatgggct gtgacctgaa ctcctgcagc 3900

atgcccctgg gcatggagag caaggccatt tctgatgccc agatcactgc ctccagctac 3960

ttcaccaaca tgtttgccac ctggagccca agcaaggcca ggctgcacct ccagggaagg 4020

agcaatgcct ggaggcccca ggtcaacaac ccaaaggagt ggctgcaggt ggacttccag 4080

aagaccatga aggtcactgg ggtgaccacc cagggggtca agagcctgct caccagcatg 4140

tatgtgaagg agttcctgat cagctccagc caggatggcc accagtggac cctcttcttc 4200

cagaatggca aggtcaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac 4260

agcctggacc cccccctcct gaccagatac ctgaggattc acccccagag ctgggtccac 4320

cagattgccc tgaggatgga ggtcctggga tgtgaggccc aggacctgta ctga 4374

<210> 2

<211> 1457

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多肽

<400> 2

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu

755 760 765

Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln

770 775 780

Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu

785 790 795 800

Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe

805 810 815

Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp

820 825 830

Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln

835 840 845

Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr

850 855 860

Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His

865 870 875 880

Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile

885 890 895

Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser

900 905 910

Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg

915 920 925

Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val

930 935 940

Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp

945 950 955 960

Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu

965 970 975

Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His

980 985 990

Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe

995 1000 1005

Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn

1010 1015 1020

Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys

1025 1030 1035

Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr

1040 1045 1050

Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr

1055 1060 1065

Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe

1070 1075 1080

Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met

1085 1090 1095

Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met

1100 1105 1110

Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly

1115 1120 1125

Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser

1130 1135 1140

Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg

1145 1150 1155

Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro

1160 1165 1170

Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser

1175 1180 1185

Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro

1190 1195 1200

Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe

1205 1210 1215

Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp

1220 1225 1230

Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu

1235 1240 1245

Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn

1250 1255 1260

Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro

1265 1270 1275

Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly

1280 1285 1290

Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys

1295 1300 1305

Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn

1310 1315 1320

Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln

1325 1330 1335

Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu

1340 1345 1350

Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val

1355 1360 1365

Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys

1370 1375 1380

Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu

1385 1390 1395

Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp

1400 1405 1410

Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr

1415 1420 1425

Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala

1430 1435 1440

Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

1445 1450 1455

<210> 3

<211> 2220

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 3

gccaccagga gatactacct gggggctgtg gagctttctt gggactacat gcagtctgac 60

ctgggggagc tgcctgtgga tgccaggttc ccacccagag tgcccaaatc cttcccattc 120

aacacctctg tggtctacaa gaagaccctc tttgtggagt tcactgacca cctgttcaac 180

attgccaaac ccaggccacc ctggatggga ctcctgggac ccaccattca ggctgaggtg 240

tatgacactg tggtcatcac cctcaagaac atggcctccc accctgtgag cctgcatgct 300

gtgggggtca gctactggaa ggcctctgag ggggctgagt atgatgacca gacctcccag 360

agggagaagg aggatgacaa agtgttccct gggggcagcc acacctatgt gtggcaggtc 420

ctcaaggaga atggccccat ggcctctgac ccactctgcc tgacctactc ctacctttct 480

catgtggacc tggtcaagga cctcaactct ggactgattg gggccctgct ggtgtgcagg 540

gagggctccc tggccaaaga gaagacccag accctgcaca agttcattct cctgtttgct 600

gtctttgatg agggcaagag ctggcactct gaaaccaaga actccctgat gcaggacagg 660

gatgctgcct ctgccagggc ctggcccaag atgcacactg tgaatggcta tgtgaacagg 720

agcctgcctg gactcattgg ctgccacagg aaatctgtct actggcatgt gattggcatg 780

gggacaaccc ctgaggtgca ctccattttc ctggagggcc acaccttcct ggtcaggaac 840

cacagacagg ccagcctgga gatcagcccc atcaccttcc tcactgccca gaccctgctg 900

atggacctcg gacagttcct gctgttctgc cacatcagct cccaccagca tgatggcatg 960

gaggcctatg tcaaggtgga cagctgccct gaggagccac agctcaggat gaagaacaat 1020

gaggaggctg aggactatga tgatgacctg actgactctg agatggatgt ggtccgcttt 1080

gatgatgaca acagcccatc cttcattcag atcaggtctg tggccaagaa acaccccaag 1140

acctgggtgc actacattgc tgctgaggag gaggactggg actatgcccc actggtcctg 1200

gcccctgatg acaggagcta caagagccag tacctcaaca atggcccaca gaggattgga 1260

cgcaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320

gccattcagc atgagtctgg catcctgggc ccactcctgt atggggaggt gggggacacc 1380

ctgctcatca tcttcaagaa ccaggcctcc aggccctaca acatctaccc acatggcatc 1440

actgatgtca ggcccctgta cagccgcagg ctgccaaagg gggtgaaaca cctcaaggac 1500

ttccccattc tgcctgggga gatcttcaag tacaagtgga ctgtcactgt ggaggatgga 1560

ccaaccaaat ctgaccccag gtgcctcacc agatactact ccagctttgt gaacatggag 1620

agggacctgg cctctggcct gattggccca ctgctcatct gctacaagga gtctgtggac 1680

cagaggggaa accagatcat gtctgacaag aggaatgtga ttctgttctc tgtctttgat 1740

gagaacagga gctggtacct gactgagaac attcagcgct tcctgcccaa ccctgctggg 1800

gtgcagctgg aggaccctga gttccaggcc agcaacatca tgcactccat caatggctat 1860

gtgtttgaca gcctccagct ttctgtctgc ctgcatgagg tggcctactg gtacattctt 1920

tctattgggg cccagactga cttcctttct gtcttcttct ctggctacac cttcaaacac 1980

aagatggtgt atgaggacac cctgaccctc ttcccattct ctggggagac tgtgttcatg 2040

agcatggaga accctggcct gtggattctg ggatgccaca actctgactt ccgcaacagg 2100

ggcatgactg ccctgctcaa agtctcctcc tgtgacaaga acactgggga ctactatgag 2160

gacagctatg aggacatctc tgcctacctg ctcagcaaga acaatgccat tgagcccagg 2220

<210> 4

<211> 2052

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 4

gagatcacca ggaccaccct ccagtctgac caggaggaga ttgactatga tgacaccatt 60

tctgtggaga tgaagaaaga ggactttgac atctatgacg aggacgagaa ccagagccca 120

aggagcttcc agaagaagac caggcactac ttcattgctg ctgtggagcg cctgtgggac 180

tatggcatga gctccagccc ccatgtcctc aggaacaggg cccagtctgg ctctgtgcca 240

cagttcaaga aagtggtctt ccaagagttc actgatggca gcttcaccca gcccctgtac 300

agaggggagc tgaatgagca cctgggactc ctgggcccat acatcagggc tgaggtggag 360

gacaacatca tggtgacctt ccgcaaccag gcctccaggc cctacagctt ctacagctcc 420

ctcatcagct atgaggagga ccagaggcag ggggctgagc cacgcaagaa ctttgtgaaa 480

cccaatgaaa ccaagaccta cttctggaaa gtccagcacc acatggcccc caccaaggat 540

gagtttgact gcaaggcctg ggcctacttc tctgatgtgg acctggagaa ggatgtgcac 600

tctggcctga ttggcccact cctggtctgc cacaccaaca ccctgaaccc tgcccatgga 660

aggcaagtga ctgtgcagga gtttgccctc ttcttcacca tctttgatga aaccaagagc 720

tggtacttca ctgagaacat ggagcgcaac tgcagggccc catgcaacat tcagatggag 780

gaccccacct tcaaagagaa ctaccgcttc catgccatca atggctacat catggacacc 840

ctgcctgggc ttgtcatggc ccaggaccag aggatcaggt ggtacctgct ttctatgggc 900

tccaatgaga acattcactc catccacttc tctgggcatg tcttcactgt gcgcaagaag 960

gaggagtaca agatggccct gtacaacctc taccctgggg tctttgagac tgtggagatg 1020

ctgccctcca aagctggcat ctggagggtg gagtgcctca ttggggagca cctgcatgct 1080

ggcatgagca ccctgttcct ggtctacagc aacaagtgcc agacccccct gggaatggcc 1140

tctggccaca tcagggactt ccagatcact gcctctggcc agtatggcca gtgggccccc 1200

aagctggcca ggctccacta ctctggatcc atcaatgcct ggagcaccaa ggagccattc 1260

agctggatca aagtggacct gctggccccc atgatcatcc atggcatcaa gacccagggg 1320

gccaggcaga agttctccag cctgtacatc agccagttca tcatcatgta cagcctggat 1380

ggcaagaaat ggcagaccta cagaggcaac tccactggaa cactcatggt cttctttggc 1440

aatgtggaca gctctggcat caagcacaac atcttcaacc ccccaatcat cgccagatac 1500

atcaggctgc accccaccca ctacagcatc cgcagcaccc tcaggatgga gctgatgggc 1560

tgtgacctga actcctgcag catgcccctg ggcatggaga gcaaggccat ttctgatgcc 1620

cagatcactg cctccagcta cttcaccaac atgtttgcca cctggagccc aagcaaggcc 1680

aggctgcacc tccagggaag gagcaatgcc tggaggcccc aggtcaacaa cccaaaggag 1740

tggctgcagg tggacttcca gaagaccatg aaggtcactg gggtgaccac ccagggggtc 1800

aagagcctgc tcaccagcat gtatgtgaag gagttcctga tcagctccag ccaggatggc 1860

caccagtgga ccctcttctt ccagaatggc aaggtcaagg tgttccaggg caaccaggac 1920

agcttcaccc ctgtggtgaa cagcctggac ccccccctcc tgaccagata cctgaggatt 1980

cacccccaga gctgggtcca ccagattgcc ctgaggatgg aggtcctggg atgtgaggcc 2040

caggacctgt ac 2052

<210> 5

<211> 42

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

寡核苷酸

<400> 5

agcttcagcc agaatccacc tgtcctgaaa cgccaccaga gg 42

<210> 6

<211> 7827

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 6

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cctcgagatt taaatgacgt 420

tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 480

gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg 540

ccaactccat cactaggggt tcctgagttt aaacttcgtc gacgattcga gcttgggctg 600

caggtcgagg gcactgggag gatgttgagt aagatggaaa actactgatg acccttgcag 660

agacagagta ttaggacatg tttgaacagg ggccgggcga tcagcaggta gctctagagg 720

atccccgtct gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc 780

aaggttcata tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa 840

tcagcaggtt tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat 900

aaaagcccct tcaccaggag aagccgtcac acagactagg cgcgccaccg ccaccatgca 960

gattgagctg agcacctgct tcttcctgtg cctgctgagg ttctgcttct ctgccaccag 1020

gagatactac ctgggggctg tggagctttc ttgggactac atgcagtctg acctggggga 1080

gctgcctgtg gatgccaggt tcccacccag agtgcccaaa tccttcccat tcaacacctc 1140

tgtggtctac aagaagaccc tctttgtgga gttcactgac cacctgttca acattgccaa 1200

acccaggcca ccctggatgg gactcctggg acccaccatt caggctgagg tgtatgacac 1260

tgtggtcatc accctcaaga acatggcctc ccaccctgtg agcctgcatg ctgtgggggt 1320

cagctactgg aaggcctctg agggggctga gtatgatgac cagacctccc agagggagaa 1380

ggaggatgac aaagtgttcc ctgggggcag ccacacctat gtgtggcagg tcctcaagga 1440

gaatggcccc atggcctctg acccactctg cctgacctac tcctaccttt ctcatgtgga 1500

cctggtcaag gacctcaact ctggactgat tggggccctg ctggtgtgca gggagggctc 1560

cctggccaaa gagaagaccc agaccctgca caagttcatt ctcctgtttg ctgtctttga 1620

tgagggcaag agctggcact ctgaaaccaa gaactccctg atgcaggaca gggatgctgc 1680

ctctgccagg gcctggccca agatgcacac tgtgaatggc tatgtgaaca ggagcctgcc 1740

tggactcatt ggctgccaca ggaaatctgt ctactggcat gtgattggca tggggacaac 1800

ccctgaggtg cactccattt tcctggaggg ccacaccttc ctggtcagga accacagaca 1860

ggccagcctg gagatcagcc ccatcacctt cctcactgcc cagaccctgc tgatggacct 1920

cggacagttc ctgctgttct gccacatcag ctcccaccag catgatggca tggaggccta 1980

tgtcaaggtg gacagctgcc ctgaggagcc acagctcagg atgaagaaca atgaggaggc 2040

tgaggactat gatgatgacc tgactgactc tgagatggat gtggtccgct ttgatgatga 2100

caacagccca tccttcattc agatcaggtc tgtggccaag aaacacccca agacctgggt 2160

gcactacatt gctgctgagg aggaggactg ggactatgcc ccactggtcc tggcccctga 2220

tgacaggagc tacaagagcc agtacctcaa caatggccca cagaggattg gacgcaagta 2280

caagaaagtc aggttcatgg cctacactga tgaaaccttc aagaccaggg aggccattca 2340

gcatgagtct ggcatcctgg gcccactcct gtatggggag gtgggggaca ccctgctcat 2400

catcttcaag aaccaggcct ccaggcccta caacatctac ccacatggca tcactgatgt 2460

caggcccctg tacagccgca ggctgccaaa gggggtgaaa cacctcaagg acttccccat 2520

tctgcctggg gagatcttca agtacaagtg gactgtcact gtggaggatg gaccaaccaa 2580

atctgacccc aggtgcctca ccagatacta ctccagcttt gtgaacatgg agagggacct 2640

ggcctctggc ctgattggcc cactgctcat ctgctacaag gagtctgtgg accagagggg 2700

aaaccagatc atgtctgaca agaggaatgt gattctgttc tctgtctttg atgagaacag 2760

gagctggtac ctgactgaga acattcagcg cttcctgccc aaccctgctg gggtgcagct 2820

ggaggaccct gagttccagg ccagcaacat catgcactcc atcaatggct atgtgtttga 2880

cagcctccag ctttctgtct gcctgcatga ggtggcctac tggtacattc tttctattgg 2940

ggcccagact gacttccttt ctgtcttctt ctctggctac accttcaaac acaagatggt 3000

gtatgaggac accctgaccc tcttcccatt ctctggggag actgtgttca tgagcatgga 3060

gaaccctggc ctgtggattc tgggatgcca caactctgac ttccgcaaca ggggcatgac 3120

tgccctgctc aaagtctcct cctgtgacaa gaacactggg gactactatg aggacagcta 3180

tgaggacatc tctgcctacc tgctcagcaa gaacaatgcc attgagccca ggagcttcag 3240

ccagaatcca cctgtcctga aacgccacca gagggagatc accaggacca ccctccagtc 3300

tgaccaggag gagattgact atgatgacac catttctgtg gagatgaaga aagaggactt 3360

tgacatctat gacgaggacg agaaccagag cccaaggagc ttccagaaga agaccaggca 3420

ctacttcatt gctgctgtgg agcgcctgtg ggactatggc atgagctcca gcccccatgt 3480

cctcaggaac agggcccagt ctggctctgt gccacagttc aagaaagtgg tcttccaaga 3540

gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg agcacctggg 3600

actcctgggc ccatacatca gggctgaggt ggaggacaac atcatggtga ccttccgcaa 3660

ccaggcctcc aggccctaca gcttctacag ctccctcatc agctatgagg aggaccagag 3720

gcagggggct gagccacgca agaactttgt gaaacccaat gaaaccaaga cctacttctg 3780

gaaagtccag caccacatgg cccccaccaa ggatgagttt gactgcaagg cctgggccta 3840

cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc cactcctggt 3900

ctgccacacc aacaccctga accctgccca tggaaggcaa gtgactgtgc aggagtttgc 3960

cctcttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga acatggagcg 4020

caactgcagg gccccatgca acattcagat ggaggacccc accttcaaag agaactaccg 4080

cttccatgcc atcaatggct acatcatgga caccctgcct gggcttgtca tggcccagga 4140

ccagaggatc aggtggtacc tgctttctat gggctccaat gagaacattc actccatcca 4200

cttctctggg catgtcttca ctgtgcgcaa gaaggaggag tacaagatgg ccctgtacaa 4260

cctctaccct ggggtctttg agactgtgga gatgctgccc tccaaagctg gcatctggag 4320

ggtggagtgc ctcattgggg agcacctgca tgctggcatg agcaccctgt tcctggtcta 4380

cagcaacaag tgccagaccc ccctgggaat ggcctctggc cacatcaggg acttccagat 4440

cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctcc actactctgg 4500

atccatcaat gcctggagca ccaaggagcc attcagctgg atcaaagtgg acctgctggc 4560

ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttct ccagcctgta 4620

catcagccag ttcatcatca tgtacagcct ggatggcaag aaatggcaga cctacagagg 4680

caactccact ggaacactca tggtcttctt tggcaatgtg gacagctctg gcatcaagca 4740

caacatcttc aaccccccaa tcatcgccag atacatcagg ctgcacccca cccactacag 4800

catccgcagc accctcagga tggagctgat gggctgtgac ctgaactcct gcagcatgcc 4860

cctgggcatg gagagcaagg ccatttctga tgcccagatc actgcctcca gctacttcac 4920

caacatgttt gccacctgga gcccaagcaa ggccaggctg cacctccagg gaaggagcaa 4980

tgcctggagg ccccaggtca acaacccaaa ggagtggctg caggtggact tccagaagac 5040

catgaaggtc actggggtga ccacccaggg ggtcaagagc ctgctcacca gcatgtatgt 5100

gaaggagttc ctgatcagct ccagccagga tggccaccag tggaccctct tcttccagaa 5160

tggcaaggtc aaggtgttcc agggcaacca ggacagcttc acccctgtgg tgaacagcct 5220

ggaccccccc ctcctgacca gatacctgag gattcacccc cagagctggg tccaccagat 5280

tgccctgagg atggaggtcc tgggatgtga ggcccaggac ctgtactgat gacgagcggc 5340

cgctcttagt agcagtatcg ataataaaag atctttattt tcattagatc tgtgtgttgg 5400

ttttttgtgt gttaattaag ctcgcgaagg aacccctagt gatggagttg gccactccct 5460

ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 5520

ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aagacgattt 5580

aaatgacaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 5640

tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 5700

gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 5760

tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 5820

ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 5880

cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 5940

gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 6000

tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 6060

agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 6120

tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 6180

cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 6240

ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 6300

ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 6360

ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 6420

ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc 6480

cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 6540

gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 6600

atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 6660

ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 6720

gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 6780

tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 6840

ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 6900

taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 6960

gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 7020

gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 7080

ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 7140

aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 7200

gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 7260

cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 7320

actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 7380

caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 7440

gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 7500

ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 7560

caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 7620

tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 7680

gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 7740

cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa 7800

ataggcgtat cacgaggccc tttcgtc 7827

<210> 7

<211> 4374

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 7

atgcagatcg aactgagcac ttgcttcttc ctgtgtctcc tgcgcttttg cttctccgcc 60

acaaggagat actatctcgg tgccgtggag ctcagctggg actacatgca gagcgacttg 120

ggtgaactgc ctgtggacgc caggtttcca ccccgcgtgc ccaagagttt cccgttcaac 180

accagtgtcg tgtacaagaa aaccctcttc gtggaattca ccgaccacct gttcaacatc 240

gccaaaccgc gccctccctg gatggggctg ctcggcccga cgatccaggc tgaggtctat 300

gacacggtgg tgattaccct caagaacatg gctagccacc cggtgagcct gcacgccgtg 360

ggcgtgtcct attggaaagc gtccgagggt gcggagtacg atgaccagac ttcacagcgg 420

gagaaggaag acgacaaagt gttccccggg ggttcccaca cctatgtctg gcaggtcctg 480

aaggagaatg gtcctatggc ctccgaccca ttgtgcctca cctactctta cctaagccat 540

gtggatctcg tcaaggacct gaactcgggg ctgatcggcg ccctgctcgt gtgccgggag 600

ggctcactgg ccaaggagaa gacccaaact ctgcacaagt tcatcctgct gttcgcggta 660

ttcgacgagg ggaagtcctg gcactccgag accaagaaca gcctgatgca ggaccgcgac 720

gcagcctcgg cccgtgcgtg gccaaagatg cacaccgtga acggctacgt taacaggagc 780

ctacccggcc tgatcggctg ccaccgcaaa tcggtctact ggcatgtgat cggaatgggc 840

acaacgcccg aggtccacag tatcttcctc gagggccaca ctttcctggt ccggaatcac 900

cgccaggcca gcctggagat cagccccata acctttctga cggcgcagac cttactcatg 960

gatctcggcc agttcctcct gttctgccac atttcgtccc accagcacga tgggatggaa 1020

gcatatgtga aagtggactc ctgccccgag gaaccccagc ttaggatgaa gaacaatgag 1080

gaggccgagg actacgacga tgaccttacc gattcagaaa tggacgtagt acgctttgac 1140

gacgacaact ctccatcctt catacagatt cgctccgtcg ccaagaagca ccctaagact 1200

tgggtgcact acatcgcggc cgaggaggag gactgggatt atgctcccct ggtgctggcc 1260

cccgacgacc gcagctacaa gagccagtac ctgaataacg ggccccagcg catcggccgg 1320

aagtacaaga aagtgcggtt catggcttac acggacgaga ccttcaagac ccgggaggct 1380

atccagcatg agagcggcat cttggggccc ctcctgtacg gcgaagttgg agacacactg 1440

ctgatcatct tcaagaacca ggcgagcagg ccctacaaca tctaccccca cggcattacc 1500

gatgtccggc cgttgtacag ccgacggctg cccaagggcg tgaagcacct gaaggacttt 1560

ccgatcctgc cgggcgagat cttcaagtac aagtggactg tgaccgtgga ggatgggccg 1620

accaagagcg atccgcgctg cctgacccgt tactactcca gctttgtcaa tatggagcgc 1680

gacctcgcta gcggcttgat tggccctctg ctgatctgct acaaggagtc cgtggaccag 1740

agggggaatc agatcatgag tgacaagagg aacgtgatcc tgttctccgt gttcgacgaa 1800

aaccgcagct ggtatctcac cgagaatatc cagcgcttcc tgcccaaccc ggccggtgtg 1860

cagctggagg accccgagtt tcaggccagc aacatcatgc attctatcaa cggatatgtg 1920

tttgattccc tgcagctctc agtgtgtctg cacgaggtcg cctactggta tatcctcagc 1980

attggggcac agaccgactt cctgagcgtg ttcttctccg ggtatacctt caagcacaag 2040

atggtgtacg aggataccct gaccctgttc ccctttagcg gcgaaaccgt gtttatgtct 2100

atggagaacc ccgggctctg gatccttggc tgccataact ccgacttccg caaccgcgga 2160

atgaccgcgc tcctgaaagt gtcgagttgt gacaagaaca ccggcgacta ttacgaggac 2220

agttacgagg acatctctgc gtacctcctt agcaagaata acgccatcga gccaagatcc 2280

ttcagccaga accccccagt gctgaagagg catcagcggg agatcacccg cacgaccctg 2340

cagtcggatc aggaggagat tgattacgac gacacgatca gtgtggagat gaagaaggag 2400

gacttcgaca tctacgacga agatgaaaac cagtcccctc ggtccttcca aaagaagacc 2460

cggcactact tcatcgccgc tgtggaacgc ctgtgggact atggaatgtc ttctagccct 2520

cacgttttga ggaaccgcgc ccagtcgggc agcgtgcccc agttcaagaa agtggtgttc 2580

caggagttca ccgacggctc cttcacccag ccactttacc ggggcgagct caatgaacat 2640

ctgggcctgc tgggacccta catcagggct gaggtggagg acaacatcat ggtgacattc 2700

cggaatcagg ccagcagacc atacagtttc tacagttcac tcatctccta cgaggaggac 2760

cagcgccagg gggctgaacc ccgtaagaac ttcgtgaagc caaacgaaac aaagacctac 2820

ttctggaagg tccagcacca catggcacct accaaggacg agttcgattg caaggcctgg 2880

gcctacttct ccgacgtgga cctggagaaa gatgtgcaca gcggcctgat tggccctctg 2940

ctggtgtgtc acacgaacac actcaaccct gcacacgggc ggcaggtcac tgtgcaggaa 3000

ttcgccctgt tctttaccat ctttgatgag acgaagtcct ggtatttcac cgaaaacatg 3060

gagaggaact gccgcgcacc ctgcaacatc cagatggaag atccgacatt caaggagaac 3120

taccggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct cgtgatggcc 3180

caagaccagc gtatccgctg gtatctgctg tcgatgggct ccaacgagaa catccatagt 3240

atccacttca gcgggcatgt cttcacggtg aggaaaaagg aggagtacaa gatggcactg 3300

tacaacctct atcccggcgt gttcgagacc gtggagatgc tgccctccaa ggccggcatc 3360

tggagagtgg aatgcctgat cggcgagcac ctccacgctg ggatgtccac gctgttcctc 3420

gtttacagca ataagtgcca gacccctctg ggcatggcga gcggccacat ccgcgacttc 3480

cagattacag ccagcggcca gtacggtcag tgggctccaa agctggcccg tctgcactac 3540

tccggatcca tcaacgcctg gtccaccaag gaaccgttct cctggatcaa agtagacctg 3600

ctagccccca tgatcattca cggcatcaag acacaaggcg cccgacagaa gttctcgagc 3660

ctctatatct cccagttcat catcatgtat agcctggacg gaaagaagtg gcagacttac 3720

cgcggaaact cgacagggac cctgatggta ttcttcggta acgtggacag ctccggaatc 3780

aagcacaaca tcttcaaccc acccattatc gcccgctaca tccgcctgca ccccactcac 3840

tatagcatta ggtccaccct gcgaatggag ctcatgggct gtgacctgaa cagctgtagc 3900

atgcccctcg gcatggagtc taaggcgatc tccgacgcac agataacggc atcatcctac 3960

tttaccaaca tgttcgctac ctggtccccc tccaaggccc gactccacct gcaagggaga 4020

tccaacgcct ggcggccaca ggtcaacaat cccaaggagt ggctgcaagt ggactttcag 4080

aaaactatga aagtcaccgg agtgaccaca cagggagtga agtctctgct gaccagcatg 4140

tacgtgaagg agttcctcat ctccagttcg caggatggcc accagtggac gttgttcttc 4200

caaaacggta aagtcaaagt cttccaaggg aaccaggaca gctttacacc cgtcgtgaac 4260

tccctggacc ccccgcttct cactagatac ctccgcatcc accctcagag ctgggtgcac 4320

cagattgccc tgcgcatgga ggttctgggg tgtgaagccc aggacctgta ctaa 4374

<210> 8

<211> 4374

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 8

atgcagattg agctctccac ctgcttcttt ctctgccttc ttcgcttctg cttttctgcc 60

acacgcaggt actatttggg agcagtggaa ctgagctggg attacatgca gagtgacctt 120

ggtgaacttc ctgtggacgc tcgttttcca cctagagttc ccaagtcctt ccccttcaac 180

acctcagtgg tctacaagaa aacgctgttt gtggagttca ctgaccacct cttcaacatt 240

gccaaaccaa gacccccttg gatgggattg ctgggaccca caatacaagc agaagtctac 300

gacacggtgg tgattaccct gaagaacatg gcgtcacacc ctgtttcact tcacgctgtt 360

ggggtcagtt attggaaagc ctcagagggt gcggaatacg atgatcaaac cagccagagg 420

gagaaggaag atgacaaggt ctttcctggg ggtagccata cctatgtttg gcaggtgctg 480

aaagagaatg ggcctatggc ctctgatccc ttgtgcctca catactctta cctgagtcac 540

gtcgacctgg tgaaagacct gaatagcggt ctgattggtg cactgcttgt ttgtagagag 600

gggagtttgg ccaaggagaa aactcagact ctccacaagt ttatcctcct gtttgctgtg 660

ttcgacgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca ggacagagat 720

gctgcatctg caagggcttg gccaaaaatg cacacagtga acggctatgt gaatcgatca 780

ctgccaggac tgataggctg tcatcgcaag tcagtgtatt ggcacgttat cgggatggga 840

acaactccag aagtgcacag catcttcctt gagggccaca ctttcctggt tcggaatcat 900

agacaggcca gccttgagat cagcccaatc acctttctga ctgcccaaac cttgctgatg 960

gatctgggac agttcctcct gttttgtcac atctcctccc accaacatga cgggatggag 1020

gcttatgtga aggtcgatag ctgtccggag gaaccacaac tgaggatgaa gaacaacgaa 1080

gaggcagagg actatgacga cgatctgact gacagtgaaa tggacgtggt tcggttcgac 1140

gatgacaatt ctccttcatt tatccagatc cgttccgtgg ccaagaagca ccccaagact 1200

tgggttcatt acatcgctgc tgaggaggag gattgggact acgcgccctt ggtgttggcc 1260

ccagacgatc gctcatacaa gagccagtac cttaacaatg gtccacaaag gatcggccgg 1320

aagtacaaga aggttagatt tatggcttat accgacgaga cttttaaaac tagggaagca 1380

attcagcatg aaagtggcat tcttggaccc ctgctgtatg gcgaggttgg cgacaccctg 1440

ctgattatct ttaagaacca ggcaagccgg ccctacaaca tctacccgca cggcataacc 1500

gatgtacgac ccctgtacag tcgcagactt cctaaagggg tgaaacacct gaaggacttc 1560

ccaattctgc ccggggagat cttcaagtat aaatggaccg tgacggttga ggatggtccc 1620

acaaagtccg atccgagatg ccttacccga tattattcca gcttcgtgaa catggaaagg 1680

gacctggcca gcgggctgat tggcccactg ctgatttgtt acaaggagtc tgtcgatcaa 1740

agaggaaacc aaataatgag cgacaaacgt aacgtcatcc tgttcagcgt ctttgatgag 1800

aatagaagct ggtacctcac agaaaatatt cagcggtttc tgcctaaccc cgcaggcgtc 1860

cagctggaag atcccgagtt ccaagcctca aacatcatgc atagcatcaa cggatacgta 1920

ttcgatagcc tgcagctgtc cgtctgtctc catgaagtgg catattggta catcctgagt 1980

atcggggcgc agaccgactt cctgagcgtg ttcttttctg gatacacgtt caaacacaaa 2040

atggtctatg aagataccct gactctgttt ccattctcag gagagacagt ctttatgagt 2100

atggaaaatc ctggactgtg gatcctgggc tgtcacaatt ctgattttcg gaacagaggc 2160

atgacagccc tgcttaaagt gagctcatgc gacaagaaca ccggtgatta ctacgaagat 2220

agctatgagg acatcagtgc gtatttgctc tccaagaaca acgctatcga gccacggtct 2280

ttcagtcaga atcctcccgt tctgaagcgg catcagcgcg aaataacacg cacaaccctt 2340

cagtcagacc aagaggaaat cgactacgat gatactatct ctgtggagat gaagaaggag 2400

gatttcgaca tttacgacga ggacgagaat cagtccccaa ggagctttca gaagaaaaca 2460

agacactatt tcattgccgc cgtggagcga ctgtgggact acggcatgtc tagctctccg 2520

catgtactta gaaatagggc acaaagcgga tccgtgcctc agtttaagaa agttgtcttt 2580

caggagttta cagatggctc cttcacccag cccttgtatc gcggggaact caatgaacac 2640

ctgggcctcc tgggtcctta tattagggcc gaagtcgagg acaatatcat ggtgaccttt 2700

aggaaccagg catctagacc ttactctttc tactcctccc tgatatccta tgaggaggac 2760

cagcggcaag gcgctgagcc tcggaagaac tttgtgaagc caaatgaaac caaaacatac 2820

ttttggaaag ttcagcacca catggctccc acgaaggacg aatttgactg taaagcctgg 2880

gcctacttct cagatgtaga tctcgagaaa gacgtgcact cagggctcat tggtcccctc 2940

ctggtctgtc atactaatac cctcaatcca gcacacggac gtcaggtaac cgtccaggaa 3000

tttgccctgt tctttaccat tttcgatgag actaaatcct ggtactttac cgaaaacatg 3060

gagaggaatt gcagagcccc atgcaacatc cagatggagg accctacctt caaagagaac 3120

tatcgcttcc atgccattaa cggttacatt atggatactc tcccaggact tgtgatggca 3180

caggatcagc ggataagatg gtatctgttg agcatgggct ccaacgagaa tattcacagc 3240

atccatttct ccggtcacgt gtttacagtg agaaagaaag aagagtacaa gatggctctg 3300

tataatctct atccaggcgt attcgaaacg gtggagatgt tgcctagcaa ggccggcatt 3360

tggcgagtag aatgccttat cggggaacat ctgcatgccg gaatgagcac gctcttcctg 3420

gtgtatagta acaagtgcca gactccgctg ggcatggcat ctggccatat acgggacttt 3480

cagattacgg ctagcgggca gtatgggcag tgggcaccca aacttgcgcg actgcactat 3540

tcaggctcta tcaatgcatg gtccaccaag gaacccttct cttggattaa ggtggacctt 3600

ttggcgccca tgataatcca tgggatcaaa acccagggcg ctcgtcagaa attctcatca 3660

ctctacatct ctcagttcat aataatgtat tcactggatg ggaagaaatg gcagacttac 3720

agaggaaaca gcaccgggac gctgatggtg ttctttggca acgtggacag cagcggcatc 3780

aaacacaaca tcttcaatcc tcccattatt gcccgttata ttagactgca tcccactcac 3840

tactctatac gcagcacact taggatggag ctcatgggat gcgacctgaa cagttgtagt 3900

atgcccttgg ggatggagtc caaagctata agcgacgcac aaattacagc tagctcttac 3960

tttacgaata tgttcgccac gtggagccca agcaaagccc ggctgcattt gcagggtcgg 4020

agtaatgctt ggcgcccaca ggtgaataac cctaaggaat ggttgcaagt agatttccag 4080

aaaactatga aggtaaccgg cgtcactaca cagggagtca agtccctctt gacctctatg 4140

tacgtcaagg agttcctgat tagcagcagt caggatgggc accaatggac actgttcttc 4200

cagaatggga aagttaaagt atttcagggt aaccaggact cctttacacc tgtggtgaat 4260

agcctcgacc cacccctgct gacacgatac ctccgcatcc accctcagtc ttgggtgcat 4320

caaattgccc tgcgaatgga ggtgttggga tgcgaagctc aggacctcta ctga 4374

<210> 9

<211> 4374

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 9

atgcagatcg aactctctac ttgcttcttc ctgtgccttc tgaggttctg cttctctgcc 60

actcgccgat attacctcgg ggccgtggag ttgagttggg actacatgca atcagatctg 120

ggcgaactcc ctgtggatgc ccgattccca ccgcgcgtgc ccaagtcttt cccatttaat 180

acttctgtgg tgtacaagaa gacattgttt gtggagttta ccgatcacct gttcaacatc 240

gccaaaccgc ggcccccatg gatgggtctg cttgggccca ccattcaagc ggaggtctat 300

gatacagtgg tgataacgct taagaacatg gcgagccacc cagtgtctct gcatgccgtt 360

ggtgtatcat attggaaggc cagcgaagga gcggagtacg atgaccagac ctctcagaga 420

gagaaggaag acgataaggt ttttcctggc ggaagtcata catatgtatg gcaggtcctg 480

aaagagaatg ggccgatggc ttctgacccc ctttgtctta cctatagtta tctgagccac 540

gtggacctgg tcaaggacct caacagtggt ctgattgggg ctctgcttgt ttgtagagag 600

ggtagcttgg ctaaggagaa aacccaaaca ctccataagt tcattttgct gttcgcggtg 660

ttcgacgagg gaaagagttg gcacagcgaa acaaagaatt cactgatgca agacagggac 720

gccgcttccg caagggcttg gcctaagatg catacggtga atgggtatgt gaaccggagc 780

ctcccggggc tgatcgggtg ccatcgcaag tctgtttact ggcacgtcat tggaatgggg 840

acaacgccag aggtacatag tatatttctt gaaggccaca cgttcctcgt acggaaccac 900

cgacaggctt ccctggagat aagccccatt acctttctga ccgctcagac tctgctgatg 960

gaccttggcc agtttctcct gttctgccat attagcagcc accagcacga cggtatggaa 1020

gcatacgtga aagtcgatag ctgtcctgag gagcctcagc tcagaatgaa gaacaacgag 1080

gaggccgaag actatgacga tgaccttaca gattccgaga tggacgtggt gcgctttgac 1140

gacgataaca gtcctagttt cattcaaatc agatccgtag ccaaaaagca tccaaagaca 1200

tgggtgcatt acattgcagc cgaagaggag gattgggatt atgcgcccct tgttctggct 1260

ccagatgaca ggagctataa gtcccagtac ttgaacaacg ggccacagcg aatcggtaga 1320

aaatataaga aggtaagatt catggcctac actgacgaaa catttaaaac cagggaagct 1380

atccaacacg aatctggaat tctcggccct ctgctctacg gtgaggtggg ggacaccttg 1440

ctgatcattt tcaaaaatca ggcatccagg ccttacaaca tataccccca tggcatcacc 1500

gatgtccgcc cgctgtattc cagaagactc cccaagggag tgaaacatct gaaagatttt 1560

cccatcctgc cgggcgagat ctttaaatac aaatggactg tgactgtaga ggacgggcct 1620

acaaaatcag acccacggtg cctgacaagg tattacagta gcttcgtcaa catggaacgc 1680

gacctcgcca gcggactcat tggcccactg ttgatctgtt acaaagagtc agtggatcag 1740

aggggaaatc agatcatgag cgataagaga aacgttatcc tgtttagtgt cttcgacgag 1800

aaccggtctt ggtaccttac tgagaacatc cagaggttcc tgccgaatcc ggctggcgtt 1860

cagctcgagg acccagagtt ccaggccagt aatataatgc actcaatcaa cggttatgtg 1920

ttcgatagcc tgcagctgag cgtctgcctc cacgaggtag cctattggta catattgtcc 1980

atcggggctc agaccgattt tctgtccgtg ttctttagcg ggtatacctt taaacataaa 2040

atggtctatg aagacaccct gaccctgttc ccattctccg gtgagactgt gttcatgtcc 2100

atggagaacc cagggctgtg gatcctgggg tgtcacaata gtgactttag gaatcgggga 2160

atgacggcac tgctgaaggt gagttcttgc gataaaaata caggagatta ctatgaggat 2220

agttacgagg atatcagtgc ctatctgctt tcaaaaaaca acgcaattga gccccggtct 2280

ttctcacaaa accccccggt gctgaagcgc caccagcgcg aaattacccg gacaaccttg 2340

cagtccgacc aggaggaaat cgattatgac gatactatca gtgtagaaat gaaaaaggag 2400

gattttgata tttacgacga agacgagaac cagtctccgc gaagttttca gaagaaaacg 2460

cgacactact ttatagctgc cgtggaacga ctctgggatt atggcatgtc ctccagccct 2520

catgtcctta ggaatcgagc gcagagtggc tctgtgcctc agttcaaaaa ggttgtgttc 2580

caggaattca ccgacggctc atttacccag ccgctgtaca gaggcgaact caacgaacac 2640

cttgggctgc ttgggccata tattcgagca gaggtggaag ataatatcat ggtaaccttt 2700

agaaaccagg cgtcaagacc ctattccttc tacagttctc tgatcagcta cgaggaggac 2760

caaagacagg gagctgaacc caggaagaac tttgtgaaac ctaatgagac caagacctac 2820

ttctggaagg tccagcacca tatggcccca actaaagatg aattcgattg caaggcctgg 2880

gcttatttca gcgacgtgga tctcgaaaag gatgtgcaca gcgggttgat cggaccgctt 2940

ttggtgtgcc acacaaatac cctcaatcct gcccacgggc ggcaggtcac agttcaagag 3000

tttgcactct tctttacaat atttgacgag acaaagtcat ggtattttac agagaatatg 3060

gagagaaatt gtcgcgcacc ttgcaacatt cagatggagg accccacatt taaggagaat 3120

tacagatttc atgctatcaa tgggtacatt atggatactc tgcctggtct ggtcatggcc 3180

caggatcagc gcataaggtg gtacttgctg agcatgggat ctaatgagaa tatacacagc 3240

attcacttca gtggccacgt ttttactgtt agaaagaagg aggagtacaa aatggcgctc 3300

tacaaccttt acccgggtgt gtttgagaca gtggagatgc tgccaagcaa ggcaggcatc 3360

tggagggttg agtgtcttat tggggagcat ctgcatgctg gaatgtccac cctctttctt 3420

gtgtacagca ataagtgcca gacaccgctt ggcatggcca gcggccacat tagggacttt 3480

cagataactg ccagtggaca gtacggccag tgggctccca agcttgcaag actccactac 3540

tccggaagca taaacgcatg gagcaccaag gaacccttct cttggattaa ggtggacctg 3600

ctggcgccaa tgatcattca cggcataaaa acccaagggg cacgacagaa attttcatct 3660

ttgtatatta gtcagtttat catcatgtac agcttggatg gaaagaagtg gcagacgtac 3720

aggggcaatt ctacaggaac acttatggtg ttttttggga atgtcgattc cagcgggatc 3780

aaacataaca tcttcaatcc tcctattatc gcccgatata tccgcctgca ccctacgcat 3840

tactccatca ggtccacatt gagaatggaa ctgatggggt gcgacctgaa tagttgtagt 3900

atgccactgg gcatggagtc taaagccatc agcgatgcac agatcactgc cagctcttac 3960

ttcaccaaca tgtttgcaac ttggtccccc tctaaagctc gcctgcatct gcagggacgc 4020

tcaaatgcat ggcgaccaca ggtgaacaat ccaaaagagt ggctccaggt cgactttcag 4080

aagacaatga aggtaacagg agtgacaacc cagggtgtaa aaagcctcct tacgagtatg 4140

tacgttaagg agtttctgat ttctagctcc caggacggac accagtggac tctgttcttc 4200

cagaacggca aagtgaaggt atttcaggga aaccaggatt cttttacccc ggtagtgaat 4260

agcctggatc caccgttgct gacccgctat ctgagaattc atccacaatc ctgggtgcat 4320

cagattgccc tccggatgga agtgctcggc tgtgaagctc aggatctgta ttag 4374

<210> 10

<211> 4374

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 10

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280

ttctcccaga atccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340

cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400

gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460

cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520

catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580

caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640

ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700

agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760

cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820

ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880

gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940

ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000

tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060

gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120

tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180

caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240

attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300

tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360

tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420

gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480

cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540

tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600

ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660

ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720

cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780

aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840

tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900

atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960

tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020

agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080

aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140

tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200

cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260

tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320

cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctga 4374

<210> 11

<211> 4374

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

多核苷酸

<400> 11

atgcagatcg agctgtccac atgctttttt ctgtgcctgc tgcggttctg cttcagcgcc 60

acccggcggt actacctggg cgccgtggag ctgtcctggg actacatgca gagcgacctg 120

ggcgagctgc ccgtggacgc ccggttcccc cccagagtgc ccaagagctt ccccttcaac 180

accagcgtgg tgtacaagaa aaccctgttc gtggagttca ccgaccacct gttcaacatc 240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360

ggcgtgagct actggaaggc ctccgagggc gccgagtacg acgaccagac cagccagcgg 420

gagaaagagg acgacaaagt ctttcctggc ggcagccaca cctacgtgtg gcaggtcctg 480

aaagaaaacg gccccatggc ctccgacccc ctgtgcctga cctacagcta cctgagccac 540

gtggacctgg tgaaggacct gaacagcggg ctgattgggg ccctgctggt ctgccgggag 600

ggcagcctgg ccaaagagaa aacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgggac 720

gccgcctctg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacagaagc 780

ctgcccggcc tgattggctg ccaccggaag agcgtgtact ggcacgtgat cggcatgggc 840

accacacccg aggtgcacag catctttctg gaagggcaca cctttctggt gcggaaccac 900

cggcaggcca gcctggaaat cagccctatc accttcctga ccgcccagac actgctgatg 960

gacctgggcc agttcctgct gttttgccac atcagctctc accagcacga cggcatggaa 1020

gcctacgtga aggtggactc ctgccccgag gaaccccagc tgcggatgaa gaacaacgag 1080

gaagccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcggttcgac 1140

gacgacaaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc 1200

tgggtgcact acatcgccgc cgaggaagag gactgggact acgcccccct ggtgctggcc 1260

cccgacgaca gaagctacaa gagccagtac ctgaacaatg gcccccagcg gatcggccgg 1320

aagtacaaga aagtgcggtt catggcctac accgacgaga ccttcaagac ccgggaggcc 1380

atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaagtggg cgacacactg 1440

ctgatcatct tcaagaacca ggccagccgg ccctacaaca tctaccccca cggcatcacc 1500

gacgtgcggc ccctgtacag caggcggctg cccaagggcg tgaagcacct gaaggacttc 1560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc 1620

accaagagcg accccagatg cctgacccgg tactacagca gcttcgtgaa catggaacgg 1680

gacctggcct ccgggctgat cggacctctg ctgatctgct acaaagaaag cgtggaccag 1740

cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgatgag 1800

aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaaccc tgccggggtg 1860

cagctggaag atcccgagtt ccaggccagc aacatcatgc actccatcaa tggctacgtg 1920

ttcgacagcc tgcagctgtc cgtgtgtctg cacgaggtgg cctactggta catcctgagc 1980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 2040

atggtgtacg aggacaccct gaccctgttc cctttcagcg gcgagaccgt gttcatgagc 2100

atggaaaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg gaaccggggc 2160

atgaccgccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac 2220

agctacgagg atatcagcgc ctacctgctg tccaagaaca acgccatcga gcccagaagc 2280

ttcagccaga acccccctgt gctgaagcgg caccagagag agatcacccg gaccaccctg 2340

cagtccgacc aggaagagat cgattacgac gacaccatca gcgtggagat gaaaaaagaa 2400

gatttcgaca tctacgacga ggacgagaac cagagccccc ggtccttcca gaagaaaacc 2460

cggcactact ttatcgccgc cgtggagcgg ctgtgggact acggcatgag cagcagcccc 2520

cacgtgctgc ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc 2580

caggaattca ccgacggcag cttcacccag cccctgtacc ggggcgagct gaacgagcac 2640

ctggggctgc tggggcccta catcagggcc gaagtggagg acaacatcat ggtgaccttc 2700

cggaatcagg ccagcagacc ctactccttc tacagcagcc tgatcagcta cgaagaggac 2760

cagcggcagg gcgctgaacc ccggaagaac ttcgtgaagc ccaatgagac caagacctac 2820

ttctggaaag tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880

gcctacttca gcgacgtgga tctggaaaag gacgtgcact ctggactgat tggccctctg 2940

ctggtgtgcc acaccaacac cctgaacccc gcccacggcc ggcaggtgac cgtgcaggaa 3000

ttcgccctgt tcttcaccat cttcgacgag accaagtcct ggtacttcac cgagaatatg 3060

gaacggaact gcagagcccc ctgcaacatc cagatggaag atcctacctt caaagagaac 3120

taccggttcc acgccatcaa cggctacatc atggacaccc tgcctggcct ggtgatggcc 3180

caggaccaga ggatccggtg gtatctgctg tccatgggca gcaacgagaa tatccacagc 3240

atccacttca gcggccacgt gttcaccgtg aggaagaaag aagagtacaa gatggccctg 3300

tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc 3360

tggcgggtgg agtgtctgat cggcgagcac ctgcatgccg ggatgagcac cctgtttctg 3420

gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgggacttc 3480

cagatcaccg cctccggcca gtacggccag tgggccccca agctggcccg gctgcactac 3540

agcggcagca tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg 3600

ctggccccta tgatcatcca cggcattaag acccagggcg ccaggcagaa gttcagcagc 3660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720

cggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780

aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tccggctgca ccccacccac 3840

tacagcatca gatccaccct gcggatggaa ctgatgggct gcgacctgaa ctcctgcagc 3900

atgcctctgg gcatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac 3960

ttcaccaaca tgttcgccac ctggtccccc tccaaggcca ggctgcacct gcagggccgg 4020

tccaacgcct ggcggcctca ggtgaacaac cccaaagaat ggctgcaggt ggactttcag 4080

aaaaccatga aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct gaccagcatg 4140

tacgtgaaag agtttctgat cagcagcagc caggacggcc accagtggac cctgttcttt 4200

cagaacggca aggtgaaagt gttccagggc aaccaggact ccttcacccc cgtggtgaac 4260

tccctggacc cccccctgct gacccgctac ctgcggatcc acccccagtc ttgggtgcac 4320

cagatcgccc tgaggatgga agtgctggga tgtgaggccc aggatctgta ctga 4374

<210> 12

<211> 2351

<212> PRT

<213> 智人(Homo sapiens)

<400> 12

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro

755 760 765

Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp

770 775 780

Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys

785 790 795 800

Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser

805 810 815

Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr

820 825 830

Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn

835 840 845

Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly

850 855 860

Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu

865 870 875 880

Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys

885 890 895

Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn

900 905 910

Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met

915 920 925

Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys

930 935 940

Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu

945 950 955 960

Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu

965 970 975

Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe

980 985 990

Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala

995 1000 1005

Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser

1010 1015 1020

Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser

1025 1030 1035

Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu

1040 1045 1050

Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg

1055 1060 1065

Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met

1070 1075 1080

Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln

1085 1090 1095

Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met

1100 1105 1110

Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile

1115 1120 1125

Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro

1130 1135 1140

Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu

1145 1150 1155

Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys

1160 1165 1170

Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro

1175 1180 1185

Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu

1190 1195 1200

Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu

1205 1210 1215

Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile

1220 1225 1230

His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu

1235 1240 1245

Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr

1250 1255 1260

Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn

1265 1270 1275

Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu

1280 1285 1290

Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu

1295 1300 1305

Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln

1310 1315 1320

Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg

1325 1330 1335

Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp

1340 1345 1350

Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro

1355 1360 1365

Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala

1370 1375 1380

Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser

1385 1390 1395

Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser

1400 1405 1410

Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe

1415 1420 1425

Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys

1430 1435 1440

Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys

1445 1450 1455

Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly

1460 1465 1470

Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser

1475 1480 1485

Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp

1490 1495 1500

Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His

1505 1510 1515

Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser

1520 1525 1530

Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr

1535 1540 1545

Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val

1550 1555 1560

Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser

1565 1570 1575

Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln

1580 1585 1590

Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys

1595 1600 1605

Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys

1610 1615 1620

Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys

1625 1630 1635

Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg

1640 1645 1650

Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu

1655 1660 1665

Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr

1670 1675 1680

Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile

1685 1690 1695

Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys

1700 1705 1710

Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr

1715 1720 1725

Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser

1730 1735 1740

Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr

1745 1750 1755

Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu

1760 1765 1770

His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp

1775 1780 1785

Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser

1790 1795 1800

Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly

1805 1810 1815

Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr

1820 1825 1830

Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu

1835 1840 1845

Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu

1850 1855 1860

Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His

1865 1870 1875

Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln

1880 1885 1890

Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp

1895 1900 1905

Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn

1910 1915 1920

Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His

1925 1930 1935

Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met

1940 1945 1950

Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser

1955 1960 1965

Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr

1970 1975 1980

Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr

1985 1990 1995

Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly

2000 2005 2010

Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly

2015 2020 2025

Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro

2030 2035 2040

Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala

2045 2050 2055

Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His

2060 2065 2070

Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser

2075 2080 2085

Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile

2090 2095 2100

Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser

2105 2110 2115

Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr

2120 2125 2130

Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn

2135 2140 2145

Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile

2150 2155 2160

Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg

2165 2170 2175

Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys

2180 2185 2190

Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln

2195 2200 2205

Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser

2210 2215 2220

Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp

2225 2230 2235

Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe

2240 2245 2250

Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys

2255 2260 2265

Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser

2270 2275 2280

Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys

2285 2290 2295

Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val

2300 2305 2310

Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His

2315 2320 2325

Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu

2330 2335 2340

Gly Cys Glu Ala Gln Asp Leu Tyr

2345 2350

<210> 13

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的描述:合成

<400> 13

Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg

1 5 10

<210> 14

<211> 24

<212> PRT

<213> 猪属(Sus sp.)

<400> 14

Ser Phe Ala Gln Asn Ser Arg Pro Pro Ser Ala Ser Ala Pro Lys Pro

1 5 10 15

Pro Val Leu Arg Arg His Gln Arg

20

<210> 15

<211> 16

<212> PRT

<213> 猪属(Sus sp.)

<400> 15

Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg Tyr Arg Arg Gly

1 5 10 15

100页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:抗-MUC1抗体

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!