Dna结合结构域反式激活因子及其用途

文档序号：1894611 发布日期：2021-11-26 浏览：9次 >En<

阅读说明：本技术 Dna结合结构域反式激活因子及其用途 (DNA binding domain transactivating factor and its use ) 是由 M·S·埃斯特维斯 S·A·沃尔夫于 2020-02-24 设计创作，主要内容包括：在一些方面,本公开涉及包含编码包含DNA结合结构域和转录调控子结构域的融合蛋白的核酸的重组腺相关病毒(rAAV)及其使用方法。在一些实施方案中,所述融合蛋白的表达导致细胞中靶基因的修饰的表达。(In some aspects, the disclosure relates to recombinant adeno-associated viruses (rAAV) comprising a nucleic acid encoding a fusion protein comprising a DNA-binding domain and a transcriptional regulator domain and methods of use thereof. In some embodiments, expression of the fusion protein results in modified expression of the target gene in the cell.)

DNA结合结构域反式激活因子及其用途

相关申请

本申请根据35U.S.C.§119(e)要求标题为“ZINC FINGER PROTEINTRANSACTIVATORS AND USES THEREOF”且于2019年2月25日提交的美国临时申请序列号62/810,005的申请日的权益，其全部内容以引用的方式并入本文。

背景技术

靶基因表达的调控已作为生物医学研究的主要领域而出现。基因表达的上调可纠正因基因表达降低而导致的单倍体不足(haploinsufficient)病状。当基因的至少一个拷贝中存在一个或多个功能丧失突变时，通常会导致单倍体不足。用于治疗与单倍体不足相关的疾病的基于AAV的基因增强方法受到传统rAAV载体的包装能力的阻碍。

发明内容

本公开的方面涉及用于基因递送的分离的核酸和重组AAV载体。本公开部分地基于用于调控靶基因表达的组合物(例如，rAAV载体和rAAV)和方法，其中靶基因是单倍体不足的，诸如SCN1A。在一些实施方案中，本公开提供包含DNA结合结构域(诸如Cys2-His2锌指蛋白(ZFP))和转录调控子结构域的融合蛋白。在一些实施方案中，本公开描述的组合物包含含有融合至转录调控子结构域的DNA结合结构域(例如，ZFP、转录激活因子样效应物(TALE)结构域等)的融合蛋白。在一些实施方案中，本公开描述的融合蛋白增加靶基因(例如，SCN1A)的表达，并因此可用于治疗与正常细胞或受试者相比，细胞或受试者中以靶基因表达缺陷为特征的疾病(例如，与靶基因的单倍体不足相关的疾病)。

因此，在一些方面，本公开提供一种分离的核酸，其包含被配置来表达融合至至少一个转录调控子结构域的至少一个DNA结合结构域的转基因，其中DNA结合结构域结合至靶基因或靶基因(例如，在受试者或细胞中)的调控区(例如，增强子序列、启动子序列、阻遏子序列等)，其中靶基因编码电压门控钠通道(例如，Na_v1.1)。在一些实施方案中，靶基因为SCN1A基因。在一些实施方案中，转基因的侧翼为腺相关病毒(AAV)反向末端重复序列(ITR)。在一些实施方案中，至少一个DNA结合结构域结合靶基因(例如，在受试者或细胞中)，并且转录调控子结构域修饰(例如，上调)靶基因的表达。

在一些方面，本公开提供一种重组AAV(rAAV)，其包含：核酸，所述核酸包含编码融合至至少一个转录调控子结构域的至少一个DNA结合结构域，其中DNA结合结构域结合至靶基因或靶基因(例如，在受试者或细胞中)的调控区，其中靶基因编码电压门控钠通道(例如，Nav1.1)；以及至少一种衣壳蛋白。在一些实施方案中，靶基因为SCN1A基因。在一些实施方案中，转基因的侧翼为AAV反向末端重复序列(ITR)。

在一些实施方案中，至少一个DNA结合结构域结合靶基因(例如，在受试者或细胞中)，并且转录调控子结构域修饰(例如，上调)受试者中靶基因的表达。

在一些实施方案中，至少一个DNA结合结构域结合到靶基因的非翻译区。在一些实施方案中，DNA结合结构域结合到靶基因的调控区，任选地增强子序列、启动子序列和/或阻遏子序列。

在一些实施方案中，DNA结合结构域结合在靶基因的调控区(例如，增强子序列、启动子序列和/或阻遏子序列等)的上游2bp与2000bp或上游或下游2bp与2000bp之间。

在一些实施方案中，至少一个DNA结合结构域编码锌指蛋白(ZFP)、转录激活因子样效应物(TALE)、dCas蛋白(例如，dCas9或dCas12a)和/或同源结构域(homeodomain)。在一些实施方案中，至少一个DNA结合结构域结合到SEQ ID NO:5-7中的任一个中列出的核酸序列。在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含由具有SEQ ID NO：11-16、23-28或35-40中的任一个中列出的序列的核酸编码的识别螺旋。在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含SEQ ID NO：17-22、29-34或41-46中的任一个中列出的氨基酸序列。

在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含由包含SEQ IDNO：11的核酸编码的识别螺旋、由包含SEQ ID NO：12的核酸编码的识别螺旋、由包含SEQ IDNO:13的核酸编码的识别螺旋、由包含SEQ ID NO:14的核酸编码的识别螺旋、由包含SEQ IDNO：15的核酸编码的识别螺旋和/或由包含SEQ ID NO：16的核酸编码的识别螺旋。在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含SEQ ID NO：57的氨基酸序列。在一些实施方案中，结合到SCN1A基因的ZFP包含与SEQ ID NO:57的氨基酸序列至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％或至少99％的序列同一性。

在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含由包含SEQ IDNO:23的核酸编码的识别螺旋、由包含SEQ ID NO:24的核酸编码的识别螺旋、由包含SEQ IDNO:25的核酸编码的识别螺旋、由包含SEQ ID NO:26的核酸编码的识别螺旋、由包含SEQ IDNO：27的核酸编码的识别螺旋和/或由包含SEQ ID NO：28的核酸编码的识别螺旋。在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含SEQ ID NO：59的氨基酸序列。在一些实施方案中，结合到SCN1A基因的ZFP包含与SEQ ID NO:59的氨基酸序列至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％或至少99％的序列同一性。

在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含由包含SEQ IDNO：35的核酸编码的识别螺旋、由包含SEQ ID NO：36的核酸编码的识别螺旋、由包含SEQ IDNO：37的核酸编码的识别螺旋、由包含SEQ ID NO：38的核酸编码的识别螺旋、由包含SEQ IDNO:39的核酸编码的识别螺旋和/或由包含SEQ ID NO:40的核酸编码的识别螺旋。在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含SEQ ID NO:61的氨基酸序列。在一些实施方案中，结合到SCN1A基因的ZFP包含与SEQ ID NO：61的氨基酸序列至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％或至少99％的序列同一性。

在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含含SEQ ID NO:17的氨基酸序列的识别螺旋、含SEQ ID NO:18的氨基酸序列的识别螺旋、含SEQ ID NO:19的氨基酸序列的识别螺旋、含SEQ ID NO:20的氨基酸序列的识别螺旋、含SEQ ID NO:21的氨基酸序列的识别螺旋和/或含SEQ ID NO:22的氨基酸序列的识别螺旋。

在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含含SEQ ID NO:29的识别螺旋、含SEQ ID NO:30的识别螺旋、含SEQ ID NO:31的识别螺旋、含SEQ ID NO:32的识别螺旋、含SEQ ID NO:33的识别螺旋和/或含SEQ ID NO:34的识别螺旋。

在一些实施方案中，至少一个DNA结合结构域为锌指蛋白，其包含含SEQ ID NO:41的识别螺旋、含SEQ ID NO:42的识别螺旋、含SEQ ID NO：43的识别螺旋、含SEQ ID NO:44的识别螺旋、含SEQ ID NO:45的识别螺旋和/或含SEQ ID NO:46的识别螺旋。

在一些实施方案中，至少一个DNA结合结构域为催化失活的CRISPR相关蛋白(Cas蛋白)。在一些实施方案中，催化失活的Cas蛋白(或“死亡Cas蛋白”)为dCas9或dCas12蛋白。在一些实施方案中，核酸或rAAV还包含至少一种指导核酸(例如，指导RNA或gRNA)。在一些实施方案中，指导核酸包含靶向SCN1A的间隔区序列。在一些实施方案中，指导核酸包含具有SEQ ID NO:85、86、89、90、93或94中的任一个的核苷酸序列的间隔区序列。在一些实施方案中，指导核酸包含具有SEQ ID NO:83-94中的任一个的核苷酸序列。在一些实施方案中，指导核酸由SEQ ID NO:83-94中的任一个列出的核酸序列编码。

在一些实施方案中，至少一个转录调控子结构域为包含VP16结构域、VP64结构域、Rta结构域、p65结构域、Hsf1结构域或其任何组合的反式激活因子结构域，诸如VPR结构域(VP64+p65+Rta1结构域)。在一些实施方案中，至少一个转录调控子结构域由如SEQ ID NO:47中列出的核酸序列编码。在一些实施方案中，至少一个反式激活结构域包含SEQ ID NO：48中列出的氨基酸序列。

在一些实施方案中，位于转基因侧翼的ITR包含选自由以下组成的组的ITR：AAV1ITR、AAV2 ITR、AAV3 ITR、AAV4 ITR、AAV5 ITR、AAV6 ITR、AAV8 ITR、AAVrh8 ITR、AAV9ITR、AAV10 ITR或AAVrh10 ITR。在一些实施方案中，ITR为ΔTR或mTR。

在一些实施方案中，分离的核酸的转基因可操作地连接到启动子。在一些实施方案中，启动子为组织特异性启动子。在一些实施方案中，组织特异性启动子为神经元启动子，诸如SST、NYP、磷酸激活的谷氨酰胺酶(PAG)、囊泡谷氨酸转运蛋白-1(VGLUT1)、谷氨酸脱羧酶65和57(GAD65、GAD67)、突触蛋白I、a-CamKII、Dock10、Prox1、小白蛋白(PV)、生长抑素(SST)、胆囊收缩素(CCK)、钙视网膜蛋白(CR)或神经肽Y(NPY)。

在一些实施方案中，转基因的DNA结合结构域通过接头结构域与转录调控子结构域融合。在一些实施方案中，接头结构域为柔性接头，例如富含甘氨酸的接头或甘氨酸-丝氨酸接头；或可裂解的接头，诸如可光裂解的接头或酶(例如，蛋白酶)可裂解的接头。

在一些实施方案中，分离的核酸包含编码多个DNA结合结构域(例如，1、2、3、4、5、6、7、8、9或10个DNA结合结构域)的转基因。在一些实施方案中，分离的核酸包含编码多个转录调控子结构域(例如，1、2、3、4、5、6、7、8、9或10个转录调控子结构域)的转基因。

在一些实施方案中，分离的核酸或rAAV在特征在于相对于正常细胞或受试者，靶基因的异常表达或单倍体不足(例如，表达增加或表达减少)的细胞或受试者中表达。在一些实施方案中，分离的核酸或rAAV在特征在于相对于正常细胞或受试者，靶基因的表达不足(例如，减少)的细胞或受试者中表达。在一些实施方案中，分离的核酸或rAAV的靶基因为SCN1A。

在一些实施方案中，AAV衣壳血清型选自由以下组成的组：AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAV9、AAV10、AAVrh10或AAV.PHPB。

在一些方面，本公开提供了调控靶基因表达的方法。在一些实施方案中，本公开的方法包括向表达靶基因的细胞或受试者施用如本文所述的分离的核酸或rAAV，其中所述受试者对靶基因单倍体不足(例如，对SCN1A单倍体不足)。例如，在一些实施方案中，靶基因(诸如SCN1A)在所述细胞或受试者中的表达相对于正常细胞或受试者中的靶基因表达是缺陷的(例如，减少)。在一些实施方案中，向其施用分离的核酸或rAAV的细胞为神经元。在一些实施方案中，神经元为GABA能神经元。

在一些实施方案中，施用分离的核酸或rAAV导致靶基因表达(例如，SCN1A表达)相对于未施用分离的核酸或rAAV的受试者增加至少2倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。在一些实施方案中，施用分离的核酸或rAAV导致靶基因表达(例如，SCN1A表达)相对于施用分离的核酸或rAAV之前受试者中的靶基因(例如，SCN1A)表达增加至少2倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。

在一些方面，本公开提供了一种调控受试者中的基因表达(例如，SCN1A的表达)的方法，其中将如本文所述的分离的核酸或rAAV施用于表达靶基因的受试者。在一些实施方案中，相对于健康受试者，受试者中靶基因的表达是异常的(例如，增加或减少)。在一些实施方案中，相对于健康受试者，受试者关于靶基因的表达是或疑似是单倍体不足的。

在一些实施方案中，受试者患有或疑似患有由靶基因的单倍体不足表达引起的疾病或病状。例如，在一些实施方案中，对于SCN1A表达单倍体不足的受试者患有德拉韦综合征(Dravet syndrome)。在一些实施方案中，通过静脉内注射、肌肉内注射、吸入、皮下注射和/或颅内注射向受试者施用分离的核酸或rAAV。

在一些方面，本公开提供了一种包含如本公开所述的分离的核酸或rAAV的组合物。在一些实施方案中，组合物包含药学上可接受的载剂。

在一些方面，本公开提供了一种包含容纳如本公开所述的分离的核酸或rAAV的容器的试剂盒。在一些实施方案中，试剂盒包含容纳药学上可接受的载剂的容器。在一些实施方案中，分离的核酸或rAAV和药学上可接受的载剂容纳在同一容器中。在一些实施方案中，容器为注射器。

在一些方面，本公开提供了一种包含如本公开所述的分离的核酸或rAAV的宿主细胞。在一些实施方案中，宿主细胞为真核细胞。在一些实施方案中，宿主细胞为哺乳动物细胞。在一些实施方案中，宿主细胞为人细胞，任选地为神经元，例如GABA能神经元。

附图说明

图1示出了表明人(HEK)与小鼠(HEPG2)SCN1A基因之间的序列保守性的色谱测序数据(共有序列–SEQ ID NO:98；靶序列–SEQ ID NO:99；Hep-SCN1A_R4序列(顶部)–SEQ IDNO:100；Hep-SCN1A_R4序列(底部)–SEQ ID NO:101

图2示出了人(SEQ ID NO:1)和小鼠(SEQ ID NO:2)SCN1A基因的近端启动子区的序列比对，其中突出显示了保守序列。在此保守序列中的是锌指蛋白(ZFP)结合区的关注的靶区，其以粗体显示(SEQ ID NO:4)。

图3是示出SCN1A基因近端启动子区中三个重叠靶ZFP(ZFP-1、ZFP-2、ZFP-3)(SEQID NO：5-7)结合位点的位置(SEQ ID NO：3)的示意图。

图4A至图4D示出了ZFP-1中单个锌指(指1至指6；F1-F6)的六个识别螺旋序列的比对，其将识别SCN1A基因(SEQ ID NO:2)的近端启动子区内的单独的三个碱基区(以红色表示的DNA三联体，通过“·”分隔)。图4A突出显示了ZFP-1的锌指1至6(F1-F6)将结合的核苷酸序列(SEQ ID NO：3)。图4B示出了由ZFP-1(SEQ ID NO:17-22)的指1至6的每个识别螺旋(七个氨基酸)识别的三个核苷酸序列。图4C示出了ZFP-1的氨基酸序列，其含有6个指，每行一个，其中指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列(SEQID NO：65-70)。图4D示出了ZFP-1(F1-F6)(SEQ ID NO：102-107)的核苷酸序列。

图5A至图5D示出了ZFP-2中单个锌指(指1至指6；F1-F6)的六个识别螺旋序列的比对，其将识别SCN1A基因(SEQ ID NO:3)的近端启动子区内的单独的三个碱基区(以红色表示的DNA三联体，通过“*”分隔)。图5A突出显示了ZFP-2的锌指1至6(F1-F6)将结合的核苷酸序列(SEQ ID NO:3)。图5B示出了由ZFP-2(SEQ ID NO:29-34)的指1至6的每个识别螺旋(七个氨基酸)识别的前三个核苷酸。图5C示出了ZFP-2的氨基酸序列，其含有6个指，每行一个(SEQ ID NO:69-74)，其中指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。图5D示出了ZFP-2(F1-F6)(SEQ ID NO:108-113)的核苷酸序列。

图6A至图6D示出了ZFP-3中单个锌指(指1至指6；F1-F6)的六个识别螺旋序列的比对，其将识别SCN1A基因(SEQ ID NO:4)的近端启动子区内的单独的三个碱基区(以红色表示的DNA三联体，通过“*”分隔)。图6A突出显示了ZFP-3的锌指1至6(F1-F6)将结合的核苷酸序列(SEQ ID NO：3)。图6B示出了由ZFP-3(SEQ ID NO:41-46)的指1至6的每个识别螺旋(七个氨基酸)识别的前三个核苷酸。图6C示出了ZFP-3的氨基酸序列，其含有6个指，每行一个(SEQ ID NO：75-80)，其中指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。图6D示出了ZFP-3(F1-F6)(SEQ ID NO：114-119)的核苷酸序列。

图7示出了表明如通过定量实时聚合酶链反应(qRT-PCR)所测量，图4至图6中所述的SCN1A结合ZFP增加HEK293T细胞中的SCN1A基因表达的数据。通过瞬时转染编码以下转录调控因子的表达质粒来将这些表达构建体递送至细胞：酿脓链球菌(Streptococcuspyogenes)Cas9+SCN1A指导RNA(SpCas9+Scn1a)；无核酸内切酶活性的Cas9(dCas9)；VPR激活结构域+SCN1A指导RNA(dCas9_VPR+Scn1a)；VPR激活结构域+ZFP1(VPR_ZFP1)；VPR激活结构域+ZPF2(VPR_ZFP2)；VPR激活结构域+ZFP3(VPR_ZFP3)；SpCas9+ASCL1指导RNA(SpCas9+Ascl1)；三个VPR_ZFP(VPR_ZFP1+VPR_ZFP2+VPR_ZFP3)。将表达水平归一化为每个样品中通过qRT-PCR确定的TBP表达水平。

图8示出了表明如通过定量实时聚合酶链反应(qRT-PCR)所测量，图4至图6中所述的SCN1A结合ZFP以及Cas9+SCN1A指导RNA增加HEK293T细胞中的SCN1A基因表达的数据。

具体实施方式

本公开的方面涉及用于调控(例如，增加)细胞或受试者中靶基因的表达的方法和组合物，其中靶基因为单倍体不足的(即，靶基因包含一个功能拷贝)。在一些实施方案中，靶基因为SCN1A。

在一些实施方案中，本公开提供包含DNA结合结构域(诸如ZFP)和转录调控子结构域的融合蛋白。在一些实施方案中，本公开提供包含DNA结合结构域(诸如ZFP)和反式激活因子结构域(例如，VPR结构域)的融合蛋白。在一些实施方案中，DNA结合蛋白结合到靶基因序列或靶基因的调控区。在一些实施方案中，调控区为增强子序列、启动子序列或阻遏子序列。在一些实施方案中，启动子序列可为内部启动子(例如，位于靶基因的内含子中)或外部启动子(例如，位于靶基因的转录起始位点的上游)。在一些实施方案中，本文所述的融合蛋白的DNA结合结构域结合靶基因(例如，SCN1A)的启动子区中的保守序列，因此反式激活因子结构域增加基因表达。

在一些方面，本公开涉及用于增加细胞或受试者中靶基因(例如，SCN1A)的表达的方法。在一些实施方案中，靶基因含有使细胞或受试者对靶基因单倍体不足的突变。因此，在一些实施方案中，本公开的方法和组合物可用于治疗与靶基因产物的单倍体不足相关的疾病和病症，例如德拉韦综合征，其通常是由于SCN1A基因的一个拷贝中的突变导致电压门控钠通道α亚基Nav1.1的单倍体不足所致。

反式激活因子融合蛋白

本公开的一些方面涉及包含DNA结合结构域(DBD)和反式激活因子结构域的融合蛋白。如本文所用，融合蛋白包含由两个或更多个单独的氨基酸序列编码的两个或更多个连接多肽。如本文所用，嵌合蛋白为融合蛋白，其中两个或更多个连接基因来自不同物种。融合蛋白通常是重组产生的，其中编码融合蛋白的基因位于支持两个或更多个连接基因表达和将所得mRNA翻译成重组蛋白的系统中。在一些实施方案中，融合蛋白在原核或真核细胞中重组产生。融合蛋白可以多种排列构造。例如，一种蛋白质(蛋白质A)位于第二种蛋白质(蛋白质B)的上游。在其他融合蛋白构型中，蛋白质B位于蛋白质A的上游。在一些实施方案中，编码DNA结合结构域的核酸序列位于编码反式激活因子结构域的核酸序列的上游，并产生包含连接到反式激活因子的DBD的融合蛋白。在一些实施方案中，编码反式激活因子结构域的核酸序列位于编码DNA结合结构域的核酸序列的上游，并产生包含连接到DNA结合结构域的反式激活因子结构域的融合蛋白。在一些实施方案中，融合蛋白包含位于DNA结合结构域上游的反式激活因子结构域。在一些实施方案中，融合蛋白包含位于反式激活因子结构域上游的DNA结合结构域。

在一些实施方案中，本公开所述的融合蛋白包含DNA结合结构域。如本文所用，“DNA结合结构域(DBD)”是指包含识别双链或单链DNA(dsDNA或ssDNA)的至少一个结构基序的独立折叠蛋白质。某些DBD识别特定序列(识别序列或基序)，而其他类型的DBD对DNA具有一般亲和力。在一些实施方案中，本公开所述的融合蛋白包含序列特异性DBD。在一些实施方案中，DBD识别(例如，特异性结合)编码SCN1A蛋白(例如Nav1.1)的基因内或附近的核酸序列。含有DBD的蛋白质通常参与细胞过程，诸如转录、复制、修复和DNA储存。转录因子中的DBD识别启动子区或增强子元件中的特定DNA序列以促进基因表达。转录因子DBD在基因工程中用作融合蛋白来调控靶基因的表达，并且可突变以改变DNA结合特异性或DNA结合亲和力，从而调控所需靶基因的表达。DBD的实例包括但不限于螺旋-转角-螺旋基序、锌指基序(包括Cys2-His2锌指)、转录激活因子样效应物(TALE)、翼螺旋基序、HMG-盒、dCas蛋白(例如，dCas9或dCas12a)、同源结构域和OB折叠结构域。

在一些实施方案中，本公开涉及锌指DBD融合蛋白。如本文所用，“锌指蛋白(ZFP)”是指含有至少一个结构基序的蛋白质，其特征在于稳定蛋白质折叠的一种或多种锌离子的配位。锌指是在蛋白质中发现的最多样化的结构基序之一，并且高达3％的人基因编码锌指。大多数ZFP含有与靶分子(包括DNA、RNA和小蛋白泛素)串联接触的多个锌指。“经典”锌指基序由2个半胱氨酸氨基酸和2个组氨酸氨基酸(C₂H₂)组成，并以序列特异性方式结合DNA。这些ZFP(包括转录因子IIIIA(TFIIIA))通常涉及基因表达。DNA结合蛋白中的多个锌指基序结合并包裹在DNA双螺旋的外侧。由于它们的尺寸相对较小(例如，每个指为约25-40个，通常为27-35个氨基酸)，锌指结构域融合蛋白用于创建具有新的DNA结合特异性的DBD。这些DBD可递送其他融合结构域(例如，转录激活或抑制结构域或表观遗传修饰结构域)以改变靶基因的转录调控。在一些实施方案中，锌指蛋白包含2至8个指，其中每个指含有27至40个氨基酸(例如，27、28、29、30、31、32、33、34、35、36、37、38、39或40个氨基酸)。

在一些实施方案中，ZFP包含1、2、3、4、5、6、7或8个锌指。每个锌指可包含25-40、25-30、30-35、35-40或40-45个氨基酸。在一些实施方案中，锌指包含27-35个氨基酸。在一些实施方案中，锌指包含27、28、29、30、31、32、33、34或35个氨基酸。锌指可特异性识别或结合在受试者中单倍体不足的靶序列，例如，靶基因或靶基因的调控区。在一些实施方案中，锌指结合到SCN1A基因(例如，人SCN1A，例如如SEQ ID NO:49中列出的)的靶序列。在一些实施方案中，结合到SCN1A基因的靶序列的锌指包含SEQ ID NO:63-80的一个或多个氨基酸序列或其组合。在一些实施方案中，锌指特异性识别或结合到包含三核苷酸序列的靶序列。

在一些实施方案中，锌指包含识别或结合到靶序列(例如，包含三核苷酸序列的靶序列)的识别螺旋。在一些实施方案中，识别螺旋结合到三核苷酸。在一些实施方案中，识别螺旋包含4-10个氨基酸。在一些实施方案中，识别螺旋包含4、6、7、8、9或10个氨基酸。在一些实施方案中，识别螺旋结合到SCN1A基因的三核苷酸序列。在一些实施方案中，结合到SCN1A基因的识别序列包含SEQ ID NO:17-22、29-34或41-46中的任一个的氨基酸序列。在一些实施方案中，结合到SCN1A基因的识别序列由SEQ ID NO:11-16、23-28或35-40中的任一个编码。在一些实施方案中，锌指结合到与包含SEQ ID NO:17-22、29-34或41-46中的任一个的氨基酸序列的识别螺旋相同的核苷酸序列。

在一些实施方案中，锌指在其C末端包含接头序列，其可用于将所述锌指链接或连接至另外的锌指。在一些实施方案中，接头序列可为例如包含TGEKP(SEQ ID NO：120)的氨基酸序列的经典接头。在一些实施方案中，接头序列可为例如包含TGSQKP(SEQ ID NO:121)的氨基酸序列的非经典接头。在一些实施方案中，接头序列可为2-10个氨基酸，例如，2、3、4、5、6、7、8、9或10个氨基酸。

在一些实施方案中，结合到靶基因(例如，SCN1A基因)的ZFP包含六个锌指，每个锌指识别或结合到靶基因(例如，SCN1A基因)的不同三核苷酸序列。在一些实施方案中，结合到SCN1A基因的ZFP包含SEQ ID NO:57的氨基酸序列。在一些实施方案中，结合到SCN1A基因的ZFP包含含有SEQ ID NO:63、64、65、66、67和/或68的氨基酸序列的锌指。在一些实施方案中，结合到SCN1A基因的ZFP包含含有SEQ ID NO:17、18、19、20、21和/或22的氨基酸序列的识别螺旋。在一些实施方案中，结合到SCN1A基因的ZFP包含SEQ ID NO：59的氨基酸序列。在一些实施方案中，结合到SCN1A基因的ZFP包含含有SEQ ID NO:69、70、71、72、73和/或74的氨基酸序列的锌指。在一些实施方案中，结合到SCN1A基因的ZFP包含含有SEQ ID NO:29、30、31、32、33和/或34的氨基酸序列的识别螺旋。在一些实施方案中，结合到SCN1A基因的ZFP包含SEQ ID NO：61的氨基酸序列。在一些实施方案中，结合到SCN1A基因的ZFP包含含有SEQ ID NO:75、76、77、78、79和/或80的氨基酸序列的锌指。在一些实施方案中，结合到SCN1A基因的ZFP包含含有SEQ ID NO：41、42、43、44、45和/或46的氨基酸序列的识别螺旋。在一些实施方案中，结合到SCN1A基因的ZFP包含与如下所示的SEQ ID NO：57、59或61至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％或至少99％的序列同一性。

SEQ ID NO:57(ZFP1蛋白的氨基酸序列)

RPFQCRICMRNFSQRGNLVRHIRTHTGEKPFACDICGKKFALSFNLTRHTKIHTGSQKPFQCRICMRNFSRSDNLTRHIRTHTGEKPFACDICGKKFADRSHLARHTKIHTGSQKPFQCRICMRNFSQKAHLTAHIRTHTGEKPFACDICGRKFARSDNLTRHTKIHLRQKD

SEQ ID NO：59(ZFP2蛋白的氨基酸序列)

RPFQCRICMRNFSRSSNLTRHIRTHTGEKPFACDICGKKFADKRTLIRHTKIHTGSQKPFQCRICMRNFSQRGNLVRHIRTHTGEKPFACDICGKKFALSFNLTRHTKIHTGSQKPFQCRICMRNFSRSDNLTRHIRTHTGEKPFACDICGRKFADRSHLARHTKIHLRQKD

SEQ ID NO：61(ZFP3蛋白的氨基酸序列)

RPFQCRICMRNFSDRSALARHIRTHTGEKPFACDICGKKFARSDNLTRHTKIHTGSQKPFQCRICMRNFSQSGDLTRHIRTHTGEKPFACDICGKKFAVRQTLKQHTKIHTGSQKPFQCRICMRNFSAAGNLTRHIRTHTGEKPFACDICGRKFARSDNLTRHTKIHLRQKD

在一些实施方案中，DBD为转录激活因子样效应物蛋白(TALE)。TALE可特异性识别或结合靶序列，例如，靶基因或靶基因的调控区。在一些实施方案中，受试者对靶基因单倍体不足。在一些实施方案中，TALE结合到SCN1A基因(例如，如SEQ ID NO：49中提供的人SCN1A)的靶序列。TALE蛋白由细菌分泌并结合宿主植物中的启动子序列，以激活有助于细菌感染的植物基因的表达。通常，TALE蛋白被操纵以结合新的DNA序列，因为通过由可变数量的约30-35个氨基酸重复组成的中心重复结构域识别靶序列，其中每个重复识别靶序列内的单个碱基对。这些重复的阵列通常是识别DNA序列所必需的。

在一些实施方案中，DBD为同源结构域。同源结构域可特异性识别或结合靶序列，例如，靶基因或靶基因的调控区。在一些实施方案中，受试者对靶基因单倍体不足。在一些实施方案中，同源结构域结合到SCN1A基因(例如，如SEQ ID NO:49中提供的人SCN1A)的靶序列。同源结构域是负责识别靶序列的含有三个α螺旋和一个N端臂的蛋白质。同源结构域通常识别小的DNA序列(约4至8个碱基对)，然而这些结构域可与其他DNA结合结构域(其他同源结构域或锌指蛋白)串联融合以识别更长的延伸序列(12至24个碱基对)。因此，同源结构域可为识别人基因组中的独特序列的DBD的组成部分。

在一些实施方案中，至少一个DNA结合结构域为催化失活的CRISPR相关蛋白(Cas蛋白)。催化失活的Cas蛋白(也称为dCas或“死亡Cas蛋白”)为经修饰或突变使得其核酸酶活性(例如，核酸内切酶活性)降低或缺乏所有核酸酶活性(例如，核酸内切酶活性)的Cas蛋白。在一些实施方案中，催化失活的Cas蛋白为dCas9或dCas12蛋白。在一些实施方案中，DBD为dCas蛋白(也称为‘死亡Cas’)，诸如dCas9或dCas12a。dCas蛋白是已突变使得其催化失活(即不能进行核苷酸裂解)的CRISPR相关蛋白(Cas，例如Cas9或Cas12a)的突变变体。dCas可特异性识别或结合靶序列，例如，靶基因或靶基因的调控区。包含dCas蛋白和指导核酸(例如，gRNA)的复合物可靶向和/或结合到与指导核酸互补的特定核苷酸序列或基因。在一些实施方案中，受试者对靶基因单倍体不足。在一些实施方案中，dCas结合到SCN1A基因(例如，如SEQ ID NO:49中提供的人SCN1A)的靶序列。然而，当结合到与所述靶DNA序列互补或部分互补的指导核酸(例如，指导RNA、gRNA或sgRNA)时，dCas蛋白保留其识别和结合到靶DNA序列的能力。在一些实施方案中，用于将dCas(例如，dCas9)蛋白靶向SCN1A的指导核酸包含具有SEQ ID NO:85、86、89、90、93或94中的任一个的间隔区序列。在一些实施方案中，用于将dCas(例如，dCas9)蛋白靶向SCN1A的指导核酸包含具有SEQ ID NO:85、86、89、90、93或94中的任一个的至少15个(例如，至少16、17、18、19或20个)连续核苷酸的间隔区序列。在一些实施方案中，用于将dCas(例如，dCas9)蛋白靶向SCN1A的指导核酸包含SEQ ID NO:83、84、87、88、91或92中的任一个。在一些实施方案中，用于将dCas(例如，dCas9)蛋白靶向SCN1A的指导核酸包含SEQ ID NO:83-94中的任一个或由其组成。因此，dCas核酸内切酶可为识别人基因组中的独特序列的DBD的组成部分。在一些实施方案中，融合蛋白包含dCas9蛋白和反式激活结构域(例如，VPR结构域)。

在一些方面，本公开涉及结合到编码电压门控钠通道(例如，Na_v1.1)的基因的DNA结合结构域。在一些实施方案中，编码电压门控钠通道的基因为SCN1A基因，并且包含SEQID NO:49中列出的序列。在一些实施方案中，DNA结合结构域结合到靶基因的非翻译区，诸如3'-非翻译区(3'UTR)或5'-非翻译区(5'UTR)。在一些实施方案中，非翻译区包含调控序列，例如增强子、启动子、内含子或阻遏子序列。在一些实施方案中，DNA结合结构域为锌指蛋白，其包含SEQ ID NO:57-62中列出的序列。在一些实施方案中，DNA结合结构域结合到SEQ ID NO:5-7中的任一个中列出的核酸序列。

由转基因编码的DNA结合结构域的数量可变化。在一些实施方案中，转基因编码一个DNA结合结构域。在一些实施方案中，转基因编码2个DNA结合结构域。在一些实施方案中，转基因编码3个DNA结合结构域。在一些实施方案中，转基因编码4个DNA结合结构域。在一些实施方案中，转基因编码5个DNA结合结构域。在一些实施方案中，转基因编码6个DNA结合结构域。在一些实施方案中，转基因编码7个DNA结合结构域。在一些实施方案中，转基因编码8个DNA结合结构域。在一些实施方案中，转基因编码9个DNA结合结构域。在一些实施方案中，转基因编码10个DNA结合结构域。在一些实施方案中，转基因编码多于10个(例如，20、30、50、100个等)DNA结合结构域。DNA结合结构域可为相同的DNA结合结构域(例如，相同DBD的多个拷贝)、不同的DNA结合结构域(例如，每个DBD结合唯一序列)或其组合。

在一些方面，本公开涉及包含反式激活因子结构域的融合蛋白。如本文所用，“反式激活结构域”是指转录因子中的支架结构域，其含有调控基因表达的其他蛋白质(诸如转录共调控因子)的结合位点。在一些实施方案中，反式激活结构域(也称为转录激活结构域)与DBD联合作用，以直接通过接触转录因子或间接通过共激活因子蛋白激活来自启动子或增强子的转录。反式激活结构域(TAD)通常以其氨基酸组成命名，其中氨基酸为活性所必需的或为TAD中最丰富的。TAD在基因工程中被用作融合蛋白来调控靶基因的表达，并且可突变以改变转录激活水平，从而改变靶基因的表达。反式激活结构域的实例包括但不限于GAL4、HAP1、VP16、P65、RTA和GCN4。

在一些实施方案中，反式激活因子结构域包含VP64结构域。VP64是由单纯疱疹病毒自然表达的VP16蛋白的四个串联拷贝组成的酸性TAD。当与结合在基因启动子处或其附近的DBD融合时，VP64充当强转录激活因子，并因此可用于调控靶基因(例如，SCN1A)的表达。VP64结构域通常由单纯疱疹蛋白VP16的最小激活结构域的四聚体重复组成。在一些实施方案中，VP64结构域包含VP16中氨基酸残基437-448的四个重复。在一些实施方案中，VP16蛋白由人疱疹病毒2UL48基因编码，其包含NCBI参考序列登录号：NC_001798.2中列出的序列。在一些实施方案中，VP16基因包含与由NCBI参考序列登录号：YP_009137200.1中列出的核酸序列编码的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的核苷酸序列。在一些实施方案中，VP16蛋白包含与NCBI参考序列登录号Q69113-1中列出的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。在一些实施方案中，VP16基因包含与由SEQ ID NO：51中列出的核酸序列编码的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的核苷酸序列。在一些实施方案中，VP16蛋白包含与SEQ ID NO:52中列出的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。

在一些实施方案中，反式激活因子结构域包含P65激活结构域。P65为NF-κβ转录因子的亚基，其C端含有两个相邻的酸性TAD。当与结合在基因启动子处或其附近的DBD融合时，p65蛋白充当强转录激活因子，并因此可用于调控靶基因的表达，例如如Urlinger等人“The p65 domain from NF-kappaB is an efficient human activator in thetetracycline-regulatable gene expression system,”Gene,2000所述。在一些实施方案中，p65蛋白由人RELA基因编码，其包含NCBI参考序列登录号：NM_001145138.1、NM_001243984.1、NM_001243985.1或NM_021975.3中列出的序列。在一些实施方案中，RELA基因包含与由NCBI参考序列登录号：NM_001145138.1、NM_001243984.1、NM_001243985.1或NM_021975.3中的任一个中列出的核酸序列编码的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的核苷酸序列。在一些实施方案中，p65蛋白包含与NP_001138610.1、NP_001230913.1、NP_001230914.1和NP_068110.3中列出的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。在一些实施方案中，RELA基因包含与由SEQ ID NO：53中列出的核酸序列编码的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的核苷酸序列。在一些实施方案中，p65蛋白包含与SEQ ID NO：54中列出的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。

在一些实施方案中，反式激活因子结构域包含RTA结构域。RTA是衍生自爱泼斯坦巴尔病毒(Epstein Barr virus)的疏水性TAD，它是与增强子区结合以促进几种病毒基因的表达的有效的反式激活结构域。当与结合在基因启动子处或其附近的DBD融合时，RTA蛋白充当强转录激活因子，并因此可用于调控靶基因的表达，例如如Miyazawa等人,“IL-10promoter transactivation by the viral K-RTA protein involves the host-celltranscription factors,specificity proteins 1and 3,”Journal of BiologicalChemistry,2018所述。在一些实施方案中，RTA蛋白由爱泼斯坦巴尔病毒BRLF1基因编码，其包含NCBI参考序列登录号：YP_041674.1中列出的序列。在一些实施方案中，BRLF1基因包含与由NCBI参考Seq ID No:YP_041674.1中的任一个中列出的核酸序列编码的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的核苷酸序列。在一些实施方案中，RTA蛋白包含与YP_041674.1中列出的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。在一些实施方案中，BRLF1基因包含与由SEQ ID NO：55中列出的核酸序列编码的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的核苷酸序列。在一些实施方案中，RTA蛋白包含与SEQ ID NO：56中列出的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。

本公开部分地基于包含杂交反式激活因子结构域的融合蛋白。如本文所用，“杂交反式激活因子结构域”是指包含多于一种转录激活蛋白或其部分(例如，2、3、4、5个或更多个转录激活蛋白或其部分)的融合蛋白。在基因工程中使用杂交反式激活结构域来增加靶基因的表达。在本公开的一些实施方案中，包含VP64-P65-RTA(VPR)的核苷酸序列的三元杂交反式激活结构域(如描述于Chavez等人“Highly efficient Cas9-mediatedtranscriptional programming”,Nat Methods,2015,(SEQ ID NO∶47)中)用于增加靶基因(例如，SCN1A)表达。

在一些实施方案中，本文所述的融合蛋白可包含DBD(例如，ZFP)和转录阻遏子蛋白。在一些方面，本公开涉及包含转录阻遏子结构域的融合蛋白。如本文所用，“转录阻遏子”蛋白通常是指下调靶基因表达的多肽。转录阻遏子的实例包括但不限于KRAB、SMRT/TRAC-2和NCoR/RIP-13。在一些实施方案中，此类转录阻遏子融合蛋白可用于降低靶基因(例如，在功能获得性疾病中过度表达的基因)的表达水平。

分离的核酸

分离的核酸序列是指DNA或RNA序列。在一些实施方案中，本公开的蛋白质和核酸是分离的。如本文所用，术语“分离的”意指人工生产的。如本文中关于核酸所使用的，术语“分离的”意指：(i)通过例如聚合酶链反应(PCR)在体外扩增；(ii)通过克隆重组产生；(iii)纯化，如通过裂解和凝胶分离；或(iv)通过例如化学合成来合成。分离的核酸是通过本领域众所周知的重组DNA技术易于操作的核酸。因此，包含在已知5'和3'限制位点或已公开聚合酶链反应(PCR)引物序列的载体中的核苷酸序列被认为是分离的，但以天然状态存在于自然宿主中的核酸序列不是分离的。分离的核酸可以是基本上纯化的，但不是必须的。例如，在克隆或表达载体中分离的核酸不是纯的，因为它可能仅占其所在细胞中物质的很小百分比。然而，正如本文所用的术语，此种核酸是分离的，因为通过本领域普通技术人员已知的标准技术易于操作。如本文中关于蛋白质或肽所使用的，术语“分离的”是指已从其天然环境中分离或人工生产(例如，通过化学合成、通过重组DNA技术等)的蛋白质或肽。

在一些方面，本公开涉及被配置为表达一种或多种ZFP反式激活结构域融合蛋白的分离的核酸(例如，表达构建体，诸如rAAV载体)。在一些实施方案中，融合蛋白包含1至10个(例如，1、2、3、4、5、6、7、8、9或10个)DBD和/或1至10个(例如，1、2、3、4、5、6、7、8、9或10个)反式激活因子结构域。在一些实施方案中，融合蛋白包含多于10个DBS和/或多于10个反式激活因子结构域。

在本公开的一些方面，DNA结合结构域通过接头间接融合到转录调控子结构域。如本文所用，“接头”通常为一段多肽，其在结构上连接单个转基因内的两个不同多肽。在一些实施方案中，接头是柔性的，以允许不同多肽的移动。在一些实施方案中，柔性接头包含甘氨酸残基。在一些实施方案中，柔性接头包含甘氨酸和丝氨酸残基的混合物。在一些实施方案中，接头为可裂解的，从而允许分离多肽。在一些实施方案中，可裂解接头被蛋白酶切割。在一些实施方案中，蛋白酶为胰蛋白酶或因子X。

在一些实施方案中，接头包含5至30个氨基酸(例如，5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸)。在一些实施方案中，接头包含3至30个氨基酸(例如，3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸)。在一些实施方案中，接头包含3至20个氨基酸(例如，3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸)。

本公开部分地基于融合蛋白，所述融合蛋白被工程化以增加编码电压门控钠离子通道亚基蛋白(也称为SCN蛋白)(例如SCN1A)的基因的表达。如本文所用，“SCN蛋白”是指钠离子通道蛋白，其介导可兴奋膜的电压依赖性钠离子渗透性，从而允许钠离子穿过膜。人中SCN蛋白的实例包括但不限于SCN1A、SCN3A、SCN5A、SCN10A和SCN11A。在一些实施方案中，SCN蛋白为SCN1A(也称为Nav1.1)，其编码1型α₁离子通道亚基。在一些实施方案中，SCN蛋白为SCN1B蛋白，其编码1型β₁离子通道亚基或SCN1C蛋白。在一些实施方案中，SCN蛋白为SCN1A、SCN1B和/或SCN1C蛋白的组合。如本文所公开，SCN蛋白可为SCN蛋白的一部分或片段。在一些实施方案中，如本文所公开的SCN蛋白为SCN蛋白的变体，诸如点突变体或截短的突变体。

在人中，SCN1A由SCN1A基因(基因ID：6323，人)编码，所述基因在黑猩猩、恒河猴、狗、牛、小鼠、大鼠和鸡中保守。人中的SCN1A基因主要在脑、肺和睾丸中表达。在一些实施方案中，SCN1A蛋白包含五个结构重复(I、II、III、IV、Q)。

在一些实施方案中，SCN1A蛋白由人SCN1A基因编码，其包含NCBI参考Seq ID No:NM_001165963.2、NM_00165964.2、NM_001202435.2、NM_001353948.1、NM_001353949.1、NM_001353950.1、NM_00135395.1、NM_001353952.1、NM_001353954.1、NM_00353955.1、NM_001353957.1、NM_001353958.1、NM_001353960.1、NM_001353961.1或NM_006920.5中列出的序列。在一些实施方案中，SCN1A蛋白由小鼠SCN1A基因编码，其包含NCBI参考Seq ID No:NM_001313997.1或NM_018733.2中列出的序列。在一些实施方案中，SCN1A蛋白包含与由NCBI参考Seq ID No:NG_011906.1、NM_001313997.1或NM_018733.2中列出的核酸序列编码的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。在一些实施方案中，SCN1A基因包含与SEQ ID NO：50中列出的序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。在一些实施方案中，人SCN1A蛋白包含NCBI参考Seq ID No:NP_001159435.1、NP_0011159436.1、NP_001189364.1、NP_001340877.1、NP_001340878.1、NP_001340879.1、NP_001340880.1、NP_001340881.1、NP_001340883.1、NP_001340884.1、NP_001340886.1、NP_001340887.1、NP_001340889.1、NP_001340890.1、NP_00851.3中列出的序列。在一些实施方案中，SCN1A蛋白包含与由NCBI参考Seq ID No:NG_011906.1、NM_001313997.1或NM_018733.2中列出的核酸序列编码的氨基酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。在一些实施方案中，小鼠SCN1A蛋白包含NCBI参考Seq ID No：NP_001300926.1或NP_061203.2中列出的序列。在一些实施方案中，人SCN1A蛋白包含与SEQ IDNO：49中列出的核酸序列99％相同、95％相同、90％相同、80％相同、70％相同、60％相同或50％相同的氨基酸序列。

本公开的分离的核酸可为重组腺相关病毒(AAV)载体(rAAV载体)。在一些实施方案中，如本公开所述的分离的核酸包含含有第一腺相关病毒(AAV)反向末端重复(ITR)或其变体的区(例如，第一区)。可将分离的核酸(例如，重组AAV载体)包装成衣壳蛋白并施用于受试者和/或递送至选定的靶细胞。“重组AAV(rAAV)载体”通常至少由转基因及其调控序列以及5'和3'AAV反向末端重复(ITR)组成。如本公开别处所述，转基因可包含编码例如蛋白质和/或表达控制序列(例如，聚-A尾)的区。

通常，ITR序列的长度为约145bp。优选地，基本上在分子中使用编码ITR的整个序列，尽管允许对这些序列进行某种程度的微小修饰。修饰这些ITR序列的能力在本领域技术范围内。(参见例如，文本诸如Sambrook等人.,″Molecular Cloning.A LaboratoryManual″,第2版,Cold Spring Harbor Laboratory,New York(1989)；和K.Fisher等人,JVirol.,70:520 532(1996))。本公开中采用的这种分子的实例是含有转基因的“顺式作用”质粒，其中选定转基因序列和相关调控元件的侧翼为5'和3'AAV ITR序列。AAV ITR序列可从任何已知的AAV获得，包括目前鉴定的哺乳动物AAV类型。在一些实施方案中，分离的核酸还包含含有第二AAV ITR的区(例如，第二区、第三区、第四区等)。

除了上面鉴定的重组AAV载体的主要元件外，载体还包括以允许其在用载体转染或用本公开产生的病毒感染的细胞中转录、翻译和/或表达的方式与转基因的元件可操作地连接的常规控制元件。如本文所用，“可操作地连接的”序列包括与关注的基因相邻的表达控制序列和反式作用或一定距离作用以控制关注的基因的表达控制序列。表达控制序列包括适当的转录起始、终止、启动子和增强子序列；有效的RNA处理信号，诸如剪接和聚腺苷酸化(polyA)信号；稳定细胞质mRNA的序列；提高翻译效率的序列(例如，Kozak共有序列)；增强蛋白质稳定性的序列；以及在需要时，增强编码产物的分泌的序列。许多表达控制序列(包括天然、组成型、诱导型和/或组织特异性启动子)是本领域已知的并且可被利用。

如本文所用，当核酸序列(例如，编码序列)和调控序列以将核酸序列的表达或转录置于调控序列的影响或控制下的方式共价连接时，它们被称为可操作地连接。如果希望将核酸序列翻译成功能性蛋白质，如果5'调控序列中启动子的诱导导致编码序列的转录，并且如果两个DNA序列之间的连接的性质不会(1)导致移码突变的引入，(2)干扰启动子区指导编码序列转录的能力，或(3)干扰相应RNA转录物翻译成蛋白质的能力，则两个DNA序列称为可操作地连接。因此，如果启动子区能够影响该DNA序列的转录，使得所得转录物可翻译成所需的蛋白质或多肽，则启动子区将可操作地连接到核酸序列。类似地，当两个或更多个编码区以它们从共同启动子的转录导致已在框内翻译的两个或更多个蛋白质的表达的方式连接时，它们可操作地连接。在一些实施方案中，可操作地连接的编码序列产生融合蛋白。

包含转基因(例如，包含融合蛋白等)的区可位于将能够表达融合蛋白的分离的核酸的任何合适的位置。

应当理解，在转基因编码多于一个多肽的情况下，每个多肽可位于转基因内的任何合适的位置。例如，编码第一多肽的核酸可位于转基因的内含子中，并且编码第二多肽的核酸序列可位于另一个非翻译区中(例如，在蛋白质编码序列的最后一个密码子与转基因聚-A信号的第一个碱基之间)。

“启动子”是指由需要启动基因的特异性转录的细胞的合成机械或引入的合成机械识别的DNA序列。短语“可操作地连接的”、“可操作地定位”、“受控”或“受转录控制”意指启动子相对于核酸处于正确的位置和方向，以控制RNA聚合酶的起始和基因的表达。

对于编码蛋白质的核酸，通常在转基因序列之后和3'AAV ITR序列之前插入聚腺苷酸化序列。可用于本公开的rAAV构建体还可含有内含子，其理想地位于启动子/增强子序列与转基因之间。一种可能的内含子序列源自SV-40，并且称为SV-40T内含子序列。可使用的另一个载体元件为内部核糖体进入位点(IRES)。IRES序列用于从单个基因转录物产生多于一个多肽。IRES序列将用于产生含有多于一条多肽链的蛋白质。这些和其他常见载体元件的选择是常规的，并且许多此类序列是可用的[参见例如，Sambrook等人及其中在例如第3.183.26和16.17 16.27页引用的参考文献，以及Ausubel等人,Current Protocols inMolecular Biology,John Wiley&Sons,New York,1989]。在一些实施方案中，口蹄疫病毒2A序列包含在多蛋白中；这是已被证明介导多蛋白的裂解的小的肽(长度为大约18个氨基酸)(Ryan,MD等人,EMBO,1994；4∶928-933；Mattion,N M等人,J Virology,1996年11月；第8124-8127页；Furler,S等人,Gene Therapy,2001；8∶864-873；和Halpin,C等人,The PlantJournal,1999；4∶453-459)。2A序列的裂解活性先前已在包括质粒和基因疗法载体(AAV和逆转录病毒)的人工系统中得到证实(Ryan,M D等人,EMBO,1994；4:928-933；Mattion,N M等人,J Virology,1996年11月；第8124-8127页；Furler,S等人,Gene Therapy,2001；8∶864-873；和Halpin,C等人,The Plant Journal,1999；4∶453-459；de Felipe,P等人,GeneTherapy,1999；6∶198-208；de Felipe,P等人,Human Gene Therapy,2000；11∶1921-1931；和Klump,H等人,Gene Therapy,2001；8∶811-817)。

组成型启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见例如，Boshart等人,Cell,41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子[Invitrogen]。在一些实施方案中，启动子为P2启动子。在一些实施方案中，启动子为鸡β-肌动蛋白(CBA)启动子。在一些实施方案中，启动子为两个CBA启动子。在一些实施方案中，启动子为由CMV增强子分离的两个CBA启动子。在一些实施方案中，启动子为CAG启动子。

诱导型启动子允许调控基因表达，并且可通过外源提供的化合物、环境因素(诸如温度)或特定生理状态(例如，急性期、细胞的特定分化状态或仅在复制细胞中)的存在来调控。诱导型启动子和诱导型系统可购自多种商业来源，包括但不限于Invitrogen、Clontech和Ariad。已描述了许多其他系统并且本领域技术人员可容易地选择这些系统。通过外源提供的启动子调控的诱导型启动子的实例包括锌诱导型绵羊金属硫蛋白(MT)启动子、地塞米松(Dex)诱导型小鼠乳腺肿瘤病毒(MMTV)启动子、T7聚合酶启动子系统(WO98/10088)；蜕皮激素昆虫启动子(No等人,Proc.Natl.Acad.Sci.USA,93:3346-3351(1996))、四环素抑制系统(Gossen等人,Proc.Natl.Acad.Sci.USA,89:5547-5551(1992))、四环素诱导型系统(Gossen等人,Science,268:1766-1769(1995)，也参见Harvey等人,Curr.Opin.Chem.Biol.,2:512-518(1998))、RU486诱导型系统(Wang等人,Nat.Biotech.,15:239-243(1997)和Wang等人,Gene Ther.,4:432-441(1997))和雷帕霉素诱导型系统(Magari等人,J.Clin.Invest.,100:2865-2872(1997))。在此情况下可能有用的其他类型的诱导型启动子是受特定生理状态(例如，温度、急性期、细胞的特定分化状态或仅在复制细胞中)调控的那些启动子。

在另一个实施方案中，将使用转基因的天然启动子。当希望转基因的表达应模拟天然表达时，可优选天然启动子。当转基因的表达必须在时间或发育上、或以组织特异性方式、或响应特定转录刺激物时，可使用天然启动子。在另一个实施方案中，其他天然表达控制元件(诸如增强子元件、聚腺苷酸化位点或Kozak共有序列)也可用于模拟天然表达。

在一些实施方案中，调控序列赋予组织特异性基因表达能力。在一些情况下，组织特异性调控序列结合以组织特异性方式诱导转录的组织特异性转录因子。此类组织特异性调控序列(例如，启动子、增强子等)是本领域众所周知的。示例性组织特异性调控序列包括但不限于以下组织特异性启动子：肝特异性甲状腺素结合球蛋白(TBG)启动子、胰岛素启动子、胰高血糖素启动子、生长抑素启动子、胰腺多肽(PPY)启动子、突触素-1(Syn)启动子、肌酸激酶(MCK)启动子、哺乳动物结蛋白(DES)启动子、α-肌球蛋白重链(α-MHC)启动子或心脏肌钙蛋白T(cTnT)启动子。其他示例性启动子包括β-肌动蛋白启动子、乙型肝炎病毒核心启动子，Sandig等人,Gene Ther.,3:1002-9(1996)；甲胎蛋白(AFP)启动子，Arbuthnot等人,Hum.Gene Ther.,7:1503-14(1996))、骨骨钙素启动子(Stein等人,Mol.Biol.Rep.,24:185-96(1997))；骨唾液蛋白启动子(Chen等人,J.Bone Miner.Res.,11∶654-64(1996))、CD2启动子(Hansal等人，J.Immunol.,161∶1063-8(1998)；免疫球蛋白重链启动子；T细胞受体α链启动子、神经元诸如神经元特异性烯醇化酶(NSE)启动子(Andersen等人,Cell.Mol.Neurobiol.,13：503-15(1993))、神经丝轻链基因启动子(Piccioli等人，Proc.Natl.Acad.Sci.USA,88∶5611-5(1991))和神经元特异性vgf基因启动子(Piccioli等人，Neuron,15∶373-84(1995))以及对于本领域技术人员将是显而易见的其他启动子。

在一些实施方案中，编码包含DBD和反式激活因子的融合蛋白的转基因可操作地连接到启动子。在一些实施方案中，启动子为组成型启动子。在一些实施方案中，启动子为诱导型启动子。在一些实施方案中，启动子为组织特异性启动子。在一些实施方案中，启动子对神经组织具有特异性。在一些实施方案中，启动子为SST或NPY启动子。

本公开的方面涉及一种包含多于一个启动子(例如，2、3、4、5个或更多个启动子)的分离的核酸。例如，在具有包含编码蛋白质的第一区和编码蛋白质的第二区的转基因的构建体的情况下，可能需要使用第一启动子序列(例如，可操作地连接到蛋白质编码区的第一启动子序列)驱动第一蛋白质编码区的表达，以及用第二启动子序列(例如，可操作地连接到第二蛋白质编码区的第二启动子序列)驱动第二蛋白质编码区的表达。通常，第一启动子序列和第二启动子序列可为相同的启动子序列或不同的启动子序列。在一些实施方案中，第一启动子序列(例如，驱动蛋白质编码区表达的启动子)为RNA聚合酶III(pol III)启动子序列。pol III启动子序列的非限制性实例包括U6和H1启动子序列。在一些实施方案中，第二启动子序列(例如，驱动第二蛋白质表达表达的启动子序列)为RNA聚合酶II(polII)启动子序列。pol II启动子序列的非限制性实例包括T7、T3、SP6、RSV和巨细胞病毒启动子序列。在一些实施方案中，pol III启动子序列驱动第一蛋白质编码区的表达。在一些实施方案中，pol II启动子序列驱动第二蛋白质编码区的表达。

重组腺相关病毒(rAAV)

在一些方面，本公开提供分离的腺相关病毒(AAV)。如本文中关于AAV所使用的，术语“分离的”是指人工生产或获得的AAV。可使用重组方法生产分离的AAV。此类AAV在本文中称为“重组AAV”。重组AAV(rAAV)优选具有组织特异性靶向能力，使得rAAV的核酸酶和/或转基因将被特异性递送至一个或多个预定组织。AAV衣壳是确定这些组织特异性靶向能力的重要元件。因此，可选择具有适合所靶向组织的衣壳的rAAV。

用于获得具有所需衣壳蛋白的重组AAV的方法是本领域众所周知的。(参见例如，US 2003/0138772)，其内容以引用的方式整体并入本文。通常，所述方法涉及培养含有编码AAV衣壳蛋白的核酸序列的宿主细胞；功能性rep基因；由AAV反向末端重复(ITR)和转基因组成的重组AAV载体；和足够的辅助功能，以允许将重组AAV载体包装到AAV衣壳蛋白中。在一些实施方案中，衣壳蛋白是由AAV的cap基因编码的结构蛋白。AAV包含三种衣壳蛋白，病毒蛋白1至3(命名为VP1、VP2和VP3)，所有这些蛋白都通过选择性剪接从单个cap基因转录。在一些实施方案中，VP1、VP2和VP3的分子量分别为约87kDa、约72kDa和约62kDa。在一些实施方案中，在翻译时，衣壳蛋白在病毒基因组周围形成球形60-mer蛋白壳。在一些实施方案中，衣壳蛋白的功能为保护病毒基因组、递送基因组并与宿主相互作用。在一些方面，衣壳蛋白以组织特异性方式将病毒基因组递送至宿主。

在一些实施方案中，AAV衣壳蛋白具有选自由AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAV9、AAV10、AAVrh10和AAV.PHP.B组成的组的AAV血清型。在一些实施方案中，AAV衣壳蛋白具有衍生自非人灵长类动物的血清型，例如AAVrh8血清型。在一些实施方案中，AAV衣壳蛋白具有为广泛且有效的CNS转导而衍生的血清型，例如AAV.PHP.B。在一些实施方案中，衣壳蛋白具有AAV血清型9。

待在宿主细胞中培养以将rAAV载体包装在AAV衣壳中的组分可以反式提供给宿主细胞。替代地，所需组分(例如，重组AAV载体、rep序列、cap序列和/或辅助功能)中的任何一种或多种可由稳定的宿主细胞提供，所述稳定的宿主细胞已使用本领域技术人员已知的方法被工程化以含有所需组分中的一种或多种。最合适的是，此种稳定的宿主细胞将含有在诱导型启动子控制下的一种或多种所需组分。然而，一种或多种所需组分可能在组成型启动子的控制下。在讨论适合与转基因一起使用的调控元件时，本文提供了合适的诱导型和组成型启动子的实例。在另一个替代方案中，选定的稳定宿主细胞可含有在组成型启动子控制下的一种或多种选定组分和在一个或多个诱导型启动子控制下的一种或多种其他选定组分。例如，可产生稳定的宿主细胞，其衍生自293个细胞(其含有在组成型启动子控制下的E1辅助功能)，但其含有在诱导型启动子控制下的rep和/或cap蛋白。本领域技术人员还可产生其他稳定的宿主细胞。

在一些实施方案中，本公开涉及含有核酸的宿主细胞，所述核酸包含编码转基因的编码序列(例如，融合至转录调控子结构域的DNA结合结构域)。在一些实施方案中，宿主细胞为哺乳动物细胞、酵母细胞、细菌细胞、昆虫细胞、植物细胞或真菌细胞。

生产本公开的rAAV所需的重组AAV载体、rep序列、cap序列和辅助功能可使用任何适当的遗传元件(载体)递送至包装宿主细胞。选定的遗传元件可通过任何合适的方法递送，包括本文所述的那些方法。用于构建本公开的任何实施方案的方法是核酸操纵技术人员已知的，并且包括基因工程、重组工程和合成技术。参见例如，Sambrook等人,MolecularCloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,N.Y。类似地，产生rAAV病毒粒子的方法是众所周知的，并且选择合适的方法不是对本公开的限制。参见例如，K.Fisher等人,J.Virol.,70:520-532(1993)和美国专利号5,478,745。

在一些实施方案中，重组AAV可使用三重转染方法(详细描述于美国专利号6,001,650中)生产。通常，重组AAV是通过用待包装成AAV颗粒、AAV辅助功能载体和辅助功能载体的AAV载体(包含侧翼为ITR元件的转基因)转染宿主细胞来生产的。AAV辅助功能载体编码“AAV辅助功能”序列(例如，rep和cap)，其反式作用用于生产性AAV复制和包装。优选地，AAV辅助功能载体支持有效的AAV载体生产，而不产生任何可检测的野生型AAV病毒粒子(例如，含有功能性rep和cap基因的AAV病毒粒子)。适合与本公开一起使用的载体的非限制性实例包括描述于美国专利号6,001,650中的pHLP19和描述于美国专利号6,156,303中的pRep6cap6载体，两者的全部内容以引用的方式并入本文。辅助功能载体编码AAV复制所依赖的非AAV衍生病毒和/或细胞功能(例如，“辅助功能”)的核苷酸序列。辅助功能包括AAV复制所需的那些功能，包括但不限于参与AAV基因转录的激活、阶段特异性AAV mRNA剪接、AAVDNA复制、cap表达产物的合成和AAV衣壳组装的那些部分。基于病毒的辅助功能可源自任何已知的辅助病毒，诸如腺病毒、疱疹病毒(单纯疱疹病毒1型除外)和痘苗病毒。

在一些方面，本公开提供转染的宿主细胞。术语“转染”用于指细胞摄取外源DNA，并且当外源DNA被引入细胞膜内时，细胞已被“转染”。许多转染技术是本领域公知的。参见例如，Graham等人(1973)Virology,52:456；Sambrook等人(1989)Molecular Cloning,alaboratory manual,Cold Spring Harbor Laboratories,New York；Davis等人(1986)Basic Methods in Molecular Biology,Elsevier；和Chu等人(1981)Gene13:197。此类技术可用于将一种或多种外源核酸(诸如核苷酸整合载体和其他核酸分子)引入合适的宿主细胞。

“宿主细胞”是指携带或能够携带关注的物质的任何细胞。通常，宿主细胞为哺乳动物细胞。在一些实施方案中，宿主细胞为神经元，任选地为GABA能神经元。如本文所用，“GABA能神经元”为产生γ氨基丁酸(GABA)的神经细胞。在哺乳动物中，GABA是广泛分布在神经系统中的神经递质，它结合并抑制与其结合的神经元。因此，GABA与影响神经系统的许多病症有关，包括癫痫、自闭症和焦虑。对SCN1A半合子和敲除小鼠的研究观察到，脑中GABA能神经元存在严重的钠电流缺陷。宿主细胞可用作AAV辅助构建体、AAV小基因质粒、辅助功能载体或与重组AAV生产相关的其他转移DNA的受体。所述术语包括已被转染的原始细胞的子代。因此，如本文所用，“宿主细胞”可指已用外源DNA序列转染的细胞。应当理解，由于天然、偶然或有意突变，单个亲本细胞的子代可不必在形态或在基因组或总DNA互补序列上与原始亲本完全相同。

如本文所用，术语“细胞系”是指能够在体外连续或延长生长和分裂的细胞群。通常，细胞系是源自单个祖细胞的克隆种群。本领域进一步已知，在此类克隆种群的储存或转移期间，核型可发生自发或诱导的变化。因此，源自所指细胞系的细胞可与祖先细胞或培养物不完全相同，并且所指细胞系包括此类变体。

如本文所用，术语“重组细胞”是指已引入外源DNA片段(诸如导致生物活性多肽转录或生物活性核酸诸如RNA产生的DNA片段)的细胞。

如本文所用，术语“载体”包括任何遗传元件，诸如质粒、噬菌体、转座子、粘粒、染色体、人工染色体、病毒、病毒粒子等，其在与适当的控制元件相关联时能够复制并且其可在细胞之间转移基因序列。在一些实施方案中，载体为病毒载体，诸如rAAV载体、慢病毒载体、腺病毒载体、逆转录病毒载体等。因此，所述术语包括克隆和表达载体，以及病毒载体。在一些实施方案中，设想有用的载体是其中待转录的核酸片段位于启动子的转录控制下的那些载体。

“启动子”是指由需要启动基因的特异性转录的细胞的合成机械或引入的合成机械识别的DNA序列。短语“可操作地连接的”、“可操作地定位”、“受控”或“受转录控制”意指启动子相对于核酸处于正确的位置和方向，以控制RNA聚合酶的起始和基因的表达。术语“表达载体或构建体”意指含有核酸的任何类型的遗传构建体，其中核酸编码序列中的部分或全部能够被转录。在一些实施方案中，表达包括核酸的转录，以例如从转录的基因产生生物活性多肽产物。用于将重组载体包装在所需AAV衣壳中以产生本公开的rAAV的前述方法并不意味着是限制性的，并且其他合适的方法对于技术人员来说将是显而易见的。

用于调控靶基因表达的方法

本公开提供了用于调控细胞或受试者中基因表达的方法。方法通常涉及向细胞或受试者施用分离的核酸或rAAV，所述核酸或rAAV包含编码包含DNA结合结构域(例如，ZFP结构域)和反式激活结构域的融合蛋白的转基因。在一些实施方案中，融合蛋白包含ZFP和VP64反式激活因子。在一些实施方案中，融合蛋白包含ZFP和p65反式激活因子。在一些实施方案中，融合蛋白包含ZFP和RTA反式激活因子。在一些实施方案中，融合蛋白包含ZFP和VPR反式激活因子。在一些实施方案中，方法涉及向细胞或受试者施用dCas9蛋白和靶向SCN1A的至少一种指导核酸(例如，包含SEQ ID NO:83-94中的任一个或由SEQ ID NO:83-94中的任一个编码的指导核酸)。

在一些实施方案中，向细胞或受试者施用编码融合蛋白(例如，包含反式激活因子的融合蛋白)的分离的核酸或rAAV导致靶基因(例如，SCN1A)的表达增加。因此，在一些实施方案中，本公开所述的组合物和方法可用于治疗由靶基因单倍体不足引起的病状，诸如由SCN1A基因单倍体不足引起的德拉韦综合征(Dravet syndrome)。

如本文所用，“单倍体不足”是指其中基因(例如SCN1A)的一个拷贝例如通过基因突变而失活、或缺失，并且基因的剩余功能拷贝不足以产生足以维持基因正常功能的基因产物量的遗传病状。

德拉韦综合征(也称为婴儿严重肌阵挛性癫痫)是通常出现在生命的前三年的罕见的终生癫痫。德拉韦综合征的特点是长时间且频繁的癫痫发作、行为和发育迟缓、运动和平衡问题、语言和言语迟缓问题以及自主神经系统紊乱。在一些实施方案中，受试者患有与德拉韦综合征相关联的单倍体不足，诸如SCN1A基因的一个拷贝发生突变，从而导致细胞或受试者中SCN1A蛋白减少。大多数德拉韦综合征患者携带被翻译成截短的蛋白质的SCN1A突变；与德拉韦综合征相关的其他SCN1A突变，包括剪接位点和错义突变，以及随机分布在整个SCN1A基因中的突变。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)SCN1A基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向SCNA1的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)SCN1A基因的指导核酸(例如，gRNA)。

在一些实施方案中，受试者患有与MED13L单倍体不足综合征相关联的单倍体不足，其中受试者仅具有MED13L基因的单个功能拷贝。患有MED13L单倍体不足综合征的受试者通常在MED13L基因的第二个非功能拷贝中具有突变。MED13L单倍体不足综合征的特征是智力障碍、言语问题、独特的面部特征和发育迟缓。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)MED13L基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向MED13L的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)MED13L基因的指导核酸(例如，gRNA)。

在一些实施方案中，受试者患有与骨髓增生异常综合征相关联的单倍体不足。患有骨髓增生异常综合征的受试者通常在异柠檬酸脱氢酶1(IDH1)、异柠檬酸脱氢酶2(IDH2)和/或GATA2基因的一个拷贝中具有突变。骨髓增生异常综合征是骨髓中的未成熟血细胞不成熟为健康血细胞的一组癌症。有时，此种综合征可导致急性髓系白血病。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)IDH1基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向IDH1的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)IDH1基因的指导核酸(例如，gRNA)。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)IDH2基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向IDH2的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)IDH2基因的指导核酸(例如，gRNA)。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)GATA2基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向GATA2的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)GATA2基因的指导核酸(例如，gRNA)。

在一些实施方案中，受试者患有与狄乔治综合征(DiGeorge syndrome)相关联的单倍体不足。患有狄乔治综合征的受试者通常在22号染色体中间的称为22q11.2的位置有30至40个基因的缺失。特别地，所述疾病的特征可能是TBX基因的单倍体不足。狄乔治综合征的特征是先天性心脏问题、特定面部特征、频繁感染、发育迟缓、学习问题和腭裂。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)TBX基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向TBX的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)TBX基因的指导核酸(例如，gRNA)。

在一些实施方案中，受试者患有与CHARGE综合征相关联的单倍体不足。在大多数情况下，患有CHARGE综合征的受试者对CHD7基因单倍体不足。CHARGE综合征的特征是眼缺损、心脏缺陷、后鼻孔闭锁、生长和/或发育迟缓、生殖器和/或泌尿系统异常、以及耳部异常和耳聋。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)CHD7基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向CHD7的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)CHD7基因的指导核酸(例如，gRNA)。

在一些实施方案中，受试者患有与埃勒斯-当洛综合征(Ehlers–Danlossyndrome)相关联的单倍体不足。患有埃勒斯-当洛综合征的受试者可对COL1A1、COL1A2、COL3A1、COL5A1、COL5A2、TNXB、ADAMTS2、PLOD1、B4GALT7、DSE和/或D4ST1/CHST14基因单倍体不足。埃勒斯-当洛综合征的特征是皮肤弹性过大，并且可导致主动脉夹层、脊柱侧弯和早发性骨关节炎。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)COL1A1、COL1A2、COL3A1、COL5A1、COL5A2、TNXB、ADAMTS2、PLOD1、B4GALT7、DSE或D4ST1/CHST14基因中的任一个的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向COL1A1、COL1A2、COL3A1、COL5A1、COL5A2、TNXB、ADAMTS2、PLOD1、B4GALT7、DSE或D4ST1/CHST14中的任一个的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)COL1A1、COL1A2、COL3A1、COL5A1、COL5A2、TNXB、ADAMTS2、PLOD1、B4GALT7、DSE或D4ST1/CHST14基因中的任一个的指导核酸(例如，gRNA)。

在一些实施方案中，受试者患有与额颞痴呆相关联的单倍体不足。患有FTD的受试者对编码Tau蛋白的MAPT基因和/或GRN基因单倍体不足。FTD的特征是记忆力减退、缺乏社会意识、冲动控制能力差和言语困难。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)MAPT基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向MAPT的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)MAPT基因的指导核酸(例如，gRNA)。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)GRN基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向GRN的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)GRN基因的指导核酸(例如，gRNA)。

在一些实施方案中，受试者患有与霍尔特-奥拉姆综合征(Holt–Oram syndrome)相关联的单倍体不足。患有霍尔特-奥拉姆综合征的受试者对TBX5基因单倍体不足。霍尔特-奥拉姆综合征的特征是心脏并发症，包括先天性心脏缺陷和心脏传导疾病。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)TBX5基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向TBX5的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)TBX5基因的指导核酸(例如，gRNA)。

在一些实施方案中，受试者患有与马凡综合征(Marfan syndrome)相关联的单倍体不足。患有马凡综合征的受试者通常对编码fibrillin-1蛋白的FBN1基因单倍体不足。马凡综合征的特征是肢体长度不成比例、早发性关节炎、心脏并发症和/或自主神经系统功能障碍。在一些实施方案中，本公开的融合蛋白包含特异性靶向(例如，结合)FBN1基因的ZFP结构域以及反式激活结构域。在一些实施方案中，用于靶向FBN1的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白，和(ii)特异性靶向(例如，结合)FBN1基因的指导核酸(例如，gRNA)。

本公开部分地基于向受试者施用如本文所述的融合蛋白的方法。在一些实施方案中，融合蛋白包含DBD和转录激活因子。在一些实施方案中，DBD为ZNF、TALE、dCas蛋白(例如，dCas9或dCas12a)或与SCN1A基因结合的同源结构域。在一些实施方案中，转录激活因子为VP64、p65、RTA或包含VP64-p65-RTA(VPR)的三元转录激活因子。在一些实施方案中，融合蛋白的侧翼为AAV反向末端重复(ITR)序列。在一些实施方案中，融合蛋白可操作地连接到启动子。在一些实施方案中，受试者患有或疑似患有导致SCN1A蛋白质单倍体不足的SCN1A突变。在一些实施方案中，受试者患有或疑似患有德拉韦综合征。

在一些方面，本公开提供了调节(例如，增加、减少等)细胞中靶基因表达的方法。在一些实施方案中，本公开提供了增加细胞中靶基因(例如，SCN1A)表达的方法。在一些实施方案中，细胞为哺乳动物细胞。在一些实施方案中，细胞在受试者中(例如，在体内)。在一些实施方案中，受试者为哺乳动物受试者，例如人。在一些实施方案中，细胞为神经系统细胞(中枢神经系统细胞或外周神经系统细胞)，例如神经元(例如，GABA能神经元、单极神经元、双极神经元、篮细胞、Betz细胞、Lugaro细胞、棘神经元、浦肯野细胞、金字塔神经细胞(Pyrimidal cell)、伦肖细胞(Renshaw cell)、颗粒细胞、运动神经元、梭形细胞等)或神经胶质细胞(例如，星形胶质细胞、少突胶质细胞、室管膜细胞、放射状胶质细胞、雪旺氏细胞、卫星细胞等)。

在“正常”细胞或受试者中，靶基因(例如，SCN1A)的表达足以使得细胞或受试者关于靶基因(例如，SCN1A)不是单倍体不足的。在一些实施方案中，相对于未施用如本文所述的一种或多种分离的核酸、rAAV或组合物的细胞或受试者中转基因的表达或活性，测量转基因的“改善的”或“增加的”表达或活性。在一些实施方案中，相对于在向受试者施用(例如，在施用前和施用后测量基因表达)如本文所述的一种或多种分离的核酸、rAAV或组合物后受试者中转基因的表达或活性，测量转基因的“改善的”或“增加的”表达或活性。例如，在一些实施方案中，相对于未施用编码融合ZFP反式激活因子的转基因的细胞或受试者，测量细胞或受试者中SCN1A的“改善的”或“增加的”表达。在一些实施方案中，本公开所述的方法导致相对于未施用本公开所述的一种或多种组合物的受试者的SCN1A表达和/或活性，受试者中SCN1A表达和/或活性增加2倍至100倍(例如，2倍、5倍、10倍、50倍、100倍等)。

如本文所用，术语“治疗(treatment/treating)”和“疗法”是指治疗性治疗和预防性(prophylactic/preventative)操作。所述术语还包括改善现有症状、预防另外的症状、改善或预防症状的根本原因、预防或逆转症状的原因，例如与单倍体不足基因(例如，单倍体不足SCN1A基因)相关的症状。因此，所述术语表示已将有益结果赋予患有病症(例如，与单倍体不足基因相关的疾病或病状，例如，德拉韦综合征)或具有发展此种病症的潜力的受试者。此外，术语“治疗”还包括将剂(例如，治疗剂或治疗组合物，例如靶向或结合靶基因或靶基因的调控区的分离的核酸或rAAV)应用或施用于受试者或来自受试者的分离组织或细胞系，所述受试者可能患有疾病、疾病症状或疾病倾向，其目的是治疗、治愈、缓解、减少、改变、补救、缓和、改善或影响疾病、疾病症状或疾病倾向。

治疗剂或治疗组合物可包括药学上可接受形式的化合物，其防止和/或减少特定疾病(例如，与单倍体不足基因相关的疾病或病状，例如德拉韦综合征)的症状。例如，治疗组合物可为防止和/或减少与单倍体不足基因相关的疾病或病状(例如，德拉韦综合征)的症状的药物组合物。设想本发明的治疗组合物将以任何合适的形式提供。治疗组合物的形式将取决于许多因素，包括如本文所述的施用模式。治疗组合物可含有稀释剂、佐剂和赋形剂以及如本文所述的其他成分。

施用模式

可根据本领域已知的任何适当方法将本公开的分离的核酸、rAAV和组合物以组合物形式递送至受试者。例如，可将优选地悬浮在生理相容载剂中(例如，组合物中)的rAAV施用于受试者，即宿主动物，诸如人、小鼠、大鼠、猫、狗、绵羊、兔、马、牛、山羊、猪、豚鼠、仓鼠、鸡、火鸡或非人灵长类动物(例如，猕猴)。在一些实施方案中，宿主动物不包括人。

将rAAV递送至哺乳动物受试者可通过例如肌肉内注射或通过施用至哺乳动物受试者的血流中。可通过注射到静脉、动脉或任何其他血管导管中来施用到血流中。在一些实施方案中，通过隔离肢体灌注将rAAV施用到血流中，这是外科领域众所周知的技术，所述方法基本上使技术人员能够在施用rAAV病毒粒子之前将肢体与体循环隔离。描述于美国专利号6,177,403中的隔离肢体灌注技术的变体也可由技术人员用来将病毒粒子施用到隔离肢体的脉管系统中，以潜在地增强向肌肉细胞或组织中的转导。此外，在某些情况下，可能需要将病毒粒子递送至受试者的CNS。“CNS”意指脊椎动物脑和脊髓的所有细胞和组织。因此，所述术语包括但不限于神经元细胞、神经胶质细胞、星形胶质细胞、脑脊液(CSF)、间隙空间、骨、软骨等。可通过使用本领域已知的神经外科技术，用针、导管或相关装置将重组AAV注射到例如心室区以及纹状体(例如，纹状体的尾状核或壳核)、丘脑、脊髓和神经肌肉接头或小脑小叶来直接递送至CNS或大脑，所述外科技术诸如通过立体定向注射(参见例如，Stein等人,J Virol 73:3424-3429,1999；Davidson等人,PNAS 97:3428-3432,2000；Davidson等人,Nat.Genet.3:219-223,1993；以及Alisky和Davidson,Hum.Gene Ther.11:2315-2329,2000)。在一些实施方案中，通过静脉内注射施用如本公开所述的rAAV。在一些实施方案中，通过脑内注射施用rAAV。在一些实施方案中，通过鞘内注射施用rAAV。在一些实施方案中，通过纹状体内注射施用rAAV。在一些实施方案中，通过颅内注射递送rAAV。在一些实施方案中，通过大池注射递送rAAV。在一些实施方案中，通过脑侧脑室注射递送rAAV。

本公开的方面涉及包含重组AAV的组合物，所述重组AAV包含衣壳蛋白和编码转基因的核酸，其中转基因包含编码一种或多种蛋白质的核酸序列。在一些实施方案中，核酸还包含AAV ITR。在一些实施方案中，组合物还包含药学上可接受的载剂。

本公开的组合物可包含单独的rAAV或与一种或多种其他病毒的组合的rAAV(例如，编码具有一种或多种不同转基因的第二rAAV)。在一些实施方案中，组合物包含1、2、3、4、5、6、7、8、9、10种或更多种不同的rAAV，其各自具有一种或多种不同的转基因。

鉴于rAAV所针对的适应症，本领域技术人员可容易地选择合适的载剂。例如，一种合适的载剂包括盐水，其可与多种缓冲溶液(例如，磷酸盐缓冲盐水)一起配制。其他示例性载剂包括无菌盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油和水。载剂的选择并不是对本公开的限制。

任选地，除了rAAV和一种或多种载剂之外，本公开的组合物还可含有其他常规药物成分，诸如防腐剂或化学稳定剂。合适的示例性防腐剂包括氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯苯酚和泊洛沙姆(非离子表面活性剂)诸如F-68。合适的化学稳定剂包括明胶和白蛋白。

以足够量施用rAAV，以转染所需组织的细胞，并提供足够水平的基因转移和表达，而不产生过度的副作用。常规和药学上可接受的施用途径包括但不限于直接递送至所选器官(例如，经门静脉递送至肝脏)、口服、吸入(包括鼻内和气管内递送)、眼内、静脉内、肌肉内、皮下、皮内、瘤内和其他肠胃外施用途径。如果需要，可组合施用途径。

实现特定“治疗效果”所需的rAAV病毒粒子的剂量(例如，基因组拷贝数/每千克体重(GC/kg)的剂量单位)将根据多种因素而变化，所述因素包括但不限于：rAAV病毒粒子施用的途径、实现治疗效果所需的基因或RNA表达水平、所治疗的特定疾病或病症以及基因或RNA产物的稳定性。本领域技术人员可基于上述因素以及本领域众所周知的其他因素容易地确定治疗患有特定疾病或病症的患者的rAAV病毒粒子剂量范围。

rAAV的有效量为足以靶向感染动物、靶向所需组织的量。在一些实施方案中，在溶酶体贮积疾病的症状前阶段向受试者施用有效量的rAAV。在一些实施方案中，溶酶体贮积疾病的症状前阶段发生在出生(例如，围产期)与4周龄之间。

在一些实施方案中，配制rAAV组合物以减少组合物中AAV颗粒的聚集，特别是在存在高rAAV浓度(例如，约10¹³GC/mL或更高)的情况下。用于减少rAAV聚集的方法是本领域众所周知的，并且包括例如添加表面活性剂、pH调节、盐浓度调节等。(参见例如，Wright FR等人,Molecular Therapy(2005)12,171–178，其内容以引用的方式并入本文。)

本领域技术人员熟知药学上可接受的赋形剂和载剂溶液的配方，以及用于在各种治疗方案中使用本文所述的特定组合物的合适剂量和治疗方案的开发。

通常，这些制剂可含有至少约0.1％的活性化合物或更多，尽管一种或多种活性成分的百分比当然可变化，并且可方便地在总制剂重量或体积的约1％或2％和约70％或80％或更多之间。自然地，每种治疗上有用的组合物中活性化合物的量可以这样的方式制备，即在化合物的任何给定单位剂量中将获得合适的剂量。制备此类药物制剂领域的技术人员将设想诸如溶解度、生物利用度、生物半衰期、施用途径、产品保质期以及其他药理学考虑的因素，并且因此，多种剂量和治疗方案可为希望的。

在某些情况下，需要通过皮下、胰内、鼻内、肠胃外、静脉内、肌肉内、鞘内或口服、腹膜内或通过吸入递送本文公开的适当配制的药物组合物中的基于rAAV的治疗构建体。在一些实施方案中，如描述于美国专利号5,543,158；5,641,515和5,399,363(各自以引用的方式整体具体并入本文)中的施用模式可用于递送rAAV。在一些实施方案中，优选的施用模式为通过门静脉注射。

适于注射使用的药物剂型包括无菌水性溶液或分散剂以及用于临时制备无菌可注射溶液或分散剂的无菌粉末。分散体也可在甘油、液态聚乙二醇及其混合物和在油中制备。在普通的储存和使用条件下，这些制剂含有防腐剂以防止微生物的生长。在许多情况下，所述形式为无菌的且为易于注射的流体。在制造和储存条件下，所述组合物必须稳定且必须在贮存中防止诸如细菌和真菌的微生物的污染作用。载剂可为溶剂或分散介质，其含有例如水、乙醇、多元醇(例如，甘油、丙二醇和液态聚乙二醇等)、其合适的混合物和/或植物油。例如，可通过包衣(诸如卵磷脂)的使用、通过维持所需的粒子大小(在分散体的情况下)以及通过使用表面活性剂来维持适当的流动性。防止微生物作用可通过各种抗细菌和抗真菌剂(例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞(thimerosal)等)来达成。在许多情况下，将为优选的是包括等张剂，例如糖或氯化钠。延长可注射组合物的吸收可通过在组合物中使用延迟吸收的剂(例如单硬脂酸铝和明胶)来达成。

例如，对于施用可注射水溶液，如果需要，可适当地缓冲溶液，并且首先使液体稀释剂与足够的盐水或葡萄糖等渗。这些特定的水溶液特别适用于静脉内、肌肉内、皮下和腹膜内施用。在此方面，可使用的无菌水介质是本领域技术人员已知的。例如，可将一个剂量溶解于1mL等渗NaCl溶液中，然后添加到1000mL皮下输液中或在提议的输液部位注射，(参见例如，″Remington's Pharmaceutical Sciences″第15版，第1035-1038和1570-1580页)。取决于宿主的状况，剂量必然将存在一定的变化。在任何情况下，负责施用的人将决定各个宿主的适当剂量。

无菌可注射溶液是通过将活性rAAV以所需量在必要时与本文列举的各种其它成分一起并入适当溶剂中，随后进行过滤灭菌来制备。通常，通过将多种灭菌活性成分并入含有碱性分散介质和来自上文所列举那些成分的所需其它成分的无菌媒剂中来制备分散体。在用于制备无菌可注射溶液的无菌粉末的情况下，优选的制备方法是真空干燥技术和冷冻干燥技术，由此产生活性成分外加来自其先前无菌过滤溶液的任何额外所需成分的粉末。

本文公开的rAAV组合物也可配制成中性或盐形式。药学上可接受的盐包括与例如像氢氯酸或磷酸的无机酸或诸如乙酸、草酸、酒石酸、扁桃酸等的有机酸形成的酸加成盐(用蛋白质的游离氨基形成的)。用游离羧基形成的盐也可源自例如像氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁的无机碱和诸如异丙胺、三甲胺、组氨酸、普鲁卡因等的有机碱。当配制时，将以与剂量制剂相容的方式且以治疗有效量施用溶液。制剂是以诸如可注射溶液剂、药物释放胶囊剂等的多种剂型容易地施用。

如本文所用，“制剂”包括任何和全部溶剂、分散介质、媒介物、包衣、稀释剂、抗菌剂和抗真菌剂、等渗剂和吸收延迟剂、缓冲剂、载剂溶液、悬浮剂、胶体等。用于药物活性物质的此类介质和剂的用途是本领域众所周知的。补充活性成分也可并入组合物中。短语“药学上可接受的”是指当施用于宿主时不产生过敏或类似不良反应的分子实体和组合物。

诸如脂质体、纳米胶囊、微粒、微球、脂质颗粒、囊泡等的递送媒介物可用于将本公开的组合物引入到合适的宿主细胞中。特别地，rAAV载体递送的转基因可被配制用于封装在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中递送。

此类制剂可优选用于引入本文公开的核酸或rAAV构建体的药学上可接受的制剂。脂质体的形成和使用通常是本领域技术人员已知的。最近，脂质体的开发提高了血清稳定性和循环半衰期(美国专利号5,741,516)。此外，已描述了脂质体和脂质体样制剂作为潜在药物载剂的各种方法(美国专利号5,567,434；5,552,157；5,565,213；5,738,868和5,795,587)。

脂质体已成功用于通常对通过其他程序的转染具有抗性的许多细胞类型。另外，脂质体不受基于病毒的递送系统典型的DNA长度限制。脂质体已被有效地用于将基因、药物、放射治疗剂、病毒、转录因子和变构效应物引入多种培养的细胞系和动物中。另外，已经完成了检查脂质体介导的药物递送有效性的几项成功的临床试验。

脂质体由分散在水介质中并自发形成多层同心双层囊泡(也称为多层囊泡(MLV))的磷脂形成。MLV通常具有25nm至4μm的直径。MLV的超声处理导致形成核心中含有水溶液的直径在至范围内的小单层囊泡(SUV)。

替代地，可使用rAAV的纳米胶囊制剂。纳米胶囊通常可以稳定且可重复的方式捕获物质。为避免由于细胞内聚合物过载而产生副作用，应使用能够在体内降解的聚合物来设计此类超细颗粒(大小为约0.1μm)。设想使用满足这些要求的可生物降解的聚氰基丙烯酸烷基酯纳米颗粒。

除了上述递送方法之外，还设想以下技术作为将rAAV组合物递送至宿主的替代方法。超声波导入术(即超声波)已在美国专利号5,656,016号中作为提高药物渗透进入和穿过循环系统的速度和功效的装置使用和描述。设想的其他药物递送替代方案为骨内注射(美国专利号5,779,708)、微芯片装置(美国专利号5,797,898)、眼用制剂(Bourlais等人，1998)、透皮基质(美国专利号5,770,219和5,783,208)和反馈控制递送(美国专利号5,697,899)。

实施例

实施例1.上调SCN1A基因表达的锌指蛋白的设计

人(HEK293T细胞)和小鼠(HEPG2细胞)SCN1A启动子序列之间的同源区通过对在RIKEN CAGE-seq数据集中鉴定的每个物种的两个突出转录起始位点周围的序列进行比对来鉴定(图1)。人(HEK)和小鼠(HEPG2)之间的高度保守序列存在于SCN1A的近端启动子区中(图2)。由六个指组成的三个ZFP被设计为通过组装具有预定义DNA结合特异性的一个指和两个指模块来结合SCN1A近端启动子区中重叠的15-22个核苷酸同源区(图3)。各自由六个指组成的三个ZFP(ZFP1-ZFP3)被设计成结合图3中鉴定的重叠的高度保守序列。每个指被设计为结合SCN1A近端启动子的高度保守区中的三个碱基区(三联体)。

ZFP-1识别SCN1A基因(SEQ ID NO：2)的近端启动子区中的单独的三个碱基区(以红色表示的DNA三联体，通过“·”分隔)，如图4A所示。ZFP-1的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列，如图4B所示。ZFP-1(SEQ ID NO:17-22)的六个指的氨基酸序列在图4C中示出；指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。ZFP-1(SEQ ID NO：11-16)的六个指的核苷酸序列在图4D中示出。

表1.靶向SCN1A的ZFP-1识别螺旋

ZFP-2识别SCN1A基因(SEQ ID NO：3)的近端启动子区中的单独的三个碱基区(以红色表示的DNA三联体，通过“·”分隔)，如图5A所示。ZFP-2的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列，如图5B所示。ZFP-2(SEQ ID NO:29-34)的六个指的氨基酸序列在图5C中示出；指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。ZFP-1(SEQ ID NO：23-28)的六个指的核苷酸序列在图5D中示出。

表2.靶向SCN1A的ZFP-2识别螺旋

ZFP-3识别SCN1A基因(SEQ ID NO：4)的近端启动子区中的单独的三个碱基区(以红色表示的DNA三联体，通过“·”分隔)，如图6A所示。ZFP-3的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列，如图6B所示。ZFP-3(SEQ ID NO:41-46)的六个指的氨基酸序列在图6C中示出；指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。ZFP-1(SEQ ID NO:35-40)的六个指的核苷酸序列在图6D中示出。

表3.靶向SCN1A的ZFP-3识别螺旋

经设计来靶向SCN1A基因近端启动子区中保守序列的另外的ZFP将各自包含五个或六个指结构域，并将与在人和小鼠SCN1A之间高度保守的15-22个核苷酸的区结合。

表4.靶向SCN1A的锌指蛋白

实施例2.ZFP增加人细胞中SCN1A基因的表达

为了检查ZFP1-ZFP3上调SCN1A转录的能力，将ZFP1-ZFP3DNA结合结构域与杂交VP64、p53和RTA(VPR)三元强转录激活因子结构域融合以形成嵌合反式激活因子。VPR融合激活因子结构域用于募集转录调控复合物并增加染色质可及性，并且有助于实现高水平的基因表达。因此，ZFP结构域将VPR激活因子靶向至近端启动子区中的高度保守序列，以增加SCN1A基因表达。

通过瞬时转染将编码VPR-ZFP1、VPR-ZFP2和/或VPR-ZFP3融合蛋白的表达质粒转染到HEK293细胞中，并且通过qRT-PCR(使用TBP表达作为归一化参考)测量SCN1A基因表达。VPR-ZFP融合包含融合到VPR的ZFP1、ZFP2和/或ZFP3。含有各自融合到VPR的ZFP1、ZFP2和ZFP3 DNA结合结构域的用于多重调控的三种构建体的转染导致SCN1A基因表达相对于未转染细胞增加45倍，这表明VPR-ZFP嵌合反式激活因子能够通过结合在基因的启动子近端区中来增加SCN1A基因表达(图7)。

VPR-[ZFP1-ZFP3]融合蛋白以及其中目前正在设计ZFP DNA结合结构域的VPR-ZFP融合蛋白正在HeLa和HEPG2细胞中转染，这两种细胞都具有低水平的SCN1A表达。VPR-ZFP融合蛋白含有融合到VPR反式激活因子的单个ZFP DNA结合结构域以及多个ZFP DNA结合结构域的组合。通过qRT-PCR测量SCN1A基因表达，以确定这些VPR-ZFP融合是否能够增加基因表达。在腺相关病毒(AAV)递送融合蛋白后，在原代小鼠皮层神经元中测试最有希望的VPR-ZFP融合候选物的增加SCN1A表达的能力。

正在使用细菌单杂交选择系统进一步优化ZFP结构域的特异性(参见例如，Meng等人,“Targeted gene inactivation in zebrafish using engineered zinc-fingernucleases,”Nat Biotechnol,2008)，以从随机文库中鉴定理想的ZFP，其中对DNA结合重要的残基是不同的。新选择的ZFP将与VPR反式激活因子结构域融合，无论是单独的ZFP还是多个ZFP的组合，并在HEK293、HeLa和HEPG2细胞以及原代小鼠皮层神经元中转染，以鉴定在qRT-PCR分析后最能增加SCN1A基因表达的候选ZFP结构域。

实施例3.生成具有不同效力的ZFP^SCN1A反式激活因子系列

实施例2中上调SCN1A基因表达的最有效ZFP融合至具有预期效力的梯度的一系列人反式激活结构域(例如，Rta、p65、Hsf1等)，以鉴定在AAV感染复数(MOI)范围内实现SCN1A基因表达2倍上调的组装。用表达ZFP^SCN1A融合反式激活因子的AAV载体感染来自正常和SCN1A^+/-小鼠的小鼠原代皮层神经元。Na_V1.1蛋白的表达水平通过使用蛋白质印迹和qPCR进行评估。用TGF-α处理8小时的原代神经元用作阳性对照，因为该处理使Na_V1.1蛋白表达增加约6至8倍(Chen等人,2015,Neuroinflammation 12:126)。还评估了其他Na_Vα亚基基因表达水平的变化，以证明ZFP^SCN1A反式激活的特异性。免疫荧光用于通过针对ZFP^SCN1A(HA标签)和对GABA能神经元具有特异性的标志物(例如，小白蛋白⁺或生长抑素⁺)或通用神经元标志物(例如，NeuN、TUBIII和/或Map2)的抗体的双重免疫荧光染色来确定Na_V1.1表达是否仍然局限于GABA能中间神经元。ZFP^SCN1A对SCN1A基因反式激活的特异性也通过ChIP-Seq和RNA-Seq进行评估，以绘制基因组结合位点和基因转移后产生的转录组增殖。

实施例4.指导启动子活性依赖性SCN1A-ZFP反式激活因子的设计的GABA能抑制剂中SCN1A启动子的组蛋白组织和表观基因组的图谱

ZFP结合基因组靶点的能力取决于靶序列的可及性(例如，无核小体区的存在)。对DNA可及性的这一要求被用来设计ZFP反式激活因子，所述ZFP反式激活因子仅在基于DNA靶序列可及性的存在的细胞类型子集中起作用。通过使用ZFP反式激活因子表达的组织特异性启动子实现对细胞类型活性的另外限制。来自河豚(红鳍东方鲀(Takifugu rubripes))生长抑素和神经肽Y基因的小启动子已被证明在AAV载体和慢病毒的背景下驱动皮质和海马抑制性中间神经元中的高度特异性转基因表达。在一些实施方案中，对DNA可及性敏感的SCN1A特异性ZFP的基于AAV的转录限制的组合导致整个大脑中抑制性中间神经元中Na_V1.1蛋白表达的高度特异性上调。该双重调控方法将最小化Na_V1.1蛋白在正常情况下不表达的细胞中异位表达可能产生的副作用。

在小鼠和人GABA能抑制和谷氨酸能兴奋性神经元中分析了SCN1A启动子的核小体结构和表观遗传图谱。该信息用于通过靶向仅可在该细胞类型中的SCN1A基因座周围可及的序列来设计GABA能抑制性神经元限制性ZFP反式激活因子。

使用荧光激活细胞分选(FACS)分离在GAD67启动子下表达TdTomato的转基因小鼠的GABA能抑制神经元和通过Emx1-IRES-Cre与ROSA26/终止/EGFP小鼠杂交产生的GFP阳性谷氨酸兴奋性神经元。人GABA能和兴奋性神经元由诱导多能干细胞(iPS)细胞产生，并使用免疫染色和RT-PCR确认对这些细胞类型具有特异性的标志物以及电生理活性。使用转座酶可及染色质测定(ATAC-Seq)表征小鼠和人神经元群中SCN1A启动子周围的可及基因组区。

基于抑制性和兴奋性神经元中SCN1A启动子周围基因组区的差异染色质可及性设计识别仅在GABA能神经元中可及的序列的ZFP^SCN1A反式激活因子。正在产生一系列候选ZFP-VPR反式激活因子融合，以靶向不同的SCN1A可及区，其中反式激活因子的结合有望有效上调抑制区中的Na_V1.1表达，以及揭示兴奋性神经元中Na_V1.1表达的任何不希望的诱导表达。

在模拟德拉韦综合征的培养的人iPS衍生神经元和小鼠SCN1A^+/-原代神经元中进行表达研究，以确定经设计用于识别仅在抑制性神经元中可及的DNA序列的ZFP^SCN1A反式激活因子在从泛神经元人突触蛋白1或抑制性中间神经元特异性启动子下的AAV载体表达时，是否提供必要的特异性。Na_V1.1表达水平通过qRT-PCR、蛋白质印迹和双重免疫荧光测定，其具有抑制性GABA能(例如，GABA⁺、GAD65/67⁺、生长抑素和/或小白蛋白)和兴奋性谷氨酸能(例如，Cux1+、FoxG1,+、GABA_A受体、GABA^-)神经元的神经元类型特异性标志物。ZFP^SCN1A反式激活因子的细胞类型特异性被设计为靶向小鼠和人SCN1A启动子中的不同序列，因为同线区内的染色质结构和DNA序列在物种之间不同。这些实验中的对照包括感染有类似AAV载体的神经元培养物，所述AAV载体编码GFP、不含反式激活结构域的ZFP或不含ZFP DNA结合结构域的反式激活因子。

微小RNA(miRNA)结合位点被并入ZFP^SCN1A反式激活因子的3'非翻译区(3'UTR)中，所述反式激活因子仅限于其中发生不希望的表达的细胞类型(例如，谷氨酸能兴奋性神经元)。该方法先前用于限制AAV递送的转基因的表达(Xie等人,“MicroRNA-regulated,systematically delivered rAAV9：a step closer to CNS-restricted transgeneexpression,”Mol.Ther.2011)。GABA能抑制性神经元和其他细胞类型的miRNA表达谱的差异正在通过小RNA测序确定。

实施例5.评价AAV-ZFP^SCN1A基因疗法纠正患者来源的iPS产生的GABA能中间神经元中钠电流缺陷的潜力

开发用于德拉韦综合征的一种或多种ZFP^SCN1A反式激活因子的关键步骤是证明这些人工反式激活因子在人神经元中具有所需的功能。为此，正在获得来自德拉韦患者(n＝4-6)和非德拉韦患者(n＝4)的iPS细胞。非德拉韦遗传背景在这些细胞中得以表达，无需人工操纵基因表达，并且因此iPS细胞已成为生物医学研究的最先进细胞系。CRISPR-Cas9基因组编辑技术正用于通过将SCN1A中的遗传突变修复为野生型序列，或通过将德拉韦相关突变引入对照细胞系内的正常等位基因来创建等基因细胞系。因此，等基因系消除了因比较来自不同人受试者的细胞系而产生的自然可变性，并因此对于确认和增强疾病特异性表型具有价值。已建立的抑制性神经元分化方案和验证管道正用于将iPS细胞系分化为前脑GABA能抑制剂中间神经元。

如通过全细胞膜片钳电生理学测量确定，来自德拉韦患者的抑制性神经元表现出减少的钠电流和受损的动作电位放电。正在进行类似的测量，以确认本文所述的德拉韦衍生神经元概括了这些疾病相关表型。钠电流缺陷发生在抑制剂中，但不发生在德拉韦患者中的兴奋性神经元中(Sun等人)，并且因此在本公开中仅使用抑制性神经元。德拉韦患者来源的抑制性神经元中突变诱导的钠通道缺陷可通过野生型SCN1A的异位表达来挽救(参考文献20)。因此，本公开中描述的方法适用于测试ZFP^SCN1A反式激活因子在德拉韦综合征背景下恢复野生型钠通道功能和生理机能的功效。

GABA能抑制性神经元培养物在通用神经元或抑制性神经元特异性启动子下被编码ZFP^SCN1A反式激活因子的AAV载体感染。正通过蛋白质印迹法评估Na_V1.1表达水平的变化。与转染细胞相比，正通过未转染细胞的全细胞膜片钳来评估抑制性神经元中功能性钠电流的恢复。正在通过ChIP-seq分析所有患者来源的抑制性神经元内的基因组中ZFP^SCN1A反式激活因子的结合，并与通过RNA-seq检测到的任何鉴定的转录组变化相关。这些实验中的对照为感染有类似AAV载体的神经元培养物，所述AAV载体编码GFP、不含VPR反式激活结构域的ZFP和不含ZFP DNA结合结构域的VPR反式激活因子结构域。

实施例6.评估AAV-ZFP^SCN1A干预在SCN1A小鼠中不同年龄和递送途径下的治疗潜力

AAV的广泛趋向性是广泛表达基因的基因疗法应用的关键特性，但当关注的转基因以细胞类型特异性方式表达时，可能成为重大挑战。通过使用组织特异性启动子诸如甲状腺素结合蛋白(TBP)、肌酸激酶和肌钙蛋白T，分别在很大程度上解决了诸如肝脏、肌肉和心脏的身体中主要组织的这个问题。可将另外的控制水平叠加在组织特异性启动子上，以通过掺入在那些组织中高度丰富的微小RNA的结合位点的多个拷贝(诸如肝脏中的miR-122和骨骼肌中的miR-1)来实现从特定组织中更高程度的脱靶。在转导广泛的细胞类型的情况下，最近描述的AAV-PHP.B血清型对于全身递送后的CNS基因转移非常有效。此外，它对外周组织的趋向性在很大程度上与AAV9的趋向性一样广泛。德拉韦综合征的基因疗法方法的目标是完全恢复GABA能抑制性中间神经元中的Na_V1.1表达，同时防止其他神经元和别处异位表达产生有害影响。在源自河豚(红鳍东方鲀)生长抑素(fSST)和神经肽Y(fNPY)基因的小启动子下编码GFP的AAV和慢病毒载体(<2.8kb)已显示在颅内注射后驱动小鼠大脑中的抑制性神经元特异性表达。携带驱动GFP表达的这些启动子的AAV-PHP.B载体与对照载体正在进行比较，其中转基因表达由泛在的强CAG启动子和最小相对较弱的小鼠MeCP2启动子驱动。通过在6周龄(尾静脉)和出生后第1天(眶后)小鼠全身施用、新生儿CSF递送以及最后靶向齿状回(DG)的单侧注射递送至CNS后，正在研究具有fSST和fNYP启动子的AAV-PHP.B-GFP载体对GABA能抑制性中间神经元的特异性(表5)。CNS基因转移的效率因递送途径的不同而有很大差异，并且因为不同年龄的Scn1a^+/-小鼠正在进行治疗，因此正在进行广泛的分析，以建立每个递送途径在整个CNS中对GABA能抑制性中间神经元的神经元转导功效和启动子特异性的基线。从短fSST和fNYP启动子驱动GFP表达的AAV载体先前已被证明对直接注射后海马中的抑制性中间神经元具有高度特异性。本公开的AAV-PHP.B载体正在以与后续研究相同的方式进行验证，其中正在评估恢复Scn1a^+/-小鼠海马形成中抑制性神经元中Na_V1.1表达(特别位于齿状回和颗粒细胞层内壁)的治疗影响(基本原理如下明确地表达)。正在通过将129SvJ与从Jackson Laboratories(Bar Harbor,ME)获得的C57BL/6小鼠交配而在UMMS产生的129SvJ/C57BL/6小鼠中进行实验。在注射后一个月对小鼠实施安乐死，并收集大脑和脊髓以使用细胞特异性标志物和GFP的抗体的双重免疫荧光对转导效率和特异性进行组织学分析。通过用针对谷氨酸脱羧酶(GAD；GABA能神经元的标志物)和GFP的抗体的双重免疫荧光染色，正在评估整个大脑和脊髓中GABA能抑制性中间神经元的基因转移效率和特异性。另外，使用对那些蛋白质和GFP具有特异性的抗体评估了启动子和/或AAV-PHP.B对表达生长抑素(SST)、小白蛋白(PV)、钙视网膜蛋白(CR)、血管活性肠肽(VIP)或神经肽Y(NPY)的抑制性中间神经元亚群的优先特异性。从通过全身和ICV施用处理的小鼠中收集肝脏、心脏和骨骼肌，以在组织学上评估GFP表达，并且正在利用蛋白质印迹来确定外周组织中异位表达的可能性。

表5.实验组

^*各组由来自两性的相等数量的小鼠组成。

^#每种载体注射一窝

缩写：ICV–侧脑室注射；IC–颅内注射；PND1–产后第1天

向六周龄的Scn1a^+/-小鼠施用编码不同ZFP^Scn1a反式激活因子蛋白的AAV-PHP.B载体(一种具有ZFP^Scn1a激活结构域但没有DNA结合结构域来控制单独激活因子影响的构建体)或相同体积的磷酸盐缓冲盐水(PBS)的双侧注射液到齿状回中(n＝3只雄性+3只雌性/组)。这些实验中使用的单链AAV载体还携带ZFP^Scn1a cDNA下游的IRES-GFP盒，以促进识别转导细胞。测试了至少两种ZFP^Scn1a反式激活因子，它们可能在多种神经元中具有更广泛的激活，以及上述两种最有希望的GABA能抑制性神经元限制性ZFP^SCN1A反式激活因子。注射后一个月，收获大脑并解剖来自一个大脑半球的海马，以通过使用β-肌动蛋白或微管蛋白作为负载对照的蛋白质印迹评估ZFP^Scn1a、Na_V1.1、Na_V1.3、GAD65、GAD67蛋白的表达水平。通过使用连续脑切片(10μm)的组织学研究检查另一个大脑半球，以通过具有针对GAD和GFP或GAD和包括在所有ZFP^Scn1a蛋白中的表位标签(HA或myc标签)的抗体的双重免疫荧光染色分析颗粒细胞层的齿状回和内小叶中转导的抑制性中间神经元％。此外，正在确定表达Na_V1.1和Na_V1.3的GAD阳性神经元的百分比，以证明钠通道表达的正常模式的恢复。除了对Na_V1.1和Na_V1.3蛋白表达进行免疫荧光检测外，还使用针对Na_V1.1、Na_V1.3、ZFP^Scn1a和GAD的RNAscope探针评估GABA能中间神经元中mRNA水平的变化。RNAScope是分析大脑内神经元中的mRNA水平的高度灵敏的原位杂交技术。评估由ZFP^Scn1a表达引起的Na_V1.1水平变化的这两种方法的组合提供了对中间神经元变化如何通过本公开的基因疗法方法实现的全面理解。

在出生后第1天或6周龄时通过尾静脉开始的两种性别的Scn1a^+/-小鼠中对AAV-PHP.B-ZFP^Scn1a基因疗法的治疗功效进行分析。对照包括用AAV载体处理的小鼠，所述AAV载体编码不含ZFP DNA结合结构域的ZFP样蛋白；以及年龄匹配的未处理的Scn1a^+/-小鼠和野生型同窝小鼠(n＝每组15只雄性和15只雌性)。每组中的小鼠的子集(n＝3只雄性和3只雌性)在12周龄时被安乐死，以使用蛋白质印迹法以及使用针对GAD(和其他神经元类型特异性标志物，例如GAD65、GAD67)和ZFP的抗体的免疫荧光来评估基因转移到GABA能中间神经元的效率，以及恢复整个大脑和脊髓中那些细胞中的Na_V1.1表达。此外，评估了ZFP的异位表达以及外周组织中的Na_V1.1表达。每组中的其他动物子集(n＝24)正在用于研究对存活率(最多1岁)、运动表现和行为的影响，从2-12个月龄开始每两个月对其进行一次测试。由于Scn1a^+/-小鼠表现出由PND21导致的前肢和后肢协调受损，使用加速旋转和波束交叉测试评估运动功能和协调性。另外，正在使用行为测试，其中Scn1a^+/-小鼠表现出受损的表现，包括：露天场地、高架十字迷宫、筑巢、大理石埋藏和巴恩斯迷宫，以测试Scn1a^+/-小鼠中似乎严重受损的空间学习和记忆。德拉韦综合征患者的自发性癫痫发作特征在Scn1a^+/-小鼠中也很明显，并且频率随着年龄和体温而增加。此外，Scn1a^+/-小鼠的过早猝死在强直阵挛发作后立即发生。因此，在2个月、6个月和12个月龄时使用连续视频监测24小时，以评估癫痫发作频率和持续时间。如果在上述测试中测量的主要结果中检测到显著变化，则考虑使用对新物体、气味和老鼠做出响应的箱偏好读数的社交互动研究。在人道终点实验收集和评估大脑、脊髓和外周器官，以进行上述分子和组织学分析。

实施例7.ZFP和dCas9系统增加人细胞中SCN1A基因的表达

此外，为了检查靶向SCN1A的dCas9系统上调SCN1A转录的能力，将靶向SCN1A的三个指导RNA与dCas9蛋白复合。

用以下实验条件中的一个对HEK293T细胞进行瞬时转染–(1)VPR-ZFP1构建体；(2)VPR-ZFP2构建体；(3)VPR-ZFP3构建体；(4)VPR-ZFP1、VPR-ZFP2、和VPR-ZFP3构建体中的所有三个；(5)dCas9-VPR构建体和SCN1A指导RNA 1；(6)dCas9-VPR构建体和SCN1A指导RNA 2；(7)dCas9-VPR构建体和SCN1A指导RNA 3；(8)dCas9-VPR构建体和SCN1A指导RNA 1、SCN1A指导RNA 2和SCN1A指导RNA 3中的所有三个；和(9)不含任何指导RNA的dCas9-VPR构建体(对照)。通过qRT-PCR测量SCN1A基因表达。将SCN1A的折叠激活归一化至对照实验(不含任何指导RNA的dCas9-VPR构建体)。

相对于对照实验，所有测试的实验条件都产生了SCN1A基因激活的增加(图8)。这些数据表明，本实施例和整个本公开中描述的锌指蛋白能够靶向SCN1A以影响基因表达。这些数据进一步证明，该实施例的指导RNA序列(SEQ ID NO:83-94)能够将dCas9靶向至SCN1A以影响基因表达。

表6.靶向SCN1A的指导核酸(间隔区序列以粗体显示)

序列表

<110> 马萨诸塞大学(Univeristy of Massachusetts)

<120> DNA结合结构域反式激活因子及其用途

<130> U0120.70106WO00

<140> 尚未分配

<141> 与此同时

<150> US 62/810,005

<151> 2019-02-25

<160> 121

<170> PatentIn version 3.5

<210> 1

<211> 672

<212> DNA

<213> 智人(Homo sapiens)

<400> 1

aatttccatg gactcttttt ccaaaggaat aactggaatg aataaactta aaatcaagat 60

gaaacaatta gatggcttac ctgattaaaa ggaaaattat ccatctgcag tgaggaacag 120

catcacccaa agacgagatg ataacaatgt gccttcagtt gcaattgttc agttccttct 180

tgcaaaaggt gtcaaagtat ttacaagggc tgcagtctca ctggggcaga acacacagac 240

acacaaacac acacaaacgc acacatacac acatgcacca gagacctctg cagtatcctc 300

tcggcttcat cctcgcctca ctctatggta cctaatacaa atcagcaaat agcttgtttc 360

aaaaaaaaaa aaaagtcaag acagcacctt acattacatc gccatctagt ggctaaatat 420

taaacacttt ctcacaatcc agatttatga tttcttcctc aacctctttt ctctcagctt 480

ttttcctttc ttctctgtaa tctcccagta ttgcttctcc ttgcttctct ttcattccct 540

attgctatat aatatcatga acctaatgac tcaaagagga aaaggtttga aagtaaatat 600

agctattttc aagtagtact tgaaaaactt agcattattt tagtttgaaa ctgttacttt 660

attcctaata tg 672

<210> 2

<211> 669

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 2

tatttccgtg ggctcttctc cccaaggatt taccaggtaa gaattcacca ccaaagaaga 60

tcacaatgag ataatcagat ggcttacctg ataaaaagga aaattatcca tctgcagtca 120

ggagcaacat ctccccacga cgagtccgca ccttccgttg caacgattca gattccttct 180

tgcaaaaggt gaccaagtgc ttcacaaggg ctgcagcctc ataggggaga acacacgtac 240

acaaacacac gcacacacac acacacatgc accagagacc tctgcagtat cctctggctt 300

catcctcgcc tcactctatg gtacctaata caaatcagca aatagcttgt tttaaaaaaa 360

agaaagaaaa aaagcggaga cagcacctaa cgttacagtg ccatctagtg gctacatcgt 420

aaataggttc tcacagcctg gatttctgtg ttctttctca accgcttcct tctggttcct 480

ttttcttttt tcctctttat tttggtttta ttacttcctc agatgccttt ttttcattcc 540

cctttgctct gcctacatgg aactattgac ttaaagatta aaacaatcag aactggagag 600

cgttgctttt aagttaaaaa aaaaaaggtt gctaattttg tttgtaaatg ttactttatt 660

ttctctatt 669

<210> 3

<211> 130

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 3

tttttttttt tttttttgaa acaagctatt tgctgatttg tattaggtac catagagtga 60

ggcgaggatg aagccgagag gatactgcag aggtctctgg tgcatgtgtg tatgtgtgcg 120

tttgtgtgtg 130

<210> 4

<211> 41

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 4

gagtgaggcg aggatgaagc cgagaggata ctgcagaggt c 41

<210> 5

<211> 18

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 5

gagtgaggcg aggatgaa 18

<210> 6

<211> 18

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 6

ggcgaggatg aagccgag 18

<210> 7

<211> 18

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 7

gaggatactg cagaggtc 18

<210> 8

<211> 5

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 8

Glu Gly Glu Asp Glu

1 5

<210> 9

<211> 6

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 9

Gly Glu Asp Glu Ala Glu

1 5

<210> 10

<211> 6

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 10

Glu Asp Thr Ala Glu Val

1 5

<210> 11

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 11

cagcggggaa acctggtgag g 21

<210> 12

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 12

ctgagcttca atctaaccag a 21

<210> 13

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 13

cggagtgaca acttaacgcg g 21

<210> 14

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 14

gaccggtctc accttgcccg a 21

<210> 15

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 15

cagaaggccc atttgactgc c 21

<210> 16

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 16

cggtcggaca acctcacacg c 21

<210> 17

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 17

Gln Arg Gly Asn Leu Val Arg

1 5

<210> 18

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 18

Leu Ser Phe Asn Leu Thr Arg

1 5

<210> 19

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 19

Arg Ser Asp Asn Leu Thr Arg

1 5

<210> 20

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 20

Asp Arg Ser His Leu Ala Arg

1 5

<210> 21

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 21

Gln Lys Ala His Leu Thr Ala

1 5

<210> 22

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 22

Arg Ser Asp Asn Leu Thr Arg

1 5

<210> 23

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 23

cgaagttcca acctgacacg g 21

<210> 24

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 24

gacaagcgga ccttaatccg c 21

<210> 25

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 25

cagcggggaa atctagtgcg a 21

<210> 26

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 26

ctgagcttca acttgactcg t 21

<210> 27

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 27

cggagtgaca atcttacgag a 21

<210> 28

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 28

gaccggagcc acttagccag g 21

<210> 29

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 29

Arg Ser Ser Asn Leu Thr Arg

1 5

<210> 30

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 30

Asp Lys Arg Thr Leu Ile Arg

1 5

<210> 31

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 31

Gln Arg Gly Asn Leu Val Arg

1 5

<210> 32

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 32

Leu Ser Phe Asn Leu Thr Arg

1 5

<210> 33

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 33

Arg Ser Asp Asn Leu Thr Arg

1 5

<210> 34

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 34

Asp Arg Ser His Leu Ala Arg

1 5

<210> 35

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 35

gaccggagcg cgctggcacg g 21

<210> 36

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 36

cgaagtgaca acttaacgcg c 21

<210> 37

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 37

cagtcagggg acctcactcg t 21

<210> 38

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 38

gtacgacaga cgcttaaaca a 21

<210> 39

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 39

gccgctggta acttgacacg a 21

<210> 40

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 40

agatctgata atctaacgcg t 21

<210> 41

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 41

Asp Arg Ser Ala Leu Ala Arg

1 5

<210> 42

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 42

Arg Ser Asp Asn Leu Thr Arg

1 5

<210> 43

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 43

Gln Ser Gly Asp Leu Thr Arg

1 5

<210> 44

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 44

Val Arg Gln Thr Leu Lys Gln

1 5

<210> 45

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 45

Ala Ala Gly Asn Leu Thr Arg

1 5

<210> 46

<211> 7

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 46

Arg Ser Asp Asn Leu Thr Arg

1 5

<210> 47

<211> 1569

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 47

gaggccagcg gttccggacg ggctgacgca ttggacgatt ttgatctgga tatgctggga 60

agtgacgccc tcgatgattt tgaccttgac atgcttggtt cggatgccct tgatgacttt 120

gacctcgaca tgctcggcag tgacgccctt gatgatttcg acctggacat gctgattaac 180

tctagaagtt ccggatctag ccagtacctg cccgacaccg acgaccggca ccggatcgag 240

gaaaagcgga agcggaccta cgagacattc aagagcatca tgaagaagtc ccccttcagc 300

ggccccaccg accctagacc tccacctaga agaatcgccg tgcccagcag atccagcgcc 360

agcgtgccaa aacctgcccc ccagccttac cccttcacca gcagcctgag caccatcaac 420

tacgacgagt tccctaccat ggtgttcccc agcggccaga tctctcaggc ctctgctctg 480

gctccagccc ctcctcaggt gctgcctcag gctcctgctc ctgcaccagc tccagccatg 540

gtgtctgcac tggctcaggc accagcaccc gtgcctgtgc tggctcctgg acctccacag 600

gctgtggctc caccagcccc taaacctaca caggccggcg agggcacact gtctgaagct 660

ctgctgcagc tgcagttcga cgacgaggat ctgggagccc tgctgggaaa cagcaccgat 720

cctgccgtgt tcaccgacct ggccagcgtg gacaacagcg agttccagca gctgctgaac 780

cagggcatcc ctgtggcccc tcacaccacc gagcccatgc tgatggaata ccccgaggcc 840

atcacccggc tcgtgacagg cgctcagagg cctcctgatc cagctcctgc ccctctggga 900

gcaccaggcc tgcctaatgg actgctgtct ggcgacgagg acttcagctc tatcgccgat 960

atggatttct cagccttgct gggctctggc agcggcagcc gggattccag ggaagggatg 1020

tttttgccga agcctgaggc cggctccgct attagtgacg tgtttgaggg ccgcgaggtg 1080

tgccagccaa aacgaatccg gccatttcat cctccaggaa gtccatgggc caaccgccca 1140

ctccccgcca gcctcgcacc aacaccaacc ggtccagtac atgagccagt cgggtcactg 1200

accccggcac cagtccctca gccactggat ccagcgcccg cagtgactcc cgaggccagt 1260

cacctgttgg aggatcccga tgaagagacg agccaggctg tcaaagccct tcgggagatg 1320

gccgatactg tgattcccca gaaggaagag gctgcaatct gtggccaaat ggacctttcc 1380

catccgcccc caaggggcca tctggatgag ctgacaacca cacttgagtc catgaccgag 1440

gatctgaacc tggactcacc cctgaccccg gaattgaacg agattctgga taccttcctg 1500

aacgacgagt gcctcttgca tgccatgcat atcagcacag gactgtccat cttcgacaca 1560

tctctgttt 1569

<210> 48

<211> 523

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 48

Glu Ala Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu

1 5 10 15

Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

20 25 30

Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp

35 40 45

Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser

50 55 60

Gly Ser Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu

65 70 75 80

Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys

85 90 95

Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile

100 105 110

Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln

115 120 125

Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe

130 135 140

Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu

145 150 155 160

Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro

165 170 175

Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro

180 185 190

Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys

195 200 205

Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu

210 215 220

Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp

225 230 235 240

Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln

245 250 255

Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro

260 265 270

Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala

275 280 285

Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu

290 295 300

Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp

305 310 315 320

Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser

325 330 335

Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser

340 345 350

Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro

355 360 365

Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser

370 375 380

Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu

385 390 395 400

Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr

405 410 415

Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln

420 425 430

Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys

435 440 445

Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro

450 455 460

Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu

465 470 475 480

Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu

485 490 495

Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser

500 505 510

Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe

515 520

<210> 49

<211> 6027

<212> DNA

<213> 智人(Homo sapiens)

<400> 49

atggaacaga ccgtgctggt gccgccgggc ccggatagct ttaacttttt tacccgcgaa 60

agcctggcgg cgattgaacg ccgcattgcg gaagaaaaag cgaaaaaccc gaaaccggat 120

aaaaaagatg atgatgaaaa cggcccgaaa ccgaacagcg atctggaagc gggcaaaaac 180

ctgccgttta tttatggcga tattccgccg gaaatggtga gcgaaccgct ggaagatctg 240

gatccgtatt atattaacaa aaaaaccttt attgtgctga acaaaggcaa agcgattttt 300

cgctttagcg cgaccagcgc gctgtatatt ctgaccccgt ttaacccgct gcgcaaaatt 360

gcgattaaaa ttctggtgca tagcctgttt agcatgctga ttatgtgcac cattctgacc 420

aactgcgtgt ttatgaccat gagcaacccg ccggattgga ccaaaaacgt ggaatatacc 480

tttaccggca tttatacctt tgaaagcctg attaaaatta ttgcgcgcgg cttttgcctg 540

gaagatttta cctttctgcg cgatccgtgg aactggctgg attttaccgt gattaccttt 600

gcgtatgtga ccgaatttgt ggatctgggc aacgtgagcg cgctgcgcac ctttcgcgtg 660

ctgcgcgcgc tgaaaaccat tagcgtgatt ccgggcctga aaaccattgt gggcgcgctg 720

attcagagcg tgaaaaaact gagcgatgtg atgattctga ccgtgttttg cctgagcgtg 780

tttgcgctga ttggcctgca gctgtttatg ggcaacctgc gcaacaaatg cattcagtgg 840

ccgccgacca acgcgagcct ggaagaacat agcattgaaa aaaacattac cgtgaactat 900

aacggcaccc tgattaacga aaccgtgttt gaatttgatt ggaaaagcta tattcaggat 960

agccgctatc attattttct ggaaggcttt ctggatgcgc tgctgtgcgg caacagcagc 1020

gatgcgggcc agtgcccgga aggctatatg tgcgtgaaag cgggccgcaa cccgaactat 1080

ggctatacca gctttgatac ctttagctgg gcgtttctga gcctgtttcg cctgatgacc 1140

caggattttt gggaaaacct gtatcagctg accctgcgcg cggcgggcaa aacctatatg 1200

attttttttg tgctggtgat ttttctgggc agcttttatc tgattaacct gattctggcg 1260

gtggtggcga tggcgtatga agaacagaac caggcgaccc tggaagaagc ggaacagaaa 1320

gaagcggaat ttcagcagat gattgaacag ctgaaaaaac agcaggaagc ggcgcagcag 1380

gcggcgaccg cgaccgcgag cgaacatagc cgcgaaccga gcgcggcggg ccgcctgagc 1440

gatagcagca gcgaagcgag caaactgagc agcaaaagcg cgaaagaacg ccgcaaccgc 1500

cgcaaaaaac gcaaacagaa agaacagagc ggcggcgaag aaaaagatga agatgaattt 1560

cagaaaagcg aaagcgaaga tagcattcgc cgcaaaggct ttcgctttag cattgaaggc 1620

aaccgcctga cctatgaaaa acgctatagc agcccgcatc agagcctgct gagcattcgc 1680

ggcagcctgt ttagcccgcg ccgcaacagc cgcaccagcc tgtttagctt tcgcggccgc 1740

gcgaaagatg tgggcagcga aaacgatttt gcggatgatg aacatagcac ctttgaagat 1800

aacgaaagcc gccgcgatag cctgtttgtg ccgcgccgcc atggcgaacg ccgcaacagc 1860

aacctgagcc agaccagccg cagcagccgc atgctggcgg tgtttccggc gaacggcaaa 1920

atgcatagca ccgtggattg caacggcgtg gtgagcctgg tgggcggccc gagcgtgccg 1980

accagcccgg tgggccagct gctgccggaa gtgattattg ataaaccggc gaccgatgat 2040

aacggcacca ccaccgaaac cgaaatgcgc aaacgccgca gcagcagctt tcatgtgagc 2100

atggattttc tggaagatcc gagccagcgc cagcgcgcga tgagcattgc gagcattctg 2160

accaacaccg tggaagaact ggaagaaagc cgccagaaat gcccgccgtg ctggtataaa 2220

tttagcaaca tttttctgat ttgggattgc agcccgtatt ggctgaaagt gaaacatgtg 2280

gtgaacctgg tggtgatgga tccgtttgtg gatctggcga ttaccatttg cattgtgctg 2340

aacaccctgt ttatggcgat ggaacattat ccgatgaccg atcattttaa caacgtgctg 2400

accgtgggca acctggtgtt taccggcatt tttaccgcgg aaatgtttct gaaaattatt 2460

gcgatggatc cgtattatta ttttcaggaa ggctggaaca tttttgatgg ctttattgtg 2520

accctgagcc tggtggaact gggcctggcg aacgtggaag gcctgagcgt gctgcgcagc 2580

tttcgcctgc tgcgcgtgtt taaactggcg aaaagctggc cgaccctgaa catgctgatt 2640

aaaattattg gcaacagcgt gggcgcgctg ggcaacctga ccctggtgct ggcgattatt 2700

gtgtttattt ttgcggtggt gggcatgcag ctgtttggca aaagctataa agattgcgtg 2760

tgcaaaattg cgagcgattg ccagctgccg cgctggcata tgaacgattt ttttcatagc 2820

tttctgattg tgtttcgcgt gctgtgcggc gaatggattg aaaccatgtg ggattgcatg 2880

gaagtggcgg gccaggcgat gtgcctgacc gtgtttatga tggtgatggt gattggcaac 2940

ctggtggtgc tgaacctgtt tctggcgctg ctgctgagca gctttagcgc ggataacctg 3000

gcggcgaccg atgatgataa cgaaatgaac aacctgcaga ttgcggtgga tcgcatgcat 3060

aaaggcgtgg cgtatgtgaa acgcaaaatt tatgaattta ttcagcagag ctttattcgc 3120

aaacagaaaa ttctggatga aattaaaccg ctggatgatc tgaacaacaa aaaagatagc 3180

tgcatgagca accataccgc ggaaattggc aaagatctgg attatctgaa agatgtgaac 3240

ggcaccacca gcggcattgg caccggcagc agcgtggaaa aatatattat tgatgaaagc 3300

gattatatga gctttattaa caacccgagc ctgaccgtga ccgtgccgat tgcggtgggc 3360

gaaagcgatt ttgaaaacct gaacaccgaa gattttagca gcgaaagcga tctggaagaa 3420

agcaaagaaa aactgaacga aagcagcagc agcagcgaag gcagcaccgt ggatattggc 3480

gcgccggtgg aagaacagcc ggtggtggaa ccggaagaaa ccctggaacc ggaagcgtgc 3540

tttaccgaag gctgcgtgca gcgctttaaa tgctgccaga ttaacgtgga agaaggccgc 3600

ggcaaacagt ggtggaacct gcgccgcacc tgctttcgca ttgtggaaca taactggttt 3660

gaaaccttta ttgtgtttat gattctgctg agcagcggcg cgctggcgtt tgaagatatt 3720

tatattgatc agcgcaaaac cattaaaacc atgctggaat atgcggataa agtgtttacc 3780

tatattttta ttctggaaat gctgctgaaa tgggtggcgt atggctatca gacctatttt 3840

accaacgcgt ggtgctggct ggattttctg attgtggatg tgagcctggt gagcctgacc 3900

gcgaacgcgc tgggctatag cgaactgggc gcgattaaaa gcctgcgcac cctgcgcgcg 3960

ctgcgcccgc tgcgcgcgct gagccgcttt gaaggcatgc gcgtggtggt gaacgcgctg 4020

ctgggcgcga ttccgagcat tatgaacgtg ctgctggtgt gcctgatttt ttggctgatt 4080

tttagcatta tgggcgtgaa cctgtttgcg ggcaaatttt atcattgcat taacaccacc 4140

accggcgatc gctttgatat tgaagatgtg aacaaccata ccgattgcct gaaactgatt 4200

gaacgcaacg aaaccgcgcg ctggaaaaac gtgaaagtga actttgataa cgtgggcttt 4260

ggctatctga gcctgctgca ggtggcgacc tttaaaggct ggatggatat tatgtatgcg 4320

gcggtggata gccgcaacgt ggaactgcag ccgaaatatg aagaaagcct gtatatgtat 4380

ctgtattttg tgatttttat tatttttggc agctttttta ccctgaacct gtttattggc 4440

gtgattattg ataactttaa ccagcagaaa aaaaaatttg gcggccagga tatttttatg 4500

accgaagaac agaaaaaata ttataacgcg atgaaaaaac tgggcagcaa aaaaccgcag 4560

aaaccgattc cgcgcccggg caacaaattt cagggcatgg tgtttgattt tgtgacccgc 4620

caggtgtttg atattagcat tatgattctg atttgcctga acatggtgac catgatggtg 4680

gaaaccgatg atcagagcga atatgtgacc accattctga gccgcattaa cctggtgttt 4740

attgtgctgt ttaccggcga atgcgtgctg aaactgatta gcctgcgcca ttattatttt 4800

accattggct ggaacatttt tgattttgtg gtggtgattc tgagcattgt gggcatgttt 4860

ctggcggaac tgattgaaaa atattttgtg agcccgaccc tgtttcgcgt gattcgcctg 4920

gcgcgcattg gccgcattct gcgcctgatt aaaggcgcga aaggcattcg caccctgctg 4980

tttgcgctga tgatgagcct gccggcgctg tttaacattg gcctgctgct gtttctggtg 5040

atgtttattt atgcgatttt tggcatgagc aactttgcgt atgtgaaacg cgaagtgggc 5100

attgatgata tgtttaactt tgaaaccttt ggcaacagca tgatttgcct gtttcagatt 5160

accaccagcg cgggctggga tggcctgctg gcgccgattc tgaacagcaa accgccggat 5220

tgcgatccga acaaagtgaa cccgggcagc agcgtgaaag gcgattgcgg caacccgagc 5280

gtgggcattt ttttttttgt gagctatatt attattagct ttctggtggt ggtgaacatg 5340

tatattgcgg tgattctgga aaactttagc gtggcgaccg aagaaagcgc ggaaccgctg 5400

agcgaagatg attttgaaat gttttatgaa gtgtgggaaa aatttgatcc ggatgcgacc 5460

cagtttatgg aatttgaaaa actgagccag tttgcggcgg cgctggaacc gccgctgaac 5520

ctgccgcagc cgaacaaact gcagctgatt gcgatggatc tgccgatggt gagcggcgat 5580

cgcattcatt gcctggatat tctgtttgcg tttaccaaac gcgtgctggg cgaaagcggc 5640

gaaatggatg cgctgcgcat tcagatggaa gaacgcttta tggcgagcaa cccgagcaaa 5700

gtgagctatc agccgattac caccaccctg aaacgcaaac aggaagaagt gagcgcggtg 5760

attattcagc gcgcgtatcg ccgccatctg ctgaaacgca ccgtgaaaca ggcgagcttt 5820

acctataaca aaaacaaaat taaaggcggc gcgaacctgc tgattaaaga agatatgatt 5880

attgatcgca ttaacgaaaa cagcattacc gaaaaaaccg atctgaccat gagcaccgcg 5940

gcgtgcccgc cgagctatga tcgcgtgacc aaaccgattg tggaaaaaca tgaacaggaa 6000

ggcaaagatg aaaaagcgaa aggcaaa 6027

<210> 50

<211> 2009

<212> PRT

<213> 智人(Homo sapiens)

<400> 50

Met Glu Gln Thr Val Leu Val Pro Pro Gly Pro Asp Ser Phe Asn Phe

1 5 10 15

Phe Thr Arg Glu Ser Leu Ala Ala Ile Glu Arg Arg Ile Ala Glu Glu

20 25 30

Lys Ala Lys Asn Pro Lys Pro Asp Lys Lys Asp Asp Asp Glu Asn Gly

35 40 45

Pro Lys Pro Asn Ser Asp Leu Glu Ala Gly Lys Asn Leu Pro Phe Ile

50 55 60

Tyr Gly Asp Ile Pro Pro Glu Met Val Ser Glu Pro Leu Glu Asp Leu

65 70 75 80

Asp Pro Tyr Tyr Ile Asn Lys Lys Thr Phe Ile Val Leu Asn Lys Gly

85 90 95

Lys Ala Ile Phe Arg Phe Ser Ala Thr Ser Ala Leu Tyr Ile Leu Thr

100 105 110

Pro Phe Asn Pro Leu Arg Lys Ile Ala Ile Lys Ile Leu Val His Ser

115 120 125

Leu Phe Ser Met Leu Ile Met Cys Thr Ile Leu Thr Asn Cys Val Phe

130 135 140

Met Thr Met Ser Asn Pro Pro Asp Trp Thr Lys Asn Val Glu Tyr Thr

145 150 155 160

Phe Thr Gly Ile Tyr Thr Phe Glu Ser Leu Ile Lys Ile Ile Ala Arg

165 170 175

Gly Phe Cys Leu Glu Asp Phe Thr Phe Leu Arg Asp Pro Trp Asn Trp

180 185 190

Leu Asp Phe Thr Val Ile Thr Phe Ala Tyr Val Thr Glu Phe Val Asp

195 200 205

Leu Gly Asn Val Ser Ala Leu Arg Thr Phe Arg Val Leu Arg Ala Leu

210 215 220

Lys Thr Ile Ser Val Ile Pro Gly Leu Lys Thr Ile Val Gly Ala Leu

225 230 235 240

Ile Gln Ser Val Lys Lys Leu Ser Asp Val Met Ile Leu Thr Val Phe

245 250 255

Cys Leu Ser Val Phe Ala Leu Ile Gly Leu Gln Leu Phe Met Gly Asn

260 265 270

Leu Arg Asn Lys Cys Ile Gln Trp Pro Pro Thr Asn Ala Ser Leu Glu

275 280 285

Glu His Ser Ile Glu Lys Asn Ile Thr Val Asn Tyr Asn Gly Thr Leu

290 295 300

Ile Asn Glu Thr Val Phe Glu Phe Asp Trp Lys Ser Tyr Ile Gln Asp

305 310 315 320

Ser Arg Tyr His Tyr Phe Leu Glu Gly Phe Leu Asp Ala Leu Leu Cys

325 330 335

Gly Asn Ser Ser Asp Ala Gly Gln Cys Pro Glu Gly Tyr Met Cys Val

340 345 350

Lys Ala Gly Arg Asn Pro Asn Tyr Gly Tyr Thr Ser Phe Asp Thr Phe

355 360 365

Ser Trp Ala Phe Leu Ser Leu Phe Arg Leu Met Thr Gln Asp Phe Trp

370 375 380

Glu Asn Leu Tyr Gln Leu Thr Leu Arg Ala Ala Gly Lys Thr Tyr Met

385 390 395 400

Ile Phe Phe Val Leu Val Ile Phe Leu Gly Ser Phe Tyr Leu Ile Asn

405 410 415

Leu Ile Leu Ala Val Val Ala Met Ala Tyr Glu Glu Gln Asn Gln Ala

420 425 430

Thr Leu Glu Glu Ala Glu Gln Lys Glu Ala Glu Phe Gln Gln Met Ile

435 440 445

Glu Gln Leu Lys Lys Gln Gln Glu Ala Ala Gln Gln Ala Ala Thr Ala

450 455 460

Thr Ala Ser Glu His Ser Arg Glu Pro Ser Ala Ala Gly Arg Leu Ser

465 470 475 480

Asp Ser Ser Ser Glu Ala Ser Lys Leu Ser Ser Lys Ser Ala Lys Glu

485 490 495

Arg Arg Asn Arg Arg Lys Lys Arg Lys Gln Lys Glu Gln Ser Gly Gly

500 505 510

Glu Glu Lys Asp Glu Asp Glu Phe Gln Lys Ser Glu Ser Glu Asp Ser

515 520 525

Ile Arg Arg Lys Gly Phe Arg Phe Ser Ile Glu Gly Asn Arg Leu Thr

530 535 540

Tyr Glu Lys Arg Tyr Ser Ser Pro His Gln Ser Leu Leu Ser Ile Arg

545 550 555 560

Gly Ser Leu Phe Ser Pro Arg Arg Asn Ser Arg Thr Ser Leu Phe Ser

565 570 575

Phe Arg Gly Arg Ala Lys Asp Val Gly Ser Glu Asn Asp Phe Ala Asp

580 585 590

Asp Glu His Ser Thr Phe Glu Asp Asn Glu Ser Arg Arg Asp Ser Leu

595 600 605

Phe Val Pro Arg Arg His Gly Glu Arg Arg Asn Ser Asn Leu Ser Gln

610 615 620

Thr Ser Arg Ser Ser Arg Met Leu Ala Val Phe Pro Ala Asn Gly Lys

625 630 635 640

Met His Ser Thr Val Asp Cys Asn Gly Val Val Ser Leu Val Gly Gly

645 650 655

Pro Ser Val Pro Thr Ser Pro Val Gly Gln Leu Leu Pro Glu Val Ile

660 665 670

Ile Asp Lys Pro Ala Thr Asp Asp Asn Gly Thr Thr Thr Glu Thr Glu

675 680 685

Met Arg Lys Arg Arg Ser Ser Ser Phe His Val Ser Met Asp Phe Leu

690 695 700

Glu Asp Pro Ser Gln Arg Gln Arg Ala Met Ser Ile Ala Ser Ile Leu

705 710 715 720

Thr Asn Thr Val Glu Glu Leu Glu Glu Ser Arg Gln Lys Cys Pro Pro

725 730 735

Cys Trp Tyr Lys Phe Ser Asn Ile Phe Leu Ile Trp Asp Cys Ser Pro

740 745 750

Tyr Trp Leu Lys Val Lys His Val Val Asn Leu Val Val Met Asp Pro

755 760 765

Phe Val Asp Leu Ala Ile Thr Ile Cys Ile Val Leu Asn Thr Leu Phe

770 775 780

Met Ala Met Glu His Tyr Pro Met Thr Asp His Phe Asn Asn Val Leu

785 790 795 800

Thr Val Gly Asn Leu Val Phe Thr Gly Ile Phe Thr Ala Glu Met Phe

805 810 815

Leu Lys Ile Ile Ala Met Asp Pro Tyr Tyr Tyr Phe Gln Glu Gly Trp

820 825 830

Asn Ile Phe Asp Gly Phe Ile Val Thr Leu Ser Leu Val Glu Leu Gly

835 840 845

Leu Ala Asn Val Glu Gly Leu Ser Val Leu Arg Ser Phe Arg Leu Leu

850 855 860

Arg Val Phe Lys Leu Ala Lys Ser Trp Pro Thr Leu Asn Met Leu Ile

865 870 875 880

Lys Ile Ile Gly Asn Ser Val Gly Ala Leu Gly Asn Leu Thr Leu Val

885 890 895

Leu Ala Ile Ile Val Phe Ile Phe Ala Val Val Gly Met Gln Leu Phe

900 905 910

Gly Lys Ser Tyr Lys Asp Cys Val Cys Lys Ile Ala Ser Asp Cys Gln

915 920 925

Leu Pro Arg Trp His Met Asn Asp Phe Phe His Ser Phe Leu Ile Val

930 935 940

Phe Arg Val Leu Cys Gly Glu Trp Ile Glu Thr Met Trp Asp Cys Met

945 950 955 960

Glu Val Ala Gly Gln Ala Met Cys Leu Thr Val Phe Met Met Val Met

965 970 975

Val Ile Gly Asn Leu Val Val Leu Asn Leu Phe Leu Ala Leu Leu Leu

980 985 990

Ser Ser Phe Ser Ala Asp Asn Leu Ala Ala Thr Asp Asp Asp Asn Glu

995 1000 1005

Met Asn Asn Leu Gln Ile Ala Val Asp Arg Met His Lys Gly Val

1010 1015 1020

Ala Tyr Val Lys Arg Lys Ile Tyr Glu Phe Ile Gln Gln Ser Phe

1025 1030 1035

Ile Arg Lys Gln Lys Ile Leu Asp Glu Ile Lys Pro Leu Asp Asp

1040 1045 1050

Leu Asn Asn Lys Lys Asp Ser Cys Met Ser Asn His Thr Ala Glu

1055 1060 1065

Ile Gly Lys Asp Leu Asp Tyr Leu Lys Asp Val Asn Gly Thr Thr

1070 1075 1080

Ser Gly Ile Gly Thr Gly Ser Ser Val Glu Lys Tyr Ile Ile Asp

1085 1090 1095

Glu Ser Asp Tyr Met Ser Phe Ile Asn Asn Pro Ser Leu Thr Val

1100 1105 1110

Thr Val Pro Ile Ala Val Gly Glu Ser Asp Phe Glu Asn Leu Asn

1115 1120 1125

Thr Glu Asp Phe Ser Ser Glu Ser Asp Leu Glu Glu Ser Lys Glu

1130 1135 1140

Lys Leu Asn Glu Ser Ser Ser Ser Ser Glu Gly Ser Thr Val Asp

1145 1150 1155

Ile Gly Ala Pro Val Glu Glu Gln Pro Val Val Glu Pro Glu Glu

1160 1165 1170

Thr Leu Glu Pro Glu Ala Cys Phe Thr Glu Gly Cys Val Gln Arg

1175 1180 1185

Phe Lys Cys Cys Gln Ile Asn Val Glu Glu Gly Arg Gly Lys Gln

1190 1195 1200

Trp Trp Asn Leu Arg Arg Thr Cys Phe Arg Ile Val Glu His Asn

1205 1210 1215

Trp Phe Glu Thr Phe Ile Val Phe Met Ile Leu Leu Ser Ser Gly

1220 1225 1230

Ala Leu Ala Phe Glu Asp Ile Tyr Ile Asp Gln Arg Lys Thr Ile

1235 1240 1245

Lys Thr Met Leu Glu Tyr Ala Asp Lys Val Phe Thr Tyr Ile Phe

1250 1255 1260

Ile Leu Glu Met Leu Leu Lys Trp Val Ala Tyr Gly Tyr Gln Thr

1265 1270 1275

Tyr Phe Thr Asn Ala Trp Cys Trp Leu Asp Phe Leu Ile Val Asp

1280 1285 1290

Val Ser Leu Val Ser Leu Thr Ala Asn Ala Leu Gly Tyr Ser Glu

1295 1300 1305

Leu Gly Ala Ile Lys Ser Leu Arg Thr Leu Arg Ala Leu Arg Pro

1310 1315 1320

Leu Arg Ala Leu Ser Arg Phe Glu Gly Met Arg Val Val Val Asn

1325 1330 1335

Ala Leu Leu Gly Ala Ile Pro Ser Ile Met Asn Val Leu Leu Val

1340 1345 1350

Cys Leu Ile Phe Trp Leu Ile Phe Ser Ile Met Gly Val Asn Leu

1355 1360 1365

Phe Ala Gly Lys Phe Tyr His Cys Ile Asn Thr Thr Thr Gly Asp

1370 1375 1380

Arg Phe Asp Ile Glu Asp Val Asn Asn His Thr Asp Cys Leu Lys

1385 1390 1395

Leu Ile Glu Arg Asn Glu Thr Ala Arg Trp Lys Asn Val Lys Val

1400 1405 1410

Asn Phe Asp Asn Val Gly Phe Gly Tyr Leu Ser Leu Leu Gln Val

1415 1420 1425

Ala Thr Phe Lys Gly Trp Met Asp Ile Met Tyr Ala Ala Val Asp

1430 1435 1440

Ser Arg Asn Val Glu Leu Gln Pro Lys Tyr Glu Glu Ser Leu Tyr

1445 1450 1455

Met Tyr Leu Tyr Phe Val Ile Phe Ile Ile Phe Gly Ser Phe Phe

1460 1465 1470

Thr Leu Asn Leu Phe Ile Gly Val Ile Ile Asp Asn Phe Asn Gln

1475 1480 1485

Gln Lys Lys Lys Phe Gly Gly Gln Asp Ile Phe Met Thr Glu Glu

1490 1495 1500

Gln Lys Lys Tyr Tyr Asn Ala Met Lys Lys Leu Gly Ser Lys Lys

1505 1510 1515

Pro Gln Lys Pro Ile Pro Arg Pro Gly Asn Lys Phe Gln Gly Met

1520 1525 1530

Val Phe Asp Phe Val Thr Arg Gln Val Phe Asp Ile Ser Ile Met

1535 1540 1545

Ile Leu Ile Cys Leu Asn Met Val Thr Met Met Val Glu Thr Asp

1550 1555 1560

Asp Gln Ser Glu Tyr Val Thr Thr Ile Leu Ser Arg Ile Asn Leu

1565 1570 1575

Val Phe Ile Val Leu Phe Thr Gly Glu Cys Val Leu Lys Leu Ile

1580 1585 1590

Ser Leu Arg His Tyr Tyr Phe Thr Ile Gly Trp Asn Ile Phe Asp

1595 1600 1605

Phe Val Val Val Ile Leu Ser Ile Val Gly Met Phe Leu Ala Glu

1610 1615 1620

Leu Ile Glu Lys Tyr Phe Val Ser Pro Thr Leu Phe Arg Val Ile

1625 1630 1635

Arg Leu Ala Arg Ile Gly Arg Ile Leu Arg Leu Ile Lys Gly Ala

1640 1645 1650

Lys Gly Ile Arg Thr Leu Leu Phe Ala Leu Met Met Ser Leu Pro

1655 1660 1665

Ala Leu Phe Asn Ile Gly Leu Leu Leu Phe Leu Val Met Phe Ile

1670 1675 1680

Tyr Ala Ile Phe Gly Met Ser Asn Phe Ala Tyr Val Lys Arg Glu

1685 1690 1695

Val Gly Ile Asp Asp Met Phe Asn Phe Glu Thr Phe Gly Asn Ser

1700 1705 1710

Met Ile Cys Leu Phe Gln Ile Thr Thr Ser Ala Gly Trp Asp Gly

1715 1720 1725

Leu Leu Ala Pro Ile Leu Asn Ser Lys Pro Pro Asp Cys Asp Pro

1730 1735 1740

Asn Lys Val Asn Pro Gly Ser Ser Val Lys Gly Asp Cys Gly Asn

1745 1750 1755

Pro Ser Val Gly Ile Phe Phe Phe Val Ser Tyr Ile Ile Ile Ser

1760 1765 1770

Phe Leu Val Val Val Asn Met Tyr Ile Ala Val Ile Leu Glu Asn

1775 1780 1785

Phe Ser Val Ala Thr Glu Glu Ser Ala Glu Pro Leu Ser Glu Asp

1790 1795 1800

Asp Phe Glu Met Phe Tyr Glu Val Trp Glu Lys Phe Asp Pro Asp

1805 1810 1815

Ala Thr Gln Phe Met Glu Phe Glu Lys Leu Ser Gln Phe Ala Ala

1820 1825 1830

Ala Leu Glu Pro Pro Leu Asn Leu Pro Gln Pro Asn Lys Leu Gln

1835 1840 1845

Leu Ile Ala Met Asp Leu Pro Met Val Ser Gly Asp Arg Ile His

1850 1855 1860

Cys Leu Asp Ile Leu Phe Ala Phe Thr Lys Arg Val Leu Gly Glu

1865 1870 1875

Ser Gly Glu Met Asp Ala Leu Arg Ile Gln Met Glu Glu Arg Phe

1880 1885 1890

Met Ala Ser Asn Pro Ser Lys Val Ser Tyr Gln Pro Ile Thr Thr

1895 1900 1905

Thr Leu Lys Arg Lys Gln Glu Glu Val Ser Ala Val Ile Ile Gln

1910 1915 1920

Arg Ala Tyr Arg Arg His Leu Leu Lys Arg Thr Val Lys Gln Ala

1925 1930 1935

Ser Phe Thr Tyr Asn Lys Asn Lys Ile Lys Gly Gly Ala Asn Leu

1940 1945 1950

Leu Ile Lys Glu Asp Met Ile Ile Asp Arg Ile Asn Glu Asn Ser

1955 1960 1965

Ile Thr Glu Lys Thr Asp Leu Thr Met Ser Thr Ala Ala Cys Pro

1970 1975 1980

Pro Ser Tyr Asp Arg Val Thr Lys Pro Ile Val Glu Lys His Glu

1985 1990 1995

Gln Glu Gly Lys Asp Glu Lys Ala Lys Gly Lys

2000 2005

<210> 51

<211> 1470

<212> DNA

<213> 智人(Homo sapiens)

<400> 51

atggatctgc tggtggatga actgtttgcg gatatgaacg cggatggcgc gagcccgccg 60

ccgccgcgcc cggcgggcgg cccgaaaaac accccggcgg cgccgccgct gtatgcgacc 120

ggccgcctga gccaggcgca gctgatgccg agcccgccga tgccggtgcc gccggcggcg 180

ctgtttaacc gcctgctgga tgatctgggc tttagcgcgg gcccggcgct gtgcaccatg 240

ctggatacct ggaacgaaga tctgtttagc gcgctgccga ccaacgcgga tctgtatcgc 300

gaatgcaaat ttctgagcac cctgccgagc gatgtggtgg aatggggcga tgcgtatgtg 360

ccggaacgca cccagattga tattcgcgcg catggcgatg tggcgtttcc gaccctgccg 420

gcgacccgcg atggcctggg cctgtattat gaagcgctga gccgcttttt tcatgcggaa 480

ctgcgcgcgc gcgaagaaag ctatcgcacc gtgctggcga acttttgcag cgcgctgtat 540

cgctatctgc gcgcgagcgt gcgccagctg catcgccagg cgcatatgcg cggccgcgat 600

cgcgatctgg gcgaaatgct gcgcgcgacc attgcggatc gctattatcg cgaaaccgcg 660

cgcctggcgc gcgtgctgtt tctgcatctg tatctgtttc tgacccgcga aattctgtgg 720

gcggcgtatg cggaacagat gatgcgcccg gatctgtttg attgcctgtg ctgcgatctg 780

gaaagctggc gccagctggc gggcctgttt cagccgttta tgtttgtgaa cggcgcgctg 840

accgtgcgcg gcgtgccgat tgaagcgcgc cgcctgcgcg aactgaacca tattcgcgaa 900

catctgaacc tgccgctggt gcgcagcgcg gcgaccgaag aaccgggcgc gccgctgacc 960

accccgccga ccctgcatgg caaccaggcg cgcgcgagcg gctattttat ggtgctgatt 1020

cgcgcgaaac tggatagcta tagcagcttt accaccagcc cgagcgaagc ggtgatgcgc 1080

gaacatgcgt atagccgcgc gcgcaccaaa aacaactatg gcagcaccat tgaaggcctg 1140

ctggatctgc cggatgatga tgcgccggaa gaagcgggcc tggcggcgcc gcgcctgagc 1200

tttctgccgg cgggccatac ccgccgcctg agcaccgcgc cgccgaccga tgtgagcctg 1260

ggcgatgaac tgcatctgga tggcgaagat gtggcgatgg cgcatgcgga tgcgctggat 1320

gattttgatc tggatatgct gggcgatggc gatagcccgg gcccgggctt taccccgcat 1380

gatagcgcgc cgtatggcgc gctggatatg gcggattttg aatttgaaca gatgtttacc 1440

gatgcgctgg gcattgatga atatggcggc 1470

<210> 52

<211> 490

<212> PRT

<213> 智人(Homo sapiens)

<400> 52

Met Asp Leu Leu Val Asp Glu Leu Phe Ala Asp Met Asn Ala Asp Gly

1 5 10 15

Ala Ser Pro Pro Pro Pro Arg Pro Ala Gly Gly Pro Lys Asn Thr Pro

20 25 30

Ala Ala Pro Pro Leu Tyr Ala Thr Gly Arg Leu Ser Gln Ala Gln Leu

35 40 45

Met Pro Ser Pro Pro Met Pro Val Pro Pro Ala Ala Leu Phe Asn Arg

50 55 60

Leu Leu Asp Asp Leu Gly Phe Ser Ala Gly Pro Ala Leu Cys Thr Met

65 70 75 80

Leu Asp Thr Trp Asn Glu Asp Leu Phe Ser Ala Leu Pro Thr Asn Ala

85 90 95

Asp Leu Tyr Arg Glu Cys Lys Phe Leu Ser Thr Leu Pro Ser Asp Val

100 105 110

Val Glu Trp Gly Asp Ala Tyr Val Pro Glu Arg Thr Gln Ile Asp Ile

115 120 125

Arg Ala His Gly Asp Val Ala Phe Pro Thr Leu Pro Ala Thr Arg Asp

130 135 140

Gly Leu Gly Leu Tyr Tyr Glu Ala Leu Ser Arg Phe Phe His Ala Glu

145 150 155 160

Leu Arg Ala Arg Glu Glu Ser Tyr Arg Thr Val Leu Ala Asn Phe Cys

165 170 175

Ser Ala Leu Tyr Arg Tyr Leu Arg Ala Ser Val Arg Gln Leu His Arg

180 185 190

Gln Ala His Met Arg Gly Arg Asp Arg Asp Leu Gly Glu Met Leu Arg

195 200 205

Ala Thr Ile Ala Asp Arg Tyr Tyr Arg Glu Thr Ala Arg Leu Ala Arg

210 215 220

Val Leu Phe Leu His Leu Tyr Leu Phe Leu Thr Arg Glu Ile Leu Trp

225 230 235 240

Ala Ala Tyr Ala Glu Gln Met Met Arg Pro Asp Leu Phe Asp Cys Leu

245 250 255

Cys Cys Asp Leu Glu Ser Trp Arg Gln Leu Ala Gly Leu Phe Gln Pro

260 265 270

Phe Met Phe Val Asn Gly Ala Leu Thr Val Arg Gly Val Pro Ile Glu

275 280 285

Ala Arg Arg Leu Arg Glu Leu Asn His Ile Arg Glu His Leu Asn Leu

290 295 300

Pro Leu Val Arg Ser Ala Ala Thr Glu Glu Pro Gly Ala Pro Leu Thr

305 310 315 320

Thr Pro Pro Thr Leu His Gly Asn Gln Ala Arg Ala Ser Gly Tyr Phe

325 330 335

Met Val Leu Ile Arg Ala Lys Leu Asp Ser Tyr Ser Ser Phe Thr Thr

340 345 350

Ser Pro Ser Glu Ala Val Met Arg Glu His Ala Tyr Ser Arg Ala Arg

355 360 365

Thr Lys Asn Asn Tyr Gly Ser Thr Ile Glu Gly Leu Leu Asp Leu Pro

370 375 380

Asp Asp Asp Ala Pro Glu Glu Ala Gly Leu Ala Ala Pro Arg Leu Ser

385 390 395 400

Phe Leu Pro Ala Gly His Thr Arg Arg Leu Ser Thr Ala Pro Pro Thr

405 410 415

Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala

420 425 430

Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly

435 440 445

Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro

450 455 460

Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr

465 470 475 480

Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly

485 490

<210> 53

<211> 2570

<212> DNA

<213> 智人(Homo sapiens)

<400> 53

agcgcgcagg cgcggccgga ttccgggcag tgacgcgacg gcgggccgcg cggcgcattt 60

ccgcctctgg cgaatggctc gtctgtagtg cacgccgcgg gcccagctgc gaccccggcc 120

ccgcccccgg gaccccggcc atggacgaac tgttccccct catcttcccg gcagagccag 180

cccaggcctc tggcccctat gtggagatca ttgagcagcc caagcagcgg ggcatgcgct 240

tccgctacaa gtgcgagggg cgctccgcgg gcagcatccc aggcgagagg agcacagata 300

ccaccaagac ccaccccacc atcaagatca atggctacac aggaccaggg acagtgcgca 360

tctccctggt caccaaggac cctcctcacc ggcctcaccc ccacgagctt gtaggaaagg 420

actgccggga tggcttctat gaggctgagc tctgcccgga ccgctgcatc cacagtttcc 480

agaacctggg aatccagtgt gtgaagaagc gggacctgga gcaggctatc agtcagcgca 540

tccagaccaa caacaacccc ttccaagaag agcagcgtgg ggactacgac ctgaatgctg 600

tgcggctctg cttccaggtg acagtgcggg acccatcagg caggcccctc cgcctgccgc 660

ctgtcctttc tcatcccatc tttgacaatc gtgcccccaa cactgccgag ctcaagatct 720

gccgagtgaa ccgaaactct ggcagctgcc tcggtgggga tgagatcttc ctactgtgtg 780

acaaggtgca gaaagaggac attgaggtgt atttcacggg accaggctgg gaggcccgag 840

gctccttttc gcaagctgat gtgcaccgac aagtggccat tgtgttccgg acccctccct 900

acgcagaccc cagcctgcag gctcctgtgc gtgtctccat gcagctgcgg cggccttccg 960

accgggagct cagtgagccc atggaattcc agtacctgcc agatacagac gatcgtcacc 1020

ggattgagga gaaacgtaaa aggacatatg agaccttcaa gagcatcatg aagaagagtc 1080

ctttcagcgg acccaccgac ccccggcctc cacctcgacg cattgctgtg ccttcccgca 1140

gctcagcttc tgtccccaag ccagcacccc agccctatcc ctttacgtca tccctgagca 1200

ccatcaacta tgatgagttt cccaccatgg tgtttccttc tgggcagatc agccaggcct 1260

cggccttggc cccggcccct ccccaagtcc tgccccaggc tccagcccct gcccctgctc 1320

cagccatggt atcagctctg gcccaggccc cagcccctgt cccagtccta gccccaggcc 1380

ctcctcaggc tgtggcccca cctgccccca agcccaccca ggctggggaa ggaacgctgt 1440

cagaggccct gctgcagctg cagtttgatg atgaagacct gggggccttg cttggcaaca 1500

gcacagaccc agctgtgttc acagacctgg catccgtcga caactccgag tttcagcagc 1560

tgctgaacca gggcatacct gtggcccccc acacaactga gcccatgctg atggagtacc 1620

ctgaggctat aactcgccta gtgacagggg cccagaggcc ccccgaccca gctcctgctc 1680

cactgggggc cccggggctc cccaatggcc tcctttcagg agatgaagac ttctcctcca 1740

ttgcggacat ggacttctca gccctgctga gtcagatcag ctcctaaggg ggtgacgcct 1800

gccctcccca gagcactggg ttgcagggga ttgaagccct ccaaaagcac ttacggattc 1860

tggtggggtg tgttccaact gcccccaact ttgtggatgt cttccttgga ggggggagcc 1920

atattttatt cttttattgt cagtatctgt atctctctct ctttttggag gtgcttaagc 1980

agaagcatta acttctctgg aaagggggga gctggggaaa ctcaaacttt tcccctgtcc 2040

tgatggtcag ctcccttctc tgtagggaac tctggggtcc cccatcccca tcctccagct 2100

tctggtactc tcctagagac agaagcaggc tggaggtaag gcctttgagc ccacaaagcc 2160

ttatcaagtg tcttccatca tggattcatt acagcttaat caaaataacg ccccagatac 2220

cagcccctgt atggcactgg cattgtccct gtgcctaaca ccagcgtttg aggggctggc 2280

cttcctgccc tacagaggtc tctgccggct ctttccttgc tcaaccatgg ctgaaggaaa 2340

ccagtgcaac agcactggct ctctccagga tccagaaggg gtttggtctg ggacttcctt 2400

gctctccctc ttctcaagtg ccttaatagt agggtaagtt gttaagagtg ggggagagca 2460

ggctggcagc tctccagtca ggaggcatag tttttactga acaatcaaag cacttggact 2520

cttgctcttt ctactctgaa ctaataaatc tgttgccaag ctggctagaa 2570

<210> 54

<211> 548

<212> PRT

<213> 智人(Homo sapiens)

<400> 54

Met Asp Glu Leu Phe Pro Leu Ile Phe Pro Ala Glu Pro Ala Gln Ala

1 5 10 15

Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met

20 25 30

Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly

35 40 45

Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn

50 55 60

Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp

65 70 75 80

Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg

85 90 95

Asp Gly Phe Tyr Glu Ala Glu Leu Cys Pro Asp Arg Cys Ile His Ser

100 105 110

Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln

115 120 125

Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe Gln Glu Glu

130 135 140

Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys Phe Gln Val

145 150 155 160

Thr Val Arg Asp Pro Ser Gly Arg Pro Leu Arg Leu Pro Pro Val Leu

165 170 175

Ser His Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala Glu Leu Lys

180 185 190

Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly Gly Asp Glu

195 200 205

Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile Glu Val Tyr

210 215 220

Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser Gln Ala Asp

225 230 235 240

Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro Tyr Ala Asp

245 250 255

Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu Arg Arg Pro

260 265 270

Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr Leu Pro Asp

275 280 285

Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu

290 295 300

Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp

305 310 315 320

Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala

325 330 335

Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu

340 345 350

Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly

355 360 365

Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu

370 375 380

Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu

385 390 395 400

Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln

405 410 415

Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr

420 425 430

Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly

435 440 445

Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala

450 455 460

Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro

465 470 475 480

Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala

485 490 495

Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro

500 505 510

Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp

515 520 525

Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser

530 535 540

Gln Ile Ser Ser

545

<210> 55

<211> 1815

<212> DNA

<213> 智人(Homo sapiens)

<400> 55

atgcgcccga aaaaagatgg cctggaagat tttctgcgcc tgaccccgga aattaaaaaa 60

cagctgggca gcctggtgag cgattattgc aacgtgctga acaaagaatt taccgcgggc 120

agcgtggaaa ttaccctgcg cagctataaa atttgcaaag cgtttattaa cgaagcgaaa 180

gcgcatggcc gcgaatgggg cggcctgatg gcgaccctga acatttgcaa cttttgggcg 240

attctgcgca acaaccgcgt gcgccgccgc gcggaaaacg cgggcaacga tgcgtgcagc 300

attgcgtgcc cgattgtgat gcgctatgtg ctggatcatc tgattgtggt gaccgatcgc 360

ttttttattc aggcgccgag caaccgcgtg atgattccgg cgaccattgg caccgcgatg 420

tataaactgc tgaaacatag ccgcgtgcgc gcgtatacct atagcaaagt gctgggcgtg 480

gatcgcgcgg cgattatggc gagcggcaaa caggtggtgg aacatctgaa ccgcatggaa 540

aaagaaggcc tgctgagcag caaatttaaa gcgttttgca aatgggtgtt tacctatccg 600

gtgctggaag aaatgtttca gaccatggtg agcagcaaaa ccggccatct gaccgatgat 660

gtgaaagatg tgcgcgcgct gattaaaacc ctgccgcgcg cgagctatag cagccatgcg 720

ggccagcgca gctatgtgag cggcgtgctg ccggcgtgcc tgctgagcac caaaagcaaa 780

gcggtggaaa ccccgattct ggtgagcggc gcggatcgca tggatgaaga actgatgggc 840

aacgatggcg gcgcgagcca taccgaagcg cgctatagcg aaagcggcca gtttcatgcg 900

tttaccgatg aactggaaag cctgccgagc ccgaccatgc cgctgaaacc gggcgcgcag 960

agcgcggatt gcggcgatag cagcagcagc agcagcgata gcggcaacag cgataccgaa 1020

cagagcgaac gcgaagaagc gcgcgcggaa gcgccgcgcc tgcgcgcgcc gaaaagccgc 1080

cgcaccagcc gcccgaaccg cggccagacc ccgtgcccga gcaacgcggc ggaaccggaa 1140

cagccgtgga ttgcggcggt gcatcaggaa agcgatgaac gcccgatttt tccgcatccg 1200

agcaaaccga cctttctgcc gccggtgaaa cgcaaaaaag gcctgcgcga tagccgcgaa 1260

ggcatgtttc tgccgaaacc ggaagcgggc agcgcgatta gcgatgtgtt tgaaggccgc 1320

gaagtgtgcc agccgaaacg cattcgcccg tttcatccgc cgggcagccc gtgggcgaac 1380

cgcccgctgc cggcgagcct ggcgccgacc ccgaccggcc cggtgcatga accggtgggc 1440

agcctgaccc cggcgccggt gccgcagccg ctggatccgg cgccggcggt gaccccggaa 1500

gcgagccatc tgctggaaga tccggatgaa gaaaccagcc aggcggtgaa agcgctgcgc 1560

gaaatggcgg ataccgtgat tccgcagaaa gaagaagcgg cgatttgcgg ccagatggat 1620

ctgagccatc cgccgccgcg cggccatctg gatgaactga ccaccaccct ggaaagcatg 1680

accgaagatc tgaacctgga tagcccgctg accccggaac tgaacgaaat tctggatacc 1740

tttctgaacg atgaatgcct gctgcatgcg atgcatatta gcaccggcct gagcattttt 1800

gataccagcc tgttt 1815

<210> 56

<211> 605

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 56

Met Arg Pro Lys Lys Asp Gly Leu Glu Asp Phe Leu Arg Leu Thr Pro

1 5 10 15

Glu Ile Lys Lys Gln Leu Gly Ser Leu Val Ser Asp Tyr Cys Asn Val

20 25 30

Leu Asn Lys Glu Phe Thr Ala Gly Ser Val Glu Ile Thr Leu Arg Ser

35 40 45

Tyr Lys Ile Cys Lys Ala Phe Ile Asn Glu Ala Lys Ala His Gly Arg

50 55 60

Glu Trp Gly Gly Leu Met Ala Thr Leu Asn Ile Cys Asn Phe Trp Ala

65 70 75 80

Ile Leu Arg Asn Asn Arg Val Arg Arg Arg Ala Glu Asn Ala Gly Asn

85 90 95

Asp Ala Cys Ser Ile Ala Cys Pro Ile Val Met Arg Tyr Val Leu Asp

100 105 110

His Leu Ile Val Val Thr Asp Arg Phe Phe Ile Gln Ala Pro Ser Asn

115 120 125

Arg Val Met Ile Pro Ala Thr Ile Gly Thr Ala Met Tyr Lys Leu Leu

130 135 140

Lys His Ser Arg Val Arg Ala Tyr Thr Tyr Ser Lys Val Leu Gly Val

145 150 155 160

Asp Arg Ala Ala Ile Met Ala Ser Gly Lys Gln Val Val Glu His Leu

165 170 175

Asn Arg Met Glu Lys Glu Gly Leu Leu Ser Ser Lys Phe Lys Ala Phe

180 185 190

Cys Lys Trp Val Phe Thr Tyr Pro Val Leu Glu Glu Met Phe Gln Thr

195 200 205

Met Val Ser Ser Lys Thr Gly His Leu Thr Asp Asp Val Lys Asp Val

210 215 220

Arg Ala Leu Ile Lys Thr Leu Pro Arg Ala Ser Tyr Ser Ser His Ala

225 230 235 240

Gly Gln Arg Ser Tyr Val Ser Gly Val Leu Pro Ala Cys Leu Leu Ser

245 250 255

Thr Lys Ser Lys Ala Val Glu Thr Pro Ile Leu Val Ser Gly Ala Asp

260 265 270

Arg Met Asp Glu Glu Leu Met Gly Asn Asp Gly Gly Ala Ser His Thr

275 280 285

Glu Ala Arg Tyr Ser Glu Ser Gly Gln Phe His Ala Phe Thr Asp Glu

290 295 300

Leu Glu Ser Leu Pro Ser Pro Thr Met Pro Leu Lys Pro Gly Ala Gln

305 310 315 320

Ser Ala Asp Cys Gly Asp Ser Ser Ser Ser Ser Ser Asp Ser Gly Asn

325 330 335

Ser Asp Thr Glu Gln Ser Glu Arg Glu Glu Ala Arg Ala Glu Ala Pro

340 345 350

Arg Leu Arg Ala Pro Lys Ser Arg Arg Thr Ser Arg Pro Asn Arg Gly

355 360 365

Gln Thr Pro Cys Pro Ser Asn Ala Ala Glu Pro Glu Gln Pro Trp Ile

370 375 380

Ala Ala Val His Gln Glu Ser Asp Glu Arg Pro Ile Phe Pro His Pro

385 390 395 400

Ser Lys Pro Thr Phe Leu Pro Pro Val Lys Arg Lys Lys Gly Leu Arg

405 410 415

Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala

420 425 430

Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile

435 440 445

Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro

450 455 460

Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly

465 470 475 480

Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala

485 490 495

Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr

500 505 510

Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro

515 520 525

Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro

530 535 540

Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met

545 550 555 560

Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu

565 570 575

Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His

580 585 590

Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe

595 600 605

<210> 57

<211> 172

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 57

Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Gly

1 5 10 15

Asn Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala

20 25 30

Cys Asp Ile Cys Gly Lys Lys Phe Ala Leu Ser Phe Asn Leu Thr Arg

35 40 45

His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile

50 55 60

Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu Thr Arg His Ile Arg

65 70 75 80

Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Lys Lys

85 90 95

Phe Ala Asp Arg Ser His Leu Ala Arg His Thr Lys Ile His Thr Gly

100 105 110

Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln

115 120 125

Lys Ala His Leu Thr Ala His Ile Arg Thr His Thr Gly Glu Lys Pro

130 135 140

Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Leu

145 150 155 160

Thr Arg His Thr Lys Ile His Leu Arg Gln Lys Asp

165 170

<210> 58

<211> 516

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 58

cgaccattcc agtgtcgaat ctgcatgcgc aacttcagcc agcggggaaa cctggtgagg 60

catatccgca cccacacggg agagaagcct tttgcctgcg atatttgtgg aaagaagttt 120

gctctgagct tcaatctaac cagacacacc aagattcata ctgggtccca gaaaccgttc 180

cagtgtagga tatgcatgag gaatttctct cggagtgaca acttaacgcg gcatataagg 240

acgcacacag gtgaaaaacc atttgcatgc gacatctgtg gcaaaaagtt tgcggaccgg 300

tctcaccttg cccgacacac aaaaatccat accggcagtc aaaagccctt tcaatgtcgc 360

atttgcatgc gaaacttctc acagaaggcc catttgactg cccatattcg tactcatact 420

ggcgagaaac ctttcgcttg cgatatatgt ggtcgtaagt ttgcacggtc ggacaacctc 480

acacgccaca ctaagataca cctgcggcag aaggac 516

<210> 59

<211> 172

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 59

Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Ser

1 5 10 15

Asn Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala

20 25 30

Cys Asp Ile Cys Gly Lys Lys Phe Ala Asp Lys Arg Thr Leu Ile Arg

35 40 45

His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile

50 55 60

Cys Met Arg Asn Phe Ser Gln Arg Gly Asn Leu Val Arg His Ile Arg

65 70 75 80

Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Lys Lys

85 90 95

Phe Ala Leu Ser Phe Asn Leu Thr Arg His Thr Lys Ile His Thr Gly

100 105 110

Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg

115 120 125

Ser Asp Asn Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

130 135 140

Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp Arg Ser His Leu

145 150 155 160

Ala Arg His Thr Lys Ile His Leu Arg Gln Lys Asp

165 170

<210> 60

<211> 516

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 60

cgaccattcc agtgtcgaat ctgcatgcgc aacttcagcc gaagttccaa cctgacacgg 60

catatccgca cccacacggg agagaagcct tttgcctgcg atatttgtgg aaagaagttt 120

gctgacaagc ggaccttaat ccgccacacc aagattcata ctgggtccca gaaaccgttc 180

cagtgtagga tatgcatgag gaatttctct cagcggggaa atctagtgcg acatataagg 240

acgcacacag gtgaaaaacc atttgcatgc gacatctgtg gcaaaaagtt tgcgctgagc 300

ttcaacttga ctcgtcacac aaaaatccat accggcagtc aaaagccctt tcaatgtcgc 360

atttgcatgc gaaacttctc acggagtgac aatcttacga gacatattcg tactcatact 420

ggcgagaaac ctttcgcttg cgatatatgt ggtcgtaagt ttgcagaccg gagccactta 480

gccaggcaca ctaagataca cctgcggcag aaggac 516

<210> 61

<211> 172

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 61

Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser

1 5 10 15

Ala Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala

20 25 30

Cys Asp Ile Cys Gly Lys Lys Phe Ala Arg Ser Asp Asn Leu Thr Arg

35 40 45

His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile

50 55 60

Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg

65 70 75 80

Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Lys Lys

85 90 95

Phe Ala Val Arg Gln Thr Leu Lys Gln His Thr Lys Ile His Thr Gly

100 105 110

Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Ala

115 120 125

Ala Gly Asn Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

130 135 140

Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Leu

145 150 155 160

Thr Arg His Thr Lys Ile His Leu Arg Gln Lys Asp

165 170

<210> 62

<211> 516

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 62

cgaccattcc agtgtcgaat ctgcatgcgc aacttcagcg accggagcgc gctggcacgg 60

catatccgca cccacacggg agagaagcct tttgcctgcg atatttgtgg aaagaagttt 120

gctcgaagtg acaacttaac gcgccacacc aagattcata ctgggtccca gaaaccgttc 180

cagtgtagga tatgcatgag gaatttctct cagtcagggg acctcactcg tcatataagg 240

acgcacacag gtgaaaaacc atttgcatgc gacatctgtg gcaaaaagtt tgcggtacga 300

cagacgctta aacaacacac aaaaatccat accggcagtc aaaagccctt tcaatgtcgc 360

atttgcatgc gaaacttctc agccgctggt aacttgacac gacatattcg tactcatact 420

ggcgagaaac ctttcgcttg cgatatatgt ggtcgtaagt ttgcaagatc tgataatcta 480

acgcgtcaca ctaagataca cctgcggcag aaggac 516

<210> 63

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 63

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Gly Asn Leu

1 5 10 15

Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 64

<211> 29

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 64

Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Leu Ser Phe Asn Leu

1 5 10 15

Thr Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro

20 25

<210> 65

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 65

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu

1 5 10 15

Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 66

<211> 29

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 66

Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Asp Arg Ser His Leu

1 5 10 15

Ala Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro

20 25

<210> 67

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 67

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Lys Ala His Leu

1 5 10 15

Thr Ala His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 68

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 68

Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Leu

1 5 10 15

Thr Arg His Thr Lys Ile His Leu Arg Gln Lys Asp

20 25

<210> 69

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 69

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Ser Asn Leu

1 5 10 15

Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 70

<211> 29

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 70

Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Asp Lys Arg Thr Leu

1 5 10 15

Ile Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro

20 25

<210> 71

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 71

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Gly Asn Leu

1 5 10 15

Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 72

<211> 29

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 72

Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Leu Ser Phe Asn Leu

1 5 10 15

Thr Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro

20 25

<210> 73

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 73

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu

1 5 10 15

Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 74

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 74

Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp Arg Ser His Leu

1 5 10 15

Ala Arg His Thr Lys Ile His Leu Arg Gln Lys Asp

20 25

<210> 75

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 75

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Ala Leu

1 5 10 15

Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 76

<211> 29

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 76

Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Arg Ser Asp Asn Leu

1 5 10 15

Thr Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro

20 25

<210> 77

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 77

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu

1 5 10 15

Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 78

<211> 29

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 78

Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Val Arg Gln Thr Leu

1 5 10 15

Lys Gln His Thr Lys Ile His Thr Gly Ser Gln Lys Pro

20 25

<210> 79

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 79

Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Ala Ala Gly Asn Leu

1 5 10 15

Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro

20 25

<210> 80

<211> 28

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 80

Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Leu

1 5 10 15

Thr Arg His Thr Lys Ile His Leu Arg Gln Lys Asp

20 25

<210> 81

<211> 4104

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 81

atggacaaga agtactccat tgggctcgct atcggtacca acagcgtcgg ctgggccgtc 60

attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120

cacagcataa agaagaacct cattggagcc ctcctgttcg actccgggga gacggccgaa 180

gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240

tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300

ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360

aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420

aagctggtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcac 480

atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540

gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga ggagaacccg 600

atcaacgcat ccggcgttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660

cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720

cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780

gatgccaagc tgcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840

cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900

ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960

atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020

cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080

ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140

gaaaaaatgg acggcaccga ggagctgctg gtaaagctga acagagaaga tctgttgcgc 1200

aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260

gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320

gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgctcg gggaaattcc 1380

agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440

gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500

aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560

tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620

tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680

gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740

agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800

attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860

ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920

catctcttcg acgacaaagt catgaaacag ctcaagagac gccgatatac aggatggggg 1980

cggctgtcaa gaaaactgat caatggcatc cgagacaagc agagtggaaa gacaatcctg 2040

gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100

tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160

cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220

gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280

atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340

atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400

gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460

gacatgtacg tggatcagga actggacatc aaccggttgt ccgactacga cgtggatgct 2520

atcgtgcccc aaagctttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580

gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640

aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700

actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760

cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820

accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880

aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940

taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000

tatcccaagc tggaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060

atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120

aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180

ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240

gcgacagtcc gcaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300

cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360

gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420

tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480

aaggaactgc tgggcatcac aatcatggag cgatccagct tcgagaaaaa ccccatcgac 3540

tttctcgaag cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gctgcccaag 3600

tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660

cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720

cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780

caacacaaac actaccttga tgagatcatc gagcaaataa gcgagttctc caaaagagtg 3840

atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900

cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960

cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020

gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080

gacctctctc agctcggtgg agac 4104

<210> 82

<211> 1368

<212> PRT

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 82

Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 83

<211> 97

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 83

gaggtaccat agagtgaggc ggttttagag ctagaaatag caagttaaaa taaggctagt 60

ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97

<210> 84

<211> 97

<212> RNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 84

gagguaccau agagugaggc gguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60

ccguuaucaa cuugaaaaag uggcaccgag ucggugc 97

<210> 85

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 85

gaggtaccat agagtgaggc g 21

<210> 86

<211> 21

<212> RNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 86

gagguaccau agagugaggc g 21

<210> 87

<211> 99

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 87

accgaggcga ggatgaagcc gaggttttag agctagaaat agcaagttaa aataaggcta 60

gtccgttatc aacttgaaaa agtggcaccg agtcggtgc 99

<210> 88

<211> 99

<212> RNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 88

accgaggcga ggaugaagcc gagguuuuag agcuagaaau agcaaguuaa aauaaggcua 60

guccguuauc aacuugaaaa aguggcaccg agucggugc 99

<210> 89

<211> 23

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 89

accgaggcga ggatgaagcc gag 23

<210> 90

<211> 23

<212> RNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 90

accgaggcga ggaugaagcc gag 23

<210> 91

<211> 100

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 91

accgaagccg agaggatact gcaggtttta gagctagaaa tagcaagtta aaataaggct 60

agtccgttat caacttgaaa aagtggcacc gagtcggtgc 100

<210> 92

<211> 100

<212> RNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 92

accgaagccg agaggauacu gcagguuuua gagcuagaaa uagcaaguua aaauaaggcu 60

aguccguuau caacuugaaa aaguggcacc gagucggugc 100

<210> 93

<211> 24

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 93

accgaagccg agaggatact gcag 24

<210> 94

<211> 24

<212> RNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 94

accgaagccg agaggauacu gcag 24

<210> 95

<211> 1569

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成

<400> 95

gacgcattgg acgattttga tctggatatg ctgggaagtg acgccctcga tgattttgac 60

cttgacatgc ttggttcgga tgcccttgat gactttgacc tcgacatgct cggcagtgac 120

gcccttgatg atttcgacct ggacatgctg attaactcta gaagttccgg atctccgaaa 180

aagaaacgca aagttggtag ccagtacctg cccgacaccg acgaccggca ccggatcgag 240