Il2ra基因人源化的非人动物的构建方法及应用

文档序号:920400 发布日期:2021-03-02 浏览:6次 >En<

阅读说明:本技术 Il2ra基因人源化的非人动物的构建方法及应用 (Construction method and application of IL2RA gene humanized non-human animal ) 是由 沈月雷 白阳 尚诚彰 黄蕤 张美玲 姚佳维 郭朝设 郭雅南 于 2020-08-07 设计创作,主要内容包括:本发明提供了一种IL2RA基因人源化的非人动物的构建方法,制备包含IL2RA基因人源化的多基因人源化的非人动物的方法,以及制备获得的IL2RA基因人源化的非人动物或多基因人源化的非人动物在靶向人IL2RA抗体的筛选、药效评价中的应用。(The invention provides a construction method of an IL2RA gene humanized non-human animal, a method for preparing a multi-gene humanized non-human animal containing IL2RA gene humanized, and application of the prepared IL2RA gene humanized non-human animal or the multi-gene humanized non-human animal in screening and drug effect evaluation of a targeted human IL2RA antibody.)

IL2RA基因人源化的非人动物的构建方法及应用

技术领域

本发明涉及基因工程技术领域,具体涉及人源化改造的转基因非人动物,尤其是人源化改造的转基因啮齿类动物,例如转基因小鼠。更具体的,涉及包含人白介素2受体亚基A(IL2RA)基因序列的转基因小鼠,其制备方法和用途。

背景技术

白细胞介素2受体(Interleukin 2 Receptor,IL2R)能够与T细胞生长因子—白细胞介素2(Interleukin 2,IL2)特异性结合触发下游信号级联反应,产生IL2介导的细胞增殖效应,促进T细胞生长、B细胞增殖分化,增强细胞毒性T淋巴细胞、自然杀伤细胞和淋巴因子活化的杀伤细胞的杀伤活性,诱导其它细胞因子的产生和细胞因子受体的表达,发挥至关重要的免疫调节作用。目前IL2R家族已经发现了3个成员,分别是α亚基(IL2RA,CD25)、β亚基(IL2RB,CD122)和γ亚基(IL2RG,CD132)。人体内,这三个亚基以不同方式结合形成不同类型的受体,每种受体都与IL2有不同的亲和力。现有技术显示,IL2RB与IL2RG的结合为信号传导所必需,但高亲和力IL2R的形成必须有IL2RA的参与。IL2RA主要在激活的T细胞表面高表达,而IL2RA被看作是调节性T细胞Treg(CD4+CD25HIFOXP3+)与活化T细胞的标志,有学者认为IL2R通过JAK-STAT细胞信号通路实现对Treg的调节,进而在机体免疫自稳、移植耐受、肿瘤免疫、过敏反应及微生物感染等多种病理过程中均发挥重要作用。其上调表达机制可通过不同途径实现:(1)抗原或丝裂原激活T细胞受体,启动钙流入引起蛋白激酶C磷酸化等级联反应,从而上调IL2RA的表达;(2)IL2激发的涉及P13K、RAS及STAT5信号通路的正反馈调节机制。IL2RA上调表达进一步刺激T细胞生长并发挥效应功能。同时,有文献公开了IL2RA还以可溶性形式存在于血清中,且与细胞表面IL2RA表达呈正相关关系。

目前,已经有大量研究表明在多种自身免疫性疾病(例如再生障碍性贫血、哮喘、特发性血小板减少症、葡萄膜炎、多发性硬化症等)、肿瘤(例如白血病、淋巴瘤、多发性骨髓瘤、肉瘤、头颈癌、肺腺癌等)及移植物排斥中可溶性IL2RA高水平表达,并且在临床中已被作为部分癌症(例如成人T细胞白血病)的预后指标之一。通过特异性阻断IL2RA的体内生物学活性,在临床已经表现出显著的疗效。据GlobalData数据库统计,截止2019年4月26日全球约有470项IL2RA相关临床试验正在进行,涉及药物19个。目前FDA批准的靶向人IL2RA抗体药物只有两款:basiliximab和daclizumab,适应症分别为肾移植后急性器官排斥反应和成人复发型多发性硬化症。其中daclizumab因严重不良反应(脑炎、脑膜炎)于2018年3月2日宣布退市。考虑到越来越多的IL2RA相关性疾病的研究发现以及目前临床药物的稀缺性,急切且庞大的临床需求远远不能得到满足,仍需要开发更多靶向IL2RA的药物。

实验动物疾病模型对于研究人类疾病发病机制、开发防治技术及药物是不可缺少的研究工具。由于人IL2RA氨基酸序列与啮齿类动物中的对应蛋白存在显著差异,如人IL2RA和小鼠IL2RA蛋白序列的一致性仅为60%,识别人IL2RA蛋白的抗体通常无法识别小鼠IL2RA,即无法用普通小鼠来筛选和评价靶向IL2RA信号通路药物的药效。鉴于IL2RA全球研发进展及靶向该信号通路的巨大应用价值,为了使临床前期试验更有效并使研发失败率最小化,本领域急需开发人源化IL2RA信号通路相关的非人动物模型。

发明内容

本发明的第一方面,提供了一种IL2RA基因人源化的非人动物的构建方法,所述的非人动物表达人或人源化IL2RA蛋白。

优选的,所述的非人动物内源IL2RA蛋白表达降低或缺失。

优选的,所述的非人动物的基因组中包括非人动物IL2RA基因的部分序列,所述的非人动物IL2RA基因的部分包括非人动物调控元件,优选的,所述的非人动物调控元件包括启动子,进一步优选的,所述的人IL2RA基因与启动子可操作性的连接在非人动物IL2RA基因座。

优选的,所述的非人动物表达人或人源化IL2RA蛋白,该人或人源化IL2RA蛋白结合靶向人特定抗原的抗体,同时内源IL2RA蛋白表达降低或缺失。

优选的,所述人或人源化IL2RA蛋白包含人IL2RA蛋白胞外区、胞内区和/或跨膜区的全部或部分,优选的,包含人IL2RA蛋白胞外区和/或跨膜区的全部或部分,更优选的,包含人IL2RA蛋白胞外区的全部或部分,其中,胞外区的部分包含从胞外区N端第1-5(例如1、2、3、4、5)个氨基酸开始至C端第1-5(例如1、2、3、4、5)个氨基酸为止,优选的,所述胞外区部分包含SEQ ID NO:4第25-237位。

优选的,所述的非人动物的基因组中包括人或人源化IL2RA基因。进一步优选包含人IL2RA基因的2号至6号外显子的全部或部分。更进一步优选的,包括人IL2RA基因的2号外显子、3号外显子、4号外显子、5号外显子或6号外显子中的一种或两种以上的组合。再进一步优选的,包括人IL2RA基因的2号至6号外显子的8807bp的片段序列。

在本发明的一个

具体实施方式

中,包括人IL2RA基因2号外显子的全部或部分、3号至5号外显子的全部和6号外显子的全部或部分,其中,2号外显子的部分包括从编码胞外区的N端第1-5(例如1、2、3、4、5)个氨基酸的核苷酸开始至2号外显子的最后一个核苷酸,6号外显子的部分包括从6号外显子的第一个核苷酸序列开始至编码胞外区的C端1-5(例如1、2、3、4、5)个氨基酸的核苷酸为止。

优选的,所述的非人动物中至少一个染色体上包含人IL2RA基因。

优选的,所述的非人动物的基因组中IL2RA基因编码的蛋白包括SEQ ID NO:4第25-237位所示氨基酸序列的全部或部分。

优选的,所述的非人动物的基因组中IL2RA基因编码的蛋白包括胞外区、跨膜区、信号肽和胞内区,其中,胞外区包含人IL2RA基因编码的胞外区的全部或部分,所述的胞外区序列连续5-219个氨基酸与人IL2RA胞外区序列一致,进一步优选的,所述的胞外区序列连续10-213个氨基酸与人IL2RA胞外区序列一致,更进一步优选的,所述的胞外区序列连续10-100个氨基酸与人IL2RA胞外区序列一致。进一步优选的,所述的胞外区氨基酸序列至少50个与人IL2RA胞外区序列相同,更优选的,所述的胞外区序列包含SEQ ID NO:4第22-240位所示氨基酸序列的全部或部分。

优选的,所述的跨膜区来源于非人动物IL2RA基因编码。更优选的,所述的跨膜区序列如SEQ ID NO:2第237-257位所示氨基酸序列的全部或部分。

优选的,所述的信号肽来源于非人动物IL2RA基因编码。更优选的,所述的信号肽序列如SEQ ID NO:2第1-21位所示氨基酸序列的全部或部分。

优选的,所述的胞内区来源于非人动物IL2RA基因编码。更优选的,所述的胞内区序列如SEQ ID NO:2第258-268位所示氨基酸序列的全部或部分。

在本发明的一个具体实施方式中,所述胞外区包含人IL2RA基因编码的胞外区的全部或部分,所述的跨膜区、信号肽和胞内区来源于非人动物IL2RA基因编码,同时人IL2RA基因和非人动物IL2RA基因通过序列拼接连接于非人动物内源的IL2RA启动子后。

优选的,所述的非人动物的基因组中包括如SEQ ID NO:7所示的序列。

优选的,所述的非人动物基因组中的IL2RA基因为纯合或杂合的。

优选的,使用基因编辑技术进行IL2RA基因人源化的非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。

在本发明的一个具体实施方式中,所述的构建方法包括将包含人IL2RA基因的全部或部分插入或替换至非人动物IL2RA基因座;优选的,将包含人IL2RA基因的2号至6号外显子部分插入或替换至非人动物IL2RA基因座。进一步优选的,将包含人IL2RA基因的2号外显子、3号外显子、4号外显子、5号外显子或6号外显子中的一种或两种以上的组合插入或替换至非人动物IL2RA基因座。更进一步优选的,将包含人IL2RA基因2号外显子的全部或部分、3号至5号外显子的全部和6号外显子的全部或部分插入或替换至非人动物IL2RA基因座,其中,2号外显子的部分包括从编码胞外区的N端第1-5(例如1、2、3、4、5)个氨基酸的核苷酸开始至2号外显子的最后一个核苷酸,6号外显子的部分包括从6号外显子的第一个核苷酸序列开始至编码胞外区的C端1-5(例如1、2、3、4、5)个氨基酸的核苷酸为止。再进一步优选的,将包含SEQ ID NO:7的核苷酸序列插入或替换至非人动物IL2RA基因座。

在本发明的一个具体实施方式中,所述的构建方法包括将包含编码人或人源化IL2RA蛋白的核苷酸序列插入或替换至非人动物IL2RA基因座。优选的,将包含编码人IL2RA蛋白胞外区的全部或部分核苷酸序列插入或替换至非人动物IL2RA基因座。进一步优选的,将包含从编码人IL2RA蛋白胞外区的N端第1-5(例如1、2、3、4、5)个氨基酸的核苷酸开始至2号外显子的最后一个核苷酸插入或替换至非人动物IL2RA基因座。再进一步优选的,将包含编码SEQ ID NO:4第25-237位的核苷酸序列插入或替换至非人动物IL2RA基因座。

优选的,所述的插入或替换的位置可以为非人动物IL2RA基因的1号至8号外显子上。进一步优选为2号至6号外显子上。最为优选为,编码人IL2RA蛋白胞外区的N端第1-5(例如1、2、3、4、5)个氨基酸的核苷酸开始至2号外显子的最后一个核苷酸所对应的非人动物相应区域。

在本发明的一个具体实施方式中,所述的非人动物为小鼠,所述小鼠IL2RA基因的mRNA序列如SEQ ID NO:1中的全部或部分片段所示,所述小鼠IL2RA蛋白序列如SEQ ID NO:2中的全部或部分片段所示。

在本发明的一个具体实施方式中,所述的人IL2RA基因的mRNA序列如SEQ ID NO:3中的全部或部分片段所示,所述人IL2RA蛋白序列如SEQ ID NO:4中的全部或部分片段所示。

优选的,所述的构建方法包括使用靶向载体进行非人动物的构建,进一步优选的使用靶向载体将人IL2RA基因的2号至6号外显子的全部或部分替换至内源IL2RA基因的相应区域;其中,至少一个细胞中的内源IL2RA基因被人IL2RA基因全部或部分替换。

所述的靶向载体包含人IL2RA基因的全部或部分,优选包含人IL2RA基因的2号至6号外显子的全部或部分,进一步优选包含人IL2RA基因的2号外显子、3号外显子、4号外显子、5号外显子或6号外显子中的一种或两种以上的组合,更进一步优选包含人IL2RA基因的2号外显子的全部或部分,3号至5号外显子的全部和6号外显子的全部或部分,其中,2号外显子的部分包括从编码胞外区的N端第1-5(例如1、2、3、4、5)个氨基酸的核苷酸开始至2号外显子的最后一个核苷酸,6号外显子的部分包括从6号外显子的第一个核苷酸序列开始至编码胞外区的C端1-5(例如1、2、3、4、5)个氨基酸的核苷酸为止,再进一步优选的,包括编码SEQ ID NO:4第25-237位核苷酸序列,更进一步优选的,包括如SEQ ID NO:7所示的序列。

进一步优选的,所述的靶向载体还包含5’臂和/或3’臂。

其中5’臂核苷酸长度为3886bp,3’臂核苷酸长度为5776bp。

在本发明的一个具体实施方式中,所述的5’臂为SEQ ID NO:5所示序列的全部或部分。

在本发明的一个具体实施方式中,所述的3’臂为SEQ ID NO:6所示序列的全部或部分。

在本发明的一个具体实施方式中,所述的一种IL2RA基因人源化的非人动物的构建方法,包括如下步骤:

1)提供一种包含靶向载体的细胞,所述的细胞为受精卵细胞或者胚胎干细胞;

2)将步骤1)所述细胞在培养液中进行培养;

3)将培养后细胞移植至受体雌性非人哺乳动物的输卵管内,允许所述细胞在所述雌性非人哺乳动物的子宫中发育;其中,所述非人哺乳动物为假孕雌性;

4)鉴定步骤3)的怀孕雌性的后代基因改造人源化的非人哺乳动物中的种系传递。

优选的,所述受精卵来源于任何非人哺乳动物;进一步优选的,所述受精卵细胞来源于啮齿类动物;更进一步优选的,所述受精卵选自C57BL/6受精卵、FVB/N受精卵、129受精卵、BALB/c受精卵、DBA/1受精卵或DBA/2受精卵。

优选的,所述的胚胎干细胞来源于任何非人哺乳动物。进一步优选的,所述的胚胎干细胞来源于啮齿类动物。更进一步优选的,所述胚胎干细胞选自C57BL/6胚胎干细胞、FVB/N胚胎干细胞、129胚胎干细胞、BALB/c胚胎干细胞、DBA/1胚胎干细胞或DBA/2胚胎干细胞。

优选的,所述的人或人源化IL2RA蛋白包含下列组中的一种:

A)SEQ ID NO:4第25-237位所示氨基酸序列的全部或部分;

B)SEQ ID NO:4第25-237位所示氨基酸序列序列同源性程度为至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

C)SEQ ID NO:4第25-237位所示氨基酸序列序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,

D)SEQ ID NO:4第25-237位所示氨基酸序列包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

在本发明的一个具体实施方式中,所述的人源化IL2RA蛋白包含下列组中的一种:

A)SEQ ID NO:11所述氨基酸序列的部分或全部;

B)与SEQ ID NO:11所示氨基酸的序列同源性程度为至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

C)编码人源化IL2RA蛋白的核酸序列在严格条件下,与编码SEQ ID NO:11所示蛋白的核苷酸序列杂交;

D)与SEQ ID NO:11所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,

E)具有SEQ ID NO:11所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

优选的,所述的非人动物包含的人IL2RA基因包含下列任一组:

(a)SEQ ID NO:7所示的序列的部分或全部;

(b)与SEQ ID NO:7所示的核苷酸序列的部分或全部的同源性程度为至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

(c)与SEQ ID NO:7所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,

(d)具有SEQ ID NO:7所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

进一步优选的,所述的人源化IL2RA基因转录的mRNA序列包含下列组中的一种:

(a)人源化IL2RA基因编码上述的人或人源化IL2RA蛋白;

(b)SEQ ID NO:10所示的序列的部分或全部;

(c)与SEQ ID NO:10所示的核苷酸序列的部分或全部的同源性程度为至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

(d)人源化IL2RA基因的序列在严格条件下,与SEQ ID NO:10所示的核苷酸序列杂交;

(e)与SEQ ID NO:10所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,

(f)具有SEQ ID NO:10所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的,所述的人源化IL2RA基因还包括特异性诱导物或阻遏物。进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-Off System/Tet-On System)或他莫昔芬系统(Tamoxifen System)。

优选的,所述的IL2RA基因人源化的非人动物中至少一个染色体上包含人源化IL2RA基因。

在本发明的一个具体实施方式中,所述的人源化IL2RA基因序列包含SEQ ID NO:7、SEQ ID NO:8和/或SEQ ID NO:9所示的序列。

本发明的第二方面,提供了一种上述IL2RA基因人源化的非人动物的构建方法制备的IL2RA基因人源化的非人动物或其子代。

本发明的第三方面,提供了一种IL2RA基因人源化的非人动物,所述的人源化的非人动物的基因组中包括人IL2RA基因的全部或部分。

本发明的第四方面,提供了一种IL2RA基因的靶向载体,所述的靶向载体包含人IL2RA基因的全部或部分,优选包含人IL2RA基因的2号至6号外显子的全部或部分,进一步优选包含人IL2RA基因的2号外显子、3号外显子、4号外显子、5号外显子或6号外显子中的一种或两种以上的组合,更进一步优选包含人IL2RA基因的2号外显子的全部或部分,3号至5号外显子的全部和6号外显子的全部或部分,其中,2号外显子的部分包括从编码胞外区的N端第1-5(例如1、2、3、4、5)个氨基酸的核苷酸开始至2号外显子的最后一个核苷酸,6号外显子的部分包括从6号外显子的第一个核苷酸序列开始至编码胞外区的C端1-5(例如1、2、3、4、5)个氨基酸的核苷酸为止,再进一步优选的,包括编码SEQ ID NO:4第25-237位核苷酸序列,更进一步优选的,包括如SEQ ID NO:7所示的序列。

优选的,所述靶向载体还包括5’臂和/或3’臂。所述5’臂与待改变的转换区5’端同源。所述3’臂与待改变的转换区3’端同源。

所述5’臂选自IL2RA基因基因组DNA的100-10000个长度的核苷酸,优选与NCBI登录号为NC_000068.7至少具有90%同源性的核苷酸,进一步优选包含SEQ ID NO:5。所述3’臂,选自IL2RA基因基因组DNA的100-10000个长度的核苷酸,优选与NCBI登录号为NC_000068.7至少具有90%同源性的核苷酸,进一步优选包含SEQ ID NO:6。

在本发明的一个具体实施方式中,所述的靶向载体包含a)与待改变的转换区5’端同源的DNA片段,即5’臂,其选自IL2RA基因基因组DNA的100-10000个长度的核苷酸;b)插入或替换的供体DNA序列,其编码供体转换区;c)与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自IL2RA基因基因组DNA的100-10000个长度的核苷酸。

进一步优选的,所述IL2RA基因的靶向载体中5’臂核苷酸长度为3886bp,3’臂核苷酸长度为5776bp。

优选的,所述的待改变的转换区位于IL2RA基因的2号外显子至6号外显子。

优选的,所述的靶向载体还包括可选择的标记基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。

优选的,所述靶向载体还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。

优选的,所述靶向载体还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为2个,分别装在抗性基因的两侧。

本发明的第五方面,提供了一种包含上述靶向载体的细胞。

本发明的第六方面,提供了一种上述的靶向载体或包含靶向载体的细胞在构建IL2RA基因修饰中的应用。优选的,在敲除、插入或替换IL2RA基因的2号至6号外显子的部分或全部中的应用。

本发明的第七方面,提供了一种包含IL2RA基因人源化的细胞株,所述的包含IL2RA基因人源化的细胞株的基因组中包括人IL2RA基因的全部或部分。

优选的,所述的人IL2RA基因通过内源性调控元件调控。更优选的,所述的内源性调控元件包括启动子。

在本发明的一个具体实施方式中,所述的人IL2RA基因与内源启动子可操作性的连接在内源IL2RA基因座。

优选的,所述的IL2RA基因人源化的细胞株表达人或人源化IL2RA蛋白,该人或人源化IL2RA蛋白结合靶向人特定抗原的抗体,同时内源IL2RA蛋白表达降低或缺失。

优选的,所述的IL2RA基因人源化的细胞株的基因组中包括人IL2RA基因的2号至6号外显子的全部或部分。更优选的,所述的IL2RA基因人源化的细胞株的基因组中包括人IL2RA基因的2号外显子、3号外显子、4号外显子、5号外显子或6号外显子中的一种或两种以上的组合。

进一步优选的,所述的IL2RA基因人源化的细胞株的基因组中包括人IL2RA基因的2号至6号外显子的8807bp的片段序列。

在本发明的一个具体实施方式中,所述的IL2RA基因人源化的细胞株的基因组中包括人IL2RA基因的2号外显子的全部或部分、3号至5号外显子的全部和6号外显子的全部或部分。

优选的,所述的细胞株中至少一个染色体上包含人IL2RA基因。

优选的,所述的IL2RA基因人源化的细胞株的基因组中包括如SEQ ID NO:7所示的序列。

优选的,所述的IL2RA基因人源化的细胞株的基因组中IL2RA基因编码的蛋白包括SEQ ID NO:4第25-237位所示氨基酸序列的全部或部分。

优选的,所述的IL2RA基因人源化的细胞株的基因组中IL2RA基因编码的蛋白包括胞外区、跨膜区、信号肽和胞内区,其中,胞外区包含人IL2RA基因编码的胞外区的全部或部分,所述的胞外区序列连续5-219个氨基酸与人IL2RA胞外区序列一致。进一步优选的,所述的胞外区序列连续10-213个氨基酸与人IL2RA胞外区序列一致,更进一步优选的,所述的胞外区序列连续10-100个氨基酸与人IL2RA胞外区序列一致。

更优选的,所述的胞外区氨基酸序列至少50个与人IL2RA胞外区序列相同,优选的,所述的胞外区序列包含SEQ ID NO:4第22-240位所示氨基酸序列的全部或部分。

优选的,所述的跨膜区来源于非人动物IL2RA基因编码。更优选的,所述的跨膜区序列如SEQ ID NO:2第237-257位所示氨基酸序列的全部或部分。

优选的,所述的信号肽来源于非人动物IL2RA基因编码。更优选的,所述的信号肽序列如SEQ ID NO:2第1-21位所示氨基酸序列的全部或部分。

优选的,所述的胞内区来源于非人动物IL2RA基因编码。更优选的,所述的胞内区序列如SEQ ID NO:2第258-268位所示氨基酸序列的全部或部分。

在本发明的一个具体实施方式中,所述的胞外区包含人IL2RA基因编码的胞外区的全部或部分,跨膜区、信号肽和胞内区来源于非人动物IL2RA基因编码,同时人IL2RA基因和非人动物IL2RA基因通过序列拼接连接于非人动物内源的IL2RA启动子后。

优选的,所述的IL2RA基因人源化细胞株基因组中的IL2RA基因为纯合或杂合的。

优选的,所述的细胞株来源于非人动物。进一步优选的,所述的非人动物为非人哺乳动物。更进一步优选的,所述的非人哺乳动物可以为啮齿类动物、斑马鱼、猪、鸡、兔子、猴子等任何可以进行基因编辑制备IL2RA基因人源化动物的非人哺乳动物。

在本发明的一个具体实施方式中,所述的非人哺乳动物为啮齿类动物,所述的啮齿类动物为小鼠或大鼠。

在本发明的一个具体实施方式中,所述的细胞株来源于小鼠的细胞株,将人IL2RA基因的全部或部分插入或原位替换小鼠细胞株内源IL2RA基因获得人源化小鼠细胞株,优选的,将人IL2RA基因的2号至6号外显子全部或部分原位替换小鼠细胞株内源IL2RA基因的2号至6号外显子。

优选的,所述的人源化IL2RA蛋白为人源化嵌合IL2RA蛋白,所述的人源化嵌合IL2RA蛋白选自下列组中的一种:

A)人源化嵌合IL2RA蛋白序列为SEQ ID NO:11所述氨基酸序列的部分或全部;

B)人源化嵌合IL2RA蛋白序列与SEQ ID NO:11所示氨基酸的序列同源性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

C)编码人源化嵌合IL2RA蛋白的核酸序列在严格条件下,与编码SEQ ID NO:11所示蛋白的核苷酸序列杂交;

D)人源化嵌合IL2RA蛋白序列与SEQ ID NO:11所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;

E)人源化嵌合IL2RA蛋白序列具有SEQ ID NO:11所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

在本发明的一个具体实施方式中,所述的人源化嵌合IL2RA蛋白序列包含SEQ IDNO:2的全部或部分,和/或,SEQ ID NO:4的全部或部分。

优选的,所述的IL2RA基因人源化的细胞株的基因组中包含人源化嵌合IL2RA基因,所述的人源化嵌合IL2RA基因选自下列组中的一种:

(a)人源化嵌合IL2RA基因编码上述的人源化嵌合IL2RA蛋白;

(b)人源化嵌合IL2RA基因的mRNA序列为SEQ ID NO:10所示的序列的部分或全部;

(c)人源化嵌合IL2RA基因序列与SEQ ID NO:10所示的核苷酸序列的部分或全部的同源性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

(d)人源化嵌合IL2RA基因的序列在严格条件下,与SEQ ID NO:10所示的核苷酸序列杂交;

(e)人源化嵌合IL2RA基因的序列与SEQ ID NO:10所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;

(f)人源化嵌合IL2RA基因序列具有SEQ ID NO:10所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的,所述的人源化嵌合IL2RA基因还包括特异性诱导物或阻遏物。进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-Off System/Tet-On System)或他莫昔芬系统(Tamoxifen System)。

优选的,所述的细胞株中至少一个染色体上包含人源化嵌合IL2RA基因。

在本发明的一个具体实施方式中,所述的人源化嵌合IL2RA基因的mRNA序列包含SEQ ID NO:1的全部或部分,和/或,SEQ ID NO:3的全部或部分。

在本发明的一个具体实施方式中,所述的人源化嵌合IL2RA基因序列包含SEQ IDNO:7、SEQ ID NO:8和/或SEQ ID NO:9所示的序列。

本发明所述的细胞株不是动物品种,所述的包含IL2RA基因人源化的细胞株不会发育为个体。

本发明的第八方面,提供了一种上述的IL2RA基因人源化的细胞株的制备方法,使用基因编辑技术进行IL2RA基因人源化的细胞株的构建,所述的基因编辑技术包括基于胚胎干细胞的DNA同源重组技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。

在本发明的一个具体实施方式中,所述的基因编辑技术包括胚胎干细胞的DNA同源重组技术。

优选的,所述的细胞株来源于非人动物。进一步优选的,所述的非人动物为非人哺乳动物。更进一步优选的,所述的非人哺乳动物可以为啮齿类动物、斑马鱼、猪、鸡、兔子、猴子等任何可以进行基因编辑制备IL2RA基因人源化动物的非人哺乳动物。

在本发明的一个具体实施方式中,所述的非人哺乳动物为啮齿类动物,所述的啮齿类动物为小鼠或大鼠。

优选的,所述的制备方法包括使用靶向载体将人IL2RA基因的2号至6号外显子的全部或部分原位替换内源IL2RA基因的相应区域;其中,至少一个细胞中的内源IL2RA基因被人IL2RA基因全部或部分替换。

所述的靶向载体包含:a)与待改变的转换区5’端同源的DNA片段,即5’臂,其选自IL2RA基因基因组DNA的100-10000个长度的核苷酸;b)插入或替换的供体DNA序列,其编码供体转换区;c)与待改变的转换区3’端同源的第二个DNA片段,即3’臂,其选自IL2RA基因基因组DNA的100-10000个长度的核苷酸。

优选的,所述的5’臂与NC_000068.7至少具有90%同源性的核苷酸。

优选的,所述3’臂与NCBI登录号为NC_000068.7至少具有90%同源性的核苷酸。

进一步优选的,所述IL2RA基因的靶向载体中5’臂核苷酸长度为3886bp,3’臂核苷酸长度为5776bp。

进一步优选的,所述的插入或替换的供体DNA序列包含人IL2RA基因的2号至6号外显子的全部或部分。

在本发明的一个具体实施方式中,所述的插入或替换的供体DNA序列包含SEQ IDNO:7所示的序列。

在本发明的一个具体实施方式中,所述的5’臂为SEQ ID NO:5所示序列的全部或部分。

在本发明的一个具体实施方式中,所述的3’臂为SEQ ID NO:6所示序列的全部或部分。

在本发明的一个具体实施方式中,所述的细胞株的制备方法,包括如下步骤:

1)提供一种包含靶向载体的细胞,所述的细胞为受精卵细胞或胚胎干细胞;

2)将步骤1)所述的细胞在培养液中进行培养。

本发明的第七方面,提供了一种多基因人源化的非人动物的构建方法,包括如下步骤:

(1)制备上述的IL2RA基因人源化的非人动物,或者,采用上述的构建方法获得的IL2RA基因人源化的非人动物;

(2)将步骤(1)制备获得的的非人动物与其他人源化动物交配、体外授精或直接进行基因编辑,并进行筛选,得到多基因人源化的非人动物。

优选的,所述的其他人源化动物包括细胞因子编码基因人源化的动物。

在本发明的一个具体实施方式中,所述的细胞因子编码基因包括但不限于TNFa等。

优选的,所述多基因人源化的非人动物为双基因人源化的非人动物、三基因人源化的非人动物、四基因人源化的非人动物、五基因人源化的非人动物、六基因人源化的非人动物、七基因人源化的非人动物、八基因人源化的非人动物或九基因人源化的非人动物。

优选的,所述的多基因人源化的非人动物基因组中人源化的多基因中的每一个基因均可以是纯合或杂合的。

优选的,所述的其他人源化动物为非人哺乳动物。更优选的,所述的非人哺乳动物可以为啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备IL2RA基因人源化动物的非人哺乳动物。最为优选的,所述的非人哺乳动物为啮齿类动物,所述的啮齿类动物为小鼠或大鼠。

优选的,所述的其他人源化动物表达细胞因子蛋白。

优选的,所述的多基因人源化的非人动物表达人源化IL2RA蛋白和细胞因子类蛋白。

本发明的第八方面,提供了一种上述的构建方法获得的非人动物或其子代。

本发明的第九方面,提供了一种荷瘤或炎症的动物模型,该动物模型来源于上述的方法构建的IL2RA基因人源化的非人动物、上述的IL2RA基因人源化的非人动物、上述的方法构建的多基因人源化的非人动物、或者上述的非人动物或其子代。

本发明的第十方面,提供了一种荷瘤或炎症的动物模型的制备方法,所述的动物模型的制备方法包括通过上述的构建方法制备非人动物的步骤。

优选的,所述的荷瘤动物模型的制备方法还包括在上述方法制备的非人动物或其后代植入肿瘤细胞的步骤。

本发明的第十一方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的构建方法获得的IL2RA基因人源化的非人动物、上述的IL2RA基因人源化的非人动物、上述的构建方法获得的多基因人源化的非人动物、上述的非人动物或其子代,或者,上述的荷瘤或炎性的动物模型。

本发明的第十二方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的构建方法获得的IL2RA基因人源化的非人动物、上述的IL2RA基因人源化的非人动物、上述的构建方法获得的多基因人源化的非人动物、上述的非人动物或其子代,或者,上述的荷瘤或炎性的动物模型。

优选的,所述组织或器官为脾脏、肿瘤或其培养物。

本发明的第十三方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的构建方法获得的IL2RA基因人源化的非人动物、上述的IL2RA基因人源化的非人动物、上述的构建方法获得的多基因人源化的非人动物、上述的非人动物或其子代,或者,上述的荷瘤或炎性的动物模型。

本发明的第十四方面,提供了一种人源化IL2RA蛋白,所述的人源化IL2RA蛋白包含人IL2RA蛋白的全部或部分。

优选的,所述的人IL2RA蛋白的部分包括人IL2RA基因的2号至6号外显子编码的全部或部分氨基酸序列。更优选的,所述的人IL2RA蛋白的部分包括人IL2RA基因的2号外显子、3号外显子、4号外显子、5号外显子或6号外显子中的一种或两种以上的组合编码的蛋白的全部或部分。进一步优选的,所述的人IL2RA蛋白的部分包括胞外区的全部或部分,其中,胞外区的部分包括从N端第1-5(例如1、2、3、4、5)个氨基酸开始至C端第1-5(例如1、2、3、4、5)个氨基酸为止,优选的,所述胞外区部分包含SEQ ID NO:4第25-237位。

优选的,所述的人源化IL2RA蛋白包括胞外区、跨膜区、信号肽和胞内区,其中,所述胞外区包括人IL2RA蛋白胞外区的全部或部分,所述的胞外区序列连续5-219个氨基酸与人IL2RA胞外区序列一致。进一步优选的,所述的胞外区序列连续10-213个氨基酸与人IL2RA胞外区序列一致,更进一步优选的,所述的胞外区序列连续10-100个氨基酸与人IL2RA胞外区序列一致。

进一步优选的,所述的胞外区氨基酸序列至少50个与人IL2RA胞外区序列相同,优选的,所述的胞外区序列包含SEQ ID NO:4第22-240位所示氨基酸序列的全部或部分。

优选的,所述的跨膜区来源于非人动物IL2RA蛋白。进一步优选的,所述的跨膜区序列如SEQ ID NO:2第237-257位所示氨基酸序列的全部或部分。

优选的,所述的信号肽来源于非人动物IL2RA蛋白。进一步优选的,所述的信号肽序列如SEQ ID NO:2第1-21位所示氨基酸序列的全部或部分。

优选的,所述的胞内区来源于非人动物IL2RA蛋白。进一步优选的,所述的胞内区序列如SEQ ID NO:2第258-268位所示氨基酸序列的全部或部分。

在本发明的一个具体实施方式中,所述胞外区包含人IL2RA蛋白胞外区的全部或部分,所述的跨膜区、信号肽和胞内区来源于动物IL2RA蛋白。

优选的,所述的人源化IL2RA蛋白结合靶向人特定抗原的抗体。

所述的人源化IL2RA蛋白包含下列组中的一种:

A)SEQ ID NO:4第25-237位所示氨基酸序列的全部或部分;

B)SEQ ID NO:4第25-237位所示氨基酸序列序列同源性程度为至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

C)SEQ ID NO:4第25-237位所示氨基酸序列序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,

D)SEQ ID NO:4第25-237位所示氨基酸序列包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

在本发明的一个具体实施方式中,所述的人源化IL2RA蛋白包含下列组中的一种:

A)SEQ ID NO:11所述氨基酸序列的部分或全部;

B)与SEQ ID NO:11所示氨基酸的序列同源性程度为至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;或,

C)编码人源化IL2RA蛋白的核酸序列在严格条件下,与编码SEQ ID NO:11所示蛋白的核苷酸序列杂交;

D)与SEQ ID NO:11所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;

E)具有SEQ ID NO:11所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

在本发明的一个具体实施方式中,所述的人源化IL2RA蛋白序列包含SEQID NO:2的全部或部分,和/或,SEQ ID NO:4的全部或部分。

本发明的第十五方面,提供了一种人源化IL2RA基因,所述的人源化IL2RA基因包含人IL2RA基因的部分。

优选的,所述的人IL2RA基因的部分包括人IL2RA基因的2号至6号外显子的全部或部分。进一步优选的,包括人IL2RA基因的2号外显子、3号外显子、4号外显子、5号外显子或6号外显子中的一种或两种以上的组合。

进一步优选的,包括人IL2RA基因2号外显子的全部或部分、3号至5号外显子的全部和6号外显子的全部或部分,其中,2号外显子的部分包括从编码胞外区的N端第1-5(例如1、2、3、4、5)个氨基酸的核苷酸开始至2号外显子的最后一个核苷酸,6号外显子的部分包括从6号外显子的第一个核苷酸序列开始至编码胞外区的C端1-5(例如1、2、3、4、5)个氨基酸的核苷酸为止。

优选的,所述的人源化IL2RA基因包含编码胞外区的全部或部分核苷酸序列。进一步优选包含编码胞外区从N端第1-5(例如1、2、3、4、5)个氨基酸开始至C端第1-5(例如1、2、3、4、5)个氨基酸为止的核苷酸序列,进一步优选包含编码SEQ ID NO:4第25-237位的核苷酸序列。

优选的,所述的人源化IL2RA基因编码的蛋白包括胞外区、跨膜区、信号肽和胞内区,其中,所述胞外区包含人IL2RA基因编码的胞外区的全部或部分,所述的胞外区序列连续5-219个氨基酸与人IL2RA胞外区序列一致。进一步优选的,所述的胞外区序列连续10-213个氨基酸与人IL2RA胞外区序列一致,更进一步优选的,所述的胞外区序列连续10-100个氨基酸与人IL2RA胞外区序列一致。

优选的,所述的胞外区氨基酸序列至少50个与人IL2RA胞外区序列相同,进一步优选的,所述的胞外区序列包含SEQ ID NO:4第22-240位所示氨基酸序列的全部或部分。

优选的,所述的跨膜区来源于非人动物IL2RA基因编码。进一步优选的,所述的跨膜区序列如SEQ ID NO:2第237-257位所示氨基酸序列的全部或部分。

优选的,所述的信号肽来源于非人动物IL2RA基因编码。进一步优选的,所述的信号肽序列如SEQ ID NO:2第1-21位所示氨基酸序列的全部或部分。

优选的,所述的胞内区来源于非人动物IL2RA基因编码。进一步优选的,所述的胞内区序列如SEQ ID NO:2第258-268位所示氨基酸序列的全部或部分。

在本发明的一个具体实施方式中,所述的人源化IL2RA基因包括下列任一组:

(a)SEQ ID NO:7所示的序列的部分或全部;

(b)与SEQ ID NO:7所示的核苷酸序列的部分或全部的同源性程度为至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

(c)与SEQ ID NO:7所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,

(d)具有SEQ ID NO:7所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

在本发明的一个具体实施方式中,所述的人源化IL2RA基因包含下列组中的一种:

(a)人源化IL2RA基因编码权上述的人源化IL2RA蛋白;

(b)人源化IL2RA基因的mRNA序列为SEQ ID NO:10所示的序列的部分或全部;

(c)人源化IL2RA基因序列与SEQ ID NO:10所示的核苷酸序列的部分或全部的同源性程度为至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

(d)人源化IL2RA基因的序列在严格条件下,与SEQ ID NO:10所示的核苷酸序列杂交;

(e)人源化IL2RA基因的序列与SEQ ID NO:10所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,

(f)人源化IL2RA基因序列具有SEQ ID NO:10所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

在本发明的一个具体实施方式中,所述的人源化IL2RA基因的mRNA序列包含SEQID NO:1的全部或部分,和/或,SEQ ID NO:3的全部或部分。

在本发明的一个具体实施方式中,所述的人源化IL2RA基因序列包含SEQ ID NO:7、SEQ ID NO:8和/或SEQ ID NO:9所示的序列。

本发明的第十六方面,提供了一种表达上述的人源化IL2RA蛋白的构建体。

本发明的第十七方面,提供了一种包含上述构建体的细胞。

本发明的第十八方面,提供了一种包含上述的细胞的组织。

优选的,所述的组织来源于通过上述的构建方法获得的非人动物,本发明所述的非人动物或其子代,或者,本发明所述的荷瘤或炎症动物模型。优选为荷瘤后的瘤组织

本发明的第十九方面,提供了一种包含IL2RA基因人源化的细胞,所述的细胞表达上述的人或人源化IL2RA蛋白。

优选的,所述的细胞的基因组包含上述的人源化IL2RA基因。

优选的,所述的细胞来源于通过上述的构建方法获得的非人动物,本发明所述的非人动物或其子代,或者,本发明所述的荷瘤或炎症动物模型。

本发明的第二十方面,提供了来源于上述的构建方法获得的IL2RA基因人源化的非人动物、上述的IL2RA基因人源化的非人动物、上述细胞、上述的方法构建的多基因人源化的非人动物、上述的非人动物或其子代,上述细胞或细胞系或原代细胞培养物、上述组织或器官或其培养物、上述荷瘤后的瘤组织、上述人源化IL2RA蛋白、上述人源化IL2RA基因、上述构建体、上述包含构建体的细胞、上述包含细胞的组织,或者,上述的荷瘤或炎性的动物模型在涉及人类细胞的免疫过程中的产品开发,制造人类抗体,或者作为药理学、免疫学、微生物学和医学研究的模型系统中的应用;或在生产和利用动物实验疾病模型,用于病原学研究和/或用于开发新的诊断策略和/或治疗策略中的应用;或在筛选、验证、评价或研究IL2RA基因功能、IL2RA抗体、针对IL2RA靶位点的药物、药效研究,免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的用途。

在本发明的一个具体实施方式中,所述的用途为IL2RA阻断型抗体的药物筛选、药效评价。

优选的,所述药物筛选或药效评价的方法不是治疗方法。该方法用来筛选药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。

本发明的第二十一方面,提供了来源于上述的构建方法获得的IL2RA基因人源化的非人动物、上述的IL2RA基因人源化的非人动物、上述细胞、上述的方法构建的多基因人源化的非人动物、上述的非人动物或其子代,上述细胞或细胞系或原代细胞培养物、上述组织或器官或其培养物、上述荷瘤后的瘤组织、上述人源化IL2RA蛋白、上述人源化IL2RA基因、上述构建体、上述包含构建体的细胞、上述包含细胞的组织,或者,上述的荷瘤或炎性的动物模型在制备疾病动物模型,或者,制备治疗免疫相关疾病、肿瘤或炎症的药物中的应用。

本发明的第二十二方面,提供了一种人用药物筛选或评价的方法,所述的方法包括向个体给予候选药物,对给予候选药物的个体进行药效检测和/或比较,其中,所述的个体选自上述的构建方法获得的IL2RA基因人源化的非人动物、上述的IL2RA基因人源化的非人动物、上述的构建方法获得的多基因人源化的非人动物、上述的非人动物或其子代,或者,上述的荷瘤或炎性的动物模型。

优选的,所述的候选药物为抗体。

优选的,在向非人动物给予候选药物之前使得非人动物致敏或向其移入肿瘤细胞。

优选的,所述药物筛选或评价的方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。

优选的,所述候选药物包括IL2RA靶向药物。进一步优选的,所述的靶向药物为抗原结合蛋白。在本发明的一个具体实施方式中,所述的抗原结合蛋白为抗体。

优选的,所述候选药物为单抗或双特异性抗体或两种及两种以上药物的联合使用。

优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率;优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。

优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。

本发明的第二十三方面,提供了一种CAR-T体内验证的方法,所述的方法包括向个体植入鼠肿瘤细胞,向植入鼠肿瘤细胞的个体施加人CAR-T,对施加人CAR-T后的个体进行肿瘤抑制效果检测和评价,其中,所述的个体选自上述的构建方法获得的IL2RA基因人源化的非人动物、上述的IL2RA基因人源化的非人动物、上述的构建方法获得的多基因人源化的非人动物、上述的非人动物或其子代,或者,上述的荷瘤或炎性的动物模型。

优选的,所述CAR-T体内验证的方法不是治疗方法。该方法对CAR-T的效果进行检测和评价,以确定该方法是否有治疗效果,即治疗效果不是必然的,只是一种可能性。

本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。

本发明所述的“肿瘤”包括但不限于淋巴瘤、非小细胞肺癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。在本发明的一个具体实施方式中,所述的肿瘤选自白血病、淋巴瘤、多发性骨髓瘤、肉瘤、头颈癌、肺癌等。

本发明所述的“炎症”包括急性炎症,也包括慢性炎症。具体的,包括但不限于变质性炎症、渗出性炎症(浆液性炎、纤维素性炎、化脓性炎、出血性炎、坏死性炎、卡他性炎)、增生性炎症、特异性炎症(结核、梅毒、麻疯、淋巴肉芽肿等)。

本发明所述的“免疫相关疾病”包括但不限于过敏、哮喘、慢性阻塞性肺病、心肌炎、肾炎、肝炎、多发性硬化症、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、特发性血小板减少症、自身免疫性溶血性贫血、再生障碍性贫血、葡萄膜炎、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。在本发明的一个具体实施方式中,所述的免疫相关疾病选自再生障碍性贫血、哮喘、特发性血小板减少症、葡萄膜炎、多发性硬化症等。

本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。

本发明所述的“x-xx号外显子”或者“x号至xx号外显子”或“x号至xx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,例如所述的“2号至6号外显子”包含2号外显子、2-3号内含子、3号外显子、3-4号内含子、4号外显子、4-5号内含子、5号外显子、5-6号内含子和6号外显子的全部核苷酸序列。

本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“4-5号内含子”表示4号外显子与5号外显子之间的内含子。

本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“IL2RA基因座”表示IL2RA基因1号至8号外显子上的任选一段的DNA片段。在本发明的一个具体实施方式中,被插入或替换的IL2RA基因座可以是IL33基因2号至6号外显子上的任选一段的DNA片段。优选为2号至6号外显子上的任选一段的DNA序列。

本发明所述的细胞、组织等不是动物品种,其也不会发育为个体。

本发明所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物可以为啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备IL2RA基因人源化动物的非人哺乳动物。更进一步优选的,所述的非人哺乳动物为啮齿类动物,所述的啮齿类动物为小鼠或大鼠。

本发明所述“治疗(treating)”(或“治疗(treat)”或“治疗(treatment)”)表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。术语“治疗(treating)”等是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。

本发明所述“同源性”,是指在使用蛋白序列或核苷酸序列的方面,本领域技术人员可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。

本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。

在一个方面,所述非人动物是哺乳动物。在一个方面,所述非人动物是小型哺乳动物,例如跳鼠科或鼠总科超家族。在一个实施方式中,所述基因修饰的动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。

在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠。

除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods InENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。

附图说明

以下,结合附图来详细说明本发明的实施例,其中:

图1:鼠IL2RA基因和人IL2RA基因对比示意图(非按比例);

图2:人源化IL2RA小鼠基因示意图(非按比例),其中,用人IL2RA基因2号至6号外显子的8807bp片段替换小鼠的相应区域获得人源化IL2RA小鼠基因;

图3:IL2RA基因打靶策略及靶向载体设计示意图,其中,靶向载体包含5’同源臂、3’同源臂以及含人IL2RA基因序列的片段、FRT、NeoR和DTA的片段;

图4:采用5’探针、3’探针和Neo探针进行Southern Blot鉴定的结果图,其中,WT为野生型C57BL/6小鼠,1-H03、2-A02、2-C07、2-D10、2-F09、2-F11、3-F02、3-G11、3-H03、3-H07、4-B03为细胞(or克隆)编号;

图5:阳性鼠与Flp工具鼠交配去除阳性筛选标记基因过程示意图;

图6:F1代小鼠鼠尾PCR鉴定结果,其中WT为野生型C57BL/6小鼠,H2O为水对照,PC、PC1、PC2为阳性对照,M为Marker,F1-1、F1-2、F1-3、F1-4、F1-5、F1-6、F1-7、F1-8为鼠尾编号,图(A)为引物WT-F/WT-R扩增结果,图(B)为引物WT-F/Mut-R扩增结果,图(C)为引物Frt-F/Frt-R扩增结果,图(D)为引物Flp-F2/Flp-R2扩增结果;

图7:小鼠体内IL2RA蛋白表达流式分析结果,其中B-hIL2RA(h/+)为IL2RA基因人源化杂合子小鼠,C57BL/6为野生型小鼠,图(A)-(D)为未经CD3刺激的小鼠脾脏检测结果,图(E)-(H)为经CD3刺激后小鼠脾脏检测结果;

图8:经CD3刺激后小鼠体内脾脏细胞中NK细胞上IL2RA蛋白表达流式分析结果,其中B-hIL2RA(h/h)为IL2RA基因人源化纯合子小鼠,WT为野生型C57BL/6小鼠,具体染色方案:PE/CyTM7Mouse anti-mouse NK1.1、PerCP/Cy5.5anti-mouse TCRβchain、BrilliantViolet 510TManti-mouse CD45与PE anti-mouse CD25(mIL2RA-PE)或APC mouse anti-human CD25(hIL2RA-APC);

图9:经CD3刺激后小鼠体内脾脏细胞中CD4+T细胞上IL2RA蛋白表达流式分析结果,其中B-hIL2RA(h/h)为IL2RA基因人源化纯合子小鼠,WT为野生型C57BL/6小鼠,具体染色方案:Brilliant Violet 421TManti-mouse CD4、PerCP/Cy5.5 anti-mouse TCRβchain、Brilliant Violet 510TManti-mouse CD45与PE anti-mouse CD25(mIL2RA-PE)或APCmouse anti-human CD25(hIL2RA-APC);

图10:经CD3刺激后小鼠体内脾脏细胞中CD8+T细胞上IL2RA蛋白表达流式分析结果,其中B-hIL2RA(h/h)为IL2RA基因人源化纯合子小鼠,WT为野生型C57BL/6小鼠,具体染色方案:Brilliant Violet 711TManti-mouse CD8a、PerCP/Cy5.5 anti-mouse TCRβchain、Brilliant Violet 510TManti-mouse CD45与PE anti-mouse CD25(mIL2RA-PE)或APCmouse anti-human CD25(hIL2RA-APC);

图11:经重组白介素-2刺激后小鼠体内脾脏细胞中p-STAT5蛋白表达流式分析结果,其中,WT为野生型C57BL/6小鼠的细胞,B-hIL2RA(h/h)为IL2RA基因人源化纯合小鼠的细胞;图(A)为经mIL2刺激后的结果图,图(B)为经hIL2刺激后结果图;

图12:经重组白介素-2刺激的小鼠脾脏细胞中进行抗人IL2RA抗体阻断试验,图为p-STAT5蛋白表达流式分析结果,其中,WT为野生型C57BL/6小鼠的细胞,B-hIL2RA(h/h)为IL2RA基因人源化纯合小鼠的细胞;Tab02、Tab04为抗人抗体处理组;

图13:将小鼠结肠癌细胞MC38植入IL2RA基因人源化纯合子小鼠体内,并利用2种IL2RA抗体(AB1和AB2)进行抗肿瘤药效试验(10mg/kg),G1-G3各组实验动物平均体重增长无显著差异;

图14:将小鼠结肠癌细胞MC38植入IL2RA基因人源化纯合子小鼠体内,并利用2种IL2RA抗体(AB1和AB2)进行抗肿瘤药效试验(10mg/kg),G1-G3各组实验动物体重变化无显著差异;

图15:将小鼠结肠癌细胞MC38植入IL2RA基因人源化纯合子小鼠体内,并利用2种IL2RA抗体(AB1和AB2)进行抗肿瘤药效试验(10mg/kg),G2和G3治疗组实验动物肿瘤平均体积明显小于G1对照组,且具有显著差异;

图16:将小鼠结肠癌细胞MC38植入IL2RA基因人源化纯合子小鼠体内,并利用2种IL2RA抗体(ab1和ab2)进行抗肿瘤药效试验(10mg/kg),G1-G3各组实验动物平均体重增长无显著差异;

图17:将小鼠结肠癌细胞MC38植入IL2RA基因人源化纯合子小鼠体内,并利用2种IL2RA抗体(ab1和ab2)进行抗肿瘤药效试验(10mg/kg),G1-G3各组实验动物体重变化无显著差异;

图18:将小鼠结肠癌细胞MC38植入IL2RA基因人源化纯合子小鼠体内,并利用2种IL2RA抗体(ab1和ab2)进行抗肿瘤药效试验(10mg/kg),G2和G3治疗组实验动物肿瘤平均体积明显小于G1对照组,且具有显著差异。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的部分实施例,而不是全部。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在下述实施例中,设备和材料是从以下所指出的几家公司获得:

StuI、NdeI和DraIII酶购自NEB,货号分别为R0187M、R0111S和R3510S;

C57BL/6小鼠和Flp工具鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;

流式细胞仪生产厂家为BD,型号为Calibur;

离心机生产厂家为白洋,型号为R320;

PE anti-mouse CD25 Antibody(mCD25 PE)来源:Biolegend,货号102008;

PerCP/Cyanine5.5 anti-mouse TCRβchain(mTCRβ-PerCP/Cy5.5)来源Biolegend,货号109228;

FITC anti-mouse CD4 Antibody(mCD4 FITC)来源Biolegend,货号116004;

APC anti-human CD25 Antibody(hCD25 APC)来源Biolegend,货号302610;

PE/CyTM7Mouse anti-mouse NK1.1来源Biolegend,货号552878;

Brilliant Violet 510TManti-mouse CD45来源Biolegend,货号103138;

Brilliant Violet 421TManti-mouse CD4来源Biolegend,货号100438;

Brilliant Violet 711TManti-mouse CD8a来源Biolegend,货号100759;

鼠重组白介素-2(mIL2)来源PeproTech,Inc,货号212-12;

Purified NA/LE Hamster Anti-Mouse CD3e(mCD3)购自BD公司,货号:553057;

人IL2(hIL2)来源江苏恒瑞医药;

APC Rat Anti-Mouse CD3 Molecular Complex来源BD Biosciences,货号565643;

Phospho-Stat5(Tyr694)(D47E7)Rabbit mAb来源Cell SignalingTechnology,货号4322S;

Anti-rabbit IgG(H+L),F(ab')2Fragment(Alexa488Conjugate)来源CellSignaling Technology,货号4412;

人IgG来源泰州市百英生物科技有限公司。

实施例1 IL2RA基因人源化小鼠

小鼠IL2RA基因(NCBI Gene ID:16184,Primary source:MGI:96549,UniProtKB:P01590,位于2号染色体NC_000068.7的第11642792至11693194位,基于转录本NM_008367.3(SEQ ID NO:1)及其编码蛋白NP_032393.3(SEQ ID NO:2))和人IL2RA基因(NCBI Gene ID:3559,Primary source:HGNC:6008,UniProtKB:P01589,位于10号染色体NC_000010.11的第6010694至6062370位,基于转录本NM_000417.2(SEQ ID NO:3)及其编码蛋白NP_000408.1(SEQ ID NO:4所示))对比示意图如图1所示。

本发明计划对非人动物(如小鼠)进行改造,使该非人动物体内包含编码人IL2RA蛋白的核酸序列,得到经遗传修饰的非人动物体内可表达人或人源化IL2RA蛋白。为了达到本发明的目的,可在小鼠内源IL2RA基因座引入编码人IL2RA蛋白的基因序列,使得该小鼠表达人或人源化IL2RA蛋白。具体而言,用基因编辑技术对小鼠细胞进行修饰,在小鼠内源IL2RA基因座上用人IL2RA基因的序列替换特定小鼠IL2RA基因序列。在小鼠IL2RA基因调节元件的控制下,如将至少包含小鼠IL2RA基因的2号至6号外显子的8807bp的序列用对应的人基因序列替换,得到小鼠人源化IL2RA基因座,示意图如图2所示。

进一步的,设计如图3所示的打靶策略。分别用细菌人工染色体(BAC)获得小鼠和人IL2RA基因的DNA序列。其中图3所示的,靶向载体上含有5’同源臂(SEQ ID NO:5)、3’同源臂(SEQ ID NO:6)以及含有人IL2RA基因序列的片段,其中5’同源臂与NCBI登录号为NC_000068.7的第11670417至11674302位核苷酸序列相同;3’同源臂与NCBI登录号为NC_000068.7的第11683554至11689329位核苷酸序列相同;含有人IL2RA基因序列的片段上的人IL2RA基因片段(SEQ ID NO:7)与NCBI登录号为NC_000010.11的第6019444至6026017位核苷酸序列相同。

其中,人IL2RA基因序列和鼠基因座的上游连接设计为5’-TCTCCTTGCCTTTGCAGAACTGTGTGACGATGACCCGCCAGAGATCCCAC-3’(SEQ ID NO:8),其中序列“TGTGT”的最后一个“T”是小鼠序列的最后一个核苷酸,序列“GACGA”的第一个“G”是人序列的第一个核苷酸。

人IL2RA基因的序列和鼠基因座的下游连接设计为5’-CATGGAGACGTCCATATTTACA ACAGAGTATAAGGTAGCAGGTGGGCCAG-3’(SEQ ID NO:9)其中序列“CAACA”的最后一个“A”是人序列的最后一个核苷酸,序列“GAGTA”的第一个“G”是小鼠序列的第一个核苷酸。

改造后的人源化小鼠IL2RA的mRNA序列及其编码的蛋白质序列分别如SEQ ID NO:10和SEQ ID NO:11所示。

靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧具有两个同向排列的位点特异性重组系统FRT重组位点,组成Neo盒(Neo cassette)。

其中,Neo盒5’端与小鼠IL2RA基因座的连接设计为5’-GGCAGAGGCCAGCCTGGTCTGCATAGTGAATTCCAGTATAGTCGACGGTATCGATAAGCTTGATATCGAATTCCGAAGTT-3’(SEQ ID NO:12),其中序列“GTATA”的最后一个“A”是小鼠序列的最后一个核苷酸,序列“GTCGA”的第一“G”是Neo盒的第一个核苷酸。

Neo盒3’端与小鼠IL2RA基因座的连接设计为5’-TTCATCAGTCAGGTACATAATGGTGGATCCACTAGTTCTAGAGCGGCCGCGCCAGAACGACATAGTGAGACCTTGTTTCA-3’(SEQ ID NO:13),其中序列“GCCGC”的最后一个“C”是Neo盒的最后一个核苷酸,“GCCAG”的第一个“G”是小鼠序列的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因,即白喉毒素A亚基的编码基因(DTA)。

靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测,确认外源基因的整合情况,筛选出正确的阳性克隆细胞。经PCR鉴定为阳性的克隆再进行Southern Blot(分别用StuI或NdeI或DraIII消化细胞DNA并使用3个探针进行杂交)检测,结果如图4所示,检测结果表明PCR鉴定为阳性的11个克隆中(1-H03、2-A02、2-C07、2-D10、2-F09、2-F11、3-F02、3-G11、3-H03、3-H07、4-B03)均为阳性杂合克隆且无随机插入。

PCR测定包括下述引物:

F1:5’-TCTGGTGGAATTTTTGGGGTTCACT-3’(SEQ ID NO:14)

R1:5’-TCTGTCTCACTCTTTGCTGCAGTTCT-3’(SEQ ID NO:15)

F2:5’-GCTCGACTAGAGCTTGCGGA-3’(SEQ ID NO:16)

R2:5’-CTGAGTGGGTCTGAGCAAGATGTCC-3’(SEQ ID NO:17)

Southern Blot检测包括如下探针引物:

5’探针:

5’F:5’-GATATTCCGGTGTGCCATTCTGCCT-3’(SEQ ID NO:18)

R:5’-GTAGTAGGCAGCGTCAACTCGAAGG-3’(SEQ ID NO:19)

5’3’探针:

3’F:5’-GAAGAGCAGAAGAACCATCTAGCAAG-3’(SEQ ID NO:20)

3’R:5’-CATTAGTGCTGAGTTTTACTTGGGC-3’(SEQ ID NO:21)

Neo探针:

Neo F:5’-GGATCGGCCATTGAACAAGATGG-3’(SEQ ID NO:22)

Neo R:5’-CAGAAGAACTCGTCAAGAAGGCG-3’(SEQ ID NO:23)

按照本领域已知的技术将筛选出的阳性克隆细胞(黑色鼠)导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图5)后,再通过互相交配即可得到表达人源化IL2RA蛋白的人源化纯合子小鼠。可通过PCR鉴定子代小鼠体细胞的基因型,示例性的F1代小鼠(已去除Neo标记基因)的鉴定结果见图6,其中,编号为F1-1、F1-2、F1-3、F1-4、F1-5、F1-6、F1-7、F1-8的小鼠为阳性杂合小鼠。

PCR测定包括下述引物:

WT-F:5’-ACTGATCCCGAGGAGGTAGAGTACG-3’(SEQ ID NO:24)

WT-R:5’-AGGGTCACACTTACAGTTGCTGGTG-3’(SEQ ID NO:25)

WT-F:(SEQ ID NO:24)

Mut-R:5’-CTGGGCTCTGTCTCACTCTTTGCTG-3’(SEQ ID NO:26)

FRT-F:5’-CATGGGTCAGCTGTAGTACGTTGGG-3’(SEQ ID NO:27)

FRT-R:5’-AGGCTAAATGGGTAGGGAGACTGCT-3’(SEQ ID NO:28)

Flp-F2:5’-GACAAGCGTTAGTAGGCACATATAC-3’(SEQ ID NO:29)

Flp-R2:5’-GCTCCAATTTCCCACAACATTAGT-3’(SEQ ID NO:30)

以上实验表明通过本方法,构建了可稳定传代且无随机插入的IL2RA基因人源化的转基因小鼠。

实施例2 IL2RA基因人源化小鼠体内人源化IL2RA蛋白的表达

通过常规检测方法可确认小鼠体内人源化IL2RA蛋白的表达情况。选取8周龄的野生型C57BL/6小鼠和实施例1制备的IL2RA基因人源化杂合小鼠各2只,随机分为两组,其中一组腹腔注射7.5μg/200μL的mCD3刺激,另一组作为对照组不注射抗体,24小时后取脾脏细胞进行流式检测。染色方案如下:先用PerCP/Cyanine5.5 anti-mouse TCRβchain(mTCRβ-PerCP/Cy5.5)标记T细胞,然后用抗鼠IL2RA抗体PE anti-mouse CD25 Antibody(mCD25PE)和抗鼠CD4抗体FITC anti-mouse CD4 Antibody(mCD4 FITC)或抗人IL2RA抗体APCanti-human CD25 Antibody(hCD25 APC)和抗鼠CD4抗体mCD4 FITC识别染色后进行流式检测。流式分析结果(见图7)表明可在所有小鼠脾脏细胞中CD4阳性的细胞群中检测到部分细胞中有鼠IL2RA的表达,其中未经CD3刺激的野生型小鼠和人源化小鼠脾脏内CD4阳性细胞中mIL2RA蛋白表达水平较低,mCD4+mIL2RA+细胞的比例分别为5.03%和3.86%(图7A、7B),经mCD3抗体刺激后,mCD4+mIL2RA+细胞的比例分别为22.1%和19.5%(图7E、7F),均出现明显增加;此外,不论是否经过mCD3抗体刺激,野生型小鼠脾脏内均未检测到hIL2RA蛋白的表达(图7C、7G),而IL2RA基因人源化小鼠在经CD3刺激后,CD4+hIL2RA+细胞比例从3.79%增加到15.6%(图7D、7H),上述结果证明了小鼠体内IL2RA蛋白表达水平很低,但可在CD4+T细胞被刺激后大量诱导产生;与野生型C57BL/6小鼠相比,抗人IL2RA抗体可以检测到人源化小鼠脾脏内表达人源化IL2RA蛋白的细胞,而在C57BL/6对照鼠的脾脏内未检测到表达人或人源化IL2RA蛋白的细胞。

进一步的,将实施例1鉴定为阳性的杂合小鼠互相交配,可得到IL2RA人源化基因工程小鼠纯合子。选取纯合小鼠(10周龄)及野生型同周龄C57BL/6小鼠作为对照,用鼠CD3抗体刺激24h后取脾脏细胞进行FACS检测,检测结果表明(见图8-10)纯合小鼠体内的T细胞和NK细胞比例与野生型小鼠接近,其中NK、CD4+T细胞及CD8+T细胞中均有不同程度的IL2RA表达,且纯合小鼠体内只能检测到表达人源化IL2RA蛋白的细胞,不能检测到表达鼠IL2RA蛋白的细胞;野生型小鼠体内只能检测到表达鼠IL2RA蛋白的细胞,不能检测到表达人或人源化IL2RA蛋白的细胞。

已知p-STAT5为IL2/IL2RA介导的信号通路中的下游产物,可通过检测IL2RA基因人源化小鼠体内p-STAT5的表达来验证人源化小鼠信号通路是否正常。取野生型C57BL/6小鼠(14周龄)和IL2RA基因人源化纯合小鼠(14周龄)脾脏并分离脾脏细胞(每份5x105个细胞,各4份),37℃培养箱孵育30min后,分别用0U/mL、10U/mL、100U/mL、1000U/mL的鼠重组白介素-2(mIL2)或人IL2(hIL2)刺激15min,再用APC Rat Anti-Mouse CD3 MolecularComplex染色后破膜,再用Phospho-Stat5(Tyr694)(D47E7)Rabbit mAb和Anti-rabbitIgG(H+L),F(ab')2Fragment(Alexa488Conjugate)识别染色后进行流式检测,对流式结果进行分析(见图11),结果表明使用mIL2和hIL2刺激后,野生型C57BL/6小鼠和IL2RA基因人源化小鼠脾细胞中均可检测出鼠p-STAT5表达(图11A、11B),这证明了人源化小鼠的IL2/IL2RA信号通路正常,且mIL2可以结合人源化IL2RA,hIL2可以结合鼠IL2RA。

可进一步用抗人IL2RA抗体进行确认IL2/IL2RA信号通路功能是否正常。抗体Tab02(daclizumab)和Tab04(7G7B6)均为抗人IL2RA抗体,已知Tab02具有阻断效应,而Tab04只能结合IL2RA并无阻断效应。取野生型和IL2RA基因人源化纯合子小鼠的脾脏细胞各3份(每份5x105个细胞),先用100U/mL mIL2刺激15分钟,每种细胞随机选取2份加入Tab02或Tab04(10μg/mL,两种抗体均由外部公司合成)中的一种,另1份加入等量人IgG作为对照,于37℃孵育30分钟后按前述染色方案检测p-STAT5蛋白的表达情况,对流式结果进行分析(如图12),发现在3份野生型小鼠的细胞中均可检测到鼠p-STAT5的表达,人源化小鼠的对照组和加入抗人IL2RA抗体Tab04的细胞系中均可检测到鼠p-STAT5的表达且表达水平相当,只有在人源化小鼠加入抗人IL2RA抗体Tab02抗体的细胞发现p-STAT5的表达水平明显降低,这表明阻断型抗人IL2RA抗体Tab02可以与人源化小鼠体内经人源化改造的IL2RA结合并阻断该信号通路,从而降低p-STAT5的表达,但该抗体不能影响野生型小鼠体内的IL2RA信号传导。本研究进一步证明人源化小鼠体内IL2/IL2RA信号通路功能正常,其表达的人源化IL2RA可以结合抗人IL2RA抗体,并表明本方法制备的小鼠可用于抗人IL2RA阻断型抗体的筛选、药效评价等。

实施例3 IL2RA基因人源化小鼠模型体内药效验证

利用本方法制备的人源化小鼠构建肿瘤模型,可用于测试靶向人IL2RA的药物。在一个实验中,取实施例1制备的IL2RA基因人源化纯合子小鼠(6-7周龄),按体重随机分为对照组和治疗组(n=5/组),分组后第二天所有小鼠皮下接种小鼠结肠癌细胞MC38(5×105个)。对照组注射同型对照抗体(Isotype),治疗组随机选择两种抗人IL2RA单克隆抗体(AB1和AB2,使用常规方法免疫小鼠得到,参见Janeway'sImmunobiology(9thEdition))中的一种,给药剂量为10mg/kg。给药方式:腹腔注射,分组当天开始给药,每周给药2次,共给药6次。每周测量肿瘤体积2次,接种后单只小鼠肿瘤体积达到3000mm3时执行安乐死。

整体来看,各组实验过程中小鼠健康状态良好。在实验终点时,各组动物体重均出现一定程度的增长。所有治疗组(G2、G3)和对照组小鼠(G1)体重(图13)在整个实验周期内均无显著区别,整体呈现增长趋势(图14);从肿瘤体积测量结果上看(图15),对照组小鼠肿瘤在实验周期内均持续生长,而所有治疗组小鼠与对照组相比,肿瘤体积均出现不同程度的缩小,可见在使用抗人IL2RA抗体AB1或AB2治疗后,可以抑制小鼠体内的肿瘤生长。表明这2种抗人IL2RA抗体未对动物产生明显毒性作用,安全性较好,且具有不同的体内抑制肿瘤效果。

表3中列出了各个实验的主要数据和分析结果,具体包括分组后第10天、分组后21天时、实验结束时(分组后第28天)的肿瘤体积、小鼠存活情况、肿瘤(体积)抑制率(TumorGrowth Inhibition Value,TGITV)以及治疗组与对照组的小鼠体重、肿瘤体积之间的统计学差异(P值)。

表3肿瘤体积、存活情况及肿瘤抑制率

从表3可见,对照组和治疗组的所有小鼠在实验终点时均存活,所有治疗组与对照组相比,动物体重无显著性差异(p>0.05),表明动物对抗人IL2RA抗体AB1和AB2耐受良好,未对动物产生明显毒性作用,安全性较好。对照组所有小鼠在实验过程中肿瘤持续生长,在实验终点时,对照组平均肿瘤体积为2635±297mm3,AB1抗体治疗组(G2)为195±58mm3,AB2抗体治疗组(G3)为833±307mm3,所有治疗组小鼠的肿瘤体积与对照组的肿瘤体积相比均具有显著差异(P≤0.05),TGITV分别为92.2%和66.7%。表明在相同的给药剂量和频次下,抗人AB1抗体与抗人AB2抗体在体内都具有明显的抑制肿瘤生长上的效果(TGITV>60%),且抗人AB1抗体在治疗和抑制肿瘤生长能力优于抗人AB2抗体。由此证明不同的抗人IL2RA抗体在IL2RA人源化小鼠体内表现出不同的抑制肿瘤生长能力和不同的疗效,且均未对动物产生明显毒副作用,安全性较好。

在另一个类似实验中,采用相同的方法验证另外2种不同的抗人IL2RA单克隆抗体(ab1、ab2)的药效,结果如图16、图17、图18所示。表4中列出了各组实验的主要数据和分析结果。整体来看,各组实验过程中小鼠体重增长良好,所有治疗组和对照组小鼠体重在整个实验周期内均无显著差异(图16),整体呈现增长趋势(图17);在实验终点时,所有治疗组小鼠的肿瘤体积与对照组的肿瘤体积相比出现不同程度的缩小,且均与对照组具有显著差异(P≤0.05)(图18)。其中,抗人ab2抗体抑制肿瘤生长能力优于抗人ab1抗体。

表3肿瘤体积、存活情况及肿瘤抑制率

上述研究结果证明人源化IL2RA动物模型可作为体内药效研究的活体模型,用于IL2RA相关调节剂的筛选、评估和治疗实验,并可用于在动物体内评估靶向人IL2RA信号通路的抗体的有效性及治疗效果等。

采用其它基因编辑系统和制备方法也可以得到本发明的非人哺乳动物,包括但不限于基于锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)、规律成簇间隔短回文重复(CRISPR)技术或其他分子生物学技术。

以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。

序列表

<110> 北京百奥赛图基因生物技术有限公司

<120> IL2RA基因人源化的非人动物的构建方法及应用

<130> 1

<160> 30

<170> SIPOSequenceListing 1.0

<210> 1

<211> 4428

<212> DNA/RNA

<213> 小鼠(Mouse)

<400> 1

aagttcctgc tgagcagatc agcctaatgc ttaaatagaa caactcctgg ctgtcattga 60

cattgtctaa aagccaagat gacagactga gaggcctgag cccttgttct ggcattctcc 120

caggaagatg cagtaaaggg gttgacccaa tatactgcag agaatttcat ccagttccct 180

cctccatcct gatcccatgt gccaggaaga tggagccacg cttgctgatg ttggggtttc 240

tctcattaac catagtaccc agttgtcggg cagaactgtg tctgtatgac ccacccgagg 300

tccccaatgc cacattcaaa gccctctcct acaagaacgg caccatccta aactgtgaat 360

gcaagagagg tttccgaaga ctaaaggaat tggtctatat gcgttgctta ggaaactcct 420

ggagcagcaa ctgccagtgc accagcaact cccatgacaa atcgagaaag caagttacag 480

ctcaacttga acaccagaaa gagcaacaaa ccacaacaga catgcagaag ccaacacagt 540

ctatgcacca agagaacctt acaggtcact gcagggagcc acctccttgg aaacatgaag 600

attccaagag aatctatcat ttcgtggaag gacagagtgt tcactacgag tgtattccgg 660

gatacaaggc tctacagaga ggtcctgcta ttagcatctg caagatgaag tgtgggaaaa 720

cggggtggac tcagccccag ctcacatgtg tagatgaaag agaacaccac cgatttctgg 780

ctagtgagga atctcaagga agcagaaatt cttctcccga gagtgagact tcctgcccca 840

taaccaccac agacttccca caacccacag aaacaactgc aatgacggag acatttgtgc 900

tcacaatgga gtataaggta gcagtggcca gctgcctctt cctgctcatc agcatcctcc 960

tcctgagcgg gctcacctgg caacacagat ggaggaagag cagaagaacc atctagcaag 1020

ctagaaaagt cagagcccag gcaagcggat gggaatcaca aagctcaagc caaatctgag 1080

acgccaagca ttcacctaac ggctgtttcc ttctgatccc tgggtttcta gaacattctg 1140

aagtcacagg acataacagc aactctatca ctaaactgga ctttgccatt gaagaatagg 1200

atctaaccac ttcagcacag cagttctaaa gctttaatgg gagagagggc ccaacagtgc 1260

tctgtgtgtt ttgtttttgt gtatatctgt tgatgggagc tgagatggtg tggtcacttt 1320

tcatgtaaca tatagtatag aaaaagtagc tttaggttga cttcattgtt acaacccagt 1380

ttggaaagcc caagtaaaac tcagcactaa tgtaaataat tcctcctcct cctcctctct 1440

cttttcatcc tccgctccat cttcctcttc ttcctcctcc ttttccacct cctctgtccc 1500

tacccacccc cacccatcca ctttccttct tcctttctgc tctcacaagc tcatcctagc 1560

tacacgtgca tggctggctc ctttttcaac ctctgtttgc ctaactggct cttctgattt 1620

catcacttac tgatcagcct ttaaaactct gagctggcaa agatgactct atctatgttc 1680

ttggctcagt cccagaagga aacccccttt tcatgaagct tcagttttga catcctgaag 1740

aacagaaact gtggcagaac aatcttcaga taacatcaaa acaaagtgga gaagccacgg 1800

gaactgtgga gctctggtat tcagaagcct gtgtctaggg tctgcgccag gagcagaagg 1860

ctgaaggaag tcccaggacg tggacttaga tgctttccca gcaggccact ctaagcgctg 1920

gtttctttgg gacagctgtc aattgtacgc tcaatttagc ctgcactaat ctgatgctta 1980

caggtgaaca ctcaaggcac aggtatggac ttggtacata ccgtgaaaac actggaaaga 2040

aaagaatact ttcaagttta cagaaggaag gaaggaaaaa ggaagcagag gtggtgatta 2100

tacaaaagat tagctgtaga ctggatatcc caggcatcct cggataatgc ccccgcccca 2160

gcaccctgat ccaggtcacc aaagccttgt gagatcagac tgcagagcca gtctgtctct 2220

gagtcagtaa atgtagaatt tggatttctc acaagttcct ggcggtgtct tttttttttt 2280

taatattttt tattaggtat tttcctcatt tacatttcca atgctatccc aaaagtcccc 2340

cataccctcc cccacactcc cctacccacc cactcccact ttttggccct ggtgttcccc 2400

tgtactgggg catataaagt ttgcaagtcc tggtggtgtc tttatgctga tctctagccc 2460

acactttgtg aggcactggg ctatcccagt gtgctctcct cttccacaga taccaaaagc 2520

acctgggttt gatgctcaga cttctgagca cgttcttgtt caatctcttg cgtaagattt 2580

cctctcagat gagttgagtc agattctcat gtttaacagt gttttagggg attcacagaa 2640

gcccaaacta tcagttttca tttctgaaaa ggctggaaaa ttttatgaaa aactttcaaa 2700

ggtcagacag agccattttg agtcttttat gtgaccaagt atgaaccaga tctttcctat 2760

ctatggtctc ccctttccaa aatatatctt ttgtggggac acggcaagga ggaaagttaa 2820

atagaatctc aagctactaa ttttagaaaa gaaaaaaata ttaaactctt actaaagagc 2880

tgtgggtagt ggtacacacc tgtaagccca gctctcagga gactgaggca ggaggattgc 2940

agtgagtcag agatcagctt cacctacaag caaaaccctg ccttacccct caacctttcc 3000

ataaaaacag tcttacttgt gtaaaattaa tttttaatac atatttgtgc acgatgtgtg 3060

tgcctggtgc ccagggaagc caaaaaaata tgttcaatgt ccctggaata ggtggttatg 3120

agctgccatg gaggtgatgg gatttaaacc cctgttctct gaaaaagcag ctagttctct 3180

taaccactga gccatctcta cagccccatt aaattgaatt ttattgtcat tactcaatat 3240

gggagatggg gtaatgataa caattttttt tttataatac taagatgttt agctatttta 3300

ctctccttca caagtgtaga gtagaatttt ctagaagcta catgcatgat attatcgctc 3360

tggtgttaac acataatgga tttatcttgt taataaaaga attagtaaat aatattttaa 3420

attttttctt tgttttagtt ttaagatgat taatatctat agatactagt gtacattaag 3480

aaagcctttg ggatcctcaa tcattttgca tggttttagt aattttttaa taacataaag 3540

aaggtctgac agattatgct aaagagctat tgtggtatgg attagaaatg gcccccacag 3600

gctcctgtgt tcaaacatca gctagcagtg ctgctttggg ttttggaacc tttaagaggt 3660

ggggccttgc ttaaggagat aggtcactgg aggtgaacca gacttgcttc cagtctccct 3720

ctctgctgtc ccaggaagcc atcatatgag gagtttcaca acatacttct gctgccacag 3780

agtccctcca gtaaggcacg tactggccac tgtgtagtgt accctctaaa actgagctag 3840

agctcccctc tcctccctac actatctctg ttgatgcttt gtcacggtga tgaagaacat 3900

aagtaaggca aagacaagac atagtttgga gactcacgtg agcatctcag ccagactcag 3960

gcacagctgc gatgtgggaa ttatcaagca tgagatgcaa agcaatggaa aatgaatcgt 4020

tatgacagaa gcctacatct agtcttccct tcttcccatt agtaataata gcccgtgttt 4080

tagaagaaca catctttttg gtgttctagg tagcttatat tgcaaatgtg gcacaatcta 4140

agagaaatct gggatgaggg aacctcagtg aaagattctc cttgatcaga ttgtcccact 4200

gatgattgat atgggaaggc ccaacccact gtgaaaggca ccacccattg gcaggatgac 4260

tggggttata gaagcaaaca ggctgagcat gagccagtga gcaagccagt aagcagtggc 4320

ttctctttgg aagaagcatg gctttcttcc gtggcttctg tttgatctct ctcaatgata 4380

gattgtgacc tagaagtata agctaaaata aaccatttct tacccata 4428

<210> 2

<211> 268

<212> PRT

<213> 小鼠(Mouse)

<400> 2

Met Glu Pro Arg Leu Leu Met Leu Gly Phe Leu Ser Leu Thr Ile Val

1 5 10 15

Pro Ser Cys Arg Ala Glu Leu Cys Leu Tyr Asp Pro Pro Glu Val Pro

20 25 30

Asn Ala Thr Phe Lys Ala Leu Ser Tyr Lys Asn Gly Thr Ile Leu Asn

35 40 45

Cys Glu Cys Lys Arg Gly Phe Arg Arg Leu Lys Glu Leu Val Tyr Met

50 55 60

Arg Cys Leu Gly Asn Ser Trp Ser Ser Asn Cys Gln Cys Thr Ser Asn

65 70 75 80

Ser His Asp Lys Ser Arg Lys Gln Val Thr Ala Gln Leu Glu His Gln

85 90 95

Lys Glu Gln Gln Thr Thr Thr Asp Met Gln Lys Pro Thr Gln Ser Met

100 105 110

His Gln Glu Asn Leu Thr Gly His Cys Arg Glu Pro Pro Pro Trp Lys

115 120 125

His Glu Asp Ser Lys Arg Ile Tyr His Phe Val Glu Gly Gln Ser Val

130 135 140

His Tyr Glu Cys Ile Pro Gly Tyr Lys Ala Leu Gln Arg Gly Pro Ala

145 150 155 160

Ile Ser Ile Cys Lys Met Lys Cys Gly Lys Thr Gly Trp Thr Gln Pro

165 170 175

Gln Leu Thr Cys Val Asp Glu Arg Glu His His Arg Phe Leu Ala Ser

180 185 190

Glu Glu Ser Gln Gly Ser Arg Asn Ser Ser Pro Glu Ser Glu Thr Ser

195 200 205

Cys Pro Ile Thr Thr Thr Asp Phe Pro Gln Pro Thr Glu Thr Thr Ala

210 215 220

Met Thr Glu Thr Phe Val Leu Thr Met Glu Tyr Lys Val Ala Val Ala

225 230 235 240

Ser Cys Leu Phe Leu Leu Ile Ser Ile Leu Leu Leu Ser Gly Leu Thr

245 250 255

Trp Gln His Arg Trp Arg Lys Ser Arg Arg Thr Ile

260 265

<210> 3

<211> 3216

<212> DNA/RNA

<213> 人(human)

<400> 3

ggcagtttcc tggctgaaca cgccagccca atacttaaag agagcaactc ctgactccga 60

tagagactgg atggacccac aagggtgaca gcccaggcgg accgatcttc ccatcccaca 120

tcctccggcg cgatgccaaa aagaggctga cggcaactgg gccttctgca gagaaagacc 180

tccgcttcac tgccccggct ggtcccaagg gtcaggaaga tggattcata cctgctgatg 240

tggggactgc tcacgttcat catggtgcct ggctgccagg cagagctctg tgacgatgac 300

ccgccagaga tcccacacgc cacattcaaa gccatggcct acaaggaagg aaccatgttg 360

aactgtgaat gcaagagagg tttccgcaga ataaaaagcg ggtcactcta tatgctctgt 420

acaggaaact ctagccactc gtcctgggac aaccaatgtc aatgcacaag ctctgccact 480

cggaacacaa cgaaacaagt gacacctcaa cctgaagaac agaaagaaag gaaaaccaca 540

gaaatgcaaa gtccaatgca gccagtggac caagcgagcc ttccaggtca ctgcagggaa 600

cctccaccat gggaaaatga agccacagag agaatttatc atttcgtggt ggggcagatg 660

gtttattatc agtgcgtcca gggatacagg gctctacaca gaggtcctgc tgagagcgtc 720

tgcaaaatga cccacgggaa gacaaggtgg acccagcccc agctcatatg cacaggtgaa 780

atggagacca gtcagtttcc aggtgaagag aagcctcagg caagccccga aggccgtcct 840

gagagtgaga cttcctgcct cgtcacaaca acagattttc aaatacagac agaaatggct 900

gcaaccatgg agacgtccat atttacaaca gagtaccagg tagcagtggc cggctgtgtt 960

ttcctgctga tcagcgtcct cctcctgagt gggctcacct ggcagcggag acagaggaag 1020

agtagaagaa caatctagaa aaccaaaaga acaagaattt cttggtaaga agccgggaac 1080

agacaacaga agtcatgaag cccaagtgaa atcaaaggtg ctaaatggtc gcccaggaga 1140

catccgttgt gcttgcctgc gttttggaag ctctgaagtc acatcacagg acacggggca 1200

gtggcaacct tgtctctatg ccagctcagt cccatcagag agcgagcgct acccacttct 1260

aaatagcaat ttcgccgttg aagaggaagg gcaaaaccac tagaactctc catcttattt 1320

tcatgtatat gtgttcatta aagcatgaat ggtatggaac tctctccacc ctatatgtag 1380

tataaagaaa agtaggttta cattcatctc attccaactt cccagttcag gagtcccaag 1440

gaaagcccca gcactaacgt aaatacacaa cacacacact ctaccctata caactggaca 1500

ttgtctgcgt ggttcctttc tcagccgctt ctgactgctg attctcccgt tcacgttgcc 1560

taataaacat ccttcaagaa ctctgggctg ctacccagaa atcattttac ccttggctca 1620

atcctctaag ctaaccccct tctactgagc cttcagtctt gaatttctaa aaaacagagg 1680

ccatggcaga ataatctttg ggtaacttca aaacggggca gccaaaccca tgaggcaatg 1740

tcaggaacag aaggatgaat gaggtcccag gcagagaatc atacttagca aagttttacc 1800

tgtgcgttac taattggcct ctttaagagt tagtttcttt gggattgcta tgaatgatac 1860

cctgaatttg gcctgcacta atttgatgtt tacaggtgga cacacaaggt gcaaatcaat 1920

gcgtacgttt cctgagaagt gtctaaaaac accaaaaagg gatccgtaca ttcaatgttt 1980

atgcaaggaa ggaaagaaag aaggaagtga agagggagaa gggatggagg tcacactggt 2040

agaacgtaac cacggaaaag agcgcatcag gcctggcacg gtggctcagg cctataaccc 2100

cagctcccta ggagaccaag gcgggagcat ctcttgaggc caggagtttg agaccagcct 2160

gggcagcata gcaagacaca tccctacaaa aaattagaaa ttggctggat gtggtggcat 2220

acgcctgtag tcctagccac tcaggaggct gaggcaggag gattgcttga gcccaggagt 2280

tcgaggctgc agtcagtcat gatggcacca ctgcactcca gcctgggcaa cagagcaaga 2340

tcctgtcttt aaggaaaaaa agacaagatg agcataccag cagtccttga acattatcaa 2400

aaagttcagc atattagaat caccgggagg ccttgttaaa agagttcgct gggcccatct 2460

tcagagtctc tgagttgttg gtctggaata gagccaaatg ttttgtgtgt ctaacaattc 2520

ccaggtgctg ttgctgctgc tactattcca ggaacacact ttgagaacca ttgtgttatt 2580

gctctgcacg cccacccact ctcaactccc acgaaaaaaa tcaacttcca gagctaagat 2640

ttcggtggaa gtcctggttc catatctggt gcaagatctc ccctcacgaa tcagttgagt 2700

caacattcta gctcaacaac atcacacgat taacattaac gaaaattatt catttgggaa 2760

actatcagcc agttttcact tctgaagggg caggagagtg ttatgagaaa tcacggcagt 2820

tttcagcagg gtccagattc agattaaata actattttct gtcatttctg tgaccaacca 2880

catacaaaca gactcatctg tgcactctcc ccctccccct tcaggtatat gttttctgag 2940

taaagttgaa aagaatctca gaccagaaaa tatagatata tatttaaatc ttacttgagt 3000

agaactgatt acgacttttg ggtgttgagg ggtctataag atcaaaactt ttccatgata 3060

atactaagat gttatcgacc atttatctgt ccttctctca aaagtgtatg gtggaatttt 3120

ccagaagcta tgtgatacgt gatgatgtca tcactctgct gttaacatat aataaattta 3180

ttgctattgt ttataaaaga ataaatgata tttttt 3216

<210> 4

<211> 272

<212> PRT

<213> 人(human)

<400> 4

Met Asp Ser Tyr Leu Leu Met Trp Gly Leu Leu Thr Phe Ile Met Val

1 5 10 15

Pro Gly Cys Gln Ala Glu Leu Cys Asp Asp Asp Pro Pro Glu Ile Pro

20 25 30

His Ala Thr Phe Lys Ala Met Ala Tyr Lys Glu Gly Thr Met Leu Asn

35 40 45

Cys Glu Cys Lys Arg Gly Phe Arg Arg Ile Lys Ser Gly Ser Leu Tyr

50 55 60

Met Leu Cys Thr Gly Asn Ser Ser His Ser Ser Trp Asp Asn Gln Cys

65 70 75 80

Gln Cys Thr Ser Ser Ala Thr Arg Asn Thr Thr Lys Gln Val Thr Pro

85 90 95

Gln Pro Glu Glu Gln Lys Glu Arg Lys Thr Thr Glu Met Gln Ser Pro

100 105 110

Met Gln Pro Val Asp Gln Ala Ser Leu Pro Gly His Cys Arg Glu Pro

115 120 125

Pro Pro Trp Glu Asn Glu Ala Thr Glu Arg Ile Tyr His Phe Val Val

130 135 140

Gly Gln Met Val Tyr Tyr Gln Cys Val Gln Gly Tyr Arg Ala Leu His

145 150 155 160

Arg Gly Pro Ala Glu Ser Val Cys Lys Met Thr His Gly Lys Thr Arg

165 170 175

Trp Thr Gln Pro Gln Leu Ile Cys Thr Gly Glu Met Glu Thr Ser Gln

180 185 190

Phe Pro Gly Glu Glu Lys Pro Gln Ala Ser Pro Glu Gly Arg Pro Glu

195 200 205

Ser Glu Thr Ser Cys Leu Val Thr Thr Thr Asp Phe Gln Ile Gln Thr

210 215 220

Glu Met Ala Ala Thr Met Glu Thr Ser Ile Phe Thr Thr Glu Tyr Gln

225 230 235 240

Val Ala Val Ala Gly Cys Val Phe Leu Leu Ile Ser Val Leu Leu Leu

245 250 255

Ser Gly Leu Thr Trp Gln Arg Arg Gln Arg Lys Ser Arg Arg Thr Ile

260 265 270

<210> 5

<211> 3886

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ttcttaacag cttggtgagt gccacttcag tgagtgtgtg tcttcaataa tcacaatatt 60

ttctttggaa acatgactat tcgagtgttt gttcatctat cgattcagtt gccctttagt 120

gttgctatgt aggtttttgt gtattctgga aacaaatatt gtcatatata cattataaat 180

ggttttctca cagcctgcca catctcctcc attttctcat ggtctttgga ttagctgata 240

cttttgtaat tttttttttc ttttataaaa tctttaacct ggagcagggc atgggagggt 300

ggactcagac cctctgatgc tggggttaca ggtgcttgtg agctgcttgg ttcaggtggc 360

tgggaagcga acattggtcc tctgcaaagg tagcaagcat tctcagcaac tgagccatct 420

ctccagcccc cttttccttt tatattcagt gcatgctctg tcctaagaaa tcttcaccta 480

tccacaactt ctaaagctgt ctgcctttat ttccttttag aagttttaca gttttaattc 540

tatgattgca tgtgatacac acacacacac acacacacac acacacacac acacacacac 600

gttcttatta tggaagagaa ataagttttc tctgtggaag gaagctcttt tcccttttca 660

catttatcca cacgactcaa gagtatttgt tgagaacgtt gtcctctttt catgaattgc 720

tttggtaaat gggggggggg gcagtaatta aatgttcctg agtttctaga atgtatattc 780

tgtcgctgta cttgtttttc tcccagttgc ttgctgtctt gatggctagc tttatagtaa 840

cagatgttat gagtctccta tcatacactt tatcttacag ttatcttaga tacttccaag 900

gaagtttgaa aacaattttc caattttact aatatgtaca tcaaaccagt gaattgaagg 960

taaactgaca tgtcttttaa aaatcagccc tccaatttat aaacagtgta tgtttctctg 1020

tttatttcac ttaaaaattt tttctcagca gaaattcttt tgcaattttc aagtctgttc 1080

ttgtaggtgt gggtgaattt attcttgagt attttatgat tctgatgtgt aattacaatt 1140

aactttagat cttaattaat tcattcagtt taaatatata acaagtgatt tgagatagcc 1200

acacctacct acttacatac gccattatgt agaattctcg gtactttcat ggaaagaggc 1260

atttttagct gtgttaagtg ccctttccca caaaactact ttctgatagt aacatagccc 1320

atatcagctt tcctatgctt atctctgcat atctttttct attctttcac tcaattcatt 1380

ttggttttta tattttagca ttttctttgt gagatagtat gcagttgttg tggtctgaaa 1440

gtttctattt tagaaaaaat tgttcattta tgtttactat aatcactagt agtgggttga 1500

cgttgatgtc tgccttcttg ctctttcttc gtgcttcttc atttcaccta aacagatctg 1560

tttaatacat attggaatgt tctgtttaat ttattctgtt atcttttaat gtgtgctcct 1620

ggtagtattt cattattggg tgccttccct ggaatattta ctatgcattc ttaattttct 1680

atgttctatt tagttagcat tgtaccattt cagacatgct agaaaaattt aaaaagctaa 1740

aggcccatca acctcagctt tcttgcccaa gttgtcacgt tttacattta agtaggtact 1800

aagatctgtc ctgtagggac cagcacggtg gctcagtggc taagaatgca tgcacactgc 1860

tcttccagaa gatctgagtt tagttccagg cactcacact gtacagctca caatcacctg 1920

tttctgacgc cctcttctgg tctctaggag aactgcactc accccctccc ctaacacaca 1980

cagttaaatc aaaaataaat aaaagaccta ccatacagtg ctattttttt tttattttag 2040

acatctcttt caagaaaaaa ctggaatttt ctcatgaata tatacttact aatgcccttc 2100

attattccca gtagatttct atttttgact aatataattt ccctgggtct tgacattttg 2160

tccttagctt tcttttcact tttaatatgc actataagtg tgctagtggg gttttgtgaa 2220

ctttctttta cctgaaaatg tgctaacccc atcctcattt ttgaagggtg tcacgtctaa 2280

tcaggattga gctgaaagcc tgtctgtgtg tctgtttcga ggctggctct gtttccctgt 2340

tattttctgg ctccctttgc tctgtggtga agtcagttgt catccatcac tgttcccact 2400

aatgtgtgtg gcctttccct ctggctcctt taagacattc tctttagatt tttggcagct 2460

tggcattaga tgcataacaa tttgctttta aaagtctact ctggtgtcat gaacatcttg 2520

gatctgtaag ttaacatctg tcttcaagag tcagaaatga gctggcaaga tgggtaagtg 2580

tgtacaggtg tttcctattg gtggccctcc cacatttcat ccttcccaaa cagttccacc 2640

aagcaggacc aagcattcaa atatataagt ctatgaggga cattttcttt cgaaccacta 2700

aacagaggga tagaaaaggg ggcggggact ggatgtgtgg gttggggtga tagatagaac 2760

atacttcttt gccttctact tcctgtccca gctacatctc cagctgactc ttgggtgcct 2820

gcccacactg agggcggggt cttttcccta ttattttgct gacctgtagt cagtcttctc 2880

aggcaatgtg cttacagata cacccagaag tatgtttcaa attctctagg catccattag 2940

agccttcagt cgacacctca aactagccgt catgatactc accagtctaa tgtataagca 3000

ggtgcagtgt tggcctcggt gttggcctca gcatgccgtt ccagatggag caggtgggca 3060

ggatggcagc ttgattacaa ccaccttcac acactcagcc atcatgccat gacagccccc 3120

tgctttcctg ccactcccac tccttaccat cactcactcc cccctccacc ccccacctgc 3180

tgtggtagtc tcctagtcac ctgatgtctt caagcacaag agcttgttgc aatggaatgg 3240

ttttcactta catcagggtc cctcttccct tcaagagtcg ggcatagaga gctggctgtg 3300

gcagtgtgca cctgtaatcg aaagacttgg gactgaaagc aggatggtag gagttcatcc 3360

tcagctacat aacgaacttg agcccaattg ggcctacagg agaacactcc ctctcaaaat 3420

gattacatgg gaacctctat ttctggtgat catgctagga cacctgacct gtctcagaag 3480

ctttggccca cccaacctct ctcctgtgta tgctagacac aaagtacctt cagagtgaaa 3540

ttctacttat ttgtacttat tccttctaca gtttgcattt tatactgtag aggaacttga 3600

gtgaacactc ctatagcatc tctgacacaa atatttatct cttcagtttt atacaatggg 3660

tttcattgtg acttttccat agatgcatat aatgtatttt gatcatattc acacacacac 3720

acacatacac acacatacac acatatcatc ctctgtgctc ccactgatcc cgaggaggta 3780

gagtacgtac caatccttta aattgagaga agaagcatgt gagcaagcta ctgcacaatc 3840

aaactcatgt ctcaccaaca ttctccttgc ctttgcagaa ctgtgt 3886

<210> 6

<211> 5776

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

gccagaacga catagtgaga ccttgtttca aagaaataaa agaattttta aaaagagaaa 60

gataaatgtt tgttcccagc ttactctcct ttttatggaa cctatggaat ggggccccac 120

atttagagca gtctccctac ccatttagcc taatcttgat aacctctcaa ggacgtgtcc 180

agaacgttat ctctaatgtg actcgaaaac ctgtcaatca acataaacca agagcatcat 240

cagagttaaa tcacccaaaa ccagtttctc ccacatacat tttcaagaac aatgcctccc 300

aaactttggt gagagacaaa gcaaggatcc agggagagaa aatatagtgt ccatacgcac 360

ctcagttatt cctggtagga ggcaaaagca ggccttcctg aaccacggaa tcaatggaag 420

cttctggaag attcacatgt cagcatttgg gaagtgtgag cacttccagg cgatatcggt 480

gtgtttagga tttcttatct tgtttcaata gttcctttat gaaggatgat gctgctaatg 540

aggactatcc tctgggcctt cctcaggttg agctgttctg tcaagtacca gcctctttct 600

atggctgttc cttctatgcc ccctctgctc tttgaaggct ccttgatcct tctaagaaat 660

acccagggag aagaggaaag aaagaagaaa ctgcaggccc cagctgttca ggaggtcctt 720

gatcacctac agaattttct cacctgatct acagatccaa cccccgatcc atgcattccc 780

aaagcatggt cctgacctga actccatctc cctctcttga cagtggccag ctgcctcttc 840

ctgctcatca gcatcctcct cctgagcggg ctcacctggc aacacagatg gtaagtccaa 900

cactggaagg acccagcacc ccagtgtctg gtccctggcc tggcatcgtg aacattgcct 960

agagcttgac ctcagctgac acgctgggaa gatggctccg acgaaagcat gagatgggtg 1020

tgcaattcct aaaagctttg tttaaaaaaa aatcgaatgt gatgatggca tttgcctata 1080

attgtataat tcaagagctg aggaggcagg cagaggtgga tccctcatac tctctggcca 1140

gccagcctag agaaactggt gaactccagg ttgatcagga gactctattt caaaagtaat 1200

gtgaataata tactaaggaa caagattcca ggttgacctc tagactccac agtcatttac 1260

tccctgacac acgtactctt actgaatgtg tatgcccggt actgagtggg ttacattagc 1320

aaatgtcacc cctactctca gaggtctgtg ctgtttagag attaggaaaa cctaggcttc 1380

ccgaatgtgc agatagcaag agtttgaatc ctatttagag atcttcaacc ttgccatcca 1440

tccaccaggg ctctaccaag gtcgctggaa cagaccatgc caccccaccc tccctccaac 1500

tccgctgatc atccactaga aaccagcatg ggtagcaagg gatggagaga ggagacgggg 1560

accatggcta gaccaggctt gatggtatgg atgaaggttg ctagatactc acaaggcttt 1620

aaaaaaaaca ttcttgcatt tatcattaaa tacagtgaaa agctcccgga tagcaagagc 1680

agggggaggc tctgtattct gtgtctgtgt gtctggctgt gtctgtgtgt ctgcctgtct 1740

gggagttccc ttgtttttta ggccctaagt atcttggtca gtgatatctg ccatggctca 1800

tataatgtct ttttatggat aaacatattt tcaagccatg attaagtaaa gagttttgtg 1860

tgagacagaa accagaaatc agaaatctag gtgaacatac aaattgcacg tgcatgtgtg 1920

cacacacaga cacacacaca gacacacaca cagacacaca cacacagaca tacacagaca 1980

cacatagaca cagacataca cagacacaca aacacacaga cacacagaca cacacacaca 2040

cactgggggg ttggaggagg actgtgtatc atggtacatt ccattgatct cagcacacaa 2100

gagttggaga caggaagatc atgagtttga gtttgaaagc agtcgggctg tatagaaatt 2160

cgaatgccag cctcatagtg agagctgtct caaagtaaat gagtaaataa gatgccaagg 2220

gatgtagttc atttggtaga gtgagagctg agcatgccca cgaagcccgg acttgatctc 2280

agcaccataa gaaaccaggt atagcggcat aagcctctaa taccagcgct caggaggtag 2340

aagcagggaa atccaaagtt caaggtcacc ctgggctaca tgagatctta tattaaaaaa 2400

ctaaacacat tattttttaa agatttattt atttatttat tttatgtgag tgcactatag 2460

ctgtcttcag acacaccaga agcgggagtt ggatcccatt tcagatggtt gtgagccacc 2520

atgtggttgc tgggaattga actcaggaat tctggaagag cagtcagtgc tcttaaccac 2580

tgagccatct ctccagcccc aatacattat ttaaagaaga agaagaatta gaagaagaag 2640

gagaaggagg aggaggagga gaagaagaag aagaagaaga agaagaagaa gaagaagaag 2700

aagaagaagg aggaggagga ggaggaggag gaggaggagg aggaggagga ggaggaggag 2760

gaggaggaga aggagaagga gaaggagaag gaaggagaaa aggagaagaa gaagaagaag 2820

aagaagaaga agaagaagaa gaagaagaag aagaagaaga agaagaagaa gaagaagaag 2880

aagaagaaga aagagttaag agtataaaac catcttgaga aaagccagat acatcctcat 2940

tagagtcagc tgtgtgagat gttctgtccc tgtctttgtt tcatttcctg tgggtgatat 3000

aaaatacccc aaccaaagca gcttaagaga gaaggggctt ctctgactta caggtccagg 3060

atgcagtcca cccttgtgtg gcagctaagg tggccgaaac ccgaagcctt tactcatatc 3120

acaccctcca tcaaaagcag ggatcaatga atttgcatgc acacttatcc cagctcactt 3180

cctctttcta tacagtctag gacccaaatc catttagact gggttttccc acatcgatta 3240

cagtaataaa aacaatcccc tgcaggcatg ctcacagatg acctaatcta ggtaatccac 3300

cattgagatt cccttccggt aactttaggt tctgttaaat tggcaattaa cactaaatca 3360

tcacacgcct gacgtcaagg gtgtgcccct cctgcccgag caggttctgg ccagccctga 3420

tactttaaat ctttaataac agagtcatag gtatgtgggt gagaatccag tttcttccat 3480

tcttttgttg ttcatctggc ctccttctca ttttcctcaa gtggagcaag aagcagaagg 3540

cattgaggtc cacatgaggg taccccgata gttgctgtgc taagagttac tcatggccct 3600

gacactctac ccatttcctt aagatgttct tttagagttc tgggagataa aacgtgatgt 3660

aatatgcctt gacagtctag gcccctcagt ccttgtgaga ccttcttcct gctcaggacg 3720

agcatctacc tggcatggca ttttcgtttg gtgaagacac cagactcaga accagaggac 3780

agggctcttc atgagcaaca atagcttaga gtttacaatg tgaagcaagg agctgtctaa 3840

gactgtgaga ttcccctaga cctcccagta gcggggccat tagggagact gaaatagaat 3900

ctcaatatga cccctttggt caaagaattt gtccaagaaa acaaaacaaa acacttctga 3960

aatcccagcc acaaggagtc cagcataaca aggtcctgtt gcagacacat aggtgcctgt 4020

gctcacgttt gtacatatat atatatttac atgtgtgtat atatgtgtgt atatatatga 4080

aaaaagttta ctttctagaa gctaatttca tctaatgctg ccctcttgtg gccaattgga 4140

aatcttacct ctgaattctg aaaatttcag tctttgccac tttggaacac ttaccaggag 4200

ctaggagggc actggctggc tcacattagt tacgttttta ggaatttcat gggttttgtt 4260

ttgtttcgtt tcttttcttt gtttgtttgt ttgtttgttt gtttgtttgt ttgtttgttt 4320

gttttgagac agggtttctt tgtgtagccc tggctgtcct ggaactcact ttgtagacca 4380

ggctggcctc gaactcagaa atccacctcc ctctgcctcc cgagtgctgg aattaaaggc 4440

gtgcaccacc atgcccggcc tcattttttg ttttaaatgt tcgccctggg aatttaatcc 4500

aaggccttga gcatgctaga cacatgttct attcagctat gatccagccc tttgaactgt 4560

tttgttaata cttttctctc tttttctgtt tcgtaatgtt gatttttggg tgggattgga 4620

gcacgagcat ccggaagtta gaggacaagt tttgagagtt ggttttctcc ttcattcact 4680

aggattggtg ccaaactccc ttactccctg agacatcttt ctcccccagt cggattgtta 4740

ggttttgtgt gtttgatttg gtttagagca gtagtcctta gccttcctaa ttctgtgacc 4800

ctttaatata gttctgtatg tttaatggct aatcttactc caactcagca gttattagtc 4860

cacaggacta aatgaggaaa aatccacaac tgccaagtgt cagacattgc accgcaggcc 4920

acagacatgc acaacccagc cctgctcgta ggaactagta gactggaaga aaaaaaaaac 4980

ttgaaatatt tttgtggtgc tgaggataca ggtcaatagt agaatgtttt ctcagccctg 5040

ggttcaatcc ttagtataga agaaaaagaa gaaagggaga tatgggtgga aggaaatacg 5100

gagggaggaa gggaatgagg gagggaggga gggagggaca tttgttgaaa gtctaagatg 5160

gagatatgta agcagaagga catttaatct acatgggaat caaaagacag ctgactgagc 5220

tggtatactc tgaagtgtca gataaaacga gccaggaaac atctcctgga agaggaagct 5280

ggggcaccta tggaattgtg aatctgtgtg gtgatgtctg agagaaggtt gagttgtagg 5340

acataaaatg aatgggcacc atggccacaa tgataccaca ctgcccagac agtcagaaat 5400

actgtcatgg aagatgaggc cgcattgagg agctgggcca agatgctgat ggtggtggca 5460

cctcagatca cctcacctag gagagaaacc gttatcttgg ccttctgggt gatctgctgc 5520

gtagaggctt accgtgggca atgtgttgac aatatgattg cattatggtg gaataaatcc 5580

acatagaagt tggtgactgt gcttttgtgg gtctgtggat ctgagtgaat ggaggaaaca 5640

aaccaagggg tatagaaaag aattgagcaa attagtatga ctggtaagct ggataaaaag 5700

atggagtatg gaagaaggat gagtcagaga ggggccgtgg gtttctcaga cagggagcct 5760

ctgtagccac tacatc 5776

<210> 7

<211> 6574

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

gacgatgacc cgccagagat cccacacgcc acattcaaag ccatggccta caaggaagga 60

accatgttga actgtgaatg caagagaggt ttccgcagaa taaaaagcgg gtcactctat 120

atgctctgta caggaaactc tagccactcg tcctgggaca accaatgtca atgcacaagc 180

tctggtaagt gtcccttctg tgactaccaa gaacaaaaga actgcagcaa agagtgagac 240

agagcccagc ttttgttcac tcagccctat agacacaaat gggccagtcc agtctacagg 300

ataactaatt ttagtggttc ctgaaaagtc attcactaaa cacaattttt tttttttttg 360

gagacagact ctcactctgt tgcctaggct ggagtgcaat ggcacgcgat ctcggctcac 420

tgcaacttcc gcctcctggc ttcaagtgat tctcctgcct cagcctcctg agtagctggg 480

attacaggca ccctccacca tgcctggcta atttttgcat ttttagtaga gatggggttt 540

caccatgttg gccaggctgg tctcaaactc ctgaccttga gtaatctgcc catctcagcc 600

acccaaaatg ctgggattac aggcatgagt cacagtgccc ggccacacaa ttttattttt 660

atttttgaga cagtctcgct ctgttgccca ggctggggtg cggtggtaca atctcagatc 720

actgcaacct ccacctcctg ggttcaagtg aatcttgtgc cacagctgcc caagtagctg 780

ggactacagg tgtgcaccac catgcctggc taattttttt atttttagca aagatggggt 840

ttcgccatgt tggccaggct ggtctcgaac tcctggcctc aagtgattct cctgcctggg 900

ccttataggc gcacaccacc atgcctggct aatattttgt attttttgtt agtgatgggg 960

tttccccatg ttgtccaggc tggtcttaaa ctcctgggct caagcagtcc tcctgcctca 1020

gcctcccaat gtgctggaat tataggtgtg agccaccaca cctgacctag acaccctctt 1080

ttatcctgag ctggaatact gatcaccccc ctcactgggg cactcagact caactccttt 1140

gccaaactct tcacaataga gagggctgtt ctagaagttt ccttgtcatt gtgttaagat 1200

ggcgtctcta acttcaagca ttctgaacag ccttagggag caaaggatca gtgtgttgtg 1260

gagtgagacc actcctgctg ctgtcaaaca acacagagac aattgacagc aagcaaggag 1320

tcccttttgg tgagagacac acacatgcac acataacata catgacatac acagacacgt 1380

aacatacatg gcatacacag acacgtaaca tacatgacat gcacagacac gtatacacac 1440

gctcaaaaac atgtcgtggg cattgccata tgcacttgaa tacccagagg ccggtgctgg 1500

gagggcatac tctggtttcg tatttgtaag ctcagcagcc agacaccacc agacacatcg 1560

tgggccctgg acaggtgtgc ttctcaagtg aatgaataca tgaacagtgt tttctatgaa 1620

gcatttgtga aattatctgc atcattccat ctatattttc tagccactcg gaacacaacg 1680

aaacaagtga cacctcaacc tgaagaacag aaagaaagga aaaccacaga aatgcaaagt 1740

ccaatgcagc cagtggacca agcgagcctt ccaggtgaga gatgaatctg tcctccagct 1800

aactcctgct agcgcaccct tctcctgcag gcagatgatg tgtacccaaa ggaagaaggt 1860

ctgccctgcc ttctataaac acatgcatgt ggctccgtcc tcccaagaca tcattgcaga 1920

caagaattag tgcagagttg ctcagaggct gtttgctcag caactaaagc caatctgacg 1980

gcagccaatc caggtctggg cttactccct ggtttggtaa ctggccaaat agaattcaac 2040

ccaaattcaa ctcaacttaa aagcgtctgt tgggtctgtg tgccaggccc tgctgataga 2100

agacacaaac aagagtgtga caacgatccc tgccctcaag gaaacgctct gcgtcttccc 2160

cttaagcaca agacaacgca ccgcaaaaaa attacttgct tcccagtatt tcttccaggg 2220

caaggttgta aaatgtgcat gccacacttg tgagtctcaa aagctccaga tgcgtgtgtc 2280

ctggccagca gtctgtgcat gagtgggcac tgtggctgtc ccttgtctgc cctctgcttt 2340

cccacgactg aattgggatt cagttatggt gtcaagaaaa tgggctgggc gcagtggctc 2400

acgcctgtaa tcccagcact gtgggagtct gaggcaggca gatcacttga ggtcaggagt 2460

tcgagaccag cctggccaac atggtgaaac cttgtctcta caatcataca aaaattaagc 2520

tgggcatggt ggtggatgcc tgtagtccca gctactcagg aggccaaggc atgagaattg 2580

cttgaaatca ggaggtggag gttgcagtga gcagagattg catcactgca ctccagcctg 2640

agtgacagag gaagactctg tcccccctca aaaaaacaaa acaaaaaaga aaaaaaaccc 2700

acagaacctg ctaggaagaa ttgagctttc taaggtcagg ctagccttag gagacttcag 2760

agccctttgc tgattttaca accttacaaa gaactgtatc agataccatc ccatttgagc 2820

ctggctatac aatgagtcag gaccaggaag ggttacttca acttactgaa gaaactgaga 2880

tgcacaaaag ataaaaagat ttggttaagc tcacatagta gggctggaat cagacctcag 2940

gtctcccaga ttagatgagg aaactttctg ctgattactt attttaaaag agtttgaatt 3000

tacttacagc ttccattatt ttatttttta aaacagacta atctaggggc acagttgcaa 3060

catgatgctc ttactccttc cccttccgac tttgtcctgg aatggtgttt ccaagcacat 3120

ttgtttgttt tgttctactt cccccatatc accctgcaca gttattggaa ggcttcaaag 3180

aggccaatgc ttgttgtcct ttctcgaagg ctggctctgc ctgagggatg tttcaaagat 3240

tgtctcagtt tgggtgtttt cattggaaag aagcaaaccc aattcaaaca tgttcagaca 3300

gttacgaatt gtactggctg tcaaacaacc ttttatcctg agaccaaaac acaagttcag 3360

tcgtgatgtt caaggtgcca catggcagga gccagcctgg gacagggcca cccagcttcc 3420

tgctggggaa gaggctctgg aggatattta cagaggctct gttgggtatg cagggttggg 3480

gagagtctgg aagttcagag cacgtgcgca gtttcacagg ctggggttag agggcacata 3540

caattccata tgtccaggtt gggggctgtg ggtggggaat tcagagattt aatcagaaca 3600

agacatggtc tcaggccaca ggtccgtcag gcctgggatg tagttgggtg agtggaaagt 3660

tctggggatg ggaaattttg agacgtcttg aaagggcgca tgtgtgtcaa ccttcaggtg 3720

tggcttgatc agagatggtg ctccatttct ctgaggttcc ctcagcccgt ccctcctcct 3780

ggctttggtg ttgtccccaa tccttccgac atcatcccaa gatgcccagc cgctgccccc 3840

aagaatgcac ttcctcactt gtccagcaga aatccaaggt ggtcttcatg ctccattggc 3900

ccaaataggc ttgagcctac ccttgtgtct cagctgagac tgccccgccc actcctgtcc 3960

actgtcaaca cctgcactgt cttccaagag gcagttgtgg cgttcctgtc tcggggccgc 4020

accaaccaga atgaatcgct cattcctctg tgttcccatt gccaacgtct gctatccttc 4080

acatgccttt cttacccaat ccactgtcca ccccttgcag gagtgacagg gtcttcgtgc 4140

cttcctacag ggcctagcaa acttccccac gctcagacgt tctcaacata tattggttga 4200

atgaaaggat gagcaagcag tcaagagagt aagaaccaag gtccagtccc tagcaagagg 4260

caacctggac tcactcgcgg tgctgtcccc aacttgcctt cagagcattc cttccatctt 4320

ccaggtcact gcagggaacc tccaccatgg gaaaatgaag ccacagagag aatttatcat 4380

ttcgtggtgg ggcagatggt ttattatcag tgcgtccagg gatacagggc tctacacaga 4440

ggtcctgctg agagcgtctg caaaatgacc cacgggaaga caaggtggac ccagccccag 4500

ctcatatgca caggtgaaat ggagaccagt cagtttccag gtagggtggc tcccttctgg 4560

ggtccacaat gttgctttgc tccatcaggc tgaccagagt ggaatccctg accactcctg 4620

ctggacaaga gtggtccttg gacaagaccc ttgatctccc tgggcttcca ttttttctca 4680

ttctgagaaa aaaaaaaaaa tttaaataga ccagatcaga tggactctaa gggctccttc 4740

aatgaaggtc cccctgtgcc ctgagtgggg agaaaggttg gagacagaag agaaggaaag 4800

ccctctccta agcaccctag atgctgcctc gtagttggtc ctaagtccac tacttctcta 4860

agccaccaag gcctcctctg gctccaaggg caagtccagt ttcccactca cacatttttc 4920

ctcttactgg tgatcgtgta aatgcatgat ctgaacagcc ctccacggtc agcatgttcc 4980

ttccccttgt gccattcccc agctgagctt gtaaaaataa acataaaatg tgcagagtcg 5040

ggacttactc agtgcacatg cgcgcacaca cacacacaca cacacatact catgcaaatg 5100

ctcagcccac cgatgtcgag gtctcctgct gtcttccttc tgaaatctta ttagtatcac 5160

gacaatcaaa agtgacttac atgcaggctg ggcacagtgg ctcacacctg taatcccagc 5220

actctgggag gccaaggcgg gcagatcact ttaggtcagg agttcgagac cagcctggcc 5280

aacatggtga aaccccgtct ctactaaaaa tacaaaaatt atctgggcgt ggtggtgggt 5340

gcctgtaatc ccagctactt gggaggctga ggcaggagaa tcacttgaac ccaggaggtg 5400

gagttgcagt gagctgagat cacaccactg cactccagcc tgggcaacag caagactccg 5460

tctcaaaaaa aaaaagtgac ttacattcaa ccacaagtat tcctggtttt cttgctcact 5520

gcacttctca tactccatgt ccttctcttg ggttccctag ggaggctgtt ttgttccctt 5580

agctgcttcc ctgggccacc ctgacagcca gggaatgctt gctgcttcct tggaagaggg 5640

tgagaggcag ggcagagcca gggttgctga cccctcagga gaagtggaga gcctggcaca 5700

gaagcagctg tcccttagtg catctctgct ccatccagtg gttcaatggc attcgtatta 5760

ttatgacctg tttccaagtc acagatggaa accaggactg gggagggagg ctggggagaa 5820

agcattgctc agagttttgg ggacagctag ggtcagagtt agaattcagc ctcgtctgct 5880

ctgctgagac cacttcaccg cttcccagtg cccctgctgt ggaaccatga ggggtggcat 5940

ccctggcgaa gtgcccacac caggattcct gcctcctcgg gcgtgtctgg ggccggctgc 6000

ctggggcagg cggggtggga gtgaggccct gactcctgtg tttagctcca ccagcatcac 6060

ttactctctc ccccaggtga agagaagcct caggcaagcc ccgaaggccg tcctgagagt 6120

gagacttcct gcctcgtcac aacaacaggt gcgggagaag acaaacgctg gaccacagag 6180

gcctagtcca aaagggcaga ggtgaccagg agccaggctc agggagatag gcggaggtga 6240

cctgtagggg agaagcccac agcagcctcc tctccctctg agcagggaca gggcctcagc 6300

aacctgcagg ccccaaagca agtgtcagaa agagggaacc caggaccagg accaagcacg 6360

gtccccaggc agagatggaa caccttccct caccaccacc acgtgtctcc caccagcctc 6420

tgagcttctc attcacagag acaccctgac ttcctttagc ctcgtgctgt cctaaagtca 6480

cggtagcagg agtgtctctc tttatctctt tttcacagat tttcaaatac agacagaaat 6540

ggctgcaacc atggagacgt ccatatttac aaca 6574

<210> 8

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

tctccttgcc tttgcagaac tgtgtgacga tgacccgcca gagatcccac 50

<210> 9

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

catggagacg tccatattta caacagagta taaggtagca ggtgggccag 50

<210> 10

<211> 4440

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 10

aagttcctgc tgagcagatc agcctaatgc ttaaatagaa caactcctgg ctgtcattga 60

cattgtctaa aagccaagat gacagactga gaggcctgag cccttgttct ggcattctcc 120

caggaagatg cagtaaaggg gttgacccaa tatactgcag agaatttcat ccagttccct 180

cctccatcct gatcccatgt gccaggaaga tggagccacg cttgctgatg ttggggtttc 240

tctcattaac catagtaccc agttgtcggg cagaactgtg tgacgatgac ccgccagaga 300

tcccacacgc cacattcaaa gccatggcct acaaggaagg aaccatgttg aactgtgaat 360

gcaagagagg tttccgcaga ataaaaagcg ggtcactcta tatgctctgt acaggaaact 420

ctagccactc gtcctgggac aaccaatgtc aatgcacaag ctctgccact cggaacacaa 480

cgaaacaagt gacacctcaa cctgaagaac agaaagaaag gaaaaccaca gaaatgcaaa 540

gtccaatgca gccagtggac caagcgagcc ttccaggtca ctgcagggaa cctccaccat 600

gggaaaatga agccacagag agaatttatc atttcgtggt ggggcagatg gtttattatc 660

agtgcgtcca gggatacagg gctctacaca gaggtcctgc tgagagcgtc tgcaaaatga 720

cccacgggaa gacaaggtgg acccagcccc agctcatatg cacaggtgaa atggagacca 780

gtcagtttcc aggtgaagag aagcctcagg caagccccga aggccgtcct gagagtgaga 840

cttcctgcct cgtcacaaca acagattttc aaatacagac agaaatggct gcaaccatgg 900

agacgtccat atttacaaca gagtataagg tagcagtggc cagctgcctc ttcctgctca 960

tcagcatcct cctcctgagc gggctcacct ggcaacacag atggaggaag agcagaagaa 1020

ccatctagca agctagaaaa gtcagagccc aggcaagcgg atgggaatca caaagctcaa 1080

gccaaatctg agacgccaag cattcaccta acggctgttt ccttctgatc cctgggtttc 1140

tagaacattc tgaagtcaca ggacataaca gcaactctat cactaaactg gactttgcca 1200

ttgaagaata ggatctaacc acttcagcac agcagttcta aagctttaat gggagagagg 1260

gcccaacagt gctctgtgtg ttttgttttt gtgtatatct gttgatggga gctgagatgg 1320

tgtggtcact tttcatgtaa catatagtat agaaaaagta gctttaggtt gacttcattg 1380

ttacaaccca gtttggaaag cccaagtaaa actcagcact aatgtaaata attcctcctc 1440

ctcctcctct ctcttttcat cctccgctcc atcttcctct tcttcctcct ccttttccac 1500

ctcctctgtc cctacccacc cccacccatc cactttcctt cttcctttct gctctcacaa 1560

gctcatccta gctacacgtg catggctggc tcctttttca acctctgttt gcctaactgg 1620

ctcttctgat ttcatcactt actgatcagc ctttaaaact ctgagctggc aaagatgact 1680

ctatctatgt tcttggctca gtcccagaag gaaaccccct tttcatgaag cttcagtttt 1740

gacatcctga agaacagaaa ctgtggcaga acaatcttca gataacatca aaacaaagtg 1800

gagaagccac gggaactgtg gagctctggt attcagaagc ctgtgtctag ggtctgcgcc 1860

aggagcagaa ggctgaagga agtcccagga cgtggactta gatgctttcc cagcaggcca 1920

ctctaagcgc tggtttcttt gggacagctg tcaattgtac gctcaattta gcctgcacta 1980

atctgatgct tacaggtgaa cactcaaggc acaggtatgg acttggtaca taccgtgaaa 2040

acactggaaa gaaaagaata ctttcaagtt tacagaagga aggaaggaaa aaggaagcag 2100

aggtggtgat tatacaaaag attagctgta gactggatat cccaggcatc ctcggataat 2160

gcccccgccc cagcaccctg atccaggtca ccaaagcctt gtgagatcag actgcagagc 2220

cagtctgtct ctgagtcagt aaatgtagaa tttggatttc tcacaagttc ctggcggtgt 2280

cttttttttt tttaatattt tttattaggt attttcctca tttacatttc caatgctatc 2340

ccaaaagtcc cccataccct cccccacact cccctaccca cccactccca ctttttggcc 2400

ctggtgttcc cctgtactgg ggcatataaa gtttgcaagt cctggtggtg tctttatgct 2460

gatctctagc ccacactttg tgaggcactg ggctatccca gtgtgctctc ctcttccaca 2520

gataccaaaa gcacctgggt ttgatgctca gacttctgag cacgttcttg ttcaatctct 2580

tgcgtaagat ttcctctcag atgagttgag tcagattctc atgtttaaca gtgttttagg 2640

ggattcacag aagcccaaac tatcagtttt catttctgaa aaggctggaa aattttatga 2700

aaaactttca aaggtcagac agagccattt tgagtctttt atgtgaccaa gtatgaacca 2760

gatctttcct atctatggtc tcccctttcc aaaatatatc ttttgtgggg acacggcaag 2820

gaggaaagtt aaatagaatc tcaagctact aattttagaa aagaaaaaaa tattaaactc 2880

ttactaaaga gctgtgggta gtggtacaca cctgtaagcc cagctctcag gagactgagg 2940

caggaggatt gcagtgagtc agagatcagc ttcacctaca agcaaaaccc tgccttaccc 3000

ctcaaccttt ccataaaaac agtcttactt gtgtaaaatt aatttttaat acatatttgt 3060

gcacgatgtg tgtgcctggt gcccagggaa gccaaaaaaa tatgttcaat gtccctggaa 3120

taggtggtta tgagctgcca tggaggtgat gggatttaaa cccctgttct ctgaaaaagc 3180

agctagttct cttaaccact gagccatctc tacagcccca ttaaattgaa ttttattgtc 3240

attactcaat atgggagatg gggtaatgat aacaattttt tttttataat actaagatgt 3300

ttagctattt tactctcctt cacaagtgta gagtagaatt ttctagaagc tacatgcatg 3360

atattatcgc tctggtgtta acacataatg gatttatctt gttaataaaa gaattagtaa 3420

ataatatttt aaattttttc tttgttttag ttttaagatg attaatatct atagatacta 3480

gtgtacatta agaaagcctt tgggatcctc aatcattttg catggtttta gtaatttttt 3540

aataacataa agaaggtctg acagattatg ctaaagagct attgtggtat ggattagaaa 3600

tggcccccac aggctcctgt gttcaaacat cagctagcag tgctgctttg ggttttggaa 3660

cctttaagag gtggggcctt gcttaaggag ataggtcact ggaggtgaac cagacttgct 3720

tccagtctcc ctctctgctg tcccaggaag ccatcatatg aggagtttca caacatactt 3780

ctgctgccac agagtccctc cagtaaggca cgtactggcc actgtgtagt gtaccctcta 3840

aaactgagct agagctcccc tctcctccct acactatctc tgttgatgct ttgtcacggt 3900

gatgaagaac ataagtaagg caaagacaag acatagtttg gagactcacg tgagcatctc 3960

agccagactc aggcacagct gcgatgtggg aattatcaag catgagatgc aaagcaatgg 4020

aaaatgaatc gttatgacag aagcctacat ctagtcttcc cttcttccca ttagtaataa 4080

tagcccgtgt tttagaagaa cacatctttt tggtgttcta ggtagcttat attgcaaatg 4140

tggcacaatc taagagaaat ctgggatgag ggaacctcag tgaaagattc tccttgatca 4200

gattgtccca ctgatgattg atatgggaag gcccaaccca ctgtgaaagg caccacccat 4260

tggcaggatg actggggtta tagaagcaaa caggctgagc atgagccagt gagcaagcca 4320

gtaagcagtg gcttctcttt ggaagaagca tggctttctt ccgtggcttc tgtttgatct 4380

ctctcaatga tagattgtga cctagaagta taagctaaaa taaaccattt cttacccata 4440

<210> 11

<211> 272

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 11

Met Glu Pro Arg Leu Leu Met Leu Gly Phe Leu Ser Leu Thr Ile Val

1 5 10 15

Pro Ser Cys Arg Ala Glu Leu Cys Asp Asp Asp Pro Pro Glu Ile Pro

20 25 30

His Ala Thr Phe Lys Ala Met Ala Tyr Lys Glu Gly Thr Met Leu Asn

35 40 45

Cys Glu Cys Lys Arg Gly Phe Arg Arg Ile Lys Ser Gly Ser Leu Tyr

50 55 60

Met Leu Cys Thr Gly Asn Ser Ser His Ser Ser Trp Asp Asn Gln Cys

65 70 75 80

Gln Cys Thr Ser Ser Ala Thr Arg Asn Thr Thr Lys Gln Val Thr Pro

85 90 95

Gln Pro Glu Glu Gln Lys Glu Arg Lys Thr Thr Glu Met Gln Ser Pro

100 105 110

Met Gln Pro Val Asp Gln Ala Ser Leu Pro Gly His Cys Arg Glu Pro

115 120 125

Pro Pro Trp Glu Asn Glu Ala Thr Glu Arg Ile Tyr His Phe Val Val

130 135 140

Gly Gln Met Val Tyr Tyr Gln Cys Val Gln Gly Tyr Arg Ala Leu His

145 150 155 160

Arg Gly Pro Ala Glu Ser Val Cys Lys Met Thr His Gly Lys Thr Arg

165 170 175

Trp Thr Gln Pro Gln Leu Ile Cys Thr Gly Glu Met Glu Thr Ser Gln

180 185 190

Phe Pro Gly Glu Glu Lys Pro Gln Ala Ser Pro Glu Gly Arg Pro Glu

195 200 205

Ser Glu Thr Ser Cys Leu Val Thr Thr Thr Asp Phe Gln Ile Gln Thr

210 215 220

Glu Met Ala Ala Thr Met Glu Thr Ser Ile Phe Thr Thr Glu Tyr Lys

225 230 235 240

Val Ala Val Ala Ser Cys Leu Phe Leu Leu Ile Ser Ile Leu Leu Leu

245 250 255

Ser Gly Leu Thr Trp Gln His Arg Trp Arg Lys Ser Arg Arg Thr Ile

260 265 270

<210> 12

<211> 80

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

ggcagaggcc agcctggtct gcatagtgaa ttccagtata gtcgacggta tcgataagct 60

tgatatcgaa ttccgaagtt 80

<210> 13

<211> 80

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

ttcatcagtc aggtacataa tggtggatcc actagttcta gagcggccgc gccagaacga 60

catagtgaga ccttgtttca 80

<210> 14

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 14

tctggtggaa tttttggggt tcact 25

<210> 15

<211> 26

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 15

tctgtctcac tctttgctgc agttct 26

<210> 16

<211> 20

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 16

gctcgactag agcttgcgga 20

<210> 17

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 17

ctgagtgggt ctgagcaaga tgtcc 25

<210> 18

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 18

gatattccgg tgtgccattc tgcct 25

<210> 19

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 19

gtagtaggca gcgtcaactc gaagg 25

<210> 20

<211> 26

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 20

gaagagcaga agaaccatct agcaag 26

<210> 21

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 21

cattagtgct gagttttact tgggc 25

<210> 22

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 22

ggatcggcca ttgaacaaga tgg 23

<210> 23

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 23

cagaagaact cgtcaagaag gcg 23

<210> 24

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 24

actgatcccg aggaggtaga gtacg 25

<210> 25

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 25

agggtcacac ttacagttgc tggtg 25

<210> 26

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 26

ctgggctctg tctcactctt tgctg 25

<210> 27

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 27

catgggtcag ctgtagtacg ttggg 25

<210> 28

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 28

aggctaaatg ggtagggaga ctgct 25

<210> 29

<211> 25

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 29

gacaagcgtt agtaggcaca tatac 25

<210> 30

<211> 24

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 30

gctccaattt cccacaacat tagt 24

60页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!