Sting基因人源化非人动物的构建方法及应用

文档序号:431182 发布日期:2021-12-24 浏览:34次 >En<

阅读说明:本技术 Sting基因人源化非人动物的构建方法及应用 (Construction method and application of humanized non-human animal of STING gene ) 是由 沈月雷 张美玲 黄蕤 白阳 郭朝设 周小飞 于 2021-09-02 设计创作,主要内容包括:本发明提供了一种人源化STING蛋白、一种人源化STING基因、一种STING基因的靶向载体、一种STING基因人源化的非人动物及其构建方法和其在生物医药领域的应用,利用同源重组的方式将编码人STING蛋白的核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化STING蛋白,可以作为人STING信号机理研究、肿瘤及自身免疫性疾病药物筛选的动物模型,对免疫靶点的新药研发具有重要的应用价值。(The invention provides a humanized STING protein, a humanized STING gene, a targeting vector of the STING gene, a humanized non-human animal of the STING gene, a construction method and application thereof in the field of biomedicine.)

STING基因人源化非人动物的构建方法及应用

技术领域

本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种STING基因改造的非人动物模型、其构建方法及其在生物医药领域的应用。

背景技术

干扰素基因刺激蛋白STING(stimulator of interferon genes)也称为MITA,MPYS,ERIS和TMEM173,是一种四次跨膜蛋白,主要分布在免疫相关的组织细胞中,在胸腺、脾及外周血细胞中高表达,该蛋白主要定位于内质网(ER)和线粒体上,是固有免疫体系(innate immune system)的主要组成成分。细胞质内的DNA(无论DNA是来自于病毒、细菌或者生物体自身)可与cyclic GMP-AMP synthase(cGAS)的酶结合后形成cGAMP(一种环状二核苷酸,cyclic dinucleotide,简称CDN),二聚化的STING与之结合后发生构象改变,激活下游的转录因子TBK1(STAT-6,NF-kb),募集和磷酸化转录因子IRF3,导致干扰素(interferon,IFN)(主要是I型IFN)和其它多种细胞因子(包括TNFα、IL6等)来杀伤肿瘤细胞和病毒,这就构成了cGAS-cGAMP-STING信号通路,进一步的研究发现小分子化合物也可以结合STING激活或抑制该信号通路。在认识到STING信号通路后,人们设计了一些类似结构的小分子,希望能活化STING信号通路来抗肿瘤和病毒,同时为T细胞的活化和增殖提供基础;或者抑制STING信号通路来治疗自身免疫性疾病。

实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。但由于动物与人类的生理结构和代谢系统本身的差异,传统的动物模型并不能很好的反映人体的真实状况,在动物体内建立更接近人类的生理特征的疾病模型是生物医药行业的迫切需求。人源和鼠源STING蛋白的相似度(Positives)高达81%,但由于种属差异,已经确认靶向STING的化合物DMXAA(vadimezan)只结合鼠源STING,无法激活人源STING蛋白,因此尽管DMXAA临床前研究在小鼠抗肿瘤模型中药效极好,但在进入III期临床时失败。近几年国际制药公司如BMS、诺华等都在加紧寻找能够活化STING的药物,预计将来会有越来越多的国内外制药企业参与到靶向STING蛋白的药物研发。开发更多可模拟人类进行药物研发的动物模型将有助于降低研发失败的风险,然而,由于动物与人类在生理学及病理学方面存在差异,加上基因(即遗传因子)的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战。

发明内容

鉴于STING基因在肿瘤和免疫治疗领域具有巨大应用价值,为了进一步的研究STING相关的生物学特性,提高临床前期的药效试验的有效性,提高研发成功率,本发明提供一种建立STING基因人源化改造动物模型的新方法,并得到STING基因人源化动物。具体来说,本发明的目的是制备一种非人动物模型,该动物体内可正常表达STING蛋白,且表达的STING蛋白能被识别并结合靶向人STING的调节剂,该方法在药物筛选、有效性验证等方面有着广阔的应用前景。此外,本方法得到的非人动物还可与其它免疫检查点人源化非人动物,如B-hPD-1小鼠交配得到STING和PD-1双基因人源化动物模型,用于筛选和评估针对该信号通路的人用药及联合用药的药效研究。具体如下:

本发明的第一方面,提供了一种人源化STING蛋白,所述的人源化STING蛋白包含人STING蛋白的部分。

优选的,所述的非人动物的内源STING蛋白表达降低或缺失。

优选的,所述的人源化STING蛋白包含人STING基因的3号至8号外显子编码的氨基酸序列的全部或部分。优选的,包含人STING基因的5号至8号外显子编码的氨基酸序列的全部或部分。

优选的,所述的人源化STING蛋白还包含非人动物STING基因的1号至4号外显子的全部或部分编码的氨基酸序列。进一步优选还包含非人动物STING基因的5号外显子的部分编码的氨基酸序列。

在本发明的一个

具体实施方式

中,所述的人源化STING蛋白的氨基酸序列包含下列组中的一种:

A)SEQ ID NO:2第146-341位或第138-379位氨基酸序列的全部或部分;

B)与SEQ ID NO:2第146-341位或第138-379位氨基酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

C)与SEQ ID NO:2第146-341位或第138-379位所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或

D)与SEQ ID NO:2第146-341位或第138-379位所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

在本发明的一个具体实施方式中,所述的人源化STING蛋白包含与SEQ ID NO:1第1-144、341-378位或第1-136位具有至少60%、65%、70%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者与SEQ ID NO:1第1-144、341-378位或第1-136位所示氨基酸序列一致。

在本发明的一个具体实施方式中,所述的人源化STING蛋白的氨基酸序列包含下列组中的一种:

a)SEQ ID NO:7或者49所示氨基酸序列的全部或部分;

b)与SEQ ID NO:7或者49所示氨基酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

c)与SEQ ID NO:7或者49所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,

d)与SEQ ID NO:7或者49所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

本发明的第二方面,提供了一种人源化STING基因,所述的人源化STING基因包含人STING基因的部分。

优选的,所述的人源化STING基因编码上述的人源化STING蛋白。

优选的,所述的人源化STING基因包含人STING基因的3号至8号外显子的全部或部分。进一步优选的,包含人STING基因的3号至8号外显子中的一种或两种以上外显子的组合,更优选的,其中,3号外显子的部分包含从3号外显子的起始密码子至3号外显子的最后一个核苷酸,8号外显子的部分包含从8号外显子的第一个核苷酸至终止密码子。

在本发明的一个具体实施方式中,包含人STING基因的3号外显子、4号外显子、5号外显子、6号外显子、7号外显子和8号外显子。

优选的包含人STING基因的5号至8号外显子的全部或部分,进一步优选包含5号外显子的全部或者部分、6号至7号外显子的全部和8号外显子的全部或者部分,更优选还包含5-6、6-7号内含子和/或7-8号内含子,5号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、81、82、83、84、85、90、100、105、106、107、108、109bp的核苷酸序列,进一步优选的,包含85或109bp的核苷酸序列,8号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、70、75、76、77、78、79、80、100、150、170、190、191、192、193、194、195、200、500、700、900、922bp的核苷酸序列,进一步优选的,包含77或194bp的核苷酸序列。

在本发明的一个具体实施方式中,包含人STING基因的CDS序列的全部或部分或人STING的全长核苷酸序列的全部或部分。

优选的,所述的人源化STING基因包含编码人STING蛋白的全部或部分核苷酸序列。进一步优选的,包含SEQ ID NO:2第146-341位或第138-379位所示氨基酸的核苷酸序列,进一步优选包含编码SEQ ID NO:7第145-340位或者SEQ ID NO:49第138-378位所示氨基酸的核苷酸序列。

优选的,所述的人源化STING基因还包含非人动物STING基因的部分。进一步优选包含非人动物STING基因1号至4号外显子的全部和8号外显子的部分。更进一步优选还包含非人动物STING基因5号外显子的部分。

在本发明的一个具体实施方式中,所述的人源化STING基因包含下列组中的一种:

A)SEQ ID NO:5或SEQ ID NO:47所示核苷酸序列的全部或部分;

B)与SEQ ID NO:5或SEQ ID NO:47所示核苷酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

C)与SEQ ID NO:5或SEQ ID NO:47所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,

D)与SEQ ID NO:5或SEQ ID NO:47所示的,包括取代、缺失和/或插入一个或多个核苷酸残基的核苷酸序列。

优选的,所述的人源化STING基因还包含转录终止序列,优选为3’UTR、polyA、WPRE或lox2中的一种或两种以上的组合。

优选的,所述的人源化STING基因还包含Neo盒。

优选的,所述的人源化STING基因还包括内源调控序列。

在本发明的一个具体实施方式中,所述的人源化STING基因转录的mRNA包含下列组中的一种:

(i)包含SEQ ID NO:6或48所示核苷酸序列的全部或部分;

(ii)包含与SEQ ID NO:6或48所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

(iii)包含与SEQ ID NO:6或48所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,

(iv)包含与SEQ ID NO:6或48所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

本发明第三方面,提供了一种靶向载体,所述的靶向载体包含人STING基因的部分。

优选的,所述的靶向载体包含人STING基因的3号至8号外显子的全部或部分。进一步优选包含人STING基因的3号至8号外显子中的一种或两种以上外显子的组合,更优选的,其中,3号外显子的部分包含从3号外显子的起始密码子至3号外显子的最后一个核苷酸,8号外显子的部分包含从8号外显子的第一个核苷酸至终止密码子。

在本发明的一个具体实施方式中,包含人STING基因的3号外显子、4号外显子、5号外显子、6号外显子、7号外显子和8号外显子。

优选包含人STING基因的5号至8号外显子的全部或部分,进一步优选包含5号外显子的全部或者部分、6号至7号外显子的全部和8号外显子的全部或者部分,更优选还包含5-6、6-7号内含子和/或7-8号内含子,5号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、81、82、83、84、85、90、100、105、106、107、108、109bp的核苷酸序列,进一步优选的,包含85或109bp的核苷酸序列,8号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、70、75、76、77、78、79、80、100、150、170、190、191、192、193、194、195、200、500、700、900、922bp的核苷酸序列,进一步优选的,包含77或194bp的核苷酸序列。

在本发明的一个具体实施方式中,包含人STING基因的CDS序列的全部或部分或人STING的全长核苷酸序列的全部或部分。

在本发明的一个具体实施方式中,包含编码SEQ ID NO:7第145-340位或者SEQ IDNO:49第138-378位所示氨基酸的核苷酸序列。

在本发明的一个具体实施方式中,包含编码SEQ ID NO:2第146-341位或第138-379位所示氨基酸的核苷酸序列。

在本发明的一个具体实施方式中,包含SEQ ID NO:5或47。

优选的,所述的靶向载体还包含5’臂和/或3’臂。所述5’臂选自非人动物STING基因基因组DNA的100-10000个长度的核苷酸。优选的,所述的5’臂与NCBI登录号为NC_000075.6至少具有90%同源性的核苷酸。进一步优选的,所述5’臂序列与SEQ ID NO:3或45至少具有90%同源性。所述3’臂选自非人动物STING基因基因组DNA的100-10000个长度的核苷酸。优选的,所述的3’臂与NCBI登录号为NC_000084.6至少具有90%同源性的核苷酸。进一步优选的,所述3’臂序列与SEQ ID NO:4或46至少具有90%同源性。

优选的,所述的靶向载体还包含标记基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。

在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。

在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为具有两个Frt重组位点,分别连接在抗性基因的两侧。

优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。

优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。

优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。

本发明的第四方面,提供了一种sgRNA,所述的sgRNA靶向非人动物STING基因,同时所述sgRNA的序列在待改变的STING基因上的靶序列上。

优选的,所述sgRNA的靶位点位于STING基因的3号外显子至8号外显子序列上。进一步优选的,所述sgRNA的靶位点位于STING基因的3号外显子、3号外显子至8号外显子之间的任一内含子和/或8号外显子序列上。

在本发明的一个具体实施方式中,所述sgRNA的靶位点位于STING基因的5号外显子和8号外显子上。

优选的,所述的sgRNA的靶位点序列如SEQ ID NO:8-23,69-82任一项所示,优选的,所述sgRNA序列靶向的5’端靶位点序列如SEQ ID NO:8-15或者69-75任一项所示,3’端靶位点序列如SEQ ID NO:16-23或者76-82任一项所示。

本发明的第五方面,提供了一种编码上述sgRNA的DNA分子。优选的,所述的DNA分子双链分别为上述sgRNA的上下游序列,或者加入酶切位点后的正反向寡核苷酸序列。

在本发明的一个具体实施方式中,所述的DNA分子为SEQ ID NO:32。

本发明的第六方面,提供了一种sgRNA载体,所述的sgRNA载体包含上述sgRNA。

本发明的第七方面,提供了一种包含上述靶向载体、上述sgRNA、上述DNA分子或上述sgRNA载体的细胞。

本发明的第八方面,提供了一种上述靶向载体、上述sgRNA、上述DNA分子、上述sgRNA载体或上述的细胞在STING基因修饰中的应用。优选包含在敲除、插入或替换STING基因中的应用。

本发明的第九方面,提供了一种STING基因人源化的非人动物,所述的非人动物表达人或人源化STING蛋白。

优选的,所述的非人动物包含人或人源化STING基因,所述人或人源化STING基因包含人STING基因的3号至8号外显子的全部或部分。进一步优选的,包含人STING基因的3号至8号外显子中的一种或两种以上外显子的组合,更优选的,其中,3号外显子的部分包含从3号外显子的起始密码子至3号外显子的最后一个核苷酸,8号外显子的部分包含从8号外显子的第一个核苷酸至终止密码子。

在本发明的一个具体实施方式中,包含人STING基因的3号外显子、4号外显子、5号外显子、6号外显子、7号外显子和8号外显子。

优选的,包含人STING基因的5号外显子至8号外显子的部分或全部,更优选的,包含人STING基因的5号外显子的全部或部分、6号至7号外显子的全部和8号外显子的全部或部分。

优选的,所述的动物模型的基因组中包括人STING基因的5号外显子的部分、5-6号内含子、6号外显子至7号外显子的全部、7-8号内含子和8号外显子的部分,5号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、81、82、83、84、85、90、100、105、106、107、108、109bp的核苷酸序列,进一步优选的,包含85或109bp的核苷酸序列,8号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、70、75、76、77、78、79、80、100、150、170、190、191、192、193、194、195、200、500、700、900、922bp的核苷酸序列,进一步优选的,包含77或194bp的核苷酸序列。

优选的,所述的5号外显子的部分包含去除编码N端第1-10个(例如1、2、3、4、5、6、7、8、9、10个)氨基酸的5号外显子的核苷酸序列,所述的8号外显子的部分包含去除编码C端第1-60个(例如1、5、10、15、20、25、30、35、38、39、40、45、50、55、60个等)氨基酸的8号外显子的核苷酸序列。

优选的,所述的5号外显子的部分包含从起始密码子开始至5号外显子最后一个核苷酸,所述的8号外显子的部分包含从8号外显子第一个核苷酸开始至终止密码子。

进一步优选的,所述的非人动物的人STING基因来自5号外显子至8号外显子的部分,并至少包含编码SEQ ID NO:7第145-340位或SEQ ID NO:49第138-378位所示氨基酸的核苷酸序列,或者,至少包含编码SEQ ID NO:2第146-341位或第138-379位所示氨基酸的核苷酸序列。

在本发明的一个具体实施方式中,包含人STING基因的CDS序列的全部或部分或人STING的全长核苷酸序列的全部或部分。

优选的,所述的非人动物包含编码人STING蛋白的全部或部分核苷酸序列。进一步优选包含编码SEQ ID NO:7第145-340位或者SEQ ID NO:49第138-378位所示氨基酸的核苷酸序列。更优选的,所述的非人动物中编码的人STING蛋白如SEQ ID NO:7第145-340位或者SEQ ID NO:49第138-378位所示氨基酸所示。

在本发明的一个具体实施方式中,所述的人源化STING基因包含下列组中的一种:

A)SEQ ID NO:5或SEQ ID NO:47所示核苷酸序列的全部或部分;

B)与SEQ ID NO:5或SEQ ID NO:47所示核苷酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

C)与SEQ ID NO:5或SEQ ID NO:47所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,

D)与SEQ ID NO:5或SEQ ID NO:47所示的,包括取代、缺失和/或插入一个或多个核苷酸残基的核苷酸序列。

优选的,所述的人源化STING基因还包含转录终止序列。进一步优选为3’UTR、polyA、WPRE或lox2中的一种或两种以上的组合。

优选的于,所述的人源化STING基因还包含Neo盒,进一步优选的,所述Neo盒5’端与小鼠基因座的连接设计序列为SEQ ID NO:50所示,所述Neo盒3’端与小鼠基因座的连接设计序列为SEQ ID NO:51所示。

优选的,所述的人源化STING基因还包括内源调控序列。

在本发明的一个具体实施方式中,所述的人源化STING基因转录的mRNA包含下列组中的一种:

(i)包含SEQ ID NO:6或者48所示核苷酸序列的全部或部分;

(ii)包含与SEQ ID NO:6或者48所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

(iii)包含与SEQ ID NO:6或者48所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或,

(iv)包含与SEQ ID NO:6或者48所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。

优选的,所述的非人动物的内源STING蛋白表达降低或缺失。

优选的,所述的人源化STING蛋白包含人STING蛋白的全部或部分。进一步优选包含人STING基因的5号至8号外显子编码的氨基酸序列的全部或部分。更优选的,所述的人源化STING蛋白还至少包含SEQ ID NO:7第145-340位或SEQ ID NO:49第138-378位所示氨基酸。

在本发明的一个具体实施方式中,所述的人源化STING蛋白的氨基酸序列包含下列组中的一种:

a)SEQ ID NO:7或者SEQ ID NO:49所示氨基酸序列的全部或部分;

b)与SEQ ID NO:7或者SEQ ID NO:49所示氨基酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;

c)与SEQ ID NO:7或者SEQ ID NO:49所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或,

d)与SEQ ID NO:7或者SEQ ID NO:49所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。

优选的,所述的非人动物基因组中还包含其他基因修饰,进一步优选的,所述的其他基因包含PD-1、PD-L1、CTLA-4、LAG-3、BTLA、CD27、CD28、CD47、CD137、CD154、OX40、SIRPα、TIGIT、TIM-3、CD40或GITR基因中的一种或两种以上的组合。

优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。

优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。

优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。

本发明的第十方面,提供了一种上述非人动物的构建方法,所述的非人动物表达人或人源化STING蛋白。

优选的,所述的人源化STING蛋白为上述的人源化STING蛋白。

优选的,所述的非人动物的基因组中还包含人或人源化STING基因,所述的人源化STING基因为上述的人源化STING基因。

优选的,所述的构建方法包括用包含人或人源化STING基因的核苷酸序列导入非人动物STING基因座。进一步优选用包含人STING基因的3号至8号外显子的全部或部分导入非人动物STING基因座,进一步优选的,用包含人STING基因的3号至8号外显子中的一种或两种以上外显子的组合导入非人动物STING基因座,其中,3号外显子的部分包含从3号外显子的起始密码子至3号外显子的最后一个核苷酸,8号外显子的部分包含从8号外显子的第一个核苷酸至终止密码子。

在本发明的一个具体实施方式中,用包含人STING基因的3号外显子、4号外显子、5号外显子、6号外显子、7号外显子和8号外显子导入非人动物STING基因座。

优选用包含人STING基因的5号至8号外显子的全部或部分导入非人动物STING基因座,进一步优选用包含5号外显子的全部或者部分、6号至7号外显子的全部和8号外显子的全部或者部分,优选还包含5-6、6-7号内含子和/或7-8号内含子,导入非人动物STING基因座,其中,5号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、81、82、83、84、85、90、100、105、106、107、108、109bp的核苷酸序列,进一步优选的,包含85或109bp的核苷酸序列,8号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、70、75、76、77、78、79、80、100、150、170、190、191、192、193、194、195、200、500、700、900、922bp的核苷酸序列,进一步优选的,包含77或194bp的核苷酸序列。

在本发明的一个具体实施方式中,所述的构建方法包括用包含人STING基因的CDS序列的全部或部分或人STING的全长核苷酸序列的全部或部分导入非人动物STING基因座。

优选的,所述的构建方法包括用包含人STING基因的cDNA序列导入非人动物STING基因座。

在本发明的一个具体实施方式中,所述的构建方法包括用包含SEQ ID NO:5或47的核苷酸序列导入非人动物STING基因座。

优选的,所述的构建方法包括用包含编码人STING蛋白的全部或部分核苷酸序列导入非人动物STING基因座。进一步优选用包含编码SEQ ID NO:7第145-340位或者SEQ IDNO:49第138-378位所示氨基酸的核苷酸序列导入非人动物STING基因座,更优选的,所述的非人动物的人STING基因来自5号外显子至8号外显子的部分,并至少包含编码SEQ ID NO:7第145-340位所示氨基酸的核苷酸序列,最为优选的,所述的非人动物中编码的人STING蛋白如SEQ ID NO:7第145-340位或者SEQ ID NO:49第138-378位所示氨基酸所示。

优选的,人或人源化STING基因的核苷酸序列可操作的连接至非人动物内源调控元件。

优选的,本申请中所述的导入包括但不限于插入、替换或转基因,所述的替换优选为原位替换。

优选的,所述的插入或替换的位置位于STING基因的内源调控元件之后。

优选的,插入或替换的位置位于非人动物STING基因的3号至8号外显子上。进一步优选位于STING基因的起始密码子至终止密码子上。

优选的,插入或替换的位置位于非人动物STING基因的5号至8号外显子上。进一步优选位于5号外显子上。

优选的,所述的非人动物是纯合或者杂合的。

优选的,所述人或人源化STING基因或编码人STING蛋白的核苷酸序列通过内源调控元件调控。

优选的,所述非人动物的基因组中至少一个染色体上包含人源化STING基因。

优选的,所述的非人动物中至少一个细胞表达人或人源化STING蛋白。

优选的,使用基因编辑技术进行非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、规律成簇间隔短回文重复(CRISPR/Cas9)技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。

优选的,使用上述的靶向载体进行非人动物的构建。

在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体导入非人动物细胞中,培养该细胞(优选为胚胎干细胞),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得STING基因人源化的非人动物。

优选的,为提高重组效率,还可以使用靶向STING基因的sgRNA与上述靶向载体一起进行非人动物的构建。其中,所述的sgRNA靶向非人动物STING基因,同时所述sgRNA的序列在待改变的STING基因上的靶序列上。

优选的,所述sgRNA的靶位点位于STING基因的3号外显子至8号外显子序列上。进一步优选的,所述sgRNA的靶位点位于STING基因的5号外显子、4-5号内含子和/或8号外显子序列上。

在本发明的一个具体实施方式中,所述sgRNA的靶位点位于STING基因的5号外显子和8号外显子上。

优选的,所述的sgRNA的靶位点序列如SEQ ID NO:8-23,69-82任一项所示,优选的,所述sgRNA序列靶向的5’端靶位点序列如SEQ ID NO:8-15或者69-75任一项所示,3’端靶位点序列如SEQ ID NO:16-23或者76-82任一项所示。

优选的,上述替换为原位替换。

在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体、靶向STING基因的sgRNA及Cas9导入非人动物细胞中,培养该细胞(优选为胚胎干细胞),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得STING基因人源化的非人动物。

本发明的第十一方面,提供了一种多基因修饰的非人动物,所述的非人动物为上述的非人动物或上述的构建方法获得的非人动物,且所述的非人动物基因组中包含基因PD-1、PD-L1、CTLA-4、LAG-3、BTLA、CD27、CD28、CD47、CD137、CD154、OX40、SIRPα、TIGIT、TIM-3、CD40或GITR中的一种或两种以上的组合的修饰。

本发明的第十二方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:

(一)提供上述的非人动物或上述的构建方法获得的非人动物;

(二)将步骤(一)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。

优选的,所述的其他基因修饰的非人动物包括基因PD-1、PD-L1、CTLA-4、LAG-3、BTLA、CD27、CD28、CD47、CD137、CD154、OX40、SIRPα、TIGIT、TIM-3、CD40或GITR中的一种或两种以上的组合人源化的非人动物。

优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。

本发明的第十三方面,提供了一种上述构建方法获得的非人动物或其子代。

本发明的第十四方面,提供了一种动物的荷瘤或炎症模型,所述的荷瘤或炎症模型来源于上述的非人动物或上述的构建方法获得的非人动物。

本发明的第十五方面,提供了一种动物的荷瘤或炎症模型的构建方法,所述的构建方法包括采用上述构建方法获得STING基因人源化的非人动物或多基因修饰的非人动物的步骤。

本发明的第十六方面,提供了一种上述的非人动物或上述的构建方法获得的非人动物在制备荷瘤或炎症动物模型中的应用。

本发明的第十七方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的非人动物或上述的构建方法获得的非人动物,或上述的荷瘤或炎症模型。优选的,所述的细胞或细胞系或原代细胞培养物不能发育为动物个体。

本发明的第十八方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的非人动物或上述的构建方法获得的非人动物,或上述的荷瘤或炎症模型。优选的,所述的组织或器官或其培养物不能发育为动物个体。

本发明的第十九方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的非人动物或上述的构建方法获得的非人动物,或上述的荷瘤或炎症模型。优选的,所述的荷瘤后的瘤组织不能发育为动物个体。

本发明的第二十方面,提供了一种STING基因人源化的细胞,所述的细胞包含人或人源化STING基因。优选包含上述的人源化STING基因。

优选的,所述的细胞表达人或人源化STING蛋白。进一步优选为本发明上述的人源化STING蛋白。优选的,所述的细胞不能发育为动物个体。

本发明的第二十一方面,提供了一种STING基因缺失的细胞,所述的细胞缺失STING基因的1号至8号外显子的全部或部分。优选的,缺失3-8号外显子的全部或部分,更优选的缺失5-8号外显子的全部或部分。

在本发明的一个具体实施方式中,缺失编码SEQ ID NO:2第145-340位或者SEQ IDNO:2第137-378位所示氨基酸的核苷酸序列。

在本发明的另一个具体实施方式中,缺失STING基因的从起始密码子开始至终止密码子为止的核苷酸序列。优选的,所述的细胞不能发育为动物个体。

本发明的第二十二方面,提供了一种STING基因缺失的非人动物,所述的非人动物缺失STING基因的1号至8号外显子的全部或部分。优选的,缺失3-8号外显子的全部或部分,更优选的缺失5-8号外显子的全部或部分。

在本发明的一个具体实施方式中,缺失编码SEQ ID NO:2第145-340位或者SEQ IDNO:2第137-378位所示氨基酸的核苷酸序列。

本发明的第二十三方面,提供一种STING基因缺失的非人动物或者细胞的构建方法,所述的构建方法采用上述sgRNA对基因进行缺失。

本发明的第二十四方面,提供了一种包含上述的人源化STING基因的构建体。

优选的,所述的构建体表达人或人源化STING蛋白,所述的人源化STING蛋白如上述的人源化STING蛋白。

本发明的第二十五方面,提供了一种包含上述构建体的细胞。优选的,所述的细胞不能发育为动物个体。

本发明的第二十六方面,提供了一种包含上述细胞的组织。优选的,所述的组织不能发育为动物个体。

本发明的第二十七方面,提供了来源于上述的非人动物、上述的构建方法获得的非人动物、上述的人源化STING基因、上述的人源化STING蛋白、上述的荷瘤或炎症模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞或上述的组织的应用,所述的应用包括:在涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;或者在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;或者在筛选、验证、评价或研究STING通路功能、人STING通路信号机理、靶向人的抗体、靶向人的药物、药效,免疫相关疾病药物以及抗肿瘤药物,筛选和评估人用药及药效研究方面的应用。

优选的,所述应用不是疾病的治疗和/或诊断方法。

本发明的第二十八方面,提供了一种人STING特异性调节剂的筛选方法,所述的筛选方法包括向个体施加调节剂;其中,所述的个体选自上述的非人动物、上述的构建方法获得的非人动物或者上述的荷瘤或炎症模型,并对调节剂的进行评估、筛选。

优选的,所述的筛选方法还包括向个体植入肿瘤细胞。

优选的,所述的调节剂选自CAR-T、药物;优选的,所述的药物为抗体。

优选的,所述的筛选方法还包括检测肿瘤抑制性。

优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。

优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率。

优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。

优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。

优选的,所述的肿瘤细胞来源于人或非人动物。

优选的,所述的筛选方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。

本发明的第二十九方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体植入肿瘤细胞,向植入肿瘤细胞的个体施加干预方案,对施加干预方案后的个体进行肿瘤抑制效果检测和评价;其中,所述的个体选自上述的非人动物,上述的构建方法获得的非人动物,上述的非人动物或其子代,或者上述的荷瘤或炎症模型。

优选的,所述的干预方案选自CAR-T、药物治疗。进一步优选的,所述的药物为抗原结合蛋白。所述的抗体结合蛋白为抗体。

优选的,所述的肿瘤细胞来源于人或非人动物。

优选的,所述干预方案的评价方法不是治疗方法。该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。

本发明所述的STING基因人源化的非人动物,其体内可正常表达人或人源化STING蛋白,可用于针对人STING通路靶位点的药物筛选、药效评估、自身免疫疾病和肿瘤治疗,可以加快新药研发过程、节约时间和成本。

本发明所述的“免疫相关疾病”包括但不限于过敏、哮喘、皮炎、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。

本发明所述的“肿瘤”包括但不限于淋巴瘤、脑癌、非小细胞肺癌、宫颈癌、食道癌、白血病、卵巢癌、鼻咽癌、乳癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。

本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。

本发明所述的“人源化STING蛋白”,包含来源于人STING蛋白的部分和非人STING蛋白的部分。其中,所述的“人源化STING蛋白”包含连续或间隔的5-379个氨基酸序列与人STING蛋白的氨基酸序列一致。

本发明所述的“人源化STING基因”,包含来源于人STING基因的部分和非人STING基因的部分。其中,所述的“人源化STING基因”包含连续或间隔的核苷酸序列与人STING基因的核苷酸序列一致。

本发明所述的“3号至8号外显子”或“3号至8号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,即3号外显子、3-4号内含子、4号外显子、4-5号内含子、5号外显子、5-6号内含子、6号外显子、6-7号内含子、7号外显子、7-8号内含子和8号外显子。

本发明所述的“3-4号内含子”表示3号外显子与4号外显子之间的内含子。

本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“STING基因座”表示STING基因1号至8号外显子上的任选一段的DNA片段。在本发明的一个具体实施方式中,被插入或替换的STING基因座可以是STING基因5号至8号外显子上的任选一段的DNA片段。

本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。

本发明所述“治疗(treating)”(或“治疗(treat)”或“治疗(treatment)”)表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。术语“治疗(treating)”等是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。

本发明所述“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。

本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。

在一个方面,所述非人动物是哺乳动物。在一个方面,所述非人动物是小型哺乳动物,例如跳鼠科。在一个实施方式中,所述基因人源化的非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。

在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠。

除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNACloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.NO.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。

以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。

本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。

下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。

附图说明

以下,结合附图来详细说明本发明的实施例,其中:

图1:小鼠STING基因和人STING基因座对比示意图(非按比例)。

图2:小鼠STING基因人源化改造示意图(非按比例)。

图3:STING基因打靶策略及靶向载体设计示意图(非按比例)。

图4:sgRNA活性检测结果,其中Con为阴性对照,PC为阳性对照。

图5:F0代小鼠基因型鉴定结果,其中M为Marker,WT为野生型对照,H2O为水对照。

图6:F1代小鼠PCR基因型鉴定结果,其中PC为阳性对照,WT为野生型对照,H2O为水对照。

图7:Southern Blot检测结果。

图8:ELISA检测结果,其中+/+野生型C57BL/6小鼠,H/+为STING基因人源化小鼠杂合子。

图9:STING基因敲除鼠PCR检测结果,其中WT为野生型对照,H2O为水对照。

图10:实施例2中STING基因打靶策略。

图11:小鼠Southern blot结果,其中WT为野生型;

图12:FRT重组过程示意图(非按比例);

图13:F1代小鼠鼠尾PCR鉴定体细胞基因型,其中,WT为野生型,H2O为水对照,PC为阳性对照,M为Marker;

图14:打靶策略示意图(非按比例);

图15:sgRNA的相对活性检测结果,其中Con为阴性对照,PC为阳性对照;(A)为sgRNA17-sgRNA23相对活性检测结果;(B)为sgRNA24-sgRNA30相对活性检测结果。

具体实施方式

下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。

在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:

NcoI、HindIII、BbsI、EcoRI及BamHI酶购自NEB,货号分别为R0193M、R3104M、R0539L、R0101M、R0136M;

C57BL/6小鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;

Ambion体外转录试剂盒购自Ambion,货号AM1354;

Cas9mRNA来源SIGMA,货号CAS9MRNA-1EA;

UCA试剂盒来源百奥赛图公司,货号BCG-DX-001;

红细胞裂解液购自碧云天公司,货号C3702;

LEGEND MAXTMMouse TNF-αELISA Kit购自Biolegend,货号430907;

R&D Mouse IFN-beta DuoSet ELISA购自R&D公司,货号DY8234-05;

LEGEND MAXTMMouse IL-6ELISA Kit购自Biolegend,货号431307。

实施例1STING基因人源化小鼠

小鼠STING基因(NCBI Gene ID:72512,Primary source:MGI:1919762,UniProtID:Q3TBT3,位于18号染色体NC_000084.6的第35733678至35740554位,基于转录本NM_028261.1及其编码蛋白NP_082537.1(SEQ ID NO:1))和人STING基因(NCBI Gene ID:340061,Primary source:HGNC:27962,UniProt ID:Q16552,位于5号染色体NC_000005.10的第139475528至139482790位,基于转录本NM_198282.3及其编码蛋白NP_938023.1(SEQID NO:2))对比示意图如图1所示。

为了达到本发明的目的,可在内源小鼠STING基因座引入人STING基因序列,使得该小鼠表达人或人源化STING蛋白。例如,可以采取在小鼠内源STING基因座上直接插入含有人STING基因的核苷酸序列或人STING蛋白的编码序列的方法,并可在插入序列后加入辅助序列(例如终止密码子等)或其他方法(例如,翻转或敲除)使得插入位点后的小鼠内源STING序列不能正常表达;也可以采取原位替换的策略,即,在小鼠内源STING基因座上直接用人STING的基因的核苷酸序列进行替换。本实施例将以原位替换的策略来阐述如何对STING基因进行人源化改造。

具体来说,可以通过基因编辑技术在内源小鼠STING基因座上用人STING基因序列替换小鼠STING基因序列,如将小鼠STING基因的5号外显子至8号外显子的约4.1kb(4144bp)序列用对应的人DNA序列替换,得到人源化STING基因序列(示意图如图2所示),实现对小鼠STING基因的人源化改造。

CRISPR/Cas系统进行基因编辑,进一步的设计如图3所示的打靶策略示意图,图中显示了靶向载体上含有小鼠STING基因上游和下游的同源臂序列,以及包含编码人STING基因DNA序列的片段。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:3)与NCBI登录号为NC_000084.6的第35740014-35738766位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQID NO:4)与NCBI登录号为NC_000084.6的第35734621-35733137位核苷酸序列相同;人STING的DNA片段序列(SEQ ID NO:5)与NCBI登录号为NC_000005.10的第139480874-139476378位核苷酸序列相同,只是在第139483414和139483415位点处进行了突变,将上述位点核苷酸由AT突变为GG,从而使编码的氨基酸由组氨酸突变为精氨酸。改造后的人源化小鼠STING的mRNA序列及其编码的蛋白序列分别如SEQ ID NO:6和SEQ ID NO:7所示,其中,SEQ ID NO:6第771-1358位为人的序列,SEQ ID NO:7第145-340位为人的序列。

靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的重组载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的打靶载体用于后续实验。

设计并合成识别5’端靶位点(sgRNA1-sgRNA8)、3’端靶位点(sgRNA9-sgRNA16)的sgRNA序列。5’端靶位点和3’端靶位点分别位于STING基因5号外显子和8号外显子上,各sgRNA在STING基因上的靶位点序列如下:

sgRNA1靶位点序列(SEQ ID NO:8):5’-GTACCCAATGTAGTATGACCAGG-3’

sgRNA2靶位点序列(SEQ ID NO:9):5’-GCGGTTGATCTTACCAGGTAGGG-3’

sgRNA3靶位点序列(SEQ ID NO:10):5’-ATTTAACTGTATGGCAGACATGG-3’

sgRNA4靶位点序列(SEQ ID NO:11):5’-AAGAAGTTAAATGTTGCCCACGG-3’

sgRNA5靶位点序列(SEQ ID NO:12):5’-TACTTGCGGTTGATCTTACCAGG-3’

sgRNA6靶位点序列(SEQ ID NO:13):5’-TGGCCTGGTCATACTACATTGGG-3’

sgRNA7靶位点序列(SEQ ID NO:14):5’-GCTTTAGGAATTTAACTGTATGG-3’

sgRNA8靶位点序列(SEQ ID NO:15):5’-CATACTACATTGGGTACTTGCGG-3’

sgRNA9靶位点序列(SEQ ID NO:16):5’-GGTGCTCCGGCACATTCGTCAGG-3’

sgRNA10靶位点序列(SEQ ID NO:17):5’-GCTGTGTGTTAGGTGGCAAGAGG-3’

sgRNA11靶位点序列(SEQ ID NO:18):5’-ACCAAGGCACATTAGAGTCAAGG-3’

sgRNA12靶位点序列(SEQ ID NO:19):5’-CAGCAAGATGCAGGCACCCTTGG-3’

sgRNA13靶位点序列(SEQ ID NO:20):5’-CATCTCTAAAGCAGGAGGGTGGG-3’

sgRNA14靶位点序列(SEQ ID NO:21):5’-TGAGAAACTGTTTCCGTCTGTGG-3’

sgRNA15靶位点序列(SEQ ID NO:22):5’-GGTTCTGGAATAGAGATGGGGGG-3’

sgRNA16靶位点序列(SEQ ID NO:23):5’-TTTCTTCCTGACGAATGTGCCGG-3’

利用UCA试剂盒检测多个sgRNA的活性,从结果可见sgRNA具有不同活性,检测结果参见图4和表1。从中优先选择sgRNA1和sgRNA10进行后续实验。在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸(序列见表2),退火后将退火产物分别连接至pT7-sgRNA质粒(质粒先用BbsI线性化),获得表达载体pT7-STING-1和pT7-STING-10。

表1 sgRNA的活性检测结果

表2 sgRNA1和sgRNA10序列表

pT7-sgRNA载体由质粒合成公司合成含有T7启动子及sgRNA scaffold的片段DNA(SEQ ID NO:32)并依次通过酶切(EcoRI及BamHI)连接至骨架载体(来源Takara,货号3299)上,经专业测序公司测序验证,结果表明获得了目的质粒。

取C57BL/6小鼠的原核期受精卵,利用显微注射仪将预混好的pT7-STING-1和pT7-STING-10的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)和Cas9mRNA及包含人STING的DNA片段序列的靶向载体质粒注射至小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》中的方法进行胚胎的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管中发育,可生产F0代首建鼠。

可通过常规检测方法(如PCR检测等)鉴定F0代小鼠体细胞的基因型,部分F0代小鼠的基因型鉴定结果见图5。结合5’端引物检测结果和3’端引物检测结果可知,图5中编号为F0-01、F0-02的2只小鼠为阳性小鼠。PCR分析包括下述引物:

5’端引物:

L-GT-F(SEQ ID NO:33):5’-GCTTTGGCAGGAAACACCAAAAAG-3’

L-GT-R(SEQ ID NO:34):5’-GGTTGTTGTAATGCTGATTGTAAGTT-3’

3’端引物:

R-GT-F(SEQ ID NO:35):5’-CATTCTCTGGCACCCACACACTG-3’

R-GT-R(SEQ ID NO:36):5’-TCAGGGGTAGAGTGTTTGCCTAT-3’

其中,引物L-GT-F位置位于5’同源臂左侧,R-GT-R位于3’同源臂右侧,L-GT-R和R-GT-F均位于人源序列上。

将获得的F0代小鼠与野生型鼠回交可获得F1代鼠,可使用同样的PCR方法对F1代小鼠进行基因型鉴定,结果见图6,显示编号为F1-01到F1-07的7只F1代小鼠为阳性小鼠。

PCR引物序列包括:

L-GT-F(SEQ ID NO:33):5’-GCTTTGGCAGGAAACACCAAAAAG-3’

L-GT-R(SEQ ID NO:34):5’-GGTTGTTGTAATGCTGATTGTAAGTT-3’

R-GT-F(SEQ ID NO:35):5’-CATTCTCTGGCACCCACACACTG-3’

R-GT-R(SEQ ID NO:36):5’-TCAGGGGTAGAGTGTTTGCCTAT-3’

WT-F(SEQ ID NO:37):5’-GGAGACCTGGGTGTGGAGCTATG-3’

WT-R(SEQ ID NO:38):5’-CATGAAGACAGCTACAGTGTATC-3’

Mut-R(SEQ ID NO:39):5’-TTAGAAACACAAGAGGCTGTGTGT-3’

对7只F1代PCR鉴定为阳性的小鼠进行Southern blot检测,确认是否存在随机插入。剪取鼠尾提取基因组DNA,选用BglII酶或NcoI酶消化基因组,转膜,杂交。5’探针和3’探针分别位于5’同源臂外侧及3’同源臂上,具体探针及目的片段的长度见表3。Southernblot检测结果见图7,结果表明编号为F1-01到F1-07的小鼠均为阳性杂合且无随机插入。

表3具体探针及目的片段的长度

限制性内切酶 探针 野生型片段大小 重组序列片段大小
BglII 5’探针(5’Probe) 13.2kb 9.4kb
NcoI 3’探针(3’Probe) 3.1kb 4.8kb

Southern Blot检测包括如下探针引物:

5’探针(5’Probe):

F:5’-CCTCCCCTCCCGATTTCCGGGGGA-3’(SEQ ID NO:40)

R:5’-TGGCCAGCTCTTTATTCTTTTTGG-3’(SEQ ID NO:41)

3’探针(3’Probe):

F:5’-ACCATGAATGCCCCCATGACCTCAG-3’(SEQ ID NO:42)

R:5’-CTCTCAAGTTTACCAGGCATTGACAC-3’(SEQ ID NO:43)

这表明使用本方法能构建出可稳定传代且无随机插入的STING基因人源化的转基因小鼠。

可通过STING调节剂检测STING基因人源化小鼠体内STING信号通路是否正常。例如ELISA检测法。具体来说,分别选取野生型C57BL/6小鼠和本方法制备的STING基因人源化杂合子小鼠各3只,脱颈安乐死后取胫骨和股骨的骨髓细胞,裂解红细胞后用含有10ng/mLM-CSF的RPMI-1640培养液重悬细胞并培养,培养至第8天时用胰蛋白酶消化并收集F4/80+CD11b+细胞(即巨噬细胞),将分化好的巨噬细胞接种至96孔板培养1-2小时后,分别加入100μL终浓度分别为0、2.5μM、10μM、40μM和80μM的三种化合物ADU-S100类似物(人鼠交叉识别STING激动剂)、DMXAA类似物(鼠特异性STING激动剂)、(人特异性STING激动剂Z),继续培养5小时后收集上清液进行ELISA检测。检测结果如图8所示,从图中可以看出,与野生型C57BL/6小鼠(+/+)相比,随着人特异性STING激动剂Z浓度的增加,STING基因人源化小鼠杂合子(H/+)体内TNFA(图8B)、IFNB(图8D)、IL6(图8F)表达量明显增加。表明该方法制备的STING基因人源化小鼠体内的信号通路正常。

此外,由于Cas9的切割造成基因组DNA的双链断裂,通过染色体同源重组的修复方式会随机产生插入/缺失突变,可能得到STING蛋白功能丧失的基因敲除小鼠。为此设计一对引物用于检测基因敲除小鼠,野生型小鼠应没有PCR条带,基因敲除小鼠应有1条PCR条带,产物长度应为约341bp,结果见图9,其中编号KO-01到KO-06为STING基因敲除小鼠。引物分别位于5’端靶位点左侧和3’端靶位点右侧,序列如下:

WT-F(SEQ ID NO:37):5’-GGAGACCTGGGTGTGGAGCTATG-3’

WT-R1(SEQ ID NO:44):5’-TCAGGAGGCTAAAGGATCACTAG-3’。

实施例2 STING基因人源化小鼠

为制备STING基因人源化小鼠,除实施例1所述方法,本发明还设计并验证了另一种原位替换策略,具体如下:如图10所示的打靶策略示意图中,显示了靶向载体上含有小鼠STING基因的上游和下游的同源臂序列(内源STING基因5号外显子上游5574bp和TGA下游共3444bp的小鼠DNA),以及4635bp人STING序列(从5号外显子延伸至终止密码子TGA)。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:45)与NCBI登录号为NC_000084.6的第35744360-35738787位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:46)与NCBI登录号为NC_000084.6的第35733320-35729877位核苷酸序列相同;人STING的DNA片段序列(SEQ ID NO:47)与NCBI登录号为NC_000005.10的第139480895-139476261位核苷酸序列相同。改造后的人源化小鼠STING的mRNA序列及其编码的蛋白序列分别如SEQ ID NO:48和SEQID NO:49所示,其中SEQ ID NO:48第750-1475位为人序列,SEQ ID NO:49第138-378位氨基酸为人序列。

打靶载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与小鼠基因座的连接设计为5’-ACACAGGTGCCATACGTGGCCCATAGCTAAGCTTGATATCGAATTCCGAAGTTCCT-3’(SEQ ID NO:50)内,其中序列“TAGCT”的最后一个“T”是鼠的最后一个核苷酸,序列“AAGCT”的第一个“A”是Neo盒的第一个核苷酸。Neo盒3’端与小鼠基因座的接合设计为5’-AACTTCATCAGTCAGGTACATAATGGTGGATCCACTAGTTCTAGAGCGGCCGCATTAATGTGTCCA GGGAAGGGACCACTGAACAAATGCTCCCA-3’(SEQ ID NO:51)内,其中序列“TTAAT”的最后一个“T”是Neo盒的最后一个核苷酸,序列“GTGTC”的第一个“G”是鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。

靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的重组载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞,经PCR鉴定为阳性的克隆再进行Southern Blot(分别用BglII或VspI或HindIII消化细胞DNA并使用3个探针进行杂交)检测,结果见如图11所示,检测结果表明12个经PCR验证为阳性的克隆中,除1-C7外均为阳性杂合克隆且无随机插入。

其中,PCR测定包括下述引物:

F1:5’-GGTCACACAGCTAGAGAGACAGAAGTC-3’(SEQ ID NO:52),

R1:5’-CATAGCAACATCCTTCATGCCTTGGG-3’(SEQ ID NO:53);

F2:5’-GCTCGACTAGAGCTTGCGGA-3’(SEQ ID NO:54),

R2:5’-CCCCTTTCTCTGGTACCTCAGATGC-3’(SEQ ID NO:55);

Southern Blot检测包括如下探针引物:

5’探针(5’Probe):

F:5’-GACAAAGATGGGGTAGAGTCACTAAGG-3’(SEQ ID NO:56),

R:5’-GCTTAGAACCTGTCCAGTCTAAACTTAG-3’(SEQ ID NO:57);

3’探针(3’Probe):

F:5’-CTCTGAGCGCTCAGAAAGGTATGG-3’(SEQ ID NO:58),

R:5’-GGACCTTAGCTTCAGGAAATGGG-3’(SEQ ID NO:59);

Neo探针(Neo Probe):

F:5’-GGATCGGCCATTGAACAAGATGG-3’(SEQ ID NO:60),

R:5’-CAGAAGAACTCGTCAAGAAGGCG-3’(SEQ ID NO:61)。

将筛选出的正确阳性克隆按照本领域已知的技术将阳性克隆细胞(黑色鼠)导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图12)后,再通过互相交配即可得到表达人源化STING蛋白的STING基因人源化纯合子小鼠。可通过PCR鉴定子代小鼠体细胞的基因型,示例性的F1代小鼠(已去Neo)的鉴定结果见图13,其中,编号为F1-1小鼠为阳性杂合小鼠。PCR测定包括下述引物:

WT-F2:5’-CTCAGAGGCTGTGTGTTAGGTGG-3’(SEQ ID NO:62),

WT-R2:5’-CTGGGCAGGGAACGCATTATGAC-3’(SEQ ID NO:63);

Mut-F:5’-CTATCTCCCTGTTCCAGAACCTGC-3’(SEQ ID NO:64)

WT-R:5’-CTGGGCAGGGAACGCATTATGAC-3’(SEQ ID NO:63);

Frt-F:5’-CAAGGCATAGGCAATGGGTGTCG-3’(SEQ ID NO:65);

Frt-R:5’-CCTAAGGGTGTGTCCTCAGACG-3’(SEQ ID NO:66);

Flp-F2:5’-GACAAGCGTTAGTAGGCACATATAC-3’(SEQ ID NO:67);

Flp-R2:5’-GCTCCAATTTCCCACAACATTAGT-3’(SEQ ID NO:68)。

这表明使用本方法能构建出可稳定传代且无随机插入的STING人源化基因工程小鼠。可通过常规检测方法确认阳性小鼠体内人源化STING蛋白的表达情况,如流式细胞仪等。结果显示,本实施例制备的基因人源化小鼠可以稳定表达人源化STING蛋白,且可以与人STING抗体特异性结合。

此外,还可以引入CRISPR/Cas系统进行基因编辑,从而得到STING基因人源化小鼠,设计的打靶策略如图14所示。该系统中靶序列决定了sgRNA的靶向特异性和诱导Cas9切割目的基因的效率,因此,高效特异的靶序列选择和设计是构建sgRNA表达载体的前提。设计并合成识别5’端靶位点(sgRNA17-sgRNA23)、3’端靶位点(sgRNA24-sgRNA30)的sgRNA序列。5’端靶位点和3’端靶位点分别位于STING基因第5号外显子和第8号外显子上,各sgRNA在STING上的靶位点序列如下:

sgRNA17靶位点序列(SEQ ID NO:69):5’-GTACCCAATGTAGTATGACCAGG-3’

sgRNA18靶位点序列(SEQ ID NO:70):5’-TACTTGCGGTTGATCTTACCAGG-3’

sgRNA19靶位点序列(SEQ ID NO:71):5’-GTATGACCAGGCCAGCCCGTGGG-3’

sgRNA20靶位点序列(SEQ ID NO:72):5’-GCGGTTGATCTTACCAGGTAGGG-3’

sgRNA21靶位点序列(SEQ ID NO:73):5’-TGCGGTTGATCTTACCAGGTAGG-3’

sgRNA22靶位点序列(SEQ ID NO:74):5’-CAGACTGCAGAGACTTCCGCTGG-3’

sgRNA23靶位点序列(SEQ ID NO:75):5’-CATACTACATTGGGTACTTGCGG-3’

sgRNA24靶位点序列(SEQ ID NO:76):5’-GGTGCTCCGGCACATTCGTCAGG-3’

sgRNA25靶位点序列(SEQ ID NO:77):5’-TGGCTCTTGGGACAGTACGGAGG-3’

sgRNA26靶位点序列(SEQ ID NO:78):5’-AGATGAGGTCAGTGCGGAGT GGG-3’

sgRNA27靶位点序列(SEQ ID NO:79):5’-GCTGATCCATACCACTGATG AGG-3’

sgRNA28靶位点序列(SEQ ID NO:80):5’-CTCCGCACTGACCTCATCTG AGG-3’

sgRNA29靶位点序列(SEQ ID NO:81):5’-ACTGACCTCATCTGAGGCAT GGG-3’

sgRNA30靶位点序列(SEQ ID NO:82):5’-CACTGTCTCAGGAGGTGCTC CGG-3’

利用UCA试剂盒检测多个sgRNA的活性,从结果可见sgRNA具有不同活性,检测结果参见图15和表4。从中优先选择2个(分别是sgRNA21和sgRNA26)进行后续实验。取C57BL/6小鼠的原核期受精卵,利用显微注射仪将预混好的sgRNA21、sgRNA26的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)和Cas9mRNA及包含人STING的DNA片段序列(SEQ ID NO:47)的打靶载体质粒注射至小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》中的方法进行胚胎的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管,生产基因改造人源化小鼠,得到首建鼠(即founder鼠,为F0代)。将获得的小鼠通过杂交和自交,扩大种群数量,可建立稳定的小鼠品系。

表4 sgRNA的活性检测结果

实施例3双重人源化或多重双人源化小鼠的制备

利用本方法或制得的STING基因人源化小鼠还可以制备双人源化或多人源化小鼠模型。如,前述实施例1或2中,囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1等其它基因修饰的小鼠,或者,也可在STING基因人源化小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得STING与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的STING小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到人源化STING与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人STING和其它基因调节剂的体内药效验证等。

以双重人源化STING/PD-1小鼠为例,由于鼠STING与PD-1基因分别均位于18号和1号染色体上,选择STING人源化小鼠与PD-1人源化小鼠交配,通过阳性子代小鼠的筛选,最终得到双重人源化STING/PD-1小鼠。该双人源化小鼠可用于评估人特异性STING信号通路的调节剂与人PD-1信号通路拮抗剂联用的药效、药代动力学及在本领域已知的各种疾病模型中的体内治疗功效。

以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。

此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

序列表

<110> 百奥赛图江苏基因生物技术有限公司

<120> STING基因人源化非人动物的构建方法及应用

<130> 1

<150> CN202010910378.0

<151> 2020-09-02

<160> 82

<170> SIPOSequenceListing 1.0

<210> 1

<211> 378

<212> PRT

<213> 小鼠(Mouse)

<400> 1

Met Pro Tyr Ser Asn Leu His Pro Ala Ile Pro Arg Pro Arg Gly His

1 5 10 15

Arg Ser Lys Tyr Val Ala Leu Ile Phe Leu Val Ala Ser Leu Met Ile

20 25 30

Leu Trp Val Ala Lys Asp Pro Pro Asn His Thr Leu Lys Tyr Leu Ala

35 40 45

Leu His Leu Ala Ser His Glu Leu Gly Leu Leu Leu Lys Asn Leu Cys

50 55 60

Cys Leu Ala Glu Glu Leu Cys His Val Gln Ser Arg Tyr Gln Gly Ser

65 70 75 80

Tyr Trp Lys Ala Val Arg Ala Cys Leu Gly Cys Pro Ile His Cys Met

85 90 95

Ala Met Ile Leu Leu Ser Ser Tyr Phe Tyr Phe Leu Gln Asn Thr Ala

100 105 110

Asp Ile Tyr Leu Ser Trp Met Phe Gly Leu Leu Val Leu Tyr Lys Ser

115 120 125

Leu Ser Met Leu Leu Gly Leu Gln Ser Leu Thr Pro Ala Glu Val Ser

130 135 140

Ala Val Cys Glu Glu Lys Lys Leu Asn Val Ala His Gly Leu Ala Trp

145 150 155 160

Ser Tyr Tyr Ile Gly Tyr Leu Arg Leu Ile Leu Pro Gly Leu Gln Ala

165 170 175

Arg Ile Arg Met Phe Asn Gln Leu His Asn Asn Met Leu Ser Gly Ala

180 185 190

Gly Ser Arg Arg Leu Tyr Ile Leu Phe Pro Leu Asp Cys Gly Val Pro

195 200 205

Asp Asn Leu Ser Val Val Asp Pro Asn Ile Arg Phe Arg Asp Met Leu

210 215 220

Pro Gln Gln Asn Ile Asp Arg Ala Gly Ile Lys Asn Arg Val Tyr Ser

225 230 235 240

Asn Ser Val Tyr Glu Ile Leu Glu Asn Gly Gln Pro Ala Gly Val Cys

245 250 255

Ile Leu Glu Tyr Ala Thr Pro Leu Gln Thr Leu Phe Ala Met Ser Gln

260 265 270

Asp Ala Lys Ala Gly Phe Ser Arg Glu Asp Arg Leu Glu Gln Ala Lys

275 280 285

Leu Phe Cys Arg Thr Leu Glu Glu Ile Leu Glu Asp Val Pro Glu Ser

290 295 300

Arg Asn Asn Cys Arg Leu Ile Val Tyr Gln Glu Pro Thr Asp Gly Asn

305 310 315 320

Ser Phe Ser Leu Ser Gln Glu Val Leu Arg His Ile Arg Gln Glu Glu

325 330 335

Lys Glu Glu Val Thr Met Asn Ala Pro Met Thr Ser Val Ala Pro Pro

340 345 350

Pro Ser Val Leu Ser Gln Glu Pro Arg Leu Leu Ile Ser Gly Met Asp

355 360 365

Gln Pro Leu Pro Leu Arg Thr Asp Leu Ile

370 375

<210> 2

<211> 379

<212> PRT

<213> 人(human)

<400> 2

Met Pro His Ser Ser Leu His Pro Ser Ile Pro Cys Pro Arg Gly His

1 5 10 15

Gly Ala Gln Lys Ala Ala Leu Val Leu Leu Ser Ala Cys Leu Val Thr

20 25 30

Leu Trp Gly Leu Gly Glu Pro Pro Glu His Thr Leu Arg Tyr Leu Val

35 40 45

Leu His Leu Ala Ser Leu Gln Leu Gly Leu Leu Leu Asn Gly Val Cys

50 55 60

Ser Leu Ala Glu Glu Leu Arg His Ile His Ser Arg Tyr Arg Gly Ser

65 70 75 80

Tyr Trp Arg Thr Val Arg Ala Cys Leu Gly Cys Pro Leu Arg Arg Gly

85 90 95

Ala Leu Leu Leu Leu Ser Ile Tyr Phe Tyr Tyr Ser Leu Pro Asn Ala

100 105 110

Val Gly Pro Pro Phe Thr Trp Met Leu Ala Leu Leu Gly Leu Ser Gln

115 120 125

Ala Leu Asn Ile Leu Leu Gly Leu Lys Gly Leu Ala Pro Ala Glu Ile

130 135 140

Ser Ala Val Cys Glu Lys Gly Asn Phe Asn Val Ala His Gly Leu Ala

145 150 155 160

Trp Ser Tyr Tyr Ile Gly Tyr Leu Arg Leu Ile Leu Pro Glu Leu Gln

165 170 175

Ala Arg Ile Arg Thr Tyr Asn Gln His Tyr Asn Asn Leu Leu Arg Gly

180 185 190

Ala Val Ser Gln Arg Leu Tyr Ile Leu Leu Pro Leu Asp Cys Gly Val

195 200 205

Pro Asp Asn Leu Ser Met Ala Asp Pro Asn Ile Arg Phe Leu Asp Lys

210 215 220

Leu Pro Gln Gln Thr Gly Asp His Ala Gly Ile Lys Asp Arg Val Tyr

225 230 235 240

Ser Asn Ser Ile Tyr Glu Leu Leu Glu Asn Gly Gln Arg Ala Gly Thr

245 250 255

Cys Val Leu Glu Tyr Ala Thr Pro Leu Gln Thr Leu Phe Ala Met Ser

260 265 270

Gln Tyr Ser Gln Ala Gly Phe Ser Arg Glu Asp Arg Leu Glu Gln Ala

275 280 285

Lys Leu Phe Cys Arg Thr Leu Glu Asp Ile Leu Ala Asp Ala Pro Glu

290 295 300

Ser Gln Asn Asn Cys Arg Leu Ile Ala Tyr Gln Glu Pro Ala Asp Asp

305 310 315 320

Ser Ser Phe Ser Leu Ser Gln Glu Val Leu Arg His Leu Arg Gln Glu

325 330 335

Glu Lys Glu Glu Val Thr Val Gly Ser Leu Lys Thr Ser Ala Val Pro

340 345 350

Ser Thr Ser Thr Met Ser Gln Glu Pro Glu Leu Leu Ile Ser Gly Met

355 360 365

Glu Lys Pro Leu Pro Leu Arg Thr Asp Phe Ser

370 375

<210> 3

<211> 1249

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

tctccccatt cagaagccac ttgctagtag ctactgaaag gctcttcatt gtctcttctg 60

ctccaggaac accggtctag gaagcagaag gtaggattag aaatggggca gtattctcct 120

ggtacttcgt ggtgggagaa accctgggct ggcagaacac tctaaggtct aggtcttgga 180

tcagtttctt ccttctttct cacaccagtg agctcagtgg ggctcacatg tacacgctct 240

gtttactatg aacctctcct agacaggtgc tgtaggatgc tatgtgccca gggcgtctcc 300

ttgaggtgta tccaagagta gcccatggga ctagctgggc tgggagaccc aaggagatgg 360

atgactagtc aggaccttag gccctgaagg acaggagaac cccagaagca tagctgtgga 420

tttcttgatg tctacagatg ccatactcca acctgcatcc agccatccca cggcccagag 480

gtcaccgctc caaatatgta gccctcatct ttctggtggc cagcctgatg atcctttggg 540

tggcaaagga tccaccaaat cacactctga agtacctagc acttcaccta gcctcgcacg 600

aacttggact actgttgaaa aacctctgct gtctggctga agagctgtgc catgtccagt 660

ccaggtaacc ctctgtggtc tccacgatga cttgataccc agcaagtatc acacccttga 720

ctcctaacct tggccttccc tgaacatcat cagctgagtt gggctgggat ctgaggctag 780

gctgtcccct gcaggtacca gggcagctac tggaaggctg tgcgcgcctg cctgggatgc 840

cccatccact gtatggctat gattctacta tcgtcttatt tctatttcct ccaaaacact 900

gctgacatat acctcagttg gatgtttggc cttctggtcc tctataagtc cctaagcatg 960

ctcctgggcc ttcaggtatg aagcagaaga ggtgggtggt gtgggaagag gggactatgg 1020

ctagtgctgg tgtgcctgag ctcagtgctg agactcagac taatttaaag gttggagacc 1080

tgggtgtgga gctatgaagg cttgggatga tgggtttaat agcagtgctg agagcaagct 1140

ggcagcaggt tgggaaagtt ttctgcaaga gaagggcttt ggacatcccc cttgaaagtc 1200

cctcaggccc ttctgctgtc ttcagagctt gactccagcg gaagtctct 1249

<210> 4

<211> 1485

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

accatgaatg cccccatgac ctcagtggca cctcctccct ccgtactgtc ccaagagcca 60

agactcctca tcagtggtat ggatcagcct ctcccactcc gcactgacct catctgaggc 120

atgggacagc cttgtctggg ctctagtgat cctttagcct cctgactgag ccttccttca 180

atggttgggg gcctcagaga cttcacatct ccagatgagt cccacattcc tgggcaagcc 240

atttatttca cctctctgag cctcaaccaa ccctactatg aaaggaggtc ataatgcgtt 300

ccctgcccag ccaaaggatt ttatatatgt agaagttggt gtcaatgcct ggtaaacttg 360

agagaaaggc caagtacttc ccgtggatgc tgcagacatt ccctgctctc tgttgacctg 420

tgtggatggt accagcagac ttccaaccct ccagcttctg gtcacgtgtg ttcaatggga 480

gcttaagtag atggcgagag ggagaaggaa catttgttct gttagctgta tacaatcaca 540

gtgggctggc ctgtcaactg ccttcttaat aaacatatct attctcagat ttctagaatg 600

gcctcttccc cttgtctcta gcactggtat ttgtgtgaca ctggagtact ttctgtctgg 660

tctctttata tcatgtccct tgcacatggt gttggcatca ggacgtccca aactcatgac 720

atcacatagg cgacagcatg acctgcaacc tgcagaccgg ttgccaagac aacaggcacc 780

atattcccac cttccacttg gctcacctcc cacctttacc tgtgttacgt catcttccat 840

atcttccata cgtcttccat cttccatacg tctctctccc ctgcttctct ttctgctgct 900

accttgtctc tcccttccaa taaaacctct tccatgcgga actgccttgg cctagtgtgt 960

tgttgagatg cgacccgcta ttctatcaca tcacatggcc cttcaatagg cactccttga 1020

attacccggt tctaggacac atctttttct gctaggacat gatagctatg aggcattgcc 1080

cctgacatct gagtctgagg gcatatacag cacttcctat actcttcatc ctgccacaag 1140

gcataggcaa tgggtgtcgt ttcaacccaa acagagccca ccattcacac tgagggcaca 1200

ccccacctta ctttcagtgt ccctgcctcc agtggcaggc tgaaggatca ggagcggggc 1260

tgagtggagc agcacacagg tgccatacgt ggcccatagc tgtgtccagg gaagggacca 1320

ctgaacaaat gctcccaaat gagagatctg tgaaaggatc atggaggaga ggaggtgcgt 1380

ctgaggacac acccttagga atggttagtc accaagccta cctgatgccg ttgtaacaat 1440

atcgtggtgg cactgtcacc cccagctagg aggtcaggca gtcct 1485

<210> 5

<211> 4497

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

gcagtgtgtg aaaaagggaa tttcaacgtg gcccatgggc tggcatggtc atattacatc 60

ggatatctgc ggctgatcct gccaggtggg ccatcctctc tgcccccatt tctcgatcta 120

caaaacagac actaagacac acagcctctt gtgtttctaa acacacagaa ctcactatat 180

ttttcaaagc attttcatgt ctaccaaatc ctttaatccc aaggcatgaa ggatgttgct 240

atgatgccta gtttgcagaa aggaatatgg ggcttagagc cattaagtga cttgcccaag 300

gtcacttgtg aattcttttt ttttcttttt gagaaggaat ctccctctgt cgcccaggct 360

agagtgcagt ggtaccatct cggctactgc aacctcctcc ttccaagttc aagtgattat 420

cctggctcag gttcccgagt agctgggatt ataggcaccc accacaacgc ccggctaatt 480

tttgtatttt tagtagagac agggtttcac cgtattggcc aggccggtac aaactcctga 540

cctcaagtga tccgcctgcc ttagcctccc aaagtgctgg gattacaggc gtgagcccag 600

ctgtaaattc tttcaataaa tatttactgc atgctgtgtg ctctcatgtg ccttttctaa 660

ttcacaccct atgaggaagg aataatcttt attcctgttt tattttattt atatattttt 720

taaaaagaag agggttttgc tatgttaccc agcctggtct caactcctgg gctcaagcaa 780

tcctcctgcc ttggcttccc aaagtgccga gataacaagc aggagccacc aagcccatac 840

ctattttaga tttttttttt tttttttttt tgagacaaag tctcactctg ttgcgcagac 900

tggagtgcag tagcacaatc tcagctcact gcgacctctg cctcctgggt tcagcctccc 960

aagtagctgg aattacaggt ccctgccacc ggcatggctt tttttttttt tttttttttt 1020

ttttttgtat ttttagtaga gacagggttt caccatgttg cccaggctgg tcttgaattc 1080

ttgacctcaa gtaatccacc caccttggcc tcccaaagtg ctgggattac agacatgagc 1140

cactgcacca gccttagatt tttttttttt tttaagatgg agtttcactt tttcacccgg 1200

gctgaagtag agtggcacaa tctgggctca ctgcaacttc tgcttcccag gttccagtga 1260

ttctcctgcc ttagcctccc aagtagctgg gattttaggt gcctgccacc acgcccggct 1320

aatttttgta ttttcagtac agacggggtt tcaccatgtt gggtaggcta gtctcaaact 1380

cctgacctca ggtgatccac ccacctcggc ctcccaaagt gctagaacta taggcatgag 1440

ccactgtgcc tggccttttt ttttaagtgc agttctgaga ggtaaagtga tttatccgat 1500

atcacatagc ttagagagag gaagagaaag gatttgaacc caggtttgtc cagagcctgg 1560

accctagacc actgcaccgt ggagcctgtg tttgttgttg ttgttgttgt tgttgttgtt 1620

gttgttgttg ttgttgttgt tttgagatga agtctctttc tgttacccag cctggagtac 1680

agtggtgaca agatctcagc tcactgcaac ctctgcctcc caggttcaag tgattctcct 1740

gcctgagcct cttgaatagc taggattaca ggcacgtgcc accatgcctg gctaattttt 1800

gtatttttag tagagacaat gtttcaccat gttgcccagg ctagtctcaa actcctgacc 1860

tcaaatgatc cacctgcctc agcctcccaa agtgctggat tacaggcgtg agccactgtg 1920

cctgccctaa gcctgtgtgt tttattcttc tgacttgcag gctaaagcgg cagctcttcc 1980

atatctcatt gctatctcct agggcttccg ctaggagact gatctggggc tagaggcctc 2040

cctctgtgca cacgagaatg ctggaaatgt cacctctcag ggctctgcct gcctctcagc 2100

cctgaaagcc atggtggaaa ggggtggcgc tgacatagac atctgaggaa agaagtgagg 2160

gagggtaaag ggtggtgcag taagaggagg ggtggggagg gcttttggag gcgctgcccc 2220

tcctggcctc ctgtacaatg agagtgcact ggactctcca ttctctggca cccacacact 2280

gcgggggcca atgacctggg tctcactcct gaatcaggtg ggagataggg ttagcaggaa 2340

taacttcttg ggcttccctg cctcagagct ccaggcccgg attcgaactt acaatcagca 2400

ttacaacaac ctgctacggg gtgcagtgag ccagcggctg tatattctcc tcccattgga 2460

ctgtggggtg cctgataacc tgagtatggc tgaccccaac attcgcttcc tggataaact 2520

gccccagcag accggtgacc gggctggcat caaggatcgg gtttacagca acagcatcta 2580

tgagcttctg gagaacgggc agcgggtaag tgtgcagggg agtgggggtc tctgaggagg 2640

ggtcaggacc ccagaaccct gggccctagc caagcactga tgaaaattca ctgcccttct 2700

ctgagctgta gtgtccctag ctggtcccag gtctgggcag gattcagctc tgaatgataa 2760

tgatgagtaa catttatcga gcacttacta caagctggat gctattctgg gtgtgtcatc 2820

tgatcacctc attgaattct caccaccacc ctatggggta gggactgtta gcattcccac 2880

tttacagagg aggacactga ggctcagaga caccgtagga aagtggacga tttaaacttg 2940

actgtaccat gctcttgacc ataaagctgc cccagacgaa ggctgtgaga acatctgaag 3000

gattcatgtg ggtgcagggg aacccagacc agagttgaac ccagagccta gccccagacc 3060

tgattcccag ctggagcagt tgacagcctc gggtcttgcc ctaggatctt ggaagaagga 3120

tctgtgaagg gtaaatttag cccagccgtg tccctgattt cagagttggg tatcagaggc 3180

aaaggcaggc cagacagcat agaccccatt agggtggcca cctcccagga ctctatcgtt 3240

acaggctgag ggagtggggc ctcagcccgt ggcactgggg gccagagcct ggactggacc 3300

ctccattctc catccgcctg gcccctggct tagtctggtc ttcctcttac ctcctctagg 3360

cgggcacctg tgtcctggag tacgccaccc ccttgcagac tttgtttgcc atgtcacaat 3420

acagtcaagc tggctttagc cgggaggata ggcttgagca ggccaaactc ttctgccgga 3480

cacttgagga catcctggca gatgcccctg agtctcagaa caactgccgc ctcattgcct 3540

accagggtga ggggttggta gggtgagggg ttgataggct ggagggcagg aggagtcagg 3600

ggtcccaggg tctcccaaag agtcagaagg ggctatggag caccatgccc tgggcctgtc 3660

cttccttccc tgggagaagc cccctcttcc cagcacacca gattgctttt taggtctttg 3720

actgtaatcc ctcaggggag cctgaagagg tgggttctag gggcctctca cttcatctag 3780

gattccagag gaaacagaag agtcccaggc cagtatgtac tgggcacagg agactagggc 3840

tgcagcctcg gctctactac tccctcactg tgtgacctcg ggcaggtttc tgctcctctc 3900

tgagcattag ctttaaaagt aagagggtgg aatttcattc tctctgaaat cacttttttt 3960

tttttttttt gagatggagt ctcactctgt tgcccaggct ggagtgaagt ggctcgattt 4020

cgggtcactg caacctccac ctcccgggtc caagcgattc tcctgcctca gcctcccaag 4080

tagctgggac tacaggcgcc cgccaccatg cccagctaat ttttgtattt ttagtagaga 4140

cggggtttca tcatattggc caggctggtc ttgaattcct gacctcatga tctacctgcc 4200

tcggcctccc aaagtgctag gattacaggc gtgagccact gtgccaggcc tgaaccactt 4260

ctacctctag gattctatga aactctagtc ccagtggctg gggcttgggt aggaaggggg 4320

gtagggaggg ttaggggatc ttcccagcaa gttctctagg tatgtttgag tgggaatggg 4380

taagatcctc attactctct cccctatctc cctgttccag aacctgcaga tgacagcagc 4440

ttctcgctgt cccaggaggt tctccggcac ctgcggcagg aggaaaagga agaggtt 4497

<210> 6

<211> 2302

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 6

tgaaactatt aaattccttg ctcagatttc aggaagtaaa gtgtgctgtt catctcaatc 60

tctcctgtct aacccctccc ctcccgattt ccgggggatc aatgatagta gagagctttg 120

gggcctctgg aaatcctgtg gggccctgtc acttttggtc cttgtatgga gtcctgctag 180

gtgtccactg gagtgtgtta catctcggga cctttagagg aattcggagt gcggggctgt 240

ggctgctgtc tccccattca gaagccactt gctagtagct actgaaaggc tcttcattgt 300

ctcttctgct ccaggaacac cggtctagga agcagaagat gccatactcc aacctgcatc 360

cagccatccc acggcccaga ggtcaccgct ccaaatatgt agccctcatc tttctggtgg 420

ccagcctgat gatcctttgg gtggcaaagg atccaccaaa tcacactctg aagtacctag 480

cacttcacct agcctcgcac gaacttggac tactgttgaa aaacctctgc tgtctggctg 540

aagagctgtg ccatgtccag tccaggtacc agggcagcta ctggaaggct gtgcgcgcct 600

gcctgggatg ccccatccac tgtatggcta tgattctact atcgtcttat ttctatttcc 660

tccaaaacac tgctgacata tacctcagtt ggatgtttgg ccttctggtc ctctataagt 720

ccctaagcat gctcctgggc cttcagagct tgactccagc ggaagtctct gcagtgtgtg 780

aaaaagggaa tttcaacgtg gcccatgggc tggcatggtc atattacatc ggatatctgc 840

ggctgatcct gccagagctc caggcccgga ttcgaactta caatcagcat tacaacaacc 900

tgctacgggg tgcagtgagc cagcggctgt atattctcct cccattggac tgtggggtgc 960

ctgataacct gagtatggct gaccccaaca ttcgcttcct ggataaactg ccccagcaga 1020

ccggtgacca tgctggcatc aaggatcggg tttacagcaa cagcatctat gagcttctgg 1080

agaacgggca gcgggcgggc acctgtgtcc tggagtacgc cacccccttg cagactttgt 1140

ttgccatgtc acaatacagt caagctggct ttagccggga ggataggctt gagcaggcca 1200

aactcttctg ccggacactt gaggacatcc tggcagatgc ccctgagtct cagaacaact 1260

gccgcctcat tgcctaccag gaacctgcag atgacagcag cttctcgctg tcccaggagg 1320

ttctccggca cctgcggcag gaggaaaagg aagaggttac catgaatgcc cccatgacct 1380

cagtggcacc tcctccctcc gtactgtccc aagagccaag actcctcatc agtggtatgg 1440

atcagcctct cccactccgc actgacctca tctgaggcat gggacagcct tgtctgggct 1500

ctagtgatcc tttagcctcc tgactgagcc ttccttcaat ggttgggggc ctcagagact 1560

tcacatctcc agatgagtcc cacattcctg ggcaagccat ttatttcacc tctctgagcc 1620

tcaaccaacc ctactatgaa aggaggtcat aatgcgttcc ctgcccagcc aaaggatttt 1680

atatatgtag aagttggtgt caatgcctgg taaacttgag agaaaggcca agtacttccc 1740

gtggatgctg cagacattcc ctgctctctg ttgacctgtg tggatggtac cagcagactt 1800

ccaaccctcc agcttctggt cacgtgtgtt caatgggagc ttaagtagat ggcgagaggg 1860

agaaggaaca tttgttctgt tagctgtata caatcacagt gggctggcct gtcaactgcc 1920

ttcttaataa acatatctat tctcagattt ctagaatggc ctcttcccct tgtctctagc 1980

actggtattt gtgtgacact ggagtacttt ctgtctggtc tctttatatc atgtcccttg 2040

cacatggtgt tggcatcagg acgtcccaaa ctcatgacat cacataggcg acagcatgac 2100

ctgcaacctg cagaccggtt gccaagacaa caggcaccat attcccacct tccacttggc 2160

tcacctccca cctttacctg tgttacgtca tcttccatat cttccatacg tcttccatct 2220

tccatacgtc tctctcccct gcttctcttt ctgctgctac cttgtctctc ccttccaata 2280

aaacctcttc catgcggaac tg 2302

<210> 7

<211> 378

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Met Pro Tyr Ser Asn Leu His Pro Ala Ile Pro Arg Pro Arg Gly His

1 5 10 15

Arg Ser Lys Tyr Val Ala Leu Ile Phe Leu Val Ala Ser Leu Met Ile

20 25 30

Leu Trp Val Ala Lys Asp Pro Pro Asn His Thr Leu Lys Tyr Leu Ala

35 40 45

Leu His Leu Ala Ser His Glu Leu Gly Leu Leu Leu Lys Asn Leu Cys

50 55 60

Cys Leu Ala Glu Glu Leu Cys His Val Gln Ser Arg Tyr Gln Gly Ser

65 70 75 80

Tyr Trp Lys Ala Val Arg Ala Cys Leu Gly Cys Pro Ile His Cys Met

85 90 95

Ala Met Ile Leu Leu Ser Ser Tyr Phe Tyr Phe Leu Gln Asn Thr Ala

100 105 110

Asp Ile Tyr Leu Ser Trp Met Phe Gly Leu Leu Val Leu Tyr Lys Ser

115 120 125

Leu Ser Met Leu Leu Gly Leu Gln Ser Leu Thr Pro Ala Glu Val Ser

130 135 140

Ala Val Cys Glu Lys Gly Asn Phe Asn Val Ala His Gly Leu Ala Trp

145 150 155 160

Ser Tyr Tyr Ile Gly Tyr Leu Arg Leu Ile Leu Pro Glu Leu Gln Ala

165 170 175

Arg Ile Arg Thr Tyr Asn Gln His Tyr Asn Asn Leu Leu Arg Gly Ala

180 185 190

Val Ser Gln Arg Leu Tyr Ile Leu Leu Pro Leu Asp Cys Gly Val Pro

195 200 205

Asp Asn Leu Ser Met Ala Asp Pro Asn Ile Arg Phe Leu Asp Lys Leu

210 215 220

Pro Gln Gln Thr Gly Asp His Ala Gly Ile Lys Asp Arg Val Tyr Ser

225 230 235 240

Asn Ser Ile Tyr Glu Leu Leu Glu Asn Gly Gln Arg Ala Gly Thr Cys

245 250 255

Val Leu Glu Tyr Ala Thr Pro Leu Gln Thr Leu Phe Ala Met Ser Gln

260 265 270

Tyr Ser Gln Ala Gly Phe Ser Arg Glu Asp Arg Leu Glu Gln Ala Lys

275 280 285

Leu Phe Cys Arg Thr Leu Glu Asp Ile Leu Ala Asp Ala Pro Glu Ser

290 295 300

Gln Asn Asn Cys Arg Leu Ile Ala Tyr Gln Glu Pro Ala Asp Asp Ser

305 310 315 320

Ser Phe Ser Leu Ser Gln Glu Val Leu Arg His Leu Arg Gln Glu Glu

325 330 335

Lys Glu Glu Val Thr Met Asn Ala Pro Met Thr Ser Val Ala Pro Pro

340 345 350

Pro Ser Val Leu Ser Gln Glu Pro Arg Leu Leu Ile Ser Gly Met Asp

355 360 365

Gln Pro Leu Pro Leu Arg Thr Asp Leu Ile

370 375

<210> 8

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 8

gtacccaatg tagtatgacc agg 23

<210> 9

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 9

gcggttgatc ttaccaggta ggg 23

<210> 10

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 10

atttaactgt atggcagaca tgg 23

<210> 11

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 11

aagaagttaa atgttgccca cgg 23

<210> 12

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 12

tacttgcggt tgatcttacc agg 23

<210> 13

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 13

tggcctggtc atactacatt ggg 23

<210> 14

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 14

gctttaggaa tttaactgta tgg 23

<210> 15

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 15

catactacat tgggtacttg cgg 23

<210> 16

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 16

ggtgctccgg cacattcgtc agg 23

<210> 17

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 17

gctgtgtgtt aggtggcaag agg 23

<210> 18

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 18

accaaggcac attagagtca agg 23

<210> 19

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 19

cagcaagatg caggcaccct tgg 23

<210> 20

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 20

catctctaaa gcaggagggt ggg 23

<210> 21

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 21

tgagaaactg tttccgtctg tgg 23

<210> 22

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 22

ggttctggaa tagagatggg ggg 23

<210> 23

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 23

tttcttcctg acgaatgtgc cgg 23

<210> 24

<211> 20

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 24

gtacccaatg tagtatgacc 20

<210> 25

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 25

taggtaccca atgtagtatg acc 23

<210> 26

<211> 20

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 26

ggtcatacta cattgggtac 20

<210> 27

<211> 24

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 27

aaacggtcat actacattgg gtac 24

<210> 28

<211> 20

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 28

gctgtgtgtt aggtggcaag 20

<210> 29

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 29

taggctgtgt gttaggtggc aag 23

<210> 30

<211> 20

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 30

cttgccacct aacacacagc 20

<210> 31

<211> 24

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 31

aaaccttgcc acctaacaca cagc 24

<210> 32

<211> 132

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60

agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120

tttaaaggat cc 132

<210> 33

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

gctttggcag gaaacaccaa aaag 24

<210> 34

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

ggttgttgta atgctgattg taagtt 26

<210> 35

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

cattctctgg cacccacaca ctg 23

<210> 36

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

tcaggggtag agtgtttgcc tat 23

<210> 37

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

ggagacctgg gtgtggagct atg 23

<210> 38

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

catgaagaca gctacagtgt atc 23

<210> 39

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

ttagaaacac aagaggctgt gtgt 24

<210> 40

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

cctcccctcc cgatttccgg ggga 24

<210> 41

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

tggccagctc tttattcttt ttgg 24

<210> 42

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

accatgaatg cccccatgac ctcag 25

<210> 43

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

ctctcaagtt taccaggcat tgacac 26

<210> 44

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

tcaggaggct aaaggatcac tag 23

<210> 45

<211> 5574

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

cttcgaggat taagtgatgc tgagcttgtg tgggccagag aggctctgag aggccagagc 60

ctctcacact ttgtcagggt gaaacttccc ctgaatggaa aaatgaggtg acatcttcca 120

agagcatcag tgatgagtgt tggagaagac agaagaactg gcctggaaat agaaataaga 180

acctgttcag atcagcattt cagggtatct tcacagaaga agcaactaca aaaaggcgtg 240

agagtaaagt ctgtatgtca gacagcaact tgaagctaac ttgcctccgt agcctctggc 300

cttctcttcg gctgatgaga gctgatcaca gacaaataca gactccttgc ctgtctgtaa 360

agctggtctg tctacatgtg gaagacagtc tcatgcaatc cctgtcaaat gattttttcc 420

aggcctggcc tcaaggtcct agtcaatttt tcaaacttct tgtgtcactg accaggtgag 480

agatttgatt gtatccccaa tgtgctgaag ccctgtcttc cagtattgtg tctatatgtc 540

tgtcttctgt tgctaaaagc acagtacaga ctggataagt tacagagaaa gcagttttat 600

ttcaatttgt aattctggtg caaggccaaa ggacttcatt cagtattaac tttgtttctg 660

gcaaaatacc aagggagggc attatgtggc cgaagacaag agacatttat tcattcattc 720

attcgttcgt tcgttcgttc atttattttg gatttctgag acaggttctt attcagtctg 780

ggctgtccta aactcactat ttatccaagg atgaccttgt actttgcgct tccactttcc 840

aagtgctgta actacaggag catgctgctg tgcctggctg aggcaagaga cattcatgtg 900

tatctccact gctcttttct tcttataaat ccaccagtat tagataacag ttgctccaca 960

ctaatgacct tctttaaacc caatcacttc ccaaacacct cgtctttgtg aaccatggtt 1020

ggactaagta cccaaccctg gaagggaagc cacatttaga ccatgcagtc tactgtggga 1080

catttttttg gacgtttttg aatggagtta aggcaaagta agctcactgg gtggagcact 1140

aatgccatct aactgggtcc atagaaaaag aaatgctagg taaagacaga tgctcagcag 1200

tgcagcaggt gaggtcggag gtagacattc agttcctgcc aaccaaggcc tgctagcagt 1260

gaagggagca aggagacttt ttcagagccc ttagacacct tggtccctgg ctaccaagct 1320

ttagagagaa taaaattgtg ttgtttgttt tgttttttgt ttgtttgttt tgttttgttt 1380

tgttttgttt ttttgagaga gggtttcttg gtgtagccct ggctctcctg gaactccttt 1440

tgtggaccag gctggcctcc atcttagaga tccacctgcc tctgcctcct gagtgctgcg 1500

atcaaaggaa taagccacca cccacctggt tgagataata catttatgtt gttttctgat 1560

gcttagttat agcaaccttg gagagtatat agatgcctct cctgcatgtt ctcataacat 1620

ctgcatcctc caccggccaa gatccagctg aggcagggtt tatacctctc ctttcagaat 1680

gttttatcga tgctgtcctc atctctctca taggccttcc aaattcggct ttaatggcac 1740

atctgcagta aagtccagac ttgggcattc cggttgccta ccagagcaac aagatgaacg 1800

catctttggt agccctcatc atgtgtgtag ctgaatactt ccttggatag ttatgttata 1860

tacatttgcc ccgcttggtt gttgatgcca gttcaaggcc tggcatcaca gattcatcag 1920

cagacctggt catgagtagg cacaatctct aggatgattc actgcatgag atatatggat 1980

aaaagatgta cagcctggca tagggctgca catctgcaat cccagctctt gggagggcag 2040

ggcaggaggc acaggcgctc aaagtcatcc ttggctacat attgagtttg aagacagcct 2100

gggctacatg agaccctgtc tcaaaatgaa acaaaagtaa ccctgcgcag gagctcctgg 2160

caggacgttt aaagagccag gcagtgggag cctgtccttc agcagcttta tcgctcttgc 2220

ccaatgcgcc ggaggttttg ctgtaatcag tccaagctaa cgtgcagacc acaatccatt 2280

caccaggccc tgctggctgc tctttttctt tggtctccac cattcccaac atctgacttc 2340

caggcacacc ttactattcc taagggacct gactcaatac tttttgtagc atgcatgcac 2400

tgcattgccc agaacagtgg atgagtgtac aggacagggc aagtagaaag cagtgcccag 2460

ataaaagtga tactaagagg ttttcttcta actagatatt aaaaacaaaa caaacaaata 2520

actaacatat taattaattg acttatttag tgtatatgat gctttgcctg tgtgtatccc 2580

tgtagcactt gtgtgcccgg tactggaaga gaccagaaga aacatcagag accctgaaga 2640

tggagttaga gatggttgtg aacagccatg taggtactga gaaactaact taggtcctct 2700

ggaagggcag ccaaggctct taacttcgga ttcatcttcc catcctctcc tttctgaata 2760

ctttgttatt gcttactgta tagatgaggc ttttctgaaa ctcagcccaa ccgtcctatc 2820

tcagcctccc cagtgctggg attacaggta tgtgccctcc tgcctgtcct tctgtataaa 2880

gtgtacatca tacaaataaa tttcatccca tgtagtgaag gaggggaaaa cggaatagaa 2940

atcactcaga ttcctacctc aaggaatctc atcctctctc atgctgtcat ccacccagtt 3000

agctctttat atgaggcaac tatgagggag agaaagtgta gggagttccc tgcagtttaa 3060

gataattgtt ttttaaaaat ccagaggttt tccaggaagc cagaatattc ctgggagttc 3120

aggggagcct ctgaatgccg gtgttctcct gtctctgctt gtgatacggg gaggattcag 3180

gttcttgcct ggaagggacg aactgctcct gtcccgggcc tcagcagcta gcttctcctg 3240

tgccagggaa actacatgaa ccatggcatc ttccatctgc tcctaaaaac aaggcacgga 3300

gccaactggc ttctgagctt ctgagcctca gggctcaggc tttacaacct caccgacttg 3360

ggtaaagtta ctgtacctct ctgggctcag atcaccctca tgtaaaaaaa aagaataaag 3420

agctggccag atggctagca gggaagagat gcttgtggct aagcctaagg atctgtgttg 3480

gatccctgat acccaccggg tgaaagggga gaatgactca taaattgtcc ggtgccctcc 3540

cctaacaaaa aaacaaaaca aaactataat tgtaaaaaca aacaaacaaa caaacaaaca 3600

aaaaacagga aagaatttga gccttcttcc taggggcaca gggagaactg aactgagcga 3660

aacaggatta gaagcctttg gctatctgga cctggacttc ccttcattta attctagtac 3720

cttcccactc aaccatcctg agactgggaa attagaggcg tggttatttc cccgaaaaga 3780

gtgctctccc ccctcccccg gaaggctgaa actattaaat tccttgctca gatttcagga 3840

agtaaagtgt gctgttcatc tcaatctctc ctgtctaacc cctcccctcc cgatttccgg 3900

gggatcaatg atagtagaga gctttggggc ctctggaaat cctgtggggc cctgtcactt 3960

ttggtccttg tatggagtcc tgctaggtgt ccactggagt gtgttacatc tcgggacctt 4020

tagaggaatt cggagtgcgg ggctgtggct gctggtgagt gactttttga acaccttcag 4080

tttgggggtt aggaaagagg aacagaggag ggcgatctga agcttcacct cccccaccct 4140

cccctgctat actcagacct ggtttatgga ggctggtagg aagggggggg ggtgctttgg 4200

caggaaacac caaaaagaat aaagagctgg ccagatggct agcttcctcc cagagcactg 4260

aaaactgtgc tctggcaagg gccagggctg tggttttact gaggaagcga gctgagttgc 4320

agttgttttt aacatttcgt tttcagtctc cccattcaga agccacttgc tagtagctac 4380

tgaaaggctc ttcattgtct cttctgctcc aggaacaccg gtctaggaag cagaaggtag 4440

gattagaaat ggggcagtat tctcctggta cttcgtggtg ggagaaaccc tgggctggca 4500

gaacactcta aggtctaggt cttggatcag tttcttcctt ctttctcaca ccagtgagct 4560

cagtggggct cacatgtaca cgctctgttt actatgaacc tctcctagac aggtgctgta 4620

ggatgctatg tgcccagggc gtctccttga ggtgtatcca agagtagccc atgggactag 4680

ctgggctggg agacccaagg agatggatga ctagtcagga ccttaggccc tgaaggacag 4740

gagaacccca gaagcatagc tgtggatttc ttgatgtcta cagatgccat actccaacct 4800

gcatccagcc atcccacggc ccagaggtca ccgctccaaa tatgtagccc tcatctttct 4860

ggtggccagc ctgatgatcc tttgggtggc aaaggatcca ccaaatcaca ctctgaagta 4920

cctagcactt cacctagcct cgcacgaact tggactactg ttgaaaaacc tctgctgtct 4980

ggctgaagag ctgtgccatg tccagtccag gtaaccctct gtggtctcca cgatgacttg 5040

atacccagca agtatcacac ccttgactcc taaccttggc cttccctgaa catcatcagc 5100

tgagttgggc tgggatctga ggctaggctg tcccctgcag gtaccagggc agctactgga 5160

aggctgtgcg cgcctgcctg ggatgcccca tccactgtat ggctatgatt ctactatcgt 5220

cttatttcta tttcctccaa aacactgctg acatatacct cagttggatg tttggccttc 5280

tggtcctcta taagtcccta agcatgctcc tgggccttca ggtatgaagc agaagaggtg 5340

ggtggtgtgg gaagagggga ctatggctag tgctggtgtg cctgagctca gtgctgagac 5400

tcagactaat ttaaaggttg gagacctggg tgtggagcta tgaaggcttg ggatgatggg 5460

tttaatagca gtgctgagag caagctggca gcaggttggg aaagttttct gcaagagaag 5520

ggctttggac atcccccttg aaagtccctc aggcccttct gctgtcttca gagc 5574

<210> 46

<211> 3444

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

gtgtccaggg aagggaccac tgaacaaatg ctcccaaatg agagatctgt gaaaggatca 60

tggaggagag gaggtgcgtc tgaggacaca cccttaggaa tggttagtca ccaagcctac 120

ctgatgccgt tgtaacaata tcgtggtggc actgtcaccc ccagctagga ggtcaggcag 180

tccttcctat cagctttacc tagacttgac atgtgtcttc cctctacctc tgttttcatt 240

acaagggctc ggtattgcac tttgaacgtc cccttgtttt atgcgtgtgt tttctccagt 300

actgaggatc caattcatgg tcttgttcac ataggcaaac actctacccc tgagctgtgc 360

cctcagttct cattatgagt ttctgcatac agtgtcactg tagggggagg ttctgatgct 420

agttgctggg ctggaggtac agatgggact tctgggtttt tggatgagaa cgggctcgcc 480

atactttaga gacgaactaa gagccatgtg agatctcaaa atggagtagc cacacaggct 540

gctcctatag gcaggttgtc aggggagttt agcaactaaa gtttaggact ggtgggagag 600

gcagagataa gaaattggta aagggctggg tggtggtggt gcatgccttt aatctcagca 660

cttgggaggc agaggcaggt ggatttctga gttcaaagcc agcctggtct acaaagtgag 720

ttccaggaca gccagggcta tacagagaaa tcctgtttcg aaaaaaaaga aaaaagaaaa 780

aaaagaaaga aactggtaag ggcatgcttt tccaggcagg agataatagc acccagcaat 840

tgtgccaaga aggcaaattg aacacctgtg tgtctgtgtt tttatccttg gactcaaggg 900

aagccaggta agggctggta cctcaattga taccacaaaa ctacactcaa catgtcacta 960

tggagaaata tcacacacac acacacacac acacacacac acacacacac acacacacac 1020

acacacatca gaggaagcca gtcactctaa ggatagcaga accatgggga tcaagtgtgg 1080

ggcagtcttg ggactcgtga gatggctcag tgggtaagag cacccgacta ttcttccgaa 1140

ggtctgaagt tcaaatccca acaaccacat ggtggctcac aaccatccgt aatgagatct 1200

gactccctct tctggagtgt ctaaagacag ctacagtgta cttatatata ataaaaataa 1260

ataaatcttt aaaaaaaagt gtggggcagt ctcttctctc tctgtcacag ccatcttgtc 1320

ataacactga ggagcctcta tcacacccaa cacttccttc tctagcaacc aggcctagca 1380

taaacggcct cctcaggctg attgtgttca acccaccagt ccccgggatg gttcctaggc 1440

tgtgcggctg gtgaaactca gtctgaaatg ctcactttat tgcttggtac ctgtgtccac 1500

catggtgaaa tggggactgc atggcatctc tgccaaggtt gtgaggagtg aatgggactg 1560

acaggaccag caatctgcac atagatgaat agctgactgc taagcagcag catcaagcaa 1620

tgccagctgg cacctttttt tttttttttt tttttgagac agtgtttctc tgtgtagcct 1680

tggctgtcct ggaacacact ctgtagacca ggctggtctt gaactcacag agatctgcct 1740

gcttctgcct ccctagtggt aggattaaaa gcaagtacca ccattgcctg gctcttatgc 1800

agtcacaagg aggtgtgttc attctctgca cacatttcca cccattctgc ttctccccca 1860

cctccctggt tccctgcctc attctgtggg aggacagagc acgatgattt atccttagga 1920

ggtcccagtt gtgtttgttt gtttgtttgt ttgtttaaga tttcttttat ttatatgagt 1980

acactgtagc tgtcttcagc cacaccagaa ggggacattg atcccattac agatggctgt 2040

gagccaccat gtggttgcta ggatttgaac tcaggatctc tggaagagca gcactgctct 2100

taactgctga gccatccctc cagccttctt tttttttttt tttttttttt tttttaagaa 2160

agagcctcac tatgtagccc aggttagcat agaactcact atataaaatc aattcacctt 2220

gaactcagag atccatctgc ctctgcctct tgagtgctgg ggttaaaggt gtgcaccagc 2280

atatccaacc ctgctcttct cttctcttcc ttcctttttt tttttttttg taagttttta 2340

ctgattctct gtatcattca tatcgtgtac cccagcccac tcctctcctt caccttgtat 2400

ttgccttctg cccatgcaac ctcctcccca aataataaac aaacaagaaa taaaacaaag 2460

catggtgaac atctcgttgt ggaagctgta gtgtgtcaca gtgtgtccca caataaaccc 2520

ctctgtccac acaccttcac ttgggaatgt tcattgcact gagtcattgg tctgttctga 2580

gatctctggc ttccgtgacg ccgtcaatat tggatcctca ccaggacccc tcctggtttc 2640

ctgctgttgc cctgtgtcac agagatccta cagcttagga acagcaggac tgctttcatg 2700

tgtcccaaca gttcacagat gctgtagagg ttgtggtggt ggatctggat ctgggcgtgg 2760

atggaagctg agcgtcagcc tgccagctct tccttattca aaccgccagg gcgagctctc 2820

cagcactgct ctgactaggt cacccaatgc tgacctcggc aggaagcagg gtcagctctt 2880

ccgctcttat gccctccctc gcgcaggctc acccgcaccc acgctgccag agccctcggc 2940

tgtactgccc aatcaaggca gcctgctctc tcaagtgctg cacccggcaa ggggctggga 3000

ctgctctggc catgtcacac cttcggggct gcctcacctg agccatcatc ctcagggcca 3060

gctccactgt gttgcccaag cgaggtgcag agcctgcctt cagccagtga gggacaggga 3120

tagctctttc cctttcatga caggtggggg ggttgaccgg tgacaggtgg gggtggggag 3180

cagctgtccc gactactgca aggggagtgg ggtgggggag gggaaagggc ttcaccagtc 3240

gcccactcca cctcatttca cagcagatga gtggtggggc cagttctcct aaggactggc 3300

taagctgccc atgctctatc agggccaact ctactgtgag gttcagggct tgcttttatt 3360

tcacaacctc tagccagcca caggtggcta gtggcaaggc aggcctctcc tttctcttaa 3420

taaacaggtg ccatgtagtc tagg 3444

<210> 47

<211> 4635

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

ctggccccag ctgagatctc tgcagtgtgt gaaaaaggga atttcaacgt ggcccatggg 60

ctggcatggt catattacat cggatatctg cggctgatcc tgccaggtgg gccatcctct 120

ctgcccccat ttctcgatct acaaaacaga cactaagaca cacagcctct tgtgtttcta 180

aacacacaga actcactata tttttcaaag cattttcatg tctaccaaat cctttaatcc 240

caaggcatga aggatgttgc tatgatgcct agtttgcaga aaggaatatg gggcttagag 300

ccattaagtg acttgcccaa ggtcacttgt gaattctttt tttttctttt tgagaaggaa 360

tctccctctg tcgcccaggc tagagtgcag tggtaccatc tcggctactg caacctcctc 420

cttccaagtt caagtgatta tcctggctca ggttcccgag tagctgggat tataggcacc 480

caccacaacg cccggctaat ttttgtattt ttagtagaga cagggtttca ccgtattggc 540

caggccggta caaactcctg acctcaagtg atccgcctgc cttagcctcc caaagtgctg 600

ggattacagg cgtgagccca gctgtaaatt ctttcaataa atatttactg catgctgtgt 660

gctctcatgt gccttttcta attcacaccc tatgaggaag gaataatctt tattcctgtt 720

ttattttatt tatatatttt ttaaaaagaa gagggttttg ctatgttacc cagcctggtc 780

tcaactcctg ggctcaagca atcctcctgc cttggcttcc caaagtgccg agataacaag 840

caggagccac caagcccata cctattttag attttttttt tttttttttt ttgagacaaa 900

gtctcactct gttgcgcaga ctggagtgca gtagcacaat ctcagctcac tgcgacctct 960

gcctcctggg ttcagcctcc caagtagctg gaattacagg tccctgccac cggcatggct 1020

tttttttttt tttttttttt tttttttgta tttttagtag agacagggtt tcaccatgtt 1080

gcccaggctg gtcttgaatt cttgacctca agtaatccac ccaccttggc ctcccaaagt 1140

gctgggatta cagacatgag ccactgcacc agccttagat tttttttttt ttttaagatg 1200

gagtttcact ttttcacccg ggctgaagta gagtggcaca atctgggctc actgcaactt 1260

ctgcttccca ggttccagtg attctcctgc cttagcctcc caagtagctg ggattttagg 1320

tgcctgccac cacgcccggc taatttttgt attttcagta cagacggggt ttcaccatgt 1380

tgggtaggct agtctcaaac tcctgacctc aggtgatcca cccacctcgg cctcccaaag 1440

tgctagaact ataggcatga gccactgtgc ctggcctttt tttttaagtg cagttctgag 1500

aggtaaagtg atttatccga tatcacatag cttagagaga ggaagagaaa ggatttgaac 1560

ccaggtttgt ccagagcctg gaccctagac cactgcaccg tggagcctgt gtttgttgtt 1620

gttgttgttg ttgttgttgt tgttgttgtt gttgttgttg ttttgagatg aagtctcttt 1680

ctgttaccca gcctggagta cagtggtgac aagatctcag ctcactgcaa cctctgcctc 1740

ccaggttcaa gtgattctcc tgcctgagcc tcttgaatag ctaggattac aggcacgtgc 1800

caccatgcct ggctaatttt tgtattttta gtagagacaa tgtttcacca tgttgcccag 1860

gctagtctca aactcctgac ctcaaatgat ccacctgcct cagcctccca aagtgctgga 1920

ttacaggcgt gagccactgt gcctgcccta agcctgtgtg ttttattctt ctgacttgca 1980

ggctaaagcg gcagctcttc catatctcat tgctatctcc tagggcttcc gctaggagac 2040

tgatctgggg ctagaggcct ccctctgtgc acacgagaat gctggaaatg tcacctctca 2100

gggctctgcc tgcctctcag ccctgaaagc catggtggaa aggggtggcg ctgacataga 2160

catctgagga aagaagtgag ggagggtaaa gggtggtgca gtaagaggag gggtggggag 2220

ggcttttgga ggcgctgccc ctcctggcct cctgtacaat gagagtgcac tggactctcc 2280

attctctggc acccacacac tgcgggggcc aatgacctgg gtctcactcc tgaatcaggt 2340

gggagatagg gttagcagga ataacttctt gggcttccct gcctcagagc tccaggcccg 2400

gattcgaact tacaatcagc attacaacaa cctgctacgg ggtgcagtga gccagcggct 2460

gtatattctc ctcccattgg actgtggggt gcctgataac ctgagtatgg ctgaccccaa 2520

cattcgcttc ctggataaac tgccccagca gaccggtgac catgctggca tcaaggatcg 2580

ggtttacagc aacagcatct atgagcttct ggagaacggg cagcgggtaa gtgtgcaggg 2640

gagtgggggt ctctgaggag gggtcaggac cccagaaccc tgggccctag ccaagcactg 2700

atgaaaattc actgcccttc tctgagctgt agtgtcccta gctggtccca ggtctgggca 2760

ggattcagct ctgaatgata atgatgagta acatttatcg agcacttact acaagctgga 2820

tgctattctg ggtgtgtcat ctgatcacct cattgaattc tcaccaccac cctatggggt 2880

agggactgtt agcattccca ctttacagag gaggacactg aggctcagag acaccgtagg 2940

aaagtggacg atttaaactt gactgtacca tgctcttgac cataaagctg ccccagacga 3000

aggctgtgag aacatctgaa ggattcatgt gggtgcaggg gaacccagac cagagttgaa 3060

cccagagcct agccccagac ctgattccca gctggagcag ttgacagcct cgggtcttgc 3120

cctaggatct tggaagaagg atctgtgaag ggtaaattta gcccagccgt gtccctgatt 3180

tcagagttgg gtatcagagg caaaggcagg ccagacagca tagaccccat tagggtggcc 3240

acctcccagg actctatcgt tacaggctga gggagtgggg cctcagcccg tggcactggg 3300

ggccagagcc tggactggac cctccattct ccatccgcct ggcccctggc ttagtctggt 3360

cttcctctta cctcctctag gcgggcacct gtgtcctgga gtacgccacc cccttgcaga 3420

ctttgtttgc catgtcacaa tacagtcaag ctggctttag ccgggaggat aggcttgagc 3480

aggccaaact cttctgccgg acacttgagg acatcctggc agatgcccct gagtctcaga 3540

acaactgccg cctcattgcc taccagggtg aggggttggt agggtgaggg gttgataggc 3600

tggagggcag gaggagtcag gggtcccagg gtctcccaaa gagtcagaag gggctatgga 3660

gcaccatgcc ctgggcctgt ccttccttcc ctgggagaag ccccctcttc ccagcacacc 3720

agattgcttt ttaggtcttt gactgtaatc cctcagggga gcctgaagag gtgggttcta 3780

ggggcctctc acttcatcta ggattccaga ggaaacagaa gagtcccagg ccagtatgta 3840

ctgggcacag gagactaggg ctgcagcctc ggctctacta ctccctcact gtgtgacctc 3900

gggcaggttt ctgctcctct ctgagcatta gctttaaaag taagagggtg gaatttcatt 3960

ctctctgaaa tcactttttt tttttttttt tgagatggag tctcactctg ttgcccaggc 4020

tggagtgaag tggctcgatt tcgggtcact gcaacctcca cctcccgggt ccaagcgatt 4080

ctcctgcctc agcctcccaa gtagctggga ctacaggcgc ccgccaccat gcccagctaa 4140

tttttgtatt tttagtagag acggggtttc atcatattgg ccaggctggt cttgaattcc 4200

tgacctcatg atctacctgc ctcggcctcc caaagtgcta ggattacagg cgtgagccac 4260

tgtgccaggc ctgaaccact tctacctcta ggattctatg aaactctagt cccagtggct 4320

ggggcttggg taggaagggg ggtagggagg gttaggggat cttcccagca agttctctag 4380

gtatgtttga gtgggaatgg gtaagatcct cattactctc tcccctatct ccctgttcca 4440

gaacctgcag atgacagcag cttctcgctg tcccaggagg ttctccggca cctgcggcag 4500

gaggaaaagg aagaggttac tgtgggcagc ttgaagacct cagcggtgcc cagtacctcc 4560

acgatgtccc aagagcctga gctcctcatc agtggaatgg aaaagcccct ccctctccgc 4620

acggatttct cttga 4635

<210> 48

<211> 2302

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 48

tgaaactatt aaattccttg ctcagatttc aggaagtaaa gtgtgctgtt catctcaatc 60

tctcctgtct aacccctccc ctcccgattt ccgggggatc aatgatagta gagagctttg 120

gggcctctgg aaatcctgtg gggccctgtc acttttggtc cttgtatgga gtcctgctag 180

gtgtccactg gagtgtgtta catctcggga cctttagagg aattcggagt gcggggctgt 240

ggctgctgtc tccccattca gaagccactt gctagtagct actgaaaggc tcttcattgt 300

ctcttctgct ccaggaacac cggtctagga agcagaagat gccatactcc aacctgcatc 360

cagccatccc acggcccaga ggtcaccgct ccaaatatgt agccctcatc tttctggtgg 420

ccagcctgat gatcctttgg gtggcaaagg atccaccaaa tcacactctg aagtacctag 480

cacttcacct agcctcgcac gaacttggac tactgttgaa aaacctctgc tgtctggctg 540

aagagctgtg ccatgtccag tccaggtacc agggcagcta ctggaaggct gtgcgcgcct 600

gcctgggatg ccccatccac tgtatggcta tgattctact atcgtcttat ttctatttcc 660

tccaaaacac tgctgacata tacctcagtt ggatgtttgg ccttctggtc ctctataagt 720

ccctaagcat gctcctgggc cttcagagcc tggccccagc tgagatctct gcagtgtgtg 780

aaaaagggaa tttcaacgtg gcccatgggc tggcatggtc atattacatc ggatatctgc 840

ggctgatcct gccagagctc caggcccgga ttcgaactta caatcagcat tacaacaacc 900

tgctacgggg tgcagtgagc cagcggctgt atattctcct cccattggac tgtggggtgc 960

ctgataacct gagtatggct gaccccaaca ttcgcttcct ggataaactg ccccagcaga 1020

ccggtgacca tgctggcatc aaggatcggg tttacagcaa cagcatctat gagcttctgg 1080

agaacgggca gcgggcgggc acctgtgtcc tggagtacgc cacccccttg cagactttgt 1140

ttgccatgtc acaatacagt caagctggct ttagccggga ggataggctt gagcaggcca 1200

aactcttctg ccggacactt gaggacatcc tggcagatgc ccctgagtct cagaacaact 1260

gccgcctcat tgcctaccag gaacctgcag atgacagcag cttctcgctg tcccaggagg 1320

ttctccggca cctgcggcag gaggaaaagg aagaggttac tgtgggcagc ttgaagacct 1380

cagcggtgcc cagtacctcc acgatgtccc aagagcctga gctcctcatc agtggaatgg 1440

aaaagcccct ccctctccgc acggatttct cttgaggcat gggacagcct tgtctgggct 1500

ctagtgatcc tttagcctcc tgactgagcc ttccttcaat ggttgggggc ctcagagact 1560

tcacatctcc agatgagtcc cacattcctg ggcaagccat ttatttcacc tctctgagcc 1620

tcaaccaacc ctactatgaa aggaggtcat aatgcgttcc ctgcccagcc aaaggatttt 1680

atatatgtag aagttggtgt caatgcctgg taaacttgag agaaaggcca agtacttccc 1740

gtggatgctg cagacattcc ctgctctctg ttgacctgtg tggatggtac cagcagactt 1800

ccaaccctcc agcttctggt cacgtgtgtt caatgggagc ttaagtagat ggcgagaggg 1860

agaaggaaca tttgttctgt tagctgtata caatcacagt gggctggcct gtcaactgcc 1920

ttcttaataa acatatctat tctcagattt ctagaatggc ctcttcccct tgtctctagc 1980

actggtattt gtgtgacact ggagtacttt ctgtctggtc tctttatatc atgtcccttg 2040

cacatggtgt tggcatcagg acgtcccaaa ctcatgacat cacataggcg acagcatgac 2100

ctgcaacctg cagaccggtt gccaagacaa caggcaccat attcccacct tccacttggc 2160

tcacctccca cctttacctg tgttacgtca tcttccatat cttccatacg tcttccatct 2220

tccatacgtc tctctcccct gcttctcttt ctgctgctac cttgtctctc ccttccaata 2280

aaacctcttc catgcggaac tg 2302

<210> 49

<211> 378

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 49

Met Pro Tyr Ser Asn Leu His Pro Ala Ile Pro Arg Pro Arg Gly His

1 5 10 15

Arg Ser Lys Tyr Val Ala Leu Ile Phe Leu Val Ala Ser Leu Met Ile

20 25 30

Leu Trp Val Ala Lys Asp Pro Pro Asn His Thr Leu Lys Tyr Leu Ala

35 40 45

Leu His Leu Ala Ser His Glu Leu Gly Leu Leu Leu Lys Asn Leu Cys

50 55 60

Cys Leu Ala Glu Glu Leu Cys His Val Gln Ser Arg Tyr Gln Gly Ser

65 70 75 80

Tyr Trp Lys Ala Val Arg Ala Cys Leu Gly Cys Pro Ile His Cys Met

85 90 95

Ala Met Ile Leu Leu Ser Ser Tyr Phe Tyr Phe Leu Gln Asn Thr Ala

100 105 110

Asp Ile Tyr Leu Ser Trp Met Phe Gly Leu Leu Val Leu Tyr Lys Ser

115 120 125

Leu Ser Met Leu Leu Gly Leu Gln Ser Leu Ala Pro Ala Glu Ile Ser

130 135 140

Ala Val Cys Glu Lys Gly Asn Phe Asn Val Ala His Gly Leu Ala Trp

145 150 155 160

Ser Tyr Tyr Ile Gly Tyr Leu Arg Leu Ile Leu Pro Glu Leu Gln Ala

165 170 175

Arg Ile Arg Thr Tyr Asn Gln His Tyr Asn Asn Leu Leu Arg Gly Ala

180 185 190

Val Ser Gln Arg Leu Tyr Ile Leu Leu Pro Leu Asp Cys Gly Val Pro

195 200 205

Asp Asn Leu Ser Met Ala Asp Pro Asn Ile Arg Phe Leu Asp Lys Leu

210 215 220

Pro Gln Gln Thr Gly Asp His Ala Gly Ile Lys Asp Arg Val Tyr Ser

225 230 235 240

Asn Ser Ile Tyr Glu Leu Leu Glu Asn Gly Gln Arg Ala Gly Thr Cys

245 250 255

Val Leu Glu Tyr Ala Thr Pro Leu Gln Thr Leu Phe Ala Met Ser Gln

260 265 270

Tyr Ser Gln Ala Gly Phe Ser Arg Glu Asp Arg Leu Glu Gln Ala Lys

275 280 285

Leu Phe Cys Arg Thr Leu Glu Asp Ile Leu Ala Asp Ala Pro Glu Ser

290 295 300

Gln Asn Asn Cys Arg Leu Ile Ala Tyr Gln Glu Pro Ala Asp Asp Ser

305 310 315 320

Ser Phe Ser Leu Ser Gln Glu Val Leu Arg His Leu Arg Gln Glu Glu

325 330 335

Lys Glu Glu Val Thr Val Gly Ser Leu Lys Thr Ser Ala Val Pro Ser

340 345 350

Thr Ser Thr Met Ser Gln Glu Pro Glu Leu Leu Ile Ser Gly Met Glu

355 360 365

Lys Pro Leu Pro Leu Arg Thr Asp Phe Ser

370 375

<210> 50

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

acacaggtgc catacgtggc ccatagctaa gcttgatatc gaattccgaa gttcct 56

<210> 51

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

aacttcatca gtcaggtaca taatggtgga tccactagtt ctagagcggc cgcattaatg 60

tgtccaggga agggaccact gaacaaatgc tccca 95

<210> 52

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

ggtcacacag ctagagagac agaagtc 27

<210> 53

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

catagcaaca tccttcatgc cttggg 26

<210> 54

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

gctcgactag agcttgcgga 20

<210> 55

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

cccctttctc tggtacctca gatgc 25

<210> 56

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

gacaaagatg gggtagagtc actaagg 27

<210> 57

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

gcttagaacc tgtccagtct aaacttag 28

<210> 58

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

ctctgagcgc tcagaaaggt atgg 24

<210> 59

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

ggaccttagc ttcaggaaat ggg 23

<210> 60

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

ggatcggcca ttgaacaaga tgg 23

<210> 61

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

cagaagaact cgtcaagaag gcg 23

<210> 62

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

ctcagaggct gtgtgttagg tgg 23

<210> 63

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

ctgggcaggg aacgcattat gac 23

<210> 64

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

ctatctccct gttccagaac ctgc 24

<210> 65

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

caaggcatag gcaatgggtg tcg 23

<210> 66

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

cctaagggtg tgtcctcaga cg 22

<210> 67

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

gacaagcgtt agtaggcaca tatac 25

<210> 68

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

gctccaattt cccacaacat tagt 24

<210> 69

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 69

gtacccaatg tagtatgacc agg 23

<210> 70

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 70

tacttgcggt tgatcttacc agg 23

<210> 71

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 71

gtatgaccag gccagcccgt ggg 23

<210> 72

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 72

gcggttgatc ttaccaggta ggg 23

<210> 73

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 73

tgcggttgat cttaccaggt agg 23

<210> 74

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 74

cagactgcag agacttccgc tgg 23

<210> 75

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 75

catactacat tgggtacttg cgg 23

<210> 76

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 76

ggtgctccgg cacattcgtc agg 23

<210> 77

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 77

tggctcttgg gacagtacgg agg 23

<210> 78

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 78

agatgaggtc agtgcggagt ggg 23

<210> 79

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 79

gctgatccat accactgatg agg 23

<210> 80

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 80

ctccgcactg acctcatctg agg 23

<210> 81

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 81

actgacctca tctgaggcat ggg 23

<210> 82

<211> 23

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 82

cactgtctca ggaggtgctc cgg 23

62页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:应用于疾病治疗的T细胞受体

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!