重症免疫缺陷猪源重组细胞及其制备方法和试剂盒

文档序号:872088 发布日期:2021-03-19 浏览:7次 >En<

阅读说明:本技术 重症免疫缺陷猪源重组细胞及其制备方法和试剂盒 (Severe immunodeficiency swine-derived recombinant cell and preparation method and kit thereof ) 是由 牛冬 汪滔 马翔 曾为俊 王磊 程锐 赵泽英 于 2020-09-04 设计创作,主要内容包括:本发明公开了重症免疫缺陷猪源重组细胞及其制备方法。具体来说,本发明涉及IL2RG基因、RAG1基因和RAG2基因这三个基因联合敲除的重症免疫缺陷猪源重组细胞,以及用于制备该重组细胞的方法,以及用于制备该重组细胞的试剂盒。本发明提供了sgRNA组合,由sgRNA-(IL2RG-g7)、sgRNA-(RAG1-g4)和sgRNA-(RAG2-g2)组成。sgRNA-(IL2RG-g7)的靶序列结合区如SEQ ID NO:24中第1-20位核苷酸所示。sgRNA-(RAG1-g4)的靶序列结合区如SEQ ID NO:9中第1-20位核苷酸所示。sgRNA-(RAG2-g2)的靶序列结合区如SEQ ID NO:13中第1-20位核苷酸所示。本发明为重症免疫缺陷猪模型的制备奠定了坚实的基础,对于重症免疫缺陷药物的研发具有重大应用价值。(The invention discloses a severe immunodeficiency swine-derived recombinant cell and a preparation method thereof. Specifically, the invention relates to a severe immunodeficiency swine recombinant cell with combined knock-out of three genes, namely an IL2RG gene, a RAG1 gene and a RAG2 gene, a method for preparing the recombinant cell and a kit for preparing the recombinant cell. The invention provides sgRNA combinations comprising sgRNAs IL2RG‑g7 、sgRNA RAG1‑g4 And sgRNA RAG2‑g2 And (4) forming. sgRNA IL2RG‑g7 The target sequence binding region of (a) is as shown in SEQ ID NO: nucleotides 1 to 20 of 24. sgRNA RAG1‑g4 The target sequence binding region of (a) is as shown in SEQ ID NO: 9 at nucleotides 1-20. sgRNA RAG2‑g2 The target sequence binding region of (a) is as shown in SEQ ID NO: 13, nucleotides 1-20. The invention lays a solid foundation for the preparation of the severe immunodeficiency pig model and has great application value for the research and development of severe immunodeficiency medicaments.)

重症免疫缺陷猪源重组细胞及其制备方法和试剂盒

技术领域

本发明涉及重症免疫缺陷猪源重组细胞及其制备方法。具体来说,本发明涉及IL2RG基因、RAG1基因和RAG2基因这三个基因联合敲除的重症免疫缺陷猪源重组细胞,以及用于制备该重组细胞的方法,以及用于制备该重组细胞的试剂盒。

背景技术

重症联合免疫缺陷(severe combined immunodeficiency,SCID)是原发性免疫缺陷病中最严重的表型,是指由于遗传、发育或感染等因素导致的T细胞、B细胞和NK细胞同时出现发育、分化、增殖、代谢或功能障碍。1950年,Glanzmann和Riniker首次报道了人类婴儿中的SCID病。在全球,SCID的新生儿发病率约为1/50000,该病发病年龄早,临床表现重,且死亡率高。多数SCID是由于免疫相关基因的异常造成的,而SCID的主要遗传方式包括X连锁隐性遗传和常染色体隐性遗传两种。该病发病具有一定的区域性和血缘性,且由于存在X连锁隐性遗传的特性,该病多见于男性患者。

目前,针对于SCID的治疗手段主要包括骨髓或造血干细胞移植和基因治疗。骨髓或干细胞移植是治疗SCID的最佳方案,但是寻找与患者合适配型的供体相当困难。作为大动物,猪是人类长期以来主要的肉食来源动物,易于大规模繁殖饲养,而且在伦理道德及动物保护等方面的要求较低,同时猪体型大小和器官功能与人类近似,是理想的人类疾病模型动物。

另外,在进行研究生物活性大分子或细胞治疗的效果时,用异源动物进行试验将会产生免疫排斥,从而无法进行有效的动物试验。而用重症联合免疫缺陷模式动物则可避免异种间的免疫排斥问题。

因此,研发出人类SCID猪模型用于进行药物(特别是生物活性分子)筛选、药效检测、疾病病理、基因及细胞治疗等研究,能够为进一步的临床应用提供有效的实验数据,也为成功治疗人类SCID疾病提供有力的实验手段。

X连锁隐性遗传导致的SCID是最常见的一种类型,其致病突变为编码IL-2Rγ链的IL2RG基因发生突变,从而导致IL-2Rγ链功能发生障碍。而IL-2Rγ链也被称为共有γ链(common gamma chain),是IL-2、IL-4和IL-7等多种参与调控免疫细胞分化、发育、成熟过程的细胞因子受体与其相应配体结合后,向免疫细胞内部转导信号时所共同使用的信号转导分子。因此,共有γ链的功能障碍会导致免疫细胞的功能或发育异常,从而引发SCID。由IL2RG基因突变引发的SCID占50%-60%,另有10%的SCID发病是由于RAG基因突变所致的。RAG基因突变可影响VDJ区域重排,影响T细胞和B细胞分化,干扰抗原受体形成和免疫球蛋白表达。RAG1作为RAG复合物的催化剂成分,而RAG2虽不是催化剂,但参与目前已知RAG1催化过程。因此RAG1和RAG2均与SCID密切相关。

发明内容

本发明的目的是提供重症免疫缺陷猪源重组细胞及其制备方法。具体来说,本发明涉及IL2RG基因、RAG1基因和RAG2基因这三个基因联合敲除的重症免疫缺陷猪源重组细胞,以及用于制备该重组细胞的方法,以及用于制备该重组细胞的试剂盒。

本发明提供了一种试剂盒,包括特异sgRNA组合。

本发明还提供了一种试剂盒,包括特异质粒组合。所述试剂盒还包括质粒pKG-GE3。

本发明还保护特异sgRNA组合。

本发明还保护特异质粒组合。

以上任一所述特异sgRNA组合,由sgRNAIL2RG-g7、sgRNARAG1-g4和sgRNARAG2-g2组成。

以上任一所述质粒组合,由质粒pKG-U6gRNA(IL2RG-g7)、质粒pKG-U6gRNA(RAG1-g4)和质粒pKG-U6gRNA(RAG2-g2)组成。

本发明还保护以上任一所述sgRNA组合或以上任一所述质粒组合或以上任一所述试剂盒在制备重组细胞中的应用。所述重组细胞为猪重组细胞。所述重组细胞的转化受体细胞为猪细胞。所述猪细胞可为猪成纤维细胞。所述猪细胞具体可为猪原代成纤维细胞。所述猪具体可为从江香猪。

本发明还保护以上任一所述sgRNA组合或以上任一所述质粒组合或以上任一所述试剂盒在制备免疫缺陷动物模型中的应用。应用时,先制备所述重组细胞,然后将所述重组细胞作为供体细胞采用体细胞克隆技术得到克隆动物,即为免疫缺陷动物模型。还可以用免疫缺陷动物模型制备免疫缺陷细胞模型,即分离免疫缺陷动物模型的相应细胞,作为免疫缺陷细胞模型。所述动物具体可为猪。所述重组细胞为猪重组细胞。所述免疫缺陷动物模型为免疫缺陷猪模型。所述重组细胞的转化受体细胞为猪细胞。所述猪细胞可为猪成纤维细胞。所述猪细胞具体可为猪原代成纤维细胞。所述猪具体可为从江香猪。

本发明还保护一种制备重组细胞的方法,包括如下步骤:将质粒pKG-U6gRNA(IL2RG-g7)、质粒pKG-U6gRNA(RAG1-g4)、质粒pKG-U6gRNA(RAG2-g2)和质粒pKG-GE3共转染猪细胞,得到IL2RG基因、RAG1基因和RAG2基因均发生突变的重组细胞。所述猪细胞可为猪成纤维细胞。所述猪细胞具体可为猪原代成纤维细胞。所述猪具体可为从江香猪。

所述方法制备得到的重组细胞也属于本发明的保护范围。

以上任一所述重组细胞为IL2RG基因、RAG1基因和RAG2基因均缺陷的细胞。

以上任一所述重组细胞为IL2RG基因、RAG1基因和RAG2基因均发生突变的重组细胞。所述突变可为杂合突变(对应基因型为杂合突变型)或纯合突变(对应的基因型为双等位基因相同突变型或双等位基因不同突变型)。

具体来说,所述重组细胞可为如下任一:表1至表3中编号为2、16、19、26、37、48、55、58、64、66、75、79、80、83、85的单克隆细胞株。

本发明还保护所述重组细胞在制备免疫缺陷动物模型中的应用。制备免疫缺陷动物模型时,将所述重组细胞作为供体细胞采用体细胞克隆技术得到克隆动物,即为免疫缺陷动物模型。还可以用免疫缺陷动物模型制备免疫缺陷细胞模型,即分离免疫缺陷动物模型的相应细胞,作为免疫缺陷细胞模型。所述免疫缺陷动物模型为免疫缺陷猪模型。

本发明还保护所述sgRNA组合在制备试剂盒中的应用。

本发明还保护所述质粒组合在制备试剂盒中的应用。

本发明还保护所述质粒组合和质粒pKG-GE3在制备试剂盒中的应用。

以上任一所述试剂盒的用途为如下(a)或(b):(a)制备重组细胞;(b)制备免疫缺陷动物模型。制备免疫缺陷动物模型时,先制备所述重组细胞,然后将所述重组细胞作为供体细胞采用体细胞克隆技术得到克隆动物,即为免疫缺陷动物模型。还可以用免疫缺陷动物模型制备免疫缺陷细胞模型,即分离免疫缺陷动物模型的相应细胞,作为免疫缺陷细胞模型。所述动物具体可为猪。所述重组细胞为猪重组细胞。所述免疫缺陷动物模型为免疫缺陷猪模型。所述重组细胞的转化受体细胞为猪细胞。所述猪细胞可为猪成纤维细胞。所述猪细胞具体可为猪原代成纤维细胞。所述猪具体可为从江香猪。

sgRNAIL2RG-g7靶点:5’-TCCCTTCAGAGAATAGATAG-3’。

sgRNARAG1-g4靶点:5’-AGTTATGGCAGAACTCAGTG-3’。

sgRNARAG2-g2靶点:5’-GATAACAGTTGGTAATAACA-3’。

所述sgRNAIL2RG-g7的靶序列结合区如SEQ ID NO:24中第1-20位核苷酸所示。

所述sgRNARAG1-g4的靶序列结合区如SEQ ID NO:9中第1-20位核苷酸所示。

所述sgRNARAG2-g2的靶序列结合区如SEQ ID NO:13中第1-20位核苷酸所示。

所述sgRNAIL2RG-g7如SEQ ID NO:24所示。

所述sgRNARAG1-g4如SEQ ID NO:9所示。

所述sgRNARAG2-g2如SEQ ID NO:13所示。

所述质粒pKG-U6gRNA(IL2RG-g7)转录得到sgRNAIL2RG-g7

所述质粒pKG-U6gRNA(RAG1-g4)转录得到sgRNARAG1-g4

所述质粒pKG-U6gRNA(RAG2-g2)转录得到sgRNARAG2-g2

具体来说,所述质粒pKG-U6gRNA(IL2RG-g7)借助限制性内切酶BbsI将sgRNAIL2RG-g7的靶序列结合区的编码序列插入pKG-U6gRNA载体得到的。

具体来说,所述质粒pKG-U6gRNA(RAG1-g4)借助限制性内切酶BbsI将sgRNARAG1-g4的靶序列结合区的编码序列插入pKG-U6gRNA载体得到的。

具体来说。所述质粒pKG-U6gRNA(RAG2-g2)是借助限制性内切酶BbsI将sgRNARAG2-g2的靶序列结合区的编码序列插入pKG-U6gRNA载体得到的。

质粒pKG-GE3中,具有特异融合基因;所述特异融合基因编码特异融合蛋白;

所述特异融合蛋白自N端至C端依次包括如下元件:两个核定位信号(NLS)、Cas9蛋白、两个核定位信号、自剪切多肽P2A、荧光报告蛋白、自裂解多肽T2A、抗性筛选标记蛋白;

质粒pKG-GE3中,由EF1a启动子启动所述特异融合基因的表达;

质粒pKG-GE3中,所述特异融合基因下游具有WPRE序列元件、3’LTR序列元件和bGHpoly(A)signal序列元件。

质粒pKG-GE3中,依次具有如下元件:CMV增强子、EF1a启动子、所述特异融合基因、WPRE序列元件、3’LTR序列元件、bGH poly(A)signal序列元件。

所述特异融合蛋白中,Cas9蛋白上游的两个核定位信号为SV40核定位信号,Cas9蛋白下游的两个核定位信号为nucleoplasmin核定位信号。

所述特异融合蛋白中,荧光报告蛋白具体可为EGFP蛋白。

所述特异融合蛋白中,抗性筛选标记蛋白具体可为Puromycin蛋白。

自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”(发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)。

自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”(发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)。

特异融合基因具体如SEQ ID NO:2中第911-6706位核苷酸所示。

CMV增强子如SEQ ID NO:2中第395-680位核苷酸所示。

EF1a启动子如SEQ ID NO:2中第682-890位核苷酸所示。

WPRE序列元件如SEQ ID NO:2中第6722-7310位核苷酸所示。

3’LTR序列元件如SEQ ID NO:2中第7382-7615位核苷酸所示。

bGH poly(A)signal序列元件如SEQ ID NO:2中第7647-7871位核苷酸所示。

质粒pKG-GE3具体如SEQ ID NO:2所示。

质粒pKG-U6gRNA中,具有SEQ ID NO:3中第2280-2637位核苷酸所示的DNA分子。

质粒pKG-U6gRNA具体如SEQ ID NO:3所示。

猪IL2RG基因信息:编码interleukin 2receptor subunit gamma;位于X染色体;GeneID为397156,Sus scrofa。猪IL2RG基因编码的蛋白质如SEQ ID NO:16所示。基因组DNA中,猪IL2RG基因具有9个外显子,其中第4外显子及其上下游各500bp序列如SEQ ID NO:17所示。

猪RAG1基因信息:编码recombination-activating protein 1;位于2号染色体;GeneID为397506,Sus scrofa。猪RAG1基因编码的蛋白质如SEQ ID NO:4所示。基因组DNA中,猪RAG1基因具有2个外显子,其中第2外显子序列如SEQ ID NO:5所示。

猪RAG2基因信息:编码recombination-activating protein 2;位于2号染色体;GeneID为100151744,Sus scrofa。猪RAG2基因编码的蛋白质如SEQ ID NO:10所示。基因组DNA中,猪RAG2基因具有2个外显子,其中第2外显子及其上下游各500bp序列如SEQ ID NO:11所示。

以上任一所述免疫缺陷具体可为重症免疫缺陷。

本发明可用于通过基因编辑手段获得重症免疫缺陷猪模型,用于进行药物筛选、药效检测、疾病病理、基因治疗及细胞治疗等研究,能够为进一步的临床应用提供有效的实验数据,为今后治愈人类重症免疫缺陷打下坚实基础。

与现有技术相比,本发明至少具有如下有益效果:

(1)本发明研究对象(猪)比其他动物(大小鼠、灵长类)具有更好的应用性。目前未有任何大动物杜氏肌营养不良症疾病模型被成功研发。大小鼠等啮齿类动物不论从体型、器官大小、生理、病理等方面都与人相差巨大,无法真实地模拟人类正常的生理、病理状态。研究表明,95%以上在大小鼠中验证有效的药物在人类临床试验中是无效的。就大动物而言,灵长类是与人亲缘关系最近的动物,但其体型小、性成熟晚(6-7岁开始交配),且为单胎动物,群体扩繁速度极慢,饲养成本也很高。另外,灵长类动物克隆效率低、难度大、成本高。而猪作为模型动物就没有上述缺点,猪是除灵长类外与人亲缘关系最近的动物,其体型、体重、器官大小等与人相近,在解剖学、生理学、营养代谢、疾病发病机制等方面与人类极为相似。同时,猪的性成熟早(4-6个月),繁殖力高,一窝多胎,在2-3年内即可形成一个较大群体。另外,猪的克隆技术非常成熟,克隆及饲养成本较灵长类低得多;而且猪作为人类长期以来的肉食性动物,用猪作为疾病模型动物在动物保护和伦理等方面的阻力相对较小。

(2)采用本发明改造的cas9高效表达载体进行基因编辑,编辑效率比原载体显著提高。

本发明为重症免疫缺陷猪模型的制备奠定了坚实的基础,对于重症免疫缺陷药物的研发具有重大应用价值。

附图说明

图1为质粒pX330的结构示意图。

图2为质粒pKG-GE3的结构示意图。

图3为质粒pKG-U6gRNA的结构示意图。

图4为将20bp左右的DNA分子(用于转录形成gRNA的靶序列结合区)插入质粒pKG-U6gRNA的示意图。

图5为实施例2的步骤一中以8只猪的基因组DNA为模板采用IL2RG-GT-F4543/IL2RG-GT-R5180组成的引物对进行PCR扩增后的电泳图。

图6为实施例2的步骤三中各种具有粘性末端的双链DNA分子。

图7为实施例2的步骤四中的测序峰图。

图8为实施例3的步骤一中以8只猪的基因组DNA为模板采用RAG1-GT-F4699/RAG1-GT-R5306组成的引物对进行PCR扩增后的电泳图。

图9为实施例3的步骤三中各种具有粘性末端的双链DNA分子。

图10为实施例3的步骤四中的测序峰图。

图11为实施例4的步骤一中以8只猪的基因组DNA为模板采用RAG2-GT-F4181/RAG2-GT-R4927组成的引物对进行PCR扩增后的电泳图。

图12为实施例4的步骤三中各种具有粘性末端的双链DNA分子。

图13为实施例4的步骤四中的测序峰图。

图14为表1中部分单克隆细胞的靶基因测序峰图。

图15为表2中部分单克隆细胞的靶基因测序峰图。

图16为表3中部分单克隆细胞的靶基因测序峰图。

图17为实施例6的步骤三中MSTN三组的电泳图。

图18为实施例6的步骤三中FNDC5三组的电泳图。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。

下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。如无特殊说明,以下实施例中的定量试验,均设置三次重复实验,结果取平均值。完全培养液(%为体积比):15%胎牛血清(Gibco)+83%DMEM培养基(Gibco)+1%Penicillin-Streptomycin(Gibco)+1%HEPES(Solarbio)。细胞培养条件:37℃,5%CO2、5%O2的恒温培养箱。

实施例2至4中的8只猪均为刚出生从江香猪,其中雌性4只(分别命名1、2、3、4)、雄性4只(分别命名为A、B、C、D)。

制备猪原代成纤维细胞的方法:①取猪耳组织0.5g,除毛,然后用75﹪酒精浸泡30-40s,然后用含5%(体积比)Penicillin-Streptomycin(Gibco)的PBS缓冲液洗涤5次,然后用PBS缓冲液洗涤一次;②用剪刀将组织剪碎,采用5mL 1%胶原酶溶液(Sigma),37℃消化1h,然后500g离心5min,弃上清;③将沉淀用1mL完全培养液重悬,然后铺入含10mL完全培养基并已用0.2%明胶(VWR)封盘的直径为9cm的细胞培养皿中,培养至细胞长满皿底60%左右;④完成步骤③后,采用胰蛋白酶消化并收集细胞,使用细胞冻存液(90%完全培养基+10%DMSO,体积比)将细胞冻存。

用于实施例2至6中的猪原代成纤维细胞均获自上述命名为2的猪(雌性,血型AO)。

实施例1、质粒的制备

制备质粒pX330-U6-Chimeric_BB-CBh-hSpCas9,如SEQ ID NO:1所示。质粒pX330-U6-Chimeric_BB-CBh-hSpCas9,简称质粒pX330。

制备质粒pU6gRNA eEF1a-mNLS-hSpCas9-EGFP-PURO,如SEQ ID NO:2所示。质粒pU6gRNA eEF1a-mNLS-hSpCas9-EGFP-PURO,简称质粒pKG-GE3。

制备质粒pKG-U6gRNA,如SEQ ID NO:3所示。

质粒pX330、质粒pKG-GE3、质粒pKG-U6gRNA均为环形质粒。

质粒pX330的结构示意图见图1。SEQ ID NO:1中,第440-725位核苷酸组成CMV增强子,第727-1208位核苷酸组成chickenβ-actin启动子,第1304-1324位核苷酸编码SV40核定位信号(NLS),第1325-5449位核苷酸编码Cas9蛋白,第5450-5497位核苷酸编码nucleoplasmin核定位信号(NLS)。

质粒pKG-GE3的结构示意图见图2。SEQ ID NO:2中,第395-680位核苷酸组成CMV增强子,第682-890位核苷酸组成EF1a启动子,第986-1006位核苷酸编码核定位信号(NLS),第1016-1036位核苷酸编码核定位信号(NLS),第1037-5161位核苷酸编码Cas9蛋白,第5162-5209位核苷酸编码核定位信号(NLS),第5219-5266位核苷酸编码核定位信号(NLS),第5276-5332位核苷酸编码自剪切多肽P2A(自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”,发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间),第5333-6046位核苷酸编码EGFP蛋白,第6056-6109位核苷酸编码自裂解多肽T2A(自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”,发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间),第6110-6703位核苷酸编码Puromycin蛋白(简称Puro蛋白),第6722-7310位核苷酸组成WPRE序列元件,第7382-7615位核苷酸组成3’LTR序列元件,第7647-7871位核苷酸组成bGH poly(A)signal序列元件。SEQID NO:2中,第911-6706形成融合基因,表达融合蛋白。由于自剪切多肽P2A和自裂解多肽T2A的存在,融合蛋白自发形成如下三个蛋白:具有Cas9蛋白的蛋白、具有EGFP蛋白的蛋白和具有Puro蛋白的蛋白。

与质粒pX330相比,质粒pKG-GE3主要进行了如下改造:①去除残留的gRNA骨架序列(GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTTT),降低干扰;②将原有chickenβ-actin启动子改造为具更高表达活性的EF1a启动子,增加Cas9基因的蛋白表达能力;③在Cas9基因的上游和下游均增加核定位信号编码基因(NLS),增加Cas9蛋白的核定位能力;④原质粒无任何真核细胞筛选标记,不利于阳性转化细胞的筛选和富集,依次在Cas9基因的下游插入P2A-EGFP-T2A-PURO编码基因,赋予载体荧光和真核细胞抗性筛选能力;⑤插入WPRE元件和3’LTR序列元件,增强Cas9基因的蛋白翻译能力。

质粒pKG-U6gRNA的结构示意图见图3。SEQ ID NO:3中,第2280-2539位核苷酸组成hU6启动子,第2558-2637位核苷酸用于转录形成gRNA骨架。使用时,将20bp左右的DNA分子(用于转录形成gRNA的靶序列结合区)插入质粒pKG-U6gRNA,形成重组质粒,示意图见图4,在细胞中重组质粒转录得到gRNA。

实施例2、IL2RG基因敲除的靶点的筛选

一、IL2RG基因敲除预设靶点及邻近基因组序列保守性分析

猪IL2RG基因信息:编码interleukin 2receptor subunit gamma;位于X染色体;GeneID为397156,Sus scrofa。猪IL2RG基因编码的蛋白质如SEQ ID NO:16所示。基因组DNA中,猪IL2RG基因具有9个外显子,其中第4外显子及其上下游各500bp序列如SEQ ID NO:17所示。

分别以8只猪的基因组DNA为模板,采用引物IL2RG-GT-F4543/IL2RG-GT-R5180组成的引物对进行PCR扩增,然后进行电泳,见图5。回收PCR扩增产物并进行测序,将测序结果与公共数据库中的IL2RG基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:IL2RG-nF33/IL2RG-nR460。

IL2RG-GT-F4543:5’-ATATAGCACAGGGGAGGGAGGAA-3’;

IL2RG-GT-R5180:5’-AGGGTGCGAAGGGTCAGATTC-3’;

IL2RG-nF33:5’-CCCAGGCTTCCCACTATATTCTC-3’;

IL2RG-nR460:5’-CCATTGGATCCCTCACTTCTTCT-3’。

二、筛选靶点

通过筛选NGG(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到9个靶点。

9个靶点分别如下:

sgRNAIL2RG-g1靶点:5’-CCTGTAGTTTTAGCGTCTGT-3’;

sgRNAIL2RG-g2靶点:5’-CAACAAATGTTTGGTAGAGG-3’;

sgRNAIL2RG-g3靶点:5’-GATGATAAAGTCCAGGAGTG-3’;

sgRNAIL2RG-g4靶点:5’-CTGGACTTTATCATCATTAG-3’;

sgRNAIL2RG-g5靶点:5’-TTGTCCAGCTCCAGGACCCA-3’;

sgRNAIL2RG-g6靶点:5’-GGCCACTATCTATTCTCTGA-3’;

sgRNAIL2RG-g7靶点:5’-TCCCTTCAGAGAATAGATAG-3’;

sgRNAIL2RG-g8靶点:5’-AACATTTGTTGTCCAGCTCC-3’;

sgRNAIL2RG-g9靶点:5’-TGTCCAGCTCCAGGACCCAC-3’。

三、制备重组质粒

取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。

分别合成IL2RG-g1S和IL2RG-g1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6A)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g1)。质粒pKG-U6gRNA(IL2RG-g1)表达SEQ ID NO:18所示的sgRNAIL2RG-g1

SEQ ID NO:18:

CCUGUAGUUUUAGCGUCUGUguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成IL2RG-g2S和IL2RG-g2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6B)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g2)。质粒pKG-U6gRNA(IL2RG-g2)表达SEQ ID NO:19所示的sgRNAIL2RG-g2

SEQ ID NO:19:

CAACAAAUGUUUGGUAGAGGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成IL2RG-g3S和IL2RG-g3A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6C)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g3)。质粒pKG-U6gRNA(IL2RG-g3)表达SEQ ID NO:20所示的sgRNAIL2RG-g3

SEQ ID NO:20:

GAUGAUAAAGUCCAGGAGUGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成IL2RG-g4S和IL2RG-g4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6D)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g4)。质粒pKG-U6gRNA(IL2RG-g4)表达SEQ ID NO:21所示的sgRNAIL2RG-g4

SEQ ID NO:21:

CUGGACUUUAUCAUCAUUAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成IL2RG-g5S和IL2RG-g5A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6E)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g5)。质粒pKG-U6gRNA(IL2RG-g5)表达SEQ ID NO:22所示的sgRNAIL2RG-g5

SEQ ID NO:22:

UUGUCCAGCUCCAGGACCCAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成IL2RG-g6S和IL2RG-g6A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6F)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g6)。质粒pKG-U6gRNA(IL2RG-g6)表达SEQ ID NO:23所示的sgRNAIL2RG-g6

SEQ ID NO:23:

GGCCACUAUCUAUUCUCUGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成IL2RG-g7S和IL2RG-g7A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6G)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g7)。质粒pKG-U6gRNA(IL2RG-g7)表达SEQ ID NO:24所示的sgRNAIL2RG-g7

SEQ ID NO:24:

UCCCUUCAGAGAAUAGAUAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成IL2RG-g8S和IL2RG-g8A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6H)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g8)。质粒pKG-U6gRNA(IL2RG-g8)表达SEQ ID NO:25所示的sgRNAIL2RG-g8

SEQ ID NO:25:

AACAUUUGUUGUCCAGCUCCguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成IL2RG-g9S和IL2RG-g9A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图6I)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(IL2RG-g9)。质粒pKG-U6gRNA(IL2RG-g9)表达SEQ ID NO:26所示的sgRNAIL2RG-g9

SEQ ID NO:26:

UGUCCAGCUCCAGGACCCACguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

sgRNA-IL2RG-1S:5’-caccgCCTGTAGTTTTAGCGTCTGT-3’;

sgRNA-IL2RG-1A:5’-aaacACAGACGCTAAAACTACAGGc-3’。

sgRNA-IL2RG-2S:5’-caccgCAACAAATGTTTGGTAGAGG-3’;

sgRNA-IL2RG-2A:5’-aaacCCTCTACCAAACATTTGTTGc-3’。

sgRNA-IL2RG-3S:5’-caccGATGATAAAGTCCAGGAGTG-3’;

sgRNA-IL2RG-3A:5’-aaacCACTCCTGGACTTTATCATC-3’。

sgRNA-IL2RG-4S:5’-caccgCTGGACTTTATCATCATTAG-3’;

sgRNA-IL2RG-4A:5’-aaacCTAATGATGATAAAGTCCAGc-3’。

sgRNA-IL2RG-5S:5’-caccgTTGTCCAGCTCCAGGACCCA-3’;

sgRNA-IL2RG-5A:5’-aaacTGGGTCCTGGAGCTGGACAAc-3’。

sgRNA-IL2RG-6S:5’-caccgGGCCACTATCTATTCTCTGA-3’;

sgRNA-IL2RG-6A:5’-aaacTCAGAGAATAGATAGTGGCCc-3’。

sgRNA-IL2RG-7S:5’-caccgTCCCTTCAGAGAATAGATAG-3’;

sgRNA-IL2RG-7A:5’-aaacCTATCTATTCTCTGAAGGGAc-3’。

sgRNA-IL2RG-8S:5’-caccgAACATTTGTTGTCCAGCTCC-3’;

sgRNA-IL2RG-8A:5’-aaacGGAGCTGGACAACAAATGTTc-3’。

sgRNA-IL2RG-9S:5’-caccgTGTCCAGCTCCAGGACCCAC-3’;

sgRNA-IL2RG-9A:5’-aaacGTGGGTCCTGGAGCTGGACAc-3’。

sgRNA-IL2RG-1S、sgRNA-IL2RG-1A、sgRNA-IL2RG-2S、sgRNA-IL2RG-2A、sgRNA-IL2RG-3S、sgRNA-IL2RG-3A、sgRNA-IL2RG-4S、sgRNA-IL2RG-4A、sgRNA-IL2RG-5S、sgRNA-IL2RG-5A、sgRNA-IL2RG-6S、sgRNA-IL2RG-6A、sgRNA-IL2RG-7S、sgRNA-IL2RG-7A、sgRNA-IL2RG-8S、sgRNA-IL2RG-8A、sgRNA-IL2RG-9S、sgRNA-IL2RG-9A均为单链DNA分子。

四、不同靶点的编辑效率比较

1、共转染

第一组:将质粒pKG-U6gRNA(IL2RG-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g1):1.238μg质粒pKG-GE3。

第二组:将质粒pKG-U6gRNA(IL2RG-g2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g2):1.238μg质粒pKG-GE3。

第三组:将质粒pKG-U6gRNA(IL2RG-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g3):1.238μg质粒pKG-GE3。

第四组:将质粒pKG-U6gRNA(IL2RG-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g4):1.238μg质粒pKG-GE3。

第五组:将质粒pKG-U6gRNA(IL2RG-g5)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g5):1.238μg质粒pKG-GE3。

第六组:将质粒pKG-U6gRNA(IL2RG-g6)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g6):1.238μg质粒pKG-GE3。

第七组:将质粒pKG-U6gRNA(IL2RG-g7)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g7):1.238μg质粒pKG-GE3。

第八组:将质粒pKG-U6gRNA(IL2RG-g8)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g8):1.238μg质粒pKG-GE3。

第九组:将质粒pKG-U6gRNA(IL2RG-g9)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(IL2RG-g9):1.238μg质粒pKG-GE3。

第十组:猪原代成纤维细胞,未进行任何转染操作。

共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。

2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。

3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用IL2RG-nF33和IL2RG-nR460组成的引物对进行PCR扩增,然后进行电泳并测序,结果见图7。

通过利用Synthego ICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第十组不同靶点的编辑效率依次为1%、0%、3%、5%、0%、46%、65%、18%、34%和0%。结果表明,第七组编辑效率最高,sgRNAIL2RG-g7为最优靶点。

实施例3、RAG1基因敲除的靶点的筛选

一、RAG1基因敲除预设靶点及邻近基因组序列保守性分析

猪RAG1基因信息:编码recombination-activating protein 1;位于2号染色体;GeneID为397506,Sus scrofa。猪RAG1基因编码的蛋白质如SEQ ID NO:4所示。基因组DNA中,猪RAG1基因具有2个外显子,其中第2外显子序列如SEQ ID NO:5所示。

分别以8只猪的基因组DNA为模板,采用引物RAG1-GT-F4699/RAG1-GT-R5306组成的引物对进行PCR扩增,然后进行电泳,见图8。回收PCR扩增产物并进行测序,将测序结果与公共数据库中的RAG1基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:RAG1-nF126/RAG1-nR525。

RAG1-GT-F4699:5’-CACCTGAAAAGGCTCAAACGGAA-3’;

RAG1-GT-R5306:5’-CGCTCGGTCAATCACAGTTTTGA-3’;

RAG1-nF126:5’-CCCCATCCAAAGTTTTTAAAGGA-3’;

RAG1-nR525:5’-TGTGGCAGATGTCACAGTTTAGG-3’。

二、筛选靶点

通过筛选NGG(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。

4个靶点分别如下:

sgRNARAG1-g1靶点:5’-GGGAATTCTTTCAACACCAC-3’;

sgRNARAG1-g2靶点:5’-AGAGAAGGTATCCAGTCCAC-3’;

sgRNARAG1-g3靶点:5’-AATGAGGTCTGGCCAGGACG-3’;

sgRNARAG1-g4靶点:5’-AGTTATGGCAGAACTCAGTG-3’。

三、制备重组质粒

取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。

分别合成RAG1-g1S和RAG1-g1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图9A)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG1-g1)。质粒pKG-U6gRNA(RAG1-g1)表达SEQ ID NO:6所示的sgRNARAG1-g1

SEQ ID NO:6:

GGGAAUUCUUUCAACACCACguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成RAG1-g2S和RAG1-g2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图9B)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG1-g2)。质粒pKG-U6gRNA(RAG1-g2)表达SEQ ID NO:7所示的sgRNARAG1-g2

SEQ ID NO:7:

AGAGAAGGUAUCCAGUCCACguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成RAG1-g3S和RAG1-g3A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图9C)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG1-g3)。质粒pKG-U6gRNA(RAG1-g3)表达SEQ ID NO:8所示的sgRNARAG1-g3

SEQ ID NO:8:

AAUGAGGUCUGGCCAGGACGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成RAG1-g4S和RAG1-g4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图9D)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG1-g4)。质粒pKG-U6gRNA(RAG1-g4)表达SEQ ID NO:9所示的sgRNARAG1-g4

SEQ ID NO:9:

AGUUAUGGCAGAACUCAGUGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

sgRNA-RAG1-1S:5’-caccGGGAATTCTTTCAACACCAC-3’;

sgRNA-RAG1-1A:5’-aaacGTGGTGTTGAAAGAATTCCc-3’。

sgRNA-RAG1-2S:5’-caccgAGAGAAGGTATCCAGTCCAC-3’;

sgRNA-RAG1-2A:5’-aaacGTGGACTGGATACCTTCTCTc-3’。

sgRNA-RAG1-3S:5’-caccgAATGAGGTCTGGCCAGGACG-3’;

sgRNA-RAG1-3A:5’-aaacCGTCCTGGCCAGACCTCATTc-3’。

sgRNA-RAG1-4S:5’-caccgAGTTATGGCAGAACTCAGTG-3’;

sgRNA-RAG1-4A:5’-aaacCACTGAGTTCTGCCATAACTc-3’。

sgRNA-RAG1-1S、sgRNA-RAG1-1A、sgRNA-RAG1-2S、sgRNA-RAG1-2A、sgRNA-RAG1-3S、sgRNA-RAG1-3A、sgRNA-RAG1-4S、sgRNA-RAG1-4A均为单链DNA分子。

四、不同靶点的编辑效率比较

1、共转染

第一组:将质粒pKG-U6gRNA(RAG1-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(RAG1-g1):1.238μg质粒pKG-GE3。

第二组:将质粒pKG-U6gRNA(RAG1-g2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(RAG1-g2):1.238μg质粒pKG-GE3。

第三组:将质粒pKG-U6gRNA(RAG1-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(RAG1-g3):1.238μg质粒pKG-GE3。

第四组:将质粒pKG-U6gRNA(RAG1-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(RAG1-g4):1.238μg质粒pKG-GE3。

第五组:猪原代成纤维细胞,未进行任何转染操作。

共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。

2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。

3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用RAG1-nF126和RAG1-nR525组成的引物对进行PCR扩增,然后进行电泳并测序,结果见图10。

通过利用Synthego ICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组的编辑效率依次为51%、56%、52%、77%和0%。结果表明,第四组编辑效率最高,sgRNARAG1-g4为最优靶点。

实施例4、RAG2基因敲除的靶点的筛选

一、RAG2基因敲除预设靶点及邻近基因组序列保守性分析

猪RAG2基因信息:编码recombination-activating protein 2;位于2号染色体;

GeneID为100151744,Sus scrofa。猪RAG2基因编码的蛋白质如SEQ ID NO:10所示。基因组DNA中,猪RAG2基因具有2个外显子,其中第2外显子及其上下游各500bp序列如SEQ ID NO:11所示。

分别以8只猪的基因组DNA为模板,采用引物RAG2-GT-F4181/RAG2-GT-R4927组成的引物对进行PCR扩增,然后进行电泳,见图11。回收PCR扩增产物并进行测序,将测序结果与公共数据库中的RAG2基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:RAG2-nF138/RAG2-nR600。

RAG2-GT-F4181:5’-CCACGTCTTAAACTTGTCCCAGC-3’;

RAG2-GT-R4927:5’-TGAGCAGAAGGGATGTATGACCG-3’;

RAG2-nnF138:5’-GGCTTTTTATGTGTGAGGGATCT-3’;

RAG2-nnR600:5’-TTGTTCTTGCAAACCACAGACAT-3’。

二、筛选靶点

通过筛选NGG(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。

4个靶点分别如下:

sgRNARAG2-g1靶点:5’-TCACTACAGATGATAACAGT-3’;

sgRNARAG2-g2靶点:5’-GATAACAGTTGGTAATAACA-3’;

sgRNARAG2-g3靶点:5’-GTGCAGGCTTCAGTTTGAGA-3’;

sgRNARAG2-g4靶点:5’-CAAGTGGCTGGGTAGCGGAG-3’。

三、制备重组质粒

取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。

分别合成RAG2-g1S和RAG2-g1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图12A)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG2-g1)。质粒pKG-U6gRNA(RAG2-g1)表达SEQ ID NO:12所示的sgRNARAG2-g1

SEQ ID NO:12:

UCACUACAGAUGAUAACAGUguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成RAG2-g2S和RAG2-g2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图12B)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG2-g2)。质粒pKG-U6gRNA(RAG2-g2)表达SEQ ID NO:13所示的sgRNARAG2-g2

SEQ ID NO:13:

GAUAACAGUUGGUAAUAACAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成RAG2-g3S和RAG2-g3A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图12C)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG2-g3)。质粒pKG-U6gRNA(RAG2-g3)表达SEQ ID NO:14所示的sgRNARAG2-g3

SEQ ID NO:14:

GUGCAGGCUUCAGUUUGAGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

分别合成RAG2-g4S和RAG2-g4A,然后混合并进行退火,得到具有粘性末端的双链DNA分子(图12D)。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(RAG2-g4)。质粒pKG-U6gRNA(RAG2-g4)表达SEQ ID NO:15所示的sgRNARAG2-g4

SEQ ID NO:15:

CAAGUGGCUGGGUAGCGGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu

sgRNA-RAG2-1S:5’-caccgTCACTACAGATGATAACAGT-3’;

sgRNA-RAG2-1A:5’-aaacACTGTTATCATCTGTAGTGAc-3’。

sgRNA-RAG2-2S:5’-caccGATAACAGTTGGTAATAACA-3’;

sgRNA-RAG2-2A:5’-aaacTGTTATTACCAACTGTTATC-3’。

sgRNA-RAG2-3S:5’-caccGTGCAGGCTTCAGTTTGAGA-3’;

sgRNA-RAG2-3A:5’-aaacTCTCAAACTGAAGCCTGCAC-3’。

sgRNA-RAG2-4S:5’-caccgCAAGTGGCTGGGTAGCGGAG-3’;

sgRNA-RAG2-4A:5’-aaacCTCCGCTACCCAGCCACTTGc-3’。

sgRNA-RAG2-1S、sgRNA-RAG2-1A、sgRNA-RAG2-2S、sgRNA-RAG2-2A、sgRNA-RAG2-3S、sgRNA-RAG2-3A、sgRNA-RAG2-4S、sgRNA-RAG2-4A均为单链DNA分子。

四、不同靶点的编辑效率比较

1、共转染

第一组:将质粒pKG-U6gRNA(RAG2-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(RAG2-g1):1.238μg质粒pKG-GE3。

第二组:将质粒pKG-U6gRNA(RAG2-g2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(RAG2-g2):1.238μg质粒pKG-GE3。

第三组:将质粒pKG-U6gRNA(RAG2-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(RAG2-g3):1.238μg质粒pKG-GE3。

第四组:将质粒pKG-U6gRNA(RAG2-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.762μg质粒pKG-U6gRNA(RAG2-g4):1.238μg质粒pKG-GE3。

第五组:猪原代成纤维细胞,未进行任何转染操作。

共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。

2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。

3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用RAG2-nF138和RAG2-nR600组成的引物对进行PCR扩增,然后进行电泳并测序,结果见图13。

通过利用Synthego ICE工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组不同靶点的编辑效率依次为66%、69%、34%、50%和0%。结果表明,第二组编辑效率最高,sgRNARAG2-g2为最优靶点。

实施例5、制备IL2RG、RAG1和RAG2基因编辑单克隆细胞

1、共转染

将质粒pKG-U6gRNA(IL2RG-g7)、质粒pKG-U6gRNA(RAG1-g4)、质粒pKG-U6gRNA(RAG2-g2)、和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.38μg质粒pKG-U6gRNA(IL2RG-g7):0.38μg质粒pKG-U6gRNA(RAG1-g4):0.38μg质粒pKG-U6gRNA(RAG2-g2):1.86μg质粒pKG-GE3。

共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。

2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。

3、完成步骤2后,采用胰蛋白酶消化并收集细胞,然后用完全培养液洗涤,然后用完全培养液重悬,然后分别挑取各个单克隆转移到96孔板中(每个孔1个细胞,每个孔中装有200μl完全培养液),培养2周(每2-3天更换新的完全培养液)。

4、完成步骤3后,采用胰蛋白酶消化并收集细胞(每孔得到的细胞,约2/3接种到装有完全培养液的6孔板中,剩余的1/3收集在1.5mL离心管中)。

5、取步骤4的6孔板,培养直至细胞长至50%丰满度,采用胰蛋白酶消化并收集细胞,使用细胞冻存液(90%完全培养基+10%DMSO,体积比)将细胞冻存。

6、取步骤4的离心管,取细胞,提取基因组DNA,进行PCR扩增(分别采用IL2RG-nF33和IL2RG-nR460组成的引物对、RAG1-nF126和RAG1-nR525组成的引物对、RAG2-nF138和RAG2-nR600组成的引物对),然后进行电泳。将猪原代成纤维细胞作为野生型对照。

7、完成步骤6后,回收PCR扩增产物并测序。

猪原代成纤维细胞的测序结果只有一种,其基因型为纯合野生型。如果某一单克隆细胞的测序结果有两种,一种与猪原代成纤维细胞的测序结果一致,另一种与猪原代成纤维细胞的测序结果相比发生了突变(突变包括一个或多个核苷酸的缺失、插入或替换),该单克隆细胞的基因型为杂合型;如果某一单克隆细胞的测序结果为两种,均与猪原代成纤维细胞的测序结果相比发生了突变(突变包括一个或多个核苷酸的缺失、插入或替换),该单克隆细胞的基因型为双等位基因不同突变型;如果某一单克隆细胞的测序结果为一种,且与猪原代成纤维细胞的测序结果相比发生了突变(突变包括一个或多个核苷酸的缺失、插入或替换),该单克隆细胞的基因型为双等位基因相同突变型;如果某一单克隆细胞的测序结果为一种,且与猪原代成纤维细胞的测序结果一致,该单克隆细胞的基因型为纯合野生型。

IL2RG基因的编辑结果见表1。编号为26、58、64、75、83、85的单克隆细胞的基因型为双等位基因相同突变型。编号为16、48、79的单克隆细胞的基因型为双等位基因不同突变型。编号为66的单克隆细胞的基因型为杂合型。编号为2、6、19、27、30、37、42、55、80的单克隆细胞均显示为复杂的套峰,因此未能获得有效的序列,不能确定基因型和具体形式,但可以判断发生了基因编辑。得到的IL2RG基因编辑单克隆细胞的比率为19/92。示例性的IL2RG的测序峰图见图14。

表1采用IL2RG-nF33和IL2RG-nR460组成的引物对检测IL2RG基因

RAG1基因的编辑结果见表2。编号为6、12、19、26、27、32、37、58、64、66、81、85的单克隆细胞的基因型为双等位基因相同突变型。编号为2、16、48、75、79、80、83的单克隆细胞的基因型为双等位基因不同突变型。编号为47的单克隆细胞的基因型为杂合型。编号为5、22、30、31、41、55、73的单克隆细胞均显示为复杂的套峰,因此未能获得有效的序列,不能确定基因型和具体形式,但可以判断发生了基因编辑。得到的RAG1基因编辑单克隆细胞的比率为27/92。示例性的RAG1的测序峰图见图15。

表2采用RAG1-nF126和RAG1-nR525组成的引物对检测RAG1基因

RAG2基因的编辑结果见表3。编号为16、19、26、37、48、64、66、75、79、85的单克隆细胞的基因型为双等位基因相同突变型。编号为2、80、83的单克隆细胞的基因型为双等位基因不同突变型。编号为5、73的单克隆细胞的基因型为杂合型。编号为55、58、61的单克隆细胞均显示为复杂的套峰,因此未能获得有效的序列,不能确定基因型和具体形式,但可以判断发生了基因编辑。得到的RAG2基因编辑单克隆细胞的比率为18/92。示例性的RAG2的测序峰图见图16。

表3采用RAG2-nF138和RAG2-nR600组成的引物对检测RAG2基因

通过分析,编号为2、16、19、26、37、48、55、58、64、66、75、79、80、83、85的单克隆细胞为IL2RG、RAG1和RAG2基因同时敲除的单克隆细胞。

实施例6、质粒pX330和质粒pKG-GE3的效果比较

选择位于MSTN基因的两个gRNA靶点:

MSTN-gRNA1的靶点:5’-GCTGATTGTTGCTGGTCCCG-3’;

MSTN-gRNA2的靶点:5’-TTTCCAGGCGAAGTTTACTG-3’。

选择位于FNDC5基因的两个gRNA靶点:

FNDC5-gRNA1的靶点:5’-TGTACTCAGTGTCCTCCTCC-3’;

FNDC5-gRNA2的靶点:5’-GCTCTTCAAGACGCCTCGCG-3’。

用于扩增包含靶点的片段的引物为:

MSTN-F896:5’-TCTCTCAGACAGTGCAGGCATTA-3’;

MSTN-R1351:5’-CGTTTCCGTCGTAGCGTGATAAT-3’。

FNDC5-F209:5’-CAGTTCTCACTTGATGGCCTTGG-3’;

FNDC5-R718:5’-AGGGGTCTGGGGAGGAATGG-3’。

一、制备重组质粒

取质粒pKG-U6gRNA,用限制性内切酶BbsI进行酶切,回收载体骨架(约3kb的线性大片段)。

分别合成MSTN-1S和MSTN-1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(MSTN-1)。

分别合成MSTN-2S和MSTN-2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(MSTN-2)。

分别合成FNDC5-1S和FNDC5-1A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(FNDC5-1)。

分别合成FNDC5-2S和FNDC5-2A,然后混合并进行退火,得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接,得到质粒pKG-U6gRNA(FNDC5-2)。

MSTN-1S:5’-caccGCTGATTGTTGCTGGTCCCG-3’;

MSTN-1A:5’-aaacCGGGACCAGCAACAATCAGC-3’。

MSTN-2S:5’-caccgTTTCCAGGCGAAGTTTACTG-3’;

MSTN-2A:5’-aaacCAGTAAACTTCGCCTGGAAAc-3’。

FNDC5-1S:5’-caccgTGTACTCAGTGTCCTCCTCC-3’;

FNDC5-1A:5’-aaacGGAGGAGGACACTGAGTACAc-3’。

FNDC5-2S:5’-caccGCTCTTCAAGACGCCTCGCG-3’;

FNDC5-2A:5’-aaacCGCGAGGCGTCTTGAAGAGC-3’。

二、质粒pX330和质粒pKG-GE3的效果比较

1、共转染

MSTN-B组:将质粒pKG-U6gRNA(MSTN-1)和质粒pKG-U6gRNA(MSTN-2)共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.46μg质粒pKG-U6gRNA(MSTN-1):0.46μg质粒pKG-U6gRNA(MSTN-2)。

MSTN-330组:将质粒pKG-U6gRNA(MSTN-1)、质粒pKG-U6gRNA(MSTN-2)和质粒pX330共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.46μg质粒pKG-U6gRNA(MSTN-1):0.46μg质粒pKG-U6gRNA(MSTN-2):1.08μg质粒pX330。

MSTN-KG组:将质粒pKG-U6gRNA(MSTN-1)、质粒pKG-U6gRNA(MSTN-2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.46μg质粒pKG-U6gRNA(MSTN-1):质粒0.46μg pKG-U6gRNA(MSTN-2):1.08μg质粒pKG-GE3。

FNDC5-B组:将质粒pKG-U6gRNA(FNDC5-1)和质粒pKG-U6gRNA(FNDC5-2)共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.46μg质粒pKG-U6gRNA(FNDC5-1):0.46μg质粒pKG-U6gRNA(FNDC5-2)。

FNDC5-330组:将质粒pKG-U6gRNA(FNDC5-1)、质粒pKG-U6gRNA(FNDC5-2)和质粒pX330共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.46μg质粒pKG-U6gRNA(FNDC5-1):0.46μg质粒pKG-U6gRNA(FNDC5-2):1.08μg质粒pX330。

FNDC5-KG组:将质粒pKG-U6gRNA(FNDC5-1)、质粒pKG-U6gRNA(FNDC5-2)和质粒pKG-GE3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.46μg质粒pKG-U6gRNA(FNDC5-1):0.46μg质粒pKG-U6gRNA(FNDC5-2):1.08μg质粒pKG-GE3。

共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为:1450V、10ms、3pulse)。

2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。

3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组DNA,采用MSTN-F896和MSTN-R1351组成的引物对(MSTN的三组)进行PCR扩增,或者采用FNDC5-F209和FNDC5-R718组成的引物对(FNDC5的三组)进行PCR扩增,然后进行电泳。

MSTN的三组的结果见图17。

FNDC5的三组的结果见图18。

MSTN-330组基因缺失突变效率为27.6%,MSTN-KG组基因缺失突变效率为86.5%。FNDC5-330组基因缺失突变效率为18.6%,FNDC5-KG组基因缺失突变效率为81.7%。结果表明,与采用质粒pX330相比,采用质粒pKG-GE3使得基因编辑效率显著提高。

以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。

SEQUENCE LISTING

<110> 南京启真基因工程有限公司

<120> 重症免疫缺陷猪源重组细胞及其制备方法和试剂盒

<130> GNCYX202100

<160> 26

<170> PatentIn version 3.5

<210> 1

<211> 8484

<212> DNA

<213> Artificial sequence

<400> 1

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300

gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360

agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420

aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480

ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540

aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600

caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660

acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720

ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780

ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840

ggggggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 900

agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 960

aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgcgctg ccttcgcccc gtgccccgct 1020

ccgccgccgc ctcgcgccgc ccgccccggc tctgactgac cgcgttactc ccacaggtga 1080

gcgggcggga cggcccttct cctccgggct gtaattagct gagcaagagg taagggttta 1140

agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 1200

ctttttttca ggttggaccg gtgccaccat ggactataag gaccacgacg gagactacaa 1260

ggatcatgat attgattaca aagacgatga cgataagatg gccccaaaga agaagcggaa 1320

ggtcggtatc cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg 1380

caccaactct gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt 1440

caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct 1500

gttcgacagc ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata 1560

caccagacgg aagaaccgga tctgctatct gcaagagatc ttcagcaacg agatggccaa 1620

ggtggacgac agcttcttcc acagactgga agagtccttc ctggtggaag aggataagaa 1680

gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc acgagaagta 1740

ccccaccatc taccacctga gaaagaaact ggtggacagc accgacaagg ccgacctgcg 1800

gctgatctat ctggccctgg cccacatgat caagttccgg ggccacttcc tgatcgaggg 1860

cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg tgcagaccta 1920

caaccagctg ttcgaggaaa accccatcaa cgccagcggc gtggacgcca aggccatcct 1980

gtctgccaga ctgagcaaga gcagacggct ggaaaatctg atcgcccagc tgcccggcga 2040

gaagaagaat ggcctgttcg gaaacctgat tgccctgagc ctgggcctga cccccaactt 2100

caagagcaac ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg acacctacga 2160

cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc tgtttctggc 2220

cgccaagaac ctgtccgacg ccatcctgct gagcgacatc ctgagagtga acaccgagat 2280

caccaaggcc cccctgagcg cctctatgat caagagatac gacgagcacc accaggacct 2340

gaccctgctg aaagctctcg tgcggcagca gctgcctgag aagtacaaag agattttctt 2400

cgaccagagc aagaacggct acgccggcta cattgacggc ggagccagcc aggaagagtt 2460

ctacaagttc atcaagccca tcctggaaaa gatggacggc accgaggaac tgctcgtgaa 2520

gctgaacaga gaggacctgc tgcggaagca gcggaccttc gacaacggca gcatccccca 2580

ccagatccac ctgggagagc tgcacgccat tctgcggcgg caggaagatt tttacccatt 2640

cctgaaggac aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc cctactacgt 2700

gggccctctg gccaggggaa acagcagatt cgcctggatg accagaaaga gcgaggaaac 2760

catcaccccc tggaacttcg aggaagtggt ggacaagggc gcttccgccc agagcttcat 2820

cgagcggatg accaacttcg ataagaacct gcccaacgag aaggtgctgc ccaagcacag 2880

cctgctgtac gagtacttca ccgtgtataa cgagctgacc aaagtgaaat acgtgaccga 2940

gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg tggacctgct 3000

gttcaagacc aaccggaaag tgaccgtgaa gcagctgaaa gaggactact tcaagaaaat 3060

cgagtgcttc gactccgtgg aaatctccgg cgtggaagat cggttcaacg cctccctggg 3120

cacataccac gatctgctga aaattatcaa ggacaaggac ttcctggaca atgaggaaaa 3180

cgaggacatt ctggaagata tcgtgctgac cctgacactg tttgaggaca gagagatgat 3240

cgaggaacgg ctgaaaacct atgcccacct gttcgacgac aaagtgatga agcagctgaa 3300

gcggcggaga tacaccggct ggggcaggct gagccggaag ctgatcaacg gcatccggga 3360

caagcagtcc ggcaagacaa tcctggattt cctgaagtcc gacggcttcg ccaacagaaa 3420

cttcatgcag ctgatccacg acgacagcct gacctttaaa gaggacatcc agaaagccca 3480

ggtgtccggc cagggcgata gcctgcacga gcacattgcc aatctggccg gcagccccgc 3540

cattaagaag ggcatcctgc agacagtgaa ggtggtggac gagctcgtga aagtgatggg 3600

ccggcacaag cccgagaaca tcgtgatcga aatggccaga gagaaccaga ccacccagaa 3660

gggacagaag aacagccgcg agagaatgaa gcggatcgaa gagggcatca aagagctggg 3720

cagccagatc ctgaaagaac accccgtgga aaacacccag ctgcagaacg agaagctgta 3780

cctgtactac ctgcagaatg ggcgggatat gtacgtggac caggaactgg acatcaaccg 3840

gctgtccgac tacgatgtgg accatatcgt gcctcagagc tttctgaagg acgactccat 3900

cgacaacaag gtgctgacca gaagcgacaa gaaccggggc aagagcgaca acgtgccctc 3960

cgaagaggtc gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg ccaagctgat 4020

tacccagaga aagttcgaca atctgaccaa ggccgagaga ggcggcctga gcgaactgga 4080

taaggccggc ttcatcaaga gacagctggt ggaaacccgg cagatcacaa agcacgtggc 4140

acagatcctg gactcccgga tgaacactaa gtacgacgag aatgacaagc tgatccggga 4200

agtgaaagtg atcaccctga agtccaagct ggtgtccgat ttccggaagg atttccagtt 4260

ttacaaagtg cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt 4320

cgtgggaacc gccctgatca aaaagtaccc taagctggaa agcgagttcg tgtacggcga 4380

ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa tcggcaaggc 4440

taccgccaag tacttcttct acagcaacat catgaacttt ttcaagaccg agattaccct 4500

ggccaacggc gagatccgga agcggcctct gatcgagaca aacggcgaaa ccggggagat 4560

cgtgtgggat aagggccggg attttgccac cgtgcggaaa gtgctgagca tgccccaagt 4620

gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc agcaaagagt ctatcctgcc 4680

caagaggaac agcgataagc tgatcgccag aaagaaggac tgggacccta agaagtacgg 4740

cggcttcgac agccccaccg tggcctattc tgtgctggtg gtggccaaag tggaaaaggg 4800

caagtccaag aaactgaaga gtgtgaaaga gctgctgggg atcaccatca tggaaagaag 4860

cagcttcgag aagaatccca tcgactttct ggaagccaag ggctacaaag aagtgaaaaa 4920

ggacctgatc atcaagctgc ctaagtactc cctgttcgag ctggaaaacg gccggaagag 4980

aatgctggcc tctgccggcg aactgcagaa gggaaacgaa ctggccctgc cctccaaata 5040

tgtgaacttc ctgtacctgg ccagccacta tgagaagctg aagggctccc ccgaggataa 5100

tgagcagaaa cagctgtttg tggaacagca caagcactac ctggacgaga tcatcgagca 5160

gatcagcgag ttctccaaga gagtgatcct ggccgacgct aatctggaca aagtgctgtc 5220

cgcctacaac aagcaccggg ataagcccat cagagagcag gccgagaata tcatccacct 5280

gtttaccctg accaatctgg gagcccctgc cgccttcaag tactttgaca ccaccatcga 5340

ccggaagagg tacaccagca ccaaagaggt gctggacgcc accctgatcc accagagcat 5400

caccggcctg tacgagacac ggatcgacct gtctcagctg ggaggcgaca aaaggccggc 5460

ggccacgaaa aaggccggcc aggcaaaaaa gaaaaagtaa gaattcctag agctcgctga 5520

tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 5580

tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 5640

tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 5700

ggggaggatt gggaagagaa tagcaggcat gctggggagc ggccgcagga acccctagtg 5760

atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 5820

gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc 5880

ctgcaggggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 5940

atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6000

tggttacgcg cagcgtgacc gctacacttg ccagcgcctt agcgcccgct cctttcgctt 6060

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6120

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgatttgg 6180

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6240

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aactctatct 6300

cgggctattc ttttgattta taagggattt tgccgatttc ggtctattgg ttaaaaaatg 6360

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaattttat 6420

ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc 6480

caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 6540

ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 6600

cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg 6660

tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 6720

ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 6780

aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct 6840

tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag 6900

atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta 6960

agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc 7020

tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca 7080

tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg 7140

atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg 7200

ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca 7260

tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa 7320

acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa 7380

ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata 7440

aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat 7500

ctggagccgg tgagcgtgga agccgcggta tcattgcagc actggggcca gatggtaagc 7560

cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata 7620

gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt 7680

actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga 7740

agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 7800

cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 7860

tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 7920

agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 7980

ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 8040

acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 8100

ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 8160

gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 8220

gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 8280

gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 8340

tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 8400

caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct 8460

tttgctggcc ttttgctcac atgt 8484

<210> 2

<211> 10476

<212> DNA

<213> Artificial sequence

<400> 2

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300

gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttc tagcgcgtgc 360

gccaattctg cagacaaatg gctctagagg tacccgttac ataacttacg gtaaatggcc 420

cgcctggctg accgcccaac gacccccgcc cattgacgtc aatagtaacg ccaataggga 480

ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 540

aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 600

ggcattgtgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 660

tagtcatcgc tattaccatg ggggcagagc gcacatcgcc cacagtcccc gagaagttgg 720

ggggaggggt cggcaattga tccggtgcct agagaaggtg gcgcggggta aactgggaaa 780

gtgatgtcgt gtactggctc cgcctttttc ccgagggtgg gggagaaccg tatataagtg 840

cagtagtcgc cgtgaacgtt ctttttcgca acgggtttgc cgccagaaca caggttggac 900

cggtgccacc atggactata aggaccacga cggagactac aaggatcatg atattgatta 960

caaagacgat gacgataaga tggcccccaa aaagaaacga aaggtgggtg ggtccccaaa 1020

gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt acagcatcgg 1080

cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc 1140

cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga agaacctgat 1200

cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga agagaaccgc 1260

cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa 1320

cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga 1380

agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg aggtggccta 1440

ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa 1500

ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc ggggccactt 1560

cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct 1620

ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc 1680

caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc tgatcgccca 1740

gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga gcctgggcct 1800

gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa 1860

ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga 1920

cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca tcctgagagt 1980

gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca 2040

ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa 2100

agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg gcggagccag 2160

ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga 2220

actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg 2280

cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga 2340

tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttccgcat 2400

cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga tgaccagaaa 2460

gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgcttccgc 2520

ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg agaaggtgct 2580

gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga ccaaagtgaa 2640

atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat 2700

cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga aagaggacta 2760

cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa 2820

cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga 2880

caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga 2940

cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat 3000

gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa 3060

cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt 3120

cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat 3180

ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc 3240

cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt 3300

gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca 3360

gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat 3420

caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa 3480

cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact 3540

ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa 3600

ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga 3660

caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa 3720

cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct 3780

gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac 3840

aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa 3900

gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa 3960

ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta 4020

cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt 4080

cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga 4140

aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac 4200

cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga 4260

aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag 4320

catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga 4380

gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc 4440

taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa 4500

agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat 4560

catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa 4620

agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa 4680

cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct 4740

gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc 4800

ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga 4860

gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga 4920

caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa 4980

tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga 5040

caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat 5100

ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga 5160

caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagg gcggctccaa 5220

gcggcctgcc gcgacgaaga aagcgggaca ggccaagaaa aagaaaggat ccggcgcaac 5280

aaacttctct ctgctgaaac aagccggaga tgtcgaagag aatcctggac cggtgagcaa 5340

gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa 5400

cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac 5460

cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 5520

cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt 5580

cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 5640

cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 5700

cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 5760

caactacaac agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt 5820

gaacttcaag atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 5880

gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 5940

ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 6000

cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagggct ccggcgaggg 6060

caggggaagt cttctaacat gcggggacgt ggaggaaaat cccggcccaa ccgagtacaa 6120

gcccacggtg cgcctcgcca cccgcgacga cgtccccagg gccgtacgca ccctcgccgc 6180

cgcgttcgcc gactaccccg ccacgcgcca caccgtcgat ccggaccgcc acatcgagcg 6240

ggtcaccgag ctgcaagaac tcttcctcac gcgcgtcggg ctcgacatcg gcaaggtgtg 6300

ggtcgcggac gacggcgccg cggtggcggt ctggaccacg ccggagagcg tcgaagcggg 6360

ggcggtgttc gccgagatcg gcccgcgcat ggccgagttg agcggttccc ggctggccgc 6420

gcagcaacag atggaaggcc tcctggcgcc gcaccggccc aaggagcccg cgtggttcct 6480

ggccaccgtc ggagtctcgc ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct 6540

ccccggagtg gaggcggccg agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc 6600

ccgcaacctc cccttctacg agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc 6660

cgaaggaccg cgcacctggt gcatgacccg caagcccggt gcctgaacgc gttaagtcga 6720

caatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 6780

tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 6840

tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 6900

gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 6960

tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 7020

tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 7080

gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 7140

cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 7200

caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 7260

tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc gtcgacttta 7320

agaccaatga cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga 7380

ctggaagggc taattcactc ccaacgaaga caagatctgc tttttgcttg tactgggtct 7440

ctctggttag accagatctg agcctgggag ctctctggct aactagggaa cccactgctt 7500

aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac 7560

tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagggcc 7620

cgtttaaacc cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 7680

cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 7740

aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 7800

ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 7860

gggctctatg gcctgcaggg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 7920

atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg 7980

cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ttagcgcccg 8040

ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 8100

taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 8160

aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 8220

ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 8280

tcaactctat ctcgggctat tcttttgatt tataagggat tttgccgatt tcggtctatt 8340

ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 8400

ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 8460

cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 8520

cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 8580

caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca 8640

tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 8700

ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 8760

gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 8820

cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 8880

tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 8940

tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 9000

cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 9060

tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 9120

agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 9180

ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 9240

ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 9300

aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 9360

gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 9420

tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 9480

ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca gcactggggc 9540

cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 9600

atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 9660

cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 9720

ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 9780

cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 9840

ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 9900

tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 9960

taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 10020

caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 10080

agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 10140

gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 10200

gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 10260

ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 10320

acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 10380

tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 10440

ggttcctggc cttttgctgg ccttttgctc acatgt 10476

<210> 3

<211> 3120

<212> DNA

<213> Artificial sequence

<400> 3

gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60

cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120

tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180

aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240

ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300

ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360

tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420

tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480

actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540

gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600

acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660

gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720

acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780

gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840

ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900

gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960

cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020

agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080

catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140

tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200

cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260

gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320

taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380

ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440

tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500

ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560

cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620

agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680

gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740

atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800

gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860

gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920

ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980

cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040

cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100

acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160

cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220

accatgatta cgccaagctt gcatgcaggc ctctgcagtc gacgggcccg ggatccgatg 2280

ataaacatgt gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 2340

tgttagagag ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 2400

gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 2460

ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 2520

gtggaaagga cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag 2580

ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttc 2640

tagcgcgtgc gccaattctg cagacaaatg gctctagagg tacccataga tctagatgca 2700

ttcgcgaggt accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa 2760

accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta 2820

atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat 2880

ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt 2940

gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 3000

cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3060

tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3120

<210> 4

<211> 1043

<212> PRT

<213> Sus scrofa

<400> 4

Met Ala Val Ser Leu Pro Pro Thr Leu Gly Leu Ser Ser Ala Pro Asp

1 5 10 15

Glu Ile Gln His Pro His Ile Lys Phe Ser Glu Trp Lys Phe Lys Leu

20 25 30

Phe Arg Val Arg Ser Phe Glu Lys Ala Pro Glu Lys Ala Gln Thr Glu

35 40 45

Lys Gln Asp Ser Ser Glu Gly Lys Pro Ser Leu Glu Gln Ser Pro Ala

50 55 60

Val Leu Asp Lys Pro Gly Gly Gln Lys Ser Ala Leu Pro Gln Pro Ala

65 70 75 80

Phe Lys Pro His Pro Lys Phe Leu Lys Glu Ser His Glu Asp Gly Lys

85 90 95

Ala Arg Asp Lys Ala Ile His Gln Ala Asn Leu Arg Arg Leu Cys Arg

100 105 110

Ile Cys Gly Asn Ser Phe Asn Thr Thr Gly His Lys Arg Arg Tyr Pro

115 120 125

Val His Gly Pro Val Asp Gly Lys Thr Gln Val Leu Leu Arg Lys Lys

130 135 140

Glu Lys Arg Ala Thr Ser Trp Pro Asp Leu Ile Ala Lys Val Phe Arg

145 150 155 160

Ile Asp Val Lys Ala Asp Val Asp Ser Ile His Pro Thr Glu Phe Cys

165 170 175

His Asn Cys Trp Ser Phe Met His Arg Lys Phe Ser Ser Thr Pro Cys

180 185 190

Glu Val Tyr Ser Pro Arg Asn Ala Thr Met Glu Trp His Pro His Thr

195 200 205

Leu Asn Cys Asp Ile Cys His Ile Ala Arg Arg Gly Leu Lys Arg Lys

210 215 220

Ser Gln Gln Pro Asn Met Gln Leu Ser Lys Lys Leu Lys Thr Val Ile

225 230 235 240

Asp Arg Ala Arg Gln Ala Arg Gln Arg Lys Arg Arg Ala Gln Ala Arg

245 250 255

Ile Ser Ser Lys Glu Leu Met Lys Lys Ile Ala Asn Cys Gly Gln Ile

260 265 270

His Leu Ser Pro Lys Leu Leu Ala Val Asp Phe Pro Ala His Phe Val

275 280 285

Lys Ser Ile Ser Cys Gln Ile Cys Glu His Ile Leu Ala Asp Pro Val

290 295 300

Glu Thr Ser Cys Lys His Val Phe Cys Arg Ile Cys Ile Leu Arg Cys

305 310 315 320

Leu Lys Val Met Gly Ser Ser Cys Pro Ser Cys His Tyr Pro Cys Phe

325 330 335

Pro Thr Asp Leu Glu Ser Pro Val Lys Ser Phe Leu Ser Ile Leu Asn

340 345 350

Thr Leu Met Val Lys Cys Pro Ala Lys Glu Cys Asn Glu Glu Ile Ser

355 360 365

Leu Glu Lys Tyr Asn His His Ile Ser Ser His Lys Glu Ser Lys Glu

370 375 380

Thr Phe Val His Ile Asn Lys Gly Gly Arg Pro Arg Gln His Leu Leu

385 390 395 400

Ser Leu Thr Arg Arg Ala Gln Lys His Arg Leu Arg Glu Leu Lys Leu

405 410 415

Gln Val Lys Ala Phe Ala Asp Lys Glu Glu Gly Gly Asp Val Lys Ser

420 425 430

Val Cys Leu Thr Leu Phe Leu Leu Val Leu Arg Ala Arg Asn Glu His

435 440 445

Arg Gln Ala Asp Glu Leu Glu Ala Ile Met Arg Gly Gln Gly Ser Gly

450 455 460

Leu Gln Pro Ala Val Cys Leu Ala Ile Arg Val Asn Thr Phe Leu Ser

465 470 475 480

Cys Ser Gln Tyr His Lys Met Tyr Arg Thr Val Lys Ala Ile Thr Gly

485 490 495

Arg Gln Ile Phe Gln Pro Leu His Ala Leu Arg Asn Ala Glu Lys Val

500 505 510

Leu Leu Pro Gly Tyr His Pro Phe Glu Trp Gln Pro Pro Leu Lys Asn

515 520 525

Val Ser Ser Ser Thr Asp Val Gly Ile Ile Asp Gly Leu Ser Gly Leu

530 535 540

Ser Ser Ser Val Asp Asp Tyr Pro Val Asp Thr Ile Ala Lys Arg Phe

545 550 555 560

Arg Tyr Asp Ser Ala Leu Val Ser Ala Leu Met Asp Met Glu Glu Asp

565 570 575

Ile Leu Glu Gly Met Arg Ala Gln Asp Leu Asp Asp Tyr Leu Asn Gly

580 585 590

Pro Phe Thr Val Val Val Lys Glu Ser Cys Asp Gly Met Gly Asp Val

595 600 605

Ser Glu Lys His Gly Ser Gly Pro Val Val Pro Glu Lys Ala Val Arg

610 615 620

Phe Ser Phe Thr Val Met Lys Ile Thr Ile Ala His Gly Ser Gln Asn

625 630 635 640

Val Lys Val Phe Glu Glu Ala Lys Pro Asn Ser Glu Leu Cys Cys Lys

645 650 655

Pro Leu Cys Leu Met Leu Ala Asp Glu Ser Asp His Glu Thr Leu Thr

660 665 670

Ala Ile Leu Ser Pro Leu Ile Ala Glu Arg Glu Ala Met Lys Ser Ser

675 680 685

Gln Leu Met Leu Glu Met Gly Gly Ile Leu Arg Thr Phe Lys Phe Ile

690 695 700

Phe Arg Gly Thr Gly Tyr Asp Glu Lys Leu Val Arg Glu Val Glu Gly

705 710 715 720

Leu Glu Ala Ser Gly Ser Val Tyr Ile Cys Thr Leu Cys Asp Ala Thr

725 730 735

Arg Leu Glu Ala Ser Gln Asn Leu Val Phe His Ser Ile Thr Arg Ser

740 745 750

His Ala Glu Asn Leu Glu Arg Tyr Glu Val Trp Arg Ser Asn Pro Tyr

755 760 765

His Glu Thr Val Asp Glu Leu Arg Asp Arg Val Lys Gly Val Ser Ala

770 775 780

Lys Pro Phe Ile Glu Thr Val Pro Ser Ile Asp Ala Leu His Cys Asp

785 790 795 800

Ile Gly Asn Ala Ala Glu Phe Tyr Lys Ile Phe Gln Leu Glu Ile Gly

805 810 815

Glu Ala Tyr Lys Asn Pro His Ala Ser Lys Glu Glu Arg Lys Arg Trp

820 825 830

Gln Ala Thr Leu Asp Lys His Leu Arg Lys Lys Met Asn Leu Lys Pro

835 840 845

Ile Met Arg Met Asn Gly Asn Phe Ala Arg Lys Leu Met Thr Lys Glu

850 855 860

Thr Val Glu Ala Val Cys Glu Leu Ile Pro Ser Glu Glu Arg His Glu

865 870 875 880

Ala Leu Arg Glu Leu Met Asp Leu Tyr Leu Lys Met Lys Pro Val Trp

885 890 895

Arg Ser Ser Cys Pro Ala Lys Glu Cys Pro Glu Ser Leu Cys Gln Tyr

900 905 910

Ser Phe Asn Ser Gln Arg Phe Ala Glu Leu Leu Ser Thr Lys Phe Lys

915 920 925

Tyr Arg Tyr Glu Gly Lys Ile Thr Asn Tyr Phe His Lys Thr Leu Ala

930 935 940

His Val Pro Glu Ile Ile Glu Arg Asp Gly Ser Ile Gly Ala Trp Ala

945 950 955 960

Ser Glu Gly Asn Glu Ser Gly Asn Lys Leu Phe Arg Arg Phe Arg Lys

965 970 975

Met Asn Ala Arg Gln Ser Lys Tyr Tyr Glu Met Glu Asp Val Leu Lys

980 985 990

His His Trp Leu Tyr Thr Ser Lys Tyr Leu Gln Lys Phe Met Asn Ala

995 1000 1005

His Lys Ala Phe Lys Asn Ser Gly Phe Thr Ile Asn Leu Gln Arg

1010 1015 1020

Ser Ser Gly Asp Thr Leu Asp Leu Glu Asn Ser Pro Glu Ser Gln

1025 1030 1035

Asp Leu Met Glu Phe

1040

<210> 5

<211> 3132

<212> DNA

<213> Sus scrofa

<400> 5

atggctgtct ctttgccacc cactctggga ctcagttccg ccccagatga aatccagcac 60

ccccacatta aattttcaga atggaagttt aagctattca gggtgagatc ctttgaaaag 120

gcacctgaaa aggctcaaac ggaaaagcag gattcctccg aggggaaacc ctcgctggag 180

caatctccag cagtcctgga caagcctggt ggtcagaagt cagccctgcc tcaaccagca 240

ttcaagcccc atccaaagtt tttaaaggaa tcccacgaag atgggaaagc aagagacaaa 300

gccatccacc aagccaacct gagacgtctc tgccgcatct gtgggaattc tttcaacacc 360

actgggcaca agagaaggta tccagtccac gggcctgtgg atggtaaaac ccaagtcctt 420

ttacggaaga aggaaaagag ggccacgtcc tggccagacc tcattgccaa agttttccgg 480

atcgatgtga aggcagatgt tgactcgatc caccccactg agttctgcca taactgctgg 540

agcttcatgc acaggaagtt tagcagcacc ccatgtgagg tttactcccc aaggaatgca 600

accatggagt ggcaccccca caccctaaac tgtgacatct gccacattgc acgtcgggga 660

ctcaagagga agagtcagca gccaaacatg cagctcagca aaaaactcaa aactgtgatt 720

gaccgagcga gacaagcccg tcagcgcaag aggagagctc aggccaggat cagcagcaag 780

gaactgatga agaagatcgc caactgcggt cagatacatc ttagccccaa gctcctggca 840

gtggacttcc cggcgcactt tgtgaaatct atctcctgcc agatttgtga acacatcctg 900

gccgacccgg tggagaccag ctgcaagcac gtgttttgca ggatctgcat tctcaggtgc 960

ctcaaagtca tgggcagcag ttgtccctct tgccactatc cctgtttccc tactgacctg 1020

gagagtccag tgaagtcttt tctgagcatc ttgaataccc tgatggtgaa atgcccagca 1080

aaggagtgca acgaggagat cagcttggaa aaatataatc accatatctc aagccacaag 1140

gagtcgaagg agacatttgt gcatattaat aaagggggcc ggccccgcca gcatctcctg 1200

tccctgacgc ggagggctca gaaacaccgt ctgagggagc tcaagctgca agtcaaggcc 1260

ttcgccgaca aagaagaagg tggcgacgtg aagtcagtgt gcctgacctt gttcctgcta 1320

gtgctgaggg cgaggaatga gcacagacaa gctgacgagc tggaggccat catgcgaggc 1380

cagggttccg gcctgcagcc tgctgtttgc ttggccatcc gcgtcaacac cttcctcagc 1440

tgcagccagt accacaagat gtacaggact gtgaaggcca tcacgggcag gcagattttc 1500

cagcctttgc atgcccttcg gaatgcggag aaggtccttc tgcccggcta ccaccccttc 1560

gagtggcagc cacctctgaa gaatgtgtct tccagcacgg acgtgggcat tattgatggg 1620

ctgtctggac tctcctcctc tgtggacgat tacccagtgg acaccattgc caagcgcttc 1680

cgctatgact cggctctggt gtccgctctc atggacatgg aagaagacat cctggagggt 1740

atgagagccc aagaccttga cgactacctg aatggcccct tcactgtggt ggtgaaggag 1800

tcttgtgatg ggatgggaga cgtgagtgag aagcacggca gtgggccggt cgtgccggaa 1860

aaggccgttc ggttttcctt cacagtcatg aaaatcacca tcgcacacgg gtcacagaac 1920

gtgaaggtgt ttgaggaagc caagcctaac tctgaactat gctgcaagcc cttgtgcctc 1980

atgctggccg acgaatccga ccatgagacc ctgacggcca tcctgagccc tctcattgcc 2040

gagagggagg ccatgaagag cagccagcta atgctggaga tgggaggcat cctccggact 2100

ttcaagttca tcttcagggg caccggatat gatgagaaac tggtccggga agtggaaggc 2160

cttgaggctt ctggctctgt ctacatctgt actctctgtg atgccacccg cctggaagcc 2220

tctcaaaatc tggtcttcca ctccataacc agaagccacg cggagaattt ggagcgctat 2280

gaggtctggc gttccaaccc ataccatgag acggtggatg aacttcggga ccgggtgaaa 2340

ggggtctcgg ccaaaccctt cattgagacg gtgccttcca tagatgccct ccactgtgac 2400

attggcaatg cagccgagtt ctacaagatt ttccagctcg agatagggga ggcgtataag 2460

aacccccatg cctccaagga ggaaaggaag agatggcagg cgaccttgga caagcacctc 2520

cgcaagaaga tgaatctgaa gcccatcatg aggatgaatg gcaactttgc caggaagctc 2580

atgaccaaag agactgtgga agcagtctgt gagttaattc cctccgagga gaggcatgaa 2640

gctctgaggg aactgatgga cctttacctg aagatgaaac ccgtctggcg atcgtcatgc 2700

cctgctaaag agtgcccgga atccctctgc cagtatagtt tcaattcgca gcgttttgct 2760

gagctcctct ccaccaagtt caagtacaga tatgagggca aaatcaccaa ttattttcac 2820

aagacactgg cccacgtccc ggaaattatc gagagggacg gctccattgg ggcatgggct 2880

agcgagggaa atgagtctgg gaacaagctg ttcaggcgct tccgaaaaat gaatgccagg 2940

cagtccaagt actatgaaat ggaagatgtt ttgaaacatc actggttgta cacctccaaa 3000

tacctgcaga agtttatgaa tgctcataaa gcatttaaaa actcagggtt taccataaac 3060

ttgcagagaa gttcagggga cacattagac ctagagaact ctccagaatc tcaagatttg 3120

atggaatttt aa 3132

<210> 6

<211> 100

<212> RNA

<213> Artificial sequence

<400> 6

gggaauucuu ucaacaccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 7

<211> 100

<212> RNA

<213> Artificial sequence

<400> 7

agagaaggua uccaguccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 8

<211> 100

<212> RNA

<213> Artificial sequence

<400> 8

aaugaggucu ggccaggacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 9

<211> 100

<212> RNA

<213> Artificial sequence

<400> 9

aguuauggca gaacucagug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 10

<211> 527

<212> PRT

<213> Sus scrofa

<400> 10

Met Ser Leu Gln Met Ile Thr Val Gly Asn Asn Met Ala Leu Ile Gln

1 5 10 15

Pro Gly Phe Ser Leu Met Asn Phe Asp Gly Gln Ile Phe Phe Phe Gly

20 25 30

Gln Lys Gly Trp Pro Lys Arg Ser Cys Pro Thr Gly Val Phe His Phe

35 40 45

Asp Val Lys His Asn His Leu Lys Leu Lys Pro Ala Leu Phe Ser Lys

50 55 60

Asp Ser Cys Tyr Leu Pro Pro Leu Arg Tyr Pro Ala Thr Cys Thr Phe

65 70 75 80

Lys Ser Ser Leu Glu Ser Glu Lys His Gln Tyr Ile Ile His Gly Gly

85 90 95

Lys Thr Pro Asn Asn Glu Leu Ser Asp Lys Ile Tyr Val Met Ser Val

100 105 110

Val Cys Lys Asn Asn Lys Lys Val Thr Phe Arg Cys Arg Glu Lys Asp

115 120 125

Leu Val Gly Asp Val Pro Glu Gly Arg Tyr Gly His Ser Ile Asp Val

130 135 140

Val Tyr Ser Arg Gly Lys Ser Met Gly Val Leu Phe Gly Gly Arg Ser

145 150 155 160

Tyr Ile Pro Ser Ala Gln Arg Thr Thr Glu Lys Trp Asn Ser Val Ala

165 170 175

Asp Cys Leu Pro His Ile Phe Leu Val Asp Phe Glu Phe Gly Cys Ser

180 185 190

Thr Ser Tyr Ile Leu Pro Glu Leu Gln Asp Gly Leu Ser Phe His Val

195 200 205

Ser Ile Ala Arg Asn Asp Thr Ile Tyr Ile Leu Gly Gly His Ser Leu

210 215 220

Ala Asn Asn Ile Arg Pro Ala Asn Leu Tyr Lys Ile Arg Val Asp Leu

225 230 235 240

Pro Leu Gly Ser Pro Ala Val Thr Cys Thr Val Leu Pro Gly Gly Ile

245 250 255

Ser Val Ser Ser Ala Ile Leu Thr Gln Thr Ser Ser Asp Glu Phe Val

260 265 270

Ile Val Gly Gly Tyr Gln Leu Glu Asn Gln Lys Arg Met Val Cys Asn

275 280 285

Ile Ile Ser Phe Lys Asp Asn Lys Ile Gly Ile His Glu Met Glu Thr

290 295 300

Pro Asp Trp Thr Pro Asp Ile Lys His Ser Lys Ile Trp Phe Gly Ser

305 310 315 320

Asn Met Gly Asn Gly Thr Val Phe Leu Gly Ile Pro Gly Asp Asn Lys

325 330 335

Gln Ala Leu Ser Glu Ala Phe Tyr Phe Tyr Thr Leu Lys Cys Thr Glu

340 345 350

Asp Asp Val Asn Glu Asp Gln Lys Thr Phe Thr Asn Ser Gln Thr Ser

355 360 365

Thr Glu Asp Pro Gly Asp Ser Thr Pro Phe Glu Asp Ser Glu Glu Phe

370 375 380

Cys Phe Ser Ala Glu Ala Asn Ser Phe Asp Gly Asp Asp Glu Phe Asp

385 390 395 400

Thr Tyr Asn Glu Asp Asp Glu Glu Asp Glu Ser Glu Thr Gly Tyr Trp

405 410 415

Ile Thr Cys Cys Pro Thr Cys Asp Met Asp Ile Asn Thr Trp Val Pro

420 425 430

Phe Tyr Ser Thr Glu Leu Asn Lys Pro Ala Met Ile Tyr Cys Ser His

435 440 445

Gly Asp Gly His Trp Val His Ala Gln Cys Met Asp Leu Ala Glu His

450 455 460

Thr Leu Ile His Leu Ser Glu Gly Ser Ser Lys Tyr Tyr Cys Lys Glu

465 470 475 480

His Val Glu Ile Ala Arg Ala Leu Gln Thr Pro Lys Arg Val Leu Pro

485 490 495

Leu Lys Lys Pro Pro Leu Lys Ser Leu His Lys Lys Gly Ser Gly Lys

500 505 510

Ile Ile Thr Pro Ala Lys Lys Ser Phe Leu Arg Arg Leu Phe Asp

515 520 525

<210> 11

<211> 2584

<212> DNA

<213> Sus scrofa

<400> 11

tctacgtcag ccattctcac ctcccattcc ctagtttttc gccttggctt ccatctagtc 60

acttcgcact cttggcgtct ttattcagag agactcttaa agacttcttt cctggggcaa 120

taaagacaaa ctctgtagcc acacatccca tagagaatgg attcctggga aatgtagttc 180

tttctgggga caagtggtta gtctttaagg gaaaaggact acagttccca gaaatctaag 240

ggaggccagt ccacgtctta aacttgtccc agctgcatgg attgtattag gcaggaaggt 300

tctgtggcgt tttctttacc cagctgcctg gatttttgct aattcaatcc cactacaagc 360

ttgtggaaca actctctttt tttaacaggc tttttatgtg tgagggatct aaacacagtg 420

attttaatga agagatatag taagttaaaa aatgtttttt aattctttca gataaaaaaa 480

gagctaccca ctgtcagaaa atgtcactac agatgataac agttggtaat aacatggcct 540

taattcagcc aggcttctca ttgatgaatt ttgatgggca aatcttcttc tttggccaaa 600

aaggctggcc caagaggtcc tgccccactg gagtttttca ttttgatgta aagcataacc 660

atctcaaact gaagcctgca cttttctcta aggattcctg ctaccttcct cctctccgct 720

acccagccac ttgcacattc aaaagcagct tagagtctga aaaacatcag tacatcatcc 780

atggagggaa aacaccaaat aatgagcttt cggataagat ttatgtcatg tctgtggttt 840

gcaagaacaa caaaaaagtt acttttcgct gcagagagaa agacttggta ggagatgttc 900

ctgaaggcag atatggtcat tccattgatg tcgtgtatag tcgagggaaa agtatgggtg 960

ttctctttgg aggacggtca tacatccctt ctgctcaaag aaccacagaa aaatggaata 1020

gtgtagctga ctgcctgccc cacattttct tggtagattt tgaatttggt tgctctacat 1080

catacattct tccagaactt caagatgggc tatcttttca tgtctccatt gccagaaatg 1140

ataccattta tattttagga ggacactcac ttgccaataa catccgtcct gccaatctat 1200

ataaaataag ggttgatctc cccctgggta gcccagctgt gacttgcaca gtcctgccag 1260

gaggaatctc tgtctccagt gcaatcctga ctcaaacgag cagtgatgaa tttgttattg 1320

ttggtggcta tcagcttgaa aatcaaaaaa gaatggtctg caacatcatc tctttcaagg 1380

acaacaagat aggaattcat gagatggaaa ctccagattg gaccccagat attaagcaca 1440

gcaagatatg gtttggaagc aacatgggaa atggaaccgt tttccttggc ataccaggag 1500

acaataaaca ggctctttca gaagcattct atttctatac attgaaatgt actgaagacg 1560

atgtgaacga agatcaaaaa acattcacaa atagtcagac atcaacagaa gatccagggg 1620

actccactcc ctttgaagac tcagaagaat tttgtttcag tgcagaagca aatagttttg 1680

atggtgatga tgaatttgac acctataacg aagatgatga ggaagatgag tctgagacgg 1740

gctactggat tacatgctgc cctacttgtg atatggatat caacacttgg gtaccatttt 1800

attcaactga gctcaacaaa cctgccatga tctactgctc tcatggagat gggcattggg 1860

tccatgccca gtgcatggat ctggcagaac acacactcat ccatctgtca gaaggaagca 1920

gcaagtatta ctgcaaggag catgtggaga tagcaagagc actgcaaacc cccaaaagag 1980

ttttaccctt aaaaaagcct ccactgaaat ccctccacaa aaaaggttct gggaaaatta 2040

ttacccctgc caagaaatcc tttcttagaa gattattcga ttagtttcac aaaagctttt 2100

ctgatccaag tgcatcaggt ttttaaacat attttcaaga atcctgacaa tgataaaaat 2160

tatattctta tttttgttat tgaaaatatc tgttttcttt tagttatatg aattaagttc 2220

cagagaaaag tcttataatg caatacaaaa tacagtcatt gtgtttagac ttatatagga 2280

cctataatat tttgaaaatt ctttactcaa aggatcttca gtgagtattt ttgatctgaa 2340

tttctttgtt caaggaatgt tcaacactga gacagtagta ataactaatg tatgcttatg 2400

tccattatat gactttcggt aacaaataat ctatagaata gttgagacaa gtttaaacag 2460

tagagaaact aagagctaaa ggaattaaag gaattctttt gcatgatgta gcaatttggt 2520

tgatgttgct tgatgctgta actccaacat ggccctttgg ttatgcccat gtacagaaaa 2580

agct 2584

<210> 12

<211> 100

<212> RNA

<213> Artificial sequence

<400> 12

ucacuacaga ugauaacagu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 13

<211> 100

<212> RNA

<213> Artificial sequence

<400> 13

gauaacaguu gguaauaaca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 14

<211> 100

<212> RNA

<213> Artificial sequence

<400> 14

gugcaggcuu caguuugaga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 15

<211> 100

<212> RNA

<213> Artificial sequence

<400> 15

caaguggcug gguagcggag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 16

<211> 368

<212> PRT

<213> Sus scrofa

<400> 16

Met Leu Lys Pro Pro Leu Pro Val Lys Ser Leu Leu Phe Leu Gln Leu

1 5 10 15

Pro Leu Leu Gly Val Gly Leu Asn Pro Lys Val Leu Thr His Ser Gly

20 25 30

Asn Glu Asp Ile Thr Ala Asp Phe Leu Leu Leu Ser Thr Pro Pro Gly

35 40 45

Thr Leu Asn Val Ser Thr Leu Pro Leu Pro Lys Val Gln Cys Phe Val

50 55 60

Phe Asn Val Glu Tyr Met Asn Cys Thr Trp Asn Ser Ser Ser Glu Leu

65 70 75 80

Gln Pro Thr Asn Leu Thr Leu His Tyr Trp Tyr Lys Thr Ser Asn Asp

85 90 95

Asp Lys Val Gln Glu Cys Gly His Tyr Leu Phe Ser Glu Gly Ile Thr

100 105 110

Ser Gly Cys Trp Phe Gly Lys Glu Glu Ile Arg Leu Tyr Gln Thr Phe

115 120 125

Val Val Gln Leu Gln Asp Pro Arg Glu Pro Arg Arg Gln Asp Pro Gln

130 135 140

Thr Leu Lys Leu Gln Asp Leu Val Ile Pro Trp Ala Pro Ala Asn Leu

145 150 155 160

Thr Leu Arg Thr Leu Ser Glu Ser Gln Leu Glu Leu Asn Trp Ser Asn

165 170 175

Arg Tyr Leu Asp His Cys Leu Glu His Leu Val Gln Tyr Arg Ser Asp

180 185 190

Arg Asp Arg Ser Trp Thr Glu Gln Ser Val Asp His Arg Gln Ser Phe

195 200 205

Ser Leu Pro Ser Val Asp Ala Gln Lys Leu Tyr Thr Phe Arg Val Arg

210 215 220

Ser Arg Tyr Asn Pro Leu Cys Gly Ser Ala Gln Arg Trp Ser Asp Trp

225 230 235 240

Ser His Pro Ile His Trp Gly Asn Thr Ser Lys Glu Asn Pro Leu Leu

245 250 255

Phe Ala Leu Glu Ala Val Leu Ile Pro Leu Gly Ser Met Gly Leu Ile

260 265 270

Val Gly Leu Met Cys Val Tyr Cys Trp Leu Glu Arg Thr Met Pro Arg

275 280 285

Ile Pro Thr Leu Lys Asn Leu Glu Asp Leu Val Thr Glu Tyr His Gly

290 295 300

Asn Phe Ser Ala Trp Ser Gly Val Ser Lys Gly Leu Ala Glu Ser Leu

305 310 315 320

Gln Pro Asp Tyr Ser Glu Arg Leu Cys His Val Ser Glu Ile Ser Pro

325 330 335

Lys Gly Gly Ala Leu Gly Glu Gly Pro Gly Gly Ser Pro Cys Ser Gln

340 345 350

His Ser Pro Tyr Trp Ala Pro Pro Cys Tyr Thr Leu Lys Pro Glu Thr

355 360 365

<210> 17

<211> 1185

<212> DNA

<213> Sus scrofa

<400> 17

aaattttaga gtactggggg gagggcaagg ggaagggttc cctgcctagt gctgcttctt 60

cttctgacca tcatgtcttc cctttgcctc ccccacttca ttttctcccc gtcctagatt 120

tcctcctgct ctctacaccc cctgggactc tcaacgtttc cactctaccc ctcccaaagg 180

ttcagtgttt tgtgttcaat gttgagtaca tgaattgcac ttggaacagc agctctgagc 240

tccagcctac caacctaact ctgcactact ggtatgagaa gggaagaggg gatatagcac 300

aggggaggga ggaagaggcg ctgggctaga tgtgagagat tgtgtgagga ccaagaaaga 360

ggttagccag catcccaggc ttcccactat attctcgtgg ggtaagtcat aagtcagttc 420

gtaggagctg aggctggact gtggaatctg tggtattcac atttacctca ctgttattct 480

tccttgaaat ccttctctag gtacaagacc tctaatgatg ataaagtcca ggagtgtggc 540

cactatctat tctctgaagg gatcacttct ggctgttggt ttggaaaaga ggagatccgc 600

ctctaccaaa catttgttgt ccagctccag gacccacggg aacccaggag gcaggaccca 660

cagacgctaa aactacagga tctgggtaat ttggaaatgg ggagggtcaa gggatattgt 720

gggggtattg gtgtatgtag agtggtattc ttgcaccata agggtacttg ggcagaaaag 780

aagaagtgag ggatccaatg gggtcgggag gagggatcag gagcactgcc ctcaggatcc 840

tgacttgtct aggccagggg aatgaccaca cacgcacaca tatctccagt gatcccctgg 900

gcgccggcga atctgaccct tcgcaccctg agtgaatccc agctagaact cagctggagc 960

aaccgatact tggaccactg tttggagcac ctcgtgcaat accggagtga ccgggaccgc 1020

agctggactg tgagtgagtg ggaacagcag ctggggctga gcaagtgggg ataaaggatt 1080

caatcagtcc agtaggaagg cttgattccc agctcctatt ctctgcatcc tggtgcctct 1140

gcccaccttc tcccctcctt ggactccttt ctctgtcgtc accat 1185

<210> 18

<211> 100

<212> RNA

<213> Artificial sequence

<400> 18

ccuguaguuu uagcgucugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 19

<211> 100

<212> RNA

<213> Artificial sequence

<400> 19

caacaaaugu uugguagagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 20

<211> 100

<212> RNA

<213> Artificial sequence

<400> 20

gaugauaaag uccaggagug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 21

<211> 100

<212> RNA

<213> Artificial sequence

<400> 21

cuggacuuua ucaucauuag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 22

<211> 100

<212> RNA

<213> Artificial sequence

<400> 22

uuguccagcu ccaggaccca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 23

<211> 100

<212> RNA

<213> Artificial sequence

<400> 23

ggccacuauc uauucucuga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 24

<211> 100

<212> RNA

<213> Artificial sequence

<400> 24

ucccuucaga gaauagauag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 25

<211> 100

<212> RNA

<213> Artificial sequence

<400> 25

aacauuuguu guccagcucc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 26

<211> 100

<212> RNA

<213> Artificial sequence

<400> 26

uguccagcuc caggacccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

63页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:CRISPR系统及其在构建LRP5基因突变的骨质疏松症克隆猪核供体细胞中的应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!