一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法

文档序号:920401 发布日期:2021-03-02 浏览:4次 >En<

阅读说明:本技术 一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法 (FokI and dCpf1 fusion protein expression vector and site-directed gene editing method mediated by same ) 是由 高波 留汉文 王赛赛 王亚丽 宋成义 陈才 王宵燕 于 2020-10-26 设计创作,主要内容包括:本发明属于基因编辑领域,特别涉及一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法,本发明将CRISPR/Cpf1编辑系统中经突变失活的dCpf1蛋白与FokI核酸酶融合在一起,构建一种高效的gRNA介导的基因定点编辑系统。该方法利用dCpf1的定点作用与核酸酶FokI的剪切作用,通过二聚体的形式进行剪切,可以提高该基因编辑系统的特异性,并达到较低的脱靶率。相对于Cas9蛋白而言,Cpf1蛋白有更大的优势被用来进行基因编辑等操作。本发明提供了一种更便捷,更高效的融合蛋白介导的基因定点编辑方法。(The invention belongs to the field of gene editing, and particularly relates to a FokI and dCpf1 fusion protein expression vector and a mediated site-directed gene editing method thereof. The method utilizes the site-directed action of dCpf1 and the shearing action of nuclease FokI, and can improve the specificity of the gene editing system and achieve lower off-target rate by shearing in a dimer form. Compared with the Cas9 protein, the Cpf1 protein has greater advantages in gene editing and other operations. The invention provides a more convenient and efficient fusion protein mediated gene site-directed editing method.)

一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编 辑方法

技术领域

本发明属于基因编辑领域,特别涉及一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法。

背景技术

理论上特异位点的内切酶可以对基因组中的单个位点进行定向操作,在治疗和研究应用的基因定点是非常有用。在很多生物中,包括哺乳动物,特异位点内切酶通过刺激NHEJ(非同源末端连接)和HDR(同源重组)进行基因编辑,例如CRISPR/Cas9,Cpf1等。

CRISPR/Cas是存在于细菌和古细菌演化过程中形成的一种防御性免疫机制,可用来抵制病毒和外源DNA的入侵。在CRISPR/Cas系统中,其中CRISPR是规律间隔性成簇短回文序列(clustered regularly interspaced short palindromic repeats)的简称,Cas是CRISPR相关蛋白(CRISPR-associated proteins,Cas的简称)。CRISPR/Cas9系统作为基因编辑工具在2013年问世后就引起广泛关注。该系统主要有三部分组成,TracrRNA,CrRNA和Cas9蛋白。TracrRNA和CrRNA形成guide-RNA,与基因组上的靶位点结合,而Cas9蛋白不但具有核酸内切酶作用,又可以与guide-RNA形成高特异性识别目标序列的复合物,其原因主要归功于Cas9蛋白的6个结构域,分别为RECI,RECII,Bridge Helix,PAM互作域,HNH和RuvC。RecI是最大的结构域,负责结合guide-RNA;而富含精氨酸的bridge helix域是Cas9结合靶DNA后开始裂解的关键部分;HNH和RuvC结构域则是最主要的负责剪切单链DNA的核酸酶结构域,并且Cas9蛋白中的HNH和RuvC结构域与其他蛋白中发现的高度同源;PAM互作域特异识别PAM序列,并启动靶DNA的结合;最后针对RECII结构域的功能还没有了解很透彻。有研究表明在CRISPR系统中,guide-RNA是由一条T型的单链RNA组成,其5’末端是与靶位点DNA互补的序列。人工合成的RNA结合到Cas9蛋白上后会改变蛋白的构象,而构象的变化把无活性的蛋白质转变成有活性的形式。这种构象改变的机制还不完全清楚,但是Jinek等学者在2014年报道的文章中推测,可能是由于蛋白质侧链与RNA碱基之间的空间相互作用或者弱结合引起的这还种变化。迄今为止,对于CRISPR/Cas9系统的应用已经很广泛,例如细菌、酵母、拟南芥、线虫、果蝇、斑马鱼、小鼠、大鼠、猪、牛、羊、人等多个物种及多个物种的细胞系,但是也发现得到广泛应用的CRISPR/Cas9系统经常会发生脱靶效应,这就为该系统的应用造成很大的障碍。

2012年Gasiunas等人将Cas9蛋白的HNH和RuvC核酸酶结构域的催化氨基酸突变,产生了不具有切割活性的Cas9蛋白,即dCas9(D10A和H840A)。Gasiunas等学者发现dCas9虽然没有了剪切活性,但仍然存在特异有效结合双链DNA的特性。所以John等学者在2014年发现将无剪切活性的dCas9蛋白与Fok1核酸酶融合后可以提高基因组编辑的特异性。由于Fok1剪切时需要二聚体的特性,所以Fok1-dCas9(fCas9)系统需要两个fCas9单体,由一对guide-RNA来识别基因组的靶位点,再由与Fok1融合的dCas9识别该一对邻近的RNA,最后Fok1进行剪切,随后经NHEJ或HDR进行修复,达到基因编辑的目的。2012年Gasiunas等发现Cas9核酸酶结构域可以单独突变形成DNA“nickases”,并且突变后能够引入与常规CRISPR/Cas9核酸酶具有相同特异性的单链剪切,所以单个Cas9nickases能够作为全功能型酶使用,而2013年Mali等表明一对Cas9nickases可作为基因编辑工具用于基因组DNA双链的剪切。随后在John等学者的文章中发现,fCas9系统,Cas9nickases系统和CRISPR/Cas9系统进行比较后,虽然CRISPR/Cas9系统表现出最高的编辑活性,但是其也表现出很高的脱靶率。一对Cas9nickases可用于切割邻近两个靶位点的相对链,产生有效的双链断裂,并可诱导大量的对靶DNA修饰,由于二聚体更大的约束性,所以减少了脱靶效应;Fok1-dCas9的融合也需要二聚体才能发生剪切,同样具有较高的约束性和特异性,所以理论上脱靶率也会低于野生型Cas9。经John等人研究发现,fCas9修饰靶位点的特异性比野生型Cas9高>140倍,与Cas9nickases效率相似。但是经比较发现Cas9nickases在仅有一个sgRNA使也能发生基因组编辑,而fCas9系统则必须存在两个sgRNA才会发生作用,所以fCas9系统的脱靶率是最低的,会是很好的基因编辑工具。

发明内容

本发明涉及建立一种FokI和dCpf1融合蛋白介导的定点基因编辑方法,本发明的某些方面公开了用于改善RNA可编辑内切酶(如Cpf1)特异性的组合和方法;同时还公开了该方法涉及的FokI-dCpf1融合载体,Fok1-Cpf1融合载体以及CAG-Cpf1融合载体构建方法,通过gRNA定点导向,二聚体Fok1剪切的作用,在生物基因组中实现低脱靶率下的定点整合。

为了实现上述发明目的,本发明采用的技术方案为:

本发明将CRISPR/Cpf1编辑系统中经突变失活的dCpf1蛋白与FokI核酸酶融合在一起,构建一种高效的gRNA介导的基因定点编辑系统。该方法利用dCpf1的定点作用与核酸酶FokI的剪切作用,通过二聚体的形式进行剪切,可以提高该基因编辑系统的特异性,并达到较低的脱靶率。相对于Cas9蛋白而言,Cpf1蛋白有更大的优势被用来进行基因编辑等操作。所以本发明提供了一种更便捷,更高效的融合蛋白介导的基因定点编辑方法。

本发明的目的通过下述技术方案实现:

一种融合蛋白表达载体,所述融合蛋白表达载体的核酸序列如SEQ ID NO:1所示。

进一步的,所述融合蛋白表达载体为FokI核酸内切酶与无切割活性的Cpf1融合形成的质粒载体pFokI-dCpf1。

进一步的,所述融合蛋白表达载体包括CAG启动子,Kozak序列,两个SV40核定微信号NLS序列,FokI序列,Linker序列,dCpf1序列;

所述CAG启动子序列为SEQ ID NO.1中自5’端第1989-3638位碱基;

所述Kozak序列为SEQ ID NO.1中自5’端第3747-3556位碱基;

所述FokI序列为SEQ ID NO.1中自5’端第4374-4394位碱基;

所述Linker序列为SEQ ID NO.1中自5’端第4401-4988位碱基;

所述dCpf1序列为SEQ ID NO.1中自5’端第5004-8687位碱基;

两个NLS序列分别位于FokI的上游和dCpf1的下游,分别为SEQ ID NO.1中自5’端第4374-4394位碱基和第8694-8714位碱基。

进一步的,所述融合蛋白表达载体的引物序列如下所示:

一种融合蛋白表达载体构建方法,将dCpf1克隆至LB载体上,构建pLB-dCpf1载体,利用BsmBI酶切pLB-dCpf1,切回片段dCpf1;从实验室保存载体上用PCR的方法获得T2A-NLS和FokI片段;随后T2A-NLS、FokI、将dCpf1片段和CAG框架利用金门克隆方法连接在一起,转化至TOP10细胞,挑取单克隆,提质粒后电泳鉴定。

上述融合蛋白表达载体在基因编辑中的应用。

一种融合蛋白介导的定点基因编辑方法,通过无核酶活性的dCpf1与核酸酶FokI融合后,在gRNA引导下,定点编辑基因组靶位点。

进一步的,FokI-dCpf1基因编辑系统包括:用来识别gRNA并剪切的FokI-dCpf1融合蛋白表达质粒和引导FokI-dCpf1融合蛋白定点结合的gRNA表达质粒。

一种gRNA载体,所述载体的核酸序列如SEQ ID NO.2所示。

进一步的,gRNA引物的序列如下所示:

一种FokI和dCpf1融合蛋白介导的定点基因编辑方法,是通过无核酶活性的dCpf1与核酸酶FokI融合后,在gRNA引导下,定点编辑基因组靶位点。所述的FokI-dCpf1基因编辑系统包括:用来识别gRNA并剪切的FokI-dCpf1融合蛋白表达质粒和引导FokI-dCpf1融合蛋白定点结合的gRNA表达质粒。

融合蛋白及其二聚体例如融合蛋白包括两个结构域:1)无核酸酶活性的Cpf1结构域;2)核酸酶区域(如FokI单体提供DNA裂解区域)。dCpf1经D832A突变导致切割缺陷,与FokI融合后,在产生二聚体的情况下才可以发生剪切,更大程度的提高了系统的特异性。

FokI-dCpf1融合蛋白中含有两个核定位信号(NLS)结构域,该结构域为融合蛋白转运到细胞核提供介导信号。

FokI核酸酶与dCpf1蛋白之间含有一个Linker序列(GGGGS)。

一种gRNA表达质粒,在原有框架pSQT1313质粒的基础上,构建含有两个gRNA的表达质粒,gRNA之间含有gRNA scaffold序列(如SEQ ID No.2),该序列能够被dCpf1识别并切开,形成2个gRNA,识别打靶位点,以此来提高gRNA结合的特异性,并在一定程度是降低了脱靶的发生。

针对任意感兴趣基因组位点设计gRNA,均可通过上述FokI-dCpf1基因编辑系统进行编辑,包括但不限于单碱基替换、随机小片段插入/删除突变、基因片段替换、基因敲入和基因敲除等遗传操作。

本发明还提供了pFok1-dCpf1载体在生物基因组中定点整合的方法;包括以下步骤:

1)本发明所述的融合蛋白与DNA结合,如无核酶活性的dCpf1域与FokI的DNA裂解域结合,其中gRNA与生物基因组DNA的一个区域结合,无核酶活性的dCpf1与gRNA结合;2)所述的第二个融合蛋白(FokI-dCpf1)与生物基因组DNA结合,如第二个gRNA与生物基因组DNA的另一个区域结合,而dCpf1与第二个gRNA结合;3)第一步和第二步产生的结合区域会形成核酸酶域的二聚体,所以在融合蛋白结合的位置会发生DNA的剪切。

本发明还提供了与上述质粒融合载体配合使用的gRNA载体的构建方法,将一对gRNA共同构建到一个载体中,所述载体的核酸序列如SEQ ID NO.2

本发明利用Cpf1的特性,剪切选择余地较Cas9更大,构建了不同spacer长度的载体,以pSQT1313-IGF2-spacer 53为例,但不限于该gRNA,其核苷酸序列如SEQ ID NO.2。

有益效果

本发明所采用的是比Cas9效果更好的Cpf1蛋白(也称作Cas12a)。Cpf1蛋白是在CRISPR/Cas系统中发现的新成员,来自于拉热弗朗西丝菌(Francisellanovicida),具有双重切割活性,不仅能切割DNA也切割RNA,除了Cas9以外,这些细菌也会利用Cpf1来切割外源DNA。对比于CRISPR/Cas9系统,CRISPR/Cpf1系统具有五大优势:1)Cpf1蛋白仅需一个RNA分子协助(CrRNA),而Cas9则需要两个RNA分子协助(TracrRNA和CrRNA);2)Cpf1酶分子量比Cas9小,更容易进入细胞,所以编辑成功率会更高;3)Cpf1系统不同的识别序列使该系统定点效率会更好;4)剪切的位置与Cas9不同,会有更大的选择余地;5)Cpf1剪切产生粘性末端,更利于新DNA序列的插入,而Cas9会产生平末端。CRISPR/Cpf1系统相比于Cas9而言会更简单,更精准,脱靶率更低,在基因编辑中具有更好的应用前景。当今对于基因编辑等方面的研究越来越重要,挖掘一套准确定点,特异性好,脱靶率低的基因编辑工具更迫在眉睫。鉴于Cpf1的优势,本发明构建的FokI-Cpf1编辑系统会更符合现在的需求。

本发明将失去切割活性的Cpf1(dCpf1)与Fok1融合,旨在产生一种比fCas9更高效,更便捷,更低脱靶率,更利于生物基因编辑的工具。本发明通过生物体内DNA重组技术,构建了Fok1与切割缺陷型Cas酶(Cpf1)的融合表达系统,该系统表达的融合蛋白在crRNA的引导下在靶位点特异结合形成二聚体复合物,在靶位点进行定点剪切;或将携带外源基因的供体质粒与融合蛋白表达载体(pFok1-Cpf1)及gRNA表达载体共同作用下,在形成二聚体的特异位点剪切后由于HDR(同源重组)作用插入外源基因,从而实现基因大片段高效定点敲入,同时该系统去除了Cpf1的切割作用,只有在二聚体形成的情况下,才可以发生剪切,所以极大地提高了Fok1-Cpf1融合载体整合的特异性,通过识别不同PAM序列,与Fok1-Cas9相比再一次降低了其脱靶率。针对定点介导的基因编辑方法可用作单碱基替换、随机小片段插入/删除突变、基因片段替换、基因敲入和基因敲除,但不限于此。

本发明作为一种高效,低脱靶率的基因编辑工具,在基因编辑、基因治疗和基因功能研究等领域有巨大的应用潜力。

附图说明

图1:dCpf1PCR扩增产物;

图2:pLB-dCpf1质粒;

图3:pCAG-FokI-dCpf1质粒;

图4:pCAG-FokI-dCpf1质粒图谱;

图5:pSQT1313-IGF2-gRNA-spacer7质粒;

图6:pSQT1313-IGF2-gRNA-spacer16,40质粒;

图7:pSQT1313-IGF2-gRNA-spacer18质粒;

图8:pSQT1313-IGF2-gRNA-spacer21质粒;

图9:pSQT1313-IGF2-gRNA-spacer53质粒;

图10:pSQT1313-IGF2-gRNA-spacer53质粒图谱;

图11:各靶位点PCR扩增;

图12:各靶位点T7酶切图;

图13:pLB-spacer53质粒;

图14:spacer53靶位点测序结果比对图。

具体实施方式

实施例1

下述实施例中提到的实验方法,如无特别说明均为常规方法;本发明的实施不限于此。

实施例I、pFok1-dCpf1融合蛋白表达载体的构建及应用

1、pLB-dCpf1载体构建

dCpf1从商品化载体WN10151(Addgene质粒号#53369)上PCR扩增获得(如图1),克隆至LB载体上,构建pLB-dCpf1载体,质粒DNA用1%琼脂糖凝胶电泳检测(如图2)。

2、pFokI-dCpf1融合蛋白表达载体构建

利用BsmBI酶切pLB-dCpf1获得,切回片段dCpf1;用Acc65I和Not1两种酶双切商品化载体pSQT1601(4849bp,5474bp),回收CAG框架4849bp。从实验室保存载体上PCR扩增下来的T2A-NLS,FokI片段(引物序列如表1);随后将T2A-NLS、FokI、dCpf1片段和CAG框架利用金门克隆方法连接在一起,T7连接酶25℃反应30min,转化至TOP10细胞,挑取单克隆,提质粒后电泳鉴定(如图3),疑似正确条带送公司测序鉴定。将正确的载体命名为pCAG-FokI-dCpf1载体,质粒图谱如图4。

表1 FokI-dCpf1载体构建引物

3、p SQT1313-gRNA载体构建

本发明以IGF2基因为例验证该编辑系统的效果,但不限于此基因。利用网站CRISPRscan(https://www.crisprscan.org/)在IGF2第一内含子上设计gRNA,PAM选择为TTTV。本发明根据不同spacer长度(分别为7bp,16bp,18bp,21bp,40bp,53bp)共设计6对gRNA(如表2)进行验证,合成不同间隔序列长度的gRNA引物(如表3),将引物稀释为将引物稀释为100μM,将上下游引物退火形成双链oligo并使用T4PNK使其磷酸化,反应条件如下:gRNA-F 2μL;gRNA-R2μL;T4PNK enzyme 1μL;2X T7 ligase buffer(含ATP)5μL。反应程序:37℃30min,95℃5min,ramp down to 25℃。反应结束后,将退火产物200倍稀释。

通过BsmB1酶切pSQT1313(Addgene质粒号#53370)载体,获得含有Cpf1scaffold(AATTTCTACTAAGTGTAGAT)的框架。连接IGF2-gRNA(不同spacer长度分别为7bp,16bp,18bp,21bp,40bp,53bp)退火产物和SQT1313框架,T7连接酶25℃反应1h,转化至TOP10细胞,挑取单克隆,提质粒后电泳鉴定(如图5-9),疑似正确条带送公司测序鉴定。将正确的载体命名为pSQT1313-IGF2-gRNA-spacer(根据不同spacer长度修改,如pSQT1313-IGF2-gRNA-spacer53),质粒图谱仅以spacer53为例(如图10)。

表2 gRNA序列

表3 gRNA引物序列

4、本实施例以IGF2为目标基因,以小鼠成肌细胞C2C12为模型,成功对目标基因靶序列进行编辑。

1)冻存细胞的复苏与培养

pCAG-FokI-dCpf1和pSQT1313-IGF2-gRNA-spacer质粒用OMEGA无内毒素质粒提取试剂盒(购自OMEGA公司)提取,产物终浓度调整为500ng/ul用于细胞转染。

从液氮中取出装有小鼠成肌细胞C2C12的冻存管(保存于本实验室的细胞),立即投入37-40℃的温水中快速晃动,直至冻存液完全融解;在1-2min内完成复温;将细胞悬液移入无菌的离心管,加入5mL培养液,轻轻吹匀;将细胞悬液800-1000rpm离心5min,弃上清;向含有细胞沉淀的离心管加入1mL完全培养基,轻轻吹匀,将细胞悬液转入细胞培养瓶,加入适量的完全培养基进行培养。

2)细胞转染

将小鼠成肌细胞C2C12分成6组,各组分别转染转500ng pCAG-FokI-dCpf1和500ngpSQT1313-IGF2-gRNA-spacer(7bp,16bp,18bp,21bp,40bp,53bp)质粒,每组3个重复。

转染前24h,向六孔板中各孔含10%胎牛血清(购自GIBCO公司)的2000μLDMEM高糖培养基(购自GIBCO公司)中按3×105个细胞/孔接种6孔板,使细胞在转染前达到约70-80%的汇合;将2种质粒按照1:1质量比混和稀释于用100μL的Opti-MEM(购自GIBCO公司)培养基中,并温和地混匀;将3μLFUGENE转染试剂(购自Promega公司)加入100μL的无血清、无抗生素的Opti-MEM培养基并轻轻混匀,于室温孵育5min;5min后,分别将100μL的转染试剂稀释液加入100μL的各组DNA稀释液中,轻轻混匀并于室温放置20min;将200μL混合物加入到准备好的孔内,轻轻来回晃动培养板,将其置于37℃、饱和湿度、5%CO2的培养箱中培养,于4h后用完全培养基代替转染培养基,完全培养48h后,收集细胞待用。

3)T7EN酶切检测试验

收集转染48h的细胞,使用TIANGEN基因组提取试剂盒提取细胞基因组。利用表4中各gRNA引物对相应靶位点进行PCR扩增,扩增结果如图11。随后利用Takara DNA纯化试剂盒对PCR产物进行纯化,用于后续酶切鉴定试验。共有7组,分别为Spacer length7,Spacerlength16,Spacer length,18,Spacerlength,2,Spacer length40,Spacer length53组及Positive control组。DNA变性体系:250ng靶位点纯化DNA,NEB Buffer2 2μL。程序为:95℃5min,95℃1min,ramp at 65℃(0.2℃/s)45sec,72℃45sec,19个循环;94℃1min,55℃45sec,10个循环;72℃10min。变性的DNA中加入1μL T7内切酶(10U/μl,NEB),37℃15min。酶切产物用2%琼脂糖凝胶进行电泳检测,结果如图12所示。

表4 spacer53靶位点gRNA引物序列

结果表明,用T7核酸内切酶1可识别并剪切不完全配对的DNA,所以FokI-dCpf1系统利用特异的gRNA,定位于靶位点发生剪切作用后,生物基因组会发生非同源末端连接,产生不完全配对的DNA序列,则可用T7EN1酶切开靶位点,若未发生编辑则不会切开。根据图12,图13所示,spacer 7,18,53,40,Positive control,五组产生了两条及以上条带,说明7、18、53、40四对gRNA发生了引导的FokI-Cpf1系统在C2C12细胞中发生了剪切,说明该系统左右基因编辑工具是有效的。

通过Sanger测序发现spacer53的一对gRNA介导的FokI-dCpf1系统在靶位点发生大量突变,具体操作为:500ng pCAG-FokI-dCpf1和500ng pSQT1313-IGF2-gRNA-spacer53共转染C2C12细胞48h后,收集细胞。利用TIAGEN基因组提取试剂盒提取细胞基因组。用表3中给出的靶位点引物进行PCR扩增,后进行TA-克隆,连接至LB载体上,转化至TOP10细胞,挑取单克隆,提质粒后电泳鉴定如图13,送擎科生物有限公司测序,测序结果如图14,可以观测到在C2C12基因组中靶位点位置发生多种突变。结果表明FokI-dCpf1系统是一种有效的基因编辑工具。

序列表

<110> 扬州大学

<120> 一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法

<160> 2

<170> SIPOSequenceListing 1.0

<210> 1

<211> 9958

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 60

tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 120

tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 180

gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 240

aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 300

ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 360

gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 420

ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 480

ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 540

cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 600

attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 660

ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 720

aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 780

gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 840

tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 900

ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 960

taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 1020

atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 1080

actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 1140

cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 1200

agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 1260

gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 1320

gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 1380

gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 1440

gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 1500

cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 1560

ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 1620

accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 1680

aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 1740

aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 1800

caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 1860

ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 1920

gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 1980

cctgggtcga cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt 2040

tcatagccca tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg 2100

accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc 2160

aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc 2220

agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 2280

gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat 2340

ctacgtatta gtcatcgcta ttaccatggt cgaggtgagc cccacgttct gcttcactct 2400

ccccatctcc cccccctccc cacccccaat tttgtattta tttatttttt aattattttg 2460

tgcagcgatg ggggcggggg gggggggggg gcgaggggcg gggcggggcg aggcggagag 2520

gtgcggcggc agccaatcag agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc 2580

ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc gggagtcgct gcgcgctgcc 2640

ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc tgactgaccg 2700

cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt aattagcgct 2760

tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag gggctccggg 2820

agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg cgtgtgtgtg tgcgtgggga 2880

gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc 2940

tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgga 3000

gtcgctgcgc gctgccttcg ccccgtgccc cgcgcggggg gggctgcgag gggaacaaag 3060

gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg tcggtcgggc 3120

tgcaaccccc cctgcacccc cctccccgag ttgctgagca cggcccggct tcgggtgcgg 3180

ggctccgtac ggggcgtggc gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg 3240

gggtgccggg cggggcgggg ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg 3300

gcccccggag cgccggcggc tgtcgaggcg cggcgagccg cagccattgc cttttatggt 3360

aatcgtgcga gagggcgcag ggacttcctt tgtcccaaat ctgtgcggag ccgaaatctg 3420

ggaggcgccg ccgcaccccc tctagcgggc gcggggcgaa gcggtgcggc gccggcagga 3480

aggaaatggg cggggagggc cttcgtgcgt cgccgcgccg ccgtcccctt ctccctctcc 3540

agcctcgggg ctgtccgcgg ggggacggct gccttcgggg gggacggggc agggcggggt 3600

tcggcttctg gcgtgtgacc ggcggctcta gagcctctgc taaccatgtt catgccttct 3660

tctttttcct acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca 3720

aagaattcta atacgactca ctatagggct taagggtacc gcgggcccgg gatccaccgg 3780

tcgccaccat gggtgatcat tatctggata ttcggctgag gcctgatcca gagttcccac 3840

ctgcgcagct gatgtctgtc ctttttggca aacttcatca ggccctggtt gcccagggcg 3900

gagatcggat aggggtaagc tttccagacc tcgacgaaag ccggagccgc ctgggagaac 3960

gcctgcggat ccacgcttct gccgacgatc tgagagcctt gctggcaagg ccatggcttg 4020

aggggctccg ggatcacctg cagtttggcg aacccgccgt tgttccccac ccaacccctt 4080

atcggcaggt gtctagagtg caggccaaat ctaatccaga acggctgcga cggcgactca 4140

tgcggcgaca tgatcttagc gaggaagagg cccgaaaaag aatccctgat accgtggccc 4200

gcgcccttga cttgcctttt gtcacactgc ggtcccagag tacggggcag catttcagac 4260

ttttcattcg acacgggcca ctgcaagtta ccgccgaaga aggaggcttt acttgttatg 4320

gactctccaa gggaggtttc gtgccctggt ttgagggcag aggaagtctg ttaacatgcg 4380

gtgacgtcga ggagaatcct ggcccaatgc ctaagaagaa gcggaaggtg agcagccaac 4440

ttgtgaagtc tgaactcgag gagaaaaaat cagagttgag acacaagttg aagtacgtgc 4500

cacacgaata catcgagctt atcgagatcg ccagaaacag tacccaggat aggatccttg 4560

agatgaaagt catggagttc tttatgaagg tctacggtta tagaggaaag caccttggcg 4620

gtagcagaaa gcccgatggc gccatctata ctgtcggatc tcctatcgat tatggggtga 4680

tcgtggatac caaagcttac tcaggcgggt acaacttgcc cataggacaa gccgacgaga 4740

tgcagcggta tgtcgaagag aaccagacgc gcaacaagca catcaacccc aatgaatggt 4800

ggaaagtgta cccaagtagt gtgactgagt tcaagttcct gtttgtctcc ggccacttta 4860

agggcaatta taaagctcag ctcactagac tcaatcacat cacaaactgc aacggagctg 4920

tgttgtcagt ggaggagctc ctgattggag gcgagatgat caaagccggc acccttacac 4980

tggaggaggt gcggcggaag ttcaacaatg gagagatcaa cttcggtggc ggtggatcca 5040

tgagcaagct ggagaagttt acaaactgct actccctgtc taagaccctg aggttcaagg 5100

ccatccctgt gggcaagacc caggagaaca tcgacaataa gcggctgctg gtggaggacg 5160

agaagagagc cgaggattat aagggcgtga agaagctgct ggatcgctac tatctgtctt 5220

ttatcaacga cgtgctgcac agcatcaagc tgaagaatct gaacaattac atcagcctgt 5280

tccggaagaa aaccagaacc gagaaggaga ataaggagct ggagaacctg gagatcaatc 5340

tgcggaagga gatcgccaag gccttcaagg gcaacgaggg ctacaagtcc ctgtttaaga 5400

aggatatcat cgagacaatc ctgccagagt tcctggacga taaggacgag atcgccctgg 5460

tgaacagctt caatggcttt accacagcct tcaccggctt ctttgataac agagagaata 5520

tgttttccga ggaggccaag agcacatcca tcgccttcag gtgtatcaac gagaatctga 5580

cccgctacat ctctaatatg gacatcttcg agaaggtgga cgccatcttt gataagcacg 5640

aggtgcagga gatcaaggag aagatcctga acagcgacta tgatgtggag gatttctttg 5700

agggcgagtt ctttaacttt gtgctgacac aggagggcat cgacgtgtat aacgccatca 5760

tcggcggctt cgtgaccgag agcggcgaga agatcaaggg cctgaacgag tacatcaacc 5820

tgtataatca gaaaaccaag cagaagctgc ctaagtttaa gccactgtat aagcaggtgc 5880

tgagcgatcg ggagtctctg agcttctacg gcgagggcta tacatccgat gaggaggtgc 5940

tggaggtgtt tagaaacacc ctgaacaaga acagcgagat cttcagctcc atcaagaagc 6000

tggagaagct gttcaagaat tttgacgagt actctagcgc cggcatcttt gtgaagaacg 6060

gccccgccat cagcacaatc tccaaggata tcttcggcga gtggaacgtg atccgggaca 6120

agtggaatgc cgagtatgac gatatccacc tgaagaagaa ggccgtggtg accgagaagt 6180

acgaggacga tcggagaaag tccttcaaga agatcggctc cttttctctg gagcagctgc 6240

aggagtacgc cgacgccgat ctgtctgtgg tggagaagct gaaggagatc atcatccaga 6300

aggtggatga gatctacaag gtgtatggct cctctgagaa gctgttcgac gccgattttg 6360

tgctggagaa gagcctgaag aagaacgacg ccgtggtggc catcatgaag gacctgctgg 6420

attctgtgaa gagcttcgag aattacatca aggccttctt tggcgagggc aaggagacaa 6480

acagggacga gtccttctat ggcgattttg tgctggccta cgacatcctg ctgaaggtgg 6540

accacatcta cgatgccatc cgcaattatg tgacccagaa gccctactct aaggataagt 6600

tcaagctgta ttttcagaac cctcagttca tgggcggctg ggacaaggat aaggagacag 6660

actatcgggc caccatcctg agatacggct ccaagtacta tctggccatc atggataaga 6720

agtacgccaa gtgcctgcag aagatcgaca aggacgatgt gaacggcaat tacgagaaga 6780

tcaactataa gctgctgccc ggccctaata agatgctgcc aaaggtgttc ttttctaaga 6840

agtggatggc ctactataac cccagcgagg acatccagaa gatctacaag aatggcacat 6900

tcaagaaggg cgatatgttt aacctgaatg actgtcacaa gctgatcgac ttctttaagg 6960

atagcatctc ccggtatcca aagtggtcca atgcctacga tttcaacttt tctgagacag 7020

agaagtataa ggacatcgcc ggcttttaca gagaggtgga ggagcagggc tataaggtga 7080

gcttcgagtc tgccagcaag aaggaggtgg ataagctggt ggaggagggc aagctgtata 7140

tgttccagat ctataacaag gacttttccg ataagtctca cggcacaccc aatctgcaca 7200

ccatgtactt caagctgctg tttgacgaga acaatcacgg acagatcagg ctgagcggag 7260

gagcagagct gttcatgagg cgcgcctccc tgaagaagga ggagctggtg gtgcacccag 7320

ccaactcccc tatcgccaac aagaatccag ataatcccaa gaaaaccaca accctgtcct 7380

acgacgtgta taaggataag aggttttctg aggaccagta cgagctgcac atcccaatcg 7440

ccatcaataa gtgccccaag aacatcttca agatcaatac agaggtgcgc gtgctgctga 7500

agcacgacga taacccctat gtgatcggca tcgcgagggg cgagcgcaat ctgctgtata 7560

tcgtggtggt ggacggcaag ggcaacatcg tggagcagta ttccctgaac gagatcatca 7620

acaacttcaa cggcatcagg atcaagacag attaccactc tctgctggac aagaaggaga 7680

aggagaggtt cgaggcccgc cagaactgga cctccatcga gaatatcaag gagctgaagg 7740

ccggctatat ctctcaggtg gtgcacaaga tctgcgagct ggtggagaag tacgatgccg 7800

tgatcgccct ggaggacctg aactctggct ttaagaatag ccgcgtgaag gtggagaagc 7860

aggtgtatca gaagttcgag aagatgctga tcgataagct gaactacatg gtggacaaga 7920

agtctaatcc ttgtgcaaca ggcggcgccc tgaagggcta tcagatcacc aataagttcg 7980

agagctttaa gtccatgtct acccagaacg gcttcatctt ttacatccct gcctggctga 8040

catccaagat cgatccatct accggctttg tgaacctgct gaaaaccaag tataccagca 8100

tcgccgattc caagaagttc atcagctcct ttgacaggat catgtacgtg cccgaggagg 8160

atctgttcga gtttgccctg gactataaga acttctctcg cacagacgcc gattacatca 8220

agaagtggaa gctgtactcc tacggcaacc ggatcagaat cttccggaat cctaagaaga 8280

acaacgtgtt cgactgggag gaggtgtgcc tgaccagcgc ctataaggag ctgttcaaca 8340

agtacggcat caattatcag cagggcgata tcagagccct gctgtgcgag cagtccgaca 8400

aggccttcta ctctagcttt atggccctga tgagcctgat gctgcagatg cggaacagca 8460

tcacaggccg caccgacgtg gattttctga tcagccctgt gaagaactcc gacggcatct 8520

tctacgatag ccggaactat gaggcccagg agaatgccat cctgccaaag aacgccgacg 8580

ccaatggcgc ctataacatc gccagaaagg tgctgtgggc catcggccag ttcaagaagg 8640

ccgaggacga gaagctggat aaggtgaaga tcgccatctc taacaaggag tggctggagt 8700

acgcccagac cagcgtgaag cacggatccc ccaagaagaa gaggaaagtc tcgagcgact 8760

acaaagacca tgacggtgat tataaagatc atgacatcga ttacaaggat gacgatgaca 8820

agtgaagcgg ccgcactcct caggtgcagg ctgcctatca gaaggtggtg gctggtgtgg 8880

ccaatgccct ggctcacaaa taccactgag atctttttcc ctctgccaaa aattatgggg 8940

acatcatgaa gccccttgag catctgactt ctggctaata aaggaaattt attttcattg 9000

caatagtgtg ttggaatttt ttgtgtctct cactcggaag gacatatggg agggcaaatc 9060

atttaaaaca tcagaatgag tatttggttt agagtttggc aacatatgcc catatgctgg 9120

ctgccatgaa caaaggttgg ctataaagag gtcatcagta tatgaaacag ccccctgctg 9180

tccattcctt attccataga aaagccttga cttgaggtta gatttttttt atattttgtt 9240

ttgtgttatt tttttcttta acatccctaa aattttcctt acatgtttta ctagccagat 9300

ttttcctcct ctcctgacta ctcccagtca tagctgtccc tcttctctta tggagatccc 9360

tcgacctgca gcccaagctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 9420

tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 9480

gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 9540

ggaaacctgt cgtgccagcg gatccgcatc tcaattagtc agcaaccata gtcccgcccc 9600

taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg ccccatggct 9660

gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag ctattccaga 9720

agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagctaact tgtttattgc 9780

agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 9840

ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 9900

ccgctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgct 9958

<210> 2

<211> 2321

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

gacgtcgcta gctgtacaaa aaagcaggct ttaaaggaac caattcagtc gactggatcc 60

ggtaccaagg tcgggcagga agagggccta tttcccatga ttccttcata tttgcatata 120

cgatacaagg ctgttagaga gataattaga attaatttga ctgtaaacac aaagatatta 180

gtacaaaata cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta 240

tgttttaaaa tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct 300

ttatatatct tgtggaaagg acgaaacacc gttcactgcc gtataggcag aatttctact 360

aagtgtagat tctgtagtct attgccctaa ctcaatttct actaagtgta gattatctgc 420

agtaatgttc ctgctgaatt tctactaagt gtagatgttc actgccgtat aggcagagct 480

tgggccgctc gaggtacctc tctacatatg acatgtgagc aaaaggccag caaaaggcca 540

ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 600

atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 660

aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 720

gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 780

ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 840

ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 900

acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 960

gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat 1020

ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 1080

ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 1140

gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 1200

ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 1260

agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 1320

ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 1380

gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 1440

catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 1500

cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 1560

cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 1620

gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta 1680

tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 1740

gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 1800

tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 1860

gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 1920

gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 1980

taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 2040

tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 2100

ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 2160

taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 2220

tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 2280

aaataggggt tccgcgcaca tttccccgaa aagtgccacc t 2321

24页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种快速测定CGRP/CGRP受体抗体药物生物学活性的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!