一种植物基因组定向碱基编辑骨架载体及其应用

文档序号:1646940 发布日期:2019-12-24 浏览:25次 >En<

阅读说明:本技术 一种植物基因组定向碱基编辑骨架载体及其应用 (Plant genome directed base editing framework vector and application thereof ) 是由 张勇 唐旭 郑雪莲 任秋蓉 周建平 邓科君 于 2018-11-23 设计创作,主要内容包括:本发明属于基因工程技术领域,具体涉及一种植物基因组定向碱基编辑骨架载体及其应用。本发明要解决的技术问题是提升植物细胞基因组的定向碱基编辑效率、拓展碱基编辑窗口。本发明解决技术问题的技术方案是提供一种植物基因组定向碱基编辑骨架载体,该骨架载体由一个PolⅡ型启动子驱动nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达单元和合成向导RNA(sgRNA)转录表达单元两个核心区域构成的核心单元的转录。本发明单一转录单元定向碱基编辑骨架载体,可有效实现胞嘧啶碱基(C)转变为胸腺嘧啶碱基(T)的简单、快捷、高效定向编辑,是一种有效实现植物基因组碱基定向编辑的分子工具。(The invention belongs to the technical field of genetic engineering, and particularly relates to a plant genome directional base editing framework vector and application thereof. The invention aims to improve the directional base editing efficiency of plant cell genome and expand the base editing window. The technical scheme for solving the technical problem is to provide a plant genome directed base editing framework vector, wherein the framework vector is used for driving the transcription of a core unit consisting of an nCas9-PmCDA1 nuclease-cytosine deaminase fusion protein expression unit and a synthetic guide RNA (sgRNA) transcription expression unit by a Pol II type promoter. The single transcription unit directional base editing framework vector can effectively realize simple, quick and efficient directional editing of converting cytosine base (C) into thymine base (T), and is a molecular tool for effectively realizing directional editing of plant genome base.)

一种植物基因组定向碱基编辑骨架载体及其应用

技术领域

本发明属于植物基因工程领域,涉及一种植物基因组定向碱基编辑骨架载体及其应用。

背景技术

基因组定向修饰一直是生物学研究的前沿与热点领域,通过对基因组特定区域进行精确定向修饰:一方面可以针对目标序列进行精确突变,获得突变材料,对目标基因功能进行明确鉴定;另一方面可以进行目标序列的精确置换或***,将外源基因随机导入造成的表达及遗传的不确定性降至最低。

2012年,研究者首次证明了CRISPR-Cas(Clustered regularly interspacedshort palindromic repeats-CRISPR associated protein)可以实现序列特异性DNA双链剪切,随后CRISPR-Cas9系统在包括食蟹猴、斑马鱼、小鼠、人源细胞系、拟南芥、水稻等动植物系统中实现了基于RNA导向的细胞内基因组定向编辑。在该基因组定向编辑体系中,Cas蛋白在向导RNA引导下,识别并剪切特定DNA序列产生DNA双链断裂(double strandbreaks,DSBs),进而基于细胞内源DNA修复系统实现目标位点DNA序列定向编辑。目前已知的真核生物DNA修复系统可分为两大类:“同源重组”(homologous recombination,HR)修复;“非同源性末端连接”(nonhomologous end joining,NHEJ)修复。HR依据同源序列为模板,精确修复受损DNA区域;而NHEJ则不需要同源序列的存在,直接将DNA损伤形成的断裂末端进行连接,在完成修复的同时往往也引入不同程度的序列变异。

尽管CRISPR-Cas基因组编辑工具可有效实现目标基因组序列定向编辑,但基于NHEJ修复途径的编辑事件主要是在目标修饰位点随机引入碱基***或缺失突变,而基于HR修复途径的编辑事件尽管可依据供体模板DNA精确进行目标修饰位点序列替换,但其发生频率效率远低于NHEJ修复途径介导的编辑事件,极大限制了CRISPR-Cas基因组编辑工具进行精准碱基编辑相关基础研究及应用实践的有效应用。

为了提高基因组目标位点特定碱基精准编辑效率,有效实现目标位点单碱基精准替换编辑,研究者在CRISPR-Cas基因组编辑工具基础上,通过将特定碱基脱氨酶与dCas9、nCas9或你Cas12a进行融合,实现了针对基因组目标位点特定碱基的精准替换编辑(如:碱基C替换为碱基T;碱基A替换为碱基G),这种新型基因组编辑工具被称为碱基编辑器(baseeditor,BE)。定向碱基编辑技术,可以针对基因组目标位点特定单碱基进行有效替换编辑,是CRISPR-Cas基因组编辑技术的有益补充,于2017年被《科学》杂志评为全球十大年度科学突破之一,凸显了该技术在基础研究及应用实践中的重要潜力。

基于CRISPR-Cas系统的定向碱基编辑工具,有效扩展了CRISPR-Cas系统的应用范围,显示了其广泛应用前景。但现有定向碱基编辑工具,普遍存在编辑效率偏低、编辑窗口有限的问题,特别是在植物基因组编辑应用实践中,此类问题更为明显,急需研发具备高碱基编辑效率、宽碱基编辑窗口的增强型植物定向碱基编辑工具,以便有效拓展基于CRISPR-Cas系统的定向碱基编辑技术在植物基因组功能研究及育种实践中的积极应用。

发明内容

本发明要解决的技术问题是提升植物细胞基因组的定向碱基编辑效率、拓展碱基编辑窗口。

本发明解决技术问题的技术方案是提供一种植物基因组定向碱基编辑骨架载体。该骨架载体包含一个由nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达单元和合成向导RNA(sgRNA)转录表达单元两个核心区域构成的核心单元,该核心单元由一个PolⅡ型启动子驱动转录;

所述核心单元从5’到3’方向依次为nCas9 ORF-PmCDA1-Poly A-sgRNA cloningscaffold-T;所述的nCas9 ORF为酿脓链球菌(Streptococcus pyogenes)核酸酶蛋白D10A突变体编码框;PmCDA1为胞嘧啶脱氨酶编码区功能单元;Poly A为多聚A区域;sgRNAcloning scaffold为sgRNA克隆及转录单元,且sgRNA cloning scaffold至少为一个;T为终止子。

其中,上述骨架载体中所述的PmCDA1胞嘧啶脱氨酶编码区功能单元从N端到C端依次包含GGGS接头、SH3接头、PmCDA1编码区、NLS信号肽、UGI编码区、SGGS接头、NLS信号肽。

其中,上述骨架载体符合以下至少一项:

a、nCas9核酸酶蛋白D10A突变体编码框nCas9 ORF所编码的氨基酸序列为Seq IDNo.2中第1位至第1382位氨基酸所示;

b、PmCDA1胞嘧啶脱氨酶编码区功能单元所编码的氨基酸序列为Seq ID No.2中第1383位至第1788位氨基酸所示。

其中,上述骨架载体中所述sgRNA克隆及转录单元sgRNA cloning scaffold从5’端到3’端依次包含tRNA-Gly编码序列、BsaI-ccdB-BsaI单元、sgRNA骨架编码序列、tRNA-Gly编码序列。

其中,上述骨架载体中所述的sgRNA克隆及转录单元为1~6个。

其中,上述骨架载体中所述的sgRNA克隆及转录单元sgRNA cloning scaffold的核苷酸序列为Seq ID No.1中第7432bp至第8300bp所示。

其中,上述骨架载体符合以下至少一项:

a、nCas9核酸酶蛋白D10A突变体编码框nCas9 ORF所编码的核苷酸序列为Seq IDNo.1中第2011bp至第6156bp所示;

b、PmCDA1胞嘧啶脱氨酶编码区功能单元所编码的核苷酸序列为Seq ID No.1中第6157bp至第7374bp所示。

c、多聚A区域Poly A的核苷酸序列为Seq ID No.1中第7384bp至第7431bp所示

d、所述的终止子为水稻HSP终止子HSP T,其核苷酸序列为Seq ID No.1中第8307bp至第8556bp所示的核苷酸序列所示。

e、所述的PolⅡ型启动子为玉米pZmUbi1启动子pZmUbi1,其核苷酸序列为Seq IDNo.1中第1bp至第2008bp所示。

其中,上述骨架载体中所述的核心单元具有pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T的结构。进一步的,所述的pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T核心单元的核苷酸序列如Seq ID No.1所示。

基于上述的骨架载体,本发明还提供了针对植物基因组目标位点特定胞嘧啶碱基进行定向碱基编辑的重组表达载体的制备方法。该方法包括如下步骤:

a、明确特定生物基因组目标DNA区域,分析具有PAM(PAM全称protospaceradjacent motif sequenc,候选识别位点的毗邻基序)特征的区域,选择PAM结构5’端相邻的15~30bpDNA序列作为特异性靶序列;

b、按照选定的特异性靶序列,分别合成具有5’-CGGA-NX-3’特征的正向寡核苷酸链和具有5’-AAAC-NX-3’特征的反向寡核苷酸链,N表示A、G、C、T中的任一种,X为整数,且14≤X≤30,其中所述正向寡核苷酸链中的NX和反向寡核苷酸中的NX具有反向互补特征;通过退火获得互补寡核苷酸双链片段;

c、将权利要求1~9任一项所述的植物基因组定向碱基编辑骨架载体与步骤b得到的互补寡核苷酸双链片段混合,反应体系中同时加入BsaI内切酶及T4 DNA连接酶,设置酶切-连接循环反应,得到针对位点的进行定向碱基编辑的重组表达载体。

进一步的,所述步骤a中特异性靶序列长度为18~21bp。优选的,步骤a中特异性靶序列长度为20bp。

优选的,步骤b中18≤X≤21。

优选的,在实践操作中,步骤c中可应用融合PCR扩增策略,得到由tRNA序列间隔的多个sgRNA转录单元串联扩增产物,通过“BsaI酶切-T4 DNA连接酶连接”循环反应的方式,替换BsaI-ccdB-BsaI单元,将此多sgRNA转录单元克隆入sgRNA克隆及转录单元,得到可针对多个目标位点进行特异定向碱基编辑重组表达载体。

本发明的有益效果在于:本发明通过由一个启动子驱动nCas9-PmCDA1融合蛋白和合成向导RNA(sgRNA)转录表达单元两个核心区域启动,构成了单一转录单元定向碱基编辑骨架载体的核心单元。使用包含了该核心单元的定向碱基编辑骨架载体,可以针对植物基因组目标序列有效实现胞嘧啶碱基(C)转变为胸腺嘧啶碱基(T)的简单、快捷、高效定向编辑。本发明相较于目前使用的植物碱基编辑工具,提升了碱基编辑效率、拓展了碱基编辑窗口,推进了定向碱基编辑策略在植物基因组定向编辑中的有效应用,是一种有效实现植物基因组碱基定向编辑的分子工具,具有很好的应用前景。

附图说明

图1、本发明中植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的核心单元结构及工作示意图。

图2、基于本发明中STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体瞬时转化水稻原生质体,基于Illumina高通量测序的目标位点胞嘧啶定向编辑效率分析。其中,nCas9-PmCDA1代表本发明中植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,nCas9-rApobec1为对照组(依据参考文献报道(Komor AC,Kim YB,Packer MS,Zuris JA,LiuDR.2016.Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.Nature,533(7603):420-424.),将rApobec1胞嘧啶脱氨酶替换本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体中的PmCDA1单元)。

图3基于本发明中STU nCas9-PmCDA1-OsCDC48-sgRNA01重组表达载体瞬时转化水稻原生质体,进行Illumina高通量测序,具体编辑位点处不同位置胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑效率分析。其中,nCas9-PmCDA1及nCas9-rApobec1同图2说明。

图4基于本发明中STU nCas9-PmCDA1-OsROC5-gRNA04重组表达载体瞬时转化水稻原生质体,进行Illumina高通量测序,具体编辑位点处不同位置胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑效率分析。其中,nCas9-PmCDA1及nCas9-rApobec1同图2说明。

图5基于本发明中STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体瞬时转化水稻原生质体,进行Illumina高通量测序,具体编辑位点处不同位置胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑效率分析。其中,nCas9-PmCDA1及nCas9-rApobec1同图2说明。

图6基于本发明中STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体进行农杆菌介导的水稻遗传转化,提取水稻转化再生幼苗基因组DNA,进行PCR扩增及Sanger测序分析,进行目标位点胞嘧啶定向编辑效率分析的结果。

具体实施方式

本发明基于CRISPR-Cas9单一转录系统及PmCDA1胞嘧啶脱氨酶,通过编码区密码子优化、功能单元多元组装等策略,构建了构建了植物基因组定向碱基编辑骨架载体(本发明中也将其称为植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体),

本发明植物基因组定向碱基编辑骨架载体包含一个由nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达单元和合成向导RNA(sgRNA)转录表达单元两个核心区域构成的核心单元,该核心单元由一个PolⅡ型启动子驱动转录;

所述nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达单元,包括nCas9 ORF为酿脓链球菌(Streptococcus pyogenes)核酸酶蛋白D10A突变体编码框;PmCDA1为胞嘧啶脱氨酶编码区功能单元;Poly A为多聚A区域,即nCas9 ORF-PmCDA1-Poly A;

所述核心单元从5’到3’方向依次为nCas9 ORF-PmCDA1-Poly A-sgRNA cloningscaffold-T;所述的nCas9 ORF为酿脓链球菌(Streptococcus pyogenes)核酸酶蛋白D10A突变体编码框;PmCDA1为胞嘧啶脱氨酶编码区功能单元;Poly A为多聚A区域;sgRNAcloning scaffold为sgRNA克隆及转录单元,且sgRNA cloning scaffold至少为一个;T为终止子。

其中,上述骨架载体中所述的PmCDA1胞嘧啶脱氨酶编码区功能单元从N端到C端依次包含GGGS接头、SH3接头、PmCDA1编码区、NLS信号肽、UGI编码区、SGGS接头、NLS信号肽。

其中,上述骨架载体符合以下至少一项:

a、nCas9核酸酶蛋白D10A突变体编码框nCas9 ORF所编码的氨基酸序列为Seq IDNo.2中第1位至第1382位氨基酸所示;

b、PmCDA1胞嘧啶脱氨酶编码区功能单元所编码的氨基酸序列为Seq ID No.2中第1383位至第1788位氨基酸所示。上述两个组件连接构成了nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达框,氨基酸序列为序列表中的Seq ID No.2所示。

其中,上述骨架载体中所述sgRNA克隆及转录单元sgRNA cloning scaffold从5’端到3’端依次包含tRNA-Gly编码序列、BsaI-ccdB-BsaI单元、sgRNA骨架编码序列、tRNA-Gly编码序列。

其中,上述骨架载体中所述的sgRNA克隆及转录单元为1~6个。

其中,上述骨架载体中所述的sgRNA克隆及转录单元sgRNA cloning scaffold的核苷酸序列为Seq ID No.1中第7432bp至第8300bp所示。

其中,上述骨架载体符合以下至少一项:

a、nCas9核酸酶蛋白D10A突变体编码框nCas9 ORF所编码的核苷酸序列为Seq IDNo.1中第2011bp至第6156bp所示;

b、PmCDA1胞嘧啶脱氨酶编码区功能单元所编码的核苷酸序列为Seq ID No.1中第6157bp至第7374bp所示。

c、多聚A区域Poly A的核苷酸序列为Seq ID No.1中第7384bp至第7431bp所示

d、所述的终止子为水稻HSP终止子HSP T,其核苷酸序列为Seq ID No.1中第8307bp至第8556bp所示的核苷酸序列所示。

e、所述的PolⅡ型启动子为玉米pZmUbi1启动子pZmUbi1,其核苷酸序列为Seq IDNo.1中第1bp至第2008bp所示。

其中,上述骨架载体中所述的核心单元具有pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T的结构。进一步的,所述的pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T核心单元的核苷酸序列如Seq ID No.1所示。

本发明的核心单元(pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloningscaffold-HSP T)可以针对具体转化宿主生物及实验需要,将其中的启动子和终止子替换为任何的Pol II型启动子元件(如:植物中常用的OsUb1、CaMV35S、AtUb10等启动子元件)及终止子元件(如:植物中常用的Nos T、35s T等终止子元件),并可以放置于任何植物表达骨架载体中(如:植物中常用的pCambia、pBI、pMDC、pGreen等载体系列),实现位点特异性定向碱基编辑。

本发明中,基于植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,完成构建具体植物基因组位点特异性STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体进行转化后,在活体细胞条件下,PolⅡ启动子驱动“nCas9 ORF-PmCDA1-Poly A-sgRNAcloning scaffold”作为整体转录单元转录得到单链初级转录本。在细胞内源tRNA加工因子作用下,单一初级转录本分别在两个tRNA位点处发生自剪切,得到完整nCas9 ORF-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达框mRNA(含Poly A)及sgRNA转录单元。在细胞体系内,nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达框(含Poly A)进一步进行翻译得到nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白,并和已有的sgRNA单元结合形成功能性的nCas9-PmCDA1-sgRNA复合单元进行基因组目标位点特定胞嘧啶碱基定向编辑。

本发明中,完整的sgRNA由能够与所述靶标片段互补结合的18~21bp RNA片段替换骨架载体sgRNA克隆及转录单元中的BsaI-ccdB-BsaI单元而成,所述骨架RNA片段依次由可以结合protospacer位点的sgRNA、tracrRNA、crRNA嵌合形成类似发夹结构的功能性RNA,所述骨架RNA片段可与Cas9核酸酶结合。

针对具体的目标基因,确定sgRNA位点后(5’-NX-NGG-3’;N表示A、G、C、T中的任一种,X为整数,且14≤X≤30(18、19、20、21为常用值)),依据发明中提供的STU nCas9-PmCDA1-sgRNA重组表达载体构建方法,将设计的sgRNA特异性靶序列(protospacer)“BsaI酶切-T4 DNA连接酶连接”循环反应的方式,替换BsaI-ccdB-BsaI单元克隆入gRNA克隆及转录单元,得到特定的有功能的STU nCas9-PmCDA1-sgRNA重组表达载体。

本发明中,在sgRNA克隆转录框架单元端融合了BsaI-ccdB-BsaI单元,其作用是作为多克隆位点酶切CRISPR/Cas9单一转录单元骨架载体,以便克隆目标gRAN特异性靶序列(protospacer)。可将BsaI-ccdB-BsaI单元替换为可以在本发明骨架载体上引入切口的限制内切酶,并相应修改sgRAN特异性靶序列克隆位点,都可以有效实现本发明的关键内容。

在构建植物基因组位点特异性STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体过程中,可通过转化大肠杆菌、细菌筛选压筛选含正确Cas9-gRNA表达载体的重组克隆,并可采用菌落PCR、质粒酶切、序列测定等方式进行鉴定,以明确获得了用于目的植物基因组位点特异性STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体。

应用融合PCR扩增策略,可以得到由tRNA序列间隔的多个sgRNA转录单元串联扩增产物,通过“BsaI酶切-T4 DNA连接酶连接”循环反应的方式,替换BsaI-ccdB-BsaI单元,可以将此多sgRNA转录单元克隆入sgRNA克隆及转录单元,得到可针对多个目标位点进行特异修饰的STU nCas9-PmCDA1-sgRNA1-sgRNA2-…-sgRNAx重组表达载体(参见图1)。优选的,上述骨架载体中所述的sgRNA克隆及转录单元为1~6个。

本发明中,可通过原生质、基因枪及农杆菌介导的多种转化方法,将依据本发明构建的位点特异性STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体转入植物细胞,使转化细胞同时具有nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白及针对特定基因组目标序列的sgRNA单元;在nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白及sgRNA单元共同作用下,对特定基因组目标序列特定胞嘧啶碱基进行编辑(将其替换为T(大概率)、A(小概率)、G(小概率))。本发明所述的STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体在植物中应用时,可以使用包括卡那霉素、潮霉素、basta等抗性基因进行植物转化子筛选,由阳性转化子细胞或组织(如原生质体或愈伤组织)分化再生,得到而来包含目标位点定向修饰的再生植株。

实施例1植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的构建

本发明设计一种用于植物基因组工程的STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,其核心单元从5’到3’方向依次为pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T。其中:pZmUbi1即玉米pZmUbi1启动子(可通过AscI、SbfI双酶切基础STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的方案,实现不同PolII型启动子的替换);nCas9 ORF为化脓性链球菌(Streptococcus pyogenes)核酸酶蛋白D10A突变体编码框(包含C端NLS信号肽);PmCDA1为胞嘧啶脱氨酶编码区功能单元(从N端到C端依次包含GGGS接头、SH3接头、PmCDA1编码区、NLS信号肽、UGI编码区、SGGS接头、NLS信号肽);Poly A为多聚A区域;sgRNA cloning scaffold(简写为sgRNA CS)即sgRNA克隆及转录单元(从5’端到3’端依次包含tRNA-Gly编码序列、BsaI-ccdB-BsaI单元、sgRNA骨架编码序列、tRNA-Gly编码序列);HSP T即水稻HSP终止子(可通过BamHI、SacI双酶切基础STUnCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的方案,实现不同终止子的替换)。植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体结构及工作原理见图1。

可选地,该骨架载体还包括:T-DNA的左、右边界序列,“pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T”核心单元位于所述T-DNA左、右边界之间;T-DNA的左、右边界序列间还可包括潮霉素抗性基因表达单元(依次组成元件为:2×CaMV35S启动子-hygromycin phosphotransferase ORF-CaMV poly A;可以通过AvrII、PacI双酶切基础CRISPR/Cas9单一转录单元骨架载体的方案,实现不同抗性基因ORF的替换)作为植物转化子筛选标记。

为了实现特定基因组目标STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体的快捷、高效构建,本发明所述的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体在sgRNA转录表达单元的5’端融入637bp的的BsaI-ccdB-BsaI单元,基于此设计策略,在后续目标STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体构建过程中,仅需在构建体系中混合本发明所述的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体、退火的特异性靶序列互补寡核苷酸双链片段、BsaI内切酶及T4 DNA连接酶,并设置“37℃酶切-16℃连接”循环反应,即可实现特定Cas9-gRNA表达载体的有效构建。该载体可以采用现有分子克隆技术中的常规方式来构建,同时需要说明的是上述元件序列是该骨干质粒载体的特有部分,其还可以包括一些常规载体所具有的一般结构,本发明中不再累述。

基于酿脓链球菌(Streptococcus pyogenes)Cas9核酸酶蛋白编码基因(Streptococcus pyogenes Cas9,SpCas9)进行植物密码子优化(3’端添加NLS信号),并引入D10A突变,人工合成nCas9核酸酶蛋白D10A突变体编码框(包含C端NLS编码序列)完整ORF序列,核苷酸序列如Seq ID No.1中第2011bp至第6156bp所示(编码的氨基酸序列如Seq IDNo.2中第1AA至第1382AA所示)。同时,依据七鳃鳗(Petromyzon marinus)胞嘧啶脱氨酶(PmCDA1)检出序列(Nishida K,Arazoe T,Yachie N,Banno S,Kakimoto M,Tabata M,Mochizuki M,Miyabe A,Araki M,Hara KY,Shimatani Z,Kondo A.2016.Targetednucleotide editing using hybrid prokaryotic and vertebrate adaptive immunesystems.Science,353(6305).pii:aaf8729),设计PmCDA1胞嘧啶脱氨酶表达单元编码框(从N端到C端依次包含GGGS接头、SH3接头、PmCDA1编码区、NLS信号肽、UGI编码区、SGGS接头、NLS信号肽),进行植物密码子优化并进行人工合成,核苷酸序列如Seq ID No.1中第6157bp至第7374bp所示(编码的氨基酸序列如Seq ID No.2中第1383AA至第1788AA所示)。进一步,通过人工合成方式得到另外3个基本单元:

a、frag-A:Poly A,核苷酸序列如Seq ID No.1中第7384bp至第7431bp所示;

b、frag-B:sgRNA克隆及转录单元编码序列,从5’端到3’端依次包含tRNA-Gly编码序列、BsaI-ccdB-BsaI单元、sgRNA骨架编码序列、tRNA-Gly编码序列:核苷酸序如Seq IDNo.1中第7432bp至第8300bp所示);

c、frag-C:水稻HSP终止子编码序列,核苷酸序列如Seq ID No.1中第8307bp至第8556bp所示。

通过融合PCR方式,依次将nCas9核酸酶蛋白D10A突变体编码框编码序列、PmCDA1胞嘧啶脱氨酶表达单元编码框编码序列、frag-A、frag-B、frag-C进行融合,并分别在融合PCR产物5’、3’端添加SbfI、SacI限制酶切位点,得到6560bp组装单元。

分别对载体骨架pGEL026(Tang X,Zheng X,Qi YP,Zhang D,Cheng Y,Tang A,Voytas DF,Zhang Y.2016.A single transcript CRISPR-Cas9 system for efficientgenome editing in plants.Molecular Plant,9(7):1088-1091.)及6560bp组装单元进行SbfI、SacI双酶切,回收目标片段,进行连接、转化。针对筛选的阳性克隆进行菌落PCR、质粒限制酶切、DNA测序确认了将6560bp组装单元克隆入了pGEL026原有的pZmUbi1下游,完成植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的构建。

实施例2基于STU nCas9-PmCDA1系统的水稻内源基因胞嘧啶定向碱基编辑效率高通量鉴定

1.水稻内源基因sgRNA设计及STU nCas9-PmCDA1碱基编辑重组表达载体构建

针对水稻OsCDC48(LOC_Os03g05730)、OsROC5(LOC_Os02g45250)编码基因,检索5’-NGG-3’PAM位点,选取PAM上游20bp序列设计sgRNA(表1)。

表1水稻内源基因sgRNAcrRNA设计、合成及检测信息

依据设计的sgRNA位点核酸序列,人工合成对应的正、反向寡核苷酸链,具体序列如下(大写碱基序列代表所设计的位点特异性向导sgRNA位点;小写碱基序列代表与骨架载体互补的粘性末端):

BE-OsCDC48-sgRNA01-F(Seq ID No.10):tgcaGACCAGCCAGCGTCTGGCGC;

BE-OsCDC48-sgRNA01-R(Seq ID No.11):aaacGCGCCAGACGCTGGCTGGTC;

BE-OsROC5-gRNA04-F(Seq ID No.12):tgcaGCAGCTGGCTGAGGGTGCAT;

BE-OsROC5-gRNA04-R(Seq ID No.13):aaacATGCACCCTCAGCCAGCTGC;

BE-OsROC5-gRNA05-F(Seq ID No.14):tgcaAGCCAGCTGCTTACAAAAC;

BE-OsROC5-gRNA05-R(Seq ID No.15):aaacGTTTTGTAAGCAGCTGGCT。

分别将BE-OsCDC48-sgRNA01-F/R、BE-OsROC5-gRNA04-F/R、BE-OsROC5-gRNA05-F/R等比例混合,沸水浴10min,而后自然降温退火,形成具有粘性末端的双链DNA,作为构建重组载体的***片段。于200uL PCR管中加入植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体、粘末端***片段、BsaI内切酶和T4 DNA连接酶,设置“37℃酶切-16℃连接”10个循环反应,80℃处理失活内切及连接酶后,取反应产物进行大肠杆菌转化。

通过卡那霉素抗性筛选、菌落PCR及酶切鉴定阳性转化子,最终通过经测序验证分别得到了STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STUnCas9-PmCDA1-OsROC5-gRNA05重组表达载体。

2.水稻内源基因STU nCas9-PmCDA1-sgRNA碱基编辑重组表达载体的水稻原生质体转化

分离水稻日本晴原生质体,基于PEG介导的转化方法,分别进行STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体的水稻原生质体转化。水稻原生质体转化具体过程可参考文献(Tang X,Zheng X,Qi YP,Zhang D,Cheng Y,Tang A,Voytas DF,Zhang Y.2016.Asingle transcript CRISPR-Cas9 system for efficient genome editing inplants.Molecular Plant,9(7):1088-1091.)中公开的实验方法。

3.水稻内源OsCDC48、OsROC5基因特定位点胞嘧啶碱基定向编辑检测

水稻原生质体转化后,25℃暗培养48小时,收集转化细胞,CTAB方法提取水稻原生质体基因组DNA,以该DNA为模板,进行PCR扩增及Illumina高通量测序,具体方法参考文献(Tang X,Lowder LG,Zhang T,Malzahn A,Zheng X,Voytas DF,Zhong Z,Chen Y,Ren Q,LiQ,Kirkland ER,Zhang Y,Qi Y.2017.A CRISPR-Cpf1 system for efficient genomeediting and transcriptional repression in plants.Nature Plants,3:17018.)中公开的实验方法。

Illumina高通量测序结果分析表明,针对水稻OsCDC48、OsROC5内源基因共3个胞嘧啶碱基编辑目标序列分别实现了28.62%(OsCDC48-sgRNA01)、30.99%(OsROC5-gRNA04)、49.41%(OsROC5-gRNA05)的胞嘧啶碱基替换为胸腺嘧啶碱基的编辑效率(图2:nCas9-PmCDA1)。特别指出的是,作为对照组(依据参考文献报道(Komor AC,Kim YB,PackerMS,Zuris JA,Liu DR.2016.Programmable editing of a target base in genomic DNAwithout double-stranded DNA cleavage.Nature,533(7603):420-424.),将rApobec1胞嘧啶脱氨酶替换本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体中的PmCDA1单元),相同目标序列的胞嘧啶编辑效率分别为7.65%(OsCDC48-sgRNA01)、4.44%(OsROC5-gRNA04)、4.16%(OsROC5-gRNA05)(图2:nCas9-rApobec1)。

针对测定的水稻3个胞嘧啶碱基编辑目标序列,依据Illumina高通量测序结果,进一步分析具体编辑位点处独立胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑效率表明:OsCDC48-sgRNA01处C3、C4、C7、C8、C11、C14共6个胞嘧啶碱基发生了有效胸腺嘧啶碱基替换编辑(图3:nCas9-PmCDA1);OsROC5-gRNA04处C2、C5共2个胞嘧啶碱基发生了有效胸腺嘧啶碱基替换编辑(图4:nCas9-PmCDA1);OsROC5-gRNA05处C-1、C3、C4共3个胞嘧啶碱基发生了有效胸腺嘧啶碱基替换编辑(图5:nCas9-PmCDA1)。特别指出的是,基于本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,在OsROC5-gRNA05处-1bp的C-1位点,检测到了37.94%的胞嘧啶碱基替换为胸腺嘧啶碱基的编辑效率(图5:nCas9-PmCDA1),这种位于sgRNA靶向序列区间外侧的胞嘧啶碱基编辑事件,在现有研究中还未能实现。同时,作为对照组,在测试的3个水稻胞嘧啶碱基编辑目标序列处独立胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑窗口、编辑效率均显著低于本发明实施例(图3:nCas9-rApobec1;图4:nCas9-rApobec1;图5:nCas9-rApobec1;)。

以上测试结果说明,基于本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,可以有效实现水稻内源基因特定区域胞嘧啶碱基高效定向编辑,并可以进一步拓展编辑窗口范围。

实施例3基于STU nCas9-PmCDA1系统的水稻内源基因胞嘧啶定向碱基编辑再生植株创制及效率分析

1.水稻内源基因STU nCas9-PmCDA1-sgRNA碱基编辑重组表达载体的农杆菌转化

将实施例2中成功构建,且于水稻原生质体中检测过定向修饰活性的STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体通过热激法分别转化农杆菌EHA105感受态细胞,涂布在含50毫克/升卡那霉素和50毫克/升利福平的LB固体培养基上,28℃黑暗培养2天后,得到阳性克隆。阳性克隆在含50毫克/升卡那霉素和50毫克/升利福平的LB液体培养基中活化,用于后续转化。

2.农杆菌介导的水稻内源基因STU nCas9-PmCDA1-sgRNA碱基编辑重组表达载体的水稻愈伤转化

将STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STUnCas9-PmCDA1-OsROC5-gRNA05重组表达载体通过农杆菌介导的转化方法,分别进行水稻愈伤组织转化。转化的具体过程参考文献(Tang X,Zheng X,Qi YP,Zhang D,Cheng Y,TangA,Voytas DF,Zhang Y.2016.A single transcript CRISPR-Cas9 system for efficientgenome editing in plants.Molecular Plant,9(7):1088-1091.)中公开的实验方法。

3.水稻内源基因STU nCas9-PmCDA1-sgRNA碱基编辑重组表达载体稳定转化再生植株定向碱基编辑检测及效率分析

待转化后抗性愈伤诱导成水稻幼苗,提取水稻转化再生幼苗基因组DNA,以该DNA为模板进行PCR扩增及Sanger测序分析。STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体水稻转化再生植株分析表明,针对水稻OsCDC48、OsROC5内源基因共3个胞嘧啶碱基编辑目标序列分别实现了44.44%(OsCDC48-sgRNA01:8/18)、100.00%(OsROC5-gRNA04:26/26)、68.75%(OsROC5-gRNA05:11/16)的碱基编辑效率(图6:nCas9-PmCDA1)。该测试结果进一步说明,本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,可以有效实现水稻内源基因特定区域胞嘧啶碱基高效定向编辑,并获得碱基编辑再生植株,是一种有效实现植物基因组碱基定向编辑的分子工具,可以提升基因组工程化作物改良效率。

核苷酸和氨基酸序列

Seq ID No.1:pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T的核苷酸序列

CGCGCCTGCAGTGCAGCGTGACCCGGTCGTGCCCCTCTCTTGAGATAATGAGCATTGCATGTCTAAGTTATAAAAAATTACCACATATTTTTTTTGTCACACTTGTTTGAAGTGCAGTTTATCTATCTTTATACATATATTTAAACTTTACTCTACGAATAATATAATCTATAGTACTACAATAATATCAGTGTTTTAGAGAATCATATAAATGAACAGTTAGACATGGTCTAAAGGACAATTGAGTATTTTGACAACAGGACTCTACAGTTTTATCTTTTTAGTGTGCATGTGTTCTCCTTTTTTTTTGCAAATAGCTTCACCTATATAATACTTCATCCATTTTATTAGTACATCCATTTAGGGTTTAGGGTTAATGGTTTTTATAGACTAATTTTTTTAGTACATCTATTTTATTCTATTTTAGCCTCTAAATTAAGAAAACTAAAACTCTATTTTAGTTTTTTTATTTAATAATTTAGATATAAAATAGAATAAAATAAAGTGACTAAAAATTAAACAAATACCCTTTAAGAAATTAAAAAAACTAAGGAAACATTTTTCTTGTTTCGAGTAGATAATGCCAGCCTGTTAAACGCCGTCGACGAGTCTAACGGACACCAACCAGCGAACCAGCAGCGTCGCGTCGGGCCAAGCGAAGCAGACGGCACGGCATCTCTGTCGCTGCCTCTGGACCCCTCTCGAGAGTTCCGCTCCACCGTTGGACTTGCTCCGCTGTCGGCATCCAGAAATTGCGTGGCGGAGCGGCAGACGTGAGCCGGCACGGCAGGCGGCCTCCTCCTCCTCTCACGGCACCGGCAGCTACGGGGGATTCCTTTCCCACCGCTCCTTCGCTTTCCCTTCCTCGCCCGCCGTAATAAATAGACACCCCCTCCACACCCTCTTTCCCCAACCTCGTGTTGTTCGGAGCGCACACACACACAACCAGAACTCCCCCAAATCCACCCGTCGGCACCTCCGCTTCAAGGTACGCCGCTCGTCCTCCCCCCCCCCCCCTCTCTACCTTCTCAAGATCGGCGTTCCGGTCCATGGTTAGGGCCCGGTAGTTCTACTTCTGTTCATGTTTGTGTTAGATCCGTGTTTGTGTTAGATCCGTGCTACTAGCGTTCGTACACGGATGCGACCTGTACGTCAGACACGTTCTGATTGCTAACTTGCCAGTGTTTCTCTTTGGGGAATCCTGGGATGGCTCTAGCCGTTCCGCAGACGGGATCGATTTCATGATTTTTTTTGTTTCGTTGCATAGGGTTTGGTTTGCCCTTTTCCTTTATTTCAATATATGCCGTGCACTTGTTTGTCGGGTCATCTTTTCATGCTTTTTTTTGTCTTGGTTGTGATGATGTGGTCTGGTTGGGCGGTCGTTCAAGATCGGAGTAGAATTAATTCTGTTTCAAACTACCTGGTGGATTTATTAATTTTGGATCTGTATGTGTGTGCCATACATATTCATAGTTACGAATTGAAGATGATGGATGGAAATATCGATCTAGGATAGGTATACATGTTGATGCGGGTTTTACTGATGCATATACAGAGATGCTTTTTGTTCGCTTGGTTGTGATGATGTGGTGTGGTTGGGCGGTCGTTCATTCGTTCAAGATCGGAGTAGAATACTGTTTCAAACTACCTGGTGTATTTATTAATTTTGGAACTGTATGTGTGTGTCATACATCTTCATAGTTACGAGTTTAAGATGGATGGAAATATCGATCTAGGATAGGTATACATGTTGATGTGGGTTTTACTGATGCATATACATGATGGCATATGCAGCATCTATTCATATGCTCTAACCTTGAGTACCTATCTATTATAATAAACAAGTATGTTTTATAATTATTTTGATCTTGATATACTTGGATGATGGCATATGCAGCAGCTATATGTGGATTTTTTTAGCCCTGCCTTCATACGCTATTTATTTGCTTGGTACTGTTTCTTTTGTCGATGCTCACCCTGTTGTTTGGTGTTACTTCTGCAGCCTGCAGGATGGATAAGAAGTACTCTATCGGACTCGCTATCGGAACTAACTCTGTGGGATGGGCTGTGATCACCGATGAGTACAAGGTGCCATCTAAGAAGTTCAAGGTTCTCGGAAACACCGATAGGCACTCTATCAAGAAAAACCTTATCGGTGCTCTCCTCTTCGATTCTGGTGAAACTGCTGAGGCTACCAGACTCAAGAGAACCGCTAGAAGAAGGTACACCAGAAGAAAGAACAGGATCTGCTACCTCCAAGAGATCTTCTCTAACGAGATGGCTAAAGTGGATGATTCATTCTTCCACAGGCTCGAAGAGTCATTCCTCGTGGAAGAAGATAAGAAGCACGAGAGGCACCCTATCTTCGGAAACATCGTTGATGAGGTGGCATACCACGAGAAGTACCCTACTATCTACCACCTCAGAAAGAAGCTCGTTGATTCTACTGATAAGGCTGATCTCAGGCTCATCTACCTCGCTCTCGCTCACATGATCAAGTTCAGAGGACACTTCCTCATCGAGGGTGATCTCAACCCTGATAACTCTGATGTGGATAAGTTGTTCATCCAGCTCGTGCAGACCTACAACCAGCTTTTCGAAGAGAACCCTATCAACGCTTCAGGTGTGGATGCTAAGGCTATCCTCTCTGCTAGGCTCTCTAAGTCAAGAAGGCTTGAGAACCTCATTGCTCAGCTCCCTGGTGAGAAGAAGAACGGACTTTTCGGAAACTTGATCGCTCTCTCTCTCGGACTCACCCCTAACTTCAAGTCTAACTTCGATCTCGCTGAGGATGCAAAGCTCCAGCTCTCAAAGGATACCTACGATGATGATCTCGATAACCTCCTCGCTCAGATCGGAGATCAGTACGCTGATTTGTTCCTCGCTGCTAAGAACCTCTCTGATGCTATCCTCCTCAGTGATATCCTCAGAGTGAACACCGAGATCACCAAGGCTCCACTCTCAGCTTCTATGATCAAGAGATACGATGAGCACCACCAGGATCTCACACTTCTCAAGGCTCTTGTTAGACAGCAGCTCCCAGAGAAGTACAAAGAGATTTTCTTCGATCAGTCTAAGAACGGATACGCTGGTTACATCGATGGTGGTGCATCTCAAGAAGAGTTCTACAAGTTCATCAAGCCTATCCTCGAGAAGATGGATGGAACCGAGGAACTCCTCGTGAAGCTCAATAGAGAGGATCTTCTCAGAAAGCAGAGGACCTTCGATAACGGATCTATCCCTCATCAGATCCACCTCGGAGAGTTGCACGCTATCCTTAGAAGGCAAGAGGATTTCTACCCATTCCTCAAGGATAACAGGGAAAAGATTGAGAAGATTCTCACCTTCAGAATCCCTTACTACGTGGGACCTCTCGCTAGAGGAAACTCAAGATTCGCTTGGATGACCAGAAAGTCTGAGGAAACCATCACCCCTTGGAACTTCGAAGAGGTGGTGGATAAGGGTGCTAGTGCTCAGTCTTTCATCGAGAGGATGACCAACTTCGATAAGAACCTTCCAAACGAGAAGGTGCTCCCTAAGCACTCTTTGCTCTACGAGTACTTCACCGTGTACAACGAGTTGACCAAGGTTAAGTACGTGACCGAGGGAATGAGGAAGCCTGCTTTTTTGTCAGGTGAGCAAAAGAAGGCTATCGTTGATCTCTTGTTCAAGACCAACAGAAAGGTGACCGTGAAGCAGCTCAAAGAGGATTACTTCAAGAAAATCGAGTGCTTCGATTCAGTTGAGATTTCTGGTGTTGAGGATAGGTTCAACGCATCTCTCGGAACCTACCACGATCTCCTCAAGATCATTAAGGATAAGGATTTCTTGGATAACGAGGAAAACGAGGATATCTTGGAGGATATCGTTCTTACCCTCACCCTCTTTGAAGATAGAGAGATGATTGAAGAAAGGCTCAAGACCTACGCTCATCTCTTCGATGATAAGGTGATGAAGCAGTTGAAGAGAAGAAGATACACTGGTTGGGGAAGGCTCTCAAGAAAGCTCATTAACGGAATCAGGGATAAGCAGTCTGGAAAGACAATCCTTGATTTCCTCAAGTCTGATGGATTCGCTAACAGAAACTTCATGCAGCTCATCCACGATGATTCTCTCACCTTTAAAGAGGATATCCAGAAGGCTCAGGTTTCAGGACAGGGTGATAGTCTCCATGAGCATATCGCTAACCTCGCTGGATCTCCTGCAATCAAGAAGGGAATCCTCCAGACTGTGAAGGTTGTGGATGAGTTGGTGAAGGTGATGGGAAGGCATAAGCCTGAGAACATCGTGATCGAAATGGCTAGAGAGAACCAGACCACTCAGAAGGGACAGAAGAACTCTAGGGAAAGGATGAAGAGGATCGAGGAAGGTATCAAAGAGCTTGGATCTCAGATCCTCAAAGAGCACCCTGTTGAGAACACTCAGCTCCAGAATGAGAAGCTCTACCTCTACTACCTCCAGAACGGAAGGGATATGTATGTGGATCAAGAGTTGGATATCAACAGGCTCTCTGATTACGATGTTGATCATATCGTGCCACAGTCATTCTTGAAGGATGATTCTATCGATAACAAGGTGCTCACCAGGTCTGATAAGAACAGGGGTAAGAGTGATAACGTGCCAAGTGAAGAGGTTGTGAAGAAAATGAAGAACTATTGGAGGCAGCTCCTCAACGCTAAGCTCATCACTCAGAGAAAGTTCGATAACTTGACTAAGGCTGAGAGGGGAGGACTCTCTGAATTGGATAAGGCAGGATTCATCAAGAGGCAGCTTGTGGAAACCAGGCAGATCACTAAGCACGTTGCACAGATCCTCGATTCTAGGATGAACACCAAGTACGATGAGAACGATAAGTTGATCAGGGAAGTGAAGGTTATCACCCTCAAGTCAAAGCTCGTGTCTGATTTCAGAAAGGATTTCCAATTCTACAAGGTGAGGGAAATCAACAACTACCACCACGCTCACGATGCTTACCTTAACGCTGTTGTTGGAACCGCTCTCATCAAGAAGTATCCTAAGCTCGAGTCAGAGTTCGTGTACGGTGATTACAAGGTGTACGATGTGAGGAAGATGATCGCTAAGTCTGAGCAAGAGATCGGAAAGGCTACCGCTAAGTATTTCTTCTACTCTAACATCATGAATTTCTTCAAGACCGAGATTACCCTCGCTAACGGTGAGATCAGAAAGAGGCCACTCATCGAGACAAACGGTGAAACAGGTGAGATCGTGTGGGATAAGGGAAGGGATTTCGCTACCGTTAGAAAGGTGCTCTCTATGCCACAGGTGAACATCGTTAAGAAAACCGAGGTGCAGACCGGTGGATTCTCTAAAGAGTCTATCCTCCCTAAGAGGAACTCTGATAAGCTCATTGCTAGGAAGAAGGATTGGGACCCTAAGAAATACGGTGGTTTCGATTCTCCTACCGTGGCTTACTCTGTTCTCGTTGTGGCTAAGGTTGAGAAGGGAAAGAGTAAGAAGCTCAAGTCTGTTAAGGAACTTCTCGGAATCACTATCATGGAAAGGTCATCTTTCGAGAAGAACCCAATCGATTTCCTCGAGGCTAAGGGATACAAAGAGGTTAAGAAGGATCTCATCATCAAGCTCCCAAAGTACTCACTCTTCGAACTCGAGAACGGTAGAAAGAGGATGCTCGCTTCTGCTGGTGAGCTTCAAAAGGGAAACGAGCTTGCTCTCCCATCTAAGTACGTTAACTTTCTTTACCTCGCTTCTCACTACGAGAAGTTGAAGGGATCTCCAGAAGATAACGAGCAGAAGCAACTTTTCGTTGAGCAGCACAAGCACTACTTGGATGAGATCATCGAGCAGATCTCTGAGTTCTCTAAAAGGGTGATCCTCGCTGATGCAAACCTCGATAAGGTGTTGTCTGCTTACAACAAGCACAGAGATAAGCCTATCAGGGAACAGGCAGAGAACATCATCCATCTCTTCACCCTTACCAACCTCGGTGCTCCTGCTGCTTTCAAGTACTTCGATACAACCATCGATAGGAAGAGATACACCTCTACCAAAGAAGTGCTCGATGCTACCCTCATCCATCAGTCTATCACTGGACTCTACGAGACTAGGATCGATCTCTCACAGCTCGGTGGTGATTCAAGGGCTGATCCTAAGAAGAAGAGGAAGGTTGGAGACGACGGAGGTGGCGGTACAGGAGGGGGTGGGTCCGCTGAGTATGTCAGGGCGTTGTTCGACTTCAATGGAAACGACGAGGAAGATCTGCCTTTTAAAAAGGGAGATATTCTCAGGATCAGAGATAAGCCGGAAGAACAATGGTGGAACGCTGAAGACTCTGAAGGTAAGAGAGGTATGATTCTTGTCCCCTACGTCGAGAAGTATTCGGGTGACTATAAAGACCACGATGGAGATTATAAGGACCACGATATAGATTATAAGGATGATGATGATAAGAGCGGAATGACCGATGCAGAGTACGTCAGGATTCATGAGAAACTTGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCTGTTAGTCACCGCTGTTACGTGCTGTTCGAATTGAAACGCAGAGGTGAGAGGAGAGCCTGCTTTTGGGGCTATGCCGTCAACAAGCCGCAAAGCGGCACAGAAAGGGGCATTCACGCGGAGATATTTAGCATTAGAAAGGTCGAGGAATACCTTCGGGATAATCCCGGGCAATTCACTATCAATTGGTACTCTTCATGGTCCCCGTGTGCAGATTGCGCTGAAAAGATACTGGAGTGGTATAATCAAGAACTCAGAGGAAACGGTCACACCCTCAAGATTTGGGCTTGCAAGCTTTACTACGAGAAAAATGCAAGGAACCAGATCGGCCTCTGGAACTTGCGCGACAACGGCGTGGGGTTGAATGTGATGGTGTCGGAGCATTACCAGTGCTGCCGGAAGATATTCATTCAGTCGTCACATAATCAATTGAACGAGAATAGGTGGCTCGAAAAAACCCTGAAGCGGGCCGAGAAGTGGAGGAGTGAACTCTCGATAATGATCCAGGTTAAAATACTGCATACTACCAAATCTCCGGCGGTGGGACCGAAGAAGAAGCGCAAGGTGGGGACCATGACTAATCTCTCAGATATAATCGAGAAGGAAACAGGAAAGCAACTGGTCATCCAAGAATCGATTTTGATGCTTCCCGAAGAAGTCGAAGAAGTTATAGGAAATAAGCCCGAGTCTGACATACTGGTTCACACAGCGTACGATGAAAGTACGGACGAGAATGTCATGTTGCTGACATCGGACGCACCTGAATACAAGCCTTGGGCTCTGGTCATACAAGATAGTAACGGAGAAAATAAGATTAAAATGCTTTCAGGTGGCTCCCCAAAGAAGAAACGCAAGGTTTGAGGATCTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACAAAGCACCAGTGGTCTAGTGGTAGAATAGTACCCTGCCACGGTACAGACCCGGGTTCGATTCCCGGCTGGTGCAGGAGACCTTATATTCCCCAGAACATCAGGTTAATGGCGTTTTTGATGTCATTTTCGCGGTGGCTGAGATCAGCCACTTCTTCCCCGATAACGGAAACCGGCACACTGGCCATATCGGTGGTCATCATGCGCCAGCTTTCATCCCCGATATGCACCACCGGGTAAAGTTCACGGGAGACTTTATCTGACAGCAGACGTGCACTGGCCAGGGGGATCACCATCCGTCGCCCGGGCGTGTCAATAATATCACTCTGTACATCCACAAACAGACGATAACGGCTCTCTCTTTTATAGGTGTAAACCTTAAACTGCATTTCACCAGCCCCTGTTCTCGTCAGCAAAAGAGCCGTTCATTTCAATAAACCGGGCGACCTCAGCCATCCCTTCCTGATTTTCCGCTTTCCAGCGTTCGGCACGCAGACGACGGGCTTCATTCTGCATGGTTGTGCTTACCAGACCGGAGATATTGACATCATATATGCCTTGAGCAACTGATAGCTGTCGCTGTCAACTGTCACTGTAATACGCTGCTTCATAGCATACCTCTTTTTGACATACTTCGGGTATACATATCAGTATATATTCTTATACCGCAAAAATCAGCGCGCAAATACGCATACTGTTATCTGGCTTGGTCTCAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAACAAAGCACCAGTGGTCTAGTGGTAGAATAGTACCCTGCCACGGTACAGACCCGGGTTCGATTCCCGGCTGGTGCAGGATCCATATGAAGATGAAGATGAAATATTTGGTGTGTCAAATAAAAAGCTTGTGTGCTTAAGTTTGTGTTTTTTTCTTGGCTTGTTGTGTTATGAATTTGTGGCTTTTTCTAATATTAAATGAATGTAAGATCACATTATAATGAATAAACAAATGTTTCTATAATCCATTGTGAATGTTTTGTTGGATCTCTTCTGCAGCATATAACTACTGTATGTGCTATGGTATGGACTATGGAATATGATTAAAGATAAG

Seq ID No.2:nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达框氨基酸序列

MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVGDDGGGGTGGGGSAEYVRALFDFNGNDEEDLPFKKGDILRIRDKPEEQWWNAEDSEGKRGMILVPYVEKYSGDYKDHDGDYKDHDIDYKDDDDKSGMTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKWRSELSIMIQVKILHTTKSPAVGPKKKRKVGTMTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSPKKKRKV。

序列表

<110> 电子科技大学

<120> 一种植物基因组定向碱基编辑骨架载体及其应用

<130> 20180001

<141> 2018-11-23

<160> 15

<170> SIPOSequenceListing 1.0

<210> 1

<211> 8556

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

cgcgcctgca gtgcagcgtg acccggtcgt gcccctctct tgagataatg agcattgcat 60

gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt 120

atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac 180

aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca 240

attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc 300

tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat 360

ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct 420

attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt 480

agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt 540

aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc 600

gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa 660

gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc 720

gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc 780

ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc 840

ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac 900

cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga actcccccaa 960

atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccctct 1020

ctaccttctc aagatcggcg ttccggtcca tggttagggc ccggtagttc tacttctgtt 1080

catgtttgtg ttagatccgt gtttgtgtta gatccgtgct actagcgttc gtacacggat 1140

gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat 1200

cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt 1260

tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc 1320

gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt 1380

cgttcaagat cggagtagaa ttaattctgt ttcaaactac ctggtggatt tattaatttt 1440

ggatctgtat gtgtgtgcca tacatattca tagttacgaa ttgaagatga tggatggaaa 1500

tatcgatcta ggataggtat acatgttgat gcgggtttta ctgatgcata tacagagatg 1560

ctttttgttc gcttggttgt gatgatgtgg tgtggttggg cggtcgttca ttcgttcaag 1620

atcggagtag aatactgttt caaactacct ggtgtattta ttaattttgg aactgtatgt 1680

gtgtgtcata catcttcata gttacgagtt taagatggat ggaaatatcg atctaggata 1740

ggtatacatg ttgatgtggg ttttactgat gcatatacat gatggcatat gcagcatcta 1800

ttcatatgct ctaaccttga gtacctatct attataataa acaagtatgt tttataatta 1860

ttttgatctt gatatacttg gatgatggca tatgcagcag ctatatgtgg atttttttag 1920

ccctgccttc atacgctatt tatttgcttg gtactgtttc ttttgtcgat gctcaccctg 1980

ttgtttggtg ttacttctgc agcctgcagg atggataaga agtactctat cggactcgct 2040

atcggaacta actctgtggg atgggctgtg atcaccgatg agtacaaggt gccatctaag 2100

aagttcaagg ttctcggaaa caccgatagg cactctatca agaaaaacct tatcggtgct 2160

ctcctcttcg attctggtga aactgctgag gctaccagac tcaagagaac cgctagaaga 2220

aggtacacca gaagaaagaa caggatctgc tacctccaag agatcttctc taacgagatg 2280

gctaaagtgg atgattcatt cttccacagg ctcgaagagt cattcctcgt ggaagaagat 2340

aagaagcacg agaggcaccc tatcttcgga aacatcgttg atgaggtggc ataccacgag 2400

aagtacccta ctatctacca cctcagaaag aagctcgttg attctactga taaggctgat 2460

ctcaggctca tctacctcgc tctcgctcac atgatcaagt tcagaggaca cttcctcatc 2520

gagggtgatc tcaaccctga taactctgat gtggataagt tgttcatcca gctcgtgcag 2580

acctacaacc agcttttcga agagaaccct atcaacgctt caggtgtgga tgctaaggct 2640

atcctctctg ctaggctctc taagtcaaga aggcttgaga acctcattgc tcagctccct 2700

ggtgagaaga agaacggact tttcggaaac ttgatcgctc tctctctcgg actcacccct 2760

aacttcaagt ctaacttcga tctcgctgag gatgcaaagc tccagctctc aaaggatacc 2820

tacgatgatg atctcgataa cctcctcgct cagatcggag atcagtacgc tgatttgttc 2880

ctcgctgcta agaacctctc tgatgctatc ctcctcagtg atatcctcag agtgaacacc 2940

gagatcacca aggctccact ctcagcttct atgatcaaga gatacgatga gcaccaccag 3000

gatctcacac ttctcaaggc tcttgttaga cagcagctcc cagagaagta caaagagatt 3060

ttcttcgatc agtctaagaa cggatacgct ggttacatcg atggtggtgc atctcaagaa 3120

gagttctaca agttcatcaa gcctatcctc gagaagatgg atggaaccga ggaactcctc 3180

gtgaagctca atagagagga tcttctcaga aagcagagga ccttcgataa cggatctatc 3240

cctcatcaga tccacctcgg agagttgcac gctatcctta gaaggcaaga ggatttctac 3300

ccattcctca aggataacag ggaaaagatt gagaagattc tcaccttcag aatcccttac 3360

tacgtgggac ctctcgctag aggaaactca agattcgctt ggatgaccag aaagtctgag 3420

gaaaccatca ccccttggaa cttcgaagag gtggtggata agggtgctag tgctcagtct 3480

ttcatcgaga ggatgaccaa cttcgataag aaccttccaa acgagaaggt gctccctaag 3540

cactctttgc tctacgagta cttcaccgtg tacaacgagt tgaccaaggt taagtacgtg 3600

accgagggaa tgaggaagcc tgcttttttg tcaggtgagc aaaagaaggc tatcgttgat 3660

ctcttgttca agaccaacag aaaggtgacc gtgaagcagc tcaaagagga ttacttcaag 3720

aaaatcgagt gcttcgattc agttgagatt tctggtgttg aggataggtt caacgcatct 3780

ctcggaacct accacgatct cctcaagatc attaaggata aggatttctt ggataacgag 3840

gaaaacgagg atatcttgga ggatatcgtt cttaccctca ccctctttga agatagagag 3900

atgattgaag aaaggctcaa gacctacgct catctcttcg atgataaggt gatgaagcag 3960

ttgaagagaa gaagatacac tggttgggga aggctctcaa gaaagctcat taacggaatc 4020

agggataagc agtctggaaa gacaatcctt gatttcctca agtctgatgg attcgctaac 4080

agaaacttca tgcagctcat ccacgatgat tctctcacct ttaaagagga tatccagaag 4140

gctcaggttt caggacaggg tgatagtctc catgagcata tcgctaacct cgctggatct 4200

cctgcaatca agaagggaat cctccagact gtgaaggttg tggatgagtt ggtgaaggtg 4260

atgggaaggc ataagcctga gaacatcgtg atcgaaatgg ctagagagaa ccagaccact 4320

cagaagggac agaagaactc tagggaaagg atgaagagga tcgaggaagg tatcaaagag 4380

cttggatctc agatcctcaa agagcaccct gttgagaaca ctcagctcca gaatgagaag 4440

ctctacctct actacctcca gaacggaagg gatatgtatg tggatcaaga gttggatatc 4500

aacaggctct ctgattacga tgttgatcat atcgtgccac agtcattctt gaaggatgat 4560

tctatcgata acaaggtgct caccaggtct gataagaaca ggggtaagag tgataacgtg 4620

ccaagtgaag aggttgtgaa gaaaatgaag aactattgga ggcagctcct caacgctaag 4680

ctcatcactc agagaaagtt cgataacttg actaaggctg agaggggagg actctctgaa 4740

ttggataagg caggattcat caagaggcag cttgtggaaa ccaggcagat cactaagcac 4800

gttgcacaga tcctcgattc taggatgaac accaagtacg atgagaacga taagttgatc 4860

agggaagtga aggttatcac cctcaagtca aagctcgtgt ctgatttcag aaaggatttc 4920

caattctaca aggtgaggga aatcaacaac taccaccacg ctcacgatgc ttaccttaac 4980

gctgttgttg gaaccgctct catcaagaag tatcctaagc tcgagtcaga gttcgtgtac 5040

ggtgattaca aggtgtacga tgtgaggaag atgatcgcta agtctgagca agagatcgga 5100

aaggctaccg ctaagtattt cttctactct aacatcatga atttcttcaa gaccgagatt 5160

accctcgcta acggtgagat cagaaagagg ccactcatcg agacaaacgg tgaaacaggt 5220

gagatcgtgt gggataaggg aagggatttc gctaccgtta gaaaggtgct ctctatgcca 5280

caggtgaaca tcgttaagaa aaccgaggtg cagaccggtg gattctctaa agagtctatc 5340

ctccctaaga ggaactctga taagctcatt gctaggaaga aggattggga ccctaagaaa 5400

tacggtggtt tcgattctcc taccgtggct tactctgttc tcgttgtggc taaggttgag 5460

aagggaaaga gtaagaagct caagtctgtt aaggaacttc tcggaatcac tatcatggaa 5520

aggtcatctt tcgagaagaa cccaatcgat ttcctcgagg ctaagggata caaagaggtt 5580

aagaaggatc tcatcatcaa gctcccaaag tactcactct tcgaactcga gaacggtaga 5640

aagaggatgc tcgcttctgc tggtgagctt caaaagggaa acgagcttgc tctcccatct 5700

aagtacgtta actttcttta cctcgcttct cactacgaga agttgaaggg atctccagaa 5760

gataacgagc agaagcaact tttcgttgag cagcacaagc actacttgga tgagatcatc 5820

gagcagatct ctgagttctc taaaagggtg atcctcgctg atgcaaacct cgataaggtg 5880

ttgtctgctt acaacaagca cagagataag cctatcaggg aacaggcaga gaacatcatc 5940

catctcttca cccttaccaa cctcggtgct cctgctgctt tcaagtactt cgatacaacc 6000

atcgatagga agagatacac ctctaccaaa gaagtgctcg atgctaccct catccatcag 6060

tctatcactg gactctacga gactaggatc gatctctcac agctcggtgg tgattcaagg 6120

gctgatccta agaagaagag gaaggttgga gacgacggag gtggcggtac aggagggggt 6180

gggtccgctg agtatgtcag ggcgttgttc gacttcaatg gaaacgacga ggaagatctg 6240

ccttttaaaa agggagatat tctcaggatc agagataagc cggaagaaca atggtggaac 6300

gctgaagact ctgaaggtaa gagaggtatg attcttgtcc cctacgtcga gaagtattcg 6360

ggtgactata aagaccacga tggagattat aaggaccacg atatagatta taaggatgat 6420

gatgataaga gcggaatgac cgatgcagag tacgtcagga ttcatgagaa acttgacatc 6480

tacacgttta agaaacagtt tttcaacaac aaaaaatctg ttagtcaccg ctgttacgtg 6540

ctgttcgaat tgaaacgcag aggtgagagg agagcctgct tttggggcta tgccgtcaac 6600

aagccgcaaa gcggcacaga aaggggcatt cacgcggaga tatttagcat tagaaaggtc 6660

gaggaatacc ttcgggataa tcccgggcaa ttcactatca attggtactc ttcatggtcc 6720

ccgtgtgcag attgcgctga aaagatactg gagtggtata atcaagaact cagaggaaac 6780

ggtcacaccc tcaagatttg ggcttgcaag ctttactacg agaaaaatgc aaggaaccag 6840

atcggcctct ggaacttgcg cgacaacggc gtggggttga atgtgatggt gtcggagcat 6900

taccagtgct gccggaagat attcattcag tcgtcacata atcaattgaa cgagaatagg 6960

tggctcgaaa aaaccctgaa gcgggccgag aagtggagga gtgaactctc gataatgatc 7020

caggttaaaa tactgcatac taccaaatct ccggcggtgg gaccgaagaa gaagcgcaag 7080

gtggggacca tgactaatct ctcagatata atcgagaagg aaacaggaaa gcaactggtc 7140

atccaagaat cgattttgat gcttcccgaa gaagtcgaag aagttatagg aaataagccc 7200

gagtctgaca tactggttca cacagcgtac gatgaaagta cggacgagaa tgtcatgttg 7260

ctgacatcgg acgcacctga atacaagcct tgggctctgg tcatacaaga tagtaacgga 7320

gaaaataaga ttaaaatgct ttcaggtggc tccccaaaga agaaacgcaa ggtttgagga 7380

tctaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaacaaagca 7440

ccagtggtct agtggtagaa tagtaccctg ccacggtaca gacccgggtt cgattcccgg 7500

ctggtgcagg agaccttata ttccccagaa catcaggtta atggcgtttt tgatgtcatt 7560

ttcgcggtgg ctgagatcag ccacttcttc cccgataacg gaaaccggca cactggccat 7620

atcggtggtc atcatgcgcc agctttcatc cccgatatgc accaccgggt aaagttcacg 7680

ggagacttta tctgacagca gacgtgcact ggccaggggg atcaccatcc gtcgcccggg 7740

cgtgtcaata atatcactct gtacatccac aaacagacga taacggctct ctcttttata 7800

ggtgtaaacc ttaaactgca tttcaccagc ccctgttctc gtcagcaaaa gagccgttca 7860

tttcaataaa ccgggcgacc tcagccatcc cttcctgatt ttccgctttc cagcgttcgg 7920

cacgcagacg acgggcttca ttctgcatgg ttgtgcttac cagaccggag atattgacat 7980

catatatgcc ttgagcaact gatagctgtc gctgtcaact gtcactgtaa tacgctgctt 8040

catagcatac ctctttttga catacttcgg gtatacatat cagtatatat tcttataccg 8100

caaaaatcag cgcgcaaata cgcatactgt tatctggctt ggtctcagtt ttagagctag 8160

aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 8220

tgcaacaaag caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg 8280

ttcgattccc ggctggtgca ggatccatat gaagatgaag atgaaatatt tggtgtgtca 8340

aataaaaagc ttgtgtgctt aagtttgtgt ttttttcttg gcttgttgtg ttatgaattt 8400

gtggcttttt ctaatattaa atgaatgtaa gatcacatta taatgaataa acaaatgttt 8460

ctataatcca ttgtgaatgt tttgttggat ctcttctgca gcatataact actgtatgtg 8520

ctatggtatg gactatggaa tatgattaaa gataag 8556

<210> 2

<211> 1788

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1010 1015 1020

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser

1025 1030 1035 1040

Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1045 1050 1055

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1060 1065 1070

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser

1075 1080 1085

Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1090 1095 1100

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile

1105 1110 1115 1120

Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1125 1130 1135

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly

1140 1145 1150

Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile

1155 1160 1165

Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1170 1175 1180

Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1185 1190 1195 1200

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1205 1210 1215

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1220 1225 1230

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1250 1255 1260

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val

1265 1270 1275 1280

Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1285 1290 1295

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1300 1305 1310

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp

1315 1320 1325

Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1330 1335 1340

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile

1345 1350 1355 1360

Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys

1365 1370 1375

Arg Lys Val Gly Asp Asp Gly Gly Gly Gly Thr Gly Gly Gly Gly Ser

1380 1385 1390

Ala Glu Tyr Val Arg Ala Leu Phe Asp Phe Asn Gly Asn Asp Glu Glu

1395 1400 1405

Asp Leu Pro Phe Lys Lys Gly Asp Ile Leu Arg Ile Arg Asp Lys Pro

1410 1415 1420

Glu Glu Gln Trp Trp Asn Ala Glu Asp Ser Glu Gly Lys Arg Gly Met

1425 1430 1435 1440

Ile Leu Val Pro Tyr Val Glu Lys Tyr Ser Gly Asp Tyr Lys Asp His

1445 1450 1455

Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp

1460 1465 1470

Lys Ser Gly Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu

1475 1480 1485

Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val

1490 1495 1500

Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg

1505 1510 1515 1520

Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr

1525 1530 1535

Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu

1540 1545 1550

Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser

1555 1560 1565

Trp Ser Pro Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn

1570 1575 1580

Gln Glu Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys

1585 1590 1595 1600

Leu Tyr Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu

1605 1610 1615

Arg Asp Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln

1620 1625 1630

Cys Cys Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu

1635 1640 1645

Asn Arg Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser

1650 1655 1660

Glu Leu Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser

1665 1670 1675 1680

Pro Ala Val Gly Pro Lys Lys Lys Arg Lys Val Gly Thr Met Thr Asn

1685 1690 1695

Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln

1700 1705 1710

Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn

1715 1720 1725

Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr

1730 1735 1740

Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro

1745 1750 1755 1760

Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met

1765 1770 1775

Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val

1780 1785

<210> 3

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

cgacatccgc aagtaccagg 20

<210> 4

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

agtacactgt ttccccgtat gt 22

<210> 5

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

gctgctggtg agtgctgat 19

<210> 6

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

acccattggg agtgtcttgc 20

<210> 7

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

gaccagccag cgtctggcgc 20

<210> 8

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gcagctggct gagggtgcat 20

<210> 9

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

agccagctgc ttacaaaac 19

<210> 10

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

tgcagaccag ccagcgtctg gcgc 24

<210> 12

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

aaacgcgcca gacgctggct ggtc 24

<210> 13

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

tgcagcagct ggctgagggt gcat 24

<210> 13

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

aaacatgcac cctcagccag ctgc 24

<210> 14

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

tgcaagccag ctgcttacaa aac 23

<210> 15

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

aaacgttttg taagcagctg gct 23

34页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:与玉米增加的能育性相关的遗传基因座

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!