一种植物基因组定向碱基编辑骨架载体及其应用
阅读说明:本技术 一种植物基因组定向碱基编辑骨架载体及其应用 (Plant genome directed base editing framework vector and application thereof ) 是由 张勇 唐旭 郑雪莲 任秋蓉 周建平 邓科君 于 2018-11-23 设计创作,主要内容包括:本发明属于基因工程技术领域,具体涉及一种植物基因组定向碱基编辑骨架载体及其应用。本发明要解决的技术问题是提升植物细胞基因组的定向碱基编辑效率、拓展碱基编辑窗口。本发明解决技术问题的技术方案是提供一种植物基因组定向碱基编辑骨架载体,该骨架载体由一个PolⅡ型启动子驱动nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达单元和合成向导RNA(sgRNA)转录表达单元两个核心区域构成的核心单元的转录。本发明单一转录单元定向碱基编辑骨架载体,可有效实现胞嘧啶碱基(C)转变为胸腺嘧啶碱基(T)的简单、快捷、高效定向编辑,是一种有效实现植物基因组碱基定向编辑的分子工具。(The invention belongs to the technical field of genetic engineering, and particularly relates to a plant genome directional base editing framework vector and application thereof. The invention aims to improve the directional base editing efficiency of plant cell genome and expand the base editing window. The technical scheme for solving the technical problem is to provide a plant genome directed base editing framework vector, wherein the framework vector is used for driving the transcription of a core unit consisting of an nCas9-PmCDA1 nuclease-cytosine deaminase fusion protein expression unit and a synthetic guide RNA (sgRNA) transcription expression unit by a Pol II type promoter. The single transcription unit directional base editing framework vector can effectively realize simple, quick and efficient directional editing of converting cytosine base (C) into thymine base (T), and is a molecular tool for effectively realizing directional editing of plant genome base.)
技术领域
本发明属于植物基因工程领域,涉及一种植物基因组定向碱基编辑骨架载体及其应用。
背景技术
基因组定向修饰一直是生物学研究的前沿与热点领域,通过对基因组特定区域进行精确定向修饰:一方面可以针对目标序列进行精确突变,获得突变材料,对目标基因功能进行明确鉴定;另一方面可以进行目标序列的精确置换或***,将外源基因随机导入造成的表达及遗传的不确定性降至最低。
2012年,研究者首次证明了CRISPR-Cas(Clustered regularly interspacedshort palindromic repeats-CRISPR associated protein)可以实现序列特异性DNA双链剪切,随后CRISPR-Cas9系统在包括食蟹猴、斑马鱼、小鼠、人源细胞系、拟南芥、水稻等动植物系统中实现了基于RNA导向的细胞内基因组定向编辑。在该基因组定向编辑体系中,Cas蛋白在向导RNA引导下,识别并剪切特定DNA序列产生DNA双链断裂(double strandbreaks,DSBs),进而基于细胞内源DNA修复系统实现目标位点DNA序列定向编辑。目前已知的真核生物DNA修复系统可分为两大类:“同源重组”(homologous recombination,HR)修复;“非同源性末端连接”(nonhomologous end joining,NHEJ)修复。HR依据同源序列为模板,精确修复受损DNA区域;而NHEJ则不需要同源序列的存在,直接将DNA损伤形成的断裂末端进行连接,在完成修复的同时往往也引入不同程度的序列变异。
尽管CRISPR-Cas基因组编辑工具可有效实现目标基因组序列定向编辑,但基于NHEJ修复途径的编辑事件主要是在目标修饰位点随机引入碱基***或缺失突变,而基于HR修复途径的编辑事件尽管可依据供体模板DNA精确进行目标修饰位点序列替换,但其发生频率效率远低于NHEJ修复途径介导的编辑事件,极大限制了CRISPR-Cas基因组编辑工具进行精准碱基编辑相关基础研究及应用实践的有效应用。
为了提高基因组目标位点特定碱基精准编辑效率,有效实现目标位点单碱基精准替换编辑,研究者在CRISPR-Cas基因组编辑工具基础上,通过将特定碱基脱氨酶与dCas9、nCas9或你Cas12a进行融合,实现了针对基因组目标位点特定碱基的精准替换编辑(如:碱基C替换为碱基T;碱基A替换为碱基G),这种新型基因组编辑工具被称为碱基编辑器(baseeditor,BE)。定向碱基编辑技术,可以针对基因组目标位点特定单碱基进行有效替换编辑,是CRISPR-Cas基因组编辑技术的有益补充,于2017年被《科学》杂志评为全球十大年度科学突破之一,凸显了该技术在基础研究及应用实践中的重要潜力。
基于CRISPR-Cas系统的定向碱基编辑工具,有效扩展了CRISPR-Cas系统的应用范围,显示了其广泛应用前景。但现有定向碱基编辑工具,普遍存在编辑效率偏低、编辑窗口有限的问题,特别是在植物基因组编辑应用实践中,此类问题更为明显,急需研发具备高碱基编辑效率、宽碱基编辑窗口的增强型植物定向碱基编辑工具,以便有效拓展基于CRISPR-Cas系统的定向碱基编辑技术在植物基因组功能研究及育种实践中的积极应用。
发明内容
本发明要解决的技术问题是提升植物细胞基因组的定向碱基编辑效率、拓展碱基编辑窗口。
本发明解决技术问题的技术方案是提供一种植物基因组定向碱基编辑骨架载体。该骨架载体包含一个由nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达单元和合成向导RNA(sgRNA)转录表达单元两个核心区域构成的核心单元,该核心单元由一个PolⅡ型启动子驱动转录;
所述核心单元从5’到3’方向依次为nCas9 ORF-PmCDA1-Poly A-sgRNA cloningscaffold-T;所述的nCas9 ORF为酿脓链球菌(Streptococcus pyogenes)核酸酶蛋白D10A突变体编码框;PmCDA1为胞嘧啶脱氨酶编码区功能单元;Poly A为多聚A区域;sgRNAcloning scaffold为sgRNA克隆及转录单元,且sgRNA cloning scaffold至少为一个;T为终止子。
其中,上述骨架载体中所述的PmCDA1胞嘧啶脱氨酶编码区功能单元从N端到C端依次包含GGGS接头、SH3接头、PmCDA1编码区、NLS信号肽、UGI编码区、SGGS接头、NLS信号肽。
其中,上述骨架载体符合以下至少一项:
a、nCas9核酸酶蛋白D10A突变体编码框nCas9 ORF所编码的氨基酸序列为Seq IDNo.2中第1位至第1382位氨基酸所示;
b、PmCDA1胞嘧啶脱氨酶编码区功能单元所编码的氨基酸序列为Seq ID No.2中第1383位至第1788位氨基酸所示。
其中,上述骨架载体中所述sgRNA克隆及转录单元sgRNA cloning scaffold从5’端到3’端依次包含tRNA-Gly编码序列、BsaI-ccdB-BsaI单元、sgRNA骨架编码序列、tRNA-Gly编码序列。
其中,上述骨架载体中所述的sgRNA克隆及转录单元为1~6个。
其中,上述骨架载体中所述的sgRNA克隆及转录单元sgRNA cloning scaffold的核苷酸序列为Seq ID No.1中第7432bp至第8300bp所示。
其中,上述骨架载体符合以下至少一项:
a、nCas9核酸酶蛋白D10A突变体编码框nCas9 ORF所编码的核苷酸序列为Seq IDNo.1中第2011bp至第6156bp所示;
b、PmCDA1胞嘧啶脱氨酶编码区功能单元所编码的核苷酸序列为Seq ID No.1中第6157bp至第7374bp所示。
c、多聚A区域Poly A的核苷酸序列为Seq ID No.1中第7384bp至第7431bp所示
d、所述的终止子为水稻HSP终止子HSP T,其核苷酸序列为Seq ID No.1中第8307bp至第8556bp所示的核苷酸序列所示。
e、所述的PolⅡ型启动子为玉米pZmUbi1启动子pZmUbi1,其核苷酸序列为Seq IDNo.1中第1bp至第2008bp所示。
其中,上述骨架载体中所述的核心单元具有pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T的结构。进一步的,所述的pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T核心单元的核苷酸序列如Seq ID No.1所示。
基于上述的骨架载体,本发明还提供了针对植物基因组目标位点特定胞嘧啶碱基进行定向碱基编辑的重组表达载体的制备方法。该方法包括如下步骤:
a、明确特定生物基因组目标DNA区域,分析具有PAM(PAM全称protospaceradjacent motif sequenc,候选识别位点的毗邻基序)特征的区域,选择PAM结构5’端相邻的15~30bpDNA序列作为特异性靶序列;
b、按照选定的特异性靶序列,分别合成具有5’-CGGA-NX-3’特征的正向寡核苷酸链和具有5’-AAAC-NX-3’特征的反向寡核苷酸链,N表示A、G、C、T中的任一种,X为整数,且14≤X≤30,其中所述正向寡核苷酸链中的NX和反向寡核苷酸中的NX具有反向互补特征;通过退火获得互补寡核苷酸双链片段;
c、将权利要求1~9任一项所述的植物基因组定向碱基编辑骨架载体与步骤b得到的互补寡核苷酸双链片段混合,反应体系中同时加入BsaI内切酶及T4 DNA连接酶,设置酶切-连接循环反应,得到针对位点的进行定向碱基编辑的重组表达载体。
进一步的,所述步骤a中特异性靶序列长度为18~21bp。优选的,步骤a中特异性靶序列长度为20bp。
优选的,步骤b中18≤X≤21。
优选的,在实践操作中,步骤c中可应用融合PCR扩增策略,得到由tRNA序列间隔的多个sgRNA转录单元串联扩增产物,通过“BsaI酶切-T4 DNA连接酶连接”循环反应的方式,替换BsaI-ccdB-BsaI单元,将此多sgRNA转录单元克隆入sgRNA克隆及转录单元,得到可针对多个目标位点进行特异定向碱基编辑重组表达载体。
本发明的有益效果在于:本发明通过由一个启动子驱动nCas9-PmCDA1融合蛋白和合成向导RNA(sgRNA)转录表达单元两个核心区域启动,构成了单一转录单元定向碱基编辑骨架载体的核心单元。使用包含了该核心单元的定向碱基编辑骨架载体,可以针对植物基因组目标序列有效实现胞嘧啶碱基(C)转变为胸腺嘧啶碱基(T)的简单、快捷、高效定向编辑。本发明相较于目前使用的植物碱基编辑工具,提升了碱基编辑效率、拓展了碱基编辑窗口,推进了定向碱基编辑策略在植物基因组定向编辑中的有效应用,是一种有效实现植物基因组碱基定向编辑的分子工具,具有很好的应用前景。
附图说明
图1、本发明中植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的核心单元结构及工作示意图。
图2、基于本发明中STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体瞬时转化水稻原生质体,基于Illumina高通量测序的目标位点胞嘧啶定向编辑效率分析。其中,nCas9-PmCDA1代表本发明中植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,nCas9-rApobec1为对照组(依据参考文献报道(Komor AC,Kim YB,Packer MS,Zuris JA,LiuDR.2016.Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.Nature,533(7603):420-424.),将rApobec1胞嘧啶脱氨酶替换本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体中的PmCDA1单元)。
图3基于本发明中STU nCas9-PmCDA1-OsCDC48-sgRNA01重组表达载体瞬时转化水稻原生质体,进行Illumina高通量测序,具体编辑位点处不同位置胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑效率分析。其中,nCas9-PmCDA1及nCas9-rApobec1同图2说明。
图4基于本发明中STU nCas9-PmCDA1-OsROC5-gRNA04重组表达载体瞬时转化水稻原生质体,进行Illumina高通量测序,具体编辑位点处不同位置胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑效率分析。其中,nCas9-PmCDA1及nCas9-rApobec1同图2说明。
图5基于本发明中STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体瞬时转化水稻原生质体,进行Illumina高通量测序,具体编辑位点处不同位置胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑效率分析。其中,nCas9-PmCDA1及nCas9-rApobec1同图2说明。
图6基于本发明中STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体进行农杆菌介导的水稻遗传转化,提取水稻转化再生幼苗基因组DNA,进行PCR扩增及Sanger测序分析,进行目标位点胞嘧啶定向编辑效率分析的结果。
具体实施方式
本发明基于CRISPR-Cas9单一转录系统及PmCDA1胞嘧啶脱氨酶,通过编码区密码子优化、功能单元多元组装等策略,构建了构建了植物基因组定向碱基编辑骨架载体(本发明中也将其称为植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体),
本发明植物基因组定向碱基编辑骨架载体包含一个由nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达单元和合成向导RNA(sgRNA)转录表达单元两个核心区域构成的核心单元,该核心单元由一个PolⅡ型启动子驱动转录;
所述nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达单元,包括nCas9 ORF为酿脓链球菌(Streptococcus pyogenes)核酸酶蛋白D10A突变体编码框;PmCDA1为胞嘧啶脱氨酶编码区功能单元;Poly A为多聚A区域,即nCas9 ORF-PmCDA1-Poly A;
所述核心单元从5’到3’方向依次为nCas9 ORF-PmCDA1-Poly A-sgRNA cloningscaffold-T;所述的nCas9 ORF为酿脓链球菌(Streptococcus pyogenes)核酸酶蛋白D10A突变体编码框;PmCDA1为胞嘧啶脱氨酶编码区功能单元;Poly A为多聚A区域;sgRNAcloning scaffold为sgRNA克隆及转录单元,且sgRNA cloning scaffold至少为一个;T为终止子。
其中,上述骨架载体中所述的PmCDA1胞嘧啶脱氨酶编码区功能单元从N端到C端依次包含GGGS接头、SH3接头、PmCDA1编码区、NLS信号肽、UGI编码区、SGGS接头、NLS信号肽。
其中,上述骨架载体符合以下至少一项:
a、nCas9核酸酶蛋白D10A突变体编码框nCas9 ORF所编码的氨基酸序列为Seq IDNo.2中第1位至第1382位氨基酸所示;
b、PmCDA1胞嘧啶脱氨酶编码区功能单元所编码的氨基酸序列为Seq ID No.2中第1383位至第1788位氨基酸所示。上述两个组件连接构成了nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达框,氨基酸序列为序列表中的Seq ID No.2所示。
其中,上述骨架载体中所述sgRNA克隆及转录单元sgRNA cloning scaffold从5’端到3’端依次包含tRNA-Gly编码序列、BsaI-ccdB-BsaI单元、sgRNA骨架编码序列、tRNA-Gly编码序列。
其中,上述骨架载体中所述的sgRNA克隆及转录单元为1~6个。
其中,上述骨架载体中所述的sgRNA克隆及转录单元sgRNA cloning scaffold的核苷酸序列为Seq ID No.1中第7432bp至第8300bp所示。
其中,上述骨架载体符合以下至少一项:
a、nCas9核酸酶蛋白D10A突变体编码框nCas9 ORF所编码的核苷酸序列为Seq IDNo.1中第2011bp至第6156bp所示;
b、PmCDA1胞嘧啶脱氨酶编码区功能单元所编码的核苷酸序列为Seq ID No.1中第6157bp至第7374bp所示。
c、多聚A区域Poly A的核苷酸序列为Seq ID No.1中第7384bp至第7431bp所示
d、所述的终止子为水稻HSP终止子HSP T,其核苷酸序列为Seq ID No.1中第8307bp至第8556bp所示的核苷酸序列所示。
e、所述的PolⅡ型启动子为玉米pZmUbi1启动子pZmUbi1,其核苷酸序列为Seq IDNo.1中第1bp至第2008bp所示。
其中,上述骨架载体中所述的核心单元具有pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T的结构。进一步的,所述的pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T核心单元的核苷酸序列如Seq ID No.1所示。
本发明的核心单元(pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloningscaffold-HSP T)可以针对具体转化宿主生物及实验需要,将其中的启动子和终止子替换为任何的Pol II型启动子元件(如:植物中常用的OsUb1、CaMV35S、AtUb10等启动子元件)及终止子元件(如:植物中常用的Nos T、35s T等终止子元件),并可以放置于任何植物表达骨架载体中(如:植物中常用的pCambia、pBI、pMDC、pGreen等载体系列),实现位点特异性定向碱基编辑。
本发明中,基于植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,完成构建具体植物基因组位点特异性STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体进行转化后,在活体细胞条件下,PolⅡ启动子驱动“nCas9 ORF-PmCDA1-Poly A-sgRNAcloning scaffold”作为整体转录单元转录得到单链初级转录本。在细胞内源tRNA加工因子作用下,单一初级转录本分别在两个tRNA位点处发生自剪切,得到完整nCas9 ORF-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达框mRNA(含Poly A)及sgRNA转录单元。在细胞体系内,nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达框(含Poly A)进一步进行翻译得到nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白,并和已有的sgRNA单元结合形成功能性的nCas9-PmCDA1-sgRNA复合单元进行基因组目标位点特定胞嘧啶碱基定向编辑。
本发明中,完整的sgRNA由能够与所述靶标片段互补结合的18~21bp RNA片段替换骨架载体sgRNA克隆及转录单元中的BsaI-ccdB-BsaI单元而成,所述骨架RNA片段依次由可以结合protospacer位点的sgRNA、tracrRNA、crRNA嵌合形成类似发夹结构的功能性RNA,所述骨架RNA片段可与Cas9核酸酶结合。
针对具体的目标基因,确定sgRNA位点后(5’-NX-NGG-3’;N表示A、G、C、T中的任一种,X为整数,且14≤X≤30(18、19、20、21为常用值)),依据发明中提供的STU nCas9-PmCDA1-sgRNA重组表达载体构建方法,将设计的sgRNA特异性靶序列(protospacer)“BsaI酶切-T4 DNA连接酶连接”循环反应的方式,替换BsaI-ccdB-BsaI单元克隆入gRNA克隆及转录单元,得到特定的有功能的STU nCas9-PmCDA1-sgRNA重组表达载体。
本发明中,在sgRNA克隆转录框架单元端融合了BsaI-ccdB-BsaI单元,其作用是作为多克隆位点酶切CRISPR/Cas9单一转录单元骨架载体,以便克隆目标gRAN特异性靶序列(protospacer)。可将BsaI-ccdB-BsaI单元替换为可以在本发明骨架载体上引入切口的限制内切酶,并相应修改sgRAN特异性靶序列克隆位点,都可以有效实现本发明的关键内容。
在构建植物基因组位点特异性STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体过程中,可通过转化大肠杆菌、细菌筛选压筛选含正确Cas9-gRNA表达载体的重组克隆,并可采用菌落PCR、质粒酶切、序列测定等方式进行鉴定,以明确获得了用于目的植物基因组位点特异性STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体。
应用融合PCR扩增策略,可以得到由tRNA序列间隔的多个sgRNA转录单元串联扩增产物,通过“BsaI酶切-T4 DNA连接酶连接”循环反应的方式,替换BsaI-ccdB-BsaI单元,可以将此多sgRNA转录单元克隆入sgRNA克隆及转录单元,得到可针对多个目标位点进行特异修饰的STU nCas9-PmCDA1-sgRNA1-sgRNA2-…-sgRNAx重组表达载体(参见图1)。优选的,上述骨架载体中所述的sgRNA克隆及转录单元为1~6个。
本发明中,可通过原生质、基因枪及农杆菌介导的多种转化方法,将依据本发明构建的位点特异性STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体转入植物细胞,使转化细胞同时具有nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白及针对特定基因组目标序列的sgRNA单元;在nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白及sgRNA单元共同作用下,对特定基因组目标序列特定胞嘧啶碱基进行编辑(将其替换为T(大概率)、A(小概率)、G(小概率))。本发明所述的STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体在植物中应用时,可以使用包括卡那霉素、潮霉素、basta等抗性基因进行植物转化子筛选,由阳性转化子细胞或组织(如原生质体或愈伤组织)分化再生,得到而来包含目标位点定向修饰的再生植株。
实施例1植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的构建
本发明设计一种用于植物基因组工程的STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,其核心单元从5’到3’方向依次为pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T。其中:pZmUbi1即玉米pZmUbi1启动子(可通过AscI、SbfI双酶切基础STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的方案,实现不同PolII型启动子的替换);nCas9 ORF为化脓性链球菌(Streptococcus pyogenes)核酸酶蛋白D10A突变体编码框(包含C端NLS信号肽);PmCDA1为胞嘧啶脱氨酶编码区功能单元(从N端到C端依次包含GGGS接头、SH3接头、PmCDA1编码区、NLS信号肽、UGI编码区、SGGS接头、NLS信号肽);Poly A为多聚A区域;sgRNA cloning scaffold(简写为sgRNA CS)即sgRNA克隆及转录单元(从5’端到3’端依次包含tRNA-Gly编码序列、BsaI-ccdB-BsaI单元、sgRNA骨架编码序列、tRNA-Gly编码序列);HSP T即水稻HSP终止子(可通过BamHI、SacI双酶切基础STUnCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的方案,实现不同终止子的替换)。植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体结构及工作原理见图1。
可选地,该骨架载体还包括:T-DNA的左、右边界序列,“pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T”核心单元位于所述T-DNA左、右边界之间;T-DNA的左、右边界序列间还可包括潮霉素抗性基因表达单元(依次组成元件为:2×CaMV35S启动子-hygromycin phosphotransferase ORF-CaMV poly A;可以通过AvrII、PacI双酶切基础CRISPR/Cas9单一转录单元骨架载体的方案,实现不同抗性基因ORF的替换)作为植物转化子筛选标记。
为了实现特定基因组目标STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体的快捷、高效构建,本发明所述的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体在sgRNA转录表达单元的5’端融入637bp的的BsaI-ccdB-BsaI单元,基于此设计策略,在后续目标STU nCas9-PmCDA1-sgRNA定向碱基编辑重组表达载体构建过程中,仅需在构建体系中混合本发明所述的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体、退火的特异性靶序列互补寡核苷酸双链片段、BsaI内切酶及T4 DNA连接酶,并设置“37℃酶切-16℃连接”循环反应,即可实现特定Cas9-gRNA表达载体的有效构建。该载体可以采用现有分子克隆技术中的常规方式来构建,同时需要说明的是上述元件序列是该骨干质粒载体的特有部分,其还可以包括一些常规载体所具有的一般结构,本发明中不再累述。
基于酿脓链球菌(Streptococcus pyogenes)Cas9核酸酶蛋白编码基因(Streptococcus pyogenes Cas9,SpCas9)进行植物密码子优化(3’端添加NLS信号),并引入D10A突变,人工合成nCas9核酸酶蛋白D10A突变体编码框(包含C端NLS编码序列)完整ORF序列,核苷酸序列如Seq ID No.1中第2011bp至第6156bp所示(编码的氨基酸序列如Seq IDNo.2中第1AA至第1382AA所示)。同时,依据七鳃鳗(Petromyzon marinus)胞嘧啶脱氨酶(PmCDA1)检出序列(Nishida K,Arazoe T,Yachie N,Banno S,Kakimoto M,Tabata M,Mochizuki M,Miyabe A,Araki M,Hara KY,Shimatani Z,Kondo A.2016.Targetednucleotide editing using hybrid prokaryotic and vertebrate adaptive immunesystems.Science,353(6305).pii:aaf8729),设计PmCDA1胞嘧啶脱氨酶表达单元编码框(从N端到C端依次包含GGGS接头、SH3接头、PmCDA1编码区、NLS信号肽、UGI编码区、SGGS接头、NLS信号肽),进行植物密码子优化并进行人工合成,核苷酸序列如Seq ID No.1中第6157bp至第7374bp所示(编码的氨基酸序列如Seq ID No.2中第1383AA至第1788AA所示)。进一步,通过人工合成方式得到另外3个基本单元:
a、frag-A:Poly A,核苷酸序列如Seq ID No.1中第7384bp至第7431bp所示;
b、frag-B:sgRNA克隆及转录单元编码序列,从5’端到3’端依次包含tRNA-Gly编码序列、BsaI-ccdB-BsaI单元、sgRNA骨架编码序列、tRNA-Gly编码序列:核苷酸序如Seq IDNo.1中第7432bp至第8300bp所示);
c、frag-C:水稻HSP终止子编码序列,核苷酸序列如Seq ID No.1中第8307bp至第8556bp所示。
通过融合PCR方式,依次将nCas9核酸酶蛋白D10A突变体编码框编码序列、PmCDA1胞嘧啶脱氨酶表达单元编码框编码序列、frag-A、frag-B、frag-C进行融合,并分别在融合PCR产物5’、3’端添加SbfI、SacI限制酶切位点,得到6560bp组装单元。
分别对载体骨架pGEL026(Tang X,Zheng X,Qi YP,Zhang D,Cheng Y,Tang A,Voytas DF,Zhang Y.2016.A single transcript CRISPR-Cas9 system for efficientgenome editing in plants.Molecular Plant,9(7):1088-1091.)及6560bp组装单元进行SbfI、SacI双酶切,回收目标片段,进行连接、转化。针对筛选的阳性克隆进行菌落PCR、质粒限制酶切、DNA测序确认了将6560bp组装单元克隆入了pGEL026原有的pZmUbi1下游,完成植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体的构建。
实施例2基于STU nCas9-PmCDA1系统的水稻内源基因胞嘧啶定向碱基编辑效率高通量鉴定
1.水稻内源基因sgRNA设计及STU nCas9-PmCDA1碱基编辑重组表达载体构建
针对水稻OsCDC48(LOC_Os03g05730)、OsROC5(LOC_Os02g45250)编码基因,检索5’-NGG-3’PAM位点,选取PAM上游20bp序列设计sgRNA(表1)。
表1水稻内源基因sgRNAcrRNA设计、合成及检测信息
依据设计的sgRNA位点核酸序列,人工合成对应的正、反向寡核苷酸链,具体序列如下(大写碱基序列代表所设计的位点特异性向导sgRNA位点;小写碱基序列代表与骨架载体互补的粘性末端):
BE-OsCDC48-sgRNA01-F(Seq ID No.10):tgcaGACCAGCCAGCGTCTGGCGC;
BE-OsCDC48-sgRNA01-R(Seq ID No.11):aaacGCGCCAGACGCTGGCTGGTC;
BE-OsROC5-gRNA04-F(Seq ID No.12):tgcaGCAGCTGGCTGAGGGTGCAT;
BE-OsROC5-gRNA04-R(Seq ID No.13):aaacATGCACCCTCAGCCAGCTGC;
BE-OsROC5-gRNA05-F(Seq ID No.14):tgcaAGCCAGCTGCTTACAAAAC;
BE-OsROC5-gRNA05-R(Seq ID No.15):aaacGTTTTGTAAGCAGCTGGCT。
分别将BE-OsCDC48-sgRNA01-F/R、BE-OsROC5-gRNA04-F/R、BE-OsROC5-gRNA05-F/R等比例混合,沸水浴10min,而后自然降温退火,形成具有粘性末端的双链DNA,作为构建重组载体的***片段。于200uL PCR管中加入植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体、粘末端***片段、BsaI内切酶和T4 DNA连接酶,设置“37℃酶切-16℃连接”10个循环反应,80℃处理失活内切及连接酶后,取反应产物进行大肠杆菌转化。
通过卡那霉素抗性筛选、菌落PCR及酶切鉴定阳性转化子,最终通过经测序验证分别得到了STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STUnCas9-PmCDA1-OsROC5-gRNA05重组表达载体。
2.水稻内源基因STU nCas9-PmCDA1-sgRNA碱基编辑重组表达载体的水稻原生质体转化
分离水稻日本晴原生质体,基于PEG介导的转化方法,分别进行STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体的水稻原生质体转化。水稻原生质体转化具体过程可参考文献(Tang X,Zheng X,Qi YP,Zhang D,Cheng Y,Tang A,Voytas DF,Zhang Y.2016.Asingle transcript CRISPR-Cas9 system for efficient genome editing inplants.Molecular Plant,9(7):1088-1091.)中公开的实验方法。
3.水稻内源OsCDC48、OsROC5基因特定位点胞嘧啶碱基定向编辑检测
水稻原生质体转化后,25℃暗培养48小时,收集转化细胞,CTAB方法提取水稻原生质体基因组DNA,以该DNA为模板,进行PCR扩增及Illumina高通量测序,具体方法参考文献(Tang X,Lowder LG,Zhang T,Malzahn A,Zheng X,Voytas DF,Zhong Z,Chen Y,Ren Q,LiQ,Kirkland ER,Zhang Y,Qi Y.2017.A CRISPR-Cpf1 system for efficient genomeediting and transcriptional repression in plants.Nature Plants,3:17018.)中公开的实验方法。
Illumina高通量测序结果分析表明,针对水稻OsCDC48、OsROC5内源基因共3个胞嘧啶碱基编辑目标序列分别实现了28.62%(OsCDC48-sgRNA01)、30.99%(OsROC5-gRNA04)、49.41%(OsROC5-gRNA05)的胞嘧啶碱基替换为胸腺嘧啶碱基的编辑效率(图2:nCas9-PmCDA1)。特别指出的是,作为对照组(依据参考文献报道(Komor AC,Kim YB,PackerMS,Zuris JA,Liu DR.2016.Programmable editing of a target base in genomic DNAwithout double-stranded DNA cleavage.Nature,533(7603):420-424.),将rApobec1胞嘧啶脱氨酶替换本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体中的PmCDA1单元),相同目标序列的胞嘧啶编辑效率分别为7.65%(OsCDC48-sgRNA01)、4.44%(OsROC5-gRNA04)、4.16%(OsROC5-gRNA05)(图2:nCas9-rApobec1)。
针对测定的水稻3个胞嘧啶碱基编辑目标序列,依据Illumina高通量测序结果,进一步分析具体编辑位点处独立胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑效率表明:OsCDC48-sgRNA01处C3、C4、C7、C8、C11、C14共6个胞嘧啶碱基发生了有效胸腺嘧啶碱基替换编辑(图3:nCas9-PmCDA1);OsROC5-gRNA04处C2、C5共2个胞嘧啶碱基发生了有效胸腺嘧啶碱基替换编辑(图4:nCas9-PmCDA1);OsROC5-gRNA05处C-1、C3、C4共3个胞嘧啶碱基发生了有效胸腺嘧啶碱基替换编辑(图5:nCas9-PmCDA1)。特别指出的是,基于本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,在OsROC5-gRNA05处-1bp的C-1位点,检测到了37.94%的胞嘧啶碱基替换为胸腺嘧啶碱基的编辑效率(图5:nCas9-PmCDA1),这种位于sgRNA靶向序列区间外侧的胞嘧啶碱基编辑事件,在现有研究中还未能实现。同时,作为对照组,在测试的3个水稻胞嘧啶碱基编辑目标序列处独立胞嘧啶碱基位点替换为胸腺嘧啶碱基的编辑窗口、编辑效率均显著低于本发明实施例(图3:nCas9-rApobec1;图4:nCas9-rApobec1;图5:nCas9-rApobec1;)。
以上测试结果说明,基于本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,可以有效实现水稻内源基因特定区域胞嘧啶碱基高效定向编辑,并可以进一步拓展编辑窗口范围。
实施例3基于STU nCas9-PmCDA1系统的水稻内源基因胞嘧啶定向碱基编辑再生植株创制及效率分析
1.水稻内源基因STU nCas9-PmCDA1-sgRNA碱基编辑重组表达载体的农杆菌转化
将实施例2中成功构建,且于水稻原生质体中检测过定向修饰活性的STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体通过热激法分别转化农杆菌EHA105感受态细胞,涂布在含50毫克/升卡那霉素和50毫克/升利福平的LB固体培养基上,28℃黑暗培养2天后,得到阳性克隆。阳性克隆在含50毫克/升卡那霉素和50毫克/升利福平的LB液体培养基中活化,用于后续转化。
2.农杆菌介导的水稻内源基因STU nCas9-PmCDA1-sgRNA碱基编辑重组表达载体的水稻愈伤转化
将STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STUnCas9-PmCDA1-OsROC5-gRNA05重组表达载体通过农杆菌介导的转化方法,分别进行水稻愈伤组织转化。转化的具体过程参考文献(Tang X,Zheng X,Qi YP,Zhang D,Cheng Y,TangA,Voytas DF,Zhang Y.2016.A single transcript CRISPR-Cas9 system for efficientgenome editing in plants.Molecular Plant,9(7):1088-1091.)中公开的实验方法。
3.水稻内源基因STU nCas9-PmCDA1-sgRNA碱基编辑重组表达载体稳定转化再生植株定向碱基编辑检测及效率分析
待转化后抗性愈伤诱导成水稻幼苗,提取水稻转化再生幼苗基因组DNA,以该DNA为模板进行PCR扩增及Sanger测序分析。STU nCas9-PmCDA1-OsCDC48-sgRNA01、STU nCas9-PmCDA1-OsROC5-gRNA04、STU nCas9-PmCDA1-OsROC5-gRNA05重组表达载体水稻转化再生植株分析表明,针对水稻OsCDC48、OsROC5内源基因共3个胞嘧啶碱基编辑目标序列分别实现了44.44%(OsCDC48-sgRNA01:8/18)、100.00%(OsROC5-gRNA04:26/26)、68.75%(OsROC5-gRNA05:11/16)的碱基编辑效率(图6:nCas9-PmCDA1)。该测试结果进一步说明,本发明构建的植物STU nCas9-PmCDA1单一转录单元定向碱基编辑骨架载体,可以有效实现水稻内源基因特定区域胞嘧啶碱基高效定向编辑,并获得碱基编辑再生植株,是一种有效实现植物基因组碱基定向编辑的分子工具,可以提升基因组工程化作物改良效率。
核苷酸和氨基酸序列
Seq ID No.1:pZmUbi1-nCas9 ORF-PmCDA1-Poly A-sgRNA cloning scaffold-HSP T的核苷酸序列
CGCGCCTGCAGTGCAGCGTGACCCGGTCGTGCCCCTCTCTTGAGATAATGAGCATTGCATGTCTAAGTTATAAAAAATTACCACATATTTTTTTTGTCACACTTGTTTGAAGTGCAGTTTATCTATCTTTATACATATATTTAAACTTTACTCTACGAATAATATAATCTATAGTACTACAATAATATCAGTGTTTTAGAGAATCATATAAATGAACAGTTAGACATGGTCTAAAGGACAATTGAGTATTTTGACAACAGGACTCTACAGTTTTATCTTTTTAGTGTGCATGTGTTCTCCTTTTTTTTTGCAAATAGCTTCACCTATATAATACTTCATCCATTTTATTAGTACATCCATTTAGGGTTTAGGGTTAATGGTTTTTATAGACTAATTTTTTTAGTACATCTATTTTATTCTATTTTAGCCTCTAAATTAAGAAAACTAAAACTCTATTTTAGTTTTTTTATTTAATAATTTAGATATAAAATAGAATAAAATAAAGTGACTAAAAATTAAACAAATACCCTTTAAGAAATTAAAAAAACTAAGGAAACATTTTTCTTGTTTCGAGTAGATAATGCCAGCCTGTTAAACGCCGTCGACGAGTCTAACGGACACCAACCAGCGAACCAGCAGCGTCGCGTCGGGCCAAGCGAAGCAGACGGCACGGCATCTCTGTCGCTGCCTCTGGACCCCTCTCGAGAGTTCCGCTCCACCGTTGGACTTGCTCCGCTGTCGGCATCCAGAAATTGCGTGGCGGAGCGGCAGACGTGAGCCGGCACGGCAGGCGGCCTCCTCCTCCTCTCACGGCACCGGCAGCTACGGGGGATTCCTTTCCCACCGCTCCTTCGCTTTCCCTTCCTCGCCCGCCGTAATAAATAGACACCCCCTCCACACCCTCTTTCCCCAACCTCGTGTTGTTCGGAGCGCACACACACACAACCAGAACTCCCCCAAATCCACCCGTCGGCACCTCCGCTTCAAGGTACGCCGCTCGTCCTCCCCCCCCCCCCCTCTCTACCTTCTCAAGATCGGCGTTCCGGTCCATGGTTAGGGCCCGGTAGTTCTACTTCTGTTCATGTTTGTGTTAGATCCGTGTTTGTGTTAGATCCGTGCTACTAGCGTTCGTACACGGATGCGACCTGTACGTCAGACACGTTCTGATTGCTAACTTGCCAGTGTTTCTCTTTGGGGAATCCTGGGATGGCTCTAGCCGTTCCGCAGACGGGATCGATTTCATGATTTTTTTTGTTTCGTTGCATAGGGTTTGGTTTGCCCTTTTCCTTTATTTCAATATATGCCGTGCACTTGTTTGTCGGGTCATCTTTTCATGCTTTTTTTTGTCTTGGTTGTGATGATGTGGTCTGGTTGGGCGGTCGTTCAAGATCGGAGTAGAATTAATTCTGTTTCAAACTACCTGGTGGATTTATTAATTTTGGATCTGTATGTGTGTGCCATACATATTCATAGTTACGAATTGAAGATGATGGATGGAAATATCGATCTAGGATAGGTATACATGTTGATGCGGGTTTTACTGATGCATATACAGAGATGCTTTTTGTTCGCTTGGTTGTGATGATGTGGTGTGGTTGGGCGGTCGTTCATTCGTTCAAGATCGGAGTAGAATACTGTTTCAAACTACCTGGTGTATTTATTAATTTTGGAACTGTATGTGTGTGTCATACATCTTCATAGTTACGAGTTTAAGATGGATGGAAATATCGATCTAGGATAGGTATACATGTTGATGTGGGTTTTACTGATGCATATACATGATGGCATATGCAGCATCTATTCATATGCTCTAACCTTGAGTACCTATCTATTATAATAAACAAGTATGTTTTATAATTATTTTGATCTTGATATACTTGGATGATGGCATATGCAGCAGCTATATGTGGATTTTTTTAGCCCTGCCTTCATACGCTATTTATTTGCTTGGTACTGTTTCTTTTGTCGATGCTCACCCTGTTGTTTGGTGTTACTTCTGCAGCCTGCAGGATGGATAAGAAGTACTCTATCGGACTCGCTATCGGAACTAACTCTGTGGGATGGGCTGTGATCACCGATGAGTACAAGGTGCCATCTAAGAAGTTCAAGGTTCTCGGAAACACCGATAGGCACTCTATCAAGAAAAACCTTATCGGTGCTCTCCTCTTCGATTCTGGTGAAACTGCTGAGGCTACCAGACTCAAGAGAACCGCTAGAAGAAGGTACACCAGAAGAAAGAACAGGATCTGCTACCTCCAAGAGATCTTCTCTAACGAGATGGCTAAAGTGGATGATTCATTCTTCCACAGGCTCGAAGAGTCATTCCTCGTGGAAGAAGATAAGAAGCACGAGAGGCACCCTATCTTCGGAAACATCGTTGATGAGGTGGCATACCACGAGAAGTACCCTACTATCTACCACCTCAGAAAGAAGCTCGTTGATTCTACTGATAAGGCTGATCTCAGGCTCATCTACCTCGCTCTCGCTCACATGATCAAGTTCAGAGGACACTTCCTCATCGAGGGTGATCTCAACCCTGATAACTCTGATGTGGATAAGTTGTTCATCCAGCTCGTGCAGACCTACAACCAGCTTTTCGAAGAGAACCCTATCAACGCTTCAGGTGTGGATGCTAAGGCTATCCTCTCTGCTAGGCTCTCTAAGTCAAGAAGGCTTGAGAACCTCATTGCTCAGCTCCCTGGTGAGAAGAAGAACGGACTTTTCGGAAACTTGATCGCTCTCTCTCTCGGACTCACCCCTAACTTCAAGTCTAACTTCGATCTCGCTGAGGATGCAAAGCTCCAGCTCTCAAAGGATACCTACGATGATGATCTCGATAACCTCCTCGCTCAGATCGGAGATCAGTACGCTGATTTGTTCCTCGCTGCTAAGAACCTCTCTGATGCTATCCTCCTCAGTGATATCCTCAGAGTGAACACCGAGATCACCAAGGCTCCACTCTCAGCTTCTATGATCAAGAGATACGATGAGCACCACCAGGATCTCACACTTCTCAAGGCTCTTGTTAGACAGCAGCTCCCAGAGAAGTACAAAGAGATTTTCTTCGATCAGTCTAAGAACGGATACGCTGGTTACATCGATGGTGGTGCATCTCAAGAAGAGTTCTACAAGTTCATCAAGCCTATCCTCGAGAAGATGGATGGAACCGAGGAACTCCTCGTGAAGCTCAATAGAGAGGATCTTCTCAGAAAGCAGAGGACCTTCGATAACGGATCTATCCCTCATCAGATCCACCTCGGAGAGTTGCACGCTATCCTTAGAAGGCAAGAGGATTTCTACCCATTCCTCAAGGATAACAGGGAAAAGATTGAGAAGATTCTCACCTTCAGAATCCCTTACTACGTGGGACCTCTCGCTAGAGGAAACTCAAGATTCGCTTGGATGACCAGAAAGTCTGAGGAAACCATCACCCCTTGGAACTTCGAAGAGGTGGTGGATAAGGGTGCTAGTGCTCAGTCTTTCATCGAGAGGATGACCAACTTCGATAAGAACCTTCCAAACGAGAAGGTGCTCCCTAAGCACTCTTTGCTCTACGAGTACTTCACCGTGTACAACGAGTTGACCAAGGTTAAGTACGTGACCGAGGGAATGAGGAAGCCTGCTTTTTTGTCAGGTGAGCAAAAGAAGGCTATCGTTGATCTCTTGTTCAAGACCAACAGAAAGGTGACCGTGAAGCAGCTCAAAGAGGATTACTTCAAGAAAATCGAGTGCTTCGATTCAGTTGAGATTTCTGGTGTTGAGGATAGGTTCAACGCATCTCTCGGAACCTACCACGATCTCCTCAAGATCATTAAGGATAAGGATTTCTTGGATAACGAGGAAAACGAGGATATCTTGGAGGATATCGTTCTTACCCTCACCCTCTTTGAAGATAGAGAGATGATTGAAGAAAGGCTCAAGACCTACGCTCATCTCTTCGATGATAAGGTGATGAAGCAGTTGAAGAGAAGAAGATACACTGGTTGGGGAAGGCTCTCAAGAAAGCTCATTAACGGAATCAGGGATAAGCAGTCTGGAAAGACAATCCTTGATTTCCTCAAGTCTGATGGATTCGCTAACAGAAACTTCATGCAGCTCATCCACGATGATTCTCTCACCTTTAAAGAGGATATCCAGAAGGCTCAGGTTTCAGGACAGGGTGATAGTCTCCATGAGCATATCGCTAACCTCGCTGGATCTCCTGCAATCAAGAAGGGAATCCTCCAGACTGTGAAGGTTGTGGATGAGTTGGTGAAGGTGATGGGAAGGCATAAGCCTGAGAACATCGTGATCGAAATGGCTAGAGAGAACCAGACCACTCAGAAGGGACAGAAGAACTCTAGGGAAAGGATGAAGAGGATCGAGGAAGGTATCAAAGAGCTTGGATCTCAGATCCTCAAAGAGCACCCTGTTGAGAACACTCAGCTCCAGAATGAGAAGCTCTACCTCTACTACCTCCAGAACGGAAGGGATATGTATGTGGATCAAGAGTTGGATATCAACAGGCTCTCTGATTACGATGTTGATCATATCGTGCCACAGTCATTCTTGAAGGATGATTCTATCGATAACAAGGTGCTCACCAGGTCTGATAAGAACAGGGGTAAGAGTGATAACGTGCCAAGTGAAGAGGTTGTGAAGAAAATGAAGAACTATTGGAGGCAGCTCCTCAACGCTAAGCTCATCACTCAGAGAAAGTTCGATAACTTGACTAAGGCTGAGAGGGGAGGACTCTCTGAATTGGATAAGGCAGGATTCATCAAGAGGCAGCTTGTGGAAACCAGGCAGATCACTAAGCACGTTGCACAGATCCTCGATTCTAGGATGAACACCAAGTACGATGAGAACGATAAGTTGATCAGGGAAGTGAAGGTTATCACCCTCAAGTCAAAGCTCGTGTCTGATTTCAGAAAGGATTTCCAATTCTACAAGGTGAGGGAAATCAACAACTACCACCACGCTCACGATGCTTACCTTAACGCTGTTGTTGGAACCGCTCTCATCAAGAAGTATCCTAAGCTCGAGTCAGAGTTCGTGTACGGTGATTACAAGGTGTACGATGTGAGGAAGATGATCGCTAAGTCTGAGCAAGAGATCGGAAAGGCTACCGCTAAGTATTTCTTCTACTCTAACATCATGAATTTCTTCAAGACCGAGATTACCCTCGCTAACGGTGAGATCAGAAAGAGGCCACTCATCGAGACAAACGGTGAAACAGGTGAGATCGTGTGGGATAAGGGAAGGGATTTCGCTACCGTTAGAAAGGTGCTCTCTATGCCACAGGTGAACATCGTTAAGAAAACCGAGGTGCAGACCGGTGGATTCTCTAAAGAGTCTATCCTCCCTAAGAGGAACTCTGATAAGCTCATTGCTAGGAAGAAGGATTGGGACCCTAAGAAATACGGTGGTTTCGATTCTCCTACCGTGGCTTACTCTGTTCTCGTTGTGGCTAAGGTTGAGAAGGGAAAGAGTAAGAAGCTCAAGTCTGTTAAGGAACTTCTCGGAATCACTATCATGGAAAGGTCATCTTTCGAGAAGAACCCAATCGATTTCCTCGAGGCTAAGGGATACAAAGAGGTTAAGAAGGATCTCATCATCAAGCTCCCAAAGTACTCACTCTTCGAACTCGAGAACGGTAGAAAGAGGATGCTCGCTTCTGCTGGTGAGCTTCAAAAGGGAAACGAGCTTGCTCTCCCATCTAAGTACGTTAACTTTCTTTACCTCGCTTCTCACTACGAGAAGTTGAAGGGATCTCCAGAAGATAACGAGCAGAAGCAACTTTTCGTTGAGCAGCACAAGCACTACTTGGATGAGATCATCGAGCAGATCTCTGAGTTCTCTAAAAGGGTGATCCTCGCTGATGCAAACCTCGATAAGGTGTTGTCTGCTTACAACAAGCACAGAGATAAGCCTATCAGGGAACAGGCAGAGAACATCATCCATCTCTTCACCCTTACCAACCTCGGTGCTCCTGCTGCTTTCAAGTACTTCGATACAACCATCGATAGGAAGAGATACACCTCTACCAAAGAAGTGCTCGATGCTACCCTCATCCATCAGTCTATCACTGGACTCTACGAGACTAGGATCGATCTCTCACAGCTCGGTGGTGATTCAAGGGCTGATCCTAAGAAGAAGAGGAAGGTTGGAGACGACGGAGGTGGCGGTACAGGAGGGGGTGGGTCCGCTGAGTATGTCAGGGCGTTGTTCGACTTCAATGGAAACGACGAGGAAGATCTGCCTTTTAAAAAGGGAGATATTCTCAGGATCAGAGATAAGCCGGAAGAACAATGGTGGAACGCTGAAGACTCTGAAGGTAAGAGAGGTATGATTCTTGTCCCCTACGTCGAGAAGTATTCGGGTGACTATAAAGACCACGATGGAGATTATAAGGACCACGATATAGATTATAAGGATGATGATGATAAGAGCGGAATGACCGATGCAGAGTACGTCAGGATTCATGAGAAACTTGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCTGTTAGTCACCGCTGTTACGTGCTGTTCGAATTGAAACGCAGAGGTGAGAGGAGAGCCTGCTTTTGGGGCTATGCCGTCAACAAGCCGCAAAGCGGCACAGAAAGGGGCATTCACGCGGAGATATTTAGCATTAGAAAGGTCGAGGAATACCTTCGGGATAATCCCGGGCAATTCACTATCAATTGGTACTCTTCATGGTCCCCGTGTGCAGATTGCGCTGAAAAGATACTGGAGTGGTATAATCAAGAACTCAGAGGAAACGGTCACACCCTCAAGATTTGGGCTTGCAAGCTTTACTACGAGAAAAATGCAAGGAACCAGATCGGCCTCTGGAACTTGCGCGACAACGGCGTGGGGTTGAATGTGATGGTGTCGGAGCATTACCAGTGCTGCCGGAAGATATTCATTCAGTCGTCACATAATCAATTGAACGAGAATAGGTGGCTCGAAAAAACCCTGAAGCGGGCCGAGAAGTGGAGGAGTGAACTCTCGATAATGATCCAGGTTAAAATACTGCATACTACCAAATCTCCGGCGGTGGGACCGAAGAAGAAGCGCAAGGTGGGGACCATGACTAATCTCTCAGATATAATCGAGAAGGAAACAGGAAAGCAACTGGTCATCCAAGAATCGATTTTGATGCTTCCCGAAGAAGTCGAAGAAGTTATAGGAAATAAGCCCGAGTCTGACATACTGGTTCACACAGCGTACGATGAAAGTACGGACGAGAATGTCATGTTGCTGACATCGGACGCACCTGAATACAAGCCTTGGGCTCTGGTCATACAAGATAGTAACGGAGAAAATAAGATTAAAATGCTTTCAGGTGGCTCCCCAAAGAAGAAACGCAAGGTTTGAGGATCTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACAAAGCACCAGTGGTCTAGTGGTAGAATAGTACCCTGCCACGGTACAGACCCGGGTTCGATTCCCGGCTGGTGCAGGAGACCTTATATTCCCCAGAACATCAGGTTAATGGCGTTTTTGATGTCATTTTCGCGGTGGCTGAGATCAGCCACTTCTTCCCCGATAACGGAAACCGGCACACTGGCCATATCGGTGGTCATCATGCGCCAGCTTTCATCCCCGATATGCACCACCGGGTAAAGTTCACGGGAGACTTTATCTGACAGCAGACGTGCACTGGCCAGGGGGATCACCATCCGTCGCCCGGGCGTGTCAATAATATCACTCTGTACATCCACAAACAGACGATAACGGCTCTCTCTTTTATAGGTGTAAACCTTAAACTGCATTTCACCAGCCCCTGTTCTCGTCAGCAAAAGAGCCGTTCATTTCAATAAACCGGGCGACCTCAGCCATCCCTTCCTGATTTTCCGCTTTCCAGCGTTCGGCACGCAGACGACGGGCTTCATTCTGCATGGTTGTGCTTACCAGACCGGAGATATTGACATCATATATGCCTTGAGCAACTGATAGCTGTCGCTGTCAACTGTCACTGTAATACGCTGCTTCATAGCATACCTCTTTTTGACATACTTCGGGTATACATATCAGTATATATTCTTATACCGCAAAAATCAGCGCGCAAATACGCATACTGTTATCTGGCTTGGTCTCAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAACAAAGCACCAGTGGTCTAGTGGTAGAATAGTACCCTGCCACGGTACAGACCCGGGTTCGATTCCCGGCTGGTGCAGGATCCATATGAAGATGAAGATGAAATATTTGGTGTGTCAAATAAAAAGCTTGTGTGCTTAAGTTTGTGTTTTTTTCTTGGCTTGTTGTGTTATGAATTTGTGGCTTTTTCTAATATTAAATGAATGTAAGATCACATTATAATGAATAAACAAATGTTTCTATAATCCATTGTGAATGTTTTGTTGGATCTCTTCTGCAGCATATAACTACTGTATGTGCTATGGTATGGACTATGGAATATGATTAAAGATAAG
Seq ID No.2:nCas9-PmCDA1核酸酶-胞嘧啶脱氨酶融合蛋白表达框氨基酸序列
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVGDDGGGGTGGGGSAEYVRALFDFNGNDEEDLPFKKGDILRIRDKPEEQWWNAEDSEGKRGMILVPYVEKYSGDYKDHDGDYKDHDIDYKDDDDKSGMTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKWRSELSIMIQVKILHTTKSPAVGPKKKRKVGTMTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSPKKKRKV。
序列表
<110> 电子科技大学
<120> 一种植物基因组定向碱基编辑骨架载体及其应用
<130> 20180001
<141> 2018-11-23
<160> 15
<170> SIPOSequenceListing 1.0
<210> 1
<211> 8556
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
cgcgcctgca gtgcagcgtg acccggtcgt gcccctctct tgagataatg agcattgcat 60
gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt 120
atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac 180
aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca 240
attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc 300
tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat 360
ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct 420
attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt 480
agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt 540
aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc 600
gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa 660
gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc 720
gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc 780
ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc 840
ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac 900
cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga actcccccaa 960
atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccctct 1020
ctaccttctc aagatcggcg ttccggtcca tggttagggc ccggtagttc tacttctgtt 1080
catgtttgtg ttagatccgt gtttgtgtta gatccgtgct actagcgttc gtacacggat 1140
gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat 1200
cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt 1260
tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc 1320
gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt 1380
cgttcaagat cggagtagaa ttaattctgt ttcaaactac ctggtggatt tattaatttt 1440
ggatctgtat gtgtgtgcca tacatattca tagttacgaa ttgaagatga tggatggaaa 1500
tatcgatcta ggataggtat acatgttgat gcgggtttta ctgatgcata tacagagatg 1560
ctttttgttc gcttggttgt gatgatgtgg tgtggttggg cggtcgttca ttcgttcaag 1620
atcggagtag aatactgttt caaactacct ggtgtattta ttaattttgg aactgtatgt 1680
gtgtgtcata catcttcata gttacgagtt taagatggat ggaaatatcg atctaggata 1740
ggtatacatg ttgatgtggg ttttactgat gcatatacat gatggcatat gcagcatcta 1800
ttcatatgct ctaaccttga gtacctatct attataataa acaagtatgt tttataatta 1860
ttttgatctt gatatacttg gatgatggca tatgcagcag ctatatgtgg atttttttag 1920
ccctgccttc atacgctatt tatttgcttg gtactgtttc ttttgtcgat gctcaccctg 1980
ttgtttggtg ttacttctgc agcctgcagg atggataaga agtactctat cggactcgct 2040
atcggaacta actctgtggg atgggctgtg atcaccgatg agtacaaggt gccatctaag 2100
aagttcaagg ttctcggaaa caccgatagg cactctatca agaaaaacct tatcggtgct 2160
ctcctcttcg attctggtga aactgctgag gctaccagac tcaagagaac cgctagaaga 2220
aggtacacca gaagaaagaa caggatctgc tacctccaag agatcttctc taacgagatg 2280
gctaaagtgg atgattcatt cttccacagg ctcgaagagt cattcctcgt ggaagaagat 2340
aagaagcacg agaggcaccc tatcttcgga aacatcgttg atgaggtggc ataccacgag 2400
aagtacccta ctatctacca cctcagaaag aagctcgttg attctactga taaggctgat 2460
ctcaggctca tctacctcgc tctcgctcac atgatcaagt tcagaggaca cttcctcatc 2520
gagggtgatc tcaaccctga taactctgat gtggataagt tgttcatcca gctcgtgcag 2580
acctacaacc agcttttcga agagaaccct atcaacgctt caggtgtgga tgctaaggct 2640
atcctctctg ctaggctctc taagtcaaga aggcttgaga acctcattgc tcagctccct 2700
ggtgagaaga agaacggact tttcggaaac ttgatcgctc tctctctcgg actcacccct 2760
aacttcaagt ctaacttcga tctcgctgag gatgcaaagc tccagctctc aaaggatacc 2820
tacgatgatg atctcgataa cctcctcgct cagatcggag atcagtacgc tgatttgttc 2880
ctcgctgcta agaacctctc tgatgctatc ctcctcagtg atatcctcag agtgaacacc 2940
gagatcacca aggctccact ctcagcttct atgatcaaga gatacgatga gcaccaccag 3000
gatctcacac ttctcaaggc tcttgttaga cagcagctcc cagagaagta caaagagatt 3060
ttcttcgatc agtctaagaa cggatacgct ggttacatcg atggtggtgc atctcaagaa 3120
gagttctaca agttcatcaa gcctatcctc gagaagatgg atggaaccga ggaactcctc 3180
gtgaagctca atagagagga tcttctcaga aagcagagga ccttcgataa cggatctatc 3240
cctcatcaga tccacctcgg agagttgcac gctatcctta gaaggcaaga ggatttctac 3300
ccattcctca aggataacag ggaaaagatt gagaagattc tcaccttcag aatcccttac 3360
tacgtgggac ctctcgctag aggaaactca agattcgctt ggatgaccag aaagtctgag 3420
gaaaccatca ccccttggaa cttcgaagag gtggtggata agggtgctag tgctcagtct 3480
ttcatcgaga ggatgaccaa cttcgataag aaccttccaa acgagaaggt gctccctaag 3540
cactctttgc tctacgagta cttcaccgtg tacaacgagt tgaccaaggt taagtacgtg 3600
accgagggaa tgaggaagcc tgcttttttg tcaggtgagc aaaagaaggc tatcgttgat 3660
ctcttgttca agaccaacag aaaggtgacc gtgaagcagc tcaaagagga ttacttcaag 3720
aaaatcgagt gcttcgattc agttgagatt tctggtgttg aggataggtt caacgcatct 3780
ctcggaacct accacgatct cctcaagatc attaaggata aggatttctt ggataacgag 3840
gaaaacgagg atatcttgga ggatatcgtt cttaccctca ccctctttga agatagagag 3900
atgattgaag aaaggctcaa gacctacgct catctcttcg atgataaggt gatgaagcag 3960
ttgaagagaa gaagatacac tggttgggga aggctctcaa gaaagctcat taacggaatc 4020
agggataagc agtctggaaa gacaatcctt gatttcctca agtctgatgg attcgctaac 4080
agaaacttca tgcagctcat ccacgatgat tctctcacct ttaaagagga tatccagaag 4140
gctcaggttt caggacaggg tgatagtctc catgagcata tcgctaacct cgctggatct 4200
cctgcaatca agaagggaat cctccagact gtgaaggttg tggatgagtt ggtgaaggtg 4260
atgggaaggc ataagcctga gaacatcgtg atcgaaatgg ctagagagaa ccagaccact 4320
cagaagggac agaagaactc tagggaaagg atgaagagga tcgaggaagg tatcaaagag 4380
cttggatctc agatcctcaa agagcaccct gttgagaaca ctcagctcca gaatgagaag 4440
ctctacctct actacctcca gaacggaagg gatatgtatg tggatcaaga gttggatatc 4500
aacaggctct ctgattacga tgttgatcat atcgtgccac agtcattctt gaaggatgat 4560
tctatcgata acaaggtgct caccaggtct gataagaaca ggggtaagag tgataacgtg 4620
ccaagtgaag aggttgtgaa gaaaatgaag aactattgga ggcagctcct caacgctaag 4680
ctcatcactc agagaaagtt cgataacttg actaaggctg agaggggagg actctctgaa 4740
ttggataagg caggattcat caagaggcag cttgtggaaa ccaggcagat cactaagcac 4800
gttgcacaga tcctcgattc taggatgaac accaagtacg atgagaacga taagttgatc 4860
agggaagtga aggttatcac cctcaagtca aagctcgtgt ctgatttcag aaaggatttc 4920
caattctaca aggtgaggga aatcaacaac taccaccacg ctcacgatgc ttaccttaac 4980
gctgttgttg gaaccgctct catcaagaag tatcctaagc tcgagtcaga gttcgtgtac 5040
ggtgattaca aggtgtacga tgtgaggaag atgatcgcta agtctgagca agagatcgga 5100
aaggctaccg ctaagtattt cttctactct aacatcatga atttcttcaa gaccgagatt 5160
accctcgcta acggtgagat cagaaagagg ccactcatcg agacaaacgg tgaaacaggt 5220
gagatcgtgt gggataaggg aagggatttc gctaccgtta gaaaggtgct ctctatgcca 5280
caggtgaaca tcgttaagaa aaccgaggtg cagaccggtg gattctctaa agagtctatc 5340
ctccctaaga ggaactctga taagctcatt gctaggaaga aggattggga ccctaagaaa 5400
tacggtggtt tcgattctcc taccgtggct tactctgttc tcgttgtggc taaggttgag 5460
aagggaaaga gtaagaagct caagtctgtt aaggaacttc tcggaatcac tatcatggaa 5520
aggtcatctt tcgagaagaa cccaatcgat ttcctcgagg ctaagggata caaagaggtt 5580
aagaaggatc tcatcatcaa gctcccaaag tactcactct tcgaactcga gaacggtaga 5640
aagaggatgc tcgcttctgc tggtgagctt caaaagggaa acgagcttgc tctcccatct 5700
aagtacgtta actttcttta cctcgcttct cactacgaga agttgaaggg atctccagaa 5760
gataacgagc agaagcaact tttcgttgag cagcacaagc actacttgga tgagatcatc 5820
gagcagatct ctgagttctc taaaagggtg atcctcgctg atgcaaacct cgataaggtg 5880
ttgtctgctt acaacaagca cagagataag cctatcaggg aacaggcaga gaacatcatc 5940
catctcttca cccttaccaa cctcggtgct cctgctgctt tcaagtactt cgatacaacc 6000
atcgatagga agagatacac ctctaccaaa gaagtgctcg atgctaccct catccatcag 6060
tctatcactg gactctacga gactaggatc gatctctcac agctcggtgg tgattcaagg 6120
gctgatccta agaagaagag gaaggttgga gacgacggag gtggcggtac aggagggggt 6180
gggtccgctg agtatgtcag ggcgttgttc gacttcaatg gaaacgacga ggaagatctg 6240
ccttttaaaa agggagatat tctcaggatc agagataagc cggaagaaca atggtggaac 6300
gctgaagact ctgaaggtaa gagaggtatg attcttgtcc cctacgtcga gaagtattcg 6360
ggtgactata aagaccacga tggagattat aaggaccacg atatagatta taaggatgat 6420
gatgataaga gcggaatgac cgatgcagag tacgtcagga ttcatgagaa acttgacatc 6480
tacacgttta agaaacagtt tttcaacaac aaaaaatctg ttagtcaccg ctgttacgtg 6540
ctgttcgaat tgaaacgcag aggtgagagg agagcctgct tttggggcta tgccgtcaac 6600
aagccgcaaa gcggcacaga aaggggcatt cacgcggaga tatttagcat tagaaaggtc 6660
gaggaatacc ttcgggataa tcccgggcaa ttcactatca attggtactc ttcatggtcc 6720
ccgtgtgcag attgcgctga aaagatactg gagtggtata atcaagaact cagaggaaac 6780
ggtcacaccc tcaagatttg ggcttgcaag ctttactacg agaaaaatgc aaggaaccag 6840
atcggcctct ggaacttgcg cgacaacggc gtggggttga atgtgatggt gtcggagcat 6900
taccagtgct gccggaagat attcattcag tcgtcacata atcaattgaa cgagaatagg 6960
tggctcgaaa aaaccctgaa gcgggccgag aagtggagga gtgaactctc gataatgatc 7020
caggttaaaa tactgcatac taccaaatct ccggcggtgg gaccgaagaa gaagcgcaag 7080
gtggggacca tgactaatct ctcagatata atcgagaagg aaacaggaaa gcaactggtc 7140
atccaagaat cgattttgat gcttcccgaa gaagtcgaag aagttatagg aaataagccc 7200
gagtctgaca tactggttca cacagcgtac gatgaaagta cggacgagaa tgtcatgttg 7260
ctgacatcgg acgcacctga atacaagcct tgggctctgg tcatacaaga tagtaacgga 7320
gaaaataaga ttaaaatgct ttcaggtggc tccccaaaga agaaacgcaa ggtttgagga 7380
tctaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaacaaagca 7440
ccagtggtct agtggtagaa tagtaccctg ccacggtaca gacccgggtt cgattcccgg 7500
ctggtgcagg agaccttata ttccccagaa catcaggtta atggcgtttt tgatgtcatt 7560
ttcgcggtgg ctgagatcag ccacttcttc cccgataacg gaaaccggca cactggccat 7620
atcggtggtc atcatgcgcc agctttcatc cccgatatgc accaccgggt aaagttcacg 7680
ggagacttta tctgacagca gacgtgcact ggccaggggg atcaccatcc gtcgcccggg 7740
cgtgtcaata atatcactct gtacatccac aaacagacga taacggctct ctcttttata 7800
ggtgtaaacc ttaaactgca tttcaccagc ccctgttctc gtcagcaaaa gagccgttca 7860
tttcaataaa ccgggcgacc tcagccatcc cttcctgatt ttccgctttc cagcgttcgg 7920
cacgcagacg acgggcttca ttctgcatgg ttgtgcttac cagaccggag atattgacat 7980
catatatgcc ttgagcaact gatagctgtc gctgtcaact gtcactgtaa tacgctgctt 8040
catagcatac ctctttttga catacttcgg gtatacatat cagtatatat tcttataccg 8100
caaaaatcag cgcgcaaata cgcatactgt tatctggctt ggtctcagtt ttagagctag 8160
aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 8220
tgcaacaaag caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg 8280
ttcgattccc ggctggtgca ggatccatat gaagatgaag atgaaatatt tggtgtgtca 8340
aataaaaagc ttgtgtgctt aagtttgtgt ttttttcttg gcttgttgtg ttatgaattt 8400
gtggcttttt ctaatattaa atgaatgtaa gatcacatta taatgaataa acaaatgttt 8460
ctataatcca ttgtgaatgt tttgttggat ctcttctgca gcatataact actgtatgtg 8520
ctatggtatg gactatggaa tatgattaaa gataag 8556
<210> 2
<211> 1788
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val Gly Asp Asp Gly Gly Gly Gly Thr Gly Gly Gly Gly Ser
1380 1385 1390
Ala Glu Tyr Val Arg Ala Leu Phe Asp Phe Asn Gly Asn Asp Glu Glu
1395 1400 1405
Asp Leu Pro Phe Lys Lys Gly Asp Ile Leu Arg Ile Arg Asp Lys Pro
1410 1415 1420
Glu Glu Gln Trp Trp Asn Ala Glu Asp Ser Glu Gly Lys Arg Gly Met
1425 1430 1435 1440
Ile Leu Val Pro Tyr Val Glu Lys Tyr Ser Gly Asp Tyr Lys Asp His
1445 1450 1455
Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp
1460 1465 1470
Lys Ser Gly Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu
1475 1480 1485
Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val
1490 1495 1500
Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg
1505 1510 1515 1520
Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr
1525 1530 1535
Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu
1540 1545 1550
Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser
1555 1560 1565
Trp Ser Pro Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn
1570 1575 1580
Gln Glu Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys
1585 1590 1595 1600
Leu Tyr Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu
1605 1610 1615
Arg Asp Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln
1620 1625 1630
Cys Cys Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu
1635 1640 1645
Asn Arg Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser
1650 1655 1660
Glu Leu Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser
1665 1670 1675 1680
Pro Ala Val Gly Pro Lys Lys Lys Arg Lys Val Gly Thr Met Thr Asn
1685 1690 1695
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
1700 1705 1710
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
1715 1720 1725
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
1730 1735 1740
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
1745 1750 1755 1760
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1765 1770 1775
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1780 1785
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cgacatccgc aagtaccagg 20
<210> 4
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
agtacactgt ttccccgtat gt 22
<210> 5
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gctgctggtg agtgctgat 19
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
acccattggg agtgtcttgc 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gaccagccag cgtctggcgc 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gcagctggct gagggtgcat 20
<210> 9
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
agccagctgc ttacaaaac 19
<210> 10
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tgcagaccag ccagcgtctg gcgc 24
<210> 12
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aaacgcgcca gacgctggct ggtc 24
<210> 13
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tgcagcagct ggctgagggt gcat 24
<210> 13
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
aaacatgcac cctcagccag ctgc 24
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tgcaagccag ctgcttacaa aac 23
<210> 15
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
aaacgttttg taagcagctg gct 23
- 上一篇:一种医用注射器针头装配设备
- 下一篇:与玉米增加的能育性相关的遗传基因座