一种产生基因点突变的融合蛋白及基因点突变的诱导方法

文档序号:1138325 发布日期:2020-10-09 浏览:49次 >En<

阅读说明:本技术 一种产生基因点突变的融合蛋白及基因点突变的诱导方法 (Fusion protein for generating gene point mutation and induction method of gene point mutation ) 是由 王小林 李硕 于 2019-03-26 设计创作,主要内容包括:本发明涉及一种产生基因点突变的融合蛋白及基因点突变的诱导方法。本发明找到了多种新的胞核嘧啶核苷脱氨酶,通过与nCas9/dCas9为代表的突变型核酸酶组合,得到的新融合蛋白能对位于前间隔序列1-16位的胞嘧啶(前间区序列邻近基序(PAM)的NGG序列定为21-23位)实现有效的C-T碱基突变,且不同的胞核嘧啶核苷脱氨酶为基础的融合蛋白,其可突变范围各有差异。本发明可实现更广范围、更精细的C-T单碱基替换,拓宽单碱基编辑工具的应用。(The invention relates to a fusion protein for generating gene point mutation and an induction method of the gene point mutation. The invention finds a plurality of new cytosine nucleoside deaminases, and the new fusion protein obtained by combining the cytosine deaminases with mutant nucleases represented by nCas9/dCas9 can realize effective C-T base mutation on the cytosine positioned at the 1-16 position of a pre-spacer sequence (the NGG sequence of a motif (PAM) adjacent to the pre-spacer sequence is positioned at the 21-23 position), and the fusion proteins based on different cytosine nucleoside deaminases have different mutation ranges. The invention can realize wider and more precise C-T single base substitution and broaden the application of single base editing tools.)

一种产生基因点突变的融合蛋白及基因点突变的诱导方法

技术领域

本发明涉及分子生物学基因编辑领域,具体地说,涉及一种产生基因点突变的融合蛋白及基因点突变的诱导方法。

背景技术

近年来,随着基因工程技术的飞速发展,基因编辑(Clustered regularlyinterspaced short palindromic repeats,CRISPR)技术已经成为科学界的研究热点,被广泛应用于各类体内和体外的基因组编辑、转基因模式动物的构建以及基因治疗等领域。

目前广泛应用于基因组编辑的CRISPR-Cas9系统属于II型CRISPR-Cas系统,其作用机制具体而言可分为三步:第一步是Cas蛋白对外源DNA的识别,之后Cas蛋白会选择性的切割出长度为30-50bp的外源DNA(被称作原型间隔序列),并将其***原核生物(宿主)的CRISPR位点。而Cas蛋白选择原型间隔序列的标准是附近的PAM序列,即只有PAM序列附近的外源DNA才能被Cas识别,切割并***CIRSPR位点。第二步是CRISPR位点的转录,最终形成两条短链的crRNAs(CRISPR来源的RNAs)和tracerRNA(反式作用的crRNA)。其中crRNAs中包含有一段与外源DNA互补的序列,这是CRISPR-Cas系统识别并清除外源DNA的基础。第三步是清除入侵的外源DNA。这一过程需要Cas9、crRNA和tracerRNA的共同作用,它们会靶向外源的双链DNA,靶向的特异性由crRNA中包含的外源DNA互补序列决定:只有当外源双链DNA中包含与crRNA互补的序列并有PAM位点方能被Cas9、crRNA和tracerRNA形成的复合物切割形成DNA双链断裂缺口(DSBs)。

从上述的CRISPR-Cas9作用机制中我们可以看出,CRISPR-Cas9系统切割外源DNA依赖于Cas9、crRNA和tracerRNA。通过在真核生物的基因组中寻找原型间隔序列,便可以构建出特异性的crRNA,之后辅以Cas9和tracerRNA,我们便能实现真核生物基因组的定向切割。而研究者将crRNA与tracerRNA融合,构建出了单一的sgRNA(single-stranded RNA,单向导RNA),这样整个系统只需要Cas9和sgRNA便可发挥基因组定向切割。Cas9和sgRNA可以在基因组中引入DNA双链断裂缺口(double-strain breaks,DSBs)而开启基因编辑过程。

传统基因组点突变诱导与修复的基本原理是利用在靶位点区自发或诱发的DNA双链缺口(double-strain breaks,DSBs),DSBs将激活细胞内的DNA修复机制来进行基因组的改造,比如非同源区的末端连接(Non-homologous end joint,NHEJ)或是同源重组(Homologous recombination,HR)。同源重组的发生通常需要外源的模板DNA以修复DSBs附近的突变或是在DSBs附近引入点突变。

在哺乳动物细胞内,DSB自发产生的概率约低于1/104,如果通过基因工程方法采用spCas9和SaCas9等核酸酶诱发DSBs,效率可提高至10%以上,且具有位点特异性,因此方便了下一步对内源基因靶位点进行的基因修复过程顺利进行。在点突变诱导与修复的过程中,DSBs的引入有利于NHEJ的发生,由于NHEJ与HR之间存在竞争关系,抑制NHEJ的策略被用于增强HR的效率。尽管如此,HR的效率依然不高。

spCas9和SaCas9等核酸酶中,特定的点突变(如spCas9中的D10A突变和N863A突变)会抑制其切割双链DNA形成DSBs的能力,使核酸酶只切割双链DNA的一条链(单点突变如spCas9中的D10A或N863A,称为切口酶nCas9,其中D10A突变型Cas9切割与sgRNA互补的DNA单链,而N863A突变型Cas9切割非互补链)或不切割双链DNA(多点突变,如在spCas9中同时引入D10A和N863A点突变,称为失活体Cas9(dCas9));但突变后的核酸酶依然能在sgRNA的引导下识别并结合于特定的DNA序列。

将特定的胞核嘧啶核苷脱氨酶(cytidine deaminase)与突变型核酸酶(如携带有D10A或/和N863A突变的spCas9)组合,得到的融合蛋白在sgRNA的引导下,可以在不诱发DSBs的情况下,直接在前间隔序列(protospacer)的特定位置诱导胞嘧啶(C)突变为尿嘧啶(U),在DNA序列中,尿嘧啶(U)会被识别并替换为胸腺嘧啶(T),最终实现C-T的单碱基突变。细胞内存在有一种重要的DNA修复酶---尿嘧啶糖基化酶(uracil glycosylase),它能特异性的识别并修复DNA单链或双链中的尿嘧啶残基,这对C-T碱基替换有抑制作用。为提升单碱基编辑的效率,尿嘧啶糖基化酶抑制因子(UGI)被添加至融合蛋白中或是与融合蛋白共表达。目前被用于单碱基编辑的胞核嘧啶核苷脱氨酶有大鼠胞苷脱氨酶APOBEC1,人的活化诱导的胞苷脱氨酶(AID),人胞苷脱氨酶APOBEC3A,以及七鳃鳗胞苷脱氨酶PmCDA1。通过与不同的突变型核酸酶(如spCas9及各种突变体;SaCas9及各种突变体;Cpf1)组合,得到的融合蛋白能够实现特定区域内的C-T碱基突变,其突变范围取决于两方面,一是核酸酶所能识别的PAM位点相邻的前间隔序列,二是胞核嘧啶核苷脱氨酶的活性区域。目前已知以大鼠APOBEC1及七鳃鳗的PmCDA1与spCas9切口酶组合的融合蛋白,主要能编辑位于前间隔序列4-8位的胞嘧啶(前间区序列邻近基序(PAM)的NGG序列定为21-23位),对其它位置的胞嘧啶的编辑能力有限。此外,专利文献CN109021111A,公开日2018.12.18,公开了一种基因碱基编辑器,其包含有两个片段,第一片段包含载脂蛋白B人胞嘧啶脱氨酶3A(human APOBEC3A,hA3A),第二片段包含CRISPR/Cas系统相关蛋白。该基因碱基编辑器即使是在GpC二核苷酸的背景下,仍然能够实现高精度、高效率的定向碱基编辑,还能够在甲基化的胞嘧啶(methylated C)上进行高效率的编辑。专利文献CN107522787A,2017.06.15,公开了一种在细胞内产生点突变的融合蛋白、其制备及用途,所述融合蛋白含有胞嘧啶脱氨酶和核酸酶活性缺失、保留了解旋酶活性的Cas酶,或由胞嘧啶脱氨酶和核酸酶活性缺失、保留了解旋酶活性的Cas酶形成。本发明能实现定点突变的同时,在特定的基因区获得高的突变效率和多种突变组合。

然而,目前单碱基编辑工具编辑能力的不足极大的限制了其应用。

发明内容

本发明的目的是针对现有技术中的不足,提供新的单碱基编辑工具。

第一方面,本发明提供了一种融合蛋白,所述融合蛋白包含胞核嘧啶核苷脱氨酶和核酸酶,所述胞核嘧啶核苷脱氨酶与SEQ ID NO:1-13任一所示氨基酸序列相同,或具有同一性且仍保持胞苷脱氨基活性。

作为一个优选例,所述核酸酶为无切割活性或只具有单链切割活性的Cas酶。

作为另一优选例,所述核酸酶选自:spCas9或其各种突变体、SaCas9或其各种突变体、Cpf1或其各种突变体。

作为另一优选例,所述核酸酶选自nspCas9、nSaCas9、nLbCpf1、nAsCpf1、dspCas9、dSaCas9、dLbCpf1、dAsCpf1。

作为另一优选例,所述融合蛋白还包含以下序列中的一种或多种:接头,核定位序列,以及为了构建融合蛋白、促进重组蛋白的表达、获得自动分泌到宿主细胞外的重组蛋白、或利于重组蛋白的纯化而引入的氨基酸残基或氨基酸序列。

第二方面,本发明提供了一种多核苷酸序列,选自:

(1)编码任一所述融合蛋白的多核苷酸序列;和

(2)如(1)所述序列的互补序列。

第三方面,本发明提供了一种核酸构建物,所述核酸构建物含有所述多核苷酸序列。

作为一个优选例,所述核酸构建物是表达载体,用于在宿主细胞中表达所述融合蛋白。

作为另一优选例,所述核酸构建物具有5’至3’的式I结构:

P1-X1-L1-X2(I);

其中,P1为第一启动子序列;

X1为胞核嘧啶核苷脱氨酶的编码序列;

L1为无或连接序列;

X2为核酸酶的编码序列,所述核酸酶是无切割活性或单链切割活性的Cas酶;

并且,各“-”独立地为键或核苷酸连接序列;

或者

P1为第一启动子序列;

X1为核酸酶的编码序列,所述核酸酶是无切割活性或单链切割活性的Cas酶;

L1为无或连接序列;

X2为胞核嘧啶核苷脱氨酶的编码序列;

并且,各“-”独立地为键或核苷酸连接序列。

第四方面,本发明提供了一种宿主细胞,所述宿主细胞含有或表达任一所述的融合蛋白,或含有所述的多核苷酸序列或所述的核酸构建物。

第五方面,本发明提供了一种基因点突变的诱导方法,所述方法包括在细胞中表达或转染任一所述融合蛋白和sgRNA的步骤,其中,所述sgRNA包括靶标结合区和核酸酶识别区,所述靶标结合区能特异性结合待突变的核酸序列,所述核酸酶识别区能被所述融合蛋白中的核酸酶识别并结合。

作为一个优选例,所述方法参考本发明表5中的信息确定胞核嘧啶核苷脱氨酶、核酸酶或sgRNA的设计。

本发明优点在于:

1、本发明找到了多种新的胞核嘧啶核苷脱氨酶,通过与nCas9/dCas9为代表的突变型核酸酶组合,得到的新融合蛋白能对位于前间隔序列1-16位的胞嘧啶(前间区序列邻近基序(PAM)的NGG序列定为21-23位)实现有效的C-T碱基突变,且不同的胞核嘧啶核苷脱氨酶为基础的融合蛋白,其可突变范围各有差异。基于此,提供了新的基因编辑组合物,可实现更广范围、更精细的C-T单碱基替换。

2、本发明还发现,胞核嘧啶核苷脱氨酶与nCas9/dCas9为代表的突变型核酸酶的组合方式对融合蛋白的C-T碱基突变能力有重要影响。当胞核嘧啶核苷脱氨酶融合在nCas9/dCas9为代表的突变型核酸酶的氨基末端(N末端)时,得到的融合蛋白通常具有更高的单碱基编辑活性,和更广的C-T碱基突变范围。当胞核嘧啶核苷脱氨酶融合在nCas9/dCas9为代表的突变型核酸酶的羧基末端(C末端)时,融合蛋白的单碱基编辑活性明显减弱,不过仍有部分融合蛋白的单碱基编辑活性未有明显改变,不过其C-T碱基突变范围有明显减小。即本发明证实了不同的融合方法会改变C-T单碱基替换的作用范围。

总的来说,本发明拓宽了单碱基编辑工具的应用。

附图说明

附图1是胞苷脱氨酶及其对应的单碱基编辑系统。

附图2是单碱基编辑系统表达载体信息。

附图3是N末端融合单碱基编辑系统针对sgA,sgB,sg18和sg19四种sgRNA的编辑效率。

附图4是C末端融合单碱基编辑系统针对sgA,sgB,sg18和sg19四种sgRNA的编辑效率。

具体实施方式

胞核嘧啶核苷脱氨酶

胞核嘧啶核苷脱氨酶是一类能移除胞嘧啶分子氨基的酶。在本发明中,胞核嘧啶核苷脱氨酶是与SEQ ID NO:1-13任一所示氨基酸序列相同,或具有同一性且仍保持脱氨基活性的酶。例如具有一定水平(例如70%,75%,80%,85%,90%,95%,98%,99%)序列同一性的变体和突变体,这些变体和突变体都具有胞苷脱氨活性。

本发明的胞核嘧啶核苷脱氨酶也可以在一些氨基酸位置进行进一步的修饰,例如添加,缺失和/或取代。这样的修饰可以是在一个,两个或三个或更多个氨基酸位置上进行的取代替换。在一个实施例中,修饰是在一个位置处的替换。在一些实施例中,这样的替换是保守氨基酸取代。

“保守氨基酸取代”是指氨基酸残基被其他具有相似侧链的氨基酸残基取代的情况。具有相似侧链的氨基酸残基家族在本领域内已有公认的定义,包括碱性侧链(例如赖氨酸,精氨酸,组氨酸),酸性侧链(例如天冬氨酸,谷氨酸),不带电荷的极性侧链(例如甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸),非极性侧链(例如丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,色氨酸,异亮氨酸)和芳族侧链(例如酪氨酸,苯丙氨酸,色氨酸,组氨酸)家族。因此,该发明公开的融合蛋白中的非关键氨基酸残基可以被来自相同侧链家族的另一氨基酸残基取代置换。

在本发明中,通过识别特定DNA序列,以将所述胞核嘧啶核苷脱氨酶引入到特定突变可以有多种策略,包括基因工程改造过的I-sceI、I-AniI、FoxI、Cas9以及一些合成多核苷酸,如LNA、PNA等。

Cas蛋白

Cas蛋白指一种核酸酶。其包括本领域周知的各种Cas蛋白及其变异体,包括但不限于Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物或其修饰形式。

一种优选的Cas蛋白是Cas9蛋白。Cas9酶可以是来自不同物种的Cas9酶,包括但不限于来自化脓链球菌的Cas9(SpCas9)、来自金黄色葡萄球菌的Cas9(SaCas9),以及来自嗜热链球菌的Cas9(St1Cas9)等。在本发明中,Cas9蛋白为突变的Cas9蛋白,具体地,是无切割活性或只具有单链切割活性的突变的Cas9蛋白。

sgRNA

sgRNA通常包括两部分:靶标结合区和Cas蛋白识别区。靶标结合区与Cas蛋白识别区通常以5’到3’的方向连接。

靶标结合区的长度通常为15~25个碱基,更通常为18~22个碱基,如20个碱基。靶标结合区与DNA的模板链特异性结合,从而将融合蛋白招募到预定位点。通常,DNA模板链上sgRNA结合区域的对侧区紧邻PAM,或者隔开数个碱基(例如10个以内,或8个以内,或5个以内)。因此,在设计sgRNA时,通常先根据所用的Cas酶确定该酶的PAM,然后在DNA的非模板链上寻找可作为PAM的位点,之后将该非模板链(3’到5’)PAM位点下游紧邻该PAM位点或与该PAM位点隔开10个以内(例如8个以内、5个以内等)的长15~25个碱基、更通常长18~22个碱基的片段作为sgRNA的靶标结合区的序列。

sgRNA的Cas蛋白识别区则根据所使用的Cas蛋白而确定,这为本领域所技术人员所掌握。

因此,本发明的sgRNA的靶标结合区的序列为含所选Cas酶识别的PAM位点的DNA链下游紧邻该PAM位点或与该PAM位点隔开10个以内(例如8个以内、5个以内等)的长15~25个碱基、更通常长18~22个碱基的片段;其Cas蛋白识别区为所选Cas酶所特异性识别。

可采用本领域常规的方法制备sgRNA,例如,采用常规的化学合成方法合成。sgRNA也可经由表达载体转入细胞,在细胞内表达出该sgRNA。可采用本领域周知的方法构建sgRNA的表达载体。

融合蛋白

本发明提供的融合蛋白其包含胞核嘧啶核苷脱氨酶和核酸酶。所述的“包含”并不意指融合蛋白仅包括核酸酶和胞核嘧啶核苷脱氨酶,该限定应理解为融合蛋白可仅包括核酸酶和胞核嘧啶核苷脱氨酶,或还可含有其他不影响到该融合蛋白中的核酸酶的靶向作用及胞核嘧啶核苷脱氨酶的功能的部分,包括但不限于各种接头序列、核定位序列以及如下文所述因基因克隆操作、和/或为了构建融合蛋白、促进重组蛋白的表达、获得自动分泌到宿主细胞外的重组蛋白、或利于重组蛋白的检测和/或纯化等而在融合蛋白中引入的氨基酸序列。

多核苷酸序列、核酸构建物、宿主

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。

本发明所述的核苷酸序列通常可以用PCR扩增法获得。具体而言,可根据本发明所公开的核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。

本发明的核酸构建物含有本发明所述的融合蛋白的编码序列,以及与这些序列操作性连接的一个或多个调控序列。本发明所述的融合蛋白的编码序列可以多种方式***作以保证所述蛋白的表达。在将核酸构建物***载体之前可根据表达载体的不同或要求而对核酸构建物进行操作。利用重组DNA方法来改变多核苷酸序列的技术是本领域已知的。

调控序列可以是合适的启动子序列。启动子序列通常与待表达蛋白的编码序列操作性连接。启动子可以是在所选择的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合启动子,并且可以从编码与该宿主细胞同源或异源的胞外或胞内多肽的基因获得。

调控序列也可以是合适的转录终止子序列,由宿主细胞识别以终止转录的序列。终止子序列与编码该多肽的核苷酸序列的3’末端操作性连接。在选择的宿主细胞中有功能的任何终止子都可用于本发明。

调控序列也可以是合适的前导序列,对宿主细胞翻译重要的mRNA的非翻译区。前导序列与编码该多肽的核苷酸序列的5’末端可操作连接。在选择的宿主细胞中有功能的任何终止子都可用于本发明。

在某些实施方案中,所述核酸构建物是载体。例如,可将本发明的多核苷酸序列***到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其它载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。表达载体还可包括翻译起始用的核糖体结合位点和转录终止子。本发明所述的多核苷酸序列可操作性地连接到表达载体中的适当启动子上,以经由该启动子指导mRNA合成。

本领域一般技术人员清楚如何选择适当的载体、启动子、增强子和宿主细胞。可采用本领域技术人员熟知的方法构建含本发明所述的多核苷酸序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。

可将本发明所述的载体转化适当的宿主细胞,以使其能够表达本发明所述的融合蛋白。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;丝状真菌细胞、或是高等真核细胞,如哺乳动物细胞。宿主细胞还可以是植物细胞。宿主细胞的代表性例子有:大肠杆菌;链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母、丝状真菌;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。除用于表达融合蛋白的细胞外,其它的含本发明所述多核苷酸序列或载体以及sgRNA或其表达载体的细胞,例如用于制备点突变蛋白的细胞,也在本发明所述的宿主细胞的范围之内。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。

转化宿主细胞后,获得的转化子可以用常规方法培养,以允许其表达本发明所述的融合蛋白。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。可利用本领域已知的各种分离方法分离和纯化本发明的重组融合蛋白。这些方法是本领域技术人员所熟知的,包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。

组合物、试剂盒

本发明的融合蛋白、其编码序列或表达载体,和/或sgRNA、其编码序列或表达载体还可以组合物的形式提供。例如,组合物可含有本发明的融合蛋白和sgRNA或sgRNA的表达载体,或可含有本发明融合蛋白的表达载体和sgRNA或sgRNA的表达载体。在组合物中,融合蛋白或其表达载体、或sgRNA或其表达载体可以混合物的形式提供,或者可单独包装。组合物可以是溶液的形式,也可以是冻干形式。

组合物可提供在试剂盒中。因此,本发明提供含有本发明所述组合物的试剂盒。或者,本发明也提供一种试剂盒,该试剂盒含有本发明的融合蛋白和sgRNA或sgRNA的表达载体,或含有本发明融合蛋白的表达载体和sgRNA或sgRNA的表达载体。试剂盒中,融合蛋白或其表达载体、或sgRNA或其表达载体可独立包装,或以混合物的形式提供。试剂盒中还可包括例如用于将所述融合蛋白或其表达载体和/或sgRNA或其表达载体转入细胞的试剂,以及指导技术人员进行所述转入的说明书。或者,试剂盒还可包括指导技术人员采用试剂盒所含成分实施本发明所述的各种方法和用途的说明书。试剂盒中还包括其它的试剂,例如用于PCR的试剂等。

方法和用途

本发明的基因点突变的诱导方法包括在细胞内表达或转染本发明所述的融合蛋白和sgRNA的步骤。一种具体的诱导方法为:根据目标位点的特点(待编辑C位点周围的序列信息)设计sgRNA,并构建sgRNA表达载体,之后选取合适的融合蛋白的表达载体,将两者共转染进入目标细胞或动物,实现目标位点的C-T单碱基替换。另一种具体的诱导方法为:可体外合成针对靶目标的sgRNA,并体外转录获得表达融合蛋白的mRNA,或是获得融合蛋白,将mRNA或融合蛋白与sgRNA混合转染入目标细胞或动物,实现目标位点的C-T单碱基替换。

细胞可以是任意感兴趣的细胞,包括原核细胞和真核细胞,例如植物细胞、动物细胞、微生物细胞等。尤其优选的是动物细胞,例如哺乳动物细胞、啮齿类动物细胞,包括人、马、牛、羊、鼠、兔等等。微生物细胞包括本领域周知的来自各种微生物种类的细胞,尤其是那些具有医疗研究价值、生产价值(例如燃料如乙醇的生产、蛋白质生产、油脂如DHA生产)的微生物种类的细胞。细胞还可以是各种器官来源的细胞,例如来自人肝脏、肾脏、皮肤等处的细胞。

动物可以是任意动物,优选为哺乳动物,如人、马、牛、羊、鼠、兔等。

产生突变的基因可以来自于微生物、植物、动物、细胞、哺乳动物或人。

本发明的方法可以是体外方法,也可以是体内方法。当体内实施时,可采用本领域周知的手段将本发明的融合蛋白或其表达载体和sgRNA或其表达载体转入实验对象体内,如相应的组织细胞内,并通过观察动物表型变化筛选出感兴趣的功能变体。应理解,体内实验时,实验对象可以是各种非人动物,尤其是本领域惯常采用的各种非人模式生物。体内实验也应满足伦理要求。

为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。

实施例1构建融合蛋白

合成人源密码子优化的胞苷脱氨酶的开放阅读框(ORF),包括LpCDA1,LpCDA1L1_1/3/4,LpCDA1L2_1/2,LjCDA1,LjCDA1L1_1/4,LjCDA1L2_1/2,PmCDA1L1_4和PmCDA4,合成大鼠胞苷脱氨酶APOBEC1,人的活化诱导的胞苷脱氨酶(AID),以及七鳃鳗胞苷脱氨酶PmCDA1(图1,全序列信息见表1)。全序列均在南京金斯瑞生物科技有限公司合成。

表1胞苷脱氨酶序列信息

名称 序列编号
LpCDA1 SEQ ID NO:1
LjCDA1 SEQ ID NO:2
LpCDA1L1-1 SEQ ID NO:3
LpCDA1L1-3 SEQ ID NO:4
LpCDA1L1-4 SEQ ID NO:5
LpCDA1L2-1 SEQ ID NO:6
LpCDA1L2-2 SEQ ID NO:7
LjCDA1L1-1 SEQ ID NO:8
LjCDA1L1-4 SEQ ID NO:9
LjCDA1L2-1 SEQ ID NO:10
LjCDA1L2-2 SEQ ID NO:11
PmCDA1L1_4 SEQ ID NO:12
PmCDA4 SEQ ID NO:13
rAPOBEC1 SEQ ID NO:14
Human AID SEQ ID NO:15
PmCDA1 SEQ ID NO:16

识别特定DNA序列可以有多种策略,包括基因工程改造过的I-sceI、I-AniI、FoxI、Cas9以及一些合成多核苷酸,如LNA、PNA等。本实验采用spCas9,SaCas9和Cpf1,并引入特定的突变得到nspCas9(Addgene#48137;NCBI ACCESSION QAB34447.1),nSaCas9(Addgene#61593;NCBI ACCESSION J7RUA5),nLbCpf1(Addgene#84742;NCBI ACCESSION WP_051666128.1/GenBank:ATB19154.1),nAsCpf1(Addgene#84741;NCBI ACCESSION U2UMQ6/GenBank:ATB19153.1)或是dspCas9(Addgene#61422;NCBI D10A和N863A/H840A),dSaCas9(Addgene#61594;NCBI D10A和N580A),dLbCpf1(E925A或其他突变体),dAsCpf1(E993A或其他突变体)。dLbCpf1和dAsCpf1的信息可参见(DOI:https://doi.org/10.1016/j.molcel.2017.06.035)。

合成的胞苷脱氨酶编码序列连接入nCas或dCas表达载体的N末端或C末端,得到表达N末端融合单碱基编辑系统的质粒载体和表达C末端融合单碱基编辑系统的质粒载体用于后续实验(图2,N末端融合蛋白和C末端融合蛋白表达载体的详细信息见表2)。

表2 N末端融合蛋白和C末端融合蛋白表达载体详细信息

注:SEQ ID NO:17和SEQ ID NO:18中的胞苷脱氨酶序列信息为代表性表述,实际构建的载体中为相应的胞苷脱氨酶编码序列,即SEQ ID NO:1-16的任一个。

利用2A肽段共表达融合蛋白与绿色荧光蛋白EGFP,用以指示融合蛋白的表达情况,并用于后续的流式细胞分选(图2)。

实施例2 sgRNA表达载体的构建

构建sgRNA表达载体,在表达特定sgRNA的同时表达UGI-2A-mCherry。UGI可以抑制尿嘧啶糖基化酶的活性,提高C-T突变效率,红色荧光蛋白mCherry用于指示载体表达情况,可用于后续的流式细胞分选(图2)。

选取多种sgRNAs(详细信息参见表3)构建sgRNA表达载体(详细信息见表4),以分析前间隔序列中胞嘧啶突变为胸腺嘧啶的频率。

表3 sgRNA信息

Figure BDA0002007084150000121

表4 sgRNA表达载体详细信息

Figure BDA0002007084150000122

注:SEQ ID NO:35中的sgRNA序列信息为代表性表述,仅表示sgRNA连入的位点,实际构建的载体中为相应的sgRNA编码序列,即SEQ ID NO:19-34中的任一个。

实施例3不同单碱基编辑载体与sgRNA表达载体转染HEK293T细胞检测C-T突变频率及特点

将HEK293T细胞系种植在24孔板上放入37℃含5%二氧化碳培养箱进行培养,8-16小时后进行转染实验。融合蛋白的表达载体与特定sgRNA的表达载体用Lipofectamine3000进行共转染,37℃,5%二氧化碳培养箱培养72小时后,通过流式细胞分选(flowcytometry)富集同时表达GFP和mCherry两种荧光蛋白的细胞。提取基因组后,使用针对特定sgRNA的PCR引物进行片段扩增,送高通量测序,分析sgRNA靶向的前间隔序列中的C-T突变情况。N末端融合单碱基编辑系统针对sgA,sgB,sg18和sg19四种sgRNA的编辑效率参见图3,我们发现16种N末端融合单碱基编辑系统中有13种在至少两种sgRNA的特定C位点呈现出>40%的C-T单碱基替换效率(BE3,N-hAID-BE,N-PmCDA1-BE,N-1-BE,N-2-BE,N-4-BE,N-7-BE,N-8-BE,N-9-BE,N-10-BE,N-11-BE,N-12-BE,N-13-BE);C末端融合单碱基编辑系统针对sgA,sgB,sg18和sg19四种sgRNA的编辑效率参见图4,16种C末端融合单碱基编辑系统中有8种在至少两种sgRNA的特定C位点呈现出>40%的C-T单碱基替换效率(C-BE3,Target-AID,C-1-BE,C-2-BE,C-4-BE,C-8-BE,C-9-BE,C-10-BE)。

之后我们挑选有代表性的N末端融合单碱基编辑系统和C末端融合单碱基编辑系统,与其它的sgRNA用Lipofectamine3000进行共转染,37℃,5%二氧化碳培养箱培养72小时后,通过流式细胞分选(flow cytometry)富集同时表达GFP和mCherry两种荧光蛋白的细胞。提取基因组后,使用针对特定sgRNA的PCR引物进行片段扩增,送高通量测序,分析sgRNA靶向的前间隔序列中的C-T突变情况。综合每种单碱基编辑系统针对各种sgRNA的单碱基编辑情况,我们对不同的单碱基编辑系统的活性编辑窗口,序列偏好性及脱靶情况进行了系统分析(表5)。我们选用已经报道的单碱基编辑工具BE3,N-hAID-BE,N-PmCDA1-BE及Target-AID作为比较对象。我们发现,与已报道的单碱基编辑工具相比,我们构建的N末端融合单碱基编辑系统和C末端融合单碱基编辑系统的活性编辑窗口更加多样化,其靶位点序列的偏好性也要优于已有的系统,且数种新的单碱基编辑系统的编辑特异性要优于已报道的系统(表5)。

表5单碱基编辑系统的特性

a编辑位点用下划线标识。

b该编辑活性窗口通过分析如下4种sgRNAs获得—sgRNA-18/19/A/B。b标注之外的,均使用到sgA,sgB,sg18,sg19,HEK4,FANCFN,VEGFA S2,FANCF-2,另,N-1,N-4,N-8,N-12,C-BE3和C-1还用到S16,HEK3,FANCF-AAC和FANCF-TAC;其余则还用到EMXNGG,site1,SITE7和PTEN SG2。N/A:未分析,n.s.:不显著。

H=A/C/T;M=A/C;K=G/T;Y=C/T;B=C/G/T;W=A/T;S=C/G;R=A/G。

申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。

SEQUENCE LISTING

<110> 复旦大学附属中山医院

<120> 一种产生基因点突变的融合蛋白及基因点突变的诱导方法

<130> /

<160> 35

<170> PatentIn version 3.3

<210> 1

<211> 618

<212> DNA

<213> 人工序列

<400> 1

gccaacgccg agtacgtgaa ggtgcgcgag aagctggaca gccacacctt catgaaggag 60

ttcgtgaact acaagcgcag ccccagccgc cgctgctgcg tgatcttcga gctgaagcgc 120

cagaacagcc gcgtgcgctt ctggggctac gccatgaaca agccctggag caacgccgac 180

gtgggcatcc acgccgagta cttctgcatc aagaaggtga agaagtacct gcgcaagaac 240

cccggcaagt acaccatcaa ctggtacagc agctggagcc cctgcgccaa ctgcgccaag 300

aagatcctga actggtacaa caagaagctg atgggcaagg gccacaccct gaagatttgg 360

gcctgcaagc tgtacttcga gaagaacaag tggaaccaga tcggcctgtg gaacctgcgc 420

aagaaccgcg tgggcctgga gatcatgacc ggcgagcact accagtggtg ctggaacaac 480

tacatccaga ccctgggccg caacctgaac gagaacaagt ggctgaaaaa gaccagcaac 540

cgcgccctga cccgccgcag cgagctgagc atcatgatcc aggtgaagcg cctgcacacc 600

gccaagaccc ccgccgtg 618

<210> 2

<211> 642

<212> DNA

<213> 人工序列

<400> 2

gccaacgccg agtacgtgcg cgtgggcgag aagctggaca gctgcacctt ccgcacccag 60

ttcctgaact accgccgcag ccgcagccgc cgctgctgcg tgatcttcga gctgaagcgc 120

cagaacagcc gcgtgcgctt ctggggctac gccatgaaca agccctggag caacgccgac 180

gtgggcatcc acgccgagtt cttctgcatc aagaaggtga agaagtacct gcgcaagaac 240

cccggcatct acaccatcaa ctggtacagc agctggagcc cctgcgccaa ctgcgccgag 300

aagatcctga actggtacaa caagaagctg atgggcaagg gccacaccct gaagatttgg 360

gcctgcaagc tgtacttcga gaacatcaag cgcaaccaga tcggcctgtg gaacctgcgc 420

aacaacggcg tgggcctggc catcatgctg ggcgagcact accagtggtg ctggaacaac 480

tacatccaga ccctgggccg caacctgaac gagaacaagt ggctgaaaaa gaccagcaac 540

cgcgcccgca cccgccgcag cgagctgagc atcatgatcc acgtgaagcg cctgcacacc 600

gcccgcctgc tgctgttcaa gcgcctgtgc ggctggttca gc 642

<210> 3

<211> 642

<212> DNA

<213> 人工序列

<400> 3

gccggcgacg agaacgtgcg cgtgagcaag aagctggact tcaacacctt cgagttcgag 60

ttcgagaacc tgcactacgc cgagggccgc ggccgcacct acgtgatctt cgacgtgaag 120

ccccagagcg agggcggccg cggcgagcgc ctgtggggct acgtgcgcaa caaccccctg 180

gacgaccacg ccgaggtgat cctgatgagc aagatcaacg accacctgga gacacaccag 240

ggcaactaca ccatgacctg gtacatgagc tggagcccct gcggcaactg cagcagcgag 300

ctggtgccct ggctgcagaa cctgctggag gagcagcagc acaccctgac catgtacttc 360

agccgcatct acgacaagga ccgcgccgtg gaccaccgcg gcctgtgcga cctgcagcac 420

gtggtgagca acggcttcca gatgggcgtg atgggccaga ccgaggtgga cacctgcctg 480

gccgagtacg tggaggccag cggctgcccc cccctgaagt ggctgcacat gaccgacagc 540

aacgccaccc agacccagga caagctgagc agcatcctga tgaaccgctt cgtgcgctgc 600

gccggcatgc gcgagagcgg catgcccctg cacctgttca cc 642

<210> 4

<211> 591

<212> DNA

<213> 人工序列

<400> 4

gccggcgatg agaacgtgcg cgtgagcgag aagctgcact tcaacacctt cgagttcgag 60

ttcgagaacc tgcactacgc cgagggccgc ggccagacct acgtgatctt cgacgtgaag 120

ccccagagcg agggaggccg cggcgagcgc ctgtggggct acgtgcgcaa caagcccctg 180

ggcgaccacg ccgaggtgat cctgatgagc aagatcaacg accacctgga gactcaccag 240

gacaactaca ccatgacctg gtacatgagc tggagcccct gcggcaagtg cagcagcgag 300

ctggtgccct ggctgcagaa cctgctgaag aagcagcaca agctgaccat gcacttcagc 360

cgcatctacg acaaggaccg cgccgtggac caccgcggcc tgtgcgacct gcagcacgtg 420

gtgagcaacg gcttccagat gggcgtgatg ggccagaccg aggtggacac ctgcctggcc 480

gagtacgtgg aggccagcgg ctgccccccc ctgaagtggc tgcacatgac cgacagcaac 540

gccacccaga tgcaggacaa gctgagcagc atcctgatga accgcttcgg a 591

<210> 5

<211> 639

<212> DNA

<213> 人工序列

<400> 5

gccggcgacg agaacgtgcg cgtgagcgag aagctggact tcaacacctt cgagttcgag 60

ttcgagaacc tgcactacgc cgccggccgc tgccgcacct acgtgatctt cgacgtgaag 120

ccccagagca agcgcggacg cggcaagcgc ctgtggggct acgtgcgcaa caaccccctg 180

gaggaccacg ccgagatgat cctgatgagc aagatcaacc accacctggc cgccaacaac 240

aaggacaagt acaccatgac ctggtacatg agctggagcc cctgcggcaa ctgcagcagc 300

gagctggtgc cctggctgaa gatcctgctg gaggagcagc agcacaccct gaccatgcac 360

ttcagccgca tctacaacaa ggaccgcgcc gtggaccacc gcggcctgcg cgacctgcgc 420

gacctgcagc gcgtggtgag caactacttc aagatgggcg tgatgcgcga aaccgaggtg 480

aagaagtgcc tggccgagta cgtggaggcc agccgccgca ccctgaagtg gctgcgcacc 540

accgccagca acgccggccg ccgccgccgc aagctgagca gcatcctggt gcgctgcgcc 600

ggcatgcgcg agagcggcat gcccctgcac ctgttcacc 639

<210> 6

<211> 936

<212> DNA

<213> 人工序列

<400> 6

agcatcttcc tgtataagaa gctgcccctg aacaccttcc tgttcgagtt cgacaacctg 60

gagaaggcct acggccgcaa ccgctgctac atctgcttca agctgaagcc catccacgcc 120

gtgggcgcca ccggcaccac cggcaccacc ggcagcgagc tgtggggcta cgccaccaac 180

aagtgggagg tggccgacgg catcccccgc gagagccccg agaagcgcgg catgcacgcc 240

gaggagcccc tgctggacga gatgacccgc cacgtgcgcg agcacggcgg cgccagcttc 300

tgcatcgagt ggttcaccag ctggagcccc tgcgaccgct gcagcggcct gctgctgcac 360

tggctgcgcg acgtgggcgg cggacgccac cgcctgcgcg tgtggttcag ccgcatctac 420

cgcggcaacg tgggcaccgt gcgcgccggc ctgcgccacc tgcgccgcgc cggcgtgcag 480

ctgggcgtga tggaccgccg ccgccacgac aactgcgccc acgccctggt ggacgccgcc 540

cgcggcgacc ccaccccccc ctggcacatc aacgtgcccc gcatccagcg cgccttcgac 600

gagatcatgg acgagaagga cgacaacggc agcgacaaca gcgaccccgg caagctgagc 660

gagagcgcca gcggcggcca cgagagctgg cacgacgacg acctgcacct gcccctggac 720

gacctgaccg tggtggtgga gtgcaccccc agcaagcagg gcccccccga ggccaccgcc 780

gcccccaccc tgccccgcaa gcgccagcag gaggaccccg tggacgccct gaccgccaag 840

cgcgccctgt tcgtgcgcga gcccggctgg tgctggtggt gctggcgccc ctggtggctg 900

gccgacgtgc ccagcaacgc cagcctgaac tacccc 936

<210> 7

<211> 993

<212> DNA

<213> 人工序列

<400> 7

agcgtgttcc tgcacaagaa gctgcccctg aacaccttcc tgttcgagtt cgacaacctg 60

gagaaggcct acggccgcaa ccgctgctac atctgcttca agctgaagcc catctacgcc 120

gtgggcgcca ccggcaccac cggcaccacc ggcagcgagc tgtggggcta cgccaccaac 180

aagtgggagg tggccgacgg catcccccgc gagagccccg agaagcgcgg catgcacacc 240

gaggagctgc tgctggacga gatgacccgc cacgtgcgcg agcacggcgg cgccagcttc 300

tgcatcgagt ggttcaccag ctggagcccc tgccaccgct gcagcggcct gctgcacagc 360

tggctgcgcg acgtgggcgg cggacgccac cgcctgcgcg tgtggttcag ccgcatctac 420

tacggcgacg tgggcgccgt gcgcgccggc ctgcgccgcc tgcgccgcgc cggcgtgcag 480

ctgggcgtga tggacggccg cctgcgcgac tactgcgccc acgccctggt ggacaccgcc 540

cagggcgacc ccacccccct gtggctggtg ccctggcaca tgaacgtgcc ccgcgtgcag 600

cgcgccttcg acgagatcat ggacgagaag gacgacaacg gcagcgacaa cagcgacccc 660

ggcaagctga gcgagagcat cagcggcggc cacgagagct ggcacgacga cgacctgcac 720

ctgcccctgg aggacctgac cgtggtggtg gagtgcaccc ccagcaagca gggccccccc 780

gaggccaccg ccgcccccac cctgccccgc aagcgccagc aggaggaccc cgtggacgcc 840

ctgaccgcca agcgcgccct gttcgtgcgc gagcccggct ggtgctggtg gtgctggcgc 900

ccctggtggc tggccgacgt gctgagcaac gccagcttcc cccagctgca cgtgaacgac 960

gaggccatcg tggaccgcgt ggagaagttc ctg 993

<210> 8

<211> 630

<212> DNA

<213> 人工序列

<400> 8

gccggcgacg agaacgtgcg cgtgagcgag aagctggact tcaacacctt cgagttcgag 60

ttcgagaacc tgcactacgc cgagggccgc ggccgcacct acgtgatctt cgacgtgaag 120

cccaagagcg agggcggccg cggcaagcgc ctgtggggct acgtgcgcaa caaccccctg 180

gacgaccacg ccgaggtgat cctgatgagc aagatcaacg accacctgga gacccaccag 240

ggcaactaca ccatgacctg gtacatgagc tggagcccct gcggcaactg cagcagcgag 300

ctggtgccct ggctgcagaa cctgctggag gagcagcagc acaccctgac catgcacttc 360

agccgcatct acgacaagga ccgcgccgtg gaccaccgcg gcctgcgcga cctgcagcgc 420

gtggtgagca acgacttcca gatgggcgtg atgggccaga ccgaggtgga cacctgcctg 480

gccgagtacg tggaggccag cggcggcctg agcctgaagt ggctgcacat gaccgagaag 540

aacgccaccc gcacccagaa gaagctgagc agcatcctgg tgcgctgcgc cggcatgcgc 600

gagagcggca tgcccctgca cctgttcacc 630

<210> 9

<211> 624

<212> DNA

<213> 人工序列

<400> 9

gccggcgacg agaacgtgcg cgtgagcgag aagctggact tcaacacctt cgagttcgag 60

ttcgagaacc tgcactacgc cgagggccgc ggccgcacct acgtgatctt cgacgtgaag 120

ccccagagcg agggcggccg cggcaagcgc ctgtggggct acgtgcgcaa caaccccctg 180

gacgaccacg ccgaggtgat cctgatgagc aagatcaacg accacctgga aacccaccag 240

ggcaactaca ccatgacctg gtacatgagc tggagcccct gcggcaactg cagcagcgag 300

ctggtgccct ggctgaagaa cctggaggag cagcagcaca ccctgaccat gcacttcagc 360

cgcatctacg acaaggaccg cgccgtggac caccgcggcc tgtgcgacct gcagcgcgtg 420

gtgagcaact acttccagat gggcgtgatg cgcaagaagg aggtgaagaa gtgcctggcc 480

gagtacgtgg aggccagcgg ccgcaccctg cgctggctgc gcaccaccac cagcaacgcc 540

ggccgccgcc gccgcaagct gtatagcatc ctggtgcgct gcgccggcat gcgcgagagc 600

ggcatgcccc tgcacctgtt cacc 624

<210> 10

<211> 801

<212> DNA

<213> 人工序列

<400> 10

agcgtgttcc tgtataagaa gctgcccctg gacaccttcc tgttcgagtt caacaacctg 60

gagtgggcct acggccgcaa cagctgctac atctgcttca agctgaagcc catcctggcc 120

accagcacca ccggcaccac cgagagcgag ctgtggggct acgtgaccaa caagggcgag 180

gtggccgacg gcatcccctg cgagagcccc gagaagcgcg gcatgcacgc cgaggagctg 240

ctgctggagg agatgacccg ccacgtgcgc gagcacggcg gcgccagctt ctgcgtggag 300

tggttcgcca gctggagccc ctgcgaccgc tgcagcggcg tgctgctgcg ctggctgcgc 360

gacgtgggcg gcggacgcca ccgcctgcgc gtgtggttca gccgcatcta ccgcggcaac 420

gtgggcgccg tgcgcgccgg cctgcgccac ctgcgccgcg ccggcgtgca gctgggcgtg 480

atggaccgcc gccgccacga caactgcgtg cacgtgctgg tggacgccgc ccgcggcgac 540

cccacccccc tgtggctggt gcagtggcac agcaacgtgc cccgcgtgca gcgcgagttc 600

gacaagatca tggacgagaa ggtgcgcgag cccggctggt gctggtggtg ctggcgcccc 660

tggatggccg acgtgcccag caacgccagc ttcccccagc tgcccgtgaa cgacggcgcc 720

atcgtggacc gcgtggagaa gttcccctac ctgggcagcc tgctgatgac cagcagcggc 780

ctggccgccg aggtgagcat c 801

<210> 11

<211> 813

<212> DNA

<213> 人工序列

<400> 11

agcgtgttcc tgcacaagaa gctgcccctg aacaccttcc tgttcgagtt caacaacctg 60

gagaaggcct acggccgcaa cagctgctac atcttcttca agctgaagcc catccacgcc 120

gtgggcgcca ccagcaccac cggcaccacc ggcagcgagc tgtggggcta cgccaccaac 180

aagtgggagg tggccgacgg catcccccgc gagagccccg agaagcgcgg catgcacacc 240

gaggagctgc tgctggacga gatgacccgc cacgtgcgcg agcacagcgg cgtgggcttc 300

tgcgtggagt ggttcaccag ctggagcccc tgccaccgct gcagcggcct gctgctgcgc 360

tggctgcgcg acatcggcgg aggccgccac cgcctgcgcg tgtggttcag ccgcatctac 420

tacggcgacg acggcgccgt gcgcgccggc ctgcgccgcc tgcgccgcgc cggcgtgcag 480

ctgggcgtga tggacggccg cctgcacgac tactgcgccc acgtgctggt ggacgccgcc 540

tggggcgacc ccaccccccc ctggctggtg ccctggcaca tcaacgtgcc ccgcgtgcag 600

cgcgccttcg acgagatcat ggacgagaag gtgcgcgagc ccggctggtg ctggtggtgc 660

tggcgcccct ggtggctggc cgacgtgccc agcaacgcca gcttccccca gctgcccgtg 720

aacgacgagg ccatcgtgga ccgcgtggag aagttcctgt acctgggcag cctgttcatg 780

accagcagcg gcctggccgc cgaggtgagc atc 813

<210> 12

<211> 669

<212> DNA

<213> 人工序列

<400> 12

gccggctacg agtgcgtgcg cgtgagcgag aagctggact tcgacacctt cgagttccag 60

ttcgagaacc tgcactacgc caccgagcgc caccgcacct acgtgatctt cgacgtgaag 120

ccccagagcg ccggcggccg cagccgccgc ctgtggggct acatcatcaa caaccccaac 180

gtgtgccacg ccgagctgat cctgatgagc atgatcgacc gccacctgga gagcaacccc 240

ggcgtgtacg ccatgacctg gtacatgagc tggagcccct gcgccaactg cagcagcaag 300

ctgaacccct ggctgaagaa cctgctggag gagcagggcc acaccctgac catgcacttc 360

agccgcatct acgaccgcga ccgcgagggc gaccaccgcg gcctgcgcgg cctgaagcac 420

gtgagcaaca gcttccgcat gggcgtggtg ggccgcgccg aggtgaagga gtgcctggcc 480

gagtacgtgg aggccagccg ccgcaccctg acctggctgg acaccaccga gagcatggcc 540

gccaagatgc gccgcaagct gttctgcatc ctggtgcgct gcgccggcat gcgcgagagc 600

ggcatccccc tgcacctgtt caccctgcag acccccctgc tgagcggccg cgtggtgtgg 660

tggcgcgtg 669

<210> 13

<211> 813

<212> DNA

<213> 人工序列

<400> 13

agcgtgttcc tgtataagaa gctgcccctg aacaccttcc tgttcgagtt caacaacctg 60

gagaaggcct acggccgcaa cagctgctac atcttcttca agctgaagcc catccacgcc 120

gtgggcgcca ccagcaccac cggcaccacc ggcagcgagc tgtggggcta cgccaccaac 180

aagtgggagg tggccgacgg catcccccgc gagagccccg agaagcgcgg catgcacacc 240

gaggagctgc tgctggacga gatgacccgc cacgtgcgcg agcacagcgg cgtgggcttc 300

tgcgtggagt ggttcaccag ctggagcccc tgccaccgct gcagcggcct gctgctgcgc 360

tggctgcgcg acatcggcgg cggacgccac cgcctgcgcg tgtggttcag ccgcatctac 420

tacggcgacg acggcgccgt gcgcgccggc ctgcgccgcc tgcgccgcgc cggcgtgcag 480

ctgggcgtga tggacggccg cctgcacgac tactgcgccc acgtgctggt ggacgccgcc 540

tggggcgacc ccaccccccc ctggctggtg ccctggcaca tcaacgtgcc ccgcgtgcag 600

cgcgccttcg acgagatcat ggacgagaag gtgcgcgagc ccggctggtg ctggtggtgc 660

tggcgcccct ggtggctggc cgacgtgccc agcaacgcca gcttccccca gctgcccgtg 720

aacgacgagg ccatcgtgga ccgcgtggag aagttcccct acctgggcag cctgctgatg 780

accagcagcg gcctggccgc cgaggtgagc atc 813

<210> 14

<211> 684

<212> DNA

<213> 人工序列

<400> 14

agctcagaga ctggcccagt ggctgtggac cccacattga gacggcggat cgagccccat 60

gagtttgagg tattcttcga tccgagagag ctccgcaagg agacctgcct gctttacgaa 120

attaattggg ggggccggca ctccatttgg cgacatacat cacagaacac taacaagcac 180

gtcgaagtca acttcatcga gaagttcacg acagaaagat atttctgtcc gaacacaagg 240

tgcagcatta cctggtttct cagctggagc ccatgcggcg aatgtagtag ggccatcact 300

gaattcctgt caaggtatcc ccacgtcact ctgtttattt acatcgcaag gctgtaccac 360

cacgctgacc cccgcaatcg acaaggcctg cgggatttga tctcttcagg tgtgactatc 420

caaattatga ctgagcagga gtcaggatac tgctggagaa actttgtgaa ttatagcccg 480

agtaatgaag cccactggcc taggtatccc catctgtggg tacgactgta cgttcttgaa 540

ctgtactgca tcatactggg cctgcctcct tgtctcaaca ttctgagaag gaagcagcca 600

cagctgacat tctttaccat cgctcttcag tcttgtcatt accagcgact gcccccacac 660

attctctggg ccaccgggtt gaaa 684

<210> 15

<211> 594

<212> DNA

<213> 人工序列

<400> 15

atggatagcc tcttgatgaa tagacgcaag ttcctgtatc agtttaaaaa cgtgagatgg 60

gcaaaaggcc gacgagagac atatctgtgc tatgtcgtta agcgcagaga ttcagccacc 120

agtttctctc tcgacttcgg ctacctgcgg aacaagaatg gttgccatgt tgagctcctg 180

ttcctgaggt atatcagcga ctgggatttg gacccagggc ggtgctatag ggtgacatgg 240

tttacctcct ggtcaccttg ttatgactgc gcgcggcatg ttgccgattt tctgagaggg 300

aaccctaacc tgtctctgag gatcttcacc gcgcgactgt acttctgtga ggaccggaaa 360

gccgaacccg agggactgag acgcctccac agagcgggtg tgcagattgc cataatgacc 420

tttaaggact acttctactg ctggaacacc ttcgtcgaaa atcacgagcg gactttcaag 480

gcttgggaag gattgcatga aaacagcgtc aggctttcca ggcagcttcg ccgcattctt 540

ctcccgttgt acgaggttga tgacctcaga gatgccttta gaacactggg actg 594

<210> 16

<211> 624

<212> DNA

<213> 人工序列

<400> 16

atgacagacg ctgaatatgt taggatacat gaaaaactgg atatctatac atttaagaag 60

cagttcttca ataacaaaaa gtcagtatct cacagatgct atgtcctgtt cgaactcaag 120

agaagaggag aaaggcgggc ctgtttctgg gggtacgcgg ttaataaacc ccagtccggg 180

accgagaggg ggattcacgc cgagatcttt tcaattagga aggttgaaga gtatcttcgc 240

gacaatcccg gtcagttcac aattaactgg tacagctcct ggagcccttg cgctgattgc 300

gccgagaaaa tactcgaatg gtacaaccag gagttgagag gcaatggcca cactctcaag 360

atttgggctt gcaagcttta ctacgagaag aacgcgagaa atcagattgg cttgtggaac 420

ctcagggaca acggggtcgg gttgaatgtt atggtgtccg aacattacca gtgctgtaga 480

aagatcttca ttcagtccag tcacaatcag ctgaacgaga acagatggct ggagaaaaca 540

ctgaaacggg cagagaaaag gcgctcagag ctgagtatca tgatccaggt caaaatcctg 600

catacaacca aaagcccggc tgta 624

<210> 17

<211> 6004

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (976)..(981)

<223> n is a, c, g, or t

<400> 17

gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 60

ccttgaatta cttccacctg gctgcagtac gtgattcttg atcccgagct tcgggttgga 120

agtgggtggg agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt 180

gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt 240

ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt 300

tttttctggc aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt 360

tttggggccg cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg 420

ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct 480

ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg 540

tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca 600

aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg 660

gcctttccgt cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg 720

cacctcgatt agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt 780

tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac 840

ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag 900

cctcagacag tggttcaaag tttttttctt ccatttcagg tgtcgtgagg tgtcgtgagc 960

gccatggccg gatccnnnnn ngctagacga tccgacaaga agtacagcat cggcctggcc 1020

atcggcacca actctgtggg ctgggccgtg atcaccgacg agtacaaggt gcccagcaag 1080

aaattcaagg tgctgggcaa caccgaccgg cacagcatca agaagaacct gatcggagcc 1140

ctgctgttcg acagcggcga aacagccgag gccacccggc tgaagagaac cgccagaaga 1200

agatacacca gacggaagaa ccggatctgc tatctgcaag agatcttcag caacgagatg 1260

gccaaggtgg acgacagctt cttccacaga ctggaagagt ccttcctggt ggaagaggat 1320

aagaagcacg agcggcaccc catcttcggc aacatcgtgg acgaggtggc ctaccacgag 1380

aagtacccca ccatctacca cctgagaaag aaactggtgg acagcaccga caaggccgac 1440

ctgcggctga tctatctggc cctggcccac atgatcaagt tccggggcca cttcctgatc 1500

gagggcgacc tgaaccccga caacagcgac gtggacaagc tgttcatcca gctggtgcag 1560

acctacaacc agctgttcga ggaaaacccc atcaacgcca gcggcgtgga cgccaaggcc 1620

atcctgtctg ccagactgag caagagcaga cggctggaaa atctgatcgc ccagctgccc 1680

ggcgagaaga agaatggcct gttcggcaac ctgattgccc tgagcctggg cctgaccccc 1740

aacttcaaga gcaacttcga cctggccgag gatgccaaac tgcagctgag caaggacacc 1800

tacgacgacg acctggacaa cctgctggcc cagatcggcg accagtacgc cgacctgttt 1860

ctggccgcca agaacctgtc cgacgccatc ctgctgagcg acatcctgag agtgaacacc 1920

gagatcacca aggcccccct gagcgcctct atgatcaaga gatacgacga gcaccaccag 1980

gacctgaccc tgctgaaagc tctcgtgcgg cagcagctgc ctgagaagta caaagagatt 2040

ttcttcgacc agagcaagaa cggctacgcc ggctacattg acggcggagc cagccaggaa 2100

gagttctaca agttcatcaa gcccatcctg gaaaagatgg acggcaccga ggaactgctc 2160

gtgaagctga acagagagga cctgctgcgg aagcagcgga ccttcgacaa cggcagcatc 2220

ccccaccaga tccacctggg agagctgcac gccattctgc ggcggcagga agatttttac 2280

ccattcctga aggacaaccg ggaaaagatc gagaagatcc tgaccttccg catcccctac 2340

tacgtgggcc ctctggccag gggaaacagc agattcgcct ggatgaccag aaagagcgag 2400

gaaaccatca ccccctggaa cttcgaggaa gtggtggaca agggcgcttc cgcccagagc 2460

ttcatcgagc ggatgaccaa cttcgataag aacctgccca acgagaaggt gctgcccaag 2520

cacagcctgc tgtacgagta cttcaccgtg tataacgagc tgaccaaagt gaaatacgtg 2580

accgagggaa tgagaaagcc cgccttcctg agcggcgagc agaaaaaggc catcgtggac 2640

ctgctgttca agaccaaccg gaaagtgacc gtgaagcagc tgaaagagga ctacttcaag 2700

aaaatcgagt gcttcgactc cgtggaaatc tccggcgtgg aagatcggtt caacgcctcc 2760

ctgggcacat accacgatct gctgaaaatt atcaaggaca aggacttcct ggacaatgag 2820

gaaaacgagg acattctgga agatatcgtg ctgaccctga cactgtttga ggacagagag 2880

atgatcgagg aacggctgaa aacctatgcc cacctgttcg acgacaaagt gatgaagcag 2940

ctgaagcggc ggagatacac cggctggggc aggctgagcc ggaagctgat caacggcatc 3000

cgggacaagc agtccggcaa gacaatcctg gatttcctga agtccgacgg cttcgccaac 3060

agaaacttca tgcagctgat ccacgacgac agcctgacct ttaaagagga catccagaaa 3120

gcccaggtgt ccggccaggg cgatagcctg cacgagcaca ttgccaatct ggccggcagc 3180

cccgccatta agaagggcat cctgcagaca gtgaaggtgg tggacgagct cgtgaaagtg 3240

atgggccggc acaagcccga gaacatcgtg atcgaaatgg ccagagagaa ccagaccacc 3300

cagaagggac agaagaacag ccgcgagaga atgaagcgga tcgaagaggg catcaaagag 3360

ctgggcagcc agatcctgaa agaacacccc gtggaaaaca cccagctgca gaacgagaag 3420

ctgtacctgt actacctgca gaatgggcgg gatatgtacg tggaccagga actggacatc 3480

aaccggctgt ccgactacga tgtggaccat atcgtgcctc agagctttct gaaggacgac 3540

tccatcgaca acaaggtgct gaccagaagc gacaagaacc ggggcaagag cgacaacgtg 3600

ccctccgaag aggtcgtgaa gaagatgaag aactactggc ggcagctgct gaacgccaag 3660

ctgattaccc agagaaagtt cgacaatctg accaaggccg agagaggcgg cctgagcgaa 3720

ctggataagg ccggcttcat caagagacag ctggtggaaa cccggcagat cacaaagcac 3780

gtggcacaga tcctggactc ccggatgaac actaagtacg acgagaatga caagctgatc 3840

cgggaagtga aagtgatcac cctgaagtcc aagctggtgt ccgatttccg gaaggatttc 3900

cagttttaca aagtgcgcga gatcaacaac taccaccacg cccacgacgc ctacctgaac 3960

gccgtcgtgg gaaccgccct gatcaaaaag taccctaagc tggaaagcga gttcgtgtac 4020

ggcgactaca aggtgtacga cgtgcggaag atgatcgcca agagcgagca ggaaatcggc 4080

aaggctaccg ccaagtactt cttctacagc aacatcatga actttttcaa gaccgagatt 4140

accctggcca acggcgagat ccggaagcgg cctctgatcg agacaaacgg cgaaaccggg 4200

gagatcgtgt gggataaggg ccgggatttt gccaccgtgc ggaaagtgct gagcatgccc 4260

caagtgaata tcgtgaaaaa gaccgaggtg cagacaggcg gcttcagcaa agagtctatc 4320

ctgcccaaga ggaacagcga taagctgatc gccagaaaga aggactggga ccctaagaag 4380

tacggcggct tcgacagccc caccgtggcc tattctgtgc tggtggtggc caaagtggaa 4440

aagggcaagt ccaagaaact gaagagtgtg aaagagctgc tggggatcac catcatggaa 4500

agaagcagct tcgagaagaa tcccatcgac tttctggaag ccaagggcta caaagaagtg 4560

aaaaaggacc tgatcatcaa gctgcctaag tactccctgt tcgagctgga aaacggccgg 4620

aagagaatgc tggcctctgc cggcgaactg cagaagggaa acgaactggc cctgccctcc 4680

aaatatgtga acttcctgta cctggccagc cactatgaga agctgaaggg ctcccccgag 4740

gataatgagc agaaacagct gtttgtggaa cagcacaagc actacctgga cgagatcatc 4800

gagcagatca gcgagttctc caagagagtg atcctggccg acgctaatct ggacaaagtg 4860

ctgtccgcct acaacaagca ccgggataag cccatcagag agcaggccga gaatatcatc 4920

cacctgttta ccctgaccaa tctgggagcc cctgccgcct tcaagtactt tgacaccacc 4980

atcgaccgga agaggtacac cagcaccaaa gaggtgctgg acgccaccct gatccaccag 5040

agcatcaccg gcctgtacga gacacggatc gacctgtctc agctgggagg cgacaaaagg 5100

ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa aggaattggg tggaggaggt 5160

acaggcggtg gaggctcagc agaatacgta cgagctctgt ttgacttcaa tgggaatgac 5220

gaggaggatc tcccctttaa gaagggcgat attctccgca tcagagataa gcccgaagaa 5280

caatggtgga atgccgagga tagcgaaggg aaaaggggca tgattctggt gccttatgtg 5340

gagaaatatt ccggtgacta caaagaccat gatggggatt acaaagacca cgacatcgac 5400

tacaaagacg acgacgataa agaattccaa ttcatgacca acctttccga catcatagag 5460

aaggaaacag gcaaacagtt ggtcatccaa gagtcgatac tcatgcttcc tgaagaagtt 5520

gaggaggtca ttgggaataa gccggaaagt gacattctcg tacacactgc gtatgatgag 5580

agcaccgatg agaacgtgat gctgctcacg tcagatgccc cagagtacaa accctgggct 5640

ctggtgattc aggactctaa tggagagaac aagatcaaga tgctatctgg tggttctgga 5700

ggatctggtg gttctcaatt caytaatctg tcagatatta ttgaaaagga aaccggcaag 5760

caactggtta tccaggaatc catcctcatg ctcccagagg aggtggaaga agtcattggg 5820

aacaagccgg aaagcgatat actcgtgcac accgcctacg acgagagcac cgacgagaat 5880

gtcatgcttc tgactagcga cgcccctgaa tacaagcctt gggctctggt catacaggat 5940

agcaacggtg agaacaagat taagatgctc tctggtggtt ctcccaagaa gaagaggaaa 6000

gtcg 6004

<210> 18

<211> 6121

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (5524)..(5532)

<223> n is a, c, g, or t

<400> 18

gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 60

ccttgaatta cttccacctg gctgcagtac gtgattcttg atcccgagct tcgggttgga 120

agtgggtggg agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt 180

gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt 240

ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt 300

tttttctggc aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt 360

tttggggccg cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg 420

ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct 480

ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg 540

tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca 600

aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg 660

gcctttccgt cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg 720

cacctcgatt agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt 780

tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac 840

ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag 900

cctcagacag tggttcaaag tttttttctt ccatttcagg tgtcgtgagg tgtcgtgagc 960

gccatggact ataaggacca cgacggagac tacaaggatc atgatattga ttacaaagac 1020

gatgacgata agatggcccc aaagaagaag cggaaggtcg gtatccacgg agtcccagca 1080

gccgacaaga agtacagcat cggcctggcc atcggcacca actctgtggg ctgggccgtg 1140

atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 1200

cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 1260

gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 1320

tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 1380

ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 1440

aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 1500

aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 1560

atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 1620

gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 1680

atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 1740

cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggcaac 1800

ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 1860

gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 1920

cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 1980

ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 2040

atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 2100

cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 2160

ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 2220

gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 2280

aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 2340

gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 2400

gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 2460

agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 2520

gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 2580

aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 2640

tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 2700

agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 2760

gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 2820

tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 2880

atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 2940

ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 3000

cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 3060

aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 3120

gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 3180

agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 3240

cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 3300

gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 3360

atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 3420

atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 3480

gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 3540

gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 3600

atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 3660

gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 3720

aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 3780

accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 3840

ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 3900

actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 3960

aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 4020

taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 4080

taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 4140

atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 4200

aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 4260

cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 4320

gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 4380

cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 4440

gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 4500

tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 4560

aaagagctgc tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 4620

tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 4680

tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 4740

cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 4800

cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 4860

cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 4920

atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 4980

cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 5040

cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 5100

gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 5160

gacctgtctc agctgggagg cgacaaaagg ccggcggcca cgaaaaaggc cggccaggca 5220

aaaaagaaaa aggaattggg tggaggaggt acaggcggtg gaggctcagc agaatacgta 5280

cgagctctgt ttgacttcaa tgggaatgac gaggaggatc tcccctttaa gaagggcgat 5340

attctccgca tcagagataa gcccgaagaa caatggtgga atgccgagga tagcgaaggg 5400

aaaaggggca tgattctggt gccttatgtg gagaaatatt ccggtgacta caaagaccat 5460

gatggggatt acaaagacca cgacatcgac tacaaagacg acgacgataa agaattcgga 5520

tccnnnnnnn nngctagagg tacccaattc atgaccaacc tttccgacat catagagaag 5580

gaaacaggca aacagttggt catccaagag tcgatactca tgcttcctga agaagttgag 5640

gaggtcattg ggaataagcc ggaaagtgac attctcgtac acactgcgta tgatgagagc 5700

accgatgaga acgtgatgct gctcacgtca gatgccccag agtacaaacc ctgggctctg 5760

gtgattcagg actctaatgg agagaacaag atcaagatgc tatctggtgg ttctggagga 5820

tctggtggtt ctcaattcay taatctgtca gatattattg aaaaggaaac cggcaagcaa 5880

ctggttatcc aggaatccat cctcatgctc ccagaggagg tggaagaagt cattgggaac 5940

aagccggaaa gcgatatact cgtgcacacc gcctacgacg agagcaccga cgagaatgtc 6000

atgcttctga ctagcgacgc ccctgaatac aagccttggg ctctggtcat acaggatagc 6060

aacggtgaga acaagattaa gatgctctct ggtggttctc ccaagaagaa gaggaaagtc 6120

g 6121

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<400> 19

gggaataaat catagaatcc 20

<210> 20

<211> 20

<212> DNA

<213> 人工序列

<400> 20

tgcccctccc tccctggccc 20

<210> 21

<211> 20

<212> DNA

<213> 人工序列

<400> 21

agagcccccc ctcaaagaga 20

<210> 22

<211> 20

<212> DNA

<213> 人工序列

<400> 22

acacacacac ttagaatctg 20

<210> 23

<211> 20

<212> DNA

<213> 人工序列

<400> 23

cacacacact tagaatctgt 20

<210> 24

<211> 20

<212> DNA

<213> 人工序列

<400> 24

ggcccagact gagcacgtga 20

<210> 25

<211> 20

<212> DNA

<213> 人工序列

<400> 25

ggcactgcgg ctggaggtgg 20

<210> 26

<211> 20

<212> DNA

<213> 人工序列

<400> 26

ggaatccctt ctgcagcacc 20

<210> 27

<211> 20

<212> DNA

<213> 人工序列

<400> 27

gagtccgagc agaagaagaa 20

<210> 28

<211> 20

<212> DNA

<213> 人工序列

<400> 28

gaccccctcc accccgcctc 20

<210> 29

<211> 20

<212> DNA

<213> 人工序列

<400> 29

gcagagagtc gccgtctcca 20

<210> 30

<211> 20

<212> DNA

<213> 人工序列

<400> 30

ggcggctgca caaccagtgg 20

<210> 31

<211> 20

<212> DNA

<213> 人工序列

<400> 31

gcactaccta cgtcagcacc 20

<210> 32

<211> 20

<212> DNA

<213> 人工序列

<400> 32

aagttccatt tggctactga 20

<210> 33

<211> 20

<212> DNA

<213> 人工序列

<400> 33

gaacacaaag catagactgc 20

<210> 34

<211> 20

<212> DNA

<213> 人工序列

<400> 34

gaatactaag catagactcc 20

<210> 35

<211> 5951

<212> DNA

<213> 人工序列

<400> 35

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg gagaccgaga gagggtctca gttttagagc tagaaatagc aagttaaaat 300

aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttaaagaat 360

tcctagcgtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 420

ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 480

gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 540

gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 600

gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 660

acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 720

gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 780

cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 840

ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 900

caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 960

gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 1020

gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 1080

ggcctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 1140

gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 1200

acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 1260

tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 1320

tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1380

gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1440

ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1500

gtggttcaaa gtttttttct tccatttcag gtgtcgtgac gtacggccac catgcatggt 1560

ggccgtacgg ccaccatgtc tagacctaag aaaaagagga aggtggcggc cgctggatcc 1620

ccatggatga ccaacctttc cgacatcata gagaaggaaa caggcaaaca gttggtcatc 1680

caagagtcga tactcatgct tcctgaagaa gttgaggagg tcattgggaa taagccggaa 1740

agtgacattc tcgtacacac tgcgtatgat gagagcaccg atgagaacgt gatgctgctc 1800

acgtcagatg ccccagagta caaaccctgg gctctggtga ttcaggactc taatggagag 1860

aacaagatca agatgctatc tggtggttct ggaggatctg gtggttctca attcactaat 1920

ctgtcagata ttattgaaaa ggaaaccggc aagcaactgg ttatccagga atccatcctc 1980

atgctcccag aggaggtgga agaagtcatt gggaacaagc cggaaagcga tatactcgtg 2040

cacaccgcct acgacgagag caccgacgag aatgtcatgc ttctgactag cgacgcccct 2100

gaatacaagc cctgggctct ggtcatacag gatagcaacg gtgagaacaa gattaagatg 2160

ctctctggtg gttctcccaa gaagaagagg aaagtcgcta gcgagggcag aggaagtctg 2220

ctaacatgcg gtgacgtcga ggagaatcct ggccctagcg tgagcaaggg cgaggaggat 2280

aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg ctccgtgaac 2340

ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 2400

gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat cctgtcccct 2460

cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc cgactacttg 2520

aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 2580

gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta caaggtgaag 2640

ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac catgggctgg 2700

gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga gatcaagcag 2760

aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac ctacaaggcc 2820

aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga catcacctcc 2880

cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg ccactccacc 2940

ggcggcatgg acgagctgta caaggaattc taactagagc tcgctgatca gcctcgactg 3000

tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg 3060

aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga 3120

gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg 3180

aagagaatag caggcatgct ggggagcggc cgcaggaacc cctagtgatg gagttggcca 3240

ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 3300

cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc 3360

tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata cgtcaaagca 3420

accatagtac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 3480

cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 3540

tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 3600

ccgatttagt gctttacggc acctcgaccc caaaaaactt gatttgggtg atggttcacg 3660

tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 3720

taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg gctattcttt 3780

tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 3840

aaaatttaac gcgaatttta acaaaatatt aacgtttaca attttatggt gcactctcag 3900

tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 3960

cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4020

cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4080

cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4140

aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4200

ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4260

aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 4320

ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 4380

gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 4440

ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 4500

ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 4560

gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 4620

aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 4680

gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 4740

aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 4800

caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 4860

tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 4920

acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 4980

gcgtggaagc cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 5040

agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 5100

gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 5160

ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 5220

taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 5280

agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 5340

aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 5400

ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 5460

gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 5520

aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 5580

aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 5640

gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 5700

aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 5760

aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 5820

cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 5880

cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 5940

tgctcacatg t 5951

36页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:紫杉二烯合酶TcTS2、编码核苷酸序列及其应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!