以失活的筛选剂抗性基因为报告体系的a·g碱基替换的细胞富集技术及其应用

文档序号:1668368 发布日期:2019-12-31 浏览:15次 >En<

阅读说明:本技术 以失活的筛选剂抗性基因为报告体系的a·g碱基替换的细胞富集技术及其应用 ([db:专利名称-en]) 是由 杨永星 杨进孝 康桂婷 王飞鹏 宋金岭 于 2019-09-30 设计创作,主要内容包括:本发明公开了以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞富集技术及其应用。所述细胞富集技术载体包括如下试剂:靶向目标基因靶点序列的sgRNA、靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA、A·G碱基替换系统和功能丧失的筛选剂抗性基因;A·G碱基替换系统在靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换使功能丧失的筛选剂抗性基因功能恢复。本发明实现了细胞水平上A·G碱基替换细胞富集,大大提高A·G碱基替换效率。([db:摘要-en])

以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞 富集技术及其应用

技术领域

本发明涉及生物技术领域,具体涉及以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞富集技术及其应用。

背景技术

CRISPR-Cas9技术已经成为强有力的基因组编辑手段,被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上,切割产生DNA双链断裂(dsDNA break,DSB),而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种,一种是非同源末端连接(non-homologous end joining,NHEJ),另一种是同源重组(homology-directed repair,HDR)。通常情况下NHEJ占大多数,因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换,因为HDR效率低以及需要DNA模板,所以使用HDR实现碱基精确替换的应用受到很大的限制。

2017年,David Liu实验室报道了一种新型的腺嘌呤碱基编辑器(adenine baseeditors,ABE)。通过七轮进化,研究者将来源于大肠杆菌的tRNA腺嘌呤脱氨酶(tRNAadenosine deaminase,ecTadA)融合在Cas9 nickase(Cas9n)的5’端,在细胞内能够直接实现对单个碱基A(Adenine,A)到G(Guanine,G)的替换,而不再通过产生DSB和启动HDR修复,大大提高了A替换为G的碱基编辑效率。具体过程为:当含有基因组靶向序列的sgRNA与ecTadA&ecTadA&Cas9n结合时,复合体定位到靶点,ecTadA催化非配对的单链DNA上的A发生腺嘌呤脱氨反应变成肌苷(Inosine,I),在DNA修复的过程中,I会被视为G,Cas9n会在切割配对的DNA链的磷酸二酯键,引入一个胞嘧啶C(Cytosine)与I配对。最终在接下来的修复过程中产生C-G配对,从而实现了A到G的转换。

目前,在植物中通过报告基因介导的细胞富集技术富集A·G碱基替换细胞的研究非常有限,目前尚无利用转化过程中使用筛选标记在细胞水平上实现A·G碱基替换细胞的富集,进而提高A·G碱基替换效率的报道。

发明内容

本发明的目的是提供一种以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞富集技术,该细胞富集技术能够在细胞水平上实现A·G碱基替换细胞的富集,进而提高目标靶点的A·G碱基替换效率。

为了实现上述目的,本发明首先提供了一种成套试剂,所述成套试剂包括sgRNA或与所述sgRNA相关的生物材料、A·G碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料;

所述sgRNA由靶向目标基因靶点序列的sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA组成;

所述sgRNA结构如下:所述靶点序列转录的RNA-sgRNA骨架;

所述A·G碱基替换系统包括Cas9核酸酶或与所述Cas9核酸酶相关的生物材料和腺嘌呤脱氨酶或与所述腺嘌呤脱氨酶相关的生物材料;

所述A·G碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换使所述功能丧失的筛选剂抗性基因功能恢复;

所述sgRNA骨架为S1)或S2)或S3):

S1)将序列1第617-692位中的T替换为U得到的RNA分子;

S2)将S1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;

S3)与S1)或S2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子。

上述成套试剂中,靶向所述目标基因靶点序列的个数可为一个或两个或多个;靶向所述功能丧失的筛选剂抗性基因靶点序列的个数可为一个或两个或多个。所述靶点序列大小可为15-25bp,进一步可为18-22bp,更进一步可为20bp。

所述功能丧失的筛选剂抗性基因满足如下条件:所述功能丧失的筛选剂抗性基因功能或活性丧失,且通过对所述功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换后可使所述功能丧失的筛选剂抗性基因功能恢复。所述功能丧失的筛选剂抗性基因靶点序列可为功能丧失的筛选剂抗性基因序列上的靶点序列(位于功能丧失的筛选剂抗性基因序列内部),也可为额外添加在功能丧失的筛选剂抗性基因序列内部或5’端或3’端的靶点序列。当为了使功能丧失的筛选剂抗性基因在进行A·G碱基替换后可恢复功能而在其序列上额外添加了靶点靶序列(记作代理靶点靶序列)时,所述功能丧失的筛选剂抗性基因序列不仅包括功能丧失的筛选剂抗性基因本身,还包括代理靶点靶序列以及如果需要,为了保证添加代理靶点靶序列后筛选剂抗性基因能够在正常读码框内翻译再额外添加的一个或两个或多个碱基。

进一步的,所述功能丧失的筛选剂抗性基因可为将筛选剂抗性基因的起始密码子(如ATG)删除,且在筛选剂抗性基因5’端添加代理靶点靶序列后得到的序列。所述代理靶点靶序列满足如下条件即可:通过A·G碱基替换系统对所述代理靶点靶序列进行A·G碱基替换后可使所述功能丧失的筛选剂抗性基因功能恢复。代理靶点靶序列依次由功能丧失的筛选剂抗性基因靶点序列和PAM序列组成。需要注意的是,为了保证添加代理靶点靶序列后,去除起始密码子的筛选剂抗性基因能够在正常读码框内翻译,可在代理靶点靶序列和去除起始密码子的筛选剂抗性基因之间再添加一个或两个或多个碱基。

在本发明的一个具体实施例中,所述代理靶点靶序列为序列5。所述功能丧失的筛选剂抗性基因靶点序列为序列5第1-20位。所述A·G碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述代理靶点靶序列进行A·G碱基替换,使代理靶点靶序列第6位碱基A突变为碱基G,形成ATG,进而使筛选标记基因功能恢复。需要注意的是,为了保证添加代理靶点序列后,去除起始密码子的筛选剂抗性基因能够在正常读码框内翻译,此处在代理靶点靶序列和去除起始密码子的筛选剂抗性基因之间又添加了一个碱基C。

更进一步的,所述筛选剂抗性基因可为现有技术中常见的筛选剂抗性基因,如Bar/PAT草铵膦-N-乙酰转移酶基因、PMI 6-磷酸甘露糖异构酶基因、EPSPS 5-烯醇丙酮莽草酸-3-磷酸合成酶基因等。在本发明的一个具体实施例中,所述筛选剂抗性基因为潮霉素抗性基因。

上述成套试剂中,所述Cas9核酸酶包括不同来源的Cas9核酸酶或其变体、dead失活酶(dead Cas9,dCas9)或其变体、nickase切刻酶(Cas9 nickase,Cas9n)或其变体。所述不同来源的Cas9核酸酶或其变体包括来源于细菌的Cas9(如SaCas9、SaCas9-KKH等),Cas9-PAM变体(如xCas9、NG Cas9、Cas9-VQR、Cas9-VRER等),Cas9高保真酶变体(如HypaCas9、eSpCas9(1.1)、Cas9-HF1等)等。在本发明的一个具体实施例中,所述Cas9核酸酶为Cas9n,具体为SpCas9n蛋白质。在本发明的另一个具体实施例中,所述Cas9核酸酶为Cas9n,具体为HypaCas9n蛋白质。

所述腺嘌呤脱氨酶可为不同来源的腺嘌呤脱氨酶,如来源于大肠杆菌的ecTadA蛋白质、或来源于植物内源的腺嘌呤脱氨酶(如水稻内源OsTadA,拟南芥来源AtTadA等)。在本发明的一个具体实施例中,所述腺嘌呤脱氨酶为来源于大肠杆菌的ecTadA蛋白质。

进一步的,所述SpCas9n蛋白质为A1)或A2)或A3):

A1)氨基酸序列是序列3所示的蛋白质;

A2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质;

与所述SpCas9n相关的生物材料为B1)至B5)中的任一种:

B1)编码所述SpCas9n的核酸分子;

B2)含有B1)所述核酸分子的表达盒;

B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;

B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;

B5)含有B1)所述核酸分子的转基因细胞系、或含有B2)所述表达盒的转基因细胞系;

所述ecTadA蛋白质为E1)或E2)或E3):

E1)氨基酸序列是序列2所示的蛋白质;

E2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质;

与所述ecTadA蛋白质相关的生物材料为F1)至F5)中的任一种:

F1)编码所述ecTadA蛋白质的核酸分子;

F2)含有F1)所述核酸分子的表达盒;

F3)含有F1)所述核酸分子的重组载体、或含有F2)所述表达盒的重组载体;

F4)含有F1)所述核酸分子的重组微生物、或含有F2)所述表达盒的重组微生物、或含有F3)所述重组载体的重组微生物;

F5)含有F1)所述核酸分子的转基因细胞系、或含有F2)所述表达盒的转基因细胞系;

与所述功能丧失的筛选剂抗性基因相关的生物材料为K1)至K4)中的任一种:

K1)含有所述功能丧失的筛选剂抗性基因的表达盒;

K2)含有所述功能丧失的筛选剂抗性基因的重组载体、或含有K1)所述表达盒的重组载体;

K3)含有所述功能丧失的筛选剂抗性基因的重组微生物、或含有K1)所述表达盒的重组微生物、或含有K2)所述重组载体的重组微生物;

K4)含有所述功能丧失的筛选剂抗性基因的转基因细胞系、或含有K1)所述表达盒的转基因细胞系。

为了使A1)、E1)中的蛋白质便于纯化,可在由序列表中序列2或序列3所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。

表、标签的序列

标签 残基 序列
Poly-Arg 5-6(通常为5个) RRRRR
Poly-His 2-10(通常为6个) HHHHHH
FLAG 8 DYKDDDDK
Strep-tag II 8 WSHPQFEK
c-myc 10 EQKLISEEDL

上述A2)、E2)中的蛋白质,为与序列2或序列3所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。

上述A2)、E2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。

上述A2)、E2)中的蛋白质的编码基因可通过将序列1的第4205-4705位(编码序列2所示的蛋白质)、序列1的第5396-9496位(编码序列3所示的蛋白质)所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。

更进一步的,B1)所述核酸分子为b1)或b2)或b3):

b1)序列表中序列1第5396-9496位所示的cDNA分子或DNA分子;

b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述SpCas9n的cDNA分子或DNA分子;

b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述SpCas9n的cDNA分子或DNA分子;

F1)所述核酸分子为f1)或f2)或f3):

f1)序列表中序列1第4205-4705位所示的cDNA分子或DNA分子;

f2)与f1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述ecTadA的cDNA分子或DNA分子;

f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述ecTadA的cDNA分子或DNA分子;

K1)所述功能丧失的筛选剂抗性基因为序列1第12278-13324位所示的DNA分子。

其中,所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如mRNA或hnRNA等。

本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码所述SpCas9n或所述ecTadA的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明的所述SpCas9n或所述ecTadA的核苷酸序列75%或者更高同一性的核苷酸,只要编码所述SpCas9n或所述ecTadA且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。

这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2或3所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。

所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。

上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。

B2)所述的含有编码SpCas9n蛋白质的核酸分子的表达盒(SpCas9n基因表达盒),是指能够在宿主细胞中表达SpCas9n蛋白质的DNA,该DNA不但可包括启动SpCas9n基因转录的启动子,还可包括终止SpCas9n基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述SpCas9n基因表达盒的重组载体。

F2)所述的含有编码ecTadA蛋白质的核酸分子的表达盒(ecTadA基因表达盒),是指能够在宿主细胞中表达ecTadA蛋白质的DNA,该DNA不但可包括启动ecTadA基因转录的启动子,还可包括终止ecTadA基因转录的终止子。进一步,所述表达盒还可包括增强子序列。更进一步,所述表达盒中可含有一个或两个编码ecTadA蛋白质的核酸分子。可用现有的表达载体构建含有所述ecTadA基因表达盒的重组载体。

所述载体可为质粒、黏粒、噬菌体或病毒载体。在本发明的具体实施例中,所述重组载体具体为sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体或sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体。

所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体的序列为序列1。所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体含有四个靶点序列,序列见表1。

所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体的序列为将序列1中的前三个靶点序列依次分别替换为如下三个靶点序列:DEP1-T2、ACC、NRT1.1B-T4,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体的序列为将序列1中的前三个靶点序列依次分别替换为如下三个靶点序列:SPL14、WRKY45、DELLA,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

所述微生物可为酵母、细菌、藻或真菌。其中,所述细菌可为农杆菌,如农杆菌EHA105。在本发明的具体实施例中,所述重组微生物具体为含有所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体或所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体或所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体的农杆菌EHA105。

所述转基因细胞系不包括繁殖材料。

上述成套试剂具有如下用途:

M1)富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞;

M2)制备富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞的产品;

M3)提高生物体或生物细胞基因组靶点序列的A·G碱基替换效率;

M4)制备提高生物体或生物细胞基因组靶点序列的A·G碱基替换效率的产品;

M5)生物体或生物细胞基因组靶点序列中的A·G碱基替换;

M6)制备生物体或生物细胞靶点序列中的A·G碱基替换的产品。

上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料也属于本发明的保护范围。

为了实现上述目的,本发明还提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料的新用途。

本发明提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料在M1)-M6)任一种中的应用:

M1)富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞;

M2)制备富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞的产品;

M3)提高生物体或生物细胞基因组靶点序列的A·G碱基替换效率;

M4)制备提高生物体或生物细胞基因组靶点序列的A·G碱基替换效率的产品;

M5)生物体或生物细胞基因组靶点序列中的A·G碱基替换;

M6)制备生物体或生物细胞靶点序列中的A·G碱基替换的产品。

为了实现上述目的,本发明还提供了N1)或N2)或N3)所述的方法:

N1)富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列A·G碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、腺嘌呤脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述sgRNA、所述腺嘌呤脱氨酶均得到表达;所述Cas9核酸酶和所述腺嘌呤脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生A·G碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生A·G碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的A·G碱基替换效率;

N2)富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列A·G碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、腺嘌呤脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶和所述腺嘌呤脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生A·G碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生A·G碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的A·G碱基替换效率;

N3)生物突变体的制备方法,包括如下步骤:按照N1)或N2)所述的方法对生物体的基因组进行编辑,获得生物突变体;所述生物突变体为发生A·G碱基替换的生物体。

上述方法中,所述N1)中,所述Cas9核酸酶的编码基因、所述转录靶向目标基因靶点序列的sgRNA的DNA分子、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子和所述腺嘌呤脱氨酶的编码基因通过含有所述Cas9核酸酶的编码基因的表达盒、所述转录靶向目标基因靶点序列的sgRNA的DNA分子的表达盒、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子的表达盒、所述腺嘌呤脱氨酶的编码基因的表达盒的重组载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内,也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。

在本发明的具体实施例中,上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内。该重组表达载体中腺嘌呤脱氨酶编码基因的表达盒含有两个腺嘌呤脱氨酶的编码基因。所述重组表达载体具体为上述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体或上述sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体或上述sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体。

上述成套试剂或应用或方法中,所述A·G碱基替换为碱基A突变为碱基G。所述碱基A可为位于所述靶点序列中任意位置的碱基A。

上述成套试剂或应用或方法中,所述生物体为P1)或P2)或P3)或P4):

P1)植物或动物;

P2)单子叶植物或双子叶植物;

P3)禾本科植物;

P4)水稻(如日本晴水稻);

所述生物细胞为Q1)或Q2)或Q3)或Q4):

Q1)植物细胞或动物细胞;

Q2)单子叶植物细胞或双子叶植物细胞;

Q3)禾本科植物细胞;

Q4)水稻细胞(如日本晴水稻细胞)。

本发明的细胞富集技术原理如下:以失活的筛选剂抗性基因为报告基因,建立一种A·G碱基替换的细胞富集技术,使得报告基因上发生了A·G碱基替换的细胞能够在含有筛选剂的培养基中生长出来,没有发生A·G碱基替换的细胞不能够在含有筛选剂的培养基中生长。在此报告基因的基础上,如果同时对内源目标基因靶点进行A·G碱基替换编辑,在含有筛选剂的培养基中生长出来的细胞有更大的概率发生内源目标基因靶点的A·G碱基替换,从而实现对内源目标基因靶点发生A·G碱基替换的细胞的富集,进而提高内源目标基因靶点的A·G碱基替换效率。

本发明具有以下优点:

1、有多种不同类型的基因可以作为报告基因,在植物中进行A·G碱基替换的细胞富集。由于各种作物的遗传转化方法(如农杆菌转化法、基因枪转化法)都有相对成熟、稳定的筛选体系,使用转化用筛选剂对应的抗性基因作为报告基因进行基因组内源突变细胞的富集,比其余的如荧光报告基因、内源除草剂抗性基因等,更具有广谱性、通用性。

2、技术设计简便,其中的代理靶点以及设计形式可以更广泛的应用到更多的筛选剂对应的抗性基因中,以满足不同作物的不同转化筛选体系的需求。

3、本发明的细胞富集技术对不同的脱氨酶介导的碱基编辑器或者是不同的Cas9酶介导的碱基编辑器均实现了细胞水平上A·G碱基替换细胞富集,大大提高A·G碱基替换效率。

附图说明

图1为细胞富集技术载体和非细胞富集技术载体的结构示意图。

图2为细胞富集技术富集A·G碱基替换的细胞的工作原理示意图。

图3为重组载体的结构示意图。

图4为细胞富集技术与非细胞富集技术在水稻抗性愈伤中对靶点的A·G碱基替换效率比较。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。

引物对T1由引物T1-F:5’-ctgtcttcggctggtctggg-3’和引物T1-R:5’-tgccaagcacatcaaacaagtaaa-3’组成,用于扩增靶点ALS-T4。

引物对T2由引物T2-F:5’-tctagactgtagtggtgataac-3’和引物T2-R:5’-tttcttctttctgattaatggcc-3’组成,用于扩增靶点CDC48-T3。

引物对T3由引物T3-F:5’-aatccaccaccaatccaatcc-3’和引物T3-R:5’-caccatggcgtcgtcgtccg-3’组成,用于扩增靶点AAT。

引物对T4由引物T4-F:5’-tcagcctgcagtactgaattatc-3’和引物T4-R:5’-gggcctaagtgtgacatacaag-3’组成,用于扩增靶点DEP1-T2。

引物对T5由引物T5-F:5’-gcattgctggacttcaacc-3’和引物T5-R:5’-caaaccgtatcgcaatctgag-3’组成,用于扩增靶点ACC。

引物对T6由引物T6-F:5’-agcatatatagcaagccaggttg-3’和引物T6-R:5’-aataagccactgtgttatgtacgc-3’组成,用于扩增靶点NRT1.1B-T4。

引物对T7由引物T7-F:5’-gatgtgttgtttgttgcgattc-3’和引物T7-R:5’-agtgggcatgatggctagg-3’组成,用于扩增靶点SPL14。

引物对T8由引物T8-F:5’-ctacagggtcacctacatcgg-3’和引物T8-R:5’-tgagacgacacatcaacaagg-3’组成,用于扩增靶点WRKY45。

引物对T9由引物T9-F:5’-gaagcgcgagtaccaagaag-3’和引物T9-R:5’-atccgcttggtgtccctc-3’组成,用于扩增靶点DELLA。

以下实施例中,A·G碱基替换是指靶点序列中任何位置的A突变为G。

A·G碱基替换效率=发生A·G碱基替换的阳性抗性愈伤数/分析的总阳性抗性愈伤数×100%。

日本晴水稻:参考文献:梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.;公众可以从北京市农林科学院获得。

恢复培养基:含有200mg/L特美汀的N6固体培养基。

筛选培养基:含有50mg/L潮霉素的N6固体培养基。

实施例1、EcTadA&ecTadA&Cas9n介导的A·G碱基替换的细胞富集技术的建立

一、EcTadA&ecTadA&Cas9n介导的A·G碱基替换的细胞富集技术载体的建立

将EcTadA&ecTadA&Cas9n(ABE)介导的A·G碱基替换的普通技术(非细胞富集技术)载体命名为sgRNA-GT。

将EcTadA&ecTadA&Cas9n(ABE)介导的A·G碱基替换的细胞富集技术载体命名为sgRNA-ATG-Hyg-ATG/sgRNA-GT。

sgRNA-GT和sgRNA-ATG-Hyg-ATG/sgRNA-GT载体的结构示意图均如图1所示。

细胞富集技术载体为在非细胞富集技术载体基础上对筛选剂抗性基因进行改造使其功能丧失,同时在sgRNA部分加入相应的代理靶点后得到的载体。

以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例:非细胞富集技术载体中的筛选剂抗性基因为完整的潮霉素抗性基因Hygromycin。细胞富集技术载体中的筛选剂抗性基因为功能丧失的潮霉素抗性基因Hygromycin(Hygromycin-ATG),功能丧失的潮霉素抗性基因Hygromycin为将完整的潮霉素抗性基因Hygromycin去掉ATG,且在5’端添加代理靶点序列(含有PAM)后得到的序列。其中,代理靶点序列如下:ctcatagcactcaatgcggtTGG(大写字母碱基为PAM序列)。

二、EcTadA&ecTadA&Cas9n介导的A·G碱基替换的细胞富集技术的工作原理

A·G碱基替换的细胞富集技术的工作原理如图2所示。以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例:在细胞富集技术中,由于潮霉素抗性基因Hygromycin去掉ATG后,抗性功能丧失,在潮霉素筛选培养基中,植物无法长出抗性愈伤,当细胞富集技术中的A·G碱基替换系统(EcTadA&ecTadA&Cas9n)在sgRNA向导下将代理靶点序列中的A6突变为G6(第6位碱基A突变为碱基G),形成ATG后,能够使潮霉素抗性基因Hygromycin正常表达,抗性功能恢复,进而使植物在潮霉素筛选培养基中长出抗性愈伤。由于长出抗性愈伤的细胞已经发生了A·G碱基替换,那么此细胞对应的内源基因发生A·G碱基替换的效率相对会更高,从而达到富集A·G碱基替换细胞的目的,实现提高植物内源靶点的A·G碱基替换效率。

实施例2、EcTadA&ecTadA&Cas9n介导的细胞富集技术载体的构建及其在水稻基因组编辑中的应用

一、重组表达载体的构建

本实施例中的重组表达载体分为如下两种:sgRNA-ATG-Hyg-ATG/sgRNA-GT重组表达载体、sgRNA-GT重组表达载体。两种重组表达载体示意图如图3所示。各载体均为环状质粒。

根据含有的靶序列不同,每种重组表达载体又各自分成三种,共有如下六种重组表达载体:sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体、sgRNA-GT-1重组表达载体、sgRNA-GT-2重组表达载体、sgRNA-GT-3重组表达载体。

人工合成上述六种重组表达载体,六种重组表达载体的具体结构描述分别如下:

sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体的序列为序列表中的序列1。序列1的第131-596位为OsU6a启动子的核苷酸序列,第702-1034位为OsU6b启动子的核苷酸序列,第1140-1881位为OsU6c启动子的核苷酸序列,第1987-2367位为OsU3启动子的核苷酸序列;第597-616位、第1035-1054位、第1882-1901位分别为ALS-T4、CDC48-T3、AAT三个靶点序列,第2368-2387位为报告基因代理靶点序列;第617-692位、第1055-1130位、第1902-1977位、第2388-2463位为sgRNA核苷酸序列。序列1的第2482-4195位为OsUbq3启动子的核苷酸序列,第4205-4705位、第4802-5299位为ecTadA的编码序列,均编码序列2所示的ecTadA蛋白质;序列1的第5396-9496位为SpCas9n蛋白质的编码序列,编码序列3所示的SpCas9n蛋白质;序列1的第9653-9985位为OsUbq3的3’UTR序列;序列1的第9986-10237位为Nos终止子的核苷酸序列。序列1的第10279-12271位为ZmUbi1启动子的核苷酸序列,第12278-12300位为代理靶点的靶序列,第12302-13324位为去掉起始密码子的潮霉素磷酸转移酶的核苷酸序列,第13351-13566位为CaMV35S终止子的核苷酸序列。sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体中四个靶点序列见表1,靶点分别为ALS-T4、CDC48-T3、AAT、ST1152代理靶点。

sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体的序列为将序列1中的前三个靶点序列依次分别替换为如下三个靶点序列:DEP1-T2、ACC、NRT1.1B-T4,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体的序列为将序列1中的前三个靶点序列依次分别替换为如下三个靶点序列:SPL14、WRKY45、DELLA,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

sgRNA-GT-1重组表达载体的序列为将序列1第12278-13324位替换为序列4所示的完整的潮霉素磷酸转移酶核苷酸序列,且保持其他序列不变后得到的序列。

sgRNA-GT-2重组表达载体的序列为将sgRNA-GT-1重组表达载体中的前三个靶点序列依次分别替换为如下三个靶点序列:DEP1-T2、ACC、NRT1.1B-T4,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

sgRNA-GT-3重组表达载体的序列为将sgRNA-GT-1重组表达载体的前三个靶点序列依次分别替换为如下三个靶点序列:SPL14、WRKY45、DELLA,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。

表1

二、水稻阳性抗性愈伤的获得

将步骤一获得的sgRNA-ATG-Hyg-ATG/sgRNA-GT-1载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-2载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-3载体、sgRNA-GT-1载体、sgRNA-GT-2和sgRNA-GT-3载体分别按照如下步骤1-8进行操作:

1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品,CAT#:AC1010),得到重组农杆菌。

2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌,28℃,150rpm震荡培养至OD600为1.0-2.0,室温条件下,10000rpm离心1min,用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖,葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD600为0.2,得到农杆菌侵染液。

3、水稻品种日本晴成熟种子去壳脱粒,置于100mL三角瓶中,加入70%(v/v)乙醇水溶液浸泡30sec,再置于25%(v/v)次氯酸钠水溶液中,120rpm震荡灭菌30min,无菌水冲洗3次,用滤纸吸干水分,然后将种子胚朝下置于N6固体培养基上,28℃暗培养4-6周,得到水稻愈伤。

4、完成步骤3后,将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体,乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl:50ml)中浸泡10min,然后,放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上,21℃暗培养1天。

5、取步骤4得到的水稻愈伤放入恢复培养基上,25-28℃暗培养3天。

6、取步骤5得到的水稻愈伤,置于筛选培养基上,28℃暗培养2周。

7、取步骤6得到的水稻愈伤,再次置于筛选培养基上,28℃暗培养2周,得到水稻抗性愈伤。

8、分别提取20-24块水稻抗性愈伤的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻抗性愈伤为水稻阳性抗性愈伤;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。

三、结果分析

1、每载体分别取步骤二所获得的20-24块水稻阳性抗性愈伤的基因组DNA作为模板(独立侵染两次,获得平均值和方差),对于ALS-T4靶点,采用引物对T1进行PCR扩增,得到PCR扩增产物;对于CDC48-T3靶点,采用引物对T2进行PCR扩增,得到PCR扩增产物;对于AAT靶点,采用引物对T3进行PCR扩增,得到PCR扩增产物;对于DEP1-T2靶点,采用引物对T4进行PCR扩增,得到PCR扩增产物;对于ACC靶点,采用引物对T5进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T4靶点,采用引物对T6进行PCR扩增,得到PCR扩增产物;对于SPL14靶点,采用引物对T7进行PCR扩增,得到PCR扩增产物;对于WRKY45靶点,采用引物对T8进行PCR扩增,得到PCR扩增产物;对于DELLA靶点,采用引物对T9进行PCR扩增,得到PCR扩增产物。

2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生A·G碱基替换的水稻阳性抗性愈伤数,,计算得出A·G碱基替换效率,结果见图4。

结果表明:通过使用细胞富集技术,在水稻抗性愈伤中,ALS-T4靶点的A·G碱基替换效率从34%增加到98%;CDC48-T3靶点的A·G碱基替换效率从36%增加到91%;AAT靶点的A·G碱基替换效率从23%增加到70%;NRT1.1B-T4靶点的A·G碱基替换效率从0%增加到16%;SPL14靶点的A·G碱基替换效率从20%增加到95%;WRKY45靶点的A·G碱基替换效率从93%增加到100%;DELLA靶点的A·G碱基替换效率从32%增加到100%。综上所述,通过使用细胞富集技术大部分靶点的A·G碱基替换效率提升至普通技术的2.5-3倍。

以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。

序列表

<110>北京市农林科学院

<120>以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞富集技术及其应用

<160>5

<170>PatentIn version 3.5

<210>1

<211>19972

<212>DNA

<213>人工序列(Artificial Sequence)

<400>1

ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60

ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120

ttaaggtacc tggaatcggc agcaaaggat tttttcctgt agttttccca caaccatttt 180

ttaccatccg aatgatagga taggaaaaat atccaagtga acagtattcc tataaaattc 240

ccgtaaaaag cctgcaatcc gaatgagccc tgaagtctga actagccggt cacctgtaca 300

ggctatcgag atgccataca agagacggta gtaggaacta ggaagacgat ggttgattcg 360

tcaggcgaaa tcgtcgtcct gcagtcgcat ctatgggcct ggacggaata ggggaaaaag 420

ttggccggat aggagggaaa ggcccaggtg cttacgtgcg aggtaggcct gggctctcag 480

cacttcgatt cgttggcacc ggggtaggat gcaatagaga gcaacgttta gtaccacctc 540

gcttagctag agcaaactgg actgccttat atgcgcgggt gctggcttgg ctgccgcctc 600

atgaacattc aggagcgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 660

atcaacttga aaaagtggca ccgagtcggt gctttttttt ttgcaagaac gaactaagcc 720

ggacaaaaaa aaaaggagca catatacaaa ccggttttat tcatgaatgg tcacgatgga 780

tgatggggct cagacttgag ctacgaggcc gcaggcgaga gaagcctagt gtgctctctg 840

cttgtttggg ccgtaacgga ggatacggcc gacgagcgtg tactaccgcg cgggatgccg 900

ctgggcgctg cgggggccgt tggatgggga tcggtgggtc gcgggagcgt tgaggggaga 960

caggtttagt accacctcgc ctaccgaaca atgaagaacc caccttataa ccccgcgcgc 1020

tgccgcttgt gttgtagcac ccatgacaat gacagtttta gagctagaaa tagcaagtta 1080

aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc tttttttttc 1140

tcattagcgg tatgcatgtt ggtagaagtc ggagatgtaa ataattttca ttatataaaa 1200

aaggtacttc gagaaaaata aatgcatacg aattaattct ttttatgttt tttaaaccaa 1260

gtatatagaa tttattgatg gttaaaattt caaaaatatg acgagagaaa ggttaaacgt 1320

acggcatata cttctgaaca gagagggaat atggggtttt tgttgctccc aacaattctt 1380

aagcacgtaa aggaaaaaag cacattatcc acattgtact tccagagata tgtacagcat 1440

tacgtaggta cgttttcttt ttcttcccgg agagatgata caataatcat gtaaacccag 1500

aatttaaaaa atattcttta ctataaaaat tttaattagg gaacgtatta ttttttacat 1560

gacacctttt gagaaagagg gacttgtaat atgggacaaa tgaacaattt ctaagaaatg 1620

ggcatatgac tctcagtaca atggaccaaa ttccctccag tcggcccagc aatacaaagg 1680

gaaagaaatg agggggccca caggccacgg cccacttttc tccgtggtgg ggagatccag 1740

ctagaggtcc ggcccacaag tggcccttgc cccgtgggac ggtgggattg cagagcgcgt 1800

gggcggaaac aacagtttag taccacctcg ctcacgcaac gacgcgacca cttgcttata 1860

agctgctgcg ctgaggctca gcaaggatcc cagccccgtg agttttagag ctagaaatag 1920

caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 1980

ttttttagga atctttaaac atacgaacag atcacttaaa gttcttctga agcaacttaa 2040

agttatcagg catgcatgga tcttggagga atcagatgtg cagtcaggga ccatagcaca 2100

agacaggcgt cttctactgg tgctaccagc aaatgctgga agccgggaac actgggtacg 2160

ttggaaacca cgtgtgatgt gaaggagtaa gataaactgt aggagaaaag catttcgtag 2220

tgggccatga agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg 2280

acgacaacaa agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt 2340

aaaagagttg tgcagatgat ccgtggcctc atagcactca atgcggtgtt ttagagctag 2400

aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 2460

tgcttttttt tttttaagct tacaaattcg ggtcaaggcg gaagccagcg cgccacccca 2520

cgtcagcaaa tacggaggcg cggggttgac ggcgtcaccc ggtcctaacg gcgaccaaca 2580

aaccagccag aagaaattac agtaaaaaaa aagtaaattg cactttgatc caccttttat 2640

tacctaagtc tcaatttgga tcacccttaa acctatcttt tcaatttggg ccgggttgtg 2700

gtttggacta ccatgaacaa cttttcgtca tgtctaactt ccctttcagc aaacatatga 2760

accatatata gaggagatcg gccgtatact agagctgatg tgtttaaggt cgttgattgc 2820

acgagaaaaa aaaatccaaa tcgcaacaat agcaaattta tctggttcaa agtgaaaaga 2880

tatgtttaaa ggtagtccaa agtaaaactt atagataata aaatgtggtc caaagcgtaa 2940

ttcactcaaa aaaaatcaac gagacgtgta ccaaacggag acaaacggca tcttctcgaa 3000

atttcccaac cgctcgctcg cccgcctcgt cttcccggaa accgcggtgg tttcagcgtg 3060

gcggattctc caagcagacg gagacgtcac ggcacgggac tcctcccacc acccaaccgc 3120

cataaatacc agccccctca tctcctctcc tcgcatcagc tccacccccg aaaaatttct 3180

ccccaatctc gcgaggctct cgtcgtcgaa tcgaatcctc tcgcgtcctc aaggtacgct 3240

gcttctcctc tcctcgcttc gtttcgattc gatttcggac gggtgaggtt gttttgttgc 3300

tagatccgat tggtggttag ggttgtcgat gtgattatcg tgagatgttt aggggttgta 3360

gatctgatgg ttgtgatttg ggcacggttg gttcgatagg tggaatcgtg gttaggtttt 3420

gggattggat gttggttctg atgattgggg ggaattttta cggttagatg aattgttgga 3480

tgattcgatt ggggaaatcg gtgtagatct gttggggaat tgtggaacta gtcatgcctg 3540

agtgattggt gcgatttgta gcgtgttcca tcttgtaggc cttgttgcga gcatgttcag 3600

atctactgtt ccgctcttga ttgagttatt ggtgccatgg gttggtgcaa acacaggctt 3660

taatatgtta tatctgtttt gtgtttgatg tagatctgta gggtagttct tcttagacat 3720

ggttcaatta tgtagcttgt gcgtttcgat ttgatttcat atgttcacag attagataat 3780

gatgaactct tttaattaat tgtcaatggt aaataggaag tcttgtcgct atatctgtca 3840

taatgatctc atgttactat ctgccagtaa tttatgctaa gaactatatt agaatatcat 3900

gttacaatct gtagtaatat catgttacaa tctgtagttc atctatataa tctattgtgg 3960

taatttcttt ttactatctg tgtgaagatt attgccacta gttcattcta cttatttctg 4020

aagttcagga tacgtgtgct gttactacct atctgaatac atgtgtgatg tgcctgttac 4080

tatctttttg aatacatgta tgttctgttg gaatatgttt gctgtttgat ccgttgttgt 4140

gtccttaatc ttgtgctagt tcttacccta tctgtttggt gattatttct tgcagtacgt 4200

aagcatgtcc gaggtggagt tctcccacga gtactggatg aggcacgcac tcaccctcgc 4260

aaagagggca tgggacgaga gggaggtgcc tgtgggagca gtgctcgtgc acaacaacag 4320

ggtgatcgga gagggatgga acaggcctat cggaaggcac gaccctaccg cacacgcaga 4380

gatcatggca ctcaggcagg gaggcctcgt gatgcagaac tacaggctca tcgacgccac 4440

cctctacgtg accctcgagc cttgcgtgat gtgcgcagga gccatgatcc actccaggat 4500

cggaagggtg gtgttcggag caagggacgc aaagaccgga gcagccggct ccctcatgga 4560

cgtgctccac cacccgggca tgaaccacag ggtggagatc accgagggaa tcctcgcaga 4620

cgagtgcgca gccctcctct ccgacttctt caggatgagg aggcaggaga tcaaggccca 4680

gaagaaggcc cagtcctcca ccgactccgg cggctcatca ggcggctcct ccggctccga 4740

gacaccgggc acctccgagt ccgccacccc ggagtcctcc ggcggctcct ccggcggctc 4800

ctccgaggtg gagttctccc acgagtactg gatgaggcac gcactcaccc tcgcaaagag 4860

ggcaagggac gagagggagg tgcctgtggg agcagtgctc gtgctcaaca acagggtgat 4920

cggagaggga tggaacaggg caatcggcct ccacgaccct accgcacacg cagagatcat 4980

ggcactcagg cagggaggcc tcgtgatgca gaactacagg ctcatcgacg ccaccctcta 5040

cgtgaccttc gagccttgcg tgatgtgcgc aggagccatg atccactcca ggatcggcag 5100

ggtggtgttc ggcgtgagga acgcaaagac cggagcagca ggctccctca tggacgtgct 5160

ccactacccg ggcatgaacc acagggtgga gatcaccgag ggaatcctcg cagacgagtg 5220

cgcagccctc ctctgctact tcttcaggat gccgaggcag gtgttcaacg cccagaagaa 5280

ggcccagtcc tccaccgact ccggcggctc atcaggcggc tcctccggct ccgagacacc 5340

gggcacctcc gagtccgcca ccccggagtc ctccggcggc tcctccggcg gctccgacaa 5400

gaagtactcc atcggcctcg ccatcggcac caacagcgtc ggctgggcgg tgatcaccga 5460

cgagtacaag gtcccgtcca agaagttcaa ggtcctgggc aacaccgacc gccactccat 5520

caagaagaac ctcatcggcg ccctcctctt cgactccggc gagacggcgg aggcgacccg 5580

cctcaagcgc accgcccgcc gccgctacac ccgccgcaag aaccgcatct gctacctcca 5640

ggagatcttc tccaacgaga tggcgaaggt cgacgactcc ttcttccacc gcctcgagga 5700

gtccttcctc gtggaggagg acaagaagca cgagcgccac cccatcttcg gcaacatcgt 5760

cgacgaggtc gcctaccacg agaagtaccc cactatctac caccttcgta agaagcttgt 5820

tgactctact gataaggctg atcttcgtct catctacctt gctctcgctc acatgatcaa 5880

gttccgtggt cacttcctta tcgagggtga ccttaaccct gataactccg acgtggacaa 5940

gctcttcatc cagctcgtcc agacctacaa ccagctcttc gaggagaacc ctatcaacgc 6000

ttccggtgtc gacgctaagg cgatcctttc cgctaggctc tccaagtcca ggcgtctcga 6060

gaacctcatc gcccagctcc ctggtgagaa gaagaacggt cttttcggta acctcatcgc 6120

tctctccctc ggtctgaccc ctaacttcaa gtccaacttc gacctcgctg aggacgctaa 6180

gcttcagctc tccaaggata cctacgacga tgatctcgac aacctcctcg ctcagattgg 6240

agatcagtac gctgatctct tccttgctgc taagaacctc tccgatgcta tcctcctttc 6300

ggatatcctt agggttaaca ctgagatcac taaggctcct ctttctgctt ccatgatcaa 6360

gcgctacgac gagcaccacc aggacctcac cctcctcaag gctcttgttc gtcagcagct 6420

ccccgagaag tacaaggaga tcttcttcga ccagtccaag aacggctacg ccggttacat 6480

tgacggtgga gctagccagg aggagttcta caagttcatc aagccaatcc ttgagaagat 6540

ggatggtact gaggagcttc tcgttaagct taaccgtgag gacctcctta ggaagcagag 6600

gactttcgat aacggctcta tccctcacca gatccacctt ggtgagcttc acgccatcct 6660

tcgtaggcag gaggacttct accctttcct caaggacaac cgtgagaaga tcgagaagat 6720

ccttactttc cgtattcctt actacgttgg tcctcttgct cgtggtaact cccgtttcgc 6780

ttggatgact aggaagtccg aggagactat caccccttgg aacttcgagg aggttgttga 6840

caagggtgct tccgcccagt ccttcatcga gcgcatgacc aacttcgaca agaacctccc 6900

caacgagaag gtcctcccca agcactccct cctctacgag tacttcacgg tctacaacga 6960

gctcaccaag gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tctccggcga 7020

gcagaagaag gctatcgttg acctcctctt caagaccaac cgcaaggtca ccgtcaagca 7080

gctcaaggag gactacttca agaagatcga gtgcttcgac tccgtcgaga tcagcggcgt 7140

tgaggaccgt ttcaacgctt ctctcggtac ctaccacgat ctcctcaaga tcatcaagga 7200

caaggacttc ctcgacaacg aggagaacga ggacatcctc gaggacatcg tcctcactct 7260

tactctcttc gaggataggg agatgatcga ggagaggctc aagacttacg ctcatctctt 7320

cgatgacaag gttatgaagc agctcaagcg tcgccgttac accggttggg gtaggctctc 7380

ccgcaagctc atcaacggta tcagggataa gcagagcggc aagactatcc tcgacttcct 7440

caagtctgat ggtttcgcta acaggaactt catgcagctc atccacgatg actctcttac 7500

cttcaaggag gatattcaga aggctcaggt gtccggtcag ggcgactctc tccacgagca 7560

cattgctaac cttgctggtt cccctgctat caagaagggc atccttcaga ctgttaaggt 7620

tgtcgatgag cttgtcaagg ttatgggtcg tcacaagcct gagaacatcg tcatcgagat 7680

ggctcgtgag aaccagacta cccagaaggg tcagaagaac tcgagggagc gcatgaagag 7740

gattgaggag ggtatcaagg agcttggttc tcagatcctt aaggagcacc ctgtcgagaa 7800

cacccagctc cagaacgaga agctctacct ctactacctc cagaacggta gggatatgta 7860

cgttgaccag gagctcgaca tcaacaggct ttctgactac gacgtcgacc acattgttcc 7920

tcagtctttc cttaaggatg actccatcga caacaaggtc ctcacgaggt ccgacaagaa 7980

caggggtaag tcggacaacg tcccttccga ggaggttgtc aagaagatga agaactactg 8040

gaggcagctt ctcaacgcta agctcattac ccagaggaag ttcgacaacc tcacgaaggc 8100

tgagaggggt ggcctttccg agcttgacaa ggctggtttc atcaagaggc agcttgttga 8160

gacgaggcag attaccaagc acgttgctca gatcctcgat tctaggatga acaccaagta 8220

cgacgagaac gacaagctca tccgcgaggt caaggtgatc accctcaagt ccaagctcgt 8280

ctccgacttc cgcaaggact tccagttcta caaggtccgc gagatcaaca actaccacca 8340

cgctcacgat gcttacctta acgctgtcgt tggtaccgct cttatcaaga agtaccctaa 8400

gcttgagtcc gagttcgtct acggtgacta caaggtctac gacgttcgta agatgatcgc 8460

caagtccgag caggagatcg gcaaggccac cgccaagtac ttcttctact ccaacatcat 8520

gaacttcttc aagaccgaga tcaccctcgc caacggcgag atccgcaagc gccctcttat 8580

cgagacgaac ggtgagactg gtgagatcgt ttgggacaag ggtcgcgact tcgctactgt 8640

tcgcaaggtc ctttctatgc ctcaggttaa catcgtcaag aagaccgagg tccagaccgg 8700

tggcttctcc aaggagtcta tccttccaaa gagaaactcg gacaagctca tcgctaggaa 8760

gaaggattgg gaccctaaga agtacggtgg tttcgactcc cctactgtcg cctactccgt 8820

cctcgtggtc gccaaggtgg agaagggtaa gtcgaagaag ctcaagtccg tcaaggagct 8880

cctcggcatc accatcatgg agcgctcctc cttcgagaag aacccgatcg acttcctcga 8940

ggccaagggc tacaaggagg tcaagaagga cctcatcatc aagctcccca agtactctct 9000

tttcgagctc gagaacggtc gtaagaggat gctggcttcc gctggtgagc tccagaaggg 9060

taacgagctt gctcttcctt ccaagtacgt gaacttcctc tacctcgcct cccactacga 9120

gaagctcaag ggttcccctg aggataacga gcagaagcag ctcttcgtgg agcagcacaa 9180

gcactacctc gacgagatca tcgagcagat ctccgagttc tccaagcgcg tcatcctcgc 9240

tgacgctaac ctcgacaagg tcctctccgc ctacaacaag caccgcgaca agcccatccg 9300

cgagcaggcc gagaacatca tccacctctt cacgctcacg aacctcggcg cccctgctgc 9360

tttcaagtac ttcgacacca ccatcgacag gaagcgttac acgtccacca aggaggttct 9420

cgacgctact ctcatccacc agtccatcac cggtctttac gagactcgta tcgacctttc 9480

ccagcttggt ggtgatgacg atgacaaaat ggcaccgaag aaaaaaagga aggtcggcgg 9540

ctccccgaag aaaaaaagga aggtcggcgg ctccccgaag aaaaaaagga aggtcggcgg 9600

ctccccgaag aaaaaaagga aggtcggaat ccatggcgtt ccatagacta gttcagccag 9660

tttggtggag ctgccgatgt gcctggtcgt cccgagcctc tgttcgtcaa gtatttgtgg 9720

tgctgatgtc tacttgtgtc tggtttaatg gaccatcgag tccgtatgat atgttagttt 9780

tatgaaacag tttcctgtgg gacagcagta tgctttatga ataagttgga tttgaaccta 9840

aatatgtgct caatttgctc atttgcatct cattcctgtt gatgttttat ctgagttgca 9900

agtttgaaaa tgctgcatat tcttattaaa tcgtcattta cttttatctt aatgagcttt 9960

gcaatggcct atgggatata aaagagatcg ttcaaacatt tggcaataaa gtttcttaag 10020

attgaatcct gttgccggtc ttgcgatgat tatcatataa tttctgttga attacgttaa 10080

gcatgtaata attaacatgt aatgcatgac gttatttatg agatgggttt ttatgattag 10140

agtcccgcaa ttatacattt aatacgcgat agaaaacaaa atatagcgcg caaactagga 10200

taaattatcg cgcgcggtgt catctatgtt actagatcgg cgcctgtccg ggcgcgcctg 10260

gtggatcgtc cgcctaggct gcagtgcagc gtgacccggt cgtgcccctc tctagagata 10320

atgagcattg catgtctaag ttataaaaaa ttaccacata ttttttttgt cacacttgtt 10380

tgaagtgcag tttatctatc tttatacata tatttaaact ttactctacg aataatataa 10440

tctatagtac tacaataata tcagtgtttt agagaatcat ataaatgaac agttagacat 10500

ggtctaaagg acaattgagt attttgacaa caggactcta cagttttatc tttttagtgt 10560

gcatgtgttc tccttttttt ttgcaaatag cttcacctat ataatacttc atccatttta 10620

ttagtacatc catttagggt ttagggttaa tggtttttat agactaattt ttttagtaca 10680

tctattttat tctattttag cctctaaatt aagaaaacta aaactctatt ttagtttttt 10740

tatttaataa tttagatata aaatagaata aaataaagtg actaaaaatt aaacaaatac 10800

cctttaagaa attaaaaaaa ctaaggaaac atttttcttg tttcgagtag ataatgccag 10860

cctgttaaac gccgtcgacg agtctaacgg acaccaacca gcgaaccagc agcgtcgcgt 10920

cgggccaagc gaagcagacg gcacggcatc tctgtcgctg cctctggacc cctctcgaga 10980

gttccgctcc accgttggac ttgctccgct gtcggcatcc agaaattgcg tggcggagcg 11040

gcagacgtga gccggcacgg caggcggcct cctcctcctc tcacggcacc ggcagctacg 11100

ggggattcct ttcccaccgc tccttcgctt tcccttcctc gcccgccgta ataaatagac 11160

accccctcca caccctcttt ccccaacctc gtgttgttcg gagcgcacac acacacaacc 11220

agatctcccc caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc 11280

cccccccccc tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag 11340

ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg 11400

ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt 11460

ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt 11520

ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt 11580

gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt 11640

ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt 11700

attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat 11760

ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat 11820

acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat 11880

tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga 11940

actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga 12000

tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg 12060

cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt 12120

ttataattat tttgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga 12180

tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg 12240

ctcaccctgt tgtttggtgt tacttctgca ggagctcctc atagcactca atgcggttgg 12300

caaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag 12360

cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt 12420

aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg 12480

ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg 12540

ggagtttagc gagagcctga cctattgcat ctcccgccgt tcacagggtg tcacgttgca 12600

agacctgcct gaaaccgaac tgcccgctgt tctacaaccg gtcgcggagg ctatggatgc 12660

gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat 12720

cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca 12780

ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct 12840

gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc 12900

caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat 12960

gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg 13020

tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccacg 13080

actccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg 13140

caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc 13200

cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg 13260

tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagaa 13320

atagagtaga tgccgaccgg gatctgtcga tcgacaagct cgagtttctc cataataatg 13380

tgtgagtagt tcccagataa gggaattagg gttcctatag ggtttcgctc atgtgttgag 13440

catataagaa acccttagta tgtatttgta tttgtaaaat acttctatca ataaaatttc 13500

taattcctaa aaccaaaatc cagtactaaa atccagatcc cccgaattaa ttcggcgtta 13560

attcagcctg caggacgcgt ttaattaagt gcacgcggcc gcctacttag tcaagagcct 13620

cgcacgcgac tgtcacgcgg ccaggatcgc ctcgtgagcc tcgcaatctg tacctagtgt 13680

ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 13740

attagaataa cggatattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg 13800

tgcatgccaa ccacagggtt cccctcggga tcaaagtact ttgatccaac ccctccgctg 13860

ctatagtgca gtcggcttct gacgttcagt gcagccgtct tctgaaaacg acatgtcgca 13920

caagtcctaa gttacgcgac aggctgccgc cctgcccttt tcctggcgtt ttcttgtcgc 13980

gtgttttagt cgcataaagt agaatacttg cgactagaac cggagacatt acgccatgaa 14040

caagagcgcc gccgctggcc tgctgggcta tgcccgcgtc agcaccgacg accaggactt 14100

gaccaaccaa cgggccgaac tgcacgcggc cggctgcacc aagctgtttt ccgagaagat 14160

caccggcacc aggcgcgacc gcccggagct ggccaggatg cttgaccacc tacgccctgg 14220

cgacgttgtg acagtgacca ggctagaccg cctggcccgc agcacccgcg acctactgga 14280

cattgccgag cgcatccagg aggccggcgc gggcctgcgt agcctggcag agccgtgggc 14340

cgacaccacc acgccggccg gccgcatggt gttgaccgtg ttcgccggca ttgccgagtt 14400

cgagcgttcc ctaatcatcg accgcacccg gagcgggcgc gaggccgcca aggcccgagg 14460

cgtgaagttt ggcccccgcc ctaccctcac cccggcacag atcgcgcacg cccgcgagct 14520

gatcgaccag gaaggccgca ccgtgaaaga ggcggctgca ctgcttggcg tgcatcgctc 14580

gaccctgtac cgcgcacttg agcgcagcga ggaagtgacg cccaccgagg ccaggcggcg 14640

cggtgccttc cgtgaggacg cattgaccga ggccgacgcc ctggcggccg ccgagaatga 14700

acgccaagag gaacaagcat gaaaccgcac caggacggcc aggacgaacc gtttttcatt 14760

accgaagaga tcgaggcgga gatgatcgcg gccgggtacg tgttcgagcc gcccgcgcac 14820

gtctcaaccg tgcggctgca tgaaatcctg gccggtttgt ctgatgccaa gctggcggcc 14880

tggccggcca gcttggccgc tgaagaaacc gagcgccgcc gtctaaaaag gtgatgtgta 14940

tttgagtaaa acagcttgcg tcatgcggtc gctgcgtata tgatgcgatg agtaaataaa 15000

caaatacgca aggggaacgc atgaaggtta tcgctgtact taaccagaaa ggcgggtcag 15060

gcaagacgac catcgcaacc catctagccc gcgccctgca actcgccggg gccgatgttc 15120

tgttagtcga ttccgatccc cagggcagtg cccgcgattg ggcggccgtg cgggaagatc 15180

aaccgctaac cgttgtcggc atcgaccgcc cgacgattga ccgcgacgtg aaggccatcg 15240

gccggcgcga cttcgtagtg atcgacggag cgccccaggc ggcggacttg gctgtgtccg 15300

cgatcaaggc agccgacttc gtgctgattc cggtgcagcc aagcccttac gacatatggg 15360

ccaccgccga cctggtggag ctggttaagc agcgcattga ggtcacggat ggaaggctac 15420

aagcggcctt tgtcgtgtcg cgggcgatca aaggcacgcg catcggcggt gaggttgccg 15480

aggcgctggc cgggtacgag ctgcccattc ttgagtcccg tatcacgcag cgcgtgagct 15540

acccaggcac tgccgccgcc ggcacaaccg ttcttgaatc agaacccgag ggcgacgctg 15600

cccgcgaggt ccaggcgctg gccgctgaaa ttaaatcaaa actcatttga gttaatgagg 15660

taaagagaaa atgagcaaaa gcacaaacac gctaagtgcc ggccgtccga gcgcacgcag 15720

cagcaaggct gcaacgttgg ccagcctggc agacacgcca gccatgaagc gggtcaactt 15780

tcagttgccg gcggaggatc acaccaagct gaagatgtac gcggtacgcc aaggcaagac 15840

cattaccgag ctgctatctg aatacatcgc gcagctacca gagtaaatga gcaaatgaat 15900

aaatgagtag atgaatttta gcggctaaag gaggcggcat ggaaaatcaa gaacaaccag 15960

gcaccgacgc cgtggaatgc cccatgtgtg gaggaacggg cggttggcca ggcgtaagcg 16020

gctgggttgt ctgccggccc tgcaatggca ctggaacccc caagcccgag gaatcggcgt 16080

gacggtcgca aaccatccgg cccggtacaa atcggcgcgg cgctgggtga tgacctggtg 16140

gagaagttga aggccgcgca ggccgcccag cggcaacgca tcgaggcaga agcacgcccc 16200

ggtgaatcgt ggcaagcggc cgctgatcga atccgcaaag aatcccggca accgccggca 16260

gccggtgcgc cgtcgattag gaagccgccc aagggcgacg agcaaccaga ttttttcgtt 16320

ccgatgctct atgacgtggg cacccgcgat agtcgcagca tcatggacgt ggccgttttc 16380

cgtctgtcga agcgtgaccg acgagctggc gaggtgatcc gctacgagct tccagacggg 16440

cacgtagagg tttccgcagg gccggccggc atggccagtg tgtgggatta cgacctggta 16500

ctgatggcgg tttcccatct aaccgaatcc atgaaccgat accgggaagg gaagggagac 16560

aagcccggcc gcgtgttccg tccacacgtt gcggacgtac tcaagttctg ccggcgagcc 16620

gatggcggaa agcagaaaga cgacctggta gaaacctgca ttcggttaaa caccacgcac 16680

gttgccatgc agcgtacgaa gaaggccaag aacggccgcc tggtgacggt atccgagggt 16740

gaagccttga ttagccgcta caagatcgta aagagcgaaa ccgggcggcc ggagtacatc 16800

gagatcgagc tagctgattg gatgtaccgc gagatcacag aaggcaagaa cccggacgtg 16860

ctgacggttc accccgatta ctttttgatc gatcccggca tcggccgttt tctctaccgc 16920

ctggcacgcc gcgccgcagg caaggcagaa gccagatggt tgttcaagac gatctacgaa 16980

cgcagtggca gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa gctgatcggg 17040

tcaaatgacc tgccggagta cgatttgaag gaggaggcgg ggcaggctgg cccgatccta 17100

gtcatgcgct accgcaacct gatcgagggc gaagcatccg ccggttccta atgtacggag 17160

cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct ctttcctgtg 17220

gatagcacgt acattgggaa cccaaagccg tacattggga accggaaccc gtacattggg 17280

aacccaaagc cgtacattgg gaaccggtca cacatgtaag tgactgatat aaaagagaaa 17340

aaaggcgatt tttccgccta aaactcttta aaacttatta aaactcttaa aacccgcctg 17400

gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc gcctaccctt 17460

cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc cgctggccgc 17520

tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc gcggacaagc cgcgccgtcg 17580

ccactcgacc gccggcgccc acatcaaggc accctgcctc gcgcgtttcg gtgatgacgg 17640

tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc 17700

cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc 17760

catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc ggcatcagag 17820

cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga 17880

aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 17940

cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 18000

ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 18060

aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 18120

cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 18180

cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 18240

gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 18300

tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 18360

cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 18420

ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 18480

gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 18540

gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 18600

accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 18660

ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 18720

tcacgttaag ggattttggt catgcattct aggtactaaa acaattcatc cagtaaaata 18780

taatatttta ttttctccca atcaggcttg atccccagta agtcaaaaaa tagctcgaca 18840

tactgttctt ccccgatatc ctccctgatc gaccggacgc agaaggcaat gtcataccac 18900

ttgtccgccc tgccgcttct cccaagatca ataaagccac ttactttgcc atctttcaca 18960

aagatgttgc tgtctcccag gtcgccgtgg gaaaagacaa gttcctcttc gggcttttcc 19020

gtctttaaaa aatcatacag ctcgcgcgga tctttaaatg gagtgtcttc ttcccagttt 19080

tcgcaatcca catcggccag atcgttattc agtaagtaat ccaattcggc taagcggctg 19140

tctaagctat tcgtataggg acaatccgat atgtcgatgg agtgaaagag cctgatgcac 19200

tccgcataca gctcgataat cttttcaggg ctttgttcat cttcatactc ttccgagcaa 19260

aggacgccat cggcctcact catgagcaga ttgctccagc catcatgccg ttcaaagtgc 19320

aggacctttg gaacaggcag ctttccttcc agccatagca tcatgtcctt ttcccgttcc 19380

acatcatagg tggtcccttt ataccggctg tccgtcattt ttaaatatag gttttcattt 19440

tctcccacca gcttatatac cttagcagga gacattcctt ccgtatcttt tacgcagcgg 19500

tatttttcga tcagtttttt caattccggt gatattctca ttttagccat ttattatttc 19560

cttcctcttt tctacagtat ttaaagatac cccaagaagc taattataac aagacgaact 19620

ccaattcact gttccttgca ttctaaaacc ttaaatacca gaaaacagct ttttcaaagt 19680

tgttttcaaa gttggcgtat aacatagtat cgacggagcc gattttgaaa ccgcggtgat 19740

cacaggcagc aacgctctgt catcgttaca atcaacatgc taccctccgc gagatcatcc 19800

gtgtttcaaa cccggcagct tagttgccgt tcttccgaat agcatcggta acatgagcaa 19860

agtctgccgc cttacaacgg ctctcccgct gacgccgtcc cggactgatg ggctgcctgt 19920

atcgagtggt gattttgtgc cgagctgccg gtcggggagc tgttggctgg ct 19972

<210>2

<211>167

<212>PRT

<213>人工序列(Artificial Sequence)

<400>2

Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu

1 5 10 15

Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala

20 25 30

Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro

35 40 45

Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg

50 55 60

Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu

65 70 75 80

Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His

85 90 95

Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly

100 105 110

Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His

115 120 125

Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu

130 135 140

Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys

145 150 155 160

Lys Ala Gln Ser Ser Thr Asp

165

<210>3

<211>1367

<212>PRT

<213>人工序列(Artificial Sequence)

<400>3

Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly

1 5 10 15

Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys

20 25 30

Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly

35 40 45

Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys

50 55 60

Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr

65 70 75 80

Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe

85 90 95

Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His

100 105 110

Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His

115 120 125

Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser

130 135 140

Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met

145 150 155 160

Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp

165 170 175

Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn

180 185 190

Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys

195 200 205

Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu

210 215 220

Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu

225 230 235 240

Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp

245 250 255

Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp

260 265 270

Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu

275 280 285

Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile

290 295 300

Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met

305 310 315 320

Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala

325 330 335

Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp

340 345 350

Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln

355 360 365

Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly

370 375 380

Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys

385 390 395 400

Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly

405 410 415

Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu

420 425 430

Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro

435 440 445

Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met

450 455 460

Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val

465 470 475 480

Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn

485 490 495

Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu

500 505 510

Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr

515 520 525

Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys

530 535 540

Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val

545 550 555 560

Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser

565 570 575

Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr

580 585 590

Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn

595 600 605

Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu

610 615 620

Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His

625 630 635 640

Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr

645 650 655

Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys

660 665 670

Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala

675 680 685

Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys

690 695 700

Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His

705 710 715 720

Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile

725 730 735

Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg

740 745 750

His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr

755 760 765

Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu

770 775 780

Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val

785 790 795 800

Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

805 810 815

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu

820 825 830

Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp

835 840 845

Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly

850 855 860

Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn

865 870 875 880

Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe

885 890 895

Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys

900 905 910

Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys

915 920 925

His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

930 935 940

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys

945 950 955 960

Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

965 970 975

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val

980 985 990

Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

995 1000 1005

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1010 1015 1020

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr

1025 1030 1035

Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn

1040 1045 1050

Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr

1055 1060 1065

Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg

1070 1075 1080

Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu

1085 1090 1095

Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg

1100 1105 1110

Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys

1115 1120 1125

Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu

1130 1135 1140

Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser

1145 1150 1155

Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe

1160 1165 1170

Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu

1175 1180 1185

Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe

1190 1195 1200

Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu

1205 1210 1215

Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn

1220 1225 1230

Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1235 1240 1245

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1250 1255 1260

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg

1265 1270 1275

Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr

1280 1285 1290

Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile

1295 1300 1305

Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe

1310 1315 1320

Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr

1325 1330 1335

Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly

1340 1345 1350

Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210>4

<211>1026

<212>DNA

<213>人工序列(Artificial Sequence)

<400>4

atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60

agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120

gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180

cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240

ggggagttta gcgagagcct gacctattgc atctcccgcc gttcacaggg tgtcacgttg 300

caagacctgc ctgaaaccga actgcccgct gttctacaac cggtcgcgga ggctatggat 360

gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420

atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480

cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540

ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600

tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660

atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720

tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgcca 780

cgactccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840

ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900

gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960

tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020

aaatag 1026

<210>5

<211>23

<212>DNA

<213>人工序列(Artificial Sequence)

<400>5

ctcatagcac tcaatgcggt tgg 23

33页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:鱼类诺卡氏菌病共同抗原DNA疫苗及其制备和应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!