以失活的筛选剂抗性基因为报告体系的a·g碱基替换的细胞富集技术及其应用
阅读说明:本技术 以失活的筛选剂抗性基因为报告体系的a·g碱基替换的细胞富集技术及其应用 ([db:专利名称-en]) 是由 杨永星 杨进孝 康桂婷 王飞鹏 宋金岭 于 2019-09-30 设计创作,主要内容包括:本发明公开了以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞富集技术及其应用。所述细胞富集技术载体包括如下试剂:靶向目标基因靶点序列的sgRNA、靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA、A·G碱基替换系统和功能丧失的筛选剂抗性基因;A·G碱基替换系统在靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换使功能丧失的筛选剂抗性基因功能恢复。本发明实现了细胞水平上A·G碱基替换细胞富集,大大提高A·G碱基替换效率。([db:摘要-en])
技术领域
本发明涉及生物技术领域,具体涉及以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞富集技术及其应用。
背景技术
CRISPR-Cas9技术已经成为强有力的基因组编辑手段,被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上,切割产生DNA双链断裂(dsDNA break,DSB),而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种,一种是非同源末端连接(non-homologous end joining,NHEJ),另一种是同源重组(homology-directed repair,HDR)。通常情况下NHEJ占大多数,因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换,因为HDR效率低以及需要DNA模板,所以使用HDR实现碱基精确替换的应用受到很大的限制。
2017年,David Liu实验室报道了一种新型的腺嘌呤碱基编辑器(adenine baseeditors,ABE)。通过七轮进化,研究者将来源于大肠杆菌的tRNA腺嘌呤脱氨酶(tRNAadenosine deaminase,ecTadA)融合在Cas9 nickase(Cas9n)的5’端,在细胞内能够直接实现对单个碱基A(Adenine,A)到G(Guanine,G)的替换,而不再通过产生DSB和启动HDR修复,大大提高了A替换为G的碱基编辑效率。具体过程为:当含有基因组靶向序列的sgRNA与ecTadA&ecTadA&Cas9n结合时,复合体定位到靶点,ecTadA催化非配对的单链DNA上的A发生腺嘌呤脱氨反应变成肌苷(Inosine,I),在DNA修复的过程中,I会被视为G,Cas9n会在切割配对的DNA链的磷酸二酯键,引入一个胞嘧啶C(Cytosine)与I配对。最终在接下来的修复过程中产生C-G配对,从而实现了A到G的转换。
目前,在植物中通过报告基因介导的细胞富集技术富集A·G碱基替换细胞的研究非常有限,目前尚无利用转化过程中使用筛选标记在细胞水平上实现A·G碱基替换细胞的富集,进而提高A·G碱基替换效率的报道。
发明内容
本发明的目的是提供一种以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞富集技术,该细胞富集技术能够在细胞水平上实现A·G碱基替换细胞的富集,进而提高目标靶点的A·G碱基替换效率。
为了实现上述目的,本发明首先提供了一种成套试剂,所述成套试剂包括sgRNA或与所述sgRNA相关的生物材料、A·G碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料;
所述sgRNA由靶向目标基因靶点序列的sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA组成;
所述sgRNA结构如下:所述靶点序列转录的RNA-sgRNA骨架;
所述A·G碱基替换系统包括Cas9核酸酶或与所述Cas9核酸酶相关的生物材料和腺嘌呤脱氨酶或与所述腺嘌呤脱氨酶相关的生物材料;
所述A·G碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换使所述功能丧失的筛选剂抗性基因功能恢复;
所述sgRNA骨架为S1)或S2)或S3):
S1)将序列1第617-692位中的T替换为U得到的RNA分子;
S2)将S1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
S3)与S1)或S2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子。
上述成套试剂中,靶向所述目标基因靶点序列的个数可为一个或两个或多个;靶向所述功能丧失的筛选剂抗性基因靶点序列的个数可为一个或两个或多个。所述靶点序列大小可为15-25bp,进一步可为18-22bp,更进一步可为20bp。
所述功能丧失的筛选剂抗性基因满足如下条件:所述功能丧失的筛选剂抗性基因功能或活性丧失,且通过对所述功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换后可使所述功能丧失的筛选剂抗性基因功能恢复。所述功能丧失的筛选剂抗性基因靶点序列可为功能丧失的筛选剂抗性基因序列上的靶点序列(位于功能丧失的筛选剂抗性基因序列内部),也可为额外添加在功能丧失的筛选剂抗性基因序列内部或5’端或3’端的靶点序列。当为了使功能丧失的筛选剂抗性基因在进行A·G碱基替换后可恢复功能而在其序列上额外添加了靶点靶序列(记作代理靶点靶序列)时,所述功能丧失的筛选剂抗性基因序列不仅包括功能丧失的筛选剂抗性基因本身,还包括代理靶点靶序列以及如果需要,为了保证添加代理靶点靶序列后筛选剂抗性基因能够在正常读码框内翻译再额外添加的一个或两个或多个碱基。
进一步的,所述功能丧失的筛选剂抗性基因可为将筛选剂抗性基因的起始密码子(如ATG)删除,且在筛选剂抗性基因5’端添加代理靶点靶序列后得到的序列。所述代理靶点靶序列满足如下条件即可:通过A·G碱基替换系统对所述代理靶点靶序列进行A·G碱基替换后可使所述功能丧失的筛选剂抗性基因功能恢复。代理靶点靶序列依次由功能丧失的筛选剂抗性基因靶点序列和PAM序列组成。需要注意的是,为了保证添加代理靶点靶序列后,去除起始密码子的筛选剂抗性基因能够在正常读码框内翻译,可在代理靶点靶序列和去除起始密码子的筛选剂抗性基因之间再添加一个或两个或多个碱基。
在本发明的一个具体实施例中,所述代理靶点靶序列为序列5。所述功能丧失的筛选剂抗性基因靶点序列为序列5第1-20位。所述A·G碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述代理靶点靶序列进行A·G碱基替换,使代理靶点靶序列第6位碱基A突变为碱基G,形成ATG,进而使筛选标记基因功能恢复。需要注意的是,为了保证添加代理靶点序列后,去除起始密码子的筛选剂抗性基因能够在正常读码框内翻译,此处在代理靶点靶序列和去除起始密码子的筛选剂抗性基因之间又添加了一个碱基C。
更进一步的,所述筛选剂抗性基因可为现有技术中常见的筛选剂抗性基因,如Bar/PAT草铵膦-N-乙酰转移酶基因、PMI 6-磷酸甘露糖异构酶基因、EPSPS 5-烯醇丙酮莽草酸-3-磷酸合成酶基因等。在本发明的一个具体实施例中,所述筛选剂抗性基因为潮霉素抗性基因。
上述成套试剂中,所述Cas9核酸酶包括不同来源的Cas9核酸酶或其变体、dead失活酶(dead Cas9,dCas9)或其变体、nickase切刻酶(Cas9 nickase,Cas9n)或其变体。所述不同来源的Cas9核酸酶或其变体包括来源于细菌的Cas9(如SaCas9、SaCas9-KKH等),Cas9-PAM变体(如xCas9、NG Cas9、Cas9-VQR、Cas9-VRER等),Cas9高保真酶变体(如HypaCas9、eSpCas9(1.1)、Cas9-HF1等)等。在本发明的一个具体实施例中,所述Cas9核酸酶为Cas9n,具体为SpCas9n蛋白质。在本发明的另一个具体实施例中,所述Cas9核酸酶为Cas9n,具体为HypaCas9n蛋白质。
所述腺嘌呤脱氨酶可为不同来源的腺嘌呤脱氨酶,如来源于大肠杆菌的ecTadA蛋白质、或来源于植物内源的腺嘌呤脱氨酶(如水稻内源OsTadA,拟南芥来源AtTadA等)。在本发明的一个具体实施例中,所述腺嘌呤脱氨酶为来源于大肠杆菌的ecTadA蛋白质。
进一步的,所述SpCas9n蛋白质为A1)或A2)或A3):
A1)氨基酸序列是序列3所示的蛋白质;
A2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质;
与所述SpCas9n相关的生物材料为B1)至B5)中的任一种:
B1)编码所述SpCas9n的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)含有B1)所述核酸分子的转基因细胞系、或含有B2)所述表达盒的转基因细胞系;
所述ecTadA蛋白质为E1)或E2)或E3):
E1)氨基酸序列是序列2所示的蛋白质;
E2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质;
与所述ecTadA蛋白质相关的生物材料为F1)至F5)中的任一种:
F1)编码所述ecTadA蛋白质的核酸分子;
F2)含有F1)所述核酸分子的表达盒;
F3)含有F1)所述核酸分子的重组载体、或含有F2)所述表达盒的重组载体;
F4)含有F1)所述核酸分子的重组微生物、或含有F2)所述表达盒的重组微生物、或含有F3)所述重组载体的重组微生物;
F5)含有F1)所述核酸分子的转基因细胞系、或含有F2)所述表达盒的转基因细胞系;
与所述功能丧失的筛选剂抗性基因相关的生物材料为K1)至K4)中的任一种:
K1)含有所述功能丧失的筛选剂抗性基因的表达盒;
K2)含有所述功能丧失的筛选剂抗性基因的重组载体、或含有K1)所述表达盒的重组载体;
K3)含有所述功能丧失的筛选剂抗性基因的重组微生物、或含有K1)所述表达盒的重组微生物、或含有K2)所述重组载体的重组微生物;
K4)含有所述功能丧失的筛选剂抗性基因的转基因细胞系、或含有K1)所述表达盒的转基因细胞系。
为了使A1)、E1)中的蛋白质便于纯化,可在由序列表中序列2或序列3所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。
表、标签的序列
标签
残基
序列
Poly-Arg
5-6(通常为5个)
RRRRR
Poly-His
2-10(通常为6个)
HHHHHH
FLAG
8
DYKDDDDK
Strep-tag II
8
WSHPQFEK
c-myc
10
EQKLISEEDL
上述A2)、E2)中的蛋白质,为与序列2或序列3所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。
上述A2)、E2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
上述A2)、E2)中的蛋白质的编码基因可通过将序列1的第4205-4705位(编码序列2所示的蛋白质)、序列1的第5396-9496位(编码序列3所示的蛋白质)所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。
更进一步的,B1)所述核酸分子为b1)或b2)或b3):
b1)序列表中序列1第5396-9496位所示的cDNA分子或DNA分子;
b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述SpCas9n的cDNA分子或DNA分子;
b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述SpCas9n的cDNA分子或DNA分子;
F1)所述核酸分子为f1)或f2)或f3):
f1)序列表中序列1第4205-4705位所示的cDNA分子或DNA分子;
f2)与f1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述ecTadA的cDNA分子或DNA分子;
f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述ecTadA的cDNA分子或DNA分子;
K1)所述功能丧失的筛选剂抗性基因为序列1第12278-13324位所示的DNA分子。
其中,所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如mRNA或hnRNA等。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码所述SpCas9n或所述ecTadA的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明的所述SpCas9n或所述ecTadA的核苷酸序列75%或者更高同一性的核苷酸,只要编码所述SpCas9n或所述ecTadA且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2或3所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。
B2)所述的含有编码SpCas9n蛋白质的核酸分子的表达盒(SpCas9n基因表达盒),是指能够在宿主细胞中表达SpCas9n蛋白质的DNA,该DNA不但可包括启动SpCas9n基因转录的启动子,还可包括终止SpCas9n基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述SpCas9n基因表达盒的重组载体。
F2)所述的含有编码ecTadA蛋白质的核酸分子的表达盒(ecTadA基因表达盒),是指能够在宿主细胞中表达ecTadA蛋白质的DNA,该DNA不但可包括启动ecTadA基因转录的启动子,还可包括终止ecTadA基因转录的终止子。进一步,所述表达盒还可包括增强子序列。更进一步,所述表达盒中可含有一个或两个编码ecTadA蛋白质的核酸分子。可用现有的表达载体构建含有所述ecTadA基因表达盒的重组载体。
所述载体可为质粒、黏粒、噬菌体或病毒载体。在本发明的具体实施例中,所述重组载体具体为sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体或sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体。
所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体的序列为序列1。所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体含有四个靶点序列,序列见表1。
所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体的序列为将序列1中的前三个靶点序列依次分别替换为如下三个靶点序列:DEP1-T2、ACC、NRT1.1B-T4,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体的序列为将序列1中的前三个靶点序列依次分别替换为如下三个靶点序列:SPL14、WRKY45、DELLA,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
所述微生物可为酵母、细菌、藻或真菌。其中,所述细菌可为农杆菌,如农杆菌EHA105。在本发明的具体实施例中,所述重组微生物具体为含有所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体或所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体或所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体的农杆菌EHA105。
所述转基因细胞系不包括繁殖材料。
上述成套试剂具有如下用途:
M1)富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞;
M2)制备富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞的产品;
M3)提高生物体或生物细胞基因组靶点序列的A·G碱基替换效率;
M4)制备提高生物体或生物细胞基因组靶点序列的A·G碱基替换效率的产品;
M5)生物体或生物细胞基因组靶点序列中的A·G碱基替换;
M6)制备生物体或生物细胞靶点序列中的A·G碱基替换的产品。
上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料也属于本发明的保护范围。
为了实现上述目的,本发明还提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料的新用途。
本发明提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料在M1)-M6)任一种中的应用:
M1)富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞;
M2)制备富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞的产品;
M3)提高生物体或生物细胞基因组靶点序列的A·G碱基替换效率;
M4)制备提高生物体或生物细胞基因组靶点序列的A·G碱基替换效率的产品;
M5)生物体或生物细胞基因组靶点序列中的A·G碱基替换;
M6)制备生物体或生物细胞靶点序列中的A·G碱基替换的产品。
为了实现上述目的,本发明还提供了N1)或N2)或N3)所述的方法:
N1)富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列A·G碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、腺嘌呤脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述sgRNA、所述腺嘌呤脱氨酶均得到表达;所述Cas9核酸酶和所述腺嘌呤脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生A·G碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生A·G碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的A·G碱基替换效率;
N2)富集生物体或生物细胞基因组靶点序列发生A·G碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列A·G碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、腺嘌呤脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶和所述腺嘌呤脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行A·G碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生A·G碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生A·G碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的A·G碱基替换效率;
N3)生物突变体的制备方法,包括如下步骤:按照N1)或N2)所述的方法对生物体的基因组进行编辑,获得生物突变体;所述生物突变体为发生A·G碱基替换的生物体。
上述方法中,所述N1)中,所述Cas9核酸酶的编码基因、所述转录靶向目标基因靶点序列的sgRNA的DNA分子、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子和所述腺嘌呤脱氨酶的编码基因通过含有所述Cas9核酸酶的编码基因的表达盒、所述转录靶向目标基因靶点序列的sgRNA的DNA分子的表达盒、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子的表达盒、所述腺嘌呤脱氨酶的编码基因的表达盒的重组载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内,也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。
在本发明的具体实施例中,上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内。该重组表达载体中腺嘌呤脱氨酶编码基因的表达盒含有两个腺嘌呤脱氨酶的编码基因。所述重组表达载体具体为上述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体或上述sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体或上述sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体。
上述成套试剂或应用或方法中,所述A·G碱基替换为碱基A突变为碱基G。所述碱基A可为位于所述靶点序列中任意位置的碱基A。
上述成套试剂或应用或方法中,所述生物体为P1)或P2)或P3)或P4):
P1)植物或动物;
P2)单子叶植物或双子叶植物;
P3)禾本科植物;
P4)水稻(如日本晴水稻);
所述生物细胞为Q1)或Q2)或Q3)或Q4):
Q1)植物细胞或动物细胞;
Q2)单子叶植物细胞或双子叶植物细胞;
Q3)禾本科植物细胞;
Q4)水稻细胞(如日本晴水稻细胞)。
本发明的细胞富集技术原理如下:以失活的筛选剂抗性基因为报告基因,建立一种A·G碱基替换的细胞富集技术,使得报告基因上发生了A·G碱基替换的细胞能够在含有筛选剂的培养基中生长出来,没有发生A·G碱基替换的细胞不能够在含有筛选剂的培养基中生长。在此报告基因的基础上,如果同时对内源目标基因靶点进行A·G碱基替换编辑,在含有筛选剂的培养基中生长出来的细胞有更大的概率发生内源目标基因靶点的A·G碱基替换,从而实现对内源目标基因靶点发生A·G碱基替换的细胞的富集,进而提高内源目标基因靶点的A·G碱基替换效率。
本发明具有以下优点:
1、有多种不同类型的基因可以作为报告基因,在植物中进行A·G碱基替换的细胞富集。由于各种作物的遗传转化方法(如农杆菌转化法、基因枪转化法)都有相对成熟、稳定的筛选体系,使用转化用筛选剂对应的抗性基因作为报告基因进行基因组内源突变细胞的富集,比其余的如荧光报告基因、内源除草剂抗性基因等,更具有广谱性、通用性。
2、技术设计简便,其中的代理靶点以及设计形式可以更广泛的应用到更多的筛选剂对应的抗性基因中,以满足不同作物的不同转化筛选体系的需求。
3、本发明的细胞富集技术对不同的脱氨酶介导的碱基编辑器或者是不同的Cas9酶介导的碱基编辑器均实现了细胞水平上A·G碱基替换细胞富集,大大提高A·G碱基替换效率。
附图说明
图1为细胞富集技术载体和非细胞富集技术载体的结构示意图。
图2为细胞富集技术富集A·G碱基替换的细胞的工作原理示意图。
图3为重组载体的结构示意图。
图4为细胞富集技术与非细胞富集技术在水稻抗性愈伤中对靶点的A·G碱基替换效率比较。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。
引物对T1由引物T1-F:5’-ctgtcttcggctggtctggg-3’和引物T1-R:5’-tgccaagcacatcaaacaagtaaa-3’组成,用于扩增靶点ALS-T4。
引物对T2由引物T2-F:5’-tctagactgtagtggtgataac-3’和引物T2-R:5’-tttcttctttctgattaatggcc-3’组成,用于扩增靶点CDC48-T3。
引物对T3由引物T3-F:5’-aatccaccaccaatccaatcc-3’和引物T3-R:5’-caccatggcgtcgtcgtccg-3’组成,用于扩增靶点AAT。
引物对T4由引物T4-F:5’-tcagcctgcagtactgaattatc-3’和引物T4-R:5’-gggcctaagtgtgacatacaag-3’组成,用于扩增靶点DEP1-T2。
引物对T5由引物T5-F:5’-gcattgctggacttcaacc-3’和引物T5-R:5’-caaaccgtatcgcaatctgag-3’组成,用于扩增靶点ACC。
引物对T6由引物T6-F:5’-agcatatatagcaagccaggttg-3’和引物T6-R:5’-aataagccactgtgttatgtacgc-3’组成,用于扩增靶点NRT1.1B-T4。
引物对T7由引物T7-F:5’-gatgtgttgtttgttgcgattc-3’和引物T7-R:5’-agtgggcatgatggctagg-3’组成,用于扩增靶点SPL14。
引物对T8由引物T8-F:5’-ctacagggtcacctacatcgg-3’和引物T8-R:5’-tgagacgacacatcaacaagg-3’组成,用于扩增靶点WRKY45。
引物对T9由引物T9-F:5’-gaagcgcgagtaccaagaag-3’和引物T9-R:5’-atccgcttggtgtccctc-3’组成,用于扩增靶点DELLA。
以下实施例中,A·G碱基替换是指靶点序列中任何位置的A突变为G。
A·G碱基替换效率=发生A·G碱基替换的阳性抗性愈伤数/分析的总阳性抗性愈伤数×100%。
日本晴水稻:参考文献:梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.;公众可以从北京市农林科学院获得。
恢复培养基:含有200mg/L特美汀的N6固体培养基。
筛选培养基:含有50mg/L潮霉素的N6固体培养基。
实施例1、EcTadA&ecTadA&Cas9n介导的A·G碱基替换的细胞富集技术的建立
一、EcTadA&ecTadA&Cas9n介导的A·G碱基替换的细胞富集技术载体的建立
将EcTadA&ecTadA&Cas9n(ABE)介导的A·G碱基替换的普通技术(非细胞富集技术)载体命名为sgRNA-GT。
将EcTadA&ecTadA&Cas9n(ABE)介导的A·G碱基替换的细胞富集技术载体命名为sgRNA-ATG-Hyg-ATG/sgRNA-GT。
sgRNA-GT和sgRNA-ATG-Hyg-ATG/sgRNA-GT载体的结构示意图均如图1所示。
细胞富集技术载体为在非细胞富集技术载体基础上对筛选剂抗性基因进行改造使其功能丧失,同时在sgRNA部分加入相应的代理靶点后得到的载体。
以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例:非细胞富集技术载体中的筛选剂抗性基因为完整的潮霉素抗性基因Hygromycin。细胞富集技术载体中的筛选剂抗性基因为功能丧失的潮霉素抗性基因Hygromycin(Hygromycin-ATG),功能丧失的潮霉素抗性基因Hygromycin为将完整的潮霉素抗性基因Hygromycin去掉ATG,且在5’端添加代理靶点序列(含有PAM)后得到的序列。其中,代理靶点序列如下:ctcatagcactcaatgcggtTGG(大写字母碱基为PAM序列)。
二、EcTadA&ecTadA&Cas9n介导的A·G碱基替换的细胞富集技术的工作原理
A·G碱基替换的细胞富集技术的工作原理如图2所示。以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例:在细胞富集技术中,由于潮霉素抗性基因Hygromycin去掉ATG后,抗性功能丧失,在潮霉素筛选培养基中,植物无法长出抗性愈伤,当细胞富集技术中的A·G碱基替换系统(EcTadA&ecTadA&Cas9n)在sgRNA向导下将代理靶点序列中的A6突变为G6(第6位碱基A突变为碱基G),形成ATG后,能够使潮霉素抗性基因Hygromycin正常表达,抗性功能恢复,进而使植物在潮霉素筛选培养基中长出抗性愈伤。由于长出抗性愈伤的细胞已经发生了A·G碱基替换,那么此细胞对应的内源基因发生A·G碱基替换的效率相对会更高,从而达到富集A·G碱基替换细胞的目的,实现提高植物内源靶点的A·G碱基替换效率。
实施例2、EcTadA&ecTadA&Cas9n介导的细胞富集技术载体的构建及其在水稻基因组编辑中的应用
一、重组表达载体的构建
本实施例中的重组表达载体分为如下两种:sgRNA-ATG-Hyg-ATG/sgRNA-GT重组表达载体、sgRNA-GT重组表达载体。两种重组表达载体示意图如图3所示。各载体均为环状质粒。
根据含有的靶序列不同,每种重组表达载体又各自分成三种,共有如下六种重组表达载体:sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体、sgRNA-GT-1重组表达载体、sgRNA-GT-2重组表达载体、sgRNA-GT-3重组表达载体。
人工合成上述六种重组表达载体,六种重组表达载体的具体结构描述分别如下:
sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体的序列为序列表中的序列1。序列1的第131-596位为OsU6a启动子的核苷酸序列,第702-1034位为OsU6b启动子的核苷酸序列,第1140-1881位为OsU6c启动子的核苷酸序列,第1987-2367位为OsU3启动子的核苷酸序列;第597-616位、第1035-1054位、第1882-1901位分别为ALS-T4、CDC48-T3、AAT三个靶点序列,第2368-2387位为报告基因代理靶点序列;第617-692位、第1055-1130位、第1902-1977位、第2388-2463位为sgRNA核苷酸序列。序列1的第2482-4195位为OsUbq3启动子的核苷酸序列,第4205-4705位、第4802-5299位为ecTadA的编码序列,均编码序列2所示的ecTadA蛋白质;序列1的第5396-9496位为SpCas9n蛋白质的编码序列,编码序列3所示的SpCas9n蛋白质;序列1的第9653-9985位为OsUbq3的3’UTR序列;序列1的第9986-10237位为Nos终止子的核苷酸序列。序列1的第10279-12271位为ZmUbi1启动子的核苷酸序列,第12278-12300位为代理靶点的靶序列,第12302-13324位为去掉起始密码子的潮霉素磷酸转移酶的核苷酸序列,第13351-13566位为CaMV35S终止子的核苷酸序列。sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体中四个靶点序列见表1,靶点分别为ALS-T4、CDC48-T3、AAT、ST1152代理靶点。
sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体的序列为将序列1中的前三个靶点序列依次分别替换为如下三个靶点序列:DEP1-T2、ACC、NRT1.1B-T4,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
sgRNA-ATG-Hyg-ATG/sgRNA-GT-3重组表达载体的序列为将序列1中的前三个靶点序列依次分别替换为如下三个靶点序列:SPL14、WRKY45、DELLA,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
sgRNA-GT-1重组表达载体的序列为将序列1第12278-13324位替换为序列4所示的完整的潮霉素磷酸转移酶核苷酸序列,且保持其他序列不变后得到的序列。
sgRNA-GT-2重组表达载体的序列为将sgRNA-GT-1重组表达载体中的前三个靶点序列依次分别替换为如下三个靶点序列:DEP1-T2、ACC、NRT1.1B-T4,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
sgRNA-GT-3重组表达载体的序列为将sgRNA-GT-1重组表达载体的前三个靶点序列依次分别替换为如下三个靶点序列:SPL14、WRKY45、DELLA,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。
表1
二、水稻阳性抗性愈伤的获得
将步骤一获得的sgRNA-ATG-Hyg-ATG/sgRNA-GT-1载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-2载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-3载体、sgRNA-GT-1载体、sgRNA-GT-2和sgRNA-GT-3载体分别按照如下步骤1-8进行操作:
1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品,CAT#:AC1010),得到重组农杆菌。
2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌,28℃,150rpm震荡培养至OD600为1.0-2.0,室温条件下,10000rpm离心1min,用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖,葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD600为0.2,得到农杆菌侵染液。
3、水稻品种日本晴成熟种子去壳脱粒,置于100mL三角瓶中,加入70%(v/v)乙醇水溶液浸泡30sec,再置于25%(v/v)次氯酸钠水溶液中,120rpm震荡灭菌30min,无菌水冲洗3次,用滤纸吸干水分,然后将种子胚朝下置于N6固体培养基上,28℃暗培养4-6周,得到水稻愈伤。
4、完成步骤3后,将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体,乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl:50ml)中浸泡10min,然后,放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上,21℃暗培养1天。
5、取步骤4得到的水稻愈伤放入恢复培养基上,25-28℃暗培养3天。
6、取步骤5得到的水稻愈伤,置于筛选培养基上,28℃暗培养2周。
7、取步骤6得到的水稻愈伤,再次置于筛选培养基上,28℃暗培养2周,得到水稻抗性愈伤。
8、分别提取20-24块水稻抗性愈伤的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻抗性愈伤为水稻阳性抗性愈伤;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。
三、结果分析
1、每载体分别取步骤二所获得的20-24块水稻阳性抗性愈伤的基因组DNA作为模板(独立侵染两次,获得平均值和方差),对于ALS-T4靶点,采用引物对T1进行PCR扩增,得到PCR扩增产物;对于CDC48-T3靶点,采用引物对T2进行PCR扩增,得到PCR扩增产物;对于AAT靶点,采用引物对T3进行PCR扩增,得到PCR扩增产物;对于DEP1-T2靶点,采用引物对T4进行PCR扩增,得到PCR扩增产物;对于ACC靶点,采用引物对T5进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T4靶点,采用引物对T6进行PCR扩增,得到PCR扩增产物;对于SPL14靶点,采用引物对T7进行PCR扩增,得到PCR扩增产物;对于WRKY45靶点,采用引物对T8进行PCR扩增,得到PCR扩增产物;对于DELLA靶点,采用引物对T9进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生A·G碱基替换的水稻阳性抗性愈伤数,,计算得出A·G碱基替换效率,结果见图4。
结果表明:通过使用细胞富集技术,在水稻抗性愈伤中,ALS-T4靶点的A·G碱基替换效率从34%增加到98%;CDC48-T3靶点的A·G碱基替换效率从36%增加到91%;AAT靶点的A·G碱基替换效率从23%增加到70%;NRT1.1B-T4靶点的A·G碱基替换效率从0%增加到16%;SPL14靶点的A·G碱基替换效率从20%增加到95%;WRKY45靶点的A·G碱基替换效率从93%增加到100%;DELLA靶点的A·G碱基替换效率从32%增加到100%。综上所述,通过使用细胞富集技术大部分靶点的A·G碱基替换效率提升至普通技术的2.5-3倍。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110>北京市农林科学院
<120>以失活的筛选剂抗性基因为报告体系的A·G碱基替换的细胞富集技术及其应用
<160>5
<170>PatentIn version 3.5
<210>1
<211>19972
<212>DNA
<213>人工序列(Artificial Sequence)
<400>1
ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60
ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120
ttaaggtacc tggaatcggc agcaaaggat tttttcctgt agttttccca caaccatttt 180
ttaccatccg aatgatagga taggaaaaat atccaagtga acagtattcc tataaaattc 240
ccgtaaaaag cctgcaatcc gaatgagccc tgaagtctga actagccggt cacctgtaca 300
ggctatcgag atgccataca agagacggta gtaggaacta ggaagacgat ggttgattcg 360
tcaggcgaaa tcgtcgtcct gcagtcgcat ctatgggcct ggacggaata ggggaaaaag 420
ttggccggat aggagggaaa ggcccaggtg cttacgtgcg aggtaggcct gggctctcag 480
cacttcgatt cgttggcacc ggggtaggat gcaatagaga gcaacgttta gtaccacctc 540
gcttagctag agcaaactgg actgccttat atgcgcgggt gctggcttgg ctgccgcctc 600
atgaacattc aggagcgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 660
atcaacttga aaaagtggca ccgagtcggt gctttttttt ttgcaagaac gaactaagcc 720
ggacaaaaaa aaaaggagca catatacaaa ccggttttat tcatgaatgg tcacgatgga 780
tgatggggct cagacttgag ctacgaggcc gcaggcgaga gaagcctagt gtgctctctg 840
cttgtttggg ccgtaacgga ggatacggcc gacgagcgtg tactaccgcg cgggatgccg 900
ctgggcgctg cgggggccgt tggatgggga tcggtgggtc gcgggagcgt tgaggggaga 960
caggtttagt accacctcgc ctaccgaaca atgaagaacc caccttataa ccccgcgcgc 1020
tgccgcttgt gttgtagcac ccatgacaat gacagtttta gagctagaaa tagcaagtta 1080
aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc tttttttttc 1140
tcattagcgg tatgcatgtt ggtagaagtc ggagatgtaa ataattttca ttatataaaa 1200
aaggtacttc gagaaaaata aatgcatacg aattaattct ttttatgttt tttaaaccaa 1260
gtatatagaa tttattgatg gttaaaattt caaaaatatg acgagagaaa ggttaaacgt 1320
acggcatata cttctgaaca gagagggaat atggggtttt tgttgctccc aacaattctt 1380
aagcacgtaa aggaaaaaag cacattatcc acattgtact tccagagata tgtacagcat 1440
tacgtaggta cgttttcttt ttcttcccgg agagatgata caataatcat gtaaacccag 1500
aatttaaaaa atattcttta ctataaaaat tttaattagg gaacgtatta ttttttacat 1560
gacacctttt gagaaagagg gacttgtaat atgggacaaa tgaacaattt ctaagaaatg 1620
ggcatatgac tctcagtaca atggaccaaa ttccctccag tcggcccagc aatacaaagg 1680
gaaagaaatg agggggccca caggccacgg cccacttttc tccgtggtgg ggagatccag 1740
ctagaggtcc ggcccacaag tggcccttgc cccgtgggac ggtgggattg cagagcgcgt 1800
gggcggaaac aacagtttag taccacctcg ctcacgcaac gacgcgacca cttgcttata 1860
agctgctgcg ctgaggctca gcaaggatcc cagccccgtg agttttagag ctagaaatag 1920
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 1980
ttttttagga atctttaaac atacgaacag atcacttaaa gttcttctga agcaacttaa 2040
agttatcagg catgcatgga tcttggagga atcagatgtg cagtcaggga ccatagcaca 2100
agacaggcgt cttctactgg tgctaccagc aaatgctgga agccgggaac actgggtacg 2160
ttggaaacca cgtgtgatgt gaaggagtaa gataaactgt aggagaaaag catttcgtag 2220
tgggccatga agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg 2280
acgacaacaa agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt 2340
aaaagagttg tgcagatgat ccgtggcctc atagcactca atgcggtgtt ttagagctag 2400
aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 2460
tgcttttttt tttttaagct tacaaattcg ggtcaaggcg gaagccagcg cgccacccca 2520
cgtcagcaaa tacggaggcg cggggttgac ggcgtcaccc ggtcctaacg gcgaccaaca 2580
aaccagccag aagaaattac agtaaaaaaa aagtaaattg cactttgatc caccttttat 2640
tacctaagtc tcaatttgga tcacccttaa acctatcttt tcaatttggg ccgggttgtg 2700
gtttggacta ccatgaacaa cttttcgtca tgtctaactt ccctttcagc aaacatatga 2760
accatatata gaggagatcg gccgtatact agagctgatg tgtttaaggt cgttgattgc 2820
acgagaaaaa aaaatccaaa tcgcaacaat agcaaattta tctggttcaa agtgaaaaga 2880
tatgtttaaa ggtagtccaa agtaaaactt atagataata aaatgtggtc caaagcgtaa 2940
ttcactcaaa aaaaatcaac gagacgtgta ccaaacggag acaaacggca tcttctcgaa 3000
atttcccaac cgctcgctcg cccgcctcgt cttcccggaa accgcggtgg tttcagcgtg 3060
gcggattctc caagcagacg gagacgtcac ggcacgggac tcctcccacc acccaaccgc 3120
cataaatacc agccccctca tctcctctcc tcgcatcagc tccacccccg aaaaatttct 3180
ccccaatctc gcgaggctct cgtcgtcgaa tcgaatcctc tcgcgtcctc aaggtacgct 3240
gcttctcctc tcctcgcttc gtttcgattc gatttcggac gggtgaggtt gttttgttgc 3300
tagatccgat tggtggttag ggttgtcgat gtgattatcg tgagatgttt aggggttgta 3360
gatctgatgg ttgtgatttg ggcacggttg gttcgatagg tggaatcgtg gttaggtttt 3420
gggattggat gttggttctg atgattgggg ggaattttta cggttagatg aattgttgga 3480
tgattcgatt ggggaaatcg gtgtagatct gttggggaat tgtggaacta gtcatgcctg 3540
agtgattggt gcgatttgta gcgtgttcca tcttgtaggc cttgttgcga gcatgttcag 3600
atctactgtt ccgctcttga ttgagttatt ggtgccatgg gttggtgcaa acacaggctt 3660
taatatgtta tatctgtttt gtgtttgatg tagatctgta gggtagttct tcttagacat 3720
ggttcaatta tgtagcttgt gcgtttcgat ttgatttcat atgttcacag attagataat 3780
gatgaactct tttaattaat tgtcaatggt aaataggaag tcttgtcgct atatctgtca 3840
taatgatctc atgttactat ctgccagtaa tttatgctaa gaactatatt agaatatcat 3900
gttacaatct gtagtaatat catgttacaa tctgtagttc atctatataa tctattgtgg 3960
taatttcttt ttactatctg tgtgaagatt attgccacta gttcattcta cttatttctg 4020
aagttcagga tacgtgtgct gttactacct atctgaatac atgtgtgatg tgcctgttac 4080
tatctttttg aatacatgta tgttctgttg gaatatgttt gctgtttgat ccgttgttgt 4140
gtccttaatc ttgtgctagt tcttacccta tctgtttggt gattatttct tgcagtacgt 4200
aagcatgtcc gaggtggagt tctcccacga gtactggatg aggcacgcac tcaccctcgc 4260
aaagagggca tgggacgaga gggaggtgcc tgtgggagca gtgctcgtgc acaacaacag 4320
ggtgatcgga gagggatgga acaggcctat cggaaggcac gaccctaccg cacacgcaga 4380
gatcatggca ctcaggcagg gaggcctcgt gatgcagaac tacaggctca tcgacgccac 4440
cctctacgtg accctcgagc cttgcgtgat gtgcgcagga gccatgatcc actccaggat 4500
cggaagggtg gtgttcggag caagggacgc aaagaccgga gcagccggct ccctcatgga 4560
cgtgctccac cacccgggca tgaaccacag ggtggagatc accgagggaa tcctcgcaga 4620
cgagtgcgca gccctcctct ccgacttctt caggatgagg aggcaggaga tcaaggccca 4680
gaagaaggcc cagtcctcca ccgactccgg cggctcatca ggcggctcct ccggctccga 4740
gacaccgggc acctccgagt ccgccacccc ggagtcctcc ggcggctcct ccggcggctc 4800
ctccgaggtg gagttctccc acgagtactg gatgaggcac gcactcaccc tcgcaaagag 4860
ggcaagggac gagagggagg tgcctgtggg agcagtgctc gtgctcaaca acagggtgat 4920
cggagaggga tggaacaggg caatcggcct ccacgaccct accgcacacg cagagatcat 4980
ggcactcagg cagggaggcc tcgtgatgca gaactacagg ctcatcgacg ccaccctcta 5040
cgtgaccttc gagccttgcg tgatgtgcgc aggagccatg atccactcca ggatcggcag 5100
ggtggtgttc ggcgtgagga acgcaaagac cggagcagca ggctccctca tggacgtgct 5160
ccactacccg ggcatgaacc acagggtgga gatcaccgag ggaatcctcg cagacgagtg 5220
cgcagccctc ctctgctact tcttcaggat gccgaggcag gtgttcaacg cccagaagaa 5280
ggcccagtcc tccaccgact ccggcggctc atcaggcggc tcctccggct ccgagacacc 5340
gggcacctcc gagtccgcca ccccggagtc ctccggcggc tcctccggcg gctccgacaa 5400
gaagtactcc atcggcctcg ccatcggcac caacagcgtc ggctgggcgg tgatcaccga 5460
cgagtacaag gtcccgtcca agaagttcaa ggtcctgggc aacaccgacc gccactccat 5520
caagaagaac ctcatcggcg ccctcctctt cgactccggc gagacggcgg aggcgacccg 5580
cctcaagcgc accgcccgcc gccgctacac ccgccgcaag aaccgcatct gctacctcca 5640
ggagatcttc tccaacgaga tggcgaaggt cgacgactcc ttcttccacc gcctcgagga 5700
gtccttcctc gtggaggagg acaagaagca cgagcgccac cccatcttcg gcaacatcgt 5760
cgacgaggtc gcctaccacg agaagtaccc cactatctac caccttcgta agaagcttgt 5820
tgactctact gataaggctg atcttcgtct catctacctt gctctcgctc acatgatcaa 5880
gttccgtggt cacttcctta tcgagggtga ccttaaccct gataactccg acgtggacaa 5940
gctcttcatc cagctcgtcc agacctacaa ccagctcttc gaggagaacc ctatcaacgc 6000
ttccggtgtc gacgctaagg cgatcctttc cgctaggctc tccaagtcca ggcgtctcga 6060
gaacctcatc gcccagctcc ctggtgagaa gaagaacggt cttttcggta acctcatcgc 6120
tctctccctc ggtctgaccc ctaacttcaa gtccaacttc gacctcgctg aggacgctaa 6180
gcttcagctc tccaaggata cctacgacga tgatctcgac aacctcctcg ctcagattgg 6240
agatcagtac gctgatctct tccttgctgc taagaacctc tccgatgcta tcctcctttc 6300
ggatatcctt agggttaaca ctgagatcac taaggctcct ctttctgctt ccatgatcaa 6360
gcgctacgac gagcaccacc aggacctcac cctcctcaag gctcttgttc gtcagcagct 6420
ccccgagaag tacaaggaga tcttcttcga ccagtccaag aacggctacg ccggttacat 6480
tgacggtgga gctagccagg aggagttcta caagttcatc aagccaatcc ttgagaagat 6540
ggatggtact gaggagcttc tcgttaagct taaccgtgag gacctcctta ggaagcagag 6600
gactttcgat aacggctcta tccctcacca gatccacctt ggtgagcttc acgccatcct 6660
tcgtaggcag gaggacttct accctttcct caaggacaac cgtgagaaga tcgagaagat 6720
ccttactttc cgtattcctt actacgttgg tcctcttgct cgtggtaact cccgtttcgc 6780
ttggatgact aggaagtccg aggagactat caccccttgg aacttcgagg aggttgttga 6840
caagggtgct tccgcccagt ccttcatcga gcgcatgacc aacttcgaca agaacctccc 6900
caacgagaag gtcctcccca agcactccct cctctacgag tacttcacgg tctacaacga 6960
gctcaccaag gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tctccggcga 7020
gcagaagaag gctatcgttg acctcctctt caagaccaac cgcaaggtca ccgtcaagca 7080
gctcaaggag gactacttca agaagatcga gtgcttcgac tccgtcgaga tcagcggcgt 7140
tgaggaccgt ttcaacgctt ctctcggtac ctaccacgat ctcctcaaga tcatcaagga 7200
caaggacttc ctcgacaacg aggagaacga ggacatcctc gaggacatcg tcctcactct 7260
tactctcttc gaggataggg agatgatcga ggagaggctc aagacttacg ctcatctctt 7320
cgatgacaag gttatgaagc agctcaagcg tcgccgttac accggttggg gtaggctctc 7380
ccgcaagctc atcaacggta tcagggataa gcagagcggc aagactatcc tcgacttcct 7440
caagtctgat ggtttcgcta acaggaactt catgcagctc atccacgatg actctcttac 7500
cttcaaggag gatattcaga aggctcaggt gtccggtcag ggcgactctc tccacgagca 7560
cattgctaac cttgctggtt cccctgctat caagaagggc atccttcaga ctgttaaggt 7620
tgtcgatgag cttgtcaagg ttatgggtcg tcacaagcct gagaacatcg tcatcgagat 7680
ggctcgtgag aaccagacta cccagaaggg tcagaagaac tcgagggagc gcatgaagag 7740
gattgaggag ggtatcaagg agcttggttc tcagatcctt aaggagcacc ctgtcgagaa 7800
cacccagctc cagaacgaga agctctacct ctactacctc cagaacggta gggatatgta 7860
cgttgaccag gagctcgaca tcaacaggct ttctgactac gacgtcgacc acattgttcc 7920
tcagtctttc cttaaggatg actccatcga caacaaggtc ctcacgaggt ccgacaagaa 7980
caggggtaag tcggacaacg tcccttccga ggaggttgtc aagaagatga agaactactg 8040
gaggcagctt ctcaacgcta agctcattac ccagaggaag ttcgacaacc tcacgaaggc 8100
tgagaggggt ggcctttccg agcttgacaa ggctggtttc atcaagaggc agcttgttga 8160
gacgaggcag attaccaagc acgttgctca gatcctcgat tctaggatga acaccaagta 8220
cgacgagaac gacaagctca tccgcgaggt caaggtgatc accctcaagt ccaagctcgt 8280
ctccgacttc cgcaaggact tccagttcta caaggtccgc gagatcaaca actaccacca 8340
cgctcacgat gcttacctta acgctgtcgt tggtaccgct cttatcaaga agtaccctaa 8400
gcttgagtcc gagttcgtct acggtgacta caaggtctac gacgttcgta agatgatcgc 8460
caagtccgag caggagatcg gcaaggccac cgccaagtac ttcttctact ccaacatcat 8520
gaacttcttc aagaccgaga tcaccctcgc caacggcgag atccgcaagc gccctcttat 8580
cgagacgaac ggtgagactg gtgagatcgt ttgggacaag ggtcgcgact tcgctactgt 8640
tcgcaaggtc ctttctatgc ctcaggttaa catcgtcaag aagaccgagg tccagaccgg 8700
tggcttctcc aaggagtcta tccttccaaa gagaaactcg gacaagctca tcgctaggaa 8760
gaaggattgg gaccctaaga agtacggtgg tttcgactcc cctactgtcg cctactccgt 8820
cctcgtggtc gccaaggtgg agaagggtaa gtcgaagaag ctcaagtccg tcaaggagct 8880
cctcggcatc accatcatgg agcgctcctc cttcgagaag aacccgatcg acttcctcga 8940
ggccaagggc tacaaggagg tcaagaagga cctcatcatc aagctcccca agtactctct 9000
tttcgagctc gagaacggtc gtaagaggat gctggcttcc gctggtgagc tccagaaggg 9060
taacgagctt gctcttcctt ccaagtacgt gaacttcctc tacctcgcct cccactacga 9120
gaagctcaag ggttcccctg aggataacga gcagaagcag ctcttcgtgg agcagcacaa 9180
gcactacctc gacgagatca tcgagcagat ctccgagttc tccaagcgcg tcatcctcgc 9240
tgacgctaac ctcgacaagg tcctctccgc ctacaacaag caccgcgaca agcccatccg 9300
cgagcaggcc gagaacatca tccacctctt cacgctcacg aacctcggcg cccctgctgc 9360
tttcaagtac ttcgacacca ccatcgacag gaagcgttac acgtccacca aggaggttct 9420
cgacgctact ctcatccacc agtccatcac cggtctttac gagactcgta tcgacctttc 9480
ccagcttggt ggtgatgacg atgacaaaat ggcaccgaag aaaaaaagga aggtcggcgg 9540
ctccccgaag aaaaaaagga aggtcggcgg ctccccgaag aaaaaaagga aggtcggcgg 9600
ctccccgaag aaaaaaagga aggtcggaat ccatggcgtt ccatagacta gttcagccag 9660
tttggtggag ctgccgatgt gcctggtcgt cccgagcctc tgttcgtcaa gtatttgtgg 9720
tgctgatgtc tacttgtgtc tggtttaatg gaccatcgag tccgtatgat atgttagttt 9780
tatgaaacag tttcctgtgg gacagcagta tgctttatga ataagttgga tttgaaccta 9840
aatatgtgct caatttgctc atttgcatct cattcctgtt gatgttttat ctgagttgca 9900
agtttgaaaa tgctgcatat tcttattaaa tcgtcattta cttttatctt aatgagcttt 9960
gcaatggcct atgggatata aaagagatcg ttcaaacatt tggcaataaa gtttcttaag 10020
attgaatcct gttgccggtc ttgcgatgat tatcatataa tttctgttga attacgttaa 10080
gcatgtaata attaacatgt aatgcatgac gttatttatg agatgggttt ttatgattag 10140
agtcccgcaa ttatacattt aatacgcgat agaaaacaaa atatagcgcg caaactagga 10200
taaattatcg cgcgcggtgt catctatgtt actagatcgg cgcctgtccg ggcgcgcctg 10260
gtggatcgtc cgcctaggct gcagtgcagc gtgacccggt cgtgcccctc tctagagata 10320
atgagcattg catgtctaag ttataaaaaa ttaccacata ttttttttgt cacacttgtt 10380
tgaagtgcag tttatctatc tttatacata tatttaaact ttactctacg aataatataa 10440
tctatagtac tacaataata tcagtgtttt agagaatcat ataaatgaac agttagacat 10500
ggtctaaagg acaattgagt attttgacaa caggactcta cagttttatc tttttagtgt 10560
gcatgtgttc tccttttttt ttgcaaatag cttcacctat ataatacttc atccatttta 10620
ttagtacatc catttagggt ttagggttaa tggtttttat agactaattt ttttagtaca 10680
tctattttat tctattttag cctctaaatt aagaaaacta aaactctatt ttagtttttt 10740
tatttaataa tttagatata aaatagaata aaataaagtg actaaaaatt aaacaaatac 10800
cctttaagaa attaaaaaaa ctaaggaaac atttttcttg tttcgagtag ataatgccag 10860
cctgttaaac gccgtcgacg agtctaacgg acaccaacca gcgaaccagc agcgtcgcgt 10920
cgggccaagc gaagcagacg gcacggcatc tctgtcgctg cctctggacc cctctcgaga 10980
gttccgctcc accgttggac ttgctccgct gtcggcatcc agaaattgcg tggcggagcg 11040
gcagacgtga gccggcacgg caggcggcct cctcctcctc tcacggcacc ggcagctacg 11100
ggggattcct ttcccaccgc tccttcgctt tcccttcctc gcccgccgta ataaatagac 11160
accccctcca caccctcttt ccccaacctc gtgttgttcg gagcgcacac acacacaacc 11220
agatctcccc caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc 11280
cccccccccc tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag 11340
ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg 11400
ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt 11460
ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt 11520
ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt 11580
gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt 11640
ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt 11700
attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat 11760
ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat 11820
acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat 11880
tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga 11940
actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga 12000
tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg 12060
cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt 12120
ttataattat tttgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga 12180
tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg 12240
ctcaccctgt tgtttggtgt tacttctgca ggagctcctc atagcactca atgcggttgg 12300
caaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag 12360
cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt 12420
aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg 12480
ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg 12540
ggagtttagc gagagcctga cctattgcat ctcccgccgt tcacagggtg tcacgttgca 12600
agacctgcct gaaaccgaac tgcccgctgt tctacaaccg gtcgcggagg ctatggatgc 12660
gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat 12720
cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca 12780
ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct 12840
gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc 12900
caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat 12960
gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg 13020
tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccacg 13080
actccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg 13140
caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc 13200
cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg 13260
tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagaa 13320
atagagtaga tgccgaccgg gatctgtcga tcgacaagct cgagtttctc cataataatg 13380
tgtgagtagt tcccagataa gggaattagg gttcctatag ggtttcgctc atgtgttgag 13440
catataagaa acccttagta tgtatttgta tttgtaaaat acttctatca ataaaatttc 13500
taattcctaa aaccaaaatc cagtactaaa atccagatcc cccgaattaa ttcggcgtta 13560
attcagcctg caggacgcgt ttaattaagt gcacgcggcc gcctacttag tcaagagcct 13620
cgcacgcgac tgtcacgcgg ccaggatcgc ctcgtgagcc tcgcaatctg tacctagtgt 13680
ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 13740
attagaataa cggatattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg 13800
tgcatgccaa ccacagggtt cccctcggga tcaaagtact ttgatccaac ccctccgctg 13860
ctatagtgca gtcggcttct gacgttcagt gcagccgtct tctgaaaacg acatgtcgca 13920
caagtcctaa gttacgcgac aggctgccgc cctgcccttt tcctggcgtt ttcttgtcgc 13980
gtgttttagt cgcataaagt agaatacttg cgactagaac cggagacatt acgccatgaa 14040
caagagcgcc gccgctggcc tgctgggcta tgcccgcgtc agcaccgacg accaggactt 14100
gaccaaccaa cgggccgaac tgcacgcggc cggctgcacc aagctgtttt ccgagaagat 14160
caccggcacc aggcgcgacc gcccggagct ggccaggatg cttgaccacc tacgccctgg 14220
cgacgttgtg acagtgacca ggctagaccg cctggcccgc agcacccgcg acctactgga 14280
cattgccgag cgcatccagg aggccggcgc gggcctgcgt agcctggcag agccgtgggc 14340
cgacaccacc acgccggccg gccgcatggt gttgaccgtg ttcgccggca ttgccgagtt 14400
cgagcgttcc ctaatcatcg accgcacccg gagcgggcgc gaggccgcca aggcccgagg 14460
cgtgaagttt ggcccccgcc ctaccctcac cccggcacag atcgcgcacg cccgcgagct 14520
gatcgaccag gaaggccgca ccgtgaaaga ggcggctgca ctgcttggcg tgcatcgctc 14580
gaccctgtac cgcgcacttg agcgcagcga ggaagtgacg cccaccgagg ccaggcggcg 14640
cggtgccttc cgtgaggacg cattgaccga ggccgacgcc ctggcggccg ccgagaatga 14700
acgccaagag gaacaagcat gaaaccgcac caggacggcc aggacgaacc gtttttcatt 14760
accgaagaga tcgaggcgga gatgatcgcg gccgggtacg tgttcgagcc gcccgcgcac 14820
gtctcaaccg tgcggctgca tgaaatcctg gccggtttgt ctgatgccaa gctggcggcc 14880
tggccggcca gcttggccgc tgaagaaacc gagcgccgcc gtctaaaaag gtgatgtgta 14940
tttgagtaaa acagcttgcg tcatgcggtc gctgcgtata tgatgcgatg agtaaataaa 15000
caaatacgca aggggaacgc atgaaggtta tcgctgtact taaccagaaa ggcgggtcag 15060
gcaagacgac catcgcaacc catctagccc gcgccctgca actcgccggg gccgatgttc 15120
tgttagtcga ttccgatccc cagggcagtg cccgcgattg ggcggccgtg cgggaagatc 15180
aaccgctaac cgttgtcggc atcgaccgcc cgacgattga ccgcgacgtg aaggccatcg 15240
gccggcgcga cttcgtagtg atcgacggag cgccccaggc ggcggacttg gctgtgtccg 15300
cgatcaaggc agccgacttc gtgctgattc cggtgcagcc aagcccttac gacatatggg 15360
ccaccgccga cctggtggag ctggttaagc agcgcattga ggtcacggat ggaaggctac 15420
aagcggcctt tgtcgtgtcg cgggcgatca aaggcacgcg catcggcggt gaggttgccg 15480
aggcgctggc cgggtacgag ctgcccattc ttgagtcccg tatcacgcag cgcgtgagct 15540
acccaggcac tgccgccgcc ggcacaaccg ttcttgaatc agaacccgag ggcgacgctg 15600
cccgcgaggt ccaggcgctg gccgctgaaa ttaaatcaaa actcatttga gttaatgagg 15660
taaagagaaa atgagcaaaa gcacaaacac gctaagtgcc ggccgtccga gcgcacgcag 15720
cagcaaggct gcaacgttgg ccagcctggc agacacgcca gccatgaagc gggtcaactt 15780
tcagttgccg gcggaggatc acaccaagct gaagatgtac gcggtacgcc aaggcaagac 15840
cattaccgag ctgctatctg aatacatcgc gcagctacca gagtaaatga gcaaatgaat 15900
aaatgagtag atgaatttta gcggctaaag gaggcggcat ggaaaatcaa gaacaaccag 15960
gcaccgacgc cgtggaatgc cccatgtgtg gaggaacggg cggttggcca ggcgtaagcg 16020
gctgggttgt ctgccggccc tgcaatggca ctggaacccc caagcccgag gaatcggcgt 16080
gacggtcgca aaccatccgg cccggtacaa atcggcgcgg cgctgggtga tgacctggtg 16140
gagaagttga aggccgcgca ggccgcccag cggcaacgca tcgaggcaga agcacgcccc 16200
ggtgaatcgt ggcaagcggc cgctgatcga atccgcaaag aatcccggca accgccggca 16260
gccggtgcgc cgtcgattag gaagccgccc aagggcgacg agcaaccaga ttttttcgtt 16320
ccgatgctct atgacgtggg cacccgcgat agtcgcagca tcatggacgt ggccgttttc 16380
cgtctgtcga agcgtgaccg acgagctggc gaggtgatcc gctacgagct tccagacggg 16440
cacgtagagg tttccgcagg gccggccggc atggccagtg tgtgggatta cgacctggta 16500
ctgatggcgg tttcccatct aaccgaatcc atgaaccgat accgggaagg gaagggagac 16560
aagcccggcc gcgtgttccg tccacacgtt gcggacgtac tcaagttctg ccggcgagcc 16620
gatggcggaa agcagaaaga cgacctggta gaaacctgca ttcggttaaa caccacgcac 16680
gttgccatgc agcgtacgaa gaaggccaag aacggccgcc tggtgacggt atccgagggt 16740
gaagccttga ttagccgcta caagatcgta aagagcgaaa ccgggcggcc ggagtacatc 16800
gagatcgagc tagctgattg gatgtaccgc gagatcacag aaggcaagaa cccggacgtg 16860
ctgacggttc accccgatta ctttttgatc gatcccggca tcggccgttt tctctaccgc 16920
ctggcacgcc gcgccgcagg caaggcagaa gccagatggt tgttcaagac gatctacgaa 16980
cgcagtggca gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa gctgatcggg 17040
tcaaatgacc tgccggagta cgatttgaag gaggaggcgg ggcaggctgg cccgatccta 17100
gtcatgcgct accgcaacct gatcgagggc gaagcatccg ccggttccta atgtacggag 17160
cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct ctttcctgtg 17220
gatagcacgt acattgggaa cccaaagccg tacattggga accggaaccc gtacattggg 17280
aacccaaagc cgtacattgg gaaccggtca cacatgtaag tgactgatat aaaagagaaa 17340
aaaggcgatt tttccgccta aaactcttta aaacttatta aaactcttaa aacccgcctg 17400
gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc gcctaccctt 17460
cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc cgctggccgc 17520
tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc gcggacaagc cgcgccgtcg 17580
ccactcgacc gccggcgccc acatcaaggc accctgcctc gcgcgtttcg gtgatgacgg 17640
tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc 17700
cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc 17760
catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc ggcatcagag 17820
cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga 17880
aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 17940
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 18000
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 18060
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 18120
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 18180
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 18240
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 18300
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 18360
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 18420
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 18480
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 18540
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 18600
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 18660
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 18720
tcacgttaag ggattttggt catgcattct aggtactaaa acaattcatc cagtaaaata 18780
taatatttta ttttctccca atcaggcttg atccccagta agtcaaaaaa tagctcgaca 18840
tactgttctt ccccgatatc ctccctgatc gaccggacgc agaaggcaat gtcataccac 18900
ttgtccgccc tgccgcttct cccaagatca ataaagccac ttactttgcc atctttcaca 18960
aagatgttgc tgtctcccag gtcgccgtgg gaaaagacaa gttcctcttc gggcttttcc 19020
gtctttaaaa aatcatacag ctcgcgcgga tctttaaatg gagtgtcttc ttcccagttt 19080
tcgcaatcca catcggccag atcgttattc agtaagtaat ccaattcggc taagcggctg 19140
tctaagctat tcgtataggg acaatccgat atgtcgatgg agtgaaagag cctgatgcac 19200
tccgcataca gctcgataat cttttcaggg ctttgttcat cttcatactc ttccgagcaa 19260
aggacgccat cggcctcact catgagcaga ttgctccagc catcatgccg ttcaaagtgc 19320
aggacctttg gaacaggcag ctttccttcc agccatagca tcatgtcctt ttcccgttcc 19380
acatcatagg tggtcccttt ataccggctg tccgtcattt ttaaatatag gttttcattt 19440
tctcccacca gcttatatac cttagcagga gacattcctt ccgtatcttt tacgcagcgg 19500
tatttttcga tcagtttttt caattccggt gatattctca ttttagccat ttattatttc 19560
cttcctcttt tctacagtat ttaaagatac cccaagaagc taattataac aagacgaact 19620
ccaattcact gttccttgca ttctaaaacc ttaaatacca gaaaacagct ttttcaaagt 19680
tgttttcaaa gttggcgtat aacatagtat cgacggagcc gattttgaaa ccgcggtgat 19740
cacaggcagc aacgctctgt catcgttaca atcaacatgc taccctccgc gagatcatcc 19800
gtgtttcaaa cccggcagct tagttgccgt tcttccgaat agcatcggta acatgagcaa 19860
agtctgccgc cttacaacgg ctctcccgct gacgccgtcc cggactgatg ggctgcctgt 19920
atcgagtggt gattttgtgc cgagctgccg gtcggggagc tgttggctgg ct 19972
<210>2
<211>167
<212>PRT
<213>人工序列(Artificial Sequence)
<400>2
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp
165
<210>3
<211>1367
<212>PRT
<213>人工序列(Artificial Sequence)
<400>3
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210>4
<211>1026
<212>DNA
<213>人工序列(Artificial Sequence)
<400>4
atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240
ggggagttta gcgagagcct gacctattgc atctcccgcc gttcacaggg tgtcacgttg 300
caagacctgc ctgaaaccga actgcccgct gttctacaac cggtcgcgga ggctatggat 360
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgcca 780
cgactccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020
aaatag 1026
<210>5
<211>23
<212>DNA
<213>人工序列(Artificial Sequence)
<400>5
ctcatagcac tcaatgcggt tgg 23
- 上一篇:一种医用注射器针头装配设备
- 下一篇:鱼类诺卡氏菌病共同抗原DNA疫苗及其制备和应用