一种真核生物CRISPR/Cas全基因组编辑载体文库及构建方法
阅读说明:本技术 一种真核生物CRISPR/Cas全基因组编辑载体文库及构建方法 (Eukaryotic organism CRISPR/Cas whole genome editing vector library and construction method ) 是由 马三垣 常珈菘 夏庆友 于 2020-05-07 设计创作,主要内容包括:本发明涉及一种真核生物CRISPR/Cas9全基因组编辑载体文库及构建方法,首先是构建一种piggyBac转座子系统介导的真核生物CRISPR/Cas9敲除骨架载体,然后综合运用搭桥PCR和酶切连接方法构建真核生物全基因组敲除突变体文库。本发明的特点是递送系统选用具有广泛生物适用性和超大外源基因承载能力的piggyBac转座子系统,构建方法选用搭桥PCR和酶切连接方法。构建的真核生物全基因组敲除载体文库效果好。(The invention relates to a eukaryotic organism CRISPR/Cas9 whole genome editing vector library and a construction method thereof, which comprises the steps of firstly constructing a piggyBac transposon system-mediated eukaryotic organism CRISPR/Cas9 knockout skeleton vector, and then comprehensively constructing a eukaryotic organism whole genome knockout mutant library by using a bypass PCR and enzyme digestion connection method. The invention is characterized in that the piggyBac transposon system with wide biological applicability and super-large exogenous gene bearing capacity is selected as the delivery system, and the bypass PCR and enzyme digestion connection method is selected as the construction method. The constructed eukaryotic whole genome knockout vector library has good effect.)
技术领域
本发明属于基因编辑技术领域,涉及一种真核生物CRISPR/Cas全基因组编辑载体文库及构建方法。
背景技术
随着测序技术的发展,越来越多的生物完成了全基因组测序,功能基因组研究日益成为生命科学研究的重要领域。面对海量的功能基因组数据,传统的研究手段耗时耗力,显得力不从心。如何高效快速的研究功能基因组,越来越成为生命科学家们关心的问题。基因编辑技术是近年来发展起来的一种遗传操作技术,CRISPR/Cas9是基因编辑技术中效率最高,最经济的技术。除了实现单个基因的编辑,CRISRP/Cas9还可以通过设计构建简单的sgRNA文库,很方便的执行全基因组编辑。CRISPR/Cas9全基因组编辑库能够很方便的执行功能基因组筛选,目前已经在人、小鼠等物种中实现了药物靶点基因筛选、抗病毒靶点基因筛选等,是研究功能基因组的重要手段。
发明内容
有鉴于此,本发明的目的在于提供一种真核生物CRISPA/Cas全基因组编辑载体文库及构建方法。
为达到上述目的,本发明提供如下技术方案:
1、一种真核生物CRISPA/Cas全基因组编辑载体文库的构建方法,具体步骤如下:
(1)构建piggyBac转座子系统介导的真核生物CRISPR/Cas9基因敲除载体骨架,命名为pB-CRISPRv2,其核苷酸序列如SEQ ID NO.1所示;
(2)构建一个有U6启动子核苷酸序列的载体,命名为T-U6,其核苷酸序列如SEQIDNO.2所示;
(3)构建一个有sgRNA scaffold核苷酸序列的载体,命名为T-sgRNA scaffold,其核苷酸序列如SEQ ID NO.3所示;
(4)设计全部真核生物蛋白编码基因的打靶位点,然后根据U6启动子的核苷酸序列和sgRNA scaffold的核苷酸序列,设计sgRNA的侧翼序列,合成包含侧翼区的全部sgRNA序列,命名为单链寡核苷酸库(The pool of sgRNA oligonucleotides);
(5)以载体T-U6为模板,扩增U6启动子片段,命名为DGP-1;以合成的The pool ofsgRNA oligonucleotides为模板,扩增sgRNA片段,命名为DGP-2;以载体T-sgRNA scaffold为模板,扩增sgRNA scaffold片段,命名为DGP-3;然后以DGP-1、DGP-2、DGP-3的混合物为模板,进行搭桥PCR实验,扩增出包含sgRNA库的U6-sgRNA文库片段,命名为DGP-4;
(6)分别将载体pB-CRISPRv2和片段DGP-4酶切后混合连接,建库,即得所述载体文库。
作为优选的技术方案之一,步骤(1)中,pB-CRISPRv2包含:piggyBac转座臂(包含piggyBac转座子末端反向重复序列,inverted terminal repeat,ITR)、筛选标记Zeocin抗性基因表达框、Cas9蛋白表达框、大肠杆菌致死基因ccDB表达框。
作为优选的技术方案之一,步骤(4)的具体方法是:根据spCas9作用规律,结合真核生物蛋白编码基因,设计全部真核生物蛋白编码基因的打靶位点,绝大多数蛋白的打靶位点为6个,其核苷酸具有如下规律:5’-NNNNNNNNNNNNNNNNNNNN-NGG-3’,所有打靶位点都在CDS序列的前半部分,靠近PAM区的种子序列部分12bp核苷酸不能在基因组上有重复区域;设计sgRNA的侧翼序列,具有以下规律:5’-TACAA AATAT CGTGC TCTAC AAGTG NNNNNNNNNN NNNNN NNNNN GTTTT AGAGC TAGAA ATAGC AAGTT-3’,其中“N”为sgRNA序列,用基因芯片的方式合成包含侧翼区的全部sgRNA序列,命名为The pool of sgRNAoligonucleotides,核苷酸序列如SEQ ID NO.4。
作为优选的技术方案之一,步骤(5)中,设计搭桥PCR引物,包括:
>KU-1R,5’-TCGATGATGATGATCAATTGTGGCGCGCCAAGCTGTCCAAGGAATGCGT-3’,SEQ IDNO.5;
>DG-1R,5’-TTGTAGAGCACGATATTTTGTATAT-3’,SEQ ID NO.6;
>DP-2F,5’-TCAATAGTTTAGTTTTTTTAGGTATATATACAAAATATCGTGCTCTACAA-3’,SEQID NO.7;
>DP-2R,5’-AAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAA-3’,SEQ IDNO.8;
>DG-3F,5’-TTAGAGCTAGAAATAGCAAGTTAAA-3’,SEQ ID NO.9;
>KU-1F,5’-ACCGATCGATCCTAGGCGCTAGCTAATGAAAGATCTTTATCGATTTAGC-3’,SEQ IDNO.10。
作为进一步优选的技术方案之一,DGP-1、DGP-2、DGP-3的合成方法如下:
以载体T-U6为模板,用引物KU-1R和DG-1R来扩增U6启动子片段,命名为DGP-1;以;The pool of sgRNA oligonucleotides为模板,用引物DP-2F和DP-2R来扩增sgRNA片段,命名为DGP-2;以载体T-sgRNA scaffold为模板,用引物DG-3F和KU-1F来扩增sgRNA scaffold片段,命名为DGP-3。
作为进一步优选的技术方案之一,以DGP-1、DGP-2、DGP-3的混合物为模板,用引物KU-1F和KU-1R来进行搭桥PCR实验,扩增出包含sgRNA库的U6-sgRNA文库片段,命名为DGP-4。
作为优选的技术方案之一,步骤(5)中,DGP-1、DGP-2、DGP-3按照摩尔比1:1:1混合。
作为优选的技术方案之一,步骤(6)中,载体pB-CRISPRv2和片段DGP-4均利用AscI/NheI双酶切。
作为进一步优选的技术方案之一,载体pB-CRISPRv2的酶切条件为50μL体系,包含:1μg载体,AscI和NheI各1μL,双蒸水补齐50μL;回收12187bp的骨架。
作为进一步优选的技术方案之一,片段DGP-4的酶切条件为50μL体系,包含:1μg片段,AscI和NheI各1μL,双蒸水补齐50μL。
作为优选的技术方案之一,步骤(6)中,酶切完成的载体pB-CRISPRv2和酶切完成的片段DGP-4以摩尔比1:10混合后用DNA连接酶连接,然后通过电转方式建库,抽提质粒,完成建库,建库覆盖度大于100×。
2、利用上述方法构建得到的一种真核生物CRISPA/Cas全基因组编辑载体文库。
本发明的有益效果在于:
本发明首先是构建一种piggyBac转座子系统介导的真核生物CRISPR/Cas9敲除骨架载体,然后综合运用搭桥PCR和酶切连接方法构建真核生物全基因组敲除突变体文库。本发明的特点是递送系统选用具有广泛生物适用性和超大外源基因承载能力的piggyBac转座子系统,构建方法选用搭桥PCR和酶切连接方法。在真核生物中,目前广泛运用慢病毒系统来递送CRISPR全基因组编辑文库,但慢病毒系统在哺乳动物以外的物种中效率较低,而且承载容量只有几kb,限制了其应用,而且,慢病毒系统在非哺乳动物细胞中效率很低。本发明公布的piggyBac转座子系统构建的真核生物全基因组敲除载体文库效果好。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为pB-CRISPRv2载体图谱,包含:piggyBacL/piggyBacR,piggyBac转座臂;IE2,IE2启动子;Zeocin,Zeocin抗性基因;Ser1PA,家蚕丝胶1(Ser1)基因polyA;ccDB,大肠杆菌致死基因ccDB;Hr3-hsp70;Hr3增强子和hsp70启动子;spCas9,spCas9蛋白;SV40PA,SV40polyA。
图2为应用搭桥PCR方法,构建包含全部sgRNA库的U6-sgRNA文库片段。
图3为载体文库质量分析图,载体文库中8%的载体reads数在1-5条,4%的载体reads数在5-10条,72%的载体reads数在10-200条,12%的载体reads数在200-500条,3%的载体reads数大于500条。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
以下凡是未注明的具体实验方法,都按照公认的实验方法与条件实施,例如,按照试剂耗材厂商提供的说明书操作,或者按照经典实验书籍《分子克隆实验指南》(第三版,J.萨姆布鲁克等著)来完成实验。
实施例:
本实施例中所用到的家蚕胚胎细胞系(The Bombyx mori embryonic cell line,BmE)为生物实验中常用细胞系(PMID:17570024)。
piggyBac转座子系统介导的家蚕CRISPR/Cas9全基因组标记载体文库的构建
1、以piggyBac转座子系统基础载体piggyBacModify(其核苷酸序列如SEQ IDNO.11)为初始载体,构建一个piggyBac转座子系统介导的家蚕CRISPR/Cas9基因敲除载体骨架,主要包含piggyBac转座臂(包含两个piggyBac转座子末端反向重复序列,invertedterminal repeat,ITR)、筛选标记Zeocin抗性基因表达框、Cas9蛋白表达框、大肠杆菌致死基因ccDB表达框,命名为pB-CRISPRv2,其核苷酸序列如SEQ ID NO.1所示,载体图谱如图1所示。
2、构建两个载体用于后续建库实验。一个是含有U6启动子核苷酸序列的载体,命名为T-U6,其核苷酸序列如SEQ ID NO.2所示。其构建方法具体是设计一对引物:
U6-F,5’-AGCTGTCCAAGGAATGCGT-3’,如SEQ ID NO.12所示;
U6-R,5’-ATATACAAAATATCGTGCTCTACAAGT-3’,如SEQ ID NO.13所示;
以pB-CRISPR为模板扩增U6启动子序列,然后连接到T载体上,sanger测序验证正确性。第二个载体是含有sgRNA scaffold核苷酸序列的载体,命名为T-sgRNA scaffold,其核苷酸序列如SEQ ID NO.3所示。具体构建方法是设计一对引物:
sgRNA-scaffold-F,5’-GTTTTAGAGCTAGAAATAGCAAGTTAAA-3’,如SEQ ID NO.14所示;
sgRNA-scaffold-R,5’-GCTAAATCGATAAAGATCTTTCATT-3’,如SEQ ID NO.15所示;
以pB-CRISPR为模板扩增sgRNA scaffold序列,然后连接到T载体上,sanger测序验证正确性。PCR扩增酶是高保真热启动酶,反应总体系50μL,包括引物各1μL,模板1μL,2×酶预混液25μL,水22μL,反应条件如下:98℃预变性4min;98℃变性10s,55℃退火5s,72℃延伸5s;35个循环;72℃延伸10min;12℃保存。T克隆方法和sanger测序按照普遍公认的实验方案执行。
3、根据SpCas9作用规律,设计家蚕全部蛋白编码基因打靶位点,每个基因尽量设计6个打靶位点,打靶位点的核苷酸具有如下特征5’-NNNNNNNNNNNNNNNNNNNN-NGG-3’,所有打靶位点都在CDS序列的前半部分,靠近PAM区的种子序列部分12bp核苷酸不能在基因组上有重复区域,总共设计了94000个打靶位点。然后根据U6启动子的核苷酸序列和sgRNAscaffold的核苷酸序列,设计sgRNA的侧翼序列,其特征如下:5′-TACAA AATATCGTGC TCTACAAGTG NNNNN NNNNN NNNNN NNNNN GTTTT AGAGC TAGAA ATAGCAAGTT-3′,其中“N”为sgRNA序列,用基因芯片的方式合成全部sgRNA序列(包含侧翼区),命名为The pool of sgRNAoligonucleotides。
4、根据骨架载体pB-CRISPRv2载体序列、T-U6载体序列、T-sgRNA scaffold载体序列和The pool of sgRNA oligonucleotides序列,设计用于做搭桥PCR的引物,引物序列如下:>KU-1R,5’-TCGATGATGATGATCAATTGTGGCGCGCCAAGCTGTCCAAGGAATGCGT-3’,SEQ IDNO.5;
>DG-1R,5’-TTGTAGAGCACGATATTTTGTATAT-3’,SEQ ID NO.6;
>DP-2F,5’-TCAATAGTTTAGTTTTTTTAGGTATATATACAAAATATCGTGCTCTACAA-3’,SEQID NO.7;
>DP-2R,5’-AAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAA-3’,SEQ IDNO.8;
>DG-3F,5’-TTAGAGCTAGAAATAGCAAGTTAAA-3’,SEQ ID NO.9;
>KU-1F,5’-ACCGATCGATCCTAGGCGCTAGCTAATGAAAGATCTTTATCGATTTAGC-3’,SEQ IDNO.10。
5、应用搭桥PCR方法,构建包含全部sgRNA库的U6-sgRNA文库片段。如图2所示。
1)以载体T-U6为模板,用引物KU-1R和DG-1R来扩增U6启动子片段,命名为DGP-1。PCR扩增酶是高保真热启动酶,反应总体系50μL,包括引物各1μL,模板1μL,2×酶预混液25μL,水22μL,反应条件如下:98℃预变性4min;98℃变性10s,55℃退火5s,72℃延伸5s;35个循环;72℃延伸10min;12℃保存,总共扩增30管。
2)以合成的单链寡核苷酸文库(The pool of sgRNA oligonucleotides)为模板用引物DP-2F和DP-2R来扩增sgRNA片段,命名为DGP-2。PCR扩增酶是高保真热启动酶,反应总体系50μL,包括引物各1μL,模板1μL,2×酶预混液25μL,水22μL,反应条件如下:98℃预变性4min;98℃变性10s,55℃退火5s,72℃延伸5s;35个循环;72℃延伸10min;12℃保存,总共扩增30管。
3)以载体T-sgRNA scaffold为模板,用引物DG-3F和KU-1F来扩增sgRNA scaffold片段,命名为DGP-3。PCR扩增酶是高保真热启动酶,反应总体系50μL,包括引物各1μL,模板1μL,2×酶预混液25μL,水22μL,反应条件如下:98℃预变性4min;98℃变性10s,55℃退火5s,72℃延伸5s;35个循环;72℃延伸10min;12℃保存,总共扩增30管。
4)以PCR片段DGP-1/DGP-2/DGP-3混合物为模板,用引物KU-1F和KU-1R来来进行搭桥PCR实验,扩增出包含sgRNA库的U6-sgRNA文库片段,命名为DGP-4。其中,DGP-1/DGP-2/DGP-3按照摩尔比1:1:1混合。PCR扩增酶是高保真热启动酶,反应总体系50μL,包括引物各1μL,模板1μL,2×酶预混液25μL,水22μL,反应条件如下:98℃预变性4min;98℃变性10s,55℃退火5s,72℃延伸5s;35个循环;72℃延伸10min;12℃保存,总共扩增50管。
6、将载体pB-CRISPRv2用AscI/NheI双酶切,回收12187bp的骨架用于下一步建库实验。其中,酶切条件为50μL体系,包含1μg载体,5μL的CutSmart缓冲液,AscI和NheI各1μL,酶切条件为37℃过夜。将片段DGP-4用AscI/NheI双酶切,其中,酶切条件为50μL体系,包含1μg的DGP-4片段,AscI和NheI各1μL,酶切条件为37℃过夜。
7、将步骤6描述的酶切完成的载体骨架和酶切完成的DGP-4片段按照摩尔比1:10混合后用DNA连接酶连接,然后要过柱方式纯化浓缩,用双蒸水溶解,溶解体积为30μL;然后通过电转方式建库,抽提质粒,完成建库,建库覆盖度大于100×。DNA连接酶为T4 DNA连接酶,连接总体系为50μL,其中骨架和片段按照摩尔比1:10添加,总质量为2μg,T4连接酶2.5μL,连接条件是16℃过夜连接。电转感受态为E.coli HST08 Premium Electro-Cells,电转仪器为Gene Pulser Xcell,电转50管。具体电转操作步骤如下:
1)电转感受态:E.coli HST08 Premium Electro-Cells(50μL)使用前在冰上融化。
2)在融化的细胞中加入1~2μL DNA溶液*1。
3)将Electro-Cell及DNA混合液注入到冰中预冷的0.1cm电转杯内(Cuvette)。
4)电压冲击*2后,迅速置于冰中冷却,加入1ml SOC培养基(冰浴中预冷)。
5)37℃振荡培养1小时(160~225rpm)。
6)取适量涂布选择培养基*3。
7)37℃过夜培养。
*1:当DNA溶液中有盐存在时,用TE buffer或灭菌水稀释,也可用乙醇沉淀方法脱盐(建议<10ng)。
*2:Takara Bio使用BIO-RAD MicroPulser,电压为1.5kV。当使用BIO-RADGenePulser时,标准设置为200Ω,25μF,1.5kV。
*3:直径为9cm的平板涂布量不超过100μL。如有必要,使用SOC培养基稀释菌液后涂布。
用梯度稀释的方法统计电转后单克隆的数量,保证单克隆数量能够满足建库最低要求,即单克隆数量>100×。
8、质粒抽提采用试剂盒抽提的方法,将抽提好的质粒全部混匀后取部分用设计好的引物扩增下来载体文库的sgRNA片段,建库后执行高通量测序,分析sgRNA丰度,检测文库质量。测序引物核苷酸序列如下:
正向引物>gD-F,5-NNNNNNNNNNNNTAAATCACGCTTTCAATA,N表示碱基A、T、G或C,如SEQ ID NO.16所示;
反向引物>gD-R,5-NNNNNNNNNNNNCGACTCGGTGCCACTTT,N表示碱基A、T、G或C,如SEQID NO.17所示。
载体文库质量分析如图3所示。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
序列表
<110> 西南大学
<120> 一种真核生物CRISPR/Cas全基因组编辑载体文库及构建方法
<130> 2020
<160> 17
<170> SIPOSequenceListing 1.0
<210> 1
<211> 12690
<212> DNA
<213> Artificial
<400> 1
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ggagatcggt acttcgcgaa 420
tgcgtcgaga taagagggtt aaaaaatata ttttacgcac catatacgca tcgggttgat 480
atcgttaata tggatcaatt tgaacagttg attaacgtgt ctctgctcaa gtctttgatc 540
aaaacgcaaa tcgacgaaaa tgtgtcggac aatatcaagt cgatgagcga aaaactaaaa 600
aggctagaat acgacaatct cacagacagc gttgagatat acggtattca cgacagcagg 660
ctgaataata aaaaaattag aaactattat ttaaccctag aaagataatc atattgtgac 720
gtacgttaaa gataatcatg cgtaaaattg acgcatgtgt tttatcggtc tgtatatcga 780
ggtttattta ttaatttgaa tagatattaa gttttattat atttacactt acatactaat 840
aataaattca acaaacaatt tatttatgtt tatttattta ttaaaaaaaa acaaaaactc 900
aaaatttctt ctataaagta acaaaacttt taaacattct ctcttttaca aaaataaact 960
tattttgtac tttaaaaaca gtcatgttgt attataaaat aagtaattag cttaacttat 1020
acataataga aacaaattat acttattagt cagtcagaaa caactttggc acatatcaat 1080
attatgctct cgacaaataa cttttttgca ttttttgcac gatgcatttg cctttcgcct 1140
tattttagag gggcagtaag tacagtaagt acgttttttc attactggct cttcagtact 1200
gtcatctgat gtaccaggca cttcatttgg caaaatatta gagatattat cgcgcaaata 1260
tctcttcaaa gtaggagctt ctaaacgctt acgcataaac gatgacgtca ggctcatgta 1320
aaggtttctc ataaattttt tgcgactttg aaccttttct cccttgctac tgacattatg 1380
gctgtatata ataaaagaat ttatgcaggc aatgtttatc attccgtaca ataatgccat 1440
aggccaccta ttcgtcctcc tactgcaggt catcacagaa cacatttggt ctagcgtgtc 1500
cactccgcct ttagtttgat tataatacat aaccatttgc ggtttaccgg tactttcgtt 1560
gatagaagca tcctcatcac aagatgataa taagtatacc atcttagctg gcttcggttt 1620
atatgagacg agagtaaggg gtccgtcaaa acaaaacatc gatgttccca ctggcctgga 1680
gcgactgttt ttcagtactt ccggtatctc gcgtttgttc ctgcaggatc atgatgataa 1740
acaatgtatg gtgctaatgt tgcttcaaca acaattctgt tgaactgtgt tttcatgttt 1800
gccaacaagc acctttatac tcggtggcct ccccaccacc aacttttttg cactgcaaaa 1860
aaacacgctt ttgcacgcgg gcccatacat agtacaaact ctacgtttcg tagactattt 1920
tacataaata gtctacaccg ttgtatacgc tccaaataca ctaccacaca ttgaaccttt 1980
ttgcagtgca aaaaagtacg tgtcggcagt cacgtaggcc ggccttatcg ggtcgcgtcc 2040
tgtcacgtac gaatcacatt atcggaccgg acgagtgttg tcttatcgtg acaggacgcc 2100
agcttcctgt gttgctaacc gcagccggac gcaactcctt atcggaacag gacgcgcctc 2160
catatcagcc gcgcgttatc tcatgcgcgt gaccggacac gaggcgcccg tcccgcttat 2220
cgcgcctata aatacagccc gcaacgatct ggtaaacaca gttgaacagc atctgttcga 2280
aatggccaag ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt 2340
cgagttctgg accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg 2400
tgtggtccgg gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga 2460
caacaccctg gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga 2520
ggtcgtgtcc acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca 2580
gccgtggggg cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc 2640
cgaggagcag gactaaagct ttacaactaa acacgacttg gagtattcct tgtagtgttt 2700
aagattttaa atcttactta atgacttcga acgattttaa cgataacttt ctctttgttt 2760
aactttaatc agcatacata aaaagccccg gttttgtatc gggaagaaaa aaaatgtaat 2820
tgtgttgcct agataataaa cgtattatca aagtgtgtgg ttttccttta ccaaagaccc 2880
ctttaagatg ggcctaatgg gcttaagtcg agtcctttcc gatgtgttaa atacacattt 2940
attacactga tgcgtcgaat gtacactttt aataggatag ctccactaaa aattatttta 3000
tttatttaat ttgttgcacc aaaactgata cattgacgaa acgcgtatgc tagcttaaag 3060
gaaccaattc agtcgactgg atccggtacc gaattcgctt actaaaagcc agataacagt 3120
atgcgtattt gcgcgctgat ttttgcggta taagaatata tactgatatg tatacccgaa 3180
gtatgtcaaa aagaggtgtg cttctagaat gcagtttaag gtttacacct ataaaagaga 3240
gagccgttat cgtctgtttg tggatgtaca gagtgatatt attgacacgc ccgggcgacg 3300
gatagtgatc cccctggcca gtgcacgtct gctgtcagat aaagtctccc gtgaacttta 3360
cccggtggtg catatcgggg atgaaagctg gcgcatgatg accaccgata tggccagtgt 3420
gccggtctcc gttatcgggg aagaagtggc tgatctcagc caccgcgaaa atgacatcaa 3480
aaacgccatt aacctgatgt tctggggaat atagaattcg cggccgcact cgagatatct 3540
agaggcgcgc ccagcgtcgt gaaaagaggc aatgacaaat acaaaacgac gtatgagcag 3600
acccgtcgcc aagacgggtc tacctctaag atgatgtcat ttgtttttta aaactaactc 3660
gctttacgag tagaattcta cgtgtaaaac ataatcaaga gatgatgtca tttgtttttc 3720
aaaaccaaac tcgctttacg agtagaattc tacgtgtaaa acacaatcaa aagatgatgt 3780
cattcgtttt tcaaaaccga atttaagaaa tgatgtcatt tgtttttcaa aaccaaactc 3840
gctttacgag cagaattcta cgtgtaaaac acaatcaaga gatgatgtca tttgtttttc 3900
aaaactgaat gatgtcattt gtttttcaaa actaaacttg ctttgcgagt agaattctac 3960
gtgtaaaaca cagtcaagag atgatgtcat ttgtttttca aaactgaacc ggctttacga 4020
gtagaattct acttgtaaaa cataatcaag agatgatgtc atttgttttt caaaactgaa 4080
ctggctttac gagtagaatt ctacgtgtaa aacataatca agagatgatg tcatcattaa 4140
actgatgtca ttttatacac gattgttaac atgtttaata atgactaatt tgtttttcca 4200
aattaaactc gctttacgag tagaattcta cttgtaacgc acgattaagt atgaatcata 4260
agctgatgtc atttgttttc gacataaaat gtttatacaa tggaatcttc ttgtaaatta 4320
tccaaataat ataatttatc cgattctacg ttacatttaa attcgttgtt atcgtacaat 4380
tcttcaggac acgccatgta ttggtcattt ttagcgtgca accaacgatt gtatttgacg 4440
ccgtcgttgg attgcgtgtt caggttggcg tacacgtgac tgggcacggc ttctttttcc 4500
atgggacgtc gaccgagaaa tttctctggc cgttattcgt tattctctct tttctttttg 4560
ggtctctccc tctctgcact aatgctctct cactctgtca cacagtaaac ggcatactgc 4620
tctcgttggt tcgagagagc gcgcctcgaa tgttcgcgaa aagagcgccg gagtataaat 4680
agaggcgctt cgtctacgga gcgacaattc aattcaaaca agcaaagtga acacgtcgct 4740
aagcgaaagc taagcaaata aacaagcgca gctgaacaag ctaaacaatc tgcagtaaag 4800
tgcaagttaa agtgaatcaa ttaaaagtaa ccagcaacca agtaaatcaa ctgcaactac 4860
tgaaatctgc caagaagtaa ttattgaata caagaagaga actctggggg atctctagtc 4920
cagtgtggtg gaattcgcca tggccccaaa gaaaaagaga aaggttgatt acaaagacca 4980
cgacggagac tacaaagacc acgacattga ttataaagat gatgatgata aaggaacgat 5040
ggacaaaaag tatagcatcg gtctggatat tggaactaac tccgtcggct gggctgtaat 5100
caccgacgaa tacaaggtcc cgtcaaaaaa gttcaaggta ttgggtaaca cagatcgtca 5160
ctctatcaaa aagaatctca ttggagctct gttgttcgac agcggcgaaa cagctgaggc 5220
cactagactg aagcgcaccg ccagacgccg ttacacgagg agaaagaaca gaatctgcta 5280
cttgcaagaa atattctcaa acgagatggc caaagtggac gattcgttct ttcataggtt 5340
agaagagagt ttccttgttg aagaggataa aaagcacgaa agacatccga tatttggaaa 5400
catcgtggac gaagttgctt atcacgagaa gtaccccacg atctatcatc tgcgtaaaaa 5460
gttggtggac tcgacagata aggccgacct caggttaata taccttgcac tggcgcacat 5520
gatcaaattc agaggccatt ttctgattga aggtgacctg aaccctgaca atagtgatgt 5580
ggacaaactc ttcattcaat tagttcagac ctacaatcaa ctgtttgaag agaaccctat 5640
caacgcttca ggagttgacg ctaaggccat ccttagtgcg agactgagca aatcccgccg 5700
tctcgaaaac ttaatcgcac agttgcctgg agagaaaaag aacggtttgt tcggaaatct 5760
cattgcgttg tcactcggac tcacgccaaa cttcaagtct aacttcgatt tggcagaaga 5820
cgcgaaactg caactgagca aagacacata tgacgatgac ctcgataacc tcttagctca 5880
gatcggcgat caatacgccg acttgttcct cgctgccaaa aatctgtcgg acgctatact 5940
tctgagtgat atcttgcgcg tcaacacaga aattactaag gctcctctgt cggccagtat 6000
gataaaacgc tatgacgaac accatcagga tttgacattg ctcaaagccc tcgtgcgtca 6060
acagctccca gaaaagtaca aggagatttt ctttgatcag tccaagaatg gctacgcagg 6120
ttatatagac ggtggagcgt cgcaagaaga gttctacaag ttcatcaagc caatattaga 6180
aaagatggac ggcacggaag agttacttgt taagctgaat cgtgaggacc tgttgcgtaa 6240
acagaggaca ttcgataacg gatcaattcc gcaccaaata catcttggcg aactgcacgc 6300
tatcctcagg agacaagagg acttctaccc ctttttaaag gataaccgtg aaaagatcga 6360
gaaaatcctg actttcagga ttccttacta tgtcggccca ctggctcgtg gtaatagcag 6420
gtttgcctgg atgaccagga agtccgaaga gacaattact ccgtggaact tcgaagaggt 6480
ggttgataaa ggagcatcag cgcagtcttt catagaacgc atgacaaatt ttgacaagaa 6540
cttaccgaat gagaaggtcc ttcccaaaca ctcactcctc tacgaatact tcacagtata 6600
caacgagctc actaaagtca agtacgtaac cgagggtatg cgcaaacccg ctttcctgtc 6660
tggagagcag aaaaaggcca tcgtggacct tctgttcaag acaaaccgta aggtcactgt 6720
aaagcaactc aaggaagact acttcaaaaa gatagagtgt ttcgattcag tggaaatctc 6780
tggcgttgag gacagattta acgcttcctt gggtacttac cacgatttgc tcaagatcat 6840
taaagataag gacttcctcg acaacgaaga gaacgaagat atcttagagg acatagttct 6900
cacccttacg ctgtttgaag atagagagat gattgaagag cgcctgaaga cttatgctca 6960
tttgttcgat gacaaagtca tgaagcaact gaaacgccgt aggtacaccg gctggggtag 7020
attatcgcgc aaacttatta atggtataag ggacaagcag tcgggaaaaa cgatattgga 7080
ctttctcaag agtgatggtt tcgccaacag aaattttatg caactcatac acgatgacag 7140
cttaacattc aaggaagata tccaaaaagc acaggtgtcg ggacagggcg acagtttgca 7200
cgaacatatt gctaacctcg ccggctcccc ggcgataaaa aagggtatcc ttcagactgt 7260
gaaagtcgta gatgaactgg tgaaggttat gggtcgtcat aaacccgaga acatagttat 7320
cgaaatggct agggagaatc aaacaactca gaagggacag aaaaactcaa gagaacgcat 7380
gaagcgcatt gaagagggta tcaaagagct tggcagtcaa atcctgaagg aacaccctgt 7440
cgagaacacg caacttcaga acgaaaaatt gtacctctac tatctgcaga atggtagaga 7500
tatgtacgta gaccaagaat tggatattaa ccgcctctca gattacgacg tggatcatat 7560
agttccgcag tcattcttga aggatgactc tatcgacaac aaagtcctca caagatcaga 7620
caagaaccgc ggaaaatcag ataatgtacc ctctgaagag gtggttaaaa agatgaaaaa 7680
ctactggaga cagttactta acgctaagtt gatcacgcaa agaaagttcg ataacctcac 7740
aaaggctgaa cgcggcggtt taagcgagct tgacaaggcc ggtttcataa aacgtcagtt 7800
agtcgaaacc aggcaaatta cgaaacacgt agcccaaata ttggattccc gcatgaacac 7860
taaatacgat gaaaatgaca agctcatccg tgaggtcaaa gtaattaccc tgaaaagcaa 7920
gttggtgtcc gacttcagaa aggatttcca gttctacaaa gttcgcgaaa tcaacaacta 7980
ccaccatgca catgacgctt acctgaacgc agtcgtaggc actgcgttaa ttaaaaagta 8040
ccctaaactg gaatctgagt tcgtgtacgg tgactataaa gtgtacgatg ttagaaagat 8100
gatcgctaaa agcgaacagg agattggaaa ggctaccgcc aagtatttct tttactccaa 8160
catcatgaat ttctttaaga ccgaaatcac gttagcaaat ggcgagatac gtaaaaggcc 8220
acttatcgaa acaaacggag aaactggcga gatagtgtgg gacaagggta gagattttgc 8280
cactgtccgc aaagtactgt cgatgccgca agtgaatatc gttaaaaaga ccgaagttca 8340
aacgggaggc ttcagcaaag agtccatcct gcccaagcgt aacagtgata aattgatagc 8400
taggaaaaag gactgggatc ctaaaaagta tggtggattc gacagcccaa ctgtcgcata 8460
ctccgtattg gtggttgcga aagtcgaaaa aggaaagagc aaaaagctca agtccgtaaa 8520
agagctgttg ggcattacca taatggaaag atcatctttc gagaagaatc ctatcgattt 8580
tctggaagcc aagggatata aagaggtcaa aaaggacctc ataatcaagt taccaaaata 8640
cagtctgttc gaattggaga acggcagaaa acgcatgctt gcatcagcgg gtgaactgca 8700
aaagggaaat gagttagcac ttccttctaa atacgtcaac ttcctgtatt tggcgtcaca 8760
ctacgaaaaa ctgaagggct ctccagaaga taacgagcaa aagcagttat ttgtggaaca 8820
gcacaaacat taccttgacg aaattataga gcaaatctcg gagttcagta agagagtgat 8880
tttggctgac gccaatcttg ataaagttct gtctgcttac aacaagcacc gtgataaacc 8940
gattagggaa caggccgaga acatcataca tctcttcaca ctcactaacc ttggtgcacc 9000
cgcagcgttc aaatattttg acaccacgat agatcgtaag aggtacacca gcacgaaaga 9060
agttttggac gcgacactca tccatcaatc aatcacgggc ctgtacgaga ccagaatcga 9120
cctgtcccag ctcggtggcg actagcggcc gcgactctag atcataatca gccatgcggc 9180
cgcgactcta gaccacattt gtagaggttt tacttgcttt aaaaaacctc ccacacctcc 9240
ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt 9300
ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 9360
tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttaaagctta tcgatacgcg 9420
tacctaggcc ggccgatctc ggatctgaca atgttcagtg cagagactcg gctacgcctc 9480
gtggactttg aagttgacca acaatgttta ttcttacctc taatagtcct ctgtggcaag 9540
gtcaagattc tgttagaagc caatgaagaa cctggttgtt caataacatt ttgttcgtct 9600
aatatttcac taccgcttga cgttggctgc acttcatgta cctcatctat aaacgcttct 9660
tctgtatcgc tctggacgtc atcttcactt acgtgatctg atatttcact gtcagaatcc 9720
tcaccaacaa gctcgtcatc gctttgcaga agagcagaga ggatatgctc atcgtctaaa 9780
gaactaccca ttttattata tattagtcac gatatctata acaagaaaat atatatataa 9840
taagttatca cgtaagtaga acatgaaata acaatataat tatcgtatga gttaaatctt 9900
aaaagtcacg taaaagataa tcatgcgtca ttttgactca cgcggtcgtt atagttcaaa 9960
atcagtgaca cttaccgcat tgacaagcac gcctcacggg agctccaagc ggcgactgag 10020
atgtcctaaa tgcacagcga cggattcgcg ctatttagaa agagagagca atatttcaag 10080
aatgcatgcg tcaattttac gcagactatc tttctagggt taaaaaagat ttgcgcttta 10140
ctcgacctaa actttaaaca cgtcatagaa tcttcgtttg acaaaaacca cattgtggcc 10200
aagctgtgtg acgcgacgcg cgctaaagaa tggcaaacca agtcgcgcga gcgtcgactc 10260
tagaggatcc ccgggtaccg agctcgaatt cgtaatcatg gtcatagctg tttcctgtgt 10320
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 10380
cctggggtgc ctaatgagtg agctaactca catcggatgc cgggaccgac gagtgcagag 10440
gcgtgcaagc gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 10500
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 10560
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 10620
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 10680
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 10740
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 10800
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 10860
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 10920
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 10980
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 11040
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 11100
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 11160
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 11220
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 11280
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 11340
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 11400
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 11460
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 11520
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 11580
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 11640
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 11700
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 11760
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 11820
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 11880
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 11940
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 12000
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 12060
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 12120
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 12180
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 12240
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 12300
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 12360
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 12420
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 12480
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 12540
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 12600
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 12660
aaaataggcg tatcacgagg ccctttcgtc 12690
<210> 2
<211> 619
<212> DNA
<213> Artificial
<400> 2
agctgtccaa ggaatgcgta gcagctttct ccagcaatac atttcaaacg cctcaatctt 60
tttgcgttcc tttttcctga gacaccaagt ctcctaaagt catgatgatt gacctaaaag 120
aatcaataca gtttaataaa tttataagta ttaggttatg tagtacacat tgttgtaaat 180
cactgaattg ttttagatga ttttaacaat tagtacttat taatattaaa taagtacata 240
ccttgagaat ttaaaaatcg tcaactataa gccatacgaa tttaagcttg gtacttggct 300
tatagataag gacagaataa gaattgttaa cgtgtaagac aaggtcagat agtcatagtg 360
attttgtcaa agtaataaca gatggcgctg tacaaaccat aactgttttc atttgttttt 420
atggatttta ttacaaattc taaaggtttt attgttatta tttaatttcg ttttaattat 480
attatatatc tttaatagaa tatgttaaga gtttttgctc tttttgaata atctttgtaa 540
agtcgagtgt tgttgtaaat cacgctttca atagtttagt ttttttaggt atatatacaa 600
aatatcgtgc tctacaagt 619
<210> 3
<211> 287
<212> DNA
<213> Artificial
<400> 3
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt tttctagaac aattttataa catacatcgg attttttaat 120
tagtttaaaa atatatttga ttcgttatca aatgttaaca taaatattaa tactagataa 180
acagtttatg tataaaaaat tgtttatttt tttaaataaa aaaacaaata ttatcctatt 240
tttggtcaag cttttgcttt tggctaaatc gataaagatc tttcatt 287
<210> 4
<211> 70
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (26)..(45)
<223> n is a, c, g, or t
<400> 4
tacaaaatat cgtgctctac aagtgnnnnn nnnnnnnnnn nnnnngtttt agagctagaa 60
atagcaagtt 70
<210> 5
<211> 49
<212> DNA
<213> Artificial
<400> 5
tcgatgatga tgatcaattg tggcgcgcca agctgtccaa ggaatgcgt 49
<210> 6
<211> 25
<212> DNA
<213> Artificial
<400> 6
ttgtagagca cgatattttg tatat 25
<210> 7
<211> 50
<212> DNA
<213> Artificial
<400> 7
tcaatagttt agttttttta ggtatatata caaaatatcg tgctctacaa 50
<210> 8
<211> 49
<212> DNA
<213> Artificial
<400> 8
aagttgataa cggactagcc ttattttaac ttgctatttc tagctctaa 49
<210> 9
<211> 25
<212> DNA
<213> Artificial
<400> 9
ttagagctag aaatagcaag ttaaa 25
<210> 10
<211> 49
<212> DNA
<213> Artificial
<400> 10
accgatcgat cctaggcgct agctaatgaa agatctttat cgatttagc 49
<210> 11
<211> 6291
<212> DNA
<213> Artificial
<400> 11
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ggagatcggt acttcgcgaa 420
tgcgtcgaga taagagggtt aaaaaatata ttttacgcac catatacgca tcgggttgat 480
atcgttaata tggatcaatt tgaacagttg attaacgtgt ctctgctcaa gtctttgatc 540
aaaacgcaaa tcgacgaaaa tgtgtcggac aatatcaagt cgatgagcga aaaactaaaa 600
aggctagaat acgacaatct cacagacagc gttgagatat acggtattca cgacagcagg 660
ctgaataata aaaaaattag aaactattat ttaaccctag aaagataatc atattgtgac 720
gtacgttaaa gataatcatg cgtaaaattg acgcatgtgt tttatcggtc tgtatatcga 780
ggtttattta ttaatttgaa tagatattaa gttttattat atttacactt acatactaat 840
aataaattca acaaacaatt tatttatgtt tatttattta ttaaaaaaaa acaaaaactc 900
aaaatttctt ctataaagta acaaaacttt taaacattct ctcttttaca aaaataaact 960
tattttgtac tttaaaaaca gtcatgttgt attataaaat aagtaattag cttaacttat 1020
acataataga aacaaattat acttattagt cagtcagaaa caactttggc acatatcaat 1080
attatgctct cgacaaataa cttttttgca ttttttgcac gatgcatttg cctttcgcct 1140
tattttagag gggcagtaag tacagtaagt acgttttttc attactggct cttcagtact 1200
gtcatctgat gtaccaggca cttcatttgg caaaatatta gagatattat cgcgcaaata 1260
tctcttcaaa gtaggagctt ctaaacgctt acgcataaac gatgacgtca ggctcatgta 1320
aaggtttctc ataaattttt tgcgactttg aaccttttct cccttgctac tgacattatg 1380
gctgtatata ataaaagaat ttatgcaggc aatgtttatc attccgtaca ataatgccat 1440
aggccaccta ttcgtcctcc tactgcaggt catcacagaa cacatttggt ctagcgtgtc 1500
cactccgcct ttagtttgat tataatacat aaccatttgc ggtttaccgg tactttcgtt 1560
gatagaagca tcctcatcac aagatgataa taagtatacc atcttagctg gcttcggttt 1620
atatgagacg agagtaaggg gtccgtcaaa acaaaacatc gatgttccca ctggcctgga 1680
gcgactgttt ttcagtactt ccggtatctc gcgtttgttt gatcgcacgg ttcccacaat 1740
ggttaattcg agctcgcccg gggatctaat tcaattagag actaattcaa ttagagctaa 1800
ttcaattagg atccaagctt atcgatttcg aaccctcgac cgccggagta taaatagagg 1860
cgcttcgtct acggagcgac aattcaattc aaacaagcaa agtgaacacg tcgctaagcg 1920
aaagctaagc aaataaacaa gcgcagctga acaagctaaa caatcggggt accgctagag 1980
tcgacggtac cgcgggcccg ggatccaccg gtcgccacca tggtgagcaa gggcgaggag 2040
ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag 2100
ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagttc 2160
atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgacctac 2220
ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc 2280
gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac 2340
aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag 2400
ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac 2460
agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt gaacttcaag 2520
atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca gcagaacacc 2580
cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac ccagtccgcc 2640
ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc 2700
gccgggatca ctctcggcat ggacgagctg tacaagtaac ggccgcgact ctagatcata 2760
atcagccatg cggccgcgac tctagaccac atttgtagag gttttacttg ctttaaaaaa 2820
cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt 2880
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 2940
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttaaag 3000
cttatcgata cgcgtacggc gcgcctaggc cggccgatct cggatctgac aatgttcagt 3060
gcagagactc ggctacgcct cgtggacttt gaagttgacc aacaatgttt attcttacct 3120
ctaatagtcc tctgtggcaa ggtcaagatt ctgttagaag ccaatgaaga acctggttgt 3180
tcaataacat tttgttcgtc taatatttca ctaccgcttg acgttggctg cacttcatgt 3240
acctcatcta taaacgcttc ttctgtatcg ctctggacgt catcttcact tacgtgatct 3300
gatatttcac tgtcagaatc ctcaccaaca agctcgtcat cgctttgcag aagagcagag 3360
aggatatgct catcgtctaa agaactaccc attttattat atattagtca cgatatctat 3420
aacaagaaaa tatatatata ataagttatc acgtaagtag aacatgaaat aacaatataa 3480
ttatcgtatg agttaaatct taaaagtcac gtaaaagata atcatgcgtc attttgactc 3540
acgcggtcgt tatagttcaa aatcagtgac acttaccgca ttgacaagca cgcctcacgg 3600
gagctccaag cggcgactga gatgtcctaa atgcacagcg acggattcgc gctatttaga 3660
aagagagagc aatatttcaa gaatgcatgc gtcaatttta cgcagactat ctttctaggg 3720
ttaaaaaaga tttgcgcttt actcgaccta aactttaaac acgtcataga atcttcgttt 3780
gacaaaaacc acattgtggc caagctgtgt gacgcgacgc gcgctaaaga atggcaaacc 3840
aagtcgcgcg agcgtcgact ctagaggatc cccgggtacc gagctcgaat tcgtaatcat 3900
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 3960
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acatcggatg 4020
ccgggaccga cgagtgcaga ggcgtgcaag cgagcttggc gtaatcatgg tcatagctgt 4080
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4140
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4200
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4260
cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc 4320
gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat 4380
ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca 4440
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 4500
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 4560
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 4620
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 4680
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 4740
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 4800
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 4860
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat 4920
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 4980
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 5040
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 5100
ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 5160
agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 5220
ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 5280
gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 5340
catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 5400
cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 5460
cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 5520
gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta 5580
tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 5640
gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 5700
tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 5760
gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 5820
gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 5880
taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 5940
tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 6000
ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 6060
taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 6120
tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 6180
aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta 6240
ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt c 6291
<210> 12
<211> 19
<212> DNA
<213> Artificial
<400> 12
agctgtccaa ggaatgcgt 19
<210> 13
<211> 27
<212> DNA
<213> Artificial
<400> 13
atatacaaaa tatcgtgctc tacaagt 27
<210> 14
<211> 28
<212> DNA
<213> Artificial
<400> 14
gttttagagc tagaaatagc aagttaaa 28
<210> 15
<211> 25
<212> DNA
<213> Artificial
<400> 15
gctaaatcga taaagatctt tcatt 25
<210> 16
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(12)
<223> n is a, c, g, or t
<400> 16
nnnnnnnnnn nntaaatcac gctttcaata 30
<210> 17
<211> 29
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(12)
<223> n is a, c, g, or t
<400> 17
nnnnnnnnnn nncgactcgg tgccacttt 29
- 上一篇:一种医用注射器针头装配设备
- 下一篇:一种花椰菜单核苷酸突变的方法