xCas9n-epBE碱基编辑系统在基因编辑中的应用

文档序号：1717438 发布日期：2019-12-17 浏览：21次 >En<

阅读说明：本技术 xCas9n-epBE碱基编辑系统在基因编辑中的应用 (application of xCas9n-epBE base editing system in gene editing ) 是由杨进孝徐雯刘亚王飞鹏袁爽于 2019-08-30 设计创作，主要内容包括：本发明公开了xCas9n-epBE碱基编辑系统在基因编辑中的应用。本发明公开的xCas9n-epBE碱基编辑系统包括xCas9n、PmCDA1、UGI和tRNA-esgRNA；所述tRNA-esgRNA靶向靶点序列；所述tRNA-esgRNA如式I所示：tRNA-所述靶点序列转录的RNA-esgRNA骨架(式I)。通过实验证明：本发明的xCas9n-epBE碱基编辑系统在植物基因组中实现了靶点序列的编辑,尤其是在PAM序列为NGT、NGA、NGG、GAA或GAT时实现了靶点序列中由碱基C到碱基T的替换。本发明的xCas9n-epBE碱基编辑系统在植物或动物基因编辑中具有广泛的应用前景。(The invention discloses an application of an xCas9n-epBE base editing system in gene editing. The xCas9n-epBE base editing system disclosed by the invention comprises xCas9n, PmCDA1, UGI and tRNA-esgRNA; the tRNA-esgRNA targets a target sequence; the tRNA-esgRNA is shown as a formula I: tRNA-RNA transcribed from the target sequence-esgRNA backbone (formula I). Experiments prove that: the xCas9n-epBE base editing system realizes the editing of a target point sequence in a plant genome, and particularly realizes the replacement from a base C to a base T in the target point sequence when the PAM sequence is NGT, NGA, NGG, GAA or GAT. The xCas9n-epBE base editing system has wide application prospect in plant or animal gene editing.)

技术领域

本发明涉及生物技术领域，具体涉及xCas9n-epBE碱基编辑系统在基因编辑中的应用。

背景技术

CRISPR-Cas9技术已经成为强有力的基因组编辑手段，被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上，切割产生DNA双链断裂(dsDNA break，DSB)，而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种，一种是非同源末端连接(non-homologous end joining，NHEJ)，另一种是同源重组(homology-directed repair，HDR)。通常情况下NHEJ占大多数，因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换，因为HDR效率低以及需要DNA模板，所以使用HDR实现碱基精确替换的应用受到很大的限制。

2016年，David Liu和Akihiko Kondo两个实验室分别独立报道了两种不同类型的胞嘧啶碱基编辑器(cytosine base editor，CBE)，分别使用了两种不同的胞苷脱氨酶rAPOBEC1(rat APOBEC1)和PmCDA1(activation-induced cytidine deaminase(AID)ortholog from sea lamprey)，原理都是通过使用胞苷脱氨酶直接实现对单个胞嘧啶(Cytosine，C)碱基进行编辑，而不再通过产生DSB和启动HDR修复，大大提高了C替换为胸腺嘧啶(Thymine，T)的碱基编辑效率。具体为dead Cas9(dCas9)或the Cas9 nickase(Cas9n)连带着rAPOBEC1或PmCDA1通过向导RNA定位到靶点，rAPOBEC1或PmCDA1催化非配对的单链DNA上的C发生胞嘧啶脱氨反应变成尿嘧啶(Uracil，U)，通过DNA的修复使得U与腺嘌呤(Adenine，A)配对，又通过DNA复制，最终使得T与A配对，从而实现了C到T的转换。在所测试的编辑器中，SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统(其含有尿嘧啶DNA糖化酶抑制剂(uracil DNA glycosylase inhibitor，UGI)的平均突变率较高，原因有二：一是UGI可以抑制尿嘧啶DNA糖化酶(uracil DNA glycosylase，UDG)催化清除DNA中U，二是SpCas9n(D10A)在非编辑链上产生切口，诱导真核错配修复机制或long-patch BER(base-excision repair)修复机制，促使U:G错配更多的偏好性修复成U:A。

目前，SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统已被广泛应用到水稻中，实现C到T的转换，但编辑的靶点主要局限在PAM(Protospacer Adjacent Motif)为NGG的序列，大大限制了可编辑的C的范围。在人细胞中，SpCas9的变体xCas9能够识别NG，GAA和GAT靶点，被成功的开发成CBE，大大拓展了基因组中可编辑的C的范围。研究人员也多次尝试使用xCas9开发新的水稻CBE，但是在水稻转基因T0苗中，除了能够编辑PAM为NGG的靶点外，其他的NG PAM(包括NGT、NGA和NGC)以及GAA和GAT PAM靶点均未实现编辑，限制了使用xCas9拓展水稻基因组中可编辑C范围的应用。

发明内容

本发明所要解决的技术问题是如何使用SpCas9的变体xCas9将生物体或生物细胞中PAM序列为NG(包括NGT、NGA和NGG)以及GAA和GAT的靶点序列中的C突变为T。

为了解决上述技术问题，本发明首先提供了一种基因组靶点序列的编辑方法。

本发明提供的基因组靶点序列的编辑方法为方法(一)或方法(二)或方法(三)或方法(四)：

所述方法(一)包括如下步骤：将xCas9n的编码基因、转录tRNA-esgRNA的DNA分子、PmCDA1的编码基因和UGI的编码基因导入生物体或生物细胞内，使所述xCas9n、所述tRNA-esgRNA、所述PmCDA1和所述UGI的编码基因均得到表达，实现基因组靶点序列的编辑；

所述方法(二)包括如下步骤：将xCas9n的编码基因、转录tRNA-esgRNA的DNA分子和PmCDA1的编码基因导入生物体或生物细胞内，使所述xCas9n、所述tRNA-esgRNA和所述PmCDA1的编码基因均得到表达，实现基因组靶点序列的编辑；

所述方法(三)包括如下步骤：将xCas9n、tRNA-esgRNA、PmCDA1和UGI导入生物体或生物细胞内，实现基因组靶点序列的编辑；

所述方法(四)包括如下步骤：将xCas9n、tRNA-esgRNA和PmCDA1导入生物体或生物细胞内，实现基因组靶点序列的编辑；

所述tRNA-esgRNA靶向所述靶点序列；

所述tRNA-esgRNA如式I所示：tRNA-所述靶点序列转录的RNA-esgRNA骨架(式I)；

所述tRNA为m1)或m2)或m3)：

m1)将序列1第474-550位中的T替换为U得到的RNA分子；

m2)将m1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子；

m3)与m1)或m2)限定的核苷酸序列具有75％或75％以上同一性且具有相同功能的RNA分子；

所述esgRNA骨架为n1)或n2)或n3)：

n1)将序列1第571-656位中的T替换为U得到的RNA分子；

n2)将n1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子。

n3)与n1)或n2)限定的核苷酸序列具有75％或75％以上同一性且具有相同功能的RNA分子；

所述靶点序列的PAM序列为如下任一种：NGT、NGA、NGG、GAA、GAT；N为A、T、C或G。

所述PAM序列为与所述靶点序列3′端相连的一段DNA序列。所述PAM序列(NGT、NGA、NGG)中的N或PAM序列(GAA、GAT)中的G与所述靶点序列3′端相连。所述靶点序列大小可为15-25bp，进一步可为18-22bp，更进一步的可为20bp。

上述方法中，所述xCas9n可为xCas9n 3.6或xCas9n 3.7。在本发明的具体实施例中，所述xCas9n为xCas9n 3.7。

所述xCas9n 3.7为A1)或A2)或A3)：

A1)氨基酸序列是序列2所示的蛋白质；

A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质。

所述PmCDA1为C1)或C2)或C3)：

C1)氨基酸序列是序列3所示的蛋白质；

C2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

C3)在C1)或C2)的N端或/和C端连接标签得到的融合蛋白质。

所述UGI为E1)或E2)或E3)：

E1)氨基酸序列是序列4所示的蛋白质；

E2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质。

为了使A1)、C1)或E1)中的蛋白质便于纯化，可在由序列表中序列2或序列3或序列4所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。

表、标签的序列

标签	残基	序列
			Poly-Arg	5-6(通常为5个)	RRRRR
Poly-His	2-10(通常为6个)	HHHHHH
			FLAG	8	DYKDDDDK
Strep-tag II	8	WSHPQFEK
			c-myc	10	EQKLISEEDL

上述A2)、C2)或E2)中的蛋白质，为与序列2或序列3或序列4所示蛋白质的氨基酸序列具有75％或75％以上同一性且具有相同功能的蛋白质。所述具有75％或75％以上同一性为具有75％、具有80％、具有85％、具有90％、具有95％、具有96％、具有97％、具有98％或具有99％的同一性。

上述A2)、C2)或E2)中的蛋白质可人工合成，也可先合成其编码基因，再进行生物表达得到。

上述A2)、C2)或E2)中的蛋白质的编码基因可通过将序列1的第2857-7125位、第7417-8040位或第8062-8358位所示的DNA序列中缺失一个或几个氨基酸残基的密码子，和/或进行一个或几个碱基对的错义突变，和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。序列1的第2857-7125位、第7417-8040位和第8062-8358位分别编码序列2、序列3和序列4所示的蛋白质。

所述xCas9n 3.7的编码基因为b1)或b2)或b3)：

b1)序列表中序列1第2857-7125位所示的cDNA分子或DNA分子；

b2)与b1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述xCas9n 3.7的cDNA分子或DNA分子；

b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交，且编码所述xCas9n 3.7的cDNA分子或DNA分子。

所述PmCDA1的编码基因为d1)或d2)或d3)：

d1)序列表中序列1第7417-8040位所示的cDNA分子或DNA分子；

d2)与d1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述PmCDA1的cDNA分子或DNA分子；

d3)在严格条件下与d1)或d2)限定的核苷酸序列杂交，且编码所述PmCDA1的cDNA分子或DNA分子。

所述UGI的编码基因为f1)或f2)或f3)：

f1)序列表中序列1第8062-8358位所示的cDNA分子或DNA分子；

f2)与f1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述UGI的cDNA分子或DNA分子；

f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交，且编码所述UGI的cDNA分子或DNA分子。

本领域普通技术人员可以很容易地采用已知的方法，例如定向进化和点突变的方法，对本发明的编码所述xCas9n、所述PmCDA1或所述UGI的核苷酸序列进行突变。那些经过人工修饰的，具有与本发明的所述xCas9n、所述PmCDA1或所述UGI的核苷酸序列75％或者更高同一性的核苷酸，只要编码所述xCas9n、所述PmCDA1或所述UGI且具有相同功能，均是衍生于本发明的核苷酸序列并且等同于本发明的序列。

这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3或4所示的氨基酸序列组成的蛋白质的核苷酸序列具有75％或更高，或85％或更高，或90％或更高，或95％或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件，两个或多个序列之间的同一性可以用百分比(％)表示，其可以用来评价相关序列之间的同一性。

所述严格条件是在2×SSC，0.1％SDS的溶液中，在68℃下杂交并洗膜2次，每次5min，又于0.5×SSC，0.1％SDS的溶液中，在68℃下杂交并洗膜2次，每次15min；或，0.1×SSPE(或0.1×SSC)、0.1％SDS的溶液中，65℃条件下杂交并洗膜。

上述75％或75％以上同一性，可为80％、85％、90％或95％以上的同一性。

上述方法中，所述转录tRNA-esgRNA的DNA分子转录后得到的所述tRNA-esgRNA为不成熟的RNA前体，该RNA前体中的tRNA会被两种酶(RNase P和RNase Z)切割掉后得到成熟的RNA。一个重组表达载体中有多少个靶点，就会得到多少个独立的成熟的RNA，每个成熟的RNA依次由所述靶点序列转录的RNA和所述esgRNA骨架组成，或依次由所述tRNA残留的个别碱基、所述靶点序列转录的RNA和所述esgRNA骨架组成。

上述方法中，所述方法(一)中，所述UGI的个数可为一个或两个或多个。在本发明的具体实施例中，所述UGI的个数具体为一个。

上述方法中，所述方法(一)中，所述xCas9n的编码基因、所述转录tRNA-esgRNA的DNA分子、所述PmCDA1的编码基因和所述UGI的编码基因通过含有所述xCas9n的编码基因的表达盒、所述转录tRNA-esgRNA的DNA分子的表达盒、所述PmCDA1的编码基因的表达盒和所述UGI的编码基因的表达盒的重组表达载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内，也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。

在本发明的具体实施例中，上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内，所述重组表达载体具体为xCas9n-epBE-1重组表达载体、xCas9n-epBE-2重组表达载体、xCas9n-epBE-3重组表达载体、xCas9n-epBE-4重组表达载体、xCas9n-epBE-5重组表达载体或xCas9n-epBE-6重组表达载体。

所述xCas9n-epBE-1重组表达载体的序列为序列表中的序列1。所述xCas9n-epBE-1重组表达载体含有OsMPK2基因的如下两个靶点T1-1和T5-1，序列见表1。

所述xCas9n-epBE-2重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列，且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。

所述xCas9n-epBE-3重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中序列1第474-839位所示的DNA分子替换为序列8所示的DNA分子，且保持其他序列不变后得到的序列。所述xCas9n-epBE-3重组表达载体含有OsMPK5基因的如下四个靶点T4-1、T6-1、T1-2和T5-3，序列见表2。

所述xCas9n-epBE-4重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK2基因的另外两个靶点T4-2和T2-2的序列，且保持其他序列不变后得到的序列。OsMPK2基因的另外两个靶点T4-2和T2-2的序列见表2。

所述xCas9n-epBE-5重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsNRT1.1B基因的一个靶点T3-1的序列和OsWaxy基因的一个靶点T3-2的序列，且保持其他序列不变后得到的序列。OsNRT1.1B基因的一个靶点T3-1的序列和OsWaxy基因的一个靶点T3-2的序列见表2。

所述xCas9n-epBE-6重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsWaxy基因的两个靶点T6-2和T6-3的序列，且保持其他序列不变后得到的序列。OsWaxy基因的两个靶点T6-2和T6-3的序列见表2。

为了解决上述技术问题，本发明还提供了一种生物突变体的制备方法。

本发明提供的生物突变体的制备方法包括如下步骤：按照上述基因组靶点序列的编辑方法对生物体的基因组靶点序列进行编辑，获得生物突变体。

上述任一所述方法中，所述靶点序列可为一个或两个或多个。

上述任一所述方法中，所述基因组靶点序列的编辑可为将所述靶点序列中的C突变为T。所述C可为位于所述靶点序列中任意位置的碱基C。

上述任一所述方法中，所述生物体为p1)或p2)或p3)或p4)：p1)植物或动物；p2)单子叶植物或双子叶植物；p3)禾本科植物；p4)水稻(如日本晴水稻)；

所述生物细胞为q1)或q2)或q3)或q4)：q1)植物细胞或动物细胞；q2)单子叶植物细胞或双子叶植物细胞；q3)禾本科植物细胞；q4)水稻细胞(如日本晴水稻细胞)。

本发明提供了xCas9n-epBE碱基编辑系统在基因编辑中的应用。本发明的xCas9n-epBE碱基编辑系统包括xCas9n、PmCDA1、UGI和tRNA-esgRNA组成；所述tRNA-esgRNA靶向靶点序列；所述tRNA-esgRNA如式I所示：tRNA-所述靶点序列转录的RNA-esgRNA骨架(式I)。通过实验证明：本发明的xCas9n-epBE碱基编辑系统在植物基因组中实现了靶点序列的编辑，尤其是在PAM序列为NGT、NGA、NGG、GAA或GAT时实现了靶点序列中由碱基C到碱基T的替换。本发明的xCas9n-epBE碱基编辑系统在植物或动物基因编辑中具有广泛的应用前景。

附图说明

图1为四种碱基编辑系统中各元件结构示意图。

图2为四种碱基编辑系统的C·T碱基替换效率。

图3为相应位置C发生C·T碱基替换的靶点数占相应位置恰好为C的所有可编辑靶点数的比例。

图4为相应位置C发生C·T碱基替换的阳性T0苗数占相应位置恰好为C的所有被编辑的阳性T0苗数的比例。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂、仪器等，如无特殊说明，均可从商业途径得到。下述实施例中，如无特殊说明，序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸，末位均为相应DNA/RNA的3′末端核苷酸。

引物对T1-1由引物T1-1-F：5’-tgtgacaaaatctagccatttttc-3’和引物T1-1-R：5’-caacattcccatgaacagatg-3’组成，用于扩增靶点T1-1。

引物对T1-2由引物T1-2-F：5’-tcaagtacatccactcggcg-3’和引物T1-2-R：5’-gccagtcaaagaagcagtgc-3’组成，用于扩增靶点T1-2。

引物对T2-1由引物T2-1-F：5’-tcaagctcctcaggcacctc-3’和引物T2-1-R：5’-cagcaagcacgagttggg-3’组成，用于扩增靶点T2-1。

引物对T2-2由引物T2-2-F：5’-tgtgacaaaatctagccatttttc-3’和引物T2-2-R：5’-gctgggatcaaacacaagc-3’组成，用于扩增靶点T2-2。

引物对T3-1由引物T3-1-F：5’-aacacggtcaccaacttcatc-3’和引物T3-1-R：5’-cccacatgaatgatgcatatg-3’组成，用于扩增靶点T3-1。

引物对T3-2由引物T3-2-F：5’-taagcacacacaaacttcgatc-3’和引物T3-2-R：5’-gcagacgaacacaacatcctc-3’组成，用于扩增靶点T3-2。

引物对T4-1由引物T4-1-F：5’-ttccctttttaatagctgccttc-3’和引物T4-1-R：5’-gtgttgttgtagcagttagtgacag-3’组成，用于扩增靶点T4-1。

引物对T4-2由引物T4-2-F：5’-tgtgacaaaatctagccatttttc-3’和引物T4-2-R：5’-tgccctgtaccatcgagtaac-3’组成，用于扩增靶点T4-2。

引物对T5-1由引物T5-1-F：5’-cataggttgaagctttggattatg-3’和引物T5-1-R：5’-gttcttcattggaaattcatctagtg-3’组成，用于扩增靶点T5-1。

引物对T5-2由引物T5-2-F：5’-tcaagctcctcaggcacctc-3’和引物T5-2-R：5’-cagcaagcacgagttggg-3’组成，用于扩增靶点T5-2。

引物对T5-3由引物T5-3-F：5’-tcaagtacatccactcggcg-3’和引物T5-3-R：5’-gccagtcaaagaagcagtgc-3’组成，用于扩增靶点T5-3。

引物对T6-1由引物T6-1-F：5’-ttccctttttaatagctgccttc-3’和引物T6-1-R：5’-gtgttgttgtagcagttagtgacag-3’组成，用于扩增靶点T6-1。

引物对T6-2由引物T6-2-F：5’-ttcaggtcatccttcgatttc-3’和引物T6-2-R：5’-gatacttctcctccatgctcttg-3’组成，用于扩增靶点T6-2。

引物对T6-3由引物T6-3-F：5’-gcgaagaactgggagaatgtg-3’和引物T6-3-R：5’-acacacataaattcagggtccg-3’组成，用于扩增靶点T6-3。

以下实施例中，C·T碱基替换是指靶点序列中任何位置的C突变为T。

C·T碱基替换效率＝发生C·T碱基替换的阳性抗性愈伤数(或阳性T0苗数)/分析的总阳性抗性愈伤数(或总阳性T0苗数)×100％。

纯合突变体定义为所有发生C·T碱基替换的位点均为纯合突变的T0苗。反之则为杂合突变体。

日本晴水稻：参考文献：梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.；公众可以从北京市农林科学院获得。

恢复培养基：含有200mg/L特美汀的N6固体培养基。

筛选培养基：含有50mg/L潮霉素的N6固体培养基。

分化培养基：含有2mg/L KT、0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。

生根培养基：含有0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。

实施例1、四种碱基编辑系统载体的构建及其在水稻基因组编辑中的应用

一、重组表达载体的构建

本实施例中的重组表达载体分为如下四种：xCas9n-erBE重组表达载体、xCas9n-rBE重组表达载体、xCas9n-epBE重组表达载体和xCas9n-pBE重组表达载体。各载体均为环状质粒。

四种重组表达载体各元件结构示意图如图1所示。其中xCas9n-erBE重组表达载体和xCas9n-rBE重组表达载体均使用的是基于rAPOBEC1的tRNA系统，二者的区别仅在于sgRNA骨架结构的不同。xCas9n-epBE重组表达载体和xCas9n-pBE重组表达载体均使用的是基于PmCDA1的tRNA系统，二者的区别也仅在于sgRNA骨架结构的不同。

根据含有的靶点序列不同，每种重组表达载体又各自分成两种，共有如下八种重组表达载体：xCas9n-epBE-1重组表达载体、xCas9n-epBE-2重组表达载体、xCas9n-pBE-1重组表达载体、xCas9n-pBE-2重组表达载体、xCas9n-erBE-1重组表达载体、xCas9n-erBE-2重组表达载体、xCas9n-rBE-1重组表达载体和xCas9n-rBE-2重组表达载体。

人工合成上述八种重组表达载体，八种重组表达载体的具体结构描述分别如下：

xCas9n-epBE-1重组表达载体的序列为序列表中的序列1。其中，序列1的第131-467位为OsU3启动子的核苷酸序列，第474-550位和第657-733位均为tRNA的核苷酸序列，第551-656位和第734-839位分别为靶向OsMPK2基因的两个esgRNA的核苷酸序列，这两个esgRNA的共同sgRNA骨架(记为esgRNA骨架)的核苷酸序列为序列1的第571-656位或序列1的第754-839位，第840-1130位为OsU3终止子的核苷酸序列；序列1的第1137-2850位为OsUbq3启动子的核苷酸序列，第2857-7125位为xCas9n 3.7蛋白质的编码序列(不含有终止密码子)，编码序列2所示的xCas9n 3.7蛋白质；序列1的第7417-8040位为PmCDA1蛋白质的编码序列(不含有终止密码子)，编码序列3所示的PmCDA1蛋白质；序列1的第8062-8358位为UGI蛋白质的编码序列，编码序列4所示的UGI蛋白质；序列1的第8365-8559位为35S终止子的核苷酸序列；序列1的第8634-10626位为ZmUbi1启动子的核苷酸序列，第10633-11655位为潮霉素磷酸转移酶的编码序列，第11685-11900位为CaMV35S polyA的核苷酸序列。xCas9n-epBE-1重组表达载体中的两个靶点分别为T1-1和T5-1，序列见表1。

xCas9n-epBE-2重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列，且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。

xCas9n-pBE-1重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中序列1第571-656位和第754-839位所示的esgRNA骨架核苷酸序列均替换为序列5所示的sgRNA骨架(记为对照sgRNA骨架)的核苷酸序列，且保持其他序列不变后得到的序列。

xCas9n-pBE-2重组表达载体的序列为将xCas9n-pBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列，且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。

xCas9n-erBE-1重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中序列1第2857-8061位所示的DNA分子替换为序列6所示的DNA分子，且保持其他序列不变后得到的序列。其中，序列6第1-687位为rAPOBEC1蛋白质的编码序列(不含有终止密码子)，编码序列7所示的rAPOBEC1蛋白质，第736-5004位为xCas9n 3.7蛋白质的编码序列(不含有终止密码子)，编码序列2所示的xCas9n 3.7蛋白质。xCas9n-erBE-1重组表达载体中的两个靶点分别为T1-1和T5-1，序列见表1。

xCas9n-erBE-2重组表达载体的序列为将xCas9n-erBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列，且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。

xCas9n-rBE-1重组表达载体的序列为将xCas9n-erBE-1重组表达载体序列中序列1第571-656位和第754-839位所示的esgRNA骨架核苷酸序列均替换为序列5所示的对照sgRNA骨架核苷酸序列，且保持其他序列不变后得到的序列。

xCas9n-rBE-2重组表达载体的序列为将xCas9n-rBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列，且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。

各载体的sgRNA(esgRNA或对照sgRNA)的靶点核苷酸序列及相应的PAM序列如表1所示。

表1各载体的sgRNA(esgRNA或对照sgRNA)的靶点核苷酸序列及相应的PAM序列

二、水稻阳性抗性愈伤的获得

将步骤一获得的xCas9n-epBE-1重组表达载体，xCas9n-epBE-2重组表达载体，xCas9n-pBE-1重组表达载体，xCas9n-pBE-2重组表达载体，xCas9n-erBE-1重组表达载体，xCas9n-erBE-2重组表达载体，xCas9n-rBE-1重组表达载体和xCas9n-rBE-2重组表达载体分别按照如下步骤1-8进行操作：

1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品，CAT#:AC1010)，得到重组农杆菌。

2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌，28℃，150rpm震荡培养至OD₆₀₀为1.0-2.0，室温条件下，10000rpm离心1min，用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖，葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD₆₀₀为0.2，得到农杆菌侵染液。

3、水稻品种日本晴成熟种子去壳脱粒，置于100mL三角瓶中，加入70％(v/v)乙醇水溶液浸泡30sec，再置于25％(v/v)次氯酸钠水溶液中，120rpm震荡灭菌30min，无菌水冲洗3次，用滤纸吸干水分，然后将种子胚朝下置于N6固体培养基上，28℃暗培养4-6周，得到水稻愈伤。

4、完成步骤3后，将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体，乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl：50ml)中浸泡10min，然后，放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上，21℃暗培养1天。

5、取步骤4得到的水稻愈伤放入恢复培养基上，25-28℃暗培养3天。

6、取步骤5得到的水稻愈伤，置于筛选培养基上，28℃暗培养2周。

7、取步骤6得到的水稻愈伤，再次置于筛选培养基上，28℃暗培养2周，得到水稻抗性愈伤。

8、分别提取20块水稻抗性愈伤的基因组DNA并以其作为模板，采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增，得到PCR扩增产物；将该PCR扩增产物进行琼脂糖凝胶电泳，然后进行如下判断：如果PCR扩增产物中含有约1150bp的DNA片段，则相应的水稻抗性愈伤为水稻阳性抗性愈伤；如果PCR扩增产物中不含有约1150bp的DNA片段，则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。

三、结果分析

1、每载体分别取步骤二所获得的20块水稻阳性抗性愈伤的基因组DNA作为模板，对于T1-1靶点，采用引物对T1-1进行PCR扩增，得到PCR扩增产物；对于T2-1靶点，采用引物对T2-1进行PCR扩增，得到PCR扩增产物；对于T5-1靶点，采用引物对T5-1进行PCR扩增，得到PCR扩增产物；对于T5-2靶点，采用引物对T5-2进行PCR扩增，得到PCR扩增产物。

2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性抗性愈伤数，计算得出C·T碱基替换效率，结果见图2。

结果表明，xCas9n-erBE和xCas9-rBE碱基编辑系统对四个靶点均未实现C·T碱基替换，xCas9n-pBE也仅实现对T1-1靶点的编辑，而xCas9n-epBE表现最好，对四个靶点均成功实现C·T碱基替换，编辑效率范围为5％-70％。说明xCas9n-epBE是有效的碱基编辑系统，能够在水稻基因组中实现C·T碱基替换。

实施例2、xCas9n-epBE碱基编辑系统可实现对水稻基因组中PAM序列为NGG，NGT，NGA，GAA和GAT的靶点进行碱基编辑

一、重组表达载体的构建

人工合成如下重组表达载体：xCas9n-epBE-3重组表达载体，xCas9n-epBE-4重组表达载体，xCas9n-epBE-5重组表达载体和xCas9n-epBE-6重组表达载体。各载体均为环状质粒。

xCas9n-epBE-3重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中序列1第474-839位所示的DNA分子替换为序列8所示的DNA分子，且保持其他序列不变后得到的序列。其中，序列8的第1-77位、第184-260位、第367-443位和第550-626位均为tRNA的核苷酸序列，第78-183位、第261-366位、第444-549位和第627-732位分别为靶向OsMPK5基因的四个sgRNA的核苷酸序列，这四个sgRNA的共同sgRNA骨架(esgRNA骨架)的核苷酸序列为序列1的第571-656位。xCas9n-epBE-3重组表达载体中四个靶点分别为T4-1、T6-1、T1-2和T5-3，序列见表2。

xCas9n-epBE-4重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK2基因的另外两个靶点T4-2和T2-2的序列，且保持其他序列不变后得到的序列。OsMPK2基因的另外两个靶点T4-2和T2-2的序列见表2。

xCas9n-epBE-5重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsNRT1.1B基因的一个靶点T3-1的序列和OsWaxy基因的一个靶点T3-2的序列，且保持其他序列不变后得到的序列。OsNRT1.1B基因的一个靶点T3-1的序列和OsWaxy基因的一个靶点T3-2的序列见表2。

xCas9n-epBE-6重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsWaxy基因的两个靶点T6-2和T6-3的序列，且保持其他序列不变后得到的序列。OsWaxy基因的两个靶点T6-2和T6-3的序列见表2。

各载体的esgRNA的靶点核苷酸序列及相应的PAM序列如表2所示。

表2各载体的esgRNA的靶点核苷酸序列及相应的PAM序列

二、水稻植株中对靶点进行碱基编辑

1、将步骤一构建的xCas9n-epBE-3重组表达载体，xCas9n-epBE-4重组表达载体，xCas9n-epBE-5重组表达载体，xCas9n-epBE-6重组表达载体和实施例1步骤一构建的xCas9n-epBE-1重组表达载体，xCas9n-epBE-2重组表达载体，分别按照实施例1步骤二的1-7进行操作，得到水稻抗性愈伤。

2、取步骤1得到的水稻抗性愈伤放入分化培养基上，25℃光照培养1个月左右，将分化出来的小苗移至生根培养基上，25℃光照培养2周，获取水稻T0苗。

3、分别提取水稻T0苗的基因组DNA并以其作为模板，采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增，得到PCR扩增产物；将该PCR扩增产物进行琼脂糖凝胶电泳，然后进行如下判断：如果PCR扩增产物中含有约1150bp的DNA片段，则相应的水稻T0苗为水稻阳性T0苗；如果PCR扩增产物中不含有约1150bp的DNA片段，则相应的水稻T0苗不为水稻阳性T0苗。

4、各载体分别取步骤3所获得的水稻阳性T0苗的基因组DNA作为模板，对于T1-1靶点，采用引物对T1-1进行PCR扩增，得到PCR扩增产物；对于T1-2靶点，采用引物对T1-2进行PCR扩增，得到PCR扩增产物；对于T2-1靶点，采用引物对T2-1进行PCR扩增，得到PCR扩增产物；对于T2-2靶点，采用引物对T2-2进行PCR扩增，得到PCR扩增产物；对于T3-1靶点，采用引物对T3-1进行PCR扩增，得到PCR扩增产物；对于T3-2靶点，采用引物对T3-2进行PCR扩增，得到PCR扩增产物；对于T4-1靶点，采用引物对T4-1进行PCR扩增，得到PCR扩增产物；对于T4-2靶点，采用引物对T4-2进行PCR扩增，得到PCR扩增产物；对于T5-1靶点，采用引物对T5-1进行PCR扩增，得到PCR扩增产物；对于T5-2靶点，采用引物对T5-2进行PCR扩增，得到PCR扩增产物；对于T5-3靶点，采用引物对T5-3进行PCR扩增，得到PCR扩增产物；对于T6-1靶点，采用引物对T6-1进行PCR扩增，得到PCR扩增产物；对于T6-2靶点，采用引物对T6-2进行PCR扩增，得到PCR扩增产物；对于T6-3靶点，采用引物对T6-3进行PCR扩增，得到PCR扩增产物。

5、将步骤4得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计靶点T1-1、T1-2、T2-1、T2-2、T3-1、T3-2、T4-1、T4-2、T5-1、T5-2、T5-3、T6-1、T6-2和T6-3的发生C·T碱基替换的阳性T0苗数，计算得出C·T碱基替换效率，结果见表3。

结果表明，xCas9n-epBE碱基编辑系统，除了不能对两个PAM序列为NGC的T4-1和T4-2靶点编辑外，对其他PAM序列的靶点均能够有效编辑，得到C·T碱基替换的T0苗，碱基编辑效率为5％-64.3％。由此表明xCas9n-epBE碱基编辑系统可以对水稻基因组中PAM序列为NGG，NGT，NGA，GAA和GAT的靶点序列进行碱基编辑，实现C·T碱基替换，大大拓展了碱基编辑范围。

表3基因编辑效率分析结果

三、xCas9n-epBE碱基编辑系统的编辑窗口、编辑偏好性及创制的突变体类型分析

1、xCas9n-epBE碱基编辑系统的编辑窗口分析

将步骤二的5中得到的各载体各靶点的发生C·T碱基替换的阳性T0苗的靶点序列综合在一起进行分析，结果见表4。

结果表明，xCas9n-epBE碱基编辑系统的编辑窗口主要集中在靶点的1-7位(靶点5’端计为第1位)，偶尔也会发生在其他位置。

2、xCas9n-epBE碱基编辑系统的编辑偏好性分析

进一步针对所有可编辑靶点及所获得的所有被编辑的阳性T0苗，分析不同位置C发生突变的情况，即分析xCas9n-epBE碱基编辑系统的编辑偏好性，结果见图3和图4。

结果表明，C2，C3，C4和C5的发生频率相当，且均高于C1，C6和C7，C10和C14与C1，C6和C7相当。

3、xCas9n-epBE碱基编辑系统创制的突变体类型分析

对xCas9n-epBE碱基编辑系统创制的突变体类型的分析结果见表5和表6。

结果表明，xCas9n-epBE碱基编辑系统所创制的突变体类型主要为单个C突变和两个C同时突变。

表4靶点突变情况

表5靶点中各突变类型所占比例

突变类型	靶点数	突变类型比例(％)
			总数	15
仅单个C突变	4	26.7
			仅两个C同时突变	4	26.7
单个C突变或两个C同时突变	4	26.7
			两个C或三个C同时突变	1	6.7
单个C突变、两个C或三个C同时突变	1	6.7
			仅多个C同时突变(大于三个C)	1	6.7

表6阳性T0苗中各突变类型所占比例

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。

序列表

<110>北京市农林科学院

<120>xCas9n-epBE碱基编辑系统在基因编辑中的应用

<160>8

<170>PatentIn version 3.5

<210>1

<211>18306

<212>DNA

<213>人工序列(Artificial Sequence)

<400>1

ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60

ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120

ttaaggtacc gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg 180

tgcagtcagg gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg 240

gaagccggga acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt 300

aggagaaaag catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg 360

ccggcccatt acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc 420

acatagatca aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag 480

caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 540

ggctggtgca acactgcagc tattgatatc gtttcagagc tatgctggaa acagcatagc 600

aagttgaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca 660

aagcaccagt ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt 720

cccggctggt gcacccttca tgagatatat gatgtttcag agctatgctg gaaacagcat 780

agcaagttga aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 840

tttttttttc gttttgcatt gagttttctc cgtcgcatgt ttgcagtttt attttccgtt 900

ttgcattgaa atttctccgt ctcatgtttg cagcgtgttc aaaaagtacg cagctgtatt 960

tcacttattt acggcgccac attttcatgc cgtttgtgcc aactatcccg agctagtgaa 1020

tacagcttgg cttcacacaa cactggtgac ccgctgacct gctcgtacct cgtaccgtcg 1080

tacggcacag catttggaat taaagggtgt gatcgatact gcttgctgct aagcttacaa 1140

attcgggtca aggcggaagc cagcgcgcca ccccacgtca gcaaatacgg aggcgcgggg 1200

ttgacggcgt cacccggtcc taacggcgac caacaaacca gccagaagaa attacagtaa 1260

aaaaaaagta aattgcactt tgatccacct tttattacct aagtctcaat ttggatcacc 1320

cttaaaccta tcttttcaat ttgggccggg ttgtggtttg gactaccatg aacaactttt 1380

cgtcatgtct aacttccctt tcagcaaaca tatgaaccat atatagagga gatcggccgt 1440

atactagagc tgatgtgttt aaggtcgttg attgcacgag aaaaaaaaat ccaaatcgca 1500

acaatagcaa atttatctgg ttcaaagtga aaagatatgt ttaaaggtag tccaaagtaa 1560

aacttataga taataaaatg tggtccaaag cgtaattcac tcaaaaaaaa tcaacgagac 1620

gtgtaccaaa cggagacaaa cggcatcttc tcgaaatttc ccaaccgctc gctcgcccgc 1680

ctcgtcttcc cggaaaccgc ggtggtttca gcgtggcgga ttctccaagc agacggagac 1740

gtcacggcac gggactcctc ccaccaccca accgccataa ataccagccc cctcatctcc 1800

tctcctcgca tcagctccac ccccgaaaaa tttctcccca atctcgcgag gctctcgtcg 1860

tcgaatcgaa tcctctcgcg tcctcaaggt acgctgcttc tcctctcctc gcttcgtttc 1920

gattcgattt cggacgggtg aggttgtttt gttgctagat ccgattggtg gttagggttg 1980

tcgatgtgat tatcgtgaga tgtttagggg ttgtagatct gatggttgtg atttgggcac 2040

ggttggttcg ataggtggaa tcgtggttag gttttgggat tggatgttgg ttctgatgat 2100

tggggggaat ttttacggtt agatgaattg ttggatgatt cgattgggga aatcggtgta 2160

gatctgttgg ggaattgtgg aactagtcat gcctgagtga ttggtgcgat ttgtagcgtg 2220

ttccatcttg taggccttgt tgcgagcatg ttcagatcta ctgttccgct cttgattgag 2280

ttattggtgc catgggttgg tgcaaacaca ggctttaata tgttatatct gttttgtgtt 2340

tgatgtagat ctgtagggta gttcttctta gacatggttc aattatgtag cttgtgcgtt 2400

tcgatttgat ttcatatgtt cacagattag ataatgatga actcttttaa ttaattgtca 2460

atggtaaata ggaagtcttg tcgctatatc tgtcataatg atctcatgtt actatctgcc 2520

agtaatttat gctaagaact atattagaat atcatgttac aatctgtagt aatatcatgt 2580

tacaatctgt agttcatcta tataatctat tgtggtaatt tctttttact atctgtgtga 2640

agattattgc cactagttca ttctacttat ttctgaagtt caggatacgt gtgctgttac 2700

tacctatctg aatacatgtg tgatgtgcct gttactatct ttttgaatac atgtatgttc 2760

tgttggaata tgtttgctgt ttgatccgtt gttgtgtcct taatcttgtg ctagttctta 2820

ccctatctgt ttggtgatta tttcttgcag tacgtaatgg actacaagga ccacgacggg 2880

gattacaaag accacgacat agactacaag gatgacgatg acaaaatggc accgaagaaa 2940

aaaaggaagg tcggaatcca tggcgttcca gctgccgata agaaatattc catcggactc 3000

gccattggca cgaatagcgt cggatgggct gttattactg atgagtacaa agttccgtct 3060

aagaagttca aggtgctggg caacacagac cgccacagca taaagaaaaa tctcatcggt 3120

gcactccttt tcgatagtgg ggagactgca gaagcgacaa gattgaaaag gactgcgaga 3180

aggcgctata cacggcgtaa gaatagaatc tgctaccttc aggagatttt ctctaacgaa 3240

atggctaagg tcgatgacag tttctttcat agacttgagg aatcgttctt ggttgaggag 3300

gataagaaac atgagaggca cccgatattt ggaaacatcg tggatgaggt cgcatatcat 3360

gaaaagtacc ccacaatcta ccacctgaga aagaaactcg ttgattccac cgacaaagcg 3420

gatttgagac tcatctacct cgctcttgcc catatgataa agttccgcgg acactttctg 3480

atcgagggcg acctcaaccc tgataatagc gacgtcgata agctcttcat ccagttggtt 3540

caaacctaca atcagctctt tgaggaaaac ccaattaatg ctagtggagt ggatgcaaaa 3600

gcgatactgt cggccagact ctccaagagc agaaggttgg agaacctgat cgctcaactt 3660

cctggagaaa agaaaaacgg tctttttggg aatttgattg ccttgtctct gggcctcaca 3720

ccaaacttca agtcaaattt tgacctcgct gaggatacca aacttcagtt gtctaaggat 3780

acctatgatg acgatcttga caatttgctg gcacaaattg gcgaccagta cgcggatctg 3840

ttcctcgcag cgaagaatct gagtgatgct attctccttt cggacatact cagggttaac 3900

actgagatca caaaagcacc tttgagtgcg tcgatgatta agctgtatga tgaacatcac 3960

caagacctca ctttgctgaa ggcccttgtg cggcagcaat tgccagagaa gtacaaagaa 4020

atcttctttg accaatctaa gaacggatac gctggctata ttgatggagg agcttctcag 4080

gaggaattct ataagtttat caaacctata cttgagaaga tggatggtac agaggaactc 4140

cttgttaaat tgaacagaga agatttgctg cgcaagcaac ggacctttga caacggaatc 4200

attccgcatc agatacacct cggcgagctt catgccatcc ttcgccggca ggaagatttc 4260

tacccctttt tgaaggacaa ccgcgagaag atagaaaaaa tccttacgtt ccggattcct 4320

tactatgtgg gtccattggc aagggggaat tcccgctttg cgtggatgac tcggaaaagc 4380

gaggaaacta tcacaccgtg gaacttcgag aaagttgtgg acaagggagc ttctgcccaa 4440

tcattcattg agaggatgac taacttcgat aagaacctgc cgaacgagaa agttctcccc 4500

aagcactccc tcctttacga gtatttcacc gtgtataacg aacttacgaa ggttaaatac 4560

gtgactgagg gtatgaggaa gccagcattc ttgagcgggg atcaaaagaa agcgattgtt 4620

gatttgctgt ttaaaactaa tcgcaaggtg acagtcaagc agctcaaaga ggattatttc 4680

aagaaaattg aatgtttcga ctctgtggag atatcaggag tcgaagatag gtttaacgct 4740

tcccttggca cataccatga cctccttaag atcattaagg acaaagattt cctggataac 4800

gaggaaaatg aggacatcct cgaagatatt gttcttacct tgacgctgtt tgaggatcgc 4860

gaaatgatcg aggaacggct taagacgtat gctcacttgt tcgacgataa ggttatgaag 4920

cagctcaagc gtagaaggta cactggatgg ggccgtctgt ctagaaagct catcaacgga 4980

atacgtgata aacaaagtgg caagacaatt ttggattttc tgaagtcgga cggattcgcc 5040

aacagaaatt ttattcagct gattcatgac gatagtctca ccttcaaaga ggacatacag 5100

aaggctcaag tgagtggtca aggggattcg ctgcatgaac acatcgcaaa cctcgcgggt 5160

tcaccggcca taaagaaagg aatccttcaa actgttaagg tcgttgatga gttggttaaa 5220

gtgatgggta ggcacaagcc cgaaaacata gtgatcgaga tggctcgcga aaatcagact 5280

acacaaaaag ggcagaagaa ctctcgcgag cggatgaaaa ggattgagga aggaatcaag 5340

gaactgggct cacagattct caaagagcat ccagtcgaaa acacacagct gcaaaatgag 5400

aagctctatc tttactatct ccaaaatggc cgggacatgt atgttgatca ggagcttgac 5460

atcaaccgtt tgtccgacta tgatgtggac cacattgtcc cgcaatcttt ccttaaggac 5520

gattcaatcg ataataaggt gttgacccgg agcgataaaa accgtggaaa gtctgacaat 5580

gtcccttcag aggaagtggt taagaagatg aagaactact ggagacaatt gctgaatgca 5640

aaactgatca cacagagaaa gttcgacaac ctcaccaaag cagagagagg tgggctcagt 5700

gaacttgata aagcgggctt cattaagcgt cagctcgttg agactagaca gatcacgaag 5760

catgtcgcgc agattttgga ttcgcggatg aacacgaagt acgacgagaa tgataaactg 5820

atacgtgaag tcaaggttat cactcttaag tccaaattgg tgagcgattt cagaaaggac 5880

ttccaattct ataaggtcag ggagatcaac aattatcatc acgctcacga tgcctacctt 5940

aatgctgttg tggggaccgc ccttattaag aaatacccta aattggagtc tgaattcgtt 6000

tacggggatt ataaggtcta cgacgttagg aaaatgatag ctaagagtga gcaggagatc 6060

ggtaaagcaa ctgcgaagta tttcttttac tcgaacatca tgaatttctt taagaccgag 6120

ataacgctgg caaatggcga aattagaaag aggcctctca tagagactaa cggtgagaca 6180

ggggaaatcg tctgggataa gggtagggac tttgcgacag tgcgcaaggt cctctctatg 6240

ccgcaagtta atattgtgaa gaaaaccgag gtgcagacgg gaggcttctc caaggaaagc 6300

atacttccca aacggaactc tgataagttg atcgctcgta agaaagattg ggaccctaag 6360

aaatatggtg ggttcgattc cccaactgtt gcttacagcg tgctggtcgt tgccaaggtc 6420

gagaagggta aatccaagaa actcaaaagc gttaaggaac tccttgggat tactatcatg 6480

gagagatctt cattcgaaaa gaatcctatc gactttcttg aggccaaagg atataaggaa 6540

gttaagaaag atctgataat caaactccca aagtactcat tgtttgagct ggaaaacggc 6600

aggaagcgca tgcttgcttc cgccggagtt ttgcagaaag ggaacgagtt ggctctgcct 6660

tctaagtatg ttaacttcct ctatcttgcc tctcattacg agaagctcaa aggctcacca 6720

gaggacaacg aacagaaaca actttttgtc gagcaacata agcactattt ggatgagatt 6780

atagaacaga tcagtgaatt ctcgaaaagg gttatccttg cagatgcgaa tcttgacaag 6840

gtgttgtctg catacaacaa acatagagat aagccgatca gggagcaagc ggaaaatatc 6900

attcacctct tcactcttac aaacttgggt gctcccgctg ccttcaagta ttttgatacc 6960

acgattgacc ggaaacgtta cacctcaacg aaggaggtgc tggatgccac cctcatccac 7020

caatctatta ccggactcta cgagactaga atcgatctct cacagctcgg cggggataaa 7080

agaccagcag cgacgaaaaa ggcaggacag gctaagaaga agaaagagct cggaggagga 7140

ggcacgggag gaggaggctc cgccgagtat gtgcgcgcgc tcttcgactt caacggcaat 7200

gacgaggagg atctcccttt caagaagggc gacatcctcc gcatccgcga taagccggag 7260

gagcagtggt ggaacgcaga ggactccgag ggcaagcggg gcatgatcct ggtgccatac 7320

gtcgagaagt acagcggcga ttacaaggac cacgatggcg actacaagga tcatgacatc 7380

gattacaagg acgatgacga taagtccggc gtcgacatga cggacgcgga gtatgtgcgc 7440

atccacgaga agctcgatat ctacaccttc aagaagcagt tcttcaacaa taagaagtcg 7500

gtgtcccatc ggtgctacgt cctcttcgag ctgaagcgca ggggagagcg ccgcgcctgc 7560

ttctggggct acgcggtgaa taagccgcag tcaggcacag agcgcggcat ccacgccgag 7620

atcttctcga tccggaaggt cgaggagtac ctccgcgaca acccaggcca gttcacgatc 7680

aattggtact ccagctggtc cccttgcgca gattgcgcag agaagatcct cgagtggtac 7740

aaccaggagc tgaggggcaa tggccatacc ctcaagatct gggcctgcaa gctgtactac 7800

gagaagaacg cgaggaatca gatcggcctc tggaacctgc gggataatgg cgtgggcctc 7860

aacgtgatgg tgtccgagca ctaccagtgc tgccgcaaga tcttcatcca gtcctcccac 7920

aatcagctga acgagaatag gtggctcgaa aagaccctga agcgcgccga gaagtggagg 7980

agcgagctgt ctatcatgat ccaggtcaag atcctgcaca ccacaaagtc accggcggtg 8040

ggcggcggcg gcagcgaatt ctccggcggc agcacgaacc tcagcgacat catcgagaag 8100

gagacaggca agcagctcgt gatccaggag tctatcctca tgctgcctga ggaggtggag 8160

gaggtcatcg gcaacaagcc ggagtccgat atcctcgtgc acaccgccta cgacgagtcg 8220

acagatgaga atgtcatgct cctgacctcc gacgcaccag agtacaagcc atgggcgctc 8280

gtgatccagg attccaacgg cgagaataag atcaagatgc tgtctggcgg ctccccgaag 8340

aagaagcgca aggtctagac tagtctgaaa tcaccagtct ctctctacaa atctatctct 8400

ctctataata atgtgtgagt agttcccaga taagggaatt agggttctta tagggtttcg 8460

ctcatgtgtt gagcatataa gaaaccctta gtatgtattt gtatttgtaa aatacttcta 8520

tcaataaaat ttctaattcc taaaaccaaa atccagtggg gcgcccgacc tgtactcgcg 8580

aaggttaact tacagagagt gtccgggcgc gcctggtgga tcgtccgcct aggctgcagt 8640

gcagcgtgac ccggtcgtgc ccctctctag agataatgag cattgcatgt ctaagttata 8700

aaaaattacc acatattttt tttgtcacac ttgtttgaag tgcagtttat ctatctttat 8760

acatatattt aaactttact ctacgaataa tataatctat agtactacaa taatatcagt 8820

gttttagaga atcatataaa tgaacagtta gacatggtct aaaggacaat tgagtatttt 8880

gacaacagga ctctacagtt ttatcttttt agtgtgcatg tgttctcctt tttttttgca 8940

aatagcttca cctatataat acttcatcca ttttattagt acatccattt agggtttagg 9000

gttaatggtt tttatagact aattttttta gtacatctat tttattctat tttagcctct 9060

aaattaagaa aactaaaact ctattttagt ttttttattt aataatttag atataaaata 9120

gaataaaata aagtgactaa aaattaaaca aatacccttt aagaaattaa aaaaactaag 9180

gaaacatttt tcttgtttcg agtagataat gccagcctgt taaacgccgt cgacgagtct 9240

aacggacacc aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg 9300

gcatctctgt cgctgcctct ggacccctct cgagagttcc gctccaccgt tggacttgct 9360

ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc 9420

ggcctcctcc tcctctcacg gcaccggcag ctacggggga ttcctttccc accgctcctt 9480

cgctttccct tcctcgcccg ccgtaataaa tagacacccc ctccacaccc tctttcccca 9540

acctcgtgtt gttcggagcg cacacacaca caaccagatc tcccccaaat ccacccgtcg 9600

gcacctccgc ttcaaggtac gccgctcgtc ctcccccccc ccccctctct accttctcta 9660

gatcggcgtt ccggtccatg gttagggccc ggtagttcta cttctgttca tgtttgtgtt 9720

agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc gacctgtacg 9780

tcagacacgt tctgattgct aacttgccag tgtttctctt tggggaatcc tgggatggct 9840

ctagccgttc cgcagacggg atcgatttca tgattttttt tgtttcgttg catagggttt 9900

ggtttgccct tttcctttat ttcaatatat gccgtgcact tgtttgtcgg gtcatctttt 9960

catgcttttt tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg ttctagatcg 10020

gagtagaatt ctgtttcaaa ctacctggtg gatttattaa ttttggatct gtatgtgtgt 10080

gccatacata ttcatagtta cgaattgaag atgatggatg gaaatatcga tctaggatag 10140

gtatacatgt tgatgcgggt tttactgatg catatacaga gatgcttttt gttcgcttgg 10200

ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt ctagatcgga gtagaatact 10260

gtttcaaact acctggtgta tttattaatt ttggaactgt atgtgtgtgt catacatctt 10320

catagttacg agtttaagat ggatggaaat atcgatctag gataggtata catgttgatg 10380

tgggttttac tgatgcatat acatgatggc atatgcagca tctattcata tgctctaacc 10440

ttgagtacct atctattata ataaacaagt atgttttata attattttga tcttgatata 10500

cttggatgat ggcatatgca gcagctatat gtggattttt ttagccctgc cttcatacgc 10560

tatttatttg cttggtactg tttcttttgt cgatgctcac cctgttgttt ggtgttactt 10620

ctgcaggagc tcatgaaaaa gcctgaactc accgcgacgt ctgtcgagaa gtttctgatc 10680

gaaaagttcg acagcgtctc cgacctgatg cagctctcgg agggcgaaga atctcgtgct 10740

ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg taaatagctg cgccgatggt 10800

ttctacaaag atcgttatgt ttatcggcac tttgcatcgg ccgcgctccc gattccggaa 10860

gtgcttgaca ttggggagtt tagcgagagc ctgacctatt gcatctcccg ccgttcacag 10920

ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg ctgttctaca accggtcgcg 10980

gaggctatgg atgcgatcgc tgcggccgat cttagccaga cgagcgggtt cggcccattc 11040

ggaccgcaag gaatcggtca atacactaca tggcgtgatt tcatatgcgc gattgctgat 11100

ccccatgtgt atcactggca aactgtgatg gacgacaccg tcagtgcgtc cgtcgcgcag 11160

gctctcgatg agctgatgct ttgggccgag gactgccccg aagtccggca cctcgtgcac 11220

gcggatttcg gctccaacaa tgtcctgacg gacaatggcc gcataacagc ggtcattgac 11280

tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg ccaacatctt cttctggagg 11340

ccgtggttgg cttgtatgga gcagcagacg cgctacttcg agcggaggca tccggagctt 11400

gcaggatcgc cacgactccg ggcgtatatg ctccgcattg gtcttgacca actctatcag 11460

agcttggttg acggcaattt cgatgatgca gcttgggcgc agggtcgatg cgacgcaatc 11520

gtccgatccg gagccgggac tgtcgggcgt acacaaatcg cccgcagaag cgcggccgtc 11580

tggaccgatg gctgtgtaga agtactcgcc gatagtggaa accgacgccc cagcactcgt 11640

ccgagggcaa agaaatagag tagatgccga ccgggatctg tcgatcgaca agctcgagtt 11700

tctccataat aatgtgtgag tagttcccag ataagggaat tagggttcct atagggtttc 11760

gctcatgtgt tgagcatata agaaaccctt agtatgtatt tgtatttgta aaatacttct 11820

atcaataaaa tttctaattc ctaaaaccaa aatccagtac taaaatccag atcccccgaa 11880

ttaattcggc gttaattcag cctgcaggac gcgtttaatt aagtgcacgc ggccgcctac 11940

ttagtcaaga gcctcgcacg cgactgtcac gcggccagga tcgcctcgtg agcctcgcaa 12000

tctgtaccta gtgtttaaac tatcagtgtt tgacaggata tattggcggg taaacctaag 12060

agaaaagagc gtttattaga ataacggata tttaaaaggg cgtgaaaagg tttatccgtt 12120

cgtccatttg tatgtgcatg ccaaccacag ggttcccctc gggatcaaag tactttgatc 12180

caacccctcc gctgctatag tgcagtcggc ttctgacgtt cagtgcagcc gtcttctgaa 12240

aacgacatgt cgcacaagtc ctaagttacg cgacaggctg ccgccctgcc cttttcctgg 12300

cgttttcttg tcgcgtgttt tagtcgcata aagtagaata cttgcgacta gaaccggaga 12360

cattacgcca tgaacaagag cgccgccgct ggcctgctgg gctatgcccg cgtcagcacc 12420

gacgaccagg acttgaccaa ccaacgggcc gaactgcacg cggccggctg caccaagctg 12480

ttttccgaga agatcaccgg caccaggcgc gaccgcccgg agctggccag gatgcttgac 12540

cacctacgcc ctggcgacgt tgtgacagtg accaggctag accgcctggc ccgcagcacc 12600

cgcgacctac tggacattgc cgagcgcatc caggaggccg gcgcgggcct gcgtagcctg 12660

gcagagccgt gggccgacac caccacgccg gccggccgca tggtgttgac cgtgttcgcc 12720

ggcattgccg agttcgagcg ttccctaatc atcgaccgca cccggagcgg gcgcgaggcc 12780

gccaaggccc gaggcgtgaa gtttggcccc cgccctaccc tcaccccggc acagatcgcg 12840

cacgcccgcg agctgatcga ccaggaaggc cgcaccgtga aagaggcggc tgcactgctt 12900

ggcgtgcatc gctcgaccct gtaccgcgca cttgagcgca gcgaggaagt gacgcccacc 12960

gaggccaggc ggcgcggtgc cttccgtgag gacgcattga ccgaggccga cgccctggcg 13020

gccgccgaga atgaacgcca agaggaacaa gcatgaaacc gcaccaggac ggccaggacg 13080

aaccgttttt cattaccgaa gagatcgagg cggagatgat cgcggccggg tacgtgttcg 13140

agccgcccgc gcacgtctca accgtgcggc tgcatgaaat cctggccggt ttgtctgatg 13200

ccaagctggc ggcctggccg gccagcttgg ccgctgaaga aaccgagcgc cgccgtctaa 13260

aaaggtgatg tgtatttgag taaaacagct tgcgtcatgc ggtcgctgcg tatatgatgc 13320

gatgagtaaa taaacaaata cgcaagggga acgcatgaag gttatcgctg tacttaacca 13380

gaaaggcggg tcaggcaaga cgaccatcgc aacccatcta gcccgcgccc tgcaactcgc 13440

cggggccgat gttctgttag tcgattccga tccccagggc agtgcccgcg attgggcggc 13500

cgtgcgggaa gatcaaccgc taaccgttgt cggcatcgac cgcccgacga ttgaccgcga 13560

cgtgaaggcc atcggccggc gcgacttcgt agtgatcgac ggagcgcccc aggcggcgga 13620

cttggctgtg tccgcgatca aggcagccga cttcgtgctg attccggtgc agccaagccc 13680

ttacgacata tgggccaccg ccgacctggt ggagctggtt aagcagcgca ttgaggtcac 13740

ggatggaagg ctacaagcgg cctttgtcgt gtcgcgggcg atcaaaggca cgcgcatcgg 13800

cggtgaggtt gccgaggcgc tggccgggta cgagctgccc attcttgagt cccgtatcac 13860

gcagcgcgtg agctacccag gcactgccgc cgccggcaca accgttcttg aatcagaacc 13920

cgagggcgac gctgcccgcg aggtccaggc gctggccgct gaaattaaat caaaactcat 13980

ttgagttaat gaggtaaaga gaaaatgagc aaaagcacaa acacgctaag tgccggccgt 14040

ccgagcgcac gcagcagcaa ggctgcaacg ttggccagcc tggcagacac gccagccatg 14100

aagcgggtca actttcagtt gccggcggag gatcacacca agctgaagat gtacgcggta 14160

cgccaaggca agaccattac cgagctgcta tctgaataca tcgcgcagct accagagtaa 14220

atgagcaaat gaataaatga gtagatgaat tttagcggct aaaggaggcg gcatggaaaa 14280

tcaagaacaa ccaggcaccg acgccgtgga atgccccatg tgtggaggaa cgggcggttg 14340

gccaggcgta agcggctggg ttgtctgccg gccctgcaat ggcactggaa cccccaagcc 14400

cgaggaatcg gcgtgacggt cgcaaaccat ccggcccggt acaaatcggc gcggcgctgg 14460

gtgatgacct ggtggagaag ttgaaggccg cgcaggccgc ccagcggcaa cgcatcgagg 14520

cagaagcacg ccccggtgaa tcgtggcaag cggccgctga tcgaatccgc aaagaatccc 14580

ggcaaccgcc ggcagccggt gcgccgtcga ttaggaagcc gcccaagggc gacgagcaac 14640

cagatttttt cgttccgatg ctctatgacg tgggcacccg cgatagtcgc agcatcatgg 14700

acgtggccgt tttccgtctg tcgaagcgtg accgacgagc tggcgaggtg atccgctacg 14760

agcttccaga cgggcacgta gaggtttccg cagggccggc cggcatggcc agtgtgtggg 14820

attacgacct ggtactgatg gcggtttccc atctaaccga atccatgaac cgataccggg 14880

aagggaaggg agacaagccc ggccgcgtgt tccgtccaca cgttgcggac gtactcaagt 14940

tctgccggcg agccgatggc ggaaagcaga aagacgacct ggtagaaacc tgcattcggt 15000

taaacaccac gcacgttgcc atgcagcgta cgaagaaggc caagaacggc cgcctggtga 15060

cggtatccga gggtgaagcc ttgattagcc gctacaagat cgtaaagagc gaaaccgggc 15120

ggccggagta catcgagatc gagctagctg attggatgta ccgcgagatc acagaaggca 15180

agaacccgga cgtgctgacg gttcaccccg attacttttt gatcgatccc ggcatcggcc 15240

gttttctcta ccgcctggca cgccgcgccg caggcaaggc agaagccaga tggttgttca 15300

agacgatcta cgaacgcagt ggcagcgccg gagagttcaa gaagttctgt ttcaccgtgc 15360

gcaagctgat cgggtcaaat gacctgccgg agtacgattt gaaggaggag gcggggcagg 15420

ctggcccgat cctagtcatg cgctaccgca acctgatcga gggcgaagca tccgccggtt 15480

cctaatgtac ggagcagatg ctagggcaaa ttgccctagc aggggaaaaa ggtcgaaaag 15540

gtctctttcc tgtggatagc acgtacattg ggaacccaaa gccgtacatt gggaaccgga 15600

acccgtacat tgggaaccca aagccgtaca ttgggaaccg gtcacacatg taagtgactg 15660

atataaaaga gaaaaaaggc gatttttccg cctaaaactc tttaaaactt attaaaactc 15720

ttaaaacccg cctggcctgt gcataactgt ctggccagcg cacagccgaa gagctgcaaa 15780

aagcgcctac ccttcggtcg ctgcgctccc tacgccccgc cgcttcgcgt cggcctatcg 15840

cggccgctgg ccgctcaaaa atggctggcc tacggccagg caatctacca gggcgcggac 15900

aagccgcgcc gtcgccactc gaccgccggc gcccacatca aggcaccctg cctcgcgcgt 15960

ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt 16020

ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg 16080

tgtcggggcg cagccatgac ccagtcacgt agcgatagcg gagtgtatac tggcttaact 16140

atgcggcatc agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca 16200

gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc 16260

tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 16320

tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 16380

ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 16440

agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 16500

accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 16560

ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 16620

gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 16680

ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 16740

gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 16800

taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 16860

tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 16920

gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 16980

cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 17040

agtggaacga aaactcacgt taagggattt tggtcatgca ttctaggtac taaaacaatt 17100

catccagtaa aatataatat tttattttct cccaatcagg cttgatcccc agtaagtcaa 17160

aaaatagctc gacatactgt tcttccccga tatcctccct gatcgaccgg acgcagaagg 17220

caatgtcata ccacttgtcc gccctgccgc ttctcccaag atcaataaag ccacttactt 17280

tgccatcttt cacaaagatg ttgctgtctc ccaggtcgcc gtgggaaaag acaagttcct 17340

cttcgggctt ttccgtcttt aaaaaatcat acagctcgcg cggatcttta aatggagtgt 17400

cttcttccca gttttcgcaa tccacatcgg ccagatcgtt attcagtaag taatccaatt 17460

cggctaagcg gctgtctaag ctattcgtat agggacaatc cgatatgtcg atggagtgaa 17520

agagcctgat gcactccgca tacagctcga taatcttttc agggctttgt tcatcttcat 17580

actcttccga gcaaaggacg ccatcggcct cactcatgag cagattgctc cagccatcat 17640

gccgttcaaa gtgcaggacc tttggaacag gcagctttcc ttccagccat agcatcatgt 17700

ccttttcccg ttccacatca taggtggtcc ctttataccg gctgtccgtc atttttaaat 17760

ataggttttc attttctccc accagcttat ataccttagc aggagacatt ccttccgtat 17820

cttttacgca gcggtatttt tcgatcagtt ttttcaattc cggtgatatt ctcattttag 17880

ccatttatta tttccttcct cttttctaca gtatttaaag ataccccaag aagctaatta 17940

taacaagacg aactccaatt cactgttcct tgcattctaa aaccttaaat accagaaaac 18000

agctttttca aagttgtttt caaagttggc gtataacata gtatcgacgg agccgatttt 18060

gaaaccgcgg tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 18120

ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 18180

ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 18240

gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 18300

ctggct 18306

<210>2

<211>1423

<212>PRT

<213>人工序列(Artificial Sequence)

<400>2

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Thr Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Leu Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ile

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Lys Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Asp Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Ile Gln Leu Ile

725 730 735

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1010 1015 1020

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1025 1030 1035

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1040 1045 1050

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1055 1060 1065

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1070 1075 1080

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1085 1090 1095

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1100 1105 1110

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1115 1120 1125

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1130 1135 1140

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1145 1150 1155

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1160 1165 1170

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1175 1180 1185

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1190 1195 1200

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1205 1210 1215

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1220 1225 1230

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Gly Val Leu Gln Lys Gly Asn

1250 1255 1260

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1265 1270 1275

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1280 1285 1290

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1295 1300 1305

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1310 1315 1320

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1325 1330 1335

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1340 1345 1350

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1355 1360 1365

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1370 1375 1380

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1385 1390 1395

Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr

1400 1405 1410

Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1415 1420

<210>3

<211>208

<212>PRT

<213>人工序列(Artificial Sequence)

<400>3

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser Glu Leu Ser

180 185 190

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

<210>4

<211>98

<212>PRT

<213>人工序列(Artificial Sequence)

<400>4

Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly

1 5 10 15

Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val

20 25 30

Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr

35 40 45

Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp

50 55 60

Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly

65 70 75 80

Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg

85 90 95

Lys Val

<210>5

<211>76

<212>DNA

<213>人工序列(Artificial Sequence)

<400>5

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtgc 76

<210>6

<211>5010

<212>DNA

<213>人工序列(Artificial Sequence)

<400>6

atgtccagcg agacaggacc agtggcagtc gacccaacac tgcgcaggcg gatcgagcca 60

cacgagttcg aggtgttctt cgatccgagg gagctccgga aggagacatg cctcctgtac 120

gagatcaact ggggcggccg ccactctatc tggaggcata cctcacagaa cacaaataag 180

catgtggagg tcaacttcat cgagaagttc accacagagc ggtacttctg cccgaatacg 240

cgctgctcca tcacctggtt cctgtcgtgg tccccatgcg gagagtgctc gagggcaatc 300

acggagttcc tctcccgcta cccgcacgtc accctgttca tctacatcgc acggctctac 360

caccatgcgg acccgcggaa taggcagggc ctccgcgatc tgatctcttc aggcgtgaca 420

atccagatca tgacggagca ggagtcaggc tactgctgga ggaacttcgt caattacagc 480

ccatctaacg aggcacactg gccgcgctac ccgcatctct gggtgcgcct ctacgtgctc 540

gagctgtact gcatcatcct cggcctgccg ccatgcctca atatcctgcg caggaagcag 600

ccgcagctga cgttcttcac catcgccctc cagagctgcc actaccagcg gctccctccg 660

catatcctgt gggcgacagg cctcaagtca ggctcggaga cacctggcac gtccgagagc 720

gccaccccgg agtctatgga ctacaaggac cacgacgggg attacaaaga ccacgacata 780

gactacaagg atgacgatga caaaatggca ccgaagaaaa aaaggaaggt cggaatccat 840

ggcgttccag ctgccgataa gaaatattcc atcggactcg ccattggcac gaatagcgtc 900

ggatgggctg ttattactga tgagtacaaa gttccgtcta agaagttcaa ggtgctgggc 960

aacacagacc gccacagcat aaagaaaaat ctcatcggtg cactcctttt cgatagtggg 1020

gagactgcag aagcgacaag attgaaaagg actgcgagaa ggcgctatac acggcgtaag 1080

aatagaatct gctaccttca ggagattttc tctaacgaaa tggctaaggt cgatgacagt 1140

ttctttcata gacttgagga atcgttcttg gttgaggagg ataagaaaca tgagaggcac 1200

ccgatatttg gaaacatcgt ggatgaggtc gcatatcatg aaaagtaccc cacaatctac 1260

cacctgagaa agaaactcgt tgattccacc gacaaagcgg atttgagact catctacctc 1320

gctcttgccc atatgataaa gttccgcgga cactttctga tcgagggcga cctcaaccct 1380

gataatagcg acgtcgataa gctcttcatc cagttggttc aaacctacaa tcagctcttt 1440

gaggaaaacc caattaatgc tagtggagtg gatgcaaaag cgatactgtc ggccagactc 1500

tccaagagca gaaggttgga gaacctgatc gctcaacttc ctggagaaaa gaaaaacggt 1560

ctttttggga atttgattgc cttgtctctg ggcctcacac caaacttcaa gtcaaatttt 1620

gacctcgctg aggataccaa acttcagttg tctaaggata cctatgatga cgatcttgac 1680

aatttgctgg cacaaattgg cgaccagtac gcggatctgt tcctcgcagc gaagaatctg 1740

agtgatgcta ttctcctttc ggacatactc agggttaaca ctgagatcac aaaagcacct 1800

ttgagtgcgt cgatgattaa gctgtatgat gaacatcacc aagacctcac tttgctgaag 1860

gcccttgtgc ggcagcaatt gccagagaag tacaaagaaa tcttctttga ccaatctaag 1920

aacggatacg ctggctatat tgatggagga gcttctcagg aggaattcta taagtttatc 1980

aaacctatac ttgagaagat ggatggtaca gaggaactcc ttgttaaatt gaacagagaa 2040

gatttgctgc gcaagcaacg gacctttgac aacggaatca ttccgcatca gatacacctc 2100

ggcgagcttc atgccatcct tcgccggcag gaagatttct accccttttt gaaggacaac 2160

cgcgagaaga tagaaaaaat ccttacgttc cggattcctt actatgtggg tccattggca 2220

agggggaatt cccgctttgc gtggatgact cggaaaagcg aggaaactat cacaccgtgg 2280

aacttcgaga aagttgtgga caagggagct tctgcccaat cattcattga gaggatgact 2340

aacttcgata agaacctgcc gaacgagaaa gttctcccca agcactccct cctttacgag 2400

tatttcaccg tgtataacga acttacgaag gttaaatacg tgactgaggg tatgaggaag 2460

ccagcattct tgagcgggga tcaaaagaaa gcgattgttg atttgctgtt taaaactaat 2520

cgcaaggtga cagtcaagca gctcaaagag gattatttca agaaaattga atgtttcgac 2580

tctgtggaga tatcaggagt cgaagatagg tttaacgctt cccttggcac ataccatgac 2640

ctccttaaga tcattaagga caaagatttc ctggataacg aggaaaatga ggacatcctc 2700

gaagatattg ttcttacctt gacgctgttt gaggatcgcg aaatgatcga ggaacggctt 2760

aagacgtatg ctcacttgtt cgacgataag gttatgaagc agctcaagcg tagaaggtac 2820

actggatggg gccgtctgtc tagaaagctc atcaacggaa tacgtgataa acaaagtggc 2880

aagacaattt tggattttct gaagtcggac ggattcgcca acagaaattt tattcagctg 2940

attcatgacg atagtctcac cttcaaagag gacatacaga aggctcaagt gagtggtcaa 3000

ggggattcgc tgcatgaaca catcgcaaac ctcgcgggtt caccggccat aaagaaagga 3060

atccttcaaa ctgttaaggt cgttgatgag ttggttaaag tgatgggtag gcacaagccc 3120

gaaaacatag tgatcgagat ggctcgcgaa aatcagacta cacaaaaagg gcagaagaac 3180

tctcgcgagc ggatgaaaag gattgaggaa ggaatcaagg aactgggctc acagattctc 3240

aaagagcatc cagtcgaaaa cacacagctg caaaatgaga agctctatct ttactatctc 3300

caaaatggcc gggacatgta tgttgatcag gagcttgaca tcaaccgttt gtccgactat 3360

gatgtggacc acattgtccc gcaatctttc cttaaggacg attcaatcga taataaggtg 3420

ttgacccgga gcgataaaaa ccgtggaaag tctgacaatg tcccttcaga ggaagtggtt 3480

aagaagatga agaactactg gagacaattg ctgaatgcaa aactgatcac acagagaaag 3540

ttcgacaacc tcaccaaagc agagagaggt gggctcagtg aacttgataa agcgggcttc 3600

attaagcgtc agctcgttga gactagacag atcacgaagc atgtcgcgca gattttggat 3660

tcgcggatga acacgaagta cgacgagaat gataaactga tacgtgaagt caaggttatc 3720

actcttaagt ccaaattggt gagcgatttc agaaaggact tccaattcta taaggtcagg 3780

gagatcaaca attatcatca cgctcacgat gcctacctta atgctgttgt ggggaccgcc 3840

cttattaaga aataccctaa attggagtct gaattcgttt acggggatta taaggtctac 3900

gacgttagga aaatgatagc taagagtgag caggagatcg gtaaagcaac tgcgaagtat 3960

ttcttttact cgaacatcat gaatttcttt aagaccgaga taacgctggc aaatggcgaa 4020

attagaaaga ggcctctcat agagactaac ggtgagacag gggaaatcgt ctgggataag 4080

ggtagggact ttgcgacagt gcgcaaggtc ctctctatgc cgcaagttaa tattgtgaag 4140

aaaaccgagg tgcagacggg aggcttctcc aaggaaagca tacttcccaa acggaactct 4200

gataagttga tcgctcgtaa gaaagattgg gaccctaaga aatatggtgg gttcgattcc 4260

ccaactgttg cttacagcgt gctggtcgtt gccaaggtcg agaagggtaa atccaagaaa 4320

ctcaaaagcg ttaaggaact ccttgggatt actatcatgg agagatcttc attcgaaaag 4380

aatcctatcg actttcttga ggccaaagga tataaggaag ttaagaaaga tctgataatc 4440

aaactcccaa agtactcatt gtttgagctg gaaaacggca ggaagcgcat gcttgcttcc 4500

gccggagttt tgcagaaagg gaacgagttg gctctgcctt ctaagtatgt taacttcctc 4560

tatcttgcct ctcattacga gaagctcaaa ggctcaccag aggacaacga acagaaacaa 4620

ctttttgtcg agcaacataa gcactatttg gatgagatta tagaacagat cagtgaattc 4680

tcgaaaaggg ttatccttgc agatgcgaat cttgacaagg tgttgtctgc atacaacaaa 4740

catagagata agccgatcag ggagcaagcg gaaaatatca ttcacctctt cactcttaca 4800

aacttgggtg ctcccgctgc cttcaagtat tttgatacca cgattgaccg gaaacgttac 4860

acctcaacga aggaggtgct ggatgccacc ctcatccacc aatctattac cggactctac 4920

gagactagaa tcgatctctc acagctcggc ggggataaaa gaccagcagc gacgaaaaag 4980

gcaggacagg ctaagaagaa gaaagagctc 5010

<210>7

<211>229

<212>PRT

<213>人工序列(Artificial Sequence)

<400>7

Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg

1 5 10 15

Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu

20 25 30

Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His

35 40 45

Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val

50 55 60

Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr

65 70 75 80

Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys

85 90 95

Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu

100 105 110

Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg

115 120 125

Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met

130 135 140

Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser

145 150 155 160

Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg

165 170 175

Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys

180 185 190

Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile

195 200 205

Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp

210 215 220

Ala Thr Gly Leu Lys

225

<210>8

<211>732

<212>DNA

<213>人工序列(Artificial Sequence)

<400>8

aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60

gattcccggc tggtgcatca ggccgacgat gacgcacgtt tcagagctat gctggaaaca 120

gcatagcaag ttgaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 180

tgcaacaaag caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg 240

ttcgattccc ggctggtgca gccaagcgca cgctccggga gtttcagagc tatgctggaa 300

acagcatagc aagttgaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt 360

cggtgcaaca aagcaccagt ggtctagtgg tagaatagta ccctgccacg gtacagaccc 420

gggttcgatt cccggctggt gcacgacatg atgacggagt acggtttcag agctatgctg 480

gaaacagcat agcaagttga aataaggcta gtccgttatc aacttgaaaa agtggcaccg 540

agtcggtgca acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga 600

cccgggttcg attcccggct ggtgcacacc ttcaacccgc tgcagagttt cagagctatg 660

ctggaaacag catagcaagt tgaaataagg ctagtccgtt atcaacttga aaaagtggca 720

ccgagtcggt gc 732

37页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：一种农杆菌介导的沟叶结缕草遗传转化方法

xCas9n-epBE碱基编辑系统在基因编辑中的应用

相关技术

网友询问留言