一类5-11双环二倍半萜骨架化合物及其制备
阅读说明:本技术 一类5-11双环二倍半萜骨架化合物及其制备 (5-11 bicyclic sesterterpene skeleton compounds and preparation thereof ) 是由 刘雪婷 蒋岚 杨欢婷 张立新 黎晓莹 吕康杰 张雪 朱国良 王芷馨 于 2021-06-25 设计创作,主要内容包括:本发明提供了一类5-11双环二倍半萜骨架化合物及其制备,Nigtetraene的结构式如下所示,其合成酶NnNS的氨基酸序列如SEQ ID NO.3所示,合成基因为从CS12199菌株(Nectria.nigrescens 12199)基因组中克隆得到,多核苷酸序列如SEQ ID NO.1所示。NnNS蛋白具有催化底物链长延伸和结构环化的功能,能够辅助Nigtetraene类化合物母核合成。本发明为5-11双环二倍半萜化合物的生物合成提供了新的资源,为该类化合物种类的合成提供一种选择。(The invention provides a 5-11 double-ring sesterterpene skeleton compound and a preparation method thereof, wherein the structural formula of Nigtetraene is shown as follows, the amino acid sequence of synthetase NnNS is shown as SEQ ID NO.3, a synthetic gene is obtained by cloning from a CS12199 strain (Nectria. nigrescens 12199) genome, and a polynucleotide sequence is shown as SEQ ID NO. 1. The NnNS protein has the functions of catalyzing the chain length extension and structural cyclization of a substrate, and can assist the synthesis of the mother nucleus of the Nigtetraene compound. The invention is 5-11 bicyclicThe biosynthesis of the sesquiterpene compound provides a new resource, and a choice is provided for the synthesis of the compound types.)
技术领域
本发明属于基因工程技术领域,具体涉及一种具体涉及一种从Nectrianigrescens 12199 中克隆得到的5-11双环二倍半萜骨架化合物Nigtetraene合成基因NnNS及其应用。
背景技术
萜类化合物是一种由异戊二烯或异戊烷以各种方式结合而形成的一类小分子化合物, 也是天然产物中最大的一类化合物,迄今为止已从植物、动物及微生物中发现了8万多种 1。萜类化合物一般可根据所含异戊二烯单位数目的不同分为单萜(C10)、倍半萜(C15)、二萜(C20)、二倍半萜(C25)、三萜(C30)等。其中二倍半萜数量不足萜类总数的2%, 尤为值得关注2。目前绝大多数的二倍半萜是从海洋生物海绵中提取分离得到,但也存在 于地衣、真菌、昆虫分泌物、植物中。二倍半萜化合物具有广谱的生理活性,如ophiobolins 类二倍半萜化合物ophiobolins A是一种重要的钙调蛋白抑制剂3,同时也具有抗疟疾和抗 脑胶质瘤活性,其衍生物3-anhydro-6-hydroxyophiobolin A能够促进PC12细胞α突触蛋白 的降解,在帕金森病的治疗中有潜在应用4。terretonins类二倍半萜化合物terretonins E和terretonins F具有抑制线粒体呼吸链的功能5。除此之外,还具有抗菌6、抑制受体7等活性。1965年至今共发现了70多种丝状真菌来源的二倍半萜化合物,简练的结构和多样的生物活性使其在生物医学等方面都具有良好的应用前景8。
萜类化合物起始于两个C5单元的同分异构体二甲基烯丙基焦磷酸(Dimethylallyl pyrophosphate,DMAPP)与异戊烯基二磷酸(Isopentenylpyrophosphate,IPP),经过在异 戊烯基转移酶(Prenyltransferase,PTs)的催化下链延伸形成链状多聚异戊烯基焦磷酸前体, 后在萜类环化酶(Terpene cyclase,TCs)的催化下环化形成萜类骨架并在多种后修饰酶 的催化反应下形成具有不同环化结构的终产物。而真菌来源的二倍半萜大多是由一种特殊 的双功能萜合酶(Bifunctional terpenesynthases,简称为BFTSs)催化生成,这类酶同时具 备异戊二烯转移酶和萜类环化酶,分别催化聚异戊烯基焦磷酸链延伸与环化。自2007年 日本Sassa团队从植物病原真菌Phomopsis amygdali中挖掘到了双功能萜合酶PaFS9后, 截止目前共有22例BFTSs被报道。
通过传统的化学合成方法得到萜类化合物的过程中存在操作步骤繁琐、反应条件不稳 定以及对环境不友好等缺点,最为关键的是其在获取新萜类骨架方面存在一定局限性。但 近些年来,随着基因组测序技术的更新迭代以及生物信息学的高速发展,人们发现微生物 在生产萜类化合物方面具有巨大潜力。因此在易于操作且遗传背景清晰的异源宿主中重构 生物合成基因簇进行异源表达,可获得大量新骨架二倍半萜化合物及其衍生物。这不仅是 丰富了天然产物资源库,更是为发现新药物提供了更多的选择。目前常用的适用于真菌次 级代谢产物的异源表达宿主包括原核生物表达系统、酵母表达系统以及丝状真菌表达系统 10。原核生物表达系统如大肠杆菌,由于其无法剪切真核基因中的内含子,可应用于生物 合成途径中部分酶的过表达及功能鉴定。酵母表达系统如酿酒酵母,其分泌途径能够进行 正确的蛋白质加工和翻译后修饰,可应用于真菌天然产物生物合成机制的解析。丝状真菌 表达系统如米曲霉,其可自发完成基因中内含子的正确剪切工作,可应用于真菌天然产物 的生物合成途径解析和异源生产。Oikawa教授课题组在米曲霉里成功表达了二萜化合物 pleuromutilin11、倍半萜化合物(-)-Terpestacin12等天然萜类产物。
发明内容
本发明依托上述研究进行,提供了一类5-11双环二倍半萜骨架化合物、其合成酶、合成酶的编码基因、以及化合物的异源表达方法。
本发明的思路如下:在挖掘菌株N.nigrescens 12199代谢产物5-11双环二倍半萜类化 合物的生物合成过程中,通过对基因基因功能分析,得知NnNS基因与萜类合成相关,说 明NnNS基因参与了5-11双环二倍半萜类化合物的生物合成。进一步通过异源表达NnNS基因获取NnNS蛋白进行体外酶促反应,验证了NnNS基因是一种5-11双环二倍半萜化 合物Nigtetraene的合成基因。
本发明的首要目的在于提供5-11双环二倍半萜骨架化合物的结构;第二目的在于提 供合成该化合物的酶及基因;第三目的在于提供异源表达5-11双环二倍半萜骨架化合物 的方法。
为了实现上述目的,本发明所采用的技术方案如下:
本发明的第一方面,提供5-11双环二倍半萜骨架化合物Nigtetraene,其分子式为C25H40,结构式如下所示:
本发明的第二方面,提供了上述5-11双环二倍半萜骨架化合物的合成酶NnNS,该合 成酶的氨基酸序列如SEQ ID NO.3所示,其N端和C端分别负责萜类环化和异戊烯基转移功能。
进一步,该合成酶含有两个保守结构域:萜类环化酶结构域含有两个用来识别Mg2+和底物的特征性保守基序DDVIE和NDYFSWDKE,E-IPPS结构域也含有两个具有相似 功能的特征性保守基序DDVED和DDYLN。
本发明的第二方面,提供了编码上述合成酶的基因,从CS12199菌株(N.nigrescens 12199)基因组中克隆得到,其多核苷酸序列如SEQ ID NO.1所示。该CS12199菌株保 藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为CGMCCNo.21943。 该基因含有7个内含子,其cDNA大小为2205bp,序列如SEQ ID NO.2所示。
本发明的第三方面,提供了一种5-11双环二倍半萜骨架化合物重组表达载体,该重 组表达载体为运载有上述合成酶或基因的真核或原核表达载体,如大肠杆菌、酵母系统以 及丝状真菌。
本发明的第四方面,提供了一种5-11双环二倍半萜骨架化合物重组表达宿主细胞, 含有如上所述的重组表达载体,实现化合物异源表达。
本发明的第五方面,提供上述合成酶或基因在合成萜类化合物中的应用,具体为在合 成5-11双环二倍半萜骨架化合物中的应用。
本发明的第六方面,提供了一种异源表达5-11双环二倍半萜骨架化合物的方法,其 特征在于,包括如下步骤:
A、NnNS基因异源表达载体的构建
通过PCR技术,以N.nigrescens 12199基因组为模板扩增得到含有NnNS的基因序列, 扩增所用到的引物序列分别如SEQ ID NO.4和SEQ ID NO.5所示;
扩增所用到的引物序列:
NnNS-F:cgGAATTCGAGCTCGATGGCTCCATTGTCGATCAT;
NnNS-R:actacaGATCCCCGGTCATCGAGCTTCAATTTCCAGCCG。
将扩增得到的片段通过同源重组与pUARA2载体连接,构建pUARA2-NnNS表达质粒,并将该连接产物转化到大肠杆菌DH10B中,筛选阳性转化子,培养后提取质粒PCR验证, 获取pUARA2-NnNS质粒,
B、原生质体转化
培养米曲霉Aspergillus oryzae NSAR1并收集原生质体,与pUARA2-NnNS质粒混匀, 培养后将长出的转化子进行PCR验证,阳性转化子即为NnNS异源表达菌株AO-NnNS,
C、异源表达菌株AO-NnNS培养及产物分离
接种异源表达菌株AO-NnNS经pUARA2质粒筛选液体培养基筛选后,进行发酵培养,对得到的发酵粗提物首先采用正向硅胶柱层析方法进行分离纯化,TLC快速检测各流份,合并斑点相同流份,减压浓缩旋蒸至干并转至已称重样品瓶中,称量样品并记录重量。
本发明的有益效果如下:
本发明发现了合成5-11双环二倍半萜骨架化合物Nigtetraene的NnNS基因,其编码 的NnNS蛋白能够辅助Nigtetraene类化合物母核合成。本发明为5-11双环二倍半萜化合物的生物合成提供了新的资源,为该类化合物合成提供一种选择。
本发明发现的NnNS基因催化产生新的5-11双环二倍半萜骨架化合物,为丰富天然产 物化合物库、发现新抗生素提供了宝贵的先导化合物资源。
附图说明
图1为本发明化合物Nigtetraene的HR-EI-MS谱图。
图2为本发明化合物Nigtetraene溶于Benzene-d6中的1H-NMR谱图。
图3为本发明化合物Nigtetraene溶于Benzene-d6中的13C-NMR谱图。
图4为本发明化合物Nigtetraene溶于Benzene-d6中的1H-1H COSY谱。
图5为本发明化合物Nigtetraene溶于Benzene-d6中的HSQC谱图。
图6为本发明化合物Nigtetraene溶于Benzene-d6中的HMBC谱图。
图7为本发明化合物Nigtetraene溶于Benzene-d6中的NOESY谱图。
图8为Nectria nigrescens 12199中NnNS基因编码的蛋白与已报道的蛋白的氨基酸序 列比对结果图。
菌种保藏信息:CS12199(Nectria nigrescens 12199)保藏于中国微生物菌种保藏管理 委员会普通微生物中心,保藏地址为北京市朝阳区北辰西路1号院3号,保藏日期为2021 年04月02号,保藏编号为CGMCC No.21943。
具体实施方式
下面结合本发明的附图和实施例对本发明的实施作详细说明,以下实施例是在以本发 明技术方案为前提下进行实施,给出了详细的实施方式和具体操作过程,但本发明的保护 范围不限于下述的实施例。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
本发明所提供的5-11双环二倍半萜化合物Nigtetraene合成基因,是从Nectrianigrescens 12199中克隆得到,命名为NnNS基因,其基因序列如SEQ ID NO.1所示。NnNS基因含有7 个内含子,其cDNA大小为2205bp,序列如SEQ ID NO.2所示。NnNS基因编码的蛋白,命 名为NnNS蛋白,其氨基酸序列如SEQ ID NO.3所示。
NnNS蛋白属于嵌合型萜类合成酶,其N端和C端分别负责萜类环化和异戊烯基转移功 能。NnNS蛋白含有两个保守结构域,其中萜类环化酶结构域含有两个用来识别Mg2+和底物的特征性保守基序DDVIE和NDYFSWDKE,E-IPPS结构域也含有两个具有相似功能的特 征性保守基序DDVED和DDYLN(图8)。
实施例1:一种5-11双环二倍半萜化合物Nigtetraene合成基因的异源表达及5-11双环二 倍半萜骨架化合物的结构鉴定
利用异源表达的方法,将Nectria nigrescens 12199菌体中的NnNS基因通过构建表达质 粒转入宿主米曲霉中,检测异源表达菌株产物生产情况。所用到培养基配方如表1。
表1 实施例所用到培养基配方
1.NnNS基因源表达载体的构建
(1)通过PCR技术,以N.nigrescens 12199基因组为模板扩增得到含有NnNS的基因序列。扩增所用到的引物序列:
NnNS-F:cgGAATTCGAGCTCGATGGCTCCATTGTCGATCAT(SEQ ID NO.4);
NnNS-R:actacaGATCCCCGGTCATCGAGCTTCAATTTCCAGCCG(SEQ ID NO.5)。
(2)将扩增得到的片段通过同源重组与pUARA2载体连接,构建pUARA2-NnNS表 达质粒,该载体NnNS两侧与pUARA2载体具有一致的同源序列。
(3)连接产物转化到大肠杆菌DH10B中,通过氨苄青霉素筛选阳性转化子。液体培养阳性转化子,提取质粒PCR验证,获取pUARA2-NnNS质粒。
2.原生质体的转化
(1)将米曲霉Aspergillus oryzae NSAR1涂于PDA平板,30℃培养7d。
(2)收集孢子于10mL 0.1%Tween-80(一般需要收集1个平板的抱子),用血球计数板 计数。接种约107个孢子于50mL DPY中,30℃、220rpm培养2-3d。
(3)称量100mg Yatalase,加入solution 0溶解,20ml用0.22μm滤膜过滤灭菌,加入 到50ml离心管中。
(4)收集菌体。将培养好的100ml菌丝体倒入到P250玻璃过滤器中,去除培养基,用灭菌水清洗(或0.8M NaCl)3~5次,用灭菌药勺将水分挤干去除,然后将压干的菌体加 入到Yatalase溶液中。30℃,200rpm震荡培养1-2小时,至球状菌丝体消失上清明显秽浊 状为止。
(5)用Miracloth滤布过滤消化好的菌液,收集原生质体,转到新50ml离心管中,4℃, 800g,5min离心。
(6)去除上清液,加入20ml,0.8M NaCl再悬浮清洗,4℃,800g,5min离心(清 洗两次)。去除上清液,加10ml,0.8M NaCl。用细菌计数器在显微镜下数原生质体的数 目。原生质体数目=总计数/80×400ml×104×稀释倍数。
(7)将原生质体浓度调成2×108cell/ml。(sol 2/sol 3=4/1),依据菌体生长情况可收 获0.5ml-2ml原生质体不等。
(8)取200μl的原生质体溶液移至新的50ml的离心管中,加入10μg表达质粒pUARA2-NnNS,轻轻地混匀。在冰上静置20min。期间将灭菌好的Top agar,在50℃水 浴中保温。
(9)往(8)的混悬液中加入1ml的sol 3,用枪头轻轻的混匀。在室温下静置20min。加入10ml的sol 2,轻轻混匀。
(10)4℃,800g,10min离心,除去上清,加入1ml的sol 2,用移液枪轻轻地混悬, 加入200μl到pUARA2质粒筛选固体培养基的中央(x3板)。在培养皿的周围迅速加入 5ml 50℃保温的top agar,快速混匀。平板表面充分干燥后,用parafilm缠好,盖朝下,进 行30℃培养3-7天。
(11)每平板挑2-3个克隆,共8个。将长出的转化子进行PCR验证,阳性转化子即为NnNS异源表达菌株AO-NnNS。
3、异源表达菌株AO-NnNS表达产物的检测
(1)接种异源表达菌株AO-NnNS于pUARA2质粒筛选液体培养基,30℃培养3d。
(2)8000rpm离心10min收发酵菌体,加入100ml等体积80%丙酮后超声破碎20min后,8000rpm离心10min,取上清。
(3)用2倍体积的乙酸乙酯萃取1次,用旋转蒸发仪旋干后用15mL甲醇(色谱级)溶解。
(4)取1mL甲醇溶液,经0.22μm滤膜过滤后置于色谱瓶中,即为GC-MS和LC-MS 样品。
(5)将样品进行GC-MS检测:采用Agilent-HP-5MS色谱柱,起始温度60℃,以15℃/min 的速度升至310℃,再以5℃/min的速度升至310℃,保持13min。GC-MS方法参数如下:Sample模块:进样前后洗针次数5次,样品洗针次数2次,粘度补偿时间0.2s,进样模式 为normal。GC模块:柱温50℃,进样温度270℃,进样模式为不分流(splitness),载气 为氦气,流速控制模式为线性,总流速10mL/min。MS模块:MS离子源温度230℃,界 面温度270℃,溶剂切除时间2.5min采集时间3min-60min,采集模式为全扫描,event time 设置为0.3s,扫描速度为2000,扫描核质比为40-600Da。
(7)将样品进行LC-MS检测:采用Cholester色谱柱,流动相A相-0.1%甲酸水,B相-乙腈,流速为1mL/min,30min内流动相乙腈的比例由5%上升到100%,然后维持6min, 之后10s内流动相乙腈的比例降至5%,然后维持4min 50s。
4、异源表达重组菌株AO-NnNS二倍半萜骨架产物分离纯化及鉴定
AO-NnNS共发酵10L,得到约2g粗提物。对得到的发酵粗提物首先采用正向硅胶柱层析方法进行分离纯化。采用干法上柱,石油醚等度洗脱,每10mL流出液收集一管,共 收集得到18个流份,TLC快速检测各流份,合并斑点相同流份,减压浓缩旋蒸至干并转 至已称重样品瓶中,称量样品并记录重量。HPLC分析各流份组分,精确定位目标流份。 优化制备条件,选用Cholester半制备色谱柱制备目标化合物,流动相:A相-0.1%甲酸水; B相-乙腈,流速为4mL/min,95%乙腈甲酸等度,初始进样10μL,在保证峰型不变的基 础上,逐渐加大进样量至80μL,目标二倍半萜化合物峰会在20min左右出现,在峰出现 的时候将流出溶液接到锥形瓶中即可。对制备到的化合物TLC及HPLC进行纯度检验。
分离的二倍半萜骨架化合物的NMR测试采用Bruker 600MHz(1H 600MHz;13C 150MHz)。二倍半萜骨架化合物的溶剂为Benzene-d6,NMR谱仪器分辨率为600MHz,先进 行1HNMR和13C NMR的测定,将其与数据库中的数据做对比,若为新结构,则再补全 HSQC,COSY,HMBC谱图解谱确定具体结构。
5、鉴定二倍半萜骨架化合物Nigtetraene。
将上述得到的二倍半萜骨架化合物Nigtetraene进行鉴定:
(1)外观:为透明油脂状。
(2)溶解性:易溶于甲醇,难溶于水。
(3)核磁共振谱:图1为本发明化合物Nigtetraene溶于Benzene-d6中的1H-NMR谱图。
图2为本发明化合物Nigtetraene溶于Benzene-d6中的13C-NMR谱图。图3为本发明化合 物Nigtetraene溶于Benzene-d6中13C-DEPT 135谱。图4为本发明化合物Nigtetraene溶于 Benzene-d6中的1H-1H COSY谱。图5为本发明化合物Nigtetraene溶于Benzene-d6中的HSQC谱图。图6为本发明化合物Nigtetraene溶于Benzene-d6中的HMBC谱图。图7为 本发明化合物Nigtetraene溶于Benzene-d6中的NOESY谱图。对本发明化合物Nigtetraene 的核磁共振谱进行了研究并对1D和2D谱各信号进行了归属,见表2。并最终确定结构 如下:
表2 化合物fusaoxyspeneA的1D和2D谱各峰归属
本发明背景技术中所涉及的参考文献如下:
1 Mitsuhashi,T.&Abe,I.Chimeric Terpene Synthases Possessing bothTerpene Cyclization and Prenyltransfer Activities.Chembiochem 19,1106-1114(2018).
2 Wang,L.,Yang,B.,Lin,X.-P.,Zhou,X.-F.&Liu,Y.Sesterterpenoids.Naturalproduct reports 30,455-473(2013).
3 Guan,Z.et al.Metabolic engineering of Bacillus subtilis forterpenoid production. Applied Microbiology biotechnology 99,9395-9406(2015).
4 Xue,D.et al.3-Anhydro-6-hydroxy-ophiobolin A,a fungal sesterterpenefrom Bipolaris oryzae induced autophagy and promoted the degradation ofα-synuclein in PC12 cells. Bioorganic Medicinal Chemistry Letters 25,1464-1470(2015).
5 López-Gresa,M.P.et al.Terretonins E and F,inhibitors of themitochondrial respiratory chain from the marine-derived fungus Aspergillusinsuetus.Journal of natural products 72,1348-1351(2009).
6 Amagata,T.et al.Unusual C25 Steroids Produced by a Sponge-DerivedPenicillium c itrinum.Organic letters 5,4393-4396(2003).
7 Hensens,O.D.et al.Variecolin,a sesterterpenoid of novel skeletonfrom Aspergillus variecolor MF138.The Journal of Organic Chemistry 56,3399-3403(1991).
8 Yin,R.&Hong,K.Filamentous fungal sesterterpenoids and theirsynthases.Chinese Journal of Biotechnology 32,1631-1641(2016).
9 Toyomasu,T.et al.Fusicoccins are biosynthesized by an unusualchimera diterpene synthase in fungi.Proceedings of the national academy ofsciences 104,3084-3088 (2007).
10马紫卉,李伟&尹文兵.真菌天然产物异源生产研究进展.微生物学报56, 429-440(2016).
11 Nagamine,S.et al.Ascomycete Aspergillus oryzae is an efficientexpression host for production of basidiomycete terpenes by using genomic DNAsequences.Applied environmental microbiology 85,e00409-00419(2019).
12 Narita,K.et al.Total biosynthesis of antiangiogenic agent(-)-terpestacin by artificial reconstitution of the biosynthetic machinery inAspergillus oryzae.The Journal of organic chemistry 83,7042-7048(2018).
以上已对本发明创造的较佳实施例进行了具体说明,但本发明创造并不限于所述实施 例,熟悉本领域的技术人员在不违背本发明创造精神的前提下还可作出种种的等同的变型 或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。
序列表
<110> 华东理工大学
<120> 一类5-11双环二倍半萜骨架化合物及其制备
<130> 权利要求书、说明书
<160> 5
<170> SIPOSequenceListing 1.0
<210> 1
<211> 2607
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 1
atggctccat tgtcgatcat ccgcaactct gtccctctcc caccgcatac atacgaaaca 60
gacgagtact tttgtcgatt caccccacgt atccatcgtg acgtccgcct tgctgatgcc 120
ggctcgtggc aatgccaggt cgactttctg ggatctagta cggccgctcg ggctggtgca 180
acgcgcaaca aggatgtttc tagttacgcc gtgggctgca ttaacccagt cgtcggcaac 240
ttcactgcgc tgtgtgcttg cgaagccttg agtgaccggc ttgccctgac tacttatatg 300
gttgagtatg cttatattca tgatgatggt atgtacttgg agcattgctt cccaccctca 360
tttaacatgt gttatgctag tgatcgagta tgccgagaac aaagacgaat ctcaggtaaa 420
tccaattaga ttgtttctct agacatgtct catcgttatg ctaacatttt aaacagcttc 480
tggagacaaa ccagcagctc attgaaggtc tcagtctcga agaagacgtc agcgctggct 540
cgaaagacca tgtcagaaga cgacagttgc aagctaaaat ggtcatggag cttattgaaa 600
cagacaagaa gcaggcaaaa gagtgcctcc gcttatggag ggaaatgtca cacgtatttg 660
tccagatcag agacatgcag ttcactgaac tgaatgacta tctcaagttc cgtgtggtag 720
acgcgggatg cccgtaagtc tacaatcaac actataagta ataagataat ccagtcgcta 780
acactgtctt tcagttggac tatgagcctc ttatgctttt ccatggactt cacactgaat 840
tccagtgaag aggagagagc ttccgccgtc acccaggcag cgtacgacgc ctgggttcta 900
gtcaacgact acttttcttg ggataaggag tggaacaacc accaatctcg tggtggcacc 960
ggtgtgattg ccaattccat cttcctcttc atgaaatggt actccgttga cgcaaaggag 1020
ggcaaaacga tgctgcgaaa ggagattctg gctcgcgaag agaagtattg caaggccaaa 1080
gaagatcttg aggcaaatgg ttccatgtcc gacaagataa cacagtggct cgagttgctc 1140
gatcttgtaa cagcaggtaa ctttgcttgg agcatgacaa ctgcccgcta tcgccttggc 1200
gctgaagacg catatatagc tttacggaat gcgtatacag agacccctgg ttctggtaca 1260
actgacagtc ttgggagccc catttcgcaa aacgctcttg cgatggcaga taaaatcgat 1320
atcgtgctga aggatcggag gtacctggat cttagcatcc gcgagcgcaa gataatcaaa 1380
cccgttgata gacccattgg ccgacaaaca actcatcctc ccgaggatgc gaacttcaag 1440
aagtcgcagg tcagccaagt ttggtctctc caccaatacg aagaggtctg taagcaaata 1500
agtgtgacag agagaatgtt tacctaataa tatcccagat gattctacaa cctccaaagt 1560
acttggagat gatgccatca aaggaagtga ggaacgctgt tatagacggc ctagagactt 1620
ggtaccatgt ttcagagaag tcactcgcag ccattcgaga aattgtaaac ttattgcata 1680
gctcttccct catgtacgta tctatctcta aaccaaaaaa aaaaaaaaca ctaactcctt 1740
tgtaggctag acgatgttga agataactcg cggctcagac gaggatttcc agcaacccac 1800
attatatttg gagtcagcca gactataaat tcagccaacc tactcatcat gaaggctctt 1860
aaagcagcgg aaaccctctc gcctctcgcc gtgcgcatcc tcatcgaaag actcattgac 1920
gggcatattg gtcaagggct ggatctctac tggacacacc acactcagac acccaccgaa 1980
gaagaatatt tcactatggt cgatggaagt tagtattgga cctctgctca gtcaccgcac 2040
agtcaacact aacgctctcg gtctagaaac cggtagtctt ttcattctta tcgccgaact 2100
gatgcgttct gaagctacga agcataaaac actcgacgct ggccttctca tgaagcttgt 2160
gggccgcttc ttccaagcac gagatgatta tctaaatctc cagagtgaag aggtttgtaa 2220
ttaaaatatt ctgcattcat tggttcagtg gtgctaattt tgcacgtgtc aacacagtat 2280
acccagaaga aaggcatcgc ggaagatatc aacgaaggga aattctcgct gccgctcatt 2340
cacgctttaa ggagcaagtc accgcaccgc gatcgccttt tgagcattct gcagcaacga 2400
aagaggtacg acgatctttc ccctgaaata cgcaagctcg ctctcgacga tatcaaagcc 2460
actggagggc tggagtatgc ggagaagacg gctatagagc tacaggaggc ggttagcgag 2520
acgcttacta cgtatgagga gagggtagga gagaagaatt ggctcctgag attggcgcag 2580
aagcggctgg aaattgaagc tcgatga 2607
<210> 2
<211> 2205
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 2
atggctccat tgtcgatcat ccgcaactct gtccctctcc caccgcatac atacgaaaca 60
gacgagtact tttgtcgatt caccccacgt atccatcgtg acgtccgcct tgctgatgcc 120
ggctcgtggc aatgccaggt cgactttctg ggatctagta cggccgctcg ggctggtgca 180
acgcgcaaca aggatgtttc tagttacgcc gtgggctgca ttaacccagt cgtcggcaac 240
ttcactgcgc tgtgtgcttg cgaagccttg agtgaccggc ttgccctgac tacttatatg 300
gttgagtatg cttatattca tgatgatgtg atcgagtatg ccgagaacaa agacgaatct 360
cagcttctgg agacaaacca gcagctcatt gaaggtctca gtctcgaaga agacgtcagc 420
gctggctcga aagaccatgt cagaagacga cagttgcaag ctaaaatggt catggagctt 480
attgaaacag acaagaagca ggcaaaagag tgcctccgct tatggaggga aatgtcacac 540
gtatttgtcc agatcagaga catgcagttc actgaactga atgactatct caagttccgt 600
gtggtagacg cgggatgccc ttggactatg agcctcttat gcttttccat ggacttcaca 660
ctgaattcca gtgaagagga gagagcttcc gccgtcaccc aggcagcgta cgacgcctgg 720
gttctagtca acgactactt ttcttgggat aaggagtgga acaaccacca atctcgtggt 780
ggcaccggtg tgattgccaa ttccatcttc ctcttcatga aatggtactc cgttgacgca 840
aaggagggca aaacgatgct gcgaaaggag attctggctc gcgaagagaa gtattgcaag 900
gccaaagaag atcttgaggc aaatggttcc atgtccgaca agataacaca gtggctcgag 960
ttgctcgatc ttgtaacagc aggtaacttt gcttggagca tgacaactgc ccgctatcgc 1020
cttggcgctg aagacgcata tatagcttta cggaatgcgt atacagagac ccctggttct 1080
ggtacaactg acagtcttgg gagccccatt tcgcaaaacg ctcttgcgat ggcagataaa 1140
atcgatatcg tgctgaagga tcggaggtac ctggatctta gcatccgcga gcgcaagata 1200
atcaaacccg ttgatagacc cattggccga caaacaactc atcctcccga ggatgcgaac 1260
ttcaagaagt cgcaggtcag ccaagtttgg tctctccacc aatacgaaga gatgattcta 1320
caacctccaa agtacttgga gatgatgcca tcaaaggaag tgaggaacgc tgttatagac 1380
ggcctagaga cttggtacca tgtttcagag aagtcactcg cagccattcg agaaattgta 1440
aacttattgc atagctcttc cctcatgcta gacgatgttg aagataactc gcggctcaga 1500
cgaggatttc cagcaaccca cattatattt ggagtcagcc agactataaa ttcagccaac 1560
ctactcatca tgaaggctct taaagcagcg gaaaccctct cgcctctcgc cgtgcgcatc 1620
ctcatcgaaa gactcattga cgggcatatt ggtcaagggc tggatctcta ctggacacac 1680
cacactcaga cacccaccga agaagaatat ttcactatgg tcgatggaaa aaccggtagt 1740
cttttcattc ttatcgccga actgatgcgt tctgaagcta cgaagcataa aacactcgac 1800
gctggccttc tcatgaagct tgtgggccgc ttcttccaag cacgagatga ttatctaaat 1860
ctccagagtg aagagtatac ccagaagaaa ggcatcgcgg aagatatcaa cgaagggaaa 1920
ttctcgctgc cgctcattca cgctttaagg agcaagtcac cgcaccgcga tcgccttttg 1980
agcattctgc agcaacgaaa gaggtacgac gatctttccc ctgaaatacg caagctcgct 2040
ctcgacgata tcaaagccac tggagggctg gagtatgcgg agaagacggc tatagagcta 2100
caggaggcgg ttagcgagac gcttactacg tatgaggaga gggtaggaga gaagaattgg 2160
ctcctgagat tggcgcagaa gcggctggaa attgaagctc gatga 2205
<210> 3
<211> 734
<212> PRT
<213> 人工序列(Artificial sequence )
<400> 3
Met Ala Pro Leu Ser Ile Ile Arg Asn Ser Val Pro Leu Pro Pro His
1 5 10 15
Thr Tyr Glu Thr Asp Glu Tyr Phe Cys Arg Phe Thr Pro Arg Ile His
20 25 30
Arg Asp Val Arg Leu Ala Asp Ala Gly Ser Trp Gln Cys Gln Val Asp
35 40 45
Phe Leu Gly Ser Ser Thr Ala Ala Arg Ala Gly Ala Thr Arg Asn Lys
50 55 60
Asp Val Ser Ser Tyr Ala Val Gly Cys Ile Asn Pro Val Val Gly Asn
65 70 75 80
Phe Thr Ala Leu Cys Ala Cys Glu Ala Leu Ser Asp Arg Leu Ala Leu
85 90 95
Thr Thr Tyr Met Val Glu Tyr Ala Tyr Ile His Asp Asp Val Ile Glu
100 105 110
Tyr Ala Glu Asn Lys Asp Glu Ser Gln Leu Leu Glu Thr Asn Gln Gln
115 120 125
Leu Ile Glu Gly Leu Ser Leu Glu Glu Asp Val Ser Ala Gly Ser Lys
130 135 140
Asp His Val Arg Arg Arg Gln Leu Gln Ala Lys Met Val Met Glu Leu
145 150 155 160
Ile Glu Thr Asp Lys Lys Gln Ala Lys Glu Cys Leu Arg Leu Trp Arg
165 170 175
Glu Met Ser His Val Phe Val Gln Ile Arg Asp Met Gln Phe Thr Glu
180 185 190
Leu Asn Asp Tyr Leu Lys Phe Arg Val Val Asp Ala Gly Cys Pro Trp
195 200 205
Thr Met Ser Leu Leu Cys Phe Ser Met Asp Phe Thr Leu Asn Ser Ser
210 215 220
Glu Glu Glu Arg Ala Ser Ala Val Thr Gln Ala Ala Tyr Asp Ala Trp
225 230 235 240
Val Leu Val Asn Asp Tyr Phe Ser Trp Asp Lys Glu Trp Asn Asn His
245 250 255
Gln Ser Arg Gly Gly Thr Gly Val Ile Ala Asn Ser Ile Phe Leu Phe
260 265 270
Met Lys Trp Tyr Ser Val Asp Ala Lys Glu Gly Lys Thr Met Leu Arg
275 280 285
Lys Glu Ile Leu Ala Arg Glu Glu Lys Tyr Cys Lys Ala Lys Glu Asp
290 295 300
Leu Glu Ala Asn Gly Ser Met Ser Asp Lys Ile Thr Gln Trp Leu Glu
305 310 315 320
Leu Leu Asp Leu Val Thr Ala Gly Asn Phe Ala Trp Ser Met Thr Thr
325 330 335
Ala Arg Tyr Arg Leu Gly Ala Glu Asp Ala Tyr Ile Ala Leu Arg Asn
340 345 350
Ala Tyr Thr Glu Thr Pro Gly Ser Gly Thr Thr Asp Ser Leu Gly Ser
355 360 365
Pro Ile Ser Gln Asn Ala Leu Ala Met Ala Asp Lys Ile Asp Ile Val
370 375 380
Leu Lys Asp Arg Arg Tyr Leu Asp Leu Ser Ile Arg Glu Arg Lys Ile
385 390 395 400
Ile Lys Pro Val Asp Arg Pro Ile Gly Arg Gln Thr Thr His Pro Pro
405 410 415
Glu Asp Ala Asn Phe Lys Lys Ser Gln Val Ser Gln Val Trp Ser Leu
420 425 430
His Gln Tyr Glu Glu Met Ile Leu Gln Pro Pro Lys Tyr Leu Glu Met
435 440 445
Met Pro Ser Lys Glu Val Arg Asn Ala Val Ile Asp Gly Leu Glu Thr
450 455 460
Trp Tyr His Val Ser Glu Lys Ser Leu Ala Ala Ile Arg Glu Ile Val
465 470 475 480
Asn Leu Leu His Ser Ser Ser Leu Met Leu Asp Asp Val Glu Asp Asn
485 490 495
Ser Arg Leu Arg Arg Gly Phe Pro Ala Thr His Ile Ile Phe Gly Val
500 505 510
Ser Gln Thr Ile Asn Ser Ala Asn Leu Leu Ile Met Lys Ala Leu Lys
515 520 525
Ala Ala Glu Thr Leu Ser Pro Leu Ala Val Arg Ile Leu Ile Glu Arg
530 535 540
Leu Ile Asp Gly His Ile Gly Gln Gly Leu Asp Leu Tyr Trp Thr His
545 550 555 560
His Thr Gln Thr Pro Thr Glu Glu Glu Tyr Phe Thr Met Val Asp Gly
565 570 575
Lys Thr Gly Ser Leu Phe Ile Leu Ile Ala Glu Leu Met Arg Ser Glu
580 585 590
Ala Thr Lys His Lys Thr Leu Asp Ala Gly Leu Leu Met Lys Leu Val
595 600 605
Gly Arg Phe Phe Gln Ala Arg Asp Asp Tyr Leu Asn Leu Gln Ser Glu
610 615 620
Glu Tyr Thr Gln Lys Lys Gly Ile Ala Glu Asp Ile Asn Glu Gly Lys
625 630 635 640
Phe Ser Leu Pro Leu Ile His Ala Leu Arg Ser Lys Ser Pro His Arg
645 650 655
Asp Arg Leu Leu Ser Ile Leu Gln Gln Arg Lys Arg Tyr Asp Asp Leu
660 665 670
Ser Pro Glu Ile Arg Lys Leu Ala Leu Asp Asp Ile Lys Ala Thr Gly
675 680 685
Gly Leu Glu Tyr Ala Glu Lys Thr Ala Ile Glu Leu Gln Glu Ala Val
690 695 700
Ser Glu Thr Leu Thr Thr Tyr Glu Glu Arg Val Gly Glu Lys Asn Trp
705 710 715 720
Leu Leu Arg Leu Ala Gln Lys Arg Leu Glu Ile Glu Ala Arg
725 730
<210> 4
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 4
cggaattcga gctcgatggc tccattgtcg atcat 35
<210> 5
<211> 39
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 5
actacagatc cccggtcatc gagcttcaat ttccagccg 39