一种用于糖蛋白制备的工程化酵母构建方法及其菌株

文档序号：149360 发布日期：2021-10-26 浏览：33次 >En<

阅读说明：本技术 一种用于糖蛋白制备的工程化酵母构建方法及其菌株 (Engineered yeast construction method for glycoprotein preparation and strain thereof ) 是由吴军刘波孙鹏巩新王甜甜侯旭宸于 2020-04-24 设计创作，主要内容包括：本发明公开了一种用于糖蛋白制备的工程化酵母构建方法及其菌株。本发明提供了一种具有特定哺乳动物细胞糖型修饰能力的酵母工程菌的构建方法,包括：失活受体酵母内源的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶I-IV、O甘露糖转移酶I；表达外源甘露糖苷酶I、N-乙酰葡萄糖胺转移酶I、甘露糖苷酶II、N-乙酰葡萄糖胺转移酶II、半乳糖异构酶和外源半乳糖转移酶。本发明所得酵母工程菌构建周期短、生长快、易于大规模生产、安全性高等特点,使其不仅可用于制备普通糖蛋白疫苗,而且非常适合在突发新型传染病等应急条件下,进行疫苗高效研发和大规模生产。这在医药用途方面具有重要意义。(The invention discloses a construction method of engineered yeast for glycoprotein preparation and a strain thereof. The invention provides a construction method of a yeast engineering bacterium with specific mammal cell glycoform modification capacity, which comprises the following steps: inactivating endogenous alpha-1, 6-mannose transferase, phosphomannose synthetase, beta-mannose transferase I-IV, O-mannose transferase I of the recipient yeast; expressing the exogenous mannosidase I, N-acetylglucosamine transferase I, mannosidase II, N-acetylglucosamine transferase II, galactose isomerase, and exogenous galactose transferase. The yeast engineering bacteria obtained by the invention has the characteristics of short construction period, quick growth, easy large-scale production, high safety and the like, and can be used for preparing common glycoprotein vaccines and is very suitable for carrying out efficient research and development and large-scale production of the vaccines under emergency conditions of sudden novel infectious diseases and the like. This is of great significance in medical use.)

技术领域

本发明涉及生物工程领域，具体涉及一种用于糖蛋白制备的工程化酵母构建方法及其菌株。

背景技术

酵母作为重要的重组蛋白表达系统，已广泛用于各种重组蛋白表达。它具有像原核细胞系统生长快、便于基因操作和可大规模培养等优点，同时又具有真核细胞翻译后加工、能产生具有生物活性的重组蛋白等特点。巴斯德毕赤酵母(Pichia pastoris)(也称为毕赤酵母)是近年来发展较快的外源蛋白表达宿主菌。除一般酵母所具有的特点外，毕赤酵母还具有很多优点，如毕赤酵母具有甲醇诱导启动子，可严格调控外源蛋白的表达；外源基因的表达产物既可存在于胞内，也可分泌至胞外，能高效获取外源基因的产物；表达载体能稳定遗传；可进行高密度高产量的发酵培养，便于工业化生产等，除此之外，还可进行很多典型的高等真核生物的蛋白翻译后修饰，如糖基化修饰。

糖基化对蛋白质的正确折叠、稳定性和，至关重要。在人体内，糖基化是影响蛋白质的药物动力学特性(如组织分布和在血液中的清除)的原因之一(郭振楚，《糖类化学》，化学工业出版社，2005)。糖蛋白的糖基分为N-糖基和O-糖基两种类型。N-糖链连接在Asn-X-Thr/Ser保守序列中的Asn上(其中的X为除脯氨酸以外的任意氨基酸残基)。O-糖链的结构比N-糖链简单，连接位点比N-糖链多，常出现在丝氨酸(Ser)、苏氨酸(Thr)上。糖基化对蛋白质的正确折叠、稳定性和生物活性至关重要。但酵母表达蛋白的糖基化修饰，常产生过度甘露糖基化，正常的N-糖基修饰，一般每个糖基含10-20个单糖，分子量为 1500-4000。而过度糖基化修饰时，每个糖基可以含数十至上百个甘露糖，分子量为5000至数万，表现为糖蛋白分子量明显增大，而且由于过度糖基化修饰往往不均一，因而糖蛋白分子量也不均一，SDS-PAGE分析时可出现明显“拖尾”。N-糖基化修饰会发生在其保守的N- 糖基化修饰位点上(N-X-S/T)，但由于O-糖基化修饰没有保守的糖基化位点，一般认为会发生在富集丝氨酸或苏氨酸的氨基酸上，不同的蛋白是否发生O-糖基化修饰，以及发生在哪一个氨基酸上，O-糖基化修饰的程度是有所不同的。蛋白的丝氨酸或苏氨酸都可能是O-糖基化的潜在位点，但并不是每一个丝氨酸或苏氨酸都会发生O-糖基化修饰，也并非每一个含有丝氨酸或苏氨酸的蛋白会发生O-糖基化修饰，不同的蛋白在不同的表达系统中的糖基化修饰也有所不同。而过度甘露糖基化的糖蛋白，在人体中半衰期短、免疫原性高、易被清除。由于该缺陷，限制了毕赤酵母在大部分糖蛋白类药物生产方面的应用。

发明内容

本发明旨在提供一种具有特定哺乳动物细胞糖型修饰能力的工程化巴斯德毕赤酵母菌株及其构建方法，要解决的第一个技术问题是构建酵母底盘细胞，需要灭活一系列酵母自身相关糖基化修饰酶，但因糖基化修饰酶种类繁多，很多糖基修饰的灭活会使酵母死亡，因此这涉及到修饰酶的选择不确定性。要解决的第二个技术问题是在酵母底盘细胞上构建具有特定哺乳动物细胞糖型修饰能力的工程化毕赤酵母菌株，因真核生物具有糖基化修饰现象(近年来在原核生物中也发现具有糖基化修饰现象)，因此将糖基化修饰酶引入酵母底盘细胞就存在多种选择，不同的物种、不同的细胞器定位方式，不同的温度和pH调控方式(因有些生物耐寒、耐热、耐酸、耐碱等等)、不同的生物活性高低，这些因素都需要考虑其中，需要进行大量的组合实验和分析，通过多年的探索和尝试。本发明提供了一种具有特定哺乳动物细胞糖型修饰能力的工程化巴斯德毕赤酵母，利用该工程化酵母表达的宿主蛋白的糖型为特定哺乳动物细胞糖型：Gal_aGlcNAc_bMan_cGlcNAc₂，其中a：0-2个；b：0-2个；c：3-5个(Gal：半乳糖，GlcNAc：N-乙酰葡萄糖胺；Man：甘露糖)；同时酵母O糖基化修饰现象进一步降低。

第一方面，本发明要求保护一种具有特定哺乳动物细胞糖型修饰能力的巴斯德毕赤酵母工程菌的构建方法。

本发明所要求保护的具有特定哺乳动物细胞糖型修饰能力的巴斯德毕赤酵母工程菌的构建方法，可包括如下步骤：

(A1)失活受体巴斯德毕赤酵母内源的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶I、β甘露糖转移酶II、β甘露糖转移酶III和β甘露糖转移酶 IV，得到重组酵母1；

(A2)在所述重组酵母1中表达如下外源蛋白中的至少一种：外源甘露糖苷酶I、外源 N-乙酰葡萄糖胺转移酶I、外源甘露糖苷酶II、外源N-乙酰葡萄糖胺转移酶II、外源半乳糖异构酶和外源半乳糖转移酶，得到重组酵母2；所述重组酵母2即为具有所述特定哺乳动物细胞糖型修饰能力的酵母工程菌；

所述特定哺乳动物细胞糖型为Gal_aGlcNAc_bMan_cGlcNAc₂，其中a：0-2个；b：0-2个；c： 3-5个(Gal：半乳糖，GlcNAc：N-乙酰葡萄糖胺；Man：甘露糖)。

当灭活α-1,6-甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶 I-IV后，N糖基化修饰明显降低、糖基内环境更趋向于相对“干净”，带来的新问题是：如何降低O糖基化修饰？O糖基化家族成员众多，哪一种酶的灭活可以适用于本发明，并且达到预期效果？我们都知道，N-糖基化修饰会发生在其保守的N-糖基化修饰位点上(N-X-S/T)，但由于O-糖基化修饰没有保守的糖基化位点，一般认为会发生在富集丝氨酸或苏氨酸的氨基酸上，不同的蛋白是否发生O-糖基化修饰，以及发生在哪一个氨基酸上，O-糖基化修饰的程度是有所不同的。蛋白的丝氨酸或苏氨酸都可能是O-糖基化的潜在位点，但并不是每一个丝氨酸或苏氨酸都会发生O-糖基化修饰，也并非每一个含有丝氨酸或苏氨酸的蛋白会发生O- 糖基化修饰，不同的蛋白在不同的表达系统中的糖基化修饰也有所不同。如果发生O-糖基化修饰，糖链上的糖基则多是甘露糖，虽然糖链比较短，但由于其糖链数量较多，酵母表达蛋白的表面可能会有大量裸露的甘露糖。这种具有甘露糖化的糖蛋白，在人体中半衰期短、免疫原性高、易被清除。由于该缺陷，限制了毕赤酵母在大部分蛋白类药物生产方面的应用。

根据O糖基转移酶家族成员的同源性将其分为三个亚科：PMT1亚科、PMT2亚科和PMT4亚科。不同的物种中PMT1亚科、PMT2亚科的成员数目或许不同，共有7个家庭成员：PMT1\PMT2\PMT3\PMT4\PMT5\PMT6\PMT7。酿酒酵母的PMT1亚科包括 PMT1\PMT5\PMT7，PMT2亚科包括PMT2\PMT3\PMT638。Pmt1p亚科(Pmt1p,Pmt5p)和Pmt2p 亚科(Pmt2p,Pmt3p)成员互相形成异聚双体，Pmt4p会形成同聚双体，而Pmt6p既不能与Pmtp 家族其他成员形成异源双体，也不能和它本身形成同源双体。在野生型酵母中，Pmt1p亚科和Pmt2p亚科成员形成的复合体主要是Pmt1p–Pmt2p和Pmt5p–Pmt3p复合体，也有很少量的 Pmt1p–Pmt3p和Pmt2p–Pmt5p复合体。然而在本发明中，我们发现在α-1,6-甘露糖转移酶灭活、磷酸甘露糖转移酶灭活、磷酸甘露糖合成酶灭活和β甘露糖转移酶I-IV灭活基础上，进一步灭活O甘露糖转移酶I，同时表达特定来源的某一型外源甘露糖苷酶I、外源N-乙酰葡萄糖胺转移酶I、外源甘露糖苷酶II、外源N-乙酰葡萄糖胺转移酶II、外源半乳糖异构酶GalE 和外源半乳糖转移酶GalT，这种组合方式可以显著地降低工程酵母表达的蛋白的O糖基化修饰，并且获得具有特定哺乳动物细胞糖型。

相应的，所述方法还可包括如下步骤(A3)：

(A3)失活所述重组酵母2内源的O甘露糖转移酶I，得到重组酵母3；所述重组酵母3也为具有所述特定哺乳动物细胞糖型修饰能力的酵母工程菌。

步骤(A3)使得酵母O糖基化修饰现象进一步降低。

当所述特定哺乳动物细胞糖型为Man₅GlcNAc₂时，步骤(A2)中在所述重组酵母1中表达的外源蛋白为外源甘露糖苷酶I。

当所述特定哺乳动物细胞糖型为GlcNAcMan₅GlcNAc₂时，步骤(A2)中在所述重组酵母1中表达的外源蛋白为外源甘露糖苷酶I和外源N-乙酰葡萄糖胺转移酶I。

当所述特定哺乳动物细胞糖型为GalGlcNAcMan₅GlcNAc₂时，步骤(A2)中在所述重组酵母1中表达的外源蛋白为外源甘露糖苷酶I、外源N-乙酰葡萄糖胺转移酶I，以及外源半乳糖异构酶和外源半乳糖转移酶。

当所述特定哺乳动物细胞糖型为GalGlcNAcMan₃GlcNAc₂时，步骤(A2)中在所述重组酵母1中表达的外源蛋白为外源甘露糖苷酶I、外源N-乙酰葡萄糖胺转移酶I、外源半乳糖异构酶和外源半乳糖转移酶，以及外源甘露糖苷酶II。

当所述特定哺乳动物细胞糖型为Gal₂GlcNAc₂Man₃GlcNAc₂时，步骤(A2)中在所述重组酵母1中表达的外源蛋白为外源甘露糖苷酶I、外源N-乙酰葡萄糖胺转移酶I、外源半乳糖异构酶和外源半乳糖转移酶、外源甘露糖苷酶II，以及外源N-乙酰葡萄糖胺转移酶II。

步骤(A1)和(A3)中，失活上述糖基修饰酶，可以通过突变基因一个或者多个核苷酸序列、或者通过缺失部分或完整基因序列来实现、也可以利用插入核苷酸破坏原有阅读框、提前终止蛋白质合成等方式来实现失活该基因或该基因编码的蛋白质活性。上述突变、缺失和插入失活等可以用常规的诱变、敲除等方法获得。这些方法已有许多文献报道，如J.萨姆布鲁克等，《分子克隆实验指南》第二版，科学出版社，1995。也可用本领域已知的其它方法来构建基因失活的酵母菌株。其中较优的菌株是通过敲除甘露糖转移酶基因的部分序列获得的。该序列至少大于三个碱基，较优的是大于100碱基，更优的是包括50％以上的编码序列。这种通过敲除糖基修饰酶基因的部分序列获得的菌株不易产生回复突变，菌株的稳定性比利用点突变等方法构建的稳定性更高，更有利于应用于医疗和工业范围内。

敲除糖基化修饰酶基因的部分序列的方法可以包括：首先构建敲除该基因的质粒：质粒上包括待敲除基因两侧的同源臂序列，两个同源臂应选择在目标基因两侧，所述同源臂的长度至少大于200bp，最优的大小在500bp-2000bp。也可以利用插入灭活的方式，获得一个氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加，致使没有功能活性的核苷酸序列，并构建到质粒。质粒上还带有URA3(orotidine-5′-phosphatedecarboxylase)基因、或博莱霉素、或潮霉素B、或Blasticidin或G418等作为筛选标记。编码侧翼区同源臂片段的核酸多聚核苷酸序列、欲被破坏功能的蛋白的核苷酸序列，可以从公开的美国国立生物技术信息中心(NCBI)获得。利用PCR方法，以毕赤酵母宿主基因组为模板，获得灭活基因所需的一定长度的侧翼同源区，分别包括目的基因(其序列在NCBI中已经公开)基因编码区上游和下游侧翼同源区，并在引物部分添加合适的酶切位点。根据序列获得多聚核苷酸可以用本领域周知的方法，如PCR(J.萨姆布鲁克等，《分子克隆实验指南》第二版，科学出版社，1995.)、RT-PCR方法、人工合成的方法、基因组DNA和构建筛选cDNA文库的方法等获得。若需要可用本领域公知的方法对多聚核苷酸进行突变、缺失、插入、和与其它多聚核苷酸连接等。将分别得到的上游(5′)和下游(3′)侧翼区同源臂片段进行融合，在保持各自片段大小不变的前提下，可以用本领域周知的各种方法，如通过重叠PCR的方法，所用标准的分子克隆过程见J.萨姆布鲁克等(J.萨姆布鲁克等，《分子克隆实验指南》第二版，科学出版社，1995.) 的叙述。可用本领域公知的方法分别将含欲灭活基因同源臂序列融合片段的核酸克隆到各种适用于酵母的载体中去。或者利用各自同源臂上酶切位点分别插入载体特定区域。所用标准的分子克隆过程见J.萨姆布鲁克等(J.萨姆布鲁克等，《分子克隆实验指南》第二版，科学出版社，1995.)的叙述。构建重组敲除质粒。原始质粒可以选用适于酵母的表达载体、穿梭载体，可以带有复制位点，筛选标记，营养缺陷型标记(URA3,HIS,ADE1,LEU2,ARG4)等，这些载体的构建方法已在许多文献公开(如J.萨姆布鲁克等，《分子克隆实验指南》第二版，科学出版社，1995)，也可以从各种公司购得(如Invitrogen life technologies,Carlsbad, California 92008,USA)，优先的载体有pPICZαA、pYES2酵母表达载体。灭活载体都是穿梭质粒，先在大肠杆菌中复制扩增，然后被导入宿主酵母细胞，载体应该带有抗性标记基因，或者营养缺陷型标记基因，以利于后期转化子的筛选。

将欲灭活基因两侧同源区(上游称之为5′臂，下游称之为3′臂)分别构建至酵母载体，形成重组敲除载体。进一步利用同源臂的线性化位点线性化敲除载体，通过电转化方法，转化至毕赤酵母或其改构体中的一种，进行培养。转化所需核酸至宿主细胞中去可用通常方法得到，如制备感受态细胞、电穿孔、醋酸锂法等(A.亚当斯等，《酵母遗传学方法实验指南》，科学出版社，2000)。成功转化的细胞，即含有欲敲除基因的同源区的细胞，可以通过人们熟知的技术加以鉴定，如细胞经收集并裂解，提取DNA，然后PCR方法鉴定基因型；而之前选择正确的表型可以通过营养缺陷型或者抗性标记的筛选而得以实现。一次重组正确的转化子，经过在酵母基本培养基培养后，涂布在含尿嘧啶的5-氟乳清酸平板等二次重组筛选平板，长出的克隆，再进一步进行基因型的PCR鉴定。分别筛选到正确的缺失了预期的基因编码区的转化子。

在本发明的

具体实施方式

中，步骤(A1)中，所述失活受体巴斯德毕赤酵母内源的α-1,6- 甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶I、β甘露糖转移酶 II、β甘露糖转移酶III和β甘露糖转移酶IV均是采用同源重组的方式进行基因敲除。

在本发明的具体实施方式中，步骤(A2)中，在所述重组酵母1中表达所述外源蛋白是通过向所述重组酵母1中导入所述外源蛋白的编码基因实现的。

进一步地，所述外源蛋白的编码基因是以重组载体的形式导入所述重组酵母1中的。

进一步地，所述外源甘露糖苷酶I的编码基因和所述外源甘露糖苷酶II的编码基因均向所述重组酵母1中导入两次。

在本发明的具体实施方式中，步骤(A3)中，失活所述重组酵母2内源的O甘露糖转移酶I，本发明没有按照传统敲除基因的方式，而是巧妙的通过对所述重组酵母2的基因组DNA中的O甘露糖转移酶I编码基因进行插入失活(通过插入灭活的方式破坏其相应的核苷酸序列)实现的。

在本发明中，具体是在所述重组酵母2的基因组DNA中的O甘露糖转移酶I编码基因的靶标片段的前端和末端各装上不同组合的终止密码子，并且在末端的终止密码子之后装上终止子(如CYC1TT终止子)。前端和末端各装上不同组合的终止密码子后的所述靶标片段具体为以毕赤酵母JC308的基因组DNA为模板，利用引物PMT1-IN-5和PMT1-IN-3进行PCR扩增所得的片段。

PMT1-IN-5：5’-tctatgcattaatgatagttaatgactaatagagtaaaacaagtcctcaagaggt-3’；

PMT1-IN-3：5’-tgacataactaattacatgatctattagtcattaactatcattagatcagagtggggacgactaagaaa gc-3’。

接下来的技术问题是在酵母底盘细胞中构建具有哺乳动物细胞糖型修饰能力的工程化毕赤酵母菌株，参与哺乳动物细胞糖基修饰的糖基修饰酶繁多复杂，什么样的酶修饰会获得什么样的糖型？以及获得糖型的比例组合在未研究之前都不得而知。本发明通过以下技术方法来实现：

所述外源甘露糖苷酶I来源于绿色木霉，且C端融合内质网保留信号HDEL。

所述外源N-乙酰葡萄糖胺转移酶I可以是来源于哺乳动物等的N-乙酰葡萄糖胺转移酶 I，如人N-乙酰葡萄糖胺转移酶I(GenBank NO NM 002406)、白色念珠菌N-乙酰葡萄糖胺转移酶I(GenBank NO NW_139513.1)、盘基网柄菌N-乙酰葡萄糖胺转移酶I(GenBank NONC_007088.5)等等，可以在N-端或C-端融合内质网或内侧高尔基体定位信号，如ScGLS、ScMNS1、PpSEC12、ScMNN9等等；优选的为来源于人，且含有mnn9定位信号；

所述外源甘露糖苷酶II可以是来源于丝状真菌、植物、昆虫、爪哇、哺乳动物等的甘露糖苷酶II，如果蝇甘露糖苷酶II(GenBank NOX77652)、线虫甘露糖苷酶II(GenBankNO NM 0735941)、人甘露糖苷酶II(GenBank NO U31520)等等；表达的甘露糖苷酶II可以在N- 端或C-端融合内质网或内侧高尔基体定位信号，如ScGLS、ScMNS1、PpSEC12、ScMNN9 等等，优选的为来源于线虫，含有mnn2定位信号；

外源N-乙酰葡萄糖胺转移酶II，可以是来源于哺乳动物等的N-乙酰葡萄糖胺转移酶II，如人N-乙酰葡萄糖胺转移酶II(GenBank NO Q10469)、鼠N-乙酰葡萄糖胺转移酶II(GenBank NO Q09326)等等；表达的N-乙酰葡萄糖胺转移酶II可以在N-端或C-端融合内质网或内侧高尔基体定位信号，如ScGLS、ScMNS1、PpSEC12、ScMNN9等等，优选的为来源于人，含有mnn2定位信号；

所述甘露糖苷酶II和所述N-乙酰葡萄糖胺转移酶II均含有mnn2定位信号；

所述半乳糖异构酶和所述半乳糖转移酶为融合蛋白，选择均来源于人，且共用一个kre2 定位信号。

半乳糖转移酶可以是来源于哺乳动物等的半乳糖转移酶，如人β-1,4-半乳糖转移酶 (GenBank NO gi:13929461)、鼠β-1,4-半乳糖转移酶GenBank NO NC_000081.6)等等。表达的半乳糖转移酶可以在N-端或C-端融合内质网或内侧高尔基体定位信号，如ScKRE2、ScGLS、 ScMNS1、PpSEC12、ScMNN9等等，本发明实施例半乳糖转移酶来源于人，且共有一个kre2 定位信号；

所述α-1,6-甘露糖转移酶可为如下B1)或B2)：

B1)氨基酸序列是SEQ ID No.1的蛋白质；

B2)将SEQ ID No.1所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.1所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述磷酸甘露糖转移酶可为如下B3)或B4)：

B3)氨基酸序列是SEQ ID No.2的蛋白质；

B4)将SEQ ID No.2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.2所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述磷酸甘露糖合成酶可为如下B5)或B6)：

B5)氨基酸序列是SEQ ID No.3的蛋白质；

B6)将SEQ ID No.3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.3所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述β甘露糖转移酶I可为如下B7)或B8)：

B7)氨基酸序列是SEQ ID No.4的蛋白质；

B8)将SEQ ID No.4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.4所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述β甘露糖转移酶II可为如下B9)或B10)：

B9)氨基酸序列是SEQ ID No.5的蛋白质；

B10)将SEQ ID No.5所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.5所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述β甘露糖转移酶III可为如下B11)或B12)：

B11)氨基酸序列是SEQ ID No.6的蛋白质；

B12)将SEQ ID No.6所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.6所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述β甘露糖转移酶IV可为如下B13)或B14)：

B13)氨基酸序列是SEQ ID No.7的蛋白质；

B14)将SEQ ID No.7所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.7所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述O甘露糖转移酶I可为如下B15)或B16)：

B15)氨基酸序列是SEQ ID No.8的蛋白质；

B16)将SEQ ID No.8所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.8所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述外源甘露糖苷酶I可为如下B17)或B18)：

B17)氨基酸序列是SEQ ID No.9的蛋白质；

B18)将SEQ ID No.9所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质，或与SEQ ID No.9所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述外源N-乙酰葡萄糖胺转移酶I可为如下B19)或B20)：

B19)氨基酸序列是SEQ ID No.10的蛋白质；

B20)将SEQ ID No.10所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质，或与SEQ ID No.10所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

由所述半乳糖异构酶和所述半乳糖转移酶组成的所述融合蛋白可为如下B21)或B22)：

B21)氨基酸序列是SEQ ID No.11的蛋白质；

B22)将SEQ ID No.11所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和 /或添加且具有相同功能的蛋白质，或与SEQ ID No.11所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述甘露糖苷酶II可为如下B23)或B24)：

B23)氨基酸序列是SEQ ID No.12的蛋白质；

B24)将SEQ ID No.12所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和 /或添加且具有相同功能的蛋白质，或与SEQ ID No.12所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述N-乙酰葡萄糖胺转移酶II可为如下B25)或B26)：

B25)氨基酸序列是SEQ ID No.13的蛋白质；

B26)将SEQ ID No.13所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和 /或添加且具有相同功能的蛋白质，或与SEQ ID No.13所示的氨基酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且具有相同功能的蛋白质。

所述外源甘露糖苷酶I的编码基因可为如下C1)或C2)：

C1)核苷酸序列是SEQ ID No.14的DNA分子；

C2)与SEQ ID No.14所示的核苷酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且编码所述外源甘露糖苷酶I的DNA分子，或在严格条件下与C1)限定的DNA分子杂交且编码所述外源甘露糖苷酶I的DNA分子。

所述外源N-乙酰葡萄糖胺转移酶I的编码基因可为如下C3)或C4)：

C3)核苷酸序列是SEQ ID No.15的DNA分子；

C4)与SEQ ID No.15所示的核苷酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且编码所述外源N-乙酰葡萄糖胺转移酶I的DNA分子，或在严格条件下与C3)限定的DNA分子杂交且编码所述外源N-乙酰葡萄糖胺转移酶I的DNA分子。

由所述半乳糖异构酶和所述半乳糖转移酶组成的所述融合蛋白的编码基因可为如下C5) 或C6)：

C5)核苷酸序列是SEQ ID No.16的DNA分子；

C6)与SEQ ID No.16所示的核苷酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且编码所述融合蛋白的DNA分子，或在严格条件下与C5)限定的DNA 分子杂交且编码所述融合蛋白的DNA分子。

所述甘露糖苷酶II的编码基因可为如下C7)或C8)：

C7)核苷酸序列是SEQ ID No.17的DNA分子；

C8)与SEQ ID No.17所示的核苷酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且编码所述甘露糖苷酶II的DNA分子，或在严格条件下与C7)限定的 DNA分子杂交且编码所述甘露糖苷酶II的DNA分子。

所述N-乙酰葡萄糖胺转移酶II的编码基因可为如下C9)或C10)：

C9)核苷酸序列是SEQ ID No.18的DNA分子；

C10)与SEQ ID No.18所示的核苷酸序列具有99％以上、95％以上、90％以上、85％以上或者80％以上同源性且编码所述N-乙酰葡萄糖胺转移酶II的DNA分子，或在严格条件下与C9)限定的DNA分子杂交且编码所述N-乙酰葡萄糖胺转移酶II的DNA分子。

上述蛋白质中，同源性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1 中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用 BLOSUM62作为Matrix，将Gap existence cost，Per residue gap cost和Lambdaratio分别设置为11，1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。

上述基因中，同源性是指核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定核苷酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62 作为Matrix，将Gap existence cost，Per residue gap cost和Lambda ratio分别设置为11，1和 0.85(缺省值)并进行检索一对核苷酸序列的同一性进行计算，然后即可获得同一性的值(％)。

上述蛋白质和基因中，所述95％以上的同源性可为至少96％、97％、98％的同一性。所述90％以上的同源性可为至少91％、92％、93％、94％的同一性。所述85％以上的同源性可为至少86％、87％、88％、89％的同一性。所述80％以上的同源性可为至少81％、82％、 83％、84％的同一性。

上述基因中，所述严格条件可为如下：50℃，在7％十二烷基硫酸钠(SDS)、0.5MNaPO₄和1mM EDTA的混合溶液中杂交，在50℃，2×SSC，0.1％SDS中漂洗；还可为：50℃，在7％SDS、0.5M NaPO₄和1mM EDTA的混合溶液中杂交，在50℃，1×SSC，0.1％SDS中漂洗；还可为：50℃，在7％SDS、0.5M NaPO₄和1mM EDTA的混合溶液中杂交，在50℃， 0.5×SSC，0.1％SDS中漂洗；还可为：50℃，在7％SDS、0.5M NaPO₄和1mM EDTA的混合溶液中杂交，在50℃，0.1×SSC，0.1％SDS中漂洗；还可为：50℃，在7％SDS、0.5M NaPO₄和1mM EDTA的混合溶液中杂交，在65℃，0.1×SSC，0.1％SDS中漂洗；也可为：在6×SSC，0.5％SDS的溶液中，在65℃下杂交，然后用2×SSC，0.1％SDS和1×SSC， 0.1％SDS各洗膜一次。

本发明所有糖基修饰酶相关信息都可以在美国国立生物技术信息中心(NCBI)或者公开的文献中获得，相关酶的功能、定义也可以在文献中获得。即使是同一种菌或物种，由于来源不同等，各种酶的氨基酸会略有差别，但其功能基本相同，因此，本发明所述酶也可包括这些变异体。

第二方面，本发明要求保护利用前文第一方面所述方法构建得到的巴斯德毕赤酵母工程菌。

进一步地，所述巴斯德毕赤酵母工程菌为在中国微生物菌种保藏管理委员会普通微生物中心保藏的保藏编号为CGMCCNo.19488的菌株。

第三方面，本发明要求保护前文第二方面所述的巴斯德毕赤酵母工程菌在制备修饰有所述特定哺乳动物细胞糖型的目的蛋白中的应用。

第四方面，本发明要求保护一种制备修饰有所述特定哺乳动物细胞糖型的目的蛋白的方法。

本发明所要求保护的制备修饰有所述特定哺乳动物细胞糖型的目的蛋白的方法，可包括如下步骤：在前文第二方面所述的巴斯德毕赤酵母工程菌中表达所述目的蛋白，得到重组酵母工程菌；培养所述重组酵母工程菌，制备具有所述特定哺乳动物细胞糖型的目的蛋白。

在本发明的具体实施方式中，所述目的蛋白具体为抗Her2抗体。

本发明的实验证明，本发明获得的巴斯德毕赤酵母工程菌株，其自身N-糖基和O-糖基降低，且其具有动物细胞糖型修饰能力，这个工程酵母菌株制备的糖蛋白避免了真菌型糖基化修饰可能引起过敏等问题，工程化巴斯德毕赤酵母菌株构建周期短、生长快、易于大规模生产、安全性高等特点，使其不仅可用于制备普通糖蛋白疫苗，而且非常适合在突发新型传染病等应急条件下，进行疫苗高效研发和大规模生产。这在医药用途方面具有重要意义。

保藏说明

菌株拉丁名：Pichia pastoris

参椐的生物材料：GJK30

建议的分类命名：巴斯德毕赤酵母

保藏机构：中国微生物菌种保藏管理委员会普通微生物中心

保藏机构简称：CGMCC

地址：北京市朝阳区北辰西路1号院3号

保藏日期：2020年03月18日

保藏中心登记入册编号：CGMCC No.19488

附图说明

图1为GJK01菌中och1基因的鉴定以及糖型分析结果。A为och1基因鉴定结果。M代表Marker；1：GJK01菌(已敲除och1)；2：X33菌(未敲除och1)。B为GJK01菌(敲除 och1)表达的抗体的DSA-FACE糖型分析结果。

图2为pno1基因鉴定结果。M代表Marker；1：GJK02菌(已敲除pno1)；2：X33菌 (未敲除pno1)。

图3为mnn4b基因鉴定结果。M代表Marker；1：GJK03菌(已敲除mnn4b)；2：X33 菌(未敲除mnn4b)。

图4为GJK01、GJK02、GJK03菌(已敲除och1、pno1、mnn4b)的DSA-FACE糖型分析结果。

图5为ARM2基因鉴定结果。M代表Marker；1：GJK04菌(已敲除ARM2)；2：X33 菌(未敲除ARM2)。

图6为ARM1基因鉴定结果。M代表Marker；1：GJK05菌(已敲除ARM1)；2：X33 菌(未敲除ARM1)。

图7为ARM3基因鉴定结果。M代表Marker；1：GJK07菌(已敲除ARM3)；2：X33 菌(未敲除ARM3)。

图8为ARM4基因鉴定结果。M代表Marker；1：GJK18菌(已敲除ARM4)；2：X33 菌(未敲除ARM4)。

图9为GJK18菌的DSA-FACE糖型分析结果。

图10为W10菌的TrmdsI基因鉴定结果和DSA-FACE糖型分析结果。A为TrmdsI基因鉴定结果。M代表Marker；1：W10菌中导入TrmdsI；X33菌中无TrmdsI。B为W10菌的 DSA-FACE糖型分析结果。

图11为1-8菌的GnTI基因鉴定结果和DSA-FACE糖型分析结果。A为GnTI基因鉴定结果。M代表Marker；1：1-8菌中导入GnTI；2：X33菌中无GnTI。B为1-8菌的DSA-FACE 糖型分析结果。

图12为1-8-4菌的GalE-GalT基因鉴定结果和DSA-FACE糖型分析结果。A为GalE-GalT 基因鉴定结果。M代表Marker；1：1-8-4菌中导入GalE-GalT；2：X33菌中无GalE-GalT。B为1-8-4菌的DSA-FACE糖型分析结果。

图13为52-60和150L2菌的mdsII基因、GnTII基因鉴定结果和DSA-FACE糖型分析结果。A为MdsII基因鉴定结果。M代表Marker；1：52-60菌中导入MdsII；2：X33菌中无 MdsII。B为GnTII基因鉴定结果。M代表Marker；1：150L2菌中导入GnTII；2：X33菌中无GnTII。C为52-60菌的DSA-FACE糖型分析结果。

图14为PMT1插入失活基因鉴定结果。M代表Marker；1：X33菌PMT1未失活；2： GJK30(PMT1失活)。

图15为GJK30工程菌的糖型结构分析结果。A为前期Gal2GlcNAc2Man3GlcNAc2结构低于50％；B为GJK30工程菌获得的Gal2GlcNAc2Man3GlcNAc2结构所占糖型比例大于60％；C为通过糖苷酶(New England Biolabs，Beijing)对该糖型进行酶切分析。

具体实施方式

下述实施例中所使用的实验方法如无特殊说明，均为常规方法。

下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

除非另外说明，本文所用的所有技术和科学术语具有与本发明所属领域的普通技术人通常理解的相同的意思。示例性的方法和材料描述如下，虽然与本文描述的类似或等同的方法和材料也可以用于实施本发明，这对本领域技术人员来说是显而易见的。本文提及的所有出版物和其它参考文献都以引用的方式引入其全文.在不一致的情况下，以本说明书，包括定义，为准。材料，方法和实施例仅是举例说明而不是进行限制。

pPICZαA、pYES2载体、X33、GS115毕赤酵母为Invitrogen公司产品。

毕赤酵母GJK01 CGMCC No.1853(记载发明专利ZL200610164912.8中，公开号为CN101195809，为失活了α-1,6-甘露糖转移酶的毕赤酵母。

实验中所使用的Pyrobest酶、LA Taq酶、dNTPs、限制性内切酶、T4连接酶等购自大连宝生物工程有限公司，pfu酶、试剂盒、DH5α感受态细胞为北京全式金有限公司产品。全基因合成、核苷酸合成、引物合成、测序等由上海生工生物工程技术服务有限公司提供。

下述实施例中所涉及的相关修饰酶的序列信息如表1所示。

表1本发明所涉及的相关修饰酶

实施例1、构建具有特定哺乳动物细胞糖型修饰能力的工程化巴斯德毕赤酵母

一、磷酸甘露糖转移酶基因灭活的酵母菌株构建

本发明采用的基础菌株为我们前期构建的GJK01菌株，保藏号为CGMCC No.1853，菌株授权专利号：ZL200610164912.8。该菌株为α-1,6-甘露糖转移酶灭活的毕赤酵母菌株。α-1,6- 甘露糖转移酶(OCH1)的氨基酸序列如SEQ ID No.1所示。

磷酸甘露糖转移酶基因灭活的酵母菌株GJK02为将毕赤酵母GJK01中编码SEQ IDNo.2 所示磷酸甘露糖转移酶的DNA分子部分敲除而获得，即敲除GJK01酵母基因组中的磷酸甘露糖转移酶基因，得到的重组酵母。

1、构建磷酸甘露糖转移酶基因灭活载体

用于敲除甘露糖转移酶(PNO1)基因的敲除质粒pYES2-pno1为将甘露糖转移酶(PNO1) 对应的基因片段(SEQ ID No.20)插入载体pYES2的KpnI和XbaI酶切位点间得到的载体。其中SEQ ID No.20自5’末端第7-1006位核苷酸为敲除甘露糖转移酶(PNO1)基因片段的上游同源臂；SEQ ID No.20自5’末端第1015-2017位核苷酸为敲除甘露糖转移酶(PNO1)基因片段的下游同源臂。

具体如下：

用玻璃珠制备法(A.亚当斯等，《酵母遗传学方法实验指南》，科学出版社，2000)提取毕赤酵母X33的基因组DNA，以该基因组DNA为模板扩增甘露糖转移酶(PNO1)基因两侧的同源臂，PNO1两侧的同源臂分别约为1kb，中间缺失约1.4kb的编码基因。

扩增pno1上游侧翼区同源臂(PNO1 5′同源臂)所用的引物为PNO-5-5和PNO-5-3，引物序列分别为：

5′-AGTGGTACCGCAGTTTAATCATAGCCCACTGC-3′(划线部分为Kpn I识别位点)；

5′-ATTCCAATACCAAGAAAGTAAAGTgcggccgcAAGTGGAACTGGCGCACCGGT-3′ (划线部分为Not I识别位点)。

扩增PNO1下游侧翼区同源臂(PNO13′同源臂)所用的引物为PNO-3-5和PNO-3-3，引物序列分别为：

5′-ACCGGTGCGCCAGTTCCACTTgcggccgcACTTTACTTTCTTGGTATTGGAAT-3′(划线部分为Not I识别位点)；

5′-TGTTCTAGATCCGAGATTTTGCGCTATGGAGC-3′(划线部分为Xba I识别位点)。

两个同源臂的PCR扩增条件如下：94℃变性5min后，按照94℃变性30sec、55℃复性30sec、72℃延伸1min30sec进行30次循环，最后72℃延伸10min；目的片段大小在1kb左右。将PCR产物用PCR产物回收纯化试剂盒纯化回收(购自鼎国生物技术有限公司，北京)。利用重叠延伸PCR的方法融合PNO1 5′同源臂和3′同源臂(参见J.萨姆布鲁克等，《分子克隆实验指南》第二版，科学出版社，1995)，以PNO1 5′同源臂和3′同源臂PCR产物为模板，以PNO-5-5/PNO-3-3为引物，PCR扩增条件如下：94℃变性5min后，按照94℃变性1min、 55℃复性1min、72℃延伸3min30sec进行30次循环，最后72℃延伸10min；目的片段大小在2kb左右。PCR产物用PCR产物回收纯化试剂盒纯化回收。

Kpn I/Xba I双酶切(本试验所用的限制性内切酶均来自宝生物工程有限公司，大连)PCR 产物，酶切后产物插入同样双酶切处理的载体pYES2(Invitrogen Corp.USA)中，T4连接酶 16℃连接过夜，转化大肠杆菌DH5α，在含氨苄青霉素(100μg/ml)的LB平板上筛选阳性克隆。用Kpn I/Xba I双酶切鉴定阳性克隆的质粒，得到4200bp左右和2000bp左右片段的重组载体命名为pYES2-pno1，即为用于敲除甘露糖转移酶(PNO1)基因的敲除质粒，pno1基因上下游同源臂并经最终测序验证正确。

2、敲除质粒对毕赤酵母的转化

采用电转化法将敲除质粒pYES2-pno1转化入毕赤酵母GJK01(记载发明专利ZL200610164912.8中，公开号为CN101195809)中，电转化的方法为本领域所共知的(如 A.亚当斯等，《酵母遗传学方法实验指南》，科学出版社，2000)。电转化前，先将敲除质粒用 5’同源臂上游BamH I酶切位点线性化，然后电转入制备好的感受态细胞中，涂布于含有精氨酸和组氨酸的MD培养基(YNB 1.34g/100mL，生物素4×10^-5g/100mL，葡萄糖2g/100mL，琼脂1.5g/100mL，精氨酸100mg/ml，组氨酸100mg/ml)上。待培养基上长出克隆后，随机挑取几个克隆提取基因组，通过PCR的方法鉴定敲除质粒是否正确整合到了染色体上的目标位点，PCR反应所用的两对引物分别是：PNO1基因5’同源臂外的引物序列PNO-5-5OUT： 5′-GCAGTTTAATCATAGCCCACTGCTA-3′和载体上的引物序列inner01： 5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′。PCR反应所用的酶为rTaq(宝生物工程有限公司)，PCR扩增条件如下：94℃变性5min后，按照94℃变性30sec、55℃复性30sec、72℃延伸3min进行30次循环，最后72延伸10min。通过凝胶电泳分析PCR产物条带的大小，引物所扩增的条带在2.3kb左右为阳性克隆。

3、PCR鉴定阳性工程菌株

将其中一个阳性克隆接种于YPD培养基(10g/L酵母提取物，20g/L蛋白胨，20g/L葡萄糖)中，25℃摇床培养12小时后，将菌液涂布于腺嘌呤缺陷的5-FOA培养基(YNB 1.34g/100mL，生物素4×10-5g/100mL，葡萄糖2g/100mL，琼脂1.5g/100mL，精氨酸100mg/ml, 组氨酸100mg/ml，尿嘧啶100mg/ml，5-FOA 0.1％)(其中，YNB，为无氨基酸酵母氮源，为北京欣经科生物技术有限公司产品，5-FOA为5-氟尿嘧啶，来自Sigma-aldrich P.O.BOX14508,St.Louis,MO 63178 USA)，置于25℃培养。

待5-FOA培养基上长出克隆后，提取这些克隆的基因组，进行PCR鉴定：以基因组为模板，鉴定引物为染色体上pno1基因同源臂外的序列PNO1-ORF01和PNO1-ORF02，引物序列分别为：

PNO1-ORF01：5′-GGGAAAGAAAACCTTCAATTT-3′；

PNO1-ORF02：5′-TACAAGCCAGTTTCGCAATAA-3′。

同时将以野生型X33菌株(Invitrogen公司)的基因组为模板的PCR反应体系设为对照。 PCR反应所用的酶为LA Taq(宝生物工程有限公司)，PCR扩增条件如下：94℃变性5min 后，按照94℃变性30sec、55℃复性30sec、72℃延伸3min进行30次循环，最后72延伸10min。

为了鉴定α-1,6-甘露糖转移酶是否敲除，本发明在获得GJK01工程菌后引入了一个报告蛋白，本发明以抗Her2抗体为报告蛋白，抗Her2抗体的表达载体的构建方法、载体转化方法已经在申请专利中公开(公开号：CN101748145A)。利用该方法将抗Her2抗体表达载体转入至GJK01宿主菌中，获得了表达抗Her2抗体的GJK01-HL工程菌株。DSA-FACE糖型分析方法已经公开报道“刘波,等.一种利用DSA-FACE分析寡糖链的方法.生物技术通讯.2008.19(6).885-888”

将产物进行琼脂糖凝胶电泳。图1中A为GJK01宿主菌的鉴定结果；图1中B为GJK01-HL 菌(敲除och1)的DSA-FACE糖型分析结果所示。图2中泳道1为PON1缺陷型，泳道2为野生型；以野生型X33菌株基因组为模板的PCR产物大小在490bp左右，PON1缺陷型工程菌无扩增条带，也证明了PNO1基因的丢失，磷酸甘露糖转移酶敲除的菌株构建正确，命名为GJK02，为磷酸甘露糖转移酶敲除的重组毕赤酵母菌。

二、磷酸甘露糖合成酶基因灭活的酵母菌株构建

磷酸甘露糖合成酶基因灭活的酵母菌株GJK03为将毕赤酵母GJK02中编码SEQ IDNo.3 所示磷酸甘露糖合成酶的DNA分子部分敲除而获得，即敲除GJK02酵母基因组中的磷酸甘露糖合成酶基因，得到的重组酵母；即该酵母的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶和磷酸甘露糖合成酶灭活。

构建载体的方法与步骤一相同。

1、构建磷酸甘露糖合成酶基因灭活载体

用于敲除磷酸甘露糖合成酶基因的敲除质粒pYES2-MNN4B为将磷酸甘露糖合成酶对应的欲敲除除基因片段的上下游同源臂插入载体pYES2的Stu I和Spe I酶切位点间得到的载体。

利用同上述一的方法，用玻璃珠制备法提取毕赤酵母X33的基因组DNA，以该基因组 DNA为模板扩增敲除甘露糖合成酶(MNN4B)基因片段，MNN4B两侧的同源臂分别约为1kb，中间缺失约1kb的编码基因。

扩增MNN4B上游侧翼区同源臂(ARM25′同源臂)所用的引物为MNN4B-5-5和 MNN4B-5-3，引物序列分别为：

5′-AGTAGGCCTTTCAACGAGTGACCAATGTAGA-3′(划线部分为Stu I识别位点)；

5′-TATCTCCATAGTTTCTAAGCAGGGCGGCCGCAATATGTGCGGTGTAGGGAGAAA-3 ′(划线部分为Not I识别位点)。

扩增MNN4B下游侧翼区同源臂(MNN4B 3′同源臂)所用的引物为MNN4B-3-5和MNN4B-3-3，引物序列分别为：

5′-TTTCTCCCTACACCGCACATATTGCGGCCGCCCTGCTTAGAAACTATGGAGATA-3′ (划线部分为Not I识别位点)；

5′-TGTACTAGTTGAAGACGTCCCCTTTGAACA-3′(划线部分为Spe I识别位点)。

两个同源臂的PCR扩增条件、回收方法、以及酶切方法都同步骤1，最终构建获得pYES2-MNN4B敲除载体，并经最终测序验证正确。

2、敲除质粒对毕赤酵母的转化

敲除质粒采用电转化法将敲除质粒转化入上述一构建的毕赤酵母工程菌株GJK02中，电转化的方法、鉴定方法同步骤一。

PCR反应所用的两对引物分别是：mnn4b基因5’同源臂外的引物序列MNN4B-5-5OUT： 5′-TAGTCCAAGTACGAAACGACACTA-3′和载体上的引物序列inner01： 5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′，引物所扩增的条带在2kb左右为阳性克隆。

3、PCR鉴定阳性工程菌株

将其中一个阳性克隆接种于5-FOA培养基(配方同前)上长出克隆后，提取这些克隆的基因组，进行PCR鉴定：以基因组为模板，鉴定引物为染色体上mnn4b基因同源臂外的序列MNN4B-ORF01和MNN4B-ORF02，引物序列：

MNN4B-ORF01：5'-AAAACTATCCAATGAGGGTCTC-3'；

MNN4B-ORF02：5'-TCTTCAATGTCTTTAACGGTGT-3'。

以阳性克隆基因组DNA为模板，利用引物MNN4B-ORF01和MNN4B-ORF02进行PCR 扩增。结果如图3所示，泳道1为MNN4B缺陷型，泳道2为野生型；以野生型X33菌株基因组为模板的PCR产物大小在912bp左右，MNN4缺陷型工程菌无扩增条带，也证明了磷酸甘露糖合成酶敲除的，命名为GJK03，为磷酸甘露糖转移酶和磷酸甘露糖合成酶敲除的重组毕赤酵母菌。

GJK02、GJK03菌(已敲除och1、pno1、mnn4b)的DSA-FACE糖型分析结果(方法同实施例一中所述)如图4所示，可见pno1、mnn4b敲除后糖型中的磷酸甘露糖部分被去除了。

三、β甘露糖转移酶基因ARM2灭活的酵母菌株构建

磷酸甘露糖转移酶、磷酸甘露糖合成酶和β甘露糖转移酶ARM2(即β甘露糖转移酶II) 基因灭活的酵母菌株GJK04为毕赤酵母GJK03中编码SEQ ID No.5所示β甘露糖转移酶ARM2的DNA分子部分敲除而获得，即敲除GJK03酵母基因组中的β甘露糖转移酶ARM2 基因，得到的重组酵母；即酵母基因组中的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶基因、磷酸甘露糖合成酶基因和β甘露糖转移酶ARM2已被灭活。

1、构建β甘露糖转移酶ARM2基因灭活载体

载体构建方法同步骤一，具体如下：

利用同上述一的方法，用玻璃珠制备法提取毕赤酵母X33的基因组DNA，以该基因组 DNA为模板扩增β甘露糖转移酶(ARM2)基因两侧的同源臂，ARM2两侧的同源臂分别约为0.6kb，中间缺失约0.6kb的编码基因。

扩增ARM2上游侧翼区同源臂(ARM2 5′同源臂)所用的引物为ARM2-5-5和ARM2-5-3，引物序列分别为：

5′-ActTGGTACCACACGACTCAACTTCCTGCTGCTC-3′(划线部分为Kpn I识别位点)；

5′-actGCGGCCGCCACGAAACTTCTTACCTTTGACAA-3′(划线部分为Not I识别位点)。

扩增ARM2下游侧翼区同源臂(ARM23′同源臂)所用的引物为ARM2-3-5和ARM2-3-3，引物序列分别为：

5′-TTGTCAAAGGTAAGAAGTTTCGTGGCGGCCGCTATCTTGACATTGTCATTCAGTG A-3′(划线部分为Not I识别位点)；

5′-caaTCTAGAGCCTCCTTCTTTTCCGCCT-3′(划线部分为Xba I识别位点)。

2、敲除质粒对毕赤酵母的转化

敲除质粒采用电转化法将敲除质粒转化入上述一构建的毕赤酵母工程菌株GJK03中，电转化的方法、鉴定方法同上述一。

PCR反应所用的两对引物分别是：ARM2基因5’同源臂外的引物序列ARM2-5-5OUT：5′-TTTTCCTCAAGCCTTCAAAGACAG-3′和载体上的引物序列inner01： 5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′，引物所扩增的条带在0.8kb左右为阳性克隆。

3、PCR鉴定阳性工程菌株

将其中一个阳性克隆接种于5-FOA培养基(配方同前)上长出克隆后，提取这些克隆的基因组，进行PCR鉴定：以基因组为模板，鉴定引物为染色体上ARM2基因同源臂外的序列Arm-ORF01和Arm-ORF02，引物序列：

Arm2-ORF-09：5'-gggcagaagatcctagag-3'；

Arm2-ORF-10：5'-tcgtctccattgctatctacgact-3'。

以阳性克隆基因组DNA为模板，用引物Arm2-ORF-09和Arm2-ORF-10进行PCR扩增，结果如图5所示，泳道1为ARM2缺陷型，泳道2为野生型；结果以野生型X33菌株基因组为模板的PCR产物大小在600bp左右，ARM2缺陷型工程菌无扩增条带，也证明了β甘露糖转移酶(ARM2)敲除的，命名为GJK04，为磷酸甘露糖转移酶、磷酸甘露糖合成酶和β甘露糖转移酶II(ARM2)基因敲除的重组毕赤酵母菌。

四、β甘露糖转移酶ARM1、ARM3、ARM4基因灭活的酵母菌株构建

根据上述步骤一至三，同β甘露糖转移酶基因ARM2灭活的酵母菌株构建的设计方法和构建过程，在GJK04工程菌的基础上先后敲除β甘露糖转移酶ARM1、ARM3、ARM4(即 β甘露糖转移酶I、III和IV，氨基酸序列分别为SEQ ID No.4、SEQ ID No.6和SEQ ID No.7)，分别构建获得GJK05、GJK07、GJK18工程菌株。

1、构建β甘露糖转移酶ARM1、ARM3、ARM4基因灭活载体

载体构建方法同步骤三，差别之处在于：

扩增ARM1上游侧翼区同源臂(ARM1 5′同源臂)所用的引物为ARM1-5-5和ARM1-5-3，引物序列分别为：

ARM1-5-5：5'-TCAACGCGTTGGCTCTGGATCGTTCTAATA-3'(划线部分为MluI识别位点)；

ARM1-5-3：5'-ttctccgttctcctttctccgtGCGGCCGCcagcagcaaggaagataccaa-3'(划线部分为NotI 识别位点)。

扩增ARM1下游侧翼区同源臂(ARM1 3′同源臂)所用的引物为ARM1-3-5和ARM1-3-3，引物序列分别为：

ARM1-3-5：5'-ttggtatcttccttgctgctgGCGGCCGCacggagaaaggagaacggagaa-3'(划线部分为 NotI识别位点)；

ARM1-3-3：5'-TCAACGCGTTGGCTGGAGGTGACAGAGGAA-3'(划线部分为MluI识别位点)。

扩增ARM3上游侧翼区同源臂(ARM3 5′同源臂)所用的引物为ARM3-5-5和ARM3-5-3，引物序列分别为：

ARM3-5-5：5'-TCAACGCGTTAGTAGTGCCGTGCCAAGTAGCG-3'(划线部分为MluI 识别位点)；

ARM3-5-3：5'-tcctactttgcttatcatctgccGCGGCCGCggtcaggccctcttatggttgtg-3'(划线部分为 NotI识别位点)。

扩增ARM3下游侧翼区同源臂(ARM3 3′同源臂)所用的引物为ARM3-3-5和ARM3-3-3，引物序列分别为：

ARM3-3-5：5'-_cacaaccataagagggcctgaccGCGGCCGCggcagatgataagcaaagtagga-3'(划线部分为NotI识别位点)；

ARM3-3-3：5'-TCAACGCGTCATAGGTAATGGCACAGGGATAG-3'(划线部分为MluI 识别位点)。

扩增ARM4上游侧翼区同源臂(ARM4 5′同源臂)所用的引物为ARM4-5-5和ARM4-5-3，引物序列分别为：

ARM4-5-5：5'-TCAACGCGTGCAGCGTTTACGAATAGTGTCC-3'(划线部分为MluI识别位点)；

ARM4-5-3：5'-gcatagggctgaagcatactgtGCGGCCGCaatgatatgtacgttcccaaga-3'(划线部分为 NotI识别位点)。

扩增ARM4下游侧翼区同源臂(ARM4 3′同源臂)所用的引物为ARM4-3-5和ARM4-3-3，引物序列分别为：

ARM4-3-5：5'-tcttgggaacgtacatatcattGCGGCCGCacagtatgcttcagccctatgc-3'(划线部分为NotI 识别位点)；

ARM4-3-3：5'-TCAACGCGTGAGGTGGACAAGAGTTCAACAAAG-3'(划线部分为MluI 识别位点)。

2、敲除质粒对毕赤酵母的转化

同步骤三，差别之处在于，PCR反应所用的两对引物分别是：

ARM1基因5’同源臂外的引物序列ARM1-5-5OUT：5′-GTTCTGGTATGCGTTCTA TTCTTC-3′和载体上的引物序列inner01：5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′，引物所扩增的条带在3.5kb左右为阳性克隆。

ARM3基因5’同源臂外的引物序列ARM3-5-5OUT：5′-TATTTGCCTTCTTCACCGT TAT-3′和载体上的引物序列inner01：5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′，引物所扩增的条带在3.7kb左右为阳性克隆。

ARM4基因5’同源臂外的引物序列ARM4-5-5OUT：5′-TCCGTTGAGGGTGCTAAT GGTA-3′和载体上的引物序列inner01：5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′，引物所扩增的条带在3.7kb左右为阳性克隆。

3、PCR鉴定阳性工程菌株

同步骤三，差别之处在于，利用下面引物对工程菌进行鉴定，可以发现基因已被敲除(图 6、图7和图8)：

Arm1-ORF-09：5'-TAGTCTGGTTTGCGGTAGTGT-3'；

Arm1-ORF-10：5'-AGATTGAGCATAGGAGTGGC-3'。

Arm3-ORF-09：5'-AAACGGAGTCCAGTTCTTCT-3'；

Arm3-ORF-10：5'-CAACTTTGCCTGTCATTTCC-3'。

Arm4-ORF-09：5'-CGCTTCAGTTCACGGACATA-3'；

Arm4-ORF-10：5'-GCAACCCAGACCTCCTTACC-3'。

GJK18菌的DSA-FACE糖型分析结果如图9所示。因β甘露糖的修饰仅仅添加在甘露糖的个别末端，尽管糖型分析结果并没有实质性的变化，但β甘露糖是潜在的引起免疫原性的糖，因此对于用于人体的药物来源，存在潜在的风险，本发明将所有的β甘露糖均灭活，因此从根本上解决了存在β甘露糖的问题，且糖型结构没有被改变。

五、具有哺乳动物Man5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株构建

首先，为了鉴定外源甘露糖苷酶I(MDSI)是否正确地发挥了作用，本发明提前在GJK18 工程菌中引入了一个报告蛋白，本发明以抗Her2抗体为报告蛋白，因此构建了抗Her2抗体的表达载体。该载体的构建方法、载体转化方法已经在申请专利中公开(公开号：CN101748145A)。利用该方法将抗Her2抗体表达载体转入至GJK18宿主菌中，获得了表达抗Her2抗体的W2工程菌株。

其次，具有哺乳动物Man5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株W10为 C端融合HDEL序列的MDSI(TrmdsI，核苷酸序列如SEQ ID No.14所示，编码SEQ ID No.9所示MDSI蛋白)插入宿主菌W2的基因组中，得到的工程菌。

1、外源甘露糖苷酶I(MDSI)表达载体的构建

表达外源甘露糖苷酶I重组载体pPIC9-TrmdsI为将SEQ ID No.14所示的DNA分子插入 pPIC9载体的Xho I和EcoR I酶切位点间得到的重组载体。

其中，SEQ ID No.14自5’末端第1-1524位核苷酸为优化后的甘露糖苷酶I编码基因，自 5’末端第1525-1536位核苷酸为内质网保留信号——HDEL编码基因。

(1)甘露糖苷酶I(MDSI)基因

外源甘露糖苷酶I可以是来源于丝状真菌、植物、昆虫、爪哇、哺乳动物等的甘露糖苷酶I，本实施例选取绿色木霉的甘露糖苷酶I(詹洁.绿色木霉α-1,2-甘露糖苷酶在毕赤酵母中的克隆表达与活性鉴定[学位论硕士文].)，并在甘露糖苷酶I的C-端融合了内质网保留信号 ——HDEL。

根据詹洁.绿色木霉α-1,2-甘露糖苷酶在毕赤酵母中的克隆表达与活性鉴定[学位论硕士文].公布的绿色木霉的甘露糖苷酶I序列，根据酵母偏爱密码子和基因高表达原则优化编码基因，并在C端融合HDEL序列，得到基因片段(SEQ ID No.14)。

(2)设计并合成如下引物：

TrmdsI-5：5’-TCTCTCGAGAAAAGAGAGGCTGAAGCTTATCCAAAGCCGGGC GCCAC-3’；下划线所示序列为Xho I酶切识别位点。

TrmdsI-3：5’-AGGGAATTCTTACAACTCGTCGTGAGCAAGGTGGCCGCCCCGT CGTGATG-3’；下划线所示序列为EcoR I酶切识别位点。

(3)以上述(1)得到的基因片段为模板，以TrmdsI-5和TrmdsI-3为引物，进行PCR扩增，得到PCR扩增产物，命名为TrmdsI，该产物含有SEQ ID No.14。

(4)Xho I和EcoR I双酶切上述(3)获得的PCR产物，得到基因片段；Xho I和EcoR I双酶切pPIC9载体得到载体大片段；将基因片段与载体大片段连接，得到重组质粒，将其命名为pPIC9-TrmdsI。将pPIC9-TrmdsI测序，结果正确。

2、表达外源甘露糖苷酶I的重组酵母的构建

将约10μg pPIC9-TrmdsI质粒，用Sal I线性化，用1/10体积的3M醋酸钠和3倍体积的无水酒精沉淀线性化的质粒。用体积百分含量为70％的乙醇水溶液洗两次以除去其中的盐，晾干，加入约30μL水重悬沉淀，获得用于转化的pPIC9-TrmdsI线性化质粒。

以下步骤中制备酵母电转化感受态细胞的方法参照Invitrogen公司的相关手册和 “Molecular Cloning，A laboratory Manual(Fourth Edition)”,2012Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New YorK。选用的宿主菌是上述构建的W2工程菌。

具体如下：

将毕赤酵母W2在YPD平板(酵母提取物10g/L，胰蛋白胨20g/L，葡萄糖20g/L，琼脂15g/L)上用划线法分离单克隆，28℃温箱培养2天。接种一个单克隆至一个装有10mL YPD液体培养基(酵母提取物10g/L，胰蛋白胨20g/L，葡萄糖20g/L)的50mL三角瓶中，28℃ 过夜培养至OD₆₀₀约为2，得到菌液。再将0.1-0.5mL菌液接种到含有500mL YPD液体培养基的3.5L摇瓶中，培养过夜至OD₆₀₀至1.3-1.5之间。将菌液转移至无菌的离心瓶中，4℃， 1500g离心10分钟。用500mL预冷的无菌水重悬菌体，4℃，1500g离心10分钟收获细胞，用250mL预冷的无菌水再洗一次。用20mL预冷的无菌1M山梨醇重悬菌体，4℃，1500g离心10分钟收获细胞，用预冷的1M山梨醇重悬菌体至终体积为1.5mL，得到菌悬液。

取80μL菌悬液与10μL用于转化的pPIC9-TrmdsI线性化质粒，在微量离心管中混匀，得到混合物，将其置冰上5min，将混合物转移到一个冰冷的0.2cm电转杯中，电穿孔细胞 (Bio-Rad Gene Pulser，2000V，25μF，200Ω)，再立即向电转杯中加入1mL冰冷的1M山梨醇，并小心地将混合物(转化细胞)转移至15mL培养管中。

将培养管放在28℃温箱孵育1h，不要摇动。然后加入1mL YPD液体培养基后在28℃， 250rpm的摇床中孵育3h。取200μL转化细胞涂布到含MD平板上(1.34g/100ml的YNB， 4×10^-5g/100ml Biotin，2g/100ml的葡萄糖)。28℃温箱培养2-5天，至形成单克隆，即W2-Tr，命名为W10。

用玻璃珠制备法提取W10的基因组DNA，以基因组DNA为模板，以TrMDSI-1.3kb-01和TrMDSI-1.3kb-02为引物，进行PCR扩增，得到PCR扩增产物约1.3kb，证明MDSI已插入到基因组中，即为阳性工程菌(图10中A)。

TrMDSI-1.3kb-01：5’-GAACACGATCCTTCAGTATGTA-3’；

TrMDSI-1.3kb-02：5’-TGATGATGAACGGATGCTAAAG-3’。

W10菌的DSA-FACE糖型分析结果(方法同实施例一中所述方法)如图10中B所示，可见转入TrmdsI后，W10菌表达蛋白的糖型结构为Man5GlcNAc2、Man6GlcNAc2，其中以Man5GlcNAc2为主。

六、具有哺乳动物GlcNAcMan5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株构建

具有哺乳动物GlcNAcMan5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株1-8为将含mnn9定位信号的N-乙酰葡萄糖胺转移酶I(GnTI)(核苷酸序列如SEQ ID No.15所示，编码SEQ ID No.10所示蛋白)的DNA片段插入宿主菌W10基因组中，得到的工程菌。

其中，SEQ ID No.15自5’末端第1-114位核苷酸为mnn9定位信号，自5’末端第115-1335 位核苷酸为N-乙酰葡萄糖胺转移酶I编码基因。

1、含mnn9定位信号的N-乙酰葡萄糖胺转移酶I(GnTI)表达载体的构建

(1)调取人gnt1基因

用人gnt1基因上游引物(mnn9-GnTI-01：5’-tcagtcagcgctctcgatggcgaccccg-3’)和下游引物GnTI-02：5’-GCGAATTCTTAGTGCTAATTCCAGCTAGGATCATAG-3’(下划线为EcoR I酶切位点)，用PCR的方法从人肝胎cDNA文库(购自Clontech Laboratories Inc.1290TerraBella Ave.Mountain View，CA94043,USA)获得人gnt1基因全长片段，PCR反应条件：94℃预变性5分钟，94℃变性30秒，52℃退火30秒，72℃延伸1分钟30秒，循环30次；最后 72℃延伸10分钟。PCR扩增产物用0.8％的琼脂糖凝胶电泳分离，用DNA回收试剂盒进行回收。

(2)含定位信号mnn9的GnTI DNA片段

S.cere MNN9高尔基体定位信号：ScMNN9-03： tatAATattATGTCACTTTCTCTTGTATCGTACCGCCTAAGAAAGAACCCGTGGGTTAACATT TTTCTACCTGTTTTGGCCATATTTCTAATATATATAATTTTTTTCCAGAGAGATCAATCTtcagt cagcgctctcgatggcgaccccg

以含有S.cere MNN9高尔基体定位信号编码序列的上游引物ScMNN9-03 (tatAATattATGTCACTTTCTCTTGTATCGTACCGCCTAAGAAAGAACCCGTGGGTTAACA TTTTTCTACCTGTTTTGGCCATATTTCTAATATATATAATTTTTTTCCAGAGAGATCAATCTtc agtcagcgctctcgatggcgaccccg，下划线为SspI酶切位点)和GnTI催化结构域编码区下游引物 GnTI-02，通过PCR反应将回收纯化的1.2kb GnTI片段和S.cere MNN9高尔基体定位信号编码序列相连接，使用Pyrobest DNA聚合酶扩增mnn9-gnt1基因片段(SEQ ID No.15)。

PCR反应条件：94℃变性2分钟，52℃退火30秒、72℃延伸5分钟，之后94℃变性30秒，52℃退火30秒，72℃延伸1分钟30秒，循环30次；最后72℃延伸10分钟。

PCR扩增产物经0.8％的琼脂糖凝胶电泳(8V/cm，15分钟)分离，紫外灯下用洁净的刀片切下1.3kb的目的条带，用DNA回收试剂盒进行回收，方法同上。

(3)PGE-URA3-GAP1-mnn9-GnTI表达载体的构建

Ssp I和EcoR I双酶切上述(2)获得的mnn9-gnt1基因片段PCR产物，得到基因片段； Ssp I和EcoR I双酶切PGE-URA3-GAP1(杨晓鹏,刘波,宋淼,巩新,唱韶红,薛奎晶,吴军. Man5GlcNAc2哺乳动物甘露糖型糖蛋白的毕赤酵母表达系统构建.生物工程学报.2011；27:108-17.)载体得到载体大片段；将基因片段与载体大片段连接，得到重组质粒，将其命名为PGE-URA3-GAP1-mnn9-GnTI。测序，结果正确。

PGE-URA3-GAP1-mnn9-GnTI为将SEQ ID No.15所示的DNA分子插入 PGE-URA3-GAP1载体的酶切位点Ssp I和EcoR I之间后得到的重组载体。

2、表达外源甘露糖苷酶I的重组酵母的构建

将约10μg PGE-URA3-GAP1-mnn9-GnTI质粒，用Nhe I线性化，获得用于转化的PGE-URA3-GAP1-mnn9-GnTI线性化质粒，制备酵母电转化感受态细胞的方法上述步骤五。

选用的宿主菌是上述步骤五构建的的W10工程菌。转化后在MD平板上形成的单克隆，命名为1-8。

用玻璃珠制备法提取1-8的基因组DNA，以基因组DNA为模板，以HuGnTI-0.9k-01和HuGnTI-0.9k-02为引物，进行PCR扩增，得到PCR扩增产物约0.9kb，证明GnTI已插入到基因组中，即为阳性工程菌(如图11中A)。

HuGnTI-0.9k-01：5’-TGGACAAGCTGCTGCATTATC-3’；

HuGnTI-0.9k-02：5’-CGGAACTGGAAGGTGACAATA-3’。

1-8菌的DSA-FACE糖型分析结果(方法同实施例一中所述方法)如图11中B所示，可见转入GnTI后，宿主菌表达蛋白的主要糖型结构为GlcNAcMan5GlcNAc2。

七、具有哺乳动物GalGlcNAcMan5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌构建

具有哺乳动物GalGlcNAcMan5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株 1-8-4为将kre2-GalE-GalT基因片段(核苷酸序列如SEQ ID No.16所示，编码SEQ IDNo.11 所示蛋白)插入宿主菌1-8基因组中，得到的工程菌1-8-4。

其中，SEQ ID No.16自5’末端第1-294位核苷酸为kre2定位信号，自5’末端第295-1317 位核苷酸为半乳糖异构酶GalE编码基因、自5’末端第1325-2394位核苷酸为半乳糖转移酶GalT编码基因。

1、含kre2定位信号的半乳糖转移酶(GalE+T)表达载体的构建

(1)调取人GalE、GalT基因

用人GalE基因上游引物GalE5’和下游引物GalE3’，用人GalT基因上游引物GalT5’和下游引物GalT3’，用PCR的方法分别从人肝胎cDNA文库(购自Clontech LaboratoriesInc.1290 Terra Bella Ave.Mountain View，CA94043,USA)获得人GalE、GalT基因全长片段，PCR反应条件：94℃预变性5分钟，94℃变性30秒，52℃退火30秒，72℃延伸1分钟30秒，循环 30次；最后72℃延伸10分钟。PCR扩增产物分别用0.8％的琼脂糖凝胶电泳分离，用DNA回收试剂盒分别进行回收。

GalE5’：5’-ATGAGAGTTCTGGTTACCGGTGGTA-3’；

GalE3’：5’-AGGGTACCATCGGGATATCCCTGTGGATGGC-3’(KpnI)；

GalT5’：5’-ATGGTACCGGTGGTGGACGTGACCTTTCTCGTCTGCCA-3’(KpnI)。

GalT3’：5’-GCatttaaatttaGCTCGGTGTCCCGATGTCCACTGTGAT-3’(SwaI)。

(2)含定位信号kre2的GalE-GalT DNA片段

Kre2 5’：5’-ATAATattAAACGATGGCCCTCTTTCTCAGTAAGAG-3’(下划线SspI I位点)；

Kre2 3’+GalE5’：5’-CACCGGtAACCAGaACTctCatGATCGGGGCAtctgccttttcagcggcagctttcagagccttggattc-3’。

用PCR的方法从酿酒酵母S.cere基因组DNA中调取kre2定位信号片段。PCR条件同上。

以含有S.cere kre2高尔基体定位信号编码序列的上游引物Kre2和GalE+GalT催化结构域编码区下游引物GalT3’，通过PCR反应将回收纯化的GalE、GalT片段和S.cerekre2高尔基体定位信号编码序列相连接，使用Pyrobest DNA聚合酶扩增kre2-GalE-GalT基因片段。

PCR反应条件：94℃变性2分钟，52℃退火30秒、72℃延伸5分钟，之后94℃变性30秒，52℃退火30秒，72℃延伸4分钟30秒，循环30次；最后72℃延伸10分钟。

PCR扩增产物经0.8％的琼脂糖凝胶电泳(8V/cm，15分钟)分离，紫外灯下用洁净的刀片切下2.4kb的目的条带，用DNA回收试剂盒进行回收，方法同上。

(3)PGE-URA3-GAP1-kre2-GalE-GalT载体的构建

先用SwaI酶切上述kre2-GalE-GalT的DNA分子，再用T4 PNK酶(大连宝生物有限公司)磷酸化该基因片段；Ssp I和SwaI双酶切PGE-URA3-GAP1载体得到载体大片段；将基因片段与载体大片段连接，得到重组质粒，将其命名为PGE-URA3-GAP1-kre2-GalE-GalT。测序，结果正确。

PGE-URA3-GAP1-kre2-GalE-GalT为将SEQ ID No.16所示的kre2-GalE-GalT的DNA分子插入PGE-URA3-GAP1载体的Ssp I和SwaI酶切位点得到的重组载体。

2、表达外源UDP-Gal和乳糖转移酶的重组酵母的构建

将约10μg PGE-URA3-GAP1-kre2-GalE-GalT质粒，用Nhe I线性化，获得用于转化的 PGE-URA3-GAP1-kre2-GalE-GalT线性化质粒，制备酵母电转化感受态细胞的方法同上述步骤五。

选用的宿主菌是步骤六构建的1-8工程菌。转化后在MD平板上形成的单克隆，命名为 1-8-4。

用玻璃珠制备法提取1-8-4的基因组DNA，以基因组DNA为模板，分别以GalE-T(1.5k)-01 (5’-TGATAACCTCTGTAACAGTAAGCGC-3’)和GalE-T(1.5k)-02 (5’-GGAGCTTAGCACGATTGAATATAGT-3’)为引物，进行PCR扩增，得到PCR扩增产物分别为1.5kb，证明GalE-T已插入到基因组中，即为阳性工程菌(如图12中A)。

1-8-4菌的DSA-FACE糖型分析结果(方法同实施例一中所述方法)如图12中B所示，可见转入半乳糖异构酶和半乳糖转移酶后，宿主菌表达蛋白的主要糖型结构为GalGlcNAcMan5GlcNAc2。

八、具有哺乳动物GalGlcNAcMan3GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株构建

具有哺乳动物GalGlcNAcMan3GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株 52-60为将MDSII DNA分子(核苷酸序列如SEQ ID No.17所示，编码SEQ ID No.12所示蛋白)插入宿主菌1-8-4的基因组中，得到的工程菌52-60。

其中，SEQ ID No.17自5’末端第1-108位核苷酸为甘露糖苷酶II编码基因的mnn2定位信号，自5’末端第109-3303位核苷酸为甘露糖苷酶II编码基因。

1、含mnn2定位信号的甘露糖苷酶II(MDSII)表达载体的构建

(1)全基因合成方式合成含mnn2定位信号的MDSII基因

根据序列利用全基因合成方式合成含mnn2的MDSII基因(SEQ ID No.17)，由南京金瑞斯公司合成并克隆至pUC57克隆载体中，获得pUC57-MDSII。

设计MDSII基因上游引物(mnn2-MDSII-01： 5’-ATAATattAAACCatgctgcttaccaaaaggttttcaaagctgttc-3’)(下划线为SspI酶切位点)和下游引物(MDSII-02：5’-GCTATTTA AATctattaCCTCAACTGGATTCGGAATGTGC TG ATTTCCATTG-3’)(下划线为SwaI酶切位点)，用PCR的方法从pUC57-MDSII获得人MDSII 基因全长片段PCR产物，PCR反应条件：94℃预变性5分钟，94℃变性30秒，52℃退火30 秒，72℃延伸4分钟30秒，循环30次；最后72℃延伸10分钟。PCR扩增产物(序列17) 用0.8％的琼脂糖凝胶电泳分离，用DNA回收试剂盒进行回收。

(2)PGE-URA3-arm3-GAP-mnn2-MDSII表达载体的构建

先用SwaI酶切上述PCR产物，再用T4 PNK酶(大连宝生物有限公司)磷酸化该基因片段；Ssp I和SwaI双酶切PGE-URA3-GAP1载体得到载体大片段；将基因片段与载体大片段连接，得到重组质粒，将其命名为PGE-URA3-arm3-GAP-mnn2-MDSII。测序，结果正确。

PGE-URA3-arm3-GAP-mnn2-MDSII为将SEQ ID No.17所示DNA分子插入 PGE-URA3-GAP1载体的Ssp I和Swa I酶切位点得到的重组载体。

2、表达外源甘露糖苷酶II的重组酵母的构建

将约10μg PGE-URA3-arm3--GAP-mnn2-MDSII质粒，用Msc I线性化，获得用于转化的 PGE-URA3-arm3-GAP-mnn2-MDSII线性化质粒，制备酵母电转化感受态细胞的方法同上述步骤五。

选用的宿主菌是步骤七构建的1-8-4工程菌。转化后在MD平板上形成的单克隆，命名为52-60。

用玻璃珠制备法提取52-60的基因组DNA，以基因组DNA为模板，分别以 CeMNSII-1.2k-01和CeMNSII-1.2k-02为引物，进行PCR扩增，得到PCR扩增产物分别为1.2 kb，证明MDSII已插入到基因组中，即为阳性工程菌(图13中A)。

CeMNSII-1.2k-01：5’-CAGATGGATGAGCATAGAGTTA-3’；

CeMNSII-1.2k-02：5’-GACAAGAGGATAATGAAGAGAC-3’。

52-60菌的DSA-FACE糖型分析结果如图13中C所示。可见，转入后外源甘露糖苷酶II，宿主菌表达蛋白的主要糖型结构为GalGlcNAcMan3GlcNAc2。

九、具有哺乳动物Gal2GlcNAc2Man3GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株构建

具有哺乳动物Gal2GlcNAc2Man3GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株 150L2为将GnT II DNA分子(核苷酸序列如SEQ ID No.18所示，编码SEQ ID No.13所示蛋白)插入宿主菌52-60的基因组中，得到的工程菌150L2。

其中，SEQ ID No.18自5’末端第1-108位核苷酸为N-乙酰葡萄糖胺转移酶II编码基因的 mnn2定位信号，自5’末端第109-1185位核苷酸为N-乙酰葡萄糖胺转移酶II。

1、mnn2定位信号的N-乙酰葡萄糖胺转移酶II(GnTII)表达载体的构建

(1)全基因合成方式合成GnTII基因

根据序列利用全基因合成方式合成含mnn2的GnTII基因(SEQ ID No.18)，由南京金瑞斯公司合成并克隆至pUC57克隆载体中，获得pUC57-GnTII。

设计GnTII基因上游引物(mnn2-GnTII-01：5’-ATAATattAAACCatgctgcttaccaaaaggttttcaaagctgttc-3’)(下划线为SspI酶切位点)和下游引物(GnTII-02：5’-GCTatttaaatTTAtcactgcagtcttctataacttttac-3’)(下划线为SwaI酶切位点)，用PCR的方法从pUC57-GnTII 获得含mnn2定位信号的N-乙酰葡萄糖胺转移酶II(GnTII)DNA分子，PCR反应条件：94℃ 预变性5分钟，94℃变性30秒，52℃退火30秒，72℃延伸2分钟30秒，循环30次；最后 72℃延伸10分钟。PCR扩增产物用0.8％的琼脂糖凝胶电泳分离，用DNA回收试剂盒进行回收。

(2)PGE-URA3-arm3-GAP-mnn2-GnTII表达载体的构建

酶切及构建方法与PGE-URA3-arm3-GAP-mnn2-MDSII构建方法一致，得到重组质粒，将其命名为PGE-URA3-arm3-GAP-mnn2-GnTII。测序，结果正确。

PGE-URA3-arm3-GAP-mnn2-GnTII为将SEQ ID No.18所示DNA分子插入 PGE-URA3-GAP1载体的Ssp I和Swa I酶切位点得到的重组载体。

2、表达外源N-乙酰葡萄糖胺转移酶II的重组酵母的构建

将约10μg PGE-URA3-arm3-GAP-mnn2-GnTII质粒，用Msc I线性化，获得用于转化的 PGE-URA3-arm3-GAP-mnn2-GnTII线性化质粒，制备酵母电转化感受态细胞的方法同上述步骤五。

选用的宿主菌是步骤八构建的52-60工程菌。转化后在MD平板上形成的单克隆，命名为150L2。

用玻璃珠制备法提取150L2的基因组DNA，以基因组DNA为模板，分别RnGnTII-0.8k-01 和RnGnTII-0.8k-02为引物，进行PCR扩增，得到PCR扩增产物为0.8kb，证明GnTII已插入到基因组中，即为阳性工程菌(图13中B)。

RnGnTII-0.8k-01：5’-ATCAACAGTCTGATCTCTAGTG-3’；

RnGnTII-0.8k-02：5’-AGTTCATGGTCCCTAATATCTC-3’。

十、工程化菌株中抗her2抗体基因的敲除

抗her2抗体基因灭活的酵母菌株3-5-11为将SEQ ID No.19所示的DNA分子(抗her2 抗体轻重链基因敲除序列)导入毕赤酵母150L2中，与150L2基因组中的同源序列发生同源重组，敲除酵母基因组中的抗her2抗体轻重链基因，得到的重组酵母。

构建抗her2抗体轻重链基因灭活载体、敲除质粒对毕赤酵母的转化、PCR鉴定阳性工程菌株与前述步骤方法相同，抗her2抗体基因灭活的酵母菌株命名为3-5-11。

十一、工程化菌株中灭活O-甘露糖转移酶I基因

因发现宿主菌存在不稳定性，容易丢失MDSI和MDSII基因，因此在O-甘露糖转移酶I 基因灭活之前，按照本实施例步骤八和步骤五的同样技术方法，在3-5-11中宿主菌先后转入 SEQ ID No.17(MDSII)和SEQ ID No.14(MDSI)，保证了工程菌内这两个基因的双拷贝，构建获得了670宿主菌。

O-甘露糖转移酶I基因灭活的酵母菌株7b为将编码SEQ ID No.8所示的O-甘露糖转移酶 I的DNA分子在毕赤酵母670中进行插入灭活，得到的酵母，命名为7b，即GJK30。GJK30 已经于2020年03月18日保藏于中国普通微生物菌种保藏管理中心，其保藏编号为CGMCC No.19488。

1、O-甘露糖转移酶基因灭活载体的构建

以质粒pPIC9(invitrogen公司)为模板，通过PCR方法获取终止子AOXTT序列。所用PCR钓取终止子引物AOXTT-5和AOXTT-3(5’-AOX1TT-5tctacgcgtccttagacatgactgttcctcagt-3’； AOX1TT-3：5’-tctacgcgtaagcttgcacaaacgaacttc-3’)。将得到的PCR产物用PCR产物回收纯化试剂盒纯化回收(鼎国生物技术有限公司，北京)，得到AOX1TT终止子片段。

本发明所用的载体pYES2(invitrogen公司)具有酵母的URA3筛选标记，可用于后续筛选工作。为了防止载体上的URA3基因的启动子对载体上其他基因的影响，本发明在URA3 基因末端添加AOX1TT终止子。具体构建方法为：将上述获得的AOX1TT终止子片段回收后用MluI酶切，得到酶切片段；将该酶切片段与用同样用Mlu1处理过的载体pYES2连接，将连接产物转化大肠杆菌感受态细胞Trans5α(北京全式金生物技术有限公司，目录号CD201)扩增，将序列正确的克隆命名为Trans5α-pYES2-URA3-AOX1TT，提取质粒，得到URA3基因末端添加AOX1TT终止子的重组载体，记为pYES2-URA3-AOX1TT。

为了使构建的载体能够定点整合到毕赤酵母PMT1基因中，本发明利用PCR钓取PMT1 基因中ORF区的一个片段作为同源重组片段。为了确保失活载体整合到PMT1基因上能够引起PMT1基因的失活，本研究在引物两端加上不同组合的终止密码子，在钓取的PMT1基因片段3^′末端加上CYCTT终止子。

以毕赤酵母JC308(Invitrogen公司)基因组为模板，用玻璃珠制备法(A.亚当斯等，《酵母遗传学方法实验指南》，科学出版社，2000)提取毕赤酵母JC308的基因组DNA，以该基因组DNA为模板，利用引物PMT1-IN-5和PMT1-IN-3进行PCR扩增钓取PMT1基因片段。

PMT1-IN-5：5’-tctatgcattaatgatagttaatgactaatagagtaaaacaagtcctcaagaggt-3’；

PMT1-IN-3：5’-tgacataactaattacatgatctattagtcattaactatcattagatcagagtggggacgactaagaaa gc-3’。

钓取的PMT1基因片段两端加入具有不同组合的终止密码子，命名为PMT1-IN。

PCR钓取PMT1基因片段反应条件为94℃预变性5min；94℃变性30s，55℃退火30s，72℃延伸1min40s。共进行25个循环，最后72℃延伸10min。回收PCR产物即为钓取的PMT1 基因片段。

以含有CYCTT终止子的质粒pYES2为模板，利用引物CYC1TT-5和CYC1TT-3(CYC1TT-5：5’-gctttcttagtcgtccccactctgatctaatgatagttaatgactaatagatcatgtaattagttatgtca-3’； CYC1TT-3：5’-gcaaattaaagccttcgagcgtc-3’)进行PCR扩增钓取CYC1TT终止子片段。PCR反应条件为94℃预变性5min；94℃变性30s，55℃退火30s，72℃延伸1min。共进行25个循环，最后72℃延伸10min。回收PCR产物，即为CYC1TT终止子片段。

再以回收的PCR产物CYC1TT终止子片段和PMT1-IN片段(钓取的PMT1基因片段) 为模板，利用引物PMT1-IN-5和CYC1TT-3进行PCR扩增，连接PMT1-IN和CYC1TT片段，构建PMT1-IN-CYC1TT融合片段。PCR反应条件为94℃预变性5min；94℃变性30s，55℃ 退火30s，72℃延伸2.4min。共进行25个循环，最后72℃延伸10min。回收PCR产物，即为 PMT1-IN和CYC1TT终止子的连接片段——PMT1-IN-CYC1TT融合片段。回收后的产物用 Nsi1酶切后磷酸化，然后与pYES2-URA3-AOX1TT经Nsi1和Stu1酶切得到的载体骨架连接，得到的序列正确的重组载体为PMT1插入失活载体PMT1-IN-pYES2。

在钓取的PMT1基因片段的前端和末端各装上不同组合的终止密码子，并且在末端的终止密码子之后又装了CYC1TT终止子，即保证如果基因组整合正确PMT1基因便不会表达。 pYES2载体上含有毕赤酵母的URA3基因，为防止URA3基因启动子对PMT1基因的启动，在URA3基因后插入AOX1TT终止子。根据设计的引物，获得CYC1TT终止子(272bp)片段和PMT1(907bp)片段，与理论大小一致。PMT1-IN片段与CYC1TT融合片段大小是1135bp，通过以上PCR鉴定和测序等证明载体PMT1-IN-pYES2构建成功。

2、PMT1基因灭活菌株的构建

制备酵母670感受态细胞，制备方法为：

挑取670单菌落接种于2mL YPD+U培养基(该培养基为向YPD培养基中添加尿嘧啶得到的尿嘧啶浓度为100μg/mL的培养基)中，在25℃摇床以170r/min培养48h；然后取500μL 培养物，接种于100mL YPD+U培养基中，25℃下以170r/min培养24h，OD₆₀₀到达1.0；然后在4℃以6000r/min离心6min，用15mL的冷无菌水重悬菌体；相同条件下再次离心，用 15mL的冷无菌水重悬菌体；4℃下以6000r/min离心6min，用15mL冷的1mol/L山梨醇重悬菌体；相同条件下再次离心；倒掉上清，用1mL冷的1mol/L山梨醇重悬菌体，体积约1.5mL，即酵母670感受态细胞，置于冰上备用。

PMT1插入失活载体PMT1-IN-pYES2的电击转化：将PMT1插入失活载体 PMT1-IN-pYES2利用EcoRV酶切线性化后回收，终产物溶于20μL ddH₂O，即为线性化质粒；将85μL的670感受态细胞与线性化质粒混合于电转杯中，冰上放置5min，按毕赤酵母电转化手册上的条件进行电转化(2kV)，电击后立即加入700μL的1M的山梨醇，转移至1.5mL 离心管中，25℃下放置1h，涂布于MD+RH平板(该平板为向MD培养基中添加组氨酸和精氨酸得到的组氨酸和精氨酸浓度分别为100μg/mL和100μg/mL的固体培养基)，置于25℃ 下培养，待平板上长出的克隆提取基因组DNA，利用PMT1基因组外围引物 PMT1-ORF-OUT-5和PMT1-ORF-OUT-3做PCR鉴定，基因组鉴定正确的克隆命名为7b，即 GJK30。

PMT1-ORF-OUT-5：5’-aagacccatgccgaacacgac-3’；

PMT1-ORF-OUT-3：5’-gctctgaggcaccttgggtaa-3’。

利用插入失活载体插入整合的方式整合到毕赤酵母染色体中，由于载体中含有PMT1基因同源片段，理论上载体的整合属于定点整合，即插入在PMT1基因上，可以通过设计的特定引物进行鉴定和筛选。利用毕赤酵母的URA3筛选标记，通过压力筛选，鉴定MD+RH平板上长出的克隆。通过PMT1基因外围引物PMT1-ORF-OUT-5和PMT1-ORF-OUT-3做PCR 鉴定。如果PMT1-IN-pYES2载体正确整合到PMT1基因中，利用上面的引物可以得到8.6kb 大小的片段；对照(即酵母X33)为3kb大小的片段(图14)；由可知，此PMT1-IN-pYES2 载体正确整合到PMT1基因中，命名为7b，即GJK30。由于插入载体上设计了不同的终止密码子和终止子，因此，基因整合正确，PMT1基因便不会表达。

十二、GJK30工程菌的糖型结构分析

为了观察最终获得的GJK30的糖型结构是否正确，本发明在获得GJK30工程菌后引入了一个报告蛋白，同实施例一的方法，以抗Her2抗体为报告蛋白，抗Her2抗体的表达载体的构建方法、载体转化方法已经在申请专利中公开(见实施例一)。利用该方法将抗Her2抗体表达载体转入至GJK30宿主菌中，获得了表达抗Her2抗体的GJK30-HL工程菌株。糖型与前期获得的糖型(将Her2抗体表达载体转入至中国专利申请201410668305.X的实施例1构建的GJK08菌株中获得的对照重组工程菌，即与本发明GJK30-HL工程菌株相比，差别之处有三：本发明敲除的β甘露糖转移酶是I-IV，对照重组工程菌仅敲除了β甘露糖转移酶II；本发明还失活了O甘露糖转移酶I，对照重组工程菌没有；本发明导入外源MDSI和MDSII 是导入两次，对照重组工程菌是导入一次)尽管均含有Gal2GlcNAc2Man3GlcNAc2结构，但两者的比例明显不同，前期Gal2GlcNAc2Man3GlcNAc2结构低于50％(图15中A)，而GJK30 工程菌获得的Gal2GlcNAc2Man3GlcNAc2结构所占糖型比例大于60％，且整体糖型更为简单且均一(图15中B)。据众多文献报道，这种Gal2GlcNAc2Man3GlcNAc2糖型结构会影响蛋白的生物活性，如抗体的ADCC、CDC活性，因此它所占的比重就直接影响到蛋白的很多特性。通过商业化购买的糖苷酶(New England Biolabs，Beijing)对该糖型进行酶切分析，如图15中C示，由于Gal2GlcNAc2Man3GlcNAc2(G2)末端没有N-乙酰葡萄糖胺，所以在β-N- 乙酰氨基葡糖苷酶的作用下，Gal2GlcNAc2Man3GlcNAc2结构不会发生改变，而可以在外切酶β1,4-半乳糖苷酶的作用，剪切去除两个半乳糖，而形成GlcNAc2Man3GlcNAc2(G0)的结构；而同时在这两个外切酶的作用下，即先后剪切去除了半乳糖Gal和N-乙酰葡萄糖胺 GlcNAc，因而糖基结构变为Man3GlcNAc2结构，证明表达的糖型正确。

<110> 中国人民解放军军事科学院军事医学研究院

<120> 一种用于糖蛋白制备的工程化酵母构建方法及其菌株

<130> GNCLN200956

<160> 20

<170> PatentIn version 3.5

<210> 1

<211> 404

<212> PRT

<213> Artificial sequence

<400> 1

Met Ala Lys Ala Asp Gly Ser Leu Leu Tyr Tyr Asn Pro His Asn Pro

1 5 10 15

Pro Arg Arg Tyr Tyr Phe Tyr Met Ala Ile Phe Ala Val Ser Val Ile

20 25 30

Cys Val Leu Tyr Gly Pro Ser Gln Gln Leu Ser Ser Pro Lys Ile Asp

35 40 45

Tyr Asp Pro Leu Thr Leu Arg Ser Leu Asp Leu Lys Thr Leu Glu Ala

50 55 60

Pro Ser Gln Leu Ser Pro Gly Thr Val Glu Asp Asn Leu Arg Arg Gln

65 70 75 80

Leu Glu Phe His Phe Pro Tyr Arg Ser Tyr Glu Pro Phe Pro Gln His

85 90 95

Ile Trp Gln Thr Trp Lys Val Ser Pro Ser Asp Ser Ser Phe Pro Lys

100 105 110

Asn Phe Lys Asp Leu Gly Glu Ser Trp Leu Gln Arg Ser Pro Asn Tyr

115 120 125

Asp His Phe Val Ile Pro Asp Asp Ala Ala Trp Glu Leu Ile His His

130 135 140

Glu Tyr Glu Arg Val Pro Glu Val Leu Glu Ala Phe His Leu Leu Pro

145 150 155 160

Glu Pro Ile Leu Lys Ala Asp Phe Phe Arg Tyr Leu Ile Leu Phe Ala

165 170 175

Arg Gly Gly Leu Tyr Ala Asp Met Asp Thr Met Leu Leu Lys Pro Ile

180 185 190

Glu Ser Trp Leu Thr Phe Asn Glu Thr Ile Gly Gly Val Lys Asn Asn

195 200 205

Ala Gly Leu Val Ile Gly Ile Glu Ala Asp Pro Asp Arg Pro Asp Trp

210 215 220

His Asp Trp Tyr Ala Arg Arg Ile Gln Phe Cys Gln Trp Ala Ile Gln

225 230 235 240

Ser Lys Arg Gly His Pro Ala Leu Arg Glu Leu Ile Val Arg Val Val

245 250 255

Ser Thr Thr Leu Arg Lys Glu Lys Ser Gly Tyr Leu Asn Met Val Glu

260 265 270

Gly Lys Asp Arg Gly Ser Asp Val Met Asp Trp Thr Gly Pro Gly Ile

275 280 285

Phe Thr Asp Thr Leu Phe Asp Tyr Met Thr Asn Val Asn Thr Thr Gly

290 295 300

His Ser Gly Gln Gly Ile Gly Ala Gly Ser Ala Tyr Tyr Asn Ala Leu

305 310 315 320

Ser Leu Glu Glu Arg Asp Ala Leu Ser Ala Arg Pro Asn Gly Glu Met

325 330 335

Leu Lys Glu Lys Val Pro Gly Lys Tyr Ala Gln Gln Val Val Leu Trp

340 345 350

Glu Gln Phe Thr Asn Leu Arg Ser Pro Lys Leu Ile Asp Asp Ile Leu

355 360 365

Ile Leu Pro Ile Thr Ser Phe Ser Pro Gly Ile Gly His Ser Gly Ala

370 375 380

Gly Asp Leu Asn His His Leu Ala Tyr Ile Arg His Thr Phe Glu Gly

385 390 395 400

Ser Trp Lys Asp

<210> 2

<211> 462

<212> PRT

<213> Artificial sequence

<400> 2

Met Ser Thr Asp Ser Asn Leu Gly Tyr Gly Ile Ser Ile Ser Gly Gly

1 5 10 15

Ser Arg Ser Thr Gln Ser Leu Gly Thr Ser Arg Val Thr Pro Ser Arg

20 25 30

Ser Ala Asn His Glu Gly Lys Glu Asn Lys Ala Phe Ser Met Ile Ser

35 40 45

Pro Lys Lys Leu Ile Asn Lys Leu Ser Lys Ser Ser Val Ser Ser Asn

50 55 60

Asn Thr Ser Ser Ser Asn His Asp Ser Phe Val Asp Arg Lys Tyr Lys

65 70 75 80

Ile Glu Ile Glu Asn Ser Phe Ser Asp Arg Ser Val Ser Glu Val Asp

85 90 95

Leu Leu Glu Asp Ser Leu Asp Thr Thr Glu Gly Asp Ser Gly Glu Asn

100 105 110

Leu Val Ser Thr Pro Thr Gln Val Thr Leu Arg Pro Lys Arg Gly Asn

115 120 125

Ser Gln Asp Arg Asn Glu Asn Arg Val Leu Lys Glu Lys Glu Thr Ala

130 135 140

Val Arg Glu Ser Gln Arg His Thr Gly Phe Phe Thr Glu Ser Met Leu

145 150 155 160

Ser Pro Ser Asp Gly Ser Arg Gln Asp Thr Ser Asp Ser Pro Gly Ser

165 170 175

Ile Ser Ile Pro Thr Ala Glu Leu Ser Lys Lys Asn Leu Ser Asp Val

180 185 190

Ser Lys Ser Thr Ser Glu Asn Ser His Asn Arg Lys Trp Glu Ala Arg

195 200 205

Ser Ser Leu Leu Pro Glu Asn Leu Ser Ser Ile His Leu Asp Asp Ser

210 215 220

Pro Ile Glu Ile Tyr Glu Asp Ala Glu Glu Ile Ile Asp Glu Thr Val

225 230 235 240

Glu Glu Pro Arg Ser Ser Ile Pro Leu Gln Asn Glu Trp Glu Met Glu

245 250 255

Asp Thr Ile Leu Glu Gly Arg Leu Val Gln Ser Ala Ser Asp Pro Val

260 265 270

Ile Thr Ser Asn Asp Ile Ser Lys Glu Leu Arg Lys Ser Ile Ser Thr

275 280 285

Pro Ala Leu Thr His Ser Asp Leu Val Asp Phe Arg Lys Val Ile Pro

290 295 300

Gly Ser Ser His Tyr His Val Phe Thr Asp Pro Lys Ser Pro Phe Thr

305 310 315 320

Glu Asp Pro Ser Gln Leu Ala Tyr His Lys Ile Arg Asp Arg Asn Phe

325 330 335

Asp Ala His Tyr Ser Thr Asp Pro Ile Arg Leu Ser Ser Gly Ser Ser

340 345 350

Ser Glu Gly Ser Asp Glu Lys Asn Leu Leu Leu Gly Ser Arg Lys Pro

355 360 365

Ser Asp Pro Tyr Arg Leu Pro Tyr Glu Asp Glu Asp Gly Tyr Arg Phe

370 375 380

Trp Thr Lys Thr Pro Leu Asn Arg Glu Cys Pro Lys Arg Val Ala Leu

385 390 395 400

Trp Leu Leu Val Gly Ala Ile Leu Ala Pro Pro Val Trp Ile Met Met

405 410 415

Tyr Val Gly Phe Leu Asp Ser Ser Val Gly Arg Leu Pro Pro Lys Tyr

420 425 430

Arg Val Ile Ser Gly Val Leu Ala Leu Ser Met Ile Ile Leu Thr Ala

435 440 445

Met Gly Ile Ala Val Gly Phe Ala Tyr Gly Leu Asn Asn Arg

450 455 460

<210> 3

<211> 652

<212> PRT

<213> Artificial sequence

<400> 3

Met Phe Lys Glu Thr Ser Lys Asn Leu Phe Gly Ser Ile Asn Thr Phe

1 5 10 15

Asn Thr Val Glu Tyr Val Met Tyr Met Met Leu Leu Leu Thr Ala Tyr

20 25 30

Phe Leu Asn His Leu Leu His Ser Leu Asp Asn Ile Asn His Leu Val

35 40 45

Glu Ser Asp Val Asn Tyr Gln Leu Leu Gln Arg Val Thr Asn Lys Val

50 55 60

Lys Leu Phe Asp Glu Glu Ala Val Leu Pro Phe Ala Lys Asn Leu Asn

65 70 75 80

Arg Arg Thr Glu Arg Phe Asp Pro Arg Leu Pro Val Ala Ala Tyr Leu

85 90 95

Arg Ser Leu Gln Asp Gln Tyr Ser Glu Leu Pro Gln Gly Thr Asp Leu

100 105 110

Asn Asp Ile Pro Pro Leu Glu Val Ser Phe His Trp Asp Asp Trp Leu

115 120 125

Ser Leu Gly Ile Ala Ser Thr Phe Trp Asp Ala Phe Asp Asn Tyr Asn

130 135 140

Lys Arg Gln Gly Glu Asn Ala Ile Ser Tyr Glu Gln Leu Gln Ala Ile

145 150 155 160

Leu Val Asn Asp Leu Glu Asp Phe Ser Pro Tyr Thr Ala His Ile Leu

165 170 175

His Ser Asn Val Glu Val Tyr Lys Tyr Arg Thr Ile Pro Gln Lys Ile

180 185 190

Val Tyr Met Ser Asn Lys Gly Tyr Phe Glu Leu Leu Val Thr Glu Lys

195 200 205

Glu Lys Leu Ser Asn Glu Gly Leu Trp Ser Ile Phe His Gln Lys Gln

210 215 220

Gly Gly Leu Asn Glu Phe Ser Ser Leu Asn Leu Ile Glu Glu Val Asp

225 230 235 240

Ala Leu Asp Glu Ile Tyr Asp Ser Lys Gly Leu Pro Ala Trp Asp Pro

245 250 255

Pro Phe Pro Glu Glu Leu Asp Ala Ser Asp Glu Asp Leu Pro Phe Asn

260 265 270

Ala Thr Glu Glu Leu Ala Lys Val Glu Gln Ile Lys Glu Pro Lys Leu

275 280 285

Glu Asp Ile Phe Tyr Gln Glu Gly Leu Gln His Gly Ile Gln Thr Leu

290 295 300

Pro Ser Asp Ala Ser Val Tyr Phe Pro Val Asn Tyr Val Glu Asn Asp

305 310 315 320

Pro Gly Leu Gln Ser His His Leu His Phe Pro Phe Phe Ser Gly Met

325 330 335

Val Leu Pro Arg Glu Ile His Ser Ser Val His His Met Asn Lys Ala

340 345 350

Phe Phe Leu Phe Ala Arg Gln His Gly Tyr Val Val Trp Phe Phe Tyr

355 360 365

Gly Asn Leu Ile Gly Trp Tyr Tyr Asn Gly Asn Asn His Pro Trp Asp

370 375 380

Ser Asp Ile Asp Ala Ile Met Pro Met Ala Glu Met Ala Arg Met Ala

385 390 395 400

His His His Asn Asn Thr Leu Ile Ile Glu Asn Pro His Asp Gly Tyr

405 410 415

Gly Thr Tyr Leu Leu Thr Ile Ser Pro Trp Phe Thr Lys Lys Thr Arg

420 425 430

Gly Gly Asn His Ile Asp Gly Arg Phe Val Asp Val Lys Arg Gly Thr

435 440 445

Tyr Ile Asp Leu Ser Ala Ile Ser Ala Met His Gly Ile Tyr Pro Asp

450 455 460

Trp Val Arg Asp Gly Val Lys Glu Asn Pro Lys Asn Leu Ala Leu Ala

465 470 475 480

Asp Lys Asn Gly Asn Trp Tyr Leu Thr Arg Asp Ile Leu Pro Leu Arg

485 490 495

Arg Thr Ile Phe Glu Gly Ser Arg Ser Tyr Thr Val Lys Asp Ile Glu

500 505 510

Asp Thr Leu Leu Arg Asn Tyr Gly Asp Lys Val Leu Ile Asn Thr Glu

515 520 525

Leu Ala Asp His Glu Trp His Asp Asp Trp Lys Met Trp Val Gln Lys

530 535 540

Lys Lys Tyr Cys Thr Tyr Glu Glu Phe Glu Asp Tyr Leu Ser Ala His

545 550 555 560

Gly Gly Val Glu Tyr Asp Glu Asp Gly Val Leu Thr Leu Glu Gly Ala

565 570 575

Cys Gly Phe Glu Glu Val Arg Gln Asp Trp Ile Ile Thr Arg Glu Ser

580 585 590

Val Asn Leu His Met Lys Glu Trp Glu Ala Ile Gln Arg Asn Glu Ser

595 600 605

Thr Thr Glu Tyr Thr Ala Lys Asp Leu Pro Arg Tyr Arg Pro Asp Ser

610 615 620

Phe Lys Asn Leu Leu Asp Gly Val Ser Asn His Gly Asn Gly Asn Val

625 630 635 640

Gly Lys Ile Glu His Val Lys Leu Glu His Asn Asp

645 650

<210> 4

<211> 594

<212> PRT

<213> Artificial sequence

<400> 4

Met Arg Ile Arg Ser Asn Val Leu Leu Leu Ser Thr Ala Gly Ala Leu

1 5 10 15

Ala Leu Val Trp Phe Ala Val Val Phe Ser Trp Asp Asp Lys Ser Ile

20 25 30

Phe Gly Ile Pro Thr Pro Gly His Ala Val Ala Ser Ala Tyr Asp Ser

35 40 45

Ser Val Thr Leu Gly Thr Phe Asn Asp Met Glu Val Asp Ser Tyr Val

50 55 60

Thr Asn Ile Tyr Asp Asn Ala Pro Val Leu Gly Cys Tyr Asp Leu Ser

65 70 75 80

Tyr His Gly Leu Leu Lys Val Ser Pro Lys His Glu Ile Leu Cys Asp

85 90 95

Met Lys Phe Ile Arg Ala Arg Val Leu Glu Thr Glu Ala Tyr Ala Ala

100 105 110

Leu Lys Asp Leu Glu His Lys Lys Leu Thr Glu Glu Glu Lys Ile Glu

115 120 125

Lys His Trp Phe Thr Phe Tyr Gly Ser Ser Val Phe Leu Pro Asp His

130 135 140

Asp Val His Tyr Leu Val Arg Arg Val Val Phe Ser Gly Glu Gly Lys

145 150 155 160

Ala Asn Arg Pro Ile Thr Ser Ile Leu Val Ala Gln Ile Tyr Asp Lys

165 170 175

Asn Trp Asn Glu Leu Asn Gly His Phe Leu Asn Val Leu Asn Pro Asn

180 185 190

Thr Gly Lys Leu Gln His His Ala Phe Pro Gln Val Leu Pro Ile Ala

195 200 205

Val Asn Trp Asp Arg Asn Ser Lys Tyr Arg Gly Gln Glu Asp Pro Arg

210 215 220

Val Val Leu Arg Arg Gly Arg Phe Gly Pro Asp Pro Leu Val Met Phe

225 230 235 240

Asn Thr Leu Thr Gln Asn Asn Lys Leu Arg Arg Leu Phe Thr Ile Ser

245 250 255

Pro Phe Asp Gln Tyr Lys Thr Val Met Tyr Arg Thr Asn Ala Phe Lys

260 265 270

Met Gln Thr Thr Glu Lys Asn Trp Val Pro Phe Phe Leu Lys Asp Asp

275 280 285

Gln Glu Ser Val His Phe Val Tyr Ser Phe Asn Pro Leu Arg Val Leu

290 295 300

Asn Cys Ser Leu Asp Asn Gly Ala Cys Asp Val Leu Phe Glu Leu Pro

305 310 315 320

His Asp Phe Gly Met Ser Ser Glu Leu Arg Gly Ala Thr Pro Met Leu

325 330 335

Asn Leu Pro Gln Ala Ile Pro Met Ala Asp Asp Lys Glu Ile Trp Val

340 345 350

Ser Phe Pro Arg Thr Arg Ile Ser Asp Cys Gly Cys Ser Glu Thr Met

355 360 365

Tyr Arg Pro Met Leu Met Leu Phe Val Arg Glu Gly Thr Asn Phe Phe

370 375 380

Ala Glu Leu Leu Ser Ser Ser Ile Asp Phe Gly Leu Glu Val Ile Pro

385 390 395 400

Tyr Thr Gly Asp Gly Leu Pro Cys Ser Ser Gly Gln Ser Val Leu Ile

405 410 415

Pro Asn Ser Ile Asp Asn Trp Glu Val Thr Gly Ser Asn Gly Glu Asp

420 425 430

Ile Leu Ser Leu Thr Phe Ser Glu Ala Asp Lys Ser Thr Ser Val Val

435 440 445

His Ile Arg Gly Leu Tyr Lys Tyr Leu Ser Glu Leu Asp Gly Tyr Gly

450 455 460

Gly Pro Glu Ala Glu Asp Glu His Asn Phe Gln Arg Ile Leu Ser Asp

465 470 475 480

Leu His Phe Asp Gly Lys Lys Thr Ile Glu Asn Phe Lys Lys Val Gln

485 490 495

Ser Cys Ala Leu Asp Ala Ala Lys Ala Tyr Cys Lys Glu Tyr Gly Val

500 505 510

Thr Arg Gly Glu Glu Asp Arg Leu Lys Asn Lys Glu Lys Glu Arg Lys

515 520 525

Ile Glu Glu Lys Arg Lys Lys Glu Glu Glu Arg Lys Lys Lys Glu Glu

530 535 540

Glu Lys Lys Lys Lys Glu Glu Glu Glu Lys Lys Lys Lys Glu Glu Glu

545 550 555 560

Glu Glu Glu Glu Lys Arg Leu Lys Glu Leu Lys Lys Lys Leu Lys Glu

565 570 575

Leu Gln Glu Glu Leu Glu Lys Gln Lys Asp Glu Val Lys Asp Thr Lys

580 585 590

Ala Lys

<210> 5

<211> 644

<212> PRT

<213> Artificial sequence

<400> 5

Met Arg Thr Arg Leu Asn Phe Leu Leu Leu Cys Ile Ala Ser Val Leu

1 5 10 15

Ser Val Ile Trp Ile Gly Val Leu Leu Thr Trp Asn Asp Asn Asn Leu

20 25 30

Gly Gly Ile Ser Leu Asn Gly Gly Lys Asp Ser Ala Tyr Asp Asp Leu

35 40 45

Leu Ser Leu Gly Ser Phe Asn Asp Met Glu Val Asp Ser Tyr Val Thr

50 55 60

Asn Ile Tyr Asp Asn Ala Pro Val Leu Gly Cys Thr Asp Leu Ser Tyr

65 70 75 80

His Gly Leu Leu Lys Val Thr Pro Lys His Asp Leu Ala Cys Asp Leu

85 90 95

Glu Phe Ile Arg Ala Gln Ile Leu Asp Ile Asp Val Tyr Ser Ala Ile

100 105 110

Lys Asp Leu Glu Asp Lys Ala Leu Thr Val Lys Gln Lys Val Glu Lys

115 120 125

His Trp Phe Thr Phe Tyr Gly Ser Ser Val Phe Leu Pro Glu His Asp

130 135 140

Val His Tyr Leu Val Arg Arg Val Ile Phe Ser Ala Glu Gly Lys Ala

145 150 155 160

Asn Ser Pro Val Thr Ser Ile Ile Val Ala Gln Ile Tyr Asp Lys Asn

165 170 175

Trp Asn Glu Leu Asn Gly His Phe Leu Asp Ile Leu Asn Pro Asn Thr

180 185 190

Gly Lys Val Gln His Asn Thr Phe Pro Gln Val Leu Pro Ile Ala Thr

195 200 205

Asn Phe Val Lys Gly Lys Lys Phe Arg Gly Ala Glu Asp Pro Arg Val

210 215 220

Val Leu Arg Lys Gly Arg Phe Gly Pro Asp Pro Leu Val Met Phe Asn

225 230 235 240

Ser Leu Thr Gln Asp Asn Lys Arg Arg Arg Ile Phe Thr Ile Ser Pro

245 250 255

Phe Asp Gln Phe Lys Thr Val Met Tyr Asp Ile Lys Asp Tyr Glu Met

260 265 270

Pro Arg Tyr Glu Lys Asn Trp Val Pro Phe Phe Leu Lys Asp Asn Gln

275 280 285

Glu Ala Val His Phe Val Tyr Ser Phe Asn Pro Leu Arg Val Leu Lys

290 295 300

Cys Ser Leu Asp Asp Gly Ser Cys Asp Ile Val Phe Glu Ile Pro Lys

305 310 315 320

Val Asp Ser Met Ser Ser Glu Leu Arg Gly Ala Thr Pro Met Ile Asn

325 330 335

Leu Pro Gln Ala Ile Pro Met Ala Lys Asp Lys Glu Ile Trp Val Ser

340 345 350

Phe Pro Arg Thr Arg Ile Ala Asn Cys Gly Cys Ser Arg Thr Thr Tyr

355 360 365

Arg Pro Met Leu Met Leu Phe Val Arg Glu Gly Ser Asn Phe Phe Val

370 375 380

Glu Leu Leu Ser Thr Ser Leu Asp Phe Gly Leu Glu Val Leu Pro Tyr

385 390 395 400

Ser Gly Asn Gly Leu Pro Cys Ser Ala Asp His Ser Val Leu Ile Pro

405 410 415

Asn Ser Ile Asp Asn Trp Glu Val Val Asp Ser Asn Gly Asp Asp Ile

420 425 430

Leu Thr Leu Ser Phe Ser Glu Ala Asp Lys Ser Thr Ser Val Ile His

435 440 445

Ile Arg Gly Leu Tyr Asn Tyr Leu Ser Glu Leu Asp Gly Tyr Gln Gly

450 455 460

Pro Glu Ala Glu Asp Glu His Asn Phe Gln Arg Ile Leu Ser Asp Leu

465 470 475 480

His Phe Asp Asn Lys Thr Thr Val Asn Asn Phe Ile Lys Val Gln Ser

485 490 495

Cys Ala Leu Asp Ala Ala Lys Gly Tyr Cys Lys Glu Tyr Gly Leu Thr

500 505 510

Arg Gly Glu Ala Glu Arg Arg Arg Arg Val Ala Glu Glu Arg Lys Lys

515 520 525

Lys Glu Lys Glu Glu Glu Glu Lys Lys Lys Lys Lys Glu Lys Glu Glu

530 535 540

Glu Glu Lys Lys Arg Ile Glu Glu Glu Lys Lys Lys Ile Glu Glu Lys

545 550 555 560

Glu Arg Lys Glu Lys Glu Lys Glu Glu Ala Glu Arg Lys Lys Leu Gln

565 570 575

Glu Met Lys Lys Lys Leu Glu Glu Ile Thr Glu Lys Leu Glu Lys Gly

580 585 590

Gln Arg Asn Lys Glu Ile Asp Pro Lys Glu Lys Gln Arg Glu Glu Glu

595 600 605

Glu Arg Lys Glu Arg Val Arg Lys Ile Ala Glu Lys Gln Arg Lys Glu

610 615 620

Ala Glu Lys Lys Glu Ala Glu Lys Lys Ala Asn Asp Lys Lys Asp Leu

625 630 635 640

Lys Ile Arg Gln

<210> 6

<211> 488

<212> PRT

<213> Artificial sequence

<400> 6

Met Tyr His Leu Ala Pro Arg Lys Lys Leu Leu Ile Trp Gly Gly Ser

1 5 10 15

Leu Gly Phe Val Leu Leu Leu Leu Ile Val Ala Ser Ser His Gln Arg

20 25 30

Ile Arg Ser Thr Ile Leu His Arg Thr Pro Ile Ser Thr Leu Pro Val

35 40 45

Ile Ser Gln Glu Val Ile Thr Ala Asp Tyr His Pro Thr Leu Leu Thr

50 55 60

Gly Phe Ile Pro Thr Asp Ser Asp Asp Ser Asp Cys Ala Asp Phe Ser

65 70 75 80

Pro Ser Gly Val Ile Tyr Ser Thr Asp Lys Leu Val Leu His Asp Ser

85 90 95

Leu Lys Asp Ile Arg Asp Ser Leu Leu Lys Thr Gln Tyr Lys Asp Leu

100 105 110

Val Thr Leu Glu Asp Glu Glu Lys Met Asn Ile Asp Asp Ile Leu Lys

115 120 125

Arg Trp Tyr Thr Leu Ser Gly Ser Ser Val Trp Ile Pro Gly Met Lys

130 135 140

Ala His Leu Val Val Ser Arg Val Met Tyr Leu Gly Thr Asn Gly Arg

145 150 155 160

Ser Asp Pro Leu Val Ser Phe Val Arg Val Gln Leu Phe Asp Pro Asp

165 170 175

Phe Asn Glu Leu Lys Asp Ile Ala Leu Lys Phe Ser Asp Lys Pro Asp

180 185 190

Gly Thr Val Ile Phe Pro Tyr Ile Leu Pro Val Asp Ile Pro Arg Glu

195 200 205

Gly Ser Arg Trp Leu Gly Pro Glu Asp Ala Lys Ile Ala Val Asn Pro

210 215 220

Glu Thr Pro Asp Asp Pro Ile Val Ile Phe Asn Met Gln Asn Ser Val

225 230 235 240

Asn Arg Ala Met Tyr Gly Phe Tyr Pro Phe Arg Pro Glu Asn Lys Gln

245 250 255

Val Leu Phe Ser Ile Lys Asp Glu Glu Pro Arg Lys Lys Glu Lys Asn

260 265 270

Trp Thr Pro Phe Phe Val Pro Gly Ser Pro Thr Thr Val Asn Phe Val

275 280 285

Tyr Asp Leu Gln Lys Leu Thr Ile Leu Lys Cys Ser Ile Ile Thr Gly

290 295 300

Ile Cys Glu Lys Glu Phe Val Ser Gly Asp Asp Gly Gln Asn His Gly

305 310 315 320

Ile Gly Ile Phe Arg Gly Gly Ser Asn Leu Val Pro Phe Pro Thr Ser

325 330 335

Phe Thr Asp Lys Asp Val Trp Val Gly Phe Pro Lys Thr His Met Glu

340 345 350

Ser Cys Gly Cys Ser Ser His Ile Tyr Arg Pro Tyr Leu Met Val Leu

355 360 365

Val Arg Lys Gly Asp Phe Tyr Tyr Lys Ala Phe Val Ser Thr Pro Leu

370 375 380

Asp Phe Gly Ile Asp Val Arg Ser Trp Glu Ser Ala Glu Ser Thr Ser

385 390 395 400

Cys Gln Thr Ala Lys Asn Val Leu Ala Val Asn Ser Ile Ser Asn Trp

405 410 415

Asp Leu Leu Asp Asp Gly Leu Asp Lys Asp Tyr Met Thr Ile Thr Leu

420 425 430

Ser Glu Ala Asp Val Val Asn Ser Val Leu Arg Val Arg Gly Ile Ala

435 440 445

Lys Phe Val Asp Asn Leu Thr Met Asp Asp Gly Ser Thr Thr Leu Ser

450 455 460

Thr Ser Asn Lys Ile Asp Glu Cys Ala Thr Thr Gly Ser Lys Gln Tyr

465 470 475 480

Cys Gln Arg Tyr Gly Glu Leu His

485

<210> 7

<211> 652

<212> PRT

<213> Artificial sequence

<400> 7

Met Val Asp Leu Phe Gln Trp Leu Lys Phe Tyr Ser Met Arg Arg Leu

1 5 10 15

Gly Gln Val Ala Ile Thr Leu Val Leu Leu Asn Leu Phe Val Phe Leu

20 25 30

Gly Tyr Lys Phe Thr Pro Ser Thr Val Ile Gly Ser Pro Ser Trp Glu

35 40 45

Pro Ala Val Val Pro Thr Val Phe Asn Glu Ser Tyr Leu Asp Ser Leu

50 55 60

Gln Phe Thr Asp Ile Asn Val Asp Ser Phe Leu Ser Asp Thr Asn Gly

65 70 75 80

Arg Ile Ser Val Thr Cys Asp Ser Leu Ala Tyr Lys Gly Leu Val Lys

85 90 95

Thr Ser Lys Lys Lys Glu Leu Asp Cys Asp Met Ala Tyr Ile Arg Arg

100 105 110

Lys Ile Phe Ser Ser Glu Glu Tyr Gly Val Leu Ala Asp Leu Glu Ala

115 120 125

Gln Asp Ile Thr Glu Glu Gln Arg Ile Lys Lys His Trp Phe Thr Phe

130 135 140

Tyr Gly Ser Ser Val Tyr Leu Pro Glu His Glu Val His Tyr Leu Val

145 150 155 160

Arg Arg Val Leu Phe Ser Lys Val Gly Arg Ala Asp Thr Pro Val Ile

165 170 175

Ser Leu Leu Val Ala Gln Leu Tyr Asp Lys Asp Trp Asn Glu Leu Thr

180 185 190

Pro His Thr Leu Glu Ile Val Asn Pro Ala Thr Gly Asn Val Thr Pro

195 200 205

Gln Thr Phe Pro Gln Leu Ile His Val Pro Ile Glu Trp Ser Val Asp

210 215 220

Asp Lys Trp Lys Gly Thr Glu Asp Pro Arg Val Phe Leu Lys Pro Ser

225 230 235 240

Lys Thr Gly Val Ser Glu Pro Ile Val Leu Phe Asn Leu Gln Ser Ser

245 250 255

Leu Cys Asp Gly Lys Arg Gly Met Phe Val Thr Ser Pro Phe Arg Ser

260 265 270

Asp Lys Val Asn Leu Leu Asp Ile Glu Asp Lys Glu Arg Pro Asn Ser

275 280 285

Glu Lys Asn Trp Ser Pro Phe Phe Leu Asp Asp Val Glu Val Ser Lys

290 295 300

Tyr Ser Thr Gly Tyr Val His Phe Val Tyr Ser Phe Asn Pro Leu Lys

305 310 315 320

Val Ile Lys Cys Ser Leu Asp Thr Gly Ala Cys Arg Met Ile Tyr Glu

325 330 335

Ser Pro Glu Glu Gly Arg Phe Gly Ser Glu Leu Arg Gly Ala Thr Pro

340 345 350

Met Val Lys Leu Pro Val His Leu Ser Leu Pro Lys Gly Lys Glu Val

355 360 365

Trp Val Ala Phe Pro Arg Thr Arg Leu Arg Asp Cys Gly Cys Ser Arg

370 375 380

Thr Thr Tyr Arg Pro Val Leu Thr Leu Phe Val Lys Glu Gly Asn Lys

385 390 395 400

Phe Tyr Thr Glu Leu Ile Ser Ser Ser Ile Asp Phe His Ile Asp Val

405 410 415

Leu Ser Tyr Asp Ala Lys Gly Glu Ser Cys Ser Gly Ser Ile Ser Val

420 425 430

Leu Ile Pro Asn Gly Ile Asp Ser Trp Asp Val Ser Lys Lys Gln Gly

435 440 445

Gly Lys Ser Asp Ile Leu Thr Leu Thr Leu Ser Glu Ala Asp Arg Asn

450 455 460

Thr Val Val Val His Val Lys Gly Leu Leu Asp Tyr Leu Leu Val Leu

465 470 475 480

Asn Gly Glu Gly Pro Ile His Asp Ser His Ser Phe Lys Asn Val Leu

485 490 495

Ser Thr Asn His Phe Lys Ser Asp Thr Thr Leu Leu Asn Ser Val Lys

500 505 510

Ala Ala Glu Cys Ala Ile Phe Ser Ser Arg Asp Tyr Cys Lys Lys Tyr

515 520 525

Gly Glu Thr Arg Gly Glu Pro Ala Arg Tyr Ala Lys Gln Met Glu Asn

530 535 540

Glu Arg Lys Glu Lys Glu Lys Lys Glu Lys Glu Ala Lys Glu Lys Leu

545 550 555 560

Glu Ala Glu Lys Ala Glu Met Glu Glu Ala Val Arg Lys Ala Gln Glu

565 570 575

Ala Ile Ala Gln Lys Glu Arg Glu Lys Glu Glu Ala Glu Gln Glu Lys

580 585 590

Lys Ala Gln Gln Glu Ala Lys Glu Lys Glu Ala Glu Glu Lys Ala Ala

595 600 605

Lys Glu Lys Glu Ala Lys Glu Asn Glu Ala Lys Lys Lys Ile Ile Val

610 615 620

Glu Lys Leu Ala Lys Glu Gln Glu Glu Ala Glu Lys Leu Glu Ala Lys

625 630 635 640

Lys Lys Leu Tyr Gln Leu Gln Glu Glu Glu Arg Ser

645 650

<210> 8

<211> 789

<212> PRT

<213> Artificial sequence

<400> 8

Met Cys Gln Ile Phe Leu Pro Gln Asn Val Thr Arg Cys Ser Val Ser

1 5 10 15

Leu Leu Thr Met Ser Lys Thr Ser Pro Gln Glu Val Pro Glu Asn Thr

20 25 30

Thr Glu Leu Lys Ile Ser Lys Gly Glu Leu Arg Pro Phe Ile Val Thr

35 40 45

Ser Pro Ser Pro Gln Leu Ser Lys Ser Arg Ser Val Thr Ser Thr Lys

50 55 60

Glu Lys Leu Ile Leu Ala Ser Leu Phe Ile Phe Ala Met Val Ile Arg

65 70 75 80

Phe His Asn Val Ala His Pro Asp Ser Val Val Phe Asp Glu Val His

85 90 95

Phe Gly Gly Phe Ala Arg Lys Tyr Ile Leu Gly Thr Phe Phe Met Asp

100 105 110

Val His Pro Pro Leu Ala Lys Leu Leu Phe Ala Gly Val Gly Ser Leu

115 120 125

Gly Gly Tyr Asp Gly Glu Phe Glu Phe Lys Lys Ile Gly Asp Glu Phe

130 135 140

Pro Glu Asn Val Pro Tyr Val Leu Met Arg Tyr Leu Pro Ser Gly Met

145 150 155 160

Gly Val Gly Thr Cys Ile Met Leu Tyr Leu Thr Leu Arg Ala Ser Gly

165 170 175

Cys Gln Pro Ile Val Cys Cys Ser Asp Asn Arg Ser Leu Ile Ile Glu

180 185 190

Asn Ala Asn Val Thr Ile Ser Arg Phe Ile Leu Leu Asp Ser Pro Met

195 200 205

Leu Phe Phe Ile Ala Ser Thr Val Tyr Ser Phe Lys Lys Phe Gln Ile

210 215 220

Gln Glu Pro Phe Thr Phe Gln Trp Tyr Lys Thr Leu Ile Ala Thr Gly

225 230 235 240

Val Ser Leu Gly Leu Ala Ala Ser Ser Lys Trp Val Gly Leu Phe Thr

245 250 255

Val Ala Trp Ile Gly Leu Ile Thr Ile Trp Asp Leu Trp Phe Ile Ile

260 265 270

Gly Asp Leu Thr Val Ser Val Lys Lys Ile Phe Gly His Phe Ile Thr

275 280 285

Arg Ala Val Ala Phe Leu Val Val Pro Thr Leu Ile Tyr Leu Thr Phe

290 295 300

Phe Ala Ile His Leu Gln Val Leu Thr Lys Glu Gly Asp Gly Gly Ala

305 310 315 320

Phe Met Ser Ser Val Phe Arg Ser Thr Leu Glu Gly Asn Ala Val Pro

325 330 335

Lys Gln Ser Leu Ala Asn Val Gly Leu Gly Ser Leu Val Thr Ile Arg

340 345 350

His Leu Asn Thr Arg Gly Gly Tyr Leu His Ser His Asn His Leu Tyr

355 360 365

Glu Gly Gly Ser Gly Gln Gln Gln Val Thr Leu Tyr Pro His Ile Asp

370 375 380

Ser Asn Asn Gln Trp Ile Val Gln Asp Tyr Asn Ala Thr Glu Glu Pro

385 390 395 400

Thr Glu Phe Val Pro Leu Lys Asp Gly Val Lys Ile Arg Leu Asn His

405 410 415

Lys Leu Thr Ser Arg Arg Leu His Ser His Asn Leu Arg Pro Pro Val

420 425 430

Thr Glu Gln Asp Trp Gln Asn Glu Val Ser Ala Tyr Gly His Glu Gly

435 440 445

Phe Gly Gly Asp Ala Asn Asp Asp Phe Val Val Glu Ile Ala Lys Asp

450 455 460

Leu Ser Thr Thr Glu Glu Ala Lys Glu Asn Val Arg Ala Ile Gln Thr

465 470 475 480

Val Phe Arg Leu Arg His Ala Met Thr Gly Cys Tyr Leu Phe Ser His

485 490 495

Glu Val Lys Leu Pro Lys Trp Ala Tyr Glu Gln Gln Glu Val Thr Cys

500 505 510

Ala Thr Gln Gly Ile Lys Pro Leu Ser Tyr Trp Tyr Val Glu Thr Asn

515 520 525

Glu Asn Pro Phe Leu Asp Lys Glu Val Asp Glu Ile Val Ser Tyr Pro

530 535 540

Val Pro Thr Phe Phe Gln Lys Val Ala Glu Leu His Ala Arg Met Trp

545 550 555 560

Lys Ile Asn Lys Gly Leu Thr Asp His His Val Tyr Glu Ser Ser Pro

565 570 575

Asp Ser Trp Pro Phe Leu Leu Arg Gly Ile Ser Tyr Trp Ser Lys Asn

580 585 590

His Ser Gln Ile Tyr Phe Ile Gly Asn Ala Val Thr Trp Trp Thr Val

595 600 605

Thr Ala Ser Ile Ala Leu Phe Ser Val Phe Leu Val Phe Ser Ile Leu

610 615 620

Arg Trp Gln Arg Gly Phe Gly Phe Ser Val Asp Pro Thr Val Phe Asn

625 630 635 640

Phe Asn Val Gln Met Leu His Tyr Ile Leu Gly Trp Val Leu His Tyr

645 650 655

Leu Pro Ser Phe Leu Met Ala Arg Gln Leu Phe Leu His His Tyr Leu

660 665 670

Pro Ser Leu Tyr Phe Gly Ile Leu Ala Leu Gly His Val Phe Glu Ile

675 680 685

Ile His Ser Tyr Val Phe Lys Asn Lys Gln Val Val Ser Tyr Ser Ile

690 695 700

Phe Val Leu Phe Phe Ala Val Ala Leu Ser Phe Phe Gln Arg Tyr Ser

705 710 715 720

Pro Leu Ile Tyr Ala Gly Arg Trp Thr Lys Asp Gln Cys Asn Glu Ser

725 730 735

Lys Ile Leu Lys Trp Asp Phe Asp Cys Asn Thr Phe Pro Ser His Thr

740 745 750

Ser Gln Tyr Glu Ile Trp Ala Ser Pro Val Gln Thr Ser Thr Pro Lys

755 760 765

Glu Gly Thr His Ser Glu Ser Thr Val Gly Glu Pro Asp Val Glu Lys

770 775 780

Leu Gly Glu Thr Val

785

<210> 9

<211> 512

<212> PRT

<213> Artificial sequence

<400> 9

Glu Ala Glu Ala Tyr Pro Lys Pro Gly Ala Thr Lys Arg Gly Ser Pro

1 5 10 15

Asn Pro Thr Arg Ala Ala Ala Val Lys Ala Ala Phe Gln Thr Ser Trp

20 25 30

Asn Ala Tyr His His Phe Ala Phe Pro His Asp Asp Leu His Pro Val

35 40 45

Ser Asn Ser Phe Asp Asp Glu Arg Asn Gly Trp Gly Ser Ser Ala Ile

50 55 60

Asp Gly Leu Asp Thr Ala Ile Leu Met Gly Asp Ala Asp Ile Val Asn

65 70 75 80

Thr Ile Leu Gln Tyr Val Pro Gln Ile Asn Phe Thr Thr Thr Ala Val

85 90 95

Ala Asn Gln Gly Ile Ser Val Phe Glu Thr Asn Ile Arg Tyr Leu Gly

100 105 110

Gly Leu Leu Ser Ala Tyr Asp Leu Leu Arg Gly Pro Phe Ser Ser Leu

115 120 125

Ala Thr Asn Gln Thr Leu Val Asn Ser Leu Leu Arg Gln Ala Gln Thr

130 135 140

Leu Ala Asn Gly Leu Lys Val Ala Phe Thr Thr Pro Ser Gly Val Pro

145 150 155 160

Asp Pro Thr Val Phe Phe Asn Pro Thr Val Arg Arg Ser Gly Ala Ser

165 170 175

Ser Asn Asn Val Ala Glu Ile Gly Ser Leu Val Leu Glu Trp Thr Arg

180 185 190

Leu Ser Asp Leu Thr Gly Asn Pro Gln Tyr Ala Gln Leu Ala Gln Lys

195 200 205

Gly Glu Ser Tyr Leu Leu Asn Pro Lys Gly Ser Pro Glu Ala Trp Pro

210 215 220

Gly Leu Ile Gly Thr Phe Val Ser Thr Ser Asn Gly Thr Phe Gln Asp

225 230 235 240

Ser Ser Gly Ser Trp Ser Gly Leu Met Asp Ser Phe Tyr Glu Tyr Leu

245 250 255

Ile Lys Met Tyr Leu Tyr Asp Pro Val Ala Phe Ala His Tyr Lys Asp

260 265 270

Arg Trp Val Leu Ala Ala Asp Ser Thr Ile Ala His Leu Ala Ser His

275 280 285

Pro Ser Thr Arg Lys Asp Leu Thr Phe Leu Ser Ser Tyr Asn Gly Gln

290 295 300

Ser Thr Ser Pro Asn Ser Gly His Leu Ala Ser Phe Ala Gly Gly Asn

305 310 315 320

Phe Ile Leu Gly Gly Ile Leu Leu Asn Glu Gln Lys Tyr Ile Asp Phe

325 330 335

Gly Ile Lys Leu Ala Ser Ser Tyr Phe Ala Thr Tyr Asn Gln Thr Ala

340 345 350

Ser Gly Ile Gly Pro Glu Gly Phe Ala Trp Val Asp Ser Val Thr Gly

355 360 365

Ala Gly Gly Ser Pro Pro Ser Ser Gln Ser Gly Phe Tyr Ser Ser Ala

370 375 380

Gly Phe Trp Val Thr Ala Pro Tyr Tyr Ile Leu Arg Pro Glu Thr Leu

385 390 395 400

Glu Ser Leu Tyr Tyr Ala Tyr Arg Val Thr Gly Asp Ser Lys Trp Gln

405 410 415

Asp Leu Ala Trp Glu Ala Phe Ser Ala Ile Glu Asp Ala Cys Arg Ala

420 425 430

Gly Ser Ala Tyr Ser Ser Ile Asn Asp Val Thr Gln Ala Asn Gly Gly

435 440 445

Gly Ala Ser Asp Asp Met Glu Ser Phe Trp Phe Ala Glu Ala Leu Lys

450 455 460

Tyr Ala Tyr Leu Ile Phe Ala Glu Glu Ser Asp Val Gln Val Gln Ala

465 470 475 480

Asn Gly Gly Asn Lys Phe Val Phe Asn Thr Glu Ala His Pro Phe Ser

485 490 495

Ile Arg Ser Ser Ser Arg Arg Gly Gly His Leu Ala His Asp Glu Leu

500 505 510

<210> 10

<211> 445

<212> PRT

<213> Artificial sequence

<400> 10

Met Ser Leu Ser Leu Val Ser Tyr Arg Leu Arg Lys Asn Pro Trp Val

1 5 10 15

Asn Ile Phe Leu Pro Val Leu Ala Ile Phe Leu Ile Tyr Ile Ile Phe

20 25 30

Phe Gln Arg Asp Gln Ser Ser Val Ser Ala Leu Asp Gly Asp Pro Ala

35 40 45

Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu

50 55 60

Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser

65 70 75 80

Ser Gln Arg Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg

85 90 95

Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala

100 105 110

Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr

115 120 125

Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly

130 135 140

His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr

145 150 155 160

His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His

165 170 175

Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala

180 185 190

Leu Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val Val Val

195 200 205

Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala

210 215 220

Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala

225 230 235 240

Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu

245 250 255

Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu

260 265 270

Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp

275 280 285

Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile

290 295 300

Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser

305 310 315 320

His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln

325 330 335

Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu

340 345 350

Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu

355 360 365

Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val

370 375 380

Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala

385 390 395 400

Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr

405 410 415

Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala

420 425 430

Pro Pro Leu Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn

435 440 445

<210> 11

<211> 804

<212> PRT

<213> Artificial sequence

<400> 11

Met Ala Leu Phe Leu Ser Lys Arg Leu Leu Arg Phe Thr Val Ile Ala

1 5 10 15

Gly Ala Val Ile Val Leu Leu Leu Thr Leu Asn Ser Asn Ser Arg Thr

20 25 30

Gln Gln Tyr Ile Pro Ser Ser Ile Ser Ala Ala Phe Asp Phe Thr Ser

35 40 45

Gly Ser Ile Ser Pro Glu Gln Gln Val Ile Ser Glu Glu Asn Asp Ala

50 55 60

Lys Lys Leu Glu Gln Ser Ala Leu Asn Ser Glu Ala Ser Glu Asp Ser

65 70 75 80

Glu Ala Met Asp Glu Glu Ser Lys Ala Leu Lys Ala Ala Ala Glu Lys

85 90 95

Ala Asp Ala Pro Ile Gly Gly Gly Pro Ala Gly Met Arg Val Leu Val

100 105 110

Thr Gly Gly Ser Gly Tyr Ile Gly Ser His Thr Cys Val Gln Leu Leu

115 120 125

Gln Asn Gly His Asp Val Ile Ile Leu Asp Asn Leu Cys Asn Ser Lys

130 135 140

Arg Ser Val Leu Pro Val Ile Glu Arg Leu Gly Gly Lys His Pro Thr

145 150 155 160

Phe Val Glu Gly Asp Ile Arg Asn Glu Ala Leu Met Thr Glu Ile Leu

165 170 175

His Asp His Ala Ile Asp Thr Val Ile His Phe Ala Gly Leu Lys Ala

180 185 190

Val Gly Glu Ser Val Gln Lys Pro Leu Glu Tyr Tyr Asp Asn Asn Val

195 200 205

Asn Gly Thr Leu Arg Leu Ile Ser Ala Met Arg Ala Ala Asn Val Lys

210 215 220

Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr Gly Asp Gln Pro Lys

225 230 235 240

Ile Pro Tyr Val Glu Ser Phe Pro Thr Gly Thr Pro Gln Ser Pro Tyr

245 250 255

Gly Lys Ser Lys Leu Met Val Glu Gln Ile Leu Thr Asp Leu Gln Lys

260 265 270

Ala Gln Pro Asp Trp Ser Ile Ala Leu Leu Arg Tyr Phe Asn Pro Val

275 280 285

Gly Ala His Pro Ser Gly Asp Met Gly Glu Asp Pro Gln Gly Ile Pro

290 295 300

Asn Asn Leu Met Pro Tyr Ile Ala Gln Val Ala Val Gly Arg Arg Asp

305 310 315 320

Ser Leu Ala Ile Phe Gly Asn Asp Tyr Pro Thr Glu Asp Gly Thr Gly

325 330 335

Val Arg Asp Tyr Ile His Val Met Asp Leu Ala Asp Gly His Val Val

340 345 350

Ala Met Glu Lys Leu Ala Asn Lys Pro Gly Val His Ile Tyr Asn Leu

355 360 365

Gly Ala Gly Val Gly Asn Ser Val Leu Asp Val Val Asn Ala Phe Ser

370 375 380

Lys Ala Cys Gly Lys Pro Val Asn Tyr His Phe Ala Pro Arg Arg Glu

385 390 395 400

Gly Asp Leu Pro Ala Tyr Trp Ala Asp Ala Ser Lys Ala Asp Arg Glu

405 410 415

Leu Asn Trp Arg Val Thr Arg Thr Leu Asp Glu Met Ala Gln Asp Thr

420 425 430

Trp His Trp Gln Ser Arg His Pro Gln Gly Tyr Pro Asp Gly Thr Gly

435 440 445

Gly Gly Arg Asp Leu Ser Arg Leu Pro Gln Leu Val Gly Val Ser Thr

450 455 460

Pro Leu Gln Gly Gly Ser Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser

465 470 475 480

Gly Glu Leu Arg Thr Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala

485 490 495

Ser Ser Gln Pro Arg Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser

500 505 510

Gly Pro Gly Pro Ala Ser Asn Leu Thr Ser Val Pro Val Pro His Thr

515 520 525

Thr Ala Leu Ser Leu Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val

530 535 540

Gly Pro Met Leu Ile Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val

545 550 555 560

Ala Lys Gln Asn Pro Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg

565 570 575

Asp Cys Val Ser Pro His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn

580 585 590

Arg Gln Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu

595 600 605

Gln Arg Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly

610 615 620

Asp Thr Ile Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu

625 630 635 640

Ala Leu Lys Asp Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp

645 650 655

Leu Ile Pro Met Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro

660 665 670

Arg His Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr

675 680 685

Val Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu

690 695 700

Thr Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp

705 710 715 720

Asp Asp Ile Phe Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg

725 730 735

Pro Asn Ala Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp

740 745 750

Lys Lys Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr

755 760 765

Lys Glu Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val

770 775 780

Leu Asp Val Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile

785 790 795 800

Gly Thr Pro Ser

<210> 12

<211> 1101

<212> PRT

<213> Artificial sequence

<400> 12

Met Leu Leu Thr Lys Arg Phe Ser Lys Leu Phe Lys Leu Thr Phe Ile

1 5 10 15

Val Leu Ile Leu Cys Gly Leu Phe Val Ile Thr Asn Lys Tyr Met Asp

20 25 30

Glu Asn Thr Ser Pro Ala Gly Val Glu Asp Gly Pro Lys Ser Ser Gln

35 40 45

Ser Asn Phe Ser Gln Gly Ala Gly Ser His Leu Leu Pro Ser Gln Leu

50 55 60

Ser Leu Ser Val Asp Thr Ala Asp Cys Leu Phe Ala Ser Gln Ser Gly

65 70 75 80

Ser His Asn Ser Asp Val Gln Met Leu Asp Val Tyr Ser Leu Ile Ser

85 90 95

Phe Asp Asn Pro Asp Gly Gly Val Trp Lys Gln Gly Phe Asp Ile Thr

100 105 110

Tyr Glu Ser Asn Glu Trp Asp Thr Glu Pro Leu Gln Val Phe Val Val

115 120 125

Pro His Ser His Asn Asp Pro Gly Trp Leu Lys Thr Phe Asn Asp Tyr

130 135 140

Phe Arg Asp Lys Thr Gln Tyr Ile Phe Asn Asn Met Val Leu Lys Leu

145 150 155 160

Lys Glu Asp Ser Arg Arg Lys Phe Ile Trp Ser Glu Ile Ser Tyr Leu

165 170 175

Ser Lys Trp Trp Asp Ile Ile Asp Ile Gln Lys Lys Asp Ala Val Lys

180 185 190

Ser Leu Ile Glu Asn Gly Gln Leu Glu Ile Val Thr Gly Gly Trp Val

195 200 205

Met Pro Asp Glu Ala Thr Pro His Tyr Phe Ala Leu Ile Asp Gln Leu

210 215 220

Ile Glu Gly His Gln Trp Leu Glu Asn Asn Ile Gly Val Lys Pro Arg

225 230 235 240

Ser Gly Trp Ala Ile Asp Pro Phe Gly His Ser Pro Thr Met Ala Tyr

245 250 255

Leu Leu Asn Arg Ala Gly Leu Ser His Met Leu Ile Gln Arg Val His

260 265 270

Tyr Ala Val Lys Lys His Phe Ala Leu His Lys Thr Leu Glu Phe Phe

275 280 285

Trp Arg Gln Asn Trp Asp Leu Gly Ser Val Thr Asp Ile Leu Cys His

290 295 300

Met Met Pro Phe Tyr Ser Tyr Asp Ile Pro His Thr Cys Gly Pro Asp

305 310 315 320

Pro Lys Ile Cys Cys Gln Phe Asp Phe Lys Arg Leu Pro Gly Gly Arg

325 330 335

Phe Gly Cys Pro Trp Gly Val Pro Pro Glu Thr Ile His Pro Gly Asn

340 345 350

Val Gln Ser Arg Ala Arg Met Leu Leu Asp Gln Tyr Arg Lys Lys Ser

355 360 365

Lys Leu Phe Arg Thr Lys Val Leu Leu Ala Pro Leu Gly Asp Asp Phe

370 375 380

Arg Tyr Cys Glu Tyr Thr Glu Trp Asp Leu Gln Phe Lys Asn Tyr Gln

385 390 395 400

Gln Leu Phe Asp Tyr Met Asn Ser Gln Ser Lys Phe Lys Val Lys Ile

405 410 415

Gln Phe Gly Thr Leu Ser Asp Phe Phe Asp Ala Leu Asp Lys Ala Asp

420 425 430

Glu Thr Gln Arg Asp Lys Gly Gln Ser Met Phe Pro Val Leu Ser Gly

435 440 445

Asp Phe Phe Thr Tyr Ala Asp Arg Asp Asp His Tyr Trp Ser Gly Tyr

450 455 460

Phe Thr Ser Arg Pro Phe Tyr Lys Arg Met Asp Arg Ile Met Glu Ser

465 470 475 480

His Leu Arg Ala Ala Glu Ile Leu Tyr Tyr Phe Ala Leu Arg Gln Ala

485 490 495

His Lys Tyr Lys Ile Asn Lys Phe Leu Ser Ser Ser Leu Tyr Thr Ala

500 505 510

Leu Thr Glu Ala Arg Arg Asn Leu Gly Leu Phe Gln His His Asp Ala

515 520 525

Ile Thr Gly Thr Ala Lys Asp Trp Val Val Val Asp Tyr Gly Thr Arg

530 535 540

Leu Phe His Ser Leu Met Val Leu Glu Lys Ile Ile Gly Asn Ser Ala

545 550 555 560

Phe Leu Leu Ile Gly Lys Asp Lys Leu Thr Tyr Asp Ser Tyr Ser Pro

565 570 575

Asp Thr Phe Leu Glu Met Asp Leu Lys Gln Lys Ser Gln Asp Ser Leu

580 585 590

Pro Gln Lys Asn Ile Ile Arg Leu Ser Ala Glu Pro Arg Tyr Leu Val

595 600 605

Val Tyr Asn Pro Leu Glu Gln Asp Arg Ile Ser Leu Val Ser Val Tyr

610 615 620

Val Ser Ser Pro Thr Val Gln Val Phe Ser Ala Ser Gly Lys Pro Val

625 630 635 640

Glu Val Gln Val Ser Ala Val Trp Asp Thr Ala Asn Thr Ile Ser Glu

645 650 655

Thr Ala Tyr Glu Ile Ser Phe Arg Ala His Ile Pro Pro Leu Gly Leu

660 665 670

Lys Val Tyr Lys Ile Leu Glu Ser Ala Ser Ser Asn Ser His Leu Ala

675 680 685

Asp Tyr Val Leu Tyr Lys Asn Lys Val Glu Asp Ser Gly Ile Phe Thr

690 695 700

Ile Lys Asn Met Ile Asn Thr Glu Glu Gly Ile Thr Leu Glu Asn Ser

705 710 715 720

Phe Val Leu Leu Arg Phe Asp Gln Thr Gly Leu Met Lys Gln Met Met

725 730 735

Thr Lys Glu Asp Gly Lys His His Glu Val Asn Val Gln Phe Ser Trp

740 745 750

Tyr Gly Thr Thr Ile Lys Arg Asp Lys Ser Gly Ala Tyr Leu Phe Leu

755 760 765

Pro Asp Gly Asn Ala Lys Pro Tyr Val Tyr Thr Thr Pro Pro Phe Val

770 775 780

Arg Val Thr His Gly Arg Ile Tyr Ser Glu Val Thr Cys Phe Phe Asp

785 790 795 800

His Val Thr His Arg Val Arg Leu Tyr His Ile Gln Gly Ile Glu Gly

805 810 815

Gln Ser Val Glu Val Ser Asn Ile Val Asp Ile Arg Lys Val Tyr Asn

820 825 830

Arg Glu Ile Ala Met Lys Ile Ser Ser Asp Ile Lys Ser Gln Asn Arg

835 840 845

Phe Tyr Thr Asp Leu Asn Gly Tyr Gln Ile Gln Pro Arg Met Thr Leu

850 855 860

Ser Lys Leu Pro Leu Gln Ala Asn Val Tyr Pro Met Thr Thr Met Ala

865 870 875 880

Tyr Ile Gln Asp Ala Lys His Arg Leu Thr Leu Leu Ser Ala Gln Ser

885 890 895

Leu Gly Val Ser Ser Leu Asn Ser Gly Gln Ile Glu Val Ile Met Asp

900 905 910

Arg Arg Leu Met Gln Asp Asp Asn Arg Gly Leu Glu Gln Gly Ile Gln

915 920 925

Asp Asn Lys Ile Thr Ala Asn Leu Phe Arg Ile Leu Leu Glu Lys Arg

930 935 940

Ser Ala Val Asn Thr Glu Glu Glu Lys Lys Ser Val Ser Tyr Pro Ser

945 950 955 960

Leu Leu Ser His Ile Thr Ser Ser Leu Met Asn His Pro Val Ile Pro

965 970 975

Met Ala Asn Lys Phe Ser Ser Pro Thr Leu Glu Leu Gln Gly Glu Phe

980 985 990

Ser Pro Leu Gln Ser Ser Leu Pro Cys Asp Ile His Leu Val Asn Leu

995 1000 1005

Arg Thr Ile Gln Ser Lys Val Gly Asn Gly His Ser Asn Glu Ala

1010 1015 1020

Ala Leu Ile Leu His Arg Lys Gly Phe Asp Cys Arg Phe Ser Ser

1025 1030 1035

Lys Gly Thr Gly Leu Phe Cys Ser Thr Thr Gln Gly Lys Ile Leu

1040 1045 1050

Val Gln Lys Leu Leu Asn Lys Phe Ile Val Glu Ser Leu Thr Pro

1055 1060 1065

Ser Ser Leu Ser Leu Met His Ser Pro Pro Gly Thr Gln Asn Ile

1070 1075 1080

Ser Glu Ile Asn Leu Ser Pro Met Glu Ile Ser Thr Phe Arg Ile

1085 1090 1095

Gln Leu Arg

1100

<210> 13

<211> 394

<212> PRT

<213> Artificial sequence

<400> 13

Met Leu Leu Thr Lys Arg Phe Ser Lys Leu Phe Lys Leu Thr Phe Ile

1 5 10 15

Val Leu Ile Leu Cys Gly Leu Phe Val Ile Thr Asn Lys Tyr Met Asp

20 25 30

Glu Asn Thr Ser Pro Ala Gly Ser Leu Val Tyr Gln Leu Asn Phe Asp

35 40 45

Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr Trp Ala Pro Arg Glu

50 55 60

Leu Val Leu Val Val Gln Val His Asn Arg Pro Glu Tyr Leu Arg Leu

65 70 75 80

Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile Asp Asn Val Leu Val

85 90 95

Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile Asn Gln Leu Ile Ala

100 105 110

Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe Phe Pro Phe Ser Ile

115 120 125

Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp Pro Arg Asp Cys Pro

130 135 140

Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu Gly Cys Ile Asn Ala

145 150 155 160

Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu Ala Lys Phe Ser Gln

165 170 175

Thr Lys His His Trp Trp Trp Lys Leu His Phe Val Trp Glu Arg Val

180 185 190

Lys Ile Leu Arg Asp Tyr Ala Gly Leu Ile Leu Phe Leu Glu Glu Asp

195 200 205

His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe Lys Lys Met Trp Lys

210 215 220

Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val Leu Ser Leu Gly Thr

225 230 235 240

Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala Asp Lys Val Asp Val

245 250 255

Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly Leu Ala Leu Thr Arg

260 265 270

Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp Thr Phe Cys Thr Tyr

275 280 285

Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr Leu Thr Val Ser Cys

290 295 300

Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln Ile Pro Arg Ile Phe

305 310 315 320

His Ala Gly Asp Cys Gly Met His His Lys Lys Thr Cys Arg Pro Ser

325 330 335

Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn Asn Asn Lys Gln Tyr

340 345 350

Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys Phe Thr Val Val Ala

355 360 365

Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp Ile Arg Asp His

370 375 380

Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln

385 390

<210> 14

<211> 1539

<212> DNA

<213> Artificial sequence

<400> 14

gaggctgaag cttatccaaa gccgggcgcc acaaaacgtg gatctcccaa ccctacgagg 60

gcggcagcag tcaaggccgc attccagacg tcgtggaacg cttaccacca ttttgccttt 120

ccccatgacg acctccaccc ggtcagcaac agctttgatg atgagagaaa cggctggggc 180

tcgtcggcaa tcgatggctt ggacacggct atcctcatgg gggatgccga cattgtgaac 240

acgatccttc agtatgtacc gcagatcaac ttcaccacga ctgcggttgc caaccaaggc 300

atctccgtgt tcgagaccaa cattcggtac ctcggtggcc tgctttctgc ctatgacctg 360

ttgcgaggtc ctttcagctc cttggcgaca aaccagaccc tggtaaacag ccttctgagg 420

caggctcaaa cactggccaa cggcctcaag gttgcgttca ccactcccag cggtgtcccg 480

gaccctaccg tcttcttcaa ccctaccgtc cggagaagtg gtgcatctag caacaacgtc 540

gctgaaattg gaagcctggt gctcgaatgg acacggttga gcgacctgac gggaaacccg 600

cagtatgccc agcttgcgca gaagggcgag tcgtatctcc tgaatccaaa gggaagcccg 660

gaggcatggc ctggcctgat tggaacgttt gtcagcacga gcaacggtac ctttcaggat 720

agcagcggca gctggtccgg cctcatggac agcttctacg agtacctgat caagatgtac 780

ctgtacgacc cggttgcgtt tgcacactac aaggatcgct gggtccttgc tgccgactcg 840

accattgcgc atctcgcctc tcacccgtcg acgcgcaagg acttgacctt tttgtcttcg 900

tacaacggac agtctacgtc gccaaactca ggacatttgg ccagttttgc cggtggcaac 960

ttcatcttgg gaggcattct cctgaacgag caaaagtaca ttgactttgg aatcaagctt 1020

gccagctcgt actttgccac gtacaaccag acggcttctg gaatcggccc cgaaggcttc 1080

gcgtgggtgg acagcgtgac gggcgccggc ggctcgccgc cctcgtccca gtccgggttc 1140

tactcgtcgg caggattctg ggtgacggca ccgtattaca tcctgcggcc ggagacgctg 1200

gagagcttgt actacgcata ccgcgtcacg ggcgactcca agtggcagga cctggcgtgg 1260

gaagcgttca gtgccattga ggacgcatgc cgcgccggca gcgcgtactc gtccatcaac 1320

gacgtgacgc aggccaacgg cgggggtgcc tctgacgata tggagagctt ctggtttgcc 1380

gaggcgctca agtatgcgta cctgatcttt gcggaggagt cggatgtgca ggtgcaggcc 1440

aacggcggga acaaatttgt ctttaacacg gaggcgcacc cctttagcat ccgttcatca 1500

tcacgacggg gcggccacct tgctcacgac gagttgtaa 1539

<210> 15

<211> 1338

<212> DNA

<213> Artificial sequence

<400> 15

atgtcacttt ctcttgtatc gtaccgccta agaaagaacc cgtgggttaa catttttcta 60

cctgttttgg ccatatttct aatatatata atttttttcc agagagatca atcttcagtc 120

agcgctctcg atggcgaccc cgccagcctc acccgggaag tgattcgcct ggcccaagac 180

gccgaggtgg agctggagcg gcagcgtggg ctgctgcagc agatcgggga tgccctgtcg 240

agccagcggg ggagggtgcc caccgcggcc cctcccgccc agccgcgtgt gcctgtgacc 300

cccgcgccgg cggtgattcc catcctggtc atcgcctgtg accgcagcac tgttcggcgc 360

tgcctggaca agctgctgca ttatcggccc tcggctgagc tcttccccat catcgttagc 420

caggactgcg ggcacgagga gacggcccag gccatcgcct cctacggcag cgcggtcacg 480

cacatccggc agcccgacct gagcagcatt gcggtgccgc cggaccaccg caagttccag 540

ggctactaca agatcgcgcg ccactaccgc tgggcgctgg gccaggtctt ccggcagttt 600

cgcttccccg cggccgtggt ggtggaggat gacctggagg tggccccgga cttcttcgag 660

tactttcggg ccacctatcc gctgctgaag gccgacccct ccctgtggtg cgtctcggcc 720

tggaatgaca acggcaagga gcagatggtg gacgccagca ggcctgagct gctctaccgc 780

accgactttt tccctggcct gggctggctg ctgttggccg agctctgggc tgagctggag 840

cccaagtggc caaaggcctt ctgggacgac tggatgcggc ggccggagca gcggcagggg 900

cgggcctgca tacgccctga gatctcaaga acgatgacct ttggccgcaa gggtgtgagc 960

cacgggcagt tctttgacca gcacctcaag tttatcaagc tgaaccagca gtttgtgcac 1020

ttcacccagc tggacctgtc ttacctgcag cgggaggcct atgaccgaga tttcctcgcc 1080

cgcgtctacg gtgctcccca gctgcaggtg gagaaagtga ggaccaatga ccggaaggag 1140

ctgggggagg tgcgggtgca gtatacgggc agggacagct tcaaggcttt cgccaaggct 1200

ctgggtgtca tggatgacct taagtcgggg gttccgagag ctggctaccg gggtattgtc 1260

accttccagt tccggggccg ccgtgtccac ctggcgcccc cactgacgtg ggagggctat 1320

gatcctagct ggaattag 1338

<210> 16

<211> 2397

<212> DNA

<213> Artificial sequence

<400> 16

atggccctct ttctcagtaa gagactgttg agatttaccg tcattgcagg tgcggttatt 60

gttctcctcc taacattgaa ttccaacagt agaactcagc aatatattcc gagttccatc 120

tccgctgcat ttgattttac ctcaggatct atatcccctg aacaacaagt catctctgag 180

gaaaatgatg ctaaaaaatt agagcaaagt gctctgaatt cagaggcaag cgaagactcc 240

gaagccatgg atgaagaatc caaggctctg aaagctgccg ctgaaaaggc agatgccccg 300

atcatgagag ttctggttac cggtggtagc ggttacattg gaagtcatac ctgtgtgcaa 360

ttactgcaaa acggtcatga tgtcatcatt cttgataacc tctgtaacag taagcgcagc 420

gtactgcctg ttatcgagcg tttaggcggc aaacatccaa cgtttgttga aggcgatatt 480

cgtaacgaag cgttgatgac cgagatcctg cacgatcacg ctatcgacac cgtgatccac 540

ttcgccgggc tgaaagccgt gggcgaatcg gtacaaaaac cgctggaata ttacgacaac 600

aatgtcaacg gcactctgcg cctgattagc gccatgcgcg ccgctaacgt caaaaacttt 660

atttttagct cctccgccac cgtttatggc gatcagccca aaattccata cgttgaaagc 720

ttcccgaccg gcacaccgca aagcccttac ggcaaaagca agctgatggt ggaacagatc 780

ctcaccgatc tgcaaaaagc ccagccggac tggagcattg ccctgctgcg ctacttcaac 840

ccggttggcg cgcatccgtc gggcgatatg ggcgaagatc cgcaaggcat tccgaataac 900

ctgatgccat acatcgccca ggttgctgta ggccgtcgcg actcgctggc gatttttggt 960

aacgattatc cgaccgaaga tggtactggc gtacgcgatt acatccacgt aatggatctg 1020

gcggacggtc acgtcgtggc gatggaaaaa ctggcgaaca agccaggcgt acacatctac 1080

aacctcggcg ctggcgtagg caacagcgtg ctggacgtgg ttaatgcctt cagcaaagcc 1140

tgcggcaaac cggttaatta tcattttgca ccgcgtcgcg agggcgacct tccggcctac 1200

tgggcggacg ccagcaaagc cgaccgtgaa ctgaactggc gcgtaacgcg cacactcgat 1260

gaaatggcgc aggacacctg gcactggcag tcacgccatc cacagggata tcccgatggt 1320

accggtggtg gacgtgacct ttctcgtctg ccacaactgg ttggagtttc tactccactg 1380

caaggtggat ctaactctgc tgctgcaatt ggtcaatcat ctggtgagct tcgtactgga 1440

ggtgctcgtc cccctccacc acttggtgct tcttcccagc cccgtccagg tggcgactcc 1500

agcccagtcg tggattctgg ccctggcccc gctagcaact tgacctcggt cccagtgccc 1560

cacaccaccg cactgtcgct gcccgcctgc cctgaggagt ccccgctgct tgtgggcccc 1620

atgctgattg agtttaacat gcctgtggac ctggagctcg tggcaaagca gaacccaaat 1680

gtgaagatgg gcggccgcta tgcccccagg gactgcgtct ctcctcacaa ggtggccatc 1740

atcattccat tccgcaaccg gcaggagcac ctcaagtact ggctatatta tttgcaccca 1800

gtcctgcagc gccagcagct ggactatggc atctatgtta tcaaccaggc gggagacact 1860

atattcaatc gtgctaagct cctcaatgtt ggctttcaag aagccttgaa ggactatgac 1920

tacacctgct ttgtgtttag tgacgtggac ctcattccaa tgaatgacca taatgcgtac 1980

aggtgttttt cacagccacg gcacatttcc gttgcaatgg ataagtttgg attcagccta 2040

ccttatgttc agtattttgg aggtgtctct gctctaagta aacaacagtt tctaaccatc 2100

aatggatttc ctaataatta ttggggttgg ggaggagaag atgacgacat ttttaacaga 2160

ttagttttta gaggcatgtc tatatctcgc ccaaatgctg tggtcgggag gtgtcgcatg 2220

atccgccact caagagacaa gaaaaatgaa cccaatcctc agaggtttga ccgaattgca 2280

cacacaaagg agacaatgct ctctgatggt ttgaactcac tcacctacca ggtgctggat 2340

gtacagagat acccattgta tacccaaatc acagtggaca tcgggacacc gagctaa 2397

<210> 17

<211> 3306

<212> DNA

<213> Artificial sequence

<400> 17

atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60

tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcgcc tgcaggcgtg 120

gaggatggtc cgaaaagttc acaaagcaat ttcagccaag gtgctggctc acatcttctg 180

ccctcacaat tatccctctc agttgacact gcagactgtc tgtttgcttc acaaagtgga 240

agtcacaatt cagatgtgca gatgttggat gtttacagtc taatttcttt tgacaatcca 300

gatggtggag tttggaagca aggatttgac attacttatg aatctaatga atgggacact 360

gaaccccttc aagtctttgt ggtgcctcat tcccataacg acccaggttg gttgaagact 420

ttcaatgact actttagaga caagactcag tatattttta ataacatggt cctaaagctg 480

aaagaagact cacggaggaa gtttatttgg tctgagatct cttacctttc aaagtggtgg 540

gatattatag atattcagaa gaaggatgct gttaaaagtt taatagaaaa tggtcagctt 600

gaaattgtga caggtggctg ggttatgcct gatgaagcta ctccacatta ttttgcctta 660

attgatcaac taattgaagg acatcagtgg ctggaaaata atataggagt gaaacctcgg 720

tccggctggg ctattgatcc ctttggacac tcaccaacaa tggcttatct tctaaaccgt 780

gctggacttt ctcacatgct tatccagaga gttcattatg cagttaaaaa acactttgca 840

ctgcataaaa cattggagtt tttttggaga cagaattggg atctgggatc tgtcacagat 900

attttatgcc acatgatgcc cttctacagc tatgacatcc ctcacacttg tggacctgat 960

cctaaaatat gctgccagtt tgattttaaa cgtcttcctg gaggcagatt tggttgtccc 1020

tggggagtcc ccccagaaac aatacatcct ggaaatgtcc aaagcagggc tcggatgcta 1080

ctagatcagt accgaaagaa gtcaaagctt tttcgaacca aagttctcct ggctccacta 1140

ggagatgatt tccgctactg tgaatacacg gaatgggatt tacagtttaa gaattatcag 1200

cagctttttg attatatgaa ttctcagtcc aagtttaaag ttaagataca gtttggaact 1260

ttatcagatt tttttgatgc gctggataaa gcagatgaaa ctcagagaga caagggccaa 1320

tcgatgttcc ctgttttaag tggagatttt ttcacttatg ccgatcgaga tgatcattac 1380

tggagtggct attttacatc cagacccttt tacaaacgaa tggacagaat catggaatct 1440

catttaaggg ctgctgaaat tctttactat ttcgccctga gacaagctca caaatacaag 1500

ataaataaat ttctctcatc atcactttac acggcactga cagaagccag aaggaatttg 1560

ggactgtttc aacatcatga tgctatcaca ggaactgcaa aagactgggt ggttgtggat 1620

tatggtacca gactttttca ttcgttaatg gttttggaga agataattgg aaattctgca 1680

tttcttctta ttgggaagga caaactcaca tacgactctt actctcctga taccttcctg 1740

gagatggatt tgaaacaaaa atcacaagat tctctgccac aaaaaaatat aataaggctg 1800

agtgcggagc caaggtacct tgtggtctat aatcctttag aacaagaccg aatctcgttg 1860

gtctcagtct atgtgagttc cccgacagtg caagtgttct ctgcttcagg aaaacctgtg 1920

gaagttcaag tcagcgcagt ttgggataca gcaaatacta tttcagaaac agcctatgag 1980

atctcttttc gagcacatat accgccattg ggactgaaag tgtataagat tttggaatca 2040

gcaagttcaa attcacattt agctgattat gtcttgtata agaataaagt agaagatagc 2100

ggaattttca ccataaagaa tatgataaat actgaagaag gtataacact agagaactcc 2160

tttgttttac ttcggtttga tcaaactgga cttatgaagc aaatgatgac taaagaagat 2220

ggtaaacacc atgaagtaaa tgtgcaattt tcatggtatg gaaccacaat taaaagagac 2280

aaaagtggtg cctacctctt cttacctgat ggtaatgcca agccttatgt ttacacaaca 2340

ccgccctttg tcagagtgac acatggaagg atttattcgg aagtgacttg cttttttgac 2400

catgttactc atagagtccg actataccac atacagggaa tagaaggaca gtctgtggaa 2460

gtttccaata ttgtggacat ccgaaaagta tataaccgtg agattgcaat gaaaatttct 2520

tctgatataa aaagccaaaa tagattttat actgacctaa atgggtacca gattcaacct 2580

agaatgacac tgagcaaatt gcctcttcaa gcaaatgtct atcccatgac cacaatggcc 2640

tatatccagg atgccaaaca tcgtttgaca ctgctctctg ctcagtcatt aggggtttcg 2700

agtttgaata gtggtcagat tgaagttatc atggatcgaa gactcatgca agatgataat 2760

cgtggccttg agcaaggtat ccaggataac aagattacag ctaatctatt tcgaatacta 2820

ctagaaaaaa gaagtgctgt taatacggaa gaagaaaaga agtcggtcag ttatccttct 2880

ctccttagcc acataacttc ttctctcatg aatcatccag tcattccaat ggcaaataag 2940

ttctcctcac ctacccttga gctgcaaggt gaattctctc cattacagtc atctttgcct 3000

tgtgacattc atctggttaa tttgagaaca atacagtcaa aggtgggcaa tgggcactcc 3060

aatgaggcag ccttgatcct ccacagaaaa gggtttgatt gtcggttctc tagcaaaggc 3120

acagggctgt tttgttctac tactcaggga aagatattgg tacagaaact tttaaacaag 3180

tttattgtcg aaagtctcac accttcatca ctatccttga tgcattcacc tcccggcact 3240

cagaatataa gtgagatcaa cttgagtcca atggaaatca gcacattccg aatccagttg 3300

aggtga 3306

<210> 18

<211> 1188

<212> DNA

<213> Artificial sequence

<400> 18

atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60

tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcgcc tgcaggctcc 120

ctggtgtacc agctgaactt tgatcagacc ctgaggaatg tagataaggc tggcacctgg 180

gccccccggg agctggtgct ggtggtccag gtgcataacc ggcccgaata cctcagactg 240

ctgctggact cacttcgaaa agcccaggga attgacaacg tcctcgtcat ctttagccat 300

gacttctggt cgaccgagat caatcagctg atcgccgggg tgaatttctg tccggttctg 360

caggtgttct ttcctttcag cattcagttg taccctaacg agtttccagg tagtgaccct 420

agagattgtc ccagagacct gccgaagaat gccgctttga aattggggtg catcaatgct 480

gagtatcccg actccttcgg ccattataga gaggccaaat tctcccagac caaacatcac 540

tggtggtgga agctgcattt tgtgtgggaa agagtgaaaa ttcttcgaga ttatgctggc 600

cttatacttt tcctagaaga ggatcactac ttagccccag acttttacca tgtcttcaaa 660

aagatgtgga aactgaagca gcaagagtgc cctgaatgtg atgttctctc cctggggacc 720

tatagtgcca gtcgcagttt ctatggcatg gctgacaagg tagatgtgaa aacttggaaa 780

tccacagagc acaatatggg tctagccttg acccggaatg cctatcagaa gctgatcgag 840

tgcacagaca ctttctgtac ttatgatgat tataactggg actggactct tcaatacttg 900

actgtatctt gtcttccaaa attctggaaa gtgctggttc ctcaaattcc taggatcttt 960

catgctggag actgtggtat gcatcacaag aaaacctgta gaccatccac tcagagtgcc 1020

caaattgagt cactcttaaa taataacaaa caatacatgt ttccagaaac tctaactatc 1080

agtgaaaagt ttactgtggt agccatttcc ccacctagaa aaaatggagg gtggggagat 1140

attagggacc atgaactctg taaaagttat agaagactgc agtgataa 1188

<210> 19

<211> 4921

<212> DNA

<213> Artificial sequence

<400> 19

ggcatacact attatcttat ctatattagt cgtcgccgtt gcttttggat cctcgtgtat 60

ctctggagca ttattcactg tggaagataa ttataatgtt tcattggaag ttgccatttt 120

gacagtttca ttgatggtct tgggtttctc cttgggtcca ttgttgtggt ctcctttatc 180

tgagcagatt ggaaggagat gggtttattt tatatccttg ggtctctaca caatttttaa 240

cattccttgc gctctatccc ctaatatcgg tggtctctta gtttgtcgat ttttgtgtgg 300

tgtttttagt tccagcgcac tttgtctggt tggtggttct atagctgaca tgcatccttc 360

tgaaacaaga ggtaaagcaa tcgcctattt tgcagcagct ccttatggtg gaccagttat 420

tggaccttta gtatgtggtt ggatcggtgt taaaaccaac agaatggatc ttatcttttg 480

ggtaaatatg ggatttgcag gatttatgtg gttactagtt gcctgcattc cagaaaccta 540

tcaaccagta attttaaaga accgagcaaa gaaattaaga atggagttga acaatcctaa 600

catcatgaca gagcaagaag ctaatccact aactttcaag gaattagtag ttacctgcct 660

ttataggcct cttatgtttg ttttcactga gcctgttttg gacatgatgt gtgtttacgt 720

ttgtcttatt tactcattgc tttatgcatt tttctttgca tacccagtta tatttaatga 780

gctttatggc tatgaagatg atttcatcgg cctgatgttg attccaatat tgataggagc 840

ctttttggcc ttagttacaa ctccaatttt ggaatccatg tacgtgaaaa tgtgtcaacg 900

aagaaaacca actcctgaag acagattggt aggagccatg attgggtctc ctttccctgc 960

aattgcccta tttattttgg gagcaacgtc ctacaagcat atcatttggg tcggtccagc 1020

atcttccggt atcgccttcg gttatggaat ggtactaatt tactactctt tgaataatta 1080

catcatcgac acctacgcca agtatgcagc tagtgctctg gcaacaaagg ttttcctgag 1140

gagtgctgga ggtgctgctt tcccactatt tactacacag atgtaccata aactagggct 1200

acagtgggcc agttggttgt tggcattcat ttcattagca atgattctca tcccattcgt 1260

tttctacatt tatggtgctc gtttgagggc caaaatgtgt aaagagaact acagtgagat 1320

gtgatgcatt aagaacaatc attcattaat ccttttcagc atatattatt tctaattaat 1380

tcatacttaa taacgaaaat atggtacctg ccctcacggt ggttacggtc taggaacgga 1440

acgtatctta gcatggttgt gcgacagatt cactgtgaaa gactgttcat tatacccacg 1500

tttcactggg agatgtaagc cttaggtgtt ttaccctgat tagataatac aataaccaac 1560

agaaatacga gaatctagac taatttcgat gattcatttt tctttttacc gcgctgcctc 1620

ttttggcaat tctttcacct atattctacc ttctctttcc ttttgttcta aacttattac 1680

cagctatcta tgtcgaatca agaagaaaga cttaaactgt ggggtggcag gtttactggg 1740

gctactgacc ccttgatgga tttgtataac gcttccttac cttacgacaa gaaaatgtac 1800

aaggtggatt tagaaggaac aaaagtttac actgagggcc tggagaaaat taatttgcta 1860

actaaagacg aactaagtga gattcatcgt ggtctcaaat tgattgaagc agagtgggca 1920

gaagggaagt ttgttgagaa gccaggggat gaggatattc acactgctaa tgaacgtcgc 1980

ttgggtgagt tgattggtcg tggaatctct ggtaaggttc ataccggaag gtctagaaat 2040

gatcaagttg ccactgatat gcggttgtat gtcagagaca atctaactca gttggctgac 2100

tatctgaagc agttcattca agtaatcatc aagagagctg aacaggaaat agacgtcttg 2160

atgcccggtt atactcactt gcaaagagct caaccaatca gatggtctca ctggttgagc 2220

atgtatgcta cctatttcac tgaagattat gagagactga atcaaatcgt taaaaggttg 2280

aacaaatccc cattgggagc tggagctttg gctggtcatc cttatggaat tgatcgtgaa 2340

tacattgctg agagattagg gtttgattct gttattggta attctttggc cgctgtttca 2400

gacagagatt ttgtagtcga aaccatgttc tggtcttcgt tgtttatgaa tcatatttct 2460

cgattctcag aagatttgat catttactcc actggagagt ttggatttat caagttggca 2520

gatgcttatt ctactggatc ttctctgatg cctcaaaaaa aaaacccaga ctctttggag 2580

ttattgaggg gtaaatctgg tagatgtttt ggggccttgg ctggtttcct catgtctatt 2640

aagtccattc cgtcaaccta taacaaagat atgcaagagg ataaggagcc tttatttgat 2700

actctaatca ctgtagagca ctcgattttg atagcatccg gtgtagtttc taccttgaac 2760

attgatgccg aacgaatgaa gaatgctcta actatggata tgctggctac agatcttgcc 2820

gactatttag ttagaagggg agttccattc agagaaactc accacatttc tggtgaatgt 2880

gtcagacaag ccgaggagtt gaacctttct ggtattgatc agttgtccct cgaacaattg 2940

aaatccattg actcccgttt tgaggctgat gtggcttcaa cgtttgactt tgaagccagt 3000

gttgaaaaaa gaactgccac cggaggaact tctaagactg ctgttttaaa gcaattggat 3060

gcactgaatg aaaagctaga gtcttgaagg ttttatactg agtttgttaa tgatacaata 3120

aactgttata gtacatacaa ttgaaactct cttatctata ctgggggacc ttctcgcaga 3180

atggtataaa tatctactaa ctgactgtcg tacggcctag gggtctcttc ttcgattatt 3240

tgcaggtcgg aacatccttc gtctgatgcg gatctcctga gacaaagttc acgggtatct 3300

agtattctat cagcataaat ggaggacctt tctaaactaa actttgaatc gtctccagca 3360

gcatcctcgc ataatccttt tgtcatttcc tctatgtcta ttgtcactgt ggttggcgca 3420

tcaagagtcg tccttctgta aaccggtaca gaattcctac cactagaagc ttgaaatggg 3480

gagggtttca gctttgtatc ccgatactgt gctttaaaaa gggagtccaa actgaaatct 3540

ttttcggaat cattggatga tacctctgta ttagatctcc tatgtatcgg tttcctcggg 3600

tagatagaac ttcactcatc aacattatga tctttgtcga aaagtatcaa ttgaaacatt 3660

gccgctctgg ctctttcctt ggtgtccgtg ttgtcgcttt caaaactcaa tttcttgata 3720

acatcataaa atccatcttt aattagcttc aacgctcttg atctaggtgc tcgcatcttc 3780

ttgaaatgtt catcggaagt tagctcattc aagtacccaa catttatttc ttcttcaata 3840

gtttccatat ccatttcaac atctgaatct tccagatctg aagatgtatc gtccttccat 3900

gttaagttgg taactatcca aatacatgat atcatcagat ctttatggaa agcggcccat 3960

tcggaggaga ccccttctat ttcttgtact aaaggagtct ccaataacat ataaatgaag 4020

tcgagcaatt cttgattaca aataatcatt gatctgttat cttcattaga ggccgcaaaa 4080

tggaccagga tataagtgat agcaagaata acctcataag tttctgattc ctttctttta 4140

ctaatgtcat cctcctttaa tgtggatgat aaactcttca aattttttaa tagaaaattc 4200

aaaaaatctt tatcatcgtg agcttttgct gtcgggtcgg aacagaatga ttgaatgatt 4260

ttgttcgaat agttaagagg accacaggac aagtttcgga taatattgaa tgctttttct 4320

tgaatttgca gatttgaaga ataacaaagt tcaaaaattc ttgataaagg aactttgtcc 4380

aaaaataatt ttttatcaat gatatcatcc ccgtaaaggt aatttctaag aattgataag 4440

gcattgttct ttaagaattc aaactcgttc tcttccgaaa caaaataaga caataccttc 4500

aggaagtctt cattgaaaac attttttttc aaagaactat attccaccac acaattggaa 4560

atgattccca aaactagcgc cttgagtgta atttcgtcat ccaataagga cgcacaagat 4620

tcattgtctc ttgaaaccaa aggcagtttc accagatccg tcaacgagtt tacaatgttt 4680

aaatctacta ggtaggttcg tagcaatggc gctgatcgtg acagtgagcg gaccaagtac 4740

agagcagacg tcgtgattat gtttgaaagc ttcaatatag taatgacatg atccaactga 4800

gcagcgtctc cgtgaaactc tttgtaaata ttaatatgac gagagacaag atccaccaca 4860

cattctgaaa caatgtcatg cttgataatt tcatctctgt attcctcgtt gttggacgtt 4920

a 4921

<210> 20

<211> 2023

<212> DNA

<213> Artificial sequence

<400> 20

ggtaccgcag tttaatcata gcccactgct aagccagaat tctaatatgt aactacgtac 60

ctttcctttt aataaatgat ctgtattttc cacctagtag cagatcaaat tgttcaactt 120

taagtctttg gtccctcaag cgagagaact tgcgatgaca ctcaggagtg ccataaaagc 180

cagaacctca aaaggactga tcggagctgt tattatagcc tcaataatat ttttcaccac 240

agtaaccttc tacgatgaaa gcaaaattgt cggcataata agagtttctg atacttatac 300

aggccatagc gctgtatctt caactttcaa tgcttcttcc gttgttagtg acaacaagat 360

caacggatat ggacttcctt tgattgacac ggaatcaaat agccgttatg aggatccaga 420

cgatatttcc attgaaaacg aattgcgcta tagaattgcc caatctacca aagaggaaga 480

aaacatgtgg aaactcgata ccactctcac ggaagcaagc ttgaaaatcc ccaacataca 540

gtcgtttgag ctgcagccgt tcaaagaaag acttgataat tcactttaca attctaagaa 600

cataggaaac ttttacttct atgacccaag gcttacattc tcagtttact tgaagtatat 660

caaggataaa ttggcctctg gaagcacaac aaatcttaca atacccttca actgggcaca 720

ttttagagat ttatcgtcac tgaatcctta tttggacata aaacaagaag ataaggtcgc 780

atgtgattac ttttatgaat caagtaataa agacaaacga aaacccacgg gtaactgtat 840

tgagtttaaa gatgttcgtg atgagcacct gatacagtat gggatttcat caaaagacca 900

tctacctggt ccttttattt taaagtcact tggaattccc atgcagcata cagccaagcg 960

actggaatca aatctttatc tattaaccgg tgcgccagtt ccacttgcgg ccgcacttta 1020

ctttcttggt attggaattc attgatgttc ccttgggatt atgatattga tgtgcaaatg 1080

ccaatcaaga gtttgaacaa tctatgtgct aacttcaacc aatcattaat aattgaggat 1140

cttactgaag gatattcttc ttttttcttg gattgcggat caagtatcac gcatagaaca 1200

aaaggcaaag gattaaactt cattgatgca agattcataa atgttgaaac aggcctttat 1260

atcgatatca ctggattaag taccagtcag tcagctcgac cgccaaggtt tagtaacgct 1320

tcgaagaaag atcctattta caattgcagg aataatcatt tctactctca taacaatata 1380

gcacctctca aatacacgtt gatggagggg gttcccagtt tcattcctca acagtatgaa 1440

gaaatattga gagaggagta tacaactggt ttgacttcga aacactacaa cggcaacttt 1500

tttatgactc aattgaattt gtggcttgaa agagatccaa tgctagcact tgtgccttca 1560

tccaaatacg aaattgaagg tggaggggtg gaccataaca agattatcaa gtctattctt 1620

gaactttcca acatcaaaaa attggaattg ttggatgata atcccgatat attagaggag 1680

gtgatcagga catacgaact gacttccatt caccataaag agatgcagta tctttccagt 1740

gtcaaaccag atggggacag gtccatgcag tcaaatgaca taaccagttc ttaccaggag 1800

tttctagcaa gtctgaagaa attccagcct ttacgcaaag atttgttcca atttgagcgg 1860

atagaccttt ctaagcatag aaaacagtga gcagccgttt tgcctaaaat gttccagaaa 1920

ctataggata aatatataca gtaatgaatt aggtgatgtt agcatttagt ccccaaaaat 1980

acctcgaatc tccagctcca tagcgcaaaa tctcggatct aga 2023

77页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：高效合成不同来源的血红或肌红蛋白的酿酒酵母菌株的构建及其应用

一种用于糖蛋白制备的工程化酵母构建方法及其菌株

相关技术

网友询问留言