蛋白质的制造方法

文档序号:1382395 发布日期:2020-08-14 浏览:20次 >En<

阅读说明:本技术 蛋白质的制造方法 (Method for producing protein ) 是由 深田宽朗 河口礼佳 十仓充范 于 2018-10-09 设计创作,主要内容包括:本发明提供蛋白质的制造方法。通过培养基培养以使YscB蛋白质的活性降低的方式进行了修饰并且具有靶蛋白生产能力的Talaromyces cellulolyti cus,从而制造靶蛋白。(The present invention provides a method for producing a protein. Talaromyces cellulolyticus cus modified so as to reduce the activity of YscB protein and having the ability to produce a target protein is cultured in a medium to produce the target protein.)

蛋白质的制造方法

技术领域

本发明涉及蛋白质的制造方法。

背景技术

作为蛋白质的制造方法,报告了使用了棒状细菌、芽孢杆菌属细菌、酵母、丝状菌等的各种微生物的方法。

例如,非专利文献1公开了,使用了丝状菌Talaromyces cellulolyticus(旧名:Acremonium cellulolyticus)的宿主由来的纤维素酶的生产。此外,专利文献1中公开了,使用了丝状菌的抗体的生产。此外,专利文献2公开了,使用了Talaromycescellulolyticus等的丝状菌并且具有内腔的多聚体蛋白质的生产。

此外,专利文献3~4中公开了,使用了内源性蛋白酶的活性弱化了的丝状菌的异源蛋白的生产。此外,专利文献5中公开了,使用了内源性碱蛋白酶的活性弱化了的丝状菌的异源蛋白的生产。

此外,专利文献6中公开了,使用了缺乏羧肽酶yscα活性的酵母的异源蛋白的生产。该文献中指出,该酵母还可以缺乏选自yscA、yscB、yscY和y scS中的肽酶活性。

然而,尚不知Talaromyces cellulolyticus中的YscB蛋白质与蛋白质生产的关系。

现有技术文献

专利文献

专利文献1:日本特表2006-512891

专利文献2:日本特开2016-158599

专利文献3:日本特表2015-512611

专利文献4:日本特表2016-523552

专利文献5:日本特表2000-507106

专利文献6:日本特开1990-104279

非专利文献

非专利文献1:Inoue H,et al.,Construction of a starch-inducible homologous expression system to produce cellulolytic enzymes from Acremoniumcellulolyticus.J Ind Microbiol Biotechnol.2013Aug;40(8):823-30.

发明内容

发明所解决的技术问题

本发明的目的是提供蛋白质的制造方法。

解决问题的技术手段

本发明人等为了解决所述问题而进行了深入研究,结果发现,以使YscB蛋白质的活性降低的方式对Talaromyces cellulolyticus进行修饰,从而能够提高Talaromycescellulolyticus的蛋白质生产能力,完成了本发明。

即,本发明可以举例如下。

1、一种靶蛋白的制造方法,其包含下述工序:

通过培养基培养具有生产靶蛋白的能力的Talaromyces cellulolyticus,其中,

所述Talaromyces cellulolyticus经过了修饰,以使得与非修饰菌株相比Y scB蛋白质的活性降低。

2、所述方法,其中,

通过降低yscB基因的表达或破坏yscB基因,而使所述YscB蛋白质的活性降低。

3、所述方法,其中,

通过yscB基因的缺失而使所述YscB蛋白质的活性降低。

4、所述方法,其中,

所述YscB蛋白质为下述(a)、(b)或(c)所述的蛋白质:

(a)包含SEQ ID NO.43表示的氨基酸序列的蛋白质;

(b)包含在SEQ ID NO.43表示的氨基酸序列中含有1~10个的氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列,并且具有蛋白酶活性的蛋白质;

(c)包含相对于SEQ ID NO.43表示的氨基酸序列具有90%以上的同源性的氨基酸序列,并且具有蛋白酶活性的蛋白质。

5、所述方法,其中,

所述Talaromyces cellulolyticus经过了修饰,以使得与非修饰菌株相比CreA蛋白质的活性降低。

6、所述方法,其中,

通过降低creA基因的表达或破坏creA基因,而使所述CreA蛋白质的活性降低。

7、所述方法,其中,

通过creA基因的缺失,而使所述CreA蛋白质的活性降低。

8、所述方法,其中,

所述Talaromyces cellulolyticus为源自Talaromyces cellulolyticus S6-25菌株(NITE BP-01685)的修饰菌株。

9、所述方法,其还包含下述工序:

回收靶蛋白。

10、所述方法,其中,

通过所述培养而使靶蛋白积蓄于所述培养基中。

11、所述方法,其中,

靶蛋白作为与在Talaromyces cellulolyticus中发挥功能的信号肽形成的融合蛋白而进行表达。

12、所述方法,其中,

靶蛋白为异源蛋白。

13、所述方法,其中,

靶蛋白为源自人的蛋白质。

14、所述方法,其中,

靶蛋白为人血清白蛋白。

15、所述方法,其中,

靶蛋白为抗体相关分子。

16、所述方法,其中,

靶蛋白为生长因子。

附图说明

[图1]表示基于T.cellulolyticus F09菌株和F09ΔyscB菌株的人血清白蛋白(HSA)生产的结果的图(照片)。

[图2]表示基于T.cellulolyticus F09菌株和F09ΔyscB菌株的曲妥珠单抗生产的结果的图(照片)。

[图3]表示基于T.cellulolyticus F09菌株和F09ΔyscB菌株的角质细胞生长因子(Keratinocyte growth factor)1(KGF-1)生产的结果的图(照片)。

[图4]表示基于T.cellulolyticus F09菌株和F09ΔyscB菌株的血管内皮生长因子(Vascular endothelial growth factor)(VEGF)生产的结果的图(照片)。

[图5]表示T.cellulolyticus F09菌株的培养上清液的蛋白酶活性的评价结果的图(照片)。

[图6]表示T.cellulolyticus F09菌株及其蛋白酶缺陷菌株的培养上清液的蛋白酶活性的评价结果的图(照片)。

具体实施方式

以下,对本发明详细地进行说明。

本发明的方法是利用了Talaromyces cellulolyticus的靶蛋白的制造方法。也将该方法中利用的Talaromyces cellulolyticus称为“本发明的微生物”。

<1>本发明的微生物

本发明的微生物是,以使YscB蛋白质的活性降低的方式进行了修饰的、具有靶蛋白生产能力的Talaromyces cellulolyticus。需要说明的是,在本发明的微生物的说明中,有时将本发明的微生物或用于构建它们的Talaromyces c ellulolyticus称为“宿主”。

<1-1>Talaromyces cellulolyticus

本发明的微生物为Talaromyces cellulolyticus。Talaromyces cellulolyticus的旧名为Acremonium cellulolyticus。即,Acremonium cellulolyticus通过系统分类的修订而被再分类为Talaromyces cellulolyticus(FEMS Microbiol.Lett.,2014,351:32-41)。作为Talaromyces cellulolyticus,具体而言,可举出:C1菌株(日本特开2003-135052)、CF-2612菌株(日本特开2008-271927)、TN菌株(FERM BP-685)、S6-25菌株(NITEBP-01685)、Y-94菌株(FERM BP-5826、CBS 136886)和它们的衍生菌株。需要说明的是,“Talaromyces cellulolyticus”总称为:在本申请的申请前、申请时和申请后的至少任一时间点被分类在Tal aromyces cellulolyticus中的真菌。即,例如,所述例举的菌株等的被分类在T alaromyces cellulolyticus中的菌株,即使在将来改变系统分类的情况下,也被视为属于Talaromyces cellulolyticus。

S6-25菌株原本于2013年8月8日被保藏在NITE国际专利微生物保藏中心(日本千叶县木更津市上总镰足2-5-8 122号室,邮编292-0818),并于2013年11月15日基于布达佩斯条约而被移交至国际保藏中心,并被赋予保藏编号NITE BP-01685。该菌株为由TN菌株(FERM BP-685)而得到的菌株,具有较高的纤维素酶生产能力。Y-94菌株原本于1983年1月12日被保藏在通商产业省工业技术院生命工学工业技术研究所(现为NITE国际专利微生物保藏中心,邮编292-0818,地址:日本千叶县木更津市上总镰足2-5-8 120号室),并于1997年2月19日基于布达佩斯条约而被移交至国际保藏中心,并被赋予保藏编号FERM BP-5826。

例如,这些菌株可以从各菌株所保藏的保藏机关入手。

本发明的微生物,可以通过对所述例举的菌株等的Talaromyces cellulolyticus进行修饰而取得。即,例如,本发明的微生物可以为源自所述例举的菌株的修饰菌株。具体而言,例如,本发明的微生物可以为源自S6-25菌株或Y-94菌株的修饰菌株。更具体而言,例如,本发明的微生物可以为源自S6-25菌株的修饰菌株。用于构建本发明的微生物的修饰的实施顺序没有特别限制。

<1-2>靶蛋白生产能力

本发明的微生物具有靶蛋白生产能力。“具有靶蛋白生产能力的微生物”是指具有生产靶蛋白的能力的微生物。“具有靶蛋白生产能力的微生物”具体而言可以指,在通过培养基而进行培养时,具有表达靶蛋白并在培养物中使靶蛋白积蓄至能够回收的程度的能力的微生物。具体而言,“在培养物中的积蓄”可以指在培养基中、菌体表层、菌体内或它们的组合中的积蓄。需要说明的是,将靶蛋白积蓄在菌体外(例如,培养基中、细胞表层)的情况称为靶蛋白的“分泌”或“分泌生产”。即,本发明的微生物可以具有靶蛋白的分泌生产能力(分泌生产靶蛋白的能力)。靶蛋白特别是可以积蓄在培养基中。就靶蛋白的积蓄量而言,例如,作为培养物中的积蓄量,可以为10μg/L以上、1mg/L以上、100mg/L以上或1g/L以上。本发明的微生物可以具有1种靶蛋白的生产能力,也可以具有2种或以上的靶蛋白的生产能力。

本发明的微生物可以是本来就具有靶蛋白生产能力的物质,也可以是以具有靶蛋白生产能力的方式进行了修饰的物质。典型性地,本发明的微生物可以是本来就具有纤维素酶生产能力(生产纤维素酶的能力)的物质。此外,本发明的微生物可以是以使本来所具有的靶蛋白生产能力增强的方式进行了修饰的物质。就具有靶蛋白生产能力的微生物而言,例如,可以通过如上所述地赋予Talaromyces cellulolyticus以靶蛋白生产能力,或,通过如上所述地增强Talaromyces cellulolyticus的靶蛋白生产能力而取得。就靶蛋白生产能力而言,例如,可以通过靶蛋白的表达用的基因构建体的导入、其它提高靶蛋白生产能力的修饰的导入或它们的组合而进行赋予或增强。

本发明的微生物依靠具有至少靶蛋白的表达用的基因构建体而具有靶蛋白生产能力。具体而言,本发明的微生物可以通过具有靶蛋白的表达用的基因构建体,或通过具有靶蛋白的表达用的基因构建体和其他性质的组合,而具有靶蛋白生产能力。即,本发明的微生物具有靶蛋白的表达用的基因构建体。本发明的微生物可以具有1拷贝的靶蛋白的表达用的基因构建体,也可以具有2拷贝或以上的靶蛋白的表达用的基因构建体。本发明的微生物可以具有1种靶蛋白的表达用的基因构建体,也可以具有2种或以上的靶蛋白的表达用的基因构建体。靶蛋白的表达用的基因构建体的拷贝数和种类数可以分别称为靶蛋白基因的拷贝数和种类数。

本发明的微生物中,靶蛋白的表达用的基因构建体可以存在于质粒这样的在染色体外进行自主复制的载体上,也可以整合在染色体上。即,就本发明的微生物而言,例如,可以在载体上具有靶蛋白的表达用的基因构建体,换而言之,可以具有包含靶蛋白的表达用的基因构建体的载体。此外,就本发明的微生物而言,例如,可以在染色体上具有靶蛋白的表达用的基因构建体。在本发明的微生物具有2个或以上的靶蛋白的表达用的基因构建体的情况下,这些基因构建体只要以能够制造靶蛋白的方式保持在本发明的微生物中即可。例如,这些基因构建体可以全部保持在单个的表达载体上,也可以全部保持在染色体上。此外,这些基因构建体可以分别保持在多个表达载体上,也可以分别保持在单个或多个表达载体上和染色体上。

本发明的微生物可以是本来就具有靶蛋白的表达用的基因构建体的物质,也可以是以具有靶蛋白的表达用的基因构建体的方式进行了修饰的物质。典型性地,本发明的微生物可以是本来就具有纤维素酶的表达用的基因构建体的物质。此外,本发明的微生物可以是代替本来就具有的靶蛋白的表达用的基因构建体而导入了靶蛋白的表达用的基因构建体的物质、或进一步导入了靶蛋白的表达用的基因构建体的物质。具有靶蛋白的表达用的基因构建体的微生物,可以通过如上所述在Talaromyces cellulolyticus中导入靶蛋白的表达用的基因构建体而取得。

“靶蛋白的表达用的基因构建体”是指,以能够表达靶蛋白的方式构成的基因表达系统。也将靶蛋白的表达用的基因构建体称为“靶蛋白的表达系统”、“靶蛋白的表达单元”或“靶蛋白的表达盒”。靶蛋白的表达用的基因构建体在5’至3’方向上包含启动子序列和编码靶蛋白的碱基序列。也将启动子序列简称为“启动子”。也将编码氨基酸序列的碱基序列称为“基因”。例如,也将编码靶蛋白编码的碱基序列称为“编码靶蛋白的基因”或“靶蛋白基因”。靶蛋白基因只要连接在启动子的下游以受到基于同启动子的控制并表达靶蛋白即可。此外,靶蛋白的表达用的基因构建体可以在适当的位置上具有用于表达靶蛋白的有效的控制序列(操纵子、终止子等)以使它们发挥功能。需要说明的是,本发明中,除非特别说明,否则“靶蛋白基因的表达”、“靶蛋白的表达”、“靶蛋白的生成”、“靶蛋白的生产”可以相互同义地使用。靶蛋白的表达用的基因构建体可以根据靶蛋白的种类等的各种条件而进行适宜设计。

启动子只要在Talaromyces cellulolyticus中发挥功能,就没有特别限制。“在Talaromyces cellulolyticus中发挥功能的启动子”是指在Talaromyces cellulolyticus中具有启动子活性,即基因的转录活性的启动子。

启动子可以是源自宿主的启动子,也可以是源自异源的启动子。启动子可以是靶蛋白基因的固有的启动子,也可以是其他基因的启动子。此外,启动子可以是诱导性的启动子,也可以是组成性(constitutive)的启动子。作为启动子,可举出微生物的纤维素酶基因的启动子。作为启动子,具体而言,可举出Talaromyces cellulolyticus的纤维素酶基因的启动子。作为纤维素酶基因,可举出cbhI基因(也称为cbh1基因)、cbhII基因(也称为cbh2基因)。即,作为启动子,可举出cbhI基因的启动子、cbhII基因的启动子。也可以将cbhI基因的启动子称为“cbhI启动子”或“cbh1启动子”。也可以将cbhII基因的启动子称为“cbhII启动子”或“cbh2启动子”。将Talaromyces cellulolyticus的cbhI启动子和cbhII启动子的碱基序列分别表示为SEQ ID NO.41和33。即,就启动子而言,例如,可以是具有所述例举的启动子的碱基序列(例如S EQ ID NO.41或33的碱基序列)的启动子。此外,启动子可以是所述例举的启动子(例如具有SEQ ID NO.41或33的碱基序列的启动子)的保守性变体。即,例如,所述例举的启动子可以原样使用或进行适宜修饰后使用。“cbhI启动子”和“cbhII启动子”这样的术语除了所述例举的cbhI启动子和cbhII启动子之外,还包含它们的保守性变体。对于启动子的保守性变体,可以适用涉及后述的yscB基因的保守性变体的记载。例如,启动子如果保持原本的功能,则可以是具有相对于SEQ ID NO.41或33的碱基序列具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的碱基序列的DNA。需要说明的是,启动子的“原本的功能”是指,表达(例如,诱导性或组成性地表达)连接在下游的基因的功能。就启动子的功能而言,例如,可以通过确认基因的表达而进行确认。就基因的表达而言,例如,可以使用报告基因进行确认。

靶蛋白没有特别限制。靶蛋白可以是源自宿主的蛋白质,也可以是源自异源的蛋白质(异源蛋白质)。本发明中,“异源蛋白质”(heterologous protein)是指,对于生产该蛋白质的Talaromyces cellulolyticus而言是外来性(exogeno us)的蛋白质。就靶蛋白而言,例如,可以是源自微生物的蛋白质,可以是源自植物的蛋白质,可以是源自动物的蛋白质,可以是源自病毒的蛋白质,可以是具有人工设计的氨基酸序列的蛋白质。特别是,靶蛋白可以是人源性蛋白质。靶蛋白可以是单体蛋白质,也可以是多聚体蛋白质。多聚体蛋白质是指,作为包含2或以上的亚基的多聚体而存在的蛋白质。多聚体中,各亚基可以通过二硫键等的共价键而进行连接,可以通过氢键、疏水性相互作用等的非共价键而进行连接,也可以通过它们的组合而进行连接。优选在多聚体中包含1个或以上的分子间二硫键。多聚体可以是包含单一的种类的亚基的同源多聚体,也可以是包含2或以上的种类的亚基的异源多聚体。需要说明的是,“靶蛋白是异源蛋白质”是指,在靶蛋白是异源多聚体蛋白质的情况下,只要构成多聚体的亚基的中至少1个的亚基是异源蛋白质即可。即,可以所有亚基都源自异源,也可以仅一部分亚基源自异源。靶蛋白可以是分泌性蛋白,也可以是非分泌性蛋白。分泌性蛋白可以是天然分泌性的蛋白质,也可以是天然非分泌性的蛋白质,优选为天然分泌性的蛋白质。需要说明的是,“蛋白质”中还包含寡肽、多肽等的称为肽的物质。

作为靶蛋白,例如可举出:酶、生物活性蛋白、受体蛋白、作为疫苗使用的抗原蛋白、其它任意的蛋白质。

作为酶,例如可举出:纤维素酶、谷胺酰转氨酶、蛋白质谷氨酰胺酶(Pr oteinglutaminase)、异麦芽糖葡聚糖酶(Isomaltodextranase)、蛋白酶、内肽酶、外肽酶、氨基肽酶、羧基肽酶、胶原酶和几丁质酶等。

本发明中,“纤维素酶”是催化使纤维素中包含的糖苷键水解的反应的酶的总称。作为纤维素酶,可举出:内切型纤维素酶(内切葡聚糖酶;EC 3.2.1.4)、外切型纤维素酶(纤维二糖水解酶;EC 3.2.1.91)、纤维二糖酶(β-葡萄糖苷酶;EC 3.2.1.21)。此外,根据活性测定中使用的基质,纤维素酶称为微晶纤维酶(Avicelase)、滤纸纤维素酶(FPase)、羧甲基纤维素酶(CMCase)等。作为纤维素酶,例如,可举出:里氏木霉(Trichoderma reesei)、Talaromyces cellulol yticus等的真菌、热纤梭菌(Clostridium thermocellum)等的细菌的纤维素酶。

作为谷胺酰转氨酶,例如,可举出:Streptoverticillium mobaraense IFO13819(WO01/23591)、Streptoverticillium cinnamoneum IFO 12852、Streptove rticilliumgriseocarneum IFO 12776、Streptomyces lydicus(WO9606931)等的放线菌、Oomycetes(WO9622366)等的丝状菌的分泌型的谷胺酰转氨酶。作为蛋白质谷氨酰胺酶,例如可举出Chryseobacterium proteolyticum的蛋白质谷氨酰胺酶(WO2005/103278)。作为异麦芽糖葡聚糖酶,例如可举出Arthrobact er globiformis的异麦芽糖葡聚糖酶(WO2005/103278)。

作为生物活性蛋白,例如可举出:生长因子(Growth factor),激素,细胞因子,抗体相关分子。

作为生长因子(Growth factor),具体而言,例如可举出:表皮生长因子(Epidermal growth factor;EGF)、胰岛素样生长因子-1(Insulin-like growth factor-1;IGF-1)、转化生长因子(Transforming growth factor;TGF)、神经生长因子(Nervegrowth factor;NGF)、脑源性神经营养因子(Brain-derived neurotrophic factor;BDNF)、血管内皮生长因子(Vascular endothelial growth factor;VEGF)、粒细胞集落刺激因子(Granulocyte-colony stimulating factor;G-CSF)、粒细胞巨噬细胞集落刺激因子(Granulocyte-macrophage-colony stimulating factor;GM-CSF)、血小板衍生生长因子(Platelet-derived growth factor;PDGF)、促红细胞生成素(Erythropoietin;EPO)、血小板生成素(Thrombopoietin;TPO)、酸性成纤维细胞生长因子(acidic fibroblastgrowth factor;aFGF或FGF1)、碱基性成纤维细胞生长因子(basic fibroblast growthfactor;bFGF或FGF2)、角质细胞生长因子(Keratinocyte growth factor;KGF-1或FGF7、KGF-2或FGF10)、肝细胞生长因子(Hepatocyte growth factor;HGF)。

作为激素,具体而言,例如可举出:胰岛素、胰高血糖素、生长抑素(somatostatin)、人类生长激素(human growth hormone;hGH)、甲状旁腺激素(parathyroid hormone;PTH)、降钙素(calcitonin)、艾塞那肽(exenatide)。

作为细胞因子,具体而言,例如可举出:白细胞介素、干扰素、肿瘤坏死因子(TumorNecrosis Factor;TNF)。

需要说明的是,生长因子(Growth factor)、激素和细胞因子可以不用相互严格区别。例如,生物活性蛋白可以属于选自生长因子(Growth factor)、激素和细胞因子中的任一组,也可以属于选自这些中的多个组。

此外,生物活性蛋白可以是蛋白质整体,也可以是其一部分。作为蛋白质的一部分,例如可举出具有生理活性的部分。作为具有生理活性的部分,具体而言,例如可举出包含甲状旁腺激素(parathyroid hormone;PTH)的成熟体的N末端34氨基酸残基的生理活性肽特立帕肽(Teriparatide)。

“抗体相关分子”是指,包含由选自构成完整抗体的结构域的单个结构域或2或者2以上结构域的组合组成的分子种的蛋白质。作为构成完整抗体的结构域,可举出:作为重链的结构域的VH、CH1、CH2和CH3、以及作为轻链的结构域的VL和CL。抗体相关分子只要包含所述分子种即可,可以是单体蛋白质,也可以是多聚体蛋白质。需要说明的是,在抗体相关分子为多聚体蛋白质的情况下,可以是包含单一种类的亚基的同源多聚体,也可以是包含2或2个以上种类的亚基的异源多聚体。作为抗体相关分子,具体而言,例如可举出:完整抗体、Fab、F(ab’)、F(ab’)2、Fc、包含重链(H链)与轻链(L链)的二聚体、Fc融合蛋白、重链(H链)、轻链(L链)、单链Fv(scFv)、sc(Fv)2、二硫键Fv(sdFv)、双链抗体(diabody)、VHH片段(nanobody(注册商标))。作为抗体相关分子,更具体而言,例如可举出曲妥珠单抗、纳武单抗。

受体蛋白没有特别限制,例如,可以是对于生物活性蛋白、其它生理活性物质的受体蛋白。作为其它生理活性物质,例如可举出多巴胺等的神经递质。此外,受体蛋白也可以是对应的配体未知的孤儿受体。

作为疫苗使用的抗原蛋白,只要能够引起免疫应答,就没有特别限制,根据假定的免疫应答的对象而适宜选择即可。

此外,作为其它蛋白质,可举出:肝型脂肪酸结合蛋白Liver-type fatty acid-binding protein(LFABP)、荧光蛋白、免疫球蛋白结合蛋白、白蛋白、细胞外蛋白。作为荧光蛋白,可举出绿色荧光蛋白Green Fluorescent Protein(GFP)。作为免疫球蛋白结合蛋白,可举出Protein A、Protein G、Protein L。作为白蛋白,可举出人血清白蛋白。

作为细胞外蛋白,可举出:纤连蛋白、玻连蛋白、胶原蛋白、骨桥蛋白、层粘连蛋白、它们的部分序列。层粘连蛋白是具有包含α链、β链和γ链的异三聚体结构的蛋白质。作为层粘连蛋白,可举出哺乳动物的层粘连蛋白。作为哺乳动物,可举出:人、猴子、黑猩猩等的灵长类、小鼠、大鼠、仓鼠、豚鼠等的啮齿类、兔子、马、牛、绵羊、山羊、猪、狗、猫等的其它各种哺乳动物。作为哺乳动物,特别是可举出人。层粘连蛋白的亚基链(即,α链、β链和γ链),可举出:5种α链(α1~α5)、3种β链(β1~β3)、3种γ链(γ1~γ3)。层粘连蛋白通过这些亚基链的组合而构成各种的同工型。作为层粘连蛋白,具体而言,例如可举出:层粘连蛋白111、层粘连蛋白121、层粘连蛋白211、层粘连蛋白213、层粘连蛋白221、层粘连蛋白311、层粘连蛋白321、层粘连蛋白332、层粘连蛋白411、层粘连蛋白421、层粘连蛋白423、层粘连蛋白511、层粘连蛋白521、层粘连蛋白523。作为层粘连蛋白的部分序列,可举出作为层粘连蛋白的E8片段的层粘连蛋白E8。具体而言,层粘连蛋白E8,是具有包含α链的E8片段(α链E8)、β链的E8片段(β链E8)和γ链的E8片段(γ链E8)的异三聚体结构的蛋白质。层粘连蛋白E8的亚基链(即,α链E8、β链E8和γ链E8)也总称为“E8亚基链”。作为E8亚基链,可举出所述例举的层粘连蛋白亚基链的E8片段。层粘连蛋白E8通过这些E8亚基链的组合而构成各种同工型。作为层粘连蛋白E8,具体而言,例如可举出:层粘连蛋白111E8、层粘连蛋白121E8、层粘连蛋白211E8、层粘连蛋白221E8、层粘连蛋白332E8、层粘连蛋白421E8、层粘连蛋白411E8、层粘连蛋白511E8、层粘连蛋白521E8。

靶蛋白基因可以原样利用或适宜修饰后利用。靶蛋白基因,例如,为了得到期望的活性而可以进行修饰。对于靶蛋白基因和靶蛋白的变体,可以援用对后述的yscB基因和YscB蛋白质的保守性变体的记载。例如,靶蛋白基因可以以使得在编码的靶蛋白的氨基酸序列中包含1个或几个氨基酸的取代、缺失、插入和/或添加的方式而进行修饰。需要说明的是,源自生物种的特定的蛋白质不限于在该生物种中发现的蛋白质本身,还包含具有在该生物种中发现的蛋白质的氨基酸序列的蛋白质和它们的变体。这些变体可以在该生物种中发现,也可以没有发现。即,例如,“人源蛋白质”是指,不限于在人体中发现的蛋白质本身,还包含具有在人体中发现的蛋白质的氨基酸序列的蛋白质和它们的变体。此外,靶蛋白基因可以将任意的密码子用与其等价的密码子取代。例如,就靶蛋白基因而言,可以根据使用的宿主的密码子使用频率而进行修饰,以使得具有最适的密码子。

就靶蛋白而言,除了所述例举的靶蛋白的氨基酸序列之外,还可以包含其他氨基酸序列。即,靶蛋白可以是与其他氨基酸序列形成的融合蛋白。“其他氨基酸序列”只要能得到期望的性质的靶蛋白,就没有特别限制。“其他氨基酸序列”可以根据其利用目的等的各种条件而适宜选择。作为“其他氨基酸序列”,例如可举出:信号肽(也称为信号序列)、肽标签、蛋白酶的识别序列。“其他氨基酸序列”,例如,可以与靶蛋白的N末端或者C末端、或两者连接。作为“其他氨基酸序列”,可以使用1种氨基酸序列,也可以组合使用2种或2种以上的氨基酸序列。

信号肽,例如,可以在靶蛋白的分泌生产中利用。信号肽可以与靶蛋白的N末端连接。即,在一个方式中,靶蛋白的表达用的基因构建体在从5’至3’方向上可以包含启动子序列、编码信号肽的碱基序列和编码靶蛋白的碱基序列。在这种情况下,可以将编码靶蛋白的核酸序列连接至编码信号肽的核酸序列的下游,以使得靶蛋白作为与同信号肽形成的融合蛋白而进行表达。需要说明的是,在这样的融合蛋白中,信号肽和靶蛋白可以相邻,也可以不相邻。即,“靶蛋白作为与信号肽形成的融合蛋白而进行表达”不限于靶蛋白与信号肽相邻并作为与同信号肽形成的融合蛋白而进行表达的情况,还包含靶蛋白借助其他氨基酸序列而作为与信号肽形成的融合蛋白而进行表达的情况。在利用信号肽而分泌生产靶蛋白的情况下,通常,在分泌时剪切信号肽,可以将没有信号肽的靶蛋白分泌在菌体外。即,“靶蛋白作为与信号肽形成的融合蛋白而进行表达”或“靶蛋白包含信号肽”是指,只要靶蛋白在表达时构成与信号肽形成的融合蛋白即可,不需要最终得到的靶蛋白构成与信号肽形成的融合蛋白。

信号肽只要是在Talaromyces cellulolyticus中发挥功能物质就没有特别限制。“在Talaromyces cellulolyticus中发挥功能的信号肽”是指,当与靶蛋白的N末端连接时,在Talaromyces cellulolyticus中带来靶蛋白的分泌的肽。

信号肽可以是源自宿主的信号肽,也可以是源自异源的信号肽。信号肽可以是靶蛋白的固有的信号肽,也可以是其他蛋白质的信号肽。作为信号肽,可举出微生物的分泌性纤维素酶的信号肽。作为信号肽,具体而言,可举出Talaromyces cellulolyticus的分泌性纤维素酶的信号肽。作为分泌性纤维素酶,可举出:cbhI基因编码的CbhI蛋白质(也称为Cbh1蛋白质)、cbhII基因编码的CbhII蛋白质(也称为Cbh2蛋白质)。即,作为信号肽,可举出:CbhI蛋白质的信号肽、CbhII蛋白质的信号肽。也将CbhI蛋白质的信号肽称为“CbhI信号肽”或“Cbh1信号肽”。也将CbhII蛋白质的信号肽称为“CbhII信号肽”或“Cbh2信号肽”。将Talaromyces cellulolyticus的CbhI信号肽的氨基酸序列示于SEQ ID NO.42中。即,信号肽,例如,可以是具有所述例举的信号肽的氨基酸序列(例如SEQ ID NO.42的氨基酸序列)的信号肽。此外,信号肽可以是所述例举的信号肽(例如具有SEQ ID NO.42的氨基酸序列的信号肽)的保守性变体。即,例如,所述例举的信号肽可以原样使用或适宜修饰后使用。“CbhI信号肽”和“CbhII信号肽”这样的术语,除了所述例举的CbhI信号肽和CbhII信号肽之外,还包含它们的保守性变体。对于信号肽的保守性变体,可以援用涉及后述的YscB蛋白质的保守性变体的记载。例如,信号肽如果保持原本的功能,则可以是具有在SEQ ID NO.42的氨基酸序列中,1或者几个位置的1个或几个氨基酸被取代、缺失、插入和/或添加的氨基酸序列的肽。需要说明的是,信号肽的变体中的所述“1个或几个”是指,具体而言,优选为1~7个,更优选为1~5个,近一些优选为1~3个,特别优选为1~2个。此外,例如,信号肽如果保持原本的功能,则可以是具有相对于SEQ ID NO.42的氨基酸序列,具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的氨基酸序列的肽。需要说明的是,对于信号肽的“原本的功能”,是可以在与靶蛋白的N末端连接时带来靶蛋白的分泌的功能。信号肽的功能,例如,可以通过对向蛋白质的N末端的连接引起的该蛋白质的分泌进行确认来确认。

作为肽标签,具体而言,可举出:His标签、FLAG标签、GST标签、Myc标签、MBP(maltose binding protein)、CBP(cellulose binding protein)、TRX(Thioredoxin)、GFP(green fluorescent protein)、HRP(horseradish peroxidase)、ALP(AlkalinePhosphatase)、抗体的Fc区域。肽标签,例如,可以在表达而得的靶蛋白的检测、纯化中利用。

作为蛋白酶的识别序列,具体而言,可举出:HRV3C蛋白酶识别序列、Factor Xa蛋白酶识别序列、proTEV蛋白酶识别序列。蛋白酶的识别序列,例如,可以在表达而得的靶蛋白的剪切中利用。具体而言,例如,在使靶蛋白作为与肽标签形成的融合蛋白而进行表达的情况下,通过将蛋白酶的识别序列导入靶蛋白与肽标签的连接部,而能够利用蛋白酶从表达而得的靶蛋白剪切肽标签,得到没有肽标签的靶蛋白。

最终得到的靶蛋白的N末端区域可以与天然的蛋白质相同,也可以与天然的蛋白质不相同。例如,与天然的蛋白质比较,最终得到的靶蛋白的N末端区域可以额外添加或缺失1个或几个氨基酸。需要说明的是,所述“1个或几个”是指,根据目的靶蛋白的全长、结构等而不同,具体而言,优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。

此外,靶蛋白可以作为添加有前体结构部的蛋白质(前体蛋白质)而进行表达。在靶蛋白作为前体蛋白质而进行表达的情况下,最终得到的靶蛋白可以是前体蛋白质,也可以不是。即,前体蛋白质可以剪切前体结构部而成为成熟蛋白质。就剪切而言,例如,可以通过蛋白酶而进行。在使用蛋白酶的情况下,从最终得到的蛋白质的活性这样的观点出发,前体蛋白质通常优选在与天然的蛋白质大致相同位置剪切,更优选在与天然的蛋白质完全相同位置剪切而得到与天然的蛋白质相同的成熟蛋白质。因此,通常,最优选在产生天然产生的成熟蛋白质相同的蛋白质的位置剪切前体蛋白质的特异性蛋白酶。然而,如上所述,最终得到的靶蛋白的N末端区域可以与天然的蛋白质不相同。例如,根据要生产的靶蛋白的种类、使用目的等,N末端比天然的蛋白质长或短1~几个氨基酸的蛋白质可能具有更适当的活性。可以在本发明中使用的蛋白酶除了Dispase(BOEHRINGER MANNHEIM公司制)这样的可商购之外,还包含微生物的培养液,例如从放线菌的培养液等得到的蛋白酶。这样的蛋白酶可以在未纯化状态下使用,也可以根据需要纯化至适当的纯度后使用。

靶蛋白基因,例如,可以通过克隆而取得。克隆,例如,可以利用包含靶蛋白基因的基因组DNA、cDNA等的核酸。此外,就靶蛋白基因而言,例如,也可以通过基于其碱基序列而进行全合成来取得(Gene,60(1),115-127(1987))。取得的靶蛋白基因可以原样利用或适宜修饰后利用。即,通过对靶蛋白基因进行修饰,而能够取得其变体。基因的修饰可以通过公知的手法而进行。例如,可以通过位点特异性突变法而在DNA的目的位点导入目的变异。作为位点特异性突变法,可举出:使用PCR的方法(Higuchi,R.,61,in PCR technology,Erlich,H.A.Eds.,Stockton press(1989);Carter,P.,Meth.in Enzymol.,154,382(1987))、使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.in Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。或者,可以全合成靶蛋白基因的变体。此外,可以对取得的靶蛋白基因适宜进行启动子序列的导入等的修饰,取得靶蛋白的表达用的基因构建体。需要说明的是,靶蛋白的表达用的基因构建体的其他构成要素(例如,启动子序列)、靶蛋白的表达用的基因构建体也可以通过与靶蛋白基因同样的方式取得。

基因的修饰可以通过公知的手法而进行。例如,可以通过位点特异性突变法而在DNA的目的位点导入目的变异。作为位点特异性突变法,可举出:使用PCR的方法(Higuchi,R.,61,in PCR technology,Erlich,H.A.Eds.,Stockton press(1989);Carter,P.,Meth.in Enzymol.,154,382(1987))、使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.in Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。

将靶蛋白的表达用的基因构建体导入Talaromyces cellulolyticus的手法没有特别限制。“靶蛋白的表达用的基因构建体的导入”是指只要将靶蛋白的表达用的基因构建体保持在宿主中即可,具体而言,是将靶蛋白基因以使其可以表达的方式导入宿主。“靶蛋白的表达用的基因构建体的导入”,只要没有特别说明,则不限于将预先构建的靶蛋白的表达用的基因构建体一并导入宿主的情况,还包含将靶蛋白的表达用的基因构建体的一部分导入宿主,并且在宿主内构建靶蛋白的表达用的基因构建体的情况。例如,可以通过将靶蛋白基因导入宿主本来就具有的启动子的下游,而在染色体上构建靶蛋白的表达用的基因构建体。

就靶蛋白的表达用的基因构建体而言,例如,可以使用包含靶蛋白的表达用的基因构建体的载体而导入宿主。也将包含靶蛋白的表达用的基因构建体的载体称为“靶蛋白的表达载体”。就靶蛋白的表达载体而言,例如,可以通过将靶蛋白的表达用的基因构建体与载体进行连接而进行构建。此外,例如,在载体具备启动子的情况下,靶蛋白的表达载体可以通过将靶蛋白基因连接至该启动子的下游而进行构建。用靶蛋白的表达载体而转化宿主,从而得到导入了同载体的转化体,即,可以将靶蛋白的表达用的基因构建体导入宿主。就载体而言,只要可以在宿主的细胞内中自主复制就没有特别限制。载体可以是1拷贝载体,可以是低拷贝载体,也可以是多拷贝载体。载体可以具备用于选择转化体的标记基因。载体也可以具备用于表达靶蛋白基因的启动子、终止子。

此外,靶蛋白的表达用的基因构建体可以导入宿主的染色体中。向染色体的基因的导入,可以利用同源重组而进行。具体而言,用包含靶蛋白的表达用的基因构建体的重组DNA而转化宿主,与宿主的染色体上的目的位点发生同源重组,从而能够将靶蛋白的表达用的基因构建体导入宿主的染色体上。在同源重组中使用的重组DNA的结构只要以期望的方式发生同源重组则没有特别限制。例如,可以是包含靶蛋白的表达用的基因构建体的线状DNA,用在靶蛋白的表达用的基因构建体的两端分别具备染色体上的取代对象位点的上游和下游的序列的线状DNA转化宿主,在取代对象位点的上游和下游分别发生同源重组,从而能够将取代对象位点用靶蛋白的表达用的基因构建体取代。同源重组中使用的重组DNA可以具备用于选择转化体的标记基因。需要说明的是,靶蛋白基因、启动子等,向靶蛋白的表达用的基因构建体的一部分的染色体的导入也可以以与向靶蛋白的表达用的基因构建体整体的染色体的导入同样的方式进行。

标记基因可以根据宿主的营养缺陷型等的性状而适宜选择。例如,在宿主通过pyrF基因或pyrG基因的变异而表现出尿嘧啶(Uracil)缺陷型的情况下,将pyrF基因或pyrG基因作为标记基因而使用,从而能够将尿嘧啶(Uracil)缺陷型的互补(即非尿嘧啶(Uracil)缺陷型)作为指标,选拔导入了目的修饰的菌株。此外,作为标记基因,可以使用潮霉素抗性基因等的药剂抗性基因。

就转化而言,例如,可以通过通常在霉菌、酵母等的真核微生物的转化中使用的手法而进行。作为这样的手法,可举出原生质体法。

<1-3>YscB蛋白质的活性降低

本发明的微生物经过了修饰,以使YscB蛋白质的活性降低。具体而言,本发明的微生物经过了修饰,以使得与非修饰菌株相比YscB蛋白质的活性降低。更具体而言,例如,本发明的微生物经过了修饰,可以以使yscB基因的表达降低,也可以以使yscB基因被破坏。通过以使YscB蛋白质的活性降低的方式对Talaromyces cellulolyticus进行修饰,而能够提高该微生物的靶蛋白生产能力,即,能够使基于该微生物的靶蛋白的生产增大。

以下,对YscB蛋白质及编码其的yscB基因进行说明。

YscB蛋白质为蛋白酶。“蛋白酶”是指,具有对使蛋白质水解的反应进行催化的活性的蛋白质。此外,也将该活性称为“蛋白酶活性”。

分别将Talaromyces cellulolyticus S6-25菌株的yscB基因(包含内含子)的碱基序列和该基因编码的YscB蛋白质的氨基酸序列示于分别SEQ ID NO.32和43中。即,yscB基因,例如,可以是具有SEQ ID NO.32所示的碱基序列的基因。此外,YscB蛋白质,例如,可以是具有SEQ ID NO.43所示的氨基酸序列的蛋白质。需要说明的是,“具有(氨基酸或碱基)序列”这样的表达包含该“包含(氨基酸或碱基)序列”情况和该“由(氨基酸或碱基)序列组成”情况。

yscB基因只要保持原本的功能,则可以是所述例举的yscB基因(例如,具有SEQ IDNO.32所示的碱基序列的基因)的变体。同样,YscB蛋白质只要保持原本的功能,则可以是所述例举的YscB蛋白质(例如,具有SEQ ID NO.43所示的氨基酸序列的蛋白质)的变体。有时也将这样的保持原本的功能的变体称为“保守性变体”。在本发明中,“yscB基因”这样的术语不限于所述例举的yscB基因,还包含其保守性变体。同样,“YscB蛋白质”这样的术语不限于所述例举的YscB蛋白质,还包含其保守性变体。作为保守性变体,例如可举出:所述例举的yscB基因、YscB蛋白质的同系物、人为性的修饰体。

“保持原本的功能”是指,基因或蛋白质的变体具有与原本的基因或蛋白质的功能(活性、性质)对应的功能(活性、性质)。即,“保持原本的功能”是指,在yscB基因的情况下,基因的变体编码保持原本的功能的蛋白质。此外,“保持原本的功能”是指,在YscB蛋白质的情况下,蛋白质的变体具有蛋白酶活性。

蛋白酶活性可以通过将酶与基质(蛋白质)进行培养(Incubate),测定酶依赖性的基质的分解而进行测定。此外,蛋白酶活性可以使用市售的蛋白酶活性测定试剂盒而进行测定。

以下,将举例表示保守性变体。

就yscB基因的同系物或YscB蛋白质的同系物而言,例如,可以通过使用所述例举的yscB基因的碱基序列或所述例举的YscB蛋白质的氨基酸序列作为查询序列的BLAST检索、FASTA检索而从公开数据库容易地取得。此外,就yscB基因的同系物而言,例如,可以以Talaromyces cellulolyticus的染色体为模板,通过使用基于这些公知的yscB基因的碱基序列而制备的寡核苷酸作为引物的PCR而取得。

yscB基因只要保持原本的功能,则可以是编码具有在所述例举的YscB蛋白质的氨基酸序列(例如,SEQ ID NO.43所示的氨基酸序列)中,1或者几个的位置上的1个或几个氨基酸被取代、缺失、插入和/或添加的氨基酸序列的蛋白质的基因。需要说明的是,所述“1个或几个”,根据氨基酸残基的蛋白质的立体结构中的位置、氨基酸残基的种类而不同,具体而言,例如为1~50个、1~40个、1~30个,优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。

所述的1或者几个的氨基酸的取代、缺失、插入和/或添加是正常保持蛋白质的功能的保守性变异。代表性的保守性变异是保守性取代。保守性取代是指,在取代位点为芳香族氨基酸的情况下,是在Phe、Trp、Tyr间相互取代的变异,在取代位点为疏水性氨基酸的情况下,是在Leu、Ile、Val间相互取代的变异,在为极性氨基酸的情况下,是在Gln、Asn间相互取代的变异,在为碱基性氨基酸的情况下,是在Lys、Arg、His间相互取代的变异,在为酸性氨基酸的情况下,是在Asp、Glu间相互取代的变异,在为具有羟基的氨基酸的情况下,是在Ser、Thr间相互取代的变异。作为被认为是保守性取代的取代,具体而言,可举出:从Ala向Ser或Thr的取代,从Arg向Gln、His或Lys的取代、从Asn向Glu、Gln、Lys、His或Asp的取代、从Asp向Asn、Glu或Gln的取代、从Cys向Ser或Ala的取代、从Gln向Asn、Glu、Lys、His、Asp或Arg的取代、从Glu向Gly、Asn、Gln、Lys或Asp的取代、从Gly向Pro的取代、从His向Asn、Lys、Gln、Arg或Tyr的取代、从Ile向Leu、Met、Val或Phe的取代、从Leu向Ile、Met、Val或Phe的取代、从Lys向Asn、Glu、Gln、His或Arg的取代、从Met向Ile、Leu、Val或Phe的取代、从Phe向Trp、Tyr、Met、Ile或Leu的取代、从Ser向Thr或Ala的取代、从Thr向Ser或Ala的取代、从Trp向Phe或Tyr的取代、从Tyr向His、Phe或Trp的取代和从Val向Met、Ile或Leu的取代。此外,所述的这样的氨基酸的取代、缺失、插入或添加,包含因基于源自基因的生物的个体差、物种的差异的情况等的天然产生的变异(mutant或variant)而产生的情况。

此外,yscB基因只要保持原本的功能,则可以是编码具有下述氨基酸序列的蛋白质的基因,所述氨基酸序列对整个所述例举的YscB蛋白质的氨基酸序列(例如,SEQ IDNO.43所示的氨基酸序列)具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的。需要说明的是,在本说明书中,“同源性”(homology)意味着“同一性”(identity)。

此外,yscB基因只要保持原本的功能,则可以是在严格条件下与所述例举的yscB基因的碱基序列(例如,SEQ ID NO.32所示的碱基序列)的互补序列或可以从同互补序列制备的探针进行杂交的DNA。“严格条件”是指,形成所谓的特异性的杂交,不形成非特异性的杂交的条件。如果显示一个实例,可举出:同源性较高的DNA彼此杂交,例如,具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的DNA彼此杂交,并且同源性较低的DNA彼此不杂交的条件,或者与作为通常的Southern杂交的洗涤的条件的60℃,1×SSC,0.1%SDS,优选为60℃,0.1×SSC,0.1%SDS,更优选为68℃,0.1×SSC,0.1%SDS相当的盐浓度和温度下,进行1次,优选为2~3次清洗的条件。

所述探针,例如,可以是基因的互补序列的一部分。这样的探针可以通过将基于公知的基因的碱基序列而制备的寡核苷酸作为引物,将包含这些碱基序列的DNA片段设为模板的PCR而进行制备。作为探针,例如,可以使用300bp左右的长度的DNA片段。在这样的情况下,作为杂交的洗涤的条件,可举出:50℃,2×SSC,0.1%SDS。

此外,yscB基因可以是将任意的密码子用与其等价的密码子取代而得到基因。即,yscB基因可以是基于密码子的简并的所述例举的yscB基因的变体。

2个序列间的序列同源性的百分比,例如,可以使用数学性算法来确定。作为这样的数学性算法的非限定的实例,可举出:Myers and Miller(1988)CABIOS 4:11-17的算法,Smith et al(1981)Adv.Appl.Math.2:482的局部相同算法、Needleman and Wunsch(1970)J.Mol.Biol.48:443-453的相同比对算法、检索Pearson and Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的类似性的方法、Karlin and Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877中记载的那样的改良的Karlin and Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264的算法。

可以利用基于这些数学性算法的程序,进行用于确定序列同源性的序列比较(校准)。程序可以适宜通过计算机实行。作为这样的程序,没有特别限定,可举出:PC/Gene程序的CLUSTAL(可从Intelligenetics,Mountain View,Cali f.入手)、ALIGN程序(Version2.0)以及Wisconsin Genetics Software Package,Version 8(可从Genetics ComputerGroup(GCG),575Science Drive,Madis on,Wis.,USA入手)的GAP、BESTFIT、BLAST、FASTA和TFASTA。使用了这些程序的校准,例如,可以使用初期参数而进行。对于CLUSTAL程序,良好地记载在Higgins et al.(1988)Gene 73:237-244、Higgins et al.(1989)CABIOS 5:151-153、Corpet et al.(1988)Nucleic Acids Res.16:10881-90、Huang et al.(1992)CABIOS8:155-65和Pearson et al.(1994)Meth.Mol.Biol.24:307-331中。

为了得到与编码对象的蛋白质的核苷酸序列具有同源性的核苷酸序列,具体而言,例如,可以通过BLASTN程序,在分数=100,字长=12下进行BLAST核苷酸检索。为了得到与对象的蛋白质具有同源性的氨基酸序列,具体而言,例如,可以通过BLASTX程序,在分数=50,字长=3下进行BLAST蛋白质检索。对于BLAST核苷酸检索、BLAST蛋白质检索,参照http://www.ncbi.nlm.nih.gov。此外,为了得到为了比较而添加了间隙的校准,可以利用Gapped BLAST(BLAST 2.0)。此外,可以利用PSI-BLAST(BLAST 2.0)检测序列间的离间关系并进行反复检索。对于Gapped BLAST和PSI-BLAST,参照Altschul et al.(1997)NucleicAcids Res.25:3389。在利用BLAST、Gapp ed BLAST或PSI-BLAST的情况下,例如,可以使用各程序(例如,针对核苷酸序列的BLASTN,针对氨基酸序列的BLASTX)的初期参数。校准可以手动执行。

2个序列间的序列同源性作为当将2个序列以变成最大一致的方式进行排列时2个序列间一致的残基的比例而算出。需要说明的是,氨基酸序列间的“同源性”,具体而言,只要没有特别说明,则是指使用通过blastp而默认设定的Scoring Parameters(Matrix:BLOSUM62;Gap Costs:Existence=11,Extension=1;Compositional Adjustments:Conditional compositional score matrix adjustment)算出的氨基酸序列间的同源性。此外,碱基序列间的“同源性”,具体而言,只要没有特别说明,则是指使用通过blastn而默认设定的Scoring Parameters(Match/Mismatch Scores=1,-2;Gap Costs=Linear)而算出的碱基序列间的同源性。

需要说明的是,与所述的基因、蛋白质的变体有关的记载也可以援用在靶蛋白等的任意的蛋白质和编码它们的基因中。

<1-4>其它性质

本发明的微生物只要不损害靶蛋白生产能力,就可以具有其它期望的性质(例如修饰)。作为修饰,可举出提高Talaromyces cellulolyticus的靶蛋白生产能力的修饰。作为修饰,具体而言,可举出降低CreA蛋白质的活性的修饰。这些性质、修饰可以单独或适宜组合利用。

即,例如,可以对本发明的微生物进行修饰,使得CreA蛋白的活性降低。具体而言,可以对本发明的微生物进行修饰,使其与非修饰菌株比较CreA蛋白的活性降低。更具体而言,例如,可以对本发明的微生物进行修饰,使得creA基因的表达降低,或使得creA基因被破坏。creA基因是编码参与分解代谢物阻遏的转录因子的基因。已知creA基因在丝状菌中参与纤维素酶的表达(Mol Gen Genet.1996Jun 24;251(4):451-60,Biosci BiotechnolBiochem.1998Dec;62(12):2364-70)。

将Talaromyces cellulolyticus S6-25菌株的creA基因的碱基序列示于SEQ IDNO.44中。即,例如,creA基因可以是具有SEQ ID NO.44所示的碱基序列的基因。此外,例如,CreA蛋白可以是具有通过SEQ ID NO.44所示的碱基序列而编码的氨基酸序列的蛋白质。creA基因和CreA蛋白可以分别是所述例举的creA基因和CreA蛋白的保守性变体。对于creA基因和CreA蛋白的保守性变体可以援用对yscB基因和YscB蛋白质的保守性变体的记载。需要说明的是,“保持原本的功能”是指,在CreA蛋白的情况下,蛋白质的变体具有作为参与分解代谢物阻遏的转录因子的功能。

<1-5>使蛋白质的活性降低的手法

以下,对使YscB蛋白质、CreA蛋白质等的蛋白质的活性降低的手法进行说明。

“蛋白质的活性降低”是指,与非修饰菌株相比该蛋白质的活性降低。具体而言,“蛋白质的活性降低”是指,与非修饰菌株相比该蛋白质在每个细胞中的活性降低。此处所说的“非修饰菌株”是指,未以使得靶蛋白的活性降低的方式而修饰的对照菌株。作为非修饰菌株,可举出野生菌株、亲本菌株。作为非修饰菌株,具体而言,可举出Talaromycescellulolyticus的说明中例举的菌株。即,在一个方式中,与TalaromycescellulolyticusS6-25菌株相比蛋白质的活性可以降低。需要说明的是,“蛋白质的活性降低”也包含该蛋白质的活性完全消失的情况。更具体而言,“蛋白质的活性降低”可以是指,与非修饰菌株相比,该蛋白质在每个细胞中的分子数降低,和/或,该蛋白质的每个分子的功能降低。即,“蛋白质的活性降低”这样的情况的“活性”,不限于蛋白质的催化剂活性,可以是指编码蛋白质的基因的转录量(mRNA量)或翻译量(蛋白质的量)。需要说明的是,“蛋白质在每个细胞中的分子数降低”也包含该蛋白质完全不存在的情况。此外,“蛋白质的每个分子的功能降低”也包含该蛋白质的每个分子的功能完全消失的情况。蛋白质的活性的降低的程度,如果与非修饰菌株相比蛋白质的活性降低,则没有特别限制。蛋白质的活性,例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。

这样的使蛋白质的活性降低的修饰,例如,可以通过使编码该蛋白质的基因的表达降低而达成。“基因的表达降低”是指,与非修饰菌株相比该基因的表达降低。“基因的表达降低”是指,具体而言,与非修饰菌株相比该基因在每个细胞中的表达量降低。“基因的表达降低”可以是指,更具体而言,基因的转录量(mRNA量)降低,和/或,基因的翻译量(蛋白质的量)降低。“基因的表达降低”包含该基因完全不表达的情况。需要说明的是,也将“基因的表达降低”称为“基因的表达弱化”。基因的表达,例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。

基因的表达的降低,例如,可以基于转录效率的降低,可以基于翻译效率的降低,也可以基于它们的组合。基因的表达的降低,例如,可以通过对基因的表达调控序列进行修饰而达成。“表达调控序列”是影响启动子等的基因的表达的位点的总称。表达调控序列,例如,可以使用启动子检索载体、GENETYX等的基因分析软件而进行确定。在对表达调控序列进行修饰的情况下,表达调控序列优选1碱基以上,更优选2碱基以上,特别优选3碱基以上被修饰。基因的转录效率的降低,例如,可以通过用更弱的启动子取代染色体上的基因的启动子而达成。“更弱的启动子”是指,基因的转录比原本存在的野生型的启动子弱的启动子。作为更弱的启动子,例如可举出诱导型的启动子。即,诱导型的启动子可以在非诱导条件下(例如,不存在诱导物质下)作为更弱的启动子而发挥功能。此外,可以使表达调控序列的一部分或全部的区域缺失(缺陷)。此外,基因的表达的降低,例如,可以通过操纵与表达控制有关的因子而达成。作为与表达控制有关的因子,可举出:与转录、翻译控制有关的低分子(诱导物质、阻碍物质等)、蛋白质(转录因子等)、核酸(siRNA等)等。此外,基因的表达的降低,例如,也可以通过在基因的编码区域中导入使基因的表达降低这样的变异而达成。例如,将基因的编码区域的密码子替换为在宿主中以更低频率利用的同义密码子,因此能够使基因的表达降低。此外,例如,通过后述这样的基因的破坏而可以使基因的表达本身降低。

此外,这样的使蛋白质的活性降低的修饰,例如,可以通过对编码该蛋白质的基因进行破坏而达成。“使基因破坏”是指,对该基因进行修饰,使得不产生正常发挥功能的蛋白质。“不产生正常发挥功能的蛋白质”包含从该基因完全不产生蛋白质的情况、从该基因产生每个分子的功能(活性、性质)降低或消失的蛋白质的情况。

基因的破坏,例如,可以通过使染色体上的基因缺失(缺陷)而达成。“基因的缺失”是指,基因的编码区域的一部分或全部的区域的缺失。进一步,也可以使包含染色体上的基因的编码区域的前后的序列的整个基因缺失。基因的编码区域的前后的序列,例如,可以包含基因的表达调控序列。只要能够达成蛋白质的活性的降低,则缺失的区域可以是N末端区域(编码蛋白质的N末端侧的区域)、内部区域、C末端区域(编码蛋白质的C末端侧的区域)等的任一区域。通常,缺失的区域长的情况能够确实地使基因不活化。缺失的区域,例如,可以是基因的编码区域全长的10%以上、20%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上或95%以上的长度的区域。此外,优选缺失的区域的前后的序列的阅读框不一致。可以通过阅读框的不一致而在缺失的区域的下游发生移码。在creA基因的情况下,具体而言,例如,通过使与SEQ ID NO.44的3262~4509位相当的部分缺失,而能够破坏该基因。

此外,基因的破坏,例如,可以通过在染色体上的基因的编码区域中导入氨基酸取代(错义突变)、导入终止密码子(无义突变)或导入1~2碱基的添加或缺失(移码变异)等而达成(Journal of Biological Chemistry 272:8611-8617(1997),Proceedings of theNational Academy of Sciences,USA 95 5511-5515(1998),Journal of BiologicalChemistry 26 116,20833-20839(1991))。

此外,基因的破坏,例如,可以通过在染色体上的基因的编码区域中插入其他碱基序列而达成。插入位点可以是基因的任一区域,插入的碱基序列长的情况能够确实得使基因不活化。此外,优选插入位点的前后的序列的阅读框不一致。通过阅读框的不一致而可以在插入位点的下游发生移码。作为其他碱基序列,如果使编码的蛋白质的活性降低或消失则没有特别限制,例如,可举出在标记基因、靶蛋白生产中有用的基因。

特别是,可以实施基因的破坏,使得编码的蛋白质的氨基酸序列缺失(缺陷)。换而言之,这样的使蛋白质的活性降低的修饰,例如,可以通过使蛋白质的氨基酸序列缺失而达成,具体而言,可以通过以使其编码氨基酸序列缺失的蛋白质的方式对基因进行修饰而达成。需要说明的是,“蛋白质的氨基酸序列的缺失”是指,蛋白质的氨基酸序列的一部分或全部的区域的缺失。此外,“蛋白质的氨基酸序列的缺失”是指在蛋白质中原本的氨基酸序列变为不存在,也包含原本的氨基酸序列变为别的氨基酸序列的情况。即,例如,通过移码而变为别的氨基酸序列的区域可以被认为是缺失的区域。通过蛋白质的氨基酸序列的缺失,典型性地使蛋白质的全长短缩,但也可能存在蛋白质的全长不变化,或延长的情况。例如,通过使基因的编码区域的一部分或全部的区域的缺失,而能够在编码的蛋白质的氨基酸序列中,使该缺失的区域所编码的区域缺失。此外,例如,通过向基因的编码区域的终止密码子的导入,而能够在编码的蛋白质的氨基酸序列中,使在该导入位点的下游的区域所编码的区域缺失。此外,例如,通过基因的编码区域中的移码,而能够使该移码位点所编码的区域缺失。对于氨基酸序列的缺失中的缺失的区域的位置和长度,可以援用基因的缺失中的缺失的区域的位置和长度的说明。

在对染色体上的基因进行如上所述的修饰的情况下,例如可以通过下述方式达成:制备经过修饰的破坏型基因,使其不产生正常发挥功能的蛋白质,用包含该破坏型基因的重组DNA转化宿主,通过破坏型基因和染色体上的野生型基因而发生同源重组,从而用破坏型基因取代染色体上的野生型基因。此时,重组DNA如果根据宿主的营养缺陷型等的性状而包含标记基因,则容易操纵。作为破坏型基因,可举出:缺失了基因的编码区域的一部分或全部的区域的基因、导入了错义突变的基因、导入了无义突变的基因、导入了移码变异的基因、导入了转座子、标记基因等的插入序列的基因。由破坏型基因而编码的蛋白质,即使生成,也具有与野生型蛋白质不同的立体结构,功能降低或消失。

同源重组中使用的重组DNA的结构,只要以期望的方式发生同源重组,则没有特别限制。例如为包含任意的序列的线状DNA,用在该任意的序列的两端分别具备染色体上的取代对象位点的上游和下游的序列的线状DNA转化宿主,分别使取代对象位点的上游和下游发生同源重组,从而能够在1步骤中用该任意的序列取代要取代对象位点。作为该任意的序列,例如可以使用包含标记基因的序列。

标记基因可以根据宿主的营养缺陷型等的性状而适宜选择。例如,在宿主通过pyrF基因或pyrG基因的变异而表现出尿嘧啶(Uracil)缺陷型的情况下,通过将pyrF基因或pyrG基因作为标记基因使用,而能够将尿嘧啶(Uracil)缺陷型的互补(即非尿嘧啶(Uracil)缺陷型)作为指标,选拔导入有目的修饰的菌株。此外,例如,在通过sC基因(sulfate permiase基因)的变异而表现出蛋氨酸缺陷型的情况下,通过将sC基因作为标记基因使用,而能够将蛋氨酸缺陷型的互补(即蛋氨酸非缺陷型)作为指标,选拔导入有目的修饰的菌株。此外,作为标记基因,可以使用潮霉素抗性基因等的药剂抗性基因。

此外,这样的使蛋白质的活性降低的修饰,例如,可以通过突变处理而进行。作为突变处理,可举出:X射线的照射、紫外线的照射、以及基于N-甲基-N'-硝基-N-亚硝基胍(MNNG)、甲磺酸乙酯(EMS)和甲基磺酸甲酯(MMS)等的变异剂的处理。

可以通过对该蛋白质的活性进行测定来确认蛋白质的活性降低。YscB蛋白质的活性例如可以通过如上所述的方式进行测定。例如,CreA蛋白的活性可以通过对分解代谢物阻遏的程度进行测定而测定。例如,分解代谢物阻遏的程度可以通过对包含葡萄糖作为碳源的培养条件下的纤维素酶生产进行测定而测定。即,具体而言,例如,可以通过将包含葡萄糖作为碳源的培养条件下的纤维素酶生产的提高作为指标来确认CreA蛋白的活性降低。

也可以通过对编码该蛋白质的基因的表达降低进行确认来确认蛋白质的活性降低。基因的表达降低也可以通过下述方式确定:通过对该基因的转录量降低进行确认或通过对从该基因表达的蛋白质的量降低进行确认。

基因的转录量降低的确认可以通过将从该基因转录的mRNA的量与非修饰菌株进行比较而进行。作为评价mRNA的量的方法,可举出:Northern杂交、RT-PCR等(Molecularcloning(Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001))。mRNA的量(例如,每细胞中的分子数),例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。。

蛋白质的量降低的确认可以使用抗体通过蛋白质印迹法而进行(Molecularcloning(Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001))。蛋白质的量(例如,每细胞中的分子数),例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。

基因破坏可以通过下述方式确认:根据破坏中使用的手段,对该基因的一部分或全部的碱基序列、制限酶图谱或全长等进行确定。

就转化而言,例如,可以通过霉菌、酵母等的真核微生物的转化中通常使用的手法而进行。作为这样的手法,可举出原生质体法。

<2>本发明的方法

可以利用本发明的微生物,制造靶蛋白。具体而言,可以通过培养本发明的微生物,而制造靶蛋白。即,具体而言,本发明的方法可以是包含用培养基对本发明的微生物进行培养的、靶蛋白的制造方法。

使用的培养基,只要使得本发明的微生物能够增殖,生产靶蛋白,则没有特别限制。作为培养基,例如,可以使用根据需要而含有选自碳源、氮源、磷酸源、硫源、其它各种有机成分、无机成分的成分的培养基。本领域技术人员可以适宜设定培养基成分的种类、浓度。对于具体的培养基组成,例如,可以参照与Talaromyces cellulolyticus有关的报告(日本特开2003-135052、日本特开2008-271826、日本特开2008-271927等)中所述的培养基组成、里氏木霉等的其它各种纤维素酶生产微生物用的培养基组成。

就碳源而言,只要能够使本发明的微生物同化并生成靶蛋白,则没有特别限制。作为碳源,例如可举出:糖类、纤维素类基质。作为糖类,具体而言,例如可举出:葡萄糖、果糖、半乳糖、木糖、阿拉伯糖、蔗糖、乳糖、纤维二糖、糖蜜、淀粉水解物、生物质水解物。作为纤维素类基质,具体而言,例如可举出:微晶纤维素(Avicel)、滤纸、废纸、纸浆、木材、稻草(Ricestraw)、麦秆(Straw)、稻壳、米糠、麦麸、甘蔗渣、咖啡渣、茶渣。纤维素类基质可以在进行水热分解处理、酸处理、碱处理、蒸煮、破碎、粉碎等的预处理之后用作碳源。作为市售的适宜的纤维素类基质,可举出SOLKA FLOC(International Fiber Corp,North Tonawanda,NY,U.S.A)。作为碳源,可以使用1种碳源,也可以组合使用2种或2种以上的碳源。

作为氮源,具体而言,例如可举出:硫酸铵、氯化铵、磷酸铵等的铵盐、蛋白胨、酵母提取物、肉提取物、玉米浆、大豆蛋白分解物等的有机氮源、氨、尿素。作为氮源,可以使用1种氮源,也可以组合使用2种或2种以上的氮源。

作为磷酸源,具体而言,例如可举出:磷酸二氢钾、磷酸氢二钾等的磷酸盐、焦磷酸等的磷酸聚合物。作为磷酸源,可以使用1种磷酸源,也可以组合使用2种或2种以上的磷酸源。

作为硫源,具体而言,例如可举出:硫酸盐、硫代硫酸盐、亚硫酸盐等的无机硫化合物、半胱氨酸、胱氨酸、谷胱甘肽等的含硫氨基酸。作为硫源,可以使用1种硫源,也可以组合使用2种或2种以上的硫源。

作为其它各种有机成分、无机成分,具体而言,例如可举出:氯化钠、氯化钾等的无机盐类;铁、锰、镁、钙等的微量金属类;维生素B1、维生素B2、维生素B6、烟酸、烟酸酰胺、维生素B12等的维生素类;氨基酸类;核酸类;包含这些的蛋白胨、酪蛋白氨基酸、酵母提取物、大豆蛋白分解物等的有机成分。作为其它各种有机成分、无机成分,可以使用1种成分,也可以组合使用2种或2种以上的成分。

就培养条件而言,只要本发明的微生物能够增殖,生产靶蛋白,则没有特别限制。就培养而言,例如,可以在丝状菌等的微生物的培养中使用的通常的条件而进行。对于具体的培养条件,例如,可以参照与Talaromyces cell ulolyticus有关的报告(日本特开2003-135052、日本特开2008-271826、日本特开2008-271927等)所述的培养条件、里氏木霉等的其它各种纤维素酶生产微生物用的培养条件。

就培养而言,例如,可以使用液体培养基,在好氧条件下进行。在好氧条件下的培养,具体而言,可以通过通气培养、振荡培养、搅拌培养或它们的组合而进行。就培养温度而言,例如,可以为15~43℃,特别可以为约30℃。就培养期间而言,例如,可以为2小时~20日。培养可以通过分批培养(b atch culture)、流加培养(Fed-batch culture)、连续培养(continuous culture)或它们的组合而实施。需要说明的是,也将培养开始时的培养基称为“初始培养基”。此外,也将流加培养或连续培养中供给至培养体系(发酵槽)中的培养基称为“流加培养基”。此外,也将在流加培养或连续培养中向培养体系中供给流加培养基称为“流加”。此外,培养可以分为预培养和主培养而实施。例如,可以在琼脂培养基等的固体培养基中进行预培养,可以在液体培养基中进行主培养。可以继续培养,例如,直至培养基中的碳源被消耗或直至本发明的微生物的活性丧失为止。

在本发明中,各培养基成分可以含有在初始培养基、流加培养基或这两者中。初始培养基中含有的成分的种类可以与流加培养基中含有的成分的种类相同,也可以不同。此外,初始培养基中含有的各成分的浓度可以与流加培养基中含有的各成分的浓度相同,也可以不同。此外,可以使用含有的成分的种类和/或浓度的不同的2种或2种以上的流加培养基。例如,在间歇性地进行多次流加的情况下,各回的流加培养基中含有的成分的种类和/或浓度可以相同,也可以不同。

各种成分的浓度可以通过气相色谱法(Hashimoto,K.et al.1996.Biosci.Biotechnol.Biochem.70:22-30)、HPLC(Lin,J.T.et al.1998.J.Chromatog r.A.808:43-49)而进行测定

通过如上所述对本发明的微生物进行培养,而表达靶蛋白,得到包含靶蛋白的培养物。具体而言,靶蛋白可以向培养基中、菌体表层、菌体内或它们的组合积蓄。靶蛋白特别是可以积蓄在培养基中。

靶蛋白的生产可以通过蛋白质的检测或鉴定中使用的公知的方法而进行确认。作为这样的方法,例如可举出:SDS-PAGE、蛋白质印迹法(Western blotting)、质谱法、N末氨基酸序列分析、酶活性测定。这些方法可以单独使用1种,也可以组合使用2种或2种以上。

生成的靶蛋白可以适宜回收。即,本发明的靶蛋白的制造方法可以包含回收生成的靶蛋白。具体而言,就靶蛋白而言,可以作为包含靶蛋白的适当的部分而进行回收。作为这样的部分,例如可举出:培养物、培养上清液、菌体、菌体处理物(破碎物、溶解物、萃取物(无细胞萃取液))。就菌体而言,例如,可以以用丙烯酸酰胺、卡拉胶等的载体进行了固定化的固定化菌体的方式提供。

此外,可以将靶蛋白分离纯化至期望的程度。靶蛋白可以以游离的状态下而提供,也可以以进行了在树脂等的固相中的固定化的固定化酶的状态下而提供。

在将靶蛋白积蓄在培养基中的情况下,就靶蛋白而言,例如,可以在通过离心分离等从培养物中除去菌体等的固体成分后,从上清液中分离纯化。

在靶蛋白在菌体内的情况下,就靶蛋白而言,例如,可以在对菌体进行破碎、溶解或萃取等的处理后,从处理物中分离纯化。菌体可以通过离心分离等而从培养物中回收。细胞的破碎、溶解或萃取等的处理可以通过公知的方法而进行。作为这样的方法,例如可举出:超声波破碎法、Dyno-mill法、珠粒破碎、法式压制破碎(French press crushing)、溶菌酶处理。这些方法可以单独使用1种,也可以组合使用2种或2种以上。

在靶蛋白积蓄在菌体表层的情况下,就靶蛋白而言,例如,可以在进行可溶化后,从可溶化物中分离纯化。可溶化可以通过公知的方法而进行。作为这样的方法,例如可举出:盐浓度的上升、表面活性剂的使用。这些方法可以单独使用1种,也可以组合使用2种或2种以上。

靶蛋白的纯化(例如,从如上所述的上清液、处理物或可溶化物中的纯化)可以通过蛋白质的纯化中使用的公知的方法而进行。作为这样的方法,例如可举出:硫酸铵分级分离、离子交换色谱法、疏水色谱法、亲和色谱法、凝胶过滤色谱法、等电点沉淀。这些方法可以单独使用1种,也可以组合使用2种或2种以上。

需要说明的是,培养物中,与靶蛋白同时,还可以生成积蓄其他酶,例如,纤维素酶、木聚糖酶、木糖苷酶(β-木糖苷酶)、阿拉伯呋喃糖苷酶(Arabi nofuranosidase)等的半纤维素酶。靶蛋白可以作为与这些其他酶形成的混合物而回收,也可以与这些其他酶分离而回收。

回收的靶蛋白可以适宜制剂化。剂形没有特别限制,可以根据靶蛋白的使用用途等的各种条件而适宜设定。作为剂形,例如可举出:液剂、悬浮剂、散剂、片剂、丸剂、胶囊剂。在制剂化中,例如可以使用:赋形剂、粘合剂、崩解剂、润滑剂、稳定剂、矫味剂、矫臭剂、香料、稀释剂、表面活性剂等的药理学上容许的添加剂。

实施例

以下,通过非限定性的实施例而进一步对本发明具体性地进行说明。

(1)Talaromyces cellulolyticus的yscB基因缺陷菌株F09ΔyscB的构建

将Talaromyces cellulolyticus F09菌株(日本特开2016-131533)作为亲本菌株,通过以下步骤而破坏yscB基因(SEQ ID NO.32),构建T.cellulolyticu s F09ΔyscB菌株。F09菌株是将T.cellulolyticus S6-25菌株(NITE BP-01685)作为亲本菌株而得到的在pyrF基因中具有变异(单碱基取代)的菌株。F09菌株通过pyrF基因的变异而表现出尿嘧啶(Uracil)缺陷型。

首先,根据以下步骤而制成具有按照T.cellulolyticus的yscB基因上游区域、潮霉素抗性基因、T.cellulolyticus的yscB基因下游区域的顺序连接的碱基序列的yscB基因破坏用DNA片段。

将T.cellulolyticus Y-94菌株(FERM BP-5826)的基因组DNA作为模板,通过使用了引物(SEQ ID NO.1和2)的PCR而使yscB基因的上游区域扩增,通过使用了引物(SEQ IDNO.3和4)的PCR而使yscB基因的下游区域扩增。此外,将搭载有潮霉素抗性基因的pcDNA3.1/Hygro(+)(Life Technologies)作为模板,通过使用了引物(SEQ ID NO.5和6)的PCR而使潮霉素抗性基因(包含启动子和终止子)扩增。使用Wizard SV Gel and PCRClean-Up System(Pr omega)使PCR产物纯化。通过In-Fusion HD Cloning Kit(TAKARABIO)而将纯化的PCR产物导入并与试剂盒随附的pUC质粒连接。用反应物转化大肠杆菌(E.coli)JM109,在LB琼脂培养基(包含100mg/L氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用Wizard Plus Miniprep System(Promega),由得到的转化体得到导入了yscB基因破坏用DNA片段的pUC-yscB::hyg质粒。将pUC-yscB::hyg质粒作为模板,通过使用了引物(SEQ ID NO.1和4)的PCR而使yscB基因破坏用DNA片段扩增,通过乙醇沉淀而进行浓缩和纯化。

接下来,将F09菌株接种至包含12g/L Potato Dextrose Broth(Difco)、20g/LBacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在琼脂培养基上形成的菌落的末端附近打孔而得到的1个琼脂盘接种至包含24g/L Pot ato Dextrose Broth的培养基中,在30℃、220rpm的条件下进行2天旋转培养。通过离心分离(5000rpm,5分钟)而回收菌体,添加包含10g/L Yatalase(T AKARA BIO)、10mM KH2PO4、0.8M NaCl的水溶液(pH6.0)30mL,在振荡的同时使其在30℃下进行2小时反应,消化细胞壁而进行原生质体化。通过玻璃过滤器而除去残渣后,通过离心分离(2000rpm,10分钟)而回收原生质体,通过包含1.2M山梨糖醇、10mM CaCl2的Tris-HCl缓冲液(pH7.5)而悬浮成1mL,制备原生质体溶液。在200μL的原生质体溶液中,添加10μg纯化的ys cB破坏用DNA片段和50μL包含400g/L PEG4000、10mM CaCl2的Tris-HC l缓冲液(pH7.5),在冰上放置30分钟。然后进一步添加1mL的包含400g/L PEG4000、10mM CaCl2的Tris-HCl缓冲液(pH7.5)并进行混合,在室温下放置15分钟而进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1M蔗糖、1g/L尿嘧啶(Uracil)、1g/L尿苷的最小必需培养基(10g/L葡萄糖、10mM NH4Cl、10mM KH2PO4、7mM KCl、2mM MgSO4、0.06mg/L H3BO3、0.26mg/L(NH4)6Mo7O24·4H2O、1mg/L FeCl3·6H2O、0.4mg/L CuS O4·5H2O、0.08mg/L MnCl2、2mg/L ZnCl2、20g/L Bacto Agar)中,在30℃下培养1天后,覆盖包含0.5g/L Hygromycin B、24g/L Potato Dextrose Broth、7g/L BactoAgar的培养基,进一步在30℃下培养3天,从而选拔潮霉素抗性菌株。将出现的菌落接种至包含0.5g/L Hygromycin B的最小必需培养基中,在30℃下培养4天后,确认yscB基因被Hygromycin抗性基因取代,得到源自F09的yscB破坏菌株(F09ΔyscB菌株)。

(2)人血清白蛋白(HSA)表达菌株的构建和培养评价

将T.cellulolyticus F09菌株和F09ΔyscB菌株作为亲本菌株,通过以下步骤而构建人血清白蛋白(HSA)表达菌株。

首先,根据以下步骤而制成具有按照T.cellulolyticus的creA基因上游区域、T.cellulolyticus的cbh2基因上游区域(cbh2启动子;SEQ ID NO.33)、T.cellulolyticus的cbh1分泌信号编码序列(SEQ ID NO.34)、HSA基因(SEQ ID NO.35)、T.cellulolyticus的cbh2基因下游区域(cbh2终止子;SEQ ID NO.36)、T.cellulolyticus的pyrF基因标记(SEQID NO.37)、T.cellulolyticus的creA基因下游区域的顺序连接的碱基序列的HSA表达用DNA片段。

将T.cellulolyticus Y-94菌株(FERM BP-5826)的基因组DNA作为模板,通过使用了引物(SEQ ID NO.7和8)的PCR而使creA基因的上游区域扩增,通过使用了引物(SEQ IDNO.9和10)的PCR而使cbh2基因的上游区域扩增,通过使用了引物(SEQ ID NO.11和12)的PCR而使cbh1分泌信号编码序列扩增,通过使用了引物(SEQ ID NO.13和14)的PCR而使cbh2基因的下游区域扩增,通过使用了引物(SEQ ID NO.15和16)的PCR而使pyrF基因标记扩增,通过使用了引物(SEQ ID NO.17和18)的PCR而使creA基因下游区域扩增。此外,将从EUROFINS株式会社购入的全合成基因作为模板,通过使用了引物(SEQ ID NO.19和20)的PCR而使HSA基因扩增。使用Wizard SV Gel and PCR Clean-Up System(Promega)使PCR产物纯化。将混合2种纯化的PCR产物而得到的混合物作为模板,再次进行PCR并连接,重复进行后,通过In-Fusion HD Cloning Kit(TAKARA BIO)而导入试剂盒随附的pUC质粒中。用反应物转化大肠杆菌(E.coli)JM109,在LB琼脂培养基(包含100mg/L氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用Wizard Plus Miniprep System(Promega),由得到的转化体得到导入了HSA表达用DNA片段的pUC-creA::Pcbh2-HSA-pyrF质粒。将pUC-creA::Pcbh2-HSA-pyrF质粒作为模板,通过使用了引物(SEQ ID NO.7和18)的PCR而使HSA表达用DNA片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使creA基因的上游和下游序列与HSA表达序列的两端连接,可以不是在基因组上的随机的位置,而是针对creA基因区域而插入HSA表达序列。

接下来,以与(1)同样的手法培养F09菌株和F09ΔyscB菌株,进行原生质体化,以与(1)同样的方式用纯化的HSA表达用DNA片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1M蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(Uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认creA基因区域被HSA表达序列取代,得到源自F09菌株和F09ΔyscB菌株的HSA表达菌株。

将源自F09菌株和F09ΔyscB菌株的HSA表达菌株接种至包含12g/L PotatoDextrose Broth(Difco)、20g/L Bacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20mL的包含50g/L Solka Floc、24g/L KH2PO4、5g/L (NH4)2SO4、3g/L尿素、1g/L Tween80、1.2g/LMgSO4·7H2O、0.01g/L ZnSO4·7H2O、0.01g/L MnSO4·5H2O、0.01g/L CuSO4·5H2O的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

为了确认HSA的分泌生产,而将得到的培养液上清液提供至SDS-PAGE后,进行基于抗HSA抗体(SIGMA,A6684)的蛋白质印迹(Western Blotting)。结果示于图1。在F09菌株的情况下,虽然可以确认HSA的带,但是非常薄,并且,在低分子量侧观察到被认为是分解物的带。另一方面,在F09ΔyscB菌株的情况下,可以确认浓的HSA的带,在低分子量侧几乎未观察到带。这暗示,在F09菌株的情况下,HSA分解,而在F09ΔyscB菌株的情况下,HSA的分解得到抑制,从而使得HSA的分泌生产量增加。因此,进行基于使用Albumin ELISAQuantitation Kit,Human(BETHYL LABORATORIES公司)的ELISA的HSA的定量。结果示于表1。确认了,与F09菌株相比,在F09ΔyscB菌株情况下HSA分泌生产量增加,因此,显示通过yscB基因缺陷而提高HSA的分泌生产量。

表1

(3)曲妥珠单抗表达菌株的构建和培养评价

将T.cellulolyticus F09菌株和F09ΔyscB菌株作为亲本菌株,通过以下步骤而构建曲妥珠单抗表达菌株。

首先,根据以下步骤而制成具有按照T.cellulolyticus的creA基因上游区域、T.cellulolyticus的cbh2基因上游区域(cbh2启动子;SEQ ID NO.33)、T.cellulolyticus的cbh1分泌信号编码序列(SEQ ID NO.34)、曲妥珠单抗重链基因(SEQ ID NO.38)、T.cellulolyticus的cbh1基因下游区域(cbh1终止子;SEQ ID NO.39)、T.cellulolyticus的pyrF基因标记(SEQ ID NO.37)、T.cellulolyticus的cbh2基因上游区域(cbh2启动子;SEQ ID NO.33)、T.cellulolyticus的cbh1分泌信号编码序列(SEQ ID NO.34)、曲妥珠单抗轻链基因(SEQ ID NO.40)、T.cellulolyticus的cbh2基因下游区域(cbh2终止子;SEQ IDNO.36)、T.cellulolyticus的creA基因下游区域的顺序连接的碱基序列的曲妥珠单抗表达用DNA片段。

将T.cellulolyticus Y-94菌株(FERM BP-5826)的基因组DNA作为模板,通过使用了引物(SEQ ID NO.7和8)的PCR而使creA基因的上游区域扩增,通过使用了引物(SEQ IDNO.9和10)的PCR而使cbh2基因的上游区域扩增,通过使用了引物(SEQ ID NO.11和21)的PCR而使cbh1分泌信号编码序列扩增,通过使用了引物(SEQ ID NO.22和23)的PCR而使cbh1基因的下游区域扩增,通过使用了引物(SEQ ID NO.24和16)的PCR而使pyrF基因标记扩增,通过使用了引物(SEQ ID NO.25和10)的PCR而使cbh2基因的上游区域扩增,通过使用了引物(SEQ ID NO.11和26)的PCR而使cbh1分泌信号编码序列扩增,通过使用了引物(SEQ IDNO.13和14)的PCR而使cbh2基因的下游区域扩增,通过使用了引物(SEQ ID NO.27和18)的PCR而使creA基因下游区域扩增。此外,将从EUROFINS株式会社购入的全合成基因作为模板,通过使用了引物(SEQ ID NO.28和29)的PCR而使曲妥珠单抗重链基因扩增,通过使用了引物(SEQ ID NO.30和31)的PCR而使曲妥珠单抗轻链基因扩增。使用Wizard SV Gel andPCR Clean-Up System(Promega)而使PCR产物纯化。将混合2种纯化的PCR产物而得到的混合物作为模板,再次进行PCR并连接,重复进行后,通过In-Fusion HD Cloning Kit(TAKARABIO)而导入试剂盒随附的pUC质粒中。用反应物转化大肠杆菌(E.coli)JM109,在LB琼脂培养基(包含100mg/L氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用WizardPlus Miniprep System(Promega),由得到的转化体得到导入了曲妥珠单抗表达用DNA片段的pUC-creA::Pcbh2-Her_H-pyrF-Pcbh2-Her_L质粒。将pUC-creA::Pcbh2-Her_H-pyrF-Pcbh2-Her_L质粒作为模板,通过使用了引物(SEQ ID NO.7和18)的PCR而使曲妥珠单抗表达用DNA片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使creA基因的上游和下游序列与曲妥珠单抗表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对creA基因区域而插入曲妥珠单抗表达序列。

接下来,以与(1)同样的手法培养F09菌株和F09ΔyscB菌株,进行原生质体化,以与(1)同样的方式用纯化的曲妥珠单抗表达用DNA片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1M蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(Uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认creA基因区域被曲妥珠单抗表达序列取代,得到源自F09菌株和F09ΔyscB菌株的曲妥珠单抗表达菌株。

将源自F09菌株和F09ΔyscB菌株的曲妥珠单抗表达菌株接种至包含12g/LPotato Dextrose Broth(Difco)、20g/L Bacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20mL的包含50g/L Solka Floc、24g/L KH2PO4、5g/L (NH4)2SO4、3g/L尿素、1g/L Tween80、1.2g/L MgSO4·7H2O、0.01g/L ZnSO4·7H2O、0.01g/L MnSO4·5H2O、0.01g/L CuSO4·5H2O的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

为了确认曲妥珠单抗的分泌生产,而使用Proteus ProteinA AntibodyPurification Midi Kit(BIO-RAD)将得到的培养液上清液提供至基于ProteinA的抗体纯化。将从同量的培养液上清液中得到的溶出液提供至SDS-PAGE。结果示于图2。同时,将进行了电泳的曲妥珠单抗标准品(CHUGAI PHARMACE UTICAL)的阶段稀释液作为对照,通过图像分析而计算样品中的曲妥珠单抗浓度。轻链的带的结果示于表2。对于重链的带,确认也与具有表2同样的倾向。确认与F09菌株相比,在F09ΔyscB菌株的情况下,曲妥珠单抗分泌生产量增加,因此,显示通过yscB基因缺陷而使曲妥珠单抗的分泌生产量提高。

表2

(4)纳武单抗表达菌株的构建和培养评价

将T.cellulolyticus F09菌株和F09ΔyscB菌株作为亲本菌株,通过以下步骤而构建纳武单抗表达菌株。

首先,根据以下步骤而制成具有按照T.cellulolyticus的creA基因上游区域、T.cellulolyticus的cbh2基因上游区域(cbh2启动子;SEQ ID NO.33)、T.cellulolyticus的cbh1分泌信号编码序列(SEQ ID NO.34)、纳武单抗重链基因(SEQ ID NO.45)、T.cellulolyticus的cbh1基因下游区域(cbh1终止子;SEQ ID NO.39)、T.cellulolyticus的pyrF基因标记(SEQ ID NO.37)、T.cellulolyticus的cbh2基因上游区域(cbh2启动子;SEQ ID NO.33)、T.cellulolyticus的cbh1分泌信号编码序列(SEQ ID NO.34)、纳武单抗轻链基因(SEQ ID NO.46)、T.cellulolyticus的cbh2基因下游区域(cbh2终止子;SEQ IDNO.36)、T.cellulolyticus的creA基因下游区域的顺序连接的碱基序列的纳武单抗表达用DNA片段。

将T.cellulolyticus Y-94菌株(FERM BP-5826)的基因组DNA作为模板,通过使用了引物(SEQ ID NO.7和8)的PCR而使creA基因的上游区域扩增,通过使用了引物(SEQ IDNO.9和10)的PCR而使cbh2基因的上游区域扩增,通过使用了引物(SEQ ID NO.11和21)的PCR而使cbh1分泌信号编码序列扩增,通过使用了引物(SEQ ID NO.22和23)的PCR而使cbh1基因的下游区域扩增,通过使用了引物(SEQ ID NO.24和16)的PCR而使pyrF基因标记扩增,通过使用了引物(SEQ ID NO.25和10)的PCR而使cbh2基因的上游区域扩增,通过使用了引物(SEQ ID NO.11和26)的PCR而使cbh1分泌信号编码序列扩增,通过使用了引物(SEQ IDNO.13和14)的PCR而使cbh2基因的下游区域扩增,通过使用了引物(SEQ ID NO.27和18)的PCR而使creA基因下游区域扩增。此外,将从EUROFINS株式会社购入的全合成基因作为模板,通过使用了引物(SEQ ID NO.47和48)的PCR而使纳武单抗重链基因扩增,通过使用了引物(SEQ ID NO.49和50)的PCR而使纳武单抗轻链基因扩增。使用Wizard SV Gel and PCRClean-Up System(Promega)而使PCR产物纯化。将混合2种纯化的PCR产物而得到的混合物作为模板,再次进行PCR并连接,重复进行后,通过In-Fusion HD Cloning Kit(TAKARABIO)而导入试剂盒随附的pUC质粒中。用反应物转化大肠杆菌(E.coli)JM109,在LB琼脂培养基(包含100mg/L氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用Wizard PlusMiniprep System(Promega),由得到的转化体得到导入了纳武单抗表达用DNA片段的pUC-creA::Pcbh2-Opd_H-pyrF-Pcbh2-Opd_L质粒。将pUC-creA::Pcbh2-Opd_H-pyrF-Pcbh2-Opd_L质粒作为模板,通过使用了引物(SEQ ID NO.7和18)的PCR而使纳武单抗表达用DNA片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使creA基因的上游和下游序列与纳武单抗表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对creA基因区域而插入纳武单抗表达序列。

接下来,以与(1)同样的手法培养F09菌株和F09ΔyscB菌株,进行原生质体化,以与(1)同样的方式用纯化的纳武单抗表达用DNA片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1M蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(Uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认creA基因区域被纳武单抗表达序列取代,得到源自F09菌株和F09ΔyscB菌株的纳武单抗表达菌株。

将源自F09菌株和F09ΔyscB菌株的纳武单抗表达菌株接种至包含12g/L PotatoDextrose Broth(Difco)、20g/L Bacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20mL的包含50g/L Solka Floc、24g/L KH2PO4、5g/L(NH4)2SO4、3g/L尿素、1g/L Tween80、1.2g/LMgSO4·7H2O、0.01g/L ZnSO4·7H2O、0.01g/L MnSO4·5H2O、0.01g/L CuSO4·5H2O的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

就纳武单抗的分泌生产量而言,通过Human IgG ELISA Quantitation Ki t(BETHYL LABORATORIES公司)而测定为培养液上清液中的人IgG量。结果示于表3。确认与F09菌株相比,在F09ΔyscB菌株的情况下,纳武单抗分泌生产量增加,因此,显示通过yscB基因缺陷而使纳武单抗的分泌生产量提高。

表3

(5)角质细胞生长因子(Keratinocyte growth factor)1(KGF-1)表达菌株的构建和培养评价

将T.cellulolyticus F09菌株和F09ΔyscB菌株作为亲本菌株,通过以下步骤而构建角质细胞生长因子(Keratinocyte growth factor)1(KGF-1)表达菌株。

首先,根据以下步骤而制成具有按照T.cellulolyticus的creA基因上游区域、T.cellulolyticus的cbh2基因上游区域(cbh2启动子;SEQ ID NO.33)、T.cellulolyticus的cbh1分泌信号编码序列(SEQ ID NO.34)、编码添加有His6标签的KGF-1的基因(SEQ IDNO.51)、T.cellulolyticus的cbh2基因下游区域(cbh2终止子;SEQ ID NO.36)、T.cellulolyticus的pyrF基因标记(SEQ ID NO.37)、T.cellulolyticus的creA基因下游区域的顺序连接的碱基序列的KGF-1表达用DNA片段。

将T.cellulolyticus Y-94菌株(FERM BP-5826)的基因组DNA作为模板,通过使用了引物(SEQ ID NO.7和8)的PCR而使creA基因的上游区域扩增,通过使用了引物(SEQ IDNO.9和10)的PCR而使cbh2基因的上游区域扩增,通过使用了引物(SEQ ID NO.11和12)的PCR而使cbh1分泌信号编码序列扩增,通过使用了引物(SEQ ID NO.13和14)的PCR而使cbh2基因的下游区域扩增,通过使用了引物(SEQ ID NO.15和16)的PCR而使pyrF基因标记扩增,通过使用了引物(SEQ ID NO.17和18)的PCR而使creA基因下游区域扩增。此外,将从EUROFINS株式会社购入的全合成基因作为模板,通过使用了引物(SEQ ID NO.52和53)的PCR而使编码添加有His6标签的KGF-1的基因扩增。使用Wizard SV Gel and PCR Clean-UpSystem(Promega)而使PCR产物纯化。将混合2种纯化的PCR产物而得到的混合物作为模板,再次进行PCR并连接,重复进行后,通过In-Fusion HD Cloning Kit(TAKARABIO)而导入试剂盒随附的pUC质粒中。用反应物转化大肠杆菌(E.coli)JM109,在LB琼脂培养基(包含100mg/L氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用Wizard Plus MiniprepSystem(Promega),由得到的转化体得到导入了KGF-1表达用DNA片段的pUC-creA::Pcbh2-KGF1-pyrF质粒。将pUC-creA::Pcbh2-KGF1-pyrF质粒作为模板,通过使用了引物(SEQ IDNO.7和18)的PCR而使KGF-1表达用DNA片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使creA基因的上游和下游序列与KGF-1表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对creA基因区域而插入KGF-1表达序列。

接下来,以与(1)同样的手法培养F09菌株和F09ΔyscB菌株,进行原生质体化,以与(1)同样的方式用纯化的KGF-1表达用DNA片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1M蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(Uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认creA基因区域被KGF-1表达序列取代,得到源自F09菌株和F09ΔyscB菌株的KGF-1表达菌株。

将源自F09菌株和F09ΔyscB菌株的KGF-1表达菌株接种至包含12g/L PotatoDextrose Broth(Difco)、20g/L Bacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20mL的包含50g/L Solka Floc、24g/L KH2PO4、5g/L(NH4)2SO4、3g/L尿素、1g/L Tween80、1.2g/LMgSO4·7H2O、0.01g/L ZnSO4·7H2O、0.01g/L MnSO4·5H2O、0.01g/L CuSO4·5H2O的液体培养基中、在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

为了确认KGF-1的分泌生产,而将得到的培养液上清液提供至基于Ni-NTAAgarose(QIAGEN)的His标签纯化,将纯化物提供至SDS-PAGE。具体而言,将Ni-NTA Agarose(QIAGEN)添加至将pH调整至8.0的培养上清液中并进行1小时混和后,用50mM磷酸缓冲液(pH8.0)清洗,添加SDS-PAGE的样品缓冲液并在95℃下加热5分钟,将上清液提供至SDS-PAGE。结果示于图3。确认与F09菌株相比,在F09ΔyscB菌株的情况下,KGF-1分泌生产量增加,因此,显示通过yscB基因缺陷而使KGF-1的分泌生产量提高。

(6)血管内皮生长因子(Vascular endothelial growth factor)(VEGF)表达菌株的构建和培养评价

将T.cellulolyticus F09菌株和F09ΔyscB菌株作为亲本菌株,通过以下步骤而构建血管内皮生长因子(Vascular endothelial growth factor)(VEGF)表达菌株。

首先,根据以下步骤而制成具有按照T.cellulolyticus的creA基因上游区域、T.cellulolyticus的cbh2基因上游区域(cbh2启动子;SEQ ID NO.33)、T.cellulolyticus的cbh1分泌信号编码序列(SEQ ID NO.34)、编码添加有His6标签的VEGF的基因(SEQ IDNO.54)、T.cellulolyticus的cbh2基因下游区域(cbh2终止子;SEQ ID NO.36)、T.cellulolyticus的pyrF基因标记(SEQ ID NO.37)、T.cellulolyticus的creA基因下游区域的顺序连接的碱基序列的VEGF表达用DNA片段。

将T.cellulolyticus Y-94菌株(FERM BP-5826)的基因组DNA作为模板,通过使用了引物(SEQ ID NO.7和8)的PCR而使creA基因的上游区域扩增,通过使用了引物(SEQ IDNO.9和10)的PCR而使cbh2基因的上游区域扩增,通过使用了引物(SEQ ID NO.11和12)的PCR而使cbh1分泌信号编码序列扩增,通过使用了引物(SEQ ID NO.13和14)的PCR而使cbh2基因的下游区域扩增,通过使用了引物(SEQ ID NO.15和16)的PCR而使pyrF基因标记扩增,通过使用了引物(SEQ ID NO.17和18)的PCR而使creA基因下游区域扩增。此外,将从EUROFINS株式会社购入的全合成基因作为模板,通过使用了引物(SEQ ID NO.55和56)的PCR而使编码添加有His6标签的VEGF的基因扩增。使用Wizard SV Gel and PCR Clean-UpSystem(Promega)而使PCR产物纯化。将混合2种纯化的PCR产物而得到的混合物作为模板,再次进行PCR并连接,重复进行后,通过In-Fusion HD Cloning Kit(TAKARABIO)而导入试剂盒随附的pUC质粒中。用反应物转化大肠杆菌(E.coli)JM109,在LB琼脂培养基(包含100mg/L氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用Wizard Plus MiniprepSystem(Promega),由得到的转化体得到导入了VEGF表达用DNA片段的pUC-creA::Pcbh2-VEGF-pyrF质粒。将pUC-creA::Pcbh2-VEGF-pyrF质粒作为模板,通过使用了引物(SEQ IDNO.7和18)的PCR而使VEGF表达用DNA片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使creA基因的上游和下游序列与VEGF表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对creA基因区域而插入VEGF表达序列。

接下来,以与(1)同样的手法培养F09菌株和F09ΔyscB菌株,进行原生质体化,以与(1)同样的方式用纯化的VEGF表达用DNA片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1M蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(Uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认creA基因区域被VEGF表达序列取代,得到源自F09菌株和F09ΔyscB菌株的VEGF表达菌株。

将源自F09菌株和F09ΔyscB菌株的VEGF表达菌株接种至包含12g/L PotatoDextrose Broth(Difco)、20g/L Bacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20mL的包含50g/L Solka Floc、24g/L KH2PO4、5g/L(NH4)2SO4、3g/L尿素、1g/L Tween80、1.2g/LMgSO4·7H2O、0.01g/L ZnSO4·7H2O、0.01g/L MnSO4·5H2O、0.01g/L CuSO4·5H2O的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

为了确认VEGF的分泌生产,而将得到的培养液上清液提供至基于Ni-NTA Agarose(QIAGEN)的His标签纯化,将纯化物提供至SDS-PAGE。具体而言,将Ni-NTA Agarose(QIAGEN)添加至将pH调整至8.0的培养上清液中并进行1小时混和后,用50mM磷酸缓冲液(pH8.0)清洗,添加SDS-PAGE的样品缓冲液并在95℃下加热5分钟,将上清液提供至SDS-PAGE。结果示于图4。确认与F09菌株相比,在F09ΔyscB菌株的情况下,VEGF分泌生产量增加,因此,显示通过yscB基因缺陷而使VEGF的分泌生产量提高。

(7)与异源蛋白分解有关的蛋白酶的分析

(7-1)与异源蛋白分解有关的蛋白酶的定位分析

如上所述,(2)中将Talaromyces cellulolyticus F09菌株(日本特开2016-131533)作为宿主而分泌生产作为异源蛋白的HSA,其结果,观察到HSA的分解(图1)。因此,为了调查与异源蛋白分解有关的蛋白酶的定位,而以如下所述的方式制备F09菌株的培养液上清液。首先,将F09菌株接种至包含12g/L Potato Dextrose Broth(Difco)、20g/LBacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20mL的包含50g/L Solka Floc、24g/LKH2PO4、5g/L(NH4)2SO4、3g/L尿素、1g/L Tween80、1.2g/L MgSO4·7H2O、0.01g/L ZnS O4·7H2O、0.01g/L MnSO4·5H2O、0.01g/L CuSO4·5H2O、1g/L尿嘧啶、1g/L尿苷的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器而除去菌体,得到培养液上清液。将培养液上清液与纯化HSA(Abcam,ab201876)混合,在30℃下静置3天。接着,将混合液提供至SDS-PAGE,进行基于抗HSA抗体(SIGMA,A6684)的蛋白质印迹(Western Blotting)。结果示于图5。分子量比HAS小的位置处观察到分解物的多个带,由此出发,观察到HSA的分解。该结果暗示,F09菌株的培养液上清液中包含与异源蛋白分解有关的蛋白酶。

(7-2)与异源蛋白分解有关的蛋白酶候补基因的提取

为了提取与异源蛋白分解有关的蛋白酶候补基因,而通过离心分离(5000rpm,5分钟)从(7-1)中得到的培养液中回收F09菌株的菌体,使用RNeasy Pl ant Mini Kit(QIAGEN)而进行Total RNA的提取。通过TruSeq Stranded mR NA SamplePrep Kit(illumina)而从得到的Total RNA进行文库制备,通过新一代测序仪MiSeq使用MiSeqReagent Kit v2 500cycle(illumina)而实施表达分析。提取蛋白酶和注释了的基因,按表达量(映射的读取数)顺序排序的结果示于表4。需要说明的是,由于具有最高表达量的cbh1基因为140000读数,第2高表达量的cbh2基因为80000读数,因此,排除800读数以下的。提取表4所示的5个基因作为蛋白酶候补基因。虽然暗示(7-1)中培养液上清液包含蛋白酶,但考虑基于溶菌的蛋白酶的溶出、注释的差异等,因此不考虑注释上的定位,将全部这5个基因作为候补而实施之后的研究。

[表4]

(7-3)提取的蛋白酶候补基因缺陷菌株的构建

将Talaromyces cellulolyticus F09菌株(日本特开2016-131533)作为亲本菌株,通过以下步骤而破坏蛋白酶候补基因(胃蛋白酶(Pepsin)1:SEQ ID NO.57,yscB:SEQID NO.32,CPY:SEQ ID NO.58,胃蛋白酶(Pepsin)2:SE Q ID NO.59,嗜热菌蛋白酶(Thermolysin):SEQ ID NO.60),构建源自T.c ellulolyticus F09的蛋白酶候补基因缺陷菌株。F09菌株是将T.cellulolyticus S6-25菌株(NITE BP-01685)作为亲本菌株而得到的在pyrF基因中具有变异(单碱基取代)的菌株。F09菌株通过pyrF基因的变异而表现出尿嘧啶(Uracil)缺陷型。

首先,根据以下步骤而制成具有按照T.cellulolyticus的蛋白酶候补基因上游区域、pyrF基因、T.cellulolyticus的蛋白酶候补基因下游区域的顺序连接的碱基序列的蛋白酶候补基因破坏用DNA片段。

将T.cellulolyticus Y-94菌株(FERM BP-5826)的基因组DNA作为模板,通过使用了引物(SEQ ID NO.61和62)的PCR而使胃蛋白酶(Pepsin)1基因的上游区域扩增,通过使用了引物(SEQ ID NO.62和63)的PCR而使胃蛋白酶(P epsin)1基因的下游区域扩增,通过使用了引物(SEQ ID NO.1和65)的PCR而使yscB基因的上游区域扩增,通过使用了引物(SEQID NO.66和4)的PC R而使yscB基因的下游区域扩增,通过使用了引物(SEQ ID NO.67和68)的PCR而使CPY基因的上游区域扩增,通过使用了引物(SEQ ID NO.69和70)的PCR而使CPY基因的下游区域扩增,通过使用了引物(SEQ ID NO.71和72)的PCR而使胃蛋白酶(Pepsin)2基因的上游区域扩增,通过使用了引物(SEQ ID NO.73和74)的PCR而使胃蛋白酶(Pepsin)2基因的下游区域扩增,通过使用了引物(SEQ ID NO.75和76)的PCR而使嗜热菌蛋白酶(Thermolysin)基因的上游区域扩增,通过使用了引物(SEQ ID NO.77和78)的PCR而使嗜热菌蛋白酶(Thermolysin)基因的下游区域扩增。此外,将T.cellulolyticus Y-94菌株(FERMBP-5826)的基因组DNA作为模板,通过使用了引物(SEQ ID NO.79和80)的PCR而使pyrF基因(包含启动子和终止子)扩增。使用Wizard SV Gel and PCR Clean-Up System(Promega)而使PCR产物纯化。通过In-Fusion HD Cloning Kit(TAKARABIO)而将纯化的上游区域、下游区域和pyrF基因的PCR产物导入并与试剂盒随附的pUC质粒连接。用反应物转化大肠杆菌(E.coli)JM109,在LB琼脂培养基(包含100mg/L氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用Wizard Plus Miniprep System(Promega),由得到的转化体得到导入了蛋白酶候补基因破坏用DNA片段的质粒。将这些质粒作为模板,通过使用了引物(胃蛋白酶(Pepsin)1:SEQ ID NO.61和64,YscB:SEQ ID NO.1和4,CPY:SEQ ID NO.67和70,胃蛋白酶(Pepsin)2:SEQ ID NO.71和74,嗜热菌蛋白酶(Thermolysin):SEQ ID NO.75和78)的PCR而使蛋白酶候补基因破坏用DNA片段扩增,通过乙醇沉淀而进行浓缩和纯化。

接下来,将F09菌株接种至包含12g/L Potato Dextrose Broth(Difco)、20g/LBacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至包含24g/L Potato Dextrose Broth的培养基中,在30℃,220rpm的条件下进行2天旋转培养。通过离心分离(5000rpm,5分钟)而回收菌体,添加包含10g/L Yatalase(TAKARABIO)、10mM KH2PO4、0.8M NaCl的水溶液(pH6.0)30mL,在振荡的同时使其在30℃下进行2小时反应,消化细胞壁而进行原生质体化。通过玻璃过滤器而除去残渣后,通过离心分离(2000rpm,10分钟)而回收原生质体,通过包含1.2M山梨糖醇、10mM CaCl2的Tris-HCl缓冲液(pH7.5)而悬浮成1mL,制备原生质体溶液。在200μL的原生质体溶液中,添加10μg纯化的各蛋白酶候补破坏用DNA片段和50μL包含400g/L PEG4000、10mM CaCl2的Tris-HCl缓冲液(pH7.5),在冰上放置30分钟。然后进一步添加1mL的包含400g/L PEG4000、10mM CaCl2的Tris-HCl缓冲液(pH7.5)并进行混合,在室温下放置15分钟而进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1M蔗糖的最小必需培养基(10g/L葡萄糖、10mM NH4Cl、10mM KH2PO4、7mM KCl、2mM MgSO4、0.06mg/LH3BO3、0.26mg/L (N H4)6Mo7O24·4H2O、1mg/L FeCl3·6H2O、0.4mg/L CuSO4·5H2O、0.08mg/LMn Cl2、2mg/L ZnCl2、20g/L Bacto Agar)中,在30℃下培养7天,从而选拔互补了尿嘧啶(Uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认各蛋白酶候补基因区域被pyrF基因取代,得到源自F09菌株的蛋白酶候补基因缺陷菌株。

(7-4)蛋白酶候补基因缺陷菌株的培养液上清液的蛋白酶活性的评价

将各蛋白酶候补基因缺陷菌株接种至包含12g/L Potato Dextrose Broth(Difco)、20g/L Bacto Agar(Difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20mL的包含50g/L SolkaFloc、24g/L KH2PO4、5g/L(NH4)2SO4、3g/L尿素、1g/L Tween80、1.2g/L MgSO4·7H2O、0.01g/L ZnSO4·7H2O、0.01g/L MnSO4·5H2O、0.01g/L CuSO4·5H2O的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。以与(7-1)同样的方式而将培养液上清液与纯化HSA混合而对蛋白酶活性进行评价。结果示于图6。在胃蛋白酶(Pepsin)1、CPY、胃蛋白酶(Pepsin)2、嗜热菌蛋白酶(Thermolysin)缺陷菌株的情况下与F09菌株同样,在分子量比HSA小的位置观察到分解物的多个带,由此出发,观察到HSA的分解。另一方面,在yscB缺陷菌株中,分解物的带消失。该结果表明,YscB是承担F09菌株中培养上清液中的异源蛋白分解的蛋白酶。

工业实用性

通过本发明而能够高效地制造蛋白质。

<序列表的说明>

SEQ ID NO.1~31:引物

SEQ ID NO.32:Talaromyces cellulolyticus S6-25菌株的yscB基因的碱基序列

SEQ ID NO.33:Talaromyces cellulolyticus的cbh2启动子的碱基序列

SEQ ID NO.34:Talaromyces cellulolyticus的编码Cbh1信号肽的碱基序列

SEQ ID NO.35:人血清白蛋白(HSA)基因的碱基序列

SEQ ID NO.36:cbh2终止子的碱基序列

SEQ ID NO.37:Talaromyces cellulolyticus的pyrF基因标记的碱基序列

SEQ ID NO.38:曲妥珠单抗重链基因的碱基序列

SEQ ID NO.39:cbh1终止子的碱基序列

SEQ ID NO.40:曲妥珠单抗轻链基因的碱基序列

SEQ ID NO.41:Talaromyces cellulolyticus的cbh1启动子的碱基序列

SEQ ID NO.42:Talaromyces cellulolyticus的Cbh1信号肽的氨基酸序列

SEQ ID NO.43:Talaromyces cellulolyticus S6-25菌株的YscB蛋白质的氨基酸序列

SEQ ID NO.44:Talaromyces cellulolyticus S6-25菌株的creA基因的碱基序列

SEQ ID NO.45:纳武单抗重链基因的碱基序列

SEQ ID NO.46:纳武单抗轻链基因的碱基序列

SEQ ID NO.47~50:引物

SEQ ID NO.51:角质细胞生长因子(Keratinocyte growth factor)1(KGF-1)基因的碱基序列

SEQ ID NO.52~53:引物

SEQ ID NO.54:血管内皮生长因子(Vascular endothelial growth factor)(VEGF)基因的碱基序列

SEQ ID NO.55~56:引物

SEQ ID NO.57:胃蛋白酶(Pepsin)1基因的碱基序列

SEQ ID NO.58:CPY基因的碱基序列

SEQ ID NO.59:胃蛋白酶(Pepsin)2基因的碱基序列

SEQ ID NO.60:嗜热菌蛋白酶(Thermolysin)基因的碱基序列

SEQ ID NO.61~80:引物

序列表

<110> Ajinomoto Co.,Inc.

<120> 蛋白质的制造方法

<130> E047-18419

<150> JP2017-196538

<151> 2017-10-10

<160> 80

<170> PatentIn version 3.5

<210> 1

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 1

cggtacccgg ggatcttggg gcacagagac aacagggtca 40

<210> 2

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 2

agatagggtt gagtgagata gcgtgagcac actgagcagg 40

<210> 3

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 3

aaagtgtaaa gcctgcaaca cgctacctct tccacagtag 40

<210> 4

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 4

cgactctaga ggatcgagct gattgagcat gctaacgcag 40

<210> 5

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 5

cactcaaccc tatctcggtc t 21

<210> 6

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 6

caggctttac actttatgct tccg 24

<210> 7

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 7

cggtacccgg ggatcagcgc agaccaatgc cagaggagaa 40

<210> 8

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 8

gcgcgagttg cgcgatgaaa tttat 25

<210> 9

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 9

tcgcgcaact cgcgctgcta tgcagttgat gctactgtgt 40

<210> 10

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 10

agttgctaaa tgatcaagaa gcttcacttt 30

<210> 11

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 11

acagctggtg ctcagaagtg ggtcaccttc atctctctcc tcttc 45

<210> 12

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 12

ctgagcacca gctgttgcca gcaag 25

<210> 13

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 13

tagatcagct ttgagtgcag caaaa 25

<210> 14

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 14

gcttgtttga gaatacatga ggttgcc 27

<210> 15

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 15

tattctcaaa caagcgtcaa ttcagatcgg ctgccgcctg 40

<210> 16

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 16

ataagtgaac gccgagtcag tacta 25

<210> 17

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 17

tcggcgttca cttatcctct ttctcgccct ttcttctcaa 40

<210> 18

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 18

cgactctaga ggatcaaccg tcgatcagaa ggagcgcaat 40

<210> 19

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 19

acagctggtg ctcagaagtg ggtcaccttc atctctctcc 40

<210> 20

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 20

ctcaaagctg atctacaaac caagagcagc ttgactagcg 40

<210> 21

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 21

gacgagctgg acttcctgag caccagctgt tgccagcaag 40

<210> 22

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 22

taaattttca cttctttctt cgcctattga 30

<210> 23

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 23

ccgatctgaa ttgacccgaa aacggtaagg cgtagttata gaaat 45

<210> 24

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 24

gtcaattcag atcggctgcc gcctg 25

<210> 25

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 25

tcggcgttca cttattgcta tgcagttgat gctactgtgt 40

<210> 26

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 26

tgtcatctgg atgtcctgag caccagctgt tgccagcaag 40

<210> 27

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 27

tattctcaaa caagccctct ttctcgccct ttcttctcaa 40

<210> 28

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 28

gaagtccagc tcgtcgagtc tggtg 25

<210> 29

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 29

agaagtgaaa atttatttac caggagacaa ggacaga 37

<210> 30

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 30

gacatccaga tgacacagtc ccctt 25

<210> 31

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 31

ctcaaagctg atctaacact caccacggtt gaaggactta 40

<210> 32

<211> 1589

<212> DNA

<213> Talaromyces cellulolyticus

<400> 32

atgaagggcg tcctcagcct ttcgctgctg ccgttgttga cggttgcgtc accggtgatg 60

ccgcgcacca tccacaacga cgctgctccc attctctctt cgtccaacgc cgttgaggtc 120

ccagattcat atatcattgt ctttaaagac catgtagatt ctgcttctgc cgcagcccat 180

cataactggg tgcaagacat tcacagccaa cacaccgagc tccgaaagcg gtctcaattc 240

ccattcgctg acaatgcctt tgccggtctc aaacacactt ttgacattgc cggcagcttc 300

cttggttact caggacactt cgaagagaat gtcattgagg ccattcgccg acaccccgat 360

gtgagttatc cgcacgtgcc ctactcctaa ggcaatgact aatacgcatc tccacctata 420

ggttgattac atcgagaagg attctcttgt ccacaccatg gaagatcccg cccttgagaa 480

gaacgcccca tggggtttgg ctcgtatttc gcaccgtgag agcttgagct tcggaagctt 540

caacaagtac ttgtacgctg ccgacggcgg tgaaggtgtt gacgtttatg tcattgacac 600

tggtaccaac atcgaccacg tcgacttcga gggtcgtgct tcctggggca agaccatccc 660

cactgacgat gaggatgttg atggcaatgg tcacggtact cactgctccg gaactattgc 720

gggcaagaag tacggtgttg ccaagaaggc caatgtctac gctgtcaagg tcttgaagtc 780

taacggttct ggaaccatgt ccgatgtcgt tcagggtgtc gaatgggctg ctactcagca 840

catcaagaag gtcaaggacg ccaaggccgg aaaagccaag ggcttcaagg gtagcgctgc 900

gaacatgagt ctcggtggtg gcaagtccgt cactcttgac aaggctgtca atgctgctgt 960

tgatgctggt atccacttcg ctgtcgctgc tggcaacgac aacgccgact cctgcaacta 1020

ctcccctgcc gccgctgaga aggccgtcac cgtcggagcc tcgaccttgg ccgatgagcg 1080

tgcttacttc tccaactacg gcaagtgcaa cgacatcttt gctcctggtc tgaacattct 1140

ctctacctgg atcggcagca agtacgccgt caacaccatc tccggtacct ccatggcttc 1200

tcctcacatt gctggtcttt tggcctactt cctctctctc cagcctgcca gtgactccgc 1260

cttcgctgtt gccgagatta ctcccaagaa gttgaaggag aacctcattg ctattggtac 1320

ccagggcgct cttactgatg ttccctctga caccactaac gtaagttgac tctgttagtc 1380

tttcaatgca ttatcaacta acaactgtgt catagattct cgcctggaac ggtggtggct 1440

cagccaacta caccgacatc attgcccaag gtggttacaa gaccaagaca ctcagcaacg 1500

aagttgacga attgatcaac aagttggagg tcgtgaacga ggaactcggt gccatctaca 1560

gccacatcaa ggatgccatt gccgcataa 1589

<210> 33

<211> 1100

<212> DNA

<213> Talaromyces cellulolyticus

<400> 33

tgctatgcag ttgatgctac tgtgttctaa aataattgat agggttaggg tcgggtataa 60

ggcgatgcaa tgtatcaatt atcacgagaa ataatgcaga aaaacacaat tccccgtatc 120

tgttgattct taaacaatct gatcaccaat ttgtagaaag aaacgattat aaggtgccat 180

ggtaatgctg gagtttacac aggatactac ttgttctgtt cattacaatg aaccgtaatt 240

gcattctgtt ttgaccactc aacaaatcct acacaaaagt aagtggactt cagtgctcgc 300

tctacgcaag taaatacttg gcatatatgg cctcgtatat tcttacaatg aggtaaattc 360

cgatagatta ctgcccaact agtcaatctt aaatccttaa gagatacagg gggaggcgga 420

agtacctgaa accacgtaat aagacgttca gggtcatgtg aatgtatgta gtatccatgt 480

ccaatacaat tgataatagt atccagtatt atatctcatt caggtaagcg ccacgcgatt 540

cttcagatct acttaactgc cgactcgcca aacgaaacaa cgtttattcg tgaccccaga 600

aaatcaccgc ggagttgcgg aggaccagtt tgtacaatgc accgaaccaa gcgttggtca 660

tttttctgga aatgggccaa acgttagaag tgattggtca gagctacatc tgaaggtgaa 720

gcaatttccg gtatgcatac atgacagcaa gcttacctac caagaccaag ttattcccca 780

gcatttgccc catacttggc tttaatattg tgggatagca aacaatatcc acaacactga 840

tgataactaa actacaaatc tgacgttact tcagactact cacgtgtcaa aagcagttag 900

cgaggatcaa gtcttttagt ctggtcatta acaaacgcaa tttcgcaacc cgataatccg 960

cgatgataat atagcgactc caaggtcgta tttatattca atcaattccc cccaatttgg 1020

aatggatttt tggaatcatc gcatgccagg acaatcagtg aaacagtgac aaagtgaagc 1080

ttcttgatca tttagcaact 1100

<210> 34

<211> 78

<212> DNA

<213> Talaromyces cellulolyticus

<400> 34

atgtctgcct tgaactcttt caatatgtac aagagcgccc tcatcttggg ctccttgctg 60

gcaacagctg gtgctcag 78

<210> 35

<211> 1827

<212> DNA

<213> 智人

<400> 35

aagtgggtca ccttcatctc tctcctcttc ttgttctcca gcgcctacag ccgtggtgtt 60

ttccgtcgtg acgcacacaa gtccgaagtg gcccatcgct tcaaagacct cggtgaggaa 120

aacttcaagg ctctcgtctt gattgccttc gctcagtact tgcaacagtg ccctttcgag 180

gaccacgtga agctggtcaa cgaagttacc gaattcgcca aaacctgcgt tgctgacgag 240

tctgccgaaa actgcgataa gtctctgcat accttgttcg gcgacaagct ctgtactgtc 300

gctaccctcc gtgagaccta cggagaaatg gccgattgtt gcgccaagca ggagcctgag 360

cgtaatgagt gctttctgca gcacaaggac gacaacccca atttgcctcg gcttgttcgt 420

cctgaggttg acgtcatgtg taccgccttc cacgataacg aggaaacctt cctcaagaag 480

tacctctacg agatcgcaag acgccatccc tacttctacg ctcctgaatt gctgttcttt 540

gccaagcgtt acaaggcagc attcactgag tgttgtcaag ccgctgacaa ggccgcctgc 600

ttgctcccca agttggatga actccgcgat gagggtaagg cctctagcgc caaacagcgc 660

cttaagtgcg cctctttgca gaagttcggt gagagagcct tcaaagcctg ggctgttgct 720

cgtctatccc aacgtttccc taaagccgag tttgctgaag tttccaaact cgtcactgac 780

ctgacaaagg tccatactga gtgctgccac ggtgacttgt tggagtgtgc tgatgatcgt 840

gccgatttgg caaagtacat ctgcgagaac caggacagca tctcctccaa gttgaaggag 900

tgctgcgaaa agcccttgct cgagaagtcc cactgcattg cggaggtcga gaacgacgaa 960

atgcctgccg acttgccttc tttggctgct gacttcgtcg aaagcaagga tgtctgcaag 1020

aactacgctg aagccaaaga cgtgttcttg ggcatgttct tgtacgagta tgctcgtcgc 1080

caccctgact actccgtggt tcttctcctc cgtctcgcca agacatacga gacgactttg 1140

gagaagtgct gtgccgctgc cgaccctcac gagtgctatg ccaaggtctt cgacgaattc 1200

aagcccttag tcgaagaacc tcagaactta atcaagcaga attgtgagct attcgagcaa 1260

ctcggtgagt acaagttcca gaacgcgtta ctggtccggt acaccaagaa ggttccccaa 1320

gtctccactc ctaccttggt tgaggtctct cgtaacttgg gtaaggttgg aagcaagtgc 1380

tgtaagcacc ccgaagccaa gcgtatgcct tgcgctgaag actacctgtc ggtcgtcttg 1440

aaccaattgt gcgtcttgca cgagaagact cccgttagcg atcgtgttac caagtgttgt 1500

accgaaagct tggttaaccg tcgtccctgc ttctccgctt tggaagtcga tgagacttac 1560

gttcctaagg agttcaacgc cgaaaccttc acctttcacg ctgatatctg cactctgtca 1620

gagaaagagc gtcagatcaa gaagcaaacc gcactcgttg agcttgtcaa gcacaaaccc 1680

aaagccacca aggaacagct caaagccgtc atggacgatt tcgctgcctt cgtcgagaaa 1740

tgctgcaaag ccgacgacaa ggagacgtgc ttcgcggaag agggcaagaa gttggtcgcc 1800

gctagtcaag ctgctcttgg tttgtag 1827

<210> 36

<211> 497

<212> DNA

<213> Talaromyces cellulolyticus

<400> 36

atcagctttg agtgcagcaa aaatgcttcc gactgtcttc ttatattgat atcatatttt 60

tcaattcact ttgtctcaag tttcaatata tcgagaaaat agtatcaaag atgaactgta 120

ataattccga tatacctata caggtttata gtaaattact ctatttcata atgcgtccat 180

ccgagaagtc tggcggcctt atcagtagtc caaaacgcct ggtttttaga catgtcacct 240

ctaatctccg cttgaggaaa atgcgtccga gcaagttctt tcgacggggt gtcttgggtc 300

gtagttggag atatgatatt tattacttcg aatcctttga tattctcact cttttcaacc 360

gccaaaaggc aagctcttgc cactgcgcga ggattaaccc atccccagag ttgtcgaacc 420

ccagattcat accatttatc gtggtgtctt tttctaacat ctctcaatgg ggcaacctca 480

tgtattctca aacaagc 497

<210> 37

<211> 2858

<212> DNA

<213> Talaromyces cellulolyticus

<400> 37

gtcaattcag atcggctgcc gcctgcgccc caggtgacgt cgatgaaagc tgggcctagg 60

tcgtgcatgc ggtccatacg gtcgtataag ttctggacac cttgggcggt ctttgggggg 120

aagtattcga aggaaattcc aggtcggccg gtggccgcct gttcttggag cttttgcccg 180

acatgcatgt tgataggtcg gtcaattgtc tgctttttca atatcttctc ggtatgatgt 240

agcttgcaga acccaagtta tgtagttcaa ttgcaaaatc aagtctgatc aagaccgaaa 300

ctcaatcccg gagcactgag gttcgcacta attgatcaag ggtacaagaa tgaggggcac 360

aatgaaagca gtcttgaaaa tgacaggcag agaaattgaa agaaaggaga agagaggacc 420

tccgggacag gagaaatgaa agcaacaaaa ccccgaacaa gctggagaga agttaaaggg 480

agcagcttgg tcaccggcaa tggatgctca tcataaaaaa ggaccctaaa cccgttatcg 540

gagtccggag aaatgacgct aattcggatt tggaagtccc cgccaatcgt gggaaattct 600

cgaagcagac aatttgctcg tgacaatcag ccagcaatga gagggagact gaaaaatatg 660

tatttacact caaagaatcc gatactgcta ttaggatcag tgtttttctt ataagcaaat 720

gagcgttgga cgtggaaaat gaggaatcct cagtccctat actcggtcag cgacggaggg 780

gtgcgtgatc ggccaatcac agcctattat tttatcaaca tctgattggc tacttccgat 840

aagagcgaaa tatgcccctc cttgcaattt ttaccatcaa cgctaacagc aacactcaac 900

aaaccattca atcttgatac tcgctcccat tagtcaccac gcaggacaac acaacacgac 960

atcgcatctc agctttgacc attcccgccg caagcgattc gctgtcacaa acgccagata 1020

ccccaacatg gctgcccctc cctccgccga tcaggactac aagaccaatc tgttgtcttt 1080

gctgatagcc aacgatgcgc tcgcatttgg cacgttcaca ttgaaatctg gtcgccagtc 1140

gccgtatttt ttgacctcga gtcgtcttta tactgcgcct ctgctgcgcc aggtgtcggc 1200

cgcgttcgcg aataccatct cgtccccgcc ttttgtgaat atagctgcag atggcagcat 1260

taccccgaac tttgacattg tttttgggta tgttacccta ttattcgtgc gcctgatatg 1320

cgtgtactga tttacttcaa atagccccgc ctacaaagga atccccgaat gcgtcggtgt 1380

tgtcaacgag ctcgctaccc gggatgcgct cgccggtacc aagacatggg acaacatcag 1440

ctactccttc aaccgcaaag aagccaaaga ccacggcgaa gggggtaaca tcgtcggtgc 1500

gcctctcaag ggaaaacgtg ttttgatcgt tgacgacgtc atcaccgctg gtaccgcgct 1560

gcgtgaagct gtcggcatta ttcaaaagga aggcggaacc gttgccggtg ttgtgttgct 1620

gttcgatcgt caggaacggg tcagtgatac ggagcagaag agtgccattg gagccgcgga 1680

gagggacctt ggaggcgata ttcctatccg tgcggtgttg gtattccagg atttgattga 1740

taagcttgga gataagattg gtcaggagga ggtgcgcagg ttggaagagt accggaacac 1800

gtacaaggct caataaatgg ctgctgtggg atgaaatggg tatattaacg atttatgcta 1860

aaaatggctg ggtggaatac tgcgaaataa atataaatca gcttgaagga tgtattttta 1920

gcgcaaagtg atagaatttt ctatgtaaat agtttgtaca ataggattac tactttatat 1980

gcgttatgcg tatacatttc taaagtgtaa ccagtttagc tgggagtaca attttaacac 2040

tcttccatca atcaggttcc agatcagttt tctatctaca atcatgactc cccagtctct 2100

actcctttca agaatgacgc gttatgttcc aagctcccct ggttgatggc ggtaacccga 2160

tatattctag ccaggtcagg tcctagtgtg aggactaaca caggcacgtc cagtatcgta 2220

gcaaatagaa tatcagcata tataagtccc ctttcccgga ccttgctcga gtcagtgact 2280

agcaggtacg tacgtaccca tcagactatc tactatctac tatgtacgga gtatatagtc 2340

ggtacttgac gcaaggcgag tctgatagag ggacaatatg cagttctgta gccaatcaat 2400

cgcggatggc agaccctcga tcgtcattgt ggatctttag cttccttatg ggcggggcgg 2460

tggttatttc agagccattt agccaatcat acatcgtagt ccgaaagtct aggattatat 2520

aggctagacc aatctactgt caaccggtaa agcgggtctc tagtctttat cccgacctcc 2580

tctctttctc tttctccgat tcgaatgtga cacatacatc tgatcaattg ataagaatac 2640

ggattgccgt gtacgtgggc tgacagagct gagataaaat atcctggatg tgatatgtgg 2700

cgcatccagt accgacactg tgacaggatc cgtgtactac aattcattca tcgatcgttg 2760

gctaggcaaa aagtaggcaa ggtttgcaga tcgatatccc ggtacctggc taaaatcgag 2820

acccatctac atatagtact gactcggcgt tcacttat 2858

<210> 38

<211> 1356

<212> DNA

<213> 智人

<400> 38

gaagtccagc tcgtcgagtc tggtggtggc ttggtccaac ccggtggatc cttacgtctc 60

tcttgtgcag ctagcggttt caacatcaag gacacctaca tccattgggt tcgtcaagct 120

cctggcaaag gtttggaatg ggttgcgcgt atctacccta cgaacggtta cacccgttat 180

gccgacagcg ttaagggccg tttcaccatt tctgccgaca cttccaagaa caccgcctac 240

ttgcagatga actccttgag agccgaggat actgccgtct actactgcag ccgttgggga 300

ggtgatgggt tctacgccat ggactactgg ggtcaaggca cccttgttac cgttagctcc 360

gccagcacaa agggtccctc cgtcttccct ttggctccct cctccaagtc tacttccggt 420

ggtaccgctg cactgggttg cttggtcaag gactacttcc ctgagcccgt cactgtcagc 480

tggaattctg gcgcattgac ttctggtgtc cacacttttc ccgctgttct ccaatcttcc 540

ggcttgtaca gcctaagcag cgttgtcact gtgccctctt cctccttggg cactcagacc 600

tacatctgca acgtcaacca caagccctcc aacacgaagg ttgacaagaa ggtggaacct 660

cccaagtcct gcgataagac ccacacctgt cctccctgtc ctgctcctga actgttgggt 720

ggaccctcag tgttcttgtt ccctcccaag cccaaggaca ctctcatgat cagccgtact 780

cctgaggtta catgcgtcgt cgtcgatgtc tcccatgagg atcctgaggt caagttcaac 840

tggtacgtcg acggtgtcga ggtccacaat gccaagacca agcctcgtga agaacagtac 900

aactccacct accgcgttgt ttcagtcttg accgtgttgc accaggattg gctgaacggc 960

aaggagtaca agtgcaaggt ctccaacaag gccctgcctg ctcccatcga gaaaaccatc 1020

agtaaggcca aaggtcaacc tcgcgaaccc caggtttaca ccctccctcc ttctcgggac 1080

gaactcacca agaaccaggt ctcgttgact tgccttgtta agggattcta ccctagcgat 1140

attgccgttg agtgggagtc caatggtcag cccgagaaca actacaagac tacccctcct 1200

gttctcgact ctgacggatc tttcttcctc tacagcaagt tgaccgtcga caaaagccgt 1260

tggcagcaag gcaacgtttt ctcctgctct gtcatgcacg aggctctcca caaccactac 1320

acacagaagt ctctgtcctt gtctcctggt aaataa 1356

<210> 39

<211> 1680

<212> DNA

<213> Talaromyces cellulolyticus

<400> 39

attttcactt ctttcttcgc ctattgattg ggctatgaca aaattaggag agataggttg 60

gacgttgtca agtcaaaatg taccgaacac gatgcgttga tatgctgcac atgtgcctag 120

tatccattcg ttcctattta tattaaattg aaattttctt atccaattac tgagctaaaa 180

catacttcag cactgtaagc gccagcctaa gttatgctat gttagactgt ccggattcgg 240

ctggcactgg cttttgtgat ccccagtatc atgtaaaggt atccgcctgt ttgttagggg 300

gtcttaaatg ttgtataaag tttcttgcta ggctgtttat gcttgataga gaatatatat 360

atatatctag ctgctattaa tatccttgtt tcaatgtctt agacttccaa ggttacctac 420

ccgcgtgcgt ggactaatac aaacaatctc actcaagaca atcttataca aactcggatt 480

ctggtcaatc cgttccttgg ttatattgct aaaaaaacta ggtagcccaa aattccatct 540

caagccgtat aagaactttc aaattcacca tggtactctc acgggcgaag catctccgtc 600

ttccatctgc caaaatccat taccaaaatc ggaagtaccc gaatgtagca aatgaacaat 660

aactttcgca ccatctagcg gatcctttgt gccacgatag ttgttgaacg cagttttgca 720

atacccagga ctaactgctt ggatgataac actctcattc gccgggtctt tcccatattc 780

gaccgtgagc atgttaaggg ccgtctttga ggcgcagtac gcgatagtaa cagttggagg 840

cagcttgcca gatgatgata ggcccaaaga accccgtgtg gatgatacgt ttattatgtg 900

gcctcgaggc gactgacgca aaagtggtag gaatagatct atggtcattg cgaccgatgt 960

gacattcaca tcaaaagttc ggttgtaagt agaccgcatt tcggaaaatg aagtctgggt 1020

gaaggcaacg gcagcattgt ttatcagaac tagacatctg ttagagaatt tctaaagccc 1080

gctcactcga gaatgaaata ggcttaccat ccagtctacc atatgttgtc tcgaccgcct 1140

tagcaaaagc aatgaggcta tcgtcgcgag tcacatcaac ctccataacg tcgatcttgg 1200

attgaacagc gagctctctc aaccgcttaa gtgcctgatt tccgtcttcc ttattccggc 1260

atcctaagat gaagtgatcg gatggactat gcagacttaa agcctggagg gtaccaaacc 1320

cgatgcctga caattattag tgatcatata gaatgagtat catggccatc gcaaatctac 1380

ctctgtttgc tccagttata agaattagcc ttgatgacat cttgtgagag aagtaaaaga 1440

taatagcaga tgaatttcga tcgtatactg gttgtattgg caatcttgac gagaatggtt 1500

tcattgtcag accatcagtt ccctttatat acctgccatt ctctccttta taaataatta 1560

ttcggtttta acacggagat actcggattt catcacacaa attgcatttc ttccgatagt 1620

tgttgaagat cggaagtcct tcgaatgatc atttctataa ctacgcctta ccgttttcgg 1680

<210> 40

<211> 645

<212> DNA

<213> 智人

<400> 40

gacatccaga tgacacagtc cccttctagc ctttctgcct ctgttggaga tcgtgtcacc 60

atcacttgtc gtgcttctca agacgtcaac acagccgttg cctggtatca gcagaaaccc 120

ggcaaagctc ccaagttgct gatctacagc gctagcttcc tgtacagcgg tgtcccttct 180

cgcttctcag gttcccgttc tggtaccgac ttcaccttga ccatttccag cttgcaaccc 240

gaggatttcg ccacgtacta ctgccagcaa cactacacca ctcctcccac ctttggccaa 300

ggtaccaagg tcgagatcaa gcggactgtt gccgcacctt ccgtcttcat cttccctccc 360

tcggatgagc agctcaagtc tggaactgcg tctgtcgttt gcttgctcaa caacttctac 420

cctcgtgaag ccaaggtcca gtggaaggtc gacaacgctt tgcagtccgg caatagccaa 480

gagtccgtta ccgaacagga cagcaaggac tccacttact ccttgagttc cactctcacc 540

ttgtccaagg ccgattacga gaagcacaag gtctacgctt gcgaagtgac ccatcaaggt 600

ctctctagcc ctgttactaa gtccttcaac cgtggtgagt gttag 645

<210> 41

<211> 1354

<212> DNA

<213> Talaromyces cellulolyticus

<400> 41

ctcgtgaaag ctgccctcac aatgatcgtc aagatgacgt agtttgactg ggtcgttcct 60

ggataagggt tagggtaaat agggctcaaa gtaccacgtg agtgtggaaa gataagccct 120

aaccctaagg tcgtgtcgga caaaaattat cacttgacca aaattggaga tccccttaat 180

ggagcttttt ggtaatggtt tgtatagggt tatgtgacgt ccgtatcaca tgatttttat 240

cccaacaggt cgatccccct cttatagtta atggacaaca tataagtacg tagcatctta 300

gatagttcgt cagcgtcaac tgaccaaagt ccccgtgttt cattttaatt tgtcagactg 360

caagagtctc gaaacataaa aagatcgaaa gttttgcctt attaggctat gagcatgaat 420

gtcggaacaa tgccgttgag gctattccca atttcggaaa tatgtatctt cattgctgtc 480

gacttgacga cagtcgataa aaggctcatc cggatagata agccagatca ctcattatgc 540

caatttctcc ggtgtctgaa aacgtatact acatacgtaa ctgatcttcg tggttgaaag 600

agtgtttctt ctcattctca tctgccgatg ccgagccaat tggaacaaac cccgcatatg 660

gtcctgaata tcaatcgcgg agatgcggag agtgagggag caacacaatt ttaaattagt 720

cagttttctc atgttctccg caatcttgca ggcttgggtc tggtaggttt atctctctct 780

tttcacaaca aggttgggcc attgtcagct tagcaagcgc gcagcaaagg gtgtcggtca 840

atgttcatgt cctccgcggt cactacaaaa cagcacgtgg ggaatgttgc tttccctgtt 900

gatgttcatg tgttgtcatt cccggcaaat cgactccaat taatatggta ggctcctgca 960

taatgcaagt ccttgagatg cagcttccgg cagatggacg tatagatcag ggactttgag 1020

gggctaaaac acttacccga gctaaaacat accataattt cgtttaatga ctttcgtctg 1080

gatggcagag gctgaaggtc gattatgagt gaaattggta tgaagccaca tacgccgata 1140

ctgtaacgct gtgccttcat ccgccttcta tcgcgccccg acattccgcg gtaccgcgat 1200

tatgaagaaa aacactcgta atgatgagga gatagttctt agctcttatt atttttgtct 1260

agctatggaa tgcaagttta gcactatata atggtggtgt ttcccttgaa gaattaggca 1320

ctatcaaccg caacagtcag aagcaatcga caca 1354

<210> 42

<211> 26

<212> PRT

<213> Talaromyces cellulolyticus

<400> 42

Met Ser Ala Leu Asn Ser Phe Asn Met Tyr Lys Ser Ala Leu Ile Leu

1 5 10 15

Gly Ser Leu Leu Ala Thr Ala Gly Ala Gln

20 25

<210> 43

<211> 490

<212> PRT

<213> Talaromyces cellulolyticus

<400> 43

Met Lys Gly Val Leu Ser Leu Ser Leu Leu Pro Leu Leu Thr Val Ala

1 5 10 15

Ser Pro Val Met Pro Arg Thr Ile His Asn Asp Ala Ala Pro Ile Leu

20 25 30

Ser Ser Ser Asn Ala Val Glu Val Pro Asp Ser Tyr Ile Ile Val Phe

35 40 45

Lys Asp His Val Asp Ser Ala Ser Ala Ala Ala His His Asn Trp Val

50 55 60

Gln Asp Ile His Ser Gln His Thr Glu Leu Arg Lys Arg Ser Gln Phe

65 70 75 80

Pro Phe Ala Asp Asn Ala Phe Ala Gly Leu Lys His Thr Phe Asp Ile

85 90 95

Ala Gly Ser Phe Leu Gly Tyr Ser Gly His Phe Glu Glu Asn Val Ile

100 105 110

Glu Ala Ile Arg Arg His Pro Asp Val Asp Tyr Ile Glu Lys Asp Ser

115 120 125

Leu Val His Thr Met Glu Asp Pro Ala Leu Glu Lys Asn Ala Pro Trp

130 135 140

Gly Leu Ala Arg Ile Ser His Arg Glu Ser Leu Ser Phe Gly Ser Phe

145 150 155 160

Asn Lys Tyr Leu Tyr Ala Ala Asp Gly Gly Glu Gly Val Asp Val Tyr

165 170 175

Val Ile Asp Thr Gly Thr Asn Ile Asp His Val Asp Phe Glu Gly Arg

180 185 190

Ala Ser Trp Gly Lys Thr Ile Pro Thr Asp Asp Glu Asp Val Asp Gly

195 200 205

Asn Gly His Gly Thr His Cys Ser Gly Thr Ile Ala Gly Lys Lys Tyr

210 215 220

Gly Val Ala Lys Lys Ala Asn Val Tyr Ala Val Lys Val Leu Lys Ser

225 230 235 240

Asn Gly Ser Gly Thr Met Ser Asp Val Val Gln Gly Val Glu Trp Ala

245 250 255

Ala Thr Gln His Ile Lys Lys Val Lys Asp Ala Lys Ala Gly Lys Ala

260 265 270

Lys Gly Phe Lys Gly Ser Ala Ala Asn Met Ser Leu Gly Gly Gly Lys

275 280 285

Ser Val Thr Leu Asp Lys Ala Val Asn Ala Ala Val Asp Ala Gly Ile

290 295 300

His Phe Ala Val Ala Ala Gly Asn Asp Asn Ala Asp Ser Cys Asn Tyr

305 310 315 320

Ser Pro Ala Ala Ala Glu Lys Ala Val Thr Val Gly Ala Ser Thr Leu

325 330 335

Ala Asp Glu Arg Ala Tyr Phe Ser Asn Tyr Gly Lys Cys Asn Asp Ile

340 345 350

Phe Ala Pro Gly Leu Asn Ile Leu Ser Thr Trp Ile Gly Ser Lys Tyr

355 360 365

Ala Val Asn Thr Ile Ser Gly Thr Ser Met Ala Ser Pro His Ile Ala

370 375 380

Gly Leu Leu Ala Tyr Phe Leu Ser Leu Gln Pro Ala Ser Asp Ser Ala

385 390 395 400

Phe Ala Val Ala Glu Ile Thr Pro Lys Lys Leu Lys Glu Asn Leu Ile

405 410 415

Ala Ile Gly Thr Gln Gly Ala Leu Thr Asp Val Pro Ser Asp Thr Thr

420 425 430

Asn Ile Leu Ala Trp Asn Gly Gly Gly Ser Ala Asn Tyr Thr Asp Ile

435 440 445

Ile Ala Gln Gly Gly Tyr Lys Thr Lys Thr Leu Ser Asn Glu Val Asp

450 455 460

Glu Leu Ile Asn Lys Leu Glu Val Val Asn Glu Glu Leu Gly Ala Ile

465 470 475 480

Tyr Ser His Ile Lys Asp Ala Ile Ala Ala

485 490

<210> 44

<211> 4509

<212> DNA

<213> Talaromyces cellulolyticus

<400> 44

atgtcgagaa gaatacggaa ccctgattcc gcaggctcga gtcaaaccct aagtaattca 60

ccggtaccaa tagccgccga atccggcacg gaacctgtgt acctaggtcc gtatcgaata 120

gcgaagtttt ccgtctattc ttcgaatttt gtatacatgc ttaccttggc tcaaaggtac 180

tcacaaagtc cgaagaataa attatagaac cgatgtgaaa cggggacagt ttggcaaccc 240

cttgtactat gtacattgta tggatctcgt ctcgactctc gagacgaggg tttcgtacca 300

accaaagact caaaacttgg ggtaactaag cgatcggctg cgtagtactc catactccat 360

aaataccccg gtgaattcgc ctcttgccca tggaatgagc gagaatttac ccttggagtc 420

atcgcggtaa atgactcaca tatcatgtct gccttcactc tcctcaacct ttgaaattcc 480

ggttaatgtt aaggcgaggt gtcctctacg gaatggcttt gtagatttga gataagacta 540

cgccgtaact taagggatcc acatactcca tattgatagt ctcaggaccg agatagtctg 600

gagtaacccc gtacccaatc aacgtcctca gactcgccac ctggttacaa tatttcggtg 660

cttgtgccga tatacctccg ttgcgtgagc cttgatagcc aacaagaaat gattcaaaat 720

taagatttga gaaaatccgg agtacgcagt gcctgcagtg taaaaaataa tgtatttacc 780

taatgccaat atgtcgatgc caaagtacta ctagcaaaga cactagatat gcagcaaact 840

cgatgtttag gtacatgtaa ccatatcctg gggtcaggta cgaacgccat caattaatct 900

cgtaaactag ctgtcacacg acagtatcat ttgatagttc caatgttcca tgctccccct 960

caaatgtcac tggatgatac gaatttggct gtgacttgaa cagatagacg gaaaacagtc 1020

cgatcattat ccggagtacg catgtacgag atagtctggg gatcctcggc tgccccgatt 1080

ggggttagtg cgggtttcct tatcttgata cgccgtctgg aggcgcaggt gattgttacg 1140

gtgtgttccg tgatagataa gttagacatc cgataataac ctatcttcta gatagacggc 1200

aggtacgtat gtagatagat agatgacaca gtcataagac agttttattt accatacata 1260

gtatagtcat ttgacaaaca cttgatgact atgagcagta agtccagaca agagcataga 1320

ctagaaatga tgtgatcatc aataggtacg gagtcgtacc acccccggat tatcttggct 1380

ggcttagtca cgcccaaaca gacggtgacg gatgagacac aagcaaagag cgacattccg 1440

aagaattctc gtgacggaaa cgagaatgcc gccggcgctg atagggggaa attttatctt 1500

ttccctttct gacattcagt gtttacaata caatacggaa ttacggaacc ccggttttcg 1560

caaccggtgg aattacctaa tgggtgacct gaatttatta gataacgatg aacaatttgt 1620

tggatcttcc gtagatcgat ttggacttga taggtgcttc caaggttgtt gctgctcaca 1680

tggtcgcttg cgttatctgc ctacagaatg aggaagatgt attccgcacg tactccggtc 1740

gcgacagata tgcgacgatt gcaatatgta ctacatagtt agtacataca actctagact 1800

agactctata ttatgtagag tgtaagagaa aaagaaagaa gataacggca gggtctattt 1860

gattgcgcta taatatgcgc cgctgtatgg ttccccagat ctgcgtgaga tatcacctca 1920

tcctatcatc attccaggtc aaagtctcgt catcatgaat tggtattatt acccagtacg 1980

taaaccacgt atcgaggcgt atcggtgtat taaagataga gctactgcat tggctctagt 2040

cctatctttg ccccggaatc cggcccgtgg atgacgatat gatgctgttt gtccttcagc 2100

taaacacgga cgatctctta cagggtgcgg ttaattatta aggatataat tctaatcaac 2160

gactctggct gtgctatatt aacaatgtct tctaagtggt catgatgtgt acgtacttcg 2220

tacacatgct acatgcaatc gagtacgtaa ctccagatct gcgccgtacc cgcgataccc 2280

gggccatcat gcaaatgtaa ccgcttggaa cacgcactgc agtgcataaa agccacagcc 2340

tcgcttccca atccggttta gacgcgtttt gtcttgctgt tttgggagca gccagacccc 2400

acattccact aacccactct ttttcagcgc ttattctcgt aagattcgta cgaaaaatac 2460

atctgcccac actatccacc agctcggcca ctcttcggtg agaacgctgc catgagaaaa 2520

aaatctgcga ctctgcaaca gagtgaggca cggctgaacc gagctgattg tcaccctttg 2580

cccaatgccc agacagccca gacagcccag acagcccaga cagcccagac agcccagaca 2640

gcccagacag ccagtgcttg gttaattttt actaagggta aaaacctaaa aaaaagaaac 2700

gaaaaaaaaa aaaaaaaact tttctttttt gccccccaat cacttggccg acagtcaaag 2760

ggttccccca cacggtactc cgtacttgct acgtacacta actaaagaaa aaatctcctg 2820

attgagtctg tgtctgtctg tcgctgctaa actcggataa ccccccgttc ccgatcaccc 2880

gtcgaaaaga gcagcagcca tttaacattt ttcccctcca ttcctccttc ttggaacttt 2940

ccctccctcc ctcatcctta catctccctg cgtgcgcgcc tgcctgccta cttacactgc 3000

cactccccag attttctttc tcttgtttct tctccagact ttctttcctc ctccacctcg 3060

cctcaccaca ccaccaccac cactcaccac gccaacaaca ccgcactacc actactgctt 3120

caaagatcga tcaggccatt atcaaggagg atcgacgtct tattccatcg accaccctgt 3180

tgatcacctc ggctggagcg ctcgactccc tggcttcctt ccccagctta tttaaacccg 3240

tcacccgcca ggtctcttca catgtcaccg tcatcttcgt cagtgggttt ttccaatctg 3300

ctgaacccac agtcagactc tgtcgagcct acggataaca catcttcacc tgctaccacc 3360

actaccaccg gcacagactc caactcagac aaggaaatgg cgtcctctgt cagtctgctc 3420

ccaccactca tgaagggtgc ccgccccgcc gcggaggaag tgcgacagga cctccctcgt 3480

ccatacaagt gtcctctttg cgatcgtgct ttccatcgtc tagagcacca aactcgtcac 3540

attcgtactc acaccggcga gaaaccccat gcctgccagt ttccaggctg cacgaaacgg 3600

ttcagtcgtt cagatgaatt gactcgtcac tcgcgcattc acaacaaccc caactcgaga 3660

agaagtaaca aagctcagca tattgctgcg gctgcggcgg ccggtcagga ttcgggtatg 3720

cttaacgctg ctgcctcgat gatgcctcct ccaagcaaac ccattactcg ctcggctcca 3780

gtgtctcagg tcggatctcc ggatgtgtct cctccgcact cttacaccaa ctacacctcg 3840

catttgcggg cgggtctggg tccttattca cgcaacagcg accgtgcttc atctggtatg 3900

gatattaatt tgctcgcgac tgctgcttca caagtcgagc gcgatcacta cggaggctcg 3960

tctcgtcatt accctttcag ctctcgatac tcgggtactc ctggacgtct accgtcgctt 4020

tccgcctatg ccatttctca gagcatgagc cggtcgcatt ctcacgagga tgaggacaac 4080

tacggacatc accgggttaa gcgctctcgt cctaactcac caaactcgac tgcgccatcc 4140

tcgcctacat tctctcacga ttcattgtcg cctacccccg atcacactcc tcttgcaacc 4200

ccagcacact cgcctcgttt gcgtccttat ggagccgcag atttgcaatt accttccatc 4260

cgtcatttgt cgttacacca cactcccgca ctcgcaccaa tggagcctca agccgaggga 4320

cctaatgttt acaaccccgg tcagcaccac ggtggaccca gcatcacgga catcatgagc 4380

aggcccgacg gcacccagcg taagcttcct gttccgcaag tacccaaaat cccggtgcag 4440

gacatgttgg caccgaacgg atattcctcc aacactccgt ccgtcaacgg ttccgtgatg 4500

gagttataa 4509

<210> 45

<211> 1323

<212> DNA

<213> 智人

<400> 45

caggttcagc tcgttgaaag cggtggtggt gtcgttcaac ccggtcgttc cttgcgtctg 60

gactgcaagg ctagcggtat caccttctct aactctggta tgcattgggt ccgtcaagcc 120

cctggtaagg gccttgagtg ggttgccgtc atttggtacg atggctccaa acgctactat 180

gccgatagcg ttaaaggtcg tttcactatc agccgtgaca actctaagaa caccctcttc 240

ctccagatga actctttgcg tgccgaggat actgcagtct actactgcgc cactaacgac 300

gactactggg gtcagggtac actcgttacg gtcagctctg ccagtacgaa gggtccctcc 360

gtctttccct tggctccctg ttcccgctca acctccgaga gcactgcggc tttgggttgc 420

ttggtgaagg actactttcc cgaacctgtg accgtttcct ggaattccgg tgctttgacc 480

tctggtgtcc acactttccc tgctgttttg cagtctagcg gactctacag cttgtccagc 540

gtcgtcaccg ttccttcctc tagcttgggg accaagacct acacctgcaa cgtcgaccac 600

aagccttcca acacaaaggt tgacaaacgt gtcgagtcca agtacggacc tccttgtccc 660

ccttgtcccg cacctgagtt cttgggaggt ccttctgtgt tcctcttccc tcctaagccc 720

aaagacacct tgatgatctc tcggactcct gaggttactt gcgtcgtcgt tgacgtctct 780

caggaagatc ctgaggtcca gttcaattgg tacgttgatg gcgtcgaggt tcacaacgcc 840

aagactaaac cccgtgaaga gcagttcaac tccacctacc gtgtcgtctc agtcctcacc 900

gtcttgcacc aagactggtt gaacggcaag gagtacaagt gcaaggtcag caacaagggc 960

ttgccttctt ccatcgaaaa gaccatcagc aaggctaagg gccaacctcg tgagccccag 1020

gtgtacactt tacctccctc tcaagaagag atgaccaaga accaggtttc cttgacctgc 1080

ctcgtcaagg gattctaccc ctctgatatt gccgtcgaat gggagtccaa tggccaaccc 1140

gagaacaact acaagacaac tccccctgtt ctggactccg atggtagctt cttcctctac 1200

tcgagactga ccgtcgacaa gtcccgttgg caggaaggca acgttttctc ctgctccgtc 1260

atgcacgaag ccctgcataa ccactacacc caaaagagcc tatccttgtc tcttggtaag 1320

taa 1323

<210> 46

<211> 645

<212> DNA

<213> 智人

<400> 46

gaaatcgtcc tcactcagtc ccctgcaacc cttagcttgt ctcccggaga acgtgccact 60

ctcagctgtc gtgccagtca atccgtttcc agctacttgg cttggtacca gcagaaacct 120

ggtcaagcac ctcgtttgct catctacgat gcctccaatc gtgctacagg tattcccgct 180

cgtttctctg gctcaggtag cggtaccgac ttcaccttga ccatcagctc cttagagcct 240

gaggactttg ccgtctacta ctgccaacag tcctctaact ggcctcgcac tttcggtcaa 300

ggcacgaagg tcgagatcaa gcggactgtt gctgctcctt ccgtcttcat cttccccccc 360

tctgatgagc agctgaagtc cggaactgcg tctgtcgtct gtctgctcaa caacttctat 420

ccccgtgaag ccaaggttca gtggaaggtc gacaacgcct tgcagtctgg taactctcag 480

gagagcgtta ccgagcaaga ctccaaggat agcacctact ctttgtcctc cactttgacc 540

ctcagcaaag ccgactacga gaagcacaag gtctacgctt gcgaagttac ccaccaaggc 600

ttgtcttccc ctgtgaccaa gtcgttcaac cgtggtgaat gctag 645

<210> 47

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 47

caggttcagc tcgttgaaag cggtg 25

<210> 48

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 48

agaagtgaaa atttacttac caagagacaa ggatagg 37

<210> 49

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 49

gaaatcgtcc tcactcagtc ccctg 25

<210> 50

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 50

ctcaaagctg atctagcatt caccacggtt gaacgac 37

<210> 51

<211> 507

<212> DNA

<213> 智人

<400> 51

tgcaacgaca tgacccctga gcaaatggct acgaatgtca actgttcctc tcctgaacgt 60

catacccgtt cctacgacta catggaaggt ggagatatcc gtgtgagacg tctgttctgt 120

cgcactcaat ggtacttgcg catcgataag cgtggcaaag tcaagggtac acaggagatg 180

aagaacaact acaacatcat ggaaatccgg actgttgcag tcggaatcgt tgccatcaag 240

ggtgtcgaaa gcgagttcta cttggccatg aacaaggaag gcaagttgta cgccaagaaa 300

gagtgcaacg aagactgcaa cttcaaggag ctcatcctcg agaaccacta caacacctat 360

gcttctgcga aatggaccca caatggtggt gagatgtttg tcgccttgaa ccagaagggt 420

attcccgttc gtggcaagaa gaccaagaag gagcagaaga ctgctcactt ccttcccatg 480

gccattaccc accaccatca ccatcac 507

<210> 52

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 52

acagctggtg ctcagtgcaa cgacatgacc cctgagcaaa 40

<210> 53

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 53

ctcaaagctg atctagtgat ggtgatggtg gtgggtaatg 40

<210> 54

<211> 513

<212> DNA

<213> 智人

<400> 54

gcccctatgg cagaaggagg tggtcagaat caccacgaag tggtcaagtt catggacgtc 60

taccaacgct cctactgcca tcccattgag acactcgtcg acatcttcca ggagtacccc 120

gatgagatcg agtacatctt caagcctagc tgcgttccct tgatgcgttg tggtggctgt 180

tgcaacgacg aaggcttgga gtgcgttcct actgaggagt ccaacatcac catgcagatc 240

atgcggatta agcctcatca gggtcaacac atcggcgaaa tgagctttct ccagcacaac 300

aagtgcgaat gtcgtcccaa gaaggacaga gctcgtcaag agaacccttg cggtccttgc 360

tctgaacgcc gtaagcacct gttcgtccaa gatccccaga cctgcaagtg ttcctgcaag 420

aacaccgatt ctcgctgtaa agcccgtcag ttggagctta acgagcgtac ttgccgttgc 480

gacaaacctc gtcgtcacca ccatcaccat cac 513

<210> 55

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 55

acagctggtg ctcaggcccc tatggcagaa ggaggtggtc 40

<210> 56

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 56

ctcaaagctg atctagtgat ggtgatggtg gtgacgacga 40

<210> 57

<211> 1587

<212> DNA

<213> Talaromyces cellulolyticus

<400> 57

atgcgtatgt cagcttcgtt accgctcatc gtcttgtcga tggtgtcggc cagcaatgcg 60

ctctctcttc atagacgtga tgagccagca gttctagcag caccgttaca acgcagacat 120

gtggatggga ttttgggcaa aagagatacg tcgccagttg atgtatcgat cttcaatcac 180

gtacgtacga ggatttcgaa tgcaatattt cctgggacct aacgactgca tagcaaaata 240

caagctactg gctgaacttg actctgggat cacctgcgca gaatttcaca ctcgccttgg 300

acacgggcag cagcgatcta tgggttattg agggatcgaa aaaggcagct aatgtttacg 360

tctcggatga ttcgtcctct ttcaaatctc tggatcttcc atacaacgca acatacgcgg 420

atggcaccac ggctctcggt gtctacgcga ctgacatatt gagcttggga ggtgcaactg 480

tcaaggactt tgagtttatt gttgtgaacc aaacttcatc tgatggtgag atctgacctt 540

atgaaaatat cattgtatct tctgcaaact ttagtggcgt gtgcattcat tctaattcat 600

gattgattgt atacagtggg cattgccggt gtcggctaca acatctcaac atatgcatct 660

tcaggcctga acaaaacata caacaaccta ccttatgcct tggctgccag cggcgtcacc 720

aaatctgctg cttacagcct gtggatggac gatgccgcag caacttcagg cacgattatg 780

tttggtggtg tcaacaaggc aaagtacatc ggtgaactcc aaactctccc agtcgtgcca 840

gtctataaca ggtattactc acttgcactc gccttgaccg aagtcactgt gcaaactggg 900

gactccaaga gtactacgac gaaccttccg ctcgcagttt ctctggatac gggctcaact 960

tccactttgc tgccccaaga cctttttaat gacattctcg gcgctctgaa tggaacctac 1020

gacgagaaga gcggcttcgc ctatgtgagc tgcgacctca tagaaaccga ttacaatgtg 1080

acattcagtt tctctggagc taagatcgac gtgggtctta gtcaactggt atttttcggg 1140

gccgtggctg ggtggcccaa gaacagctgt gttattgatc ttactcccag cgaacctgga 1200

gtgaacatcc ttggagacag tttcctgcgc agtgcgtacg tcgtctatga ccttgagaac 1260

aatgaaattt cccttgccaa caccaacttc aaccccggta aggacgacat tctggaaatc 1320

ggtaccggcg ccgatggggt gccaggtgcc actcttgttc cctcggctgt ctctactgct 1380

acaggaaacg gcgttcagac agcgactacc ggtgtggtgg gtgctaccgg ggtcactgtc 1440

accgctggta ctactgctac cggcagcgca agcaccggcg gttctgcaaa atctactggc 1500

acatcttctg gcatggcagc gttgcccacc ggcaatgcca aacttctttc tggtctggca 1560

ggcgctggtc ttctccttat gatctaa 1587

<210> 58

<211> 2025

<212> DNA

<213> Talaromyces cellulolyticus

<400> 58

atggaactgt ccccgccggg cttagcgccg aacaggtatc gcatcaccat cggaccaagg 60

taactcccag tcgtgtggcc atccacccat ctgccccaac ttcatctctt catcttcatc 120

ttcatctcat tccggattcc cccagagagg tgtactgtat ctgggataca ctgttcaagg 180

ctttgtgtgc atcagacaca acaattatct tgtaagttgg ttcgtctctg actctccagc 240

tatcgttgag tcaccactga tactgataac gacgtcatct ccagattcga ctgctcgagc 300

catcaacatg aaaggtttgg ctaccacgct cctcgtaggg gctgcggctg ctttttctcc 360

tgctcagcag gtgcttaaag ccccagagga cgttgttgag aacacccaca aggcctcctc 420

tccctctcta gccgagacgc tcgcccagcc tctccatgag ctcaatgaag agctcaagtc 480

gttcactcac gaagccgagg aggtctggga acaagtctca aacatgttcc caggtgctct 540

agataacatc cctttcttct cctcacccaa gaagcacact cgtcgccctg actcacactg 600

ggaccacatc gttcgtggtg ccgacgtcca gaacatctgg gttgagaacg ccaatggcga 660

gaaggaacgt gaagtcggtg gtaggctcga ggcctttgac cttcgtgtca agtctgttga 720

ccccagctcg cttggaatcg atcccgatgt caagcagtac agtgggtacc ttgacgacaa 780

cgagaatgat aagcatttgt tttactgtat gtgcacactt ctatctatcg aaagtatcac 840

tgataactaa caattatagg gttctttgag tcccgaaatg accccaagac tgaccctgtc 900

gtcctctggt tgaacggtgg accaggatgc tcgtccttga ccggtctttt cttcgagctc 960

ggacccagct ctatcggcaa gaacatcaag cccatctaca acccctactc ctggaactcc 1020

aacgcctctg ttatcttcct tgaccagccc gtcaatgtcg gtttctccta cagcggtaac 1080

tccgtcagtg agacgagcgc tgctgcaaag gatgtctatg ctcttcttac tcttttcttc 1140

aagcaattcc ccgaatatgc cactcaggat ttccacattg caggtgaatc ctacgccggc 1200

cactacattc cttcatttgc ctctgagatc ctttctcaca agaagcgcaa catcaacctg 1260

aagtctgttt tgatcggaaa cggtcttact gatggtctca ctcagtacga atactaccgc 1320

cccatggctt gcggtgatgg tggttatcct gctgttctcg atgagagcac ttgccgctcc 1380

atggacaacg ctctcggtcg ctgccagtcc atgattcaat cctgctacga cagtgaaagt 1440

gcttggacct gtgttcctgc ttctatctac tgcaacaacg cccttttggg tccctaccag 1500

cgcactggcc agaatgtata tgatgtccgc aagccttgcg agggcggcaa cctctgctac 1560

actgatctcg aatacatcag cacctatctc aaccaggctg aggtcttgaa ggctgtcgga 1620

gccgaagttg acaacttcga ctcttgcaac tttgacatta accgcaactt ccttttcaag 1680

ggtgactgga tgaaaccatt ccacaagctt gtccctggaa tccttgagga aatccctgtt 1740

ctcatctacg ctggtgacgc cgacttcatc tgcaactggc tgggcaacaa ggcctggtct 1800

gatgctcttg agtggagcgg ccacgaagaa tacgccgcta ctgagcttga agatctcgag 1860

atcgttgaca acaagcacaa gggcaagaag attggtcagg tcaagtcctc tggtaatctc 1920

accttcatgc gcctatttgg cggtggccac atggttccct atgaccagcc cgaggccagt 1980

ctcgagttct tcaaccgctg gatcggtggt gagtggactc agtaa 2025

<210> 59

<211> 1657

<212> DNA

<213> Talaromyces cellulolyticus

<400> 59

atgtcgctac gcagctgcgc cctgctgggt ctagctgcca gcgcccttgc cgctgagccc 60

aaggtgctgc acatgccaat ggcccgcaac ccaaatgcca accctctcgc caaacgagac 120

tctgcctccg tcaccgtcac aaatgccctg agcgagggta tctactttgt gaacgctaca 180

gttggaacac ccggtcagct ggtgcagttg gtcttggata ctggaagcag tgatgtgtgg 240

ttcttcggtc cgaattcgtg cgacgcgaaa acctctgatt gtctgggtgg aacatgtatg 300

ttttctcctt attctcctta cattccgatg ccatgtggtt ggcacgtgga tgtgcaaatc 360

gtttctgtac taatagttga taatagatga cccctcccaa tcttcgagcg tcttaatctc 420

ccaacctaaa ggccaatttt tcattcaata cggcacaccc ggctcgaatg tcactggtaa 480

ctacatcaaa gacgctttca gcgttggcga agccaaagtc acaaacctca ccatggctta 540

tgctacctac gcggcatacg ttcctaccgg tgtgatgggt attggattcg acaccaacga 600

ggccatcaca gcatatggtg gcaagcccta cccgaatttc gtcgatgttc tcaagtcgga 660

gaacgtcatt agcaccaagg catacagtct gtggttgaac gatctcgagt caagcaccgg 720

aagctgtttg tttggtggat acgataccaa gaaattctcc ggcaacctct tggctgtgcc 780

cattcaaccc gacgagtcgt ctggtgaatt gaccagtatg actgtcgcat ggactgcgct 840

tggtattacg acccaatctg gatcgcaaac aatcacttcc tcgtccttca agtcgcctgc 900

gttgctcgac tccggtacca cattgagtat catacctgat gatatctatg aatcattagt 960

cacgttcttc gatgccacac tagaccaagc aggtgatgca attgtcaaat gcaacctact 1020

cgatgactcg ggcactcttg actttacatt tggcggatcc gacggtccag ttatcaaggt 1080

tcctttctcg gagtttgcgc tacctgcaac taccaccaac ggccagcagg ccaccttcaa 1140

cgatggctcg ttggcttgtt atcttggtct tcaaggaaca ggctcggacc cgacatcaca 1200

ggtccccgtc attctcggcg acactttcct tcgctctgcc tatgttgtgt acgatctcga 1260

caacaagcaa atctctctcg cgcaaaccgt cttcaacgcg acagacagca acgtcgttga 1320

aattacgtct gccagccctg ttgccagtgt cgtgagtggc gtcacagtca cccagactgc 1380

ctctggcaac cccaacgagc tcggtgggcc tactgctact gccgacccga ccggttcagg 1440

cagctcgatc ggttcaggca gttcaggcgg ttctgatctt tccggcagca gcctcaccgt 1500

ctctcttacc cctgccacgg caaccggctc tgcatcgtca tcaacttctt ctcacaaatc 1560

gtcggctaac cccgctcctg ggccagactt tatgagcact gcccttattg ctggagcgtc 1620

tatgttgctg ggaggtgttt tcttcgtcct tcattag 1657

<210> 60

<211> 1053

<212> DNA

<213> Talaromyces cellulolyticus

<400> 60

atgtgtcaat tcatttccca ttatatactt caaaaagttg ctgagtcacc tgaagtgtct 60

cagcatgcac gagaatcagc agcgaggacg ctgagtatcg acacagaggt acgaaataga 120

aggcccgatc tgcatgctgc aatcgttcag aatcccaacc tcggcaactt gcagtcagtg 180

actgcaagct cgggccgcga acaaccaagt atctcagtgt acgactgtag aaacagctcc 240

aaacttccag gagtccgggt ccgaagcgat gaccagagag tcagagatcg agtcgtcaat 300

aatgcatttg acggcttaca gattgcagac aagttttata gcgatgtttt cgcatacaaa 360

gtccctgatg gttcatggaa tgctcttact ggctcagttc attttcgcga gaactacaac 420

aatgctatgt gggatggaca gcagatgatt tttggtgacg gagacggaga aattttcgat 480

tactttgctg attcactaga cgtaatcgtc cacgaaatta cccatggagt tacccaatac 540

acagcaaatc tgcagtacga aggccaaagc ggagcgttga atgaatctat atcagatgtt 600

tttgcatgta tggccgagca atggtatctt gaccagacag ctgaggatgg ggattggttg 660

ttaggccaaa atctgttccc tgttgcacga aagggatccg cgctgcgttc actaaagaag 720

cccggcacag cttacaacaa tgacaaaatc ctcggcaaag atccccaacc tggccatatg 780

cgtgattata acaacacacg tgacgacaac ggtggtgtac atctcaattc cggcatccca 840

aatcatgcat tttatctcgt tgccactact cttggagggc gttcgtggga tcaagccggt 900

catatatggt tcaaaacttt gaccgactcc cggctcaggc ctacagctac tttcagtgcc 960

tttgctggat tgactgtgga taatgcacag agactttacg gtaacaatgt gggtcaagca 1020

gtaaagaaag cgtgggaagg ggttggtgtc tga 1053

<210> 61

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 61

cggtacccgg ggatcagcaa ccccaccgta atctcaaggt 40

<210> 62

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 62

ccgatctgaa ttgacattcg gatggacttt ttgaaggcca 40

<210> 63

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 63

tcggcgttca cttatgaggt tgacttgata gtcgatcgct 40

<210> 64

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 64

cgactctaga ggatcgttat tgctgttgct gttgtggttg 40

<210> 65

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 65

ccgatctgaa ttgacagata gcgtgagcac actgagcagg 40

<210> 66

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 66

tcggcgttca cttatcaaca cgctacctct tccacagtag 40

<210> 67

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 67

cggtacccgg ggatccgtct gtcaaggttg ggttaatcgt 40

<210> 68

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 68

ccgatctgaa ttgaccgagg cagccaacca taagaactgc 40

<210> 69

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 69

tcggcgttca cttatgcgag ccgtacttgg tttgactact 40

<210> 70

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 70

cgactctaga ggatcaattg catttcttcc ccatcgtcga 40

<210> 71

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 71

cggtacccgg ggatccatag cctcatgacc aatgaccggt 40

<210> 72

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 72

ccgatctgaa ttgacgtcga tgaagtcgtc gggggtatgt 40

<210> 73

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 73

tcggcgttca cttatcggct caatatgcaa taggtgttcc 40

<210> 74

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 74

cgactctaga ggatctaggg ctaaccagca gggtaccgcc 40

<210> 75

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 75

cggtacccgg ggatcccaca ttcacagaag gcactataca 40

<210> 76

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 76

ccgatctgaa ttgaccatca acatctacaa tccgacggtg 40

<210> 77

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 77

tcggcgttca cttatgttgt tggccagaag aaagcataca 40

<210> 78

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 78

cgactctaga ggatcctctc ccgaggcaca acccaaagtg 40

<210> 79

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 79

gtcaattcag atcggctgcc gcctg 25

<210> 80

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 80

ataagtgaac gccgagtcag tacta 25

69页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:脱氨引起的序列错误的纠正

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!