改善蛋白酶表达的手段和方法

文档序号:1957763 发布日期:2021-12-10 浏览:17次 >En<

阅读说明:本技术 改善蛋白酶表达的手段和方法 (Means and methods for improving protease expression ) 是由 A.Q.加努扎 M.D.拉斯穆森 A.K.尼尔森 于 2020-03-04 设计创作,主要内容包括:本发明涉及通过与折叠酶共表达来改善蛋白酶表达的手段和方法。(The present invention relates to means and methods for improving protease expression by co-expression with a folding enzyme.)

改善蛋白酶表达的手段和方法

序列表的引用

本申请含有处于计算机可读形式的序列表,将其通过引用并入本文。

技术领域

本发明涉及通过与折叠酶共表达来改善蛋白酶表达的手段和方法。

背景技术

在工业生物技术中,持续需要提高生产产率,从而在酶和其他工业相关蛋白质的生产中提高利润率。一个成功的策略是使用过表达编码靶蛋白的基因的生产宿主细胞,例如通过使用包含几个基因拷贝的多拷贝菌株或通过修改其控制序列来增强基因的活性。为了充分利用基因过表达的有利作用,需要增加生产宿主细胞的分泌能力,以克服分泌机制中的任何瓶颈。

折叠酶是协助其他蛋白质折叠的蛋白质。生产宿主细胞中一种或多种分子折叠酶的过度表达可以使给定的靶蛋白的折叠增强,这反过来又可能导致正确折叠的蛋白质分泌增强,从而提高生产产率。

PrsA是一种胞质外折叠酶,发现存在于包括工业相关的地衣芽孢杆菌在内的多种革兰氏阳性细菌中。PrsA是一种二聚体脂蛋白质,锚定在细胞膜的外小叶(outer leaflet)中,在此处它有助于通过保守的SecA-YEG途径分泌的蛋白质的折叠。

已表明,天然PrsA的过表达可改善革兰氏阳性细菌中多肽的表达(WO 1994/019471)。

我们已观察到,克劳氏芽孢杆菌碱性蛋白酶(AprH)与某些细菌折叠酶的共表达可显著改善AprH的表达。基于这一发现,我们提出这些特异性折叠酶通常可用于改善蛋白酶的表达。

发明内容

本发明涉及令人惊奇的创造性发现,克劳氏芽孢杆菌碱性蛋白酶(AprH)和某些细菌折叠酶的共表达提高了AprH表达产率。

在第一方面,本发明涉及核酸构建体,其包含:

a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;以及

b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性。

在第二方面,本发明涉及表达载体,这些表达载体包含根据第一方面所述的核酸构建体。

在第三方面,本发明涉及革兰氏阳性宿主细胞,这些革兰氏阳性宿主细胞在基因组中包含根据第一方面所述的核酸构建体和/或根据第二方面所述的表达载体。

在第四方面,本发明涉及用于生产蛋白酶的方法,这些方法包括:

a)提供根据第三方面所述的革兰氏阳性宿主细胞;

b)在有利于蛋白酶表达的条件下培养所述宿主细胞;以及,任选地

c)回收该蛋白酶。

附图说明

图1示出了一个系统发生树,描绘了从各种革兰氏阳性物种获得的不同PrsA同源物之间的相互关系。分支长度与氨基酸序列的散度成正比。来自芽孢杆菌属物种(Bacillussp.)的PrsA的序列号为25,与来自枯草芽孢杆菌(B.subtilis)的PrsA具有47.7%的序列同一性。来自高温木质素降解菌(Geobacillus caldoxylosilyticus)的PrsA的序列号为26,与来自枯草芽孢杆菌的PrsA具有53.3%的序列同一性。

图2示出了用于在枯草芽孢杆菌菌株AN2中整合prsA基因的线性DNA产物的示意图。

图3示出了用于在枯草芽孢杆菌菌株AN2、AN2406和AN2407中整合aprH基因的线性DNA产物的示意图。

定义

折叠酶:术语“折叠酶”意指具有折叠酶活性的酶。折叠酶是促进多肽折叠成功能性三维结构和/或防止未折叠多肽聚集成非功能性结构和任何随后的蛋白质降解的蛋白质。PrsA是革兰氏阳性细菌中的折叠酶一个实例。PrsA是由形成两个结构域的两个单体组成的二聚体;肽基脯氨酰异构酶(PPIase,E.C.5.2.1.8)结构域用于肽基脯氨酰键的顺式和反式异构体的相互转换,而折叠酶结构域辅助多肽折叠(Jakob等人,2015,J.Biol.Chem.[生物化学杂志]290(6):3278-3292)。Jakob等人(同上)提供了来自枯草芽孢杆菌的PrsA的晶体结构。

折叠酶活性:术语“折叠酶活性”意指PPIase活性和/或折叠酶活性,并且被确定为在合适的宿主细胞中目的多肽(例如蛋白酶)与折叠酶共表达时该多肽的表达产率或活性产率。

等位基因变体:术语“等位基因变体”意指占据同一染色体基因座的基因的两种或更多种替代形式中的任一种。等位基因变异通过突变而自然产生,并且可以导致群体内部的多态性。基因突变可以是沉默的(所编码的多肽无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体,其要通过一系列的步骤(包括剪接)进行加工,然后呈现为成熟的剪接的mRNA。

进化枝:术语“进化枝”意指基于追溯至共同祖先的同源性特征聚集在一起的一组多肽。多肽进化枝可以被看作是系统发生树,并且进化枝是由共同祖先及其所有直系后裔组成的一组多肽。在系统发生树的进化枝(亚进化枝)内形成一组多肽也可以享有共同的特性,并且与进化枝中的其他多肽更密切相关。

编码序列:术语“编码序列”意指多核苷酸,该多核苷酸直接规定了变体的氨基酸序列。编码序列的边界通常由可读框确定,该可读框以起始密码子(例如ATG、GTG或TTG)开始并且以终止密码子(例如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。

控制序列:术语“控制序列”意指表达本发明的编码蛋白酶的多核苷酸和编码折叠酶的多核苷酸所必需的核酸序列。每个控制序列对于编码蛋白酶的多核苷酸和/或编码折叠酶的多核苷酸可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于控制序列与本发明多核苷酸编码区连接的特异性限制性位点的目的,这些控制序列可以提供有多个接头。术语“异源启动子”意指对与其可操作地连接的多核苷酸是外源(即,来自不同基因)的启动子。

表达:术语“表达”包括涉及蛋白酶产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。

表达载体:术语“表达载体”意指直链或环状DNA分子,该分子包含本发明的多核苷酸并且可操作地连接至提供用于他们的表达的控制序列。

宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不相同的任何亲本细胞子代。

分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其性质相关的一种或多种或所有天然存在的成分中去除;(3)相对于自然界中发现的物质通过人工修饰的任何物质;或(4)通过增加该物质相对于与其本质相关的其他组分的量而修饰的任何物质(例如,编码该物质的基因的多拷贝;使用比编码该物质的基因本质相关的启动子强的启动子)。分离的物质可以存在于发酵液样品中。

成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰(如N-末端加工、C-末端截短、糖基化、磷酸化等)之后处于其最终形式的多肽。本领域已知宿主细胞可以产生由相同多核苷酸表达的多种不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)中的两种的混合物。

成熟多肽编码序列:根据上下文,术语“成熟多肽编码序列”意指编码成熟蛋白酶的多核苷酸或编码成熟折叠酶的多核苷酸。

核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以原本不存在于自然界中的方式被修饰成包含核酸的区段,或者是合成的,该核酸分子包含一个或多个控制序列。

可操作地连接:术语“可操作地连接”意指如下构型,在该构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得该控制序列指导该编码序列的表达。

序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”来描述。

出于本发明的目的,使用如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件包(EMBOSS:The European Molecular Biology Open Software Suite),Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版本或更新版本)的尼德尔程序中所实施的尼德曼-翁施算法(Needleman-Wunsch algorithm)(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453),来确定两个氨基酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用尼德尔标记的“最长同一性”的输出(使用非简化选项获得)作为同一性百分比并且如下计算:

(相同的残基x 100)/(比对长度-比对中的空位总数)

出于本发明的目的,使用如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件包(EMBOSS:The European Molecular Biology Open Software Suite),Rice等人,2000,同上)(优选5.0.0版本或更新版本)的尼德尔程序中所实施的尼德曼-翁施算法(Needleman和Wunsch,1970,同上),来确定两个脱氧核糖核苷酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用尼德尔标记的“最长同一性”的输出(使用非简化选项获得)作为同一性百分比并且如下计算:

(相同的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)

变体:术语“变体”意指具有蛋白酶活性的、在一个或多个(例如,若干个)位置处包含改变(即,取代、插入和/或缺失)的多肽。取代意指用不同的氨基酸替代占据某一位置的氨基酸;缺失意指去除占据某一位置的氨基酸;以及插入意指邻近于并且紧跟着占据某一位置的氨基酸之后添加一个或多个(例如,几个)氨基酸(例如,1-5个氨基酸)。

序列表

SEQ ID NO:1:克劳氏芽孢杆菌碱性蛋白酶(AprH)的多核苷酸序列。

SEQ ID NO:2:克劳氏芽孢杆菌碱性蛋白酶(AprH)的多肽序列,包括信号肽。

SEQ ID NO:3:克劳氏芽孢杆菌碱性蛋白酶(AprH)的成熟多肽序列。

SEQ ID NO:4:编码PrsA的多核苷酸序列,由枯草芽孢杆菌PrsA的信号肽和芽孢杆菌属物种PrsA的成熟多肽组成。

SEQ ID NO:5:PrsA的多肽序列,由枯草芽孢杆菌PrsA的信号肽和芽孢杆菌属物种PrsA的成熟多肽组成。

SEQ ID NO:6:芽孢杆菌属物种PrsA的成熟多肽序列。

SEQ ID NO:7:编码PrsA的多核苷酸序列,由枯草芽孢杆菌PrsA的信号肽和高温木质素降解菌PrsA的成熟多肽组成。

SEQ ID NO:8:PrsA的多肽序列,由枯草芽孢杆菌PrsA的信号肽和高温木质素降解菌PrsA的成熟多肽组成。

SEQ ID NO:9:高温木质素降解菌PrsA的成熟多肽序列。

SEQ ID NO:10:sigF基因的多核苷酸序列。

SEQ ID NO:11:sigFΔ297bp的多核苷酸序列。

SEQ ID NO:12:用于将来自芽孢杆菌属物种的prsA基因整合入AN2中的SOE PCR产物。

SEQ ID NO:13:用于将来自高温木质素降解菌的prsA基因整合入AN2中的SOE PCR产物。

SEQ ID NO:14:用于将来自克劳氏芽孢杆菌的aprH基因整合入AN2、AN2406和AN2407中的SOE PCR产物。

具体实施方式

本发明涉及令人惊奇的创造性发现,克劳氏芽孢杆菌碱性蛋白酶(AprH)和某些细菌折叠酶的共表达提高了AprH表达产率。将共表达AprH(SEQ ID NO:3)的枯草芽孢杆菌菌株与芽孢杆菌属物种PrsA(SEQ ID NO:6)或高温木质素降解菌PrsA(SEQ ID NO:9)共同培养,AprH的表达产率分别提高了14%和23%。此外,系统发生分析显示这些特定的折叠酶是密切相关的(图1),表明其他结构相关的折叠酶(例如属于同一系统发生进化枝的折叠酶)将对AprH表达产生类似的有益影响。

基于这一发现,我们提出芽孢杆菌属物种PrsA和高温木质素降解菌PrsA以及密切相关的折叠酶通常可用于改善蛋白酶的表达,特别是丝氨酸蛋白酶,例如枯草杆菌蛋白酶(subtilisin)。

核酸构建体

在第一方面,本发明涉及核酸构建体,该核酸构建体包含:

a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;以及

b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性。

该第一和第二异源启动子可以是分别适合于蛋白酶和折叠酶表达的任何异源启动子。在一个实施例中,该第一异源启动子和该第二异源启动子是相同或不同的启动子;优选地,该第一异源启动子和该第二异源启动子是相同启动子的相同拷贝。

本发明的核酸构建体包含至少一种(即一种或多种,例如1、2、3、4、5、6、7、8、9、10或更多种)编码蛋白酶的多核苷酸。在一些实施例中,本发明的核酸构建体包含两种或更多种编码两种或更多种蛋白酶的多核苷酸,其中两种或更多种蛋白酶是相同或不同的蛋白酶。

该蛋白酶可以是任何蛋白酶,例如微生物蛋白酶、植物蛋白酶、动物蛋白酶或人蛋白酶。优选地,该蛋白酶是分泌的。优选地,该蛋白酶是丝氨酸蛋白酶、半胱氨酸蛋白酶、苏氨酸蛋白酶、天冬氨酸蛋白酶、谷氨酸蛋白酶、金属蛋白酶或天冬酰胺肽裂解酶。更优选地,该蛋白酶是丝氨酸蛋白酶;甚至更优选枯草杆菌酶(subtilase);最优选枯草杆菌蛋白酶。

在一些实施例中,该蛋白酶包含C-末端前肽或N-末端前肽和/或N-末端信号肽。在一些实施例中,该蛋白酶是成熟蛋白酶。

在优选的实施例中,该蛋白酶与SEQ ID NO:3具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。更优选地,该蛋白酶包含SEQ ID NO:3或由SEQID NO:3组成。最优选地,该蛋白酶是克劳氏芽孢杆菌碱性蛋白酶(AprH)或其变体。

优选地,该至少一种编码蛋白酶的多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。更优选地,该至少一种编码蛋白酶的多核苷酸包含SEQ ID NO:1或由SEQ ID NO:1组成。

本发明的核酸构建体进一步包含至少一种(即一种或多种,例如,1、2、3、4、5、6、7、8、9、10或更多种)编码折叠酶的多核苷酸。该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。优选地,该折叠酶包含SEQ ID NO:6或SEQ ID NO:9,或由SEQ ID NO:6或SEQ ID NO:9组成。最优选地,该折叠酶是芽孢杆菌属物种PrsA或其变体,或高温木质素降解菌PrsA或其变体。

优选地,该至少一种编码折叠酶的多核苷酸与SEQ ID NO:4或SEQ ID NO:7的成熟多肽编码序列具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。优选地,该至少一种编码折叠酶的多核苷酸包含SEQ ID NO:4或SEQ ID NO:7,或由SEQID NO:4或SEQ ID NO:7组成。

在一些实施例中,本发明的核酸构建体包含两种或更多种编码两种或更多种折叠酶的多核苷酸,其中两种或更多种折叠酶是相同或不同的折叠酶,即芽孢杆菌属物种PrsA(SEQ ID NO:6)和/或高温木质素降解菌PrsA(SEQ ID NO:9)。因此,在一些实施例中,两种或更多种编码两种或更多种折叠酶的多核苷酸与SEQ ID NO:4和/或SEQ ID NO:7的成熟多肽编码序列具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。

该至少一种编码蛋白酶的多核苷酸和该至少一种编码折叠酶的多核苷酸(即本发明的多核苷酸)可操作地连接至一个或多个控制序列,该一个或多个控制序列在与控制序列相容的条件下指导编码序列在适合的宿主细胞中表达。多核苷酸可以按多种方式操纵,以提供蛋白酶和/或折叠酶的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操纵可能是理想的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

控制序列可以是启动子,即多核苷酸,其由宿主细胞识别用于表达该多核苷酸。优选地,该启动子是异源启动子。该启动子包含介导蛋白酶和/或折叠酶表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变型、截短型和杂合型启动子,并且可以获得自编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因。

用于在细菌宿主细胞中指导本发明核酸构建体的转录的适合启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,MolecularMicrobiology[分子微生物学]13:97-107)、天蓝链霉菌(Streptomyces coelicolor)琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731)以及tac启动子(DeBoer等人,1983,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等人,1980,Scientific American[科学美国人]242:74-94的“Useful proteinsfrom recombinant bacteria[来自重组细菌的有用蛋白质]”;和Sambrook等人,1989,同上。串联启动子的实例披露于WO 99/43835中。

控制序列也可为由宿主细胞识别以终止转录的转录终止子。终止子序列可操作地连接至本发明的多核苷酸的3'-末端。可以使用在宿主细胞中有功能的任何终止子。

细菌宿主细胞的优选终止子从克劳氏芽孢杆菌碱性蛋白酶(aprH)和地衣芽孢杆菌α-淀粉酶(amyL)的基因中获得。

控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区域,其增加该基因的表达。

适合的mRNA稳定子区域的实例是从以下获得的:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等人,1995,Journal of Bacteriology[细菌学杂志]177:3465-3471)。

控制序列还可以是信号肽编码区,该编码区编码与蛋白酶和/或折叠酶的N-端连接的信号肽,并且指导蛋白酶和/或折叠酶进入细胞的分泌途径。本发明的多核苷酸的编码序列的5'端本身可以含有在翻译阅读框中与编码蛋白酶和/或折叠酶的编码序列区段天然地相连接的信号肽编码序列。可替代地,编码序列的5'端可以含有对编码序列而言外源的信号肽编码序列。在编码序列不天然地含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强蛋白酶和/或折叠酶的分泌。然而,可以使用指导已表达的蛋白酶和/或折叠酶进入宿主细胞分泌途径的任何信号肽编码序列。

用于细菌宿主细胞的有效信号肽编码序列是从芽孢杆菌NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的基因获得的信号肽编码序列。其他信号肽由Simonen和Palva,1993,Microbiological Reviews[微生物评论]57:109-137描述。

控制序列还可以是编码位于蛋白酶和/或折叠酶N-末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从枯草芽孢杆菌碱性蛋白酶(aprE)或枯草芽孢杆菌中性蛋白酶(nprT)的基因中获得。

在信号肽序列和前肽序列二者都存在的情况下,前肽序列定位成紧邻蛋白酶和/或折叠酶的N-末端,并且信号肽序列定位成紧邻前肽序列的N-末端。

还可希望的是添加调节序列,这些调节序列调节与宿主细胞生长相关的蛋白酶和/或折叠酶的表达。调节系统的实例是响应于化学或物理刺激而引起基因的表达开启或关闭的那些,包括调节化合物的存在。原核系统中的调节系统包括lac、tac和trp操纵子系统。

多核苷酸

本发明还涉及本发明的编码蛋白酶的多核苷酸和编码折叠酶的多核苷酸。在一个实施例中,这些多核苷酸已经被分离。

用于分离或克隆多核苷酸的技术是本领域已知的且包括从基因组DNA或cDNA或其组合进行分离。可以例如通过使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段,进行从基因组DNA克隆多核苷酸。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[PCR:方法和应用指南],AcademicPress[学术出版社],纽约。可以使用其他核酸扩增程序例如连接酶链式反应(LCR)、连接激活的转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以克隆来自芽孢杆菌属的菌株或相关有机体,并且因此,例如可以是本发明多核苷酸的多肽编码区的等位基因变体或物种变体。

表达载体

在第二方面,本发明还涉及包含核酸构建体的重组表达载体,该核酸构建体包含:

(a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;

(b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性。

本发明的表达载体还包含另外的控制序列,例如转录和翻译终止信号。

多个多核苷酸和控制序列可连接在一起以产生重组表达载体,该重组表达载体可包括一个或多个便利的限制位点以允许在此类位点插入或取代本发明的多核苷酸。可替代地,本发明的多核苷酸可以通过将多核苷酸或包含多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生表达载体时,编码序列如此位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。

重组表达载体可以是可以方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。

载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。

载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。

细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标记。

载体优选地含有允许载体整合入宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

为了整合入宿主细胞基因组中,载体可以依赖于本发明的多核苷酸的编码序列或用于借助同源或非同源重组整合入基因组中的该载体的任何其他元件。可替代地,载体可以含有用于指导通过同源重组而整合入宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,例如100至10,000个碱基对、400至10,000个碱基对和800至10,000个碱基对,这些核酸与相对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。

为了自主复制,载体可以进一步包含复制起点,该复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。

细菌复制起点的实例是允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。

可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞中以增加蛋白酶和/或折叠酶的产生。通过将序列的至少一个另外的拷贝整合入宿主细胞基因组中,或者通过包括与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝以及由此该多核苷酸的另外的拷贝的细胞。

用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,Sambrook等人,1989,同上)。

宿主细胞

在第三方面,本发明还涉及革兰氏阳性宿主细胞,这些革兰氏阳性宿主细胞在基因组中包含:

(i)核酸构建体,该核酸构建体包含:

a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;以及

b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性;和/或

(ii)表达载体,该表达载体包含所述核酸构建体。

将包含本发明的多核苷酸的核酸构建体和/或表达载体引入宿主细胞中,这样使该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如前所述。

术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不相同的任何亲本细胞子代。宿主细胞的选择在很大程度上将取决于编码蛋白酶的基因及其来源。

原核宿主细胞可以是用于蛋白酶重组生产的任何革兰氏阳性细胞。革兰氏阳性细菌包括但不限于芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、大洋芽孢杆菌、葡萄球菌属、链球菌属和链霉菌属。

革兰氏阳性宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)和马链球菌兽疫亚种(Streptococcus equisubsp.Zooepidemicus)细胞。

细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于:不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌、以及浅青紫链霉菌细胞。

将DNA引入芽孢杆菌属细胞中可以通过以下方式来实现:原生质体转化(参见例如,Chang和Cohen,1979,Mol.Gen.Genet.[分子与普通遗传学]168:111-115)、感受态细胞转化(参见例如,Young和Spizizen,1961,J.Bacteriol.[细菌学杂志]81:823-829;或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如,Shigekawa和Dower,1988,Biotechniques[生物技术]6:742-751)或接合(参见例如,Koehler和Thorne,1987,J.Bacteriol.[细菌学杂志]169:5271-5278)。

将DNA引入链霉菌属细胞中可以通过以下来实现:原生质体转化、电穿孔(参见例如,Gong等人,2004,Folia Microbiol.(Praha)[叶线形微生物学(布拉格)]49:399-405)、轭合(参见例如,Mazodier等人,1989,J.Bacteriol.[细菌学杂志]171:3583-3585)、或转导(参见例如,Burke等人,2001,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。

将DNA引入链球菌属细胞中可以通过以下方式来实现:天然感受态(naturalcompetence)(参见例如,Perry和Kuramitsu,1981,Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见例如,Catt和Jollick,1991,Microbios[微生物学]68:189-207)、电穿孔(参见例如,Buckley等人,1999,Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)、或轭合(参见例如,Clewell,1981,Microbiol.Rev.[微生物学评论]45:409-436)。

然而,可以使用本领域已知的将DNA引入宿主细胞中的任何方法。

生产方法

在第四方面,本发明还涉及生产蛋白酶的方法,该方法包括:

I)提供革兰氏阳性宿主细胞,其包含:

i)核酸构建体,该核酸构建体包含:

a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;以及

b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性;和/或

ii)表达载体,该表达载体包含所述核酸构建体;

II)在有利于该蛋白酶和该折叠酶表达的条件下培养所述革兰氏阳性宿主细胞;以及,任选地

III)回收该蛋白酶。

优选地,该革兰氏阳性宿主细胞是芽孢杆菌属宿主细胞;优选地,该芽孢杆菌属宿主细胞选自由以下组成的组:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。

使用本领域已知的方法将革兰氏阳性宿主细胞在适合产生蛋白酶的营养培养基中进行培养。例如,可以通过摇瓶培养,或者在适合的培养基中并在允许蛋白酶表达和/或分离的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批给料发酵或固态发酵)来培养细胞。使用本领域中已知的程序,培养发生在包含碳和氮来源及无机盐的适合的营养培养基中。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果蛋白酶被分泌到营养培养基中,则可以直接从培养基中回收蛋白酶。如果未分泌蛋白酶,则可以从细胞裂解液中回收。

可以使用本领域已知的对蛋白酶特异的方法来检测蛋白酶。这些检测方法包括但不限于:特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来测定蛋白酶的活性。

可以使用本领域已知的方法回收蛋白酶。例如,可通过常规程序(包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀)从营养培养基回收蛋白酶。

可以通过本领域已知的多种程序纯化蛋白酶,包括但不限于色谱法(例如,离子交换色谱法、亲和色谱法、疏水色谱法、聚焦色谱法和尺寸排阻色谱法)、电泳程序(例如,制备型等电聚焦电泳)、差异性溶解(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见例如,ProteinPurification[蛋白质纯化],Janson和Ryden编辑,VCH Publishers[VCH出版公司],纽约,1989),以便获得基本上纯的蛋白酶。

在替代性方面,不回收蛋白酶,而是将表达该蛋白酶的本发明的革兰氏阳性宿主细胞用作变体的来源。

发酵液配制品或细胞组合物

本发明还涉及包含本发明的蛋白酶和任选的折叠酶的发酵液配制品或细胞组合物。发酵液产物进一步包含在发酵过程中使用的另外成分,例如像细胞(包括含有编码本发明蛋白酶和折叠酶的多核苷酸的革兰氏阳性宿主细胞,这些革兰氏阳性宿主细胞用于产生蛋白酶)、细胞碎片、生物质、发酵培养基和/或发酵产物。在一些实施例中,组合物是含有一种或多种有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。

如本文使用的术语“发酵液”意指由细胞发酵产生的、不经历或经历最少的回收和/或纯化的制剂。例如,当微生物培养物在允许蛋白质合成(例如,由宿主细胞表达酶)并且将蛋白质分泌到细胞培养基中的碳限制条件下温育生长到饱和时,产生发酵液。该发酵液可以含有在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,该发酵液是未分级的并且包含用过的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液含有用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。

在一个实施例中,发酵液配制品和细胞组合物包含第一有机酸组分(包含至少一种1-5个碳的有机酸和/或其盐)和第二有机酸组分(包含至少一种6个或更多个碳的有机酸和/或其盐)。在特定实施例中,第一有机酸组分是乙酸、甲酸、丙酸、其盐或前述两种或更多种的混合物;并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐或前述两种或更多种的混合物。

在一方面,组合物含有一种或多种有机酸,并且任选地进一步含有杀灭的细胞和/或细胞碎片。在一个实施例中,从细胞杀灭的全培养液中去除这些杀灭的细胞和/或细胞碎片,以提供不含这些组分的组合物。

这些发酵液配制品或细胞组合物可以进一步包含防腐剂和/或抗微生物(例如,抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域已知的其他试剂。

该细胞杀灭的全培养液或组合物可以含有在发酵结束时得到的发酵材料的未分级的内容物。典型地,该细胞杀灭的全培养液或组合物含有用过的培养基以及在允许蛋白质合成的碳限制条件下孵育革兰氏阳性宿主细胞使其生长至饱和之后存在的细胞碎片。在一些实施例中,细胞杀灭的全培养液或组合物含有用过的细胞培养基、胞外酶和杀灭的革兰氏阳性细胞。在一些实施例中,可以使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的革兰氏阳性宿主细胞透性化和/或裂解。

如本文所述的全培养液或细胞组合物典型地是液体,但是可以含有不溶性组分,例如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中,可以去除不溶性组分以提供澄清的液体组合物。

本发明的全培养液配制品和细胞组合物可以通过WO 1990/15861或WO 2010/096673中所述的方法来产生。

酶组合物

本发明还涉及包含本发明的蛋白酶和任选的折叠酶的组合物。

这些组合物可包含本发明的蛋白酶作为主要酶组分,例如单组分组合物。可替代地,这些组合物可以包括多种酶活性,如选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地,该酶是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、绿色荧光蛋白、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。

可以根据本领域中已知的方法来制备组合物,并且组合物可以处于液体或干组合物的形式。可以根据本领域中已知的方法将组合物稳定化。

优选的实施例

1)一种核酸构建体,该核酸构建体包含:

a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;以及

b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性。

2)据实施例1所述的核酸构建体,其中该第一异源启动子和该第二异源启动子是相同或不同的启动子;优选地,该第一异源启动子和该第二异源启动子是相同启动子的相同拷贝。

3)根据前述实施例中任一项所述的核酸构建体,其中该蛋白酶是丝氨酸蛋白酶、半胱氨酸蛋白酶、苏氨酸蛋白酶、天冬氨酸蛋白酶、谷氨酸蛋白酶、金属蛋白酶或天冬酰胺肽裂解酶。

4)根据实施例3所述的核酸构建体,其中该蛋白酶是丝氨酸蛋白酶;优选枯草杆菌酶,最优选枯草杆菌蛋白酶。

5)根据前述实施例中任一项所述的核酸构建体,其中该蛋白酶包含C-末端前肽或N-末端前肽和/或N-末端信号肽;或其中该蛋白酶是成熟蛋白酶。

6)根据前述实施例中任一项所述的核酸构建体,其中该蛋白酶与SEQ ID NO:3具有至少80%的序列同一性。

7)根据前述实施例中任一项所述的核酸构建体,其中该蛋白酶包含SEQ ID NO:3或由SEQ ID NO:3组成。

8)根据前述实施例中任一项所述的核酸构建体,其中该蛋白酶是克劳氏芽孢杆菌碱性蛋白酶(AprH)或其变体。

9)根据前述实施例中任一项所述的核酸构建体,其中该至少一种编码蛋白酶的多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80%的序列同一性。

10)根据前述实施例中任一项所述的核酸构建体,其中该至少一种编码蛋白酶的多核苷酸包含SEQ ID NO:1或由SEQ ID NO:1组成。

11)根据前述实施例中任一项所述的核酸构建体,其中该至少一种编码折叠酶的多核苷酸与SEQ ID NO:4或SEQ ID NO:7的成熟多肽编码序列具有至少80%的序列同一性。

12)根据前述实施例中任一项所述的核酸构建体,其中该至少一种编码折叠酶的多核苷酸包含SEQ ID NO:4或SEQ ID NO:7,或由SEQ ID NO:4或SEQ ID NO:7组成。

13)一种表达载体,该表达载体包含核酸构建体,该核酸构建体包含:

a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;以及

b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性。

14)根据实施例13所述的表达载体,其中该第一异源启动子和该第二异源启动子是相同或不同的启动子;优选地,该第一异源启动子和该第二异源启动子是相同启动子的相同拷贝。

15)根据实施例13-14中任一项所述的表达载体,其中该蛋白酶是丝氨酸蛋白酶、半胱氨酸蛋白酶、苏氨酸蛋白酶、天冬氨酸蛋白酶、谷氨酸蛋白酶、金属蛋白酶或天冬酰胺肽裂解酶。

16)根据实施例15所述的表达载体,其中该蛋白酶是丝氨酸蛋白酶;优选枯草杆菌酶,最优选枯草杆菌蛋白酶。

17)根据实施例13-16中任一项所述的表达载体,其中该蛋白酶包含C-末端前肽或N-末端前肽和/或N-末端信号肽;或其中该蛋白酶是成熟蛋白酶。

18)根据实施例13-17中任一项所述的表达载体,其中该蛋白酶与SEQ ID NO:3具有至少80%的序列同一性。

19)根据实施例13-18中任一项所述的表达载体,其中该蛋白酶包含SEQ ID NO:3或由SEQ ID NO:3组成。

20)根据实施例13-19中任一项所述的表达载体,其中该蛋白酶是克劳氏芽孢杆菌碱性蛋白酶(AprH)或其变体。

21)根据实施例13-20中任一项所述的表达载体,其中该至少一种编码蛋白酶的多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80%的序列同一性。

22)根据实施例13-21中任一项所述的表达载体,其中该至少一种编码蛋白酶的多核苷酸包含SEQ ID NO:1或由SEQ ID NO:1组成。

23)根据实施例13-22中任一项所述的表达载体,其中该至少一种编码折叠酶的多核苷酸与SEQ ID NO:4或SEQ ID NO:7的成熟多肽编码序列具有至少80%的序列同一性。

24)根据前述实施例中任一项所述的表达载体,其中该至少一种编码折叠酶的多核苷酸包含SEQ ID NO:4或SEQ ID NO:7,或由SEQ ID NO:4或SEQ ID NO:7组成。

25)一种革兰氏阳性宿主细胞,在该革兰氏阳性宿主细胞基因组中包含:

(i)核酸构建体,该核酸构建体包含:

a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;以及

b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性;和/或

(ii)表达载体,该表达载体包含所述核酸构建体。

26)根据实施例25所述的革兰氏阳性宿主细胞,其中该革兰氏阳性宿主细胞是芽孢杆菌属宿主细胞;优选地,该芽孢杆菌属宿主细胞选自由以下组成的组:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。

27)根据实施例25-26中任一项所述的革兰氏阳性宿主细胞,其中该第一异源启动子和该第二异源启动子是相同或不同的启动子;优选地,该第一异源启动子和该第二异源启动子是相同启动子的相同拷贝。

28)根据实施例25-27中任一项所述的革兰氏阳性宿主细胞,其中该蛋白酶是丝氨酸蛋白酶、半胱氨酸蛋白酶、苏氨酸蛋白酶、天冬氨酸蛋白酶、谷氨酸蛋白酶、金属蛋白酶或天冬酰胺肽裂解酶。

29)根据实施例28所述的革兰氏阳性宿主细胞,其中该蛋白酶是丝氨酸蛋白酶;优选枯草杆菌酶,最优选枯草杆菌蛋白酶。

30)根据实施例25-29中任一项所述的革兰氏阳性宿主细胞,其中该蛋白酶包含C-末端前肽或N-末端前肽和/或N-末端信号肽;或其中该蛋白酶是成熟蛋白酶。

31)根据实施例25-30中任一项所述的革兰氏阳性宿主细胞,其中该蛋白酶与SEQID NO:3具有至少80%的序列同一性。

32)根据实施例25-31中任一项所述的革兰氏阳性宿主细胞,其中该蛋白酶包含SEQ ID NO:3或由SEQ ID NO:3组成。

33)根据实施例25-32中任一项所述的革兰氏阳性宿主细胞,其中该蛋白酶是克劳氏芽孢杆菌碱性蛋白酶(AprH)或其变体。

34)根据实施例25-33中任一项所述的革兰氏阳性宿主细胞,其中该至少一种编码蛋白酶的多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80%的序列同一性。

35)根据实施例25-34中任一项所述的革兰氏阳性宿主细胞,其中该至少一种编码蛋白酶的多核苷酸包含SEQ ID NO:1或由SEQ ID NO:1组成。

36)根据实施例25-35中任一项所述的革兰氏阳性宿主细胞,其中该至少一种编码折叠酶的多核苷酸与SEQ ID NO:4或SEQ ID NO:7的成熟多肽编码序列具有至少80%的序列同一性。

37)根据实施例25-36中任一项所述的革兰氏阳性宿主细胞,其中该至少一种编码折叠酶的多核苷酸包含SEQ ID NO:4或SEQ ID NO:7,或由SEQ ID NO:4或SEQ ID NO:7组成。

38)一种用于生产蛋白酶的方法,该方法包括:

I)提供革兰氏阳性宿主细胞,在该革兰氏阳性宿主细胞基因组中包含:

i)核酸构建体,该核酸构建体包含:

a)与至少一种编码蛋白酶的多核苷酸可操作地连接的第一异源启动子;以及

b)与至少一种编码折叠酶的多核苷酸可操作地连接的第二异源启动子;

其中该折叠酶与SEQ ID NO:6或SEQ ID NO:9具有至少80%的序列同一性;和/或

ii)表达载体,该表达载体包含所述核酸构建体;

II)在有利于该蛋白酶和该折叠酶表达的条件下培养所述革兰氏阳性宿主细胞;以及,任选地

III)回收该蛋白酶。

39)根据实施例38所述的方法,其中该革兰氏阳性宿主细胞是芽孢杆菌属宿主细胞;优选地,该芽孢杆菌属宿主细胞选自由以下组成的组:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。

40)根据实施例38-39中任一项所述的方法,其中该第一异源启动子和该第二异源启动子是相同或不同的启动子;优选地,该第一异源启动子和该第二异源启动子是相同启动子的相同拷贝。

41)根据实施例38-40中任一项所述的方法,其中该蛋白酶是丝氨酸蛋白酶、半胱氨酸蛋白酶、苏氨酸蛋白酶、天冬氨酸蛋白酶、谷氨酸蛋白酶、金属蛋白酶或天冬酰胺肽裂解酶。

42)根据实施例41所述的方法,其中该蛋白酶是丝氨酸蛋白酶;优选枯草杆菌酶,最优选枯草杆菌蛋白酶。

43)根据实施例38-42中任一项所述的方法,其中该蛋白酶包含C-末端前肽或N-末端前肽和/或N-末端信号肽;或其中该蛋白酶是成熟蛋白酶。

44)根据实施例38-43中任一项所述的方法,其中该蛋白酶与SEQ ID NO:3具有至少80%的序列同一性。

45)根据实施例38-44中任一项所述的方法,其中该蛋白酶包含SEQ ID NO:3或由SEQ ID NO:3组成。

46)根据实施例38-45中任一项所述的方法,其中该蛋白酶是克劳氏芽孢杆菌碱性蛋白酶(AprH)或其变体。

47)根据实施例38-46中任一项所述的方法,其中该至少一种编码蛋白酶的多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80%的序列同一性。

48)根据实施例38-47中任一项所述的方法,其中该至少一种编码蛋白酶的多核苷酸包含SEQ ID NO:1或由SEQ ID NO:1组成。

49)根据实施例38-48中任一项所述的方法,其中该至少一种编码折叠酶的多核苷酸与SEQ ID NO:4或SEQ ID NO:7的成熟多肽编码序列具有至少80%的序列同一性。

50)根据实施例38-49中任一项所述的方法,其中该至少一种编码折叠酶的多核苷酸包含SEQ ID NO:4或SEQ ID NO:7,或由SEQ ID NO:4或SEQ ID NO:7组成。

通过以下实例进一步描述本发明,这些实例不应理解为对本发明的范围进行限制。

实例

材料与方法

用作缓冲液和底物的化学品是至少试剂级的商业产品。

使用标准教科书程序,采用商业热循环仪和来自商业供应商的Ready-To-Go PCRbeads,Phusion聚合酶或RED-TAQ聚合酶进行PCR扩增。

LB琼脂:参见EP 0 506 780。

LBPSG琼脂板含有LB琼脂,补充有磷酸盐(0.01M K3PO4)、葡萄糖(0.4%)和淀粉(0.5%);参见EP 0 805 867B1。

TY(液体肉汤培养基):参见WO 94/14968,第16页。

寡核苷酸引物获自欧陆集团(Eurofins)(奥尔胡斯,丹麦)。用可商购的试剂盒和试剂,使用标准教科书程序进行DNA操作(质粒和基因组DNA制备、限制性消化、纯化、连接、DNA测序)。

使用两步式程序(Yasbin等人,1975,J.Bacteriol.[细菌学杂志]121:296-304.)或一步式程序将DNA引入到枯草芽孢杆菌经提炼的天然感受态细胞中,其中将来自琼脂板的细胞材料再悬浮于Spizisen 1培养基(12ml)(WO 2014/052630)中,在37℃以200rpm振荡约4小时,将DNA添加至400微升等分试样中,并且在选择性琼脂板上铺板之前,将这些等分试样在所希望的温度下,以150rpm振荡另外1小时。

实例中描述的所有构建都是从基因艺术-赛默飞世尔科技公司(GeneArt-ThermoFisher Scientific)订购的合成DNA片段组装而成。如下文实例中所述,片段通过序列重叠延伸(SOE)进行组装。

使用来自凯杰公司(Qiagen)的市售QIAamp DNA血液试剂盒,从所有相关分离物中制备基因组DNA。

标准微孔板分批发酵

使PrsA文库菌株以生物学上一式三份在96深孔板(CR1496b,酶筛选公司(Enzyscreen))中的500mL LB培养基中生长,用夹心盖(Sandwich Covers)(CR1296,酶筛选公司)覆盖。在37℃和300rpm下,使培养物在夹持系统(Clamp Systems)(CR1700,酶筛选公司)中生长24小时(1)。24小时后,取样进行酶活性测定。

所有测定均在96孔微量滴定板中进行,并且以克劳氏芽孢杆菌碱性蛋白酶(AprH)作为标准品,在2种不同稀释度下同时测量每个样品。在Biomek Fx液体处理器上进行测定,在Spectramax板读数器(美谷分子仪器公司(Molecular Devices))上测量吸光度读数。

将样品在稀释缓冲液(Tris pH 9.0+0.01%Triton X)中稀释。将20μl稀释样品与稀释缓冲液中的底物溶液(0.6mg/ml Suc-ala-ala-pro-phe-pNA,巴亨公司(Bachem))混合。立即测量405nM处的动力学吸光度,持续5分钟,并根据相应的标准曲线推算结果。

菌株

系统发生树的构建

如图1所示的系统进化树是通过以下构建的:执行ClustalW比对(Bioconductor3.8,“msa”软件包,R),然后构建同一性矩阵(dist.alignment function in R[R中的区分比对函数],W.M.Fitch,s.l.:J.Mol.Biol.[分子生物学杂志],第16卷,第9-16页)以及邻接树估计(nj function in R[R中的邻接函数],N.Saitou和M.Nei,s.l.:Molecular Biologyand Evolution[分子生物学与进化],第4卷,第406-425页)。将此树绘制成无根树。

实例1.枯草芽孢杆菌宿主AN2的构建

如以下实施例中所述,枯草芽孢杆菌AN2用作表达prsA和蛋白酶基因的宿主菌株。菌株AN2是枯草芽孢杆菌168的孢子形成缺陷型衍生物,因为sigF基因中缺失了297bp(完整的sigF基因序列作为SEQ ID NO:10提供,包含缺失的非活性版本作为SEQ ID NO:11提供)。

实例2.prsA基因表达盒的构建及这些基因在枯草芽孢杆菌AN2中的染色体整合

枯草芽孢杆菌菌株AN2用作插入prsA基因拷贝的表达盒的宿主菌株。PrsA表达盒被整合入pel基因座中,由合成启动子PconsSD后跟prsA基因和枯草芽孢杆菌prsA天然终止子组成。用于整合的DNA可通过合成DNA的PCR扩增进行组装,合成DNA由以下DNA组分组成:pel5'区+ermC(对红霉素产生抗性)+带有SD序列的合成共有启动子(PconsSD)+带有终止子的prsA可读框+pel 3'区。将纯化的PCR产物用于随后的PCR反应中,以使用重叠延伸基因剪接(SOE)方法(Horton RM 1989)和Phusion热启动DNA聚合酶系统(赛默科技公司(ThermoScientific))生成单个线性DNA,如下所示:PCR扩增反应混合物含有凝胶纯化的PCR产物每种50ng,使用热循环仪组装和扩增DNA。所得SOE产物直接用于对枯草芽孢杆菌宿主AN2的转化。同源重组促进染色体整合,并在含有1μg/ml红霉素的LB琼脂板上选择发生双交换事件的细胞。用于将prsA基因整合入AN2中的线性DNA产物的示意图如图2所示,用于将来自芽孢杆菌属物种的prsA基因整合入AN2中从而产生菌株AN2406的DNA序列作为SEQ ID NO:12提供。通过类似的方法构建了表达来自高温木质素降解菌的prsA基因的菌株(DNA序列作为SEQ ID NO:13提供),并命名为AN2407。

实例3.克劳氏芽孢杆菌碱性蛋白酶基因(aprH)表达盒的构建及该克劳氏芽孢杆菌碱性蛋白酶基因在枯草芽孢杆菌菌株AN2、AN2406和AN2407中的染色体整合

将aprH表达盒整合入枯草芽孢杆菌AN2、AN2406和AN2407的amyE基因座中,该表达盒由合成启动子PconsSD后跟aprH基因和解淀粉芽孢杆菌amyQ终止子组成。amyE基因在此过程中失活。用于整合的DNA可通过合成DNA的PCR扩增进行组装,合成DNA由以下DNA组分组成:amyE 5'区+带有SD序列的合成共有启动子(PconsSD)+aprH可读框+解淀粉芽孢杆菌amyQ终止子+cat基因(对氯霉素产生抗性)+amyE 3'区。将纯化的PCR产物用于随后的PCR反应中,以使用实例2中描述的SOE方法生成单个线性DNA。所得SOE产物直接用于转化枯草芽孢杆菌菌株AN2(产生菌株AQG88)、AN2406(产生菌株AQG825)和AN2407(产生菌株AQG812)。同源重组促进染色体整合,并在含有6μg/ml氯霉素的LB琼脂板上选择发生双交换事件的细胞。菌株AQG88从amyE基因座表达克劳氏芽孢杆菌AprH(SEQ ID NO:3),并含有天然pel基因座。菌株AQG825从pel基因座表达来自芽孢杆菌属物种的PrsA(SEQ ID NO:6),以及从amyE基因座表达AprH。菌株AQG812从pel基因座表达来自高温木质素降解菌的PrsA(SEQ ID NO:9),以及从amyE基因座表达AprH。图3中示出了用于在枯草芽孢杆菌菌株AN2、AN2406和AN2407中整合aprH基因的线性DNA产物的示意图,并将DNA序列作为SEQ ID NO:14提供。

实例4.蛋白酶在具有枯草芽孢杆菌AQG88、AQG825和AQG812的分批培养物中的表达

如上所述,对实例3中构建的枯草芽孢杆菌菌株在标准微孔板分批培养中的蛋白酶生产率进行了测试。如上所述,以生物学上一式三份培养24小时,之后收集上清液用于随后的蛋白酶活性测量。在这个实例中,与具有不表达任何异源prsA基因的AQG88的培养物相比,我们从含有表达芽孢杆菌属物种PrsA(SEQ ID NO:6)的AQG825的培养物中获得了14%以上的蛋白酶活性,以及从表达高温木质素降解菌PrsA(SEQ ID NO:9)的AQG812的培养物中获得了23%以上的蛋白酶活性。

22页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于抗体优化的变异核酸文库

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!