编码纤维素酶的基因

文档序号:1751420 发布日期:2019-11-29 浏览:33次 >En<

阅读说明:本技术 编码纤维素酶的基因 (The gene of encoding cellulase ) 是由 谭叙秋 K·E·巴雷特 R·S·李 于 2013-03-12 设计创作,主要内容包括:本发明提供了编码热稳定纤维素酶并指导其升高表达的多核苷酸序列,以及热稳定纤维素酶在水力压裂方法和返排液处理中的用途。(The present invention provides encoding heat stable cellulases to and guide it to rise highly expressed polynucleotide sequence and heat-stable cellulase in hydraulic fracturing method and return the purposes in drain processing.)

编码纤维素酶的基因

本申请是中国专利申请201380025682.5的分案申请,原申请的申请日是2013年3月12日,发明名称是“编码纤维素酶的基因”。

相关申请

本申请依据35U.S.C.§119(e)要求于2012年3月30日提交的美国临时申请61/618,610和2012年9月21日提交的美国临时申请61/704,368的优先权,所述每一份临时申请均通过援引全文纳入本文。

技术领域

提供了编码纤维素酶的多核苷酸序列。具体地,所述多核苷酸序列可以提供特定的、热稳定的、耐热的、压力稳定的酶如纤维素酶的增加的表达。

序列表

如MPEP§502.05中授权并阐述,本申请经由USPTO EFS-WEB服务器电子提交,该电子提交包括电子提交的序列表;这份序列表的全部内容通过援引纳入本申请的说明书中。在电子提交的ASCII(.txt)文本文件上该序列表被标示为如下:

文件名 形成日 大小
D2480_SEQLISTING 2013年3月11日 31.4KB

背景技术

O-糖基水解酶(EC 3.2.1.-)是一组广泛分布的天然存在的酶,其水解两个或者多个碳水化合物之间或者碳水化合物与非碳水化合物部分之间的糖苷键。糖基水解酶(或糖基化酶)的国际生物化学和分子生物学联合会(IUBMB)酶命名法主要是基于其底物特异性并有时基于其分子机制(生物化学与分子生物学国际联盟命名委员会(NC-IUBMB),2011年10月24日访问)。

IUBMB酶命名法EC 3.2.1.4已被指定用于一小组被称为“纤维素酶”的糖基化酶类型的酶。用于属于该组的酶的其他名称包括:内切葡聚糖酶、内-1,4-β-葡聚糖酶、羧甲基纤维素酶和β-1,4-葡聚糖酶。由属于该组的酶催化的反应是对纤维素、地衣淀粉和谷类β-D-葡聚糖(例如大麦β-葡聚糖)中的1,4-β-D-糖苷键的内切水解。由于本发明公开的纤维素酶的主要活性是内切水解大麦β-葡聚糖和羧甲基纤维素,因此其适合被归为IUBMB酶命名法EC 3.2.1.4。

糖基水解酶的另一分类基于氨基酸序列的相似性(Henrissat,B.Accessed atUniProt 10/26/2011)。根据这一分类方案,糖基水解酶可以被分为70多个家族。在将本发明公开的纤维素酶的一级氨基酸序列与公共数据库中包含的其他糖基水解酶的序列相比较的基础上,本发明公开的纤维素酶可以被指定到糖基水解酶家族5。该家族包含20多种内切葡聚糖酶(IUBMB酶命名法EC 3.2.1.4),其主要的催化活性是对纤维素底物中的β-1,4-糖苷键的内切水解。使用该第二种酶分类法对下述结论提供了进一步的支持:本发明公开的纤维素酶应该归为IUBMB酶命名法EC 3.2.1.4。

纤维素酶被用于多种工业和商业目的,包括但不限于油和气的勘探,食品和饮料、饮用或燃料酒精生产,例如酿造、乙醇、果酒、香料、香精、织品、洗涤剂、造纸、纸浆、环境和农业、以及研究目的。(Rebecca S.Bryant,Erle C.Donaldson,Teh Fu Yen,GeorgeV.Chilingarian,Chapter 14Microbial Enhanced Oil Recovery,In:Erle C.Donaldson,George V.Chilingarian and Teh Fu Yen,Editor(s),Developments in PetroleumScience,Elsevier,1989,第17(B)卷:423-450)(M.Karmakar and R.R.Ray,2011.CurrentTrends in Research and Application of Microbial Cellulases.Research Journalof Microbiology,6:41-53.)。

对于油和气的发现和钻井操作的典型且必然的活动和费用是对由此操作使用和/或产生的流体的处理。例如,钻井、清洗和准备(prepping)井(“完井”)、水力压裂操作、以及油和气加工,全都典型地会产生数千加仑被污染的流体副产品。通常,由这样的操作形成的流体副产品被称为“返排液”,因为所述返排液通常会返排出井眼并回到表面。所述流体副产品或者返排液,通常必须被处理以进行处置或者再利用。

需要更有效的处理返排液的方式

由于在气发现和钻井工业中处理返排液需要大量资源和时间,因此存在针对处理返排液的有效方法或组合物的需要。另外,由于气发现和钻井操作通常需要新鲜的(如清洁过的或者过滤过的)流体,因此针对处理返排液以允许将所述返排液重新使用于另外的气发现和钻井操作中的方法存在重大需求。

发明内容

酶是用作催化剂的蛋白质。蛋白质是经脱水反应通过肽键连接的氨基酸的聚合物。氨基酸的同源性以及将其连接形成蛋白质的顺序决定了给定蛋白的活性。氨基酸被组装成蛋白质的这一顺序(蛋白质“序列”)最终由“编码”该蛋白质的DNA链的序列所决定。

规定待组装成为蛋白质的给定氨基酸的三核苷酸序列被称为“密码子”。成为蛋白质的20个氨基酸一共由六十四个三核苷酸密码子序列所编码。指定蛋白质的密码子系列被称为“开放读码框”。一个氨基酸可以由少到一个密码子或者多达六个不同的密码子来指定。不影响被指定的氨基酸的密码子的三核苷酸序列中的改变(或突变)被称为“沉默”突变。

因此,有许多DNA序列能够编码相同的蛋白质,因为DNA序列彼此之间的差异仅在于“沉默”突变。通过改变编码给定蛋白的一个或者多个密码子,能够大大地增加基因产生的蛋白质的量,而不会影响被编码蛋白的序列。

在一些实施方案中,本发明包含SEQ ID NO:1。在一些实施方案中,本发明包括SEQID NO:1的多核苷酸序列。在一些实施方案中,该序列编码蛋白质。在一些实施方案中,该蛋白质是具有纤维素酶活性的酶。

在本文中公开的改进的核苷酸序列被表示为SEQ ID NO:1,其编码此前公开的纤维素酶(SEQ ID NO:2),所述纤维素酶演变自来源于海栖热袍菌(Thermotoga maritima)菌株MSB8的DNA库的亲本纤维素酶。本公开的SEQ ID NO:2的纤维素酶描述于PCT公布文本WO2009/020459中,在这份文献中作为SEQ ID NO:9(由这份公开文本中的多核苷酸序列SEQID NO:8编码,在本文中被描述为SEQ ID NO:3)。在一些实施方案中,本发明包括SEQ IDNO:1的多核苷酸序列,或其片段。在一些实施方案中,这些序列编码蛋白质。在一些实施方案中,所述蛋白质是具有纤维素酶活性的酶。

关于SEQ ID NO:3,本发明包括多个核苷酸碱基变化。对于所编码的蛋白质而言,这些变化是沉默的。下文给出了十四个碱基变化。“位(置)”是指SEQ ID NO:1的开放读码框内的核苷酸的编号,将第一个密码子的第一个核苷酸编号为1。如果SEQ ID NO:1的开放读码框在其5’端与另一核苷酸序列连接,使得该开放读码框延伸超过SEQ ID NO:1的5’端,则该“位(置)”将继续去指从SEQ ID NO:1的开放读码框的5’端编号的碱基。类似地,如果SEQID NO:1的开放读码框被截短,使得该开放读码框不从与SEQ ID NO:1相关的序列的5’端开始,则编号系统将继续源自对应于SEQ ID NO:1的5’端的所述序列的5’端。

使用标记法“(旧核苷酸)(位置)(新核苷酸)”指定核苷酸碱基的改变或者突变。突变如下:T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C,并且其可以在单个序列中单独存在或以其与上至包括全部上述的碱基变化的任何组合存在。

使SEQ ID NO:1全体地和单独地区别于现有技术报道的编码所公开的纤维素酶的序列的碱基变化得到一个开放读码框,该开放读码框导致比之前采用的编码相同蛋白质的核苷酸序列更高的蛋白质表达水平。

在一些实施方案中,公开了编码来源于海栖热袍菌的纤维素酶的核苷酸序列,其中该核苷酸序列在单个序列中包含至少一个选自以下的突变:T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C、A6C、G6C、A9C、G9C、A15G、C15G、T22C、G22C、A24T、C24T、T33C、G33C、T39C、G39C、T40C、G40C、T42C、G42C、T54C、G54C、T57C、G57C、A66C、G66C、C81A、T81A、T84C、G84C、或其与上至包括全部上述的碱基变化的任何组合。在这些实施方案的一些方面,对于所编码的蛋白质的序列,至少一个突变是沉默的。在其他方面,至少一个突变导致核苷酸序列包含至少一个突变的核苷酸序列:所述突变指导纤维素酶以高于缺少至少一个突变的核苷酸序列并且在其他方面没有不同于上述核苷酸序列的水平表达。

在一些实施方案中,公开了编码纤维素酶的核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:3,并且在单个序列中具有至少一个选自以下的突变:T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C、A6C、G6C、A9C、G9C、A15G、C15G、T22C、G22C、A24T、C24T、T33C、G33C、T39C、G39C、T40C、G40C、T42C、G42C、T54C、G54C、T57C、G57C、A66C、G66C、C81A、T81A、T84C、G84C、或其与上至包括全部上述的碱基变化的任何组合。

在一些实施方案中,公开了来自海栖热袍菌的核苷酸序列,其具有至少一个下述的突变:与海栖热袍菌的基因组序列相比,该突变提高了由所述核苷酸序列编码的蛋白质的表达水平。在一些方面,至少一个突变是沉默的。

在一些实施方案中,公开了编码SEQ ID NO:2的多肽的第一核苷酸序列,其中所述核苷酸序列已经针对编码SEQ ID NO:2的多肽的第二序列进行了突变,使得该蛋白质的表达水平相对于由所述第二核苷酸序列编码的蛋白质的表达水平增加。

本发明提供了用于处理在气和油发现以及钻井操作中产生的返排液的组合物和方法。在一些方面,本文公开的组合物和方法用于处理返排液,从而实现恰当的环境处置。在一些方面,本文公开的组合物和方法用于处理返排液,以在油和气发现以及钻井操作中进一步使用,或者换言之,以再循环返排液。

在一些实施方案中,酶被用于实施本发明,包括任何淀粉酶和/或纤维素酶例如SEQ ID NO:2中公开的酶,例如,包括使用本文所描述的酶和/或其他酶的“鸡尾酒混合物(cocktails)”。

在一些实施方案中,本发明提供了(例如在油和气发现和钻井操作中产生的返排液中)添加淀粉酶和/或纤维素酶,例如SEQ ID NO:2中公开的酶。

可选的实施方案包括例如本文描述的淀粉酶和/或纤维素酶:

本文公开的组合物和方法包括使用分离的、合成的或重组的下述核酸,其包含与用于实施本发明的示例性核酸在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、或更多个残基的一段区域上具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更多的、或完全的(100%)序列同一性的核酸序列,所述示例性核酸序列包括SEQ ID NO:1、SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、和/或SEQ ID NO:15,其中这些核酸编码:至少一个具有纤维素酶活性的多肽,具体是基于示例性SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14的属(genus),和/或至少一个具有淀粉酶活性的多肽,具体是基于示例性SEQ ID NO:16的属。

本文公开的组合物和方法包括使用分离的、合成的或重组的具有纤维素酶活性的多肽,具体是基于示例性ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、和/或SEQ ID NO:14的属,和/或具有淀粉酶活性的多肽,具体是基于示例性SEQ ID NO:16的属。

在一些方面,用于实施本发明的多肽具有淀粉酶或纤维素酶活性,其是热稳定的。该多肽在以下的条件下保留淀粉酶或纤维素酶活性:包括温度范围为约-100℃至约-80℃、约-80℃至约-60℃、约-60℃至约-40℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约37℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃、116℃、117℃、118℃、119℃、120℃、121℃、122℃、123℃、124℃、125℃、或更高的温度。该多肽在以下范围的温度保留淀粉酶或纤维素酶活性:约-100℃至约-80℃、约-80℃至约-40℃、约-80℃至约-60℃、约-60℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃、116℃、117℃、118℃、119℃、120℃、121℃、122℃、123℃、124℃、125℃或者更高的温度。

在一些方面,用于实施本发明的多肽具有淀粉酶或纤维素酶活性,是耐热的。该多肽在暴露于以下的温度后可保留淀粉酶或纤维素酶活性:从高于37℃至约95℃的范围,或者从高于55℃至约85℃范围中的任何温度。该多肽在暴露于以下的温度范围后可以保留淀粉酶或纤维素酶活性:在约-100℃至约-80℃、约-80℃至约-40℃、约-80℃至约-60℃、约-60℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃、116℃、117℃、118℃、119℃、120℃、121℃、122℃、123℃、124℃、125℃或更高温度。

在一些方面,该多肽在暴露于以下条件后保留淀粉酶或纤维素酶活性:温度范围从约-100℃至约-80℃、约-80℃至约-40℃、约-80℃至约-60℃、约-60℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃、116℃、117℃、118℃、119℃、120℃、121℃、122℃、123℃、124℃、125℃或更高的温度,在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH 5.5、约pH 6.0、约pH 6.5、约pH7.0、约pH 7.5、约pH 8.0、约pH 8.5、约pH 9.0、约pH 9.5、约pH 10.0、约pH 10.5、约pH11.0、约pH 11.5、约pH 12.0或更高。

可使用编码具有淀粉酶或纤维素酶活性的多肽的核酸实施本发明,其中所述核酸包含在严格条件下与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和/或SEQ ID NO:15中列出的序列杂交的序列。在一些方面,该核酸编码具有淀粉酶或纤维素酶活性的多肽。该核酸的长度可以为至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或更多个残基,或者为所述基因或者转录物的全长。在一些方面,所述严格条件包括以0.2×SSC在约65℃的温度下洗涤15分钟的洗涤步骤。本文公开的组合物和方法包括使用分离的、合成的或重组的包含与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的或者完全的(100%)序列同一性的氨基酸序列的多肽、或酶活性片段,其中所述片段为至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350或更多残基或全长的多肽。在一些方面、该多肽具有纤维素酶或者淀粉酶活性。

用于实施本发明的示例性多肽或者肽序列包括SEQ ID NO:2、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16,包括其子序列(酶活性片段)及其变体,例如,包括长度为至少约10、15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600或更多个残基的片段或者全长的酶。

用于测定淀粉酶活性或纤维素酶活性的测试,例如用于确定是否某个多肽具有所需活性的测试是本领域熟知的并在本文公开的范围内;参见例如Baker WL,Panow A,Estimation of cellulase activity using a glucose-oxidase-Cu(II)reducing assayfor glucose,J Biochem Biophys Methods.1991Dec,23(4):265-73;Sharrock KR,Cellulase assay methods:a review,J Biochem Biophys Methods.1988Oct,17(2):81-105;Carder JH,Detection and quantitation of cellulase by Congo red stainingof substrates in a cupplate diffusion assay,Anal Biochem.1986Feb 15,153(1):75-9;Canevascini G.,A cellulase assay coupled to cellobiose dehydrogenase,Anal Biochem.1985Jun,30 147(2):419-27;Huang JS,Tang J,Sensitive assay forcellulase and dextranase.Anal Biochem.1976Jun,73(2):369-77。

在一些实施方案中,用于实施本发明的多肽,不管是单独地还是与本文公开的“鸡尾酒混合物”一起,包括可催化包含葡萄糖单体的多糖水解的淀粉酶,所述多糖例如淀粉(通过1,4-α或1,6-α键连接的葡萄糖单体的聚合物)。在一些方面,该多肽具有淀粉酶活性,如:α淀粉酶活性、内切淀粉酶活性或葡萄糖淀粉酶活性;本文所用术语“淀粉酶”还包括催化多糖例如淀粉水解的酶活性。用于实施本发明的淀粉酶包括具有以下活性的多肽:α-淀粉酶活性、α-淀粉酶活性、葡萄糖淀粉酶活性、1,4-α-D-葡聚糖葡糖水解酶活性、外切淀粉酶活性、葡聚糖α-麦芽糖四水解酶(maltotetrahydrolase)活性、麦芽糖酶活性、异麦芽糖酶活性、葡聚糖1,4,α-糖苷酶活性、α-糖苷酶活性、蔗糖酶活性或者琼脂水解酶活性(如α-琼脂水解酶活性)。例如,用于实施本发明的淀粉酶包括具有α-淀粉酶活性的多肽,包括水解淀粉中的内部α-1,4-糖苷键的能力,以产生较小分子量的麦芽糊精。在一些方面,所述α-淀粉酶活性包括随机地水解淀粉中的内部α-1,4-糖苷键。用于实施本发明的淀粉酶包括具有葡糖淀粉酶活性的多肽,所述活性例如水解由α-1,4-糖苷键和α-1,6-糖苷键连接的葡萄糖聚合物的能力。在一些方面,用于实施本发明的淀粉酶包括具有葡糖淀粉酶活性的多肽,其水解内部α-1,4-糖苷键以产生较小分子量的麦芽糊精。用于实施本发明的淀粉酶包括具有葡聚糖1,4-α-糖苷酶活性的多肽或1,4-α-D-葡聚糖葡糖水解酶(通常称为葡糖淀粉酶,但也称为淀粉葡萄糖苷酶和α-淀粉酶),在一个方面,其从1,4-α-连接的葡聚糖、1,6-α-连接的葡聚糖和1,3-α-连接的葡聚糖释放α-D-葡萄糖。用于实施本发明的淀粉酶包括具有外切淀粉酶活性的多肽。

在一些实施方案中,用于实施本发明的多肽,不管是单独地还是与本文公开的“鸡尾酒混合物”一起,包括例如纤维素酶或者能够催化包含葡萄糖单体的多糖水解的纤维素酶,所述多糖例如瓜尔胶(由1,4-α键或者1,6-α键连接的葡萄糖单体的聚合物)。在一些方面,用于实施本发明的多肽,无论是单独地还是与本文公开的“鸡尾酒混合物”一起,包括本文描述的纤维素酶,具有葡聚糖酶如内切葡聚糖酶、甘露聚糖酶、木聚糖酶活性,或者这些活性的组合。在一些方面,该葡聚糖酶活性是内切葡聚糖酶活性(如:内-1,4-β-D-葡聚糖4-葡聚糖水解酶活性),并且包括水解下述物质中的1,4-β-D-糖苷键:纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)地衣淀粉、混杂的β-1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖和其他含有纤维素部分的植物材料中的β-1,4键。在可选的方面,这些葡聚糖酶如内切葡聚糖酶、甘露聚糖酶、木聚糖酶在升高或者降低的pH和温度下具有升高的活性和稳定性,包括耐热性或热稳定性。

合适的多糖底物的实例包括半乳甘露聚糖胶、瓜尔、衍生的瓜尔、纤维素和纤维素衍生物、淀粉、淀粉衍生物、黄原胶、衍生的黄原胶、以及它们的混合物。具体的实例包括但不限于瓜尔胶、瓜尔胶衍生物、豆角胶、刺梧桐树胶、黄原胶、纤维素和纤维素衍生物等。公开的酶可以针对的典型的聚合物增粘剂或胶凝剂包括瓜尔胶、羟丙基瓜尔、羧甲基羟丙基瓜尔、羟乙基纤维素、羧甲基羟乙基纤维素、羧甲基纤维素、二烷基羧甲基纤维素等。聚合物的其他实例包括但不限于磷酸甘露糖(phosphomannons)、硬葡聚糖(scerolglucon)、右旋糖酐和其他类型的聚合物。在一些实施方案中,聚合物底物是羧甲基羟丙基瓜尔。在一些实施方案中,公开的酶还可以有效水解生物胶(biogum)(如由枣浆(date syrup)或蔗糖制得的琥珀酰聚糖生物胶)。在一些实施方案中,公开的酶可以用于水解含纤维素的或含衍生的纤维素的聚合物——通常,该酶攻击纤维素骨架的糖苷键。所公开的酶可以适合用于将聚合物降解成大部分的单糖单元,在一些情况下,通过特异地水解任何纤维二糖片段的(1,4)-β-D-糖苷键中单糖单元与纤维素骨架之间的外(1,4)-β-D-糖苷键和内(l,4)-β-D-糖苷键。

本文公开的包含酶的组合物可以包含本文描述的降解多糖的酶,或者可以包含本文描述的任何降解多糖的多肽的一种、两种、三种、四种或更多种的混合物(“鸡尾酒混合物”),包括基于以下序列的属:SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16。用于实施本发明的组合物可以包含一种、两种、三种或者更多种本文描述的多肽,包括基于以下序列的属:SEQ ID NO:2、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16;并且可以包含其他酶的任何组合,所述其他酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、虫漆酶、其他纤维素酶、内切糖苷酶、内-β-1,4-漆酶、淀粉葡萄糖苷酶、其他糖苷酶、葡萄糖异构酶、糖基转移酶、脂肪酶、磷脂酶、脂肪加氧酶(lipo oxygenase)、β-漆酶、内-β-1,3(4)-漆酶、角质酶(cutinase)、过氧化物酶、淀粉酶、黄原胶酶(xanthanase)、葡萄糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质酶、支链淀粉酶、***糖胶酶(arabinanase)、半纤维素酶、甘露聚糖酶、木糖漆酶(xylolaccase)、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛酸乙酰酯酶(rhamnogalacturonan acetyl esterase)、蛋白酶、肽酶、蛋白水解酶(proteinase)、多聚半乳糖醛酸酶、鼠李半乳糖醛酸酶(rhamnogalacturonase)、半乳聚糖酶、果胶裂合酶、转谷氨酰胺酶、果胶甲酯酶、其他纤维二糖水解酶(cellobiohydrolase)和/或转谷氨酰胺酶。

本文公开的组合物和方法包括使用分离的、合成的或重组的包含这些多肽(如上文描述的属的多肽)和信号序列的多肽。信号序列可以来源于另一淀粉酶、黄原胶酶和/或糖苷酶、如纤维素酶或内切葡聚糖酶、纤维二糖水解酶(cellobiohydrolase)、甘露聚糖酶和/或β-糖苷酶或非纤维素酶、如非-内切葡聚糖酶、非-纤维二糖水解酶和/或非-β-糖苷酶(一种异源)酶。

本文公开的组合物和方法包括使用分离的、合成的或重组的不包含信号序列的、或者缺乏全部或者部分信号序列的、或包含异源信号序列的多肽,例如异源的淀粉酶或黄原胶酶或糖苷酶或纤维素酶、如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或β-糖苷酶的信号序列、或者非-淀粉酶、非-黄原胶酶或非-纤维素酶、如非-内切葡聚糖酶、非纤维二糖水解酶(noncellobiohydrolase)、和/或非-β-糖苷酶的信号序列。

本文公开的组合物和方法包括使用分离的、合成的或重组的嵌合蛋白质,其包含含有信号序列的第一结构域和包含上文所述的属的多肽的至少一个第二结构域。该蛋白质可以是融合蛋白。第二结构域可以包含几种酶或活性。该酶可以是非-酶。本文公开的组合物和方法包括使用分离的、合成的或重组的嵌合蛋白质,其包含上文所述属的多肽和信号肽(SP)、前原序列(prepro sequence)和/或催化结构域(CD),并且在一个可选的实施方案中,其包含至少另一个包含异源多肽或者肽的结构域,其中所述异源多肽或者肽与所述信号肽(SP)、前原序列和/或催化结构域(CD)并非天然相关。在一些方面,所述异源多肽或肽并非淀粉酶或黄原胶酶或纤维素酶、如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或β-糖苷酶。所述异源多肽或肽可以在信号肽(SP)、前原序列和/或催化结构域(CD)的氨基端、羧基端、或者在其两端。

在一些方面,用于实施本发明的淀粉酶和/或纤维素酶在包括约pH 6.5、pH6、pH5.5、pH 5、pH 4.5、pH 4.0、pH 3.5、pH 3.0或更低(更酸性)的条件下可以保留酶活性;或者在包括约pH 7、pH 7.5pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11.0、pH 11.5、pH12、pH 12.5或更高(更碱性)的条件下保持活性;或者可以在暴露于包括约pH 6.5、pH 6、pH5.5、pH 5、pH 4.5、pH4.0、pH 3.5、pH 3.0或更低(更酸性)的条件后保持酶活性;或者可以在暴露于包括约pH 7、pH 7.5pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11.0、pH11.5、pH 12、pH 12.5或更高(更碱性)的条件后保持酶活性;或者可以在碱性环境下保持活性。在某些方面,反应进行的pH范围是约3.0至约9.0。在其他方面,pH是约4.5或pH是约7.5或pH是约9。在碱性条件下进行的反应条件也可以是有利的,例如在本文公开的酶的一些工业应用中。

本发明提供了包含本文描述的几类多肽(包括肽)的任何成员的蛋白制剂,其中所述蛋白制剂包括液体、固体或凝胶;并且用于实施本发明的几类多肽(包括肽)的任何成员可以是包含本文描述的多肽的异二聚体,例如:其中异二聚体的第二成员可以是不同的淀粉酶或黄原胶酶或纤维素酶、如内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或β-糖苷酶、一种不同的酶或另一蛋白。在一些方面,所述第二结构域可以是多肽,所述异二聚体可以是融合蛋白。在一些方面,所述第二结构域可以是表位或者标签。在一些方面,本发明提供了用于实施本发明的包含多肽的同二聚体(homodimer)。

本发明的实施可以使用固定化的具有本文描述的淀粉酶和/或纤维素酶活性的多肽(包括肽);一个多肽可以具有至少一个另外的(第二)结构域。在一些方面,所述多肽可以被固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠、凝胶、平板、阵列或毛细管上。

用于实施本发明的淀粉酶和/或纤维素酶的制备可以通过在任何有机体如细菌、酵母、植物、昆虫、真菌和/或动物中表达编码该酶的多核苷酸。所述有机体可以是例如荧光假单胞菌(P.flourescencs)、裂殖酵母(S.pombe)、酿酒酵母(S.cerevisiae),毕赤酵母(Pichia pastoris)、大肠杆菌(E.coli)、链霉菌属(Streptomyces sp.)、杆菌属(Bacillussp.)或乳杆菌属(Lactobacillus sp.)。

用于实施本发明的淀粉酶和/或纤维素酶可通过在(如包含热稳定的重组酶的)酶递送基质中配制,如作为包含颗粒载体和热稳定重组酶的小丸(pellets)形式的酶递送系统,其中所述小丸容易将其中包含的酶分散到水性介质中,并且将该酶递送基质给予所需环境,如返排液中。

本发明提供了以多种形式和制剂使用的组合物和酶。在本文公开的方法中,这些酶以多种形式和制剂使用。例如,纯化的多肽可以在钻井或断裂应用中以酶制剂使用。

在另一个实施方案中,本发明包括SEQ ID NO:1,其中所述序列编码蛋白质。在又一实施方案中,本发明包括编码来源于海栖热袍菌的纤维素酶的核苷酸序列或SEQ ID NO:3,其包括选自以下的至少一个突变:T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C、A6C、G6C、A9C、G9C、A15G、C15G、T22C、G22C、A24T、C24T、T33C、G33C、T39C、G39C、T40C、G40C、T42C、G42C、T54C、G54C、T57C、G57C、A66C、G66C、C81A、T81A、T84C、G84C、或其任何组合,其中任选地,任何这样的突变都是沉默的。在本发明的又一实施方案中,至少一个这样的沉默突变导致所述纤维素酶以高于缺失至少一个这样的突变的核苷酸序列的水平表达。

在本发明的另一实施方案中,本发明包括来自于海栖热袍菌的下述核苷酸序列,所述核苷酸序列具有至少一个突变,并且与海栖热袍菌野生型基因组序列相比,具有升高的由所述核苷酸序列编码的蛋白质的表达水平,其中任选地,所述一个或者多个突变是沉默的。

在本发明的另一个实施方案中,本发明包括编码SEQ ID NO:2的多肽的第一核苷酸序列,其中所述核苷酸序列相对于编码SEQ ID NO:2的第二序列已被突变,使得所述蛋白质的表达水平相对于由所述第二核苷酸序列编码的蛋白质的表达水平升高。

在本发明的另一个实施方案中,本发明包括编码与SEQ ID NO:2有至少50%、60%、70%、80%、90%、95%、97%、98%、99%或100%同一性的蛋白质的核苷酸序列或其片段,其中所述核苷酸序列包括至少一个选自以下的突变:T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C、A6C、G6C、A9C、G9C、A15G、C15G、T22C、G22C、A24T、C24T、T33C、G33C、T39C、G39C、T40C、G40C、T42C、G42C、T54C、G54C、T57C、G57C、A66C、G66C、C81A、T81A、T84C、G84C、或其任何组合。

在本发明的另一个实施方案中,本发明的任何蛋白质均在细菌表达系统中表达,其中所述细菌表达系统是革兰氏阴性细菌系统,如假单胞菌(Pseudomonas)表达系统、大肠杆菌表达系统、青枯菌(Ralstonia)表达系统或柄杆菌(Caulobacter)表达系统。

在本发明的另一个实施方案中,本发明的纤维素酶的表达产生至少1.0g/L、2.0g/L、3.0g/L、4.0g/L、5.0g/L、6.0g/L、7.0g/L、8.0g/L、9.0g/L、10.0g/L、11.0g/L、12.0g/L、13.0g/L、14.0g/L、15.0g/L、16.0g/L、17.0g/L、18.0g/L、19.0g/L、20.0g/L、21.0g/L、22.0g/L、23.0g/L、24.0g/L、25.0g/L、26.0g/L、27.0g/L、28.0g/L、29.0g/L、30.0g/L、31.0g/L、32.0g/L、33.0g/L、34.0g/L或35.0g/L。

在本发明的另一个实施方案中,本发明的纤维素酶与第二种酶组合,其中所述第二种酶选自由以下组成的组:乳糖酶、脂肪酶、蛋白酶、过氧化氢酶(catalase)、木聚糖酶、纤维素酶、葡聚糖酶、甘露聚糖酶、淀粉酶、酰胺酶、环氧化物水解酶、酯酶、磷脂酶、转氨酶、胺氧化酶、纤维二糖水解酶、解氨酶(ammonia lyase)、或其任何组合。

在本发明的另一个实施方案中,本发明包括分离的、重组的或合成的核苷酸,其具有包含SEQ ID NO:1的核酸序列,其中所述核酸序列编码具有纤维素酶活性的多肽。

在本发明的另一个实施方案中,本发明包括分离的、重组的或合成的核苷酸,包含SEQ ID NO:1的核酸序列,其中所述核酸序列编码具有纤维素酶活性的多肽,并且所述多肽包含SEQ ID NO:2的氨基酸序列、或其酶活性片段。

在本发明的另一个实施方案中,本发明包括分离的、重组的或合成的包含编码具有纤维素酶活性的多肽的SEQ ID NO:1的核酸序列,其中所述多肽包含SEQ ID NO:2的氨基酸序列,并且所述多肽在重组的荧光假单胞菌(Pseudomonas fluorescens)表达系统中产生。

在本发明的另一个实施方案中,本发明包括一种处理用于油或气操作中或者由油或者气操作产生的返排液的方法,所述方法包括:(a)向返排液提供酶或者酶处理物;(b)使所述酶或者酶处理物将返排液中含多糖或淀粉的材料降解,其中所述酶或酶处理物可有效降解(break down)或者水解返排液中含多糖或淀粉的材料,其中任选地,所述酶是纤维素酶或淀粉酶。在处理返排液的方法的另一个实施方案中,所述酶或酶处理物包括淀粉酶,其中所述淀粉酶包括具有与SEQ ID NO:16具有至少以下同一性的氨基酸序列的多肽、或酶活性片段:约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)。在处理返排液的方法的又一实施方案中,所述酶或酶处理物包括纤维素酶,其中所述纤维素酶包括具有与SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12和/或SEQ ID NO:14具有至少以下同一性的氨基酸序列的多肽、或酶活性片段:约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全的(100%)。

在本发明的另一个实施方案中,本发明包括含有以下物质的组合物:聚合物增粘剂、表面活性剂、热稳定剂和酶降解剂(enzyme breaker),包括来源于极端嗜热细菌的野生型纤维素酶,或者其突变变体。在该组合物的其他实施方案中,该增粘剂是瓜尔胶,包括线性瓜尔、交联瓜尔或其混合物。在该组合物的其他实施方案中,所述酶降解剂特异地水解瓜尔胶中的β-1,4糖苷键。在该组合物的其他实施方案中,该酶降解剂不特异地水解瓜尔胶中的α-1,6糖苷键。在该组合物的其他实施方案中,该酶降解剂在最高达约275° F的温度下保留其水解瓜尔胶中的β-1,4糖苷键的能力。在该组合物的其他实施方案中,其中该酶降解剂在最高达约11的pH下保留其水解瓜尔胶中的β-1,4糖苷键的能力。在该组合物的其他实施方案中,所述酶降解剂具有SEQ ID.NO.2。在该组合物的其他实施方案中,该酶降解剂由具有SEQ ID NO:1的多核苷酸编码。在任一以上组合物的其他实施方案中,该酶降解剂是野生型纤维素酶的突变变体,并且在约pH 6.5时具有高于该野生型纤维素酶的熔化温度至少20° F、且在约pH10.5时具有高于该野生型纤维素酶的熔化温度至少10° F的熔化温度。在任何上述的组合物的其他实施方案中,进一步包含酯,其中任选地,所述酯选自由以下组成的组:乙酸乙酯、2-乙氧基乙基乙酸酯、乙酰乙酸乙酯、苯甲酸甲酯、甲酸乙酯、乙酸甲酯、和邻苯二甲酸二甲酯。

在另一个实施方案中,本发明包括包含由SEQ ID NO 1编码的多肽的动物饲料或动物饲料添加剂。在另一个实施方案中,所述动物饲料或动物饲料添加剂有助于或有利于消化粮食。

本文引用的所有出版物、专利、专利申请、GenBank序列和ATCC保藏物,均就全部目的、以其各自整体地明确地引入本文。

具体实施方式

海栖热袍菌是一种嗜热真细菌,其特征在于其在极端盐浓度(即:从0.25%NaCl至6.00%NaCl)下生长的能力。海栖热袍菌属于热胞菌目(Thermotogale),该目成员嗜热、杆状,为厌氧且革兰氏阴性的。对于生长,最低温度是大约55℃,最佳是80°-85℃,最高为约90℃。在一些实施方案中,最低温度低于55℃,最高温度高于90℃。这些细菌缓慢地从真杆菌界中的最深分支之一演化。热胞菌目成员已经被描述为“广泛传播的和世界性的”(Huber,R.等人,2006),在活跃的地热区旺盛生长。海栖热袍菌与新阿波罗栖热袍菌(Thermotoganeapolitana)、Thermotoga petrophila和超嗜热古细菌(Thermotoga naphthophila)的菌种密切相关。已从意大利的Vulcano、亚速尔群岛(Azores)的利贝拉广场(Riberia Quente)和圣米格尔岛(Sao Miguel Island)以及印度尼西亚的Sangeang岛和裴济岛的海底获得海栖热袍菌的样本(Huber,R.等人,2006)。

菌株MSB8分离自意大利Vulcano的地热加热的海洋沉积物(Huber,1986)。收集位点的温度范围是70-100℃,pH为6.5-7.0。该菌株已作为DSM 3109保藏于德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen),并作为ATCC43589保藏于ATCC(Huber,R.等人,2006)。

由于海栖热袍菌菌株MSB8产生的酶的出色的热稳定性,所以已经对海栖热袍菌菌株MSB8的酶编码基因进行了研究。Liebl(Liebl,W.等人,1996)已经发表了《Analysis of aThermotoga maritima DNA fragment encoding two similar thermostable celluases,CelA and CelB,and characterization of the recombinant enzymes》。另外,淀粉分解酶(Bibel,M.等人,1998)、反螺旋酶(reverse gyrase)(Bouthier de la Tour,C.等人,1998)、α-淀粉酶(Liebl,W.等人,1997)、α-葡糖醛酸糖苷酶(Ruile,P.等人,1997)、木聚糖酶(Winterhalter,C.等人,1995)、β-糖苷酶(Liebl,W.等人,1994)、葡聚糖转移酶(Liebl,W.等人,1992)的基因已经被分离和分析。Bronnenmeier的研究(Bronnenmeier,K.等人,1995)《Purification of Thermotoga maritima enzymes for the degradation ofcellulosic materials》已经证明,这些酶对于降解纤维素和木聚糖是有价值的。

表达系统

在一些实施方案中,可以将本发明的编码纤维素酶的DNA引入质粒上或者稳定地转化到例如革兰氏阴性菌系统的任何成员的基因组中,所述革兰氏阴性菌系统例如大肠杆菌、假单胞菌菌种例如荧光假单胞菌、恶臭假单胞菌(Pseudomonas putida)、绿脓假单胞菌(Pseudomonas aeruginosa)、雷尔氏菌菌种(Ralstonia)种或柄杆菌(Caulobacter)菌种。类似地,可以将纤维素酶引入任何革兰氏阳性菌表达系统的任何成员中,所述革兰氏阳性菌表达系统例如杆菌(Bacillus)菌种例如枯草芽孢杆菌(Bacillus subtilis)、巨大芽孢杆菌(Bacillus megaterium)、短芽孢杆菌(Bacillus brevis)、乳球菌(Lactococcus)菌种例如乳酸乳球菌(Lactococcus lactis)、乳杆菌(Lactobacillus)菌种、链霉菌(Streptomyces)菌种例如变铅青链霉菌(Streptomyces lividans)。其他革兰氏阴性的、革兰氏阳性的或者无关的真细菌或者古细菌的表达系统可以用于表达纤维素酶。

用于实施本发明的多肽可以使用本领域已知的操作在微生物中表达。在其他方面,用于实施本发明的多肽可以在用于本文公开的方法中之前被固定在固体支持物上。将酶固定在固体支持物上的方法是本领域公知的,例如J.Mol.Cat.B:Enzymatic 6(1999)29-39;Chivata等人Biocatalysis:Immobilized cells and enzymes、J Mol.Cat.37(1986)1-24:Sharma等人,Immobilized Biomaterials Techniques and Applications,Angew.Chem.Int.Ed.Engl.21(1982)837-15 54:Laskin(Ed.),Enzymes and ImmobilizedCells in Biotechnology。用于实施本发明的多肽可被重组表达。用于实施本发明的多肽可以包括由基于以下序列的核酸的属编码的重组蛋白:SEQ ID NO:1、SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和/或SEQ ID NO:15(以编码如SEQ IDNO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQID NO:16)。

示例性多肽SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16(例如由SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和/或SEQ ID NO:15分别编码的)可用于降解(或者水解)β-连接的碳水化合物,例如瓜尔胶、衍生的瓜尔(羟丙基瓜尔、羧甲基瓜尔、羧甲基羟丙基瓜尔)和羧甲基纤维素。所述酶的作用模式包括内切糖苷酶和外切糖苷酶活性,这使得它们能够通过在长多糖链内的切割并且通过从聚合物的末端切割二糖单元来有效地降低粘性。它们还具有广谱的甘露聚糖酶活性。

在一些实施方案中,SEQ ID NO:1用于指导在多个系统中升高水平的表达,在该表达系统中,所公开的纤维素酶可以被表达。SEQ ID NO:1可以被引入表达系统的任何成员中,从而以升高的累积水平表达所公开的纤维素酶。例如,SEQ ID NO:1可以被引入质粒上,或者被稳定地转化到革兰氏阴性菌系统的基因组中,所述革兰氏阴性菌系统例如大肠杆菌、假单胞菌种例如荧光假单胞菌、恶臭假单胞菌(Pseudomonas putida)、绿脓假单胞菌(Pseudomonas aeruginosa)、雷尔氏菌(Ralstonia)菌种或柄杆菌(Caulobacter)菌种。类似地,也可以将SEQ ID NO:1引入任何革兰氏阳性菌表达系统的任何成员中,所述革兰氏阳性菌表达系统例如杆菌(Bacillus)菌种例如枯草芽孢杆菌(Bacillus subtilis)、巨大芽孢杆菌(Bacillus megaterium)、短芽孢杆菌(Bacillus brevis)、乳球菌(Lactococcus)菌种例如乳酸乳球菌(Lactococcus lactis)、乳杆菌(Lactobacillus)菌种、链霉菌(Streptomyces)菌种例如变铅青链霉菌(Streptomyces lividans)。其他革兰氏阴性的、革兰氏阳性的或者无关的真细菌或者古细菌的表达系统可以用于表达SEQ ID NO:1。在又一个实施方案中,可以将SEQ ID NO:1引入真核表达系统的任何成员中,所述真核表达系统例如酵母(Saccharomyces)、粟酒裂殖酵母(Schizosaccharomyces pombe)、毕赤酵母(Pichiapastoris)和多形汉逊酵母(Hansanuela polymorpha)。

更具体地,可以将SEQ ID NO:1引入质粒中,以引导其表达。可被引入SEQ ID NO:1的质粒包括例如pQE、pET和pASK家族的大肠杆菌表达载体;以及pCN51 LT8、RSF1010、pWZ112T和pMYC家族的假单胞菌属表达载体;pBAX、pHT01和pHIS1525家族的杆菌属表达载体;pIJ6021和pIJ2460家族的链霉菌属表达载体;以及pNZ9530和pNZ8148家族的乳球菌表达载体。这些实例仅用于示例的目的,并不表示一套完整的可表达SEQ ID NO:1的多核苷酸序列的载体。

在一些实施方案中,表达系统可以为本领域已知的任何荧光假单胞菌表达系统,例如可从Dow Global Technologies Inc.商购的荧光假单胞菌表达系统、菌株DC454(美国专利公开申请第20050130160号和美国专利公开申请第20050186666号)。编码纤维素酶或多肽的核酸序列被***pMYC载体中(Dow Global Technologies Inc.,美国专利公开申请第20050130160号),或者被***pDOW1169载体中(Dow Global Technologies Inc.,美国专利公开申请第20080058262号),然后通过电穿孔引入荧光假单胞菌宿主中。本领域技术人员将知晓可用作本发明的实施方案的可选载体。

在一些实施方案中,所述纤维素酶至少在如下的表达水平表达:1.0g/L、2.0g/L、3.0g/L、4.0g/L、5.0g/L、6.0g/L、7.0g/L、8.0g/L、9.0g/L、10.0g/L、11.0g/L、12.0g/L、13.0g/L、14.0g/L、15.0g/L、16.0g/L、17.0g/L、18.0g/L、19.0g/L、20.0g/L、21.0g/L、22.0g/L、23.0g/L、24.0g/L、25.0、g/L、26.0g/L、27.0g/L、28.0g/L、29.0g/L、30.0g/L、31.0g/L、32.0g/L、33.0g/L、34.0g/L、35.0g/L或更高。

核酸

本发明提供分离的、合成的或重组的核酸,包括与本文公开的核酸序列完全互补的核酸(互补(非编码)序列和编码序列在下文中统称为本文公开的核酸序列)。

本发明提供分离的、合成的或重组的核酸,包括编码至少一个具有纤维素水解活性的多肽的核酸,其中所述核酸包含与本文公开的示例性核酸(包括SEQ ID NO:1、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和/或SEQ ID NO:15的序列)具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的或完全的(100%)的序列同一性(同源性)的序列。例如,本发明提供分离的、合成的或重组的核酸,包括核酸序列SEQ ID NO:1(本发明的一个示例性多核苷酸序列)。本发明提供分离的、合成的或重组的核酸,其编码包含如SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16(本发明的示例性多肽序列)所示的序列的多肽、及其酶活性片段。

多肽

本文公开的多肽和肽是分离的、合成的或重组的多肽。肽和蛋白质可以在体外或者体内重组表达。本文公开的肽和多肽可以使用本领域已知的任何方法进行制得到和分离。本文公开的多肽和肽也可以使用本领域周知的化学方法全部地或者部分地合成。例如,纤维素酶多肽可以在标准的重组表达系统(如本文描述的)中表达、经化学合成或者从天然表达该纤维素酶多肽的有机体中纯化。

本发明提供分离的、合成的或重组的具有纤维素水解活性的多肽,其包含与本文公开的示例性氨基酸序列(如SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14和/或SEQ ID NO:16)具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的或具有100%(完全的)序列同一性的氨基酸序列或酶活性片段。

本发明提供分离的、合成的或重组的多肽,其包含如SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16所示的序列及其酶活性片段和其变体。

在可选的实施方案中,本发明提供具有纤维素水解活性但是缺少信号序列、前原结构域(prepro domain)、锚定(dockerin)结构域和/或碳水化合物结合模块(CBM)的多肽(以及其编码核酸);并且在一个方面,所述碳水化合物结合模块(CBM)包括或由下述模块组成:纤维素结合模块、木质素结合模块、木聚糖结合模块、木糖结合模块、甘露糖结合模块、木葡聚糖特异的模块和/或***呋喃糖苷结合模块。

在可选的实施方案中,本发明提供具有纤维素水解活性并且还包含异源序列的多肽(以及编码它们的核酸);并且在一个方面,所述异源序列包含编码以下的序列或者由其组成:(i)异源信号序列、异源碳水化合物结合模块、异源锚定结构域、异源催化结构域(CD)或其组合;(ii)(i)的序列,其中所述异源信号序列、碳水化合物结合模块或催化结构域(CD)来源于异源酶;或者,(iii)标记、表位、靶向肽、可切割的序列、可检测的部分或酶;并且在一个方面,所述异源碳水化合物结合模块(CBM)包括或者由下述模块组成:纤维素结合模块、木质素结合模块、木聚糖结合模块、木糖结合模块、甘露糖结合模块、木葡聚糖特异的模块和/或***呋喃糖苷结合模块;并且在一个方面,所述异源信号序列将被编码的序列靶向至液泡、内质网、叶绿体或淀粉粒。

酶活性

所公开的纤维素酶对pNP-β-D-乳吡喃糖苷的酶水解可用作本文公开的酶例如SEQID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12活性的测量。对硝基苯酚的释放可在405nm通过分光光度法跟踪。在405nm处吸光度的升高可以通过使用在那些限定条件下的标准品吸光度被转化为微摩尔(μmole)的对硝基苯酚。一单位活性被定义为:在pH 7.00和80℃,在一分钟期间从2mM的pNP-β-D-乳吡喃糖苷释放0.42微摩尔的对硝基苯酚所需的酶量(Advances in Carbohydrate Chemistry和Biochemistry,Academic Press,1999)。

热稳定性

在一些方面,本发明的重组核酸编码具有纤维素水解活性的热稳定的多肽。例如:本文公开的多肽,SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16或由本文公开的酶演变而来的变体可能是热稳定的。本发明的热稳定多肽在包括以下温度的条件下可以保留结合活性和/或酶活性如纤维素水解活性:温度范围在大于37℃至约95℃、或约55℃至约85℃、或约70℃至约75℃、或约70℃至约95℃、约90℃至约95℃、约95℃至约105℃、或约95℃至约110℃。在一些方面,其中所述多肽在包括以下温度的条件下可以保留结合活性和/或酶活性如纤维素水解活性:1℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃。在一些方面,本文公开的多肽在包括以下温度的条件下可以保留结合活性和/或酶活性如纤维素水解活性:90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、103.5℃、104℃、105℃、107℃、108℃、109℃或110℃或更高。在一些实施方案中,本发明的热稳定多肽在上文描述的温度范围内、在包括以下的酸性条件下保持活性(如纤维素酶水解活性):约pH 6.5、pH6、pH 5.5、pH 5、pH 4.5或pH4或更低(酸性更高),或者在暴露于包括以下的酸性环境后保留纤维素水解活性:约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4或更低(酸性更高);或者在包括以下的碱性条件下保留活性:约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11、pH 11.5、pH 12、pH 12.5或更高(碱性更强),或者在暴露于包括以下的碱性条件后保留纤维素水解活性:约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH10.5、pH 11、pH 11.5、pH 12、pH12.5或更高(碱性更强)。

耐热性

在一些方面,本发明的重组核酸编码具有纤维素水解活性的耐热的多肽。例如:本文公开的多肽,SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14和/或SEQ ID NO:16或由本文公开的酶演变而来的变体可能是耐热的。在一些方面,所述纤维素水解活性是耐热的,例如:其中所述多肽在暴露于如下温度范围后保留纤维素水解活性:从大于37℃至约95℃、或约55℃至约85℃、或约70℃至约75℃、或约70℃至约95℃、约90℃至约95℃、约95℃至约105℃、或约95℃至约110℃。在一些方面,其中所述多肽在暴露于包括以下温度范围的条件后保留纤维素水解活性:约1℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃。在一些方面,本文公开的多肽在暴露于最高至以下的温度后可以保留纤维素水解活性:90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、107℃、108℃、109℃或110℃或更高。在一些方面,由本文公开的核酸编码的多肽在包括以下的酸性条件下保留纤维素水解活性:约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4或更低(酸性更强),或者在暴露于包括以下的酸性条件后保留纤维素水解活性:约pH6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4或更低(酸性更强);或者在包括以下的碱性条件下保留活性:约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH9.5、pH10、pH 10.5、pH 11、pH 11.5、pH 12、pH 12.5或更高(碱性更强)。

纤维素消化

在一些方面,本文公开的组合物和方法用于生物质的酶消化中,并且可以包括使用多种不同的酶,包括纤维素酶和半纤维素酶。用于实施本发明的纤维素酶可以将纤维素消化成葡萄糖。在一些方面,用于实施本发明的组合物可以包括酶的混合物,所述酶如木聚糖酶、木糖苷酶(如β-木糖苷酶)、纤维二糖水解酶和/或***呋喃糖苷酶(arabinofuranosidase)或其他可以将半纤维素、纤维素和木质纤维素材料消化成可发酵的糖和/或单体糖的酶。

本文公开的酶,如内切葡聚糖酶,被用于消化纤维素或任何包含β-l,4-连接的葡聚糖的合成的或天然的材料,包括那些在任何植物材料中发现的材料。本文公开的酶,如内切葡聚糖酶,被用作商购酶来消化来自任何来源的纤维素,所述来源包括所有生物来源,例如植物生物质,如玉米、谷物、草(如:印度草,例如印度落芒草(Sorghastrum nutans);或者柳枝稷(switch grass),例如稷种(Panicum species);例如柳枝稷(Panicum virgatum));或者木材或者木材加工副产品,例如在木材加工、纸浆和/或造纸工业中,在纺织制造中和在家用和工业用洗涤剂中和/或在生物质废物加工中。

膳食

在一些实施方案中,本发明的纤维素酶可以用于预处理、修饰或消化动物用或者人用的食品、食品添加剂或膳食补充剂。在一些实施方案中,本发明的纤维素酶可以用作动物用或人用的食品、食品添加剂或膳食补充剂。在一些方面,所述纤维素酶治疗消化紊乱或者起到预防消化紊乱的作用。在本发明的一些方面,所述纤维素酶改变或者增强消化。在本发明的一些方面,所述纤维素酶增强、改变或有助于消化食物。在本文公开的又一方面,所述纤维素酶增强、有助于或改变食物的营养价值。在又一方面,所述纤维素酶在消化道中例如在胃和/或小肠中有活性。

在一些实施方案中,本文公开的纤维素酶可以用作动物饲料或动物饲料添加剂。在一些实施方案中,所述纤维素酶的热稳定性和耐热性使得可以形成丸粒,而不需要第二种试剂例如盐或蜡。可以将本领域技术人员已知的任何制剂的包含纤维素酶的动物饲料提供给动物。动物饲料制剂的实例包括但不限于递送基质、丸粒、片剂、凝胶、液体、喷雾、磨碎的颗粒或粉末。

本发明提供可食用的酶递送基质,其包含热稳定的重组纤维素酶,如本文公开的多肽。本发明提供了将纤维素酶补充剂递送给动物的方法,所述方法包括:制备丸粒形式的包含颗粒状可食用载体和热稳定的重组纤维素酶的可食用的酶递送基质,其中所述丸粒容易将其中含有的纤维素酶分散到水性介质中,并将所述可食用的酶递送介质给予动物。所述重组纤维素酶酶可以包括本文公开的多肽。所述颗粒状可食用载体可包括选自由以下组成的组的载体:谷物胚芽、用了油的谷物胚芽、干草、紫花苜蓿、梯牧草、大豆豆荚、葵花籽粕和麦粉(wheat midd)。所述可食用载体可包括用了油的谷物胚芽。所述纤维素酶可被糖基化,以在制粒条件下提供热稳定性。所述递送介质可通过将包含谷物胚芽和纤维素酶的混合物制粒形成。制粒条件可包括施加蒸汽。在一些实施方案中,制粒条件可包括施加超过约80℃的温度约五分钟,并且所述酶保留至少350至约900单位/毫克酶的比活。

制备乙醇的方法

本发明提供了制备乙醇的方法,包括使含有淀粉的组合物与具有纤维素水解活性的多肽例如SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12,和/或SEQ ID NO:14的酶或其酶活性片段接触,其中所述多肽具有本文所公开的序列,或者所述多肽由包含本文公开的序列的核酸编码。本发明提供了包含淀粉和具有纤维素水解活性的多肽或其酶活性片段的组合物,其中所述多肽具有本文公开的序列,或者所述多肽由包含本文公开的序列的核酸编码。

酿造和发酵

本发明提供了酿造(如发酵)包含本文公开的纤维素酶的啤酒的方法。在一个示例性工艺中,分解并加工含有淀粉的原材料,以形成麦芽。本文公开的酶在发酵过程中的任意点使用。本文公开的纤维素酶可以用于酿造工业中,用于降解β-葡聚糖。在一些方面,本文公开的纤维素酶用于酿造工业中用于使饮料澄清。本文公开的酶可在提高麦芽汁或啤酒的滤过性方面用于饮料工业,如在例如美国专利No.4,746,517中所述。

在一些方面,本文公开的纤维素酶用于淀粉糖化和转换过程。在酿造和发酵工业中,淀粉糖化和转换过程在太低而不能促进水溶性葡聚糖、甘露聚糖、***木聚糖(arabinoxylan)或木聚糖或者其它多糖的充分水解的温度下进行。这些聚合物形成会在淀粉糖化麦芽汁中引起粘度增加的树胶状底物,导致更长的麦芽浆流出、因无效过滤而在最终啤酒产物中产生的残留浑浊物和沉淀、以及较低的萃取率。

在一些方面,本文公开的纤维素酶用于麦芽制造厂的操作中,例如,将葡聚糖酶添加到加工用水中,以缩短萌发时间和/或促进质量差的大麦转化为可接受的麦芽。在一些方面,本文公开的酶用于淀粉糖化,例如,加入它们以增加麦芽汁的滤过性和/或改善过滤(将麦芽汁与麦芽浆分离)。在一些方面,本文公开的酶用于发酵罐和/或沉降罐中,以帮助混浊物澄清和/或改善过滤。在一些方面,本文公开的酶用于辅料酿造(adjunct brewing),例如:加入本文公开的葡聚糖酶,以分解葡聚糖、甘露聚糖、***木聚糖或木聚糖、或者其他来自大麦、小麦和/或其他谷类的多糖,包括麦芽中的葡聚糖。在一些方面,本文公开的酶用于麦芽酿造,例如:加入本文公开的葡聚糖,以修饰具有高葡聚糖含量的差麦芽。

本文公开的纤维素酶可用于任何啤酒或醇类饮料生产过程中,如在例如美国专利5,762,991;5,536,650;5,405,624;5,021,246;4,788,066中描述,这其中的每一份专利均通过援引全文纳入本文作为参考。

处理食品和食品加工

本文公开的纤维素酶在食品加工工业中具有多种应用。例如,在一个方面,本文公开的酶可用于改善从富油植物材料如富油籽(oil-rich seed)中提取油;例如:从大豆提取大豆油、从橄榄提取橄榄油、从油菜籽提取菜籽油和/或从葵花籽提取葵花籽油。

本文公开的纤维素酶可用于分离植物细胞材料的组分。例如,本文公开的酶可用于将富含葡聚糖的材料(如植物细胞)分离成各组分。在一些方面,本文公开的酶可用于将富含葡聚糖的或者富含油的作物分离成有价值的蛋白质和油以及外皮成分(hullfractions)。分离过程可通过使用本领域已知的方法进行。

本文公开的纤维素酶可用于水果或蔬菜汁、糖浆、提取物等的制备中,以提高产量。本文公开的酶可用于对各种植物细胞壁衍生的材料或者废料(如来自谷类、谷物、果酒或果汁生产或农业废物如蔬菜外皮、大豆豆荚、甜菜果肉、橄榄果肉、马铃薯果肉等)的酶处理(如对包含葡聚糖的植物材料的水解)中。本文公开的酶可用于改变加工后的水果或者蔬菜的一致性和外观。本文公开的酶可用于处理植物材料以促进对植物材料(包括食品)的加工,有助于对植物组分的纯化或提取。本文公开的酶可用于改善饲料价值、降低水结合能力、改善废水植物的降解性和/或改善植物材料至青贮饲料的转化等。本文公开的纤维素酶还可用于水果和酿造工业中用于设备清洗和维护。

洗涤剂组合物

本发明提供了包含本文公开的一种或者多种多肽的洗涤剂组合物、以及制备和使用这些组合物的方法。本发明纳入所有制备和使用洗涤剂组合物的方法,参见例如美国专利6,413,928;6,399,561;6,365,561;6,380,147,这其中的每一份专利均通过引用全文纳入本文作为参考。所述洗涤剂组合物可以是一个部分和两个部分的水性组合物、非水性液体组合物、模铸(cast)固体、颗粒形式、微粒形式、压缩片剂、凝胶和/或膏剂和浆体形式。本发明还提供了能够使用这些洗涤剂组合物快速除去大部分食物类污垢、食品残留膜和其他微小的食物组合物。本文公开的酶能通过催化水解淀粉多糖去除淀粉污垢。本文公开的酶可用于清洗碗盘的清洗剂中、织品洗烫洗涤剂中。实际的活性酶含量取决于洗涤剂组合物的制备方法且不是关键的,如果洗涤剂溶液具有所需的酶活性。在一些方面,存在于最终溶液中的糖苷酶的量范围在约0.001mg至0.5mg/g的洗涤剂组合物。被选择用于本发明的方法和产品中的具体的酶取决于最终的应用条件,包括物理的产品形式、使用的pH、使用的温度以及有待被降解或改变的污垢类型。可以选择酶来为给定系列的应用条件提供最佳的活性和稳定性。本文公开的洗涤剂可包括例如:阳离子型、半极性非离子型或两性离子型表面活性剂;或它们的混合物。

本发明提供清洗组合物,包括用于清洗硬质表面的洗涤剂组合物、用于清洗织物的洗涤剂组合物、洗碗盘的组合物、口腔清洁组合物、假牙清洗组合物和隐形眼镜清洁液。在一些方面,本发明提供了一种洗涤物品的方法,包括使所述物品与本文公开的多肽在充分洗涤的条件下接触。本文公开的多肽可作为洗涤剂添加剂被包含在其中。本文公开的洗涤剂组合物可以例如作为包含本文公开的多肽的手洗或者机洗洗涤剂组合物进行配制。适合预处理染色了的织物的洗衣添加剂可以包含本文公开的多肽。织物柔顺组合物可包含本文公开的多肽。可选地,本文公开的多肽可作为洗涤剂组合物被配制,用于一般的家庭硬质表面清洁操作。

油和气勘探和净化

为了提高油井和气井以及页岩气藏的生产力,一种被称“水力压裂”的高度专业化的技术被越来越多地使用。在典型的水力压裂操作中,将大体积的基于瓜尔的流体(凝胶形式,并被称为“压裂液”)在极高的静水压力下泵入井眼。加压的液体在井眼周围的岩层形成新的裂隙和断裂。压裂液中包含的沙粒移动并沉积于新形成的断裂中,并起到维持这些通道开放的作用,从而增加油流和气流。一旦砂石沉积在断裂中,就不得不降解凝胶(即使之分解),并送回表面,从而去除对油流或气流的任何阻塞。工业使用粘性分解剂(例如氧化剂、酸或酶)来降解裂解流体,并从裂隙和断裂除去任何固体凝胶残留物。

在典型的油和气钻井操作中,通过钻杆将液体泵送,并从钻头之上排出,这样的液体通常被称为“钻井液”。钻井液起到冷却钻头、向钻头加压、润滑钻头以及去除钻井位点的碎屑的作用。由于流体循环回到钻杆外表面,因此钻井碎屑通过流体被带着返回表面。携带碎屑的钻井液通常被称为“泥浆”、“污泥”或“返排物”。

泥浆、污泥或返排物中存在的常见材料是岩石和砂石以及钻井液中存在的多种烃例如油和石油。泥浆或污泥通常具有高的盐含量,这取决于钻井发生的地方。钻井液中的盐含量通常可以接近甚至高于海洋中发现的平均盐度(大约35份/1000)。此外,泥浆或者污泥已被发现含有也污染污泥的毒素和重金属。

平均钻井过程可在两个星期里每天产生300,000桶泥浆、污泥、返排物,或者相当于每口钻井4,200,000桶泥浆或污泥。在钻井过程中产生的泥浆、污泥或返排物通常被装船、暂时储存、处理和/或在***井(insertion well)中处置。

在一些实施方案中,所公开的纤维素酶用作高温粘性分解剂,以增强油和气操作。更具体地,当在油井或气井中进行水力压裂时,本发明公开的纤维素酶被应用至压裂液。

由SEQ ID NO:1编码的酶、以及由本文公开的其他多核苷酸例如SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和/或SEQ ID NO:15编码的、或者可通过本文公开的方法获得的纤维素酶和淀粉酶,潜在地可用于水解广谱的多糖——其中有许多可用于油和气钻孔、压裂和井清洁操作。所公开的纤维素酶显示广谱的β-糖苷酶活性、例如针对瓜尔胶、羟丙基瓜尔、羧甲基瓜尔、羧甲基羟丙基瓜尔、羧甲基纤维素、大麦β-葡聚糖和豆角胶的β-糖苷酶活性。酶活性模式优选内切和外切,通过在长的多糖链内切割并且还通过从聚合物的末端切割二糖单元,使得多糖例如瓜尔和衍生的瓜尔溶液的粘度有效降低。除了上述多糖外,所公开的酶的其他底物还包括能够形成线性或者交联凝胶的那些底物。合适的多糖底物的实例包括半乳甘露聚糖胶、瓜尔、衍生的瓜尔、纤维素和纤维素衍生物、淀粉、淀粉衍生物、黄原胶、衍生的黄原胶、及其混合物。具体的实例还包括但不限于瓜尔胶、瓜尔胶衍生物、豆角胶、刺梧桐树胶、黄原胶、纤维素和纤维素衍生物等。所公开的酶可以针对的典型的聚合物或胶凝剂可以包括瓜尔胶、羟丙基瓜尔、羧甲基羟丙基瓜尔、羟乙基纤维素、羧甲基羟乙基纤维素、羧甲基纤维素、二烷基羧甲基纤维素,等等。聚合物的其它实例包括但不限于磷酸甘露聚糖、硬葡聚糖、右旋糖酐和其他类型的聚合物。在一些实施方案中,聚合物底物是羧甲基羟丙基瓜尔。在一些实施方案中,所公开的酶还可有效水解生物胶(biogum)(如由枣浆或蔗糖制得的琥珀酰聚糖生物胶)。在一些实施方案中,所公开的酶可用于水解含有纤维素的或者含有衍生的纤维素的聚合物——典型地,该酶攻击纤维素骨架的糖苷键。所公开的酶可适合将聚合物降解为主要是单糖单元,在一些情况下,通过专门水解任何纤维二糖片段的(1,4)-β-D-糖苷键中单糖单元与纤维素骨架之间的外(1,4)-β-D-糖苷键和内(l,4)-β-D-糖苷键。

在使用所公开纤维素酶的每一个压裂任务中,油田操作人员通常先在工业实验室中进行酶剂量优化研究。这样的研究可包括将纤维素酶稀释至10~400ppm的浓度,并将其与线性或者交联的瓜尔胶混合(25–60lb/1,000gal)。根据应用条件,瓜尔胶可以使用交联剂交联,尤其是对于存在较高温度、压力和pH条件的井。由这样的优化研究得到的酶剂量信息随后可以用于实际的压裂任务中。

所公开的纤维素酶的独特活性使得可以在存在高温和高pH条件的深井中以平稳地和受控的方式水解基于瓜尔的压裂液。与化学分解剂相比,本发明公开的纤维素酶为苛刻的和非选择性的化学分解剂提供了非腐蚀性的且环境温和的替代品。

在本发明的一些实施方案中,所述纤维素酶可以用于处理、清洗或者改变在油和气勘探活动中使用的流体。在又一方面,本发明的纤维素酶部分地或者完全地处理或者改变流体,使该流体可以再次使用或者再循环,例如用于另外的油和气勘探活动中,或者以环境友好的方式处置。

本发明提供使用多糖降解酶处理来自油和气勘探和钻井操作的返排物的组合物和方法。在一些方面,本文公开的组合物和方法用于通过向返排液中添加多糖降解酶来降解存在于返排液中的多糖,该多糖可以包括淀粉和/或瓜尔胶。

在一些实施方案中,用于该方法中的酶是纤维素酶或淀粉酶或其组合,以处理通过油和气勘探和钻井操作产生的返排物。

在一些实施方案中,本文公开的组合物,包括如本文描述的淀粉酶和纤维素酶,被添加至返排液中。在一些实施方案中,本文公开的组合物和方法包括环境触发措施(如:pH、盐度或机械处理系统步骤),该步骤会活化本文公开的组合物,包括本文描述的淀粉酶和纤维素酶。

本文公开的包含酶的组合物可以以多种形式配制,例如作为液体、凝胶、小丸、片剂、喷雾、粉末、丸粒或胶囊形式,包括纳米胶囊形式。

完井

在钻镗孔的过程中,油和气的地层的壁被暴露。成功地完成井眼需要将低浸透性滤饼沉积在井眼壁上,以密闭由钻头暴露的浸透性地层(permeable formation)。滤饼可以局限钻井液自井眼流失,并通过浸透到井眼中的流体保护天然地层免于可能的损害。返排液中的固体也可能破坏地层,特别是细岩屑(drilling fines)。在形成滤饼时进入地层的微细颗粒悬浮液被称为“溅射泥浆(mud spurt)”,随后进入的液体被称为“滤液”。对于要形成的滤饼,钻井液必须包含大小仅略小于地层的孔开口的一些颗粒。这些颗粒被称为桥连颗粒(bridging particle),其陷入表面的孔中,由此形成在地层的孔上的桥。构成滤饼的流体还可含有用于悬浮固体和用于通过封装(encapsulating)桥连颗粒减少液体通过滤饼流失的聚合物。这些可以是天然的或合成的聚合物。所述聚合物可以包括针对其流变特性而选择的一种聚合物例如黄原胶和针对减少流体损失而选择的第二聚合物例如淀粉。在钻井和其他井维修完成时,必须除去滤饼以在完成阶段产生地层流体或者使水泥与地层粘结。沉积滤饼的去除应该尽可能地完全,以恢复地层内的浸透性。典型地,当从井眼中除去滤饼或者从井眼中清洗掉滤饼时,用于形成滤饼的一些聚合物保持无损,并在返排液中被运送至表面。

水力压裂

在水力压裂过程中,在压力下将水性压裂液注入到孔洞中。压力驱使压裂液进入地层中的裂缝、裂隙和断裂处,迫使所述开口变得更大且增多。其中包含的支撑剂材料锲入扩大了的裂缝、裂隙和断裂中,以在压力减小时帮助裂缝、裂隙和断裂保持开放,并且提供改善的地层浸透性。被注入的压裂液与存在于地下环境中的地下水、气体和其他材料混合。

当除去压力时,该压裂液混合物流回表面,并从其中提取气体。提取之后的压裂液混合物被称为“返排液”、回收的水和压裂液,其从油或气钻井压裂操作中流回。该返排液通常可为被注入到井内的压裂液体积的10-60%中的任一数值,其压裂后的在几天到几周或者更长的一段时间里流回。显著量的压裂液可被保留在地层中。在某个点,在基本回收的压裂液与所产生的水之间存在转变。在Marcellus页岩层上的典型的压裂任务可能需要20,000桶至150,000桶压裂液,这取决于泵送阶段的数目。对于泵送40,000桶的压裂液的项目,负载回收率应该是50%或20,000桶返排物。在最初几周的压裂后的回收之后,额外的10,000至30,000桶返排液可以从井中流出持续两年。

返排液可以由水、注入井中的压裂化学品(包括但不限于瓜尔胶、支撑剂和交联剂)以及存在于岩层水中的任何污染物组成。除了岩层中水的自然盐度外,在压裂过程中注入井中的任何淡水往往会溶解地层中的盐,从而升高返排液中的盐度。

处理系统

美国专利第4,536,293;5,093,008;6,132,619;4,896,665;6,110,382;4,465,598;7,754,080号(全部通过援引就其各自的全文纳入本文作为参考)公开了处理来自钻井和油发现过程中的返排液的方法。用于处理返排液的该方法以及其他过滤方法具有逐渐堵塞的可能。返排物处理系统和/或滤器(包括但不限于反渗透滤器),在加工返排液中往往会逐渐被堵塞或者变得无效,原因在于返排液的粘性和/或流速。

处理返排液

本发明提供使用本文描述的一种或者多种酶或者酶鸡尾酒混合物的方法,其中所述方法通过降解返排液的粘性的含有淀粉的或者多糖的组分来处理通过钻井和勘探操作产生的返排液,或者是该处理中的一个步骤。因此,该方法降低了返排液的粘性和/或流速。

在一些方面,本发明提供:通过将水性流体和用于实施本发明的多肽掺混在一起形成酶处理物(使用用于实施本发明的酶);将酶处理物添加至返排液;使得酶处理物降解返排液中的粘性多糖材料,其中所述酶处理物可有效分解或水解所述流体中的淀粉和/或多糖组分。

在一些实施方案中,用于实施本发明的多肽可能能够分解回收的流体或者返排物中的键价。在一些实施方案中,该酶可能能够降低返排液的粘度或升高返排液的流速。

在一些实施方案中,用于实施本发明的多肽会减少用于处理返排液的系统中堵塞的可能性。

在一些实施方案中,用于所述本发明的多肽被添加至用于处理返排液的系统或者设备中。在一些实施方案中,用于实施本发明的多肽被添加至返排液中,以增强先前已知的返排液处理。

在一些实施方案中,本文公开的用于实施本发明的多肽与微生物联合使用,以处理返排液。

在一些实施方案中,使用该酶分解返排液中的材料。

在另一个实施方案中,将使用该酶降解返排液中的滤饼材料或者压裂材料。

在一些实施方案中,所描述的用于实施本发明的多肽可以被封装以稳定该酶,改善热稳定性和碱性pH耐受性,并提供受控的释放。分解剂封装组合物和方法的实例提供于美国专利第5,164,099、6,163,766、5,373,901、5,437,331和6,357,527号中,这些专利中的每一份的公开内容均通过援引纳入本文作为参考。

在一些实施方案中,用于实施本发明的多肽被封装,具有通过水解方式降解的包衣或膜,实现了之前不能提供的更好地控制释放时间和简易操作。例如,由于用于实施本发明的多肽被封装在与水发生反应的材料中、而非仅仅在水中溶解或者消散的材料中,因此释放可通过包衣与水的反应速度被控制。同样地,通过使得用于实施本发明的多肽与苛刻环境(高的温度和pH)隔离一段时间,可以提供延迟的降解。本领域技术人员要理解,包衣的反应速度(及因此分解剂的释放特征)可以有极大的改变,这取决于所采用的包封的聚合物化学品。

在一些实施方案中,所公开的酶例如纤维素酶和淀粉酶是耐热的和/或热稳定的;例如,该酶在95℃加热2分钟后可以保留至少75%残留活性(如:葡聚糖酶活性);并且在另一方面,在95℃加热30分钟后保留100%活性。在又一方面,该酶在96℃、97℃、98℃或99℃加热30分钟后保留100%活性。在又一方面,所公开纤维素酶在100℃加热30分钟后保留至少90%活性。

在一些实施方案中,本文描述的纤维素酶具有葡聚糖酶如内切葡聚糖酶、甘露聚糖酶、木聚糖酶的活性或这些活性的组合。在一些方面,所述葡聚糖酶活性是内切葡聚糖酶活性(如:内-1,4-β-D-葡聚糖4-葡聚糖水解酶活性),包括水解纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉中的1,4-β-D-糖苷键,混杂的β-1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖和其它含有纤维素部分的植物材料中的β-1,4键。在可选的方面,这些葡聚糖酶如内切葡聚糖酶、甘露聚糖酶、木聚糖酶在升高或者降低的pH和温度下具有升高的活性和稳定性,包括耐热性或热稳定性。

本文公开的一些酶的合适的多糖底物的实例包括半乳甘露聚糖胶、瓜尔、衍生的瓜尔、纤维素和纤维素衍生物、淀粉、淀粉衍生物、黄原胶、衍生的黄原胶及它们的混合物。具体的实例还包括但不限于瓜尔胶、瓜尔胶衍生物、豆角胶、刺梧桐树胶、黄原胶、纤维素和纤维素衍生物、等等。所公开的酶可以针对的典型聚合物增粘剂或胶凝剂包括瓜尔胶、羟丙基瓜尔、羧甲基羟丙基瓜尔、羟乙基纤维素、羧甲基羟乙基纤维素、羧甲基纤维素、二烷基羧甲基纤维素、等等。聚合物的其他实例包括但不限于磷酸甘露糖、硬葡聚糖、右旋糖酐和其他类型的聚合物。在一些实施方案中,聚合物底物是羧甲基羟丙基瓜尔。在一些实施方案中,所公开的酶还可以有效水解生物胶(如由枣浆或蔗糖制得的琥珀酰聚糖生物胶)。在一些实施方案中,所公开的酶可以用于水解含有纤维素的或含有衍生的纤维素的聚合物——通常,该酶攻击纤维素骨架的糖苷键。所公开的酶可适于将聚合物降解为大部分的单糖单元,在一些情况下,通过特异地水解任何纤维二糖片段的(1,4)-β-D-糖苷键中单糖单元与纤维素骨架之间的外(1,4)-β-D-糖苷键和内(l,4)-β-D-糖苷键。

附图说明

图1描绘了流变曲线的图像,其显示两种瓜尔溶液相对于时间的粘度测量,如实施例1所述。

图2描绘了SDS PAGE凝胶电泳照片,其显示不同水平的蛋白表达,如实施例3所述。

图3描绘了柱状图,其显示蛋白制剂的活性水平,如实施例4所述。

图4描绘了SEQ ID NO:1——与SEQ ID NO:3相比具有14个沉默突变的多核苷酸:T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C。

图5描绘了SEQ ID NO:2——由SEQ ID NO:1、3和4编码的多肽。

图6描绘了SEQ ID NO:3——SEQ ID NO:1和4的未经修饰的亲本多核苷酸序列。

图7描绘了SEQ ID NO:4——与SEQ ID NO:3相比具有14个沉默突变(T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C)、加上一个额外的从起始密码子的上游点突变的多核苷酸(示出了额外的上游序列)。

图8描绘了SEQ ID NO:5的核酸。

图9描绘了SEQ ID NO:6的多肽。

图10描绘了SEQ ID NO:7的核酸。

图11描绘了SEQ ID NO:8的多肽。

图12描绘了SEQ ID NO:9的核酸。

图13描绘了SEQ ID NO:10的多肽。

图14描绘了SEQ ID NO:11的核酸。

图15描绘了SEQ ID NO:12的多肽。

图16描绘了SEQ ID NO:13的核酸。

图17描绘了SEQ ID NO:14的多肽。

图18描绘了SEQ ID NO:15的核酸。

图19描绘了SEQ ID NO:16的多肽。

术语定义:

“纤维素酶”是指具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶、***呋喃糖酶和/或寡聚酶活性的酶。

“纤维素水解活性”是具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶、***呋喃糖酶、和/或寡聚酶活性的酶。

“密码子”为指定待添加到蛋白质的氨基酸身份(identity)的三个多核苷酸序列。

“沉默突变”是指密码子中不会导致规定不同氨基酸的突变。

“开放读码框”是规定蛋白质中氨基酸序列的一系列密码子。

碱基“位(置)”是指多核苷酸序列中从开放读码框的起点或者从一些其他的参照标记连续计数的碱基的数字位置。

“编码”蛋白质是规定该蛋白质的氨基酸序列。

“突变”是与参照相比核苷酸序列或者氨基酸序列中的改变。

“核苷酸”是指构成DNA序列的四个碱基之一——腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(Guanidine,G)和胞嘧啶(C)。

“海栖热袍菌基因组序列”是指由GenBank登录号AE000512规定的海栖热袍菌菌株MSB8的基因组序列。

给定蛋白质的“表达水平”是由表达系统例如转化的细胞培养物形成的如所测量的每单位体积的细胞培养物的蛋白质的量。

给定酶的“表达水平”是指由表达系统例如转化的细胞培养物形成的如所测量的每单位体积的细胞培养物的酶活性的量。

“野生型”是指可从自然界中获得的蛋白质或核酸序列。

本发明涉及如下实施方案:

1.SEQ ID NO:1的核苷酸序列。

2.实施方案1所述的核苷酸序列,其中所述序列编码蛋白质。

3.编码来源于海栖热袍菌(Thermotoga maritima)的纤维素酶的核苷酸序列,其包含至少一个选自T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C、A6C、G6C、A9C、G9C、A15G、C15G、T22C、G22C、A24T、C24T、T33C、G33C、T39C、G39C、T40C、G40C、T42C、G42C、T54C、G54C、T57C、G57C、A66C、G66C、C81A、T81A、T84C、G84C或它们的任何组合的突变。

4.SEQ ID NO:3的核苷酸序列,其包含至少一个选自T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C、A6C、G6C、A9C、G9C、A15G、C15G、T22C、G22C、A24T、C24T、T33C、G33C、T39C、G39C、T40C、G40C、T42C、G42C、T54C、G54C、T57C、G57C、A66C、G66C、C81A、T81A、T84C、G84C或它们的任何组合的突变。

5.实施方案3或4所述的核苷酸序列,其中至少一个突变是沉默的。

6.实施方案3或4所述的核苷酸序列,其中至少一个突变导致所述核苷酸序列具有下述至少一个突变:其指导所述纤维素酶以高于缺少至少一个突变且在其他方面没有不同于实施方案3或4的所述核苷酸序列的水平表达。

7.来自海栖热袍菌的核苷酸序列,其具有至少一个突变并且具有与海栖热袍菌野生型基因组序列相比升高的由所述核苷酸序列编码的蛋白质的表达水平。

8.实施方案7所述的核苷酸序列,其中所述突变是沉默的。

9.编码SEQ ID NO:2的多肽的第一核苷酸序列,其中所述核苷酸序列已经针对编码SEQ ID NO:2的第二序列进行了突变,使得所述蛋白质的表达水平相对于由所述第二核苷酸序列编码的所述蛋白质的表达水平升高。

10.编码与SED ID NO:2至少50%、60%、70%、80%、90%、95%、97%、98%、99%或100%同一性的蛋白质或其片段的核苷酸序列,其中所述核苷酸序列包含至少一个选自T6C、T9C、T15G、A22C、G24T、A33C、A39C、A40C、A42C、A54C、A57C、T66C、G81A、A84C、A6C、G6C、A9C、G9C、A15G、C15G、T22C、G22C、A24T、C24T、T33C、G33C、T39C、G39C、T40C、G40C、T42C、G42C、T54C、G54C、T57C、G57C、A66C、G66C、C81A、T81A、T84C、G84C或它们的任何组合的突变。

11.实施方案1、2、3、4、5、6、7、8、9或10所述的核苷酸序列,其编码具有纤维素酶活性的多肽。

12.细菌表达系统,其包含实施方案11所述的核苷酸序列。

13.实施方案12所述的细菌表达系统,其中所述细菌表达系统是革兰氏阴性细菌表达系统。

14.实施方案13所述的革兰氏阴性细菌表达系统,其中所述革兰氏阴性细菌是假单胞菌(Pseudomonas)、大肠杆菌(E.coli)、青枯菌(Ralstonia)或柄杆菌(Caulobacter)表达系统。

15.实施方案14所述的革兰氏阴性细菌表达系统,其中所述假单胞菌表达系统是荧光假单胞菌(Pseudomonas fluorescens)表达系统。

16.实施方案12所述的表达系统,其中所述纤维素酶以至少1.0g/L、2.0g/L、3.0g/L、4.0g/L、5.0g/L、6.0g/L、7.0g/L、8.0g/L、9.0g/L、10.0g/L、11.0g/L、12.0g/L、13.0g/L、14.0g/L、15.0g/L、16.0g/L、17.0g/L、18.0g/L、19.0g/L、20.0g/L、21.0g/L、22.0g/L、23.0g/L、24.0g/L、25.0、g/L、26.0g/L、27.0g/L、28.0g/L、29.0g/L、30.0g/L、31.0g/L、32.0g/L、33.0g/L、34.0g/L或35.0g/L产生。

17.SEQ ID NO:2所述的多肽,其中所述氨基酸序列不包含信号序列、前蛋白序列、启动子序列或它们的任何组合。

18.SEQ ID NO:2的多肽,其中所述序列还包括异源序列。

19.实施方案18所述的多肽,其中所述异源序列选自由以下组成的组:信号序列、标签、表位、启动子序列、N端延伸、C端延伸及它们的任何组合。

20.实施方案18所述的多肽,其中所述多肽还包括至少一个第二酶。

21.组合物,其包含SEQ ID NO:2的多肽,并且还包含第二酶。

22.实施方案21所述的组合物,其中所述第二酶选自由以下组成的组:乳糖酶、脂肪酶、蛋白酶、过氧化氢酶、木聚糖酶、纤维素酶、葡聚糖酶、甘露聚糖酶、淀粉酶、酰胺酶、环氧化物水解酶、酯酶、磷脂酶、转氨酶、胺氧化酶、纤维二糖水解酶、解氨酶或它们的任何组合。

23.一种分离的、重组的或合成的具有包含SEQ ID NO:1的核酸序列的核苷酸,其中所述核酸序列编码具有纤维素酶活性的多肽。

24.一种分离的、重组的或合成的包含SEQ ID NO:1的核酸序列的核苷酸,其中所述核酸序列编码具有纤维素酶活性的多肽,并且所述多肽包含SEQ ID NO:2的氨基酸序列或其酶活性片段。

25.一种分离的、重组的或合成的包含SEQ ID NO:1的核酸序列,其编码具有纤维素酶活性的多肽,其中所述多肽包含SEQ ID NO:2的氨基酸序列,并且所述多肽在重组体荧光假单胞菌(Pseudomonas fluorescens)表达系统中生产。

26.一种处理用于油或气操作或者通过油或气操作产生的返排液的方法,其包括:

(a)将酶或酶处理物提供给返排液;

(b)使所述酶或酶处理物降解所述返排液中含有多糖或者淀粉的材料,其中所述酶或酶处理物可有效降解或者水解所述返排液中包含所述多糖或者淀粉的材料。

27.实施方案26所述的方法,其中所述酶是淀粉酶和/或纤维素酶。

28.实施方案27所述的方法,其中所述淀粉酶包括具有与SEQ ID NO:16具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的氨基酸序列的多肽或其酶活性片段。

29.实施方案27所述的方法,其中所述纤维素酶包括具有与SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12和/或SEQ ID NO:14具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的氨基酸序列的多肽或其酶活性片段。

30.一种组合物,其包含聚合物增粘剂、表面活性剂、热稳定剂和酶降解剂,所述酶降解剂包括来源于极端湿热细菌的野生型纤维素酶或其突变的变体。

31.实施方案30所述的组合物,其中所述增粘剂是瓜尔胶,所述瓜尔胶包括线性瓜尔、交联瓜尔或它们的混合物。

32.实施方案30所述的组合物,其中所述酶降解剂特异地水解所述瓜尔胶中的β-1,4糖苷键。

33.实施方案30所述的组合物,其中所述酶降解剂不特异地水解所述瓜尔胶中的α-1,6糖苷键。

34.实施方案30-33中任一项所述的组合物,其中所述酶降解剂在最高达约275°F的温度下保留其水解所述瓜尔胶中的β-1,4糖苷键的能力。

35.实施方案32-34中任一项所述的组合物,其中所述酶降解剂在最高到约pH 11保留其水解所述瓜尔胶中的β-1,4糖苷键的能力。

36.实施方案30所述的组合物,其中所述酶降解剂具有SEQ ID.NO.2。

37.实施方案30所述的组合物,其中所述酶降解剂由具有SEQ ID.NO.1的多核苷酸编码。

38.实施方案30-35中任一项所述的组合物,其中所述酶降解剂是野生型纤维素酶的突变变体,并且在约pH 6.5时具有高于所述野生型纤维素酶的熔化温度至少20°F、以及在约pH 10.5时具有高于所述野生型纤维素酶的熔化温度至少10°F的熔化温度。

39.实施方案30-38中任一项所述的组合物,其还包含酯。

40.实施方案30-38中任一项所述的组合物,其中所述酯选自由以下组成的组:乙酸乙酯、2-乙酸乙氧乙酯、乙酰乙酸乙酯、苯甲酸甲酯、甲酸乙酯、乙酸甲酯和邻苯二甲酸二甲酯。

41.一种动物饲料或动物饲料添加剂,其包含由SEQ ID NO.1编码的多肽。

实施例1-SEQ ID NO.2与酯的使用

使用Grace M5600 HPHT流变仪进行流变学测试,对两个样本进行了测定,一个具有SEQ ID NO:2编码的纤维素酶,另一个是对照,没有酶。测定条件如下:样本1,包含由SEQID NO.2编码的纤维素酶,在200ppm,有0.25pptg酯、25pptg交联的瓜尔看,在pH 10.5,华氏180度;样本2,包含0.25pptg酯、25pptg交联的瓜尔,pH 10.5,华氏180度。如图1所示,包含由SEQ ID NO:2编码的纤维素酶和酯,在pH 10.5和华氏180度(下面的线)的样本达到了接近0厘泊(cP),而没有酶的对照样本保持500cP的粘度(上面的线)。

实施例2-制备增强的表达变体的方法

基于SEQ ID NO:3设计两个变体(SEQ ID NO:1和NO:4),以在DNA水平进行突变,从而改善基因表达。该设计考虑了很多可能影响基因表达的因素。使用本领域技术人员已知的PCR技术在PCR引物上引入突变。对这两个基因进行PCR扩增,并使用标准的分子克隆技术将其克隆到假单胞载体pDOW1169(DOW AgroSciences,IN)中。将所得表达构建体转化到荧光假单胞菌DC454(DOW AgroSciences,IN)中。具有SEQ ID NO:1的转化体被指定为领先序列,因为其表现出最多增强的表达。

实施例3–使用SDS-PAGE凝胶电泳和非特异性蛋白质染色来可视化由包含序列SEQ ID NO:1、3和4的构建体表达的SEQ ID NO:2多肽的表达水平。

将CriterionTM预铸三盐酸聚丙烯酰胺凝胶(Bio-rad Laboratories,Inc.)用于分离蛋白质。使用三甘氨酸缓冲液在150V跑胶(参见图1)。将每个泳道的蛋白质负载相对于来自0.33OD600细胞的负载蛋白进行标准化。使用预染色蛋白质标准品(LifeTechnologies)。凝胶用非特异性染料进行染色,并且在视觉上对每个泳道的在SEQ ID NO:2尺寸(约37千道尔顿)的条带(band)的存在进行检查。

结果表明,存在单个条带,其具有在样本间变化的累积水平,并且不存在于阴性对照。该条带具有针对SEQ ID NO:2所预期的大小。

相比于SEQ ID NO:3或阴性对照,与来自具有包含SEQ ID NO:1和SEQ ID NO:4(较少延长)的构建体的细胞的蛋白质提取物对应的泳道中的这一条带的累积水平显著更高。

实施例4–确定变体的相对表达水平的方法

将包含SEQ ID NO:1、SEQ ID NO:3和SEQ ID NO:4基因的核酸序列转化到合适的宿主细胞中,用于表达SEQ ID NO:2的蛋白质。在烧瓶中培养细胞,使被编码的蛋白质被表达。使培养物在30℃和220rpm于所设计的复合培养基中生长至OD600约为0.9,并用0.3mMIPTG(异丙基β-D-1-硫代半乳糖苷(thiogalactopyranoside))诱导24小时。收集细胞,并通过声处理或者在80℃热处理1小时对其进行裂解。通过基于对硝基苯(pNP)的分析使用pNP--D-乳吡喃糖苷作为底物测量纤维素酶活性(Advances in Carbohydrate Chemistryand Biochemistry,Academic Press,1999)。活性水平被度量为U/ml,如图2所示,以确定来自每个培养物的相对表达水平。

结果表明,具有包含SEQ ID NO:1的构建体的细胞表现出比那些具有SEQ ID NO:4的细胞显著更多的SEQ ID NO:2活性,并且SEQ ID NO:1和4两者产生了比具有SEQ ID NO:3的细胞更大量活性的表达蛋白质。

序列表

<110> 维莱尼姆公司

<120> 编码纤维素酶的基因

<130> FP1V141341LD/USKMOB/RR

<150> 61/618610

<151> 2012-03-30

<150> 61/704368

<151> 2012-09-21

<160> 16

<170>用于Windows版本4.0的FastSEQ

<210> 1

<211> 954

<212> DNA

<213> 人工序列

<220>

<223> 编码赋予增强的蛋白质表达的SEQ ID NO: 2的开放读码框

<400> 1

atgggcgtcg atccgtttga acgtaacaaa atcttgggcc gcggcattaa tatcggcaat 60

gcgctcgaag caccaaatga aggcgactgg ggagtggtga taaaagatga gttcttcgac 120

attataaaag aagccggttt ctctcatgtt cgaattccaa taagatggag tacgcacgct 180

caggcgtttc ctccttataa aatcgagcct tctttcttca aaagagtgga tgaagtgata 240

aacggagccc tgaaaagagg actggctgtt gttataaata ttcatcacta cgaggagtta 300

atgaatgatc cagaagaaca caaggaaaga tttcttgctc tttggaaaca aattgctgat 360

cgttataaag actatcccga aactctattt tttgaaattc tgaatgaacc tcacggaaat 420

cttactccgg aaaaatggaa tgaactgctt gaggaagctc taaaagttat aagatcaatt 480

gacaaaaagc acactgtgat tataggcaca gctgaatggg ggggtatatc tgcccttgaa 540

aaactgaggg tcccaaaatg ggaaaaaaat gcgatagtta caattcacta ctacaatcct 600

ttcgaattta cccatcaagg agctgagtgg gtgcctggat ctgagaaatg gttgggaaga 660

aagtggggat ctccagatga tcagaaacat ttgatagaag aattcaattt tatagaagaa 720

tggtcaaaaa agaacaaaag accaatttac ataggtgagt ttggtgccta cagaaaagct 780

gaccttgaat caagaataaa atggacctcc tttgtcgttc gcgaagccga gaaaaggggg 840

tggagctggg catactggga attttgttcc ggttttggtg tttatgatcc tctgagaaaa 900

cagtggaata aagatctttt agaagcttta ataggaggag atagcattga atga 954

<210> 2

<211> 317

<212> PRT

<213> Thermotoga maritima - 纤维素酶

<400> 2

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Gln Ala Phe Pro

50 55 60

Pro Tyr Lys Ile Glu Pro Ser Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Val Ile Asn Ile His His

85 90 95

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

Asp Lys Lys His Thr Val Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

Ser Ala Leu Glu Lys Leu Arg Val Pro Lys Trp Glu Lys Asn Ala Ile

180 185 190

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

Glu Trp Val Pro Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

Val Arg Glu Ala Glu Lys Arg Gly Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

Cys Ser Gly Phe Gly Val Tyr Asp Pro Leu Arg Lys Gln Trp Asn Lys

290 295 300

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu

305 310 315

<210> 3

<211> 954

<212> DNA

<213> Thermotoga maritima

<400> 3

atgggtgttg atccttttga aaggaacaaa atattgggaa gaggcattaa tataggaaat 60

gcgcttgaag caccaaatga gggagactgg ggagtggtga taaaagatga gttcttcgac 120

attataaaag aagccggttt ctctcatgtt cgaattccaa taagatggag tacgcacgct 180

caggcgtttc ctccttataa aatcgagcct tctttcttca aaagagtgga tgaagtgata 240

aacggagccc tgaaaagagg actggctgtt gttataaata ttcatcacta cgaggagtta 300

atgaatgatc cagaagaaca caaggaaaga tttcttgctc tttggaaaca aattgctgat 360

cgttataaag actatcccga aactctattt tttgaaattc tgaatgaacc tcacggaaat 420

cttactccgg aaaaatggaa tgaactgctt gaggaagctc taaaagttat aagatcaatt 480

gacaaaaagc acactgtgat tataggcaca gctgaatggg ggggtatatc tgcccttgaa 540

aaactgaggg tcccaaaatg ggaaaaaaat gcgatagtta caattcacta ctacaatcct 600

ttcgaattta cccatcaagg agctgagtgg gtgcctggat ctgagaaatg gttgggaaga 660

aagtggggat ctccagatga tcagaaacat ttgatagaag aattcaattt tatagaagaa 720

tggtcaaaaa agaacaaaag accaatttac ataggtgagt ttggtgccta cagaaaagct 780

gaccttgaat caagaataaa atggacctcc tttgtcgttc gcgaagccga gaaaaggggg 840

tggagctggg catactggga attttgttcc ggttttggtg tttatgatcc tctgagaaaa 900

cagtggaata aagatctttt agaagcttta ataggaggag atagcattga ataa 954

<210> 4

<211> 976

<212> DNA

<213> 人工序列

<220>

<223> 5'区和编码具有适度增加的表达的SEQ ID

NO:2的开放读码框

<400> 4

tctactagtt aggaggtaac ttatgggcgt cgatccgttt gaacgtaaca aaatcttggg 60

ccgcggcatt aatatcggca atgcgctcga agcaccaaat gaaggcgact ggggagtggt 120

gataaaagat gagttcttcg acattataaa agaagccggt ttctctcatg ttcgaattcc 180

aataagatgg agtacgcacg ctcaggcgtt tcctccttat aaaatcgagc cttctttctt 240

caaaagagtg gatgaagtga taaacggagc cctgaaaaga ggactggctg ttgttataaa 300

tattcatcac tacgaggagt taatgaatga tccagaagaa cacaaggaaa gatttcttgc 360

tctttggaaa caaattgctg atcgttataa agactatccc gaaactctat tttttgaaat 420

tctgaatgaa cctcacggaa atcttactcc ggaaaaatgg aatgaactgc ttgaggaagc 480

tctaaaagtt ataagatcaa ttgacaaaaa gcacactgtg attataggca cagctgaatg 540

ggggggtata tctgcccttg aaaaactgag ggtcccaaaa tgggaaaaaa atgcgatagt 600

tacaattcac tactacaatc ctttcgaatt tacccatcaa ggagctgagt gggtgcctgg 660

atctgagaaa tggttgggaa gaaagtgggg atctccagat gatcagaaac atttgataga 720

agaattcaat tttatagaag aatggtcaaa aaagaacaaa agaccaattt acataggtga 780

gtttggtgcc tacagaaaag ctgaccttga atcaagaata aaatggacct cctttgtcgt 840

tcgcgaagcc gagaaaaggg ggtggagctg ggcatactgg gaattttgtt ccggttttgg 900

tgtttatgat cctctgagaa aacagtggaa taaagatctt ttagaagctt taataggagg 960

agatagcatt gaatga 976

<210> 5

<211> 954

<212> DNA

<213> 人工序列

<220>

<223> 编码纤维素酶的开放读码框

<400> 5

atgggtgttg atccttttga aaggaacaaa atattgggaa gaggcattaa tataggaaat 60

gcgcttgaag caccaaatga gggagactgg ggagtggtga taaaagatga gttcttcgac 120

attataaaag aagccggttt ctctcatgtt cgaattccaa taagatggag tacgcacgct 180

tacgcgtttc ctccttataa aatcatggat cgcttcttca aaagagtgga tgaagtgata 240

aacggagccc tgaaaagagg actggctgtt gttataaata ttcatcacta cgaggagtta 300

atgaatgatc cagaagaaca caaggaaaga tttcttgctc tttggaaaca aattgctgat 360

cgttataaag actatcccga aactctattt tttgaaattc tgaatgaacc tcacggaaat 420

cttactccgg aaaaatggaa tgaactgctt gaggaagctc taaaagttat aagatcaatt 480

gacaaaaagc acactataat tataggcaca gctgaatggg ggggtatatc tgcccttgaa 540

aaactgtctg tcccaaaatg ggaaaaaaat tctatagtta caattcacta ctacaatcct 600

ttcgaattta cccatcaagg agctgagtgg gtggaaggat ctgagaaatg gttgggaaga 660

aagtggggat ctccagatga tcagaaacat ttgatagaag aattcaattt tatagaagaa 720

tggtcaaaaa agaacaaaag accaatttac ataggtgagt ttggtgccta cagaaaagct 780

gaccttgaat caagaataaa atggacctcc tttgtcgttc gcgaaatgga gaaaaggaga 840

tggagctggg catactggga attttgttcc ggttttggtg tttatgatac tctgagaaaa 900

acctggaata aagatctttt agaagcttta ataggaggag atagcattga ataa 954

<210> 6

<211> 317

<212> PRT

<213> 纤维素酶

<400> 6

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro

50 55 60

Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Val Ile Asn Ile His His

85 90 95

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile

180 185 190

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys

290 295 300

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu

305 310 315

<210> 7

<211> 972

<212> DNA

<213> 人工序列

<220>

<223> 编码纤维素酶的开放读码框

<400> 7

atggaacagt cagttgctga aagtgatagc aactcagcat ttgaatacaa caaaatggta 60

ggtaaaggag taaatattgg aaatgcttta gaagctcctt tcgaaggagc ttggggagta 120

agaattgagg atgaatattt tgagataata aagaaaaggg gatttgattc tgttaggatt 180

cccataagat ggtcagcaca tatatccgaa aagccaccat atgatattga caggaatttc 240

ctcgaaagag ttaaccatgt tgtcgatagg gctcttgaga ataatttaac agtaatcatc 300

aatacgcacc attttgaaga actctatcaa gaaccggata aatacggcga tgttttggtg 360

gaaatttgga gacagattgc aaaattcttt aaagattacc cggaaaatct gttctttgaa 420

atctacaacg agcctgctca gaacttgaca gctgaaaaat ggaacgcact ttatccaaaa 480

gtgctcaaag ttatcaggga gagcaatcca acccggattg tcattatcga tgctccaaac 540

tgggcacact atagcgcagt gagaagtcta aaattagtca acgacaaacg catcattgtt 600

tccttccatt actacgaacc tttcaaattc acacatcagg gtgccgaatg ggttaatccc 660

atcccacctg ttagggttaa gtggaatggc gaggaatggg aaattaacca aatcagaagt 720

catttcaaat acgtgagtga ctgggcaaag caaaataacg taccaatctt tcttggtgaa 780

ttcggtgctt attcaaaagc agacatggac tcaagggtta agtggaccga aagtgtgaga 840

aaaatggcgg aagaatttgg attttcatac gcgtattggg aattttgtgc aggatttggc 900

atatacgata gatggtctca aaactggatc gaaccattgg caacagctgt ggttggcaca 960

ggcaaagagt aa 972

<210> 8

<211> 323

<212> PRT

<213> 纤维素酶

<400> 8

Met Glu Gln Ser Val Ala Glu Ser Asp Ser Asn Ser Ala Phe Glu Tyr

1 5 10 15

Asn Lys Met Val Gly Lys Gly Val Asn Ile Gly Asn Ala Leu Glu Ala

20 25 30

Pro Phe Glu Gly Ala Trp Gly Val Arg Ile Glu Asp Glu Tyr Phe Glu

35 40 45

Ile Ile Lys Lys Arg Gly Phe Asp Ser Val Arg Ile Pro Ile Arg Trp

50 55 60

Ser Ala His Ile Ser Glu Lys Pro Pro Tyr Asp Ile Asp Arg Asn Phe

65 70 75 80

Leu Glu Arg Val Asn His Val Val Asp Arg Ala Leu Glu Asn Asn Leu

85 90 95

Thr Val Ile Ile Asn Thr His His Phe Glu Glu Leu Tyr Gln Glu Pro

100 105 110

Asp Lys Tyr Gly Asp Val Leu Val Glu Ile Trp Arg Gln Ile Ala Lys

115 120 125

Phe Phe Lys Asp Tyr Pro Glu Asn Leu Phe Phe Glu Ile Tyr Asn Glu

130 135 140

Pro Ala Gln Asn Leu Thr Ala Glu Lys Trp Asn Ala Leu Tyr Pro Lys

145 150 155 160

Val Leu Lys Val Ile Arg Glu Ser Asn Pro Thr Arg Ile Val Ile Ile

165 170 175

Asp Ala Pro Asn Trp Ala His Tyr Ser Ala Val Arg Ser Leu Lys Leu

180 185 190

Val Asn Asp Lys Arg Ile Ile Val Ser Phe His Tyr Tyr Glu Pro Phe

195 200 205

Lys Phe Thr His Gln Gly Ala Glu Trp Val Asn Pro Ile Pro Pro Val

210 215 220

Arg Val Lys Trp Asn Gly Glu Glu Trp Glu Ile Asn Gln Ile Arg Ser

225 230 235 240

His Phe Lys Tyr Val Ser Asp Trp Ala Lys Gln Asn Asn Val Pro Ile

245 250 255

Phe Leu Gly Glu Phe Gly Ala Tyr Ser Lys Ala Asp Met Asp Ser Arg

260 265 270

Val Lys Trp Thr Glu Ser Val Arg Lys Met Ala Glu Glu Phe Gly Phe

275 280 285

Ser Tyr Ala Tyr Trp Glu Phe Cys Ala Gly Phe Gly Ile Tyr Asp Arg

290 295 300

Trp Ser Gln Asn Trp Ile Glu Pro Leu Ala Thr Ala Val Val Gly Thr

305 310 315 320

Gly Lys Glu

<210> 9

<211> 974

<212> DNA

<213> 人工序列

<220>

<223> 纤维素酶7x基因位点饱和诱变

产物和3'序列

<400> 9

atgggtgttg atccttttga aaggaacaaa atattgggaa gaggcattaa tataggaaat 60

gcgcttgaag caccaaatga gggagactgg ggagtggtga taaaagatga gtatttcgac 120

attataaaag aagccggttt ctctcatgtt cgaattccaa taagatggag tacgcacgct 180

caggcgtttc ctccttataa aatcgaggat cgcttcttca aaagagtgga tgaagtgata 240

aacggagccc tgaaaagagg actggctgtt gttataaatc agcatcacta cgaggagtta 300

atgaatgatc cagaagaaca caaggaaaga tttcttgctc tttggaaaca aattgctgat 360

cgttataaag actatcccga aactctattt tttgaaattc tgaatgaacc tcacggaaat 420

cttactccgg aaaaatggaa tgaactgctt gaggaagctc taaaagttat aagatcaatt 480

gacaaaaagc acactataat tataggcaca gctgaatggg ggggtatatc tgcccttgaa 540

aaactgaggg tcccaaaatg ggaaaaaaat gcgatagtta caattcacta ctacaatcct 600

ttcgaattta cccatcaagg agctgagtgg gtggaaggat ctgagaaatg gttgggaaga 660

aagtggggat ctccagatga tcagaaacat ttgatagaag aattcaattt tatagaagaa 720

tggtcaaaaa agaacaaaag accaatttac ataggtgagt ttggtgccta cagaaaagct 780

gaccttgaat caagaataaa atggacctcc tttgtcgttc gcgaagctga gaaaaggaga 840

tggagctggg catactggga attttgttcc ggttttggtg tttatgatac tctgagaaaa 900

acctggaata aagatctttt agaagcttta ataggaggag atagcattga ataacaccat 960

tccaagatgg cgtg 974

<210> 10

<211> 323

<212> PRT

<213> 纤维素酶

<400> 10

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

Val Ile Lys Asp Glu Tyr Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Gln Ala Phe Pro

50 55 60

Pro Tyr Lys Ile Glu Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Val Ile Asn Gln His His

85 90 95

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

Ser Ala Leu Glu Lys Leu Arg Val Pro Lys Trp Glu Lys Asn Ala Ile

180 185 190

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

Val Arg Glu Ala Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys

290 295 300

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu His His Ser

305 310 315 320

Lys Met Ala

<210> 11

<211> 954

<212> DNA

<213> 人工序列

<220>

<223> 纤维素酶 31x-1 7x基因位点饱和诱变产物

<400> 11

atgggtgttg atccttttga aaggaacaaa atattgggaa gaggcattaa tataggaaat 60

gcgcttgaag caccaaatga gggagactgg ggagtggtga taaaagatga gtatttcgac 120

attataaaag aagccggttt ctctcatgtt cgaattccaa taagatggag tacgcacgct 180

caggcgtttc ctccttataa aatcgaggat tctttcttca aaagagtgga tgaagtgata 240

aacggagccc tgaaaagagg actggctgtt gttataaata ttcatcacta cgaggagtta 300

atgaatgatc cagaagaaca caaggaaaga tttcttgctc tttggaaaca aattgctgat 360

cgttataaag actatcccga aactctattt tttgaaattc tgaatgaacc tcacggaaat 420

cttactccgg aaaaatggaa tgaactgctt gaggaagctc taaaagttat aagatcaatt 480

gacaaaaagc acactgtgat tataggcaca gctgaatggg ggggtatatc tgcccttgaa 540

aaactgaggg tcccaaaatg ggaaaaaaat gcgatagtta caattcacta ctacaatcct 600

ttcgaattta cccatcaagg agctgagtgg gtgcctggat ctgagaaatg gttgggaaga 660

aagtggggat ctccagatga tcagaaacat gtgatagaag aattcaattt tatagaagaa 720

tggtcaaaaa agaacaaaag accaatttac ataggtgagt ttggtgccta cagaaaagct 780

gaccttgaat caagaataaa atggacctcc tttgtcgttc gcgaagccga gaaaaggggg 840

tggagctggg catactggga attttgttcc ggttttggtg tttatgatcc tctgagaaaa 900

cagtggaata aagatctttt agaagctcta ataggaggag atagcattga ataa 954

<210> 12

<211> 317

<212> PRT

<213> 纤维素酶

<400> 12

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

Val Ile Lys Asp Glu Tyr Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Gln Ala Phe Pro

50 55 60

Pro Tyr Lys Ile Glu Asp Ser Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Val Ile Asn Ile His His

85 90 95

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

Asp Lys Lys His Thr Val Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

Ser Ala Leu Glu Lys Leu Arg Val Pro Lys Trp Glu Lys Asn Ala Ile

180 185 190

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

Glu Trp Val Pro Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

Pro Asp Asp Gln Lys His Val Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

Val Arg Glu Ala Glu Lys Arg Gly Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

Cys Ser Gly Phe Gly Val Tyr Asp Pro Leu Arg Lys Gln Trp Asn Lys

290 295 300

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu

305 310 315

<210> 13

<211> 954

<212> DNA

<213> 人工序列

<220>

<223> 纤维素酶 12X-1组合的基因位点饱和诱变产物

<400> 13

atgggtgttg atccttttga aaggaacaaa atattgggaa gaggcattaa tataggaaat 60

gcgcttgaag caccaaatga gggagactgg ggagtggtga taaaagatga gttcttcgac 120

attataaaag aagccggttt ctctcatgtt cgaattccaa taagatggag tacgcacgct 180

caggcgtttc ctccttataa aatcgaggat tctttcttca aaagagtgga tgaagtgata 240

aacggagccc tgaaaagagg actggctgtt gttataaatc agcatcacta cgaggagtta 300

atgaatgatc cagaagaaca caaggaaaga tttcttgctc tttggaaaca aattgctgat 360

cgttataaag actatcccga aactctattt tttgaaattc tgaatgaacc tcacggaaat 420

cttactccgg aaaaatggaa tgaactgctt gaggaagctc taaaagttat aagatcaatt 480

gacaaaaagc acactgtgat tataggcaca gctgaatggg ggggtatatc tgcccttgaa 540

aaactgaggg tcccaaaatg ggaaaaaaat gcgatagtta caattcacta ctacaatcct 600

ttcgaattta cccatcaagg agctgagtgg gtgcctggat ctgagaaatg gttgggaaga 660

aagtggggat ctccagatga tcagaaacat ttgatagaag aattcaattt tatagaagaa 720

tggtcaaaaa agaacaaaag accaatttac ataggtgagt ttggtgccta cagaaaagct 780

gaccttgaat caagaataaa atggacctcc tttgtcgttc gcgaagccga gaaaaggggg 840

tggagctggg catactggga attttgttcc ggttttggtg tttatgatcc tctgagaaaa 900

cagtggaata aagatctttt agaagcttta ataggaggag atagcattga ataa 954

<210> 14

<211> 317

<212> PRT

<213> 纤维素酶

<400> 14

Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile

1 5 10 15

Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val

20 25 30

Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser

35 40 45

His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Gln Ala Phe Pro

50 55 60

Pro Tyr Lys Ile Glu Asp Ser Phe Phe Lys Arg Val Asp Glu Val Ile

65 70 75 80

Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Val Ile Asn Gln His His

85 90 95

Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu

100 105 110

Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr

115 120 125

Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu

130 135 140

Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile

145 150 155 160

Asp Lys Lys His Thr Val Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile

165 170 175

Ser Ala Leu Glu Lys Leu Arg Val Pro Lys Trp Glu Lys Asn Ala Ile

180 185 190

Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala

195 200 205

Glu Trp Val Pro Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser

210 215 220

Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu

225 230 235 240

Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala

245 250 255

Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val

260 265 270

Val Arg Glu Ala Glu Lys Arg Gly Trp Ser Trp Ala Tyr Trp Glu Phe

275 280 285

Cys Ser Gly Phe Gly Val Tyr Asp Pro Leu Arg Lys Gln Trp Asn Lys

290 295 300

Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu

305 310 315

<210> 15

<211> 1310

<212> DNA

<213> 人工序列

<220>

<223> 编码SEQ ID NO:16淀粉酶的开放读码框

<400> 15

atggccaagt actccgagct ggaaaagggc ggggtcataa tgcaggcgtt ctactgggac 60

gtgccttcag gaggaatatg gtgggacaca atacggcaga agataccgga gtggtacgat 120

gccggaatct ccgcaatatg gattcccccg gcgagcaagg gcatgggcgg cgcctattcg 180

atgggctacg acccctacga cttctttgac ctcgtgagta cgaccagaag ggaacggtag 240

agacgcgctt tggctccaag caggagctcg tgaacatgat aaacaccgcc cacgcctatg 300

gcatgaaggt aatagccgat atagtcatca accaccgcgc cggcggtgac ctggagtgga 360

accccttcgt gaacgactat acctggaccg acttctcaaa ggtcgcgtcg ggtaaataca 420

cggccaacta cctcgacttc cacccgaacg agctccatgc gggcgattcc gggacatttg 480

gaggctatcc cgacatatgc cacgacaaga gctgggacca gtactggctc tgggccagcc 540

aggagagcta cgcggcatat ctcaggagca tcggcatcga tgcctggcgc ttcgactacg 600

tcaagggcta tgctccctgg gtcgtcaagg actggctgaa ctggtgggga ggctgggcgg 660

ttggagagta ctgggacacc aacgtcgacg ctgttctcaa ctgggcatac tcgagcggtg 720

ccaaggtctt tgacttcgcc ctctactaca agatggatga ggcctttgac aacaaaaaca 780

ttccagcgct cgtctctgcc cttcagaacg gccagactgt tgtctcccgc gacccgttca 840

aggccgtaac ctttgtagca aaccacgaca ccgatataat ctggaacaag tatccagcct 900

acgcgttcat cctcacctac gagggccagc cgacaatatt ctaccgcgac tacgaggagt 960

ggctcaacaa ggataagctc aagaacctca tctggataca tgagaacctc gccggaggaa 1020

gcaccgacat agtctactac gataacgatg aactcatctt cgtcaggaac ggctacgggg 1080

acaagccggg gcttataacc tacatcaacc taggctcgag caaggccgga aggtgggttt 1140

atgtgccgaa gttcgcgggc gcgtgcatcc acgagtatac tggtaacctc ggaggctggg 1200

tagacaagta cgtctactca agcggctggg tctatctcga agctccagct tacgaccctg 1260

ccaacgggca gtatggctac tccgtgtgga gctactgcgg ggtgggctga 1310

<210> 16

<211> 436

<212> PRT

<213> 淀粉酶

<400> 16

Met Ala Lys Tyr Ser Glu Leu Glu Lys Gly Gly Val Ile Met Gln Ala

1 5 10 15

Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg

20 25 30

Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile

35 40 45

Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp

50 55 60

Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gln Lys Gly Thr Val

65 70 75 80

Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Val Asn Met Ile Asn Thr

85 90 95

Ala His Ala Tyr Gly Met Lys Val Ile Ala Asp Ile Val Ile Asn His

100 105 110

Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Asn Asp Tyr Thr

115 120 125

Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr

130 135 140

Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe

145 150 155 160

Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp

165 170 175

Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly

180 185 190

Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Ala Pro Trp Val

195 200 205

Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr

210 215 220

Trp Asp Thr Asn Val Asp Ala Val Leu Asn Trp Ala Tyr Ser Ser Gly

225 230 235 240

Ala Lys Val Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe

245 250 255

Asp Asn Lys Asn Ile Pro Ala Leu Val Ser Ala Leu Gln Asn Gly Gln

260 265 270

Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn

275 280 285

His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile

290 295 300

Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu

305 310 315 320

Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Glu Asn

325 330 335

Leu Ala Gly Gly Ser Thr Asp Ile Val Tyr Tyr Asp Asn Asp Glu Leu

340 345 350

Ile Phe Val Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr

355 360 365

Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Val Tyr Val Pro Lys

370 375 380

Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp

385 390 395 400

Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro

405 410 415

Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr

420 425 430

Cys Gly Val Gly

435

57页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:草莓液泡加工酶编码基因FaVPE3及其应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!