来源于梭菌属提取物的无细胞蛋白质合成平台

文档序号:90753 发布日期:2021-10-08 浏览:30次 >En<

阅读说明:本技术 来源于梭菌属提取物的无细胞蛋白质合成平台 (Cell-free protein synthesis platform derived from Clostridium extract ) 是由 M·C·朱厄特 A·克鲁格-格里克 A·P·穆勒 M·科普克 于 2020-02-25 设计创作,主要内容包括:公开了用于进行无细胞RNA转录和/或无细胞蛋白质合成(CFPS)的组合物、方法和试剂盒。所公开的组合物、方法和试剂盒包括或利用从梭菌属物种制备的组分,例如来自产乙醇梭菌的细胞提取物。(Compositions, methods, and kits for performing cell-free RNA transcription and/or cell-free protein synthesis (CFPS) are disclosed. The disclosed compositions, methods, and kits include or utilize components prepared from clostridium species, such as cell extracts from clostridium autoethanogenum.)

来源于梭菌属提取物的无细胞蛋白质合成平台

关于联邦资助的研究或开发的声明

本发明是根据美国能源部授予的SC0018249在政府支持下进行的。政府对本发明享有一定的权利。

相关申请的交叉引用

本申请根据35U.S.C§119(e)要求于2019年2月25日提交的美国临时申请62/810,014号的优先权,其内容通过引用整体并入本文。

背景技术

本发明通常涉及用于进行无细胞RNA转录和/或无细胞蛋白质合成(CFPS)的组合物、方法和试剂盒。更具体地,本发明涉及用于进行无细胞RNA转录和/或进行无细胞蛋白质合成(CFPS)的组合物、方法和试剂盒,其包括或利用从梭菌属,包括产乙醇梭菌的天然存在或重组物种制备的组分。

梭菌属是一类厚壁菌门,包括梭菌和其他类似的属。梭菌属是气体和废物发酵厌氧细菌,具有非凡的生物制造潜力(例如燃料和化学品生产)。(例如参见Tracy等,“Clostridia:the importance of their exceptional substrate and metabolitediversity for biofuel and biorefinery application.”Curr.Opin.Biotechno.2012Jun;23(3):364-81;其全部内容通过引用整体并入本文)。梭菌属还具有广泛的医学应用(例如生产用于临床应用的胶原酶或肉毒杆菌毒素),并且最近开发来自梭菌属的首批天然产品(例如用作抗生素或作物保护剂)。(例如参见Schiel等,“Clostridium:Encyclopediaof Industrial Biotechnology:Bioprocess,Bioseparation,and Cell Technology,2010;和Pidot等,“Discovery of clostrubin,and exceptional polyphenolicpolyketide antibiotic from a strictly anaerobic bacterium,”Angew.Chem.Int.Ed.Engl.2014Jul 21;53(30):7856-9;其内容通过引用整体并入本文)。尽管梭菌属已在工业上使用100多年,但当前的菌株工程技术仍然具有低通量、劳动密集型和耗时的挑战。菌株工程的具体挑战包括生物体特定的遗传限制、厌氧环境的要求,以及在产乙酸菌的情况下,气体的处理。因此,梭菌属生物技术的发展和梭菌属生物学的基础知识远远落后于需氧原核和真核生物的成就。

在这里,发明人提出第一个源自厌氧细菌产乙醇梭菌的无细胞蛋白质合成(CFPS)平台。发明人的平台可用于在体内实施之前对梭菌属遗传部分和代谢途径进行高通量原型设计,以及高价值产品的无细胞生物制造。发明人已经开发一系列用于用不同菌株以分批和连续模式进行细胞生长的方案。本发明人已经优化可用于原型设计和生物制造目的的提取物制备、CFPS反应组分和CFPS反应条件。发明人的优化系统能够产生高达90μg/ml的荧光素酶报告蛋白,可以使用标准实验室设备通过发光测量以高通量检测该蛋白,并提供合适的动态范围以开始确定遗传部分库中的细微差别。

发明内容

公开用于进行无细胞RNA转录和/或进行无细胞蛋白质合成(CFPS)的组合物、方法、试剂盒和组分。所公开的组合物、方法和试剂盒包括或利用从梭菌属,包括产乙醇梭菌的天然存在的或重组的物种制备的组分。此外,所公开的组合物、方法、试剂盒及其组分可用于在体内实施原型梭菌属遗传部分和代谢途径之前,体外对梭菌属遗传部分和代谢途径进行高通量原型设计,例如在梭菌细胞中。所公开的组合物、方法、试剂盒及其组分还可用于在无细胞系统中体外或体内生物制造高价值产品。

附图说明

图1提供一个简单、稳健且高产的无细胞梭菌属平台的示意图,该平台促进无细胞合成生物学应用,例如生物产品的生产、遗传部分的原型设计和代谢途径性能。从由梭菌属培养物中收集的细胞沉淀开始,我们最初通过测试不同的超声处理、径流和透析条件来优化提取物的制备和加工。在第二步中,我们调整CFPS反应中关键组分的浓度以进一步最大化蛋白质产量。然后使用这种优化的CFPS系统来证明系统对梭菌属遗传部分和代谢途径进行原型设计的能力。

图2产乙醇梭菌衍生的CFPS需要与大肠杆菌衍生的CFPS不同的条件。(A)使用大肠杆菌条件进行提取物制备/加工和CFPS反应,在产乙醇梭菌提取物中测定荧光素酶表达。(A,左图和中图)分别是提取物制备和加工步骤以及CFPS反应关键组分的简化示意图。(A,右图)在8mM Mg(Glu)2的CFPS期间,产乙醇梭菌提取物中的荧光素酶表达。(B)CFPS在不同Mg(Glu)2浓度下的最大荧光素酶表达。箭头表示优化条件。产乙醇梭菌细胞沉淀重悬在S30缓冲液中,通过在640J下超声裂解,在12,000xg下离心澄清,并用于含有(A)中的指定浓度的关键组分的CFPS。荧光素酶表达通过生物发光测定。PEP:磷酸烯醇式丙酮酸;AAs:氨基酸;NAD+:还原型烟酰胺腺嘌呤二核苷酸;CoA:辅酶A。数据表示为至少三个独立反应的平均值±s.d.。

图3产乙醇梭菌提取物制备和加工的优化。(A)提取物制备工作流程示意图。(B-D)从产乙醇梭菌提取物在4.25h CFPS期间体外相对最大荧光素酶发光,使用(B)指示的超声输入能量,(C)350J超声输入能量和指示的径流时间,以及(D)不用(每组中的第一条)和用透析的350J超声输入能量制备。对于B和C,带有一个(*)或两个(**)的条形分别表示先前和新优化的条件。荧光素酶表达通过生物发光测定并绘制为与先前使用条件的最大荧光素酶表达相比的相对值。数据表示为三个独立反应的平均值±s.d.。

图4优化产乙醇梭菌提取物的CFPS反应条件。(A)CFPS反应示意图,描绘关键CFPS组分的浓度,这些组分针对基于产乙醇梭菌提取物的CFPS进行逐步调整。(B-H)在不同试剂浓度的CFPS期间,产乙醇梭菌提取物体外的相对最大荧光素酶发光:(B)能量再生系统,(C)PEP浓度,(D)氨基酸浓度,(E)烟酰胺二核苷酸和辅酶A辅因子组成,(F)质粒DNA模板浓度。带有一个*或两个**的条形分别表示先前和新优化的条件。最大荧光素酶表达通过生物发光确定,并绘制为与先前使用的条件(BE)相比的相对值,或使用荧光素酶标准曲线(F)转换为蛋白质产量。AA:氨基酸,AcP:乙酰磷酸激酶,AcK:乙酰磷酸激酶,PEP:磷酸烯醇丙酮酸,PyK:丙酮酸激酶。数据表示为至少三个独立反应的平均值±s.d.。

图5产乙醇梭菌CFPS促进梭菌属代谢工程的原型应用。(A)使用产乙醇梭菌CFPS测试原型应用的示意图。(B)左图:来自含有天然产乙醇梭菌启动子和产乙醇梭菌适应编码序列的质粒DNA模板的荧光素酶表达。右图:来自PCR产物模板的荧光素酶表达,该模板包含适用于两种不同梭菌属物种,丙酮丁醇梭菌(Cac)和产乙醇梭菌(Cae),以及需氧细菌大肠杆菌(Eco)的编码序列。CFPS使用优化的条件进行。最大荧光素酶表达通过生物发光确定并且绘制为通过使用荧光素酶标准曲线确定的荧光素酶产量(左图),或作为与产乙醇梭菌适应的编码序列(右图)相比的相对值。数据表示为至少三个独立反应的平均值±s.d.。(C)产乙醇梭菌CFPS中重组天然代谢酶全长表达的放射自显影。除了所有20种标准氨基酸外,CFPS反应使用优化的条件和放射性14C-亮氨酸(10μM)进行。在CFPS后,将4μl CFPS反应用于SDS-PAGE。将凝胶干燥并在储存荧光屏上暴露14天。该图像与包含蛋白质标准梯的染色图像进行数字比较以确定合成蛋白质的长度。w和s:分别为整体和可溶部分。(D)产乙醇梭菌提取物中CFPS反应期间广义碳通量的示意图。(E、F、G、H)在用或不用45mM PEP的CFPS期间代谢物浓度的变化,如浅灰色或黑色所示,分别由GC-MS确定。数据表示为四个独立反应的平均值±s.d。

图6提供显示A)寡核苷酸序列的表,其中“*”表示硫代磷酸酯(PS)键(即,硫原子取代寡核苷酸磷酸骨架中的非桥连氧)。pJL1线性F(SEQ ID NO:21);pJL1线性R(SEQ ID NO:22);PS_pJL1线性F(SEQ ID NOL:23);和PS_pJL1线性R(SEQ ID NO:24)。B)示例性优化的CFPS反应条件。

图7温度对产乙醇梭菌提取物的CFPS的影响。在不同反应温度下CFPS中荧光素酶的相对表达。产乙醇梭菌细胞沉淀重悬在S30缓冲液中,在350J下超声裂解,通过在12,000xg下离心澄清,在4℃下对S30缓冲液透析3次45分钟,再次通过12,000xg离心澄清并在指示温度下用于CFPS。荧光素酶表达通过生物发光测定并绘制为与30℃下最大荧光素酶表达相比的相对值。顶线表示最佳条件。数据表示为三个独立反应的平均值±s.d.。

图8磷酸烯醇式丙酮酸(PEP)对产乙醇梭菌提取物的CFPS的影响。在丙酮酸激酶(PyK)存在下,在CFPS期间(A)在不同浓度的PEP下和(B)在不同浓度的PEP下的最大荧光素酶表达。CFPS在30℃下用指定的PEP浓度进行。荧光素酶表达通过生物发光测定。带有一个*或两个**的条形分别表示以前使用的和新优化的条件。数据表示为三个独立反应的平均值±s.d.。

图9在产乙醇梭菌提取物的CFPS 1小时后施用第二种氨基酸(AA)的影响。不同AA施用方案下的相对荧光素酶表达。CFPS用45mM PEP进行,并在CFPS 1小时后一次或第二次指示AA浓度。荧光素酶表达通过生物发光测定并绘制为与先前使用的条件相比的相对值。带有一个*或两个**的条形分别表示以前使用的和新优化的条件。数据表示为三个独立反应的平均值±s.d.。

图10提取物量和氧气利用率对产乙醇梭菌提取物的CFPS的影响。(A)CFPS反应中的相对荧光素酶表达,每微升CFPS反应中含有不同量的提取物。CFPS反应设置为40μl分批反应。(B)在1.5ml反应管中以指定体积设置的CFPS分批反应中的相对荧光素酶表达。荧光素酶表达通过生物发光测定并绘制为与先前使用的条件的荧光素酶表达相比的相对值(带*的条形图)。数据表示为三个独立反应的平均值±s.d.。

图11DNA模板类型和浓度对产乙醇梭菌提取物的CFPS的影响。CFPS反应中的相对荧光素酶表达包含(A)不同的DNA模板类型、不同浓度的(B)质粒DNA和(C)线性DNA。质粒DNA进行中段制备,并通过乙醇沉淀进行额外净化。线性模板通过PCR制备,并使用PCR纯化试剂盒和额外的乙醇沉淀进行清洗。荧光素酶表达通过生物发光测定并绘制为与先前使用的条件的荧光素酶表达相比的相对值(带一个*的条形图)。“线性+PS”表示含有硫代磷酸化5'末端修饰的线性DNA模板。带有两个**的条形表示新优化的条件。数据表示为三个独立反应的平均值±s.d.。

图12产乙醇梭菌CFPS的开发和优化总结。显示产乙醇梭菌CFPS中荧光素酶表达产量的逐步和累积改善。提取物制备&加工:提取物制备和加工;数据表示为至少三个独立反应的平均值±s.d.。条从左到右:1)起始材料;2)Mg(Glu)2浓度;3)提取物制备&加工;4)CFPS条件;5)反应模式。

图13三种不同荧光素酶编码序列的分析。(A)由RBS计算器确定的预测翻译率(Salis等,2009)。(B)荧光素酶编码序列的GC含量。

图14提供以下示例性生物学序列:1)启动子和5'UTR:磷酸转乙酰酶-乙酸激酶操纵子(pPta-Ack;CAETHG_RS16490)(SEQ ID NO:25);丙酮酸:甲酸氧化还原酶(pPFOR;CAETHG_RS14890)启动子(SEQ ID NO:26);和Wood-Ljungdahl簇(pWL;CAETHG_RS07860)启动子(SEQ ID NO:27)。2)萤光素酶编码序列:适用于在丙酮丁醇梭菌中表达的萤光素酶编码序列(SEQ ID NO:17);适用于在产乙醇梭菌中表达的荧光素酶编码序列(SEQ ID NO:19),以及适用于在大肠杆菌中表达的荧光素酶编码序列(SEQ ID NO:20);3)产乙醇梭菌代谢基因:乙酰乳酸脱羧酶(CAETHG_RS14410)(SEQ ID NO:28);乙酰乳酸合酶(CAETHG_RS08420)(SEQ ID NO:29);和初级:二级醇脱氢酶(CAETHG_RS02620)(SEQ ID NO:30)。

图15原型代谢途径的能力。(A)产乙醇梭菌体内代谢的示意图,突出原型(丙酮酸三步转化为2,3-丁二醇(2,3-BDO))的示例靶途径。(B)在产乙醇梭菌CFPS中2,3-BDO合成途径的重组天然代谢酶(乙酰乳酸合酶(AcLacS;六边形)、乙酰乳酸脱羧酶(ACLacDC;半圆)、仲醇脱氢酶(SecAlcDH;第一个三角形)、2,3-丁二醇脱氢酶(BDODH;黄色三角形))以及荧光素酶和纳米荧光素酶(NLuc)的表达。除了所有20种标准氨基酸外,CFPS反应使用优化的条件和放射性14C-亮氨酸(10μM)进行。然后使用三氯乙酸沉淀放射性标记的蛋白质样品,并通过液体闪烁测量它们的放射性计数。(C)在2,3-BDO合成途径的天然代谢酶的3h CFPS之前和后CFPS反应中的2,3-BDO、乙酸盐、乙醇(EtOH)和乳酸产生。使用HPLC,代谢物浓度是根据已知浓度的标准品的色谱峰面积计算的。

具体实施方式

定义和术语

可以使用如下定义和术语进一步描述所公开的主题。本文中使用的定义和术语仅用于描述具体实施方案的目的,并不旨在进行限制。

如在本说明书和权利要求书中使用,单数形式“一个”、“一种”和“该”包括复数形式,除非上下文另有明确规定。例如,除非上下文另有明确规定,否则术语“一个组分”应被解释为表示“一个或多个组分”。如本文所用,术语“多个”是指“两个或更多个”。

如本文所用,“大约”、“约”、“基本上”和“显著”将被本领域普通技术人员理解并且将在它们使用的上下文中在一定程度上变化。如果考虑到使用它的上下文,该术语的使用对于本领域的普通技术人员来说是不清楚的,“大约”和“约”将表示高达特定术语的正负10%并且“基本上”和“显著”将表示超过特定术语的正负10%。

如本文所用,术语“包括(include)”和“包括(including)”与术语“包含(comprise)”和“包含(comprising)”具有相同的含义。术语“包含(comprise)”和“包含(comprising)”应被解释为“开放式”过渡性术语,允许进一步包括在权利要求中陈述的那些组分外的附加组分。术语“由……组成(consist)”和“由……组成(consisting of)”应被解释为“封闭式”过渡性术语,不允许包括除权利要求中记载的组分外的附加组分。术语“基本上由……组成”应被解释为部分封闭并且仅允许包含不会从根本上改变要求保护的主题的性质的附加组分。

短语“例如”应解释为“例如,包括”。此外,任何和所有示例性语言的使用,包括但不限于“例如”,仅意在更好地阐明本发明,并且除非另有声明,否则不对本发明的范围构成限制。

此外,在使用其中类似于“A、B和C等中的至少一个”的约定的那些情况下,通常这样的构造意在本领域普通技术人员将理解约定的含义中(例如,“具有A、B和C中的至少一个的系统”将包括但不限于具有单独A、单独B、单独C、A和B一起、A和C一起、B和C一起和/或A、B和C一起的系统。)。本领域技术人员将进一步理解,实际上任何呈现两个或多个替代术语的分离词和/或短语,无论是在说明书或附图中,都应该被理解为考虑包括术语之一、任一术语或两个术语的可能性。例如,短语“A或B”将被理解为包括“A”或“B”或“A和B”的可能性。

诸如“至多”、“至少”、“大于”、“小于”等的所有语言都包括所列举的数字并且指的是随后可以分解为如上所述的子范围的范围。

范围包括每个单独的成员。因此,例如,具有1-3个成员的组是指具有1、2或3个成员的组。同理,6个成员的组是指1个、2个、3个、4个、6个成员等的组。

情态动词“可以”是指在几个所描述的实施方案或其中包含的特征中的一个或多个选项或选择的优选使用或选择。当没有公开关于具体实施方案或其中包含的特征的选项或选择时,情态动词“可以”是指关于如何制作或使用所描述的实施方案或其中包含的特征的方面的肯定行为,或使用关于所描述的实施方案或其中包含的特征的特定技能的最终决定。在后一种情况下,情态动词“可以”与助动词“能”具有相同的含义和内涵。

多核苷酸和合成方法

所公开的方法、设备、试剂盒和组分可以利用和/或包括多核苷酸。术语“多核苷酸”、“多核苷酸序列”、“核酸”和“核酸序列”是指核苷酸、寡核苷酸、多核苷酸(这些术语可以互换使用)或其任何片段。这些短语也指基因组、天然或合成来源的DNA或RNA(可以是单链或双链,可以代表有义链或反义链)。

如本文所用,术语“核酸”和“寡核苷酸”是指聚脱氧核糖核苷酸(包含2-脱氧-D-核糖)、多聚核糖核苷酸(包含D-核糖),以及任何其他类型的多核苷酸,其为N糖苷嘌呤或嘧啶碱基。术语“核酸”、“寡核苷酸”和“多核苷酸”之间在长度上没有有意的区别,这些术语将互换使用。这些术语仅指分子的一级结构。因此,这些术语包括双链和单链DNA,以及双链和单链RNA。为了在本方法中使用,寡核苷酸还可以包括其中碱基、糖或磷酸骨架被修饰的核苷酸类似物以及非嘌呤或非嘧啶核苷酸类似物。

关于多核苷酸序列,术语“同一性百分比”和“%同一性”是指使用标准化算法比对的至少两个多核苷酸序列之间的残基匹配百分比。这样的算法可以以标准化和可重复的方式在被比较的序列中插入间隙以优化两个序列之间的比对,并因此实现两个序列的更有意义的比较。核酸序列的百分比同一性可以如本领域所理解的那样确定。(例如参见美国专利号7,396,664,其通过引用整体并入本文)。国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLAST)提供一套常用且可免费获得的序列比较算法,该工具可从多个来源在其网站获得,包括马里兰州贝塞斯达NCBI。BLAST软件套件包括各种序列分析程序,包括“blastn”,用于将已知的多核苷酸序列与来自各种数据库的其他多核苷酸序列进行比对。还有一种称为“BLAST 2Sequences”的工具,用于直接对两个核苷酸序列进行成对比较。“BLAST 2Sequences”可以在NCBI网站上以交互方式访问和使用。“BLAST 2Sequences”工具可用于blastn和blastp(如上所述)。

关于多核苷酸序列,同一性百分比可以在整个定义的多核苷酸序列的长度上测量,例如如特定的SEQ ID号所定义的,或可以在较短的长度上测量,例如在取自更大、确定的序列的片段的长度上测量,例如至少20、至少30、至少40、至少50、至少70、至少100或至少200个连续核苷酸的片段。此类长度仅是示例性的,并且应理解本文、表格、附图或序列表中所示序列支持的任何片段长度可用于描述可测量同一性百分比的长度。

关于多核苷酸序列,“变体”、“突变体”或“衍生物”可以定义为使用国家生物技术信息中心网站上提供的“BLAST 2Sequences”工具的blastn在一定长度的核酸序列之一上与特定核酸序列具有至少50%序列同一性的核酸序列。(参见Tatiana A.Tatusova,ThomasL.Madden(1999),"Blast 2sequences-a new tool for comparing protein andnucleotide sequences",FEMS Microbiol Lett.174:247-250)。此类核酸对可显示在某个定义的长度上例如至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%或更高的序列同一性。

然而,由于其中多个密码子可以编码单个氨基酸的遗传密码的简并性,不显示高度同一性的核酸序列可能编码相似的氨基酸序列。应当理解,可以使用这种简并性来改变核酸序列以产生全部编码基本相同蛋白质的多个核酸序列。例如,本文考虑的多核苷酸序列可以编码蛋白质并且可以是密码子优化的和/或密码子适应的以在特定宿主中表达。在本领域中,已经为包括人、小鼠、大鼠、猪、大肠杆菌、植物和其他宿主细胞的许多宿主生物准备密码子使用频率表。在一些实施方案中,本文公开的多核苷酸序列可以编码蛋白质(例如,报告蛋白,例如荧光素酶)并且可以是密码子优化的和/或密码子适应的以在梭菌属(例如丙酮丁醇梭菌、产乙醇梭菌和/或大肠杆菌(例如参见SEQ ID NO:17-20和图13)中表达。

寡核苷酸可以通过任何合适的方法制备,包括通过以下方法的直接化学合成:例如Narang等的磷酸三酯法,1979,Meth.Enzymol.68:90-99;the phosphodiester methodof Brown等的磷酸二酯法,1979,Meth.Enzymol.68:109-151;Beaucage等的二乙基亚磷酰胺法,1981,Tetrahedron Letters 22:1859-1862;和美国专利号4,458,066的固体支持方法,每个都通过引用并入本文。Goodchild,1990,Bioconjugate Chemistry 1(3):165-187中提供寡核苷酸和修饰核苷酸的缀合物的合成方法的综述,该文献通过引用并入本文。

术语“扩增反应”是指任何化学反应,包括酶促反应,其导致模板核酸序列的拷贝增加或导致模板核酸的转录。扩增反应包括逆转录、聚合酶链反应(PCR),包括实时PCR(参见美国专利号4,683,195和4,683,202;PCR Protocols:A Guide to Methods andApplications(Innis等,1990版)),和连接酶链反应(LCR)(参见Barany等,美国专利号5,494,810)。示例性的“扩增反应条件”或“扩增条件”通常包括两步或三步循环。两步循环具有高温变性步骤,然后是杂交/延伸(或连接)步骤。三步循环包括变性步骤,然后是杂交步骤,然后是单独的延伸步骤。

如本文所用,术语“靶标”、“靶标序列”、“靶标区域”和“靶标核酸”是同义词,是指待扩增、排序或检测的核酸区域或序列。

如本文所用,术语“杂交”是指由于碱基互补配对,两条单链核酸形成双链体结构。杂交可发生在完全互补的核酸链之间或包含少量错配区域的“基本互补”核酸链之间。强烈优选完全互补的核酸链杂交的条件称为“严格杂交条件”或“序列特异性杂交条件”。在不太严格的杂交条件下可以获得基本互补序列的稳定双链体;可以通过适当调整杂交条件来控制容许的错配程度。核酸技术领域的技术人员可以根据经验确定双链体稳定性,考虑许多变量,包括例如寡核苷酸的长度和碱基对组成、离子强度和错配碱基对的发生率,遵循由技术提供的引导(例如参见Sambrook等,1989,Molecular Cloning-A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York;Wetmur,1991,Critical Review in Biochem.和Mol.Biol.26(3/4):227-259;和Owczarzy等,2008,Biochemistry,47:5336-5353,通过引用将其并入本文)。

如本文所用,术语“引物”是指能够在合适条件下充当DNA合成起始点的寡核苷酸。此类条件包括在四种不同的三磷酸核苷和用于延伸的试剂(例如,DNA聚合酶或逆转录酶)的存在下在适当的缓冲液中并且在合适的温度下诱导与核酸链互补的引物延伸产物的合成。

引物优选地是单链DNA。引物的合适长度取决于引物的预期用途,但通常在约6至约225个核苷酸的范围内,包括中间范围,例如15至35个核苷酸、18至75个核苷酸和25至150个核苷酸。短引物分子通常需要较低的温度才能与模板形成足够稳定的杂化复合物。引物不需要反映模板核酸的确切序列,但必须充分互补以与模板杂交。用于扩增给定靶序列的合适引物的设计是本领域众所周知的并且在本文引用的文献中有所描述。

引物可以包含允许检测或固定引物但不改变引物的基本性质,即作为DNA合成起始点的性质的附加特征。例如,引物可在5'端包含额外的核酸序列,该序列不与目标核酸杂交,但有助于扩增产物的克隆或检测,或使RNA转录(例如,通过包含启动子)或蛋白质翻译(例如,通过包含5'-UTR,例如内部核糖体进入位点(IRES)或3'-UTR元件,例如poly(A)n序列,其中n在约20至约200的范围内)成为可能。与模板充分互补以杂交的引物区域在本文中称为杂交区域。

如本文所用,如果在足够严格的条件下用于扩增反应中时,引物主要与靶核酸杂交,则引物对于靶序列是“特异性的”。通常,如果引物-靶标双链体稳定性大于引物与样品中发现的任何其他序列之间形成的双链体的稳定性,则引物对靶序列具有特异性。本领域技术人员将认识到各种因素,例如盐条件以及引物的碱基组成和错配的位置,将影响引物的特异性,并且引物特异性的常规实验确认将是很多情况下都需要。可以选择杂交条件,在该条件下引物可以仅与目标序列形成稳定的双链体。因此,在适当严格的扩增条件下使用靶特异性引物能够选择性扩增含有靶引物结合位点的那些靶序列。

如本文所用,“聚合酶”是指催化核苷酸聚合的酶。“DNA聚合酶”催化脱氧核糖核苷酸的聚合。已知的DNA聚合酶包括例如激烈火球菌(Pfu)DNA聚合酶、大肠杆菌DNA聚合酶I、T7 DNA聚合酶和水生栖热菌(Taq)DNA聚合酶等。“RNA聚合酶”催化核糖核苷酸的聚合。DNA聚合酶的上述实例也称为DNA依赖性DNA聚合酶。RNA依赖性DNA聚合酶也属于DNA聚合酶的范围。包括由逆转录病毒编码的病毒聚合酶的逆转录酶是依赖于RNA的DNA聚合酶的实例。RNA聚合酶(“RNAP”)的已知实例包括例如噬菌体的RNA聚合酶(例如T3 RNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶)和大肠杆菌RNA聚合酶等。RNA聚合酶的上述实例也称为DNA依赖性RNA聚合酶。任何上述酶的聚合酶活性可以通过本领域公知的方法测定。

术语“启动子”是指引导RNA聚合酶和其他反式作用转录因子从包括顺式作用DNA序列的DNA模板开始RNA转录的顺式作用DNA序列。

如本文所用,术语“序列定义的生物聚合物”是指具有特定一级序列的生物聚合物。在其中基因编码具有特定一级序列的生物聚合物的情况下,序列限定的生物聚合物可以等同于基因编码的限定生物聚合物。如本文所用,“表达”是指多核苷酸从DNA模板(例如进入和mRNA或其它RNA转录物)转录的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸源自基因组DNA,则表达可以包括mRNA在真核细胞中的剪接。

如本文所用,“表达模板”是指作为底物用于转录至少一种RNA的核酸,该RNA可以被翻译成序列限定的生物聚合物(例如,多肽或蛋白质)。表达模板包括由DNA或RNA组成的核酸。将核酸用于表达模板的合适的DNA来源包括基因组DNA、cDNA和可以转化为cDNA的RNA。基因组DNA、cDNA和RNA可以来自任何生物来源,例如组织样品、活检、拭子、痰、血液样品、粪便样品、尿液样品、刮屑等。基因组DNA、cDNA和RNA可以来自宿主细胞或病毒来源以及任何物种,包括现存和灭绝的生物体。如本文所用,“表达模板”和“转录模板”具有相同含义并可互换使用。

在某些示例性实施方案中,提供载体,例如表达载体,其含有编码本文所述的一种或多种rRNA或报告多肽和/或蛋白质的核酸。如本文所用,术语“载体”是指能够转运与其连接的另一种核酸的核酸分子。一种类型的载体是“质粒”,它指的是其中可以连接额外的DNA片段的环状双链DNA环。此类载体在本文中称为“表达载体”。通常,可用于重组DNA技术的表达载体通常是质粒形式。在本说明书中,“质粒”和“载体”可以互换使用。然而,所公开的方法和组合物旨在包括这些其他形式的表达载体,例如具有同等功能的病毒载体(例如,复制缺陷型逆转录病毒、腺病毒和腺相关病毒)。

在某些示例性实施方案中,重组表达载体包含适合于以一种或多种本文描述的方法表达核酸序列的形式的核酸序列(例如,编码本文所述的一种或多种rRNA或报告多肽和/或蛋白质的核酸序列),这表示重组表达载体包含一个或多个与待表达的核酸序列可操作地连接的调节序列。在重组表达载体内,“可操作地连接”意指编码本文所述的一种或多种rRNA或报告多肽和/或蛋白质的核苷酸序列以允许核苷酸序列(例如,在体外核糖体组装、转录和/或翻译系统中)表达的方式连接至调节序列。术语“调节序列”旨在包括启动子、增强子和其他表达控制元件(例如,聚腺苷酸化信号)。例如,在Goeddel,Gene ExpressionTechnology:Methods in Enzymology 185,Academic Press,San Diego,Calif.(1990)中描述这样的调节序列。

本文考虑的多核苷酸序列可以存在于表达载体中。例如,载体可以包含:(a)编码蛋白质的ORF的多核苷酸;(b)表达RNA的多核苷酸,该RNA指导靶标DNA序列的RNA介导的结合、剪切和/或切割;以及(a)和(b)二者。载体中存在的多核苷酸可以与原核或真核启动子可操作地连接。“有效连接”是指其中第一核酸序列与第二核酸序列处于功能关系中的情况。例如,如果启动子影响编码序列的转录或表达,则启动子与编码序列可操作地连接。可操作地连接的DNA序列可以非常接近或连续,并且在需要连接两个蛋白质编码区时,在同一阅读框中。本文考虑的载体可以包含与编码蛋白质的多核苷酸可操作地连接的异源启动子(例如,真核或原核启动子)。“异源启动子”是指不是所表达的蛋白质或RNA的天然或内源启动子的启动子。本文公开的载体可以包括质粒载体。

寡核苷酸和多核苷酸可任选地包括一种或多种非标准核苷酸、核苷酸类似物和/或修饰的核苷酸。修饰核苷酸的实例包括但不限于二氨基嘌呤、S2T、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基喹啉、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基喹啉、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-D46-异戊烯基腺嘌呤、尿嘧啶-5-羟基乙酸(v)、wybutoxosine、假尿嘧啶、queosine、2-巯基胞嘧啶、5-甲基-2-硫脲嘧啶、2-硫脲嘧啶、4-硫脲嘧啶、5-甲基脲嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫脲嘧啶、3-(3-氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤等。核酸分子也可以在碱基部分(例如,在通常可用于与互补核苷酸形成氢键的一个或多个原子处和/或在通常不能与互补核苷酸形成氢键的一个或多个原子处)、糖部分或磷酸骨架处修饰。

肽、多肽、蛋白质和合成方法

所公开的方法、设备、试剂盒和组分可用于合成蛋白质、多肽和/或肽。如本文所用,术语“蛋白质”或“多肽”或“肽”可互换使用以指氨基酸的聚合物。通常,“多肽”或“蛋白质”被定义为较长的氨基酸聚合物,其长度通常大于50、60、70、80、90或100个氨基酸。“肽”被定义为氨基酸的短聚合物,长度通常为50、40、30、20或更短的氨基酸。

如本文所用,术语“肽”、“多肽”和“蛋白质”是指包含通过酰胺键连接的氨基酸残基聚合物链的分子。术语“氨基酸残基”包括但不限于包含在由丙氨酸(Ala或A)、半胱氨酸(Cys或C)、天冬氨酸(Asp或D)、谷氨酸(Glu或E)、苯丙氨酸(Phe或F)、甘氨酸(Gly或G)、组氨酸(His或H)、异亮氨酸(Ile或I)、赖氨酸(Lys或K)、亮氨酸(Leu或L)、蛋氨酸(Met或M)、天冬酰胺(Asn或N)、脯氨酸(Pro或P)、谷氨酰胺(Gln或Q)、精氨酸(Arg或R)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、缬氨酸(Val或V)、色氨酸(Trp或W)和酪氨酸(Tyr或Y)残基。术语“氨基酸残基”还可以包括非标准的、非规范的或非天然的氨基酸,其任选地可以包括除以下任何氨基酸外的氨基酸:丙氨酸、半胱氨酸、天冬氨酸、谷氨酸、苯丙氨酸、甘氨酸、组氨酸、异亮氨酸、赖氨酸、亮氨酸、甲硫氨酸、天冬酰胺、脯氨酸、谷氨酰胺、精氨酸、丝氨酸、苏氨酸、缬氨酸、色氨酸和酪氨酸残基。术语“氨基酸残基”可以包括α-、β-、γ-和δ-氨基酸。

在一些实施方案中,术语“氨基酸残基”可以包括包含在由高半胱氨酸、2-氨基己二酸、N-乙基天冬酰胺、3-氨基己二酸、羟赖氨酸、β-丙氨酸、β-氨基丙酸、异常羟赖氨酸、2-氨基丁酸、3-羟脯氨酸、4-氨基丁酸、4-羟脯氨酸、哌啶酸、6-氨基己酸、异去丝氨酸、2-氨基庚酸、异常亮氨酸、2-氨基异丁酸、N-甲基甘氨酸、肌氨酸、3-氨基异丁酸、N-甲基异亮氨酸、2-氨基庚二酸、6-N-甲基赖氨酸、2,4-二氨基丁酸、N-甲基缬氨酸、地氨酰、正缬氨酸、2,2'-二氨基庚二酸、正亮氨酸、2,3-二氨基丙酸、鸟氨酸和N-乙基甘氨酸组成的组中的非标准、非常规和非天然氨基酸残基。术语“氨基酸残基”可以包括任何上述氨基酸的L异构体或D异构体。

非标准、非规范或非天然氨基酸的其他实例包括但不限于对乙酰基-L-苯丙氨酸、对碘-L-苯丙氨酸、O-甲基-L-酪氨酸、对炔丙氧基苯丙氨酸、对炔丙基-苯丙氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAcpβ-丝氨酸、L-Dopa、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯丙氨酸、对苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、磷酸丝氨酸、磷酸酪氨酸、对溴苯丙氨酸、对氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;甲硫氨酸氨基酸的非天然类似物;亮氨酸氨基酸的非天然类似物;异亮氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、卤素、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒、酯、硫代酸、硼酸酯、硼酸盐、18ufa18hor、膦酰基、膦、杂环、烯酮、亚胺、醛、羟胺、酮或氨基取代的氨基酸,或其组合;具有可光活化交联剂的氨基酸;自旋标记的氨基酸;荧光氨基酸;金属结合氨基酸;含金属的氨基酸;放射性氨基酸;光笼化和/或光致异构化氨基酸;含有生物素或生物素类似物的氨基酸;含酮的氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;可化学切割或可光切割的氨基酸;具有延长侧链的氨基酸;含有毒性基团的氨基酸;糖取代的氨基酸;碳连接的含糖氨基酸;具有氧化还原活性的氨基酸;含α-羟基的酸;氨基硫代酸;α,α双取代氨基酸;β-氨基酸;γ-氨基酸,脯氨酸或组氨酸以外的环状氨基酸,苯丙氨酸、酪氨酸或色氨酸以外的芳香族氨基酸。

如本文所用,“肽”定义为氨基酸的短聚合物,其长度通常为20个或更少的氨基酸,并且更通常为12个或更少的氨基酸(Garrett&Grisham,Biochemistry,第2版,1999,Brooks/Cole,110)。在一些实施方案中,如本文所考虑的肽可以包括不超过约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。多肽,也称为蛋白质,通常长度>100个氨基酸(Garrett&Grisham,Biochemistry,第2版,1999,Brooks/Cole,110)。如本文所考虑的,多肽可以包括但不限于100、101、102、103、104、105、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约875、约900、约925、约950、约975、约1000、约1100、约1200、约1300、约1400、约1500、约1750、约2000、约2250、约2500个或更多个氨基酸残基。

如本文所考虑的肽可以被进一步修饰以包括非氨基酸部分。修饰可以包括但不限于酰化(例如,O-酰化(酯)、N-酰化(酰胺)、S-酰化(硫酯))、乙酰化(例如,在蛋白质的N-末端或在赖氨酸残基)、甲酰化脂酰化(例如,硫辛酸酯、C8官能团的连接),肉豆蔻酰化(例如,肉豆蔻酸酯、C14饱和酸的连接)、棕榈酰化(例如,棕榈酸酯、C16饱和酸的连接)、烷基化(例如,在赖氨酸或精氨酸残基处添加烷基,例如甲基)、异戊二烯化或异戊二烯化(例如,添加类异戊二烯基团,例如法呢醇或香叶基香叶醇)、在C-末端酰胺化、糖基化(例如,向天冬酰胺、羟赖氨酸、丝氨酸或苏氨酸添加糖基,产生糖蛋白)。聚唾液酸化(例如,加入聚唾液酸)、糖基化(例如,糖基磷脂酰肌醇(GPI)锚定形成、羟基化、碘化(例如甲状腺激素的)和磷酸化(例如,加入磷酸基团,通常加到丝氨酸、酪氨酸、苏氨酸或组氨酸)不同于被认为是糖的非酶促连接的糖基化。

本文公开的蛋白质可以包括“野生型”蛋白质及其变体、突变体和衍生物。如本文所用,术语“野生型”是技术人员理解的本领域术语,是指生物体、菌株、基因或特征的典型形式,如其在自然界中出现的,有别于突变体或变异体形式。如本文所用,“变体”、“突变体”或“衍生物”是指具有不同于参考蛋白质或多肽分子的氨基酸序列的蛋白质分子。变体或突变体相对于参考分子可以具有一个或多个氨基酸残基的插入、缺失或取代。变体或突变体可以包括参考分子的片段。例如,突变体或变体分子相对于参考多肽可以具有至少一个氨基酸残基的一处或多处插入、缺失或取代。

关于蛋白质,“缺失”是指导致一个或多个氨基酸残基缺失的氨基酸序列变化。删除可以去除至少1、2、3、4、5、10、20、50、100、200或更多个氨基酸残基。缺失可以包括内部缺失和/或末端缺失(例如,参考多肽的N-末端截短、C-末端截短或两者)。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括相对于参考多肽序列的缺失。

关于蛋白质,“片段”是与参考序列序列相同但长度短于参考序列的氨基酸序列的一部分。片段可以包含至多参考序列的整个长度,减去至少一个氨基酸残基。例如,片段可分别包含参考多肽的5至1000个连续氨基酸残基。在一些实施方案中,片段可以包含参考多肽的至少5、10、15、20、25、30、40、50、60、70、80、90、100、150、250或500个连续氨基酸残基.片段可以优先选自分子的某些区域。术语“至少一个片段”包括全长多肽。相对于全长蛋白质,片段可以包括N-末端截短、C-末端截短或这两种截短。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括参考多肽序列的片段。

关于蛋白质,词语“插入”和“添加”是指氨基酸序列的变化导致添加一个或多个氨基酸残基。插入或添加可指1、2、3、4、5、10、20、30、40、50、60、70、80、90、100、150、200或更多个氨基酸残基。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括相对于参考多肽序列的插入或添加。蛋白质的变体可具有N-末端插入、C-末端插入、内部插入或N-末端插入、C-末端插入和内部插入的任何组合。

关于蛋白质,短语“同一性百分比”和“%同一性”是指使用标准化算法比对的至少两个氨基酸序列之间的残基匹配百分比。氨基酸序列比对的方法是众所周知的。一些比对方法考虑保守的氨基酸替换。下文更详细解释的此类保守取代通常保留取代位点处的电荷和疏水性,从而保留多肽的结构(并因此保留功能)。可以如本领域所理解的那样确定氨基酸序列的百分比同一性。(例如参见美国专利号7,396,664,其通过引用整体并入本文)。国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLAST)提供一套常用且可免费获得的序列比较算法,该工具可从多个来源在其网站获得,包括马里兰州贝塞斯达NCBI。BLAST软件套件包括各种序列分析程序,包括“blastp”,用于将已知氨基酸序列与来自各种数据库的其他氨基酸序列进行比对。

关于蛋白质,同一性百分比可以在整个定义的多肽序列的长度上测量,例如,如由特定的SEQ ID号定义的,或可以在较短的长度上测量,例如,在取自更大的、确定的多肽序列,例如至少15、至少20、至少30、至少40、至少50、至少70或至少150个连续残基的片段的片段的长度上测量。此类长度仅是示例性的,并且应理解,本文、表格、附图或序列表中所示序列支持的任何片段长度可用于描述可测量同一性百分比的长度。

关于蛋白质,本文考虑的变体、突变体或衍生物的氨基酸序列可以包括相对于参考氨基酸序列的保守氨基酸取代。例如,变体、突变体或衍生蛋白质可以包括相对于参考分子的保守氨基酸取代。“保守氨基酸取代”是将一个氨基酸取代为不同氨基酸的取代,其中预测该取代对参考多肽的性质干扰最少。换言之,保守氨基酸取代基本上保留参考多肽的结构和功能。下表提供本文考虑的示例性保守氨基酸取代的列表:

保守氨基酸取代通常保持(a)取代区域内的多肽骨架结构,例如,β折叠或α螺旋构象,(b)取代位点处分子的电荷或疏水性,和/或(c)大部分侧链。非保守氨基酸通常会破坏(a)取代区域的多肽骨架结构,例如,作为β折叠或α螺旋构象,(b)取代位点处分子的电荷或疏水性,和/或(c)大部分侧链。

所公开的蛋白质、突变体、变体或本文所述的蛋白质可具有参考多肽表现出的一种或多种功能或生物活性(例如,野生型蛋白质表现出的一种或多种功能或生物活性)。

所公开的蛋白质可以是基本上分离的或纯化的。术语“基本上分离或纯化”是指从其天然环境中去除的蛋白质,并且至少60%不含,优选至少75%不含,更优选至少90%不含,甚至更优选至少95%不含与它们自然相关的其他组分。

本文公开的蛋白质可以从“翻译模板”表达。如本文所用,“翻译模板”是指从表达模板转录的RNA产物,其可被核糖体用于合成多肽或蛋白质。

本文公开的蛋白质可以在“反应混合物”中表达。如本文所用,术语“反应混合物”是指含有进行给定反应所必需的试剂的溶液。如果反应混合物包含进行反应所需的所有试剂,则该反应混合物被称为完全反应混合物。反应混合物的组分可以分别储存在单独的容器中,每个容器包含一种或多种全部组分。组分可以单独包装用于商业化并且有用的商业试剂盒可以包含一种或多种用于反应混合物的反应组分。

无细胞蛋白质合成

无细胞蛋白质合成(CFPS)和制备用于CFPS的细胞提取物的方法是本领域已知的。(例如参见Carlson等,“Cell-free protein synthesis:Applications come of age,”Biotech.Adv.Vol.30,Issue 5,Sept-Oct 2012,Pages 1185-1194;Hodgman等,“Cell-freesynthetic biology:Thinking outside the cell,”Metabol.Eng.Vol.14,Issue 3,May2012,Pages 261-269;和Harris等,“Cell-free biology:exploiting the interfacebetween synthetic biology and synthetic chemistry,”Curr.Op.Biotech.Vol.23,Issue 5,October 2012,Pages 672-678;还参见美国专利号7,312,049;7,008,651;和6994986;还参见美国公开申请号20170306320;20160362708;20160060301;20120088269;20090042244;2008024821;20080138857;20070154983;20070141661;20050186655;20050148046l20050064592;20050032086;20040209321;和20040038332;其内容通过引用以其整体并入本文)。

所公开的合成方法可以利用细胞提取物。如本领域所理解的,细胞提取物是从无细胞或基本上无细胞的细胞制备的提取物。例如,细胞提取物可以通过使用例如机械或化学方法裂解细胞并分离无细胞或基本无细胞的裂解细胞级分来制备。

所公开的组合物可以包括用于在体外制备序列限定的蛋白质生物聚合物的平台。用于在体外制备序列定义的聚合物或蛋白质的平台包括来自生物体的细胞提取物,特别是梭菌属物种,例如产乙醇梭菌。由于CFPS利用从细胞粗裂解物中制备的催化蛋白集合,细胞提取物(其组分对生长介质、裂解方法和加工条件敏感)是基于提取物的CFPS反应的重要组成部分。存在多种方法来制备能够进行无细胞蛋白质合成的提取物,包括在2014年10月2日公布的美国公开申请号20140295492中公开的那些,该申请通过引用以其整体并入。

该平台可以包括表达模板、翻译模板或表达模板和翻译模板两者。表达模板用作转录至少一种RNA的底物,该RNA可以翻译成序列限定的生物聚合物(例如,多肽或蛋白质)。翻译模板是RNA产物,核糖体可以使用它来合成序列定义的生物聚合物。在某些实施方案中,平台包括表达模板和翻译模板。在某些特定实施方案中,平台可以是偶联转录/翻译(“Tx/T1”)系统,其中从相同细胞提取物合成翻译模板和序列定义的生物聚合物。

该平台可以包含一种或多种能够从表达模板产生翻译模板的聚合酶。聚合酶可以外源提供或可以从用于制备提取物的生物体提供。在某些特定实施方案中,聚合酶由存在于用于制备提取物的生物体中的质粒和/或用于制备提取物的生物体基因组中的整合位点表达。

该平台可以包括正交平移系统。正交平移系统可以包含一个或多个正交组分,这些组分被设计为平行于和/或独立于生物体的正交平移机构操作。在某些实施方案中,正交翻译系统和/或正交组分被配置为掺入非天然氨基酸。正交组分可以是正交蛋白质或正交RNA。在某些实施方案中,正交蛋白质可以是正交合成酶。在某些实施方案中,正交RNA可以是正交tRNA或正交rRNA。美国公开申请号20170073381和20160060301中已经描述了正交rRNA组分的示例,其内容通过引用整体并入。在某些实施方案中,一种或多种正交组分可以通过寡核苷酸模板的表达在体内或体外制备。一种或多种正交组分可以从基因组重新编码的生物体中存在的质粒表达,从基因组重新编码的生物体基因组中的整合位点表达,从基因组重新编码的生物体中存在的质粒和在基因重新编码的生物体的基因组中的整合位点共同表达,在体外转录和翻译反应中表达,或作为因子外源添加(例如,加到平台或反应混合物中的正交tRNA或正交合成酶)。

包含梭菌属提取物的平台

所公开的组合物(或系统)可以包括用于在体外制备序列定义的生物聚合物或蛋白质的平台,其中该平台包含从梭菌属物种,特别是产乙醇梭菌属的细胞培养物制备的细胞提取物。

合适的梭菌属物种可以包括天然存在的分离物(即,野生型物种),或者梭菌属物种可以被改造。例如,梭菌属物种可以被改造为缺乏无细胞蛋白质合成(CFPS)的阴性效应物,例如通过敲除突变。已针对大肠杆菌定义CFPS的阴性效应物,可能包括但不限于endA(SEQ ID NO:1)、lon(SEQ ID NO:2)、mazF(SEQ ID NO:3)、ompT(SEQ ID NO:4)、rna(SEQ IDNO:5)、rnb(SEQ ID NO:6)、glpK(SEQ ID NO:7)、gor(SEQ ID NO:8)、gshA(SEQ ID NO:9)、tnaA(SEQ ID NO:10)、rne(SEQ ID NO:11)、gdhA(SEQ ID NO:12)、sdaA(SEQ ID NO:13)、sdaB(SEQ ID NO:14)、speA(SEQ ID NO:15)、WaaL(SEQ ID NO:16),以及它们的任何组合。

可将合适的梭菌属物种改造为缺乏编码大肠杆菌endA、mazF、rna、rnb、rne、gor、lon、ompT、gdhA、gshA、sdaA、sdaB、speA、WaAL、tnaA、glpK及其任何组合中任一种的相应同系物的基因。例如,梭菌属物种可能缺乏编码大肠杆菌endA、mazF、rna、rnb、rne、gor、lon、ompT、gdhA、gshA、sdaA、sdaB、speA、WaaL、tnaA、glpK中任一种的相应同系物的基因,其同系物至少具有与endA(SEQ ID NO:1)、lon(SEQ ID NO:2)、mazF(SEQ ID NO:3)、ompT(SEQ IDNO:4)、rna(SEQ ID NO:5)、rnb(SEQ ID NO:6)、glpK(SEQ ID NO:7)、gor(SEQ ID NO:8)、gshA(SEQ ID NO:9)、tnaA(SEQ ID NO:10)、rne(SEQ ID NO:11)、gdhA(SEQ ID NO:12)、sdaA(SEQ ID NO:13)、sdaB(SEQ ID NO:14)、speA(SEQ ID NO:15)、WaaL(SEQ ID NO:16)中的一个或多个以及它们的任何组合约20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的氨基酸序列同一性。

此外或备选地,梭菌属物种可被改造以表达作为CFPS阳性效应物的上调基因产物。已为大肠杆菌定义CFPS的阳性效应子,可能包括但不限于ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr及其任何组合。梭菌属物种可以在基因组上改造,例如通过将异源DNA重组引入梭菌属的基因组中,和/或梭菌属可以通过将附加型载体(例如,质粒)引入梭菌属中来改造以产生表达上调基因产物的梭菌属的改造物种,所述基因产物是大肠杆菌ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr中的任一种及其任何组合的相应同系物。例如,梭菌属可被改造以表达具有与大肠杆菌ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr中的一种或多种及其任何组合至少约20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的氨基酸序列同一性的上调基因产物。

梭菌属物种可以被改造为特别缺乏翻译释放因子。用于翻译的释放因子可以包括但不限于释放因子1(RF-1)。

梭菌属物种可以被基因组重新编码。例如,梭菌属可以被基因组重新编码以用不同的密码子替换一个或多个终止密码子,任选地其中所述梭菌属的基因组中的所有一个终止密码子被替换为不同的密码子。

梭菌属物种可以被改造以表达非天然或异源RNA聚合酶,例如,通过将编码RNA聚合酶的异源DNA重组引入梭菌属的基因组中,和/或梭菌属可以通过引入表达RNA聚合酶(例如,质粒)的附加型载体到梭菌属改造。合适的RNA聚合酶可以包括但不限于T7 RNA聚合酶。

该平台的细胞提取物是从梭菌的细胞培养物中制备的。在一些实施方案中,细胞培养物处于静止期。在一些实施方案中,固定相可被定义为细胞培养物具有大于约3.0,3.5,4.0,4.5,5.0,5.5,6.0,6.5,7.0,7.5,8.0的OD600,或具有由这些值中的任何一个限定的范围内的OD600

细胞提取物可以通过裂解细胞培养物的细胞并从裂解的细胞中分离部分来制备。例如,细胞提取物可以通过裂解细胞培养物的细胞并使裂解的细胞经受离心力,并在离心后分离级分(例如,其中分离S12级分和/或S30级分)来制备。

本文公开的平台可以包括附加组分,例如用于执行CFPS的一个或多个组分。组分可以包括但不限于氨基酸,其任选地可以包括非常规氨基酸、NTP、盐(例如钠盐、钾盐和/或镁盐)、辅因子(例如,烟酰胺腺嘌呤二核苷酸(NAD)和/或辅酶-A(CoA))、能量源和任选的包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP)、ATP或磷酸肌酸)、翻译模板(例如,在平台中翻译的非天然mRNA)和/或转录模板(例如,用于合成在平台中翻译的非天然mRNA的模板DNA),以及它们的任何组合。

在一些实施方案中,平台可以包含能量源和任选地包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP)、ATP或磷酸肌酸),其中能量源以大于约30mM、40mM、50mM、60mM、70mM、80mM或90mM(优选大于约67mM),但小于约100mM,或在由任何这些值界定的浓度范围内的浓度存在于平台中。

在一些实施方案中,平台还包含钾(K+)源(例如钾盐,例如谷氨酸钾),其中平台包含浓度大于约50mM、100mM、150mM、200mM的钾、250mM、300mM、350mM、400mM或450mM(优选约300mM),但小于约500mM,或在由这些值中的任一个界定的浓度范围内。

在一些实施方案中,平台还包含镁(Mg2+)源(例如镁盐,例如谷氨酸镁或乙酸镁),其中平台包含浓度大于约1mM、2mM、3mM的镁、4mM、5mM、6mM、8mM、12mM、16mM、20mM、24mM、28mM、32mM、36mM(优选约24mM),但小于约60mM,或在由这些值中的任何一个界定的浓度范围内。

所公开的平台和细胞提取物可用于在体外制备序列限定的生物聚合物或蛋白质的方法中。所公开的方法通常包括体外翻译在前述权利要求中任一项的平台中编码定义的生物聚合物或蛋白质的序列的翻译模板(例如,mRNA)。任选地,所公开的方法可以包括在平台中转录转录模板(例如,DNA)以提供翻译模板。

所公开的方法可以在适合从梭菌属物种制备的细胞提取物的条件下进行。在一些实施方案中,所公开的方法在约20-40℃的温度下进行,优选在约30℃的温度下进行。

可以执行所公开的方法来合成任何序列限定的生物聚合物或蛋白质。在一些实施方案中,序列定义的聚合物或蛋白质是治疗性蛋白质和/或该方法可用于通过翻译转录模板文库来鉴定治疗性蛋白质或生物材料。在一些实施方案中,可以进行所公开的方法以优化从梭菌属物种制备的细胞提取物的体外翻译条件。

本文还考虑试剂盒。在一些实施方案中,所考虑的试剂盒包含作为组分:(a)从梭菌属(例如产乙醇梭菌)的细胞培养物制备的细胞提取物;(b)用于翻译mRNA的反应混合物。所公开试剂盒的反应混合物的合适组分可以包括但不限于氨基酸,其任选可以包括非规范氨基酸、NTP、盐(例如钠盐、钾盐和/或镁盐)、辅因子(例如,烟酰胺腺嘌呤二核苷酸(NAD)和/或辅酶-A(CoA))、能量源和任选的包含磷酸基团的能量源(例如ATP或磷酸肌酸)。

敲除突变

本文公开的梭菌属物种可以包括基因敲除突变,优选下调或消除CFPS的负蛋白效应物的敲除突变。在某些实施方案中,至少一种额外的基因敲除突变改善DNA稳定性、RNA稳定性、蛋白质稳定性、氨基酸稳定性、能量供应或其任何组合。在某些实施方案中,至少一种额外的基因敲除突变包含1、2、3、4或多于4个基因敲除突变。在菌株包含2个或更多个基因敲除突变的实施方案中,至少2个基因敲除突变可以同时改善相同的属性、改善DNA稳定性、改善RNA稳定性、改善蛋白质稳定性、改善氨基酸稳定性、改善能量供应,或者两者都可以改善不同的属性。

为了改善DNA或RNA的稳定性,至少一种额外的基因敲除突变可以靶向核酸酶的功能失活。在体内,核酸酶在调节DNA和mRNA转换方面发挥重要作用。然而,它们在粗细胞提取物中的存在预计是有害的,导致模板不稳定和反应终止。已在大肠杆菌中鉴定的潜在负面效应物的非详尽列表如下:RNase A(由ma编码)通过催化磷酸二酯键的裂解来降解RNA,并且鉴定缺乏ma的菌株(例如MRE600、A19)对于体外翻译的早期研究是重要的。RNase II(由rnb编码)负责通过3'至5'核酸外切酶活性的mRNA衰减,并且缺乏RNase II的细胞提取物的CFPS效率提高70%。RNase E(由me编码)是冷休克降解体的一部分,它在冷休克中诱导mRNA衰减,细胞在提取物生成之前的收获期间经历这种衰减。MazF(由mazF编码)是通过序列特异性(ACA)内切核糖核酸酶活性降解mRNA的毒素,这可能会影响转录本的稳定性。CsdA(由csdA编码)与RNase E一起是冷休克降解体的一部分,并在冷休克中诱导mRNA衰减,细胞在提取物生成之前的收获期间经历这种衰减。DNA特异性核酸内切酶I(由endA编码)破坏双链DNA,并且其缺失先前已证明对于延长CFPS反应的持续时间很重要。这些和其他核酸酶的相应梭菌属同系物可以通过至少一个额外的基因敲除突变在功能上失活。

为了提高蛋白质稳定性,至少一种额外的基因敲除突变可以针对蛋白酶的功能失活。在体内,这些蛋白酶在调节蛋白质周转方面发挥重要作用。然而,它们在CFPS反应中的存在预计是有害的,导致蛋白质不稳定问题。在大肠杆菌中鉴定的潜在负面效应物的非详尽列表如下:谷胱甘肽还原酶(由gor编码)还原氧化型谷胱甘肽以维持细胞质中的还原环境,从而使二硫键蛋白的合成存在问题。Lon(由lon编码)是一种ATP依赖性蛋白酶,在转录下调后,BL21菌株的无细胞系统中的蛋白质产量得到改善。外膜蛋白酶VII(由ompT编码)显示出对配对碱性残基的特异性,并且已被证明在CFPS期间去除后可稳定蛋白质。这些和其他蛋白酶的相应梭菌属同系物可以通过至少一个额外的基因敲除突变在功能上失活。

至少一种额外的基因敲除突变可以靶向已知会对氨基酸或能量供应产生负面影响的蛋白质。在体内,这些蛋白质在代谢和底物周转中起重要作用。然而,它们在粗细胞提取物中的存在预计是有害的,导致支持翻译的氨基酸和能量供应减少。以下是在大肠杆菌中鉴定的潜在负面效应物的非详尽清单。谷氨酸脱氢酶(由gdhA编码)催化谷氨酸脱氨,这可能会影响谷氨酸的稳定性。谷氨酸-半胱氨酸连接酶(由gshA编码)催化谷胱甘肽合成的第一步,并可能降低半胱氨酸的稳定性。丝氨酸脱氨酶I(由sdaA编码)和丝氨酸脱氨酶II(由sdaB编码)是参与丝氨酸降解的三种酶中的两种。精氨酸脱羧酶(由speA编码)在腐胺的生物合成生产中消耗精氨酸。色氨酸酶(由tnaA编码)在吲哚的生产中消耗色氨酸。最后,甘油激酶(由glpK编码)消耗ATP以磷酸化甘油,这有助于消耗无细胞反应所需的能量供应。这些和其他蛋白质的相应梭菌属同系物可以通过至少一个额外的基因敲除突变在功能上失活。

具有至少一个额外基因敲除突变的菌株可以通过改造菌株以功能性地灭活阴性效应物以从由该菌株制备的裂解物中减少或消除阴性效应物的任何方法来制备。在某些实施方案中,基因敲除突变可以通过将无义突变和/或移码突变插入菌株的基因组以及删除基因编码序列的重要部分来制备。在某些实施方案中,基因敲除突变可以通过去除调节序列(即启动子、核糖体结合位点)或以其他方式改变基因组中的这些序列以使它们无功能来制备。在某些实施方案中,可以通过引入独特的亲和标签并随后使用该标签从裂解物中选择性去除效应蛋白而在裂解物中功能性敲除阴性效应物蛋白。在某些实施方案中,可以通过多重自动化基因组工程(MAGE)、λ-Red重组酶介导的重组(Datsenko-Wanner)、锌指核酸酶(ZFN)、转录激活因子样效应核酸酶(TALEN)、成簇的规则间隔短回文重复序列(CRISPR)相关蛋白9核酸酶(Cas9)、同源重组、基于内含子的破坏和任何其他常用的重组工程和基因组工程工具制备具有至少一种额外基因敲除、敲低或破坏突变的菌株。用于梭菌属中基因敲除/降低或破坏的遗传工具是本领域已知的。(例如参见Joseph等,“RecentDevelopments of the Synthetic Biology Toolkit for Clostridium,”Front.Microbiol.,2018;9:154;和Liew等,“Gas Fermentation–A Flexible Platformfor Commercial Scale Production of Low-Carbon-Fuels and Chemicals from Wasteand Renewable Feedstocks,”Front.Microbiol.2016年5月11日,1-29;其内容通过引用整体并入本文)。

上调基因产品

可将本文公开的梭菌属物种改造以表达额外的上调基因产物。至少一种额外的上调基因产物优选是作为CFPS阳性效应物的上调基因产物。在某些实施方案中,至少一种额外的上调基因产物改善能量供应、分子伴侣水平、翻译功能、核糖体再循环或其任何组合。在某些实施方案中,至少一种额外上调基因产物包含1、2、3、4或多于4种上调基因产物。在其中菌株包含2个或更多个上调基因产物的实施方案中,至少2个上调基因产物可同时改善相同的属性、改善能量供应、改善分子伴侣水平、改善翻译功能或改善核糖体循环,或可同时改善不同的属性。

为了改善能量供应,至少一种额外的上调基因产物可以靶向激酶的上调。在体内,这些蛋白质在代谢和磷酸基团的转移中起重要作用。粗细胞提取物中上调的存在有望改善能量供应以支持翻译。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。乙酸激酶(由ackA编码)增加代谢物向底物水平ATP生成的整体代谢通量。核苷二磷酸激酶(由ndk编码)促进NTP从其相应的NDP合成。丙酮酸激酶单体(由pykF编码)有助于驱动ATP生成。这些和其他激酶的相应梭菌属同系物可以是至少一种额外的上调基因产物。

为了改善能量供应,至少一种额外的上调基因产物可以靶向脱氨酶的上调。在体内,这些蛋白质可能在代谢和制备代谢物方面发挥重要作用。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。胞苷脱氨酶(由cdd编码)启动胞苷脱氨,这可能导致UTP的合成。这些和其他脱氨酶的相应的梭菌属同系物可以是至少一种额外的上调基因产物。

为了改善分子伴侣水平,至少一种上调的基因产物可以靶向异构酶、折叠酶和/或保持酶的上调。在体内,这些蛋白质可能在辅助蛋白质采用功能活性构象方面发挥重要作用。粗细胞提取物中上调的存在预计会改善分子伴侣水平,以支持蛋白质生产成可溶性和/或活性确认。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。二硫键异构酶(由dsbC编码)将二硫键改组到正确的位置。伴侣蛋白DnaK(由dnaK编码)有助于新生多肽链的折叠和错误折叠蛋白的拯救。伴侣蛋白DnaJ(由dnaJ编码)刺激DnaK的ATPase活性。蛋白质GrpE(由grpE编码)刺激DnaK的ATPas活性。触发因子(由tig编码)有助于新生多肽的折叠。10kDa伴侣蛋白亚基(由groS编码)形成帮助蛋白质折叠的GroEL-GroES伴侣蛋白复合物的一部分。60kDa伴侣蛋白亚基(由groL编码)形成帮助蛋白质折叠的GroEL-GroES伴侣蛋白复合物的一部分。这些和其他异构酶、折叠酶和/或保持酶的相应梭菌属同系物可以是至少一种额外的上调基因产物。

为了改善翻译功能,至少一种上调的基因产物可以靶向起始因子和/或延伸因子的上调。在体内,这些蛋白质在翻译功能中起着重要作用。粗细胞提取物中上调的存在有望改善翻译功能。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。翻译起始因子IF-1(由infA编码)与30S核糖体亚基相互作用以启动翻译。翻译起始级分IF-2(由infB编码)在通过GTP依赖机制正确放置带电起始fMet-tRNA中起作用。延伸因子G(由fusA编码)促进核糖体通过一个密码子沿mRNA的易位。延伸因子P(由efp编码)刺激肽键的合成。延伸因子4(由lepA编码)可以改变翻译速度,导致在某些压力条件下翻译速度增加。延伸因子TU 2(由tufB编码)有助于将带电的tRNA穿梭至核糖体。这些和其他起始因子和/或延伸因子的相应梭菌属同系物可以是至少一种额外的上调基因产物。

为了改善翻译功能,至少一种上调的基因产物可以针对回收因子的上调。在体内,这些蛋白质在核糖体循环中起着重要作用。粗细胞提取物中上调的存在有望改善核糖体的回收。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。热休克蛋白15(由hslR编码)参与游离50S核糖体亚基的回收。核糖体循环因子(由frr编码)在多肽链释放后促进核糖体亚基的快速循环。这些和其他再循环因子的相应梭菌属同系物可以是至少一种额外的上调基因产物。

具有至少一个额外基因敲除突变的菌株可以通过改造菌株以在功能上增加阳性效应子以增加阳性效应子在由该菌株制备的裂解物中的存在的任何方法来制备。在某些实施方案中,上调的基因产物从GRO中存在的质粒表达和/或从GRO基因组中的整合位点表达。此外,可以通过在位于质粒或基因组上的感兴趣基因前面设计启动子和/或核糖体结合位点来增强基因上调。更强的启动子/核糖体结合位点会导致转录活性增加。通常用于将过表达阳性效应子的质粒整合到菌株中的技术包括转化。通常用于将含有阳性效应子的基因盒整合到基因组中以进行过表达的技术包括X-Red重组酶介导的重组(Datsenko-Wanner)。用于梭菌中基因敲除/降低或破坏的遗传工具是本领域已知的。(例如参见Joseph等,“RecentDevelopments of the Synthetic Biology Toolkit for Clostridium,”Front.Microbiol.,2018;9:154;和Liew等,“Gas Fermentation–A Flexible Platformfor Commercial Scale Production of Low-Carbon-Fuels and Chemicals from Wasteand Renewable Feedstocks,”Front.Microbiol.2016年5月11日,1-29;其内容通过引用整体并入本文)。

基因组记录生物

本发明的一个方面是基因组重新编码的生物体(GRO),其任选地可以是缺乏释放因子1(RF1)或其遗传同系物的菌株。GRO可以通过任何应变工程方法制备。在某些实施方案中,通过在菌株中替换UAG密码子的所有实例,允许删除释放因子1(RF1;在UAG和UAA处终止翻译),并因此消除在UAG密码子处的翻译终止,制备缺乏RF1的菌株。该GRO允许重新引入UAG密码子,以及正交翻译机制,以允许将非标准或非规范氨基酸有效地和位点特定地掺入蛋白质中。也就是说,UAG可以从无义密码子(终止翻译)转化为有义密码子(包含选择的氨基酸),前提是存在适当的翻译机制。

说明性实施方案

下面提供本文公开的主题的几个说明性实施方案。这些说明性实施方案无意以任何方式限制权利要求。

实施方案1.一种用于mRNA体外转录和/或多肽翻译的无细胞蛋白质合成平台,该平台包含作为组分的从梭菌属物种的细胞培养物中制备的细胞提取物。

实施方案2.实施方案1的平台,其中所述梭菌属的物种选自产乙醇梭菌、杨氏梭菌,丁酸梭菌,拜氏梭菌,巴氏梭菌,糖丁酸梭菌(Clostridiumsaccharoperbutylacetonicum)、醋酸梭菌、破伤风形梭菌(Clostridium tetanomorphum)、Clostridium phytofermentans、Clostridium arbusti、Clostridium akagii、纤维梭菌、Clostridium diolis、Clostridium acetireducens、Clostridium coskatii、Clostridiumragsdalei、Clostridium drakei、Clostridium formicoaceticum、Clostridiumscatalogenes、克氏梭菌、酪丁酸梭菌、Clostridium grantii、Clostridiumhomopropionicum、Clostridium tepidiprofundi、Clostridium collagenovorans、Clostridium tunisiense、Clostridium argentinense、Clostridium ihumii、尸毒梭菌(Clostridium cadaveris)、Clostridium amylolyticum、Clostridium sartagoforme、巴氏梭菌、副腐化梭菌(Clostridium paraputrificum)、谲诈梭菌(Clostridium fallax)、Clostridium cavendishii、释义柱胞梭菌(Clostridium cylindrosporum)、Clostridiumphoceensis、肉毒梭菌、艰难梭菌、破伤风梭菌、污泥梭菌(Clostridium sordelli)、魏氏梭菌(Clostridium perfringes)、诺氏梭菌、腐败梭菌、污泥梭菌、溶组织梭菌、产气荚膜梭菌、生孢梭菌(Clostridium sporogenes)、多枝梭菌(Clostridium ramosum)、无害梭菌(Clostridium innocuum)、梭状梭菌(Clostridium clostridioforme)、第三梭菌(Clostridium tertium)和水肿梭菌(Clostridium oedematiens)。

实施方案3.实施方案1或2的平台,其中所述梭菌属物种为产乙醇梭菌。

实施方案4.前述实施方案中任一项的平台,其中所述梭菌属物种被改造以缺乏无细胞蛋白质合成(CFPS)的阴性效应物。

实施方案5.实施方案4的平台,其中用于CFPS的阴性效应物选自大肠杆菌endA、mazF、rna、rnb、rne、gor、lon、ompT、gdhA、gshA、sdaA、sdaB、speA、WaaL、tnaA、glpK及其任何组合的梭菌属同系物。

实施方案6.前述实施方案中任一项的平台,其中所述梭菌属物种被改造以表达作为CFPS阳性效应物的上调基因产物。

实施方案7.实施方案6的平台,其中用于CFPS的阳性效应物选自大肠杆菌ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr及其任何组合的梭菌属同系物。

实施方案8.前述实施方案中任一项的平台,其中所述梭菌属物种被改造以缺乏释放因子1。

实施方案9.前述实施方案中任一项的平台,其中所述梭菌属物种被改造以表达T7RNA聚合酶。

实施方案10.前述实施方案中任一项的平台,其中所述细胞培养物处于静止期。

实施方案11.实施方案10的平台,其中静止期被定义为具有大于约3.0的OD600的细胞培养物。

实施方案12.前述实施方案中任一项的平台,其中细胞提取物包含细胞培养物的S12级分和/或S30级分。

实施方案13.前述实施方案中任一项的平台还包括以下中的一个或多个:(i)反应缓冲液;(ii)RNA聚合酶;(iii)转录模板,其中RNA聚合酶能够转录转录模板以形成翻译模板,并且细胞提取物能够通过组合的转录/翻译反应维持蛋白质合成。

实施方案14.前述实施方案中任一项的平台,还包含一个或多个选自以下的组分:(i)氨基酸,其任选地可以包括非规范氨基酸并且任选地浓度在约0.5-4.0mM之间并且优选地约2mM;(ii)NTP;(iii)总浓度任选地在约50–400mM之间的盐;(iv)大分子拥挤剂,任选地为聚乙二醇或Ficol;(iv)辅因子;(v)能量源和任选的包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP));(vi)翻译模板;(vii)转录模板;(viii)依赖DNA的RNA聚合酶(例如,T7RNA聚合酶);(ix)它们的任何组合。

实施方案15.前述实施方案中任一项的平台,还包含能量源和任选地包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP)),其中所述能量源以大于约30mM、40mM、50mM、60mM、70mM、80mM或90mM(优选大于约67mM),但小于约100mM,或在由这些值中的任一个界定的浓度范围内的浓度存在。

实施方案16.前述实施方案中任一项的平台,还包含钾(K+)源,其中所述平台包含浓度大于约10mM、20mM、30mM或50mM,但小于约500mM、400mM、300mM或200mM,或在由这些值中的任一个界定的浓度范围内,优选约100mM的钾;和/或前述权利要求中任一项的平台,还包含镁(Mg+)源,其中所述平台包含浓度大于约1mM、2mM、3mM、4mM、5mM、6mM、8mM、12mM、16mM、20mM、24mM或28mM,但小于约60mM、56mM、52mM、48mM、44mM、40mM或36mM,或在由这些值中的任一个界定的浓度范围内,优选约32mM的镁。

实施方案17.前述实施方案中任一项的平台,其中整个平台或其一个或多个组分通过冷冻干燥保存。

实施方案18.前述实施方案中任一项的平台,其中所述细胞提取物通过包括以下步骤中的一个或多个的方法制备:(i)细胞悬浮和裂解(例如,通过超声处理);(ii)径流反应;和(iii)透析。

实施方案19.一种用于体外转录mRNA和/或体外翻译mRNA以制备多肽的方法,该方法包括从转录模板转录mRNA和/或在前述实施方案中任一项的平台中翻译mRNA。

实施方案20.实施方案19的方法,其中该方法包括在平台中转录DNA模板以提供翻译的mRNA。

实施方案21.实施方案19或20的方法,其中所述DNA模板编码包括促进有效转录和/或翻译的修饰的mRNA,任选地其中所述修饰存在于5'-UTR、3'UTR或两者中。

实施方案22.实施方案19-21中任一项的方法,其中该方法在约20-40℃之间的温度下进行。

实施方案23.根据实施方案19-22中任一项的方法,其中该方法作为分批反应进行。

实施方案24.实施方案19-22中任一项的方法,其中该方法作为半连续反应进行。

实施方案25.实施方案19-22中任一项的方法,其中该方法作为连续反应进行。

实施方案26.根据实施方案19-25中任一项的方法,其中该方法在厌氧条件下进行。

实施方案27.根据实施方案19-25中任一项的方法,其中该方法在有氧条件下进行。

实施方案28.包含作为组分的试剂盒:(a)从梭菌属物种的细胞培养物中制备的细胞提取物;(b)用于转录和/或翻译mRNA的反应混合物,任选地其中所述梭菌属物种是产乙醇梭菌。

实施方案29.实施方案28的试剂盒,其中反应混合物包含一种或多种选自由以下组成的组的组分:(i)氨基酸,其任选地可以包括非规范氨基酸;(ii)NTP;(iii)盐类;(iv)辅因子;(v)能量源和任选的包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP));(vi)它们的任何组合。

实施方案30.梭菌属的重组物种,任选地产乙醇梭菌,其中所述梭菌属物种被改造以缺乏无细胞蛋白质合成(CFPS)的阴性效应物。

实施方案31.实施方案30的梭菌属的重组物种,其中用于CFPS阴性效应物选自大肠杆菌endA、mazF、rna、rnb、rne、gor、lon、ompT、gdhA、gshA、sdaA、sdaB、speA、WaaL、tnaA、glpK及其任何组合的梭菌属同系物。

实施方案32.实施方案30或31的梭菌属的重组物种,其中所述梭菌属物种被改造以表达作为CFPS阳性效应物的上调基因产物。

实施方案33.实施方案32的梭菌属的重组物种,其中用于CFPS的阳性效应物选自大肠杆菌ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr及其任何组合的梭菌属同系物。

实施方案34.实施方案30-33中任一项的梭菌属的重组物种,其中所述梭菌属的物种被改造以缺乏释放因子1。

实施方案35.实施方案30-34中任一项的梭菌属的重组物种,其中所述梭菌属的物种已被基因组重新编码以用不同的密码子替换一个或多个终止密码子。

实施方案36.根据实施方案30-35中任一项的梭菌属的重组物种,其中所述梭菌属的物种被改造以表达T7 RNA聚合酶。

实施方案37.一种用于鉴定和表征梭菌属遗传部分和用于转录和/或翻译的梭菌属基因表达的方法,该方法包括:(a)形成梭菌属遗传部分或梭菌属变异基因序列的测试文库(例如,一种或更多的测试启动子、测试终止子、测试核糖体结合位点等);和(b)测试测试文库的遗传部分和/或在平台中表达的替代密码子,该平台包括:(i)从梭菌属制备的细胞提取物;(ii)用于转录和/或翻译mRNA的反应混合物

实施例

以下实施例是说明性的,不应被解释为限制要求保护的主题的范围。

A.简述

梭菌属是经过工业验证的微生物,具有出色的底物灵活性和代谢物多样性以及对代谢终产物和污染物的耐受性,使其适用于许多代谢工程应用。气体发酵梭菌属对可持续生化生产特别有吸引力,因为它们具有将废碳转化为低成本燃料和高价值化合物的潜力。不幸的是,设计和改造这些非模式生物仍然费力且成本高昂。在努力加速菌株工程的过程中,我们开发一种简单、稳健且高产的好氧梭菌属无细胞系统,用于体外代谢途径工程的酶表达原型。在这里,我们提出提取物制备和加工以及无细胞反应条件的系统优化以实现梭菌属特异性启动子、编码序列和代谢的原型设计。我们的系统源自工业相关厌氧菌产乙醇梭菌,并且在分批反应中产生>200μg/mL的活性荧光素酶,并且在半连续反应模式下产生>300μg/mL。这种不需要厌氧条件的易于使用的系统为梭菌属中不依赖氧的代谢工程工作原型提供极好的平台,例如转录和翻译以及由抗氧酶组成的代谢途径,这将扩展梭菌属代谢工程的“工具箱”并加快梭菌菌株工程工作。

B.介绍

微生物可以被改造成生产生物燃料和高价值化合物,如化学品、材料和治疗剂(Keasling,2012;Nielsen和Keasling,2016),以应对人口快速增长、能源需求增加和废物产生等现代挑战(Nielsen等,2014)。然而,即使是用于优化给定化合物在模式生物(如大肠杆菌和酵母)中的生物合成途径的最先进的设计-构建-测试循环仍需要数周到数月的时间,并且与这些生物相关的基于过程的挑战仍然存在(例如,有限的底物范围、添加酶的成本、CO2损失导致的产量降低、易受污染和遗传不稳定性)(Keasling,2012;Nielsen和Keasling,2016)。这些挑战阻碍新生物产品制造工艺的更快商业化,迄今为止,除了乙醇发酵外,只有少数成功商业化(Meadows等,2016;Nakamura和Whited,2003;Nielsen等,2014;Yim等,2011)。此外,大肠杆菌和酵母本质上缺乏某些细胞特征,这限制反应空间的多样性和最终可以制造的产品。因此,大多数工业生物过程(例如,氨基酸的合成)(Leuchtenberger等,2005)、丙酮-丁醇-乙醇(ABE)(Jiang等,2015;Jones,2005)、有机酸(Ghaffar等,2014;Rodriguez等,2014;Wee等,2006)依赖其他生物。

梭菌属是这样的一类生物,经过工业验证并且具有出色的底物和代谢物多样性,以及对代谢终产物和污染物的耐受性(Tracy等,2012)。梭菌的工业大规模发酵已经进行100多年,其中ABE发酵是仅次于乙醇发酵的第二大工业发酵过程(Jones,2005)。除ABE梭菌属(溶解性),还存在能够降解木质纤维素生物质(纤维素分解)的梭菌属物种和能够在C1底物(例如一氧化碳(CO)和CO2(产乙酸)上自养生长)的物种(Tracy等,2012)。产乙酸梭菌的气体发酵为合成气的转化提供有吸引力的途径,合成气可以从任何生物质资源(例如农业废物或未分类和不可回收的城市固体废物)和工业废物资源(例如来自钢厂、加工厂或炼油厂的废气))产生为燃料和化学品。然而,当前现有技术的梭菌属的菌株工程仍然是低通量、劳动密集型的努力。具体挑战包括生物体特定的遗传限制(Daniell等,2015;Joseph等,2018;Liew等,2016、2017;Nagaraju等,2016)、厌氧环境的要求,以及在产乙酸菌的情况下,气体处理。因此,梭菌属生物技术和梭菌属生物学基础知识的发展落后于需氧原核和真核生物学的成就。需要新的强大工具来研究梭菌并加快这些生物体中生物过程的设计、构建和测试。

基于提取物的无细胞系统正在成为合成生物学应用(如代谢工程)的强大平台(Bujara等,2011;Carlson等,2012;Dudley等,2019;Hodgman和Jewett,2012;Karim等,2019;Karim和Jewett,2016;Kelwick等,2017;Morgado等等,2018)。在无细胞环境中组装代谢途径传统上是通过组装纯化的酶和底物来完成的。然而,无细胞蛋白质合成(CFPS)系统的发展已经改变构建和测试通路的方式。这些系统由粗细胞提取物、能量底物、辅助因子和DNA形式的遗传指令组成,并促进试管中细胞过程的激活、操作和使用。虽然无细胞系统历来被用于研究基础生物学(例如遗传密码)(Nirenberg和Matthaei,1961)、无细胞蛋白质合成能力的最新发展(Caschera和Noireaux,2014;Jewett等,2008;Jewett和Swartz,2004)扩大应用空间以包括重组蛋白的批量生产(Garamella等,2016;Jaroentomeechai等,2018;Kwon等,2013)、纸质诊断(Gootenberg等,2017;Pardee等,2016、2014;Salehi等,2017;Takahashi等,2018)、按需生物制造(Karig等,2017;Pardee等,2016;Sullivan等,2016)、遗传部分的原型设计(Chappell等,2013;Marshall等,2018;Moore,Simon J.;MacDonald,James T.;Wienecke,Sarah;Ishwarbhai,Alka;Tsipa,Argyro;Aw,Rochelle;Kylilis,Nicolas;Bell,David J.,McClymont,David W.;Jensen,Kirsten;Polizzi,Karen M.;Biedendieck,Rebekka;Freemont,2018;Siegal-Gaskins等,2014;Melissa K Takahashi等,2015;Melissa K.Takahashi等,2015;Yim等,2019)和研究整个代谢途径(Bujara等,2011;Dudley等,2019;Karim等,2019;Karim和Jewett,2016;Kelwick等,2017)。这些系统具有三个关键优势:首先,这些系统没有细胞壁,因此可以进行主动监测、快速采样和直接操作,从而实现前所未有的设计自由,以控制、修改和设计所需的生物过程。其次,因为基因指令可以简单地以质粒DNA或线性PCR产物的形式加到CFPS反应中,它们避免了费力的克隆和转化步骤,从而可以在几个小时内而不是几天或几周内促进基因设计的测试。第三,这种方法不依赖耗时的酶纯化程序,而是通过体外合成所需的酶,直接在细胞提取物中快速建立和测试代谢途径(Karim等,2018;Karim和Jewett,2016)。

直到最近,无细胞系统大多是使用大肠杆菌和其他模式生物提取物开发的。这很重要,因为基于提取物的CFPS应用的范围是由所选的源生物和细胞收获和提取物制备时存在的生化资源预先确定的。这表示底盘生物独有的代谢酶、细胞机器(如翻译系统)以及辅助因子和能量再生系统也是该生物的独特提取物。最常用的CFPS系统来自大肠杆菌(细菌)(Carlson等,2012;Hodgman和Jewett,2012)、小麦胚芽(植物)(Madin等,2000;Takai等,2010)、草地夜蛾(Spodoptera frugiperda)(昆虫)(Ezure等,2010;Tarui等,2001),和兔网织红细胞(哺乳动物)(Anastasina等,2014;Kobs,2008;Pelham和Jackson,1976),其他正在开发中(Ferrer-Miralles等,2009;Gan和Jewett,2014;Hodgman和Jewett,2013),(Kovtun等,2010;Mureev等,2009),(等,2014;Martin等,2017),(王等,2018)(Mikami等,2010)(Kelwick等,2016)。然而,源自非模式生物的CFPS系统直到最近才被开发出来,最显著的是来自古细菌物种(Endoh等,2008、2007、2006)、芽孢杆菌(Moore,Simon J.;MacDonald,James T.;Wienecke,Sarah;Ishwarbhai,Alka;Tsipa,Argyro;Aw,Rochelle;Kylilis,Nicolas;Bell,David J.,McClymont,David W.;Jensen,Kirsten;Polizzi,KarenM.;Biedendieck,Rebekka;Freemont,2018)、链霉菌(Li等,2018,2017)和弧菌(Des Soye等,2018;Failmezger等,2018;Wiegand等,2018)。迄今为止,还没有梭菌无细胞系统能够产生足以构建遗传部分和代谢途径原型的蛋白质产量。在无细胞系统中研究梭菌属生物合成途径仅限于将大肠杆菌无细胞结果转化为梭菌细胞性能(Karim等,2019)。虽然这些努力可以成功地告知梭菌菌株工程尝试,但由于提取物中存在的大肠杆菌和梭菌属代谢之间的差异,它们受到限制。我们假设基于梭菌属提取物的无细胞平台将进一步提高对成功途径设计的预测,因为这些提取物可能更好地模拟生物体的自然代谢。

在这里,我们展示第一个易于使用、强大且高产的梭菌属CFPS平台,该平台源自工业相关菌株产乙醇梭菌,可促进无细胞合成生物学应用。我们通过使用最适合大肠杆菌系统的提取物制备和CFPS反应条件以及梭菌密码子适应的萤火虫萤光素酶作为报告蛋白,开始开发梭菌属CFPS系统。然后,我们通过系统地优化两个步骤的关键参数来调整提取物制备和CFPS反应条件,以适应梭菌属提取物。最后,我们展示我们的系统进行梭菌特异性原型设计的能力:通过在内源性启动子+来自梭菌属代谢酶的5'UTR控制下从构建体表达荧光素酶或通过利用不同的基因编码序列以及提取物中的梭菌属代谢途径的活性来原型设计梭菌属遗传部分(图1)。我们的系统在批量反应中产生>200μg/mL的活性荧光素酶,并且在半连续反应模式下产生>300μg/mL,能够检测因使用不同内源性启动子或编码序列而产生的基因表达差异,并显示梭菌属糖酵解中的代谢活性/糖异生和相关通路。据我们所知,所提出的系统是第一个源自专性厌氧菌的高产和强大的CFPS系统。其在有氧条件下对氧不敏感的生物过程进行原型设计的能力可以简化和加速梭菌属生物过程开发的代谢工程工作。

C.结果与讨论

开发能够从新生物体进行无细胞蛋白质合成(CFPS)的系统需要在多个层面进行优化。生物体的选择、发酵条件、提取物制备和加工以及无细胞反应条件均在CFPS平台中发挥着重要作用。在这项工作中,我们的目标是开发第一个简单、强大且高产的梭菌属衍生CFPS系统,使用工业相关的梭菌菌株作为我们的源生物,即产乙醇梭菌。基于为该生物建立厌氧发酵条件的广泛优化(Heijstra等,2017;Valgepea等,2017),我们选择修复微生物生长和收获条件。在这里,我们描述(1)建立有氧的、基于梭菌的无细胞系统,(2)确定有益的提取物加工步骤,以及(3)优化反应条件以实现基于梭菌的遗传部分和细胞代谢在无细胞环境中的原型设计。

1.使用产乙醇梭菌提取物优化CFPS中的Mg(Glu)2浓度

我们通过探索在有氧条件下制备时的CFPS能力并使用高产BL21大肠杆菌系统的提取物制备和CFPS条件,开始开发基于产乙醇梭菌的无细胞系统(Kwon和Jewett,2015)。简而言之,我们将产乙醇梭菌细胞重新悬浮在含有醋酸盐的缓冲液中,使用每毫升细胞悬浮液640J的总超声输入能量通过超声裂解它们,并以12,000xg离心它们以澄清裂解物(图2A,左图)。所得提取物用于在30℃下通过PANOx-SP能量再生系统驱动的CFPS(Jewett和Swartz,2004)并含有8mM Mg(Glu)2、33mM磷酸烯醇式丙酮酸(PEP)、2mM所有同源氨基酸、100mM还原烟酰胺腺嘌呤二核苷酸(NAD+)和50mM辅酶A(CoA)(图2A,中间)。我们选择萤火虫荧光素酶作为报告蛋白,因为它已在梭菌属中得到证明(Feustel等,2004)并且它的表达可以经由高度敏感的生物发光测定来检测,不仅证明提取物的蛋白质合成能力,而且还证明正确折叠的能力。为此,在T7启动子的控制下,我们将萤火虫荧光素酶基因的梭菌属密码子适应变体克隆到我们的CFPS表达载体pJL1中,将构建体加到CFPS反应中,并通过发光跟踪CFPS中荧光素酶的表达2.75小时。虽然表达少量荧光素酶,我们观察到在反应过程中发光增加和减少,表明提取物中存在一些蛋白质合成活性(图2A,右图)。

该结果促使我们对加到CFPS反应中的镁进行初步优化,因为它已被显示是CFPS产率的最关键因素之一(Des Soye等,2018;Hodgman和Jewett,2013;Jewett和Swartz,2004;Kwon和Jewett,2015;Li等,2017;Martin等,2017;Wang等,2018)。我们将表达荧光素酶的CFPS反应设置为2.75小时,将Mg(Glu)2浓度调整为8mM至36mM。≥20mM的Mg(Glu)2浓度显著增加荧光素酶表达超过五个数量级(图2B),最佳浓度为32mM Mg(Glu)2。这个结果令人惊讶,因为大肠杆菌提取物的最佳浓度往往在8mM至12mM Mg(Glu)2的范围内(Jewett和Swartz,2004;Kwon和Jewett,2015)。镁在无细胞反应中的一个主要作用是清除游离的无机磷酸盐(通过磷酸化能源积累),它可以抑制驱动蛋白质表达的代谢反应。不希望受理论束缚,我们推测梭菌属提取物可以比大肠杆菌提取物含有或产生更多的无机磷酸盐。与梭菌属提取物中存在的其他离子,尤其是铁(许多关键酶的辅助因子)的竞争、协同或抵消作用,可能是需要如此高浓度镁的另一个原因。这些结果证明有希望进一步开发基于有氧梭菌属提取物的CFPS系统。因此,我们寻求逐步调整提取物制备和CFPS条件以提高无细胞性能。

2.调整产乙醇梭菌的提取物制备和加工增加CFPS产量并将Mg(Glu)2最佳浓度转 向更多生理浓度

制备的粗细胞提取物的质量在很大程度上取决于细胞的裂解方式(在此过程中相关蛋白质可能会受到伤害)以及裂解物的处理方式(即径流反应、透析),这对CFPS具有显著影响(Carlson等,2012;Gregorio等,2019;Kwon和Jewett,2015)。在CFPS系统上工作,例如大肠杆菌(Kwon和Jewett,2015;Silverman等,2019)、酿酒酵母(Hodgman和Jewett,2013)和需钠弧菌(Des Soye等,2018)已经证明可以通过系统地优化每个提取物制备和加工步骤来提高提取物的稳定性和生产率。因此,我们探索两者的关键参数(图3A),从导致细胞壁破裂的裂解条件开始。使用超声作为我们的裂解方法,因为它简单、可重复且价格低廉(Kwon和Jewett,2015),我们在250J至910J的不同超声输入能量下以50%振幅裂解1mL重悬的产乙醇梭菌细胞,10秒开启和10秒关闭(图3B)。我们通过离心澄清裂解物并测试提取物对CFPS的能力。与最初使用的640J相比,较高的输入能量会降低CFPS的产量,而较低的能量是有益的。最佳值为350J,使荧光素酶表达增加约30%。我们的结果表明,当输入能量高于490J时,参与蛋白质合成的核糖体或其他脆弱的细胞组分会被破坏,从而损害提取物的CFPS活性。

两个常见的裂解后处理步骤、径流和透析,可以提高CFPS提取物的质量。径流包括在37℃下孵育提取物,这可以提高提取物的蛋白质合成生产率(Kwon和Jewett,2015)。在生理温度下的额外时间可能使核糖体“跑掉”天然mRNA,然后这些mRNA可能会被内源性RNase降解,同时释放出核糖体用于合成重组蛋白(Jermutus等,1998;Nirenberg和Matthaei,1961)。为了测试径流步骤的效果,我们在37℃超声处理后孵育澄清的裂解物短(45分钟)和长(80分钟)时间,通过离心再次澄清它们并比较它们的蛋白质合成活性。我们发现径流显著降低荧光素酶的表达(图3C)。45分钟的径流几乎使荧光素酶量减半,而较长的孵育时间(80分钟)将产量降低到三分之一。由于我们在离心后观察到相对较大的不溶性物质沉淀,我们怀疑CFPS的减少是由于不稳定和氧敏感性蛋白质的损失引起的,这些蛋白质对蛋白质合成直接或间接必不可少(例如酶和能量代谢中的辅因子,如铁氧还蛋白或对氧极度敏感的丙酮酸:铁氧还蛋白氧化还原酶(Meinecke等,1989)或关键的电子分叉酶(Mock等,2015)。

与径流相反,透析通过允许透析缓冲液和提取物之间的小分子交换来改变提取物的组成。如果此步骤从提取物中去除小的抑制性分子,例如无机磷酸盐,则此步骤可能有益并增加CFPS产量(Gregorio等,2019;Silverman等,2019)。为了测试透析的影响,我们在4℃的S30缓冲液中对超声处理后的澄清裂解物进行3次透析45分钟,并比较几种Mg(Glu)2浓度下的荧光素酶表达。我们发现透析并没有显著影响整体提取生产力,而是将Mg(Glu)2最佳浓度从32mM降低到生理浓度更高的24mM(图3D)。我们推测,在CFPS期间导致其产生的无机磷酸盐或分子离开提取物,从而减少所需的镁以抵消其抑制作用。基于这些结果,我们接下来着手使用现在包括透析的提取物制备和处理方案来优化CFPS反应条件。

3.调整CFPS反应条件进一步改善基于产乙醇梭菌提取物的CFPS

无细胞反应的物理化学环境对无细胞功能很重要。例如,当我们改变Mg(Glu)2浓度时,我们看到蛋白质合成生产率发生巨大变化。到目前为止,我们主要使用最适合BL21大肠杆菌的理化反应条件(Kwon和Jewett,2015)(图4A)。然而,产乙醇梭菌的蛋白质组和代谢与大肠杆菌的代谢显著不同(Kracke等,2016;Marcellin等,2016;Valgepea等,2018、2017),因此需要进行理化优化以改善基于产乙醇梭菌提取物的CFPS。因此,我们着手系统地调整反应温度、参与能量再生的关键CFPS组分、氨基酸和辅因子浓度、提取物浓度和氧气可用性以及DNA模板。

首先,我们研究CFPS反应温度。尽管大肠杆菌的最佳生长温度是37℃,但基于大肠杆菌的CFPS在30℃下效果最佳。虽然在较低温度下整体活性可能会变慢,但RNase和蛋白酶活性也会降低,从而增加重组mRNA转录物和合成蛋白质的半衰期,从而增强无细胞系统中的整体蛋白质合成能力。为了在产乙醇梭菌提取物中测试这种效果,我们将CFPS的温度设置为16℃、23℃、30℃和37℃(图7)。我们发现16℃和23℃使荧光素酶表达分别降低至48±2%和71±4%。有趣的是,虽然在30℃和37℃下荧光素酶的CFPS在前30分钟内类似地增加,但荧光素酶发光在37℃下在5.75小时后逐渐降低至9±1%。该结果表明,在37℃下,提取物中的蛋白酶活性非常高,导致荧光素酶降解,其产生无法弥补。因此,30℃是基于产乙醇梭菌的CFPS的最佳温度。

接下来,我们探索了产乙醇梭菌提取物中CFPS的能量再生。蛋白质合成是一个非常耗能的过程,需要在转录和翻译过程中再生ATP。现有技术的基于大肠杆菌的PANOx-SP能量再生系统中ATP的主要来源(Jewett和Swartz,2004)是磷酸烯醇式丙酮酸(PEP)通过丙酮酸激酶(PyK)转化为丙酮酸。虽然该反应发生在产乙醇梭菌中,但Wood-Ljungdahl途径和乙酰磷酸激酶(AcK)反应在生成用于蛋白质合成的ATP方面更为活跃(Brown等,2014;Kracke等,2016;Liew等,2017)。由于大肠杆菌和产乙醇梭菌代谢的差异,我们假设PEP可能不是最理想的能源。为了确定在有氧条件下产乙醇梭菌提取物的最佳能量再生系统,我们测试不同浓度的PEP、乙酰磷酸(AcP)和甲酸盐,这是一种关键的Wood-Ljungdahl途径代谢物。为了减轻由于需氧提取物制备而导致提取物中底物代谢酶的潜在下调或氧化损伤,我们还测试用PEP和AcK补充0.67mg/mL纯化重组PyK和AcP和甲酸盐。我们发现在存在除PEP外的其他底物时几乎没有荧光素酶表达(图4B)。我们进一步研究“PEP+PyK”能量再生系统中不同的PEP浓度(图8A)。有趣的是,与单独的PEP相比,PEP加丙酮酸激酶(PyK)将CFPS产率降低约20%。这种抑制作用可能是由含有甘油的PyK储存缓冲液引起的,也可能是由PEP加速转化为丙酮酸引起的副反应和/或副产物引起的。此外,我们看到45mM PEP在添加和不添加PyK的情况下都是最佳的,在两种条件下产生类似的荧光素酶表达(图8A;图4C)。因此,我们保持不具有PyK的PEP作为能量再生系统,并选择45mM作为我们前进的新浓度。

在优化提取能源后,我们评估氨基酸(AA)和辅因子浓度,因为它们是优化基于大肠杆菌提取物的CFPS的重要组成部分。在大肠杆菌提取物中,补充2mM AA可确保蛋白质合成和背景代谢有足够的可用性(Martin等,2018)。为了优化基于产乙醇梭菌的CFPS的AA浓度,我们将AA浓度改变为0-5mM(图4D)。高于2mM的浓度会逐渐降低CFPS的产量,而将AA减少到1mM会略微增加荧光素酶的表达。此外,我们发现在CFPS一小时后第二次补充AA对CFPS产量没有显著影响(图9)。此外,NAD+和CoA在氧化还原平衡和代谢方面都具有重要作用,并且被加到CFPS反应中以确保提取物的代谢活性驱动蛋白质合成的ATP生产。与大肠杆菌相反,产乙醇梭菌使用NADP(H)进行许多分解代谢反应,且丙酮酸氧化为乙酰辅酶A不依赖于NAD(H),但依赖于氧不稳定的铁氧还蛋白(Meinecke等,1989;Mock等,2015)。除这些差异外,需氧产乙醇梭菌基于CFPS可能会影响氧化还原状态,并且辅助因子的比例可能会发生变化。因此,我们试图检查辅因子组成对基于产乙醇梭菌提取物的CFPS的影响。我们在有或没有NADP(H)或NAD(H)以及有或没有CoA的情况下确定CFPS中的荧光素酶表达(图4E)。有趣的是,我们发现从试剂混合物中排除CoA和NAD(P)(H)可将荧光素酶表达提高三分之一。这些结果共同为我们选择1mM AA以及我们今后放弃补充辅助因子的决定提供信息。

在确定CFPS反应缓冲液的浓度后,我们接下来测试CFPS的其他两种组分:提取物和DNA模板。在其他基于提取物的CFPS系统中,增加提取物量被认为是有益的(李等,2018),因此我们在CFPS上测试不同体积的产乙醇梭菌提取物。然而,我们没有观察到蛋白质合成有任何改善(图10A)。梭菌属以其高核酸外切酶活性而闻名(Nakotte等,1998)。DNA模板可以以质粒或线性DNA形式加入,并对CFPS具有浓度依赖性影响(Nakotte等,1998)。我们首先测试从我们最初的6nM质粒DNA增加质粒DNA浓度是否会改善产乙醇梭菌提取物中的CFPS,因为这对其他CFPS系统有帮助(李等,2017)。我们测试0-30nM的质粒DNA,发现浓度≥15nM可使荧光素酶表达增加约10-15%(图11A)。然后我们测试线性DNA模板是否可以用于基于产乙醇梭菌提取物的CFPS。使用通过PCR制备的线性模板可以加快制备时间,但可能对细胞提取物中的核酸外切酶敏感。为了测试它们在基于产乙醇梭菌提取物的CFPS中的适用性,我们使用标准寡核苷酸引物和含有硫代磷酸酯(PS)键(图6A中的表)以增加线性模板稳定性。比较来自含有等摩尔DNA模板的反应的CFPS,我们发现线性PCR产物确实是基于产乙醇梭菌提取物的CFPS中的合适模板(图11A)。使用由标准引物制备的PCR产物仅将CFPS产量降低约10%。然而,令人惊讶的是,在5'和3'末端包含PS键的线性模板将CFPS产率降低到50%。我们还确定由标准引物制成的PCR产物的最佳浓度,发现它是33.3nM,产生的荧光素酶表达与使用质粒模板获得的荧光素酶表达相当(图11C)。

在优化CFPS反应的组成部分后,我们最后评估反应器的操作条件,特别是氧气可用性反应模式(即间歇与半连续)。我们通过改变反应体积但保持反应管几何形状恒定以有效改变反应的表面积与体积比来研究氧气可用性对基于产乙醇梭菌的CFPS反应的影响。降低该比率会降低氧气的可用性并降低反应中的有效氧气浓度,从而降低其代谢可用性,这对基于大肠杆菌提取物的CFPS有害(Voloshin和Swartz,2005)。我们通过在1.5mL反应管中进行15-90μL反应来测试这种对基于产乙醇梭菌的CFPS的影响,并将它们的荧光素酶表达与之前使用的40μL反应进行比较。

通过运行15μL反应增加氧气可用性导致荧光素酶表达减少约20%。然而,降低氧气可用性并没有显示出显著差异(图10B)。我们还测试以半连续方式运行反应,提供底物补充和副产物(例如,无机磷酸盐)去除是否可以进一步提高基于产乙醇梭菌的CFPS的表达产率。为了测试这个问题,我们在由半透膜(3.5kDa截断值)分隔的两个隔室中进行CFPS反应(一个是完全反应;另一个是没有提取物的反应缓冲液)。小分子可以在两个隔室之间自由扩散,而代谢酶和翻译机制保留在反应隔室中。我们观察到半连续反应中的活性荧光素酶比分批反应高37±14%(图4F)。使用所有优化条件(CFPS试剂浓度、提取体积、DNA模板浓度)(图6B中的表),我们以分批模式制备235.95±24.11μg/ml的荧光素酶,在半连续反应模式下制备322.71±63.99μg/ml(图12)。

4.基于产乙醇梭菌提取物的CFPS促进代谢工程努力的遗传部分和代谢的原型设

简单、强大和高效的基于梭菌属的无细胞平台的两个最吸引人的应用是基因表达测试和代谢途径原型设计,因为它们可以加速费力的产乙醇梭菌工程工作(图5A)。事实上,梭菌属中的代谢工程工作将受益于“工具箱”,其中包括启动子、核糖体结合位点和可以与单个或分组基因组合组装的终止子。(Joseph等,2018)。因此,我们通过研究(1)密码子适应效应、(2)内源性RNA聚合酶的使用和(3)生物合成酶的表达来评估在无细胞环境中测试基因表达的能力。首先,我们使用针对两种不同梭菌属,即丙酮丁醇梭菌(Cac)、产乙醇梭菌(Cae)和一种需氧菌大肠杆菌(Eco)进行密码子适应的荧光素酶基因序列比较荧光素酶表达含量(产乙醇梭菌的GC含量为31.1%)(Brown等,2014)。我们发现,与来自产乙醇梭菌适应序列的荧光素酶表达相比,丙酮丁醇梭菌适应的荧光素酶表达减少20%,而适用于大肠杆菌的序列表达的荧光素酶减少约75%(图5B,右图)。这些结果与由Salis RBS计算器确定的预测翻译率(Salis等,2009)以及基因序列的GC含量(图13)相关。这提供基于产乙醇梭菌的CFPS系统可用于遗传部分原型设计的原理证明。其次,我们通过将T7启动子和我们表达载体的5'UTR与三个不同的梭菌属天然启动子区域(pPta-Ack、pPFOR和pWL)交换来研究内源性RNA聚合酶的活性,这些区域已用于在过去的基因表达(刘等,2016),并比较它们的CFPS产量。我们检测到来自内源性启动子的荧光素酶表达范围为2-7.5μg/mL(图5B,左图)。正如预期的那样,在产乙醇梭菌提取物中,基于天然启动子的表达是基于T7启动子的表达的~5%。第三,我们想测试除荧光素酶外的重组蛋白的全长合成。因此,我们在基于产乙醇梭菌的CFPS中表达了三种不同蛋白质长度的重组酶。所有三种酶都以全长和可比量表达(图5C)。通过一些优化,天然启动子可用于构建基于梭菌属的遗传回路和生物传感器,并且全长重组蛋白的表达将有助于在无细胞环境中构建代谢途径,为梭菌的代谢工程提供信息。

无细胞环境中的代谢途径原型使我们能够在操纵细胞代谢之前探测内源性代谢和生物合成途径。我们试图使用基于产乙醇梭菌的提取物来鉴定体外活性代谢途径。虽然我们完全期望本文介绍的有氧无细胞系统与源厌氧生物明显不同,但我们预计无细胞系统可用于鉴定关键代谢物,从中可以开发和测试新的生物合成路线。为了检测产乙醇梭菌提取物中的活性代谢途径,我们通过GC-MS在有和没有PEP以及有和没有用于蛋白质合成的DNA模板的情况下确定3小时CFPS反应过程中的代谢组。我们鉴定44种代谢物:4-羟基丁酸;磷酸(烯醇)丙酮酸;3-磷酸甘油酸;2-磷酸甘油酸;α-酮戊二酸;6-磷酸葡萄糖;草苹果酸;(S)-(-)-2-羟基异己酸;23-二羟基异戊酸;丙氨酸;羟基丙酮酸;吲哚-3-乳酸;琥珀酸;丝氨酸;丙二酸;乙酰乙酸盐;乳酸;4-二羟基丁酸;1/3-磷酸甘油;胸腺嘧啶;天冬氨酸;赖氨酸;2-磷酸甘油;甘油;缬氨酸;5-氧代脯氨酸;草酸;谷氨酸;苯丙氨酸;甘氨酸;二硫苏糖醇(ox);乙醇酸;色氨酸;3-羟基丙酸;腐胺;蛋氨酸;脯氨酸;尿嘧啶;亮氨酸;单硬脂酸;异亮氨酸;苏氨酸;黄嘌呤;和肌苷。

加入CFPS的DNA模板对代谢物谱仅产生很小的影响,这在以前在大肠杆菌无细胞系统中已经观察到(Karim等,2018),导致我们将PEP处理和CFPS反应时间相同的样品集集中在一起。我们根据CFPS期间产乙醇梭菌提取物中的广义碳通量将检测到的代谢物分为特定的合成代谢和分解代谢反应(图5D)。令人兴奋的是,对于大多数已识别的代谢物,我们在CFPS期间检测到浓度变化,强烈表明其相应生物合成和降解途径的代谢活动(图5E-H)。在比较PEP条件时,我们观察到大规模效应。例如,加入PEP会立即增加糖酵解/糖异生中间体3-磷酸甘油酸、2-磷酸甘油酸和葡萄糖6-磷酸的浓度(图5E)。此外,几种有机酸被上调,包括参与TCA循环和碳固定到生物质中的代谢物,如α-酮戊二酸、琥珀酸、乙醇酸和丙二酸(图5F)。在含有PEP的CFPS反应中消耗的代谢物包括嘌呤和嘧啶途径中间体肌苷、黄嘌呤和尿嘧啶(图5G)以及氨基酸蛋氨酸(图5H)。总之,我们观察糖酵解/糖异生的代谢物和相关途径,包括核苷酸合成、不完整的TCA循环、碳固定、氨基酸和甘油脂途径。我们没有观察到朝向乙酰辅酶A和相关途径的碳通量。该观察结果表明,将丙酮酸转化为乙酰辅酶A的酶、丙酮酸:铁氧还蛋白氧化还原酶(PFOR)在需氧产乙醇梭菌提取物中是无活性的,如对其他梭菌属所述(Meinecke等,1989)。这些结果共同表明,开发的产乙醇梭菌无细胞系统确实可以用于测试不依赖氧气的遗传部分和途径的文库。

接下来,我们研究系统对代谢途径进行原型设计的能力。为了对此进行测试,我们选择将丙酮酸转化为2,3-丁二醇(2,3-BDO)作为示例途径。使用优化的产乙醇梭菌CFPS反应条件,我们单独或组合表达乙酰乳酸合成酶(AcLacS)、乙酰乳酸脱羧酶(ACLacDC)、仲醇脱氢酶(SecAlcDH)和2,3-丁二醇脱氢酶(BDODH)并确定2,3-BDO、乙醇、乙酸盐和乳酸盐在3h CFPS前和后使用HPLC的生产。我们发现,与没有或单独表达酶的反应相比,所有酶的联合表达确实增加2,3-BDO的生产。

D.讨论

在这项工作中,我们提出一种新颖、强大、高产的CFPS系统,该系统源自非模型厌氧细菌产乙醇梭菌,可以扩展梭菌属代谢工程的“工具箱”并帮助加速菌株工程工作。我们确定该生物的最佳提取物制备条件,证明产乙醇梭菌提取物对高于490J的裂解能量敏感,但在较低能量下相对一致。与基于大肠杆菌的系统相比,这种较低的输入能量方便地将提取物制备时间减半。

令人惊讶的是,产乙醇梭菌CFPS需要异常高的镁浓度。虽然,在提取物处理方案中包括透析步骤降低32mM的初始最佳值,但24mM仍然是一个很高的需求。通过专门针对产乙醇梭菌优化其他CFPS组分,我们能够在分批反应模式下在3小时内产生超过230μg/mL的荧光素酶。该产率高于源自其他模型和非模型生物,如兔网织红细胞(Anastasina等,2014)、古生菌(Endoh等,2008、2007、2006)、酵母(Gan和Jewett,2014;Hodgman和Jewett,2013)、昆虫(Ezure等,2010)的大多数其他CFPS系统,据,并且显著高于源自发明人所知的革兰氏(+)细菌的其他CFPS系统,例如参见枯草芽孢杆菌(Kelwick等,2016)、巨大芽孢杆菌(Moore,Simon J.;MacDonald,James T.;Wienecke,Sarah;Ishwarbhai,Alka;Tsipa,Argyro;Aw,Rochelle;Kylilis,Nicolas;Bell,David J.,McClymont,David W.;Jensen,Kirsten;Polizzi,Karen M.;Biedendieck,Rebekka;Freemont,2018)和链霉菌(Li等,2018,2017)。通过进行半连续反应,我们在4小时内将产率提高到高于320μg/mL。仅源自CHO细胞(Martin等,2017)、需钠弧菌(Des Soye等,2018)、小麦胚芽(Harbers,2014)和大肠杆菌(Caschera和Noireaux,2014)的CFPS系统已被证明具有更高的生产力。

我们预计我们的优化工作流程可以为梭菌属物种的CFPS系统开发铺平道路,包括产溶剂或纤维素分解梭菌以及医学相关梭菌属。进一步优化CFPS反应条件有助于延长CFPS反应持续时间,从而进一步提高蛋白质产量,厌氧系统的发展可以更好地模拟梭菌的细胞环境。因为我们的系统将提取物暴露在氧气中,我们假设氧敏感蛋白质,包括代谢酶,受到损坏,无法被内源性梭菌抗氧化机制拯救。或者,用抗氧化系统补充有氧系统可以挽救可逆的氧化蛋白质损伤。

我们证明我们的系统适用于遗传部分原型设计。虽然我们只测试几个启动子和基因编码序列,但获得的数据表明,我们基于产乙醇梭菌的CFPS系统与荧光素酶报告基因检测相结合,具有足够的灵敏度和动态性,可以检测转录和翻译相关的表达差异。重要的是,我们的系统允许对需要被内源性转录机制识别的天然启动子进行原型设计。这是我们系统的一个特别强大的功能。梭菌属代谢工程最常用的启动子来自少数菌株,通常不能转移到非本地宿主。能够表征启动子部分并快速和高通量地测试调整可以对梭菌属代谢工程产生巨大影响。展望未来,我们希望我们的系统与液体处理器相结合,可以快速构建数百个遗传部分的原型。

我们开发的系统显示天然途径的代谢活动。尽管提取物的氧气暴露可能会使PFOR等氧敏感酶失活,但我们在与糖酵解相关的几个途径中检测到代谢活动。通过比较有和没有能量底物PEP的CFPS期间代谢物浓度的变化,我们扣除提取物中的一般碳通量。展望未来,我们预计确定的活性途径和全长重组酶表达能力可用于无细胞代谢工程。总之,这里开发的基于产乙醇梭菌的CFPS系统为原型设计不依赖于氧的梭菌属代谢工程工作,例如转录和翻译以及具有抗氧酶的代谢途径提供一个极好的平台。

我们还展示所开发系统对通路原型设计的适用性。当在一锅CFPS反应中表达所有酶时,参与丙酮酸转化为2,3-BDO的天然代谢酶的表达增加2,3-BDO的生产。单独或组合的酶表达也影响EtOH的产生,而乳酸和乙酸盐的产生没有观察到差异。未来的努力通过在梭菌属提取物中使用无细胞代谢工程来测试不同酶同系物的不同组合和优化通路性能,可能会进一步改善滴度和通路性能,为体内代谢工程工作提供信息。

E.材料和方法

菌株和质粒构建体本研究中使用产乙醇梭菌DSM 23693。DSM 23693是DSM10061型菌株的衍生物(Heijstra等,2016)。本研究中使用的基因序列和寡核苷酸在图6和14以及SEQ ID列表中提供。

CFPS的密码子适应荧光素酶基因通过IDT合成,使用Gibson组装克隆到pJL1质粒中,并通过ACGT,Inc.的Sanger测序确认。卡那霉素(50μg/mL)用于维持基于pJL1的质粒。磷酸转乙酰酶-乙酸激酶操纵子(pPta-Ack;CAETHG_RS16490)、丙酮酸:甲酸氧化还原酶(pPFOR;CAETHG_RS14890)和Wood-Ljungdahl簇(pWL;CAETHG_RS07860)的产乙醇梭菌内源性启动子从质粒中扩增,其中相应的序列已从基因组中扩增并克隆到pMTL82250载体报告质粒中(Nagaraju等,2016)并使用Gibson组装克隆以代替pJL1-LucCae构建体中的T7启动子区域,并通过ACGT,Inc.的Sanger测序确认。

细胞培养和收获产乙醇梭菌发酵在工作体积为6L的10-L生物反应器中在37℃和含CO的气体(50%CO、10%H2、20%CO2、20%N2)作为唯一的能源和碳源下在如前所述细菌生长速率接近1天-1下进行(王等,2013)。在收获细胞前,用K2CO3将培养物的pH值调节至pH 6。在冰上收集五升培养物。将培养物在1L离心瓶之间分配,细胞以5000xg沉淀10分钟。倒出上清液,除去残留液体。将沉淀物重新悬浮在~300mL的50mM K2PO4(pH 7.5)中。将重悬液转移到50-mL-Falcon管中,并且细胞在5000xg下沉淀15分钟。弃去上清液,将沉淀立即冷冻在液体N2上并储存在-80℃下。

提取物制备将细胞沉淀解冻并悬浮在每克湿细胞质量0.33mL S30缓冲液(10mMTris(CH3COO)(pH8.2)、14mM Mg(CH3COO)2、10mM K(CH3COO)、4mM DTT)中。将细胞悬液以1mL等分试样转移到1.5mL微管中。在20kHz频率和50%振幅下使用具有3.175mm探头直径的Q125超声仪(Qsonica,Newtown,CT,USA),将细胞裂解数个10秒开启/10秒关闭循环,直到达到最终输入能量。超声处理期间将样品保存在冰水浴中,以最大限度地减少超声处理引起的潜在热变性。对于每1mL细胞悬液等分试样,输入能量为~70焦耳/超声处理周期。随后,裂解物在4℃下以12,000×g离心10分钟,收集上清液,在液氮中快速冷冻,并在-80℃下储存直至使用。对于流出反应,将第一次澄清离心的上清液转移到新管中,在37℃下孵育45分钟或80分钟,在4℃下以12,000x g离心10分钟清除,收集上清液,在液氮中闪蒸冷冻,并在-80℃下储存直至使用。使用具有3.5kDa截止值的Slide-A-LyzerTM透析盒(ThermoScientific,Rockford,IL,USA)进行透析。提取物用150mL S30缓冲液/mL提取物在4℃下透析3次45分钟,然后在4℃下以12,000×g离心10分钟清除。收集上清液,在液氮中快速冷冻,并在-80℃下储存直至使用。

CFPS反应改善的PANOx-SP系统用于CFPS反应。简而言之,如果没有另外说明,在1.5mL微管中通过混合以下组分制备40-60μL CFPS反应:1.2mM ATP;GTP、UTP和CTP各0.85mM;34μg/mL亚叶酸;170μg/mL大肠杆菌tRNA混合物;16μg/mL T7 RNA聚合酶;20种标准氨基酸中的每一种2mM;0.33mM烟酰胺腺嘌呤二核苷酸(NAD);0.27mM辅酶A(CoA);1.5mM亚精胺;1mM腐胺;4mM草酸钠;8mM谷氨酸镁;10mM谷氨酸铵;130mM谷氨酸钾;57mM HEPES(pH7.2);33mM磷酸烯醇式丙酮酸(PEP)和33%(v/v)的细胞提取物。除非另有说明,特定产物的合成是通过向每个反应加入6nM编码感兴趣基因的pJL1模板质粒开始的,并且每个CFPS反应在30℃下孵育。由于在整个研究过程中优化各个试剂浓度,因此从那时起,它们确定的最佳值用于所有反应。大肠杆菌总tRNA混合物(来自MRE600菌株)和PEP购自Roche AppliedScience(Indianapolis,IN,USA);ATP、GTP、CTP、UTP、20种氨基酸和其他材料购自Sigma(St.Louis,MO,USA),未经进一步纯化。如前所述在内部纯化T7RNAP(Martin等,2018)。

活性荧光素酶的定量使用ONE-Glo荧光素酶检测系统(Promega,Madison,WI,USA)、Synergy 2读板器(BioTek,Winooski,VT,USA)和96孔半区白板((Costar 3694;Corning,Corning,NY))测定CFPS中的荧光素酶表达。使用4μl CFPS反应液与30μl荧光素酶测定缓冲液混合进行测定。使用BioTek Synergy 2读板器(Winooski,VT,USA)在30分钟内每3分钟检测一次发光。记录每个反应的最大相对光单位(RLU)量。然后使用使用放射性标记的荧光素酶确定的线性标准曲线将RLU转化为μg/mL的量。为此,除了所有20种标准氨基酸外,还使用放射性14C-亮氨酸(10μM)进行CFPS反应。然后使用三氯乙酸(TCA)沉淀放射性标记的蛋白质样品,并使用MicroBeta2(PerkinElmer,Waltham,MA)通过液体闪烁测量其放射性计数,以量化如前报告的可溶性和总荧光素酶产率(Jewett等,2008;Jewett和Swartz,2004)。

半连续CFPS反应90μL CFPS半连续反应使用3.5kDa MWCO 96孔板透析盒(ThermoScientific,Rockford,IL,USA)在装有1.4mL透析缓冲液的2mL微量离心管中进行。反应在Eppendorf Thermomixer C中在30℃和600rpm下孵育,并与在相同条件下进行的60μL分批反应进行比较。

气相色谱-质谱法(GC-MS)。通过GC-MS分析梭菌CFPS反应样品。简而言之,将在分析前储存在-80℃的样品解冻并在4℃下以12,000rpm的速度离心15分钟。将5μl的等分试样转移到含有10μl山梨糖醇(1mg/ml水溶液)用作内标的小瓶中,然后在N2气流下干燥。将干燥的样品溶解在250μl甲硅烷基化级乙腈中,然后加入250μl N-甲基-N-(三甲基甲硅烷基)三氟乙酰胺(MSTFA)和1%三甲基氯硅烷(TMCS)(Thermo Scientific,Bellefonte,PA)并在70℃下加热1小时以生成三甲基甲硅烷基衍生物。在2天后,将1μl等分试样注射到与配备RTX-5MS(5%二苯基/95%二甲基聚硅氧烷)30m×250μm×0.25μm膜厚毛细管柱的5975C惰性XL MS偶联的Agilent Technologies 7890A GC 5m Integra-Guard色谱柱。气流为每分钟1.0ml,并且注射口配置为不分流注射。初始烘箱温度为50℃,并保持2分钟,然后以每分钟20℃的速度升温至325℃,并再保持11.5分钟。MS在标准电子碰撞(70eV)电离模式下运行。注射口、MS传输线、MS源和MS四极杆温度分别为250℃、300℃、230℃和150℃。用户形成的大型数据库和商用Wiley Registry第10版与NIST 14质谱数据库相结合,用于鉴定感兴趣的代谢物。通过使用提取离子色谱图(EIC)而不是总离子流色谱图对峰进行量化,利用关键的选定离子特征m/z碎片,以最大限度地减少共流出的代谢物。使用预先确定的比例因子将EIC缩放回TIC,量化基于面积积分,并归一化为回收的内标量、处理的样品体积、衍生体积和注射体积。

放射自显影放射自显影用于确定在产乙醇梭菌CFPS中合成的合成代谢酶的质量。除了所有20种标准氨基酸外,还使用放射性14C-亮氨酸(10μM)进行CFPS反应。在孵育3.5小时后,按照制造商的说明将4μl CFPS反应液加载到NuPAGE 4-12%Bis-Tris Gel(LifeTechnologies,Carlsbad,CA,USA)上。NuPAGE凝胶用InstantBlue(Expedeon,Cambridgeshire,UK)染色。将凝胶干燥并在Storage Phosphor Screen(GE HealthcareBiosciences,Chicago,IL,USA)上暴露14天,并用Typhoon FLA 7000(GE HealthcareBiosciences)成像。该图像与包含蛋白质标准梯的染色图像进行数字比较以确定合成蛋白质的长度。

参考文献

Anastasina,M.,Terenin,I.,Butcher,S.J.,Kainov,D.E.,2014.A technique toincrease protein yield in a rabbit reticulocyte lysate translationsystem.Biotechniques 56.https://doi.org/10.2144/000114125

A.K.,Sonnabend,A.,Kubick,S.,2014.Cell-free protein expressionbased on extracts from CHO cells.Biotechnol.Bioeng.111,25–36.https://doi.org/10.1002/bit.25013

Brown,S.D.,Nagaraju,S.,Utturkar,S.,De Tissera,S.,Segovia,S.,Mitchell,W.,Land,M.L.,Dassanayake,A.,M.,2014.Comparison of single-moleculesequencing and hybrid approaches for finishing the genome of Clostridiumautoethanogenum and analysis of CRISPR systems in industrial relevantClostridia.Biotechnol.Biofuels 7,40.https://doi.org/10.1186/1754-6834-7-40

Bujara,M.,Schümperli,M.,Pellaux,R.,Heinemann,M.,Panke,S.,2011.Optimization of a blueprint for in vitro glycolysis by metabolic real-time analysis.Nat.Chem.Biol.7,271–277.https://doi.org/10.1038/nchembio.541

Carlson,E.D.,Gan,R.,Hodgman,C.E.,Jewett,M.C.,2012.Cell-free proteinsynthesis:Applications come of age.Biotechnol.Adv.30,1185–1194.https://doi.org/10.1016/J.BIOTECHADV.2011.09.016

Caschera,F.,Noireaux,V.,2014.Synthesis of 2.3mg/ml of protein with anall Escherichia coli cell-free transcription–translation system.Biochimie 99,162–168.https://doi.org/10.1016/J.BIOCHI.2013.11.025

Chappell,J.,Jensen,K.,Freemont,P.S.,2013.Validation of an entirely invitro approach for rapid prototyping of DNA regulatory elements for syntheticbiology.Nucleic Acids Res.41,3471–3481.https://doi.org/10.1093/nar/gkt052

Daniell,J.,Nagaraju,S.,Burton,F.,M.,Simpson,S.D.,2015.Low-CarbonFuel and Chemical Production by Anaerobic Gas Fermentation.Springer,Cham,第293–321页.https://doi.org/10.1007/10_2015_5005

Des Soye,B.J.,Davidson,S.R.,Weinstock,M.T.,Gibson,D.G.,Jewett,M.C.,2018.Establishing a High-Yielding Cell-Free Protein Synthesis PlatformDerived from Vibrio natriegens.ACS Synth.Biol.7,2245–2255.https://doi.org/10.1021/acssynbio.8b00252

Dudley,Q.M.,Nash,C.J.,Jewett,M.C.,2019.Cell-free biosynthesis oflimonene using enzyme-enriched Escherichia coli lysates.Synth.Biol.(Oxford,England)4.https://doi.org/10.1093/SYNBIO/YSZ003

Endoh,T.,Kanai,T.,Imanaka,T.,2008.Effective approaches for theproduction of heterologous proteins using the Thermococcus kodakaraensis-based translation system.J.Biotechnol.133,177–182.https://doi.org/10.1016/J.JBIOTEC.2007.08.036

Endoh,T.,Kanai,T.,Imanaka,T.,2007.A highly productive system forcell-free protein synthesis using a lysate of the hyperthermophilic archaeon,Thermococcus kodakaraensis.Appl.Microbiol.Biotechnol.74,1153–1161.https://doi.org/10.1007/s00253-006-0753-3

Endoh,T.,Kanai,T.,Sato,Y.T.,Liu,D.V.,Yoshikawa,K.,Atomi,H.,Imanaka,T.,2006.Cell-free protein synthesis at high temperatures using the lysate ofa hyperthermophile.J.Biotechnol.126,186–195.https://doi.org/10.1016/J.JBIOTEC.2006.04.010

Ezure,T.,Suzuki,T.,Shikata,M.,Ito,M.,Ando,E.,2010.A Cell-Free ProteinSynthesis System from Insect Cells,in:Methods in Molecular Biology.HumanaPress,pp.31–42.https://doi.org/10.1007/978-1-60327-331-2_4

Failmezger,J.,Scholz,S.,Blombach,B.,Siemann-Herzberg,M.,2018.Cell-Free Protein Synthesis From Fast-Growing Vibrio natriegens.Front.Microbiol.9,1146.https://doi.org/10.3389/fmicb.2018.01146

Ferrer-Miralles,N.,Domingo-Espín,J.,Corchero,J.,Vázquez,E.,Villaverde,A.,2009.Microbial factories for recombinantpharmaceuticals.Microb.Cell Fact.8,17.https://doi.org/10.1186/1475-2859-8-17

Feustel,L.,Nakotte,S.,Dürre,P.,2004.Characterization and Developmentof Two Reporter Gene Systems for Clostridium acetobutylicum.Appl.Environ.Microbiol.70,798–803.https://doi.org/10.1128/AEM.70.2.798-803.2004

Gan,R.,Jewett,M.C.,2014.A combined cell-free transcription-translation system from Saccharomyces cerevisiae for rapid and robust proteinsynthe.Biotechnol.J.9,641–651.https://doi.org/10.1002/biot.201300545

Garamella,J.,Marshall,R.,Rustad,M.,Noireaux,V.,2016.The All E.coliTX-TL Toolbox 2.0:A Platform for Cell-Free Synthetic Biology.ACS Synth.Biol5,355.https://doi.org/10.1021/acssynbio.5b00296

Ghaffar,T.,Irshad,M.,Anwar,Z.,Aqil,T.,Zulifqar,Z.,Tariq,A.,Kamran,M.,Ehsan,N.,Mehmood,S.,2014.Recent trends in lactic acid biotechnology:A briefreview on production to purification.J.Radiat.Res.Appl.Sci.7,222–229.https://doi.org/10.1016/J.JRRAS.2014.03.002

Gootenberg,J.S.,Abudayyeh,O.O.,Lee,J.W.,Essletzbichler,P.,Dy,A.J.,Joung,J.,Verdine,V.,Donghia,N.,Daringer,N.M.,Freije,C.A.,Myhrvold,C.,Bhattacharyya,R.P.,Livny,J.,Regev,A.,Koonin,E.V,Hung,D.T.,Sabeti,P.C.,Collins,J.J.,Zhang,F.,2017.Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438–442.https://doi.org/10.1126/science.aam9321

Gregorio,N.E.,Levine,M.Z.,Oza,J.P.,2019.A User’s Guide to Cell-FreeProtein Synthesis.Methods Protoc.2.https://doi.org/10.3390/mps2010024

Harbers,M.,2014.Wheat germ systems for cell-free proteinexpression.FEBS Lett.588,2762–2773.https://doi.org/10.1016/j.febslet.2014.05.061

Heijstra,B.D.,Kern,E.,Koepke,M.,Segovia,S.,Liew,F.,2016.NOVELBACTERIA AND METHODS OF USE THEREOF.

Heijstra,B.D.,Leang,C.,Juminaga,A.,2017.Gas fermentation:cellularengineering possibilities and scale up.Microb.Cell Fact.16,60.https://doi.org/10.1186/s12934-017-0676-y

Hodgman,C.E.,Jewett,M.C.,2013.Optimized extract preparation methodsand reaction conditions for improved yeast cell-free proteinsynthesis.Biotechnol.Bioeng.110,2643–2654.https://doi.org/10.1002/bit.24942

Hodgman,C.E.,Jewett,M.C.,2012.Cell-free synthetic biology:Thinkingoutside the cell.Metab.Eng.14,261–269.https://doi.org/10.1016/J.YMBEN.2011.09.002

Jaroentomeechai,T.,Stark,J.C.,Natarajan,A.,Glasscock,C.J.,Yates,L.E.,Hsu,K.J.,Mrksich,M.,Jewett,M.C.,DeLisa,M.P.,2018.Single-pot glycoproteinbiosynthesis using a cell-free transcription-translation system enriched withglycosylation machinery.Nat.Commun.9,2686.https://doi.org/10.1038/s41467-018-05110-x

Jermutus,L.,Ryabova,L.A.,Plückthun,A.,1998.Recent advances inproducing and selecting functional proteins by using cell-free translation.Curr.Opin.Biotechnol.9,534–548.https://doi.org/10.1016/S0958-1669(98)80042-6

Jewett,M.C.,Calhoun,K.A.,Voloshin,A.,Wuu,J.J.,Swartz,J.R.,2008.Anintegrated cell-free metabolicplatform for protein production and syntheticbiology.Mol.Syst.Biol.https://doi.org/10.1038/msb.2008.57

Jewett,M.C.,Swartz,J.R.,2004.Mimicking theEscherichia colicytoplasmic environment activates long-lived and efficient cell-free proteinsynthesis.Biotechnol.Bioeng.86,19–26.https://doi.org/10.1002/bit.20026

Jiang,Y.,Liu,J.,Jiang,W.,Yang,Y.,Yang,S.,2015.Current status andprospects of industrial bio-production of n-butanol inChina.Biotechnol.Adv.33,1493–1501.https://doi.org/10.1016/J.BIOTECHADV.2014.10.007

Jones,D.T.,2005.Applied Acetone-Butanol Fermentation,in:Clostridia.Wiley-VCH Verlag GmbH,Weinheim,FRG,pp.125–168.https://doi.org/10.1002/3527600108.ch5

Joseph,R.C.,Kim,N.M.,Sandoval,N.R.,2018.Recent Developments of theSynthetic Biology Toolkit for Clostridium.Front.Microbiol.9,154.https://doi.org/10.3389/fmicb.2018.00154

Karig,D.K.,Bessling,S.,Thielen,P.,Zhang,S.,Wolfe,J.,2017.Preservationof protein expression systems at elevated temperatures for portabletherapeutic production.J.R.Soc.Interface 14,20161039.https://doi.org/10.1098/rsif.2016.1039

Karim,A.S.,Dudley,Q.M.,Juminaga,A.,Yuan,Y.,Crowe,S.A.,Heggestad,J.T.,Abdalla,T.,Grubbe,W.,Rasor,B.,Coar,D.,Torculas,M.,Krein,M.,Liew,F.,Quattlebaum,A.,Jensen,R.O.,Stuart,J.,Simpson,S.D.,M.,Jewett,M.C.,2019.Invitro prototyping and rapid optimization of biosynthetic enzymes for cellulardesign.bioRxiv.https://doi.org/10.1101/685768

Karim,A.S.,Heggestad,J.T.,Crowe,S.A.,Jewett,M.C.,2018.Controllingcell-free metabolism through physiochemical perturbations.Metab.Eng.45,86–94.https://doi.org/10.1016/J.YMBEN.2017.11.005

Karim,A.S.,Jewett,M.C.,2016.A cell-free framework for rapidbiosynthetic pathway prototyping and enzyme discovery.Metab.Eng.36,116–126.https://doi.org/10.1016/J.YMBEN.2016.03.002

Keasling,J.D.,2012.Synthetic biology and the development of tools formetabolic engineering.Metab.Eng.14,189–195.https://doi.org/10.1016/J.YMBEN.2012.01.004

Kelwick,R.,Ricci,L.,Mei Chee,S.,Bell,D.,Webb,A.J.,Freemont,P.S.,Freemont,P.,2017.Cell-free prototyping strategies for enhancing thesustainable production of polyhydroxyalkanoates bioplastics.bioRxiv.https://doi.org/10.1101/225144

Kelwick,R.,Webb,A.J.,MacDonald,J.T.,Freemont,P.S.,2016.Development ofa Bacillus subtilis cell-freetranscription-translation system for prototypingregulatory elements.Metab.Eng.38,370–381.https://doi.org/10.1016/J.YMBEN.2016.09.008

Kobs,G.,2008.Selecting the cell-free protein expression system thatmeets your experimental goals.Promega Coop.Madison,WI,USA.

Kovtun,O.,Mureev,S.,Johnston,W.,Alexandrov,K.,2010.Towards theConstruction of Expressed Proteomes Using a Leishmania tarentolae Based Cell-Free Expression System.PLoS One 5,e14388.https://doi.org/10.1371/journal.pone.0014388

Kracke,F.,Virdis,B.,Bernhardt,P.V.,Rabaey,K.,J.O.,2016.Redoxdependent metabolic shift in Clostridium autoethanogenum by extracellularelectron supply.Biotechnol.Biofuels 9,249.https://doi.org/10.1186/s13068-016-0663-2

Kwon,Y.-C.,Jewett,M.C.,2015.High-throughput preparation methods ofcrude extract for robust cell-free protein synthesis.Sci.Rep.5,8663.https://doi.org/10.1038/srep08663

Kwon,Y.-C.,Oh,I.-S.,Lee,N.,Lee,K.-H.,Yoon,Y.J.,Lee,E.Y.,Kim,B.-G.,Kim,D.-M.,2013.Integrating cell-free biosyntheses of heme prosthetic groupand apoenzyme for the synthesis of functional P450 monooxygenase.Biotechnol.Bioeng.110,1193–1200.https://doi.org/10.1002/bit.24785

Leuchtenberger,W.,Huthmacher,K.,Drauz,K.,2005.Biotechnologicalproduction of amino acids and derivatives:current status and prospects.Appl.Microbiol.Biotechnol.69,1–8.https://doi.org/10.1007/s00253-005-0155-y

Li,J.,Wang,H.,Jewett,M.C.,2018.Expanding the palette of Streptomyces-based cell-free protein synthesis systems with enhancedyields.Biochem.Eng.J.130,29–33.https://doi.org/10.1016/J.BEJ.2017.11.013

Li,J.,Wang,H.,Kwon,Y.-C.,Jewett,M.C.,2017.Establishing a highyielding streptomyces-based cell-free protein synthesissystem.Biotechnol.Bioeng.114,1343–1353.https://doi.org/10.1002/bit.26253

Liew,F.,Henstra,A.M.,M.,Winzer,K.,Simpson,S.D.,Minton,N.P.,2017.Metabolic engineering of Clostridium autoethanogenum for selectivealcohol production.Metab.Eng.40,104–114.https://doi.org/10.1016/J.YMBEN.2017.01.007

Liew,F.,Martin,M.E.,Tappel,R.C.,Heijstra,B.D.,Mihalcea,C.,M.,2016.Gas Fermentation-A Flexible Platform for Commercial Scale Production ofLow-Carbon-Fuels and Chemicals from Waste and RenewableFeedstocks.Front.Microbiol.|www.frontiersin.org 7.https://doi.org/10.3389/fmicb.2016.00694

Madin,K.,Sawasaki,T.,Ogasawara,T.,Endo,Y.,2000.A highly efficient androbust cell-free protein synthesis system prepared from wheat embryos:plantsapparently contain a suicide system directed at ribosomes.Proc.Natl.Acad.Sci.U.S.A.97,559–64.https://doi.org/10.1073/pnas.97.2.559

Marcellin,E.,Behrendorff,J.B.,Nagaraju,S.,DeTissera,S.,Segovia,S.,Palfreyman,R.W.,Daniell,J.,Licona-Cassani,C.,Quek,L.,Speight,R.,Hodson,M.P.,Simpson,S.D.,Mitchell,W.P.,M.,Nielsen,L.K.,2016.Low carbon fuels andcommodity chemicals from waste gases–systematic approach to understand energymetabolism in a model acetogen.Green Chem.18,3020–3028.https://doi.org/10.1039/C5GC02708J

Marshall,R.,Maxwell,C.S.,Collins,S.P.,Jacobsen,T.,Luo,M.L.,Begemann,M.B.,Gray,B.N.,January,E.,Singer,A.,He,Y.,Beisel,C.L.,Noireaux,V.,2018.Rapidand Scalable Characterization of CRISPR Technologies Using an E.coli Cell-Free Transcription-Translation System.Mol.Cell 69,146-157.e3.https://doi.org/10.1016/J.MOLCEL.2017.12.007

Martin,R.W.,Des Soye,B.J.,Kwon,Y.-C.C.,Kay,J.,Davis,R.G.,Thomas,P.M.,Majewska,N.I.,Chen,C.X.,Marcum,R.D.,Weiss,M.G.,Stoddart,A.E.,Amiram,M.,RanjiCharna,A.K.,Patel,J.R.,Isaacs,F.J.,Kelleher,N.L.,Hong,S.H.,Jewett,M.C.,2018.Cell-free protein synthesis from genomically recoded bacteria enablesmultisite incorporation of noncanonical amino acids.Nat.Commun.9,1–9.https://doi.org/10.1038/s41467-018-03469-5

Martin,R.W.,Majewska,N.I.,Chen,C.X.,Albanetti,T.E.,Jimenez,R.B.C.,Schmelzer,A.E.,Jewett,M.C.,Roy,V.,2017.Development of a CHO-Based Cell-FreePlatform for Synthesis of Active Monoclonal Antibodies.ACS Synth.Biol.6,1370–1379.https://doi.org/10.1021/acssynbio.7b00001

Meadows,A.L.,Hawkins,K.M.,Tsegaye,Y.,Antipov,E.,Kim,Y.,Raetz,L.,Dahl,R.H.,Tai,A.,Mahatdejkul-Meadows,T.,Xu,L.,Zhao,L.,Dasika,M.S.,Murarka,A.,Lenihan,J.,Eng,D.,Leng,J.S.,Liu,C.-L.,Wenger,J.W.,Jiang,H.,Chao,L.,Westfall,P.,Lai,J.,Ganesan,S.,Jackson,P.,Mans,R.,Platt,D.,Reeves,C.D.,Saija,P.R.,Wichmann,G.,Holmes,V.F.,Benjamin,K.,Hill,P.W.,Gardner,T.S.,Tsong,A.E.,2016.Rewriting yeast central carbon metabolism for industrial isoprenoid production.Nat.Publ.Gr.537.https://doi.org/10.1038/nature19769

Meinecke,B.,Bertram,J.,Gottsehalk,G.,1989.Purification andcharacterization of the pyruvate-ferredoxin oxidoreductase from Clostridiumacetobutylicum,Arch Microbiol.

Mikami,S.,Kobayashi,T.,Imataka,H.,2010.Cell-Free Protein SynthesisSystems with Extracts from Cultured Human Cells,in:Methods in MolecularBiology.Humana Press,pp.43–52.https://doi.org/10.1007/978-1-60327-331-2_5

Mock,J.,Zheng,Y.,Mueller,A.P.,Ly,S.,Tran,L.,Segovia,S.,Nagaraju,S.,M.,Dürre,P.,Thauer,R.K.,2015.Energy Conservation Associated with EthanolFormation from H2 and CO2 in Clostridium autoethanogenum Involving ElectronBifurcation.J.Bacteriol.197,2965–80.https://doi.org/10.1128/JB.00399-15

Moore,Simon J.;MacDonald,James T.;Wienecke,Sarah;Ishwarbhai,Alka;Tsipa,Argyro;Aw,Rochelle;Kylilis,Nicolas;Bell,David J.,McClymont,David W.;Jensen,Kirsten;Polizzi,Karen M.;Biedendieck,Rebekka;Freemont,P.S.,2018.Rapidacquisition and model-based analysis of cell-free transcription–translationreactions from nonmodel bacteria.Proc.Natl.Acad.Sci.115,E4340–E4349.https://doi.org/10.1073/pnas.1715806115

Morgado,G.,Gerngross,D.,Roberts,T.M.,Panke,S.,2018.Synthetic biologyfor cell-free biosynthesis:Fundamentals of designing novel in vitro multi-enzyme reaction networks,in:Advances in Biochemical Engineering/Biotechnology.Springer,Cham,pp.117–146.https://doi.org/10.1007/10_2016_13

Mureev,S.,Kovtun,O.,Nguyen,U.T.T.,Alexandrov,K.,2009.Species-independent translational leaders facilitate cell-freeexpression.Nat.Biotechnol.27,747–752.https://doi.org/10.1038/nbt.1556

Nagaraju,S.,Davies,N.K.,Jeffrey,D.,Walker,F.,M.,Simpson,S.D.,2016.Genome editing of Clostridium autoethanogenum using CRISPR/Cas9.Biotechnol Biofuels 9,219.https://doi.org/10.1186/s13068-016-0638-3

Nakamura,C.E.,Whited,G.M.,2003.Metabolic engineering for themicrobial production of 1,3-propanediol.Curr.Opin.Biotechnol.14,454–459.https://doi.org/10.1016/J.COPBIO.2003.08.005

Nakotte,S.,Schaffer,S.,M.,Dürre,P.,1998.Electroporation of,plasmid isolation from and plasmid conservation in Clostridium acetobutylicumDSM 792.Appl.Microbiol.Biotechnol.50,564–567.

Nielsen,J.,Fussenegger,M.,Keasling,J.,Lee,S.Y.,Liao,J.C.,Prather,K.,Palsson,B.,2014.Engineering synergy in biotechnology.Nat.Chem.Biol.10,319–322.https://doi.org/10.1038/nchembio.1519

Nielsen,J.,Keasling,J.D.,2016.Engineering Cellular Metabolism.Cell164,1185–1197.https://doi.org/10.1016/J.CELL.2016.02.004

Nirenberg,M.W.,Matthaei,J.H.,1961.The dependence of cell-free proteinsynthesis in E.coli upon naturally occurring or synthetic polyribonucleotides.Proc.Natl.Acad.Sci.U.S.A.47,1588–602.https://doi.org/10.1073/pnas.47.10.1588

Pardee,K.,Green,A.A.,Ferrante,T.,Cameron,D.E.,DaleyKeyser,A.,Yin,P.,Collins,J.J.,2014.Paper-Based Synthetic Gene Networks.Cell 159,940–954.https://doi.org/10.1016/J.CELL.2014.10.004

Pardee,K.,Slomovic,S.,Nguyen,P.Q.,Lee,J.W.,Donghia,N.,Burrill,D.,Ferrante,T.,McSorley,F.R.,Furuta,Y.,Vernet,A.,Lewandowski,M.,Boddy,C.N.,Joshi,N.S.,Collins,J.J.,2016.Portable,On-Demand BiomolecularManufacturing.Cell 167,248-259.e12.https://doi.org/10.1016/J.CELL.2016.09.013

Pelham,H.R.B.,Jackson,R.J.,1976.An Efficient mRNA-DependentTranslation System from Reticulocyte Lysates.Eur.J.Biochem.67,247–256.https://doi.org/10.1111/j.1432-1033.1976.tb10656.x

Rodriguez,B.A.,Stowers,C.C.,Pham,V.,Cox,B.M.,2014.Green ChemistryPERSPECTIVE The production of propionic acid,propanol and propylene via sugarfermentation:an industrial perspective on the progress,technical challengesand future outlook.https://doi.org/10.1039/c3gc42000k

Salehi,A.S.M.,Shakalli Tang,M.J.,Smith,M.T.,Hunt,J.M.,Law,R.A.,Wood,D.W.,Bundy,B.C.,2017.Cell-Free Protein Synthesis Approach to Biosensing hTRβ-Specific Endocrine Disruptors.Anal.Chem.89,3395–3401.https://doi.org/10.1021/acs.analchem.6b04034

Salis,H.M.,Mirsky,E.A.,Voigt,C.A.,2009.Automated design of syntheticribosome binding sites to control protein expression.Nat.Biotechnol.27,946–950.https://doi.org/10.1038/nbt.1568

Siegal-Gaskins,D.,Tuza,Z.A.,Kim,J.,Noireaux,V.,Murray,R.M.,2014.GeneCircuit Performance Characterization and Resource Usage in a Cell-Free“Breadboard.”ACS Synth.Biol.3,416–425.https://doi.org/10.1021/sb400203p

Silverman,A.D.,Kelley-Loughnane,N.,Lucks,J.B.,Jewett,M.C.,2019.Deconstructing Cell-Free Extract Preparation for in Vitro Activation ofTranscriptional Genetic Circuitry.ACS Synth.Biol.8,403–414.https://doi.org/10.1021/acssynbio.8b00430

Sullivan,C.J.,Pendleton,E.D.,Sasmor,H.H.,Hicks,W.L.,Farnum,J.B.,Muto,M.,Amendt,E.M.,Schoborg,J.A.,Martin,R.W.,Clark,L.G.,Anderson,M.J.,Choudhury,A.,Fior,R.,Lo,Y.-H.,Griffey,R.H.,Chappell,S.A.,Jewett,M.C.,Mauro,V.P.,Dresios,J.,2016.A cell-free expression and purification process for rapidproduction of protein biologics.Biotechnol.J.11,238–248.https://doi.org/10.1002/biot.201500214

Takahashi,Melissa K.,Chappell,J.,Hayes,C.A.,Sun,Z.Z.,Kim,J.,Singhal,V.,Spring,K.J.,Al-Khabouri,S.,Fall,C.P.,Noireaux,V.,Murray,R.M.,Lucks,J.B.,2015.Rapidly Characterizing the Fast Dynamics of RNA Genetic Circuitry withCell-Free Transcription–Translation(TX-TL)Systems.ACS Synth.Biol.4,503–515.https://doi.org/10.1021/sb400206c

Takahashi,Melissa K,Hayes,C.A.,Chappell,J.,Sun,Z.Z.,Murray,R.M.,Noireaux,V.,Lucks,J.B.,2015.Characterizing and prototyping genetic networkswith cell-free“translation reactions.METHODS.https://doi.org/10.1016/j.ymeth.2015.05.020

Takahashi,M.K.,Tan,X.,Dy,A.J.,Braff,D.,Akana,R.T.,Furuta,Y.,Donghia,N.,Ananthakrishnan,A.,Collins,J.J.,2018.A low-cost paper-based syntheticbiology platform for analyzing gut microbiota and hostbiomarkers.Nat.Commun.9,3347.https://doi.org/10.1038/s41467-018-05864-4

Takai,K.,Sawasaki,T.,Endo,Y.,2010.Practical cell-free proteinsynthesis system using purified wheat embryos.Nat.Protoc.5,227–238.https://doi.org/10.1038/nprot.2009.207

Tarui,H.,Murata,M.,Tani,I.,Imanishi,S.,Nishikawa,S.,Hara,T.,2001.Establishment and characterization of cell-free translation/glycosylation in insect cell(Spodoptera frugiperda 21)extract prepared withhigh pressure treatment.Appl.Microbiol.Biotechnol.55,446–453.https://doi.org/10.1007/s002530000534

Tracy,B.P.,Jones,S.W.,Fast,A.G.,Indurthi,D.C.,Papoutsakis,E.T.,2012.Clostridia:the importance of their exceptional substrate and metabolitediversity for biofuel and biorefinery applications.Curr.Opin.Biotechnol.23,364–381.https://doi.org/10.1016/J.COPBIO.2011.10.008

Valgepea,K.,de Souza Pinto Lemgruber,R.,Abdalla,T.,Binos,S.,Takemori,N.,Takemori,A.,Tanaka,Y.,Tappel,R.,M.,Simpson,S.D.,Nielsen,L.K.,Marcellin,E.,2018.H2drives metabolic rearrangements in gas-fermentingClostridium autoethanogenum.Biotechnol.Biofuels 11,55.https://doi.org/10.1186/s13068-018-1052-9

Valgepea,K.,de Souza Pinto Lemgruber,R.,Meaghan,K.,Palfreyman,R.W.,Abdalla,T.,Heijstra,B.D.,Behrendorff,J.B.,Tappel,R.,M.,Simpson,S.D.,Nielsen,L.K.,Marcellin,E.,2017.Maintenance of ATP Homeostasis TriggersMetabolic Shifts in Gas-Fermenting Acetogens.Cell Syst.4,505-515.e5.https://doi.org/10.1016/j.cels.2017.04.008

Voloshin,A.M.,Swartz,J.R.,2005.Efficient and scalable method forscaling up cell free protein synthesis in batch mode.Biotechnol.Bioeng.91,516–521.https://doi.org/10.1002/bit.20528

Wang,H.,Li,J.,Jewett,M.C.,2018.Development of a Pseudomonas putidacell-free protein synthesis platform for rapid screening of gene regulatoryelements.Synth.Biol.3.https://doi.org/10.1093/synbio/ysy003

Wang,S.,Huang,H.,Kahnt,J.,Mueller,A.P.,M.,Thauer,R.K.,2013.NADP-specific electron-bifurcating[FeFe]-hydrogenase in a functional complex withformate dehydrogenase in Clostridium autoethanogenum grown onCO.J.Bacteriol.195,4373–86.https://doi.org/10.1128/JB.00678-13

Wee,Y.-J.,Kim,J.-N.,Ryu,H.-W.,2006.Biotechnological Production ofLactic Acid and Its Recent Applications.Food Technol.Biotechnol.44,163–172.

Wiegand,D.J.,Lee,H.H.,Ostrov,N.,Church,G.M.,2018.Establishing a Cell-Free Vibrio natriegens Expression System.ACS Synth.Biol.7,2475–2479.https://doi.org/10.1021/acssynbio.8b00222

Yim,H.,Haselbeck,R.,Niu,W.,Pujol-Baxley,C.,Burgard,A.,Boldt,J.,Khandurina,J.,Trawick,J.,Osterhout,R.,Stephen,R.,Estadilla,J.,Teisan,S.,Brettschreyer,H.,Andrae,S.,Hoon Yang,T.,Yup Lee,S.,Burk,M.J.,Van dien,S.,2011.Metabolic engineering of Escherichia coli for direct production of 1,4-butanediol.Nat.Chem.Biol.7.https://doi.org/10.1038/nCHeMBIO.580

Yim,S.S.,Johns,N.I.,Park,J.,Gomes,A.L.C.,Mcbee,R.M.,Richardson,M.,Ronda,C.,Chen,S.P.,Garenne,D.,Noireaux,V.,Wang,H.H.,2019.Multiplextranscriptional characterizations across diverse and hybrid bacterial cell-free expression systems.bioRxiv.https://doi.org/10.1101/427559

M.,Held,C.,Hujer,S.,Liesegang,H.,Wiezer,A.,Wollherr,A.,Ehrenreich,A.,Liebl,W.,Gottschalk,G.&Dürre,P.Clostridium ljungdahliirepresents a microbial production platform based on syngas.Proceedings of theNational Academy of Sciences 107,13087-13092,(2010).

Salis,H.M.,Mirsky,E.A.,Voigt,C.A.,2009.Automated design of syntheticribosome binding sites to control protein expression.Nat.Biotechnol.27,946–950.https://doi.org/10.1038/nbt.1568

Tummala,S.B.,Tomas,C.,Harris,L.M.,Papoutsakis,E.T.,Welker,N.E.,Rudolph,F.B.&Bennett,G.N.in Clostridia:Biotechnology and Medical Applications(ed H.Bahl and P.Dürre)(Wiley-VCH Verlag GmbH,2001).

Papoutsakis,E.T.Engineering solventogenic clostridia.Current Opinionin Biotechnology 19,420-429,(2008).

美国专利号7,041,479.Enhanced in vitro synthesis of active proteinscontaining disulfide bonds.Kim,D.,Swartz,J.

美国专利号7,186,525.Methods of RNA and protein synthesis.Sakanyan,V.,Snapyan,M.,Ghochikyan,A.,Lecocq,F.

美国专利号8,734,856.Cell extract for cell-free protein synthesis andprocess for producing the same.Endo,Y.

美国专利号7,235,382.Preparation containing cell extracts for cell-free protein synthesis and means for synthesizing protein using thepreparation.Endo,Y.,Nishikawa,S.

美国专利号7,273,615.Reaction solution for cell-free proteinsynthesis,method of preparing the same,and protein synthesis method using thesame.Endo,Y.,Kawasaki,T.,and Sawasaki,T.

美国专利号7,008,651.E.coli extract for protein synthesis.Ambuel,Y.,Oosbree,T.,McCormick,M.,Mierendorf,R.

美国专利号6,994,986.In vitro synthesis of polypeptides by optimizingamino acid metabolism.Swartz,J.,Kim,D.

美国专利号7,312,049.Total amino acid stabilization during cell-freeprotein synthesis.Calhoun,K.and Swartz,J.

美国专利号8,298,759.Protein expression yield enhancement in cell-freeprotein synthesis systems by addition of antifoam agents.Voloshin,A.andSwartz,J.

美国专利号9,005,920.Solution for cell-free protein synthesis,kit forcell-free protein synthesis,and method of protein synthesis.Kusumegi,T.andKawaguchi,T.

美国专利号10,494,600.Bacteria and methods of use thereof.Heijstra、Bjorn Daniel等。

在前面的描述中,对于本领域技术人员来说显而易见的是,在不脱离本发明的范围和精神的情况下,可以对这里公开的发明进行各种替换和修改。此处说明性描述的本发明可在不存在此处未具体公开的任何要素、限制或限制的情况下适当地实施。已使用的术语和表达用作描述而非限制并且无意在使用这样的术语和表达排除所示和描述的特征或其部分的任何等效物,但是认识到在本发明的范围内各种修改是可能的。因此,应当理解,虽然本发明已经通过具体实施方案和可选特征进行说明,但是本领域技术人员可以对这里公开的概念进行修改和/或变化,并且考虑这样的修改和变化属于本发明的范围。

除非本文中另有指示或明显与上下文相矛盾,否则本文所描述的所有方法均可以以任何合适的顺序进行。除非另有主张,否则本文中所提供的任何和所有实例的使用仅意图更好地阐明本发明并且不对本发明的范围造成限制。说明书中的任何语言都不应当解释为指示任何未要求保护的要素为实践本发明所必需的。

本文引用了许多专利和非专利参考文献。引用的参考文献在此通过引用并入本文。如果说明书中的术语定义与引用参考文献中的术语定义不一致,则应根据说明书中的定义来解释该术语。

序列表

<110> 西北大学

Jewett, Michael Christopher

Kruger-Gericke, Antje

Mueller, Alexander Paul

Koepke, Michael

<120> 来自梭菌属提取物的无细胞蛋白质合成平台

<130> 702581.01702

<150> 62/810,014

<151> 2019-02-25

<160> 30

<170> PatentIn version 3.5

<210> 1

<211> 235

<212> PRT

<213> 大肠杆菌

<400> 1

Met Tyr Arg Tyr Leu Ser Ile Ala Ala Val Val Leu Ser Ala Ala Phe

1 5 10 15

Ser Gly Pro Ala Leu Ala Glu Gly Ile Asn Ser Phe Ser Gln Ala Lys

20 25 30

Ala Ala Ala Val Lys Val His Ala Asp Ala Pro Gly Thr Phe Tyr Cys

35 40 45

Gly Cys Lys Ile Asn Trp Gln Gly Lys Lys Gly Val Val Asp Leu Gln

50 55 60

Ser Cys Gly Tyr Gln Val Arg Lys Asn Glu Asn Arg Ala Ser Arg Val

65 70 75 80

Glu Trp Glu His Val Val Pro Ala Trp Gln Phe Gly His Gln Arg Gln

85 90 95

Cys Trp Gln Asp Gly Gly Arg Lys Asn Cys Ala Lys Asp Pro Val Tyr

100 105 110

Arg Lys Met Glu Ser Asp Met His Asn Leu Gln Pro Ser Val Gly Glu

115 120 125

Val Asn Gly Asp Arg Gly Asn Phe Met Tyr Ser Gln Trp Asn Gly Gly

130 135 140

Glu Gly Gln Tyr Gly Gln Cys Ala Met Lys Val Asp Phe Lys Glu Lys

145 150 155 160

Ala Ala Glu Pro Pro Ala Arg Ala Arg Gly Ala Ile Ala Arg Thr Tyr

165 170 175

Phe Tyr Met Arg Asp Gln Tyr Asn Leu Thr Leu Ser Arg Gln Gln Thr

180 185 190

Gln Leu Phe Asn Ala Trp Asn Lys Met Tyr Pro Val Thr Asp Trp Glu

195 200 205

Cys Glu Arg Asp Glu Arg Ile Ala Lys Val Gln Gly Asn His Asn Pro

210 215 220

Tyr Val Gln Arg Ala Cys Gln Ala Arg Lys Ser

225 230 235

<210> 2

<211> 784

<212> PRT

<213> 大肠杆菌

<400> 2

Met Asn Pro Glu Arg Ser Glu Arg Ile Glu Ile Pro Val Leu Pro Leu

1 5 10 15

Arg Asp Val Val Val Tyr Pro His Met Val Ile Pro Leu Phe Val Gly

20 25 30

Arg Glu Lys Ser Ile Arg Cys Leu Glu Ala Ala Met Asp His Asp Lys

35 40 45

Lys Ile Met Leu Val Ala Gln Lys Glu Ala Ser Thr Asp Glu Pro Gly

50 55 60

Val Asn Asp Leu Phe Thr Val Gly Thr Val Ala Ser Ile Leu Gln Met

65 70 75 80

Leu Lys Leu Pro Asp Gly Thr Val Lys Val Leu Val Glu Gly Leu Gln

85 90 95

Arg Ala Arg Ile Ser Ala Leu Ser Asp Asn Gly Glu His Phe Ser Ala

100 105 110

Lys Ala Glu Tyr Leu Glu Ser Pro Thr Ile Asp Glu Arg Glu Gln Glu

115 120 125

Val Leu Val Arg Thr Ala Ile Ser Gln Phe Glu Gly Tyr Ile Lys Leu

130 135 140

Asn Lys Lys Ile Pro Pro Glu Val Leu Thr Ser Leu Asn Ser Ile Asp

145 150 155 160

Asp Pro Ala Arg Leu Ala Asp Thr Ile Ala Ala His Met Pro Leu Lys

165 170 175

Leu Ala Asp Lys Gln Ser Val Leu Glu Met Ser Asp Val Asn Glu Arg

180 185 190

Leu Glu Tyr Leu Met Ala Met Met Glu Ser Glu Ile Asp Leu Leu Gln

195 200 205

Val Glu Lys Arg Ile Arg Asn Arg Val Lys Lys Gln Met Glu Lys Ser

210 215 220

Gln Arg Glu Tyr Tyr Leu Asn Glu Gln Met Lys Ala Ile Gln Lys Glu

225 230 235 240

Leu Gly Glu Met Asp Asp Ala Pro Asp Glu Asn Glu Ala Leu Lys Arg

245 250 255

Lys Ile Asp Ala Ala Lys Met Pro Lys Glu Ala Lys Glu Lys Ala Glu

260 265 270

Ala Glu Leu Gln Lys Leu Lys Met Met Ser Pro Met Ser Ala Glu Ala

275 280 285

Thr Val Val Arg Gly Tyr Ile Asp Trp Met Val Gln Val Pro Trp Asn

290 295 300

Ala Arg Ser Lys Val Lys Lys Asp Leu Arg Gln Ala Gln Glu Ile Leu

305 310 315 320

Asp Thr Asp His Tyr Gly Leu Glu Arg Val Lys Asp Arg Ile Leu Glu

325 330 335

Tyr Leu Ala Val Gln Ser Arg Val Asn Lys Ile Lys Gly Pro Ile Leu

340 345 350

Cys Leu Val Gly Pro Pro Gly Val Gly Lys Thr Ser Leu Gly Gln Ser

355 360 365

Ile Ala Lys Ala Thr Gly Arg Lys Tyr Val Arg Met Ala Leu Gly Gly

370 375 380

Val Arg Asp Glu Ala Glu Ile Arg Gly His Arg Arg Thr Tyr Ile Gly

385 390 395 400

Ser Met Pro Gly Lys Leu Ile Gln Lys Met Ala Lys Val Gly Val Lys

405 410 415

Asn Pro Leu Phe Leu Leu Asp Glu Ile Asp Lys Met Ser Ser Asp Met

420 425 430

Arg Gly Asp Pro Ala Ser Ala Leu Leu Glu Val Leu Asp Pro Glu Gln

435 440 445

Asn Val Ala Phe Ser Asp His Tyr Leu Glu Val Asp Tyr Asp Leu Ser

450 455 460

Asp Val Met Phe Val Ala Thr Ser Asn Ser Met Asn Ile Pro Ala Pro

465 470 475 480

Leu Leu Asp Arg Met Glu Val Ile Arg Leu Ser Gly Tyr Thr Glu Asp

485 490 495

Glu Lys Leu Asn Ile Ala Lys Arg His Leu Leu Pro Lys Gln Ile Glu

500 505 510

Arg Asn Ala Leu Lys Lys Gly Glu Leu Thr Val Asp Asp Ser Ala Ile

515 520 525

Ile Gly Ile Ile Arg Tyr Tyr Thr Arg Glu Ala Gly Val Arg Gly Leu

530 535 540

Glu Arg Glu Ile Ser Lys Leu Cys Arg Lys Ala Val Lys Gln Leu Leu

545 550 555 560

Leu Asp Lys Ser Leu Lys His Ile Glu Ile Asn Gly Asp Asn Leu His

565 570 575

Asp Tyr Leu Gly Val Gln Arg Phe Asp Tyr Gly Arg Ala Asp Asn Glu

580 585 590

Asn Arg Val Gly Gln Val Thr Gly Leu Ala Trp Thr Glu Val Gly Gly

595 600 605

Asp Leu Leu Thr Ile Glu Thr Ala Cys Val Pro Gly Lys Gly Lys Leu

610 615 620

Thr Tyr Thr Gly Ser Leu Gly Glu Val Met Gln Glu Ser Ile Gln Ala

625 630 635 640

Ala Leu Thr Val Val Arg Ala Arg Ala Glu Lys Leu Gly Ile Asn Pro

645 650 655

Asp Phe Tyr Glu Lys Arg Asp Ile His Val His Val Pro Glu Gly Ala

660 665 670

Thr Pro Lys Asp Gly Pro Ser Ala Gly Ile Ala Met Cys Thr Ala Leu

675 680 685

Val Ser Cys Leu Thr Gly Asn Pro Val Arg Ala Asp Val Ala Met Thr

690 695 700

Gly Glu Ile Thr Leu Arg Gly Gln Val Leu Pro Ile Gly Gly Leu Lys

705 710 715 720

Glu Lys Leu Leu Ala Ala His Arg Gly Gly Ile Lys Thr Val Leu Ile

725 730 735

Pro Phe Glu Asn Lys Arg Asp Leu Glu Glu Ile Pro Asp Asn Val Ile

740 745 750

Ala Asp Leu Asp Ile His Pro Val Lys Arg Ile Glu Glu Val Leu Thr

755 760 765

Leu Ala Leu Gln Asn Glu Pro Ser Gly Met Gln Val Val Thr Ala Lys

770 775 780

<210> 3

<211> 111

<212> PRT

<213> 大肠杆菌

<400> 3

Met Val Ser Arg Tyr Val Pro Asp Met Gly Asp Leu Ile Trp Val Asp

1 5 10 15

Phe Asp Pro Thr Lys Gly Ser Glu Gln Ala Gly His Arg Pro Ala Val

20 25 30

Val Leu Ser Pro Phe Met Tyr Asn Asn Lys Thr Gly Met Cys Leu Cys

35 40 45

Val Pro Cys Thr Thr Gln Ser Lys Gly Tyr Pro Phe Glu Val Val Leu

50 55 60

Ser Gly Gln Glu Arg Asp Gly Val Ala Leu Ala Asp Gln Val Lys Ser

65 70 75 80

Ile Ala Trp Arg Ala Arg Gly Ala Thr Lys Lys Gly Thr Val Ala Pro

85 90 95

Glu Glu Leu Gln Leu Ile Lys Ala Lys Ile Asn Val Leu Ile Gly

100 105 110

<210> 4

<211> 317

<212> PRT

<213> 大肠杆菌

<400> 4

Met Arg Ala Lys Leu Leu Gly Ile Val Leu Thr Thr Pro Ile Ala Ile

1 5 10 15

Ser Ser Phe Ala Ser Thr Glu Thr Leu Ser Phe Thr Pro Asp Asn Ile

20 25 30

Asn Ala Asp Ile Ser Leu Gly Thr Leu Ser Gly Lys Thr Lys Glu Arg

35 40 45

Val Tyr Leu Ala Glu Glu Gly Gly Arg Lys Val Ser Gln Leu Asp Trp

50 55 60

Lys Phe Asn Asn Ala Ala Ile Ile Lys Gly Ala Ile Asn Trp Asp Leu

65 70 75 80

Met Pro Gln Ile Ser Ile Gly Ala Ala Gly Trp Thr Thr Leu Gly Ser

85 90 95

Arg Gly Gly Asn Met Val Asp Gln Asp Trp Met Asp Ser Ser Asn Pro

100 105 110

Gly Thr Trp Thr Asp Glu Ser Arg His Pro Asp Thr Gln Leu Asn Tyr

115 120 125

Ala Asn Glu Phe Asp Leu Asn Ile Lys Gly Trp Leu Leu Asn Glu Pro

130 135 140

Asn Tyr Arg Leu Gly Leu Met Ala Gly Tyr Gln Glu Ser Arg Tyr Ser

145 150 155 160

Phe Thr Ala Arg Gly Gly Ser Tyr Ile Tyr Ser Ser Glu Glu Gly Phe

165 170 175

Arg Asp Asp Ile Gly Ser Phe Pro Asn Gly Glu Arg Ala Ile Gly Tyr

180 185 190

Lys Gln Arg Phe Lys Met Pro Tyr Ile Gly Leu Thr Gly Ser Tyr Arg

195 200 205

Tyr Glu Asp Phe Glu Leu Gly Gly Thr Phe Lys Tyr Ser Gly Trp Val

210 215 220

Glu Ser Ser Asp Asn Asp Glu His Tyr Asp Pro Gly Lys Arg Ile Thr

225 230 235 240

Tyr Arg Ser Lys Val Lys Asp Gln Asn Tyr Tyr Ser Val Ala Val Asn

245 250 255

Ala Gly Tyr Tyr Val Thr Pro Asn Ala Lys Val Tyr Val Glu Gly Ala

260 265 270

Trp Asn Arg Val Thr Asn Lys Lys Gly Asn Thr Ser Leu Tyr Asp His

275 280 285

Asn Asn Asn Thr Ser Asp Tyr Ser Lys Asn Gly Ala Gly Ile Glu Asn

290 295 300

Tyr Asn Phe Ile Thr Thr Ala Gly Leu Lys Tyr Thr Phe

305 310 315

<210> 5

<211> 268

<212> PRT

<213> 大肠杆菌

<400> 5

Met Lys Ala Phe Trp Arg Asn Ala Ala Leu Leu Ala Val Ser Leu Leu

1 5 10 15

Pro Phe Ser Ser Ala Asn Ala Leu Ala Leu Gln Ala Lys Gln Tyr Gly

20 25 30

Asp Phe Asp Arg Tyr Val Leu Ala Leu Ser Trp Gln Thr Gly Phe Cys

35 40 45

Gln Ser Gln His Asp Arg Asn Arg Asn Glu Arg Asp Glu Cys Arg Leu

50 55 60

Gln Thr Glu Thr Thr Asn Lys Ala Asp Phe Leu Thr Val His Gly Leu

65 70 75 80

Trp Pro Gly Leu Pro Lys Ser Val Ala Ala Arg Gly Val Asp Glu Arg

85 90 95

Arg Trp Met Arg Phe Gly Cys Ala Thr Arg Pro Ile Pro Asn Leu Pro

100 105 110

Glu Ala Arg Ala Ser Arg Met Cys Ser Ser Pro Glu Thr Gly Leu Ser

115 120 125

Leu Glu Thr Ala Ala Lys Leu Ser Glu Val Met Pro Gly Ala Gly Gly

130 135 140

Arg Ser Cys Leu Glu Arg Tyr Glu Tyr Ala Lys His Gly Ala Cys Phe

145 150 155 160

Gly Phe Asp Pro Asp Ala Tyr Phe Gly Thr Met Val Arg Leu Asn Gln

165 170 175

Glu Ile Lys Glu Ser Glu Ala Gly Lys Phe Leu Ala Asp Asn Tyr Gly

180 185 190

Lys Thr Val Ser Arg Arg Asp Phe Asp Ala Ala Phe Ala Lys Ser Trp

195 200 205

Gly Lys Glu Asn Val Lys Ala Val Lys Leu Thr Cys Gln Gly Asn Pro

210 215 220

Ala Tyr Leu Thr Glu Ile Gln Ile Ser Ile Lys Ala Asp Ala Ile Asn

225 230 235 240

Ala Pro Leu Ser Ala Asn Ser Phe Leu Pro Gln Pro His Pro Gly Asn

245 250 255

Cys Gly Lys Thr Phe Val Ile Asp Lys Ala Gly Tyr

260 265

<210> 6

<211> 644

<212> PRT

<213> 大肠杆菌

<400> 6

Met Phe Gln Asp Asn Pro Leu Leu Ala Gln Leu Lys Gln Gln Leu His

1 5 10 15

Ser Gln Thr Pro Arg Ala Glu Gly Val Val Lys Ala Thr Glu Lys Gly

20 25 30

Phe Gly Phe Leu Glu Val Asp Ala Gln Lys Ser Tyr Phe Ile Pro Pro

35 40 45

Pro Gln Met Lys Lys Val Met His Gly Asp Arg Ile Ile Ala Val Ile

50 55 60

His Ser Glu Lys Glu Arg Glu Ser Ala Glu Pro Glu Glu Leu Val Glu

65 70 75 80

Pro Phe Leu Thr Arg Phe Val Gly Lys Val Gln Gly Lys Asn Asp Arg

85 90 95

Leu Ala Ile Val Pro Asp His Pro Leu Leu Lys Asp Ala Ile Pro Cys

100 105 110

Arg Ala Ala Arg Gly Leu Asn His Glu Phe Lys Glu Gly Asp Trp Ala

115 120 125

Val Ala Glu Met Arg Arg His Pro Leu Lys Gly Asp Arg Ser Phe Tyr

130 135 140

Ala Glu Leu Thr Gln Tyr Ile Thr Phe Gly Asp Asp His Phe Val Pro

145 150 155 160

Trp Trp Val Thr Leu Ala Arg His Asn Leu Glu Lys Glu Ala Pro Asp

165 170 175

Gly Val Ala Thr Glu Met Leu Asp Glu Gly Leu Val Arg Glu Asp Leu

180 185 190

Thr Ala Leu Asp Phe Val Thr Ile Asp Ser Ala Ser Thr Glu Asp Met

195 200 205

Asp Asp Ala Leu Phe Ala Lys Ala Leu Pro Asp Asp Lys Leu Gln Leu

210 215 220

Ile Val Ala Ile Ala Asp Pro Thr Ala Trp Ile Ala Glu Gly Ser Lys

225 230 235 240

Leu Asp Lys Ala Ala Lys Ile Arg Ala Phe Thr Asn Tyr Leu Pro Gly

245 250 255

Phe Asn Ile Pro Met Leu Pro Arg Glu Leu Ser Asp Asp Leu Cys Ser

260 265 270

Leu Arg Ala Asn Glu Val Arg Pro Val Leu Ala Cys Arg Met Thr Leu

275 280 285

Ser Ala Asp Gly Thr Ile Glu Asp Asn Ile Glu Phe Phe Ala Ala Thr

290 295 300

Ile Glu Ser Lys Ala Lys Leu Val Tyr Asp Gln Val Ser Asp Trp Leu

305 310 315 320

Glu Asn Thr Gly Asp Trp Gln Pro Glu Ser Glu Ala Ile Ala Glu Gln

325 330 335

Val Arg Leu Leu Ala Gln Ile Cys Gln Arg Arg Gly Glu Trp Arg His

340 345 350

Asn His Ala Leu Val Phe Lys Asp Arg Pro Asp Tyr Arg Phe Ile Leu

355 360 365

Gly Glu Lys Gly Glu Val Leu Asp Ile Val Ala Glu Pro Arg Arg Ile

370 375 380

Ala Asn Arg Ile Val Glu Glu Ala Met Ile Ala Ala Asn Ile Cys Ala

385 390 395 400

Ala Arg Val Leu Arg Asp Lys Leu Gly Phe Gly Ile Tyr Asn Val His

405 410 415

Met Gly Phe Asp Pro Ala Asn Ala Asp Ala Leu Ala Ala Leu Leu Lys

420 425 430

Thr His Gly Leu His Val Asp Ala Glu Glu Val Leu Thr Leu Asp Gly

435 440 445

Phe Cys Lys Leu Arg Arg Glu Leu Asp Ala Gln Pro Thr Gly Phe Leu

450 455 460

Asp Ser Arg Ile Arg Arg Phe Gln Ser Phe Ala Glu Ile Ser Thr Glu

465 470 475 480

Pro Gly Pro His Phe Gly Leu Gly Leu Glu Ala Tyr Ala Thr Trp Thr

485 490 495

Ser Pro Ile Arg Lys Tyr Gly Asp Met Ile Asn His Arg Leu Leu Lys

500 505 510

Ala Val Ile Lys Gly Glu Thr Ala Thr Arg Pro Gln Asp Glu Ile Thr

515 520 525

Val Gln Met Ala Glu Arg Arg Arg Leu Asn Arg Met Ala Glu Arg Asp

530 535 540

Val Gly Asp Trp Leu Tyr Ala Arg Phe Leu Lys Asp Lys Ala Gly Thr

545 550 555 560

Asp Thr Arg Phe Ala Ala Glu Ile Val Asp Ile Ser Arg Gly Gly Met

565 570 575

Arg Val Arg Leu Val Asp Asn Gly Ala Ile Ala Phe Ile Pro Ala Pro

580 585 590

Phe Leu His Ala Val Arg Asp Glu Leu Val Cys Ser Gln Glu Asn Gly

595 600 605

Thr Val Gln Ile Lys Gly Glu Thr Val Tyr Lys Val Thr Asp Val Ile

610 615 620

Asp Val Thr Ile Ala Glu Val Arg Met Glu Thr Arg Ser Ile Ile Ala

625 630 635 640

Arg Pro Val Ala

<210> 7

<211> 502

<212> PRT

<213> 大肠杆菌

<400> 7

Met Thr Glu Lys Lys Tyr Ile Val Ala Leu Asp Gln Gly Thr Thr Ser

1 5 10 15

Ser Arg Ala Val Val Met Asp His Asp Ala Asn Ile Ile Ser Val Ser

20 25 30

Gln Arg Glu Phe Glu Gln Ile Tyr Pro Lys Pro Gly Trp Val Glu His

35 40 45

Asp Pro Met Glu Ile Trp Ala Thr Gln Ser Ser Thr Leu Val Glu Val

50 55 60

Leu Ala Lys Ala Asp Ile Ser Ser Asp Gln Ile Ala Ala Ile Gly Ile

65 70 75 80

Thr Asn Gln Arg Glu Thr Thr Ile Val Trp Glu Lys Glu Thr Gly Lys

85 90 95

Pro Ile Tyr Asn Ala Ile Val Trp Gln Cys Arg Arg Thr Ala Glu Ile

100 105 110

Cys Glu His Leu Lys Arg Asp Gly Leu Glu Asp Tyr Ile Arg Ser Asn

115 120 125

Thr Gly Leu Val Ile Asp Pro Tyr Phe Ser Gly Thr Lys Val Lys Trp

130 135 140

Ile Leu Asp His Val Glu Gly Ser Arg Glu Arg Ala Arg Arg Gly Glu

145 150 155 160

Leu Leu Phe Gly Thr Val Asp Thr Trp Leu Ile Trp Lys Met Thr Gln

165 170 175

Gly Arg Val His Val Thr Asp Tyr Thr Asn Ala Ser Arg Thr Met Leu

180 185 190

Phe Asn Ile His Thr Leu Asp Trp Asp Asp Lys Met Leu Glu Val Leu

195 200 205

Asp Ile Pro Arg Glu Met Leu Pro Glu Val Arg Arg Ser Ser Glu Val

210 215 220

Tyr Gly Gln Thr Asn Ile Gly Gly Lys Gly Gly Thr Arg Ile Pro Ile

225 230 235 240

Ser Gly Ile Ala Gly Asp Gln Gln Ala Ala Leu Phe Gly Gln Leu Cys

245 250 255

Val Lys Glu Gly Met Ala Lys Asn Thr Tyr Gly Thr Gly Cys Phe Met

260 265 270

Leu Met Asn Thr Gly Glu Lys Ala Val Lys Ser Glu Asn Gly Leu Leu

275 280 285

Thr Thr Ile Ala Cys Gly Pro Thr Gly Glu Val Asn Tyr Ala Leu Glu

290 295 300

Gly Ala Val Phe Met Ala Gly Ala Ser Ile Gln Trp Leu Arg Asp Glu

305 310 315 320

Met Lys Leu Ile Asn Asp Ala Tyr Asp Ser Glu Tyr Phe Ala Thr Lys

325 330 335

Val Gln Asn Thr Asn Gly Val Tyr Val Val Pro Ala Phe Thr Gly Leu

340 345 350

Gly Ala Pro Tyr Trp Asp Pro Tyr Ala Arg Gly Ala Ile Phe Gly Leu

355 360 365

Thr Arg Gly Val Asn Ala Asn His Ile Ile Arg Ala Thr Leu Glu Ser

370 375 380

Ile Ala Tyr Gln Thr Arg Asp Val Leu Glu Ala Met Gln Ala Asp Ser

385 390 395 400

Gly Ile Arg Leu His Ala Leu Arg Val Asp Gly Gly Ala Val Ala Asn

405 410 415

Asn Phe Leu Met Gln Phe Gln Ser Asp Ile Leu Gly Thr Arg Val Glu

420 425 430

Arg Pro Glu Val Arg Glu Val Thr Ala Leu Gly Ala Ala Tyr Leu Ala

435 440 445

Gly Leu Ala Val Gly Phe Trp Gln Asn Leu Asp Glu Leu Gln Glu Lys

450 455 460

Ala Val Ile Glu Arg Glu Phe Arg Pro Gly Ile Glu Thr Thr Glu Arg

465 470 475 480

Asn Tyr Arg Tyr Ala Gly Trp Lys Lys Ala Val Lys Arg Ala Met Ala

485 490 495

Trp Glu Glu His Asp Glu

500

<210> 8

<211> 450

<212> PRT

<213> 大肠杆菌

<400> 8

Met Thr Lys His Tyr Asp Tyr Ile Ala Ile Gly Gly Gly Ser Gly Gly

1 5 10 15

Ile Ala Ser Ile Asn Arg Ala Ala Met Tyr Gly Gln Lys Cys Ala Leu

20 25 30

Ile Glu Ala Lys Glu Leu Gly Gly Thr Cys Val Asn Val Gly Cys Val

35 40 45

Pro Lys Lys Val Met Trp His Ala Ala Gln Ile Arg Glu Ala Ile His

50 55 60

Met Tyr Gly Pro Asp Tyr Gly Phe Asp Thr Thr Ile Asn Lys Phe Asn

65 70 75 80

Trp Glu Thr Leu Ile Ala Ser Arg Thr Ala Tyr Ile Asp Arg Ile His

85 90 95

Thr Ser Tyr Glu Asn Val Leu Gly Lys Asn Asn Val Asp Val Ile Lys

100 105 110

Gly Phe Ala Arg Phe Val Asp Ala Lys Thr Leu Glu Val Asn Gly Glu

115 120 125

Thr Ile Thr Ala Asp His Ile Leu Ile Ala Thr Gly Gly Arg Pro Ser

130 135 140

His Pro Asp Ile Pro Gly Val Glu Tyr Gly Ile Asp Ser Asp Gly Phe

145 150 155 160

Phe Ala Leu Pro Ala Leu Pro Glu Arg Val Ala Val Val Gly Ala Gly

165 170 175

Tyr Ile Ala Val Glu Leu Ala Gly Val Ile Asn Gly Leu Gly Ala Lys

180 185 190

Thr His Leu Phe Val Arg Lys His Ala Pro Leu Arg Ser Phe Asp Pro

195 200 205

Met Ile Ser Glu Thr Leu Val Glu Val Met Asn Ala Glu Gly Pro Gln

210 215 220

Leu His Thr Asn Ala Ile Pro Lys Ala Val Val Lys Asn Thr Asp Gly

225 230 235 240

Ser Leu Thr Leu Glu Leu Glu Asp Gly Arg Ser Glu Thr Val Asp Cys

245 250 255

Leu Ile Trp Ala Ile Gly Arg Glu Pro Ala Asn Asp Asn Ile Asn Leu

260 265 270

Glu Ala Ala Gly Val Lys Thr Asn Glu Lys Gly Tyr Ile Val Val Asp

275 280 285

Lys Tyr Gln Asn Thr Asn Ile Glu Gly Ile Tyr Ala Val Gly Asp Asn

290 295 300

Thr Gly Ala Val Glu Leu Thr Pro Val Ala Val Ala Ala Gly Arg Arg

305 310 315 320

Leu Ser Glu Arg Leu Phe Asn Asn Lys Pro Asp Glu His Leu Asp Tyr

325 330 335

Ser Asn Ile Pro Thr Val Val Phe Ser His Pro Pro Ile Gly Thr Val

340 345 350

Gly Leu Thr Glu Pro Gln Ala Arg Glu Gln Tyr Gly Asp Asp Gln Val

355 360 365

Lys Val Tyr Lys Ser Ser Phe Thr Ala Met Tyr Thr Ala Val Thr Thr

370 375 380

His Arg Gln Pro Cys Arg Met Lys Leu Val Cys Val Gly Ser Glu Glu

385 390 395 400

Lys Ile Val Gly Ile His Gly Ile Gly Phe Gly Met Asp Glu Met Leu

405 410 415

Gln Gly Phe Ala Val Ala Leu Lys Met Gly Ala Thr Lys Lys Asp Phe

420 425 430

Asp Asn Thr Val Ala Ile His Pro Thr Ala Ala Glu Glu Phe Val Thr

435 440 445

Met Arg

450

<210> 9

<211> 518

<212> PRT

<213> 大肠杆菌

<400> 9

Met Ile Pro Asp Val Ser Gln Ala Leu Ala Trp Leu Glu Lys His Pro

1 5 10 15

Gln Ala Leu Lys Gly Ile Gln Arg Gly Leu Glu Arg Glu Thr Leu Arg

20 25 30

Val Asn Ala Asp Gly Thr Leu Ala Thr Thr Gly His Pro Glu Ala Leu

35 40 45

Gly Ser Ala Leu Thr His Lys Trp Ile Thr Thr Asp Phe Ala Glu Ala

50 55 60

Leu Leu Glu Phe Ile Thr Pro Val Asp Gly Asp Ile Glu His Met Leu

65 70 75 80

Thr Phe Met Arg Asp Leu His Arg Tyr Thr Ala Arg Asn Met Gly Asp

85 90 95

Glu Arg Met Trp Pro Leu Ser Met Pro Cys Tyr Ile Ala Glu Gly Gln

100 105 110

Asp Ile Glu Leu Ala Gln Tyr Gly Thr Ser Asn Thr Gly Arg Phe Lys

115 120 125

Thr Leu Tyr Arg Glu Gly Leu Lys Asn Arg Tyr Gly Ala Leu Met Gln

130 135 140

Thr Ile Ser Gly Val His Tyr Asn Phe Ser Leu Pro Met Ala Phe Trp

145 150 155 160

Gln Ala Lys Cys Gly Asp Ile Ser Gly Ala Asp Ala Lys Glu Lys Ile

165 170 175

Ser Ala Gly Tyr Phe Arg Val Ile Arg Asn Tyr Tyr Arg Phe Gly Trp

180 185 190

Val Ile Pro Tyr Leu Phe Gly Ala Ser Pro Ala Ile Cys Ser Ser Phe

195 200 205

Leu Gln Gly Lys Pro Thr Ser Leu Pro Phe Glu Lys Thr Glu Cys Gly

210 215 220

Met Tyr Tyr Leu Pro Tyr Ala Thr Ser Leu Arg Leu Ser Asp Leu Gly

225 230 235 240

Tyr Thr Asn Lys Ser Gln Ser Asn Leu Gly Ile Thr Phe Asn Asp Leu

245 250 255

Tyr Glu Tyr Val Ala Gly Leu Lys Gln Ala Ile Lys Thr Pro Ser Glu

260 265 270

Glu Tyr Ala Lys Ile Gly Ile Glu Lys Asp Gly Lys Arg Leu Gln Ile

275 280 285

Asn Ser Asn Val Leu Gln Ile Glu Asn Glu Leu Tyr Ala Pro Ile Arg

290 295 300

Pro Lys Arg Val Thr Arg Ser Gly Glu Ser Pro Ser Asp Ala Leu Leu

305 310 315 320

Arg Gly Gly Ile Glu Tyr Ile Glu Val Arg Ser Leu Asp Ile Asn Pro

325 330 335

Phe Ser Pro Ile Gly Val Asp Glu Gln Gln Val Arg Phe Leu Asp Leu

340 345 350

Phe Met Val Trp Cys Ala Leu Ala Asp Ala Pro Glu Met Ser Ser Ser

355 360 365

Glu Leu Ala Cys Thr Arg Val Asn Trp Asn Arg Val Ile Leu Glu Gly

370 375 380

Arg Lys Pro Gly Leu Thr Leu Gly Ile Gly Cys Glu Thr Ala Gln Phe

385 390 395 400

Pro Leu Pro Gln Val Gly Lys Asp Leu Phe Arg Asp Leu Lys Arg Val

405 410 415

Ala Gln Thr Leu Asp Ser Ile Asn Gly Gly Glu Ala Tyr Gln Lys Val

420 425 430

Cys Asp Glu Leu Val Ala Cys Phe Asp Asn Pro Asp Leu Thr Phe Ser

435 440 445

Ala Arg Ile Leu Arg Ser Met Ile Asp Thr Gly Ile Gly Gly Thr Gly

450 455 460

Lys Ala Phe Ala Glu Ala Tyr Arg Asn Leu Leu Arg Glu Glu Pro Leu

465 470 475 480

Glu Ile Leu Arg Glu Glu Asp Phe Val Ala Glu Arg Glu Ala Ser Glu

485 490 495

Arg Arg Gln Gln Glu Met Glu Ala Ala Asp Thr Glu Pro Phe Ala Val

500 505 510

Trp Leu Glu Lys His Ala

515

<210> 10

<211> 471

<212> PRT

<213> 大肠杆菌

<400> 10

Met Glu Asn Phe Lys His Leu Pro Glu Pro Phe Arg Ile Arg Val Ile

1 5 10 15

Glu Pro Val Lys Arg Thr Thr Arg Ala Tyr Arg Glu Glu Ala Ile Ile

20 25 30

Lys Ser Gly Met Asn Pro Phe Leu Leu Asp Ser Glu Asp Val Phe Ile

35 40 45

Asp Leu Leu Thr Asp Ser Gly Thr Gly Ala Val Thr Gln Ser Met Gln

50 55 60

Ala Ala Met Met Arg Gly Asp Glu Ala Tyr Ser Gly Ser Arg Ser Tyr

65 70 75 80

Tyr Ala Leu Ala Glu Ser Val Lys Asn Ile Phe Gly Tyr Gln Tyr Thr

85 90 95

Ile Pro Thr His Gln Gly Arg Gly Ala Glu Gln Ile Tyr Ile Pro Val

100 105 110

Leu Ile Lys Lys Arg Glu Gln Glu Lys Gly Leu Asp Arg Ser Lys Met

115 120 125

Val Ala Phe Ser Asn Tyr Phe Phe Asp Thr Thr Gln Gly His Ser Gln

130 135 140

Ile Asn Gly Cys Thr Val Arg Asn Val Tyr Ile Lys Glu Ala Phe Asp

145 150 155 160

Thr Gly Val Arg Tyr Asp Phe Lys Gly Asn Phe Asp Leu Glu Gly Leu

165 170 175

Glu Arg Gly Ile Glu Glu Val Gly Pro Asn Asn Val Pro Tyr Ile Val

180 185 190

Ala Thr Ile Thr Ser Asn Ser Ala Gly Gly Gln Pro Val Ser Leu Ala

195 200 205

Asn Leu Lys Ala Met Tyr Ser Ile Ala Lys Lys Tyr Asp Ile Pro Val

210 215 220

Val Met Asp Ser Ala Arg Phe Ala Glu Asn Ala Tyr Phe Ile Lys Gln

225 230 235 240

Arg Glu Ala Glu Tyr Lys Asp Trp Thr Ile Glu Gln Ile Thr Arg Glu

245 250 255

Thr Tyr Lys Tyr Ala Asp Met Leu Ala Met Ser Ala Lys Lys Asp Ala

260 265 270

Met Val Pro Met Gly Gly Leu Leu Cys Met Lys Asp Asp Ser Phe Phe

275 280 285

Asp Val Tyr Thr Glu Cys Arg Thr Leu Cys Val Val Gln Glu Gly Phe

290 295 300

Pro Thr Tyr Gly Gly Leu Glu Gly Gly Ala Met Glu Arg Leu Ala Val

305 310 315 320

Gly Leu Tyr Asp Gly Met Asn Leu Asp Trp Leu Ala Tyr Arg Ile Ala

325 330 335

Gln Val Gln Tyr Leu Val Asp Gly Leu Glu Glu Ile Gly Val Val Cys

340 345 350

Gln Gln Ala Gly Gly His Ala Ala Phe Val Asp Ala Gly Lys Leu Leu

355 360 365

Pro His Ile Pro Ala Asp Gln Phe Pro Ala Gln Ala Leu Ala Cys Glu

370 375 380

Leu Tyr Lys Val Ala Gly Ile Arg Ala Val Glu Ile Gly Ser Phe Leu

385 390 395 400

Leu Gly Arg Asp Pro Lys Thr Gly Lys Gln Leu Pro Cys Pro Ala Glu

405 410 415

Leu Leu Arg Leu Thr Ile Pro Arg Ala Thr Tyr Thr Gln Thr His Met

420 425 430

Asp Phe Ile Ile Glu Ala Phe Lys His Val Lys Glu Asn Ala Ala Asn

435 440 445

Ile Lys Gly Leu Thr Phe Thr Tyr Glu Pro Lys Val Leu Arg His Phe

450 455 460

Thr Ala Lys Leu Lys Glu Val

465 470

<210> 11

<211> 1061

<212> PRT

<213> 大肠杆菌

<400> 11

Met Lys Arg Met Leu Ile Asn Ala Thr Gln Gln Glu Glu Leu Arg Val

1 5 10 15

Ala Leu Val Asp Gly Gln Arg Leu Tyr Asp Leu Asp Ile Glu Ser Pro

20 25 30

Gly His Glu Gln Lys Lys Ala Asn Ile Tyr Lys Gly Lys Ile Thr Arg

35 40 45

Ile Glu Pro Ser Leu Glu Ala Ala Phe Val Asp Tyr Gly Ala Glu Arg

50 55 60

His Gly Phe Leu Pro Leu Lys Glu Ile Ala Arg Glu Tyr Phe Pro Ala

65 70 75 80

Asn Tyr Ser Ala His Gly Arg Pro Asn Ile Lys Asp Val Leu Arg Glu

85 90 95

Gly Gln Glu Val Ile Val Gln Ile Asp Lys Glu Glu Arg Gly Asn Lys

100 105 110

Gly Ala Ala Leu Thr Thr Phe Ile Ser Leu Ala Gly Ser Tyr Leu Val

115 120 125

Leu Met Pro Asn Asn Pro Arg Ala Gly Gly Ile Ser Arg Arg Ile Glu

130 135 140

Gly Asp Asp Arg Thr Glu Leu Lys Glu Ala Leu Ala Ser Leu Glu Leu

145 150 155 160

Pro Glu Gly Met Gly Leu Ile Val Arg Thr Ala Gly Val Gly Lys Ser

165 170 175

Ala Glu Ala Leu Gln Trp Asp Leu Ser Phe Arg Leu Lys His Trp Glu

180 185 190

Ala Ile Lys Lys Ala Ala Glu Ser Arg Pro Ala Pro Phe Leu Ile His

195 200 205

Gln Glu Ser Asn Val Ile Val Arg Ala Phe Arg Asp Tyr Leu Arg Gln

210 215 220

Asp Ile Gly Glu Ile Leu Ile Asp Asn Pro Lys Val Leu Glu Leu Ala

225 230 235 240

Arg Gln His Ile Ala Ala Leu Gly Arg Pro Asp Phe Ser Ser Lys Ile

245 250 255

Lys Leu Tyr Thr Gly Glu Ile Pro Leu Phe Ser His Tyr Gln Ile Glu

260 265 270

Ser Gln Ile Glu Ser Ala Phe Gln Arg Glu Val Arg Leu Pro Ser Gly

275 280 285

Gly Ser Ile Val Ile Asp Ser Thr Glu Ala Leu Thr Ala Ile Asp Ile

290 295 300

Asn Ser Ala Arg Ala Thr Arg Gly Gly Asp Ile Glu Glu Thr Ala Phe

305 310 315 320

Asn Thr Asn Leu Glu Ala Ala Asp Glu Ile Ala Arg Gln Leu Arg Leu

325 330 335

Arg Asp Leu Gly Gly Leu Ile Val Ile Asp Phe Ile Asp Met Thr Pro

340 345 350

Val Arg His Gln Arg Ala Val Glu Asn Arg Leu Arg Glu Ala Val Arg

355 360 365

Gln Asp Arg Ala Arg Ile Gln Ile Ser His Ile Ser Arg Phe Gly Leu

370 375 380

Leu Glu Met Ser Arg Gln Arg Leu Ser Pro Ser Leu Gly Glu Ser Ser

385 390 395 400

His His Val Cys Pro Arg Cys Ser Gly Thr Gly Thr Val Arg Asp Asn

405 410 415

Glu Ser Leu Ser Leu Ser Ile Leu Arg Leu Ile Glu Glu Glu Ala Leu

420 425 430

Lys Glu Asn Thr Gln Glu Val His Ala Ile Val Pro Val Pro Ile Ala

435 440 445

Ser Tyr Leu Leu Asn Glu Lys Arg Ser Ala Val Asn Ala Ile Glu Thr

450 455 460

Arg Gln Asp Gly Val Arg Cys Val Ile Val Pro Asn Asp Gln Met Glu

465 470 475 480

Thr Pro His Tyr His Val Leu Arg Val Arg Lys Gly Glu Glu Thr Pro

485 490 495

Thr Leu Ser Tyr Met Leu Pro Lys Leu His Glu Glu Ala Met Ala Leu

500 505 510

Pro Ser Glu Glu Glu Phe Ala Glu Arg Lys Arg Pro Glu Gln Pro Ala

515 520 525

Leu Ala Thr Phe Ala Met Pro Asp Val Pro Pro Ala Pro Thr Pro Ala

530 535 540

Glu Pro Ala Ala Pro Val Val Ala Pro Ala Pro Lys Ala Ala Pro Ala

545 550 555 560

Thr Pro Ala Ala Pro Ala Gln Pro Gly Leu Leu Ser Arg Phe Phe Gly

565 570 575

Ala Leu Lys Ala Leu Phe Ser Gly Gly Glu Glu Thr Lys Pro Thr Glu

580 585 590

Gln Pro Ala Pro Lys Ala Glu Ala Lys Pro Glu Arg Gln Gln Asp Arg

595 600 605

Arg Lys Pro Arg Gln Asn Asn Arg Arg Asp Arg Asn Glu Arg Arg Asp

610 615 620

Thr Arg Ser Glu Arg Thr Glu Gly Ser Asp Asn Arg Glu Glu Asn Arg

625 630 635 640

Arg Asn Arg Arg Gln Ala Gln Gln Gln Thr Ala Glu Thr Arg Glu Ser

645 650 655

Arg Gln Gln Ala Glu Val Thr Glu Lys Ala Arg Thr Ala Asp Glu Gln

660 665 670

Gln Ala Pro Arg Arg Glu Arg Ser Arg Arg Arg Asn Asp Asp Lys Arg

675 680 685

Gln Ala Gln Gln Glu Ala Lys Ala Leu Asn Val Glu Glu Gln Ser Val

690 695 700

Gln Glu Thr Glu Gln Glu Glu Arg Val Arg Pro Val Gln Pro Arg Arg

705 710 715 720

Lys Gln Arg Gln Leu Asn Gln Lys Val Arg Tyr Glu Gln Ser Val Ala

725 730 735

Glu Glu Ala Val Val Ala Pro Val Val Glu Glu Thr Val Ala Ala Glu

740 745 750

Pro Ile Val Gln Glu Ala Pro Ala Pro Arg Thr Glu Leu Val Lys Val

755 760 765

Pro Leu Pro Val Val Ala Gln Thr Ala Pro Glu Gln Gln Glu Glu Asn

770 775 780

Asn Ala Asp Asn Arg Asp Asn Gly Gly Met Pro Arg Arg Ser Arg Arg

785 790 795 800

Ser Pro Arg His Leu Arg Val Ser Gly Gln Arg Arg Arg Arg Tyr Arg

805 810 815

Asp Glu Arg Tyr Pro Thr Gln Ser Pro Met Pro Leu Thr Val Ala Cys

820 825 830

Ala Ser Pro Glu Leu Ala Ser Gly Lys Val Trp Ile Arg Tyr Pro Ile

835 840 845

Val Arg Pro Gln Asp Val Gln Val Glu Glu Gln Arg Glu Gln Glu Glu

850 855 860

Val His Val Gln Pro Met Val Thr Glu Val Pro Val Ala Ala Ala Ile

865 870 875 880

Glu Pro Val Val Ser Ala Pro Val Val Glu Glu Val Ala Gly Val Val

885 890 895

Glu Ala Pro Val Gln Val Ala Glu Pro Gln Pro Glu Val Val Glu Thr

900 905 910

Thr His Pro Glu Val Ile Ala Ala Ala Val Thr Glu Gln Pro Gln Val

915 920 925

Ile Thr Glu Ser Asp Val Ala Val Ala Gln Glu Val Ala Glu Gln Ala

930 935 940

Glu Pro Val Val Glu Pro Gln Glu Glu Thr Ala Asp Ile Glu Glu Val

945 950 955 960

Val Glu Thr Ala Glu Val Val Val Ala Glu Pro Glu Val Val Ala Gln

965 970 975

Pro Ala Ala Pro Val Val Ala Glu Val Ala Ala Glu Val Glu Thr Val

980 985 990

Ala Ala Val Glu Pro Glu Val Thr Val Glu His Asn His Ala Thr Ala

995 1000 1005

Pro Met Thr Arg Ala Pro Ala Pro Glu Tyr Val Pro Glu Ala Pro

1010 1015 1020

Arg His Ser Asp Trp Gln Arg Pro Thr Phe Ala Phe Glu Gly Lys

1025 1030 1035

Gly Ala Ala Gly Gly His Thr Ala Thr His His Ala Ser Ala Ala

1040 1045 1050

Pro Ala Arg Pro Gln Pro Val Glu

1055 1060

<210> 12

<211> 447

<212> PRT

<213> 大肠杆菌

<400> 12

Met Asp Gln Thr Tyr Ser Leu Glu Ser Phe Leu Asn His Val Gln Lys

1 5 10 15

Arg Asp Pro Asn Gln Thr Glu Phe Ala Gln Ala Val Arg Glu Val Met

20 25 30

Thr Thr Leu Trp Pro Phe Leu Glu Gln Asn Pro Lys Tyr Arg Gln Met

35 40 45

Ser Leu Leu Glu Arg Leu Val Glu Pro Glu Arg Val Ile Gln Phe Arg

50 55 60

Val Val Trp Val Asp Asp Arg Asn Gln Ile Gln Val Asn Arg Ala Trp

65 70 75 80

Arg Val Gln Phe Ser Ser Ala Ile Gly Pro Tyr Lys Gly Gly Met Arg

85 90 95

Phe His Pro Ser Val Asn Leu Ser Ile Leu Lys Phe Leu Gly Phe Glu

100 105 110

Gln Thr Phe Lys Asn Ala Leu Thr Thr Leu Pro Met Gly Gly Gly Lys

115 120 125

Gly Gly Ser Asp Phe Asp Pro Lys Gly Lys Ser Glu Gly Glu Val Met

130 135 140

Arg Phe Cys Gln Ala Leu Met Thr Glu Leu Tyr Arg His Leu Gly Ala

145 150 155 160

Asp Thr Asp Val Pro Ala Gly Asp Ile Gly Val Gly Gly Arg Glu Val

165 170 175

Gly Phe Met Ala Gly Met Met Lys Lys Leu Ser Asn Asn Thr Ala Cys

180 185 190

Val Phe Thr Gly Lys Gly Leu Ser Phe Gly Gly Ser Leu Ile Arg Pro

195 200 205

Glu Ala Thr Gly Tyr Gly Leu Val Tyr Phe Thr Glu Ala Met Leu Lys

210 215 220

Arg His Gly Met Gly Phe Glu Gly Met Arg Val Ser Val Ser Gly Ser

225 230 235 240

Gly Asn Val Ala Gln Tyr Ala Ile Glu Lys Ala Met Glu Phe Gly Ala

245 250 255

Arg Val Ile Thr Ala Ser Asp Ser Ser Gly Thr Val Val Asp Glu Ser

260 265 270

Gly Phe Thr Lys Glu Lys Leu Ala Arg Leu Ile Glu Ile Lys Ala Ser

275 280 285

Arg Asp Gly Arg Val Ala Asp Tyr Ala Lys Glu Phe Gly Leu Val Tyr

290 295 300

Leu Glu Gly Gln Gln Pro Trp Ser Leu Pro Val Asp Ile Ala Leu Pro

305 310 315 320

Cys Ala Thr Gln Asn Glu Leu Asp Val Asp Ala Ala His Gln Leu Ile

325 330 335

Ala Asn Gly Val Lys Ala Val Ala Glu Gly Ala Asn Met Pro Thr Thr

340 345 350

Ile Glu Ala Thr Glu Leu Phe Gln Gln Ala Gly Val Leu Phe Ala Pro

355 360 365

Gly Lys Ala Ala Asn Ala Gly Gly Val Ala Thr Ser Gly Leu Glu Met

370 375 380

Ala Gln Asn Ala Ala Arg Leu Gly Trp Lys Ala Glu Lys Val Asp Ala

385 390 395 400

Arg Leu His His Ile Met Leu Asp Ile His His Ala Cys Val Glu His

405 410 415

Gly Gly Glu Gly Glu Gln Thr Asn Tyr Val Gln Gly Ala Asn Ile Ala

420 425 430

Gly Phe Val Lys Val Ala Asp Ala Met Leu Ala Gln Gly Val Ile

435 440 445

<210> 13

<211> 454

<212> PRT

<213> 大肠杆菌

<400> 13

Met Ile Ser Leu Phe Asp Met Phe Lys Val Gly Ile Gly Pro Ser Ser

1 5 10 15

Ser His Thr Val Gly Pro Met Lys Ala Gly Lys Gln Phe Val Asp Asp

20 25 30

Leu Val Glu Lys Gly Leu Leu Asp Ser Val Thr Arg Val Ala Val Asp

35 40 45

Val Tyr Gly Ser Leu Ser Leu Thr Gly Lys Gly His His Thr Asp Ile

50 55 60

Ala Ile Ile Met Gly Leu Ala Gly Asn Glu Pro Ala Thr Val Asp Ile

65 70 75 80

Asp Ser Ile Pro Gly Phe Ile Arg Asp Val Glu Glu Arg Glu Arg Leu

85 90 95

Leu Leu Ala Gln Gly Arg His Glu Val Asp Phe Pro Arg Asp Asn Gly

100 105 110

Met Arg Phe His Asn Gly Asn Leu Pro Leu His Glu Asn Gly Met Gln

115 120 125

Ile His Ala Tyr Asn Gly Asp Glu Val Val Tyr Ser Lys Thr Tyr Tyr

130 135 140

Ser Ile Gly Gly Gly Phe Ile Val Asp Glu Glu His Phe Gly Gln Asp

145 150 155 160

Ala Ala Asn Glu Val Ser Val Pro Tyr Pro Phe Lys Ser Ala Thr Glu

165 170 175

Leu Leu Ala Tyr Cys Asn Glu Thr Gly Tyr Ser Leu Ser Gly Leu Ala

180 185 190

Met Gln Asn Glu Leu Ala Leu His Ser Lys Lys Glu Ile Asp Glu Tyr

195 200 205

Phe Ala His Val Trp Gln Thr Met Gln Ala Cys Ile Asp Arg Gly Met

210 215 220

Asn Thr Glu Gly Val Leu Pro Gly Pro Leu Arg Val Pro Arg Arg Ala

225 230 235 240

Ser Ala Leu Arg Arg Met Leu Val Ser Ser Asp Lys Leu Ser Asn Asp

245 250 255

Pro Met Asn Val Ile Asp Trp Val Asn Met Phe Ala Leu Ala Val Asn

260 265 270

Glu Glu Asn Ala Ala Gly Gly Arg Val Val Thr Ala Pro Thr Asn Gly

275 280 285

Ala Cys Gly Ile Val Pro Ala Val Leu Ala Tyr Tyr Asp His Phe Ile

290 295 300

Glu Ser Val Ser Pro Asp Ile Tyr Thr Arg Tyr Phe Met Ala Ala Gly

305 310 315 320

Ala Ile Gly Ala Leu Tyr Lys Met Asn Ala Ser Ile Ser Gly Ala Glu

325 330 335

Val Gly Cys Gln Gly Glu Val Gly Val Ala Cys Ser Met Ala Ala Ala

340 345 350

Gly Leu Ala Glu Leu Leu Gly Gly Ser Pro Glu Gln Val Cys Val Ala

355 360 365

Ala Glu Ile Gly Met Glu His Asn Leu Gly Leu Thr Cys Asp Pro Val

370 375 380

Ala Gly Gln Val Gln Val Pro Cys Ile Glu Arg Asn Ala Ile Ala Ser

385 390 395 400

Val Lys Ala Ile Asn Ala Ala Arg Met Ala Leu Arg Arg Thr Ser Ala

405 410 415

Pro Arg Val Ser Leu Asp Lys Val Ile Glu Thr Met Tyr Glu Thr Gly

420 425 430

Lys Asp Met Asn Ala Lys Tyr Arg Glu Thr Ser Arg Gly Gly Leu Ala

435 440 445

Ile Lys Val Gln Cys Asp

450

<210> 14

<211> 455

<212> PRT

<213> 大肠杆菌

<400> 14

Met Ile Ser Val Phe Asp Ile Phe Lys Ile Gly Ile Gly Pro Ser Ser

1 5 10 15

Ser His Thr Val Gly Pro Met Lys Ala Gly Lys Gln Phe Thr Asp Asp

20 25 30

Leu Ile Ala Arg Asn Leu Leu Lys Asp Val Thr Arg Val Val Val Asp

35 40 45

Val Tyr Gly Ser Leu Ser Leu Thr Gly Lys Gly His His Thr Asp Ile

50 55 60

Ala Ile Ile Met Gly Leu Ala Gly Asn Leu Pro Asp Thr Val Asp Ile

65 70 75 80

Asp Ser Ile Pro Ser Phe Ile Gln Asp Val Asn Thr His Gly Arg Leu

85 90 95

Met Leu Ala Asn Gly Gln His Glu Val Glu Phe Pro Val Asp Gln Cys

100 105 110

Met Asn Phe His Ala Asp Asn Leu Ser Leu His Glu Asn Gly Met Arg

115 120 125

Ile Thr Ala Leu Ala Gly Asp Lys Val Val Tyr Ser Gln Thr Tyr Tyr

130 135 140

Ser Ile Gly Gly Gly Phe Ile Val Asp Glu Glu His Phe Gly Gln Gln

145 150 155 160

Asp Ser Ala Pro Val Glu Val Pro Tyr Pro Tyr Ser Ser Ala Ala Asp

165 170 175

Leu Gln Lys His Cys Gln Glu Thr Gly Leu Ser Leu Ser Gly Leu Met

180 185 190

Met Lys Asn Glu Leu Ala Leu His Ser Lys Glu Glu Leu Glu Gln His

195 200 205

Leu Ala Asn Val Trp Glu Val Met Arg Gly Gly Ile Glu Arg Gly Ile

210 215 220

Ser Thr Glu Gly Val Leu Pro Gly Lys Leu Arg Val Pro Arg Arg Ala

225 230 235 240

Ala Ala Leu Arg Arg Met Leu Val Ser Gln Asp Lys Thr Thr Thr Asp

245 250 255

Pro Met Ala Val Val Asp Trp Ile Asn Met Phe Ala Leu Ala Val Asn

260 265 270

Glu Glu Asn Ala Ala Gly Gly Arg Val Val Thr Ala Pro Thr Asn Gly

275 280 285

Ala Cys Gly Ile Ile Pro Ala Val Leu Ala Tyr Tyr Asp Lys Phe Ile

290 295 300

Arg Glu Val Asn Ala Asn Ser Leu Ala Arg Tyr Leu Leu Val Ala Ser

305 310 315 320

Ala Ile Gly Ser Leu Tyr Lys Met Asn Ala Ser Ile Ser Gly Ala Glu

325 330 335

Val Gly Cys Gln Gly Glu Val Gly Val Ala Cys Ser Met Ala Ala Ala

340 345 350

Gly Leu Ala Glu Leu Leu Gly Ala Ser Pro Ala Gln Val Cys Ile Ala

355 360 365

Ala Glu Ile Ala Met Glu His Asn Leu Gly Leu Thr Cys Asp Pro Val

370 375 380

Ala Gly Gln Val Gln Val Pro Cys Ile Glu Arg Asn Ala Ile Ala Ala

385 390 395 400

Val Lys Ala Val Asn Ala Ala Arg Met Ala Leu Arg Arg Thr Ser Glu

405 410 415

Pro Arg Val Cys Leu Asp Lys Val Ile Glu Thr Met Tyr Glu Thr Gly

420 425 430

Lys Asp Met Asn Ala Lys Tyr Arg Glu Thr Ser Arg Gly Gly Leu Ala

435 440 445

Met Lys Ile Val Ala Cys Asp

450 455

<210> 15

<211> 658

<212> PRT

<213> 大肠杆菌

<400> 15

Met Ser Asp Asp Met Ser Met Gly Leu Pro Ser Ser Ala Gly Glu His

1 5 10 15

Gly Val Leu Arg Ser Met Gln Glu Val Ala Met Ser Ser Gln Glu Ala

20 25 30

Ser Lys Met Leu Arg Thr Tyr Asn Ile Ala Trp Trp Gly Asn Asn Tyr

35 40 45

Tyr Asp Val Asn Glu Leu Gly His Ile Ser Val Cys Pro Asp Pro Asp

50 55 60

Val Pro Glu Ala Arg Val Asp Leu Ala Gln Leu Val Lys Thr Arg Glu

65 70 75 80

Ala Gln Gly Gln Arg Leu Pro Ala Leu Phe Cys Phe Pro Gln Ile Leu

85 90 95

Gln His Arg Leu Arg Ser Ile Asn Ala Ala Phe Lys Arg Ala Arg Glu

100 105 110

Ser Tyr Gly Tyr Asn Gly Asp Tyr Phe Leu Val Tyr Pro Ile Lys Val

115 120 125

Asn Gln His Arg Arg Val Ile Glu Ser Leu Ile His Ser Gly Glu Pro

130 135 140

Leu Gly Leu Glu Ala Gly Ser Lys Ala Glu Leu Met Ala Val Leu Ala

145 150 155 160

His Ala Gly Met Thr Arg Ser Val Ile Val Cys Asn Gly Tyr Lys Asp

165 170 175

Arg Glu Tyr Ile Arg Leu Ala Leu Ile Gly Glu Lys Met Gly His Lys

180 185 190

Val Tyr Leu Val Ile Glu Lys Met Ser Glu Ile Ala Ile Val Leu Asp

195 200 205

Glu Ala Glu Arg Leu Asn Val Val Pro Arg Leu Gly Val Arg Ala Arg

210 215 220

Leu Ala Ser Gln Gly Ser Gly Lys Trp Gln Ser Ser Gly Gly Glu Lys

225 230 235 240

Ser Lys Phe Gly Leu Ala Ala Thr Gln Val Leu Gln Leu Val Glu Thr

245 250 255

Leu Arg Glu Ala Gly Arg Leu Asp Ser Leu Gln Leu Leu His Phe His

260 265 270

Leu Gly Ser Gln Met Ala Asn Ile Arg Asp Ile Ala Thr Gly Val Arg

275 280 285

Glu Ser Ala Arg Phe Tyr Val Glu Leu His Lys Leu Gly Val Asn Ile

290 295 300

Gln Cys Phe Asp Val Gly Gly Gly Leu Gly Val Asp Tyr Glu Gly Thr

305 310 315 320

Arg Ser Gln Ser Asp Cys Ser Val Asn Tyr Gly Leu Asn Glu Tyr Ala

325 330 335

Asn Asn Ile Ile Trp Ala Ile Gly Asp Ala Cys Glu Glu Asn Gly Leu

340 345 350

Pro His Pro Thr Val Ile Thr Glu Ser Gly Arg Ala Val Thr Ala His

355 360 365

His Thr Val Leu Val Ser Asn Ile Ile Gly Val Glu Arg Asn Glu Tyr

370 375 380

Thr Val Pro Thr Ala Pro Ala Glu Asp Ala Pro Arg Ala Leu Gln Ser

385 390 395 400

Met Trp Glu Thr Trp Gln Glu Met His Glu Pro Gly Thr Arg Arg Ser

405 410 415

Leu Arg Glu Trp Leu His Asp Ser Gln Met Asp Leu His Asp Ile His

420 425 430

Ile Gly Tyr Ser Ser Gly Ile Phe Ser Leu Gln Glu Arg Ala Trp Ala

435 440 445

Glu Gln Leu Tyr Leu Ser Met Cys His Glu Val Gln Lys Gln Leu Asp

450 455 460

Pro Gln Asn Arg Ala His Arg Pro Ile Ile Asp Glu Leu Gln Glu Arg

465 470 475 480

Met Ala Asp Lys Met Tyr Val Asn Phe Ser Leu Phe Gln Ser Met Pro

485 490 495

Asp Ala Trp Gly Ile Asp Gln Leu Phe Pro Val Leu Pro Leu Glu Gly

500 505 510

Leu Asp Gln Val Pro Glu Arg Arg Ala Val Leu Leu Asp Ile Thr Cys

515 520 525

Asp Ser Asp Gly Ala Ile Asp His Tyr Ile Asp Gly Asp Gly Ile Ala

530 535 540

Thr Thr Met Pro Met Pro Glu Tyr Asp Pro Glu Asn Pro Pro Met Leu

545 550 555 560

Gly Phe Phe Met Val Gly Ala Tyr Gln Glu Ile Leu Gly Asn Met His

565 570 575

Asn Leu Phe Gly Asp Thr Glu Ala Val Asp Val Phe Val Phe Pro Asp

580 585 590

Gly Ser Val Glu Val Glu Leu Ser Asp Glu Gly Asp Thr Val Ala Asp

595 600 605

Met Leu Gln Tyr Val Gln Leu Asp Pro Lys Thr Leu Leu Thr Gln Phe

610 615 620

Arg Asp Gln Val Lys Lys Thr Asp Leu Asp Ala Glu Leu Gln Gln Gln

625 630 635 640

Phe Leu Glu Glu Phe Glu Ala Gly Leu Tyr Gly Tyr Thr Tyr Leu Glu

645 650 655

Asp Glu

<210> 16

<211> 417

<212> PRT

<213> 大肠杆菌

<400> 16

Met Ser Phe Cys Trp Asn Glu Ile Asn Ser Gly Ile Lys Ser Leu Ile

1 5 10 15

Leu Ile Leu Cys Ile Phe Ser Leu Met Thr Leu Ser Leu Trp Asp Asp

20 25 30

Val Ala Thr Lys Phe Leu His Ala Ala Gly Ile Ile Ser Ala Leu Tyr

35 40 45

Phe Leu Ala Thr Pro Lys Lys Thr Ile Thr Asn Asn Pro Thr Leu Leu

50 55 60

Ile Phe Ile Ser Leu Cys Leu Leu Gly Ile Val Asn Ile Ile Trp Tyr

65 70 75 80

Ser His Tyr Lys Val Ser Gly Ser Val Tyr Thr Asn Ala Tyr Arg Gly

85 90 95

Pro Met Glu Thr Gly Lys Ile Ala Leu Cys Ser Ala Phe Ile Phe Leu

100 105 110

Val Leu Phe Ala Lys Asn Glu Met Arg Thr Lys Ile Lys Phe Gly Lys

115 120 125

Leu Ile Leu Phe Ala Ser Leu Ala Thr Gln Leu Leu Phe Phe Ala His

130 135 140

Ala Met Trp Gln His Phe Tyr Leu Asn Val Asp Arg Val Ala Leu Ser

145 150 155 160

Ala Ser His Ala Thr Thr Ala Gly Tyr Ile Ile Leu Phe Pro Ser Leu

165 170 175

Leu Ala Ser Ile Leu Ile Leu Lys Ser Asp Phe Arg His Lys Thr Thr

180 185 190

Leu Tyr Thr Ile Asn Phe Met Leu Ser Leu Cys Ala Val Ile Val Thr

195 200 205

Glu Thr Arg Ala Ala Ile Leu Val Phe Pro Phe Phe Ala Leu Ile Leu

210 215 220

Ile Val Met Asp Ser Tyr Ile Asn Lys Arg Ile Asn Tyr Lys Leu Tyr

225 230 235 240

Cys Phe Ile Thr Ile Ala Leu Leu Ala Gly Val Phe Ser Phe Lys Asp

245 250 255

Thr Leu Leu Met Arg Met Asn Asp Leu Asn Asn Asp Leu Val Asn Tyr

260 265 270

Ser His Asp Asn Thr Arg Thr Ser Val Gly Ala Arg Leu Ala Met Tyr

275 280 285

Glu Val Gly Leu Lys Thr Tyr Ser Pro Ile Gly Gln Ser Leu Glu Lys

290 295 300

Arg Ala Glu Lys Ile His Glu Leu Glu Glu Lys Glu Pro Arg Leu Ser

305 310 315 320

Gly Ala Leu Pro Tyr Val Asp Ser His Leu His Asn Asp Leu Ile Asp

325 330 335

Thr Leu Ser Thr Arg Gly Ile Pro Gly Val Val Leu Thr Ile Leu Ala

340 345 350

Phe Ser Ala Ile Leu Ile Tyr Ala Leu Arg Thr Ala Lys Glu Pro Tyr

355 360 365

Ile Leu Ile Leu Leu Phe Ser Leu Leu Val Val Gly Leu Ser Asp Val

370 375 380

Ile Leu Phe Ser Lys Pro Val Pro Thr Ala Val Phe Ile Thr Ile Ile

385 390 395 400

Leu Leu Cys Ala Tyr Phe Lys Ala Gln Ser Asp Gln Cys Leu Leu Glu

405 410 415

Lys

<210> 17

<211> 1653

<212> DNA

<213> 人工

<220>

<223> 适用于在乙酰丁酸梭菌中表达的荧光素酶编码序列

<400> 17

atggaggatg caaagaatat taagaaaggt ccagctcctt tctacccttt agaagacgga 60

actgctggtg agcaattaca caaggcaatg aagaggtatg cattagtacc aggaactata 120

gcttttactg atgctcatat tgaagtaaat ataacatatg cagaatactt tgagatgtct 180

gtgaggcttg cagaagcaat gaaaagatat ggattaaata ctaaccacag gatagtggtt 240

tgttctgaaa acagcttaca attcttcatg ccagttcttg gagcattatt cattggagtt 300

gctgtggctc cagcaaatga catttacaac gagagggagt tgttaaattc aatgaatatt 360

agtcaaccta ctgtagtgtt cgtttctaag aagggacttc agaaaattct aaacgtgcaa 420

aaaaagctac caattattca aaagataata attatggact caaaaactga ttaccaagga 480

ttccagagca tgtatacttt tgttacatct catctaccac caggttttaa tgagtatgat 540

ttcgtgccag aaagctttga cagagataag acaatagctt tgattatgaa cagctcagga 600

tctacaggac tacctaaggg tgtggctcta cctcatagga ctgcttgcgt taggtttagt 660

catgcaaggg accctatatt tggaaatcaa attattcctg atactgcaat actatcagtt 720

gtaccatttc atcacggatt cggtatgttc acaacattgg gatatcttat atgcggtttt 780

agagtggtac ttatgtatag gttcgaggaa gaactttttt taaggagtct acaagactac 840

aaaatacaat cagcattgtt agtgccaaca ttatttagtt ttttcgctaa aagcacactt 900

atagataaat acgacttgtc taacctacac gaaatagcaa gcggtggagc tcctttatct 960

aaagaggtag gagaagctgt tgcaaaaaga ttccacttac ctggtataag acagggttat 1020

ggattgacag aaacaacatc agcaattttg attactccag agggagatga caagccaggt 1080

gctgtaggaa aggtggtacc attctttgaa gctaaagtag tagacttgga cacaggaaaa 1140

actctaggtg tgaatcagag aggagaactt tgcgtaaggg gaccaatgat aatgtcaggt 1200

tatgtaaata atccagaggc aacaaatgca cttatagata aagatggttg gttgcacagc 1260

ggagatatag cttactggga tgaggacgaa cattttttta ttgtggacag gcttaaaagt 1320

ttgattaaat acaaaggtta ccaggtggca ccagctgagc ttgaatctat attgcttcaa 1380

cacccaaata tttttgatgc tggtgtagca ggtcttcctg atgatgatgc aggagagctt 1440

ccagctgctg tagtagtatt agagcacgga aagacaatga cagaaaagga aatagtggac 1500

tacgttgcat ctcaggttac aactgcaaag aagctaaggg gaggtgttgt ttttgtagac 1560

gaagttccta aaggattgac aggaaagttg gacgctagga agattagaga gattctaata 1620

aaagctaaga agggtggtaa aagtaagtta tag 1653

<210> 18

<211> 3416

<212> DNA

<213> 人工

<220>

<223> 表达载体pJL1+荧光素酶密码子的核苷酸序列

适用于在乙酰丁酸梭菌中表达的序列

<400> 18

agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 60

aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 120

cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 180

agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 240

tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 300

gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 360

gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 420

ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 480

gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 540

ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 600

ggaaaaacgc cagcaacgcg atcccgcgaa attaatacga ctcactatag ggagaccaca 660

acggtttccc tctagaaata attttgttta actttaagaa ggagatatac atatggagga 720

tgcaaagaat attaagaaag gtccagctcc tttctaccct ttagaagacg gaactgctgg 780

tgagcaatta cacaaggcaa tgaagaggta tgcattagta ccaggaacta tagcttttac 840

tgatgctcat attgaagtaa atataacata tgcagaatac tttgagatgt ctgtgaggct 900

tgcagaagca atgaaaagat atggattaaa tactaaccac aggatagtgg tttgttctga 960

aaacagctta caattcttca tgccagttct tggagcatta ttcattggag ttgctgtggc 1020

tccagcaaat gacatttaca acgagaggga gttgttaaat tcaatgaata ttagtcaacc 1080

tactgtagtg ttcgtttcta agaagggact tcagaaaatt ctaaacgtgc aaaaaaagct 1140

accaattatt caaaagataa taattatgga ctcaaaaact gattaccaag gattccagag 1200

catgtatact tttgttacat ctcatctacc accaggtttt aatgagtatg atttcgtgcc 1260

agaaagcttt gacagagata agacaatagc tttgattatg aacagctcag gatctacagg 1320

actacctaag ggtgtggctc tacctcatag gactgcttgc gttaggttta gtcatgcaag 1380

ggaccctata tttggaaatc aaattattcc tgatactgca atactatcag ttgtaccatt 1440

tcatcacgga ttcggtatgt tcacaacatt gggatatctt atatgcggtt ttagagtggt 1500

acttatgtat aggttcgagg aagaactttt tttaaggagt ctacaagact acaaaataca 1560

atcagcattg ttagtgccaa cattatttag ttttttcgct aaaagcacac ttatagataa 1620

atacgacttg tctaacctac acgaaatagc aagcggtgga gctcctttat ctaaagaggt 1680

aggagaagct gttgcaaaaa gattccactt acctggtata agacagggtt atggattgac 1740

agaaacaaca tcagcaattt tgattactcc agagggagat gacaagccag gtgctgtagg 1800

aaaggtggta ccattctttg aagctaaagt agtagacttg gacacaggaa aaactctagg 1860

tgtgaatcag agaggagaac tttgcgtaag gggaccaatg ataatgtcag gttatgtaaa 1920

taatccagag gcaacaaatg cacttataga taaagatggt tggttgcaca gcggagatat 1980

agcttactgg gatgaggacg aacatttttt tattgtggac aggcttaaaa gtttgattaa 2040

atacaaaggt taccaggtgg caccagctga gcttgaatct atattgcttc aacacccaaa 2100

tatttttgat gctggtgtag caggtcttcc tgatgatgat gcaggagagc ttccagctgc 2160

tgtagtagta ttagagcacg gaaagacaat gacagaaaag gaaatagtgg actacgttgc 2220

atctcaggtt acaactgcaa agaagctaag gggaggtgtt gtttttgtag acgaagttcc 2280

taaaggattg acaggaaagt tggacgctag gaagattaga gagattctaa taaaagctaa 2340

gaagggtggt aaaagtaagt tataggtcga ccggctgcta acaaagcccg aaaggaagct 2400

gagttggctg ctgccaccgc tgagcaataa ctagcataac cccttggggc ctctaaacgg 2460

gtcttgaggg gttttttgct gaaagccaat tctgattaga aaaactcatc gagcatcaaa 2520

tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 2580

tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 2640

tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 2700

aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagc 2760

ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 2820

ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 2880

tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 2940

agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 3000

ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 3060

atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 3120

tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 3180

tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 3240

tataaatcag catccatgtt ggaatttaat cgcggcttcg agcaagacgt ttcccgttga 3300

atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 3360

gatgatatat ttttatcttg tgcaatgtaa catcagagat tttgagacac aacgtg 3416

<210> 19

<211> 1653

<212> DNA

<213> 人工

<220>

<223> 适用于在产乙醇梭菌中表达的荧光素酶密码子序列

<400> 19

atggaagatg caaaaaatat aaagaaagga ccagcaccat tctatccact tgaagacgga 60

acagcaggag aacagctaca taaagcaatg aaaagatatg cacttgtacc gggaacaata 120

gcttttactg atgctcacat agaagtaaac ataacctatg cggaatattt tgaaatgtca 180

gtaagattgg cagaggcaat gaaaagatat ggattaaata caaatcatag aatagtagtg 240

tgtagtgaaa acagcttgca gttttttatg cctgtacttg gtgctttatt cataggtgta 300

gcagtagcac cagctaatga tatttataat gaacgtgagc ttttaaattc tatgaatata 360

agtcagccaa ctgtagtatt tgtttcaaag aaaggtttgc agaagatttt gaatgttcaa 420

aagaaattgc ctataattca aaaaataata attatggatt ctaagacaga ttatcaggga 480

ttccagtcta tgtatacatt cgtaacatct catcttcccc cgggatttaa tgaatatgac 540

ttcgtacctg aatcctttga tagagataag acaatagctt taatcatgaa tagttcagga 600

agcacaggac ttcctaaagg tgtggcactt ccacatagaa ctgcttgtgt tagattctct 660

catgctagag atccaatttt tggaaatcaa ataattccag atacagcaat actaagtgta 720

gtaccattcc atcatggatt tgggatgttt acaactcttg gatatttaat ttgtggtttt 780

agagttgtat taatgtatag atttgaggaa gaactcttcc ttcgttcact acaagactat 840

aagatacaat ctgctttact tgtaccaact ttattttcat tttttgctaa gagtactctt 900

atagataaat atgatttaag caacctgcat gaaatagcat caggcggcgc tccactatct 960

aaggaagttg gagaagctgt tgctaaaaga ttccacttac caggaatcag gcagggatat 1020

ggacttacag aaacaacttc agcaattctt attacacctg aaggagatga caagcctgga 1080

gcagtaggta aagtggtacc attctttgaa gctaaagtag tagatttaga tacaggaaaa 1140

acattgggag ttaaccagag aggagagctg tgtgtaagag gacctatgat aatgagtgga 1200

tatgtaaata atccagaagc cactaatgca ttaatagata aggatggatg gctgcattct 1260

ggtgatatag catattggga tgaagatgaa cattttttta ttgtagatag actaaaatcc 1320

ctaataaaat ataagggata ccaggtagct ccagcagaat tagaatcaat acttctgcag 1380

catccaaaca tatttgatgc aggagtagct ggattaccag atgatgatgc aggagaactt 1440

cctgctgcag tagttgtttt agagcatggc aaaactatga ctgaaaaaga gatagttgac 1500

tatgttgcaa gtcaggttac tacagcaaag aaattgagag gcggcgtagt attcgtagat 1560

gaggttccaa aaggtcttac aggaaaattg gatgcaagaa aaatacgtga aatacttata 1620

aaggcaaaga agggcggcaa atcaaaatta taa 1653

<210> 20

<211> 1653

<212> DNA

<213> 人工

<220>

<223> 适用于在大肠杆菌中表达的荧光素酶编码序列

<400> 20

atggaagacg ccaaaaacat aaagaaaggc ccggctccat tctatccgct agaggatgga 60

accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120

gcttttacag atgcacatat cgaggtgaac atcacgtacg cggaatactt cgaaatgtcc 180

gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240

tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300

gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgaacatt 360

tcgcagccta ccgtagtgtt tgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420

aaaaaattac caataatcca gaaaattatt atcatggatt ctaaaacgga ttaccaggga 480

tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540

tttgtaccag agtcctttga tcgtgacaaa acaattgcac tgataatgaa ctcctctgga 600

tctactgggt tacctaaggg tgtggccctt ccgcatagaa ctgcctgcgt cagattctcg 660

catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720

gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780

cgagtcgtct taatgtatag atttgaagaa gagctgtttt tacgatccct tcaggattac 840

aaaattcaaa gtgcgttgct agtaccaacc ctattttcat tcttcgccaa aagcactctg 900

attgacaaat acgatttatc taatttacac gaaattgctt ctgggggcgc acctctttcg 960

aaagaagtcg gggaagcggt tgcaaaacgc ttccatcttc cagggatacg acaaggatat 1020

gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080

gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140

acgctgggcg ttaatcagag aggcgaatta tgtgtcagag gacctatgat tatgtccggt 1200

tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260

ggagacatag cttactggga cgaagacgaa cacttcttca tagttgaccg cttgaagtct 1320

ttaattaaat acaaaggata ccaggtggcc cccgctgaat tggagtcgat attgttacaa 1380

caccccaaca tcttcgacgc gggcgtggca ggtcttcccg acgatgacgc cggtgaactt 1440

cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat 1500

tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac 1560

gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata 1620

aaggccaaga agggcggaaa gtccaaattg taa 1653

<210> 21

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物- pJL1线性F

<400> 21

ctgagatacc tacagcgtga gc 22

<210> 22

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 引物- pJL1线性R

<400> 22

cgtcactcat ggtgatttct cacttg 26

<210> 23

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 引物- PS_pJL1线性F

<400> 23

ccgaactgag atacctacag cgtgagc 27

<210> 24

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物- PS_pJL1线性R

<400> 24

tcagtcgtca ctcatggtga tttctcactt g 31

<210> 25

<211> 488

<212> DNA

<213> 产乙醇梭菌

<220>

<221> misc_feature

<222> (1)..(488)

<223> 磷酸转乙酰酶-乙酸激酶操纵子(pPta-Ack;

CAETHG_RS16490)启动子

<400> 25

ggccgcaata tgatatttat gtccattgtg aaagggatta tattcaacta ttattccagt 60

tacgttcata gaaattttcc tttctaaaat attttattcc atgtcaagaa ctctgtttat 120

ttcattaaag aactataagt acaaagtata aggcatttga aaaaataggc tagtatattg 180

attgattatt tattttaaaa tgcctaagtg aaatatatac atattataac aataaaataa 240

gtattagtgt aggattttta aatagagtat ctattttcag attaaatttt tgattatttg 300

atttacatta tataatattg agtaaagtat tgactagcaa aattttttga tactttaatt 360

tgtgaaattt cttatcaaaa gttatatttt tgaataattt ttattgaaaa atacaactaa 420

aaaggattat agtataagtg tgtgtaattt tgtgttaaat ttaaagggag gaaatgaaca 480

tgaaacat 488

<210> 26

<211> 475

<212> DNA

<213> 产乙醇梭菌

<220>

<221> misc_feature

<222> (1)..(475)

<223> 丙酮酸:甲酸氧化还原酶(pPFOR;CAETHG_RS14890)启动子

<400> 26

gcaaaatagt tgataataat gcagagttat aaacaaaggt gaaaagcatt acttgtattc 60

ttttttatat attattataa attaaaatga agctgtatta gaaaaaatac acacctgtaa 120

tataaaattt taaattaatt tttaattttt tcaaaatgta ttttacatgt ttagaatttt 180

gatgtatatt aaaatagtag aatacataag atacttaatt taattaaaga tagttaagta 240

cttttcaatg tgctttttta gatgtttaat acaaatcttt aattgtaaaa gaaatgctgt 300

actatttact gtactagtga cgggattaaa ctgtattaat tataaataaa aaataagtac 360

agttgtttaa aattatattt tgtattaaat ctaatagtac gatgtaagtt attttatact 420

attgctagtt taataaaaag atttaattat atacttgaaa aggagaggaa tccat 475

<210> 27

<211> 558

<212> DNA

<213> 产乙醇梭菌

<220>

<221> misc_feature

<222> (1)..(558)

<223> Wood-Ljungdahl 簇(pWL;CAETHG_RS07860)启动子

<400> 27

agatagtcat aatagttcca gaatagttca atttagaaat tagactaaac ttcaaaatgt 60

ttgttaaata tataccaaac tagtatagat attttttaaa tactggactt aaacagtagt 120

aatttgccta aaaaattttt tcaatttttt ttaaaaaatc cttttcaagt tgtacattgt 180

tatggtaata tgtaattgaa gaagttatgt agtaatattg taaacgtttc ttgatttttt 240

tacatccatg tagtgcttaa aaaaccaaaa tatgtcacat gcaattgtat atttcaaata 300

acaatattta ttttctcgtt aaattcacaa ataatttatt aataatatca ataaccaaga 360

ttatacttaa atggatgttt attttttaac acttttatag taaatatatt tattttatgt 420

agtaaaaagg ttataattat aattgtattt attacaatta attaaaataa aaaatagggt 480

tttaggtaaa attaagttat tttaagaagt aattacaata aaaattgaag ttatttcttt 540

aaggagggaa ttattcat 558

<210> 28

<211> 239

<212> PRT

<213> 产乙醇梭菌

<220>

<221> MISC_FEATURE

<222> (1)..(239)

<223> 代谢基因:乙酰乳酸脱羧酶(CAETHG_RS14410)

<400> 28

Met Asp Asp Glu Val Lys Val Pro Asn His Ile Tyr Gln Met Ser Thr

1 5 10 15

Ile Asn Ala Leu Val Ser Gly Leu Tyr Asp Gly Cys Val Ser Leu Ser

20 25 30

Lys Leu Leu Lys Lys Gly Asn Phe Gly Ile Gly Thr Phe Lys Gly Leu

35 40 45

Asp Gly Glu Leu Thr Leu Leu Asn Gly Thr Phe Tyr Arg Thr Lys Pro

50 55 60

Asp Gly Ser Val Tyr Val Cys Ser Lys Asn Val Ser Val Pro Phe Ala

65 70 75 80

Val Val Thr Glu Leu Glu Asn Tyr Asn Thr Tyr Asn Ile Gln Asn Arg

85 90 95

Thr Ser Tyr Glu Asp Ile Arg Lys Glu Leu Asp Ser Phe Ile Glu Ser

100 105 110

Lys Asn Ile Phe Tyr Ala Phe Tyr Met Glu Gly Lys Phe Asn Tyr Val

115 120 125

Lys Thr Arg Thr Val Val Lys Gln Asn Met Pro Tyr Lys Pro Met Ala

130 135 140

Glu Val Val Lys Asp Gln Pro Met Phe Glu Tyr Asn Gly Val Asp Gly

145 150 155 160

Tyr Val Val Gly Phe Arg Cys Pro Asp Tyr Val Glu Gly Leu Asn Val

165 170 175

Pro Gly Tyr His Phe His Phe Ile Asn Lys Asp Lys Lys Phe Gly Gly

180 185 190

His Ile Ser Glu Phe Ser Ile Glu Asn Ala Lys Val Tyr Val Gln Asn

195 200 205

Cys Ser Cys Phe Arg Met Glu Leu Pro Lys Asn Glu Ser Phe Tyr Asn

210 215 220

Met Glu Val Gln Asp Arg Asn Asp Glu Ile Thr Ser Val Glu Lys

225 230 235

<210> 29

<211> 556

<212> PRT

<213> 产乙醇梭菌

<220>

<221> MISC_FEATURE

<222> (1)..(556)

<223> 代谢基因:乙酰乳酸合酶(CAETHG_RS08420)

<400> 29

Met Asn Arg Asp Ile Lys Lys Glu Val Gln Leu Asn Thr Ala Gln Met

1 5 10 15

Leu Val Lys Cys Leu Glu Ala Glu Gly Val Lys Tyr Ile Phe Gly Ile

20 25 30

Pro Gly Glu Glu Asn Leu Glu Ile Met Asn Ala Ile Ser Asp Ser Thr

35 40 45

Ile Glu Phe Ile Thr Thr Arg His Glu Gln Gly Ala Ala Phe Met Ala

50 55 60

Asp Val Tyr Gly Arg Leu Thr Gly Lys Ala Gly Val Cys Leu Ser Thr

65 70 75 80

Leu Gly Pro Gly Ala Thr Asn Leu Val Thr Gly Val Ala Asp Ala Asp

85 90 95

Ser Asp Gly Ala Pro Val Val Ala Ile Thr Gly Gln Val Gly Thr Glu

100 105 110

Arg Met His Ile Thr Ser His Gln Phe Leu Asp Leu Cys Lys Met Phe

115 120 125

Glu Pro Ile Thr Lys Arg Ser Lys Gln Ile Val Arg Pro Asp Thr Val

130 135 140

Ser Glu Ile Ile Arg Leu Val Phe Lys Tyr Ala Glu Ser Glu Lys Pro

145 150 155 160

Gly Ala Cys His Ile Asp Leu Pro Val Asn Ile Ala Lys Met Pro Val

165 170 175

Gly Ala Leu Glu Lys Pro Leu Glu Lys Lys Ile Pro Pro Lys Glu His

180 185 190

Ala Asp Leu Ser Thr Ile Glu Glu Ala Ala Ser Glu Ile Phe Lys Ala

195 200 205

Lys Asn Pro Ile Ile Leu Ala Gly Ser Gly Ala Ile Arg Gly Asn Ser

210 215 220

Ser Lys Ala Val Thr Glu Phe Ala Thr Lys Leu Lys Ile Pro Val Ile

225 230 235 240

Asn Thr Met Met Ala Lys Gly Ile Ile Pro Met Asp Asn Lys Tyr Ser

245 250 255

Met Trp Thr Ile Gly Ile Pro Gln Lys Asp Tyr Val Asn Lys Ile Ile

260 265 270

Glu Glu Ala Asp Leu Val Ile Thr Ile Gly Tyr Asp Ile Val Glu Tyr

275 280 285

Ala Pro Ser Lys Trp Asn Ile Asn Gly Asp Ile Lys Ile Val His Ile

290 295 300

Asp Ala Arg Pro Ser His Ile Asn Lys Leu Tyr Gln Pro Ile Val Glu

305 310 315 320

Val Val Gly Asp Ile Ser Asp Ala Leu Tyr Asn Ile Leu Arg Arg Thr

325 330 335

Ser Ser Lys Asp Glu Pro Val Lys Ala Leu Glu Ile Lys Ser Glu Met

340 345 350

Leu Ala Glu His Glu Ser Tyr Ala Asn Asp Asn Ala Phe Pro Met Lys

355 360 365

Pro Gln Arg Ile Leu Asn Asp Val Arg Lys Val Met Gly Pro His Asp

370 375 380

Ile Val Ile Ser Asp Val Gly Ala His Lys Met Trp Ile Ala Arg His

385 390 395 400

Tyr Asn Cys Tyr Glu Pro Asn Thr Cys Ile Ile Ser Asn Gly Phe Ala

405 410 415

Thr Met Gly Ile Gly Val Pro Gly Ala Ile Ala Ala Lys Leu Ile Asn

420 425 430

Pro Asp Lys Lys Val Leu Ala Ile Val Gly Asp Gly Gly Phe Met Met

435 440 445

Asn Asn Gln Glu Leu Glu Thr Ala Leu Arg Ile Lys Thr Pro Ile Val

450 455 460

Val Leu Ile Phe Asn Asp Ser Asn Tyr Gly Leu Ile Lys Trp Lys Gln

465 470 475 480

Glu Glu His Tyr Gly Lys Ser Cys Tyr Val Asp Phe Thr Asn Pro Asp

485 490 495

Phe Val Lys Leu Ala Glu Ser Met Tyr Ala Lys Gly Tyr Arg Val Glu

500 505 510

Lys Ala Glu Asp Leu Ile Pro Thr Leu Glu Glu Ala Phe Lys Gln Asn

515 520 525

Val Pro Ala Val Ile Asp Cys Gln Val Asp Tyr Gly Glu Asn Ile Lys

530 535 540

Leu Thr Lys His Leu Lys Glu Val Tyr Glu Asn Met

545 550 555

<210> 30

<211> 351

<212> PRT

<213> 产乙醇梭菌

<220>

<221> MISC_FEATURE

<222> (1)..(351)

<223> 代谢基因:初级:二级乙醇脱氢酶

(CAETHG_RS02620)

<400> 30

Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu

1 5 10 15

Lys Lys Asn Pro Val Pro Gly Pro Tyr Asp Ala Ile Val His Pro Leu

20 25 30

Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala

35 40 45

Leu Gly Asn Arg Glu Asn Met Ile Leu Gly His Glu Ala Val Gly Glu

50 55 60

Ile Ala Glu Val Gly Ser Glu Val Lys Asp Phe Lys Val Gly Asp Arg

65 70 75 80

Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln

85 90 95

Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe

100 105 110

Ser Asn Phe Lys Asp Gly Val Phe Ala Asp Tyr Phe His Val Asn Asp

115 120 125

Ala Asp Met Asn Leu Ala Ile Leu Pro Asp Glu Ile Pro Leu Glu Ser

130 135 140

Ala Val Met Met Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu

145 150 155 160

Leu Ala Asp Ile Lys Met Gly Ser Ser Val Val Val Ile Gly Ile Gly

165 170 175

Ala Val Gly Leu Met Gly Ile Ala Gly Ser Lys Leu Arg Gly Ala Gly

180 185 190

Arg Ile Ile Gly Val Gly Ser Arg Pro Val Cys Val Glu Thr Ala Lys

195 200 205

Phe Tyr Gly Ala Thr Asp Ile Val Asn Tyr Lys Asn Gly Asp Ile Val

210 215 220

Glu Gln Ile Met Asp Leu Thr His Gly Lys Gly Val Asp Arg Val Ile

225 230 235 240

Met Ala Gly Gly Gly Ala Glu Thr Leu Ala Gln Ala Val Thr Met Val

245 250 255

Lys Pro Gly Gly Val Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp

260 265 270

Thr Leu Pro Ile Pro Arg Val Gln Trp Gly Cys Gly Met Ala His Lys

275 280 285

Thr Ile Arg Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Met Glu Met

290 295 300

Leu Arg Asp Leu Val Leu Tyr Lys Arg Val Asp Leu Ser Lys Leu Val

305 310 315 320

Thr His Val Phe Asp Gly Ala Glu Asn Ile Glu Lys Ala Leu Leu Leu

325 330 335

Met Lys Asn Lys Pro Lys Asp Leu Ile Lys Ser Val Val Thr Phe

340 345 350

114页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:改进的核酸扩增

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!