来源于梭菌属提取物的无细胞蛋白质合成平台
阅读说明:本技术 来源于梭菌属提取物的无细胞蛋白质合成平台 (Cell-free protein synthesis platform derived from Clostridium extract ) 是由 M·C·朱厄特 A·克鲁格-格里克 A·P·穆勒 M·科普克 于 2020-02-25 设计创作,主要内容包括:公开了用于进行无细胞RNA转录和/或无细胞蛋白质合成(CFPS)的组合物、方法和试剂盒。所公开的组合物、方法和试剂盒包括或利用从梭菌属物种制备的组分,例如来自产乙醇梭菌的细胞提取物。(Compositions, methods, and kits for performing cell-free RNA transcription and/or cell-free protein synthesis (CFPS) are disclosed. The disclosed compositions, methods, and kits include or utilize components prepared from clostridium species, such as cell extracts from clostridium autoethanogenum.)
关于联邦资助的研究或开发的声明
本发明是根据美国能源部授予的SC0018249在政府支持下进行的。政府对本发明享有一定的权利。
相关申请的交叉引用
本申请根据35U.S.C§119(e)要求于2019年2月25日提交的美国临时申请62/810,014号的优先权,其内容通过引用整体并入本文。
背景技术
本发明通常涉及用于进行无细胞RNA转录和/或无细胞蛋白质合成(CFPS)的组合物、方法和试剂盒。更具体地,本发明涉及用于进行无细胞RNA转录和/或进行无细胞蛋白质合成(CFPS)的组合物、方法和试剂盒,其包括或利用从梭菌属,包括产乙醇梭菌的天然存在或重组物种制备的组分。
梭菌属是一类厚壁菌门,包括梭菌和其他类似的属。梭菌属是气体和废物发酵厌氧细菌,具有非凡的生物制造潜力(例如燃料和化学品生产)。(例如参见Tracy等,“Clostridia:the importance of their exceptional substrate and metabolitediversity for biofuel and biorefinery application.”Curr.Opin.Biotechno.2012Jun;23(3):364-81;其全部内容通过引用整体并入本文)。梭菌属还具有广泛的医学应用(例如生产用于临床应用的胶原酶或肉毒杆菌毒素),并且最近开发来自梭菌属的首批天然产品(例如用作抗生素或作物保护剂)。(例如参见Schiel等,“Clostridium:Encyclopediaof Industrial Biotechnology:Bioprocess,Bioseparation,and Cell Technology,2010;和Pidot等,“Discovery of clostrubin,and exceptional polyphenolicpolyketide antibiotic from a strictly anaerobic bacterium,”Angew.Chem.Int.Ed.Engl.2014Jul 21;53(30):7856-9;其内容通过引用整体并入本文)。尽管梭菌属已在工业上使用100多年,但当前的菌株工程技术仍然具有低通量、劳动密集型和耗时的挑战。菌株工程的具体挑战包括生物体特定的遗传限制、厌氧环境的要求,以及在产乙酸菌的情况下,气体的处理。因此,梭菌属生物技术的发展和梭菌属生物学的基础知识远远落后于需氧原核和真核生物的成就。
在这里,发明人提出第一个源自厌氧细菌产乙醇梭菌的无细胞蛋白质合成(CFPS)平台。发明人的平台可用于在体内实施之前对梭菌属遗传部分和代谢途径进行高通量原型设计,以及高价值产品的无细胞生物制造。发明人已经开发一系列用于用不同菌株以分批和连续模式进行细胞生长的方案。本发明人已经优化可用于原型设计和生物制造目的的提取物制备、CFPS反应组分和CFPS反应条件。发明人的优化系统能够产生高达90μg/ml的荧光素酶报告蛋白,可以使用标准实验室设备通过发光测量以高通量检测该蛋白,并提供合适的动态范围以开始确定遗传部分库中的细微差别。
发明内容
公开用于进行无细胞RNA转录和/或进行无细胞蛋白质合成(CFPS)的组合物、方法、试剂盒和组分。所公开的组合物、方法和试剂盒包括或利用从梭菌属,包括产乙醇梭菌的天然存在的或重组的物种制备的组分。此外,所公开的组合物、方法、试剂盒及其组分可用于在体内实施原型梭菌属遗传部分和代谢途径之前,体外对梭菌属遗传部分和代谢途径进行高通量原型设计,例如在梭菌细胞中。所公开的组合物、方法、试剂盒及其组分还可用于在无细胞系统中体外或体内生物制造高价值产品。
附图说明
图1提供一个简单、稳健且高产的无细胞梭菌属平台的示意图,该平台促进无细胞合成生物学应用,例如生物产品的生产、遗传部分的原型设计和代谢途径性能。从由梭菌属培养物中收集的细胞沉淀开始,我们最初通过测试不同的超声处理、径流和透析条件来优化提取物的制备和加工。在第二步中,我们调整CFPS反应中关键组分的浓度以进一步最大化蛋白质产量。然后使用这种优化的CFPS系统来证明系统对梭菌属遗传部分和代谢途径进行原型设计的能力。
图2产乙醇梭菌衍生的CFPS需要与大肠杆菌衍生的CFPS不同的条件。(A)使用大肠杆菌条件进行提取物制备/加工和CFPS反应,在产乙醇梭菌提取物中测定荧光素酶表达。(A,左图和中图)分别是提取物制备和加工步骤以及CFPS反应关键组分的简化示意图。(A,右图)在8mM Mg(Glu)2的CFPS期间,产乙醇梭菌提取物中的荧光素酶表达。(B)CFPS在不同Mg(Glu)2浓度下的最大荧光素酶表达。箭头表示优化条件。产乙醇梭菌细胞沉淀重悬在S30缓冲液中,通过在640J下超声裂解,在12,000xg下离心澄清,并用于含有(A)中的指定浓度的关键组分的CFPS。荧光素酶表达通过生物发光测定。PEP:磷酸烯醇式丙酮酸;AAs:氨基酸;NAD+:还原型烟酰胺腺嘌呤二核苷酸;CoA:辅酶A。数据表示为至少三个独立反应的平均值±s.d.。
图3产乙醇梭菌提取物制备和加工的优化。(A)提取物制备工作流程示意图。(B-D)从产乙醇梭菌提取物在4.25h CFPS期间体外相对最大荧光素酶发光,使用(B)指示的超声输入能量,(C)350J超声输入能量和指示的径流时间,以及(D)不用(每组中的第一条)和用透析的350J超声输入能量制备。对于B和C,带有一个(*)或两个(**)的条形分别表示先前和新优化的条件。荧光素酶表达通过生物发光测定并绘制为与先前使用条件的最大荧光素酶表达相比的相对值。数据表示为三个独立反应的平均值±s.d.。
图4优化产乙醇梭菌提取物的CFPS反应条件。(A)CFPS反应示意图,描绘关键CFPS组分的浓度,这些组分针对基于产乙醇梭菌提取物的CFPS进行逐步调整。(B-H)在不同试剂浓度的CFPS期间,产乙醇梭菌提取物体外的相对最大荧光素酶发光:(B)能量再生系统,(C)PEP浓度,(D)氨基酸浓度,(E)烟酰胺二核苷酸和辅酶A辅因子组成,(F)质粒DNA模板浓度。带有一个*或两个**的条形分别表示先前和新优化的条件。最大荧光素酶表达通过生物发光确定,并绘制为与先前使用的条件(BE)相比的相对值,或使用荧光素酶标准曲线(F)转换为蛋白质产量。AA:氨基酸,AcP:乙酰磷酸激酶,AcK:乙酰磷酸激酶,PEP:磷酸烯醇丙酮酸,PyK:丙酮酸激酶。数据表示为至少三个独立反应的平均值±s.d.。
图5产乙醇梭菌CFPS促进梭菌属代谢工程的原型应用。(A)使用产乙醇梭菌CFPS测试原型应用的示意图。(B)左图:来自含有天然产乙醇梭菌启动子和产乙醇梭菌适应编码序列的质粒DNA模板的荧光素酶表达。右图:来自PCR产物模板的荧光素酶表达,该模板包含适用于两种不同梭菌属物种,丙酮丁醇梭菌(Cac)和产乙醇梭菌(Cae),以及需氧细菌大肠杆菌(Eco)的编码序列。CFPS使用优化的条件进行。最大荧光素酶表达通过生物发光确定并且绘制为通过使用荧光素酶标准曲线确定的荧光素酶产量(左图),或作为与产乙醇梭菌适应的编码序列(右图)相比的相对值。数据表示为至少三个独立反应的平均值±s.d.。(C)产乙醇梭菌CFPS中重组天然代谢酶全长表达的放射自显影。除了所有20种标准氨基酸外,CFPS反应使用优化的条件和放射性14C-亮氨酸(10μM)进行。在CFPS后,将4μl CFPS反应用于SDS-PAGE。将凝胶干燥并在储存荧光屏上暴露14天。该图像与包含蛋白质标准梯的染色图像进行数字比较以确定合成蛋白质的长度。w和s:分别为整体和可溶部分。(D)产乙醇梭菌提取物中CFPS反应期间广义碳通量的示意图。(E、F、G、H)在用或不用45mM PEP的CFPS期间代谢物浓度的变化,如浅灰色或黑色所示,分别由GC-MS确定。数据表示为四个独立反应的平均值±s.d。
图6提供显示A)寡核苷酸序列的表,其中“*”表示硫代磷酸酯(PS)键(即,硫原子取代寡核苷酸磷酸骨架中的非桥连氧)。pJL1线性F(SEQ ID NO:21);pJL1线性R(SEQ ID NO:22);PS_pJL1线性F(SEQ ID NOL:23);和PS_pJL1线性R(SEQ ID NO:24)。B)示例性优化的CFPS反应条件。
图7温度对产乙醇梭菌提取物的CFPS的影响。在不同反应温度下CFPS中荧光素酶的相对表达。产乙醇梭菌细胞沉淀重悬在S30缓冲液中,在350J下超声裂解,通过在12,000xg下离心澄清,在4℃下对S30缓冲液透析3次45分钟,再次通过12,000xg离心澄清并在指示温度下用于CFPS。荧光素酶表达通过生物发光测定并绘制为与30℃下最大荧光素酶表达相比的相对值。顶线表示最佳条件。数据表示为三个独立反应的平均值±s.d.。
图8磷酸烯醇式丙酮酸(PEP)对产乙醇梭菌提取物的CFPS的影响。在丙酮酸激酶(PyK)存在下,在CFPS期间(A)在不同浓度的PEP下和(B)在不同浓度的PEP下的最大荧光素酶表达。CFPS在30℃下用指定的PEP浓度进行。荧光素酶表达通过生物发光测定。带有一个*或两个**的条形分别表示以前使用的和新优化的条件。数据表示为三个独立反应的平均值±s.d.。
图9在产乙醇梭菌提取物的CFPS 1小时后施用第二种氨基酸(AA)的影响。不同AA施用方案下的相对荧光素酶表达。CFPS用45mM PEP进行,并在CFPS 1小时后一次或第二次指示AA浓度。荧光素酶表达通过生物发光测定并绘制为与先前使用的条件相比的相对值。带有一个*或两个**的条形分别表示以前使用的和新优化的条件。数据表示为三个独立反应的平均值±s.d.。
图10提取物量和氧气利用率对产乙醇梭菌提取物的CFPS的影响。(A)CFPS反应中的相对荧光素酶表达,每微升CFPS反应中含有不同量的提取物。CFPS反应设置为40μl分批反应。(B)在1.5ml反应管中以指定体积设置的CFPS分批反应中的相对荧光素酶表达。荧光素酶表达通过生物发光测定并绘制为与先前使用的条件的荧光素酶表达相比的相对值(带*的条形图)。数据表示为三个独立反应的平均值±s.d.。
图11DNA模板类型和浓度对产乙醇梭菌提取物的CFPS的影响。CFPS反应中的相对荧光素酶表达包含(A)不同的DNA模板类型、不同浓度的(B)质粒DNA和(C)线性DNA。质粒DNA进行中段制备,并通过乙醇沉淀进行额外净化。线性模板通过PCR制备,并使用PCR纯化试剂盒和额外的乙醇沉淀进行清洗。荧光素酶表达通过生物发光测定并绘制为与先前使用的条件的荧光素酶表达相比的相对值(带一个*的条形图)。“线性+PS”表示含有硫代磷酸化5'末端修饰的线性DNA模板。带有两个**的条形表示新优化的条件。数据表示为三个独立反应的平均值±s.d.。
图12产乙醇梭菌CFPS的开发和优化总结。显示产乙醇梭菌CFPS中荧光素酶表达产量的逐步和累积改善。提取物制备&加工:提取物制备和加工;数据表示为至少三个独立反应的平均值±s.d.。条从左到右:1)起始材料;2)Mg(Glu)2浓度;3)提取物制备&加工;4)CFPS条件;5)反应模式。
图13三种不同荧光素酶编码序列的分析。(A)由RBS计算器确定的预测翻译率(Salis等,2009)。(B)荧光素酶编码序列的GC含量。
图14提供以下示例性生物学序列:1)启动子和5'UTR:磷酸转乙酰酶-乙酸激酶操纵子(pPta-Ack;CAETHG_RS16490)(SEQ ID NO:25);丙酮酸:甲酸氧化还原酶(pPFOR;CAETHG_RS14890)启动子(SEQ ID NO:26);和Wood-Ljungdahl簇(pWL;CAETHG_RS07860)启动子(SEQ ID NO:27)。2)萤光素酶编码序列:适用于在丙酮丁醇梭菌中表达的萤光素酶编码序列(SEQ ID NO:17);适用于在产乙醇梭菌中表达的荧光素酶编码序列(SEQ ID NO:19),以及适用于在大肠杆菌中表达的荧光素酶编码序列(SEQ ID NO:20);3)产乙醇梭菌代谢基因:乙酰乳酸脱羧酶(CAETHG_RS14410)(SEQ ID NO:28);乙酰乳酸合酶(CAETHG_RS08420)(SEQ ID NO:29);和初级:二级醇脱氢酶(CAETHG_RS02620)(SEQ ID NO:30)。
图15原型代谢途径的能力。(A)产乙醇梭菌体内代谢的示意图,突出原型(丙酮酸三步转化为2,3-丁二醇(2,3-BDO))的示例靶途径。(B)在产乙醇梭菌CFPS中2,3-BDO合成途径的重组天然代谢酶(乙酰乳酸合酶(AcLacS;六边形)、乙酰乳酸脱羧酶(ACLacDC;半圆)、仲醇脱氢酶(SecAlcDH;第一个三角形)、2,3-丁二醇脱氢酶(BDODH;黄色三角形))以及荧光素酶和纳米荧光素酶(NLuc)的表达。除了所有20种标准氨基酸外,CFPS反应使用优化的条件和放射性14C-亮氨酸(10μM)进行。然后使用三氯乙酸沉淀放射性标记的蛋白质样品,并通过液体闪烁测量它们的放射性计数。(C)在2,3-BDO合成途径的天然代谢酶的3h CFPS之前和后CFPS反应中的2,3-BDO、乙酸盐、乙醇(EtOH)和乳酸产生。使用HPLC,代谢物浓度是根据已知浓度的标准品的色谱峰面积计算的。
具体实施方式
定义和术语
可以使用如下定义和术语进一步描述所公开的主题。本文中使用的定义和术语仅用于描述具体实施方案的目的,并不旨在进行限制。
如在本说明书和权利要求书中使用,单数形式“一个”、“一种”和“该”包括复数形式,除非上下文另有明确规定。例如,除非上下文另有明确规定,否则术语“一个组分”应被解释为表示“一个或多个组分”。如本文所用,术语“多个”是指“两个或更多个”。
如本文所用,“大约”、“约”、“基本上”和“显著”将被本领域普通技术人员理解并且将在它们使用的上下文中在一定程度上变化。如果考虑到使用它的上下文,该术语的使用对于本领域的普通技术人员来说是不清楚的,“大约”和“约”将表示高达特定术语的正负10%并且“基本上”和“显著”将表示超过特定术语的正负10%。
如本文所用,术语“包括(include)”和“包括(including)”与术语“包含(comprise)”和“包含(comprising)”具有相同的含义。术语“包含(comprise)”和“包含(comprising)”应被解释为“开放式”过渡性术语,允许进一步包括在权利要求中陈述的那些组分外的附加组分。术语“由……组成(consist)”和“由……组成(consisting of)”应被解释为“封闭式”过渡性术语,不允许包括除权利要求中记载的组分外的附加组分。术语“基本上由……组成”应被解释为部分封闭并且仅允许包含不会从根本上改变要求保护的主题的性质的附加组分。
短语“例如”应解释为“例如,包括”。此外,任何和所有示例性语言的使用,包括但不限于“例如”,仅意在更好地阐明本发明,并且除非另有声明,否则不对本发明的范围构成限制。
此外,在使用其中类似于“A、B和C等中的至少一个”的约定的那些情况下,通常这样的构造意在本领域普通技术人员将理解约定的含义中(例如,“具有A、B和C中的至少一个的系统”将包括但不限于具有单独A、单独B、单独C、A和B一起、A和C一起、B和C一起和/或A、B和C一起的系统。)。本领域技术人员将进一步理解,实际上任何呈现两个或多个替代术语的分离词和/或短语,无论是在说明书或附图中,都应该被理解为考虑包括术语之一、任一术语或两个术语的可能性。例如,短语“A或B”将被理解为包括“A”或“B”或“A和B”的可能性。
诸如“至多”、“至少”、“大于”、“小于”等的所有语言都包括所列举的数字并且指的是随后可以分解为如上所述的子范围的范围。
范围包括每个单独的成员。因此,例如,具有1-3个成员的组是指具有1、2或3个成员的组。同理,6个成员的组是指1个、2个、3个、4个、6个成员等的组。
情态动词“可以”是指在几个所描述的实施方案或其中包含的特征中的一个或多个选项或选择的优选使用或选择。当没有公开关于具体实施方案或其中包含的特征的选项或选择时,情态动词“可以”是指关于如何制作或使用所描述的实施方案或其中包含的特征的方面的肯定行为,或使用关于所描述的实施方案或其中包含的特征的特定技能的最终决定。在后一种情况下,情态动词“可以”与助动词“能”具有相同的含义和内涵。
多核苷酸和合成方法
所公开的方法、设备、试剂盒和组分可以利用和/或包括多核苷酸。术语“多核苷酸”、“多核苷酸序列”、“核酸”和“核酸序列”是指核苷酸、寡核苷酸、多核苷酸(这些术语可以互换使用)或其任何片段。这些短语也指基因组、天然或合成来源的DNA或RNA(可以是单链或双链,可以代表有义链或反义链)。
如本文所用,术语“核酸”和“寡核苷酸”是指聚脱氧核糖核苷酸(包含2-脱氧-D-核糖)、多聚核糖核苷酸(包含D-核糖),以及任何其他类型的多核苷酸,其为N糖苷嘌呤或嘧啶碱基。术语“核酸”、“寡核苷酸”和“多核苷酸”之间在长度上没有有意的区别,这些术语将互换使用。这些术语仅指分子的一级结构。因此,这些术语包括双链和单链DNA,以及双链和单链RNA。为了在本方法中使用,寡核苷酸还可以包括其中碱基、糖或磷酸骨架被修饰的核苷酸类似物以及非嘌呤或非嘧啶核苷酸类似物。
关于多核苷酸序列,术语“同一性百分比”和“%同一性”是指使用标准化算法比对的至少两个多核苷酸序列之间的残基匹配百分比。这样的算法可以以标准化和可重复的方式在被比较的序列中插入间隙以优化两个序列之间的比对,并因此实现两个序列的更有意义的比较。核酸序列的百分比同一性可以如本领域所理解的那样确定。(例如参见美国专利号7,396,664,其通过引用整体并入本文)。国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLAST)提供一套常用且可免费获得的序列比较算法,该工具可从多个来源在其网站获得,包括马里兰州贝塞斯达NCBI。BLAST软件套件包括各种序列分析程序,包括“blastn”,用于将已知的多核苷酸序列与来自各种数据库的其他多核苷酸序列进行比对。还有一种称为“BLAST 2Sequences”的工具,用于直接对两个核苷酸序列进行成对比较。“BLAST 2Sequences”可以在NCBI网站上以交互方式访问和使用。“BLAST 2Sequences”工具可用于blastn和blastp(如上所述)。
关于多核苷酸序列,同一性百分比可以在整个定义的多核苷酸序列的长度上测量,例如如特定的SEQ ID号所定义的,或可以在较短的长度上测量,例如在取自更大、确定的序列的片段的长度上测量,例如至少20、至少30、至少40、至少50、至少70、至少100或至少200个连续核苷酸的片段。此类长度仅是示例性的,并且应理解本文、表格、附图或序列表中所示序列支持的任何片段长度可用于描述可测量同一性百分比的长度。
关于多核苷酸序列,“变体”、“突变体”或“衍生物”可以定义为使用国家生物技术信息中心网站上提供的“BLAST 2Sequences”工具的blastn在一定长度的核酸序列之一上与特定核酸序列具有至少50%序列同一性的核酸序列。(参见Tatiana A.Tatusova,ThomasL.Madden(1999),"Blast 2sequences-a new tool for comparing protein andnucleotide sequences",FEMS Microbiol Lett.174:247-250)。此类核酸对可显示在某个定义的长度上例如至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%或更高的序列同一性。
然而,由于其中多个密码子可以编码单个氨基酸的遗传密码的简并性,不显示高度同一性的核酸序列可能编码相似的氨基酸序列。应当理解,可以使用这种简并性来改变核酸序列以产生全部编码基本相同蛋白质的多个核酸序列。例如,本文考虑的多核苷酸序列可以编码蛋白质并且可以是密码子优化的和/或密码子适应的以在特定宿主中表达。在本领域中,已经为包括人、小鼠、大鼠、猪、大肠杆菌、植物和其他宿主细胞的许多宿主生物准备密码子使用频率表。在一些实施方案中,本文公开的多核苷酸序列可以编码蛋白质(例如,报告蛋白,例如荧光素酶)并且可以是密码子优化的和/或密码子适应的以在梭菌属(例如丙酮丁醇梭菌、产乙醇梭菌和/或大肠杆菌(例如参见SEQ ID NO:17-20和图13)中表达。
寡核苷酸可以通过任何合适的方法制备,包括通过以下方法的直接化学合成:例如Narang等的磷酸三酯法,1979,Meth.Enzymol.68:90-99;the phosphodiester methodof Brown等的磷酸二酯法,1979,Meth.Enzymol.68:109-151;Beaucage等的二乙基亚磷酰胺法,1981,Tetrahedron Letters 22:1859-1862;和美国专利号4,458,066的固体支持方法,每个都通过引用并入本文。Goodchild,1990,Bioconjugate Chemistry 1(3):165-187中提供寡核苷酸和修饰核苷酸的缀合物的合成方法的综述,该文献通过引用并入本文。
术语“扩增反应”是指任何化学反应,包括酶促反应,其导致模板核酸序列的拷贝增加或导致模板核酸的转录。扩增反应包括逆转录、聚合酶链反应(PCR),包括实时PCR(参见美国专利号4,683,195和4,683,202;PCR Protocols:A Guide to Methods andApplications(Innis等,1990版)),和连接酶链反应(LCR)(参见Barany等,美国专利号5,494,810)。示例性的“扩增反应条件”或“扩增条件”通常包括两步或三步循环。两步循环具有高温变性步骤,然后是杂交/延伸(或连接)步骤。三步循环包括变性步骤,然后是杂交步骤,然后是单独的延伸步骤。
如本文所用,术语“靶标”、“靶标序列”、“靶标区域”和“靶标核酸”是同义词,是指待扩增、排序或检测的核酸区域或序列。
如本文所用,术语“杂交”是指由于碱基互补配对,两条单链核酸形成双链体结构。杂交可发生在完全互补的核酸链之间或包含少量错配区域的“基本互补”核酸链之间。强烈优选完全互补的核酸链杂交的条件称为“严格杂交条件”或“序列特异性杂交条件”。在不太严格的杂交条件下可以获得基本互补序列的稳定双链体;可以通过适当调整杂交条件来控制容许的错配程度。核酸技术领域的技术人员可以根据经验确定双链体稳定性,考虑许多变量,包括例如寡核苷酸的长度和碱基对组成、离子强度和错配碱基对的发生率,遵循由技术提供的引导(例如参见Sambrook等,1989,Molecular Cloning-A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York;Wetmur,1991,Critical Review in Biochem.和Mol.Biol.26(3/4):227-259;和Owczarzy等,2008,Biochemistry,47:5336-5353,通过引用将其并入本文)。
如本文所用,术语“引物”是指能够在合适条件下充当DNA合成起始点的寡核苷酸。此类条件包括在四种不同的三磷酸核苷和用于延伸的试剂(例如,DNA聚合酶或逆转录酶)的存在下在适当的缓冲液中并且在合适的温度下诱导与核酸链互补的引物延伸产物的合成。
引物优选地是单链DNA。引物的合适长度取决于引物的预期用途,但通常在约6至约225个核苷酸的范围内,包括中间范围,例如15至35个核苷酸、18至75个核苷酸和25至150个核苷酸。短引物分子通常需要较低的温度才能与模板形成足够稳定的杂化复合物。引物不需要反映模板核酸的确切序列,但必须充分互补以与模板杂交。用于扩增给定靶序列的合适引物的设计是本领域众所周知的并且在本文引用的文献中有所描述。
引物可以包含允许检测或固定引物但不改变引物的基本性质,即作为DNA合成起始点的性质的附加特征。例如,引物可在5'端包含额外的核酸序列,该序列不与目标核酸杂交,但有助于扩增产物的克隆或检测,或使RNA转录(例如,通过包含启动子)或蛋白质翻译(例如,通过包含5'-UTR,例如内部核糖体进入位点(IRES)或3'-UTR元件,例如poly(A)n序列,其中n在约20至约200的范围内)成为可能。与模板充分互补以杂交的引物区域在本文中称为杂交区域。
如本文所用,如果在足够严格的条件下用于扩增反应中时,引物主要与靶核酸杂交,则引物对于靶序列是“特异性的”。通常,如果引物-靶标双链体稳定性大于引物与样品中发现的任何其他序列之间形成的双链体的稳定性,则引物对靶序列具有特异性。本领域技术人员将认识到各种因素,例如盐条件以及引物的碱基组成和错配的位置,将影响引物的特异性,并且引物特异性的常规实验确认将是很多情况下都需要。可以选择杂交条件,在该条件下引物可以仅与目标序列形成稳定的双链体。因此,在适当严格的扩增条件下使用靶特异性引物能够选择性扩增含有靶引物结合位点的那些靶序列。
如本文所用,“聚合酶”是指催化核苷酸聚合的酶。“DNA聚合酶”催化脱氧核糖核苷酸的聚合。已知的DNA聚合酶包括例如激烈火球菌(Pfu)DNA聚合酶、大肠杆菌DNA聚合酶I、T7 DNA聚合酶和水生栖热菌(Taq)DNA聚合酶等。“RNA聚合酶”催化核糖核苷酸的聚合。DNA聚合酶的上述实例也称为DNA依赖性DNA聚合酶。RNA依赖性DNA聚合酶也属于DNA聚合酶的范围。包括由逆转录病毒编码的病毒聚合酶的逆转录酶是依赖于RNA的DNA聚合酶的实例。RNA聚合酶(“RNAP”)的已知实例包括例如噬菌体的RNA聚合酶(例如T3 RNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶)和大肠杆菌RNA聚合酶等。RNA聚合酶的上述实例也称为DNA依赖性RNA聚合酶。任何上述酶的聚合酶活性可以通过本领域公知的方法测定。
术语“启动子”是指引导RNA聚合酶和其他反式作用转录因子从包括顺式作用DNA序列的DNA模板开始RNA转录的顺式作用DNA序列。
如本文所用,术语“序列定义的生物聚合物”是指具有特定一级序列的生物聚合物。在其中基因编码具有特定一级序列的生物聚合物的情况下,序列限定的生物聚合物可以等同于基因编码的限定生物聚合物。如本文所用,“表达”是指多核苷酸从DNA模板(例如进入和mRNA或其它RNA转录物)转录的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸源自基因组DNA,则表达可以包括mRNA在真核细胞中的剪接。
如本文所用,“表达模板”是指作为底物用于转录至少一种RNA的核酸,该RNA可以被翻译成序列限定的生物聚合物(例如,多肽或蛋白质)。表达模板包括由DNA或RNA组成的核酸。将核酸用于表达模板的合适的DNA来源包括基因组DNA、cDNA和可以转化为cDNA的RNA。基因组DNA、cDNA和RNA可以来自任何生物来源,例如组织样品、活检、拭子、痰、血液样品、粪便样品、尿液样品、刮屑等。基因组DNA、cDNA和RNA可以来自宿主细胞或病毒来源以及任何物种,包括现存和灭绝的生物体。如本文所用,“表达模板”和“转录模板”具有相同含义并可互换使用。
在某些示例性实施方案中,提供载体,例如表达载体,其含有编码本文所述的一种或多种rRNA或报告多肽和/或蛋白质的核酸。如本文所用,术语“载体”是指能够转运与其连接的另一种核酸的核酸分子。一种类型的载体是“质粒”,它指的是其中可以连接额外的DNA片段的环状双链DNA环。此类载体在本文中称为“表达载体”。通常,可用于重组DNA技术的表达载体通常是质粒形式。在本说明书中,“质粒”和“载体”可以互换使用。然而,所公开的方法和组合物旨在包括这些其他形式的表达载体,例如具有同等功能的病毒载体(例如,复制缺陷型逆转录病毒、腺病毒和腺相关病毒)。
在某些示例性实施方案中,重组表达载体包含适合于以一种或多种本文描述的方法表达核酸序列的形式的核酸序列(例如,编码本文所述的一种或多种rRNA或报告多肽和/或蛋白质的核酸序列),这表示重组表达载体包含一个或多个与待表达的核酸序列可操作地连接的调节序列。在重组表达载体内,“可操作地连接”意指编码本文所述的一种或多种rRNA或报告多肽和/或蛋白质的核苷酸序列以允许核苷酸序列(例如,在体外核糖体组装、转录和/或翻译系统中)表达的方式连接至调节序列。术语“调节序列”旨在包括启动子、增强子和其他表达控制元件(例如,聚腺苷酸化信号)。例如,在Goeddel,Gene ExpressionTechnology:Methods in Enzymology 185,Academic Press,San Diego,Calif.(1990)中描述这样的调节序列。
本文考虑的多核苷酸序列可以存在于表达载体中。例如,载体可以包含:(a)编码蛋白质的ORF的多核苷酸;(b)表达RNA的多核苷酸,该RNA指导靶标DNA序列的RNA介导的结合、剪切和/或切割;以及(a)和(b)二者。载体中存在的多核苷酸可以与原核或真核启动子可操作地连接。“有效连接”是指其中第一核酸序列与第二核酸序列处于功能关系中的情况。例如,如果启动子影响编码序列的转录或表达,则启动子与编码序列可操作地连接。可操作地连接的DNA序列可以非常接近或连续,并且在需要连接两个蛋白质编码区时,在同一阅读框中。本文考虑的载体可以包含与编码蛋白质的多核苷酸可操作地连接的异源启动子(例如,真核或原核启动子)。“异源启动子”是指不是所表达的蛋白质或RNA的天然或内源启动子的启动子。本文公开的载体可以包括质粒载体。
寡核苷酸和多核苷酸可任选地包括一种或多种非标准核苷酸、核苷酸类似物和/或修饰的核苷酸。修饰核苷酸的实例包括但不限于二氨基嘌呤、S2T、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基喹啉、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基喹啉、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-D46-异戊烯基腺嘌呤、尿嘧啶-5-羟基乙酸(v)、wybutoxosine、假尿嘧啶、queosine、2-巯基胞嘧啶、5-甲基-2-硫脲嘧啶、2-硫脲嘧啶、4-硫脲嘧啶、5-甲基脲嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫脲嘧啶、3-(3-氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤等。核酸分子也可以在碱基部分(例如,在通常可用于与互补核苷酸形成氢键的一个或多个原子处和/或在通常不能与互补核苷酸形成氢键的一个或多个原子处)、糖部分或磷酸骨架处修饰。
肽、多肽、蛋白质和合成方法
所公开的方法、设备、试剂盒和组分可用于合成蛋白质、多肽和/或肽。如本文所用,术语“蛋白质”或“多肽”或“肽”可互换使用以指氨基酸的聚合物。通常,“多肽”或“蛋白质”被定义为较长的氨基酸聚合物,其长度通常大于50、60、70、80、90或100个氨基酸。“肽”被定义为氨基酸的短聚合物,长度通常为50、40、30、20或更短的氨基酸。
如本文所用,术语“肽”、“多肽”和“蛋白质”是指包含通过酰胺键连接的氨基酸残基聚合物链的分子。术语“氨基酸残基”包括但不限于包含在由丙氨酸(Ala或A)、半胱氨酸(Cys或C)、天冬氨酸(Asp或D)、谷氨酸(Glu或E)、苯丙氨酸(Phe或F)、甘氨酸(Gly或G)、组氨酸(His或H)、异亮氨酸(Ile或I)、赖氨酸(Lys或K)、亮氨酸(Leu或L)、蛋氨酸(Met或M)、天冬酰胺(Asn或N)、脯氨酸(Pro或P)、谷氨酰胺(Gln或Q)、精氨酸(Arg或R)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、缬氨酸(Val或V)、色氨酸(Trp或W)和酪氨酸(Tyr或Y)残基。术语“氨基酸残基”还可以包括非标准的、非规范的或非天然的氨基酸,其任选地可以包括除以下任何氨基酸外的氨基酸:丙氨酸、半胱氨酸、天冬氨酸、谷氨酸、苯丙氨酸、甘氨酸、组氨酸、异亮氨酸、赖氨酸、亮氨酸、甲硫氨酸、天冬酰胺、脯氨酸、谷氨酰胺、精氨酸、丝氨酸、苏氨酸、缬氨酸、色氨酸和酪氨酸残基。术语“氨基酸残基”可以包括α-、β-、γ-和δ-氨基酸。
在一些实施方案中,术语“氨基酸残基”可以包括包含在由高半胱氨酸、2-氨基己二酸、N-乙基天冬酰胺、3-氨基己二酸、羟赖氨酸、β-丙氨酸、β-氨基丙酸、异常羟赖氨酸、2-氨基丁酸、3-羟脯氨酸、4-氨基丁酸、4-羟脯氨酸、哌啶酸、6-氨基己酸、异去丝氨酸、2-氨基庚酸、异常亮氨酸、2-氨基异丁酸、N-甲基甘氨酸、肌氨酸、3-氨基异丁酸、N-甲基异亮氨酸、2-氨基庚二酸、6-N-甲基赖氨酸、2,4-二氨基丁酸、N-甲基缬氨酸、地氨酰、正缬氨酸、2,2'-二氨基庚二酸、正亮氨酸、2,3-二氨基丙酸、鸟氨酸和N-乙基甘氨酸组成的组中的非标准、非常规和非天然氨基酸残基。术语“氨基酸残基”可以包括任何上述氨基酸的L异构体或D异构体。
非标准、非规范或非天然氨基酸的其他实例包括但不限于对乙酰基-L-苯丙氨酸、对碘-L-苯丙氨酸、O-甲基-L-酪氨酸、对炔丙氧基苯丙氨酸、对炔丙基-苯丙氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAcpβ-丝氨酸、L-Dopa、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯丙氨酸、对苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、磷酸丝氨酸、磷酸酪氨酸、对溴苯丙氨酸、对氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;甲硫氨酸氨基酸的非天然类似物;亮氨酸氨基酸的非天然类似物;异亮氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、卤素、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒、酯、硫代酸、硼酸酯、硼酸盐、18ufa18hor、膦酰基、膦、杂环、烯酮、亚胺、醛、羟胺、酮或氨基取代的氨基酸,或其组合;具有可光活化交联剂的氨基酸;自旋标记的氨基酸;荧光氨基酸;金属结合氨基酸;含金属的氨基酸;放射性氨基酸;光笼化和/或光致异构化氨基酸;含有生物素或生物素类似物的氨基酸;含酮的氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;可化学切割或可光切割的氨基酸;具有延长侧链的氨基酸;含有毒性基团的氨基酸;糖取代的氨基酸;碳连接的含糖氨基酸;具有氧化还原活性的氨基酸;含α-羟基的酸;氨基硫代酸;α,α双取代氨基酸;β-氨基酸;γ-氨基酸,脯氨酸或组氨酸以外的环状氨基酸,苯丙氨酸、酪氨酸或色氨酸以外的芳香族氨基酸。
如本文所用,“肽”定义为氨基酸的短聚合物,其长度通常为20个或更少的氨基酸,并且更通常为12个或更少的氨基酸(Garrett&Grisham,Biochemistry,第2版,1999,Brooks/Cole,110)。在一些实施方案中,如本文所考虑的肽可以包括不超过约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。多肽,也称为蛋白质,通常长度>100个氨基酸(Garrett&Grisham,Biochemistry,第2版,1999,Brooks/Cole,110)。如本文所考虑的,多肽可以包括但不限于100、101、102、103、104、105、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约875、约900、约925、约950、约975、约1000、约1100、约1200、约1300、约1400、约1500、约1750、约2000、约2250、约2500个或更多个氨基酸残基。
如本文所考虑的肽可以被进一步修饰以包括非氨基酸部分。修饰可以包括但不限于酰化(例如,O-酰化(酯)、N-酰化(酰胺)、S-酰化(硫酯))、乙酰化(例如,在蛋白质的N-末端或在赖氨酸残基)、甲酰化脂酰化(例如,硫辛酸酯、C8官能团的连接),肉豆蔻酰化(例如,肉豆蔻酸酯、C14饱和酸的连接)、棕榈酰化(例如,棕榈酸酯、C16饱和酸的连接)、烷基化(例如,在赖氨酸或精氨酸残基处添加烷基,例如甲基)、异戊二烯化或异戊二烯化(例如,添加类异戊二烯基团,例如法呢醇或香叶基香叶醇)、在C-末端酰胺化、糖基化(例如,向天冬酰胺、羟赖氨酸、丝氨酸或苏氨酸添加糖基,产生糖蛋白)。聚唾液酸化(例如,加入聚唾液酸)、糖基化(例如,糖基磷脂酰肌醇(GPI)锚定形成、羟基化、碘化(例如甲状腺激素的)和磷酸化(例如,加入磷酸基团,通常加到丝氨酸、酪氨酸、苏氨酸或组氨酸)不同于被认为是糖的非酶促连接的糖基化。
本文公开的蛋白质可以包括“野生型”蛋白质及其变体、突变体和衍生物。如本文所用,术语“野生型”是技术人员理解的本领域术语,是指生物体、菌株、基因或特征的典型形式,如其在自然界中出现的,有别于突变体或变异体形式。如本文所用,“变体”、“突变体”或“衍生物”是指具有不同于参考蛋白质或多肽分子的氨基酸序列的蛋白质分子。变体或突变体相对于参考分子可以具有一个或多个氨基酸残基的插入、缺失或取代。变体或突变体可以包括参考分子的片段。例如,突变体或变体分子相对于参考多肽可以具有至少一个氨基酸残基的一处或多处插入、缺失或取代。
关于蛋白质,“缺失”是指导致一个或多个氨基酸残基缺失的氨基酸序列变化。删除可以去除至少1、2、3、4、5、10、20、50、100、200或更多个氨基酸残基。缺失可以包括内部缺失和/或末端缺失(例如,参考多肽的N-末端截短、C-末端截短或两者)。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括相对于参考多肽序列的缺失。
关于蛋白质,“片段”是与参考序列序列相同但长度短于参考序列的氨基酸序列的一部分。片段可以包含至多参考序列的整个长度,减去至少一个氨基酸残基。例如,片段可分别包含参考多肽的5至1000个连续氨基酸残基。在一些实施方案中,片段可以包含参考多肽的至少5、10、15、20、25、30、40、50、60、70、80、90、100、150、250或500个连续氨基酸残基.片段可以优先选自分子的某些区域。术语“至少一个片段”包括全长多肽。相对于全长蛋白质,片段可以包括N-末端截短、C-末端截短或这两种截短。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括参考多肽序列的片段。
关于蛋白质,词语“插入”和“添加”是指氨基酸序列的变化导致添加一个或多个氨基酸残基。插入或添加可指1、2、3、4、5、10、20、30、40、50、60、70、80、90、100、150、200或更多个氨基酸残基。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括相对于参考多肽序列的插入或添加。蛋白质的变体可具有N-末端插入、C-末端插入、内部插入或N-末端插入、C-末端插入和内部插入的任何组合。
关于蛋白质,短语“同一性百分比”和“%同一性”是指使用标准化算法比对的至少两个氨基酸序列之间的残基匹配百分比。氨基酸序列比对的方法是众所周知的。一些比对方法考虑保守的氨基酸替换。下文更详细解释的此类保守取代通常保留取代位点处的电荷和疏水性,从而保留多肽的结构(并因此保留功能)。可以如本领域所理解的那样确定氨基酸序列的百分比同一性。(例如参见美国专利号7,396,664,其通过引用整体并入本文)。国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLAST)提供一套常用且可免费获得的序列比较算法,该工具可从多个来源在其网站获得,包括马里兰州贝塞斯达NCBI。BLAST软件套件包括各种序列分析程序,包括“blastp”,用于将已知氨基酸序列与来自各种数据库的其他氨基酸序列进行比对。
关于蛋白质,同一性百分比可以在整个定义的多肽序列的长度上测量,例如,如由特定的SEQ ID号定义的,或可以在较短的长度上测量,例如,在取自更大的、确定的多肽序列,例如至少15、至少20、至少30、至少40、至少50、至少70或至少150个连续残基的片段的片段的长度上测量。此类长度仅是示例性的,并且应理解,本文、表格、附图或序列表中所示序列支持的任何片段长度可用于描述可测量同一性百分比的长度。
关于蛋白质,本文考虑的变体、突变体或衍生物的氨基酸序列可以包括相对于参考氨基酸序列的保守氨基酸取代。例如,变体、突变体或衍生蛋白质可以包括相对于参考分子的保守氨基酸取代。“保守氨基酸取代”是将一个氨基酸取代为不同氨基酸的取代,其中预测该取代对参考多肽的性质干扰最少。换言之,保守氨基酸取代基本上保留参考多肽的结构和功能。下表提供本文考虑的示例性保守氨基酸取代的列表:
保守氨基酸取代通常保持(a)取代区域内的多肽骨架结构,例如,β折叠或α螺旋构象,(b)取代位点处分子的电荷或疏水性,和/或(c)大部分侧链。非保守氨基酸通常会破坏(a)取代区域的多肽骨架结构,例如,作为β折叠或α螺旋构象,(b)取代位点处分子的电荷或疏水性,和/或(c)大部分侧链。
所公开的蛋白质、突变体、变体或本文所述的蛋白质可具有参考多肽表现出的一种或多种功能或生物活性(例如,野生型蛋白质表现出的一种或多种功能或生物活性)。
所公开的蛋白质可以是基本上分离的或纯化的。术语“基本上分离或纯化”是指从其天然环境中去除的蛋白质,并且至少60%不含,优选至少75%不含,更优选至少90%不含,甚至更优选至少95%不含与它们自然相关的其他组分。
本文公开的蛋白质可以从“翻译模板”表达。如本文所用,“翻译模板”是指从表达模板转录的RNA产物,其可被核糖体用于合成多肽或蛋白质。
本文公开的蛋白质可以在“反应混合物”中表达。如本文所用,术语“反应混合物”是指含有进行给定反应所必需的试剂的溶液。如果反应混合物包含进行反应所需的所有试剂,则该反应混合物被称为完全反应混合物。反应混合物的组分可以分别储存在单独的容器中,每个容器包含一种或多种全部组分。组分可以单独包装用于商业化并且有用的商业试剂盒可以包含一种或多种用于反应混合物的反应组分。
无细胞蛋白质合成
无细胞蛋白质合成(CFPS)和制备用于CFPS的细胞提取物的方法是本领域已知的。(例如参见Carlson等,“Cell-free protein synthesis:Applications come of age,”Biotech.Adv.Vol.30,Issue 5,Sept-Oct 2012,Pages 1185-1194;Hodgman等,“Cell-freesynthetic biology:Thinking outside the cell,”Metabol.Eng.Vol.14,Issue 3,May2012,Pages 261-269;和Harris等,“Cell-free biology:exploiting the interfacebetween synthetic biology and synthetic chemistry,”Curr.Op.Biotech.Vol.23,Issue 5,October 2012,Pages 672-678;还参见美国专利号7,312,049;7,008,651;和6994986;还参见美国公开申请号20170306320;20160362708;20160060301;20120088269;20090042244;2008024821;20080138857;20070154983;20070141661;20050186655;20050148046l20050064592;20050032086;20040209321;和20040038332;其内容通过引用以其整体并入本文)。
所公开的合成方法可以利用细胞提取物。如本领域所理解的,细胞提取物是从无细胞或基本上无细胞的细胞制备的提取物。例如,细胞提取物可以通过使用例如机械或化学方法裂解细胞并分离无细胞或基本无细胞的裂解细胞级分来制备。
所公开的组合物可以包括用于在体外制备序列限定的蛋白质生物聚合物的平台。用于在体外制备序列定义的聚合物或蛋白质的平台包括来自生物体的细胞提取物,特别是梭菌属物种,例如产乙醇梭菌。由于CFPS利用从细胞粗裂解物中制备的催化蛋白集合,细胞提取物(其组分对生长介质、裂解方法和加工条件敏感)是基于提取物的CFPS反应的重要组成部分。存在多种方法来制备能够进行无细胞蛋白质合成的提取物,包括在2014年10月2日公布的美国公开申请号20140295492中公开的那些,该申请通过引用以其整体并入。
该平台可以包括表达模板、翻译模板或表达模板和翻译模板两者。表达模板用作转录至少一种RNA的底物,该RNA可以翻译成序列限定的生物聚合物(例如,多肽或蛋白质)。翻译模板是RNA产物,核糖体可以使用它来合成序列定义的生物聚合物。在某些实施方案中,平台包括表达模板和翻译模板。在某些特定实施方案中,平台可以是偶联转录/翻译(“Tx/T1”)系统,其中从相同细胞提取物合成翻译模板和序列定义的生物聚合物。
该平台可以包含一种或多种能够从表达模板产生翻译模板的聚合酶。聚合酶可以外源提供或可以从用于制备提取物的生物体提供。在某些特定实施方案中,聚合酶由存在于用于制备提取物的生物体中的质粒和/或用于制备提取物的生物体基因组中的整合位点表达。
该平台可以包括正交平移系统。正交平移系统可以包含一个或多个正交组分,这些组分被设计为平行于和/或独立于生物体的正交平移机构操作。在某些实施方案中,正交翻译系统和/或正交组分被配置为掺入非天然氨基酸。正交组分可以是正交蛋白质或正交RNA。在某些实施方案中,正交蛋白质可以是正交合成酶。在某些实施方案中,正交RNA可以是正交tRNA或正交rRNA。美国公开申请号20170073381和20160060301中已经描述了正交rRNA组分的示例,其内容通过引用整体并入。在某些实施方案中,一种或多种正交组分可以通过寡核苷酸模板的表达在体内或体外制备。一种或多种正交组分可以从基因组重新编码的生物体中存在的质粒表达,从基因组重新编码的生物体基因组中的整合位点表达,从基因组重新编码的生物体中存在的质粒和在基因重新编码的生物体的基因组中的整合位点共同表达,在体外转录和翻译反应中表达,或作为因子外源添加(例如,加到平台或反应混合物中的正交tRNA或正交合成酶)。
包含梭菌属提取物的平台
所公开的组合物(或系统)可以包括用于在体外制备序列定义的生物聚合物或蛋白质的平台,其中该平台包含从梭菌属物种,特别是产乙醇梭菌属的细胞培养物制备的细胞提取物。
合适的梭菌属物种可以包括天然存在的分离物(即,野生型物种),或者梭菌属物种可以被改造。例如,梭菌属物种可以被改造为缺乏无细胞蛋白质合成(CFPS)的阴性效应物,例如通过敲除突变。已针对大肠杆菌定义CFPS的阴性效应物,可能包括但不限于endA(SEQ ID NO:1)、lon(SEQ ID NO:2)、mazF(SEQ ID NO:3)、ompT(SEQ ID NO:4)、rna(SEQ IDNO:5)、rnb(SEQ ID NO:6)、glpK(SEQ ID NO:7)、gor(SEQ ID NO:8)、gshA(SEQ ID NO:9)、tnaA(SEQ ID NO:10)、rne(SEQ ID NO:11)、gdhA(SEQ ID NO:12)、sdaA(SEQ ID NO:13)、sdaB(SEQ ID NO:14)、speA(SEQ ID NO:15)、WaaL(SEQ ID NO:16),以及它们的任何组合。
可将合适的梭菌属物种改造为缺乏编码大肠杆菌endA、mazF、rna、rnb、rne、gor、lon、ompT、gdhA、gshA、sdaA、sdaB、speA、WaAL、tnaA、glpK及其任何组合中任一种的相应同系物的基因。例如,梭菌属物种可能缺乏编码大肠杆菌endA、mazF、rna、rnb、rne、gor、lon、ompT、gdhA、gshA、sdaA、sdaB、speA、WaaL、tnaA、glpK中任一种的相应同系物的基因,其同系物至少具有与endA(SEQ ID NO:1)、lon(SEQ ID NO:2)、mazF(SEQ ID NO:3)、ompT(SEQ IDNO:4)、rna(SEQ ID NO:5)、rnb(SEQ ID NO:6)、glpK(SEQ ID NO:7)、gor(SEQ ID NO:8)、gshA(SEQ ID NO:9)、tnaA(SEQ ID NO:10)、rne(SEQ ID NO:11)、gdhA(SEQ ID NO:12)、sdaA(SEQ ID NO:13)、sdaB(SEQ ID NO:14)、speA(SEQ ID NO:15)、WaaL(SEQ ID NO:16)中的一个或多个以及它们的任何组合约20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的氨基酸序列同一性。
此外或备选地,梭菌属物种可被改造以表达作为CFPS阳性效应物的上调基因产物。已为大肠杆菌定义CFPS的阳性效应子,可能包括但不限于ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr及其任何组合。梭菌属物种可以在基因组上改造,例如通过将异源DNA重组引入梭菌属的基因组中,和/或梭菌属可以通过将附加型载体(例如,质粒)引入梭菌属中来改造以产生表达上调基因产物的梭菌属的改造物种,所述基因产物是大肠杆菌ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr中的任一种及其任何组合的相应同系物。例如,梭菌属可被改造以表达具有与大肠杆菌ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr中的一种或多种及其任何组合至少约20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的氨基酸序列同一性的上调基因产物。
梭菌属物种可以被改造为特别缺乏翻译释放因子。用于翻译的释放因子可以包括但不限于释放因子1(RF-1)。
梭菌属物种可以被基因组重新编码。例如,梭菌属可以被基因组重新编码以用不同的密码子替换一个或多个终止密码子,任选地其中所述梭菌属的基因组中的所有一个终止密码子被替换为不同的密码子。
梭菌属物种可以被改造以表达非天然或异源RNA聚合酶,例如,通过将编码RNA聚合酶的异源DNA重组引入梭菌属的基因组中,和/或梭菌属可以通过引入表达RNA聚合酶(例如,质粒)的附加型载体到梭菌属改造。合适的RNA聚合酶可以包括但不限于T7 RNA聚合酶。
该平台的细胞提取物是从梭菌的细胞培养物中制备的。在一些实施方案中,细胞培养物处于静止期。在一些实施方案中,固定相可被定义为细胞培养物具有大于约3.0,3.5,4.0,4.5,5.0,5.5,6.0,6.5,7.0,7.5,8.0的OD600,或具有由这些值中的任何一个限定的范围内的OD600。
细胞提取物可以通过裂解细胞培养物的细胞并从裂解的细胞中分离部分来制备。例如,细胞提取物可以通过裂解细胞培养物的细胞并使裂解的细胞经受离心力,并在离心后分离级分(例如,其中分离S12级分和/或S30级分)来制备。
本文公开的平台可以包括附加组分,例如用于执行CFPS的一个或多个组分。组分可以包括但不限于氨基酸,其任选地可以包括非常规氨基酸、NTP、盐(例如钠盐、钾盐和/或镁盐)、辅因子(例如,烟酰胺腺嘌呤二核苷酸(NAD)和/或辅酶-A(CoA))、能量源和任选的包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP)、ATP或磷酸肌酸)、翻译模板(例如,在平台中翻译的非天然mRNA)和/或转录模板(例如,用于合成在平台中翻译的非天然mRNA的模板DNA),以及它们的任何组合。
在一些实施方案中,平台可以包含能量源和任选地包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP)、ATP或磷酸肌酸),其中能量源以大于约30mM、40mM、50mM、60mM、70mM、80mM或90mM(优选大于约67mM),但小于约100mM,或在由任何这些值界定的浓度范围内的浓度存在于平台中。
在一些实施方案中,平台还包含钾(K+)源(例如钾盐,例如谷氨酸钾),其中平台包含浓度大于约50mM、100mM、150mM、200mM的钾、250mM、300mM、350mM、400mM或450mM(优选约300mM),但小于约500mM,或在由这些值中的任一个界定的浓度范围内。
在一些实施方案中,平台还包含镁(Mg2+)源(例如镁盐,例如谷氨酸镁或乙酸镁),其中平台包含浓度大于约1mM、2mM、3mM的镁、4mM、5mM、6mM、8mM、12mM、16mM、20mM、24mM、28mM、32mM、36mM(优选约24mM),但小于约60mM,或在由这些值中的任何一个界定的浓度范围内。
所公开的平台和细胞提取物可用于在体外制备序列限定的生物聚合物或蛋白质的方法中。所公开的方法通常包括体外翻译在前述权利要求中任一项的平台中编码定义的生物聚合物或蛋白质的序列的翻译模板(例如,mRNA)。任选地,所公开的方法可以包括在平台中转录转录模板(例如,DNA)以提供翻译模板。
所公开的方法可以在适合从梭菌属物种制备的细胞提取物的条件下进行。在一些实施方案中,所公开的方法在约20-40℃的温度下进行,优选在约30℃的温度下进行。
可以执行所公开的方法来合成任何序列限定的生物聚合物或蛋白质。在一些实施方案中,序列定义的聚合物或蛋白质是治疗性蛋白质和/或该方法可用于通过翻译转录模板文库来鉴定治疗性蛋白质或生物材料。在一些实施方案中,可以进行所公开的方法以优化从梭菌属物种制备的细胞提取物的体外翻译条件。
本文还考虑试剂盒。在一些实施方案中,所考虑的试剂盒包含作为组分:(a)从梭菌属(例如产乙醇梭菌)的细胞培养物制备的细胞提取物;(b)用于翻译mRNA的反应混合物。所公开试剂盒的反应混合物的合适组分可以包括但不限于氨基酸,其任选可以包括非规范氨基酸、NTP、盐(例如钠盐、钾盐和/或镁盐)、辅因子(例如,烟酰胺腺嘌呤二核苷酸(NAD)和/或辅酶-A(CoA))、能量源和任选的包含磷酸基团的能量源(例如ATP或磷酸肌酸)。
敲除突变
本文公开的梭菌属物种可以包括基因敲除突变,优选下调或消除CFPS的负蛋白效应物的敲除突变。在某些实施方案中,至少一种额外的基因敲除突变改善DNA稳定性、RNA稳定性、蛋白质稳定性、氨基酸稳定性、能量供应或其任何组合。在某些实施方案中,至少一种额外的基因敲除突变包含1、2、3、4或多于4个基因敲除突变。在菌株包含2个或更多个基因敲除突变的实施方案中,至少2个基因敲除突变可以同时改善相同的属性、改善DNA稳定性、改善RNA稳定性、改善蛋白质稳定性、改善氨基酸稳定性、改善能量供应,或者两者都可以改善不同的属性。
为了改善DNA或RNA的稳定性,至少一种额外的基因敲除突变可以靶向核酸酶的功能失活。在体内,核酸酶在调节DNA和mRNA转换方面发挥重要作用。然而,它们在粗细胞提取物中的存在预计是有害的,导致模板不稳定和反应终止。已在大肠杆菌中鉴定的潜在负面效应物的非详尽列表如下:RNase A(由ma编码)通过催化磷酸二酯键的裂解来降解RNA,并且鉴定缺乏ma的菌株(例如MRE600、A19)对于体外翻译的早期研究是重要的。RNase II(由rnb编码)负责通过3'至5'核酸外切酶活性的mRNA衰减,并且缺乏RNase II的细胞提取物的CFPS效率提高70%。RNase E(由me编码)是冷休克降解体的一部分,它在冷休克中诱导mRNA衰减,细胞在提取物生成之前的收获期间经历这种衰减。MazF(由mazF编码)是通过序列特异性(ACA)内切核糖核酸酶活性降解mRNA的毒素,这可能会影响转录本的稳定性。CsdA(由csdA编码)与RNase E一起是冷休克降解体的一部分,并在冷休克中诱导mRNA衰减,细胞在提取物生成之前的收获期间经历这种衰减。DNA特异性核酸内切酶I(由endA编码)破坏双链DNA,并且其缺失先前已证明对于延长CFPS反应的持续时间很重要。这些和其他核酸酶的相应梭菌属同系物可以通过至少一个额外的基因敲除突变在功能上失活。
为了提高蛋白质稳定性,至少一种额外的基因敲除突变可以针对蛋白酶的功能失活。在体内,这些蛋白酶在调节蛋白质周转方面发挥重要作用。然而,它们在CFPS反应中的存在预计是有害的,导致蛋白质不稳定问题。在大肠杆菌中鉴定的潜在负面效应物的非详尽列表如下:谷胱甘肽还原酶(由gor编码)还原氧化型谷胱甘肽以维持细胞质中的还原环境,从而使二硫键蛋白的合成存在问题。Lon(由lon编码)是一种ATP依赖性蛋白酶,在转录下调后,BL21菌株的无细胞系统中的蛋白质产量得到改善。外膜蛋白酶VII(由ompT编码)显示出对配对碱性残基的特异性,并且已被证明在CFPS期间去除后可稳定蛋白质。这些和其他蛋白酶的相应梭菌属同系物可以通过至少一个额外的基因敲除突变在功能上失活。
至少一种额外的基因敲除突变可以靶向已知会对氨基酸或能量供应产生负面影响的蛋白质。在体内,这些蛋白质在代谢和底物周转中起重要作用。然而,它们在粗细胞提取物中的存在预计是有害的,导致支持翻译的氨基酸和能量供应减少。以下是在大肠杆菌中鉴定的潜在负面效应物的非详尽清单。谷氨酸脱氢酶(由gdhA编码)催化谷氨酸脱氨,这可能会影响谷氨酸的稳定性。谷氨酸-半胱氨酸连接酶(由gshA编码)催化谷胱甘肽合成的第一步,并可能降低半胱氨酸的稳定性。丝氨酸脱氨酶I(由sdaA编码)和丝氨酸脱氨酶II(由sdaB编码)是参与丝氨酸降解的三种酶中的两种。精氨酸脱羧酶(由speA编码)在腐胺的生物合成生产中消耗精氨酸。色氨酸酶(由tnaA编码)在吲哚的生产中消耗色氨酸。最后,甘油激酶(由glpK编码)消耗ATP以磷酸化甘油,这有助于消耗无细胞反应所需的能量供应。这些和其他蛋白质的相应梭菌属同系物可以通过至少一个额外的基因敲除突变在功能上失活。
具有至少一个额外基因敲除突变的菌株可以通过改造菌株以功能性地灭活阴性效应物以从由该菌株制备的裂解物中减少或消除阴性效应物的任何方法来制备。在某些实施方案中,基因敲除突变可以通过将无义突变和/或移码突变插入菌株的基因组以及删除基因编码序列的重要部分来制备。在某些实施方案中,基因敲除突变可以通过去除调节序列(即启动子、核糖体结合位点)或以其他方式改变基因组中的这些序列以使它们无功能来制备。在某些实施方案中,可以通过引入独特的亲和标签并随后使用该标签从裂解物中选择性去除效应蛋白而在裂解物中功能性敲除阴性效应物蛋白。在某些实施方案中,可以通过多重自动化基因组工程(MAGE)、λ-Red重组酶介导的重组(Datsenko-Wanner)、锌指核酸酶(ZFN)、转录激活因子样效应核酸酶(TALEN)、成簇的规则间隔短回文重复序列(CRISPR)相关蛋白9核酸酶(Cas9)、同源重组、基于内含子的破坏和任何其他常用的重组工程和基因组工程工具制备具有至少一种额外基因敲除、敲低或破坏突变的菌株。用于梭菌属中基因敲除/降低或破坏的遗传工具是本领域已知的。(例如参见Joseph等,“RecentDevelopments of the Synthetic Biology Toolkit for Clostridium,”Front.Microbiol.,2018;9:154;和Liew等,“Gas Fermentation–A Flexible Platformfor Commercial Scale Production of Low-Carbon-Fuels and Chemicals from Wasteand Renewable Feedstocks,”Front.Microbiol.2016年5月11日,1-29;其内容通过引用整体并入本文)。
上调基因产品
可将本文公开的梭菌属物种改造以表达额外的上调基因产物。至少一种额外的上调基因产物优选是作为CFPS阳性效应物的上调基因产物。在某些实施方案中,至少一种额外的上调基因产物改善能量供应、分子伴侣水平、翻译功能、核糖体再循环或其任何组合。在某些实施方案中,至少一种额外上调基因产物包含1、2、3、4或多于4种上调基因产物。在其中菌株包含2个或更多个上调基因产物的实施方案中,至少2个上调基因产物可同时改善相同的属性、改善能量供应、改善分子伴侣水平、改善翻译功能或改善核糖体循环,或可同时改善不同的属性。
为了改善能量供应,至少一种额外的上调基因产物可以靶向激酶的上调。在体内,这些蛋白质在代谢和磷酸基团的转移中起重要作用。粗细胞提取物中上调的存在有望改善能量供应以支持翻译。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。乙酸激酶(由ackA编码)增加代谢物向底物水平ATP生成的整体代谢通量。核苷二磷酸激酶(由ndk编码)促进NTP从其相应的NDP合成。丙酮酸激酶单体(由pykF编码)有助于驱动ATP生成。这些和其他激酶的相应梭菌属同系物可以是至少一种额外的上调基因产物。
为了改善能量供应,至少一种额外的上调基因产物可以靶向脱氨酶的上调。在体内,这些蛋白质可能在代谢和制备代谢物方面发挥重要作用。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。胞苷脱氨酶(由cdd编码)启动胞苷脱氨,这可能导致UTP的合成。这些和其他脱氨酶的相应的梭菌属同系物可以是至少一种额外的上调基因产物。
为了改善分子伴侣水平,至少一种上调的基因产物可以靶向异构酶、折叠酶和/或保持酶的上调。在体内,这些蛋白质可能在辅助蛋白质采用功能活性构象方面发挥重要作用。粗细胞提取物中上调的存在预计会改善分子伴侣水平,以支持蛋白质生产成可溶性和/或活性确认。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。二硫键异构酶(由dsbC编码)将二硫键改组到正确的位置。伴侣蛋白DnaK(由dnaK编码)有助于新生多肽链的折叠和错误折叠蛋白的拯救。伴侣蛋白DnaJ(由dnaJ编码)刺激DnaK的ATPase活性。蛋白质GrpE(由grpE编码)刺激DnaK的ATPas活性。触发因子(由tig编码)有助于新生多肽的折叠。10kDa伴侣蛋白亚基(由groS编码)形成帮助蛋白质折叠的GroEL-GroES伴侣蛋白复合物的一部分。60kDa伴侣蛋白亚基(由groL编码)形成帮助蛋白质折叠的GroEL-GroES伴侣蛋白复合物的一部分。这些和其他异构酶、折叠酶和/或保持酶的相应梭菌属同系物可以是至少一种额外的上调基因产物。
为了改善翻译功能,至少一种上调的基因产物可以靶向起始因子和/或延伸因子的上调。在体内,这些蛋白质在翻译功能中起着重要作用。粗细胞提取物中上调的存在有望改善翻译功能。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。翻译起始因子IF-1(由infA编码)与30S核糖体亚基相互作用以启动翻译。翻译起始级分IF-2(由infB编码)在通过GTP依赖机制正确放置带电起始fMet-tRNA中起作用。延伸因子G(由fusA编码)促进核糖体通过一个密码子沿mRNA的易位。延伸因子P(由efp编码)刺激肽键的合成。延伸因子4(由lepA编码)可以改变翻译速度,导致在某些压力条件下翻译速度增加。延伸因子TU 2(由tufB编码)有助于将带电的tRNA穿梭至核糖体。这些和其他起始因子和/或延伸因子的相应梭菌属同系物可以是至少一种额外的上调基因产物。
为了改善翻译功能,至少一种上调的基因产物可以针对回收因子的上调。在体内,这些蛋白质在核糖体循环中起着重要作用。粗细胞提取物中上调的存在有望改善核糖体的回收。以下是在大肠杆菌中鉴定的潜在阳性效应物的非详尽清单。热休克蛋白15(由hslR编码)参与游离50S核糖体亚基的回收。核糖体循环因子(由frr编码)在多肽链释放后促进核糖体亚基的快速循环。这些和其他再循环因子的相应梭菌属同系物可以是至少一种额外的上调基因产物。
具有至少一个额外基因敲除突变的菌株可以通过改造菌株以在功能上增加阳性效应子以增加阳性效应子在由该菌株制备的裂解物中的存在的任何方法来制备。在某些实施方案中,上调的基因产物从GRO中存在的质粒表达和/或从GRO基因组中的整合位点表达。此外,可以通过在位于质粒或基因组上的感兴趣基因前面设计启动子和/或核糖体结合位点来增强基因上调。更强的启动子/核糖体结合位点会导致转录活性增加。通常用于将过表达阳性效应子的质粒整合到菌株中的技术包括转化。通常用于将含有阳性效应子的基因盒整合到基因组中以进行过表达的技术包括X-Red重组酶介导的重组(Datsenko-Wanner)。用于梭菌中基因敲除/降低或破坏的遗传工具是本领域已知的。(例如参见Joseph等,“RecentDevelopments of the Synthetic Biology Toolkit for Clostridium,”Front.Microbiol.,2018;9:154;和Liew等,“Gas Fermentation–A Flexible Platformfor Commercial Scale Production of Low-Carbon-Fuels and Chemicals from Wasteand Renewable Feedstocks,”Front.Microbiol.2016年5月11日,1-29;其内容通过引用整体并入本文)。
基因组记录生物
本发明的一个方面是基因组重新编码的生物体(GRO),其任选地可以是缺乏释放因子1(RF1)或其遗传同系物的菌株。GRO可以通过任何应变工程方法制备。在某些实施方案中,通过在菌株中替换UAG密码子的所有实例,允许删除释放因子1(RF1;在UAG和UAA处终止翻译),并因此消除在UAG密码子处的翻译终止,制备缺乏RF1的菌株。该GRO允许重新引入UAG密码子,以及正交翻译机制,以允许将非标准或非规范氨基酸有效地和位点特定地掺入蛋白质中。也就是说,UAG可以从无义密码子(终止翻译)转化为有义密码子(包含选择的氨基酸),前提是存在适当的翻译机制。
说明性实施方案
下面提供本文公开的主题的几个说明性实施方案。这些说明性实施方案无意以任何方式限制权利要求。
实施方案1.一种用于mRNA体外转录和/或多肽翻译的无细胞蛋白质合成平台,该平台包含作为组分的从梭菌属物种的细胞培养物中制备的细胞提取物。
实施方案2.实施方案1的平台,其中所述梭菌属的物种选自产乙醇梭菌、杨氏梭菌,丁酸梭菌,拜氏梭菌,巴氏梭菌,糖丁酸梭菌(Clostridiumsaccharoperbutylacetonicum)、醋酸梭菌、破伤风形梭菌(Clostridium tetanomorphum)、Clostridium phytofermentans、Clostridium arbusti、Clostridium akagii、纤维梭菌、Clostridium diolis、Clostridium acetireducens、Clostridium coskatii、Clostridiumragsdalei、Clostridium drakei、Clostridium formicoaceticum、Clostridiumscatalogenes、克氏梭菌、酪丁酸梭菌、Clostridium grantii、Clostridiumhomopropionicum、Clostridium tepidiprofundi、Clostridium collagenovorans、Clostridium tunisiense、Clostridium argentinense、Clostridium ihumii、尸毒梭菌(Clostridium cadaveris)、Clostridium amylolyticum、Clostridium sartagoforme、巴氏梭菌、副腐化梭菌(Clostridium paraputrificum)、谲诈梭菌(Clostridium fallax)、Clostridium cavendishii、释义柱胞梭菌(Clostridium cylindrosporum)、Clostridiumphoceensis、肉毒梭菌、艰难梭菌、破伤风梭菌、污泥梭菌(Clostridium sordelli)、魏氏梭菌(Clostridium perfringes)、诺氏梭菌、腐败梭菌、污泥梭菌、溶组织梭菌、产气荚膜梭菌、生孢梭菌(Clostridium sporogenes)、多枝梭菌(Clostridium ramosum)、无害梭菌(Clostridium innocuum)、梭状梭菌(Clostridium clostridioforme)、第三梭菌(Clostridium tertium)和水肿梭菌(Clostridium oedematiens)。
实施方案3.实施方案1或2的平台,其中所述梭菌属物种为产乙醇梭菌。
实施方案4.前述实施方案中任一项的平台,其中所述梭菌属物种被改造以缺乏无细胞蛋白质合成(CFPS)的阴性效应物。
实施方案5.实施方案4的平台,其中用于CFPS的阴性效应物选自大肠杆菌endA、mazF、rna、rnb、rne、gor、lon、ompT、gdhA、gshA、sdaA、sdaB、speA、WaaL、tnaA、glpK及其任何组合的梭菌属同系物。
实施方案6.前述实施方案中任一项的平台,其中所述梭菌属物种被改造以表达作为CFPS阳性效应物的上调基因产物。
实施方案7.实施方案6的平台,其中用于CFPS的阳性效应物选自大肠杆菌ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr及其任何组合的梭菌属同系物。
实施方案8.前述实施方案中任一项的平台,其中所述梭菌属物种被改造以缺乏释放因子1。
实施方案9.前述实施方案中任一项的平台,其中所述梭菌属物种被改造以表达T7RNA聚合酶。
实施方案10.前述实施方案中任一项的平台,其中所述细胞培养物处于静止期。
实施方案11.实施方案10的平台,其中静止期被定义为具有大于约3.0的OD600的细胞培养物。
实施方案12.前述实施方案中任一项的平台,其中细胞提取物包含细胞培养物的S12级分和/或S30级分。
实施方案13.前述实施方案中任一项的平台还包括以下中的一个或多个:(i)反应缓冲液;(ii)RNA聚合酶;(iii)转录模板,其中RNA聚合酶能够转录转录模板以形成翻译模板,并且细胞提取物能够通过组合的转录/翻译反应维持蛋白质合成。
实施方案14.前述实施方案中任一项的平台,还包含一个或多个选自以下的组分:(i)氨基酸,其任选地可以包括非规范氨基酸并且任选地浓度在约0.5-4.0mM之间并且优选地约2mM;(ii)NTP;(iii)总浓度任选地在约50–400mM之间的盐;(iv)大分子拥挤剂,任选地为聚乙二醇或Ficol;(iv)辅因子;(v)能量源和任选的包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP));(vi)翻译模板;(vii)转录模板;(viii)依赖DNA的RNA聚合酶(例如,T7RNA聚合酶);(ix)它们的任何组合。
实施方案15.前述实施方案中任一项的平台,还包含能量源和任选地包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP)),其中所述能量源以大于约30mM、40mM、50mM、60mM、70mM、80mM或90mM(优选大于约67mM),但小于约100mM,或在由这些值中的任一个界定的浓度范围内的浓度存在。
实施方案16.前述实施方案中任一项的平台,还包含钾(K+)源,其中所述平台包含浓度大于约10mM、20mM、30mM或50mM,但小于约500mM、400mM、300mM或200mM,或在由这些值中的任一个界定的浓度范围内,优选约100mM的钾;和/或前述权利要求中任一项的平台,还包含镁(Mg+)源,其中所述平台包含浓度大于约1mM、2mM、3mM、4mM、5mM、6mM、8mM、12mM、16mM、20mM、24mM或28mM,但小于约60mM、56mM、52mM、48mM、44mM、40mM或36mM,或在由这些值中的任一个界定的浓度范围内,优选约32mM的镁。
实施方案17.前述实施方案中任一项的平台,其中整个平台或其一个或多个组分通过冷冻干燥保存。
实施方案18.前述实施方案中任一项的平台,其中所述细胞提取物通过包括以下步骤中的一个或多个的方法制备:(i)细胞悬浮和裂解(例如,通过超声处理);(ii)径流反应;和(iii)透析。
实施方案19.一种用于体外转录mRNA和/或体外翻译mRNA以制备多肽的方法,该方法包括从转录模板转录mRNA和/或在前述实施方案中任一项的平台中翻译mRNA。
实施方案20.实施方案19的方法,其中该方法包括在平台中转录DNA模板以提供翻译的mRNA。
实施方案21.实施方案19或20的方法,其中所述DNA模板编码包括促进有效转录和/或翻译的修饰的mRNA,任选地其中所述修饰存在于5'-UTR、3'UTR或两者中。
实施方案22.实施方案19-21中任一项的方法,其中该方法在约20-40℃之间的温度下进行。
实施方案23.根据实施方案19-22中任一项的方法,其中该方法作为分批反应进行。
实施方案24.实施方案19-22中任一项的方法,其中该方法作为半连续反应进行。
实施方案25.实施方案19-22中任一项的方法,其中该方法作为连续反应进行。
实施方案26.根据实施方案19-25中任一项的方法,其中该方法在厌氧条件下进行。
实施方案27.根据实施方案19-25中任一项的方法,其中该方法在有氧条件下进行。
实施方案28.包含作为组分的试剂盒:(a)从梭菌属物种的细胞培养物中制备的细胞提取物;(b)用于转录和/或翻译mRNA的反应混合物,任选地其中所述梭菌属物种是产乙醇梭菌。
实施方案29.实施方案28的试剂盒,其中反应混合物包含一种或多种选自由以下组成的组的组分:(i)氨基酸,其任选地可以包括非规范氨基酸;(ii)NTP;(iii)盐类;(iv)辅因子;(v)能量源和任选的包含磷酸基团的能量源(例如磷酸烯醇丙酮酸(PEP));(vi)它们的任何组合。
实施方案30.梭菌属的重组物种,任选地产乙醇梭菌,其中所述梭菌属物种被改造以缺乏无细胞蛋白质合成(CFPS)的阴性效应物。
实施方案31.实施方案30的梭菌属的重组物种,其中用于CFPS阴性效应物选自大肠杆菌endA、mazF、rna、rnb、rne、gor、lon、ompT、gdhA、gshA、sdaA、sdaB、speA、WaaL、tnaA、glpK及其任何组合的梭菌属同系物。
实施方案32.实施方案30或31的梭菌属的重组物种,其中所述梭菌属物种被改造以表达作为CFPS阳性效应物的上调基因产物。
实施方案33.实施方案32的梭菌属的重组物种,其中用于CFPS的阳性效应物选自大肠杆菌ackA、ndk、pykF、cdd、dsbC、dnaK、dnaJ、crpE、tig、groS、groL、infA、infB、fusA、efp、lepA、tufB、hslR、ffr及其任何组合的梭菌属同系物。
实施方案34.实施方案30-33中任一项的梭菌属的重组物种,其中所述梭菌属的物种被改造以缺乏释放因子1。
实施方案35.实施方案30-34中任一项的梭菌属的重组物种,其中所述梭菌属的物种已被基因组重新编码以用不同的密码子替换一个或多个终止密码子。
实施方案36.根据实施方案30-35中任一项的梭菌属的重组物种,其中所述梭菌属的物种被改造以表达T7 RNA聚合酶。
实施方案37.一种用于鉴定和表征梭菌属遗传部分和用于转录和/或翻译的梭菌属基因表达的方法,该方法包括:(a)形成梭菌属遗传部分或梭菌属变异基因序列的测试文库(例如,一种或更多的测试启动子、测试终止子、测试核糖体结合位点等);和(b)测试测试文库的遗传部分和/或在平台中表达的替代密码子,该平台包括:(i)从梭菌属制备的细胞提取物;(ii)用于转录和/或翻译mRNA的反应混合物
实施例
以下实施例是说明性的,不应被解释为限制要求保护的主题的范围。
A.简述
梭菌属是经过工业验证的微生物,具有出色的底物灵活性和代谢物多样性以及对代谢终产物和污染物的耐受性,使其适用于许多代谢工程应用。气体发酵梭菌属对可持续生化生产特别有吸引力,因为它们具有将废碳转化为低成本燃料和高价值化合物的潜力。不幸的是,设计和改造这些非模式生物仍然费力且成本高昂。在努力加速菌株工程的过程中,我们开发一种简单、稳健且高产的好氧梭菌属无细胞系统,用于体外代谢途径工程的酶表达原型。在这里,我们提出提取物制备和加工以及无细胞反应条件的系统优化以实现梭菌属特异性启动子、编码序列和代谢的原型设计。我们的系统源自工业相关厌氧菌产乙醇梭菌,并且在分批反应中产生>200μg/mL的活性荧光素酶,并且在半连续反应模式下产生>300μg/mL。这种不需要厌氧条件的易于使用的系统为梭菌属中不依赖氧的代谢工程工作原型提供极好的平台,例如转录和翻译以及由抗氧酶组成的代谢途径,这将扩展梭菌属代谢工程的“工具箱”并加快梭菌菌株工程工作。
B.介绍
微生物可以被改造成生产生物燃料和高价值化合物,如化学品、材料和治疗剂(Keasling,2012;Nielsen和Keasling,2016),以应对人口快速增长、能源需求增加和废物产生等现代挑战(Nielsen等,2014)。然而,即使是用于优化给定化合物在模式生物(如大肠杆菌和酵母)中的生物合成途径的最先进的设计-构建-测试循环仍需要数周到数月的时间,并且与这些生物相关的基于过程的挑战仍然存在(例如,有限的底物范围、添加酶的成本、CO2损失导致的产量降低、易受污染和遗传不稳定性)(Keasling,2012;Nielsen和Keasling,2016)。这些挑战阻碍新生物产品制造工艺的更快商业化,迄今为止,除了乙醇发酵外,只有少数成功商业化(Meadows等,2016;Nakamura和Whited,2003;Nielsen等,2014;Yim等,2011)。此外,大肠杆菌和酵母本质上缺乏某些细胞特征,这限制反应空间的多样性和最终可以制造的产品。因此,大多数工业生物过程(例如,氨基酸的合成)(Leuchtenberger等,2005)、丙酮-丁醇-乙醇(ABE)(Jiang等,2015;Jones,2005)、有机酸(Ghaffar等,2014;Rodriguez等,2014;Wee等,2006)依赖其他生物。
梭菌属是这样的一类生物,经过工业验证并且具有出色的底物和代谢物多样性,以及对代谢终产物和污染物的耐受性(Tracy等,2012)。梭菌的工业大规模发酵已经进行100多年,其中ABE发酵是仅次于乙醇发酵的第二大工业发酵过程(Jones,2005)。除ABE梭菌属(溶解性),还存在能够降解木质纤维素生物质(纤维素分解)的梭菌属物种和能够在C1底物(例如一氧化碳(CO)和CO2(产乙酸)上自养生长)的物种(Tracy等,2012)。产乙酸梭菌的气体发酵为合成气的转化提供有吸引力的途径,合成气可以从任何生物质资源(例如农业废物或未分类和不可回收的城市固体废物)和工业废物资源(例如来自钢厂、加工厂或炼油厂的废气))产生为燃料和化学品。然而,当前现有技术的梭菌属的菌株工程仍然是低通量、劳动密集型的努力。具体挑战包括生物体特定的遗传限制(Daniell等,2015;Joseph等,2018;Liew等,2016、2017;Nagaraju等,2016)、厌氧环境的要求,以及在产乙酸菌的情况下,气体处理。因此,梭菌属生物技术和梭菌属生物学基础知识的发展落后于需氧原核和真核生物学的成就。需要新的强大工具来研究梭菌并加快这些生物体中生物过程的设计、构建和测试。
基于提取物的无细胞系统正在成为合成生物学应用(如代谢工程)的强大平台(Bujara等,2011;Carlson等,2012;Dudley等,2019;Hodgman和Jewett,2012;Karim等,2019;Karim和Jewett,2016;Kelwick等,2017;Morgado等等,2018)。在无细胞环境中组装代谢途径传统上是通过组装纯化的酶和底物来完成的。然而,无细胞蛋白质合成(CFPS)系统的发展已经改变构建和测试通路的方式。这些系统由粗细胞提取物、能量底物、辅助因子和DNA形式的遗传指令组成,并促进试管中细胞过程的激活、操作和使用。虽然无细胞系统历来被用于研究基础生物学(例如遗传密码)(Nirenberg和Matthaei,1961)、无细胞蛋白质合成能力的最新发展(Caschera和Noireaux,2014;Jewett等,2008;Jewett和Swartz,2004)扩大应用空间以包括重组蛋白的批量生产(Garamella等,2016;Jaroentomeechai等,2018;Kwon等,2013)、纸质诊断(Gootenberg等,2017;Pardee等,2016、2014;Salehi等,2017;Takahashi等,2018)、按需生物制造(Karig等,2017;Pardee等,2016;Sullivan等,2016)、遗传部分的原型设计(Chappell等,2013;Marshall等,2018;Moore,Simon J.;MacDonald,James T.;Wienecke,Sarah;Ishwarbhai,Alka;Tsipa,Argyro;Aw,Rochelle;Kylilis,Nicolas;Bell,David J.,McClymont,David W.;Jensen,Kirsten;Polizzi,Karen M.;Biedendieck,Rebekka;Freemont,2018;Siegal-Gaskins等,2014;Melissa K Takahashi等,2015;Melissa K.Takahashi等,2015;Yim等,2019)和研究整个代谢途径(Bujara等,2011;Dudley等,2019;Karim等,2019;Karim和Jewett,2016;Kelwick等,2017)。这些系统具有三个关键优势:首先,这些系统没有细胞壁,因此可以进行主动监测、快速采样和直接操作,从而实现前所未有的设计自由,以控制、修改和设计所需的生物过程。其次,因为基因指令可以简单地以质粒DNA或线性PCR产物的形式加到CFPS反应中,它们避免了费力的克隆和转化步骤,从而可以在几个小时内而不是几天或几周内促进基因设计的测试。第三,这种方法不依赖耗时的酶纯化程序,而是通过体外合成所需的酶,直接在细胞提取物中快速建立和测试代谢途径(Karim等,2018;Karim和Jewett,2016)。
直到最近,无细胞系统大多是使用大肠杆菌和其他模式生物提取物开发的。这很重要,因为基于提取物的CFPS应用的范围是由所选的源生物和细胞收获和提取物制备时存在的生化资源预先确定的。这表示底盘生物独有的代谢酶、细胞机器(如翻译系统)以及辅助因子和能量再生系统也是该生物的独特提取物。最常用的CFPS系统来自大肠杆菌(细菌)(Carlson等,2012;Hodgman和Jewett,2012)、小麦胚芽(植物)(Madin等,2000;Takai等,2010)、草地夜蛾(Spodoptera frugiperda)(昆虫)(Ezure等,2010;Tarui等,2001),和兔网织红细胞(哺乳动物)(Anastasina等,2014;Kobs,2008;Pelham和Jackson,1976),其他正在开发中(Ferrer-Miralles等,2009;Gan和Jewett,2014;Hodgman和Jewett,2013),(Kovtun等,2010;Mureev等,2009),(等,2014;Martin等,2017),(王等,2018)(Mikami等,2010)(Kelwick等,2016)。然而,源自非模式生物的CFPS系统直到最近才被开发出来,最显著的是来自古细菌物种(Endoh等,2008、2007、2006)、芽孢杆菌(Moore,Simon J.;MacDonald,James T.;Wienecke,Sarah;Ishwarbhai,Alka;Tsipa,Argyro;Aw,Rochelle;Kylilis,Nicolas;Bell,David J.,McClymont,David W.;Jensen,Kirsten;Polizzi,KarenM.;Biedendieck,Rebekka;Freemont,2018)、链霉菌(Li等,2018,2017)和弧菌(Des Soye等,2018;Failmezger等,2018;Wiegand等,2018)。迄今为止,还没有梭菌无细胞系统能够产生足以构建遗传部分和代谢途径原型的蛋白质产量。在无细胞系统中研究梭菌属生物合成途径仅限于将大肠杆菌无细胞结果转化为梭菌细胞性能(Karim等,2019)。虽然这些努力可以成功地告知梭菌菌株工程尝试,但由于提取物中存在的大肠杆菌和梭菌属代谢之间的差异,它们受到限制。我们假设基于梭菌属提取物的无细胞平台将进一步提高对成功途径设计的预测,因为这些提取物可能更好地模拟生物体的自然代谢。
在这里,我们展示第一个易于使用、强大且高产的梭菌属CFPS平台,该平台源自工业相关菌株产乙醇梭菌,可促进无细胞合成生物学应用。我们通过使用最适合大肠杆菌系统的提取物制备和CFPS反应条件以及梭菌密码子适应的萤火虫萤光素酶作为报告蛋白,开始开发梭菌属CFPS系统。然后,我们通过系统地优化两个步骤的关键参数来调整提取物制备和CFPS反应条件,以适应梭菌属提取物。最后,我们展示我们的系统进行梭菌特异性原型设计的能力:通过在内源性启动子+来自梭菌属代谢酶的5'UTR控制下从构建体表达荧光素酶或通过利用不同的基因编码序列以及提取物中的梭菌属代谢途径的活性来原型设计梭菌属遗传部分(图1)。我们的系统在批量反应中产生>200μg/mL的活性荧光素酶,并且在半连续反应模式下产生>300μg/mL,能够检测因使用不同内源性启动子或编码序列而产生的基因表达差异,并显示梭菌属糖酵解中的代谢活性/糖异生和相关通路。据我们所知,所提出的系统是第一个源自专性厌氧菌的高产和强大的CFPS系统。其在有氧条件下对氧不敏感的生物过程进行原型设计的能力可以简化和加速梭菌属生物过程开发的代谢工程工作。
C.结果与讨论
开发能够从新生物体进行无细胞蛋白质合成(CFPS)的系统需要在多个层面进行优化。生物体的选择、发酵条件、提取物制备和加工以及无细胞反应条件均在CFPS平台中发挥着重要作用。在这项工作中,我们的目标是开发第一个简单、强大且高产的梭菌属衍生CFPS系统,使用工业相关的梭菌菌株作为我们的源生物,即产乙醇梭菌。基于为该生物建立厌氧发酵条件的广泛优化(Heijstra等,2017;Valgepea等,2017),我们选择修复微生物生长和收获条件。在这里,我们描述(1)建立有氧的、基于梭菌的无细胞系统,(2)确定有益的提取物加工步骤,以及(3)优化反应条件以实现基于梭菌的遗传部分和细胞代谢在无细胞环境中的原型设计。
1.使用产乙醇梭菌提取物优化CFPS中的Mg(Glu)2浓度
我们通过探索在有氧条件下制备时的CFPS能力并使用高产BL21大肠杆菌系统的提取物制备和CFPS条件,开始开发基于产乙醇梭菌的无细胞系统(Kwon和Jewett,2015)。简而言之,我们将产乙醇梭菌细胞重新悬浮在含有醋酸盐的缓冲液中,使用每毫升细胞悬浮液640J的总超声输入能量通过超声裂解它们,并以12,000xg离心它们以澄清裂解物(图2A,左图)。所得提取物用于在30℃下通过PANOx-SP能量再生系统驱动的CFPS(Jewett和Swartz,2004)并含有8mM Mg(Glu)2、33mM磷酸烯醇式丙酮酸(PEP)、2mM所有同源氨基酸、100mM还原烟酰胺腺嘌呤二核苷酸(NAD+)和50mM辅酶A(CoA)(图2A,中间)。我们选择萤火虫荧光素酶作为报告蛋白,因为它已在梭菌属中得到证明(Feustel等,2004)并且它的表达可以经由高度敏感的生物发光测定来检测,不仅证明提取物的蛋白质合成能力,而且还证明正确折叠的能力。为此,在T7启动子的控制下,我们将萤火虫荧光素酶基因的梭菌属密码子适应变体克隆到我们的CFPS表达载体pJL1中,将构建体加到CFPS反应中,并通过发光跟踪CFPS中荧光素酶的表达2.75小时。虽然表达少量荧光素酶,我们观察到在反应过程中发光增加和减少,表明提取物中存在一些蛋白质合成活性(图2A,右图)。
该结果促使我们对加到CFPS反应中的镁进行初步优化,因为它已被显示是CFPS产率的最关键因素之一(Des Soye等,2018;Hodgman和Jewett,2013;Jewett和Swartz,2004;Kwon和Jewett,2015;Li等,2017;Martin等,2017;Wang等,2018)。我们将表达荧光素酶的CFPS反应设置为2.75小时,将Mg(Glu)2浓度调整为8mM至36mM。≥20mM的Mg(Glu)2浓度显著增加荧光素酶表达超过五个数量级(图2B),最佳浓度为32mM Mg(Glu)2。这个结果令人惊讶,因为大肠杆菌提取物的最佳浓度往往在8mM至12mM Mg(Glu)2的范围内(Jewett和Swartz,2004;Kwon和Jewett,2015)。镁在无细胞反应中的一个主要作用是清除游离的无机磷酸盐(通过磷酸化能源积累),它可以抑制驱动蛋白质表达的代谢反应。不希望受理论束缚,我们推测梭菌属提取物可以比大肠杆菌提取物含有或产生更多的无机磷酸盐。与梭菌属提取物中存在的其他离子,尤其是铁(许多关键酶的辅助因子)的竞争、协同或抵消作用,可能是需要如此高浓度镁的另一个原因。这些结果证明有希望进一步开发基于有氧梭菌属提取物的CFPS系统。因此,我们寻求逐步调整提取物制备和CFPS条件以提高无细胞性能。
2.调整产乙醇梭菌的提取物制备和加工增加CFPS产量并将Mg(Glu)2最佳浓度转 向更多生理浓度
制备的粗细胞提取物的质量在很大程度上取决于细胞的裂解方式(在此过程中相关蛋白质可能会受到伤害)以及裂解物的处理方式(即径流反应、透析),这对CFPS具有显著影响(Carlson等,2012;Gregorio等,2019;Kwon和Jewett,2015)。在CFPS系统上工作,例如大肠杆菌(Kwon和Jewett,2015;Silverman等,2019)、酿酒酵母(Hodgman和Jewett,2013)和需钠弧菌(Des Soye等,2018)已经证明可以通过系统地优化每个提取物制备和加工步骤来提高提取物的稳定性和生产率。因此,我们探索两者的关键参数(图3A),从导致细胞壁破裂的裂解条件开始。使用超声作为我们的裂解方法,因为它简单、可重复且价格低廉(Kwon和Jewett,2015),我们在250J至910J的不同超声输入能量下以50%振幅裂解1mL重悬的产乙醇梭菌细胞,10秒开启和10秒关闭(图3B)。我们通过离心澄清裂解物并测试提取物对CFPS的能力。与最初使用的640J相比,较高的输入能量会降低CFPS的产量,而较低的能量是有益的。最佳值为350J,使荧光素酶表达增加约30%。我们的结果表明,当输入能量高于490J时,参与蛋白质合成的核糖体或其他脆弱的细胞组分会被破坏,从而损害提取物的CFPS活性。
两个常见的裂解后处理步骤、径流和透析,可以提高CFPS提取物的质量。径流包括在37℃下孵育提取物,这可以提高提取物的蛋白质合成生产率(Kwon和Jewett,2015)。在生理温度下的额外时间可能使核糖体“跑掉”天然mRNA,然后这些mRNA可能会被内源性RNase降解,同时释放出核糖体用于合成重组蛋白(Jermutus等,1998;Nirenberg和Matthaei,1961)。为了测试径流步骤的效果,我们在37℃超声处理后孵育澄清的裂解物短(45分钟)和长(80分钟)时间,通过离心再次澄清它们并比较它们的蛋白质合成活性。我们发现径流显著降低荧光素酶的表达(图3C)。45分钟的径流几乎使荧光素酶量减半,而较长的孵育时间(80分钟)将产量降低到三分之一。由于我们在离心后观察到相对较大的不溶性物质沉淀,我们怀疑CFPS的减少是由于不稳定和氧敏感性蛋白质的损失引起的,这些蛋白质对蛋白质合成直接或间接必不可少(例如酶和能量代谢中的辅因子,如铁氧还蛋白或对氧极度敏感的丙酮酸:铁氧还蛋白氧化还原酶(Meinecke等,1989)或关键的电子分叉酶(Mock等,2015)。
与径流相反,透析通过允许透析缓冲液和提取物之间的小分子交换来改变提取物的组成。如果此步骤从提取物中去除小的抑制性分子,例如无机磷酸盐,则此步骤可能有益并增加CFPS产量(Gregorio等,2019;Silverman等,2019)。为了测试透析的影响,我们在4℃的S30缓冲液中对超声处理后的澄清裂解物进行3次透析45分钟,并比较几种Mg(Glu)2浓度下的荧光素酶表达。我们发现透析并没有显著影响整体提取生产力,而是将Mg(Glu)2最佳浓度从32mM降低到生理浓度更高的24mM(图3D)。我们推测,在CFPS期间导致其产生的无机磷酸盐或分子离开提取物,从而减少所需的镁以抵消其抑制作用。基于这些结果,我们接下来着手使用现在包括透析的提取物制备和处理方案来优化CFPS反应条件。
3.调整CFPS反应条件进一步改善基于产乙醇梭菌提取物的CFPS
无细胞反应的物理化学环境对无细胞功能很重要。例如,当我们改变Mg(Glu)2浓度时,我们看到蛋白质合成生产率发生巨大变化。到目前为止,我们主要使用最适合BL21大肠杆菌的理化反应条件(Kwon和Jewett,2015)(图4A)。然而,产乙醇梭菌的蛋白质组和代谢与大肠杆菌的代谢显著不同(Kracke等,2016;Marcellin等,2016;Valgepea等,2018、2017),因此需要进行理化优化以改善基于产乙醇梭菌提取物的CFPS。因此,我们着手系统地调整反应温度、参与能量再生的关键CFPS组分、氨基酸和辅因子浓度、提取物浓度和氧气可用性以及DNA模板。
首先,我们研究CFPS反应温度。尽管大肠杆菌的最佳生长温度是37℃,但基于大肠杆菌的CFPS在30℃下效果最佳。虽然在较低温度下整体活性可能会变慢,但RNase和蛋白酶活性也会降低,从而增加重组mRNA转录物和合成蛋白质的半衰期,从而增强无细胞系统中的整体蛋白质合成能力。为了在产乙醇梭菌提取物中测试这种效果,我们将CFPS的温度设置为16℃、23℃、30℃和37℃(图7)。我们发现16℃和23℃使荧光素酶表达分别降低至48±2%和71±4%。有趣的是,虽然在30℃和37℃下荧光素酶的CFPS在前30分钟内类似地增加,但荧光素酶发光在37℃下在5.75小时后逐渐降低至9±1%。该结果表明,在37℃下,提取物中的蛋白酶活性非常高,导致荧光素酶降解,其产生无法弥补。因此,30℃是基于产乙醇梭菌的CFPS的最佳温度。
接下来,我们探索了产乙醇梭菌提取物中CFPS的能量再生。蛋白质合成是一个非常耗能的过程,需要在转录和翻译过程中再生ATP。现有技术的基于大肠杆菌的PANOx-SP能量再生系统中ATP的主要来源(Jewett和Swartz,2004)是磷酸烯醇式丙酮酸(PEP)通过丙酮酸激酶(PyK)转化为丙酮酸。虽然该反应发生在产乙醇梭菌中,但Wood-Ljungdahl途径和乙酰磷酸激酶(AcK)反应在生成用于蛋白质合成的ATP方面更为活跃(Brown等,2014;Kracke等,2016;Liew等,2017)。由于大肠杆菌和产乙醇梭菌代谢的差异,我们假设PEP可能不是最理想的能源。为了确定在有氧条件下产乙醇梭菌提取物的最佳能量再生系统,我们测试不同浓度的PEP、乙酰磷酸(AcP)和甲酸盐,这是一种关键的Wood-Ljungdahl途径代谢物。为了减轻由于需氧提取物制备而导致提取物中底物代谢酶的潜在下调或氧化损伤,我们还测试用PEP和AcK补充0.67mg/mL纯化重组PyK和AcP和甲酸盐。我们发现在存在除PEP外的其他底物时几乎没有荧光素酶表达(图4B)。我们进一步研究“PEP+PyK”能量再生系统中不同的PEP浓度(图8A)。有趣的是,与单独的PEP相比,PEP加丙酮酸激酶(PyK)将CFPS产率降低约20%。这种抑制作用可能是由含有甘油的PyK储存缓冲液引起的,也可能是由PEP加速转化为丙酮酸引起的副反应和/或副产物引起的。此外,我们看到45mM PEP在添加和不添加PyK的情况下都是最佳的,在两种条件下产生类似的荧光素酶表达(图8A;图4C)。因此,我们保持不具有PyK的PEP作为能量再生系统,并选择45mM作为我们前进的新浓度。
在优化提取能源后,我们评估氨基酸(AA)和辅因子浓度,因为它们是优化基于大肠杆菌提取物的CFPS的重要组成部分。在大肠杆菌提取物中,补充2mM AA可确保蛋白质合成和背景代谢有足够的可用性(Martin等,2018)。为了优化基于产乙醇梭菌的CFPS的AA浓度,我们将AA浓度改变为0-5mM(图4D)。高于2mM的浓度会逐渐降低CFPS的产量,而将AA减少到1mM会略微增加荧光素酶的表达。此外,我们发现在CFPS一小时后第二次补充AA对CFPS产量没有显著影响(图9)。此外,NAD+和CoA在氧化还原平衡和代谢方面都具有重要作用,并且被加到CFPS反应中以确保提取物的代谢活性驱动蛋白质合成的ATP生产。与大肠杆菌相反,产乙醇梭菌使用NADP(H)进行许多分解代谢反应,且丙酮酸氧化为乙酰辅酶A不依赖于NAD(H),但依赖于氧不稳定的铁氧还蛋白(Meinecke等,1989;Mock等,2015)。除这些差异外,需氧产乙醇梭菌基于CFPS可能会影响氧化还原状态,并且辅助因子的比例可能会发生变化。因此,我们试图检查辅因子组成对基于产乙醇梭菌提取物的CFPS的影响。我们在有或没有NADP(H)或NAD(H)以及有或没有CoA的情况下确定CFPS中的荧光素酶表达(图4E)。有趣的是,我们发现从试剂混合物中排除CoA和NAD(P)(H)可将荧光素酶表达提高三分之一。这些结果共同为我们选择1mM AA以及我们今后放弃补充辅助因子的决定提供信息。
在确定CFPS反应缓冲液的浓度后,我们接下来测试CFPS的其他两种组分:提取物和DNA模板。在其他基于提取物的CFPS系统中,增加提取物量被认为是有益的(李等,2018),因此我们在CFPS上测试不同体积的产乙醇梭菌提取物。然而,我们没有观察到蛋白质合成有任何改善(图10A)。梭菌属以其高核酸外切酶活性而闻名(Nakotte等,1998)。DNA模板可以以质粒或线性DNA形式加入,并对CFPS具有浓度依赖性影响(Nakotte等,1998)。我们首先测试从我们最初的6nM质粒DNA增加质粒DNA浓度是否会改善产乙醇梭菌提取物中的CFPS,因为这对其他CFPS系统有帮助(李等,2017)。我们测试0-30nM的质粒DNA,发现浓度≥15nM可使荧光素酶表达增加约10-15%(图11A)。然后我们测试线性DNA模板是否可以用于基于产乙醇梭菌提取物的CFPS。使用通过PCR制备的线性模板可以加快制备时间,但可能对细胞提取物中的核酸外切酶敏感。为了测试它们在基于产乙醇梭菌提取物的CFPS中的适用性,我们使用标准寡核苷酸引物和含有硫代磷酸酯(PS)键(图6A中的表)以增加线性模板稳定性。比较来自含有等摩尔DNA模板的反应的CFPS,我们发现线性PCR产物确实是基于产乙醇梭菌提取物的CFPS中的合适模板(图11A)。使用由标准引物制备的PCR产物仅将CFPS产量降低约10%。然而,令人惊讶的是,在5'和3'末端包含PS键的线性模板将CFPS产率降低到50%。我们还确定由标准引物制成的PCR产物的最佳浓度,发现它是33.3nM,产生的荧光素酶表达与使用质粒模板获得的荧光素酶表达相当(图11C)。
在优化CFPS反应的组成部分后,我们最后评估反应器的操作条件,特别是氧气可用性反应模式(即间歇与半连续)。我们通过改变反应体积但保持反应管几何形状恒定以有效改变反应的表面积与体积比来研究氧气可用性对基于产乙醇梭菌的CFPS反应的影响。降低该比率会降低氧气的可用性并降低反应中的有效氧气浓度,从而降低其代谢可用性,这对基于大肠杆菌提取物的CFPS有害(Voloshin和Swartz,2005)。我们通过在1.5mL反应管中进行15-90μL反应来测试这种对基于产乙醇梭菌的CFPS的影响,并将它们的荧光素酶表达与之前使用的40μL反应进行比较。
通过运行15μL反应增加氧气可用性导致荧光素酶表达减少约20%。然而,降低氧气可用性并没有显示出显著差异(图10B)。我们还测试以半连续方式运行反应,提供底物补充和副产物(例如,无机磷酸盐)去除是否可以进一步提高基于产乙醇梭菌的CFPS的表达产率。为了测试这个问题,我们在由半透膜(3.5kDa截断值)分隔的两个隔室中进行CFPS反应(一个是完全反应;另一个是没有提取物的反应缓冲液)。小分子可以在两个隔室之间自由扩散,而代谢酶和翻译机制保留在反应隔室中。我们观察到半连续反应中的活性荧光素酶比分批反应高37±14%(图4F)。使用所有优化条件(CFPS试剂浓度、提取体积、DNA模板浓度)(图6B中的表),我们以分批模式制备235.95±24.11μg/ml的荧光素酶,在半连续反应模式下制备322.71±63.99μg/ml(图12)。
4.基于产乙醇梭菌提取物的CFPS促进代谢工程努力的遗传部分和代谢的原型设 计
简单、强大和高效的基于梭菌属的无细胞平台的两个最吸引人的应用是基因表达测试和代谢途径原型设计,因为它们可以加速费力的产乙醇梭菌工程工作(图5A)。事实上,梭菌属中的代谢工程工作将受益于“工具箱”,其中包括启动子、核糖体结合位点和可以与单个或分组基因组合组装的终止子。(Joseph等,2018)。因此,我们通过研究(1)密码子适应效应、(2)内源性RNA聚合酶的使用和(3)生物合成酶的表达来评估在无细胞环境中测试基因表达的能力。首先,我们使用针对两种不同梭菌属,即丙酮丁醇梭菌(Cac)、产乙醇梭菌(Cae)和一种需氧菌大肠杆菌(Eco)进行密码子适应的荧光素酶基因序列比较荧光素酶表达含量(产乙醇梭菌的GC含量为31.1%)(Brown等,2014)。我们发现,与来自产乙醇梭菌适应序列的荧光素酶表达相比,丙酮丁醇梭菌适应的荧光素酶表达减少20%,而适用于大肠杆菌的序列表达的荧光素酶减少约75%(图5B,右图)。这些结果与由Salis RBS计算器确定的预测翻译率(Salis等,2009)以及基因序列的GC含量(图13)相关。这提供基于产乙醇梭菌的CFPS系统可用于遗传部分原型设计的原理证明。其次,我们通过将T7启动子和我们表达载体的5'UTR与三个不同的梭菌属天然启动子区域(pPta-Ack、pPFOR和pWL)交换来研究内源性RNA聚合酶的活性,这些区域已用于在过去的基因表达(刘等,2016),并比较它们的CFPS产量。我们检测到来自内源性启动子的荧光素酶表达范围为2-7.5μg/mL(图5B,左图)。正如预期的那样,在产乙醇梭菌提取物中,基于天然启动子的表达是基于T7启动子的表达的~5%。第三,我们想测试除荧光素酶外的重组蛋白的全长合成。因此,我们在基于产乙醇梭菌的CFPS中表达了三种不同蛋白质长度的重组酶。所有三种酶都以全长和可比量表达(图5C)。通过一些优化,天然启动子可用于构建基于梭菌属的遗传回路和生物传感器,并且全长重组蛋白的表达将有助于在无细胞环境中构建代谢途径,为梭菌的代谢工程提供信息。
无细胞环境中的代谢途径原型使我们能够在操纵细胞代谢之前探测内源性代谢和生物合成途径。我们试图使用基于产乙醇梭菌的提取物来鉴定体外活性代谢途径。虽然我们完全期望本文介绍的有氧无细胞系统与源厌氧生物明显不同,但我们预计无细胞系统可用于鉴定关键代谢物,从中可以开发和测试新的生物合成路线。为了检测产乙醇梭菌提取物中的活性代谢途径,我们通过GC-MS在有和没有PEP以及有和没有用于蛋白质合成的DNA模板的情况下确定3小时CFPS反应过程中的代谢组。我们鉴定44种代谢物:4-羟基丁酸;磷酸(烯醇)丙酮酸;3-磷酸甘油酸;2-磷酸甘油酸;α-酮戊二酸;6-磷酸葡萄糖;草苹果酸;(S)-(-)-2-羟基异己酸;23-二羟基异戊酸;丙氨酸;羟基丙酮酸;吲哚-3-乳酸;琥珀酸;丝氨酸;丙二酸;乙酰乙酸盐;乳酸;4-二羟基丁酸;1/3-磷酸甘油;胸腺嘧啶;天冬氨酸;赖氨酸;2-磷酸甘油;甘油;缬氨酸;5-氧代脯氨酸;草酸;谷氨酸;苯丙氨酸;甘氨酸;二硫苏糖醇(ox);乙醇酸;色氨酸;3-羟基丙酸;腐胺;蛋氨酸;脯氨酸;尿嘧啶;亮氨酸;单硬脂酸;异亮氨酸;苏氨酸;黄嘌呤;和肌苷。
加入CFPS的DNA模板对代谢物谱仅产生很小的影响,这在以前在大肠杆菌无细胞系统中已经观察到(Karim等,2018),导致我们将PEP处理和CFPS反应时间相同的样品集集中在一起。我们根据CFPS期间产乙醇梭菌提取物中的广义碳通量将检测到的代谢物分为特定的合成代谢和分解代谢反应(图5D)。令人兴奋的是,对于大多数已识别的代谢物,我们在CFPS期间检测到浓度变化,强烈表明其相应生物合成和降解途径的代谢活动(图5E-H)。在比较PEP条件时,我们观察到大规模效应。例如,加入PEP会立即增加糖酵解/糖异生中间体3-磷酸甘油酸、2-磷酸甘油酸和葡萄糖6-磷酸的浓度(图5E)。此外,几种有机酸被上调,包括参与TCA循环和碳固定到生物质中的代谢物,如α-酮戊二酸、琥珀酸、乙醇酸和丙二酸(图5F)。在含有PEP的CFPS反应中消耗的代谢物包括嘌呤和嘧啶途径中间体肌苷、黄嘌呤和尿嘧啶(图5G)以及氨基酸蛋氨酸(图5H)。总之,我们观察糖酵解/糖异生的代谢物和相关途径,包括核苷酸合成、不完整的TCA循环、碳固定、氨基酸和甘油脂途径。我们没有观察到朝向乙酰辅酶A和相关途径的碳通量。该观察结果表明,将丙酮酸转化为乙酰辅酶A的酶、丙酮酸:铁氧还蛋白氧化还原酶(PFOR)在需氧产乙醇梭菌提取物中是无活性的,如对其他梭菌属所述(Meinecke等,1989)。这些结果共同表明,开发的产乙醇梭菌无细胞系统确实可以用于测试不依赖氧气的遗传部分和途径的文库。
接下来,我们研究系统对代谢途径进行原型设计的能力。为了对此进行测试,我们选择将丙酮酸转化为2,3-丁二醇(2,3-BDO)作为示例途径。使用优化的产乙醇梭菌CFPS反应条件,我们单独或组合表达乙酰乳酸合成酶(AcLacS)、乙酰乳酸脱羧酶(ACLacDC)、仲醇脱氢酶(SecAlcDH)和2,3-丁二醇脱氢酶(BDODH)并确定2,3-BDO、乙醇、乙酸盐和乳酸盐在3h CFPS前和后使用HPLC的生产。我们发现,与没有或单独表达酶的反应相比,所有酶的联合表达确实增加2,3-BDO的生产。
D.讨论
在这项工作中,我们提出一种新颖、强大、高产的CFPS系统,该系统源自非模型厌氧细菌产乙醇梭菌,可以扩展梭菌属代谢工程的“工具箱”并帮助加速菌株工程工作。我们确定该生物的最佳提取物制备条件,证明产乙醇梭菌提取物对高于490J的裂解能量敏感,但在较低能量下相对一致。与基于大肠杆菌的系统相比,这种较低的输入能量方便地将提取物制备时间减半。
令人惊讶的是,产乙醇梭菌CFPS需要异常高的镁浓度。虽然,在提取物处理方案中包括透析步骤降低32mM的初始最佳值,但24mM仍然是一个很高的需求。通过专门针对产乙醇梭菌优化其他CFPS组分,我们能够在分批反应模式下在3小时内产生超过230μg/mL的荧光素酶。该产率高于源自其他模型和非模型生物,如兔网织红细胞(Anastasina等,2014)、古生菌(Endoh等,2008、2007、2006)、酵母(Gan和Jewett,2014;Hodgman和Jewett,2013)、昆虫(Ezure等,2010)的大多数其他CFPS系统,据,并且显著高于源自发明人所知的革兰氏(+)细菌的其他CFPS系统,例如参见枯草芽孢杆菌(Kelwick等,2016)、巨大芽孢杆菌(Moore,Simon J.;MacDonald,James T.;Wienecke,Sarah;Ishwarbhai,Alka;Tsipa,Argyro;Aw,Rochelle;Kylilis,Nicolas;Bell,David J.,McClymont,David W.;Jensen,Kirsten;Polizzi,Karen M.;Biedendieck,Rebekka;Freemont,2018)和链霉菌(Li等,2018,2017)。通过进行半连续反应,我们在4小时内将产率提高到高于320μg/mL。仅源自CHO细胞(Martin等,2017)、需钠弧菌(Des Soye等,2018)、小麦胚芽(Harbers,2014)和大肠杆菌(Caschera和Noireaux,2014)的CFPS系统已被证明具有更高的生产力。
我们预计我们的优化工作流程可以为梭菌属物种的CFPS系统开发铺平道路,包括产溶剂或纤维素分解梭菌以及医学相关梭菌属。进一步优化CFPS反应条件有助于延长CFPS反应持续时间,从而进一步提高蛋白质产量,厌氧系统的发展可以更好地模拟梭菌的细胞环境。因为我们的系统将提取物暴露在氧气中,我们假设氧敏感蛋白质,包括代谢酶,受到损坏,无法被内源性梭菌抗氧化机制拯救。或者,用抗氧化系统补充有氧系统可以挽救可逆的氧化蛋白质损伤。
我们证明我们的系统适用于遗传部分原型设计。虽然我们只测试几个启动子和基因编码序列,但获得的数据表明,我们基于产乙醇梭菌的CFPS系统与荧光素酶报告基因检测相结合,具有足够的灵敏度和动态性,可以检测转录和翻译相关的表达差异。重要的是,我们的系统允许对需要被内源性转录机制识别的天然启动子进行原型设计。这是我们系统的一个特别强大的功能。梭菌属代谢工程最常用的启动子来自少数菌株,通常不能转移到非本地宿主。能够表征启动子部分并快速和高通量地测试调整可以对梭菌属代谢工程产生巨大影响。展望未来,我们希望我们的系统与液体处理器相结合,可以快速构建数百个遗传部分的原型。
我们开发的系统显示天然途径的代谢活动。尽管提取物的氧气暴露可能会使PFOR等氧敏感酶失活,但我们在与糖酵解相关的几个途径中检测到代谢活动。通过比较有和没有能量底物PEP的CFPS期间代谢物浓度的变化,我们扣除提取物中的一般碳通量。展望未来,我们预计确定的活性途径和全长重组酶表达能力可用于无细胞代谢工程。总之,这里开发的基于产乙醇梭菌的CFPS系统为原型设计不依赖于氧的梭菌属代谢工程工作,例如转录和翻译以及具有抗氧酶的代谢途径提供一个极好的平台。
我们还展示所开发系统对通路原型设计的适用性。当在一锅CFPS反应中表达所有酶时,参与丙酮酸转化为2,3-BDO的天然代谢酶的表达增加2,3-BDO的生产。单独或组合的酶表达也影响EtOH的产生,而乳酸和乙酸盐的产生没有观察到差异。未来的努力通过在梭菌属提取物中使用无细胞代谢工程来测试不同酶同系物的不同组合和优化通路性能,可能会进一步改善滴度和通路性能,为体内代谢工程工作提供信息。
E.材料和方法
菌株和质粒构建体本研究中使用产乙醇梭菌DSM 23693。DSM 23693是DSM10061型菌株的衍生物(Heijstra等,2016)。本研究中使用的基因序列和寡核苷酸在图6和14以及SEQ ID列表中提供。
CFPS的密码子适应荧光素酶基因通过IDT合成,使用Gibson组装克隆到pJL1质粒中,并通过ACGT,Inc.的Sanger测序确认。卡那霉素(50μg/mL)用于维持基于pJL1的质粒。磷酸转乙酰酶-乙酸激酶操纵子(pPta-Ack;CAETHG_RS16490)、丙酮酸:甲酸氧化还原酶(pPFOR;CAETHG_RS14890)和Wood-Ljungdahl簇(pWL;CAETHG_RS07860)的产乙醇梭菌内源性启动子从质粒中扩增,其中相应的序列已从基因组中扩增并克隆到pMTL82250载体报告质粒中(Nagaraju等,2016)并使用Gibson组装克隆以代替pJL1-LucCae构建体中的T7启动子区域,并通过ACGT,Inc.的Sanger测序确认。
细胞培养和收获产乙醇梭菌发酵在工作体积为6L的10-L生物反应器中在37℃和含CO的气体(50%CO、10%H2、20%CO2、20%N2)作为唯一的能源和碳源下在如前所述细菌生长速率接近1天-1下进行(王等,2013)。在收获细胞前,用K2CO3将培养物的pH值调节至pH 6。在冰上收集五升培养物。将培养物在1L离心瓶之间分配,细胞以5000xg沉淀10分钟。倒出上清液,除去残留液体。将沉淀物重新悬浮在~300mL的50mM K2PO4(pH 7.5)中。将重悬液转移到50-mL-Falcon管中,并且细胞在5000xg下沉淀15分钟。弃去上清液,将沉淀立即冷冻在液体N2上并储存在-80℃下。
提取物制备将细胞沉淀解冻并悬浮在每克湿细胞质量0.33mL S30缓冲液(10mMTris(CH3COO)(pH8.2)、14mM Mg(CH3COO)2、10mM K(CH3COO)、4mM DTT)中。将细胞悬液以1mL等分试样转移到1.5mL微管中。在20kHz频率和50%振幅下使用具有3.175mm探头直径的Q125超声仪(Qsonica,Newtown,CT,USA),将细胞裂解数个10秒开启/10秒关闭循环,直到达到最终输入能量。超声处理期间将样品保存在冰水浴中,以最大限度地减少超声处理引起的潜在热变性。对于每1mL细胞悬液等分试样,输入能量为~70焦耳/超声处理周期。随后,裂解物在4℃下以12,000×g离心10分钟,收集上清液,在液氮中快速冷冻,并在-80℃下储存直至使用。对于流出反应,将第一次澄清离心的上清液转移到新管中,在37℃下孵育45分钟或80分钟,在4℃下以12,000x g离心10分钟清除,收集上清液,在液氮中闪蒸冷冻,并在-80℃下储存直至使用。使用具有3.5kDa截止值的Slide-A-LyzerTM透析盒(ThermoScientific,Rockford,IL,USA)进行透析。提取物用150mL S30缓冲液/mL提取物在4℃下透析3次45分钟,然后在4℃下以12,000×g离心10分钟清除。收集上清液,在液氮中快速冷冻,并在-80℃下储存直至使用。
CFPS反应改善的PANOx-SP系统用于CFPS反应。简而言之,如果没有另外说明,在1.5mL微管中通过混合以下组分制备40-60μL CFPS反应:1.2mM ATP;GTP、UTP和CTP各0.85mM;34μg/mL亚叶酸;170μg/mL大肠杆菌tRNA混合物;16μg/mL T7 RNA聚合酶;20种标准氨基酸中的每一种2mM;0.33mM烟酰胺腺嘌呤二核苷酸(NAD);0.27mM辅酶A(CoA);1.5mM亚精胺;1mM腐胺;4mM草酸钠;8mM谷氨酸镁;10mM谷氨酸铵;130mM谷氨酸钾;57mM HEPES(pH7.2);33mM磷酸烯醇式丙酮酸(PEP)和33%(v/v)的细胞提取物。除非另有说明,特定产物的合成是通过向每个反应加入6nM编码感兴趣基因的pJL1模板质粒开始的,并且每个CFPS反应在30℃下孵育。由于在整个研究过程中优化各个试剂浓度,因此从那时起,它们确定的最佳值用于所有反应。大肠杆菌总tRNA混合物(来自MRE600菌株)和PEP购自Roche AppliedScience(Indianapolis,IN,USA);ATP、GTP、CTP、UTP、20种氨基酸和其他材料购自Sigma(St.Louis,MO,USA),未经进一步纯化。如前所述在内部纯化T7RNAP(Martin等,2018)。
活性荧光素酶的定量使用ONE-Glo荧光素酶检测系统(Promega,Madison,WI,USA)、Synergy 2读板器(BioTek,Winooski,VT,USA)和96孔半区白板((Costar 3694;Corning,Corning,NY))测定CFPS中的荧光素酶表达。使用4μl CFPS反应液与30μl荧光素酶测定缓冲液混合进行测定。使用BioTek Synergy 2读板器(Winooski,VT,USA)在30分钟内每3分钟检测一次发光。记录每个反应的最大相对光单位(RLU)量。然后使用使用放射性标记的荧光素酶确定的线性标准曲线将RLU转化为μg/mL的量。为此,除了所有20种标准氨基酸外,还使用放射性14C-亮氨酸(10μM)进行CFPS反应。然后使用三氯乙酸(TCA)沉淀放射性标记的蛋白质样品,并使用MicroBeta2(PerkinElmer,Waltham,MA)通过液体闪烁测量其放射性计数,以量化如前报告的可溶性和总荧光素酶产率(Jewett等,2008;Jewett和Swartz,2004)。
半连续CFPS反应90μL CFPS半连续反应使用3.5kDa MWCO 96孔板透析盒(ThermoScientific,Rockford,IL,USA)在装有1.4mL透析缓冲液的2mL微量离心管中进行。反应在Eppendorf Thermomixer C中在30℃和600rpm下孵育,并与在相同条件下进行的60μL分批反应进行比较。
气相色谱-质谱法(GC-MS)。通过GC-MS分析梭菌CFPS反应样品。简而言之,将在分析前储存在-80℃的样品解冻并在4℃下以12,000rpm的速度离心15分钟。将5μl的等分试样转移到含有10μl山梨糖醇(1mg/ml水溶液)用作内标的小瓶中,然后在N2气流下干燥。将干燥的样品溶解在250μl甲硅烷基化级乙腈中,然后加入250μl N-甲基-N-(三甲基甲硅烷基)三氟乙酰胺(MSTFA)和1%三甲基氯硅烷(TMCS)(Thermo Scientific,Bellefonte,PA)并在70℃下加热1小时以生成三甲基甲硅烷基衍生物。在2天后,将1μl等分试样注射到与配备RTX-5MS(5%二苯基/95%二甲基聚硅氧烷)30m×250μm×0.25μm膜厚毛细管柱的5975C惰性XL MS偶联的Agilent Technologies 7890A GC 5m Integra-Guard色谱柱。气流为每分钟1.0ml,并且注射口配置为不分流注射。初始烘箱温度为50℃,并保持2分钟,然后以每分钟20℃的速度升温至325℃,并再保持11.5分钟。MS在标准电子碰撞(70eV)电离模式下运行。注射口、MS传输线、MS源和MS四极杆温度分别为250℃、300℃、230℃和150℃。用户形成的大型数据库和商用Wiley Registry第10版与NIST 14质谱数据库相结合,用于鉴定感兴趣的代谢物。通过使用提取离子色谱图(EIC)而不是总离子流色谱图对峰进行量化,利用关键的选定离子特征m/z碎片,以最大限度地减少共流出的代谢物。使用预先确定的比例因子将EIC缩放回TIC,量化基于面积积分,并归一化为回收的内标量、处理的样品体积、衍生体积和注射体积。
放射自显影放射自显影用于确定在产乙醇梭菌CFPS中合成的合成代谢酶的质量。除了所有20种标准氨基酸外,还使用放射性14C-亮氨酸(10μM)进行CFPS反应。在孵育3.5小时后,按照制造商的说明将4μl CFPS反应液加载到NuPAGE 4-12%Bis-Tris Gel(LifeTechnologies,Carlsbad,CA,USA)上。NuPAGE凝胶用InstantBlue(Expedeon,Cambridgeshire,UK)染色。将凝胶干燥并在Storage Phosphor Screen(GE HealthcareBiosciences,Chicago,IL,USA)上暴露14天,并用Typhoon FLA 7000(GE HealthcareBiosciences)成像。该图像与包含蛋白质标准梯的染色图像进行数字比较以确定合成蛋白质的长度。
参考文献
Anastasina,M.,Terenin,I.,Butcher,S.J.,Kainov,D.E.,2014.A technique toincrease protein yield in a rabbit reticulocyte lysate translationsystem.Biotechniques 56.https://doi.org/10.2144/000114125
A.K.,Sonnabend,A.,Kubick,S.,2014.Cell-free protein expressionbased on extracts from CHO cells.Biotechnol.Bioeng.111,25–36.https://doi.org/10.1002/bit.25013
Brown,S.D.,Nagaraju,S.,Utturkar,S.,De Tissera,S.,Segovia,S.,Mitchell,W.,Land,M.L.,Dassanayake,A.,M.,2014.Comparison of single-moleculesequencing and hybrid approaches for finishing the genome of Clostridiumautoethanogenum and analysis of CRISPR systems in industrial relevantClostridia.Biotechnol.Biofuels 7,40.https://doi.org/10.1186/1754-6834-7-40
Bujara,M.,Schümperli,M.,Pellaux,R.,Heinemann,M.,Panke,S.,2011.Optimization of a blueprint for in vitro glycolysis by metabolic real-time analysis.Nat.Chem.Biol.7,271–277.https://doi.org/10.1038/nchembio.541
Carlson,E.D.,Gan,R.,Hodgman,C.E.,Jewett,M.C.,2012.Cell-free proteinsynthesis:Applications come of age.Biotechnol.Adv.30,1185–1194.https://doi.org/10.1016/J.BIOTECHADV.2011.09.016
Caschera,F.,Noireaux,V.,2014.Synthesis of 2.3mg/ml of protein with anall Escherichia coli cell-free transcription–translation system.Biochimie 99,162–168.https://doi.org/10.1016/J.BIOCHI.2013.11.025
Chappell,J.,Jensen,K.,Freemont,P.S.,2013.Validation of an entirely invitro approach for rapid prototyping of DNA regulatory elements for syntheticbiology.Nucleic Acids Res.41,3471–3481.https://doi.org/10.1093/nar/gkt052
Daniell,J.,Nagaraju,S.,Burton,F.,M.,Simpson,S.D.,2015.Low-CarbonFuel and Chemical Production by Anaerobic Gas Fermentation.Springer,Cham,第293–321页.https://doi.org/10.1007/10_2015_5005
Des Soye,B.J.,Davidson,S.R.,Weinstock,M.T.,Gibson,D.G.,Jewett,M.C.,2018.Establishing a High-Yielding Cell-Free Protein Synthesis PlatformDerived from Vibrio natriegens.ACS Synth.Biol.7,2245–2255.https://doi.org/10.1021/acssynbio.8b00252
Dudley,Q.M.,Nash,C.J.,Jewett,M.C.,2019.Cell-free biosynthesis oflimonene using enzyme-enriched Escherichia coli lysates.Synth.Biol.(Oxford,England)4.https://doi.org/10.1093/SYNBIO/YSZ003
Endoh,T.,Kanai,T.,Imanaka,T.,2008.Effective approaches for theproduction of heterologous proteins using the Thermococcus kodakaraensis-based translation system.J.Biotechnol.133,177–182.https://doi.org/10.1016/J.JBIOTEC.2007.08.036
Endoh,T.,Kanai,T.,Imanaka,T.,2007.A highly productive system forcell-free protein synthesis using a lysate of the hyperthermophilic archaeon,Thermococcus kodakaraensis.Appl.Microbiol.Biotechnol.74,1153–1161.https://doi.org/10.1007/s00253-006-0753-3
Endoh,T.,Kanai,T.,Sato,Y.T.,Liu,D.V.,Yoshikawa,K.,Atomi,H.,Imanaka,T.,2006.Cell-free protein synthesis at high temperatures using the lysate ofa hyperthermophile.J.Biotechnol.126,186–195.https://doi.org/10.1016/J.JBIOTEC.2006.04.010
Ezure,T.,Suzuki,T.,Shikata,M.,Ito,M.,Ando,E.,2010.A Cell-Free ProteinSynthesis System from Insect Cells,in:Methods in Molecular Biology.HumanaPress,pp.31–42.https://doi.org/10.1007/978-1-60327-331-2_4
Failmezger,J.,Scholz,S.,Blombach,B.,Siemann-Herzberg,M.,2018.Cell-Free Protein Synthesis From Fast-Growing Vibrio natriegens.Front.Microbiol.9,1146.https://doi.org/10.3389/fmicb.2018.01146
Ferrer-Miralles,N.,Domingo-Espín,J.,Corchero,J.,Vázquez,E.,Villaverde,A.,2009.Microbial factories for recombinantpharmaceuticals.Microb.Cell Fact.8,17.https://doi.org/10.1186/1475-2859-8-17
Feustel,L.,Nakotte,S.,Dürre,P.,2004.Characterization and Developmentof Two Reporter Gene Systems for Clostridium acetobutylicum.Appl.Environ.Microbiol.70,798–803.https://doi.org/10.1128/AEM.70.2.798-803.2004
Gan,R.,Jewett,M.C.,2014.A combined cell-free transcription-translation system from Saccharomyces cerevisiae for rapid and robust proteinsynthe.Biotechnol.J.9,641–651.https://doi.org/10.1002/biot.201300545
Garamella,J.,Marshall,R.,Rustad,M.,Noireaux,V.,2016.The All E.coliTX-TL Toolbox 2.0:A Platform for Cell-Free Synthetic Biology.ACS Synth.Biol5,355.https://doi.org/10.1021/acssynbio.5b00296
Ghaffar,T.,Irshad,M.,Anwar,Z.,Aqil,T.,Zulifqar,Z.,Tariq,A.,Kamran,M.,Ehsan,N.,Mehmood,S.,2014.Recent trends in lactic acid biotechnology:A briefreview on production to purification.J.Radiat.Res.Appl.Sci.7,222–229.https://doi.org/10.1016/J.JRRAS.2014.03.002
Gootenberg,J.S.,Abudayyeh,O.O.,Lee,J.W.,Essletzbichler,P.,Dy,A.J.,Joung,J.,Verdine,V.,Donghia,N.,Daringer,N.M.,Freije,C.A.,Myhrvold,C.,Bhattacharyya,R.P.,Livny,J.,Regev,A.,Koonin,E.V,Hung,D.T.,Sabeti,P.C.,Collins,J.J.,Zhang,F.,2017.Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438–442.https://doi.org/10.1126/science.aam9321
Gregorio,N.E.,Levine,M.Z.,Oza,J.P.,2019.A User’s Guide to Cell-FreeProtein Synthesis.Methods Protoc.2.https://doi.org/10.3390/mps2010024
Harbers,M.,2014.Wheat germ systems for cell-free proteinexpression.FEBS Lett.588,2762–2773.https://doi.org/10.1016/j.febslet.2014.05.061
Heijstra,B.D.,Kern,E.,Koepke,M.,Segovia,S.,Liew,F.,2016.NOVELBACTERIA AND METHODS OF USE THEREOF.
Heijstra,B.D.,Leang,C.,Juminaga,A.,2017.Gas fermentation:cellularengineering possibilities and scale up.Microb.Cell Fact.16,60.https://doi.org/10.1186/s12934-017-0676-y
Hodgman,C.E.,Jewett,M.C.,2013.Optimized extract preparation methodsand reaction conditions for improved yeast cell-free proteinsynthesis.Biotechnol.Bioeng.110,2643–2654.https://doi.org/10.1002/bit.24942
Hodgman,C.E.,Jewett,M.C.,2012.Cell-free synthetic biology:Thinkingoutside the cell.Metab.Eng.14,261–269.https://doi.org/10.1016/J.YMBEN.2011.09.002
Jaroentomeechai,T.,Stark,J.C.,Natarajan,A.,Glasscock,C.J.,Yates,L.E.,Hsu,K.J.,Mrksich,M.,Jewett,M.C.,DeLisa,M.P.,2018.Single-pot glycoproteinbiosynthesis using a cell-free transcription-translation system enriched withglycosylation machinery.Nat.Commun.9,2686.https://doi.org/10.1038/s41467-018-05110-x
Jermutus,L.,Ryabova,L.A.,Plückthun,A.,1998.Recent advances inproducing and selecting functional proteins by using cell-free translation.Curr.Opin.Biotechnol.9,534–548.https://doi.org/10.1016/S0958-1669(98)80042-6
Jewett,M.C.,Calhoun,K.A.,Voloshin,A.,Wuu,J.J.,Swartz,J.R.,2008.Anintegrated cell-free metabolicplatform for protein production and syntheticbiology.Mol.Syst.Biol.https://doi.org/10.1038/msb.2008.57
Jewett,M.C.,Swartz,J.R.,2004.Mimicking theEscherichia colicytoplasmic environment activates long-lived and efficient cell-free proteinsynthesis.Biotechnol.Bioeng.86,19–26.https://doi.org/10.1002/bit.20026
Jiang,Y.,Liu,J.,Jiang,W.,Yang,Y.,Yang,S.,2015.Current status andprospects of industrial bio-production of n-butanol inChina.Biotechnol.Adv.33,1493–1501.https://doi.org/10.1016/J.BIOTECHADV.2014.10.007
Jones,D.T.,2005.Applied Acetone-Butanol Fermentation,in:Clostridia.Wiley-VCH Verlag GmbH,Weinheim,FRG,pp.125–168.https://doi.org/10.1002/3527600108.ch5
Joseph,R.C.,Kim,N.M.,Sandoval,N.R.,2018.Recent Developments of theSynthetic Biology Toolkit for Clostridium.Front.Microbiol.9,154.https://doi.org/10.3389/fmicb.2018.00154
Karig,D.K.,Bessling,S.,Thielen,P.,Zhang,S.,Wolfe,J.,2017.Preservationof protein expression systems at elevated temperatures for portabletherapeutic production.J.R.Soc.Interface 14,20161039.https://doi.org/10.1098/rsif.2016.1039
Karim,A.S.,Dudley,Q.M.,Juminaga,A.,Yuan,Y.,Crowe,S.A.,Heggestad,J.T.,Abdalla,T.,Grubbe,W.,Rasor,B.,Coar,D.,Torculas,M.,Krein,M.,Liew,F.,Quattlebaum,A.,Jensen,R.O.,Stuart,J.,Simpson,S.D.,M.,Jewett,M.C.,2019.Invitro prototyping and rapid optimization of biosynthetic enzymes for cellulardesign.bioRxiv.https://doi.org/10.1101/685768
Karim,A.S.,Heggestad,J.T.,Crowe,S.A.,Jewett,M.C.,2018.Controllingcell-free metabolism through physiochemical perturbations.Metab.Eng.45,86–94.https://doi.org/10.1016/J.YMBEN.2017.11.005
Karim,A.S.,Jewett,M.C.,2016.A cell-free framework for rapidbiosynthetic pathway prototyping and enzyme discovery.Metab.Eng.36,116–126.https://doi.org/10.1016/J.YMBEN.2016.03.002
Keasling,J.D.,2012.Synthetic biology and the development of tools formetabolic engineering.Metab.Eng.14,189–195.https://doi.org/10.1016/J.YMBEN.2012.01.004
Kelwick,R.,Ricci,L.,Mei Chee,S.,Bell,D.,Webb,A.J.,Freemont,P.S.,Freemont,P.,2017.Cell-free prototyping strategies for enhancing thesustainable production of polyhydroxyalkanoates bioplastics.bioRxiv.https://doi.org/10.1101/225144
Kelwick,R.,Webb,A.J.,MacDonald,J.T.,Freemont,P.S.,2016.Development ofa Bacillus subtilis cell-freetranscription-translation system for prototypingregulatory elements.Metab.Eng.38,370–381.https://doi.org/10.1016/J.YMBEN.2016.09.008
Kobs,G.,2008.Selecting the cell-free protein expression system thatmeets your experimental goals.Promega Coop.Madison,WI,USA.
Kovtun,O.,Mureev,S.,Johnston,W.,Alexandrov,K.,2010.Towards theConstruction of Expressed Proteomes Using a Leishmania tarentolae Based Cell-Free Expression System.PLoS One 5,e14388.https://doi.org/10.1371/journal.pone.0014388
Kracke,F.,Virdis,B.,Bernhardt,P.V.,Rabaey,K.,J.O.,2016.Redoxdependent metabolic shift in Clostridium autoethanogenum by extracellularelectron supply.Biotechnol.Biofuels 9,249.https://doi.org/10.1186/s13068-016-0663-2
Kwon,Y.-C.,Jewett,M.C.,2015.High-throughput preparation methods ofcrude extract for robust cell-free protein synthesis.Sci.Rep.5,8663.https://doi.org/10.1038/srep08663
Kwon,Y.-C.,Oh,I.-S.,Lee,N.,Lee,K.-H.,Yoon,Y.J.,Lee,E.Y.,Kim,B.-G.,Kim,D.-M.,2013.Integrating cell-free biosyntheses of heme prosthetic groupand apoenzyme for the synthesis of functional P450 monooxygenase.Biotechnol.Bioeng.110,1193–1200.https://doi.org/10.1002/bit.24785
Leuchtenberger,W.,Huthmacher,K.,Drauz,K.,2005.Biotechnologicalproduction of amino acids and derivatives:current status and prospects.Appl.Microbiol.Biotechnol.69,1–8.https://doi.org/10.1007/s00253-005-0155-y
Li,J.,Wang,H.,Jewett,M.C.,2018.Expanding the palette of Streptomyces-based cell-free protein synthesis systems with enhancedyields.Biochem.Eng.J.130,29–33.https://doi.org/10.1016/J.BEJ.2017.11.013
Li,J.,Wang,H.,Kwon,Y.-C.,Jewett,M.C.,2017.Establishing a highyielding streptomyces-based cell-free protein synthesissystem.Biotechnol.Bioeng.114,1343–1353.https://doi.org/10.1002/bit.26253
Liew,F.,Henstra,A.M.,M.,Winzer,K.,Simpson,S.D.,Minton,N.P.,2017.Metabolic engineering of Clostridium autoethanogenum for selectivealcohol production.Metab.Eng.40,104–114.https://doi.org/10.1016/J.YMBEN.2017.01.007
Liew,F.,Martin,M.E.,Tappel,R.C.,Heijstra,B.D.,Mihalcea,C.,M.,2016.Gas Fermentation-A Flexible Platform for Commercial Scale Production ofLow-Carbon-Fuels and Chemicals from Waste and RenewableFeedstocks.Front.Microbiol.|www.frontiersin.org 7.https://doi.org/10.3389/fmicb.2016.00694
Madin,K.,Sawasaki,T.,Ogasawara,T.,Endo,Y.,2000.A highly efficient androbust cell-free protein synthesis system prepared from wheat embryos:plantsapparently contain a suicide system directed at ribosomes.Proc.Natl.Acad.Sci.U.S.A.97,559–64.https://doi.org/10.1073/pnas.97.2.559
Marcellin,E.,Behrendorff,J.B.,Nagaraju,S.,DeTissera,S.,Segovia,S.,Palfreyman,R.W.,Daniell,J.,Licona-Cassani,C.,Quek,L.,Speight,R.,Hodson,M.P.,Simpson,S.D.,Mitchell,W.P.,M.,Nielsen,L.K.,2016.Low carbon fuels andcommodity chemicals from waste gases–systematic approach to understand energymetabolism in a model acetogen.Green Chem.18,3020–3028.https://doi.org/10.1039/C5GC02708J
Marshall,R.,Maxwell,C.S.,Collins,S.P.,Jacobsen,T.,Luo,M.L.,Begemann,M.B.,Gray,B.N.,January,E.,Singer,A.,He,Y.,Beisel,C.L.,Noireaux,V.,2018.Rapidand Scalable Characterization of CRISPR Technologies Using an E.coli Cell-Free Transcription-Translation System.Mol.Cell 69,146-157.e3.https://doi.org/10.1016/J.MOLCEL.2017.12.007
Martin,R.W.,Des Soye,B.J.,Kwon,Y.-C.C.,Kay,J.,Davis,R.G.,Thomas,P.M.,Majewska,N.I.,Chen,C.X.,Marcum,R.D.,Weiss,M.G.,Stoddart,A.E.,Amiram,M.,RanjiCharna,A.K.,Patel,J.R.,Isaacs,F.J.,Kelleher,N.L.,Hong,S.H.,Jewett,M.C.,2018.Cell-free protein synthesis from genomically recoded bacteria enablesmultisite incorporation of noncanonical amino acids.Nat.Commun.9,1–9.https://doi.org/10.1038/s41467-018-03469-5
Martin,R.W.,Majewska,N.I.,Chen,C.X.,Albanetti,T.E.,Jimenez,R.B.C.,Schmelzer,A.E.,Jewett,M.C.,Roy,V.,2017.Development of a CHO-Based Cell-FreePlatform for Synthesis of Active Monoclonal Antibodies.ACS Synth.Biol.6,1370–1379.https://doi.org/10.1021/acssynbio.7b00001
Meadows,A.L.,Hawkins,K.M.,Tsegaye,Y.,Antipov,E.,Kim,Y.,Raetz,L.,Dahl,R.H.,Tai,A.,Mahatdejkul-Meadows,T.,Xu,L.,Zhao,L.,Dasika,M.S.,Murarka,A.,Lenihan,J.,Eng,D.,Leng,J.S.,Liu,C.-L.,Wenger,J.W.,Jiang,H.,Chao,L.,Westfall,P.,Lai,J.,Ganesan,S.,Jackson,P.,Mans,R.,Platt,D.,Reeves,C.D.,Saija,P.R.,Wichmann,G.,Holmes,V.F.,Benjamin,K.,Hill,P.W.,Gardner,T.S.,Tsong,A.E.,2016.Rewriting yeast central carbon metabolism for industrial isoprenoid production.Nat.Publ.Gr.537.https://doi.org/10.1038/nature19769
Meinecke,B.,Bertram,J.,Gottsehalk,G.,1989.Purification andcharacterization of the pyruvate-ferredoxin oxidoreductase from Clostridiumacetobutylicum,Arch Microbiol.
Mikami,S.,Kobayashi,T.,Imataka,H.,2010.Cell-Free Protein SynthesisSystems with Extracts from Cultured Human Cells,in:Methods in MolecularBiology.Humana Press,pp.43–52.https://doi.org/10.1007/978-1-60327-331-2_5
Mock,J.,Zheng,Y.,Mueller,A.P.,Ly,S.,Tran,L.,Segovia,S.,Nagaraju,S.,M.,Dürre,P.,Thauer,R.K.,2015.Energy Conservation Associated with EthanolFormation from H2 and CO2 in Clostridium autoethanogenum Involving ElectronBifurcation.J.Bacteriol.197,2965–80.https://doi.org/10.1128/JB.00399-15
Moore,Simon J.;MacDonald,James T.;Wienecke,Sarah;Ishwarbhai,Alka;Tsipa,Argyro;Aw,Rochelle;Kylilis,Nicolas;Bell,David J.,McClymont,David W.;Jensen,Kirsten;Polizzi,Karen M.;Biedendieck,Rebekka;Freemont,P.S.,2018.Rapidacquisition and model-based analysis of cell-free transcription–translationreactions from nonmodel bacteria.Proc.Natl.Acad.Sci.115,E4340–E4349.https://doi.org/10.1073/pnas.1715806115
Morgado,G.,Gerngross,D.,Roberts,T.M.,Panke,S.,2018.Synthetic biologyfor cell-free biosynthesis:Fundamentals of designing novel in vitro multi-enzyme reaction networks,in:Advances in Biochemical Engineering/Biotechnology.Springer,Cham,pp.117–146.https://doi.org/10.1007/10_2016_13
Mureev,S.,Kovtun,O.,Nguyen,U.T.T.,Alexandrov,K.,2009.Species-independent translational leaders facilitate cell-freeexpression.Nat.Biotechnol.27,747–752.https://doi.org/10.1038/nbt.1556
Nagaraju,S.,Davies,N.K.,Jeffrey,D.,Walker,F.,M.,Simpson,S.D.,2016.Genome editing of Clostridium autoethanogenum using CRISPR/Cas9.Biotechnol Biofuels 9,219.https://doi.org/10.1186/s13068-016-0638-3
Nakamura,C.E.,Whited,G.M.,2003.Metabolic engineering for themicrobial production of 1,3-propanediol.Curr.Opin.Biotechnol.14,454–459.https://doi.org/10.1016/J.COPBIO.2003.08.005
Nakotte,S.,Schaffer,S.,M.,Dürre,P.,1998.Electroporation of,plasmid isolation from and plasmid conservation in Clostridium acetobutylicumDSM 792.Appl.Microbiol.Biotechnol.50,564–567.
Nielsen,J.,Fussenegger,M.,Keasling,J.,Lee,S.Y.,Liao,J.C.,Prather,K.,Palsson,B.,2014.Engineering synergy in biotechnology.Nat.Chem.Biol.10,319–322.https://doi.org/10.1038/nchembio.1519
Nielsen,J.,Keasling,J.D.,2016.Engineering Cellular Metabolism.Cell164,1185–1197.https://doi.org/10.1016/J.CELL.2016.02.004
Nirenberg,M.W.,Matthaei,J.H.,1961.The dependence of cell-free proteinsynthesis in E.coli upon naturally occurring or synthetic polyribonucleotides.Proc.Natl.Acad.Sci.U.S.A.47,1588–602.https://doi.org/10.1073/pnas.47.10.1588
Pardee,K.,Green,A.A.,Ferrante,T.,Cameron,D.E.,DaleyKeyser,A.,Yin,P.,Collins,J.J.,2014.Paper-Based Synthetic Gene Networks.Cell 159,940–954.https://doi.org/10.1016/J.CELL.2014.10.004
Pardee,K.,Slomovic,S.,Nguyen,P.Q.,Lee,J.W.,Donghia,N.,Burrill,D.,Ferrante,T.,McSorley,F.R.,Furuta,Y.,Vernet,A.,Lewandowski,M.,Boddy,C.N.,Joshi,N.S.,Collins,J.J.,2016.Portable,On-Demand BiomolecularManufacturing.Cell 167,248-259.e12.https://doi.org/10.1016/J.CELL.2016.09.013
Pelham,H.R.B.,Jackson,R.J.,1976.An Efficient mRNA-DependentTranslation System from Reticulocyte Lysates.Eur.J.Biochem.67,247–256.https://doi.org/10.1111/j.1432-1033.1976.tb10656.x
Rodriguez,B.A.,Stowers,C.C.,Pham,V.,Cox,B.M.,2014.Green ChemistryPERSPECTIVE The production of propionic acid,propanol and propylene via sugarfermentation:an industrial perspective on the progress,technical challengesand future outlook.https://doi.org/10.1039/c3gc42000k
Salehi,A.S.M.,Shakalli Tang,M.J.,Smith,M.T.,Hunt,J.M.,Law,R.A.,Wood,D.W.,Bundy,B.C.,2017.Cell-Free Protein Synthesis Approach to Biosensing hTRβ-Specific Endocrine Disruptors.Anal.Chem.89,3395–3401.https://doi.org/10.1021/acs.analchem.6b04034
Salis,H.M.,Mirsky,E.A.,Voigt,C.A.,2009.Automated design of syntheticribosome binding sites to control protein expression.Nat.Biotechnol.27,946–950.https://doi.org/10.1038/nbt.1568
Siegal-Gaskins,D.,Tuza,Z.A.,Kim,J.,Noireaux,V.,Murray,R.M.,2014.GeneCircuit Performance Characterization and Resource Usage in a Cell-Free“Breadboard.”ACS Synth.Biol.3,416–425.https://doi.org/10.1021/sb400203p
Silverman,A.D.,Kelley-Loughnane,N.,Lucks,J.B.,Jewett,M.C.,2019.Deconstructing Cell-Free Extract Preparation for in Vitro Activation ofTranscriptional Genetic Circuitry.ACS Synth.Biol.8,403–414.https://doi.org/10.1021/acssynbio.8b00430
Sullivan,C.J.,Pendleton,E.D.,Sasmor,H.H.,Hicks,W.L.,Farnum,J.B.,Muto,M.,Amendt,E.M.,Schoborg,J.A.,Martin,R.W.,Clark,L.G.,Anderson,M.J.,Choudhury,A.,Fior,R.,Lo,Y.-H.,Griffey,R.H.,Chappell,S.A.,Jewett,M.C.,Mauro,V.P.,Dresios,J.,2016.A cell-free expression and purification process for rapidproduction of protein biologics.Biotechnol.J.11,238–248.https://doi.org/10.1002/biot.201500214
Takahashi,Melissa K.,Chappell,J.,Hayes,C.A.,Sun,Z.Z.,Kim,J.,Singhal,V.,Spring,K.J.,Al-Khabouri,S.,Fall,C.P.,Noireaux,V.,Murray,R.M.,Lucks,J.B.,2015.Rapidly Characterizing the Fast Dynamics of RNA Genetic Circuitry withCell-Free Transcription–Translation(TX-TL)Systems.ACS Synth.Biol.4,503–515.https://doi.org/10.1021/sb400206c
Takahashi,Melissa K,Hayes,C.A.,Chappell,J.,Sun,Z.Z.,Murray,R.M.,Noireaux,V.,Lucks,J.B.,2015.Characterizing and prototyping genetic networkswith cell-free“translation reactions.METHODS.https://doi.org/10.1016/j.ymeth.2015.05.020
Takahashi,M.K.,Tan,X.,Dy,A.J.,Braff,D.,Akana,R.T.,Furuta,Y.,Donghia,N.,Ananthakrishnan,A.,Collins,J.J.,2018.A low-cost paper-based syntheticbiology platform for analyzing gut microbiota and hostbiomarkers.Nat.Commun.9,3347.https://doi.org/10.1038/s41467-018-05864-4
Takai,K.,Sawasaki,T.,Endo,Y.,2010.Practical cell-free proteinsynthesis system using purified wheat embryos.Nat.Protoc.5,227–238.https://doi.org/10.1038/nprot.2009.207
Tarui,H.,Murata,M.,Tani,I.,Imanishi,S.,Nishikawa,S.,Hara,T.,2001.Establishment and characterization of cell-free translation/glycosylation in insect cell(Spodoptera frugiperda 21)extract prepared withhigh pressure treatment.Appl.Microbiol.Biotechnol.55,446–453.https://doi.org/10.1007/s002530000534
Tracy,B.P.,Jones,S.W.,Fast,A.G.,Indurthi,D.C.,Papoutsakis,E.T.,2012.Clostridia:the importance of their exceptional substrate and metabolitediversity for biofuel and biorefinery applications.Curr.Opin.Biotechnol.23,364–381.https://doi.org/10.1016/J.COPBIO.2011.10.008
Valgepea,K.,de Souza Pinto Lemgruber,R.,Abdalla,T.,Binos,S.,Takemori,N.,Takemori,A.,Tanaka,Y.,Tappel,R.,M.,Simpson,S.D.,Nielsen,L.K.,Marcellin,E.,2018.H2drives metabolic rearrangements in gas-fermentingClostridium autoethanogenum.Biotechnol.Biofuels 11,55.https://doi.org/10.1186/s13068-018-1052-9
Valgepea,K.,de Souza Pinto Lemgruber,R.,Meaghan,K.,Palfreyman,R.W.,Abdalla,T.,Heijstra,B.D.,Behrendorff,J.B.,Tappel,R.,M.,Simpson,S.D.,Nielsen,L.K.,Marcellin,E.,2017.Maintenance of ATP Homeostasis TriggersMetabolic Shifts in Gas-Fermenting Acetogens.Cell Syst.4,505-515.e5.https://doi.org/10.1016/j.cels.2017.04.008
Voloshin,A.M.,Swartz,J.R.,2005.Efficient and scalable method forscaling up cell free protein synthesis in batch mode.Biotechnol.Bioeng.91,516–521.https://doi.org/10.1002/bit.20528
Wang,H.,Li,J.,Jewett,M.C.,2018.Development of a Pseudomonas putidacell-free protein synthesis platform for rapid screening of gene regulatoryelements.Synth.Biol.3.https://doi.org/10.1093/synbio/ysy003
Wang,S.,Huang,H.,Kahnt,J.,Mueller,A.P.,M.,Thauer,R.K.,2013.NADP-specific electron-bifurcating[FeFe]-hydrogenase in a functional complex withformate dehydrogenase in Clostridium autoethanogenum grown onCO.J.Bacteriol.195,4373–86.https://doi.org/10.1128/JB.00678-13
Wee,Y.-J.,Kim,J.-N.,Ryu,H.-W.,2006.Biotechnological Production ofLactic Acid and Its Recent Applications.Food Technol.Biotechnol.44,163–172.
Wiegand,D.J.,Lee,H.H.,Ostrov,N.,Church,G.M.,2018.Establishing a Cell-Free Vibrio natriegens Expression System.ACS Synth.Biol.7,2475–2479.https://doi.org/10.1021/acssynbio.8b00222
Yim,H.,Haselbeck,R.,Niu,W.,Pujol-Baxley,C.,Burgard,A.,Boldt,J.,Khandurina,J.,Trawick,J.,Osterhout,R.,Stephen,R.,Estadilla,J.,Teisan,S.,Brettschreyer,H.,Andrae,S.,Hoon Yang,T.,Yup Lee,S.,Burk,M.J.,Van dien,S.,2011.Metabolic engineering of Escherichia coli for direct production of 1,4-butanediol.Nat.Chem.Biol.7.https://doi.org/10.1038/nCHeMBIO.580
Yim,S.S.,Johns,N.I.,Park,J.,Gomes,A.L.C.,Mcbee,R.M.,Richardson,M.,Ronda,C.,Chen,S.P.,Garenne,D.,Noireaux,V.,Wang,H.H.,2019.Multiplextranscriptional characterizations across diverse and hybrid bacterial cell-free expression systems.bioRxiv.https://doi.org/10.1101/427559
M.,Held,C.,Hujer,S.,Liesegang,H.,Wiezer,A.,Wollherr,A.,Ehrenreich,A.,Liebl,W.,Gottschalk,G.&Dürre,P.Clostridium ljungdahliirepresents a microbial production platform based on syngas.Proceedings of theNational Academy of Sciences 107,13087-13092,(2010).
Salis,H.M.,Mirsky,E.A.,Voigt,C.A.,2009.Automated design of syntheticribosome binding sites to control protein expression.Nat.Biotechnol.27,946–950.https://doi.org/10.1038/nbt.1568
Tummala,S.B.,Tomas,C.,Harris,L.M.,Papoutsakis,E.T.,Welker,N.E.,Rudolph,F.B.&Bennett,G.N.in Clostridia:Biotechnology and Medical Applications(ed H.Bahl and P.Dürre)(Wiley-VCH Verlag GmbH,2001).
Papoutsakis,E.T.Engineering solventogenic clostridia.Current Opinionin Biotechnology 19,420-429,(2008).
美国专利号7,041,479.Enhanced in vitro synthesis of active proteinscontaining disulfide bonds.Kim,D.,Swartz,J.
美国专利号7,186,525.Methods of RNA and protein synthesis.Sakanyan,V.,Snapyan,M.,Ghochikyan,A.,Lecocq,F.
美国专利号8,734,856.Cell extract for cell-free protein synthesis andprocess for producing the same.Endo,Y.
美国专利号7,235,382.Preparation containing cell extracts for cell-free protein synthesis and means for synthesizing protein using thepreparation.Endo,Y.,Nishikawa,S.
美国专利号7,273,615.Reaction solution for cell-free proteinsynthesis,method of preparing the same,and protein synthesis method using thesame.Endo,Y.,Kawasaki,T.,and Sawasaki,T.
美国专利号7,008,651.E.coli extract for protein synthesis.Ambuel,Y.,Oosbree,T.,McCormick,M.,Mierendorf,R.
美国专利号6,994,986.In vitro synthesis of polypeptides by optimizingamino acid metabolism.Swartz,J.,Kim,D.
美国专利号7,312,049.Total amino acid stabilization during cell-freeprotein synthesis.Calhoun,K.and Swartz,J.
美国专利号8,298,759.Protein expression yield enhancement in cell-freeprotein synthesis systems by addition of antifoam agents.Voloshin,A.andSwartz,J.
美国专利号9,005,920.Solution for cell-free protein synthesis,kit forcell-free protein synthesis,and method of protein synthesis.Kusumegi,T.andKawaguchi,T.
美国专利号10,494,600.Bacteria and methods of use thereof.Heijstra、Bjorn Daniel等。
在前面的描述中,对于本领域技术人员来说显而易见的是,在不脱离本发明的范围和精神的情况下,可以对这里公开的发明进行各种替换和修改。此处说明性描述的本发明可在不存在此处未具体公开的任何要素、限制或限制的情况下适当地实施。已使用的术语和表达用作描述而非限制并且无意在使用这样的术语和表达排除所示和描述的特征或其部分的任何等效物,但是认识到在本发明的范围内各种修改是可能的。因此,应当理解,虽然本发明已经通过具体实施方案和可选特征进行说明,但是本领域技术人员可以对这里公开的概念进行修改和/或变化,并且考虑这样的修改和变化属于本发明的范围。
除非本文中另有指示或明显与上下文相矛盾,否则本文所描述的所有方法均可以以任何合适的顺序进行。除非另有主张,否则本文中所提供的任何和所有实例的使用仅意图更好地阐明本发明并且不对本发明的范围造成限制。说明书中的任何语言都不应当解释为指示任何未要求保护的要素为实践本发明所必需的。
本文引用了许多专利和非专利参考文献。引用的参考文献在此通过引用并入本文。如果说明书中的术语定义与引用参考文献中的术语定义不一致,则应根据说明书中的定义来解释该术语。
序列表
<110> 西北大学
Jewett, Michael Christopher
Kruger-Gericke, Antje
Mueller, Alexander Paul
Koepke, Michael
<120> 来自梭菌属提取物的无细胞蛋白质合成平台
<130> 702581.01702
<150> 62/810,014
<151> 2019-02-25
<160> 30
<170> PatentIn version 3.5
<210> 1
<211> 235
<212> PRT
<213> 大肠杆菌
<400> 1
Met Tyr Arg Tyr Leu Ser Ile Ala Ala Val Val Leu Ser Ala Ala Phe
1 5 10 15
Ser Gly Pro Ala Leu Ala Glu Gly Ile Asn Ser Phe Ser Gln Ala Lys
20 25 30
Ala Ala Ala Val Lys Val His Ala Asp Ala Pro Gly Thr Phe Tyr Cys
35 40 45
Gly Cys Lys Ile Asn Trp Gln Gly Lys Lys Gly Val Val Asp Leu Gln
50 55 60
Ser Cys Gly Tyr Gln Val Arg Lys Asn Glu Asn Arg Ala Ser Arg Val
65 70 75 80
Glu Trp Glu His Val Val Pro Ala Trp Gln Phe Gly His Gln Arg Gln
85 90 95
Cys Trp Gln Asp Gly Gly Arg Lys Asn Cys Ala Lys Asp Pro Val Tyr
100 105 110
Arg Lys Met Glu Ser Asp Met His Asn Leu Gln Pro Ser Val Gly Glu
115 120 125
Val Asn Gly Asp Arg Gly Asn Phe Met Tyr Ser Gln Trp Asn Gly Gly
130 135 140
Glu Gly Gln Tyr Gly Gln Cys Ala Met Lys Val Asp Phe Lys Glu Lys
145 150 155 160
Ala Ala Glu Pro Pro Ala Arg Ala Arg Gly Ala Ile Ala Arg Thr Tyr
165 170 175
Phe Tyr Met Arg Asp Gln Tyr Asn Leu Thr Leu Ser Arg Gln Gln Thr
180 185 190
Gln Leu Phe Asn Ala Trp Asn Lys Met Tyr Pro Val Thr Asp Trp Glu
195 200 205
Cys Glu Arg Asp Glu Arg Ile Ala Lys Val Gln Gly Asn His Asn Pro
210 215 220
Tyr Val Gln Arg Ala Cys Gln Ala Arg Lys Ser
225 230 235
<210> 2
<211> 784
<212> PRT
<213> 大肠杆菌
<400> 2
Met Asn Pro Glu Arg Ser Glu Arg Ile Glu Ile Pro Val Leu Pro Leu
1 5 10 15
Arg Asp Val Val Val Tyr Pro His Met Val Ile Pro Leu Phe Val Gly
20 25 30
Arg Glu Lys Ser Ile Arg Cys Leu Glu Ala Ala Met Asp His Asp Lys
35 40 45
Lys Ile Met Leu Val Ala Gln Lys Glu Ala Ser Thr Asp Glu Pro Gly
50 55 60
Val Asn Asp Leu Phe Thr Val Gly Thr Val Ala Ser Ile Leu Gln Met
65 70 75 80
Leu Lys Leu Pro Asp Gly Thr Val Lys Val Leu Val Glu Gly Leu Gln
85 90 95
Arg Ala Arg Ile Ser Ala Leu Ser Asp Asn Gly Glu His Phe Ser Ala
100 105 110
Lys Ala Glu Tyr Leu Glu Ser Pro Thr Ile Asp Glu Arg Glu Gln Glu
115 120 125
Val Leu Val Arg Thr Ala Ile Ser Gln Phe Glu Gly Tyr Ile Lys Leu
130 135 140
Asn Lys Lys Ile Pro Pro Glu Val Leu Thr Ser Leu Asn Ser Ile Asp
145 150 155 160
Asp Pro Ala Arg Leu Ala Asp Thr Ile Ala Ala His Met Pro Leu Lys
165 170 175
Leu Ala Asp Lys Gln Ser Val Leu Glu Met Ser Asp Val Asn Glu Arg
180 185 190
Leu Glu Tyr Leu Met Ala Met Met Glu Ser Glu Ile Asp Leu Leu Gln
195 200 205
Val Glu Lys Arg Ile Arg Asn Arg Val Lys Lys Gln Met Glu Lys Ser
210 215 220
Gln Arg Glu Tyr Tyr Leu Asn Glu Gln Met Lys Ala Ile Gln Lys Glu
225 230 235 240
Leu Gly Glu Met Asp Asp Ala Pro Asp Glu Asn Glu Ala Leu Lys Arg
245 250 255
Lys Ile Asp Ala Ala Lys Met Pro Lys Glu Ala Lys Glu Lys Ala Glu
260 265 270
Ala Glu Leu Gln Lys Leu Lys Met Met Ser Pro Met Ser Ala Glu Ala
275 280 285
Thr Val Val Arg Gly Tyr Ile Asp Trp Met Val Gln Val Pro Trp Asn
290 295 300
Ala Arg Ser Lys Val Lys Lys Asp Leu Arg Gln Ala Gln Glu Ile Leu
305 310 315 320
Asp Thr Asp His Tyr Gly Leu Glu Arg Val Lys Asp Arg Ile Leu Glu
325 330 335
Tyr Leu Ala Val Gln Ser Arg Val Asn Lys Ile Lys Gly Pro Ile Leu
340 345 350
Cys Leu Val Gly Pro Pro Gly Val Gly Lys Thr Ser Leu Gly Gln Ser
355 360 365
Ile Ala Lys Ala Thr Gly Arg Lys Tyr Val Arg Met Ala Leu Gly Gly
370 375 380
Val Arg Asp Glu Ala Glu Ile Arg Gly His Arg Arg Thr Tyr Ile Gly
385 390 395 400
Ser Met Pro Gly Lys Leu Ile Gln Lys Met Ala Lys Val Gly Val Lys
405 410 415
Asn Pro Leu Phe Leu Leu Asp Glu Ile Asp Lys Met Ser Ser Asp Met
420 425 430
Arg Gly Asp Pro Ala Ser Ala Leu Leu Glu Val Leu Asp Pro Glu Gln
435 440 445
Asn Val Ala Phe Ser Asp His Tyr Leu Glu Val Asp Tyr Asp Leu Ser
450 455 460
Asp Val Met Phe Val Ala Thr Ser Asn Ser Met Asn Ile Pro Ala Pro
465 470 475 480
Leu Leu Asp Arg Met Glu Val Ile Arg Leu Ser Gly Tyr Thr Glu Asp
485 490 495
Glu Lys Leu Asn Ile Ala Lys Arg His Leu Leu Pro Lys Gln Ile Glu
500 505 510
Arg Asn Ala Leu Lys Lys Gly Glu Leu Thr Val Asp Asp Ser Ala Ile
515 520 525
Ile Gly Ile Ile Arg Tyr Tyr Thr Arg Glu Ala Gly Val Arg Gly Leu
530 535 540
Glu Arg Glu Ile Ser Lys Leu Cys Arg Lys Ala Val Lys Gln Leu Leu
545 550 555 560
Leu Asp Lys Ser Leu Lys His Ile Glu Ile Asn Gly Asp Asn Leu His
565 570 575
Asp Tyr Leu Gly Val Gln Arg Phe Asp Tyr Gly Arg Ala Asp Asn Glu
580 585 590
Asn Arg Val Gly Gln Val Thr Gly Leu Ala Trp Thr Glu Val Gly Gly
595 600 605
Asp Leu Leu Thr Ile Glu Thr Ala Cys Val Pro Gly Lys Gly Lys Leu
610 615 620
Thr Tyr Thr Gly Ser Leu Gly Glu Val Met Gln Glu Ser Ile Gln Ala
625 630 635 640
Ala Leu Thr Val Val Arg Ala Arg Ala Glu Lys Leu Gly Ile Asn Pro
645 650 655
Asp Phe Tyr Glu Lys Arg Asp Ile His Val His Val Pro Glu Gly Ala
660 665 670
Thr Pro Lys Asp Gly Pro Ser Ala Gly Ile Ala Met Cys Thr Ala Leu
675 680 685
Val Ser Cys Leu Thr Gly Asn Pro Val Arg Ala Asp Val Ala Met Thr
690 695 700
Gly Glu Ile Thr Leu Arg Gly Gln Val Leu Pro Ile Gly Gly Leu Lys
705 710 715 720
Glu Lys Leu Leu Ala Ala His Arg Gly Gly Ile Lys Thr Val Leu Ile
725 730 735
Pro Phe Glu Asn Lys Arg Asp Leu Glu Glu Ile Pro Asp Asn Val Ile
740 745 750
Ala Asp Leu Asp Ile His Pro Val Lys Arg Ile Glu Glu Val Leu Thr
755 760 765
Leu Ala Leu Gln Asn Glu Pro Ser Gly Met Gln Val Val Thr Ala Lys
770 775 780
<210> 3
<211> 111
<212> PRT
<213> 大肠杆菌
<400> 3
Met Val Ser Arg Tyr Val Pro Asp Met Gly Asp Leu Ile Trp Val Asp
1 5 10 15
Phe Asp Pro Thr Lys Gly Ser Glu Gln Ala Gly His Arg Pro Ala Val
20 25 30
Val Leu Ser Pro Phe Met Tyr Asn Asn Lys Thr Gly Met Cys Leu Cys
35 40 45
Val Pro Cys Thr Thr Gln Ser Lys Gly Tyr Pro Phe Glu Val Val Leu
50 55 60
Ser Gly Gln Glu Arg Asp Gly Val Ala Leu Ala Asp Gln Val Lys Ser
65 70 75 80
Ile Ala Trp Arg Ala Arg Gly Ala Thr Lys Lys Gly Thr Val Ala Pro
85 90 95
Glu Glu Leu Gln Leu Ile Lys Ala Lys Ile Asn Val Leu Ile Gly
100 105 110
<210> 4
<211> 317
<212> PRT
<213> 大肠杆菌
<400> 4
Met Arg Ala Lys Leu Leu Gly Ile Val Leu Thr Thr Pro Ile Ala Ile
1 5 10 15
Ser Ser Phe Ala Ser Thr Glu Thr Leu Ser Phe Thr Pro Asp Asn Ile
20 25 30
Asn Ala Asp Ile Ser Leu Gly Thr Leu Ser Gly Lys Thr Lys Glu Arg
35 40 45
Val Tyr Leu Ala Glu Glu Gly Gly Arg Lys Val Ser Gln Leu Asp Trp
50 55 60
Lys Phe Asn Asn Ala Ala Ile Ile Lys Gly Ala Ile Asn Trp Asp Leu
65 70 75 80
Met Pro Gln Ile Ser Ile Gly Ala Ala Gly Trp Thr Thr Leu Gly Ser
85 90 95
Arg Gly Gly Asn Met Val Asp Gln Asp Trp Met Asp Ser Ser Asn Pro
100 105 110
Gly Thr Trp Thr Asp Glu Ser Arg His Pro Asp Thr Gln Leu Asn Tyr
115 120 125
Ala Asn Glu Phe Asp Leu Asn Ile Lys Gly Trp Leu Leu Asn Glu Pro
130 135 140
Asn Tyr Arg Leu Gly Leu Met Ala Gly Tyr Gln Glu Ser Arg Tyr Ser
145 150 155 160
Phe Thr Ala Arg Gly Gly Ser Tyr Ile Tyr Ser Ser Glu Glu Gly Phe
165 170 175
Arg Asp Asp Ile Gly Ser Phe Pro Asn Gly Glu Arg Ala Ile Gly Tyr
180 185 190
Lys Gln Arg Phe Lys Met Pro Tyr Ile Gly Leu Thr Gly Ser Tyr Arg
195 200 205
Tyr Glu Asp Phe Glu Leu Gly Gly Thr Phe Lys Tyr Ser Gly Trp Val
210 215 220
Glu Ser Ser Asp Asn Asp Glu His Tyr Asp Pro Gly Lys Arg Ile Thr
225 230 235 240
Tyr Arg Ser Lys Val Lys Asp Gln Asn Tyr Tyr Ser Val Ala Val Asn
245 250 255
Ala Gly Tyr Tyr Val Thr Pro Asn Ala Lys Val Tyr Val Glu Gly Ala
260 265 270
Trp Asn Arg Val Thr Asn Lys Lys Gly Asn Thr Ser Leu Tyr Asp His
275 280 285
Asn Asn Asn Thr Ser Asp Tyr Ser Lys Asn Gly Ala Gly Ile Glu Asn
290 295 300
Tyr Asn Phe Ile Thr Thr Ala Gly Leu Lys Tyr Thr Phe
305 310 315
<210> 5
<211> 268
<212> PRT
<213> 大肠杆菌
<400> 5
Met Lys Ala Phe Trp Arg Asn Ala Ala Leu Leu Ala Val Ser Leu Leu
1 5 10 15
Pro Phe Ser Ser Ala Asn Ala Leu Ala Leu Gln Ala Lys Gln Tyr Gly
20 25 30
Asp Phe Asp Arg Tyr Val Leu Ala Leu Ser Trp Gln Thr Gly Phe Cys
35 40 45
Gln Ser Gln His Asp Arg Asn Arg Asn Glu Arg Asp Glu Cys Arg Leu
50 55 60
Gln Thr Glu Thr Thr Asn Lys Ala Asp Phe Leu Thr Val His Gly Leu
65 70 75 80
Trp Pro Gly Leu Pro Lys Ser Val Ala Ala Arg Gly Val Asp Glu Arg
85 90 95
Arg Trp Met Arg Phe Gly Cys Ala Thr Arg Pro Ile Pro Asn Leu Pro
100 105 110
Glu Ala Arg Ala Ser Arg Met Cys Ser Ser Pro Glu Thr Gly Leu Ser
115 120 125
Leu Glu Thr Ala Ala Lys Leu Ser Glu Val Met Pro Gly Ala Gly Gly
130 135 140
Arg Ser Cys Leu Glu Arg Tyr Glu Tyr Ala Lys His Gly Ala Cys Phe
145 150 155 160
Gly Phe Asp Pro Asp Ala Tyr Phe Gly Thr Met Val Arg Leu Asn Gln
165 170 175
Glu Ile Lys Glu Ser Glu Ala Gly Lys Phe Leu Ala Asp Asn Tyr Gly
180 185 190
Lys Thr Val Ser Arg Arg Asp Phe Asp Ala Ala Phe Ala Lys Ser Trp
195 200 205
Gly Lys Glu Asn Val Lys Ala Val Lys Leu Thr Cys Gln Gly Asn Pro
210 215 220
Ala Tyr Leu Thr Glu Ile Gln Ile Ser Ile Lys Ala Asp Ala Ile Asn
225 230 235 240
Ala Pro Leu Ser Ala Asn Ser Phe Leu Pro Gln Pro His Pro Gly Asn
245 250 255
Cys Gly Lys Thr Phe Val Ile Asp Lys Ala Gly Tyr
260 265
<210> 6
<211> 644
<212> PRT
<213> 大肠杆菌
<400> 6
Met Phe Gln Asp Asn Pro Leu Leu Ala Gln Leu Lys Gln Gln Leu His
1 5 10 15
Ser Gln Thr Pro Arg Ala Glu Gly Val Val Lys Ala Thr Glu Lys Gly
20 25 30
Phe Gly Phe Leu Glu Val Asp Ala Gln Lys Ser Tyr Phe Ile Pro Pro
35 40 45
Pro Gln Met Lys Lys Val Met His Gly Asp Arg Ile Ile Ala Val Ile
50 55 60
His Ser Glu Lys Glu Arg Glu Ser Ala Glu Pro Glu Glu Leu Val Glu
65 70 75 80
Pro Phe Leu Thr Arg Phe Val Gly Lys Val Gln Gly Lys Asn Asp Arg
85 90 95
Leu Ala Ile Val Pro Asp His Pro Leu Leu Lys Asp Ala Ile Pro Cys
100 105 110
Arg Ala Ala Arg Gly Leu Asn His Glu Phe Lys Glu Gly Asp Trp Ala
115 120 125
Val Ala Glu Met Arg Arg His Pro Leu Lys Gly Asp Arg Ser Phe Tyr
130 135 140
Ala Glu Leu Thr Gln Tyr Ile Thr Phe Gly Asp Asp His Phe Val Pro
145 150 155 160
Trp Trp Val Thr Leu Ala Arg His Asn Leu Glu Lys Glu Ala Pro Asp
165 170 175
Gly Val Ala Thr Glu Met Leu Asp Glu Gly Leu Val Arg Glu Asp Leu
180 185 190
Thr Ala Leu Asp Phe Val Thr Ile Asp Ser Ala Ser Thr Glu Asp Met
195 200 205
Asp Asp Ala Leu Phe Ala Lys Ala Leu Pro Asp Asp Lys Leu Gln Leu
210 215 220
Ile Val Ala Ile Ala Asp Pro Thr Ala Trp Ile Ala Glu Gly Ser Lys
225 230 235 240
Leu Asp Lys Ala Ala Lys Ile Arg Ala Phe Thr Asn Tyr Leu Pro Gly
245 250 255
Phe Asn Ile Pro Met Leu Pro Arg Glu Leu Ser Asp Asp Leu Cys Ser
260 265 270
Leu Arg Ala Asn Glu Val Arg Pro Val Leu Ala Cys Arg Met Thr Leu
275 280 285
Ser Ala Asp Gly Thr Ile Glu Asp Asn Ile Glu Phe Phe Ala Ala Thr
290 295 300
Ile Glu Ser Lys Ala Lys Leu Val Tyr Asp Gln Val Ser Asp Trp Leu
305 310 315 320
Glu Asn Thr Gly Asp Trp Gln Pro Glu Ser Glu Ala Ile Ala Glu Gln
325 330 335
Val Arg Leu Leu Ala Gln Ile Cys Gln Arg Arg Gly Glu Trp Arg His
340 345 350
Asn His Ala Leu Val Phe Lys Asp Arg Pro Asp Tyr Arg Phe Ile Leu
355 360 365
Gly Glu Lys Gly Glu Val Leu Asp Ile Val Ala Glu Pro Arg Arg Ile
370 375 380
Ala Asn Arg Ile Val Glu Glu Ala Met Ile Ala Ala Asn Ile Cys Ala
385 390 395 400
Ala Arg Val Leu Arg Asp Lys Leu Gly Phe Gly Ile Tyr Asn Val His
405 410 415
Met Gly Phe Asp Pro Ala Asn Ala Asp Ala Leu Ala Ala Leu Leu Lys
420 425 430
Thr His Gly Leu His Val Asp Ala Glu Glu Val Leu Thr Leu Asp Gly
435 440 445
Phe Cys Lys Leu Arg Arg Glu Leu Asp Ala Gln Pro Thr Gly Phe Leu
450 455 460
Asp Ser Arg Ile Arg Arg Phe Gln Ser Phe Ala Glu Ile Ser Thr Glu
465 470 475 480
Pro Gly Pro His Phe Gly Leu Gly Leu Glu Ala Tyr Ala Thr Trp Thr
485 490 495
Ser Pro Ile Arg Lys Tyr Gly Asp Met Ile Asn His Arg Leu Leu Lys
500 505 510
Ala Val Ile Lys Gly Glu Thr Ala Thr Arg Pro Gln Asp Glu Ile Thr
515 520 525
Val Gln Met Ala Glu Arg Arg Arg Leu Asn Arg Met Ala Glu Arg Asp
530 535 540
Val Gly Asp Trp Leu Tyr Ala Arg Phe Leu Lys Asp Lys Ala Gly Thr
545 550 555 560
Asp Thr Arg Phe Ala Ala Glu Ile Val Asp Ile Ser Arg Gly Gly Met
565 570 575
Arg Val Arg Leu Val Asp Asn Gly Ala Ile Ala Phe Ile Pro Ala Pro
580 585 590
Phe Leu His Ala Val Arg Asp Glu Leu Val Cys Ser Gln Glu Asn Gly
595 600 605
Thr Val Gln Ile Lys Gly Glu Thr Val Tyr Lys Val Thr Asp Val Ile
610 615 620
Asp Val Thr Ile Ala Glu Val Arg Met Glu Thr Arg Ser Ile Ile Ala
625 630 635 640
Arg Pro Val Ala
<210> 7
<211> 502
<212> PRT
<213> 大肠杆菌
<400> 7
Met Thr Glu Lys Lys Tyr Ile Val Ala Leu Asp Gln Gly Thr Thr Ser
1 5 10 15
Ser Arg Ala Val Val Met Asp His Asp Ala Asn Ile Ile Ser Val Ser
20 25 30
Gln Arg Glu Phe Glu Gln Ile Tyr Pro Lys Pro Gly Trp Val Glu His
35 40 45
Asp Pro Met Glu Ile Trp Ala Thr Gln Ser Ser Thr Leu Val Glu Val
50 55 60
Leu Ala Lys Ala Asp Ile Ser Ser Asp Gln Ile Ala Ala Ile Gly Ile
65 70 75 80
Thr Asn Gln Arg Glu Thr Thr Ile Val Trp Glu Lys Glu Thr Gly Lys
85 90 95
Pro Ile Tyr Asn Ala Ile Val Trp Gln Cys Arg Arg Thr Ala Glu Ile
100 105 110
Cys Glu His Leu Lys Arg Asp Gly Leu Glu Asp Tyr Ile Arg Ser Asn
115 120 125
Thr Gly Leu Val Ile Asp Pro Tyr Phe Ser Gly Thr Lys Val Lys Trp
130 135 140
Ile Leu Asp His Val Glu Gly Ser Arg Glu Arg Ala Arg Arg Gly Glu
145 150 155 160
Leu Leu Phe Gly Thr Val Asp Thr Trp Leu Ile Trp Lys Met Thr Gln
165 170 175
Gly Arg Val His Val Thr Asp Tyr Thr Asn Ala Ser Arg Thr Met Leu
180 185 190
Phe Asn Ile His Thr Leu Asp Trp Asp Asp Lys Met Leu Glu Val Leu
195 200 205
Asp Ile Pro Arg Glu Met Leu Pro Glu Val Arg Arg Ser Ser Glu Val
210 215 220
Tyr Gly Gln Thr Asn Ile Gly Gly Lys Gly Gly Thr Arg Ile Pro Ile
225 230 235 240
Ser Gly Ile Ala Gly Asp Gln Gln Ala Ala Leu Phe Gly Gln Leu Cys
245 250 255
Val Lys Glu Gly Met Ala Lys Asn Thr Tyr Gly Thr Gly Cys Phe Met
260 265 270
Leu Met Asn Thr Gly Glu Lys Ala Val Lys Ser Glu Asn Gly Leu Leu
275 280 285
Thr Thr Ile Ala Cys Gly Pro Thr Gly Glu Val Asn Tyr Ala Leu Glu
290 295 300
Gly Ala Val Phe Met Ala Gly Ala Ser Ile Gln Trp Leu Arg Asp Glu
305 310 315 320
Met Lys Leu Ile Asn Asp Ala Tyr Asp Ser Glu Tyr Phe Ala Thr Lys
325 330 335
Val Gln Asn Thr Asn Gly Val Tyr Val Val Pro Ala Phe Thr Gly Leu
340 345 350
Gly Ala Pro Tyr Trp Asp Pro Tyr Ala Arg Gly Ala Ile Phe Gly Leu
355 360 365
Thr Arg Gly Val Asn Ala Asn His Ile Ile Arg Ala Thr Leu Glu Ser
370 375 380
Ile Ala Tyr Gln Thr Arg Asp Val Leu Glu Ala Met Gln Ala Asp Ser
385 390 395 400
Gly Ile Arg Leu His Ala Leu Arg Val Asp Gly Gly Ala Val Ala Asn
405 410 415
Asn Phe Leu Met Gln Phe Gln Ser Asp Ile Leu Gly Thr Arg Val Glu
420 425 430
Arg Pro Glu Val Arg Glu Val Thr Ala Leu Gly Ala Ala Tyr Leu Ala
435 440 445
Gly Leu Ala Val Gly Phe Trp Gln Asn Leu Asp Glu Leu Gln Glu Lys
450 455 460
Ala Val Ile Glu Arg Glu Phe Arg Pro Gly Ile Glu Thr Thr Glu Arg
465 470 475 480
Asn Tyr Arg Tyr Ala Gly Trp Lys Lys Ala Val Lys Arg Ala Met Ala
485 490 495
Trp Glu Glu His Asp Glu
500
<210> 8
<211> 450
<212> PRT
<213> 大肠杆菌
<400> 8
Met Thr Lys His Tyr Asp Tyr Ile Ala Ile Gly Gly Gly Ser Gly Gly
1 5 10 15
Ile Ala Ser Ile Asn Arg Ala Ala Met Tyr Gly Gln Lys Cys Ala Leu
20 25 30
Ile Glu Ala Lys Glu Leu Gly Gly Thr Cys Val Asn Val Gly Cys Val
35 40 45
Pro Lys Lys Val Met Trp His Ala Ala Gln Ile Arg Glu Ala Ile His
50 55 60
Met Tyr Gly Pro Asp Tyr Gly Phe Asp Thr Thr Ile Asn Lys Phe Asn
65 70 75 80
Trp Glu Thr Leu Ile Ala Ser Arg Thr Ala Tyr Ile Asp Arg Ile His
85 90 95
Thr Ser Tyr Glu Asn Val Leu Gly Lys Asn Asn Val Asp Val Ile Lys
100 105 110
Gly Phe Ala Arg Phe Val Asp Ala Lys Thr Leu Glu Val Asn Gly Glu
115 120 125
Thr Ile Thr Ala Asp His Ile Leu Ile Ala Thr Gly Gly Arg Pro Ser
130 135 140
His Pro Asp Ile Pro Gly Val Glu Tyr Gly Ile Asp Ser Asp Gly Phe
145 150 155 160
Phe Ala Leu Pro Ala Leu Pro Glu Arg Val Ala Val Val Gly Ala Gly
165 170 175
Tyr Ile Ala Val Glu Leu Ala Gly Val Ile Asn Gly Leu Gly Ala Lys
180 185 190
Thr His Leu Phe Val Arg Lys His Ala Pro Leu Arg Ser Phe Asp Pro
195 200 205
Met Ile Ser Glu Thr Leu Val Glu Val Met Asn Ala Glu Gly Pro Gln
210 215 220
Leu His Thr Asn Ala Ile Pro Lys Ala Val Val Lys Asn Thr Asp Gly
225 230 235 240
Ser Leu Thr Leu Glu Leu Glu Asp Gly Arg Ser Glu Thr Val Asp Cys
245 250 255
Leu Ile Trp Ala Ile Gly Arg Glu Pro Ala Asn Asp Asn Ile Asn Leu
260 265 270
Glu Ala Ala Gly Val Lys Thr Asn Glu Lys Gly Tyr Ile Val Val Asp
275 280 285
Lys Tyr Gln Asn Thr Asn Ile Glu Gly Ile Tyr Ala Val Gly Asp Asn
290 295 300
Thr Gly Ala Val Glu Leu Thr Pro Val Ala Val Ala Ala Gly Arg Arg
305 310 315 320
Leu Ser Glu Arg Leu Phe Asn Asn Lys Pro Asp Glu His Leu Asp Tyr
325 330 335
Ser Asn Ile Pro Thr Val Val Phe Ser His Pro Pro Ile Gly Thr Val
340 345 350
Gly Leu Thr Glu Pro Gln Ala Arg Glu Gln Tyr Gly Asp Asp Gln Val
355 360 365
Lys Val Tyr Lys Ser Ser Phe Thr Ala Met Tyr Thr Ala Val Thr Thr
370 375 380
His Arg Gln Pro Cys Arg Met Lys Leu Val Cys Val Gly Ser Glu Glu
385 390 395 400
Lys Ile Val Gly Ile His Gly Ile Gly Phe Gly Met Asp Glu Met Leu
405 410 415
Gln Gly Phe Ala Val Ala Leu Lys Met Gly Ala Thr Lys Lys Asp Phe
420 425 430
Asp Asn Thr Val Ala Ile His Pro Thr Ala Ala Glu Glu Phe Val Thr
435 440 445
Met Arg
450
<210> 9
<211> 518
<212> PRT
<213> 大肠杆菌
<400> 9
Met Ile Pro Asp Val Ser Gln Ala Leu Ala Trp Leu Glu Lys His Pro
1 5 10 15
Gln Ala Leu Lys Gly Ile Gln Arg Gly Leu Glu Arg Glu Thr Leu Arg
20 25 30
Val Asn Ala Asp Gly Thr Leu Ala Thr Thr Gly His Pro Glu Ala Leu
35 40 45
Gly Ser Ala Leu Thr His Lys Trp Ile Thr Thr Asp Phe Ala Glu Ala
50 55 60
Leu Leu Glu Phe Ile Thr Pro Val Asp Gly Asp Ile Glu His Met Leu
65 70 75 80
Thr Phe Met Arg Asp Leu His Arg Tyr Thr Ala Arg Asn Met Gly Asp
85 90 95
Glu Arg Met Trp Pro Leu Ser Met Pro Cys Tyr Ile Ala Glu Gly Gln
100 105 110
Asp Ile Glu Leu Ala Gln Tyr Gly Thr Ser Asn Thr Gly Arg Phe Lys
115 120 125
Thr Leu Tyr Arg Glu Gly Leu Lys Asn Arg Tyr Gly Ala Leu Met Gln
130 135 140
Thr Ile Ser Gly Val His Tyr Asn Phe Ser Leu Pro Met Ala Phe Trp
145 150 155 160
Gln Ala Lys Cys Gly Asp Ile Ser Gly Ala Asp Ala Lys Glu Lys Ile
165 170 175
Ser Ala Gly Tyr Phe Arg Val Ile Arg Asn Tyr Tyr Arg Phe Gly Trp
180 185 190
Val Ile Pro Tyr Leu Phe Gly Ala Ser Pro Ala Ile Cys Ser Ser Phe
195 200 205
Leu Gln Gly Lys Pro Thr Ser Leu Pro Phe Glu Lys Thr Glu Cys Gly
210 215 220
Met Tyr Tyr Leu Pro Tyr Ala Thr Ser Leu Arg Leu Ser Asp Leu Gly
225 230 235 240
Tyr Thr Asn Lys Ser Gln Ser Asn Leu Gly Ile Thr Phe Asn Asp Leu
245 250 255
Tyr Glu Tyr Val Ala Gly Leu Lys Gln Ala Ile Lys Thr Pro Ser Glu
260 265 270
Glu Tyr Ala Lys Ile Gly Ile Glu Lys Asp Gly Lys Arg Leu Gln Ile
275 280 285
Asn Ser Asn Val Leu Gln Ile Glu Asn Glu Leu Tyr Ala Pro Ile Arg
290 295 300
Pro Lys Arg Val Thr Arg Ser Gly Glu Ser Pro Ser Asp Ala Leu Leu
305 310 315 320
Arg Gly Gly Ile Glu Tyr Ile Glu Val Arg Ser Leu Asp Ile Asn Pro
325 330 335
Phe Ser Pro Ile Gly Val Asp Glu Gln Gln Val Arg Phe Leu Asp Leu
340 345 350
Phe Met Val Trp Cys Ala Leu Ala Asp Ala Pro Glu Met Ser Ser Ser
355 360 365
Glu Leu Ala Cys Thr Arg Val Asn Trp Asn Arg Val Ile Leu Glu Gly
370 375 380
Arg Lys Pro Gly Leu Thr Leu Gly Ile Gly Cys Glu Thr Ala Gln Phe
385 390 395 400
Pro Leu Pro Gln Val Gly Lys Asp Leu Phe Arg Asp Leu Lys Arg Val
405 410 415
Ala Gln Thr Leu Asp Ser Ile Asn Gly Gly Glu Ala Tyr Gln Lys Val
420 425 430
Cys Asp Glu Leu Val Ala Cys Phe Asp Asn Pro Asp Leu Thr Phe Ser
435 440 445
Ala Arg Ile Leu Arg Ser Met Ile Asp Thr Gly Ile Gly Gly Thr Gly
450 455 460
Lys Ala Phe Ala Glu Ala Tyr Arg Asn Leu Leu Arg Glu Glu Pro Leu
465 470 475 480
Glu Ile Leu Arg Glu Glu Asp Phe Val Ala Glu Arg Glu Ala Ser Glu
485 490 495
Arg Arg Gln Gln Glu Met Glu Ala Ala Asp Thr Glu Pro Phe Ala Val
500 505 510
Trp Leu Glu Lys His Ala
515
<210> 10
<211> 471
<212> PRT
<213> 大肠杆菌
<400> 10
Met Glu Asn Phe Lys His Leu Pro Glu Pro Phe Arg Ile Arg Val Ile
1 5 10 15
Glu Pro Val Lys Arg Thr Thr Arg Ala Tyr Arg Glu Glu Ala Ile Ile
20 25 30
Lys Ser Gly Met Asn Pro Phe Leu Leu Asp Ser Glu Asp Val Phe Ile
35 40 45
Asp Leu Leu Thr Asp Ser Gly Thr Gly Ala Val Thr Gln Ser Met Gln
50 55 60
Ala Ala Met Met Arg Gly Asp Glu Ala Tyr Ser Gly Ser Arg Ser Tyr
65 70 75 80
Tyr Ala Leu Ala Glu Ser Val Lys Asn Ile Phe Gly Tyr Gln Tyr Thr
85 90 95
Ile Pro Thr His Gln Gly Arg Gly Ala Glu Gln Ile Tyr Ile Pro Val
100 105 110
Leu Ile Lys Lys Arg Glu Gln Glu Lys Gly Leu Asp Arg Ser Lys Met
115 120 125
Val Ala Phe Ser Asn Tyr Phe Phe Asp Thr Thr Gln Gly His Ser Gln
130 135 140
Ile Asn Gly Cys Thr Val Arg Asn Val Tyr Ile Lys Glu Ala Phe Asp
145 150 155 160
Thr Gly Val Arg Tyr Asp Phe Lys Gly Asn Phe Asp Leu Glu Gly Leu
165 170 175
Glu Arg Gly Ile Glu Glu Val Gly Pro Asn Asn Val Pro Tyr Ile Val
180 185 190
Ala Thr Ile Thr Ser Asn Ser Ala Gly Gly Gln Pro Val Ser Leu Ala
195 200 205
Asn Leu Lys Ala Met Tyr Ser Ile Ala Lys Lys Tyr Asp Ile Pro Val
210 215 220
Val Met Asp Ser Ala Arg Phe Ala Glu Asn Ala Tyr Phe Ile Lys Gln
225 230 235 240
Arg Glu Ala Glu Tyr Lys Asp Trp Thr Ile Glu Gln Ile Thr Arg Glu
245 250 255
Thr Tyr Lys Tyr Ala Asp Met Leu Ala Met Ser Ala Lys Lys Asp Ala
260 265 270
Met Val Pro Met Gly Gly Leu Leu Cys Met Lys Asp Asp Ser Phe Phe
275 280 285
Asp Val Tyr Thr Glu Cys Arg Thr Leu Cys Val Val Gln Glu Gly Phe
290 295 300
Pro Thr Tyr Gly Gly Leu Glu Gly Gly Ala Met Glu Arg Leu Ala Val
305 310 315 320
Gly Leu Tyr Asp Gly Met Asn Leu Asp Trp Leu Ala Tyr Arg Ile Ala
325 330 335
Gln Val Gln Tyr Leu Val Asp Gly Leu Glu Glu Ile Gly Val Val Cys
340 345 350
Gln Gln Ala Gly Gly His Ala Ala Phe Val Asp Ala Gly Lys Leu Leu
355 360 365
Pro His Ile Pro Ala Asp Gln Phe Pro Ala Gln Ala Leu Ala Cys Glu
370 375 380
Leu Tyr Lys Val Ala Gly Ile Arg Ala Val Glu Ile Gly Ser Phe Leu
385 390 395 400
Leu Gly Arg Asp Pro Lys Thr Gly Lys Gln Leu Pro Cys Pro Ala Glu
405 410 415
Leu Leu Arg Leu Thr Ile Pro Arg Ala Thr Tyr Thr Gln Thr His Met
420 425 430
Asp Phe Ile Ile Glu Ala Phe Lys His Val Lys Glu Asn Ala Ala Asn
435 440 445
Ile Lys Gly Leu Thr Phe Thr Tyr Glu Pro Lys Val Leu Arg His Phe
450 455 460
Thr Ala Lys Leu Lys Glu Val
465 470
<210> 11
<211> 1061
<212> PRT
<213> 大肠杆菌
<400> 11
Met Lys Arg Met Leu Ile Asn Ala Thr Gln Gln Glu Glu Leu Arg Val
1 5 10 15
Ala Leu Val Asp Gly Gln Arg Leu Tyr Asp Leu Asp Ile Glu Ser Pro
20 25 30
Gly His Glu Gln Lys Lys Ala Asn Ile Tyr Lys Gly Lys Ile Thr Arg
35 40 45
Ile Glu Pro Ser Leu Glu Ala Ala Phe Val Asp Tyr Gly Ala Glu Arg
50 55 60
His Gly Phe Leu Pro Leu Lys Glu Ile Ala Arg Glu Tyr Phe Pro Ala
65 70 75 80
Asn Tyr Ser Ala His Gly Arg Pro Asn Ile Lys Asp Val Leu Arg Glu
85 90 95
Gly Gln Glu Val Ile Val Gln Ile Asp Lys Glu Glu Arg Gly Asn Lys
100 105 110
Gly Ala Ala Leu Thr Thr Phe Ile Ser Leu Ala Gly Ser Tyr Leu Val
115 120 125
Leu Met Pro Asn Asn Pro Arg Ala Gly Gly Ile Ser Arg Arg Ile Glu
130 135 140
Gly Asp Asp Arg Thr Glu Leu Lys Glu Ala Leu Ala Ser Leu Glu Leu
145 150 155 160
Pro Glu Gly Met Gly Leu Ile Val Arg Thr Ala Gly Val Gly Lys Ser
165 170 175
Ala Glu Ala Leu Gln Trp Asp Leu Ser Phe Arg Leu Lys His Trp Glu
180 185 190
Ala Ile Lys Lys Ala Ala Glu Ser Arg Pro Ala Pro Phe Leu Ile His
195 200 205
Gln Glu Ser Asn Val Ile Val Arg Ala Phe Arg Asp Tyr Leu Arg Gln
210 215 220
Asp Ile Gly Glu Ile Leu Ile Asp Asn Pro Lys Val Leu Glu Leu Ala
225 230 235 240
Arg Gln His Ile Ala Ala Leu Gly Arg Pro Asp Phe Ser Ser Lys Ile
245 250 255
Lys Leu Tyr Thr Gly Glu Ile Pro Leu Phe Ser His Tyr Gln Ile Glu
260 265 270
Ser Gln Ile Glu Ser Ala Phe Gln Arg Glu Val Arg Leu Pro Ser Gly
275 280 285
Gly Ser Ile Val Ile Asp Ser Thr Glu Ala Leu Thr Ala Ile Asp Ile
290 295 300
Asn Ser Ala Arg Ala Thr Arg Gly Gly Asp Ile Glu Glu Thr Ala Phe
305 310 315 320
Asn Thr Asn Leu Glu Ala Ala Asp Glu Ile Ala Arg Gln Leu Arg Leu
325 330 335
Arg Asp Leu Gly Gly Leu Ile Val Ile Asp Phe Ile Asp Met Thr Pro
340 345 350
Val Arg His Gln Arg Ala Val Glu Asn Arg Leu Arg Glu Ala Val Arg
355 360 365
Gln Asp Arg Ala Arg Ile Gln Ile Ser His Ile Ser Arg Phe Gly Leu
370 375 380
Leu Glu Met Ser Arg Gln Arg Leu Ser Pro Ser Leu Gly Glu Ser Ser
385 390 395 400
His His Val Cys Pro Arg Cys Ser Gly Thr Gly Thr Val Arg Asp Asn
405 410 415
Glu Ser Leu Ser Leu Ser Ile Leu Arg Leu Ile Glu Glu Glu Ala Leu
420 425 430
Lys Glu Asn Thr Gln Glu Val His Ala Ile Val Pro Val Pro Ile Ala
435 440 445
Ser Tyr Leu Leu Asn Glu Lys Arg Ser Ala Val Asn Ala Ile Glu Thr
450 455 460
Arg Gln Asp Gly Val Arg Cys Val Ile Val Pro Asn Asp Gln Met Glu
465 470 475 480
Thr Pro His Tyr His Val Leu Arg Val Arg Lys Gly Glu Glu Thr Pro
485 490 495
Thr Leu Ser Tyr Met Leu Pro Lys Leu His Glu Glu Ala Met Ala Leu
500 505 510
Pro Ser Glu Glu Glu Phe Ala Glu Arg Lys Arg Pro Glu Gln Pro Ala
515 520 525
Leu Ala Thr Phe Ala Met Pro Asp Val Pro Pro Ala Pro Thr Pro Ala
530 535 540
Glu Pro Ala Ala Pro Val Val Ala Pro Ala Pro Lys Ala Ala Pro Ala
545 550 555 560
Thr Pro Ala Ala Pro Ala Gln Pro Gly Leu Leu Ser Arg Phe Phe Gly
565 570 575
Ala Leu Lys Ala Leu Phe Ser Gly Gly Glu Glu Thr Lys Pro Thr Glu
580 585 590
Gln Pro Ala Pro Lys Ala Glu Ala Lys Pro Glu Arg Gln Gln Asp Arg
595 600 605
Arg Lys Pro Arg Gln Asn Asn Arg Arg Asp Arg Asn Glu Arg Arg Asp
610 615 620
Thr Arg Ser Glu Arg Thr Glu Gly Ser Asp Asn Arg Glu Glu Asn Arg
625 630 635 640
Arg Asn Arg Arg Gln Ala Gln Gln Gln Thr Ala Glu Thr Arg Glu Ser
645 650 655
Arg Gln Gln Ala Glu Val Thr Glu Lys Ala Arg Thr Ala Asp Glu Gln
660 665 670
Gln Ala Pro Arg Arg Glu Arg Ser Arg Arg Arg Asn Asp Asp Lys Arg
675 680 685
Gln Ala Gln Gln Glu Ala Lys Ala Leu Asn Val Glu Glu Gln Ser Val
690 695 700
Gln Glu Thr Glu Gln Glu Glu Arg Val Arg Pro Val Gln Pro Arg Arg
705 710 715 720
Lys Gln Arg Gln Leu Asn Gln Lys Val Arg Tyr Glu Gln Ser Val Ala
725 730 735
Glu Glu Ala Val Val Ala Pro Val Val Glu Glu Thr Val Ala Ala Glu
740 745 750
Pro Ile Val Gln Glu Ala Pro Ala Pro Arg Thr Glu Leu Val Lys Val
755 760 765
Pro Leu Pro Val Val Ala Gln Thr Ala Pro Glu Gln Gln Glu Glu Asn
770 775 780
Asn Ala Asp Asn Arg Asp Asn Gly Gly Met Pro Arg Arg Ser Arg Arg
785 790 795 800
Ser Pro Arg His Leu Arg Val Ser Gly Gln Arg Arg Arg Arg Tyr Arg
805 810 815
Asp Glu Arg Tyr Pro Thr Gln Ser Pro Met Pro Leu Thr Val Ala Cys
820 825 830
Ala Ser Pro Glu Leu Ala Ser Gly Lys Val Trp Ile Arg Tyr Pro Ile
835 840 845
Val Arg Pro Gln Asp Val Gln Val Glu Glu Gln Arg Glu Gln Glu Glu
850 855 860
Val His Val Gln Pro Met Val Thr Glu Val Pro Val Ala Ala Ala Ile
865 870 875 880
Glu Pro Val Val Ser Ala Pro Val Val Glu Glu Val Ala Gly Val Val
885 890 895
Glu Ala Pro Val Gln Val Ala Glu Pro Gln Pro Glu Val Val Glu Thr
900 905 910
Thr His Pro Glu Val Ile Ala Ala Ala Val Thr Glu Gln Pro Gln Val
915 920 925
Ile Thr Glu Ser Asp Val Ala Val Ala Gln Glu Val Ala Glu Gln Ala
930 935 940
Glu Pro Val Val Glu Pro Gln Glu Glu Thr Ala Asp Ile Glu Glu Val
945 950 955 960
Val Glu Thr Ala Glu Val Val Val Ala Glu Pro Glu Val Val Ala Gln
965 970 975
Pro Ala Ala Pro Val Val Ala Glu Val Ala Ala Glu Val Glu Thr Val
980 985 990
Ala Ala Val Glu Pro Glu Val Thr Val Glu His Asn His Ala Thr Ala
995 1000 1005
Pro Met Thr Arg Ala Pro Ala Pro Glu Tyr Val Pro Glu Ala Pro
1010 1015 1020
Arg His Ser Asp Trp Gln Arg Pro Thr Phe Ala Phe Glu Gly Lys
1025 1030 1035
Gly Ala Ala Gly Gly His Thr Ala Thr His His Ala Ser Ala Ala
1040 1045 1050
Pro Ala Arg Pro Gln Pro Val Glu
1055 1060
<210> 12
<211> 447
<212> PRT
<213> 大肠杆菌
<400> 12
Met Asp Gln Thr Tyr Ser Leu Glu Ser Phe Leu Asn His Val Gln Lys
1 5 10 15
Arg Asp Pro Asn Gln Thr Glu Phe Ala Gln Ala Val Arg Glu Val Met
20 25 30
Thr Thr Leu Trp Pro Phe Leu Glu Gln Asn Pro Lys Tyr Arg Gln Met
35 40 45
Ser Leu Leu Glu Arg Leu Val Glu Pro Glu Arg Val Ile Gln Phe Arg
50 55 60
Val Val Trp Val Asp Asp Arg Asn Gln Ile Gln Val Asn Arg Ala Trp
65 70 75 80
Arg Val Gln Phe Ser Ser Ala Ile Gly Pro Tyr Lys Gly Gly Met Arg
85 90 95
Phe His Pro Ser Val Asn Leu Ser Ile Leu Lys Phe Leu Gly Phe Glu
100 105 110
Gln Thr Phe Lys Asn Ala Leu Thr Thr Leu Pro Met Gly Gly Gly Lys
115 120 125
Gly Gly Ser Asp Phe Asp Pro Lys Gly Lys Ser Glu Gly Glu Val Met
130 135 140
Arg Phe Cys Gln Ala Leu Met Thr Glu Leu Tyr Arg His Leu Gly Ala
145 150 155 160
Asp Thr Asp Val Pro Ala Gly Asp Ile Gly Val Gly Gly Arg Glu Val
165 170 175
Gly Phe Met Ala Gly Met Met Lys Lys Leu Ser Asn Asn Thr Ala Cys
180 185 190
Val Phe Thr Gly Lys Gly Leu Ser Phe Gly Gly Ser Leu Ile Arg Pro
195 200 205
Glu Ala Thr Gly Tyr Gly Leu Val Tyr Phe Thr Glu Ala Met Leu Lys
210 215 220
Arg His Gly Met Gly Phe Glu Gly Met Arg Val Ser Val Ser Gly Ser
225 230 235 240
Gly Asn Val Ala Gln Tyr Ala Ile Glu Lys Ala Met Glu Phe Gly Ala
245 250 255
Arg Val Ile Thr Ala Ser Asp Ser Ser Gly Thr Val Val Asp Glu Ser
260 265 270
Gly Phe Thr Lys Glu Lys Leu Ala Arg Leu Ile Glu Ile Lys Ala Ser
275 280 285
Arg Asp Gly Arg Val Ala Asp Tyr Ala Lys Glu Phe Gly Leu Val Tyr
290 295 300
Leu Glu Gly Gln Gln Pro Trp Ser Leu Pro Val Asp Ile Ala Leu Pro
305 310 315 320
Cys Ala Thr Gln Asn Glu Leu Asp Val Asp Ala Ala His Gln Leu Ile
325 330 335
Ala Asn Gly Val Lys Ala Val Ala Glu Gly Ala Asn Met Pro Thr Thr
340 345 350
Ile Glu Ala Thr Glu Leu Phe Gln Gln Ala Gly Val Leu Phe Ala Pro
355 360 365
Gly Lys Ala Ala Asn Ala Gly Gly Val Ala Thr Ser Gly Leu Glu Met
370 375 380
Ala Gln Asn Ala Ala Arg Leu Gly Trp Lys Ala Glu Lys Val Asp Ala
385 390 395 400
Arg Leu His His Ile Met Leu Asp Ile His His Ala Cys Val Glu His
405 410 415
Gly Gly Glu Gly Glu Gln Thr Asn Tyr Val Gln Gly Ala Asn Ile Ala
420 425 430
Gly Phe Val Lys Val Ala Asp Ala Met Leu Ala Gln Gly Val Ile
435 440 445
<210> 13
<211> 454
<212> PRT
<213> 大肠杆菌
<400> 13
Met Ile Ser Leu Phe Asp Met Phe Lys Val Gly Ile Gly Pro Ser Ser
1 5 10 15
Ser His Thr Val Gly Pro Met Lys Ala Gly Lys Gln Phe Val Asp Asp
20 25 30
Leu Val Glu Lys Gly Leu Leu Asp Ser Val Thr Arg Val Ala Val Asp
35 40 45
Val Tyr Gly Ser Leu Ser Leu Thr Gly Lys Gly His His Thr Asp Ile
50 55 60
Ala Ile Ile Met Gly Leu Ala Gly Asn Glu Pro Ala Thr Val Asp Ile
65 70 75 80
Asp Ser Ile Pro Gly Phe Ile Arg Asp Val Glu Glu Arg Glu Arg Leu
85 90 95
Leu Leu Ala Gln Gly Arg His Glu Val Asp Phe Pro Arg Asp Asn Gly
100 105 110
Met Arg Phe His Asn Gly Asn Leu Pro Leu His Glu Asn Gly Met Gln
115 120 125
Ile His Ala Tyr Asn Gly Asp Glu Val Val Tyr Ser Lys Thr Tyr Tyr
130 135 140
Ser Ile Gly Gly Gly Phe Ile Val Asp Glu Glu His Phe Gly Gln Asp
145 150 155 160
Ala Ala Asn Glu Val Ser Val Pro Tyr Pro Phe Lys Ser Ala Thr Glu
165 170 175
Leu Leu Ala Tyr Cys Asn Glu Thr Gly Tyr Ser Leu Ser Gly Leu Ala
180 185 190
Met Gln Asn Glu Leu Ala Leu His Ser Lys Lys Glu Ile Asp Glu Tyr
195 200 205
Phe Ala His Val Trp Gln Thr Met Gln Ala Cys Ile Asp Arg Gly Met
210 215 220
Asn Thr Glu Gly Val Leu Pro Gly Pro Leu Arg Val Pro Arg Arg Ala
225 230 235 240
Ser Ala Leu Arg Arg Met Leu Val Ser Ser Asp Lys Leu Ser Asn Asp
245 250 255
Pro Met Asn Val Ile Asp Trp Val Asn Met Phe Ala Leu Ala Val Asn
260 265 270
Glu Glu Asn Ala Ala Gly Gly Arg Val Val Thr Ala Pro Thr Asn Gly
275 280 285
Ala Cys Gly Ile Val Pro Ala Val Leu Ala Tyr Tyr Asp His Phe Ile
290 295 300
Glu Ser Val Ser Pro Asp Ile Tyr Thr Arg Tyr Phe Met Ala Ala Gly
305 310 315 320
Ala Ile Gly Ala Leu Tyr Lys Met Asn Ala Ser Ile Ser Gly Ala Glu
325 330 335
Val Gly Cys Gln Gly Glu Val Gly Val Ala Cys Ser Met Ala Ala Ala
340 345 350
Gly Leu Ala Glu Leu Leu Gly Gly Ser Pro Glu Gln Val Cys Val Ala
355 360 365
Ala Glu Ile Gly Met Glu His Asn Leu Gly Leu Thr Cys Asp Pro Val
370 375 380
Ala Gly Gln Val Gln Val Pro Cys Ile Glu Arg Asn Ala Ile Ala Ser
385 390 395 400
Val Lys Ala Ile Asn Ala Ala Arg Met Ala Leu Arg Arg Thr Ser Ala
405 410 415
Pro Arg Val Ser Leu Asp Lys Val Ile Glu Thr Met Tyr Glu Thr Gly
420 425 430
Lys Asp Met Asn Ala Lys Tyr Arg Glu Thr Ser Arg Gly Gly Leu Ala
435 440 445
Ile Lys Val Gln Cys Asp
450
<210> 14
<211> 455
<212> PRT
<213> 大肠杆菌
<400> 14
Met Ile Ser Val Phe Asp Ile Phe Lys Ile Gly Ile Gly Pro Ser Ser
1 5 10 15
Ser His Thr Val Gly Pro Met Lys Ala Gly Lys Gln Phe Thr Asp Asp
20 25 30
Leu Ile Ala Arg Asn Leu Leu Lys Asp Val Thr Arg Val Val Val Asp
35 40 45
Val Tyr Gly Ser Leu Ser Leu Thr Gly Lys Gly His His Thr Asp Ile
50 55 60
Ala Ile Ile Met Gly Leu Ala Gly Asn Leu Pro Asp Thr Val Asp Ile
65 70 75 80
Asp Ser Ile Pro Ser Phe Ile Gln Asp Val Asn Thr His Gly Arg Leu
85 90 95
Met Leu Ala Asn Gly Gln His Glu Val Glu Phe Pro Val Asp Gln Cys
100 105 110
Met Asn Phe His Ala Asp Asn Leu Ser Leu His Glu Asn Gly Met Arg
115 120 125
Ile Thr Ala Leu Ala Gly Asp Lys Val Val Tyr Ser Gln Thr Tyr Tyr
130 135 140
Ser Ile Gly Gly Gly Phe Ile Val Asp Glu Glu His Phe Gly Gln Gln
145 150 155 160
Asp Ser Ala Pro Val Glu Val Pro Tyr Pro Tyr Ser Ser Ala Ala Asp
165 170 175
Leu Gln Lys His Cys Gln Glu Thr Gly Leu Ser Leu Ser Gly Leu Met
180 185 190
Met Lys Asn Glu Leu Ala Leu His Ser Lys Glu Glu Leu Glu Gln His
195 200 205
Leu Ala Asn Val Trp Glu Val Met Arg Gly Gly Ile Glu Arg Gly Ile
210 215 220
Ser Thr Glu Gly Val Leu Pro Gly Lys Leu Arg Val Pro Arg Arg Ala
225 230 235 240
Ala Ala Leu Arg Arg Met Leu Val Ser Gln Asp Lys Thr Thr Thr Asp
245 250 255
Pro Met Ala Val Val Asp Trp Ile Asn Met Phe Ala Leu Ala Val Asn
260 265 270
Glu Glu Asn Ala Ala Gly Gly Arg Val Val Thr Ala Pro Thr Asn Gly
275 280 285
Ala Cys Gly Ile Ile Pro Ala Val Leu Ala Tyr Tyr Asp Lys Phe Ile
290 295 300
Arg Glu Val Asn Ala Asn Ser Leu Ala Arg Tyr Leu Leu Val Ala Ser
305 310 315 320
Ala Ile Gly Ser Leu Tyr Lys Met Asn Ala Ser Ile Ser Gly Ala Glu
325 330 335
Val Gly Cys Gln Gly Glu Val Gly Val Ala Cys Ser Met Ala Ala Ala
340 345 350
Gly Leu Ala Glu Leu Leu Gly Ala Ser Pro Ala Gln Val Cys Ile Ala
355 360 365
Ala Glu Ile Ala Met Glu His Asn Leu Gly Leu Thr Cys Asp Pro Val
370 375 380
Ala Gly Gln Val Gln Val Pro Cys Ile Glu Arg Asn Ala Ile Ala Ala
385 390 395 400
Val Lys Ala Val Asn Ala Ala Arg Met Ala Leu Arg Arg Thr Ser Glu
405 410 415
Pro Arg Val Cys Leu Asp Lys Val Ile Glu Thr Met Tyr Glu Thr Gly
420 425 430
Lys Asp Met Asn Ala Lys Tyr Arg Glu Thr Ser Arg Gly Gly Leu Ala
435 440 445
Met Lys Ile Val Ala Cys Asp
450 455
<210> 15
<211> 658
<212> PRT
<213> 大肠杆菌
<400> 15
Met Ser Asp Asp Met Ser Met Gly Leu Pro Ser Ser Ala Gly Glu His
1 5 10 15
Gly Val Leu Arg Ser Met Gln Glu Val Ala Met Ser Ser Gln Glu Ala
20 25 30
Ser Lys Met Leu Arg Thr Tyr Asn Ile Ala Trp Trp Gly Asn Asn Tyr
35 40 45
Tyr Asp Val Asn Glu Leu Gly His Ile Ser Val Cys Pro Asp Pro Asp
50 55 60
Val Pro Glu Ala Arg Val Asp Leu Ala Gln Leu Val Lys Thr Arg Glu
65 70 75 80
Ala Gln Gly Gln Arg Leu Pro Ala Leu Phe Cys Phe Pro Gln Ile Leu
85 90 95
Gln His Arg Leu Arg Ser Ile Asn Ala Ala Phe Lys Arg Ala Arg Glu
100 105 110
Ser Tyr Gly Tyr Asn Gly Asp Tyr Phe Leu Val Tyr Pro Ile Lys Val
115 120 125
Asn Gln His Arg Arg Val Ile Glu Ser Leu Ile His Ser Gly Glu Pro
130 135 140
Leu Gly Leu Glu Ala Gly Ser Lys Ala Glu Leu Met Ala Val Leu Ala
145 150 155 160
His Ala Gly Met Thr Arg Ser Val Ile Val Cys Asn Gly Tyr Lys Asp
165 170 175
Arg Glu Tyr Ile Arg Leu Ala Leu Ile Gly Glu Lys Met Gly His Lys
180 185 190
Val Tyr Leu Val Ile Glu Lys Met Ser Glu Ile Ala Ile Val Leu Asp
195 200 205
Glu Ala Glu Arg Leu Asn Val Val Pro Arg Leu Gly Val Arg Ala Arg
210 215 220
Leu Ala Ser Gln Gly Ser Gly Lys Trp Gln Ser Ser Gly Gly Glu Lys
225 230 235 240
Ser Lys Phe Gly Leu Ala Ala Thr Gln Val Leu Gln Leu Val Glu Thr
245 250 255
Leu Arg Glu Ala Gly Arg Leu Asp Ser Leu Gln Leu Leu His Phe His
260 265 270
Leu Gly Ser Gln Met Ala Asn Ile Arg Asp Ile Ala Thr Gly Val Arg
275 280 285
Glu Ser Ala Arg Phe Tyr Val Glu Leu His Lys Leu Gly Val Asn Ile
290 295 300
Gln Cys Phe Asp Val Gly Gly Gly Leu Gly Val Asp Tyr Glu Gly Thr
305 310 315 320
Arg Ser Gln Ser Asp Cys Ser Val Asn Tyr Gly Leu Asn Glu Tyr Ala
325 330 335
Asn Asn Ile Ile Trp Ala Ile Gly Asp Ala Cys Glu Glu Asn Gly Leu
340 345 350
Pro His Pro Thr Val Ile Thr Glu Ser Gly Arg Ala Val Thr Ala His
355 360 365
His Thr Val Leu Val Ser Asn Ile Ile Gly Val Glu Arg Asn Glu Tyr
370 375 380
Thr Val Pro Thr Ala Pro Ala Glu Asp Ala Pro Arg Ala Leu Gln Ser
385 390 395 400
Met Trp Glu Thr Trp Gln Glu Met His Glu Pro Gly Thr Arg Arg Ser
405 410 415
Leu Arg Glu Trp Leu His Asp Ser Gln Met Asp Leu His Asp Ile His
420 425 430
Ile Gly Tyr Ser Ser Gly Ile Phe Ser Leu Gln Glu Arg Ala Trp Ala
435 440 445
Glu Gln Leu Tyr Leu Ser Met Cys His Glu Val Gln Lys Gln Leu Asp
450 455 460
Pro Gln Asn Arg Ala His Arg Pro Ile Ile Asp Glu Leu Gln Glu Arg
465 470 475 480
Met Ala Asp Lys Met Tyr Val Asn Phe Ser Leu Phe Gln Ser Met Pro
485 490 495
Asp Ala Trp Gly Ile Asp Gln Leu Phe Pro Val Leu Pro Leu Glu Gly
500 505 510
Leu Asp Gln Val Pro Glu Arg Arg Ala Val Leu Leu Asp Ile Thr Cys
515 520 525
Asp Ser Asp Gly Ala Ile Asp His Tyr Ile Asp Gly Asp Gly Ile Ala
530 535 540
Thr Thr Met Pro Met Pro Glu Tyr Asp Pro Glu Asn Pro Pro Met Leu
545 550 555 560
Gly Phe Phe Met Val Gly Ala Tyr Gln Glu Ile Leu Gly Asn Met His
565 570 575
Asn Leu Phe Gly Asp Thr Glu Ala Val Asp Val Phe Val Phe Pro Asp
580 585 590
Gly Ser Val Glu Val Glu Leu Ser Asp Glu Gly Asp Thr Val Ala Asp
595 600 605
Met Leu Gln Tyr Val Gln Leu Asp Pro Lys Thr Leu Leu Thr Gln Phe
610 615 620
Arg Asp Gln Val Lys Lys Thr Asp Leu Asp Ala Glu Leu Gln Gln Gln
625 630 635 640
Phe Leu Glu Glu Phe Glu Ala Gly Leu Tyr Gly Tyr Thr Tyr Leu Glu
645 650 655
Asp Glu
<210> 16
<211> 417
<212> PRT
<213> 大肠杆菌
<400> 16
Met Ser Phe Cys Trp Asn Glu Ile Asn Ser Gly Ile Lys Ser Leu Ile
1 5 10 15
Leu Ile Leu Cys Ile Phe Ser Leu Met Thr Leu Ser Leu Trp Asp Asp
20 25 30
Val Ala Thr Lys Phe Leu His Ala Ala Gly Ile Ile Ser Ala Leu Tyr
35 40 45
Phe Leu Ala Thr Pro Lys Lys Thr Ile Thr Asn Asn Pro Thr Leu Leu
50 55 60
Ile Phe Ile Ser Leu Cys Leu Leu Gly Ile Val Asn Ile Ile Trp Tyr
65 70 75 80
Ser His Tyr Lys Val Ser Gly Ser Val Tyr Thr Asn Ala Tyr Arg Gly
85 90 95
Pro Met Glu Thr Gly Lys Ile Ala Leu Cys Ser Ala Phe Ile Phe Leu
100 105 110
Val Leu Phe Ala Lys Asn Glu Met Arg Thr Lys Ile Lys Phe Gly Lys
115 120 125
Leu Ile Leu Phe Ala Ser Leu Ala Thr Gln Leu Leu Phe Phe Ala His
130 135 140
Ala Met Trp Gln His Phe Tyr Leu Asn Val Asp Arg Val Ala Leu Ser
145 150 155 160
Ala Ser His Ala Thr Thr Ala Gly Tyr Ile Ile Leu Phe Pro Ser Leu
165 170 175
Leu Ala Ser Ile Leu Ile Leu Lys Ser Asp Phe Arg His Lys Thr Thr
180 185 190
Leu Tyr Thr Ile Asn Phe Met Leu Ser Leu Cys Ala Val Ile Val Thr
195 200 205
Glu Thr Arg Ala Ala Ile Leu Val Phe Pro Phe Phe Ala Leu Ile Leu
210 215 220
Ile Val Met Asp Ser Tyr Ile Asn Lys Arg Ile Asn Tyr Lys Leu Tyr
225 230 235 240
Cys Phe Ile Thr Ile Ala Leu Leu Ala Gly Val Phe Ser Phe Lys Asp
245 250 255
Thr Leu Leu Met Arg Met Asn Asp Leu Asn Asn Asp Leu Val Asn Tyr
260 265 270
Ser His Asp Asn Thr Arg Thr Ser Val Gly Ala Arg Leu Ala Met Tyr
275 280 285
Glu Val Gly Leu Lys Thr Tyr Ser Pro Ile Gly Gln Ser Leu Glu Lys
290 295 300
Arg Ala Glu Lys Ile His Glu Leu Glu Glu Lys Glu Pro Arg Leu Ser
305 310 315 320
Gly Ala Leu Pro Tyr Val Asp Ser His Leu His Asn Asp Leu Ile Asp
325 330 335
Thr Leu Ser Thr Arg Gly Ile Pro Gly Val Val Leu Thr Ile Leu Ala
340 345 350
Phe Ser Ala Ile Leu Ile Tyr Ala Leu Arg Thr Ala Lys Glu Pro Tyr
355 360 365
Ile Leu Ile Leu Leu Phe Ser Leu Leu Val Val Gly Leu Ser Asp Val
370 375 380
Ile Leu Phe Ser Lys Pro Val Pro Thr Ala Val Phe Ile Thr Ile Ile
385 390 395 400
Leu Leu Cys Ala Tyr Phe Lys Ala Gln Ser Asp Gln Cys Leu Leu Glu
405 410 415
Lys
<210> 17
<211> 1653
<212> DNA
<213> 人工
<220>
<223> 适用于在乙酰丁酸梭菌中表达的荧光素酶编码序列
<400> 17
atggaggatg caaagaatat taagaaaggt ccagctcctt tctacccttt agaagacgga 60
actgctggtg agcaattaca caaggcaatg aagaggtatg cattagtacc aggaactata 120
gcttttactg atgctcatat tgaagtaaat ataacatatg cagaatactt tgagatgtct 180
gtgaggcttg cagaagcaat gaaaagatat ggattaaata ctaaccacag gatagtggtt 240
tgttctgaaa acagcttaca attcttcatg ccagttcttg gagcattatt cattggagtt 300
gctgtggctc cagcaaatga catttacaac gagagggagt tgttaaattc aatgaatatt 360
agtcaaccta ctgtagtgtt cgtttctaag aagggacttc agaaaattct aaacgtgcaa 420
aaaaagctac caattattca aaagataata attatggact caaaaactga ttaccaagga 480
ttccagagca tgtatacttt tgttacatct catctaccac caggttttaa tgagtatgat 540
ttcgtgccag aaagctttga cagagataag acaatagctt tgattatgaa cagctcagga 600
tctacaggac tacctaaggg tgtggctcta cctcatagga ctgcttgcgt taggtttagt 660
catgcaaggg accctatatt tggaaatcaa attattcctg atactgcaat actatcagtt 720
gtaccatttc atcacggatt cggtatgttc acaacattgg gatatcttat atgcggtttt 780
agagtggtac ttatgtatag gttcgaggaa gaactttttt taaggagtct acaagactac 840
aaaatacaat cagcattgtt agtgccaaca ttatttagtt ttttcgctaa aagcacactt 900
atagataaat acgacttgtc taacctacac gaaatagcaa gcggtggagc tcctttatct 960
aaagaggtag gagaagctgt tgcaaaaaga ttccacttac ctggtataag acagggttat 1020
ggattgacag aaacaacatc agcaattttg attactccag agggagatga caagccaggt 1080
gctgtaggaa aggtggtacc attctttgaa gctaaagtag tagacttgga cacaggaaaa 1140
actctaggtg tgaatcagag aggagaactt tgcgtaaggg gaccaatgat aatgtcaggt 1200
tatgtaaata atccagaggc aacaaatgca cttatagata aagatggttg gttgcacagc 1260
ggagatatag cttactggga tgaggacgaa cattttttta ttgtggacag gcttaaaagt 1320
ttgattaaat acaaaggtta ccaggtggca ccagctgagc ttgaatctat attgcttcaa 1380
cacccaaata tttttgatgc tggtgtagca ggtcttcctg atgatgatgc aggagagctt 1440
ccagctgctg tagtagtatt agagcacgga aagacaatga cagaaaagga aatagtggac 1500
tacgttgcat ctcaggttac aactgcaaag aagctaaggg gaggtgttgt ttttgtagac 1560
gaagttccta aaggattgac aggaaagttg gacgctagga agattagaga gattctaata 1620
aaagctaaga agggtggtaa aagtaagtta tag 1653
<210> 18
<211> 3416
<212> DNA
<213> 人工
<220>
<223> 表达载体pJL1+荧光素酶密码子的核苷酸序列
适用于在乙酰丁酸梭菌中表达的序列
<400> 18
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 60
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 120
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 180
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 240
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 300
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 360
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 420
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 480
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 540
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 600
ggaaaaacgc cagcaacgcg atcccgcgaa attaatacga ctcactatag ggagaccaca 660
acggtttccc tctagaaata attttgttta actttaagaa ggagatatac atatggagga 720
tgcaaagaat attaagaaag gtccagctcc tttctaccct ttagaagacg gaactgctgg 780
tgagcaatta cacaaggcaa tgaagaggta tgcattagta ccaggaacta tagcttttac 840
tgatgctcat attgaagtaa atataacata tgcagaatac tttgagatgt ctgtgaggct 900
tgcagaagca atgaaaagat atggattaaa tactaaccac aggatagtgg tttgttctga 960
aaacagctta caattcttca tgccagttct tggagcatta ttcattggag ttgctgtggc 1020
tccagcaaat gacatttaca acgagaggga gttgttaaat tcaatgaata ttagtcaacc 1080
tactgtagtg ttcgtttcta agaagggact tcagaaaatt ctaaacgtgc aaaaaaagct 1140
accaattatt caaaagataa taattatgga ctcaaaaact gattaccaag gattccagag 1200
catgtatact tttgttacat ctcatctacc accaggtttt aatgagtatg atttcgtgcc 1260
agaaagcttt gacagagata agacaatagc tttgattatg aacagctcag gatctacagg 1320
actacctaag ggtgtggctc tacctcatag gactgcttgc gttaggttta gtcatgcaag 1380
ggaccctata tttggaaatc aaattattcc tgatactgca atactatcag ttgtaccatt 1440
tcatcacgga ttcggtatgt tcacaacatt gggatatctt atatgcggtt ttagagtggt 1500
acttatgtat aggttcgagg aagaactttt tttaaggagt ctacaagact acaaaataca 1560
atcagcattg ttagtgccaa cattatttag ttttttcgct aaaagcacac ttatagataa 1620
atacgacttg tctaacctac acgaaatagc aagcggtgga gctcctttat ctaaagaggt 1680
aggagaagct gttgcaaaaa gattccactt acctggtata agacagggtt atggattgac 1740
agaaacaaca tcagcaattt tgattactcc agagggagat gacaagccag gtgctgtagg 1800
aaaggtggta ccattctttg aagctaaagt agtagacttg gacacaggaa aaactctagg 1860
tgtgaatcag agaggagaac tttgcgtaag gggaccaatg ataatgtcag gttatgtaaa 1920
taatccagag gcaacaaatg cacttataga taaagatggt tggttgcaca gcggagatat 1980
agcttactgg gatgaggacg aacatttttt tattgtggac aggcttaaaa gtttgattaa 2040
atacaaaggt taccaggtgg caccagctga gcttgaatct atattgcttc aacacccaaa 2100
tatttttgat gctggtgtag caggtcttcc tgatgatgat gcaggagagc ttccagctgc 2160
tgtagtagta ttagagcacg gaaagacaat gacagaaaag gaaatagtgg actacgttgc 2220
atctcaggtt acaactgcaa agaagctaag gggaggtgtt gtttttgtag acgaagttcc 2280
taaaggattg acaggaaagt tggacgctag gaagattaga gagattctaa taaaagctaa 2340
gaagggtggt aaaagtaagt tataggtcga ccggctgcta acaaagcccg aaaggaagct 2400
gagttggctg ctgccaccgc tgagcaataa ctagcataac cccttggggc ctctaaacgg 2460
gtcttgaggg gttttttgct gaaagccaat tctgattaga aaaactcatc gagcatcaaa 2520
tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 2580
tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 2640
tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 2700
aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagc 2760
ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 2820
ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 2880
tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 2940
agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 3000
ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 3060
atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 3120
tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 3180
tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 3240
tataaatcag catccatgtt ggaatttaat cgcggcttcg agcaagacgt ttcccgttga 3300
atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 3360
gatgatatat ttttatcttg tgcaatgtaa catcagagat tttgagacac aacgtg 3416
<210> 19
<211> 1653
<212> DNA
<213> 人工
<220>
<223> 适用于在产乙醇梭菌中表达的荧光素酶密码子序列
<400> 19
atggaagatg caaaaaatat aaagaaagga ccagcaccat tctatccact tgaagacgga 60
acagcaggag aacagctaca taaagcaatg aaaagatatg cacttgtacc gggaacaata 120
gcttttactg atgctcacat agaagtaaac ataacctatg cggaatattt tgaaatgtca 180
gtaagattgg cagaggcaat gaaaagatat ggattaaata caaatcatag aatagtagtg 240
tgtagtgaaa acagcttgca gttttttatg cctgtacttg gtgctttatt cataggtgta 300
gcagtagcac cagctaatga tatttataat gaacgtgagc ttttaaattc tatgaatata 360
agtcagccaa ctgtagtatt tgtttcaaag aaaggtttgc agaagatttt gaatgttcaa 420
aagaaattgc ctataattca aaaaataata attatggatt ctaagacaga ttatcaggga 480
ttccagtcta tgtatacatt cgtaacatct catcttcccc cgggatttaa tgaatatgac 540
ttcgtacctg aatcctttga tagagataag acaatagctt taatcatgaa tagttcagga 600
agcacaggac ttcctaaagg tgtggcactt ccacatagaa ctgcttgtgt tagattctct 660
catgctagag atccaatttt tggaaatcaa ataattccag atacagcaat actaagtgta 720
gtaccattcc atcatggatt tgggatgttt acaactcttg gatatttaat ttgtggtttt 780
agagttgtat taatgtatag atttgaggaa gaactcttcc ttcgttcact acaagactat 840
aagatacaat ctgctttact tgtaccaact ttattttcat tttttgctaa gagtactctt 900
atagataaat atgatttaag caacctgcat gaaatagcat caggcggcgc tccactatct 960
aaggaagttg gagaagctgt tgctaaaaga ttccacttac caggaatcag gcagggatat 1020
ggacttacag aaacaacttc agcaattctt attacacctg aaggagatga caagcctgga 1080
gcagtaggta aagtggtacc attctttgaa gctaaagtag tagatttaga tacaggaaaa 1140
acattgggag ttaaccagag aggagagctg tgtgtaagag gacctatgat aatgagtgga 1200
tatgtaaata atccagaagc cactaatgca ttaatagata aggatggatg gctgcattct 1260
ggtgatatag catattggga tgaagatgaa cattttttta ttgtagatag actaaaatcc 1320
ctaataaaat ataagggata ccaggtagct ccagcagaat tagaatcaat acttctgcag 1380
catccaaaca tatttgatgc aggagtagct ggattaccag atgatgatgc aggagaactt 1440
cctgctgcag tagttgtttt agagcatggc aaaactatga ctgaaaaaga gatagttgac 1500
tatgttgcaa gtcaggttac tacagcaaag aaattgagag gcggcgtagt attcgtagat 1560
gaggttccaa aaggtcttac aggaaaattg gatgcaagaa aaatacgtga aatacttata 1620
aaggcaaaga agggcggcaa atcaaaatta taa 1653
<210> 20
<211> 1653
<212> DNA
<213> 人工
<220>
<223> 适用于在大肠杆菌中表达的荧光素酶编码序列
<400> 20
atggaagacg ccaaaaacat aaagaaaggc ccggctccat tctatccgct agaggatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtgaac atcacgtacg cggaatactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgaacatt 360
tcgcagccta ccgtagtgtt tgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaaattac caataatcca gaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtaccag agtcctttga tcgtgacaaa acaattgcac tgataatgaa ctcctctgga 600
tctactgggt tacctaaggg tgtggccctt ccgcatagaa ctgcctgcgt cagattctcg 660
catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720
gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780
cgagtcgtct taatgtatag atttgaagaa gagctgtttt tacgatccct tcaggattac 840
aaaattcaaa gtgcgttgct agtaccaacc ctattttcat tcttcgccaa aagcactctg 900
attgacaaat acgatttatc taatttacac gaaattgctt ctgggggcgc acctctttcg 960
aaagaagtcg gggaagcggt tgcaaaacgc ttccatcttc cagggatacg acaaggatat 1020
gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080
gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140
acgctgggcg ttaatcagag aggcgaatta tgtgtcagag gacctatgat tatgtccggt 1200
tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260
ggagacatag cttactggga cgaagacgaa cacttcttca tagttgaccg cttgaagtct 1320
ttaattaaat acaaaggata ccaggtggcc cccgctgaat tggagtcgat attgttacaa 1380
caccccaaca tcttcgacgc gggcgtggca ggtcttcccg acgatgacgc cggtgaactt 1440
cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat 1500
tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac 1560
gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata 1620
aaggccaaga agggcggaaa gtccaaattg taa 1653
<210> 21
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物- pJL1线性F
<400> 21
ctgagatacc tacagcgtga gc 22
<210> 22
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物- pJL1线性R
<400> 22
cgtcactcat ggtgatttct cacttg 26
<210> 23
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物- PS_pJL1线性F
<400> 23
ccgaactgag atacctacag cgtgagc 27
<210> 24
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物- PS_pJL1线性R
<400> 24
tcagtcgtca ctcatggtga tttctcactt g 31
<210> 25
<211> 488
<212> DNA
<213> 产乙醇梭菌
<220>
<221> misc_feature
<222> (1)..(488)
<223> 磷酸转乙酰酶-乙酸激酶操纵子(pPta-Ack;
CAETHG_RS16490)启动子
<400> 25
ggccgcaata tgatatttat gtccattgtg aaagggatta tattcaacta ttattccagt 60
tacgttcata gaaattttcc tttctaaaat attttattcc atgtcaagaa ctctgtttat 120
ttcattaaag aactataagt acaaagtata aggcatttga aaaaataggc tagtatattg 180
attgattatt tattttaaaa tgcctaagtg aaatatatac atattataac aataaaataa 240
gtattagtgt aggattttta aatagagtat ctattttcag attaaatttt tgattatttg 300
atttacatta tataatattg agtaaagtat tgactagcaa aattttttga tactttaatt 360
tgtgaaattt cttatcaaaa gttatatttt tgaataattt ttattgaaaa atacaactaa 420
aaaggattat agtataagtg tgtgtaattt tgtgttaaat ttaaagggag gaaatgaaca 480
tgaaacat 488
<210> 26
<211> 475
<212> DNA
<213> 产乙醇梭菌
<220>
<221> misc_feature
<222> (1)..(475)
<223> 丙酮酸:甲酸氧化还原酶(pPFOR;CAETHG_RS14890)启动子
<400> 26
gcaaaatagt tgataataat gcagagttat aaacaaaggt gaaaagcatt acttgtattc 60
ttttttatat attattataa attaaaatga agctgtatta gaaaaaatac acacctgtaa 120
tataaaattt taaattaatt tttaattttt tcaaaatgta ttttacatgt ttagaatttt 180
gatgtatatt aaaatagtag aatacataag atacttaatt taattaaaga tagttaagta 240
cttttcaatg tgctttttta gatgtttaat acaaatcttt aattgtaaaa gaaatgctgt 300
actatttact gtactagtga cgggattaaa ctgtattaat tataaataaa aaataagtac 360
agttgtttaa aattatattt tgtattaaat ctaatagtac gatgtaagtt attttatact 420
attgctagtt taataaaaag atttaattat atacttgaaa aggagaggaa tccat 475
<210> 27
<211> 558
<212> DNA
<213> 产乙醇梭菌
<220>
<221> misc_feature
<222> (1)..(558)
<223> Wood-Ljungdahl 簇(pWL;CAETHG_RS07860)启动子
<400> 27
agatagtcat aatagttcca gaatagttca atttagaaat tagactaaac ttcaaaatgt 60
ttgttaaata tataccaaac tagtatagat attttttaaa tactggactt aaacagtagt 120
aatttgccta aaaaattttt tcaatttttt ttaaaaaatc cttttcaagt tgtacattgt 180
tatggtaata tgtaattgaa gaagttatgt agtaatattg taaacgtttc ttgatttttt 240
tacatccatg tagtgcttaa aaaaccaaaa tatgtcacat gcaattgtat atttcaaata 300
acaatattta ttttctcgtt aaattcacaa ataatttatt aataatatca ataaccaaga 360
ttatacttaa atggatgttt attttttaac acttttatag taaatatatt tattttatgt 420
agtaaaaagg ttataattat aattgtattt attacaatta attaaaataa aaaatagggt 480
tttaggtaaa attaagttat tttaagaagt aattacaata aaaattgaag ttatttcttt 540
aaggagggaa ttattcat 558
<210> 28
<211> 239
<212> PRT
<213> 产乙醇梭菌
<220>
<221> MISC_FEATURE
<222> (1)..(239)
<223> 代谢基因:乙酰乳酸脱羧酶(CAETHG_RS14410)
<400> 28
Met Asp Asp Glu Val Lys Val Pro Asn His Ile Tyr Gln Met Ser Thr
1 5 10 15
Ile Asn Ala Leu Val Ser Gly Leu Tyr Asp Gly Cys Val Ser Leu Ser
20 25 30
Lys Leu Leu Lys Lys Gly Asn Phe Gly Ile Gly Thr Phe Lys Gly Leu
35 40 45
Asp Gly Glu Leu Thr Leu Leu Asn Gly Thr Phe Tyr Arg Thr Lys Pro
50 55 60
Asp Gly Ser Val Tyr Val Cys Ser Lys Asn Val Ser Val Pro Phe Ala
65 70 75 80
Val Val Thr Glu Leu Glu Asn Tyr Asn Thr Tyr Asn Ile Gln Asn Arg
85 90 95
Thr Ser Tyr Glu Asp Ile Arg Lys Glu Leu Asp Ser Phe Ile Glu Ser
100 105 110
Lys Asn Ile Phe Tyr Ala Phe Tyr Met Glu Gly Lys Phe Asn Tyr Val
115 120 125
Lys Thr Arg Thr Val Val Lys Gln Asn Met Pro Tyr Lys Pro Met Ala
130 135 140
Glu Val Val Lys Asp Gln Pro Met Phe Glu Tyr Asn Gly Val Asp Gly
145 150 155 160
Tyr Val Val Gly Phe Arg Cys Pro Asp Tyr Val Glu Gly Leu Asn Val
165 170 175
Pro Gly Tyr His Phe His Phe Ile Asn Lys Asp Lys Lys Phe Gly Gly
180 185 190
His Ile Ser Glu Phe Ser Ile Glu Asn Ala Lys Val Tyr Val Gln Asn
195 200 205
Cys Ser Cys Phe Arg Met Glu Leu Pro Lys Asn Glu Ser Phe Tyr Asn
210 215 220
Met Glu Val Gln Asp Arg Asn Asp Glu Ile Thr Ser Val Glu Lys
225 230 235
<210> 29
<211> 556
<212> PRT
<213> 产乙醇梭菌
<220>
<221> MISC_FEATURE
<222> (1)..(556)
<223> 代谢基因:乙酰乳酸合酶(CAETHG_RS08420)
<400> 29
Met Asn Arg Asp Ile Lys Lys Glu Val Gln Leu Asn Thr Ala Gln Met
1 5 10 15
Leu Val Lys Cys Leu Glu Ala Glu Gly Val Lys Tyr Ile Phe Gly Ile
20 25 30
Pro Gly Glu Glu Asn Leu Glu Ile Met Asn Ala Ile Ser Asp Ser Thr
35 40 45
Ile Glu Phe Ile Thr Thr Arg His Glu Gln Gly Ala Ala Phe Met Ala
50 55 60
Asp Val Tyr Gly Arg Leu Thr Gly Lys Ala Gly Val Cys Leu Ser Thr
65 70 75 80
Leu Gly Pro Gly Ala Thr Asn Leu Val Thr Gly Val Ala Asp Ala Asp
85 90 95
Ser Asp Gly Ala Pro Val Val Ala Ile Thr Gly Gln Val Gly Thr Glu
100 105 110
Arg Met His Ile Thr Ser His Gln Phe Leu Asp Leu Cys Lys Met Phe
115 120 125
Glu Pro Ile Thr Lys Arg Ser Lys Gln Ile Val Arg Pro Asp Thr Val
130 135 140
Ser Glu Ile Ile Arg Leu Val Phe Lys Tyr Ala Glu Ser Glu Lys Pro
145 150 155 160
Gly Ala Cys His Ile Asp Leu Pro Val Asn Ile Ala Lys Met Pro Val
165 170 175
Gly Ala Leu Glu Lys Pro Leu Glu Lys Lys Ile Pro Pro Lys Glu His
180 185 190
Ala Asp Leu Ser Thr Ile Glu Glu Ala Ala Ser Glu Ile Phe Lys Ala
195 200 205
Lys Asn Pro Ile Ile Leu Ala Gly Ser Gly Ala Ile Arg Gly Asn Ser
210 215 220
Ser Lys Ala Val Thr Glu Phe Ala Thr Lys Leu Lys Ile Pro Val Ile
225 230 235 240
Asn Thr Met Met Ala Lys Gly Ile Ile Pro Met Asp Asn Lys Tyr Ser
245 250 255
Met Trp Thr Ile Gly Ile Pro Gln Lys Asp Tyr Val Asn Lys Ile Ile
260 265 270
Glu Glu Ala Asp Leu Val Ile Thr Ile Gly Tyr Asp Ile Val Glu Tyr
275 280 285
Ala Pro Ser Lys Trp Asn Ile Asn Gly Asp Ile Lys Ile Val His Ile
290 295 300
Asp Ala Arg Pro Ser His Ile Asn Lys Leu Tyr Gln Pro Ile Val Glu
305 310 315 320
Val Val Gly Asp Ile Ser Asp Ala Leu Tyr Asn Ile Leu Arg Arg Thr
325 330 335
Ser Ser Lys Asp Glu Pro Val Lys Ala Leu Glu Ile Lys Ser Glu Met
340 345 350
Leu Ala Glu His Glu Ser Tyr Ala Asn Asp Asn Ala Phe Pro Met Lys
355 360 365
Pro Gln Arg Ile Leu Asn Asp Val Arg Lys Val Met Gly Pro His Asp
370 375 380
Ile Val Ile Ser Asp Val Gly Ala His Lys Met Trp Ile Ala Arg His
385 390 395 400
Tyr Asn Cys Tyr Glu Pro Asn Thr Cys Ile Ile Ser Asn Gly Phe Ala
405 410 415
Thr Met Gly Ile Gly Val Pro Gly Ala Ile Ala Ala Lys Leu Ile Asn
420 425 430
Pro Asp Lys Lys Val Leu Ala Ile Val Gly Asp Gly Gly Phe Met Met
435 440 445
Asn Asn Gln Glu Leu Glu Thr Ala Leu Arg Ile Lys Thr Pro Ile Val
450 455 460
Val Leu Ile Phe Asn Asp Ser Asn Tyr Gly Leu Ile Lys Trp Lys Gln
465 470 475 480
Glu Glu His Tyr Gly Lys Ser Cys Tyr Val Asp Phe Thr Asn Pro Asp
485 490 495
Phe Val Lys Leu Ala Glu Ser Met Tyr Ala Lys Gly Tyr Arg Val Glu
500 505 510
Lys Ala Glu Asp Leu Ile Pro Thr Leu Glu Glu Ala Phe Lys Gln Asn
515 520 525
Val Pro Ala Val Ile Asp Cys Gln Val Asp Tyr Gly Glu Asn Ile Lys
530 535 540
Leu Thr Lys His Leu Lys Glu Val Tyr Glu Asn Met
545 550 555
<210> 30
<211> 351
<212> PRT
<213> 产乙醇梭菌
<220>
<221> MISC_FEATURE
<222> (1)..(351)
<223> 代谢基因:初级:二级乙醇脱氢酶
(CAETHG_RS02620)
<400> 30
Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu
1 5 10 15
Lys Lys Asn Pro Val Pro Gly Pro Tyr Asp Ala Ile Val His Pro Leu
20 25 30
Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala
35 40 45
Leu Gly Asn Arg Glu Asn Met Ile Leu Gly His Glu Ala Val Gly Glu
50 55 60
Ile Ala Glu Val Gly Ser Glu Val Lys Asp Phe Lys Val Gly Asp Arg
65 70 75 80
Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln
85 90 95
Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe
100 105 110
Ser Asn Phe Lys Asp Gly Val Phe Ala Asp Tyr Phe His Val Asn Asp
115 120 125
Ala Asp Met Asn Leu Ala Ile Leu Pro Asp Glu Ile Pro Leu Glu Ser
130 135 140
Ala Val Met Met Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu
145 150 155 160
Leu Ala Asp Ile Lys Met Gly Ser Ser Val Val Val Ile Gly Ile Gly
165 170 175
Ala Val Gly Leu Met Gly Ile Ala Gly Ser Lys Leu Arg Gly Ala Gly
180 185 190
Arg Ile Ile Gly Val Gly Ser Arg Pro Val Cys Val Glu Thr Ala Lys
195 200 205
Phe Tyr Gly Ala Thr Asp Ile Val Asn Tyr Lys Asn Gly Asp Ile Val
210 215 220
Glu Gln Ile Met Asp Leu Thr His Gly Lys Gly Val Asp Arg Val Ile
225 230 235 240
Met Ala Gly Gly Gly Ala Glu Thr Leu Ala Gln Ala Val Thr Met Val
245 250 255
Lys Pro Gly Gly Val Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp
260 265 270
Thr Leu Pro Ile Pro Arg Val Gln Trp Gly Cys Gly Met Ala His Lys
275 280 285
Thr Ile Arg Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Met Glu Met
290 295 300
Leu Arg Asp Leu Val Leu Tyr Lys Arg Val Asp Leu Ser Lys Leu Val
305 310 315 320
Thr His Val Phe Asp Gly Ala Glu Asn Ile Glu Lys Ala Leu Leu Leu
325 330 335
Met Lys Asn Lys Pro Lys Asp Leu Ile Lys Ser Val Val Thr Phe
340 345 350
- 上一篇:一种医用注射器针头装配设备
- 下一篇:改进的核酸扩增