增加nadph的生物合成途径的基因组工程化

文档序号：1580711 发布日期：2020-01-31 浏览：29次 >En<

阅读说明：本技术 增加nadph的生物合成途径的基因组工程化 (Genome engineering of NADPH-increasing biosynthetic pathways ) 是由 S·曼彻斯特 B·梅森 A·戈拉诺夫于 2018-05-18 设计创作，主要内容包括：本公开涉及具有改变的NADPH可用性以增加使用NADPH产生的化合物的产生的宿主细胞以及其使用方法。通过以下中的一或多个来改变NADPH可用性：在所述宿主细胞中表达改变的GAPDH,表达变异谷氨酸脱氢酶gdh、天冬氨酸半醛脱氢酶asd、二氢吡啶甲酸还原酶dapB和内消旋-二氨基庚二酸脱氢酶ddh,表达新颖烟酰胺核苷酸转氢酶,表达新颖苏氨酸醛缩酶,以及表达丙酮酸羧化酶或调节丙酮酸羧化酶的所述表达。(The NADPH availability is altered by or more of expressing altered GAPDH in the host cell, expressing variant glutamate dehydrogenase gdh, aspartate semialdehyde dehydrogenase asd, dihydropicolinate reductase dapB, and meso-diaminopimelate dehydrogenase ddh, expressing a novel nicotinamide nucleotide transhydrogenase, expressing a novel threonine aldolase, and expressing pyruvate carboxylase or modulating the expression of pyruvate carboxylase.)

增加NADPH的生物合成途径的基因组工程化

相关申请的交叉引用

本申请要求2017年5月19日提交的美国临时申请第62/508,589号的优先权益，所述临时申请以全文引用的方式并入本文中。

关于序列表的陈述

与本申请相关的序列表以文本格式代替纸本拷贝提供，并且在此以引用的方式并入本说明书中。含有序列表的文本文件的名称是ZYMR_011_01WO_SeqList_ST25.txt。所述文本文件是950KB，创建于2018年5月18日，并且以电子方式通过EFS-Web提交。

技术领域

本公开大体上是针对增加微生物细胞中的NADPH可用性的微生物工程化方法。

具体地说，本公开涉及通过在宿主细胞中表达以下中的一或多种将宿主细胞进行工程化以增加NADPH可用性：改变的GAPDH、变异谷氨酸脱氢酶(glutamate dehydrogenase，gdh)、天冬氨酸半醛脱氢酶(aspartate semialdehyde dehydrogenase，asd)、二氢吡啶甲酸还原酶(dihydropicolinate reductase，dapB)、内消旋-二氨基庚二酸脱氢酶(meso-diaminopimelate dehydrogenase，ddh)、苏氨酸醛缩酶(threonine aldohase，ltaE)、丙酮酸羧化酶(pyruvate carboxylase，pyc)和新颖烟酰胺核苷酸转氢酶。

背景技术

NADPH作为一种还原当量，与用于合成如糖和例如L-赖氨酸和L-苏氨酸等氨基酸的工业上重要化合物的许多重要生物过程有关。然而，众所周知，NADPH的正常细胞供应可能是使用NADPH产生的化合物的产生中的限制因素。举例来说，当在谷氨酸棒状杆菌(C.glutamicum)中以工业规模产生L-赖氨酸时NADPH可能是限制因素(贝克尔(Becker)等人(2005),《环境微生物学应用(Appl.Environ.Microbiol.)》,71(12):8587-8596)。

因此，本领域中非常需要将工业微生物工程化的新方法，以克服对用于产生使用NADPH制成的化合物的细胞，例如用于产生L-赖氨酸或L-苏氨酸的细胞中NADPH的可用性的限制。

发明内容

本公开涉及克服对宿主细胞中NADPH可用性的限制，增加L-赖氨酸、L-苏氨酸、L-异亮氨酸、L-甲硫氨酸或L-甘氨酸产生的至少六个策略：(1)通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(Glyceraldehyde-3-phosphate dehydrogenase，gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化；(2)在宿主细胞中表达由NADH产生NADPH的转氢酶；(3)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh、asd、dapB和ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程；(4)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和asd酶的同源物，将用于苏氨酸合成的thrABC-途径重编程；(5)通过表达减少或逆转苏氨酸降解成甘氨酸的内源性L-苏氨酸醛缩酶(ltA)的同源物，将苏氨酸合成重编程；以及(6)表达异源丙酮酸羧化酶(pyc)或其同源物以增加草酰乙酸的合成，或增加内源性pyc的表达。

在某些实施例中，提供了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，所述方法包含改变细胞的可利用的NADPH。

在某些实施例中，提供了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中相对于缺乏经修饰的GAPDH的对应宿主细胞，所述宿主细胞提高使用NADPH产生的化合物的产生。

在某些实施例中，提供了一种产生L-赖氨酸的方法，其包含培养棒状杆菌属菌株并从所培养的棒状杆菌属菌株或培养液回收L-赖氨酸，其中所述棒状杆菌属菌株表达使用NADP作为辅酶的经修饰的GAPDH，并且其中所述棒状杆菌属菌株的L-赖氨酸生产率得到提高。

在某些实施例中，提供了一种加宽GAPDH的辅酶特异性的方法，其包含：对所述GAPDH进行修饰，使得经修饰的GAPDH具有针对辅酶NADP和NAD的双特异性。

在某些实施例中，提供了一种提高宿主细胞产生使用NADPH产生的化合物的效率的方法，其包含：在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性。

在某些实施例中，提供了一种宿主细胞，其包含：一或多种酶gdh、asd、dapB和ddh的变体，其中所述变体展现针对辅酶NADH和NADPH的双特异性。

在某些实施例中，提供了一种提高宿主细胞产生使用NADPH产生的化合物的效率的方法，其包含在所述宿主细胞中表达新颖烟酰胺核苷酸转氢酶。

在某些实施例中，提供了一种提高宿主细胞产生L-赖氨酸的效率的方法，其包含以下中的两个或更多个：

对内源性GAPDH进行修饰，使得经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性；

在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性；以及

在所述宿主细胞中表达新颖烟酰胺核苷酸转氢酶。

在某些实施例中，提供了一种提高宿主细胞产生使用NADPH产生的化合物的效率的方法，其包含：在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)和天冬氨酸半醛脱氢酶(asd)中的一或两种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性。

在某些实施例中，提供了一种提高宿主细胞产生L-苏氨酸的效率的方法，其包含：在所述宿主细胞中表达苏氨酸醛缩酶的变异酶，其中所述变异酶展现与大肠杆菌苏氨酸醛缩酶(ltaE)不同的底物偏好或酶动力学。

在某些实施例中，提供了一种增加宿主细胞的L-苏氨酸产生的方法，其包含：在所述宿主细胞中表达酶甘油醛3-磷酸脱氢酶(gapA)、谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、苏氨酸醛缩酶(ltaE)和丙酮酸羧化酶(pyc)中的一或多种酶的变异酶。

在某些实施例中，提供了一种宿主细胞，其包含多拷贝复制质粒，所述多拷贝复制质粒包含各自可操作地连接到一或多个合成启动子的thrA基因、thrB基因和thrC基因。

在某些实施例中，提供了一种提高宿主细胞产生化合物的效率的方法，其包含以下中的两个或更多个：(1)通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化；(2)在宿主细胞中表达由NADH产生NADPH的转氢酶；(3)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh、asd、dapB和ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程；(4)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和asd酶的同源物，将用于苏氨酸合成的thrABC-途径重编程；(5)通过表达减少或逆转苏氨酸降解成甘氨酸的内源性L-苏氨酸醛缩酶(ltA)的同源物，将苏氨酸合成重编程；以及(6)表达异源丙酮酸羧化酶(pyc)或其同源物以增加草酰乙酸的合成，或增加内源性pyc的表达。

在某些实施例中，提供了一种人工多核苷酸，其编码截短的甘油醛-3-磷酸脱氢酶(gapA)基因，其中所述多核苷酸包含与选自由SEQ ID NO:290、291、292和293组成的群组的多核苷酸序列至少85％、90％、95％或99％相同的序列。

在某些实施例中，提供了一种甘油醛-3-磷酸脱氢酶(gapA)的重组蛋白片段，其中所述重组蛋白片段包含与选自由SEQ ID NO:233、234、235、236和298组成的群组的氨基酸序列至少70％、80％、90％或95％相同的序列。

在某些实施例中，提供了一种提高宿主细胞的L-赖氨酸或L-苏氨酸产生效率的方法，其包含增加宿主细胞产生NADPH的能力。在一些方面，所述方法包含对甘油醛-3-磷酸脱氢酶(GAPDH)进行修饰，使得其辅酶特异性加宽。在某些情况下，经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性。在某些方面，宿主细胞是原核细胞。在某些方面，宿主细胞是棒状杆菌属。在一些方面，宿主细胞是谷氨酸棒状杆菌。在一些实施例中，宿主细胞是大肠杆菌。在一些实施例中，天然存在的GAPDH具有SEQ ID NO:58的氨基酸序列。在一些方面，经修饰的GAPDH包含与SEQ ID NO:58的氨基酸序列至少95％相同的氨基酸序列。在某些实施例中，经修饰的GAPDH在与SEQ ID NO:58的氨基酸37相对应的位置处包含氨基酸置换。在其它实施例中，经修饰的GAPDH在与SEQ ID NO:58的氨基酸36和37相对应的位置处包含氨基酸置换。在某些方面，在与SEQ ID NO:58的氨基酸37相对应的位置处的苏氨酸已经被赖氨酸置换。在其它方面，在与SEQ ID NO:58的氨基酸36相对应的位置处的亮氨酸已经被苏氨酸置换，并且在与SEQ ID NO:58的氨基酸37相对应的位置处的苏氨酸已经被赖氨酸置换。

在某些实施例中，提供了一种提高宿主细胞产生L-赖氨酸的效率的方法，其包含降低所述宿主细胞利用NADPH的能力，所述方法包含在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性。在某些方面，所有四种酶同时在宿主细胞中表达。在某些实施例中，提供了一种提高宿主细胞产生L-苏氨酸的效率的方法，其包含降低所述宿主细胞利用NADPH的能力，所述方法包含在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)和天冬氨酸半醛脱氢酶(asd)中的一或两种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性。在一些实施例中，相比于NADPH，变异酶更有效地使用NADH。在某些实施例中，所述方法包含表达gdh的变异酶，其中所述变异酶包含与SEQ IDNO:42的氨基酸序列至少约70％、75％、80％、85％、90％、95％或100％相同的氨基酸序列。在某些方面，所述方法包含表达gdh的变异酶，其中所述变异酶包含与SEQ ID NO:42的氨基酸序列至少约95％相同的氨基酸序列。在其它实施例中，所述方法包含表达asd的变异酶，其中所述变异酶包含与SEQ ID NO:40的氨基酸序列至少约70％、75％、80％、85％、90％、95％或100％相同的氨基酸序列。在其它方面，所述方法包含表达asd的变异酶，其中所述变异酶包含与SEQ ID NO:40的氨基酸序列至少95％相同的氨基酸序列。在其它方面，所述方法包含表达dapB的变异酶，其中所述变异酶包含与SEQ ID NO:46的氨基酸序列至少95％相同的氨基酸序列。在其它方面，所述方法包含表达ddh的变异酶，其中所述ddh酶包含SEQ ID NO:4的氨基酸序列。在某些实施例中，gdh的变异酶包含SEQ ID NO:44的氨基酸序列。在其它实施例中，asd的变异酶包含SEQ ID NO:30的氨基酸序列。在其它实施例中，dapB的变异酶包含SEQ ID NO:48的氨基酸序列。

在其它实施例中，提供了一种产生L-赖氨酸或L-苏氨酸的方法，其包含培养棒状杆菌属或大肠杆菌菌株并从所培养的棒状杆菌属或大肠杆菌菌株或培养液回收L-赖氨酸或L-苏氨酸，其中所述棒状杆菌属或大肠杆菌菌株表达使用NADP作为辅酶的经修饰的GAPDH，并且其中所述棒状杆菌属菌株的L-赖氨酸或L-苏氨酸生产率得到提高。

在其它实施例中，提供了一种通过对GAPDH进行修饰来加宽GAPDH的辅酶特异性的方法，其中经修饰的GAPDH具有针对辅酶NADP和NAD的双特异性。在某些方面，相对于NAD，经修饰的GAPDH具有增加的针对辅酶NADP的特异性。在其它方面，相比于NAD，经修饰的GAPDH更有效地使用NADP。

在一些实施例中，提供了一种包含经修饰的GAPDH的宿主细胞，其中所述经修饰的GAPDH包含与SEQ ID NO:58的氨基酸序列至少95％相同的氨基酸序列，并且其中在与SEQID NO:58的氨基酸37相对应的位置处的苏氨酸已经被赖氨酸置换。在某些方面，宿主细胞是谷氨酸棒状杆菌。

在其它实施例中，提供了一种包含经修饰的GAPDH的宿主细胞，其中所述经修饰的GAPDH包含与SEQ ID NO:58的氨基酸序列至少95％相同的氨基酸序列，并且其中在与SEQID NO:58的氨基酸36相对应的位置处的亮氨酸已经被苏氨酸置换，并且在与SEQ ID NO:58的氨基酸37相对应的位置处的苏氨酸已经被赖氨酸置换。在某些方面，宿主细胞是谷氨酸棒状杆菌。

在进一步实施例中，提供了一种宿主细胞，其包含一或多种酶gdh、asd、dapB和ddh的变体，其中所述变体展现针对辅酶NADH和NADPH的双特异性。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，所述方法包含改变细胞的可利用的NADPH。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中通过在所述细胞中表达经修饰的甘油醛-3-磷酸脱氢酶(GAPDH)来改变可利用的NADPH，其中经修饰的GAPDH经过修饰，使得其辅酶特异性加宽。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中所述宿主细胞是棒状杆菌属。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中所述宿主细胞是谷氨酸棒状杆菌。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中所述天然存在的GAPDH是gapA。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中所述gapA具有SEQ ID NO:58的氨基酸序列。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中经修饰的GAPDH包含与SEQ ID NO:58的氨基酸序列至少95％相同的氨基酸序列。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸37相对应的位置处包含氨基酸置换。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸36和37相对应的位置处包含氨基酸置换。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中在与SEQ ID NO:58的氨基酸37相对应的位置处的苏氨酸已经被赖氨酸置换。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中在与SEQ ID NO:58的氨基酸36相对应的位置处的亮氨酸已经被苏氨酸置换，并且在与SEQ ID NO:58的氨基酸37相对应的位置处的苏氨酸已经被赖氨酸置换。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中所述化合物选自由以下各物组成的群组：聚酮(例如苦霉素(pikromycin)、红霉素A(erythromycin A)、克拉霉素(clarithromycin)、阿奇霉素(azithromycin)、阿维菌素(Avermectin)、伊佛霉素(ivermectin)、赐诺杀(spinosad)、格尔德霉素(geldanamycin)、麦可贝辛(macbecin)、利福霉素(rifamycin)、两性霉素(amphotericin)、制霉素(nystatin)、匹马霉素(pimaricin)、莫能菌素(monensin)、多西环素(doxycycline)、布拉他辛(bullatacin)、多鳞番荔枝辛(squamocin)、莫维扎因(molvizarin)、乌瓦辛(uvaricin)、番荔枝辛(annonacin)、他克莫司(tacrolimus)、西罗莫司(sirolimus)、根赤壳菌素(radicicol)、洛伐他汀(lovastatin)、迪斯德莫来(discodermolide)、黄霉毒素(aflatoxin)、松萝酸(usnic acid)和安曲霉素(anthramycin))；儿茶素(例如表儿茶素(epicatechin)、表没食子儿茶素(epigallocatechin)、表儿茶素没食子酸酯(epicatechin gallate)、表没食子儿茶素没食子酸酯(epigallocatechin gallate)、表枇杷素(epiafzelechin)、非瑟酮醇(fisetinidol)、古柏醇(guibourtinidol)、美奎醇(mesquitol)和刺槐亭醇(robinetinidol))；萜类(例如异戊烯醇(prenol)、异戊酸(isovaleric acid)、香草醇(geraniol)、松油醇(terpineol)、柠檬烯(limonene)、月桂烯(myrcene)、沉香醇(linalool)、蒎烯(pinene)、蛇麻烯(humulene)、法呢烯(farnesenes)、法呢醇(farnesol)、咖啡醇(cafestol)、咖啡白醇(kahweol)、西松烯(cembrene)、紫杉烯(taxadiene)、视黄醇(retinol)、视网膜醛(retinal)、植醇(phytol)、香叶基法呢醇(geranylfarnesol)、角鲨烯(squalene)、羊毛甾醇(lanosterol)、环阿屯醇(cycloartenol)、胆固醇(cholesterol)、福卡醇(ferrugicadiol)、四异戊二烯基姜黄烯(tetraprenylcurcumene)、番茄红素(lycopene)、γ-胡萝卜素(gamma-carotene)、α-和β-胡萝卜素、3-氧代-α-紫罗兰醇、7,8-二氢紫罗兰酮、甲基环己烯-3,9-二醇和3-氧代-7,8-二氢-α-紫罗兰醇；脂肪酸(例如肉豆蔻脑酸、棕榈油酸、十六碳烯酸、油酸、反油酸、异油酸、亚油酸、反亚油酸(linoelaidicacid)、α-亚麻酸(α-linolenic acid)、花生四烯酸(arachidonic acid)、二十碳五烯酸(eicosapentaenoic acid)、芥酸(erucic acid)、二十二碳六烯酸(docosahexaenoicacid)、辛酸、癸酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸、花生酸、山嵛酸(behenic acid)、二十四烷酸(lignoceric acid)和蜡酸(cerotic acid))；氨基酸或其衍生物(例如S-腺苷甲硫氨酸、异亮氨酸、亮氨酸、缬氨酸、甲硫氨酸、苏氨酸、赖氨酸、谷氨酸、色氨酸、酪氨酸、L-赖氨酸和苯丙氨酸)；来自分支酸途径的化合物(例如吲哚、分支酸(chorismate)、莽草酸(shikimate)、水杨酸、2,3-二羟基苯甲酸、对氨基苯甲酸酯、维生素k和叶酸盐)；以及生物碱(例如麻黄素(ephedrine)、高三尖杉酯碱(homoharringtonine)、加兰他敏(galantamine)、长春蔓胺(vincamine)、奎尼丁(quinidine)、***(morphine)、白屈菜红碱(chelerythrine)、胡椒碱(piperine)、咖啡碱(caffeine)、烟碱(nicotine)、可可豆碱(theobromine)和奎宁(quinine))。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，其中所述化合物选自表2。

在一些实施例中，本公开教示了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中相对于缺乏经修饰的GAPDH的对应宿主细胞，所述宿主细胞提高使用NADPH产生的化合物的产生。

在一些实施例中，本公开教示了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中经修饰的GAPDH相对于天然存在的GAPDH具有增加的针对NADP的特异性。

在一些实施例中，本公开教示了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中经修饰的GAPDH包含与SEQ ID NO:58的氨基酸序列至少95％相同的氨基酸序列。

在一些实施例中，本公开教示了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中所述经修饰的GAPDH包含与SEQ ID NO:58至少70％相同的氨基酸序列并且其中所述经修饰的GAPDH包含在SEQ ID NO:58的位置36、37或两个位置处的氨基酸的取代。

在一些实施例中，本公开教示了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中所述化合物选自由以下各物组成的群组：聚酮(例如苦霉素、红霉素A、克拉霉素、阿奇霉素、阿维菌素、伊佛霉素、赐诺杀、格尔德霉素、麦可贝辛、利福霉素、两性霉素、制霉素、匹马霉素、莫能菌素、多西环素、布拉他辛、多鳞番荔枝辛、莫维扎因、乌瓦辛、番荔枝辛、他克莫司、西罗莫司、根赤壳菌素、洛伐他汀、迪斯德莫来、黄霉毒素、松萝酸和安曲霉素)；儿茶素(例如表儿茶素、表没食子儿茶素、表儿茶素没食子酸酯、表没食子儿茶素没食子酸酯、表枇杷素、非瑟酮醇、古柏醇、美奎醇和刺槐亭醇)；萜类(例如异戊烯醇、异戊酸、香草醇、松油醇、柠檬烯、月桂烯、沉香醇、蒎烯、蛇麻烯、法呢烯、法呢醇、咖啡醇、咖啡白醇、西松烯、紫杉烯、视黄醇、视网膜醛、植醇、香叶基法呢醇、角鲨烯、羊毛甾醇、环阿屯醇、胆固醇、福卡醇、四异戊二烯基姜黄烯、番茄红素、γ-胡萝卜素、α-和β-胡萝卜素、3-氧代-α-紫罗兰醇、7,8-二氢紫罗兰酮、甲基环己烯-3,9-二醇和3-氧代-7,8-二氢-α-紫罗兰醇；脂肪酸(例如肉豆蔻脑酸、棕榈油酸、十六碳烯酸、油酸、反油酸、异油酸、亚油酸、反亚油酸、α-亚麻酸、花生四烯酸、二十碳五烯酸、芥酸、二十二碳六烯酸、辛酸、癸酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸、花生酸、山嵛酸、二十四烷酸和蜡酸)；氨基酸或其衍生物(例如S-腺苷甲硫氨酸、异亮氨酸、亮氨酸、缬氨酸、甲硫氨酸、苏氨酸、赖氨酸、谷氨酸、色氨酸、酪氨酸、L-赖氨酸和苯丙氨酸)；来自分支酸途径的化合物(例如吲哚、分支酸、莽草酸、水杨酸、2,3-二羟基苯甲酸、对氨基苯甲酸酯、维生素k和叶酸盐)；以及生物碱(例如麻黄素、高三尖杉酯碱、加兰他敏、长春蔓胺、奎尼丁、***、白屈菜红碱、胡椒碱、咖啡碱、烟碱、可可豆碱和奎宁)。

在一些实施例中，本公开教示了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中所述化合物选自表2。

在一些实施例中，本公开教示了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中所述修饰包含在与SEQ ID NO:58的氨基酸36相对应的位置处的亮氨酸被苏氨酸置换，以及在与SEQ ID NO:58的氨基酸37相对应的位置处的苏氨酸被赖氨酸置换。

在一些实施例中，本公开教示了一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中宿主细胞是谷氨酸棒状杆菌。

在一些实施例中，本公开教示了一种产生L-赖氨酸的方法，其包含培养棒状杆菌属菌株并从所培养的棒状杆菌属菌株或培养液回收L-赖氨酸，其中所述棒状杆菌属菌株表达使用NADP作为辅酶的经修饰的GAPDH，并且其中所述棒状杆菌属菌株的L-赖氨酸生产率得到提高。

在一些实施例中，本公开教示了一种加宽GAPDH的辅酶特异性的方法，其包含：对所述GAPDH进行修饰，使得经修饰的GAPDH具有针对辅酶NADP和NAD的双特异性。

在一些实施例中，本公开教示了一种加宽GAPDH的辅酶特异性的方法，其包含：对所述GAPDH进行修饰，使得经修饰的GAPDH具有针对辅酶NADP和NAD的双特异性，其中经修饰的GAPDH对辅酶NADP的特异性相对于NAD增加。

在一些实施例中，本公开教示了一种加宽GAPDH的辅酶特异性的方法，其包含：对所述GAPDH进行修饰，使得经修饰的GAPDH具有针对辅酶NADP和NAD的双特异性，其中相比于NAD，所述经修饰的GAPDH更有效地使用NADP。

在一些实施例中，本公开教示了一种提高宿主细胞产生使用NADPH产生的化合物的效率的方法，其包含：在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性，其中所述化合物选自以下各物：聚酮(例如苦霉素、红霉素A、克拉霉素、阿奇霉素、阿维菌素、伊佛霉素、赐诺杀、格尔德霉素、麦可贝辛、利福霉素、两性霉素、制霉素、匹马霉素、莫能菌素、多西环素、布拉他辛、多鳞番荔枝辛、莫维扎因、乌瓦辛、番荔枝辛、他克莫司、西罗莫司、根赤壳菌素、洛伐他汀、迪斯德莫来、黄霉毒素、松萝酸和安曲霉素)；儿茶素(例如表儿茶素、表没食子儿茶素、表儿茶素没食子酸酯、表没食子儿茶素没食子酸酯、表枇杷素、非瑟酮醇、古柏醇、美奎醇和刺槐亭醇)；萜类(例如异戊烯醇、异戊酸、香草醇、松油醇、柠檬烯、月桂烯、沉香醇、蒎烯、蛇麻烯、法呢烯、法呢醇、咖啡醇、咖啡白醇、西松烯、紫杉烯、视黄醇、视网膜醛、植醇、香叶基法呢醇、角鲨烯、羊毛甾醇、环阿屯醇、胆固醇、福卡醇、四异戊二烯基姜黄烯、番茄红素、γ-胡萝卜素、α-和β-胡萝卜素、3-氧代-α-紫罗兰醇、7,8-二氢紫罗兰酮、甲基环己烯-3,9-二醇和3-氧代-7,8-二氢-α-紫罗兰醇；脂肪酸(例如肉豆蔻脑酸、棕榈油酸、十六碳烯酸、油酸、反油酸、异油酸、亚油酸、反亚油酸、α-亚麻酸、花生四烯酸、二十碳五烯酸、芥酸、二十二碳六烯酸、辛酸、癸酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸、花生酸、山嵛酸、二十四烷酸和蜡酸)；氨基酸或其衍生物(例如S-腺苷甲硫氨酸、异亮氨酸、亮氨酸、缬氨酸、甲硫氨酸、苏氨酸、赖氨酸、谷氨酸、色氨酸、酪氨酸、L-赖氨酸和苯丙氨酸)；来自分支酸途径的化合物(例如吲哚、分支酸、莽草酸、水杨酸、2,3-二羟基苯甲酸、对氨基苯甲酸酯、维生素k和叶酸盐)；以及生物碱(例如麻黄素、高三尖杉酯碱、加兰他敏、长春蔓胺、奎尼丁、***、白屈菜红碱、胡椒碱、咖啡碱、烟碱、可可豆碱和奎宁)。

在一些实施例中，本公开教示了一种宿主细胞，其包含：一或多种酶gdh、asd、dapB和ddh的变体，其中所述变体展现针对辅酶NADH和NADPH的双特异性。

在一些实施例中，本公开教示了一种提高宿主细胞的L-赖氨酸产生效率的方法，其包含在所述宿主细胞中表达新颖烟酰胺核苷酸转氢酶。

在一些实施例中，本公开教示了一种提高宿主细胞的L-赖氨酸产生效率的方法，其包含以下中的两个或更多个：(1)对内源性GAPDH进行修饰，使得经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性；(2)在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性；以及(3)在所述宿主细胞中表达新颖烟酰胺核苷酸转氢酶。

在一些实施例中，本公开教示了一种通过以下来增加L-赖氨酸、L-苏氨酸、L-异亮氨酸、L-甲硫氨酸或L-甘氨酸产生的方法：(1)通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化；(2)在宿主细胞中表达由NADH产生NADPH的转氢酶；(3)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh、asd、dapB和ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程；(4)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和asd酶的同源物，将用于苏氨酸合成的thrABC-途径重编程；(5)通过表达减少或逆转苏氨酸降解成甘氨酸的内源性L-苏氨酸醛缩酶(lTA)的同源物，将苏氨酸合成重编程；以及(6)表达异源丙酮酸羧化酶(pyc)或其同源物以增加草酰乙酸的合成，或增加内源性pyc的表达。

附图说明

图1示出细菌赖氨酸生物合成途径，并概述在本申请中用以提高L-赖氨酸在细菌中的产率和生产率的策略。宿主细胞产生L-赖氨酸的效率可以通过以下中的一或多个来提高：(1)对内源性GAPDH进行修饰，使得经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性，从而产生NADPH；(2)在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性，从而减少对NADPH的利用；以及(3)在所述宿主细胞中表达新颖烟酰胺核苷酸转氢酶，从而由NADH产生NADPH。

图2展示如实例1中所述，表达经修饰甘油醛-3-磷酸脱氢酶(GAPDH)的谷氨酸棒状杆菌菌株中的L-赖氨酸生产率。产生几个谷氨酸棒状杆菌菌株，每一个表达具有以下突变中的一或多个突变的gapA酶：D35G、L36T、T37K和P192S。随后与具有原生gapA的亲代菌株相比，测试菌株产生L-赖氨酸的能力。具有赋予针对NADP的改变的辅酶特异性的某些突变的GAPDH的引入显著提高L-赖氨酸的生产率。单独T37K和T37K与L36T显著增加2个背景中的生产率。菌株7000182994和7000184348各自含有T37K，并且性能比其相应的亲代亲代_1和亲代_2更佳。菌株7000182999和7000184352各自含有T37K和L36T，并且性能比其相应的亲代亲代_1和亲代_2更佳。

图3示出通过表达相比于NADPH更有效地使用NADH的变异gdh、asd、dapB和ddh酶，将谷氨酸棒状杆菌中用于赖氨酸合成的DAP-途径重编程的策略。谷氨酸棒状杆菌酶gdh和dapB分别在共生梭菌(Clostridium symbiosum)和大肠杆菌(Escherichia coli)中具有已知的同源物，相比于NADPH，这些同源物更有效地使用NADH。在宿主细胞中进行全基因组同源性搜索，以发现谷氨酸棒状杆菌adh和ddh的变体。对于每种酶，同源性搜索得到9种变体。对谷氨酸棒状杆菌gdh和dapB的已知同源物以及谷氨酸棒状杆菌asd和ddh的9种变体进行密码子优化并克隆至质粒中以在谷氨酸棒状杆菌中表达。

图4示出用于在谷氨酸棒状杆菌中表达变异gdh、asd、dapB和ddh酶的多种组合的策略。gdh、asd、dapB和ddh酶的每个不同型式的一个拷贝以多种组合克隆至含有抗卡那霉素标记基因的质粒中。随后将每个质粒引入谷氨酸棒状杆菌中，并通过标准同源重组技术将酶基因整合至谷氨酸棒状杆菌染色体中。通过在含有卡那霉素的培养基上培养来选择成功地将酶基因整合于基因组中的克隆。所有四种酶在谷氨酸棒状杆菌中同时表达。

图5A-B展示谷氨酸棒状杆菌中gdh、asd、dapB和ddh酶的不同型式的多种组合的表达的作用。图5A展示两个谷氨酸棒状杆菌重组菌株7000186960和7000186992的数据，每个菌株含有ddh的原生酶以及gdh、asd和dapB的相同3种异源酶(使用NADH的gdh和dapB的已知型式以及来自敏捷乳杆菌(Lactobacillus agilis)的asd的变体)，显示与相应的亲代亲代_3和亲代_4相比，显著提高L-赖氨酸的生产率。7000186960和7000186992各自含有gdh、asd和dapB的相同3种异源酶以及ddh的原生酶。图5B展示在3个测试背景中的2个中gdh和dapB的异源酶也略微增加产率。

图6描绘本公开的转化质粒的装配以及其整合至宿主生物体中。***DNA是通过在装配反应中合并一或多个合成寡核苷酸来产生。含有所期望序列的DNA***序列侧接与基因组的目标区域同源的DNA区域。这些同源区域促进了基因组整合，并且一经整合，则形成直接重复区域，所述直接重复区域是为了在后续步骤中使载体骨架DNA环出而设计。所装配的质粒含有***DNA且任选地含有一或多个选择标记。

图7描绘用于DNA的所选区域从宿主菌株环出的程序。所***DNA和宿主基因组的直接重复区域可以在重组事件中“环出”。选择标记反向选择的细胞含有直接重复区域所侧接的环DNA的缺失。

图8A-B展示用于在大肠杆菌K-12、W3110中使用thrLABC调控子(图8A)或thrABC操纵子(图8B)进行大肠杆菌W3110苏氨酸基础菌株构建的步骤一的质粒设计。

图9示出赖氨酸和苏氨酸的细菌生物合成途径，并概述在本申请中用以提高L-赖氨酸或L-苏氨酸在细菌中的产率和生产率的策略。(1)通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化，从而产生NADPH。(2)在宿主细胞中表达由NADH产生NADPH的转氢酶，从而产生NADPH。(3)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh、asd、dapB和ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程，从而减少NADPH的利用。(4)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和asd酶的同源物，将用于苏氨酸合成的thrABC-途径重编程，从而减少NADPH的利用。(5)通过表达减少或逆转苏氨酸降解成甘氨酸的内源性L-苏氨酸醛缩酶(ltA)的同源物，将苏氨酸合成重编程，从而增加每单位消耗的NADPH的苏氨酸产生。(6)表达异源丙酮酸羧化酶(pyc)或其同源物以增加草酰乙酸的合成，或增加内源性pyc的表达。

图10A-C描绘苏氨酸生物合成的代谢通路图，其展示出通过表达异源苏氨酸醛缩酶文库(TA_lib)实现的可能情形。图10A描绘苏氨酸生物合成的代谢通路图，其展示出原生大肠杆菌ltaE所偏爱的反应(苏氨酸转变成乙醛和甘氨酸)。图10B描绘展示改善情形的部分途径，其中在表达异源TA酶下苏氨酸与乙醛和甘氨酸之间的转变更加平衡。图10C描绘展示出优选情形的部分途径，其中乙醛和甘氨酸转变成苏氨酸是在表达异源TA酶下所偏爱的方向。

图11A-C展示当表达也在棒状杆菌中测试的原生gapA、gsd、asd、ltaE或变体的个别基因或组合时由大肠杆菌thrABC背景菌株(W3110 pMB085thrABCΔtdh；thrABC)产生的L-苏氨酸的效价(mg/L)。还展示野生型大肠杆菌K12 W3110、缺失tdh的W3110(tdh_del)和W3110 pMB085thrLABCΔtdh(thrLABC)菌株的效价，用于比较。图11A展示gapA的结果。测试的三个gapA变体(gapAv5、gapAv7和gapAv8)都产生相对于对照显著更高的L-苏氨酸效价，对照包括表达大肠杆菌gapA的额外拷贝的菌株(Ec_gapA)。图11B展示asd的结果。敏捷乳杆菌asd产生显著高于表达大肠杆菌asd的第二拷贝的相同基础菌株的效价。图11C展示gdh的结果。在此情况下，梭菌属gdh(Csy_gdh)与表达大肠杆菌gdh的第二拷贝的相同基础菌株未显著不同，但两个菌株性能比亲代菌株(thrABC)更佳。

图12展示用于构建用于表达asd、gdh和ltaE文库变体的质粒的调控元件(pMB038启动子(SEQ ID NO:237)和thrL终止子(SEQ ID NO:238)和骨架(p15A)(SEQ ID NO:239)的设计。

图13展示与野生型大肠杆菌K12 W3110和经p15A空白载体(不具有在pMB038启动子(SEQ ID NO:237)与终止子(SEQ ID NO:238)之间克隆的文库变体的环化p15A质粒(SEQID NO:239)；对照质粒)转化的亲代对照菌株-苏氨酸基础菌株THR02(W3110pMB085thrABCΔtdh)相比提高的L-苏氨酸效价(mg/L)。表达asd_13(SEQ ID NO:108)和asd_18(SEQ IDNO:118)的菌株具有提高的力价，但未与对照菌株无显著不同。通过学生T比较方式所测定，七种gdh变体：gdh_1(SEQ ID NO:136)、gdh_8(SEQ ID NO:150)、gdh_14(SEQ ID NO:162)、gdh_16(SEQ ID NO:166)、gdh_18(SEQ ID NO:170)、gdh_20(SEQ ID NO:174)和gdh_22(SEQID NO:178)都产生显著更高的L-苏氨酸效价。灰色圆圈和标记表明性能显著优于对照菌株的样品。

图14展示与野生型大肠杆菌K12 W3110和经p15A空白载体(不具有在pMB038启动子(SEQ ID NO:237)与终止子(SEQ ID NO:238)之间克隆的文库变体的环化p15A质粒(SEQID NO:239)；对照质粒)转化的亲代对照菌株-苏氨酸基础菌株THR02(W3110pMB085thrABCΔtdh)相比由表达苏氨酸醛缩酶(ltaE)文库变体的菌株产生的提高的L-苏氨酸效价(mg/L)。通过学生T比较方式所测定，ltaE_6(SEQ ID NO:196)、ltaE_11(SEQ ID NO:206)、ltaE_18(SEQ ID NO:220)、ltaE_20(SEQ ID NO:224)、lta_24(SEQ ID NO:232)都产生显著更高的L-苏氨酸效价。灰色圆圈和标记表明性能显著优于对照菌株的样品。

图15展示由表达在个别地表达时各自提高效价的Csy_gdh、gapAv5或gapAv7与单一asd、gdh或ltaE文库变体的组合的菌株产生的提高的苏氨酸效价。除W3110外，所示的所有菌株都在pMB085-thrABC tdh缺失背景中。对于这些实验来说，大部分相关对照是经空白p15A对照质粒(7000349886、7000349887和7000349885；分别Csy_gdh+p15A(-)、gapAv5+p15A(-)和gapAv7+p15A(-))转化的亲代菌株(Csy_gdh、gapAv5和gapAv7)。

图16描绘用于由表达来自NNK文库的外源性gapA等位基因的谷氨酸棒状杆菌产生赖氨酸的两个平板模型中的文库性能。绘制每个模型中的平均性能。大部分整合体(灰色圆圈)性能等于或比亲代(黑色菱形)更差。某些gapA等位基因在两个平板模型中产生高效价赖氨酸(黑色圆圈)。

具体实施方式

定义

尽管相信所属领域的技术人员非常了解以下术语，但仍阐述以下定义以促进对所公开的主题的解释。

术语“一(a/an)”是指所述实体中的一个或多个，即可指多个指示物。因而，术语“一”、“一或多种”和“至少一种”在本文中可互换地使用。此外，通过不定冠词“一”提及“一个元件”并不排除存在超过一个元件的可能性，除非上下文明确要求存在一个并且仅存在一个元件。

除非上下文另有要求，否则本说明书和权利要求书通篇中，词语“包含(comprise)”和其变体，如“包含(comprises)”和“包含(comprising)”，应解释为开放性、包涵性含义，即“包括(但不限于)”。

本说明书通篇对“一个实施例”或“一实施例”的提及意味着结合所述实施例描述的具体特征、结构或特性可以包括在本公开的至少一个实施例中。因此，本说明书通篇中多个位置处出现短语“在一个实施例中”或“在一实施例中”未必都是指同一个实施例。应了解，出于清楚的目的在分开的实施例的上下文中描述的本公开的某些特征还可以按组合形式提供于单个实施例中。相反，为简洁起见而在单个实施例的上下文中描述的本公开的各种特征也可以分开或以任何合适的子组合形式提供。

如本文所用，术语“细胞生物体”、“微生物体”或“微生物”应该在宽泛的意义上理解。这些术语可互换地使用并且包括(但可以不限于)两种原核生物域：细菌和古细菌，以及某些真核生物真菌和原生生物。在一些实施例中，本公开提及本公开中所存在的清单/表格和图式的“微生物”或“细胞生物体”或“微生物”。这种表征不仅可以指所述表格和图式的已鉴别类属，而且指已鉴别的分类种，以及所述表格或图式中的各种新颖和最新鉴别或设计的任何生物体株系。对于这些术语在本说明书的其它部分(如实例)中的叙述来说，相同表征同样适用。

术语“原核生物”是所属领域内所公认的并且是指不含细胞核或其它细胞器的细胞。原核生物通常分类至两个域之一：细菌和古细菌。古细菌和细菌域生物体之间的决定性差异是基于16S核糖体RNA中的核苷酸碱基序列的基本差异。

术语“古细菌”是指疵壁菌门(Mendosicutes)的生物体类别，典型地在异常环境中发现其并且根据若干个准则而与原核生物的其余部分区分开来，所述若干个准则包括核糖体蛋白的数目和细胞壁中的胞壁酸的缺乏。基于ssrRNA分析，古细菌由系统发生学截然不同的两个群组组成：嗜泉古菌界(Crenarchaeota)和广古生菌界(Euryarchaeota)。古细菌基于其生理学可以组织成三种类型：产甲烷菌(产生甲烷的原核生物)；极端嗜盐菌(extreme halophiles)(在极高浓度的盐(NaCl)存在下活着的原核生物)；和极端(超)嗜热菌(extreme(hyper)thermophilus)(在极高温度下活着的原核生物)。除有别于细菌的统一古细菌特点(即，细胞壁中没有胞壁质、酯连型膜脂等)之外，这些原核生物还展现了使其适应其具体栖息地的独特结构或生物化学属性。嗜泉古菌界主要由极端嗜热性硫依赖性原核生物组成并且广古生菌界含有产甲烷菌和极端嗜盐菌。

“细菌”或“真细菌”是指原核生物体域。细菌包括如下至少11个不同群组：(1)革兰氏阳性(革兰+)细菌，其存在两大亚门：(1)高G+C群组(放线菌属(Actinomycetes)、分枝杆菌属(Mycobacteria)、微球菌属(Micrococcus)等)，(2)低G+C群组(芽孢杆菌属(Bacillus)、梭菌属(Clostridia)、乳杆菌属(Lactobacillus)、葡萄球菌属(Staphylococci)、链球菌属(Streptococci)、霉浆菌属(Mycoplasmas))；(2)变形菌门(Proteobacteria)，例如紫色光合成+非光合成革兰氏阴性细菌(包括最“常见”的革兰氏阴性细菌)；(3)蓝细菌(Cyanobacteria)，例如有氧光养生物；(4)螺旋菌(Spirochetes)和相关物种；(5)浮霉状菌属(Planctomyces)；(6)拟杆菌属(Bacteroides)、黄杆菌(Flavobacteria)；(7)衣原体属(Chlamydia)；(8)绿色硫细菌；(9)绿色非硫细菌(也是无氧光养生物)；(10)耐放射性微球菌和相关物种；(11)栖热孢菌属(Thermotoga)和嗜热性热袍菌(Thermosipho thermophiles)。

“真核生物”是细胞含有细胞核和封闭于膜内的其它细胞器的任何生物体。真核生物属于真核或真核生物分类群。将真核细胞与原核细胞(前述细菌和古细菌)区分开来的决定性特征是其具有膜结合的细胞器，尤其是含有遗传物质且被核被膜封闭的细胞核。

术语“经过基因修饰的宿主细胞”、“经过基因修饰的微生物”、“重组微生物”、“重组宿主细胞”和“重组菌株”在本文中可互换使用，并且可以指已经进行基因修饰的微生物。因此，所述术语包括如下微生物(例如细菌、酵母细胞、真菌细胞等)，其与所源自的天然存在的微生物相比，已经进行基因改变、修饰或工程化，以便其展现改变、修饰或不同的基因型和/或表型(例如当基因修饰影响微生物的编码核酸序列时)。应了解，所述术语不仅指所讨论的具体重组微生物，而且还指此类微生物的后代或可能的后代。

术语“野生型微生物”可以描述天然存在的细胞，即尚未经过基因修饰的细胞。

术语“基因工程化”可以指对微生物基因组的任何操控(例如通过核酸***或缺失)。

术语“对照”或“对照宿主细胞”是指用于测定基因修饰或实验处理的影响的适当的比较宿主细胞。在一些实施例中，对照宿主细胞是野生型细胞。在其它实施例中，对照宿主细胞在基因上除了基因修饰之外与进行基因修饰的宿主细胞相同，从而有别于处理宿主细胞。在一些实施例中，本公开教示了亲代菌株作为对照宿主细胞(例如用作菌株改良程序基础的S₁菌株)的用途。

如本文所用，术语“等位基因”意指基因的一或多种替代形式中的任一种，所有等位基因都涉及至少一种性状或特征。在二倍体细胞中，既定基因的两个等位基因占据一对同源染色体上的相应基因座。在实施例中，因为本公开涉及QTL，即可以包含一或多个基因或调控序列的基因组区域，所以在一些情况下，称为“单倍型”(即染色体区段的等位基因)比“等位基因”更准确，然而，在那些情况下，术语“等位基因”应理解为包含术语“单倍型”。

如本文所用，术语“基因座(locus)”(基因座(loci)的复数形式)意指染色体上发现例如基因或遗传标记的特定位置或位点。

如本文所用，术语“基因连锁”是指在育种期间，两种或更多种特性以高比率共同遗传，使得其难以通过杂交来分离。

如本文所用，“重组”或“重组事件”是指染色体交换或独立分类。术语“重组”是指具有作为重组事件的结果产生的新基因组成的生物体。

如本文所用，术语“表型”是指由个体的基因组成(即基因型)与环境之间的相互相用产生的个别细胞、细胞培养物、生物体或生物体群组的可观察特征。

如本文所用，术语“嵌合”或“重组”当描述核酸序列或蛋白质序列时，是指使至少两个异源多核苷酸或两个异源多肽连接成单一大分子或使至少一种天然核酸或蛋白质序列的一或多个元件重排的核酸或蛋白质序列。举例来说，术语“重组”可以指序列中两个以其它方式分离的区段例如通过化学合成或通过基因工程技术操控核酸中的分离区段进行的人造组合。

如本文所用，“合成核苷酸序列”或“合成多核苷酸序列”可以是不知在自然界中存在或天然不存在的核苷酸序列。通常，当与任何其它天然存在的核苷酸序列相比时，这类合成核苷酸序列将包含至少一种核苷酸差异。

如本文所用，术语“核酸”是指具有任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式，或其类似物。这一术语是指分子的主要结构，并且因此包括双链和单链DNA，以及双链和单链RNA。其还包括经修饰的核酸，如甲基化和/或封端核酸、含有经修饰碱基、骨架修饰等的核酸。术语“核酸”与“核苷酸序列”可互换使用。

如本文所用，术语“基因”是指与生物功能相关的任何DNA区段。因此，基因包括(但不限于)编码序列和/或其表达所需的调控序列。基因还可以包括例如形成其它蛋白质的识别序列的未表达的DNA区段。基因可以从多种来源获得，包括从所关注的来源克隆或利用已知或预测的序列信息合成，并且可以包括被设计成具有所期望参数的序列。

如本文所用，术语“同源”或“同源物”或“直系同源物”是所属领域中已知的并且是指具有共同祖先或家族成员并且基于序列一致性程度而确定的相关序列。术语“同源性”、“同源”、“基本上相似”以及“基本上对应”在本文中可互换使用。其可以指一或多个核苷酸碱基中的变化不影响核酸片段介导基因表达或产生某一表现型的能力的核酸片段。这些术语还可以指本公开的核酸片段的修饰，例如相对于初始的未经修饰的片段，基本上不改变所得核酸片段的功能特性的一或多个核苷酸的缺失或***。因此，应了解，如所属领域的技术人员将了解，本公开可以涵盖超过特定例示性序列。这些术语可以描述一种物种、亚种、品种、栽培品种或品系中所发现的基因与另一种物种、亚种、品种、栽培品种或品系中的相应或同等基因之间的关系。出于本公开的目的，可以对同源序列进行比较。认为、相信或已知“同源序列”或“同源物”或“直系同源物”在功能上是相关的。功能关系可以用多种方式中的任一种表示，包括(但不限于)：(a)序列同一性程度和/或(b)相同或相似的生物功能。优选地，指示(a)与(b)。可以使用所属领域中容易获得的软件程序确定同源性，如《现代分子生物学实验技术(Current Protocols in Molecular Biology)》(奥斯贝(F.M.Ausubel)等人编，1987)副刊30，章节7.718，表6.71中所论述的那些软件程序。一些比对程序是MacVector(英国牛津的牛津分子有限公司(Oxford Molecular Ltd,Oxford,U.K.))、ALIGNPlus(宾夕法尼亚州的科学和教育软件(Scientific and Educational Software,Pennsylvania))以及AlignX(Vector NTI，加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen,Carlsbad,CA))。另一种比对程序是Sequencher(Gene Codes，密歇根安娜堡(Ann Arbor,Michigan))，其使用默认参数。

如本文所用，术语“变异酶”或“变体”是指一种酶，其与表达变体的生物体中的原生酶相比，具有不同的氨基酸序列，但催化反应的能力与原生酶的催化能力相同或相似。

如本文所用，术语“内源性”或“内源基因”是指在宿主细胞基因组内天然地发现此基因的位置处天然存在的基因。在本公开的上下文中，异源启动子可操作地连接到内源基因意指通过遗传方式将异源启动子序列***现有基因之前，在此基因天然存在的位置处。如本文所述的内源基因可以包括天然存在的基因的等位基因，所述等位基因已经根据本公开的任何方法发生突变。

如本文所用，术语“外源”与术语“异源”可互换地使用并且是指来自不同于天然来源的一些来源的物质。举例来说，术语“外源蛋白质”或“外源基因”是指来自非天然来源或位置并且已经通过人工方式提供至生物系统中的蛋白质或基因。

如本文所用，术语“核苷酸变化”可以指例如核苷酸取代、缺失和/或***，如在所属领域中所充分了解。举例来说，突变含有可产生沉默取代、添加或缺失，但不改变所编码的蛋白质的特性或活性或蛋白质制备方式的变化。

如本文所用，术语“蛋白质修饰”可以指例如氨基酸取代、氨基酸修饰、缺失和/或***，如所属领域中所充分了解。

如本文所用，术语核酸或多肽的“至少一部分”或“片段”可以意指具有这类序列的最小尺寸特征的部分，或全长分子的任何更大的片段，最多是并且包括全长分子。本公开的多核苷酸片段可以编码基因调控元件的生物活性部分。基因调控元件的生物活性部分可以通过分离本公开的一种多核苷酸中包含基因调控元件的部分并且如本文中所描述评估活性来制备。类似地，多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等，最多是全长多肽。待使用的所述部分的长度将取决于具体应用。适用作杂交探针的核酸部分可短至12个核苷酸；在一些实施例中，其是20个核苷酸。适用作表位的多肽部分可以短至4个氨基酸。发挥全长多肽功能的多肽部分通常将长于4个氨基酸。

变异多核苷酸还涵盖可以来源于诱变和诱重组程序(如DNA改组)的序列。这类DNA改组的策略在所属领域中已知。参见例如施特默尔(Stemmer)(1994)《美国国家科学院院刊(PNAS)》91:10747-10751；施特默尔(1994)《自然(Nature)》370:389-391；凯默瑞(Crameri)等人(1997)《自然生物技术(Nature Biotech.)》15:436-438；穆尔(Moore)等人(1997)《分子生物学杂志(J.Mol.Biol.)》272:336-347；张(Zhang)等人(1997)《美国国家科学院院刊》94:4504-4509；凯默瑞等人(1998)《自然》391:288-291；以及美国专利第5,605,793号和第5,837,458号。

对于本文所公开的多核苷酸的PCR扩增，可以设计用于PCR反应中的寡核苷酸引物以由从所关注的任何生物体提取的cDNA或基因组DNA扩增相应的DNA序列。用于设计PCR引物和PCR克隆的方法在所属领域中通常已知并且公开于萨布鲁克(Sambrook)等人(2001)，《分子克隆：实验指南(Molecular Cloning:A Laboratory Manual)》(第3版，冷泉港实验室出版社(Cold Spring Harbor Laboratory Press)，纽约普莱恩维尤(Plainview,NewYork))。还参见英尼斯(Innis)等人编(1990)《PCR方案：方法和应用指导(PCR Protocols:AGuide to Methods and Applications)》(学术出版社(Academic Press),纽约(NewYork))；英尼斯和吉尔凡(Gelfand)编(1995)《PCR策略(PCR Strategies)》(学术出版社,纽约)；以及英尼斯和吉尔凡编(1999)《PCR方法手册(PCR Methods Manual)》(学术出版社,纽约)。已知的PCR方法可以包括(但不限于)使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分不匹配引物等的方法。

如本文所用，术语“引物”可以指当放置在诱导引物延伸产物合成的条件下时，即在核苷酸和聚合剂(如DNA聚合酶)存在下以及在适合温度和pH下，能够与扩增目标粘接，从而允许DNA聚合酶附著，借此充当DNA合成的起始点的寡核苷酸。(扩增)引物优选单链以获得最大的扩增效率。引物优选是寡脱氧核糖核苷酸。引物必须足够长以在聚合剂存在下引发延伸产物的合成。引物的精确长度将取决于多种因素，包括引物的温度和组成(A/T对比G/C含量)。一对双向引子由一个正向引物和一个反向引物组成，如在DNA扩增(如PCR扩增)领域中通常使用。

如本文所用，“启动子”或“启动子多核苷酸”可以指能够控制编码序列或功能性RNA的表达的DNA序列。启动子序列由邻近的和更远侧的上游元件组成，后面元件通常可以称为强化子。因此，“强化子”可以是会刺激启动子活性的DNA序列，并且可以是启动子的固有元件或被***以增强启动子的水平或组织特异性的异源元件。启动子可完全来源于原生基因，或由来源于自然界中所发现的不同启动子的不同元件构成，或甚至包含合成DNA区段。所属领域的技术人员应了解，不同启动子可以引导基因在不同组织或细胞类型中或处于不同发育阶段或响应不同的环境条件的表达。另外认识到，由于在大多数情况下，调控序列的确切边界尚未完全界定，因此一些变异的DNA片段可以具有相同的启动子活性。

如本文所用，短语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”以及“重组DNA构建体”在本文中可互换地使用。重组构建体包含核酸片段的人工组合，例如自然界中未一同发现的调控和编码序列。举例来说，嵌合构建体可以包含来源于不同来源的调控序列和编码序列，或来源于同一来源但以与在自然界中发现的方式不同的方式排列的调控序列和编码序列。在一些情况下，嵌合构建体可以是包含多个调控(例如启动子)和编码序列(例如gapA/转氢酶/gdh、asd、dapB和/或ddh基因)的重组构建体。包含多个编码序列的嵌合构建体中的每个编码序列可以受独立调控序列控制或功能性地连接到独立调控序列。本文所述的这类构筑体可以单独使用或可以与载体结合使用。如所属领域的技术人员众所周知，如果使用载体，那么载体的选择可能取决于用于使宿主细胞转化的方法。举例来说，可以使用质粒载体。所属领域的技术人员深知，为了成功地转化、选择和繁殖包含本公开的任一个分离的核酸片段的宿主细胞，基因元件必须存在于载体上。所属领域的技术人员还将认识到，不同的独立转化事件将引起不同的表达水平和模式(琼斯(Jones)等人，(1985)，《欧洲分子生物学杂志(EMBO J)》4:2411-2418；德阿尔梅达(De Almeida)等人，(1989)，《分子基因遗传学(Mol.Gen.Genetics)》218:78-86)，因此必须对多个事件进行筛选以便获得呈现所期望表达水平和模式的株系。这类筛选尤其可以通过DNA的南方印迹分析(Southernanalysis)、mRNA表达的北方印迹分析(Northern analysis)、蛋白质表达的免疫印迹分析或表型分析来实现。载体可以是质粒、病毒、噬菌体、前病毒、噬菌粒、转座子、人工染色体等等，其自主地复制或者能整合至宿主细胞的染色体中。载体还可以是非自主复制的裸RNA多核苷酸、裸DNA多核苷酸、由相同链内的DNA和RNA组成的多核苷酸、聚赖氨酸结合的DNA或RNA、肽结合的DNA或RNA、脂质粒结合的DNA等。如本文所用，术语“表达”是指功能性最终产物，例如mRNA或蛋白质(前体或成熟物)的产生。

“可操作地连接”或“功能性地连接”在此背景下可以意指根据本公开的启动子多核苷酸与另一寡核苷酸或多核苷酸(例如gapA/转氢酶/gdh、asd、dapB和/或ddh基因)的依序排列，引起所述另一多核苷酸(例如gapA/转氢酶/gdh、asd、dapB和/或ddh基因)的转录。换句话说，“可操作地连接”或“功能性地连接”可以意指启动子控制与所述启动子相邻或处于其下游或3'的基因(例如gapA/转氢酶/gdh、asd、dapB和/或ddh基因)的转录。

如本文所用，术语“所关注产物”或“生物分子”是指由原料中的微生物产生的任何产物。在一些情况下，所关注的产物可以是小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇等。举例来说，所关注的产物或生物分子可以是任何初级或次级细胞外代谢物。初级代谢物尤其可以是乙醇、柠檬酸、乳酸、谷氨酸、谷氨酸酯、赖氨酸、苏氨酸、色氨酸和其它氨基酸、维生素、多糖等。次级代谢物尤其可以是抗生素化合物，如青霉素，或免疫抑制剂，如环孢菌素A(cyclosporin A)；植物激素，如赤霉素；他汀类药物，如洛伐他汀(lovastatin)；杀真菌剂，如灰黄霉素(griseofulvin)等。所关注的产物或生物分子也可以是微生物产生的任何细胞内组分，如：微生物酶，包括：催化酶、淀粉酶、蛋白酶、果胶酶、葡萄糖异构酶、纤维素酶、半纤维素酶、脂肪酶、乳糖酶、链激酶和其它多种。细胞内组分还可以包括重组蛋白，如：胰岛素、B型肝炎疫苗、干扰素、粒细胞群落刺激因子、链激酶等等。

术语“碳源”通常可以指适用作供细胞生长用的碳源的物质。碳源包括(但不限于)生物质水解产物、淀粉、蔗糖、纤维素、半纤维素、木糖和木质素，以及这些底物的单体组分。碳源可以包含各种形式的各种有机化合物，包括(但不限于)聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽等。这些包括例如各种单糖，如葡萄糖、右旋糖(D-葡萄糖)、麦芽糖、寡糖、多糖、饱和或不饱和脂肪酸、丁二酸酯、乳酸酯、乙酸酯、乙醇等，或其混合物。光合成生物体可以另外产生光合成产物形式的碳源。在一些实施例中，碳源可以选自生物质水解产物和葡萄糖。

术语“原料”可以定义为供应给微生物或发酵工艺，由此能够制备其它产物的原材料或原材料混合物。举例来说，碳源，如生物质或来源于生物质的碳化合物，可以是供微生物在发酵工艺中产生所关注产物(例如小分子、肽、合成化合物、燃料、乙醇等)的原料。然而，原料可以含有除碳源外的营养物。

术语“体积生产率”或“生产速率”可以定义为每单位时间每体积培养基形成的产物的量。体积生产率可以用克/升/小时(g/L/h)报告。

术语“比生产率”定义为产物的形成速率。为了描述生产率作为微生物的固有参数而非发酵工艺的固有参数，可以在本文中将生产率进一步定义为比生产率，单位为每小时每克细胞干重(CDW)的产物克数(g/g CDW/h)。对既定微生物使用CDW与OD₆₀₀的关系，比生产率还可以用每小时每升培养基每600nm培养液光学密度(OD)的产物克数(g/L/h/OD)表示。

术语“产量”可以定义为每单位重量的原材料所得的产物的量并且可以用每克底物的产物克数(g/g)表示。产量可以用理论产量的百分比表示。““理论产量”定义为如根据用于制备产物的代谢途径的化学计量学所指定，按既定量的底物计，能够产生的产物的最大量。

术语“力价”或“效价”可以定义为溶液的浓度或溶液中的物质的浓度。举例来说，所关注产物(例如小分子、肽、合成化合物、燃料、乙醇等)在发酵液中的力价可以描述为每升发酵液的溶液中的所关注产物克数(g/L)。

术语“总效价”可以定义为工艺中所产生的全部所关注产物的总和，所述所关注产物包括(但不限于)溶液中的所关注产物、气相(如果适用)中的所关注产物以及从工艺中去除并且相对于工艺中的初始体积或工艺中的操作体积所回收的任何所关注产物。

如本文所用，术语“HTP基因设计文库”或“文库”是指根据本公开的基因扰动的集合。在一些实施例中，本公开的文库可以表现为i)数据库或其它计算机文件中的序列信息的集合；ii)编码前述系列的基因元件的基因构建体的集合；或iii)包含所述基因元件的宿主细胞菌株。

产生基因多样性池供增加NADPH的基因设计和HTP微生物工程平台使用

在一些实施例中，本公开的方法的特征为基因设计。如本文所用，术语基因设计是指通过鉴别和选择具体基因的最佳变体、基因的一部分、启动子、终止密码子、5'UTR、3'UTR或其它DNA序列来重建或改变宿主生物体的基因组，以设计和产生新的优良宿主细胞。

在一些实施例中，本公开的基因设计方法中的第一步骤是获得具有多种序列变异的初始基因多样性池群体，由此群体可以重建新的宿主基因组。

利用来自现有野生型菌株的多样性池

在一些实施例中，本公开教示了用于鉴别既定野生型群体的微生物间所存在的序列多样性的方法。因此，多样性池可以是分析所用的既定数目n种野生型微生物，其中所述微生物基因组代表“多样性池”。

在一些实施例中，多样性池可以是所述野生型微生物间的天然基因变异中所存在的现有多样性的结果。这种变异可以由既定宿主细胞的菌株变体产生或可以由作为完全不同物种的微生物所产生。基因变异可以包括菌株基因序列的任何差异，不论天然存在还是不存在。在各方面，本公开利用微生物的专用文库来获得新颖苏氨酸醛缩酶。如将要看到的，本申请教示如何利用苏氨酸醛缩酶的此文库来优化此有用氨基酸的菌株产生。

利用来自现有工业菌株变体的多样性池

在本公开的其它实施例中，多样性池是在传统菌株改良过程中所产生的菌株变体(例如经由随机突变而产生并且选用于多年来提高产量的一或多种宿主生物体菌株)。因此，在一些实施例中，多样性池或宿主生物体可以包含历史性生产菌株的集合。

在具体方面，多样性池可以是原始亲代微生物菌株(S₁)，其在具体时间点具有“基线”基因序列(S₁Gen₁)；然后是任何数目个后续子代菌株(S₂、S₃、S₄、S₅等，可归纳为S_2-n)，其衍生/发展自所述S₁菌株，并且相对于S₁的基线基因组，具有不同基因组(S_2-nGen_2-n)。

通过诱变来产生多样性池

在一些实施例中，既定多样性池细胞群体中的所关注突变能够利用使菌株发生突变的任何方式(包括诱变化学品或辐射)人工产生。术语“诱变”在本文中用于指一种诱导细胞核酸材料发生一或多种基因修饰的方法。

术语“基因修饰”是指DNA的任何改变。代表性基因修饰包括核苷酸***、缺失、取代以及其组合，并且可以小至单个碱基或大至数万个碱基。因此，术语“基因修饰”涵盖核苷酸序列的倒位和其它染色体重排，借此改变构成染色体区域的DNA的位置或取向。染色体重排可以包含染色体内重排或染色体间重排。

在一个实施例中，本发明所要求的主题中所用的诱变方法基本上是随机的，以使得基因修饰能够在待诱变的核酸材料内的任何可利用核苷酸位置处发生。换句话说，在一个实施例中，诱变未显示在具体核苷酸序列处发生的偏好或频率增加。

本公开的方法可以使用任何诱变剂，包括(但不限于)：紫外光、X射线辐射、γ辐射、N-乙基-N-亚硝基脲(ENU)、甲基亚硝基脲(MNU)、丙卡巴肼(procarbazine，PRC)、三亚乙基三聚氰胺(TEM)、丙烯酰胺单体(AA)、苯丁酸氮芥(chlorambucil，CHL)、美法仑(melphalan，MLP)、环磷酰胺(cyclophosphamide，CPP)、硫酸二乙酯(DES)、甲烷磺酸乙酯(EMS)、甲烷磺酸甲酯(MMS)、6-巯基嘌呤(6-mercaptopurine，6-MP)、丝裂霉素-C(mitomycin-C，MMC)、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、³H₂O和氨基甲酸酯(UR)(参见例如林奇克(Rinchik)，1991；马克(Marker)等人，1997；和拉塞尔(Russell)，1990)。其它诱变剂已为所属领域中的技术人员所熟知，包括http://www.iephb.nw.ru/～spirov/hazard/mutagen_lst.html中所述的那些。

术语“诱变”还涵盖了用于改变(例如通过靶向突变)或调节细胞功能，借此增强诱变速率、品质或程度的方法。举例来说，可以改变或调节细胞，借此使其在DNA修复、诱变剂代谢、诱变剂敏感性、基因组稳定性或其组合方面出现功能异常或缺陷。因此，通常维持基因组稳定性的基因功能的干扰可以用于增强诱变。干扰的代表性目标包括(但不限于)DNA连接酶I(本特雷(Bentley)等人，2002)和酪蛋白激酶I(美国专利第6,060,296号)。

在一些实施例中，利用定点诱变(例如使用市购试剂盒，如Transformer定点诱变试剂盒(克隆科技公司(Clontech)进行的引物定向诱变)在整个核酸序列中产生多种变化，以便产生编码本公开的裂解酶的核酸。

暴露于一或多种诱变剂后发生基因修饰的频率可以通过改变处理剂量和/或重复次数来调节，并且可以根据具体应用来定制。

因此，在一些实施例中，如本文所用，“诱变”包含所属领域中已知的用于诱导突变的所有技术，包括易错PCR诱变、寡核苷酸定向诱变、定点诱变以及利用本文所述的任何技术进行的迭代序列重组。

增加NADPH的基因设计的概述

本公开提供了一种用于产生能够增加所关注的生物分子或产物的产生的微生物(例如细菌)的方法。一般来说，用于产生供产生如本文所提供的任何生物分子用的微生物的方法可能需要通过以下来对宿主微生物进行基因修饰：将一或多个目标基因引入所述宿主微生物中，以产生所述微生物的基因组工程化菌株；在适合于产生所关注的生物分子或产物的条件下培养所述工程化菌株；以及如果所述工程化菌株产生增加量的所关注的生物分子或产物，那么选择所述工程化菌株。所述增加量可以与宿主微生物的野生型菌株相比。增加量可以与不含目标基因文库的成员的宿主微生物菌株相比。目标基因可以在载体中包含单个目标基因，或在相同载体上包含多个目标基因。

本公开的一个实施例的一个例示性工作流程需要鉴别目标基因，获得或合成目标基因的核酸(例如DNA)以及将所述获得或合成的目标基因克隆至合适载体中。所属领域中已知和/或本文提供的任何方法可以用于将目标基因装配或克隆至合适载体中。载体可以是所属领域中已知和/或本文提供的与待利用的宿主微生物相容的任何载体。一旦装配好包含目标基因的载体，就可以将其引入宿主微生物中。载体可以使用所属领域中已知和/或本文提供的任何方法引入。宿主微生物可以是本文提供的任何宿主微生物。一旦引入宿主微生物中，就可以选择经过基因修饰的宿主并且可以评估目标基因的***。目标基因可以进行工程化以***到宿主微生物基因组的特定位置中。在一些情况下，目标基因***到促进目标基因表达但不扰乱宿主微生物内的非预期途径/过程的基因组的中性位点中。在一些情况下，目标基因置换宿主微生物内的特定基因。特定基因可以是宿主微生物中通常存在的同源目标基因。可以凭经验确定整合位点，例如中性整合位点，以便可以测试多个位点并且可以选择允许表达所整合的目标基因但不会损害宿主细胞的位点。可以通过以下来促进整合至所需位点(例如中性位点)中：将目标基因克隆至包含与所需整合位点同源的序列部分(即，同源臂)的载体中，随后在宿主细胞中进行重组事件。目标基因可以***同源序列的部分之间。在某些实施例中，载体包含约2kb的与所需整合位点同源的序列。与所需位点同源的序列可以侧接甘油醛3-磷酸脱氢酶(gapA)、谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和/或内消旋-二氨基庚二酸脱氢酶(ddh)基因***物，使得序列的第一部分处于基因***物的上游(即，5')并且序列的第二部分处于基因***物的下游(即，3')。在其它实施例中，载体包含约4kb的与所需整合位点同源的序列。在此实施例中，载体包含约2kb的与所需整合位点同源的处于gapA、gdh、asd、dapB和/或ddh基因***物上游(即，5')的序列和约2kb的与所需整合位点同源的处于gapA、gdh、asd、dapB和/或ddh基因***物下游(即，3')的序列。在一些实施例中，整合通过单一互换型整合以及随后质粒骨架的环出进行，所述环出是通过对载体骨架中存在的标记物进行反向选择来推动。在一些实施例中，目标基因是所属领域中已知和/或本文提供的任何gapA基因。在其它实施例中，目标基因是所属领域中已知和/或本文提供的任何烟酰胺核苷酸转氢酶基因。在其它实施例中，目标基因是所属领域中已知和/或本文提供的任何gdh、asd、dapB和/或ddh基因。在一些实施例中，目标基因是所属领域中已知和/或本文提供的任何gapA基因，和/或所属领域中已知和/或本文提供的任何烟酰胺核苷酸转氢酶基因，和/或所属领域中已知和/或本文提供的任何gdh、asd、dapB和ddh基因。在其它实施例中，目标基因是所属领域中已知和/或本文提供的任何thrA、thrB、thrC和/或ltaE基因。在其它实施例中，目标基因是所属领域中已知和/或本文提供的任何pyc基因。

可以使用所属领域中已知的任何方法，例如对经过基因修饰的微生物的基因组或其部分进行扩增和/或测序来评估所述***。在一些情况下，本文所提供的方法还需要通过如本文所述进行反向选择来去除选择标记或使其环出。环出可以使用本文所提供的任一方法进行。

在评估目标基因的***和任选地去除选择标记后，可以评估经过基因修饰的菌株产生所关注的生物分子或产物的能力。在评估前，任选的步骤可以为扩增菌株。扩增可能需要在平板上或多孔板中的孔中在适合于扩增的生长介质中培养经过基因修饰的菌株。评估步骤可能需要在包含被设计成模拟产生所关注的生物分子或产物的实际条件的生长介质/条件的平板上或多孔板中的孔中培养经过基因修饰的菌株。在一些情况下，此步骤中的生长介质适合于产生来源于葡萄糖代谢加工的所关注的生物分子或产物。如果如从评估步骤确定，经过基因修饰的菌株具有或预测产生所需或临限生产速率或产率的所关注的生物分子或产物，那么可以选择此菌株并且冷却存储。预测可以基于测量在培养菌株期间的多个时间点形成的所关注的产物和生物质的量，以及使用所述测量结果预测所述菌株将在扩增或更大规模条件(例如发酵条件)下如何表现。在一个实施例中，预测是基于评估方法期间菌株性能的线性回归分析。

在一些情况下，将具有或预测产生所需或临限生产速率或产率的所关注的生物分子或产物的经过基因修饰的菌株转移至较大培养物中用于产生所关注的生物分子或产物的条件(例如发酵条件)下或在其中生长。此步骤可以用以确定所选菌株是否可以如在用于产生所关注的生物分子或产物的实际条件下预测般表现。在一些情况下，本文提供的用于引入和评估来自目标基因文库(例如本文提供的目标基因文库)的每个目标基因的步骤针对来自文库的每个目标基因重复，以选择产生所需或临限产率和/或生产速率的所关注的生物分子或产物的经过基因修饰的微生物的一或多个菌株。

在一些实施例中，所关注的生物分子或产物通过微生物来源于葡萄糖和其代谢加工，使得本文所提供的方法需要产生如下微生物菌株，其可以产生增加量的来源于菌株对葡萄糖的代谢加工的所关注的生物分子或产物。在某些实施例中，本文所提供的方法需要引入一或多个与赖氨酸生物合成有关的目标基因。在其它实施例中，本文所提供的方法需要引入一或多个与宿主细胞中的NADPH产生有关的目标基因。在其它实施例中，本文所提供的方法需要引入一或多个与减少宿主细胞的NADPH利用有关的目标基因。在一些实施例中，目标基因是gapA基因，从而在本文所提供的方法中将gapA基因引入宿主微生物中。gapA基因可以是宿主微生物中的异源基因。

在其它实施例中，目标基因是烟酰胺核苷酸转氢酶基因，从而在本文所提供的方法中将烟酰胺核苷酸转氢酶基因引入宿主微生物中。

在许多生物体中，三羧酸(tricarboxylic acid，TCA)循环中间物可以直接从丙酮酸中再生。举例来说，在一些细菌中发现但在大肠杆菌中未发现的丙酮酸羧化酶(pyc)通过利用羧基生物素将丙酮酸进行羧基化来介导草酰乙酸的形成。

在其它实施例中，目标基因是丙酮酸羧化酶基因，从而在本文所提供的方法中将丙酮酸羧化酶(pyc)基因引入宿主微生物中。pyc基因可以与宿主微生物异源。在某些实施例中，pyc基因选自美国专利第6,171,833号和美国专利第6,171,833号中所公开的序列。在一个实施例中，pyc基因来源于菜豆根瘤菌(R.etli)。在一个实施例中，pyc基因来源于棒状杆菌属。在一个实施例中，目标生物体是大肠杆菌。在一个实施例中，目标生物体是棒状杆菌属。在一个实施例中，pyc的异源变体在缺乏内源性pyc的宿主细胞中表达。在一个实施例中，pyc的异源变体在具有内源性pyc的宿主细胞中表达。在一个实施例中，通过对包含pyc的基因座进行基因修饰以包括可操作地连接到pyc的强启动子来增加内源性pyc的表达。在一些实施例中，通过从启动子梯选择启动子来调节pyc的表达。在一个实施例中，通过***可操作地连接到原生pyc基因的启动子元件来原生天然PYC的表达。在一个实施例中，通过***可操作地连接到原生pyc基因的来自启动子梯的几个启动子元件中的每一个来调整原生PYC的表达。在一个实施例中，通过过表达异源pyc基因来增加PYC的表达。在一个实施例中，异源pyc基因是谷氨酸棒状杆菌pyc基因。在一个实施例中，谷氨酸棒状杆菌pyc可操作地连接到强启动子。在一个实施例中，谷氨酸棒状杆菌pyc可操作地连接到来自启动子梯的几个启动子元件中的每一个，并且通过选择启动子元件来调整PYC的表达，以产生最高量的例如苏氨酸等所需产物。

在其它实施例中，目标基因是gdh、asd、dapB或ddh基因中的一或多种，从而在本文所提供的方法中将gdh、asd、dapB或ddh基因引入宿主微生物中。gdh、asd、dapB或ddh基因中的一或多种可以是宿主微生物中的异源基因。在某些实施例中，在本文所提供的方法中将gdh、asd、dapB和ddh所有四种基因引入宿主微生物中。

在某些实施例中，在本文所提供的方法中gapA基因与烟酰胺核苷酸转氢酶基因都引入宿主微生物中。

在其它实施例中，在本文所提供的方法中gapA基因以及选自gdh、asd、dapB和ddh中的一或多种基因引入宿主微生物中。在其它实施例中，在本文所提供的方法中烟酰胺核苷酸转氢酶基因以及选自gdh、asd、dapB和ddh中的一或多种基因引入宿主微生物中。

在其它实施例中，在本文所提供的方法中gapA、烟酰胺核苷酸转氢酶基因以及选自gdh、asd、dapB和ddh中的一或多种基因同时引入宿主微生物中。

在一个实施例中，gapA基因和/或烟酰胺核苷酸转氢酶基因和/或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因引入宿主微生物中增加宿主微生物中NADPH的量。在某些方面，宿主微生物中NADPH的产生增加。在其它方面，宿主微生物中NADPH的利用减少。在某些实施例中，宿主微生物中增加量的NADPH用以增加所关注的生物分子或产物的合成。本文所提供的方法产生的所关注的生物分子或产物可以是葡萄糖产生的任何商品。在一些情况下，所关注的生物分子或产物是小分子、氨基酸、有机酸或醇。氨基酸可以是酪氨酸、苯丙氨酸、色氨酸、天冬氨酸、天冬酰胺、苏氨酸、异亮氨酸、甲硫氨酸或赖氨酸。有机酸可以是丁二酸、乳酸或丙酮酸。醇可以是乙醇或异丁醇。在特定实施例中，所关注的生物分子或产物是氨基酸。在特定方面，氨基酸是赖氨酸。在某些方面，赖氨酸是L-赖氨酸。在特定方面，氨基酸是苏氨酸。在某些方面，苏氨酸是L-苏氨酸。

在一个实施例中，宿主菌株是通过***thrLABC调控子(例如大肠杆菌K-12菌株W3110(SEQ ID NO.76)的thrLABC调控子)进行修饰的细菌菌株。在一个实施例中，宿主菌株是通过***thrABC调控子(例如通过缺失thrL前导序列而进行修饰的大肠杆菌K-12菌株W3110(SEQ ID NO:77)的thrLABC调控子)进行修饰的细菌菌株。在一个实施例中，宿主菌株是通过缺失编码L-苏氨酸3-脱氢酶(tdh)或其同源物的细菌基因组区进行修饰的细菌菌株。

利用增加NADPH的文库进行微生物基因工程化

在一个实施例中，所公开的微生物基因组工程化方法利用gapA基因和/或烟酰胺核苷酸转氢酶基因和/或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因的文库。gapA基因可基于其使用NAD作为辅因子的能力而选择。在某些实施例中，加宽gapA的辅酶特异性。因此，在一些方面，gapA具有针对NAD和NADH的双特异性。在一些方面，相比于NAD，gapA更优选地使用NADH。在其它方面，gapA对NAD和NADH同等偏好。烟酰胺核苷酸转氢酶基因可基于其将NADH转变成NADPH的能力而选择。gdh、asd、dapB或ddh可基于其使用NADPH作为辅因子的能力而选择。在某些实施例中，加宽gdh、asd、dapB和/或ddh的辅酶特异性。因此，在一些方面，gdh、asd、dapB和/或ddh具有针对NADPH和NADP的双特异性。在一些方面，相比于NADP，gdh、asd、dapB和/或ddh更优选地使用NADPH。在其它方面，gdh、asd、dapB和/或ddh对NADPH和NADP同等偏好。TA基因可基于其更缓慢地代谢苏氨酸或产生苏氨酸的能力而选择。在某些实施例中，加宽TA的底物特异性。因此，在一些方面，TA具有针对甘氨酸和丝氨酸的双特异性。在一些方面，相比于甘氨酸，TA更优选地使用丝氨酸。在其它方面，TA对丝氨酸和甘氨酸同等偏好。pyc可基于其将丙酮酸转变成草酰乙酸的能力而选择。

在一些情况下，利用gapA文库、烟酰胺核苷酸转氢酶文库、gdh、asd、dapB和/或ddh和/或TA文库和/或pyc文库或这些文库的任何组合对微生物进行工程化。在一些实施例中，文库含有多个嵌合构建体***物，使得文库中的每个***物包含gapA基因、烟酰胺核苷酸转氢酶基因和选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因。在工程化后，可以针对所得结果，例如如本文所提供的产物从葡萄糖中的产生有效地筛选或评估微生物。利用本文提供的文库界定具体基因组改变并且然后测试/筛选具有所述改变的宿主微生物基因组的此方法可以依照有效和迭代的方式进行，并且可以用于鉴别gapA和/或烟酰胺核苷酸转氢酶基因和/或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因的特定组合，所述特定组合在宿主细胞中的表达从葡萄糖产生所需或临限水平的所关注的生物分子或产物。

在某些实施例中，如本文所提供的用于本文所提供的方法的每个gapA基因或烟酰胺核苷酸转氢酶基因或选自gdh、asd、dapB和ddh的一或多种基因处于原生启动子或本文提供的任一启动子多核苷酸的控制下或功能性地连接至其。“启动子多核苷酸”或“启动子”或“具有启动子活性的多核苷酸”可以意指当功能性地连接至待转录的多核苷酸时决定编码多核苷酸(例如gapA基因或烟酰胺核苷酸转氢酶基因或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因)的转录起始点和频率，由此实现受影响的控制多核苷酸的表达强度的多核苷酸、优选脱氧核糖核苷酸，或核酸、优选脱氧核糖核酸(DNA)。在一些实施例中，包含gapA基因和/或烟酰胺核苷酸转氢酶基因和/或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因的文库中的每个gapA基因和/或烟酰胺核苷酸转氢酶基因和/或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因处于相同或同一启动子的控制下。在其它实施例中，包含葡萄糖gapA基因和/或烟酰胺核苷酸转氢酶基因和/或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因的文库中的每个gapA基因和/或烟酰胺核苷酸转氢酶基因和/或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因处于独立或不同启动子的控制下。在其它实施例中，包含目标基因的嵌合构建体的文库中的嵌合构建体中的每个目标基因处于相同或同一启动子的控制下。在另外的实施例中，包含目标基因的嵌合构建体的文库中的嵌合构建体中的每个目标基因处于独立或不同启动子的控制下。

启动子梯

在一些实施例中，本公开教示了选择具有最佳表达特性以调节宿主微生物中一或多种酶的表达并对总宿主菌株生产率产生有益作用的启动子的方法。

启动子调控基因转录速率并且可以通过多种方式影响转录。举例来说，不论内部或外部细胞条件如何，组成性启动子均引导其关联基因按恒定速率转录，而可调控启动子则取决于内部和/或外部细胞条件，例如生长速率、温度、对特定环境化学物质的响应等增加或降低基因转录的速率。启动子可以从其正常细胞情境中分离出来且进行工程化以调控几乎任何基因的表达，从而能够有效改变细胞生长、产物产量和/或所关注的其它表型。

在一些实施例中，本公开教示了用于产生启动子梯文库以供下游基因设计方法使用的方法。举例来说，在一些实施例中，本公开教示了鉴别一或多种启动子和/或在宿主细胞内产生一或多种启动子的变体的方法，所述启动子和/或变体展现了一系列表达强度或优良的调控特性。已经鉴别和/或产生的这些启动子的特定组合可以一起分组成启动子梯，下文更详细地解释此。

在一些实施例中，本公开教示了启动子梯的使用。在一些实施例中，本公开的启动子梯包含展现连续系列的表达谱的启动子。举例来说，在一些实施例中，启动子梯通过鉴别响应于刺激而展现一系列表达强度的天然、原生或野生型启动子或通过组成性表达来产生。已经鉴别的这些启动子可以一起分组成启动子梯。

在其它实施例中，本公开教示了展现跨越不同条件的一系列表达谱的启动子梯的产生。举例来说，在一些实施例中，本公开教示了具有在整个发酵的不同阶段的表达峰分布的启动子梯的产生。在其它实施例中，本公开教示了具有响应于特定刺激的不同表达峰动力学的启动子梯的产生。所属领域的技术人员将认识到，本公开的调控性启动子梯可以代表任一或多种调控概况。

在一些实施例中，本公开的启动子梯被设计成以可预测的方式跨越一系列连续响应扰动基因表达。在一些实施例中，启动子梯的连续性质赋予菌株改良程序额外的预测能力。举例来说，在一些实施例中，所选代谢途径的交换启动子或终止序列可以产生宿主细胞性能曲线，此鉴别最佳表达率或表达谱；产生如下菌株，其中靶向基因不再是具体反应或基因级联的限制因素，同时还避免了在不适当情形下发生不必要的过表达或错误表达。在一些实施例中，启动子梯通过鉴别展现所期望概况的天然、原生或野生型启动子来产生。在其它实施例中，通过使天然存在的启动子发生突变以衍生多种突变启动子序列来产生启动子梯。测试这些突变启动子中的每一种对目标基因表达的影响。在一些实施例中，测试所编辑的启动子在多种条件下的表达活性，从而记录/表征/标注每种启动子变体的活性并存储于数据库中。随后将所得到的经编辑的启动子变体组织成启动子梯，所述启动子梯基于其表达强度进行排列(例如高表达性变体靠近顶部，且减弱的表达靠近底部，因此产生术语“梯”)。

在一些实施例中，本公开教示了作为已鉴别的天然存在的启动子与突变变体启动子的组合的启动子梯。

在一些实施例中，本公开教示了鉴别符合以下两种标准的天然、原生或野生型启动子的方法:1)代表组成性启动子梯；以及2)可以由短DNA序列编码，理想地，小于100个碱基对。在一些实施例中，本公开的组成性启动子展现跨越两种所选生长条件的恒定基因表达(典型地在工业培育期间所经历的条件间进行比较)。在一些实施例中，本公开的启动子将由约60个碱基对核心启动子和长度在26个碱基对与40个碱基对之间的5'UTR组成。

在一些实施例中，选择前述已鉴别的天然存在的启动子序列中的一或多种用于基因编辑。在一些实施例中，通过上文所述的任一种突变方法编辑天然启动子。在其它实施例中，本公开的启动子通过合成具有所期望序列的新启动子变体来编辑。

以下申请的整个公开内容以引入的方式并入本文中：美国申请第15/396,230号(美国公开第US 2017/0159045 A1号)；PCT/US2016/065465(WO 2017/100377 A1)；美国申请第15/140,296号(US 2017/0316353 A1)；PCT/US2017/029725(WO 2017/189784 A1)；PCT/US2016/065464(WO 2017/100376 A2)；美国临时申请第62/431,409号；美国临时申请第62/264,232号；以及美国临时申请第62/368,786号。

本公开的启动子的非详尽性清单提供于下表1中。启动子序列中之每一个都可以称为异源启动子或异源启动子多核苷酸。

表1.本公开的所选启动子序列.

SEQ ID No.	启动子简称	启动子名称
			59	P1	Pcg0007_lib_39
60	P2	Pcg0007
			61	P3	Pcg1860
62	P4	Pcg0755
			63	P5	Pcg0007_265
64	P6	Pcg3381
			65	P7	Pcg0007_119
66	P8	Pcg3121

在一些实施例中，本公开的启动子展现与来自上表的启动子至少100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％或75％的序列同一性。

在一些情况下，启动子梯可以用于选自gapA文库、烟酰胺核苷酸转氢酶文库、gdh、asd、dapB和/或ddh和/或TA文库和/或pyc文库或这些文库的任何组合的基因前面。在一些实施例中，启动子梯的用途包含调节选自gapA文库、烟酰胺核苷酸转氢酶文库、gdh、asd、dapB和/或ddh和/或TA文库和/或pyc文库或这些文库的任何组合的基因的表达。在一些实施例中，启动子梯的用途包含微调选自gapA文库、烟酰胺核苷酸转氢酶文库、gdh、asd、dapB和/或ddh和/或TA文库和/或pyc文库或这些文库的任何组合的基因的表达。在工程化后，可以针对所得结果，例如如本文所提供的产物从葡萄糖中的产生有效地筛选或评估微生物。利用本文提供的启动子梯来产生其中基因实现具体表达水平的宿主并且然后测试/筛选具有所述改变的宿主微生物基因组的此方法可以依照有效和迭代的方式执行，并且可以用于鉴别对于gapA和/或烟酰胺核苷酸转氢酶基因和/或选自gdh、asd、dapB和ddh的一或多种基因和/或TA基因和/或pyc基因来说最佳的特定基因表达水平，由此在宿主细胞中所述基因表达水平下的表达从葡萄糖产生所需或临限水平的所关注的生物分子或产物。

甘油醛-3-磷酸脱氢酶文库

在某些实施例中，本文提供了用于本文所提供的方法中的gapA基因的文库。gapA基因的文库可以包含一或多个gapA基因。文库中的每个gapA基因可以是gapA基因的原生形式或突变形式。突变形式可以包含选自***、缺失、单核苷酸多态性(single nucleotidepolymorphism，SNP)或易位的一或多种突变。文库中的每个gapA基因可以是gapA基因。gapA基因可以是来自所属领域中已知的原核细胞(即，细菌和/或古细菌)的任何gapA基因。gapA基因可以是来自所属领域中已知的真核细胞(例如真菌)的任何gapA基因。gapA可以被认为是包含NAD和/或NADH依赖性GAPDH活性的任何蛋白质。举例来说，本文中使用的gapA可以是将甘油醛-3-磷酸转变为甘油酸-1,3-双磷酸的任何酶。宿主细胞可以是本文提供的任何宿主细胞。在一些实施例中，gapA基因的文库包含来自以下各菌的任何菌株/物种/亚种的gapA基因：分枝杆菌属(例如耻垢分支杆菌(Mycobacterium smegmatis))、链霉菌(Streptomyces)(例如天蓝色链霉菌(Streptomyces coelicolor))、发酵单胞菌属(Zymomonas)(例如运动发酵单胞菌(Zymomonas mobilis))、集胞藻属(Synechocystis)(例如集胞藻属PCC6803)、双歧杆菌属(例如长双岐杆菌(Bifidobacterium longum))、埃希氏杆菌属(例如大肠杆菌)、芽孢杆菌属(例如枯草芽孢杆菌(Bacillus subtilis))、棒状杆菌属(例如谷氨酸棒状杆菌)、酵母菌属(Saccharomyces)(例如酿酒酵母(S.cerevisiae))或其组合。

在一些实施例中，本公开的gapA酶展现与本文提供的gapA酶至少100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％或75％的序列同一性。

文库中的每个gapA基因可以功能性地连接至其原生启动子或其原生启动子的突变形式或处于所述启动子的控制下。文库中的每个gapA基因可以功能性地连接至本文提供的任何启动子或受所述启动子控制。gapA基因的文库中的每个gapA基因可以存在于嵌合构建体中，使得基因可以侧接一或多个调控序列和/或与宿主细胞基因组中存在的序列同源的序列。与宿主细胞中存在的序列同源的序列可以促进gapA基因整合至宿主细胞基因组的包含互补序列的位点或基因座中。整合可以经由重组事件进行。调控序列可以是所属领域中已知或本文提供的任何调控序列，例如宿主细胞的遗传机制所用的启动子、起始、终止、信号、分泌和/或终止序列。

烟酰胺核苷酸转氢酶文库

在某些实施例中，本文提供了用于本文所提供的方法中的烟酰胺核苷酸转氢酶基因的文库。烟酰胺核苷酸转氢酶基因的文库可以包含一或多个烟酰胺核苷酸转氢酶基因。文库中的每个烟酰胺核苷酸转氢酶基因可以是转氢酶基因的原生形式或突变形式。突变形式可以包含选自***、缺失、单核苷酸多态性(SNP)或易位的一或多种突变。文库中的每个烟酰胺核苷酸转氢酶基因可以是转氢酶基因。烟酰胺核苷酸转氢酶基因可以是来自所属领域中已知的原核细胞(即，细菌和/或古细菌)的任何转氢酶基因。烟酰胺核苷酸转氢酶基因可以是来自所属领域中已知的真核细胞(例如真菌)的任何转氢酶基因。烟酰胺核苷酸转氢酶可以是将NADH转变为NADPH的任何酶。宿主细胞可以是本文提供的任何宿主细胞。在一些实施例中，烟酰胺核苷酸转氢酶基因的文库包含来自以下各菌的任何菌株/物种/亚种的转氢酶基因：分枝杆菌属(例如耻垢分支杆菌)、链霉菌(例如天蓝色链霉菌)、发酵单胞菌属(例如运动发酵单胞菌)、集胞藻属(例如集胞藻属PCC6803)、双歧杆菌属(例如长双岐杆菌)、埃希氏杆菌属(例如大肠杆菌)、芽孢杆菌属(例如枯草芽孢杆菌)、棒状杆菌属(例如谷氨酸棒状杆菌)、酵母菌属(例如酿酒酵母)或其组合。

在一些实施例中，本公开的烟酰胺核苷酸转氢酶展现与本文提供的转氢酶至少100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％或75％的序列同一性。

文库中的每个烟酰胺核苷酸转氢酶基因可以功能性地连接至其原生启动子或其原生启动子的突变形式或处于所述启动子的控制下。文库中的每个烟酰胺核苷酸转氢酶基因可以功能性地连接至本文提供的任何启动子或受所述启动子控制。烟酰胺核苷酸转氢酶基因的文库中的每个烟酰胺核苷酸转氢酶基因可以存在于嵌合构建体中，使得基因可以侧接一或多个调控序列和/或与宿主细胞基因组中存在的序列同源的序列。与宿主细胞中存在的序列同源的序列可以促进烟酰胺核苷酸转氢酶基因整合至宿主细胞基因组的包含互补序列的位点或基因座中。整合可以经由重组事件进行。调控序列可以是所属领域中已知或本文提供的任何调控序列，例如宿主细胞的遗传机制所用的启动子、起始、终止、信号、分泌和/或终止序列。

gdh、asd、dapB和/或ddh文库

在某些实施例中，本文提供了用于本文所提供的方法中的gdh、asd、dapB和ddh基因的文库。gdh、asd、dapB和ddh基因的文库可以包含一或多个gdh、asd、dapB和ddh基因。文库中的每个gdh、asd、dapB或ddh基因可以是分别gdh、asd、dapB或ddh基因的原生形式或突变形式。突变形式可以包含选自***、缺失、单核苷酸多态性(SNP)或易位的一或多种突变。文库中的每个gdh、asd、dapB或ddh基因可以分别是gdh、asd、dapB或ddh基因。gdh、asd、dapB或ddh基因可以是来自所属领域中已知的原核细胞(即，细菌和/或古细菌)的任何gdh、asd、dapB或ddh基因。asd、dapB或ddh基因可以是来自所属领域中已知的真核细胞(例如真菌)的任何asd、dapB或ddh基因。gdh可以被认为是包含NADPH和/或NADH依赖性谷氨酸脱氢酶活性的任何蛋白质。举例来说，本文中使用的gdh可以是将草酰乙酸转变为天冬氨酸的任何酶。asd可以被认为是包含NADPH和/或NADH依赖性天冬氨酸半醛脱氢酶活性的任何蛋白质。举例来说，本文中使用的asd可以是将天冬氨酰磷酸转变为天冬氨酸半醛的任何酶。dapB可以被认为是包含NADPH和/或NADH依赖性二氢吡啶甲酸还原酶活性的任何蛋白质。举例来说，本文中使用的dapB可以是将二氢吡啶甲酸转变为四氢吡啶甲酸的任何酶。ddh可以被认为是包含NADPH和/或NADH依赖性内消旋-二氨基庚二酸脱氢酶活性的任何蛋白质。举例来说，本文中使用的ddh可以是催化四氢吡啶甲酸直接转变成内消旋-二氨基庚二酸的任何酶。

宿主细胞可以是本文提供的任何宿主细胞。在一些实施例中，asd、dapB或ddh基因的文库分别包含来自以下各菌的任何菌株/物种/亚种的asd、dapB或ddh基因：分枝杆菌属(例如耻垢分支杆菌)、链霉菌(例如天蓝色链霉菌)、发酵单胞菌属(例如运动发酵单胞菌)、集胞藻属(例如集胞藻属PCC6803)、双歧杆菌属(例如长双岐杆菌)、埃希氏杆菌属(例如大肠杆菌)、芽孢杆菌属(例如枯草芽孢杆菌)、棒状杆菌属(例如谷氨酸棒状杆菌)、酵母菌属(例如酿酒酵母)或其组合。

在一些实施例中，本公开的asd、dapB或ddh酶分别展现与本文提供的asd、dapB或ddh酶至少100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％或75％的序列同一性。

文库中的每个asd、dapB或ddh基因可以功能性地连接至其原生启动子或其原生启动子的突变形式或处于所述启动子的控制下。文库中的每个asd、dapB或ddh基因可以功能性地连接至本文提供的任何启动子或受所述启动子控制。asd、dapB和/或ddh基因的文库中的每个asd、dapB和/或ddh基因可以存在于嵌合构建体中，使得基因可以侧接一或多个调控序列和/或与宿主细胞基因组中存在的序列同源的序列。与宿主细胞中存在的序列同源的序列可以促进asd、dapB或ddh基因整合至宿主细胞基因组的包含互补序列的位点或基因座中。整合可以经由重组事件进行。调控序列可以是所属领域中已知或本文提供的任何调控序列，例如宿主细胞的遗传机制所用的启动子、起始、终止、信号、分泌和/或终止序列。

TA文库

在某些实施例中，本文提供了用于本文所提供的方法中的TA基因的文库。TA基因的文库可以包含一或多个TA基因。文库中的每个TA基因可以是分别TA基因的原生形式或突变形式。突变形式可以包含选自***、缺失、单核苷酸多态性(SNP)或易位的一或多种突变。文库中的每个TA基因可以分别是TA基因。TA基因可以分别是来自所属领域中已知的原核细胞(即，细菌和/或古细菌)的任何TA基因。TA基因可以是来自所属领域中已知的真核细胞(例如真菌)的任何TA基因。TA可以被认为是包含苏氨酸醛缩酶活性的任何蛋白质。举例来说，本文中使用的TA可以是将苏氨酸转变为乙醛和甘氨酸的任何酶。在一个实施例中，TA基因以比内源性TA慢的速率将苏氨酸转变为乙醛和甘氨酸。在一个实施例中，TA基因将乙醛和甘氨酸转变为苏氨酸。

宿主细胞可以是本文提供的任何宿主细胞。在一些实施例中，TA基因的文库分别包含来自以下各菌的任何菌株/物种/亚种的TA基因：分枝杆菌属(例如耻垢分支杆菌)、链霉菌(例如天蓝色链霉菌)、发酵单胞菌属(例如运动发酵单胞菌)、集胞藻属(例如集胞藻属PCC6803)、双歧杆菌属(例如长双岐杆菌)、埃希氏杆菌属(例如大肠杆菌)、芽孢杆菌属(例如枯草芽孢杆菌)、棒状杆菌属(例如谷氨酸棒状杆菌)、酵母菌属(例如酿酒酵母)或其组合。

在一些实施例中，本公开的TA酶展现与本文提供的TA酶至少100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％或75％的序列同一性。

文库中的每个TA基因可以功能性地连接至其原生启动子或其原生启动子的突变形式或处于所述启动子的控制下。文库中的每个TA基因可以功能性地连接至本文提供的任何启动子或受所述启动子控制。TA基因的文库中的每个TA基因可以存在于嵌合构建体中，使得基因可以侧接一或多个调控序列和/或与宿主细胞基因组中存在的序列同源的序列。与宿主细胞中存在的序列同源的序列可以促进TA基因整合至宿主细胞基因组的包含互补序列的位点或基因座中。整合可以经由重组事件进行。调控序列可以是所属领域中已知或本文提供的任何调控序列，例如宿主细胞的遗传机制所用的启动子、起始、终止、信号、分泌和/或终止序列。

pyc文库

在某些实施例中，本文提供了用于本文所提供的方法中的pyc基因的文库。pyc基因的文库可以包含一或多个pyc基因。文库中的每个pyc基因可以是分别pyc基因的原生形式或突变形式。突变形式可以包含选自***、缺失、单核苷酸多态性(SNP)或易位的一或多种突变。文库中的每个pyc基因可以分别是pyc基因。pyc基因可以分别是来自所属领域中已知的原核细胞(即，细菌和/或古细菌)的任何pyc基因。pyc基因可以是来自所属领域中已知的真核细胞(例如真菌)的任何pyc基因。pyc可以被认为是包含丙酮酸羧化酶活性的任何蛋白质。举例来说，本文中使用的pyc可以是将丙酮酸转变为草酰乙酸的任何酶。

宿主细胞可以是本文提供的任何宿主细胞。在一些实施例中，pyc基因的文库分别包含来自以下各菌的任何菌株/物种/亚种的pyc基因：分枝杆菌属(例如耻垢分支杆菌)、链霉菌(例如天蓝色链霉菌)、发酵单胞菌属(例如运动发酵单胞菌)、集胞藻属(例如集胞藻属PCC6803)、双歧杆菌属(例如长双岐杆菌)、芽孢杆菌属(例如枯草芽孢杆菌)、棒状杆菌属(例如谷氨酸棒状杆菌)、酵母菌属(例如酿酒酵母)或其组合。

在一些实施例中，本公开的pyc酶展现与本文提供的分别pyc酶至少100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％或75％的序列同一性。

文库中的每个pyc基因可以功能性地连接至其原生启动子或其原生启动子的突变形式或处于所述启动子的控制下。文库中的每个pyc基因可以功能性地连接至本文提供的任何启动子或受所述启动子控制。pyc基因的文库中的每个pyc基因可以存在于嵌合构建体中，使得基因可以侧接一或多个调控序列和/或与宿主细胞基因组中存在的序列同源的序列。与宿主细胞中存在的序列同源的序列可以促进pyc基因整合至宿主细胞基因组的包含互补序列的位点或基因座中。整合可以经由重组事件进行。调控序列可以是所属领域中已知或本文提供的任何调控序列，例如宿主细胞的遗传机制所用的启动子、起始、终止、信号、分泌和/或终止序列。

产生gapA基因的突变形式

如本文所提供，用于本文所提供的方法中的gapA基因可以是其源自的基因的突变形式。突变基因可以按所属领域中已知或本文提供的任何方式突变。

在一些实施例中，本公开教示了通过引入、缺失或置换基因组DNA的所选部分来使细胞群体发生突变。因此，在一些实施例中，本公开教示了用于靶向特定基因座(例如gapA)进行突变的方法。在其它实施例中，本公开教示了利用如ZFN、TALENS或CRISPR等基因编辑技术选择性地编辑目标DNA区域。在细胞群体突变后，靶向突变可以从细胞分离并且随后用于产生gapA基因的文库。

在一些实施例中，本公开教示了在宿主生物体外使所选DNA区域(例如gapA基因)突变。举例来说，在一些实施例中，本公开教示了使原生gapA基因突变。

在一些实施例中，DNA的所选区域是在体外通过天然变体的基因改组或用合成寡核苷酸改组、质粒-质粒重组、病毒质粒重组或病毒-病毒重组来产生。在其它实施例中，基因组区域经由易错PCR或定点诱变产生。

在一些实施例中，在含有gapA基因的所选基因区域中产生突变是利用“再装配PCR”完成。简单来说，合成寡核苷酸引物(寡核苷酸)用于所关注的核酸序列(例如gapA基因)的区段的PCR扩增，使得寡核苷酸的序列与两个区段的接合点重叠。重叠区域的长度典型地是约10至100个核苷酸。所述区段各自用一组这样的引物扩增。接着根据装配方案“再装配”PCR产物。简单来说，在装配方案中，首先通过例如凝胶电泳或尺寸排阻色谱，纯化PCR产物以不含引物。将纯化的产物混合在一起并且经历约1-10个循环的在聚合酶和三磷酸脱氧核苷(dNTP)和适当缓冲盐存在下在缺乏额外引物下(“自引发”)的变性、再粘接和延伸。利用引物侧接基因的后续PCR扩增完整再装配和改组的基因的产量。

在本公开的一些实施例中，例如上文所论述的突变gapA DNA区域富集突变序列，以便更有效地对多种突变谱，即突变的可能组合进行取样。在一些实施例中，通过mutS蛋白质亲和基质(瓦格纳(Wagner)等人，《核酸研究(Nucleic Acids Res.)》23(19):3944-3948(1995)；苏(Su)等人，《美国国家科学院院刊(Proc.Natl.Acad.Sci.(U.S.A.))》，83:5057-5061(1986))鉴别突变序列，其中优选在装配反应前进行体外扩增亲和纯化物质的步骤。然后将此扩增物质安放至装配或再装配PCR反应中。

在一些实施例中，在自然界中发现突变gapA DNA区域。

产生烟酰胺核苷酸转氢酶基因的突变形式

如本文所提供，用于本文所提供的方法中的烟酰胺核苷酸转氢酶基因可以是其源自的基因的突变形式。突变基因可以按所属领域中已知或本文提供的任何方式突变。

在一些实施例中，本公开教示了通过引入、缺失或置换基因组DNA的所选部分来使细胞群体发生突变。因此，在一些实施例中，本公开教示了用于靶向特定基因座(例如烟酰胺核苷酸转氢酶)进行突变的方法。在其它实施例中，本公开教示了利用如ZFN、TALENS或CRISPR等基因编辑技术选择性地编辑目标DNA区域。在细胞群体突变后，靶向突变可以从细胞分离并且随后用于产生烟酰胺核苷酸转氢酶基因的文库。

在一些实施例中，本公开教示了在宿主生物体外使所选DNA区域(例如烟酰胺核苷酸转氢酶基因)突变。举例来说，在一些实施例中，本公开教示了使原生烟酰胺核苷酸转氢酶基因突变。

在某些实施例中，在含有烟酰胺核苷酸转氢酶基因的所选基因区域中产生突变是利用“再装配PCR”完成。

在一些实施例中，例如上文所论述的突变烟酰胺核苷酸转氢酶DNA区域富集突变序列，以便更有效地对多种突变谱，即突变的可能组合进行取样。在一些实施例中，通过mutS蛋白质亲和基质鉴别突变序列，其中优选在装配反应前进行体外扩增亲和纯化物质的步骤。然后将此扩增物质安放至装配或再装配PCR反应中。

在一些实施例中，在自然界中发现突变烟酰胺核苷酸转氢酶DNA区域。

产生gdh、asd、dapB和/或ddh基因的突变形式

如本文所提供，用于本文所提供的方法中的gdh、asd、dapB或ddh基因可以是其源自的基因的突变形式。突变基因可以按所属领域中已知或本文提供的任何方式突变。

在一些实施例中，本公开教示了通过引入、缺失或置换基因组DNA的所选部分来使细胞群体发生突变。因此，在一些实施例中，本公开教示了用于靶向特定基因座(例如gdh、asd、dapB或ddh)进行突变的方法。在其它实施例中，本公开教示了利用如ZFN、TALENS或CRISPR等基因编辑技术选择性地编辑目标DNA区域。在细胞群体突变后，靶向突变可以从细胞分离并且随后用于产生烟酰胺核苷酸转氢酶基因的文库。

在一些实施例中，本公开教示了在宿主生物体外使所选DNA区域(例如gdh、asd、dapB或ddh基因)突变。举例来说，在一些实施例中，本公开教示了使原生gdh、asd、dapB或ddh基因突变。

在某些实施例中，在含有烟酰胺核苷酸转氢酶基因的所选基因区域中产生突变是利用“再装配PCR”完成。

在一些实施例中，例如上文所论述的突变gdh、asd、dapB和/或ddh DNA区域富集突变序列，以便更有效地对多种突变谱，即突变的可能组合进行取样。在一些实施例中，通过mutS蛋白质亲和基质鉴别突变序列，其中优选在装配反应前进行体外扩增亲和纯化物质的步骤。然后将此扩增物质安放至装配或再装配PCR反应中。

在一些实施例中，在自然界中发现突变或变异gdh、asd、dapB和/或ddh DNA区域。在某些实施例中，在包括(但不限于)以下的细菌中发现谷氨酸棒状杆菌ddh的天然存在的变体：口腔放线菌(A.oris)、超嗜热古菌(H.archaeon)、粪芽孢菌属(coprobacillus)、竹节状甲烷鬃毛菌(M.harundinacea)、微核巨球形菌(M.micronuciformis)、反硝化无色杆菌(A.denitrificans)、藤黄微球菌(M.luteus)、粪短杆菌(B.faecium)和肉食杆菌属(carnobacterium)。在某些实施例中，在包括(但不限于)以下的细菌中发现谷氨酸棒状杆菌asd的天然存在的变体：詹氏甲烷球菌(M.jannaschii)、普通索利氏菌(S.usitatus)、内部盐碱湖菌(N.innermongolicus)、嗜热光合绿曲菌(C.aurantiacus)、敏捷乳杆菌(L.agilis)、小鸡双歧杆菌(B.pullorum)、细菌双歧杆菌(B.bacterium)、汉氏粘球菌(M.hansupus)和固氮类芽孢杆菌(P.sabinae)。在一些实施例中，在包括(但不限于)共生梭菌(C.symbiosum)的细菌中发现谷氨酸棒状杆菌gdh的天然存在的变体。在一些实施例中，在包括(但不限于)大肠杆菌的细菌中发现谷氨酸棒状杆菌dapB的天然存在的变体。在某些实施例中，通过在生物体(例如细菌)中进行全基因组同源性搜索，发现谷氨酸棒状杆菌gdh、asd、dapB和/或ddh的天然存在的变体。

产生TA基因的突变形式

如本文所提供，用于本文所提供的方法中的TA基因可以是其源自的基因的突变形式。突变基因可以按所属领域中已知或本文提供的任何方式突变。

在一些实施例中，本公开教示了通过引入、缺失或置换基因组DNA的所选部分来使细胞群体发生突变。因此，在一些实施例中，本公开教示了用于靶向特定基因座(例如TA)进行突变的方法。在其它实施例中，本公开教示了利用如ZFN、TALENS或CRISPR等基因编辑技术选择性地编辑目标DNA区域。在细胞群体突变后，靶向突变可以从细胞分离并且随后用于产生烟酰胺核苷酸转氢酶基因的文库。

在一些实施例中，本公开教示了在宿主生物体外使所选DNA区域(例如TA基因)突变。举例来说，在一些实施例中，本公开教示了使原生TA基因突变。

在某些实施例中，在含有烟酰胺核苷酸转氢酶基因的所选基因区域中产生突变是利用“再装配PCR”完成。

在一些实施例中，突变TA DNA区域(例如上文所论述者)富集突变序列，以便更有效地对多种突变谱、即突变的可能组合进行取样。在一些实施例中，通过mutS蛋白质亲和基质鉴别突变序列，其中优选在装配反应前进行体外扩增亲和纯化物质的步骤。然后将此扩增物质安放至装配或再装配PCR反应中。

在一些实施例中，在自然界中发现突变或变异TA DNA区域。在某些实施例中，在包括(但不限于)以下的细菌中发现谷氨酸棒状杆菌TA的天然存在的变体：口腔放线菌、超嗜热古菌、粪芽孢菌属、竹节状甲烷鬃毛菌、微核巨球形菌、反硝化无色杆菌、藤黄微球菌、粪短杆菌和肉食杆菌属。在某些实施例中，通过在生物体(例如细菌)中进行全基因组同源性搜索，发现谷氨酸棒状杆菌TA的天然存在的变体。

产生pyc基因的突变形式

如本文所提供，用于本文所提供的方法中的pyc基因可以是其源自的基因的突变形式。突变基因可以按所属领域中已知或本文提供的任何方式突变。

在一些实施例中，本公开教示了通过引入、缺失或置换基因组DNA的所选部分来使细胞群体发生突变。因此，在一些实施例中，本公开教示了用于靶向特定基因座(例如pyc)进行突变的方法。在其它实施例中，本公开教示了利用如ZFN、TALENS或CRISPR等基因编辑技术选择性地编辑目标DNA区域。在细胞群体突变后，靶向突变可以从细胞分离并且随后用于产生烟酰胺核苷酸转氢酶基因的文库。

在一些实施例中，本公开教示了在宿主生物体外使所选DNA区域(例如pyc基因)突变。举例来说，在一些实施例中，本公开教示了使原生pyc基因突变。

在某些实施例中，在含有烟酰胺核苷酸转氢酶基因的所选基因区域中产生突变是利用“再装配PCR”完成。

在一些实施例中，例如上文所论述的突变pyc DNA区域富集突变序列，以便更有效地对多种突变谱，即突变的可能组合进行取样。在一些实施例中，通过mutS蛋白质亲和基质鉴别突变序列，其中优选在装配反应前进行体外扩增亲和纯化物质的步骤。然后将此扩增物质安放至装配或再装配PCR反应中。

在一些实施例中，在自然界中发现突变或变异pyc DNA区域。在某些实施例中，在包括(但不限于)以下的细菌中发现谷氨酸棒状杆菌pyc的天然存在的变体：口腔放线菌、超嗜热古菌、粪芽孢菌属、竹节状甲烷鬃毛菌、微核巨球形菌、反硝化无色杆菌、藤黄微球菌、粪短杆菌和肉食杆菌属。在某些实施例中，通过在生物体(例如细菌)中进行全基因组同源性搜索，发现谷氨酸棒状杆菌pyc的天然存在的变体。

包含gapA基因的文库的产生

在一些实施例中，本公开教示了***和/或置换和/或缺失宿主生物体的包含gapA基因的DNA区段。在一些方面，本文所教示的方法包括建构所关注的寡核苷酸(即，gapA区段)，其可以并入到宿主生物体的基因组中。在一些实施例中，本公开的gapA DNA区段可以经由所属领域中已知的任何方法，包括由已知模板复制或切割、突变或DNA合成来获得。在一些实施例中，本公开与用于产生DNA序列的市售基因合成产品(例如GeneArt^TM、GeneMaker^TM、GenScript^TM、Anagen^TM、Blue Heron^TM、Entelechon^TM、基诺公司(GeNOsys,Inc.)或Qiagen^TM)相容。

在一些实施例中，gapA DNA区段被设计成将葡萄糖gapA DNA区段并入宿主生物体的所选DNA区域中(例如添加有用GAPDH活性)。在某些实施例中，所选DNA区域是中性整合位点。在其它实施例中，gapA DNA区段被设计成从宿主生物体的DNA去除原生gapA基因(例如去除原生GAPDH活性)。

在一些实施例中，本发明方法中所用的gapA基因可以使用所属领域中已知的任何酶促或化学合成方法分段合成为寡核苷酸。寡核苷酸可以在固体载体上合成，所述固体载体如可控微孔玻璃(controlled pore glass，CPG)、聚苯乙烯珠粒或由可以含有CPG的热塑性聚合物组成的膜。寡核苷酸还能够在阵列上、在并行的微米尺度上使用微流体(田(Tian)等人，《分子生物系统(Mol.BioSyst.)》，5，714-722(2009))或提供两者组合的已知技术(参见雅各布森(Jacobsen)等人，美国专利申请第2011/0172127号)合成。

在阵列上或通过微流体的合成优于常规固体载体合成之处在于通过减少试剂的使用降低了成本。基因合成所需的规模低，因此由阵列或通过微流体合成的寡核苷酸产物的规模是可接受的。然而，所合成的寡核苷酸的品质低于使用固体载体合成时(参见田(Tian)，见下文；也参见施泰勒(Staehler)等人，美国专利申请第2010/0216648号)。

自从二十世纪八十年代首次描述了传统的四步亚磷酰胺化学方法以来，其已经取得了大量的进步(参见例如丝兹查勒(Sierzchala)等人，《美国化学学会杂志(J.Am.Chem.Soc.)》，125，13427-13441(2003)，其使用过氧基阴离子脱除保护基；早川(Hayakawa)等人，美国专利第6,040,439号，其是关于替代保护基；阿杂叶维(Azhayev)等人，《四面体(Tetrahedron)》57，4977-4986(2001)，其是关于通用载体；考兹洛维(Kozlov)等人，《核苷、核苷酸和核酸(Nucleosides,Nucleotides,and Nucleic Acids)》，24(5-7)，1037-1041(2005)，其是关于通过使用大孔隙CPG改良较长寡核苷酸的合成；以及丹哈(Damha)等人，《核酸研究(NAR)》，18，3813-3821(1990)，其是关于改良衍生化)。

不论合成的类型如何，所得寡核苷酸接着都可以形成较小的建构嵌段用于较长的多核苷酸(即，gapA基因)。在一些实施例中，较小的寡核苷酸可以使用所属领域中已知的方案连接在一起，如聚合酶链装配(PCA)、连接酶链反应(LCR)和热力学平衡由内而外合成法(TBIO)(参见兹阿尔(Czar)等人，《生物技术趋势(Trends in Biotechnology)》，27，63-71(2009))。在PCA中，在多个循环(典型地约55个循环)中使跨越所期望较长产物的整个长度的寡核苷酸粘接且延长，最终获得全长产物。LCR使用连接酶将两个寡核苷酸连接，所述两个寡核苷酸均粘接到第三寡核苷酸。TBIO合成始于所期望产物的中心并且通过使用重叠寡核苷酸而在两个方向上逐渐地延长，所述重叠寡核苷酸与位于基因的5'端的正向链同源并且与位于基因的3'端的反向链相反。

另一种合成较大双链DNA片段的方法是通过顶链PCR(top-strand PCR，TSP)组合较小寡核苷酸。在此方法中，多个寡核苷酸跨越所期望产物的整个长度并且含有与相邻寡核苷酸重叠的区域。可以使用通用正向和反向引物执行扩增，并且通过多个循环的扩增来形成全长双链DNA产物。此产物接着可以经历任选的差错校正和进一步的扩增，产生所期望的双链DNA片段最终产物。

在TSP的一种方法中，将要组合形成所期望全长产物的较小寡核苷酸集合具有40-200个之间的碱基长度并且彼此重叠至少约15-20个碱基。就实用目的来说，重叠区域的最小长度应该足以确保寡核苷酸的特异性粘接并且具有足够高的解链温度(T_m)，以便在所用反应温度下粘接。重叠可以延伸到既定寡核苷酸被相邻寡核苷酸完全叠覆的点。重叠的量似乎对最终产物的品质无任何影响。装配体中的第一个和最后一个寡核苷酸建构嵌段应该含有正向和反向扩增引物的结合位点。在一个实施例中，第一个和最后一个寡核苷酸的末端序列含有互补的相同序列以允许使用通用引物。

包含烟酰胺核苷酸转氢酶基因的文库的产生

在一些实施例中，本公开教示了***和/或置换和/或缺失宿主生物体的包含烟酰胺核苷酸转氢酶基因的DNA区段。在一些方面，本文所教示的方法包括建构所关注的寡核苷酸(即，烟酰胺核苷酸转氢酶区段)，其可以并入到宿主生物体的基因组中。在一些实施例中，本公开的烟酰胺核苷酸转氢酶DNA区段可以经由所属领域中已知的任何方法，包括由已知模板复制或切割、突变或DNA合成来获得。在一些实施例中，本公开与用于产生DNA序列的市售基因合成产品(例如GeneArt^TM、GeneMaker^TM、GenScript^TM、Anagen^TM、Blue Heron^TM、Entelechon^TM、基诺公司或Qiagen^TM)相容。

在一些实施例中，烟酰胺核苷酸转氢酶DNA区段被设计成将烟酰胺核苷酸转氢酶DNA区段并入宿主生物体的所选DNA区域中(例如添加有用转氢酶活性)。在某些实施例中，所选DNA区域是中性整合位点。在其它实施例中，烟酰胺核苷酸转氢酶DNA区段被设计成从宿主生物体的DNA去除原生烟酰胺核苷酸转氢酶基因(例如去除原生转氢酶活性)。

在一些实施例中，本发明方法中所用的烟酰胺核苷酸转氢酶基因可以使用所属领域中已知的任何酶促或化学合成方法分段合成为寡核苷酸。寡核苷酸可以在固体载体上合成，所述固体载体如可控微孔玻璃(CPG)、聚苯乙烯珠粒或由可以含有CPG的热塑性聚合物组成的膜。寡核苷酸还能够在阵列上、在并行的微米尺度上使用微流体或提供两者组合的已知技术合成。

在阵列上或通过微流体的合成优于常规固体载体合成之处在于通过减少试剂的使用降低了成本。基因合成所需的规模低，因此由阵列或通过微流体合成的寡核苷酸产物的规模是可接受的。然而，所合成的寡核苷酸的品质低于使用固体载体合成时。

自从二十世纪八十年代首次描述了传统的四步亚磷酰胺化学方法以来，其已经取得了大量的进步(参见例如丝兹查勒等人,《美国化学学会杂志》,125,13427-13441(2003)，其使用过氧基阴离子脱除保护基；早川等人,美国专利第6,040,439号，其是关于替代保护基；阿杂叶维等人,《四面体》57,4977-4986(2001)，其是关于通用载体；考兹洛维等人,《核苷、核苷酸和核酸》,24(5-7),1037-1041(2005)，其是关于通过使用大孔隙CPG改良较长寡核苷酸的合成；以及丹哈等人,《核酸研究》,18,3813-3821(1990)，其是关于改良衍生化)。

不论合成的类型如何，所得寡核苷酸接着都可以形成较小的建构嵌段用于较长的多核苷酸(即，烟酰胺核苷酸转氢酶基因)。在一些实施例中，较小的寡核苷酸可以使用所属领域中已知的方案连接在一起，如聚合酶链装配(PCA)、连接酶链反应(LCR)和热力学平衡由内而外合成法(TBIO)。

另一种合成较大双链DNA片段的方法是通过顶链PCR(TSP)组合较小寡核苷酸。在TSP的一种方法中，将要组合形成所期望全长产物的较小寡核苷酸集合具有40-200个之间的碱基长度并且彼此重叠至少约15-20个碱基。就实用目的来说，重叠区域的最小长度应该足以确保寡核苷酸的特异性粘接并且具有足够高的解链温度(T_m)，以便在所用反应温度下粘接。重叠可以延伸到既定寡核苷酸被相邻寡核苷酸完全叠覆的点。重叠的量似乎对最终产物的品质无任何影响。装配体中的第一个和最后一个寡核苷酸建构嵌段应该含有正向和反向扩增引物的结合位点。在一个实施例中，第一个和最后一个寡核苷酸的末端序列含有互补的相同序列以允许使用通用引物。

调节丙酮酸羧化酶

丙酮酸羧化酶可以在宿主细胞中由含有包含编码丙酮酸羧化酶的核苷酸序列的核酸片段的表达载体表达。可替代地，包含编码丙酮酸羧化酶的核苷酸序列的核酸片段可以整合至宿主的染色体中。无论相对于宿主细胞是异源还是内源性的核酸序列都可以使用例如同源重组引入细菌染色体中。首先，将所关注基因和编码抗药性标记的基因***含有与所关注基因待***的染色体区同源的DNA片的质粒中。然后，此重组诱发DNA引入细菌中，并且选择其中含有所关注基因和抗药性标记的DNA片段在所需位置处重组至染色体中的克隆。可以经由转化，将基因和抗药性标记作为由任何克隆载体制备的线性化DNA片或作为无法在细菌宿主中复制的专门重组***载体的一部分引入细菌中。在线性化DNA的情况下，可以使用recD^-宿主来增加获得所需重组体的频率。随后使用PCR和跨越***区域扩增DNA的引物验证克隆。来自非重组克隆的PCR产物尺寸较小并且只含有将发生***事件的染色体区域，而来自重组克隆的PCR产物尺寸较大并且含有此染色体区域加***基因和抗药性。

在一个优选实施例中，宿主细胞、优选大肠杆菌、谷氨酸棒状杆菌、黄色短杆菌(B.flavum)或乳糖发酵短杆菌(B.lactofermentum)经包含丙酮酸羧化酶基因、优选从菜豆根瘤菌(R.etli)或荧光假单胞菌(P.fluorescens)分离的基因、更优选来自菜豆根瘤菌的pyc基因的核酸片段转化，使得基因在宿主细胞中转录和表达，以相对于可比较的野生型细胞增加草酰乙酸的产生，因此增加所关注的下游代谢物的产生。

本公开的代谢工程细胞过表达丙酮酸羧化酶。换句话说，代谢工程细胞以高于可比较的野生型细胞中表达的丙酮酸羧化酶水平的水平表达丙酮酸羧化酶。此比较可以通过所属领域的技术人员以许多方式进行，并且在可比较的生长条件下进行。举例来说，丙酮酸羧化酶活性可以使用派恩(Payne)和莫里斯(Morris)的方法(《普通微生物学杂志(J.Gen.Microbiol.)》,59,97-101(1969))定量和比较。在此分析中过表达丙酮酸羧化酶的代谢工程细胞将产生比野生型细胞更大的活性。另外或可替代地，可以通过以下来定量和比较丙酮酸羧化酶的量：从细胞制备蛋白质提取物；使其进行SDS-PAGE；将其转移至蛋白质印迹法，随后使用检测试剂盒检测生物素化丙酮酸羧化酶蛋白质，所述试剂盒可购自例如皮尔斯化学公司(Pierce Chemical Company)(伊利诺斯州罗克福德(Rockford,Ill.))、西格玛化学公司(Sigma Chemical Company)(密苏里州圣路易斯(St.Louis,Mo.))或宝灵曼(Boehringer Mannheim)(印第安纳州印第安纳波利斯(Indianapolis,Ind.))，其用于观测蛋白质印迹上的生物素化蛋白质。在一些合适宿主细胞中，非工程化的野生型细胞中的丙酮酸羧化酶表达可以低于可检测水平。

包含gdh、asd、dapB和/或ddh基因的文库的产生

在一些实施例中，本公开教示了***和/或置换和/或缺失包含宿主生物体的gdh、asd、dapB和/或ddh基因的DNA区段。在一些方面，本文所教示的方法包括建构所关注的寡核苷酸(即，gdh、asd、dapB和/或ddh区段)，其可以并入到宿主生物体的基因组中。在一些实施例中，本公开的gdh、asd、dapB和/或ddh DNA区段可以经由所属领域中已知的任何方法，包括由已知模板复制或切割、突变或DNA合成来获得。在一些实施例中，本公开与用于产生DNA序列的市售基因合成产品(例如GeneArt^TM、GeneMaker^TM、GenScript^TM、Anagen^TM、BlueHeron^TM、Entelechon^TM、基诺公司或Qiagen^TM)相容。

在一些实施例中，gdh、asd、dapB和/或ddh DNA区段被设计成将一或多个葡萄糖gdh、asd、dapB和/或ddh DNA区段并入宿主生物体的所选DNA区域中(例如添加一或多种有用谷氨酸脱氢酶、天冬氨酸半醛脱氢酶、二氢吡啶甲酸还原酶和/或内消旋-二氨基庚二酸脱氢酶活性)。在某些实施例中，所选DNA区域是中性整合位点。在其它实施例中，gdh、asd、dapB和/或ddh DNA区段被设计成从宿主生物体的DNA去除一或多种原生gdh、asd、dapB和/或ddh基因(例如去除一或多种原生谷氨酸脱氢酶、天冬氨酸半醛脱氢酶、二氢吡啶甲酸还原酶和/或内消旋-二氨基庚二酸脱氢酶活性)。

在一些实施例中，本发明方法中所用的gdh、asd、dapB和/或ddh基因可以使用所属领域中已知的任何酶促或化学合成方法分段合成为寡核苷酸。寡核苷酸可以在固体载体上合成，所述固体载体如可控微孔玻璃(CPG)、聚苯乙烯珠粒或由可以含有CPG的热塑性聚合物组成的膜。寡核苷酸还能够在阵列上、在并行的微米尺度上使用微流体或提供两者组合的已知技术合成。

自从二十世纪八十年代首次描述了传统的四步亚磷酰胺化学方法以来，其已经取得了大量的进步(参见例如丝兹查勒等人,《美国化学学会杂志》,125,13427-13441(2003)，其使用过氧基阴离子脱除保护基；早川等人,美国专利第6,040,439号，其是关于替代保护基；阿杂叶维等人,《四面体》57,4977-4986(2001)，其是关于通用载体；考兹洛维等人，《核苷、核苷酸和核酸》,24(5-7),1037-1041(2005)，其是关于通过使用大孔隙CPG改良较长寡核苷酸的合成；以及丹哈等人，《核酸研究》,18,3813-3821(1990)，其是关于改良衍生化)。

不论合成的类型如何，所得寡核苷酸接着都可以形成较小的建构嵌段用于较长的多核苷酸(即，gdh、asd、dapB和/或ddh基因)。在一些实施例中，较小的寡核苷酸可以使用所属领域中已知的方案连接在一起，如聚合酶链装配(PCA)、连接酶链反应(LCR)和热力学平衡由内而外合成法(TBIO)。

包含苏氨酸醛缩酶(TA)基因的文库的产生

在一些实施例中，本公开教示了***和/或置换和/或缺失宿主生物体的包含TA基因的DNA区段。在一些方面，本文所教示的方法包括建构所关注的寡核苷酸(即，TA区段)，其可以并入到宿主生物体的基因组中。在一些实施例中，本公开的TA DNA区段可以经由所属领域中已知的任何方法，包括由已知模板复制或切割、突变或DNA合成来获得。在一些实施例中，本公开与用于产生DNA序列的市售基因合成产品(例如GeneArt^TM、GeneMaker^TM、GenScript^TM、Anagen^TM、Blue Heron^TM、Entelechon^TM、基诺公司或Qiagen^TM)相容。

在一些实施例中，TA DNA区段被设计成将一或多个TA DNA区段并入宿主生物体的所选DNA区域中(例如添加有用苏氨酸醛缩酶活性)。在某些实施例中，所选DNA区域是中性整合位点。在其它实施例中，TA DNA区段被设计成从宿主生物体的DNA去除一或多个原生TA基因(例如去除一或多个具有苏氨酸醛缩酶活性的基因)。

在一些实施例中，本发明方法中所用的TA基因可以使用所属领域中已知的任何酶促或化学合成方法分段合成为寡核苷酸。寡核苷酸可以在固体载体上合成，所述固体载体如可控微孔玻璃(CPG)、聚苯乙烯珠粒或由可以含有CPG的热塑性聚合物组成的膜。寡核苷酸还能够在阵列上、在并行的微米尺度上使用微流体或提供两者组合的已知技术合成。

不论合成的类型如何，所得寡核苷酸接着都可以形成较小的建构嵌段用于较长的多核苷酸(即，TA基因)。在一些实施例中，较小的寡核苷酸可以使用所属领域中已知的方案连接在一起，如聚合酶链装配(PCA)、连接酶链反应(LCR)和热力学平衡由内而外合成法(TBIO)。

包含pyc基因的文库的产生

在一些实施例中，本公开教示了***和/或置换和/或缺失宿主生物体的包含pyc基因的DNA区段。在一些方面，本文所教示的方法包括建构所关注的寡核苷酸(即，pyc区段)，其可以并入到宿主生物体的基因组中。在一些实施例中，本公开的pyc DNA区段可以经由所属领域中已知的任何方法，包括由已知模板复制或切割、突变或DNA合成来获得。在一些实施例中，本公开与用于产生DNA序列的市售基因合成产品(例如GeneArt^TM、GeneMaker^TM、GenScript^TM、Anagen^TM、Blue Heron^TM、Entelechon^TM、基诺公司或Qiagen^TM)相容。

在一些实施例中，pyc DNA区段被设计成将一或多个葡萄糖pyc DNA区段并入宿主生物体的所选DNA区域中(例如添加具有丙酮酸羧化酶活性的一或多个有用基因)。在某些实施例中，所选DNA区域是中性整合位点。在其它实施例中，pyc DNA区段被设计成从宿主生物体的DNA去除一或多个原生pyc基因(例如去除一或多个具有丙酮酸羧化酶活性的原生基因)。

在一些实施例中，本发明方法中所用的pyc基因可以使用所属领域中已知的任何酶促或化学合成方法分段合成为寡核苷酸。寡核苷酸可以在固体载体上合成，所述固体载体如可控微孔玻璃(CPG)、聚苯乙烯珠粒或由可以含有CPG的热塑性聚合物组成的膜。寡核苷酸还能够在阵列上、在并行的微米尺度上使用微流体或提供两者组合的已知技术合成。

不论合成的类型如何，所得寡核苷酸接着都可以形成较小的建构嵌段用于较长的多核苷酸(即，pyc基因)。在一些实施例中，较小的寡核苷酸可以使用所属领域中已知的方案连接在一起，如聚合酶链装配(PCA)、连接酶链反应(LCR)和热力学平衡由内而外合成法(TBIO)。

装配/克隆质粒

在一些实施例中，本公开教示了用于构建能够将所需gapA基因和/或烟酰胺核苷酸转氢酶和/或gdh、asd、dapB和/或ddh基因和/或TA基因和/或pyc基因DNA区段***宿主生物体的基因组中的载体的方法。在一些实施例中，本公开教示了克隆包含***DNA(例如gapA基因和/或烟酰胺核苷酸转氢酶和/或gdh、asd、dapB和/或ddh基因和/或TA基因和/或pyc基因)、同源臂和至少一种选择标记的载体的方法(参见图6)。

在一些实施例中，本公开与适合于转化到宿主生物体中的任何载体相容。在一些实施例中，本公开教示了与宿主细胞相容的穿梭载体的使用。在一个实施例中，本文所提供的方法中使用的穿梭载体是与大肠杆菌和/或棒状杆菌属宿主细胞相容的穿梭载体。本文所提供的方法中使用的穿梭载体可以包含如本文所述的用于选择和/或反向选择的标记。标记可以是所属领域中已知和/或本文提供的任何标记。穿梭载体可以进一步包含任何调控序列和/或如所属领域已知的适用于所述穿梭载体装配的序列。穿梭载体可以进一步包含在如本文所提供的宿主细胞(例如大肠杆菌或谷氨酸棒状杆菌)中繁殖所需要的任何复制起点。调控序列可以是所属领域中已知或本文提供的任何调控序列，例如宿主细胞的遗传机制所用的启动子、起始、终止、信号、分泌和/或终止序列。在某些情况下，可以将目标DNA***从任何存储库或目录产物获得的载体、构建体或质粒中，如商业载体(参见例如DNA2.0定制版或

载体)。

在一些实施例中，本公开的装配/克隆方法可以采用以下装配策略中的至少一种：i)II型常规克隆；ii)II S型介导或“金门(Golden Gate)”克隆(参见例如恩格勒(Engler,C.)，康德兹(R.Kandzia)和马里约内(S.Marillonnet)，2008，“具有高通量能力的一锅一步精确克隆方法(A one pot,one step,precision cloning method with high throughputcapability)”，《公共科学图书馆综合卷(PLos One)》3:e3647；科特纳(Kotera,I.)和长井(T.Nagai)，2008，“使用DNA聚合酶抑制剂和IIS型限制酶对粗PCR产物的高通量单管式重组(A high-throughput and single-tube recombination of crude PCR products usinga DNA polymerase inhibitor and type IIS restriction enzyme)”，《生物技术杂志(JBiotechnol)》137:1-7.；韦伯(Weber,E.)，格鲁兹勒(R.Gruetzner)，沃尔纳(S.Werner)，恩格勒(C.Engler)和马里约内(S.Marillonnet)，2011，通过金门克隆装配设计者TAL效应子(Assembly of Designer TAL Effectors by Golden Gate Cloning)，《公共科学图书馆综合卷》6:e19722)；iii)

重组；iv)克隆、核酸外切酶介导的装配(艾斯兰迪斯(Aslanidis)和德迥(de Jong)，1990，“PCR产物的非连接依赖性克隆(LIC-PCR)(Ligation-independent cloning of PCR products(LIC-PCR))”，《核酸研究(NucleicAcids Research)》，第18卷，第20 6069期)；v)同源重组；vi)非同源末端连接；或其组合。模组化的基于IIS型的装配策略在PCT公开WO 2011/154147中公开，其公开内容以引用的方式包括在本文中。

在一些实施例中，本公开教示了具有至少一个选择标记的克隆载体。各种选择标记基因是所属领域中已知的，其通常编码抗生素抗性功能以在原核细胞(例如针对安比西林(ampicillin)、卡那霉素(kanamycin)、四环素(tetracycline)、氯胺苯醇(chloramphenycol)、匀霉素(zeocin)、观霉素/链霉素(spectinomycin/streptomycin))或真核细胞(例如遗传霉素(geneticin)、新霉素(neomycin)、潮霉素(hygromycin)、嘌呤霉素(puromycin)、杀稻瘟菌素(blasticidin)、匀霉素)中在选择性压力下进行选择。其它标记系统允许筛选和鉴别所需或非所需的细胞，如众所周知的蓝/白筛选系统，其在细菌中用于在X-gal或荧光报告子(如在成功转导的宿主细胞中表达的绿色或红色荧光蛋白)存在下选择阳性克隆。大部分只在原核生物系统中具功能性的另一类选择标记是指可反向选择的标记基因，通常也称为“死亡基因”，其表达杀死生产细胞的毒性基因产物。这类基因的实例包括sacB、rpsL(strA)、tetAR、pheS、thyA、gata-1或ccdB，其功能描述于(雷拉特(Reyrat)等人，1998，“可反向选择的标记：细菌遗传学和发病机理的未开发工具(CounterselectableMarkers:Untapped Tools for Bacterial Genetics and Pathogenesis)”，《感染与免疫(Infect Immun.)》，66(9):4011-4017)。

在一些实施例中，其中克隆目标DNA区段的载体包含启动子。启动子多核苷酸可用于在宿主微生物中过表达或低表达gapA和/或烟酰胺核苷酸转氢酶和/或gdh、asd、dapB和/或ddh和/或TA和/或pyc。

在一些实施例中，所产生的包含异源gapA基因和/或烟酰胺核苷酸转氢酶基因和/或gdh、asd、dapB和ddh基因中的一或多种和/或TA基因的每个菌株进行培养并根据本公开的一或多个准则(例如所关注的生物分子或产物的生产率)分析。来自所分析的每个宿主菌株的数据与具体的gapA基因或烟酰胺核苷酸转氢酶基因或gdh、asd、dapB和/或ddh基因和/或TA基因和/或pyc基因或gapA/烟酰胺核苷酸转氢酶/gdh、asd、dapB和/或ddh基因/TA/pyc组合关联/相关，并记录下来供将来使用。因此，本公开能够产生大且高度注释的基因多样性文库/保藏处，其鉴别gapA基因或烟酰胺核苷酸转氢酶基因或gdh、asd、dapB和/或ddh基因和/或TA基因和/或pyc基因或者gapA或烟酰胺核苷酸转氢酶基因或gdh、asd、dapB和/或ddh/TA/pyc基因组合对所关注的许多基因或表型特性的作用。

在一些实施例中，多样性池内的菌株是参照“参考菌株”测定的。在一些实施例中，参考菌株是野生型菌株。在其它实施例中，参考菌株是经历任何基因组工程化之前的原始工业菌株。参考菌株可以由从业者定义并且不一定是原始野生型菌株或原始工业菌株。基础菌株仅仅代表被视为“基础”、“参考”或原始基因背景的菌株，与由所述参考菌株衍生或开发的后续菌株与之进行比较。

值得留意的构思是亲代菌株与参考菌株之间的差异。亲代菌株是用于当前一轮基因组工程化的背景。参考菌株是在每个平板中用于促进比较，尤其是平板之间的比较的对照菌株，且典型地是如上文所提及的“基础菌株”。但是由于所述基础菌株(例如用于对总体性能进行基准测试的野生型或工业菌株)在所指定一轮的菌株改良中是诱变目标的意义上不一定是“基础”，因此更具描述性的术语是“参考菌株”。

总之，基础/参考菌株通常是用于对所建构菌株的性能进行基准测试，而亲代菌株是用于对相关基因背景下的特定基因变化的性能进行基准测试。

在一些实施例中，本公开教示了载体的用途，其用于在起始和/或终止密码子变体下克隆gapA基因和/或烟酰胺核苷酸转氢酶和/或gdh、asd、dapB和/或ddh基因和/或TA基因和/或pyc基因，使得所克隆的基因利用起始和/或终止密码子变体。举例来说，酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物的典型终止密码子是UGA，而昆虫和大肠杆菌通常使用UAA作为终止密码子(达尔芬(Dalphin)等人(1996)，核酸研究(Nucl.Acids Res.)24:216-218)。

密码子优化

在一个实施例中，所提供的公开的方法包含对宿主生物体所表达的一或多种基因进行密码子优化。用于优化密码子以改善各种宿主中的表达的方法在所属领域中已知且描述于文献(参见美国专利申请公开第2007/0292918号，所述申请以全文引用的方式并入本文中)中。可以制备含有具体原核生物或真核生物宿主优选的密码子的优化编码序列(也参见莫雷(Murray)等人(1989)，《核酸研究(Nucl.Acids Res.)》17:477-508)，以例如提高翻译速率或产生具有期望特性的重组RNA转录物，如半衰期比由非优化序列产生的转录物长。

在一些实施例中，本文提供的gapA/烟酰胺核苷酸转氢酶/gdh、asd、dapB和/或ddh基因/TA基因/pyc基因或多核苷酸包含针对在本文提供的例如大肠杆菌和/或谷氨酸棒状杆菌等宿主细胞中的翻译优化的分子密码子。基因或多核苷酸可以是分离、合成或重组核酸。密码子优化的gapA/烟酰胺核苷酸转氢酶/gdh、asd、dapB和/或ddh/TA/pyc基因或多核苷酸可以选自SEQ ID NO:1-50、67-74、79-231和232。本文提供的密码子优化的gapA/烟酰胺核苷酸转氢酶/gdh、asd、dapB和/或ddh/TA/pyc基因或多核苷酸可以使用所属领域中已知的用于产生密码子优化的多核苷酸的方法，例如金思特(GenScript)的OptimumGene^TM基因设计系统或DNA2.0

表达优化技术产生。

蛋白质表达由大量因素控制，包括影响转录、mRNA加工以及翻译稳定性和起始的那些因素。因此优化可以解决任何具体基因的大量序列特点中的任一个。作为一个特定实例，稀有密码子诱导的翻译暂停能够引起蛋白质表达减少。稀有密码子诱导的翻译暂停包括所关注的多核苷酸中存在很少用于宿主生物体中的密码子，因其在可利用的tRNA池中的稀缺性而可能对蛋白质翻译产生负面影响。

交替翻译起始还会引起异源蛋白质表达减少。交替翻译起始可以包括合成多核苷酸序列，其不经意间含有能够充当核糖体结合位点(RBS)的基元。这些位点可以起始截短蛋白质从基因内部位点的翻译。一种减少产生在纯化期间可能难以去除的截短蛋白质的可能性的方法包括将推定的内部RBS序列从优化的多核苷酸序列中排除。

重复诱导的聚合酶打滑会引起异源蛋白质表达减少。重复诱导的聚合酶打滑涉及已经显示可引起DNA聚合酶打滑或停顿，造成移框突变的核苷酸序列重复。这类重复还能够引起RNA聚合酶打滑。在具有高G+C含量偏好的生物体中，可以存在由G或C核苷酸重复组成的较高程度的重复。因此，一种减少诱导RNA聚合酶打滑的可能性的方法包括改变G或C核苷酸的延长重复。

干扰二级结构也会引起异源蛋白质表达减少。二级结构能够隔离RBS序列或起始密码子并且已经与蛋白质表达的减少相关。茎环结构也会与转录暂停和减弱相关。优化的多核苷酸序列可以在核苷酸序列的RBS和基因编码区中含有最小的二级结构以实现转录和翻译的改善。

举例来说，优化程序可以始于鉴别由宿主表达的所期望氨基酸序列。可以由所述氨基酸序列设计出候选多核苷酸或DNA序列。在合成DNA序列的设计期间，可以对密码子使用频率与宿主表达生物体的密码子使用进行比较并且可以从合成序列中去除稀有宿主密码子。另外，可以对合成候选DNA序列进行修饰以便去除非期望的酶限制位点并且添加或去除任何所期望的信号序列、连接子或未翻译区域。可以分析合成DNA序列中的可能会干扰翻译过程的二级结构的存在，所述二级结构如G/C重复和茎环结构。

宿主细胞的转化

在一些实施例中，本公开的载体可以使用多种技术中的任一种引入宿主细胞中，所述技术包括转化、转染、转导、病毒感染、基因枪或Ti介导的基因转移。具体方法包括磷酸钙转染、DEAE-葡聚糖介导的转染、脂质体转染或电穿孔(戴维斯(Davis,L.),迪波乐(Dibner,M.),巴特(Battey,I.),1986“分子生物学基础方法(Basic Methods inMolecular Biology)”)。其它转化方法包括例如乙酸锂转化和电穿孔。参见例如杰兹(Gietz)等人，《核酸研究(Nucleic Acids Res.)》，27:69-74(1992)；伊藤(Ito)等人，《细菌学杂志(J.Bacterol.)》153:163-168(1983)；以及贝克尔(Becker)和加伦特(Guarente)，《酶学方法(Methods in Enzymology)》194:182-187(1991)。在一些实施例中，转化的宿主细胞称为重组宿主菌株。

在一些实施例中，本公开教示了使用所属领域中已知的96孔板机器人技术平台和液体处置机进行细胞的高通量转化。

在一些实施例中，本公开教示了用一或多个选择标记筛选转化细胞。在一个此类实施例中，将经包含卡那霉素抗性标记(KanR)的载体转化的细胞涂铺于含有有效量的卡那霉素抗生素的培养基上。推测加入卡那霉素的培养基上可见的菌落形成单位，以将载体盒并入其基因组中。所期望序列的***可以通过PCR、限制酶分析和/或相关***位点的测序来证实。

所选序列的环出

在一些实施例中，本公开教示了使DNA的所选区域从宿主生物体中环出的方法。环出方法可以如中岛(Nakashima)等人，2014“通过基因组编辑和基因静默进行的细菌细胞工程化(Bacterial Cellular Engineering by Genome Editing and Gene Silencing)”，国际分子科学杂志(Int.J.Mol.Sci.)15(2)，2773-2793中所述。在一些实施例中，本公开教示了使选择标记从阳性转化体环出。环出缺失技术在所属领域中已知，并且描述于(替尔(Tear)等人，2014“不稳定人工基因特异性反向重复序列的切除介导了大肠杆菌中的无痕基因缺失(Excision of Unstable Artificial Gene-Specific inverted RepeatsMediates Scar-Free Gene Deletions in Escherichia coli)”，《应用生物化学和生物技术(Appl.Biochem.Biotech.)》175:1858-1867)。本文所提供的方法中使用的环出方法可以使用单一互换型同源重组或双重互换型同源重组执行。在某些实施例中，如本文所述的所选区域的环出可能需要使用如本文所述的单一互换型同源重组。

首先，将环出载体***宿主生物体基因组内的所选目标区域中(例如通过同源重组、CRISPR或其它基因编辑技术)。在一个实施例中，单一互换型同源重组是在圆形质粒或载体与宿主细胞基因组之间使用，以使圆形质粒或载体环入，如图6中所描绘。所***的载体可以使用作为现有或邻近引入的宿主序列的直接重复序列的序列设计，以便直接重复序列侧接预定成环和缺失的DNA区域。一旦***，可以根据选择区域的缺失来反向选择含有环出质粒或载体的细胞(参见例如图7；缺乏针对选择基因的抗性)。

宿主微生物

虽然本文所提供的基因组工程化方法是用工业微生物细胞培养物例示的，但可适用于可以在基因突变体群体中鉴别所需特性的任何生物体。

因此，如本文所用，术语“微生物”应在宽广的意义上理解。其包括(但不限于)两个原核生物域：细菌和古细菌，以及某些真核生物真菌和原生生物。然而，在某些方面，本文教示的方法中可以使用“更高级”的真核生物体，如昆虫、植物和动物。

适合的宿主细胞包括(但不限于)：细菌细胞、藻类细胞、植物细胞、真菌细胞、昆虫细胞和哺乳动物细胞。在一个示例性实施例中，适合的宿主细胞包括大肠杆菌(例如SHuffle^TM胜任型大肠杆菌，其获自马萨诸塞州伊普威治的新英格兰生物实验室(NewEngland BioLabs,Ipswich,Mass.))。

本公开的其它适合宿主生物体包括棒状杆菌属的微生物。在一些实施例中，优选的棒状杆菌属菌株/菌种包括：有效棒状杆菌(C.efficiens)，保藏模式菌株是DSM44549；谷氨酸棒状杆菌，保藏模式菌株是ATCC13032；以及产氨棒状杆菌(C.ammoniagenes)，保藏模式菌株是ATCC6871。在一些实施例中，本公开的优选宿主是谷氨酸棒状杆菌。在一些实施例中，本公开教示了志贺杆菌属(Shigella)的宿主细胞，包括弗氏志贺杆菌(Shigellaflexneri)、痢疾志贺杆菌(Shigella dysenteriae)、鲍氏志贺杆菌(Shigella boydii)和索氏志贺杆菌(Shigella sonnei)。

棒状杆菌属(具体地说，谷氨酸棒状杆菌菌种)中的适合宿主菌株尤其是已知的野生型菌株：谷氨酸棒状杆菌ATCC13032、醋麸酸棒状杆菌(Corynebacteriumacetoacidophilum)ATCC15806、嗜乙酰乙酸棒状杆菌(Corynebacteriumacetoacidophilum)ATCC13870、糖蜜棒状杆菌(Corynebacterium melassecola)ATCC17965、产热氨棒状杆菌(Corynebacterium thermoaminogenes)FERM BP-1539、黄色短杆菌(Brevibacterium flavum)ATCC14067、乳酸发酵短杆菌(Brevibacteriumlactofermentum)ATCC13869和分歧短杆菌(Brevibacterium divaricatum)ATCC14020；以及由其制备的产L-氨基酸突变体或菌株，例如产L-赖氨酸菌株：谷氨酸棒状杆菌FERM-P1709、黄色短杆菌FERM-P 1708、乳酸发酵短杆菌FERM-P 1712、谷氨酸棒状杆菌FERM-P6463、谷氨酸棒状杆菌FERM-P6464、谷氨酸棒状杆菌DM58-1、谷氨酸棒状杆菌DG52-5、谷氨酸棒状杆菌DSM5714和谷氨酸棒状杆菌DSM12866。

对于谷氨酸棒状杆菌来说，术语“谷氨酸微球菌”也已在使用。物种有效棒状杆菌的一些代表例在现有技术中也称为产热氨棒状杆菌，如菌株FERM BP-1539。

在一些实施例中，本公开的宿主细胞是真核细胞。适合的真核生物宿主细胞包括(但不限于)：真菌细胞、藻类细胞、昆虫细胞、动物细胞和植物细胞。适合的真菌宿主细胞包括(但不限于)：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、半知菌门(Deuteromycota)、接合菌门(Zygomycota)、不完全菌类(Fungi imperfecti)。某些优选的真菌宿主细胞包括酵母细胞和丝状真菌细胞。适合的丝状真菌宿主细胞包括例如真菌门(Eumycotina)和卵菌门(Oomycota)亚门的任何丝状形式。(参见例如霍克索斯(Hawksworth)等人，安·贝氏真菌词典(Ainsworth and Bisby's Dictionary of TheFungi)，第8版，1995年，CAB国际，大学出版社，英国剑桥(CAB International,UniversityPress,Cambridge,UK)，其以引用的方式并入本文中)。丝状真菌的特征是营养菌丝体，其细胞壁由甲壳素、纤维素和其它复杂多糖组成。丝状真菌宿主细胞在形态上不同于酵母。

在某些说明性但非限制性的实施例中，丝状真菌宿主细胞可以是以下物种的细胞：棉霉属(Achlya)、枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢霉属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内斯菌属(Endothis)、镰孢菌属(Fusarium)、赤霉属(Gibberella)、胶霉属(Gliocladium)、腐殖菌属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)(例如嗜热毁丝霉(Myceliophthorathermophila))、白霉菌属(Mucor)、脉孢菌属(Neurospora)、青霉属(Penicillium)、柄孢壳属(Podospora)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨胞霉属(Pyricularia)、根毛霉属(Rhizomucor)、根霉菌属(Rhizopus)、裂殖菌属(Schizophyllum)、革节孢属(Scytalidium)、孢子丝菌属(Sporotrichum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、栓菌属(Tramates)、弯颈霉菌属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)，或其有性型或无性型，以及其同义词或分类同等物。

适合的酵母宿主细胞包括(但不限于)：念珠菌属(Candida)、汉逊酵母属(Hansenula)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)和耶氏酵母属(Yarrowia)。在一些实施例中，酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母(Saccharomycescerevisiae)、卡氏酵母(Saccaromyces carlsbergensis)、糖化酵母(Saccharomycesdiastaticus)、洛本酵母(Saccharomyces norbensis)、克鲁维酵母(Saccharomyceskluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichiapastoris)、芬兰毕赤酵母(Pichia finlandica)、嗜海藻糖毕赤酵母(Pichiatrehalophila)、考达毕赤酵母(Pichia kodamae)、膜醭毕赤酵母(Pichiamembranaefaciens)、幸运毕赤酵母(Pichia opuntiae)、耐热毕赤酵母(Pichiathermotolerans)、萨利毕赤酵母(Pichia salictaria)、松栎毕赤酵母(Pichiaquercuum)、皮吉毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、嗜甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色念珠菌(Candida albicans)或解脂耶氏酵母(Yarrowialipolytica)。

在某些实施例中，宿主细胞是藻类，如衣藻属(Chlamydomonas)(例如莱茵衣藻(C.Reinhardtii))和席藻属(Phormidium)(席藻种ATCC29409)。

在其它实施例中，宿主细胞是原核细胞。适合的原核生物细胞包括革兰氏阳性、革兰氏阴性和革兰氏变异性细菌细胞。宿主细胞可以是(但不限于)以下物种：土壤杆菌属(Agrobacterium)、脂环杆菌属(Alicyclobacillus)、念珠藻属(Anabaena)、倒囊藻属(Anacystis)、不动杆菌属(Acinetobacter)、酸热菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、布赫纳氏菌属(Buchnera)、平原菟丝子(Campestris)、弯曲杆菌属(Camplyobacter)、梭菌属(Clostridium)、棒状杆菌属、红色硫黃细菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏杆菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文菌属(Erwinia)、梭杆菌属(Fusobacterium)、粪栖杆菌属(Faecalibacterium)、弗朗西斯氏菌属(Francisella)、黄杆菌属(Flavobacterium)、土芽孢杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺旋杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中间根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属、罗斯氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅列藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、聚球藻属(Synecoccus)、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺杆菌属(Shigella)、嗜热厌氧杆菌属(Thermoanaerobacterium)、养障体(Tropheryma)、土拉热(Tularensis)、蒂梅丘拉(Temecula)、嗜热聚球藻属(Thermosynechococcus)、热球菌属(Thermococcus)、脲原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)和发酵单胞菌属(Zymomonas)。在一些实施例中，宿主细胞是谷氨酸棒状杆菌。

在一些实施例中，宿主菌株是细菌宿主菌株。在一些实施例中，细菌宿主菌株是工业菌株。已知多种细菌工业菌株且其适用于本文所述的方法和组合物中。

在一些实施例中，细菌宿主细胞是土壤杆菌属物种(例如土壤放射杆菌(A.radiobacter)、发根土壤杆菌(A.rhizogenes)、悬钩子土壤杆菌(A.rubi))、节杆菌属物种(例如金黄节杆菌(A.aurescens)、柠檬节杆菌(A.citreus)、球形节杆菌(A.globformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、畏光节杆菌(A.protophonniae)、玫瑰色石蜡节杆菌(A.roseoparaffinus)、硫磺节杆菌(A.sulfureus)、产脲节杆菌(A.ureafaciens))、芽孢杆菌属物种(例如苏云金芽孢杆菌(B.thuringiensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草芽孢杆菌(B.subtilis)、迟缓芽胞杆菌(B.lentus)、环状芽孢杆菌(B.circulars)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短小芽孢杆菌(B.brevis)、强固芽胞杆菌(B.firmus)、嗜碱芽孢杆菌(B.alkaophius)、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、耐盐嗜碱芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌(B.amyloliquefaciens)。在具体实施例中，宿主细胞是工业芽孢杆菌属菌株，包括(但不限于)枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌和解淀粉芽孢杆菌。在一些实施例中，宿主细胞是工业梭菌属物种(例如丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌E88(C.tetani E88)、象牙海岸梭菌(C.lituseburense)、糖丁酸梭菌(C.saccharobutylicum)、产气荚膜梭菌(C.perfringens)、拜氏梭菌(C.beijerinckii))。在一些实施例中，宿主细胞是工业棒状杆菌属菌种(例如谷氨酸棒状杆菌、嗜乙酰乙酸棒状杆菌)。在一些实施例中，宿主细胞是工业埃希氏杆菌属物种(例如大肠杆菌)。在一些实施例中，宿主细胞是工业欧文菌属(Erwinia)菌种(例如噬夏孢欧文菌(E.uredovora)、胡萝卜软腐欧文菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文菌(E.herbicola)、点状欧文菌(E.punctata)、土生欧文菌(E.terreus))。在一些实施例中，宿主细胞是工业泛菌属物种(例如柠檬泛菌(P.citrea)、成团泛菌(P.agglomerans))。在一些实施例中，宿主细胞是工业假单胞菌属(Pseudomonas)物种(例如恶臭假单胞菌(P.putida)、铜绿假单胞菌(P.aeruginosa)、迈氏假单胞菌(P.mevalonii))。在一些实施例中，宿主细胞是工业链球菌属物种(例如类马链球菌(S.equisimiles)、酿脓链球菌(S.pyogenes)、***链球菌(S.uberis))。在一些实施例中，宿主细胞是工业链霉菌属菌种(例如产二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌(S.avermitilis)、天蓝色链霉菌(S.coelicolor)、金霉素链霉菌(S.aureofaciens)、金黄色葡萄球菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)、变铅青链霉菌(S.lividans))。在一些实施例中，宿主细胞是工业发酵单胞菌属(Zymomonas)物种(例如运动发酵单胞菌(Z.mobilis)、解脂发酵单胞菌(Z.lipolytica))等等。

在各种实施例中，公众容易从多个培养物保藏中心获得可以用于实施本公开的菌株(包括原核和真核菌株)，如美国菌种保藏中心(American Type Culture Collection，ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen andZellkulturen GmbH，DSM)、荷兰微生物菌种保藏中心(Centraalbureau VoorSchimmelcultures，CBS)以及美国农业研究菌种保藏中心(Agricultural ResearchService Patent Culture Collection)、北方区域研究中心(Northern RegionalResearch Center，NRRL))。

在一些实施例中，本公开的方法也适用于多细胞生物体。举例来说，所述平台可以用于改良农作物的性能。生物体可以包含多种植物，如禾本亚目(Gramineae)、非突亚科(Fetucoideae)、颇考亚科(Poacoideae)、剪股颖属(Agrostis)、梯牧草属(Phleum)、鸡脚茅属(Dactylis)、高粱属(Sorgum)、狗尾草属(Setaria)、玉蜀黍属(Zea)、稻属(Oryza)、小麦属(Triticum)、黑麦属(Secale)、燕麦属(Avena)、大麦属(Hordeum)、蔗属(Saccharum)、早熟禾属(Poa)、羊茅属(Festuca)、钝叶草属(Stenotaphrum)、狗牙根属(Cynodon)、薏苡属(Coix)、莪利竹族(Olyreae)、原禾族(Phareae)、菊科(Compositae)或豆科(Leguminosae)。举例来说，植物可以是玉米、稻米、大豆、棉花、小麦、黑麦、燕麦、大麦、豌豆、菜豆、小扁豆、花生、地瓜、豇豆、绒毛豆、三叶草、苜蓿、羽扇豆、野豌豆、莲藕、草木樨、紫藤、香豌豆、高粱、小米、葵花、芥花或其类似物。类似地，生物体可以包括多种动物，如非人类哺乳动物、鱼、昆虫等。

大肠杆菌宿主细胞

如上所提及，大肠杆菌宿主细胞可以用于本公开的实施例中。

举例来说，大肠杆菌物种的适合宿主菌株包含：产肠毒素大肠杆菌(Enterotoxigenic E.coli，ETEC)、肠病原体大肠杆菌(Enteropathogenic E.coli，EPEC)、肠侵袭性大肠杆菌(Enteroinvasive E.coli，EIEC)、肠出血性大肠杆菌Enterohemorrhagic E.coli，EHEC)、尿道致病性大肠杆菌(Uropathogenic E.coli，UPEC)、产维罗毒素大肠杆菌(Verotoxin-producing E.coli)、大肠杆菌O157:H7、大肠杆菌O104:H4、大肠杆菌O121、大肠杆菌O104:H21、大肠杆菌K1和大肠杆菌NC101。在一些实施例中，本公开教示了大肠杆菌K12、大肠杆菌B和大肠杆菌C的基因组工程化。

在一些实施例中，本公开教示了以下大肠杆菌菌株的基因组工程化：NCTC 12757、NCTC 12779、NCTC 12790、NCTC 12796、NCTC 12811、ATCC 11229、ATCC 25922、ATCC 8739、DSM 30083、BC 5849、BC 8265、BC 8267、BC 8268、BC 8270、BC 8271、BC 8272、BC 8273、BC8276、BC 8277、BC 8278、BC 8279、BC 8312、BC 8317、BC 8319、BC 8320、BC 8321、BC 8322、BC 8326、BC 8327、BC 8331、BC 8335、BC 8338、BC 8341、BC 8344、BC 8345、BC 8346、BC8347、BC 8348、BC 8863和BC 8864。

在一些实施例中，本公开教示了维罗毒素致病性大肠杆菌(VTEC)，例如菌株BC4734(O26:H11)、BC 4735(O157:H-)、BC 4736、BC 4737(n.d.)、BC 4738(O157:H7)、BC 4945(O26:H-)、BC 4946(O157:H7)、BC 4947(O111:H-)、BC 4948(O157:H)、BC 4949(O5)、BC5579(O157:H7)、BC 5580(O157:H7)、BC 5582(O3:H)、BC 5643(O2:H5)、BC 5644(O128)、BC5645(O55:H-)、BC 5646(O69:H-)、BC 5647(O101:H9)、BC 5648(O103:H2)、BC 5850(O22:H8)、BC 5851(O55:H-)、BC 5852(O48:H21)、BC 5853(O26:H11)、BC 5854(O157:H7)、BC5855(O157:H-)、BC 5856(O26:H-)、BC 5857(O103:H2)、BC 5858(O26:H11)、BC 7832、BC7833(O原始形式:H-)、BC 7834(ONT:H-)、BC 7835(O103:H2)、BC 7836(O57:H-)、BC 7837(ONT:H-)、BC 7838、BC 7839(O128:H2)、BC 7840(O157:H-)、BC 7841(O23:H-)、BC 7842(O157:H-)、BC 7843、BC 7844(O157:H-)、BC 7845(O103:H2)、BC 7846(O26:H11)、BC 7847(O145:H-)、BC 7848(O157:H-)、BC 7849(O156:H47)、BC 7850、BC 7851(O157:H-)、BC 7852(O157:H-)、BC 7853(O5:H-)、BC 7854(O157:H7)、BC 7855(O157:H7)、BC 7856(O26:H-)、BC7857、BC 7858、BC 7859(ONT:H-)、BC 7860(O129:H-)、BC 7861、BC 7862(O103:H2)、BC7863、BC 7864(O原始形式:H-)、BC 7865、BC 7866(O26:H-)、BC 7867(O原始形式:H-)、BC7868、BC 7869(ONT:H-)、BC 7870(O113:H-)、BC 7871(ONT:H-)、BC 7872(ONT:H-)、BC7873、BC 7874(O原始形式:H-)、BC 7875(O157:H-)、BC 7876(O111:H-)、BC 7877(O146:H21)、BC 7878(O145:H-)、BC 7879(O22:H8)、BC 7880(O原始形式:H-)、BC 7881(O145:H-)、BC 8275(O157:H7)、BC 8318(O55:K-:H-)、BC 8325(O157:H7)和BC 8332(ONT)、BC 8333。

在一些实施例中，本公开教示了肠侵袭性大肠杆菌(EIEC)，例如菌株BC 8246(O152:K-:H-)、BC 8247(O124:K(72):H3)、BC 8248(O124)、BC 8249(O112)、BC 8250(O136:K(78):H-)、BC 8251(O124:H-)、BC 8252(O144:K-:H-)、BC 8253(O143:K:H-)、BC 8254(O143)、BC 8255(O112)、BC 8256(O28a.e)、BC 8257(O124:H-)、BC 8258(O143)、BC 8259(O167:K-:H5)、BC 8260(O128a.c.:H35)、BC 8261(O164)、BC 8262(O164:K-:H-)、BC 8263(O164)和BC 8264(O124)。

在一些实施例中，本公开教示了产肠毒素大肠杆菌(ETEC)，例如菌株BC 5581(O78:H11)、BC 5583(O2:K1)、BC 8221(O118)、BC 8222(O148:H-)、BC 8223(O111)、BC 8224(O110:H-)、BC 8225(O148)、BC 8226(O118)、BC 8227(O25:H42)、BC 8229(O6)、BC 8231(O153:H45)、BC 8232(O9)、BC 8233(O148)、BC 8234(O128)、BC 8235(O118)、BC 8237(O111)、BC 8238(O110:H17)、BC 8240(O148)、BC 8241(O6H16)、BC 8243(O153)、BC 8244(O15:H-)、BC 8245(O20)、BC 8269(O125a.c:H-)、BC 8313(O6:H6)、BC 8315(O153:H-)、BC8329、BC 8334(O118:H12)和BC 8339。

在一些实施例中，本公开教示了肠病原体大肠杆菌(EPEC)，例如菌株BC 7567(O86)、BC 7568(O128)、BC 7571(O114)、BC 7572(O119)、BC 7573(O125)、BC 7574(O124)、BC 7576(O127a)、BC 7577(O126)、BC 7578(O142)、BC 7579(O26)、BC 7580(OK26)、BC 7581(O142)、BC 7582(O55)、BC 7583(O158)、BC 7584(O-)、BC 7585(O-)、BC 7586(O-)、BC8330、BC 8550(O26)、BC 8551(O55)、BC 8552(O158)、BC 8553(O26)、BC 8554(O158)、BC8555(O86)、BC 8556(O128)、BC 8557(OK26)、BC 8558(O55)、BC 8560(O158)、BC 8561(O158)、BC 8562(O114)、BC 8563(O86)、BC 8564(O128)、BC 8565(O158)、BC 8566(O158)、BC 8567(O158)、BC 8568(O111)、BC 8569(O128)、BC 8570(O114)、BC 8571(O128)、BC 8572(O128)、BC 8573(O158)、BC 8574(O158)、BC 8575(O158)、BC 8576(O158)、BC 8577(O158)、BC 8578(O158)、BC 8581(O158)、BC 8583(O128)、BC 8584(O158)、BC 8585(O128)、BC 8586(O158)、BC 8588(O26)、BC 8589(O86)、BC 8590(O127)、BC 8591(O128)、BC 8592(O114)、BC8593(O114)、BC 8594(O114)、BC 8595(O125)、BC 8596(O158)、BC 8597(O26)、BC 8598(O26)、BC 8599(O158)、BC 8605(O158)、BC 8606(O158)、BC 8607(O158)、BC 8608(O128)、BC 8609(O55)、BC 8610(O114)、BC 8615(O158)、BC 8616(O128)、BC 8617(O26)、BC 8618(O86)、BC 8619、BC 8620、BC 8621、BC 8622、BC 8623、BC 8624(O158)和BC 8625(O158)。

细胞发酵和培养

包括如本文所述进行基因工程化的微生物的本公开的微生物可以在适当时针对任何所需生物合成反应或选择进行改良的常规营养培养基中培养。在一些实施例中，本公开教示了在诱导型培养基中培养用于活化启动子。在一些实施例中，本公开教示了具有选择剂，包括转化体的选择剂(例如抗生素)或选择适合于在抑制条件(例如高乙醇条件)下生长的生物体的培养基。在一些实施例中，本公开教示了使细胞培养物在针对细胞生长优化的培养基中生长。在其它实施例中，本公开教示了细胞培养物在针对例如来源于葡萄糖代谢加工的所关注的产物或生物分子的产物产量优化的培养基中生长。在一些实施例中，本公开教示了培养物在能够诱导细胞生长并且还含有最终产物产生所需的前体(例如高水平糖以产生乙醇)的培养基中生长。

本文所提供的方法产生的所关注的生物分子或产物可以是葡萄糖产生的任何商品。在一些情况下，所关注的生物分子或产物是小分子、氨基酸、有机酸或醇。氨基酸可以是(不限于)酪氨酸、苯丙氨酸、色氨酸、天冬氨酸、天冬酰胺、苏氨酸、异亮氨酸、甲硫氨酸或赖氨酸。在特定实施例中，氨基酸是赖氨酸。在某些方面，赖氨酸是L-赖氨酸。有机酸可以是(不限于)丁二酸、乳酸或丙酮酸。醇可以是(不限于)乙醇或异丁醇。

培养条件(如温度、pH值等)是适合与选择用于表达的宿主细胞联合使用的那些条件，并且是所属领域的技术人员所显而易见的。如所提及，许多参考文献可供用于培养和产生许多细胞，包括细菌、植物、动物(包括哺乳动物)和古细菌来源的细胞。参见例如萨布鲁克(Sambrook)，奥斯贝(Ausubel)(所有均见上文)以及伯杰(Berger)，《分子克隆技术指南(Guide to Molecular Cloning Techniques)》，《酶学方法(Methods in Enzymology)》，第152卷，学术出版社有限公司(Academic Press,Inc.)，加利福尼亚州圣地亚哥(San Diego,CA)；以及弗瑞旭尼(Freshney)(1994)，《动物细胞的培养：基本技术手册(Culture ofAnimal Cells,a Manual of Basic Technique)》，第三版，纽约威立-利斯(Wiley-Liss,New York)和其中引用的参考文献；多伊尔(Doyle)和格里菲思(Griffiths)(1997)，《哺乳动物细胞培养：基本技术(Mammalian Cell Culture:Essential Techniques)》，约翰·威利父子出版公司(John Wiley and Sons)，纽约州(NY)；忽玛逊(Humason)(1979)，《动物组织技术(Animal Tissue Techniques)》，第四版，W.H.弗里曼公司(W.H.Freeman andCompany)；以及里奇埃德尔(Ricciardelle)等人，(1989)，体外细胞发育生物学(In VitroCell Dev.Biol.)25:1016-1024，所有文献均以引用的方式并入本文中。关于植物细胞培养和再生，参见派恩(Payne)等人(1992)，《液体系统中的植物细胞和组织培养(Plant Celland Tissue Culture in Liquid Systems)》，约翰·威利父子公司(John Wiley&Sons,Inc.)，纽约州纽约市(New York,N.Y.)；冈堡(Gamborg)和菲利浦(Phillips)(编)(1995)，《植物细胞、组织和器官培养：基本方法(Plant Cell,Tissue and Organ Culture；Fundamental Methods)》，施普林格实验室手册(Springer Lab Manual)，施普林格出版社(Springer-Verlag)(柏林海德堡，纽约)；琼斯(Jones)编(1984)，《植物基因转移和表达方案(Plant Gene Transfer and Expression Protocols)》，胡马纳出版社(Humana Press)，新泽西州特图瓦市(Totowa,N.J.)以及《植物分子生物学(Plant Molecular Biology)》(1993)R.R.D.克洛(R.R.D.Croy)编，生物科学出版社(Bios Scientific Publishers)，英国牛津(Oxford,U.K.)ISBN 0 12 198370 6，所有文献均以引用的方式并入本文中。细胞培养基一般性地阐述于阿特拉斯(Atlas)和帕克斯(Parks)(编)，《微生物培养基手册(TheHandbook of Microbiological Media)》(1993)CRC出版社，佛罗里达州波卡拉顿(BocaRaton,Fla.)，所述文献以引用的方式并入本文中。用于细胞培养的额外信息见于可获得的商业文献中，如得自西格玛-奥德里奇公司(Sigma-Aldrich,Inc)(密苏里州圣路易(StLouis,Mo.))的《生命科学研究细胞培养目录(Life Science Research Cell CultureCatalogue)》(“西格马-LSRCCC”)以及例如也得自西格玛-奥德里奇公司(密苏里州圣路易)的《植物培养目录和增刊(The Plant Culture Catalogue and supplement)》(“西格马-PCCS”)，所述文献都以引用的方式并入本文中。

待用的培养基或发酵培养基必须以适合方式满足相应菌株的需求。用于各种微生物的培养基的描述存在于美国细菌学学会(American Society for Bacteriology)(美国华盛顿哥伦比亚特区，1981)的《通用细菌学方法手册(Manual of Methods for GeneralBacteriology)》中。术语培养基和发酵培养基可互换。

在一些实施例中，本公开教示了所产生的微生物可以连续培养，如例如在WO05/021772中所述，或者以分批法(分批培养)或分批进料或重复分批进料法不连续地培养，以产生所需有机化合物。关于已知培养方法的通用性质的概述可获得于希米尔(Chmiel)的教科书(《生物技术进展1：生物过程技术中的引入(Bioprozeβtechnik.1:Einführung in dieBioverfahrenstechnik)》(古斯塔夫·费希尔出版社(Gustav Fischer Verlag),斯图加特(Stuttgart),1991))或斯托哈思(Storhas)的教科书(《生物反应器和***设施(Bioreaktoren and periphere Einrichtungen)》(维尤戈出版社(Vieweg Verlag),不伦瑞克(Braunschweig)/威斯巴登(Wiesbaden),1994))。

在一些实施例中，本公开的细胞是在分批或连续发酵条件下生长。经典的分批发酵是一种封闭系统，其中在发酵开始时设定培养基的组成并且在发酵期间不进行人工改变。分批系统的一种变化形式是分批进料发酵，其也可以用于本发明中。在这种变化形式中，随着发酵进展，按增量添加底物。当代谢物抑制可能会抑制细胞代谢时并且在期望培养基中的底物的量有限的情况下，分批进料系统是适用的。分批和分批进料发酵是所属领域中常见且众所周知的。连续发酵是一种系统，其中将所定义的发酵培养基连续地添加到生物反应器中并且同时移出等量的改良性培养基以供加工和收获所需蛋白质。在一些实施例中，连续发酵通常使培养物维持在恒定的高密度下，其中细胞主要处于对数生长期。在一些实施例中，连续发酵通常使培养物维持稳定期或对数后期/稳定期生长。连续发酵系统力求维持稳态生长条件。

连续发酵工艺中用于调节营养物和生长因子的方法以及使产物形成速率最大化的技术在工业微生物学领域中是众所周知的。

举例来说，本公开的培养物的碳源的非限制性清单包括糖类和碳水化合物，例如葡萄糖、蔗糖、乳糖、果糖、麦芽糖、糖蜜、来自甜菜或甘蔗加工的含蔗糖溶液、淀粉、淀粉水解产物和纤维素；油和脂肪，例如大豆油、葵花油、花生油和椰脂；脂肪酸，例如棕榈酸、硬脂酸和亚油酸；醇类，例如甘油、甲醇和乙醇；以及有机酸，例如乙酸或乳酸。

用于本公开的培养物的氮源的非限制性清单包括含有机氮的化合物，如蛋白胨、酵母萃取物、肉萃取物、麦芽萃取物、玉米浆、大豆粉和尿素；或无机化合物，如硫酸铵、氯化铵、磷酸铵、碳酸铵和硝酸铵。氮源可以个别地使用或作为混合物使用。

用于本公开的培养物的可能磷源的非限制性清单包括磷酸、磷酸二氢钾或磷酸氢二钾或相应含钠盐。培养基可以另外包含生长所需的盐，例如呈氯化物形式的盐，或金属(例如钠、钾、镁、钙和铁)硫酸盐，例如硫酸镁或硫酸铁。最后，除上述物质之外，可以使用必需生长因子，如氨基酸，例如高丝氨酸和维生素，例如硫胺、生物素或泛酸。

在一些实施例中，培养物的pH值可以利用任何酸或碱或缓冲盐，包括(但不限于)氢氧化钠、氢氧化钾、氨或氨水，或酸性化合物，如磷酸或硫酸，通过适合方式来控制。在一些实施例中，pH值通常调节到6.0至8.5的值，优选6.5至8。

在一些实施例中，本公开的培养物可以包括消泡剂，例如脂肪酸聚二醇酯。在一些实施例中，本公开的培养物通过添加适合的选择性物质(例如抗生素)来调节以使培养物中的质粒稳定。

在一些实施例中，在好氧条件下进行培养。为了维持这些条件，将氧气或含氧气体混合物，例如空气引入培养物中。同样可以使用富含过氧化氢的液体。适当时，在高压下，例如在0.03至0.2MPa的高压下进行发酵。培养物的温度通常是20℃至45℃并且优选25℃至40℃，特别优选30℃至37℃。在分批或分批进料工艺中，培养优选持续至已经形成足以回收的量的所关注的期望产物(例如有机化合物)为止。此目的通常可以在10小时至160小时内实现。在连续工艺中，更长的培养时间是可能的。微生物的活性使得所关注的产物在发酵培养基中和/或在所述微生物的细胞中浓缩(积累)。

在一些实施例中，在厌氧条件下进行培养。

筛选

在一些实施例中，本公开教示了高通量初始筛选。在其它实施例中，本公开还教示了稳固的基于槽罐的性能数据验证。

在一些实施例中，设计高通量筛选方法以预测菌株在生物反应器中的性能。如此前所述，选择适于生物体并且反映生物反应器条件的培养条件。挑选个别菌落并且转移到96孔板中并且培育适合的时间量。随后将细胞转移到新的96孔板中用于额外的种子培养，或产生培养物。在可以进行多次测量的情况下，将培养物培育不同的时间长度。这些测量可以包括产物、生物质或预测菌株在生物反应器中的性能的其它特征的测量。使用高通量培养结果预测生物反应器性能。

在一些实施例中，使用基于槽罐的性能验证确认利用高通量筛选所分离的菌株的性能。发酵工艺/条件被设计成复制商用反应器条件。使用实验室规模发酵反应器，针对相关菌株性能特征，例如生产率或产量，筛选候选菌株。

产物回收和定量

针对所关注的产物的产生进行筛选的方法为所属领域的技术人员所知并且在本说明书中通篇论述。当筛选本公开的菌株时可以使用这类方法。本文所提供的方法产生的所关注的生物分子或产物可以是葡萄糖产生的任何商品。在一些情况下，所关注的生物分子或产物是氨基酸、有机酸或醇。氨基酸可以是(不限于)酪氨酸、苯丙氨酸、色氨酸、天冬氨酸、天冬酰胺、苏氨酸、异亮氨酸、甲硫氨酸或赖氨酸。在特定实施例中，氨基酸是赖氨酸。在某些方面，赖氨酸是L-赖氨酸。有机酸可以是(不限于)丁二酸、乳酸或丙酮酸。醇可以是(不限于)乙醇或异丁醇。

在一些实施例中，本公开教示了改良菌株的方法，所述菌株被设计成可产生非分泌性细胞内产物。举例来说，本公开教示了提高细胞培养物的稳定性、产量、效率或总体期望度，从而产生细胞内酶、油、医药或其它有价值的小分子或肽的方法。非分泌性细胞内产物的回收或分离可以利用所属领域中众所周知的溶解和回收技术，包括本文所述的那些技术来实现。

举例来说，在一些实施例中，本公开的细胞可以利用离心、过滤、沉降或其它方法收获。所收获的细胞接着利用任何便利的方法破碎，包括冷冻-解冻循环、声波处理、机械破碎或使用细胞溶解剂，或所属领域的技术人员众所周知的其它方法。

所得到的所关注的产物(例如多肽)可以利用所属领域中已知的多种方法中的任一种回收/分离并且任选地加以纯化。举例来说，可以利用常规程序从营养培养基中分离出产物多肽，所述常规程序包括(但不限于)：离心、过滤、萃取、喷雾干燥、蒸发、色谱(例如离子交换、亲和、疏水性相互作用、色谱焦聚和尺寸排阻)或沉淀。最后，可以在最后纯化步骤中使用高效液相色谱(HPLC)。(参见例如细胞内蛋白质的纯化(Purification ofintracellular protein)，如帕瑞(Parry)等人，2001，《生物化学杂志(Biochem.J.)》353:117和洪(Hong)等人，2007，《应用微生物学和生物技术(Appl.Microbiol.Biotechnol.)》73:1331中所述，两个文献均以引用的方式并入本文中)。

除上文提及的参考文献之外，多种纯化方法在所属领域中是众所周知的，包括例如以下文献中所述的纯化方法：桑德纳(Sandana)(1997)，《蛋白质的生物分离(Bioseparation of Proteins)》，学术出版社有限公司；博拉格(Bollag)等人(1996)，《蛋白质方法(Protein Methods)》第2版，纽约州威立-利斯；沃克(Walker)(1996)，《蛋白质方案手册(The Protein Protocols Handbook)》，胡马纳出版社，新泽西州；哈里斯(Harris)和安格尔(Angal)(1990)，《蛋白质纯化应用：实用方法》(Protein PurificationApplications:A Practical Approach)，牛津IRL出版社，英国牛津；哈里斯和安格尔，蛋白质纯化方法：实用方法，牛津IRL出版社，英国牛津；斯科普斯(Scopes)(1993)，《蛋白质纯化：原理和实践(Protein Purification:Principles and Practice)》第3版，斯普林格出版社，纽约州；詹森(Janson)和赖登(Ryden)(1998)，《蛋白质纯化：原理、高分辨率方法和应用(Protein Purification:Principles,High Resolution Methods andApplications)》，第二版，威立-VCH，纽约州；以及沃克(Walker)(1998)，《CD-ROM上的蛋白质方案(Protein Protocols on CD-ROM)》，胡马纳出版社，新泽西州，所有文献以引用的方式并入本文中。

在一些实施例中，本公开教示了改良菌株的方法，所述菌株被设计成可产生分泌性产物。举例来说，本公开教示了提高细胞培养物的稳定性、产量、效率或总体期望度，从而产生有价值的小分子或肽的方法。

在一些实施例中，可以利用免疫学方法检测和/或纯化由本公开的细胞产生的分泌性或非分泌性产物。在一种实例方法中，将使用常规方法针对产物分子(例如针对胰岛素多肽或其免疫原性片段)产生的抗体固定于珠粒上，在使内切葡聚糖酶结合的条件下与细胞培养基混合，且沉淀。在一些实施例中，本公开教示了酶联免疫吸附分析(ELISA)的使用。

在其它相关实施例中，使用如以下文献中所公开的免疫色谱法：美国专利第5,591,645号、美国专利第4,855,240号、美国专利第4,435,504号、美国专利第4,980,298号，以及赛旺佩克(Se-Hwan Paek)等人，“一步免疫色谱快速分析的开发(Development ofrapid One-Step Immunochromatographic assay,)”,《方法Methods》，22，53-60，2000)，所述文献每一个以引用的方式并入本文中。通用的免疫色谱法通过使用两种抗体来检测试样。第一抗体存在于测试溶液中，或存在于由多孔膜制成的呈大致矩形形状的测试片末端的一部分处，其中有测试溶液滴落。这种抗体用胶乳颗粒或金胶体颗粒标记(这种抗体在下文中称为标记抗体)。当所滴落的测试溶液包括待检测的试样时，标记抗体识别试样从而与试样结合。试样与标记抗体的复合物通过毛细作用流向吸收剂，所述吸收剂由过滤纸制成并且连接到与已包括标记抗体的末端相对的末端。在流动期间，试样与标记抗体的复合物被存在于多孔膜中部的第二抗体(其在下文中称为轻敲抗体)识别且捕获，因此，复合物以可见信号的形式出现在多孔膜的检测部件上且被检测到。

在一些实施例中，本公开的筛选方法是基于光度检测技术(吸收、荧光)。举例来说，在一些实施例中，检测可以基于荧光团检测剂，如结合到抗体的GFP的存在。在其它实施例中，光度检测可以基于来自细胞培养的所期望产物的积累。在一些实施例中，可以通过培养物或得自所述培养物的提取物的UV检测到产物。

在一些实施例中，产物回收方法允许定量测定对每种候选gapA/转氢酶/gdh、asd、dapB和/或ddh基因的性能的作用。在一些实施例中，产物回收方法允许定量测定对每个候选gapA/转氢酶/gdh、asd、dapB和/或ddh基因组合的性能的作用，从而允许比较每个组合并且选择最佳组合。

表2中提供了经由本公开的方法和生物体产生和回收的产物的非限制性清单。

表2：本公开的产物(称为所关注的产物、所产生的化合物等)

所属领域中的技术人员将认识到，本公开的方法可与产生任何期望的所关注的生物分子产物的宿主细胞相容。

选择准则和目标

表达异源gapA/烟酰胺核苷酸转氢酶/苏氨酸醛缩酶/丙酮酸羧化酶/gdh、asd、dapB和/或ddh的宿主细胞的具体菌株的选择可以基于特定目标。举例来说，在一些实施例中，程序目标可以是最大化单次分批反应产量，无即刻时间限制。在其它实施例中，程序目标可以是生物合成产量的再平衡以产生特定产物，或产生特定的产物比率。在一些实施例中，程序目标可以是改良性能特征，如产量、效价、生产率、副产物消除、对过程偏移的容许性、最佳生长温度和生长速率。在一些实施例中，程序目标是改良宿主性能，如根据微生物所产生的所关注产物的体积生产率、比生产率、产量或力价所度量。

在其它实施例中，程序目标可以是就每一输入量的最终产物产量(例如每磅蔗糖所产生的乙醇总量)而言，优化商业菌株的合成效率。在其它实施例中，程序目标可以是优化合成速度，如根据例如分批完成速率或连续培养系统的产率所度量。在一个实施例中，程序目标是优化所关注的生物分子或产物的最终产物产量和/或生产速率。本文所提供的方法产生的所关注的生物分子或产物可以是葡萄糖产生的任何商品。在一些情况下，所关注的生物分子或产物是小分子、氨基酸、有机酸或醇。氨基酸可以是(不限于)酪氨酸、苯丙氨酸、色氨酸、天冬氨酸、天冬酰胺、苏氨酸、异亮氨酸、甲硫氨酸或赖氨酸。在特定实施例中，氨基酸是赖氨酸。在某些方面，赖氨酸是L-赖氨酸。在某些方面，苏氨酸是L-苏氨酸。有机酸可以是(不限于)丁二酸、乳酸或丙酮酸。醇可以是(不限于)乙醇或异丁醇。

所属领域中的技术人员将认识到如何定制菌株选择准则以满足具体项目目标。举例来说，按照反应饱和度选择菌株单批最大产量适于鉴别具有高单批产量的菌株。跨越一系列温度和条件，基于产量一致性的选择适用于鉴别稳定性和可靠性增强的菌株。

在一些实施例中，用于初始阶段和基于槽罐的验证的选择标准将是相同的。在其它实施例中，基于槽罐的选择可以依据额外和/或不同的选择准则运作。

测序

在一些实施例中，本公开教示了本文所述的生物体的全基因组测序。在其它实施例中，本公开还教示了质粒、PCR产物和其它寡核苷酸的测序，作为对本公开的方法的品质控制。大项目和小项目的测序方法是所属领域的技术人员众所周知的。

在一些实施例中，本公开的方法中可以使用用于核酸测序的任何高通量技术。在一些实施例中，本公开教示了全基因组测序。在其它实施例中，本公开教示了鉴别基因变异的扩增子测序超深度测序。在一些实施例中，本公开还教示了新颖的文库制备方法，包括添加标签(tagmentation)(参见WO/2016/073690)。DNA测序技术包括使用经标记的终止子或引物且在厚片或毛细管中进行凝胶隔离的经典双脱氧测序反应(桑格方法(Sangermethod))；使用可逆封端的经标记的核苷酸的边合成边测序、焦磷酸测序；454测序；与经标记的寡核苷酸探针的文库进行等位基因特异性杂交；使用与经标记的克隆的文库进行等位基因特异性杂交、随后进行连接的边合成边测序；在聚合步骤期间并入经标记的核苷酸的实时监测；聚合酶克隆测序(polony sequencing)；以及SOLiD测序。

在本发明的一个方面，使用高通量测序方法，其包含对上面进行并行测序的固体表面上的个别分子进行空间分离的步骤。这类固体表面可以包括无孔表面(如索莱萨测序(Solexa sequencing)，例如本特雷(Bentley)等人，自然，456:53-59(2008)，或全面基因组学测序(Complete Genomics sequencing)，例如德尔马纳茨(Drmanac)等人，科学，327:78-81(2010))；孔阵列，其可以包括珠粒或颗粒结合的模板(如用454，例如马古利斯(Margulies)等人，自然，437:376-380(2005)或离子激流测序(Ion Torrent sequencing)，美国专利公开2010/0137143或2010/0304982)；微机械加工的膜(如用SMRT测序，例如艾德(Eid)等人，科学，323:133-138(2009))，或珠粒阵列(如用SOLiD测序或聚合酶克隆测序，例如金(Kim)等人，科学，316:1481-1414(2007))。

在另一个实施例中，本公开的方法包含在对固体表面上的分子进行空间分离之前或之后，将经分离的分子扩增。先前扩增可以包含基于乳液的扩增，如乳液PCR，或滚环扩增。还教示了基于索莱萨的测序，其中对固体表面上的个别模板分子进行空间分离，随后通过桥式PCR对其进行并行扩增以形成单独的克隆群体或簇，且接着测序，如本特雷等人(上文引用)和制造商说明书(例如TruSeq^TM样品制备试剂盒和数据表，启迪公司(Illumina,Inc.)，加利福尼亚州圣地亚哥(San Diego,Calif.),2010)中所述；且进一步如以下参考文献所述：美国专利第6,090,592号、第6,300,070号、第7,115,400号；以及EP0972081B1，所述文献均以引用的方式并入本文。

在一个实施例中，安置于固体表面上并在固体表面上扩增的个别分子形成密度为每平方厘米至少10⁵个簇，或密度为每平方厘米至少5×10⁵个，或密度为每平方厘米至少10⁶个簇的簇。在一个实施例中，使用具有相对较高错误率的测序化学物质。在这类实施例中，这类化学物质所产生的平均品质分数是序列读段长度的单调下降函数。在一个实施例中，这类下降相当于0.5％的序列读段在位置1-75中具有至少一个错误；1％的序列读段在位置76-100中具有至少一个错误；且2％的序列读段在位置101-125中具有至少一个错误。

序列变体

在一些实施例中，经修饰的GAPDH包含与SEQ ID NO:58的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，经修饰的GAPDH包含与选自由SEQ IDNO:294、296、233、234、235、236、298和300组成的群组的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，其中gdh酶的变体包含与SEQ ID NO:42或44的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，其中asd的变异酶包含与SEQ ID NO:30或40的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，其中dapB的变异酶包含与SEQ ID NO:46或48的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，其中ddh的变异酶包含与SEQ ID NO:4的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在一些实施例中，gdh的变异酶包含与选自由SEQ ID NO:132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180和182组成的群组的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，asd的变异酶包含与选自由80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128和130组成的群组的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，苏氨酸醛缩酶的变异酶包含与选自由184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230和232组成的群组的氨基酸序列共享至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在一些实施例中，多拷贝复制质粒包含与SEQ ID NO:77的thrABC操纵子序列至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的序列。在一些实施例中，gapA的重组蛋白片段包含与选自由SEQ ID NO:233、234、235、236和298组成的群组的氨基酸序列至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的序列。

实例

以下实例是为了说明本发明的各种实施例而提供并且不希望以任何方式限制本公开。所属领域的技术人员将认识到涵盖于由权利要求书范围限定的本发明精神内的其中的变化和其它用途。

这些实例显示增加宿主细胞中所关注的产物的产生的方法，其受NADPH的可用性限制。本公开教示的方法可以用于增加在代谢路径中依赖于NADPH可用性的任何所关注的产物的产生。举例来说，本公开提供了增加例如L-赖氨酸或L-苏氨酸等氨基酸的产生的方法，所述氨基酸是产生受到细胞中的NADPH可用性限制的两种所关注的产物。

众所周知NADPH是细菌中L-赖氨酸和L-苏氨酸产生的限制因素。因此，这些实例说明了克服宿主细胞中的NADPH可用性的限制的六个策略，其增加L-赖氨酸或L-苏氨酸产生。这些策略是：(1)通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化；(2)在宿主细胞中表达由NADH产生NADPH的转氢酶；(3)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和/或asd酶的同源物，将作为赖氨酸、苏氨酸、异亮氨酸和甲硫氨酸前体的天冬氨酸半醛(ASA)的合成重编程；(4)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性dapB和/或ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程；(5)通过表达减少或逆转苏氨酸降解成甘氨酸的内源性ItA的同源物，将苏氨酸合成重编程；以及(6)表达异源丙酮酸羧化酶(PyC)或其同源物以增加草酰乙酸的合成，或增加内源性PyC的表达。在一个实施例中，目标生物体是大肠杆菌。在一个实施例中，目标生物体是棒状杆菌属。

下文提供了内容简表，仅仅是为了帮助读者。此内容表不意图限制本申请的实例或公开内容的范围。

表3-实例部分的内容表

实例1：加宽甘油醛3-磷酸脱氢酶(GAPDH)的辅酶特异性-赖氨酸

甘油醛-3-磷酸脱氢酶(GAPDH)是一种与中心碳代谢途径有关的酶。GAPDH最常见的形式是在迄今为止研究的所有生物体中发现的NAD依赖性酶gapA。此酶由gapA基因编码，并将甘油醛-3-磷酸转变成甘油酸-1,3-双磷酸。来自谷氨酸棒状杆菌的gapA酶的氨基酸序列如下：

MTIRVGINGFGRIGRNFFRAILERSDDLEVVAVNDLTDNKTLSTLLKFDSIMGRLGQEVEYDDDSITVGGKRIAVYAERDPKNLDWAAHNVDIVIESTGFFTDANAAKAHIEAGAKKVIISAPASNEDATFVYGVNHESYDPENHNVISGASCTTNCLAPMAKVLNDKFGIENGLMTTVHAYTGDQRLHDAPHRDLRRARAAAVNIVPTSTGAAKAVALVLPELKGKLDGYALRVPVITGSATDLTFNTKSEVTVESINAAIKEAAVGEFGETLAYSEEPLVSTDIVHDSHGSIFDAGLTKVSGNTVKVVSWYDNEWGYTCQLLRLTELVASKL(SEQ ID NO:58)。

如图1所示，gapA酶使用NAD作为辅酶，将甘油醛-3-磷酸转变成甘油酸-1,3-双磷酸。在此过程期间NAD转变成NADH。如图1中进一步所示，糖酵解途径加入生物合成途径，引起细菌中的L-赖氨酸产生。然而，如上文所论述，谷氨酸棒状杆菌下L-赖氨酸的生物技术产生中的关键因素是NADPH的充足供应。因而，增加谷氨酸棒状杆菌中的NADPH产生应该会增加L-赖氨酸的产生。一种实现此目标的方式将是改变谷氨酸棒状杆菌gapA的辅酶特异性，使得经修饰的酶使用NADP作为辅因子，结果细胞中产生更大量的NADPH。因此，本实验的目标是通过加宽gapA的辅酶特异性至包括NADP来提高谷氨酸棒状杆菌中的赖氨酸生产率。

先前的研究已显示谷氨酸棒状杆菌gapA中的D35G、L36T、T37K和P192S突变引起酶的辅酶特异性改变(从NAD至NADP)(博曼迪(Bomareddy R.R.)等人(2014),《代谢工程(Metab.Eng.)》,25:30-37)。产生谷氨酸棒状杆菌的几个菌株，每个菌株表达具有以上以上中的一或多个的gapA酶，如以下表4中所示。

与具有原生gapA的参考菌株相比，测试菌株产生L-赖氨酸的能力。发现单独或与L36T突变组合的T37K突变引起谷氨酸棒状杆菌gapA的辅酶特异性加宽，使得经修饰的酶显示对NAD和NADP两者的偏好，并且谷氨酸棒状杆菌中经修饰的酶的表达显著提高赖氨酸的生产率(图2)。下文描述谷氨酸棒状杆菌gapA突变菌株(T37K和L36T/T37K)的构建。

通过PCR，使用谷氨酸棒状杆菌的染色体DNA(ATCC 13032)作为模板，使用商业来源的寡核苷酸扩增gapA基因。将PCR片段装配至棒状杆菌属克隆载体中并使用标准的定点诱变技术诱变。最初使用标准的热休克转化技术将载体转化到大肠杆菌中，以便鉴别正确装配的克隆和扩增载体DNA用于棒状杆菌转化。

已验证的克隆通过电穿孔转化到谷氨酸棒状杆菌宿主细胞中。针对每次转化，测定每微克DNA的菌落形成单位(CFU)数目，其随***物尺寸而变。还分析棒状杆菌属基因组整合与同源臂长度的函数关系，且结果表明较短的臂具有较低的效率。

将被鉴别为已经成功整合***盒的棒状杆菌属培养物在含有卡那霉素的培养基上培养以进行反向选择，以便使卡那霉素抗性选择基因环出。

为了进一步验证环出事件，培养展现卡那霉素抗性的菌落并且通过测序加以分析。

在两种不同赖氨酸产生背景菌株亲代_2和亲代_1中，通过以上方法，产生几个突变菌株。表4描述引入每个亲本菌株真的特定突变。

表4：gapA突变体

针对在为了评估产物效价性能而设计的小规模培养(例如96孔板)中的赖氨酸产量来测试新产生的每个菌株和其亲代菌株。使用来自工业规模培养的培养基进行小规模培养。利用标准比色分析，在碳耗竭的情况下对产物效价进行光学测量(即，代表单一分批产量)。简单来说，制备浓缩的分析混合物并且添加到发酵样品中，使得试剂的最终浓度是160mM磷酸钠缓冲液、0.2mM安普莱荧光红(Amplex Red)、0.2U/mL辣根过氧化酶和0.005U/mL赖氨酸氧化酶。允许反应进行到终点并且使用Tecan M1000板式分光光度计在560nm波长下测量光学密度。实验结果概述于图2中。

具有赋予改变的针对NADP的辅酶特异性的某些突变的GAPDH的引入显著提高赖氨酸的生产率(图2)。菌株7000182994和7000184348各自含有T37K，并且性能比其相应的亲代亲代_1和亲代_2更佳。菌株7000182999和7000184352各自含有T37K和L36T，并且性能比其相应的亲代亲代_1和亲代_2更佳。菌株7000182997和7000184349各自含有P192S。菌株7000182998和7000184347各自含有L36T。

实例2：大肠杆菌K-12菌株W3110的产生苏氨酸的基础菌株的构建

如赖氨酸(以及甲硫氨酸、异亮氨酸和甘氨酸)一般，通向苏氨酸合成途径的初始步骤包括草酰乙酸转变成天冬氨酸，其使用通过谷氨酸脱氢酶(gdh)由2-酮戊二酸再生的谷氨酸。然后天冬氨酸盐转变成天冬氨酰磷酸，随后通过酶天冬氨酸半醛脱氢酶(asd)将天冬氨酰磷酸还原成天冬氨酸半醛(aspartate semialdehyde，ASA)。这些步骤是赖氨酸、苏氨酸、异亮氨酸和甲硫氨酸生物合成所通用的。除天冬氨酰磷酸经asd转变成ASA外，苏氨酸形成需要三个额外步骤：(1)通过双功能天冬氨酸激酶/高丝氨酸脱氢酶(thrA)使ASA转变成高丝氨酸；(2)通过高丝氨酸激酶(thrB)使高丝氨酸转变成L-高丝氨酸磷酸；以及最后(3)通过苏氨酸合成酶(thrC)使L-高丝氨酸磷酸转变成苏氨酸。最后这三个步骤独立于NADP/NADH运行。

首先使用野生型大肠杆菌K-12菌株W3110产生了产生苏氨酸的基础菌株。以两个步骤产生此苏氨酸基础菌株：首先，过表达原生的大肠杆菌thrLABC调控子(SEQ ID NO:76)，其由以下组成：thrL(富含苏氨酸和异亮氨酸密码子的前导序列，后面紧跟着用以防止编码酶的基因在操纵子中转录的功能性转录终止子)；thrA(双功能天冬氨酸激酶/高丝氨酸脱氢酶1)；thrB(高丝氨酸激酶)和thrC(苏氨酸合成酶)。通过PCR，使用商业来源的寡核苷酸，由W3110基因组DNA扩增此多核苷酸。将thrLABC操纵子***多拷贝复制质粒(经修饰的pUC19载体；SEQ ID NO:78)中，置于合成启动子pMB085(图8A；SEQ ID NO:75)的控制下。为了缓解表达的减弱，构建此质粒的变体，其中去除了thrL前导序列(图8B；SEQ ID NO:77)。其次，使编码L-苏氨酸3-脱氢酶(tdh)的大肠杆菌W3110染色体的区域缺失，tdh是一种通过催化L-苏氨酸氧化成2-氨基-3-酮丁酸来反对苏氨酸产生的酶。

为了评估所得到的W3110苏氨酸基础菌株W3110 pMB085thrLABCΔtdh(THR01；7000336113)和W3110 pMB085thrABCΔtdh(THR02；7000341282)中的苏氨酸产生，针对在为了评估产物效价性能而设计的小规模培养(例如96孔板)中的苏氨酸产量来测试每个菌株和其亲代(W3110；7000284155)。小规模(300μl)培养物在TPM1培养基中生长。TPM1培养基每升含有：葡萄糖，50g；酵母提取物，2g；MgSO₄.7H₂O，2g；KH₂PO₄，4g；(NH₄)2SO₄，14g；甜菜碱，1g；L-甲硫氨酸，0.149g；L-赖氨酸，0.164g；痕量金属溶液，5ml；以及CaCO₃，30g。痕量金属溶液每升含有：FeSO₄.7H₂O，10g；CaCl₂，1.35g；ZnSO₄.7H₂O，2.25g；MnSO₄.4H₂O，0.5g；CuSO₄.5H₂O，1g；(NH₄)6Mo₇O₂₄.4H₂O，0.106g；Na₂B₄O₇.10H₂O，0.23g；35％HCl，10ml。通过添加4N KOH将最终pH值调至7.2。需要时向培养基中添加氯胺苯醇(35μg/ml)、卡那霉素(40μg/ml)和安比西林(50μg/ml)。培养物在潮湿(80％湿度)INFORS HT Multitron Pro恒温振荡培养箱中在以1000rpm恒定搅动下在37℃下生长大约36小时。

在无细胞培养基的样品中，针对肽和蛋白质水解产物氨基酸使用AccQ·Tag(沃特斯公司(Waters Corp.)前置柱衍生和分析技术，确定苏氨酸效价。沃特斯AccQ·Fluor试剂用于衍生样品中存在的氨基酸。然后这些衍生物通过逆相HPLC分开并通过荧光检测来定量。通过使用Tecan M1000板式分光光度计，在660nm波长下测量光学密度(OD)来确定每个样品的生物质估计值，并且通过标准比色分析来确定最终葡萄糖浓度。简单来说，用如下最终浓度的试剂制备浓缩的分析混合物：175mM磷酸钠缓冲液pH 7.0；0.2mM安普莱荧光红(Chemodex CDX-A0022)；16U/mL来自黑曲霉(Aspergillus niger)的葡萄糖氧化酶(西格玛G7141)和0.2U/mL的辣根过氧化酶(VWR 0417-25000)。使反应在黑暗中在室温下进行30分钟并且使用Tecan M1000板式分光光度计在560nm波长下测量光学密度。以上培养条件和测量结果用于计算效价并估计在以下实例中描述的菌株的产量和生产率。

实例3：加宽甘油醛3-磷酸脱氢酶(GAPDH)的辅酶特异性-苏氨酸

实例2中描述的基础菌株用于以下实例实验。

甘油醛-3-磷酸脱氢酶(GAPDH)是一种与中心碳代谢途径有关的酶。GAPDH最常见的形式是在迄今为止研究的所有生物体中发现的NAD依赖性酶gapA。此酶由gapA基因编码，并将甘油醛-3-磷酸转变成甘油酸-1,3-双磷酸。

如图9所示，gapA酶使用NAD作为辅酶，将甘油醛-3-磷酸转变成甘油酸-1,3-双磷酸。在此过程期间NAD转变成NADH。如图9和图10A-C中进一步所示，糖酵解途径加入生物合成途径，引起细菌中的L-苏氨酸产生。然而，如上文所论述，大肠杆菌下L-苏氨酸的生物技术产生中的关键因素是NADPH的充足供应。因而，增加大肠杆菌中的NADPH产生应该会增加L-苏氨酸的产生。一种实现此目标的方式将是改变gapA的辅酶特异性，使得经修饰的酶使用NADP作为辅因子，结果细胞中产生更大量的NADPH。因此，本实验的目标是通过加宽gapA的辅酶特异性至包括NADP来提高大肠杆菌中的苏氨酸生产率。

先前的研究已显示谷氨酸棒状杆菌gapA中的D35G、L36T、T37K和P192S突变引起酶的辅酶特异性改变(从NAD至NADP)(博曼迪等人(2014),《代谢工程》,25:30-37)。来自谷氨酸棒状杆菌的gapA酶的氨基酸序列如下：

这里，产生大肠杆菌的几个菌株，每个表达具有以上突变中的一种的异源(谷氨酸棒状杆菌)gapA酶的变体：gapAv5(SEQ ID NO:69)、gapAv7(SEQ ID NO:71)或gapAv8(SEQID NO:73)，如以下表5中所示。

表5：在本研究中测试的突变和原生gapA变体

与具有原生大肠杆菌gapA(SEQ ID NO:67)的参考菌株(W3110thrABCΔtdh)相比，测试菌株产生L-苏氨酸的能力。发现所有三种变体gapAv5(SEQ ID NO:69)、gapAv7(SEQ IDNO:71)和gapAv8(SEQ ID NO:73)的表达独立引起苏氨酸效价显著提高(图11A)。下文描述大肠杆菌gapA突变菌株的构建。

通过PCR，使用商业来源的寡核苷酸，由棒状杆菌属克隆载体扩增gapA变体(gapAv5(SEQ ID NO:69)、gapAv7(SEQ ID NO:71)或gapAv8(SEQ ID NO:73))。由W3110基因组DNA扩增原生大肠杆菌gapA。将PCR片段装配至大肠杆菌克隆载体至经修饰的pUC19载体(编码以SEQ ID NO:70、72和74提供的多核苷酸序列)中，并且最初使用标准的热休克转化技术转化到NEB 10-β大肠杆菌细胞中，以便鉴别正确装配的克隆和扩增载体DNA用于转化到大肠杆菌W3110苏氨酸基础菌株THR01和THR02中。

如上所述针对小规模培养(例如96孔板)中的苏氨酸产生来测试新产生的每个菌株和其亲代菌株。

具有赋予改变的针对NADP的辅酶特异性的某些突变的GAPDH的引入显著提高苏氨酸效价(图11A)。菌株7000342726(gapAv5)、7000342720(gapAv7)和7000342727(gapAv8)的性能都比其亲代菌株(7000341282)和表达大肠杆菌gapA的第二拷贝的亲代(7000342723)更佳。

表6：gapA变体的苏氨酸生产率

菌株ID		效价	STDEV
				7000342726	gapAv5	19.04	8.33
7000342720	gapAv7	15.47	9.45
				7000342727	gapAv8	8.73	4.18
7000342723	Ec_gapA	0.79	1.37
				7000341282	thrABC	0.79	1.37
7000284155	W3110	0	0

实例4：通过利用对NADH具有辅因子特异性的变异酶将用于赖氨酸合成的DAP-途径重编程

引起细菌中L-赖氨酸产生的生物合成途径称为二氨基庚二酸(DAP)-途径(图1)。通向DAP-途径的初始步骤包括草酰乙酸转变成天冬氨酸，其使用通过谷氨酸脱氢酶(gdh)由2-酮戊二酸再生的谷氨酸。然后天冬氨酸转变成天冬氨酰磷酸，随后通过酶天冬氨酸半醛脱氢酶(asd)将天冬氨酰磷酸还原成天冬氨酸半醛(ASA)。这些步骤是赖氨酸、苏氨酸、异亮氨酸和甲硫氨酸生物合成所通用的。通向赖氨酸生物合成的第一定向步骤是在二氢吡啶甲酸合成酶催化下ASA转变成二氢吡啶甲酸(DHDP)。然后DHDP被二氢吡啶甲酸还原酶(dapB)还原成四氢吡啶甲酸(THDPA)。包括谷氨酸棒状杆菌在内的几种细菌具有酶内消旋-二氨基庚二酸脱氢酶(ddh)，其催化THDPA直接转变成内消旋-二氨基庚二酸(mDAP)，然后被二氨基庚二酸脱羧酶转变成L-赖氨酸。

如图1所示，原生谷氨酸棒状杆菌酶gdh、asd、dapB和ddh中的每一个需要NADPH作为辅酶用于其相应作用。然而，NADPH是以工业规模在谷氨酸棒状杆菌中由葡萄糖产生L-赖氨酸中的限制因素之一(贝克尔(Becker)等人(2005),《环境微生物学应用(Appl.Environ.Microbiol.)》,71(12):8587-8596)。因而，增加谷氨酸棒状杆菌中的NADPH产生应该会增加L-赖氨酸的产生。一种实现此目标的方式将是通过利用谷氨酸棒状杆菌酶gdh、asd、dapB和ddh的天然存在的同源物减少NADPH的利用，相比于NADPH，这些同源物更有效地使用NADH作为辅因子。因此，本实验的目标是加宽gdh、asd、dapB和ddh的辅酶依赖性以包括NADH以及NADPH。

谷氨酸棒状杆菌酶gdh和dapB分别在共生梭菌(利雷(Lilley K.S.)等人(1991),《生物化学与生物物理学报(Biochim Biophys Acta)》,1080(3):191-197)和大肠杆菌(雷迪(Reddy S.G.)等人(1995),《生物化学(Biochemistry)》,34(11):3492-3501)中具有已知的同源物，相比于NADPH，这些同源物更有效地使用NADH作为辅因子。不知谷氨酸棒状杆菌酶asd和ddh的此类同源物。因而，在细菌中进行全基因组同源性搜索，以找到谷氨酸棒状杆菌酶asd和ddh的氨基酸序列变体。对于asd和ddh每一种酶，同源性搜索得到9种变体。表7中概述变体的来源和其序列。gdh、asd、dapB和ddh的DNA序列相对于谷氨酸棒状杆菌进行密码子优化。

表7：途径同源物的来源和序列

对谷氨酸棒状杆菌gdh和dapB的已知同源物以及谷氨酸棒状杆菌asd和ddh的9种变体进行密码子优化以在谷氨酸棒状杆菌中表达。如图4中所示，gdh和dapB的两个型式各一个拷贝和asd和ddh的十个型式各一个拷贝以多种组合克隆至含有卡那霉素抗性标记基因的质粒中。在本实例中测试的酶的组合概述于表7中。

每个asd-gdh-dapB-ddh组合克隆至质粒(SEQ ID NO:51)中。图4示出一个示例性asd-gdh-dapB-ddh测试组合的盒排列。调控序列为SEQ ID NO:52-57。每个测试组合的最终盒可以如下从5'至3'端表示：

应注意，dapB和ddh等位基因的反向互补序列取向是表达盒排列的结果，并且不表示意图引发所述等位基因沉默。

表8：途径同源物的组合

最初使用标准的热休克转化技术将每个质粒转化到大肠杆菌中，以便鉴别正确装配的克隆和扩增载体DNA用于棒状杆菌转化。

将被鉴别为已经成功整合***盒的棒状杆菌属培养物在含有卡那霉素的培养基上培养以进行反向选择，以便使卡那霉素抗性选择基因环出。

为了进一步验证环出事件，培养展现卡那霉素抗性的菌落并且通过测序加以分析。

所有四种酶在谷氨酸棒状杆菌中同时表达。

含有每种酶的异源型式的重组菌株由3种不同亲代菌株制成，所有菌株都是基因上不同的赖氨酸生产菌株。针对在为了评估产物效价性能而设计的小规模培养(例如96孔板)中的赖氨酸产量来测试新产生的每种菌株和其亲代菌株。使用来自工业规模培养的培养基进行小规模培养。利用标准比色分析，在碳耗竭的情况下对产物效价进行光学测量(即，代表单一分批产量)。简单来说，制备浓缩的分析混合物并且添加到发酵样品中，使得试剂的最终浓度是160mM磷酸钠缓冲液、0.2mM安普莱荧光红、0.2U/mL辣根过氧化酶和0.005U/mL赖氨酸氧化酶。允许反应进行到终点并且使用帝肯(Tecan)M1000板式分光光度计在560nm波长下测量光学密度。实验结果呈现于表9中并且概述于图5A和图5B中。

两个谷氨酸棒状杆菌重组菌株7000186960和7000186992显示与相应的亲代-亲代_3和亲代_4相比，显著提高L-赖氨酸的生产率(图5A)，每个菌株含有谷氨酸棒状杆菌ddh的原生酶以及gdh、asd和dapB的相同3种异源酶(使用NADH的共生梭菌gdh和大肠杆菌dapB的已知型式以及来自敏捷乳杆菌的asd的变体)。关于不同酶的组合的作用的数据呈现于表9中，并且与亲代相比显著提高的酶组合以粗体突出。

表9：同源物组合的数据

4基因盒的两个型式引入谷氨酸棒状杆菌亲代_6中并且监测赖氨酸的产生。4种基因是基于其用作替代辅因子NADH而选择，而非NADPH。4基因盒v1(菌株263254)含有来自谷氨酸棒状杆菌的天冬氨酸-半醛脱氢酶(asd)(SEQ ID NO:39)、来自共生梭菌的谷氨酸脱氢酶(gdh)(SEQ ID NO:43)、来自大肠杆菌的4-羟基-四氢二吡啶甲酸还原酶(dapB)(SEQ IDNO:47)和来自谷氨酸棒状杆菌的内消旋-二氨基庚二酸D-脱氢酶(ddh)(SEQ ID NO:3)。因此，4基因盒v1(菌株263254)编码来自谷氨酸棒状杆菌的天冬氨酸-半醛脱氢酶(asd)(SEQID NO:40)、来自共生梭菌的谷氨酸脱氢酶(gdh)(SEQ ID NO:44)、来自大肠杆菌的4-羟基-四氢二吡啶甲酸还原酶(dapB)(SEQ ID NO:48)和来自谷氨酸棒状杆菌的内消旋-二氨基庚二酸D-脱氢酶(ddh)(SEQ ID NO:4)。

4基因盒v2(菌株263264)含有来自敏捷乳杆菌的天冬氨酸-半醛脱氢酶(asd)(SEQID NO:29)、来自共生梭菌的谷氨酸脱氢酶(gdh)(SEQ ID NO:43)、来自大肠杆菌的4-羟基-四氢二吡啶甲酸还原酶(dapB)(SEQ ID NO:47)和来自谷氨酸棒状杆菌的内消旋-二氨基庚二酸D-脱氢酶(ddh)(SEQ ID NO:3)。因此，4基因盒v2(菌株263264)编码来自敏捷乳杆菌的天冬氨酸-半醛脱氢酶(asd)(SEQ ID NO:30)、来自共生梭菌的谷氨酸脱氢酶(gdh)(SEQ IDNO:44)、来自大肠杆菌的4-羟基-四氢二吡啶甲酸还原酶(dapB)(SEQ ID NO:48)和来自谷氨酸棒状杆菌的内消旋-二氨基庚二酸D-脱氢酶(ddh)(SEQ ID NO:4)。

4基因盒显著提高平板模型9中的赖氨酸产生。数据概述于表10中。

表10：提高赖氨酸产生

基因盒	菌株	效价mM(95％CI)	相对于亲代的提高％
				无	亲代_6	6.45+/-0.9	n/a
盒v1	263254	12.41+/-0.9	92.4
				盒v2	263264	9.33+/-1.1	44.7

实例5：通过利用对NADH具有辅因子特异性的变异酶将苏氨酸生物合成路径重编程

实例2中描述的基础菌株用于以下实例实验。

引起细菌中L-苏氨酸产生的生物合成途径称为thrABC途径(图9)。如赖氨酸(以及甲硫氨酸、异亮氨酸和甘氨酸)一般，通向苏氨酸合成途径的初始步骤包括草酰乙酸转变成天冬氨酸，其使用通过谷氨酸脱氢酶(gdh)由2-酮戊二酸再生的谷氨酸。然后天冬氨酸转变成天冬氨酰磷酸，随后通过酶天冬氨酸半醛脱氢酶(asd)将天冬氨酰磷酸还原成天冬氨酸半醛(ASA)。这些步骤是赖氨酸、苏氨酸、异亮氨酸和甲硫氨酸生物合成所通用的。除天冬氨酰磷酸经asd转变成ASA外，苏氨酸形成需要三个额外步骤：通过双功能天冬氨酸激酶/高丝氨酸脱氢酶(thrA)使ASA转变成高丝氨酸；通过高丝氨酸激酶(thrB)使高丝氨酸转变成L-高丝氨酸磷酸；以及最后通过苏氨酸合成酶(thrC)使L-高丝氨酸磷酸转变成苏氨酸，但最后这三个步骤独立于NADP/NADH运行，并且在苏氨酸基础菌株中此途径中的任何可能瓶颈通过过表达thrABC操纵子而去除风险。

如图9所示，原生大肠杆菌酶gdh和asd中的每一个需要NADPH作为辅酶用于其相应作用。然而，NADPH是以工业规模在大肠杆菌中由葡萄糖产生L-苏氨酸中的限制因素之一(贝克尔等人(2005),《环境微生物学应用》,71(12):8587-8596)。因而，增加大肠杆菌中的NADPH产生应该会增加L-苏氨酸的产生。一种实现此目标的方式将是通过利用大肠杆菌酶gdh和asd的天然存在的同源物减少NADPH的利用，相比于NADPH，这些同源物更有效地使用NADH作为辅因子。因此，本实验的目标是加宽gdh和asd的辅酶依赖性以包括NADH以及NADPH。

大肠杆菌酶gdh在共生梭菌(利雷等人(1991),《生物化学与生物物理学报》,1080(3):191-197)中具有已知的同源物，相比于NADPH，其同源物更有效地使用NADH作为辅因子。不知大肠杆菌asd的此类同源物。为了研究是否可以鉴别具有更强NADH偏好的额外gdh同源物和具有NADH偏好的新颖asd同源物，对由环境样品开发出的内部宏基因组学文库进行全基因组同源性搜索。搜索由使用敏捷乳杆菌asd(asd_lag；SEQ ID 30)和梭菌目(Clostridiales)gdh(gdh_csy；SEQ ID:44)的蛋白质序列对所述文库进行BlastP分析组成。同源性搜索检索数百个序列，但应用进一步过滤和选择标准以达到每种酶二十四个序列的文库。从与查询序列的同一性<70％的结果的过滤亚群选择每种酶的大约十二个序列。从与查询序列的同一性>70％的序列亚群选择大约另十二个序列。

表11.在用于产生苏氨酸基础菌株的多拷贝苏氨酸操纵子表达载体的构建中所使用的部分的概述和多核苷酸序列

部分类型	部分名称	SEQ ID
			启动子	pMB085	75
***物(基因)	thrLABC	76
			***物(基因)	thrABC	77
骨架	pUC19载体	78

表12：途径同源物的来源和序列

大肠杆菌gdh(梭菌目gdh；SEQ ID NO:134)、敏捷乳杆菌asd(SEQ ID NO ID:80)的已知同源物以及酶的24种变体的开放阅读框(ORF)通过PCR使用商业来源的寡核苷酸扩增，并且克隆至含有调控序列、启动子pMB038(SEQ ID NO:237)和转录终止子(SEQ ID NO:238)的基于p15A的多拷贝质粒序列(SEQ ID NO:239)中，如图12所示。asd的型式26和gdh的型式26各一个拷贝呈双顺反子盒以多种组合克隆至基于p15A的多拷贝质粒骨架(SEQ ID NO:239)中。

最初使用标准的热休克转化技术将每个质粒转化到大肠杆菌中，以便鉴别正确装配的克隆和扩增载体DNA用于苏氨酸基础菌株(THR01-02)转化。

已验证的克隆通过电穿孔转化到大肠杆菌基础菌株细胞中。如上所述针对小规模培养中的苏氨酸产量来测试新产生的每种菌株和其亲代菌株。实验结果呈现于表13中。等位基因asd_13(SEQ ID NO:108)和asd_18(SEQ ID NO:118)性能更佳，但未与对照显著不同。等位基因gdh_1(SEQ ID NO:136)、ghd_8(SEQ ID NO:150)、gdh_14(SEQ ID NO:162)、gdh_16(SEQ ID NO:166)、gdh_18(SEQ ID NO:170)、gdh_20(SEQ ID NO:174)和gdh_22(SEQID NO:178)各与W3110和对照菌株相比，均增加苏氨酸(图13)。并非全部菌株都成功地建构和测试。展示较差/无生长的复制样品和统计离群值未在图13中展示，但在表13中表示。

表13.过表达asd和gdh变体的菌株的效价的概述

实例6：通过利用具有不同底物偏好和酶动力学的变异苏氨酸醛缩酶提高苏氨酸效价实例2中描述的基础菌株用于以下实例实验。

本实例展示一种使用异源苏氨酸醛缩酶基因增加细菌宿主细胞中的L-苏氨酸产生的方法。在大肠杆菌中，苏氨酸醛缩酶(ltaE)通过将L-苏氨酸转变成乙醛和甘氨酸来反对苏氨酸的累积。然而，苏氨酸醛缩酶(TA)的更宽分类家族内存在不同的底物特异性和酶动力学。本实例示出一种利用在TA之间发现的不同底物偏好，通过允许添加具有不同底物偏好或酶动力学的异源TA或用其置换原生ltaE基因来提高苏氨酸产量的策略。然而，应注意本实例如上述实施例一般，是例示性的，并且不应理解为以任何方式限制本公开的范围。

醛缩酶供体组分(亲核试剂)经可逆醇醛加成至接受体组分。大肠杆菌苏氨酸醛缩酶(ltaE)催化L-别-苏氨酸和L-苏氨酸裂解成甘氨酸和乙醛(图10A)。在大肠杆菌中，ltaE通过将L-苏氨酸转变成甘氨酸来反对苏氨酸的累积。然而，苏氨酸醛缩酶基因(TA)的更宽分类家族内存在不同的底物特异性。已经描述了具有促进L-苏氨酸形成的底物偏好(例如丝氨酸、丙氨酸)和动力学的TA(费斯科(Fesko)等人,2015)。

为了研究是否可以鉴别出具有促进苏氨酸产生的底物偏好或酶动力学的大肠杆菌ltaE的同源物，对由环境样品开发出的内部宏基因组学文库进行全基因组同源性搜索。搜索由使用来自阪崎肠杆菌苏氨酸醛缩酶(Csa_ltaE；SEQ ID NO:183)的蛋白质序列对所述文库进行BlastP分析组成，阪崎肠杆菌苏氨酸醛缩酶是一种据报导对甘氨酸偏好的酶(费斯科,2015)。同源性搜索检索数百个序列，但应用进一步过滤和选择标准以达到二十四个序列的文库。从与查询序列的同一性<70％的结果的过滤亚群选择大约十二个序列。从与查询序列的同一性>70％的序列亚群选择大约另十二个序列。

阪崎肠杆菌苏氨酸醛缩酶的开放阅读框(ORF)针对大肠杆菌(SEQ ID NO:183)进行密码子优化并合成为gBlock基因片段(IDT)。通过PCR使用商业来源的寡核苷酸扩增24种ltaE变体，并且克隆至含有启动子pMB038(SEQ ID NO:237)和原生大肠杆菌thrL转录终止子(SEQ ID NO:238)的基于p15A的多拷贝质粒序列(SEQ ID NO:239)中，如图12所示。

最初使用标准的热休克转化技术将每个质粒转化到化学胜任型NEB 10-β大肠杆菌细胞中，以便鉴别正确装配的克隆和扩增载体DNA用于转化至大肠杆菌苏氨酸基础菌株。

已验证的克隆通过电穿孔转化到大肠杆菌基础菌株细胞中。如上所述针对小规模培养中的苏氨酸产量来测试新产生的每种菌株和其亲代菌株。实验结果呈现于表14中。等位基因ltaE_6(SEQ ID NO:196)、ltaE_11(SEQ ID NO:206)、ltaE_18(SEQ ID NO:220)、ltaE_20(SEQ ID NO:224)、lta_24(SEQ ID NO:232)各与thrABC+p15A空白载体对照(对照质粒)和W3310菌株相比增加苏氨酸效价(图14)。

表14.过表达ltaE变体的菌株的效价的概述

实例7：在大肠杆菌中表达经修饰或变异gapA、gdh、asd和ltaE酶的组合以增加L-苏氨酸产生

实例2中描述的基础菌株用于以下实例实验。

以上策略中的一或多种可以组合使用以进一步增加大肠杆菌中的NADPH产生，因此，增加L-苏氨酸产量。

将gapA、gsd、asd、ltaE的多种组合引入实例2中所述的大肠杆菌thrABCΔtdh背景中。在一些情况下，如上所述，使用商业来源的寡核苷酸，这些组合克隆至含有pMB085-thrABC的相同的经修饰的pUC19载体中并其上转化，呈多顺反子添加在thrABC操纵子的下游，并且由pMB085启动子驱动。当多种基因串列添加时，包括以下核糖体结合位点(RBS)连接子：RBS1(agctggtggaatat(SEQ ID NO:306)；在thrC后)、RBS2(aggaggttgt(SEQ ID NO:307)；介于基因1与2之间)和RBS3(tgacacctattg(SEQ ID NO:308)；介于基因2和3之间)。这些连接序列包括在寡核苷酸尾部并且在基因的PCR扩增期间引入。当gapA、gsd、asd、ltaE的组合表示为thrABC效价的多顺反子操纵子时，针对某些组合观测到高达并超过15mg/L苏氨酸(图11A-C)和表15。

表15.在pUC19质粒上共表达thrABC以及gapA、asd、gdh和ltaE的组合的菌株的效价的概述

除在pUC19质粒上呈多顺反子表达的基因的以上组合外，还用表达asd、gdh和ltaE的个别文库变体(以上描述和测试)的p15A质粒(SEQ ID NO:239)或空白p15A载体对照(例如Csy_gdh+p15A(-))转化以上菌株中的三种(7000342721、7000342726和7000342720；分别Csy_gdh(SEQ ID NO:44)、gapAv5(SEQ ID NO:69)和gapAv7(SEQ ID NO:71))。这些菌株和其性能(苏氨酸效价)的概述在表16中示出。除W3110外，所有这些菌株都在pMB085-thrABCtdh缺失背景中。对于这些实验来说，大部分相关对照是经空白p15A对照质粒(7000349886、7000349887和7000349885；分别Csy_gdh+p15A(-)、gapAv5+p15A(-)和gapAv7+p15A(-))转化的亲代菌株(Csy_gdh、gapAv5和gapAv7)。asd、gdh或ltaE变体与Csy_gdh、gapAv5或gapAv7的某些组合提高苏氨酸效价。对于表达asd、gdh或ltaE文库变体的许多菌株来说，至少一种生物复制品性能比相关对照菌株更佳(图15)。感到提高苏氨酸效价的个别生物重复品说明由这些组合产生的提高。高变化性(由未能产生苏氨酸的大量复制品产生的巨大标准偏差)可能是当菌株维持两种质粒时质粒不稳定性或高突变速率的结果，但可以通过这些基因的染色体整合来缓解。额外p15A质粒的维持和氯霉素(chloramphenical)中的生长也导致在维持两种质粒的菌株中相对于亲代(例如-p15A(-)质粒相对于亲代)，观测到较低效价。

表16.表达Csy_gdh、gapAv5或gapAv7与asd、gdh或ltaE文库变体的组合的菌株的效价的概述

实例8：表达由NADH产生NADPH的转氢酶

谷氨酸棒状杆菌中L-赖氨酸的生物技术产生中的关键因素是NADPH的充足供应。如图1所示，膜整合烟酰胺核苷酸转氢酶可以经由氧化NADH来驱动NADP⁺的还原，由此由NADH产生NADPH。因此表达转氢酶是一种在谷氨酸棒状杆菌中增加细胞NADPH产生并且因此增加L-赖氨酸产生的有效策略。

实例9：表达丙酮酸羧化酶

丙酮酸羧酸酯是一种补充在生长期间生物合成或工业发酵中的赖氨酸和谷氨酸产生所消耗的草酰乙酸的重要回补酶。

已经从以下各菌克隆丙酮酸羧化酶基因并测序：埃特里根瘤菌(Rhizobium etli)(邓恩(Dunn,F.F.)等人,《细菌学杂志(J.Bacteriol.)》178:5960-5970(1996))、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)(近藤(Kondo,H.)等人,《基因(Gene)》191:47-50(1997)、枯草芽孢杆菌(Bacillus subtillis)(Genbank登录号Z97025)、结核分枝杆菌(Mycobacterium tuberculosis)(Genbank登录号Z83018)和嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum)(穆霍帕迪亚(Mukhopadhyay,B.),《生物化学杂志(J.Biol.Chem.)》273:5155-5166(1998)。先前已经在乳酸发酵短杆菌(Brevibacterium lactofermentum)(登坂(Tosaka,O.)等人,农业与生物化学(Agric.Biol.Chem.)43:1513-1519(1979))和谷氨酸棒状杆菌(彼得斯-温迪赫(Peters-Wendisch,P.G.)等人,《微生物学(Microbiology)》143:1095-1103(1997)中测量丙酮酸羧化酶活性。

研究表明氨基酸的天冬氨酸家族的产量和生产率关键取决于回补途径的碳通量(瓦尼路(Vallino,J.J.)和斯特凡诺普洛斯(Stephanopoulos,G.),《生物技术与生物工程学(Biotechnol.Bioeng.)》41:633-646(1993))。基于代谢物平衡，可以经由回补途径，显示赖氨酸产生速率小于或等于草酰乙酸合成速率。

谷氨酸棒状杆菌的丙酮酸羧化酶基因可以用突变体或变体置换，由此优选地，丙酮酸羧化酶表达比其在谷氨酸棒状杆菌基础菌株中的表达高2至20倍。

认为大肠杆菌缺乏内源性丙酮酸羧化酶基因。可以提供异源丙酮酸羧化酶。可以将来自谷氨酸棒状杆菌或另一微生物的异源丙酮酸羧化酶基因引入任何大肠杆菌菌株，例如实例2中所述的基础菌株。在一些应用中，需要内源性或异源丙酮酸羧化酶的表达水平的精确调节或微调，因为由突变或变异pyc基因的表达水平或活性水平引起的丙酮酸羧化酶活性不足或丙酮酸羧化酶活性过度可能引起不太理想的后果。在这类情况下，启动子梯可以用于调节或微调表达。通过测试变化强度的启动子元件与多种pyc变体或突变体组合，可以确定产生最佳基因活性的启动子与pyc基因的组合，从而增加例如L-苏氨酸等所期望化合物的产生。

实例10：在谷氨酸棒状杆菌或大肠杆菌中表达经修饰的gapA、转氢酶和经修饰的gdh、asd、dapB和ddh酶的组合以增加L-赖氨酸或L-苏氨酸产生

以上策略中的一或多种可以组合使用以进一步增加谷氨酸棒状杆菌或大肠杆菌中的NADPH产生，因此，增加L-赖氨酸或L-苏氨酸的产量。

实例11：鉴别新颖甘油醛3-磷酸脱氢酶(GAPDH)等位基因

使用gapAv9(D35G、L36T、T37K、P192S)(SEQ ID NO:303)作为起始序列产生gapA基因的NNK文库。每种诱变基因作为gapA的第二拷贝个别地引入在具有内源性gapA等位基因的谷氨酸棒状杆菌中的中性整合基因座(介于cg1504与cg1505之间)处，处于原生gapA启动子的调控下。在两种不同平板分析中筛选超过1200种gapA整合体以鉴别提高赖氨酸效价的等位基因。某些整合体显示与亲代菌株(黑色菱形)赖氨酸表达增加(黑色圆圈)相比(图14)。

几个截短gapA序列引起赖氨酸表达增加。原生gapA序列加下划线。剩余氨基酸是框移突变的假象。

表17：gapA截短增加赖氨酸表达

表18.提高赖氨酸产生的gapA基因中的新突变的清单

具有SEQ ID NO识别符的本公开序列

本公开的编号实施例

尽管随附条款，但本公开阐述以下编号实施例。

提高使用NADPH产生的化合物的产生

1.一种提高宿主细胞产生使用NADPH产生的化合物的能力的方法，所述方法包含改变细胞的可利用的NADPH。

2.条款1的方法，其中所述可利用的NADPH通过在所述细胞中表达经修饰的甘油醛-3-磷酸脱氢酶(GAPDH)来改变，其中所述经修饰的GAPDH经过修饰，使得其辅酶特异性加宽。

3.条款2的方法，其中所述经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性。

4.条款3的方法，其中所述天然存在的GAPDH是gapA。

5.条款4的方法，其中所述gapA具有SEQ ID NO:58的氨基酸序列。

6.条款2至5中任一条款的方法，其中所述经修饰的GAPDH包含与SEQ ID NO:58的氨基酸序列共享至少70％序列同一性的氨基酸序列。

7.条款2至5中任一条款的方法，其中所述经修饰的GAPDH包含与选自由SEQ IDNO:294、296、233、234、235、236、298和300组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

8.条款2至7中任一条款的方法，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸37相对应的位置处包含氨基酸置换。

9.条款2至8中任一条款的方法，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸36和37相对应的位置处包含氨基酸置换。

10.条款8或9的方法，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸37相对应的位置处的残基是赖氨酸。

11.条款9的方法，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸36相对应的位置处的残基是苏氨酸，并且所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸37相对应的位置处的残基是赖氨酸。

12.条款2至11中任一条款的方法，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸192相对应的位置处包含氨基酸置换。

13.条款12的方法，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸192相对应的位置处的残基是丝氨酸。

14.条款2至13中任一条款的方法，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸224相对应的位置处的残基是丝氨酸。

15.条款2至14中任一条款的方法，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸110相对应的位置处的残基是天冬氨酸。

16.条款2至15中任一条款的方法，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸140相对应的位置处的残基是甘氨酸。

17.条款2至5中任一条款的方法，其中所述经修饰的GAPDH包含与选自由SEQ IDNO:69、71、73、303、294、296、233、234、235、236、298和300组成的群组的氨基酸序列相同的氨基酸序列。

18.条款1至17中任一条款的方法，其中所述化合物选自表2。

19.条款18的方法，其中所述化合物是赖氨酸。

20.条款18的方法，其中所述化合物是苏氨酸。

21.条款1至20中任一条款的方法，其中所述宿主细胞是原核细胞。

22.条款21的方法，其中所述宿主细胞来自选自由以下组成的群组的属：土壤杆菌属(Agrobacterium)、脂环杆菌属(Alicyclobacillus)、念珠藻属(Anabaena)、倒囊藻属(Anacystis)、不动杆菌属(Acinetobacter)、酸热菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、布赫纳氏菌属(Buchnera)、平原菟丝子(Campestris)、弯曲杆菌属(Camplyobacter)、梭菌属(Clostridium)、棒状杆菌属、红色硫黃细菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏杆菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文菌属(Erwinia)、梭杆菌属(Fusobacterium)、粪栖杆菌属(Faecalibacterium)、弗朗西斯氏菌属(Francisella)、黄杆菌属(Flavobacterium)、土芽孢杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺旋杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中间根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属、罗斯氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅列藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、聚球藻属(Synecoccus)、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺杆菌属(Shigella)、嗜热厌氧杆菌属(Thermoanaerobacterium)、养障体(Tropheryma)、土拉热(Tularensis)、蒂梅丘拉(Temecula)、嗜热聚球藻属(Thermosynechococcus)、热球菌属(Thermococcus)、脲原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)和发酵单胞菌属(Zymomonas)。

23.条款22的方法，其中所述宿主细胞是谷氨酸棒状杆菌。

24.条款22的方法，其中所述宿主细胞是大肠杆菌。

25.条款1至20中任一条款的方法，其中所述宿主细胞是真核细胞。

26.条款25的方法，其中所述宿主细胞来自选自由以下组成的群组的属：棉霉属(Achlya)、枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢霉属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内斯菌属(Endothis)、镰孢菌属(Fusarium)、赤霉属(Gibberella)、胶霉属(Gliocladium)、腐殖菌属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、白霉菌属(Mucor)、脉孢菌属(Neurospora)、青霉属(Penicillium)、柄孢壳属(Podospora)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨胞霉属(Pyricularia)、根毛霉属(Rhizomucor)、根霉菌属(Rhizopus)、裂殖菌属(Schizophyllum)、革节孢属(Scytalidium)、孢子丝菌属(Sporotrichum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、栓菌属(Tramates)、弯颈霉菌属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)和小包脚菇属(Volvariella)。

包含经修饰的GAPDH的宿主细胞

27.一种宿主细胞，其包含相对于天然存在的GAPDH具有加宽的辅酶特异性的经修饰的GAPDH，其中所述宿主细胞相对于对应的缺乏所述经修饰的GAPDH的宿主细胞具有提高的使用NADPH产生的化合物的产生。

28.条款27的宿主细胞，其中所述可利用的NADPH通过在所述细胞中表达经修饰的甘油醛-3-磷酸脱氢酶(GAPDH)来改变，其中所述经修饰的GAPDH经过修饰，使得其辅酶特异性加宽。

29.条款27或28的宿主细胞，其中所述经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性。

30.条款29的宿主细胞，其中所述天然存在的GAPDH是gapA。

31.条款30的宿主细胞，其中所述gapA具有SEQ ID NO:58的氨基酸序列。

32.条款27至31中任一条款的宿主细胞，其中所述经修饰的GAPDH包含与SEQ IDNO:58的氨基酸序列共享至少70％序列同一性的氨基酸序列。

33.条款27至31中任一条款的宿主细胞，其中所述经修饰的GAPDH包含与选自由SEQ ID NO:294、296、233、234、235、236、298和300组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

34.条款27至33中任一条款的宿主细胞，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸37相对应的位置处包含氨基酸置换。

35.条款27至34中任一条款的宿主细胞，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸36和37相对应的位置处包含氨基酸置换。

36.条款34或35的宿主细胞，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸37相对应的位置处的残基是赖氨酸。

37.条款35的宿主细胞，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸36相对应的位置处的残基是苏氨酸，并且所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸37相对应的位置处的残基是赖氨酸。

38.条款27至37中任一条款的宿主细胞，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸192相对应的位置处包含氨基酸置换。

39.条款38的宿主细胞，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸192相对应的位置处的残基是丝氨酸。

40.条款27至39中任一条款的宿主细胞，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸224相对应的位置处的残基是丝氨酸。

41.条款27至40中任一条款的宿主细胞，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸110相对应的位置处的残基是天冬氨酸。

42.条款27至41中任一条款的宿主细胞，其中所述经修饰的GAPDH的与SEQ ID NO:58的氨基酸140相对应的位置处的残基是甘氨酸。

43.条款27至31中任一条款的宿主细胞，其中所述经修饰的GAPDH包含与选自由SEQ ID NO:69、71、73、303、294、296、233、234、235、236、298和300组成的群组的氨基酸序列相同的氨基酸序列。

44.条款27至43中任一条款的宿主细胞，其中所述化合物选自表2。

45.条款44的宿主细胞，其中所述化合物是赖氨酸。

46.条款44的宿主细胞，其中所述化合物是苏氨酸。

47.条款27至46中任一条款的宿主细胞，其中所述宿主细胞是原核细胞。

48.条款47的宿主细胞，其中所述宿主细胞来自选自由以下组成的群组的属：土壤杆菌属、脂环杆菌属、念珠藻属、倒囊藻属、不动杆菌属、酸热菌属、节杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、短杆菌属、丁酸弧菌属、布赫纳氏菌属、平原菟丝子、弯曲杆菌属、梭菌属、棒状杆菌属、红色硫黃细菌属、粪球菌属、埃希氏杆菌属、肠球菌属、肠杆菌属、欧文菌属、梭杆菌属、粪栖杆菌属、弗朗西斯氏菌属、黄杆菌属、土芽孢杆菌属、嗜血杆菌属、螺旋杆菌属、克雷伯氏菌属、乳杆菌属、乳球菌属、泥杆菌属、微球菌属、微杆菌属、中间根瘤菌属、甲基杆菌属、甲基杆菌属、分枝杆菌属、奈瑟菌属、泛菌属、假单胞菌属、原绿球藻属、红细菌属、红假单胞菌属、红假单胞菌属、罗斯氏菌属、红螺菌属、红球菌属、栅列藻属、链霉菌属、链球菌属、聚球藻属、糖单孢菌属、葡萄球菌属、沙雷氏菌属、沙门氏菌属、志贺杆菌属、嗜热厌氧杆菌属、养障体、土拉热、蒂梅丘拉、嗜热聚球藻属、热球菌属、脲原体属、黄单胞菌属、木杆菌属、耶尔森氏菌属和发酵单胞菌属。

49.条款48的宿主细胞，其中所述宿主细胞是谷氨酸棒状杆菌。

50.条款48的宿主细胞，其中所述宿主细胞是大肠杆菌。

51.条款27至46中任一条款的宿主细胞，其中所述宿主细胞是真核细胞。

52.条款51的宿主细胞，其中所述宿主细胞来自选自由以下组成的群组的属：棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球菌属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉属、胶霉属、腐殖菌属、肉座菌属、毁丝霉属、白霉菌属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、瘤胃壶菌属、梨胞霉属、根毛霉属、根霉菌属、裂殖菌属、革节孢属、孢子丝菌属、踝节菌属、嗜热子囊菌属、梭孢壳霉属、栓菌属、弯颈霉菌属、木霉属、轮枝孢属和小包脚菇属。

在棒状杆菌属中产生L-赖氨酸的方法

53.一种产生L-赖氨酸的方法，其包含培养棒状杆菌属菌株并从所培养的棒状杆菌属菌株或培养液回收L-赖氨酸，其中所述棒状杆菌属菌株表达使用NADP作为辅酶的经修饰的GAPDH，并且其中所述棒状杆菌属菌株的L-赖氨酸生产率得到提高。

加宽GAPDH的辅酶特异性的方法

54.一种加宽GAPDH的辅酶特异性的方法，其包含：对所述GAPDH进行修饰，使得经修饰的GAPDH具有针对辅酶NADP和NAD的双特异性。

55.条款54的方法，其中相对于NAD，所述经修饰的GAPDH具有增加的针对辅酶NADP的特异性。

56.条款54或55的方法，其中相比于NAD，所述经修饰的GAPDH更有效地使用NADP。

提高产生使用NADPH产生的化合物的效率的方法

57.一种提高宿主细胞产生使用NADPH产生的化合物的效率的方法，其包含：在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性。

58.条款57的方法，其中所述化合物选自表2。

59.条款57或58的方法，其中相比于NADPH，所述变异酶更有效地使用NADH。

60.条款57至59中任一条款的方法，其中所述方法包含表达gdh的变异酶，其中所述变异酶包含与SEQ ID NO:42或44的氨基酸序列共享至少70％序列同一性的氨基酸序列。

61.条款57至60中任一条款的方法，其中所述方法包含表达asd的变异酶，其中所述变异酶包含与SEQ ID NO:30或40的氨基酸序列共享至少70％序列同一性的氨基酸序列。

62.条款57至61中任一条款的方法，其中所述方法包含表达dapB的变异酶，其中所述变异酶包含与SEQ ID NO:46或48的氨基酸序列共享至少70％序列同一性的氨基酸序列。

63.条款57至62中任一条款的方法，其中所述方法包含表达ddh的变异酶，其中所述变异酶包含与SEQ ID NO:4的氨基酸序列共享至少70％序列同一性的氨基酸序列。

64.条款57至63中任一条款的方法，其中所述方法包含表达gdh的变异酶，其中所述变异酶包含与选自由SEQ ID NO:132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180和182组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

65.条款57至63中任一条款的方法，其中所述方法包含表达asd的变异酶，其中所述变异酶包含与选自由SEQ ID NO:80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128和130组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

66.条款57至63中任一条款的方法，其中其中所述方法包含表达gdh的变异酶，并且包含表达asd的变异酶，包含表达dapB的变异酶，包含表达ddh的变异酶，包含表达ddh的变异酶。

67.条款57至66中任一条款的方法，其中所述化合物选自表2。

68.条款68的方法，其中所述化合物是赖氨酸。

69.条款68的方法，其中所述化合物是苏氨酸。

70.条款57至69中任一条款的方法，其中所述宿主细胞是原核细胞。

71.条款70的方法，其中所述宿主细胞来自选自由以下组成的群组的属：土壤杆菌属、脂环杆菌属、念珠藻属、倒囊藻属、不动杆菌属、酸热菌属、节杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、短杆菌属、丁酸弧菌属、布赫纳氏菌属、平原菟丝子、弯曲杆菌属、梭菌属、棒状杆菌属、红色硫黃细菌属、粪球菌属、埃希氏杆菌属、肠球菌属、肠杆菌属、欧文菌属、梭杆菌属、粪栖杆菌属、弗朗西斯氏菌属、黄杆菌属、土芽孢杆菌属、嗜血杆菌属、螺旋杆菌属、克雷伯氏菌属、乳杆菌属、乳球菌属、泥杆菌属、微球菌属、微杆菌属、中间根瘤菌属、甲基杆菌属、甲基杆菌属、分枝杆菌属、奈瑟菌属、泛菌属、假单胞菌属、原绿球藻属、红细菌属、红假单胞菌属、红假单胞菌属、罗斯氏菌属、红螺菌属、红球菌属、栅列藻属、链霉菌属、链球菌属、聚球藻属、糖单孢菌属、葡萄球菌属、沙雷氏菌属、沙门氏菌属、志贺杆菌属、嗜热厌氧杆菌属、养障体、土拉热、蒂梅丘拉、嗜热聚球藻属、热球菌属、脲原体属、黄单胞菌属、木杆菌属、耶尔森氏菌属和发酵单胞菌属。

72.条款71的方法，其中所述宿主细胞是谷氨酸棒状杆菌。

73.条款71的方法，其中所述宿主细胞是大肠杆菌。

74.条款57至69中任一条款的方法，其中所述宿主细胞是真核细胞。

75.条款74的方法，其中所述宿主细胞来自选自由以下组成的群组的属：棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球菌属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉属、胶霉属、腐殖菌属、肉座菌属、毁丝霉属、白霉菌属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、瘤胃壶菌属、梨胞霉属、根毛霉属、根霉菌属、裂殖菌属、革节孢属、孢子丝菌属、踝节菌属、嗜热子囊菌属、梭孢壳霉属、栓菌属、弯颈霉菌属、木霉属、轮枝孢属和小包脚菇属。

包含gdh、asd、dapB或ddh的变体的宿主细胞

76.一种宿主细胞，其包含：一或多种酶gdh、asd、dapB和ddh的变体，其中所述变体展现针对辅酶NADH和NADPH的双特异性。

使用新颖烟酰胺核苷酸转氢酶的方法

77.一种提高宿主细胞产生使用NADPH产生的化合物的效率的方法，其包含在所述宿主细胞中表达新颖烟酰胺核苷酸转氢酶。

通过策略提高L-赖氨酸产生效率的方法

78.一种提高宿主细胞产生L-赖氨酸的效率的方法，其包含以下中的两个或更多个：

(1)对内源性GAPDH进行修饰，使得经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性；(2)在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性；以及(3)在所述宿主细胞中表达新颖烟酰胺核苷酸转氢酶。

使用gdh和/或asd的方法

79.一种提高宿主细胞产生使用NADPH产生的化合物的效率的方法，其包含：在所述宿主细胞中表达酶谷氨酸脱氢酶(gdh)和天冬氨酸半醛脱氢酶(asd)中的一或两种酶的变异酶，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性。

80.条款79的方法，其中相比于NADPH，所述变异酶更有效地使用NADH。

81.条款79或80的方法，其中所述方法包含表达gdh的变异酶，其中所述变异酶包含与选自由SEQ ID NO:132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180和182组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

82.条款81的方法，其中所述gdh的变异酶包含选自由SEQ ID NO:144、150、162、166、170、174和178组成的群组的氨基酸序列。

83.条款79至82中任一条款的方法，其中所述方法包含表达asd的变异酶，其中所述变异酶包含与选自由SEQ ID NO:80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128和130组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

84.条款83的方法，其中所述asd的变异酶包含选自由SEQ ID NO:108和118组成的群组的氨基酸序列。

提高用苏氨酸醛缩酶产生L-苏氨酸的效率的方法

85.一种提高宿主细胞产生L-苏氨酸的效率的方法，其包含：在所述宿主细胞中表达苏氨酸醛缩酶的变异酶，其中所述变异酶展现与大肠杆菌苏氨酸醛缩酶(ltaE)不同的底物偏好或酶动力学。

86.条款85的方法，其中所述变异酶促进苏氨酸产生超过甘氨酸产生。

87.条款85或86的方法，其中所述方法包含表达苏氨酸醛缩酶的变异酶，其中所述变异酶包含与选自由SEQ ID NO:184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230和232组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

88.条款87的方法，其中所述变异酶包含选自由SEQ ID NO:196、206、220、224和232组成的群组的氨基酸序列。

89.条款85至88中任一条款的方法，其中所述宿主细胞是原核细胞。

90.条款89的方法，其中所述宿主细胞来自选自由以下组成的群组的属：土壤杆菌属、脂环杆菌属、念珠藻属、倒囊藻属、不动杆菌属、酸热菌属、节杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、短杆菌属、丁酸弧菌属、布赫纳氏菌属、平原菟丝子、弯曲杆菌属、梭菌属、棒状杆菌属、红色硫黃细菌属、粪球菌属、埃希氏杆菌属、肠球菌属、肠杆菌属、欧文菌属、梭杆菌属、粪栖杆菌属、弗朗西斯氏菌属、黄杆菌属、土芽孢杆菌属、嗜血杆菌属、螺旋杆菌属、克雷伯氏菌属、乳杆菌属、乳球菌属、泥杆菌属、微球菌属、微杆菌属、中间根瘤菌属、甲基杆菌属、甲基杆菌属、分枝杆菌属、奈瑟菌属、泛菌属、假单胞菌属、原绿球藻属、红细菌属、红假单胞菌属、红假单胞菌属、罗斯氏菌属、红螺菌属、红球菌属、栅列藻属、链霉菌属、链球菌属、聚球藻属、糖单孢菌属、葡萄球菌属、沙雷氏菌属、沙门氏菌属、志贺杆菌属、嗜热厌氧杆菌属、养障体、土拉热、蒂梅丘拉、嗜热聚球藻属、热球菌属、脲原体属、黄单胞菌属、木杆菌属、耶尔森氏菌属和发酵单胞菌属。

91.条款90的方法，其中所述宿主细胞是谷氨酸棒状杆菌。

92.条款90的方法，其中所述宿主细胞是大肠杆菌。

93.条款85至88中任一条款的方法，其中所述宿主细胞是真核细胞。

94.条款93的方法，其中所述宿主细胞来自选自由以下组成的群组的属：棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球菌属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉属、胶霉属、腐殖菌属、肉座菌属、毁丝霉属、白霉菌属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、瘤胃壶菌属、梨胞霉属、根毛霉属、根霉菌属、裂殖菌属、革节孢属、孢子丝菌属、踝节菌属、嗜热子囊菌属、梭孢壳霉属、栓菌属、弯颈霉菌属、木霉属、轮枝孢属和小包脚菇属。

通过变异酶提高L-苏氨酸产生效率的方法

95.一种增加宿主细胞的L-苏氨酸产生的方法，其包含：在所述宿主细胞中表达酶甘油醛3-磷酸脱氢酶(gapA)、谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、苏氨酸醛缩酶(ltaE)和丙酮酸羧化酶(pyc)中的一或多种酶的变异酶。

96.条款95的方法，其中gdh的变异酶或asd的变异酶展现针对辅酶NADH和NADPH的双特异性。

97.条款95的方法，其中相比于NADPH，gapA的变异酶、gdh的变异酶或asd的变异酶更有效地使用NADH。

98.条款95至97中任一条款的方法，其中苏氨酸醛缩酶的变异酶促进苏氨酸产生超过甘氨酸产生。

99.条款95至98中任一条款的方法，其中所述方法包含表达gdh的变异酶，其中所述变异酶包含与选自由SEQ ID NO:132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180和182组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

100.条款99的方法，其中所述gdh的变异酶包含选自由SEQ ID NO:144、150、162、166、170、174和178组成的群组的氨基酸序列。

101.条款95至100中任一条款的方法，其中所述方法包含表达asd的变异酶，其中所述变异酶包含与选自由SEQ ID NO:80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128和130组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

102.条款101的方法，其中所述asd的变异酶包含选自由SEQ ID NO:108和118组成的群组的氨基酸序列。

103.条款95至102中任一条款的方法，其中所述方法包含表达苏氨酸醛缩酶的变异酶，其中所述变异酶包含与选自由SEQ ID NO:184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230和232组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

104.条款103的方法，其中所述苏氨酸醛缩酶的变异酶包含选自由SEQ ID NO:196、206、220、224和232组成的群组的氨基酸序列。

105.条款95至104中任一条款的方法，其中所述方法包含表达gapA的变异酶，其中所述gapA的变异酶包含选自由SEQ ID NO:69、71、73、303、294、296、233、234、235、236、298和300组成的群组的氨基酸序列。

106.条款95至105中任一条款的方法，其中所述方法包含表达gapA的变异酶，其中gapA的变异酶包含与SEQ ID NO:58的氨基酸序列共享至少70％序列同一性的氨基酸序列。

107.条款95至105中任一条款的方法，其中所述方法包含表达gapA的变异酶，其中gapA的变异酶包含与选自由SEQ ID NO:294、296、233、234、235、236、298和300组成的群组的氨基酸序列共享至少70％序列同一性的氨基酸序列。

108.条款106或107的方法，其中gapA的变异酶在与SEQ ID NO:58的氨基酸37相对应的位置处包含氨基酸置换。

109.条款106或107的方法，其中gapA的变异酶在与SEQ ID NO:58的氨基酸36和37相对应的位置处包含氨基酸置换。

110.条款108或109的方法，其中gapA的变异酶的与SEQ ID NO:58的氨基酸37相对应的位置处的残基是赖氨酸。

111.条款109的方法，其中gapA的变异酶的与SEQ ID NO:58的氨基酸36相对应的位置处的残基是苏氨酸，并且gapA的变异酶的与SEQ ID NO:58的氨基酸37相对应的位置处的残基是赖氨酸。

112.条款106至111中任一条款的方法，其中gapA的变异酶在与SEQ ID NO:58的氨基酸192相对应的位置处包含氨基酸置换。

113.条款112的方法，其中gapA的变异酶的与SEQ ID NO:58的氨基酸192相对应的位置处的残基是丝氨酸。

114.条款106至113中任一条款的方法，其中gapA的变异酶的与SEQ ID NO:58的氨基酸224相对应的位置处的残基是丝氨酸。

115.条款106至114中任一条款的方法，其中gapA的变异酶的与SEQ ID NO:58的氨基酸110相对应的位置处的残基是天冬氨酸。

116.条款106至115中任一条款的方法，其中gapA的变异酶的与SEQ ID NO:58的氨基酸140相对应的位置处的残基是甘氨酸。

117.条款95至105中任一条款的方法，其中所述方法包含表达gapA的变异酶，其中gapA的变异酶包含与选自由SEQ ID NO:69、71、73、303、294、296、233、234、235、236、298和300组成的群组的氨基酸序列相同的氨基酸序列。

苏氨酸基础菌株

118.一种宿主细胞，其包含多拷贝复制质粒，所述多拷贝复制质粒包含各自可操作地连接到一或多个合成启动子的thrA基因、thrB基因和thrC基因。

119.条款118的宿主细胞，其中所述宿主细胞是tdh缺失(Δtdh)细胞。

120.条款118或119的宿主细胞，其中所述多拷贝复制质粒包含与SEQ ID NO:77的thrABC操纵子序列至少70％相同的序列。

通过包括苏氨酸醛缩酶和丙酮酸羧化酶的策略提高化合物产生效率的方法

121.一种提高宿主细胞产生化合物的效率的方法，其包含以下中的两个或更多个：

(1)通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化；(2)在宿主细胞中表达由NADH产生NADPH的转氢酶；(3)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh、asd、dapB和ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程；(4)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和asd酶的同源物，将用于苏氨酸合成的thrABC-途径重编程；(5)通过表达减少或逆转苏氨酸降解成甘氨酸的内源性L-苏氨酸醛缩酶(ItA)的同源物，将苏氨酸合成重编程；以及(6)表达异源丙酮酸羧化酶(pyc)或其同源物以增加草酰乙酸的合成，或增加内源性pyc的表达。

122.条款121的方法，其中所述通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化包含表达gapA的变异酶，所述变异酶包含选自由SEQ ID NO:294、296、233、234、235、236、298和300组成的群组的氨基酸序列。

123.条款121或122的方法，其中所述通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh、asd、dapB和ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程包含以下中的一或多个：

i)表达gdh的变异酶，所述变异酶包含选自由SEQ ID NO:132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180和182组成的群组的氨基酸序列；

ii)表达asd的变异酶，所述变异酶包含选自由SEQ ID NO:80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128和130组成的群组的氨基酸序列；

iii)表达dapB的变异酶，所述变异酶包含选自由SEQ ID NO:46和48组成的群组的氨基酸序列；以及

iv)表达ddh的变异酶，所述变异酶包含选自由SEQ ID NO:2、4、6、8、10、12、14、16、18和20组成的群组的氨基酸序列。

124.条款121至123中任一条款的方法，其中所述通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和asd酶的同源物，将用于苏氨酸合成的thrABC-途径重编程包含以下中的一或多个：

i)表达gdh的变异酶，所述变异酶包含选自由SEQ ID NO:132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180和182组成的群组的氨基酸序列；以及

ii)表达asd的变异酶，所述变异酶包含选自由SEQ ID NO:80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128和130组成的群组的氨基酸序列。

125.条款121至124中任一条款的方法，其中所述通过表达减少或逆转苏氨酸降解成甘氨酸的内源性L-苏氨酸醛缩酶(ItA)的同源物，将苏氨酸合成重编程包含表达ltA的变异酶，所述变异酶包含选自由SEQ ID NO:184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230和232组成的群组的氨基酸序列。

126.条款121至125中任一条款的方法，其中所述表达异源丙酮酸羧化酶(pyc)或其同源物以增加草酰乙酸的合成，或增加内源性pyc的表达包含表达pyc的变异酶，所述变异酶包含选自由SEQ ID NO:184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230和232241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287和289组成的群组的氨基酸序列。

新gapA变体-多核苷酸

127.一种人工多核苷酸，其编码截短的甘油醛-3-磷酸脱氢酶(gapA)基因，其中所述多核苷酸包含与选自由SEQ ID NO:290、291、292和293组成的群组的多核苷酸序列至少85％、90％、95％或99％相同的序列。

128.条款127的人工多核苷酸，其中所述多核苷酸包含选自由SEQ ID NO:290、291、292和293组成的群组的多核苷酸序列。

129.一种载体，其包含可操作地连接到启动子的条款127或128的人工多核苷酸。

新gapA变体-蛋白质

130.一种甘油醛-3-磷酸脱氢酶(gapA)的重组蛋白片段，其中所述重组蛋白片段包含与选自由SEQ ID NO:233、234、235、236和298组成的群组的氨基酸序列至少70％、80％、90％或95％相同的序列。

131.条款130的重组蛋白片段，其中所述重组蛋白片段包含选自由SEQ ID NO:233、234、235、236和298组成的群组的氨基酸序列。

132.条款130或131的重组蛋白片段，其中所述重组蛋白片段缺乏gapA活性。

133.条款130至133中任一条款的重组蛋白片段，其中当宿主细胞包含具有gapA活性的另一蛋白质时所述重组蛋白片段增强所述宿主细胞的选自表2的化合物的生产率。

其它实施例

134.一种提高微生物细胞产生使用NADPH产生的化合物的能力的方法，所述方法包含改变所述细胞的可利用的NADPH。

135.技术方案134的方法，其中所述可利用的NADPH通过在所述细胞中表达经修饰的甘油醛-3-磷酸脱氢酶(GAPDH)来改变，其中所述经修饰的GAPDH经过修饰，使得其辅酶特异性加宽。

136.技术方案134的方法，其中通过在所述微生物细胞中表达酶谷氨酸脱氢酶(gdh)、天冬氨酸半醛脱氢酶(asd)、二氢吡啶甲酸还原酶(dapB)和内消旋-二氨基庚二酸脱氢酶(ddh)中的一或多种酶的变异酶来改变所述细胞的可利用的NADPH，其中所述变异酶展现针对辅酶NADH和NADPH的双特异性。

137.技术方案135的方法，其中所述经修饰的GAPDH相对于对应的天然存在的GAPDH具有增加的针对辅酶NADP的特异性。

138.技术方案134至137中任一技术方案的方法，其中所述微生物细胞是细菌细胞。

139.技术方案138的方法，其中所述细菌细胞来自选自由棒状杆菌属、埃希氏杆菌属、芽孢杆菌属或土芽孢杆菌属组成的群组的细菌。

140.技术方案138的方法，其中所述细菌是谷氨酸棒状杆菌或大肠杆菌。

141.技术方案134至137中任一技术方案的方法，其中所述微生物细胞是酵母细胞。

142.技术方案141的方法，其中所述酵母细胞是来自酵母菌属的细胞。

143.技术方案137的方法，其中所述天然存在的GAPDH是gapA。

144.技术方案143的方法，其中所述gapA具有SEQ ID NO:58的氨基酸序列。

145.技术方案134的方法，其中所述经修饰的GAPDH包含与SEQ ID NO:58的氨基酸序列至少70％相同的氨基酸序列。

146.技术方案134的方法，其中所述经修饰的GAPDH包含与选自由SEQ ID NO:294、296、233、234、235、236、298和300组成的群组的氨基酸序列至少70％相同的氨基酸序列。

147.技术方案145或146的方法，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸37相对应的位置处包含氨基酸置换。

148.技术方案147的方法，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸36和37相对应的位置处包含氨基酸置换。

149.技术方案147的方法，其中在与SEQ ID NO:58的氨基酸37相对应的位置处的苏氨酸已经被赖氨酸置换。

150.技术方案148的方法，其中在与SEQ ID NO:58的氨基酸36相对应的位置处的亮氨酸已经被苏氨酸置换，并且在与SEQ ID NO:58的氨基酸37相对应的位置处的苏氨酸已经被赖氨酸置换。

151.技术方案135的方法，其中所述经修饰的GAPDH在与SEQ ID NO:58的氨基酸192相对应的位置处包含氨基酸置换。

152.技术方案135的方法，其中在与SEQ ID NO:58的氨基酸172相对应的位置处的脯氨酸已经被丝氨酸置换。

153.技术方案135的方法，其中在与SEQ ID NO:58的氨基酸224相对应的位置处的亮氨酸已经被丝氨酸置换。

154.技术方案135的方法，其中在与SEQ ID NO:58的氨基酸110相对应的位置处的组氨酸已经被天冬氨酸置换。

155.技术方案135的方法，其中在与SEQ ID NO:58的氨基酸140相对应的位置处的酪氨酸已经被甘氨酸置换。

156.技术方案146的方法，其中所述经修饰的GAPDH选自由SEQ ID NO:69、71、73、303、294、296、233、234、235、236、298和300组成的群组。

157.技术方案134至137中任一技术方案的方法，其中所述化合物选自表2。

158.技术方案157的方法，其中所述化合物是L-赖氨酸或L-苏氨酸。

159.一种微生物细胞，其包含相对于天然存在的GAPDH，具有加宽的辅酶特异性的经修饰的GAPDH，其中相对于缺乏所述经修饰的GAPDH的对应微生物细胞，所述微生物细胞提高使用NADPH产生的化合物的产生。

160.技术方案159的微生物细胞，其中所述经修饰的GAPDH相对于所述天然存在的GAPDH具有增加的针对NADP的特异性。

161.技术方案160的微生物细胞，其中所述经修饰的GAPDH包含与SEQ ID NO:58至少70％相同的氨基酸序列。

162.技术方案160的微生物细胞，其中所述经修饰的GAPDH包含与选自由SEQ IDNO:294、296、233、234、235、236、298和300组成的群组的氨基酸序列至少70％相同的氨基酸序列。

163.技术方案160的微生物细胞，其中所述经修饰的GAPDH包含与SEQ ID NO:58至少70％相同的氨基酸序列并且其中所述经修饰的GAPDH包含在SEQ ID NO:58的位置36、37或两个位置处的氨基酸的取代。

164.技术方案160的微生物细胞，其中所述经修饰的GAPDH选自由SEQ ID NO:69、71、73、303、294、296、233、234、235、236、298和300组成的群组。

165.技术方案159的微生物细胞，其中所述化合物选自表2。

166.技术方案165的微生物细胞，其中所述化合物是L-赖氨酸或L-苏氨酸。

167.技术方案159的微生物细胞，其中所述微生物细胞来自细菌。

168.技术方案167的微生物细胞，其中所述细菌是棒状杆菌属、埃希氏杆菌属、芽孢杆菌属或土芽孢杆菌属。

169.技术方案168的微生物细胞，其中所述细菌是谷氨酸棒状杆菌或大肠杆菌。

170.技术方案165的微生物细胞，其中所述微生物细胞是酵母细胞。

171.一种加宽GAPDH的辅酶特异性的方法，其包含：对所述GAPDH进行修饰，使得经修饰的GAPDH具有针对辅酶NADP和NAD的双特异性。

172.技术方案171的方法，其中相对于NAD，所述经修饰的GAPDH具有增加的针对辅酶NADP的特异性。

173.技术方案172的方法，其中相比于NAD，所述经修饰的GAPDH更有效地使用NADP。

174.技术方案136的方法，其中所述方法包含表达gdh的变异酶，其中所述变异酶包含与SEQ ID NO:42或44的氨基酸序列至少70％相同的氨基酸序列。

175.技术方案136的方法，其中所述方法包含表达asd的变异酶，其中所述变异酶包含与SEQ ID NO:30或40的氨基酸序列至少70％相同的氨基酸序列。

176.技术方案136的方法，其中所述方法包含表达dapB的变异酶，其中所述变异酶包含与SEQ ID NO:46或48的氨基酸序列至少70％相同的氨基酸序列。

177.技术方案136的方法，其中所述方法包含表达ddh的变异酶，其中所述ddh酶包含SEQ ID NO:4的氨基酸序列。

178.技术方案136的方法，其中所述方法包含表达gdh的变异酶，其中所述变异酶包含与选自由SEQ ID NO:132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180和182组成的群组的氨基酸序列至少70％相同的氨基酸序列。

179.技术方案136的方法，其中所述方法包含表达asd的变异酶，其中所述变异酶包含与选自由SEQ ID NO:80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128和130组成的群组的氨基酸序列至少70％相同的氨基酸序列。

180.技术方案136的方法，其中所有四种酶的变体同时在所述微生物细胞中表达。

181.一种微生物细胞，其包含：一或多种酶gdh、asd、dapB和ddh的变体，其中所述变体展现针对辅酶NADH和NADPH的双特异性。

182.技术方案178的方法，其中所述gdh的变异酶包含选自由SEQ ID NO:144、150、162、166、170、174、178组成的群组的氨基酸序列。

183.技术方案179的方法，其中所述asd的变异酶包含选自由SEQ ID NO:108和118组成的群组的氨基酸序列。

184.技术方案134至137中任一技术方案的方法，其进一步包含：在所述微生物细胞中表达苏氨酸醛缩酶的变异酶，其中苏氨酸醛缩酶的变异酶展现与大肠杆菌苏氨酸醛缩酶(ltaE)不同的底物偏好或酶动力学。

185.技术方案184的方法，其中变异苏氨酸醛缩酶促进苏氨酸产生超过甘氨酸产生。

186.技术方案184的方法，其中所述变异苏氨酸醛缩酶包含与选自由SEQ ID NO:184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230和232组成的群组的氨基酸序列至少70％相同的氨基酸序列。

187.技术方案186的方法，其中所述变异苏氨酸醛缩酶包含选自由SEQ IDNO:196、206、220、224和232组成的群组的氨基酸序列。

188.技术方案184的方法，其中所述化合物是L-苏氨酸。

189.技术方案140的方法，其中所述细菌是大肠杆菌并且所述方法进一步包含在所述大肠杆菌细胞中表达pyc。

190.技术方案189的方法，其中所述方法包含表达pyc的变异酶，其中所述pyc的变异酶包含与选自由SEQ ID NO:241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287和289组成的群组的氨基酸序列至少70％相同的氨基酸序列。

191.一种微生物细胞，其包含多拷贝复制质粒，所述多拷贝复制质粒包含各自可操作地连接到一或多个合成启动子的thrA基因、thrB基因和thrC基因。

192.技术方案191的微生物细胞，其中所述微生物细胞是tdh缺失(Δtdh)细胞。

193.技术方案191的微生物细胞，其中所述多拷贝复制质粒包含与SEQ ID NO:77的thrABC操纵子序列至少70％相同的序列。

194.一种提高微生物细胞产生化合物的效率的方法，其包含以下中的两个或更多个：

(1)通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化；(2)在细菌中表达由NADH产生NADPH的转氢酶；(3)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh、asd、dapB和ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程；(4)通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和asd酶的同源物，将用于苏氨酸合成的thrABC-途径重编程；(5)通过表达减少或逆转苏氨酸降解成甘氨酸的内源性L-苏氨酸醛缩酶(ItA)的同源物，将苏氨酸合成重编程；以及(6)表达异源丙酮酸羧化酶(pyc)或其同源物以增加草酰乙酸的合成，或增加内源性pyc的表达。

195.技术方案194的方法，其中所述化合物选自表2。

196.技术方案195的方法，其中所述化合物是L-苏氨酸。

197.技术方案194至196中任一技术方案的方法，其中所述通过加宽内源性糖酵解酶甘油醛-3-磷酸脱氢酶(gapA)的辅酶特异性，使所述酶具有针对NADP和NAD的双特异性，将产生NADPH的糖酵解途径工程化包含表达gapA的变异酶，所述变异酶包含选自由SEQ IDNO:294、296、233、234、235、236、298和300组成的群组的氨基酸序列。

198.技术方案194至196中任一技术方案的方法，其中所述通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh、asd、dapB和ddh酶的同源物，将用于赖氨酸合成的DAP-途径重编程包含以下中的一或多个：

iii)表达dapB的变异酶，所述变异酶包含选自由SEQ ID NO:46和48组成的群组的氨基酸序列；以及

iv)表达ddh的变异酶，所述变异酶包含选自由SEQ ID NO:2、4、6、8、10、12、14、16、18和20组成的群组的氨基酸序列。

199.技术方案194至196中任一技术方案的方法，其中所述通过表达相比于NADPH更有效地使用NADH作为辅因子的内源性gdh和asd酶的同源物，将用于苏氨酸合成的thrABC-途径重编程包含以下中的一或多个：

200.技术方案194至196中任一技术方案的方法，其中所述通过表达减少或逆转苏氨酸降解成甘氨酸的内源性L-苏氨酸醛缩酶(ItA)的同源物，将苏氨酸合成重编程包含表达ltA的变异酶，所述变异酶包含选自由SEQ ID NO:184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230和232组成的群组的氨基酸序列。

201.技术方案194至196中任一技术方案的方法，其中所述表达异源丙酮酸羧化酶(pyc)或其同源物以增加草酰乙酸的合成，或增加内源性pyc的表达包含表达pyc的变异酶，所述变异酶包含选自由SEQ ID NO:184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230和232241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287和289组成的群组的氨基酸序列。

202.一种人工多核苷酸，其编码截短的甘油醛-3-磷酸脱氢酶(gapA)基因，其中所述多核苷酸包含与选自由SEQ ID NO:290、291、292和293组成的群组的多核苷酸序列至少70％相同的序列。

203.技术方案202的人工多核苷酸，其中所述多核苷酸包含选自由SEQ ID NO:290、291、292和293组成的群组的多核苷酸序列。

204.一种载体，其包含可操作地连接到启动子的条款202或203的人工多核苷酸。

205.一种甘油醛-3-磷酸脱氢酶(gapA)的重组蛋白片段，其中所述重组蛋白片段包含与选自由SEQ ID NO:233、234、235、236和298组成的群组的氨基酸序列至少70％相同的序列。

206.技术方案205的重组蛋白片段，其中所述重组蛋白片段包含选自由SEQ IDNO:233、234、235、236和298组成的群组的氨基酸序列。

207.技术方案205或206的重组蛋白片段，其中所述重组蛋白片段缺乏gapA活性。

208.技术方案207的重组蛋白片段，其中当微生物细胞包含具有gapA活性的另一蛋白质时所述重组蛋白片段增强所述微生物细胞的选自表2的化合物的生产率。

209.技术方案159至169中任一技术方案的微生物细胞，其中所述微生物细胞进一步包含变异苏氨酸醛缩酶、pyc蛋白质或两者。

引用并入

本文中所引用的所有参考文献、论文、公开、专利、专利公开以及专利申请以全文引用的方式并入以用于所有目的。

然而，提及本文引用的任何参考文献、论文、公开、专利、专利公开以及专利申请案不是并且不应认为是承认或以任何形式暗示其构成有效现有技术或形成世界上任何国家的公共常识的部分。具体地说，以下申请以全文引用的方式并入本文中：2016年12月30日提交的美国申请第15/396,230号；2016年12月7日提交的国际申请第PCT/US2016/065465号；2016年4月27日提交的美国申请第15/140,296号；2016年7月29日提交的美国临时申请第62/368,786号；以及2015年12月7日提交的美国临时申请第62/264,232号。

序列表

<110> 齐默尔根公司(Zymergen Inc.)

S•曼彻斯特(Manchester, Shawn)

<120> 增加NADPH的生物合成途径的基因组工程化

<130> ZYMR-011/01WO 327574-2057

<150> US 62/508,589

<151> 2017-05-19

<160> 308

<170> PatentIn version 3.5

<210> 1

<211> 969

<212> DNA

<213> 人工序列

<220>

<223> 来自口腔放线菌的进行密码子优化的ddh

<400> 1

atgattcgcg ttgcgatcaa tggatatggc aacctgggac ggggtgtcga acaagcgatt 60

acgaagaacg cggacatgga agtcgcggtc gtgtttacgc gccgcgaccc agctacggtg 120

actacccagg gcgcccccgt cgcccatgtt gatgacatgg ccgcttgggc cgataaagtg 180

gatgtctgtc ttaactgcgg cggatcagcg accgacttga ttgaacaaac gcccgctgcg 240

gcagctcttt tcaacaccgt agattcgttc gatacgcatg cccggattcc tgagcatttc 300

gccgcggtgg acgccgcagc gaaggcatca ggccatgtgg cgttgatttc agcgggctgg 360

gacccaggac ttttttccat gctccgggtc ctcggcgaag cagtcctccc agacggtgct 420

accacgacct tctggggccc cggagtttcg cagggtcatt cagacgctct gcgtcgcatc 480

gacggtgtgg tagatgcgaa acaatacact cggccagtcg aggcaacggt ggctgccgtc 540

aaggcaggag atgatgttga gctcactacg cgctcaatgc acactcgtga ctgctatgta 600

gttgcggagg aaggcgcaga tcttgcccgg atcgagcggg agatcgttga gatgcccaat 660

tacttcgctg attacgatac taccgttact ttcattactg ccgaggaact tgccgcggag 720

cacgcgggta ttccgcatgg aggatcggta attcggcgtg gccataccag cgaaggagtg 780

gccgaaaccg tgtcgtttga gctgcaattg ggctctaacc ccgaatttac gggatcagtc 840

ctggttgcta cggcgcgtgc tgtcgcacgg cttgctgccc ggggcgaaac tggtgcccgg 900

acggtttttg acgttactct tgccgacttg tctccgacta gccccgagga gctccgtgct 960

cactacctg 969

<210> 2

<211> 323

<212> PRT

<213> 人工序列

<220>

<223> 来自口腔放线菌的进行密码子优化的ddh

<400> 2

Met Ile Arg Val Ala Ile Asn Gly Tyr Gly Asn Leu Gly Arg Gly Val

1 5 10 15

Glu Gln Ala Ile Thr Lys Asn Ala Asp Met Glu Val Ala Val Val Phe

20 25 30

Thr Arg Arg Asp Pro Ala Thr Val Thr Thr Gln Gly Ala Pro Val Ala

35 40 45

His Val Asp Asp Met Ala Ala Trp Ala Asp Lys Val Asp Val Cys Leu

50 55 60

Asn Cys Gly Gly Ser Ala Thr Asp Leu Ile Glu Gln Thr Pro Ala Ala

65 70 75 80

Ala Ala Leu Phe Asn Thr Val Asp Ser Phe Asp Thr His Ala Arg Ile

85 90 95

Pro Glu His Phe Ala Ala Val Asp Ala Ala Ala Lys Ala Ser Gly His

100 105 110

Val Ala Leu Ile Ser Ala Gly Trp Asp Pro Gly Leu Phe Ser Met Leu

115 120 125

Arg Val Leu Gly Glu Ala Val Leu Pro Asp Gly Ala Thr Thr Thr Phe

130 135 140

Trp Gly Pro Gly Val Ser Gln Gly His Ser Asp Ala Leu Arg Arg Ile

145 150 155 160

Asp Gly Val Val Asp Ala Lys Gln Tyr Thr Arg Pro Val Glu Ala Thr

165 170 175

Val Ala Ala Val Lys Ala Gly Asp Asp Val Glu Leu Thr Thr Arg Ser

180 185 190

Met His Thr Arg Asp Cys Tyr Val Val Ala Glu Glu Gly Ala Asp Leu

195 200 205

Ala Arg Ile Glu Arg Glu Ile Val Glu Met Pro Asn Tyr Phe Ala Asp

210 215 220

Tyr Asp Thr Thr Val Thr Phe Ile Thr Ala Glu Glu Leu Ala Ala Glu

225 230 235 240

His Ala Gly Ile Pro His Gly Gly Ser Val Ile Arg Arg Gly His Thr

245 250 255

Ser Glu Gly Val Ala Glu Thr Val Ser Phe Glu Leu Gln Leu Gly Ser

260 265 270

Asn Pro Glu Phe Thr Gly Ser Val Leu Val Ala Thr Ala Arg Ala Val

275 280 285

Ala Arg Leu Ala Ala Arg Gly Glu Thr Gly Ala Arg Thr Val Phe Asp

290 295 300

Val Thr Leu Ala Asp Leu Ser Pro Thr Ser Pro Glu Glu Leu Arg Ala

305 310 315 320

His Tyr Leu

<210> 3

<211> 960

<212> DNA

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的进行密码子优化的ddh

<400> 3

atgacgaaca tccgtgtagc aatcgtcgga tacggtaatc tgggacgcag cgtagaaaaa 60

ctcatcgcca agcaaccaga catggatctt gttggaattt tctcgcgccg ggcgactctc 120

gatacgaaga cccccgtctt cgatgtggcg gacgttgata aacatgccga tgatgtcgat 180

gtactctttt tgtgcatggg atctgcaacg gatatcccgg agcaagcccc caagttcgct 240

caatttgcct gtacggtgga cacgtacgat aatcatcgtg atatcccccg gcatcgccaa 300

gttatgaatg aagctgcaac cgcagcaggc aatgtagcgt tggtttctac gggctgggac 360

ccaggcatgt tttcgattaa tcgtgtttat gccgctgctg ttttggccga gcaccagcaa 420

cacacgtttt ggggtccagg acttagccag ggccatagcg atgcccttcg ccgcatcccg 480

ggtgttcaaa aggctgttca gtacacgttg ccttctgaag atgcgcttga aaaagcacgg 540

cgcggcgagg ccggagattt gaccggcaag caaacgcata aacgccagtg cttcgttgtg 600

gccgacgcgg ccgaccatga gcgcatcgag aacgatattc ggactatgcc cgattacttc 660

gtaggctatg aggtggaagt caatttcatc gatgaagcaa ccttcgactc tgaacatacg 720

ggtatgcccc acggcggtca cgtgatcacg actggcgaca ctggcggttt taaccacacc 780

gttgagtata ttctcaagct ggaccgtaat cccgacttca ctgcgtcctc tcaaatcgcg 840

ttcggccgtg cagcgcaccg catgaaacaa caaggccaat caggtgcctt taccgttctg 900

gaagttgccc catatttgtt gagcccggaa aacttggacg acttgattgc ccgggatgtg 960

<210> 4

<211> 320

<212> PRT

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的进行密码子优化的ddh

<400> 4

Met Thr Asn Ile Arg Val Ala Ile Val Gly Tyr Gly Asn Leu Gly Arg

1 5 10 15

Ser Val Glu Lys Leu Ile Ala Lys Gln Pro Asp Met Asp Leu Val Gly

20 25 30

Ile Phe Ser Arg Arg Ala Thr Leu Asp Thr Lys Thr Pro Val Phe Asp

35 40 45

Val Ala Asp Val Asp Lys His Ala Asp Asp Val Asp Val Leu Phe Leu

50 55 60

Cys Met Gly Ser Ala Thr Asp Ile Pro Glu Gln Ala Pro Lys Phe Ala

65 70 75 80

Gln Phe Ala Cys Thr Val Asp Thr Tyr Asp Asn His Arg Asp Ile Pro

85 90 95

Arg His Arg Gln Val Met Asn Glu Ala Ala Thr Ala Ala Gly Asn Val

100 105 110

Ala Leu Val Ser Thr Gly Trp Asp Pro Gly Met Phe Ser Ile Asn Arg

115 120 125

Val Tyr Ala Ala Ala Val Leu Ala Glu His Gln Gln His Thr Phe Trp

130 135 140

Gly Pro Gly Leu Ser Gln Gly His Ser Asp Ala Leu Arg Arg Ile Pro

145 150 155 160

Gly Val Gln Lys Ala Val Gln Tyr Thr Leu Pro Ser Glu Asp Ala Leu

165 170 175

Glu Lys Ala Arg Arg Gly Glu Ala Gly Asp Leu Thr Gly Lys Gln Thr

180 185 190

His Lys Arg Gln Cys Phe Val Val Ala Asp Ala Ala Asp His Glu Arg

195 200 205

Ile Glu Asn Asp Ile Arg Thr Met Pro Asp Tyr Phe Val Gly Tyr Glu

210 215 220

Val Glu Val Asn Phe Ile Asp Glu Ala Thr Phe Asp Ser Glu His Thr

225 230 235 240

Gly Met Pro His Gly Gly His Val Ile Thr Thr Gly Asp Thr Gly Gly

245 250 255

Phe Asn His Thr Val Glu Tyr Ile Leu Lys Leu Asp Arg Asn Pro Asp

260 265 270

Phe Thr Ala Ser Ser Gln Ile Ala Phe Gly Arg Ala Ala His Arg Met

275 280 285

Lys Gln Gln Gly Gln Ser Gly Ala Phe Thr Val Leu Glu Val Ala Pro

290 295 300

Tyr Leu Leu Ser Pro Glu Asn Leu Asp Asp Leu Ile Ala Arg Asp Val

305 310 315 320

<210> 5

<211> 993

<212> DNA

<213> 人工序列

<220>

<223> 来自超嗜热古菌的进行密码子优化的ddh

<400> 5

atgaaaaaaa tcaacgtcgg aattattggt tacggtaacg tcggacgggg tgtgaagcaa 60

gctctcgaga aaaacgcaga catgaaactg gtcgctatcc tgactcgtcg cccagagcgg 120

gtacggaagg aaatcaaaga cgtgcatgtt ttccggactg atgaatcgtt gccgaaatcc 180

tttgaaatcg acgtggcggt cttgtgtggt ggatccaaga aagacatgcc aatccaaggt 240

ccaaaatttg cggccaaata caacaccgtt gatagcttcg acacccatgc cgacatccct 300

agctatttca agaaaatgga ttcaatcgct aaaaaacatg gtaatgtgtc tatcatctca 360

gcgggatggg atcccggtat tttcagcctg gagcgtgtcc ttggcggcgc ttttctgccg 420

gaatctaagc ggtatacgtt ttggggcaag ggtgtgtctc tcggtcactc tgatgctgct 480

cgccgcgtga aaggtgtctc tgatgctatt caatacacca ttccgattga gaaggctatt 540

caacgcatcc gtgcgggaga tgcgccagac tttagcaaaa cggaaatgca caagcgcgtt 600

gtttacgttg tccctgaaga gggtgccgac cttaagaaaa tccggaagga aattaccgag 660

atgccaaagt attttgaagg atatgatacg gaggtcattt ttatcactga gaaagaaatg 720

aaaaaacact ccacgtttcc ccacggcggc tttgtcttca ctagcggtgt aacgggagat 780

tctaaccgtc aaatcctcga atataaatgc cagctcgaga acaatagcga gttcactgcg 840

tctgtccttg tagcgtgcgc acgcgctgcg tatcgtctga atgagaaagg ctaccgtggt 900

gcttttacct ttttggactt tcccttgtcg tttcttatcg agtcggagtt tagcgcgtgc 960

ttcgaaagcc gcgcccggcg caatccctct cct 993

<210> 6

<211> 331

<212> PRT

<213> 人工序列

<220>

<223> 来自超嗜热古菌的进行密码子优化的ddh

<400> 6

Met Lys Lys Ile Asn Val Gly Ile Ile Gly Tyr Gly Asn Val Gly Arg

1 5 10 15

Gly Val Lys Gln Ala Leu Glu Lys Asn Ala Asp Met Lys Leu Val Ala

20 25 30

Ile Leu Thr Arg Arg Pro Glu Arg Val Arg Lys Glu Ile Lys Asp Val

35 40 45

His Val Phe Arg Thr Asp Glu Ser Leu Pro Lys Ser Phe Glu Ile Asp

50 55 60

Val Ala Val Leu Cys Gly Gly Ser Lys Lys Asp Met Pro Ile Gln Gly

65 70 75 80

Pro Lys Phe Ala Ala Lys Tyr Asn Thr Val Asp Ser Phe Asp Thr His

85 90 95

Ala Asp Ile Pro Ser Tyr Phe Lys Lys Met Asp Ser Ile Ala Lys Lys

100 105 110

His Gly Asn Val Ser Ile Ile Ser Ala Gly Trp Asp Pro Gly Ile Phe

115 120 125

Ser Leu Glu Arg Val Leu Gly Gly Ala Phe Leu Pro Glu Ser Lys Arg

130 135 140

Tyr Thr Phe Trp Gly Lys Gly Val Ser Leu Gly His Ser Asp Ala Ala

145 150 155 160

Arg Arg Val Lys Gly Val Ser Asp Ala Ile Gln Tyr Thr Ile Pro Ile

165 170 175

Glu Lys Ala Ile Gln Arg Ile Arg Ala Gly Asp Ala Pro Asp Phe Ser

180 185 190

Lys Thr Glu Met His Lys Arg Val Val Tyr Val Val Pro Glu Glu Gly

195 200 205

Ala Asp Leu Lys Lys Ile Arg Lys Glu Ile Thr Glu Met Pro Lys Tyr

210 215 220

Phe Glu Gly Tyr Asp Thr Glu Val Ile Phe Ile Thr Glu Lys Glu Met

225 230 235 240

Lys Lys His Ser Thr Phe Pro His Gly Gly Phe Val Phe Thr Ser Gly

245 250 255

Val Thr Gly Asp Ser Asn Arg Gln Ile Leu Glu Tyr Lys Cys Gln Leu

260 265 270

Glu Asn Asn Ser Glu Phe Thr Ala Ser Val Leu Val Ala Cys Ala Arg

275 280 285

Ala Ala Tyr Arg Leu Asn Glu Lys Gly Tyr Arg Gly Ala Phe Thr Phe

290 295 300

Leu Asp Phe Pro Leu Ser Phe Leu Ile Glu Ser Glu Phe Ser Ala Cys

305 310 315 320

Phe Glu Ser Arg Ala Arg Arg Asn Pro Ser Pro

325 330

<210> 7

<211> 978

<212> DNA

<213> 人工序列

<220>

<223> 来自粪芽孢菌属的进行密码子优化的ddh

<400> 7

atgatcaaaa tcggcatcgt gggctacgga aacctgggac gtggtgtgga atgcgcggtc 60

catcattcgc aggatatgga attggcggga gttttcacgc ggcgcaatcc ggagacggtt 120

aaaactcaca ccgacgttcc tgtgtatgat atggagaaac tgtacgacat gcagggcgac 180

attgatgtcc tcgtgctgtg cggaggctcc gctaatgatc tgccgaagca gacggttgag 240

ttggcacagt atttcaatgt tgtagactct ttcgatactc atgccaaaat ccccgagcat 300

ttctctaatg ttaatcaaag cagcgagaaa ggtaaacata tttcgattat ttcagtaggc 360

tgggatcctg gattgttctc cctcaatcgg ctgtatggac aagcaattct gccgaatgga 420

aacgactaca ctttttgggg taaaggagtt tcacagggac attctgatgc gatccggcgt 480

atcgcaggcg ttaaagacgc gcgccagtac acgatccccg tggacgccgc gttggagagc 540

gttcgcaatg gagaaaatcc gaccctcacc actcgggaga agcacactcg ggagtgtttc 600

gttgtcgctg aagacggcgc tgaccttaaa gtgatcgaag aaacgatcaa gaccatgcca 660

aactattttg ctgactatga cacgactgtt catttcatct cggaggaaga gctgatgcgg 720

gatcatcaag gaattccgca tggtggcgtc gtacttcgca gcggaaccac gggctttgac 780

tatgagaaca agcacgtaat cgaatacaaa ctcactctgg attcgaaccc cgagttcacc 840

tcctctgttc tcgttgcata tgctcgggcc gcttatcgta tgcaccaaga gggccaatgc 900

ggttgtaaaa ctgtatttga tattgccccg gcataccttc acgttgaatc cggagaggaa 960

ttgcgtaaga aactcttg 978

<210> 8

<211> 326

<212> PRT

<213> 人工序列

<220>

<223> 来自粪芽孢菌属的进行密码子优化的ddh

<400> 8

Met Ile Lys Ile Gly Ile Val Gly Tyr Gly Asn Leu Gly Arg Gly Val

1 5 10 15

Glu Cys Ala Val His His Ser Gln Asp Met Glu Leu Ala Gly Val Phe

20 25 30

Thr Arg Arg Asn Pro Glu Thr Val Lys Thr His Thr Asp Val Pro Val

35 40 45

Tyr Asp Met Glu Lys Leu Tyr Asp Met Gln Gly Asp Ile Asp Val Leu

50 55 60

Val Leu Cys Gly Gly Ser Ala Asn Asp Leu Pro Lys Gln Thr Val Glu

65 70 75 80

Leu Ala Gln Tyr Phe Asn Val Val Asp Ser Phe Asp Thr His Ala Lys

85 90 95

Ile Pro Glu His Phe Ser Asn Val Asn Gln Ser Ser Glu Lys Gly Lys

100 105 110

His Ile Ser Ile Ile Ser Val Gly Trp Asp Pro Gly Leu Phe Ser Leu

115 120 125

Asn Arg Leu Tyr Gly Gln Ala Ile Leu Pro Asn Gly Asn Asp Tyr Thr

130 135 140

Phe Trp Gly Lys Gly Val Ser Gln Gly His Ser Asp Ala Ile Arg Arg

145 150 155 160

Ile Ala Gly Val Lys Asp Ala Arg Gln Tyr Thr Ile Pro Val Asp Ala

165 170 175

Ala Leu Glu Ser Val Arg Asn Gly Glu Asn Pro Thr Leu Thr Thr Arg

180 185 190

Glu Lys His Thr Arg Glu Cys Phe Val Val Ala Glu Asp Gly Ala Asp

195 200 205

Leu Lys Val Ile Glu Glu Thr Ile Lys Thr Met Pro Asn Tyr Phe Ala

210 215 220

Asp Tyr Asp Thr Thr Val His Phe Ile Ser Glu Glu Glu Leu Met Arg

225 230 235 240

Asp His Gln Gly Ile Pro His Gly Gly Val Val Leu Arg Ser Gly Thr

245 250 255

Thr Gly Phe Asp Tyr Glu Asn Lys His Val Ile Glu Tyr Lys Leu Thr

260 265 270

Leu Asp Ser Asn Pro Glu Phe Thr Ser Ser Val Leu Val Ala Tyr Ala

275 280 285

Arg Ala Ala Tyr Arg Met His Gln Glu Gly Gln Cys Gly Cys Lys Thr

290 295 300

Val Phe Asp Ile Ala Pro Ala Tyr Leu His Val Glu Ser Gly Glu Glu

305 310 315 320

Leu Arg Lys Lys Leu Leu

325

<210> 9

<211> 981

<212> DNA

<213> 人工序列

<220>

<223> 来自竹节状甲烷鬃毛菌的进行密码子优化的ddh

<400> 9

atggaaaagc tccgcattgg catcgtagga tacggaaatg ttggccgggc tgtggagctg 60

tctcttcgcc aaaacccgga tatgatggcc gcagtcgtct tgacccgccg tgacccccgt 120

ggtattcgga cgctcacgcc cggtttgatg gcctcttcga ttgaggaggc tgaacggtac 180

gcttcagagg tcgacgtggc cgtactctgt ggcggtagcg ctacggacct tccagttcaa 240

ggaccggcta tggcgtcaat tttcaacact gtagattcct acgacaatca tccgcgcatc 300

ccagaatact ttgcagcagt agattctgcg gcacgccgtg gccgtcggac cgcaatcgtg 360

agcaccggtt gggatcccgg tctgttctcg ttgatccgcc tgcttgagga ggccgttttg 420

cccgaaggca ctgattatac gttttggggc cctggagtgt cccaaggaca ttctgacgct 480

gtacggcggg tcgaaggagt gcgtgatgcg cgccaatata ctatccctat cgaggacacc 540

gtggctcgcg tgcgttccgg cgaggcaccc tccctcagca cccgggaacg ccatcttcgt 600

cgttgctacg tggtggccga agagggagcc gaccccggtg agatccgtga gaaaattcgg 660

tcaatgccta attattttgc agattatgat accaaggtct cgtttatttc gcaggaagag 720

atggaacgca gccacaaccg gatgccacat ggtggtttcg ttatgcgtgc gggaaagacc 780

gccgacggaa cgggtcacgt ccttgagttc cgtcttaaat tggactctaa ccccgctttc 840

accgcatccg tgttgttggc ttatgcacgt gcagcatatc ggctgcacca agaaggcgca 900

attggcgcac ggaccgtatt tgatgtaccg ccagcgcatc tgtctcctaa aacgccagag 960

gagattcgtc gttccatgct t 981

<210> 10

<211> 327

<212> PRT

<213> 人工序列

<220>

<223> 来自竹节状甲烷鬃毛菌的进行密码子优化的ddh

<400> 10

Met Glu Lys Leu Arg Ile Gly Ile Val Gly Tyr Gly Asn Val Gly Arg

1 5 10 15

Ala Val Glu Leu Ser Leu Arg Gln Asn Pro Asp Met Met Ala Ala Val

20 25 30

Val Leu Thr Arg Arg Asp Pro Arg Gly Ile Arg Thr Leu Thr Pro Gly

35 40 45

Leu Met Ala Ser Ser Ile Glu Glu Ala Glu Arg Tyr Ala Ser Glu Val

50 55 60

Asp Val Ala Val Leu Cys Gly Gly Ser Ala Thr Asp Leu Pro Val Gln

65 70 75 80

Gly Pro Ala Met Ala Ser Ile Phe Asn Thr Val Asp Ser Tyr Asp Asn

85 90 95

His Pro Arg Ile Pro Glu Tyr Phe Ala Ala Val Asp Ser Ala Ala Arg

100 105 110

Arg Gly Arg Arg Thr Ala Ile Val Ser Thr Gly Trp Asp Pro Gly Leu

115 120 125

Phe Ser Leu Ile Arg Leu Leu Glu Glu Ala Val Leu Pro Glu Gly Thr

130 135 140

Asp Tyr Thr Phe Trp Gly Pro Gly Val Ser Gln Gly His Ser Asp Ala

145 150 155 160

Val Arg Arg Val Glu Gly Val Arg Asp Ala Arg Gln Tyr Thr Ile Pro

165 170 175

Ile Glu Asp Thr Val Ala Arg Val Arg Ser Gly Glu Ala Pro Ser Leu

180 185 190

Ser Thr Arg Glu Arg His Leu Arg Arg Cys Tyr Val Val Ala Glu Glu

195 200 205

Gly Ala Asp Pro Gly Glu Ile Arg Glu Lys Ile Arg Ser Met Pro Asn

210 215 220

Tyr Phe Ala Asp Tyr Asp Thr Lys Val Ser Phe Ile Ser Gln Glu Glu

225 230 235 240

Met Glu Arg Ser His Asn Arg Met Pro His Gly Gly Phe Val Met Arg

245 250 255

Ala Gly Lys Thr Ala Asp Gly Thr Gly His Val Leu Glu Phe Arg Leu

260 265 270

Lys Leu Asp Ser Asn Pro Ala Phe Thr Ala Ser Val Leu Leu Ala Tyr

275 280 285

Ala Arg Ala Ala Tyr Arg Leu His Gln Glu Gly Ala Ile Gly Ala Arg

290 295 300

Thr Val Phe Asp Val Pro Pro Ala His Leu Ser Pro Lys Thr Pro Glu

305 310 315 320

Glu Ile Arg Arg Ser Met Leu

325

<210> 11

<211> 972

<212> DNA

<213> 人工序列

<220>

<223> 来自微核巨球形菌的进行密码子优化的ddh

<400> 11

atggacaaaa ttcgcattgg tatcgtggga tacggcaacc tgggtcgggg agcggaggct 60

tcggtcaagc tccagccgga tatggagctg atcggtgttt tctctcggcg gaagggaatt 120

aagactgtgt cgggagtgcc tgcatatact atggacgaga tgctcaactt taagggtaaa 180

atcgatgtta tgattttgtg tggaggatcg gcaacggacc tgatcgaaca gacccctgcg 240

gtggcagccc actttacctg tattgactcc tttgatactc accctcggat taccgaacac 300

tttaataacg tagataaagc ggctaaagca gcaggtaccg ccgccctgat ttcatgtggt 360

tgggacccag gaatgttttc tcttcaacgt gttttcgcgg aagcaatttt gccccaaggc 420

aagtcttata cgttctgggg ccggggagtg tctcagggcc attcggacgc cattcggcgg 480

atcgatggag tcgtcgacgc gcggcagtat actgtaccaa aagataaata cctgaatgcc 540

atccgtaatg gtgaaatgcc cgaggtcact ggacaggagg cgcatctgcg tgactgctac 600

gttgtcgctg cggagggcgc agataaagct cggatcgaga acgaaattaa gaccatgaaa 660

aactattttg tgggatacga aaccgtagta cacttcattt cacaggagga actggaccgg 720

gatcacaagg gcattccgca cggtggtttc gtacttcgca gcggcgagtc gacccccggt 780

accaaacatg tggtggaata tcgcctccag ttggattcca acccggagtt tactggttct 840

gtgcttacgg cgtatgctcg cggccttaac cgcttggcta agcataaagc caccggagct 900

ttcacggtgt tcgatattcc tcccgcgtgg attagcgtac attctgacga ggagctgcgg 960

gcacactcac tg 972

<210> 12

<211> 324

<212> PRT

<213> 人工序列

<220>

<223> 来自微核巨球形菌的进行密码子优化的ddh

<400> 12

Met Asp Lys Ile Arg Ile Gly Ile Val Gly Tyr Gly Asn Leu Gly Arg

1 5 10 15

Gly Ala Glu Ala Ser Val Lys Leu Gln Pro Asp Met Glu Leu Ile Gly

20 25 30

Val Phe Ser Arg Arg Lys Gly Ile Lys Thr Val Ser Gly Val Pro Ala

35 40 45

Tyr Thr Met Asp Glu Met Leu Asn Phe Lys Gly Lys Ile Asp Val Met

50 55 60

Ile Leu Cys Gly Gly Ser Ala Thr Asp Leu Ile Glu Gln Thr Pro Ala

65 70 75 80

Val Ala Ala His Phe Thr Cys Ile Asp Ser Phe Asp Thr His Pro Arg

85 90 95

Ile Thr Glu His Phe Asn Asn Val Asp Lys Ala Ala Lys Ala Ala Gly

100 105 110

Thr Ala Ala Leu Ile Ser Cys Gly Trp Asp Pro Gly Met Phe Ser Leu

115 120 125

Gln Arg Val Phe Ala Glu Ala Ile Leu Pro Gln Gly Lys Ser Tyr Thr

130 135 140

Phe Trp Gly Arg Gly Val Ser Gln Gly His Ser Asp Ala Ile Arg Arg

145 150 155 160

Ile Asp Gly Val Val Asp Ala Arg Gln Tyr Thr Val Pro Lys Asp Lys

165 170 175

Tyr Leu Asn Ala Ile Arg Asn Gly Glu Met Pro Glu Val Thr Gly Gln

180 185 190

Glu Ala His Leu Arg Asp Cys Tyr Val Val Ala Ala Glu Gly Ala Asp

195 200 205

Lys Ala Arg Ile Glu Asn Glu Ile Lys Thr Met Lys Asn Tyr Phe Val

210 215 220

Gly Tyr Glu Thr Val Val His Phe Ile Ser Gln Glu Glu Leu Asp Arg

225 230 235 240

Asp His Lys Gly Ile Pro His Gly Gly Phe Val Leu Arg Ser Gly Glu

245 250 255

Ser Thr Pro Gly Thr Lys His Val Val Glu Tyr Arg Leu Gln Leu Asp

260 265 270

Ser Asn Pro Glu Phe Thr Gly Ser Val Leu Thr Ala Tyr Ala Arg Gly

275 280 285

Leu Asn Arg Leu Ala Lys His Lys Ala Thr Gly Ala Phe Thr Val Phe

290 295 300

Asp Ile Pro Pro Ala Trp Ile Ser Val His Ser Asp Glu Glu Leu Arg

305 310 315 320

Ala His Ser Leu

<210> 13

<211> 1002

<212> DNA

<213> 人工序列

<220>

<223> 来自反硝化无色杆菌的进行密码子优化的ddh

<400> 13

atgggtcttg ataacaatgc acgcacggcc atccgtatcg gtatcgttgg atacggcaac 60

cttggacgtg gtgtggaagc ggcagtcgcc cgcaattcgg atatggcagt tgccggaatt 120

tacacgcggc gtgaccctgc ccaaattgaa cccatgggcg cgggagtgcc agtgcacgcc 180

atggactcgc tccctggtca taaaggttcg attgatgttc tggtactttg cggaggctca 240

aaagatgatc tgccgcgcca atcccccgag ttggccgctc actttagcct ggttgattcc 300

tttgacaccc atgctcggat cccagagcac ttcgctgcgg ttgacgcggc ggcgcaagca 360

ggacgtacga cggcactgat ttctgcaggt tgggacccgg gaatgttttc catcaatcgg 420

gtaatgggcg aggccctctt gccggatggc gccacctata cgttctgggg caagggactc 480

tcccagggcc actctgatgc ggtgcgtcgg gttccgggcg tagctggcgg tgtgcagtat 540

actatccccg tggacgaagc ggtagctcag gtacggtccg gtttgcgtcc tgccctcacc 600

acgcgggaaa aacaccggcg cgaatgcttc gttgtactcg aagcgggagc agacgcctcg 660

gccgtgcgta agacgattgt tacgatgccc cattattttg atgagtatga caccactgta 720

cactttatcg gcgccgagga attggctcgg gaacacggcg ccatgccgca cggcggattt 780

gtcatccgct caggtaatac ctctcaggaa aacaaacagg taatcgagta tcgtctccaa 840

ctcgactcta accctgaatt taccagctct gtcctcgtcg catatgcacg tgccgtacat 900

cgtatgcaac aggccggtca gtggggctgc aagacggtat ttgatgttgc gccaggcctg 960

ctgtctccgc gctcggcggc cgaactccgc gctcaacttc tt 1002

<210> 14

<211> 334

<212> PRT

<213> 人工序列

<220>

<223> 来自反硝化无色杆菌的进行密码子优化的ddh

<400> 14

Met Gly Leu Asp Asn Asn Ala Arg Thr Ala Ile Arg Ile Gly Ile Val

1 5 10 15

Gly Tyr Gly Asn Leu Gly Arg Gly Val Glu Ala Ala Val Ala Arg Asn

20 25 30

Ser Asp Met Ala Val Ala Gly Ile Tyr Thr Arg Arg Asp Pro Ala Gln

35 40 45

Ile Glu Pro Met Gly Ala Gly Val Pro Val His Ala Met Asp Ser Leu

50 55 60

Pro Gly His Lys Gly Ser Ile Asp Val Leu Val Leu Cys Gly Gly Ser

65 70 75 80

Lys Asp Asp Leu Pro Arg Gln Ser Pro Glu Leu Ala Ala His Phe Ser

85 90 95

Leu Val Asp Ser Phe Asp Thr His Ala Arg Ile Pro Glu His Phe Ala

100 105 110

Ala Val Asp Ala Ala Ala Gln Ala Gly Arg Thr Thr Ala Leu Ile Ser

115 120 125

Ala Gly Trp Asp Pro Gly Met Phe Ser Ile Asn Arg Val Met Gly Glu

130 135 140

Ala Leu Leu Pro Asp Gly Ala Thr Tyr Thr Phe Trp Gly Lys Gly Leu

145 150 155 160

Ser Gln Gly His Ser Asp Ala Val Arg Arg Val Pro Gly Val Ala Gly

165 170 175

Gly Val Gln Tyr Thr Ile Pro Val Asp Glu Ala Val Ala Gln Val Arg

180 185 190

Ser Gly Leu Arg Pro Ala Leu Thr Thr Arg Glu Lys His Arg Arg Glu

195 200 205

Cys Phe Val Val Leu Glu Ala Gly Ala Asp Ala Ser Ala Val Arg Lys

210 215 220

Thr Ile Val Thr Met Pro His Tyr Phe Asp Glu Tyr Asp Thr Thr Val

225 230 235 240

His Phe Ile Gly Ala Glu Glu Leu Ala Arg Glu His Gly Ala Met Pro

245 250 255

His Gly Gly Phe Val Ile Arg Ser Gly Asn Thr Ser Gln Glu Asn Lys

260 265 270

Gln Val Ile Glu Tyr Arg Leu Gln Leu Asp Ser Asn Pro Glu Phe Thr

275 280 285

Ser Ser Val Leu Val Ala Tyr Ala Arg Ala Val His Arg Met Gln Gln

290 295 300

Ala Gly Gln Trp Gly Cys Lys Thr Val Phe Asp Val Ala Pro Gly Leu

305 310 315 320

Leu Ser Pro Arg Ser Ala Ala Glu Leu Arg Ala Gln Leu Leu

325 330

<210> 15

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 来自藤黄微球菌的进行密码子优化的ddh

<400> 15

atgaccattc gcgcgggaat tgtaggatat ggaaacctgg gtcgctctgt agaaaaactt 60

gttaaactgc agccggacat ggaacttgtt ggcatttttt cccggcggac tggactcgac 120

acggataccc cagtacttcc tgcggaacgt gcggccgagc acgcgggtga gattgatgtg 180

ctttttctgt gccttggaag cgcgactgat attccagagc aagcggccgg ttacgcacgc 240

cacttcacga ccgttgatac gtatgataac catcaactga tcccacggca tcggtctgaa 300

atggatgctg cggcccggga gggcggccac gtagcgatga tctcaactgg atgggaccca 360

ggactttttt ctgtcaatcg ggtccttgga gccgcccttt ttccgcagcc ccagcaaaat 420

actttttggg gcaagggcct ctcacaaggt cactcggatg cagtgcggcg ggtgccgggt 480

gtacggcgtg gcgttcagta cactattccg tcagaggaag cgattgcaga ggcccgggct 540

ggtcgcggtg cagagattac tggtgcgtcg gctcatgttc gggagtgtta cgtcgttgca 600

gacgaggcag atcatgctgc tatcactgag gcgatcacca ccatgccgga ttactttgcc 660

ccctatgaga cgaccgtaca ctttatttcg gaggaagaat ttgagcggga tcatcagggt 720

atgccacacg gaggccacgt tgtcacgtct ggtgacttgg gaggctctcg ctctgcggta 780

gaatttgtcc tcgaactcga atctaatcct gactttaccg cagcagccca ggtagcctat 840

ggccgggccg ccgctcgcct taaggcccag ggtgagactg gcgctcgtac ggtacttgag 900

gtcgctccct atcttctgtc accgacgggt ttggatgagc tgattcgccg cgacgtg 957

<210> 16

<211> 319

<212> PRT

<213> 人工序列

<220>

<223> 来自藤黄微球菌的进行密码子优化的ddh

<400> 16

Met Thr Ile Arg Ala Gly Ile Val Gly Tyr Gly Asn Leu Gly Arg Ser

1 5 10 15

Val Glu Lys Leu Val Lys Leu Gln Pro Asp Met Glu Leu Val Gly Ile

20 25 30

Phe Ser Arg Arg Thr Gly Leu Asp Thr Asp Thr Pro Val Leu Pro Ala

35 40 45

Glu Arg Ala Ala Glu His Ala Gly Glu Ile Asp Val Leu Phe Leu Cys

50 55 60

Leu Gly Ser Ala Thr Asp Ile Pro Glu Gln Ala Ala Gly Tyr Ala Arg

65 70 75 80

His Phe Thr Thr Val Asp Thr Tyr Asp Asn His Gln Leu Ile Pro Arg

85 90 95

His Arg Ser Glu Met Asp Ala Ala Ala Arg Glu Gly Gly His Val Ala

100 105 110

Met Ile Ser Thr Gly Trp Asp Pro Gly Leu Phe Ser Val Asn Arg Val

115 120 125

Leu Gly Ala Ala Leu Phe Pro Gln Pro Gln Gln Asn Thr Phe Trp Gly

130 135 140

Lys Gly Leu Ser Gln Gly His Ser Asp Ala Val Arg Arg Val Pro Gly

145 150 155 160

Val Arg Arg Gly Val Gln Tyr Thr Ile Pro Ser Glu Glu Ala Ile Ala

165 170 175

Glu Ala Arg Ala Gly Arg Gly Ala Glu Ile Thr Gly Ala Ser Ala His

180 185 190

Val Arg Glu Cys Tyr Val Val Ala Asp Glu Ala Asp His Ala Ala Ile

195 200 205

Thr Glu Ala Ile Thr Thr Met Pro Asp Tyr Phe Ala Pro Tyr Glu Thr

210 215 220

Thr Val His Phe Ile Ser Glu Glu Glu Phe Glu Arg Asp His Gln Gly

225 230 235 240

Met Pro His Gly Gly His Val Val Thr Ser Gly Asp Leu Gly Gly Ser

245 250 255

Arg Ser Ala Val Glu Phe Val Leu Glu Leu Glu Ser Asn Pro Asp Phe

260 265 270

Thr Ala Ala Ala Gln Val Ala Tyr Gly Arg Ala Ala Ala Arg Leu Lys

275 280 285

Ala Gln Gly Glu Thr Gly Ala Arg Thr Val Leu Glu Val Ala Pro Tyr

290 295 300

Leu Leu Ser Pro Thr Gly Leu Asp Glu Leu Ile Arg Arg Asp Val

305 310 315

<210> 17

<211> 981

<212> DNA

<213> 人工序列

<220>

<223> 来自粪短杆菌的进行密码子优化的ddh

<400> 17

atgaccgttc atcgtattgg catcgtagga tatggaaacc tcggacgtgg agtagagatc 60

gcgaccagct tgcaggaaga catgcaactc gttggtgtct tcacgcgccg cgacccttca 120

acggtaagca ccgttcatgc tcagacgcca gtacgctcaa tcgacgccct tgaggagatg 180

caagacgaaa ttgatgtgct cgttctttgt ggtggatcac gtaccgacct tcctgaacag 240

acgccccagt tggctgaacg gtttactgtg gttgattcgt ttgacaccca cgcgcggatt 300

cctgagcatt tcgccaaagt tgatgcagcg gcgcgcgctg ctggaaccac cgccctgatt 360

tccactggct gggatccagg cttgttttcg atcaatcgtg tatatggcga agcaatcctt 420

gcgactggaa ctacctacac cttttggggt cggggacttt cccagggcca ctccgatgct 480

gtacggcggg tcgatggcgt agctgctgcc gtacagtaca ctgtaccgag ccaagaagcg 540

attgctcggg tgcgggccgg cgaacagccc acgctgtcga cgcgggaaaa acacacccgg 600

gaatgtttcg tcgttttgga ggatggcgcg gatgctgaga ctgtccgcga ggagatcgta 660

accatgcccc actattttga accttatgac actaccgtaa ccttcctgtc tgcagaggaa 720

ctggcgcgcg atcaccaggg catgccgcac ggcggttttg tgattcggtc aggagagtca 780

agcccaggca ctacccagac tattgaatac cggcttcagg aagactctaa cccggaattt 840

actgcgtcgg tccttgtcgc atatactcgt gctgccgccc ggctcgcagc cgccggcgaa 900

catggtgcta agactccttt cgacgttgcc ccgggccttc tgtccccgaa gtcgcccgaa 960

cagctgcgcg ccgagctcct g 981

<210> 18

<211> 327

<212> PRT

<213> 人工序列

<220>

<223> 来自粪短杆菌的进行密码子优化的ddh

<400> 18

Met Thr Val His Arg Ile Gly Ile Val Gly Tyr Gly Asn Leu Gly Arg

1 5 10 15

Gly Val Glu Ile Ala Thr Ser Leu Gln Glu Asp Met Gln Leu Val Gly

20 25 30

Val Phe Thr Arg Arg Asp Pro Ser Thr Val Ser Thr Val His Ala Gln

35 40 45

Thr Pro Val Arg Ser Ile Asp Ala Leu Glu Glu Met Gln Asp Glu Ile

50 55 60

Asp Val Leu Val Leu Cys Gly Gly Ser Arg Thr Asp Leu Pro Glu Gln

65 70 75 80

Thr Pro Gln Leu Ala Glu Arg Phe Thr Val Val Asp Ser Phe Asp Thr

85 90 95

His Ala Arg Ile Pro Glu His Phe Ala Lys Val Asp Ala Ala Ala Arg

100 105 110

Ala Ala Gly Thr Thr Ala Leu Ile Ser Thr Gly Trp Asp Pro Gly Leu

115 120 125

Phe Ser Ile Asn Arg Val Tyr Gly Glu Ala Ile Leu Ala Thr Gly Thr

130 135 140

Thr Tyr Thr Phe Trp Gly Arg Gly Leu Ser Gln Gly His Ser Asp Ala

145 150 155 160

Val Arg Arg Val Asp Gly Val Ala Ala Ala Val Gln Tyr Thr Val Pro

165 170 175

Ser Gln Glu Ala Ile Ala Arg Val Arg Ala Gly Glu Gln Pro Thr Leu

180 185 190

Ser Thr Arg Glu Lys His Thr Arg Glu Cys Phe Val Val Leu Glu Asp

195 200 205

Gly Ala Asp Ala Glu Thr Val Arg Glu Glu Ile Val Thr Met Pro His

210 215 220

Tyr Phe Glu Pro Tyr Asp Thr Thr Val Thr Phe Leu Ser Ala Glu Glu

225 230 235 240

Leu Ala Arg Asp His Gln Gly Met Pro His Gly Gly Phe Val Ile Arg

245 250 255

Ser Gly Glu Ser Ser Pro Gly Thr Thr Gln Thr Ile Glu Tyr Arg Leu

260 265 270

Gln Glu Asp Ser Asn Pro Glu Phe Thr Ala Ser Val Leu Val Ala Tyr

275 280 285

Thr Arg Ala Ala Ala Arg Leu Ala Ala Ala Gly Glu His Gly Ala Lys

290 295 300

Thr Pro Phe Asp Val Ala Pro Gly Leu Leu Ser Pro Lys Ser Pro Glu

305 310 315 320

Gln Leu Arg Ala Glu Leu Leu

325

<210> 19

<211> 975

<212> DNA

<213> 人工序列

<220>

<223> 来自肉食杆菌属的进行密码子优化的ddh

<400> 19

atgactaaca agattcggat tggtcttgtg ggttacggta acatcggaaa gggcgtcgaa 60

ttggcgctgg aagagtttcc tgacatggaa ggcattgcgg tcttcactcg tcggaatccc 120

gaagatctcg attcaaagct caaagctatc tctttggacc acattcttga ttaccaggaa 180

gatctggacg ttttgatcct ttgcggcgga agcgccaccg atttgcctgg tcagggtcct 240

gctcttgcaa agcatttctc tacgattgac tcctacgata atcacaatca aattcctgaa 300

tatttcgaaa ctatggacca atctgcaaag gcaggcaaga acatttcaat tatctcggtc 360

ggctgggatc cgggactgtt ctcactgaat cgggccgttt tcgagtccat ccttccggcg 420

ggagagactt acactttttg gggcaaagga ctgtcccagg gccactccga cgccattcgt 480

cggattgatg gcgtcaagtt tggcgttcaa tacaccattc ccgtcgaaac cgcactggag 540

gaagtacggt ctggatcgaa tccgaccctt tccactcggg agaagcacaa acgtgtgtgc 600

tacgttgtag cggaagcggg ctccgaccag aatttgattg aggaaacgat taaaaccatg 660

ccggactact tcgagccgta cgacacgacc gtccatttca tcgacgagaa aacgttcaag 720

gaggagcatc agaaaatgcc acatggtggc ttcgtgatcc gtactgcaac ttcagctacg 780

ggcaacaagc agaaagctga gttccagctc gaattggagt ccaatgcaga attcacttct 840

tcaatcctcg ttgcgtacgc tcgtgccgcc tacaagttta agaaagatgg caagtctggc 900

gctctttcgg tgctggatgt ccctccggca tacctgtctc caaagtcggc agcgcagctc 960

cgcaaggagc tcctg 975

<210> 20

<211> 325

<212> PRT

<213> 人工序列

<220>

<223> 来自肉食杆菌属的进行密码子优化的ddh

<400> 20

Met Thr Asn Lys Ile Arg Ile Gly Leu Val Gly Tyr Gly Asn Ile Gly

1 5 10 15

Lys Gly Val Glu Leu Ala Leu Glu Glu Phe Pro Asp Met Glu Gly Ile

20 25 30

Ala Val Phe Thr Arg Arg Asn Pro Glu Asp Leu Asp Ser Lys Leu Lys

35 40 45

Ala Ile Ser Leu Asp His Ile Leu Asp Tyr Gln Glu Asp Leu Asp Val

50 55 60

Leu Ile Leu Cys Gly Gly Ser Ala Thr Asp Leu Pro Gly Gln Gly Pro

65 70 75 80

Ala Leu Ala Lys His Phe Ser Thr Ile Asp Ser Tyr Asp Asn His Asn

85 90 95

Gln Ile Pro Glu Tyr Phe Glu Thr Met Asp Gln Ser Ala Lys Ala Gly

100 105 110

Lys Asn Ile Ser Ile Ile Ser Val Gly Trp Asp Pro Gly Leu Phe Ser

115 120 125

Leu Asn Arg Ala Val Phe Glu Ser Ile Leu Pro Ala Gly Glu Thr Tyr

130 135 140

Thr Phe Trp Gly Lys Gly Leu Ser Gln Gly His Ser Asp Ala Ile Arg

145 150 155 160

Arg Ile Asp Gly Val Lys Phe Gly Val Gln Tyr Thr Ile Pro Val Glu

165 170 175

Thr Ala Leu Glu Glu Val Arg Ser Gly Ser Asn Pro Thr Leu Ser Thr

180 185 190

Arg Glu Lys His Lys Arg Val Cys Tyr Val Val Ala Glu Ala Gly Ser

195 200 205

Asp Gln Asn Leu Ile Glu Glu Thr Ile Lys Thr Met Pro Asp Tyr Phe

210 215 220

Glu Pro Tyr Asp Thr Thr Val His Phe Ile Asp Glu Lys Thr Phe Lys

225 230 235 240

Glu Glu His Gln Lys Met Pro His Gly Gly Phe Val Ile Arg Thr Ala

245 250 255

Thr Ser Ala Thr Gly Asn Lys Gln Lys Ala Glu Phe Gln Leu Glu Leu

260 265 270

Glu Ser Asn Ala Glu Phe Thr Ser Ser Ile Leu Val Ala Tyr Ala Arg

275 280 285

Ala Ala Tyr Lys Phe Lys Lys Asp Gly Lys Ser Gly Ala Leu Ser Val

290 295 300

Leu Asp Val Pro Pro Ala Tyr Leu Ser Pro Lys Ser Ala Ala Gln Leu

305 310 315 320

Arg Lys Glu Leu Leu

325

<210> 21

<211> 1062

<212> DNA

<213> 人工序列

<220>

<223> 来自詹氏甲烷球菌的进行密码子优化的asd

<400> 21

atgtccaagg gagaaaaaat gaagatcaag gttggcgtat tgggtgctac cggatcggtt 60

ggccaacgct ttgtgcagct gcttgcagac caccccatgt tcgaattgac tgctctggca 120

gcaagcgaac ggtccgcggg taaaaaatac aaagatgctt gttactggtt tcaagatcgg 180

gacattccag aaaatattaa ggatatggtt gtaattccga cggatccgaa gcacgaagaa 240

ttcgaagacg ttgatattgt ttttagcgcg ctgccctcgg atctggctaa aaaattcgaa 300

cccgaattcg cgaaagaagg aaagctgatc ttcagcaacg catcagccta tcgtatggag 360

gaagatgtgc cgcttgtaat tccagaggta aacgctgatc acctcgaatt gattgaaatt 420

cagcgcgaga agcggggttg ggacggagcc attatcacta acccaaactg ttcaaccatt 480

tgcgccgtaa tcacccttaa gccaattatg gacaaattcg gtcttgaagc ggtgtttatc 540

gctaccatgc aggctgtatc gggcgcagga tacaacggtg tcccgagcat ggctattctg 600

gataacttga ttccctttat taagaatgag gaggagaaga tgcagactga atcgcttaag 660

ttgctgggca cgcttaagga tggaaaagtg gaactcgcta acttcaaaat cagcgcatca 720

tgcaatcgtg tggctgtgat cgacggccac accgaatcga tcttcgtgaa gaccaaggag 780

ggtgcggaac ctgaggaaat taaagaagtg atggacaaat ttgatcctct taaagacctt 840

aaccttccga cgtatgccaa accaatcgta attcgcgaag agatcgatcg cccacagcca 900

cgtcttgacc gcaatgaggg taatggcatg tctattgtcg ttggtcgtat ccgtaaagat 960

ccgatttttg atgttaagta caccgccctg gaacataaca ctatccgtgg cgccgcgggc 1020

gcatcagtgt tgaatgcgga gtatttcgta aagaaataca tc 1062

<210> 22

<211> 354

<212> PRT

<213> 人工序列

<220>

<223> 来自詹氏甲烷球菌的进行密码子优化的asd

<400> 22

Met Ser Lys Gly Glu Lys Met Lys Ile Lys Val Gly Val Leu Gly Ala

1 5 10 15

Thr Gly Ser Val Gly Gln Arg Phe Val Gln Leu Leu Ala Asp His Pro

20 25 30

Met Phe Glu Leu Thr Ala Leu Ala Ala Ser Glu Arg Ser Ala Gly Lys

35 40 45

Lys Tyr Lys Asp Ala Cys Tyr Trp Phe Gln Asp Arg Asp Ile Pro Glu

50 55 60

Asn Ile Lys Asp Met Val Val Ile Pro Thr Asp Pro Lys His Glu Glu

65 70 75 80

Phe Glu Asp Val Asp Ile Val Phe Ser Ala Leu Pro Ser Asp Leu Ala

85 90 95

Lys Lys Phe Glu Pro Glu Phe Ala Lys Glu Gly Lys Leu Ile Phe Ser

100 105 110

Asn Ala Ser Ala Tyr Arg Met Glu Glu Asp Val Pro Leu Val Ile Pro

115 120 125

Glu Val Asn Ala Asp His Leu Glu Leu Ile Glu Ile Gln Arg Glu Lys

130 135 140

Arg Gly Trp Asp Gly Ala Ile Ile Thr Asn Pro Asn Cys Ser Thr Ile

145 150 155 160

Cys Ala Val Ile Thr Leu Lys Pro Ile Met Asp Lys Phe Gly Leu Glu

165 170 175

Ala Val Phe Ile Ala Thr Met Gln Ala Val Ser Gly Ala Gly Tyr Asn

180 185 190

Gly Val Pro Ser Met Ala Ile Leu Asp Asn Leu Ile Pro Phe Ile Lys

195 200 205

Asn Glu Glu Glu Lys Met Gln Thr Glu Ser Leu Lys Leu Leu Gly Thr

210 215 220

Leu Lys Asp Gly Lys Val Glu Leu Ala Asn Phe Lys Ile Ser Ala Ser

225 230 235 240

Cys Asn Arg Val Ala Val Ile Asp Gly His Thr Glu Ser Ile Phe Val

245 250 255

Lys Thr Lys Glu Gly Ala Glu Pro Glu Glu Ile Lys Glu Val Met Asp

260 265 270

Lys Phe Asp Pro Leu Lys Asp Leu Asn Leu Pro Thr Tyr Ala Lys Pro

275 280 285

Ile Val Ile Arg Glu Glu Ile Asp Arg Pro Gln Pro Arg Leu Asp Arg

290 295 300

Asn Glu Gly Asn Gly Met Ser Ile Val Val Gly Arg Ile Arg Lys Asp

305 310 315 320

Pro Ile Phe Asp Val Lys Tyr Thr Ala Leu Glu His Asn Thr Ile Arg

325 330 335

Gly Ala Ala Gly Ala Ser Val Leu Asn Ala Glu Tyr Phe Val Lys Lys

340 345 350

Tyr Ile

<210> 23

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 来自普通索利氏菌的进行密码子优化的asd

<400> 23

atgcagacgc ggatcgaggt aggaattctt ggagcgactg gtatggtcgg tcagcacttt 60

atcaaatttt tgcaaggcca cccttggttc gatctcaagt ggctgggtgc ttcagaccgc 120

tccgccggta aacagtacaa agacgcgatg acctggcatc ttgctggagg aaccccagat 180

tcagtcgctg gtctcaccgt cgaagaatgc aaacccggca atgccccccg tctgcttttc 240

agcgctatgg acgctggagt tgcgaccgat attgaacgtg cgtttgcgca ggcgggtcat 300

gtggttgtct cgaatagccg caaccaccgg atggagcaag acgttccttt gatggtgcct 360

gagattaacc cagatcatct gaagctggta ccgggacaac aacgcgcgcg gggatggaaa 420

ggacagattg tcacgaaccc gaattgctct acgatcggtc tggtgatggg tctcggtcca 480

atgaaacagt tcggcattac gaagatcctt gttaccacga tgcaggctat ttcaggcgca 540

ggatacccag gagtagcatc catggatatt atgggtaacg ttgtccccta catcggctct 600

gaagaggaaa agatggagat ggaaactcaa aaaattatgg gtgatttcgc gggcgatcgc 660

atcgtgccgc ttgcagcaaa ggtctcggcc cactgcaatc gggtaggcgt tgttgacggc 720

catacggaaa ctgtgtcagt cgaattctct atgaaaccaa cggaggcaga tttgcgccat 780

gcgatcgaat cctttactgc agtgccccag gaacgcaagc tcccgagcgc accaggacgt 840

ccggttatct atatgaagga agccaaccgg ccccaacctc gtaaggatgc tgaacgggag 900

cgtggcatgg cagcgtttgt tggtcgcctc cgggcatgcc cggtactgga ttataaattt 960

gtggtcctgt cccacaatac gattcgcggc gcagcaggcg cagcagtctt gaatgccgaa 1020

ctcatgcact cagagggaat gttggat 1047

<210> 24

<211> 349

<212> PRT

<213> 人工序列

<220>

<223> 来自普通索利氏菌的进行密码子优化的asd

<400> 24

Met Gln Thr Arg Ile Glu Val Gly Ile Leu Gly Ala Thr Gly Met Val

1 5 10 15

Gly Gln His Phe Ile Lys Phe Leu Gln Gly His Pro Trp Phe Asp Leu

20 25 30

Lys Trp Leu Gly Ala Ser Asp Arg Ser Ala Gly Lys Gln Tyr Lys Asp

35 40 45

Ala Met Thr Trp His Leu Ala Gly Gly Thr Pro Asp Ser Val Ala Gly

50 55 60

Leu Thr Val Glu Glu Cys Lys Pro Gly Asn Ala Pro Arg Leu Leu Phe

65 70 75 80

Ser Ala Met Asp Ala Gly Val Ala Thr Asp Ile Glu Arg Ala Phe Ala

85 90 95

Gln Ala Gly His Val Val Val Ser Asn Ser Arg Asn His Arg Met Glu

100 105 110

Gln Asp Val Pro Leu Met Val Pro Glu Ile Asn Pro Asp His Leu Lys

115 120 125

Leu Val Pro Gly Gln Gln Arg Ala Arg Gly Trp Lys Gly Gln Ile Val

130 135 140

Thr Asn Pro Asn Cys Ser Thr Ile Gly Leu Val Met Gly Leu Gly Pro

145 150 155 160

Met Lys Gln Phe Gly Ile Thr Lys Ile Leu Val Thr Thr Met Gln Ala

165 170 175

Ile Ser Gly Ala Gly Tyr Pro Gly Val Ala Ser Met Asp Ile Met Gly

180 185 190

Asn Val Val Pro Tyr Ile Gly Ser Glu Glu Glu Lys Met Glu Met Glu

195 200 205

Thr Gln Lys Ile Met Gly Asp Phe Ala Gly Asp Arg Ile Val Pro Leu

210 215 220

Ala Ala Lys Val Ser Ala His Cys Asn Arg Val Gly Val Val Asp Gly

225 230 235 240

His Thr Glu Thr Val Ser Val Glu Phe Ser Met Lys Pro Thr Glu Ala

245 250 255

Asp Leu Arg His Ala Ile Glu Ser Phe Thr Ala Val Pro Gln Glu Arg

260 265 270

Lys Leu Pro Ser Ala Pro Gly Arg Pro Val Ile Tyr Met Lys Glu Ala

275 280 285

Asn Arg Pro Gln Pro Arg Lys Asp Ala Glu Arg Glu Arg Gly Met Ala

290 295 300

Ala Phe Val Gly Arg Leu Arg Ala Cys Pro Val Leu Asp Tyr Lys Phe

305 310 315 320

Val Val Leu Ser His Asn Thr Ile Arg Gly Ala Ala Gly Ala Ala Val

325 330 335

Leu Asn Ala Glu Leu Met His Ser Glu Gly Met Leu Asp

340 345

<210> 25

<211> 1032

<212> DNA

<213> 人工序列

<220>

<223> 来自内部盐碱湖菌的进行密码子优化的asd

<400> 25

atggcagtgc gggtaggtgt attgggcgct acgggagcag tgggtcaacg gcttatccag 60

ctcctcgagc ctcaccctga attcgaaatt gctgctctca ccgcgtcgga gtcttccgct 120

ggtaaaactt atcgtcaggc ggcgaaatgg cgcgtagact ccccaatccc tgacgacgtc 180

gcagagatga ccgtaagcgc aacggatccc gatgaggttc cggatgacgt agatttgctg 240

ttcagcagct tgccgtcaag cgtcggcgaa caggtagagc ccgctttttg cgaagccgga 300

tacgtgatgt cgtccaattc ttctaatgct cgtatggcgg atgacgtccc acttgttatc 360

ccagaggtaa atgctgaaca tattgatctt cttgaggtcc aacgcgatga acgtggatgg 420

gatggcgcga tggtaaaaaa ccctaattgt tcaactatta cctttgtccc aactcttgcg 480

gcccttgagc agtttggcct ggaggaagtc cacgttgcaa cgctgcaagc ggtgtccggt 540

gcaggttatg atggagtctc ctccatggag atcattgaca atgcaattcc ttatattgga 600

tcggaagaag agaaactgga aacggaatct cgtaagctcc tgggagaatt tgacggcgct 660

gaactgtcgc ataactcagt tgaagtcgca gcttcgtgca accgtatccc gaccattgac 720

ggacacttgg agaacgtgtg ggttgagacc gaagacgacc ttacgcccga agatgccgcg 780

gatgcaatgc gcgcgtatcc atcgttggag cttcgttcat ctccggacca gctgattcat 840

gtctttgatg aaccagaccg cccgcaaccg cggatggacc ggactttggg agacggaatg 900

gcaatcgcgg ctggtggttt gcgtgaatcg actttcgacc ttcaatacaa ttgcttggct 960

cataacacca tccggggtgc agcgggagcc tcggttctga acggagagct gttgttggac 1020

caaggttata tt 1032

<210> 26

<211> 344

<212> PRT

<213> 人工序列

<220>

<223> 来自内部盐碱湖菌的进行密码子优化的asd

<400> 26

Met Ala Val Arg Val Gly Val Leu Gly Ala Thr Gly Ala Val Gly Gln

1 5 10 15

Arg Leu Ile Gln Leu Leu Glu Pro His Pro Glu Phe Glu Ile Ala Ala

20 25 30

Leu Thr Ala Ser Glu Ser Ser Ala Gly Lys Thr Tyr Arg Gln Ala Ala

35 40 45

Lys Trp Arg Val Asp Ser Pro Ile Pro Asp Asp Val Ala Glu Met Thr

50 55 60

Val Ser Ala Thr Asp Pro Asp Glu Val Pro Asp Asp Val Asp Leu Leu

65 70 75 80

Phe Ser Ser Leu Pro Ser Ser Val Gly Glu Gln Val Glu Pro Ala Phe

85 90 95

Cys Glu Ala Gly Tyr Val Met Ser Ser Asn Ser Ser Asn Ala Arg Met

100 105 110

Ala Asp Asp Val Pro Leu Val Ile Pro Glu Val Asn Ala Glu His Ile

115 120 125

Asp Leu Leu Glu Val Gln Arg Asp Glu Arg Gly Trp Asp Gly Ala Met

130 135 140

Val Lys Asn Pro Asn Cys Ser Thr Ile Thr Phe Val Pro Thr Leu Ala

145 150 155 160

Ala Leu Glu Gln Phe Gly Leu Glu Glu Val His Val Ala Thr Leu Gln

165 170 175

Ala Val Ser Gly Ala Gly Tyr Asp Gly Val Ser Ser Met Glu Ile Ile

180 185 190

Asp Asn Ala Ile Pro Tyr Ile Gly Ser Glu Glu Glu Lys Leu Glu Thr

195 200 205

Glu Ser Arg Lys Leu Leu Gly Glu Phe Asp Gly Ala Glu Leu Ser His

210 215 220

Asn Ser Val Glu Val Ala Ala Ser Cys Asn Arg Ile Pro Thr Ile Asp

225 230 235 240

Gly His Leu Glu Asn Val Trp Val Glu Thr Glu Asp Asp Leu Thr Pro

245 250 255

Glu Asp Ala Ala Asp Ala Met Arg Ala Tyr Pro Ser Leu Glu Leu Arg

260 265 270

Ser Ser Pro Asp Gln Leu Ile His Val Phe Asp Glu Pro Asp Arg Pro

275 280 285

Gln Pro Arg Met Asp Arg Thr Leu Gly Asp Gly Met Ala Ile Ala Ala

290 295 300

Gly Gly Leu Arg Glu Ser Thr Phe Asp Leu Gln Tyr Asn Cys Leu Ala

305 310 315 320

His Asn Thr Ile Arg Gly Ala Ala Gly Ala Ser Val Leu Asn Gly Glu

325 330 335

Leu Leu Leu Asp Gln Gly Tyr Ile

340

<210> 27

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 来自嗜热光合绿曲菌的进行密码子优化的asd

<400> 27

atggccacta ttccagtcgc cgttctgggt gccacgggtg ccgtgggtca acggttcatt 60

cagttgcttg agggtcaccc gctttttcag gtagttgccc tgactggcag cgagcgttcc 120

gctggtaaaa aataccacga ggtgtgtcgt tgggttttgg atactcctat gcccgcagcg 180

gttgcaaacc tgacggtact ggatgcagac gcagacctcc ccgcacagct cgtgttctcc 240

gcgctcccgt ctaccgtcgc cggcccgatc gaacaacgtc ttgctgctgc tggtcatatc 300

gtgtgctcca acgcttcgaa ccatcgtatg gagccagatg tgccactcat tattcccgaa 360

gtcaacccgg accatcttgc cttgattccc gttcaacgcc gccgccgtgg ttggtccggt 420

gctattgtta ccaacccaaa ctgcacttcc acgccggcga cgatggtgtt gcgccctttg 480

ctcgatacct ttggagtccg gcgcatgctt ttggtgtcaa tgcaagccct ctctggagcc 540

ggctacccag gtgtgccctc atacgatgta gttgataacg tgatccccta catcggtgga 600

gaagaaccaa aactcgagat tgagccgcag aaaatgctgg gacgtctgga aggagaaacg 660

attgttccag caggcttcac gacttccgca cactgcaatc gggtccctgt gctcgaaggc 720

cacctggttt gtctctcgat cgagcttgaa cggaaagccg accctgccga gatcgcgacg 780

gtgctcagca atttccgtgc actccctcag gaattgcggc tgccgactgc gccagagcag 840

cctatcattg tacgtcacga acccgaccgt cctcaaccgc gccgcgaccg tgatgctgga 900

cggggaatgg ccaccgtagt aggtcgcatt cggccctgca gcctttttga cattaagttg 960

atcgcattgt cacataacac catccggggc gccgccggag cgagcatcct gaacgccgag 1020

cttatgcatg cccaaggttg gctggcg 1047

<210> 28

<211> 349

<212> PRT

<213> 人工序列

<220>

<223> 来自嗜热光合绿曲菌的进行密码子优化的asd

<400> 28

Met Ala Thr Ile Pro Val Ala Val Leu Gly Ala Thr Gly Ala Val Gly

1 5 10 15

Gln Arg Phe Ile Gln Leu Leu Glu Gly His Pro Leu Phe Gln Val Val

20 25 30

Ala Leu Thr Gly Ser Glu Arg Ser Ala Gly Lys Lys Tyr His Glu Val

35 40 45

Cys Arg Trp Val Leu Asp Thr Pro Met Pro Ala Ala Val Ala Asn Leu

50 55 60

Thr Val Leu Asp Ala Asp Ala Asp Leu Pro Ala Gln Leu Val Phe Ser

65 70 75 80

Ala Leu Pro Ser Thr Val Ala Gly Pro Ile Glu Gln Arg Leu Ala Ala

85 90 95

Ala Gly His Ile Val Cys Ser Asn Ala Ser Asn His Arg Met Glu Pro

100 105 110

Asp Val Pro Leu Ile Ile Pro Glu Val Asn Pro Asp His Leu Ala Leu

115 120 125

Ile Pro Val Gln Arg Arg Arg Arg Gly Trp Ser Gly Ala Ile Val Thr

130 135 140

Asn Pro Asn Cys Thr Ser Thr Pro Ala Thr Met Val Leu Arg Pro Leu

145 150 155 160

Leu Asp Thr Phe Gly Val Arg Arg Met Leu Leu Val Ser Met Gln Ala

165 170 175

Leu Ser Gly Ala Gly Tyr Pro Gly Val Pro Ser Tyr Asp Val Val Asp

180 185 190

Asn Val Ile Pro Tyr Ile Gly Gly Glu Glu Pro Lys Leu Glu Ile Glu

195 200 205

Pro Gln Lys Met Leu Gly Arg Leu Glu Gly Glu Thr Ile Val Pro Ala

210 215 220

Gly Phe Thr Thr Ser Ala His Cys Asn Arg Val Pro Val Leu Glu Gly

225 230 235 240

His Leu Val Cys Leu Ser Ile Glu Leu Glu Arg Lys Ala Asp Pro Ala

245 250 255

Glu Ile Ala Thr Val Leu Ser Asn Phe Arg Ala Leu Pro Gln Glu Leu

260 265 270

Arg Leu Pro Thr Ala Pro Glu Gln Pro Ile Ile Val Arg His Glu Pro

275 280 285

Asp Arg Pro Gln Pro Arg Arg Asp Arg Asp Ala Gly Arg Gly Met Ala

290 295 300

Thr Val Val Gly Arg Ile Arg Pro Cys Ser Leu Phe Asp Ile Lys Leu

305 310 315 320

Ile Ala Leu Ser His Asn Thr Ile Arg Gly Ala Ala Gly Ala Ser Ile

325 330 335

Leu Asn Ala Glu Leu Met His Ala Gln Gly Trp Leu Ala

340 345

<210> 29

<211> 1089

<212> DNA

<213> 人工序列

<220>

<223> 来自敏捷乳杆菌的进行密码子优化的asd

<400> 29

atggatgaaa aactccgtgc cggtgttctg ggcgccacgg gtatggtagg acagcggttc 60

gtagcgatgt tggagaatca cccgtggttc gaagtaacca ctcttgcagc ttcgccgcgc 120

tcagcaggta aaacgtacgc acaggctgtg gatggccggt ggaaaatgga aactcccatt 180

ccagaggccg tcaaggatct caagattctt gatgtatcgg aagttgagaa agtcgcagct 240

caagtcgatt ttgtgttttc cgcagtttct atgtccaaag acaagattaa agcgattgaa 300

gaagcctacg cgaaaaccga aactccggta gtatcgaaca attcggcgca ccgttggacc 360

ccagatgttc ctatggtcgt gcccgaaatt aacccggagc atttcaaggt aattgattac 420

cagcggaaac ggctcggcac gaagcgcggc ttcattgccg ttaagccgaa ctgttctatc 480

cagagctacg ccccggctct cagcgcatgg ttgaaattcg aaccgtacga ggtaatcgct 540

tcaacttatc aggctatctc gggagctggt aagaacttcg acgactggcc ggagatgaag 600

ggaaacatca tcccttttat ttctggcgag gaggaaaaat cagagaagga gcccctcaag 660

atctggggac aacttgacga agctaaggga gagatcgtcc cagccactag ccctgttatt 720

acgagccaat gtattcgggt cccgatcctt tacggacaca ccgcgaccgt ctttgttaaa 780

ttcaagcaga acccaacgaa agaggaactg gtagctgctt tggaatcata tcagggactg 840

cctcaatcct tgaatttgcc gtctacccct aagcaattta ttcagtatct cagcgaagac 900

gaccgtccgc aggttgcgaa ggacgttaac tttgagaatg gtatgggtat ctctattggc 960

cgccttcgta aagattcggt ttacgattgg aagttcgtag gactctcgca caacaccgcg 1020

cgtggcgccg caggaggcgg cgtcctttcg gccgaattgc tgacggctca gggctatatt 1080

accaaaaag 1089

<210> 30

<211> 363

<212> PRT

<213> 人工序列

<220>

<223> 来自敏捷乳杆菌的进行密码子优化的asd

<400> 30

Met Asp Glu Lys Leu Arg Ala Gly Val Leu Gly Ala Thr Gly Met Val

1 5 10 15

Gly Gln Arg Phe Val Ala Met Leu Glu Asn His Pro Trp Phe Glu Val

20 25 30

Thr Thr Leu Ala Ala Ser Pro Arg Ser Ala Gly Lys Thr Tyr Ala Gln

35 40 45

Ala Val Asp Gly Arg Trp Lys Met Glu Thr Pro Ile Pro Glu Ala Val

50 55 60

Lys Asp Leu Lys Ile Leu Asp Val Ser Glu Val Glu Lys Val Ala Ala

65 70 75 80

Gln Val Asp Phe Val Phe Ser Ala Val Ser Met Ser Lys Asp Lys Ile

85 90 95

Lys Ala Ile Glu Glu Ala Tyr Ala Lys Thr Glu Thr Pro Val Val Ser

100 105 110

Asn Asn Ser Ala His Arg Trp Thr Pro Asp Val Pro Met Val Val Pro

115 120 125

Glu Ile Asn Pro Glu His Phe Lys Val Ile Asp Tyr Gln Arg Lys Arg

130 135 140

Leu Gly Thr Lys Arg Gly Phe Ile Ala Val Lys Pro Asn Cys Ser Ile

145 150 155 160

Gln Ser Tyr Ala Pro Ala Leu Ser Ala Trp Leu Lys Phe Glu Pro Tyr

165 170 175

Glu Val Ile Ala Ser Thr Tyr Gln Ala Ile Ser Gly Ala Gly Lys Asn

180 185 190

Phe Asp Asp Trp Pro Glu Met Lys Gly Asn Ile Ile Pro Phe Ile Ser

195 200 205

Gly Glu Glu Glu Lys Ser Glu Lys Glu Pro Leu Lys Ile Trp Gly Gln

210 215 220

Leu Asp Glu Ala Lys Gly Glu Ile Val Pro Ala Thr Ser Pro Val Ile

225 230 235 240

Thr Ser Gln Cys Ile Arg Val Pro Ile Leu Tyr Gly His Thr Ala Thr

245 250 255

Val Phe Val Lys Phe Lys Gln Asn Pro Thr Lys Glu Glu Leu Val Ala

260 265 270

Ala Leu Glu Ser Tyr Gln Gly Leu Pro Gln Ser Leu Asn Leu Pro Ser

275 280 285

Thr Pro Lys Gln Phe Ile Gln Tyr Leu Ser Glu Asp Asp Arg Pro Gln

290 295 300

Val Ala Lys Asp Val Asn Phe Glu Asn Gly Met Gly Ile Ser Ile Gly

305 310 315 320

Arg Leu Arg Lys Asp Ser Val Tyr Asp Trp Lys Phe Val Gly Leu Ser

325 330 335

His Asn Thr Ala Arg Gly Ala Ala Gly Gly Gly Val Leu Ser Ala Glu

340 345 350

Leu Leu Thr Ala Gln Gly Tyr Ile Thr Lys Lys

355 360

<210> 31

<211> 1092

<212> DNA

<213> 人工序列

<220>

<223> 来自小鸡双歧杆菌的进行密码子优化的asd

<400> 31

atgtccgaga aactgaaggt aggaattatt ggagcgaccg gcatggtggg tcagcggttc 60

gtgactctgt tggataatca cccatggttt gaggtcacca ccttggctgc ctcagcacac 120

tcggccggaa aaacctacga gcaggccgtt ggtggccggt ggaagatgga gacgcctatg 180

ccggcggcgg tgaaggacat gattgtccgg gatgccaagg atgtggagag cgtggctgca 240

gacgtggact tcgtgttctc tgcagtgaac atgccgaagg acgagatccg tgccttggag 300

gagcgctacg ccaagacgga gactcccgtt gtatcaaaca actcggccca ccgttggacg 360

ccagacgtac ccatggtagt ccccgagatt aatcccgaac attatgaagt aatcaagtac 420

cagcgggctc gtcttggtac tacgcgtggc ttcatcgccg tgaaaccaaa ctgctccatc 480

caggcatata cgccggcact cgccgcgtgg cgggagttcg aaccgcgtga agtcgtggta 540

tctacttacc aagcgatttc tggtgctggt aagactttcg cggactggcc agaaatggaa 600

ggcaatatca tccctttcat tagcggtgaa gaggagaagt ccgagcggga accactgcgg 660

gtatttggcc acgtcgatga gagcaagggt cagattgtcc cctttgatgg tccactccgt 720

atcacgtcgc agtgtatccg tgtacccgta ttgaatggtc acactgctac tgtttttatc 780

aacttcggca aaaaaccatc taaggatgaa ctcatcgacc gtcttgtgaa ctacacgtcg 840

gaggcgagcc gtcttggtct ccctcacgct cccaaacagt tcatccaata tctgactgag 900

gatgatcgtc cgcaggtacg tttggacgtt gattacgagg gcggtatggg agtttccatc 960

ggtcgcctgc gcgaggacac gctcttcgac ttcaaattcg tgggactcgc tcataacacg 1020

ctgcgtggag ccgcaggtgg agcacttgaa tccgcagaaa tgttgaaagc actcggatat 1080

atttcggcga aa 1092

<210> 32

<211> 364

<212> PRT

<213> 人工序列

<220>

<223> 来自小鸡双歧杆菌的进行密码子优化的asd

<400> 32

Met Ser Glu Lys Leu Lys Val Gly Ile Ile Gly Ala Thr Gly Met Val

1 5 10 15

Gly Gln Arg Phe Val Thr Leu Leu Asp Asn His Pro Trp Phe Glu Val

20 25 30

Thr Thr Leu Ala Ala Ser Ala His Ser Ala Gly Lys Thr Tyr Glu Gln

35 40 45

Ala Val Gly Gly Arg Trp Lys Met Glu Thr Pro Met Pro Ala Ala Val

50 55 60

Lys Asp Met Ile Val Arg Asp Ala Lys Asp Val Glu Ser Val Ala Ala

65 70 75 80

Asp Val Asp Phe Val Phe Ser Ala Val Asn Met Pro Lys Asp Glu Ile

85 90 95

Arg Ala Leu Glu Glu Arg Tyr Ala Lys Thr Glu Thr Pro Val Val Ser

100 105 110

Asn Asn Ser Ala His Arg Trp Thr Pro Asp Val Pro Met Val Val Pro

115 120 125

Glu Ile Asn Pro Glu His Tyr Glu Val Ile Lys Tyr Gln Arg Ala Arg

130 135 140

Leu Gly Thr Thr Arg Gly Phe Ile Ala Val Lys Pro Asn Cys Ser Ile

145 150 155 160

Gln Ala Tyr Thr Pro Ala Leu Ala Ala Trp Arg Glu Phe Glu Pro Arg

165 170 175

Glu Val Val Val Ser Thr Tyr Gln Ala Ile Ser Gly Ala Gly Lys Thr

180 185 190

Phe Ala Asp Trp Pro Glu Met Glu Gly Asn Ile Ile Pro Phe Ile Ser

195 200 205

Gly Glu Glu Glu Lys Ser Glu Arg Glu Pro Leu Arg Val Phe Gly His

210 215 220

Val Asp Glu Ser Lys Gly Gln Ile Val Pro Phe Asp Gly Pro Leu Arg

225 230 235 240

Ile Thr Ser Gln Cys Ile Arg Val Pro Val Leu Asn Gly His Thr Ala

245 250 255

Thr Val Phe Ile Asn Phe Gly Lys Lys Pro Ser Lys Asp Glu Leu Ile

260 265 270

Asp Arg Leu Val Asn Tyr Thr Ser Glu Ala Ser Arg Leu Gly Leu Pro

275 280 285

His Ala Pro Lys Gln Phe Ile Gln Tyr Leu Thr Glu Asp Asp Arg Pro

290 295 300

Gln Val Arg Leu Asp Val Asp Tyr Glu Gly Gly Met Gly Val Ser Ile

305 310 315 320

Gly Arg Leu Arg Glu Asp Thr Leu Phe Asp Phe Lys Phe Val Gly Leu

325 330 335

Ala His Asn Thr Leu Arg Gly Ala Ala Gly Gly Ala Leu Glu Ser Ala

340 345 350

Glu Met Leu Lys Ala Leu Gly Tyr Ile Ser Ala Lys

355 360

<210> 33

<211> 1059

<212> DNA

<213> 人工序列

<220>

<223> 来自细菌双歧杆菌的进行密码子优化的asd

<400> 33

atgaagcaat tcaatgtggg aattttggga gcaacgggtg cagttggcca gaaattcatc 60

aatctcctcc agggtcatcc ttggttcacg attacggctc tcggagcatc cgaacgttcc 120

gcgggaaaat cctacgctga agcagttaat tggattgaag ccgttgagtt gcctgacgca 180

attgcctcta tgacggtcac tgattgctct cccgcaagca tgaaaggcgt tgatttcgtg 240

ttttctggtt tggacgcgtc tgtagcgacc gaacttgagg gcgatctcgc tcgggctggt 300

attcccgtga tctcaaatgc taagaactat cgcactcacc cgcatgtccc ccttctggta 360

ccagaggtga acgcgaccca caccgagatg attaaggcac aagattttga tccttccggc 420

cgtggcttta tcgtaacgaa tccaaattgt gtcgcggttc ctctcgtgat ggcgctcaag 480

cctctcatgg acgcgtacgg tatccaggca gtcgccctca cgactatgca atcggtgtct 540

ggtgctggtt accccggagt cgcctctttg gacatcctgg gaaatgtgat cccatttatt 600

tccggcgagg agccgaaaat cgccgcggag cctatgaaat tgttgggccg gctgggagga 660

gaccaaaccg tcaccgaggc ccgtttccct attgacgcta ccgcaactcg tgtgcctacc 720

atcgagggac atcttttgag cgtgaagatt aagttcgaac aaaagccagc gtctgctgac 780

gaaattaagg ctgtgctccg taactggaag cacgaggttt caggtttgga tcttccgtct 840

tctccgcgta ctgcgctcaa agtttacgat gacgatcggt ttccacaacc acgcaaaaac 900

gcttacaacg agaacggaat gcaagtcggc gtgggtcgtg tgcgtatgct cgagtttttt 960

gacgcgggtc ttgttgcatt gggccataat acgtgtcggg gtgcggctgg cgtagctatc 1020

ttgaacgctg agctgctggt aaaacagggt ttcatccaa 1059

<210> 34

<211> 353

<212> PRT

<213> 人工序列

<220>

<223> 来自细菌双歧杆菌的进行密码子优化的asd

<400> 34

Met Lys Gln Phe Asn Val Gly Ile Leu Gly Ala Thr Gly Ala Val Gly

1 5 10 15

Gln Lys Phe Ile Asn Leu Leu Gln Gly His Pro Trp Phe Thr Ile Thr

20 25 30

Ala Leu Gly Ala Ser Glu Arg Ser Ala Gly Lys Ser Tyr Ala Glu Ala

35 40 45

Val Asn Trp Ile Glu Ala Val Glu Leu Pro Asp Ala Ile Ala Ser Met

50 55 60

Thr Val Thr Asp Cys Ser Pro Ala Ser Met Lys Gly Val Asp Phe Val

65 70 75 80

Phe Ser Gly Leu Asp Ala Ser Val Ala Thr Glu Leu Glu Gly Asp Leu

85 90 95

Ala Arg Ala Gly Ile Pro Val Ile Ser Asn Ala Lys Asn Tyr Arg Thr

100 105 110

His Pro His Val Pro Leu Leu Val Pro Glu Val Asn Ala Thr His Thr

115 120 125

Glu Met Ile Lys Ala Gln Asp Phe Asp Pro Ser Gly Arg Gly Phe Ile

130 135 140

Val Thr Asn Pro Asn Cys Val Ala Val Pro Leu Val Met Ala Leu Lys

145 150 155 160

Pro Leu Met Asp Ala Tyr Gly Ile Gln Ala Val Ala Leu Thr Thr Met

165 170 175

Gln Ser Val Ser Gly Ala Gly Tyr Pro Gly Val Ala Ser Leu Asp Ile

180 185 190

Leu Gly Asn Val Ile Pro Phe Ile Ser Gly Glu Glu Pro Lys Ile Ala

195 200 205

Ala Glu Pro Met Lys Leu Leu Gly Arg Leu Gly Gly Asp Gln Thr Val

210 215 220

Thr Glu Ala Arg Phe Pro Ile Asp Ala Thr Ala Thr Arg Val Pro Thr

225 230 235 240

Ile Glu Gly His Leu Leu Ser Val Lys Ile Lys Phe Glu Gln Lys Pro

245 250 255

Ala Ser Ala Asp Glu Ile Lys Ala Val Leu Arg Asn Trp Lys His Glu

260 265 270

Val Ser Gly Leu Asp Leu Pro Ser Ser Pro Arg Thr Ala Leu Lys Val

275 280 285

Tyr Asp Asp Asp Arg Phe Pro Gln Pro Arg Lys Asn Ala Tyr Asn Glu

290 295 300

Asn Gly Met Gln Val Gly Val Gly Arg Val Arg Met Leu Glu Phe Phe

305 310 315 320

Asp Ala Gly Leu Val Ala Leu Gly His Asn Thr Cys Arg Gly Ala Ala

325 330 335

Gly Val Ala Ile Leu Asn Ala Glu Leu Leu Val Lys Gln Gly Phe Ile

340 345 350

Gln

<210> 35

<211> 1086

<212> DNA

<213> 人工序列

<220>

<223> 来自汉氏粘球菌的进行密码子优化的asd

<400> 35

atggctcgtt tgcgtgctgc gttgatcggc gcgacgggac tcgccggtca acagttcatt 60

gcggccctca aagaccaccc ttttattgaa ttgactggac tggcagcgtc gccacggtcg 120

gcgggcaaaa cgtacgctga agccctcaag actgcatcag gtatgactgc atggttcgta 180

ccagaacccc tgccagccgg cattgctggt atgaaagttg ttgcgggaga cgccctcgag 240

gcgaaagatt atgaccttgt tttctctgct gtagaagcgg acgtagcccg cgagcttgag 300

ccaaaactgg cgaaagacat tccagtattt tcggctgcta gcgcgttccg ctacgaagat 360

gacgtaccac tgcttatccc ccccgttaac gccgcacacg cgcctctgat tcgtgaacag 420

cagcgtcgtc gtggttggaa aggttatgtt gttccaatcc caaattgcac gaccaccggc 480

cttgcggtta cgctcgcgcc tcttgtcgag cggtttggag tcaaggctgt cttgatgacc 540

tcacttcaag caatgagcgg agcgggacgg tctcctggcg tgatcggcat ggacattctt 600

gataacgtga ttccgtatat ccccaaagag gaacataaag tagaagtgga gactaagaaa 660

attcttggtg ctcttcgtcc tggtggcgaa ggccttacgc cccacgatat ccgcgtctca 720

tgcacctgca ctcgggtcgc ggtcatggaa ggccatactg aatcagtttt tgtttctctg 780

gaaaaaaaag ctactgttgc agaggttacc caagcgttgc gtgaatggca gggcgcggaa 840

cttgcacgga aattgccgtc cgccgcaccg cgttggattg aagtgcttga tgaccccttc 900

cgcccacaac cgcgtcttga ccgggacacg cacggtggaa tggctaccac ggtgggtcgg 960

attcgtgagg acggtgtttt ggagaacgga tttaagtacg ttttggtttc tcacaacact 1020

aaaatgggag ctgctcgcgg cgcgattttg gtagcagaac tgcttcgggc tcaaggcttg 1080

cttgga 1086

<210> 36

<211> 362

<212> PRT

<213> 人工序列

<220>

<223> 来自汉氏粘球菌的进行密码子优化的asd

<400> 36

Met Ala Arg Leu Arg Ala Ala Leu Ile Gly Ala Thr Gly Leu Ala Gly

1 5 10 15

Gln Gln Phe Ile Ala Ala Leu Lys Asp His Pro Phe Ile Glu Leu Thr

20 25 30

Gly Leu Ala Ala Ser Pro Arg Ser Ala Gly Lys Thr Tyr Ala Glu Ala

35 40 45

Leu Lys Thr Ala Ser Gly Met Thr Ala Trp Phe Val Pro Glu Pro Leu

50 55 60

Pro Ala Gly Ile Ala Gly Met Lys Val Val Ala Gly Asp Ala Leu Glu

65 70 75 80

Ala Lys Asp Tyr Asp Leu Val Phe Ser Ala Val Glu Ala Asp Val Ala

85 90 95

Arg Glu Leu Glu Pro Lys Leu Ala Lys Asp Ile Pro Val Phe Ser Ala

100 105 110

Ala Ser Ala Phe Arg Tyr Glu Asp Asp Val Pro Leu Leu Ile Pro Pro

115 120 125

Val Asn Ala Ala His Ala Pro Leu Ile Arg Glu Gln Gln Arg Arg Arg

130 135 140

Gly Trp Lys Gly Tyr Val Val Pro Ile Pro Asn Cys Thr Thr Thr Gly

145 150 155 160

Leu Ala Val Thr Leu Ala Pro Leu Val Glu Arg Phe Gly Val Lys Ala

165 170 175

Val Leu Met Thr Ser Leu Gln Ala Met Ser Gly Ala Gly Arg Ser Pro

180 185 190

Gly Val Ile Gly Met Asp Ile Leu Asp Asn Val Ile Pro Tyr Ile Pro

195 200 205

Lys Glu Glu His Lys Val Glu Val Glu Thr Lys Lys Ile Leu Gly Ala

210 215 220

Leu Arg Pro Gly Gly Glu Gly Leu Thr Pro His Asp Ile Arg Val Ser

225 230 235 240

Cys Thr Cys Thr Arg Val Ala Val Met Glu Gly His Thr Glu Ser Val

245 250 255

Phe Val Ser Leu Glu Lys Lys Ala Thr Val Ala Glu Val Thr Gln Ala

260 265 270

Leu Arg Glu Trp Gln Gly Ala Glu Leu Ala Arg Lys Leu Pro Ser Ala

275 280 285

Ala Pro Arg Trp Ile Glu Val Leu Asp Asp Pro Phe Arg Pro Gln Pro

290 295 300

Arg Leu Asp Arg Asp Thr His Gly Gly Met Ala Thr Thr Val Gly Arg

305 310 315 320

Ile Arg Glu Asp Gly Val Leu Glu Asn Gly Phe Lys Tyr Val Leu Val

325 330 335

Ser His Asn Thr Lys Met Gly Ala Ala Arg Gly Ala Ile Leu Val Ala

340 345 350

Glu Leu Leu Arg Ala Gln Gly Leu Leu Gly

355 360

<210> 37

<211> 1083

<212> DNA

<213> 人工序列

<220>

<223> 来自固氮类芽孢杆菌的进行密码子优化的asd

<400> 37

atgacggaga aattgcgtgc tggcatcgtc ggcggaactg gaatggtcgg ccagcgcttt 60

attgcgcttc ttgagaatca cccttggttt caggtaaccg ctattgccgc tagcgccaac 120

tctgcgggta aaacgtatga ggaatccgta aaaggccggt ggaagctctc tacgccaatg 180

cctgaaagcg tcaagcacat tccagtgcag gacgcgtcac gtgtcgagga agtagccgca 240

ggcgtggatt tgatcttttg cgcggtcgat atgaaaaaga atgaaatcca ggcactcgag 300

gaagcctatg ccaaagcggg tgtccccgtc atcagcaaca actccgcaca tcggtggact 360

ccagacgttc cgatggtcgt tccagaaatc aacccagaac acctggaggt cattgcagct 420

cagcggaaac gcctgggaac cgaaactggc ttcattgcgg taaagcctaa ttgcagcatc 480

cagtcttatg ttccaatgct gaacgcactt cggggcttta agcctactca agttgtcgca 540

tccacttatc aggcgatttc tggtgccggt aaaacgttca cggattggcc cgaaatgctg 600

gacaacgtaa tcccttacat tggaggtgag gaggaaaaaa gcgaacaaga gccgcttcgc 660

atttggggta ctgtagagga tggccaaatt gttaaagcct ccgcacccca tattacgacg 720

caatgcatcc gggtaccagt gactgacggt cacctggcca ctgttttcgt tagcttcgag 780

aataaaccct caaaggaaga cattctcgaa tcctggaaaa attacaaggg tcggccgcaa 840

gagcttgaac ttccgtcagc acccaaacaa ttcatcactt acttcgaaga ggaaaatcgg 900

ccacagacca acctcgaccg cgacatcgaa aatggaatgg gcatttccgc tggccgcctc 960

cgggaggata gcctttatga ctttaaattc gttggactct cacataacac tctgcgcgga 1020

gctgctggtg gtgcggtact gatcgcagag ttgctcaagg cagagggcta cattactaag 1080

cgc 1083

<210> 38

<211> 361

<212> PRT

<213> 人工序列

<220>

<223> 来自固氮类芽孢杆菌的进行密码子优化的asd

<400> 38

Met Thr Glu Lys Leu Arg Ala Gly Ile Val Gly Gly Thr Gly Met Val

1 5 10 15

Gly Gln Arg Phe Ile Ala Leu Leu Glu Asn His Pro Trp Phe Gln Val

20 25 30

Thr Ala Ile Ala Ala Ser Ala Asn Ser Ala Gly Lys Thr Tyr Glu Glu

35 40 45

Ser Val Lys Gly Arg Trp Lys Leu Ser Thr Pro Met Pro Glu Ser Val

50 55 60

Lys His Ile Pro Val Gln Asp Ala Ser Arg Val Glu Glu Val Ala Ala

65 70 75 80

Gly Val Asp Leu Ile Phe Cys Ala Val Asp Met Lys Lys Asn Glu Ile

85 90 95

Gln Ala Leu Glu Glu Ala Tyr Ala Lys Ala Gly Val Pro Val Ile Ser

100 105 110

Asn Asn Ser Ala His Arg Trp Thr Pro Asp Val Pro Met Val Val Pro

115 120 125

Glu Ile Asn Pro Glu His Leu Glu Val Ile Ala Ala Gln Arg Lys Arg

130 135 140

Leu Gly Thr Glu Thr Gly Phe Ile Ala Val Lys Pro Asn Cys Ser Ile

145 150 155 160

Gln Ser Tyr Val Pro Met Leu Asn Ala Leu Arg Gly Phe Lys Pro Thr

165 170 175

Gln Val Val Ala Ser Thr Tyr Gln Ala Ile Ser Gly Ala Gly Lys Thr

180 185 190

Phe Thr Asp Trp Pro Glu Met Leu Asp Asn Val Ile Pro Tyr Ile Gly

195 200 205

Gly Glu Glu Glu Lys Ser Glu Gln Glu Pro Leu Arg Ile Trp Gly Thr

210 215 220

Val Glu Asp Gly Gln Ile Val Lys Ala Ser Ala Pro His Ile Thr Thr

225 230 235 240

Gln Cys Ile Arg Val Pro Val Thr Asp Gly His Leu Ala Thr Val Phe

245 250 255

Val Ser Phe Glu Asn Lys Pro Ser Lys Glu Asp Ile Leu Glu Ser Trp

260 265 270

Lys Asn Tyr Lys Gly Arg Pro Gln Glu Leu Glu Leu Pro Ser Ala Pro

275 280 285

Lys Gln Phe Ile Thr Tyr Phe Glu Glu Glu Asn Arg Pro Gln Thr Asn

290 295 300

Leu Asp Arg Asp Ile Glu Asn Gly Met Gly Ile Ser Ala Gly Arg Leu

305 310 315 320

Arg Glu Asp Ser Leu Tyr Asp Phe Lys Phe Val Gly Leu Ser His Asn

325 330 335

Thr Leu Arg Gly Ala Ala Gly Gly Ala Val Leu Ile Ala Glu Leu Leu

340 345 350

Lys Ala Glu Gly Tyr Ile Thr Lys Arg

355 360

<210> 39

<211> 1032

<212> DNA

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的进行密码子优化的asd

<400> 39

atgaccacta tcgcggtcgt tggagcaacg ggacaagtag gacaggtgat gcggacgctt 60

ctggaagaac gtaattttcc tgccgatacg gtccggttct ttgcgtcgcc gcggagcgcc 120

ggtcggaaga tcgagttccg gggtaccgaa attgaggtag aggacatcac ccaagcgacc 180

gaggagtctc tcaaagatat tgatgtagca cttttttctg caggcggtac cgcgtcgaag 240

caatatgctc ctctgttcgc ggctgcgggt gcgacggtgg tggacaattc ttcggcctgg 300

cggaaagatg atgaagtacc gttgattgtc tctgaagtaa atccttcgga caaagattct 360

ctcgtgaagg gtatcattgc gaaccctaac tgtaccacca tggctgcaat gcctgtactg 420

aaaccacttc atgatgccgc aggtcttgta aagcttcatg tctcctcgta tcaagcggta 480

tccggtagcg gtctcgcagg cgtcgaaacc ctcgcaaaac aggtcgctgc tgttggtgac 540

cataacgtcg agttcgtcca cgacggtcag gccgccgacg caggagatgt tggcccatac 600

gtcagcccca tcgcttataa tgttttgccc ttcgcaggta acctggttga cgacggaacc 660

tttgagaccg acgaggagca aaaactgcgc aatgaaagcc gtaagatcct cggactgccg 720

gacttgaaag tttccggtac gtgtgtacgt gttcccgtgt ttactggaca taccttgact 780

atccatgctg agttcgataa agcaattacc gtggaccaag ctcaggagat cctcggagca 840

gcgtcgggag taaagttggt agacgtaccg actcctctgg cggctgcggg tattgatgag 900

tcgcttgtag gacgcattcg ccaagactcg acggtggatg acaaccgcgg actcgttctc 960

gtggtatctg gcgacaatct tcggaagggc gcggctttga ataccatcca gatcgccgag 1020

cttctggtaa ag 1032

<210> 40

<211> 344

<212> PRT

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的进行密码子优化的asd

<400> 40

Met Thr Thr Ile Ala Val Val Gly Ala Thr Gly Gln Val Gly Gln Val

1 5 10 15

Met Arg Thr Leu Leu Glu Glu Arg Asn Phe Pro Ala Asp Thr Val Arg

20 25 30

Phe Phe Ala Ser Pro Arg Ser Ala Gly Arg Lys Ile Glu Phe Arg Gly

35 40 45

Thr Glu Ile Glu Val Glu Asp Ile Thr Gln Ala Thr Glu Glu Ser Leu

50 55 60

Lys Asp Ile Asp Val Ala Leu Phe Ser Ala Gly Gly Thr Ala Ser Lys

65 70 75 80

Gln Tyr Ala Pro Leu Phe Ala Ala Ala Gly Ala Thr Val Val Asp Asn

85 90 95

Ser Ser Ala Trp Arg Lys Asp Asp Glu Val Pro Leu Ile Val Ser Glu

100 105 110

Val Asn Pro Ser Asp Lys Asp Ser Leu Val Lys Gly Ile Ile Ala Asn

115 120 125

Pro Asn Cys Thr Thr Met Ala Ala Met Pro Val Leu Lys Pro Leu His

130 135 140

Asp Ala Ala Gly Leu Val Lys Leu His Val Ser Ser Tyr Gln Ala Val

145 150 155 160

Ser Gly Ser Gly Leu Ala Gly Val Glu Thr Leu Ala Lys Gln Val Ala

165 170 175

Ala Val Gly Asp His Asn Val Glu Phe Val His Asp Gly Gln Ala Ala

180 185 190

Asp Ala Gly Asp Val Gly Pro Tyr Val Ser Pro Ile Ala Tyr Asn Val

195 200 205

Leu Pro Phe Ala Gly Asn Leu Val Asp Asp Gly Thr Phe Glu Thr Asp

210 215 220

Glu Glu Gln Lys Leu Arg Asn Glu Ser Arg Lys Ile Leu Gly Leu Pro

225 230 235 240

Asp Leu Lys Val Ser Gly Thr Cys Val Arg Val Pro Val Phe Thr Gly

245 250 255

His Thr Leu Thr Ile His Ala Glu Phe Asp Lys Ala Ile Thr Val Asp

260 265 270

Gln Ala Gln Glu Ile Leu Gly Ala Ala Ser Gly Val Lys Leu Val Asp

275 280 285

Val Pro Thr Pro Leu Ala Ala Ala Gly Ile Asp Glu Ser Leu Val Gly

290 295 300

Arg Ile Arg Gln Asp Ser Thr Val Asp Asp Asn Arg Gly Leu Val Leu

305 310 315 320

Val Val Ser Gly Asp Asn Leu Arg Lys Gly Ala Ala Leu Asn Thr Ile

325 330 335

Gln Ile Ala Glu Leu Leu Val Lys

340

<210> 41

<211> 1341

<212> DNA

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌进行密码子优化的gdh

<400> 41

atgactgtag atgaacaggt ttctaactac tacgacatgc ttctcaaacg taatgctgga 60

gagcccgaat ttcatcaggc ggttgctgaa gtgcttgaat ccctcaagat tgttcttgaa 120

aaagatccgc actacgcgga ctatggcctc atccagcggc tgtgtgaacc tgaacgtcaa 180

ctgatcttcc gtgtgccgtg ggtagatgat cagggacaag tgcacgtcaa ccgcggtttt 240

cgtgtacagt ttaattcggc gctcggtccc tacaaaggcg gattgcgttt ccaccctagc 300

gtcaatcttg gcatcgtcaa gtttttgggt ttcgaacaaa tttttaagaa ttcccttacc 360

ggactgccta tcggaggcgg aaagggcggt tcggattttg accctaaagg caagagcgat 420

ctcgaaatca tgcggttttg tcagtctttt atgaccgaac tgcatcgtca catcggcgaa 480

tatcgcgatg tcccggcggg tgatatcggc gtgggtggtc gtgagatcgg atacctcttt 540

ggtcattatc gtcggatggc gaatcagcac gaatcgggag tccttaccgg caaaggtctg 600

acttggggcg gcagcctggt tcggaccgaa gccacgggat acggttgtgt ctatttcgta 660

tcggagatga tcaaagcaaa aggcgagtca atctcgggac agaagattat cgtatccgga 720

tcgggaaatg ttgctaccta tgccattgag aaagctcaag agctgggcgc gacggtgatc 780

ggcttctcgg attcctcagg ctgggtgcat actccgaatg gtgtggacgt ggctaaactt 840

cgcgaaatca aggaagtacg tcgcgcacgc gtaagcgttt atgccgatga agtggaggga 900

gcaacctacc ataccgatgg atccatctgg gatcttaagt gtgacatcgc acttccttgc 960

gctacgcaaa atgaactgaa cggagagaat gcgaaaacgc tggccgataa tggttgccgc 1020

ttcgtcgcgg agggcgctaa catgccgagc accccggagg ccgtcgaagt ttttcgggag 1080

cgcgacatcc ggttcggccc cggcaaagcg gctaatgctg gcggagtggc aacgtcagcg 1140

ttggagatgc agcagaacgc atcccgggac tcatggagct tcgaatacac cgacgaacgc 1200

ctccaggtca ttatgaagaa catttttaag acgtgtgcgg aaaccgcagc cgagtatggc 1260

cacgagaacg attacgtcgt cggagcaaac attgcaggat ttaagaaagt tgctgatgcg 1320

atgctcgccc aaggtgtgat c 1341

<210> 42

<211> 447

<212> PRT

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌进行密码子优化的gdh

<400> 42

Met Thr Val Asp Glu Gln Val Ser Asn Tyr Tyr Asp Met Leu Leu Lys

1 5 10 15

Arg Asn Ala Gly Glu Pro Glu Phe His Gln Ala Val Ala Glu Val Leu

20 25 30

Glu Ser Leu Lys Ile Val Leu Glu Lys Asp Pro His Tyr Ala Asp Tyr

35 40 45

Gly Leu Ile Gln Arg Leu Cys Glu Pro Glu Arg Gln Leu Ile Phe Arg

50 55 60

Val Pro Trp Val Asp Asp Gln Gly Gln Val His Val Asn Arg Gly Phe

65 70 75 80

Arg Val Gln Phe Asn Ser Ala Leu Gly Pro Tyr Lys Gly Gly Leu Arg

85 90 95

Phe His Pro Ser Val Asn Leu Gly Ile Val Lys Phe Leu Gly Phe Glu

100 105 110

Gln Ile Phe Lys Asn Ser Leu Thr Gly Leu Pro Ile Gly Gly Gly Lys

115 120 125

Gly Gly Ser Asp Phe Asp Pro Lys Gly Lys Ser Asp Leu Glu Ile Met

130 135 140

Arg Phe Cys Gln Ser Phe Met Thr Glu Leu His Arg His Ile Gly Glu

145 150 155 160

Tyr Arg Asp Val Pro Ala Gly Asp Ile Gly Val Gly Gly Arg Glu Ile

165 170 175

Gly Tyr Leu Phe Gly His Tyr Arg Arg Met Ala Asn Gln His Glu Ser

180 185 190

Gly Val Leu Thr Gly Lys Gly Leu Thr Trp Gly Gly Ser Leu Val Arg

195 200 205

Thr Glu Ala Thr Gly Tyr Gly Cys Val Tyr Phe Val Ser Glu Met Ile

210 215 220

Lys Ala Lys Gly Glu Ser Ile Ser Gly Gln Lys Ile Ile Val Ser Gly

225 230 235 240

Ser Gly Asn Val Ala Thr Tyr Ala Ile Glu Lys Ala Gln Glu Leu Gly

245 250 255

Ala Thr Val Ile Gly Phe Ser Asp Ser Ser Gly Trp Val His Thr Pro

260 265 270

Asn Gly Val Asp Val Ala Lys Leu Arg Glu Ile Lys Glu Val Arg Arg

275 280 285

Ala Arg Val Ser Val Tyr Ala Asp Glu Val Glu Gly Ala Thr Tyr His

290 295 300

Thr Asp Gly Ser Ile Trp Asp Leu Lys Cys Asp Ile Ala Leu Pro Cys

305 310 315 320

Ala Thr Gln Asn Glu Leu Asn Gly Glu Asn Ala Lys Thr Leu Ala Asp

325 330 335

Asn Gly Cys Arg Phe Val Ala Glu Gly Ala Asn Met Pro Ser Thr Pro

340 345 350

Glu Ala Val Glu Val Phe Arg Glu Arg Asp Ile Arg Phe Gly Pro Gly

355 360 365

Lys Ala Ala Asn Ala Gly Gly Val Ala Thr Ser Ala Leu Glu Met Gln

370 375 380

Gln Asn Ala Ser Arg Asp Ser Trp Ser Phe Glu Tyr Thr Asp Glu Arg

385 390 395 400

Leu Gln Val Ile Met Lys Asn Ile Phe Lys Thr Cys Ala Glu Thr Ala

405 410 415

Ala Glu Tyr Gly His Glu Asn Asp Tyr Val Val Gly Ala Asn Ile Ala

420 425 430

Gly Phe Lys Lys Val Ala Asp Ala Met Leu Ala Gln Gly Val Ile

435 440 445

<210> 43

<211> 1350

<212> DNA

<213> 人工序列

<220>

<223> 来自共生梭菌的进行密码子优化的gdh

<400> 43

atgtccaagt acgttgaccg cgtcattgct gaagtcgaga aaaagtacgc cgacgaaccg 60

gaattcgttc aaaccgttga agaggtactc tcttcactcg gcccagtagt cgacgcacac 120

cccgagtatg aagaggttgc gctcttggag cgtatggtca ttccagaacg tgtcattgag 180

tttcgcgtcc cgtgggagga tgacaatggt aaagtacatg tgaatactgg ttaccgcgtc 240

caatttaatg gcgcgatcgg cccttataaa ggtggcttgc gcttcgcccc ttcggtcaac 300

ctttccatta tgaaatttct cggcttcgag caagcattca aagattccct gaccacgctt 360

cctatgggag gagcaaaagg cggttcagac ttcgacccaa acggaaaatc cgatcgcgaa 420

gtaatgcgct tctgccaggc gttcatgact gagttgtatc ggcatattgg tcccgatatc 480

gacgtgcctg ctggtgactt gggcgttggt gcgcgtgaaa ttggttacat gtacggacaa 540

taccggaaga tcgtcggcgg attctacaat ggcgtcctga ccggtaaagc ccggtcattc 600

ggtggaagct tggtccggcc cgaagcaact ggttacggat cggtgtatta tgtggaggct 660

gtgatgaaac atgaaaatga cacgcttgta ggtaaaactg ttgcactggc aggttttggt 720

aacgttgcat ggggtgcagc taagaagctc gcggagttgg gtgcgaaagc agtaactttg 780

tctggcccgg atggctatat ctacgacccc gagggtatca ctaccgagga aaagatcaat 840

tacatgcttg aaatgcgggc gtctggacgt aacaaggtac aggattacgc agacaagttt 900

ggagtgcaat tctttccggg tgaaaagcct tggggccaaa aagttgacat tattatgcct 960

tgtgcaactc agaatgatgt tgacctggaa caggctaaaa agatcgtggc gaacaacgtg 1020

aagtactaca tcgaagtagc caacatgcct actactaatg aagcattgcg gtttcttatg 1080

cagcaaccta acatggtagt cgcccccagc aaggctgtga acgcaggtgg agtactggta 1140

tcgggtttcg agatgtcaca aaattccgaa cgtctgtcat ggaccgccga agaagtcgat 1200

agcaaactgc atcaggtgat gactgacatt catgacggtt cagccgccgc agctgaacgc 1260

tacggacttg gttacaatct tgtcgcaggt gctaatatcg taggttttca gaagatcgcc 1320

gatgccatga tggctcaagg aatcgcttgg 1350

<210> 44

<211> 450

<212> PRT

<213> 人工序列

<220>

<223> 来自共生梭菌的进行密码子优化的gdh

<400> 44

Met Ser Lys Tyr Val Asp Arg Val Ile Ala Glu Val Glu Lys Lys Tyr

1 5 10 15

Ala Asp Glu Pro Glu Phe Val Gln Thr Val Glu Glu Val Leu Ser Ser

20 25 30

Leu Gly Pro Val Val Asp Ala His Pro Glu Tyr Glu Glu Val Ala Leu

35 40 45

Leu Glu Arg Met Val Ile Pro Glu Arg Val Ile Glu Phe Arg Val Pro

50 55 60

Trp Glu Asp Asp Asn Gly Lys Val His Val Asn Thr Gly Tyr Arg Val

65 70 75 80

Gln Phe Asn Gly Ala Ile Gly Pro Tyr Lys Gly Gly Leu Arg Phe Ala

85 90 95

Pro Ser Val Asn Leu Ser Ile Met Lys Phe Leu Gly Phe Glu Gln Ala

100 105 110

Phe Lys Asp Ser Leu Thr Thr Leu Pro Met Gly Gly Ala Lys Gly Gly

115 120 125

Ser Asp Phe Asp Pro Asn Gly Lys Ser Asp Arg Glu Val Met Arg Phe

130 135 140

Cys Gln Ala Phe Met Thr Glu Leu Tyr Arg His Ile Gly Pro Asp Ile

145 150 155 160

Asp Val Pro Ala Gly Asp Leu Gly Val Gly Ala Arg Glu Ile Gly Tyr

165 170 175

Met Tyr Gly Gln Tyr Arg Lys Ile Val Gly Gly Phe Tyr Asn Gly Val

180 185 190

Leu Thr Gly Lys Ala Arg Ser Phe Gly Gly Ser Leu Val Arg Pro Glu

195 200 205

Ala Thr Gly Tyr Gly Ser Val Tyr Tyr Val Glu Ala Val Met Lys His

210 215 220

Glu Asn Asp Thr Leu Val Gly Lys Thr Val Ala Leu Ala Gly Phe Gly

225 230 235 240

Asn Val Ala Trp Gly Ala Ala Lys Lys Leu Ala Glu Leu Gly Ala Lys

245 250 255

Ala Val Thr Leu Ser Gly Pro Asp Gly Tyr Ile Tyr Asp Pro Glu Gly

260 265 270

Ile Thr Thr Glu Glu Lys Ile Asn Tyr Met Leu Glu Met Arg Ala Ser

275 280 285

Gly Arg Asn Lys Val Gln Asp Tyr Ala Asp Lys Phe Gly Val Gln Phe

290 295 300

Phe Pro Gly Glu Lys Pro Trp Gly Gln Lys Val Asp Ile Ile Met Pro

305 310 315 320

Cys Ala Thr Gln Asn Asp Val Asp Leu Glu Gln Ala Lys Lys Ile Val

325 330 335

Ala Asn Asn Val Lys Tyr Tyr Ile Glu Val Ala Asn Met Pro Thr Thr

340 345 350

Asn Glu Ala Leu Arg Phe Leu Met Gln Gln Pro Asn Met Val Val Ala

355 360 365

Pro Ser Lys Ala Val Asn Ala Gly Gly Val Leu Val Ser Gly Phe Glu

370 375 380

Met Ser Gln Asn Ser Glu Arg Leu Ser Trp Thr Ala Glu Glu Val Asp

385 390 395 400

Ser Lys Leu His Gln Val Met Thr Asp Ile His Asp Gly Ser Ala Ala

405 410 415

Ala Ala Glu Arg Tyr Gly Leu Gly Tyr Asn Leu Val Ala Gly Ala Asn

420 425 430

Ile Val Gly Phe Gln Lys Ile Ala Asp Ala Met Met Ala Gln Gly Ile

435 440 445

Ala Trp

450

<210> 45

<211> 744

<212> DNA

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的进行密码子优化的dapB

<400> 45

atgggcatta aagttggagt gctgggagct aagggccggg taggtcagac gatcgtggca 60

gcagtgaacg aatcagacga tctcgagttg gtagcagaaa tcggtgtgga tgacgatctg 120

tctctgctcg tagacaacgg cgcggaggtc gttgttgact tcactacgcc taatgcggtg 180

atgggaaact tggagttctg tatcaacaac ggaatctccg cagtagtagg aaccaccgga 240

tttgatgatg cacgcctcga acaagtacgg gactggctgg aaggtaagga caacgtcgga 300

gtcttgattg cccctaactt tgcgatttca gcagtgctta ccatggtgtt ctctaaacag 360

gcggcgcgct ttttcgaatc cgcagaagtt atcgaacttc accacccgaa taaacttgac 420

gccccttctg gcactgcgat tcatactgct caaggtattg cagcggctcg taaagaggca 480

ggtatggatg cacagcccga tgcaactgag caagcccttg agggtagccg tggcgcgtct 540

gttgatggta ttccggtaca tgccgttcgc atgtcaggca tggtcgcaca tgaacaagta 600

atctttggca cgcaaggcca aacgcttact attaaacaag atagctacga tcgtaactct 660

ttcgcgccgg gtgttttggt tggagtccgc aatatcgcac agcatcccgg attggtggtt 720

ggccttgagc attaccttgg attg 744

<210> 46

<211> 248

<212> PRT

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的进行密码子优化的dapB

<400> 46

Met Gly Ile Lys Val Gly Val Leu Gly Ala Lys Gly Arg Val Gly Gln

1 5 10 15

Thr Ile Val Ala Ala Val Asn Glu Ser Asp Asp Leu Glu Leu Val Ala

20 25 30

Glu Ile Gly Val Asp Asp Asp Leu Ser Leu Leu Val Asp Asn Gly Ala

35 40 45

Glu Val Val Val Asp Phe Thr Thr Pro Asn Ala Val Met Gly Asn Leu

50 55 60

Glu Phe Cys Ile Asn Asn Gly Ile Ser Ala Val Val Gly Thr Thr Gly

65 70 75 80

Phe Asp Asp Ala Arg Leu Glu Gln Val Arg Asp Trp Leu Glu Gly Lys

85 90 95

Asp Asn Val Gly Val Leu Ile Ala Pro Asn Phe Ala Ile Ser Ala Val

100 105 110

Leu Thr Met Val Phe Ser Lys Gln Ala Ala Arg Phe Phe Glu Ser Ala

115 120 125

Glu Val Ile Glu Leu His His Pro Asn Lys Leu Asp Ala Pro Ser Gly

130 135 140

Thr Ala Ile His Thr Ala Gln Gly Ile Ala Ala Ala Arg Lys Glu Ala

145 150 155 160

Gly Met Asp Ala Gln Pro Asp Ala Thr Glu Gln Ala Leu Glu Gly Ser

165 170 175

Arg Gly Ala Ser Val Asp Gly Ile Pro Val His Ala Val Arg Met Ser

180 185 190

Gly Met Val Ala His Glu Gln Val Ile Phe Gly Thr Gln Gly Gln Thr

195 200 205

Leu Thr Ile Lys Gln Asp Ser Tyr Asp Arg Asn Ser Phe Ala Pro Gly

210 215 220

Val Leu Val Gly Val Arg Asn Ile Ala Gln His Pro Gly Leu Val Val

225 230 235 240

Gly Leu Glu His Tyr Leu Gly Leu

245

<210> 47

<211> 819

<212> DNA

<213> 人工序列

<220>

<223> 来自大肠杆菌的进行密码子优化的dapB

<400> 47

atgcacgacg caaacattcg ggtcgccatt gcgggagctg gaggacgtat gggacgccag 60

ctcatccagg cggcgcttgc cctcgaaggc gtgcaattgg gagcagctct ggaacgcgag 120

ggctcttcac tcttgggctc tgatgccggc gagctggctg gtgccggcaa aacgggcgta 180

acggtccagt cttctctcga cgccgtaaag gatgattttg atgtgtttat tgactttacg 240

cgcccggagg gaactctgaa ccatctggca ttctgccggc agcatggtaa gggcatggtt 300

atcggaacca ccggatttga tgaggctgga aaacaggcga ttcgggatgc cgctgccgat 360

attgctatcg tattcgcagc aaacttcagc gtaggcgtta acgttatgct caaactgctg 420

gagaaggcag ctaaggtgat gggtgactat acggacattg agattattga agctcatcat 480

cgtcacaaag tagacgctcc ttcaggaacc gcgctggcaa tgggcgaagc aattgctcat 540

gcgttggaca aagacctcaa agactgcgcg gtgtattcac gggagggaca tactggtgaa 600

cgtgttcctg gtacgattgg ttttgccacc gtccgtgcag gcgacattgt gggagaacat 660

acggccatgt tcgcagacat cggtgaacgt cttgagatca cccacaaggc tagctcgcgg 720

atgacgttcg caaacggagc ggttcggtcc gccctgtggc tgtctggcaa agaatctgga 780

ctcttcgaca tgcgggacgt gttggacctt aacaatttg 819

<210> 48

<211> 273

<212> PRT

<213> 人工序列

<220>

<223> 来自大肠杆菌的进行密码子优化的dapB

<400> 48

Met His Asp Ala Asn Ile Arg Val Ala Ile Ala Gly Ala Gly Gly Arg

1 5 10 15

Met Gly Arg Gln Leu Ile Gln Ala Ala Leu Ala Leu Glu Gly Val Gln

20 25 30

Leu Gly Ala Ala Leu Glu Arg Glu Gly Ser Ser Leu Leu Gly Ser Asp

35 40 45

Ala Gly Glu Leu Ala Gly Ala Gly Lys Thr Gly Val Thr Val Gln Ser

50 55 60

Ser Leu Asp Ala Val Lys Asp Asp Phe Asp Val Phe Ile Asp Phe Thr

65 70 75 80

Arg Pro Glu Gly Thr Leu Asn His Leu Ala Phe Cys Arg Gln His Gly

85 90 95

Lys Gly Met Val Ile Gly Thr Thr Gly Phe Asp Glu Ala Gly Lys Gln

100 105 110

Ala Ile Arg Asp Ala Ala Ala Asp Ile Ala Ile Val Phe Ala Ala Asn

115 120 125

Phe Ser Val Gly Val Asn Val Met Leu Lys Leu Leu Glu Lys Ala Ala

130 135 140

Lys Val Met Gly Asp Tyr Thr Asp Ile Glu Ile Ile Glu Ala His His

145 150 155 160

Arg His Lys Val Asp Ala Pro Ser Gly Thr Ala Leu Ala Met Gly Glu

165 170 175

Ala Ile Ala His Ala Leu Asp Lys Asp Leu Lys Asp Cys Ala Val Tyr

180 185 190

Ser Arg Glu Gly His Thr Gly Glu Arg Val Pro Gly Thr Ile Gly Phe

195 200 205

Ala Thr Val Arg Ala Gly Asp Ile Val Gly Glu His Thr Ala Met Phe

210 215 220

Ala Asp Ile Gly Glu Arg Leu Glu Ile Thr His Lys Ala Ser Ser Arg

225 230 235 240

Met Thr Phe Ala Asn Gly Ala Val Arg Ser Ala Leu Trp Leu Ser Gly

245 250 255

Lys Glu Ser Gly Leu Phe Asp Met Arg Asp Val Leu Asp Leu Asn Asn

260 265 270

Leu

<210> 49

<211> 1266

<212> DNA

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的进行密码子优化的aspK

<400> 49

atggccctgg tcgtacagaa atatggcggt tcctcgcttg agagtgcgga acgcattaga 60

aacgtcgctg aacggatcgt tgccaccaag aaggctggaa atgatgtcgt ggttgtctgc 120

tccgcaatgg gagacaccac ggatgaactt ctagaacttg cagcggcagt gaatcccgtt 180

ccgccagctc gtgaaatgga tatgctcctg actgctggtg agcgtatttc taacgctctc 240

gtcgccatgg ctattgagtc ccttggcgca gaagctcaat ctttcactgg ctctcaggct 300

ggtgtgctca ccaccgagcg ccacggaaac gcacgcattg ttgacgtcac accgggtcgt 360

gtgcgtgaag cactcgatga gggcaagatc tgcattgttg ctggttttca gggtgttaat 420

aaagaaaccc gcgatgtcac cacgttgggt cgtggtggtt ctgacaccac tgcagttgcg 480

ttggcagctg ctttgaacgc tgatgtgtgt gagatttact cggacgttga cggtgtgtat 540

accgctgacc cgcgcatcgt tcctaatgca cagaagctgg aaaagctcag cttcgaagaa 600

atgctggaac ttgctgctgt tggctccaag attttggtgc tgcgcagtgt tgaatacgct 660

cgtgcattca atgtgccact tcgcgtacgc tcgtcttata gtaatgatcc cggcactttg 720

attgccggct ctatggagga tattcctgtg gaagaagcag tccttaccgg tgtcgcaacc 780

gacaagtccg aagccaaagt aaccgttctg ggtatttccg ataagccagg cgagactgcc 840

aaggttttcc gtgcgttggc tgatgcagaa atcaacattg acatggttct gcagaacgtc 900

ttctctgtgg aagacggcac caccgacatc acgttcacct gccctcgcgc tgacggacgc 960

cgtgcgatgg agatcttgaa gaagcttcag gttcagggca actggaccaa tgtgctttac 1020

gacgaccagg tcggcaaagt ctccctcgtg ggtgctggca tgaagtctca cccaggtgtt 1080

accgcagagt tcatggaagc tctgcgcgat gtcaacgtga acatcgaatt gatttccacc 1140

tctgagatcc gcatttccgt gctgatccgt gaagatgatc tggatgctgc tgcacgtgca 1200

ttgcatgagc agttccagct gggcggcgaa gacgaagccg tcgtttatgc aggcaccgga 1260

cgctaa 1266

<210> 50

<211> 421

<212> PRT

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的进行密码子优化的aspK

<400> 50

Met Ala Leu Val Val Gln Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala

1 5 10 15

Glu Arg Ile Arg Asn Val Ala Glu Arg Ile Val Ala Thr Lys Lys Ala

20 25 30

Gly Asn Asp Val Val Val Val Cys Ser Ala Met Gly Asp Thr Thr Asp

35 40 45

Glu Leu Leu Glu Leu Ala Ala Ala Val Asn Pro Val Pro Pro Ala Arg

50 55 60

Glu Met Asp Met Leu Leu Thr Ala Gly Glu Arg Ile Ser Asn Ala Leu

65 70 75 80

Val Ala Met Ala Ile Glu Ser Leu Gly Ala Glu Ala Gln Ser Phe Thr

85 90 95

Gly Ser Gln Ala Gly Val Leu Thr Thr Glu Arg His Gly Asn Ala Arg

100 105 110

Ile Val Asp Val Thr Pro Gly Arg Val Arg Glu Ala Leu Asp Glu Gly

115 120 125

Lys Ile Cys Ile Val Ala Gly Phe Gln Gly Val Asn Lys Glu Thr Arg

130 135 140

Asp Val Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala

145 150 155 160

Leu Ala Ala Ala Leu Asn Ala Asp Val Cys Glu Ile Tyr Ser Asp Val

165 170 175

Asp Gly Val Tyr Thr Ala Asp Pro Arg Ile Val Pro Asn Ala Gln Lys

180 185 190

Leu Glu Lys Leu Ser Phe Glu Glu Met Leu Glu Leu Ala Ala Val Gly

195 200 205

Ser Lys Ile Leu Val Leu Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn

210 215 220

Val Pro Leu Arg Val Arg Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu

225 230 235 240

Ile Ala Gly Ser Met Glu Asp Ile Pro Val Glu Glu Ala Val Leu Thr

245 250 255

Gly Val Ala Thr Asp Lys Ser Glu Ala Lys Val Thr Val Leu Gly Ile

260 265 270

Ser Asp Lys Pro Gly Glu Thr Ala Lys Val Phe Arg Ala Leu Ala Asp

275 280 285

Ala Glu Ile Asn Ile Asp Met Val Leu Gln Asn Val Phe Ser Val Glu

290 295 300

Asp Gly Thr Thr Asp Ile Thr Phe Thr Cys Pro Arg Ala Asp Gly Arg

305 310 315 320

Arg Ala Met Glu Ile Leu Lys Lys Leu Gln Val Gln Gly Asn Trp Thr

325 330 335

Asn Val Leu Tyr Asp Asp Gln Val Gly Lys Val Ser Leu Val Gly Ala

340 345 350

Gly Met Lys Ser His Pro Gly Val Thr Ala Glu Phe Met Glu Ala Leu

355 360 365

Arg Asp Val Asn Val Asn Ile Glu Leu Ile Ser Thr Ser Glu Ile Arg

370 375 380

Ile Ser Val Leu Ile Arg Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala

385 390 395 400

Leu His Glu Gln Phe Gln Leu Gly Gly Glu Asp Glu Ala Val Val Tyr

405 410 415

Ala Gly Thr Gly Arg

420

<210> 51

<211> 9972

<212> DNA

<213> 人工序列

<220>

<223> 质粒骨架序列

<400> 51

gtctgctcac aaatctcagc gaccgcattg atgaaggaaa tcttggtggc caagaacgca 60

ttcgcggaaa ctttcaccag ctcagcggta gcaagatcag tgaccaaaaa cggcgtatca 120

gcagcaatcg cggtggcgta aacctcccga gcgatcgcct ctgctgtcgc cacctcacgc 180

acacccacca cgatgcggtc cggagtgatg gtgtctttga ccgcgtagcc ctcacgcaag 240

aactccggat tccacgcgat ctccacgtgc gaaccaggct tgaccagaga atcagcaagc 300

tcctgcaact gctcagcggt accaaccgga accgtagact tgccgaaaat aatgtgctcg 360

ccctcaagca gcggcaccaa atcctcaaca acctgacgaa catacgtcag atccgccgca 420

taagtaccct tctgctgagg agtacccacg cccaagaaat gcacctgcgc gaaagccgca 480

gcctccgcat aaccagtagt gaagttcagg cgaccatttt ccagattgcg ctccaaaacc 540

tcaggcaaac ccggctcaaa aaatgggacc ttgctgtcct tcaacgacgc aatctttacc 600

tcatcgacat cgacaccaag aacctcatgg ccaagctcag ccatgcaggc cgcgtgcgta 660

gcgccaaggt aacccgtacc aatcactgtc atccgcatgt agggtgattc ctttcaatga 720

agagtggact ggagattatc tcaacacgtt ttgatacagc ccgcgaccgg aacacatgat 780

tgcttacttg ttggggaaat tcaggtacgc cttcgaagga gtaggaccac gctgcccctg 840

atacttcgaa ccaagcttgc cggaaccata cggagtctcc gcaggggaac tcatctggaa 900

caaagccaac tgccccacct tcatacccgg ccacaacgtg atcggcagat tagccacatt 960

ggacaactcc aacgtgatgt aaccgctaaa accaggatca atgaaaccag cagtagagtg 1020

cgtcaacagt ccaagacgac caagagacga cttgccctcc aaacgaccag ccagatgcgc 1080

aggcaaagtg aacttttcca gcgtggacgc cagcacaaac tcacccggat gcagcacaaa 1140

gccctcgccg tcctcaacct caacaaggct ggtcagctca tcctgattca acttagggtc 1200

aatgtgggtg tacttagagt tattgaaaac ccggaagtag cggtccatgc ggacatcgac 1260

actcgacggc tgaatcagct cagcgtcgaa aggttcaatt cccaagtcgc ctgcgtcaat 1320

tgatttacga atgtcacgat ctgaaagaag cacgtcaacc agtgtagcgt tcagcgttca 1380

gggttgggcc acgggttgct gcgatgaggt tcctggggcg cgtggtgctg tcgctgattt 1440

ttatcgtgct agccttattc tcggccctta attaagcgcc accttttaca ctgccggtgt 1500

agttcaatgg tagaactcct gcttcccaag caggcggcgc gggttcgatt cccgtcaccg 1560

gctccaaata agcccctgac ctctcaatac gcaatgaagg tcaagggctt aattctatgg 1620

aaactacaaa aagtacccac ttaaatacac gctttaaatc ccctcacgat gcgatcatca 1680

gcccttttac atttttagaa aaagctttgc agttttccat cgcagccgaa aaccgctcca 1740

gtgcgaaatt gcacactaca tcacaccgaa cactcgacga catctttaat tttcaacata 1800

tccccacccc cagaaattat tcaccactta cacttcacat actcaccaat gcataaccca 1860

aaaagcgtta gatgaaactc cccacccgaa tccacaagaa ctcgggtgcc ctcagtttca 1920

cataccccta agcgcaacac tgtgcgagct ttccgccagt aggccaagca ccctttcgat 1980

taaccccgac aaacttttaa ggcaagccta aattaggtaa accttaaaca gtcgccattg 2040

aagaaattga tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtat 2100

tatggaaacg tctgtatcgg ataagtagcg aggagtgttc gttaaaaatg gccctggtcg 2160

tacagaaata tggcggttcc tcgcttgaga gtgcggaacg cattagaaac gtcgctgaac 2220

ggatcgttgc caccaagaag gctggaaatg atgtcgtggt tgtctgctcc gcaatgggag 2280

acaccacgga tgaacttcta gaacttgcag cggcagtgaa tcccgttccg ccagctcgtg 2340

aaatggatat gctcctgact gctggtgagc gtatttctaa cgctctcgtc gccatggcta 2400

ttgagtccct tggcgcagaa gctcaatctt tcactggctc tcaggctggt gtgctcacca 2460

ccgagcgcca cggaaacgca cgcattgttg acgtcacacc gggtcgtgtg cgtgaagcac 2520

tcgatgaggg caagatctgc attgttgctg gttttcaggg tgttaataaa gaaacccgcg 2580

atgtcaccac gttgggtcgt ggtggttctg acaccactgc agttgcgttg gcagctgctt 2640

tgaacgctga tgtgtgtgag atttactcgg acgttgacgg tgtgtatacc gctgacccgc 2700

gcatcgttcc taatgcacag aagctggaaa agctcagctt cgaagaaatg ctggaacttg 2760

ctgctgttgg ctccaagatt ttggtgctgc gcagtgttga atacgctcgt gcattcaatg 2820

tgccacttcg cgtacgctcg tcttatagta atgatcccgg cactttgatt gccggctcta 2880

tggaggatat tcctgtggaa gaagcagtcc ttaccggtgt cgcaaccgac aagtccgaag 2940

ccaaagtaac cgttctgggt atttccgata agccaggcga gactgccaag gttttccgtg 3000

cgttggctga tgcagaaatc aacattgaca tggttctgca gaacgtctcc tctgtggaag 3060

acggcaccac cgacatcttg ttcacctgcc ctcgcgctga cggacgccgt gcgatggaga 3120

tcttgaagaa gcttcaggtt cagggcaact ggaccaatgt gctttacgac gaccaggtcg 3180

gcaaagtctc cctcgtgggt gctggcatga agtctcaccc aggtgttacc gcagagttca 3240

tggaagctct gcgcgatgtc aacgtgaaca tcgaattgat ttccacctct gagatccgca 3300

tttccgtgct gatccgtgaa gatgatctgg atgctgctgc acgtgcattg catgagcagt 3360

tccagctggg cggcgaagac gaagccgtcg tttatgcagg caccggacgc taatagagtt 3420

ttaaaggagt agttttacaa tgtccaaggg agaaaaaatg aagatcaagg ttggcgtatt 3480

gggtgctacc ggatcggttg gccaacgctt tgtgcagctg cttgcagacc accccatgtt 3540

cgaattgact gctctggcag caagcgaacg gtccgcgggt aaaaaataca aagatgcttg 3600

ttactggttt caagatcggg acattccaga aaatattaag gatatggttg taattccgac 3660

ggatccgaag cacgaagaat tcgaagacgt tgatattgtt tttagcgcgc tgccctcgga 3720

tctggctaaa aaattcgaac ccgaattcgc gaaagaagga aagctgatct tcagcaacgc 3780

atcagcctat cgtatggagg aagatgtgcc gcttgtaatt ccagaggtaa acgctgatca 3840

cctcgaattg attgaaattc agcgcgagaa gcggggttgg gacggagcca ttatcactaa 3900

cccaaactgt tcaaccattt gcgccgtaat cacccttaag ccaattatgg acaaattcgg 3960

tcttgaagcg gtgtttatcg ctaccatgca ggctgtatcg ggcgcaggat acaacggtgt 4020

cccgagcatg gctattctgg ataacttgat tccctttatt aagaatgagg aggagaagat 4080

gcagactgaa tcgcttaagt tgctgggcac gcttaaggat ggaaaagtgg aactcgctaa 4140

cttcaaaatc agcgcatcat gcaatcgtgt ggctgtgatc gacggccaca ccgaatcgat 4200

cttcgtgaag accaaggagg gtgcggaacc tgaggaaatt aaagaagtga tggacaaatt 4260

tgatcctctt aaagacctta accttccgac gtatgccaaa ccaatcgtaa ttcgcgaaga 4320

gatcgatcgc ccacagccac gtcttgaccg caatgagggt aatggcatgt ctattgtcgt 4380

tggtcgtatc cgtaaagatc cgatttttga tgttaagtac accgccctgg aacataacac 4440

tatccgtggc gccgcgggcg catcagtgtt gaatgcggag tatttcgtaa agaaatacat 4500

ctaggcattt ttagtacgtg caataaccac tctggttttt ccagggtggt tttttgatgc 4560

cctttttgga gtcttcaact gcttagcttt gacctgcaca aatagttgca aattgtccca 4620

catacacata aagtagcttg cgtatttaaa attatgaacc taaggggttt agcaatgact 4680

gtagatgaac aggtttctaa ctactacgac atgcttctca aacgtaatgc tggagagccc 4740

gaatttcatc aggcggttgc tgaagtgctt gaatccctca agattgttct tgaaaaagat 4800

ccgcactacg cggactatgg cctcatccag cggctgtgtg aacctgaacg tcaactgatc 4860

ttccgtgtgc cgtgggtaga tgatcaggga caagtgcacg tcaaccgcgg ttttcgtgta 4920

cagtttaatt cggcgctcgg tccctacaaa ggcggattgc gtttccaccc tagcgtcaat 4980

cttggcatcg tcaagttttt gggtttcgaa caaattttta agaattccct taccggactg 5040

cctatcggag gcggaaaggg cggttcggat tttgacccta aaggcaagag cgatctcgaa 5100

atcatgcggt tttgtcagtc ttttatgacc gaactgcatc gtcacatcgg cgaatatcgc 5160

gatgtcccgg cgggtgatat cggcgtgggt ggtcgtgaga tcggatacct ctttggtcat 5220

tatcgtcgga tggcgaatca gcacgaatcg ggagtcctta ccggcaaagg tctgacttgg 5280

ggcggcagcc tggttcggac cgaagccacg ggatacggtt gtgtctattt cgtatcggag 5340

atgatcaaag caaaaggcga gtcaatctcg ggacagaaga ttatcgtatc cggatcggga 5400

aatgttgcta cctatgccat tgagaaagct caagagctgg gcgcgacggt gatcggcttc 5460

tcggattcct caggctgggt gcatactccg aatggtgtgg acgtggctaa acttcgcgaa 5520

atcaaggaag tacgtcgcgc acgcgtaagc gtttatgccg atgaagtgga gggagcaacc 5580

taccataccg atggatccat ctgggatctt aagtgtgaca tcgcacttcc ttgcgctacg 5640

caaaatgaac tgaacggaga gaatgcgaaa acgctggccg ataatggttg ccgcttcgtc 5700

gcggagggcg ctaacatgcc gagcaccccg gaggccgtcg aagtttttcg ggagcgcgac 5760

atccggttcg gccccggcaa agcggctaat gctggcggag tggcaacgtc agcgttggag 5820

atgcagcaga acgcatcccg ggactcatgg agcttcgaat acaccgacga acgcctccag 5880

gtcattatga agaacatttt taagacgtgt gcggaaaccg cagccgagta tggccacgag 5940

aacgattacg tcgtcggagc aaacattgca ggatttaaga aagttgctga tgcgatgctc 6000

gcccaaggtg tgatctaggc ttttcgacgt ctcctccggc gaaacccaaa aaaggaaccc 6060

tcacagttcg tgagggttcc ttttactatt gtctacaatc caaggtaatg ctcaaggcca 6120

accaccaatc cgggatgctg tgcgatattg cggactccaa ccaaaacacc cggcgcgaaa 6180

gagttacgat cgtagctatc ttgtttaata gtaagcgttt ggccttgcgt gccaaagatt 6240

acttgttcat gtgcgaccat gcctgacatg cgaacggcat gtaccggaat accatcaaca 6300

gacgcgccac ggctaccctc aagggcttgc tcagttgcat cgggctgtgc atccatacct 6360

gcctctttac gagccgctgc aataccttga gcagtatgaa tcgcagtgcc agaaggggcg 6420

tcaagtttat tcgggtggtg aagttcgata acttctgcgg attcgaaaaa gcgcgccgcc 6480

tgtttagaga acaccatggt aagcactgct gaaatcgcaa agttaggggc aatcaagact 6540

ccgacgttgt ccttaccttc cagccagtcc cgtacttgtt cgaggcgtgc atcatcaaat 6600

ccggtggttc ctactactgc ggagattccg ttgttgatac agaactccaa gtttcccatc 6660

accgcattag gcgtagtgaa gtcaacaacg acctccgcgc cgttgtctac gagcagagac 6720

agatcgtcat ccacaccgat ttctgctacc aactcgagat cgtctgattc gttcactgct 6780

gccacgatcg tctgacctac ccggccctta gctcccagca ctccaacttt aatgcccatt 6840

gtaaaactac tcctttaaaa ctctacacat cccgggcaat caagtcgtcc aagttttccg 6900

ggctcaacaa atatggggca acttccagaa cggtaaaggc acctgattgg ccttgttgtt 6960

tcatgcggtg cgctgcacgg ccgaacgcga tttgagagga cgcagtgaag tcgggattac 7020

ggtccagctt gagaatatac tcaacggtgt ggttaaaacc gccagtgtcg ccagtcgtga 7080

tcacgtgacc gccgtggggc atacccgtat gttcagagtc gaaggttgct tcatcgatga 7140

aattgacttc cacctcatag cctacgaagt aatcgggcat agtccgaata tcgttctcga 7200

tgcgctcatg gtcggccgcg tcggccacaa cgaagcactg gcgtttatgc gtttgcttgc 7260

cggtcaaatc tccggcctcg ccgcgccgtg ctttttcaag cgcatcttca gaaggcaacg 7320

tgtactgaac agccttttga acacccggga tgcggcgaag ggcatcgcta tggccctggc 7380

taagtcctgg accccaaaac gtgtgttgct ggtgctcggc caaaacagca gcggcataaa 7440

cacgattaat cgaaaacatg cctgggtccc agcccgtaga aaccaacgct acattgcctg 7500

ctgcggttgc agcttcattc ataacttggc gatgccgggg gatatcacga tgattatcgt 7560

acgtgtccac cgtacaggca aattgagcga acttgggggc ttgctccggg atatccgttg 7620

cagatcccat gcacaaaaag agtacatcga catcatcggc atgtttatca acgtccgcca 7680

catcgaagac gggggtcttc gtatcgagag tcgcccggcg cgagaaaatt ccaacaagat 7740

ccatgtctgg ttgcttggcg atgagttttt ctacgctgcg tcccagatta ccgtatccga 7800

cgattgctac acggatgttc gtcattttta acgaacactc ctcgctactt atccgataca 7860

gacgtttcca taatacacgc ttaggtcccc acgtagtacc acacacaacg cgagaaacgg 7920

caagaatttt aaaaacaaac aaccttcaac gcgctaacaa gcatcttccc actctcgtta 7980

ccggagtttc tcacatgtct cacaagtttt cccgccgcgc tttcgcagta ctgaccgctg 8040

ccgcgatttc cacttccgct ttcgcaacca ctgctccgtc tgcgattgca gaaccagttt 8100

ccatagtcac caccgcagac gattctagcg tcgcaacttc agaaaactcc cttgactggg 8160

gtttcaagtc ttcctggcgc acctatgtca ccggaccttg gactggtgga accgttgacg 8220

caactggcgg tgcaactgtc aacgaagatg gaacctacaa cttcaccctc ggaactggct 8280

ccacttacga catcgacacc gagaagggcc agctgaacta cgaaggaact gttgccttcg 8340

ccagtgacgc tcacggcttc aacatcacct tgtccaaccc gcagatcacc gtcgagggcg 8400

acactgcaac tttgagcgcc gagctgtctg acaatgccgc tccagaagag acctccacta 8460

ctcgcgttga tgtcgctgag ttcgagctga ctgctcctgc ggtttcagaa accgatgcaa 8520

acaccactta cacttggatc gatgtttccg gcactttcct agaatccctg ccgcctgaag 8580

aattgagccg ttacgcaggc caggaagcgg atgcgctgag cttctccatc accgtggaca 8640

aggcttcaga gaacccttcc gatgatgttg ctaccggatc ttcctccagc ttcctctcca 8700

ccatcttgaa cttccttcag cagctggcga gcccactact caagctcttc ggttcgcttt 8760

cttcctaaat aatcagtaat gccccaccag atctggtggg gcattttgtt ttaggagcag 8820

accacgtttg gtgaaggatc gtaaaccgtg gtgacggttt ctctggtgat ttcgttgcca 8880

gaaagatcgc tgatgattcg ggtgtcggag gtggtaaatc ctggtgcacc ggttgatggc 8940

acacaatctg aacccgatac tcgaactgtg ttgggctggg tggtggacca acgtccgttg 9000

ttgatggatt ccacggaggt ggtgtccaca cccatgatgc gcacggtcac gtttgaggcg 9060

tcggcagagg tgctgatcat gacggggtat ggggagttgt tgcggaattg aaggtcgatg 9120

gcaccatcga aaatagtagc ttcacgtccg gctgggtagc gggaaatgta gtagctgtgc 9180

ggggtgtgcg tgatgtcttc cagacctgcg aagtagtacg cgttgtacaa ggtggtggcg 9240

aactgactga tgccaccgcc gactgcggtg tcggaacgac cattcaaaat gatgccggaa 9300

tcaacaaagc cttgggctgc gccacgtggg ccggtgtagt tgttgaggga gaacgtatcg 9360

ccaggtgaaa cgactgcgcc gtcgaccatt tgcgcggtga ggcggatgtt tgttccggag 9420

gcagcagaga agccgccggt ggtgaactcg cccatgacct cattgaaggt agcgttttgg 9480

gcgtcggtgg cggtgaatgt tgctggggtg tcctcataga cagcgtcgat ggtgcggggg 9540

ccatcgccgg tgaggttgtt gggcagatcg gccagggttt cttcccagtt gattccgtgt 9600

ccggtgactt ctggggtgac tacgcgggag cctgaggaga aactgatttg agcgttggtg 9660

ggctcgatct ctgtttcttt gaggccttcg gccagcattg ctgtggctgc ttctgcattg 9720

atgtcgacgc ggatggtgcc gttttcttct gggaaactca ccacttcacc catgcgctcg 9780

acggggatgg tgccttcaat tccgtcatcg cctcggacga cgaaggggct agatacggct 9840

ttagctccgg cgccttctgc aagttcatcg atggtgtctt ggctgatcgc agcgggaaca 9900

acgtatggct cggcttctac gccctctggg ttgagccagt tttctgtgac tgcttgttcc 9960

aaaacggtgc gg 9972

<210> 52

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> 启动子序列

<400> 52

tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtat tatggaaacg 60

tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97

<210> 53

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 启动子序列

<400> 53

tagagtttta aaggagtagt tttaca 26

<210> 54

<211> 173

<212> DNA

<213> 人工序列

<220>

<223> 启动子序列

<400> 54

taggcatttt tagtacgtgc aataaccact ctggtttttc cagggtggtt ttttgatgcc 60

ctttttggag tcttcaactg cttagctttg acctgcacaa atagttgcaa attgtcccac 120

atacacataa agtagcttgc gtatttaaaa ttatgaacct aaggggttta gca 173

<210> 55

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> 启动子序列

<400> 55

taggcttttc gacgtctcct ccggcgaaac ccaaaaaagg aaccctcaca gttcgtgagg 60

gttcctttta ctattgtcta 80

<210> 56

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 启动子序列

<400> 56

tgtaaaacta ctcctttaaa actcta 26

<210> 57

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> 启动子序列

<400> 57

ttttaacgaa cactcctcgc tacttatccg atacagacgt ttccataata cacgcttagg 60

tccccacgta gtaccacaca caacgcgaga aacggca 97

<210> 58

<211> 334

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 58

Met Thr Ile Arg Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Asn

1 5 10 15

Phe Phe Arg Ala Ile Leu Glu Arg Ser Asp Asp Leu Glu Val Val Ala

20 25 30

Val Asn Asp Leu Thr Asp Asn Lys Thr Leu Ser Thr Leu Leu Lys Phe

35 40 45

Asp Ser Ile Met Gly Arg Leu Gly Gln Glu Val Glu Tyr Asp Asp Asp

50 55 60

Ser Ile Thr Val Gly Gly Lys Arg Ile Ala Val Tyr Ala Glu Arg Asp

65 70 75 80

Pro Lys Asn Leu Asp Trp Ala Ala His Asn Val Asp Ile Val Ile Glu

85 90 95

Ser Thr Gly Phe Phe Thr Asp Ala Asn Ala Ala Lys Ala His Ile Glu

100 105 110

Ala Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ala Ser Asn Glu Asp

115 120 125

Ala Thr Phe Val Tyr Gly Val Asn His Glu Ser Tyr Asp Pro Glu Asn

130 135 140

His Asn Val Ile Ser Gly Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro

145 150 155 160

Met Ala Lys Val Leu Asn Asp Lys Phe Gly Ile Glu Asn Gly Leu Met

165 170 175

Thr Thr Val His Ala Tyr Thr Gly Asp Gln Arg Leu His Asp Ala Pro

180 185 190

His Arg Asp Leu Arg Arg Ala Arg Ala Ala Ala Val Asn Ile Val Pro

195 200 205

Thr Ser Thr Gly Ala Ala Lys Ala Val Ala Leu Val Leu Pro Glu Leu

210 215 220

Lys Gly Lys Leu Asp Gly Tyr Ala Leu Arg Val Pro Val Ile Thr Gly

225 230 235 240

Ser Ala Thr Asp Leu Thr Phe Asn Thr Lys Ser Glu Val Thr Val Glu

245 250 255

Ser Ile Asn Ala Ala Ile Lys Glu Ala Ala Val Gly Glu Phe Gly Glu

260 265 270

Thr Leu Ala Tyr Ser Glu Glu Pro Leu Val Ser Thr Asp Ile Val His

275 280 285

Asp Ser His Gly Ser Ile Phe Asp Ala Gly Leu Thr Lys Val Ser Gly

290 295 300

Asn Thr Val Lys Val Val Ser Trp Tyr Asp Asn Glu Trp Gly Tyr Thr

305 310 315 320

Cys Gln Leu Leu Arg Leu Thr Glu Leu Val Ala Ser Lys Leu

325 330

<210> 59

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> 来源于Pcg0007_lib_39的表达启动子P1

<400> 59

tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtat tatggaaacg 60

tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97

<210> 60

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> 来源于Pcg0007的表达启动子P2

<400> 60

tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtaa gatggaaacg 60

tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97

<210> 61

<211> 93

<212> DNA

<213> 人工序列

<220>

<223> 来源于Pcg1860的表达启动子P3

<400> 61

cttagctttg acctgcacaa atagttgcaa attgtcccac atacacataa agtagcttgc 60

gtatttaaaa ttatgaacct aaggggttta gca 93

<210> 62

<211> 98

<212> DNA

<213> 人工序列

<220>

<223> 来源于Pcg0755的表达启动子P4

<400> 62

aataaattta taccacacag tctattgcaa tagaccaagc tgttcagtag ggtgcatggg 60

agaagaattt cctaataaaa actcttaagg acctccaa 98

<210> 63

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> 来源于Pcg0007_265的表达启动子P5

<400> 63

tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtac gctggaaacg 60

tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97

<210> 64

<211> 86

<212> DNA

<213> 人工序列

<220>

<223> 来源于Pcg3381的表达启动子P6

<400> 64

cgccggataa atgaattgat tattttaggc tcccagggat taagtctagg gtggaatgca 60

gaaatatttc ctacggaagg tccgtt 86

<210> 65

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> 来源于Pcg0007_119的表达启动子P7

<400> 65

tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgttg catggaaacg 60

tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97

<210> 66

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 来源于Pcg312的表达启动子P8

<400> 66

gtggctaaaa cttttggaaa cttaagttac ctttaatcgg aaacttattg aattcgggtg 60

aggcaactgc aactctggac ttaaagc 87

<210> 67

<211> 331

<212> PRT

<213> 大肠杆菌

<400> 67

Met Thr Ile Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Ile

1 5 10 15

Val Phe Arg Ala Ala Gln Lys Arg Ser Asp Ile Glu Ile Val Ala Ile

20 25 30

Asn Asp Leu Leu Asp Ala Asp Tyr Met Ala Tyr Met Leu Lys Tyr Asp

35 40 45

Ser Thr His Gly Arg Phe Asp Gly Thr Val Glu Val Lys Asp Gly His

50 55 60

Leu Ile Val Asn Gly Lys Lys Ile Arg Val Thr Ala Glu Arg Asp Pro

65 70 75 80

Ala Asn Leu Lys Trp Asp Glu Val Gly Val Asp Val Val Ala Glu Ala

85 90 95

Thr Gly Leu Phe Leu Thr Asp Glu Thr Ala Arg Lys His Ile Thr Ala

100 105 110

Gly Ala Lys Lys Val Val Met Thr Gly Pro Ser Lys Asp Asn Thr Pro

115 120 125

Met Phe Val Lys Gly Ala Asn Phe Asp Lys Tyr Ala Gly Gln Asp Ile

130 135 140

Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys

145 150 155 160

Val Ile Asn Asp Asn Phe Gly Ile Ile Glu Gly Leu Met Thr Thr Val

165 170 175

His Ala Thr Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser His Lys

180 185 190

Asp Trp Arg Gly Gly Arg Gly Ala Ser Gln Asn Ile Ile Pro Ser Ser

195 200 205

Thr Gly Ala Ala Lys Ala Val Gly Lys Val Leu Pro Glu Leu Asn Gly

210 215 220

Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val

225 230 235 240

Val Asp Leu Thr Val Arg Leu Glu Lys Ala Ala Thr Tyr Glu Gln Ile

245 250 255

Lys Ala Ala Val Lys Ala Ala Ala Glu Gly Glu Met Lys Gly Val Leu

260 265 270

Gly Tyr Thr Glu Asp Asp Val Val Ser Thr Asp Phe Asn Gly Glu Val

275 280 285

Cys Thr Ser Val Phe Asp Ala Lys Ala Gly Ile Ala Leu Asn Asp Asn

290 295 300

Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Thr Gly Tyr Ser Asn

305 310 315 320

Lys Val Leu Asp Leu Ile Ala His Ile Ser Lys

325 330

<210> 68

<211> 996

<212> DNA

<213> 大肠杆菌

<400> 68

atgactatca aagtaggtat caacggtttt ggccgtatcg gtcgcattgt tttccgtgct 60

gctcagaaac gttctgacat cgagatcgtt gcaatcaacg acctgttaga cgctgattac 120

atggcataca tgctgaaata tgactccact cacggccgtt tcgacggtac cgttgaagtg 180

aaagacggtc atctgatcgt taacggtaaa aaaatccgtg ttaccgctga acgtgatccg 240

gctaacctga aatgggacga agttggtgtt gacgttgtcg ctgaagcaac tggtctgttc 300

ctgactgacg aaactgctcg taaacacatc accgctggtg cgaagaaagt ggttatgact 360

ggtccgtcta aagacaacac tccgatgttc gttaaaggcg ctaacttcga caaatatgct 420

ggccaggaca tcgtttccaa cgcttcctgc accaccaact gcctggctcc gctggctaaa 480

gttatcaacg ataacttcgg catcatcgaa ggtctgatga ccaccgttca cgctactacc 540

gctactcaga aaaccgttga tggcccgtct cacaaagact ggcgcggcgg ccgcggcgct 600

tcccagaaca tcatcccgtc ctctaccggt gctgctaaag ctgtaggtaa agtactgcca 660

gaactgaatg gcaaactgac tggtatggcg ttccgcgttc cgaccccgaa cgtatctgta 720

gttgacctga ccgttcgtct ggaaaaagct gcaacttacg agcagatcaa agctgccgtt 780

aaagctgctg ctgaaggcga aatgaaaggc gttctgggct acaccgaaga tgacgtagta 840

tctaccgatt tcaacggcga agtttgcact tccgtgttcg atgctaaagc tggtatcgct 900

ctgaacgaca acttcgtgaa actggtatcc tggtacgaca acgaaaccgg ttactccaac 960

aaagttctgg acctgatcgc tcacatctcc aaataa 996

<210> 69

<211> 334

<212> PRT

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的D35G L36T突变gapAv5

<400> 69

Met Thr Ile Arg Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Asn

1 5 10 15

Phe Phe Arg Ala Ile Leu Glu Arg Ser Asp Asp Leu Glu Val Val Ala

20 25 30

Val Asn Gly Thr Thr Asp Asn Lys Thr Leu Ser Thr Leu Leu Lys Phe

35 40 45

Asp Ser Ile Met Gly Arg Leu Gly Gln Glu Val Glu Tyr Asp Asp Asp

50 55 60

Ser Ile Thr Val Gly Gly Lys Arg Ile Ala Val Tyr Ala Glu Arg Asp

65 70 75 80

Pro Lys Asn Leu Asp Trp Ala Ala His Asn Val Asp Ile Val Ile Glu

85 90 95

Ser Thr Gly Phe Phe Thr Asp Ala Asn Ala Ala Lys Ala His Ile Glu

100 105 110

Ala Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ala Ser Asn Glu Asp

115 120 125

Ala Thr Phe Val Tyr Gly Val Asn His Glu Ser Tyr Asp Pro Glu Asn

130 135 140

His Asn Val Ile Ser Gly Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro

145 150 155 160

Met Ala Lys Val Leu Asn Asp Lys Phe Gly Ile Glu Asn Gly Leu Met

165 170 175

Thr Thr Val His Ala Tyr Thr Gly Asp Gln Arg Leu His Asp Ala Pro

180 185 190

His Arg Asp Leu Arg Arg Ala Arg Ala Ala Ala Val Asn Ile Val Pro

195 200 205

Thr Ser Thr Gly Ala Ala Lys Ala Val Ala Leu Val Leu Pro Glu Leu

210 215 220

Lys Gly Lys Leu Asp Gly Tyr Ala Leu Arg Val Pro Val Ile Thr Gly

225 230 235 240

Ser Ala Thr Asp Leu Thr Phe Asn Thr Lys Ser Glu Val Thr Val Glu

245 250 255

Ser Ile Asn Ala Ala Ile Lys Glu Ala Ala Val Gly Glu Phe Gly Glu

260 265 270

Thr Leu Ala Tyr Ser Glu Glu Pro Leu Val Ser Thr Asp Ile Val His

275 280 285

Asp Ser His Gly Ser Ile Phe Asp Ala Gly Leu Thr Lys Val Ser Gly

290 295 300

Asn Thr Val Lys Val Val Ser Trp Tyr Asp Asn Glu Trp Gly Tyr Thr

305 310 315 320

Cys Gln Leu Leu Arg Leu Thr Glu Leu Val Ala Ser Lys Leu

325 330

<210> 70

<211> 1005

<212> DNA

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的D35G L36T突变gapAv5

<400> 70

atgaccattc gtgttggtat taacggattt ggccgtatcg gacgtaactt cttccgcgca 60

attctggagc gcagcgacga tctcgaggta gttgcagtca acggcaccac cgacaacaag 120

accctttcca cccttctcaa gttcgactcc atcatgggcc gccttggcca ggaagttgaa 180

tacgacgatg actccatcac cgttggtggc aagcgcatcg ctgtttacgc agagcgcgat 240

ccaaagaacc tggactgggc tgcacacaac gttgacatcg tgatcgagtc caccggcttc 300

ttcaccgatg caaacgcggc taaggctcac atcgaagcag gtgccaagaa ggtcatcatc 360

tccgcaccag caagcaacga agacgcaacc ttcgtttacg gtgtgaacca cgagtcctac 420

gatcctgaga accacaacgt gatctccggc gcatcttgca ccaccaactg cctcgcacca 480

atggcaaagg tcctgaacga caagttcggc atcgagaacg gtctcatgac caccgttcac 540

gcatacaccg gcgaccagcg cctgcacgat gcacctcacc gcgacctgcg tcgtgcacgt 600

gcagcagcag tcaacatcgt tcctacctcc accggtgcag ctaaggctgt tgctctggtt 660

ctcccagagc tcaagggcaa gcttgacggc tacgcacttc gcgttccagt tatcaccggt 720

tccgcaaccg acctgacctt caacaccaag tctgaggtca ccgttgagtc catcaacgct 780

gcaatcaagg aagctgcagt cggcgagttc ggcgagaccc tggcttactc cgaagagcca 840

ctggtttcca ccgacatcgt ccacgattcc cacggctcca tcttcgacgc tggcctgacc 900

aaggtctccg gcaacaccgt caaggttgtt tcctggtacg acaacgagtg gggctacacc 960

tgccagctcc tgcgtctgac cgagctcgta gcttccaagc tctaa 1005

<210> 71

<211> 334

<212> PRT

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的L36T T37K突变gapAv7

<400> 71

Met Thr Ile Arg Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Asn

1 5 10 15

Phe Phe Arg Ala Ile Leu Glu Arg Ser Asp Asp Leu Glu Val Val Ala

20 25 30

Val Asn Asp Thr Lys Asp Asn Lys Thr Leu Ser Thr Leu Leu Lys Phe

35 40 45

Asp Ser Ile Met Gly Arg Leu Gly Gln Glu Val Glu Tyr Asp Asp Asp

50 55 60

Ser Ile Thr Val Gly Gly Lys Arg Ile Ala Val Tyr Ala Glu Arg Asp

65 70 75 80

Pro Lys Asn Leu Asp Trp Ala Ala His Asn Val Asp Ile Val Ile Glu

85 90 95

Ser Thr Gly Phe Phe Thr Asp Ala Asn Ala Ala Lys Ala His Ile Glu

100 105 110

Ala Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ala Ser Asn Glu Asp

115 120 125

Ala Thr Phe Val Tyr Gly Val Asn His Glu Ser Tyr Asp Pro Glu Asn

130 135 140

His Asn Val Ile Ser Gly Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro

145 150 155 160

Met Ala Lys Val Leu Asn Asp Lys Phe Gly Ile Glu Asn Gly Leu Met

165 170 175

Thr Thr Val His Ala Tyr Thr Gly Asp Gln Arg Leu His Asp Ala Pro

180 185 190

His Arg Asp Leu Arg Arg Ala Arg Ala Ala Ala Val Asn Ile Val Pro

195 200 205

Thr Ser Thr Gly Ala Ala Lys Ala Val Ala Leu Val Leu Pro Glu Leu

210 215 220

Lys Gly Lys Leu Asp Gly Tyr Ala Leu Arg Val Pro Val Ile Thr Gly

225 230 235 240

Ser Ala Thr Asp Leu Thr Phe Asn Thr Lys Ser Glu Val Thr Val Glu

245 250 255

Ser Ile Asn Ala Ala Ile Lys Glu Ala Ala Val Gly Glu Phe Gly Glu

260 265 270

Thr Leu Ala Tyr Ser Glu Glu Pro Leu Val Ser Thr Asp Ile Val His

275 280 285

Asp Ser His Gly Ser Ile Phe Asp Ala Gly Leu Thr Lys Val Ser Gly

290 295 300

Asn Thr Val Lys Val Val Ser Trp Tyr Asp Asn Glu Trp Gly Tyr Thr

305 310 315 320

Cys Gln Leu Leu Arg Leu Thr Glu Leu Val Ala Ser Lys Leu

325 330

<210> 72

<211> 1005

<212> DNA

<213> 人工序列

<220>

<223> 来自谷氨酸棒状杆菌的L36T T37K突变gapAv7

<400> 72

atgaccattc gtgttggtat taacggattt ggccgtatcg gacgtaactt cttccgcgca 60

attctggagc gcagcgacga tctcgaggta gttgcagtca acgacaccaa ggacaacaag 120