一种低含量脂肪酸杂质的长链二元酸及其生产方法

文档序号：1624403 发布日期：2020-01-14 浏览：14次 >En<

阅读说明：本技术 一种低含量脂肪酸杂质的长链二元酸及其生产方法 (Long-chain dibasic acid with low content of fatty acid impurities and production method thereof ) 是由刘文波徐敏杨晨周豪宏刘修才于 2019-04-01 设计创作，主要内容包括：本发明涉及一种低含量脂肪酸杂质的长链二元酸及其生产方法,具体涉及利用定向进化和同源重组方法制备长链二元酸菌株、利用该菌株发酵生产低含量脂肪酸杂质的长链二元酸。本发明涉及一种分离的突变的CPR-b基因、其同源基因或其变体,其相对于GenBank登录号AY823228,以起始密码子ATG上游第一位碱基为-1计,具有碱基突变-322G>A以及以终止密码子TAG下游第一位碱基为1计,具有突变3’UTR.19C>T和3’UTR.76_77insT。本发明还涉及含有所述突变的CPR-b基因、同源基因或变体的菌株,该菌株发酵生产长链二元酸时,其发酵产物中脂肪酸杂质的含量显著降低。(The invention relates to a long-chain dibasic acid with low content of fatty acid impurities and a production method thereof, in particular to a long-chain dibasic acid strain prepared by using directed evolution and homologous recombination methods and a long-chain dibasic acid with low content of fatty acid impurities produced by fermenting the strain. The present invention relates to an isolated mutated CPR-b gene, a homologous gene thereof or a variant thereof having the mutation-322G > a, calculated as the first base upstream of the start codon ATG of-1 and the mutation 3'utr.19c > T and 3' utr.76_77insT, calculated as the first base downstream of the stop codon TAG of 1, relative to GenBank accession No. AY 823228. The invention also relates to a strain containing the mutated CPR-b gene, homologous gene or variant, wherein the content of fatty acid impurities in a fermentation product is obviously reduced when the strain is used for producing the long-chain dibasic acid by fermentation.)

技术领域

本发明涉及一种低含量脂肪酸杂质的长链二元酸及其生产方法，以及利用定向进化和同源重组方法制备长链二元酸菌株、利用该菌株生产低脂肪酸杂质含量的长链二元酸的方法。

背景技术

长链二元酸(LCDA；也称为长链二羧酸或长链二酸)包括化学式 HOOC(CH₂)_nCOOH的二元酸，其中n≥7。长链二元酸作为重要的单体原料，广泛用于合成尼龙、树脂、热熔胶、粉末涂料、防腐剂、香料、润滑剂、塑化剂等。

长期以来，长链二元酸经由石油通过传统的化学合成途径如丁二烯多步氧化法合成。但化学合成法面临多种挑战，化学合成法得到的二元酸为长链二元酸与短链二元酸的混合物，因此需要复杂的后续提取纯化步骤，对于生产工艺和生产成本而言，都是巨大的障碍。采用微生物发酵技术生产长链二元酸，因其产生的污染低、环境友好、能够合成化学合成方法难以合成的产物如12碳以上的长链二元酸且纯度高等特点，较传统的化学合成法具有明显的优势。

但是微生物发酵技术生产的长链二元酸，有时会在产物中残留杂质，产品纯度的降低会严重影响产品的质量，对后期应用造成极大地影响。尤其是与长链二元酸特性比较类似的杂质，其不仅对后期的提取纯化带来了巨大的技术挑战，而且对于生产成本控制而言也会造成严重的负面影响。因此对于生产长链二元酸菌株进行遗传改造，以降低发酵过程中一些特定杂质的含量，对于生物合成法生产二元酸具有重要的意义和生产价值。

此前，二元酸菌种的改良大多通过传统的随机诱变或采用基因工程的方法得以实现，由于诱变本身随机性的特点，对筛选通量有很高的要求，而且每一次对于性状改变都要求新一轮的诱变筛选，在技术上已经成为重要的限制因素。采用基因工程的手段可以对菌株进行有针对性的遗传改造，从而获得产率更高的优良菌株。长链二元酸微生物发酵法生产方法主要为烷烃经ω- 氧化生成。继而又可以经过β-氧化途径而被降解。以往的研究表明，可以通过增强ω-氧化途径并抑制β-氧化途径的手段来提高长链二元酸的产率。Coginis公司的Pictaggio等(Mol.Cell.Biol.,11(9),4333-4339,1991)报导敲除POX4和POX5各两个等位基因可以有效阻断β-氧化途径，从而达到底物 100％的转化率。进一步过量表达ω-氧化途径中的限速步骤的两个关键酶 P450及氧化还原酶CPR-b基因，可以使产量得到有效提升。赖小勤等(中国发明专利CN103992959B)报道向二元酸生产菌株中引入一个拷贝的 CYP52A14基因也可以有效提高二元酸的转化率和生产效率。另外清华大学曹竹安等人(Biotechnol.J.,1,68-74,2006)发现敲除乙酰辅酶A由过氧化物酶体向线粒体运输过程中的关键基因CAT中的一个拷贝，从而部分阻断乙酰辅酶A进入柠檬酸循环，也可以有效降低二元酸的降解。

易错PCR是Leung等(Technique,1,11-15,1989)最早提出的构建基因文库进行定向研究的技术。通过改变PCR反应条件，如调整反应体系中四种脱氧核糖核酸的浓度、改变Mg²⁺的浓度以及使用低保真度的DNA聚合酶等方法，使碱基错配而引入突变。过高或过低的突变率都会影响构建突变库的效果，理想的碱基突变比例是每个DNA片段1-3个。因此利用易错PCR产生随机突变，并结合同源重组的方法进行基因的定向遗传学改造，可以帮助筛选对菌株产能进一步提高有帮助的有益突变。

然而，采用基因工程的手段改造二元酸生产菌株以降低脂肪酸含量的研究尚未见有报道。本领域依然存在对杂质含量低的长链二元酸产品以及发酵生产这类产品的菌株、其制备方法的需求。

发明内容

本发明涉及一种分离的突变的CPR-b基因、其同源基因或其变体，其相对于GenBank登录号AY823228(例如SEQ ID NO：22所示)，以起始密码子ATG上游第一位碱基(例如SEQ ID NO：22所示的第763位碱基“C”) 为-1计，在其启动子区域发生了一处碱基突变-322G>A；以终止密码子TAG 下游第一位碱基(例如SEQ ID NO：22所示的第2804位碱基“A”)为1 计，其终止子区域发生的突变为：3'UTR.19C>T和3'UTR.76_77insT；其中所述变体与突变的CPR-b基因、其同源基因具有至少70％的序列同一性。

在一些实施方案中，本发明所述突变的CPR-b基因的序列如SEQ ID NO：13或23所示或与其具有至少70％的序列同一性，例如具有至少或至少约75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、 98％、99％、99.18％、99.21％、99.25％、99.28％、99.32％、99.36％、99.39％、 99.43％、99.46％、99.50％、99.53％、99.57％、99.61％、99.64％、99.68％、 99.72％、99.75％、99.79％、99.82％、99.86％、99.89％、99.93％或99.96％的同一性的序列。

本发明进一步涉及一种含有本发明所述突变的CPR-b基因、其同源基因或其变体的微生物，其相对于含有未突变的CPR-b基因及其同源基因的微生物，在生产长链二元酸时具有降低的脂肪酸杂质含量。

本发明进一步涉及一种利用含有本发明所述突变的CPR-b基因、其同源基因或其变体的微生物发酵产生长链二元酸的方法，其包括培养所述微生物的步骤，任选地，其还包括从培养产物分离、提取和/或纯化长链二元酸的步骤。

在一些实施方案中，本发明所述微生物发酵产生长链二元酸的过程结束后，发酵液中含有脂肪酸杂质，且所述脂肪酸杂质的质量比率在1.50％以下，所述质量比率为发酵液中脂肪酸杂质占长链二元酸的质量百分比。

在一些实施方案中，本发明所述微生物发酵产生长链二元酸的过程结束后，发酵液中含有脂肪酸杂质，且相对于采用常规微生物发酵法如采用本发明所述的非突变的微生物发酵生产的长链二元酸中的脂肪酸杂质的含量，所述发酵液中脂肪酸杂质的含量至少下降5％。

本发明进一步涉及一种低含量脂肪酸杂质的长链二元酸，所述长链二元酸中含有的脂肪酸杂质的含量大于0，且在4000ppm以下，优选1000ppm以下，更优选200ppm以下，并且所述脂肪酸杂质包括含有一个端羧基的饱和直链有机酸。优选地，所述长链二元酸通过培养长链二元酸生产微生物菌株，经发酵生产获得。

在一些实施方案中，所述长链二元酸生产微生物菌株含有本发明所述的突变的CPR-b基因、其同源基因或其变体。在一些实施方案中，所述长链二元酸生产微生物菌株是本发明所述的含有本发明所述突变的CPR-b基因、其同源基因或其变体的微生物。

在一些实施方案中，本发明所述微生物选自棒状杆菌、白地霉、假丝酵母属、毕赤酵母属、红酵母属、酵母属、耶氏酵母属；更优选地，所述微生物是酵母菌；更优选地，所述微生物选自热带假丝酵母(Candida tropicalis) 或清酒假丝酵母(Candida sake)。在一个具体实施方案中，所述微生物选自CCTCC M2011192和CCTCC M203052。

在一些实施方案中，本发明所述长链二元酸选自C9～C22长链二元酸，优选选自C9～C18长链二元酸，更优选选自十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种。更优选地，所述长链二元酸选自十碳至十六碳二元酸中至少一种或者正十碳至十六碳二元酸中的至少一种，例如选自癸二酸、十一烷二元酸、十二烷二元酸、十三烷二元酸、十四烷二元酸、十五烷二元酸和十六烷二元酸中的至少一种。

在一些实施方案中，所述脂肪酸杂质的化学式为CH₃-(CH₂)n-COOH，其中n≥7，优选所述脂肪酸杂质包括碳链上碳原子数在9以上、且含有1个端羧基的长链脂肪酸，优选所述脂肪酸杂质包括九碳脂肪酸、十碳脂肪酸或癸酸、十一碳脂肪酸、十二碳脂肪酸或月桂酸、十三碳脂肪酸、十四碳脂肪酸或肉豆蔻酸、十五碳脂肪酸、十六碳脂肪酸或棕榈酸、十七碳脂肪酸、十八碳脂肪酸或硬脂酸、或十九碳脂肪酸中的任意一种或多种。

在一些实施方案中，当所述长链二元酸为十二碳二元酸(例如十二烷二元酸)时，脂肪酸杂质主要为月桂酸且所述月桂酸杂质的含量低于3000ppm，优选低于400ppm、300ppm、200ppm或更低。

在一些实施方案中，当所述长链二元酸为十碳二元酸(例如癸二酸)时，脂肪酸杂质主要为癸酸且所述癸酸杂质的含量低于2000ppm，优选低于 500ppm、400ppm、300ppm、200ppm或更低。

在一些实施方案中，当所述长链二元酸为十六碳二元酸(例如十六烷二元酸)时，脂肪酸杂质主要为棕榈酸且所述棕榈酸杂质的含量低于4000ppm，优选低于500ppm、400ppm、300ppm或更低。

本发明进一步涉及一种改造长链二元酸生产微生物菌株的方法，包括定向进化长链二元酸合成途径的关键基因的步骤，其中改造后的长链二元酸生产微生物菌株相对于改造前的微生物菌株，生产的长链二元酸中脂肪酸杂质的含量得以实质性降低，例如在相同条件下。在一些实施方案中，本发明所述长链二元酸合成途径的关键基因是CPR-b基因。

在一些实施方案中，本发明所述微生物选自棒状杆菌、白地霉、假丝酵母属、毕赤酵母属、红酵母属、酵母属、耶氏酵母属，更优选地，其中所述微生物是酵母菌，更优选地，其中所述微生物选自热带假丝酵母或清酒假丝酵母。在一个具体实施方案中，所述微生物选自CCTCC M2011192和CCTCC M203052。

在一些实施方案中，本发明所述脂肪酸杂质包括碳链上碳原子数大于9 的长链脂肪酸，更优选C10酸(癸酸)、C12酸(月桂酸)、C14酸(肉豆蔻酸)、C16酸(棕榈酸)和/或C18酸(硬脂酸)。优选地，所述脂肪酸杂质的含量降低至300ppm以下，如290ppm、270ppm、250ppm、200ppm、 150ppm、140ppm、130ppm、120ppm、110ppm、100ppm以下或更低。

在一些实施方案中，改造长链二元酸生产微生物菌株的方法包括步骤：

1)通过易错PCR制备带有突变的目的基因片段；

2)制备同源重组所需的目的基因上下游片段作为同源重组的模板以及抗性标记基因，优选地，所述抗性标记基因是潮霉素B；

3)通过PCR重叠延伸制备完整的重组片段；

4)利用同源重组将所述重组片段引入菌株；

5)利用抗性标记筛选阳性菌株；

6)筛选发酵结束后的发酵液中脂肪酸杂质含量显著降低的菌株；和

7)任选地，筛选到的菌株进一步经过同源重组去除抗性筛选标记。

本发明进一步涉及一种微生物发酵法生产长链二元酸过程中的发酵液，发酵液中含有脂肪酸杂质，所述脂肪酸杂质的含量在1.5％以下，如1.4％、 1.3％、1.2％、1.1％、1.0％、0.9％、0.8％、0.7％、0.6％、0.5％、0.4％、0.3％以下或更低，所述百分比为发酵液中脂肪酸杂质占长链二元酸的质量百分比。

优选地，所述长链二元酸选自C9～C22长链二元酸，并且所述脂肪酸杂质包括含有一个端羧基的饱和直链有机酸。

在一些实施方案中，所述微生物含有本发明所述的突变的CPR-b基因、其同源基因或其变体。在一些实施方案中，所述微生物是本发明所述的含有本发明所述突变的CPR-b基因、其同源基因或其变体的微生物。在一些实施方案中，所述发酵液通过本发明所述的用含有本发明所述突变的CPR-b基因、其同源基因或其变体的微生物发酵产生长链二元酸的方法获得。在一些实施方案中，所述发酵液使用通过本发明所述的改造长链二元酸生产微生物菌株的方法获得的微生物在生产长链二元酸时获得。

本发明进一步涉及一种长链二元酸的生产方法，包括通过定向进化长链二元酸合成途径的CPR-b基因，获得含有突变的CPR-b基因、其同源基因或其变体的长链二元酸生产微生物菌株，培养所述菌株发酵生产长链二元酸，任选地，还包括从培养产物分离、提取和/或纯化长链二元酸的步骤。

所述突变的CPR-b基因、其同源基因或其变体，相对于GenBank登录号AY823228(例如SEQ ID NO：22所示)，以起始密码子ATG上游第一位碱基(例如SEQ ID NO：22所示的第763位碱基“C”)为-1计，在其启动子区域发生了一处碱基突变-322G>A；以终止密码子TAG下游第一位碱基 (例如SEQ ID NO：22所示的第2804位碱基“A”)为1计，其终止子区域发生的突变为：3'UTR.19C>T；3'UTR.76_77insT；所述变体与突变的CPR-b 基因、其同源基因具有至少70％的序列同一性。

优选地，所述突变的CPR-b基因的序列如SEQ ID NO：13或23所示或与其具有至少70％的序列同一性，例如具有至少约75％、80％、85％、90％、 91％、92％、93％、94％、95％、96％、97％、98％、99％、99.18％、99.21％、 99.25％、99.28％、99.32％、99.36％、99.39％、99.43％、99.46％、99.50％、 99.53％、99.57％、99.61％、99.64％、99.68％、99.72％、99.75％、99.79％、 99.82％、99.86％、99.89％、99.93％或99.96％的同一性的序列。

在一些实施方案中，所述长链二元酸选自C9～C22长链二元酸，优选 C9～C18长链二元酸，更优选十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种。在一些实施方案中，所述长链二元酸为十碳至十六碳二元酸中至少一种或者正十碳至十六碳二元酸中至少一种，例如选自癸二酸、十一烷二元酸、十二烷二元酸、十三烷二元酸、十四烷二元酸、十五烷二元酸和十六烷二元酸中的至少一种。

在一些实施方案中，所述脂肪酸杂质的化学式为CH₃-(CH₂)n-COOH，其中n≥7，优选所述脂肪酸杂质包括碳链上碳原子数在9以上、且含有1个端羧基的长链脂肪酸。

在一些实施方案中，所述微生物是酵母菌，更优选地，所述微生物选自热带假丝酵母或清酒假丝酵母。

在一些实施方案中，获得含有突变的CPR-b基因、其同源基因或其变体的长链二元酸生产微生物菌株包括如下步骤：

1)通过易错PCR制备带有突变的目的基因(CPR-b基因)片段；

2)制备同源重组所需的目的基因(CPR-b基因)上下游片段作为同源重组的模板以及抗性标记基因，优选地，所述抗性标记基因是潮霉素B；

3)通过PCR重叠延伸制备完整的重组片段；

4)利用同源重组将所述重组片段引入菌株；

5)利用抗性标记筛选阳性菌株；

6)筛选发酵结束后的发酵液中脂肪酸杂质含量显著降低的菌株；

7)任选地，筛选到的菌株进一步经过同源重组去除抗性筛选标记。

本发明以现有热带假丝酵母菌菌株CATN145(保藏号为CCTCC M2011192)为出发菌株，采用易错PCR对CPR-b基因进行随机突变，并通过同源重组的方法对该基因进行定向进化，以此筛选出脂肪酸杂质含量显著降低的生产长链二元酸的菌株。通过筛选，本发明得到一株发酵产物中脂肪酸杂质含量显著下降的菌株，命名为突变株5473。通过测序分析发现，与亲代菌株CCTCC M2011192相比，突变株5473的CPR-b基因，以起始密码子ATG上游第一位碱基为-1计，本发明筛选到的热带假丝酵母突变株在其启动子区域发生碱基突变-322G>A；以终止密码子TAG下游第一位碱基为1计，其终止子区域发生突变：3'UTR.19C>T和3'UTR.76_77insT。

根据本发明，突变的热带假丝酵母CPR-b基因的序列包含或如SEQ ID NO：13所示。

进一步对突变菌株去除抗性筛选标记后，与亲代菌株相比，发酵结束后的发酵液中脂肪酸杂质的质量比率显著降低，且对发酵液进行提取纯化后获得长链二元酸成品中脂肪酸杂质的含量可以降低至300ppm以下。

本发明通过对CPR-b基因进行定向进化，筛选到一株在该基因的启动子和终止子区域发生碱基突变的菌株，针对不同的发酵底物，使发酵液中脂肪酸杂质的含量均显著降低，与亲代菌株相比，脂肪酸含量降低近40％，进一步提高了发酵产物长链二元酸的纯度，使二元酸产品作为尼龙长丝、工程塑料、合成香料、耐寒增塑剂、高级润滑油和聚酰胺热熔胶等产品的重要原料，更有利于下游产品的生产制造，提高下游产品的质量。更重要的是，这在很大程度上降低了二元酸后期的提取纯化工艺的难度，简化工艺并节约了能耗。

附图说明

图1为通过同源重组的方式整合进带有突变位点的CPR-b基因并去除潮霉素筛选标记的示意图，“*”代表可能存在于CPR-b任意区域(包括启动子、编码区和终止子)的突变。

图2为本发明的突变菌株(以CPR-b’表示，如SEQ ID NO：23第295-3087 位核苷酸所示)与原始菌株(以CPR-b表示如SEQ ID NO：22第295-3086 位核苷酸所示)的CPR-b基因核苷酸序列的比对结果，突变位点用黑框标出。

具体实施方式

定义：

除非另有定义，本文所用的技术和科学术语具有本领域技术人员通常理解的含义。参见例如，Singleton et al.,DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY2nd ed.,J.Wiley&Sons(New York,NY 1994)； Sambrook et al.,MOLECULAR CLONING,ALABORATORY MANUAL,Cold Springs Harbor Press(Cold Springs Harbor,NY 1989)。

长链烷烃：本发明的发酵底物包括长链烷烃，长链烷烃属于饱和链烃，是碳氢化合物下的一种饱和烃，其整体构造大多仅由碳、氢、碳碳单键与碳氢单键所构成，其包括化学式CH₃(CH₂)_n CH₃的烷烃，其中n≥7。优选C9～C22 的正烷烃，更优选包括C9～C18的正烷烃，最优选包括C10、C11、C12、C13、 C14、C15或C16的正烷烃。

长链二元酸(LCDA；也称为长链二羧酸或长链二酸、以下或简称为二元酸)包括化学式HOOC(CH₂)_nCOOH的二元酸，其中n≥7。优选地，所述长链二元酸包括C9～C22的长链二元酸，优选包括C9～C18的长链二元酸，更优选包括十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种。优选地，所述长链二元酸为十碳至十六碳二元酸中至少一种，优选地，正十碳至十六碳二元酸中至少一种，例如选自癸二酸、十一烷二元酸、十二烷二元酸、十三烷二元酸、十四烷二元酸、十五烷二元酸和十六烷二元酸中的至少一种。

产长链二元酸的微生物：已报道的可产生和积累二元酸的菌株包括细菌、酵母以及霉菌等，如：棒状杆菌(Corynebacterium)、白地霉(Geotrichum candidum)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、红酵母属 (Rhodotroula)、酵母属(Saccharomyces)、耶氏酵母属(Yarrowia)等。其中假丝酵母属的许多种类是发酵生产二元酸的优良菌种。所述发酵的菌种优选包括：热带假丝酵母或清酒假丝酵母。

利用发酵底物长链烷烃发酵生产长链二元酸的过程中，烷烃会先被氧化成脂肪酸、再被氧化为二元酸，但是发明人发现烷烃如果氧化不完全会导致部分脂肪酸残留在发酵液中。因其特性与长链二元酸非常相似，很难通过常规手段将其有效分离。脂肪酸作为杂质会随着后处理工艺进入到最终的二元酸产品中，大大影响产品的纯度和质量。

本发明所述的脂肪酸杂质包括含有一个端羧基(-COOH)的饱和直链有机酸。所述脂肪酸杂质的化学式为CH₃-(CH₂)n-COOH，其中n≥7。优选地，所述脂肪酸杂质包括碳链上碳原子数在9以上、且含有1个端羧基的长链脂肪酸，如九碳脂肪酸、十碳脂肪酸或癸酸、十一碳脂肪酸、十二碳脂肪酸或月桂酸、十三碳脂肪酸、十四碳脂肪酸或肉豆蔻酸、十五碳脂肪酸、十六碳脂肪酸或棕榈酸、十七碳脂肪酸、十八碳脂肪酸或硬脂酸、或十九碳脂肪酸中的任意一种或多种。

如本文所用，本发明所述的脂肪酸杂质的含量实质性降低或显著降低是指与参照相比，脂肪酸杂质的含量降低至少5％、6％、7％、8％、9％、 10％、12％、14％、16％、18％、20％、25％、30％、35％、40％、50％、60％、 70％、80％、90％、95％或更多，优选至少下降10％，更优选至少下降20％，更优选至少下降40％，更优选至少下降50％，更优选至少下降70％或更多。

本发明发酵生产长链二元酸时，发酵结束后的发酵液中含有脂肪酸杂质，该脂肪酸杂质的含量相对于采用常规微生物发酵法如采用本发明所述的非突变的微生物发酵法生产的脂肪酸杂质的含量显著下降，如至少下降5％、 6％、7％、8％、9％、10％、12％、14％、16％、18％、20％、25％、30％、35％、 40％、50％、60％、70％、80％、90％、95％或更多，优选至少下降10％，更优选至少下降20％，更优选至少下降40％，更优选至少下降50％，更优选至少下降70％或更高。

在一些实施方案中，使用微生物发酵法生产长链二元酸，发酵液中含有脂肪酸杂质，所述脂肪酸杂质的含量降低至1.5％以下，如1.4％、1.3％、 1.2％、1.1％、1.0％、0.9％、0.8％、0.7％、0.6％、0.5％、0.4％、0.3％以下或更低，所述百分比为发酵液中脂肪酸杂质占长链二元酸的质量百分比，优选降低至1.1％以下，更优选降低至1.0％以下，更优选降低至0.9％以下。

在本发明一些实施方案中，本发明微生物发酵法生产的长链二元酸含有脂肪酸杂质，所述脂肪酸杂质的含量在4000ppm以下，优选3000ppm以下， 2000ppm以下，1000ppm以下，290ppm、270ppm、250ppm、200ppm、150ppm、 100ppm以下或更低。

本发明杂质含量的单位ppm为杂质占长链二元酸的质量比率，且 100ppm＝100*10^-6＝0.01％。在一些实施方案中，DC16(十六碳二元酸)的杂质整体比DC12(十六碳二元酸)和DC10(十碳二元酸)要高一些，如高至少10％、至少20％、至少30％、至少40％、至少50％、60％、至少80％、至少100％或更高，其中DC指代长链二元酸。

在本发明一些实施方案中，当使用微生物发酵法生产十二碳长链二元酸时，脂肪酸杂质主要为月桂酸，所述月桂酸杂质的含量低于3000ppm，优选低于500ppm、400ppm、300ppm、200ppm或更低。

在本发明一些实施方案中，当使用微生物发酵法生产十碳长链二元酸时，脂肪酸杂质主要为癸酸，所述癸酸杂质的含量低于2000ppm，优选低于 500ppm、400ppm、300ppm、200ppm或更低。

在本发明一些实施方案中，当使用微生物发酵法生产十六碳长链二元酸时，脂肪酸杂质主要为棕榈酸，所述棕榈酸杂质的含量低于4000ppm，优选低于500ppm、400ppm、300ppm或更低。

所述二元酸及杂质含量的测试方法可以采用本领域技术人员熟知的技术，例如气相色谱检测法的内标法或归一法等。

CPR-b基因(GenBank登录号AY823228)编码NADPH依赖的细胞色素还原酶，在ω-氧化中与P450细胞色素氧化酶形成复合体结合在内质网膜上，作为电子供体向P450提供电子。本领域技术人员知晓，在其他产长链二元酸的微生物中也存在CPR-b基因或其同源基因，其序列可能存在差异，但同样落入本发明的范围内。

术语“分离的”当用于核酸或蛋白质时，是指所述核酸或者蛋白质基本上不含其在天然状态下结合的其它细胞组分。其可以是例如均质状态，并且可以是干燥的或者在水溶液中。纯度和均质性典型地用分析化学技术确定，如聚丙烯酰胺凝胶电泳或高效液相色谱。

如本文所用，表述“相对于GenBank登录号AY823228”是指与GenBank 登录号AY823228所示的序列(SEQ ID NO：22)相比对，在相应位置具有所述的突变。所述相应位置是指当该给定多核苷酸序列(例如突变的CPR-b 基因序列)与参考序列(例如SEQ ID NO：22)相比较时参考序列的残基编号。当占据核酸内与给定碱基相同的基本结构位置时，核酸中的碱基“相应于”给定碱基。通常为了鉴别相应位置，排列核酸序列以便获得最高级别的匹配(见例如Computational Molecular Biology,Lesk,A.M.,ed.,Oxford UniversityPress,New York,1988；Biocomputing:Informatics and Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993；Computer Analysis of Sequence Data,Part I,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press, New Jersey,1994；SequenceAnalysis in Molecular Biology,von Heinje,G., Academic Press,1987；和SequenceAnalysis Primer,Gribskov,M.and Devereux, J.,eds.,M Stockton Press,New York,1991；Carillo et al.(1988)SIAM J Applied Math 48:1073)。核苷酸序列排列对比也可考虑核苷酸中的保守差异和/或取代频率。保守差异是保护涉及的残基的物理-化学性质的那些差异。排列对比可以是整体(在全长序列排列对比序列及包括所有残基)或局部(一部分序列的排列对比，仅包括最相似的一或多个区域)。

如本文所用，碱基突变“XXX N0>N1”是指在第XXX位的碱基N0突变为N1。例如，“以起始密码子ATG上游第一位碱基为-1计，碱基突变 -322G>A”是指紧邻起始密码子ATG的碱基“A”的上游第一位碱基为-1，第-322位的碱基G突变为A；以及“以终止密码子TAG下游第一位碱基为 1计，突变3'UTR.19C>T；3'UTR.76_77insT”指紧邻终止密码子TAG的碱基“G”的下游第一位碱基为1，第19位的碱基C突变为T，在76和77位碱基之间***T。

在一个实施方案中，本发明所述的CPR-b基因的序列如SEQ ID NO： 22所示，其中蛋白编码序列为764-2803位核苷酸。相应地，所述突变“-322G>A”相应于SEQ ID NO：22第442位的核苷酸G突变为A；突变“3'UTR.19C>T”相应于SEQ ID NO：22第2822位的核苷酸C突变为T；突变“3'UTR.76_77insT”相应于在SEQ ID NO：22第2879和2880位核苷酸间***T。

在本文中，提及碱基时，G指鸟嘌呤，T指胸腺嘧啶，A指腺嘌呤，C 指胞嘧啶，U指尿嘧啶。

如本文所用，“未突变的CPR-b基因”是指不含有本发明所述突变 -322G>A、3'UTR.19C>T或3'UTR.76_77insT的CPR-b基因，例如天然发生的、野生型等位基因，例如GenBank中登录号为AY823228的CPR-b基因。举例的未修饰的CPR-b基因如SEQ ID NO：22所示。所述CPR-b基因可以含有其他突变，例如在编码区中导致编码氨基酸不改变的沉默突变。

如本文所用，“非突变的微生物”是指不含有本发明所述突变的CPR-b 基因或同源基因的微生物，例如仅含有GenBank中登录号为AY823228的 CPR-b基因。在一个实施方案中，所述非突变的微生物含有本发明所述的未突变的CPR-b基因。

本发明筛选到一株CPR-b基因发生突变的菌株，其相对于GenBank登录号AY823228，以起始密码子ATG上游第一位碱基为-1计，其启动子区域发生了一处碱基突变-322G>A；以终止密码子TAG下游第一位碱基为1 计，其终止子区域发生的突变为：3'UTR.19C>T和3'UTR.76_77insT。

如本文所用，同源基因是指序列相似性达80％的两条或多条基因序列，其包括直向同源基因(又称为垂直同源基因、正同源基因或定向进化同源基因)、横向同源基因(又称为旁系同源基因、并系同源基因或平行进化同源基因)和/或异源同源基因。本发明中所指的CPR-b基因的同源基因既可以是CPR-b基因的直向同源基因，也可以是其横向同源基因或异源同源基因。

序列同一性是指在序列比对和引入缺口后，多核苷酸序列变体的残基与非变体序列的相同的百分比。在具体实施方案中，多核苷酸变体与本文所述的多核苷酸具有至少约70％、至少约75％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、至少约 99.1％、至少约99.2％、至少约99.3％、99.4％、至少约99.5％、至少约99.6％、 99.7％、至少约99.8％、至少约99.9％、至少约99.91％、至少约99.92％、至少约99.93％、至少约99.94％、至少约99.95％、或至少约99.96％的多核苷酸同源性。

如本文所用，术语“同源性”和“同一性”可互换使用，是指核苷酸序列无变化的程度，可通过比对多核苷酸与参考多核苷酸之间的相同核苷酸碱基的数目而检测。序列同一性可以通过标准排列对比算法程序使用由每个供应商制定的默认缺口罚分确定。同源核酸分子是指预定数目的相同或同源核苷酸。同源性包括不改变编码的氨基酸的取代(沉默取代)以及相同的残基。基本同源的核酸分子典型在中等严格条件下或者在高度严格条件下杂交全长核酸或者至少或至少约70％、80％或90％全长的感兴趣的核酸分子。本发明还涵盖了含有简并密码子代替杂交核酸分子中密码子的核酸分子。任两个核酸分子是否具有至少80％、85％、90％、95％、96％、97％、98％或99％“相同的”核苷酸序列可以使用已知的计算机算法确定，如BLASTN、FASTA、 DNAStar及Gap(University of Wisconsin GeneticsComputer Group(UWG), Madison WI,USA)。例如，核酸分子的同源性或同一性百分比可以例如通过使用GAP计算机程序对比序列信息而确定(例如Needleman et al.J.Mol.Biol.48:443(1970)，由Smith and Waterman(Adv.Appl.Math.2:482(1981)修订)。简而言之，GAP程序根据相似的排列对比的符号(即核苷酸)的数目除以两个序列中较短序列的符号总数而定义相似性。

定向进化是指借助于技术手段模拟自然选择的过程。通过人为制造的突变和特定的筛选压力，使蛋白质或核酸向特定的方向突变，从而在短时间内在分子水平上的实现自然界中需要成千上万年才能完成的进化过程。本领域已知多种进行定向进化的方法，包括例如易错PCR等(可参见例如Technique, 1,11-15,1989；Genome Research,2,28-33,1992)。

在一些实施方案中，在本发明的易错PCR中，Mg²⁺浓度范围为1～10mM，优选地，2～8mM，更优选地，5～6mM，和/或dNTP的浓度为0.1～5mM，优选地，0.2-3mM，更优选地，0.5～2mM，更优选地，0.8-1.5mM，例如1mM，和/或添加新鲜配置的MnCl₂至终浓度为0.1～5mM，优选地，0.2～2mM，更优选地，0.3～1mM，更优选地，0.4～0.7mM，例如0.5mM。在一些实施方案中，通过降低模板量并适当增加至40个或更多个循环PCR以增加突变几率，例如41、42、43、44、45、46、47、48、49、50、55、60或更多个循环。

PCR重叠延伸又称SOE(gene splicing by overlap extention)PCR是指通过设计具有互补末端的引物，通过PCR扩增将不同DNA片段拼接到一起的方法。

同源重组是指依赖于序列相似性的DNA分子之间的重组，最常见于细胞内用于修复有丝***期间产生的突变。同源重组技术已广泛应用于基因组编辑，包括基因敲除、基因修复以及向特定位点引入新的基因等。以酿酒酵母为代表的一类微生物，其细胞内发生同源重组的几率非常高，不依赖于序列特异性，在基因组编辑方面具有明显的优势。而位点特异性重组，依赖于特异性位点和位点特异性重组酶参与，重组仅发生于特异的位点之间，如Cre/loxP、FLP/FRT等。本专利使用的同源重组技术不属于位点特异性重组，重组依赖于细胞内的DNA修复系统。

抗性标记是指选择性标记的一种，其往往携带有赋予转化子在抗生素存在的条件下得以生存的能力。所述抗性标记基因包括NPT、HPT、HYG、 BLA及CAT等，分别可以抗卡那霉素、潮霉素、氨苄/羧苄青霉素以及氯霉素等。优选的，所述抗性标记基因是潮霉素B抗性基因HYG。

发酵生产过程中，所述发酵培养基包括：碳源、氮源、无机盐和营养盐。

在一些实施方案中，所述碳源包括选自葡萄糖、蔗糖和麦芽糖中的一种或多种；和/或所述碳源的添加量为1％～10％(w/v)，例如1.5％、2.0％、2.5％、 3.0％、3.5％、4.0％、4.5％、5.0％、6.0％、7.0％、8.0％、9.0％。

在一些实施方案中，所述氮源包括选自蛋白胨、酵母膏、玉米浆、硫酸铵、尿素和硝酸钾中的一种或多种；和/或所述氮源的总添加量为0.1％～3％ (w/v)，例如0.2％、0.4％、0.5％、0.6％、0.8％、1.0％、1.2％、1.5％、1.8％、 2.0％、2.5％。

在一些实施方案中，所述无机盐包括选自磷酸二氢钾、氯化钾、硫酸镁、氯化钙、氯化铁、硫酸铜中的一种或多种；和/或所述无机盐的总添加量为 0.1％～1.5％(w/v)，例如0.2％、0.3％、0.4％、0.5％、0.6％、0.7％、0.8％、 0.9％、1.0％、1.1％、1.2％、1.3％、1.4％。

在一些实施方案中，所述营养因子包括选自维生素B1、维生素B2，维生素C、生物素中的一种或多种；和/或所述营养因子的总添加量为0～1％ (w/v)，例如0.2％、0.3％、0.4％、0.5％、0.6％、0.7％、0.8％、0.9％。按照发酵领域常识，本发明中所述百分比为质量体积比，即：w/v；％表示g/100mL。

本领域技术人员可以容易地确定上述物质的添加量。

在本发明的一个实施方案中，发酵菌株的接种量为10％～30％，例如11％、 12％、13％、14％、15％、16％、17％、18％、19％、20％、22％、24％、25％、 27％、29％。所述菌株培养至菌体光密度(OD₆₂₀)为0.5以上(稀释30倍) 时，加入底物进行发酵转化。

长链二元酸的提取纯化：对发酵制得的发酵液进行提取纯化处理，以获得长链二元酸成品。所述提取纯化的步骤包括：对发酵液进行除菌、酸化，以及对获得的清液进行酸化、固液分离、和/或溶剂结晶。

本发明所述的提取纯化，可以重复进行一次以上，进行多次提取纯化步骤有助于进一步降低二元酸产品中的杂质含量，例如，在本发明一个实施方案中，参考中国发明专利CN 101985416A实施例1中精制工艺对本发明获得的十二碳长链二元酸产品继续进行处理，获得的十二碳长链二元酸中月桂酸杂质含量可以从处理前的5000ppm以上降低至4000ppm以下，如3000ppm 以下，2000ppm以下，1000ppm以下，500ppm以下，400ppm以下，300ppm 以下，甚至250ppm、200ppm、150ppm以下。

所述发酵液包括生物发酵长链二元酸的过程中产生的含有长链二元酸盐的发酵液，所述含有长链二元酸盐的发酵液中可能含有长链二元酸钠盐、长链二元酸钾盐或长链二元酸铵盐等。

所述除菌优选膜过滤：使用过滤膜将残留的菌体和大蛋白等杂质分离出去，与含有长链二元酸盐的发酵液有效地分离开。进而优选陶瓷膜过滤工艺。使用陶瓷膜进行膜过滤时，优选膜前压力为0.2-0.4MPa；优选过滤膜孔径为 0.05-0.2微米。

所述酸化是膜过滤后对获得的含有长链二元酸盐的膜清液进行酸化处理，通过加入酸将长链二元酸盐转化为长链二元酸沉淀。酸化时优选使用无机酸，如硫酸、盐酸、硝酸、或其混合酸。所述酸化处理时无机酸的加入量，需将溶液中的长链二元酸充分沉淀，主要以溶液的终点pH为准，优选酸化的终点pH低于5，更优选终点pH低于4.0。加入无机酸进行酸化处理时，可以获得长链二元酸沉淀和相应的无机盐溶液。

所述固液分离是将获得的长链二元酸沉淀与酸化母液分离开，所述固液分离包括过滤或/和离心分离，可以使用常用的固液分离设备。

优选的，所述提取纯化的步骤还包括对含有长链二元酸盐的发酵液进行脱色，向含有长链二元酸盐的发酵液或膜清液中加入活性炭进行脱色处理，脱色处理后再过滤除去活性炭，脱色步骤可以进一步脱除长链二元酸溶液中的杂质。优选的，活性炭的加量为0.1-5wt％，进而优选1-3wt％(相对于溶液中含有的长链二元酸的量)。

所述溶剂结晶，即将长链二元酸沉淀溶解于有机溶剂中，并通过冷却\ 蒸发\溶析使长链二元酸结晶，再分离晶体，获得纯化后长链二元酸。所述有机溶剂包括醇、酸、酮和酯的一种或多种；其中，所述醇包括甲醇、乙醇、异丙醇、正丙醇、正丁醇中的一种或多种；所述酸包括乙酸；所述酮包括丙酮；所述酯包括乙酸乙酯和/或乙酸丁酯。

在另一个优选的实施方案中，长链二元酸沉淀溶解在有机溶剂后进行脱色，再分离得到清液，使用活性炭脱色时，脱色的温度为85～100℃，脱色的时间为15～165min；在另一个优选的实施方案中，分离清液后，降温结晶，降温结晶可包括以下步骤：首先降温至65～80℃，保温1～2小时后，再降温至25～35℃，结晶。在另一个优选的实施方案中，结晶之后，分离出所得晶体，由此得到长链二元酸，分离晶体的方式可以为离心分离。

在一些实施方案中，本发明涉及利用上述获得的二元酸产品生产尼龙长丝、工程塑料、合成香料、耐寒增塑剂、高级润滑油和聚酰胺热熔胶等产品。

如本文所用，“任选”或“任选地”是指随后描述的事件或情况发生或不发生，该描述包括其中所述事件或情况发生及不发生的情况。例如，任选包括的步骤是指该步骤存在或不存在。

如本文所用，术语“约”是指包括具体数值的数值范围，本领域技术人员可以合理认为其类似于具体数值。在一些实施方案中，术语“约”是指在使用本领域通常接受的测量的标准误差内。在一些实施方案中，约是指到具体数值的+/-10％。

下面将通过下述非限制性实施例进一步说明本发明，本领域技术人员公知，在不背离本发明精神的情况下，可以对本发明做出许多修改，这样的修改也落入本发明的范围。

下述实验方法如无特别说明，均为常规方法，所使用的实验材料如无特别说明，均可容易地从商业公司获取。

实施例1培养基、培养发酵方法及二元酸检测方法

1、YPD培养基，配方(w/v)为：2％蛋白胨，2％葡萄糖和1％酵母提取物(OXOID,LP0021)。固体培养基中还需加入1.5～2％琼脂粉。

培养时，可取单菌落于含有1mL YPD液体培养基的2mL离心管中， 30℃下，250RPM摇床培养1天。

2、种子培养基，配方(w/v)为：蔗糖10～20g/L(具体使用10g/L)，酵母膏3～8g/L(具体使用3g/L)，工业发酵用玉米浆(简称玉米浆，总氮含量2.5wt％)2～4g/L(具体使用2g/L)，KH₂PO₄ 4～12g/L(具体使用4g/L)，尿素0.5～4g/L(具体使用0.5g/L)(115℃，20min单独灭菌)，发酵底物为正十二烷、正十烷、正十六烷20mL/L。

培养时，将步骤1培养后的菌液接入含有30mL种子培养基的500mL 摇瓶，接种量为3-5％，在250rpm、30℃摇床培养至OD₆₂₀达到0.8时(稀释30倍后)。

3、发酵培养基(w/v)：蔗糖10-40g/L(具体使用10g/L)，玉米浆(总氮含量2.5wt％)1～5g/L(具体使用1g/L)，酵母膏4～12g/L(具体使用4g/L)， NaCl 0～3g/L(具体未使用)，KNO₃ 4～12g/L(具体使用4g/L)，KH₂PO₄ 4～12 g/L(具体使用4g/L)，尿素0.5～3g/L(具体使用0.5g/L)(115℃，20min 单独灭菌)，发酵底物为正十二烷、正十烷、正十六烷300～400mL/L(具体使用300mL/L)，丙烯酸4g/L，用1N HCl和1N NaOH调节pH值至7.5～7.6。

发酵时，将步骤2培养的种子液接种到装有15mL发酵培养基的500mL 摇瓶中，接种量为10-30％，在30℃、250rpm摇床培养90-144h。培养过程中通过隔段时间补加酸/碱的方式调节pH值至设定范围。

4、气相色谱法(GC)测定二元酸产量和脂肪酸杂质含量的步骤

(1)发酵液产物及杂质含量检测：发酵液经常规气相色谱法前处理，使用气相色谱检测，色谱条件如下：

色谱柱：Supelco SPB-50 30m*0.53mm*0.5μm(货号54983)。

气相色谱仪(Shimadzu，GC-2014)。

方法：初温100℃，15℃/min升温至230℃，保持2min。载气为氢气，进样口温度280℃，FID温度280℃，进样量4μL。

根据二元酸产物峰面积和已知浓度的内标峰面积比进行二元酸产量计算，根据二元酸产物峰面积和杂质峰面积的比计算杂质含量。

(2)固体产品纯度及杂质含量检测：将固体产品经常规气相色谱法前处理，气相色谱检测，

色谱条件：色谱柱：Supelco SPB-50 30m*0.53mm*0.5μm(货号 54983)。

气相色谱仪(Shimadzu，GC-2014)。

方法：初温100℃，15℃/min升温至230℃,保持2min。载气为氢气，进样口温度280℃，FID温度280℃，进样量4μL。

根据二元酸产物峰面积和杂质峰面积计算产物纯度和杂质含量。

实施例2 CPR-b突变模板的制备

使用Ezup酵母基因组DNA快速提取试剂盒(Sangon，货号518257)提取假丝酵母CCTCC M2011192基因组DNA。为提高细胞壁破碎效率，辅以液氮研磨的方法破碎细胞壁。以用该方法获得的基因组DNA作为模板进行易错PCR。获得的无突变产物称为CPR-b，经测序证实与GenBank登录号 AY823228所示序列一致。

易错PCR

调整Mg²⁺的浓度(2-8mM，以0.5mM递增)，用普通Taq酶(Takara，货号R001B)进行易错PCR扩增CPR-b基因，引物如下：

CPR-b-F：5'-CGAAGTTGTTGGGGGATCT-3'(SEQ ID NO：1)

CPR-b-R：5'-TATCCCGGCATTACCAACGG-3'(SEQ ID NO：2)

PCR反应条件为：

步骤1:98℃ 30s

步骤2:98℃ 10s,55℃ 30s,72℃ 3m,35个循环

步骤3:72℃ 5m

PCR产物经1％琼脂糖凝胶电泳后，采用Axygen凝胶回收试剂盒 (Axygen，AP-GX-250G)进行回收纯化。

实施例3同源重组模板的制备

本实施例中所有DNA片段均使用Takara公司HS高保真 DNA聚合酶(Takara,R040A)扩增得到。1％琼脂糖凝胶电泳后用Axygen凝胶回收试剂盒回收纯化DNA片段。

(1)上下游同源重组片段的扩增，模板为上述热带假丝酵母基因组 DNA，引物序列如下：

CPR-b_Upstream-F：5'-TTTGCGCGAGTAACATGTGC-3'(SEQ ID NO：3)

CPR-b_Upstream-R：5'-AATGATTCCTGCGAGGGGTG-3'(SEQ ID NO：4)

PCR反应条件如下：

步骤1:98℃ 30s

步骤2:98℃ 10s,55℃ 10s,72℃ 25s,30个循环

步骤3:72℃ 5m

CPR-b_Downstream-F：5'-TTTAGTACAGTATCTCCAATCC-3'(SEQ ID NO：5)

CPR-b_Downstream-R：5'-ACGTCTATATTGTGGATGGC-3'(SEQ ID NO：6)。

PCR反应条件如下：

步骤1:98℃ 30s

步骤2:98℃ 10s,48℃ 10s,72℃ 25s,30个循环

步骤3:72℃ 5m

获得的产物分别称为CPR-b_Upstream和CPR-b_Downstream，经测序证实无误，其序列如SEQ ID NO：14和15所示。

(2)抗性筛选标记(HYG，即潮霉素抗性基因)的扩增，扩增模板为本公司所有的载体pCIB2(SEQ ID NO：16)，引物序列如下：

CPR_HYG-F：

5'-CCGTTGGTAATGCCGGGATAGCATGCGAACCCGAAAATGG-3'(SEQ ID NO：7) CPR_HYG-R：

5'-GGATTGGAGATACTGTACTAAAGCTAGCAGCTGGATTTCACT-3'(SEQ ID NO： 8)。

PCR反应条件如下：

步骤1:98℃ 30s

步骤2:98℃ 10s,55℃ 10s,72℃ 1m 50s,5个循环

步骤3:98℃ 10s,72℃ 2m,25个循环

步骤4:72℃ 5m

获得的产物称为HYG，经测序证实无误，如SEQ ID NO：9所示。

(3)PCR重叠延伸得到完整的重组模板

将上述4条回收的PCR片段进行重叠延伸，得到同源重组模板，并回收纯化。具体方法如下：

加入等摩尔量的CPR-b_Upstream、CPR-b、HYG和CPR-b_Downstream 片段作为模板，引物为CPR-b_Upstream-F和CPR-b_Downstream-R，用HS高保真DNA聚合酶进行PCR重叠延伸。

PCR反应条件如下：

步骤1:98℃ 30s

步骤2:98℃ 10s,50℃ 10s,72℃ 5m 30s共30个循环

步骤3:72℃ 8m

凝胶电泳后进行回收纯化大小约为5.1Kb的重组片段。

图1示出了本发明通过同源重组的方式整合进带有突变位点的CPR-b 基因并去除潮霉素筛选标记的示意图。

实施例4构建热带假丝酵母CPR-b基因突变体库

1、酵母电转化感受态细胞的制备

将30℃，250rpm摇床过夜培养的酵母细胞CCTCC M2011192接种到实施例1的100mLYPD培养基中，至OD₆₂₀为0.1。相同条件下培养至OD₆₂₀至1.3时，3000g、4℃离心收集细胞。用冰冷的无菌水洗涤细胞两次并收集后将细胞重悬于10mL冰上预冷的1M山梨醇溶液，4℃、1500g离心收集细胞后重悬于1mL上述山梨醇溶液，分装100μL细胞悬液用于遗传转化。

2、酵母感受态电击转化

上述感受态细胞中加入1μg实施例3步骤(3)中回收的用于重组的DNA 片段，冰上放置5min后迅速转移至0.2cm电击杯，电击转化(BioRad， Micropulser^TM Electroporator，转化程序SC2)后迅速加入1mL YPD和1M 山梨醇(1:1，v/v)的混合液，30℃，200rpm培养2小时后，收集菌液后涂布含有100mg/L潮霉素B的YPD培养基平板，30℃静置培养2至3天，至长出单菌落。

实施例5突变菌株的筛选

1、筛选方法：挑取实施例4获取的单菌落于含有1mL实施例1YPD 培养基(含100mg/L潮霉素B)的2mL离心管中，30℃，250RPM摇床培养1天。取上述菌液接入含有30mL实施例1种子培养基(含100mg/L潮霉素B)的500mL摇瓶中，接种量为3％，250rpm、30℃培养至OD₆₂₀达到0.8(稀释30倍后)时。将种子液接入装有15mL实施例1所述发酵培养基的500mL摇瓶中，接种量为20％，且发酵培养基中底物为正十二烷。继续 250rpm、30℃培养至发酵结束。

并以菌株CCTCC M2011192作为对照组：除培养基不含潮霉素B外，培养基、培养和发酵方法与上述相同。

分别取0.5g上述发酵液样品，采用实施例1中4所述的方法进行GC检测，计算十二碳二元酸含量及月桂酸杂质质量比率，结果如下表1所示。

2、筛选结果：经筛选得到一株与原始菌株CCTCC M2011192相比，月桂酸杂质含量有效降低的候选菌株，编号为5473HYG。

表1

菌株	对照组CCTCC M2011192	5473HYG
			十二碳二元酸产量(mg/g)	150.8	151.6
月桂酸杂质质量比率(％)	1.02	0.64

本发明所述月桂酸杂质质量比率为其所占十二碳二元酸的质量百分比，由表1可知月桂酸杂质的质量比率下降了37.3％。

实施例6突变菌株CPR-b基因序列分析

1、按实施例2的方法提取CCTCC M2011192和5473HYG酵母基因组 DNA，并使用Takara公司

HS高保真DNA聚合酶扩增CPR-b 基因，引物为CPR-b-F和CPR-b-R。PCR反应条件如下：

PCR反应条件为：

步骤1:98℃ 30s

步骤2:98℃ 10s,50℃ 10s,72℃ 3m,30个循环

步骤3:72℃ 5m

2、PCR完成后，将产物进行凝胶电泳并回收纯化。

3、纯化后的PCR片段加A处理：20μL PCR回收片段加入4μL 10X Takara Taq缓冲液、3.2μL dNTP(均为10mM)和0.2μL Takara Taq，补ddH₂O 至40μL，72℃保温20分钟后，使用Axygen PCR纯化试剂盒回收。

4、TA克隆。取加A后的PCR回收片段4μL加入1μL pMD19-T载体骨架和5μL SolutionI，混匀后16℃保温30min。并将连接产物转化至DH5α化学感受态，挑取阳性克隆送至Majorbio测序。

结果显示：亲代CCTCC M2011192的CPR-b基因序列与GenBank数据库中的序列(登录号AY823228)一致，而突变株5473HYG在启动子区域和终止子区域碱基突变。如图2所示，在启动子区域发生了一处碱基突变 -322G>A(序列比对结果中黑框位置所示)；以终止密码子TAG下游第一位碱基为1计，其终止子区域发生的突变为：3'UTR.19C>T，3'UTR.76_77insT。其序列如SEQ ID NO：13所示。

实施例7抗性筛选标记的去除

1、同源重组模板CPR-b-2的制备

以热带假丝酵母ATCC26336基因组DNA为模板扩增CPR-b-2，凝胶电泳后回收。获得的序列CPR-b-2经测序验证无误，如SEQ ID NO：12所示。引物序列与PCR反应条件如下：

CPR-b-2F：5’-ATTACGAAACATAGGTCAACT-3’(SEQ ID NO：10)

CPR-b-2R：5’-TAACCATATCCATACGTCGC-3’(SEQ ID NO：11)

步骤1:98℃ 30s

步骤2:98℃ 10s,50℃ 10s,72℃ 40s共30个循环

步骤3:72℃ 5m

2、去除抗性筛选标记

制备菌株5473HYG的新鲜电转化感受态细胞，加入1μg回收的CPR-b-2，冰上放置5min后迅速转移至冰上预冷的0.2cm电击杯，电击转化(如上， 1.5kV,25uFD,200ohms)。迅速加入1mL YPD和1M山梨醇(1:1，v/v) 的混合液，30℃、200rpm培养2小时后，收集菌液后涂布含有不含抗生素的 YPD培养基平板，30℃静置培养2至3天，至长出单菌落。

3、去除抗性标记的菌株的筛选

挑取单菌落一一对应分别接种于含有和不含潮霉素(100mg/L)的YPD 平板，挑取在含有抗生素培养基上不生长、但不含抗生素培养基上能够生长的单菌落接种于含有1mLYPD培养基的2mL离心管中，于4℃、250rpm过夜培养，次日通过菌落PCR鉴定抗性筛选标记是否去除，所用DNA聚合酶为Takara Taq，引物为：

a)CPR-b-2F&CPR-b-2R，PCR反应条件同上。

b)HYG-F:5’-CTCGGAGGGCGAAGAATCTC-3’(SEQ ID NO：17)

HYG-R:5’-CAATGACCGCTGTTATGCGG-3’(SEQ ID NO：18)。

PCR反应条件为

步骤1:98℃ 30s

步骤2:98℃ 10s,50℃ 30s,72℃ 35s共30个循环

步骤3:72℃ 5m

4、筛选结果

通过菌落PCR，筛选得到1株抗性筛选标记去除的菌株，并通过测序确认，该菌株CPR-b基因启动子区域发生了一处碱基突变-322G>A；以终止密码子TAG下游第一位碱基为1计，其终止子区域发生的突变为：3'UTR.19C>T； 3'UTR.76_77insT。并已去除潮霉素筛选标记基因。最终该菌株命名为5473。

实施例8菌株5473发酵生产长链二元酸

发酵：接种菌株5473至含有1mL实施例1YPD培养基的2mL离心管中，30℃下，250RPM摇床培养1天。取上述菌液接入含有30mL实施例1 种子培养基的500mL摇瓶中，接种量为3％，摇床250rpm、30℃，36～48h 培养至OD₆₂₀达到0.8(稀释30倍后)时。将种子液接种到装有15mL实施例1发酵培养基的摇瓶中，接种量为20％，发酵培养基中底物为正十二烷。继续摇床培养250rpm、30℃培养至发酵结束。并以菌株CCTCC M2011192 作为对照组，培养基、培养和发酵方法与上述相同。

取0.5g上述发酵液样品，使用实施例1中4所述方法测定并计算十二碳二元酸产量及月桂酸杂质质量比率，如下表2所示：

表2

菌株	CCTCC M2011192	5473
			十二碳二元酸产量(mg/g)	152.4	153.7
月桂酸杂质质量比率(％)	1.11	0.66

由表2可知去除筛选标记后，月桂酸杂质的质量比率下降了40.5％。

提取纯化：

(1)将上述发酵液，用质量浓度30％的氢氧化钠溶液调节pH为8.5，加水调节到长链二元酸浓度为8.9wt％，加热至45℃，用0.05微米孔径的陶瓷膜[购自三达膜科技(厦门)有限公司]对发酵液进行过滤。使用的陶瓷膜膜面积为0.84平方米，膜前压力设定0.3MPa，收集膜清液。

(2)将接收到的膜清液，在60℃下，加入5wt％的粉末活性炭(相对于溶液中含有的长链二元酸的量)脱色，过滤得到澄清液体。

(3)再向所述澄清液体中加入硫酸，调节pH至3.2，降温到30℃，过滤得到湿固体，用3倍于湿固体重量的纯净水洗涤滤饼，过滤后烘干，获得十二碳二元酸一级产品。

(4)向十二碳二元酸一级产品加入3.5倍量(相对于二元酸一级产品重量)浓度为97％的醋酸，加热到85℃溶解，加入1％大孔粉末活性炭(相对于二元酸一级产品重量)脱色，在85℃下保持1小时，热过滤得到清液。该溶液以10℃/小时的速度降温，到30℃得到长链二元酸晶体溶液。过滤，水洗涤湿固体的溶剂，烘干后得到十二碳二元酸二级产品。

使用实施例1中4所述方法测定并计算十二碳二元酸纯度及月桂酸杂质含量，如下表3所示：

表3

实施例9为进一步验证上述突变，提取酵母5473HYG的基因组DNA，用

HS高保真DNA聚合酶进行PCR扩增包含突变后的CPR-b 和HYG抗性基因的DNA片段，凝胶电泳后进行回收纯化，大小约为4.7Kb，经测序证实无误，其序列为SEQ ID NO：19。

CPR-3-F：5'-GGGATCTCCTCCGCAGTTTA-3'(SEQ ID NO：20)

CPR-3-R：5'-ATTGTGGATGGCCAGAAGTT-3'(SEQ ID NO：21)

PCR反应条件为：

步骤1:98℃ 30s

步骤2:98℃ 10s,53℃ 30s,72℃ 5m,30个循环

步骤3:72℃ 5m

将上述DNA片段(SEQ ID NO：19)同源重组入菌株CCTCC M2011192 的过程同实施例4，筛选得到的单克隆的CPR-b基因的测序步骤同实施例6。经测序确认，挑取的单克隆中整合入带有突变的CPR-b基因，突变位点与 SEQ ID NO：13一致。将其中一株菌命名为5474HYG。

发酵方法同实施例5所述，所用菌株为CCTCC M2011192、5473HYG 和5474HYG。发酵结束后各取0.5g上述发酵液样品，计算二元酸产量与月桂酸杂质含量，如表4所示。结果显示，与5473HYG一致，与对照组CCTCC M2011192相比，5474HYG中月桂酸杂质含量显著下降。

表4

菌株	CCTCC M2011192	5473HYG	5474HYG
				十二碳二元酸(mg/g)	151.2	152.5	152.3
月桂酸杂质质量比率(％)	1.01	0.67	0.67

实施例10菌株5473发酵生产十碳长链二元酸

发酵：接种菌株5473至含有1mL实施例1YPD培养基的2mL离心管中，30℃下，250RPM摇床培养1天。取上述菌液接入含有30mL实施例1 种子培养基的500mL摇瓶中，接种量为3％，摇床250rpm、30℃，36～48h 培养至OD620达到0.8(稀释30倍后)时。将种子液接种到装有15mL实施例1发酵培养基的摇瓶中，接种量为20％，发酵培养基中底物为正十烷。继续摇床培养250rpm、30℃培养至发酵结束。并以菌株CCTCC M2011192作为对照组，培养基、培养和发酵方法与上述相同。

取0.5g上述发酵液样品，使用实施例1中4所述方法测定并计算十碳二元酸产量及脂肪酸癸酸杂质质量比率，如下表5所示：

表5

菌株	CCTCC M2011192	5473
			十碳二元酸产量(mg/g)	120.9	123.4
癸酸杂质质量比率(％)	0.72	0.42

由表5可知癸酸杂质的质量比率下降了41.7％。

提取纯化步骤：与实施例8提取纯化步骤相同。使用实施例1中4所述方法测定并计算获得的十碳二元酸一级产品和二级产品的纯度及癸酸杂质含量，如下表6所示：

表6

实施例11菌株5473发酵生产十六碳长链二元酸

发酵：接种菌株5473至含有1mL实施例1YPD培养基的2mL离心管中，30℃下，250RPM摇床培养1天。取上述菌液接入含有30mL实施例1 种子培养基的500mL摇瓶中，接种量为3％，摇床250rpm、30℃，36～48h 培养至OD620达到0.8(稀释30倍后)时。将种子液接种到装有15mL实施例1发酵培养基的摇瓶中，接种量为20％，发酵培养基中底物为正十六烷。继续摇床培养250rpm、30℃培养至发酵结束。并以菌株CCTCC M2011192 作为对照组，培养基、培养和发酵方法与上述相同。

取0.5g上述发酵液样品，使用实施例1中4所述方法测定十六碳二元酸产量及棕榈酸杂质的质量比率，结果如下表7所示：

表7

菌株	CCTCC M2011192	5473
			十六碳二元酸产量(mg/g)	122.9	125.8
棕榈酸杂质质量比率(％)	1.89	1.13

由表7可知棕榈酸杂质的质量比率下降了40.2％。

提取纯化步骤：与实施例8提取纯化步骤相同，区别在于在步骤(4)之后还包括步骤(5)：即对十六碳二元酸二级产品重复步骤(4)获得十六碳二元酸三级产品。

使用实施例1中4所述方法测定并计算获得的十六碳二元酸一级产品和三级产品的纯度及棕榈酸杂质含量，如下表8所示：

表8

实施例12将实施例9所述DNA片段(SEQ ID NO：19)同源重组入热带假丝酵母(CCTCC M203052)，方法同实施例4。阳性克隆的筛选方法同实施例5，筛选得到的单克隆与亲代菌株(CCTCC M203052)基因组中CPR-b 基因的序列分析方法同实施例6。经测序证实，亲代菌株(CCTCC M203052) 的CPR-b的基因序列与GENBANK(登录号AY823228)公布的序列一致，而筛选得到的克隆中该基因携带有突变，突变位点与SEQ ID NO：13一致。将其中一株菌命名为5475HYG。

发酵方法同实施例5，所用菌株为CCTCC M203052和5475HYG。发酵结束后各取0.5g上述发酵液样品，计算二元酸产量与月桂酸杂质含量，如表 9所示。结果表明，与亲代菌株CCTCC M203052相比，5475HYG中月桂酸杂质含量显著下降。

表9

菌株	CCTCC M203052	5475HYG
			十二碳二元酸(mg/g)	137.2	135.4
月桂酸杂质质量比率(％)	1.27	0.62

从上述针对不同的发酵底物发酵生产长链二元酸的实施例8-12中可以看出，发酵后的发酵液中的主要脂肪酸杂质的含量均显著降低，与亲代菌株相比，脂肪酸杂质的含量最多能降低近40％，而且，对获得的十二碳二元酸、十碳二元酸、十六碳二元酸进行进一步的提取纯化，可以进一步降低杂质含量，很大程度上降低了后期的提取纯化工艺的难度。而且二元酸产品作为尼龙长丝、合成香料、工程塑料、耐寒增塑剂、高级润滑油和聚酰胺热熔胶等产品的重要原料，随着脂肪酸杂质含量的降低，将更有利于下游产品的生产制造，提高下游产品的质量。

本发明涉及的热带假丝酵母(Candida tropicalis)CATN145于2011年6 月9日以保藏号M2011192保藏在中国典型培养物保藏中心(CCTCC)(中国武汉市武汉大学，邮编430072)。

本发明涉及的热带假丝酵母(Candida tropicalis)ES9-66于2003年6月6 日以保藏号M203052保藏在中国典型培养物保藏中心(CCTCC)(中国武汉市武汉大学，邮编430072)。

序列表

<110> 上海凯赛生物技术研发中心有限公司

CIBT美国公司

<120> 一种低含量脂肪酸杂质的长链二元酸及其生产方法

<130> NI2018TC404

<150> CN 201810734188.0

<151> 2018-07-06

<150> CN 201810734323.1

<151> 2018-07-06

<160> 23

<170> PatentIn version 3.5

<210> 1

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-b-F

<400> 1

cgaagttgtt gggggatct 19

<210> 2

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-b-R

<400> 2

tatcccggca ttaccaacgg 20

<210> 3

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-b_Upstream-F

<400> 3

tttgcgcgag taacatgtgc 20

<210> 4

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-b_Upstream-R

<400> 4

aatgattcct gcgaggggtg 20

<210> 5

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-b_Downstream-F

<400> 5

tttagtacag tatctccaat cc 22

<210> 6

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-b_Downstream-R

<400> 6

acgtctatat tgtggatggc 20

<210> 7

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR_HYG-F

<400> 7

ccgttggtaa tgccgggata gcatgcgaac ccgaaaatgg 40

<210> 8

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR_HYG-R

<400> 8

ggattggaga tactgtacta aagctagcag ctggatttca ct 42

<210> 9

<211> 1778

<212> DNA

<213> Artificial Sequence

<220>

<223> HYG

<400> 9

ccgttggtaa tgccgggata gcatgcgaac ccgaaaatgg agcaatcttc cccggggcct 60

ccaaatacca actcacccga gagagataaa gagacaccac ccaccacgag acggagtata 120

tccaccaagg taagtaactc agagttaatg atacaggtgt acacagctcc ttccctagcc 180

attgagtggg tatcacatga cactggtagg ttacaaccac gtttagtagt tattttgtgc 240

aattccatgg ggatcaggaa gtttggtttg gtgggtgcgt ctactgattc ccctttgtct 300

ctgaaaatct tttccctagt ggaacacttt ggctgaatga tataaattca ccttgattcc 360

caccctccct tctttctctc tctctctgtt acacccaatt gaattttctt ttttttttta 420

ctttccctcc ttctttatca tcaaagataa gtaagtttat caattgccta ttcagaatga 480

aaaagcctga actcaccgcg acgtctgtcg agaagtttct catcgaaaag ttcgacagcg 540

tctccgacct catgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag 600

gagggcgtgg atatgtcctc cgggtaaata gctgcgccga tggtttctac aaagatcgtt 660

atgtttatcg gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg 720

aattcagcga gagcctcacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag 780

acctccctga aaccgaactc cccgctgttc tccagccggt cgcggaggcc atggatgcga 840

tcgctgcggc cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg 900

gtcaatacac tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact 960

ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctca 1020

tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca 1080

acaatgtcct cacggacaat ggccgcataa cagcggtcat tgactggagc gaggcgatgt 1140

tcggggattc ccaatacgag gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta 1200

tggagcagca gacgcgctac ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc 1260

tccgggcgta tatgctccgc attggtcttg accaactcta tcagagcttg gttgacggca 1320

atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc aatcgtccga tccggagccg 1380

ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc cgtctggacc gatggctgtg 1440

tagaagtact cgccgatagt ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat 1500

agtgtgctac ccacgcttac tccaccagag ctattaacat cagaaatatt tattctaata 1560

aataggatgc aaaaaaaaaa ccccccttaa taaaaaaaaa agaaacgatt ttttatctaa 1620

tgaagtctat gtatctaaca aatgtatgta tcaatgttta ttccgttaaa caaaaatcag 1680

tctgtaaaaa aggttctaaa taaatattct gtctagtgta cacattctcc caaaatagtg 1740

aaatccagct gctagcttta gtacagtatc tccaatcc 1778

<210> 10

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-b-2F

<400> 10

attacgaaac ataggtcaac t 21

<210> 11

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-b-2R

<400> 11

taaccatatc catacgtcgc 20

<210> 12

<211> 330

<212> DNA

<213> Artificial Sequence

<220>

<223> CPR-b-2

<400> 12

attacgaaac ataggtcaac tatatatact tgattaaatg ttatagaaac aataattatt 60

atctactcgt ctacttcttt ggcattggca ttggcattgg cattggcatt gccgttgccg 120

ttggtaatgc cgggatattt agtacagtat ctccaatccg gatttgagct attgtaaatc 180

agctgcaagt cattctccac cttcaaccag tacttatact tcatctttga cttcaagtcc 240

aagtcataaa tattacaagt tagcaagaac ttctggccat ccacaatata gacgttattc 300

acgttattat gcgacgtatg gatatggtta 330

<210> 13

<211> 2792

<212> DNA

<213> Artificial Sequence

<220>

<223> mutated CPR-b gene

<400> 13

cgaagttgtt gggggatctc ctccgcagtt tatgttcatg tctttcccac tttggttgtg 60

attggggtag cgtagtgagt tggtgatttt cttttttcgc aggtgtctcc gatatcgaag 120

tttgatgaat ataggagcca gatcagcatg gtatattgcc tttgtagata gagatgttga 180

acaacaacta gctgaattac acaccaccgc taaacgatgc gcacagggtg tcaccgccaa 240

ctgacgttgg gtggagttgt tgttggcagg gccatattgc taaacgaaga gaagtagcac 300

aaaacccaag gttaagaaca attaaaaaaa ttcatacgac aattccacag ccatttacat 360

aatcaacagc gacaaatgag acagaaaaaa ctttcaacat ttcaaagttc cctttttcct 420

attacttctt tttttctttc cttcctttca tttcctttcc ttctgctttt attactttac 480

cagtcttttg cttgtttttg caattcctca tcctcctcct caccatggct ttagacaagt 540

tagatttgta tgtcatcata acattggtgg tcgctgtggc cgcctatttt gctaagaacc 600

agttccttga tcagccccag gacaccgggt tcctcaacac ggacagcgga agcaactcca 660

gagacgtctt gctgacattg aagaagaata ataaaaacac gttgttgttg tttgggtccc 720

agaccggtac ggcagaagat tacgccaaca aattgtcaag agaattgcac tccagatttg 780

gcttgaaaac catggttgca gatttcgctg attacgattg ggataacttc ggagatatca 840

ccgaagatat cttggtgttt ttcatcgttg ccacctacgg tgagggtgaa cctaccgaca 900

atgccgacga gttccacacc tggttgactg aagaagctga cactttgagt actttgagat 960

ataccgtgtt cgggttgggt aactccacct acgagttctt caatgctatt ggtagaaagt 1020

ttgacagatt gttgagtgag aaaggtggtg acagatttgc tgaatatgct gaaggtgacg 1080

acggcactgg caccttggac gaagatttca tggcctggaa ggataatgtc tttgacgcct 1140

tgaagaatga cttgaacttt gaagaaaagg aattgaagta cgaaccaaac gtgaaattga 1200

ctgagagaga tgacttgtct gctgccgact cccaagtttc cttgggtgag ccaaacaaga 1260

agtacatcaa ctccgagggc atcgacttga ccaagggtcc attcgaccac acccacccat 1320

acttggccag gatcaccgag accagagagt tgttcagctc caaggaaaga cactgtattc 1380

acgttgaatt tgacatttct gaatcgaact tgaaatacac caccggtgac catctagcca 1440

tctggccatc caactccgac gaaaacatca agcaatttgc caagtgtttc ggattggaag 1500

ataaactcga cactgttatt gaattgaagg cattggactc cacttacacc attccattcc 1560

caactccaat tacttacggt gctgtcatta gacaccattt agaaatctcc ggtccagtct 1620

cgagacaatt ctttttgtcg attgctgggt ttgctcctga tgaagaaaca aagaagactt 1680

tcaccagact tggtggtgac aaacaagaat tcgccaccaa ggttacccgc agaaagttca 1740

acattgccga tgccttgtta tattcctcca acaacactcc atggtccgat gttccttttg 1800

agttccttat tgaaaacatc caacacttga ctccacgtta ctactccatt tcttcttcgt 1860

cgttgagtga aaaacaactc atcaatgtta ctgcagtcgt tgaggccgaa gaagaagccg 1920

atggcagacc agtcactggt gttgttacca acttgttgaa gaacattgaa attgcgcaaa 1980

acaagactgg cgaaaagcca cttgttcact acgatttgag cggcccaaga ggcaagttca 2040

acaagttcaa gttgccagtg cacgtgagaa gatccaactt taagttgcca aagaactcca 2100

ccaccccagt tatcttgatt ggtccaggta ctggtgttgc cccattgaga ggtttcgtta 2160

gagaaagagt tcaacaagtc aagaatggtg tcaatgttgg caagactttg ttgttttatg 2220

gttgcagaaa ctccaacgag gactttttgt acaagcaaga atgggccgag tacgcttctg 2280

ttttgggtga aaactttgag atgttcaatg ccttctctag acaagaccca tccaagaagg 2340

tttacgtcca ggataagatt ttagaaaaca gccaacttgt gcacgaattg ttgaccgaag 2400

gtgccattat ctacgtctgt ggtgacgcca gtagaatggc cagagacgtc cagaccacga 2460

tctccaagat tgttgccaaa agcagagaaa tcagtgaaga caaggccgct gaattggtca 2520

agtcctggaa agtccaaaat agataccaag aagatgtttg gtagactcaa acgaatctct 2580

ctttctccca acgcatttat gaatattctc attgaagttt tacatatgtt ctatatttca 2640

tttttttttt attatattac gaaacatagg tcaactatat atacttgatt aaatgttata 2700

gaaacaataa ttattatcta ctcgtctact tctttggcat tggcattggc attggcattg 2760

gcattgccgt tgccgttggt aatgccggga ta 2792

<210> 14

<211> 264

<212> DNA

<213> Artificial Sequence

<220>

<223> CPR-b_Upstream

<400> 14

gggggatcaa aagcggaaga tttgtgttgc ttgtgggttt tttcctttat ttttcatatg 60

atttctttgc gcaagtaaca tgtgccaatt tagtttgtga ttagcgtgcc ccacaattgg 120

catcgtggac gggcgtgttt tgtcataccc caagtcttaa ctagctccac agtctcgacg 180

gtgtctcgac gatgtcttct tccacccctc ccatgaatca ttcaaagttg ttgggggatc 240

tccaccaagg gcaccggagt taat 264

<210> 15

<211> 226

<212> DNA

<213> Artificial Sequence

<220>

<223> CPR-b_Downstream

<400> 15

tcccattacc gttgccgttg gcaatgccgg gatatttagt acagtatctc caatccggat 60

ttgagctatt gtagatcagc tgcaagtcat tctccacctt caaccagtac ttatacttca 120

tctttgactt caagtccaag tcataaatat tacaagttag caagaacttc tggccatcca 180

cgatatagac gttattcacg ttattatgcg acgtatggat gtggtt 226

<210> 16

<211> 5873

<212> DNA

<213> Artificial Sequence

<220>

<223> vector pCIB2

<400> 16

gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60

cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120

cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180

tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcggtct 240

agtatgattg tcaataatga tgggtcatcg tttcctgatt cgacgttccc tgtggtgtcg 300

ttaaatagcc tgtctgaaat ctcctccatg attgtgttgg tgtgtgttgt ttgactttcc 360

caattgctta catttttttc ttcaaggatt cgctccaaaa tagacagaaa ttatcgcgac 420

aagtcagacg aacgtcgcac gaggcgaacc aaattcttta gaagcatacg aaaactcact 480

ttatttccat tagaagtatt aaattaacaa atatataata tacaggatac aaagtaaaag 540

cacgcttaag caaccaaagc ggaagcggta gcggattcgt atttccagtt aggtggcaag 600

acagcgacgg ttctgtagta tctggccaat ctgtggattc tagattcaat caaaatcaat 660

ctgaacttgg agtccttgtc ctttctgttt ctttccaagt gctttctgac agagacagcc 720

ttcttgatca agtagtacaa gtcttctggg atttctggag ccaaaccgtt ggatttcaag 780

attctcaaga tcttgttacc agtgacaacc ttggcttggg aaacaccgtg agcatctctc 840

aagataacac caatttgaga tggagtcaaa ccctttctgg cgtacttgat gacttgttca 900

acaacttcgt cagaagacaa cttgaaccaa gatggagcgt ttcttgagta tggaagagcg 960

gaggaggaaa tacctttacc ctaaaataac aagagctaat gttagtaatt tgaaaaaaaa 1020

gacgttgagc acgcacaccc catccacccc acaggtgaaa cacatcaaac gtagcaagaa 1080

caatagttgg ccctcccgtc aagggggcag gtaattgtcc aagtacttta gaaaagtatg 1140

tttttaccca taagatgaac acacacaaac cagcaaaagt atcaccttct gcttttcttg 1200

gttgaggttc aaattatgtt tggcaataat gcagcgacaa tttcaagtac ctaaagcgta 1260

tatagtaaca attctaggtc tgtatagtcg accgtaggtg aatcgtttac tttaggcaag 1320

accttgtccc tgataaagcc aggttgtact ttctattcat tgagtgtcgt ggtggtggta 1380

gtggtggttg attgggctgt tgtggtagta gtagtggttg tgatttggaa catacagatg 1440

aatgcatacg acccatgatg actgatttgt ttctttattg agttgatggt aagaaagaga 1500

agaagaggag gtaaaaaggt ggtagagtga aaaatttttt tctcttaaaa gtgagagaga 1560

gaaagagaaa aatttcactg cgaaacaaat ggttggggac acgacttttt tcaggaattt 1620

ttactcgaag cgtatatgca ggaaagttgt tgttagggaa tatggagcca caagagagct 1680

gcgaattcga gctcggtacc cggggatcct ctagagtcga cctgcaggca tgcgaacccg 1740

aaaatggagc aatcttcccc ggggcctcca aataccaact cacccgagag agagaaagag 1800

acaccaccca ccacgagacg gagtatatcc accaaggtaa gtaactcagg gttaatgata 1860

caggtgtaca cagctccttc cctagccatt gagtgggtat cacatgacac tggtaggtta 1920

caaccacgtt tagtagttat tttgtgcaat tccatgggga tcaggaagtt tggtttggtg 1980

ggtgcgtcta ctgattcccc tttgtctctg aaaatctttt ccctagtgga acactttggc 2040

tgaatgatat aaattcacct tgattcccac cctcccttct ttctctctct ctctgttaca 2100

cccaattgaa ttttcttttt ttttttactt tccctccttc tttatcatca aagataagta 2160

agtttatcaa ttgcctattc agaatgaaaa agcctgaact caccgcgacg tctgtcgaga 2220

agtttctcat cgaaaagttc gacagcgtct ccgacctcat gcagctctcg gagggcgaag 2280

aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctccgg gtaaatagct 2340

gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg gccgcgctcc 2400

cgattccgga agtgcttgac attggggaat tcagcgagag cctcacctat tgcatctccc 2460

gccgtgcaca gggtgtcacg ttgcaagacc tccctgaaac cgaactcccc gctgttctcc 2520

agccggtcgc ggaggccatg gatgcgatcg ctgcggccga tcttagccag acgagcgggt 2580

tcggcccatt cggaccgcaa ggaatcggtc aatacactac atggcgtgat ttcatatgcg 2640

cgattgctga tccccatgtg tatcactggc aaactgtgat ggacgacacc gtcagtgcgt 2700

ccgtcgcgca ggctctcgat gagctcatgc tttgggccga ggactgcccc gaagtccggc 2760

acctcgtgca cgcggatttc ggctccaaca atgtcctcac ggacaatggc cgcataacag 2820

cggtcattga ctggagcgag gcgatgttcg gggattccca atacgaggtc gccaacatct 2880

tcttctggag gccgtggttg gcttgtatgg agcagcagac gcgctacttc gagcggaggc 2940

atccggagct tgcaggatcg ccgcggctcc gggcgtatat gctccgcatt ggtcttgacc 3000

aactctatca gagcttggtt gacggcaatt tcgatgatgc agcttgggcg cagggtcgat 3060

gcgacgcaat cgtccgatcc ggagccggga ctgtcgggcg tacacaaatc gcccgcagaa 3120

gcgcggccgt ctggaccgat ggctgtgtag aagtactcgc cgatagtgga aaccgacgcc 3180

ccagcactcg tccgagggca aaggaatagt gtgctaccca cgcttactcc accagagcta 3240

ttaacatcag aaatatttat tctaataaat aggatgcaaa aaaaaaaccc cccttaataa 3300

aaaaaaaaga aacgattttt tatctaatga agtctatgta tctaacaaat gtatgtatca 3360

atgtttattc cgttaaacaa aaatcagtct gtaaaaaagg ttctaaataa atattctgtc 3420

tagtgtacac attctcccaa aatagtgaaa tccagctgct agcgtgtaag cttggcactg 3480

gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 3540

gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 3600

tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt tctccttacg 3660

catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg ctctgatgcc 3720

gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt 3780

ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag 3840

aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt 3900

ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga 3960

aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc 4020

atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 4080

caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 4140

cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 4200

tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 4260

tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac 4320

gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 4380

tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 4440

gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 4500

aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 4560

gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca 4620

atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 4680

caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 4740

ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 4800

attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 4860

agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 4920

aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt 4980

catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc 5040

ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 5100

tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 5160

ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 5220

ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac 5280

ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct 5340

gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 5400

aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 5460

acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 5520

gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 5580

gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 5640

cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 5700

aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 5760

gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 5820

cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga aga 5873

<210> 17

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer HYG-F

<400> 17

ctcggagggc gaagaatctc 20

<210> 18

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer HYG-R

<400> 18

caatgaccgc tgttatgcgg 20

<210> 19

<211> 4666

<212> DNA

<213> Artificial Sequence

<220>

<223> CPR-b and HYG

<400> 19

gggatctcct ccgcagttta tgttcatgtc tttcccactt tggttgtgat tggggtagcg 60

tagtgagttg gtgattttct tttttcgcag gtgtctccga tatcgaagtt tgatgaatat 120

aggagccaga tcagcatggt atattgcctt tgtagataga gatgttgaac aacaactagc 180

tgaattacac accaccgcta aacgatgcgc acagggtgtc accgccaact gacgttgggt 240

ggagttgttg ttggcagggc catattgcta aacgaagaga agtagcacaa aacccaaggt 300

taagaacaat taaaaaaatt catacgacaa ttccacagcc atttacataa tcaacagcga 360

caaatgagac agaaaaaact ttcaacattt caaagttccc tttttcctat tacttctttt 420

tttctttcct tcctttcatt tcctttcctt ctgcttttat tactttacca gtcttttgct 480

tgtttttgca attcctcatc ctcctcctca ccatggcttt agacaagtta gatttgtatg 540

tcatcataac attggtggtc gctgtggccg cctattttgc taagaaccag ttccttgatc 600

agccccagga caccgggttc ctcaacacgg acagcggaag caactccaga gacgtcttgc 660

tgacattgaa gaagaataat aaaaacacgt tgttgttgtt tgggtcccag accggtacgg 720

cagaagatta cgccaacaaa ttgtcaagag aattgcactc cagatttggc ttgaaaacca 780

tggttgcaga tttcgctgat tacgattggg ataacttcgg agatatcacc gaagatatct 840

tggtgttttt catcgttgcc acctacggtg agggtgaacc taccgacaat gccgacgagt 900

tccacacctg gttgactgaa gaagctgaca ctttgagtac tttgagatat accgtgttcg 960

ggttgggtaa ctccacctac gagttcttca atgctattgg tagaaagttt gacagattgt 1020

tgagtgagaa aggtggtgac agatttgctg aatatgctga aggtgacgac ggcactggca 1080

ccttggacga agatttcatg gcctggaagg ataatgtctt tgacgccttg aagaatgact 1140

tgaactttga agaaaaggaa ttgaagtacg aaccaaacgt gaaattgact gagagagatg 1200

acttgtctgc tgccgactcc caagtttcct tgggtgagcc aaacaagaag tacatcaact 1260

ccgagggcat cgacttgacc aagggtccat tcgaccacac ccacccatac ttggccagga 1320

tcaccgagac cagagagttg ttcagctcca aggaaagaca ctgtattcac gttgaatttg 1380

acatttctga atcgaacttg aaatacacca ccggtgacca tctagccatc tggccatcca 1440

actccgacga aaacatcaag caatttgcca agtgtttcgg attggaagat aaactcgaca 1500

ctgttattga attgaaggca ttggactcca cttacaccat tccattccca actccaatta 1560

cttacggtgc tgtcattaga caccatttag aaatctccgg tccagtctcg agacaattct 1620

ttttgtcgat tgctgggttt gctcctgatg aagaaacaaa gaagactttc accagacttg 1680

gtggtgacaa acaagaattc gccaccaagg ttacccgcag aaagttcaac attgccgatg 1740

ccttgttata ttcctccaac aacactccat ggtccgatgt tccttttgag ttccttattg 1800

aaaacatcca acacttgact ccacgttact actccatttc ttcttcgtcg ttgagtgaaa 1860

aacaactcat caatgttact gcagtcgttg aggccgaaga agaagccgat ggcagaccag 1920

tcactggtgt tgttaccaac ttgttgaaga acattgaaat tgcgcaaaac aagactggcg 1980

aaaagccact tgttcactac gatttgagcg gcccaagagg caagttcaac aagttcaagt 2040

tgccagtgca cgtgagaaga tccaacttta agttgccaaa gaactccacc accccagtta 2100

tcttgattgg tccaggtact ggtgttgccc cattgagagg tttcgttaga gaaagagttc 2160

aacaagtcaa gaatggtgtc aatgttggca agactttgtt gttttatggt tgcagaaact 2220

ccaacgagga ctttttgtac aagcaagaat gggccgagta cgcttctgtt ttgggtgaaa 2280

actttgagat gttcaatgcc ttctctagac aagacccatc caagaaggtt tacgtccagg 2340

ataagatttt agaaaacagc caacttgtgc acgaattgtt gaccgaaggt gccattatct 2400

acgtctgtgg tgacgccagt agaatggcca gagacgtcca gaccacgatc tccaagattg 2460

ttgccaaaag cagagaaatc agtgaagaca aggccgctga attggtcaag tcctggaaag 2520

tccaaaatag ataccaagaa gatgtttggt agactcaaac gaatctctct ttctcccaac 2580

gcatttatga atattctcat tgaagtttta catatgttct atatttcatt ttttttttat 2640

tatattacga aacataggtc aactatatat acttgattaa atgttataga aacaataatt 2700

attatctact cgtctacttc tttggcattg gcattggcat tggcattggc attgccgttg 2760

ccgttggtaa tgccgggata gcatgcgaac ccgaaaatgg agcaatcttc cccggggcct 2820

ccaaatacca actcacccga gagagataaa gagacaccac ccaccacgag acggagtata 2880

tccaccaagg taagtaactc agagttaatg atacaggtgt acacagctcc ttccctagcc 2940

attgagtggg tatcacatga cactggtagg ttacaaccac gtttagtagt tattttgtgc 3000

aattccatgg ggatcaggaa gtttggtttg gtgggtgcgt ctactgattc ccctttgtct 3060

ctgaaaatct tttccctagt ggaacacttt ggctgaatga tataaattca ccttgattcc 3120

caccctccct tctttctctc tctctctgtt acacccaatt gaattttctt ttttttttta 3180

ctttccctcc ttctttatca tcaaagataa gtaagtttat caattgccta ttcagaatga 3240

aaaagcctga actcaccgcg acgtctgtcg agaagtttct catcgaaaag ttcgacagcg 3300

tctccgacct catgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag 3360

gagggcgtgg atatgtcctc cgggtaaata gctgcgccga tggtttctac aaagatcgtt 3420

atgtttatcg gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg 3480

aattcagcga gagcctcacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag 3540

acctccctga aaccgaactc cccgctgttc tccagccggt cgcggaggcc atggatgcga 3600

tcgctgcggc cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg 3660

gtcaatacac tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact 3720

ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctca 3780

tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca 3840

acaatgtcct cacggacaat ggccgcataa cagcggtcat tgactggagc gaggcgatgt 3900

tcggggattc ccaatacgag gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta 3960

tggagcagca gacgcgctac ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc 4020

tccgggcgta tatgctccgc attggtcttg accaactcta tcagagcttg gttgacggca 4080

atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc aatcgtccga tccggagccg 4140

ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc cgtctggacc gatggctgtg 4200

tagaagtact cgccgatagt ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat 4260

agtgtgctac ccacgcttac tccaccagag ctattaacat cagaaatatt tattctaata 4320

aataggatgc aaaaaaaaaa ccccccttaa taaaaaaaaa agaaacgatt ttttatctaa 4380

tgaagtctat gtatctaaca aatgtatgta tcaatgttta ttccgttaaa caaaaatcag 4440

tctgtaaaaa aggttctaaa taaatattct gtctagtgta cacattctcc caaaatagtg 4500

aaatccagct gctagcttta gtacagtatc tccaatccgg atttgagcta ttgtaaatca 4560

gctgcaagtc attctccacc ttcaaccagt acttatactt catctttgac ttcaagtcca 4620

agtcataaat attacaagtt agcaagaact tctggccatc cacaat 4666

<210> 20

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-3-F

<400> 20

gggatctcct ccgcagttta 20

<210> 21

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> primer CPR-3-R

<400> 21

attgtggatg gccagaagtt 20

<210> 22

<211> 3245

<212> DNA

<213> Candida tropicalis

<400> 22

aattagttat ggggggggga tcaactgatt agcggaagat tggtgttgcc tgtggggttc 60

ttttattttt catatgattt ctttgcgcga gtaacatgtg ccaatctagt ttatgattag 120

cgtacctcca caattggcat cttggacggg cgtgttttgt cttaccccaa gccttattta 180

gttccacagt ctcgacggtg tctcgccgat gtcttctccc acccctcgca ggaatcattc 240

gaagttgttg ggggatctcc tccgcagttt atgttcatgt ctttcccact ttggttgtga 300

ttggggtagc gtagtgagtt ggtgattttc ttttttcgca ggtgtctccg atatcgaagt 360

ttgatgaata taggagccag atcagcatgg tatattgcct ttgtagatag agatgttgaa 420

caacaactag ctgaattaca cgccaccgct aaacgatgcg cacagggtgt caccgccaac 480

tgacgttggg tggagttgtt gttggcaggg ccatattgct aaacgaagag aagtagcaca 540

aaacccaagg ttaagaacaa ttaaaaaaat tcatacgaca attccacagc catttacata 600

atcaacagcg acaaatgaga cagaaaaaac tttcaacatt tcaaagttcc ctttttccta 660

ttacttcttt ttttctttcc ttcctttcat ttcctttcct tctgctttta ttactttacc 720

agtcttttgc ttgtttttgc aattcctcat cctcctcctc accatggctt tagacaagtt 780

agatttgtat gtcatcataa cattggtggt cgctgtggcc gcctattttg ctaagaacca 840

gttccttgat cagccccagg acaccgggtt cctcaacacg gacagcggaa gcaactccag 900

agacgtcttg ctgacattga agaagaataa taaaaacacg ttgttgttgt ttgggtccca 960

gaccggtacg gcagaagatt acgccaacaa attgtcaaga gaattgcact ccagatttgg 1020

cttgaaaacc atggttgcag atttcgctga ttacgattgg gataacttcg gagatatcac 1080

cgaagatatc ttggtgtttt tcatcgttgc cacctacggt gagggtgaac ctaccgacaa 1140

tgccgacgag ttccacacct ggttgactga agaagctgac actttgagta ctttgagata 1200

taccgtgttc gggttgggta actccaccta cgagttcttc aatgctattg gtagaaagtt 1260

tgacagattg ttgagtgaga aaggtggtga cagatttgct gaatatgctg aaggtgacga 1320

cggcactggc accttggacg aagatttcat ggcctggaag gataatgtct ttgacgcctt 1380

gaagaatgac ttgaactttg aagaaaagga attgaagtac gaaccaaacg tgaaattgac 1440

tgagagagat gacttgtctg ctgccgactc ccaagtttcc ttgggtgagc caaacaagaa 1500

gtacatcaac tccgagggca tcgacttgac caagggtcca ttcgaccaca cccacccata 1560

cttggccagg atcaccgaga ccagagagtt gttcagctcc aaggaaagac actgtattca 1620

cgttgaattt gacatttctg aatcgaactt gaaatacacc accggtgacc atctagccat 1680

ctggccatcc aactccgacg aaaacatcaa gcaatttgcc aagtgtttcg gattggaaga 1740

taaactcgac actgttattg aattgaaggc attggactcc acttacacca ttccattccc 1800

aactccaatt acttacggtg ctgtcattag acaccattta gaaatctccg gtccagtctc 1860

gagacaattc tttttgtcga ttgctgggtt tgctcctgat gaagaaacaa agaagacttt 1920

caccagactt ggtggtgaca aacaagaatt cgccaccaag gttacccgca gaaagttcaa 1980

cattgccgat gccttgttat attcctccaa caacactcca tggtccgatg ttccttttga 2040

gttccttatt gaaaacatcc aacacttgac tccacgttac tactccattt cttcttcgtc 2100

gttgagtgaa aaacaactca tcaatgttac tgcagtcgtt gaggccgaag aagaagccga 2160

tggcagacca gtcactggtg ttgttaccaa cttgttgaag aacattgaaa ttgcgcaaaa 2220

caagactggc gaaaagccac ttgttcacta cgatttgagc ggcccaagag gcaagttcaa 2280

caagttcaag ttgccagtgc acgtgagaag atccaacttt aagttgccaa agaactccac 2340

caccccagtt atcttgattg gtccaggtac tggtgttgcc ccattgagag gtttcgttag 2400

agaaagagtt caacaagtca agaatggtgt caatgttggc aagactttgt tgttttatgg 2460

ttgcagaaac tccaacgagg actttttgta caagcaagaa tgggccgagt acgcttctgt 2520

tttgggtgaa aactttgaga tgttcaatgc cttctctaga caagacccat ccaagaaggt 2580

ttacgtccag gataagattt tagaaaacag ccaacttgtg cacgaattgt tgaccgaagg 2640

tgccattatc tacgtctgtg gtgacgccag tagaatggcc agagacgtcc agaccacgat 2700

ctccaagatt gttgccaaaa gcagagaaat cagtgaagac aaggccgctg aattggtcaa 2760

gtcctggaaa gtccaaaata gataccaaga agatgtttgg tagactcaaa cgaatctctc 2820

tctctcccaa cgcatttatg aatattctca ttgaagtttt acatatgttc tatatttcat 2880

ttttttttat tatattacga aacataggtc aactatatat acttgattaa atgttataga 2940

aacaataatt attatctact cgtctacttc tttggcattg gcattggcat tggcattggc 3000

attgccgttg ccgttggtaa tgccgggata tttagtacag tatctccaat ccggatttga 3060

gctattgtaa atcagctgca agtcattctc caccttcaac cagtacttat acttcatctt 3120

tgacttcaag tccaagtcat aaatattaca agttagcaag aacttctggc catccacaat 3180

atagacgtta ttcacgttat tatgcgacgt atggatatgg ttatccttat tgaacttctc 3240

aaact 3245

<210> 23

<211> 3246

<212> DNA

<213> Artificial Sequence

<220>

<223> mutated Cpr-b

<400> 23

aattagttat ggggggggga tcaactgatt agcggaagat tggtgttgcc tgtggggttc 60

ttttattttt catatgattt ctttgcgcga gtaacatgtg ccaatctagt ttatgattag 120

cgtacctcca caattggcat cttggacggg cgtgttttgt cttaccccaa gccttattta 180

gttccacagt ctcgacggtg tctcgccgat gtcttctccc acccctcgca ggaatcattc 240

gaagttgttg ggggatctcc tccgcagttt atgttcatgt ctttcccact ttggttgtga 300

ttggggtagc gtagtgagtt ggtgattttc ttttttcgca ggtgtctccg atatcgaagt 360

ttgatgaata taggagccag atcagcatgg tatattgcct ttgtagatag agatgttgaa 420

caacaactag ctgaattaca caccaccgct aaacgatgcg cacagggtgt caccgccaac 480