源自耐有机酸的酵母的新型启动子及使用其表达靶基因的方法

文档序号:788883 发布日期:2021-04-09 浏览:16次 >En<

阅读说明:本技术 源自耐有机酸的酵母的新型启动子及使用其表达靶基因的方法 (Novel promoter derived from organic acid-resistant yeast and method for expressing target gene using same ) 是由 朴宰演 李泰荣 李气成 欧蒂·科威斯托仁 卡利·科乌兰塔 于 2019-02-28 设计创作,主要内容包括:本发明涉及用于调控耐有机酸的酵母中ADH基因表达的新型启动子,以及通过使用该启动子表达与有机酸产生相关的基因来生产有机酸的方法。当使用根据本发明的新型启动子在耐有机酸的酵母中表达与有机酸产生相关的靶基因时,由于耐有机酸,菌株的生长能力不受抑制并且以高产率产生有机酸。(The present invention relates to a novel promoter for regulating the expression of ADH gene in organic acid-resistant yeast, and a method for producing organic acid by expressing a gene associated with organic acid production using the promoter. When a target gene associated with the production of an organic acid is expressed in an organic acid-resistant yeast using the novel promoter according to the present invention, the growth ability of the strain is not inhibited and the organic acid is produced at a high yield due to the organic acid resistance.)

源自耐有机酸的酵母的新型启动子及使用其表达靶基因的 方法

技术领域

本发明涉及一种源自耐有机酸的酵母的新型启动子,更具体地,涉及用于调控耐有机酸的酵母中ADH基因表达的新型启动子,以及通过使用该启动子表达与有机酸产生相关的基因来生产有机酸的方法。

背景技术

通过生物工艺将各种原料转化为有机酸、醇和胺等化学品,在环境友好性、二氧化碳减排、可持续性和新平台化学品供应等方面引起了人们的关注。通过这种生物转化,已经提供了食品、化妆品、保健营养品和药物相关的化学产品。

然而,通常,通过生物转化生产的产品需要经过去除杂质的纯化工艺。在有机酸的生产中,通常在通过碱调节的中性pH下进行发酵,以防止菌株的生长被所产生的有机酸抑制,然后进行酸化以分离和纯化这些有机酸。由于该纯化工艺,产生大量的副产物中和盐,并且随着生产工艺的复杂化,生产成本增加。该纯化工艺的高成本负担是阻碍发酵产物进入化学品市场的因素。

当为了解决上述问题而使用即使在低pH下也能够生长且显示出高发酵能力的微生物来生产诸如有机酸的酸性物质时,可以省略中和培养基pH和进行酸化的过程,因此,可以通过工艺简化和减少添加剂的使用来降低成本。

然而,在许多情况下,在低pH下存活的微生物的生长速率非常低,因此不可能获得生产物质所需的足够数量的细胞。因此,这些微生物显示出低的原料消耗率,因此难以应用于工业发酵工艺。因此,选择具有保持原料的高消耗率的同时在低于产品pKa的pH下快速生长的特性的微生物是非常重要的。

可以通过各种选择压力从各种菌株库中选择这些微生物。选择压力的实例包括在靶产物浓度下的耐性、对原料浓度的耐性、原料的消耗率、pH条件以及在基本培养基中的生长能力。微生物的选择可以手动进行,但是当进行自动筛选时,可以从大量对象中快速选择具有优良特性的菌株。

选定的微生物具有出色的承受选择压力的特性,但是在大多数情况下,它们会产生其他产物而不会产生靶产物。因此,为了赋予选定的微生物产生靶产物的能力,已经研究了以遗传方式引入用于转化为靶产物的基因并消除产生原始产生的产物的能力。

为了赋予选定的微生物产生靶产物的能力,引入了能够转化为靶产物的基因,或者使用了增强微生物中原始包含的基因的方法。但是,一般而言,由于所含基因和由其产生的酶的活性通常较低,因此在大多数情况下会引入高活性的外源基因。另外,在该过程中,必须引入能够强烈表达外源DNA的启动子。

关于可用的启动子,当靶微生物是酵母时,通常可以使用酿酒酵母(Saccharomyces cerevisiae)(一种众所周知的酵母)的启动子,并且还可以应用为酿酒酵母开发的各种基因工程技术。另外,强启动子可以选自与所选微生物的主要碳通量有关的启动子,并且有必要应用一种可以通过各种技术最有效地表达靶基因的方法。特别地,对于所选的耐酸酵母,当尚未进行与酵母相关的基因工程研究时,使用酿酒酵母的启动子或使用所选微生物的内源启动子是一种常用方法。

通常,启动子具有各种调控区域,包括真核细菌中的核心启动子区域,并且微生物之间的调控基因是不同的。因此,有可能通过选择一个在ORF的5'端具有足够长度的序列,在确认启动子作用的同时找到一个最佳区域,但是对于远程控制机制(增强子、沉默子等)或组合起作用的控制机制则需要单独的研究。

因此,本发明人为寻找适合于外源基因表达的启动子付出了巨大的努力,以选择对有机酸具有耐性的酵母并赋予该酵母产生有用物质的能力。结果,本发明人发现,当使用源自产乙醇的代谢途径的启动子表达靶基因时,靶基因的表达明显增加,从而增加了靶产物的产生,从而完成了本发明。

发明内容

本发明的目的是提供一种源自耐有机酸的酵母的新型启动子。

本发明的另一个目的是提供一种包含该启动子的重组载体,以及一种重组微生物,其中引入了该重组载体。

本发明的另一个目的是提供一种基因构建体,其中该新型启动子和编码靶蛋白的基因可操作地彼此连接。

本发明的又一个目的是提供一种使用重组微生物生产有机酸的方法,该重组微生物中已引入了包含该新型启动子和与有机酸产生相关的基因的重组载体。

为了实现上述目的,本发明提供了一种启动子,其包含SEQ ID NO:1或SEQ ID NO:2的核苷酸序列。

本发明还提供了一种包含该启动子的重组载体。

本发明还提供了一种其中引入有该重组载体的重组微生物。

本发明还提供一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养引入有重组载体的重组微生物来产生有机酸;和(b)收集产生的有机酸。

本发明还提供了一种基因构建体,其中启动子和编码靶基因的基因可操作地彼此连接,所述启动子包括包含SEQ ID NO:1的核苷酸序列。

本发明还提供了一种重组微生物,其具有引入到其染色体中的基因构建体。

本发明还提供了一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养其中引入有基因构建体的重组微生物来产生有机酸;和(b)收集产生的有机酸。

本发明还提供了一种重组菌株,其通过在耐酸酵母YBC菌株(KCTC13508BP)中使g4423基因缺失或失活而获得,并且具有降低的乙醇生产能力。

本发明还提供了一种用于靶基因过表达的重组微生物,其中将靶基因插入YBC菌株(KCTC13508BP)的基因组中的g4423的启动子的下游,并且靶基因的表达由g4423的启动子调控。

本发明还提供了一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养重组微生物来产生有机酸;和(b)收集产生的有机酸。

本发明还提供了一种通过培养重组微生物来过表达靶基因的方法。

附图说明

图1示出了用于表达一种、两种或三种3-HP途径酶的基因盒的实例。(a)是表达一种酶的通用盒,(b)是用于在使用g4423启动子的情况下引入MCRsa1酶的盒,(c)是用于在使用g4423启动子的情况下引入LDH的盒,(d)是用于引入三种产生3-HP的酶(MCR、HPDH和EUTE)的盒,(e)是用于使用1-kb g4423启动子的盒,该启动子是MCR酶的启动子。

图2示出了用于表达一种、两种或三种3-HP途径酶的酵母表达质粒的实例。

图3示出了在构建的包含酿酒酵母的启动子的重组菌株中和包含YBC菌株的启动子(1kb)的重组菌株中MCR基因(MCRsa1和MCRsa2)表达水平的分析结果。

图4示出了包含ScTEF1p启动子的重组菌株中BDHcm基因、HPDHec基因和EUTEdz基因的表达水平的分析结果,BDHcm基因、HPDHec基因和EUTEdz基因是与3-HP产生相关的其他基因。

图5示出了酿酒酵母菌株中MCR基因和3-HP产生相关基因的表达水平的比较结果。在图5中,995-1和995-3显示了相同基因型的不同表型。

图6示出了进行RT-qPCR以分析通过酿酒酵母的遗传信息选择的七种ADH基因候选物的表达水平的结果。

图7示出了去除了g4423基因的重组菌株YBC-1563中的葡萄糖利用(A)和乙醇产生(B)的分析结果。

图8示出了用MCRsa1基因替换g4423基因的重组YBC菌株中MCRsa1的表达水平的分析结果。

图9示出了其中g4423启动子和终止子区域位于1-kb截短区域中的MCRsa1基因的表达分析结果。

图10示出了三个LDH基因被g4423替代的重组YBC菌株中乳酸产生的分析结果。

具体实施方式

除非另外定义,否则本说明书中使用的所有技术术语和科学术语具有与本发明所属领域的技术人员通常理解的含义相同的含义。通常,本说明书中使用的术语是本领域公知的并且通常使用的术语。

对于用于生产在各种产物中的产生酸性环境的产物(例如有机酸)的生物转化方法,选择耐酸微生物,尤其是即使在酸性环境中也显示出快速生长并且可以保持较高的原料吸收率的微生物,以减少下游工艺的复杂性以及随之而来的化合物和设施的投资成本。所选择的微生物在许多情况下固有地具有产生靶产物的能力,因此有必要开发各种基因工程工具以便有效地将产生靶产物的能力赋予靶微生物。

启动子是能够强烈表达外源性靶基因或根据条件表达外源性靶基因的调控区,从根本上说,需要选择一个能够强烈表达靶基因的启动子。在葡萄糖条件下,这种强启动子通常选自与糖酵解相关或与通过微生物产生主要发酵产物相关的启动子。

已知的强启动子包括但不必限于TEF1、TPI1、HXT7、TDH3、PGK1、ADH1和PYK1,并且菌株之间可以不同。

常见的克拉布特里阳性(Crabtree-positive)酵母,包括在本发明中选择的微生物,在许多情况下产生乙醇作为主要的发酵产物,并且其启动子也被强烈表达并且主要在有利的发酵条件下(即在高糖浓度的条件下)起作用。

特别是,对于与乙醇代谢相关的启动子,通常开发技术的目的是在表达外源基因的同时阻断乙醇的产生。因此,当使用菌株的内源启动子时,具有的优点在于可以同时实现阻断乙醇产生的作用和强烈表达外源基因的作用。

在本发明中,为了高效地引入与有机酸产生相关的基因以赋予耐酸酵母YBC(KCTC13508BP)有机酸生产能力,选择了适合于这种引入的启动子。在本发明的一个实例中,已经证实,当使用源自酿酒酵母的启动子或在常规技术中使用的YBC的内源启动子引入与3-羟基丙酸(3-HP)产生相关的基因MCR基因时,该基因的表达效率非常低。在本发明的另一个实例中,已经证实,当使用与乙醇产生有关的ADH酶的基因g4423的启动子来表达MCR基因时,实现了该基因的高表达水平和优异的3-HP产率。

因此,一方面,本发明涉及包含SEQ ID NO:1或SEQ ID NO:2的核苷酸序列的启动子。

本发明的启动子在葡萄糖培养和对数生长期强烈表达,即使在酸性培养基中培养时也显示出良好的表达水平。另外,该启动子在异源基因的酵母表达中也能很好地起作用,所述异源基因包括酵母来源的基因,特别是古细菌来源的基因和细菌来源的基因。特别是,本发明的启动子是在耐酸菌株中产生各种化合物的必需启动子,并且是能够增强受该启动子影响的编码蛋白质的DNA的表达的启动子,特别是当该DNA是产生有机酸的DNA时。另外,该启动子是即使在细胞内外都存在有机酸的情况下也可以强烈表达的启动子。

另一方面,本发明涉及一种包含启动子的重组载体,以及一种其中引入有重组载体的重组微生物。

在本发明中,重组载体可以进一步包括包含SEQ ID NO:3或SEQ ID NO:4的序列的终止子。

在本发明中,重组载体可以进一步包含编码靶蛋白的基因,并且靶蛋白可以是与有机酸产生相关的蛋白。

在本发明中,已经发现可以生产作为有机酸的3-羟基丙酸和乳酸,但是本发明不必限于此。

使用此启动子表达的与有机酸产生相关的基因的实例包括编码琥珀酸途径中的富马酸还原酶、琥珀酰辅酶A(coA)合成酶和磷酸烯醇丙酮酸羧化酶的基因(Progress ofsuccinic acid production from renewable resources:Metabolic and fermentativestrategies,Bioresource Technology245(B);1710-1717,2017);编码己二酸途径中的丁酰激酶、烯醇(enoate)还原酶、己二酰辅酶A转移酶和己二酸半醛脱氢酶的基因(Development of a Platform Strain for Production of Adipic Acid YieldsInsights into the Localized Redox Metabolism of S.cerevisiae,Patrick Hyland.Athesis of Master of Applied Science,Graduate Department of ChemicalEngineering and Applied Chemistry,University of Toronto,2013);编码3-羟基异丁酸途径中的甲基丙二酰辅酶A还原酶的基因(第2016-0075640号韩国专利申请公开);编码异丁酸途径中的α-酮异戊酸脱羧酶和潜在的苯乙醛脱氢酶的基因(ChemSusChem 2011,4,1068-1070);编码苹果酸途径中的苹果酸脱氢酶的基因(Malic Acid Production bySaccharomyces cerevisiae:Engineering of Pyruvate Carboxylation,OxaloacetateReduction,and Malate Export,Appl.Environ.Microbiol.,74:2766-2777,2008);和编码衣康酸途径中的顺式-乌头酸脱羧酶的基因(Biochemistry of microbial itaconic acidproduction,Front Microbiol.2013;4:23.)。该启动子可以用于每个途径的最后一步中的基因的过表达,并且这在相关的现有技术文献(JP4700395B2)中也有详细说明。另外,除了上面举例说明的基因之外,该启动子还可以应用于相同途径的其他基因。

本发明的启动子是包含SEQ ID NO:1所示核苷酸序列的多核苷酸,且即使在有机酸产生条件下也具有很强的活性。另外,由于YBC菌株的二倍体性质,可能存在具有诸如SEQID NO:1的核苷酸序列中的缺失或插入的突变的序列,并且包括这些突变序列的序列也可以表现出相同的特征(The Baker's Yeast Diploid Genome Is Remarkably Stable inVegetative Growth and Meiosis,PLoS Genet 6(9):2010.Ploidy changes and genomestability in yeast,Yeast 31:421-430,2014)。

此外,与本发明的启动子一起起作用的终止子包含SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列。

在本发明中,靶蛋白的实例包括但不限于丙二酰辅酶A还原酶、乳酸脱氢酶、富马酸还原酶、琥珀酰辅酶A合成酶、磷酸烯醇丙酮酸羧化酶、丁酰激酶、烯醇还原酶、己二酰辅酶A转移酶、己二酸半醛脱氢酶、甲基丙二酰辅酶A还原酶、α-酮异戊酸脱羧酶、潜在的苯乙醛脱氢酶、苹果酸脱氢酶和顺式-乌头酸脱羧酶。

在本发明中,重组体优选为酵母,更优选为耐酸酵母YBC(KCTC13508BP)。

再另一方面,本发明还涉及一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养其中引入有重组载体的重组微生物来产生有机酸;和(b)收集产生的有机酸。

又另一方面,本发明涉及一种基因构建体,其中启动子和编码靶基因的基因可操作地彼此连接,所述启动子包括包含SEQ ID NO:1或SEQ ID NO:2的核苷酸序列,以及一种将基因构建体引入其染色体中的的重组微生物。

在本发明中,靶蛋白可以是与有机酸产生相关的蛋白。靶蛋白可以选自丙二酰辅酶A-还原酶、乳酸脱氢酶等,但不限于此,并且可以不受限制地使用与有机酸产生有关的任何蛋白。

在本发明中,重组体优选是酵母,更优选是耐酸酵母YBC(KCTC13508BP)。

再另一方面,本发明涉及一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养其中引入有基因构建体的重组微生物来产生有机酸;和(b)收集产生的有机酸。

本发明的启动子与编码靶蛋白的基因一起构成待引入酵母中的DNA构建体。这些DNA构建体包括适用于本领域技术人员已知的各种酵母转化方法的构建体,并且用于同源重组的DNA构建体的实例示于SEQ ID NO:5和SEQ ID NO:6。DNA构建体是用于缺失g4423基因的双等位基因缺失盒。另外,当将靶DNA插入该盒中时,产生了每个等位基因的基因插入盒,这是本领域技术人员众所周知的。

在本发明中,所述盒可以包含SEQ ID NO:5或SEQ ID NO:6的核苷酸序列,并且所述盒可以包含靶基因。

另一方面,本发明涉及一种过表达靶基因的方法,该方法包括用靶基因代替YBC菌株(KCTC13508BP)的基因组中的g4423基因。

另一方面,本发明涉及用于靶基因过表达的重组微生物,其中将靶基因插入YBC菌株(KCTC13508BP)的基因组中g4423的启动子的下游,并且靶基因的表达由g4423的启动子调控。

又另一方面,本发明涉及一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养重组微生物来产生有机酸;和(b)收集产生的有机酸。

又另一方面,本发明涉及一种通过培养重组微生物来过表达靶基因的方法。

又另一方面,本发明涉及一种重组菌株,其通过使耐酸酵母YBC菌株(KCTC13508BP)中的g4423基因缺失或失活而获得,并且具有降低的乙醇生产能力。

如本文所用,“同源性”是指用于比较的两个氨基酸部分或多核苷酸部分之间的同一性百分比。术语“相似性”是指由比较窗口确定的两个氨基酸序列或多核苷酸序列在功能上或结构上彼此相同的程度。可以通过使用标准软件,例如基于BLAST开发的名为BLASTN或BLASTX的程序(Proc.Natl.Acad.Sci.USA,90,5873-5877,1993)比较序列来确定序列的同源性或相似性。

g4423启动子可优选具有显示出与SEQ ID NO:1的序列90%以上、92%以上、93%以上、95%以上、97%以上、98%以上、99%以上或100%的序列同源性的序列。

如果任何启动子在与本发明的g4423启动子具有90%以上的同源性的同时表现出等效水平的表达效率,则可以认为其是基本上等效的启动子。

在某些情况下,可以使用本领域已知的技术使根据本发明的g4423启动子突变,以提高靶基因的表达效率。

在本发明中,重组酵母可以具有耐酸性。为了制备适用于本发明的耐酸重组酵母,优选使用对有机酸具有耐性的宿主酵母。

耐酸酵母可以是选自酵母属、哈萨克斯坦酵母(Kazachstania saccharomyces)和假丝酵母属的耐酸酵母。例如,耐酸酵母可以选自啤酒酵母(Saccharomyces cerevisiae)、Kazachstania exigua、博伊丁哈萨克斯坦酵母(Kazachstania bulderi)和扁平云假丝酵母(Candida humilis),但不限于此。

“耐酸酵母”是指对有机酸(例如3-HP或乳酸)具有耐性的酵母,并且可以通过评估在包含各种浓度的有机酸的培养基中的生长来确定耐酸性。换句话说,“耐酸酵母”是指与含有高浓度有机酸的培养基中的普通酵母相比,具有更高的生长速率和生物质消耗率的酵母。

在本发明中,术语“耐酸酵母”定义为这样一种酵母,与不含有机酸的培养基相比,在含有1M以上的有机酸的培养基中,该酵母在低于有机酸的pKa值的pH下,可以保持至少10%的生物质消耗率(糖消耗率等)或至少10%的比生长速率。更具体地说,在本发明中,术语“耐酸酵母”定义为这样一种酵母,与pH为7相比,该酵母在2至4的pH下,能够保持至少10%的生物质消耗率(糖消耗率等)或至少10%的比生长速率。

根据本发明的重组酵母可以按照常规方法通过将基因插入宿主酵母的染色体中或通过将包含该基因的载体引入宿主酵母中来制备。

作为宿主酵母,通常使用高效引入有DNA并高效表达该引入的DNA的宿主细胞。尽管在本发明的一个实例中使用了耐酸酵母,但是本发明不限于此,可以使用任何类型的酵母,只要可以在其中充分表达靶DNA即可。

可以根据任何转化方法制备重组酵母。“转化”是指将DNA引入宿主细胞并使DNA作为染色体因子或通过完成染色体整合而在其中复制的过程,这是通过将外源DNA引入细胞而人为引起遗传变化的现象。典型的转化方法包括电穿孔、乙酸锂-PEG方法等。

此外,在本发明中,可以使用任何通常已知的基因工程方法作为将基因插入宿主微生物的染色体中的方法。该方法的实例包括使用逆转录病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹病毒载体、痘病毒载体、慢病毒载体、非病毒载体等的方法。“载体”是指DNA构建体,其包含与能够在合适的宿主中表达DNA的合适的控制序列可操作地连接的DNA序列。载体可以是质粒、噬菌体颗粒或者仅仅是潜在的基因组插入物。一旦转化到合适的宿主中,载体就可以独立于宿主基因组复制且发挥作用,或者在某些情况下可以整合到基因组本身中。质粒是目前最常用的载体形式,线性化DNA也是通常用于整合入酵母基因组的形式。

典型的质粒载体的结构包括:(a)复制起点,其允许有效地进行复制,从而每个宿主细胞产生质粒载体;(b)抗生素抗性基因或营养缺陷型标记基因,其允许选择用质粒载体转化的宿主细胞;和(c)可以插入外源DNA片段的限制性酶切位点。即使没有合适的限制酶的限制位点,当按照常规方法使用接头或合成寡核苷酸衔接子时,也可以容易地连接载体和外源DNA。即使在载体中不存在合适的限制酶消化位点,根据常规方法使用合成的寡核苷酸衔接子或接头也可以使外源DNA片段易于与载体连接。

此外,当该基因与另一核酸序列处于功能关系时,该基因是“可操作地连接的”。这可以是一个基因和一个或多个调控序列,当适当的分子(例如,转录激活蛋白)与一个或多个调控序列结合时,它们以允许基因表达的方式连接。例如,如果多肽被表达为参与该多肽的分泌的前蛋白,则前导肽或分泌前导序列的DNA与该多肽的DNA可操作地连接;如果启动子或增强子影响序列的转录,则其可操作地与编码序列连接;或者如果核糖体结合位点影响序列的转录,则其可操作地与编码序列连接;或者如果核糖体结合位点被定位以促进翻译,则其可操作地与编码序列连接。

通常,“可操作地连接”是指被连接的DNA序列是连续的,并且在分泌前导序列的情况下,是连续的并且处于阅读框内。但是,增强子不必是连续的。通过在方便的限制酶位点处连接来完成接合。如果不存在这样的位点,则根据常规方法使用合成的寡核苷酸衔接子或接头。

众所周知,并不是所有的载体在表达本发明的DNA序列时都具有相同的功能,同样,并非所有的宿主都同样适合于容纳相同的表达载体。然而,本领域技术人员能够在不偏离本发明范围的情况下从其他各种载体、表达调控序列和宿主中进行适当的选择而无需进行过度的实验。例如,可以考虑宿主细胞来选择载体,因为该载体应该在宿主细胞中复制。另外,还应考虑载体的拷贝数、控制拷贝数的能力、由载体中的基因编码的另一蛋白(例如抗生素标记)的表达。

在本发明中使用的碳源可以是选自葡萄糖、木糖、阿拉伯糖、蔗糖、果糖、纤维素、半乳糖、葡萄糖低聚物和甘油中的一种或多种,但不限于此。

在本发明中,可以在微生物(例如大肠杆菌)不再起作用(例如不能产生代谢物)的条件下进行培养。例如,可以在pH 1.0至6.5、优选pH 1.0至6.0、更优选pH 2.6至4.0下进行培养,但不限于此。

在下文中,将参考实施例更详细地描述本发明。这些实施例仅用于举例说明本发明,并且对于本领域普通技术人员将显而易见的是,本发明的范围不应解释为受这些实施例的限制。

实施例1:分析YBC菌株中使用常规启动子的丙二酰辅酶A还原酶(MCR)的表达模式

耐酸菌株的选择

本发明人通过对各种酵母菌株的测试选择了具有耐酸性的一组菌株(第2017-0025315号韩国专利申请公开)。对于选择的酵母菌株,在培养开始时将乳酸添加到培养基中,并且在检查微生物的生长速率和糖消耗率的同时选择具有最佳耐酸性的菌株。此时,使用OD值为4的接种物和添加了3.5%葡萄糖的YP培养基(20g/L蛋白胨和10g/L酵母提取物),并在30℃和100rpm的条件下用50mL烧瓶培养进行实验。培养开始时的乳酸浓度在0至80g/L之间变化。比较和分析结果,并选择具有最佳耐酸性的YBC菌株。

YBC菌株(Kazachstania exigua sB-018c)于2018年4月11日保藏在保藏机构,韩国生物科学与生物技术研究所的生物资源中心,登记号为KCTC13508BP。

在抗酸菌株YBC中使用常规启动子表达MCR

在该实施例中,在YBC菌株中表达了编码MCR(丙二酰辅酶A还原酶)的基因,该酶涉及3-HP(3-羟基丙酸)的产生。

产生3-HP的丙二酰辅酶A途径是一种代谢途径,其中乙酰辅酶A通过羧化反应转化为丙二酰辅酶A,然后通过还原反应转化为3-HP(乙酰辅酶A→丙二酰辅酶A→3-HP)。丙二酰辅酶A途径作为3-HP产生途径被研究最多,因为通常由包括大肠杆菌在内的微生物产生的中间体都通过该途径(第US 2013/0071893A1号美国专利申请公开)。丙二酸辅酶A可通过丙二酸还原酶和3-HP脱氢酶的作用而转化为3-HP,因此,在葡萄糖或甘油的存在下使用重组大肠杆菌将丙二酰辅酶A转化为3-HP的方法是众所周知的。

在该实施例中,对MCRsa1和MCRsa2进行了实验,它们是已知的MCR基因中的高效基因。基于来自基因库(Genbank)的数据,利用酵母密码子用法来合成所使用的MCRsa1和MCRsa2,并且该实施例中使用的MCR基因的信息示于下表1中。

[表1]

为了将基因引入YBC菌株,构建了图1(a)所示的盒。

所述盒被构建为具有抗生素抗性基因。为了靶向靶基因,在全基因组序列或部分基因组序列的基础上,设计靶基因的5’UTR区域和3’UTR区域以具有如图1所示的限制性酶位点,然后进行PCR。基于已知的基因信息(例如,酵母(Saccharomyces)基因组数据库)构建了源自酿酒酵母的启动子和终止子。作为抗生素抗性基因,在图1(a)中以HygR为例。然而,真核生物的其他抗生素抗性基因可以用于该菌株,并且这些基因可以由本领域技术人员容易地构建。由于使用后需要去除抗生素抗性基因,以便可以进行下一步的基因操作,因此在两端引入了用于Cre-loxp的位点(lox71和lox66)。另外,使用与得到UTR区域的方法相同的方法来构建源自YBC菌株的启动子和终止子。当要表达多个靶基因时,构建如图1(d)所示的能够表达多个基因的盒,并且使用位于每个区域末端的限制酶通过交换来构建UTR、ORF基因和抗生素抗性基因以适应目的。

对于供体DNA,使用限制酶切割或通过PCR扩增包含盒的质粒,并且可以使用位于每个末端的限制酶交换每个基因的区域。除了使用限制酶的方法外,还使用吉布森组装法(Gibson assembly)构建了一种盒。对于如何使用吉布森组装法,众所周知有许多产品和用法。在该实施例中,使用NEB吉布森组装预混液和克隆试剂盒构建该盒。其中,与MCR和G4423有关的寡聚物示于下表2中。

[表2]

在耐酸啤酒酵母菌株的情况下,使用图2所示的盒或表达质粒(pSK-084和/或pSK-085)进行表达(图2)。

为了将构建的盒引入YBC菌株中,通过PCR或限制酶方法构建线性化的供体DNA,然后如通常的酵母转化中一样,使用电穿孔法或乙酸锂法引入。接下来,根据所使用的营养缺陷型标记或抗生素标记,使用培养基进行选择。通过从选择培养基中选择的菌落,通过使用要引入靶标的基因ORF引物或使用引入的基因的引物的菌落PCR,来确认基因是否被引入染色体的正确基因座。随后,从培养的细胞中提取基因组DNA,并确定正确的基因型。

将这些构建的菌株分别在250mL烧瓶中使用20mL选择性的基于SC的培养基(20g/L葡萄糖)或YPD培养基进行培养(30℃和250rpm),并继续培养直至葡萄糖和乙醇被完全消耗掉。

下表3示出了通过上述方法构建的重组菌株,且MCR基因与酿酒酵母来源的启动子(TEF1)和YBC菌株来源的启动子(FBA1p)被一起引入该重组菌株中。

[表3]

将重组菌株分别在250mL烧瓶中使用20mL YPD培养基(20g/L蛋白胨,10g/L酵母提取物和20g/L葡萄糖)进行培养(30℃和250rpm)。在乙醇产生时和乙醇消耗时收集细胞,然后针对MCR基因进行RT-qPCR。

本实施例中使用的RT-qPCR方法如下。在靶菌株的指数生长期间提取RNA后,使用RNA作为模板产生cDNA。合成对靶基因和管家基因(用作参考基因)中的每一个特异的寡聚物,并使用该寡聚物进行qPCR。本实验中使用的基因为ALG9,使用引物扩增的片段大小为147±3bp。下表4示出了实验中使用的qPCR引物和以下实施例中使用的引物。

[表4]用于qPCR的引物

结果,如图3所示,证实了在使用耐酸菌株YBC构建的重组菌株中表达了MCR基因(MCRsa1和MCRsa2)。分析了使用酿酒酵母的启动子和YBC菌株的启动子(1kb)表达的基因的水平,结果表明所述基因的表达水平与qPCR中的参考基因的表达水平相比并不高或特别低。另外,已证实使用源自YBC菌株的1-kb FBA启动子(YBC FBA1p)表达的MCRsa2的水平(图3B中的YBC-1413)低于使用ScTEF1p启动子表达的MCRsa2的水平。

此外,还对与3-HP产生相关的其他基因即BDHcm基因、HPDHec基因和EUTEdz基因在包含ScTEF1p启动子的重组菌株YBC-061、YBC-062、YBC-067和YBC-068中的表达进行了分析。

结果,如图4所示,证实了与MCR基因相似,使用ScTEF1p启动子表达的这些基因的表达水平低于使用YBC菌株的内源启动子FBA1p和酿酒酵母来源的启动子(TEF1)表达的基因的表达水平。

此外,重组菌株的3-HP产量也很低,包含两个拷贝的基因的重组菌株(其中三个基因(MCRsa2、HPDH和EUTE)的表达水平都增加了)的3-HP产量远远低于YBC-1178菌株的3-HP产量。

实施例2:通过常规启动子表达的MCR基因和相关基因的3-HP产量的分析

分析了实施例1中构建的重组菌株的3-HP产量。

首先,在250rpm和30℃下在摇瓶中在25mL的YPD培养基(20g/L蛋白胨,10g/L酵母提取物和20g/L葡萄糖)中培养每个重组菌株,并添加15μM的浅蓝菌素(Sigma-Aldrich,美国)。浅蓝菌素的功能是通过抑制从胞质乙酰辅酶A羧化为丙二酰辅酶A的脂质合成来促进3-HP的产生。在上述培养条件下培养每种重组菌株直至葡萄糖完全消耗后,测量细胞密度,并分析培养基中包括3-HP在内的主要代谢产物的产生量。另外,还针对特定条件在改变的浓度、培养基和培养条件下进行培养,但是没有进行具体描述。

为了分析细胞培养物上清液中的3-HP,使用Waters Alliance e2695 HPLC系统(沃特世公司,米尔福德,美国)以10μl的进样量分析培养物上清液样品。在HPLC中,将与快速酸分析柱(100mm×7.8mm)(Bio-Rad,美国)相连的Aminex HPX-87H有机酸柱(300mm×7.8mm)(Bio-Rad,美国)用于固定相。该柱保持在+55℃,并且使用5.0mM H2SO4(Merck KgaA,德国)作为洗脱剂,流速为0.3ml/分钟或0.5ml/分钟。

为了检测3-羟基丙酸、葡萄糖、乙酸、琥珀酸、丙酮酸、甘油和乙醇,使用了Waters2489双波长紫外光(210nm)检测器(沃特世公司,米尔福德,美国)和Waters 2414示差折光仪(沃特世公司,米尔福德,美国)。

结果,如下表5所示,证实了所有重组菌株均显示出较低的3-HP产率。由这种较低的产率,可以确定主要基因,特别是MCR的表达效率对3-HP的产生有很大影响。

[表5]重组YBC菌株中3-HP的产生

实施例3:酿酒酵母中MCR基因的表达效率分析

为了比较MCR基因和相关基因在基因信息和基因工具均已良好建立的酿酒酵母菌株中的表达效率,采用实施例1所述的RT-qPCR方法,分析了产生3-HP的基因,特别是表达效率低的MCR基因的表达水平。

结果,如图5所示,证实了即使在包含酿酒酵母的内源性启动子的重组菌株中,MCRsa2基因的表达水平也很低。因此,证实了有必要选择能够增加MCR基因表达的新型启动子。

实施例4:YBC菌株中产醇基因的表达分析

在本实施例中,为了选择能够增加YBC菌株中外源基因表达的启动子,使用调控YBC菌株自身中具有高表达效率的基因的表达的启动子,并且用待表达的外源基因替换该基因。

从在葡萄糖存在下强烈表达的与糖酵解和乙醇产生相关的基因中,选择了当被其他基因取代时高效且不影响生长的基因,并以调控ADH(醇脱氢酶)基因表达的启动子为靶标。

特别是,为了不直接影响微生物的生长,应消除糖酵解相关的基因。如果糖酵解相关的基因缺失或失活,那对微生物生长起重要作用的丙酮酸的产生就会受到抑制,或者链反应的平衡会出现问题,从而对微生物的生长特性产生不利影响,导致发酵能力下降。因此,当靶菌株是产乙醇菌株时,选择PDC(丙酮酸脱氢酶复合物)基因或ADH基因作为要被替换的内源基因,并且PDC用作在靶菌株中产生靶化合物的重要途径。因此,选择ADH基因作为要被缺失的基因。

具有较强乙醇发酵能力的菌株,例如酵母,具有拥有多种强度和功能的ADH。为了鉴定酵母ADH中主要的产乙醇ADH并选择和使用相应的启动子,通过比较YBC菌株的基因组信息与酿酒酵母的ADH基因的已知信息,鉴定了几种候选基因,并进行了qPCR。

利用来自酿酒酵母全基因组序列数据的生物信息学的信息选择了7个ADH基因候选物(参见表6),设计对所选基因特异的寡聚物并进行RT-qPCR(引物序列见表4)。

[表6]

*与酿酒酵母基因组相比,YBC中具有相似基因序列的基因

结果,如图6所示,证实了g4423基因的表达水平明显较高。

构建了去除了g4423基因的菌株(YBC-1563)。基于关于g4423和UTR的信息,构建了一个类似于图1(a)的基因盒,从中去除了g4423 ORF,并且该基因盒具有5’UTR和3’UTR以及抗生素标记。该构建的基因盒用作供体DNA。为了构建供体DNA,使用如上所述的使用限制酶的克隆方法并使用吉布森组装法。引入所构建的供体DNA,并使用ORF引物(正向引物(SEQID NO:72):GAGATAGCACACCATTCACCA,反向引物(SEQ ID NO:73):CAACGTT72AAGTACTCTGGTGTTTG)分析与标记基因相对应的平板中生长的菌落用于鉴别g4423。结果,确认除去了ORF。

将菌株用50ml培养基(含有40g/L葡萄糖)在250ml烧瓶中在30℃和250rpm下以起始OD值为0.7进行培养,直到糖和乙醇被完全消耗光。然后,分析葡萄糖消耗量和乙醇产量。结果,证实乙醇产量减少了50%以上(图7)。

实施例5:通过用MCR基因替换g4423基因而构建的YBC重组体的表达水平的分析

为了利用实施例4中鉴定的g4423基因的较强的表达能力,通过用MCRsa1基因替换YBC菌株的基因组中的g4423基因来构建重组菌株YBC-1684,并分析了MCRsa1基因的表达水平。基于关于g4423和UTR的信息,构建了图1(b)的基因盒,从中去除了g4423 ORF,并且该基因盒具有5’UTR和3’UTR以及抗生素标记。另外,将针对酵母密码子用法而优化的MCRsa1序列引入g4423的ORF位点。所构建的基因盒用作供体DNA。为了构建供体DNA,使用如上所述的使用限制酶的克隆方法并使用吉布森组装法。供体DNA中使用的质粒(pSK863)如SEQ IDNO:7所示。

所构建的盒中的供体DNA被扩增并引入到YBC菌株中。使用以下引物分析生长的菌落,以鉴定g4423 ORF。结果,证实去除了g4423 ORF并且存在MCRsa1 ORF,这表明引入了MCRsa1。

用于分析的正向引物(SEQ ID NO:74):ATGAGAAGAACTTTGAAGGCTG,

反向引物(SEQ ID NO:75):TTACTTAGGGATGTAACCCTTTTCGA。

将菌株用50ml培养基(含有40g/L葡萄糖)在250ml烧瓶中于30℃和250rpm下以起始OD值为0.7进行培养,直到糖和乙醇被完全消耗光。然后,分析了3-HP的量以及产生的糖和乙醇的量。在与实施例1相同的条件下进行用于分析基因表达水平的RT-qPCR,并在对数生长期间对培养基进行采样。下表7示出了构建的重组YBC菌株的具体基因型。

[表7]通过用MCRsa1基因替换g4423基因而构建的重组YBC菌株

结果,如图8所示,证实了所构建的重组菌株中MCRsa1基因的表达水平与g4423基因的表达水平相似,并且远高于包含TEF1启动子(源自酿酒酵母的强启动子)的菌株(对照YBC-061)中的表达水平。

将G4423的启动子与过去使用的源自酿酒酵母的各种ADH同工酶的启动子进行比较,并且通过比较同源性,发现同源性非常低(表8)。进行了G4423的启动子和源自酿酒酵母的各种常规ADH同工酶的启动子之间的同源性比较,结果可以看出同源性非常低(表8)。

[表8]g4423启动子区域和酿酒酵母ADH启动子区域之间的同源性比较

实施例6:在用MCRsa1基因替换g4423基因而构建的重组菌株中产生3-HP

对实施例5中证实具有增高的MCR基因表达水平的重组YBC-1684中3-HP的产生量进行分析。

与实施例2的表3中的结果进行比较。如上表3所示,当使用scTEF启动子或FBA启动子表达与3-HP产生有关的三个核心基因时,在烧瓶培养物中产生了约1-16mg/L的3-HP。

另外,对重组菌株YBC-1684中以及通过将3-HP产生相关的基因插入g4423位点被表达的MCRsa1取代的YBC-1684菌株而构建的菌株中的3-HP的产生量进行了分析。

将每种菌株在30℃下在烧瓶中用补充有4%葡萄糖和15μM浅蓝菌素的YP培养基(20g/L蛋白胨和10g/L酵母提取物)进行培养,并在第5天当糖完全消耗光时,对培养基进行取样并分析3-HP的产生。

结果,如下表9所示,仅将MCRsa1基因插入g4423位点的YBC-1684菌株产生了200mg/L的3-HP,而将3-HP产生相关的基因(HiBADH基因和EUTE基因)额外插入g4423位点的菌株产生了146mg/L-710mg/L的3-HP,3-HP的产量在菌落之间是不同的。因此,可以确认该菌株中3-HP的产量明显高于相应基因由scTEF启动子或FBA启动子表达的重组菌株中3-HP的产量。

[表9]

从这些结果可以证实,g4423启动子增加了MCRsa1基因的表达对3-HP产量的增加具有很大的影响。由此可见,如果通过g4423启动子增加与靶化合物有关的基因的表达,则靶化合物的产量会增加。

实施例7:g4423启动子的迁移性分析

将YBC菌株的基因组DNA中的G4423启动子和终止子区域切割成1kb的长度,并分析了用于产生3-HP的MCRsa1基因的表达水平。根据有关YBC菌株基因组中g4423和UTR的信息,使用引物扩增g4423的5’UTR区域的1kb区并进行提取,然后使用上述表2的oSK-1412至oSK1419引物进行扩增,因此获得针对酵母密码子用法而优化的带有g4423的启动子的MCRsa1片段。将获得的片段引入能够表达多个基因的图1(e)的盒中,所用质粒(pSK-865)如SEQ ID NO:8所示。将供体DNA盒扩增、纯化并引入YBC中,并分析生长的菌落的基因型。

证实了通过上述方法得到的重组菌株YBC-1693中MCRsa1的表达水平降低,如使用YBC的启动子(FBA)或酿酒酵母的TEF1p启动子时一样(图9)。因此,推测YBC耐酸菌株的启动子作用需要更长的片段或具有即使在很长的距离内也起作用的机制(增强子或沉默子)或由多种因素组合起作用的机制。需要进行其他研究才能准确阐明这些机制。

当用靶基因替换g4423基因时,可以获得两种效果:可以强烈表达靶基因,并且除去与乙醇产生相关的g4423基因。因此,可以有效地完成使用该菌株产生各种化合物的研究目的。

实施例8:由g4423启动子表达LDH基因

在本实施例中,构建了重组YBC菌株,其中除MCR基因外还用与乳酸产生相关的LDH(乳酸脱氢酶)基因来取代g4423基因。分析了所构建菌株的乳酸产率。

构建重组菌株,以使由g4423启动子表达三个代表性基因(源自瑞士乳杆菌(L.helveticus)的LDH、源自米根霉(R.oryzae)的LDH、源自植物乳杆菌(L.plantarum)的LDH)。

基于关于g4423和UTR的信息,构建了类似于图1(e)中所示的基因盒,该基因盒中除去了g4423 ORF并且该基因盒具有5’UTR和3’UTR以及抗生素标记。基于来自NCBI的三个基因的信息,合成了针对酵母密码子用法而优化的序列,然后将该序列使用限制酶(ApaI和SacI)引入盒中。扩增完成的盒中的供体DNA,并将其引入YBC菌株。使用以下引物分析生长的菌落,以鉴定g4423 ORF,结果,确认除去了g4423 ORF的一个等位基因,并引入了每个LDH基因。

瑞士乳杆菌正向引物(SEQ ID NO:76):ATGAAAATTTTTGCTTATGG;

瑞士乳杆菌反向引物(SEQ ID NO:77):TTAATATTCAACAGCAATAG;

米根霉正向引物(SEQ ID NO:78):ATGGTTTTGCATTCTAAAGT;

米根霉反向引物(SEQ ID NO:79):TTAACAAGAAGATTTAGAAA;

植物乳杆菌正向引物(SEQ ID NO:80):ATGTCTTCTATGCCAAATCA;

植物乳杆菌反向引物(SEQ ID NO:81):TTATTTATTTTCCAATTCAG

将构建的重组菌株用补充有4%葡萄糖和150mg/L尿嘧啶的YP(20g/L蛋白胨和10g/L酵母提取物)培养基在30℃和100rpm下振荡培养24小时。

通过HPLC分析培养基中的乳酸和乙醇。使用装有Waters 1525Binary HPLC泵的Bio-Rad Aminex 87-H色谱柱分析培养基中葡萄糖、乙醇和L-乳酸的浓度。使用Waters2414折射率检测器分析葡萄糖和乙醇,并使用Waters 2489紫外光/可见光检测器(210nm)分析L-乳酸。使用根据每种组分的浓度绘制的标准曲线的峰面积来计算每种组分的浓度,并且用于分析的具体条件如下。

1.流动相条件:0.005M H2SO4溶液

2.流速:0.6mL/分钟

3.运行时间:40分钟

4.柱箱温度:60℃

5.检测器温度:40℃

6.进样量:10μL

7.自动采样器托盘温度:4℃

结果如图10所示,证实了替换的靶基因表现出LDH活性,从而产生了乳酸。

[保藏信息]

保藏机构名称:韩国生物科学与生物技术研究所

登记号:KCTC13508BP

保藏日期:2018年4月11日

工业适用性

当使用根据本发明的新型启动子在耐有机酸的酵母中表达与有机酸产生有关的靶基因时,具有的优点在于,该酵母可以在对有机酸具有耐性、该酵母的生长能力不受抑制的同时高效产生有机酸。

尽管已经参考特定特征详细描述了本发明,但是对于本领域技术人员而言显而易见的是,所描述的仅是本发明的优选实施方案,并且不限制本发明的范围。因此,本发明的实质范围将由所附权利要求及其等同物来限定。

序列表自由文本

随附电子文件

<110> SK新技术株式会社

<120> 源自耐有机酸的酵母的新型启动子及使用其表达靶基因的方法

<130> PP-B2157

<150> KR 10-2018-0044508

<151> 2018-04-17

<160> 81

<170> KopatentIn 2.0

<210> 1

<211> 988

<212> DNA

<213> 人工序列

<220>

<223> g4423启动子区域等位基因 1

<400> 1

gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaatacgca 60

cagaatgaac atctgattga ttaatattta tatattactt agtggcaccc ctacaaacaa 120

accaattttg aatatttctc accatcatga tatttattta gggcaagaat ttcatgtaca 180

tacgtgcgtg tactgcatag ttttgttata tgtaaataac cagcaatata tcaccaatga 240

taaatgctca gtaatttatt tggaaccaaa atagtttcag taatcaaata atacaataac 300

taacaagtgc tgattataca acagctgtta acaacacaaa cacgctctct tctattctct 360

tccctgcttg ttcgtgtggt atattcccga atttgcaatt tagaaattat attttttaaa 420

agaattgttc tccattttct ggtagtcgta agtggcaaat tggatcataa gacacaatct 480

tgttagttcg actgctaaca ccagacaaga ccgaacgaaa acagaaaaaa aagataattt 540

tgttattctg ttcaattctc tctctctttt taaggtatct ttacattaca ttacatatcc 600

caaattacaa caagagcaag aaatgaagca caacaacacg ccatctttcg tgattatttt 660

atcatttcta tatcgtaact aaattaacaa atgctatgtt tcttaatttt taatgataaa 720

tctaactgct accttaattt ctcatggaaa gtggcaaata cagaaattat atattcttat 780

tcattttctt ataattttta tcaattacca aatatatata aatgcaatta attgattgtt 840

cctgtcacat aatttttttt gtttgttacc tttattcttt atccatttag tttagttctt 900

atatctttct tttctatttc tctttttcgt ttaatctcac cgtacacata tatatccata 960

tatcaataca aataaaaatc atttaaaa 988

<210> 2

<211> 961

<212> DNA

<213> 人工序列

<220>

<223> g4423启动子区域等位基因 2

<400> 2

gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaaatacgc 60

acagaatgaa catctgattg attaatattt atatattact cagtggcacc cctacaaaca 120

aaccaatttt gaatattgtt caccatcatg atatttattt agggcaagaa tttcatgtac 180

atacgtgcgt gtactgcata gttttgttat atgaaaataa ccagcaatat atcaccaatg 240

aataaattct caataattta tttggaacca aataatgcaa taactagcaa actaagtggt 300

gattatacaa cagctgttaa caacacaaac atacgctctc ttctattatc tcttccctgc 360

ttgttcgtgt ggtatattca cgaatttgca atttagaaat tatatttttt aaaagaattg 420

ttctccattt tctggtagtc gtaagtggca aattggatca taagacacaa tcttgttagt 480

tcgactgcta acaccagaca acaccgaacg aaaacaagaa aaaataatta ttctctctct 540

ttttaaggta tcttacatta catatcccaa attacaacaa gagcaagaaa tgaggcacaa 600

caacacacca tcatctttcg tgattatttt tatcatttct atcatgtaat taaattaaca 660

aatgttaagt ttattaattt ttaatgataa atctagttgc taccttaatt tctcatggaa 720

agtggcaaat actgaaatta tttaattcta ctttcatttt cttataattt ttatcaatta 780

ccaaatatat ataaatgcaa ttaattgatt gttcctgtca cataattttt tttgtttgtt 840

acctttattc tttatccatt taatttattt cttgtatctt tcttttctat ttctcttttc 900

tgtttaatct caccgtacac atatatatcc atatatcaat acaaataaaa atcatttaaa 960

a 961

<210> 3

<211> 1017

<212> DNA

<213> 人工序列

<220>

<223> g4423终止子区域等位基因1

<400> 3

taagtcattt aatttattct tttagaatat atttattttg tctttatttt tgaaatgtta 60

atagtctttt ttttttactt tgaacaaaaa aaagtaaaat taaaacttat cttatatacg 120

cttttaaaca ttaaactcgt taacgaatta tataatgatt ttatcgaact actttatgtt 180

tttttaatag aataatcttc tttattaata taacttacta cttcttaatc ttgttgtcct 240

ccattcgaaa ctcgagtgga acattttctg agtatctctc gcgtctgttc gtaccgtttt 300

tccaatttct ttcgggaaac ggaactggac gcattttatt tgactgttga aagggagatt 360

taatatttat atagcgagat ataacaacta acttataagt ttacacaggc tgttatcaca 420

tatatatata tatatcaaca gaggactagc tcactagact aacattagat atgtcgatgc 480

tgaaccgttt gtttggtgtt agatccattt cacaatgtgc tactcgttta caacgttcta 540

cagggacaaa tatatcagaa ggtccactaa gaattattcc acaattacaa actttctatt 600

ctgctaatcc aatgcatgat aacaatatcg acaagctaga aaatcttcta cgtaaatata 660

tcaagttacc aagtacaaac aatttattga agacacatgg gaatacatct acagaaattg 720

atccaacaaa attattacaa tcacaaaatt cttcacgtcc tttatggtta tcattcaagg 780

attatacagt gattggaggt ggttcacgtt taaaacctac tcaatacacg gaacttttat 840

ttctattgaa taaactacat agtatcgatc cacaattaat gaatgatgat attaagaacg 900

aattagctca ttattataag aatacttcac aggaaactaa taaagtcacc atccctaaat 960

tggatgaatt cggtagaagt attggaatcg gtagaaggaa atccgcaact gcaaaag 1017

<210> 4

<211> 1018

<212> DNA

<213> 人工序列

<220>

<223> g4423终止子区域等位基因2

<400> 4

taagtcattt aatttattct tttagaatat atttattttg tctttatttt tgaaatgtta 60

atagtctttt ttttactttg aaaaaaaaaa aaagtaaaat taaacttatc ttatatacgc 120

ttttaaacat taaactcgtt aacgaattat ataatgattt tatcgaacta ctttatgttt 180

ttttaataga ataatcttct ttattaatat aacttactac ttcttaatct tgttgtcctc 240

cattcgaaac tcgagaggaa caatttctga gtctctctcg caccctttcg tacgtaccgt 300

ttttccaatt tctttcggga aacggaactg gacgcatttt atttgactgt tgaaagggag 360

atttaatatt tatatagaga gatataacaa ctaacttata agtttataca ggctgttatc 420

acatatatat atatatcaac agaggactag ctcaatagaa taacattaga tatgtcgatg 480

ctgaaccgtt tgtttggtgt tagatccatt tcacaatgtg ctactcgttt acaacgttct 540

acagggacaa atatatcaga aggtccacta agaattattc cacaattaca aactttctat 600

tctgctaatc caatgcatga taacaatatc gacaagctag aaaatcttct acgtaaatat 660

atcaagttac caagtacaaa taacttattg aagacacatg ggaatacatc tacagaaatc 720

gatccaacaa aattattaca atcacaaaat tcttcacgtc ctttatggtt atcattcaag 780

gattatacag tgattggagg tggttcacgt ttaaaaccta ctcaatacac agaactttta 840

tttctattga ataaactaca tagtatcgat ccacaattaa tgaatgatga tattaagaac 900

gaattagctc attattataa gaatacttca caggaaacta ataaagtcac catccctaaa 960

ttggatgaat tcggtagaag tattggaatc ggtagaagga aatccgcaac tgcaaaag 1018

<210> 5

<211> 6402

<212> DNA

<213> 人工序列

<220>

<223> 包含质粒等位基因1的g4423缺失盒

<400> 5

cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 60

tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 120

tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 180

gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 240

gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 300

atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 360

atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 420

aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 480

gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540

agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600

ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgcctgcagg 660

gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaatacgca 720

cagaatgaac atctgattga ttaatattta tatattactt agtggcaccc ctacaaacaa 780

accaattttg aatatttctc accatcatga tatttattta gggcaagaat ttcatgtaca 840

tacgtgcgtg tactgcatag ttttgttata tgtaaataac cagcaatata tcaccaatga 900

taaatgctca gtaatttatt tggaaccaaa atagtttcag taatcaaata atacaataac 960

taacaagtgc tgattataca acagctgtta acaacacaaa cacgctctct tctattctct 1020

tccctgcttg ttcgtgtggt atattcccga atttgcaatt tagaaattat attttttaaa 1080

agaattgttc tccattttct ggtagtcgta agtggcaaat tggatcataa gacacaatct 1140

tgttagttcg actgctaaca ccagacaaga ccgaacgaaa acagaaaaaa aagataattt 1200

tgttattctg ttcaattctc tctctctttt taaggtatct ttacattaca ttacatatcc 1260

caaattacaa caagagcaag aaatgaagca caacaacacg ccatctttcg tgattatttt 1320

atcatttcta tatcgtaact aaattaacaa atgctatgtt tcttaatttt taatgataaa 1380

tctaactgct accttaattt ctcatggaaa gtggcaaata cagaaattat atattcttat 1440

tcattttctt ataattttta tcaattacca aatatatata aatgcaatta attgattgtt 1500

cctgtcacat aatttttttt gtttgttacc tttattcttt atccatttag tttagttctt 1560

atatctttct tttctatttc tctttttcgt ttaatctcac cgtacacata tatatccata 1620

tatcaataca aataaaaatc atttaaaagg gcccacgtcc gagggagctc tagtacctcg 1680

taccgttcgt ataatgtatg ctatacgaag ttatcatcca ggattctgtt tagcttgcct 1740

cgtccccgcc gggtcacccg gccagcgaca tggaggccca gaataccctc cttgacagtc 1800

ttgacgtgcg cagctcaggg gcatgatgtg actgtcgccc gtacatttag cccatacatc 1860

cccatgtata atcatttgca tccatacatt ttgatggccg cacggcgcga agcaaaaatt 1920

acggctcctc gctgcagacc tgcgagcagg gaaacgctcc cctcacagac gcgttgaatt 1980

gtccccacgc cgcgcccctg tagagaaata taaaaggtta ggatttgcca ctgaggttct 2040

tctttcatat acttcctttt aaaatcttgc taggatacag ttctcacatc acatccgaac 2100

ataaacaacc atgggtaagg aaaagactca cgtttcgagg ccgcgattaa attccaacat 2160

ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 2220

aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 2280

tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 2340

gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 2400

tgcgatcccc ggcaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa 2460

tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg 2520

tccttttaac agtgatcgcg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg 2580

tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 2640

gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt 2700

ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 2760

agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 2820

ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 2880

taaattgcag tttcatttga tgctcgatga gtttttctaa tcagtactga caataaaaag 2940

attcttgttt tcaagaactt gtcatttgta tagttttttt atattgtagt tgttctattt 3000

taatcaaatg ttagcgtgat ttatattttt tttcgcctcg acatcatctg cccagatgcg 3060

aagttaagtg cgcagaaagt aatatcatgc gtcaatcgta tgtgaatgct ggtcgctata 3120

ctgctgtcga ttcgatacta acgccgccat ccagtgtcga aaagtatcag caaataactt 3180

cgtataatgt atgctatacg aacggtagcg atcgctttgt ctttattttt gaaatgttaa 3240

tagtcttttt tttttacttt gaacaaaaaa aagtaaaatt aaaacttatc ttatatacgc 3300

ttttaaacat taaactcgtt aacgaattat ataatgattt tatcgaacta ctttatgttt 3360

ttttaataga ataatcttct ttattaatat aacttactac ttcttaatct tgttgtcctc 3420

cattcgaaac tcgagtggaa cattttctga gtatctctcg cgtctgttcg taccgttttt 3480

ccaatttctt tcgggaaacg gaactggacg cattttattt gactgttgaa agggagattt 3540

aatatttata tagcgagata taacaactaa cttataagtt tacacaggct gttatcacat 3600

atatatatat atatcaacag aggactagct cactagacta acattagata tgtcgatgct 3660

gaaccgtttg tttggtgtta gatccatttc acaatgtgct actcgtttac aacgttctac 3720

agggacaaat atatcagaag gtccactaag aattattcca caattacaaa ctttctattc 3780

tgctaatcca atgcatgata acaatatcga caagctagaa aatcttctac gtaaatatat 3840

caagttacca agtacaaaca atttattgaa gacacatggg aatacatcta cagaaattga 3900

tccaacaaaa ttattacaat cacaaaattc ttcacgtcct ttatggttat cattcaagga 3960

ttatacagtg attggaggtg gttcacgttt aaaacctact caatacacgg aacttttatt 4020

tctattgaat aaactacata gtatcgatcc acaattaatg aatgatgata ttaagaacga 4080

attagctcat tattataaga atacttcaca ggaaactaat aaagtcacca tccctaaatt 4140

ggatgaattc ggtagaagta ttggaatcgg tagaaggaaa tccgcaactg caaaagggcg 4200

cgcccagctt ttgttccctt tagtgagggt taatttcgag cttggcgtaa tcatggtcat 4260

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 4320

gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 4380

gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 4440

aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 4500

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 4560

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 4620

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 4680

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 4740

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 4800

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 4860

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 4920

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 4980

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 5040

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 5100

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 5160

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 5220

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 5280

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 5340

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 5400

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 5460

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 5520

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 5580

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 5640

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 5700

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 5760

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 5820

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 5880

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 5940

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 6000

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 6060

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 6120

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 6180

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 6240

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 6300

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 6360

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gc 6402

<210> 6

<211> 6376

<212> DNA

<213> 人工序列

<220>

<223> 包含质粒等位基因2的g4423缺失盒

<400> 6

cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 60

tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 120

tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 180

gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 240

gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 300

atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 360

atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 420

aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 480

gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540

agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600

ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgcctgcagg 660

gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaaatacgc 720

acagaatgaa catctgattg attaatattt atatattact cagtggcacc cctacaaaca 780

aaccaatttt gaatattgtt caccatcatg atatttattt agggcaagaa tttcatgtac 840

atacgtgcgt gtactgcata gttttgttat atgaaaataa ccagcaatat atcaccaatg 900

aataaattct caataattta tttggaacca aataatgcaa taactagcaa actaagtggt 960

gattatacaa cagctgttaa caacacaaac atacgctctc ttctattatc tcttccctgc 1020

ttgttcgtgt ggtatattca cgaatttgca atttagaaat tatatttttt aaaagaattg 1080

ttctccattt tctggtagtc gtaagtggca aattggatca taagacacaa tcttgttagt 1140

tcgactgcta acaccagaca acaccgaacg aaaacaagaa aaaataatta ttctctctct 1200

ttttaaggta tcttacatta catatcccaa attacaacaa gagcaagaaa tgaggcacaa 1260

caacacacca tcatctttcg tgattatttt tatcatttct atcatgtaat taaattaaca 1320

aatgttaagt ttattaattt ttaatgataa atctagttgc taccttaatt tctcatggaa 1380

agtggcaaat actgaaatta tttaattcta ctttcatttt cttataattt ttatcaatta 1440

ccaaatatat ataaatgcaa ttaattgatt gttcctgtca cataattttt tttgtttgtt 1500

acctttattc tttatccatt taatttattt cttgtatctt tcttttctat ttctcttttc 1560

tgtttaatct caccgtacac atatatatcc atatatcaat acaaataaaa atcatttaaa 1620

agggcccacg tccgagggag ctctagtacc tcgtaccgtt cgtataatgt atgctatacg 1680

aagttatcat ccaggattct gtttagcttg cctcgtcccc gccgggtcac ccggccagcg 1740

acatggaggc ccagaatacc ctccttgaca gtcttgacgt gcgcagctca ggggcatgat 1800

gtgactgtcg cccgtacatt tagcccatac atccccatgt ataatcattt gcatccatac 1860

attttgatgg ccgcacggcg cgaagcaaaa attacggctc ctcgctgcag acctgcgagc 1920

agggaaacgc tcccctcaca gacgcgttga attgtcccca cgccgcgccc ctgtagagaa 1980

atataaaagg ttaggatttg ccactgaggt tcttctttca tatacttcct tttaaaatct 2040

tgctaggata cagttctcac atcacatccg aacataaaca accatgggta aggaaaagac 2100

tcacgtttcg aggccgcgat taaattccaa catggatgct gatttatatg ggtataaatg 2160

ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg ggaagcccga 2220

tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg ttacagatga 2280

gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca agcattttat 2340

ccgtactcct gatgatgcat ggttactcac cactgcgatc cccggcaaaa cagcattcca 2400

ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg cagtgttcct 2460

gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagtgatc gcgtatttcg 2520

tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg attttgatga 2580

cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataagc ttttgccatt 2640

ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta tttttgacga 2700

ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc gataccagga 2760

tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga aacggctttt 2820

tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt tgatgctcga 2880

tgagtttttc taatcagtac tgacaataaa aagattcttg ttttcaagaa cttgtcattt 2940

gtatagtttt tttatattgt agttgttcta ttttaatcaa atgttagcgt gatttatatt 3000

ttttttcgcc tcgacatcat ctgcccagat gcgaagttaa gtgcgcagaa agtaatatca 3060

tgcgtcaatc gtatgtgaat gctggtcgct atactgctgt cgattcgata ctaacgccgc 3120

catccagtgt cgaaaagtat cagcaaataa cttcgtataa tgtatgctat acgaacggta 3180

gcgatcgctt tgtctttatt tttgaaatgt taatagtctt ttttttactt tgaaaaaaaa 3240

aaaaagtaaa attaaactta tcttatatac gcttttaaac attaaactcg ttaacgaatt 3300

atataatgat tttatcgaac tactttatgt ttttttaata gaataatctt ctttattaat 3360

ataacttact acttcttaat cttgttgtcc tccattcgaa actcgagagg aacaatttct 3420

gagtctctct cgcacccttt cgtacgtacc gtttttccaa tttctttcgg gaaacggaac 3480

tggacgcatt ttatttgact gttgaaaggg agatttaata tttatataga gagatataac 3540

aactaactta taagtttata caggctgtta tcacatatat atatatatca acagaggact 3600

agctcaatag aataacatta gatatgtcga tgctgaaccg tttgtttggt gttagatcca 3660

tttcacaatg tgctactcgt ttacaacgtt ctacagggac aaatatatca gaaggtccac 3720

taagaattat tccacaatta caaactttct attctgctaa tccaatgcat gataacaata 3780

tcgacaagct agaaaatctt ctacgtaaat atatcaagtt accaagtaca aataacttat 3840

tgaagacaca tgggaataca tctacagaaa tcgatccaac aaaattatta caatcacaaa 3900

attcttcacg tcctttatgg ttatcattca aggattatac agtgattgga ggtggttcac 3960

gtttaaaacc tactcaatac acagaacttt tatttctatt gaataaacta catagtatcg 4020

atccacaatt aatgaatgat gatattaaga acgaattagc tcattattat aagaatactt 4080

cacaggaaac taataaagtc accatcccta aattggatga attcggtaga agtattggaa 4140

tcggtagaag gaaatccgca actgcaaaag ggcgcgccca gcttttgttc cctttagtga 4200

gggttaattt cgagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 4260

ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 4320

taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 4380

aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 4440

attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 4500

cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 4560

gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 4620

ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 4680

agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 4740

tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 4800

ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 4860

gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 4920

ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 4980

gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 5040

aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 5100

aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 5160

ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 5220

gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 5280

gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 5340

tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 5400

ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 5460

ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 5520

atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 5580

ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 5640

tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 5700

attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 5760

tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 5820

ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 5880

gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 5940

gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 6000

gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 6060

aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 6120

taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 6180

tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 6240

tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 6300

atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 6360

tttccccgaa aagtgc 6376

<210> 7

<211> 5942

<212> DNA

<213> 人工序列

<220>

<223> pSK863

<400> 7

cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 60

tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 120

tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 180

gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 240

gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 300

atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 360

atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 420

aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 480

gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540

agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600

ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgcctgcagg 660

gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaatacgca 720

cagaatgaac atctgattga ttaatattta tatattactt agtggcaccc ctacaaacaa 780

accaattttg aatatttctc accatcatga tatttattta gggcaagaat ttcatgtaca 840

tacgtgcgtg tactgcatag ttttgttata tgtaaataac cagcaatata tcaccaatga 900

taaatgctca gtaatttatt tggaaccaaa atagtttcag taatcaaata atacaataac 960

taacaagtgc tgattataca acagctgtta acaacacaaa cacgctctct tctattctct 1020

tccctgcttg ttcgtgtggt atattcccga atttgcaatt tagaaattat attttttaaa 1080

agaattgttc tccattttct ggtagtcgta agtggcaaat tggatcataa gacacaatct 1140

tgttagttcg actgctaaca ccagacaaga ccgaacgaaa acagaaaaaa aagataattt 1200

tgttattctg ttcaattctc tctctctttt taaggtatct ttacattaca ttacatatcc 1260

caaattacaa caagagcaag aaatgaagca caacaacacg ccatctttcg tgattatttt 1320

atcatttcta tatcgtaact aaattaacaa atgctatgtt tcttaatttt taatgataaa 1380

tctaactgct accttaattt ctcatggaaa gtggcaaata cagaaattat atattcttat 1440

tcattttctt ataattttta tcaattacca aatatatata aatgcaatta attgattgtt 1500

cctgtcacat aatttttttt gtttgttacc tttattcttt atccatttag tttagttctt 1560

atatctttct tttctatttc tctttttcgt ttaatctcac cgtacacata tatatccata 1620

tatcaataca aataaaaatc atttaaaaat gagaagaact ttgaaggctg ccattttagg 1680

tgctacaggt ttagtcggta ttgaatacgt cagaatgtta tcacaacacc catatattaa 1740

acctgcttat ttggctggta aaggttctgt tggtaaagct tactcagaag ttgtcagatg 1800

gcaaacagtt ggtcaagtcc caaaggaagt agccgatatg ccagttttgc ctaccgacgt 1860

caatgaaatc aaaaaggctg gtgtagatat tgttttctct ccattacctc aaggtgctgc 1920

aggtccagtt gaagaagaat ttgcaaaagc cggtttccct gtcatttcta attcaccaga 1980

tcatagattc gatccagacg tacctttgat gatacctgaa gttaacggtc acactgcatc 2040

cttaattgat gaacaaaaga aaagaagaga ctggagtggt tttattgtta ctacaccatt 2100

gtgtacagca caaggtattg ccataccatt agctcctatc tatagagatt tcagagttga 2160

ttctgtattc ataaccacta tgcaatcctt gagtggtgaa ggttatcctg gtgttgcttc 2220

attggatgta gttgacaaca tcaaggtttt gggtgacgct tacgacgcta aaactgttaa 2280

ggaagtcaca agaattttat ctgaagttaa gagaaacgtc ccaggtacta tggatgaatt 2340

gactttatca gcaacaaccc atagaatagc caccattcat ggtcactacg aagtaatgta 2400

cgttactttt aaagaagatg tcaaggtaga aaaggttaag gaaactttgg ctaacttcaa 2460

aggtgaacct caagatatga agttaccaac agcaccttcc agaccaatct tgattaccga 2520

attagataac agaccacaac cttacttcga tagatgggca ggtgacgttc caggtatgtc 2580

cgtcgtagtt ggtagattaa agcaagttaa caacagaact gttagattgg tttctttgat 2640

ccataacaca gtcagaggtg ccgctggtgg tggtattttg gtagccgaat atttgatcga 2700

aaagggttac atccctaagt gagtcattta atttattctt ttagaatata attattttgt 2760

ctttattttt gaaatgttaa tagtcttttt tttttacttt gaacaaaaaa aagtaaaatt 2820

aaaacttatc ttatatacgc ttttaaacat taaactcgtt aacgaattat ataatgattt 2880

tatcgaacta ctttatgttt ttttaataga ataatcttct ttattaatat aacttactac 2940

ttcttaatct tgttgtcctc cattcgaaac tcgagtggaa cattttctga gtatctctcg 3000

cgtctgttcg taccgttttt ccaatttctt tcgggaaacg gaactggacg cattttattt 3060

gactgttgaa agggagattt aatatttata tagcgagata taacaactaa cttataagtt 3120

tacacaggct gttatcacat atatatatat atatcaacag aggactagct cactagacta 3180

acattagata tgtcgatgct gaaccgtttg tttggtgtta gatccatttc acaatgtgct 3240

actcgtttac aacgttctac agggacaaat atatcagaag gtccactaag aattattcca 3300

caattacaaa ctttctattc tgctaatcca atgcatgata acaatatcga caagctagaa 3360

aatcttctac gtaaatatat caagttacca agtacaaaca atttattgaa gacacatggg 3420

aatacatcta cagaaattga tccaacaaaa ttattacaat cacaaaattc ttcacgtcct 3480

ttatggttat cattcaagga ttatacagtg attggaggtg gttcacgttt aaaacctact 3540

caatacacgg aacttttatt tctattgaat aaactacata gtatcgatcc acaattaatg 3600

aatgatgata ttaagaacga attagctcat tattataaga atacttcaca ggaaactaat 3660

aaagtcacca tccctaaatt ggatgaattc ggtagaagta ttggaatcgg tagaaggaaa 3720

tccgcaactg caaaagggcg cgcccagctt ttgttccctt tagtgagggt taatttcgag 3780

cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 3840

acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 3900

actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 3960

gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 4020

cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 4080

tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 4140

gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 4200

ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 4260

aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 4320

tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 4380

ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 4440

gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 4500

tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 4560

caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 4620

ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 4680

cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 4740

ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 4800

cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 4860

gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 4920

aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 4980

acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 5040

gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 5100

cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 5160

cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 5220

tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 5280

cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 5340

gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 5400

cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 5460

ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 5520

gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 5580

taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 5640

gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 5700

acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 5760

aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 5820

cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 5880

atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 5940

gc 5942

<210> 8

<211> 11693

<212> DNA

<213> 人工序列

<220>

<223> pSK-865

<400> 8

cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 60

tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 120

tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 180

gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 240

gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 300

atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 360

atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 420

aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 480

gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540

agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600

ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgcctgcagg 660

agagttacgt gatcagaatg ggaaattatt accacctcca cctggattcg aattcagcac 720

ttcctttgaa tcgaagctaa caccagagga gataaatatg aattctttac caatggaacc 780

acctaattat tcagataatg aaagtacata tgcatttaaa tttcatccaa gagattcatt 840

atcaagcaat acaggtagaa ccatcccaat tgtaggaagt agcaaaagat tagacaatag 900

gatcctggta ggaagtagca gcaaccgttt aaggaattcc ccagatgata aagacgacta 960

cgatttcgat gatgacgacg attgcgacta cgatgaatat gatatccccg aggatgatga 1020

tgacgacaac aacgataata tccatgatat ccacgatatc gagaccgatg aagacgacga 1080

agagatcaca gatgaaatgg cacacatgat ctcccatcag tgatcttata taaatataca 1140

agataatata tatatatatg taacatctaa agacagatac ccgatcgtct tccttattct 1200

tccaaaggac tctgaagttg gcccgaaatt agcaccgaaa tcgggaacaa ccaacacggc 1260

gacacccgtg gagcgactgc gcgggaaaca ggagtggcct gacagacagc gacaacaata 1320

tgccatttct gcgtatcgga gtcgtcgttg atagcggggg gtgggcagac agaaagagaa 1380

aagcgggcga catcaattcc ggcggtggag gggggagtca tcccatgttt tgtcattatt 1440

attatataaa gtagatatga ctgataaaga tttgttgggt atgctttttt gaactaactt 1500

ataaacatat tatatattac aacacggttc aatataacaa ggactgttga gtgagataac 1560

attaaattcg ggcccgttaa ctcagttttc tctctttccc tccaccccac gttactctgc 1620

gaacaaaaat acgcacagaa tgaacatctg attgattaat atttatatat tacttagtgg 1680

cacccctaca aacaaaccaa ttttgaatat ttctcaccat catgatattt atttagggca 1740

agaatttcat gtacatacgt gcgtgtactg catagttttg ttatatgtaa ataaccagca 1800

atatatcacc aatgataaat gctcagtaat ttatttggaa ccaaaatagt ttcagtaatc 1860

aaataataca ataactaaca agtgctgatt atacaacagc tgttaacaac acaaacacgc 1920

tctcttctat tctcttccct gcttgttcgt gtggtatatt cccgaatttg caatttagaa 1980

attatatttt ttaaaagaat tgttctccat tttctggtag tcgtaagtgg caaattggat 2040

cataagacac aatcttgtta gttcgactgc taacaccaga caagaccgaa cgaaaacaga 2100

aaaaaaagat aattttgtta ttctgttcaa ttctctctct ctttttaagg tatctttaca 2160

ttacattaca tatcccaaat tacaacaaga gcaagaaatg aagcacaaca acacgccatc 2220

tttcgtgatt attttatcat ttctatatcg taactaaatt aacaaatgct atgtttctta 2280

atttttaatg ataaatctaa ctgctacctt aatttctcat ggaaagtggc aaatacagaa 2340

attatatatt cttattcatt ttcttataat ttttatcaat taccaaatat atataaatgc 2400

aattaattga ttgttcctgt cacataattt tttttgtttg ttacctttat tctttatcca 2460

tttagtttag ttcttatatc tttcttttct atttctcttt ttcgtttaat ctcaccgtac 2520

acatatatat ccatatatca atacaaataa aaatcattta aaagtcgaca acaaaatgag 2580

aagaactttg aaggctgcca ttttaggtgc tacaggttta gtcggtattg aatacgtcag 2640

aatgttatca caacacccat atattaaacc tgcttatttg gctggtaaag gttctgttgg 2700

taaagcttac tcagaagttg tcagatggca aacagttggt caagtcccaa aggaagtagc 2760

cgatatgcca gttttgccta ccgacgtcaa tgaaatcaaa aaggctggtg tagatattgt 2820

tttctctcca ttacctcaag gtgctgcagg tccagttgaa gaagaatttg caaaagccgg 2880

tttccctgtc atttctaatt caccagatca tagattcgat ccagacgtac ctttgatgat 2940

acctgaagtt aacggtcaca ctgcatcctt aattgatgaa caaaagaaaa gaagagactg 3000

gagtggtttt attgttacta caccattgtg tacagcacaa ggtattgcca taccattagc 3060

tcctatctat agagatttca gagttgattc tgtattcata accactatgc aatccttgag 3120

tggtgaaggt tatcctggtg ttgcttcatt ggatgtagtt gacaacatca aggttttggg 3180

tgacgcttac gacgctaaaa ctgttaagga agtcacaaga attttatctg aagttaagag 3240

aaacgtccca ggtactatgg atgaattgac tttatcagca acaacccata gaatagccac 3300

cattcatggt cactacgaag taatgtacgt tacttttaaa gaagatgtca aggtagaaaa 3360

ggttaaggaa actttggcta acttcaaagg tgaacctcaa gatatgaagt taccaacagc 3420

accttccaga ccaatcttga ttaccgaatt agataacaga ccacaacctt acttcgatag 3480

atgggcaggt gacgttccag gtatgtccgt cgtagttggt agattaaagc aagttaacaa 3540

cagaactgtt agattggttt ctttgatcca taacacagtc agaggtgccg ctggtggtgg 3600

tattttggta gccgaatatt tgatcgaaaa gggttacatc cctaagtgaa tcgatggaga 3660

ttgataagac ttttctagtt gcatatcttt tatatttaaa tcttatctat tagttaattt 3720

tttgtaattt atccttatat atagtctggt tattctaaaa tatcatttca gtatctaaaa 3780

attcccctct tttttcagtt atatcttaac aggcgacagt ccaaatgttg atttatccca 3840

gtccgattca tcagggttgt gaagcatttt gtcaatggtc gaaatcacat cagtaatagt 3900

gcctcttact tgcctcatag aatttctttc tcttaacgtc accgtttggt cttttatagt 3960

ttcgaaatct atggtgatac caaatggtgt tcccaattca tcgttacggg cgtatttttt 4020

accaattgaa gtattggaat cgtcaatttt aaagtgaatt cgaataaaaa acacgctttt 4080

tcagttcgag tttatcatta tcaatactgc catttcaaag aatacgtaaa taattaatag 4140

tagtgatttt cctaacttta tttagtcaaa aaattagcct tttaattctg ctgtaacccg 4200

tacatgccca aaataggggg cgggttacac agaatatata acatcgtagg tgtctgggtg 4260

aacagtttat tcctggcatc cactaaatat aatggagccc gctttttaag ctggcatcca 4320

gaaaaaaaaa gaatcccagc accaaaatat tgttttcttc accaaccatc agttcatagg 4380

tccattctct tagcgcaact acagagaaca ggggcacaaa caggcaaaaa acgggcacaa 4440

cctcaatgga gtgatgcaac ctgcctggag taaatgatga cacaaggcaa ttgacccacg 4500

catgtatcta tctcattttc ttacaccttc tattaccttc tgctctctct gatttggaaa 4560

aagctgaaaa aaaaggttga aaccagttcc ctgaaattat tcccctactt gactaataag 4620

tatataaaga cggtaggtat tgattgtaat tctgtaaatc tatttcttaa acttcttaaa 4680

ttctactttt atagttagtc ttttttttag ttttaaaaca ccaagaactt agtttcgaat 4740

aaacacacat aaacaaacaa acccgggaac aaaatggtca acttacaagg taaaacagca 4800

ttggtcactg gttcaacatc aggtatcggt ttgggtatcg cagaagcatt gggtagagcc 4860

ggtgctaata tagtattaaa cggttttggt gacgttgatg ctgcattggc aacaatcgcc 4920

gctaccggtg cacaatctgc ccatcaccca gctgatatga gaaaacctga cgaaattgaa 4980

gcaatgatag ctatggcaag agaaagattc ggtaccgttg atgtcttagt aaataacgct 5040

ggtattcaac atgttgcaca agtcgaagat tttccagcac aaaagtggga tgacatcttg 5100

gccataaatt tgacttcttc attccatact acaagacacg ttatacctgc tatgagagca 5160

agaaattggg gtagaatcgt taacattgct tcagtacatg gtttagttgg ttccgccggt 5220

aaaagtgctt atgttgcagc caagcacggt ttagtcggtt tgaccaaagt aactgcattg 5280

gaaacagccg gtaccggtat cacttgtaat gctatttgcc caggttttgt tttaacacct 5340

ttggtcgctg cacaaataga tgctattgct aaaagagatg gtatttctat ggaagccgct 5400

agagctagat tgttatctga taagcaacca tcaggtcaat ttgtcactcc tgaacaattg 5460

ggtaacttgg ttttaatgtt gtgtagtcca ttcggtgacc aagttagagg tgcagcctgg 5520

gctatggatg gtggttggac agctcaatga ggatccgtga atttacttta aatcttgcat 5580

ttaaataaat tttcttttta tagctttatg acttagtttc aatttatata ctattttaat 5640

gacattttcg attcattgat tgaaagcttt gtgttttttc ttgatgcgct attgcattgt 5700

tcttgtcttt ttcgccacat gtaatatctg tagtagatac ctgatacatt gtggatgctg 5760

agtgaaattt tagttaataa tggaggcgct cttaataatt ttggggatat tggctttttt 5820

ttttaaagtt tacaaatgaa ttttttccgc caggatacta gtcatgcgac tgggtgagca 5880

tatgttccgc tgatgtgatg tgcaagataa acaagcaagg cagaaactaa cttcttcttc 5940

atgtaataaa cacaccccgc gtttatttac ctatctctaa acttcaacac cttatatcat 6000

aactaatatt tcttgagata agcacactgc acccatacct tccttaaaaa cgtagcttcc 6060

agtttttggt ggttccggct tccttcccga ttccgcccgc taaacgcata tttttgttgc 6120

ctggtggcat ttgcaaaatg cataacctat gcatttaaaa gattatgtat gctcttctga 6180

cttttcgtgt gatgaggctc gtggaaaaaa tgaataattt atgaatttga gaacaatttt 6240

gtgttgttac ggtattttac tatggaataa tcaatcaatt gaggatttta tgcaaatatc 6300

gtttgaatat ttttccgacc ctttgagtac ttttcttcat aattgcataa tattgtccgc 6360

tgcccctttt tctgttagac ggtgtcttga tctacttgct atcgttcaac accaccttat 6420

tttctaacta tttttttttt agctcatttg aatcagctta tggtgatggc acatttttgc 6480

ataaacctag ctgtcctcgt tgaacatagg aaaaaaaaat atataaacaa ggctctttca 6540

ctctccttgc aatcagattt gggtttgttc cctttatttt catatttctt gtcatattcc 6600

tttctcaatt attattttct actcataacc tcacgcaaaa taacacagtc aaatcaatca 6660

aagcggccgc aacaaaatgg aacactccgt cattgaacca accgtcccta tgcctttgcc 6720

agctatgttt gatgcccctt caggtatctt ctcctcctta gacgatgcag ttcaagccgc 6780

tactttagcc caacaacaat tgtcatccgt tgaattgaga caacaagtca taaaggcaat 6840

tagagttgcc ggtgaaagat acgctcaagt cttggcagaa atggccgtcg cagaaaccgg 6900

tatgggtaga gttgtagata aatacattaa gaatgtttca caagcaagac atacaccagg 6960

tatcgaatgt ttatccgctg aagtattaac aggtgacaac ggtttgacct tgattgaaaa 7020

tgcaccttgg ggtgttgttg cttccgttac accatcaacc aacccagctg ctacagttat 7080

taacaacgca atttctatga tcgctgccgg taactcagtt gtctttgcac ctcatccatc 7140

tgcaaagaat gtttccttaa gaactatctc cttgttgaat aaggcaatag tagccacagg 7200

tggtccagaa aatttgttag tctctgttgc aaaccctaat atcgaaactg cacaaagatt 7260

gtttagatat ccaggtatcg gtttgttggt tgtaaccggt ggtgaagctg tagtcgaagc 7320

tgcaagaaag cataccgata aaagattaat cgctgcaggt gcaggtaatc caccagttgt 7380

tgttgacgaa acagctgata tccctaaggc agcaagagcc attgttaaag gtgcatcatt 7440

cgataacaat attatctgtg ccgatgaaaa agttttaatt gtagttgaca gagttgccga 7500

tgcattattg gccgaaatgc aaagaaataa cgcagtatta ttgactccag aacaaacaga 7560

aagattgtta ccagctttgt tatctgatat cgacgaacaa ggtaaaggta gagttaacag 7620

agactacgtt ggtagagatg ccgctaaatt agcagctgca atcggtttgg aagtctcaga 7680

acatacaaga ttattgttgg cagaaacaga tgcagatcat ccattcgctg ttacagaatt 7740

aatgatgcca gttttacctg tcatcagagt caagaacgtt gatgacgcaa ttgctttggc 7800

agtcaaattg gaatctggtt gtagacatac tgctgctatg cattcaacca acataagaaa 7860

tttgaataga atggccaacg ctataaatac atcaatattc gttaagaatg gtccttgtat 7920

cgctggttta ggtttgggtg gtgaaggttg gacaagtatg acaatcagta ccccaactgg 7980

tgaaggtgtt acatcagcta gaacctttgt tagattgaga agatgcgtct tagtagatat 8040

gtttagaata gcctaaccgc gggcgattta atctctaatt attagttaaa gttttataag 8100

catttttatg taacgaaaaa taaattggtt catattatta ctgcactgtc acttaccatg 8160

gaaagaccag acaagaagtt gccgacagtc tgttgaattg gcctggttag gcttaagtct 8220

gggtccgctt ctttacaaat ttggagaatt tctcttaaac gatatgtata ttcttttcgt 8280

tggaaaagat ttcttccaaa aaaaaaaccg atgaattagt ggaaccaagg aaaaaaaaag 8340

aggtatcctt gattaaggaa cactgtttaa acagtgtggt ttccaaaacc ctgaaactgc 8400

attagtgtaa tacaagacta gacacctcga tacaaataat ggttactcaa ttcaaaactg 8460

ccgagctcta gtacctcggc gatcgctgct ggtataccta taaatattta tgtactttct 8520

ataccagtac tttactaata atatatatat gtatatctta ttttatttaa aattctttaa 8580

tcgattttat tatgcgttga cgacgaaaat gtaaacaaag cgcgaaaacg cgataatgaa 8640

aatatgagat cgatcctaaa ttaatggact agttatatca acactgacac atggaggaca 8700

taataactta gaaaagtttc aactttgtaa gtagcaaaga atagccagga atttttcaga 8760

caaatatgaa tagactgcgt agtcaacaaa gtacaaagag accatgtgct gtttgtacga 8820

aacgtaaagt taaatgtgat agaaagatac cttgtggaaa ctgtattaaa agaggccaag 8880

aagctgaatg tatcaaaacg gtgacaaatg ggtttttaca tgacccacat tctacaaacg 8940

gaacagattc aattcttaat atccttcgaa tgtggccaag ttatgaatat tggataactg 9000

atattggttt attcaagaca aaagatatag attcaactat cagaatcgaa actctagaag 9060

atgaactaag agagatcact ttttggaccg attatttaac aatggaatct tcctttaagc 9120

tattaaattt tgcagtggag aacctaggcc ccttatattt tggttgtcta ggtgatatca 9180

gtgaattatt tgtacagcta gagaattact ggactagaag aaatcaattc aaagaaaatc 9240

caagggaaac cacgttcact ttagacgata attactggaa ttcagtacta tgggcaattt 9300

tcacaatggc catctactat ataccgttag aaaatttatc tgatgaattc gaattacagt 9360

ctatctgtga acaattaaat atagatgaga atcaacattg gtctgaatca attcaattga 9420

cagttgtgca aggttttaca aaatgttgta tggatcattt gaacagagca aaatataacg 9480

agaatccggc gcgcccagct tttgttccct ttagtgaggg ttaatttcga gcttggcgta 9540

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 9600

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 9660

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 9720

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 9780

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 9840

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 9900

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 9960

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 10020

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 10080

gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 10140

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 10200

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 10260

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 10320

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 10380

cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 10440

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 10500

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 10560

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 10620

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 10680

tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 10740

agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 10800

gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 10860

accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 10920

tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 10980

tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 11040

acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 11100

atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 11160

aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 11220

tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 11280

agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 11340

gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 11400

ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 11460

atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 11520

tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 11580

tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 11640

tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgc 11693

<210> 9

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 9

cttcaaagtt cttctcattt tgttgtcgac ttttgtttat aatttatcaa atatgttgat 60

t 61

<210> 10

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 10

gtcgacaaca aaatgagaag aac 23

<210> 11

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 11

ctttcaagac tcttctcatt ttgttgtcga cttttgttta taatttatca aatatgttga 60

tt 62

<210> 12

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 12

gtcgacaaca aaatgagaag agtc 24

<210> 13

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 13

tacgactcac tatagggcga attgcctgca gggttaactc agttttctct ctttccc 57

<210> 14

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 14

actagagctc cctcggacgt gggccctttt aaatgatttt tatttgtatt gatatatgg 59

<210> 15

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 15

gggcccacgt ccgagggagc tctagtacct cggcgatcgc tttgtcttta tttttgaaat 60

gttaatagtc 70

<210> 16

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 16

taaccctcac taaagggaac aaaagctggg cgcgcccttt tgcagttgcg gatttc 56

<210> 17

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 17

ggttacatcc ctaagtgaat cgatggagat tgataagact tttc 44

<210> 18

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 18

caaaagtcga caacaaaatg agaagaactt tgaaggctgc 40

<210> 19

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 19

cttcaaagtt cttctcattt tgttgtcgac ttttgtttat aatttattga aatatgttg 59

<210> 20

<211> 89

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 20

ctgtagcacc taaaatggca gccttcaaag ttcttctcat ttttaaatga tttttatttg 60

tattgatata tggatatata tgtgtacgg 89

<210> 21

<211> 89

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 21

ggttacatcc ctaagtgagt catttaattt attcttttag aatataatta ttttgtcttt 60

atttttgaaa tgttaatagt ctttttttt 89

<210> 22

<211> 81

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 22

ccgtacacat atatatccat atatcaatac aaataaaaat catttaaaaa tgagaagaac 60

tttgaaggct gccattttag g 81

<210> 23

<211> 89

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 23

atttcaaaaa taaagacaaa ataattatat tctaaaagaa taaattaaat gactcactta 60

gggatgtaac ccttttcgat caaatattc 89

<210> 24

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 24

aaattcgggc ccgttaactc agttttctct ctttccctcc acc 43

<210> 25

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 25

tttgttgtcg acttttaaat gatttttatt tgtattgata tatggatata tatgtgtacg 60

g 61

<210> 26

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 26

tgctacctta atttctcatg gaaagtggca 30

<210> 27

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 27

gttaacgagt ttaatgttta aaagcgtata taag 34

<210> 28

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 28

aatctcaccg tacacatata tatccatata tcaatacaaa taaaaatcat ttaaaaatga 60

gaagagtctt gaaagcagca atcttgg 87

<210> 29

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 29

gtggaaccca agattgctgc tttcaagact cttctcattt ttaaatgatt tttatttgta 60

ttgatatatg gatatatatg tgtacgg 87

<210> 30

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 30

tggtattttg gcaacagaat ttttggttga aaagggttac atggattgat ttgtctttat 60

ttttgaaatg ttaatagtct ttttttt 87

<210> 31

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 用于吉布森组装的寡聚物

<400> 31

tttgttcaaa gtaaaaaaaa aagactatta acatttcaaa aataaagaca aatcaatcca 60

tgtaaccctt ttcaaccaaa aattctg 87

<210> 32

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 32

cggactttag agccttgtag ac 22

<210> 33

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 33

atctggttac actcacgatg g 21

<210> 34

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 34

ccaagtacgt tagagctaac gg 22

<210> 35

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 35

gagcttctct ggtatcagct 20

<210> 36

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 36

agctttagca aacattagac cc 22

<210> 37

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 37

attccatccg aatatgctgg t 21

<210> 38

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 38

ggaacctaaa tgactgttgg ca 22

<210> 39

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 39

aggatgttga tttcgactcg t 21

<210> 40

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 40

ttccaaaggg taccaattta gctg 24

<210> 41

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 41

gtaccgctaa tgaacctaaa cca 23

<210> 42

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 42

agagctgaca ctagagaagc c 21

<210> 43

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 43

gatgtgtcta cgacgtatct acc 23

<210> 44

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 44

gtactggtaa cgtccaagtc 20

<210> 45

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 45

gaacccttcc atactctacc a 21

<210> 46

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 46

ttcagttcgt gctactcaag g 21

<210> 47

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 47

tcaattgcaa cgacagagac 20

<210> 48

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 48

ccgtaccctg aagagtttac tg 22

<210> 49

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 49

caaccataga ttcacgaatt gctc 24

<210> 50

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 50

agtggatttg gattaatggg tg 22

<210> 51

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 51

gcttctgtaa cacctttaac ac 22

<210> 52

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 52

aaattggtga ccgtgttggt 20

<210> 53

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 53

aaccaccttt actacggtaa cca 23

<210> 54

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 54

tttagtcgtc atctgttcag gt 22

<210> 55

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 55

gagacaccta acaaaccaaa tgg 23

<210> 56

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 56

gattcaagct tcttctcgta tcgg 24

<210> 57

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 57

ggaaatgata ccattcacga cct 23

<210> 58

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 58

gttccgtcaa agaaatcaag ca 22

<210> 59

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 59

tggtaaacct gtatctgaca tcac 24

<210> 60

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 60

tttagttgtc atttgtgccg gt 22

<210> 61

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 61

gacacctaac aaaccaaacg ga 22

<210> 62

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 62

gctaacttca aaggtgaacc tc 22

<210> 63

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 63

aatctaccaa ctacgacgga c 21

<210> 64

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 64

cagattcgaa ccagatatcc ct 22

<210> 65

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 65

ccaatggtaa caatacacct tgag 24

<210> 66

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 66

ggtaaagctt actcagaagt tgtc 24

<210> 67

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 67

cagcaccttg aggtaatgga 20

<210> 68

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 68

ctatgcaagc tgtttccggt 20

<210> 69

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 69

cgttgacgtt tctcttagtt tcag 24

<210> 70

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 70

ctttgagtgc aagtatcgcc 20

<210> 71

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 71

tgtgtaattg ttcaccaaag cc 22

<210> 72

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 用于qPCR的引物

<400> 72

gagatagcac accattcacc a 21

<210> 73

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 73

caacgttaag tactctggtg tttg 24

<210> 74

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 74

atgagaagaa ctttgaaggc tg 22

<210> 75

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 75

ttacttaggg atgtaaccct tttcga 26

<210> 76

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 76

atgaaaattt ttgcttatgg 20

<210> 77

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 77

ttaatattca acagcaatag 20

<210> 78

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 78

atggttttgc attctaaagt 20

<210> 79

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 79

ttaacaagaa gatttagaaa 20

<210> 80

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 80

atgtcttcta tgccaaatca 20

<210> 81

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 81

ttatttattt tccaattcag 20

PCT/RO/134表

64页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于生产具有改变的生物碱水平的烟草植物和制品的基于PMT工程改造的组合物和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!