源自耐有机酸的酵母的新型启动子及使用其表达靶基因的方法
阅读说明:本技术 源自耐有机酸的酵母的新型启动子及使用其表达靶基因的方法 (Novel promoter derived from organic acid-resistant yeast and method for expressing target gene using same ) 是由 朴宰演 李泰荣 李气成 欧蒂·科威斯托仁 卡利·科乌兰塔 于 2019-02-28 设计创作,主要内容包括:本发明涉及用于调控耐有机酸的酵母中ADH基因表达的新型启动子,以及通过使用该启动子表达与有机酸产生相关的基因来生产有机酸的方法。当使用根据本发明的新型启动子在耐有机酸的酵母中表达与有机酸产生相关的靶基因时,由于耐有机酸,菌株的生长能力不受抑制并且以高产率产生有机酸。(The present invention relates to a novel promoter for regulating the expression of ADH gene in organic acid-resistant yeast, and a method for producing organic acid by expressing a gene associated with organic acid production using the promoter. When a target gene associated with the production of an organic acid is expressed in an organic acid-resistant yeast using the novel promoter according to the present invention, the growth ability of the strain is not inhibited and the organic acid is produced at a high yield due to the organic acid resistance.)
技术领域
本发明涉及一种源自耐有机酸的酵母的新型启动子,更具体地,涉及用于调控耐有机酸的酵母中ADH基因表达的新型启动子,以及通过使用该启动子表达与有机酸产生相关的基因来生产有机酸的方法。
背景技术
通过生物工艺将各种原料转化为有机酸、醇和胺等化学品,在环境友好性、二氧化碳减排、可持续性和新平台化学品供应等方面引起了人们的关注。通过这种生物转化,已经提供了食品、化妆品、保健营养品和药物相关的化学产品。
然而,通常,通过生物转化生产的产品需要经过去除杂质的纯化工艺。在有机酸的生产中,通常在通过碱调节的中性pH下进行发酵,以防止菌株的生长被所产生的有机酸抑制,然后进行酸化以分离和纯化这些有机酸。由于该纯化工艺,产生大量的副产物中和盐,并且随着生产工艺的复杂化,生产成本增加。该纯化工艺的高成本负担是阻碍发酵产物进入化学品市场的因素。
当为了解决上述问题而使用即使在低pH下也能够生长且显示出高发酵能力的微生物来生产诸如有机酸的酸性物质时,可以省略中和培养基pH和进行酸化的过程,因此,可以通过工艺简化和减少添加剂的使用来降低成本。
然而,在许多情况下,在低pH下存活的微生物的生长速率非常低,因此不可能获得生产物质所需的足够数量的细胞。因此,这些微生物显示出低的原料消耗率,因此难以应用于工业发酵工艺。因此,选择具有保持原料的高消耗率的同时在低于产品pKa的pH下快速生长的特性的微生物是非常重要的。
可以通过各种选择压力从各种菌株库中选择这些微生物。选择压力的实例包括在靶产物浓度下的耐性、对原料浓度的耐性、原料的消耗率、pH条件以及在基本培养基中的生长能力。微生物的选择可以手动进行,但是当进行自动筛选时,可以从大量对象中快速选择具有优良特性的菌株。
选定的微生物具有出色的承受选择压力的特性,但是在大多数情况下,它们会产生其他产物而不会产生靶产物。因此,为了赋予选定的微生物产生靶产物的能力,已经研究了以遗传方式引入用于转化为靶产物的基因并消除产生原始产生的产物的能力。
为了赋予选定的微生物产生靶产物的能力,引入了能够转化为靶产物的基因,或者使用了增强微生物中原始包含的基因的方法。但是,一般而言,由于所含基因和由其产生的酶的活性通常较低,因此在大多数情况下会引入高活性的外源基因。另外,在该过程中,必须引入能够强烈表达外源DNA的启动子。
关于可用的启动子,当靶微生物是酵母时,通常可以使用酿酒酵母(Saccharomyces cerevisiae)(一种众所周知的酵母)的启动子,并且还可以应用为酿酒酵母开发的各种基因工程技术。另外,强启动子可以选自与所选微生物的主要碳通量有关的启动子,并且有必要应用一种可以通过各种技术最有效地表达靶基因的方法。特别地,对于所选的耐酸酵母,当尚未进行与酵母相关的基因工程研究时,使用酿酒酵母的启动子或使用所选微生物的内源启动子是一种常用方法。
通常,启动子具有各种调控区域,包括真核细菌中的核心启动子区域,并且微生物之间的调控基因是不同的。因此,有可能通过选择一个在ORF的5'端具有足够长度的序列,在确认启动子作用的同时找到一个最佳区域,但是对于远程控制机制(增强子、沉默子等)或组合起作用的控制机制则需要单独的研究。
因此,本发明人为寻找适合于外源基因表达的启动子付出了巨大的努力,以选择对有机酸具有耐性的酵母并赋予该酵母产生有用物质的能力。结果,本发明人发现,当使用源自产乙醇的代谢途径的启动子表达靶基因时,靶基因的表达明显增加,从而增加了靶产物的产生,从而完成了本发明。
发明内容
本发明的目的是提供一种源自耐有机酸的酵母的新型启动子。
本发明的另一个目的是提供一种包含该启动子的重组载体,以及一种重组微生物,其中引入了该重组载体。
本发明的另一个目的是提供一种基因构建体,其中该新型启动子和编码靶蛋白的基因可操作地彼此连接。
本发明的又一个目的是提供一种使用重组微生物生产有机酸的方法,该重组微生物中已引入了包含该新型启动子和与有机酸产生相关的基因的重组载体。
为了实现上述目的,本发明提供了一种启动子,其包含SEQ ID NO:1或SEQ ID NO:2的核苷酸序列。
本发明还提供了一种包含该启动子的重组载体。
本发明还提供了一种其中引入有该重组载体的重组微生物。
本发明还提供一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养引入有重组载体的重组微生物来产生有机酸;和(b)收集产生的有机酸。
本发明还提供了一种基因构建体,其中启动子和编码靶基因的基因可操作地彼此连接,所述启动子包括包含SEQ ID NO:1的核苷酸序列。
本发明还提供了一种重组微生物,其具有引入到其染色体中的基因构建体。
本发明还提供了一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养其中引入有基因构建体的重组微生物来产生有机酸;和(b)收集产生的有机酸。
本发明还提供了一种重组菌株,其通过在耐酸酵母YBC菌株(KCTC13508BP)中使g4423基因缺失或失活而获得,并且具有降低的乙醇生产能力。
本发明还提供了一种用于靶基因过表达的重组微生物,其中将靶基因插入YBC菌株(KCTC13508BP)的基因组中的g4423的启动子的下游,并且靶基因的表达由g4423的启动子调控。
本发明还提供了一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养重组微生物来产生有机酸;和(b)收集产生的有机酸。
本发明还提供了一种通过培养重组微生物来过表达靶基因的方法。
附图说明
图1示出了用于表达一种、两种或三种3-HP途径酶的基因盒的实例。(a)是表达一种酶的通用盒,(b)是用于在使用g4423启动子的情况下引入MCRsa1酶的盒,(c)是用于在使用g4423启动子的情况下引入LDH的盒,(d)是用于引入三种产生3-HP的酶(MCR、HPDH和EUTE)的盒,(e)是用于使用1-kb g4423启动子的盒,该启动子是MCR酶的启动子。
图2示出了用于表达一种、两种或三种3-HP途径酶的酵母表达质粒的实例。
图3示出了在构建的包含酿酒酵母的启动子的重组菌株中和包含YBC菌株的启动子(1kb)的重组菌株中MCR基因(MCRsa1和MCRsa2)表达水平的分析结果。
图4示出了包含ScTEF1p启动子的重组菌株中BDHcm基因、HPDHec基因和EUTEdz基因的表达水平的分析结果,BDHcm基因、HPDHec基因和EUTEdz基因是与3-HP产生相关的其他基因。
图5示出了酿酒酵母菌株中MCR基因和3-HP产生相关基因的表达水平的比较结果。在图5中,995-1和995-3显示了相同基因型的不同表型。
图6示出了进行RT-qPCR以分析通过酿酒酵母的遗传信息选择的七种ADH基因候选物的表达水平的结果。
图7示出了去除了g4423基因的重组菌株YBC-1563中的葡萄糖利用(A)和乙醇产生(B)的分析结果。
图8示出了用MCRsa1基因替换g4423基因的重组YBC菌株中MCRsa1的表达水平的分析结果。
图9示出了其中g4423启动子和终止子区域位于1-kb截短区域中的MCRsa1基因的表达分析结果。
图10示出了三个LDH基因被g4423替代的重组YBC菌株中乳酸产生的分析结果。
具体实施方式
除非另外定义,否则本说明书中使用的所有技术术语和科学术语具有与本发明所属领域的技术人员通常理解的含义相同的含义。通常,本说明书中使用的术语是本领域公知的并且通常使用的术语。
对于用于生产在各种产物中的产生酸性环境的产物(例如有机酸)的生物转化方法,选择耐酸微生物,尤其是即使在酸性环境中也显示出快速生长并且可以保持较高的原料吸收率的微生物,以减少下游工艺的复杂性以及随之而来的化合物和设施的投资成本。所选择的微生物在许多情况下固有地具有产生靶产物的能力,因此有必要开发各种基因工程工具以便有效地将产生靶产物的能力赋予靶微生物。
启动子是能够强烈表达外源性靶基因或根据条件表达外源性靶基因的调控区,从根本上说,需要选择一个能够强烈表达靶基因的启动子。在葡萄糖条件下,这种强启动子通常选自与糖酵解相关或与通过微生物产生主要发酵产物相关的启动子。
已知的强启动子包括但不必限于TEF1、TPI1、HXT7、TDH3、PGK1、ADH1和PYK1,并且菌株之间可以不同。
常见的克拉布特里阳性(Crabtree-positive)酵母,包括在本发明中选择的微生物,在许多情况下产生乙醇作为主要的发酵产物,并且其启动子也被强烈表达并且主要在有利的发酵条件下(即在高糖浓度的条件下)起作用。
特别是,对于与乙醇代谢相关的启动子,通常开发技术的目的是在表达外源基因的同时阻断乙醇的产生。因此,当使用菌株的内源启动子时,具有的优点在于可以同时实现阻断乙醇产生的作用和强烈表达外源基因的作用。
在本发明中,为了高效地引入与有机酸产生相关的基因以赋予耐酸酵母YBC(KCTC13508BP)有机酸生产能力,选择了适合于这种引入的启动子。在本发明的一个实例中,已经证实,当使用源自酿酒酵母的启动子或在常规技术中使用的YBC的内源启动子引入与3-羟基丙酸(3-HP)产生相关的基因MCR基因时,该基因的表达效率非常低。在本发明的另一个实例中,已经证实,当使用与乙醇产生有关的ADH酶的基因g4423的启动子来表达MCR基因时,实现了该基因的高表达水平和优异的3-HP产率。
因此,一方面,本发明涉及包含SEQ ID NO:1或SEQ ID NO:2的核苷酸序列的启动子。
本发明的启动子在葡萄糖培养和对数生长期强烈表达,即使在酸性培养基中培养时也显示出良好的表达水平。另外,该启动子在异源基因的酵母表达中也能很好地起作用,所述异源基因包括酵母来源的基因,特别是古细菌来源的基因和细菌来源的基因。特别是,本发明的启动子是在耐酸菌株中产生各种化合物的必需启动子,并且是能够增强受该启动子影响的编码蛋白质的DNA的表达的启动子,特别是当该DNA是产生有机酸的DNA时。另外,该启动子是即使在细胞内外都存在有机酸的情况下也可以强烈表达的启动子。
另一方面,本发明涉及一种包含启动子的重组载体,以及一种其中引入有重组载体的重组微生物。
在本发明中,重组载体可以进一步包括包含SEQ ID NO:3或SEQ ID NO:4的序列的终止子。
在本发明中,重组载体可以进一步包含编码靶蛋白的基因,并且靶蛋白可以是与有机酸产生相关的蛋白。
在本发明中,已经发现可以生产作为有机酸的3-羟基丙酸和乳酸,但是本发明不必限于此。
使用此启动子表达的与有机酸产生相关的基因的实例包括编码琥珀酸途径中的富马酸还原酶、琥珀酰辅酶A(coA)合成酶和磷酸烯醇丙酮酸羧化酶的基因(Progress ofsuccinic acid production from renewable resources:Metabolic and fermentativestrategies,Bioresource Technology245(B);1710-1717,2017);编码己二酸途径中的丁酰激酶、烯醇(enoate)还原酶、己二酰辅酶A转移酶和己二酸半醛脱氢酶的基因(Development of a Platform Strain for Production of Adipic Acid YieldsInsights into the Localized Redox Metabolism of S.cerevisiae,Patrick Hyland.Athesis of Master of Applied Science,Graduate Department of ChemicalEngineering and Applied Chemistry,University of Toronto,2013);编码3-羟基异丁酸途径中的甲基丙二酰辅酶A还原酶的基因(第2016-0075640号韩国专利申请公开);编码异丁酸途径中的α-酮异戊酸脱羧酶和潜在的苯乙醛脱氢酶的基因(ChemSusChem 2011,4,1068-1070);编码苹果酸途径中的苹果酸脱氢酶的基因(Malic Acid Production bySaccharomyces cerevisiae:Engineering of Pyruvate Carboxylation,OxaloacetateReduction,and Malate Export,Appl.Environ.Microbiol.,74:2766-2777,2008);和编码衣康酸途径中的顺式-乌头酸脱羧酶的基因(Biochemistry of microbial itaconic acidproduction,Front Microbiol.2013;4:23.)。该启动子可以用于每个途径的最后一步中的基因的过表达,并且这在相关的现有技术文献(JP4700395B2)中也有详细说明。另外,除了上面举例说明的基因之外,该启动子还可以应用于相同途径的其他基因。
本发明的启动子是包含SEQ ID NO:1所示核苷酸序列的多核苷酸,且即使在有机酸产生条件下也具有很强的活性。另外,由于YBC菌株的二倍体性质,可能存在具有诸如SEQID NO:1的核苷酸序列中的缺失或插入的突变的序列,并且包括这些突变序列的序列也可以表现出相同的特征(The Baker's Yeast Diploid Genome Is Remarkably Stable inVegetative Growth and Meiosis,PLoS Genet 6(9):2010.Ploidy changes and genomestability in yeast,Yeast 31:421-430,2014)。
此外,与本发明的启动子一起起作用的终止子包含SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列。
在本发明中,靶蛋白的实例包括但不限于丙二酰辅酶A还原酶、乳酸脱氢酶、富马酸还原酶、琥珀酰辅酶A合成酶、磷酸烯醇丙酮酸羧化酶、丁酰激酶、烯醇还原酶、己二酰辅酶A转移酶、己二酸半醛脱氢酶、甲基丙二酰辅酶A还原酶、α-酮异戊酸脱羧酶、潜在的苯乙醛脱氢酶、苹果酸脱氢酶和顺式-乌头酸脱羧酶。
在本发明中,重组体优选为酵母,更优选为耐酸酵母YBC(KCTC13508BP)。
再另一方面,本发明还涉及一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养其中引入有重组载体的重组微生物来产生有机酸;和(b)收集产生的有机酸。
又另一方面,本发明涉及一种基因构建体,其中启动子和编码靶基因的基因可操作地彼此连接,所述启动子包括包含SEQ ID NO:1或SEQ ID NO:2的核苷酸序列,以及一种将基因构建体引入其染色体中的的重组微生物。
在本发明中,靶蛋白可以是与有机酸产生相关的蛋白。靶蛋白可以选自丙二酰辅酶A-还原酶、乳酸脱氢酶等,但不限于此,并且可以不受限制地使用与有机酸产生有关的任何蛋白。
在本发明中,重组体优选是酵母,更优选是耐酸酵母YBC(KCTC13508BP)。
再另一方面,本发明涉及一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养其中引入有基因构建体的重组微生物来产生有机酸;和(b)收集产生的有机酸。
本发明的启动子与编码靶蛋白的基因一起构成待引入酵母中的DNA构建体。这些DNA构建体包括适用于本领域技术人员已知的各种酵母转化方法的构建体,并且用于同源重组的DNA构建体的实例示于SEQ ID NO:5和SEQ ID NO:6。DNA构建体是用于缺失g4423基因的双等位基因缺失盒。另外,当将靶DNA插入该盒中时,产生了每个等位基因的基因插入盒,这是本领域技术人员众所周知的。
在本发明中,所述盒可以包含SEQ ID NO:5或SEQ ID NO:6的核苷酸序列,并且所述盒可以包含靶基因。
另一方面,本发明涉及一种过表达靶基因的方法,该方法包括用靶基因代替YBC菌株(KCTC13508BP)的基因组中的g4423基因。
另一方面,本发明涉及用于靶基因过表达的重组微生物,其中将靶基因插入YBC菌株(KCTC13508BP)的基因组中g4423的启动子的下游,并且靶基因的表达由g4423的启动子调控。
又另一方面,本发明涉及一种生产有机酸的方法,该方法包括以下步骤:(a)通过培养重组微生物来产生有机酸;和(b)收集产生的有机酸。
又另一方面,本发明涉及一种通过培养重组微生物来过表达靶基因的方法。
又另一方面,本发明涉及一种重组菌株,其通过使耐酸酵母YBC菌株(KCTC13508BP)中的g4423基因缺失或失活而获得,并且具有降低的乙醇生产能力。
如本文所用,“同源性”是指用于比较的两个氨基酸部分或多核苷酸部分之间的同一性百分比。术语“相似性”是指由比较窗口确定的两个氨基酸序列或多核苷酸序列在功能上或结构上彼此相同的程度。可以通过使用标准软件,例如基于BLAST开发的名为BLASTN或BLASTX的程序(Proc.Natl.Acad.Sci.USA,90,5873-5877,1993)比较序列来确定序列的同源性或相似性。
g4423启动子可优选具有显示出与SEQ ID NO:1的序列90%以上、92%以上、93%以上、95%以上、97%以上、98%以上、99%以上或100%的序列同源性的序列。
如果任何启动子在与本发明的g4423启动子具有90%以上的同源性的同时表现出等效水平的表达效率,则可以认为其是基本上等效的启动子。
在某些情况下,可以使用本领域已知的技术使根据本发明的g4423启动子突变,以提高靶基因的表达效率。
在本发明中,重组酵母可以具有耐酸性。为了制备适用于本发明的耐酸重组酵母,优选使用对有机酸具有耐性的宿主酵母。
耐酸酵母可以是选自酵母属、哈萨克斯坦酵母(Kazachstania saccharomyces)和假丝酵母属的耐酸酵母。例如,耐酸酵母可以选自啤酒酵母(Saccharomyces cerevisiae)、Kazachstania exigua、博伊丁哈萨克斯坦酵母(Kazachstania bulderi)和扁平云假丝酵母(Candida humilis),但不限于此。
“耐酸酵母”是指对有机酸(例如3-HP或乳酸)具有耐性的酵母,并且可以通过评估在包含各种浓度的有机酸的培养基中的生长来确定耐酸性。换句话说,“耐酸酵母”是指与含有高浓度有机酸的培养基中的普通酵母相比,具有更高的生长速率和生物质消耗率的酵母。
在本发明中,术语“耐酸酵母”定义为这样一种酵母,与不含有机酸的培养基相比,在含有1M以上的有机酸的培养基中,该酵母在低于有机酸的pKa值的pH下,可以保持至少10%的生物质消耗率(糖消耗率等)或至少10%的比生长速率。更具体地说,在本发明中,术语“耐酸酵母”定义为这样一种酵母,与pH为7相比,该酵母在2至4的pH下,能够保持至少10%的生物质消耗率(糖消耗率等)或至少10%的比生长速率。
根据本发明的重组酵母可以按照常规方法通过将基因插入宿主酵母的染色体中或通过将包含该基因的载体引入宿主酵母中来制备。
作为宿主酵母,通常使用高效引入有DNA并高效表达该引入的DNA的宿主细胞。尽管在本发明的一个实例中使用了耐酸酵母,但是本发明不限于此,可以使用任何类型的酵母,只要可以在其中充分表达靶DNA即可。
可以根据任何转化方法制备重组酵母。“转化”是指将DNA引入宿主细胞并使DNA作为染色体因子或通过完成染色体整合而在其中复制的过程,这是通过将外源DNA引入细胞而人为引起遗传变化的现象。典型的转化方法包括电穿孔、乙酸锂-PEG方法等。
此外,在本发明中,可以使用任何通常已知的基因工程方法作为将基因插入宿主微生物的染色体中的方法。该方法的实例包括使用逆转录病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹病毒载体、痘病毒载体、慢病毒载体、非病毒载体等的方法。“载体”是指DNA构建体,其包含与能够在合适的宿主中表达DNA的合适的控制序列可操作地连接的DNA序列。载体可以是质粒、噬菌体颗粒或者仅仅是潜在的基因组插入物。一旦转化到合适的宿主中,载体就可以独立于宿主基因组复制且发挥作用,或者在某些情况下可以整合到基因组本身中。质粒是目前最常用的载体形式,线性化DNA也是通常用于整合入酵母基因组的形式。
典型的质粒载体的结构包括:(a)复制起点,其允许有效地进行复制,从而每个宿主细胞产生质粒载体;(b)抗生素抗性基因或营养缺陷型标记基因,其允许选择用质粒载体转化的宿主细胞;和(c)可以插入外源DNA片段的限制性酶切位点。即使没有合适的限制酶的限制位点,当按照常规方法使用接头或合成寡核苷酸衔接子时,也可以容易地连接载体和外源DNA。即使在载体中不存在合适的限制酶消化位点,根据常规方法使用合成的寡核苷酸衔接子或接头也可以使外源DNA片段易于与载体连接。
此外,当该基因与另一核酸序列处于功能关系时,该基因是“可操作地连接的”。这可以是一个基因和一个或多个调控序列,当适当的分子(例如,转录激活蛋白)与一个或多个调控序列结合时,它们以允许基因表达的方式连接。例如,如果多肽被表达为参与该多肽的分泌的前蛋白,则前导肽或分泌前导序列的DNA与该多肽的DNA可操作地连接;如果启动子或增强子影响序列的转录,则其可操作地与编码序列连接;或者如果核糖体结合位点影响序列的转录,则其可操作地与编码序列连接;或者如果核糖体结合位点被定位以促进翻译,则其可操作地与编码序列连接。
通常,“可操作地连接”是指被连接的DNA序列是连续的,并且在分泌前导序列的情况下,是连续的并且处于阅读框内。但是,增强子不必是连续的。通过在方便的限制酶位点处连接来完成接合。如果不存在这样的位点,则根据常规方法使用合成的寡核苷酸衔接子或接头。
众所周知,并不是所有的载体在表达本发明的DNA序列时都具有相同的功能,同样,并非所有的宿主都同样适合于容纳相同的表达载体。然而,本领域技术人员能够在不偏离本发明范围的情况下从其他各种载体、表达调控序列和宿主中进行适当的选择而无需进行过度的实验。例如,可以考虑宿主细胞来选择载体,因为该载体应该在宿主细胞中复制。另外,还应考虑载体的拷贝数、控制拷贝数的能力、由载体中的基因编码的另一蛋白(例如抗生素标记)的表达。
在本发明中使用的碳源可以是选自葡萄糖、木糖、阿拉伯糖、蔗糖、果糖、纤维素、半乳糖、葡萄糖低聚物和甘油中的一种或多种,但不限于此。
在本发明中,可以在微生物(例如大肠杆菌)不再起作用(例如不能产生代谢物)的条件下进行培养。例如,可以在pH 1.0至6.5、优选pH 1.0至6.0、更优选pH 2.6至4.0下进行培养,但不限于此。
在下文中,将参考实施例更详细地描述本发明。这些实施例仅用于举例说明本发明,并且对于本领域普通技术人员将显而易见的是,本发明的范围不应解释为受这些实施例的限制。
实施例1:分析YBC菌株中使用常规启动子的丙二酰辅酶A还原酶(MCR)的表达模式
耐酸菌株的选择
本发明人通过对各种酵母菌株的测试选择了具有耐酸性的一组菌株(第2017-0025315号韩国专利申请公开)。对于选择的酵母菌株,在培养开始时将乳酸添加到培养基中,并且在检查微生物的生长速率和糖消耗率的同时选择具有最佳耐酸性的菌株。此时,使用OD值为4的接种物和添加了3.5%葡萄糖的YP培养基(20g/L蛋白胨和10g/L酵母提取物),并在30℃和100rpm的条件下用50mL烧瓶培养进行实验。培养开始时的乳酸浓度在0至80g/L之间变化。比较和分析结果,并选择具有最佳耐酸性的YBC菌株。
YBC菌株(Kazachstania exigua sB-018c)于2018年4月11日保藏在保藏机构,韩国生物科学与生物技术研究所的生物资源中心,登记号为KCTC13508BP。
在抗酸菌株YBC中使用常规启动子表达MCR
在该实施例中,在YBC菌株中表达了编码MCR(丙二酰辅酶A还原酶)的基因,该酶涉及3-HP(3-羟基丙酸)的产生。
产生3-HP的丙二酰辅酶A途径是一种代谢途径,其中乙酰辅酶A通过羧化反应转化为丙二酰辅酶A,然后通过还原反应转化为3-HP(乙酰辅酶A→丙二酰辅酶A→3-HP)。丙二酰辅酶A途径作为3-HP产生途径被研究最多,因为通常由包括大肠杆菌在内的微生物产生的中间体都通过该途径(第US 2013/0071893A1号美国专利申请公开)。丙二酸辅酶A可通过丙二酸还原酶和3-HP脱氢酶的作用而转化为3-HP,因此,在葡萄糖或甘油的存在下使用重组大肠杆菌将丙二酰辅酶A转化为3-HP的方法是众所周知的。
在该实施例中,对MCRsa1和MCRsa2进行了实验,它们是已知的MCR基因中的高效基因。基于来自基因库(Genbank)的数据,利用酵母密码子用法来合成所使用的MCRsa1和MCRsa2,并且该实施例中使用的MCR基因的信息示于下表1中。
[表1]
为了将基因引入YBC菌株,构建了图1(a)所示的盒。
所述盒被构建为具有抗生素抗性基因。为了靶向靶基因,在全基因组序列或部分基因组序列的基础上,设计靶基因的5’UTR区域和3’UTR区域以具有如图1所示的限制性酶位点,然后进行PCR。基于已知的基因信息(例如,酵母(Saccharomyces)基因组数据库)构建了源自酿酒酵母的启动子和终止子。作为抗生素抗性基因,在图1(a)中以HygR为例。然而,真核生物的其他抗生素抗性基因可以用于该菌株,并且这些基因可以由本领域技术人员容易地构建。由于使用后需要去除抗生素抗性基因,以便可以进行下一步的基因操作,因此在两端引入了用于Cre-loxp的位点(lox71和lox66)。另外,使用与得到UTR区域的方法相同的方法来构建源自YBC菌株的启动子和终止子。当要表达多个靶基因时,构建如图1(d)所示的能够表达多个基因的盒,并且使用位于每个区域末端的限制酶通过交换来构建UTR、ORF基因和抗生素抗性基因以适应目的。
对于供体DNA,使用限制酶切割或通过PCR扩增包含盒的质粒,并且可以使用位于每个末端的限制酶交换每个基因的区域。除了使用限制酶的方法外,还使用吉布森组装法(Gibson assembly)构建了一种盒。对于如何使用吉布森组装法,众所周知有许多产品和用法。在该实施例中,使用NEB吉布森组装预混液和克隆试剂盒构建该盒。其中,与MCR和G4423有关的寡聚物示于下表2中。
[表2]
在耐酸啤酒酵母菌株的情况下,使用图2所示的盒或表达质粒(pSK-084和/或pSK-085)进行表达(图2)。
为了将构建的盒引入YBC菌株中,通过PCR或限制酶方法构建线性化的供体DNA,然后如通常的酵母转化中一样,使用电穿孔法或乙酸锂法引入。接下来,根据所使用的营养缺陷型标记或抗生素标记,使用培养基进行选择。通过从选择培养基中选择的菌落,通过使用要引入靶标的基因ORF引物或使用引入的基因的引物的菌落PCR,来确认基因是否被引入染色体的正确基因座。随后,从培养的细胞中提取基因组DNA,并确定正确的基因型。
将这些构建的菌株分别在250mL烧瓶中使用20mL选择性的基于SC的培养基(20g/L葡萄糖)或YPD培养基进行培养(30℃和250rpm),并继续培养直至葡萄糖和乙醇被完全消耗掉。
下表3示出了通过上述方法构建的重组菌株,且MCR基因与酿酒酵母来源的启动子(TEF1)和YBC菌株来源的启动子(FBA1p)被一起引入该重组菌株中。
[表3]
将重组菌株分别在250mL烧瓶中使用20mL YPD培养基(20g/L蛋白胨,10g/L酵母提取物和20g/L葡萄糖)进行培养(30℃和250rpm)。在乙醇产生时和乙醇消耗时收集细胞,然后针对MCR基因进行RT-qPCR。
本实施例中使用的RT-qPCR方法如下。在靶菌株的指数生长期间提取RNA后,使用RNA作为模板产生cDNA。合成对靶基因和管家基因(用作参考基因)中的每一个特异的寡聚物,并使用该寡聚物进行qPCR。本实验中使用的基因为ALG9,使用引物扩增的片段大小为147±3bp。下表4示出了实验中使用的qPCR引物和以下实施例中使用的引物。
[表4]用于qPCR的引物
结果,如图3所示,证实了在使用耐酸菌株YBC构建的重组菌株中表达了MCR基因(MCRsa1和MCRsa2)。分析了使用酿酒酵母的启动子和YBC菌株的启动子(1kb)表达的基因的水平,结果表明所述基因的表达水平与qPCR中的参考基因的表达水平相比并不高或特别低。另外,已证实使用源自YBC菌株的1-kb FBA启动子(YBC FBA1p)表达的MCRsa2的水平(图3B中的YBC-1413)低于使用ScTEF1p启动子表达的MCRsa2的水平。
此外,还对与3-HP产生相关的其他基因即BDHcm基因、HPDHec基因和EUTEdz基因在包含ScTEF1p启动子的重组菌株YBC-061、YBC-062、YBC-067和YBC-068中的表达进行了分析。
结果,如图4所示,证实了与MCR基因相似,使用ScTEF1p启动子表达的这些基因的表达水平低于使用YBC菌株的内源启动子FBA1p和酿酒酵母来源的启动子(TEF1)表达的基因的表达水平。
此外,重组菌株的3-HP产量也很低,包含两个拷贝的基因的重组菌株(其中三个基因(MCRsa2、HPDH和EUTE)的表达水平都增加了)的3-HP产量远远低于YBC-1178菌株的3-HP产量。
实施例2:通过常规启动子表达的MCR基因和相关基因的3-HP产量的分析
分析了实施例1中构建的重组菌株的3-HP产量。
首先,在250rpm和30℃下在摇瓶中在25mL的YPD培养基(20g/L蛋白胨,10g/L酵母提取物和20g/L葡萄糖)中培养每个重组菌株,并添加15μM的浅蓝菌素(Sigma-Aldrich,美国)。浅蓝菌素的功能是通过抑制从胞质乙酰辅酶A羧化为丙二酰辅酶A的脂质合成来促进3-HP的产生。在上述培养条件下培养每种重组菌株直至葡萄糖完全消耗后,测量细胞密度,并分析培养基中包括3-HP在内的主要代谢产物的产生量。另外,还针对特定条件在改变的浓度、培养基和培养条件下进行培养,但是没有进行具体描述。
为了分析细胞培养物上清液中的3-HP,使用Waters Alliance e2695 HPLC系统(沃特世公司,米尔福德,美国)以10μl的进样量分析培养物上清液样品。在HPLC中,将与快速酸分析柱(100mm×7.8mm)(Bio-Rad,美国)相连的Aminex HPX-87H有机酸柱(300mm×7.8mm)(Bio-Rad,美国)用于固定相。该柱保持在+55℃,并且使用5.0mM H2SO4(Merck KgaA,德国)作为洗脱剂,流速为0.3ml/分钟或0.5ml/分钟。
为了检测3-羟基丙酸、葡萄糖、乙酸、琥珀酸、丙酮酸、甘油和乙醇,使用了Waters2489双波长紫外光(210nm)检测器(沃特世公司,米尔福德,美国)和Waters 2414示差折光仪(沃特世公司,米尔福德,美国)。
结果,如下表5所示,证实了所有重组菌株均显示出较低的3-HP产率。由这种较低的产率,可以确定主要基因,特别是MCR的表达效率对3-HP的产生有很大影响。
[表5]重组YBC菌株中3-HP的产生
实施例3:酿酒酵母中MCR基因的表达效率分析
为了比较MCR基因和相关基因在基因信息和基因工具均已良好建立的酿酒酵母菌株中的表达效率,采用实施例1所述的RT-qPCR方法,分析了产生3-HP的基因,特别是表达效率低的MCR基因的表达水平。
结果,如图5所示,证实了即使在包含酿酒酵母的内源性启动子的重组菌株中,MCRsa2基因的表达水平也很低。因此,证实了有必要选择能够增加MCR基因表达的新型启动子。
实施例4:YBC菌株中产醇基因的表达分析
在本实施例中,为了选择能够增加YBC菌株中外源基因表达的启动子,使用调控YBC菌株自身中具有高表达效率的基因的表达的启动子,并且用待表达的外源基因替换该基因。
从在葡萄糖存在下强烈表达的与糖酵解和乙醇产生相关的基因中,选择了当被其他基因取代时高效且不影响生长的基因,并以调控ADH(醇脱氢酶)基因表达的启动子为靶标。
特别是,为了不直接影响微生物的生长,应消除糖酵解相关的基因。如果糖酵解相关的基因缺失或失活,那对微生物生长起重要作用的丙酮酸的产生就会受到抑制,或者链反应的平衡会出现问题,从而对微生物的生长特性产生不利影响,导致发酵能力下降。因此,当靶菌株是产乙醇菌株时,选择PDC(丙酮酸脱氢酶复合物)基因或ADH基因作为要被替换的内源基因,并且PDC用作在靶菌株中产生靶化合物的重要途径。因此,选择ADH基因作为要被缺失的基因。
具有较强乙醇发酵能力的菌株,例如酵母,具有拥有多种强度和功能的ADH。为了鉴定酵母ADH中主要的产乙醇ADH并选择和使用相应的启动子,通过比较YBC菌株的基因组信息与酿酒酵母的ADH基因的已知信息,鉴定了几种候选基因,并进行了qPCR。
利用来自酿酒酵母全基因组序列数据的生物信息学的信息选择了7个ADH基因候选物(参见表6),设计对所选基因特异的寡聚物并进行RT-qPCR(引物序列见表4)。
[表6]
*与酿酒酵母基因组相比,YBC中具有相似基因序列的基因
结果,如图6所示,证实了g4423基因的表达水平明显较高。
构建了去除了g4423基因的菌株(YBC-1563)。基于关于g4423和UTR的信息,构建了一个类似于图1(a)的基因盒,从中去除了g4423 ORF,并且该基因盒具有5’UTR和3’UTR以及抗生素标记。该构建的基因盒用作供体DNA。为了构建供体DNA,使用如上所述的使用限制酶的克隆方法并使用吉布森组装法。引入所构建的供体DNA,并使用ORF引物(正向引物(SEQID NO:72):GAGATAGCACACCATTCACCA,反向引物(SEQ ID NO:73):CAACGTT72AAGTACTCTGGTGTTTG)分析与标记基因相对应的平板中生长的菌落用于鉴别g4423。结果,确认除去了ORF。
将菌株用50ml培养基(含有40g/L葡萄糖)在250ml烧瓶中在30℃和250rpm下以起始OD值为0.7进行培养,直到糖和乙醇被完全消耗光。然后,分析葡萄糖消耗量和乙醇产量。结果,证实乙醇产量减少了50%以上(图7)。
实施例5:通过用MCR基因替换g4423基因而构建的YBC重组体的表达水平的分析
为了利用实施例4中鉴定的g4423基因的较强的表达能力,通过用MCRsa1基因替换YBC菌株的基因组中的g4423基因来构建重组菌株YBC-1684,并分析了MCRsa1基因的表达水平。基于关于g4423和UTR的信息,构建了图1(b)的基因盒,从中去除了g4423 ORF,并且该基因盒具有5’UTR和3’UTR以及抗生素标记。另外,将针对酵母密码子用法而优化的MCRsa1序列引入g4423的ORF位点。所构建的基因盒用作供体DNA。为了构建供体DNA,使用如上所述的使用限制酶的克隆方法并使用吉布森组装法。供体DNA中使用的质粒(pSK863)如SEQ IDNO:7所示。
所构建的盒中的供体DNA被扩增并引入到YBC菌株中。使用以下引物分析生长的菌落,以鉴定g4423 ORF。结果,证实去除了g4423 ORF并且存在MCRsa1 ORF,这表明引入了MCRsa1。
用于分析的正向引物(SEQ ID NO:74):ATGAGAAGAACTTTGAAGGCTG,
反向引物(SEQ ID NO:75):TTACTTAGGGATGTAACCCTTTTCGA。
将菌株用50ml培养基(含有40g/L葡萄糖)在250ml烧瓶中于30℃和250rpm下以起始OD值为0.7进行培养,直到糖和乙醇被完全消耗光。然后,分析了3-HP的量以及产生的糖和乙醇的量。在与实施例1相同的条件下进行用于分析基因表达水平的RT-qPCR,并在对数生长期间对培养基进行采样。下表7示出了构建的重组YBC菌株的具体基因型。
[表7]通过用MCRsa1基因替换g4423基因而构建的重组YBC菌株
结果,如图8所示,证实了所构建的重组菌株中MCRsa1基因的表达水平与g4423基因的表达水平相似,并且远高于包含TEF1启动子(源自酿酒酵母的强启动子)的菌株(对照YBC-061)中的表达水平。
将G4423的启动子与过去使用的源自酿酒酵母的各种ADH同工酶的启动子进行比较,并且通过比较同源性,发现同源性非常低(表8)。进行了G4423的启动子和源自酿酒酵母的各种常规ADH同工酶的启动子之间的同源性比较,结果可以看出同源性非常低(表8)。
[表8]g4423启动子区域和酿酒酵母ADH启动子区域之间的同源性比较
实施例6:在用MCRsa1基因替换g4423基因而构建的重组菌株中产生3-HP
对实施例5中证实具有增高的MCR基因表达水平的重组YBC-1684中3-HP的产生量进行分析。
与实施例2的表3中的结果进行比较。如上表3所示,当使用scTEF启动子或FBA启动子表达与3-HP产生有关的三个核心基因时,在烧瓶培养物中产生了约1-16mg/L的3-HP。
另外,对重组菌株YBC-1684中以及通过将3-HP产生相关的基因插入g4423位点被表达的MCRsa1取代的YBC-1684菌株而构建的菌株中的3-HP的产生量进行了分析。
将每种菌株在30℃下在烧瓶中用补充有4%葡萄糖和15μM浅蓝菌素的YP培养基(20g/L蛋白胨和10g/L酵母提取物)进行培养,并在第5天当糖完全消耗光时,对培养基进行取样并分析3-HP的产生。
结果,如下表9所示,仅将MCRsa1基因插入g4423位点的YBC-1684菌株产生了200mg/L的3-HP,而将3-HP产生相关的基因(HiBADH基因和EUTE基因)额外插入g4423位点的菌株产生了146mg/L-710mg/L的3-HP,3-HP的产量在菌落之间是不同的。因此,可以确认该菌株中3-HP的产量明显高于相应基因由scTEF启动子或FBA启动子表达的重组菌株中3-HP的产量。
[表9]
从这些结果可以证实,g4423启动子增加了MCRsa1基因的表达对3-HP产量的增加具有很大的影响。由此可见,如果通过g4423启动子增加与靶化合物有关的基因的表达,则靶化合物的产量会增加。
实施例7:g4423启动子的迁移性分析
将YBC菌株的基因组DNA中的G4423启动子和终止子区域切割成1kb的长度,并分析了用于产生3-HP的MCRsa1基因的表达水平。根据有关YBC菌株基因组中g4423和UTR的信息,使用引物扩增g4423的5’UTR区域的1kb区并进行提取,然后使用上述表2的oSK-1412至oSK1419引物进行扩增,因此获得针对酵母密码子用法而优化的带有g4423的启动子的MCRsa1片段。将获得的片段引入能够表达多个基因的图1(e)的盒中,所用质粒(pSK-865)如SEQ ID NO:8所示。将供体DNA盒扩增、纯化并引入YBC中,并分析生长的菌落的基因型。
证实了通过上述方法得到的重组菌株YBC-1693中MCRsa1的表达水平降低,如使用YBC的启动子(FBA)或酿酒酵母的TEF1p启动子时一样(图9)。因此,推测YBC耐酸菌株的启动子作用需要更长的片段或具有即使在很长的距离内也起作用的机制(增强子或沉默子)或由多种因素组合起作用的机制。需要进行其他研究才能准确阐明这些机制。
当用靶基因替换g4423基因时,可以获得两种效果:可以强烈表达靶基因,并且除去与乙醇产生相关的g4423基因。因此,可以有效地完成使用该菌株产生各种化合物的研究目的。
实施例8:由g4423启动子表达LDH基因
在本实施例中,构建了重组YBC菌株,其中除MCR基因外还用与乳酸产生相关的LDH(乳酸脱氢酶)基因来取代g4423基因。分析了所构建菌株的乳酸产率。
构建重组菌株,以使由g4423启动子表达三个代表性基因(源自瑞士乳杆菌(L.helveticus)的LDH、源自米根霉(R.oryzae)的LDH、源自植物乳杆菌(L.plantarum)的LDH)。
基于关于g4423和UTR的信息,构建了类似于图1(e)中所示的基因盒,该基因盒中除去了g4423 ORF并且该基因盒具有5’UTR和3’UTR以及抗生素标记。基于来自NCBI的三个基因的信息,合成了针对酵母密码子用法而优化的序列,然后将该序列使用限制酶(ApaI和SacI)引入盒中。扩增完成的盒中的供体DNA,并将其引入YBC菌株。使用以下引物分析生长的菌落,以鉴定g4423 ORF,结果,确认除去了g4423 ORF的一个等位基因,并引入了每个LDH基因。
瑞士乳杆菌正向引物(SEQ ID NO:76):ATGAAAATTTTTGCTTATGG;
瑞士乳杆菌反向引物(SEQ ID NO:77):TTAATATTCAACAGCAATAG;
米根霉正向引物(SEQ ID NO:78):ATGGTTTTGCATTCTAAAGT;
米根霉反向引物(SEQ ID NO:79):TTAACAAGAAGATTTAGAAA;
植物乳杆菌正向引物(SEQ ID NO:80):ATGTCTTCTATGCCAAATCA;
植物乳杆菌反向引物(SEQ ID NO:81):TTATTTATTTTCCAATTCAG
将构建的重组菌株用补充有4%葡萄糖和150mg/L尿嘧啶的YP(20g/L蛋白胨和10g/L酵母提取物)培养基在30℃和100rpm下振荡培养24小时。
通过HPLC分析培养基中的乳酸和乙醇。使用装有Waters 1525Binary HPLC泵的Bio-Rad Aminex 87-H色谱柱分析培养基中葡萄糖、乙醇和L-乳酸的浓度。使用Waters2414折射率检测器分析葡萄糖和乙醇,并使用Waters 2489紫外光/可见光检测器(210nm)分析L-乳酸。使用根据每种组分的浓度绘制的标准曲线的峰面积来计算每种组分的浓度,并且用于分析的具体条件如下。
1.流动相条件:0.005M H2SO4溶液
2.流速:0.6mL/分钟
3.运行时间:40分钟
4.柱箱温度:60℃
5.检测器温度:40℃
6.进样量:10μL
7.自动采样器托盘温度:4℃
结果如图10所示,证实了替换的靶基因表现出LDH活性,从而产生了乳酸。
[保藏信息]
保藏机构名称:韩国生物科学与生物技术研究所
登记号:KCTC13508BP
保藏日期:2018年4月11日
工业适用性
当使用根据本发明的新型启动子在耐有机酸的酵母中表达与有机酸产生有关的靶基因时,具有的优点在于,该酵母可以在对有机酸具有耐性、该酵母的生长能力不受抑制的同时高效产生有机酸。
尽管已经参考特定特征详细描述了本发明,但是对于本领域技术人员而言显而易见的是,所描述的仅是本发明的优选实施方案,并且不限制本发明的范围。因此,本发明的实质范围将由所附权利要求及其等同物来限定。
序列表自由文本
随附电子文件
<110> SK新技术株式会社
<120> 源自耐有机酸的酵母的新型启动子及使用其表达靶基因的方法
<130> PP-B2157
<150> KR 10-2018-0044508
<151> 2018-04-17
<160> 81
<170> KopatentIn 2.0
<210> 1
<211> 988
<212> DNA
<213> 人工序列
<220>
<223> g4423启动子区域等位基因 1
<400> 1
gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaatacgca 60
cagaatgaac atctgattga ttaatattta tatattactt agtggcaccc ctacaaacaa 120
accaattttg aatatttctc accatcatga tatttattta gggcaagaat ttcatgtaca 180
tacgtgcgtg tactgcatag ttttgttata tgtaaataac cagcaatata tcaccaatga 240
taaatgctca gtaatttatt tggaaccaaa atagtttcag taatcaaata atacaataac 300
taacaagtgc tgattataca acagctgtta acaacacaaa cacgctctct tctattctct 360
tccctgcttg ttcgtgtggt atattcccga atttgcaatt tagaaattat attttttaaa 420
agaattgttc tccattttct ggtagtcgta agtggcaaat tggatcataa gacacaatct 480
tgttagttcg actgctaaca ccagacaaga ccgaacgaaa acagaaaaaa aagataattt 540
tgttattctg ttcaattctc tctctctttt taaggtatct ttacattaca ttacatatcc 600
caaattacaa caagagcaag aaatgaagca caacaacacg ccatctttcg tgattatttt 660
atcatttcta tatcgtaact aaattaacaa atgctatgtt tcttaatttt taatgataaa 720
tctaactgct accttaattt ctcatggaaa gtggcaaata cagaaattat atattcttat 780
tcattttctt ataattttta tcaattacca aatatatata aatgcaatta attgattgtt 840
cctgtcacat aatttttttt gtttgttacc tttattcttt atccatttag tttagttctt 900
atatctttct tttctatttc tctttttcgt ttaatctcac cgtacacata tatatccata 960
tatcaataca aataaaaatc atttaaaa 988
<210> 2
<211> 961
<212> DNA
<213> 人工序列
<220>
<223> g4423启动子区域等位基因 2
<400> 2
gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaaatacgc 60
acagaatgaa catctgattg attaatattt atatattact cagtggcacc cctacaaaca 120
aaccaatttt gaatattgtt caccatcatg atatttattt agggcaagaa tttcatgtac 180
atacgtgcgt gtactgcata gttttgttat atgaaaataa ccagcaatat atcaccaatg 240
aataaattct caataattta tttggaacca aataatgcaa taactagcaa actaagtggt 300
gattatacaa cagctgttaa caacacaaac atacgctctc ttctattatc tcttccctgc 360
ttgttcgtgt ggtatattca cgaatttgca atttagaaat tatatttttt aaaagaattg 420
ttctccattt tctggtagtc gtaagtggca aattggatca taagacacaa tcttgttagt 480
tcgactgcta acaccagaca acaccgaacg aaaacaagaa aaaataatta ttctctctct 540
ttttaaggta tcttacatta catatcccaa attacaacaa gagcaagaaa tgaggcacaa 600
caacacacca tcatctttcg tgattatttt tatcatttct atcatgtaat taaattaaca 660
aatgttaagt ttattaattt ttaatgataa atctagttgc taccttaatt tctcatggaa 720
agtggcaaat actgaaatta tttaattcta ctttcatttt cttataattt ttatcaatta 780
ccaaatatat ataaatgcaa ttaattgatt gttcctgtca cataattttt tttgtttgtt 840
acctttattc tttatccatt taatttattt cttgtatctt tcttttctat ttctcttttc 900
tgtttaatct caccgtacac atatatatcc atatatcaat acaaataaaa atcatttaaa 960
a 961
<210> 3
<211> 1017
<212> DNA
<213> 人工序列
<220>
<223> g4423终止子区域等位基因1
<400> 3
taagtcattt aatttattct tttagaatat atttattttg tctttatttt tgaaatgtta 60
atagtctttt ttttttactt tgaacaaaaa aaagtaaaat taaaacttat cttatatacg 120
cttttaaaca ttaaactcgt taacgaatta tataatgatt ttatcgaact actttatgtt 180
tttttaatag aataatcttc tttattaata taacttacta cttcttaatc ttgttgtcct 240
ccattcgaaa ctcgagtgga acattttctg agtatctctc gcgtctgttc gtaccgtttt 300
tccaatttct ttcgggaaac ggaactggac gcattttatt tgactgttga aagggagatt 360
taatatttat atagcgagat ataacaacta acttataagt ttacacaggc tgttatcaca 420
tatatatata tatatcaaca gaggactagc tcactagact aacattagat atgtcgatgc 480
tgaaccgttt gtttggtgtt agatccattt cacaatgtgc tactcgttta caacgttcta 540
cagggacaaa tatatcagaa ggtccactaa gaattattcc acaattacaa actttctatt 600
ctgctaatcc aatgcatgat aacaatatcg acaagctaga aaatcttcta cgtaaatata 660
tcaagttacc aagtacaaac aatttattga agacacatgg gaatacatct acagaaattg 720
atccaacaaa attattacaa tcacaaaatt cttcacgtcc tttatggtta tcattcaagg 780
attatacagt gattggaggt ggttcacgtt taaaacctac tcaatacacg gaacttttat 840
ttctattgaa taaactacat agtatcgatc cacaattaat gaatgatgat attaagaacg 900
aattagctca ttattataag aatacttcac aggaaactaa taaagtcacc atccctaaat 960
tggatgaatt cggtagaagt attggaatcg gtagaaggaa atccgcaact gcaaaag 1017
<210> 4
<211> 1018
<212> DNA
<213> 人工序列
<220>
<223> g4423终止子区域等位基因2
<400> 4
taagtcattt aatttattct tttagaatat atttattttg tctttatttt tgaaatgtta 60
atagtctttt ttttactttg aaaaaaaaaa aaagtaaaat taaacttatc ttatatacgc 120
ttttaaacat taaactcgtt aacgaattat ataatgattt tatcgaacta ctttatgttt 180
ttttaataga ataatcttct ttattaatat aacttactac ttcttaatct tgttgtcctc 240
cattcgaaac tcgagaggaa caatttctga gtctctctcg caccctttcg tacgtaccgt 300
ttttccaatt tctttcggga aacggaactg gacgcatttt atttgactgt tgaaagggag 360
atttaatatt tatatagaga gatataacaa ctaacttata agtttataca ggctgttatc 420
acatatatat atatatcaac agaggactag ctcaatagaa taacattaga tatgtcgatg 480
ctgaaccgtt tgtttggtgt tagatccatt tcacaatgtg ctactcgttt acaacgttct 540
acagggacaa atatatcaga aggtccacta agaattattc cacaattaca aactttctat 600
tctgctaatc caatgcatga taacaatatc gacaagctag aaaatcttct acgtaaatat 660
atcaagttac caagtacaaa taacttattg aagacacatg ggaatacatc tacagaaatc 720
gatccaacaa aattattaca atcacaaaat tcttcacgtc ctttatggtt atcattcaag 780
gattatacag tgattggagg tggttcacgt ttaaaaccta ctcaatacac agaactttta 840
tttctattga ataaactaca tagtatcgat ccacaattaa tgaatgatga tattaagaac 900
gaattagctc attattataa gaatacttca caggaaacta ataaagtcac catccctaaa 960
ttggatgaat tcggtagaag tattggaatc ggtagaagga aatccgcaac tgcaaaag 1018
<210> 5
<211> 6402
<212> DNA
<213> 人工序列
<220>
<223> 包含质粒等位基因1的g4423缺失盒
<400> 5
cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 60
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 120
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 180
gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 240
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 300
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 360
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 420
aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 480
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgcctgcagg 660
gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaatacgca 720
cagaatgaac atctgattga ttaatattta tatattactt agtggcaccc ctacaaacaa 780
accaattttg aatatttctc accatcatga tatttattta gggcaagaat ttcatgtaca 840
tacgtgcgtg tactgcatag ttttgttata tgtaaataac cagcaatata tcaccaatga 900
taaatgctca gtaatttatt tggaaccaaa atagtttcag taatcaaata atacaataac 960
taacaagtgc tgattataca acagctgtta acaacacaaa cacgctctct tctattctct 1020
tccctgcttg ttcgtgtggt atattcccga atttgcaatt tagaaattat attttttaaa 1080
agaattgttc tccattttct ggtagtcgta agtggcaaat tggatcataa gacacaatct 1140
tgttagttcg actgctaaca ccagacaaga ccgaacgaaa acagaaaaaa aagataattt 1200
tgttattctg ttcaattctc tctctctttt taaggtatct ttacattaca ttacatatcc 1260
caaattacaa caagagcaag aaatgaagca caacaacacg ccatctttcg tgattatttt 1320
atcatttcta tatcgtaact aaattaacaa atgctatgtt tcttaatttt taatgataaa 1380
tctaactgct accttaattt ctcatggaaa gtggcaaata cagaaattat atattcttat 1440
tcattttctt ataattttta tcaattacca aatatatata aatgcaatta attgattgtt 1500
cctgtcacat aatttttttt gtttgttacc tttattcttt atccatttag tttagttctt 1560
atatctttct tttctatttc tctttttcgt ttaatctcac cgtacacata tatatccata 1620
tatcaataca aataaaaatc atttaaaagg gcccacgtcc gagggagctc tagtacctcg 1680
taccgttcgt ataatgtatg ctatacgaag ttatcatcca ggattctgtt tagcttgcct 1740
cgtccccgcc gggtcacccg gccagcgaca tggaggccca gaataccctc cttgacagtc 1800
ttgacgtgcg cagctcaggg gcatgatgtg actgtcgccc gtacatttag cccatacatc 1860
cccatgtata atcatttgca tccatacatt ttgatggccg cacggcgcga agcaaaaatt 1920
acggctcctc gctgcagacc tgcgagcagg gaaacgctcc cctcacagac gcgttgaatt 1980
gtccccacgc cgcgcccctg tagagaaata taaaaggtta ggatttgcca ctgaggttct 2040
tctttcatat acttcctttt aaaatcttgc taggatacag ttctcacatc acatccgaac 2100
ataaacaacc atgggtaagg aaaagactca cgtttcgagg ccgcgattaa attccaacat 2160
ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 2220
aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 2280
tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 2340
gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 2400
tgcgatcccc ggcaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa 2460
tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg 2520
tccttttaac agtgatcgcg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg 2580
tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 2640
gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt 2700
ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 2760
agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 2820
ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 2880
taaattgcag tttcatttga tgctcgatga gtttttctaa tcagtactga caataaaaag 2940
attcttgttt tcaagaactt gtcatttgta tagttttttt atattgtagt tgttctattt 3000
taatcaaatg ttagcgtgat ttatattttt tttcgcctcg acatcatctg cccagatgcg 3060
aagttaagtg cgcagaaagt aatatcatgc gtcaatcgta tgtgaatgct ggtcgctata 3120
ctgctgtcga ttcgatacta acgccgccat ccagtgtcga aaagtatcag caaataactt 3180
cgtataatgt atgctatacg aacggtagcg atcgctttgt ctttattttt gaaatgttaa 3240
tagtcttttt tttttacttt gaacaaaaaa aagtaaaatt aaaacttatc ttatatacgc 3300
ttttaaacat taaactcgtt aacgaattat ataatgattt tatcgaacta ctttatgttt 3360
ttttaataga ataatcttct ttattaatat aacttactac ttcttaatct tgttgtcctc 3420
cattcgaaac tcgagtggaa cattttctga gtatctctcg cgtctgttcg taccgttttt 3480
ccaatttctt tcgggaaacg gaactggacg cattttattt gactgttgaa agggagattt 3540
aatatttata tagcgagata taacaactaa cttataagtt tacacaggct gttatcacat 3600
atatatatat atatcaacag aggactagct cactagacta acattagata tgtcgatgct 3660
gaaccgtttg tttggtgtta gatccatttc acaatgtgct actcgtttac aacgttctac 3720
agggacaaat atatcagaag gtccactaag aattattcca caattacaaa ctttctattc 3780
tgctaatcca atgcatgata acaatatcga caagctagaa aatcttctac gtaaatatat 3840
caagttacca agtacaaaca atttattgaa gacacatggg aatacatcta cagaaattga 3900
tccaacaaaa ttattacaat cacaaaattc ttcacgtcct ttatggttat cattcaagga 3960
ttatacagtg attggaggtg gttcacgttt aaaacctact caatacacgg aacttttatt 4020
tctattgaat aaactacata gtatcgatcc acaattaatg aatgatgata ttaagaacga 4080
attagctcat tattataaga atacttcaca ggaaactaat aaagtcacca tccctaaatt 4140
ggatgaattc ggtagaagta ttggaatcgg tagaaggaaa tccgcaactg caaaagggcg 4200
cgcccagctt ttgttccctt tagtgagggt taatttcgag cttggcgtaa tcatggtcat 4260
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 4320
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 4380
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 4440
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 4500
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 4560
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 4620
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 4680
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 4740
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 4800
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 4860
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 4920
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 4980
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 5040
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 5100
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 5160
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 5220
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 5280
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 5340
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 5400
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 5460
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 5520
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 5580
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 5640
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 5700
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 5760
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 5820
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 5880
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 5940
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 6000
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 6060
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 6120
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 6180
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 6240
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 6300
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 6360
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gc 6402
<210> 6
<211> 6376
<212> DNA
<213> 人工序列
<220>
<223> 包含质粒等位基因2的g4423缺失盒
<400> 6
cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 60
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 120
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 180
gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 240
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 300
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 360
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 420
aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 480
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgcctgcagg 660
gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaaatacgc 720
acagaatgaa catctgattg attaatattt atatattact cagtggcacc cctacaaaca 780
aaccaatttt gaatattgtt caccatcatg atatttattt agggcaagaa tttcatgtac 840
atacgtgcgt gtactgcata gttttgttat atgaaaataa ccagcaatat atcaccaatg 900
aataaattct caataattta tttggaacca aataatgcaa taactagcaa actaagtggt 960
gattatacaa cagctgttaa caacacaaac atacgctctc ttctattatc tcttccctgc 1020
ttgttcgtgt ggtatattca cgaatttgca atttagaaat tatatttttt aaaagaattg 1080
ttctccattt tctggtagtc gtaagtggca aattggatca taagacacaa tcttgttagt 1140
tcgactgcta acaccagaca acaccgaacg aaaacaagaa aaaataatta ttctctctct 1200
ttttaaggta tcttacatta catatcccaa attacaacaa gagcaagaaa tgaggcacaa 1260
caacacacca tcatctttcg tgattatttt tatcatttct atcatgtaat taaattaaca 1320
aatgttaagt ttattaattt ttaatgataa atctagttgc taccttaatt tctcatggaa 1380
agtggcaaat actgaaatta tttaattcta ctttcatttt cttataattt ttatcaatta 1440
ccaaatatat ataaatgcaa ttaattgatt gttcctgtca cataattttt tttgtttgtt 1500
acctttattc tttatccatt taatttattt cttgtatctt tcttttctat ttctcttttc 1560
tgtttaatct caccgtacac atatatatcc atatatcaat acaaataaaa atcatttaaa 1620
agggcccacg tccgagggag ctctagtacc tcgtaccgtt cgtataatgt atgctatacg 1680
aagttatcat ccaggattct gtttagcttg cctcgtcccc gccgggtcac ccggccagcg 1740
acatggaggc ccagaatacc ctccttgaca gtcttgacgt gcgcagctca ggggcatgat 1800
gtgactgtcg cccgtacatt tagcccatac atccccatgt ataatcattt gcatccatac 1860
attttgatgg ccgcacggcg cgaagcaaaa attacggctc ctcgctgcag acctgcgagc 1920
agggaaacgc tcccctcaca gacgcgttga attgtcccca cgccgcgccc ctgtagagaa 1980
atataaaagg ttaggatttg ccactgaggt tcttctttca tatacttcct tttaaaatct 2040
tgctaggata cagttctcac atcacatccg aacataaaca accatgggta aggaaaagac 2100
tcacgtttcg aggccgcgat taaattccaa catggatgct gatttatatg ggtataaatg 2160
ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg ggaagcccga 2220
tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg ttacagatga 2280
gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca agcattttat 2340
ccgtactcct gatgatgcat ggttactcac cactgcgatc cccggcaaaa cagcattcca 2400
ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg cagtgttcct 2460
gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagtgatc gcgtatttcg 2520
tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg attttgatga 2580
cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataagc ttttgccatt 2640
ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta tttttgacga 2700
ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc gataccagga 2760
tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga aacggctttt 2820
tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt tgatgctcga 2880
tgagtttttc taatcagtac tgacaataaa aagattcttg ttttcaagaa cttgtcattt 2940
gtatagtttt tttatattgt agttgttcta ttttaatcaa atgttagcgt gatttatatt 3000
ttttttcgcc tcgacatcat ctgcccagat gcgaagttaa gtgcgcagaa agtaatatca 3060
tgcgtcaatc gtatgtgaat gctggtcgct atactgctgt cgattcgata ctaacgccgc 3120
catccagtgt cgaaaagtat cagcaaataa cttcgtataa tgtatgctat acgaacggta 3180
gcgatcgctt tgtctttatt tttgaaatgt taatagtctt ttttttactt tgaaaaaaaa 3240
aaaaagtaaa attaaactta tcttatatac gcttttaaac attaaactcg ttaacgaatt 3300
atataatgat tttatcgaac tactttatgt ttttttaata gaataatctt ctttattaat 3360
ataacttact acttcttaat cttgttgtcc tccattcgaa actcgagagg aacaatttct 3420
gagtctctct cgcacccttt cgtacgtacc gtttttccaa tttctttcgg gaaacggaac 3480
tggacgcatt ttatttgact gttgaaaggg agatttaata tttatataga gagatataac 3540
aactaactta taagtttata caggctgtta tcacatatat atatatatca acagaggact 3600
agctcaatag aataacatta gatatgtcga tgctgaaccg tttgtttggt gttagatcca 3660
tttcacaatg tgctactcgt ttacaacgtt ctacagggac aaatatatca gaaggtccac 3720
taagaattat tccacaatta caaactttct attctgctaa tccaatgcat gataacaata 3780
tcgacaagct agaaaatctt ctacgtaaat atatcaagtt accaagtaca aataacttat 3840
tgaagacaca tgggaataca tctacagaaa tcgatccaac aaaattatta caatcacaaa 3900
attcttcacg tcctttatgg ttatcattca aggattatac agtgattgga ggtggttcac 3960
gtttaaaacc tactcaatac acagaacttt tatttctatt gaataaacta catagtatcg 4020
atccacaatt aatgaatgat gatattaaga acgaattagc tcattattat aagaatactt 4080
cacaggaaac taataaagtc accatcccta aattggatga attcggtaga agtattggaa 4140
tcggtagaag gaaatccgca actgcaaaag ggcgcgccca gcttttgttc cctttagtga 4200
gggttaattt cgagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 4260
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 4320
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 4380
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 4440
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 4500
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 4560
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 4620
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 4680
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 4740
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 4800
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 4860
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 4920
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 4980
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 5040
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 5100
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 5160
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 5220
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 5280
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 5340
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 5400
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 5460
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 5520
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 5580
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 5640
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 5700
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 5760
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 5820
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 5880
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 5940
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 6000
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 6060
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 6120
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 6180
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 6240
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 6300
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 6360
tttccccgaa aagtgc 6376
<210> 7
<211> 5942
<212> DNA
<213> 人工序列
<220>
<223> pSK863
<400> 7
cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 60
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 120
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 180
gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 240
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 300
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 360
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 420
aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 480
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgcctgcagg 660
gttaactcag ttttctctct ttccctccac cccacgttac tctgcgaaca aaaatacgca 720
cagaatgaac atctgattga ttaatattta tatattactt agtggcaccc ctacaaacaa 780
accaattttg aatatttctc accatcatga tatttattta gggcaagaat ttcatgtaca 840
tacgtgcgtg tactgcatag ttttgttata tgtaaataac cagcaatata tcaccaatga 900
taaatgctca gtaatttatt tggaaccaaa atagtttcag taatcaaata atacaataac 960
taacaagtgc tgattataca acagctgtta acaacacaaa cacgctctct tctattctct 1020
tccctgcttg ttcgtgtggt atattcccga atttgcaatt tagaaattat attttttaaa 1080
agaattgttc tccattttct ggtagtcgta agtggcaaat tggatcataa gacacaatct 1140
tgttagttcg actgctaaca ccagacaaga ccgaacgaaa acagaaaaaa aagataattt 1200
tgttattctg ttcaattctc tctctctttt taaggtatct ttacattaca ttacatatcc 1260
caaattacaa caagagcaag aaatgaagca caacaacacg ccatctttcg tgattatttt 1320
atcatttcta tatcgtaact aaattaacaa atgctatgtt tcttaatttt taatgataaa 1380
tctaactgct accttaattt ctcatggaaa gtggcaaata cagaaattat atattcttat 1440
tcattttctt ataattttta tcaattacca aatatatata aatgcaatta attgattgtt 1500
cctgtcacat aatttttttt gtttgttacc tttattcttt atccatttag tttagttctt 1560
atatctttct tttctatttc tctttttcgt ttaatctcac cgtacacata tatatccata 1620
tatcaataca aataaaaatc atttaaaaat gagaagaact ttgaaggctg ccattttagg 1680
tgctacaggt ttagtcggta ttgaatacgt cagaatgtta tcacaacacc catatattaa 1740
acctgcttat ttggctggta aaggttctgt tggtaaagct tactcagaag ttgtcagatg 1800
gcaaacagtt ggtcaagtcc caaaggaagt agccgatatg ccagttttgc ctaccgacgt 1860
caatgaaatc aaaaaggctg gtgtagatat tgttttctct ccattacctc aaggtgctgc 1920
aggtccagtt gaagaagaat ttgcaaaagc cggtttccct gtcatttcta attcaccaga 1980
tcatagattc gatccagacg tacctttgat gatacctgaa gttaacggtc acactgcatc 2040
cttaattgat gaacaaaaga aaagaagaga ctggagtggt tttattgtta ctacaccatt 2100
gtgtacagca caaggtattg ccataccatt agctcctatc tatagagatt tcagagttga 2160
ttctgtattc ataaccacta tgcaatcctt gagtggtgaa ggttatcctg gtgttgcttc 2220
attggatgta gttgacaaca tcaaggtttt gggtgacgct tacgacgcta aaactgttaa 2280
ggaagtcaca agaattttat ctgaagttaa gagaaacgtc ccaggtacta tggatgaatt 2340
gactttatca gcaacaaccc atagaatagc caccattcat ggtcactacg aagtaatgta 2400
cgttactttt aaagaagatg tcaaggtaga aaaggttaag gaaactttgg ctaacttcaa 2460
aggtgaacct caagatatga agttaccaac agcaccttcc agaccaatct tgattaccga 2520
attagataac agaccacaac cttacttcga tagatgggca ggtgacgttc caggtatgtc 2580
cgtcgtagtt ggtagattaa agcaagttaa caacagaact gttagattgg tttctttgat 2640
ccataacaca gtcagaggtg ccgctggtgg tggtattttg gtagccgaat atttgatcga 2700
aaagggttac atccctaagt gagtcattta atttattctt ttagaatata attattttgt 2760
ctttattttt gaaatgttaa tagtcttttt tttttacttt gaacaaaaaa aagtaaaatt 2820
aaaacttatc ttatatacgc ttttaaacat taaactcgtt aacgaattat ataatgattt 2880
tatcgaacta ctttatgttt ttttaataga ataatcttct ttattaatat aacttactac 2940
ttcttaatct tgttgtcctc cattcgaaac tcgagtggaa cattttctga gtatctctcg 3000
cgtctgttcg taccgttttt ccaatttctt tcgggaaacg gaactggacg cattttattt 3060
gactgttgaa agggagattt aatatttata tagcgagata taacaactaa cttataagtt 3120
tacacaggct gttatcacat atatatatat atatcaacag aggactagct cactagacta 3180
acattagata tgtcgatgct gaaccgtttg tttggtgtta gatccatttc acaatgtgct 3240
actcgtttac aacgttctac agggacaaat atatcagaag gtccactaag aattattcca 3300
caattacaaa ctttctattc tgctaatcca atgcatgata acaatatcga caagctagaa 3360
aatcttctac gtaaatatat caagttacca agtacaaaca atttattgaa gacacatggg 3420
aatacatcta cagaaattga tccaacaaaa ttattacaat cacaaaattc ttcacgtcct 3480
ttatggttat cattcaagga ttatacagtg attggaggtg gttcacgttt aaaacctact 3540
caatacacgg aacttttatt tctattgaat aaactacata gtatcgatcc acaattaatg 3600
aatgatgata ttaagaacga attagctcat tattataaga atacttcaca ggaaactaat 3660
aaagtcacca tccctaaatt ggatgaattc ggtagaagta ttggaatcgg tagaaggaaa 3720
tccgcaactg caaaagggcg cgcccagctt ttgttccctt tagtgagggt taatttcgag 3780
cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 3840
acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 3900
actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 3960
gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 4020
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 4080
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 4140
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 4200
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 4260
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 4320
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 4380
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 4440
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 4500
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 4560
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 4620
ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 4680
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 4740
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 4800
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 4860
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 4920
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 4980
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 5040
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 5100
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 5160
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 5220
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 5280
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 5340
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 5400
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 5460
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 5520
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 5580
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 5640
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 5700
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 5760
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 5820
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 5880
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 5940
gc 5942
<210> 8
<211> 11693
<212> DNA
<213> 人工序列
<220>
<223> pSK-865
<400> 8
cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 60
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 120
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 180
gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 240
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 300
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 360
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 420
aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct 480
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgcctgcagg 660
agagttacgt gatcagaatg ggaaattatt accacctcca cctggattcg aattcagcac 720
ttcctttgaa tcgaagctaa caccagagga gataaatatg aattctttac caatggaacc 780
acctaattat tcagataatg aaagtacata tgcatttaaa tttcatccaa gagattcatt 840
atcaagcaat acaggtagaa ccatcccaat tgtaggaagt agcaaaagat tagacaatag 900
gatcctggta ggaagtagca gcaaccgttt aaggaattcc ccagatgata aagacgacta 960
cgatttcgat gatgacgacg attgcgacta cgatgaatat gatatccccg aggatgatga 1020
tgacgacaac aacgataata tccatgatat ccacgatatc gagaccgatg aagacgacga 1080
agagatcaca gatgaaatgg cacacatgat ctcccatcag tgatcttata taaatataca 1140
agataatata tatatatatg taacatctaa agacagatac ccgatcgtct tccttattct 1200
tccaaaggac tctgaagttg gcccgaaatt agcaccgaaa tcgggaacaa ccaacacggc 1260
gacacccgtg gagcgactgc gcgggaaaca ggagtggcct gacagacagc gacaacaata 1320
tgccatttct gcgtatcgga gtcgtcgttg atagcggggg gtgggcagac agaaagagaa 1380
aagcgggcga catcaattcc ggcggtggag gggggagtca tcccatgttt tgtcattatt 1440
attatataaa gtagatatga ctgataaaga tttgttgggt atgctttttt gaactaactt 1500
ataaacatat tatatattac aacacggttc aatataacaa ggactgttga gtgagataac 1560
attaaattcg ggcccgttaa ctcagttttc tctctttccc tccaccccac gttactctgc 1620
gaacaaaaat acgcacagaa tgaacatctg attgattaat atttatatat tacttagtgg 1680
cacccctaca aacaaaccaa ttttgaatat ttctcaccat catgatattt atttagggca 1740
agaatttcat gtacatacgt gcgtgtactg catagttttg ttatatgtaa ataaccagca 1800
atatatcacc aatgataaat gctcagtaat ttatttggaa ccaaaatagt ttcagtaatc 1860
aaataataca ataactaaca agtgctgatt atacaacagc tgttaacaac acaaacacgc 1920
tctcttctat tctcttccct gcttgttcgt gtggtatatt cccgaatttg caatttagaa 1980
attatatttt ttaaaagaat tgttctccat tttctggtag tcgtaagtgg caaattggat 2040
cataagacac aatcttgtta gttcgactgc taacaccaga caagaccgaa cgaaaacaga 2100
aaaaaaagat aattttgtta ttctgttcaa ttctctctct ctttttaagg tatctttaca 2160
ttacattaca tatcccaaat tacaacaaga gcaagaaatg aagcacaaca acacgccatc 2220
tttcgtgatt attttatcat ttctatatcg taactaaatt aacaaatgct atgtttctta 2280
atttttaatg ataaatctaa ctgctacctt aatttctcat ggaaagtggc aaatacagaa 2340
attatatatt cttattcatt ttcttataat ttttatcaat taccaaatat atataaatgc 2400
aattaattga ttgttcctgt cacataattt tttttgtttg ttacctttat tctttatcca 2460
tttagtttag ttcttatatc tttcttttct atttctcttt ttcgtttaat ctcaccgtac 2520
acatatatat ccatatatca atacaaataa aaatcattta aaagtcgaca acaaaatgag 2580
aagaactttg aaggctgcca ttttaggtgc tacaggttta gtcggtattg aatacgtcag 2640
aatgttatca caacacccat atattaaacc tgcttatttg gctggtaaag gttctgttgg 2700
taaagcttac tcagaagttg tcagatggca aacagttggt caagtcccaa aggaagtagc 2760
cgatatgcca gttttgccta ccgacgtcaa tgaaatcaaa aaggctggtg tagatattgt 2820
tttctctcca ttacctcaag gtgctgcagg tccagttgaa gaagaatttg caaaagccgg 2880
tttccctgtc atttctaatt caccagatca tagattcgat ccagacgtac ctttgatgat 2940
acctgaagtt aacggtcaca ctgcatcctt aattgatgaa caaaagaaaa gaagagactg 3000
gagtggtttt attgttacta caccattgtg tacagcacaa ggtattgcca taccattagc 3060
tcctatctat agagatttca gagttgattc tgtattcata accactatgc aatccttgag 3120
tggtgaaggt tatcctggtg ttgcttcatt ggatgtagtt gacaacatca aggttttggg 3180
tgacgcttac gacgctaaaa ctgttaagga agtcacaaga attttatctg aagttaagag 3240
aaacgtccca ggtactatgg atgaattgac tttatcagca acaacccata gaatagccac 3300
cattcatggt cactacgaag taatgtacgt tacttttaaa gaagatgtca aggtagaaaa 3360
ggttaaggaa actttggcta acttcaaagg tgaacctcaa gatatgaagt taccaacagc 3420
accttccaga ccaatcttga ttaccgaatt agataacaga ccacaacctt acttcgatag 3480
atgggcaggt gacgttccag gtatgtccgt cgtagttggt agattaaagc aagttaacaa 3540
cagaactgtt agattggttt ctttgatcca taacacagtc agaggtgccg ctggtggtgg 3600
tattttggta gccgaatatt tgatcgaaaa gggttacatc cctaagtgaa tcgatggaga 3660
ttgataagac ttttctagtt gcatatcttt tatatttaaa tcttatctat tagttaattt 3720
tttgtaattt atccttatat atagtctggt tattctaaaa tatcatttca gtatctaaaa 3780
attcccctct tttttcagtt atatcttaac aggcgacagt ccaaatgttg atttatccca 3840
gtccgattca tcagggttgt gaagcatttt gtcaatggtc gaaatcacat cagtaatagt 3900
gcctcttact tgcctcatag aatttctttc tcttaacgtc accgtttggt cttttatagt 3960
ttcgaaatct atggtgatac caaatggtgt tcccaattca tcgttacggg cgtatttttt 4020
accaattgaa gtattggaat cgtcaatttt aaagtgaatt cgaataaaaa acacgctttt 4080
tcagttcgag tttatcatta tcaatactgc catttcaaag aatacgtaaa taattaatag 4140
tagtgatttt cctaacttta tttagtcaaa aaattagcct tttaattctg ctgtaacccg 4200
tacatgccca aaataggggg cgggttacac agaatatata acatcgtagg tgtctgggtg 4260
aacagtttat tcctggcatc cactaaatat aatggagccc gctttttaag ctggcatcca 4320
gaaaaaaaaa gaatcccagc accaaaatat tgttttcttc accaaccatc agttcatagg 4380
tccattctct tagcgcaact acagagaaca ggggcacaaa caggcaaaaa acgggcacaa 4440
cctcaatgga gtgatgcaac ctgcctggag taaatgatga cacaaggcaa ttgacccacg 4500
catgtatcta tctcattttc ttacaccttc tattaccttc tgctctctct gatttggaaa 4560
aagctgaaaa aaaaggttga aaccagttcc ctgaaattat tcccctactt gactaataag 4620
tatataaaga cggtaggtat tgattgtaat tctgtaaatc tatttcttaa acttcttaaa 4680
ttctactttt atagttagtc ttttttttag ttttaaaaca ccaagaactt agtttcgaat 4740
aaacacacat aaacaaacaa acccgggaac aaaatggtca acttacaagg taaaacagca 4800
ttggtcactg gttcaacatc aggtatcggt ttgggtatcg cagaagcatt gggtagagcc 4860
ggtgctaata tagtattaaa cggttttggt gacgttgatg ctgcattggc aacaatcgcc 4920
gctaccggtg cacaatctgc ccatcaccca gctgatatga gaaaacctga cgaaattgaa 4980
gcaatgatag ctatggcaag agaaagattc ggtaccgttg atgtcttagt aaataacgct 5040
ggtattcaac atgttgcaca agtcgaagat tttccagcac aaaagtggga tgacatcttg 5100
gccataaatt tgacttcttc attccatact acaagacacg ttatacctgc tatgagagca 5160
agaaattggg gtagaatcgt taacattgct tcagtacatg gtttagttgg ttccgccggt 5220
aaaagtgctt atgttgcagc caagcacggt ttagtcggtt tgaccaaagt aactgcattg 5280
gaaacagccg gtaccggtat cacttgtaat gctatttgcc caggttttgt tttaacacct 5340
ttggtcgctg cacaaataga tgctattgct aaaagagatg gtatttctat ggaagccgct 5400
agagctagat tgttatctga taagcaacca tcaggtcaat ttgtcactcc tgaacaattg 5460
ggtaacttgg ttttaatgtt gtgtagtcca ttcggtgacc aagttagagg tgcagcctgg 5520
gctatggatg gtggttggac agctcaatga ggatccgtga atttacttta aatcttgcat 5580
ttaaataaat tttcttttta tagctttatg acttagtttc aatttatata ctattttaat 5640
gacattttcg attcattgat tgaaagcttt gtgttttttc ttgatgcgct attgcattgt 5700
tcttgtcttt ttcgccacat gtaatatctg tagtagatac ctgatacatt gtggatgctg 5760
agtgaaattt tagttaataa tggaggcgct cttaataatt ttggggatat tggctttttt 5820
ttttaaagtt tacaaatgaa ttttttccgc caggatacta gtcatgcgac tgggtgagca 5880
tatgttccgc tgatgtgatg tgcaagataa acaagcaagg cagaaactaa cttcttcttc 5940
atgtaataaa cacaccccgc gtttatttac ctatctctaa acttcaacac cttatatcat 6000
aactaatatt tcttgagata agcacactgc acccatacct tccttaaaaa cgtagcttcc 6060
agtttttggt ggttccggct tccttcccga ttccgcccgc taaacgcata tttttgttgc 6120
ctggtggcat ttgcaaaatg cataacctat gcatttaaaa gattatgtat gctcttctga 6180
cttttcgtgt gatgaggctc gtggaaaaaa tgaataattt atgaatttga gaacaatttt 6240
gtgttgttac ggtattttac tatggaataa tcaatcaatt gaggatttta tgcaaatatc 6300
gtttgaatat ttttccgacc ctttgagtac ttttcttcat aattgcataa tattgtccgc 6360
tgcccctttt tctgttagac ggtgtcttga tctacttgct atcgttcaac accaccttat 6420
tttctaacta tttttttttt agctcatttg aatcagctta tggtgatggc acatttttgc 6480
ataaacctag ctgtcctcgt tgaacatagg aaaaaaaaat atataaacaa ggctctttca 6540
ctctccttgc aatcagattt gggtttgttc cctttatttt catatttctt gtcatattcc 6600
tttctcaatt attattttct actcataacc tcacgcaaaa taacacagtc aaatcaatca 6660
aagcggccgc aacaaaatgg aacactccgt cattgaacca accgtcccta tgcctttgcc 6720
agctatgttt gatgcccctt caggtatctt ctcctcctta gacgatgcag ttcaagccgc 6780
tactttagcc caacaacaat tgtcatccgt tgaattgaga caacaagtca taaaggcaat 6840
tagagttgcc ggtgaaagat acgctcaagt cttggcagaa atggccgtcg cagaaaccgg 6900
tatgggtaga gttgtagata aatacattaa gaatgtttca caagcaagac atacaccagg 6960
tatcgaatgt ttatccgctg aagtattaac aggtgacaac ggtttgacct tgattgaaaa 7020
tgcaccttgg ggtgttgttg cttccgttac accatcaacc aacccagctg ctacagttat 7080
taacaacgca atttctatga tcgctgccgg taactcagtt gtctttgcac ctcatccatc 7140
tgcaaagaat gtttccttaa gaactatctc cttgttgaat aaggcaatag tagccacagg 7200
tggtccagaa aatttgttag tctctgttgc aaaccctaat atcgaaactg cacaaagatt 7260
gtttagatat ccaggtatcg gtttgttggt tgtaaccggt ggtgaagctg tagtcgaagc 7320
tgcaagaaag cataccgata aaagattaat cgctgcaggt gcaggtaatc caccagttgt 7380
tgttgacgaa acagctgata tccctaaggc agcaagagcc attgttaaag gtgcatcatt 7440
cgataacaat attatctgtg ccgatgaaaa agttttaatt gtagttgaca gagttgccga 7500
tgcattattg gccgaaatgc aaagaaataa cgcagtatta ttgactccag aacaaacaga 7560
aagattgtta ccagctttgt tatctgatat cgacgaacaa ggtaaaggta gagttaacag 7620
agactacgtt ggtagagatg ccgctaaatt agcagctgca atcggtttgg aagtctcaga 7680
acatacaaga ttattgttgg cagaaacaga tgcagatcat ccattcgctg ttacagaatt 7740
aatgatgcca gttttacctg tcatcagagt caagaacgtt gatgacgcaa ttgctttggc 7800
agtcaaattg gaatctggtt gtagacatac tgctgctatg cattcaacca acataagaaa 7860
tttgaataga atggccaacg ctataaatac atcaatattc gttaagaatg gtccttgtat 7920
cgctggttta ggtttgggtg gtgaaggttg gacaagtatg acaatcagta ccccaactgg 7980
tgaaggtgtt acatcagcta gaacctttgt tagattgaga agatgcgtct tagtagatat 8040
gtttagaata gcctaaccgc gggcgattta atctctaatt attagttaaa gttttataag 8100
catttttatg taacgaaaaa taaattggtt catattatta ctgcactgtc acttaccatg 8160
gaaagaccag acaagaagtt gccgacagtc tgttgaattg gcctggttag gcttaagtct 8220
gggtccgctt ctttacaaat ttggagaatt tctcttaaac gatatgtata ttcttttcgt 8280
tggaaaagat ttcttccaaa aaaaaaaccg atgaattagt ggaaccaagg aaaaaaaaag 8340
aggtatcctt gattaaggaa cactgtttaa acagtgtggt ttccaaaacc ctgaaactgc 8400
attagtgtaa tacaagacta gacacctcga tacaaataat ggttactcaa ttcaaaactg 8460
ccgagctcta gtacctcggc gatcgctgct ggtataccta taaatattta tgtactttct 8520
ataccagtac tttactaata atatatatat gtatatctta ttttatttaa aattctttaa 8580
tcgattttat tatgcgttga cgacgaaaat gtaaacaaag cgcgaaaacg cgataatgaa 8640
aatatgagat cgatcctaaa ttaatggact agttatatca acactgacac atggaggaca 8700
taataactta gaaaagtttc aactttgtaa gtagcaaaga atagccagga atttttcaga 8760
caaatatgaa tagactgcgt agtcaacaaa gtacaaagag accatgtgct gtttgtacga 8820
aacgtaaagt taaatgtgat agaaagatac cttgtggaaa ctgtattaaa agaggccaag 8880
aagctgaatg tatcaaaacg gtgacaaatg ggtttttaca tgacccacat tctacaaacg 8940
gaacagattc aattcttaat atccttcgaa tgtggccaag ttatgaatat tggataactg 9000
atattggttt attcaagaca aaagatatag attcaactat cagaatcgaa actctagaag 9060
atgaactaag agagatcact ttttggaccg attatttaac aatggaatct tcctttaagc 9120
tattaaattt tgcagtggag aacctaggcc ccttatattt tggttgtcta ggtgatatca 9180
gtgaattatt tgtacagcta gagaattact ggactagaag aaatcaattc aaagaaaatc 9240
caagggaaac cacgttcact ttagacgata attactggaa ttcagtacta tgggcaattt 9300
tcacaatggc catctactat ataccgttag aaaatttatc tgatgaattc gaattacagt 9360
ctatctgtga acaattaaat atagatgaga atcaacattg gtctgaatca attcaattga 9420
cagttgtgca aggttttaca aaatgttgta tggatcattt gaacagagca aaatataacg 9480
agaatccggc gcgcccagct tttgttccct ttagtgaggg ttaatttcga gcttggcgta 9540
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 9600
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 9660
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 9720
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 9780
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 9840
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 9900
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 9960
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 10020
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 10080
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 10140
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 10200
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 10260
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 10320
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 10380
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 10440
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 10500
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 10560
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 10620
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 10680
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 10740
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 10800
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 10860
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 10920
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 10980
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 11040
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 11100
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 11160
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 11220
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 11280
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 11340
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 11400
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 11460
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 11520
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 11580
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 11640
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgc 11693
<210> 9
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
cttcaaagtt cttctcattt tgttgtcgac ttttgtttat aatttatcaa atatgttgat 60
t 61
<210> 10
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 10
gtcgacaaca aaatgagaag aac 23
<210> 11
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 11
ctttcaagac tcttctcatt ttgttgtcga cttttgttta taatttatca aatatgttga 60
tt 62
<210> 12
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 12
gtcgacaaca aaatgagaag agtc 24
<210> 13
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 13
tacgactcac tatagggcga attgcctgca gggttaactc agttttctct ctttccc 57
<210> 14
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 14
actagagctc cctcggacgt gggccctttt aaatgatttt tatttgtatt gatatatgg 59
<210> 15
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 15
gggcccacgt ccgagggagc tctagtacct cggcgatcgc tttgtcttta tttttgaaat 60
gttaatagtc 70
<210> 16
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 16
taaccctcac taaagggaac aaaagctggg cgcgcccttt tgcagttgcg gatttc 56
<210> 17
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 17
ggttacatcc ctaagtgaat cgatggagat tgataagact tttc 44
<210> 18
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 18
caaaagtcga caacaaaatg agaagaactt tgaaggctgc 40
<210> 19
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 19
cttcaaagtt cttctcattt tgttgtcgac ttttgtttat aatttattga aatatgttg 59
<210> 20
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 20
ctgtagcacc taaaatggca gccttcaaag ttcttctcat ttttaaatga tttttatttg 60
tattgatata tggatatata tgtgtacgg 89
<210> 21
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 21
ggttacatcc ctaagtgagt catttaattt attcttttag aatataatta ttttgtcttt 60
atttttgaaa tgttaatagt ctttttttt 89
<210> 22
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 22
ccgtacacat atatatccat atatcaatac aaataaaaat catttaaaaa tgagaagaac 60
tttgaaggct gccattttag g 81
<210> 23
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 23
atttcaaaaa taaagacaaa ataattatat tctaaaagaa taaattaaat gactcactta 60
gggatgtaac ccttttcgat caaatattc 89
<210> 24
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 24
aaattcgggc ccgttaactc agttttctct ctttccctcc acc 43
<210> 25
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 25
tttgttgtcg acttttaaat gatttttatt tgtattgata tatggatata tatgtgtacg 60
g 61
<210> 26
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 26
tgctacctta atttctcatg gaaagtggca 30
<210> 27
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 27
gttaacgagt ttaatgttta aaagcgtata taag 34
<210> 28
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 28
aatctcaccg tacacatata tatccatata tcaatacaaa taaaaatcat ttaaaaatga 60
gaagagtctt gaaagcagca atcttgg 87
<210> 29
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 29
gtggaaccca agattgctgc tttcaagact cttctcattt ttaaatgatt tttatttgta 60
ttgatatatg gatatatatg tgtacgg 87
<210> 30
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 30
tggtattttg gcaacagaat ttttggttga aaagggttac atggattgat ttgtctttat 60
ttttgaaatg ttaatagtct ttttttt 87
<210> 31
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 用于吉布森组装的寡聚物
<400> 31
tttgttcaaa gtaaaaaaaa aagactatta acatttcaaa aataaagaca aatcaatcca 60
tgtaaccctt ttcaaccaaa aattctg 87
<210> 32
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 32
cggactttag agccttgtag ac 22
<210> 33
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 33
atctggttac actcacgatg g 21
<210> 34
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 34
ccaagtacgt tagagctaac gg 22
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 35
gagcttctct ggtatcagct 20
<210> 36
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 36
agctttagca aacattagac cc 22
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 37
attccatccg aatatgctgg t 21
<210> 38
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 38
ggaacctaaa tgactgttgg ca 22
<210> 39
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 39
aggatgttga tttcgactcg t 21
<210> 40
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 40
ttccaaaggg taccaattta gctg 24
<210> 41
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 41
gtaccgctaa tgaacctaaa cca 23
<210> 42
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 42
agagctgaca ctagagaagc c 21
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 43
gatgtgtcta cgacgtatct acc 23
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 44
gtactggtaa cgtccaagtc 20
<210> 45
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 45
gaacccttcc atactctacc a 21
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 46
ttcagttcgt gctactcaag g 21
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 47
tcaattgcaa cgacagagac 20
<210> 48
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 48
ccgtaccctg aagagtttac tg 22
<210> 49
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 49
caaccataga ttcacgaatt gctc 24
<210> 50
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 50
agtggatttg gattaatggg tg 22
<210> 51
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 51
gcttctgtaa cacctttaac ac 22
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 52
aaattggtga ccgtgttggt 20
<210> 53
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 53
aaccaccttt actacggtaa cca 23
<210> 54
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 54
tttagtcgtc atctgttcag gt 22
<210> 55
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 55
gagacaccta acaaaccaaa tgg 23
<210> 56
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 56
gattcaagct tcttctcgta tcgg 24
<210> 57
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 57
ggaaatgata ccattcacga cct 23
<210> 58
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 58
gttccgtcaa agaaatcaag ca 22
<210> 59
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 59
tggtaaacct gtatctgaca tcac 24
<210> 60
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 60
tttagttgtc atttgtgccg gt 22
<210> 61
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 61
gacacctaac aaaccaaacg ga 22
<210> 62
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 62
gctaacttca aaggtgaacc tc 22
<210> 63
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 63
aatctaccaa ctacgacgga c 21
<210> 64
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 64
cagattcgaa ccagatatcc ct 22
<210> 65
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 65
ccaatggtaa caatacacct tgag 24
<210> 66
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 66
ggtaaagctt actcagaagt tgtc 24
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 67
cagcaccttg aggtaatgga 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 68
ctatgcaagc tgtttccggt 20
<210> 69
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 69
cgttgacgtt tctcttagtt tcag 24
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 70
ctttgagtgc aagtatcgcc 20
<210> 71
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 71
tgtgtaattg ttcaccaaag cc 22
<210> 72
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于qPCR的引物
<400> 72
gagatagcac accattcacc a 21
<210> 73
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 73
caacgttaag tactctggtg tttg 24
<210> 74
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 74
atgagaagaa ctttgaaggc tg 22
<210> 75
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 75
ttacttaggg atgtaaccct tttcga 26
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 76
atgaaaattt ttgcttatgg 20
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 77
ttaatattca acagcaatag 20
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 78
atggttttgc attctaaagt 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 79
ttaacaagaa gatttagaaa 20
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 80
atgtcttcta tgccaaatca 20
<210> 81
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 81
ttatttattt tccaattcag 20
PCT/RO/134表