类异戊二烯的制造方法以及用于该制造方法的蛋白质、基因和转化体
阅读说明:本技术 类异戊二烯的制造方法以及用于该制造方法的蛋白质、基因和转化体 (Method for producing isoprenoid, and protein, gene and transformant used for same ) 是由 荒木康子 筱原靖智 北洁 于 2018-05-11 设计创作,主要内容包括:本发明要解决的课题在于提供类异戊二烯的制造方法,该制造方法可以以与现有技术相比更高的收率生产类异戊二烯,诸如壳二孢呋喃酮、冬青生菌素A和壳二孢氯素及它们的衍生物,因此能够以工业规模生产类异戊二烯。上述课题是通过冬青生菌素A和壳二孢氯素等的类异戊二烯的制造方法等而得以解决;该制造方法包括使用由壳二孢呋喃酮、冬青生菌素A或壳二孢氯素的生物合成基因进行转化的转化体或者它们的基因敲除生物而获得壳二孢呋喃酮、冬青生菌素A和壳二孢氯素等的类异戊二烯的步骤。(An object of the present invention is to provide a method for producing isoprenoids, which can produce isoprenoids such as ascofuranone, ilicin a, and ascochlorin and derivatives thereof in higher yields than in the prior art, and thus can produce isoprenoids on an industrial scale. The above object is achieved by a method for producing isoprenoids such as ilexolone A and ascochloride; the production method comprises a step of obtaining isoprenoids such as ascofuranone, ilicin A and ascochlorin using a transformant transformed with a biosynthetic gene of ascofuranone, ilicin A or ascochlorin or a knockout organism thereof.)
相关申请的交叉引用
本申请要求于2017年5月11日提交的日本专利申请2017-94509号及于2018年1月17日提交的日本专利申请2018-005888号的优先权,这些专利申请的全部描述以公开的方式并入本文中。
技术领域
本发明涉及用于合成如壳二孢呋喃酮、壳二孢氯素、冬青生菌素A的类异戊二烯的基因以及使用该基因的类异戊二烯的制造方法。
背景技术
在包括人口密集地区零散分布的日本在内的发达国家及发展中国家中,由病毒或原虫等所导致的感染症经常成为问题。另外,2型糖尿病、高胆固醇血症、癌和由这些疾病所引起的并发症等生活习惯病导致医疗费用的增大和劳动力的低下等,尤其在日本成为了深刻的问题。
因此,希望开发出对于这些疾病的治疗或预防而言为有效的物质。作为这种物质中的一个,已知有作为类异戊二烯烃类生理活性物质的壳二孢氯素和壳二孢呋喃酮。壳二孢氯素和壳二孢呋喃酮抑制电子传递系统并降低细胞内ATP浓度,由此预期可用于例如由采采蝇传播的由原虫锥虫所致原虫感染症即非洲昏睡症的治疗或预防(例如,参考下述专利文献1,该文献的全部内容以公开的方式并入本文中)。
如果罹患上非洲昏睡症,在感染初期原虫在血流中增殖。如果进入慢性期原虫侵入中枢神经,从而呈现精神错乱或全身痉挛等症状,最终陷入嗜眠状态而死亡。据说非洲昏睡症所导致的非洲死亡者每年在1万人以上,有潜在感染风险的人口在7,000万人以上。现在,对于非洲昏睡症尚无使用疫苗的预防方法,其治疗则依赖于药物疗法。但是,对于非洲昏睡症为有效的治疗药存在着副作用大等问题。
因此,期待利用壳二孢氯素或壳二孢呋喃酮特异性地抑制锥虫的电子传递系统,由此预防或治疗非洲昏睡症。如果原虫侵入哺乳动物体内,则主要在糖酵解酶体内部的糖酵解系统中进行ATP合成,其中锥虫交替氧化酶(TAO)所催化的NAD+再生是必需的,此时壳二孢氯素或壳二孢呋喃酮抑制该TAO的作用。受染的哺乳动物不具有与TAO同样的酶,因此能够特异性地驱除锥虫。此外,有人报告特别是壳二孢呋喃酮及其衍生物即使在非常低的浓度下也抑制TAO。
另外,已知在壳二孢氯素、壳二孢呋喃酮及它们的衍生物中,存在抗肿瘤活性、降血糖作用、降血脂作用、糖酵解抑制作用、抗氧化作用等(例如,参考下述专利文献2,该文献的全部内容以公开的方式并入本文中)。此外,作为壳二孢氯素或壳二孢呋喃酮的生物合成途径中间体的冬青生菌素A(LL-Z1272α),也基于较高的抗原虫剂(参考下述专利文献3,该文献的全部内容以公开的方式被引用到本文中)或免疫抑制剂、风湿病治疗剂、抗癌剂、排斥反应治疗药、抗病毒药、抗幽门螺杆菌药和糖尿病治疗药等(参考下述专利文献4,该文献的全部内容以公开的方式被引用到本文中)的作用,而期待作为新药物的有效成分。此外,也已知冬青生菌素A不仅是壳二孢氯素或壳二孢呋喃酮而且是其他类异戊二烯的生物合成的中间体,是也可用作它们的原料的有用化合物。
在类异戊二烯中,作为壳二孢呋喃酮或壳二孢氯素的制造方法,已知有对壳二孢属(Ascochyta)丝状菌进行培养并且分离提取蓄积在菌丝中的壳二孢呋喃酮的方法(例如,参考下述专利文献5和6,这些文献的全部内容以公开的方式被引用到本文中)。此外,下述非专利文献1(该文献的全部内容以公开的方式被引用到本文中)中报告了,已知作为壳二孢呋喃酮产生株的野豌豆壳二孢(Ascochyta viciae)确实是菌核生枝顶孢(Acremoniumsclerotigenum)。
现有技术文献
专利文献
专利文献1:日本特开平09-165332号公报
专利文献2:日本特开2006-213644号公报
专利文献3:国际公开第2012/060387号
专利文献4:国际公开第2013/180140号
专利文献5:日本特公昭56-25310号公报
专利文献6:日本特公昭45-9832号公报
非专利文献
非专利文献1:J Antibiot(东京).2016年11月2日。对作为菌核生枝顶孢(Acremonium sclerotigenum)的壳二孢呋喃酮产生真菌野豌豆壳二孢(Ascochytaviciae)的重新鉴定。
发明内容
发明要解决的课题
根据如专利文献5和6中所描述方法的、使用已知生产壳二孢氯素或壳二孢呋喃酮的丝状菌的方法,这些物质的收率很大程度上取决于所使用的丝状菌。但是,到目前为止已知的微生物中的壳二孢氯素或壳二孢呋喃酮的含量作为工业规模的生产量是少的,进而该含量在培养条件稍微不同的情况下有很大的差异,因此在现有方法中存在无法实现大量壳二孢氯素或壳二孢呋喃酮的稳定生产的问题。另外,到现在为止关于大量获得冬青生菌素A的制造方法是未知的。
例如,为了实现如壳二孢氯素或壳二孢呋喃酮及作为其中间体的冬青生菌素A的类异戊二烯的大量生产,一般认为可对以高浓度稳定地生产类异戊二烯的野生株进行分离或育种、或者构建运用生物工程技术将参与类异戊二烯生物合成的基因***的转化株。但是,到现在为止对于以高浓度稳定地生产类异戊二烯的野生株几乎是未知的,进而对于类异戊二烯的生物合成途径仍然有许多不明确的部分。
另外,对于类异戊二烯中的壳二孢氯素、壳二孢呋喃酮和冬青生菌素A的生物合成基因也有许多尚不明确的部分。
因此,本发明要解决的课题在于提供类异戊二烯的制造方法,该制造方法与现有技术相比可以以更高收率稳定地生产如壳二孢呋喃酮、冬青生菌素A和壳二孢氯素及它们的衍生物的类异戊二烯,因此能够以工业规模制造类异戊二烯。
用于解决课题的手段
本发明者们为解决上述课题而反复进行了努力研究,结果在作为丝状菌的一种的菌核生枝顶孢(Acremonium sclerotigenum)中,继对催化参与壳二孢氯素和冬青生菌素A的生物合成的反应的酶进行编码的基因群(基因ascB~基因ascH的7个基因)之后,成功地鉴定了对催化参与编码壳二孢呋喃酮生物合成的反应的酶进行编码的基因群(基因ascI~基因ascK的3个基因)。
接着,本发明者们制作了用于过量表达由上述基因群所编码蛋白质的DNA构建体,接着将所得DNA构建体作为宿主生物而导入作为丝状菌的一种的曲霉(Aspergillus)属微生物或枝顶孢(Acremonium)属微生物中并进行转化,由此成功地制作过量表达由上述基因群所编码蛋白质的转化丝状菌。此外,也成功地制作了枝顶孢属微生物的ascF、ascG和ascI的基因敲除丝状菌。
上述转化丝状菌可以依照通常的培养丝状菌的方法进行培养,其增殖速度等也与宿主生物没有特别的不同。由此可明了,如果使用上述转化丝状菌或基因敲除丝状菌,则能够生产壳二孢呋喃酮、冬青生菌素A和壳二孢氯素等的类异戊二烯。
另一方面,有人认为在壳二孢氯素生物合成基因簇中的基因ascA是转录因子,因此有人认为即使不将基因ascA导入并使其表达,也不会对壳二孢氯素的生物合成造成影响。实际上,可明了,如上所述,如果使用将基因ascB~基因ascH的7个基因导入没有基因ascA的曲霉属微生物中的转化丝状菌,则能够生物合成壳二孢氯素。
尽管有这样的事实,但本发明者们通过将基因ascA导入具有壳二孢氯素或壳二孢呋喃酮的生物合成基因的菌核生枝顶孢中,而成功地制作使基因ascA强烈表达的转化丝状菌。然后,出人意料地发现,通过使用使该基因ascA强烈表达的转化丝状菌,不仅可以大量地生产壳二孢氯素而且可以大量地生产壳二孢呋喃酮。
本发明是基于如上所述的成功例或发现而最终完成的发明。
因此,根据本发明的一个形态,提供下述[1]至[11]的基因、转化体、基因敲除生物及制造方法。
[1]基因ascI,其包含下述(1)至(5)中任一项的碱基序列,即对具有催化冬青生菌素A环氧化物的一原子氧加成反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)序列表的序列号8中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号8中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化冬青生菌素A环氧化物的一原子氧加成反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号18或67中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号18或67中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列
[2]基因ascJ,其包含下上述(1)至(5)中任一项的碱基序列,即对具有催化由冬青生菌素A环氧化物生成壳二孢呋喃醇的反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号9中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号9中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化利用由冬青生菌素A环氧化物通过AscI蛋白质的反应所生成的化合物而生成壳二孢呋喃醇的反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号19中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号19中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列
[3]基因ascK,其包含下述(1)至(5)中任一项的碱基序列,即对具有催化由壳二孢呋喃醇生成壳二孢呋喃酮的反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号10中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号10中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化由壳二孢呋喃醇生成壳二孢呋喃酮的反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号20中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号20中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[4]转化体(其中,排除人),其中将上述[1]至[3]中记载的基因ascI、ascJ和ascK中的任1个基因或它们的组合基因***并且使该***基因表达。
[5]上述[4]中所述的转化体,其中进一步将基因ascF、ascE、ascD、ascB和ascC中的任1个基因或它们的组合基因***并且使该***的基因表达。
[6]来源于具有基因ascG的野生型生物的该基因ascG的基因敲除生物(其中,排除人),其包含下述(1)至(5)中任一项的碱基序列,即对具有催化冬青生菌素A环氧化物的环化反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号6中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号6中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化冬青生菌素A环氧化物的环化反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号16或40中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号16或40中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[7]壳二孢呋喃酮的制造方法,其包括使用上述[6]中所述的基因敲除生物而获得壳二孢呋喃酮的步骤。壳二孢呋喃酮类似物、壳二孢呋喃酮前体及其类似物的制造方法,其包括使用上述[6]中所述的基因敲除生物而获得壳二孢呋喃酮类似物、壳二孢呋喃酮前体及其类似物的步骤。
[8]来源于具有基因ascF的野生型生物的该基因ascF的基因敲除生物(其中,排除人),其包含上述(1)至(5)中任一项的碱基序列,即编码具有催化冬青生菌素A的环氧化反应的活性的酶的氨基酸序列的碱基序列:
(1)序列表的序列号5中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下下进行杂交的碱基序列;
(2)与由序列号5中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化冬青生菌素A的环氧化反应的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号15或39中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号15或39中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[9]冬青生菌素A的制造方法,其包括使用上述[8]中所述的基因敲除生物而获得冬青生菌素A的步骤。冬青生菌素A类似物、冬青生菌素A前体及其类似物的制造方法,其包括利用上述[8]中所述的基因敲除生物而获得冬青生菌素A类似物、冬青生菌素A前体及其类似物的步骤。
[10]来源于具有上述[1]中所述的基因ascI的野生型生物的该基因ascI的基因敲除生物(其中,排除人)。
[11]壳二孢氯素的制造方法,其包括使用上述[10]中所述的基因敲除生物而获得壳二孢氯素的步骤。壳二孢氯素类似物、壳二孢氯素前体及其类似物的制造方法,其包括使用上述[10]中所述的基因敲除生物而获得壳二孢氯素类似物、壳二孢氯素前体及其类似物的步骤。
另外,在本发明的另一个形态中,提供下述[12]至[22]的基因、转化体及制造方法。
[12]基因ascF,其包含下述(1)至(5)中任一项的碱基序列,即对具有催化冬青生菌素A的环氧化反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号5中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号5中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化冬青生菌素A的环氧化反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号15或39中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号15或39中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[13]基因ascG,其包含下述(1)至(5)中任一项的碱基序列,即对具有催化冬青生菌素A环氧化物的环化反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号6中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号6中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化冬青生菌素A环氧化物的环化反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号16或40中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号16或40中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[14]基因ascH,其包含对具有催化下述(1)至(5)中任一项的碱基序列,即对具有催化通过由冬青生菌素A利用AscF蛋白质和AscG蛋白质的反应所生成的化合物的脱氢化而生成壳二孢氯素的反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号7中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号7中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化通过由冬青生菌素A利用AscF蛋白质和AscG蛋白质的反应所生成化合物的脱氢化而生成壳二孢氯素的反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号17或41中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号17或41中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[15]基因ascE,其包含对具有催化上述(1)至(5)中任一项的碱基序列,即具有催化由LL-Z1272β生成冬青生菌素A的反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)序列表的序列号4中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号4中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化由LL-Z1272β生成冬青生菌素A的反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对与序列号14或38中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号14或38中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[16]基因ascD,其包含下述(1)至(5)中任一项的碱基序列,即对具有催化由乙酰辅酶A生成O-苔色酸的反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号3中记载的碱基序列或与该碱基序列互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号3中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化由乙酰辅酶A生成O-苔色酸的反应的活性的氨基酸序列进行编码的碱基序列;
(4)对与序列号13或37中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号13或37中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[17]基因ascB,其包含上述(1)至(5)中任一项的碱基序列,即对具有催化由O-苔色酸生成冬青生菌素酸B的反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号1中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号1中记载的碱基序列所组成的基因具有60%以上序列一致性的碱基序列;
(3)对具有催化由O-苔色酸生成冬青生菌素B的反应的活性的酶的氨基酸序列进行编码的碱基序列;
(4)对于与序列号11或35中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号11或35中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[18]基因ascC,其包含上述(1)至(5)中任一项的碱基序列,即对具有催化由冬青生菌素B生成LL-Z1272β的反应的活性的酶的氨基酸序列进行编码的碱基序列:
(1)与序列表的序列号2中记载的碱基序列或与该碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;
(2)与由序列号2中记载的碱基序列所组成的基因具有60%以上序列一致性碱基序列;
(3)编码具有催化由冬青生菌素B生成LL-Z1272β的反应的活性的酶的氨基酸序列的碱基序列;
(4)对与序列号12或36中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列进行编码的碱基序列;以及
(5)对序列号12或36中记载的氨基酸序列的1个或数个氨基酸发生缺失、置换和/或添加的氨基酸序列进行编码的碱基序列。
[19]转化体(其中,排除人),其中将[12]至[18]中所述的基因ascF、ascG、ascH、ascE、ascD、ascB和ascC中的任意1个基因或它们的组合基因***并且使该***基因表达。
[20]冬青生菌素A的制造方法,其包括使用[19]中所述的转化体而获得冬青生菌素A的步骤。
[21]壳二孢氯素的制造方法,其包括使用[19]中所述的转化体而获得壳二孢氯素的步骤。
[22]壳二孢呋喃酮的制造方法,其包括使用[19]中所述的转化体而获得壳二孢呋喃酮的步骤。
另外,在本发明的另一个形态中,提供下述[23]至[31]的蛋白质、基因、转化体及方法。
[23]AscA蛋白质,其包含下述(a)至(c)中任一项的氨基酸序列,并且具有增强[1]至[3]和[12]至[18]中任一项的1个以上基因的表达的活性:
(a)序列表的序列号66中记载的氨基酸序列;
(b)在序列表的序列号66中记载的氨基酸序列中1个至数个氨基酸发生缺失、置换或添加的氨基酸序列;以及
(c)与序列表的序列号66中记载的氨基酸序列具有60%以上序列一致性的氨基酸序列。
[24]基因ascA,其包含下述(A)至(D)中任一项的碱基序列,即对具有增强[1]至[3]和[12]至[18]中任一项的1个以上基因的表达的活性的蛋白质的氨基酸序列进行编码的碱基序列:
(A)对[23]中所述的蛋白质的氨基酸序列进行编码的碱基序列;
(B)序列表的序列号65中记载的碱基序列;
(C)与序列表的序列号65中记载的碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列;以及
(D)与由序列表的序列号65中记载的碱基序列所组成的基因具有80%以上序列一致性的碱基序列。
[25]使使用丝状菌的类异戊二烯的产生增大的方法,其包括在具有[1]至[3]和[12]至[18]中任一项所述的1个以上基因的丝状菌中,通过增强[23]中所述的AscA蛋白质或[24]中所述的基因ascA的表达而使使用该丝状菌的类异戊二烯的产生增大的步骤。
[26]根据[25]所述的方法,其中类异戊二烯是选自由壳二孢呋喃酮、壳二孢氯素和冬青生菌素A所组成的组群的至少1种化合物。
[27]以使根据[24]所述的基因ascA的表达增强的方式而进行转化的转化体(其中,排除人)。
[28]根据[27]所述的转化体,其中前述转化体的宿主生物是枝顶孢(Acremonium)属微生物。
[29]类异戊二烯的制造方法,其包括在具有[1]至[3]和[12]至[18]中任一项所述的1个以上基因的丝状菌中,通过增强根据[23]所述的AscA蛋白质或根据[24]所述的基因ascA的表达而获得类异戊二烯的步骤。
[30]类异戊二烯的制造方法,其包括通过培养根据[27]至[28]中任一项所述的转化体而获得类异戊二烯的步骤。
[31]根据[29]或[30]中所述的方法,其中类异戊二烯是选自由壳二孢呋喃酮、壳二孢氯素和冬青生菌素A所组成的组群的至少1种化合物。
发明效果
根据本发明,可以以高收率稳定地制造壳二孢呋喃酮、冬青生菌素A和壳二孢氯素等的类异戊二烯。因此,根据本发明,可以期待以工业规模制造壳二孢呋喃酮、冬青生菌素A和壳二孢氯素等的类异戊二烯。
附图说明
图1是示出通过转录物组分析所预测的壳二孢氯素生物合成基因簇的图。
图2是示出如在下述实施例中所描述的、对As-DBCE株提取物和冬青生菌素A标准品的HPLC分析结果的图。
图3是示出如下述实施例中描述的对As-DBCE株、As-DBCEF株、As-DBCEFG株和As-DBCEFGH株的各自提取物的HPLC分析结果的图。
图4A是示出如下述实施例中所描述的、在分别使用野生株反应液和As-F反应液的情况下反应物的LC/MS分析结果的图。
图4B是示出如下述实施例中所描述的、在分别使用As-F反应液和As-FG反应液的情况下反应物的LC/MS分析结果的图。
图5是示出如下述实施例中所描述的、在分别使用As-FG反应液和As-FGH反应液的情况下反应物的LC/MS分析结果的图。
图6是示出在冬青生菌素A和壳二孢氯素的反应体系中的各酶反应与反应物的关系的方案图。
图7是示出通过转录物组分析所预测的壳二孢呋喃酮生物合成基因簇的图。
图8是如下述实施例中所描述的、在分别使用As-F反应液、As-FI反应液、As-FIJ反应液、As-FIK反应液、As-FJK反应液、As-IJK反应液和As-FIJK反应液的情况下反应物的LC/MS分析结果的图。
图9是示出如下述实施例中所描述的、在使用As-FIJK反应液的情况下反应物的LC/MS分析结果和MS/MS分析结果的图。
图10是如下述实施例中所描述的、在分别使用As-F反应液、As-FI反应液、As-FIJ反应液、As-FIK反应液、As-FJK反应液、As-IJK反应液和As-FIJK反应液的情况下反应物的LC/MS分析结果的图。
图11是示出壳二孢呋喃酮、冬青生菌素A和壳二孢氯素的反应体系中的各酶反应与反应物的关系的图。
图12是如在下述实施例中所描述的As-DBCEFIred株和As-DBCEFIJKred株的各自提取物的HPLC分析结果的图。
图13是示出如下述实施例中所描述的菌核生枝顶孢F-1392株的ascG破坏株的提取物的HPLC分析结果的图。
图14是如在下述实施例中所描述的As-Tr-DB株和As-DB株的提取物的HPLC分析结果的图。
图15是示出如下述实施例中所描述的As-DBC-Tr-E株和As-DBC株的提取物的HPLC分析结果的图。
图16是示出从冬青生菌素A环氧化物到壳二孢呋喃酮的反应体系中的各酶反应与反应物的关系的方案图。
图17是示出如在下述实施例中所描述的ΔascG株和ΔascG-I株的提取物的HPLC分析结果的图。
图18是示出如在下述实施例中所描述的ΔascG/ΔascH株和ΔascG/ΔascH+Nd-ascG株的提取物及As-FG反应液的HPLC分析结果的图。
图19是示出如在下述实施例中所描述的野生株和AscA强制表达株的各自提取物的HPLC分析结果的图。
具体实施方式
下面,对于作为本发明一个形态的基因、转化体、基因敲除生物及制造方法的详细内容加以说明,但本发明的技术范围并不仅受本条目的事项所限制,本发明只要实现其目的则能够采用各种形态。另外,本发明的技术范围并不局限于本说明书中的任何猜测或推论。
(类异戊二烯)
本说明书中的“类异戊二烯”如果是如通常所知的将异戊二烯作为结构单元的化合物则无特别限制,例如可举出冬青生菌素酸B(灰叶酸,grifolic acid)、冬青生菌素酸A、冬青生菌素B(LL-Z1272β)、冬青生菌素A(LL-Z1272α)、冬青生菌素A环氧化物、冬青生菌素C、壳二孢氯素、羟基冬青生菌素A环氧化物、壳二孢呋喃醇、壳二孢呋喃酮及它们的衍生物等。但是,在本说明书中,有时主要地将壳二孢呋喃酮、冬青生菌素A和壳二孢氯素以及它们的衍生物称为“类异戊二烯”。另外,有时将冬青生菌素A环氧化物、冬青生菌素C称为“壳二孢氯素前体”,将冬青生菌素A环氧化物、羟基冬青生菌素A环氧化物、壳二孢呋喃醇称为“壳二孢氯素前体”,将冬青生菌素B、冬青生菌素酸A、冬青生菌素B称为“冬青生菌素A前体”。
在本说明书中的所谓“衍生物”包括通过化学合成法、酶合成法、发酵法或者将它们加以组合的方法等,由冬青生菌素酸B、冬青生菌素酸A、冬青生菌素B、冬青生菌素A、冬青生菌素A环氧化物、冬青生菌素C、壳二孢氯素、羟基冬青生菌素A环氧化物、壳二孢呋喃醇、壳二孢呋喃酮等所获得的全部改性化合物。其中,“衍生物”中包括即使不使用冬青生菌素酸B、冬青生菌素酸A、冬青生菌素B、冬青生菌素A、冬青生菌素A环氧化物、冬青生菌素C、壳二孢氯素、羟基冬青生菌素A环氧化物、壳二孢呋喃醇、壳二孢呋喃酮等,也能够利用本说明书描述的酶中的任一种酶生物合成的具有与上述化合物类似结构的化合物及它们的全部修饰化合物。壳二孢呋喃酮、壳二孢氯素、冬青生菌素A或它们的前体全部是聚酮化合物与萜类化合物杂化而成的混源萜类化合物。如在本说明书中所揭示,混源萜类化合物是在利用如AscD的聚酮合成酶而生物合成聚酮骨架,然后利用如AscB的异戊烯基转移酶对C10、C15、C20等的类异戊二烯化合物进行转化,由此将聚酮化合物与萜类化合物杂化而生物合成。也就是说,通过改变底物特异性或者改变一致性较高但底物特异性不同的AscD或AscB的组合,能够生物合成各种冬青生菌素B类似化合物。作为一个例子,colletochlorin B是冬青生菌素A的1个异戊二烯骨架较短,亦即具有C10的单萜结构的类似于冬青生菌素A的类似化合物,但该化合物可通过将与本说明书的AscD与改变特异性的AscB、或者将与底物特异性不同的AscB的一致性较高的酶的2种酶的反应加以组合,或者通过有机化学合成法而获得冬青生菌素B的萜部分为C10的单萜结构的化合物,然后进一步通过AscC、AscE的反应而合成,因此在本说明书中可包含在所谓的“衍生物”中。
(酶(1)至(11)的氨基酸序列)
本发明一个形态的基因ascB包含对具有催化由O-苔色酸生成冬青生菌素B的反应的活性的酶(下面也称为“酶(1)”)的氨基酸序列进行编码的碱基序列。
本发明一个形态的基因ascC包含对具有催化由冬青生菌素B生成LL-Z1272β的反应的活性的酶(下面也称为“酶(2)”)的氨基酸序列进行编码的碱基序列。
本发明一个形态的基因ascD包含对具有催化由乙酰辅酶A生成O-苔色酸的反应的活性的酶(下面也称为“酶(3)”)的氨基酸序列进行编码的碱基序列。
本发明一个形态的基因ascE包含对具有催化由LL-Z1272β生成冬青生菌素A的反应的活性的酶(下面也称为“酶(4)”)的氨基酸序列进行编码的碱基序列。酶(4)也可以是具有催化由冬青生菌素B生成冬青生菌素酸A的反应的活性的酶。
本发明一个形态的基因ascF包含对具有催化冬青生菌素A的环氧化反应的活性的酶(下面也称为“酶(5)”)的氨基酸序列进行编码的碱基序列。
本发明一个形态的基因ascG包含对具有催化冬青生菌素A环氧化物的环化反应的活性的酶(下面也称为“酶(6)”)的氨基酸序列进行编码的碱基序列。通过使用酶(6)的反应由冬青生菌素A环氧化物所生成的化合物是冬青生菌素C。
本发明一个形态的基因ascH包含对具有催化通过由冬青生菌素A利用AscF蛋白质和AscG蛋白质的反应所生成化合物的脱氢化而生成壳二孢氯素的反应的活性的酶(下面也称为“酶(7)”)的氨基酸序列进行编码的碱基序列。
本发明一个形态的基因ascI包含对具有催化冬青生菌素A环氧化物的一原子氧加成反应的活性的酶(下面也称为“酶(8)”)的氨基酸序列进行编码的碱基序列。所谓冬青生菌素A环氧化物的一原子氧加成反应,是指将冬青生菌素A环氧化物的氢原子(-H)置换成羟基(-OH)的反应。通过使用酶(8)的反应由冬青生菌素A环氧化物所生成的化合物是羟基冬青生菌素A环氧化物。
本发明一个形态的基因ascJ和ascK包含对具有催化利用由冬青生菌素A环氧化物通过AscI蛋白质的反应所生成的化合物而生成壳二孢呋喃酮的反应的活性的酶(下面分别也称为“酶(9)”和“酶(10)”)的氨基酸序列进行编码的碱基序列。
本发明的技术范围并不局限于任何的猜测或推论,但存在以下的可能性:酶(1)具有与异戊烯基转移酶同样的功能;酶(2)具有与氧化物还原酶同样的功能;酶(3)具有与聚酮合成酶同样的功能;酶(4)具有与卤化酶同样的功能;酶(5)具有与作为环氧酶的p450/p450还原酶同样的功能;酶(6)具有与萜类环化酶同样的功能;酶(7)具有与作为脱氢酶的p450同样的功能;酶(8)具有与作为单氧化酶的p450同样的功能;酶(9)具有与萜类环化酶同样的功能;并且酶(10)具有与脱氢酶同样的功能。但是,如在下述实施例中所描述的,酶(9)和酶(10)通过使编码这些酶的基因的两种基因进行表达,能够由AscI蛋白质的反应物合成壳二孢呋喃酮。在本说明书中,无论具体的作用机制如何,在通过使编码2种酶的基因进行表达而发生特定反应的情况下,将一种酶与另一种酶称为“共同地起作用”。其中,酶(9)是具有催化由羟基冬青生菌素A环氧化物生成壳二孢呋喃醇的反应的酶。酶(10)是具有催化由壳二孢呋喃醇生成壳二孢呋喃酮的反应的活性的酶。
本发明一个形态的AscA蛋白质是具有使在编码酶(1)至(10)的基因中的1个以上基因的表达增强的活性的蛋白质。AscA蛋白质通过使在编码酶(1)至(10)的基因中的1个以上基因的表达增强,而促进包含这些基因的生物体中的类异戊二烯的生物合成,另外使使用该生物体的类异戊二烯的产生增大。AscA蛋白质能够发挥对酶(1)至(10)进行编码的基因的正的转录因子的作用。此外,对AscA蛋白质进行编码的基因可以包含于壳二孢氯素生物合成基因或壳二孢呋喃酮生物合成基因中。AscA蛋白质严格地讲是转录因子而不是酶,但在本说明书中为了方便起见将AscA蛋白质归属为酶,有时称为“酶(11)”。
酶(1)至(11),如果具有上述的酶活性,则对于氨基酸序列没有特别限定。
例如,存在作为具有上述酶活性的酶(1)的一个形态的在序列号11、35和47中所示的氨基酸序列;存在作为具有上述酶活性的酶(2)的一个形态的在序列号12、36和48中所示的氨基酸序列;存在作为具有上述酶活性的酶(3)的一个形态的在序列号13、37和49中所示的氨基酸序列;存在作为具有上述酶活性的酶(4)的一个形态的在序列号14、38和50中所示的氨基酸序列;存在作为具有上述酶活性的酶(5)的一个形态的在序列号15和39中所示的氨基酸序列;存在作为具有上述酶活性的酶(6)的一个形态的在序列号16和40中所示的氨基酸序列;存在作为具有上述酶活性的酶(7)的一个形态的在序列号17和41中所示的氨基酸序列;存在作为具有上述酶活性的酶(8)的一个形态的在序列号18中所示的氨基酸序列;存在作为具有上述酶活性的酶(9)的一个形态的在序列号19中所示的氨基酸序列;作为具有上述酶活性的酶(10)的一个形态的在序列号20中所示的氨基酸序列;存在作为具有上述酶活性的酶(11)的一个形态的在序列号66中所示的氨基酸序列。
具有序列号11~20和66中所示氨基酸序列的酶,全部都来源于作为枝顶孢属丝状菌的一种的菌核生枝顶孢(Acremonium sclerotigenum),它们被本发明者们分别取名为AscA、AscB、AscC、AscD、AscE、AscF、AscG、AscH、AscI、AscJ和AscK蛋白质。另外,编码这些酶的基因的碱基序列是序列号1~10和65中所示的碱基序列。
具有序列号35~41和67中所示氨基酸序列的酶,全部是源于苹果枝溃疡病菌(Neonecrtria ditissima),它们被本发明者们分别取名为Nd-AscB、Nd-AscC、Nd-AscD、Nd-AscE、Nd-AscF、Nd-AscH、Nd-AscH和Nd-AscI蛋白质。另外,编码Nd-AscG蛋白质的基因的碱基序列是序列号64中所示的碱基序列。
具有序列号47~50中所示的氨基酸序列的酶,全部是来源于里氏木霉(Trichoderma reesei),它们被本发明者们分别取名为Tr-AscB、Tr-AscC、Tr-AscD和Tr-AscE蛋白质。另外,编码Tr-AscC、Tr-AscD和Tr-AscB蛋白质的基因的碱基序列分别是序列号53、57和60中所示的碱基序列。
AscA、AscB、AscC、AscD、AscE、AscF、AscG、AscH、AscI、AscJ和AscK蛋白质是由存在于枝顶孢属、赤壳属或木霉属的染色体DNA上的编码这些酶的基因所编码。在本说明书中,有时将由存在于具有这种来源生物的染色体DNA上的基因和由该基因所编码的蛋白质或酶,分别称为“野生型基因”和“野生型蛋白质”或“野生型酶”。
酶(1)至(11)的氨基酸序列,如果分别具有上述酶(1)至(11)的酶活性,则也可由在野生型酶所具有的氨基酸序列中具有1至数个氨基酸的缺失、置换、添加等的氨基酸序列所组成。这里,氨基酸序列的“1至数个氨基酸的缺失、置换、添加”中的“1至数个”的范围并无特别限定,例如如果将氨基酸序列中的氨基酸数100个作为一个单位,则表示平均该一个单位中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个,优选地1、2、3、4、5、6、7、8、9或10个左右,更优选地1、2、3、4或5个左右。另外,所谓“氨基酸的缺失”表示序列中的氨基酸残基的缺少或消失,“氨基酸的置换”表示序列中的氨基酸残基被置换成另外的氨基酸残基,所谓“氨基酸的添加”表示以在序列中***新氨基酸残基的方式而添加。
作为“1至数个氨基酸的缺失、置换、添加”的具体形态,存在使1至数个氨基酸被另外的化学上类似的氨基酸所置换的形态。例如,在将某个疏水性氨基酸置换成另外的疏水性氨基酸的情况下,可举出将某个极性氨基酸置换成具有相同电荷的另外的极性氨基酸的情况等。这种化学上类似的氨基酸中的每个氨基酸在本技术领域中是已知的。如果举出具体例,作为非极性(疏水性)氨基酸,可举出丙氨酸、缬氨酸、异亮氨酸、亮氨酸、脯氨酸、色氨酸、苯丙氨酸、蛋氨酸等。作为极性(中性)氨基酸,可举出甘氨酸、丝氨酸、苏氨酸、酪氨酸、谷氨酰胺、天冬酰胺、半胱氨酸等。作为带正电荷的碱性氨基酸,可举出精氨酸、组氨酸、赖氨酸等。另外,作为带负电荷的酸性氨基酸,可举出天冬酰胺酸、谷氨酰胺酸等。
作为在野生型酶所具有的氨基酸序列中具有1至数个氨基酸的缺失、置换、添加等的氨基酸序列,可举出与野生型酶所具有的氨基酸序列具有某种程度以上的序列一致性的氨基酸序列,例如可举出与野生型酶所具有的氨基酸序列具有60%以上、优选地65%以上、优选地70%以上、优选地75%以上、优选地80%以上、优选地85%以上、更优选地90%以上、进一步优选地95%以上的序列一致性的氨基酸序列。
获得酶(1)至(11)的方法并无特别限定,例如可举出包括对以使编码酶(1)至(11)的基因的表达增强的方式而转化的转化体进行培养,接着将培养物中的酶(1)至(11)加以回收的方法等。从培养物中回收酶(1)至(11)的方法并无特别限定,例如可以按照常用方法从除去杂质的培养物上清液中通过硫酸铵沉淀等而得到包含酶(1)至(11)的蛋白质浓缩液,接着利用将酶(1)至(11)的分子量作为指标的凝胶过滤层析或SDS-PAGE等,由此分离酶(1)至(11)。此外,基于具有序列号11~20和66中所示氨基酸序列的AscB、AscC、AscD、AscE、AscF、AscG、AscH、AscI、AscJ、AscK和AscA蛋白质的构成元素所计算的理论分子量别为37000、120000、230000、61000、120000、31000、61000、57000、42000、32000和55000左右。
(编码酶(1)至(11)的基因)
基因ascB、ascC、ascD、ascE、ascF、ascG、ascH、ascI、ascJ、ascK和ascA(下面有时将它们统称为“编码酶(1)至(11)的基因”),如果包含对具有上述酶活性的酶(1)至(11)所具有氨基酸序列进行编码的碱基序列,则无特别限定。编码酶(1)至(11)的基因通过在生物体内的表达而生产酶(1)至(11)。本说明书中的所谓“基因的表达”表示经由转录或翻译等以被基因所编码的蛋白质或酶具有原来的功能或活性(特别是酶活性)的形态而生产。另外,在“基因的表达”中包括:以基因的高表达,即通过***基因而超过宿主生物原来表达的量的方式而生产由该基因所编码的蛋白质或酶。
编码酶(1)至(11)的基因,在被导入宿主生物中时,可以是在该基因的转录后经由剪接能够生成酶(1)至(11)的基因,也可以是能够在该基因的转录后不经由剪接而生成酶(1)至(11)的基因,这两种基因均可。
编码酶(1)至(11)的基因可以与来源生物原来所具有的基因(即,野生型基因)完全相同,只要是编码具有上述酶活性的酶的基因,则可以是具有与野生型基因的碱基序列为互补的碱基序列在严苛的条件下进行杂交的碱基序列的DNA。
本说明书中的所谓“在严苛的条件下进行杂交的碱基序列”,表示使用具有野生型基因的碱基序列的DNA作为探针,利用集落杂交法、噬斑杂交法、DNA印迹法等所获得的DNA的碱基序列。
本说明书中的所谓“严苛的条件”是指将特异性的杂化信号与非特异性的杂化信号明确地辨别的条件;根据所使用的杂交系统、及探针的种类、序列和长度而不同。这种条件能够通过改变杂交的温度、改变清洗的温度和盐浓度而决定。例如,在直到强烈地检测出非特异性的杂化信号的情况下,可以通过提高杂交和清洗的温度同时根据需要降低清洗的盐浓度而提高特异性。另外,在未检测出特异性的杂化信号的情况下,通过降低杂交和清洗的温度同时根据需要提高清洗的盐浓度,可以使杂化稳定化。
作为严苛的条件的具体例,例如使用DNA探针作为探针,使用5×SSC、1.0%(w/v)核酸杂交用阻断剂(宝灵曼公司制造)、0.1%(w/v)N-月桂酰肌氨酸、0.02%(w/v)SDS,在一晩(8~16小时左右)中进行杂交。使用0.1~0.5×SSC、0.1%(w/v)SDS,优选地使用0.1×SSC、0.1%(w/v)SDS,进行15分钟、2次清洗。进行杂交和清洗的温度为65℃以上,优选地为68℃以上。
作为具有在严苛的条件下进行杂交的碱基序列的DNA,例如可以举出:使用具有来源于菌落或菌斑的野生型基因的碱基序列的DNA或者将该DNA的片段固定化的过滤器,在上述严苛条件下进行杂交所得到的DNA或0.5~2.0M NaCl存在下,在40~75℃下实施杂交,然后优选地在0.7~1.0M的NaCl存在下,在65℃下实施杂交,然后用0.1~1×SSC溶液(1×SSC溶液是150mM氯化钠、15mM柠檬酸钠),在65℃条件下清洗过滤器,由此可以鉴定的DNA等。探针的制备或杂交的方法可以依照Molecular Cloning:A laboratory Manual,2nd-Ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY.,1989、Current Protocolsin Molecular Biology,Supplement 1-38,John Wiley&Sons,1987-1997(下面也将这些文献称为“参考技术文献”,这些文献的全部内容以公开的方式被引用到本文中)等中所描述的方法而实施。此外,根据本领域技术人员,除了这种缓冲液的盐浓度或温度等条件外,再加上其他的探针浓度、探针长度、反应时间等各条件,可以适当地设定用于获得具有与野生型基因的碱基序列为互补的碱基序列在严苛条件下进行杂交的碱基序列的DNA的条件。
作为包含在严苛条件下进行杂交的碱基序列的DNA,可举出具有与作为探针而使用的野生型基因的碱基序列的DNA的碱基序列具有某种程度以上的序列一致性的DNA,例如可举出与野生型基因的碱基序列具有60%以上、优选地65%以上、优选地70%以上、优选地75%以上、优选地80%以上、优选地85%以上、更优选地90%以上、进一步优选地95%以上序列一致性的DNA。
作为与野生型基因的碱基序列为互补的碱基序列在严苛条件下进行杂交的碱基序列,例如如果将碱基序列中的碱基数100个作为一个单位,则在野生型基因的碱基序列中,包含平均该一单位有1至数个、优选地1至40个、优选地1至35个、优选地1至30个、优选地1至25个、优选地1至20个、更优选地1至15个、进一步优选地1、2、3、4、5、6、7、8、9或10个,更进一步优选地1、2、3、4或5个碱基的缺失、置换、添加等的碱基序列。这里,所谓“碱基的缺失”表示在序列中的碱基中存在缺少或消失,所谓“碱基的置换”表示序列中的碱基被置换成另外的碱基,所谓“碱基的添加”表示以***新碱基的方式而添加。
由与野生型基因的碱基序列为互补的碱基序列在严苛条件下进行杂交的碱基序列所编码的酶,存在是具有在由野生型基因的碱基序所编码的酶所具有的氨基酸序列中具有1个至数个氨基酸的缺失、置换、添加等的氨基酸序列的酶的可能性,但具有与由野生型基因的碱基序列所编码酶相同的活性。
另外,编码酶(1)至(11)的基因,利用与1个氨基酸相对应的密码子存在数种的事实,是对与野生型基因编码的酶所具有的氨基酸序列为相同或近似的氨基酸序列进行编码的碱基序列,也可包含与野生型基因不同的碱基序列。作为针对这种野生型基因的碱基序列而实施密码子改变的碱基序列,例如可举出序列号21~24、28~30和61中所记载的碱基序列等。作为实施密码子改变的碱基序列,例如优选的是以在宿主生物中易于表达的方式而实施密码子改变的碱基序列。
(用于计算序列一致性的方法)
求得碱基序列或氨基酸序列的序列一致性方法并无特别限定,例如利用通常已知的方法,对将由野生型基因或野生型基因所编码蛋白质或酶的氨基酸序列作为对象的碱基序列或氨基酸序列进行比对,并利用用于计算两者的序列一致率的程序而求得。
作为用于计算2个氨基酸序列或碱基序列中的一致率的程序,例如已知有Karlin和Altschul的算法(Proc.Natl.Acad.Sci.USA,87:2264-2268,1990;Proc.Natl.Acad.Sci.USA,90:5873-5877,1993,这些文献的全部内容以公开的方式被引用到本文中),采用该算法的BLAST程序是由Altschul等人开发(J.Mol.Biol.215:403-410,1990,该文献的全部内容以公开的方式被引用到本文中)。此外,也已知有比BLAST更加灵敏地确定序列一致性的程序即Gapped BLAST(Nucleic Acids Res.25:3389-3402,1997,该文献的全部内容以公开的方式被引用到本文中)。因此,本领域技术人员可以利用例如上述的程序,从数据库中检索出相对于所给出序列显示高序列一致性的序列。这些序列能够在例如美国国家生物技术信息中心的互联网的网址(http://blast.ncbi.nlm.nih.gov/BLAST.cgi)中获得。
上述的各方法通常能够用于从数据库中检索出显示序列一致性的序列,但作为确定个别序列的序列一致性的方法,也可以采用Genetyx网络版12.0.1(GENETYX公司制造)的同源性分析。该方法也是基于Lipman-Pearson法(Science 227:1435-1441,1985,该文献的全部内容以公开的方式被引用到本文中)。在对碱基序列的序列一致性进行分析时,如果可能的话,采用编码蛋白质的结构域(CDS或ORF)。
(编码酶(1)至(11)的基因的来源)
编码酶(1)至(11)的基因例如是来源于具有冬青生菌素A、壳二孢呋喃酮、壳二孢氯素等的类异戊二烯的生产能力的生物种、或者看到酶(1)至(11)的表达的生物种等。作为对酶(1)至(11)的酶进行编码的基因的来源生物,例如可举出微生物等。在微生物中,已知在丝状菌中有许多具有壳二孢氯素生产能力或壳二孢呋喃酮生产能力的菌种,因此是优选的。作为具有壳二孢氯素或壳二孢氯素类似物的生产能力的丝状菌的具体例,可举出枝顶孢丝状菌、赤壳属丝状菌、镰刀菌属(Fusarium)丝状菌、柱孢属(Cylindrocarpon)丝状菌、轮枝孢属(Verticillium)丝状菌、丛赤壳属(Nectria)丝状菌、帚梗柱孢属(Cylindrocladium)丝状菌、炭疽菌属(Colletotrichum)丝状菌、头孢霉属(Cephalosporium)丝状菌、粪生真菌属(Nigrosabulum)丝状菌等,更具体地可举出菌核生枝顶孢、苹果枝溃疡病菌、Verticillium hemipterigenum、烟草炭疽病菌(Colletotrichumnicotianae)等。作为具有壳二孢呋喃酮生产能力的丝状菌的具体例,可举出枝顶孢属丝状菌、拟青霉属(Paecilomyces)丝状菌、轮枝孢属丝状菌等,更具体地可举出菌核生枝顶孢、苹果枝溃疡病菌、里氏木霉、宛氏拟青霉(Paecilomyces variotii)、Verticilliumhemipterigenum等。另外,作为具有冬青生菌素A生产能力的丝状菌的具体例,可举出木霉属丝状菌,更具体地可举出里氏木霉。此外,具有上述壳二孢氯素生产能力的丝状菌和具有壳二孢呋喃酮生产能力的丝状菌的具体例,可以是具有冬青生菌素A生产能力的丝状菌的具体例。
如上所述,编码酶(1)至(11)的基因的来源生物并无特别限定,但在转化体中被表达的酶(1)至(11)优选的是在不因宿主生物的生长条件而失活,能显示其活性。因此,编码酶(1)至(11)的基因生物的来源生物,优选的是生长条件与通过将编码酶(1)至(11)的基因***而进行转化的宿主生物相近似的微生物。
(采用基因工程学方法对编码酶(1)至(11)的基因的克隆化)
可以将编码酶(1)至(11)的基因***适当的公知的各种载体中。进而,可以将该载体导入适当的公知的宿主生物中,从而制作将包含编码酶(1)至(11)的基因的重组载体(重组体DNA)导入的转化体。关于编码酶(1)至(11)的基因的获得方法,或者编码酶(1)至(11)的基因的碱基序列、酶(1)至(11)的氨基酸序列信息的获得方法,各种载体的制造方法或转化体的制作方法等,可以由本领域技术人员适当地进行选择。另外,在本说明书中,转化或转化体中分别包含基因转导或基因转导体。下面非限制性地描述了编码酶(1)至(11)的基因的克隆化的一例。
为了对编码酶(1)至(11)的基因进行克隆化,通常可以适当地采用一般所采用的基因克隆化方法。例如,可以通过常用方法,例如参考技术文献中描述的方法,从具有酶(1)至(11)的生产能力的微生物或各种细胞中提取染色体DNA或mRNA。可以将所提取的mRNA作为模板而合成cDNA。可以使用以如此方式所得到的染色体DNA或cDNA来制作染色体DNA或cDNA的文库。
例如,编码酶(1)至(11)的基因,可以通过将具有该基因的来源生物的染色体DNA或cDNA作为模板的克隆化而获得。编码酶(1)至(11)的基因的来源生物是如上所述的,作为具体例子可以举出菌核生枝顶孢等。例如,对菌核生枝顶孢进行培养,从所得菌体中除去水分,一边在液氮中冷却一边用乳钵等以物理方式进行磨碎由此制成较细的粉末状菌体片,利用常用方法从该菌体片中提取染色体DNA部分。在染色体DNA提取操作中,可以使用DNeasy Plant Mini Kit(QIAGEN公司制造)等市售的染色体DNA提取试剂盒。
接着,将前述染色体DNA作为模板,使用与5’末端序列和3’末端序列为互补的合成引物而进行聚合酶链反应(下面标示为“PCR”),由此使DNA扩增。作为引物,如果能够使包含该基因的DNA片段扩增则并无特别限定。作为另外的方法,可以通过5’RACE法或3’RACE法等适当的PCR而使包含目的基因片段的DNA扩增,并将这些加以连接从而获得包含全长的目的基因的DNA。
另外,获得编码酶(1)至(11)的基因的方法并无特别限定,即使不采用基因工程学的方法,也能够通过例如化学合成法来构建编码酶(1)至(11)的基因。
对通过PCR所扩增的扩增产物或化学合成的基因中的碱基序列的确定,例如可以按如下方式进行。首先,依照常用方法将想要确定序列的DNA***适当的载体中从而制作重组体DNA。在向载体的克隆化中,可以使用TA Cloning Kit(Invitrogen公司制造)等市售的试剂盒;pUC19(Takara-bio公司制造)、pUC18(Takara-bio公司制造)、pBR322(Takara-bio公司制造)、pBluescript SK+(Stratagene公司制造)、pYES2/CT(Invitrogen公司制造)等市售的质粒载体DNA;λEMBL3(Stratagene公司制造)等市售的噬菌体载体DNA。利用该重组体DNA对宿主生物(例如大肠杆菌(Escherichia coli)、优选地大肠杆菌JM109株(Takara-bio公司制造)或大肠杆菌DH5α株(Takara-bio公司制造)进行转化。利用QIAGEN PlasmidMini Kit(QIAGEN公司制造)等对所获得化体中所包含的重组体DNA进行纯化。
对被***该重组体DNA中的各基因的碱基序列的确定,是通过双脱氧法(Methodsin Enzymology,101,20-78,1983,该文献的全部内容以公开的方式被引用到本文中)等而进行。在确定碱基序列时所使用的序列分析装置并无特别限定,例如可举出Li-COR MODEL4200L序列分析仪(Aloka公司制造)、370DNA测序系统(PerkinElmer公司制造)、CEQ 2000XLDNA分析系统(Beckman公司制造)等。然后,可以基于所确定的碱基序列,而获知被翻译蛋白质(即酶(1)至(11))的氨基酸序列。
(包含编码酶(1)至(11)的基因的重组载体的构建)
包含编码酶(1)至(11)的基因的重组载体(重组体DNA),可以通过以使编码酶(1)至(11)的基因能够表达的形式将包含编码酶(1)至(11)的基因中的任一基因的PCR扩增产物与各种载体相结合而构建。例如,可以通过用适当的限制酶切除包含编码酶(1)至(11)的基因中的任一基因的DNA片段,并将用适当的限制酶将该DNA片段切断的质粒加以连接而构建。或者,可以通过使用无缝连接HD克隆化试剂盒(Clontech公司制造)等市售的重组载体制作试剂盒,将包含在两末端添加与质粒相同序列的该基因的DNA片段与利用反向PCR所扩增的来源于质粒的DNA片段相连接而获得。
(转化体的制作方法)
转化体的制作方法并无特别限定,例如可举出依照常用方法,在编码酶(1)至(11)的基因进行表达的形态中***宿主生物中的方法等。具体地,制作将编码酶(1)至(11)的基因中的任一基因***表达诱导启动子与终止子之间而形成的DNA构建体,接着在包含编码酶(1)至(11)的基因的DNA构建体中对宿主生物进行转化,由此获得使编码酶(1)至(11)的基因过量表达的转化体。在本说明书中,将由为了对宿主生物进行转化所制作的表达诱导启动子、编码酶(1)至(11)的基因终止子所组成的DNA片段及包含该DNA片段的重组载体统称为DNA构建体。
在编码酶(1)至(11)的基因进行表达的形态中***宿主生物中的方法并无特别限定,例如可举出通过利用同源重组或非同源重组而直接地***宿主生物的染色体上的方法;通过连接到质粒载体上而导入宿主生物内的方法等。
在利用同源重组的方法中,可以将DNA构建体连接在与染色体上的重组部位的上游区域和下游区域为相同的序列之间,并***宿主生物的基因组中。高表达启动子并无特别限定,例如可举出作为翻译延伸因子的TEF1基因(tef1)的启动子结构域、α-淀粉酶基因(amy)的启动子结构域、碱性蛋白酶基因(alp)启动子结构域、甘油醛-3-磷酸脱氢酶(gpd)启动子结构域等。
在利用非同源重组的方法中,也可以在不需要相同序列的情况下,随机地***宿主生物基因组中的任意结构域,从而以多拷贝而***。转化中所使用的DNA构建体可以是直链状也可以是环状。高表达启动子并无特别限定,例如可举出作为翻译延伸因子的TEF1基因(tef1)的启动子结构域、α-淀粉酶基因(amy)的启动子结构域、碱性蛋白酶基因(alp)启动子结构域、甘油醛-3-磷酸脱氢酶(gpd)启动子结构域等。
在利用载体的方法中,可以通过常用方法将DNA构建体并入宿主生物的转化中所使用的质粒载体中,通过常用方法对相对应的宿主生物进行转化。
作为这种合适的载体-宿主系统,如果是可以在宿主生物中生产酶(1)至(11)的系统则并无特别限定,例如可举出pUC19和丝状菌的系统、pSTA14(Mol.Gen.Genet.218,99-104,1989,该文献的全部内容以公开的方式被引用到本文中)和丝状菌的系等。
DNA构建体优选的是将其导入宿主生物的染色体中而使用,但作为其他方法,也可以通过将DNA构建体并入自主复制型载体中(Ozeki等人.Biosci.Biotechnol.Biochem.59,1133(1995),该文献的全部内容以公开的方式被引用到本文中),以不导入染色体中的形式而使用。
在DNA构建体中,也可包含用于能够对经转化细胞进行选择的标志基因。标志基因并无特别限定,例如可举出如pyrG、pyrG3、niaD、adeA的补充宿主生物的营养需求性的基因;针对抗硫胺素、潮霉素B、寡霉素等药物的耐药性基因等。另外,优选的是,DNA构建体包含能够在宿主生物中过量表达对酶(1)至(11)进行编码的基因的启动子、终止子、其他控制序列(例如,增强子、多聚腺苷酸化序列等)。启动子并无特别限定,但可举出适当的表达诱导启动子或结构性启动子,例如可举出tef1启动子、alp启动子、amy启动子、gpd启动子等。终止子也无特别限定,例如可举出alp终止子、amy终止子、tef1终止子等。
在DNA构建体中,编码酶(1)至(11)的基因的表达控制序列,在包含***的编码酶(1)至(11)的基因的DNA片段具有表达控制功能的序列的情况下是必不可少的。另外,在利用共转化法进行转化的情况下,DNA构建体有时也可不具有标志基因。
在DNA构建体中可以具有用于纯化的标签。例如,通过适当地将连接序列连接到编码酶(1)至(11)的基因的上游或下游,并且在编码组氨酸的碱基序列中连接6个以上的密码子,可以使使用镍柱的纯化成为可能。
在DNA构建体中也可包含对于标志回收为必要的相同序列。例如,就pyrG标志而言,通过在pyrG标志的下游添加与***部位(5’同源重组结构域)的上游序列为相同的序列、或者在pyrG标志的上游添加与***部位(3’同源重组结构域)的下游序列为相同的序列,能够在包含5-氟乳清酸(5FOA)的培养基上使pyrG标志脱落。优选的是,适合于标志回收的该相同序列的长度为0.5kb以上。
DNA构建体的一个形态是例如使作为tef1基因启动子的Ptef、编码酶(1)至(11)的基因、作为tef1基因终止子的Ttef或alp基因终止子和pyrG标志基因连接到位于pUC19的多克隆化位点的无缝克隆位点的DNA构建体。
在通过同源重组将基因***的情况下的DNA构建体的一个形态,是将5’同源重组序列、tef1基因启动子、编码酶(1)至(11)的基因、alp基因终止子和pyrG标志基因、3’同源重组序列加以连接的DNA构建体。
通过同源重组将基因***并且将标志加以回收的情况下的DNA构建体的一个形态是将5’同源重组序列、tef1基因启动子、编码酶(1)至(11)的基因、alp基因终止子、标志回收用相同序列、pyrG标志基因、3’同源重组序列加以连接的DNA构建体。
在宿主生物是丝状菌的情况下,作为向丝状菌的转化方法,可以适当地选择本领域技术人员已知的方法,例如可以采用在制备宿主生物的原生质体之后使用聚乙二醇和氯化钙的原生质体PEG法(例如,参考Mol.Gen.Genet.218,99-104,1989和特开2007-222055号公报等,这些文献的全部内容以公开的方式被引用到本文中)。用于使转化体再生的培养基,采用根据所使用宿主生物和转化标志基因为合适的培养基。例如,在使用米曲霉(A.oryzae)、酱油曲霉(A.sojae)作为宿主生物并且使用pyrG基因作为转化标志基因的情况下,转化体的再生可以在例如包含0.5%琼脂和1.2M山梨糖醇的Czapek-Dox最低限度培养基(Difco公司制造)中进行。
另外,例如为了获得转化体,也可利用同源重组将宿主生物原来在染色体上所具有的编码酶(1)至(11)的基因的启动子置换成tef1等的高表达启动子。此时,优选的是,除了高表达启动子外,也可将pyrG等的转化标志基因***。例如,为了这个目的,参考在日本特开2011-239681号公报中所描述的实施例或图1,可以采用由编码酶(1)至(11)的基因的上游区域-转化标志基因-高表达启动子-编码酶(1)至(11)的基因的全部或部分所组成的转化用组件等。在此情况下,将编码酶(1)至(11)的基因的上游区域和编码酶(1)至(11)的基因的全部或部分应用于同源重组。编码酶(1)至(11)的基因的全部或部分,可以使用包含来自开始密码子的中间结构域的基因。在丝状菌的情况下,优选的是适合于同源重组的结构域的长度为0.5kb以上。
对转化体制作的确认,可以通过如下方法进行:在确认酶(1)至(11)所具有活性的条件下对转化体进行培养,接着检测在培养后所得培养物中的目的产物(例如如壳二孢氯素、冬青生菌素A、壳二孢呋喃酮的类异戊二烯),或者确认所检测目的产物的量与在相同条件下培养的宿主生物培养物中的目的产物的量相比更多。
另外,对转化体制作的确定,也可通过如下方式进行:从转化体中提取染色体DNA,将其作为模板而进行PCR,在发生转化的情况下确认产生能够扩增的PCR产物。在此情况下,例如在相对于所使用启动子的碱基序列的正向引物与相对于转化标志基因的碱基序列的反向引物的组合中进行PCR,确认预想长度的产物的产生。
优选的是,在通过同源重组进行转化的情况下,在位于相对于所使用上游侧的相同结构域为上游位置的正向引物与位于相对于所使用下游侧的相同结构域为下游位置的反向引物的组合中进行PCR,在发生同源重组的情况下优选的是确认产生预想长度的产物。
(基因敲除生物的制作方法)
所谓“基因敲除”表示通过使基因的一部分或全部发生缺失、变异导入或者将任意的序列***基因中、使对于该基因的表达为必要的启动子发生缺失等,而失去该基因所编码蛋白质的功能表达。严格地讲,该基因所编码蛋白质的功能表达并未完全失去,也就是说,即使存在该基因所编码蛋白质进行功能表达的可能性,只要使其功能表达大部分地失去,便可包含在本说明书中的所谓“基因敲除”中。此外,在本说明书中,有时将“基因敲除生物”称为“破坏株”或“缺失株”等。
基因敲除的制作方法并无特别限定,例如可采用利用如在下述实施例中所示的同源重组而使基因的一部分或全部发生缺失,或者利用TALEN和CRISPR-Cas9等基因组编辑技术而引起基因的缺失、***、置换,等的任意方法。利用同源重组对基因进行基因敲除的情况下的DNA构建体的一个形态是将5’同源重组序列、pyrG标志基因、3’同源重组序列加以连接的DNA构建体,但并不局限于此。
利用同源重组将基因***并且将标志加以回收的情况下的DNA构建体的一个形态,是将5’同源重组序列、标志回收用相同序列、pyrG标志基因、3’同源重组序列加以连接的DNA构建体等。
(宿主生物)
作为宿主生物,如果通过使用包含编码酶(1)至(11)的基因的DNA构建体或者包含编码酶(1)至(11)的基因的DNA构建体的转化可以生产酶(1)至(11)或生产类异戊二烯的生物,则并无特别限定,例如可举出微生物或植物等,作为微生物,可举出曲霉属微生物、枝顶孢微生物、赤壳属微生物、镰刀菌属微生物、埃希氏菌(Escherichia)属微生物、酵母菌(Saccharomyces)属微生物、毕赤酵母(Pichia)属微生物、裂殖酵母(Schizosaccharomyces)属微生物、接合酵母(Zygosaccharomyces)属微生物、木霉(Trichoderuma)属微生物、青霉(Penicillium)属微生物、根霉菌(Rhizopus)属微生物、脉孢菌(Neurospora)属微生物、毛霉菌(Mucor)属微生物、新萨托菌(Neosartorya)属微生物、丝衣霉属(Byssochlamys)属微生物、蓝状菌(Talaromyces)属微生物、组织胞浆菌(Ajellomyces)属微生物、副球孢子菌(Paracoccidioides)属微生物、爪甲团囊菌(Uncinocarpus)属微生物、球孢子菌(Coccidioides)属微生物、节皮菌(Arthroderma)属微生物、毛癣菌(Trichophyton)属微生物、外瓶霉(Exophiala)属微生物、卡普龙霉(Capronia)属微生物、枝孢瓶霉(Cladophialophora)属微生物、壳球孢(Macrophomina)属微生物、小球腔菌(Leptosphaeria)属微生物、平脐蠕孢(Bipolaris)属微生物、褥盘孢属(Dothistroma)属微生物、核腔菌(Pyrenophora)属微生物、葡萄座腔菌(Neofusicoccum)属微生物、毛球腔菌(Setosphaeria)属微生物、双极霉(Baudoinia)属微生物、顶囊壳(Gaeumannomyces)属微生物、盘二孢(Marssonina)属微生物、亚球壳(Sphaerulina)属微生物、核盘菌(Sclerotinia)属微生物、间座壳(Mmagnaporthe)属微生物、轮枝孢(Verticillium)属微生物、假尾孢(Pseudocercospora)属微生物、炭疽菌(Colletotrichum)属微生物、长喙壳(Ophiostoma)属微生物、绿僵菌(Metarhizium)属微生物、胞子丝菌(Sporothrix)属微生物、粪壳菌(Sordaria)属微生物、拟南芥(Arabidopsis)属植物等,优选的是微生物和植物。也可以是确认冬青生菌素A、壳二孢氯素、壳二孢呋喃酮等的类异戊二烯的生产能力的丝状菌、或者在基因组DNA上具有编码酶(1)至(11)的基因的丝状菌。
通过使宿主生物不具有壳二孢氯素生物合成基因或壳二孢呋喃酮生物合成基因等,在未确认类异戊二烯生产能力的情况下,利用编码酶(1)至(11)的基因进行转化。亦即,将壳二孢氯素生物合成基因或壳二孢呋喃酮生物合成基因导入而以异种表达类异戊二烯的方式进行转化的转化体(例如转化丝状菌)也可用作宿主生物。但是,在任何情况下,在宿主生物中将人排除。
作为确认类异戊二烯生产能力的生物,可举出枝顶孢属丝状菌、木霉属丝状菌、镰刀菌属丝状菌、柱孢属丝状菌、轮枝孢属丝状菌、丛赤壳属丝状菌、拟青霉属丝状菌等,更具体地可举出菌核生枝顶孢、苹果枝溃疡病菌、里氏木霉、宛氏拟青霉、半翅轮枝菌等。
在丝状菌中,如果考虑到安全性或培养的容易性,优选的是米曲霉、酱油曲霉、黑曲霉(A.niger)、溜曲霉(A.tamarii)、盛泡曲霉(A.awamori)、宇佐美曲霉(A.usami)、白曲霉(A.kawachii)、斋藤曲霉(A.saitoi)等的曲霉属微生物等。
此外,以枝顶孢属微生物或曲霉属微生物为代表的丝状菌中存在同源重组频率较低的倾向,因此在通过同源重组制作转化体的情况下,优选的是使用参与非同源重组机制的Ku70、Ku80等Ku基因被抑制的转化丝状菌。
这种Ku基因的抑制可以用本领域技术人员所公知的任意方法而实施,例如,能够通过将使用Ku基因破坏载体的Ku基因加以破坏,或者通过使用Ku基因的反义表达载体的反义RNA法使Ku基因失活等而实现。以如此方式得到的转化曲霉属微生物,与实施与Ku基因抑制有关的基因操作的原来的曲霉属微生物相比较,同源重组频率显著地升高。具体地,至少2倍、优选地至少5倍、优选地至少10倍、优选地至少约50倍地升高。
另外,作为宿主生物,优选的是使用pyrG等的标志基因被抑制的转化丝状菌。应该抑制的标志基因,可以根据DNA构建体中所包含的标志基因而适当地设定。
(编码酶(1)至(11)的基因的具体例)
作为对来源于菌核生枝顶孢的酶(1)至(11)进行编码的基因,例如可举出分别具有序列号1~10和65中所记载的碱基序列的基因ascB、ascC、ascD、ascE、ascF、ascG、ascH、ascI、ascJ、ascK和ascA。此外,将AscB、AscC、AscD、AscE、AscF、AscG、AscH、AscI、AscJ、AscK和AscA蛋白质的氨基酸序列分别表示为序列号11~20和66。
从除菌核生枝顶孢和菌核生枝顶孢以外的生物中获得编码酶(1)至(11)的基因的方法并无特别限定,例如可以通过如下方式获得:基于基因ascB、ascC、AscD、ascE、ascF、ascG、ascH、ascI、ascJ和ascK的碱基序列(序列号1~10和65),对于对象生物的基因组DNA进行BLAST同源性检索,从而鉴定具有与基因ascA、ascB、ascC、ascD、ascE、ascF、ascG、ascH、ascI、ascJ、ascK和ascA的碱基序列的序列一致性较高的碱基序列的基因。另外,可以通过如下方式获得:基于对象生物的总蛋白质,鉴定具有与AscB、AscC、AscD、AscE、AscF、AscG、AscH、AscI、AscJ、AscK和AscA蛋白质的氨基酸序列(序列号11~20和66)的序列一致性较高的氨基酸序列的蛋白质,并鉴定编码该蛋白质的基因。例如,作为与来源于菌核生枝顶孢的AscB、AscC、AscD、AscE、AscF、AscG、AscH和AscI蛋白质的氨基酸序列的序列一致性较高的氨基酸序列,可举出来源于赤壳属的序列号35~41和67的氨基酸序列;作为与来源于菌核生枝顶孢的AscB、AscC、AscD和AscE蛋白质的氨基酸序列的序列一致性较高的氨基酸序列,可举出来源于木霉的序列号47~50的氨基酸序列等。
可以将对从菌核生枝顶孢中所得到的酶(1)至(11)进行编码的基因、或者对与酶(1)至(11)具有序列一致性的酶进行编码的基因导入作为宿主生物的曲霉属微生物或枝顶孢属微生物等的任意宿主细胞中,而进行转化。
(转化体)
转化体的一个形态是将丝状菌或植物等作为宿主生物,将基因ascA、ascB、ascC、ascD、ascE、ascF、ascG、ascH、ascI、ascJ和ascK中的任一基因或它们的组合***,并且以使该***基因表达的方式进行转化的转化体(下面也称为“转化体(1)”)。在宿主生物是被确认是菌核生枝顶孢等具有壳二孢氯素或壳二孢呋喃酮的生产能力的生物的情况下,优选的是被***的基因恒定地强制表达或者与内在性表达相比更高地表达,或者在细胞增殖后的培养后期进行条件表达。这种转化体可以通过所表达的AscA、AscB、AscC、AscD、AscE、AscF、AscG、AscH、AscI、AscJ和/或AscK的作用而在宿主生物中不实质性地生产,或者以可检测的量或其以上的量而生产出即使生产也只是微量的冬青生菌素A、壳二孢氯素或壳二孢呋喃酮。
转化体的另一个形态是将丝状菌或植物等作为宿主生物,包含基因ascB、ascC、ascD、ascE、ascF、ascG、ascH、ascI、ascJ和ascK的全部或一部分的来源于野生型的生物合成基因簇基因(也包含除ORF以外的启动子序列等)、并且将以高表达或低表达控制如AscA的该生物合成基因簇的转录的转录因子的方式而设计的DNA构建体***,并且以使该***的基因表达的方式进行转化的转化体(下面也称为“转化体(2)”)。在宿主生物是菌核生枝顶孢等被确认具有壳二孢氯素或壳二孢呋喃酮的生产能力的生物的情况下,优选的是,***的基因恒定地强制表达或者与内在性的表达相比更高地表达,或者在细胞增殖后的培养后期进行条件表达。这种转化体可以利用表达量变化的转录因子的作用,在适合于宿主生物或转化体的条件下进行培养或生长,由此在宿主生物中不实质性地生产或者以可检测的量或其以上的量生产出即使生产也是微量的冬青生菌素A、壳二孢氯素或壳二孢呋喃酮。
转化体的一个具体形态是将酱油曲霉等作为宿主生物的转化体,除了基因ascI、ascJ和ascK外还将基因ascF、ascE、ascD、ascB和ascC***并且使该***的基因表达的转化体;除了基因ascI、ascJ和ascK外还将基因ascF***并且使该***的基因表达的转化体等,但并不局限于此。
转化体的一个具体形态是将菌核生枝顶孢、苹果枝溃疡病菌、里氏木霉等作为宿主生物的转化体,将ascA~ascI中的任意1个以上的基因***并且使该***的基因表达的转化体等,但并不局限于此。
(基因敲除生物)
基因敲除生物的一个形态是从如菌核生枝顶孢等的具有产生壳二孢氯素和壳二孢呋喃酮两者的基因ascB、ascC、ascD、ascE、ascF、ascG和ascI的野生型生物中对基因ascG进行基因敲除所获得的基因敲除生物(下面也称为“基因敲除生物(1)”)。这种基因敲除生物不表达作为参与壳二孢氯素生物合成的酶的AscG蛋白质,因此代替壳二孢氯素可以仅生产壳二孢呋喃酮或壳二孢呋喃酮前体,例如与野生型生物相比能够大量地生产壳二孢呋喃酮或壳二孢呋喃酮前体。
基因敲除生物的另一个形态是从菌核生枝顶孢或鲜红丛赤壳菌等具有产生壳二孢氯素或壳二孢氯素前体的基因ascB、ascC、ascD、ascE和ascF的野生型生物中对基因AscF进行基因敲除所获得的基因敲除生物(下面也称为“基因敲除生物(2)”)。通过将这种基因敲除生物在适合于野生型生物的条件下进行培养或生长,而存在与野生型生物相比更大量地产生冬青生菌素A的可能性。
基因敲除生物的另一个形态是从菌核生枝顶孢等具有产生壳二孢氯素和壳二孢呋喃酮两者的基因ascB、ascC、ascD、ascE、ascF、ascG和ascI的野生型生物,或者鲜红丛赤壳菌等的具有基因ascB、ascC、ascD、ascE、ascF、ascG和ascI的野生型生物中对基因ascI进行基因敲除所得到的基因敲除生物(下面也称为“基因敲除生物(3)”)。这种基因敲除生物不表达作为参与壳二孢呋喃酮生物合成的酶的AscI蛋白质,因此代替壳二孢呋喃酮可以仅生产壳二孢氯素,例如存在与野生型生物相比更大量地生产壳二孢氯素的可能性。
基因敲除生物的另一个形态是从里氏木霉等具有参与产生冬青生菌素A衍生物的基因ascB、ascC、ascD、ascE和冬青生菌素A以后的生物合成的基因的野生型生物中,将参与冬青生菌素A以后的生物合成的基因进行基因敲除所得到的基因敲除生物(下面也称为“基因敲除生物(4)”)。通过将这种基因敲除生物在适合于野生型生物的条件下进行培养或生长,而存在与野生型生物相比更大量地生产冬青生菌素A的可能性。
(制造方法)
本发明一个形态的制造方法是冬青生菌素A、壳二孢氯素或壳二孢呋喃酮的制造方法;该制造方法至少包括通过将转化体(1)或转化体(2)在适合于宿主细胞的条件下进行培养,而获得冬青生菌素A、壳二孢氯素或壳二孢呋喃酮的步骤。
本发明的另一个形态的制造方法是冬青生菌素A、壳二孢氯素或壳二孢呋喃酮的制造方法,该制造方法至少包括在使转化体(1)或转化体(2)作用于LL-Z1272β或冬青生菌素A(LL-Z1272α)等的冬青生菌素A、壳二孢氯素或壳二孢呋喃酮的前体而获得冬青生菌素A、壳二孢氯素或壳二孢呋喃酮的步骤。例如,使转化体作用于冬青生菌素A的方法,如果是可以使冬青生菌素A与转化体接触并利用转化体所具有的酶而产生壳二孢氯素或壳二孢呋喃酮的方法则无特别限定,例如可举出通过使用包含冬青生菌素A并且适合于转化体生长的培养基,在适合于转化体生长的培养条件下对转化体进行培养,而制造壳二孢氯素的方法等。培养方法并无特别限定,例如可举出在宿主生物是丝状菌的情况下,在通气或非通气条件下进行的固体培养法或液体培养法等。
本发明的另一个形态的制造方法是冬青生菌素A、壳二孢氯素或壳二孢呋喃酮的制造方法;该制造方法至少包括通过使从转化体(1)或转化体(2)中所提取的酶作用于LL-Z1272β或冬青生菌素A等的冬青生菌素A、壳二孢氯素或壳二孢呋喃酮的前体,而获得冬青生菌素A、壳二孢氯素或壳二孢呋喃酮的步骤。
本发明的另一个形态的制造方法是壳二孢呋喃酮或壳二孢呋喃酮前体的制造方法;该制造方法至少包括通过将基因敲除生物(1)在适合于野生型生物的条件下进行培养而获得壳二孢呋喃酮或壳二孢呋喃酮前体的步骤。
本发明的另一个形态的制造方法是冬青生菌素A的制造方法;该制造方法至少包括通过将基因敲除生物(2)或(4)在适合于野生型生物的条件下进行培养或生长而获得冬青生菌素A的步骤。
本发明的另一个形态的制造方法是壳二孢氯素或壳二孢氯素前体的制造方法;该制造方法至少包括通过将基因敲除生物(3)在适合于野生型生物的条件下进行培养或生长而获得壳二孢氯素或壳二孢氯素前体的步骤。
下面主要地对宿主生物或野生型生物是丝状菌的情况下的制造方法进行描述,但本发明的各形态的制造方法并不局限于下面的描述。
培养基,如果是对宿主生物或野生型生物(下面也将这些统称为“宿主生物等”)进行培养的常用培养基,亦即以适当的比例包含碳源、氮源、无机物、其他营养素的培养基,则可以使用合成培养基和天然培养基中的任一种。在宿主生物等是枝顶孢属微生物或曲霉属微生物的情况下,可以使用如在下述实施例中所描述的GPY培养基等,但无特别限定。
转化体或基因敲除生物(在下面也将它们统称为“转化体等”)的培养条件可采用本领域技术人员通常所知的宿主生物等的培养条件,例如在宿主生物等是枝顶孢属或曲霉属等的丝状菌的情况下,可以适当地设定培养条件:将培养基的初始pH值调整到5~10,培养温度为20~40℃,培养时间为数小时~数天、优选地1~7天、更优选地2~4天等。培养手段并无特别限定,可以采用通气搅拌深部培养、振荡培养、静置培养等,但优选的是在溶解氧变充分的条件下进行培养。例如,作为对枝顶孢属微生物或曲霉属微生物进行培养的情况下的培养基和培养条件的一例,可举出在下述实施例中有描述的使用GPY培养基、在30℃、160rpm下的3~5天的振荡培养。
在培养结束后从培养物中提取壳二孢氯素、壳二孢呋喃酮、冬青生菌素A等目的产物(类异戊二烯)的方法无特别限定。在提取中,可直接地使用通过过滤、离心分离等操作而从培养物中回收的菌体,也可使用在回收后进行干燥的菌体或进一步粉碎的菌体。菌体的干燥方法并无特别限定,例如可举出冷冻干燥、晒干、热风干燥、真空干燥、通气干燥、减压干燥等。
提取溶剂,如果使目的产物溶解则并无特别限定,例如可举出甲醇、乙醇、异丙醇、丙酮等有机溶剂;使这些有机溶剂与水混合的含水有机溶剂;水、温水和热水等。在加入溶剂后,一边适当地施行菌体破碎处理一边提取目的产物。
另外,代替上述加温处理,也可采用例如使用超声波破碎机、法式压滤壶、高效卧式砂磨机、乳钵等破坏手段来破坏菌体的方法;利用真菌破壁酶等细胞壁溶解酶将菌体细胞壁溶解的方法;用SDS、TritonX-100等表面活性剂将菌体溶解的方法等的菌体破碎处理。这些方法可以单独地使用或者组合地使用。
通过对所得到的提取液实施离心分离、薄膜过滤、超滤、凝胶过滤、利用溶解度差的分离、溶剂提取、层析(吸附层析、疏水层析、阳离子交换层析、阴离子交换层析、反相层析等)、结晶化、活性炭处理、膜处理等纯化处理,可以纯化目的产物。
可以利用LC-MS、LC-ICP-MS、MS/MS等而进行定性分析或定量析。这些分析的条件可以由本领域技术人员适当地选择,可以在例如下述实施例中所描述的条件下实施。
在本发明的各形态的制造方法中,只要可解决本发明的课题,可以在上述步骤的前段或后段或者步骤中加入各种步骤或操作。
(方法)
本发明的一个形态的方法是使使用丝状菌的类异戊二烯的产生增大的方法;该方法包括在具有ascB~ascK的任意1个以上基因或者壳二孢氯素生物合成基因和/或壳二孢呋喃酮生物合成基因的丝状菌中,增强AscA蛋白质或基因ascA的表达,由此增大使用该丝状菌的类异戊二烯的产生的步骤。本发明的另一个形态的方法是类异戊二烯的制造方法;该制造方法包括通过在具有壳二孢氯素生物合成基因和/或壳二孢呋喃酮生物合成基因的丝状菌中增强AscA蛋白质或基因ascA的表达而获得类异戊二烯的步骤。本发明的另一个形态的方法是类异戊二烯的制造方法;该制造方法包括通过对以使基因ascA的表达增强的方式而转化的转化体进行培养而获得类异戊二烯的步骤。
增强AscA蛋白质或基因ascA的表达的手段并无特别限定,例如可举出使用以使基因ascA的表达增强的方式所转化的转化体作为所使用的丝状菌;对于具有包含基因ascA的壳二孢氯素生物合成基因和/或壳二孢呋喃酮生物合成基因的丝状菌,调整培养条件或者导入其他转录因子等,从而增强该丝状菌原来所具有的基因ascA的表达等的手段。
使用丝状菌的类异戊二烯的产生是否增大,例如可通过将不采用增强AscA蛋白质或基因ascA的表达的手段的具有壳二孢氯素生物合成基因和/或壳二孢呋喃酮生物合成基因的丝状菌的类异戊二烯生产量与采用增强AscA蛋白质或基因ascA的表达的手段的具有壳二孢氯素生物合成基因和/或壳二孢呋喃酮生物合成基因的丝状菌的类异戊二烯生产量进行比较而确认。
(用途)
利用本发明的一个形态的基因、转化体、基因敲除生物及制造方法所得到的壳二孢氯素、壳二孢呋喃酮、冬青生菌素A等是可期待具有抗原虫活性、抗肿瘤活性、降血糖作用、降血脂作用、糖酵解抑制作用、抗氧化作用等各种生理活性的功能性活体物质,同时有效地利用其特征,从而能够用作用于制造药品、准药品等或它们的制品的原料。
下面通过实施例来更详细地说明本发明,但本发明并不局限于这些实施例,只要可解决本发明的课题,那么本发明可以采用各种形态。
实施例
(对壳二孢氯素生物合成基因的探索)
使用作为壳二孢呋喃酮产生菌的菌核生枝顶孢(Acremonium sclerotigenum F-1392株;J.Antibiot.70:304-307(2016),该文献的全部内容以公开的方式被引用到本文中),获得壳二孢呋喃酮生产量为400倍以上的2个不同的培养样品。
从这些样品中回收50~100mg的菌体,使用TRIzol试剂(Thermo FisherScientific公司制造),按照标准规程回收全RNA。
使用Dynabeads mRNA DIRECT Micro Kit(Thermo Fisher Scientific公司制造)从回收的全RNA中分离mRNA,使用Ion Total RNA-seq Kit v2(Thermo Fisher Scientific公司制造)来构建转录物组文库(cDNA文库)。
此外,对全RNA、mRNA和cDNA的品质及转录物组文库的浓度测定是使用AgilentRNA6000pico kit和Agilent 2100生物分析仪系统(均由Agilen公司制造)而确定。
利用Thermo Fisher Scientific公司的系统,按如下方式进行对所获得cDNA文库的RNA序列分析。
将所获得cDNA文库分别稀释到20pmol/L,使用Ion Onetouch 2通过乳液PCR进行文库的扩增。利用Ion OneTouch ES将扩增的文库加以浓缩,利用Ion PGM系统进行RNA序列分析。在Ion OneTouch 2中使用Ion PGM模板OT2 200套件,在Ion PGM中使用Ion PGM测序200套件v2。
在RNA测序中使用Ion PGm Ion 316v2芯片。将所得到的序列信息映射到菌核生枝顶孢的基因组序列数据库中,对2个样品之间的基因表达量的差异进行分析。
基于对被映射的cDNA的读数用各自的基因长度进行补正的值(PPKM:每百万映射序列读取数的每千碱基的外显子的读取数),而计算高生产样品与低生产样品之间的表达倍率。
进行可对高生产样品的基因中与低生产样品的基因比较以300倍以上的倍率而高表达的基因的探索,结果可以发现将2个以上的基因连接,以300倍以上的倍率高表达的基因集中的唯一区域。预测这是壳二孢呋喃酮生物合成基因簇,并将以300倍以上倍率高表达的基因取名为ascA~H(参照图1)。
另外,对于各自的基因所编码的蛋白质,进行了blast检索或使用Pfam的域检索,结果预测AscA~H具有如表1中的功能。其中,AscA被认为是转录因子,因此预测基因ascB~H(序列号1~7)所编码的AscB~H蛋白质(序列号11~17)参与了壳二孢呋喃酮的生物合成。
[表1]
基因
提出的功能
ascA
转录调控子
ascB
异戊烯基转移酶
ascC
氧化还原酶
ascD
聚酮合成酶
ascE
卤化酶
ascF
p450/p450还原酶
ascG
萜环化酶
ascH
p450
(AscD、AscB、AscC和AscE表达转化体的制作)
将包含改变曲霉表达用密码子的序列号15~18的基因ascB、ascC、ascD和ascE的任一基因的表达组件导入酱油曲霉(Aspergillus sojae NRRC4239株)的pyrG破坏株/ku70破坏株中。
具体地,作为用于使各asc基因表达的表达组件,将作为翻译延伸因子基因tef1的启动子序列的Ptef(tef1基因的上游748bp,序列号25)用作启动子,并且将作为碱性蛋白酶基因alp的终止子序列的Talp(alp基因的下游800bp,序列号26)用作终止子。另外,作为选择标志,使用补充尿嘧啶/尿苷要求性的转化标志基因pyrG(上游407bp,包含编码结构域896bp和下游5,35bp的1,838bp,序列号27)。
例如,以如Yune等人的文献(Appl MicrobioL biotechnol.2009Mar;82(4):691-701.doi:10.1007/s00253-008-1815-5.Epub 2008Dec 24.Construction of quintupleprotease gene disruptant for heterologous protein production in Aspergillusoryzae,该文献的全部内容以公开的方式被引用到本文中)中所报告的方式,在转化中所使用的DNA中包含与基因***位置(同源重组结构域)的上游或下游序列相同的序列的情况下,可以在含有5-氟乳清酸(5FOA)的培养基上使pyrG标志脱落,能够多次使用pyrG标志(标志回收)。因此,通过将按5’同源重组序列(5’arm)、Ptef、asc基因、Talp、标志回收用相同序列(与下游基因相同的序列;环出区(loop out region))、pyrG、3’同源重组序列(3’arm)的顺序加以连接的产物用作转化用DNA而进行pyrG的标志回收,将各asc基因的表达组件按ascD、ascB、ascC、ascE的顺序***到酱油曲霉的染色体上。
另外,在各自的DNA的连接中使用In-Fusion HD Cloning Kit(Clontech公司制造)。例如,在使Ptef与基因ascD连接的情况下,对于Ptef利用序列号31和32的引物通过PCR使各自的DNA片段扩增,对于ascD利用序列号33和34的引物通过PCR使各自的DNA片段扩增。此时,在基因ascD用的正向引物中在5’末端添加与Ptef相同的15bp的序列,因此通过无缝连接反应能够将Ptef与基因ascD连接。
使用以以上方式所制备的5’arm-Ptef-ascD-Talp-loop out region-pyrG-3’arm、5’arm-Ptef-ascB-Talp-loop out region-pyrG-3’arm、5’arm-Ptef-ascC-Talp-loopout region-pyrG-3’arm、5’arm-Ptef-ascE-Talp-loop out region-pyrG-3’arm的转化用DNA,对酱油曲霉NRRC4239株的pyrG破坏株/ku70破坏株进行转化,由此获得按照如下顺序分别将包含基因ascD、ascB、ascC、和ascE中的任一基因的表达组件每个1拷贝导入的As-D株、As-DB株、As-DBC株和As-DBCE株。
然后,将As-D株、As-DB株、As-DBC株和As-DBCE株接种到添加1%(w/v)NaCl的GPY培养基(2%(w/v)葡萄糖、1%(w/v)多聚蛋白胨、0.5%(w/v)酵母提取物、0.5%(w/v)磷酸二氢钾、0.05%(w/v)硫酸镁七水合物)中,在30℃下进行4天培养。将培养后的菌体回收到滤纸上,然后通过抽滤除去水分。
将回收的菌体在丙酮中浸渍1晩,进行过滤处理,由此获得As-DBCE株的丙酮提取物。对所获得的丙酮提取物进行浓缩干燥,溶解于甲醇,然后进行HPLC分析和MS分析(负离子模式),此时在As-D株中在与O-苔色酸标准品相同的溶出位置确认在宿主株(NBRC4239株)中未看见的新的峰。另外,在As-DB株中确认在As-D株中未看见的新的峰,基于MS分析的结果可知该峰的m/z值是与冬青生菌素B相对应的371。另外,在As-DBC株中确认在As-DB株中未看见的新的峰,基于MS分析的结果可知该峰的m/z值是与L-Z1272β相对应的355。此外,在As-DBCE株中仅确认在As-DBC株中未看见的新的峰,该峰是在与冬青生菌素A(ilicicolin A)标准品相同的溶出位置看见(参照图2)。
此外,图2的HPLC是将甲醇:水:乙酸(450:50:10)作为移动相(1ml/min),使用粒径3μm、4.6mm×100mm的TSKgel ODS-100V(TOSOH公司制造)的ODS柱而实施。
此外,可知在利用日本特愿2017-206809号说明书中所描述的pyrG3基因(序列号54)以多拷贝分别将基因ascD、ascB、ascC和ascE导入的As-DBCE多拷贝株中,蓄积了许多冬青生菌素A(参照图2)。此外,pyrG3基因是在丝状菌中改变用于将任意基因以多拷贝并入染色体的pyrG内的启动子结构域,并使表达量降低的选择标志基因。
另外,通过LC/MS分析可知,该峰的化合物显示与冬青生菌素A标准品相同m/z值389(负离子模式),在LC/MS/MS分析中也显示与冬青生菌素A标准品同样的峰型,因此利用所表达的AscD、AscB、AscC和AscE蛋白质而生物合成冬青生菌素A。此外,在图2中,在大约7分的溶出位置未看见的峰与在As-DBC株中所确定峰的溶出位置是一致的,基于MS分析的结果可知与LL-Z1272β的m/z值是一致的。
(AscD、AscB、AscC、AscE、AscF、AscG和AscH表达转化体的制作)
以与As-DBCE株同样的方式,依序将包含改变曲霉菌表达用密码子的序列号22~24的基因ascF、ascG和ascH中任一基因的表达组件导入,由此制作将AscF表达组件导入的As-DBCEF株;将AscF和AscG的表达组件导入的As-DBCEFG株;及将AscF、AscG和AscH的表达组件导入的As-DBCEFGH株。将这些株以与上述同样的方式进行培养,并进行HPLC分析。
此外,HPLC是将乙腈+0.1%(v/v)甲酸作为A液,将水+0.1%(v/v)甲酸作为B液,在A液40~100%(50min)的梯度条件下,以0.25ml/min的流速,使用L-柱2ODS(粒径3μm、2.1mm×100mm;化学物质评价研究机构公司制造)的ODS柱进行分析。
如图3中所示,在As-DBCEF株中确定在As-DBCE株中未看见的新的峰。另外,在As-DBCEFG株中确认在As-DBCEF株中未看见的新的峰。进而,在As-DBCEFGH株中,确认在As-DBCEFG株中未看见的新的峰。
由此,可知在冬青生菌素A以后,AscF、AscG和AscH蛋白质顺序地起作用而使反应进行。
(使用粗酶液的体外分析)
制作将改变曲霉菌表达用的密码子的序列号22~24的基因ascF、ascG和ascH的表达组件中任一表达组件导入酱油曲霉NRRC4239株中的pyrG破坏株中的As-F株、As-G株和As-H株。在这些株的制作时,使用将Ptef-asc基因-Talp-pyrG3***pUC19中的质粒DNA作为转化用DNA。
将酱油曲霉NRRC4239株(野生株)、As-F株、As-G株和As-H株各自在GPY培养基中进行1天培养,除去培养后的菌体的水分,然后用液氮使其冷冻,多珠振荡器使菌体破碎。通过向粉碎的菌体中加入20mM HEPES-NaOH(pH7.0),而提取野生株、As-F株、As-G株和As-H株的粗酶液。
使用所得到的粗酶液(菌体5~10mg),制备以下的反应液(1)至(4):
(1)野生株反应液:野生株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mMNADH、1mM ATP和3mM MgCl2的混合液;
(2)As-F反应液:As-F株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液;
(3)As-FG反应液:As-F株的粗酶液、As-G株的粗酶液、冬青生菌素A的标准品、1mMNADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液;以及
(4)As-FGH反应液:As-F株的粗酶液、As-G株的粗酶液、As-H株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液
使上述反应液(1)至(4)分别在室温下反应一晩。接着,将各自的反应液用乙酸乙酯进行提取,将所获得的提取物进行浓缩干燥,然后进行LC/MS分析。
LC分析是使用L-柱2ODS(粒径3μm、2.1mm×100mm;化学物质评价研究机构公司制造)的柱,将乙腈+0.1%(v/v)甲酸作为A液,将水+0.1%(v/v)甲酸作为B液,在A液40%~100%(50min)的梯度条件下,以流速0.25ml/min而进行,MS分析是在负离子模式下进行。
基于其结果可知,如图4A中所示,在As-F反应液中,在m/z值423处确认在野生株反应液中未看见的新的峰。另外,如图4B中所示,在As-FG反应液中在m/z值405处确认在As-F反应液中未看见的新的峰。此外,如在图5中所示,在As-FGH反应液中在m/z值403处确认在As-FG反应液或As-FG反应液中未看见的新的峰。另外,在As-FGH反应液中所确认峰的溶出时间与壳二孢氯素标准品的峰一致,进而壳二孢氯素的m/z值为403,因此基于这些结果可知通过依序使AscF、AscG和AscH蛋白质作用而由冬青生菌素A生物合成壳二孢氯素。
基于以上情况可知,被预测参与壳二孢呋喃酮生物合成的基因簇是壳二孢氯素的生物合成基因簇。将所预测的壳二孢氯素的生物合成方案示于图6中。如图6中所示,可知虽然壳二孢氯素的生物合成途径与壳二孢呋喃酮的生物合成途径一部分地重复,但却是完全不同的合成途径。因此可知,由将壳二孢氯素的生物合成基因簇导入的转化体所生产的物质是壳二孢氯素而不是壳二孢呋喃酮。
(对内在性环氧化物水解酶基因破坏株的分析)
通过上述的体外分析,在As-F反应液中确认m/z值为423的峰,因此预测使用在酱油曲霉NRRC4239株中所表达的AscF的粗酶液的反应生成物是经二羟基化的冬青生菌素A(参照图6)。然而,根据Hosono等的文献(J antibiot(Tokyo).2009Oct;62(10):571-4.,该文献的全部内容以公开的方式被引用到本文中),可知在枝顶孢属微生物中蓄积了冬青生菌素A环氧化物(m/z值405),因此认为原来的AscF反应生成物是冬青生菌素A环氧化物。也就是说,在酱油曲霉NRRC4239株中,利用内在性的环氧化物水解酶使冬青生菌素A环氧化物开环,认为具有生成二羟基化的冬青生菌素A的可能性。因此,在As-DBCEF株中,制作使预测编码来源于酱油曲霉的环氧化物水解酶的基因中的表达量最高的环氧化物水解酶基因(序列号42)缺失的As-DBCEF-ΔEH株。以与上述同样的方式将As-DBCEF-ΔEH株进行培养,并进行HPLC分析,此时确认在As-DBCEF株中未看见的新的峰。另外,通过MS分析,可知该峰是具有与环氧化物化合物相对应的m/z值。因此,可知AscF催化冬青生菌素A的环氧化反应。
(对壳二孢呋喃酮生物合成基因的探索)
如图6中所示,为了利用冬青生菌素A环氧化物而生物合成壳二孢呋喃酮,预想一原子氧加成反应是必要的,预测除AscF以外的另外的细胞色素P450单氧化酶参与了该反应。因此,使用上述RNA序列分析的结果,对在壳二孢呋喃酮高生产样品中高表达的P450基因进行了探索。结果,在壳二孢呋喃酮高生产样品中,具有AscF的约6成的表达量,并且新发现在低生产样品中几乎不表达的P450基因。另外,可知与该P450基因的邻接的2个的基因也同样地仅在壳二孢呋喃酮高生产样品中高表达,但提示这3个的基因形成基因簇(参照图7)。对于编码与该P450基因邻接的2个基因的蛋白质,进行了blast检索或使用Pfam的结构域检索,因而可知一个蛋白质是功能未知的蛋白质,而另一个蛋白质是脱氢酶。
(使用粗酶液的壳二孢呋喃酮合成)
将以上述方式所发现的3个基因,P450基因(序列号8)、功能未知基因(序列号9)和脱氢酶基因(序列号10)分别取名为ascI、ascJ和ascK。另外,在体外分析中确认,这些基因所分别编码的AscI蛋白质(序列号18)、AscJ蛋白质(序列号19)和AscK蛋白质(序列号20)是参与壳二孢呋喃酮的生物合成的的酶。
制作将序列号8~10的基因ascI、ascJ和ascK的表达组件中任一个导入酱油曲霉NRRC4239株的pyrG破坏株中的As-I株、As-J株和As-K株。在这些株的制作时,将把Ptef-asc基因-Talp-pyrG***pUC19中的质粒DNA用作转化用DNA。
将As-F株、As-I株、As-J株和As-K株的各株在GPY培养基中进行1天培养,除去培养后的菌体的水分,然后用液氮使其冷冻,用多珠振荡器使菌体破碎。通过向粉碎的菌体中加入20mM HEPES-NaOH(pH7.4),而对As-F株、As-I株、As-J株和As-K株的粗酶液进行提取。
使用所得到的粗酶液(菌体5~7.5mg),制备以下的反应液(1)至(7):
(1)As-F反应液:As-F株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液;
(2)As-FI反应液:As-F株的粗酶液、As-I株的粗酶液、冬青生菌素A的标准品、1mMNADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液;
(3)As-FIJ反应液:As-F株的粗酶液、As-I株的粗酶液、As-J株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液;
(4)As-FIK反应液:As-F株的粗酶液、As-I株的粗酶液、As-K株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液;
(5)As-FJK反应液:As-F株的粗酶液、As-J株的粗酶液、As-K株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液;
(6)As-IJK反应液:As-I株的粗酶液、As-J株的粗酶液、As-K株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液;以及
(7)As-FIJK反应液:As-F株的粗酶液、As-G株的粗酶液、As-H株的粗酶液、冬青生菌素A的标准品、1mM NADPH、1mM NADH、1mM ATP和3mM MgCl2的混合液。
使上述反应液(1)至(7)分别在30℃下反应1小时。接着,对各反应液用乙酸乙酯进行提取,将所得到的提取物进行浓缩干燥,然后进行LC/MS分析。
LC分析是使用L-柱2ODS(粒径3μm、2.1mm×100mm;化学物质评价研究机构公司制造)的柱,将乙腈+0.1%(v/v)甲酸作为A液,将水+0.1%(v/v)甲酸作为B液,在A液40%~100%(50min)的梯度条件下,以0.25ml/min的流速进行,MS分析是在负离子模式下进行。将LC/MS分析的结果示于图8和图10,将MS/MS分析的结果示于图9中。
因此,如图8中所示,在(7)As-FIJK反应液中仅与壳二孢呋喃酮相对应的m/z值419的峰是在与壳二孢呋喃酮标准品相同的溶出时间而检出。此外,对于在(7)中所检测出的m/z值419的峰,以45ev的碰撞能量进行MS/MS分析,此时如图9中所示显示与壳二孢呋喃酮标准品同样的裂解规律。
另外,如图10中所示,在(2)As-FI反应液中检测出在(1)As-F反应液中未看见的m/z值439的新的峰,进而该峰是对于AscF和AscI的两者而言仅在存在于反应液中时才检测出。也就是说,一般认为该m/z值439的峰是来自于将冬青生菌素A作为底物依序使AscF和AscI发生反应所生成的化合物(的水解产物),如果考虑m/z值的差和AscI为P450,则强烈地提示AscI发挥作为一原子氧加成酶(单氧化酶)的作用。
基于以上情况,如图11中所示,可知通过将冬青生菌素A作为底物,使AscF、AscI、AscJ和AscK发生反应,而生成壳二孢呋喃酮。
(AscD、AscB、AscC、AscE、AscF、AscI、AscJ和AscK表达转化体的制作)
以与上述同样的方式,将分别包含序列号8~10的基因ascI、ascJ、ascK和序列号43的来源于酱油曲霉NBRC4239株的P450还原酶基因的表达组件依序导入pyrG标志回收后的As-DBCEF株中,由此分别制作将AscI和P450还原酶的表达组件导入的As-DBCEFIred株;将AscI、AscJ、AscK和P450还原酶的表达组件导入的As-DBCEFIJKred株。将这些株在添加5%(w/v)NaCl的GPY培养基中进行培养,以与上述同样的方式进行HPLC分析。
此外,HPLC是将乙腈+0.1%(v/v)甲酸作为A液,将水+0.1%(v/v)甲酸作为B液,在A液40~100%(50min)的梯度条件下,以0.5m/min的流速,使用TSK-gel ODS-100v 3μm柱(4.6mm I.D.×150mm)进行分析。将结果示于图12中。
如图12中所示,在As-DBCEFIJKred株中确认与在As-DBCEFIred株中未看见的m/z值419的壳二孢呋喃酮相对应的峰。另外,该峰与壳二孢呋喃酮标准品的峰的溶出时间是一致的。由此可知,ascB、ascC、ascD、ascE、ascF、ascI、ascJ和ascK是壳二孢呋喃酮的生物合成基因。
因此,如在图6中所预测,可知关于壳二孢呋喃酮和壳二孢氯素的生物合成,在直到AscD、AscB、AscC、AscE和AscF为止的反应中两者是共同的,冬青生菌素A环氧化物以后的反应则不同。具体地可知,在使AscI与冬青生菌素A环氧化物发生反应的情况下,导致壳二孢呋喃酮生物合成,在使AscG与冬青生菌素A环氧化物反应的情况下导致壳二孢氯素生物合成(参照图11)。因此,在如菌核生枝顶孢的产生壳二孢呋喃酮和壳二孢氯素两者的株中,在ascG破坏株中仅可以高生产壳二孢呋喃酮,但在ascI破坏株中仅可以高生产壳二孢氯素。
(菌核生枝顶孢F-1392株的pyrG破坏株的制作)
基于以上结果可知,壳二孢呋喃酮和壳二孢氯素的生物合成途径直到冬青生菌素A环氧化物为止属于共同的途径,AscI和AscG竞争相同的底物。因此,在ascG的破坏株中仅生产壳二孢呋喃酮,提供至壳二孢氯素的生物合成途径的冬青生菌素A环氧化物也可以应用于壳二孢呋喃酮生产,因此一般认为使壳二孢呋喃酮的生产性提高。另一方面,在ascI的破坏株中仅生产壳二孢氯素,供给至壳二孢呋喃酮的生物合成途径的冬青生菌素A环氧化物也可以应用于壳二孢氯素生产,因此一般认为使壳二孢氯素的生产性提高。因此,制作菌核生枝顶孢的ascG破坏株和ascI破坏株,并验证了上述假说。
在菌核生枝顶孢F-1392株中获得各种asc破坏株时,首先制作ku70/pryG二重破坏株。以菌核生枝顶孢为代表的丝状菌在通常情况下其同源重组效率非常低,难以获得破坏株。因此,在丝状菌中,常常采用通过使参与通过非同源重组的基因***的Ku70等功能缺失而提高同源重组效率的方法。ku70/pryG二重破坏株的制作是按照以下顺序而进行:(1)pyrG破坏株的获得、(2)利用pyrG标志的ku70破坏株的获得、(3)通过pyrG标志回收而获得ku70/pryG二重破坏株。
首先,为了获得pyrG破坏株,以如下方式制备pyrG破坏株制作用DNA片段。将菌核生枝顶孢F-1392株的基因组DNA作为模板进行PCR,使pyrG ORF的上游约3kb的DNA片段(5’pyrG)、从pyrG ORF的第147个碱基开始下游约1.7kb的DNA片段(3’pyrG)、Ttef(序列号44)扩增。将线性潮霉素标记(Takara公司)作为模板进行PCR从而使潮霉素耐药基因(hygr)扩增。接着,利用无缝连接反应将扩增的各DNA片段加以连接,由此制备由5’pyrG-hygr-Ttef-3’pyrG所组成的pyrG破坏株制作用DNA片段。
然后,按照Cytologia的文献(CYTOLOGIA,82(3):317-320,JUN 2017,该文献的全部内容以公开的方式被引用到本文中)中所描述方法制备菌核生枝顶孢F-1392株的原生质体。然后,通过使用聚乙二醇和氯化钙的原生质体PEG法(例如,参考Mol.Gen.Genet.218,99-104,1989,该文献的全部内容以公开的方式被引用到本文中)将5’pyrG-HyGr-Ttef-3’pyrG导入,由此制作pyrG破坏株。此外,将PEG处理后的原生质体叠加于再生用琼脂培养基(3.5%Czapeck肉汤、1.2M山梨糖醇、20mM尿嘧啶、20mM尿苷、2%琼脂)上,在25℃下培养一晩,然后进一步叠加于5mL的包含2mg/L 5FOA和100mg/L潮霉素的再生用琼脂培养基(0.7%琼脂)上,在30℃下培养2~3周,在多次接种后通过菌落PCR而挑选目的pyrG破坏株。
(菌核生枝顶孢F-1392株的Ku70破坏株的制作)
接着,为了获得ku70破坏株,以如下方式制备ku70破坏株制作用DNA片段。将菌核生枝顶孢F-1392株的基因组DNA作为模板进行PCR,从而使ku70的ORF(序列号45)的上游约3kb的DNA片段(5’ku70)、从ku70的ORF的第207碱基开始下游约2.3kb的DNA片段(3’ku70)、用于回收pyrG标志的3’ku70的下游约1kb的DNA片段(LO)、pyrG基因(序列号46)扩增。接着,通过无缝连接反应将扩增各DNA片段加以连接,由此制备由5’ku70-LO-pyrG-3’ku70所组成的ku70破坏株制作用DNA片段。对于上述所制作的菌核生枝顶孢F-1392株的pyrG破坏株,以同样的方式利用原生质体-PEG法将ku70破坏株制作用DNA片段导入,由此制作ku70破坏株。此外,将PEG处理后的原生质体叠加于再生用琼脂培养基(3.5%Czapek-Dox肉汤、1.2M山梨糖醇、0.1%微量元素、2%琼脂)上,在30℃下培养大约5天,在多次接种后通过菌落PCR挑选目的ku70破坏株。
(菌核生枝顶孢F-1392株的ku70/pyrG二重破坏株的制作)
通过将所获得的ku70破坏株的孢子加以回收,将5×105~1×106个孢子散布于包含1mg/L的5FOA的琼脂培养基(3.5%Czapeck肉汤、20mM尿嘧啶、20mM尿苷、1.5%琼脂)上,而进行pyrG标志的回收,从而获得ku70/pyrG二重破坏株。
(菌核生枝顶孢F-1392株的ascG破坏株的制作和对壳二孢呋喃酮生产性的分析)
然后,为了获得ascG破坏株,按如以下方式制备ascG破坏株制作用DNA片段。将菌核生枝顶孢F-1392株的基因组DNA作为模板进行PCR,使从ascG的ORF的第400个碱基开始的上游约2kb的DNA片段(5’ascG)、ascG的ORF的下游约2.5kb的DNA片段(3’ascG)、用于回收pyrG标志的5’ascG的上游约0.9kb的DNA片段(LO2)、pyrG基因(序列号46)扩增。接着,通过无缝连接反应将所扩增的各DNA片段加以连接,由此制备由5’ascG-pyrG-LO2-3’ascG所组成的ascG破坏株制作用DNA片段。以同样的方式通过原生质体-PEG法将ascG破坏株制作用DNA片段导入上述制作的菌核生枝顶孢F-1392株的ku70/pyrG二重破坏株中,由此制作ascG破坏株。此外,将PEG处理后的原生质体叠加于再生用琼脂培养基(3.5%Czapek-Dox肉汤、1.2mM山梨糖醇、0.1%微量元素、2%琼脂)上,在30℃下培养大约一周,在多次接种后通过菌落PCR挑选目的ascG破坏株。
将菌核生枝顶孢F-1392株(野生株)和所制作的ascG破坏株在GPY液体培养基中在25℃下进行3天培养,将该前培养液以10%量接种到壳二孢呋喃酮高生产培养基中,以28℃、4天、180rpm的条件进行振荡培养。对培养后的菌体100mg进行丙酮提取处理,进行HPLC分析。将结果示于图13中。
如图13中所示,可知在ascG破坏株中壳二孢氯素的峰消失,仅生产壳二孢呋喃酮。另外,可知菌体的平均壳二孢呋喃酮的生产量是比野生株高。
(菌核生枝顶孢F-1392株的ascI破坏株的制作和对壳二孢氯素生产性的分析)
然后,为了获得ascI破坏株,以如下方式制备ascI破坏株制作用DNA片段。将菌核生枝顶孢F-1392株的基因组DNA作为模板进行PCR,使ascI的ORF的上游约2kb的DNA片段(5’ascI)、从ascI的ORF的第905个碱基开始下游约1.5kb的DNA片段(3’ascI)、pyrG基因(序列号46)扩增。接着,通过无缝连接反应将所扩增的各DNA片段加以连接,由此制备由5’ascI-pyrG-3’ascI所组成的ascI破坏株制作用DNA片段。以同样方式通过原生质体-PEG法将ascI破坏株制作用DNA片段导入上述所制作的菌核生枝顶孢F-1392株的ku70/pyrG二重破坏株中,由此制作ascI破坏株。此外,将PEG处理后的原生质体叠加于再生用琼脂培养基(3.5%Czapek-dox肉汤、1.2mM山梨糖醇、0.1%微量元素、2%琼脂)上,在30℃下培养大约一周,在多次接种后通过菌落PCR挑选目的ascI破坏株。
将菌核生枝顶孢F-1392株(野生株)和所制作的ascI破坏株在GPY液体培养基中在25℃下进行3天培养,将该前培养液以10%的量接种到壳二孢呋喃酮高生产培养基中,以28℃、4天、180rpm的条件进行振荡培养。对培养后的菌体100mg进行丙酮提取处理,进行HPLC分析。基于其结果可知,在ascI破坏株中壳二孢呋喃酮的峰消失,仅生产壳二孢氯素。另外,可知菌体的平均壳二孢氯素生产量比野生株高。
(菌核生枝顶孢F-1392株的ascF破坏株的制作和对冬青生菌素A生产性的分析)
然后,为了获得ascF破坏株,按如下的方式制备ascF破坏株制作用DNA片段。将菌核生枝顶孢F-1392株的基因组DNA作为模板进行PCR,使ascF的ORF的上游约1.5kb的DNA片段(5’ascF)、ascF的ORF的下游约2kb的DNA片段(3’ascF)、用于回收pyrG标志的3’ascF的下游约1.5kb的DNA片段(LO3)、pyrG基因(序列号46)扩增。然后,通过无缝连接反应将扩增的各DNA片段加以连接,由此制备由5’ascF-LO3-pyrG-3’ascF所组成的ascF破坏株制作用DNA片段。以同样方式通过原生质体-PEG法将ascF破坏株制作用DNA片段导入上述所制作的菌核生枝顶孢F-1392株的ku70/pyrG二重破坏株中,由此制作ascF破坏株。此外,将PEG处理后的原生质体叠加于再生用琼脂培养基(3.5%Czapek-dox肉汤、1.2M山梨糖醇、0.1%微量元素、2%琼脂)上,在30℃下培养大约一周,在多次接种通过菌落PCR选择目的ascF破坏株。
将菌核生枝顶孢F-1392株(野生株)和所制作的ascF破坏株在GPY液体培养基中在25℃下进行3天培养,将该前培养液以10%的量接种到壳二孢呋喃酮高生产培养基中,以28℃、4天、180rpm的条件进行振荡培养。对培养后的菌体100mg进行丙酮提取处理,进行HPLC分析。基于其结果,可以确认在ascF破坏株中大量蓄积了冬青生菌素A。
(对来源于里氏木霉的AscC的功能分析)
基于来源于菌核生枝顶孢的序列号11~14的AscB~AscE的氨基酸序列,进行Blast检索,结果可知,在里氏木霉(Trichoderma reesei)中也具有序列号47~50的AscB~AscE同源物(序列一致性分别为47%、53%、52%、66%),进而编码它们的ascB~AscE基因在基因组上邻接。由此预测,序列号47~50也是冬青生菌素A的生物合成酶。因此,将从NITE购入的里氏木霉NBRC31329株的基因组DNA作为模板,使用序列号51和52的引物进行PCR,由此将序列号53的ascC基因(Tr-ascC)克隆化。此外,序列号53的Tr-ascC基因是包含内含子的碱基序列,但基于内含子预测的结果一般认为编码序列号48的AscC蛋白质。
通过以与上述同样的方式将克隆化的Tr-ascC连接,而制备5’arm-Ptef-Tr-ascC-Talp-pyrG-3’arm的转化用DNA。接着,对于将上述所制作的来源于枝顶孢属的ascD基因和ascB基因***的As-DB株的pyrG标志加以回收的株,使用转化用DNA的5’arm-Ptef-Tr-AscC-Talp-pyrG-3’arm进行转化,由此获得分别将包含来源于枝顶孢属的ascD和ascB进而包含来源于木霉的ascC的表达组件的每个以1拷贝导入的As-DB-Tr-C株。
然后,将As-DB-Tr-C株接种到GPY培养基(2%(w/v)葡萄糖、1%(w/v)多聚蛋白胨、0.5%(w/v)酵母提取物、0.5%(w/v)磷酸二氢钾、0.05%(w/v)硫酸镁七水合物)中,在30℃下培养4天。将培养后的菌体回收到滤纸上,然后通过抽滤除去水分。
将回收的菌体在丙酮中浸渍1晩,进行过滤处理,由此获得As-DB-Tr-C株的丙酮提取物。将所得到的丙酮提取物进行浓缩干燥,溶解于甲醇,然后进行HPLC分析,此时在As-DB-Tr-C株中,在与As-DBC株的m/z值的L-Z1272β相对应的355的峰相同的溶出位置检测出新的峰。由此可知,如所预测的序列号53的Tr-ascC基因具有与来源于枝顶孢属的ascC基因相同的功能,因此一般认为来源于木霉的序列号47~50是冬青生菌素A的生物合成酶。此外,来源于苹果枝溃疡病菌(Neonecrtria ditissima)的序列号35~41的AscB~AscH与来源于枝顶孢属的AscB~AscH的序列一致性也全部为60%以上,并且各自的密码基因在基因组上邻接,因此认为该酶组群是壳二孢氯素生物合成酶。
(对来源于里氏木霉的AscD和AscB的功能分析)
将从NITE购入的里氏木霉NBRC31329株的基因组作为模板,使用序列号55和56的引物进行PCR,由此对序列号57的ascD基因(Tr-ascD)进行克隆化。以同样的方式,使用序列号58和59的引物,将序列号60的ascB基因(Tr-ascB)克隆化。序列号57的Tr-ascD基因是包含内含子的碱基序列,但基于内含子预测的结果,一般认为对序列号49的AscD蛋白质进行编码。
通过以与上述同样的方式将克隆化的Tr-ascD和Tr-ascB加以连接,而制备5’arm-Ptef-Tr-ascD-Talp-loop out region-pyrG-3’arm和5’arm-Ptef-Tr-ascB-Talp-loopout reGion-pyrG-3’arm的转化用DNA。接着,对于酱油曲霉的pyrG破坏株/ku70破坏株,使用转化用DNA的5’arm-Ptef-Tr-ascD-Talp-loop out reGion-pyrG-3’arm使用进行转化,由此获得分别以每个1拷贝将包含来源于木霉的ascD的表达组件导入的As-Tr-D株。进而,对于将As-Tr-D株的pyrG加以回收的株,使用5’arm-Ptef-Tr-ascB-Talp-loop outregion-pyrG-3’arm进行转化,由此获得分别每个1拷贝将包含来源于木霉的ascD和ascB的表达组件的As-Tr-DB株。
然后,将As-Tr-DB株(来源于木霉的ascD和ascB基因***株)和As-DB株(来源于枝顶孢属的ascD和ascB基因***株)接种到GPY培养基(2%(w/v)葡萄糖、1%(w/v)多聚蛋白胨、0.5%(w/v)酵母提取物、0.5%(w/v)磷酸二氢钾、0.05%(w/v)硫酸镁七水合物)中,在30℃下进行4天培养。将培养后的菌体回收到滤纸上,然后通过抽滤除去水分。
将回收的菌体在丙酮中浸渍1晩并进行过滤处理,由此获得As-Tr-DB株和As-DB株的丙酮提取物。对所获得的丙酮提取物进行浓缩干燥,溶解于甲醇,然后进行HPLC。此外,HPLC是将乙腈+0.1%(v/v)甲酸作为A液、将水+0.1%(v/v)甲酸作为B液,在A液80~95%(15min)的梯度条件下,以1ml/min的流速,使用TSK-gel ODS-100V 3μm柱(4.6mm I.D.×150mm)进行了分析。如图14的结果所示,与As-DB株同样在As-Tr-DB株中也在相同的溶出位置检测出在亲株中未看见的峰。由此解到,如所预测的序列号57和60的Tr-ascD基因和Tr-ascB基因与来源于枝顶孢属的ascD基因和ascB基因具有相同的功能。
(对来源于里氏木霉的AscE的功能分析)
编码序列号50的AscE,以与上述同样的方式利用无缝连接反应将改变曲霉菌用密码子的人工合成基因(序列号61)加以连接,由此制备5’arm-Ptef-Tr-ascE-Talp-pyrG-3’arm的转化用DNA。接着,对于将上述所制作的As-DBC株(将来源于枝顶孢属的ascD、ascB、ascC的表达组件以每个1拷贝***的株)的pyrG标志加以回收的株,利用转化用DNA的5’arm-Ptef-Tr-AscE-Talp-pyrG-3’arm进行转化,由此获得将包含来源于枝顶孢属的ascD、ascB、ascC进而包含来源于木霉的ascE的表达组件分别以每个1拷贝***的As-DBC-Tr-E株。
然后,将As-DBC-Tr-E株和As-DBC株接种到添加5%NaCl的GPY培养基中,在30℃下进行4天培养。以与上述同样的方式将培养后的菌体加以回收,进行丙酮提取,进行该丙酮提取物的HPLC分析。此外,HPLC是将乙腈+0.1%(v/v)甲酸作为A液、将水+0.1%(v/v)甲酸作为B液,在A液80~95%(15min)的梯度条件下,以1ml/min的流速,使用TSK-gel ODS-100V3μm柱(4.6mm I.D.×150mm)进行了分析。如图15的结果所示,在As-DBC-Tr-E株中,在与冬青生菌素A标准品相同的溶出位置检测出在As-DBC株中未确认的新的峰。由此可知,来源于木霉的AscE也与来源于枝顶孢属的AscE同样地,是将LL-Z1272β作为底物的卤化酶。基于以上情况可知,序列号47~50的来源于木霉的AscB、AscC、AscD和AscE是冬青生菌素A生物合成酶。
(对壳二孢呋喃酮生物合成途径的分析)
经预测壳二孢呋喃酮生物合成途径是通过依序使AscI、AscJ和AscK发生反应而由冬青生菌素A环氧化物生物合成壳二孢呋喃酮,但AscI的生成产物和AscJ的生成产物未被鉴定。因此,将上述所制作的ascG破坏株的pyrG标志加以回收的株作为亲株而制作ascG破坏株/ascJ破坏株时,检测到在ascG破坏株中未看见的新的峰。对被认为是该AscI生成产物的化合物进行纯化,并进行NMR分析,此时可知是具有图16中所示结构的新型化合物(羟基冬青生菌素A环氧化物)。另外,使AscJ与该AscI生成产物发生反应,此时可知生成了壳二孢呋喃醇。进而,使AscJ和AscK与AscI生成产物发生反应,此时可知生成了壳二孢呋喃酮。基于以上情况可知,在冬青生菌素A环氧化物以后的壳二孢呋喃酮生物合成途径是如图16中所示。
(通过AscI的强制表达的壳二孢呋喃酮的高生产化)
如前所述,在ascG破坏株中仅生产壳二孢呋喃酮,与野生株相比壳二孢呋喃酮的生产性也提高。然而,如图13中所示,可知在ascG破坏株中,存在在平均溶出时间38.5分处蓄积的化合物,该化合物是冬青生菌素A环氧化物。也就是说,在ascG破坏株中AscI的反应是限速反应,因此预测有冬青生菌素A环氧化物蓄积。因此,在ascG破坏株中,制作了利用序列号62的来源于枝顶孢属的tef1启动子和序列号63的来源于枝顶孢属的tef1终止子使序列号8的ascI基因高表达的株(ΔascG-I株),在壳二孢呋喃酮高生产培养基中,在28℃下,使用Biott公司制造的100ml培养装置(Bio Jr.8)在400rpm、0.5vvm的条件下进行4天培养。
接着将培养后的平均10mL培养液的菌体加以回收,用丙酮提取,然后进行HPLC。此外,HPLC是将乙腈+0.1%(v/v)甲酸作为A液、将水+0.1%(v/v)甲酸作为B液,在A液40~100%(50min)的梯度条件下,以0.5ml/min的流速,使用TSK-gel ODS-100V 3μm柱(4.6mmI.D.×150mm)进行分析。如图17的结果所示,可知与ascG破坏株(ΔascG)相比,在ΔAscG-I株中冬青生菌素A环氧化物的蓄积量减少,壳二孢呋喃酮的生产量大幅地提高。
(对来源于丛赤壳属的Asc同源物的功能分析)
基于Blastp检索的结果可知,Neonectria ditissima是在基因组上具有与序列号11~17的来源于枝顶孢属的AscB~H有60%以上的序列一致性的AscB~H的同源物(序列号35~41)进行编码的基因。另外,所公开数据库上的基因序列不处在完全组装的状态中,以与至少编码AscB、AscC、AscE和AscF的4个基因邻接的方式而存在,进而也与对AscG和AscH进行编码的2个的基因邻接的方式而存在,因此认为形成簇。另外,基于使用tblastn的检索结果可知,在编码AscH的基因的大约0.4kb的上游存在与来源于枝顶孢属的ascA基因具有50%以上序列一致性的基因序列。由此认为,来源于丛赤壳属的AscB~H的同源物(序列号35~41)是壳二孢氯素生物合成酶。
具有作为萜环化酶的功能的AscG不具有已知结构域,是在壳二孢氯素生物合成中的特征性酶,因此一般认为通过对序列号40的AscG的功能进行分析可以判断序列号35~41是否为壳二孢氯素生物合成酶。因此,在上述所获得的菌核生枝顶孢F-1392株的ascG破坏株中,通过使序列号40的来源于丛赤壳属的AscG表达,也验证是否可以对来源于菌核生枝顶孢的AscG的功能进行互补。
首先,通过将菌核生枝顶孢F-1392株的ascG破坏株的孢子加以回收,并使大约106个的孢子在包含5FOA的琼脂培养基上生长,而进行pyrG标志的回收。此外,在将pyrG标志除去时,在设计上也同时将ascH基因破坏,因此标志回收后的株成为ascG和ascH的二重基因破坏株(ΔascG/ΔascH株)。使用pyrG标志,将由序列号62的来源于枝顶孢属的tef1启动子和序列号63的来源于枝顶孢属的tef1终止子所构成的序列号40的来源于丛赤壳属的AscG的高表达组件导入该株中。此外,对序列号40的来源于丛赤壳属的AscG进行编码的基因序列Nd-ascG基因(序列号64)是通过人工基因合成而获得。
相对于ascG和ascH的2重基因破坏株,将使Nd-ascG基因表达的株(ΔascG/ΔascH+Nd-ascG株)以与上述同样的方式在壳二孢呋喃酮高生产培养基中进行培养,对培养后的菌体的丙酮提取液进行HPLC分析。如图18的结果中所示,在使Nd-ascG基因表达的株中,壳二孢呋喃酮或冬青生菌素A环氧化物的生产量下降,检测出了在不使Nd-ascG基因表达的株中未检测到的新化合物的峰。另外,在与上述体外As-FG反应液中特异性地确认的m/z值为405的化合物(冬青生菌素C)相同的溶出位置检测出在该化合物、与进一步的质量分析(MS)的结果,可知该化合物的m/z值为405。因此表示,序列号40的来源于丛赤壳属的AscG具有与来源于枝顶孢属的AscG同样的功能。
基于以上情况可知,序列号35~41的来源于丛赤壳属的AscB~H同源物是壳二孢氯素生物合成酶。
此外,可知,在对来源于丛赤壳属的AscH同源物进行编码的基因的大约6kb上游位置存在对与来源于枝顶孢属的AscI(序列号18)具有53%的序列一致性的AscI同源物(序列号67)即Nd-AscI进行编码的基因。这提示在Neonectria ditissima中,对Nd-AscI进行编码的基因与编码Nd-AscA、Nd-AscG和Nd-AscH的基因形成基因簇,Nd-AscI是与壳二孢氯素或壳二孢氯素中间体有关联的化合物的生物合成酶的可能性高。也就是说,一般认为序列号67的来源于丛赤壳属的AscI同源物与来源于枝顶孢属的AscI具有同样的功能。但是,对来源于枝顶孢属的AscJ(序列号19)和AscK(序列号20)的同源物进行编码的基因是在Neonectria ditissima中,对Nd-AscI、Nd-AscA、Nd-AscG和Nd-AscH进行编码的基因的簇结构域附近而存在。
如果考虑来源于木霉和来源于丛赤壳属的Asc同源物的结果,可证明与来源于枝顶孢属的Asc酶的一致性较高,具有相同的结构域,并且它们是位于基因组上的附近,在不形成簇的情况下与来源于枝顶孢属的Asc具有同样功能的可能性较高。
(AscA强制表达载体的制作)
按如下方式验证,存在于表1的簇上的编码转录因子的基因ascA控制壳二孢氯素或壳二孢呋喃酮的生物合成基因的表达。
基于RNA测序的结果认为,基因ascA在壳二孢呋喃酮高生产培养基中高表达,因此不能确实地控制壳二孢氯素生物合成基因群或壳二孢呋喃酮生物合成基因群。因此,为了调查在菌核生枝顶孢中通过使基因ascA强制表达是否诱导壳二孢氯素或壳二孢呋喃酮的产生,而以如下述的方式制作AscA强制表达载体。
首先,将菌核生枝顶孢F-1392株的基因组DNA作为模板进行PCR,将序列号62的tef1基因启动子(Ptef)、序列号65的基因ascA、序列号44的tef1基因终止子(Ttef)、序列号46的pyrG基因克隆化,通过无缝连接反应将各基因加以连接,由此制作将Ptef-ascA-Ttef-pyrG的ascA强制表达组件***pUC19中的ascA强制表达载体。
此外,序列号65的基因ascA是包含内含子的碱基序列,但基于RNA测序的结果可知,由基因ascA所编码的AscA蛋白质是由序列号66的氨基酸序列所组成。
(对AscA强制表达株中的壳二孢氯素生产性和壳二孢呋喃酮生产性的评价)
通过将AscA强制表达载体导入上述所制作的菌核生枝顶孢F-1392株的pyrG破坏株中,而制作AscA强制表达株。
将菌核生枝顶孢F-1392株(野生株)和所制作的AscA强制表达株分别在GPY液体培养基中在30℃下进行4天培养,以与上述同样的方式进行HPLC分析。将结果示于图19。
如图19中所示,野生株在GPY培养基中完全地不生产壳二孢氯素和壳二孢呋喃酮。相对于此,在AscA强制表达株中确认壳二孢氯素和壳二孢呋喃酮两者的生产。
到现在为止,问题是在野生株中在所限定的培养基中仅生产壳二孢氯素和壳二孢呋喃酮,在培养条件稍微不同的情况下生产量有很大的差异。但是,如果使用AscA强制表达株,那么即使不设定指定的培养条件也能够生产壳二孢氯素和壳二孢呋喃酮,可以实现诸如壳二孢氯素、壳二孢呋喃酮、冬青生菌素A的类异戊二烯的稳定工业生产,这对于工业而言是非常有用的。
序列表中所记载序列如下:
[序列号1]ascB
[序列号2]ascC
[序列号3]ascD
[序列号4]ascE
[序列号5]ascF
[序列号6]ascG
[序列号7]ascH
[序列号8]ascI
[序列号9]ascJ
[序列号10]ascK
[序列号11]AscB蛋白质
[序列号12]AscC蛋白质
[序列号13]AscD蛋白质
[序列号14]AscE蛋白质
[序列号15]AscF蛋白质
[序列号16]AscG蛋白质
[序列号17]AscH蛋白质
[序列号18]AscI蛋白质
[序列号19]AscJ蛋白质
[序列号20]AscK蛋白质
[序列号21]密码子改变ascB
[序列号22]密码子改变ascC
[序列号23]密码子改变ascD
[序列号24]密码子改变ascE
[序列号25]Ptef
[序列号26]Talp
[序列号27]pyrG
[序列号28]密码子改变ascF
[序列号29]密码子改变ascG
[序列号30]密码子改变ascH
[序列号31]Ptef-Fw
[序列号32]Ptef-Rv
[序列号33]ascD-Fw
[序列号34]ascD-Rv
[序列号35]Nd-AscB蛋白质
[序列号36]Nd-AscC蛋白质
[序列号37]Nd-AscD蛋白质
[序列号38]Nd-AscE蛋白质
[序列号39]Nd-AscF蛋白质
[序列号40]Nd-AscH蛋白质
[序列号41]Nd-AscH蛋白质
[序列号42]来源于酱油曲霉的环氧化物水解酶基因
[序列号43]来源于酱油曲霉的P450还原酶基因
[序列号44]Ttef
[序列号45]ku70
[序列号46]pyrG
[序列号47]Tr-AscB蛋白质
[序列号48]Tr-AscC蛋白质
[序列号49]Tr-AscD蛋白质
[序列号50]Tr-AscE蛋白质
[序列号51]Tr-ascC-fw
[序列号52]Tr-ascC-rv
[序列号53]Tr-ascC
[序列号54]pyrG3
[序列号55]Tr-ascD-Fw
[序列号56]Tr-ascC-Rv
[序列号57]Tr-ascD
[序列号58]Tr-ascB-Fw
[序列号59]Tr-ascB-Rv
[序列号60]Tr-ascB
[序列号61]密码子改变Tr-ascE
[序列号62]来源于枝顶孢属的Ptef
[序列号63]来源于枝顶孢属的Ttef
[序列号64]Nd-ascG
[序列号65]ascA
[序列号66]AscA蛋白质
[序列号67]Nd-AscI蛋白质
工业上的可利用性
作为本发明一个形态的基因、转化体、基因敲除生物及制造方法可以应用于大量地制造壳二孢呋喃酮、冬青生菌素A和壳二孢氯素等的类异戊二烯。因此,本发明可应用于以工业规模而制造壳二孢呋喃酮、冬青生菌素A和壳二孢氯素等的类异戊二烯。
序列表
<110> 龟甲万株式会社(KIKKOMAN CORPORATION)
<120> 类异戊二烯的制造方法以及用于该制造方法的蛋白质、基因和转化体
<130> 17DF0702PCT
<160> 67
<170> PatentIn version 3.5
<210> 1
<211> 1011
<212> DNA
<213> 菌核生枝顶孢(Acremonium sclerotigenum)
<400> 1
atggctgcca agtcaaggag tccaaagcgc gggacttctg agaagacccc gctggtcgag 60
aaagaagcgc cctaccaacc acccacgaag ggcattctct ccaaattgcc cgcttcgtgg 120
gttccgtacg cgcagctcat ccgtctcgag cagccgcacg gaaactacat gatctacttc 180
cctcacatca ttggcctcat gtacgcctct gccatcaggc ctactgagct cagcgtcttg 240
ggccatcgtg cggctatatt cgccatctgg acattcttga tgcgcggagc cggctgcgct 300
tggaacgaca acgtcgacca agactttgat cgcaagacgg agcgatgccg acacaggccc 360
atcgcccgtg gagccatttc aactactcaa ggccacgtct ttactttgat cttgacgctc 420
cttggttttg ccgccatcca gtcactgccc attgaatgca cctatgtcgg cgtcggcacg 480
actgtactct ctgcaatcta cccctttggc aagcgcttca cgcactttgc tcaagtcatc 540
ctcggaagca cgctggcttc taccatagcc ctctctgcat actcggttgg cttgccggcg 600
ctgtccaagg actacttcgt cccgacgctg tgcctctcag ctacgattat gcttctcgtc 660
gtcttttacg acgtcgtgta cgcccgagct gatacgaccg atgatctcaa gtctggtgtc 720
aagggtatgg cggtccgctt ccgcaatcat cttgagggtc tctttgcctt tatcacgctg 780
tccattgccg gttcgctgac gacgctggga tacctcgtcg gcatgggaca ttggttctac 840
ctgttctcag tgggtggatt gacgtttgga cttgtttcca tggtcgccct tacgcactgg 900
aacatactgc caggctattc ttccgggcga tgctatgcat ttgccatcct gaaccttctg 960
actggcttca tcatggagta cgccacgaag gactatgttg tgggtgtcta a 1011
<210> 2
<211> 3282
<212> DNA
<213> 菌核生枝顶孢
<400> 2
atgacggtta acggtcatca caccaacggc gtcaacggcg ccaacgggac caacggtcat 60
gccaatggaa gcaatggcat caatgacacc aaggccgtga aggaaattgt ccccttcgtt 120
aagccacaag tgaactttgc ctcagctcaa cgactcgaag gctgtattca ttcattgcca 180
gagctcgtgg acttcaacag cttgaacaat cagcaccaca ctttttgcgt tcaggcaaag 240
tcttctgagc catttgacac cattacacat ggcgagttca aggtggccgt gtcgaaatgc 300
gcggcatggc tcaaggagaa ccttccaatt cgccccagta gcgacgacaa agctctgaca 360
aagatggcgc ccgttgcgct gtttatggag agtgacattg gtctcgtcat tcacgagttc 420
gctttgatga gcattggcgt gccgccattg gtactttcac ctcgattgag ccctgtcgcc 480
atcaatgcac tcctcgaagc tacgggtgct gcttcgttca tcgtatcacc tcgcatgagc 540
gagcctctaa agggagctct cgccgccctc gcagcaaagg gagtctccac acacattgga 600
aacccgtaca aggcatacta tcagcctgga gcagatccca agtctgttgc gccttttgag 660
gttcctcaga accctgagga tgttattctt ctgctccact cgtcaggcac gacaggactt 720
cccaagccaa ttccaaccac acatcgccag ctcctgttcg cggtgaactg ccacaagttc 780
gacacggagg agcaagctca gagcctgaac ctgtcaacgc ttcccctgtt ccacggcttc 840
ggactcgttg cccctgggct ttcgatgtct gcaggcaagc cgacattgta ccctgccagc 900
gatggcatcc ccaacgccaa gtccatcgtc gatctcatca acaagactaa cgctaagagc 960
atgatgactg tgcctttctt gctggacgac atcacgaatc tgccaaacga ggagggtatc 1020
aaggctcttg ttcacatgga cttcgtcgga acgggaggtg cagctctcgg agccggtatt 1080
ggcgaccgcc ttgccaaagg tggtgtgaag ctcctcaact tctacggcac aaccgagaca 1140
ggacccctat ctcttacatt tgcccccacc gacaactacg actggaagta cttccgcctt 1200
cgtaccgact gcgagtacaa gattgacgag cttgagcccc gtgacggaga aaggaggttc 1260
cgcctcacag tctaccctta cggaagcgag ggcttcgaga tttcggacca gctcatccgc 1320
aatgagcaat accccgagac agatttcgcc gcggttggtc gcgacgatga tgtgatcgtc 1380
ctggccactg gcgaaaaggc gaaccctctc attcttgaga cgaagctcac cgaggcgccc 1440
atggtcaagg ctgccatcgc cttcggcgag aaccagttca acctgggtgt gatcgtcgag 1500
cctgcagagc ctcttacccc tgatacagaa tcagctttcc gggagagtat ctggccaatt 1560
atcacggcag cttgcgacca gatggacgct ttctcacgca tcccctcgcc ggacgccgtc 1620
gtgcttgttc ccgctggtgt ggttattccg cgcaccgaca agggcagtat cgcgcgtaaa 1680
gagacgtacg ccttgttcga taagcagatc aagggcgttt acgagcagct gctcaaggcc 1740
gcagctgatg ccgttgagcc ccttgatctc gacaacctgg agcaaaacct caagagcttg 1800
attcaggagc atctccacat ccaggctccg gcctcagact ggggagtcga ggatagtctc 1860
ttcgatattg gcgtggattc cctgcaggtc ttgcagctgc gccgtatttt ggtcactgca 1920
gcgtccaaga ccgaggcttt caaggatacc gactgcgaga agatgatccc gcctgagttc 1980
gtgtacatga acccatctat tcgcgagatc gcggctgctc ttactaaggg ctccgatggc 2040
ggagatgttt ctcttgagga tgccgctaag gaggtagtcg agctcgcgga gacgtacagc 2100
ctgaagggtg tcagtgccca ggagaaagcg ccgagctcta gcgagggtgc cttcgtcatg 2160
ttgactggtg ccactggaag tctggggtcc cacgttgccg cggatttggc gcgtcgagac 2220
aacgtcgcca aggttgtctg cctggtgcgc aaagacaagg gcacgaacca gcctccgatg 2280
cctggaggaa accccttcga caagaagatt ctcaaggctc gaggcatcca gcttaccgac 2340
gaacaatttg gaaagctcgc taccctcgag gttgacccga ctgcggataa gcttggactt 2400
attcccatgg cctatggcat gatgcaggca aaggtcaccc atgttatcca cgccgcgtgg 2460
ccgatgaact atctcatccg cctgcgtaac ttccaatacc agttcaagtt cctgcgcaat 2520
cttctcgagt tcgcttctca gggcccggct cccaccaaga agcgtttcgt cttcatctcg 2580
tcgattgcaa ccgttgcaag gatcggcctc gcgcagcccg gatccatctc agaagccccc 2640
gtctccccgt ccgattctgc atgcgggatt ggatatgccg acgggaagct tgtgtgcgag 2700
aagatcatgg agaaggcagc tcaagattac ggtggtcagc tcgatgtcac atccgtccgt 2760
tgtggacaaa tgaccggctc gaagaagact ggcgtctgga actctaacga gcagattcca 2820
atgctattga agtctgcgca gggtcttgga tccctaccgc agttgtcagg ggagctgtcc 2880
tggatccccg tcgacgatgc cgcgtctacg gtttccgaga ttgcgttttc agatggaagc 2940
atgccaattg tgcaacatct cgagaacccc atccggcagt cttgggacgc tatgctgcaa 3000
agctttgggc gtgagcttgg attgcccgct ggcaaggtcc cgttcggcga gtggctggat 3060
caagttgctg ctgctgatgg agatgacgag actttccccg tcaagaagtt gacattcttc 3120
ttcaagagct tcttccaaag cgttgcttgt ggccaggtcg tcctcgatac tacagtgtct 3180
cggggccaat cgaagacact gaatgccatg actgccgtgg gtgacgagac ggtcaaggcc 3240
tacgcagact actggaagtc tactggatac ctgagcaagt aa 3282
<210> 3
<211> 6348
<212> DNA
<213> 菌核生枝顶孢
<400> 3
atgacattga tacagacgaa gcattctgct tcggcagctg tcttctcgcc tcagagcaca 60
gcgccaaaac caacccatct cgctcatata cgagcgagac tactagagga tgatcttctc 120
aagccggtga aagaggctgt tgtctcgttg ccaaagacat ggcgggcatt agtctcgaag 180
caaccggagc ttgggaagaa ccgcaaggct tcagatctta tcgaagcctt cccttcgtgg 240
atcgaggacg ggaagaccga ggtcctcgag actgacatgt cagggctcat caccctgcct 300
cttctcgcag tcatccacat tgtccagtac ctggactaca tccaaagact cgggataagc 360
cactcggaat ttctagaaag tgtcgagagc ggtggtgtcc aaggatattg cataggccta 420
ctgtcggcaa tcgtcgtcag ctctgcggag gacgaggagg ccctaattca acacgctgcc 480
cacggcattc gcctgtcgtt ggcgatcgga gcatttggcg acattggctc ctcgtcagac 540
gaggtcgtct caaacacctt gcaggttcga ttgcgaaacg caggcagcga agaggatcta 600
gttgcgcgtt tccctggttc ctacatctcg accatcacgg acgctaagac aatgagcata 660
atcgctcccc cgcatctcat tgacgcattg aaagaacatg ccgagacgga gggtctgcgc 720
ccgcgggcga tgcacatccg cagcaacctt cacaactcaa gaaacacaga gctcgcccaa 780
caatgcagct cgttgttcga ggattgcccg tttgcatcac ccgataccct gcaagttgcc 840
gtccgctcaa acaagaccgg ctgctactta gagcaggatg ccacgtcgtt ggttgaggag 900
gctgtctcta cagtcctcgc atcccgatgc gattggagtc tagtgatgca gggtcttgca 960
gacgacctaa accagtctgg atccaagcac cattccattc tgctgttcgg catgggcgat 1020
tcggttcctg gagctccttt cagggaacac agcctggata tctccaagat tgatgttttg 1080
tcgctcgtcg agacgcccct ttcagccact ccgccagcca gctccatcga tgacttccct 1140
cccgacagca tagcaatcgt tggctcggcc tgtcggctcc ctggagccaa ctcactggat 1200
gagctctggg atcttattgc cgcagggcga tcaaggctcg aaaaggtccg aaccgaccgt 1260
gtcaacatca aggagtctta ccgcgccagc caggatcctg aatggaccaa gaagcgagag 1320
ttctatggaa actttatcga cgatgtcgac gctttcgacc acgcgttctt caacatctcg 1380
cccagagagg ccaaatacat ggaccctcaa cagaggctac tcctgatggc agcctttgaa 1440
gccatggact ccagcggtta tctccgcagc caccaacgaa atgatggcga cgccgtgggg 1500
tgtttcctgg gtgccagcta cactgagtac accgagaaca ccagcgcgta cagcccatca 1560
gctttcactg ccacatccac cattcgggca tttttgtctg gaaagatcag ctaccacttc 1620
gggtggactg gtccatccga agtgattgat acggcctgct cagccagtat cgtagccgtg 1680
catcgtgctg tgcaagcaat caacgccggt gaatgtccgg tggccctggc cggaggcgtc 1740
aacattatca ccggtgtcaa caactacttc gatcttggca aggccagctt ccttagccag 1800
actggacaat gtaagccctt tgacgactcg gccgacggct actgccgtgc tgatggcgtc 1860
ggcttggttg tcttgaagcc actcagcaag gcggttgcgg acggggacta catccagggt 1920
gtcatcccag ccatcgcaac caaccagggc ggcatcggtg cacctggaat cacggttccc 1980
gacgggatcg ctcagaaggc cctgtaccgt ggcattctcg agaaggctgg cctcaaaggc 2040
gaggacatct cttacgtcga ggcccacggc actggcactc aggtcggaga tccaatcgag 2100
attggctcca tccgggaggt ttttggcggt gctcaccgtg cctcgccttt gcatcttgga 2160
tcacttaaag ccaacatagg ccacagtgag accgctgcgg gtgtggcctc tctcttgaag 2220
gttctttcca tggtgcgaaa ccgtggtgtc cctcctttgc aaggcttcaa gcgcttgaac 2280
cacaagattc cggccttgga gctggacaag atggccatcc ccacgaagct actgccctgg 2340
gatagtgacc accgcattgc gtgcatcaac agttacggtg caagtggcag caacagcgca 2400
ctcatctgct ctgagtggct ggaagagccg agcaagctcc ctgatgtgac cggacaacct 2460
cttcaagaat atcctattct tctgagcgca gcgtctaacg agagcttgct gcgctatgcg 2520
cgtcacctgg ctgattacat caccaagtcg tccgcggatc tgactctggg caacttatcg 2580
tacactctca gccaacgccg taagcaccac cgcattcgct ggtcgacgac tgccaaggac 2640
ctcatcggtc tcatcgagca gcttcgggag tgcacgcccg ccgatttcgt ccaggcacct 2700
cagaagagta agaagattgt tcttaccttc tccgggcaga gccgtacgac gattggcgtc 2760
agcgactcag cacgtctcga gaaccctcgt ttcgagcact acatccagca atgcaacaac 2820
atcctcatgt cctatggttg ccctgatttg ctgccgtacc tgagtcagac agacccgatc 2880
tcggatccga ccatcattca gtgcggcaca gtgactgtgc agtatgcctg cgctcagtgc 2940
tggatcgatg gtggcctcga tgtagctgga attgttggcc attctttggg cgagctaaca 3000
gctctggcta tctcaggtgc cctttctctc gaagatacac tgaaggtggt gtacacccga 3060
gctgaagcca tcaaggcgaa atggggccct gagtctggct ccatgctcgc tatccatgcc 3120
aaccaggaca ctgtcaaatc cattgtcgag atcatcgaga ccatgatcac caaccctgac 3180
gaggcacttg agattgcatg ctacaacagc atcacaagtc acattgttgt tggaaaggag 3240
tcgtccattg agatggcaga gaaggtcatt caacaagatg ctcgctacca cgggctgcgg 3300
taccagcgct tgaacaccag ccatggcttt cactcccgct tcacggagcc tctcctccaa 3360
gacttgatcc acgttgagcg cagcgtagag ttccgcaaac catctattcc cttggagacc 3420
agcactcaga ctccggtcga ctttgcaaag aagcgtcact ccaagtacct ttctaaccat 3480
gctcgggagc ctgtcttctt tgtcgacgcg gcccgccgtc tagagtctcg tctcggcgag 3540
tgcgtgtggc tcgaggctgg atggaacacg cccatcgttg ccatgaccaa acgtgcggtg 3600
gccaacccat cagcccatac cttccaggct gtcacgtctc ctgcagcagt tgcaatggag 3660
ctgtggcggg aaggcatcgc aaccacctac tggagcttct tcacccccaa ggagagtggt 3720
ttgaagcaca tctggcttcc tccttacagc ttcgaccgac ctaaatactg gttggagcac 3780
gtcgatcgtg ctgtccaaga gcgggatgct gccgcgaacg gctccgcttc gccgccgcct 3840
aagaaggtcc agcaactggt caccctcaag aagaccgagg gcacaaagtc tcagttccgc 3900
ctgcacacaa ctaccgagcg ctacaagcgc attgtgtctg gtcacgctgt tcgcagcaag 3960
cccctgtgcc ctgcttctat gtacatggag tccgccatca tgggtactga gcagcttggt 4020
gcttctctcg tcggcaagac catcactttc gagaatgtct ccttcacgaa gcctttgggg 4080
tgcgatgaaa accttgaggt ttacgtcaac ctcgagcaga acaccgctgc cggtgaagaa 4140
gcttggcatt acgccgtgca atccggaggc aagggcagtc actctgaagg tgacttcttc 4200
gccacaagcg gagagatggc agacattcag ttgtacgaga tgctcatcgc cgacaagatc 4260
gaggctctcc gcaatgatgt tgacgccgaa cgtctgcgca ctgcgacagc ctactctatc 4320
ttctctcgag tggttgagta ctcggatttg ctacggggta tctcgagcat caccatgggt 4380
acccgtcagg ctctcgctca aattaaggtc ccgaagtcca cctttgaggc tcaggagagc 4440
actgtgtccg acttctacga tgcgatcact cttgacacct tcatccaggt cctggggctt 4500
ctgatcaact ctgacaatga ctccagtgca gatgacgaga tttatgtcgc ttccagtatc 4560
ggaaagatgg ttgtgtcccc caccgagttc aagaagcacg ctacgtggaa tgtttatgcc 4620
acctactccg cttccgacag caaggcatcg agcggtgctg tctttgtctt ctccgaggac 4680
cgcaaattgg tcagcttcgc tacgaagatc caattcatga ggatcaaggc cgcgaagctg 4740
gagaaggtct tggagtcggc gaaccctggc tcgaagacaa agtcgacaaa tggtaacgct 4800
cttccatctg tcccgcgctc tgtgccggct ggcccaactt cggcgcctca gcaagtcgca 4860
ccgaccacca tgccatccgc gccggctcca gtcccagtgg tggcggcagg tgcgagtcca 4920
tcaaagattg ccgacctcaa gtccttgatc tcggtctaca ccggtgttcc cgttgacgag 4980
atgcaagaca accagaactt tggcgacatg ggacttgact ccctggcatc gatggagctg 5040
gcagacgaga tggagtcaaa gcttggcctg aaggtcgaga ctgaggacct tctcctcggc 5100
agcgttggct ccttgatcaa gttgcttgct ccctcttctg ggcccacagc cgcgttgacg 5160
gagggcctgg tcgagagtta cgatacctgt tcggagtctt ccgattccat tcgcaactcg 5220
accggtttcc acaccacgat cccagctacc ccagctgagc tgcactcaaa cccacctgat 5280
tcgctggatg gaagcactgt ctggacgaag ccgaagcact cattgagcgc acggttcaag 5340
cttgacacaa tggtgtacaa ggaggcagag ggcatcgaca ttccagctga tgtctatgtt 5400
ccccaagaac cgcctcaaca acctatgcct gtagcactaa tgatccacgg cggtgggcat 5460
ctcaccctct ctcggcgagc agtccgacca acccagacaa agtacctcct gtctcagggc 5520
attctgcccg ttagcattga ctatcgccta tgcccgcagg tcaatgtcat cgatggccct 5580
gttgctgaca ctcgcgacgc ttgtgaatgg gctcaacggg accttccaaa gataatggcc 5640
tcaaggaaca tcgaggtcga tgcctcgaag ttgattgtca ttggctggtc cactggaggc 5700
acattagcga tgacaacggc ctggacgctg ccatcggctg gacttccccc tcctgttgcg 5760
attttgagct tctattgccc ggtaaattac gaccctgaag cccccatcca gatgggcgag 5820
gagcacgaga agcgcaacat gtctttgagc gaaattcgcc gactactggg tcctcagcct 5880
gctaccagcc acgcttcgca taccaccgac acaaccaagc ttggctgggt gcaggcgaac 5940
gacccacgct cagagctcgt gctagccttg atcaaggagc cgcgcggcat gtccctactg 6000
ttcaacggac ttcctccaac gggtgaggag ctgccagtcc ccgacgccga gcgcgctgca 6060
gctctcagcc ccttggtaca agtccgcaag ggcaactatg acgtgcccac ctatctcatc 6120
tttggcgacg aggatgagat cgctcctttt ggcaaggccg tcgagttcgc tcaagcgctc 6180
aaggacgctg gtgtcaagag tggcttccta cccatcaaag gtggtaagca catcttcgac 6240
ctcgggatca gcccgggaag caaggcgtgg gatgagtcca tcggtcctgg gtacgacttc 6300
ttactgggag agcttgagaa cgcccatcgc agatgcagag atgtatag 6348
<210> 4
<211> 1665
<212> DNA
<213> 菌核生枝顶孢
<400> 4
atgtctgcta ttcccaagaa gtgcaccgtg ctggtgattg gcggtggccc cggtggcagc 60
tacgccgcca gcgccttggc tcgcgagggc attgacactg tcgttttgga gggtgacaag 120
ttccctcgtt accacattgg cgagagtatg cttgcgtcga tgaggcatct tctgaagttt 180
gtcgagctcg atggcaagtt tgactcttac ggcttcgtca agaagcccgg tgccgccttc 240
aagctcaaca agaacaagcg cgagggctac accgacttcc tcgctgccgg cggccccaac 300
aactacgcct ggaacgtcgt gcgctccgag gcggacaacc tcatgttcca gcacgccggc 360
gagagcggcg ccaagatctt cgacggcgtc tctgtcaagt cgattcagtt cgagaacccc 420
accgaggtcc ccgacggcga gcccaacctg aaccctggca agcctgtgtc ggccacctac 480
cagatcaagg agaccaagga gcagggccag attgactttg actacgtcgt cgatgcttcc 540
ggccgtattg gtatcttgag caccaagtac atgaagaacc gtcgctacaa ccagggtctg 600
aagaacattg ccaactgggg atactgggag ggctgcaaca agtacgcccc cggtacccct 660
cgcgagaact cgcccttctt cgaggctctg caggacgaga gcggctgggc ttggttcatc 720
cctctccaca acgggaccgt gtcggttggt gtggtcatga accagaagct cgccacccag 780
aagaagcagg aagccgatct tgactccacc gagttctacc acgacaccct gaacaagatc 840
tctcccaacc tgcgggaact gattggcgac ggcaagttcg tgtccaacgt caagaccgcg 900
tccgactact cctacagcgc ctcttcttac tccttcccct acgctcgcat tgtcggcgac 960
gctggttgct tcatcgaccc ctacttctct tccggagtgc acttggcgct gaccagtggt 1020
ctctccgctg ctaccaccat ctctgcctcc atccggggac aggtcgacga ggagctcggc 1080
tccgagtggc acaccaagaa gttctctgac gcttacacgc gtttcttgct ggtcgtgctg 1140
agtgcctaca agcagatcag gcaccaggag gagcctgtcc tctccgactt tgacgaggac 1200
aacttcgacc gcgccttctc cttcttccgt cccatcatcc agggcaccgc cgacgcggcc 1260
aacaacaagc tctcgcaaga ggagctcaac aagacgctcg agttctgcgc cttcgcgttc 1320
gagcccgtcg agaacgacga ggatcgcagc aaggccatgt cggccatgca ggaggccgtt 1380
gacaacggca ctgggtacca ccccgacctg tcccccgagc agctcaaggc cgtcaagcac 1440
atccaggcca gacgcgcgat gcgtacctcg gacacgatga acattgagag cttcggcact 1500
gacgcgatca acggctttgt tccgaacctt gtccggggta gcctgggttt gaggaagcag 1560
gaggcgatga gcggtgatat gggtggcgcg aatggtcatg tcgacgagac gaatggtgtg 1620
actgttaatg gacaccacca gcccgagggc gtcaaggctc attga 1665
<210> 5
<211> 3195
<212> DNA
<213> 菌核生枝顶孢
<400> 5
atgacagaac tgattccagg acctaaaggt ctgccattga ttggcaacgt ccttgacatt 60
gatccagtgg atgctgttgt atgtcttgga cgtattgccg acacctacgg ccacatctac 120
cagctcaaag tcggcggttc agccaagatc ttcatctcga gccgagagct cgtcgatgaa 180
ctatctgacg agagccgctt caccaagctg gtgtcgggcc cgctagcaca gcttcgcaat 240
gtctgtcatg actccctttt cacggcgcag tcggacgagc cggcgtggga tcttgcccac 300
aagattctga tgccagcttt cgggcctctt gctattcgag ggatgttcga cgaaatgcac 360
gacatcgcat cgcagctcgt cgtcaagtgg gcgcgattcg ggcctcaaga caccatcgac 420
gtttctggcg actttacacg gctaacactt gatgcaattg cactctgctc catgagcacc 480
cgcttcaact ctttctacaa gcaagatcaa cacccctttg tgagctcgat gcttgaggtc 540
ctcgccgagt caggcaagcg agcagtccga ccgccgtttg tcaacgacta catcttccgt 600
ggatcgttaa agcactacaa cactgaaatt gccacaatgc ggcggatcgc aatggatgtc 660
ctagccgagc gtcgcgccaa ccctatggcg tgccagaaga acgacctgct caacgccatg 720
atcaacgggc gggacccgaa gaccggggag gggctatctg acgagagcac gatcaacaat 780
ttgatcgtct tcctcattgc cggtcacgaa accacaagtg gcttactctc tttcttgttc 840
tactacctcc tcacccgtcc cgatgttttc gaaaaggcac aaaaggaggt cgatgagctc 900
gttggacgag gacctgtgac gattgaacac atgtcaaagc tgcattacat cgaagcctgt 960
ctccgggaaa cgcttcgtct gcaccccaca gcaccggtca ttaccttcaa gacgaagccg 1020
gggttcgaaa aggagagcac caccatcgga ggtggcaagt acaagatcga ccgcgatcag 1080
ggcatcgtgg ccctgctggt caatatccag cgcgacccca aggtctgggg cgacgacgcc 1140
aacgagttca agcctgagcg catgacggat gagaaattca acaacctccc tgccaactgc 1200
tggaagccct tcggcaacgg catccgggga tgcattggcc gcgcgttcgc ctggcaggag 1260
agtctgctga tcacggccat gctgctgcaa aacttcaact tccagctggc ggatccggac 1320
tacaagcttc agatcaagca gacgctcacc atcaagccgg gcaacttctt catgcacgct 1380
aagcttcgag atcacgttga cccgctggag ctggagggca tccttcatgg aggagccaag 1440
aagggctcaa agattgatgg gccatcatct ggcgcttctc ttgccaccac tgagcaagag 1500
ctgcagccca tgaccattct ttacggctct gactcgggca cttgtgagtc catggcgcag 1560
tcgctggctc gcgcggctag gggtcgtgga tacggtgcga cagtgaaaac tctcgactct 1620
gctgtcgaac aagtccccaa agaccagcct gtggtgatcg tatcgccaag ttacaacggc 1680
cagccaccaa gcaacgctac tgacttcgtc aagtggctag aagcactcga ctccaaggcc 1740
ctcaaggacg tcaagtactc cgtttatggc tgcggcaaca aggattatac ctcaaccttc 1800
catcgcatcc caaagctcct ggacgccgag tttgaaagat gtggcgcaaa gcggatcgcc 1860
gaaactggcc tgggcgatgt caccgttggc gatatcttca gcgactttga gagatggcaa 1920
gacgaccagc tctggccagc gcttggtgtg gcacacatgg atggtgatgc ggatgccgag 1980
tttgacattc atgtcgacag gagtggccgt gccgctgagc ttgaagtcga tgcggatgag 2040
gcgacggtgc agagcaacca ggtcttgaca gcgcccggag agccagagaa gcggtacatc 2100
actttgaagc tgccagaagg aatgcagtac aagagcggag atcacctctc cgtgctacct 2160
ttgaacgatt ggggtgttgt tcgaagggtc ttcgcctggg cgcaactgcc ttgggatgca 2220
gtcgtgacga tccccaaagg aaccaacact tcattaccga ctggtcgcca aatctctgcc 2280
aaagatcttt taagcggata cgttgagctg agccaacctg ctactcgaaa gaacattgcg 2340
aaactcgcag ccagttcgcc atgtcctttc acacagaaga gcctctccaa gcttgaagag 2400
cacttcgaca gcgatattgc tcagaggcga ctctccgttc tcgacatctt ggaggaattc 2460
cctgccatcg atattacctt tggcaacttc atctctatgt taccgccgat gcgtcctcga 2520
cagtattcta ttgcttcgtc gcccatggct gatccatcaa ctgcgacgct gatgtggact 2580
gtactcaact cggaagccta ctctgggtct ggccgacgtt tcttgggggt ctgctcgaca 2640
tacctcgccg ggttggctga aggcgacagg gtccatgtga cggtcaagcc ggcgctgcgc 2700
ttgttccatc ctccttcgga tcccgaaagc atgcccatca tcatggcctg cgccggaacg 2760
ggccttgcac ccttcagggg cttcctcgaa gagcgcgtct gccaaatgaa ggctggtcgc 2820
gcactcgccc cagcttatct cttcgtcggc tgcagagacc cggaaaagga tgctctactc 2880
aaagatgagt tggctcagtg ggagcgagac ggggtggtga agatctacta tgctttctcg 2940
agagccagcg accagagcga cggctgcaaa cacgtccaag accgcatctg gaacgagaga 3000
gatctcgtca gaaagggctt gtttgaaggc aacgccaggt tctttatgtg tggtggctct 3060
ggcgccggca agagcgtcga ggatgtggtg aagaggatct acaaggataa taaaggcgag 3120
agtcaggaga aggcggcgga gagctggttc caggatctga aagcgaatcg ctacgtgacg 3180
gagatttttg cataa 3195
<210> 6
<211> 822
<212> DNA
<213> 菌核生枝顶孢
<400> 6
atggcttttg gtgttgagcc ccccgagcat gtgacgccct ggttcaagcc cgtctacgag 60
gccacattcc agtttggcgg cgtcgcgtgg acactatgct acatcctcat tgcccgtgag 120
ggtatgcgca ccaagtccta tggcatgccc ctctttgccc tcgccaacaa cttcgcgtgg 180
gagatggtct acgctctctg ggtcgtggac aacgcctttg agaagaccgc catgacgatc 240
tggatgttga tcgacacgcc catcatctac tccatcctga agcacggcgt gctggagtgg 300
cagcatgcgc cgatggtgag caggaacctg aagagcatcc ttgtgggcct gattgccctc 360
tgtgcggcgg cgcattggag ctggcagagc tggtggattg gcaacgagat ggggaagaga 420
gacgacctgg agggcgcaga tttgacgcag atggcctact gggctgtgag catgtgtcag 480
ttcctggtga gcaccatgtc gctggccatg ttgtgcgtta ggggccactc tggtggcgtg 540
agctggatga tctggctttc gagattcttg ggtactctca tcggtctcaa catgaactac 600
gcttgggcat actacacctg gcccgaggcg cacgagtact tcatgtccgc accagccgtc 660
ttcgtctggg gcgtgaccac cgtgtgcgac atcatctatg gcttcgtgct ttaccacgtc 720
aagagcaacg agagggagct gtcggatggt cgcaaggtag ctgctgaggc cgatgacgag 780
caggttgggg gctggagcaa gatgaagact gggaagaact ga 822
<210> 7
<211> 1605
<212> DNA
<213> 菌核生枝顶孢
<400> 7
atggggtctc tactattcga cagccctgtt gggcgtttcg tcgcctcgtt ccctgccctg 60
tcggcggcag ctggactcat cgttgctatt tctttcatct acattcgctt cattaagacg 120
cccaagctcg atctccccgt ggtgggaaac cctggtgaca agtgggatgc ccagaagcac 180
attgtcgctg gcgcccgcaa gtaccccgac actccctaca tcctccccat ggatccccct 240
attgtcgttc tccccattaa gatccaggat gaagtccgca acctccctga gaatgttgtc 300
tccttcacca aggagcacca gcgcaacttc ttcgcgcagt acaccggtat tggagaccac 360
cgtcccgaga tgatcactgc catccgtcaa gatctgacaa ggcacatcgt ctctaccatt 420
cctggtctgc aggaggaggt gcgctacggc ttcgacaagg agtttggcga ttgcaaggac 480
tggacgcctt tccctctcta catgaaggtt ctccgcattg tcgctctgac ttctggccgt 540
gtcttcgttg gtcgtcctct ttctcgtgag gaggagtggc tgcagcgcac catcagctac 600
accatggact gtgtcaaggc ccgcaacgct atccgcgagt acccctggtg gaagcgtcgc 660
tgggtcacca gctccctccc cgagattgcc aagctgactg agcaccgtac tcgtggcggt 720
gtcttgctca agcccatcat ggacgctcaa ttggccaagg actccaagcg ggagaagatc 780
atcaacgagg agacgggtga cgaggagggc aacttcattg agtggttgct gaaacacacc 840
cccggtgacc tcaagatgga tcccgagaat ctggctctga accagatggt tttggcattt 900
gcttccgttc acactagctc catgtctgtc acccacgcca tcctcgagct cgtcacgcga 960
cctgagtact tcgcccctct ccgtgaggag ctggaggagg tccgtcgcgc ggatggtcac 1020
actgttgacg acgacggcta catccgtctg aagaaggaat ccattaacaa gctccgcaag 1080
ctcgacagct tcatgaagga gtcccagcgc ttcaaccctc ccatctcgac ctctggtacc 1140
cgtatctgca ctgcagactt gaagctgtcc acaggtcaca ctctccccaa gggcacacgc 1200
atctgcttcc cgtcctacga cgtccaccac aaccccaaga ccaccaccta ctctccagag 1260
tacaaccctc ctggctacac tcctcccgat cagttcgacg gcctgcgctt cttcaagctg 1320
cgcgagatgc ctggcaagga gtcccgtcac cagttcgcca ctgccaacca cgagtccctc 1380
gttttcggct ttggtaacca cacctgccct ggtcgcttct ttgctgcgaa ccagatcaag 1440
attatcctgg ctgagctgtt gatgaactgg gatgtcaggc tgaagggtga cgtcgagcag 1500
aagggaggtc ccgagaagag gccccagaac atggtcgttg atcttgtcat cacgccgaac 1560
ccgatggcta tggttgagat gaagaggcgg agtcgggcgg tttag 1605
<210> 8
<211> 1539
<212> DNA
<213> 菌核生枝顶孢
<400> 8
atggggctat cactcggtta cagccccgat cgaggcagca ttgggtcttg gatctgtgct 60
gcgccgctaa ttctggctct tttcgtcatc tcgtaccgtc tttttcaatc tgtgatcgac 120
tatcgactgt cgcaccgcaa cggctgcaaa ccacccccta cgtaccctca caaggattgg 180
tatcttggcc tccaccacgt tttcggcctc ctgaaagcga agaaagaaaa ccgtctgccg 240
actgcattta gcgagctttt cgacgccagt ggccctgatg ttcacactct gggccactat 300
gtccttggca aaaagtctta ctggacaaga gaccccgaga acatcaaagc tgtcctgtcg 360
tccaagttca acgactgggg tcttccgtct gcgaggaagg caactttcag gacatgtctt 420
gggggcggca tctttggtgt cgatggcaaa gagtgggagc actcaagagc aatgctcaag 480
ccttcattca cccggactca gattggggac actgcgactc tgtccaagca cgccgacaac 540
ctcatcgcaa ggattccaga gggggagacg gtggacctag ctgagctatt tcccctcctt 600
accatggatg ttggaacgga aatgctcttc ggcgaaagcg tcgggagcct ggatccagcg 660
gagatcaagc aggccactag gttcactaca tcatttgact acattgttca gacaatgtcc 720
aagcacatgg ccttgcctat ccttacaaag cttcgcgata agacactaca aggatgcgtt 780
gaatttgtcg acgacttcgc agctgatgtg gtaaatcgga ccatcgccaa tgaaagcaaa 840
acggagaagc cgagctccct tgggaagtac atctttccta ctgagctggc caagatgggc 900
ttgccggaga aacaaatcag gatcgaggtt atcaacatca tggttgctgg aagagatacg 960
actgctgcac tcctgagtct catctggtgg tacttagcga aacgacctga tgccgtcatg 1020
aagcttcatc aggagcttga gccgctcgga ggacggccgc caacaggtga agaggtcaag 1080
aagatgaagt acctcagaaa cttcgtcaat gaaatcctga ggctccaccc aatcaacccc 1140
ttgaactccc gtaccgccgc caaagacact accctgccac gcggtggggg accggacggg 1200
aagtcccctg tattcatacg aaagggaaca cagctcatgt tctcttctgc tgccctgcaa 1260
cgtagaaagg atctgtacgg agaagatgct ttggatctga ggcccgagag atgggagcgc 1320
atccgaccat ccgcgtttga atacattccc ttcggtggcg gtccaaggat ttgtccaggt 1380
caacagcttg ccttgacaga agcatcatac ttcactgcaa gactcttgca agagtttcag 1440
ggagtgactt ccgagtcgag cggaccgttc caggaagcat tcgctattct cgtgaccagc 1500
ggagacgggg tcaaggttaa gttccacaag aagcactga 1539
<210> 9
<211> 1155
<212> DNA
<213> 菌核生枝顶孢
<400> 9
atgccccagc tcgcaggtaa gttaatactg gcagggctca ttcccctggg tgcatgggtc 60
ctccatggtt tcgcctcctg caacggactc atccagatgt tcgaagactt cgggaagcag 120
acagtcctgt cagacggagt gaccgattac actggggctt tcaccggcct tgagggcctg 180
gatcgcctcc tcaggactct gctcaatttt ttctggccag ttgccaacgg acatgattgg 240
gcactgtcgc tgcatgcttt catgtttgct ggccaaggag tcccgctcct ggtgcttaac 300
atgctggaag gggctcgacc tgggaacaag tctctggtcg tcagctacgt taccgtcttc 360
ggaattctgt acatggtggt tggattagcc atcatggccc ccttgtatct cttccttcac 420
ctcttgacat ctcgaaccgc cactgcaccg tccaaggcta aagtggccgt ggaccctaac 480
acggcaaaag ccgtcggctt cggcgtgttc gtaggctacg tactgcccac aattttcatg 540
tcattgcctc atccttcgct tctgtccacg gacacaaagg tcttgtcagt tgtcttctgg 600
caagcagtgc cgctgtgggc ctcagtgtgt gcatactttg catctacagc tcttggccag 660
tcggcaactt cacggtcgtc cagcaacctg ccttcggcat tgggagcggt atatgccgcc 720
tctctcatca tcgcaactgc cactcacgtt gccacattcg ccatatccgc aaatctatcg 780
gatacctgga gcggcatttt cacctttttg attccaccga atcccttcaa cacggatatg 840
aggatctcat ccttccttga gggcgcaact tggttcttgc agtgggacta cacaatgatg 900
tccttggcat acatggtctg ggccatcggt atccggcacg gggttgaagt acctcggagc 960
tcgcaccact tcgagacact cggaaagatc gccctgcgct cgatggcgaa gttgttggtc 1020
atgggaccca ttggcgcagc gctcagtctt gtatgggaga gagatcaact actgtggcaa 1080
cttgacagcg agagcggtga gaagggtgag aaaaataggt ctaggaggat gtcaaggaag 1140
tggatgttct catag 1155
<210> 10
<211> 891
<212> DNA
<213> 菌核生枝顶孢
<400> 10
atgacagaca ttcatattca ggacggagat ctctcgagtc tcaaggacaa ggtggtggtg 60
atcacaggtg gctcctcagg tatcggtctt gctactacga accttctgct cgacctcggt 120
gcaaaggtgg tcattggcga tctccaaccg cccacgaccc gtgtggacag cgagcgatgc 180
agctttcaca aagtagatgt gaccgtgtgg tctgaccaac tgaccctttt caaggaagct 240
cgagagctcc atggaagaat tgaccacgtt tttgccaacg caggcgttgg gcctaaagcc 300
gactacctat caacggcact tgaccagaat ggcgatttgg tagagccaac gttcttgacg 360
ctcgatgtca acttgaaggc agtcatctac accgcgacca ttgcttgcta ctacatgcgg 420
gaagagcagc aaagccctgc tggaggaagc atcgtcattg tctcgtctgt tgctggtgtg 480
tcgcgcttca gggcggtcga ctatgccact gccaagcacg gaaatcttgg tttcgcccgc 540
ggtctgcatc agcggttgac ggctgagaac tcgccaactc gcgtcaacct catcgctccg 600
tcgtggacca acacgggctt catgccaccc cagattatgg cggccgttgg cgtcgagcct 660
caagagcctg cctcggtggg tcgagctgcg gcttatctga tggctgatga ctcgagaaaa 720
ggacagatga ttcacattgc gaaggggcga tatcgcgagg ttgaagagag cattatgctg 780
cccgctgctg agaaagttgt tgacgtggag aacgggggtg tgatggaaga cgacaccctg 840
gctaagatta ttgagaccat gggcatattc aaagcgaagg caacacaatg a 891
<210> 11
<211> 336
<212> PRT
<213> 菌核生枝顶孢
<400> 11
Met Ala Ala Lys Ser Arg Ser Pro Lys Arg Gly Thr Ser Glu Lys Thr
1 5 10 15
Pro Leu Val Glu Lys Glu Ala Pro Tyr Gln Pro Pro Thr Lys Gly Ile
20 25 30
Leu Ser Lys Leu Pro Ala Ser Trp Val Pro Tyr Ala Gln Leu Ile Arg
35 40 45
Leu Glu Gln Pro His Gly Asn Tyr Met Ile Tyr Phe Pro His Ile Ile
50 55 60
Gly Leu Met Tyr Ala Ser Ala Ile Arg Pro Thr Glu Leu Ser Val Leu
65 70 75 80
Gly His Arg Ala Ala Ile Phe Ala Ile Trp Thr Phe Leu Met Arg Gly
85 90 95
Ala Gly Cys Ala Trp Asn Asp Asn Val Asp Gln Asp Phe Asp Arg Lys
100 105 110
Thr Glu Arg Cys Arg His Arg Pro Ile Ala Arg Gly Ala Ile Ser Thr
115 120 125
Thr Gln Gly His Val Phe Thr Leu Ile Leu Thr Leu Leu Gly Phe Ala
130 135 140
Ala Ile Gln Ser Leu Pro Ile Glu Cys Thr Tyr Val Gly Val Gly Thr
145 150 155 160
Thr Val Leu Ser Ala Ile Tyr Pro Phe Gly Lys Arg Phe Thr His Phe
165 170 175
Ala Gln Val Ile Leu Gly Ser Thr Leu Ala Ser Thr Ile Ala Leu Ser
180 185 190
Ala Tyr Ser Val Gly Leu Pro Ala Leu Ser Lys Asp Tyr Phe Val Pro
195 200 205
Thr Leu Cys Leu Ser Ala Thr Ile Met Leu Leu Val Val Phe Tyr Asp
210 215 220
Val Val Tyr Ala Arg Ala Asp Thr Thr Asp Asp Leu Lys Ser Gly Val
225 230 235 240
Lys Gly Met Ala Val Arg Phe Arg Asn His Leu Glu Gly Leu Phe Ala
245 250 255
Phe Ile Thr Leu Ser Ile Ala Gly Ser Leu Thr Thr Leu Gly Tyr Leu
260 265 270
Val Gly Met Gly His Trp Phe Tyr Leu Phe Ser Val Gly Gly Leu Thr
275 280 285
Phe Gly Leu Val Ser Met Val Ala Leu Thr His Trp Asn Ile Leu Pro
290 295 300
Gly Tyr Ser Ser Gly Arg Cys Tyr Ala Phe Ala Ile Leu Asn Leu Leu
305 310 315 320
Thr Gly Phe Ile Met Glu Tyr Ala Thr Lys Asp Tyr Val Val Gly Val
325 330 335
<210> 12
<211> 1093
<212> PRT
<213> 菌核生枝顶孢
<400> 12
Met Thr Val Asn Gly His His Thr Asn Gly Val Asn Gly Ala Asn Gly
1 5 10 15
Thr Asn Gly His Ala Asn Gly Ser Asn Gly Ile Asn Asp Thr Lys Ala
20 25 30
Val Lys Glu Ile Val Pro Phe Val Lys Pro Gln Val Asn Phe Ala Ser
35 40 45
Ala Gln Arg Leu Glu Gly Cys Ile His Ser Leu Pro Glu Leu Val Asp
50 55 60
Phe Asn Ser Leu Asn Asn Gln His His Thr Phe Cys Val Gln Ala Lys
65 70 75 80
Ser Ser Glu Pro Phe Asp Thr Ile Thr His Gly Glu Phe Lys Val Ala
85 90 95
Val Ser Lys Cys Ala Ala Trp Leu Lys Glu Asn Leu Pro Ile Arg Pro
100 105 110
Ser Ser Asp Asp Lys Ala Leu Thr Lys Met Ala Pro Val Ala Leu Phe
115 120 125
Met Glu Ser Asp Ile Gly Leu Val Ile His Glu Phe Ala Leu Met Ser
130 135 140
Ile Gly Val Pro Pro Leu Val Leu Ser Pro Arg Leu Ser Pro Val Ala
145 150 155 160
Ile Asn Ala Leu Leu Glu Ala Thr Gly Ala Ala Ser Phe Ile Val Ser
165 170 175
Pro Arg Met Ser Glu Pro Leu Lys Gly Ala Leu Ala Ala Leu Ala Ala
180 185 190
Lys Gly Val Ser Thr His Ile Gly Asn Pro Tyr Lys Ala Tyr Tyr Gln
195 200 205
Pro Gly Ala Asp Pro Lys Ser Val Ala Pro Phe Glu Val Pro Gln Asn
210 215 220
Pro Glu Asp Val Ile Leu Leu Leu His Ser Ser Gly Thr Thr Gly Leu
225 230 235 240
Pro Lys Pro Ile Pro Thr Thr His Arg Gln Leu Leu Phe Ala Val Asn
245 250 255
Cys His Lys Phe Asp Thr Glu Glu Gln Ala Gln Ser Leu Asn Leu Ser
260 265 270
Thr Leu Pro Leu Phe His Gly Phe Gly Leu Val Ala Pro Gly Leu Ser
275 280 285
Met Ser Ala Gly Lys Pro Thr Leu Tyr Pro Ala Ser Asp Gly Ile Pro
290 295 300
Asn Ala Lys Ser Ile Val Asp Leu Ile Asn Lys Thr Asn Ala Lys Ser
305 310 315 320
Met Met Thr Val Pro Phe Leu Leu Asp Asp Ile Thr Asn Leu Pro Asn
325 330 335
Glu Glu Gly Ile Lys Ala Leu Val His Met Asp Phe Val Gly Thr Gly
340 345 350
Gly Ala Ala Leu Gly Ala Gly Ile Gly Asp Arg Leu Ala Lys Gly Gly
355 360 365
Val Lys Leu Leu Asn Phe Tyr Gly Thr Thr Glu Thr Gly Pro Leu Ser
370 375 380
Leu Thr Phe Ala Pro Thr Asp Asn Tyr Asp Trp Lys Tyr Phe Arg Leu
385 390 395 400
Arg Thr Asp Cys Glu Tyr Lys Ile Asp Glu Leu Glu Pro Arg Asp Gly
405 410 415
Glu Arg Arg Phe Arg Leu Thr Val Tyr Pro Tyr Gly Ser Glu Gly Phe
420 425 430
Glu Ile Ser Asp Gln Leu Ile Arg Asn Glu Gln Tyr Pro Glu Thr Asp
435 440 445
Phe Ala Ala Val Gly Arg Asp Asp Asp Val Ile Val Leu Ala Thr Gly
450 455 460
Glu Lys Ala Asn Pro Leu Ile Leu Glu Thr Lys Leu Thr Glu Ala Pro
465 470 475 480
Met Val Lys Ala Ala Ile Ala Phe Gly Glu Asn Gln Phe Asn Leu Gly
485 490 495
Val Ile Val Glu Pro Ala Glu Pro Leu Thr Pro Asp Thr Glu Ser Ala
500 505 510
Phe Arg Glu Ser Ile Trp Pro Ile Ile Thr Ala Ala Cys Asp Gln Met
515 520 525
Asp Ala Phe Ser Arg Ile Pro Ser Pro Asp Ala Val Val Leu Val Pro
530 535 540
Ala Gly Val Val Ile Pro Arg Thr Asp Lys Gly Ser Ile Ala Arg Lys
545 550 555 560
Glu Thr Tyr Ala Leu Phe Asp Lys Gln Ile Lys Gly Val Tyr Glu Gln
565 570 575
Leu Leu Lys Ala Ala Ala Asp Ala Val Glu Pro Leu Asp Leu Asp Asn
580 585 590
Leu Glu Gln Asn Leu Lys Ser Leu Ile Gln Glu His Leu His Ile Gln
595 600 605
Ala Pro Ala Ser Asp Trp Gly Val Glu Asp Ser Leu Phe Asp Ile Gly
610 615 620
Val Asp Ser Leu Gln Val Leu Gln Leu Arg Arg Ile Leu Val Thr Ala
625 630 635 640
Ala Ser Lys Thr Glu Ala Phe Lys Asp Thr Asp Cys Glu Lys Met Ile
645 650 655
Pro Pro Glu Phe Val Tyr Met Asn Pro Ser Ile Arg Glu Ile Ala Ala
660 665 670
Ala Leu Thr Lys Gly Ser Asp Gly Gly Asp Val Ser Leu Glu Asp Ala
675 680 685
Ala Lys Glu Val Val Glu Leu Ala Glu Thr Tyr Ser Leu Lys Gly Val
690 695 700
Ser Ala Gln Glu Lys Ala Pro Ser Ser Ser Glu Gly Ala Phe Val Met
705 710 715 720
Leu Thr Gly Ala Thr Gly Ser Leu Gly Ser His Val Ala Ala Asp Leu
725 730 735
Ala Arg Arg Asp Asn Val Ala Lys Val Val Cys Leu Val Arg Lys Asp
740 745 750
Lys Gly Thr Asn Gln Pro Pro Met Pro Gly Gly Asn Pro Phe Asp Lys
755 760 765
Lys Ile Leu Lys Ala Arg Gly Ile Gln Leu Thr Asp Glu Gln Phe Gly
770 775 780
Lys Leu Ala Thr Leu Glu Val Asp Pro Thr Ala Asp Lys Leu Gly Leu
785 790 795 800
Ile Pro Met Ala Tyr Gly Met Met Gln Ala Lys Val Thr His Val Ile
805 810 815
His Ala Ala Trp Pro Met Asn Tyr Leu Ile Arg Leu Arg Asn Phe Gln
820 825 830
Tyr Gln Phe Lys Phe Leu Arg Asn Leu Leu Glu Phe Ala Ser Gln Gly
835 840 845
Pro Ala Pro Thr Lys Lys Arg Phe Val Phe Ile Ser Ser Ile Ala Thr
850 855 860
Val Ala Arg Ile Gly Leu Ala Gln Pro Gly Ser Ile Ser Glu Ala Pro
865 870 875 880
Val Ser Pro Ser Asp Ser Ala Cys Gly Ile Gly Tyr Ala Asp Gly Lys
885 890 895
Leu Val Cys Glu Lys Ile Met Glu Lys Ala Ala Gln Asp Tyr Gly Gly
900 905 910
Gln Leu Asp Val Thr Ser Val Arg Cys Gly Gln Met Thr Gly Ser Lys
915 920 925
Lys Thr Gly Val Trp Asn Ser Asn Glu Gln Ile Pro Met Leu Leu Lys
930 935 940
Ser Ala Gln Gly Leu Gly Ser Leu Pro Gln Leu Ser Gly Glu Leu Ser
945 950 955 960
Trp Ile Pro Val Asp Asp Ala Ala Ser Thr Val Ser Glu Ile Ala Phe
965 970 975
Ser Asp Gly Ser Met Pro Ile Val Gln His Leu Glu Asn Pro Ile Arg
980 985 990
Gln Ser Trp Asp Ala Met Leu Gln Ser Phe Gly Arg Glu Leu Gly Leu
995 1000 1005
Pro Ala Gly Lys Val Pro Phe Gly Glu Trp Leu Asp Gln Val Ala
1010 1015 1020
Ala Ala Asp Gly Asp Asp Glu Thr Phe Pro Val Lys Lys Leu Thr
1025 1030 1035
Phe Phe Phe Lys Ser Phe Phe Gln Ser Val Ala Cys Gly Gln Val
1040 1045 1050
Val Leu Asp Thr Thr Val Ser Arg Gly Gln Ser Lys Thr Leu Asn
1055 1060 1065
Ala Met Thr Ala Val Gly Asp Glu Thr Val Lys Ala Tyr Ala Asp
1070 1075 1080
Tyr Trp Lys Ser Thr Gly Tyr Leu Ser Lys
1085 1090
<210> 13
<211> 2115
<212> PRT
<213> 菌核生枝顶孢
<400> 13
Met Thr Leu Ile Gln Thr Lys His Ser Ala Ser Ala Ala Val Phe Ser
1 5 10 15
Pro Gln Ser Thr Ala Pro Lys Pro Thr His Leu Ala His Ile Arg Ala
20 25 30
Arg Leu Leu Glu Asp Asp Leu Leu Lys Pro Val Lys Glu Ala Val Val
35 40 45
Ser Leu Pro Lys Thr Trp Arg Ala Leu Val Ser Lys Gln Pro Glu Leu
50 55 60
Gly Lys Asn Arg Lys Ala Ser Asp Leu Ile Glu Ala Phe Pro Ser Trp
65 70 75 80
Ile Glu Asp Gly Lys Thr Glu Val Leu Glu Thr Asp Met Ser Gly Leu
85 90 95
Ile Thr Leu Pro Leu Leu Ala Val Ile His Ile Val Gln Tyr Leu Asp
100 105 110
Tyr Ile Gln Arg Leu Gly Ile Ser His Ser Glu Phe Leu Glu Ser Val
115 120 125
Glu Ser Gly Gly Val Gln Gly Tyr Cys Ile Gly Leu Leu Ser Ala Ile
130 135 140
Val Val Ser Ser Ala Glu Asp Glu Glu Ala Leu Ile Gln His Ala Ala
145 150 155 160
His Gly Ile Arg Leu Ser Leu Ala Ile Gly Ala Phe Gly Asp Ile Gly
165 170 175
Ser Ser Ser Asp Glu Val Val Ser Asn Thr Leu Gln Val Arg Leu Arg
180 185 190
Asn Ala Gly Ser Glu Glu Asp Leu Val Ala Arg Phe Pro Gly Ser Tyr
195 200 205
Ile Ser Thr Ile Thr Asp Ala Lys Thr Met Ser Ile Ile Ala Pro Pro
210 215 220
His Leu Ile Asp Ala Leu Lys Glu His Ala Glu Thr Glu Gly Leu Arg
225 230 235 240
Pro Arg Ala Met His Ile Arg Ser Asn Leu His Asn Ser Arg Asn Thr
245 250 255
Glu Leu Ala Gln Gln Cys Ser Ser Leu Phe Glu Asp Cys Pro Phe Ala
260 265 270
Ser Pro Asp Thr Leu Gln Val Ala Val Arg Ser Asn Lys Thr Gly Cys
275 280 285
Tyr Leu Glu Gln Asp Ala Thr Ser Leu Val Glu Glu Ala Val Ser Thr
290 295 300
Val Leu Ala Ser Arg Cys Asp Trp Ser Leu Val Met Gln Gly Leu Ala
305 310 315 320
Asp Asp Leu Asn Gln Ser Gly Ser Lys His His Ser Ile Leu Leu Phe
325 330 335
Gly Met Gly Asp Ser Val Pro Gly Ala Pro Phe Arg Glu His Ser Leu
340 345 350
Asp Ile Ser Lys Ile Asp Val Leu Ser Leu Val Glu Thr Pro Leu Ser
355 360 365
Ala Thr Pro Pro Ala Ser Ser Ile Asp Asp Phe Pro Pro Asp Ser Ile
370 375 380
Ala Ile Val Gly Ser Ala Cys Arg Leu Pro Gly Ala Asn Ser Leu Asp
385 390 395 400
Glu Leu Trp Asp Leu Ile Ala Ala Gly Arg Ser Arg Leu Glu Lys Val
405 410 415
Arg Thr Asp Arg Val Asn Ile Lys Glu Ser Tyr Arg Ala Ser Gln Asp
420 425 430
Pro Glu Trp Thr Lys Lys Arg Glu Phe Tyr Gly Asn Phe Ile Asp Asp
435 440 445
Val Asp Ala Phe Asp His Ala Phe Phe Asn Ile Ser Pro Arg Glu Ala
450 455 460
Lys Tyr Met Asp Pro Gln Gln Arg Leu Leu Leu Met Ala Ala Phe Glu
465 470 475 480
Ala Met Asp Ser Ser Gly Tyr Leu Arg Ser His Gln Arg Asn Asp Gly
485 490 495
Asp Ala Val Gly Cys Phe Leu Gly Ala Ser Tyr Thr Glu Tyr Thr Glu
500 505 510
Asn Thr Ser Ala Tyr Ser Pro Ser Ala Phe Thr Ala Thr Ser Thr Ile
515 520 525
Arg Ala Phe Leu Ser Gly Lys Ile Ser Tyr His Phe Gly Trp Thr Gly
530 535 540
Pro Ser Glu Val Ile Asp Thr Ala Cys Ser Ala Ser Ile Val Ala Val
545 550 555 560
His Arg Ala Val Gln Ala Ile Asn Ala Gly Glu Cys Pro Val Ala Leu
565 570 575
Ala Gly Gly Val Asn Ile Ile Thr Gly Val Asn Asn Tyr Phe Asp Leu
580 585 590
Gly Lys Ala Ser Phe Leu Ser Gln Thr Gly Gln Cys Lys Pro Phe Asp
595 600 605
Asp Ser Ala Asp Gly Tyr Cys Arg Ala Asp Gly Val Gly Leu Val Val
610 615 620
Leu Lys Pro Leu Ser Lys Ala Val Ala Asp Gly Asp Tyr Ile Gln Gly
625 630 635 640
Val Ile Pro Ala Ile Ala Thr Asn Gln Gly Gly Ile Gly Ala Pro Gly
645 650 655
Ile Thr Val Pro Asp Gly Ile Ala Gln Lys Ala Leu Tyr Arg Gly Ile
660 665 670
Leu Glu Lys Ala Gly Leu Lys Gly Glu Asp Ile Ser Tyr Val Glu Ala
675 680 685
His Gly Thr Gly Thr Gln Val Gly Asp Pro Ile Glu Ile Gly Ser Ile
690 695 700
Arg Glu Val Phe Gly Gly Ala His Arg Ala Ser Pro Leu His Leu Gly
705 710 715 720
Ser Leu Lys Ala Asn Ile Gly His Ser Glu Thr Ala Ala Gly Val Ala
725 730 735
Ser Leu Leu Lys Val Leu Ser Met Val Arg Asn Arg Gly Val Pro Pro
740 745 750
Leu Gln Gly Phe Lys Arg Leu Asn His Lys Ile Pro Ala Leu Glu Leu
755 760 765
Asp Lys Met Ala Ile Pro Thr Lys Leu Leu Pro Trp Asp Ser Asp His
770 775 780
Arg Ile Ala Cys Ile Asn Ser Tyr Gly Ala Ser Gly Ser Asn Ser Ala
785 790 795 800
Leu Ile Cys Ser Glu Trp Leu Glu Glu Pro Ser Lys Leu Pro Asp Val
805 810 815
Thr Gly Gln Pro Leu Gln Glu Tyr Pro Ile Leu Leu Ser Ala Ala Ser
820 825 830
Asn Glu Ser Leu Leu Arg Tyr Ala Arg His Leu Ala Asp Tyr Ile Thr
835 840 845
Lys Ser Ser Ala Asp Leu Thr Leu Gly Asn Leu Ser Tyr Thr Leu Ser
850 855 860
Gln Arg Arg Lys His His Arg Ile Arg Trp Ser Thr Thr Ala Lys Asp
865 870 875 880
Leu Ile Gly Leu Ile Glu Gln Leu Arg Glu Cys Thr Pro Ala Asp Phe
885 890 895
Val Gln Ala Pro Gln Lys Ser Lys Lys Ile Val Leu Thr Phe Ser Gly
900 905 910
Gln Ser Arg Thr Thr Ile Gly Val Ser Asp Ser Ala Arg Leu Glu Asn
915 920 925
Pro Arg Phe Glu His Tyr Ile Gln Gln Cys Asn Asn Ile Leu Met Ser
930 935 940
Tyr Gly Cys Pro Asp Leu Leu Pro Tyr Leu Ser Gln Thr Asp Pro Ile
945 950 955 960
Ser Asp Pro Thr Ile Ile Gln Cys Gly Thr Val Thr Val Gln Tyr Ala
965 970 975
Cys Ala Gln Cys Trp Ile Asp Gly Gly Leu Asp Val Ala Gly Ile Val
980 985 990
Gly His Ser Leu Gly Glu Leu Thr Ala Leu Ala Ile Ser Gly Ala Leu
995 1000 1005
Ser Leu Glu Asp Thr Leu Lys Val Val Tyr Thr Arg Ala Glu Ala
1010 1015 1020
Ile Lys Ala Lys Trp Gly Pro Glu Ser Gly Ser Met Leu Ala Ile
1025 1030 1035
His Ala Asn Gln Asp Thr Val Lys Ser Ile Val Glu Ile Ile Glu
1040 1045 1050
Thr Met Ile Thr Asn Pro Asp Glu Ala Leu Glu Ile Ala Cys Tyr
1055 1060 1065
Asn Ser Ile Thr Ser His Ile Val Val Gly Lys Glu Ser Ser Ile
1070 1075 1080
Glu Met Ala Glu Lys Val Ile Gln Gln Asp Ala Arg Tyr His Gly
1085 1090 1095
Leu Arg Tyr Gln Arg Leu Asn Thr Ser His Gly Phe His Ser Arg
1100 1105 1110
Phe Thr Glu Pro Leu Leu Gln Asp Leu Ile His Val Glu Arg Ser
1115 1120 1125
Val Glu Phe Arg Lys Pro Ser Ile Pro Leu Glu Thr Ser Thr Gln
1130 1135 1140
Thr Pro Val Asp Phe Ala Lys Lys Arg His Ser Lys Tyr Leu Ser
1145 1150 1155
Asn His Ala Arg Glu Pro Val Phe Phe Val Asp Ala Ala Arg Arg
1160 1165 1170
Leu Glu Ser Arg Leu Gly Glu Cys Val Trp Leu Glu Ala Gly Trp
1175 1180 1185
Asn Thr Pro Ile Val Ala Met Thr Lys Arg Ala Val Ala Asn Pro
1190 1195 1200
Ser Ala His Thr Phe Gln Ala Val Thr Ser Pro Ala Ala Val Ala
1205 1210 1215
Met Glu Leu Trp Arg Glu Gly Ile Ala Thr Thr Tyr Trp Ser Phe
1220 1225 1230
Phe Thr Pro Lys Glu Ser Gly Leu Lys His Ile Trp Leu Pro Pro
1235 1240 1245
Tyr Ser Phe Asp Arg Pro Lys Tyr Trp Leu Glu His Val Asp Arg
1250 1255 1260
Ala Val Gln Glu Arg Asp Ala Ala Ala Asn Gly Ser Ala Ser Pro
1265 1270 1275
Pro Pro Lys Lys Val Gln Gln Leu Val Thr Leu Lys Lys Thr Glu
1280 1285 1290
Gly Thr Lys Ser Gln Phe Arg Leu His Thr Thr Thr Glu Arg Tyr
1295 1300 1305
Lys Arg Ile Val Ser Gly His Ala Val Arg Ser Lys Pro Leu Cys
1310 1315 1320
Pro Ala Ser Met Tyr Met Glu Ser Ala Ile Met Gly Thr Glu Gln
1325 1330 1335
Leu Gly Ala Ser Leu Val Gly Lys Thr Ile Thr Phe Glu Asn Val
1340 1345 1350
Ser Phe Thr Lys Pro Leu Gly Cys Asp Glu Asn Leu Glu Val Tyr
1355 1360 1365
Val Asn Leu Glu Gln Asn Thr Ala Ala Gly Glu Glu Ala Trp His
1370 1375 1380
Tyr Ala Val Gln Ser Gly Gly Lys Gly Ser His Ser Glu Gly Asp
1385 1390 1395
Phe Phe Ala Thr Ser Gly Glu Met Ala Asp Ile Gln Leu Tyr Glu
1400 1405 1410
Met Leu Ile Ala Asp Lys Ile Glu Ala Leu Arg Asn Asp Val Asp
1415 1420 1425
Ala Glu Arg Leu Arg Thr Ala Thr Ala Tyr Ser Ile Phe Ser Arg
1430 1435 1440
Val Val Glu Tyr Ser Asp Leu Leu Arg Gly Ile Ser Ser Ile Thr
1445 1450 1455
Met Gly Thr Arg Gln Ala Leu Ala Gln Ile Lys Val Pro Lys Ser
1460 1465 1470
Thr Phe Glu Ala Gln Glu Ser Thr Val Ser Asp Phe Tyr Asp Ala
1475 1480 1485
Ile Thr Leu Asp Thr Phe Ile Gln Val Leu Gly Leu Leu Ile Asn
1490 1495 1500
Ser Asp Asn Asp Ser Ser Ala Asp Asp Glu Ile Tyr Val Ala Ser
1505 1510 1515
Ser Ile Gly Lys Met Val Val Ser Pro Thr Glu Phe Lys Lys His
1520 1525 1530
Ala Thr Trp Asn Val Tyr Ala Thr Tyr Ser Ala Ser Asp Ser Lys
1535 1540 1545
Ala Ser Ser Gly Ala Val Phe Val Phe Ser Glu Asp Arg Lys Leu
1550 1555 1560
Val Ser Phe Ala Thr Lys Ile Gln Phe Met Arg Ile Lys Ala Ala
1565 1570 1575
Lys Leu Glu Lys Val Leu Glu Ser Ala Asn Pro Gly Ser Lys Thr
1580 1585 1590
Lys Ser Thr Asn Gly Asn Ala Leu Pro Ser Val Pro Arg Ser Val
1595 1600 1605
Pro Ala Gly Pro Thr Ser Ala Pro Gln Gln Val Ala Pro Thr Thr
1610 1615 1620
Met Pro Ser Ala Pro Ala Pro Val Pro Val Val Ala Ala Gly Ala
1625 1630 1635
Ser Pro Ser Lys Ile Ala Asp Leu Lys Ser Leu Ile Ser Val Tyr
1640 1645 1650
Thr Gly Val Pro Val Asp Glu Met Gln Asp Asn Gln Asn Phe Gly
1655 1660 1665
Asp Met Gly Leu Asp Ser Leu Ala Ser Met Glu Leu Ala Asp Glu
1670 1675 1680
Met Glu Ser Lys Leu Gly Leu Lys Val Glu Thr Glu Asp Leu Leu
1685 1690 1695
Leu Gly Ser Val Gly Ser Leu Ile Lys Leu Leu Ala Pro Ser Ser
1700 1705 1710
Gly Pro Thr Ala Ala Leu Thr Glu Gly Leu Val Glu Ser Tyr Asp
1715 1720 1725
Thr Cys Ser Glu Ser Ser Asp Ser Ile Arg Asn Ser Thr Gly Phe
1730 1735 1740
His Thr Thr Ile Pro Ala Thr Pro Ala Glu Leu His Ser Asn Pro
1745 1750 1755
Pro Asp Ser Leu Asp Gly Ser Thr Val Trp Thr Lys Pro Lys His
1760 1765 1770
Ser Leu Ser Ala Arg Phe Lys Leu Asp Thr Met Val Tyr Lys Glu
1775 1780 1785
Ala Glu Gly Ile Asp Ile Pro Ala Asp Val Tyr Val Pro Gln Glu
1790 1795 1800
Pro Pro Gln Gln Pro Met Pro Val Ala Leu Met Ile His Gly Gly
1805 1810 1815
Gly His Leu Thr Leu Ser Arg Arg Ala Val Arg Pro Thr Gln Thr
1820 1825 1830
Lys Tyr Leu Leu Ser Gln Gly Ile Leu Pro Val Ser Ile Asp Tyr
1835 1840 1845
Arg Leu Cys Pro Gln Val Asn Val Ile Asp Gly Pro Val Ala Asp
1850 1855 1860
Thr Arg Asp Ala Cys Glu Trp Ala Gln Arg Asp Leu Pro Lys Ile
1865 1870 1875
Met Ala Ser Arg Asn Ile Glu Val Asp Ala Ser Lys Leu Ile Val
1880 1885 1890
Ile Gly Trp Ser Thr Gly Gly Thr Leu Ala Met Thr Thr Ala Trp
1895 1900 1905
Thr Leu Pro Ser Ala Gly Leu Pro Pro Pro Val Ala Ile Leu Ser
1910 1915 1920
Phe Tyr Cys Pro Val Asn Tyr Asp Pro Glu Ala Pro Ile Gln Met
1925 1930 1935
Gly Glu Glu His Glu Lys Arg Asn Met Ser Leu Ser Glu Ile Arg
1940 1945 1950
Arg Leu Leu Gly Pro Gln Pro Ala Thr Ser His Ala Ser His Thr
1955 1960 1965
Thr Asp Thr Thr Lys Leu Gly Trp Val Gln Ala Asn Asp Pro Arg
1970 1975 1980
Ser Glu Leu Val Leu Ala Leu Ile Lys Glu Pro Arg Gly Met Ser
1985 1990 1995
Leu Leu Phe Asn Gly Leu Pro Pro Thr Gly Glu Glu Leu Pro Val
2000 2005 2010
Pro Asp Ala Glu Arg Ala Ala Ala Leu Ser Pro Leu Val Gln Val
2015 2020 2025
Arg Lys Gly Asn Tyr Asp Val Pro Thr Tyr Leu Ile Phe Gly Asp
2030 2035 2040
Glu Asp Glu Ile Ala Pro Phe Gly Lys Ala Val Glu Phe Ala Gln
2045 2050 2055
Ala Leu Lys Asp Ala Gly Val Lys Ser Gly Phe Leu Pro Ile Lys
2060 2065 2070
Gly Gly Lys His Ile Phe Asp Leu Gly Ile Ser Pro Gly Ser Lys
2075 2080 2085
Ala Trp Asp Glu Ser Ile Gly Pro Gly Tyr Asp Phe Leu Leu Gly
2090 2095 2100
Glu Leu Glu Asn Ala His Arg Arg Cys Arg Asp Val
2105 2110 2115
<210> 14
<211> 554
<212> PRT
<213> 菌核生枝顶孢
<400> 14
Met Ser Ala Ile Pro Lys Lys Cys Thr Val Leu Val Ile Gly Gly Gly
1 5 10 15
Pro Gly Gly Ser Tyr Ala Ala Ser Ala Leu Ala Arg Glu Gly Ile Asp
20 25 30
Thr Val Val Leu Glu Gly Asp Lys Phe Pro Arg Tyr His Ile Gly Glu
35 40 45
Ser Met Leu Ala Ser Met Arg His Leu Leu Lys Phe Val Glu Leu Asp
50 55 60
Gly Lys Phe Asp Ser Tyr Gly Phe Val Lys Lys Pro Gly Ala Ala Phe
65 70 75 80
Lys Leu Asn Lys Asn Lys Arg Glu Gly Tyr Thr Asp Phe Leu Ala Ala
85 90 95
Gly Gly Pro Asn Asn Tyr Ala Trp Asn Val Val Arg Ser Glu Ala Asp
100 105 110
Asn Leu Met Phe Gln His Ala Gly Glu Ser Gly Ala Lys Ile Phe Asp
115 120 125
Gly Val Ser Val Lys Ser Ile Gln Phe Glu Asn Pro Thr Glu Val Pro
130 135 140
Asp Gly Glu Pro Asn Leu Asn Pro Gly Lys Pro Val Ser Ala Thr Tyr
145 150 155 160
Gln Ile Lys Glu Thr Lys Glu Gln Gly Gln Ile Asp Phe Asp Tyr Val
165 170 175
Val Asp Ala Ser Gly Arg Ile Gly Ile Leu Ser Thr Lys Tyr Met Lys
180 185 190
Asn Arg Arg Tyr Asn Gln Gly Leu Lys Asn Ile Ala Asn Trp Gly Tyr
195 200 205
Trp Glu Gly Cys Asn Lys Tyr Ala Pro Gly Thr Pro Arg Glu Asn Ser
210 215 220
Pro Phe Phe Glu Ala Leu Gln Asp Glu Ser Gly Trp Ala Trp Phe Ile
225 230 235 240
Pro Leu His Asn Gly Thr Val Ser Val Gly Val Val Met Asn Gln Lys
245 250 255
Leu Ala Thr Gln Lys Lys Gln Glu Ala Asp Leu Asp Ser Thr Glu Phe
260 265 270
Tyr His Asp Thr Leu Asn Lys Ile Ser Pro Asn Leu Arg Glu Leu Ile
275 280 285
Gly Asp Gly Lys Phe Val Ser Asn Val Lys Thr Ala Ser Asp Tyr Ser
290 295 300
Tyr Ser Ala Ser Ser Tyr Ser Phe Pro Tyr Ala Arg Ile Val Gly Asp
305 310 315 320
Ala Gly Cys Phe Ile Asp Pro Tyr Phe Ser Ser Gly Val His Leu Ala
325 330 335
Leu Thr Ser Gly Leu Ser Ala Ala Thr Thr Ile Ser Ala Ser Ile Arg
340 345 350
Gly Gln Val Asp Glu Glu Leu Gly Ser Glu Trp His Thr Lys Lys Phe
355 360 365
Ser Asp Ala Tyr Thr Arg Phe Leu Leu Val Val Leu Ser Ala Tyr Lys
370 375 380
Gln Ile Arg His Gln Glu Glu Pro Val Leu Ser Asp Phe Asp Glu Asp
385 390 395 400
Asn Phe Asp Arg Ala Phe Ser Phe Phe Arg Pro Ile Ile Gln Gly Thr
405 410 415
Ala Asp Ala Ala Asn Asn Lys Leu Ser Gln Glu Glu Leu Asn Lys Thr
420 425 430
Leu Glu Phe Cys Ala Phe Ala Phe Glu Pro Val Glu Asn Asp Glu Asp
435 440 445
Arg Ser Lys Ala Met Ser Ala Met Gln Glu Ala Val Asp Asn Gly Thr
450 455 460
Gly Tyr His Pro Asp Leu Ser Pro Glu Gln Leu Lys Ala Val Lys His
465 470 475 480
Ile Gln Ala Arg Arg Ala Met Arg Thr Ser Asp Thr Met Asn Ile Glu
485 490 495
Ser Phe Gly Thr Asp Ala Ile Asn Gly Phe Val Pro Asn Leu Val Arg
500 505 510
Gly Ser Leu Gly Leu Arg Lys Gln Glu Ala Met Ser Gly Asp Met Gly
515 520 525
Gly Ala Asn Gly His Val Asp Glu Thr Asn Gly Val Thr Val Asn Gly
530 535 540
His His Gln Pro Glu Gly Val Lys Ala His
545 550
<210> 15
<211> 1064
<212> PRT
<213> 菌核生枝顶孢
<400> 15
Met Thr Glu Leu Ile Pro Gly Pro Lys Gly Leu Pro Leu Ile Gly Asn
1 5 10 15
Val Leu Asp Ile Asp Pro Val Asp Ala Val Val Cys Leu Gly Arg Ile
20 25 30
Ala Asp Thr Tyr Gly His Ile Tyr Gln Leu Lys Val Gly Gly Ser Ala
35 40 45
Lys Ile Phe Ile Ser Ser Arg Glu Leu Val Asp Glu Leu Ser Asp Glu
50 55 60
Ser Arg Phe Thr Lys Leu Val Ser Gly Pro Leu Ala Gln Leu Arg Asn
65 70 75 80
Val Cys His Asp Ser Leu Phe Thr Ala Gln Ser Asp Glu Pro Ala Trp
85 90 95
Asp Leu Ala His Lys Ile Leu Met Pro Ala Phe Gly Pro Leu Ala Ile
100 105 110
Arg Gly Met Phe Asp Glu Met His Asp Ile Ala Ser Gln Leu Val Val
115 120 125
Lys Trp Ala Arg Phe Gly Pro Gln Asp Thr Ile Asp Val Ser Gly Asp
130 135 140
Phe Thr Arg Leu Thr Leu Asp Ala Ile Ala Leu Cys Ser Met Ser Thr
145 150 155 160
Arg Phe Asn Ser Phe Tyr Lys Gln Asp Gln His Pro Phe Val Ser Ser
165 170 175
Met Leu Glu Val Leu Ala Glu Ser Gly Lys Arg Ala Val Arg Pro Pro
180 185 190
Phe Val Asn Asp Tyr Ile Phe Arg Gly Ser Leu Lys His Tyr Asn Thr
195 200 205
Glu Ile Ala Thr Met Arg Arg Ile Ala Met Asp Val Leu Ala Glu Arg
210 215 220
Arg Ala Asn Pro Met Ala Cys Gln Lys Asn Asp Leu Leu Asn Ala Met
225 230 235 240
Ile Asn Gly Arg Asp Pro Lys Thr Gly Glu Gly Leu Ser Asp Glu Ser
245 250 255
Thr Ile Asn Asn Leu Ile Val Phe Leu Ile Ala Gly His Glu Thr Thr
260 265 270
Ser Gly Leu Leu Ser Phe Leu Phe Tyr Tyr Leu Leu Thr Arg Pro Asp
275 280 285
Val Phe Glu Lys Ala Gln Lys Glu Val Asp Glu Leu Val Gly Arg Gly
290 295 300
Pro Val Thr Ile Glu His Met Ser Lys Leu His Tyr Ile Glu Ala Cys
305 310 315 320
Leu Arg Glu Thr Leu Arg Leu His Pro Thr Ala Pro Val Ile Thr Phe
325 330 335
Lys Thr Lys Pro Gly Phe Glu Lys Glu Ser Thr Thr Ile Gly Gly Gly
340 345 350
Lys Tyr Lys Ile Asp Arg Asp Gln Gly Ile Val Ala Leu Leu Val Asn
355 360 365
Ile Gln Arg Asp Pro Lys Val Trp Gly Asp Asp Ala Asn Glu Phe Lys
370 375 380
Pro Glu Arg Met Thr Asp Glu Lys Phe Asn Asn Leu Pro Ala Asn Cys
385 390 395 400
Trp Lys Pro Phe Gly Asn Gly Ile Arg Gly Cys Ile Gly Arg Ala Phe
405 410 415
Ala Trp Gln Glu Ser Leu Leu Ile Thr Ala Met Leu Leu Gln Asn Phe
420 425 430
Asn Phe Gln Leu Ala Asp Pro Asp Tyr Lys Leu Gln Ile Lys Gln Thr
435 440 445
Leu Thr Ile Lys Pro Gly Asn Phe Phe Met His Ala Lys Leu Arg Asp
450 455 460
His Val Asp Pro Leu Glu Leu Glu Gly Ile Leu His Gly Gly Ala Lys
465 470 475 480
Lys Gly Ser Lys Ile Asp Gly Pro Ser Ser Gly Ala Ser Leu Ala Thr
485 490 495
Thr Glu Gln Glu Leu Gln Pro Met Thr Ile Leu Tyr Gly Ser Asp Ser
500 505 510
Gly Thr Cys Glu Ser Met Ala Gln Ser Leu Ala Arg Ala Ala Arg Gly
515 520 525
Arg Gly Tyr Gly Ala Thr Val Lys Thr Leu Asp Ser Ala Val Glu Gln
530 535 540
Val Pro Lys Asp Gln Pro Val Val Ile Val Ser Pro Ser Tyr Asn Gly
545 550 555 560
Gln Pro Pro Ser Asn Ala Thr Asp Phe Val Lys Trp Leu Glu Ala Leu
565 570 575
Asp Ser Lys Ala Leu Lys Asp Val Lys Tyr Ser Val Tyr Gly Cys Gly
580 585 590
Asn Lys Asp Tyr Thr Ser Thr Phe His Arg Ile Pro Lys Leu Leu Asp
595 600 605
Ala Glu Phe Glu Arg Cys Gly Ala Lys Arg Ile Ala Glu Thr Gly Leu
610 615 620
Gly Asp Val Thr Val Gly Asp Ile Phe Ser Asp Phe Glu Arg Trp Gln
625 630 635 640
Asp Asp Gln Leu Trp Pro Ala Leu Gly Val Ala His Met Asp Gly Asp
645 650 655
Ala Asp Ala Glu Phe Asp Ile His Val Asp Arg Ser Gly Arg Ala Ala
660 665 670
Glu Leu Glu Val Asp Ala Asp Glu Ala Thr Val Gln Ser Asn Gln Val
675 680 685
Leu Thr Ala Pro Gly Glu Pro Glu Lys Arg Tyr Ile Thr Leu Lys Leu
690 695 700
Pro Glu Gly Met Gln Tyr Lys Ser Gly Asp His Leu Ser Val Leu Pro
705 710 715 720
Leu Asn Asp Trp Gly Val Val Arg Arg Val Phe Ala Trp Ala Gln Leu
725 730 735
Pro Trp Asp Ala Val Val Thr Ile Pro Lys Gly Thr Asn Thr Ser Leu
740 745 750
Pro Thr Gly Arg Gln Ile Ser Ala Lys Asp Leu Leu Ser Gly Tyr Val
755 760 765
Glu Leu Ser Gln Pro Ala Thr Arg Lys Asn Ile Ala Lys Leu Ala Ala
770 775 780
Ser Ser Pro Cys Pro Phe Thr Gln Lys Ser Leu Ser Lys Leu Glu Glu
785 790 795 800
His Phe Asp Ser Asp Ile Ala Gln Arg Arg Leu Ser Val Leu Asp Ile
805 810 815
Leu Glu Glu Phe Pro Ala Ile Asp Ile Thr Phe Gly Asn Phe Ile Ser
820 825 830
Met Leu Pro Pro Met Arg Pro Arg Gln Tyr Ser Ile Ala Ser Ser Pro
835 840 845
Met Ala Asp Pro Ser Thr Ala Thr Leu Met Trp Thr Val Leu Asn Ser
850 855 860
Glu Ala Tyr Ser Gly Ser Gly Arg Arg Phe Leu Gly Val Cys Ser Thr
865 870 875 880
Tyr Leu Ala Gly Leu Ala Glu Gly Asp Arg Val His Val Thr Val Lys
885 890 895
Pro Ala Leu Arg Leu Phe His Pro Pro Ser Asp Pro Glu Ser Met Pro
900 905 910
Ile Ile Met Ala Cys Ala Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe
915 920 925
Leu Glu Glu Arg Val Cys Gln Met Lys Ala Gly Arg Ala Leu Ala Pro
930 935 940
Ala Tyr Leu Phe Val Gly Cys Arg Asp Pro Glu Lys Asp Ala Leu Leu
945 950 955 960
Lys Asp Glu Leu Ala Gln Trp Glu Arg Asp Gly Val Val Lys Ile Tyr
965 970 975
Tyr Ala Phe Ser Arg Ala Ser Asp Gln Ser Asp Gly Cys Lys His Val
980 985 990
Gln Asp Arg Ile Trp Asn Glu Arg Asp Leu Val Arg Lys Gly Leu Phe
995 1000 1005
Glu Gly Asn Ala Arg Phe Phe Met Cys Gly Gly Ser Gly Ala Gly
1010 1015 1020
Lys Ser Val Glu Asp Val Val Lys Arg Ile Tyr Lys Asp Asn Lys
1025 1030 1035
Gly Glu Ser Gln Glu Lys Ala Ala Glu Ser Trp Phe Gln Asp Leu
1040 1045 1050
Lys Ala Asn Arg Tyr Val Thr Glu Ile Phe Ala
1055 1060
<210> 16
<211> 273
<212> PRT
<213> 菌核生枝顶孢
<400> 16
Met Ala Phe Gly Val Glu Pro Pro Glu His Val Thr Pro Trp Phe Lys
1 5 10 15
Pro Val Tyr Glu Ala Thr Phe Gln Phe Gly Gly Val Ala Trp Thr Leu
20 25 30
Cys Tyr Ile Leu Ile Ala Arg Glu Gly Met Arg Thr Lys Ser Tyr Gly
35 40 45
Met Pro Leu Phe Ala Leu Ala Asn Asn Phe Ala Trp Glu Met Val Tyr
50 55 60
Ala Leu Trp Val Val Asp Asn Ala Phe Glu Lys Thr Ala Met Thr Ile
65 70 75 80
Trp Met Leu Ile Asp Thr Pro Ile Ile Tyr Ser Ile Leu Lys His Gly
85 90 95
Val Leu Glu Trp Gln His Ala Pro Met Val Ser Arg Asn Leu Lys Ser
100 105 110
Ile Leu Val Gly Leu Ile Ala Leu Cys Ala Ala Ala His Trp Ser Trp
115 120 125
Gln Ser Trp Trp Ile Gly Asn Glu Met Gly Lys Arg Asp Asp Leu Glu
130 135 140
Gly Ala Asp Leu Thr Gln Met Ala Tyr Trp Ala Val Ser Met Cys Gln
145 150 155 160
Phe Leu Val Ser Thr Met Ser Leu Ala Met Leu Cys Val Arg Gly His
165 170 175
Ser Gly Gly Val Ser Trp Met Ile Trp Leu Ser Arg Phe Leu Gly Thr
180 185 190
Leu Ile Gly Leu Asn Met Asn Tyr Ala Trp Ala Tyr Tyr Thr Trp Pro
195 200 205
Glu Ala His Glu Tyr Phe Met Ser Ala Pro Ala Val Phe Val Trp Gly
210 215 220
Val Thr Thr Val Cys Asp Ile Ile Tyr Gly Phe Val Leu Tyr His Val
225 230 235 240
Lys Ser Asn Glu Arg Glu Leu Ser Asp Gly Arg Lys Val Ala Ala Glu
245 250 255
Ala Asp Asp Glu Gln Val Gly Gly Trp Ser Lys Met Lys Thr Gly Lys
260 265 270
Asn
<210> 17
<211> 534
<212> PRT
<213> 菌核生枝顶孢
<400> 17
Met Gly Ser Leu Leu Phe Asp Ser Pro Val Gly Arg Phe Val Ala Ser
1 5 10 15
Phe Pro Ala Leu Ser Ala Ala Ala Gly Leu Ile Val Ala Ile Ser Phe
20 25 30
Ile Tyr Ile Arg Phe Ile Lys Thr Pro Lys Leu Asp Leu Pro Val Val
35 40 45
Gly Asn Pro Gly Asp Lys Trp Asp Ala Gln Lys His Ile Val Ala Gly
50 55 60
Ala Arg Lys Tyr Pro Asp Thr Pro Tyr Ile Leu Pro Met Asp Pro Pro
65 70 75 80
Ile Val Val Leu Pro Ile Lys Ile Gln Asp Glu Val Arg Asn Leu Pro
85 90 95
Glu Asn Val Val Ser Phe Thr Lys Glu His Gln Arg Asn Phe Phe Ala
100 105 110
Gln Tyr Thr Gly Ile Gly Asp His Arg Pro Glu Met Ile Thr Ala Ile
115 120 125
Arg Gln Asp Leu Thr Arg His Ile Val Ser Thr Ile Pro Gly Leu Gln
130 135 140
Glu Glu Val Arg Tyr Gly Phe Asp Lys Glu Phe Gly Asp Cys Lys Asp
145 150 155 160
Trp Thr Pro Phe Pro Leu Tyr Met Lys Val Leu Arg Ile Val Ala Leu
165 170 175
Thr Ser Gly Arg Val Phe Val Gly Arg Pro Leu Ser Arg Glu Glu Glu
180 185 190
Trp Leu Gln Arg Thr Ile Ser Tyr Thr Met Asp Cys Val Lys Ala Arg
195 200 205
Asn Ala Ile Arg Glu Tyr Pro Trp Trp Lys Arg Arg Trp Val Thr Ser
210 215 220
Ser Leu Pro Glu Ile Ala Lys Leu Thr Glu His Arg Thr Arg Gly Gly
225 230 235 240
Val Leu Leu Lys Pro Ile Met Asp Ala Gln Leu Ala Lys Asp Ser Lys
245 250 255
Arg Glu Lys Ile Ile Asn Glu Glu Thr Gly Asp Glu Glu Gly Asn Phe
260 265 270
Ile Glu Trp Leu Leu Lys His Thr Pro Gly Asp Leu Lys Met Asp Pro
275 280 285
Glu Asn Leu Ala Leu Asn Gln Met Val Leu Ala Phe Ala Ser Val His
290 295 300
Thr Ser Ser Met Ser Val Thr His Ala Ile Leu Glu Leu Val Thr Arg
305 310 315 320
Pro Glu Tyr Phe Ala Pro Leu Arg Glu Glu Leu Glu Glu Val Arg Arg
325 330 335
Ala Asp Gly His Thr Val Asp Asp Asp Gly Tyr Ile Arg Leu Lys Lys
340 345 350
Glu Ser Ile Asn Lys Leu Arg Lys Leu Asp Ser Phe Met Lys Glu Ser
355 360 365
Gln Arg Phe Asn Pro Pro Ile Ser Thr Ser Gly Thr Arg Ile Cys Thr
370 375 380
Ala Asp Leu Lys Leu Ser Thr Gly His Thr Leu Pro Lys Gly Thr Arg
385 390 395 400
Ile Cys Phe Pro Ser Tyr Asp Val His His Asn Pro Lys Thr Thr Thr
405 410 415
Tyr Ser Pro Glu Tyr Asn Pro Pro Gly Tyr Thr Pro Pro Asp Gln Phe
420 425 430
Asp Gly Leu Arg Phe Phe Lys Leu Arg Glu Met Pro Gly Lys Glu Ser
435 440 445
Arg His Gln Phe Ala Thr Ala Asn His Glu Ser Leu Val Phe Gly Phe
450 455 460
Gly Asn His Thr Cys Pro Gly Arg Phe Phe Ala Ala Asn Gln Ile Lys
465 470 475 480
Ile Ile Leu Ala Glu Leu Leu Met Asn Trp Asp Val Arg Leu Lys Gly
485 490 495
Asp Val Glu Gln Lys Gly Gly Pro Glu Lys Arg Pro Gln Asn Met Val
500 505 510
Val Asp Leu Val Ile Thr Pro Asn Pro Met Ala Met Val Glu Met Lys
515 520 525
Arg Arg Ser Arg Ala Val
530
<210> 18
<211> 512
<212> PRT
<213> 菌核生枝顶孢
<400> 18
Met Gly Leu Ser Leu Gly Tyr Ser Pro Asp Arg Gly Ser Ile Gly Ser
1 5 10 15
Trp Ile Cys Ala Ala Pro Leu Ile Leu Ala Leu Phe Val Ile Ser Tyr
20 25 30
Arg Leu Phe Gln Ser Val Ile Asp Tyr Arg Leu Ser His Arg Asn Gly
35 40 45
Cys Lys Pro Pro Pro Thr Tyr Pro His Lys Asp Trp Tyr Leu Gly Leu
50 55 60
His His Val Phe Gly Leu Leu Lys Ala Lys Lys Glu Asn Arg Leu Pro
65 70 75 80
Thr Ala Phe Ser Glu Leu Phe Asp Ala Ser Gly Pro Asp Val His Thr
85 90 95
Leu Gly His Tyr Val Leu Gly Lys Lys Ser Tyr Trp Thr Arg Asp Pro
100 105 110
Glu Asn Ile Lys Ala Val Leu Ser Ser Lys Phe Asn Asp Trp Gly Leu
115 120 125
Pro Ser Ala Arg Lys Ala Thr Phe Arg Thr Cys Leu Gly Gly Gly Ile
130 135 140
Phe Gly Val Asp Gly Lys Glu Trp Glu His Ser Arg Ala Met Leu Lys
145 150 155 160
Pro Ser Phe Thr Arg Thr Gln Ile Gly Asp Thr Ala Thr Leu Ser Lys
165 170 175
His Ala Asp Asn Leu Ile Ala Arg Ile Pro Glu Gly Glu Thr Val Asp
180 185 190
Leu Ala Glu Leu Phe Pro Leu Leu Thr Met Asp Val Gly Thr Glu Met
195 200 205
Leu Phe Gly Glu Ser Val Gly Ser Leu Asp Pro Ala Glu Ile Lys Gln
210 215 220
Ala Thr Arg Phe Thr Thr Ser Phe Asp Tyr Ile Val Gln Thr Met Ser
225 230 235 240
Lys His Met Ala Leu Pro Ile Leu Thr Lys Leu Arg Asp Lys Thr Leu
245 250 255
Gln Gly Cys Val Glu Phe Val Asp Asp Phe Ala Ala Asp Val Val Asn
260 265 270
Arg Thr Ile Ala Asn Glu Ser Lys Thr Glu Lys Pro Ser Ser Leu Gly
275 280 285
Lys Tyr Ile Phe Pro Thr Glu Leu Ala Lys Met Gly Leu Pro Glu Lys
290 295 300
Gln Ile Arg Ile Glu Val Ile Asn Ile Met Val Ala Gly Arg Asp Thr
305 310 315 320
Thr Ala Ala Leu Leu Ser Leu Ile Trp Trp Tyr Leu Ala Lys Arg Pro
325 330 335
Asp Ala Val Met Lys Leu His Gln Glu Leu Glu Pro Leu Gly Gly Arg
340 345 350
Pro Pro Thr Gly Glu Glu Val Lys Lys Met Lys Tyr Leu Arg Asn Phe
355 360 365
Val Asn Glu Ile Leu Arg Leu His Pro Ile Asn Pro Leu Asn Ser Arg
370 375 380
Thr Ala Ala Lys Asp Thr Thr Leu Pro Arg Gly Gly Gly Pro Asp Gly
385 390 395 400
Lys Ser Pro Val Phe Ile Arg Lys Gly Thr Gln Leu Met Phe Ser Ser
405 410 415
Ala Ala Leu Gln Arg Arg Lys Asp Leu Tyr Gly Glu Asp Ala Leu Asp
420 425 430
Leu Arg Pro Glu Arg Trp Glu Arg Ile Arg Pro Ser Ala Phe Glu Tyr
435 440 445
Ile Pro Phe Gly Gly Gly Pro Arg Ile Cys Pro Gly Gln Gln Leu Ala
450 455 460
Leu Thr Glu Ala Ser Tyr Phe Thr Ala Arg Leu Leu Gln Glu Phe Gln
465 470 475 480
Gly Val Thr Ser Glu Ser Ser Gly Pro Phe Gln Glu Ala Phe Ala Ile
485 490 495
Leu Val Thr Ser Gly Asp Gly Val Lys Val Lys Phe His Lys Lys His
500 505 510
<210> 19
<211> 384
<212> PRT
<213> 菌核生枝顶孢
<400> 19
Met Pro Gln Leu Ala Gly Lys Leu Ile Leu Ala Gly Leu Ile Pro Leu
1 5 10 15
Gly Ala Trp Val Leu His Gly Phe Ala Ser Cys Asn Gly Leu Ile Gln
20 25 30
Met Phe Glu Asp Phe Gly Lys Gln Thr Val Leu Ser Asp Gly Val Thr
35 40 45
Asp Tyr Thr Gly Ala Phe Thr Gly Leu Glu Gly Leu Asp Arg Leu Leu
50 55 60
Arg Thr Leu Leu Asn Phe Phe Trp Pro Val Ala Asn Gly His Asp Trp
65 70 75 80
Ala Leu Ser Leu His Ala Phe Met Phe Ala Gly Gln Gly Val Pro Leu
85 90 95
Leu Val Leu Asn Met Leu Glu Gly Ala Arg Pro Gly Asn Lys Ser Leu
100 105 110
Val Val Ser Tyr Val Thr Val Phe Gly Ile Leu Tyr Met Val Val Gly
115 120 125
Leu Ala Ile Met Ala Pro Leu Tyr Leu Phe Leu His Leu Leu Thr Ser
130 135 140
Arg Thr Ala Thr Ala Pro Ser Lys Ala Lys Val Ala Val Asp Pro Asn
145 150 155 160
Thr Ala Lys Ala Val Gly Phe Gly Val Phe Val Gly Tyr Val Leu Pro
165 170 175
Thr Ile Phe Met Ser Leu Pro His Pro Ser Leu Leu Ser Thr Asp Thr
180 185 190
Lys Val Leu Ser Val Val Phe Trp Gln Ala Val Pro Leu Trp Ala Ser
195 200 205
Val Cys Ala Tyr Phe Ala Ser Thr Ala Leu Gly Gln Ser Ala Thr Ser
210 215 220
Arg Ser Ser Ser Asn Leu Pro Ser Ala Leu Gly Ala Val Tyr Ala Ala
225 230 235 240
Ser Leu Ile Ile Ala Thr Ala Thr His Val Ala Thr Phe Ala Ile Ser
245 250 255
Ala Asn Leu Ser Asp Thr Trp Ser Gly Ile Phe Thr Phe Leu Ile Pro
260 265 270
Pro Asn Pro Phe Asn Thr Asp Met Arg Ile Ser Ser Phe Leu Glu Gly
275 280 285
Ala Thr Trp Phe Leu Gln Trp Asp Tyr Thr Met Met Ser Leu Ala Tyr
290 295 300
Met Val Trp Ala Ile Gly Ile Arg His Gly Val Glu Val Pro Arg Ser
305 310 315 320
Ser His His Phe Glu Thr Leu Gly Lys Ile Ala Leu Arg Ser Met Ala
325 330 335
Lys Leu Leu Val Met Gly Pro Ile Gly Ala Ala Leu Ser Leu Val Trp
340 345 350
Glu Arg Asp Gln Leu Leu Trp Gln Leu Asp Ser Glu Ser Gly Glu Lys
355 360 365
Gly Glu Lys Asn Arg Ser Arg Arg Met Ser Arg Lys Trp Met Phe Ser
370 375 380
<210> 20
<211> 296
<212> PRT
<213> 菌核生枝顶孢
<400> 20
Met Thr Asp Ile His Ile Gln Asp Gly Asp Leu Ser Ser Leu Lys Asp
1 5 10 15
Lys Val Val Val Ile Thr Gly Gly Ser Ser Gly Ile Gly Leu Ala Thr
20 25 30
Thr Asn Leu Leu Leu Asp Leu Gly Ala Lys Val Val Ile Gly Asp Leu
35 40 45
Gln Pro Pro Thr Thr Arg Val Asp Ser Glu Arg Cys Ser Phe His Lys
50 55 60
Val Asp Val Thr Val Trp Ser Asp Gln Leu Thr Leu Phe Lys Glu Ala
65 70 75 80
Arg Glu Leu His Gly Arg Ile Asp His Val Phe Ala Asn Ala Gly Val
85 90 95
Gly Pro Lys Ala Asp Tyr Leu Ser Thr Ala Leu Asp Gln Asn Gly Asp
100 105 110
Leu Val Glu Pro Thr Phe Leu Thr Leu Asp Val Asn Leu Lys Ala Val
115 120 125
Ile Tyr Thr Ala Thr Ile Ala Cys Tyr Tyr Met Arg Glu Glu Gln Gln
130 135 140
Ser Pro Ala Gly Gly Ser Ile Val Ile Val Ser Ser Val Ala Gly Val
145 150 155 160
Ser Arg Phe Arg Ala Val Asp Tyr Ala Thr Ala Lys His Gly Asn Leu
165 170 175
Gly Phe Ala Arg Gly Leu His Gln Arg Leu Thr Ala Glu Asn Ser Pro
180 185 190
Thr Arg Val Asn Leu Ile Ala Pro Ser Trp Thr Asn Thr Gly Phe Met
195 200 205
Pro Pro Gln Ile Met Ala Ala Val Gly Val Glu Pro Gln Glu Pro Ala
210 215 220
Ser Val Gly Arg Ala Ala Ala Tyr Leu Met Ala Asp Asp Ser Arg Lys
225 230 235 240
Gly Gln Met Ile His Ile Ala Lys Gly Arg Tyr Arg Glu Val Glu Glu
245 250 255
Ser Ile Met Leu Pro Ala Ala Glu Lys Val Val Asp Val Glu Asn Gly
260 265 270
Gly Val Met Glu Asp Asp Thr Leu Ala Lys Ile Ile Glu Thr Met Gly
275 280 285
Ile Phe Lys Ala Lys Ala Thr Gln
290 295
<210> 21
<211> 1011
<212> DNA
<213> 人工序列
<220>
<223> 修饰基因
<400> 21
atggccgcta agagcaggtc gccaaaacgc ggtaccagcg agaagactcc tctggtcgag 60
aaagaagctc cctaccagcc tcccaccaag ggaatccttt caaaattgcc agcaagttgg 120
gtgccgtatg cgcagctcat caggctggag caaccacatg gcaactacat gatttatttc 180
ccgcacatca ttggtctgat gtacgcatcc gcgattcgtc ctaccgaact ttctgttttg 240
ggccatcggg cagcgatctt cgcaatttgg acttttctta tgcggggagc cgggtgcgct 300
tggaacgaca atgtcgatca ggacttcgat cgaaagactg agcgctgtcg tcatcggccc 360
atcgcaagag gagcgattag caccactcag gggcacgtgt tcacacttat cttgacgctc 420
ctgggctttg ccgctatcca atccctgcca attgaatgca catacgtcgg cgtgggtaca 480
acggtgcttt ctgccattta tccgttcgga aagcgtttca cgcattttgc acaagttatc 540
ttggggtcca ccctcgcgtc tactattgcc ttgtcagctt acagtgtcgg tctccctgcc 600
ctgtcaaaag attatttcgt gcccacactc tgtctgagtg ctacgatcat gcttttggtc 660
gtgttttacg acgttgtcta tgcccgcgct gataccactg atgacctcaa gtcgggcgtg 720
aagggtatgg ctgttcgatt cagaaatcac cttgagggct tgttcgcctt tatcaccttg 780
agcattgctg gctcgctcac aacgctgggt taccttgttg gaatggggca ttggttctat 840
ctctttagcg tcggcggtct gacatttggt cttgtttcga tggtcgcatt gacgcactgg 900
aacatcctcc ctggatactc ctctgggcgc tgctatgcat tcgcgatcct taatctcctg 960
accggattta ttatggaata cgcgactaag gactatgtgg ttggcgtctg a 1011
<210> 22
<211> 3282
<212> DNA
<213> 人工序列
<220>
<223> 修饰基因
<400> 22
atgaccgtca acggtcatca cactaacggg gtgaatggcg caaacggtac caatggacat 60
gcgaacggga gcaatggcat caacgacact aaggccgtca aagagattgt gccatttgtt 120
aagccgcaag tgaatttcgc ttcggcacaa cggctggaag gctgcatcca tagtttgcca 180
gagctcgtgg actttaactc ccttaacaat cagcatcaca ccttctgtgt tcaagcaaag 240
tcctctgagc cgtttgatac catcactcac ggcgagttca aggtggccgt ttccaaatgc 300
gccgcttggc tcaaggagaa tctgcccatt cgaccaagct cggatgacaa ggccctcact 360
aaaatggcgc cagttgccct gtttatggaa tctgacatcg gccttgtcat tcacgagttc 420
gctttgatga gcatcggtgt gcctcccctg gttctttccc ctagattgtc tcccgttgct 480
atcaacgcac tcctggaagc tactggcgca gcgagcttca ttgtctcgcc taggatgtca 540
gagcccctca aaggtgcact ggccgctctt gcagcgaagg gtgtctccac acatatcgga 600
aatccataca aagcttacta tcagccaggt gcagacccga agtctgtcgc gccgttcgaa 660
gtgccgcaaa accctgagga tgtgatcctt ttgctccact caagtggtac cactggactg 720
ccaaaaccga ttcctacaac gcatcggcag ctgctttttg ctgttaattg tcacaagttc 780
gatacagagg aacaggcaca aagtttgaac ctctccacgc tgcctctttt tcatggattc 840
gggcttgtcg cccccgggtt gagtatgtcc gctggcaaac ctaccttgta tcccgcatct 900
gacggcatcc ccaacgcgaa gagcatcgtc gatctcatta ataagaccaa cgccaaatct 960
atgatgactg tgccattttt gctcgatgac atcaccaatc ttccgaacga ggaagggatt 1020
aaggctttgg ttcacatgga cttcgttgga actggcggtg ccgctcttgg tgcaggtatc 1080
ggagatcgtt tggctaaggg aggggtgaaa ctgcttaatt tctacggtac cactgagacc 1140
ggaccattga gcctcacctt tgccccgact gacaactacg attggaaata tttccgcctt 1200
cgtacagatt gcgaatataa gattgacgag ttggaaccta gagatggcga gcgccgtttt 1260
aggctcacgg tctaccccta tgggtcggag ggcttcgaaa tctcagacca gctcattcgc 1320
aatgaacaat accccgagac agatttcgca gcggtgggtc gtgatgacga tgtcatcgtg 1380
ttggctacgg gagagaaggc aaacccactg attcttgaaa caaaactcac ggaggccccg 1440
atggtgaagg ccgctatcgc ttttggtgaa aatcagttca acctcggagt tattgtcgag 1500
cccgcagaac cactgacccc ggacactgaa tcggcgtttc gggagtcaat ctggccaatc 1560
attaccgcag cgtgtgacca aatggatgcc ttctctcgaa ttcccagccc agatgccgtc 1620
gtgctggttc ctgctggtgt tgtcatcccc cgcaccgaca agggatccat tgcacgtaaa 1680
gaaacttacg cgcttttcga taagcagatc aaaggcgtct atgagcaatt gctcaaagcc 1740
gctgcagacg ctgtggaacc tttggacctc gataatttgg agcagaactt gaagtccctc 1800
atccaggaac atctccacat tcaagctcct gcatctgatt ggggcgtcga ggactcactc 1860
ttcgacatcg gcgtggactc gctgcaggtt ctgcaacttc ggcgaattct ggtcacagcg 1920
gcctcaaaga cggaggcctt taaagacacc gattgcgaaa agatgatccc accggagttc 1980
gtctacatga atccttctat ccgcgagatt gctgcagcgc tgaccaaagg aagtgacggc 2040
ggtgatgtct cccttgaaga cgccgctaag gaagtcgttg aactcgctga gacttatagt 2100
ctgaagggag tgtccgcgca ggaaaaagcc ccctcctcta gcgagggcgc attcgttatg 2160
ctcacaggtg cgacgggatc cctggggtct catgtcgcag cggatctggc cagaagggac 2220
aacgttgcta aggtcgtgtg tcttgtcaga aaggataaag gcacaaatca gcctcccatg 2280
cctggcggca acccgtttga caagaaaatc cttaaggccc gtggtattca gttgacggat 2340
gaacaattcg gaaaactggc aacacttgag gtcgatccaa cggcggacaa gttggggctc 2400
atcccgatgg catacggcat gatgcaggcg aaggtcaccc atgtgatcca cgccgcttgg 2460
ccaatgaatt acttgattcg gctccgaaac tttcagtatc aatttaagtt cctgcgcaac 2520
ctgcttgagt tcgcttctca gggacctgca cctacaaaga aacggtttgt tttcatctcg 2580
tcaattgcga ccgttgcacg aattggactt gcacaacctg gatctattag cgaagctcct 2640
gtgtcgccct cagacagtgc ctgcgggatc ggctacgctg atggcaagct ggtttgtgaa 2700
aagattatgg agaaagcagc gcaggactat ggcggtcaac ttgatgttac aagcgtccgt 2760
tgcggccaga tgaccggttc gaagaaaact ggagtctgga actcaaatga gcaaatccct 2820
atgttgctca agtctgccca gggtctggga agccttcctc aattgtcggg agaactgtca 2880
tggatccccg tggacgatgc cgctagcact gtttcggaga ttgctttctc agacggcagt 2940
atgcctatcg ttcagcactt ggaaaatccc attagacaga gttgggatgc catgctccaa 3000
tcctttggaa gggaactggg gcttccagct ggcaaggtgc cgttcgggga gtggttggac 3060
caagttgcag cggccgatgg cgacgatgag acattccccg tcaagaaact cacgttcttt 3120
ttcaagtcct tcttccagtc cgtggcttgt ggtcaagttg tcctggatac aacggtttct 3180
cgcggacaga gcaagacact taacgctatg acggcagtcg gtgacgagac cgtgaaggct 3240
tacgcagatt attggaaatc tactggctac ctcagcaagt ga 3282
<210> 23
<211> 6348
<212> DNA
<213> 人工序列
<220>
<223> 修饰基因
<400> 23
atgacactta ttcagacgaa acattcggcc tcagccgctg tgttctcgcc tcaatcaaca 60
gctccaaagc cgacgcattt ggctcacatc agagcaaggc tcctggaaga tgaccttttg 120
aagcccgtta aagaggccgt cgtgagcttg ccaaaaacat ggagagctct cgtctcgaag 180
cagcccgagc tgggcaagaa caggaaagca tctgacctta ttgaggcgtt cccaagctgg 240
atcgaagatg gcaagaccga ggtccttgaa actgacatgt ccggactgat cacccttccc 300
ctcctggccg tgatccatat tgttcagtac ctggactata tccaacgcct tggaattagt 360
cactccgagt tcctcgaaag tgtggagtcc ggcggtgttc agggctactg catcggtctt 420
ttgagcgcta ttgttgtctc ctctgcggaa gatgaggaag ccctgatcca acatgcagcg 480
cacggcatcc ggctttcgtt ggccattggg gcttttggcg acatcggtag ctcgtcagac 540
gaggtggtta gcaataccct tcaggttcgc ttgcgtaacg ccgggtcgga ggaagatctc 600
gtcgctcgat tcccgggctc ttatatcagc acgattaccg acgcaaaaac catgtccatc 660
attgcgcctc cccatctcat tgatgctctg aaggaacacg cagagactga aggtctccgg 720
ccccgagcaa tgcatatcag atcaaacctg cacaatagta ggaacaccga acttgcccag 780
caatgcagtt ccttgttcga ggattgtccg tttgcatcac ctgacactct gcaggtcgcg 840
gtgcggagta ataagactgg ctgctacctc gagcaagacg ccacatctct ggtggaggaa 900
gccgtctcca cggtgcttgc ttctcgatgt gattggagct tggttatgca gggtcttgct 960
gatgacttga accaatctgg aagcaagcat cactccatcc tcctgtttgg gatgggcgac 1020
tctgttcccg gtgcaccatt ccgggaacat agccttgaca tctcgaagat tgacgtcctc 1080
tccctcgtcg agacaccctt gtcagcgacg ccaccggcct ctagcatcga tgacttccct 1140
cccgattcga tcgcgattgt tggatcagca tgccgactcc caggtgcaaa ttcattggat 1200
gagctctggg acctgattgc cgctggaaga tccaggctgg aaaaagtccg cacagaccgt 1260
gtgaacatca aggagtcata cagagctagt caggatcccg agtggacgaa gaaaagggaa 1320
ttctacggca acttcatcga tgacgtggat gctttcgacc atgcattctt taacatcagc 1380
ccccgcgagg ctaagtacat ggacccacag caacgtcttt tgctcatggc agcgtttgag 1440
gcaatggatt cgtcaggcta tctccggtcg caccaacgaa atgatggaga cgccgttggg 1500
tgtttcctgg gcgctagcta cactgaatat acagagaaca cgtcggctta ctcgccctca 1560
gcattcactg cgacaagcac gattcgggca tttctctccg gcaagatctc ttatcatttc 1620
ggatggacgg ggccatcgga agtcatcgac accgcctgca gtgcttccat cgttgccgtc 1680
caccgagcag tgcaggcgat caatgctggc gagtgtcctg tggcactggc gggaggggtt 1740
aacatcatta caggtgtcaa caattacttc gatttgggaa aagcttcgtt tctctcacag 1800
acgggtcaat gcaagccatt cgatgacagc gcagatggat actgtcgtgc ggacggtgtg 1860
ggacttgtcg tgttgaaacc gctctcgaag gccgtggctg atggggacta tatccagggc 1920
gttatccctg caattgcgac caatcaaggc ggtatcggcg ccccgggtat tactgttcct 1980
gatgggattg ctcagaaggc actctaccgg ggcatcctgg agaaagccgg acttaagggg 2040
gaggacattt cctatgtcga agctcatggg accggcactc aagtgggcga tcccatcgag 2100
attggttcta tccgcgaagt cttcggaggg gcgcatcgtg ccagtccact tcacttggga 2160
tcccttaaag caaacattgg acactctgaa actgctgctg gcgtggcttc tctgcttaag 2220
gttttgagca tggtccgcaa tcgtggagtt ccaccgctgc aggggttcaa aagacttaac 2280
cataagattc ccgcactcga gctggacaaa atggcgatcc ccaccaagtt gctcccatgg 2340
gattcagacc accgaatcgc ctgcattaat agttacggcg cctctggtag caactcggct 2400
ttgatctgta gtgagtggct cgaggaaccc tccaagctgc cagatgtcac tggtcagccg 2460
cttcaagaat atcctattct gcttagtgca gcgtccaatg agtctttgct ccggtacgcg 2520
cgacatttgg ccgattatat caccaagagt tccgccgacc ttactttggg caacctcagc 2580
tatacactgt cgcagcgccg taaacatcac cggatccgat ggtccaccac tgctaaggac 2640
ctgatcggtc ttattgaaca actcagagag tgcaccccgg ctgattttgt ccaggcacct 2700
caaaagtcta agaaaattgt gcttactttc agcggccagt cgaggacaac gatcggagtc 2760
tcagacagtg ccagattgga aaaccctagg ttcgagcact acattcagca atgcaacaat 2820
atcctcatgt cctacggttg tccggatctg cttccttatc tgtcgcagac ggatcccatc 2880
tcagacccaa ccatcattca atgtggaaca gtgacggttc agtatgcctg cgctcaatgt 2940
tggattgatg gcggtctcga cgtggccgga atcgttgggc attctcttgg tgaactcacc 3000
gcactggcga tctcaggagc tctcagtctg gaggatacac tcaaggttgt ctacacgcgc 3060
gccgaagcta ttaaggccaa atggggtccg gagtccggat ctatgctggc tatccacgca 3120
aaccaggaca cagtcaagtc tattgtggaa atcattgaga ccatgatcac taatcctgat 3180
gaagctctgg agatcgcatg ctataactca atcacgagtc atattgtggt tggcaaagag 3240
tctagcattg aaatggccga gaaggtcatc cagcaagacg ctcggtacca cgggttgcgc 3300
taccagaggc tcaatacctc gcatggcttc cactcacgat ttactgaacc cttgctccaa 3360
gatctcattc atgttgaacg ctctgtcgag tttcgtaaac cgagtatccc tctggagacc 3420
tctactcaga cacccgttga cttcgctaag aaacggcatt ccaagtacct ttctaaccac 3480
gcacgagagc cagttttctt tgtcgatgcc gctcggcgac ttgaaagccg gttgggggag 3540
tgtgtctggt tggaagcagg ctggaatacc ccaatcgtcg cgatgactaa gcgcgcagtg 3600
gctaaccctt ctgctcacac ctttcaagcc gtgacttctc ctgcagcggt tgcaatggaa 3660
ctttggcgcg agggtattgc gaccacttat tggtctttct ttaccccgaa agagagcgga 3720
ctgaagcata tctggcttcc tccctacagc ttcgaccgtc ctaagtattg gctcgagcac 3780
gtggatcggg ccgttcagga acgagatgct gctgcaaatg gatctgcttc gccaccgcct 3840
aagaaagtcc agcaacttgt gaccttgaag aaaacagagg gtacgaagtc ccaattcaga 3900
ctccatacaa cgaccgagcg ctacaaacgt atcgtttctg gacatgctgt caggagcaag 3960
ccactgtgcc cagccagtat gtatatggag tccgctatta tgggtaccga acagctcgga 4020
gcttcactgg ttgggaaaac gatcaccttc gaaaatgtca gttttacaaa gcctcttggg 4080
tgtgatgaaa acctcgaggt ctacgtgaat ctcgagcaga acacggcggc cggagaggaa 4140
gcgtggcatt atgccgtcca atcgggaggg aagggctcac acagtgaggg tgatttcttt 4200
gcaacctcag gcgagatggc ggacatccag ctttacgaaa tgttgatcgc tgataagatt 4260
gaggcactcc gcaacgatgt ggacgccgaa agactgagga ctgccacagc ttactccatc 4320
ttctccagag tcgtggagta ttccgacctg cttaggggga tctcgtcaat taccatgggc 4380
actcgtcagg cactggcgca aatcaaggtg ccaaaatcta ctttcgaagc acaggagagc 4440
acagtttcgg atttttacga cgcgattaca cttgatacgt tcatccaagt tttgggcttg 4500
ctcatcaatt ccgataacga cagttccgca gatgacgaaa tttatgtcgc gtctagcatc 4560
ggcaagatgg ttgtctctcc tacagagttc aagaaacatg ccacatggaa tgtctacgct 4620
acgtattccg catctgacag caaggcgtcg tcaggtgccg ttttcgtctt ttcggaggat 4680
cgcaaactgg tgtcattcgc taccaagatc cagtttatgc gtattaaggc tgcaaaactc 4740
gaaaaggttc tggagtccgc aaacccgggt agcaagacca aatcgactaa cggaaatgcc 4800
cttccgtcag ttcctcgcag tgtccctgct ggaccaacta gcgcccctca gcaagtcgct 4860
ccgactacaa tgccatctgc acctgcacct gtgccagtgg ttgctgctgg tgcatcgccg 4920
tcaaaaattg ctgacctcaa gtcactgatc agtgtttaca caggtgtgcc tgttgatgaa 4980
atgcaggaca accaaaattt cggcgatatg ggtcttgact ccttggcatc tatggagctt 5040
gcggacgaga tggaatctaa acttggtttg aaggttgaga cagaagatct gcttttggga 5100
agcgtcgggt cgttgatcaa gttgctggca ccaagttctg gaccaaccgc tgcacttact 5160
gaaggcttgg tcgagtctta tgatacgtgc agcgaatcta gcgactccat tcgcaattct 5220
acaggatttc ataccactat ccctgctacg cctgctgagc tccactccaa ccctcctgat 5280
agcctggacg gctcgacagt ctggacgaag ccaaaacata gtctgtccgc tcgtttcaaa 5340
cttgatacca tggtgtacaa ggaagccgaa ggcatcgata ttcccgctga cgtctatgtg 5400
ccacaggagc cgcctcagca accgatgcct gtcgccctca tgatccatgg cggtggacac 5460
ctcactctgt ctagaagggc tgttcgcccg acgcagacca agtacctttt gagtcaagga 5520
atccttcctg tctccattga ctatcgtttg tgcccgcagg ttaatgtcat cgatggccct 5580
gtggccgata ctcgggacgc ttgtgaatgg gcacaacgag atctccctaa aattatggcc 5640
tcgcgcaaca tcgaggttga tgcttcaaag cttatcgtca ttggttggag taccgggggc 5700
actttggcga tgactacagc ctggaccctt ccttctgcag gactccctcc tcctgtggcg 5760
attctgtctt tctactgccc agttaattat gatcccgagg ctccaatcca gatgggagag 5820
gaacacgaaa agcgtaacat gtctctctct gaaatccgcc gtctcctggg accacagcca 5880
gctacctcac atgcaagtca cacgaccgac actacaaaac tgggttgggt gcaagcaaat 5940
gatccgcggt ctgaacttgt tttggcgctc atcaaggagc ctcgcggtat gagccttttg 6000
tttaatggac tccctcccac tggagaggaa ttgcctgtcc ctgatgctga gcgtgctgca 6060
gctctctccc ctctcgtgca ggttcgtaag ggaaattacg atgtgccaac ttatctgatt 6120
ttcggggatg aggacgaaat cgccccgttc ggcaaggctg tcgaatttgc acaagcgctt 6180
aaagacgctg gggtgaagag cggctttttg cctattaaag gtggaaagca tatcttcgat 6240
ctcggtattt cccccggatc taaggcatgg gatgagtcga tcggtccagg atacgacttc 6300
ctcttgggtg aactggaaaa tgcacaccgg cgatgtcgtg atgtctga 6348
<210> 24
<211> 1665
<212> DNA
<213> 人工序列
<220>
<223> 修饰基因
<400> 24
atgtccgcca tccccaagaa atgcaccgtg ctcgttattg gcggtggacc agggggctcc 60
tatgcagctt ctgcacttgc gcgcgaagga atcgacactg tcgtgttgga gggcgataag 120
ttccctcggt atcatattgg cgaaagcatg ttggcttcga tgcgacatct cctcaagttt 180
gtggagctcg acgggaaatt cgattcttac ggctttgtta agaaacccgg tgcagcgttc 240
aagctgaaca agaataaacg cgaaggttac accgactttc ttgccgctgg cggcccaaac 300
aattatgcat ggaacgttgt ccgttcagaa gcggacaatt tgatgttcca gcatgcaggc 360
gagagtggag cgaagatctt cgatggagtc agcgtgaaat cgattcaatt tgaaaaccct 420
actgaggtcc ccgacggcga gccaaacctc aatcctggca agcccgtgag cgccacatac 480
cagatcaagg agacgaaaga acagggacaa attgatttcg actatgtggt tgatgctagc 540
gggagaatcg gcattctgtc gacaaagtac atgaaaaacc gccgttataa tcaaggcctt 600
aagaacatcg caaattgggg ttactgggaa ggatgcaaca aatatgctcc tggaacgccg 660
cgggagaata gccccttctt tgaagccttg caggacgagt cgggttgggc ttggttcatt 720
ccactccata acgggaccgt ttcggtcggc gtcgtgatga atcaaaagct cgcaactcag 780
aagaaacaag aagcggatct ggactccacc gagttctacc acgatactct taacaagatc 840
tctcccaatc tccgggagct gattggtgac ggaaagttcg tctccaacgt gaaaacagcc 900
tctgattact catatagtgc ttcctcttac tcatttccgt atgcccgaat cgttggtgac 960
gctggatgtt tcattgatcc ttattttagc tcgggtgtcc acctcgcact gacgtcagga 1020
ctgagtgcag cgaccactat ctccgcgtct attcgcggac aggtcgacga ggaacttggg 1080
tccgagtggc atacaaagaa attctctgat gcctacacga gatttctttt ggttgtcttg 1140
tctgcttata agcagatcag gcaccaagag gaaccggtcc tcagcgattt cgacgaagat 1200
aatttcgaca gagccttttc gttctttagg cctatcattc agggcacagc tgatgccgct 1260
aacaataagc tgagccaaga ggaacttaac aaaacgttgg agttctgtgc cttcgctttt 1320
gagccagtgg aaaatgacga ggatcgctca aaggcaatga gtgcgatgca ggaagctgtt 1380
gacaacggga ccggctatca tccggatctc tctcctgagc agctgaaggc agtcaaacac 1440
atccaagccc ggcgagctat gcgaacatca gacacgatga atatcgaaag tttcggaact 1500
gatgccatta acgggtttgt tccgaatctt gtccgcgggt cacttggctt gcgtaagcag 1560
gaagccatga gtggcgacat gggcggcgcc aacggtcatg tcgatgaaac caacggtgtg 1620
actgttaatg gacatcacca acctgagggt gtgaaggctc actga 1665
<210> 25
<211> 748
<212> DNA
<213> 酱油曲霉(Aspergillus sojae)
<400> 25
tgtggaccag acaggcgcca ctcggccggg ccacaactgc ttgggttttg accgggagcg 60
gaccaattaa ggactcgaac gaccgcgggg ttcaaatgca aacaagtaca acacgcagca 120
aacgaagcag cccaccactg cgttgatgcc cagtttgtct gtccgaaatc caccggaaag 180
gtggaaacat actatgtaac aatcagaggg aagaaaaatt ttttatcgac gaggcaggat 240
agtgactgat ggtggggtca tggtcgggtc tccgagcgaa agagaaccaa ggaaacaaga 300
tcaacgaggt tggtgtaccc aaaaggccgc agcaacaaga gtcatcgccc aaaagtcaac 360
agtctggaag agactccgcc gtgcagattc tgcgtcggtc ccgcacatgc gtggtggggg 420
cattacccct ccatgtccaa tgataagggc ggcggtcgag ggcttaagcc cgcccactaa 480
ttcgccttct cgcttgcccc tccatataag gattcccctc cttcccctcc cacaactttt 540
ttcctctttc tctcttcgtc cgcatcagta cgtatatctt tcccccctac ctctttctca 600
ctcttcctcg attcattcca ctcttctcct tactgacatc tgttttgctc agtacctcta 660
cgcgatcagc cgtagtatct gagcaagctt ttttacagaa tctttctagt atcttacaaa 720
gaactacaaa gttcgcacca ccttcaaa 748
<210> 26
<211> 800
<212> DNA
<213> 酱油曲霉
<400> 26
gtaccaggag tacattggag agttctacca ttgttgctgg aatacaatga tgattagaaa 60
ccgaagagtg ttatgattcg gacggatata cgcatggcac gcatacagcg tgatacatag 120
gctgtttgct caagaattag gattttatct gaatccatgt acagagttta cttatgttag 180
tagtcaatga aatcttggct ttctaatttt gtccgatcta caaggggtag tcgatcacag 240
aacgaactag atgtgcaggg aacgatgatc acccgctctt agcaagacct ctagtagttt 300
tcgaccatag ctttaacgcg aatcatgacc ctactatttt ctagattgca gaccaagtca 360
catgacaatg tcctctttga agtaggatca gtagctgatt agattccggg aaatgaatta 420
gggctggcgt tccaactact ggggagtgcc gatgttgctg tatgaaagat agtaagatta 480
ctagtgcaca gctgtagtaa ttatttactc tagattatat attccaaata ataagtaatc 540
taagatagta gacagtccta tgatatagct ccgggttcga agtcggcaaa agatatgcaa 600
tcacctgtcg ggatgatata tgtatatctg aaataccgac atcaaccatc cagtcggatc 660
agctaaacga agtatcactt ctttcgccac tgccaatcac tacttctatt aaagttcatg 720
ttacagtata agccacaaga cttatctcca gaactaactt gtgcatagga gctctgccga 780
tagccgggtg gttggatcgg 800
<210> 27
<211> 1838
<212> DNA
<213> 酱油曲霉
<400> 27
ttgggcttat tgctatgtcc ctgaaaggat atcaaaagca ggcaaaaagc caggcataac 60
cccgcgcgga tggtacccta aggataagcc ctaatcttat ctacatgtga ctgcgtcgat 120
gtgtttggtc caaatgaggc atgtggctca ccccacaggc ggagaaacgt gtggctagtg 180
catgacggtc ccctccatag attcaattta atttttcgcg gcaattgtcg tgcagtttgt 240
atctaccgtt cattctacat attaagggtt agtaattgga catcctgatt actttgtcta 300
attactgaaa actcgaagta ctaacctact aaataagtca gtttcaacca ctaagtactc 360
atttatacaa tagttgcaga accccgcgct acccctccat tgccaacatg tcttccaagt 420
cgcaattgac ctacagcgca cgcgctagca agcaccccaa tgcgctcgtg aagaagctct 480
tcgaggttgc cgaggccaag aaaaccaatg tcaccgtttc cgccgacgtg acaaccacca 540
aagagctgct ggatttggct gaccgtatgc gcaccgggga tgccacttac atatgatcta 600
gtaatggtta atggtggaat atataacagg actcggtccg tacattgccg tgatcaaaac 660
tcacatcgat atcctctccg atttcagcga agagaccatc atcggtctga aggcccttgc 720
agagaagcac aatttcctca tcttcgaaga tcgcaagttc atcgatatcg gaaacacagt 780
ccaaaagcag taccatggcg gcactctgcg catctctgag tgggcccaca tcatcaactg 840
cagtattctg cccggtgagg gtatcgtcga ggctctggcc cagactgctt cggccgagga 900
cttcccctat ggctctgaga ggggcctttt gatccttgcg gagatgacat ccaagggatc 960
tttggctacc ggtcaatata ctacttcttc tgttgactat gcccggaagt ataagaagtt 1020
tgtgatggga ttcgtctcga cgcgtcacct gggcgaggtt cagtctgaag ttagctcgcc 1080
ttcggaggag gaggatttcg tcgtcttcac gacaggtgtc aacctctcct cgaagggaga 1140
caaactggga cagcaatacc agactcctga gtctgctgtt ggacgcggtg ccgactttat 1200
cattgctggt cgtggaattt atgctgctcc tgatcccgtg gaggcagcga agcggtacca 1260
gaaagaggga tgggatgcat accagaagcg tgttggtgcg caataagtag tggtgaatac 1320
gtgctctttt tatggcagta tatcgcaagt atgatgcgat tcataaattc agcagtcgaa 1380
ttctacgaga gaacgatgct aagagatacc ctctctatat gaataatatg cctgcctcga 1440
gatatggaca tattcaagat cagagttaag ggtcatgttt caaaatcaca ccaatctcca 1500
acatagacga gaatttttac cggattgtct gaaggtgcag ctggagattg gtctattttc 1560
taagagtggg gtatcactaa tgtacagtcg gtcactatcg tacaaacaat cacaattata 1620
tacaagattt cccatcaccc cttactctaa catggcactt ttatccatcg agtccgagcc 1680
tagccaccat ttggtgcttt cgtagagacc aaagtataac cctgatccga cagcggccat 1740
aaacgtgttg atagcacacc ctcggaatag tcctctcggg ccatctgttc gtataatctc 1800
ccgtacggta ttgatcatcc ttttcttctg aggtgcgg 1838
<210> 28
<211> 3195
<212> DNA
<213> 人工序列
<220>
<223> 修饰基因
<400> 28
atgaccgagc tgattcctgg gccgaaggga ctgcctctga ttggtaatgt gctggatatt 60
gaccccgtgg acgctgttgt ttgtctcgga cggatcgccg acacctacgg gcatatctat 120
cagctgaaag tgggcggatc cgccaagatc ttcatcagta gccgcgagct ggtcgacgag 180
ctgagtgatg agagccggtt caccaagctg gtgtctggac ctctggctca gctgcgaaac 240
gtctgtcatg attctctgtt caccgcccag tcagacgagc ctgcctggga tctggcccac 300
aagatcctga tgcctgcttt tggacctctg gctatccgag gcatgttcga cgagatgcac 360
gatatcgctt cccagctggt ggtcaagtgg gctcgatttg gaccacagga caccatcgat 420
gtgtctggcg acttcacccg gctgaccctg gatgccatcg ccctgtgtag tatgagcacc 480
cgattcaaca gtttctacaa gcaggaccag catcccttcg tgtcgtccat gctggaggtc 540
ctggctgagt caggaaagcg cgctgtgcgc ccgccctttg tcaacgatta catcttccga 600
ggcagtctga agcactataa caccgagatc gccaccatgc gccgaatcgc tatggatgtg 660
ctggctgagc gacgcgctaa cccgatggcc tgtcagaaga acgatctgct gaacgccatg 720
atcaacggac gcgaccctaa gaccggagag gggctgtcgg atgagtccac catcaacaac 780
ctgatcgtct tcctgatcgc cggacatgaa accacctctg ggctgctgtc attcctgttc 840
tactatctgc tgacccgccc agacgtgttc gagaaggccc agaaggaagt ggatgaactg 900
gtgggacgag gacctgtcac catcgagcat atgtcaaagc tgcactacat cgaggcctgt 960
ctgcgcgaaa ccctgcgact gcacccaacc gctcctgtga tcaccttcaa gaccaagccg 1020
ggcttcgaga aggagagtac caccatcggg ggcggaaagt ataagatcga tcgcgatcag 1080
ggaatcgtgg ccctgctggt caacatccag cgcgacccga aggtctgggg cgatgacgcc 1140
aacgagttca agcctgagcg aatgaccgat gagaagttca acaacctgcc cgccaactgt 1200
tggaagccgt tcgggaacgg catccgcggg tgcatcggac gagcttttgc ttggcaggag 1260
agcctgctga tcaccgccat gctgctgcag aacttcaact tccagctggc cgatccagac 1320
tataagctgc agatcaagca gaccctgacc atcaagcccg gcaacttctt catgcatgcc 1380
aagctgcgcg accacgtgga tcccctggag ctggagggaa tcctgcatgg gggcgccaag 1440
aaggggtcaa agatcgacgg accgtcttct ggggctagtc tggctaccac cgagcaggag 1500
ctgcagccta tgaccatcct gtacggctcg gattccggaa cctgtgagag tatggctcag 1560
agcctggctc gagctgctcg aggacggggg tatggagcta ccgtgaagac cctggactct 1620
gctgtggagc aggtccctaa ggatcagcca gtggtcatcg tgtctccctc atacaacggc 1680
cagcctccat cgaacgccac cgatttcgtc aagtggctgg aggccctgga ctccaaggcc 1740
ctgaaggatg tgaagtactc tgtctatgga tgtgggaaca aggactatac cagcaccttc 1800
catcgcatcc cgaagctgct ggatgccgag ttcgagcggt gtggcgccaa gcgaatcgcc 1860
gaaaccggcc tgggagatgt gaccgtcgga gacatcttct cggatttcga gcggtggcag 1920
gatgatcagc tgtggcctgc tctgggagtg gctcatatgg atggagacgc cgatgccgag 1980
ttcgacatcc acgtggatcg atctggacga gctgctgagc tggaggtgga tgctgatgag 2040
gccaccgtgc agtcgaacca ggtcctgacc gcccctggag agccagagaa gcggtacatc 2100
accctgaagc tgccagaggg gatgcagtat aagtctggcg accacctgtc tgtgctgcct 2160
ctgaacgatt ggggcgtggt ccggcgagtc tttgcttggg ctcagctgcc ttgggatgct 2220
gtggtcacca tcccaaaggg aaccaacacc tccctgccaa ccggacggca gatcagtgcc 2280
aaggatctgc tgtctggata tgtggagctg tctcagccag ccacccgaaa gaacatcgcc 2340
aaactggctg cgtcatcacc ttgcccgttc acccaaaagt ctctctcaaa actggaagaa 2400
cattttgaca gtgacatcgc ccaacgacgg ctcagtgttc tggacattct ggaggagttc 2460
cccgccattg acattacttt cggcaacttc atcagcatgc tgccacccat gcgcccacga 2520
cagtacagca tcgccagtag cccaatggcc gatccaagta ccgccaccct gatgtggacc 2580
gtcctgaaca gtgaggccta ttcgggcagt ggacgccgat tcctgggagt gtgtagcacc 2640
tatctggccg gactggccga gggcgatcga gtccatgtga ccgtcaagcc tgccctgcga 2700
ctgttccatc caccttcaga tccagagtcg atgcccatca tcatggcctg tgccggaacc 2760
ggcctggccc cgttccgcgg attcctggag gagcgggtgt gtcagatgaa ggccggacgc 2820
gccctggccc ccgcctatct gttcgtcggc tgtcgagacc cagagaagga tgccctgctg 2880
aaggatgagc tggcccagtg ggagcgagat ggcgtggtca agatctatta cgccttcagt 2940
cgcgccagcg atcagagtga tgggtgtaag catgtccagg atcgaatctg gaacgagcga 3000
gatctggtgc gaaagggcct gttcgaggga aacgcccgct tcttcatgtg tgggggatca 3060
ggcgccggaa agtccgtcga ggatgtggtc aagcgcatct acaaggacaa caagggagag 3120
tcccaggaga aggctgcgga gtcgtggttc caggacctca aggctaatcg ttatgtcact 3180
gaaatctttg cgtga 3195
<210> 29
<211> 822
<212> DNA
<213> 人工序列
<220>
<223> 修饰基因
<400> 29
atggcgtttg gcgtggagcc cccagagcat gtcaccccgt ggttcaagcc ggtttatgag 60
gcgacttttc agtttggcgg agtggcgtgg accctgtgtt acatcctgat cgcccgcgag 120
ggcatgcgga ccaagagtta tggaatgccc ctgttcgccc tggccaacaa cttcgcctgg 180
gagatggtct acgccctgtg ggtggtcgat aacgccttcg agaagaccgc catgaccatc 240
tggatgctga tcgacacccc tatcatctat tccatcctga agcatggagt gctggagtgg 300
cagcacgccc caatggtcag tcgcaacctg aagagcatcc tggtggggct gatcgctctg 360
tgtgctgctg cccattggag ttggcagagc tggtggatcg ggaacgagat gggaaagcga 420
gatgacctgg agggagctga tctgacccag atggcctact gggccgtgtc gatgtgtcag 480
ttcctggtga gtaccatgtc cctggccatg ctgtgtgtgc ggggacactc tggcggagtc 540
tcatggatga tctggctgtc tcgattcctg ggaaccctga tcgggctgaa catgaactac 600
gcctgggcct actatacctg gcccgaggcc catgagtatt tcatgtcagc tcctgctgtg 660
tttgtctggg gcgtgaccac cgtctgtgat atcatctacg gcttcgtgct gtatcacgtc 720
aagtcgaacg agcgagagct gtccgacggc cgcaaggtgg ccgctgaggc tgatgacgag 780
caagtcggtg ggtggtctaa gatgaaaact gggaagaact ga 822
<210> 30
<211> 1605
<212> DNA
<213> 人工序列
<220>
<223> 修饰基因
<400> 30
atgggctccc tgctctttga ttcccccgtt gggcgttttg tcgcttcatt tcctgctctc 60
tcggcggctg ctggactcat tgttgccatc agtttcatct acatccgctt catcaagacc 120
cctaagctgg acctgccagt ggtgggaaac ccaggcgaca agtgggatgc tcagaagcat 180
atcgtggctg gagctcgaaa gtaccctgac accccatata tcctgccgat ggatcccccg 240
atcgtggtcc tgcctatcaa gatccaggat gaggtccgaa acctgcccga gaacgtggtc 300
agtttcacca aggagcatca gcgaaacttc ttcgcccagt ataccggaat cggggaccac 360
cgaccggaga tgatcaccgc catccggcag gatctgaccc gacacatcgt gagcaccatc 420
cctggactgc aggaagaggt gcgctacggg ttcgacaagg agttcggcga ctgtaaggat 480
tggaccccct tcccgctgta tatgaaggtg ctgcgaatcg tggctctgac cagtggacga 540
gtgtttgtgg gacgcccgct gtcacgggag gaagagtggc tgcagcggac catctcgtac 600
accatggatt gtgtgaaggc ccgaaacgcc atccgcgagt atccatggtg gaagcgccga 660
tgggtcacca gtagcctgcc cgagatcgcc aagctgaccg agcatcgaac ccgaggcgga 720
gtgctgctga agcctatcat ggacgcccag ctggccaagg atagcaagcg agagaagatc 780
atcaacgagg aaaccggaga cgaggaaggc aacttcatcg agtggctgct gaagcacacc 840
ccaggcgacc tgaagatgga tcccgagaac ctggccctga accagatggt gctggccttc 900
gcctcggtcc atacctcgtc catgtccgtg acccatgcta tcctggaact ggtgacccgg 960
ccggagtact ttgcccctct gcgagaagag ctggaggaag tgcgacgcgc tgacggccat 1020
accgtcgatg acgatggata tatccgcctg aagaaggagt ctatcaacaa gctgcggaag 1080
ctggatagtt tcatgaagga gagccagcga ttcaaccctc caatctctac ctcaggcacc 1140
cgcatctgta ccgccgacct gaagctgtca accggacaca ccctgccaaa ggggacccgg 1200
atctgtttcc cctcgtacga tgtgcatcac aacccgaaga ccaccaccta ctcccctgag 1260
tataacccgc ccgggtatac ccctccagac cagttcgatg gcctgcgctt cttcaagctg 1320
cgggagatgc caggaaagga gagtcgacat cagttcgcca ccgccaacca cgagagcctg 1380
gtgttcggct tcggaaacca tacctgtccc ggacgcttct tcgccgccaa ccagatcaag 1440
atcatcctgg ccgagctgct gatgaactgg gacgtgcgcc tgaagggaga tgtggagcag 1500
aagggcggcc cagagaagcg gccgcagaac atggtggtcg atctggttat tacccccaat 1560
ccaatggcga tggttgaaat gaagcgtcgt tctcgggctg tgtga 1605
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 31
tgtggaccag acaggcgcca ctc 23
<210> 32
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 32
tttgaaggtg gtgcgaactt tgtag 25
<210> 33
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 33
cgcaccacct tcaaaatgac acttattcag acgaaacat 39
<210> 34
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
atgtactcct ggtactcaga catcacgaca tcgccggtg 39
<210> 35
<211> 325
<212> PRT
<213> 苹果枝溃疡病菌(Neonectria ditissima)
<400> 35
Met Ala Pro Lys Thr Ser Thr Ala Gln Gly Arg Tyr Thr Pro Pro Thr
1 5 10 15
Lys Gly Ile Leu Ser Lys Leu Pro Ala Ser Trp Val Pro Tyr Ala Glu
20 25 30
Leu Ile Arg Leu Glu Gln Pro His Gly Ile Tyr Met Ile Tyr Phe Pro
35 40 45
His Ile Val Gly Leu Met Tyr Ala Cys Ser Ala Arg Pro Ser Ala Val
50 55 60
Pro Ala His Glu Leu Ala His Arg Leu Val Val Phe Phe Val Trp Thr
65 70 75 80
Phe Phe Met Arg Gly Ala Gly Cys Ala Trp Asn Asp Ile Thr Asp Gln
85 90 95
Asp Phe Asp Arg Lys Thr Glu Arg Cys Arg Asn Arg Pro Val Ala Arg
100 105 110
Gly Ala Ile Ser Thr Thr Gln Gly His Ile Tyr Thr Leu Val Leu Thr
115 120 125
Ala Leu Gly Phe Leu Thr Leu Gln Thr Leu Pro Val Glu Cys Thr Leu
130 135 140
Cys Ala Leu Ala Thr Ala Val Leu Thr Ile Ile Tyr Pro Phe Gly Lys
145 150 155 160
Arg Phe Thr Asn Phe Ala Gln Val Ile Leu Gly Ser Thr Leu Ala Ser
165 170 175
Thr Ile Ala Leu Ser Ala Tyr Ala Val Glu Leu Pro Ala Leu Ser Pro
180 185 190
Gly Tyr Val Val Pro Thr Leu Cys Leu Thr Ala Thr Ile Leu Leu Leu
195 200 205
Val Val Phe Tyr Asp Thr Ile Tyr Ala Arg Gln Asp Thr Ala Asp Asp
210 215 220
Leu Lys Thr Gly Val Lys Gly Met Ala Val Leu Phe Arg Asn His Ile
225 230 235 240
Glu Thr Leu Leu Ala Val Leu Ala Leu Ser Ile Ala Gly Leu Leu Ala
245 250 255
Thr Thr Gly Thr Leu Leu Asn Met Gly Pro Tyr Phe Phe Ala Phe Ser
260 265 270
Val Val Gly Leu Ala Thr Gly Leu Leu Thr Met Ile Ala Leu Ile Arg
275 280 285
Trp His Leu Phe Pro Ser Phe Ala Lys Tyr Ser Gly Trp Phe Tyr Ala
290 295 300
Leu Ala Ile Val Asn Leu Leu Gly Gly Cys Val Val Glu Tyr Leu Asn
305 310 315 320
Lys Ala Pro Ala Leu
325
<210> 36
<211> 1057
<212> PRT
<213> 苹果枝溃疡病菌
<400> 36
Met Ala Pro Thr Ile Arg Pro Phe Val Lys Pro Ala Val Asn Phe Ala
1 5 10 15
Ser Ile Gln Arg Leu Asp Gly Cys Leu His Ser Leu Pro Glu Leu Val
20 25 30
Asp Phe Asn Ala Gln Asn Asn Ala Asp His Pro Phe Cys Ile Gln Ala
35 40 45
Lys Ser Asp Gly Leu Asp Thr Phe Thr His Ala Asp Phe Lys Thr Ala
50 55 60
Val Ser Asn Cys Ala Ala Trp Ile Lys Glu Asn Val Pro Leu Arg Ala
65 70 75 80
Ser Thr Asp Pro Asn Gly Leu Thr Lys Met Ala Pro Val Ala Leu Phe
85 90 95
Met Gln Ser Asp Phe Gly Leu Val Ile His Glu Phe Ala Leu Leu Ser
100 105 110
Ile Gly Val Pro Pro Leu Ile Leu Ser Pro Arg Leu Pro Pro Ile Ala
115 120 125
Ile Met His Leu Leu Gln Glu Thr Ala Ala Ser Ser Phe Ile Val Ser
130 135 140
Gln Arg Leu Ser Glu Pro Ala Lys Pro Ala Leu Ala Ala Leu Asn Ala
145 150 155 160
Lys Gly Ile Ser Thr His Ile Gly Leu Asn Tyr Asp Ser Phe His Glu
165 170 175
Ala Gly Ala Val Ala Ser Lys Pro Lys Phe Asp Leu Pro Thr Glu Leu
180 185 190
Asp Ser Val Val Leu Leu Leu His Ser Ser Gly Thr Thr Gly Met Pro
195 200 205
Lys Pro Ile Pro Ile Thr His Arg Gln Leu Leu Phe Ala Val Asn Cys
210 215 220
His Gly Phe Asp Thr Glu Glu Glu Ala Gln Gly Leu Asn Val Ser Ser
225 230 235 240
Leu Pro Leu Phe His Gly Phe Gly Leu Val Ala Pro Gly Leu Ser Met
245 250 255
Ser Ala Gly Lys Thr Thr Val Tyr Pro Ala Ser Asp Gly Ile Pro Asn
260 265 270
Ala Leu Ser Ile Val Glu Leu Val Lys Arg Thr Asn Ala Lys Ser Leu
275 280 285
Met Thr Val Pro Phe Leu Leu Asp Asp Val Val Asn Asn Glu Glu Ala
290 295 300
Ile Lys Val Leu Ala Gly Leu Asp Phe Val Gly Thr Gly Gly Ala Ala
305 310 315 320
Leu Gly Ala Gly Val Gly Asp Lys Leu Ala Gln Gly Gly Val Lys Leu
325 330 335
Leu Asn Phe Tyr Gly Thr Thr Glu Ser Gly Pro Leu Ser Asp Thr Phe
340 345 350
Val Pro Lys Asp Asn Tyr Ser Trp Lys Tyr Phe Arg Leu Arg Lys Asp
355 360 365
Val Asn Tyr Lys Val Asp Glu Leu Asp Pro Lys Asp Gly Gln Arg Met
370 375 380
Phe Arg Leu Thr Val Phe Pro Tyr Gly Gly Thr Glu Gly Ile Glu Ile
385 390 395 400
Ala Asp Gln Leu Ile Arg Asn Glu Gln Tyr Pro Glu Thr Asp Phe Ala
405 410 415
Ala Val Gly Arg Asp Asp Asp Val Ile Val Leu Ala Thr Gly Glu Lys
420 425 430
Ala Asp Pro Leu Ile Leu Glu Thr Met Leu Ser Glu Ala Pro Ser Val
435 440 445
Lys Ser Ala Ile Ala Phe Gly Glu Asn Arg Phe Asn Leu Gly Val Val
450 455 460
Val Glu Pro Ala Ser Pro Ile Ala Glu Gly Glu Glu Ala Ala Phe Lys
465 470 475 480
Glu Ser Ile Trp Pro Ile Ile Ala Ala Ala Gly Gln Lys Met Glu Ser
485 490 495
Tyr Ser Arg Ile Pro Ser Gln Asp Val Val Ile Val Val Pro Ser Ser
500 505 510
Val Thr Ile Pro Arg Thr Asp Lys Gly Ser Ile Pro Arg Lys Glu Val
515 520 525
Tyr Ala Leu Phe Glu Lys Asp Ile Asn Glu Val Tyr Glu Lys Leu Ala
530 535 540
Arg Gly Val Glu Glu Ser Val Glu Ala Leu Asp Leu Asp Asn Leu Glu
545 550 555 560
Gln Asn Leu Lys Gln Leu Val Glu Thr His Ser Arg Leu Gln Val Ser
565 570 575
Pro Ser Asp Trp Thr Val Glu Asp Ser Leu Phe Asp Leu Gly Leu Asp
580 585 590
Ser Leu Gln Ala Leu Gln Leu Arg Arg Val Leu Ile Thr Ala Ala Ser
595 600 605
Lys Thr Glu Val Phe Lys Asn Thr Asp Val Ala Lys Met Ile Pro Val
610 615 620
Glu Phe Leu Tyr Leu Asn Ser Ser Val Arg Glu Met Ala Thr Ala Leu
625 630 635 640
Thr Arg Ser Gly Ser Ala Gly Asp Ala Thr Glu Ser Trp Ser Glu Val
645 650 655
Asn Lys Phe Val Glu Gln Tyr Thr Leu Ala Gln Ser Val Asp Thr Lys
660 665 670
Asp Lys Leu Pro Ser Thr Pro Glu Asn Ala Val Val Leu Leu Thr Gly
675 680 685
Ser Ser Gly Ser Leu Gly Ser His Ile Leu Ala Asn Leu Ala Arg Ser
690 695 700
Pro Asn Val Lys Arg Val Val Val Leu Leu Arg Lys Gly Lys Ala Ala
705 710 715 720
Ala Pro Pro Val Pro Gly Gln Lys Tyr Asp Arg Ser Gly Leu Thr Ala
725 730 735
Arg Gly Ile Lys Leu Ser Glu Ala Glu Trp Ala Lys Ile Ser Ser Leu
740 745 750
Asp Val Asp Pro Thr Gln Glu Gln Leu Gly Leu Asn Pro Met Val Tyr
755 760 765
Gly Ala Leu Gln Gln Asn Val Thr Gln Ile Ile His Ala Ala Trp Pro
770 775 780
Met Asn Tyr Leu Ile Arg Leu Pro Ser Phe Gln Tyr Gln Phe Lys Phe
785 790 795 800
Leu Gln Asn Leu Leu Gln Leu Ala Met Asp Gly Asn Gly Asp Thr Lys
805 810 815
Arg Arg Phe Val Phe Val Ser Ser Ile Ala Ala Val Ala Lys Val Gly
820 825 830
Leu Ala Ser Gly Gly Lys Leu Ile Ala Glu Ser Pro Val Asp Pro Val
835 840 845
Asp Ala Ala Cys Gly Ile Gly Tyr Ala Asp Gly Lys Leu Ala Cys Glu
850 855 860
Lys Ile Leu Glu Arg Ala Ala Lys Thr Phe Ala Gly Gln Leu Glu Val
865 870 875 880
Thr Tyr Val Arg Cys Gly Gln Met Thr Gly Ala Arg Glu Thr Gly Val
885 890 895
Trp Asn Ser Gly Glu Gln Ile Pro Met Leu Leu Arg Thr Ala Gln Ser
900 905 910
Val Gly Ser Leu Pro Gln Leu Gln Gly Thr Leu Ser Trp Ile Pro Val
915 920 925
Asp Asp Ala Ala Ala Val Ile Ser Asp Met Thr Phe Ser Ala Gly Ile
930 935 940
Pro Pro Ile Ala Gln His Leu Glu Asn Pro Val Arg Gln Ala Trp Ser
945 950 955 960
Asp Val Ile Glu Ser Ile Arg Gln Gln Leu Lys Leu Ala Asn Ala Ser
965 970 975
Val Pro Phe Asp Ala Trp Leu Asp Gln Val Ala Ser Ala Glu Gly Glu
980 985 990
Glu Asp Ala Tyr Pro Ile Arg Lys Leu His Asp Phe Phe Lys His Ser
995 1000 1005
Phe Arg Ala Val Ala Cys Gly Gln Val Ile Leu Asp Thr Ala Val
1010 1015 1020
Ala Arg Asn Ser Ser Thr Thr Leu Arg Ser Ser Ala Ala Val Asp
1025 1030 1035
Glu Ala Thr Ile Gln Gly Tyr Ile Arg His Trp Lys Glu Thr Gly
1040 1045 1050
Tyr Leu Gln Lys
1055
<210> 37
<211> 1880
<212> PRT
<213> 苹果枝溃疡病菌
<400> 37
Ala Tyr Ile Ser Thr Ile Ser Asp Ser His Thr Arg Ser Leu Ile Ala
1 5 10 15
Pro Gln Asp Gln Ile Ser Ser Leu Arg Ala Tyr Ala Glu Lys Glu Gly
20 25 30
Leu Ser Pro Lys Thr Met His Ile Gln Gly Lys Leu His Asp Thr Asn
35 40 45
Asn Ala Asp Leu Ala Asn Glu Cys Ile Glu Trp Cys Asn Thr Leu Pro
50 55 60
Glu Leu Pro Phe Pro Ser Gly Lys Ala Leu Gln Val Pro Val Arg Ser
65 70 75 80
Asn Arg Ser Gly Gly Leu Leu Ala Thr Val Thr Gln Ser Leu Ser Asn
85 90 95
Glu Val Ile Gln Thr Ile Leu Ala Ser Thr Cys Asp Trp Ser Leu Val
100 105 110
Ile Arg Gly Leu Ala Ser Asp Leu Gln Gln Thr Asp Arg Arg Glu His
115 120 125
Thr Leu Ala Leu Phe Gly Ile Gly Asn Ser Val Pro Leu Ala Pro Phe
130 135 140
Arg Gln His Glu Leu Asp Ile Thr Lys Leu Asp Met Ser Ser Ile Ser
145 150 155 160
Thr Thr Ser Thr Ala Phe Asn Pro Ile Ser Phe Pro Pro Asn Ala Ile
165 170 175
Ala Val Val Gly Ala Gly Cys Arg Leu Pro Gly Ala Ser Ser Leu Glu
180 185 190
Glu Leu Trp Glu Leu Ile Ser Glu Gly Lys Ser Arg Leu Glu Thr Leu
195 200 205
Arg Ser Asp Arg Ala Asn Val Gln Gly Ser Tyr Arg Ala Ser Gln Asp
210 215 220
Lys Asn Trp Ala Ser Lys Arg Gln Phe Tyr Gly Asn Tyr Ile Asp Asp
225 230 235 240
Ile Asp Ala Phe Asp His Ser Phe Phe Gly Ile Ser Pro Arg Glu Ala
245 250 255
Lys Tyr Met Asp Pro Gln Gln Arg Leu Leu Leu Met Val Ala Phe Asp
260 265 270
Ala Leu Asp Ser Ser Gly Tyr Met Arg Gln His Arg Arg Glu Glu Gly
275 280 285
Asp Ala Val Gly Cys Phe Ile Gly Ala Ser Tyr Thr Glu Tyr Leu Glu
290 295 300
Asn Thr Ser Ser Tyr Ser Pro Ser Ala Phe Thr Ala Thr Gly Thr Ile
305 310 315 320
Arg Ala Phe Leu Ser Gly Lys Ile Ser Tyr His Phe Gly Trp Ser Gly
325 330 335
Pro Ser Glu Val Ile Asp Thr Ala Cys Ser Ser Ser Ile Val Ala Val
340 345 350
His Arg Ala Cys Gln Ala Ile Asn Ala Gly Glu Cys Ser Ser Ala Leu
355 360 365
Ala Gly Gly Val Asn Leu Ile Thr Gly Ile Asn Asn Tyr Phe Asp Leu
370 375 380
Gly Lys Ala Ser Phe Leu Ser Gln Thr Gly Gln Cys Lys Pro Phe Asp
385 390 395 400
Asp Ser Ala Asp Gly Tyr Cys Arg Ala Asp Gly Val Gly Leu Val Val
405 410 415
Leu Lys Pro Leu Ser Lys Ala Ile Ser Asp Gly Asp His Ile Met Gly
420 425 430
Val Ile Pro Ala Thr Ala Thr Asn Gln Gly Gly Ile Asp Ala Pro Gly
435 440 445
Ile Thr Val Pro Asp Gly Ser Ala Gln Lys Ala Leu Tyr Gln Asn Val
450 455 460
Leu Leu Lys Ser Gly Ile Lys Gly His Gln Val Ser Tyr Val Glu Ala
465 470 475 480
His Gly Thr Gly Thr Gln Val Gly Asp Pro Ile Glu Ile Lys Ser Ile
485 490 495
Arg Asp Val Phe Gly Gly Pro Thr Arg Thr Asn Pro Val Tyr Leu Gly
500 505 510
Ser Leu Lys Ala Asn Ile Gly His Ser Glu Thr Ala Ala Gly Val Ala
515 520 525
Ser Leu Leu Lys Val Leu Ala Met Phe Arg His Gln Gly Ile Pro Pro
530 535 540
Leu Gln Gly Phe Lys Ser Leu Asn His Lys Ile Pro Ala Leu Glu Pro
545 550 555 560
Asp Gly Met Ser Ile Pro Thr Thr Leu Leu Pro Trp Asp Ala Lys Tyr
565 570 575
Pro Arg Ile Ala Ala Val Asn Ser Tyr Gly Ala Ser Gly Ser Asn Ser
580 585 590
Ala Leu Leu Cys Ser Glu Trp Ser Gly Ala Ser Lys Pro Ala Ser Arg
595 600 605
Gln Thr Ser Phe Pro Ile Leu Leu Ser Ala Ala Ser Pro Glu Ser Leu
610 615 620
Arg Arg Tyr Thr Asp Asp Leu Ala Ser Tyr Leu Ser Lys Ser Ser Ala
625 630 635 640
Ala Gly Leu Lys Val Gly Asp Leu Ala Leu Thr Leu Ser Glu Arg Arg
645 650 655
Lys His His Arg Val Arg Trp Ser Thr Thr Val Ala Ser Leu Pro Asp
660 665 670
Leu Val Ser Gln Leu Gln Lys Gly Pro Glu Asp Leu Val Glu Ile Pro
675 680 685
Lys Ala Ser Lys Lys Val Val Leu Thr Phe Ser Gly Gln Ser Arg Thr
690 695 700
Ser Ile Gly Leu Asp Pro Ser Val Arg Gln Ser Tyr Pro Leu Phe Glu
705 710 715 720
Lys Tyr Ile Thr Gln Cys Asn Asp Ile Leu Gln Gly Phe Gly Cys Ser
725 730 735
Asp Ile Leu Ser Ala Leu Ser Asp Pro Gly Pro Ile Thr Asn Pro Val
740 745 750
Ile Leu Gln Cys Gly Thr Val Ala Val Gln Tyr Ala Cys Ala Gln Cys
755 760 765
Trp Ile Asp Gly Gly Leu Arg Val Asp Ala Ile Ile Gly His Ser Leu
770 775 780
Gly Glu Leu Thr Ala Leu Ala Val Ser Gly Val Leu Ser Leu Ser Asp
785 790 795 800
Ala Leu Lys Val Val Tyr Thr Arg Ala Glu Leu Ile Asn Glu Lys Trp
805 810 815
Gly Pro Glu Arg Gly Thr Met Leu Ala Ile His Ala Pro Leu Asp Val
820 825 830
Val Gln Ser Val Met Glu Val Val Asp Thr Leu Val Ser Glu Glu Asp
835 840 845
Asp Glu Leu Glu Ile Ala Cys Phe Asn Ser Val Ser Ser His Ile Val
850 855 860
Val Gly Thr Glu Ala Trp Val Ala Met Ala Glu Arg Ile Leu Gln Gln
865 870 875 880
Asp Ala Lys Tyr Gln Gly Ile Arg Phe Gln Arg Leu Ser Val Ser His
885 890 895
Gly Phe His Ser Arg Phe Thr Glu Pro Leu Leu Ser Asp Leu Val Asp
900 905 910
Leu Glu Glu Thr Leu Glu Phe Arg Glu Pro Thr Ile Pro Leu Glu Thr
915 920 925
Ser Thr Gln Thr Pro Phe Val Phe Gly Thr Lys Asp Ser Thr Tyr Leu
930 935 940
Ala Asp His Ala Arg Asp Pro Val His Phe Val Ser Ala Val Gln Arg
945 950 955 960
Val Glu Gln Arg Leu Gly Pro Cys Val Trp Leu Glu Ala Gly Trp Gly
965 970 975
Ser Pro Ile Val Ala Met Ala Lys Lys Ala Val Ala Asp Pro Lys Leu
980 985 990
His Thr Phe Gln Ala Val Thr Ser Pro Ala Ala Val Ala Ala Asn Leu
995 1000 1005
Trp Arg Glu Gly Ile Thr Ile Thr Asp Trp Gly Phe Leu Thr Pro
1010 1015 1020
Lys Asp Ser Gly Leu Gly Pro Val Trp Leu Pro Pro Tyr Ser Phe
1025 1030 1035
Asp Gln Pro Lys Ala Trp Leu Asp His Val Asp Asn Ala Ile Glu
1040 1045 1050
Glu Gln Asn Lys Val Pro Val Gln Leu Glu Ala Lys Ser Asn Thr
1055 1060 1065
Gln Leu Leu Ser Tyr Lys Gly Ala Val Ala Asp Gly Ser His Asn
1070 1075 1080
Phe Thr Leu His Thr Asn Thr Glu Arg Phe Val Lys Ile Val Gln
1085 1090 1095
Gly His Ala Val Arg Arg Lys Pro Leu Cys Pro Ala Ser Met Tyr
1100 1105 1110
Met Glu Ala Ala Val Met Gly Thr Asp Lys Leu Gly Val Glu Leu
1115 1120 1125
Arg Ser Lys Thr Ile Thr Phe Arg Asn Val Thr Phe Ala Arg Pro
1130 1135 1140
Leu Gly Cys Gly Glu Gly Leu Asp Val Glu Leu Cys Leu Gly Lys
1145 1150 1155
Leu Pro Asn Ser Ala Glu Ser Trp His Tyr Ala Val Gln Ser Thr
1160 1165 1170
Ser Lys Ser Ala Tyr Ser Glu Gly Asp Phe Ser Val Ser Ser Ser
1175 1180 1185
Pro Pro Asp Asp Met Glu Leu Tyr Gly Met Leu Val Thr Asp Gly
1190 1195 1200
Ile Thr Ala Leu Lys Asn Asp Pro Asp Thr Glu Lys Leu Arg Lys
1205 1210 1215
Ser Thr Ala Tyr Ser Leu Phe Ser Lys Ile Val Glu Tyr Ala Asp
1220 1225 1230
Leu Leu Arg Gly Ile Thr Ser Ile Thr Leu Gly Gln Lys Gln Ala
1235 1240 1245
Leu Ala Lys Ile Glu Val Pro Lys Ser Thr Phe Ala Thr Ser Glu
1250 1255 1260
Ser Thr Val Ser Asp Tyr Tyr Asp Ala Ile Thr Leu Asp Thr Phe
1265 1270 1275
Val Gln Val Leu Gly Leu Leu Ile Asn Cys Asn Asn Ala Ser Asp
1280 1285 1290
Ser Gly Asp Glu Ile Tyr Ile Ala Ser Cys Ile Asp Lys Met Val
1295 1300 1305
Val Ser Pro Thr Asp Phe Gln Lys Pro Gln Thr Trp Thr Val Tyr
1310 1315 1320
Ala Thr Tyr Ser Ala Ala Asp Ser Lys Thr Leu Ser Gly Ser Val
1325 1330 1335
Phe Val Phe Ser Glu Glu Gly Lys Leu Thr Ala Phe Gly Thr Lys
1340 1345 1350
Ile Gln Phe Met Arg Thr Gln Ala Ala Arg Leu Glu Arg Val Leu
1355 1360 1365
Glu Ala Ala Asn Pro Arg Pro Ala Val Asn Gly Leu Ser Leu Ser
1370 1375 1380
Thr Asn Ile Pro Ile Pro Ala Gly Gly Gln Gln Val Asp Leu Ala
1385 1390 1395
Leu Val Asn Pro Lys Ile Ser Ile His Ala Pro Ser Pro Thr Ser
1400 1405 1410
Ala Asn Ile Ala Leu Glu Val Glu Val Gly Lys Ile Asp Val Leu
1415 1420 1425
Lys Ser Leu Ile Ala Ala Tyr Ser Gly Val Lys Glu Ala Asp Ile
1430 1435 1440
Gln Asp Asp Val Ser Phe Ala Ser Met Gly Leu Asp Ser Leu Ala
1445 1450 1455
Ser Met Glu Leu Ala Ser Glu Ile Glu Ser Thr Leu Gly Ile Arg
1460 1465 1470
Val Asn Ser Glu Asp Leu Leu Thr Gly Asp Ile Arg Ser Leu Leu
1475 1480 1485
Lys Ser Phe Pro Ser Glu Gly Asn Met Glu Ser Leu Ser Gln Ser
1490 1495 1500
Leu Glu Asn Ala Ser Arg Ser Ser Asp Lys Ser Thr Ala Ser Asn
1505 1510 1515
Gly Thr Ser Ile Asp Gly Asp Cys Asp Asp Pro Thr Ala Met Ser
1520 1525 1530
Thr Pro Pro Asp Leu Gly Phe Gln Lys Ile Asp Thr Glu Thr Gly
1535 1540 1545
Asn Thr Pro Trp Thr Arg Pro Ser Thr Pro Leu Ser Thr Arg Phe
1550 1555 1560
Lys Ile Glu Thr Val Thr Tyr Lys Glu Val Asp Gly Val Arg Ile
1565 1570 1575
Pro Ala Asp Leu Tyr Ile Pro Ser Glu Ala Pro Ser Gln Pro Met
1580 1585 1590
Pro Ile Ala Leu Met Ile His Gly Gly Gly His Leu Thr Leu Ser
1595 1600 1605
Arg Arg Ala Val Arg Pro Ala Gln Thr Asn Phe Leu Leu Gln Asn
1610 1615 1620
Gly Leu Phe Pro Ile Ser Ile Asp Tyr Arg Leu Ala Pro His Val
1625 1630 1635
Asn Val Val Asp Gly Ser Met Ala Asp Thr Arg Asp Ala Cys Ile
1640 1645 1650
Trp Ala Arg Arg Glu Leu Pro Lys Leu Met Ala Leu Lys Gly Ile
1655 1660 1665
Thr Leu Asp Pro Thr Lys Leu Val Val Ile Gly Trp Ser Thr Gly
1670 1675 1680
Gly Thr Leu Ala Met Thr Thr Ser Trp Thr Leu Lys Asp Leu Gly
1685 1690 1695
His Ser Pro Pro Leu Ala Val Leu Ser Phe Tyr Cys Pro Val Glu
1700 1705 1710
Tyr Asn Pro Asp Ala Pro Thr Leu Met Gly His Asp His Pro Pro
1715 1720 1725
Arg Thr Met Ser Leu Ser Glu Ile Arg Ser Cys Leu Pro Ala Gly
1730 1735 1740
Pro Ser Thr Ser His Ala Phe Asn Thr Leu Asp Thr Thr Lys Leu
1745 1750 1755
Gly Trp Leu Asp Glu Gly Asp Pro Arg Ser Glu Leu Val Leu Ala
1760 1765 1770
Leu Ile Lys Glu Glu Asn Gly Met Ser Leu Leu Phe Asp Gly Leu
1775 1780 1785
Pro Ser Glu Gly Glu Gln Phe Pro Arg Ala Asn Ser Ser Arg Thr
1790 1795 1800
Thr Ala Phe Ser Pro Leu Thr Gln Ala Arg Asn Gly Asn Tyr Ser
1805 1810 1815
Thr Pro Thr Tyr Val Ile Phe Gly Asp Glu Asp Glu Ile Ala Pro
1820 1825 1830
Phe Glu Lys Ala Val Glu Phe Glu Asp Val Leu Asn Ser Asn Gly
1835 1840 1845
Val Pro Cys Gly Phe Leu Pro Val Thr Gly Gly Lys His Ile Phe
1850 1855 1860
Asp Leu Gly Leu Ser Pro Gly Ser Glu Gly Trp Asp Ile Val Leu
1865 1870 1875
Tyr Thr
1880
<210> 38
<211> 534
<212> PRT
<213> 苹果枝溃疡病菌
<400> 38
Met Ala Ala Gln Ile Pro Lys Lys Thr Thr Val Leu Val Ile Gly Gly
1 5 10 15
Gly Pro Gly Gly Ser Tyr Ala Ala Ala Ala Leu Ala Arg Glu Gly Ile
20 25 30
Asp Thr Val Val Leu Glu Gly Asp Lys Phe Pro Arg Tyr His Ile Gly
35 40 45
Glu Ser Met Leu Ala Ser Ile Arg His Leu Leu Arg Phe Val Glu Leu
50 55 60
Asp Ala Lys Phe Asp Ser Tyr Gly Phe Leu Lys Lys Ala Asn Thr Asp
65 70 75 80
Phe Leu Ala Ala Gly Gly Pro Asp Asn Tyr Ala Trp Asn Val Ile Arg
85 90 95
Ser Glu Ser Asp Lys Leu Met Phe Asp His Ala Ala Glu Ser Gly Ala
100 105 110
His Val Phe Asp Gly Val Gln Val Lys Ser Val Glu Phe Glu Gly Gly
115 120 125
Val Val Pro Gly Glu Asp Gly Val Glu Ser Leu Asn Pro Gly Arg Pro
130 135 140
Ile Ser Ala Thr Tyr Leu Ile Lys Glu Thr Lys Glu Thr Gly Gln Ile
145 150 155 160
Ala Phe Asp Tyr Val Ile Asp Ala Ser Gly Arg Ile Gly Ile Leu Ser
165 170 175
Thr Lys Tyr Met Lys Asn Arg Arg Tyr Asn Gln Gly Leu Lys Asn Val
180 185 190
Ala Asn Trp Ala Tyr Trp Lys Gly Thr Asn Pro Tyr Ala Pro Gly Thr
195 200 205
Thr Arg Glu Asn Ser Pro Phe Phe Glu Ala Leu Gln Asp Glu Ser Gly
210 215 220
Trp Ala Trp Phe Ile Pro Leu His Asn Gly Thr Thr Ser Val Gly Ile
225 230 235 240
Val Glu Asn Gln Lys Leu Ser Ile Glu Lys Lys Gln Ala Ser Lys Thr
245 250 255
Asp Asn Ser Gln Asp Phe Tyr Leu Glu Asn Leu Lys Leu Ala Pro Asn
260 265 270
Leu Leu Ala Leu Ile Gly Asp Ala Thr Gln Val Asp Lys Val Lys Ala
275 280 285
Ala Ser Asp Tyr Ser Tyr Cys Ala Ser Ser Tyr Ala Phe Pro Tyr Ala
290 295 300
Arg Ile Val Gly Asp Ala Gly Cys Phe Ile Asp Pro Tyr Phe Ser Ser
305 310 315 320
Gly Val His Leu Ala Leu Val Gly Gly Leu Ser Ala Ala Ala Thr Ile
325 330 335
Cys Ala Ser Ile Arg Gly Asp Val Glu Glu Ser Ser Ala Ala Asp Trp
340 345 350
His Ser Lys Lys Ile Ala Asp Ala Tyr Thr Arg Phe Leu Leu Val Val
355 360 365
Leu Ser Ala Tyr Arg Gln Ile Arg Ser Gln Glu Glu Pro Val Leu Thr
370 375 380
Asp Ile Asn Glu Asp His Phe Asp Arg Ala Phe Ala Met Phe Arg Pro
385 390 395 400
Ile Ile Gln Gly Thr Ala Asp Val Gly Asn Lys Lys Leu Ser Gln Glu
405 410 415
Glu Leu Lys Lys Thr Leu Glu Phe Cys Ala Thr Ala Phe Glu Pro Val
420 425 430
Lys Thr Glu Glu Asp Arg Thr Ala Ala Ile Glu Glu Ile Thr Asn Asn
435 440 445
Pro Asn Gly Thr Gly Tyr His Ala Asp Leu Ser Ala Ser Gln Arg Asn
450 455 460
Ala Val Asn His Ile Arg Ala Arg Lys Met Met Arg Thr Glu Asp Thr
465 470 475 480
Val Asn Ile Asp Ser Phe Gly Ser Asp Ala Ile Ala Gly Tyr Val Pro
485 490 495
His Leu Lys Arg Gly Ser Leu Gly Leu Lys Gln Val Ala Lys Gly Gly
500 505 510
Leu Asp Ala Val Pro Gly Gln Met Thr Pro Val His Ser His Thr Thr
515 520 525
Ala Val Glu Val Arg Ala
530
<210> 39
<211> 1064
<212> PRT
<213> 苹果枝溃疡病菌
<400> 39
Met Pro Ser Lys Ile Pro Gly Pro Arg Gly Leu Pro Leu Leu Gly Asn
1 5 10 15
Ile Ala Asp Ile Asp Pro Ser Asp Ala Val Ala Ser Leu Gly Arg Ile
20 25 30
Ala Glu Thr Tyr Gly Pro Ile Tyr Lys Leu Asn Leu Val Gly Ser Glu
35 40 45
Lys Leu Phe Ile Ser Ser Arg Glu Leu Met Asp Glu Val Ser Asp Glu
50 55 60
Lys Arg Phe Thr Lys Leu Val Ser Gly Pro Leu Phe Gln Leu Arg Asn
65 70 75 80
Ala Val Gly Asp Ser Leu Phe Thr Ala His Ser Asn Glu Pro Asn Trp
85 90 95
Asp Val Ala His Arg Val Leu Met Pro Ala Met Gly Pro Leu Ala Ile
100 105 110
Arg Gly Met Phe Asp Glu Met His Asp Val Ala Thr Gln Leu Leu Thr
115 120 125
Lys Trp Ala Arg Phe Gly Pro Lys Glu Thr Ile Asp Val Thr Ser Asp
130 135 140
Phe Thr Arg Leu Thr Leu Asp Thr Ile Ala Leu Cys Ser Met Gly Thr
145 150 155 160
Arg Phe Asn Ser Phe Tyr His Glu Glu Met His Pro Phe Val Gly Ser
165 170 175
Met Ile Gly Leu Leu Glu Glu Ser Gly Lys Arg Ala Pro Arg Pro Asn
180 185 190
Trp Val Asn Tyr Leu Met Pro Ala Ser Gln Ala Lys Tyr Glu Ala Asp
195 200 205
Ile His Thr Leu Gln Gln Val Gly Ala Asn Leu Leu Ala Asp Arg Arg
210 215 220
Val Asn Pro Thr Asp Lys Lys Asp Ile Leu Asn Ala Leu Ile Asn Gly
225 230 235 240
Ile Asp Pro Lys Thr Gly Lys Gly Met Ser Asp Glu Ser Ile Leu Asn
245 250 255
Asn Met Ile Val Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly Leu
260 265 270
Leu Ser Phe Leu Phe Tyr Tyr Leu Leu Lys Lys Ala Asp Val Phe Glu
275 280 285
Lys Ala Gln Lys Glu Val Asp Glu Val Val Gly Arg Gly Pro Val Thr
290 295 300
Ile Glu His Leu Ser Glu Leu Pro Tyr Leu Glu Ala Cys Leu Arg Glu
305 310 315 320
Val Leu Arg Leu His Pro Thr Ala Pro Val Ile Thr Leu Gln Pro Arg
325 330 335
Pro Asp Leu Val Gln Glu Asn Leu Thr Ile Gly Lys Ala Glu Tyr Ala
340 345 350
Val Gly Pro Gly Gln Pro Ile Val Ala Leu Leu Thr Gln Val His Arg
355 360 365
Asp Pro Ala Val Trp Gly Pro Asp Ala Asn Glu Phe Arg Ala Glu Arg
370 375 380
Met Ser Asp Glu Asn Phe Ser Arg Leu Pro Lys Asn Ser Trp Lys Pro
385 390 395 400
Phe Gly Asn Gly Ile Arg Gly Cys Ile Gly Arg Ala Phe Ala Trp Gln
405 410 415
Glu Ser Leu Leu Val Thr Val Met Leu Leu Gln Thr Phe Asn Phe Arg
420 425 430
Leu Lys Asp Pro Glu Tyr Glu Leu Lys Ile Lys Gln Thr Leu Thr Ile
435 440 445
Lys Pro Gly Asp Phe Tyr Met His Ala Thr Leu Arg Asp His Leu Asp
450 455 460
Ser Val Gln Leu Gly Lys Ser Leu Tyr Gly Asn Ser Gln Pro Ser Asn
465 470 475 480
Gly His Ser Lys Gln Ser Glu Val Glu Thr Lys Pro Thr Ala Thr Pro
485 490 495
His Ala Ser Lys Lys Met Thr Ile Leu Tyr Gly Ser Asp Ser Gly Thr
500 505 510
Cys Glu Thr Met Ala Gln Ala Leu Ala Arg Ala Ala Pro Thr Arg Gly
515 520 525
Tyr Asp Ala Thr Leu Ser Ser Leu Asp Ala Ala Val Asp Asp Leu Pro
530 535 540
Arg Glu Gln Pro Val Ile Leu Ile Cys Ser Ser Tyr Asn Gly His Pro
545 550 555 560
Pro Asn Asn Ala Ala Gly Phe Val Ala Trp Leu Glu Gly Leu Lys Ser
565 570 575
Asp Asn His Val Leu Lys Gly Ile Thr Phe Ala Val Tyr Gly Cys Gly
580 585 590
Asn Arg Asp Tyr Gly Pro Thr Phe His Arg Ile Pro Lys Leu Leu Asp
595 600 605
Ser Glu Leu Gly Asn Asn Gly Ala Thr Arg Leu Met Asp Ile Gly Leu
610 615 620
Gly Asp Val Thr Val Gly Asp Ile Phe Ser Asp Phe Glu Ala Trp Gln
625 630 635 640
Asp Asp Arg Leu Trp Pro Ala Leu Gly Ala Tyr Ala Val Gly Asn Val
645 650 655
Asp Gly Ala Phe Asp Ile Lys Ile Asp Arg Ser Tyr Arg Pro Ser Asp
660 665 670
Leu Arg Glu Asp Phe Asn Glu Ala Val Val Leu Thr Asn Ser Val Val
675 680 685
Thr Ala Pro Ser Glu Pro Glu Lys Arg Thr Met Thr Leu Lys Leu Pro
690 695 700
Asp Ala Val Lys Tyr Thr Ala Gly Asp His Ile Ala Val Leu Pro Leu
705 710 715 720
Asn Asp Ser Asp Thr Val Arg Arg Val Leu Arg Trp Ala Lys Leu Pro
725 730 735
Trp Asp Ala Val Ile Thr Ile Pro Thr Gly Ser Asn Thr Thr Leu Pro
740 745 750
Thr Gly Arg Ala Ile Ser Ala Pro Asp Leu Leu Ser Gly Tyr Val Glu
755 760 765
Leu Ser Arg Pro Ala Thr Arg Lys Val Ile Pro Pro Asn Val Ala Thr
770 775 780
Ile Thr Ala Arg Ala Ala Asp Glu Lys Thr Arg Asn Lys Met Leu Ala
785 790 795 800
Leu Glu Glu Asp Phe Asp Asn Ser Val Thr Leu Gln Arg Arg Ser Val
805 810 815
Leu Asp Ile Leu Glu Asp Thr Pro Glu Ile Ser Leu Pro Phe Ala Glu
820 825 830
Phe Leu Ala Met Leu Pro Pro Met Arg Ala Arg Lys Tyr Ser Val Ala
835 840 845
Ser Ser Pro Leu Ala Asp Ala Ser Thr Val Thr Leu Leu Trp Ser Val
850 855 860
Val Asp Lys Glu Ser Pro Leu Asn Pro Val Met Arg Arg Arg Gly Val
865 870 875 880
Ala Ser Thr Tyr Leu Ala Arg Leu Asn Gln Gly Asp Ser Ile His Val
885 890 895
Ala Val Lys Pro Ala Leu Arg Leu Phe His Pro Pro Thr Asp Val Glu
900 905 910
Asn Thr Pro Val Ile Met Ala Cys Ala Gly Thr Gly Leu Ala Pro Phe
915 920 925
Arg Ala Phe Val Gln Glu Arg Ser Val His Ala Gln Ala Gly Arg Asn
930 935 940
Leu Ala Pro Ala Tyr Leu Phe Ile Gly Cys Arg Asp Pro Ser Lys Asp
945 950 955 960
Thr Leu Leu Gln Glu Glu Leu Arg Gln Trp Glu Lys Leu Asp Ile Val
965 970 975
Lys Val Phe Tyr Ala Phe Ser Gln Ala Ser Glu Gln Ser Ser Gly Cys
980 985 990
Lys Tyr Val Gln Asp Arg Ile Trp Lys Glu Arg Glu Ile Val Glu Arg
995 1000 1005
Val Ile Val Asn Gly Lys Gly Ile Ile Tyr Val Cys Gly Gly Ala
1010 1015 1020
Gly Val Gly Lys Gly Val Glu Glu Val Met Lys Arg Ile Tyr Ser
1025 1030 1035
Leu Glu Thr Arg Ala Asn Thr Ala Glu Gln Trp Val Gln Asp Leu
1040 1045 1050
Lys Ser Ser Arg Tyr Ala Arg Glu Ile Phe Ser
1055 1060
<210> 40
<211> 267
<212> PRT
<213> 苹果枝溃疡病菌
<400> 40
Met Gly Phe Asn Asp Ile Pro Pro Ala His Val Ser Ala Trp Tyr Gln
1 5 10 15
Pro Val Tyr Asn Ala Thr Phe Gly Phe Ala Gly Leu Ser Trp Thr Leu
20 25 30
Cys Tyr Met Leu Tyr Ala Arg Gln Gly Leu Arg Thr Lys Ser Tyr Gly
35 40 45
Met Pro Leu Phe Ala Leu Ala Asn Asn Phe Ala Trp Glu Met Val Tyr
50 55 60
Ala Leu Ser Val Ala Asp Ala Pro Arg Glu Lys Thr Ala Met Val Ile
65 70 75 80
Trp Met Leu Ile Asp Met Pro Ile Ile Tyr Ser Thr Leu Arg Tyr Gly
85 90 95
Arg Glu Glu Trp Ser His Ala Pro Met Val Ser Arg Asn Leu Gly Lys
100 105 110
Ile Leu Val Thr Leu Val Met Leu Cys Ala Val Ala His Tyr Ser Phe
115 120 125
Ala Ser Trp Trp Met Gly Asn His Ile Ala Met Lys Ser Gly Lys Val
130 135 140
Tyr Arg Gly Val Glu Gly Gln Asp Ala Thr Glu Met Ala Phe Trp Ala
145 150 155 160
Val Ser Val Cys Gln Val Ile Val Ser Thr Ser Ser Leu Ala Gln Leu
165 170 175
Ile Thr Arg Gln His Thr Gly Gly Val Ser Trp Ser Ile Trp Ala Leu
180 185 190
Arg Phe Cys Gly Thr Leu Val Gly Leu Asn Ile Asn Tyr Gly Trp Ala
195 200 205
Trp Tyr Thr Trp Thr Glu Ala His Gly Tyr Phe Met Ser Ala Pro Gly
210 215 220
Val Phe Leu Trp Gly Ile Thr Thr Leu Cys Asp Val Val Tyr Ala Ile
225 230 235 240
Val Phe Ala Gln Val Arg Arg Asn Glu Arg Val Leu Pro Asp Gly Arg
245 250 255
Lys Ala Ala Pro Leu Gln Ser Ile Lys Arg Gly
260 265
<210> 41
<211> 533
<212> PRT
<213> 苹果枝溃疡病菌
<400> 41
Met Glu Ser Leu Ser Ser Ala Gly Glu Ser Ala Val Gln Ala Ile Thr
1 5 10 15
Ser Phe Pro Ala Leu Ser Ser Val Val Ala Leu Phe Leu Ala Val Leu
20 25 30
Val Tyr Gln Ser Cys Val Lys Thr Arg Ala Pro Thr Pro Ala Leu Pro
35 40 45
Val Val Gly Lys Pro Gly Ser His Ile Thr Lys Asp Val Ile Leu Glu
50 55 60
Gly Ser Arg Lys Tyr Pro Asp Thr Pro Phe Ile Leu Pro Met Ser Pro
65 70 75 80
Pro Ile Val Val Leu Pro Ile Gly Ile Gln Asp Glu Val Arg Asn Leu
85 90 95
Pro Glu Ser Arg Val Ser Phe Thr Gln Glu His Gln Arg Asn Phe Phe
100 105 110
Ala Gln Tyr Thr Gly Ile Gly Asp His Arg Pro Glu Met Ile Lys Ala
115 120 125
Ile Arg Ile Asp Leu Thr Arg His Ile Ala Ser Thr Leu Pro Ala Leu
130 135 140
Gln Glu Glu Val Arg Phe Gly Phe Asp Lys Glu Phe Gly Asp Cys Lys
145 150 155 160
Asp Trp Thr Pro Leu Pro Val Tyr Leu Lys Val Leu Arg Val Val Ala
165 170 175
Leu Met Asn Gly Arg Ile Phe Val Gly Arg Pro Leu Ser Arg Glu Glu
180 185 190
Glu Trp Ile Gln Ser Thr Ile Ser Tyr Thr Ile Asp Cys Val Lys Ala
195 200 205
Arg Asn Ala Ile Arg Glu His Pro Val Trp Lys Arg Arg Trp Val Thr
210 215 220
Ser Ser Leu Pro Glu Ile Ala Lys Leu Thr His His Arg Thr Arg Gly
225 230 235 240
Gly Glu Leu Leu Glu Pro Ile Met Lys Ala Gln Leu Ala Lys Pro Ser
245 250 255
Phe Lys Glu Lys Leu His Asn Pro Glu Ser Gly Asp Glu Glu Gly Asn
260 265 270
Phe Ile Glu Trp Ile Leu Lys Tyr Thr Pro Glu Glu Leu Arg Asn Asp
275 280 285
Pro Val Asn Leu Ala Val Asn Gln Met Val Leu Ser Phe Ala Ala Ile
290 295 300
His Thr Ser Ser Met Ala Thr Thr His Ala Ile Leu Asp Leu Ala Ala
305 310 315 320
Arg Arg Glu Tyr Ile Gln Pro Leu Arg Asp Glu Ile Asp Gln Val Arg
325 330 335
Ala Ala Asp Gly Asp Glu Arg Asp Asp Asp Gly Phe Val Arg Leu Lys
340 345 350
Lys Glu Ser Ile Asn Lys Leu Arg Lys Leu Asp Ser Phe Met Lys Glu
355 360 365
Ser Gln Arg Phe Ser Pro Pro Ile Tyr Thr Ser Gly Thr Arg Ile Cys
370 375 380
Thr Ser Asp Ile His Leu Ser Thr Gly His Thr Leu Pro Lys Asp Thr
385 390 395 400
Arg Ile Cys Phe Ser Ser Phe Ala Val Gln Thr Asp Pro Lys Thr Thr
405 410 415
Thr Phe Ser Pro Glu Tyr Asn Pro Ala Gly Tyr Thr Pro Pro Asp Gln
420 425 430
Phe Asp Gly Met Arg Phe Tyr Asn Leu Arg Asn Met Pro Gly Lys Glu
435 440 445
Ser Arg His Gln Phe Ala Thr Ala Gly Pro Glu Ser Leu Thr Phe Gly
450 455 460
Tyr Gly Asn His Thr Cys Pro Gly Arg Phe Phe Ala Ser Asn Glu Ile
465 470 475 480
Lys Ile Ile Leu Val Glu Leu Leu Met Asn Trp Asp Phe Arg Leu Lys
485 490 495
Gly Asp Val Glu Leu Lys Gly Gly Ala Glu Lys Arg Pro Pro Asn Val
500 505 510
Glu Val Asp Leu Val Ile Thr Pro Asn Pro Met Ala Met Leu Glu Phe
515 520 525
Lys Arg Arg Arg Ala
530
<210> 42
<211> 1065
<212> DNA
<213> 酱油曲霉
<400> 42
atggcagcca tcaccgacca caacgtcgtc tacgcggacg gcaaaaagat ccactaccta 60
gcagcaggcc ctgcaaatgg ccctctagtt ctctttatcc atggctggcc aggcagcgcg 120
atcacctgga aggcgcaaat cgatgccttc gcatccgtgg ggttccgcgc gattgcccct 180
gatatgccag gctatgggca gtcgactgcc cgccgcgtgg ccgatgacta ctgtcaagaa 240
gccgtcgtag agggcatgct ggctttgcta gccgacacag gccgcgatgc agcgatctgg 300
gtcggccacg actggggcgc aggcgtcaca tcctccgttg cgacgcaaca ccccgaggtg 360
gttaaagcgt tggtgactat gtctgtgcca ttccacacta tcgagcgtgg ctggcagggc 420
ttccttccct atgtaaaccg cgagctctac ccagcggacg aatacgagtt cggccagtgg 480
gactatatga agaactggga ggagaacttc gaaaaaaccg tggaatggtt cgacagtgac 540
attgcaggaa tgtgcaaagc ttccttgcaa ccgtccaagc ccccaactag ccgttttgcc 600
cagctgtttg ccaccgtgcg caagagcggt ggatggatgg gcggggcgcc aaagcccccg 660
agtgtggaga tgacagggcc tccggtgctc cctgctgagg tcttcgactc ttttgttcag 720
gatatgcaga gaaccggctt ctgggccgga tctgcgtact accttcacca tgcgcggaac 780
gcggaataca atggaaagcg cgaggggaag ttgaaccaac cagtcctgtt tatccatgac 840
gccagggatg tgatatgtga caccataacg tctcgcctgg tcgagccgat gagagagaac 900
tgtagcaatt tgactgaggt tacgatcgac gcaggacact ttgcgcatta tgaaaagccg 960
gaagaggtac aggccgccat tttcaggttc attgtggaag agctgccgag tgagtggcct 1020
gggttttgga ctgccgggta tactaagaag aagtcggttc tgtga 1065
<210> 43
<211> 2163
<212> DNA
<213> 酱油曲霉
<400> 43
atggcgcaac tcgacactct cgatttggtt gtcctggtgg cgcttttggt gggtagcgtt 60
gcctacttca ccaaaggcac ttactgggct gtcgccaaag atccttatgc ctcctccggt 120
ccagcgatga atggcgccgc caaggcagga aagactagag atatcttgga gaaaatggaa 180
gaaactggca agaattgcgt cattttctac ggttcccaga ctggaactgc agaggactac 240
gcctcgaggt tggccaagga aggatctcag agattcggtc tcaaaactat ggttgctgat 300
ttggaagatt acgactacga aaacttggac aaattcccgg aagacaaggt cgcctttttt 360
gttctcgcga cttatggtga gggcgagcct acggataatg ctgtcgagtt ttaccagttc 420
atcaccggtg aagatgttgc ttttgaaagt ggcgcgtccg ctgaagagaa gccgctgtcc 480
actctcaagt atgtcacctt cggccttggt aacaatacct atgagcacta caacgctatg 540
gttcgcaatc tcgacgtcgc tctgcaaaag cttggtgctc aacgtattgg ttctgctggt 600
gaaggtgatg acggcgctgg cacgatggaa gaagacttct tggcttggaa ggaacctatg 660
tggaccgcgc tttccgaggc gatgggtctc caggagcgcg aggccgttta tgagccggtg 720
ttcaatgtca cagaagatga gtctaagagc gccgaagacg agacggtcta tctcggcgag 780
ccgactaagg gtcatctcga aggtcaaccc aagggcccat tctcggccca caacccgttc 840
attgcgccta tcgtcgagtc tcgtgagcta ttcaccgtaa aggatcgtaa ctgtctgcac 900
atggaaatta gcatcgccgg aagcaacctc acctatcaaa ccggtgacca cattgctgta 960
tggccgacaa atgctggtgc tgaggtggat cggttcctgc aggtttttgg acttgaggag 1020
aagcgccatt cggttattaa tatcaagggc attgatgtga ctgctaaggt tccgatcccg 1080
acccctacca cctatgatgc cgctgttcgt tactacatgg aagtctgtgc ccctgtttcc 1140
cggcagtttg tctcgagtct ggctgctttt gctcccgatg aggcgaccaa gacagaaatt 1200
cagcgtttgg gcagcgacaa ggattacttc cacgataaga tcaccaacca atgcttcaat 1260
attgcccagg ctctccaaag catcacgtcc aagcctttct ctgccgttcc attctcgttg 1320
ctcatcgaag gcctcaataa gctccagcct cgttattatt ccatctcgtc atcttccctc 1380
gtccagaagg ataagatcag tatcactgcc gttgtggaat ccgtccgttt gcctggtgcc 1440
tcccaccttg tcaagggtgt gaccacgaat tacctccttg cgctcaagca aaagcagaat 1500
ggtgaacctt ctcctgaccc tcacggcttg acgtacgcta tcactggtcc gcgcaacaag 1560
tatgatggta ttcacgttcc ggttcacgtc cgccactcga atttcaaact gccatctgat 1620
ccctcgagac caattatcat ggttggacct ggtaccggtg tcgcaccttt ccgtggcttt 1680
atacaggaac gtgccgcctt ggcggctaaa ggcgagaaag tcggcacaac tgttttgttc 1740
tttgggtgcc gtaatcgcaa tgaggatttc ctgtatcagg acgaattcaa ggtatggttt 1800
ccccgctttc tacacttccc ccttcggata cccatggacc attagctcta acgtgtttga 1860
ctacaggctt atgaggagca acttggtgat tcattgaaga tcatcactgc attttcccgc 1920
gagacttctc aaaaggttta tgtccaacat cggttgcgcg aacaagctga gctggtcagc 1980
gaccttctga agcagaaagc cacattctac gtttgtggag atgccgccaa catggcgcgt 2040
gaggtcaatc tggtgcttgg ccagattatt gcccaacagc gtggtcttcc cgccgagaag 2100
ggcgaggaga tggtcaagca tatgcgcagc agtggaagct accaggagga tgtttggtca 2160
tga 2163
<210> 44
<211> 657
<212> DNA
<213> 菌核生枝顶孢
<400> 44
gcgccttcct ccatcggctt tatcgccttg ggtgctcgcg acgtagcttg tgctcacagg 60
ttactgtact tgcttctacg acgaaatgat actgcgatga cgatgatatc ttgggacgca 120
tgacgagtcg ggcgttggga tttaccgacc tcaccgtcgt atgtcaggac aacaaaagga 180
taactctaga tgtagagaaa atctgaacac ttttcctttg tagccacctc tttcagctgc 240
ccttgcacgt gtgaacctgg gtgttaatat ccttgtgctg ttcgtgcgcc gacctcaact 300
ttatgtcctg cgcctcagct atgtgacctt gggacaccct tagctcgaca attgacggca 360
gtctatgcgc tgattacaat aaatgctctg acgctattgt agatgctact aatttacatg 420
ttgtacagat cgcctgccgt cgtgctaaat catccctgaa gggtcccgtg aaacgccgtg 480
atgagatgcg aagctgactc tcaattttct tcctcacgtc tggagcccat cggcccgatg 540
gacttacctt gcgtagccaa atcctctgcc aaccccccct gcaacaactt gatcagcaat 600
tttgcttata tagtatccct cacttctcca acgtgtgact cccttttgca agcaata 657
<210> 45
<211> 2046
<212> DNA
<213> 菌核生枝顶孢
<400> 45
atggcggata acaaagattc gtggaggaag accgaggaag atgaggatga tcaggaaatc 60
gatgagacag tgagtgaggg ttcacccttc gcaaggccgc gacttacacc gtgaacagag 120
ctacaaggcg caaaaggatg ctatcttgct tgcgattgaa gtgagcgagt cgatgttgac 180
accaccaccc aaatcagatt ccaaaaaggc cgacaaggac agtccattac aggctgctct 240
taaatgcgcc tacaatctaa tggagcagcg catcatctcc aaccccaagg acatgatggg 300
tatactgctc tttggcaccg agaagtcaaa gtttcaggac gacggcagtg ggcgaggcgg 360
tctgggttat ccccactgct acctcttcac tgaccttgac attcctgcag ctgacgacgt 420
aaaagcgctg aaggcgcttg ctgaggatga agaggatgaa gaggaaattc tgaagccaac 480
tgaagagact gtgtcgatgt caaatgtcct attttgcgcg aaccagatct tcacgacgaa 540
agcggccaac ttcggcagcc gtcgcttgtt catcgttacc gacaacgatg atccacagaa 600
agaggacaag gccgcccggt cagctgctgc agtgcgcgcc aaagacttgt atgatctagg 660
cgttaccatc gatctatttc cgattacccg gggcgacagc aggttccagc tcgacagatt 720
ctacgatgta aggacgttgt tagaaagcaa acggcagctc ttactgaccg tcaacaggac 780
atcatctacc aagatacgat agctggcgaa gccaacctga ctgaagtgcg atcatcaaaa 840
tcaggcgacg gtctgacgct tctgaactca ctgatctcca acatcaattc aaaacagacc 900
gcaaaacggg ctctcttctc gaacctggcg ttcgaaattg ccccgggact gaggatatca 960
gtgaagggat acaacgtcat ccaccgacag acgccagcaa ggacatgcta tgtgtggctc 1020
gacggcgaaa agccacaaat agcctctggc gagaccacga ggatggcaga ggacagcgct 1080
cgtacggtcg agaagactga aatcaagaag gcgtacaagt ttggaggcga gttcgtctac 1140
ttcaccccag aggagcagaa gaagctgcga gacttcggat cacccatcat tcgtgttatc 1200
ggatttaagc cgaggtcgtc gctgcccaga tgggccagtg ttaagaaaag tacttttatc 1260
ttcccgagcg aagaggactt cgtcggttcc actcgcgtgt acgccgctct gtggcagaag 1320
ttgctacggg atgacaagat tggtcttgcc tggacgatca ccagggccaa cgcgcagcca 1380
gtattggcag ccatcatccc atcaaaagag cataccgatg acgacaatgg gacgccctac 1440
ctgcccgcag gactttggat ctacccacta ccctttgccg atgatctccg tgagatcaag 1500
ccgccgggcg agctgtgtcg aagctcagat gaactgaaga gccagatgcg tgtcatcgtg 1560
cagcagctgc agctaccgaa agccatgtac aacccgatga agtaccccaa cccagcactg 1620
cagtggcact acaagatcct tcaagccatg gctttggagg aagaagtacc cgaagtggct 1680
gaagacgcca cgcagccgaa gtacaaagct atcagtaagc gagctggggg ctacttggag 1740
gattggtctg agacacttga gaatgaggca gtcgcggcac gcaacaggcg agctacttct 1800
gccaagcgag agcctgataa cgatatcccc acgcgtccgg caaagaagag ccgggcaggc 1860
tccgagaagc ctagcccagc cggtctcacc aacctgcaga tcaagtcttt ggtaggagac 1920
ggtggtatca cgaagatgac ggttgcgcag ttgaaagatg tgctcgggtc taaagggctg 1980
agtacgagcg ggaagaagat ggagctcgta gagcgaatcg agcaatgggt ggaggagaat 2040
gcctga 2046
<210> 46
<211> 2404
<212> DNA
<213> 菌核生枝顶孢
<400> 46
cggctctcga cccctactcc gttcgcaagg tccgtctcct cgttggtccc tgcttgccct 60
gccttgccct gccttgccct tccttgcctg gccttgcctt cagttgcctc catgtcctca 120
agccacccgg gtctgccccg tcaagcgcgt ccacgcccgg cccctagctg aagtggctct 180
gccgtaccta gctcgctcgc attccctcaa ccctacttga gcacacccat atctcacctg 240
ccgtcttgca tttccaggct gatctttcga actgcagcac tttcagactg gtgcctggct 300
gctgaacact ttgtctgtgc ttcgccgccg cagctctata ttgggaagac agcctcaact 360
cctggctgcc accattgcac tctgccctgc tcaggtggtc accgcttcga ccctcggata 420
gcatatcaac ccagctccgc ccgcgcgcca gcctgcatag cctcgccctt ctcctcaatt 480
gccttcgcag ctccagatcc tcctcaagat ctgtccagcc gctggcaccc aggcgtcgag 540
gcgggtacgc acattgcgag ctggtctagc agtttctgca tcccggccgt tggccatccc 600
ctcgttgtga cttggccaat catcgacatc gccagctctt accaactctc catctccaga 660
gaaccgattt tgagctcgac aactctcgtt catcctcacc atggcgcccc acccgacgtt 720
gaagatgcct tactcgaggc ggtcggagac cgtttcgcac cctttgagcc aatatctcta 780
caagctcatg gacctgaaag cctctaacct gtgtcttagc gctgatgtgc caacggcccg 840
cgagctgctc tactttgccg acaaggttgg cccgtccatc gtcgttttga agacgcacta 900
cgacatggtc gcaggctggg acttctcgcc agaaacgggc acgggcgcac gtctcgcagc 960
gctagctcgt aagcatgggt ttctgatctt cgaggaccga aaattcggcg acattggcaa 1020
cacggtagag ctgcagtata ctcagggcac ggcgcgcatc attaactggg cgcatatcgt 1080
taatgtcaat atggtgcctg gcaaggcctc cgtagcgtcc ctcgccaaag cagccgcgca 1140
ttggctgcag aggttacctt acgaggtcaa gacctcggtc acggttggca caccgaggaa 1200
ggatgaggac accgaagatg aagaggaaga cgagacgggc aaccagaaga atggcaccag 1260
tctgacacgg aaggagagca gcgagggccg caagggcagc atcgtctccg tcaccacggt 1320
cacgcaacag tacgagtccg cacactctcc aagatacggc aagacgatcg cagaggaggg 1380
cgacgaggag ctcttctccg ggctggagga gccgcctctg aatcggggtc tcctcatcct 1440
ggctcagatg tcgagcgccg ggaacttcat gaacgccgag tacacccaag cctgcgtcga 1500
ggcggcgagg gaacacaagg acttcgtcat gggattcgtt tcacaggaag gactgaacag 1560
catgccagag gacgacttca tccacatgac gcccggttgc cagctgccac cggagcacga 1620
catggatgcg gaggtaaagg gcgatgggaa gggtcagcag tacaacacac cggacaagat 1680
cattggcctg ggggcagata tcgttattgt agggaggggt atcatcaagg ctggcgatcc 1740
ggagcatgaa gccgaccgat accgttcggc ggcctggaag gcctacagcg agcgtgttcg 1800
ctgaggggtc aaaaacctag ataattctgg ccaagcgctc tatgtggtta atggatgatc 1860
tatatatgga cgggcgaggc tgcttacacc ccctttgttt gaacgggcgg gatgacgatg 1920
tgggtttgga tgtgccgtgt ctcatctggt ggagttgcag tactacactg agacgacacc 1980
aattattttc caatcacata gcctctcaca tgtataagaa gacaaagtca tgaatcctat 2040
caaatcactt gcgacgtatt tttgaatgtt tcaaatgcag gcaacggcgg gacaccaact 2100
ggttatgcat agaccgtcgg aattaaagcc agcattctcc gctccctccg gaatccgact 2160
cccgtcactc aagcgcaccg ttcgtaacgc aggtcaatcc cgctcacaca actcatctca 2220
caccgagcga ttactctcat tgctgacctc acccgctccc gctcccgcga caaacctcca 2280
tccaggatcc ttcactttcc tgccctttgc acatggcttc gcaccgataa cgagtcaaga 2340
caactcccgc cccagaaatg gacgccatgg ggatccagca cgagaaccgc cagcctctcc 2400
gtgt 2404
<210> 47
<211> 320
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 47
Met Pro Pro Ala Val Val Lys Asn Ser Ala Tyr Thr Pro Pro Thr Lys
1 5 10 15
Gly Ile Leu Ser Cys Leu Pro Ser Ser Trp Val Pro Tyr Ala Glu Leu
20 25 30
Ile Arg Leu Asp Lys Pro His Gly Ile Tyr Met Thr Ile Tyr Pro Tyr
35 40 45
Ala Leu Gly Leu Leu Tyr Ala Ser Gln Leu Thr Ser Glu Ser Leu Pro
50 55 60
Pro Asn Val Val Leu Ser Arg Phe Leu Asn Leu Ala Ile Trp Thr Phe
65 70 75 80
Leu Ile Arg Ser Ala Gly Cys Ala Trp Asn Asp Asn Val Asp Gln Asp
85 90 95
Phe Asp Arg Gln Thr Ala Arg Cys Arg Asp Arg Pro Ile Ala Arg Gly
100 105 110
Ala Ile Ser Thr Leu Gln Gly His Val Phe Thr Thr Ala Leu Leu Ala
115 120 125
Leu Gly Phe Leu Ser Ile Gln Asn Phe Pro Leu Glu Ser Lys Ile Asp
130 135 140
Gly Ala Ala Thr Val Leu Leu Thr Cys Ile Tyr Pro Phe Gly Lys Arg
145 150 155 160
Phe Thr His Phe Ala Gln Val Thr Leu Gly Leu Thr Leu Ser Val Ala
165 170 175
Ile Ile Phe Gly Pro His Ser Val Gly Ala Asn Pro Leu Ser Gln Gly
180 185 190
Asn Phe Leu Pro Thr Thr Cys Leu Val Ser Ser Ile Ile Leu Leu Val
195 200 205
Ile Phe Tyr Asp Val Val Tyr Ala Arg Gln Asp Thr Val Asp Asp Leu
210 215 220
Lys Ser Gly Val Lys Gly Met Ala Val Leu Phe Arg Asn Trp Ile Thr
225 230 235 240
Thr Leu Leu Leu Thr Leu Ile Ile Ala Ile Leu Thr Leu Leu Tyr Ile
245 250 255
Thr Ala Arg Ser Leu Asp Leu Gly Trp Val Phe Phe Gly Leu Ser Val
260 265 270
Ala Gly Pro Ala Val Ser Leu Leu Thr Thr Ile Ala Leu Ile Ala Ser
275 280 285
Lys Ser Ser Ser Ser Arg Tyr Ala Gly Lys Phe Tyr Val Leu Ala Ile
290 295 300
Ala Ser Leu Leu Ser Gly Phe Thr Ile Glu Tyr Leu Arg Thr Ile Met
305 310 315 320
<210> 48
<211> 1052
<212> PRT
<213> 里氏木霉
<400> 48
Met Arg Ser Phe Val Lys Ala Asn Val Asp Phe Ser Ser Ala Glu Arg
1 5 10 15
Lys Glu Asp Tyr Ile His Ser Leu Pro Glu Leu Val Asp Phe Asn Ala
20 25 30
Val Gln Asn Pro Asn His Leu Leu Cys Ile Gln Ala Arg Ser Asn Ala
35 40 45
Pro Trp Val Lys Ile Thr Asn Ala Gln Phe Lys Val Ala Ile Asp Gln
50 55 60
Cys Ala Thr Trp Ile Ala Glu Asn Val Lys Leu Pro Lys Ala Arg Thr
65 70 75 80
Lys His Asp Leu Thr Gly Arg Leu Pro Val Ala Leu Leu Met Glu Ser
85 90 95
Asp Phe Gly Leu Leu Val His Gln Phe Ala Leu Val Ser Met Gly Ile
100 105 110
Pro Pro Leu Val Leu Ser Ala Arg Leu Ser Pro Glu Ala Ile Phe His
115 120 125
Leu Leu Arg Ser Thr Glu Ala Ser Ser Leu Ile Val Ser Gln Arg Val
130 135 140
Ala Met Ile Thr Lys Gly Ala Phe Gly Asn Val Lys Thr Ser Asp Phe
145 150 155 160
His Val Ala Gln Pro Tyr Ser Thr Phe Cys Asn Val Pro Ala Asp Lys
165 170 175
Ser Val Arg Lys Gln Ser Val Tyr Pro Asp Asn Ile Asp Ala Asn Ile
180 185 190
Val Leu Leu His Ser Ser Gly Thr Thr Gly Leu Pro Lys Pro Ile Ala
195 200 205
Leu Ser His Arg Gln Leu Met Phe Ser Val Ser His Gly Asp Phe Glu
210 215 220
Thr Glu Glu Glu Ala Gln Gly Ile Val Ile Ser Thr Leu Pro Leu Phe
225 230 235 240
His Gly Phe Gly Leu Leu Ala Pro Gly Leu Ser Met Ala Ile Gly Lys
245 250 255
Thr Val Cys Phe Pro Ala Ser Asp Glu Val Pro Asp Ala Gln Ser Ile
260 265 270
Val Asp Leu Ile Asn Met Ser Gly Ala Thr Gly Met Leu Thr Val Pro
275 280 285
Phe Leu Leu Glu Asn Met Ala Ala Leu Pro Asn Gly Thr Gly Leu Arg
290 295 300
Ala Leu Ala Lys Leu Asp Phe Val Gly Thr Gly Gly Ser Ala Leu Ser
305 310 315 320
Ala Asp Phe Gly Val Ser Ala Ser Ala Ala Gly Val Lys Leu Leu Asn
325 330 335
Leu Tyr Gly Thr Thr Glu Thr Gly Pro Leu Thr Lys Thr Phe Ala Pro
340 345 350
Lys Ser Gly Tyr Asp Trp Lys Tyr Phe Arg Leu Arg Gln Asp Met Leu
355 360 365
Phe Lys Val Thr Glu Leu Pro Pro Val Asp Gly Glu Lys Arg Phe Arg
370 375 380
Leu Thr Val Phe Pro Phe Gly Ala Asp Lys Pro Phe Glu Ile Ala Asp
385 390 395 400
Gln Leu Ile Arg Ser Glu Lys Phe Pro Glu Thr Asp Phe Ala Ala Val
405 410 415
Gly Arg Asp Asp Asp Val Val Val Leu Ala Thr Gly Glu Lys Val Asn
420 425 430
Pro Leu Leu Leu Glu Thr Ala Leu Thr Asp Ser Gly Leu Val Lys Ser
435 440 445
Ala Ile Val Phe Gly Glu Asn Gln Phe Gln Ile Gly Val Val Val Glu
450 455 460
Pro Ala Thr Pro Leu Asn Pro Asp Gln Lys Glu Glu Phe Arg Lys Lys
465 470 475 480
Ile Trp Pro Ile Ile Val Arg Val Gly Glu Arg Met Asp Thr Thr Ala
485 490 495
Arg Ile Tyr Ser Pro Asn Ala Val Ile Val Val Pro Ser Ser Val Thr
500 505 510
Ile Pro Arg Thr Asp Lys Gly Ser Ile Ala Arg Lys Glu Val Phe Gln
515 520 525
Leu Leu Glu Lys Glu Ile Ser Gln Val Tyr Glu Asp Leu Glu Asn Gly
530 535 540
Ser Ile Glu Glu Thr Pro Leu Asp Tyr Asp Lys Leu Glu Gln Glu Leu
545 550 555 560
Lys Gly Leu Ile Gln Lys Arg Leu Lys Leu Arg Val His Pro Gly Lys
565 570 575
Trp Thr Val Asp Asp Asn Leu Phe His Leu Gly Leu Asp Ser Leu Gln
580 585 590
Ala Thr Thr Leu Arg Arg Ile Leu Leu Ser Ala Ala Ser Lys Thr Pro
595 600 605
Pro Asp Val Ile Gly Lys Asp Phe Ile Tyr Val Asn Pro Ser Val Lys
610 615 620
Ala Ile Ala Asn Ala Leu Arg Pro Ala Asn Gly Pro Ile Gly Thr Glu
625 630 635 640
Ser Ala Ser Val Ala Gln Glu Val Asp Asp Tyr Ala Gln Gln Tyr Ser
645 650 655
Ile Lys Gly Phe Glu Val Gln Asp Ile Val Pro Lys Ala Ser Pro Lys
660 665 670
Leu Ile Arg Gly Ala Val Val Leu Leu Thr Gly Ser Ser Gly Gly Leu
675 680 685
Gly Ser His Ala Leu Gly Lys Leu Ala Glu Ser Thr Gln Val Ala Lys
690 695 700
Ile Val Cys Leu Gln Arg Lys Arg Pro Gly Thr Val Ile Asn Pro Ile
705 710 715 720
Pro Gly Ala Ala Lys Val Asp Arg Ala Ser Ile Glu Ala Lys Gly Ile
725 730 735
Lys Leu Thr Asp Asp Gln Trp Ala Lys Ile Thr Ala Leu Glu Ile Asp
740 745 750
Pro Thr Ile Asp Asn Leu Gly Leu Pro Ala Met Val Met Gly Met Val
755 760 765
Ser Lys Thr Val Thr His Ile Leu His Ala Ala Trp Pro Met Asp Phe
770 775 780
His Met Arg Leu Pro Ser Phe Gly Tyr Gln Phe Ser Tyr Leu Lys Asn
785 790 795 800
Leu Leu Arg Ile Ala Val Gln Ala Pro Gln Lys Val Arg Phe Leu Phe
805 810 815
Val Ser Ser Ile Ser Ala Leu Ala Lys Leu Gly Leu Ile Thr Pro Gly
820 825 830
Arg Pro Ile Pro Glu Glu Pro Leu Asp Val Glu Ser Ala Ala Cys Gly
835 840 845
Ile Gly Tyr Ala Asp Ala Lys Leu Val Cys Glu Lys Ile Leu Glu Glu
850 855 860
Ala Ala Ser Leu Tyr Asn Ser Asn Val Glu Val Val Ile Ala Arg Cys
865 870 875 880
Gly Gln Leu Ser Gly Ala Arg Lys Thr Gly Ala Trp Asn Val Ser Glu
885 890 895
Gln Ile Pro Met Leu Ile Arg Thr Ser Gln Gly Leu Gly Ile Leu Pro
900 905 910
Ile Leu Glu Gly Thr Val Ser Trp Ile Pro Val Asp Asp Ala Ala Ala
915 920 925
Thr Val Ala Glu Leu Leu Phe Ala Pro Asp Ala Pro Gly Leu Val Thr
930 935 940
His Val Glu Asn Pro Val Arg Gln Ser Trp Ser Glu Val Phe Gln Ile
945 950 955 960
Ile Gly Asn Glu Leu Arg Ile Thr Lys Thr Leu Ser Phe Asp Asp Trp
965 970 975
Leu Gly Glu Val Thr Ser Thr Ala Glu Arg Asp Val Glu Asp Tyr Pro
980 985 990
Val Arg Lys Leu Tyr Glu Phe Phe Lys Leu Tyr Phe Arg Ile Ala Ser
995 1000 1005
Ser Gly Ala Val Val Met Gly Thr Asp Met Ser Arg Lys Asn Ser
1010 1015 1020
Ala Thr Leu Arg Cys Leu Lys Ala Leu Asp Arg Gly Thr Ile Ala
1025 1030 1035
Gly Tyr Val Arg Tyr Trp Arg Ser Val Gly Tyr Leu Arg Gln
1040 1045 1050
<210> 49
<211> 2116
<212> PRT
<213> 里氏木霉
<400> 49
Met Ala Asn Val Ser Gly Ile Val Phe Ser Pro Gln Ser Arg Ala Pro
1 5 10 15
Ser Lys Ala Tyr Leu Glu Tyr Ile His Asn Ser Leu Thr Arg Ser Ser
20 25 30
Ile Tyr Ser Pro Ile Cys Glu Ala Ile Ser Asn Leu Ser Ala Thr Trp
35 40 45
Trp Ala Ile Ala Asn Ser Gln Pro Lys Ile Ala Ser Leu Glu Gln Gly
50 55 60
Leu Asn Phe Ala Lys Asp Phe Ser Ala Trp Ile Glu Thr Gly Asn Ser
65 70 75 80
Ser Arg Leu Glu Thr Ser Met Ser Gly Ile Val Thr Leu Pro Leu Leu
85 90 95
Val Ile Ile His Thr Ile Gln Tyr Leu Glu Tyr Leu Arg Gln Asn Cys
100 105 110
Ile Thr His Ser Glu Leu Leu Pro His Leu Arg Ala Gly Gly Val Gln
115 120 125
Gly Phe Cys Ala Gly Leu Met Met Ala Ile Val Val Ala Ala Ser Lys
130 135 140
Asp Glu Thr Gln Leu Val Glu Asn Ser Ala Lys Ala Val Arg Ile Ala
145 150 155 160
Phe Ala Ile Gly Ser Tyr Gly Glu Ile Gly Cys Asp Ala Asn Ser Ile
165 170 175
Ile Ser Thr Thr Met Val Val Arg Leu Lys Arg Gly Ser Glu Arg Glu
180 185 190
Gln Ile Ile Arg Glu Phe Pro Glu Ser Arg Ile Ser Ala Val Ser Asp
195 200 205
Pro Lys Thr Val Ser Ile Ile Ala Ser Ser Ser Gln Ile Ala Ala Met
210 215 220
Gln Ala Tyr Ile Glu Glu Leu Gly Leu Ser Phe Lys Met Val His Met
225 230 235 240
Arg Ser Asn Ile His Asn Pro Lys Asn Val Ala Leu Ala Lys Glu Leu
245 250 255
Leu Gly Leu Cys Leu Arg Asp Ala Asp Trp Gln Leu Pro Asn Ser Asp
260 265 270
Cys Ile Gln Val Ala Val Arg Ser Asn Ser Thr Gly Gln Ile Leu Ser
275 280 285
Gly Cys Ser Leu Thr Ala Glu Val Ile Asn Thr Ile Leu Thr Ser Cys
290 295 300
Cys Asp Trp Asp Arg Val Met Asn Asn Val Ala Gln Asp Leu Arg Arg
305 310 315 320
Phe Gly Lys Ser His Arg Ile Ala Met Val Gly Leu Gly Asp Cys Leu
325 330 335
Pro Leu Pro Pro Phe Gln Lys Ile Gly Ile Glu Ile Thr Lys Val Asp
340 345 350
Val Met Ser Asn Thr Glu Asp Ala Arg Arg Arg Thr Asn Asp Ala Asn
355 360 365
Ile Ser Arg Arg Ala Thr Phe Pro Ser Asp Ser Val Ala Val Val Gly
370 375 380
Ala Ala Cys Arg Leu Pro Gly Ala Asn Thr Leu Asp Glu Leu Trp Asp
385 390 395 400
Leu Ile Ser Arg Gly Glu Ser Arg Leu Glu Thr Leu Arg Gln Asp Arg
405 410 415
Val Arg Leu Glu Glu Ser Phe Arg Ala Ser Gln Asp Lys Asp Trp Thr
420 425 430
Thr Arg Arg Gln Trp Phe Gly Asn Phe Val Asp Cys Val Asp Glu Phe
435 440 445
Asp His Gly Phe Phe Gly Ile Ser Glu Lys Glu Ala Ala Tyr Met Asp
450 455 460
Pro Gln Gln Arg Leu Leu Leu Thr Cys Ala Tyr Glu Ala Leu Asp Ser
465 470 475 480
Ser Gly Tyr Leu His His His Ala Arg Ala Asn Gly Asp Pro Ile Gly
485 490 495
Cys Phe Ile Gly Ala Ser Tyr Thr Glu Tyr Asn Glu Asn Thr Asn Ala
500 505 510
Tyr Ala Pro Ser Ala Phe Ala Ala Thr Gly Thr Ile Arg Ala Phe Leu
515 520 525
Ser Gly Lys Ile Ser His Tyr Phe Gly Trp Thr Gly Pro Ser Glu Val
530 535 540
Ile Asp Thr Ala Cys Ser Ala Ser Leu Val Ala Val His His Ala Ile
545 550 555 560
Arg Ala Ile Gln Ser Gly Asp Cys Ser Met Ala Leu Ala Gly Gly Val
565 570 575
Asn Ile Leu Thr Gly Val His Asn Tyr Ile Asp Leu Gly Arg Ala Gly
580 585 590
Phe Leu Ser Arg Thr Gly Gln Cys Lys Pro Phe Asp Glu Ser Ala Asp
595 600 605
Gly Tyr Cys Arg Ala Asp Gly Val Gly Ile Val Val Leu Lys Pro Leu
610 615 620
Lys Gln Ala Ile Ala Asp Gly Asn His Ile Met Gly Val Ile Ser Ala
625 630 635 640
Thr Ala Thr Asn Gln Gly Gly Leu Ser Gln Gly Ile Thr Val Pro His
645 650 655
Gly Asp Ala Gln Arg Ala Leu Tyr Cys Arg Ile Leu Lys Thr Ala Asn
660 665 670
Ile Glu Pro Asp Gln Val Thr Tyr Val Glu Ser His Gly Thr Gly Thr
675 680 685
Gln Val Gly Asp Pro Ile Glu Val Ser Ser Ile Arg Glu Val Phe Gly
690 695 700
Gly Pro Ser Arg Gln Ser Val Val Tyr Ile Ala Ser Leu Lys Ala Asn
705 710 715 720
Val Gly His Ser Glu Thr Ala Ala Gly Val Ala Ser Leu Leu Lys Val
725 730 735
Leu Thr Met Phe Ala His Lys Ala Ile Pro Pro Gln Ala Gly Phe Lys
740 745 750
Thr Leu Asn Pro Lys Ile Pro Ala Val Glu Pro Asp Asn Met Met Ile
755 760 765
Ala Ala Gln Leu Met Pro Trp Asp Ser Lys Ile Arg Met Ala Cys Val
770 775 780
Asn Ser Tyr Gly Ala Ser Gly Ser Asn Ala Ala Leu Ile Cys Ala Glu
785 790 795 800
Trp Thr Ala Glu Ile Ala Arg Pro Arg Ala Gly Ala Pro Thr Tyr Pro
805 810 815
Val Phe Leu Ser Ala His Thr Lys Asp Ala Leu Arg Asp Ser Ala Ile
820 825 830
Arg Leu Ala Ser Tyr Phe Gln Ser Pro Gly Lys Ala Leu Ser Ile Gly
835 840 845
Ser Val Ala Phe Thr Leu Ser Glu Arg Arg Lys His His Arg Tyr Arg
850 855 860
Trp Ser Thr Ser Ala His Ser Leu Ser Asp Leu Thr Arg Gln Leu His
865 870 875 880
Ala Gly Val Met Glu Gly Ile Val Glu Ser Pro Asn Thr Arg Met Pro
885 890 895
Val Val Leu Ala Phe Ser Gly Gln Ser Arg Thr Lys Ile Gly Leu Asp
900 905 910
Pro Thr Leu Cys Glu Leu Tyr Pro Gln Phe Arg Arg Tyr Leu Glu Asn
915 920 925
Cys Asn Asp Ile Leu Arg Ser Leu Gly Tyr Ser Asp Ile Met Ser Ser
930 935 940
Leu Ile Gln Thr Asp Ala Val Thr Asp Val Val Ile Leu His Ala Gly
945 950 955 960
Thr Phe Ala Val Gln Tyr Ala Cys Ala Arg Ser Trp Leu Glu Gly Gly
965 970 975
Leu Gln Val Asp Ala Val Ile Gly His Ser Leu Gly Glu Leu Thr Ala
980 985 990
Leu Ala Val Ser Gly Val Leu Ser Leu Glu Asp Ala Leu Gly Leu Val
995 1000 1005
Ala Lys Arg Ala Leu Leu Ile Glu Arg Lys Trp Gly Ser Glu Pro
1010 1015 1020
Gly Ser Met Leu Ala Ile Tyr Ser Asp Leu Glu Thr Val Gln Gln
1025 1030 1035
Ile Val Ala Ser Ser His Thr Thr Val Val Glu Asp Gly Leu Glu
1040 1045 1050
Ile Ala Cys His Asn Ser Pro Asn Ala His Val Val Val Gly Lys
1055 1060 1065
Arg Ala Ser Ile Ala Arg Val Lys Lys Leu Ile Asp Ser Asn Pro
1070 1075 1080
Gln Phe Gln Gly Thr Arg His Gln Arg Leu Asp Val Ser His Gly
1085 1090 1095
Phe His Ser Arg Leu Thr Asp Pro Leu Leu Pro Asp Leu Ile Lys
1100 1105 1110
Phe Ala Asn Ser Leu Thr Phe Asn Glu Pro Leu Ile Pro Leu Glu
1115 1120 1125
Thr Cys Thr Glu Ser Pro Val Leu Ser Ile Thr Pro Lys Tyr Ile
1130 1135 1140
Ala Glu His Ser Arg His Ala Val Tyr Phe Thr His Ala Ile Arg
1145 1150 1155
Arg Leu Glu Arg Arg Leu Gly Pro Cys Thr Trp Leu Glu Ala Gly
1160 1165 1170
Trp His Thr Pro Ile Ile Pro Met Ala Lys Lys Ala Val Ala Met
1175 1180 1185
Pro Glu Ile His Asn Phe Gln Ser Leu Ser Gly Ser Ala Val Ala
1190 1195 1200
Val Ser Asn Val Thr Ala Ala Leu Trp Lys Gln Gly His Ser Ile
1205 1210 1215
Ser Trp Trp Gly Phe Leu Ser Pro Gly Asp Ser Gln Leu Asp Gln
1220 1225 1230
Ile Trp Leu Pro Pro Phe Ser Phe Gln Pro Ser His His Trp Leu
1235 1240 1245
Glu His Val Asp Arg Val Thr Lys Val Gln His Pro Asp Ser Lys
1250 1255 1260
Val Leu Gln Gln Arg Ser Arg Leu Val Ser Phe Val Lys Val Ser
1265 1270 1275
Ala Thr Gly Asp Glu Phe Gln Leu Leu Arg Gln Cys Glu Lys Tyr
1280 1285 1290
Ser Asn Ile Val Lys Gly His Ala Val Arg Gln Arg Pro Leu Cys
1295 1300 1305
Pro Ala Ser Leu Tyr Met Glu Ile Ala Val Met Cys Ala Gln Glu
1310 1315 1320
Arg Gly Phe Asp Phe Asn Glu His Thr Ile Lys Phe Arg Glu Ile
1325 1330 1335
Val Phe Ser Asn Gly Leu Gly Cys Asp Asn Ser Arg Asp Val Arg
1340 1345 1350
Val Val Leu Ala Gln Asn Leu Asp Ser Thr Ala Asp Gly Ala Trp
1355 1360 1365
Asn Phe Ser Val Asn Ser Ser Lys Lys Gly Asp Ala Lys Ser Val
1370 1375 1380
Arg Thr Met His Ala Ile Gly Gln Phe Ala Ala Leu Ser Glu Ala
1385 1390 1395
Ser Asp Phe Arg Ile Tyr Glu Gly Leu Ile Ser Asp Arg Met Ala
1400 1405 1410
Leu Leu Pro Lys Asp Pro Asn Ala Glu His Leu Lys Arg Arg Thr
1415 1420 1425
Ala Tyr Ala Val Phe Ser Arg Val Val Glu Tyr Ala Glu Leu Leu
1430 1435 1440
Arg Gly Ile Ser Ser Ile Thr Leu Ser Glu Asp Gln Ala Ile Ala
1445 1450 1455
Glu Ile Glu Leu Pro Ala Glu Ala Ser Thr Asn Cys Asp Ser Thr
1460 1465 1470
Val Asp Arg Phe Met Asp Ala Ile Ser Leu Asp Thr Phe Ile Gln
1475 1480 1485
Val Leu Gly Leu Leu Ile Asn Ser Arg Leu Asn Thr Val Gly His
1490 1495 1500
Glu Ile Phe Val Ala Thr Ser Ile Glu Asn Met Thr Ile Leu Pro
1505 1510 1515
Cys Asp Phe Lys Thr Gln Lys Arg Trp Ser Val Tyr Ala Met Phe
1520 1525 1530
Gly Met Lys Gly Asp Arg Gln Ala Ile Gly Asp Val Phe Val Phe
1535 1540 1545
Ser Pro Glu Gly Arg Leu Val Ile Leu Gly Ser Gln Ile Ser Phe
1550 1555 1560
Thr Arg Ile Lys Ala Ser Ile Leu Glu Glu Leu Leu Asp Arg Asn
1565 1570 1575
Tyr Ser Glu Ser Val Met Val Lys Ala Gln Arg Ala Glu Gly Pro
1580 1585 1590
Ala Ala Ser Gly Val Met His Arg Ile Arg Thr Gly Glu Ala Ile
1595 1600 1605
Ala Ala Gly Ser Ser Val Leu Pro Val Asp Ser Leu Pro Ala Lys
1610 1615 1620
Ser Glu Glu Pro Ala Tyr Asn Phe Asp Asp Ala Lys Val Leu Ile
1625 1630 1635
Ala Ser Tyr Ile Gly Leu Thr Ala Ser Glu Ile Arg Lys Glu Glu
1640 1645 1650
Ser Phe Ser Ser Leu Gly Leu Asp Ser Leu Ser Ser Val Glu Leu
1655 1660 1665
Ala Asp Glu Leu Arg Val Lys Phe Gly Ile Glu Val Ser Pro Ser
1670 1675 1680
Asp Leu Leu Thr Met Gln Val Gly Glu Leu Glu Gln Gly Gly Pro
1685 1690 1695
Ser Gln Gly Thr Asp Ser Ile Asp Val Gln Glu Gln Asp Leu Pro
1700 1705 1710
Gln Ser Ile Asn Arg Arg Val Asn Gly Leu Ala Asn Gly Arg Val
1715 1720 1725
Ala Gln Ala Ser Gly Leu Arg Asn Gly Leu His Asp Gly Cys Ser
1730 1735 1740
Asn Asn Asn Val Ser Gly Gln Val Lys Asp His Ala Tyr Ser Tyr
1745 1750 1755
Ala Ser Lys Thr Asn Gly His Leu Glu Lys Pro Leu Arg Arg Pro
1760 1765 1770
His Tyr Ala Arg His Arg Val Gln Thr Val Thr Tyr Lys Glu Val
1775 1780 1785
Asp Gly Ile His Ile Leu Ala Asp Met Phe Ile Pro Leu Glu Pro
1790 1795 1800
Pro Ser Glu Ala Met Pro Ile Ala Leu Met Ile His Gly Gly Gly
1805 1810 1815
His Leu Thr Leu Ser Arg Lys Ala Ile Arg Pro Ser Gln Thr Ser
1820 1825 1830
Phe Leu Leu Ala Asn Gly Leu Leu Pro Ile Ser Leu Asp Tyr Arg
1835 1840 1845
Leu Cys Pro His Val Asn Val Leu Asp Gly Pro Met Ala Asp Val
1850 1855 1860
Arg Asp Ala Tyr Ala Trp Ala Arg Lys Glu Val Pro Leu Leu Leu
1865 1870 1875
Arg Glu Ala Gly Met Cys Val Asp Gly Ser Lys Ile Val Val Val
1880 1885 1890
Gly Trp Ser Thr Gly Gly His Leu Ala Met Thr Thr Ala Trp Thr
1895 1900 1905
Ala Pro Ala Ala Gly Leu Pro Pro Pro Leu Ala Val Leu Ala Phe
1910 1915 1920
Tyr Cys Pro Thr His Tyr Asp Pro Ser Asp Asp Ser Leu Arg Met
1925 1930 1935
Gly Lys Asp Tyr His Ser Arg Thr Met Ser Met Ser Glu Ile Arg
1940 1945 1950
Lys Ala Leu Gly Thr Gln Thr Ala Ser Ser His Ala Phe Ser Ser
1955 1960 1965
Thr Asp Thr Thr Gly Leu Gly Trp Leu Glu Pro Gly Asp Pro Arg
1970 1975 1980
Ser Glu Leu Val Leu Ala Leu Val Lys Glu Gln Asn Gly Val Ser
1985 1990 1995
Leu Leu Leu Asp Gly Val Pro Thr Asp Gly Asn Thr Phe Gln Ala
2000 2005 2010
Pro Glu Pro Glu Arg Val Thr Ala Ile Ser Pro Leu Ser Gln Val
2015 2020 2025
Arg Leu Gly Thr Tyr Arg Thr Pro Thr Phe Val Ile Ile Gly Asp
2030 2035 2040
Glu Asp Glu Val Val Pro Phe His Ser Ser Val Asp Phe Val Asp
2045 2050 2055
Ala Leu Arg Thr Gln Gly Ile Arg His Gly Phe Ile Pro Val Pro
2060 2065 2070
Gly Gln Arg His Ile Phe Asp Leu Thr Leu Ala Pro Gly Met Ala
2075 2080 2085
Lys Trp Glu Glu Tyr His Lys Tyr Thr Ala Leu Pro Val Glu His
2090 2095 2100
Gln Asn Gly Ile Pro Gln Ser Met Arg Asp Ile Asp Thr
2105 2110 2115
<210> 50
<211> 518
<212> PRT
<213> 里氏木霉
<400> 50
Met Ala Val Pro Glu Lys Cys Thr Val Leu Val Ile Gly Gly Gly Pro
1 5 10 15
Ala Gly Ser Tyr Ala Ala Ser Ala Leu Ala Arg Glu Gly Val Asp Thr
20 25 30
Val Leu Leu Glu Ala Asp Lys Phe Pro Arg Tyr His Ile Gly Glu Ser
35 40 45
Met Leu Ala Ser Met Arg His Phe Leu Arg Phe Ile Asp Val Asp Ser
50 55 60
Val Phe Asp Ser Tyr Gly Phe Thr Lys Lys Val Gly Ala Ala Phe Lys
65 70 75 80
Leu Asn Pro Lys Lys Arg Glu Gly Tyr Thr Asp Phe Leu Ala Ala Gly
85 90 95
Gly Pro Gln Asn Tyr Ala Trp Asn Val Val Arg Ser Glu Ala Asp His
100 105 110
Leu Leu Phe Gln His Ala Ala Ser Ser Gly Ala Lys Thr Phe Asp Gly
115 120 125
Val Gln Val Lys Ser Ile Asn Phe Ile Gly Glu Pro Cys Glu Gly Phe
130 135 140
Gly Glu Leu Pro Tyr Asp Tyr Pro Gly Arg Pro Tyr Ser Ala Thr Tyr
145 150 155 160
Leu Met Lys Asp Asp Lys Thr Ser Arg Glu Ile Lys Phe Asp Tyr Ile
165 170 175
Ile Asp Ala Ser Gly Arg Val Gly Leu Leu Ser Thr Lys Tyr Leu Lys
180 185 190
Asn Arg Lys Tyr Asn Gln Gly Leu Lys Asn Val Ala Thr Trp Gly Tyr
195 200 205
Trp Lys Gly Ala Ala Ala Tyr Gly Val Gly Thr Pro Arg Gln Asn Ser
210 215 220
Pro Phe Phe Glu Ala Leu Gln Asp Glu Ser Gly Trp Ala Trp Leu Ile
225 230 235 240
Pro Leu His Asn Gly Thr Thr Ser Val Gly Ile Val Met Asn Gln Lys
245 250 255
Met Ser Ala Asn Arg Lys Ser Gln Ala Gly Ser Pro Asp Ser Lys Thr
260 265 270
Phe Tyr Leu Gly Asn Leu Lys Gln Leu Ala Pro Glu Leu Ser Lys Leu
275 280 285
Leu Glu Asn Ala Glu Leu Leu Thr Asp Ile Lys Ser Ala Ser Asp Tyr
290 295 300
Ser Tyr Ser Ala Thr Ala Tyr Ala Ile Pro Tyr Ala Arg Ile Ala Gly
305 310 315 320
Asp Ala Gly Cys Phe Ile Asp Pro Tyr Phe Ser Ser Gly Val His Leu
325 330 335
Ala Phe Val Gly Gly Leu Ser Ala Ala Thr Thr Ile Ser Ala Ala Ile
340 345 350
Lys Gly Gln Val Ser Glu Val Glu Ala Ala Asp Trp His Ser Lys Lys
355 360 365
Val Ala Asp Ser Tyr Ile Arg Phe Leu Leu Val Val Leu Ser Ala Tyr
370 375 380
Arg Gln Ile Arg Ser Gln Glu Glu Ala Val Leu Ser Asp Phe Asp Glu
385 390 395 400
Asp Asn Tyr Asp Arg Ala Phe Ala Phe Phe Arg Pro Ile Ile Gln Gly
405 410 415
Ile Ala Asp Val Asp Thr Lys Leu Ser Lys Glu Glu Leu Lys Lys Thr
420 425 430
Leu Glu Phe Cys Ser Asn Ala Phe Glu Pro Val Lys Pro Glu Asp Arg
435 440 445
Ser Ser Met Leu Glu Gln Leu Gly Lys Cys Pro Asn Thr Ala Tyr Gln
450 455 460
Val Asp Leu Ser Pro Asp Gln Arg Thr Val Val Asp His Ile Arg Ala
465 470 475 480
Arg Gln Met Met Arg Thr Glu Asp Thr Met Asn Ile Ser Ser Phe Gly
485 490 495
Thr Asp Ser Ile Asn Gly Phe Val Pro Lys Leu Lys Thr Gly Asp Leu
500 505 510
Gly Leu Val Ala Lys Ala
515
<210> 51
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 51
cgcaccacct tcaaaatgcg ttcgtttgtg aaggccaac 39
<210> 52
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 52
atgtactcct ggtactcact gcctcagata gcctaccg 38
<210> 53
<211> 3309
<212> DNA
<213> 里氏木霉
<400> 53
atgcgttcgt ttgtgaaggc caacgttgat ttctcctctg cagagagaaa ggaggactat 60
atacactctc tgccagagtt ggttgacttc aatgctgttc aaaaccccaa tcaccttctt 120
tgcatccagg cccgatcaaa cgcgccatgg gtcaaaatca ccaatgctca attcaaggtc 180
gcgattgacc aatgcgccac atggattgcg gaaaacgtca agctgcccaa ggccaggaca 240
aagcatgatc ttacagggag actgccggtt gctctgctga tggagagtga ctttggtctc 300
ctggtgcacc agttcgctct tgtgtctatg ggcattcccg tgcgtaattt cattccgagc 360
ctcctccgtg cttctctgac ttggctagcc acttgtcctc tccgctcgtc tgagtcctga 420
agccatcttc cacctcctgc gaagtactga agcttcatct ctcattgttt ctcaaagggt 480
cgccatgatc accaaaggag ctttcgggaa tgtcaagacc agtgactttc atgttgctca 540
gccgtacagc actttctgca atgtcccggc agacaaaagc gtcaggaagc agtcggttta 600
cccggataac attgacgcca acattgtgct tctgcactcc tctggaacta caggccttcc 660
gaagccaatc gctctgagcc acagacagct catgttttcc gtcagtcacg gtgacttcga 720
aacagaagag gaggctcaag gaattgtcat ctctacattg cccctgttcc atggcttcgg 780
gcttcttgca ccaggactct cgatggctat tggaaagaca gtgtgctttc ccgcctcgga 840
cgaagttccc gatgctcaat caattgtcga tcttatcaac atgtctggcg caactggcat 900
gctgactgtg cctttccttc tcgaaaacat ggctgctctg ccgaacggaa ccggtctgag 960
ggctctggcc aaattggact ttgttggaac cggaggaagt gctctgagtg ctgacttcgg 1020
agtatctgcg tcagctgcgg gcgtcaagct actgaacctc tacgggacaa ctgaaacggg 1080
cccgttgacg aagacatttg cgcctaaatc gggttacgac tggaaatact tcagactccg 1140
acaggatatg ctgttcaagg tcacggagct ccccccagtt gacggcgaga aaaggttcag 1200
gctgacggta ttcccatttg gtgccgataa gccattcgag attgccgatc aactcattcg 1260
aagcgagaag ttccccgaga cggattttgc cgctgtcgga cgcgacgacg atgtcgttgt 1320
tcttgcaact ggcgagaagg tcaacccatt attattggaa accgccctga ctgattctgg 1380
actggtcaaa tcagcgattg tatttggcga gaaccagttc cagataggtg tcgtcgtcga 1440
gcctgcaact cctctaaatc ccgaccagaa ggaggaattc aggaaaaaga tttggcctat 1500
cattgtacgc gtaggagaac gcatggacac caccgcgaga atctactcgc ccaatgccgt 1560
gattgtcgtt ccgtcatccg tcacaatccc gagaaccgac aaaggatcaa ttgctcgaaa 1620
agaggtcttc caactgctcg aaaaggaaat ttcacaggtt tatgaggacc tcgagaacgg 1680
ctccattgaa gaaacaccac tcgactacga taaactcgag caagaactca agggactgat 1740
tcagaaaaga ctcaaactga gagtccatcc tgggaaatgg acagttgatg acaacttgtt 1800
tcatctgggc ctcgactctc tacaagccac aacgctgcga cgcatccttc tttcagctgc 1860
ttcaaaaacg cctccagacg tcattgggaa agattttatc tatgtaaatc cctccgtcaa 1920
agccatcgca aacgctctga gacccgccaa cggccccatt ggcacggaga gcgcatcggt 1980
tgcacaggaa gtagatgatt atgcccagca gtattccatc aagggctttg aagtgcaaga 2040
tatagtgcca aaagcttctc ccaagcttat ccggggagca gtggtgcttc tgacaggcag 2100
ctcaggtggc ctgggatccc acgcgctggg gaaacttgcc gagtccaccc aagttgccaa 2160
gatcgtctgc ttgcaacgaa agcggccagg caccgtcatc aaccccattc caggggcagc 2220
caaggtcgac agagcctcta ttgaagccaa gggcattaaa ttgaccgacg atcaatgggc 2280
aaagattacg gcgctagaaa ttgatccaac catagacaac ttggggcttc ctgcgatggt 2340
catgggcatg gtgtcgaaga cggtcaccca tatcttgcac gcagcttggc ccatggattt 2400
ccacatgcgg ctgccatcct tcggctacca gttttcatat ctcaagaatc ttttgagaat 2460
cgctgttcaa gcgccgcaaa aggtccgttt tctctttgtc tcgtccattt ccgccctcgc 2520
caagctaggg ctcatcactc ctggaagacc catcccagaa gagcccctgg atgtggaaag 2580
cgccgcctgt ggcatcggat acgccgatgc aaagttggtt tgtgagaaga ttctcgaaga 2640
ggcagcctca ctctacaata gcaatgtgga ggtagtaatc gcccgatgcg gacagctgag 2700
tggcgctcgg aagacgggag cgtggaacgt cagtgagcag attcctatgc ttatccgcac 2760
ctctcagggc ctaggaattc tgcccatatt ggaaggagta tgcacttttc ctacctcacc 2820
ccattcattc catgactgtc aacgagtata cacgcccctc ggtcacgact cgataagcac 2880
taacttttga taccacagac tgtttcctgg atcccggtag atgatgctgc agcaacggtg 2940
gcagaacttc tattcgcgcc agacgctcca ggcctggtca cgcacgtaga gaacccggtc 3000
agacagtcct ggtccgaggt ctttcagatc atcggtaacg agctccgcat cacaaagacg 3060
ctctcctttg acgactggct gggggaggtc acatcaacgg ccgaaaggga cgtcgaggat 3120
tatcccgtaa ggaagctgta cgagttcttc aagctttatt tccgtatcgc gtcttcaggg 3180
gcagttgtca tggggactga tatgagccgc aagaactcag ctacactacg ttgtctcaag 3240
gccctggaca gaggaaccat tgctggatat gttaggtact ggagatcggt aggctatctg 3300
aggcagtga 3309
<210> 54
<211> 1487
<212> DNA
<213> 酱油曲霉
<400> 54
taagtactca tttatacaat agttgcagaa ccccgcgcta cccctccatt gccaacatgt 60
cttccaagtc gcaattgacc tacagcgcac gcgctagcaa gcaccccaat gcgctcgtga 120
agaagctctt cgaggttgcc gaggccaaga aaaccaatgt caccgtttcc gccgacgtga 180
caaccaccaa agagctgctg gatttggctg accgtatgcg caccggggat gccacttaca 240
tatgatctag taatggttaa tggtggaata tataacagga ctcggtccgt acattgccgt 300
gatcaaaact cacatcgata tcctctccga tttcagcgaa gagaccatca tcggtctgaa 360
ggcccttgca gagaagcaca atttcctcat cttcgaagat cgcaagttca tcgatatcgg 420
aaacacagtc caaaagcagt accatggcgg cactctgcgc atctctgagt gggcccacat 480
catcaactgc agtattctgc ccggtgaggg tatcgtcgag gctctggccc agactgcttc 540
ggccgaggac ttcccctatg gctctgagag gggccttttg atccttgcgg agatgacatc 600
caagggatct ttggctaccg gtcaatatac tacttcttct gttgactatg cccggaagta 660
taagaagttt gtgatgggat tcgtctcgac gcgtcacctg ggcgaggttc agtctgaagt 720
tagctcgcct tcggaggagg aggatttcgt cgtcttcacg acaggtgtca acctctcctc 780
gaagggagac aaactgggac agcaatacca gactcctgag tctgctgttg gacgcggtgc 840
cgactttatc attgctggtc gtggaattta tgctgctcct gatcccgtgg aggcagcgaa 900
gcggtaccag aaagagggat gggatgcata ccagaagcgt gttggtgcgc aataagtagt 960
ggtgaatacg tgctcttttt atggcagtat atcgcaagta tgatgcgatt cataaattca 1020
gcagtcgaat tctacgagag aacgatgcta agagataccc tctctatatg aataatatgc 1080
ctgcctcgag atatggacat attcaagatc agagttaagg gtcatgtttc aaaatcacac 1140
caatctccaa catagacgag aatttttacc ggattgtctg aaggtgcagc tggagattgg 1200
tctattttct aagagtgggg tatcactaat gtacagtcgg tcactatcgt acaaacaatc 1260
acaattatat acaagatttc ccatcacccc ttactctaac atggcacttt tatccatcga 1320
gtccgagcct agccaccatt tggtgctttc gtagagacca aagtataacc ctgatccgac 1380
agcggccata aacgtgttga tagcacaccc tcggaatagt cctctcgggc catctgttcg 1440
tataatctcc cgtacggtat tgatcatcct tttcttctga ggtgcgg 1487
<210> 55
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 55
cgcaccacct tcaaaatgct atcagccatg gccaatgta 39
<210> 56
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 56
atgtactcct ggtacctacg tgtcgatgtc ccgcatact 39
<210> 57
<211> 6782
<212> DNA
<213> 里氏木霉
<400> 57
atgctatcag ccatggccaa tgtatcagga atcgtctttt ctccccagag ccgtgcgccg 60
tcaaaggcgt atctggagta tatccacaac tcacttacca gatcgtccat atactcgccc 120
atttgcgaag caatctccaa cctttccgcg acgtggtggg ctattgcaaa cagccagcca 180
aagatcgcct ccctggagca aggcctgaat tttgcaaaag acttttcagc atggattgag 240
acgggaaatt cttcaaggct ggagaccagc atgtcgggga tcgtcacgtt acctctgctg 300
gtcatcatac atacgattca gtatctcgag tatctacggc aaaactgtat cacacactcg 360
gaactgctac ctcatttgcg ggcaggtggg gtccaaggat tctgtgctgg attgatgatg 420
gccattgttg tggctgcgtc aaaggacgaa acacaactgg ttgagaactc cgccaaagct 480
gttcggatag cctttgcgat tgggtcatat ggagagattg ggtgtgatgc aaactcaatt 540
atttctacta ctatggtggt gcggttgaaa cggggctctg agagggagca aatcatccgc 600
gagttcccag aggtgtgata atctactcag ctccatctca ggagcacgca tgctaaagaa 660
gaatataaca gtcccgtatc tctgctgtat ccgaccccaa gacagtaagc atcattgctt 720
catcatccca aattgccgcc atgcaggcat atatagagga actaggcctc tccttcaaga 780
tggttcacat gcgaagcaac atacacaatc cgaaaaatgt cgctcttgcg aaagagctgc 840
tgggactctg cctacgcgat gccgactggc agttgcccaa cagcgattgt attcaggttg 900
ctgtacgatc caatagcaca ggtcagattc tttcaggctg ttcgctcaca gccgaggtta 960
tcaacaccat tcttacctct tgctgtgact gggacagagt catgaacaat gtagcgcaag 1020
atctccgccg attcgggaaa tctcatcgca tagcaatggt tggcctggga gactgcttac 1080
cgctcccgcc atttcagaag attggcatcg aaattaccaa ggtggatgtc atgagcaaca 1140
cggaggatgc aaggcgacgg acaaatgatg ctaatatctc aagacgggct acttttcctt 1200
ccgattcggt cgccgtagta ggcgcggctt gtcgattacc aggagcaaat accctcgacg 1260
aactctggga tctcatttct cgaggcgaat cgcggctgga aacgctgcgc caagatcggg 1320
tcaggctcga agagtctttt cgggcatcac aggacaagga ctggaccaca agacgacaat 1380
ggttcggaaa tttcgttgat tgtgtcgatg aatttgatca tggcttcttt ggcataagtg 1440
aaaaggaagc ggcatatatg gatccccagc agcggctttt gctcacttgt gcgtacgagg 1500
ctctggactc cagtggctac cttcatcatc atgcccgagc aaatggcgat ccgatagggt 1560
gcttcattgg cgcgagctat accgagtata acgagaacac caacgcatac gctccctctg 1620
catttgccgc aacagggacc attcgagctt ttctttcagg caagatcagc cattactttg 1680
gctggacggg gccgtccgag gtcattgaca cggcatgctc ggcgtcgctg gttgctgttc 1740
atcacgcaat tagggcgatt cagtctgggg attgctccat ggcccttgca ggcggtgtga 1800
atatccttac cggagttcac aactacattg atctcggcag agcgggattt ctcagtagaa 1860
cgggccagtg taaaccattt gatgaatcag cggatggcta ttgccgtgca gacggagtcg 1920
ggatcgttgt gttgaagcca ctcaagcaag caattgctga cgggaatcac attatgggcg 1980
tcatttctgc gacagctaca aaccagggcg gcttgtctca gggtatcaca gttccgcatg 2040
gagatgctca gagggcgctc tattgtcgaa tcctcaagac tgccaatatt gagccagatc 2100
aggtgacata tgtcgagtca cacggaacag gtactcaggt cggcgatcct atcgaagtct 2160
ccagcattcg cgaggtcttt ggagggccat cgcggcaatc agtggtgtac attgcgtccc 2220
tcaaagccaa tgtaggacac agtgaaactg ctgctggagt tgctagcctt ctgaaggtcc 2280
tcacaatgtt tgctcacaaa gccattcctc cgcaagctgg attcaagaca ctgaatccca 2340
agattcccgc tgttgagccg gataacatga tgattgccgc tcagctcatg ccgtgggatt 2400
cgaagatacg catggcctgt gtcaacagtt atggggcctc agggagcaat gcggcgctga 2460
tctgtgcaga atggaccgct gagatagcaa gaccgagagc gggtgcgccg acttacccag 2520
tctttctgag tgcgcataca aaagatgctc tgagagactc agccatccga ctggcctctt 2580
actttcagag tcccggaaaa gccttgagta ttggcagcgt agcctttaca ttgagcgaac 2640
gcagaaaaca ccaccgttat cgatggtcca cctctgcaca tagtctgtcc gacctgacca 2700
gacaactgca cgcgggtgtg atggaaggca ttgttgagtc tcccaacaca cgaatgccgg 2760
ttgttctggc cttttcaggt caatctagga cgaagatcgg cctcgacccg acactctgcg 2820
aattatatcc ccagttccgc cgttatctag agaactgcaa tgacatactg cgaagcttgg 2880
gctattcaga catcatgtct tcacttattc agaccgacgc cgtcacagac gttgtcattc 2940
tccatgcggg cacattcgct gttcaatatg cctgtgcgag aagttggcta gaaggcggat 3000
tgcaggttga cgcagtgatc ggtcacagtc tcggcgaatt gacggcgttg gctgtatccg 3060
gcgtgctgtc actggaggat gctctgggtc tggtcgcgaa gcgagctcta ttgatagaga 3120
gaaaatgggg ctcagaaccg ggatccatgt tggcgattta ctcagatctc gagactgtgc 3180
agcagatcgt tgcaagctca cacacgacag tcgtggagga tggccttgag atcgcctgcc 3240
acaacagccc taacgctcat gttgttgttg gaaagcgagc gtctattgcg agagttaaaa 3300
agcttataga cagcaatccg cagtttcaag gcacgcgaca tcagcgtctc gatgtgagcc 3360
acggctttca ctcgagattg acagacccgt tgctcccaga tctaatcaag ttcgccaata 3420
gcttgacgtt caatgagcct cttattccgc tagagacatg tacggagtcg cctgttctta 3480
gcatcacacc gaagtacatt gcagagcatt cgagacacgc agtgtatttt acacatgcca 3540
ttcggcgtct tgagcgccgt cttggcccat gcacctggtt ggaggcagga tggcatactc 3600
cgatcatccc catggcaaag aaagctgtcg caatgcctga gatacacaac tttcaatcat 3660
tgagtggctc ggcagtggcc gtctccaatg taacggctgc tctatggaaa caaggccatt 3720
caatttcctg gtggggtttt ctctccccag gagactcaca actcgaccaa atctggctgc 3780
cgccattttc gttccaacca tcccaccatt ggctcgaaca tgttgatcga gtgacgaaag 3840
tccagcatcc tgacagcaag gtgcttcagc agcgatctcg acttgtgagc ttcgtcaaag 3900
tatcggccac aggcgacgag ttccagctcc tcaggcagtg tgaaaaatac agcaacatag 3960
tcaaaggcca cgctgtgcgc caaaggcctc tttgtccagc ttccttgtac atggaaattg 4020
ccgtcatgtg tgctcaggag agaggttttg actttaacga gcacacgatc aaattccgcg 4080
agattgtctt ctccaacggc ctgggatgcg acaacagccg tgatgtgaga gtcgtgttgg 4140
cacaaaatct agactcaact gctgatggtg catggaattt ctcagtcaac agctcaaaaa 4200
aaggtgatgc gaagtctgta aggacgatgc atgcgattgg acagtttgct gctttatcag 4260
aggcgtccga ctttcgtata tacgaggggc tcatctcgga ccgcatggct ctcctcccca 4320
aggatccaaa cgcagaacac ctaaagagaa gaacggcgta tgctgtgttc tcgagagttg 4380
ttgagtatgc tgaacttctc agaggtatct cctcgatcac tttgtctgaa gatcaagcta 4440
tcgctgagat cgagctccca gctgaagcgt cgacgaactg cgatagcact gtcgaccgct 4500
ttatggacgc gatatctctg gatacattca tacaggttct cggcctgttg atcaactcaa 4560
gactcaacac tgtaggccac gagatctttg ttgcgacaag catcgagaac atgacaattc 4620
tcccttgcga cttcaagacc cagaaacgct ggagtgtgta cgccatgttc ggtatgaagg 4680
gtgatcgaca agccattgga gacgtctttg tattctctcc cgaaggcagg ctcgtcattc 4740
ttgggtcgca gataagtttc accaggatca aggcaagcat actagaagaa ttgcttgaca 4800
gaaactactc agaatccgtc atggtcaaag ctcagcgagc cgagggccca gctgcgtctg 4860
gtgtgatgca tcgcattcgc actggtgagg ctatcgctgc aggcagttct gtccttcctg 4920
ttgattcgct gccggcgaag tctgaagaac cagcttacaa cttcgacgac gcgaaggtgc 4980
ttatagcaag ttatattggt cttacggcgt ctgagattcg caaagaggaa agtttcagta 5040
gtctaggcct agactcactg tcttcagtcg aacttgccga tgagttgcga gttaagttcg 5100
gaattgaagt ttcgccaagt gacttgctca caatgcaagt gggcgagctt gaacaagggg 5160
gtccatcaca aggcacagac tcaattgatg tacaggaaca ggacctaccg cagtccataa 5220
acagacgtgt gaatggactt gcgaatggac gtgtcgctca agccagtggg ctgagaaacg 5280
gccttcatga tggatgcagc aataacaatg tgagcggtca agtgaaagac cacgcctata 5340
gctatgccag caagacaaac ggacatctag agaagcctct gagacgaccg cactacgcaa 5400
ggcaccgcgt tcagacggta acttacaaag aagtcgacgg catccacatt ctggcagaca 5460
tgttcattcc gctagagcca ccctcggagg ctatgcccat aggtacgcgg tagctggcca 5520
actcatccct gaaataagtc aactgacatg ttccattatc gatagcgctc atgatccacg 5580
gaggcggcca tttgacgctg tcgaggaaag ccattcggcc gtcccagaca tcctttctcc 5640
tagcaaatgg cttattgccc attagcctag actatcgact ttgccctcac gtcaatgtcc 5700
ttgatggacc tatggcagat gttcgagatg cctatgcctg ggcaagaaaa gaggttccat 5760
tgctgctgcg agaggcaggc atgtgcgtgg atggctcaaa gattgtcgtc gtcggctggt 5820
caacaggagg gcatttggca atgactactg cttggactgc tccagccgca ggtttgcctc 5880
ctcctttggc tgttttggca ttttactgcc ctacacatta cgatccttcg ggtatgttta 5940
gacatttcca ttggaaagac tttcgcaact ttgctaacaa ttaataaaag atgattcctt 6000
aagaatgggc aaagactacc attcccgcac aatgtcaatg tccgagatcc gaaaggcttt 6060
aggcacgcaa acagtatgtt cattcttttc gtcgctccac atatcatcat tactcatgca 6120
gacgtacagg catcgagtca cgcattcagt agtactgata caaccggtct gggctggctt 6180
gaaccaggag atccccgctc agagctggtg ctggctcttg tcaaagaaca gaacggtgtg 6240
tctcttttac tagatggtgt tcctactgat ggaaacacct tccaagctcc tgagcccgag 6300
cgagttacag ctatcagccc gctgtctcag gtccgcctcg gcacctatcg cacaccgacg 6360
tttgtcatca tcggcgacga ggatgaagtt gtccccttcc actcttcggt tgactttgtt 6420
gatgccctga gaacacaggg tatcagacac gggttcatcc cggtaccggg tcagcgacac 6480
attttcgacc tgacgcttgc accggggatg gcgaaatggg aagagtgggt ggctccaggc 6540
tacaaattct tgtttgacat ccttggtatt tcttccgatt gataccctct tccctcgagg 6600
agagtatggt gttgggcctg gctgtggggt tggcacaggc ggctagaagt ctcgcgtcaa 6660
gtttgggctc ttcttaaaaa tgggcaatta cgcattcatt gaacagatat cacaagtaca 6720
cggctctccc cgtggagcac caaaatggca ttccacaaag tatgcgggac atcgacacgt 6780
ag 6782
<210> 58
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 58
cgcaccacct tcaaaatgcc tccagcggta gtcaagaac 39
<210> 59
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 59
atgtactcct ggtacctaca taatcgttct gagatactc 39
<210> 60
<211> 963
<212> DNA
<213> 里氏木霉
<400> 60
atgcctccag cggtagtcaa gaactctgct tacactcctc ccacgaaagg catcctctct 60
tgcctgccat cctcatgggt tccctatgct gagctcattc gcctggacaa gccacatggc 120
atatatatga ctatatatcc ttacgccttg ggcctacttt atgccagcca acttacctca 180
gagtcgttgc ctccaaacgt ggtcctgagt cgatttctca acttggcgat atggaccttc 240
ttgatacgaa gcgccggctg tgcttggaac gacaacgttg atcaagactt tgacagacaa 300
actgcccggt gccgcgacag accgattgca cgaggcgcaa tctcgactct tcaaggtcat 360
gtcttcacca ccgctctatt ggctctcggg tttttgtcaa ttcaaaactt tcctcttgaa 420
tccaagattg atggcgctgc aactgtctta ttgacatgca tctacccctt tgggaagaga 480
ttcacgcatt tcgctcaggt taccttgggc ctaacgctgt ccgttgctat catattcggg 540
ccgcattctg tgggcgccaa ccccttgtca cagggcaatt tcttgccaac gacctgcctt 600
gtgtcgtcca tcattttgct cgtcatcttc tatgacgtag tctatgctcg tcaggatacg 660
gtcgatgatc tcaagtccgg agtcaaaggc atggccgtcc tctttcgcaa ctggatcacc 720
acgttgcttt tgaccctcat catagccatc ctaactcttc tatacatcac tgcacggtct 780
cttgacttgg gttgggtctt ctttggcttg tccgttgcag ggccagccgt cagcctcctc 840
acaacgattg ccctcatcgc cagcaaatcg agcagttcaa gatatgcggg caagttctat 900
gtgctagcca ttgccagcct gctcagtggc tttactatag agtatctcag aacgattatg 960
tag 963
<210> 61
<211> 1557
<212> DNA
<213> 人工序列
<220>
<223> 修饰基因
<400> 61
atggcagttc ctgaaaagtg taccgtgttg gttattggcg gcggtcctgc tggctcttac 60
gctgcctctg cccttgcccg agagggtgta gataccgtgt tgctcgaagc cgacaaattt 120
ccacgatatc acatagggga gagcatgctg gcctcgatgc gccatttcct gcgatttatc 180
gacgttgact ccgttttcga ttcctacggc tttacaaaga aggtgggggc cgcctttaag 240
ctcaacccga agaaacgcga gggttacacg gattttctcg cagcgggcgg tcctcaaaac 300
tatgcgtgga atgtcgtgcg gtccgaggcc gatcatctgc tgtttcagca tgccgcctcc 360
tccggggcca aaacttttga cggcgtccag gttaaaagta tcaacttcat tggggagcca 420
tgtgagggtt tcggcgaact accgtatgat tacccaggcc gtccctacag cgccacatac 480
ctcatgaaag acgacaaaac atcgcgcgag atcaagtttg attatatcat agatgcttcc 540
ggtcgcgtgg gactcctcag cacgaaatat ctcaagaatc gtaagtataa tcagggcctt 600
aaaaacgttg ccacctgggg ttattggaaa ggcgctgccg cttatggcgt cggcacgcca 660
cggcaaaact cgcctttttt tgaggccctt caggatgagt ccgggtgggc gtggctgatt 720
cccctgcaca atggcactac gtccgtcggt atcgtaatga atcaaaagat gtctgctaac 780
cgcaaaagtc aggcgggatc cccagactct aaaaccttct acctcggtaa tctcaagcaa 840
ctagctcctg agctctctaa acttctggag aacgcggagt tgcttactga cattaagagc 900
gcctcggatt actcatattc agctaccgct tacgctattc cgtatgctcg aatcgctggg 960
gatgctgggt gcttcatcga tccctacttc tcgtctggag tccatctggc tttcgtcggt 1020
ggtctgtctg cagcgactac aatcagcgcg gcaatcaagg gacaagtgag cgaagtagag 1080
gcggcggact ggcactctaa gaaggtcgcg gacagttata tccgtttcct gttggtcgtc 1140
cttagcgctt accgtcaaat ccggagccaa gaagaggcag tcttgtcaga tttcgatgag 1200
gacaactacg atagggcatt cgcattcttc cggcccatca tacagggaat tgcagatgtc 1260
gatacaaaat tgtcgaagga agaacttaag aagacacttg aattctgctc aaacgcattc 1320
gaacctgtta agccggaaga taggagttca atgttggaac agcttggaaa gtgccccaat 1380
accgcatacc aggttgactt gtcgcccgac cagagaaccg tggtggacca cattagggca 1440
agacagatga tgagaaccga agatactatg aacatttcaa gtttcggaac ggacagtatt 1500
aatggattcg tgccgaagct aaagactgga gacctaggac tagttgcaaa ggcgtga 1557
<210> 62
<211> 1000
<212> DNA
<213> 菌核生枝顶孢
<400> 62
aggctcagtg acgtcggagg ggcggcgggg cagtaactcg aagaggggga ggggctcgcc 60
caaaataatg gaggggcaat tcgagggctg gagatgacct ccgccgagat gcgcaataca 120
acgcacagag tcctgggatt gtagagtccg atctagaccg aatcttgtct ttagataatg 180
atagtaaaat ccccacgtcg aaaggcataa gatatccggg gctcaaagtc aagttcgtga 240
ctcacgccgc ggatgggcat caggggctcc attgaaatga gctcactggg accggcgcta 300
cgaaaaaata tccagaaaaa cgaaaattct gtgtctcgga gcctgaggat gaaccaagct 360
gctcgaacac tgcaccaagc agcacccggc ctaaaatgcc ctctgcacgc gtcttgcacc 420
cagctaaagc cacagattag tctagattag atcgggaacg tcaaggagct gcaaggcagt 480
cgagtttcca ggctgaagct ggcacacgac tccagggggc gacacttggg cacacaactg 540
attggaacct aacacctgtc cgcaactgca agtgctggaa ccatgatgag gtgaaagttc 600
aaacagtgaa aatttgaaca gcccacttac gcgctggcac caatcacact cggggacttg 660
ttgccatagt ggggcagcct atcgacccct catcttttga ggtcacttcc cctccaccat 720
ggtgatcctc ttttaaaccc ttcctcccct cccactcgca cagccgaatt ttctttcctc 780
tttgtccgca cacaccgatc gaacaagctt cgtcacctgc gcagtaagcc tccctcctct 840
cgcctgacga cctcgacgcg ctcctcagaa ccgtcgccat ccttactttc cgctcctcta 900
cgcaccatcg cgcgcgcttt cgagaatcgc tcggctgacc ttcgttgctc gaaatagaca 960
caaaaccaac caacaaaact catctctcaa taccgcaatc 1000
<210> 63
<211> 800
<212> DNA
<213> 菌核生枝顶孢
<400> 63
gcgccttcct ccatcggctt tatcgccttg ggtgctcgcg acgtagcttg tgctcacagg 60
ttactgtact tgcttctacg acgaaatgat actgcgatga cgatgatatc ttgggacgca 120
tgacgagtcg ggcgttggga tttaccgacc tcaccgtcgt atgtcaggac aacaaaagga 180
taactctaga tgtagagaaa atctgaacac ttttcctttg tagccacctc tttcagctgc 240
ccttgcacgt gtgaacctgg gtgttaatat ccttgtgctg ttcgtgcgcc gacctcaact 300
ttatgtcctg cgcctcagct atgtgacctt gggacaccct tagctcgaca attgacggca 360
gtctatgcgc tgattacaat aaatgctctg acgctattgt agatgctact aatttacatg 420
ttgtacagat cgcctgccgt cgtgctaaat catccctgaa gggtcccgtg aaacgccgtg 480
atgagatgcg aagctgactc tcaattttct tcctcacgtc tggagcccat cggcccgatg 540
gacttacctt gcgtagccaa atcctctgcc aaccccccct gcaacaactt gatcagcaat 600
tttgcttata tagtatccct cacttctcca acgtgtgact cccttttgca agcaatagtt 660
cgctagaaag tgtcaaaaga tgcgctgtaa cacctcgagg tgaacgcaat atgagcgcca 720
tctagctgtg cggcgagtgc cttggagtac atgatctcat gttcttctgg tgcccaactc 780
cgtgttcctg agcccccgtg 800
<210> 64
<211> 804
<212> DNA
<213> 苹果枝溃疡病菌
<400> 64
atgggcttca acgacatccc ccccgctcac gtgtcggctt ggtaccagcc cgtgtacaat 60
gcaacctttg ggtttgccgg gctatcctgg acactatgct acatgctcta cgcgcgccaa 120
ggcctgcgca ccaaatccta cggcatgccg ctgttcgccc tcgccaacaa ctttgcctgg 180
gaaatggtct acgcactgtc cgtggcagac gcgccgcgcg agaagacggc catggtcatc 240
tggatgctca tcgacatgcc catcatctac agtaccctca ggtacggcag agaagagtgg 300
tcgcatgccc cgatggtcag taggaaccta ggcaagatcc tcgtcacatt ggtcatgctg 360
tgtgccgtgg cgcattatag ctttgcgtcg tggtggatgg gcaaccacat cgctatgaag 420
agtggaaaag tctaccgcgg tgttgaaggc caagacgcca ctgaaatggc tttttgggcc 480
gtctccgttt gtcaagtcat tgtgtctact tcgtctctgg cacaattgat caccagacaa 540
cacaccggag gagttagttg gtcgatctgg gctctaaggt tctgcggtac gctggtaggc 600
ctcaacatca actacggttg ggcttggtac acttggacag aggctcatgg atattttatg 660
agtgctccgg gtgtttttct ctggggaatt accactctat gtgatgttgt ttatgcaatc 720
gtctttgctc aagttaggcg caacgagagg gttttgccgg atgggcgcaa ggcggcgccg 780
ttgcagtcga tcaagcgcgg ctga 804
<210> 65
<211> 1590
<212> DNA
<213> 菌核生枝顶孢
<400> 65
atgggtaact ctgccaacga agacaagttg cgctacgcct gtgaccgctg tcactcgcaa 60
aagcttcgtt gccctcgatc tgtcgagcca gaaaaggcca acccggaaga gccgtgctcg 120
agatgtcgaa aggcaggagt accttgtgtg gtcagcctgc gaggcaaggt cggtcgaccg 180
tcaaaggcca cgaagaagaa gtctgcacga tcgcctcgag cgacgtccac gccggaagct 240
gagtttccgc cctacgacat caactcagtt ctgagcggag aggtcgatgg cagcattcca 300
tgggcttcac catccggaga ccgcatgatg gatatgtttg acctggcctc tggttctggc 360
tcagtcacca catcagcatc cccaaaaacc atggctgagg actaccagcc agaggggcaa 420
cgaccattcc ccgatccatt aatgggccca ggcttgatcc aagtgagtgg caacgacact 480
agaggccttt cgaatccgaa ctcacaaaac aaggtgccct acgagccatt cctcatggaa 540
tttgacacgg atgccgacta ccctactttc tgcataccgc caagtctcac cgatatgccc 600
gcaggggtcg agttcaacca accacaagac aagaccttca actcctcaca aatggacagc 660
ttcatggacg ttaagaccga cgcatcaatg atgatgcctc acgcagacat ggacatgact 720
tcaccaaagg ggacgggacc aactattgac ccagtcaccg tcgatccgag aatgtccttt 780
tcggcccatg ctgcacagtc accaggcgac atttttgcga gcgacgactt cgaagcaggg 840
gctgagttct caagcacagc atcgtatcag aagctatcag acctgaacct acgcatcttg 900
caatgcgggt caacggcaca agcaggcact gctcctcaga acagctctca acttctgaag 960
gacgttgtcg ggttttctgg cgagctcatc gatattgcaa gacagagcat gcctcatttc 1020
gtgggctgca caaggtcgtc atcccgtgcc tccactacgt ccaagggaag ctctatggaa 1080
agcgatgagg gcgacggttc tatcgacacc gcctttagcc agtcgtcgtg gggatccttg 1140
aagcctggct ctgcgtctgg accacaagca acaagccaat ccgtaccaga gtccgctgta 1200
atcttcttgc ttctcggatg ctacacccaa atcttgcacc tgttcgagct cacgacgaac 1260
tgtttgtggg ctcagcactg cgaggctgga caaccagctc cgcagaacga cgacacctct 1320
ggcaccatcg gttcgttgct ggaggcatcg atcgctatac acaccgtcac atatcttctg 1380
agccggttgc accgagcttt ggcagcccca gagatggacg cttccaccga tgcggcagac 1440
tcgcacggct ggaagaagtc cttcgtaggt ggcaaggagt tggaagatgg gttgcttggt 1500
cgggcatttg gtgagatccg cgagcgtgaa cagtggctca tgaggcggac gaagcacctg 1560
cagcagagga ttaacaagtg ccacatctga 1590
<210> 66
<211> 512
<212> PRT
<213> 菌核生枝顶孢
<400> 66
Met Gly Asn Ser Ala Asn Glu Asp Lys Leu Arg Tyr Ala Cys Asp Arg
1 5 10 15
Cys His Ser Gln Lys Leu Arg Cys Pro Arg Ser Val Glu Pro Glu Lys
20 25 30
Ala Asn Pro Glu Glu Pro Cys Ser Arg Cys Arg Lys Ala Gly Val Pro
35 40 45
Cys Val Val Ser Leu Arg Gly Lys Val Gly Arg Pro Ser Lys Ala Thr
50 55 60
Lys Lys Lys Ser Ala Arg Ser Pro Arg Ala Thr Ser Thr Pro Glu Ala
65 70 75 80
Glu Phe Pro Pro Tyr Asp Ile Asn Ser Val Leu Ser Gly Glu Val Asp
85 90 95
Gly Ser Ile Pro Trp Ala Ser Pro Ser Gly Asp Arg Met Met Asp Met
100 105 110
Phe Asp Leu Ala Ser Gly Ser Gly Ser Val Thr Thr Ser Ala Ser Pro
115 120 125
Lys Thr Met Ala Glu Asp Tyr Gln Pro Glu Gly Gln Arg Pro Phe Pro
130 135 140
Asp Pro Leu Met Gly Pro Gly Leu Ile Gln Val Pro Tyr Glu Pro Phe
145 150 155 160
Leu Met Glu Phe Asp Thr Asp Ala Asp Tyr Pro Thr Phe Cys Ile Pro
165 170 175
Pro Ser Leu Thr Asp Met Pro Ala Gly Val Glu Phe Asn Gln Pro Gln
180 185 190
Asp Lys Thr Phe Asn Ser Ser Gln Met Asp Ser Phe Met Asp Val Lys
195 200 205
Thr Asp Ala Ser Met Met Met Pro His Ala Asp Met Asp Met Thr Ser
210 215 220
Pro Lys Gly Thr Gly Pro Thr Ile Asp Pro Val Thr Val Asp Pro Arg
225 230 235 240
Met Ser Phe Ser Ala His Ala Ala Gln Ser Pro Gly Asp Ile Phe Ala
245 250 255
Ser Asp Asp Phe Glu Ala Gly Ala Glu Phe Ser Ser Thr Ala Ser Tyr
260 265 270
Gln Lys Leu Ser Asp Leu Asn Leu Arg Ile Leu Gln Cys Gly Ser Thr
275 280 285
Ala Gln Ala Gly Thr Ala Pro Gln Asn Ser Ser Gln Leu Leu Lys Asp
290 295 300
Val Val Gly Phe Ser Gly Glu Leu Ile Asp Ile Ala Arg Gln Ser Met
305 310 315 320
Pro His Phe Val Gly Cys Thr Arg Ser Ser Ser Arg Ala Ser Thr Thr
325 330 335
Ser Lys Gly Ser Ser Met Glu Ser Asp Glu Gly Asp Gly Ser Ile Asp
340 345 350
Thr Ala Phe Ser Gln Ser Ser Trp Gly Ser Leu Lys Pro Gly Ser Ala
355 360 365
Ser Gly Pro Gln Ala Thr Ser Gln Ser Val Pro Glu Ser Ala Val Ile
370 375 380
Phe Leu Leu Leu Gly Cys Tyr Thr Gln Ile Leu His Leu Phe Glu Leu
385 390 395 400
Thr Thr Asn Cys Leu Trp Ala Gln His Cys Glu Ala Gly Gln Pro Ala
405 410 415
Pro Gln Asn Asp Asp Thr Ser Gly Thr Ile Gly Ser Leu Leu Glu Ala
420 425 430
Ser Ile Ala Ile His Thr Val Thr Tyr Leu Leu Ser Arg Leu His Arg
435 440 445
Ala Leu Ala Ala Pro Glu Met Asp Ala Ser Thr Asp Ala Ala Asp Ser
450 455 460
His Gly Trp Lys Lys Ser Phe Val Gly Gly Lys Glu Leu Glu Asp Gly
465 470 475 480
Leu Leu Gly Arg Ala Phe Gly Glu Ile Arg Glu Arg Glu Gln Trp Leu
485 490 495
Met Arg Arg Thr Lys His Leu Gln Gln Arg Ile Asn Lys Cys His Ile
500 505 510
<210> 67
<211> 554
<212> PRT
<213> 苹果枝溃疡病菌
<400> 67
Met Ala Val Ala Ser Thr Met Leu Lys Gln Leu Leu Ile Pro Leu Val
1 5 10 15
Ile Leu Leu Val Ala Thr Arg Val Arg Thr Trp Tyr Thr His Arg Lys
20 25 30
Arg Cys Ser Ser Asn Gly Cys Leu Pro Pro Pro Ala Tyr Pro His Lys
35 40 45
Asp Gly Ile Leu Gly Leu Val His Leu Arg Thr Leu Ile Lys Ala Arg
50 55 60
Gln Glu Lys Arg Leu Pro Thr Ala Phe Ser Ser Ile Phe Thr Asp Thr
65 70 75 80
Gly Ala Gly Val His Thr Leu Thr Tyr Thr Thr Leu Gly Ser Thr Thr
85 90 95
Tyr Trp Thr Val Asp Ala Asp Asn Ile Lys Ala Val Leu Ser Ser Ser
100 105 110
Phe Arg Asp Trp Gly Leu Pro Arg Ala Arg Val Asp Ala Phe Ala Ala
115 120 125
Cys Trp Gly Gly Gly Ile Phe Gly Ala Asp Gly Ala Glu Trp Glu His
130 135 140
Ser Arg Ala Met Leu Arg Pro Ser Phe Asn Arg Arg Gln Gly Gln Asp
145 150 155 160
Thr Glu Met Leu Glu Arg His Val Gln Asn Leu Leu Ala Arg Ile Thr
165 170 175
His Gly Gln Thr Val Asp Leu Ala Glu Leu Phe Pro Leu Leu Thr Met
180 185 190
Asp Ile Ala Thr Asp Leu Leu Phe Gly Glu Ser Ala Gly Cys Leu Asp
195 200 205
Pro Ala Lys Ser Ala Gln Gly Met Glu Phe Thr Ala Ala Phe Asn Tyr
210 215 220
Val Met Gln Lys Met Ser Val Gln Val Ser Phe Pro Leu Leu Ala Lys
225 230 235 240
Val Pro Asp Arg Arg Leu Lys Ser Cys Val Asn Cys Ile Asn Thr Phe
245 250 255
Thr Asp Ala Phe Val Thr Arg Ala Leu Ser Phe Arg Asp Asn Met Ser
260 265 270
Lys Ala Lys Val Ser Gly Asp His Glu Gly Arg Tyr Gly Lys Lys Cys
275 280 285
Val Phe Leu Asp Glu Leu Ala Lys Gly Asp Tyr Ser Pro Arg Arg Leu
290 295 300
Arg Ala Glu Leu Leu Ser Val Met Val Ala Gly Arg Asp Thr Thr Ala
305 310 315 320
Ser Leu Leu Ser Ile Ile Trp Trp His Leu Ala Arg Arg Pro Asp Ile
325 330 335
Val Glu Lys Leu Arg Glu Glu Ile Ser Pro Leu Lys Ser Arg Pro Pro
340 345 350
Ser Pro Asn Glu Leu Lys Ser Met Thr Tyr Leu Arg Asp Val Ile Asn
355 360 365
Glu Val Leu Arg Leu Tyr Pro Ile Asn Pro Ile Asn Ser Arg Val Ala
370 375 380
Ile Arg Asp Thr Thr Leu Pro Arg Gly Gly Gly Lys Asp Gly Leu Ser
385 390 395 400
Pro Val Phe Ile Ala Lys Gly Gln Arg Leu Ile Phe Ser Ser Ser Ala
405 410 415
Leu His Arg Arg Lys Asp Ile Tyr Gly Gln Asp Ala Met Gln Leu Arg
420 425 430
Pro Glu Arg Trp Glu Thr Val Arg Pro Ser Thr Trp Glu Tyr Ile Pro
435 440 445
Phe Gly Gly Gly Pro Arg Val Cys Ile Gly Gln Gln Leu Ala Gln Thr
450 455 460
Glu Ala Ala Tyr Thr Thr Val Arg Leu Leu Gln Glu Phe Ser Ser Val
465 470 475 480
Lys Pro Arg Ser Glu Gly Pro Phe Gln Glu Gly Phe Ala Met Ala Leu
485 490 495
Ser Ser Gly Asp Gly Cys Arg Leu Leu Arg Leu Ala Arg His Ala Arg
500 505 510
Pro Gly Phe Gln Gly Gly Asp Tyr Leu Lys His Arg Gly Leu Val His
515 520 525
Ile Pro Val Leu Leu Pro Ser Glu Thr Lys Val His Leu Tyr Ile Phe
530 535 540
Gly Gln Pro Asn Gly Gln Glu Lys Leu Gly
545 550
- 上一篇:一种医用注射器针头装配设备
- 下一篇:嵌合抗原受体细胞的制备及其用途