杀昆虫蛋白发现平台和自其发现的杀昆虫蛋白

文档序号:1060772 发布日期:2020-10-13 浏览:16次 >En<

阅读说明:本技术 杀昆虫蛋白发现平台和自其发现的杀昆虫蛋白 (Insecticidal protein discovery platform and insecticidal proteins discovered therefrom ) 是由 J·金 O·刘 J·肖克 W·W·黄 于 2019-03-01 设计创作,主要内容包括:本发明提出一种用于从高度异质的环境来源发现新颖杀昆虫蛋白的平台。方法利用宏基因组富集程序和独特的基因扩增技术,从而能够获取广泛类别的未知微生物多样性及其所得蛋白质组。所揭示的杀昆虫蛋白发现平台IPDP可由计算驱动,且能够整合分子生物学、自动化和高级机器学习协议。所述平台将使研究人员能够快速且准确地获取由未表征和复杂的微生物环境样品产生的大量未开发的杀昆虫蛋白的组库。本文还提出来自罕见类别的杀昆虫蛋白的一组新发现的成孔毒素PFT,其利用所述杀昆虫蛋白发现平台发现。(The present invention proposes a platform for the discovery of novel insecticidal proteins from highly heterogeneous environmental sources. The method utilizes metagenome enrichment procedures and unique gene amplification techniques to obtain a wide variety of unknown microbial diversity and resulting proteomes. The disclosed insecticidal protein discovery platform IPDP can be computer driven and is capable of integrating molecular biology, automation, and advanced machine learning protocols. The platform will enable researchers to quickly and accurately obtain a repertoire of large quantities of undeveloped insecticidal proteins produced from uncharacterized and complex samples of microbial environments. Also presented herein is a set of newly discovered pore-forming toxins PFTs from a rare class of insecticidal proteins, which are discovered using the insecticidal protein discovery platform.)

杀昆虫蛋白发现平台和自其发现的杀昆虫蛋白

相关申请的交叉引用

本申请案主张2018年3月2日申请的第62/637,515号美国临时申请案的优先权,所述申请案以全文引用的方式并入本文中。

关于序列表的陈述

以文本格式代替纸本拷贝提供与本申请案相关的序列表,且在此以引用的方式并入本说明书中。含有序列表的文本文件的名称是:ZYMR_022_01WO_SeqList_ST25.txt。文本文件为约167KB,在2019年2月27日创建,且经由EFS-Web以电子方式提交。

技术领域

本发明是针对一种从高度异质的环境来源发现新颖杀昆虫蛋白的方法。所述方法利用宏基因组富集程序和独特基因扩增技术,其实现对广泛类别的未知微生物多样性及其所得蛋白质组的获取。

所揭示的杀昆虫蛋白发现平台(IPDP)可由计算驱动,且能够整合分子生物学、自动化和高级机器学***台将使得研究人员能够快速且准确地获取由未表征的并且复杂的微生物环境样品产生的大量未开发的杀昆虫蛋白的组库。

本文还呈现来自罕见类别的杀昆虫蛋白的一组新发现的成孔毒素(PFT),其利用杀昆虫蛋白发现平台发现。

背景技术

据估计,到2050年,世界人口将已达到超过90亿人。由***项目的农业专家估计,为了供给此类较大全球人口,那么总食品生产必须增加70%以满足未来需求。许多因素加剧了这一挑战,包括:淡水资源减少、耕地的供应有限、能量价格上升、投入成本增加和对现代中耕作物农业的环境问题关注。

老问题是杀虫压力和产量的相关减少和源自其的产率的减少,这将继续为我们全球农业行业面临的最迫切的问题之一。传统的合成化学物质已成功地帮助农民抗击难以解决的昆虫,但是由于担心它们对人类健康的影响以及潜在的有害环境影响,这些化学物质面临越来越多的审查。因此,为了满足不断增长的全球人口的需求,将需要更多的生物技术解决方案来对抗农业害虫。

一种主要生物技术农药溶液来自苏云金杆菌(Bacillus thuringiensis,Bt),革兰氏阳性,孢子形成细菌。Bt细菌被鉴别为昆虫病原体并且其杀昆虫活性归因于由Cry基因编码的伴胞晶体,其中存在超过100种已知同功异构物。此观察结果引起基于Bt细菌的生物杀虫剂的开发,用于控制某些昆虫物种。目前,植物已经基因工程改造以表达Bt杀昆虫蛋白,这缓解了对植物外部施用的需求。然而,类似于由于连续使用化学杀虫剂产生昆虫抗性的情形,这些杀昆虫Bt蛋白质在植物中的连续表达也强烈选择对目标害虫群体具有抗性。因此,行业已发现令人震惊的比率的昆虫群体对Bt作物具有抗性。此外,Bt蛋白具有有限范围的活性并且对目前难以解决的昆虫物种中的一些是无效的。

因此,鉴于全球人口的增长,与传统化学杀虫剂有关的环境问题以及昆虫对Bt性状的抗性日益增强,在本领域中非常需要鉴定新颖杀昆虫蛋白,其可以并入适用于现代农业的生物技术产品中。

发明内容

本发明提供新颖的杀昆虫蛋白,其可用于现代中耕作物农业中。这些杀昆虫蛋白可以开发为独立产品以直接施用到植物物种,或可以并入到宿主植物的基因组中以用于表达。

不同于传统的合成化学杀虫剂,所教示的杀昆虫蛋白并不造成环境问题。此外,杀昆虫蛋白属于新发现的类别,其具有优于当前行业标准Cry蛋白产品的若干优点,所述产品来源于苏云金杆菌(Bt)编码序列。

除新颖的杀昆虫蛋白本身以外,本发明提供一种通过获取由未表征的并且复杂的微生物环境样品产生的大量未开发的杀昆虫蛋白的组库来发现额外杀昆虫蛋白的平台。

杀昆虫蛋白发现平台(IPDP)利用宏基因组富集程序和独特基因扩增技术,实现对广泛类别的未知微生物多样性及其所得蛋白质组的获取。因为平台可由计算驱动,且能够整合分子生物学、自动化和高级机器学习方案,所以研究人员现将能够快速且系统地开发模型和搜索查询,以识别额外新颖杀昆虫蛋白。

在某些实施例中,本发明提供一种用于构建基因组库的方法,所述基因组库富集编码杀昆虫蛋白的假单胞菌的DNA,所述方法包含:a)提供包含一或多种微生物体的初始样品;b)将所述初始样品暴露于固体营养限制培养基,使假单胞菌属的物种富集生长,从而产生富集假单胞菌种的后续样品;c)从所述后续富集样品分离DNA;d)从所述分离的DNA提取DNA并且用所选择的引物进行简并PCR,以扩增目标杀昆虫蛋白基因;e)将所述PCR扩增的DNA克隆到质粒中;以及f)对来自所述质粒的克隆DNA进行测序。在某些实施例中,所述方法包含将测序DNA组装到基因组库中。在某些实施例中,所述方法包含识别测序DNA内的杀昆虫蛋白基因。在一些实施例中,经识别的杀昆虫蛋白是未知的。在一些实施例中,隐马尔可夫模型用于识别杀昆虫蛋白基因。在一些实施例中,可发现表3中的任何基因(即核苷酸序列)(例如SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69和71)。在一些实施例中,可发现编码表3中发现的蛋白质的任何基因(例如SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70和72)。在一些实施例中,引物经选择以扩增目标杀昆虫蛋白基因,其编码与SEQ ID NO:87具有至少50%序列一致性的蛋白质。

在一些实施例中,本发明提供编码杀昆虫蛋白的分离的核酸分子,所述杀昆虫蛋白与选自由以下组成的群组的蛋白质具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列一致性:SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70以及72。在某些实施例中,分离的核酸分子经密码子优化以用于在所关注的宿主细胞中表达。在某些实施例中,分离的核酸分子经密码子优化以用于在植物细胞中表达。在某些实施例中,分离的核酸分子与选自由以下组成的群组的核酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列一致性:SEQ IDNO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69以及71。

在一些实施例中,本发明提供一种核苷酸构建体,其包含:编码与选自由以下组成的群组的蛋白质具有至少约80%序列一致性的杀昆虫蛋白的核酸分子:SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70以及72,所述核酸分子可操作地连接到异源调节元件。在各方面,异源调节元件为启动子。在各方面,异源调节元件为植物启动子。在一些实施例中,本发明提供包含所述核苷酸构建体的转基因植物细胞。在一些实施例中,本发明提供从核苷酸构建体表达所述蛋白质的稳定转化植物。在一些实施例中,昆虫以转基因植物为食并且被杀死。

在一些实施例中,本发明提供一种分离的杀昆虫蛋白,其包含:与选自由以下组成的群组的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列一致性的氨基酸序列:SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70以及72。在一些实施例中,分离的杀昆虫蛋白为重组的。在一些实施例中,本发明提供表达所述蛋白质的转基因植物细胞。在一些实施例中,昆虫以转基因植物为食并且被杀死。在一些实施例中,前述杀昆虫蛋白含于农业组合物中。在一些实施例中,所述农业组合物用于在植物和/或昆虫上喷雾,以便提供有效的昆虫控制。在一些实施例中,在细胞裂解物中发现杀昆虫蛋白并且可以利用细胞裂解物来控制昆虫害虫群体。在一些实施例中,天然假单胞菌宿主生物体可以配制成组合物并且用于对抗昆虫害虫。

在某些实施例中,本发明提供新颖的杀昆虫蛋白,其中当使用表6中的HMM评分时,所述蛋白质具有评分为521.5或高于521.5的比特分数的氨基酸序列和/或以E值小于或等于7.9e-161匹配的序列。这些蛋白质可以本文所揭示的任何形式(例如作为分离的或重组的蛋白质)或作为组合物(例如植物或农业组合物)中的任一种的一部分提供。

附图说明

图1概述所教示的杀昆虫蛋白发现平台(IPDP)的工作流程。

图2概述所教示的杀昆虫蛋白发现平台(IPDP)的工作流程,且说明当前IPDP不需要的现有技术的方法利用的两个步骤。

图3说明利用IPDP发现的表3中所发现的八种新颖杀昆虫蛋白(ZIP1、ZIP2、ZIP6、ZIP8、ZIP9、ZIP10、ZIP11、ZIP12)的多序列比对。

图4说明相比于莫那辛(monalysin),利用IPDP发现的表3中所发现的八种新颖杀昆虫蛋白(ZIP1、ZIP2、ZIP6、ZIP8、ZIP9、ZIP10、ZIP11、ZIP12)的多序列比对。

图5说明利用IPDP发现的表3和图3中所发现的八种新颖杀昆虫蛋白的系统发生树。

图6说明相比于莫那辛,利用IPDP发现的表3和图4中所发现的八种新颖杀昆虫蛋白的系统发生树。

图7说明在表3中所发现的使用十种经纯化的杀昆虫蛋白的昆虫生物分析实验的结果。摄取含有经由IPDP发现的经纯化的杀昆虫蛋白(ZIP1、ZIP2、ZIP4、ZIP6、ZIP8、ZIP9、ZIP10、ZIP11和ZIP12和ZIP16)的水的昆虫(茶翅蝽(Halyomorpha halys)-害椿(BrownMarmorated Stink Bug))展现不同程度的死亡率。用于此实验的经纯化的杀昆虫蛋白的浓度也呈现于图7中。

图8说明表3中针对害椿所发现的使用三种经纯化的杀昆虫蛋白(ZIP1、ZIP2和ZIP4)的昆虫生物分析实验的结果。不同浓度的经纯化的蛋白质由昆虫摄取(N=所分析的昆虫的数目),且死亡率数据经受Probit分析以生成在上限和下限95%置信区间下杀死50%群体(LC50)所需的致死浓度。

图9A-B说明表3中针对两种主要的昆虫目的成员所发现的使用三种经纯化的杀昆虫蛋白(ZIP1、ZIP2和ZIP4)的昆虫生物分析实验的结果;秋夜蛾(Fall Armyworm)和南方玉米根虫(Southern Corn Rootworm)。报告与仅缓冲液对照相比,摄取与固态饮食混合的所列浓度的经纯化蛋白质的昆虫的平均重量百分比降低。图9A呈现对秋夜蛾(草地贪夜蛾(Spodoptera frugiperda))进行的实验,而图9B说明对南方玉米根虫(十一星黄瓜甲虫(Diabrotica undecimpunctata))进行的实验。

图10说明来自昆虫裂解物实验的结果。摄取含有经由IPDP发现的杀昆虫蛋白的细菌裂解物的昆虫(茶翅蝽-害椿)展现100%死亡率。

图11说明来自实例6的蛋白质印迹结果,其显示来自大豆和玉米叶的ZIP蛋白的表达。条带1和11:阴性对照(未转化的大豆叶);条带2和3:ZIP1转化的大豆叶;条带4-10:ZIP2转化的大豆叶;条带12和13:ZIP4转化的大豆叶;条带14:阴性对照(未转化的玉米叶);条带15和16:ZIP2转化的玉米叶。

具体实施方式

定义

尽管相信所属领域的一般技术人员充分理解以下术语,但仍阐述以下定义以便于对本发明主题进行解释。

术语“一(a/an)”是指所述实体中的一或多个,即可以指多个提及物。因而,术语“一(a或an)”、“一或多个”和“至少一个”在本文中可互换地使用。此外,通过不定冠词“一(a/an)”提及“元件”并不排除存在超过一个元件的可能性,除非上下文明确要求存在一个并且仅存在一个元件。

如本文所用,术语“细胞生物体”、“微生物体”或“微生物”应该在宽广的意义上理解。这些术语可互换地使用并且包括但不限于两种原核结构域:细菌和古细菌,以及某些真核真菌和原生生物。在一些实施例中,本发明是指本发明所存在的清单/表格和图式中的“微生物体”或“细胞生物体”或“微生物”。这种表征不仅可以指所述表格和图式的已鉴别类属,而且指已鉴别的类种,以及所述表格或图式中的各种新颖和最新鉴别或设计的任何生物体株系。对于这些术语在本说明书的其它部分(如实例)中的叙述来说,相同表征保持成立。

术语“原核生物”在本领域内为认可的且是指不含细胞核或其它细胞器的细胞。原核生物通常按照两种结构域之一归类:细菌和古细菌。古细菌和细菌结构域生物体之间的决定性差异是基于16S核糖体RNA中的核苷酸碱基序列的基本差异。

术语“古细菌”是指疵壁菌门(Mendosicutes)的生物体类别,其典型地发现于异常环境中且根据若干个准则而与原核生物的其余部分区分开来,所述若干个准则包括核糖体蛋白的数目和细胞壁中的胞壁酸的缺乏。基于ssrRNA分析,古细菌由系统发生学截然不同的两种群组组成:泉古菌门(Crenarchaeota)和广古菌门(Euryarchaeota)。古细菌基于其生理学可以组织成三种类型:产甲烷菌(产生甲烷的原核生物);极端嗜盐菌(extremehalophiles)(在极高浓度的盐(NaCl)下存活的原核生物);和极端(超)嗜热菌(extreme(hyper)thermophilus)(在极高温度下存活的原核生物)。除有别于细菌的统一古细菌特点(即,细胞壁中没有胞壁质、酯连型膜脂质等)之外,这些原核生物还展现出使其适应其特定栖息地的独特结构或生物化学属性。泉古菌门主要由极端嗜热性硫依赖性原核生物组成,且广古菌门含有产甲烷菌和极端嗜盐菌。

“细菌”或“真细菌”是指原核有机物结构域。细菌包括如下至少11种不同群组:(1)革兰氏阳性(革兰+)细菌,其存在两大亚门:(1)高G+C群组(放线菌(Actinomycetes)、分枝杆菌(Mycobacteria)、微球菌(Micrococcus)等),(2)低G+C群组(芽孢杆菌(Bacillus)、梭菌(Clostridia)、乳杆菌(Lactobacillus)、葡萄球菌(Staphylococci)、链球菌(Streptococci)、霉浆菌(Mycoplasmas));(2)变形菌门,例如紫色光合+非光合革兰氏阴性细菌(包括最“常见”的革兰氏阴性细菌);(3)蓝细菌,例如有氧光养型;(4)螺旋菌和相关物种;(5)浮霉状菌;(6)拟杆菌(Bacteroides)、黄杆菌(Flavobacteria);(7)衣原体(Chlamydia);(8)绿色硫细菌;(9)绿色非硫细菌(也是厌氧性光养型);(10)耐放射性微球菌和相关菌种;(11)栖热孢菌(Thermotoga)和嗜热性热袍菌(Thermosiphothermophiles)。

“真核生物”是其细胞含有细胞核和封闭于膜内的其它细胞器的任何生物体。真核生物属于真核或真核生物分类群。将真核细胞与原核细胞(前述细菌和古细菌)区分开来的限定性特点是其具有膜结合的细胞器,尤其是含有遗传物质且被核被膜封闭的细胞核。

术语“经基因修饰的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换地使用且是指已经利用本发明的克隆和转化方法经基因修饰的宿主细胞。因此,所述术语包括宿主细胞(例如细菌、酵母细胞、真菌细胞、CHO、人类细胞等),相较于其所来源的天然存在的生物体,所述宿主细胞已进行基因改变、修饰或工程改造,使得其呈现已改变、修饰或不同的基因型和/或表型(例如当基因修饰影响微生物体的编码核酸序列时)。应理解,在一些实施例中,所述术语不仅指所讨论的特定重组宿主细胞,且还指此类种宿主细胞的后代或潜在后代。

术语“野生型微生物体”或“野生型宿主细胞”描述自然界中存在的细胞,即尚未经基因修饰的细胞。

术语“基因工程”可以指对宿主细胞基因组的任何操控(例如核酸的***、缺失、突变或置换)。

术语“对照”或“对照宿主细胞”是指适当的比较宿主细胞,用于测定基因修饰或实验处理的效果。在一些实施例中,对照宿主细胞是野生型细胞。在其它实施例中,对照宿主细胞在基因上除了基因修饰之外,与经基因修饰的宿主细胞相同,从而有别于处理宿主细胞。

如本文所用,术语“等位基因”意指基因的一或多种替代形式中的任一种,其所有等位基因涉及至少一种性状或特征。在二倍体细胞中,所指定基因的两个等位基因占据一对同源染色体上的对应基因座。

如本文所用,术语“基因座(locus)”(基因座(loci)的复数形式)意指发现有例如基因或基因标记的染色体上的一或多个特定位置或一位点。

如本文所用,术语“以基因方式连接”是指在育种期间,两种或更多种特性以高比率共同遗传,使得其难以通过杂交来分离。

如本文所用,“重组”或“重组事件”是指染色体交换或独立分类。

如本文所用,术语“表型”是指个别细胞、细胞培养物、生物体或生物体群组的可观测特征,其由那个个体的基因组成(即基因型)与环境之间的相互相用产生。

如本文所用,术语“嵌合”或“重组”在描述核酸序列或蛋白质序列时是指将至少两种异源多核苷酸或两种异源多肽连接到单一大分子中或重排至少一种天然核酸或蛋白质序列的一或多个元件的核酸或蛋白质序列。举例来说,术语“重组”可以是指两个以其它方式分离的序列区段例如通过化学合成或通过基因工程技术操控所分离的核酸区段而发生的人工组合。

如本文所用,“合成核苷酸序列”或“合成多核苷酸序列”是已知不存在于自然界中或天然不存在的核苷酸序列。一般来说,当相较于任何其它天然存在的核苷酸序列时,此类合成核苷酸序列将包含至少一个核苷酸差异。

如本文所用,“合成氨基酸序列”或“合成肽”或“合成蛋白质”是已知不存在于自然界中或天然不存在的氨基酸序列。一般来说,当相较于任何其它天然存在的蛋白质序列时,此类合成蛋白质序列将包含至少一个氨基酸差异。

如本文所用,术语“核酸”是指具有任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式或其类似物。这一术语是指分子的初级结构,并且因此包括双链和单链DNA,以及双链和单链RNA。其还包括经修饰的核酸,如甲基化和/或封端核酸、含有经修饰的碱基、主链修饰的核酸及其类似物。术语“核酸”和“核苷酸序列”可互换地使用。

如本文所用,术语“基因”是指与生物功能相关的任何DNA区段。因此,基因包括但不限于其表达所需的编码序列和/或调节序列。基因还可包括未表达的DNA区段,例如形成针对其它蛋白质的识别序列。基因可从多种来源获得,包括从所关注的来源克隆或从已知或预测的序列信息合成,并且可包括设计成具有所需参数的序列。

如本文所用,术语“同源”或“同源物”或“直系同源物”是本领域中已知的并且是指共有共同祖先或家族成员并且可以基于序列一致性程度来推断的相关序列。术语“同源性”、“同源”、“基本上相似”和“基本上对应”在本文中可互换地使用。其是指核酸片段,其中一或多个核苷酸碱基的变化不影响所述核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰,如相对于初始、未经修饰的片段,基本上不改变所得核酸片段的功能特性的一或多个核苷酸的缺失或***。因此应理解,如本领域的技术人员将了解,本发明涵盖除所述特定示例性序列之外的序列。这些术语描述了一种物种、亚种、变种、栽培品种或品系中所发现的基因与另一种物种、亚种、变种、栽培品种或品系中的对应或等效基因之间的关系。出于本发明的目的,对同源序列进行比较。“同源序列”或“同源物”或“直系同源物”被认为、相信或已知在功能上是相关的。功能关系可以多种方式中的任一种指示,包括但不限于:(a)序列一致性程度和/或(b)相同或相似的生物功能。优选的是,指示(a)和(b)。可以使用本领域中容易获得的软件程式测定同源性,如现代分子生物学实验技术(Current Protocols in Molecular Biology)(F.M.奥斯贝(F.M.Ausubel)等人编,1987)副刊30,章节7.718,表7.71中所论述的那些。一些比对程式是MacVector(英国牛津的牛津分子有限公司(Oxford Molecular Ltd,Oxford,U.K.))、ALIGN Plus(宾夕法尼亚州的科学和教育软件(Scientific and Educational Software,Pennsylvania))以及AlignX(Vector NTI,加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen,Carlsbad,CA))。另一种比对程式是Sequencher(Gene Codes,密歇根安娜堡(Ann Arbor,Michigan)),其使用默认参数。

如本文所用,术语“内源”或“内源基因”是指天然存在的基因,在其所处位置发现其天然地存在于宿主细胞基因组内。在本发明的上下文中,异源启动子可操作地连接到内源基因意指以基因方式将异源启动子序列***现有基因之前,处于那个基因天然存在的位置。如本文所述的内源基因可以包括天然存在的基因的等位基因,所述等位基因已经根据本发明的任何方法发生突变。

如本文所用,术语“外源”与术语“异源”可互换地使用且是指来自不同于其原生来源的一些来源的物质。举例来说,术语“外源蛋白质”或“外源基因”是指来自非原生来源或位置且已经通过人工方式提供到生物系统中的蛋白质或基因。

如本文所用,术语“核苷酸变化”是指例如核苷酸取代、缺失和/或***,如本领域中充分了解。举例来说,突变含有可产生沉默取代、添加或缺失,但不改变所编码的蛋白质的特性或活性或如何制得蛋白质的变化。

如本文所用,术语“蛋白质修饰”是指例如氨基酸取代、氨基酸修饰、缺失和/或***,如在本领域中充分理解。

如本文所用,术语核酸或多肽的“至少一部分”或“片段”意指具有此类序列的最小尺寸特征的部分,或全长分子的任何较大的片段,最多是且包括全长分子。本发明的多核苷酸片段可以编码基因调节元件的生物活性部分。基因调节元件的生物活性部分可通过分离本发明的多核苷酸之一的包含基因调节元件的一部分并且如本文中所述评定活性来制备。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,最多是全长多肽。待使用的所述部分的长度将视特定应用而定。适用作杂交探针的核酸的一部分可以短到12个核苷酸;在一些实施例中,其是20个核苷酸。适用作抗原决定基的多肽的一部分可短到4个氨基酸。多肽中发挥全长多肽功能的部分将通常长于4个氨基酸。

变体多核苷酸还涵盖来源于诱变和诱重组程序(如DNA改组)的序列。此类DNA改组的策略在本领域中已知。参见例如施特默尔(Stemmer)(1994)PNAS 91:10747-10751;施特默尔(1994)《自然(Nature)》370:389-391;凯默瑞(Crameri)等人(1997)《自然生物技术(Nature Biotech.)》15:436-438;穆尔(Moore)等人(1997)《分子生物学杂志(J.Mol.Biol.)》272:336-347;张(Zhang)等人(1997)PNAS 94:4504-4509;凯默瑞等人(1998)《自然》391:288-291;和第5,605,793号与第5,837,458号美国专利。

就PCR扩增本文所揭示的多核苷酸来说,可以设计用于PCR反应中的寡核苷酸引物以由从所关注的任何生物体提取的cDNA或基因组DNA扩增对应的DNA序列。用于设计PCR引物和PCR克隆的方法是本领域中通常已知的且揭示于萨布鲁克(Sambrook)等人(2001),《分子克隆:实验指南(Molecular Cloning:A Laboratory Manual)》(第3版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约普莱恩维尤(Plainview,New York))中。还参见英尼斯(Innis)等人编(1990)《PCR方案:方法和应用指导(PCR Protocols:AGuide to Methods and Applications)》(学术出版社(Academic Press),纽约);英尼斯和吉尔凡(Gelfand)编(1995)《PCR策略(PCR Strategies)》(学术出版社,纽约);以及英尼斯和吉尔凡编(1999)《PCR方法手册(PCR Methods Manual)》(学术出版社,纽约)。已知的PCR方法包括但不限于使用成对引物、巢式引物、单一特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。

如本文所用,术语“引物”是指一种寡核苷酸,其当放置在诱导引物延伸产物合成的条件下时(即,在核苷酸和聚合试剂(如DNA聚合酶)存在下且在适合温度和pH下),能够与扩增目标粘接,从而允许DNA聚合酶附著,借此充当DNA合成的起始点。(扩增)引物优选是单链以获得最大的扩增效率。优选地,引物是寡脱氧核苷酸。引物必须足够长以在聚合试剂存在下引发延伸产物的合成。引物的确切长度将取决于多种因素,包括引物的温度和组成(A/T相对于G/C含量)。一对双向引物由一个正向和一个反向引物组成,如DNA扩增(如PCR扩增)领域中所常用。

如本文所用,“启动子”是指能够控制编码序列或功能RNA的表达的DNA序列。在一些实施例中,启动子序列由近端和更远端上游元件组成,后者元件通常称为强化子。因此,“强化子”是可以刺激启动子活性的DNA序列,并且可以是启动子的固有元件或被***以增强启动子的含量或组织特异性的异源元件。启动子可完全来源于原生基因,或由来源于自然界中所发现的不同启动子的不同元件构成,或甚至包含合成DNA区段。本领域的技术人员应了解,不同启动子可以引导基因在不同组织或细胞类型中,或在不同的发育阶段,或响应于不同的环境条件来表达。另外应认识到,由于在大多数情况下,调控序列的精确边界尚未完全界定,因此一些变异的DNA片段可以具有相同的启动子活性。

如本文所用,短语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”以及“重组DNA构建体”在本文中可互换地使用。重组构建体包含核酸片段的人工组合,例如自然界中未一同发现的调节和编码序列。举例来说,嵌合构建体可以包含来源于不同来源的调节序列和编码序列,或来源于相同来源的调节序列和编码序列,但其以与自然界中所发现不同的方式排列。此类构建体可以单独使用或可以与载体结合使用。如本领域的技术人员众所周知,如果使用载体,那么载体的选择取决于用于使宿主细胞转化的方法。举例来说,可以使用质粒载体。本领域的技术人员深知,为了成功地转化、选择和繁殖包含本发明的任一个分离的核酸片段的宿主细胞,基因元件必须存在于载体上。本领域的技术人员还将认识到不同的独立转化事件将引起不同的表达水平和模式(琼斯(Jones)等人,(1985),《EMBO杂志(EMBO J.)》4:2411-2418;德阿尔梅达(De Almeida)等人,(1989),《分子基因遗传学(Mol.Gen.Genetics)》218:78-86),且因此必须对多个事件进行筛选以便获得呈现所需表达水平和模式的株系。此类筛选可以通过DNA的南方分析、mRNA表达的北方分析、蛋白质表达的免疫印迹分析或表型分析等来完成。载体可以是质粒、病毒、噬菌体、前病毒、噬菌粒、转座子、人工染色体及其类似物,其自主地复制并且可整合到宿主细胞的染色体中。载体还可以是非自主地复制的裸RNA多核苷酸、裸DNA多核苷酸、由同一链内的DNA和RNA构成的多核苷酸、聚赖氨酸结合的DNA或RNA、肽结合的DNA或RNA、脂质体结合的DNA或其类似物。如本文所用,术语“表达”是指功能性最终产物(例如mRNA或蛋白质(前体或成熟物))的产生。

在本文中,“可操作地连接”意指根据本发明的启动子多核苷酸与其它寡核苷酸或多核苷酸的依序排列,从而引起所述其它多核苷酸的转录。

如本文所用,术语“所关注产物”或“生物分子”是指由原料中的微生物产生的任何产物。在一些情况下,所关注产物可以是小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇等。举例来说,所关注产物或生物分子可以是任何初级或次级胞外代谢物。初级代谢物尤其可以是乙醇、柠檬酸、乳酸、谷氨酸、谷氨酸盐、赖氨酸、苏氨酸、色氨酸及其它氨基酸、维生素、多糖等。次级代谢物尤其可以是抗生素化合物,如青霉素,或免疫抑制剂,如环孢菌素A(cyclosporin A);植物激素,如赤霉素;抑制素药物,如洛伐他汀(lovastatin);杀真菌剂,如灰黄霉素(griseofulvin)等。所关注产物或生物分子也可以是微生物产生的任何胞内组分,如:微生物酶,包括:催化酶、淀粉酶、蛋白酶、果胶酶、葡萄糖异构酶、纤维素酶、半纤维素酶、脂肪酶、乳糖酶、链激酶及其它多种。胞内组分也可包括重组蛋白,如:胰岛素、B型肝炎疫苗、干扰素、粒细胞集落刺激因子、链激酶等。

术语“碳源”一般是指适用作供细胞生长用的碳源的物质。碳源包括但不限于生物质水解产物、淀粉、蔗糖、纤维素、半纤维素、木糖和木质素,以及这些底物的单体组分。碳源可以包含各种形式的各种有机化合物,包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽等。这些包括例如各种单糖,如葡萄糖、右旋糖(D-葡萄糖)、麦芽糖、寡糖、多糖、饱和或不饱和脂肪酸、丁二酸盐、乳酸盐、乙酸盐、乙醇等,或其混合物。光合生物体可以另外产生光合成产物形式的碳源。在一些实施例中,碳源可以选自生物质水解产物和葡萄糖。

术语“原料”定义为供应给微生物体或发酵工艺的原材料或原材料混合物,利用所述工艺可制得其它产物。举例来说,碳源,如生物质或来源于生物质的碳化合物,是供微生物体在发酵工艺中产生所关注产物(例如小分子、肽、合成化合物、燃料、乙醇等)的原料。然而,原料可以含有不同于碳源的营养物。

术语“体积生产率”或“生产速率”定义为每体积培养基每单位时间形成的产物的量。体积生产率可以克/升/小时(g/L/h)为单位来报告。

术语“比生产率”定义为产物的形成速率。比生产率在本文中进一步定义为以克产物/克细胞干重(CDW)/小时(g/g CDW/h)表示的比生产率。对指定微生物体使用CDW与OD600的关系,比生产率还可用克产物/升培养基/600nm培养液光学密度(OD)/小时(g/L/h/OD)表示。

术语“产量”定义为每单位重量的原材料所得的产物的量且可以用g产物/g底物(g/g)表示。产量可表述为理论产量的百分比。“理论产量”定义为每指定量的底物可产生的最大产物量,如根据用于制得产物的代谢途径的化学计量学所指定。

术语“滴度”或“效价”定义为溶液的强度或溶液中的物质的浓度。举例来说,将所关注产物(例如小分子、肽、合成化合物、燃料、乙醇等)在发酵液中的滴度描述为溶液中的所关注产物克数/升发酵液(g/L)。

术语“总效价”定义为工艺中所产生的全部所关注产物的总和,包括但不限于溶液中的所关注产物、气相(如果适用)中的所关注产物和从工艺中去除且相对于工艺中的初始体积或工艺中的操作体积所回收的任何所关注产物。

术语“杀昆虫蛋白”或“杀虫蛋白”或“杀昆虫毒素”或“杀虫毒素”用于指具有针对一或多种害虫的毒性活性的蛋白质。害虫的实例包括各种昆虫目,包括:鳞翅目、双翅目、半翅目和鞘翅目(仅举几例)。害虫还包括对农业而言为害虫的非昆虫生物体,包括例如线虫动物门的成员。

杀昆虫/杀虫蛋白

本发明教示一种杀昆虫蛋白发现平台和由其发现的杀昆虫蛋白。然而,应理解,术语“杀昆虫”不限于仅昆虫,而是涵盖通常称为“害虫”的生物体的较广泛分类分组。因此,短语“杀昆虫蛋白”可视为与“杀虫蛋白”同义,且短语“杀昆虫蛋白发现平台”可视为与“杀虫蛋白发现平台”同义。此外,在一些方面,本发明提供杀昆虫毒素和用于发现杀昆虫毒素的平台,其可能不限于蛋白质实施例。

杀昆虫蛋白-莫那辛

喜昆虫假单胞菌(Pseudomonas entomophila)为感染和杀死果蝇的昆虫病原细菌。喜昆虫假单胞菌致病性与其对果蝇肠道造成不可逆伤害的能力有关,预防上皮再生和修复。最近,奥普塔(Opota)和同事报告新颖的成孔毒素(PFT),其被称为“莫那辛”的识别,促成针对果蝇的喜昆虫假单胞菌的毒性。奥普塔等人,“莫那辛,一种来自果蝇病原体喜昆虫假单胞菌的新颖β-成孔毒素,导致宿主肠道损伤和致死(Monalysin,a Novel β-Pore-Forming Toxin from the Drosophila Pathogen Pseudomonas entomophila,Contributes to Host Intestinal Damage and Lethality),”《PLoS病原学(PLoSPathogens)》,2011年9月,第7卷,期刊9。奥普塔表明莫那辛需要N端断裂而完全活化,在活体外形成寡聚物,并且在人工脂质膜中诱导孔形成。跨膜结构域的二级结构的预测指示莫那辛为β类型的PFT。莫那辛的表达由GacS/GacA两组分系统和Pvf调控器两者调节,两个信号传导系统控制喜昆虫假单胞菌致病性。此外,AprA(由喜昆虫假单胞菌分泌的金属蛋白酶)可以诱导原莫那辛快速裂解成其活性形式。在莫那辛产生时用缺陷型突变体感染后观察到减少的细胞死亡,这显示莫那辛在诱导肠道细胞损伤的喜昆虫假单胞菌能力中起作用,这与其作为PFT的活性一致。奥普塔的研究与苏云金杆菌Cry毒素的公认作用一起表明PFT的产生是昆虫病原体破坏昆虫肠道内稳定的常见策略。同上。

奥普塔通过表征未知基因pseen3174的蛋白质产物而发现莫那辛(PSEEN3174)。根据奥普塔,莫那辛氨基酸序列不显示与使用P Blast的其它序列的同源性,除了发现于恶臭假单胞菌(Pseudomonas putida)F1菌株(奥普塔的图S1)中的两个未表征的直系同源物以外。喜昆虫假单胞菌或恶臭假单胞菌基因产物都未显示任何显而易见的蛋白质结构域。但是,奥普塔利用HHpred软件(藉由HMM-HMM比较进行同源性侦测和结构预测)以揭示内部区域的存在,所述内部区域具有交替的极性和疏水残基,由一段丝氨酸和苏氨酸残基侧接,是β-桶成孔毒素的跨膜区域的标志。同上。

奥普塔的DNA序列检索和分析使用假单胞菌基因组数据库(pseudomonas.com,其可以使用“www”前缀在万维网上访问)来进行。莫那辛基因(ORF PSEEN3174)对应于寄存编号YP_608728.1。恶臭假单胞菌Pput_1063和Pput_1064中的莫那辛推定直系同源物分别对应于寄存编号YP_001266408.1、YP_001266409.1。参与VI型分泌系统的生产的ORFPSEEN0535对应于寄存编号YP_606298.1。

杀昆虫蛋白-假单胞菌杀昆虫蛋白(PIP)

存在数种已知的假单胞菌杀昆虫蛋白家族,包括:PIP-1、45、47、64、72、74、75和77。这些PIP蛋白质以及识别特征提供于下表1中。其它信息可见于:(1)U.谢伦伯格(U.Schellenberger)等人,“一种来自假单胞菌的选择性杀昆虫蛋白,用于控制玉米根虫(Aselective insecticidal protein from Pseudomonas for controlling cornrootworms),”《科学(Science)》,2016年11月4日;354(6312):634-637(提供IPD072Aa,一种86AA蛋白质,基因库寄存编号KT795291),其以引用的方式并入本文中;以及(2)魏俊志(Jun-Zhi Wei)等人,“一种来自苔藓假单胞菌的选择性杀昆虫蛋白,用于控制玉米根虫(Aselective insecticidal protein from Pseudomonas mosselii for corn rootwormcontrol),”《植物生物技术杂志(Plant Biotechnology Journal)》,2018,第16期,第649-659页(提供PIP-47aa),其以引用的方式并入本文中。

表1-假单胞菌杀昆虫蛋白(PIP)和莫那辛

Figure BDA0002647180000000141

Figure BDA0002647180000000161

1表1中的所有申请揭示案都以引用的方式并入本文中。

2序列之前所显示的是原始来源申请案/揭示案的SEQ ID NO,序列之后所显示的且带下划线的是根据当前申请案的SEQ ID NO。

杀昆虫蛋白-Cry蛋白

苏云金杆菌(Bt)为具有昆虫病原特性的革兰氏阳性产孢子细菌。在孢子形成期期间Bt产生杀昆虫蛋白作为伴胞晶体。这些晶体主要由一或多种蛋白质(Cry和Cyt毒素)组成,也称为δ-内毒素。Cry蛋白为来自苏云金杆菌的伴胞包含物(晶体)蛋白质,对目标生物体展现实验上可检验的毒性作用或与已知Cry蛋白具有显著序列相似性。类似地,Cyt蛋白为来自苏云金杆菌的伴胞包含物蛋白质,展现溶血性(细胞溶解)活性或与已知Cyt蛋白具有明显序列相似性。这些毒素对其目标昆虫具有高度特异性,对人类、脊椎动物和植物是无害的,并且是完全生物可降解的。布拉沃A(Bravo A),吉尔SS(Gill SS),索伯龙M.(SoberónM.),“苏云金杆菌Cry和Cyt毒素的作用方式及其对昆虫的控制潜力(Mode of action ofBacillus thuringiensis Cry and Cyt toxins and their potential for insectcontrol),”《毒物(Toxicon)》:国际毒理学学会官方刊物(Official Journal of theInternational Society on Toxinology).2007;49(4):423-435。

Bt Cry和Cyt毒素属于被称为成孔毒素(PFT)的一类细菌毒素,其被分泌为经历构象变化以便***到其宿主的细胞膜中或跨越所述细胞膜进行移位的水溶性蛋白质。存在两个主要组的PFT:(i)α-螺旋毒素,其中α-螺旋区形成跨膜孔,和(ii)β-桶毒素,其通过形成由来自各单体的β片层夹构成的β-桶而***到膜中。参见帕克MW(Parker MW),费尔SC(FeilSC),“成孔蛋白毒素:从结构到功能(Pore-forming protein toxins:from structure tofunction),”《生物物理学与分子生物学进展(Prog.Biophys.Mol.Biol.)》2005年5月;88(1):91-142。第一类别的PFT包括毒素,如大肠杆菌素(colicin)、外毒素A、白喉毒素以及Cry三结构域毒素。另一方面,气溶素(aerolysin)、α-溶血素、炭疽保护性抗原、胆固醇依赖性毒素作为裂解素(perfringolysin)O并且Cyt毒素属于β-桶毒素。同上。一般来说,PFT产生细菌分泌其毒素并且这些毒素与位于宿主细胞表面上的特定受体相互作用。在大多数情况下,PFT在诱导***胜任的寡聚结构的形成的受体结合之后由宿主蛋白酶活化。最后,在大多数情况下,通过减小诱导蛋白质的熔融球状态的pH来触发膜***。同上。

产生Bt Cry蛋白的转基因作物的开发允许通过环境友好的替代方案取代化学杀虫剂。在转基因植物中,Cry毒素连续地产生,保护毒素免于降解并且使其可为嘴嚼口器昆虫和蛀干昆虫接触到。植物中的Cry蛋白产生已经通过用植物偏移的密码子使用工程改造cry基因,通过去除推定的剪接信号序列和删除原毒素的羧基末端区来改良。参见舒勒TH(Schuler TH)等人,“抗昆虫转基因植物(Insect-resistant transgenic plants),”《生物技术趋势(Trends Biotechnol)》.1998;16:168-175。抗昆虫作物的使用已显著减弱了在这些转基因作物种植的区域中化学性农药的使用。参见盖姆M(Qaim M),齐尔伯曼D(Zilberman D),“转基因作物在发展中国家的产量影响(Yield effects of geneticallymodified crops in developing countries),”《科学》.2003年2月7日;299(5608):900-902。

已知Cry蛋白包括:δ-内毒素,包括但不限于:Cry1、Cry2、Cry3、Cry4、Cry5、Cry6、Cry7、Cry8、Cry9、Cry10、Cry11、Cry12、Cry13、Cry14、Cry15、Cry16、Cry17、Cry18、Cry19、Cry20、Cry21、Cry22、Cry23、Cry24、Cry25、Cry26、Cry27、Cry 28、Cry 29、Cry 30、Cry31、Cry32、Cry33、Cry34、Cry35、Cry36、Cry37、Cry38、Cry39、Cry40、Cry41、Cry42、Cry43、Cry44、Cry45、Cry 46、Cry47、Cry49、Cry 51、Cry52、Cry 53、Cry 54、Cry55、Cry56、Cry57、Cry58、Cry59.Cry60、Cry61、Cry62、Cry63、Cry64、Cry65、Cry66、Cry67、Cry68、Cry69、Cry70和Cry71类别的δ-内毒素基因和苏云金杆菌细胞溶解cytl和cyt2基因。

这些类别的苏云金杆菌杀昆虫蛋白的成员包括但不限于:CrylAa1(寄存编号AAA22353);Cry1Aa2(寄存编号AAA22552);Cry1Aa3(寄存编号BAA00257);Cry1Aa4(寄存编号CAA31886);Cry1Aa5(寄存编号BAA04468);Cry1Aa6(寄存编号AAA86265);Cry1Aa7(寄存编号AAD46139);Cry1Aa8(寄存编号126149);Cry1Aa9(寄存编号BAA77213);CrylAa10(寄存编号AAD55382);CrylAa11(寄存编号CAA70856);Cry1Aa12(寄存编号AAP80146);Cry1Aa13(寄存编号AAM44305);Cry1Aa14(寄存编号AAP40639);Cry1Aa15(寄存编号AAY66993);Cry1Aa16(寄存编号HQ439776);Cry1Aa17(寄存编号HQ439788);Cry1Aa18(寄存编号HQ439790);Cry1Aa19(寄存编号HQ685121);Cry1Aa20(寄存编号JF340156);Cry1Aa21(寄存编号JN651496);Cry1Aa22(寄存编号KC158223);Cry1Abl(寄存编号AAA22330);Cry1Ab2(寄存编号AAA22613);Cry1Ab3(寄存编号AAA22561);Cry1Ab4(寄存编号BAA00071);Cry1Ab5(寄存编号CAA28405);Cry1Ab6(寄存编号AAA22420);Cry1Ab7(寄存编号CAA31620);Cry1Ab8(寄存编号AAA22551);Cry1Ab9(寄存编号CAA38701);Cry1Ab10(寄存编号A29125);CrylAb11(寄存编号Il2419);Cry1Ab12(寄存编号AAC64003);Cry1Ab13(寄存编号AAN76494);Cry1Ab14(寄存编号AAG16877);Cry1Ab15(寄存编号AA013302);Cry1Ab16(寄存编号AAK55546);Cry1Ab17(寄存编号AAT46415);Cry1Ab18(寄存编号AAQ88259);Cry1Ab19(寄存编号AAW31761);Cry1Ab20(寄存编号ABB72460);Cry1Ab21(寄存编号ABS18384);Cry1Ab22(寄存编号ABW87320);Cry1Ab23(寄存编号HQ439777);Cry1Ab24(寄存编号HQ439778);Cry1Ab25(寄存编号HQ685122);Cry1Ab26(寄存编号HQ847729);Cry1Ab27(寄存编号JN135249);Cry1Ab28(寄存编号JN135250);Cry1Ab29(寄存编号JN135251);Cry1Ab30(寄存编号JN135252);Cry1Ab31(寄存编号JN135253);Cry1Ab32(寄存编号JN135254);Cry1Ab33(寄存编号AAS93798);Cry1Ab34(寄存编号KC156668);Cry1Ab-like(寄存编号AAK14336);Cry1Ab-like(寄存编号AAK14337);Cry1Ab-like(寄存编号AAK14338);Cry1Ab-like(寄存编号ABG88858);Cry1Ac1(寄存编号AAA22331);Cry1Ac2(寄存编号AAA22338);Cry1Ac3(寄存编号CAA38098);Cry1Ac4(寄存编号AAA73077);Cry1Ac5(寄存编号AAA22339);Cry1Ac6(寄存编号AAA86266);Cry1Ac7(寄存编号AAB46989);Cry1Ac8(寄存编号AAC44841);Cry1Ac9(寄存编号AAB49768);CrylAc10(寄存编号CAA05505);CrylAc11(寄存编号CAA10270);Cry1Ac12(寄存编号Il2418);Cry1Ac13(寄存编号AAD38701);Cry1Ac14(寄存编号AAQ06607);Cry1Ac15(寄存编号AAN07788);Cry1Ac16(寄存编号AAU87037);CrylAc17(寄存编号AAX18704);Cry1Ac18(寄存编号AAY88347);Cry1Ac19(寄存编号ABD37053);Cry1Ac20(寄存编号ABB89046);Cry1Ac21(寄存编号AAY66992);Cry1Ac22(寄存编号ABZ01836);Cry1Ac23(寄存编号CAQ30431);Cry1Ac24(寄存编号ABL01535);Cry1Ac25(寄存编号FJ513324);Cry1Ac26(寄存编号FJ617446);Cry1Ac27(寄存编号FJ617447);Cry1Ac28(寄存编号ACM90319);Cry1Ac29(寄存编号DQ438941);Cry1Ac30(寄存编号GQ227507);Cry1Ac31(寄存编号GU446674);Cry1Ac32(寄存编号HM061081);Cry1Ac33(寄存编号GQ866913);Cry1Ac34(寄存编号HQ230364);Cry1Ac35(寄存编号JF340157);Cry1Ac36(寄存编号JN387137);Cry1Ac37(寄存编号JQ317685);CrylAd1(寄存编号AAA22340);Cry1Ad2(寄存编号CAA01880);CrylAe1(寄存编号AAA22410);CrylAf1(寄存编号AAB82749);CrylAg1(寄存编号AAD46137);CrylAh1(寄存编号AAQ14326);Cry1Ah2(寄存编号ABB76664);Cry1Ah3(寄存编号HQ439779);CrylAi1(寄存编号AA039719);Cry1Ai2(寄存编号HQ439780);Cry1A-like(寄存编号AAK14339);Cry1Bal(寄存编号CAA29898);Cry1Ba2(寄存编号CAA65003);Cry1Ba3(寄存编号AAK63251);Cry1Ba4(寄存编号AAK51084);Cry1Ba5(寄存编号AB020894);Cry1Ba6(寄存编号ABL60921);Cry1Ba7(寄存编号HQ439781);CrylBb1(寄存编号AAA22344);Cry1Bb2(寄存编号HQ439782);Cry1Bcl(寄存编号CAA86568);Cry1Bdl(寄存编号AAD10292);Cry1Bd2(寄存编号AAM93496);CrylBe1(寄存编号AAC32850);Cry1Be2(寄存编号AAQ52387);Cry1Be3(寄存编号ACV96720);Cry1Be4(寄存编号HM070026);CrylBf1(寄存编号CAC50778);Cry1Bf2(寄存编号AAQ52380);Cry1Bgl(寄存编号AA039720);Cry1Bhl(寄存编号HQ589331);Cry1Bil(寄存编号KC156700);Cry1Cal(寄存编号CAA30396);Cry1Ca2(寄存编号CAA31951);Cry1Ca3(寄存编号AAA22343);Cry1Ca4(寄存编号CAA01886);Cry1Ca5(寄存编号CAA65457);Cry1Ca6[1](寄存编号AAF37224);Cry1Ca7(寄存编号AAG50438);Cry1Ca8(寄存编号AAM00264);Cry1Ca9(寄存编号AAL79362);CrylCa10(寄存编号AAN16462);Cry1Ca11(寄存编号AAX53094);Cry1Ca12(寄存编号HM070027);Cry1Ca13(寄存编号HQ412621);Cry1Ca14(寄存编号JN651493);CrylCb1(寄存编号M97880);Cry1Cb2(寄存编号AAG35409);Cry1Cb3(寄存编号ACD50894);Cry1Cb-like(寄存编号AAX63901);Cry1Dal(寄存编号CAA38099);Cry1Da2(寄存编号I76415);Cry1Da3(寄存编号HQ439784);Cry1 Dbl(寄存编号CAA80234);Cry1 Db2(寄存编号AAK48937);Cry1 Dcl(寄存编号ABK35074);Cry1Eal(寄存编号CAA37933);Cry1Ea2(寄存编号CAA39609);Cry1Ea3(寄存编号AAA22345);Cry1Ea4(寄存编号AAD04732);Cry1Ea5(寄存编号A15535);Cry1Ea6(寄存编号AAL50330);Cry1Ea7(寄存编号AAW72936);Cry1Ea8(寄存编号ABX11258);Cry1Ea9(寄存编号HQ439785);CrylEa10(寄存编号ADR00398);CrylEa11(寄存编号JQ652456);Cry1Ebl(寄存编号AAA22346);Cry1Fal(寄存编号AAA22348);Cry1Fa2(寄存编号AAA22347);Cry1Fa3(寄存编号HM070028);Cry1Fa4(寄存编号HM439638);CrylFbl(寄存编号CAA80235);Cry1Fb2(寄存编号BAA25298);Cry1Fb3(寄存编号AAF21767);Cry1Fb4(寄存编号AAC10641);Cry1Fb5(寄存编号AA013295);Cry1Fb6(寄存编号ACD50892);Cry1Fb7(寄存编号ACD50893);CrylGal(寄存编号CAA80233);Cry1Ga2(寄存编号CAA70506);CrylGbl(寄存编号AAD10291);Cry1Gb2(寄存编号AA013756);CrylGcl(寄存编号AAQ52381);CrylHa1(寄存编号CAA80236);CrylHbl(寄存编号AAA79694);Cry1Hb2(寄存编号HQ439786);CrylH-like(寄存编号AAF01213);CrylIal(寄存编号CAA44633);Cry1Ia2(寄存编号AAA22354);Cry1Ia3(寄存编号AAC36999);Cry1Ia4(寄存编号AAB00958);Cry1Ia5(寄存编号CAA70124);Cry1Ia6(寄存编号AAC26910);Cry1Ia7(寄存编号AAM73516);Cry1Ia8(寄存编号AAK66742);Cry1Ia9(寄存编号AAQ08616);Cry1Ia10(寄存编号AAP86782);CrylIa11(寄存编号CAC85964);Cry1Ia12(寄存编号AAV53390);Cry1Ia13(寄存编号ABF83202);Cry1Ia14(寄存编号ACG63871);Cry1Ia15(寄存编号FJ617445);Cry1Ia16(寄存编号FJ617448);CrylIal7(寄存编号GU989199);CrylIal8(寄存编号ADK23801);CrylIal9(寄存编号HQ439787);Cry1Ia20(寄存编号JQ228426);Cry1Ia21(寄存编号JQ228424);Cry1Ia22(寄存编号JQ228427);Cry1Ia23(寄存编号JQ228428);Cry1Ia24(寄存编号JQ228429);Cry1Ia25(寄存编号JQ228430);Cry1Ia26(寄存编号JQ228431);Cry1Ia27(寄存编号JQ228432);Cry1Ia28(寄存编号JQ228433);Cry1Ia29(寄存编号JQ228434);Cry1Ia30(寄存编号JQ317686);Cry1Ia31(寄存编号JX944038);Cry1Ia32(寄存编号JX944039);Cry1Ia33(寄存编号JX944040);CrylIb1(寄存编号AAA82114);Cry1Ib2(寄存编号ABW88019);Cry1Ib3(寄存编号ACD75515);Cry1Ib4(寄存编号HM051227);Cry1Ib5(寄存编号HM070028);Cry1Ib6(寄存编号ADK38579);Cry1Ib7(寄存编号JN571740);Cry1Ib8(寄存编号JN675714);Cry1Ib9(寄存编号JN675715);Cry1Ib10(寄存编号JN675716);CrylIbll(寄存编号JQ228423);CrylIcl(寄存编号AAC62933);Cry1Ic2(寄存编号AAE71691);CrylIdl(寄存编号AAD44366);Cry1Id2(寄存编号JQ228422);CrylIel(寄存编号AAG43526);Cry1Ie2(寄存编号HM439636);Cry1Ie3(寄存编号KC156647);Cry1Ie4(寄存编号KC156681);Cryllfl(寄存编号AAQ52382);CrylIgl(寄存编号KC156701);CrylI-like(寄存编号AAC31094);CrylI-like(寄存编号ABG88859);CrylJal(寄存编号AAA22341);Cry1Ja2(寄存编号HM070030);Cry1Ja3(寄存编号JQ228425);CrylJbl(寄存编号AAA98959);CrylJcl(寄存编号AAC31092);Cry1Jc2(寄存编号AAQ52372);CrylJdl(寄存编号CAC50779);CrylKal(寄存编号AAB00376);Cry1Ka2(寄存编号HQ439783);CrylLal(寄存编号AAS60191);Cry1La2(寄存编号HM070031);CrylMal(寄存编号FJ884067);Cry1Ma2(寄存编号KC156659);CrylNal(寄存编号KC156648);CrylNbl(寄存编号KC156678);Cryl-like(寄存编号AAC31091);Cry2Aal(寄存编号AAA22335);Cry2Aa2(寄存编号AAA83516);Cry2Aa3(寄存编号D86064);Cry2Aa4(寄存编号AAC04867);Cry2Aa5(寄存编号CAA10671);Cry2Aa6(寄存编号CAA10672);Cry2Aa7(寄存编号CAA10670);Cry2Aa8(寄存编号AA013734);Cry2Aa9(寄存编号AA013750);Cry2Aa10(寄存编号AAQ04263);Cry2Aa11(寄存编号AAQ52384);Cry2Aa12(寄存编号AB183671);Cry2Aa13(寄存编号ABL01536);Cry2Aa14(寄存编号ACF04939);Cry2Aa15(寄存编号JN426947);Cry2Abl(寄存编号AAA22342);Cry2Ab2(寄存编号CAA39075);Cry2Ab3(寄存编号AAG36762);Cry2Ab4(寄存编号AA013296);Cry2Ab5(寄存编号AAQ04609);Cry2Ab6(寄存编号AAP59457);Cry2Ab7(寄存编号AAZ66347);Cry2Ab8(寄存编号ABC95996);Cry2Ab9(寄存编号ABC74968);Cry2Ab10(寄存编号EF157306);Cry2Ab11(寄存编号CAM84575);Cry2Ab12(寄存编号ABM21764);Cry2Ab13(寄存编号ACG76120);Cry2Ab14(寄存编号ACG76121);Cry2Ab15(寄存编号HM037126);Cry2Ab16(寄存编号GQ866914);Cry2Abl 7(寄存编号HQ439789);Cry2Ab18(寄存编号JN135255);Cry2Ab19(寄存编号JN135256);Cry2Ab20(寄存编号JN135257);Cry2Ab21(寄存编号JN135258);Cry2Ab22(寄存编号JN135259);Cry2Ab23(寄存编号JN135260);Cry2Ab24(寄存编号JN135261);Cry2Ab25(寄存编号JN415485);Cry2Ab26(寄存编号JN426946);Cry2Ab27(寄存编号JN415764);Cry2Ab28(寄存编号JN651494);Cry2Acl(寄存编号CAA40536);Cry2Ac2(寄存编号AAG35410);Cry2Ac3(寄存编号AAQ52385);Cry2Ac4(寄存编号ABC95997);Cry2Ac5(寄存编号ABC74969);Cry2Ac6(寄存编号ABC74793);Cry2Ac7(寄存编号CAL18690);Cry2Ac8(寄存编号CAM09325);Cry2Ac9(寄存编号CAM09326);Cry2Ac10(寄存编号ABN15104);Cry2Ac11(寄存编号CAM83895);Cry2Ac12(寄存编号CAM83896);Cry2Adl(寄存编号AAF09583);Cry2Ad2(寄存编号ABC86927);Cry2Ad3(寄存编号CAK29504);Cry2Ad4(寄存编号CAM32331);Cry2Ad5(寄存编号CA078739);Cry2Ael(寄存编号AAQ52362);Cry2Afl(寄存编号AB030519);Cry2Af2(寄存编号GQ866915);Cry2Agl(寄存编号ACH91610);Cry2Ahl(寄存编号EU939453);Cry2Ah2(寄存编号ACL80665);Cry2Ah3(寄存编号GU073380);Cry2Ah4(寄存编号KC156702);Cry2Ail(寄存编号FJ788388);Cry2Aj(寄存编号);Cry2Akl(寄存编号KC156660);Cry2Bal(寄存编号KC156658);Cry3Aal(寄存编号AAA22336);Cry3Aa2(寄存编号AAA22541);Cry3Aa3(寄存编号CAA68482);Cry3Aa4(寄存编号AAA22542);Cry3Aa5(寄存编号AAA50255);Cry3Aa6(寄存编号AAC43266);Cry3Aa7(寄存编号CAB41411);Cry3Aa8(寄存编号AAS79487);Cry3Aa9(寄存编号AAW05659);Cry3Aa10(寄存编号AAU29411);Cry3Aa11(寄存编号AAW82872);Cry3Aa12(寄存编号ABY49136);Cry3Bal(寄存编号CAA34983);Cry3Ba2(寄存编号CAA00645);Cry3Ba3(寄存编号JQ397327);Cry3Bbl(寄存编号AAA22334);Cry3Bb2(寄存编号AAA74198);Cry3Bb3(寄存编号Il5475);Cry3Cal(寄存编号CAA42469);Cry4Aal(寄存编号CAA68485);Cry4Aa2(寄存编号BAA00179);Cry4Aa3(寄存编号CAD30148);Cry4Aa4(寄存编号AFB18317);Cry4A-like(寄存编号AAY96321);Cry4Bal(寄存编号CAA30312);Cry4Ba2(寄存编号CAA30114);Cry4Ba3(寄存编号AAA22337);Cry4Ba4(寄存编号BAA00178);Cry4Ba5(寄存编号CAD30095);Cry4Ba-like(寄存编号ABC47686);Cry4Cal(寄存编号EU646202);Cry4Cbl(寄存编号FJ403208);Cry4Cb2(寄存编号FJ597622);Cry4Ccl(寄存编号FJ403207);Cry5Aal(寄存编号AAA67694);Cry5Abl(寄存编号AAA67693);Cry5Acl(寄存编号I34543);Cry5Adl(寄存编号ABQ82087);Cry5Bal(寄存编号AAA68598);Cry5Ba2(寄存编号ABW88931);Cry5Ba3(寄存编号AFJ04417);Cry5Cal(寄存编号HM461869);Cry5Ca2(寄存编号ZP_04123426);Cry5Dal(寄存编号HM461870);Cry5Da2(寄存编号ZP_04123980);Cry5Eal(寄存编号HM485580);Cry5Ea2(寄存编号ZP_04124038);Cry6Aal(寄存编号AAA22357);Cry6Aa2(寄存编号AAM46849);Cry6Aa3(寄存编号ABH03377);Cry6Bal(寄存编号AAA22358);Cry7 Aal(寄存编号AAA22351);Cry7Abl(寄存编号AAA21120);Cry7Ab2(寄存编号AAA21121);Cry7Ab3(寄存编号ABX24522);Cry7Ab4(寄存编号EU380678);Cry7Ab5(寄存编号ABX79555);Cry7Ab6(寄存编号ACI44005);Cry7Ab7(寄存编号ADB89216);Cry7Ab8(寄存编号GU145299);Cry7Ab9(寄存编号ADD92572);Cry7Bal(寄存编号ABB70817);Cry7Bbl(寄存编号KC156653);Cry7Cal(寄存编号ABR67863);Cry7Cbl(寄存编号KC156698);Cry7Dal(寄存编号ACQ99547);Cry7Da2(寄存编号HM572236);Cry7Da3(寄存编号KC156679);Cry7Eal(寄存编号HM035086);Cry7Ea2(寄存编号HM132124);Cry7Ea3(寄存编号EEM19403);Cry7Fal(寄存编号HM035088);Cry7Fa2(寄存编号EEM19090);Cry7Fbl(寄存编号HM572235);Cry7Fb2(寄存编号KC156682);Cry7Gal(寄存编号HM572237);Cry7Ga2(寄存编号KC156669);Cry7Gbl(寄存编号KC156650);Cry7Gcl(寄存编号KC156654);Cry7Gdl(寄存编号KC156697);Cry7Hal(寄存编号KC156651);Cry7Ial(寄存编号KC156665);Cry7Jal(寄存编号KC156671);Cry7Kal(寄存编号KC156680);Cry7Kbl(寄存编号BAM99306);Cry7Lal(寄存编号BAM99307);Cry8Aal(寄存编号AAA21117);Cry8Abl(寄存编号EU044830);Cry8Acl(寄存编号KC156662);Cry8Adl(寄存编号KC156684);Cry8Bal(寄存编号AAA21118);Cry8Bbl(寄存编号CAD57542);Cry8Bcl(寄存编号CAD57543);Cry8Cal(寄存编号AAA21119);Cry8Ca2(寄存编号AAR98783);Cry8Ca3(寄存编号EU625349);Cry8Ca4(寄存编号ADB54826);Cry8Dal(寄存编号BAC07226);Cry8Da2(寄存编号BD133574);Cry8Da3(寄存编号BD133575);Cry8Dbl(寄存编号BAF93483);Cry8Eal(寄存编号AAQ73470);Cry8Ea2(寄存编号EU047597);Cry8Ea3(寄存编号KC855216);Cry8Fal(寄存编号AAT48690);Cry8Fa2(寄存编号HQl74208);Cry8Fa3(寄存编号AFH78109);Cry8Gal(寄存编号AAT46073);Cry8Ga2(寄存编号ABC42043);Cry8Ga3(寄存编号FJ198072);Cry8Hal(寄存编号AAW81032);Cry8Ial(寄存编号EU381044);Cry8Ia2(寄存编号GU073381);Cry8Ia3(寄存编号HM044664);Cry8Ia4(寄存编号KC156674);Cry8Ibl(寄存编号GU325772);Cry8Ib2(寄存编号KC156677);Cry8Jal(寄存编号EU625348);Cry8Kal(寄存编号FJ422558);Cry8Ka2(寄存编号ACN87262);Cry8Kbl(寄存编号HM123758);Cry8Kb2(寄存编号KC156675);Cry8Lal(寄存编号GU325771);Cry8Mal(寄存编号HM044665);Cry8Ma2(寄存编号EEM86551);Cry8Ma3(寄存编号HM210574);Cry8Nal(寄存编号HM640939);Cry8Pal(寄存编号HQ388415);Cry8Qal(寄存编号HQ441166);Cry8Qa2(寄存编号KC152468);Cry8Ral(寄存编号AFP87548);Cry8Sal(寄存编号JQ740599);Cry8Tal(寄存编号KC156673);Cry8-like(寄存编号FJ770571);Cry8-like(寄存编号ABS53003);Cry9Aal(寄存编号CAA41122);Cry9Aa2(寄存编号CAA41425);Cry9Aa3(寄存编号GQ249293);Cry9Aa4(寄存编号GQ249294);Cry9Aa5(寄存编号JXl 74110);Cry9Aa like(寄存编号AAQ52376);Cry9Bal(寄存编号CAA52927);Cry9Ba2(寄存编号GU299522);Cry9Bbl(寄存编号AAV28716);Cry9Cal(寄存编号CAA85764);Cry9Ca2(寄存编号AAQ52375);Cry9Dal(寄存编号BAAl9948);Cry9Da2(寄存编号AAB97923);Cry9Da3(寄存编号GQ249293);Cry9Da4(寄存编号GQ249297);Cry9Dbl(寄存编号AAX78439);Cry9Dcl(寄存编号KCl 56683);Cry9Eal(寄存编号BAA34908);Cry9Ea2(寄存编号AA012908);Cry9Ea3(寄存编号ABM21765);Cry9Ea4(寄存编号ACE88267);Cry9Ea5(寄存编号ACF04743);Cry9Ea6(寄存编号ACG63872);Cry9Ea7(寄存编号FJ380927);Cry9Ea8(寄存编号GQ249292);Cry9Ea9(寄存编号JN651495);Cry9Ebl(寄存编号CAC50780);Cry9Eb2(寄存编号GQ249298);Cry9Eb3(寄存编号KC156646);Cry9Ecl(寄存编号AAC63366);Cry9Edl(寄存编号AAX78440);Cry9Eel(寄存编号GQ249296);Cry9Ee2(寄存编号KC156664);Cry9Fal(寄存编号KC156692);Cry9Gal(寄存编号KC156699);Cry9-like(寄存编号AAC63366);Cry10Aal(寄存编号AAA22614);Cry10Aa2(寄存编号E00614);Cry10Aa3(寄存编号CAD30098);Cry10Aa4(寄存编号AFB18318);Cry10A-like(寄存编号DQ167578);Cry11Aal(寄存编号AAA22352);Cry11Aa2(寄存编号AAA22611);Cry11Aa3(寄存编号CAD30081);Cry11Aa4(寄存编号AFB18319);Cry11Aa-like(寄存编号DQ166531);Cry11Bal(寄存编号CAA60504);Cry11Bbl(寄存编号AAC97162);Cry11Bb2(寄存编号HM068615);Cry12Aal(寄存编号AAA22355);Cry13Aal(寄存编号AAA22356);Cry14Aal(寄存编号AAA21516);Cry14Abl(寄存编号KC156652);Cry15Aal(寄存编号AAA22333);Cryl6Aal(寄存编号CAA63860);Cry17Aal(寄存编号CAA67841);Cry18Aal(寄存编号CAA67506);Cryl8Bal(寄存编号AAF89667);Cry18Cal(寄存编号AAF89668);Cry19Aal(寄存编号CAA68875);Cry19Bal(寄存编号BAA32397);Cry19Cal(寄存编号AFM37572);Cry20Aal(寄存编号AAB93476);Cry20Bal(寄存编号ACS93601);Cry20Ba2(寄存编号KC156694);Cry20-like(寄存编号GQ144333);Cry21Aal(寄存编号I32932);Cry21Aa2(寄存编号I66477);Cry21Bal(寄存编号BAC06484);Cry21Cal(寄存编号JF521577);Cry21Ca2(寄存编号KC156687);Cry21Dal(寄存编号JF521578);Cry22Aal(寄存编号I34547);Cry22Aa2(寄存编号CAD43579);Cry22Aa3(寄存编号ACD93211);Cry22Abl(寄存编号AAK50456);Cry22Ab2(寄存编号CAD43577);Cry22Bal(寄存编号CAD43578);Cry22Bbl(寄存编号KC156672);Cry23Aal(寄存编号AAF76375);Cry24Aal(寄存编号AAC61891);Cry24Bal(寄存编号BAD32657);Cry24Cal(寄存编号CAJ43600);Cry25Aal(寄存编号AAC61892);Cry26Aal(寄存编号AAD25075);Cry27Aal(寄存编号BAA82796);Cry28Aal(寄存编号AAD24189);Cry28Aa2(寄存编号AAG00235);Cry29Aal(寄存编号CAC80985);Cry30Aal(寄存编号CAC80986);Cry30Bal(寄存编号BAD00052);Cry30Cal(寄存编号BAD67157);Cry30Ca2(寄存编号ACU24781);Cry30Dal(寄存编号EF095955);Cry30Dbl(寄存编号BAE80088);Cry30Eal(寄存编号ACC95445);Cry30Ea2(寄存编号FJ499389);Cry30Fal(寄存编号ACI22625);Cry30Gal(寄存编号ACG60020);Cry30Ga2(寄存编号HQ638217);Cry31Aal(寄存编号BAB11757);Cry31Aa2(寄存编号AAL87458);Cry31Aa3(寄存编号BAE79808);Cry31Aa4(寄存编号BAF32571);Cry31Aa5(寄存编号BAF32572);Cry31Aa6(寄存编号BA144026);Cry31Abl(寄存编号BAE79809);Cry31Ab2(寄存编号BAF32570);Cry31Acl(寄存编号BAF34368);Cry31Ac2(寄存编号AB731600);Cry31Adl(寄存编号BA144022);Cry32Aal(寄存编号AAG36711);Cry32Aa2(寄存编号GU063849);Cry32Abl(寄存编号GU063850);Cry32Bal(寄存编号BAB78601);Cry32Cal(寄存编号BAB78602);Cry32Cbl(寄存编号KC156708);Cry32Dal(寄存编号BAB78603);Cry32Eal(寄存编号GU324274);Cry32Ea2(寄存编号KC156686);Cry32Ebl(寄存编号KC156663);Cry32Fal(寄存编号KC156656);Cry32Gal(寄存编号KC156657);Cry32Hal(寄存编号KC156661);Cry32Hbl(寄存编号KC156666);Cry32Ial(寄存编号KC156667);Cry32Jal(寄存编号KC156685);Cry32Kal(寄存编号KC156688);Cry32Lal(寄存编号KC156689);Cry32Mal(寄存编号KC156690);Cry32Mbl(寄存编号KC156704);Cry32Nal(寄存编号KC156691);Cry32Oal(寄存编号KC156703);Cry32Pal(寄存编号KC156705);Cry32Qal(寄存编号KC156706);Cry32Ral(寄存编号KC156707);Cry32Sal(寄存编号KC156709);Cry32Tal(寄存编号KC156710);Cry32Ual(寄存编号KC156655);Cry33Aal(寄存编号AAL26871);Cry34Aal(寄存编号AAG50341);Cry34Aa2(寄存编号AAK64560);Cry34Aa3(寄存编号AAT29032);Cry34Aa4(寄存编号AAT29030);Cry34Abl(寄存编号AAG41671);Cry34Acl(寄存编号AAG50118);Cry34Ac2(寄存编号AAK64562);Cry34Ac3(寄存编号AAT29029);Cry34Bal(寄存编号AAK64565);Cry34Ba2(寄存编号AAT29033);Cry34Ba3(寄存编号AAT29031);Cry35Aal(寄存编号AAG50342);Cry35Aa2(寄存编号AAK64561);Cry35Aa3(寄存编号AAT29028);Cry35Aa4(寄存编号AAT29025);Cry35Abl(寄存编号AAG41672);Cry35Ab2(寄存编号AAK64563);Cry35Ab3(寄存编号AY536891);Cry35Acl(寄存编号AAG50117);Cry35Bal(寄存编号AAK64566);Cry35Ba2(寄存编号AAT29027);Cry35Ba3(寄存编号AAT29026);Cry36Aal(寄存编号AAK64558);Cry37Aal(寄存编号AAF76376);Cry38Aal(寄存编号AAK64559);Cry39Aal(寄存编号BAB72016);Cry40Aal(寄存编号BAB72018);Cry40Bal(寄存编号BAC77648);Cry40Cal(寄存编号EU381045);Cry40Dal(寄存编号ACF15199);Cry41Aal(寄存编号BAD35157);Cry41Abl(寄存编号BAD35163);Cry41Bal(寄存编号HM461871);Cry41Ba2(寄存编号ZP_04099652);Cry42Aal(寄存编号BAD35166);Cry43Aal(寄存编号BAD15301);Cry43Aa2(寄存编号BAD95474);Cry43Bal(寄存编号BAD15303);Cry43Cal(寄存编号KC156676);Cry43Cbl(寄存编号KC156695);Cry43Ccl(寄存编号KC156696);Cry43-like(寄存编号BAD15305);Cry44Aa(寄存编号BAD08532);Cry45Aa(寄存编号BAD22577);Cry46Aa(寄存编号BAC79010);Cry46Aa2(寄存编号BAG68906);Cry46Ab(寄存编号BAD35170);Cry47 Aa(寄存编号AAY24695);Cry48Aa(寄存编号CAJ18351);Cry48Aa2(寄存编号CAJ86545);Cry48Aa3(寄存编号CAJ86546);Cry48Ab(寄存编号CAJ86548);Cry48Ab2(寄存编号CAJ86549);Cry49Aa(寄存编号CAH56541);Cry49Aa2(寄存编号CAJ86541);Cry49Aa3(寄存编号CAJ86543);Cry49Aa4(寄存编号CAJ86544);Cry49Abl(寄存编号CAJ86542);Cry50Aal(寄存编号BAE86999);Cry50Bal(寄存编号GU446675);Cry50Ba2(寄存编号GU446676);Cry51Aal(寄存编号AB114444);Cry51Aa2(寄存编号GU570697);Cry52Aal(寄存编号EF613489);Cry52Bal(寄存编号FJ361760);Cry53Aal(寄存编号EF633476);Cry53Abl(寄存编号FJ361759);Cry54Aal(寄存编号ACA52194);Cry54Aa2(寄存编号GQ140349);Cry54Bal(寄存编号GU446677);Cry55Aal(寄存编号ABW88932);Cry54Abl(寄存编号JQ916908);Cry55Aa2(寄存编号AAE33526);Cry56Aal(寄存编号ACU57499);Cry56Aa2(寄存编号GQ483512);Cry56Aa3(寄存编号JX025567);Cry57Aal(寄存编号ANC87261);Cry58Aal(寄存编号ANC87260);Cry59Bal(寄存编号JN790647);Cry59Aal(寄存编号ACR43758);Cry60Aal(寄存编号ACU24782);Cry60Aa2(寄存编号EA057254);Cry60Aa3(寄存编号EEM99278);Cry60Bal(寄存编号GU810818);Cry60Ba2(寄存编号EA057253);Cry60Ba3(寄存编号EEM99279);Cry61Aal(寄存编号HM035087);Cry61Aa2(寄存编号HM132125);Cry61Aa3(寄存编号EEM19308);Cry62Aal(寄存编号HM054509);Cry63Aal(寄存编号BA144028);Cry64Aal(寄存编号BAJ05397);Cry65Aal(寄存编号HM461868);Cry65Aa2(寄存编号ZP_04123838);Cry66Aal(寄存编号HM485581);Cry66Aa2(寄存编号ZP_04099945);Cry67Aal(寄存编号HM485582);Cry67Aa2(寄存编号ZP_04148882);Cry68Aal(寄存编号HQ113114);Cry69Aal(寄存编号HQ401006);Cry69Aa2(寄存编号JQ821388);Cry69Abl(寄存编号JN209957);Cry70Aal(寄存编号JN646781);Cry70Bal(寄存编号AD051070);Cry70Bbl(寄存编号EEL67276);Cry71Aal(寄存编号JX025568);Cry72Aal(寄存编号JX025569);Cyt1Aa(基因库寄存编号X03182);Cyt1Ab(基因库寄存编号X98793);Cyt1B(基因库寄存编号U37196);Cyt2A(基因库寄存编号Z14147);和Cyt2B(基因库寄存编号U52043)。

δ-内毒素的实例还包括但不限于第5,880,275号、第7,858,849号、第8,530,411号、第8,575,433号和第8,686,233号美国专利的Cry1A蛋白;第8,304,604号、第8,304,605号和第8,476,226号美国专利的DIG-3或DIG-11毒素cry蛋白(如Cry1A、Cry3A)的α-螺旋1和/或α-螺旋2变异体的N端缺失);美国专利序列编号10/525,318的Cry1B;第6,033,874号美国专利的Cry1C;第5,188,960号和第6,218,188号美国专利的Cry1F;第7,070,982号;第6,962,705号和第6,713,063号美国专利的Cry1A/F chimera;第7,064,249号美国专利的Cry2蛋白,如Cry2Ab蛋白;Cry3A蛋白,其包括但不限于经工程改造的杂交杀昆虫蛋白(eHIP),其通过融合可变区的独特组合和至少两种不同Cry蛋白的保守性嵌段而产生(第2010/0017914号美国专利申请揭示案);第7,329,736号、第7,449,552号、第7,803,943号、第7,476,781号、第7,105,332号、第7,378,499号和第7,462,760号美国专利的Cry4蛋白;Cry5蛋白;Cry6蛋白;Cry8蛋白;Cry9蛋白,诸如Cry9A、Cry9B、Cry9C、Cry9D、Cry9E和Cry9F家族的成员,包括但不限于第8,802,933号美国专利的Cry9D蛋白和第8,802,934号美国专利的Cry9B蛋白;Naimov,等人,(2008),“应用与环境微生物学(Applied andEnvironmental Microbiology),”74:7145-7151的Cry15蛋白;第6,127,180号、第6,624,145号和第6,340,593号美国专利的Cry22、Cry34Abl蛋白;第6,248,535号、第6,326,351号、第6,399,330号、第6,949,626号、第7,385,107号和第7,504,229号美国专利的CryET33和CryET34蛋白;第2006/0191034号、第2012/0278954号美国专利揭示案和第WO 2012/139004号PCT揭示案的CryET33和CryET34的同源物;第6,083,499号、第6,548,291号和第6,340,593号美国专利的Cry35Abl蛋白;Cry46蛋白、Cry 51蛋白、Cry二元毒素;TIC901或相关毒素;第2008/0295207号美国专利申请揭示案的TIC807;PCT US 2006/033867的ET29、ET37、TIC809、TIC810、TIC812、TIC127、TIC128;第8,513,494号美国专利的TIC853毒素;第8,236,757号美国专利的AXMI-027、AXMI-036和AXMI-038;第7,923,602号美国专利的AXMI-031、AXMI-039、AXMI-040、AXMI-049;WO 2006/083891的AXMI-018、AXMI-020和AXMI-021;WO2005/038032的AXMI-010;WO 2005/021585的AXMI-003;第2004/0250311号美国专利申请揭示案的AXMI-008;第2004/0216186号美国专利申请揭示案的AXMI-006;第2004/0210965号美国专利申请揭示案的AXMI-007;第2004/0210964号美国专利申请案的AXMI-009;第2004/0197917号美国专利申请揭示案的AXMI-014;第2004/0197916号美国专利申请揭示案的AXMI-004;WO 2006/119457的AXMI-028和AXMI-029;WO 2004/074462的AXMI-007、AXMI-008、AXMI-008orf2、AXMI-009、AXMI-014和AXMI-004;第8,084,416号美国专利的AXMI-150;第2011/0023184号美国专利申请揭示案的AXMI-205;第2011/0263488号美国专利申请揭示案的AXMI-011、AXMI-012、AXMI-013、AXMI-015、AXMI-019、AXMI-044、AXMI-037、AXMI-043、AXMI-033、AXMI-034、AXMI-022、AXMI-023、AXMI-041、AXMI-063和AXMI-064;第2010/0197592号美国专利申请揭示案的AXMI-Rl和相关蛋白;WO 2011/103248的AXMI221z、AXMI222z、AXMI223z、AXMI224z和AXMI225z;WO 2011/103247和第8,759,619号美国专利的AXMI218、AXMI219、AXMI220、AXMI226、AXMI227、AXMI228、AXMI229、AXMI230和AXMI231;第8,334,431号美国专利的AXMI-115、AXMI-113、AXMI-005、AXMI-163和AXMI-184;第2010/0298211号美国专利申请揭示案的AXMI-001、AXMI-002、AXMI-030、AXMI-035和AXMI-045;第2009/0144852号美国专利申请揭示案的AXMI-066和AXMI-076;第8,318,900号美国专利的AXMI128、AXMI130、AXMI131、AXMI133、AXMI140、AXMI141、AXMI142、AXMI143、AXMI144、AXMI146、AXMI148、AXMI149、AXMI152、AXMI153、AXMI154、AXMI155、AXMI156、AXMI157、AXMI158、AXMI162、AXMI165、AXMI166、AXMI167、AXMI168、AXMI169、AXMI170、AXMI171、AXMI172、AXMI173、AXMI174、AXMI175、AXMI176、AXMI177、AXMI178、AXMI179、AXMI180、AXMI181、AXMI182、AXMI185、AXMI186、AXMI187、AXMI188、AXMI189;第2010/0005543号美国专利申请揭示案的AXMI079、AXMI080、AXMI081、AXMI082、AXMI091、AXMI092、AXMI096、AXMI097、AXMI098、AXMI099、AXMI100、AXMI101、AXMI102、AXMI103、AXMI104、AXMI107、AXMI108、AXMI109、AXMI110、AXMI111、AXMI112、AXMI114、AXMI116、AXMI117、AXMI118、AXMI119、AXMI120、AXMI121、AXMI122、AXMI123、AXMI124、AXMI1257、AXMI1268、AXMI127、AXMI129、AXMI164、AXMI151、AXMI161、AXMI183、AXMI132、AXMI138、AXMI137;美国专利申请揭示案US20140223598的AXMI270;美国专利申请揭示案US20140223599的AXMI279;第8,319,019号美国专利的cry蛋白,诸如Cry1A和Cry3A,其具有经修饰的蛋白水解位点;第2011/0064710号美国专利申请揭示案的来自苏云金杆菌菌株VBTS 2528的Cry1Ac、Cry2Aa和Cry1Ca毒素蛋白。

其它Cry蛋白为本领域的技术人员众所周知的。参见N.克里克莫尔(N.Crickmore)等人,“苏云金杆菌杀虫晶体蛋白命名法的修订(Revision of the Nomenclature for theBacillus thuringiensis Pesticidal Crystal Proteins),”《微生物学与分子生物学综述(Microbiology and Molecular Biology Reviews)》,”(1998)第62卷:807-813;还参见N.克里克莫尔等人,“苏云金杆菌毒素命名法(Bacillus thuringiensis toxinnomenclature)”(2016),在btnomenclature.info,其可以使用“www”前缀在万维网上访问。

Cry蛋白作为转基因植物特性的用途为本领域的技术人员众所周知,且Cry转基因植物包括但不限于表达CrylAc、Cry1Ac+Cry2Ab、CrylAb、CrylA.105、CrylF、Cry1Fa2、CrylF+CrylAc、Cry2Ab、Cry3A、mCry3A、Cry3Bbl、Cry34Abl、Cry35Abl、Vip3A、mCry3A、Cry9c和已受到法规批准的CBI-Bt的植物。参见萨纳乌哈(Sanahuja)等人,“苏云金杆菌:研究、开发和商业应用的世纪(Bacillus thuringiensis:a century of research,development andcommercial applications),”(2011)《植物生物技术杂志(Plant Biotech.Journal)》,四月9(3):283-300和CERA(2010)GM作物环境风险评定数据库中心(GM Crop DatabaseCenter for Environmental Risk Assessment)(CERA),ILSI研究基金会(ILSI ResearchFoundation),华盛顿哥伦比亚特区.在cera-gmc.org/index.php?action=gm_crop_database,其可以使用“www”前缀在万维网上访问。本领域的技术人员众所周知的超过一种杀虫蛋白也可以在植物中表达,如Vip3Ab&CrylFa(US2012/0317682);CrylBE&CrylF(US2012/0311746);CrylCA&CrylAB(US2012/0311745);CrylF&CryCa(US2012/0317681);CrylDa&CrylBe(US2012/0331590);CrylDA&CrylFa(US2012/0331589);CrylAb&CrylBe(US2012/0324606);CrylFa&Cry2Aa和Cry1I&CrylE(US2012/0324605);Cry34Ab/35Ab和Cry6Aa(US20130167269);Cry34Ab/VCry35Ab&Cry3Aa(US20130167268);CrylAb&CrylF(US20140182018);以及Cry3A和CrylAb或Vip3Aa(US20130116170)。杀虫蛋白还包括杀昆虫脂肪酶,包括第7,491,869号美国专利的脂质酰基水解酶和胆固醇氧化酶,例如来自链霉菌(珀塞尔(Purcell)等人(1993)《生物化学与生物物理学研究通讯(Biochem.Biophys.Res.Commun.)》15:1406-1413)。

杀昆虫蛋白-Vip

杀虫蛋白还包括Vip(营养期杀昆虫蛋白)毒素。

如本领域中所描述,“昆虫病原细菌产生聚积在包涵体或伴胞晶体(如前述Cry和Cyt蛋白)中的杀昆虫蛋白,以及分泌到培养基中的杀昆虫蛋白。后者之中是Vip蛋白,其根据其氨基酸一致性划分成四种家族。Vip1和Vip2蛋白充当二元毒素,且对鞘翅目和半翅目的一些成员具有毒性。Vip1组分被认为结合到昆虫中肠的膜中的受体,并且Vip2组分进入细胞,其中其显示其针对肌动蛋白的ADP-核糖基转移酶活性,从而阻止微丝形成。Vip3不具有与Vip1或Vip2的序列相似性,且对鳞翅目的广泛多种成员具有毒性。其作用模式在蛋白水解活化、结合到中肠上皮细胞膜和孔形成方面已显示类似Cry蛋白的作用模式,尽管Vip3A蛋白不与Cry蛋白共享结合位点。后者特性使其成为良好候选物,其与转基因植物(苏云金杆菌处理的作物[Bt作物])中的Cry蛋白组合以预防或延迟昆虫抗性并且拓宽杀昆虫谱。存在Bt棉花和Bt玉米的市售种植品种,其表达Vip3Aa蛋白以及Cry蛋白。对于最近报导的Vip4家族,尚未发现目标昆虫。”参见Chakroun等人,“昆虫病原细菌中的细菌营养期杀昆虫蛋白(Vip)(Bacterial Vegetative Insecticidal Proteins(Vip)fromEntomopathogenic Bacteria),”《微生物学与分子生物学综述》2016年3月2日;80(2):329-350。

VIP可发现于第5,877,012号、第6,107,279号、第6,137,033号、第7,244,820号、第7,615,686号和第8,237,020号等美国专利。其它VIP蛋白为本属领域的技术人员众所周知的。(参见lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/vip.html,其可以使用“www”前缀在万维网上访问)。

杀昆虫蛋白-毒素复合(TC)家族蛋白

杀虫蛋白还包括毒素复合(TC)蛋白,其可从生物体,如致病杆菌属、光杆状菌属和类芽孢杆菌属获得(参见第7,491,698号和第8,084,418号美国专利)。一些TC蛋白具有“独立”杀昆虫活性并且其它TC蛋白增强由相同给定生物体产生的独立毒素的活性。可通过来源于不同属的源生物体的一或多种TC蛋白“增效剂”来增强“独立”TC蛋白(来自光杆状菌属、致病杆菌属或类芽孢杆菌属)的毒性。存在三种主要类型的TC蛋白。如本文中所提及,A类蛋白质(“蛋白A”)为独立毒素。B类蛋白质(“蛋白B”)和C类蛋白质(“蛋白C”)增强A类蛋白质的毒性。A类蛋白质的实例为TcbA、TcdA、XptAl和XptA2。B类蛋白质的实例为TcaC、TcdB、XptBlXb和XptClWi。C类蛋白质的实例为TccC、XptClXb和XptBl Wi。杀虫蛋白还包括蛛蛛、蛇和蝎毒液蛋白质。蛛蛛毒液肽的实例包括但不限于细胞毒素-1肽及其突变体(第8,334,366号美国专利)。

杀昆虫蛋白-组合

在一些实施例中,本发明涵盖利用一或多种杀昆虫蛋白的组合。举例来说,已知Cry蛋白对所有常见农业害虫具有有限效用,因为蛋白质仅靶向敏感昆虫物种中发现的特定受体。因此,通过与如本文中所教示的新颖杀昆虫蛋白一起表达Cry,预期植物物种将扩大保护以对抗较广泛种类的昆虫。

因此,本发明涵盖经工程改造的植物物种,其产生如本文中所教示的新颖杀昆虫蛋白,以及也表达一或多种其它杀昆虫蛋白,例如莫那辛、PIP、Cry、Cyt、VIP、TC及其任何组合的所述植物物种。

编码所发现的杀昆虫蛋白的核酸分子

本发明的一个方面涉及分离的或重组核酸分子,其包含编码杀昆虫多肽、蛋白质或其生物活性部分的核酸序列,以及足以用作杂交探针以识别编码具有序列同源性区域的蛋白质的核酸分子的核酸分子。

如本文所用,术语“核酸分子”是指DNA分子(例如重组DNA、cDNA、基因组DNA、质粒DNA、线粒体DNA)和RNA分子(例如mRNA)以及使用核苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是单链或双链的。

本文所用的“分离的”核酸分子(或DNA)是指不再处于其天然环境(例如活体外)的核酸序列(或DNA)。本文所用的“重组”核酸分子(或DNA)是指在重组细菌或植物宿主细胞中的核酸序列(或DNA)。在一些实施例中,“分离的”或“重组的”核酸不含在衍生核酸的生物体的基因组DNA中天然侧接核酸的序列(即,位于核酸的5'和3'末端的序列)。出于本发明的目的,当用于指核酸分子时,“分离的”或“重组的”不包括分离的染色体。举例来说,在各种实施例中,编码本发明的杀昆虫蛋白的重组核酸分子可含有在衍生核酸的细胞的基因组DNA中天然侧接核酸分子的核酸序列,其小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb。

在一些实施例中,与原生或基因组核酸序列相比,编码杀昆虫蛋白的分离的核酸分子在核酸序列中具有一或多个变化。在一些实施例中,原生或基因组核酸序列的变化包括但不限于:由于基因密码简并的核酸序列的变化;相比于天然或基因组序列,由于氨基酸取代、***、缺失和/或添加的核酸序列的变化;去除一或多个内含子;缺失一或多个上游或下游调节区;以及缺失与基因组核酸序列相关的5'和/或3'未翻译区。在一些实施例中,编码杀昆虫蛋白的核酸分子为非基因组序列。

涵盖对本发明的杀昆虫蛋白进行编码的多种多核苷酸。此类多核苷酸适用于在可操作地连接到适合启动子、转录终止子和/或聚腺苷酸化序列时在宿主细胞中产生杀昆虫蛋白。此类多核苷酸还可用作探针,其用于分离编码其它杀昆虫蛋白的同源或基本上同源多核苷酸。

可以从本文所揭示的序列中重新合成编码本发明的杀昆虫蛋白的多核苷酸。多核苷酸基因的序列可以通过使用基因密码从所揭示的蛋白质序列推断出。电脑程式,例如“BackTranslate”(GCGTM程序包,加利福尼亚州圣地亚哥的Acclerys公司)可用于将肽序列转换成编码肽的对应核苷酸序列。

此外,本发明的合成多核苷酸序列可以经设计以使得其将在植物中表达。第5,500,365号美国专利描述合成植物基因以改良由合成基因编码的蛋白质的表达水平的方法。此方法涉及外源性转基因的结构基因序列的修饰,以使得其由植物更有效地转录、处理、翻译和表达。在植物中表现良好的基因的特征包括消除序列,其可能在基因转录物的编码区中引起非所需内含子剪接或聚腺苷酸化,同时基本上保留杀昆虫蛋白的毒性部分的氨基酸序列。用于获得单子叶植物中转基因的增强表达的类似方法揭示于第5,689,052号美国专利。本文中所用的“互补序列”是指与给定核酸序列充分互补以使得其可与给定核酸序列杂交从而形成稳定双螺旋的核酸序列。本文所用的“多核苷酸序列变异体”是指编码相同多肽的除基因密码简并以外的核酸序列。

在一些实施例中,编码本发明的杀昆虫蛋白的核酸分子为非基因组核酸序列。如本文所用,“非基因组核酸序列”或“非基因组核酸分子”是指与原生或基因组核酸序列相比具有核酸序列中的一或多个变化的核酸分子。在一些实施例中,原生或基因组核酸分子的变化包括但不限于:由于核酸序列简并的核酸序列的变化;用于植物中的表达的核酸序列的密码子优化;与原生或基因组序列相比,引入至少一个氨基酸取代、***、缺失和/或添加的核酸序列的变化;去除与基因组核酸序列相关的一或多个内含子;***一或多个异源内含子;缺失与基因组核酸序列相关的一或多个上游或下游调节区;***一或多个异源上游或下游调节区;缺失与基因组核酸序列相关的5'和/或3'未翻译区;***异源5'和/或3'未翻译区;以及修饰聚腺苷酸化位点。在一些实施例中,非基因组核酸分子为cDNA。

在一些实施例中,本发明教示编码本文所教示的杀昆虫蛋白的核酸分子,以及编码本文所教示的具有氨基酸取代、缺失、***及其片段及其组合的蛋白质的核酸分子。

还提供编码转录和/或翻译产物的核酸分子,所述产物随后经剪接以最终产生功能性杀昆虫蛋白。剪接可以在活体外或活体内实现,并且可以涉及顺式或反式剪接。用于剪接的底物可以是多核苷酸(例如RNA转录物)或多肽。多核苷酸的顺式剪接的实例是其中去除***到编码序列中的内含子并且剪接两个侧接外显子区域以生成杀昆虫蛋白编码序列。反式剪接的实例将是其中通过将编码序列分离成两个或更多个片段来加密多核苷酸,所述片段可分开地转录且接着经剪接以形成全长杀虫蛋白编码序列。可以引入到构建体中的剪接强化子序列的使用可以促进在多肽的顺式或反式剪接中的剪接(第6,365,377号和第6,531,316号美国专利)。因此,在一些实施例中,多核苷酸不直接编码全长杀昆虫蛋白,而是对其一或多个片段进行编码。

为编码杀昆虫蛋白的前述序列的片段的核酸分子也由所述实施例涵盖。如本文所用的“片段”是指编码杀昆虫蛋白的核酸序列的一部分。核酸序列的片段可以编码蛋白质的生物活性部分,或其可以是可以使用本文所揭示的方法用作杂交探针或PCR引物的片段。为核酸序列的片段的核酸分子包含至少约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300或更多个连续核苷酸,或至多存在于编码本文所教示的杀昆虫蛋白的全长核酸序列中的核苷酸的数目。本文所用的“连续核苷酸”是指彼此紧邻的核苷酸残基。实施例的核酸序列的片段将编码保留杀昆虫蛋白的生物活性的蛋白质片段。在一些实施例中,核酸序列的片段将编码至少约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300或更多个连续氨基酸,或至多存在于本文所教示的全长杀昆虫蛋白的氨基酸的总数。在一些实施例中,所述片段为至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14或更多个氨基酸的N端和/或C端截短,其来自相对于本文所教示的杀昆虫蛋白的N端和/或C端,例如通过蛋白水解、***起始密码子、缺失编码缺失氨基酸的密码子,伴随***终止密码子或通过***所述编码序列中的终止密码子。

在一些实施例中,杀昆虫蛋白由与以下核酸序列足够相似的核酸序列编码:SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ IDNO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ IDNO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69或SEQ ID NO:71。本文所用的“足够相似”是指相较于使用本文所描述的或本领域的技术人员已知的比对程式中的一个,使用标准参数的参考序列,具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列相似性的氨基酸或核酸序列。

在一些实施例中,杀昆虫蛋白由与以下核酸序列具有足够序列一致性的核酸序列编码:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ IDNO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ IDNO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69或SEQID NO:71。“足够序列一致性”是指相较于使用本文所描述的或本领域的技术人员已知的比对程式中的一个,使用用标准参数的参考序列,具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列一致性的氨基酸或核酸序列。

一致性百分比计算

本领域的技术人员将认识到,前述值可以适当地调节以通过考虑密码子简并、氨基酸相似性、阅读框定位等来确定由两个核酸序列编码的蛋白质的对应同源性或一致性。在一些实施例中,序列同源性是针对编码蛋白质的多核苷酸的全长序列。在一些实施例中,使用具有所有默认参数的Vector

Figure BDA0002647180000000361

程式程序组(加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen Corporation,Carlsbad,Calif.))的模块中的ClustalW算法计算序列一致性。在一些实施例中,使用具有所有默认参数的Vector NTI程式程序组(加利福尼亚州卡尔斯巴德的英杰公司)的ALIGNX模块中的ClustalW算法计算整个全长多肽的序列一致性。

为了测定两个氨基酸序列或两个核酸序列的一致性百分比,为了最优比较目的对所述序列进行比对。两个序列之间的一致性百分比随由序列共享的相同位置的数目而变(即,一致性百分比=相同位置的数目/位置(例如,重叠位置)的总数×l00)。在一个实施例中,两个序列具有相同长度。在另一实施例中,比较整个参考序列。在容许或不容许空隙的情况下,可以使用与以下所描述类似的技术,测定两个序列之间的一致性百分比。在计算一致性百分比时,通常计数精确匹配。

两个序列(核酸或氨基酸)之间的一致性百分比的测定可以使用数学算法实现。用于比较两个序列的数学算法的非限制性实例是以下算法:卡林(Karlin)和阿尔丘尔(Altschul),(1990)《美国科学院院报(Proc.Natl.Acad.Sci.USA)》87:2264,如修改于卡林和阿尔丘尔,(1993)《美国科学院院报》90:5873-5877中。此类算法并入于阿尔丘尔等人,(1990)《分子生物学杂志》215:403的BLASTN和BLASTX程式中。BLAST核苷酸搜索可以用BLASTN程式进行,分数=100,字长=12,以获得与实施例的杀虫核酸分子同源的核酸序列。BLAST蛋白质搜索可以用BLASTX程式进行,分数=50,字长=3,以获得与实施例的杀虫蛋白分子同源的氨基酸序列。为了获得用于比较目的的带间隙的比对,可以如以下所描述利用Gapped BLAST(在BLAST 2.0中):阿尔丘尔等人,(1997)《核酸研究》25:3389。替代地,PSI-Blast可用于执行迭代搜索,其检测分子之间的远距离关系。参见前述阿尔丘尔等人,(1997)。当利用BLAST、Gapped BLAST和PSI-Blast程式时,可使用对应程式(例如,BLASTX和BLASTN)的默认参数。比对还可通过检查手动地执行。

用于比较序列的数学算法的另一非限制性实例为ClustalW算法(希金斯(Higgins)等人,(1994)《核酸研究》22:4673-4680)。ClustalW比较序列并且比对整个氨基酸或DNA序列,并且因此可以提供关于整个氨基酸序列的序列守恒的数据。ClustalW算法用于若干可商购的DNA/氨基酸分析软件包,例如Vector程式程序组(加利福尼亚州卡尔斯巴德的英杰公司)的

Figure BDA0002647180000000372

模块。在用ClustalW比对氨基酸序列之后,可以评定氨基酸一致性百分比。适用于分析ClustalW比对的软件程式的非限制性实例为GENEDOCTM。GENEDOCTM(卡尔·尼古拉斯(Karl Nicholas))允许评定多个蛋白质之间的氨基酸(或DNA)相似性和一致性。用于序列比较的数学算法的另一非限制性实例是迈尔斯(Myers)和米勒(Miller),(1988)CABIOS 4:11-17的算法。此类算法并入到ALIGN程式(版本2.0)中,所述程式是GCG Wisconsin Genetics软件包版本10的一部分(可购自美国加利福尼亚州圣地亚哥的Accelrys公司,9685斯克兰顿路)。当利用ALIGN程式比较氨基酸序列时,可以使用PAM120权重残基表、空隙长度罚分12和空隙处罚4。

用于比较序列的数学算法的另一非限制性实例为尼德尔曼(Needleman)和温施(Wunsch),(1970)《分子生物学杂志》48(3):443-453的算法,使用GAP版本10软件使用以下默认参数测定序列一致性或相似性:使用间隙权数50和长度权数3的核酸序列的一致性%和相似性%;使用间隙权数8和长度权数2的核酸序列的一致性%和相似性%;以及BLOSUM62评分程式。还可使用等效程式。因此,可以使用任何序列比较程式,其对于所讨论的任何两个序列产生具有相同核苷酸或氨基酸残基匹配的比对,并且计算序列一致性百分比。

核酸分子变异体

本发明提供编码杀昆虫蛋白变异体的核酸分子。编码核酸序列的“变异体”可包括编码本文所揭示的杀昆虫蛋白但由于基因密码的简并而保守地不同的那些序列,以及如上文所论述足够一致的那些序列。可以使用众所周知的分子生物学技术,例如如下文所概述的聚合酶链反应(PCR)和杂交技术鉴别出天然存在的等位基因变异体。变异核酸序列还包括合成地衍生的核酸序列,其已经例如通过使用定点诱变产生,但仍编码所揭示的杀昆虫蛋白。

本发明提供编码本文所揭示的杀昆虫蛋白中的任一个的分离的或重组多核苷酸。本领域普通技术人员将易于了解,归因于基因密码的简并,存在编码本发明的蛋白质的众多核苷酸序列。表A为提供每一氨基酸的同义密码子的密码子表。举例来说,密码子AGA、AGG、CGA、CGC、CGG和CGU都编码氨基酸精氨酸。因此,在其中精氨酸由密码子指定的本发明的核酸中的每个位置处,可以将密码子改变为上文所描述的对应的密码子中的任一个,而不改变经编码的多肽。应理解,RNA序列中的U对应于DNA序列中的T。

表A-同义密码子表

Figure BDA0002647180000000391

本领域的技术人员将进一步了解,可通过核酸序列的突变引入改变,从而产生经编码蛋白质的氨基酸序列的改变,而不改变蛋白质的生物活性。因此,可以通过将一或多个核苷酸取代、添加和/或缺失引入本文所揭示的对应核酸序列中,使得将一或多个氨基酸取代、添加或缺失引入到经编码蛋白质中而产生变异核酸分子。可以通过标准技术引入突变,例如定点诱变和PCR介导的诱变。此类变异核酸序列也由本发明所涵盖。

替代地,可以通过沿全部或部分编码序列随机引入突变(例如通过饱和诱变)来得到变异核酸序列,并且可以筛选所得突变体的赋予杀虫活性的能力,以识别保留活性的突变体。在诱变之后,可以重组方式表达经编码蛋白质,并且可以使用标准分析技术确定蛋白质的活性。

本发明的多核苷酸及其片段任选地用作多种重组和递归重组反应的底物,除了如例如奥斯贝(Ausubel)、伯杰(Berger)和萨布鲁克(Sambrook)所阐述的标准克隆方法以外,即,以产生具有所需特性的额外的杀虫蛋白同源物及其片段。多种此类反应为已知的。产生本文中所列的任何核酸的变异体的方法(其包含以递归方式将此类多核苷酸与第二(或更多)多核苷酸重组,因此形成变异多核苷酸库)也是本发明的实施例,产生的库、包含库的细胞以及通过此类方法产生的任何重组多核苷酸同样是本发明的实施例。

多种多样性产生方案,包括核酸递归重组方案是可获得的并且在本领域中完全描述。程序可以单独地和/或组合地使用以产生核酸或核酸组的一或多个变异体,以及经编码蛋白质的变异体。单独地并且共同地,这些程序提供产生多样化核酸和核酸组(包括例如核酸库)的稳固、广泛可适用的方式,所诉核酸和核酸组适用于例如工程改造或快速进化具有新和/或改进特征的核酸、蛋白质、路径、细胞和/或生物体。

虽然出于清楚起见,在随后的论述过程中进行区别和分类,但应了解,所述技术通常不相互排斥。实际上,各种方法可以单独或组合地(并联或联串)使用,以获取不同序列变异体。

本文所描述的多样性产生程序中的任一个的结果可为产生一或多个核酸,其可针对具有或赋予所需特性或者编码具有或赋予所需特性的蛋白质的核酸进行选择或筛选。在通过本文中的方法中的一或多个或以其它方式可供本领域的技术人员使用的多样化之后,所产生的任何核酸可以针对所需活性或特性,例如杀虫活性来选择。这可以包括通过本领域中的分析中的任一个鉴别可以例如以自动化或可自动化形式检测的任何活性,参见例如下文对杀昆虫活性的筛选的论述。可以在从业者的判断下连续或并行地评估多种相关(或甚至不相关)特性。

在以下揭示案及其中引用的文献中发现用于产生经修饰的核酸序列,例如编码具有杀虫活性或其片段的蛋白质的那些核酸序列的多种多样性产生程序的描述:宋(Soong)等人,(2000)《自然遗传学(Nat.Genet.)》25(4):436-439;施特默尔等人,(1999)《肿瘤靶向(Tumor Targeting)4:1-4》;尼斯(Ness)等人,(1999)《自然生物技术(Nat.Biotechnol.)》l7:893-896;常(Chang)等人,(1999)《自然生物技术》l7:793-797;米苏尔(Minshull)和施特默尔,(1999)《化学生物学现状(Curr.Opin.Chem.Biol.)》3:284-290;克里斯蒂安(Christian)等人,(1999)《自然生物技术》17:259-264;凯默瑞等人,(1998)《自然》391:288-291;凯默瑞等人,(1997)《自然生物技术》15:436-438;张等人,(1997)PNAS USA 94:4504-4509;帕滕(Patten)等人,(1997)《生物技术现状(Curr.Opin.Biotechnol.)》8:724-733;凯默瑞等人,(1996)《自然医学(Nat.Med.)》2:100-103;凯默瑞等人,(1996)《自然生物技术》14:315-319;盖茨(Gates)等人,(1996)《分子生物学杂志》255:373-386;施特默尔(1996)“性PCR和组装PCR(Sexual PCR and Assembly PCR)”于:《分子生物学百科全书(TheEncyclopedia of Molecular Biology)》.纽约VCH出版商.第447-457页;凯默瑞和施特默尔,(1995)《生物技术(BioTechniques)》18:194-195;施特默尔等人,(1995)《基因(Gene)》,164:49-53;施特默尔,(1995)《科学》270:1510;施特默尔,(1995)《生物技术(Biotechnology)》13:549-553;施特默尔,(1994)《自然》370:389-391以及施特默尔,(1994)PNAS USA 91:10747-10751。

产生多样性的突变方法包括例如定点诱变(凌(Ling)等人,(1997)《分析生物化学(Anal Biochem)》254(2):157-178;代尔(Dale)等人,(1996)《分子生物学方法(MethodsMol.Biol.)》57:369-374;史密斯(Smith),(1985)《遗传学年评(Ann.Rev.Genet.)》19:423-462;博特斯坦(Botstein)和肖特尔(Shortle),(1985)《科学》229:1193-1201;卡特尔(Carter),(1986)《生物化学杂志(Biochem.J.)》237:1-7和金克尔(Kunkel),(1987)“寡核苷酸定向诱变的效率(The efficiency of oligonucleotide directed mutagenesis)”于《核酸与分子生物学(Nucleic Acids&Molecular Biology)》(埃克斯坦(Eckstein)和利利(Lilley),编,柏林的斯普林格维拉格(Springer Verlag,Berlin));使用含尿嘧啶模板的诱变研究(mutagenesis using uracil containing templates)(金克尔,(1985)PNAS USA82:488-492;金克尔等人,(1987)《酶学方法(Methods Enzymol)》.154:367-382和巴斯(Bass)等人,(1988)《科学》242:240-245);寡核苷酸定向诱变(oligonucleotide-directedmutagenesis)(佐勒(Zoller)和史密斯,(1983)《酶学方法》.100:468-500;佐勒和史密斯,(1987)《酶学方法》.154:329-350(1987);佐勒和史密斯,(1982)《核酸研究》10:6487-6500),经硫代磷酸酯修饰的DNA诱变(phosphorothioate-modified DNA mutagenesis)(泰勒(Taylor)等人,(1985)《核酸研究》13:8749-8764;泰勒等人,(1985)《核酸研究》13:8765-8787(1985);仲间(Nakamaye)和埃克斯坦,(1986)《核酸研究》14:9679-9698;塞耶斯(Sayers)等人,(1988)《核酸研究》16:791-802和塞耶斯等人,(1988)《核酸研究》16:803-814);使用有间隙的双螺旋DNA的诱变(mutagenesis using gapped duplex DNA)(克莱默(Kramer)等人,(1984)《核酸研究》12:9441-9456;克莱默和弗里茨(Fritz),(1987)《酶学方法》.154:350-367;克莱默等人,(1988)《核酸研究》16:7207以及弗里茨等人,(1988)《核酸研究》16:6987-6999)。

额外适合的方法包括点错配修复(克莱默等人,(1984)《细胞(Cell)》38:879-887)、使用修复缺陷型宿主菌株的诱变(mutagenesis using repair-deficient hoststrains)(卡特尔等人,(1985)《核酸研究》13:4431-4443和卡特尔,(1987)《酶学方法》154:382-403)、缺失诱变(deletion mutagenesis)(埃赫特达尔扎德(Eghtedarzadeh)和海尼科夫(Henikoff),(1986)《核酸研究》14:5115)、限制性选择和限制性纯化(restriction-selection and restriction-purification)(韦尔斯(Wells)等人,(1986)《伦敦皇家学会哲学汇刊(Phil.Trans.R.Soc.Lond.)》A317:415-423)、通过总基因合成的诱变(mutagenesis by total gene synthesis)(比亚尔(Nambiar)等人,(1984)《科学》223:1299-1301;萨卡马尔(Sakamar)和霍拉纳(Khorana),(1988)《核酸研究》14:6361-6372;韦尔斯等人,(1985)《基因》34:315-323和葛朗德斯君姆(Grundstriim)等人,(1985)《核酸研究》13:3305-3316)、双链断裂修复(double-strand break repair)(曼德基(Mandecki),(1986)PNAS USA,83:7177-7181和阿诺德(Arnold),(1993)《生物技术现状(Curr.Opin.Biotech.)》4:450-455)。关于许多以上方法的额外细节可发现于《酶学方法》第154卷,其还描述使用各种诱变方法用于故障检修问题的有用控制。

关于各种多样性产生方法的额外细节可见于以下美国专利、PCT揭示案和申请案和EPO揭示案中:第5,723,323号美国专利、第5,763,192号美国专利、第5,814,476号美国专利、第5,817,483号美国专利、第5,824,514号美国专利、第5,976,862号美国专利、第5,605,793号美国专利、第5,811,238号美国专利、第5,830,721号美国专利、第5,834,252号美国专利、第5,837,458号美国专利、WO 1995/22625、WO 1996/33207、WO 1997/20078、WO 1997/35966、WO 1999/41402、WO 1999/41383、WO 1999/41369、WO 1999/41368、EP 752008、EP0932670、WO 1999/23107、WO 1999/21979、WO 1998/31837、WO 1998/27230、WO 1998/27230、WO 2000/00632、WO 2000/09679、WO 1998/42832、WO 1999/29902、WO 1998/41653、WO 1998/41622、WO 1998/42727、WO 2000/18906、WO 2000/04190、WO 2000/42561、WO2000/42559、WO 2000/42560和WO 2001/23401。

发现相关核酸的核酸分子探针

实施例的核苷酸序列还可以用于将对应序列与其它生物体,尤其是其它细菌,尤其是假单胞菌物种分离。以此方式,如PCR、杂交等的方法可用于基于它们与本文所阐述序列的序列同源性来鉴别此类序列。

实施例涵盖基于它们与本文所阐述的全部序列或其片段的序列一致性而选择的序列。此类序列包括作为所揭示的序列的直系同源物的序列。术语「直系同源物」是指来源于共同祖先基因并且由于物种形成发现于不同物种中的基因。当发现于不同物种中的基因的核苷酸序列和/或其编码蛋白质序列具有如在本文中其他地方定义的实质性一致性时,将所述基因视为直系同源物。直系同源物的功能在物种中通常是高度保守的。

在PCR方法中,可设计寡核苷酸引物以用于PCR反应中,以扩增来自提取自任何所关注的生物体的cDNA或基因组DNA的对应DNA序列。设计PCR引物和PCR克隆的方法在本领域中通常是已知的,并且揭示于萨布鲁克等人,(1989)《分子克隆:实验指南》(第2版,冷泉港实验室出版社,纽约普莱恩维尤),以下称作“萨布鲁克”中。还参见英尼斯等人编(1990)《PCR方案:方法和应用指导》(学术出版社,纽约);英尼斯和吉尔凡编(1995)《PCR策略》(学术出版社,纽约);以及英尼斯和吉尔凡编(1999)《PCR方法手册》(学术出版社,纽约)。已知的PCR方法包括但不限于使用成对引物、巢式引物、单一特异性引物、简并引物、基因特异性引物、载体特异性引物、部分不匹配引物等的方法。

为了从细菌集合鉴别本发明的杀昆虫蛋白,可以使用蛋白质印迹法和/或ELISA方法用针对所教示的蛋白质产生的抗体筛选细菌细胞裂解物。此类型的分析可以高处理量方式执行。可以通过各种技术,如基于抗体的蛋白质纯化和识别来进一步分析阳性样品。产生抗体的方法在本领域中众所周知,如下文所论述。

或者,基于质谱的蛋白质识别方法可用于使用文献中的方案来识别所教示的蛋白质的同源物(斯科特帕特森(Scott Patterson),(1998),10.22,1-24,由约翰·威利父子公司(John Wiley&Son Inc)出版的《分子生物学的当前方案(Current Protocol inMolecular Biology)》。具体来说,基于LC-MS/MS的蛋白质识别方法可用于使给定细胞裂解物或所需分子量富集样品(从相关分子量带的SDS-PAGE凝胶切除至本文中教示的蛋白质)的MS数据与所教示的蛋白质和同源物的序列信息相关联。肽序列中的任何匹配指示在样品中具有同源物的可能性。额外技术(蛋白质纯化和分子生物学)可用于分离蛋白质且识别同源物的序列。

在杂交方法中,杀虫核酸序列的全部或部分可用于筛选cDNA或基因组库。此类cDNA和基因组库的构建方法在本领域中通常是已知的,并且揭示于前述萨布鲁克和拉塞尔(Russell),(2001)中。所谓的杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸并且可以用可检测基团,如32P或任何其它可检测标记,如其它放射性同位素、荧光化合物、酶或酶辅因子标记。可以通过基于本文所揭示的已知编码肽的核酸序列标记合成寡核苷酸来得到用于杂交的探针。可以另外使用基于核酸序列中保守性核苷酸或氨基酸残基或者经编码氨基酸序列而设计的简并引物。探针通常包含在严格条件下与编码本发明蛋白质或其片段或变异体的核酸序列的至少约12、至少约25、至少约50、75、100、125、150、175或200个连续核苷酸杂交的核酸序列区域。制备用于杂交的探针的方法在本领域中通常是已知的,并且揭示于前述萨布鲁克和拉塞尔,(2001),其以引用的方式并入本文中。

举例来说,可将本文所教示的编码杀昆虫蛋白的整个核酸序列或其一或多个部分用作能够与编码类似序列和信使RNA的对应核酸序列特异性杂交的探针。为了在多种条件下实现特异性杂交,此类探针包括独特的并且优选地长度为至少约10个核苷酸或长度为至少约20个核苷酸的序列。此类探针可以用于通过PCR从所选生物体扩增对应的杀虫序列。此技术可用于将额外编码序列与所需生物体分离或作为诊断分析以确定生物体中编码序列的存在。杂交技术包括对所涂覆DNA库(菌斑或菌落)的杂交筛选;参考例如萨布鲁克等人,(1989)《分子克隆:实验指南》(第2版,冷泉港实验室出版社,纽约冷泉港(Cold SpringHarbor))。

此类序列的杂交可以在严格条件下进行。本文中所用的“严格条件”或“严格杂交条件”是指探针将与其目标序列杂交到可检测地大于其它序列的程度(例如,相对于背景至少2倍)的条件。严格条件具有序列依赖性并且将在不同情形下不同。通过控制杂交和/或洗涤条件的严格性,可以鉴别出与探针100%互补的目标序列(同源探测)。替代地,可以调节严格条件以允许序列中的一些错配,以便检测较低程度的相似性(异源探测)。一般来说,探针的长度小于约1000个核苷酸,优选小于500个核苷酸。

典型地,严格条件将是其中盐浓度小于约1.5M Na离子,通常约0.01至1.0M Na离子浓度(或其它盐),在pH 7.0至8.3下以及温度对于短探针(例如10至50个核苷酸)至少约30℃和对于长探针(例如,大于50个核苷酸)至少约60℃的那些条件。严格条件也可以用添加去稳定化剂(如甲酰胺)来实现。例示性低严格条件包括在37℃下与30到35%甲酰胺、1MNaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液杂交,并且在50到55℃下在1×到2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。例示性中等严格条件包括在37℃下在40到45%甲酰胺、1.0M NaCl、1%SDS中杂交,并且在55到60℃下在0.5×到1×SSC中洗涤。例示性高严格条件包括在37℃下在50%甲酰胺、1M NaCl、1%SDS中杂交,并且在60到65℃下在0.1×SSC中洗涤。任选地,洗涤缓冲液可包含约0.1%到约1%SDS。杂交持续时间一般小于约24小时,通常约4到约12小时。

特异性通常为杂交后洗涤的功能,关键因素为最终洗涤溶液的离子强度和温度。对于DNA-DNA杂交物,Tm可以自梅科斯(Meinkoth)和瓦尔(Wahl)(1984)《分析生物化学(Anal.Biochem.)》138:267-284的等式粗略估计:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%形式)-500/L;其中M为一价阳离子的摩尔浓度,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%形式为杂交溶液中甲酰胺的百分比,且L为碱基对中杂交物的长度。Tm是使50%的互补目标序列与完全匹配的探针杂交的温度(在既定离子强度和pH下)。对于每一1%的错配,Tm降低约1℃;因此,Tm、杂交和/或洗涤条件可调节以与具有所需属性的序列杂交。举例来说,如果寻求具有90%一致性的序列,那么Tm可降低10℃。一般来说,在所定义的离子强度和pH下,选择的严格条件比特定序列及其互补序列的热熔点(Tm)低约5℃。然而,极其严格条件可在比热熔点(Tm)低1℃、2℃、3℃或4℃下利用杂交和/或洗涤;适度严格条件可在比热熔点(Tm)低6℃、7℃、8℃、9℃或10℃下利用杂交和/或洗涤;低严格条件可在比热熔点(Tm)低11℃、12℃、13℃、14℃、15℃或20℃下利用杂交和/或洗涤。使用等式、杂交和洗涤组合物和所需Tm,本领域的技术人员将理解,固有地描述杂交和/或洗涤溶液的严格度的变化。如果所需错配程度产生小于45℃(水溶液)或32℃(甲酰胺溶液)的Tm,那么优选的是增加SSC浓度以使得可使用更高温度。对核酸杂交的广泛引导发现于提森(Tijssen),(1993)生物化学与分子生物学的实验室技术-核酸探针杂交(Laboratory Techniques inBiochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes),第I部分,第2章(纽约爱思维尔(Elsevier N.Y.));和奥苏贝尔(Ausubel)等人编(1995)《分子生物学当前方案(Current Protocols in Molecular Biology)》,第2章(格林出版公司和威利国际科学公司(Greene Publishing and Wiley-Interscience),纽约)。参见萨布鲁克等人,(1989)《分子克隆:实验指南》(第2版,冷泉港实验室出版社,纽约冷泉港)。

新发现的杀昆虫蛋白、变异体及其片段

本文揭示新颖的杀昆虫蛋白以及所述蛋白质的变异体及其片段。术语“蛋白质”和“多肽”在一些情况下可互换地使用,因为本领域中应理解,两种术语之间的分离仅可取决于氨基酸序列的数目。本发明的杀昆虫蛋白展现针对一或多种昆虫或害虫的杀昆虫或杀虫活性。

在一些实施例中,杀昆虫蛋白与以下氨基酸序列足够同源:SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72。“足够同源性”是指相较于使用本文所描述的或本领域的技术人员已知的比对程式中的一个,使用用标准参数的参考序列,具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同源性的氨基酸或核酸序列。

在一些实施例中,杀昆虫蛋白与以下氨基酸序列具有足够序列一致性:SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72。“足够序列一致性”是指相较于使用本文所描述的或本领域的技术人员已知的比对程式中的一个,使用用标准参数的参考序列,具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列一致性的氨基酸或核酸序列。

在一些实施例中,本发明提供以下氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72,其由以下核酸序列编码:SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ IDNO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ IDNO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69或SEQ ID NO:71。

如本文所用,术语“蛋白质”、“肽”或“多肽”包括包含五个或更多个氨基酸的任何分子。本领域中众所周知,蛋白质、肽或多肽分子可经历修饰,包括翻译后修饰,例如但不限于二硫键形成、糖基化、磷酸化或寡聚。因此,如本文所用,术语“蛋白质”、“肽分子”或“多肽”包括通过任何生物或非生物过程修饰的任何蛋白质。

本文中所用的“重组蛋白”是指不再处于其天然环境中,例如在活体外或在重组细菌或植物宿主细胞中的蛋白质。基本上不含细胞材料的杀昆虫蛋白包括具有小于约30%、20%、10%或5%(以干重计)的非杀虫蛋白(在本文中也称为“受到污染的蛋白质”)的蛋白质制备物。

“片段”或“生物活性部分”包括蛋白质片段,其包含与本文所教示的蛋白质足够一致并且展现杀昆虫活性的氨基酸序列。

因此,本发明涵盖以下所阐述的氨基酸序列的片段:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72。

在一些实施例中,蛋白质片段是至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14个或更多个氨基酸的N端和/或C端截短,其来自相对于SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72的N端和/或C端,例如通过蛋白水解、通过***起始密码子、通过缺失编码缺失氨基酸的密码子且伴随***起始密码子和/或***终止密码子。

如本文所用,“变异体”是指具有氨基酸序列的蛋白质或多肽,所述氨基酸序列与亲本氨基酸序列至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致。

如本文所用,关于核酸或氨基酸的序列一致性%的术语“约”意指以0.1%增量至多且包括±1.0%。举例来说,“约90%”序列一致性包括89.0%、89.1%、89.2%、89.3%、89.4%、89.5%、89.6%、89.7%、89.8%、89.9%、90%、90.1%、90.2%、90.3%、90.4%、90.5%、90.6%、90.7%、90.8%、90.9%和91%。如果不在序列一致性%的情形下使用,那么“约”意指±10%。

在一些实施例中,杀昆虫蛋白在以下氨基酸序列的整个长度上:SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性。

在一些实施例中,所述杀昆虫蛋白具有经修饰的物理特性。如本文所用,术语“物理特性”是指适合于描述蛋白质的物理化学特征的任何参数。如本文所用,“所关注的物理特性”和“所关注的特性”可互换地使用以指代正研究和/或修改的蛋白质的物理特性。物理特性的实例包括但不限于:蛋白质表面上的净表面电荷和电荷分布、蛋白质表面上的净疏水性和疏水性残基分布、表面电荷密度、表面疏水性密度、表面可电离群组的总数、表面张力、蛋白质尺寸及其在溶液中的分布、熔融温度、热容量和第二维里系数。物理特性的实例还包括但不限于:溶解性、折叠、稳定性和可消化性。在一些实施例中,所教示的杀昆虫蛋白在昆虫肠道中的蛋白水解片段的消化性已增加。用于通过模拟胃液消化的模型为本领域的技术人员已知的(富克斯R.L.(Fuchs,R.L.)和J.D.阿斯特伍德(J.D.Astwood).《食物技术(Food Technology)》50:83-88,1996;阿斯特伍德J.D.等人《自然生物技术(NatureBiotechnology)》14:1269-1273,1996;付(Fu)T J等人《农业与食品化学杂志(J.Agric.Food Chem.)》50:7154-7160,2002)。

在一些实施例中,变异体包括由于诱变而氨基酸序列不同的多肽。本发明所涵盖的变异蛋白具有生物活性,也就是说其继续具有天然蛋白质的所需生物活性(即杀虫活性)。在一些实施例中,所述变异体将具有天然蛋白质的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%或更多的杀昆虫活性。在一些实施例中,变异体可以具有优于天然蛋白质的改进的活性。

细菌基因极常具有接近开放阅读框的开始的多个甲硫氨酸起始密码子。通常,这些起始密码子中的一或多个处的翻译起始将引起功能性蛋白质的产生。这些起始密码子可以包括ATG密码子。然而,细菌(如芽孢杆菌属)还将密码子GTG识别为起始密码子,并且引发GTG密码子处翻译的蛋白质在第一氨基酸处含有甲硫氨酸。在罕见时刻下,细菌系统中的翻译可以在TTG密码子处起始,但在此情况下,TTG编码甲硫氨酸。此外,通常不凭经验确定这些密码子中的哪些在细菌中自然地使用。因此,应理解,使用替代甲硫氨酸密码子中的一个还可引起杀虫蛋白的产生。这些杀虫蛋白涵盖于本发明中并且可以用于本发明的方法中。应理解,当在植物中表达时,有必要将替代起始密码子更改为ATG以用于恰当翻译。

在另一方面,杀昆虫蛋白可以表达为具有催化多步骤翻译后蛋白质剪接的中间序列的前驱体蛋白质。蛋白质剪接涉及从多肽切除中间序列,同时伴随侧接序列的接合以产生新多肽(宗(Chong)等人,(1996)《生物化学杂志(J.Biol.Chem.)》,271:22159-22168)。此中间序列或蛋白质剪接元件称为内含肽,其通过在N端和C端剪接点处的三个协作反应催化其自身的切除:N端半胱氨酸或丝氨酸的酰基重排;两端之间的转酯化反应以形成分支酯或硫酯中间物,以及肽键裂解,其与内含肽C端天冬酰胺的环化偶合以释放内含肽(埃文斯(Evans)等人,(2000)《生物化学杂志》,275:9091-9094。蛋白质剪接机制的阐明引起许多基于内含肽的应用(克姆(Comb)等人,第5,496,714号美国专利;克姆等人,第5,834,247号美国专利;卡马雷罗(Camarero)和缪尔(Muir),(1999)《美国化学学会杂志(J.Amer.Chem.Soc.)》121:5597-5598;宗等人,(1997)《基因》192:271-281,宗等人,(1998)《核酸研究》26:5109-5115;宗等人,(1998)《生物化学杂志》273:10567-10577;科顿(Cotton)等人,(1999)《美国化学学会杂志(J.Am.Chem.Soc.)》121:1100-1101;埃文斯等人,(1999)《生物化学杂志》274:18359-18363;埃文斯等人,(1999)《生物化学杂志》274:3923-3926;埃文斯等人,(1998)《蛋白质科学(Protein Sci.)》7:2256-2264;埃文斯等人,(2000)《生物化学杂志》275:9091-9094;岩井(Iwai)和普拉克森(Pluckthun),(1999)《FEBS快报(FEBS Lett.)》459:166-172;马泰斯(Mathys)等人,(1999)《基因》231:1-13;米尔斯(Mills)等人,(1998)《美国科学院院报》95:3543-3548;缪尔等人,(1998)《美国科学院院报》95:6705-6710;雄友(Otomo)等人,(1999)《生物化学(Biochemistry)》38:16040-16044;雄友等人,(1999)《生物学分子NMR杂志(J.Biolmol.NMR)》14:105-114;斯科特等人,(1999)《美国科学院院报》96:13638-13643;谢韦里诺夫(Severinov)和缪尔,(1998)《生物化学杂志》273:16205-16209;辛雷德克(Shingledecker)等人,(1998)《基因》207:187-195;索斯沃斯(Southworth)等人,(1998)《EMBO杂志》17:918-926;索斯沃斯等人,(1999)《生物技术(Biotechniques)》27:110-120;伍德(Wood)等人,(1999)《自然生物技术》17:889-892;吴(Wu)等人,(1998a)《美国科学院院报》95:9226-9231;吴等人,(1998b)《生物化学与生物物理Acta(Biochim.Biophys.Acta)》1387:422-432;徐(Xu)等人,(1999)《美国科学院院报》96:388-393;山崎(Yamazaki)等人,(1998)《美国化学学会杂志》,120:5591-5592)。对于植物转基因中的内含肽的应用,参见杨(Yang)等人(《转基因研究(Transgene Res.)》15:583-593(2006))和埃文斯等人(《植物生物学年评(Annu.Rev.Plant Biol.)》56:375-392(2005))。

在另一方面,杀昆虫蛋白可以由两种单独基因编码,其中前驱体蛋白质的内含肽来自两种基因,称为分开内含肽,并且前驱体的两个部分通过肽键形成接合。此肽键形成通过内含肽介导的反式剪接实现。为此目的,包含两种单独基因的第一和第二表达盒进一步编码能够介导蛋白质反式剪接的内含肽。通过反式剪接,由第一和第二片段编码的蛋白质和多肽可以通过肽键形成连接。反式剪接内含肽可以选自不同生物体的核体和细胞器基因组,包括真核生物、古细菌和真细菌。可使用的内含肽列于neb.com/neb/inteins.html,其可以使用“www”前缀在万维网上访问。编码内含肽的核苷酸序列可以分成5'和3'部分,其分别编码内含肽的5'和3'部分。可以缺失内含肽剪接不需要的序列部分(例如归位核酸内切酶结构域)。将内含肽编码序列分开,使得5'和3'部分能够反式剪接。为了选择内含肽编码序列的适合的分开位点,可遵循由索斯沃斯等人,(1998)《EMBO杂志》17:918-926所公布的考虑因素。在构建第一和第二表达盒时,5'内含肽编码序列连接到编码多肽的N端部分的第一片段的3'端,并且3'内含肽编码序列连接到编码多肽的C端部分的第二片段的5'端。

一般来说,反式剪接搭配物可以使用任何分开内含肽设计,包括任何天然存在或人工分开的内含肽。已知数种天然存在的分开内含肽,例如:集胞藻属(Synechocystissp.)PCC6803的DnaE基因的分开内含肽(参见吴等人,(1998)《美国科学院院报》95(16):9226-31和埃文斯等人,(2000)《生物化学杂志》275(13):9091-4和来自点形念珠藻(Nostocpunctiforme)的DnaE基因(参见岩井等人,(2006)《FEBS快报》580(7):1853-8)。非分开内含肽已经在实验室中人工地分开以产生新分开内含肽,例如:人工分开Ssp DnaB内含肽(参见吴等人,(1998)《生物化学与生物物理Acta》.1387:422-32)和分开See VMA内含肽(参见布伦策尔(Brenzel)等人,(2006)《生物化学》45(6):1571-8)和人工分开真菌小内含肽(参见埃勒切(Elleuche)等人,(2007)《生物化学与生物物理学研究通讯》355(3):830-4)。天然存在的非分开内含肽可以具有核酸内切酶或其它酶活性,其通常可以在设计人工分开的分开内含肽时去除。此类小内含肽或最小化的分开内含肽在本领域中众所周知并且通常小于200个氨基酸残基长(参见吴等人,(1998)《生物化学与生物物理Acta》.1387:422-32)。适合的分开内含肽可以具有其它纯化,使得能够将多肽元件添加到其结构,其条件是此类元件不抑制分开内含肽的剪接或以允许其在剪接之前去除的方式进行添加。已使用包含细菌内含肽样(BIL)结构域(参见阿米他(Amitai)等人,(2003)《分子微生物学(Mol.Microbiol.)》47:61-73)和刺猬状(hedgehog,Hog)自身加工结构域(后者在被称为Hog/内含肽超家族或HINT家族时与内含肽组合)(参见达萨(Dassa)等人,(2004)《生物化学杂志》279:32001-7)以及诸如还可以用于制备人造分开内含肽的这些结构域的蛋白质报告蛋白质剪接。确切地说,可以通过分子生物学方法修改此类家族的非剪接成员,以引入或恢复此类相关物种中的剪接活性。

重组DNA方法的开发已经使得有可能研究序列转座对蛋白质折叠、结构和功能的影响。用于创建新序列的方法类似于天然产生蛋白质对的方法,所述蛋白质对通过其氨基酸序列的线性重组而相关联(坎宁翰(Cunningham)等人,(1979)《美国科学院院报》76:3218-3222;蒂彻(Teather)和埃弗勒(Erfle),(1990)《细菌学杂志(J.Bacteriol.)》172:3837-3841;席明(Schimming)等人,(1992)《欧洲生物化学杂志(Eur.J.Biochem.)》204:13-19;片冈(Yamiuchi)和南川(Minamikawa),(1991)《FEBS快报》260:127-130;麦格雷戈(MacGregor)等人,(1996)《FEBS快报》378:263-266)。这种类型的重排活体外第一次施用到蛋白质,通过戈登伯格(Goldenberg)和克赖顿(Creighton)(《分子生物学杂志》165:407-413,1983)所描述。在创建环状排列的变异体时,在原始序列的内部位点(断裂点)处选择新N端,所述新序列具有与断裂点原始序列相同的氨基酸顺序,直到其达到处于或接近原始C端处的氨基酸为止。此时,将新序列直接或通过序列的额外部分(连接子)接合到处于或接近原始N端处的氨基酸,且新序列以与原始序列相同的序列继续,直到其达到处于或接近氨基酸(其为原始序列的断裂点位点的N端)处的点为止,此残基形成链的新C端。连接子的氨基酸序列的长度可以凭经验或以来自结构信息的引导或通过使用两种方法的组合来选择。当无结构信息可用时,可以使用设计制备小系列的连接子以用于测试,所述设计的长度变化以便涵盖0到的范围并且选择其序列以便符合表面暴露量(亲水性,霍普(Hopp)和伍德,(1983)《分子免疫学(Mol.Immunol.)》20:483-489;凯特(Kyte)和杜利特(Doolittle),(1982)《分子生物学杂志》157:105-132;溶剂暴露表面积,李(Lee)和理查德(Richard),(1971)《分子生物学杂志》55:379-400)以及在不重排杀虫多肽构形的情况下采用必要构象的能力(构象灵活性;卡普拉斯(Karplus)和舒尔茨(Schulz),(1985)《自然科学(Naturwissenschaften)》72:212-213)。假设每一残基的平均平移为2.0到这将意指待测试的长度将在0到30个残基之间,其中0到15个残基为优选的范围。例示性的此类经验系列将为使用例如Gly-Gly-Gly-Ser重复n次的盒序列构造连接子,其中n为1、2、3或4。本领域的技术人员将认识到,存在许多长度变化的此类序列或可充当连接子的组合物,主要考虑因素为其既不过长也不短(参见桑德胡(Sandhu),(1992)《生物技术评论(CriticalRev.Biotech.)》12:437-462);如果其太长,那么熵效应将很可能使三维折叠不稳定,且还可使折叠动力学不可行,且如果其太短,那么其将很可能由于扭转或空间应变而使分子不稳定。蛋白质结构信息的分析的技术人员将认识到,使用链端之间的距离(定义为c-α碳之间的距离)可以用于定义待使用的序列的长度,或至少限制在连接子的经验选择中必须测试的可能性的数目。其还将认识到有时存在这一情况,在源自x射线衍射或核磁共振光谱数据的结构模型中难以定义多肽链末端的位置,且当属实时,将因此需要考虑此情形以便恰当地估计所需连接子的长度。自其位置经明确定义的那些残基选出与链端序列接近的两个残基,且其c-α碳之间的距离用于计算其之间的连接子的大致长度。使用所计算的长度作为引导,接着选择具有一系列数量的残基的连接子(使用2到

Figure BDA0002647180000000521

/残基计算)。这些连接子可以由原始序列构成,视需要缩短或延长,并且当延长时,可以选择额外残基为如上所述的灵活性和亲水性的;或任选地,原始序列可以由一系列连接子取代,一个实例为上文所提及的Gly-Gly-Gly-Ser盒方法;或任选地,可以使用原始序列与具有适当总长度的新序列的组合。能够折叠到生物活性状态的杀虫多肽的序列可以通过适当地从原始多肽链内选择开始(氨基端)和结束(羧基端)位置,同时使用如上文所描述的连接子序列来制备。使用下文所描述的指导原则,氨基和羧基端选自共同序列拉伸(称为断裂点区域)内。因此通过从相同断裂点区域内选择氨基和羧基端来产生新颖氨基酸序列。在许多情况下,新端的选择将使得羧基端的原始位置紧接在氨基端的原始位置之前。然而,本领域的技术人员将认识到,区域内任何地方的端的选择可以起作用,并且这些选择将有效地引起对新序列的氨基或羧基部分的缺失或添加。

分子生物学的中心原则正是蛋白质的主要氨基酸序列规定折叠到表达其生物功能所必需的三维结构。本领域的技术人员已知使用单一蛋白质晶体的x射线衍射或蛋白质溶液的核磁共振光谱来获得和解译三维结构信息的方法。与断裂点区域的识别相关的结构信息的实例包括蛋白质二级结构(α和3-10螺旋、平行和反向平行β薄片、链反向和匝以及环)的位置和类型;卡巴什(Kabsch)和桑德(Sander),(1983)《生物聚合物(Biopolymers)》22:2577-2637;氨基酸残基的溶剂暴露程度、残基与彼此的相互作用的程度和类型(乔提亚(Chothia),(1984)《生物化学年评(Ann.Rev.Biochem.)》53:537-572)和沿所述多肽链的构象的静态和动态分布(阿尔伯(Alber)和马修斯(Mathews),(1987)《酶学方法》.154:511-533)。在一些情况下,已知关于残基的溶剂暴露量的额外信息;一个实例为蛋白质表面上必需的碳水化合物的翻译后连接位点。当实验结构信息不可用或不可获得时,方法也可用于分析主要氨基酸序列以便预测蛋白质三级和二级结构、溶剂可接近性以及匝和环的产生。生物化学方法有时也适用于凭经验确定当直接结构方法不可行时的表面暴露量;例如,使用有限蛋白水解之后的链断裂位点的识别以便推断表面暴露量(詹蒂莱(Gentile)和萨尔瓦托雷(Salvatore),(1993)《欧洲生物化学杂志》218:603-621)。因此,使用以实验方式所衍生的结构信息或预测方法(例如斯里尼瓦桑(Srinivisan)和罗丝(Rose),(1995)《蛋白质:结构功能与基因学(Proteins:Struct.,Funct.&Genetics)》22:81-99)检查亲本氨基酸序列以根据其是否与维持二级和三级结构成一体而对区域进行分类。已知涉及周期性二级结构(α和3-10螺旋,平行和反向平行β薄片)的区域内的所产生序列是应避免的区域。类似地,观察到或预测到具有低溶剂暴露量程度的氨基酸序列的区域更有可能是蛋白质的所谓疏水性核心的一部分,并且还应该避免选择氨基和羧基端。相比之下,已知或预测为在表面匝或环中的那些区域,并且尤其已知为不需要生物活性的那些区域是用于定位多肽链的端值的优选位点。基于以上准则优选的氨基酸序列的连续拉伸称为断裂点区域。可基本上根据如下所描述的方法制成编码环状排列的多肽(其具有新N端/C端)的多核苷酸,所述N端/C端含有将原始C端与N端分离的连接子区:马林斯(Mullins)等人,(1994)《美国化学学会杂志》116:5529-5533。聚合酶链反应(PCR)扩增的多个步骤用于重排编码蛋白质的主要氨基酸序列的DNA序列。可基于如下所描述的级联复制方法制成编码环状排列的多肽(其具有新N端/C端)的多核苷酸,所述N端/C端含有将原始C端与N端分离的连接子区:霍利克(Horlick)等人,(1992)《蛋白质工程(Protein Eng.)》5:427-431。使用级联复制的模板DNA进行新N端/C端基因的聚合酶链反应(PCR)扩增。

包含新颖杀生物蛋白的融合蛋白

在另一方面,提供融合蛋白,其在其氨基酸序列内包括选自由以下组成的群组的序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQID NO:72以及其活性片段。

本领域的技术人员已知设计和构建融合蛋白(和编码融合蛋白的多核苷酸)的方法。编码杀昆虫蛋白的多核苷酸可以融合到信号序列,所述信号序列将引导多肽定位到原核或真核细胞的特定隔室和/或引导多肽从原核或真核细胞分泌。举例来说,在大肠杆菌中,可以希望将蛋白质的表达引导到周质空间。

为了将多肽的表达引导到细菌周质空间,可以融合杀昆虫多肽的信号序列或蛋白质(或其片段)的实例包括但不限于:pelB信号序列、麦芽糖结合蛋白(MBP)信号序列、MBP、ompA信号序列、周质大肠杆菌热不稳定肠毒素B-亚单元的信号序列和碱性磷酸酶的信号序列。

数种载体可商购用于融合蛋白的构建,其将引导蛋白质的定位,例如可购自新英格兰

Figure BDA0002647180000000541

(马萨诸塞州伊普威治的240县道(240County Road,Ipswich,Mass.)01938-2723)的pMAL系列载体(pMAL-p系列)。在一个特定实施例中,多肽可以融合到pelB果胶酸裂解酶信号序列以增加在革兰氏阴性细菌中表达和纯化此类多肽的效率(参见第5,576,195号和第5,846,818号美国专利)。植物质粒转运肽/多肽融合物在本领域中众所周知(参见第7,193,133号美国专利)。质外体转运肽,如水稻或大麦α-淀粉酶分泌信号在本领域中也是众所周知的。质粒转运肽通常将N端融合到待靶向的多肽(例如融合搭配物)。然而,额外氨基酸残基可以是质粒转运肽的N端,其条件是融合蛋白至少部分靶向质粒。在一个特定实施例中,质粒转运肽处于融合蛋白的N端一半、N端三分之一或N端四分之一中。大部分或所有质粒转运肽一般在***到质粒中之后从融合蛋白裂解。裂解位置可在不同植物发育期,由于特定细胞间条件或所使用的转运肽/融合搭配物的特定组合,在植物物种之间稍微变化。在一个实施例中,质粒转运肽裂解为均质的,使得裂解位点在融合蛋白群体中是相同的。在另一实施例中,质粒转运肽不是均质的,使得裂解位点在融合蛋白群体中改变1-10个氨基酸。质粒转运肽可以多种方式中的一种以重组方式融合到第二蛋白质。举例来说,限制性核酸内切酶识别位点可以在对应于其C端的位置处被引入到转运肽的核苷酸序列中,并且相同或相容位点可以被工程改造为待靶向到其N端处的蛋白质的核苷酸序列。在设计这些位点时必须注意确保转运肽和第二蛋白质的编码序列保持在“框内”以允许合成所需融合蛋白。在一些情况下,当引入新限制位点时,可以优选地去除第二蛋白质的引发剂甲硫氨酸密码子。限制性核酸内切酶识别位点在亲本分子两者上的引入及其随后经由重组DNA技术的结合可引起在转运肽与第二蛋白质之间添加一或多个额外氨基酸。这通常不影响靶向活性,只要转运肽裂解位点保持可获取并且第二蛋白质的功能不会通过在其N端处添加这些额外氨基酸而改变。替代地,本领域的技术人员可以使用基因合成在转运肽与第二蛋白质(有或没有其引发剂甲硫氨酸)之间产生精确裂解位点(施特默尔等人,(1995)《基因》164:49-53)或相似方法。另外,转运肽融合物可有意地包括裂解位点下游的氨基酸。成熟蛋白质的N端处的氨基酸可影响转运肽将蛋白质靶向到质粒的能力和/或蛋白质导入之后的裂解效率。这可取决于待靶向的蛋白质。参见例如科迈(Comai)等人,(1988)《生物化学杂志》263(29):15104-9。

在一些实施例中,提供包含如本文所教示的杀昆虫多肽和通过氨基酸连接子接合的另一杀昆虫多肽的融合蛋白。在一些实施例中,提供的融合蛋白由选自由以下组成的群组的式表示:R1-L-R2、R2-L-R1、R1-R2或R2-R1、其中R1为选自由以下组成的群组的多肽:SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72,且R2为另一杀昆虫多肽。R1多肽直接融合或通过连接子(L)片段融合到R2多肽。术语“直接”定义融合物,其中多肽在无肽连接子的情况下接合。因此,“L”表示R1和R2两者在框内融合的化学结合或多肽片段,最通常L为R1和R2通过酰胺键结合的线性肽,所述酰胺键将R1的羧基端连接到L的氨基端,并且将L的羧基端连接到R2的氨基端。“框内融合”意指在R1和R2的阅读框之间不存在翻译终止或中断。键联基团(L)通常为长度在1与500个氨基酸之间的多肽。接合两个分子的连接子优选地经设计以:(1)使两个分子折叠且彼此独立地起作用,(2)不具有产生有序二级结构的倾向,所述结构可能干扰两种蛋白质的功能性结构域,(3)具有可与功能蛋白质结构域相互作用的最小疏水性或带电特征,和(4)提供R1和R2的空间分离,使得R1和R2可与其在单一细胞上的对应受体同时相互作用。通常,柔性蛋白质区域中的表面氨基酸包括Gly、Asn和Ser。预期氨基酸序列的几乎任何排列含有Gly、Asn和Ser,以满足连接子序列的以上准则。其它中性氨基酸,如Thr和Ala,也可以用于连接子序列中。由于在连接子序列中添加独特限制位点以促进融合物的构建,额外氨基酸也可以包括于连接子中。

在一些实施例中,连接子包含选自以下式的群组的序列:(Gly3Ser)n、(Gly4Ser)n、(Gly5Ser)n、(GlynSer)n或(AlaGlySer)n,其中n为整数。高度柔性连接子的一个实例为存在于丝状噬菌体(例如噬菌体M13或fd)的丸状蛋白质内的富含GlySer的间隔区(夏勒(Schaller)等人,1975)。此区域提供丸状表面蛋白质的两个结构域之间的长且柔性的间隔区。还包括其中包括内肽酶识别序列的连接子。此类裂解位点可为有价值的,以分离融合物的个别组分以确定其是否恰当地折叠且具有活体外活性。各种内肽酶的实例包括但不限于:纤溶酶(Plasmin)、肠激酶(Enterokinase)、微血管增渗酶(Kallikerin)、尿激酶(Urokinase)、组织纤维蛋白溶酶原活化因子、梭菌蛋白酶(clostripain)、凝乳酶(Chymosin)、胶原蛋白酶(Collagenase)、拉塞尔氏喹蛇毒液蛋白酶、后脯氨酸裂解酶、VS蛋白酶、凝血酶(Thrombin)和因子Xa。在其它实施例中,来自重链免疫球蛋白IgG、IgA、IgM、IgD或IgE的铰链区的肽连接子片段提供所连接的多肽之间的角度关系。融合蛋白不受所使用的连接子序列的形式、尺寸或数目限制,并且连接子的唯一要求在功能上并不会不利地干扰融合物的个别分子的折叠和功能。

在另一方面,提供通过接合所教示的杀昆虫蛋白基因的两个或更多个部分产生的嵌合蛋白,所述所教示的杀昆虫蛋白基因最初经编码分离杀昆虫蛋白以产生嵌合基因。嵌合基因的翻译产生具有来源于原始蛋白质中的每一者的区域、基元或结构域的单一嵌合蛋白。在某些实施例中,嵌合蛋白包含以下部分、基元或结构域:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72,以任何组合。

应认识到,DNA序列可以通过各种方法改变,并且这些改变可以产生编码蛋白质的DNA序列,所述蛋白质的氨基酸序列不同于由野生型(或原生)杀虫蛋白编码的氨基酸序列。在一些实施例中,本文所教示的杀昆虫蛋白可以各种方式改变,包括氨基酸取代、缺失、截短和***一或多个氨基酸,包括至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50,或更多个氨基酸取代、缺失和/或***或其组合,相比于SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72。

用于此类操控的方法通常是本领域中已知的。例如,多肽的氨基酸序列变异体可以通过DNA中的突变制备。这还可通过诱变和/或定向进化的数种形式中的一者来实现。在一些方面,氨基酸序列中编码的改变将基本上不影响蛋白质的功能。此类变异体将具有所需的杀虫活性。然而,应理解,所教示的多肽赋予杀虫活性的能力可以通过在本发明的组合物上使用此类技术来改进。

举例来说,保守氨基酸取代可以在一或多个预测的非必需氨基酸残基处进行。“非必需”氨基酸残基为可在不改变生物活性的情况下自所教示的多肽的野生型序列改变的残基。“保守氨基酸取代”是其中氨基酸残基被具有相似侧链的氨基酸残基取代的氨基酸取代。具有相似侧链的氨基酸残基家族已在本领域中定义。这些家族包括具有以下的氨基酸:碱性侧链(例如赖氨酸、精氨酸、组氨酸);酸性侧链(例如天冬氨酸、谷氨酸);极性带负电荷残基及其酰胺(例如天冬氨酸、天冬酰胺、谷氨酸、谷酰胺);不带电极性侧链(例如甘氨酸、天冬酰胺、谷酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸);小脂肪族、非极性或稍极性残基(例如丙氨酸、丝氨酸、苏氨酸、脯氨酸、甘氨酸);非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸);大脂肪族、非极性残基(例如甲硫氨酸、亮氨酸、异亮氨酸、缬氨酸、半胱氨酸);β-分支侧链(例如苏氨酸、缬氨酸、异亮氨酸);芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸);大芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸)。

可以在保留功能的非保守区中进行氨基酸取代。一般来说,此类取代将不针对保守氨基酸残基或存在于保守基元内的氨基酸残基(其中此类残基对于蛋白质活性来说是必不可少的)进行。保守并且可能对蛋白质活性是必要的残基的实例包括例如在类似或相关毒素与实施例的序列的比对中所含有的所有蛋白质之间相同的残基(例如在同源物的比对中相同的残基)。保守但可允许保守氨基酸取代且仍保留活性的残基的实例包括例如在类似或相关毒素与实施例的序列的比对中所含有的所有蛋白质之间仅具有保守取代的残基(例如,在同源物的比对中所含有的所有蛋白质之间仅具有保守取代的残基)。然而,本领域的技术人员将理解,功能变异体可在保守残基中具有微小保守或非保守性变化。关于并不影响所关注的蛋白质的生物活性的适当氨基酸取代的指导可发现于戴霍夫(Dayhoff)等人的模型,(1978)蛋白质序列和结构地图集(Atlas of Protein Sequence and Structure)(国家生物医药研究基金会(Natl.Biomed.Res.Found.),华盛顿哥伦比亚特区)中,其以引用的方式并入本文中。

在进行此类改变时,可以考虑氨基酸的亲水指数。亲水氨基酸指数在赋予蛋白质相互作用生物学功能方面的重要性通常为本领域中所理解的(凯特和杜利特,(1982)《分子生物学杂志(J Mol Biol.)》157(1):105-132)。公认氨基酸的相对亲水特征促成所得蛋白质的二级结构,其又定义了蛋白质与其它分子的相互作用,其它分子为例如酶、底物、受体、DNA、抗体、抗原等。

本领域中已知某些氨基酸可以经具有类似亲水指数或评分的其它氨基酸取代,并且仍产生具有类似生物活性的蛋白质,即仍获得生物功能等效蛋白质。每种氨基酸都基于其疏水性和电荷特征而被分配一个亲水指数(凯特和杜利特,出处同上)。这些亲水指数为异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和精氨酸(-4.5)。在作出此类改变时,亲水指数在+2内的氨基酸的取代是优选的,在+1内的亲水指数是特别优选的,并且在+0.5内的亲水指数甚至是更特别优选的。

本领域中还应理解可以基于亲水性有效进行类似的氨基酸取代。第4,554,101号美国专利陈述如由邻近氨基酸的亲水性调节的蛋白质的最大局部平均亲水性与蛋白质的生物特性相关。如第4,554,101号美国专利中详述,以下亲水性值已分配到氨基酸残基:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0.+0.1);谷氨酸(+3.0.+0.1);丝氨酸(0.3);天冬酰胺(+0.2);谷酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5.+0.1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);和色氨酸(-3.4)。

替代地,可以对在氨基或羧基端处的许多蛋白质的蛋白质序列作出更改而不实质上影响活性。这可包括通过现代分子方法(如PCR)引入的***、缺失或更改,包括借助于在PCR扩增中利用的寡核苷酸中包括氨基酸编码序列而改变或延伸蛋白质编码序列的PCR扩增。替代地,所添加的蛋白质序列可包括整个蛋白质编码序列,如本领域中通常用于产生蛋白质融合物的那些。此类融合蛋白通常用于(1)增加所关注的蛋白质的表达(2)引入结合结构域、酶活性或抗原决定基以促进蛋白质纯化、蛋白质检测或本领域中已知的其它实验用途(3)将蛋白质靶向分泌或翻译到亚细胞细胞器,如革兰氏阴性细菌的周质空间、植物的线粒体或叶绿体或者真核细胞的内质网,后者通常引起蛋白质的糖基化。

本发明的变异核苷酸和氨基酸序列还涵盖来源于诱变和引起重组的程序(如DNA改组)的序列。使用此类程序,可使用一或多个不同的杀昆虫多肽编码区产生具有所需特性的新多肽。以此方式,重组多核苷酸库由包含序列区的相关序列多核苷酸群体产生,所述序列区具有实质序列一致性,并且可以在活体外或活体内同源重组合。举例来说,使用此方法,可以在杀虫基因与其它已知杀虫基因之间改组编码所关注的结构域的序列基元,以获得编码具有改良的所关注的特性(例如提高的杀昆虫活性)的蛋白质的新基因。此类DNA改组的策略在本领域中已知。参见例如施特默尔,(1994)《美国科学院院报》91:10747-10751;施特默尔,(1994)《自然》370:389-391;凯默瑞等人,(1997)《自然生物技术(NatureBiotech.)》15:436-438;穆尔等人,(1997)《分子生物学杂志》272:336-347;张等人,(1997)《美国科学院院报》94:4504-4509;凯默瑞等人,(1998)《自然》391:288-291;以及第5,605,793号和第5,837,458号美国专利。

结构域交换或改组是用于产生变化的多肽的另一机制。结构域可以在多肽之间交换,产生具有改良的杀昆虫活性或目标谱的杂交或嵌合毒素。用于产生重组蛋白并测试其用于杀虫活性的方法在本领域中众所周知(参见例如奈莫夫(Naimov)等人,(2001)《应用和环境微生物学(Appl.Environ.Microbiol.)》67:5328-5330;德马格德(de Maagd)等人,(1996)《应用和环境微生物学》62:1537-1543;葛(Ge)等人,(1991)《生物化学杂志》266:17954-17958;施内普夫(Schnepf)等人,(1990)《生物化学杂志》265:20923-20930;琅(Rang)等人,91999)《应用和环境微生物学》65:2918-2925)。

DNA改组和定点诱变都可以用于定义具有杀虫活性的多肽序列。本领域的技术人员将能够使用与其它蛋白质或功能分析的比较以进一步定义基元。高处理量筛选可以用于测试那些基元的变化以确定特定残基的作用。

受体识别和分离

还涵盖所教示的杀昆虫蛋白或其变异体或片段的受体。用于识别受体的方法在本领域中众所周知(参见霍夫曼(Hofmann)等人,(1988)《欧洲生物化学杂志》173:85-91;吉尔等人,(1995)《生物化学杂志》27277-27282)并且可以用于使用来自敏感的昆虫的刷状缘膜囊泡来鉴别和分离识别所教示的杀昆虫蛋白的受体。除引用的文献中列出的放射性标记方法以外,所教示的蛋白质还可以用荧光染料及其它常见标记(例如抗生蛋白链菌素)标记。可根据文献中列出的方案准备敏感的昆虫(如大豆尺蠖(looper)和蝽)的刷状缘膜囊泡(BBMV),且在SDS-PAGE凝胶上分离且在适合膜上印迹。经标记的蛋白质可以与BBMV的印迹膜一起培育,且用经标记的报导子鉴别。可通过基于N端氨基酸气相测序或质谱的蛋白质识别方法检测与蛋白质相互作用的蛋白质带的识别(帕特森,(1998)10.22,1-24,由约翰·威利父子公司出版的《分子生物学的当前方案》)。一旦识别出蛋白质,就可以从敏感的昆虫的基因组DNA或cDNA库克隆对应的基因,并且可以直接用蛋白质测量结合亲和性。所教示的蛋白质的杀昆虫活性的受体功能可以通过基因敲除方法的RNAi类型验证(拉贾戈帕尔(Rajagopal)等人,(2002)《生物化学杂志》277:46849-46851)。

核苷酸构建体、表达盒和载体

本文中术语“核苷酸构建体”的使用并不打算将实施例限制于包含DNA的核苷酸构建体。本领域的普通技术人员将认识到,核苷酸构建体,确切地说,由核糖核苷酸构成的多核苷酸和寡核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合也可以用于本文所揭示的方法中。实施例的核苷酸构建体、核酸和核苷酸序列另外涵盖此类构建体、分子和序列的所有互补形式。此外,实施例的核苷酸构建体、核苷酸分子和核苷酸序列涵盖所有核苷酸构建体、分子和序列,其可以用于用以转化植物的实施例的方法中,包括但不限于由脱氧核糖核苷酸、核糖核苷酸及其组合构成的那些。此类脱氧核糖核苷酸和核糖核苷酸包括天然存在的分子和合成类似物两者。实施例的核苷酸构建体、核酸和核苷酸序列还涵盖核苷酸构建体的所有形式,包括但不限于单链形式、双链形式、发夹、茎-环结构等。

另一实施例涉及经转化的生物体,例如选自植物和昆虫细胞、细菌、酵母、杆状病毒、原虫、线虫和藻类。经转化的生物体包含实施例的DNA分子、包含DNA分子的表达盒或包含表达盒的载体,其可以稳定地并入到经转化的生物体的基因组中。

在DNA构建体中提供实施例的序列以用于在所关注的生物体中表达。构建体将包括可操作地连接到实施例的序列的5'和3'调节序列。如本文所用,术语“可操作地连接”是指启动子与第二序列之间的功能性连接,其中启动子序列引发并且介导对应于第二序列的DNA序列的转录。一般来说,“可操作地连接”意指所连接的核酸序列是连续的且有必要在相同阅读框中接合两个蛋白质编码区。构建体可以另外含有至少一种待共转化到生物体中的额外基因。替代地,额外基因可以提供于多个DNA构建体上。

在一些实施例中,DNA构建体包含编码本文所教示的杀昆虫蛋白的多核苷酸,其可操作地连接到异源调节序列。

在一些实施例中,DNA构建体包含编码本文所教示的杀昆虫蛋白的多核苷酸,其可操作地连接到异源调节序列,所述多核苷酸选自由以下组成的群组:SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ IDNO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ IDNO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69和SEQ ID NO:71,或已针对所关注的宿主细胞(例如,在一些实施例中的植物细胞)中的表达对应于经密码子优化的前述序列的序列。

在一些实施例中,DNA构建体包含编码本文所教示的杀昆虫蛋白的多核苷酸,其可操作地连接到异源调节序列,所述蛋白质选自由以下组成的群组:SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72,或其变异体。

此类DNA构建体具有多个限制位点以用于将多肽基因序列***到调节区的转录调节下。DNA构建体可以另外含有可选标记物基因。

DNA构建体将通常在5'到3'转录方向上包括:转录和翻译起始区(即,启动子)、实施例的DNA序列以及在充当宿主(例如细菌细胞或植物细胞)的生物体中起作用的转录和翻译终止区(即,终止区)。

转录起始区(即,启动子)对于宿主生物体和/或对于实施例的序列可以是原生、类似、外来或异源的。另外,启动子可以是天然序列或可替代地合成序列。如本文所用的术语“外来”指示启动子未发现于引入启动子的天然生物体中。在启动子对于实施例的序列为“异源”的情况下,预期启动子不是针对实施例的可操作地连接序列的天然或天然存在的启动子(即,不是天然位置)。如本文所用,嵌合基因包含可操作地连接于转录起始区(其与编码序列异源)的编码序列。在启动子为天然(native/natural)序列的情况下,可操作地连接的序列的表达从野生型表达改变,这引起表型的改变。

在一些实施例中,DNA构建体还可以包括转录强化子序列。如本文所用,术语“强化子”是指可以刺激启动子活性并且可以是启动子的先天性元件或经***以增强启动子的水平或组织特异性的异源元件的DNA序列。本领域中已知各种强化子,包括例如在植物中具有基因表达增强特性的内含子(第2009/0144863号美国专利申请揭示案,泛素内含子(即,玉米泛素内含子1(参见例如NCBI序列S94464;克里斯坦森(Christensen)和奎尔(Quail)(1996)《转基因研究》5:213-218;克里斯坦森等人(1992)《植物分子生物学(PlantMolecular Biology)》18:675-689)),ω强化子或ω起动强化子(加利(Gallie)等人,(1989)《RNA的分子生物学(Molecular Biology of RNA)》切赫(Cech)编(纽约利斯(Liss,New York))237-256以及加利等人,(1987)《基因》60:217-25)、CaMV 35S强化子(参见例如本菲(Benfey)等人,(1990)《EMBO杂志》9:1685-96)、玉米Adhl内含子(井冢(Kyozuka)等人(1991)《分子基因遗传学》228:40-48;井冢等人(1990)《麦迪卡(Maydica)》35:353-357)、第7,803,992号美国专利的强化子以及W02013130813的甘蔗杆状病毒(SCBV)强化子也可以被使用,其中的每一个以引用的方式并入。转录强化子的以上清单不意指限制性的。在实施例中可以使用任何适当的转录强化子。

终止区可以天然具有转录起始区,可以天然具有所关注的可操作地连接的DNA序列,可以天然具有植物宿主,或可以来源于另一源(即,对于启动子、所关注的序列、植物宿主或其任何组合是外来或异源的)。

适宜终止区可获自根癌农杆菌(A.tumefaciens)的Ti-质粒,如章鱼碱合成酶(octopine synthase)和胭脂碱合成酶终止区。还参见盖里诺(Guerineau)等人,(1991)《分子基因遗传学》262:141-144;普劳德富特(Proudfoot),(1991)《细胞》64:671-674;桑法康(Sanfacon)等人,(1991)《基因与发展(Genes Dev.)》5:141-149;马根(Magen)等人,(1990)《植物细胞(Plant Cell)》2:1261-1272;门罗(Munroe)等人,(1990)《基因》91:151-158;巴利亚斯(Ballas)等人,(1989)《核酸研究》17:7891-7903以及乔希(Joshi)等人,(1987)《核酸研究(Nucleic Acid Res.)》15:9627-9639。

适当时,可以优化核酸以增加宿主生物体中的表达。因此,在宿主生物体为植物的情况下,合成核酸可以使用植物优选的密码子合成以用于改进表达。参见例如坎贝尔(Campbell)和戈里(Gowri),(1990)《植物生理学(Plant Physiol.)》92:1-11,其用于宿主优选的密码子使用的论述。举例来说,尽管实施例的核酸序列可以在单子叶和双子叶植物物种两者中表达,但可以修改序列以考虑单子叶或双子叶的特定密码子优选和GC含量优选,因为这些优选已经显示为不同的(玛瑞(Murray)等人(1989)《核酸研究》17:477-498)。

因此,本领域的技术人员将理解如何利用特定的植物密码子使用表以导出最优序列,以表达本发明的杀昆虫蛋白。参见例如US 2016/0366891(第15/022,109号美国申请案),所述申请案以全文引用的方式并入本文中。

已知额外序列修饰以增强细胞宿主中的基因表达。这些包括消除编码杂散聚腺苷酸化信号的序列、外显子-内含子剪接位点信号、转座子样重复序列和可能对基因表达有害的其它良好表征的序列。可以将序列的GC含量调节到给定细胞宿主的平均水平,如参考宿主细胞中所表达的已知基因所计算。如本文所用,术语“宿主细胞”是指含有载体并且支持表达载体的复制和/或表达的细胞。宿主细胞可以是原核细胞,如大肠杆菌,或真核细胞,如酵母、昆虫、两栖动物或哺乳动物细胞或单子叶或双子叶植物细胞。单子叶宿主细胞的实例是玉米宿主细胞。当可能时,序列经修饰以避免所预测得发夹二级mRNA结构。

表达盒可另外含有5'前导序列。此类前导序列可以用以增强翻译。翻译前导序列是此项技术中已知的且包括:细小病菌前导序列,例如EMCV前导序列(脑心肌炎5'非编码区)(埃尔罗伊(Elroy)-斯坦(Stein)等人,(1989)《美国科学院院报》86:6126-6130);马铃薯Y病毒属前导序列,例如TEV前导序列(Tobacco Etch Virus)(加利等人,(1995)《基因》165(2):233-238)、MDMV前导序列(玉米矮小花叶病毒)、人类免疫球蛋白重链结合蛋白(BiP)(马塞雅克(Macejak)等人,(1991)《自然》353:90-94);来自苜蓿花叶病毒的外壳蛋白质mRNA的未翻译前导序列(AMY RNA 4)(乔布林(Jobling)等人,(1987)《自然》325:622-625);烟草花叶病毒前导序列(TMV)(加利等人,(1989)在《RNA的分子生物学》,切赫编(纽约利斯),第237-256页中)和玉米褪绿斑驳病毒前导序列(MCMV)(隆梅尔(Lommel)等人,(1991)《病毒学(Virology)》81:382-385)。还参见德拉-西奥帕(Della-Cioppa)等人,(1987)《植物生理学》84:965-968。

此类构建体还可含有“信号序列”或“前导序列”以促进肽对某些胞内结构(如叶绿体(或其它质粒)、内质网或高尔基器)的共翻译或翻译后转运。如本文所用的“信号序列”是指已知或疑似引起跨越细胞膜的共翻译或翻译后肽转运的序列。在真核生物中,这通常涉及分泌到高尔基器中,具有一些所得糖基化。细菌的杀昆虫毒素通常合成为原毒素,所述原毒素在目标害虫的肠道中进行蛋白水解活化(常(1987)《酶学方法》.153:507-516)。在一些实施例中,信号序列位于原生序列中或可来源于实施例的序列。如本文所用的“前导序列”是指任何序列,其在翻译时产生足以触发肽链对亚细胞细胞器的共翻译转运的氨基酸序列。因此,这包括通过进入内质网、通过进入液泡、包括叶绿体的质粒、线粒体等而靶向转运和/或糖基化的前导序列。靶向叶绿体类囊体内腔隔室的核编码蛋白具有由基质靶向信号肽和内腔靶向信号肽构成的特征双分型转运肽。基质靶向信息处于转运肽的氨基-近端部分中。内腔靶向信号肽处于转运肽的羧基-近端部分中,并且含有靶向内腔的所有信息。在高等植物叶绿体的蛋白质组学中的最近研究已实现许多经核编码的内腔蛋白质的识别(基塞尔巴赫(Kieselbach)等人《FEBS快报》480:271-276,2000;帕尔贴(Peltier)等人《植物细胞》12:319-341,2000;布里克(Bricker)等人《生物化学与生物物理Acta》1503:350-356,2001),根据本发明可以潜在地使用的内腔靶向信号肽。来自拟南芥属的约80种蛋白质以及来自菠菜和豌豆的同源蛋白质通过以下报导:基塞尔巴赫等人,《光合作用研究(Photosynthesis Research)》,78:249-264,2003。确切地说,此出版物的表2(其以引用的方式并入到本文中的描述中)揭示来自叶绿体内腔的85种蛋白质,由其寄存编号所识别(还参见美国专利申请揭示案2009/09044298)。此外,水稻基因组的所公布草案版本(戈夫(Goff)等人,《科学》296:92-100,2002)为可根据本发明使用的内腔靶向信号肽的适合来源。

适合的叶绿体转运肽(CTP)为本领域的技术人员众所周知的,还包括嵌合CTP,其包含但不限于来自CTP的N端结构域、中心结构域或C端结构域,所述CTP来自水稻-1-脱氧-D木酮糖-5-磷酸酯合成酶、水稻-超氧化歧化酶、水稻-可溶性淀粉合成酶、水稻-NADP-依赖性苹果酸酶、水稻-磷酸基-2-脱氢-3-脱氧庚酸醛缩酶2、水稻-L-抗坏血酸过氧化物酶5、水稻-磷酸葡聚糖水二激酶、玉米ssRUBISCO、玉米-β-葡糖苷酶、玉米-苹果酸脱氢酶、玉米硫氧还蛋白M-类型(美国专利申请揭示案2012/0304336)。美国专利揭示案US20130205440Al、US20130205441Al和US20130210114Al的叶绿体转运肽。待靶向叶绿体的多肽基因可以针对叶绿体中的表达优化,以考虑植物细胞核与此细胞器之间的密码子使用差异。

在制备表达盒时,可以操控各种DNA片段以便在恰当定向上并且适当时在恰当阅读框中提供DNA序列。就这一点而言,可以采用衔接子或连接子来接合DNA片段或可以涉及其它操控,以提供适宜的限制位点、去除多余的DNA、去除限制位点等。为此目的,可以涉及活体外诱变、引物修复、限制、粘接、再取代(例如转化)和转换。

启动子

在实施例的实践中可以使用多种启动子。可基于所需结果选择启动子。核酸可以与组成型、组织优选型、诱导型或用于在宿主生物体中表达的其它启动子组合。本发明的启动子包括已知实现基因调节的顺式元件的同源物,所述顺式元件显示与本发明的启动子序列的同源性。这些顺式元件包括但不限于氧响应性顺式元件(考恩(Cowen)等人,《生物化学杂志》268(36):26904-26910(1993))、光调节元件(布鲁斯(Bruce)和奎尔,《植物细胞》2(11):1081-1089(1990);布鲁斯等人,《EMBO杂志》10:3015-3024(1991);罗霍尔(Rocholl)等人,《植物科学(Plant Sci.)》97:189-198(1994);布洛克(Block)等人,《美国科学院院报》87:5387-5391(1990);朱利亚诺(Giuliano)等人,《美国科学院院报》85:7089-7093(1988);施泰格(Staiger)等人,《美国科学院院报》86:6930-6934(1989);井泽(Izawa)等人,《植物细胞》6:1277-1287(1994);门克斯(Menkens)等人,《生物化学趋势(Trends inBiochemistry)》20:506-510(1995);福斯特(Foster)等人,《FASEB杂志(FASEB J.)》8:192-200(1994);普利斯(Plesse)等人,《分子基因遗传学》254:258-266(1997);格林(Green)等人,《EMBO杂志》6:2543-2549(1987);库勒梅尔(Kuhlemeier)等人,《植物生理学年评(Ann.Rev.Plant Physiol.)》38:221-257(1987);维兰(Villain)等人,《生物化学杂志》271:32593-32598(1996);兰(Lam)等人,《植物细胞》2:857-866(1990);吉尔马丁(Gilmartin)等人,《植物细胞》2:369-378(1990);达塔(Datta)等人,《植物细胞》1:1069-1077(1989);吉尔马丁等人,《植物细胞》2:369-378(1990);卡斯特雷萨纳(Castresana)等人,《EMBO杂志》7:1929-1936(1988);上田(Ueda)等人,《植物细胞》1:217-227(1989);太沙基(Terzaghi)等人,《植物生理学与植物分子生物学年评(Annu.Rev.Plant Physiol.PlantMol.Biol.)》46:445-474(1995);格林等人,《EMBO杂志》6:2543-2549(1987);维兰等人,《生物化学杂志》271:32593-32598(1996);查登(Tjaden)等人,《植物细胞》6:107-118(1994);查登等人,《植物生理学》108:1109-1117(1995);恩盖(Ngai)等人,《植物杂志(Plant J.)》12:1021-1234(1997);布鲁斯等人,《EMBO杂志》10:3015-3024(1991);恩盖等人,《植物杂志》12:1021-1034(1997))、响应于赤霉素的元件(穆勒(Muller)等人,《植物生理学杂志(J.Plant Physiol.)》145:606-613(1995);克鲁瓦桑(Croissant)等人,《植物科学(PlantScience)》116:27-35(1996);洛默尔(Lohmer)等人,《EMBO杂志》10:617-624(1991);罗杰斯(Rogers)等人,《植物细胞》4:1443-1451(1992);拉纳汉(Lanahan)等人,《植物细胞》4:203-211(1992);斯可瑞娃(Skriver)等人,《美国科学院院报》88:7266-7270(1991);吉尔马丁等人,《植物细胞》2:369-378(1990);黄(Huang)等人,《植物分子生物学(Plant Mol.Biol.》14:655-668(1990),居布莱(Gubler)等人,《植物细胞》7:1879-1891(1995))、响应于脱落酸的元件(布斯克(Busk)等人,《植物细胞》9:2261-2270(1997);桂林南(Guiltinan)等人,《科学》250:267-270(1990);沈(Shen)等人,《植物细胞》7:295-307(1995);沈等人,《植物细胞》8:1107-1119(1996);濑尾(Seo)等人,《植物分子生物学》27:1119-1131(1995);马克特(Marcotte)等人,《植物细胞》1:969-976(1989);沈等人,《植物细胞》7:295-307(1995);岩崎(Iwasaki)等人,《分子基因遗传学》247:391-398(1995);哈托利(Hattori)等人,《基因与发展》6:609-618(1992);托马斯(Thomas)等人,《植物细胞》5:1401-1410(1993))、与脱落酸响应性元件类似的元件(埃勒斯特罗姆(Ellerstrom)等人,《植物分子生物学》32:1019-1027(1996))、生长素响应性元件(刘(Liu)等人,《植物细胞》6:645-657(1994);刘等人,《植物生理学》115:397-407(1997);小杉(Kosugi)等人,《植物杂志》7:877-886(1995);小杉等人,《植物细胞》9:1607-1619(1997);巴利亚斯等人,《分子生物学杂志》233:580-596(1993))、响应于甲基茉莉酸酯处理的顺式元件(博杜安(Beaudoin)和罗斯坦(Rothstein),《植物分子生物学》33:835-846(1997))、响应于脱落酸和应激反应的顺式元件(斯特劳(Straub)等人,《植物分子生物学》26:617-630(1994))、乙烯响应性顺式元件(伊扎克(Itzhaki)等人,《美国科学院院报》91:8925-8929(1994);蒙哥马利(Montgomery)等人,《美国科学院院报》90:5939-5943(1993);塞萨(Sessa)等人,《植物分子生物学》28:145-153(1995);新志(Shinshi)等人,《植物分子生物学》27:923-932(1995))、水杨酸顺式响应性元件(斯特兰奇(Strange)等人,《植物杂志》11:1315-1324(1997);秦(Qin)等人,《植物细胞》6:863-874(1994))、响应于水压和脱落酸的顺式元件(兰等人,《生物化学杂志》266:17131-17135(1991);托马斯等人,《植物细胞》5:1401-1410(1993);皮亚(Pia)等人,《植物分子生物学》21:259-266(1993)),对于M期特异性表达必需的顺式元件(伊东(Ito)等人,《植物细胞》10:331-341(1998))、蔗糖响应性元件(黄等人,《植物分子生物学》14:655-668(1990);黄(Hwang)等人,《植物分子生物学》36:331-341(1998);格里尔森(Grierson)等人,《植物杂志》5:815-826(1994))、热休克响应性元件(佩勒姆(Pelham)等人,《遗传学趋势(TrendsGenet.)》1:31-35(1985))、响应于生长素和/或水杨酸并且还报告用于光调节的元件(兰等人,《美国科学院院报》86:7890-7897(1989);本菲等人,《科学》250:959-966(1990))、响应于乙烯和水杨酸的元件(Ohme-Takagi(欧姆-高木)等人,《植物分子生物学》15:941-946(1990))、响应于伤害和非生物胁迫的元件(拉克(Laake)等人,《美国科学院院报》89:9230-9234(1992);米里(Mhiri)等人,《植物分子生物学》33:257-266(1997)),抗氧化剂响应性元件(拉什莫尔(Rushmore)等人,《生物化学杂志》266:11632-11639;达尔顿(Dalton)等人,《核酸研究》22:5016-5023(1994))、Sph元件(铃木(Suznki)等人,《植物细胞》9:799-8071997)),诱导子响应性元件(丰达(Fnkuda)等人,《植物分子生物学》34:81-87(1997);拉什顿(Rushton)等人,《EMBO杂志》15:5690-5700(1996))、金属响应性元件(斯图尔特(Stuart)等人,《自然》317:828-831(1985);韦斯廷(Westin)等人,《EMBO杂志》7:3763-3770(1988);蒂勒(Thiele)等人,《核酸研究》20:1183-1191(1992);费斯特(Faisst)等人,《核酸研究》20:3-26(1992))、低温响应性元件(贝克(Baker)等人,《植物分子生物学》24:701-713(1994);蒋(Jiang)等人,《植物分子生物学》30:679-684(1996);诺丁(Nordin)等人,《植物分子生物学》21:641-653(1993);周(Zhou)等人,《生物化学杂志》267:23515-23519(1992)),干旱响应性元件,(山口(Yamaguchi)等人,《植物细胞》6:251-264(1994);王(Wang)等人,《植物分子生物学》28:605-617(1995);Bray EA,《植物科学趋势(Trends inPlant Science)》2:48-54(1997))、谷蛋白的强化子元件(科洛(Colot)等人,《EMBO杂志》6:3559-3564(1987);托马斯等人,《植物细胞》2:1171-1180(1990);克雷斯(Kreis)等人,《伦敦皇家学会哲学汇刊》,B314:355-365(1986)),光非依赖性调节元件(拉格朗日(Lagrange)等人,《植物细胞》9:1469-1479(1997);维兰等人,《生物化学杂志》271:32593-32598(1996))、OCS强化子元件(布赫兹(Bouchez)等人,《EMBO杂志》8:4197-4204(1989);佛利(Foley)等人,《植物杂志》3:669-679(1993))、ACGT元件(福斯特等人,《FASEB杂志》8:192-200(1994);井泽等人,《植物细胞》6:1277-1287(1994);井泽等人,《分子生物学杂志》230:1131-1144(1993))、质粒相关基因中的阴性顺式元件(周等人,《生物化学杂志》267:23515-23519(1992);拉格朗日等人,《分子细胞生物学(Mol.Cell Biol.)》13:2614-2622(1993);拉格朗日等人,《植物细胞》9:1469-1479(1997);周等人,《生物化学杂志》267:23515-23519(1992))、醇溶谷蛋白盒元件(福德(Forde)等人,《核酸研究》13:7327-7339(1985);科洛等人,《EMBO杂志》6:3559-3564(1987);托马斯等人,《植物细胞》2:1171-1180(1990);汤普森(Thompson)等人,《植物分子生物学》15:755-764(1990);维森特(Vicente)等人,《美国科学院院报》94:7685-7690(1997))、来自IgM重链基因的强化子中的元件(吉利斯(Gillies)等人,Cell 33:717-728(1983);惠提尔(Whittier)等人,《核酸研究》15:2515-2535(1987))。

启动子的实例包括描述于以下中的那些:第6,437,217号美国专利(玉米RS81启动子)、第5,641,876号美国专利(米肌动蛋白启动子)、第6,426,446号美国专利(玉米RS324启动子)、第6,429,362号美国专利(玉米PR-1启动子)、第6,232,526号美国专利(玉米A3启动子)、第6,177,611号美国专利(组成型玉米启动子)、第5,322,938号、第5,352,605号、第5,359,142号和第5,530,196号美国专利(35S启动子)、第6,433,252号美国专利(玉米L3油质蛋白启动子,P-Zm.L3)、第6,429,357号美国专利(米肌动蛋白2启动子,以及米肌动蛋白2内含子)、第5,837,848号美国专利(根特异性启动子)、第6,294,714号美国专利(光诱导型启动子)、第6,140,078号美国专利(盐诱导型启动子)、第6,252,138号美国专利(病原体诱导型启动子)、第6,175,060号美国专利(磷缺乏诱导型启动子)、第6,635,806号美国专利(γ-薏苡辛(coixin)启动子,P-CI.Gcx)、美国专利序列编号09/757,089(玉米叶绿体醛缩酶启动子)以及第8,772,466号美国专利(玉米转录因子核因子B(NFB2))。

用于植物宿主细胞的适合组成型启动子包括例如Rsyn7启动子的核心启动子及其它揭示于WO 1999/43838和第6,072,050号美国专利中的组成型启动子;核心CaMV 35S启动子(奥德尔(Odell)等人,(1985)《自然》313:810-812);米肌动蛋白(麦克罗伊(McElroy)等人,(1990)《植物细胞》2:163-171);泛素(克里斯坦森等人,(1989)《植物分子生物学》12:619-632和克里斯坦森等人,(1992)《植物分子生物学》18:675-689);pEMU(拉斯特(Last)等人,(1991)《理论与应用遗传学(Theor.Appl.Genet.)》81:581-588);MAS(费尔滕(Velten)等人,(1984)《EMBO杂志》3:2723-2730);ALS启动子(第5,659,026号美国专利)等。

其它组成型启动子包括例如以下所论述的那些:第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号和第6,177,611号美国专利。

适合的组成型启动子还包括在几乎所有组织中具有强表达但在花粉中具有低表达的启动子,包括但不限于:揭示于第8,338,662号美国专利的香蕉条斑病毒(云南尖叶(Acuminata Yunnan))启动子(BSV(AY));揭示于第8,350,121号美国专利的香蕉条斑病毒(越南尖叶(Acuminata Vietnam))启动子(BSV(AV));和揭示于第8,395,022号美国专利的香蕉条斑病毒(麦梭(Mysore))启动子(BSV(M YS))。

取决于所需结果,从诱导型启动子表达基因可能是有益的。对于调节植物中的实施例的核苷酸序列的表达备受关注的是伤害诱导型启动子。此类伤害诱导型启动子可以响应于由昆虫喂养引起的损伤,并且包括马铃薯蛋白酶抑制剂(pin II)基因(里安(Ryan),(1990)《植物病理学年评(Ann.Rev.Phytopath.)》28:425-449;段(Duan)等人,(1996)《自然生物技术(Nature Biotechnology)》14:494-498);wunl和wun2,第5,428,148号美国专利;winl和win2(斯坦福(Stanford)等人,(1989)《分子基因遗传学》215:200-208);系统素(麦格尔(McGurl)等人,(1992)《科学》225:1570-1573);WIPl(罗梅尔(Rohmeier)等人,(1993)《植物分子生物学》22:783-792;埃克尔坎普(Eckelkamp)等人,(1993)《FEBS快报》323:73-76);MPI基因(科尔德罗克(Corderok)等人,(1994)《植物杂志》6(2):141-150)等,其以引用的方式并入本文中。

另外,病原体诱导型启动子可以用于实施例的方法和核苷酸构建体中。此类病原体诱导型启动子包括来自发病机理相关蛋白质(PR蛋白质)的启动子,其在由病原体感染之后诱导;例如PR蛋白质、SAR蛋白质、β-1,3-葡聚糖酶、壳质酶等。参见例如雷多尔菲(Redolfi)等人,(1983)《荷兰植物病理学杂志(Neth.J.Plant Pathol.)》89:245-254;乌克内斯(Uknes)等人,(1992)《植物细胞》4:645-656和范龙(Van Loon),(1985)《植物分子生物学》4:111-116。还参见WO 1999/43819,其以引用的方式并入本文中。

所关注的是在病原体感染部位处或附近局部表达的启动子。参见例如马里诺(Marineau)等人,(1987)《植物分子生物学》9:335-342;马顿(Matton)等人,(1989)《植物-微生物分子相互作用(Molecular Plant-Microbe Interactions)》2:325-331;松斯奇(Somsisch)等人,(1986)《美国科学院院报》83:2427-2430;松斯奇等人,(1988)《分子基因遗传学》2:93-98和杨,(1996)《美国科学院院报》93:14972-14977。还参见陈(Chen)等人,(1996)《植物杂志》10:955-966;张等人,(1994)《美国科学院院报》91:2507-2511;华纳(Warner)等人,(1993)《植物杂志》3:191-201;西伯茨(Siebertz)等人,(1989)《植物细胞》1:961-968;第5,750,386号美国专利(线虫-诱导型)及其中引用的文献。备受关注的是玉米PRms基因的诱导型启动子,其表达由病原体串珠镰刀菌诱导(参见例如科尔德罗(Cordero)等人,(1992)《生理与分子植物病理学(Physiol.Mol.Plant Path.)》41:189-200)。

化学调节启动子可以用于通过施用外源性化学调节子来调节植物中的基因的表达。取决于目标,启动子可以是化学诱导型启动子,其中化学物质的施用诱导基因表达,或化学诱导型启动子,其中化学物质的施用抑制基因表达。化学诱导型启动子是本领域中已知的并且包括但不限于玉米In2-2启动子,其通过苯磺酰胺除草剂安全剂活化;玉米GST启动子,其通过疏水性亲电化合物(其用作显现前除草剂)活化;以及烟草PR-la启动子,其通过水杨酸活化。其它所关注的化学调节启动子包括类固醇响应性启动子(参见例如糖皮质激素-诱导型启动子在舍纳(Schena)等人,(1991)《美国科学院院报》88:10421-10425和麦克尼利斯(McNellis)等人,(1998)《植物杂志》14(2):247-257中)以及四环素诱导型和四环素抑制型启动子(参见例如盖兹(Gatz)等人,(1991)《分子基因遗传学》227:229-237和第5,814,618号和第5,789,156号美国专利),其以引用的方式并入本文中。

可以利用组织优选的启动子来靶向特定植物组织内的增强的多肽表达。组织优选的启动子包括论述于以下中的那些:山本(Yamamoto)等人,(1997)《植物杂志》12(2)255-265;川田(Kawamata)等人,(1997)《植物细胞生理学(Plant Cell Physiol.)》38(7):792-803;汉森(Hansen)等人,(1997)《分子基因遗传学》254(3):337-343;拉塞尔等人,(1997)《转基因研究》6(2):157-168;里内哈特(Rinehart)等人,(1996)《植物生理学》112(3):1331-1341;范坎普(Van Camp)等人,(1996)《植物生理学》112(2):525-535;卡内瓦西尼(Canevascini)等人,(1996)《植物生理学》112(2):513-524;山本等人,(1994)《植物细胞生理学》35(5):773-778;兰,(1994)《细胞分化的结果和问题(Results Probl.CellDiffer.)》20:181-196;奥罗斯科(Orozco)等人,(1993)《植物分子生物学》23(6):1129-1138;松冈(Matsuoka)等人,(1993)《美国科学院院报》90(20):9586-9590和格瓦拉-加西亚(Guevara-Garcia)等人,(1993)《植物杂志》4(3):495-505。如果需要,可以对此类启动子进行修饰以产生较弱表达。

树叶优选的启动子为本领域中已知的。参见例如山本等人,(1997)《植物杂志》12(2):255-265;权(Kwon)等人,(1994)《植物生理学》105:357-67;山本等人,(1994)《植物细胞生理学》35(5):773-778;盖特(Gator)等人,(1993)《植物杂志》3:509-18;奥罗斯科等人,(1993)《植物分子生物学》23(6):1129-1138和松冈等人,(1993)《美国科学院院报》90(20):9586-9590。

根优选的或根特异性启动子是已知的,并且可以选自许多可从文献获得或从各种相容物质中重新分离的启动子。参见例如希尔(Hire)等人,(1992)《植物分子生物学》20(2):207-218(大豆根特异性谷酰胺合成酶基因);凯勒(Keller)和鲍姆加特纳(Baumgartner),(1991)《植物细胞》3(10):1051-1061(菜豆的GRP 1.8基因中的根特异性控制元件);桑格(Sanger)等人,(1990)《植物分子生物学》14(3):433-443(根癌农杆菌的甘露碱合成酶(MAS)基因的根特异性启动子)和米奥(Miao)等人,(1991)《植物细胞》3(1):11-22(编码胞质谷酰胺合成酶(GS)的全长cDNA克隆物,所述GS在大豆的根和根瘤中表达)。还参见布格斯(Bogusz)等人,(1990)《植物细胞》2(7):633-641,其中描述两种根特异性启动子,其从来自固氮的非豆科榆科山麻黄(Parasponia andersonii)和相关非固氮的非豆科山黄麻(Trema tomentosa)的血红蛋白基因中分离。这些基因的启动子连接到β-葡糖苷酸酶报导基因并且引入到非豆科烟草(Nicotiana tabacum)和豆科百脉根(Lotus corniculatus)的两者中,并且在这两种情况下保留根特异性启动子活性。利奇(Leach)和青柳(Aoyagi),(1991)描述其对发根农杆菌(Agrobacterium rhizogenes)的高度表达rolC和rolD根诱导基因的启动子的分析(参见《植物科学》(利默里克(Limerick))79(1):69-76)。其得出结论,强化子和组织优选的DNA决定子在那些启动子中解离。特里(Teeri)等人,(1989)使用与lacZ的基因融合物以显示编码章鱼碱合成酶的农杆菌(Agrobacterium)T-DNA基因在根尖端的表皮中尤其具有活性,并且TR2'基因在完整植物中具有根特异性,并且受到叶组织受伤的刺激,尤其是与杀昆虫或杀幼虫基因一起使用的所需特征组合(参见《EMBO杂志》8(2):343-350)。与nptll融合的TRI'基因(新霉素磷酸转移酶II)显示类似特征。其它根优选的启动子包括VfENOD-GRP3基因启动子(库斯特(Kuster)等人,(1995)《植物分子生物学》29(4):759-772)和rolB启动子(卡帕纳(Capana)等人,(1994)《植物分子生物学》25(4):681-691。还参见第5,837,876号;第5,750,386号;第5,633,363号;第5,459,252号;第5,401,836号;第5,110,732号和第5,023,179号美国专利。拟南芥根优选的调节序列揭示于美国专利申请案US20130117883中。根优选的高粱(双色高粱(Sorghum bicolor))RCc3启动子揭示于美国专利申请案US2012/0210463中。美国专利申请揭示案2003/0131377、第7,645,919号和第8,735,655号美国专利的根优选的玉米启动子。美国专利申请揭示案2013/0025000的根冠特异性1(ZmRCPl)玉米启动子。美国专利申请揭示案2013/0312136的根优选的玉米启动子。

“种子优选的”启动子包括“种子特异性”启动子(在种子开发期间具有活性的那些启动子,例如种子贮藏蛋白的启动子)以及“种子发芽的”启动子(在种子发芽期间具有活性的那些启动子)两者。参见汤普森等人,(1989)《生物分析(BioEssays)》10:108,其以引用的方式并入本文中。此类种子优选的启动子包括但不限于Ciml(细胞***素诱导的消息);cZ19Bl(玉米19kDa玉米蛋白);和milps(肌醇-1-磷酸酯合成酶)(参见第6,225,529号美国专利,其以引用的方式并入本文中)。γ-玉米蛋白和Glb-1为胚乳特异性启动子。对于双子叶植物,种子特异性启动子包括但不限于Kunitz胰蛋白酶抑制剂3(KTi3)(乔福库(Jofuku)和戈德堡(Goldberg),(1989)《植物细胞》1:1079-1093)、豆β-菜豆蛋白、napin、β-伴大豆球蛋白、大豆球蛋白1、大豆凝集素、cruciferin等。对于单子叶植物,种子特异性启动子包括但不限于玉米15kDa玉米蛋白、22kDa玉米蛋白、27kDa玉米蛋白、g-玉米蛋白、蜡质(waxy)、缩小(shrunken)1、缩小2、球蛋白1等。还参见WO 2000/12733,其中揭示来自end1和end2基因的种子优选启动子;其以引用的方式并入本文中。在双子叶植物中,种子特异性启动子包括但不限于来自拟南芥属、pBAN的种子涂层启动子;和来自拟南芥属、p26、p63和p63tr的早期种子启动子(第7,294,760号和第7,847,153号美国专利)。在特定组织中具有“优选的”表达的启动子在所述组织中的表达程度比在至少一种其它植物组织中的更大。一些组织优选的启动子显示在特定组织中几乎完全表达。

在需要低水平表达的情况下,将使用弱启动子。一般来说,如本文所用的术语“弱启动子”是指在低水平下驱使编码序列的表达的启动子。通过低水平表达,预期处于约1/1000转录物到约1/100,000转录物到约1/500,000转录物的水平下。替代地,应认识到,术语“弱启动子”还涵盖仅在几个细胞中而非在其它细胞中驱动表达以产生总低表达水平的启动子。在启动子在不可接受的高水平下驱动表达的情况下,可以缺失或修改启动子序列的部分以降低表达水平。此类弱组成型启动子包括例如Rsyn7启动子的核心启动子(WO 1999/43838和第6,072,050号美国专利)、核心35S CaMV启动子等。其它组成型启动子包括例如揭示于第5,608,149号;第5,608,144号;第5,604,121;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号和第6,177,611号美国专利中的那些,其以引用的方式并入本文中。

启动子的以上清单不意指限制性的。在实施例中可以使用任何适当的启动子。

一般来说,表达盒将包含用于选择转化细胞的可选标记物基因。可选标记物基因用于选择转化细胞或组织。标记物基因包括编码抗生素抗性的基因,如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的那些基因,以及赋予除草剂化合物抗性的基因,如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D)。适合的可选标记物基因的额外实例包括但不限于编码以下抗性的基因:氯霉素(埃雷拉·埃斯特雷拉(HerreraEstrella)等人,(1983)《EMBO杂志》2:987-992);甲氨蝶呤(埃雷拉·埃斯特雷拉等人,(1983)《自然》303:209-213和迈耶(Meijer)等人,(1991)《植物分子生物学》16:807-820);链霉素(琼斯等人,(1987)《分子基因遗传学》210:86-91);大观霉素(spectinomycin)(不列塔尼-萨格纳德(Bretagne-Sagnard)等人,(1996)《转基因研究》5:131-137);博来霉素(bleomycin)(希勒(Hille)等人,(1990)《植物分子生物学》7:171-176);磺酰胺(盖里诺等人,(1990)《植物分子生物学》15:127-136);溴苯腈(斯达克(Stalker)等人,(1988)《科学》242:419-423);草甘膦(萧(Shaw)等人,(1986)《科学》233:478-481和美国专利申请案连续编号10/004,357和10/427,692);草铵膦(德布洛克(DeBlock)等人,(l987)《EMBO杂志》6:2513-2518)。通常参见亚兰顿(Yarranton),(1992)《生物技术现状》3:506-511;克里斯托弗森(Christopherson)等人,(1992)《美国科学院院报》89:6314-6318;姚(Yao)等人,(1992)《细胞》71:63-72;雷兹尼科夫(Reznikoff),(1992)《分子微生物学》6:2419-2422;巴克利(Barkley)等人,(1980)在《操纵子(The Operon)》,第177-220页;胡(Hu)等人,(1987)《细胞》48:555-566;布朗(Brown)等人,(1987)《细胞》49:603-612;菲格(Figge)等人,(1988)《细胞》52:713-722;多伊施勒(Deuschle)等人,(1989)《美国科学院院报》86:5400-5404;弗斯特(Fuerst)等人,(1989)《美国科学院院报》86:2549-2553;多伊施勒等人,(1990)《科学》248:480-483;果森(Gossen),(1993)博士论文,海德堡大学(University of Heidelberg);莱因斯(Reines)等人,(1993)《美国科学院院报》90:1917-1921;拉博(Labow)等人,(1990)《分子细胞生物学》10:3343-3356;赞布雷蒂(Zambretti)等人,(1992)《美国科学院院报》89:3952-3956;拜姆(Baim)等人,(1991)《美国科学院院报》88:5072-5076;维博斯基(Wyborski)等人,(1991)《核酸研究》19:4647-4653;希伦南·威斯曼(Hillenand-Wissman),(1989)《分子结构生物学专题(Topics Mol.Struc.Biol.)》10:143-162;德根科布(Degenkolb)等人,(1991)《抗菌物和化学疗法(Antimicrob.Agents Chemother.)》35:1591-1595;克莱因施密特(Kleinschnidt)等人,(1988)《生物化学》27:1094-1104;博宁(Bonin),(1993)博士论文,海德堡大学;果森等人,(1992)《美国科学院院报》89:5547-5551;奥莉维亚(Oliva)等人,(1992)《抗菌物和化学疗法》36:913-919;哈瓦卡(Hlavka)等人,(1985)《实验药理学手册(Handbook of Experimental Pharmacology)》,第78卷(柏林的斯普林格-维拉格)和吉尔等人,(1988)《自然》334:721-724。此类揭示案以引用的方式并入本文中。

可选标记物基因的以上清单不意指限制性的。任何可选标记物基因可以用于实施例中。

植物转化

实施例的方法涉及将多肽或多核苷酸引入到植物中。如本文所用,“引入”意指以使得序列可进入植物细胞内部的方式将多核苷酸或多肽呈递至植物。实施例的方法不取决于将多核苷酸或多肽引入到植物中的特定方法,仅多核苷酸或多肽可进入植物的至少一个细胞内部。将多核苷酸或多肽引入到植物中的方法在本领域中已知,包括但不限于稳定转化方法、瞬时转化方法和病毒介导的方法。

如本文所用,“稳定转化”是指引入到植物中的核苷酸构建体整合到植物的基因组中并且能够由其子代遗传。如本文所用的“瞬时转化”是指将多核苷酸引入到植物中并且不整合到植物的基因组中或将多肽引入到植物中。如本文所用的“植物”是指完整植物、植物器官(例如叶子、茎、根等)、种子、植物细胞、繁殖体、胚芽及其子代。植物细胞可以分化或未分化(例如愈伤组织、悬浮培养物细胞、原生质粒、叶细胞、根细胞、韧皮部细胞和花粉)。

将核苷酸序列引入到植物中的转化方案以及方案可取决于植物或植物细胞(即,单子叶植物或双子叶植物)的类型而变化,作为转化目标。将核苷酸序列引入到植物细胞中并且随后***到植物基因组中的适合方法包括微注射(克洛斯威(Crossway(等人,(1986)《生物技术》4:320-334)、电穿孔(里格斯(Riggs)等人,(1986)《美国科学院院报》83:5602-5606)、农杆菌介导的转化(第5,563,055号和第5,981,840号美国专利)、直接基因转移(帕斯科夫斯基(Paszkowski)等人,(1984)《EMBO杂志》3:2717-2722)和弹道粒子加速(ballistic particle acceleration)(参见例如第4,945,050号;第5,879,918号;第5,886,244号和第5,932,782号美国专利;托姆斯(Tomes)等人,(1995)在《植物细胞》中,组织和器官培养:基本方法(Tissue,and Organ Culture:Fundamental Methods),甘博格(Gamborg)和菲利普斯(Phillips)编(柏林的斯普林格-维拉格)和麦卡比(McCabe)等人,(1988)《生物技术》6:923-926)和Led转化(WO 00/28058)。对于马铃薯转化,参见涂(Tu)等人,(1998)《植物分子生物学》37:829-838和宗等人,(2000)《转基因研究》9:71-78。额外转化程序可发现于魏辛格(Weissinger)等人,(1988)《遗传学年评》22:421-477;桑福德(Sanford)等人,(1987)《颗粒科学与技术(Particulate Science and Technology)》5:27-37(洋葱);赫里斯图(Christou)等人,(1988)《植物生理学》87:671-674(大豆);麦卡比等人,(1988)《生物技术》6:923-926(大豆);芬纳(Finer)和麦默伦(McMullen),(1991)《活体外细胞发育生物学(In Vitro Cell Dev.Biol.)》27P:175-182(大豆);辛格(Singh)等人,(1998)《理论与应用遗传学》96:319-324(大豆);达塔等人,(1990)《生物技术》8:736-740(米);克莱茵(Klein)等人,(1988)《美国科学院院报》85:4305-4309(玉米);克莱茵等人,(1988)《生物技术》6:559-563(玉米);第5,240,855号;第5,322,783号和第5,324,646号美国专利;克莱茵等人,(1988)《植物生理学》91:440-444(玉米);弗洛姆(Fromm)等人,(1990)《生物技术》8:833-839(玉米);霍伊卡·范斯洛特伦(Hooykaas Van Slogteren)等人,(1984)《自然》(伦敦)311:763-764;第5,736,369号美国专利(谷物);比特比耶(Bytebier)等人,(1987)《美国科学院院报》84:5345-5349(百合);德维(De Wet)等人,(1985)在胚珠组织的实验操控(The Experimental Manipulation of Ovule Tissues),查普曼(Chapman)等人编,(纽约朗文(Longman,N.Y.)),第197-209页(花粉);凯普勒(Kaeppler)等人,(1990)《植物细胞报告(Plant Cell Reports)》9:415-418和凯普勒等人,(1992)《理论与应用遗传学》84:560-566(晶须介导的转化);德哈鲁(D'Halluin)等人,(1992)《植物细胞》4:1495-1505(电穿孔);李(Li)等人,(1993)《植物细胞报告》12:250-255以及赫里斯图和福德(Ford),(1995)《植物学年鉴(Annals of Botany)》75:407-413(米);奥舍达(Osjoda)等人,(1996)《自然生物技术》14:745-750(经由根癌农杆菌的玉米);其都以引用的方式并入本文中。

在特定实施例中,可以使用多种瞬时转化方法将实施例的序列提供到植物。此类瞬时转化方法包括但不限于将多肽或其变异体和片段直接引入到植物中或将多肽转录物引入到植物中。此类方法包括例如微注射或粒子轰击(particle bombardment)。参见例如克洛斯威等人,(1986)《分子基因遗传学》202:179-185;野村(Nomura)等人,(1986)《植物科学》44:53-58;赫普勒(Hepler)等人,(1994)《美国科学院院报》91:2176-2180和哈什(Hush)等人,(1994)《细胞科学杂志(The Journal of Cell Science)》107:775-784,其都以引用的方式并入本文中。

替代地,多肽多核苷酸可以使用本领域中已知的技术瞬时地转化到植物中。此类技术包括病毒载体系统和以阻止DNA的后续释放的方式沉淀多核苷酸。因此,可发生来自粒子结合DNA的转录,但其释放以变得整合到基因组中的频率极大地降低。此类方法包括使用涂有聚乙烯亚胺(PEI;西格玛P3143号)的粒子。

本领域中已知用于将多核苷酸靶向***植物基因组中的特定位置处的方法。在一个实施例中,使用位点特异性重组系统实现多核苷酸在所需基因组位置处的***。参见例如WO 1999/25821、WO 1999/25854、WO 1999/25840、WO 1999/25855和WO 1999/25853,其都以引用的方式并入本文中。简单来说,实施例的多核苷酸可以含于通过两个不相同的重组位点侧接的转移箱中。将转移盒引入到植物中,所述植物已将目标位点稳定地并入到其基因组中,所述目标位点侧接对应于传送盒位点的两个不相同的重组位点。提供适当的重组酶并且转移盒整合在目标位点处。因此,所关注的多核苷酸在植物基因组中的特定染色***置处整合。

植物转化载体可包含实现植物转化所需的一或多个DNA载体。举例来说,本领域的普通实践是利用由多于一个的连续DNA片段构成的植物转化载体。这些载体在此项技术中通常被称作“双运载体”。双运载体以及具有辅助质粒的载体最常用于农杆菌介导的转化,其中实现有效转化所需的DNA片段的尺寸和复杂性相当大,并且有利的是将功能分离到单独的DNA分子上。双运载体通常含有质粒载体,其含有T-DNA转移所需的顺式作用序列(例如,左边框和右边框)、经工程改造以能够在植物细胞中表达的可选标记物和“所关注的基因”(经工程改造以能够在植物细胞中表达的基因,对于其期望产生转基因植物)。还存在于此质粒载体上的是细菌复制所需的序列。顺式作用序列以允许高效转移到植物细胞中及其中的表达的方式布置。举例来说,可选标记物基因和杀虫基因位于左边框与右边框之间。通常,第二质粒载体含有反式作用因子,其介导T-DNA从农杆菌转移到植物细胞。如本领域中所理解,此质粒通常含有毒性功能(Vir基因),其允许由农杆菌感染植物细胞,并且通过在边框序列处的裂解和vir介导的DNA转移来转移DNA(海伦斯(Hellens)和穆利努克斯(Mullineaux),(2000)《植物科学趋势》5:446-451)。数种类型的农杆菌菌株(例如LBA4404、GV3101、EHA101、EHA105等)可以用于植物转化。第二质粒载体对于通过其它方法,如微投影、微注射、电穿孔、聚乙二醇等转化植物不是必需的。

一般来说,植物转化方法涉及将异源DNA转移到目标植物细胞(例如不成熟或成熟胚芽、悬浮培养物、未分化的愈伤组织、原生质体等)中,接着施用适当选择的最大阈值水平(取决于可选标记物基因)以从未转化细胞块的群组回收经转化的植物细胞。在将异源外来DNA整合到植物细胞中之后,接着在培养基中施用适当选择的最大阈值水平,以杀死未转化细胞并且通过定期转移到新鲜培养基而分离并且增殖推定转化细胞(其自这一选择处理而存活)。通过连续通道并且用适当选择的挑战,人们鉴别并且增殖用质粒载体转化的细胞。分子和生物化学方法可接着用于确认所关注的异源基因整合到转基因植物的基因组中的现状。

通常将外植体转移到相同培养基的新鲜供应器并且常规地培养。随后,在置于补充有最大阈值水平的选择剂的再生培养基上之后将转化细胞分化为茎接着将茎转移到选择性生根培养基以用于回收生根茎或小植株。转基因小植株接着生长为成熟植物并且产生可育种子(例如日江井(Hiei)等人,(1994)《植物杂志》6:271-282;石田(Ishida)等人,(1996)《自然生物技术》14:745-750)。通常将外植体转移到相同培养基的新鲜供应器并且常规地培养。产生转基因植物的技术和方法的一般描述发现于艾尔斯(Ayres)和帕克(Park),(1994)《植物科学评论(Critical Reviews in Plant Science)》13:219-239以及波米宁(Bommineni)和耶哈尔(Jauhar),(1997)《麦迪卡》42:107-120。由于经转化材料含有许多细胞;经转化和未转化细胞都存在于任何一段所经受目标愈伤组织或组织或细胞群组中。能够杀死未转化细胞并且允许转化细胞增殖,产生经转化的植物培养物。通常,去除未转化细胞的能力是转化的植物细胞的快速回收和转基因植物的成功产生的限制。

已经转化的细胞可以根据常规方式生长到植物中。参见例如麦考密克(McCormick)等人,(1986)《植物细胞报告》5:81-84。这些植物接着可以生长,并且用相同的经转化菌株或不同菌株传粉,并且所得杂交物具有所识别的所需表型特征的组成型或诱导型表达。可生长两代或更多代以确保稳定地维持和遗传所需表型特征的表达,且接着收获种子以确保已实现所需表型特征的表达。

可以通过使植物与病毒或病毒核酸接触将实施例的核苷酸序列提供到植物。一般来说,此类方法涉及将所关注的核苷酸构建体并入病毒DNA或RNA分子内。应认识到,实施例的重组蛋白可以初始地合成为病毒聚合蛋白质的一部分,其随后可以在活体内或活体外通过蛋白水解处理以产生所需多肽。还认识到,包含实施例的多肽的氨基酸序列的至少一部分的此类病毒聚合蛋白质可具有所需杀虫活性。此类病毒聚合蛋白质及其编码的核苷酸序列涵盖于实施例中。提供具有核苷酸构建体的植物以及在植物中产生经编码蛋白质的方法,其涉及病毒DNA或RNA分子是本领域中已知的。参见例如第5,889,191号;第5,889,190号;第5,866,785号;第5,589,367号和第5,316,931号美国专利;其以引用的方式并入本文中。

用于转化叶绿体的方法为本领域中已知的。参见例如斯瓦伯(Svab)等人,(1990)《美国科学院院报》87:8526-8530;斯瓦伯和玛丽佳(Maliga),(1993)《美国科学院院报》90:913-917;斯瓦伯和玛丽佳,(1993)《EMBO杂志》12:601-606。所述方法依赖于粒子枪(particle gun)递送含有可选标记物的DNA并且通过同源重组将DNA靶向到质粒基因组。另外,质粒转化可以通过沉默质粒承载的转基因的转活化来实现,所述转基因通过经核编码的和质粒引导的RNA聚合酶的组织优选表达。此类系统已报导于麦克布莱德(McBride)等人,(1994)《美国科学院院报》91:7301-7305。

实施例进一步涉及实施例的经转化植物的植物繁殖材料,所述实施例包括但不限于种子、块茎、球茎、球茎体、叶以及根和茎的插条。

能够经转化且表达杀生物蛋白的植物物种

实施例可用于任何植物物种的转化,包括但不限于单子叶植物和双子叶植物。所关注的植物的实例包括但不限于玉米(玉米(Zea mays))、芸苔属(Brassica sp.)(例如欧洲油菜(B.napus)、白菜型油菜(B.rapa)、芥菜(B.juncea)),尤其适用作种子油来源的那些芸苔属,苜蓿(紫苜蓿(Medicago sativa))、水稻(水稻(Oryza sativa))、黑麦(栽培黑麦(Secale cereale))、高粱(双色高粱、高粱(Sorghum vulgare))、粟(例如珍珠粟(御谷(Pennisetum glaucum))、黍小米(糜子(Panicum miliaceum))、谷子(小米(Setariaitalica))、龙爪稷(穇子(Eleusine coracana))、向日葵(向日葵(Helianthus annuus))、红花(红花(Carthamus tinctorius))、小麦(冬小麦(Triticum aestivum))、大豆(大豆(Glycine max))、烟草(烟草(Nicotiana tabacum))、马铃薯(马铃薯(Solanumtuberosum))、花生(落花生(Arachis hypogaea))、棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯(金叶甘薯(Ipomoea batatus))、木薯(木薯(Manihotesculenta))、咖啡(咖啡属(Coffea spp.))、椰子(椰子(Cocos nucifera))、菠萝(菠萝(Ananas comosus))、柑桔树(橙属(Citrus spp.))、可可(可可树(Theobroma cacao))、茶(茶树(Camellia sinensis))、香蕉(香蕉(Musa spp.))、鳄梨(鳄梨(Persea americana))、无花果(无花果(Ficus casica))、番石榴(番石榴(Psidium guajava))、芒果(芒果(Mangifera indica))、橄榄(橄榄(Olea europaea))、番木瓜(番木瓜(Carica papaya))、腰果(腰果(Anacardium occidentale))、夏威夷果(澳洲坚果(Macadamiaintegrifolia))、扁桃(甜扁桃(Prunus amygdalus))、糖用甜菜(甜菜(Beta vulgaris))、甘蔗(甘蔗(Saccharum spp.))、燕麦、大麦、蔬菜、观赏性植物和针叶树。

蔬菜包括番茄(番茄(Lycopersicon esculentum))、莴苣(例如莴苣(Lactucasativa))、青豆(普通菜豆(Phaseolus vulgaris))、菜豆(大棉豆(Phaseolus limensis))、豌豆(香豌豆种(Lathyrus spp.)),以及黄瓜属(Cucumis)的成员,如黄瓜(小黄瓜(C.sativus))、哈密瓜(罗马甜瓜(C.cantalupensis))和香瓜(甜瓜(C.melo))。观赏性植物包括杜鹃花(杜鹃花(Rhododendron spp.))、绣球花(绣球花(Macrophylla hydrangea))、木槿(木槿(Hibiscus rosasanensis))、玫瑰(玫瑰(Rosa spp.))、郁金香(郁金香(Tulipaspp.))、水仙花(水仙花(Narcissus spp.))、矮牵牛(矮牵牛(Petunia hybrida))、康乃馨(康乃馨(Dianthus caryophyllus))、一品红(一品红(Euphorbia pulcherrima))和菊花。可以在实践所述实施例中采用的针叶树包括例如松树,诸如火炬松(火炬松(Pinustaeda))、沼泽松(沼泽松(Pinus elliottii))、黄松(黄松(Pinus ponderosa))、海滩松(扭叶松(Pinus contorta))和辐射松(辐射松(Pinus radiata));花旗松(花旗松(Pseudotsuga menziesii));异叶铁杉(加拿大铁杉(Tsuga canadensis));北美云杉(白云杉(Picea glauca));红木(北美红杉(Sequoia sempervirens));冷杉(true fir),诸如冷杉(silver fir)(胶冷杉(Abies amabilis))和香脂冷杉(香脂冷杉(Abies balsamea));和雪松,诸如北美乔柏(北美乔柏(Thuja plicata))和阿拉斯加柏木(阿拉斯加扁柏(Chamaecyparis nootkatensis))。实施例的植物包括作物植物(例如玉米、苜蓿、向日葵、芸苔、大豆、棉花、红花、花生、高粱、小麦、粟、烟草等),例如玉米和大豆植物。

草皮草包括但不限于早熟禾(早熟禾(Poa annua));意大利黑麦草(意大利黑麦草(Lolium multiflorum));加拿大早熟禾(加拿大早熟禾(Poa compressa));易变紫羊茅(紫羊茅(Festuca rubra));细弱剪股颖(细弱剪股颖(Agrostis tenuis));匍匐剪股颖(匍匐剪股颖(Agrostis palustris));沙生冰草(沙生冰草(Agropyron desertorum));扁穗冰草(扁穗冰草(Agropyron cristadtum));硬羊茅(硬羊茅(Festuca longifolia));草地早熟禾(草地早熟禾(Poa pratensis));鸭茅(鸭茅(Dactylis glomerata));黑麦草(黑麦草(Lolium perenne));紫羊茅(紫羊茅(Festuca rubra));小糠草(小糠草(Agrostisalba));粗茎早熟禾(粗茎早熟禾(Paa trivialis));羊茅(羊茅(Festuca ovina));无芒雀麦(无芒雀麦(Bromus inermis));高羊茅(高羊茅(Festuca arundinacea));梯牧草(梯牧草(Phleum pratense));绒毛剪股颖(绒毛剪股颖(Agrostis canina));碱茅(碱茅(Puccinellia distans));蓝茎冰草(蓝茎冰草(Agropyron smithi));百慕达草(百慕达草(Cynodon spp.));圣奥古斯丁草(St.Augustine grass)(偏序钝叶草(Stenotaphrumsecundatum));结缕草(结缕草(Zoysia spp.));百喜草(百喜草(Paspalum notatum));冰结草地(冰结草地(Axonopus aifinis));假俭草(假俭草(Eremochloa ophiuroides));隐花狼尾草(隐花狼尾草(Pennisetum clandesinum));海滨雀稗(海滨雀稗(Paspalumvaginatum));格兰马草(格兰马草(Bouteloua gracilis));水牛草(水牛草(Buchloedactyloids));垂穗草(垂穗草(Bouteloua curtipendula))。

所关注的植物包括谷类、提供所关注的种子的谷粒植物、含油种子植物和豆科植物。所关注的种子包括谷粒种子,例如玉米、小麦、大麦、水稻、高粱、黑麦、粟等。含油种子植物包括棉花、大豆、红花、向日葵、芸苔、玉米、苜蓿、棕榈、椰子、亚麻、蓖麻、橄榄等。豆科植物包括菜豆和豌豆。菜豆包括瓜尔豆、刺槐豆、葫芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等。

转化的评价

在将异源外来DNA引入到植物细胞中之后,通过多种方法(如与整合基因相关的核酸、蛋白质和代谢物的分析)确认异源基因至植物基因组中的转化或整合。

PCR分析为在移植到土壤中之前在较早阶段筛选转化细胞、组织或茎,以发现所并入的基因的存在的快速方法(萨布鲁克和拉塞尔,(2001)《分子克隆:实验指南》.冷泉港实验室出版社,纽约冷泉港)。使用对所关注之基因或农杆菌载体背景等具有特异性的寡核苷酸引物进行PCR。

植物转化可以通过基因组DNA的南方印迹分析确认(萨布鲁克和拉塞尔,(2001)前述)。一般来说,从转化体提取总DNA,用适当限制酶消化,在琼脂糖凝胶中分馏且转移到硝化纤维或尼龙膜。然后用例如放射性标记的32P目标DNA片段探测膜或“印迹”,以确认根据标准技术将所引入的基因整合到植物基因组中(萨布鲁克和拉塞尔,(2001)前述)。

在北方印迹分析中,RNA从转化体的特异性组织分离,在甲醛琼脂糖凝胶中分馏,并且根据本领域中常规使用的标准程序印迹到尼龙过滤物上(萨布鲁克和拉塞尔,(2001)前述)。通过本领域中已知的方法,接着通过使过滤物与来源于杀虫基因的放射性探针杂交来测试由杀虫基因编码的RNA的表达(萨布鲁克和拉塞尔,(2001)前述)。

蛋白质印迹、生物化学分析等可以对转基因植物进行,以通过标准程序确认由杀虫基因编码的蛋白质的存在(萨布鲁克和拉塞尔,2001,前述),其使用结合到所教示的杀昆虫蛋白上所存在的一或多个表位的抗体。

转基因性状在植物中的堆叠

转基因植物可包含本文所揭示的一或多种杀昆虫多核苷酸与一或多种额外多核苷酸的堆叠,产生或抑制多种多肽序列。

包含多核苷酸序列的堆叠的转基因植物可以通过传统育种方法中的任一者或两者或通过基因工程改造方法获得。这些方法包括但不限于:使各自包含所关注的多核苷酸的个别品系繁殖、用后续基因转化包含本文所揭示的基因的转基因植物和将基因共转化到单一植物细胞中。

如本文所用,术语“堆叠”包括具有存在于同一植物中的多个性状(即,两个性状都并入到核基因组中,一个性状并入到核基因组中并且一个性状并入到质粒的基因组中,或两个性状都并入到质粒的基因组中)。在一个非限制性实例中,“堆叠的性状”包含分子堆叠,其中所述序列物理上彼此邻近。如本文所用,“性状”是指来源于特定序列或序列组的表型。可以使用包含多个基因或在多个载体上单独地承载的基因的单一转化载体来进行基因的共转化。如果所述序列通过遗传转化植物而堆叠,那么所关注的多核苷酸序列可以任何时间并且以任何顺序组合。所述性状可以与由转化盒的任何组合提供的所关注的多核苷酸同时在共转化方案中引入。举例来说,如果将引入两个序列,那么两个序列可含于单独的转化盒(反式)中或含于相同的转化盒(顺式)上。序列的表达可以由相同启动子或由不同启动子驱动。在某些情况下,可能需要引入转化盒,其将抑制所关注的多核苷酸的表达。这可与其它抑制盒或过表达盒的任何组合一起组合以产生植物中的性状的所需组合。进一步认识到,多核苷酸序列可以使用位点特异性重组系统堆叠在所需基因组位置处。参见例如WO1999/25821、WO 1999/25854、WO 1999/25840、WO 1999/25855和WO 1999/25853,其都以引用的方式并入本文中。

在一些实施例中,编码本文所揭示的杀虫蛋白的多核苷酸(其单独或与一或多种额外的昆虫抗性性状堆叠)可与一或多种额外输入性状(例如,除草剂抗性、真菌抗性、病毒抗性、应激耐受性、疾病抗性、雄性不育性、茎秆强度等)或输出性状(例如,产量增加、经修饰淀粉、改良油概况、平衡氨基酸、高赖氨酸或甲硫氨酸、增加的消化率、改良纤维品质、抗旱性等)堆叠。因此,多核苷酸实施例可以用于提供具有改良的作物品质的完全农学包装,同时能够灵活地且经济有效地控制任何数目的农学害虫。

适用于堆叠的转基因包括其它杀虫蛋白,如:莫那辛、PIP、Cry、Cyt、Vip、TC及其任何组合。这些杀虫蛋白已在说明书的较早部分中非常详细地阐述。

适用于与所教示的杀虫蛋白堆叠的其它转基因包括编码以下各者的基因:植物疾病抗性、昆虫特异性激素或信息素、抗真菌活性和杀线虫活性。

对除草剂赋予抗性的转基因还可以与所教示的杀虫蛋白堆叠,包括(以下9种除草剂类别的非限制性类别):

(1)一种编码对抑制生长点或分生组织(如咪唑啉酮或磺酰脲)的除草剂的抗性的多核苷酸。此类别中的例示性基因编码如所描述的突变型ALS和AHAS酶,例如分别藉由李等人,(1988)《EMBO杂志》7:1241和三木(Miki)等人,(1990)《理论与应用遗传学》80:449。还参见第5,605,011号;第5,013,659号;第5,141,870号;第5,767,361号;第5,731,180号;第5,304,732号;第4,761,373号;第5,331,107号;第5,928,937号和第5,378,824号美国专利;美国专利序列编号11/683,737以及国际揭示案WO 1996/33270。

(2)一种编码蛋白质的多核苷酸,所述蛋白质对草甘膦(分别由突变型5-烯醇丙酮酰-3-磷酸莽草酸合成酶(EPSPS)和aroA基因赋予的抗性)和对其它膦酸化合物,如草铵膦(草铵膦(phosphinothricin)乙酰转移酶(PAT)和吸水链霉菌草铵膦乙酰转移酶(棒)基因)以及对吡啶氧基或苯氧基丙酸和环己烷(ACCase抑制剂-编码基因)具有抗性。参见例如沙(Shah)等人的第4,940,835号美国专利,其揭示可赋予草甘膦抗性的EPSPS形式的核苷酸序列。贝利(Barry)等人的第5,627,061号美国专利还描述编码EPSPS酶的基因。还参见第6,566,587号;第6,338,961号;第6,248,876Bl号;第6,040,497号;第5,804,425号;第5,633,435号;第5,145,783号;第4,971,908号;第5,312,910号;第5,188,642号;第5,094,945,4,940,835号;第5,866,775号;第6,225,114Bl号;第6,130,366号;第5,310,667号;第4,535,060号;第4,769,061号;第5,633,448号;第5,510,471号;第Re.36,449号;第RE 37,287E号和第5,491,288号美国专利以及国际揭示案EP 1173580;WO 2001/66704;EP 1173581和EP1173582,其出于此目的以引用的方式并入本文中。还向表达编码草甘膦氧离子基-还原酶的基因的植物赋予草甘膦抗性,如更充分地描述于第5,776,760号和第5,463,175号美国专利,其出于此目的以引用的方式并入本文中。此外,草甘膦抗性可以通过编码草甘膦N-乙酰转移酶的基因的过表达赋予植物。参见例如第7,462,481号;第7,405,074号美国专利和第US 2008/0234130号美国专利申请揭示案。编码突变型aroA基因的DNA分子可在

Figure BDA0002647180000000811

寄存编号39256下获得,并且所述突变型基因的核苷酸序列揭示于科迈的第4,769,061号美国专利、久间田(Kumada)等人的EP申请案编号0 333 033以及(古德曼Goodman)等人的第4,975,374号美国专利揭示谷酰胺合成酶基因的核苷酸序列,其赋予对除草剂(如L-草铵膦)的抗性。草铵膦-乙酰基-转移酶基因的核苷酸序列提供于李曼斯(Leemans)等人,德格里夫(De Greef)等人,(1989)《生物学技术(Biol Technology)》7:61的EP申请案编号0 242 246和0 242 236,描述表达编码草铵膦乙酰转移酶活性的嵌合棒基因的转基因植物的产生。还参见第5,969,213号;第5,489,520号;第5,550,318号;第5,874,265号;第5,919,675号;第5,561,236号;第5,648,477号;第5,646,024号;第6,177,616Bl号和第5,879,903号美国专利,其出于此目的以引用的方式并入本文中。赋予对苯氧基丙酸和环己烷,如稀禾定(sethoxydim)和合氯氟(haloxyfop)的抗性的例示性基因为Accl-Sl、Accl-S2和Accl-S3基因,其由马歇尔(Marshall)等人,(1992)《理论与应用遗传学》83:435描述。

(3)一种编码蛋白质的多核苷酸,其对抑制光合成的除草剂具有抗性,如三嗪(psbA和gs+基因)和苯甲腈(腈水解酶基因)。珀瑞比拉(Przibilla)等人,(1991)《植物细胞》3:169描述具有编码突变型psbA基因的质粒的衣藻属的转化。用于腈水解酶基因的核苷酸序列揭示于斯达克的第4,810,648号美国专利以及含有这些基因的DNA分子可在

Figure BDA0002647180000000812

寄存编号53435、67441和67442下获得。编码谷胱甘肽S-转移酶的DNA的克隆和表达由海斯(Hayes)等人,(1992)《生物化学杂志》285:173所描述。

(4)已将编码对乙酰羟基酸合成酶具有抗性的蛋白质的多核苷酸引入到多种植物中,所述多核苷酸已经发现使得表达这种酶的植物对多种类型的除草剂具有抗性(参见例如哈托利(Hattori)等人,(1995)《分子基因遗传学》246:419)。赋予除草剂抗性的其它基因包括:编码大鼠细胞色素P4507Al和酵母NADPH-细胞色素P450氧化还原酶的嵌合蛋白的基因(盐田(Shiota)等人,(1994)《植物生理学》106:l 7)、用于谷胱甘肽还原酶和超氧化歧化酶的基因(奥诺(Aono)等人,(1995)《植物细胞生理学》36:1687)和用于各种磷酸转移酶的基因(达塔等人,(1992)《植物分子生物学》20:619)。

(5)编码对靶向原卟啉原氧化酶(protox)的除草剂的抗性的多核苷酸,其为产生叶绿素所必需的。原卟啉原氧化酶充当多种除草化合物的目标。这些除草剂还抑制所有存在的不同植物物种的生长,引起其完全破坏。含有改变的原卟啉原氧化酶活性的植物(其对这些除草剂具有抗性)的开发描述于第6,288,306Bl号;第6,282,837Bl号和第5,767,373号美国专利以及国际揭示案WO 2001/12825。

(6)aad-1基因(最初来自鞘脂单胞菌科(Sphingobium herbicidovorans))编码芳氧基链烷酸酯双加氧酶(AAD-1)蛋白质。所述性状赋予对2,4-二氯苯氧基乙酸和芳氧基苯氧基丙酸酯(通常称为“fop”除草剂,如快伏草(quizalofop))除草剂的耐受性。在WO 2005/107437中首先揭示了aad-1基因自身对植物中的除草剂耐受性(还参见US 2009/0093366)。来源于食酸戴尔福特菌(Delftia acidovorans)的aad-12基因编码芳氧基链烷酸酯双加氧酶(AAD-12)蛋白质,其通过用芳氧基链烷酸酯部分去活化数种除草剂而赋予对2,4-二氯苯氧基乙酸和吡啶氧基乙酸酯除草剂的耐受性,所述芳氧基链烷酸酯部分包括苯氧基生长素(例如,2,4-D、MCPA),以及吡啶氧基生长素(例如,氟草定(fluroxypyr)、绿草定(triclopyr))。

(7)一种编码耐除草剂麦草畏单加氧酶的多核苷酸揭示于美国专利申请揭示案2003/0135879以用于赋予麦草畏耐受性;

(8)一种编码溴苯腈腈水解酶(Bxn)的多核苷酸分子揭示于第4,810,648号美国专利以用于赋予溴苯腈耐受性;

(9)一种编码八氢番茄红素(crtl)的多核苷酸分子描述于三泽(Misawa)等人,(1993)《植物杂志》4:833-840以及在三泽等人,(1994)《植物杂志》6:481-489中以用于达草灭耐受性。

赋予或促成改变的谷粒特征的转基因还可以与所教示的杀虫蛋白堆叠,包括(下文关于谷粒中的改变的脂肪酸的非限制性类别):(1)硬脂酰基-ACP的下调以增加植物的硬脂酸含量。参见克努尔松(Knultzon)等人,(1992)《美国科学院院报》89:2624和WO 1999/64579(改变玉米中的脂质概况的基因)。(2)经由FAD-2基因修饰升高油酸和/或经由FAD-3基因修饰降低次亚麻油酸(参见第6,063,947号;第6,323,392号;第6,372,965号和第WO1993/11245号美国专利)。(3)改变共轭次亚麻油酸或亚油酸含量,如在WO 2001/12800中。(4)改变LECl、AGP、Dekl、Superall、mil ps,各种Ipa基因,如Ipal、Ipa3、hpt或hggt。例如参见WO 2002/42424、WO 1998/22604、WO 2003/011015、WO 2002/057439、WO 2003/011015、第6,423,886号、第6,197,561号、第6,825,397号美国专利和美国专利申请揭示案编号US2003/0079247、US 2003/0204870以及里维拉-马德里(Rivera-Madrid)等人,(1995)《美国科学院院报》92:5620-5624。(5)编码用于制备长链多不饱和脂肪酸的δ-8去饱和酶的基因(第8,058,571号和第8,338,152号美国专利)、用于降低饱和脂肪的δ-9去饱和酶(第8,063,269号美国专利)、用于改良ω-3脂肪酸概况的报春花A6-去饱和酶。(6)与脂质和糖代谢调节相关的分离的核酸和蛋白质,确切地说,脂质代谢蛋白质(LMP),其用于产生转基因植物和调节包括脂质、脂肪酸、淀粉或种子贮藏蛋白的种子贮藏化合物的水平的方法中,并且用于调节植物的种子尺寸、种子数目、种子重量、根长度和叶尺寸的方法中。(EP 2404499)(7)改变植物中的高表达水平的糖诱导型2(HSI2)蛋白质的表达以增加或降低植物中的HSI2的表达。增加HSI2的表达增加油含量,同时降低HSI2的表达降低脱落酸敏感度和/或增加抗旱性(第2012/0066794号美国专利申请揭示案)。(8)细胞色素b5(Cb5)单独或与FAD2一起的表达调节植物种子中的油含量,确切地说,增加ω-3脂肪酸的水平并且改进ω-6与ω-3脂肪酸的比率(第2011/0191904号美国专利申请揭示案)。(9)编码用于调节糖代谢的起皱1样多肽的核酸分子(第8,217,223号美国专利)。

赋予或促成改变的谷粒特征的转基因还可以与所教示的杀虫蛋白堆叠,包括(下文关于谷粒中的改变的磷含量的非限制性类别):(1)引入植酸酶编码基因将增强植酸分解,将更多游离磷酸酯添加到转化植物。例如参见范哈廷斯韦尔特(Van Hartingsveldt)等人,(1993)《基因》127:87,对于黑曲霉植酸酶基因的核苷酸序列的揭示内容。(2)调节降低植酸含量的基因。在玉米中,例如,这可以通过克隆然后再引入与一或多个等位基因(如LPA等位基因)相关的DNA来实现,所述等位基因在以植酸水平较低为特征的玉米突变体中鉴别出,如在WO 2005/113778中和/或通过改变肌醇激酶活性,如在WO 2002/059324、第2003/0009011号美国专利申请揭示案、WO 2003/027243、第2003/0079247号美国专利申请揭示案、WO 1999/05298、第6,197,561号美国专利、第6,291,224号美国专利、第6,391,348号美国专利、WO 2002/059324、第2003/0079247号美国专利申请揭示案、WO 1998/45448、WO1999/55882、WO 2001/04147中。

赋予或促成改变的谷粒特征的转基因还可以与所教示的杀虫蛋白堆叠,包括(下文关于谷粒中的改变的碳水化合物的非限制性类别):(1)改变影响淀粉的支化图案的酶的基因,或改变硫氧还蛋白,如NTR和/或TRX的基因(参见第6,531,648号美国专利,其出于此目的以引用的方式并入)和/或γ玉米蛋白基因敲除或突变型,如cs27或TUSC27或en27(参见第6,858,778号美国专利和第2005/0160488号美国专利申请揭示案、第2005/0204418号美国专利申请揭示案,其出于此目的以引用的方式并入)。参见城座(Shiroza)等人,(1988)《细菌学杂志》170:810(突变型果糖基转移酶基因的链球菌核苷酸序列)、斯坦梅茨(Steinmetz)等人,(1985)《分子基因遗传学》200:220(枯草杆菌(Bacillus subtilis)果聚糖蔗糖酶基因的核苷酸序列)、庞(Pen)等人,(1992)《生物技术》10:292(表达地衣芽孢杆菌α-淀粉酶的转基因植物产生)、埃利奥特(Elliot)等人,(1993)《植物分子生物学》21:515(番茄转化酶基因的核苷酸序列)、赛加德(Segaard)等人,(1993)《生物化学杂志》268:22480(大麦α-淀粉酶基因的定点诱变)和费舍尔(Fisher)等人,(1993)《植物生理学》102:1045(玉米胚乳淀粉支化酶II)、WO 1999/10498(通过调节UDP-D-木糖4-表异构酶、脆性1和2、Refl、HCHL、C4H,改良的消化率和/或淀粉提取)、第6,232,529号美国专利(通过调节淀粉水平(AGP)产生高油种子的方法)。本文中所提及的脂肪酸调节基因还可以用于通过淀粉和油途径的相互关系影响淀粉含量和/或组合物。

赋予或促成改变的谷粒特征的转基因还可以与所教示的杀虫蛋白堆叠,包括(下文关于谷粒中的改变的抗氧化剂含量的非限制性类别):(1)改变生育酚或生育三烯酚。例如参见第6,787,683号美国专利、第2004/0034886号美国专利申请揭示案和WO 2000/68393其涉及通过改变尿黑酸香叶基香叶基转移酶(hggt)来操控抗氧化剂水平和WO 2003/082899。

赋予或促成改变的谷粒特征的转基因还可以与所教示的杀虫蛋白堆叠,包括(下文关于谷粒中的改变的必需氨基酸含量的非限制性类别):(1)例如参见第6,127,600号美国专利(增加必需氨基酸在种子中的累积的方法)、第6,080,913号美国专利(增加必需氨基酸在种子中的累积的二元方法)、第5,990,389号美国专利(高赖氨酸)、WO 1999/40209(改变种子中的氨基酸组合物)、WO 1999/29882(用于改变蛋白质的氨基酸含量的方法),第5,850,016号美国专利(改变种子中的氨基酸组合物)、WO 1998/20133(具有增强水平的必需氨基酸的蛋白质)、第5,885,802号美国专利(高甲硫氨酸)、第5,885,801号美国专利(高苏氨酸)、第6,664,445号美国专利(植物氨基酸生物合成酶)、第6,459,019号美国专利(增加的赖氨酸和苏氨酸)、第6,441,274号美国专利(植物色氨酸合成酶β亚单元)、第6,346,403号美国专利(甲硫氨酸代谢酶)、第5,939,599号美国专利(高硫)、第5,912,414号美国专利(增加的甲硫氨酸)、WO 1998/56935(植物氨基酸生物合成酶)、WO 1998/45458(具有较高百分比的必需氨基酸的经工程改造种子蛋白质)、WO 1998/42831(增加的赖氨酸)、第5,633,436号美国专利(增加的硫氨基酸含量)、第5,559,223号美国专利(具有定义的结构的合成贮藏蛋白,其含有可编程水平的必需氨基酸,用于改进植物的营养价值)、WO 1996/01905(增加的苏氨酸)、WO 1995/15392(增加的赖氨酸)、第2003/0163838号美国专利申请揭示案、第2003/0150014号美国专利申请揭示案、第2004/0068767号美国专利申请揭示案、第6,803,498号美国专利、WO 2001/79516。

赋予或促成雄性不育性的转基因还可以与所教示的杀虫蛋白堆叠。产生位点特异性DNA整合位点的转基因还可以与所教示的杀虫蛋白堆叠。

影响作物植物的非生物应激抗性的转基因还可以与所教示的杀虫蛋白堆叠,包括但不限于:花、穗和种子开发、氮利用效率的增强、氮响应性改变、抗旱性或耐旱性、抗冷性或耐冷性以及抗盐性或耐盐性以及在应激下增加的产量。可以与所教示的杀虫蛋白堆叠的非生物应激抗性基因的其它实例包括:(1)WO 2000/73475,其中水使用效率通过改变苹果酸而改变;第5,892,009号、第5,965,705号、第5,929,305号、第5,891,859号、第6,417,428号、第6,664,446号、第6,706,866号、第6,717,034号、第6,801,104号美国专利、WO 2000/060089、WO 2001/026459、WO 2001/035725、WO 2001/034726、WO 2001/035727、WO 2001/036444、WO 2001/036597、WO 2001/036598、WO 2002/015675、WO 2002/017430、WO 2002/077185、WO 2002/079403、WO 2003/013227、WO 2003/013228、WO 2003/014327、WO 2004/031349、WO 2004/076638、WO 199809521。(2)WO 199938977描述在抑制对植物的冻结、高盐度和干旱的不利影响以及赋予对植物表型的其它积极影响上有效的基因,包括CBF基因和转录因子。(3)第2004/0148654号和第WO 2001/36596号美国专利申请揭示案,其中脱落酸在植物中改变,产生改良的植物表型,如增加的产量和/或增加的对非生物应激的耐受性。(4)WO 2000/006341、WO 2004/090143、第7,531,723号和第6,992,237号美国专利,其中细胞***素表达经修饰,产生应激耐受性,如耐旱性增加和/或产量增加的植物。还参见WO2002/02776、WO 2003/052063、JP 2002/281975、第6,084,153号美国专利、WO 2001/64898、第6,177、275号美国专利和第6,107,547号美国专利(氮利用率的增加和氮响应性的改变)。(5)对于乙烯改变,参见第2004/0128719号美国专利申请揭示案、第2003/0166197号美国专利申请揭示案和WO 2000/32761。(6)对于非生物应激的植物转录因子或转录调控因子,参见例如第2004/0098764号美国专利申请揭示案或第2004/0078852号美国专利申请揭示案。(7)增加液泡焦磷酸酶(如AVPl)的表达的基因(第8,058,515号美国专利)用于增加产量;编码HSF A4或HSFA5(A类或A5类的热休克因子)多肽、寡肽转运蛋白(OPT4样)多肽;间隔期(plastochron)2样(PLA2样)多肽或Wuschel相关同源箱I样(WOXl样)多肽的核酸(美国专利申请揭示案第US 2011/0283420号)。(8)编码聚(ADP-核糖)聚合酶(PARP)蛋白质的多核苷酸的下调调节程序性细胞死亡(第8,058,510号美国专利)用于增加活力。(9)编码DTP21多肽的多核苷酸用于赋予耐旱性(第US 2011/0277181号美国专利申请揭示案)。(10)编码ACC合成酶3(ACS3)蛋白质的核苷酸序列用于调节发育、调节对应激的响应以及调节应激耐受性(第US 2010/0287669号美国专利申请揭示案)。(11)编码赋予抗旱性表型(DTP)的蛋白质的多核苷酸用于赋予耐旱性(WO 2012/058528)。(12)生育酚环化酶(TC)基因用于赋予耐旱性和耐盐性(第2012/0272352号美国专利申请揭示案)。(13)CAAX氨基端家族蛋白质用于应激耐受性(第8,338,661号美国专利)。(14)SAL1编码基因中的突变体具有增加的应激耐受性,包括增加的抗旱性(第2010/0257633号美国专利申请揭示案)。(15)编码选自由以下组成的群组的多肽的核酸序列的表达:GRF多肽、RAAl样多肽、SYR多肽、ARKL多肽和YTP多肽以增加产量相关性状(第2011/0061133号美国专利申请揭示案)。(16)调节编码III类海藻糖磷酸酯磷酸酶(TPP)多肽的核酸的植物中的表达,以用于增强植物中的产量相关性状,尤其增加种子产量(第2010/0024067号美国专利申请揭示案)。(17)编码耐旱性表型(DTP6)多肽的核酸序列的表达,尤其是第2014/0223595号美国专利申请揭示案的AT-DTP6。

可将影响植物生长和农学性状(如产量、花、植物生长和/或植物结构)的其它基因和转录因子引入或渗透到植物中,参见例如WO 1997/49811(LHY)、WO 1998/56918(ESD4)、WO 1997/10339和第6,573,430号美国专利(TFL)、第6,713,663号美国专利(FT)、WO 1996/14414(CON)、WO 1996/38560、WO 2001/21822(VRNl)、WO 2000/44918(VRN2)、WO 1999/49064(GI)、WO 2000/46358(FRI)、WO 1997/29123、第6,794,560号美国专利、第6,307,126号美国专利(GAI)、WO 1999/09174(D8和Rht)以及WO 2004/076638和WO 2004/031349(转录因子)。

赋予作物植物增加的产量的转基因还可以与所教示的杀虫蛋白堆叠,例如:(1)由l-氨基环丙烷-1-甲酸酯脱氨酶样多肽(ACCDP)编码核酸转化的转基因作物植物,其中在作物植物中核酸序列的表达相比于野生型品种的植物引起植物的根生长增加,和/或产量增加,和/或对环境应激的耐受性增加(第8,097,769号美国专利)。(2)使用种子优选启动子的玉米锌指蛋白质基因(Zm-ZFPl)的过表达已经显示植物生长提高、每个植物的果仁数目和总果仁重量增加(第2012/0079623号美国专利申请揭示案)。(3)已显示玉米侧器官边界(LOB)结构域蛋白质(Zm-LOBDPl)的组成过表达增加每个植物的果仁数目和总果仁重量(第2012/0079622号美国专利申请揭示案)。(4)通过调节编码VIM1(甲基化1中的变异体)样多肽或VTC2样(GDP-L-半乳糖磷酸化酶)多肽或DUF1685多肽或ARF6样(生长素响应性因子)多肽的核酸的植物中的表达来增强植物中的产量相关性状(WO 2012/038893)。(5)调节编码Ste20样多肽或其同源物的核酸的植物中的表达产生相对于对照植物具有增加的产量的植物(EP 2431472)。(6)编码核苷二磷酸酶激酶(NDK)多肽及其同源物的基因,用于调节植物的根架构(第2009/0064373号美国专利申请揭示案)。

在一些方面,杀虫蛋白可以与已经接受法规批准的任何遗传性状堆叠。此类性状的非穷尽性清单可发现于US 2016/0366891A1的表4A-4F中,其以引用的方式并入本文中。此外,本文所教示的新颖杀昆虫蛋白可以与来自下文列出的以下表B-G的任何遗传性状堆叠或组合。

表B-可与杀昆虫蛋白组合的米性状

Figure BDA0002647180000000871

表C-可与杀昆虫蛋白组合的苜蓿性状

表D-可与杀昆虫蛋白组合的小麦性状

Figure BDA0002647180000000873

Figure BDA0002647180000000881

表E-可与杀昆虫蛋白组合的向日葵性状

表F-可与杀昆虫蛋白组合的大豆性状

Figure BDA0002647180000000883

Figure BDA0002647180000000891

表G-可与杀昆虫蛋白组合的玉米性状

Figure BDA0002647180000000901

Figure BDA0002647180000000911

使用微生物以表达杀昆虫蛋白

可选择已知占据所关注的一或多种作物的“植物球(phytosphere)”(叶面、叶圈、根际和/或根面)的微生物宿主。选择这些微生物以便能够在特定环境中与野生型微生物成功地竞争,提供本文所教示的表达杀虫蛋白的基因的稳定维持和表达,并且提供改良的农药保护使其免于环境降解和失活。

此类微生物包括细菌、藻类和真菌。备受关注的是微生物,如细菌,例如假单胞菌、欧文菌(Erwinia)、沙雷氏菌(Serratia)、克雷伯氏菌(Klebsiella)、黄单胞菌(Xanthomonas)、链霉菌、根瘤菌(Rhizobium)、红假单胞菌(Rhodopseudomonas)、甲基杆菌(Methylius)、农杆菌、醋杆菌(Acetobacter)、乳杆菌(Lactobacillus)、节杆菌(Arthrobacter)、固氮菌(Azotobacter)、明串珠菌(Leuconostoc)和产碱菌(Alcaligenes),真菌,尤其是酵母,例如酵母菌、隐球菌(Cryptococcus)、克鲁维酵母(Kluyveromyces)、掷孢酵母(Sporobolomyces)、红酵母(Rhodotorula)和短柄霉属(Aureobasidium)。备受关注的是此类植物球细菌物种为丁香假单胞菌(Pseudomonassyringae)、布氏假单胞菌(Pseudomonas jluorescens)、绿针假单胞菌(Pseudomonaschlororaphis)、粘质沙雷氏菌(Serratia marcescens)、木醋杆菌(Acetobacterxylinum),农杆菌,球形红假单胞菌(Rhodopseudomonas spheroides)、野油菜黄单胞菌(Xanthomonas campestris)、苜蓿根瘤菌(Rhizobium melioti)、真养产碱杆菌(Alcaligenes entrophus)、甘蔗宿根矮化病菌(Clavibacter xyli)和维涅兰德固氮菌(Azotobacter vinelandii)以及植物球酵母物种,诸如深红酵母(Rhodotorula rubra)、粘红酵母(R.glutinis)、海滨红酵母(R.marina)、橙黄红酵母(R.aurantiaca)、浅白隐球酵母(Cryptococcus albidus)、液化隐球酵母(C.diffluens)、罗伦隐球酵母(C.laurentii)、罗斯酵母(Saccharomyces rosei)、比勒陀尼亚酵母(S.pretoriensis)、酿酒酵母(S.cerevzszae)、红掷孢酵母(Sporobolomyces roseus)、气味掷孢酵母(S.odorus)、维罗纳克鲁维酵母(Kluyveromyces veronae)和短柄霉酵母(Aureobasidium pollulans)。备受关注的是色素沉著微生物。备受关注的宿主生物体包括酵母,如红酵母属、短柄霉属、酵母菌属(诸如酿酒酵母(S.cerevisiae))、掷孢酵母属、叶面生物体,诸如假单胞菌属(诸如绿脓杆菌(P.aeruginosa)、布氏假单胞菌、绿针假单胞菌)、欧文菌属以及黄杆菌属(Flavobacterium spp.)以及其它此类生物体,包括根癌农杆菌、大肠杆菌、枯草杆菌、蜡样芽孢杆菌(Bacillus cereus)等。

可以将编码所教示的杀虫蛋白的基因引入到植物(附生植物)上繁殖的微生物中。附生植物可以是革兰氏阳性或革兰氏阴性细菌。根集群细菌可以通过本领域中已知的方法从所关注的植物中分离。可以例如借助于电转化将编码所教示的杀虫蛋白的基因引入到根集群或附生植物细菌中。可以将基因克隆到穿梭载体中,例如pHT3101(勒雷修斯(Lerecius)等人,(1989)《FEMS微生物学快报(FEMS Microbiol.Lett.)》60:211-218。含有特定多肽基因的编码序列的穿梭载体pHT3101可以例如借助于电穿孔转化为细菌(勒雷修斯等人,(1989)《FEMS微生物学快报》60:211-218)。可以设计表达系统以使得所教示的杀虫蛋白分泌在革兰氏阴性细菌(例如大肠杆菌)的细胞质外部。

本文所教示的杀虫蛋白可在细菌宿主中发酵,并且以Bt菌株已经用作杀昆虫喷雾剂的相同方式处理所得细菌并且用作微生物喷雾剂。就从芽孢杆菌分泌的杀虫蛋白而言,使用本领域中已知的程序去除或突变分泌信号。此类突变和/或缺失预防在发酵过程期间蛋白质分泌到生长培养基中。杀虫蛋白保留在细胞内并且然后处理细胞以产生包装蛋白质。任何适合的微生物可用于此目的。假单胞菌已经用于将Bt毒素表达为包装蛋白质,并且处理所得细胞且喷雾为杀虫剂(格特纳(Gaertner)等人,(1993),在:《高级经工程改造杀虫剂(Advanced Engineered Pesticides)》,金(Kim)编)。

替代地,所教示的杀虫蛋白通过将异源基因引入到细胞宿主中来产生。异源基因的表达直接或间接在农药的胞内生产和维持中产生。然后在细胞施用到目标害虫的环境时在延长细胞中产生的毒素的活性的条件下处理这些细胞。所得产物保留毒素的毒性。这些天然包装蛋白质接着可根据应用于容纳目标害虫的环境(例如土壤、水和植物叶)的常规技术来调配。参见例如EPA 0192319及其中引用的文献。

杀虫组合物

在一些实施例中,活性成分可以组合物形式施用并且可以与其它化合物同时或依次施用到待处理的作物区域或植物。这些化合物可以是肥料、除草剂、低温保护剂、表面活性剂、清洁剂、杀虫皂、休眠油、聚合物和/或时间释放或生物可降解的载剂调配物,其允许在单次施用调配物之后长期给药目标区域。其还可以是选择性除草剂、化学杀虫剂、杀病毒剂、杀微生物剂、抗阿米巴药(amoebicide)、农药、杀真菌剂、杀菌剂、杀线虫剂、杀软体动物剂或这些调配物中的数种的混合物(如果需要),以及其它农业上可接受的载剂、表面活性剂或调配物领域中通常采用的施用促进佐剂。适合载剂(即农业上可接受的载剂)和佐剂可为固体或液体且对应于调配物技术中通常采用的物质,例如天然或再生矿物质、溶剂、分散剂、湿润剂、粘着剂、增粘剂、粘合剂或肥料。同样地,可以将调配物制备为可食用的诱饵或形成到害虫捕集器中,以允许目标害虫食用或摄入杀虫调配物。

施用活性成分或农业化学组合物的方法包括叶施用、种子涂布和土壤施用,所述农业化学组合物含有由细菌菌株产生的所教示的杀昆虫蛋白中的至少一者。施用的数目和施用率取决于对应害虫的感染的强度。

组合物可调配为粉末、粉尘、球粒、颗粒、喷雾、乳液、胶体、溶液等,并且可通过此类常规手段制备,如干燥、冻干、均质化、萃取、过滤、离心、沉降或浓缩包含多肽的细胞的培养物。在含有至少一种此类杀虫多肽的所有此类组合物中,多肽可以约1重量%到约99重量%的浓度存在。

鳞翅目、双翅目、半翅目、异翅目、线虫或鞘翅目可以通过本发明的方法杀死或减少给定区域中的数目,或可以预防性地施用于环境区域以防止受敏感的害虫侵扰。优选地,害虫摄取杀虫有效量的所揭示的杀昆虫蛋白或与杀虫有效量的所揭示的杀昆虫蛋白接触。“杀虫有效量”是指能够使至少一种害虫死亡或显著地减少害虫生长、食用或正常生理发育的农药的量。此量将取决于例如以下此类因素而变化:待控制的特定目标害虫、特定环境、位置、植物、作物或待处理的农业部位、环境条件和方法、速率、浓度、稳定性和杀虫有效蛋白质组合物的施用量。调配物还可关于气候条件、环境考虑因素和/或施用频率和/或害虫侵扰的严重程度而变化。

所描述的农药组合物可通过用所需农业上可接受的载剂调配细菌细胞、晶体和/或孢子悬浮液或分离的蛋白质组分来制备。

组合物可在施用之前以适当方式调配,如冻干、冷冻干燥、干燥或在水性载剂、介质或适合的稀释剂(如生理盐水或其它缓冲剂)中。经调配组合物可以呈粉尘或粒状材料或油(植物或矿物质)或水或油/水乳液中的悬浮液的形式或呈可湿性粉末,或与适合于农业施用的任何其它载剂材料组合。适合农业载剂可以是固体或液体并且在本领域中众所周知。术语“农业上可接受的载剂”涵盖通常用于农药调配物技术的所有佐剂、惰性组分、分散剂、表面活性剂、粘着剂(sticker)、增粘剂、粘合剂等;这些对于农药调配物的技术人员来说是众所周知的。调配物可以与一或多种固体或液体佐剂混合,并且通过各种方式制备,例如通过使用常规调配物技术用适合的佐剂均匀混合、掺合和/或研磨杀虫组合物。适合的调配物和施用方法描述于第6,468,523号美国专利,其以引用的方式并入本文中。植物还可以用一或多种化学组合物处理,所述化学组合物包括一或多种除草剂、杀虫剂或杀真菌剂。

例示性化学组合物包括:水果/蔬菜除草剂:莠去津(Atrazine)、除草定(Bromacil)、敌草隆(Diuron)、草甘膦(Glyphosate)、利谷隆(Linuron)、赛克津(Metribuzin)、西玛津(Simazine)、氟乐灵(Trifluralin)、吡氟禾草灵(Fluazifop)、草铵膦(Glufosinate)、氯吡嘧磺隆高恩(Halo sulfuron Gowan)、巴拉割(Paraquat)、戊炔草胺(Propyzamide)、稀禾定(Sethoxydim)、氟丙嘧草酯(Butafenacil)、氯吡嘧磺隆(Halosulfuron)、茚嗪氟草胺(Indaziflam);水果/蔬菜杀虫剂:得灭克(Aldicarb)、苏云金杆菌、加保利(Carbaryl)、加保扶(Carbofuran)、陶斯松(Chlorpyrifos)、氯氰菊酯(Cypermethrin)、溴氰菊酯(Deltamethrin)、二嗪磷(Diazinon)、马拉松(Malathion)、阿维菌素(Abamectin)、氟氯氰菊酯(Cyfluthrin)/高效氟氯氰菊酯(betacyfluthrin)、高氰戊菊酯(Esfenvalerate)、λ-赛洛宁(cyhalothrin)、亚醌螨(Acequinocyl)、毕芬载(Bifenazate)、甲氧虫酰肼(Methoxyfenozide)、诺伐隆(Novaluron)、环虫酰肼(Chromafenozide)、噻虫啉(Thiacloprid)、呋虫胺(Dinotefuran)、嘧螨酯(FluaCrypyrim)、唑虫酰胺(Tolfenpyrad)、可尼丁(Clothianidin)、螺螨酯(Spirodiclofen)、γ-赛洛宁、螺甲螨酯(Spiromesifen)、赐诺杀(Spinosad)、氯虫酰胺(Rynaxypyr)、斯阿皮(Cyazypyr)、艾绿士(Spinetoram)、三福隆(Triflumuron)、螺虫乙酯(Spirotetramat)、吡虫啉(Imidacloprid)、氟虫双酰胺(Flubendiamide)、硫敌克(Thiodicarb)、氰氟虫腙(Metaflumizone)、氟啶虫胺腈(Sulfoxaflor)、丁氟螨酯(Cyflumetofen)、腈吡螨酯(Cyanopyrafen)、吡虫啉、可尼丁、噻虫嗪(Thiamethoxam)、艾绿士、硫敌克、氟尼胺(Flonicamid)、灭虫威(Methiocarb)、甲氨基阿维菌素苯甲酸盐(Emamectin benzoate)、因得克(Indoxacarb)、福噻唑(Forthiazate)、克线磷(Fenamiphos)、镉磷(Cadusaphos)、吡丙醚(Pyriproxifen)、苯丁锡(Fenbutatin oxide)、己噻唑(Hexthiazox)、灭多虫(Methomyl)、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮;水果蔬菜杀真菌剂:贝芬替(Carbendazim)、四氯异苯腈(Chlorothalonil)、EBDC、硫、多保净(Thiophanate)-甲基、亚托敏(Azoxystrobin)、克绝(Cymoxanil)、扶吉胺(Fluazinam)、福赛得(Fosetyl)、依普同(Iprodione)、克收欣(Kresoxim-methyl)、灭达乐(Metalaxyl)/右灭达乐(mefenoxam)、三氟敏(Trifloxystrobin)、噻唑菌胺(Ethaboxam)、丙森锌(Iprovalicarb)、三氟敏、环酰菌胺(Fenhexamid)、噁咪唑反丁烯二酸盐(Oxpoconazole fumarate)、赛座灭(Cyazofamid)、咪唑菌酮(Fenamidone)、苯酰菌胺(Zoxamide)、啶氧菌酯(Picoxystrobin)、百克敏(Pyraclostrobin)、环氟菌胺(Cyflufenamid)、白克列(Boscalid);谷类除草剂:异丙隆(Isoproturon)、溴苯腈、碘苯腈(loxynil)、芬诺谢(Phenoxies)、氯磺隆(Chlorsulfuron)、炔草酸(Clodinafop)、禾草灵(Diclofop)、吡氟草胺(Diflufenican)、噁唑禾草灵(Fenoxaprop)、双氟磺草胺(Florasulam)、氟草烟(Fluoroxypyr)、甲磺隆(Metsulfuron)、醚苯磺隆(Triasulfuron)、氟酮磺隆(Flucarbazone)、碘磺隆(lodosulfuron)、丙苯磺隆(Propoxycarbazone)、氟吡草胺(Picolinafen)、甲基二磺隆(Mesosulfuron)、氟丁酰草胺(Beflubutamid)、唑啉草酯(Pinoxaden)、酰嘧磺隆(Amidosulfuron)、噻吩磺隆甲基(Thifensulfuron Methyl)、苯磺隆(Tribenuron)、氟啶嘧磺隆(Flupyrsulfuron)、磺酰磺隆(Sulfosulfuron)、磺酰草吡唑(Pyrasulfotole)、嘧氧磺胺(Pyroxsulam)、氟噻草胺(Flufenacet)、肟草酮(Tralkoxydim)、砜吡草唑(Pyroxasulfon);谷类杀真菌剂:贝芬替(Carbendazim)、四氯异苯腈(Chlorothalonil)、亚托敏、环克座(Cyproconazole)、嘧菌环胺(Cyprodinil)、丁苯吗啉(Fenpropimorph)、依普座(Epoxiconazole)、醚菌酯(Kresoximmethyl)、喹氧灵(Quinoxyfen)、得克利(Tebuconazole)、三氟敏、硅氟唑(Simeconazole)、啶氧菌酯(Picoxystrobin)、百克敏(Pyraclostrobin)、二莫西史卓宾(Dimoxystrobin)、丙硫菌唑(Prothioconazole)、氟嘧菌酯(Fluoxastrobin);谷类杀虫剂:乐果(Dimethoate)、λ-赛洛宁、溴氰菊酯、α-氯氰菊酯(Cypermethrin)、β-氟氯氰菊酯(cyfluthrin)、联苯菊酯(Bifenthrin)、吡虫啉、可尼丁、噻虫嗪(Thiamethoxam)、噻虫啉、啶虫脒(Acetamiprid)、丁内妥夫(Dinetofuran)、可非磷(Clorphyriphos)、甲胺磷(Metamidophos)、氧甲隆甲基(Oxidemethon methyl)、抗蚜威(Pirimicarb)、(Methiocarb);玉米除草剂:莠去津、甲草胺(Alachlor)、溴苯腈(Bromoxynil)、乙草胺(Acetochlor)、麦草畏(Dicamba)、二氯吡啶酸(Clopyralid)、S-二甲噻草胺(Dimethenamid)、草铵膦(Glufosinate)、草甘膦、异噁唑草酮(Isoxaflutole)、S-异丙甲草胺(Metolachlor)、甲基磺草酮(Mesotrione)、烟嘧磺隆(Nicosulfuron)、氟嘧磺隆(Primisulfuron)、砜嘧磺隆(Rimsulfuron)、磺草酮(Sulcotrione)、甲酰嘧磺隆(Foramsulfuron)、苯吡唑草酮(Topramezone)、环磺酮(Tembotrione)、索氟纳西(Saflufenacil)、噻酮磺隆(Thiencarbazone)、氟噻草胺(Flufenacet)、砜吡;玉米杀虫剂:加保扶(Carbofuran)、陶斯松(Chlorpyrifos)、联苯菊酯(Bifenthrin)、氟虫腈(Fipronil)、吡虫啉、λ-赛洛宁、七氟菊酯(Tefluthrin)、特丁磷(Terbufos)、噻虫嗪(Thiamethoxam)、可尼丁、螺甲螨酯、氟虫双酰胺(Flubendiamide)、三福隆、氯虫酰胺、溴氰菊酯、硫敌克、β-氟氯氰菊酯、氯氰菊酯、联苯菊酯(Bifenthrin)、禄芬隆(Lufenuron)、杀铃脲(Triflumoron)、七氟菊酯、嘧丙磷(Tebupirimphos)、乙虫清(Ethiprole)、斯阿皮(Cyazypyr)、噻虫啉、啶虫脒、丁内妥夫、阿佛菌素(Avermectin)、灭虫威(Methiocarb)、螺螨酯、螺虫乙酯;玉米杀真菌剂:菲尼潘(Fenitropan)、福美双(Thiram)、丙硫菌唑、得克利、三氟敏;水稻除草剂:丁草胺(Butachlor)、敌稗(Propanil)、四唑嘧磺隆(Azimsulfuron)、苄嘧磺隆(Bensulfuron)、氰氟草酯(Cyhalofop)、杀草隆(Daimuron)、四唑酰草胺(Fentrazamide)、唑吡嘧磺隆(Imazosulfuron)、苯噻酰草胺(Mefenacet)、噁嗪草酮(Oxaziclomefone)、吡嘧磺隆(Pyrazosulfuron)、稗草丹(Pyributicarb)、二氯喹啉酸(Quinclorac)、禾草丹(Thiobencarb)、茚草酮(Indanofan)、氟噻草胺(Flufenacet)、四唑酰草胺(Fentrazamide)、氯吡嘧磺隆(Halosulfuron)、噁嗪草酮(Oxaziclomefone)、苯并双环酮(Benzobicyclon)、环酯草醚(Pyriftalid)、平速烂(Penoxsulam)、双草醚(Bispyribac)、丙炔噁草酮(Oxadiargyl)、乙氧嘧磺隆(Ethoxysulfuron)、丙草胺(Pretilachlor)、甲基磺草酮(Mesotrione)、特呋喃隆(Tefuryltrione)、噁二唑(Oxadiazone)、噁唑禾草灵、嘧啶硫蕃(Pyrimisulfan);大米杀虫剂:二嗪磷(Diazinon)、杀螟硫磷(Fenitrothion)、仲丁威(Fenobucarb)、久效磷(Monocrotophos)、丙硫克百威(Benfuracarb)、布芬净(Buprofezin)、呋虫胺(Dinotefuran)、氟虫腈、吡虫啉、叶蝉散(Isoprocarb)、噻虫啉、环虫酰肼(Chromafenozide)、噻虫啉、呋虫胺(Dinotefuran)、可尼丁(Clothianidin)、乙虫清(Ethiprole)、氟虫双酰胺(Flubendiamide)、氯虫酰胺、溴氰菊酯、啶虫脒、噻虫嗪(Thiamethoxam)、斯阿皮(Cyazypyr)、赐诺杀(Spinosad)、艾绿士、因灭汀-苯甲酸盐(Emamectin-Benzoate)、氯氰菊酯、陶斯松(Chlorpyriphos)、培丹(Cartap)、多灭磷(Methamidophos)、依芬宁(Etofenprox)、***磷(Triazophos)、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、加保扶(Carbofuran)、丙硫克百威(Benfuracarb);水稻杀真菌剂:多保净-甲基、亚托敏、加普胺(Carpropamid)、护粒松(Edifenphos)、嘧菌腙(Ferimzone)、异稻瘟净(Iprobenfos)、稻瘟灵(Isoprothiolane)、宾克隆(Pencycuron)、噻菌灵(Probenazole)、咯喹酮(Pyroquilon)、三赛唑(Tricyclazole)、三氟敏、双氯氰菌胺(Diclocymet)、氰菌胺(Fenoxanil)、硅氟唑(Simeconazole)、噻酰菌胺(Tiadinil);棉花除草剂:敌草隆(Diuron)、伏草隆(Fluometuron)、MSMA乙氧氟草醚(Oxyfluorfen)、扑草净(Prometryn)、氟乐灵(Trifluralin)、唑草酮(Carfentrazone)、克草同(Clethodim)、吡氟禾草灵-丁基、草甘膦、达草灭(Norflurazon)、二甲戊乐灵(Pendimethalin)、嘧硫草醚(Pyrithiobac)-钠、三氟啶磺隆(Trifloxysulfuron)、吡喃草酮(Tepraloxydim)、草铵膦、丙炔氟草胺(Flumioxazin)、噻苯隆(Thidiazuron);棉花杀虫剂:欧杀松(Acephate)、得灭克(Aldicarb)、陶斯松(Chlorpyrifos)、氯氰菊酯、溴氰菊酯、马拉松、久效磷(Monocrotophos)、阿维菌素(Abamectin)、啶虫脒、甲氨基阿维菌素苯甲酸盐、吡虫啉、因得克(Indoxacarb)、λ-赛洛宁、赐诺杀(Spinosad)、硫敌克(Thiodicarb)、γ-赛洛宁、螺甲螨酯、啶虫丙醚(Pyridalyl)、氟尼胺、氟虫双酰胺(Flubendiamide)、三福隆、氯虫酰胺、β-氟氯氰菊酯、螺虫乙酯、可尼丁、噻虫嗪(Thiamethoxam)、噻虫啉、丁内妥夫、氟虫双酰胺(Flubendiamide)、斯阿皮、赐诺杀、艾绿士、γ赛洛宁、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、硫敌克、阿佛菌素(Avermectin)、氟尼胺、啶虫丙醚(Pyridalyl)、螺甲螨酯、氟啶虫胺腈(Sulfoxaflor)、丙溴磷(Profenophos)、***磷(Thriazophos)、硫丹(Endosulfan);棉花杀真菌剂:依得利(Etridiazole)、灭达乐(Metalaxyl)、五氯硝基苯(Quintozene);大豆除草剂:甲草胺(Alachlor)、灭草松(Bentazone)、氟乐灵(Trifluralin)、氯磺隆(Chlorimuron-Ethyl)、氯酯磺草胺(Cloransulam)-甲基、噁唑禾草灵、氟磺胺草醚(Fomesafen)、吡氟禾草灵、草甘膦、甲氧咪草烟(Imazamox)、灭草喹(Imazaquin)、咪草烟(Imazethapyr)、(S-)异丙甲草胺(Metolachlor)、赛克津(Metribuzin)、二甲戊乐灵(Pendimethalin)、吡喃草酮(Tepraloxydim)、草铵膦;大豆杀虫剂:λ-赛洛宁、灭多虫(Methomyl)、巴拉松(Parathion)、抗虫威(Thiocarb)、吡虫啉、可尼丁、噻虫嗪、噻虫啉、啶虫脒、丁内妥夫、福本胺(Flubendiamide)、氯虫酰胺、斯阿皮、赐诺杀、艾绿士、因灭汀(Emamectin)-苯甲酸盐、氟虫腈、乙虫清(Ethiprole)、溴氰菊酯、β-氟氯氰菊酯、γ和λ赛洛宁、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、螺虫乙酯、螺螨酯、三福隆、氟尼胺、硫敌克、-氟氯氰菊酯;大豆杀真菌剂:亚托敏、环克座、依普座(Epoxiconazole)、粉唑醇(Flutriafol)、百克敏(Pyraclostrobin)、得克利、三氟敏、丙硫菌唑(Prothioconazole)、四克利(Tetraconazole);甜菜除草剂:氯草敏(Chloridazon)、甜菜安(Desmedipham)、乙呋草黄(Ethofumesate)、甜菜宁(Phenmedipham)、(Triallate)、二氯吡啶酸(Clopyralid)、吡氟禾草灵、环草定(Lenacil)、苯嗪草酮(Metamitron)、喹草酸(Quinmerac)、环杀草(Cycloxydim)、氟胺磺隆(Triflusulfuron)、吡喃草酮(Tepraloxydim)、快伏草(Quizalofop);甜菜杀虫剂:吡虫啉、可尼丁、噻虫嗪、噻虫啉、啶虫脒、丁内妥夫、溴氰菊酯、β-氟氯氰菊酯,γ/λ赛洛宁、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、七氟菊酯、氯虫酰胺、查西皮(Cyaxypyr)、氟虫腈、加保扶;芥花除草剂:二氯吡啶酸(Clopyralid)、禾草灵(Diclofop)、吡氟禾草灵、草铵膦、草甘膦、吡草胺(Metazachlor)、氟乐灵胺苯磺隆(Trifluralin Ethametsulfuron)、喹草酸(Quinmerac)、快伏草(Quizalofop)、克草同(Clethodim)、吡喃草酮(Tepraloxydim);芥花杀真菌剂:亚托敏、贝芬替(Carbendazim)、氟二恶尼(Fludioxonil)、依普同、扑克拉(Prochloraz)、农利灵(Vinclozolin);芥花杀虫剂:加保扶有机磷酸酯、拟除虫菊酯(Pyrethroids)、噻虫啉、溴氰菊酯、吡虫啉、可尼丁、噻虫嗪、啶虫脒、丁内妥夫、β-氟氯氰菊酯、γ和λ赛洛宁、τ氟戊酸、乙虫清(Ethiprole)、赐诺杀、艾绿士、福本胺、氯虫酰胺、斯阿皮、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮。

害虫

“害虫”包括但不限于昆虫、真菌、细菌、线虫、螨虫、扁虱等。昆虫害虫包括选自以下各者的昆虫:鞘翅目、双翅目、膜翅目、鳞翅目、食毛目、同翅目、半翅目、直翅目、缨翅目、革翅目、等翅目、虱目、蚤目、毛翅目等,特定言之鳞翅目和鞘翅目。

本领域的技术人员将认识到,并非所有化合物都对所有害虫同样有效。实施例的化合物显示针对昆虫害虫的活性,其可包括经济上重要的农学、森林、温室、苗圃观赏性植物、食品和纤维、公共和动物健康、家庭和商业结构、家庭和存储产品害虫。

鳞翅目的幼虫包括但不限于粘虫、切根虫、尺蠖和黑地香(heliothine)在夜蛾科草地贪夜蛾J E史密斯(秋夜蛾);夜盗蛾属(S.exigua)哈布纳(Hubner)(甜菜夜蛾);斜纹夜蛾(S.litura)法布里休斯(Fabricius)(百香果斜纹夜蛾、茶蚕);蓓带夜蛾(Mamestraconfigurata)沃克(Walker)(披肩粘虫);甘蓝夜蛾(M.brassicae)林奈(Linnaeus)(菜蛾(cabbage moth));小地老虎胡天纳格尔(Hufnagel)(黑毛虫);灰地老虎(A.orthogonia)莫里森(Morrison)(白缘切根虫);地下老虎(A.subterranea)法布里休斯(粒肤地老虎(granulate cutworm));棉叶波纹叶蛾(Alabama argillacea)哈布纳(棉树叶虫(cottonleaf worm));粉纹夜蛾(Trichoplusia ni)哈布纳(菜尺蠖);大豆夜蛾沃克(大豆尺蠖);黎豆夜蛾哈布纳(绒毛豆毛虫);三叶草夜蛾(Hypena scabra)法布里休斯(绿三叶草虫);美洲烟叶蛾(Heliothis virescens)法布里休斯(烟草夜蛾);一星粘虫(Pseudaletiaunipuncta)霍沃思(Haworth)(粘虫);粗皮地老虎(Athetis mindara)巴恩斯(Barnes)和麦克多诺(Mcdunnough)(粗皮地老虎);切夜蛾属(Euxoa messoria)哈里斯(Harris)(切夜蛾);棉斑实蛾(Earias insulana)博伊斯杜瓦(Boisduval)(螟蛉虫);威氏蛾(E.vittella)法布里休斯(斑点棉铃虫);茄夜蛾(Helicoverpa armigera)哈布纳(美国棉铃虫);谷实夜蛾(H.zea)博迪(Boddie)(玉米穗虫或棉铃虫);乌夜蛾(Melanchra picta)哈里斯(斑马纹夜蛾);柑橘夜蛾(Egira/Xylomyge)格罗特(Grote)(柑橘夜蛾);蛀虫、鞘蛾幼虫、结网毛虫(webworm)、锥虫和雕叶虫来自欧洲玉米螟科哈布纳(欧洲玉米蛀虫);脐橙螟(Amyeloistransitella)沃克(橙色蠕虫);地中海粉螟(Anagasta kuehniella)泽勒(Zeller)(地中海粉蛾);粉斑螟蛾(Cadra cautella)沃克(粉斑螟);二化螟(Chilo suppressalis)沃克(稻茎螟虫);斑禾草螟(C.partellus)(高粱蛀虫);米蛾(Corcyra cephalonica)斯坦顿(Stainton)(米蛾);玉米根草螟(Crambus caliginosellus)克里门斯(Clemens)(玉米根草螟);蓝草结网毛虫(C.teterrellus)辛肯(Zincken)(蓝草网虫);稻纵卷叶螟(Cnaphalocrocis medinalis)古尼(Guenee)(稻纵卷叶螟);葡萄卷叶虫(Desmiafuneralis)哈布纳(葡萄卷叶虫);甜瓜绢野螟(Diaphania hyalinata)林奈(甜瓜野螟);黄瓜绢野螟(D.nitidalis)斯托(Stoll)(泡菜虫);西南玉米螟(Diatraea grandiosella)迪叶(Dyar)(西南玉米蛀虫);小蔗螟(D.saccharalis)法布里休斯(小蔗蛀虫);禾草螟(Eoreuma loftini)迪叶(墨西哥水稻蛀虫);烟草粉斑螟(Ephestia elutella)哈布纳(烟草粉螟);大蜡螟(Galleria mellonella)林奈(大蜡螟);水稻切叶野螟(Herpetogrammalicarsisalis)沃克(结网毛虫);向日葵班螟(Homoeosoma electellum)赫尔斯特(Hulst)(向日葵班螟);小玉米螟(Elasmopalpus lignosellus)泽勒(小玉米蛀虫);小蜡螟(Achroia grisella)法布里休斯(小蜡螟);网锥额野螟(Loxostege sticticalis)林奈(黄绿条螟);茶树螟(Orthaga thyrisalis)沃克(茶树网蛾);豆野螟(Maruca testulalis)耶尔(Geyer)(豆荚蛀螟);印度谷螟(Plodia interpunctella)哈布纳(印度谷螟);三化螟(Scirpophaga incertulas)沃克(黄螟);温室结网野螟(Udea rubigalis)古尼(芹菜网螟);和在卷蛾科(Tortricidae)西黑头长翅卷蛾(Acleris gloverana)茶细蛾(黑头芽卷蛾)的卷叶螟、芽蛾、种子虫和果虫;黑头长翅卷蛾(A.variana)弗纳尔德(Fernald)(黑头芽虫);果树卷叶蛾(Archips argyrospila)沃克(果树卷叶蛾);欧洲卷叶蛾(A.rosana)林奈(欧洲卷叶蛾);及其它黄卷蛾属物种,棉褐带卷蛾(Adoxophyes orana)费舍尔棉褐带卷蛾(棉褐带卷蛾);向曰葵细巻叶蛾(Cochylis hospes)茶细蛾(向日葵细卷蛾);榛小卷蛾(Cydia latiferreana)茶细蛾(丝虫);苹果蠹蛾(C.pomonella)林奈(冷蛾);杂色小卷蛾(Platynota flavedana)克里门斯(杂色卷叶蛾);杂食卷叶蛾(P.stultana)茶细蛾(杂食卷叶蛾);葡萄花翅小卷蛾(Lobesia botrana)丹尼斯(Denis)&希弗穆勒(Schiffermuller)(欧洲葡萄蛾);苹白小卷蛾(Spilonota ocellana)丹尼斯&希弗穆勒(苹芽小卷叶);萄果实蛀虫(Endopiza viteana)克里门斯(葡萄卷叶蛾);环针单纹卷蛾(Eupoeciliaambiguella)哈布纳(葡萄果蠹蛾);巴西苹果卷叶蛾(Bonagota salubricola)梅里克(Meyrick)(巴西苹果卷叶蛾);梨小食心虫(Grapholita molesta)比斯克(Busck)(东方果蛾);向日葵芽蛾(Suleima helianthana)赖利(Riley)(向日葵芽蛾);带卷蛾属(Argyrotaenia spp.);卷蛾属(Choristoneura spp.)。

所选择的其它鳞翅目的农业学害虫包括但不限于飞蛾(Alsophila pometaria)哈里斯(秋星尺蠖);桃条麦蛾(Anarsia lineatella)泽勒(桃条麦蛾幼虫);橙条栎树(Anisota senatoria)J.E.史密斯(橙条栎树);柞蚕(Antheraea pernyi)盖林-梅内维尔(Guerin-Meneville)(柞蚕蛾);家蚕(Bombyx mori)林奈(蚕);棉潜蛾(Bucculatrixthurberiella)比斯克(棉叶潜蛾);豆粉蝶属(Colias eurytheme)博伊斯杜瓦(苜蓿粉蝶);核桃天社蛾(Datana integerrima)格罗特(Grote)&罗宾逊(Robinson)(核桃天社蛾);西伯利亚松毛虫(Dendrolimus sibiricus)切特韦里科夫(Tschetwerikov)(西伯利亚蚕蛾);白尺蠖(Ennomos subsignaria)哈布纳(榆角尺蠖);菩提尺蠖(Erannis tiliaria)哈里斯(菩提尺蠖);褐尾蠹(Euproctis chrysorrhoea)林奈(褐尾蠹);葡萄叶斑蛾(Harrisinaamericana)盖林-梅内维尔(葡萄叶雕叶虫);新墨西哥草原毛虫(Hemileuca oliviae)科克雷尔(Cockrell)(新墨西哥草原毛虫);美国白蛾(Hyphantria cunea)德鲁里(Drury)(美洲白蛾);番茄蛲虫(Keiferia lycopersicella)沃尔辛厄姆(Walsingham)(番茄蛲虫);东部铁杉尺蠖(Lambdina fiscellaria fiscellaria)赫尔斯特(东部铁杉尺蠖);西部铁杉尺蠖(L.fiscellaria lugubrosa)赫尔斯特(西部铁杉尺蠖);柳毒蛾(Leucoma salicis)林奈(杨毒蛾);中国舞毒蛾(Lymantria dispar)林奈(舞毒蛾);番茄天蛾(Manducaquinquemaculata)霍沃思(五斑鹰蛾、番茄天蛾幼虫);烟草天蛾(M.sexta)霍沃思(番茄天蛾、烟草天蛾);冬尺蠖蛾(Operophtera brumata)林奈(冬尺蠖);春尺蠖(Paleacritavernata)佩克(Peck)(春尺蠖);大凤蝶(Papilio cresphontes)克拉默(Cramer)(大燕尾幼虫);加州槲蛾(Phryganidia californica)Packard(加州槲蛾);柑桔潜叶蛾(Phyllocnistis citrella)斯坦顿(柑桔潜叶蛾);斑幕潜叶蛾(Phyllonorycterblancardella)法布里休斯(斑幕潜叶蛾);大菜粉蝶(Pieris brassicae)林奈(大菜粉蝶);菜白蝶(P.rapae)林奈(菜白蝶);暗脉菜粉蝶(P.napi)林奈(绿脉菜粉蝶);洋葱羽蛾(Platyptilia carduidactyla)赖利(洋蓟羽蛾);吊丝虫(Plutella xylostella)林奈(菜蛾);棉红铃虫(Pectinophora gossypiella)桑德斯(Saunders)(棉红铃虫);美国纹白蝶(Pontia protodice)博伊斯杜瓦和勒孔特(Leconte)(菜青虫);杂食尺蠖(Sabulodesaegrotata)古尼(杂食尺蠖);红马它背毛虫(Schizura concinna)J.E.史密斯(红驼毛毛虫);麦蛾(Sitotroga cerealella)奥利维尔(Olivier)(麦蛾(Angoumois grain moth);松异舟蛾(Thaumetopoea pityocampa)希弗米勒(Schiffermuller)(松毛虫);衣蛾(Tineolabisselliella)胡默尔(Hummel)(袋衣蛾);番茄潜麦蛾(Tuta absoluta)梅里克(番茄斑潜蝇);苹果巢蛾(Yponomeuta padella)林奈(巢蛾);夜蛾科棉铃虫(Heliothis subflexa)古尼;天幕毛虫属(Malacosoma spp.)和古毒蛾属(Orgyia spp.)。

所关注的为包括来自长角象虫科(Anthribidae)、豆象科(Bruchidae)和象甲科(Curculionidae)的象鼻虫的鞘翅目的幼虫和成虫(包括但不限于:苜蓿叶象甲(Anthonomus grandis)博厄曼(Boheman)(象鼻虫);稻水象甲(Lissorhoptrusoryzophilus)库舍尔(Kuschel)(稻水象甲);麦子象鼻虫(Sitophilus granarius)林奈(谷象);米象(S.oryzae)林奈(米象);三叶草叶象(Hypera punctata)法布里休斯(三叶草叶象);密点细枝象(Cylindrocopturus adspersus)勒孔特(LeConte)(向日葵茎象甲);黄褐小爪象(Smicronyx fulvus)勒孔特(红色葵花籽象鼻虫);灰色种子象(S.sordidus)勒孔特(灰葵花籽象鼻虫);玉米长喙象(Sphenophorus maidis)奇滕登(Chittenden)(玉米象虫));在金花虫科(Chrysomelidae)的跳甲、黄瓜甲虫、根虫、叶甲、马铃薯甲虫和潜叶蛾(包括但不限于:马铃薯甲虫(Leptinotarsa decemlineata)萨伊(Say)(科罗拉多马铃薯甲虫);玉米根虫(Diabrotica virgifera virgifera)勒孔特(玉米根叶甲);长角叶甲(D.barberi)史密斯和劳伦斯(Lawrence)(长角叶甲);十一星叶甲食根亚种(D.undecimpunctata howardi)巴伯(Barber)(南方玉米根虫);玉米跳甲(Chaetocnemapulicaria)梅尔斯海默(Melsheimer)(玉米跳甲);萝卜菜跳甲(Phyllotreta cruciferae)格策(Goeze)(十字花科蔬菜跳甲);黄曲条跳甲(Phyllotreta striolata)(黄曲条跳甲);葡萄肖叶甲(Colaspis brunnea)法布里休斯(葡萄肖叶甲);橙足负泥虫(Oulemamelanopus)林奈(橙足负泥虫);向日葵甲虫(Zygogramma exclamationis)法布里休斯(向日葵甲虫));来自瓢甲科(Coccinellidae)的甲虫(包括但不限于墨西哥豆瓢虫(Epilachnavarivestis)穆尔桑特(Mulsant)(墨西哥豆瓢虫));来自金龟子科(Scarabaeidae)的金龟子及其它甲虫(包括但不限于:日本丽金龟(Popillia japonica)纽曼(Newman)(日本甲虫);北方圆头犀金龟(Cyclocephala borealis)艾罗(Arrow)(圆头犀金龟、白蛴螬);南方圆头犀金龟(C.immaculata)奥利维尔(南方圆头犀金龟、白蛴螬);欧洲切根鳃金龟(Rhizotrogus majalis)拉祖莫夫斯基(Razoumowsky)(欧洲金龟子);白蛴螬(Phyllophagacrinita)伯格麦斯特(Burmeister)(白蛴螬);胡萝卜甲虫(Ligyrus gibbosus)德基尔(DeGeer)(胡萝卜甲虫));来自皮蠹科(Dermestidae)的地毯甲虫;来自叩甲科(Elateridae)的伪金针虫属(Eleodes spp.)、梳爪叩甲属(Melanotus spp.);宽胸叩头虫属(Conoderusspp.);金针虫属(Limonius spp.);细胸金针虫属(Agriotes spp.);叩甲属(Cteniceraspp.);叩头虫属(Aeolus spp.)的金针虫;来自小蠹科(Scolytidae)的树皮甲虫以及来自拟步甲科(Tenebrionidae)的甲虫。

所关注的双翅目成虫和幼虫包括潜叶虫玉米斑潜蝇(Agromyza parvicornis)勒夫(Loew)(玉米斑潜蝇);摇蚊(包括但不限于高粱瘿蚊(Contarinia sorghicola)科基莱特(Coquillett)(高粱瘿蚊);黑森瘿蚊(Mayetiola destructor)萨伊(小麦瘿蝇);小麦吸浆(Sitodiplosis mosellana)格明(Gehin)(麦红吸浆虫);葵花轩蚊(Neolasiopteramurtfeldtiana)Felt,(葵花籽蠓));果蝇(实蝇),瑞典杆蝇(Oscinella frit)林奈(果蝇);蛆(包括但不限于:灰地种蝇(Delia platura)梅根(Meigen)(种蝇);麦地种蝇(D.coarctata)佛棱(Fallen)(冬作种蝇)及其它地种蝇属(Delia spp.),麦秆蝇(Meromyzaamericana)菲奇(Fitch)(麦秆蝇);家蝇(Musca domestica)林奈(家蝇);夏厕蝇(Fanniacanicularis)林奈,小家蝇(F.femoralis)斯坦(小家蝇);厩螫蝇(Stomoxys calcitrans)林奈(螫蝇));脸蝇(face fly)、角蝇、丽蝇、金蝇属(Chrysomya spp.);黑花蝇属(Phormiaspp.)及其它小实蝇害虫(muscoid fly pest)、马蝇虻属(Tabanus spp.);马蝇胃蝇属(Gastrophilus spp.);牛虻属(Oestrus spp.);牛皮蝇蛆牛皮蝇属(Hypoderma spp.);斑虻斑虻属(Chrysops spp.);绵羊虱蝇(Melophagus ovinus)林奈(keds)及其它短角亚目,蚊子伊蚊属(Aedes spp.);按蚊属(Anopheles spp.);库蚊属(Culex spp.);黑蝇原蚋属(Prosimulium spp.);蚋属(Simulium spp.);吸血蠓、白蛉子、尖眼蕈蚊及其它长角亚目。

所关注的昆虫包括半翅目和同翅目的成虫和若虫,例如但不限于来自球蚜科(Adelgidae)的球蚜、来自盲蝽科(Miridae)的盲蝽象、来自蝉科(Cicadidae)的蝉、叶蝉,茶小绿叶蝉(Empoasca spp.);来自叶蝉科(Cicadellidae)、来自菱飞虱科(Cixiidae)、蛾蜡蝉科(Flatidae)、蜡蝉总科(Fulgoroidea)、瓢蜡蝉科(Issidae)和飞虱科(Delphacidae)的飞虱、来自角蝉科(Membracidae)的角蝉、来自木虱科(Psyllidae)的木虱、来自粉虱科(Aleyrodidae)的粉虱、来自蚜科(Aphididae)的蚜虫、来自根瘤蚜科(Phylloxeridae)的根瘤蚜、粉蚧科(Pseudococcidae)的粉蚧、来自介壳虫科(Asterolecanidae)、蚧科(Coccidae)、粉蚧科(Dactylopiidae)、盾蚧科(Diaspididae)、毡蚧科(Eriococcidae)、旌蚧科(Ortheziidae)、战蚧科(Phoenicococcidae)和珠蚧科(Margarodidae)的介壳虫、来自网蝽科(Tingidae)的网蝽、来自蝽科(Pentatomidae)的椿象、麦长蝽,长蝽属(Blissusspp.);以及来自长蝽科(Lygaeidae)的其它籽虫、来自沫蝉科(Cercopidae)的沫蝉、来自缘蝽科(Coreidae)的南瓜虫和来自红蝽科(Pyrrhocoridae)的沙蚤和污棉虫。

农学上重要的成员来自同翅目,进一步包括但不限于:豌豆蚜(Acyrthisiphonpisum)哈里斯(豌豆蚜);黑豆蚜(Aphis craccivora)科赫(Koch)(豇豆蚜);蚕豆蚜(A.fabae)斯科波利(Scopoli)(蚕豆蚜);棉蚜虫(A.gossypii)格洛韦尔(Glover)(棉蚜(cotton aphid)、瓜蚜(melon aphid));福尔贝斯(Forbes)(玉米根蚜);苹果蚜虫(A.pomi)德基尔(苹蚜);卷叶蚜(A.spiraecola)帕奇(Patch)(卷叶蚜);藤蚜属(Aulacorthumsolani)卡尔滕巴赫(Kaltenbach)(毛地黄蚜);草莓钉毛蚜(Chaetosiphon fragaefolii)科克雷尔(Cockerell)(草莓钉毛蚜);新疆麦双尾蚜(Diuraphis noxia)库尔德久莫夫/莫尔德维尔科(Kurdjumov/Mordvilko)(俄罗斯小麦蚜虫);玫瑰苹果蚜(Dysaphisplantaginea)帕塞里尼(Paaserini)(苹果绵蚜);苹果绵蚜(Eriosoma lanigerum)赫斯曼(Hausmann)(苹绵蚜);甘蓝蚜(Brevicoryne brassicae)林奈(甘蓝蚜);大尾虫牙(Hyalopterus pruni)若弗鲁瓦(Geoffroy)(梅大尾蚜);萝卜蚜(Lipaphis erysimi)卡尔滕巴赫(萝卜蚜);麦无网长管蚜(Metopolophium dirrhodum)沃克(麦蚜虫);马铃薯长管蚜(Macrosiphum euphorbiae)托马斯(马铃薯长管蚜);桃蚜(Myzus persicae)苏尔泽(Sulzer)(桃蚜、桃赤蚜);莴苣蚜(Nasonovia ribisnigri)莫斯利(Mosley)(莴苣膨管蚜);瘿绵蚜属(Pemphigus spp.)(根蚜和球蚜);玉米蚜(Rhopalosiphum maidis)菲奇(玉米蚜);禾谷缢管蚜(R.padi)林奈(粟缢管蚜);麦二叉蚜(Schizaphis graminum)罗南(Rondani)(麦二叉蚜);高粱长蝽(Sipha flava)福尔贝斯(甘蔗黄蚜);麦长管蚜(Sitobionavenae)法布里休斯(麦长管蚜);斑点紫花苜蓿蚜虫(Therioaphis maculata)巴克顿(Buckton)(斑点紫花苜蓿蚜虫);茶蚜(Toxoptera aurantii)博伊尔·德方斯科洛贝(Boyer de Fonscolombe)(茶蚜)和褐色橘蚜(T.citricida)柯卡尔迪(Kirkaldy)(桔二岔蚜);高粱蚜(Melanaphis sacchari)(甘蔗黄蚜);球蚜属(Adelges spp.)(球蚜);木虱(Phylloxera devastatrix)佩尔甘德(Pergande)(美核桃根瘤蚜);烟粉虱(Bemisiatabaci)根纳迪乌斯(Gennadius)(烟草粉虱、甘薯粉虱);银叶粉虱(B.argentifolii)贝洛斯(Bellows)&佩林(Perring)(银叶粉虱);裸粉虱属(Dialeurodes citri)阿什梅德(Ashmead)(柑橘白蝇);纹翅粉虱(Trialeurodes abutiloneus)(粉虱科)和温室粉虱(T.vaporariorum)韦斯特伍德(Westwood)(温室白粉虱);马铃薯叶蝉(Empoasca fabae)哈里斯(马铃薯微叶蝉);灰飞虱(Laodelphax striatellus)佛棱(灰飞虱);紫菀叶蝉(Macrolestes quadrilineatus)福尔贝斯(紫菀叶蝉);黑尾叶蝉(Nephotettixcinticeps)尤勒(Uhler)(大青叶蝉);黑条黑尾叶蝉(N.nigropictus)施塔尔(Stal)(黑尾叶蝉);褐飞虱(Nilaparvata lugens)施塔尔(稻褐飞虱);玉米蜡蝉(Peregrinus maidis)阿什梅德(菲岛玉米蜡蝉);白背飞虱(Sogatella furcifera)霍瓦特(Horvath)(白背飞虱);水稻蚜虫(Sogatodes orizicola)缪尔(水稻蚜虫);苹白小叶蝉(Typhlocybapomaria)麦卡蒂(McAtee)(苹白小叶蝉);葡萄二星斑叶蝉(Erythroneoura spp.)(葡萄叶蝉);十七年蝉(Magicicada septendecim)林奈(周期蝉);吹绵蚧(Icerya purchasi)马斯克尔(Maskell)(绵蚧);梨圆蚧(Quadraspidiotus perniciosus)康斯托克(Comstock)(梨圆蚧);桔臀纹粉蚧(Planococcus citri)里索(Risso)(桔粉蚧);粉蚧属(Pseudococcusspp.)(其它粉虱复合物);梨木虱(Cacopsylla pyricola)福斯特(Foerster)(梨黄木虱(pear psylla));柿木虱(Trioza diospyri)阿什梅德(柿木虱(psylla))。

来自半翅目的所关注的农学上重要的物种包括但不限于:绿色战士臭虫(Acrosternum hilare)萨伊(喜绿蝽);南瓜缘蝽(Anasa tristis)德基尔(南瓜虫);美洲毛谷杆长蝽(Blissus leucopterus leucopterus)萨伊(麦长蝽);棉网蝽(Corythucagossypii)法布里休斯(棉网蝽);番茄虫(Cyrtopeltis modesta)蒂斯登(Distant)(番茄虫);红蝽(Dysdercus suturellus)赫里希-谢弗(Herrich-Schaffer)(棉红蝽);褐臭蝽(Euschistus servus)萨伊(褐臭蝽);一斑臭蝽(E.variolarius)博韦帕利索(Palisot deBeauvais)(一斑臭蝽);长虫舂属(Graptostethus spp.)(蝽的复合物);叶足喙缘蝽(Leptoglossus corculus)萨伊(叶足松蝽(leaf footed pine seed bug));美国牧草盲蝽(Lygus lineolaris)博韦帕利索(牧草盲椿);豆荚草盲蝽(L.Hesperus)奈特(Knight)(西方植物变色虫);牧草盲蝽(L.pratensis)林奈(新疆棉田牧草盲蝽);长毛草盲蝽(L.rugulipennis)波皮乌斯(Poppius)(欧洲植物变色虫);原丽盲蝽(Lygocorispabulinus)林奈(普绿盲蝽);稻绿蝽(Nezara viridula)林奈(南方绿椿象);稻蝽象(Oebalus pugnax)法布里休斯(稻褐蝽);大乳草臭虫(Oncopeltus fasciatus)达拉斯(Dallas)(大马利筋长蝽);棉跳盲蝽(Pseudatomoscelis seriatus)罗伊特(Reuter)(棉跳盲蝽).

此外,实施例可有效地针对半翅目,诸如马铃薯俊盲蝽(Calocoris norvegicus)格梅林(Gmelin)(草莓虫);野生蝽(Orthops campestris)林奈;苹盲虫舂(Plesiocorisrugicollis)佛棱(苹盲蝽);番茄虫(Cyrtopeltis modestus)蒂斯登(番茄虫);黑斑烟盲鋳(Cyrtopeltis notatus)蒂斯登(吸蝇);水印跳盲蝽(Spanagonicus albofasciatus)罗伊特(白斑盲蝽);阜荚树鋳(Diaphnocoris chlorionis)萨伊(皂角盲蝽(honeylocust plantbug));葱盲蝽(Labopidicola allii)奈特(葱盲蝽);棉跳盲蝽(Pseudatomoscelisseriatus)罗伊特(棉跳盲蝽);苜蓿盲蝽(Adelphocoris rapidus)萨伊(苜蓿褐盲蝽);四线叶虫(Poecilocapsus lineatus)法布里休斯(四线叶虫);小长蝽(Nysius ericae)席林(Schilling)(谷长蝽);谷长蝽若虫(Nysius raphanus)霍华德(Howard)(谷长蝽);稻绿蝽(Nezara viridula)林奈(南方绿椿象);扁盾蝽属(Eurygaster spp.);缘蝽属(Coreidaespp.);红蝽属(Pyrrhocoridae spp.);网蝽属(Tinidae spp.);谷盗属(Blostomatidaespp.);猎蝽属(Reduviidae spp.)和臭虫(Cimicidae spp.)。

还包括蜱螨目(Acari)(螨虫)成虫和幼虫,例如瘤节蜱(Aceria tosichella)凯弗(Keifer)(郁金香瘤瘿螨);麦岩螨(Petrobia latens)穆勒(麦岩螨);在叶螨科(Tetranychidae)的蜘蛛螨和红蜘蛛、苹果全爪螨(Panonychus ulmi)科赫(苹果全爪螨);二斑叶螨(Tetranychus urticae)科赫(二斑叶螨);(四爪螨(T.mcdanieli)麦格雷戈(McGregor)(麦克丹尼尔螨(McDaniel mite));朱砂叶螨(T.cinnabarinus)博伊斯杜瓦(玉米朱砂叶螨);土耳其斯坦叶螨(T.turkestani)乌加罗夫(Ugarov)&尼科尔斯基(Nikolski)(草莓蜘蛛螨);在细须螨科(Tenuipalpidae)的扁螨、刘氏短须螨(Brevipalpus lewisi)麦格雷戈(桔短须螨);在中国瘿螨科(Eriophyidae)的锈螨和芽螨,以及在动物和人类健康中重要的其它一或多种叶螨,即在表皮螨科(Epidermoptidae)中的尘螨、在蠕形螨科的蠕形螨、在食甜螨科(Glycyphagidae)的粒螨,在硬蜱目(Ixodidae)肩突硬蜱(Ixodesscapularis)萨伊(鹿蜱)的蜱;澳大利亚麻痹蜱(I.holocyclus)诺伊曼(Neumann)(澳大利亚麻痹蜱);变异革蜱(Dermacentor variabilis)萨伊(美洲犬蜱);美洲钝眼蜱(Amblyommaamericanum)林奈(美洲钝眼蜱)和在痒螨课(Psoroptidae)、蒲螨科(Pyemotidae)和疥螨科(Sarcoptidae)的痒螨和疥螨。

缨尾目昆虫害虫是所关注的,如衣鱼(Lepisma saccharina)林奈(衣鱼);斑衣鱼(Thermobia domestica)帕卡德(Packard)(家衣鱼)。

所涵盖的额外节肢动物害虫包括:蜘蛛,以蜘蛛目,诸如褐皮花蛛(Loxoscelesreclusa)格雷奇(Gertsch)和穆拉克(Mulaik)(褐色蜘蛛)以及黑寡妇蜘蛛(Latrodectusmactans)法布里休斯(黑寡妇球腹蛛),以及蜈蚣,以蚰蜒目(Scutigeromorpha),诸如蚰蜒蚰蜒(Scutigera coleoptrata)林奈(家居蜈蚣)。

所关注的害虫包括椿象总科及其它相关昆虫,包括但不限于属于以下科的物种:蝽科(稻绿蝽(Nezara viridula)、茶翅蝽、盖德拟壁蝽(Piezodorus guildini)、褐臭蝽(Euschistus servus)、绿色战士臭虫、大豆褐椿(Euschistus heros)、暗褐椿(Euschistustristigmus)、绿色战士臭虫、椿虫(Dichelops furcatus)、椿虫(Dichelops melacanthus)以及喜菘蝽(Bagrada hilaris)(喜菘蝽));龜蝽科(Plataspidae)(筛豆龟椿(Megacoptacribraria)-豆圆蝽)和土蝽科(Cydnidae)(栗盾蝽(Scaptocoris castanea)-根臭虫)以及鳞翅目物种包括但不限于:小菜蛾,例如谷实夜蛾博迪;大豆尺蠖,例如大豆夜蛾沃克和绒毛豆毛虫,例如黎豆夜蛾哈布纳。

用于测量杀虫活性的方法为本领域中众所周知的。参见例如恰普拉(Czapla)和郎(Lang),(1990)《经济昆虫学杂志(J.Econ.Entomol.)》83:2480-2485;安德鲁斯(Andrews)等人,(1988)《生物化学杂志》252:199-206;马罗内(Marrone)等人,(1985)《经济昆虫学杂志》78:290-293和第5,743,477号美国专利,其全部以全文引用的方式并入本文中。一般来说,将蛋白质混合且用于喂养分析。参见例如马罗内等人,(1985)《经济昆虫学杂志》78:290-293此类分析可以包括使植物与一或多种害虫接触并且测定植物存活和/或引起害虫死亡的能力。

线虫包括寄生线虫,如根节、孢囊和根腐线虫,包括异皮线虫(Heterodera)种、根结线虫(Meloidogyne)种和球异皮线虫(Globodera)种;尤其孢囊线虫的成员,包括但不限于大豆孢囊线虫(Heterodera glycines)(大豆孢囊线虫);甜菜孢囊线虫(Heteroderaschachtii)(甜菜孢囊线虫);燕麦孢囊线虫(Heterodera avenae)(燕麦孢囊线虫)以及马铃薯金线虫(Globodera rostochiensis)和马铃薯白线虫(Globodera pailida)(马铃薯孢囊线虫)。根腐线虫包括根腐线虫(Pratylenchus)种。

在一些方面中,所教示的杀昆虫蛋白针对Cry蛋白具有抗性的昆虫具有活性。举例来说,所教示的杀昆虫蛋白可以针对mCry3A、Cry3Bb1、eCry3.1Ab和二元蛋白质复合物Cry34Ab1/Cry35Ab1具有抗性的昆虫具有活性。在各方面中,所教示的杀昆虫蛋白针对西方玉米根虫(WCR,玉米根虫勒孔特)具有活性,所述西方玉米根虫对Cry蛋白(例如由MON88017表达的Cry3Bb1蛋白)具有抗性。在各方面中,所教示的杀昆虫蛋白针对西方玉米根虫(WCR,玉米根虫勒孔特)具有活性,所述西方玉米根虫对Cry蛋白(例如mCry3A)具有抗性。在各方面中,所教示的杀昆虫蛋白可对北方根虫(Diabrotica barberi)和十一星黄瓜甲虫霍华德以及其它甲虫物种(例如成年巴西叶甲(Diabrotica speciosa)和萝卜菜跳甲(Phyllotreta cruciferae))具有毒性。在各方面中,所教示的杀昆虫蛋白对斑瓢虫(斑点瓢虫(Coleomegilla maculata))或某些鳞翅目昆虫或某些半翅目昆虫是无毒的。参见Schellenberger等人,“一种来自假单胞菌的选择性杀昆虫蛋白,用于控制玉米根虫,”《科学》,2016年11月4;354(6312):634-637(提供IPD072Aa,一种86AA蛋白,基因库寄存编号KT795291),其以引用的方式并入本文中;以及魏俊志等人,“一种来自苔藓假单胞菌的选择性杀昆虫蛋白,用于控制玉米根虫,”《植物生物技术杂志》,2018,第16卷,第649-659页(提供PIP-47aa),其以引用的方式并入本文中。

种子处理剂

为了保护和增强产量产生和性状技术,种子处理剂选择可提供额外作物方案灵活性和针对昆虫、杂草和疾病的有成本效益的控制。可以用包含化学或生物除草剂、除草剂安全剂、杀虫剂、杀真菌剂、发芽抑制剂和增强剂、营养物、植物生长调节剂和活化剂、杀菌剂、杀线虫剂和/或软体动物剂的组合的组合物处理种子材料,通常处理表面。

这些化合物通常与在调配物领域中通常采用的其它载剂、表面活性剂或施用促进剂佐剂一起调配。涂料可以通过用液体调配物浸渍繁殖材料或通过用组合的湿式或干式调配物涂布来施用。可用作种子处理剂的各种类型的化合物的实例提供于《农药手册:全球概论(The Pesticide Manual:A World Compendium)》,C.D.S.汤姆林(Tomlin)编中,其以引用的方式并入本文中。

可在作物种子上使用的一些种子处理剂包括但不限于以下各者中的一或多者:脱落酸、活化酯-S-甲基、阿维菌素(avermectin)、杀草强(amitrol)、氧环唑(azaconazole)、固氮螺旋菌属(azospirillum)、印楝素(azadirachtin)、亚托敏(azoxystrobin)、芽孢杆菌属(包括一或多种蜡状(cereus)、费尔姆(firmus)、巨大(megaterium)、短小(pumilis)、球形(sphaericus)、枯草(subtilis)和/或苏云金(thuringiensis)种)、短根瘤菌种(包括一或多种甜菜(betae)、老鹳草(canariense)、埃氏(elkanii)、裸鳃(iriomotense)、日本(japonicum)、廖氏(liaonigense)、豆薯苷(pachyrhizi)和/或圆明慢(yuanmingense)、盖普丹(captan)、萎锈灵(carboxin)、聚葡萄胺糖、可尼丁(clothianidin)、纯铜、斯阿皮、待克利(difenoconazole)、艾提氏(etidiazole)、氟虫腈(fipronil)、氟二恶尼(fludioxonil)、氟嘧菌酯(fluoxastrobin)、氟喹唑、解草安(flurazole)、肟草安(fluxofenim)、harpin蛋白、抑霉唑(imazalil)、吡虫啉、种菌唑(ipconazole)、异氟诺的(isoflavenoid)、lipo-壳寡糖(chitooligosaccharide)、代森锰锌(mancozeb)、锰、代森锰(maneb)、右灭达乐(mefenoxam)、灭达乐(metalaxyl)、灭特座(metconazole)、迈克尼(myclobutanil)、PCNB、氟幼脲(penflufen)、青霉(penicillium)、吡噻菌胺(penthiopyrad)、除虫精(permethrine)、啶氧菌酯(picoxystrobin)、丙硫菌唑(prothioconazole)、百克敏(pyraclostrobin)、氯虫酰胺(rynaxypyr)、S-异丙甲草胺(metolachlor)、皂苷(saponin)、氟唑环菌胺(sedaxane)、TCMTB、得克利(tebuconazole)、噻苯达唑、噻虫嗪(thiamethoxam)、抗虫威(thiocarb)福美双(thiram)、立枯磷(tolclofos)-甲基、***醇(triadimenol)、木霉、三氟敏(trifloxystrobin)、灭菌唑(triticonazole)和/或锌。PCNB种子涂层是指含有昆托赞(quintozen)和氯唑灵(terrazole)的EPA注册号00293500419。TCMTB是指2-(硫氰基甲基硫)苯并噻唑。

可以测试具有特定转基因性状的种子品种和种子,以确定哪一种种子处理剂选择和施用率可以补充此类品种和转基因性状,以便提高产量。举例来说,具有良好产量潜力但具有丝黑穗病敏感性的品种可得益于种子处理剂的使用,所述种子处理剂提供针对丝黑穗病的保护,具有良好产量潜力但具有囊肿性线虫敏感性的品种可得益于种子处理剂的使用,所述种子处理剂提供针对囊肿性线虫的保护等等。同样地,涵盖赋予昆虫抗性的转基因性状的品种可受益于种子处理剂所赋予的第二种作用模式,涵盖赋予除草剂抗性的转基因性状的品种可受益于具有安全剂的种子处理剂,所述安全剂促进对所述除草剂等的植物抗性。此外,由种子处理剂的恰当使用产生的良好根建立和早期出现可产生更有效的氮使用、更好的耐干旱的能力和当与种子处理剂组合时含有特定性状的一或多种品种的产量潜力的总体增加。

杀死昆虫害虫和控制昆虫群体的方法

在一些实施例中,提供用于杀死昆虫害虫的方法,其包含使昆虫害虫与杀虫有效量的如本文所教示的重组蛋白接触。在一些实施例中,提供用于杀死昆虫害虫的方法,其包含使昆虫害虫与杀虫有效量的以下杀虫蛋白接触:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72,或其变异体。

在一些实施例中,提供用于控制昆虫害虫群体的方法,其包含使昆虫害虫群体与杀虫有效量的如本文所教示的重组蛋白接触。在一些实施例中,提供用于控制昆虫害虫群体的方法,其包含使昆虫害虫群体与杀虫有效量的以下杀虫蛋白接触:SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72,或其变异体。

如本文所用,“控制害虫群体”或“控制害虫”是指对害虫的任何影响,其引起限制害虫所引起的损伤。控制害虫包括但不限于杀死害虫、抑制害虫的发育、改变害虫的生育力或生长,其方式为使得害虫对植物提供较少损害、减少所产生的后代的数目、产生较少拟合害虫、产生捕食者更容易攻击的害虫或阻止害虫食用植物。

在一些实施例中,提供用于控制对杀虫蛋白具有抗性的昆虫害虫群体的方法,其包含使昆虫害虫群体与杀虫有效量的如本文所教示的重组蛋白接触。在一些实施例中,提供用于控制对杀虫蛋白具有抗性的昆虫害虫群体的方法,其包含使昆虫害虫群体与杀虫有效量的以下重组杀虫蛋白接触:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70或SEQ ID NO:72,或其变异体。

在一些实施例中,提供用于保护植物免受昆虫害虫影响的方法,其包含在植物或其细胞中表达编码如本文所教示的杀虫蛋白的重组多核苷酸。在一些实施例中,提供用于保护植物免受昆虫害虫影响的方法,其包含在植物或其细胞中表达编码以下的杀虫蛋白的重组多核苷酸:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72,或其变异体。

提高植物产量的方法

本发明提供用于提高植物产量的方法。所述方法包含提供表达多核苷酸的植物或植物细胞,所述多核苷酸编码本文所揭示的杀虫多肽序列,并且使所述植物或其种子在受害虫(多肽针对其具有杀虫活性)侵扰的区域中生长。在一些实施例中,多肽具有针对鳞翅目、鞘翅目、双翅目、半翅目或线虫害虫的杀虫活性,且所述区域受鳞翅目、半翅目、鞘翅目、双翅目或线虫害虫的侵扰。

如本文所定义,植物的“产量”是指由植物产生的生物质的质量和/或数量。如本文所用,“生物质”是指任何所测量的植物产物。生物质产量的增加是所测量的植物产物的产量的任何改进。增加植物产量具有若干商业应用。举例来说,增加植物叶生物质可增加用于人类或动物食用的叶类蔬菜的产量。另外,增加叶生物质可用于增加植物衍生的医药或工业产品的产量。产量的增加可包含任何统计显著的增加,包括但不限于相比于不表达杀虫序列的植物,至少1%增加、至少3%增加、至少5%增加、至少10%增加、至少20%增加、至少30%、至少50%、至少70%、至少100%或更大的产量增加。在特定方法中,植物产量由于表达本文所揭示的杀昆虫蛋白的植物的害虫抗性的改良而增加。

隐马尔可夫模型

隐马尔可夫模型(HMM)为可用于描述可观测事件的演进的统计模型,所述可观测事件取决于不直接可观测的内部因素。观察到的事件被称为“符号”,并且观察下的不可见因素为“状态”。HMM由两个随机过程组成,即,隐藏状态的不可见过程和可观察符号的可见过程。隐式状态形成马尔可夫链,且观测到的符号的概率分布取决于基本状态。出于此原因,HMM也被称为双重嵌入式随机过程。这两个层(一个可见和另一个不可见)中的模型化观测结果是极有用的,因为许多现实世界问题处理将原始观测结果分类为更有意义的多个类别或类别标记。此方法适用于模型化生物序列,如蛋白质和DNA序列。通常,生物序列由具有不同功能的较小子结构组成,且不同功能区通常显示不同的统计特性。举例来说,众所周知,蛋白质一般由多个结构域组成。给定新蛋白质,HMM可用于预测构成结构域(对应于HMM中的一或多个状态)及其在氨基酸序列中的位置(观测结果)。此外,我们还可能想要发现此新蛋白质序列所属的蛋白质家族。实际上,已显示HMM在表示生物序列方面极有效。因此,HMM已在计算分子生物学、生物信息学中越来越流行,且许多最先进的序列分析算法已在HMM上构建。参见尹俊炳(Byung-Jun Yoon),“隐马尔可夫模型及其在生物序列分析中的应用(Hidden Markov Models and Their Applications in Biological SequenceAnalysis),”《当代基因组学(Current Genomics)》,2009,第10卷,第402-415页,为了全面综述,所述文章以引用的方式并入本文中。

因此,应理解马尔可夫模型是产生马尔可夫链的系统,且隐马尔可夫模型是其中用于产生链的规则是未知或“隐式”的系统。规则包括两个概率:(i)将存在某一观测结果,和(ii)给定模型在某一时间的状态,将存在某一状态转换。隐马尔可夫模型(HMM)方法是解决某些类型的问题的数学方法:(i)给定模型,发现观测结果的概率;(ii)给定模型和观测结果,发现最有可能的状态转换轨迹;以及(iii)通过调整模型的参数来最大化i或ii。对于这些问题中的每一个,已开发算法,例如:(i)向前-向后,(ii)维特比(Viterbi),和(iii)伯里-沃尔奇(Baum-Welch)(和分段K-均值替代方案),等等。

HMMER软件

HMMER为用于搜索蛋白质或DNA序列的同源物的序列数据库并且进行序列比对的HMM软件包。HMMER可用于搜索具有单一查询序列的序列数据库,但当查询为序列家族的多个个例的比对时,其变得尤其强大。HMMER使得查询的剖面分配用于取代、***和缺失的位置特异性评分系统。HMMER剖面是被称作“剖面隐马尔可夫模型”(剖面HMM)的概率模型(克罗(Krogh)等人,1994;艾迪(Eddy),1998;德宾(Durbin)等人,1998)。与基于早期评分方法的BLAST、FASTA及其它序列比对和数据库搜索工具相比,HMMER旨在显著更准确且更能够检测远程同源物,这是因为其基本概率模型的强度。

剖面HMM为多个序列比对的统计模型或甚至单一序列的统计模型。其捕获关于比对的每一列如何保守的位置特异性信息,且哪些残基是很可能。在UC圣克鲁兹(SantaCruz)安德斯克罗(Anders Krogh)、大卫豪斯勒(David Haussler)和合作者将剖面HMM引入到计算生物学(克罗等人,1994),采用已经在语音辨识中多年来使用的HMM技术。HMM已在克罗/豪斯勒研究之前在生物学中使用,值得注意的是丘吉尔(Churchill)(丘吉尔,1989),但克罗论文具有显著的影响,因为HMM技术很好地适合于使用多个序列比对而不是单一查询序列搜索数据库的流行的“剖面”方法。尚未通过格里布科夫(Gribskov)和同事(格里布科夫等人,1987,1990)引入“剖面”,且在约相同时间若干其它群组引入类似方法,例如“灵活模式”(巴顿(Barton),1990)和“模板”(巴士福德(Bashford)等人,1987;泰勒,1986)。术语“剖面”已经被难住。所有剖面方法(包括PSI-BLAST(阿尔丘尔等人,1997))为多个序列比对的共有序列的大体上统计描述。其使用氨基酸或核苷酸(残基)的位置特异性分数和用于打开和延伸***或缺失的位置特异性罚分。传统的成对比对(例如BLAST(阿尔丘尔等人,1990)、FASTA(皮尔逊(Pearson)和利普曼(Lipman),1988)或史密斯/威迪文(Waterman)算法(史密斯和威迪文,1981))使用位置非依赖性评分参数。剖面的此特性捕获关于多序列比对中的各种位置处的保守度的重要信息,以及允许间隙和***的不同程度。

使用HMM的优点为HMM具有正式概率基础。其使用引导应如何设定所有评分参数的概率理论。举例来说,HMM具有用于设定位置特异性间隙和***分数的恒定理论。所述方法是一致的且因此是高度自动化的,允许人们制造数百剖面HMM库,且将其以极大规模应用于全基因组分析中。蛋白结构域模型的一个此类数据库为Pfam(松哈默(Sonnhammer)等人,1997;芬恩(Finn)等人,2010),其为Interpro蛋白结构域注解系统的重要部分(穆德(Mulder)等人,2003)。Pfam的构造和使用紧密地关联到HMMER软件包。

杀昆虫蛋白发现平台(IPDP)

本发明呈现一种用于从高度异质的环境来源发现新颖杀昆虫蛋白的平台。所述方法利用宏基因组富集程序和基因扩增技术,其实现对广泛类别的未知微生物多样性及其所得蛋白质组的获取。

图1提供说明IPDP的总体工作流程,下文将详细地论述。

收集土壤样品

从含有富微生物多样性的环境样品收集1-10克材料。

在缓冲溶液中再悬浮

将环境材料再悬浮并且在10-100mL PBS(磷酸盐缓冲溶液)中连续搅拌15分钟。随后使大颗粒沉降。

稀释并植在固体营养限制琼脂培养基上

将上清液的连续稀释液涂覆于含有环己烷酰胺的营养限制琼脂上以减少真菌生长。

已经在文献中描述了各种培养基配方以促进特定微生物家族的生长。

当前IPDP利用专有培养基和培养基生长程序,以便富集特定属(例如,在某些实施例中为假单胞菌)的微生物。

自板收集细菌生长物-经由溶解和沉淀自作为混合物的富集样品分离所有基因组DNA

通过用水洗涤收集板上的所有细菌生长物,通过离心将细胞粒化,且丢弃上清液。

使用标准细菌基因组DNA分离技术从经粒化的宏基因组学样品中分离基因组DNA。

使用简并PCR进一步富集编码来自莫那辛类别的蛋白质的基因,并且将其克隆到质粒载体中以用于回收和测序

利用专有简并引物从宏基因组DNA样品的莫那辛类别扩增编码蛋白质的基因。

蛋白质的“莫那辛类别”可以是与例如来自表1的SEQ ID NO:87具有一定相似程度的蛋白质。本发明IPDP具有大量的专有简并引物库,其可用于搜索此类别中的蛋白质。

尺寸为约800bp的扩增DNA通过凝胶电泳分离并且利用标准技术回收。

简并引物包括相容于克隆到DNA质粒中的尾料。克隆PCR扩增DNA并且测序以鉴别编码蛋白质的全长基因,其与来自Opota等人的所公布的莫那辛序列具有相似性。

在一些实施例中,以下的组合:1)在营养限制琼脂上初步富集某些微生物群体,随后2)扩增编码莫那辛类别蛋白质的基因,使用来自从富集群体分离的基因组DNA的简并PCR,两者都是优选的步骤,以回收编码莫那辛样蛋白质的基因。

“莫那辛样”蛋白质可以定义为与莫那辛蛋白具有一定相似程度的蛋白质,所述莫那辛蛋白描述于奥普塔等人,参见奥普塔等人,“莫那辛,一种来自果蝇病原体喜昆虫假单胞菌的新颖β-成孔毒素,导致宿主肠道损伤和致死,”《PLoS病原学》,2011年9月,第7卷,期刊9(以引用的方式并入本文中)。术语“莫那辛样”和“莫那辛类别”蛋白质可互换地使用。此外,如前述,本申请案提供表1中的奥普塔中所描述的莫那辛的序列和SEQ ID NO:87。

从来自原始环境样品的富培养基上分离的细菌收集的基因组DNA不产生使用简并PCR的任何扩增产物。因此,营养限制的琼脂(经开发以富集特定属的微生物)步骤在允许IPDP获取微生物生物体方面是成功的,所述微生物生物体通常不可用于本领域中的当前方法。此外,富集基因组DNA的测序未产生最终利用上文所描述的组合方法(即富集和简并PCR扩增)获得的序列数目,表明发现的杀昆虫蛋白质序列非常罕见,甚至在富集群体中,并且在富集之后的扩增步骤在一些方面中是优选的。

利用同源性和剖面/HMM方法识别新颖杀昆虫蛋白

IPDP可任选地涉及使用HMM来识别杀昆虫蛋白。基于已知的杀昆虫蛋白构建的HMM剖面(例如基于已知莫那辛构建的HMM)可以用于扫描基因的富集DNA库,所述基因编码具有氨基酸序列的蛋白质,所述氨基酸序列在使用HMM剖面分析时评分很高。另外或替代地,可以通过比较富集DNA库中的序列与基因组数据库中的编码已知杀昆虫蛋白的序列来鉴别出新颖杀昆虫蛋白,例如使用序列分析工具,如BLAST并且搜索针对基因库(GENBANK)中的序列的相互最佳碰撞序列。

实例5中描述HMM过程的实例,且使用本文所描述的方法所识别的杀昆虫蛋白构建的实例HMM提供于表6中。使用经由IPDP发现且发现于表3中的八种杀昆虫蛋白构建HMM。这些蛋白质具有以下显示的氨基酸序列:a)SEQ ID NO:2,即为ZIP1、b)SEQ ID NO:4,即为ZIP2、c)SEQ ID NO:12,即为ZIP6、d)SEQ ID NO:14,即为ZIP8、e)SEQ ID NO:16,即为ZIP9、f)SEQ ID NO:18,即为ZIP10、g)SEQ ID NO:20,即为ZIP11以及h)SEQ ID NO:22,即为ZIP12。为了发现新的杀昆虫蛋白,可以使用表6中所提供的HMM搜索使用本文所揭示的方法构建的富集基因组DNA库。基于所述比较接收高分数的序列可以识别为新的杀昆虫蛋白质。在某些实施例中,受到高评分的序列为在使用表6中的HMM评分时评分比特分数为521.5或高于521.5的那些序列和/或与小于或等于7.9e-161的E值匹配的序列。

因此,在某些实施例中,本发明提供新颖的杀昆虫蛋白,所述蛋白质具有使用表6中的HMM评分时评分比特分数为521.5或高于521.5的氨基酸序列和/或以小于或等于7.9e-161的E值匹配的序列。这些蛋白质可以本文所揭示的任何形式(例如作为分离的或重组的蛋白质)或作为组合物(例如植物或农业组合物)中的任一种的一部分提供。

实例

出于说明本发明的各种实施例的目的给出以下实例,且不意图以任何方式限制本发明。本领域的技术人员将认识到涵盖于如由权利要求书范围限定的本发明精神内的其中变化及其它用途。

下文提供目录简表仅为了帮助读者。此目录中的任何内容都不意图限制本申请的实例或揭示内容的范围。

表2-实例章节目录

实例1:杀昆虫蛋白发现平台(IPDP)

此实例描述IPDP的实施方案。关于IPDP的进一步细节可发现于紧接在实例章节之前的前述IPDP章节中。

首先,收集并存储来自富含微生物多样性的环境样品的5克材料。

将这种材料再悬浮于50mL PBS中并且连续搅拌15分钟。15分钟后,使大颗粒沉降并且将上清液的连续稀释液涂覆于含有环己烷酰胺的专有营养限制琼脂培养基上以减少真菌生长。使板在18℃下生长10-14天。

通过用4mL水重复洗涤收集这些板上的细菌生长物并且收集于15mL锥形管中。通过离心将微生物细胞粒化并且丢弃上清液。

使用来自普洛麦格(Promega)的Wizard基因组DNA纯化试剂盒从细胞球粒中分离基因组DNA。

专有简并引物用于经由PCR扩增DNA。约800bp的扩增子经凝胶纯化且克隆到DNA质粒载体中。

使用桑格(Sanger)测序对克隆的扩增子进行测序,并且将编码的蛋白质与所公布的莫那辛序列相比较(即,如在奥普塔等人中所描述并且在表1中所发现,和SEQ ID NO:87)。

实例2:用IPDP所发现的新颖杀昆虫蛋白

来自实例1的前述IPDP能够识别至少36种新颖杀昆虫蛋白,其表示于以下表3中。

根据这36种新颖杀昆虫蛋白,基于同源性的分析已揭露这些蛋白质中的至少32种与此类别中的任何杀昆虫蛋白的已知序列一致性具有至少20%序列一致性差异。这是显著发现,因为其表明所教示的IPDP的能力,发现比本领域中发现的那些杀昆虫蛋白新颖的杀昆虫蛋白。

在具有至少20%序列一致性差异的32种序列中,选择与这一类别中的任何已知蛋白质具有至少20%序列一致性差异的八种杀昆虫蛋白用于进一步分析并且包括:(1)ZIP1、(2)ZIP2、(3)ZIP6、(4)ZIP8、(5)ZIP9、(6)ZIP10、(7)ZIP11以及(8)ZIP12。这些蛋白质在彼此之中共有显著同源性,并且因此指向可在这一新颖杀昆虫蛋白群组之中共有的保守杀昆虫结构域。这八种蛋白质的多序列比对可以在图3中发现,其中对应系统发生树在图5中发现。

表3-经由IPDP识别的新颖杀昆虫蛋白

Figure BDA0002647180000001201

Figure BDA0002647180000001211

Figure BDA0002647180000001251

Figure BDA0002647180000001261

Figure BDA0002647180000001321

Figure BDA0002647180000001331

此外,可以参考图4,图4说明将8种所发现的杀昆虫蛋白(即,ZIP1、ZIP2、ZIP6、ZIP8、ZIP9、ZIP10、ZIP11和ZIP12)与莫那辛进行多序列比对比较,对应系统发生树在图6中发现。

下表4为单位矩阵,其说明与这一类别中的任何已知蛋白质具有至少20%序列一致性差异的32种前述蛋白质之间的一致性百分比。

此外,表5比较这些新发现的32种蛋白质的属性与莫那辛的属性,所述莫那辛为在此类别中发现的第一蛋白质。如从表5可见,所教示的杀昆虫蛋白在氨基酸水平下与莫那辛足够不同。

其结果进一步说明所教示的IPDP发现新颖蛋白质的能力。

来自表3的八种新颖杀昆虫蛋白(即ZIP1、ZIP2、ZIP6、ZIP8、ZIP9、ZIP10、ZIP11和ZIP12)的多序列比对可在图3中发现,其中对应系统发生树在图5中发现。来自表3的八种新颖杀昆虫蛋白(即,ZIP1、ZIP2、ZIP6、ZIP8、ZIP9、ZIP10、ZIP11和ZIP12)加莫那辛的多序列比对可在图4中发现,其中对应系统发生树在图6中发现。

实例3:杀昆虫蛋白-裂解物昆虫喂食分析

将来自表达ZIP1(SEQ ID NO:2)或空载体对照的细菌的裂解物与利用害椿(茶翅蝽)的昆虫喂食分析中的水进行比较。

用0.5mL裂解物或水湿润2cm的芯体,并且将其放置于具有2个一龄若虫(一次观测)的板中。对于每样品总共16个昆虫进行测试,每裂解物或水8次观测。

在7天之后测量死亡率。

允许从含有空载体的细胞摄取细菌裂解物的昆虫显示与摄取水类似的死亡率水平。

允许摄取表达ZIP1(SEQ ID NO:2)的细菌溶解物的昆虫显示此分析中的100%死亡率。这些结果在图10中示出。

因此,本文所教示的杀昆虫蛋白展现针对半翅目和蝽科的成员的显著杀昆虫活性。

实例4:杀昆虫蛋白-经纯化的蛋白昆虫喂食分析

根据表3中表示的36种新颖杀昆虫蛋白,我们经工程改造10种蛋白质序列以与N端6xHis蛋白标记物融合以用于纯化:a)SEQ ID NO:2,即为ZIP1、b)SEQ ID NO:4,即为ZIP2、c)SEQ ID NO:8,即为ZIP4、d)SEQ ID NO:12,即为ZIP6、e)SEQ ID NO:14,即为ZIP8、f)SEQID NO:16,即为ZIP9、g)SEQ ID NO:18,即为ZIP10、h)SEQ ID NO:20,即为ZIP11、i)SEQ IDNO:22,即为ZIP12以及i)SEQ ID NO:26,即为ZIP16。将来自表达这10种标记的蛋白质的细菌的裂解物与Ni-NTA珠粒(凯杰(Qiagen))一起培育以特异性结合所述蛋白质。这些蛋白质从珠粒洗脱,渗析,且用于利用害椿(茶翅蝽)的昆虫喂食分析。

对于害椿,用0.5mL经纯化的蛋白质或缓冲剂对照组或水湿润2cm芯体,且放置于具有2个一龄若虫(一次观测)的板中。对于每样品总共16个昆虫进行测试,每裂解物或水8次观测。

在5天之后测量死亡率。

允许摄取这10种纯化的蛋白质的昆虫在此分析中显示不同程度死亡率。这些结果在图7中示出。

此外,在十种经测试的蛋白质中,不同稀释度的三种经纯化的蛋白质(ZIP1、ZIP2和ZIP4)用于用害椿进行的复制昆虫喂食分析,以通过Probit分析确定LC50值。这些结果在图8中示出。

因此,如本文所教示的这些杀昆虫蛋白展现针对半翅目和蝽科的成员的显著杀昆虫活性。

为了确定用于这些杀昆虫蛋白的有效范围的昆虫,我们针对以下两个其它主要昆虫目的成员进行昆虫生物分析:来自鳞翅目的秋夜蛾(草地贪夜蛾),和来自鞘翅目的南方玉米根虫(十一星黄瓜甲虫)。简单来说,对于秋夜蛾,将温热的多物种昆虫饮食以1.0ml/孔的速率分配到标准128孔生物分析托盘中,在每个孔内提供1.5cm2的表面积。通过将40μl纯化蛋白质施用到饮食表面上来处理每一测试孔。一旦所述施用物已经干燥,就将一个新生秋夜蛾幼虫放在每个孔中。所述分析由每次处理16个个别孔组成。仅缓冲液处理的孔充当阴性对照组。在7天之后测量按重量计的生长率。

用于南方玉米根虫的方法类似于用于秋夜蛾的方法,除使用南方玉米根虫特定饮食以外。

允许摄取表达ZIP1、ZIP2和ZIP4的纯化蛋白质的昆虫在此分析中显示不同程度的生长抑制。秋夜蛾的结果在图9A中示出,且南方玉米根虫的结果在图9B中示出。

因此,如本文所教示的这些杀昆虫蛋白展现针对鳞翅目和夜蛾科,以及鞘翅目和叶甲科的成员的显著生长抑制活性。

实例5:利用同源性和剖面/HMM方法(IPDP-HMM构建)识别新颖杀昆虫蛋白

如先前所论述,IPDP可任选地涉及HMM算法和模型化过程的利用。此程序允许从所发现的杀昆虫蛋白序列开发HMM剖面,其识别编码莫那辛样杀昆虫蛋白的基因,所述蛋白质将不可能使用本领域的一些方法(例如BLAST)来识别。

下文描述HMM过程的实例,且使用经由IPDP发现且在表3中发现且在图4中突出显示的八种杀昆虫蛋白构建。使用八种杀昆虫蛋白(其使用本文所描述的方法识别出)的实例HMM构建提供于表6中。这些蛋白质具有以下显示的氨基酸序列:a)SEQ ID NO:2,即是ZIP1、b)SEQ ID NO:4,即是ZIP2、c)SEQ ID NO:12,即是ZIP6、d)SEQ ID NO:14,即是ZIP8、e)SEQID NO:16,即是ZIP9、f)SEQ ID NO:18,即是ZIP10、g)SEQ ID NO:20,即是ZIP11以及h)SEQID NO:22,即是ZIP12。

使用HMMER软件(第3.1b2版;2015年2月)构建模型,并且可以在表6中发现输出模型。HMM利用前述八种序列来产生“莫那辛样”序列(基于八种所利用的序列)将需要的模型。现在,基于HMM,有可能分析用IPDP发现的未来推定的杀昆虫蛋白,以确定新发现的序列是“莫那辛样”序列的可能性。

实例6:转化植物

进行实验以将所关注的植物(例如玉米和大豆)转化,以用于本文所揭示的杀昆虫蛋白的稳定表达。选择三种ZIP蛋白质,ZIP1、ZIP2和ZIP4(经展现以在活体外生物分析中杀死昆虫(参见例如实例4))以转化到所关注的两种作物-大豆和玉米中。这些序列经密码子优化以用于所关注的植物中的最优表达,并且合成且克隆到大豆和玉米两者的特定表达载体中。

大豆

大豆种子在20%高乐氏(Clorox)中消毒表面,用无菌水冲洗,接着通过使其在室温下静置2小时来底涂。接着将种子吸收于发芽床(Germination Medium)中过夜。次日通过从种子去除种子涂层和子叶来制备分生组织外植体。接着在多种条件下干燥分生组织外植体或使用新鲜分生组织外植体。对于基因枪DNA递送,根据标准方案将载体涂布到金粒子(0.6μm)上以用于经由Bio-Rad PDS-1000氦***的粒子轰击。对于粒子轰击,将外植体预培养过夜,轰击,使其静置,接着转移到选择物。收获来自抗大观霉素的小植株的幼苗,且其生根于含有IAA和大观霉素的生根培养基上。将生根的植物移植到土壤中并且在温室中生长以产生T1种子。

玉米

在无菌罩盖中剥离出自温室或生长Hi-II玉米的区域的不成熟胚芽(1.5-2.0mm)。在23℃下在黑暗中在固体共培养基上在约0.4轴侧朝下的最终OD660处胚芽与农杆菌菌株AGL-1共培养1-2天。随后将胚芽转移到固体诱导培养基,轴侧朝下,且在黑暗中在28℃下培育5天。接着将胚芽转移到固体选择1培养基(毕拉草(bialaphos))且在黑暗中在28℃下培育两周。将胚芽转移到固体选择培养基2(毕拉草)且在黑暗中在28℃下培育。每两周转移抗愈合组织形成胚芽直到直径为约1.5-2cm为止。在28℃下将具抗性的愈伤组织转移到固体再生培养基1持续2周。在28℃下在16小时光周期下将愈伤组织转移到再生培养基2直到幼苗和根发育。将小植株转移到土壤中并且生长到成熟期。

为了选择表达本发明所教示的杀昆虫蛋白的植物,使用抗生素选择培养基进一步生长来自愈伤组织的再生幼苗,并且测试再生植物的本文所揭示的杀昆虫蛋白的表达。如图11中所示,ZIP1、ZIP2和ZIP4蛋白质的表达通过用ZIP特异性抗体的蛋白质印迹法来检测,所述抗体来自转化大豆植物的叶(图11的条带2-10和12-13)。此外,在用对ZIP2具有特异性的表达载体转化的玉米植物的叶(图11的条带15和16)中确认ZIP2蛋白质表达。测试表3中发现的表达杀昆虫蛋白的其它转基因大豆和玉米植物的所关注的蛋白质的表达。

此外,用稳定地表达所关注的杀昆虫蛋白(包括实例6中显示的ZIP1、ZIP2和ZIP4以及表3中发现的其它ZIP蛋白质)的转化植物的部分(例如叶、茎、根、花、果实、种子或秧苗)进行昆虫喂食分析。

Figure BDA0002647180000001481

Figure BDA0002647180000001491

Figure BDA0002647180000001501

Figure BDA0002647180000001511

Figure BDA0002647180000001531

Figure BDA0002647180000001541

Figure BDA0002647180000001561

Figure BDA0002647180000001571

本发明的编号实施例

不管所附权利要求书,本发明阐述以下编号实施例:

核苷酸

1.一种分离的核酸分子,其编码与选自由以下组成的群组的蛋白质具有至少约80%序列一致性的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70和SEQ ID NO:72。

2.根据实施例1所述的分离的核酸分子,其中所述核酸分子编码与选自由以下组成的群组的蛋白质具有90%序列一致性的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72。

3.根据实施例1所述的分离的核酸分子,其中所述核酸分子编码与选自由以下组成的群组的蛋白质具有95%序列一致性的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72。

4.根据实施例1所述的分离的核酸分子,其中所述核酸分子编码与选自由以下组成的群组的蛋白质具有99%序列一致性的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72。

5.根据实施例1所述的分离的核酸分子,其中所述核酸分子编码选自由以下组成的群组的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70和SEQ ID NO:72。

6.根据实施例1所述的分离的核酸分子,其中所述核酸分子经密码子优化以用于在所关注的宿主细胞中表达。

7.根据实施例1所述的分离的核酸分子,其中所述核酸分子经密码子优化以用于在植物细胞中表达。

8.根据实施例1所述的分离的核酸分子,其中所述核酸分子选自由以下组成的群组:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ IDNO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ IDNO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69和SEQID NO:71。

9.一种分离的核酸分子,如在表3中呈现。

10.一种分离的蛋白质、多肽、氨基酸序列,或其变异体,如在表3中呈现。

核苷酸构建体

1.一种核苷酸构建体,其包含:编码与选自由以下组成的群组的蛋白质具有至少约80%序列一致性的杀昆虫蛋白的核酸分子:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72,所述核酸分子可操作地连接到异源调节元件。

2.根据实施例1所述的核苷酸构建体,其中所述核酸分子编码与选自由以下组成的群组的蛋白质具有至少约90%序列一致性的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72。

3.根据实施例1所述的核苷酸构建体,其中所述核酸分子编码与选自由以下组成的群组的蛋白质具有至少约95%序列一致性的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72。

4.根据实施例1所述的核苷酸构建体,其中所述核酸分子编码与选自由以下组成的群组的蛋白质具有至少约99%序列一致性的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72。

5.根据实施例1所述的核苷酸构建体,其中所述核酸分子编码选自由以下组成的群组的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70和SEQ ID NO:72。

6.根据实施例1所述的核苷酸构建体,其中所述异源调节元件为启动子。

7.根据实施例1所述的核苷酸构建体,其中所述核苷酸构建体含于表达盒中。

8.根据实施例1所述的核苷酸构建体,其中所述异源调节元件能够在植物中表达经编码蛋白质。

9.根据实施例1所述的核苷酸构建体,其中所述核酸分子经密码子优化以用于在所关注的宿主细胞中表达。

10.根据实施例1所述的核苷酸构建体,其中所述核酸分子经密码子优化以用于在植物细胞中表达。

11.根据实施例1所述的核苷酸构建体,其中所述核酸分子选自由以下组成的群组:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ IDNO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ IDNO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69和SEQID NO:71。

12.一种表达载体,其包含根据实施例1所述的核苷酸构建体。

13.一种质粒,其包含根据实施例1所述的核苷酸构建体。

14.一种宿主细胞,其包含根据实施例1所述的核苷酸构建体。

15.一种杀死昆虫的方法,其包含使所述昆虫与表达根据实施例1所述的核苷酸构建体的宿主细胞接触。

16.一种原核宿主细胞,其包含根据实施例1所述的核苷酸构建体。

17.一种真核宿主细胞,其包含根据实施例1所述的核苷酸构建体。

18.一种植物细胞,其包含根据实施例1所述的核苷酸构建体。

19.一种单子叶植物细胞,其包含根据实施例1所述的核苷酸构建体。

20.一种双子叶植物细胞,其包含根据实施例1所述的核苷酸构建体。

21.一种植物,其用根据实施例1所述的核苷酸构建体稳定转化。

22.一种种子,其由已经用根据实施例1所述的核苷酸构建体稳定转化的植物产生。

分离的蛋白质

1.一种分离的杀昆虫蛋白,其包含:与以下具有至少约80%序列一致性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQID NO:72。

2.根据实施例1所述的分离的杀昆虫蛋白,其包含:与以下具有至少约90%序列一致性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70或SEQ ID NO:72。

3.根据实施例1所述的分离的杀昆虫蛋白,其包含:与以下具有至少约95%序列一致性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70或SEQ ID NO:72。

4.根据实施例1所述的分离的杀昆虫蛋白,其包含:与以下具有至少约99%序列一致性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70或SEQ ID NO:72。

5.根据实施例1所述的分离的杀昆虫蛋白,其包含:选自以下的氨基酸序列:SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72。

重组蛋白

1.一种重组杀昆虫蛋白,其包含:与以下具有至少约80%序列一致性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQID NO:72。

2.根据实施例1所述的重组杀昆虫蛋白,其包含:与以下具有至少约90%序列一致性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70或SEQ ID NO:72。

3.根据实施例1所述的重组杀昆虫蛋白,其包含:与以下具有至少约95%序列一致性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70或SEQ ID NO:72。

4.根据实施例1所述的重组杀昆虫蛋白,其包含:与以下具有至少约99%序列一致性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70或SEQ ID NO:72。

5.根据实施例1所述的重组杀昆虫蛋白,其包含:选自以下的氨基酸序列:SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQ ID NO:72。

转基因植物细胞

1.一种转基因植物细胞,其包含:

a.DNA构建体,其包含编码多肽的多核苷酸,所述多肽与选自由以下组成的群组的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列一致性:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72;和可操作地连接到所述多核苷酸的异源调节序列。

2.根据实施例1所述的转基因植物细胞,其中所述多核苷酸编码具有选自由以下组成的群组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70和SEQ ID NO:72。

3.根据实施例1所述的转基因植物细胞,其中所述异源调节元件为启动子。

4.根据实施例1所述的转基因植物细胞,其中所述细胞来自单子叶植物物种。

5.根据实施例1所述的转基因植物细胞,其中所述细胞来自玉米、小麦、燕麦或水稻。

6.根据实施例1所述的转基因植物细胞,其中所述细胞来自双子叶植物物种。

7.根据实施例1所述的转基因植物细胞,其中所述细胞来自棉花、马铃薯或大豆。

8.根据实施例1所述的转基因植物细胞,其中所述细胞来自农业中耕作物物种。

转基因植物

1.一种用DNA构建体稳定转化的转基因植物,其包含:

a.编码多肽的多核苷酸,所述多肽与选自由以下组成的群组的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列一致性:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72;以及

b.可操作地连接到所述多核苷酸的异源调节序列。

2.根据实施例1所述的转基因植物,其中所述多核苷酸编码具有选自由以下组成的群组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQID NO:70和SEQ ID NO:72。

3.根据实施例1所述的转基因植物,其中所述异源调节元件为启动子。

4.根据实施例1所述的转基因植物,其中所述植物为单子叶植物物种。

5.根据实施例1所述的转基因植物,其中所述植物为玉米、小麦、燕麦或水稻。

6.根据实施例1所述的转基因植物,其中所述植物为双子叶植物物种。

7.根据实施例1所述的转基因植物,其中所述植物为棉花、马铃薯或大豆。

8.根据实施例1所述的转基因植物,其中所述植物来自农业中耕作物物种。

9.一种种子,其由根据实施例1所述的植物产生。

10.一种子代植物,其由根据实施例1所述的植物产生。

11.根据实施例1所述的转基因植物,其进一步包含:DNA构建体,其包含编码以下多核苷酸:莫那辛蛋白、假单胞菌杀昆虫蛋白、Cry蛋白、Cyt蛋白、营养期杀昆虫蛋白、毒素复合蛋白及其任何组合。

12.一种杀死目标害虫的方法,其包含:将根据实施例1所述的转基因植物提供到一个区域,其中所述目标害虫暴露于所述转基因植物。

13.一种杀死目标害虫的方法,其包含:将根据实施例1所述的转基因植物提供到一个区域,其中所述目标害虫以所述转基因植物为食。

14.一种杀死对杀虫蛋白具有抗性的目标害虫的方法,其包含:将根据实施例1所述的转基因植物提供到一个区域,其中所述目标害虫暴露于所述转基因植物,并且其中所述目标害虫对以下中的至少一个具有抗性:莫那辛蛋白、假单胞菌杀昆虫蛋白、Cry蛋白、Cyt蛋白、营养期杀昆虫蛋白、毒素复合蛋白及其任何组合。

15.一种杀死对杀虫蛋白具有抗性的目标害虫的方法,其包含:将根据实施例1所述的转基因植物提供到一个区域,其中所述目标害虫以所述转基因植物为食,并且其中所述目标害虫对以下中的至少一个具有抗性:莫那辛蛋白、假单胞菌杀昆虫蛋白、Cry蛋白、Cyt蛋白、营养期杀昆虫蛋白、毒素复合蛋白及其任何组合。

16.一种杀死目标害虫的方法,其包含:将根据实施例1所述的转基因植物提供到一个区域,其中所述目标害虫暴露于所述转基因植物,且所述目标害虫是以下的成员:鞘翅目、双翅目、膜翅目、鳞翅目、半翅目、直翅目、缨翅目或革翅目。

农业组合物

1.一种杀昆虫组合物,其包含:

a.具有以下氨基酸序列的分离的杀昆虫蛋白:与选自由以下组成的群组的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列一致性:SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70和SEQID NO:72;以及

b.农业上可接受的载剂。

2.根据实施例1所述的杀昆虫组合物,其中所述分离的杀昆虫蛋白具有选自由以下组成的群组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQID NO:70和SEQ ID NO:72。

3.根据实施例1所述的杀昆虫组合物,其中所述分离的杀昆虫蛋白以杀昆虫有效量存在。

4.根据实施例1所述的杀昆虫组合物,其中所述农业上可接受的载剂为选自由以下组成的群组中的至少一个:佐剂、惰性组分、分散剂、表面活性剂、粘着剂、增粘剂、粘合剂、天然或再生矿物质、溶剂、润湿剂、肥料及其组合。

5.根据实施例1所述的杀昆虫组合物,其被调配为干燥固体。

6.根据实施例1所述的杀昆虫组合物,其被调配为液体。

7.根据实施例1所述的杀昆虫组合物,其经调配用于叶面施用。

8.根据实施例1所述的杀昆虫组合物,其经调配用于沟内施用。

9.根据实施例1所述的杀昆虫组合物,其被调配为种衣剂或种子处理剂。

10.根据实施例1所述的杀昆虫组合物,其进一步包含:至少一种额外杀虫化合物。

11.根据实施例1所述的杀昆虫组合物,其进一步包含:选自由以下组成的群组的至少一种额外杀虫化合物:莫那辛蛋白、假单胞菌杀昆虫蛋白、Cry蛋白、Cyt蛋白、营养期杀昆虫蛋白、毒素复合蛋白及其任何组合。

12.根据实施例1所述的杀昆虫组合物,其进一步包含:至少一种额外除草化合物。

13.一种杀死目标害虫的方法,其包含:向所述目标害虫施用根据实施例1所述的杀昆虫组合物。

14.一种杀死目标害虫的方法,其包含:向位点施用根据实施例1所述的杀昆虫组合物,其中所述目标害虫与所述位点接触。

15.一种杀死目标害虫的方法,其包含:向作物施用根据实施例1所述的杀昆虫组合物,其中所述目标害虫与所述作物接触。

16.一种杀死目标害虫的方法,其包含:向作物施用根据实施例1所述的杀昆虫组合物,所述目标害虫与所述作物接触,且所述目标害虫是以下的成员:鞘翅目、双翅目、膜翅目、鳞翅目、半翅目、直翅目、缨翅目或革翅目。

细胞裂解物

1.一种细胞裂解物,其包含:包含与以下具有至少约80%序列一致性的氨基酸序列的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70或SEQ ID NO:72。

2.根据实施例1所述的细胞裂解物,其包含:包含与以下具有至少约90%序列一致性的氨基酸序列的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70或SEQ ID NO:72。

3.根据实施例1所述的细胞裂解物,其包含:包含与以下具有至少约95%序列一致性的氨基酸序列的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70或SEQ ID NO:72。

4.根据实施例1所述的细胞裂解物,其包含:包含与以下具有至少约95%序列一致性的氨基酸序列的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70或SEQ ID NO:72。

5.根据实施例1所述的细胞裂解物,其包含:包含选自以下的氨基酸序列的杀昆虫蛋白:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70或SEQID NO:72。

6.一种杀死目标害虫的方法,其包含:向所述目标害虫施用根据实施例1所述的细胞裂解物。

用表达杀昆虫蛋白的天然微生物杀死害虫的方法

1.一种杀死目标害虫的方法,其包含:向所述目标害虫施用宿主细胞,其表达编码多肽的多核苷酸,所述多肽与选自由以下组成的群组的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列一致性:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70和SEQ ID NO:72。

2.根据实施例1所述的方法,其中所述宿主细胞表达编码具有选自由以下组成的群组的氨基酸序列的多肽的多核苷酸:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70和SEQ ID NO:72。

3.根据实施例1所述的方法,其中所述宿主细胞为原核宿主细胞。

4.根据实施例1所述的方法,其中所述宿主细胞天然地表达所述多核苷酸。

5.根据实施例1所述的方法,其中所述宿主细胞来自假单胞菌属。

6.根据实施例1所述的方法,其中所述目标害虫是以下的成员:鞘翅目、双翅目、膜翅目、鳞翅目、半翅目、直翅目、缨翅目或革翅目。

杀昆虫蛋白发现平台

1.一种用于构建基因组库的方法,所述基因组库富集编码杀昆虫蛋白的假单胞菌的DNA,所述方法包含:

a.提供包含一或多种微生物体的初始样品;

b.将所述初始样品暴露于固体营养限制培养基,使假单胞菌属的物种富集生长,从而产生富集假单胞菌种的后续样品;

c.从所述后续富集样品分离DNA;

d.从所述分离的DNA提取DNA并且用所选择的引物进行简并PCR,以扩增目标杀昆虫蛋白基因;

e.将所述PCR扩增的DNA克隆到质粒中;以及

f.对来自所述质粒的克隆DNA进行测序。

2.根据实施例1所述的方法,其进一步包含:将测序DNA组装到基因组库中。

3.根据实施例1所述的方法,其进一步包含:识别所述测序DNA内的杀昆虫蛋白基因。

4.根据实施例1所述的方法,其进一步包含:识别所述测序DNA内的杀昆虫蛋白基因,其中所述经识别的杀昆虫蛋白基因是未知的。

5.根据实施例1所述的方法,其进一步包含:利用隐马尔可夫模型来识别所述测序DNA内的杀昆虫蛋白基因。

6.根据实施例1所述的方法,其进一步包含:识别所述测序DNA内的杀昆虫蛋白基因,其中所述经识别的杀昆虫蛋白基因选自由以下组成的群组:SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69和71.

7.根据实施例1所述的方法,其进一步包含:识别所述测序DNA内的杀昆虫蛋白基因,其中所述经识别的杀昆虫蛋白基因编码选自由以下组成的群组的蛋白质:SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70和72。

8.根据实施例1所述的方法,其中所述引物经选择以扩增目标杀昆虫蛋白基因,其编码与SEQ ID NO:39具有至少50%序列一致性的蛋白质。

9.根据实施例1所述的方法,其中所述初始样品来自土壤。

10.一种杀昆虫基因组库,其富集如通过根据实施例1所述的方法所构建的编码杀昆虫蛋白的假单胞菌的DNA。

HMM模型蛋白质

1.一种杀昆虫蛋白,其包含:在使用表6中的HMM评分或匹配时,a)评分比特分数为521.5或高于521.5的氨基酸序列;和/或b)以小于或等于7.9e-161的E值匹配的氨基酸序列。

一种编码核酸的杀昆虫蛋白(如表3所阐述)或具有氨基酸序列的杀昆虫蛋白(如表3所阐述)是本发明的实施例,以及将其用于控制昆虫害虫的方法和发现其的方法。

*****

通过引用的方式并入

出于所有目的,本文所引用的所有文献、文章、揭示案、专利、专利揭示案和专利申请案全部均以全文引用的方式并入。然而,本文所引用的任何文献、文章、揭示案、专利、专利揭示案以及专利申请案的提及不视为并且不应该视为承认或以任何形式表明其构成有效的现有技术或形成世界上任何国家的公共常识的一部分。

序列表

<110> 齐默尔根公司(Zymergen Inc.)

<120> 杀昆虫蛋白发现平台和自其发现的杀昆虫蛋白

<130> ZYMR-022/01WO 327574-2109

<150> US 62/637,515

<151> 2018-03-02

<160> 87

<170> PatentIn版本3.5

<210> 1

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 1

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 2

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 2

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 3

<211> 831

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 3

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acacgatcct catcgccgtt attgaactga gatccggctg c 831

<210> 4

<211> 277

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 4

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Thr Ile Leu Ile Ala Val Ile Glu

260 265 270

Leu Arg Ser Gly Cys

275

<210> 5

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 5

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtccctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggagac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac ggcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggttgttctt 540

gtttatgcgc acaacgccac ttcggcgggc aggcagaatg gtaatgcctt cgcctataac 600

aagacccagc aggtgggctc gcgcctggac ctgtactacc tgtcggccat cactcagaac 660

agaacggtca ttgtcgagtc cagcaaggcc atcgacccgc tggattggga tacggtgcaa 720

cgcaacgtgc tgatggaaaa ctacaaccca gccagtaaca gcggacactt cagcttcgac 780

tggagtgcct acaacgatcc tcatcgccgt tat 813

<210> 6

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 6

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Pro Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Glu Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Gly Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Leu Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Asn Lys Thr Gln Gln Val Gly Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asn Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Lys Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Met Glu Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 7

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 7

atgacgatca aggaagaact gagcaatcct caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgaccgcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcagac 180

ccgaaacaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac ggacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaagtac agcgttggcg gcagtatcga catcgtcaac 420

gtcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gacccagacc 480

ttcacccaga gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctacgcgc acaacgccac ctcggcgggc cggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtggattc gcggctcgat ctctactatc tgtcggcgat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaaggca atcaacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatcgagaa ctacaacccg gcctccaaca gtgggcactt ccgcttcgac 780

tggagcgcct acaacgatcc tcatcgtcgt tac 813

<210> 8

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<220>

<221> misc_feature

<222> (251)..(251)

<223> Xaa可为任何天然存在的氨基酸

<400> 8

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln Tyr

85 90 95

Val Glu Thr Ile Ser Ile Pro Gln Asn Val Thr Thr Thr Leu Ser Tyr

100 105 110

Gln Leu Thr Lys Gly His Thr Arg Ser Phe Glu Thr Ser Val Asn Ala

115 120 125

Lys Tyr Ser Val Gly Ala Asn Ile Asp Ile Val Asn Val Gly Ser Glu

130 135 140

Ile Ser Thr Gly Phe Thr Arg Ser Glu Ser Trp Ser Thr Thr Gln Ser

145 150 155 160

Phe Thr Asp Thr Thr Glu Met Lys Gly Pro Gly Thr Phe Val Ile Tyr

165 170 175

Gln Val Val Leu Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Ala Asn Ala Phe Ala Tyr Ser Lys Thr Gln Ala Val Gly Ser Arg

195 200 205

Val Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Arg Lys Arg Val Ile

210 215 220

Val Pro Ser Ser Asn Ala Val Thr Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Met Glu Asn Tyr Asn Pro Xaa Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 9

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 9

atgacgatca aggaagagct gagcaatcct caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgaccgcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcagac 180

ccgaaacaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcaacacac ggacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaagtac aacgttggcg gcagtatcga catcgtcaac 420

gtcagctcgg atatcactgt cggtttcagc agcaccgagg cctggtcgac gacccagacc 480

ttcacccaga gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctacgcgc acaacgccac ctcggcgggc cggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtggattc gcggctcgat ctctactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaaggca atcaacccgc tggaccggga taccgtgcag 720

cgcaacgtgc tgatcgagaa ctacaacccg gcctccaaca gtgggcactt ccgcttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 10

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 10

Met Thr Ile Lys Glu Glu Leu Ser Asn Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ala Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Gln Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Asn Val Gly Gly Ser Ile Asp Ile Val Asn Val Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Thr Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asp Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Lys Ala Ile Asn Pro Leu Asp Arg Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Glu Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Arg Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 11

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 11

atgacgatca aggaagagct gggccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg tccgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaaggcc atcgcgccgc tggattggga tactgtccag 720

cgcaatgtac tgatggagaa ctacaaccag agcagcaata gcgggcactt cagtttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 12

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 12

Met Thr Ile Lys Glu Glu Leu Gly Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Ser Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Lys Ala Ile Ala Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Met Glu Asn Tyr Asn Gln Ser Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 13

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 13

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

ttgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggcccc ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 14

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 14

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Leu Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 15

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 15

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cggcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

ccgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 16

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 16

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Gly

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Pro Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 17

<211> 831

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<220>

<221> misc_feature

<222> (657)..(657)

<223> n为a、c、g或t

<400> 17

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac ggacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaagtac agcgttggcg gcagtatcga catcgtcaac 420

gtcagctcgg atatcactgt cggtttcagc agcaccgagg cctggtcgac gacccagacc 480

ttcacccaaa gcaccgagct ggccggtccg ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccangac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggaccggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acacgatcct catcgccgtt attgaactga gatccggctg c 831

<210> 18

<211> 277

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<220>

<221> misc_feature

<222> (219)..(219)

<223> Xaa可为任何天然存在的氨基酸

<400> 18

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Val Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Thr Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Xaa Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Arg Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Thr Ile Leu Ile Ala Val Ile Glu

260 265 270

Leu Arg Ser Gly Cys

275

<210> 19

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 19

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

ttgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggcccc ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 20

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 20

Met Thr Ile Lys Glu Glu Leu Ser Asn Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ala Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 21

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 21

atgacgatca aggaagagct gggccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgccggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac acagactcgc agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 22

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 22

Met Thr Ile Lys Glu Glu Leu Gly Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Arg Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Arg Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 23

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 23

atgacgatca aggaagagct gggccaaccc caaagccgtt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ctcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 24

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 24

Met Thr Ile Lys Glu Glu Leu Gly Gln Pro Gln Ser Arg Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 25

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 25

atgacgatca aggaagagct gggccagcct caaagccatt cgatcgaact ggacgaggtg 60

agcaaggagg ccgcaagtac gcgggccgcg ttgacttcca acctgtctgg ccgcttcgac 120

cagtacccga ccaagaaggg cgactttgcg atcgatggtt atttgctgga ctacagctca 180

cccaagcaag gttgctgggt ggacggtatc actgtctatg gcgatatcta catcggcaag 240

cagaactggg gcacttatac ccgcccggtg tttgcctacc tacagtatgt ggaaaccatc 300

tccattccac agaatgtgac gaccaccctc agctatcagc tgaccaaggg gcatacccgt 360

tccttcgaga ccagtgtcaa cgccaagtac agcgttggcg ccaacataga tatcgtcaac 420

gtgggttcgg agatttccac cgggtttacc cgcagcgagt cctggtccac cacgcagtcg 480

ttcaccgata ccaccgagat gaaggggcca gggacgttcg tcatttacca ggtcgtgctg 540

gtgtatgcgc acaacgccac ctcggcaggg cggcagaatg ccaatgcctt cgcctacagc 600

aaaacccagg cagtgggctc gcgggtggac ttgtactact tgtcggccat tacccagcgc 660

aagcgggtca tcgttccgtc gagcaatgcc gtcacgccgc tggactggga tacggtgcaa 720

cgcaacgtgc tgatggaaaa ctacaaccca ggcagtaaca gcggacactt cggcttcgac 780

tggagtgcct acaacgatcc tcatcgccgt tat 813

<210> 26

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 26

Met Thr Ile Lys Glu Glu Leu Gly Gln Pro Gln Ser His Ser Ile Glu

1 5 10 15

Leu Asp Glu Val Ser Lys Glu Ala Ala Ser Thr Arg Ala Ala Leu Thr

20 25 30

Ser Asn Leu Ser Gly Arg Phe Asp Gln Tyr Pro Thr Lys Lys Gly Asp

35 40 45

Phe Ala Ile Asp Gly Tyr Leu Leu Asp Tyr Ser Ser Pro Lys Gln Gly

50 55 60

Cys Trp Val Asp Gly Ile Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln Tyr

85 90 95

Val Glu Thr Ile Ser Ile Pro Gln Asn Val Thr Thr Thr Leu Ser Tyr

100 105 110

Gln Leu Thr Lys Gly His Thr Arg Ser Phe Glu Thr Ser Val Asn Ala

115 120 125

Lys Tyr Ser Val Gly Ala Asn Ile Asp Ile Val Asn Val Gly Ser Glu

130 135 140

Ile Ser Thr Gly Phe Thr Arg Ser Glu Ser Trp Ser Thr Thr Gln Ser

145 150 155 160

Phe Thr Asp Thr Thr Glu Met Lys Gly Pro Gly Thr Phe Val Ile Tyr

165 170 175

Gln Val Val Leu Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Ala Asn Ala Phe Ala Tyr Ser Lys Thr Gln Ala Val Gly Ser Arg

195 200 205

Val Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Arg Lys Arg Val Ile

210 215 220

Val Pro Ser Ser Asn Ala Val Thr Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Met Glu Asn Tyr Asn Pro Gly Ser Asn Ser Gly His

245 250 255

Phe Gly Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 27

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 27

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaggcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agccggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 28

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 28

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Gly Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Pro Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 29

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 29

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgtct 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 30

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 30

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Ser Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 31

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 31

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcggtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactgcc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 32

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 32

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Gly Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Cys Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 33

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 33

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc cggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 34

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 34

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Pro Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 35

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 35

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatggc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 36

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 36

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Gly Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 37

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 37

atgacgatca aggaagagct gggccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 38

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 38

Met Thr Ile Lys Glu Glu Leu Gly Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 39

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 39

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt cgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 40

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 40

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Ser Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 41

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 41

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagcc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 42

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 42

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Pro Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 43

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 43

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agccaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 44

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 44

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser His

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 45

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 45

atgacgatca aggaagagct gaaccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 46

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 46

Met Thr Ile Lys Glu Glu Leu Asn Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 47

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 47

atgacgatca aggaagagct gagccaaccc caaagccatt tggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 48

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 48

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Leu Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 49

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 49

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcaag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 50

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 50

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Lys Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 51

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 51

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccgaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 52

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 52

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Arg Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 53

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 53

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcag ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgagctc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcagtgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 54

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 54

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Ser Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Ser Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Ser Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 55

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 55

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc gggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 56

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 56

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Arg Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 57

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 57

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacgcccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 58

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 58

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Ala Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 59

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 59

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg caacttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 60

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 60

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Asn

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 61

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 61

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgatcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 62

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 62

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Ile Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 63

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 63

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cgacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggggcgcct acaacgatcc tcatcgccgt tat 813

<210> 64

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 64

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Gly Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 65

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 65

atgacgatca aggaagagct gggccagcct caaagccatt cgatcgaact ggacgaggtg 60

agcaaggagg ccgcaagtac gcgggccgcg ttgacttcca acctgtctgg ccgcttcgac 120

cagtacccga ccaagaaggg cgactttgcg atcgatggtt atttgctgga ctacagctca 180

cccaagcaag gttgctgggt ggacggtatc actgtctatg gcgatatcta catcggcaag 240

cagaactggg gcacttatac ccgcccggtg tttgcctacc tacagtatgt ggaaaccatc 300

tccattccac agaatgtgac gaccaccctc agctatcagc tgaccaaggg gcatacccgt 360

tccttcgaga ccagtgtcaa cgccaagtac agcgttggcg ccaacataga tatcgtcaac 420

gtgggttcgg agatttccac cgggtttacc cgcagcgagt cctggtccac cacgcagtcg 480

ttcaccgata ccaccgagat gaaggggcca gggacgttcg tcatttacca ggtcgtgctg 540

gtgtatgcgc acaacgccac ctcggcaggg cggcagaatg ccaatgcctt cgcctacagc 600

aaaacccagg cagtgggctc gcgggtggac ttgtactact tgtcggccat tacccagcgc 660

aagcgggtca tcgttccgtc gagcaatgcc gtcacgccgc tggactggga tacggtgcaa 720

cgcaacgtgc tgatggaaaa ctacaaccca ggcagtaaca gcggacactt cagcttcgac 780

tggagtgcct acaacgatcc tcatcgccgt tat 813

<210> 66

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 66

Met Thr Ile Lys Glu Glu Leu Gly Gln Pro Gln Ser His Ser Ile Glu

1 5 10 15

Leu Asp Glu Val Ser Lys Glu Ala Ala Ser Thr Arg Ala Ala Leu Thr

20 25 30

Ser Asn Leu Ser Gly Arg Phe Asp Gln Tyr Pro Thr Lys Lys Gly Asp

35 40 45

Phe Ala Ile Asp Gly Tyr Leu Leu Asp Tyr Ser Ser Pro Lys Gln Gly

50 55 60

Cys Trp Val Asp Gly Ile Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln Tyr

85 90 95

Val Glu Thr Ile Ser Ile Pro Gln Asn Val Thr Thr Thr Leu Ser Tyr

100 105 110

Gln Leu Thr Lys Gly His Thr Arg Ser Phe Glu Thr Ser Val Asn Ala

115 120 125

Lys Tyr Ser Val Gly Ala Asn Ile Asp Ile Val Asn Val Gly Ser Glu

130 135 140

Ile Ser Thr Gly Phe Thr Arg Ser Glu Ser Trp Ser Thr Thr Gln Ser

145 150 155 160

Phe Thr Asp Thr Thr Glu Met Lys Gly Pro Gly Thr Phe Val Ile Tyr

165 170 175

Gln Val Val Leu Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Ala Asn Ala Phe Ala Tyr Ser Lys Thr Gln Ala Val Gly Ser Arg

195 200 205

Val Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Arg Lys Arg Val Ile

210 215 220

Val Pro Ser Ser Asn Ala Val Thr Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Met Glu Asn Tyr Asn Pro Gly Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 67

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 67

atgacgatca aggaagagct gggccagcct caaagccatt cgatcgaact ggacgaggtg 60

agcaaggagg ccgcaagtac gcgggccgcg ttgacttcca acctgtctgg ccgcttcgac 120

cagtacccga ccaagaaggg cgactttgcg atcgatggtt atttgctgga ctacagctca 180

cccaagcaag gttgctgggt ggacggtatc actgtctatg gcgatatcta catcggcaag 240

cagaactggg gcacttatac ccgcccggtg tttgcctacc tacagtatgt ggaaaccatc 300

tccattccac agaatgtgac gaccaccctc agctatcagc tgaccaaggg gcatacccgt 360

tccttcgaga ccagtgtcaa cgccaagtac agcgttggcg ccaacataga tatcgtcaac 420

gtgggttcgg agatttccac cgggtttacc cgcagcgagt cctggtccac cacgcagtcg 480

ttcaccgata ccaccgagat gaaggggcca gggacgttcg tcatttacca ggtcgtgctg 540

gtgtatgcgc acaacgccac ctcggcaggg cggcagaatg ccaatgcctt cgcctacagc 600

aaaacccagg cagtgggctc gcgggtggac ttgtactact tgtcggccat tacccagcgc 660

aagcgggtca tcgttccgtc gagcaatgcc gtcacgccgc tggactggga tacggtgcaa 720

cgcaacgtgc tgatggaaaa ctacaaccca ggcagtaaca gcggacactt ccgctccgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 68

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 68

Met Thr Ile Lys Glu Glu Leu Gly Gln Pro Gln Ser His Ser Ile Glu

1 5 10 15

Leu Asp Glu Val Ser Lys Glu Ala Ala Ser Thr Arg Ala Ala Leu Thr

20 25 30

Ser Asn Leu Ser Gly Arg Phe Asp Gln Tyr Pro Thr Lys Lys Gly Asp

35 40 45

Phe Ala Ile Asp Gly Tyr Leu Leu Asp Tyr Ser Ser Pro Lys Gln Gly

50 55 60

Cys Trp Val Asp Gly Ile Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln Tyr

85 90 95

Val Glu Thr Ile Ser Ile Pro Gln Asn Val Thr Thr Thr Leu Ser Tyr

100 105 110

Gln Leu Thr Lys Gly His Thr Arg Ser Phe Glu Thr Ser Val Asn Ala

115 120 125

Lys Tyr Ser Val Gly Ala Asn Ile Asp Ile Val Asn Val Gly Ser Glu

130 135 140

Ile Ser Thr Gly Phe Thr Arg Ser Glu Ser Trp Ser Thr Thr Gln Ser

145 150 155 160

Phe Thr Asp Thr Thr Glu Met Lys Gly Pro Gly Thr Phe Val Ile Tyr

165 170 175

Gln Val Val Leu Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Ala Asn Ala Phe Ala Tyr Ser Lys Thr Gln Ala Val Gly Ser Arg

195 200 205

Val Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Arg Lys Arg Val Ile

210 215 220

Val Pro Ser Ser Asn Ala Val Thr Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Met Glu Asn Tyr Asn Pro Gly Ser Asn Ser Gly His

245 250 255

Phe Arg Ser Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 69

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 69

atgacgatca aggaagagct gagccaaccc caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgacctcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcggat 180

ccgaaaaaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac cggcaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagt tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaaatac agcgttggcg gcagtatcga catcgtcaac 420

atcagctcgg atatcaccgt tggtttcagc agcaccgagg cctggtcgac gaaccagacc 480

ttcacccaaa gcaccgagct ggccggccct ggcaccttct ttgtctatca ggtggtgttt 540

gtctatgcgc acaacgccac ttcggccggt gggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtgaactc gcggctcgac ctttactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaatgca atcgacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatccagaa ctacaacccg gccagcaaca gcgggcactt ctcgttcgac 780

tggagcgcct acaacgatcc tcatcgccgt tat 813

<210> 70

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 70

Met Thr Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Lys Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Gly Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Ile Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Asn Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Gly Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asn Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Asn Ala Ile Asp Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Gln Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 71

<211> 813

<212> DNA

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 71

atgacgatca aggaagagct gagcaatcct caaagccatt cggtcgagct cgaccagttg 60

caagtcgggg aagtctctgc acgcgaagcg ttgaccgcca acttcgccgg cagtttcgat 120

cagttcccga ccaaaagcgg cagcttcgag atcgacaaat acctgctcaa ctacgcagac 180

ccgaaacaag gctgctggct ggacggcgtc accgtctacg gtgacatcta catcggcaag 240

cagaactggg gcacctacac gcgcccggtg ttcgcctacc tgcagcacac ggacaccatc 300

tcgattccgc agcaggtgac gcagaccaag agctaccagc tgagcaaagg ccacacccag 360

tcgttcacca agtcggtcag cgccaagtac agcgttggcg gcagtatcga catcgtcaac 420

gtcagctcgg atatcactgt cggtttcagc agcaccgagg cctggtcgac gacccagacc 480

ttcacccaaa gcaccgagct ggccggtccg ggcaccttct ttgtctatca ggtggtgttt 540

gtctacgcgc acaacgccac ctcggcgggc cggcagaatg gcaatgcctt tgcctatagc 600

aagacccagc aggtggattc gcggctcgat ctctactacc tgtcggccat cacccaggac 660

cgtacggtca tcgtcgagtc cagcaaggca atcaacccgc tggactggga taccgtgcag 720

cgcaacgtgc tgatcgagaa ctacaacccg gcctccaaca gtgggcactt ccgcttcgac 780

tggagcgcct acaacgatcc tcatcgtcgt tac 813

<210> 72

<211> 271

<212> PRT

<213> 未知

<220>

<223> 未定义的假单胞菌物种

<400> 72

Met Thr Ile Lys Glu Glu Leu Ser Asn Pro Gln Ser His Ser Val Glu

1 5 10 15

Leu Asp Gln Leu Gln Val Gly Glu Val Ser Ala Arg Glu Ala Leu Thr

20 25 30

Ala Asn Phe Ala Gly Ser Phe Asp Gln Phe Pro Thr Lys Ser Gly Ser

35 40 45

Phe Glu Ile Asp Lys Tyr Leu Leu Asn Tyr Ala Asp Pro Lys Gln Gly

50 55 60

Cys Trp Leu Asp Gly Val Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln His

85 90 95

Thr Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Lys Ser Tyr

100 105 110

Gln Leu Ser Lys Gly His Thr Gln Ser Phe Thr Lys Ser Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Val Ser Ser Asp

130 135 140

Ile Thr Val Gly Phe Ser Ser Thr Glu Ala Trp Ser Thr Thr Gln Thr

145 150 155 160

Phe Thr Gln Ser Thr Glu Leu Ala Gly Pro Gly Thr Phe Phe Val Tyr

165 170 175

Gln Val Val Phe Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Ser Lys Thr Gln Gln Val Asp Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asp Arg Thr Val Ile

210 215 220

Val Glu Ser Ser Lys Ala Ile Asn Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Ile Glu Asn Tyr Asn Pro Ala Ser Asn Ser Gly His

245 250 255

Phe Arg Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 73

<211> 271

<212> PRT

<213> 绿针假单胞菌

<400> 73

Met Pro Ile Lys Glu Glu Leu Ser Gln Pro Gln Ser His Ser Ile Glu

1 5 10 15

Leu Asp Asp Leu Lys Ser Glu Gln Gly Ser Leu Arg Ala Ala Leu Thr

20 25 30

Ser Asn Phe Ala Gly Asn Phe Asp Gln Phe Pro Thr Lys Arg Gly Gly

35 40 45

Phe Ala Ile Asp Ser Tyr Leu Leu Asp Tyr Ser Ala Pro Lys Gln Gly

50 55 60

Cys Trp Val Asp Gly Ile Thr Val Tyr Gly Asp Ile Phe Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln Tyr

85 90 95

Met Asp Thr Ile Ser Ile Pro Gln Gln Val Thr Gln Thr Arg Ser Tyr

100 105 110

Gln Leu Thr Lys Gly His Thr Lys Thr Phe Thr Thr Asn Val Ser Ala

115 120 125

Lys Tyr Ser Val Gly Gly Ser Ile Asp Ile Val Asn Val Gly Ser Asp

130 135 140

Ile Ser Ile Gly Phe Ser Asn Ser Glu Ser Trp Ser Thr Thr Gln Thr

145 150 155 160

Phe Ser Asn Ser Thr Gln Leu Thr Gly Pro Gly Thr Phe Ile Val Tyr

165 170 175

Gln Val Val Met Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Gly Asn Ala Phe Ala Tyr Asn Lys Thr Asn Thr Val Gly Ser Arg

195 200 205

Leu Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Asn Ser Thr Val Ile

210 215 220

Val Asp Ser Ser Lys Ala Ile Ala Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Met Glu Asn Tyr Asn Pro Gly Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

<210> 74

<211> 578

<212> PRT

<213> 布氏假单胞菌

<400> 74

Met Ser Thr Pro Phe Lys Gln Phe Thr Ser Pro Ala Gly Gln Ala Pro

1 5 10 15

Lys Asp Tyr Asn Lys Leu Gly Leu Glu Asn Gln Leu Pro Gln Phe Glu

20 25 30

Thr Asp Trp Asn Asn Asp Leu Thr Gly Trp Thr Gln Ser Ala Ile Ile

35 40 45

Gly Asn Pro Trp Ser Gly Leu Asn Asp Ala Pro Arg Ser Gly Tyr Tyr

50 55 60

Asn Pro Leu Val Glu Gly Tyr Gly Pro Thr Thr Pro Pro Ala Ile Thr

65 70 75 80

Trp Ala Pro Phe Pro Asn Arg Leu Trp Thr Phe Phe Tyr Asn Asn Gly

85 90 95

Thr Ala Val Ile Pro Gln Leu Gly Gly Lys Ala Met Ser Leu Gln Gln

100 105 110

Val Met Glu Leu Thr Asp Asn Gly Gln Ile Thr Ile Asn Asn Thr Leu

115 120 125

Tyr Met Leu Tyr Asp Pro Asn Lys Gln Gly Thr Leu Leu Gln Leu Pro

130 135 140

Val Thr Arg Cys Pro Thr Ile Asp Trp Gln Gly Lys Tyr Lys Asp Phe

145 150 155 160

Ser Pro Ser Gly Pro Arg Gly Trp Leu Asp Glu Tyr Cys Glu Trp Ser

165 170 175

Ile Val Arg Asp Ala Asp Gly Asn Met Arg Lys Ile Thr Phe Thr Cys

180 185 190

Glu Asn Pro Ala Tyr Phe Leu Ala Met Trp Arg Ile Asp Pro Asn Ala

195 200 205

Val Leu Gly Leu Tyr Arg Asp Tyr Ile Asp Pro Gln Val Gln Leu Glu

210 215 220

Asp Leu Tyr Leu Arg Tyr Thr Ala Asp Cys Pro Thr Gly Lys Ala Gly

225 230 235 240

Asp Pro Val Ile Asp Pro Thr Thr Gly Gln Pro Ala Tyr Asp Thr Val

245 250 255

Asn Lys Trp Asn Ala Gly Thr Ala Cys Val Pro Gly Gln Tyr Gly Gly

260 265 270

Ala Met His Leu Thr Ser Gly Pro Asn Thr Leu Ser Ala Glu Val Tyr

275 280 285

Leu Ala Ala Ala Ala Thr Ile Leu Arg Pro Leu Ala Ser Ser Gln Asn

290 295 300

Ser Gln Ala Leu Ile Cys Cys Ala Gln Tyr Gly Gln Asn Tyr Arg Asn

305 310 315 320

Ser Asp Pro His Ile Gly Phe Ser Ala Asn Ser Val Ala Val Asn Asn

325 330 335

Arg Leu Ser Leu Thr Asn Pro Ile Gly Leu Tyr Leu Gln Gln Pro Thr

340 345 350

Asp Phe Ser Ala Trp Lys Gly Pro Gln Gly Gln Asp Val Ser Gln Tyr

355 360 365

Trp Lys Ile Thr Arg Gly Thr Ala Lys Ser Ala Ala Asn Gly Ser Asp

370 375 380

Gln Ile Leu Gln Ala Val Phe Glu Val Pro Val Ser Ala Gly Phe Ser

385 390 395 400

Ile Asn Asp Ile Thr Ile Ser Gly Gln Pro Ile Asp Tyr Val Trp Val

405 410 415

Ile Ala Gln Gln Leu Leu Val Gly Leu Ser Val Thr Thr Thr Pro Ile

420 425 430

Ser Pro Thr Pro Asp Ser Cys Pro Cys Val Lys Asp Arg Val Asn Gly

435 440 445

Val Gln Pro Trp Pro Val Gln Leu Leu Pro Leu Asp Leu Phe Tyr Gly

450 455 460

Gln Ser Pro Thr Asp Leu Pro Ala Trp Leu Ala Pro Gly Thr Ser Gly

465 470 475 480

Gln Phe Ala Leu Val Val Gln Gly Ala Asp Leu Lys Thr Thr Ala Glu

485 490 495

Thr Ala Arg Val Gln Phe Ser Asn Pro Gly Val Thr Ala Gln Val Thr

500 505 510

Gln Phe Leu Pro Asp Ala Ser Ala Ile Pro Gly Gln Thr Asn Ser Gly

515 520 525

Gly Thr Gln Gly Tyr Leu Leu Thr Ile Thr Val Ser Pro Thr Ala Ala

530 535 540

Pro Gly Leu Val Thr Val Arg Ala Leu Asn Pro Gly Glu Ala Asp Asn

545 550 555 560

Pro Ser Ala Thr Glu His Pro Trp Glu Ser Gly Leu Ala Leu Val Pro

565 570 575

Gly Ala

<210> 75

<211> 535

<212> PRT

<213> 布氏假单胞菌

<400> 75

Met Ser Arg Leu Arg Leu Ser Val Leu Ser Leu Leu Thr Ser Val Val

1 5 10 15

Leu Ser Leu Phe Ala Met Gln Ala Ala Tyr Ala Ser Pro Thr Ser Asp

20 25 30

Ala Asp Ala Cys Val Gln Gln Gln Leu Val Phe Asn Pro Lys Ser Gly

35 40 45

Gly Phe Leu Pro Ile Asn Asn Phe Asn Ala Thr Gly Gln Ser Phe Met

50 55 60

Asn Cys Phe Gly Trp Gln Leu Phe Ile Ala Leu Asn Trp Pro Val Asn

65 70 75 80

Pro Gly Trp Pro Ala Thr Pro Ala Leu Ala Gly Glu Pro Asp Met Asn

85 90 95

Ser Thr Leu Ala Gln Phe Gly Val Pro Thr Ala Ser Gly Gln Pro Met

100 105 110

Ser Val Ala Pro Val Trp Ala Ser Tyr Lys Asp Ala Asn Asp Ile Phe

115 120 125

Leu Pro Gly Ala Pro Ala Pro Thr Gly Trp Gly Val Gln Thr Leu Val

130 135 140

Pro Ser Asn Cys Ser Thr Gln Gly Ser Leu Arg Ala Ile Ser Val Gly

145 150 155 160

Ala Arg Lys Phe Met Thr Ala Thr Ser Glu Ser Ala Ile Asn Ala Arg

165 170 175

His Gly Phe His Leu Ser Ser Gly Thr Leu Ala Ser Ile Pro Asp Pro

180 185 190

Ile Met Glu Ala Ser Gly Gly Trp Leu Thr Asp Gln Ser Gln Asn Leu

195 200 205

Val Phe Phe Glu Arg Lys Val Gly Lys Ala Glu Phe Asp Tyr Ile Val

210 215 220

Ser Lys Gly Leu Tyr Asp Ala Ala Asn Gln Leu Thr Val Ala Gln Asn

225 230 235 240

Leu Asp Asn Gln Asn Pro Gly Gly Leu Ser Leu Pro Ile Gly Glu Pro

245 250 255

Met Arg Ser Leu Pro Pro Asn Pro Val Pro Gln Glu Gln Leu Gly Ala

260 265 270

Leu Glu Val Lys Ala Ala Trp Arg Ile Leu Thr Gly Lys Pro Glu Leu

275 280 285

Tyr Gly Arg Tyr Leu Thr Thr Val Ala Trp Leu Lys Asn Pro Ala Thr

290 295 300

Leu Gln Cys Thr Gln Gln Val Val Gly Leu Val Gly Leu His Ile Ile

305 310 315 320

Asn Lys Thr Gln Ala Ser Pro Asn Phe Ile Trp Thr Thr Phe Glu Gln

325 330 335

Val Asp Asn Val Pro Glu Pro Asn Gln Val Pro Pro Gln Gln Thr Pro

340 345 350

Pro Asp Ser Phe Ala Phe Asn Asn Pro Asn Cys Gly Thr Gly Pro Glu

355 360 365

Cys Thr Pro Asn Val Ala Arg Ile Gln Cys Lys Gln His His Pro Asp

370 375 380

Arg Asp Cys Thr Glu Pro Phe Pro Arg Asp Gln Pro Val Gln Thr Thr

385 390 395 400

Arg Glu His Pro Leu Pro Thr Glu Leu Gln Ala Leu Asn Gly Ala Val

405 410 415

Gln Ala Asn Phe Ala Gln Gln Ser Gln Gly Lys Ser Val Phe Gln Tyr

420 425 430

Tyr Lys Leu Ile Asn Val Leu Trp Thr Leu Thr Pro Asn Pro Pro Thr

435 440 445

Gln Pro Glu Pro Gly Val Ser Ala Gln Val Pro Leu Ser Tyr Gly Pro

450 455 460

Phe Ile Ser Gln Gly Asn Val Pro Val Ala Asn Thr Thr Leu Glu Thr

465 470 475 480

Tyr Val Gln Gly Asp Asn Cys Asn Ala Cys His Gln Tyr Ala Thr Ile

485 490 495

Ala Gly Ser Ser Thr Leu Ala Ser Asp Phe Ser Phe Leu Phe Asn Ser

500 505 510

Ala Asp Ser Ala Ser Lys Asn Ser Leu Val Lys Arg Val Lys Ala Phe

515 520 525

Gln Thr Leu Lys Asp Gln Pro

530 535

<210> 76

<211> 256

<212> PRT

<213> 布氏假单胞菌

<400> 76

Met Gly Ser Ile Thr Asp His Asn Gln Leu Leu Ala Trp Val Ala Ser

1 5 10 15

Leu Asp Ile Pro Glu Ala Ser Gly Val Lys Thr Arg Ser Arg Asn Val

20 25 30

Val Ala Arg Ala Asn Ala Glu Asp Glu Gly Ala Ala Val Val Arg Gly

35 40 45

Ser Ile Thr Ser Phe Val Thr Gly Leu Ser Gln Gln Ala Arg Asp Asp

50 55 60

Val Gln Asn Ser Thr Leu Leu Met Gln Leu Ala Ala Asp Lys Lys Phe

65 70 75 80

Asn Pro Glu Lys Gln Arg Glu Glu Trp Phe Lys Phe Tyr Thr Asp Gly

85 90 95

Leu Ala Asn Leu Gly Trp Gly Arg Val Ser Ser Tyr Tyr Gln Ser Tyr

100 105 110

Gln Pro Arg Asn Thr Asn Val Thr Met Asp Gln Val Val Leu Glu Val

115 120 125

Ile Ala Ala Val Val Gly Ala Asp Ser Ala Val Tyr Lys Val Thr Glu

130 135 140

Lys Thr Phe Ser Ser Leu Gln Asp Asn Pro Lys Asn Gln Ala Pro Leu

145 150 155 160

Lys Leu Phe Asp Ser Ser Ser Thr Arg Asp Ser Val Gly Thr Phe Gln

165 170 175

Ile Leu Pro Val Met Gln Asp Arg Asp Gly Asn Val Val Met Val Leu

180 185 190

Thr Thr Val Asn Ala Ser Thr Thr Val Gln Arg Gly Ser Phe Leu Phe

195 200 205

Trp Ser Trp Ser Lys Thr Thr Ala Trp Met Tyr Arg Ala Ala Gln Gln

210 215 220

Thr Val Leu Asn Glu Ser Val Tyr Ala Thr Val Arg Gln Ser Val Ile

225 230 235 240

Lys Lys Leu Gly Lys Asn Ala Glu Glu Phe Ile Asp Asp Leu Glu Ile

245 250 255

<210> 77

<211> 260

<212> PRT

<213> 布氏假单胞菌

<400> 77

Met Lys Leu Ser Ala Asp Glu Val Tyr Val Ile Ser Gly Asn Leu Leu

1 5 10 15

Ser Ala Thr Pro Ser Leu Thr Asp Pro Thr Val Leu Glu Asp Ile Ala

20 25 30

Asn Ser Asn Leu Leu Cys Gln Leu Ala Ala Asp Lys Asn Gln Gly Thr

35 40 45

Arg Phe Ile Asp Pro Ala Ala Trp Leu Asp Phe Tyr Arg Ser Ser Leu

50 55 60

Gly Arg Leu Phe Trp Arg Ile Ser Asn Ser Gly Thr Val Ser Tyr Ala

65 70 75 80

Ile Pro Gln Leu Val His Lys Ile Thr Val Lys Glu Val Leu Glu Lys

85 90 95

Thr Phe Tyr Lys Thr Leu Asp Arg Pro Gln Arg Ile Arg Val Glu Glu

100 105 110

Ser Ile Glu Leu Leu Gly Glu Gln Ser Ala Asp Ser Pro Ser Ala Thr

115 120 125

Leu Tyr Ser Leu Lys Thr Gln Val Asn Phe Asn Glu Thr Thr Ser Ser

130 135 140

Pro Gly Leu Leu Pro His Ser Ile Ser Ser Val Asn Leu Gln Leu Ser

145 150 155 160

Val Val His Ser Glu Thr Cys Ile Ser Val Cys Ser Val Tyr Phe Lys

165 170 175

Thr Ser Thr Arg Ile Gly Asp Asp Val Phe Asn Gln Lys Phe Pro Val

180 185 190

Lys Glu Leu Leu Gly Asn Val Ser Val Ser Thr Phe Glu Ala Lys Leu

195 200 205

Leu Glu Ser Ser Tyr Ala Gly Ile Arg Gln Ser Ile Ile Asp Lys Leu

210 215 220

Gly Glu Asp Asn Ile Arg Glu Asn Ile Leu Leu Val Pro Ala Val Ser

225 230 235 240

Pro Ser Leu Ser Asn Thr Arg His Ala Gly Ala Leu Gln Phe Val Gln

245 250 255

Glu Leu Asp Ile

260

<210> 78

<211> 555

<212> PRT

<213> 霍氏假单胞菌

<400> 78

Met Ala Lys Leu Thr Gln Phe Ser Thr Pro Ala Asp Ile Gln Asp Phe

1 5 10 15

Ser Asp Ser Pro Ala Gln Gln Glu Arg Met Asn Ala Ala Trp Ser Gly

20 25 30

Asn Ile Asn Arg Trp Val Asn Ala Ala Leu Val Gly Asp Val Trp Asp

35 40 45

Leu Ile Asn Tyr Gly Pro Arg Pro Ala Phe Tyr Asn Pro Leu Asp Thr

50 55 60

Asp Thr Pro Ser Thr Ser Val Asn Ala Pro Ile Thr Trp Asn Ala Phe

65 70 75 80

Pro Gly Arg Ile Pro Ala Leu Phe Pro Asn Gln Ser Ala Asn Trp Leu

85 90 95

Gln Trp Ala Asp Gln Gly Val Pro Ala Asn Val Thr Thr Asn Leu Cys

100 105 110

Thr Gln Gln Ser Val Pro Pro Ala Pro Tyr Ser Pro Thr Gly Pro Arg

115 120 125

Gly Trp Gln Asp Glu Tyr Cys Glu Trp Ser Val Thr Arg Asn Ala Ala

130 135 140

Gly Gln Ile Thr Ser Val Met Phe Thr Cys Glu Asn Pro Glu Tyr Trp

145 150 155 160

Met Thr Leu Trp Gln Val Asp Pro Gly Lys Val Leu Gln Arg Tyr Gln

165 170 175

Gln Leu Ile Asn Pro Ala Val Gln Leu Ala Asp Leu Ser Leu Lys Asp

180 185 190

Ala Gln Gly Gln Thr Val Ile Asp Pro Val Thr Gly Ala Pro Cys Tyr

195 200 205

Asn Pro Leu Asn Lys Trp Asn Ser Gly Thr Gln Thr Leu Pro Gly Ser

210 215 220

Gly Gly Ala Met His Leu Thr Ser Ser Pro Asn Thr Leu Gly Ala Glu

225 230 235 240

Tyr Asp Leu Ala Ala Ala Ala Thr Met Pro Arg Glu Leu Asn Asn Glu

245 250 255

Pro Val Thr Ser Ala Ser Gln Leu Val Cys Tyr Ala Arg Tyr Gly Arg

260 265 270

Ile Gly Arg His Ser Asp Pro Thr Ile Gly Gln Asn Val Asn Gln Tyr

275 280 285

Val Asn Tyr Thr Ser Gly Leu Thr Glu Val Arg Ala Thr Leu Thr Asn

290 295 300

Pro Pro Gly Leu Tyr Ile Gln Thr Pro Asp Phe Ser Gly Tyr Thr Thr

305 310 315 320

Pro Asp Gly Ser Pro Ala Ala Ala Cys Trp Thr Ile Asn Arg Gly His

325 330 335

Leu Ala Gln Thr Ser Asp Asp Ile Asp Arg Ile Leu His Ala Thr Phe

340 345 350

Ser Val Pro Ala Gly Lys Asn Phe Thr Val Ser Asp Ile Ser Ile Asn

355 360 365

Gly Ala Lys Ile Gln Tyr Ala Ser Gln Ile Ala Gly Thr Ile Thr Met

370 375 380

Gly Leu Met Ala Thr Val Phe Gly Asn Ser Gly Val Thr Gln Gln Pro

385 390 395 400

Val Ala Gly Thr Leu Asp Ser Asp Asn Pro Ser Pro Ser Val Ser Ala

405 410 415

Leu Gln Pro Leu Ser Val Phe Asn Ala Tyr Arg Ala Gln Glu Leu Ala

420 425 430

Ser Asn Glu Gln Ala Leu Ser Ile Pro Ile Leu Ala Leu Ala Ile Arg

435 440 445

Pro Gly Gln Gln Val Asp Asn Ile Ala Leu Leu Leu Asn Thr Ser Gln

450 455 460

Thr Pro Asn Gly Ala Ser Phe Ser Val Val Glu Gly Gly Val Ser Ile

465 470 475 480

Ser Ile Thr Gly Thr Gln Asp Leu Pro Gly Leu Asp Met Ser Leu Tyr

485 490 495

Leu Val Ser Ile Ser Ala Asp Ala Asn Ala Ala Pro Gly Asp Arg Thr

500 505 510

Val Leu Ala Ser Val Pro Gly Met Ala Ser Thr Gln Gln Ala Ala Ile

515 520 525

Gly Leu Leu Thr Val Gly Gly Pro Thr Leu Val Thr Ser Gln Thr Gly

530 535 540

Pro Ser Lys Pro Asn Phe Arg Arg Gly Arg Gly

545 550 555

<210> 79

<211> 451

<212> PRT

<213> 霍氏假单胞菌

<400> 79

Met Arg Arg Arg Pro Thr Val Leu Leu Gly Leu Ala Leu Leu Leu Gly

1 5 10 15

Leu Pro Ala Thr Gln Ala Met Gly Ala Pro Leu Cys Gly Ser Pro Phe

20 25 30

Val Pro Ser Pro Thr Leu Gln Pro Thr Leu Ala Pro Pro Asn Phe Ser

35 40 45

Ala Ser Asp Ser Ala Val Asp Cys Phe Met Trp Gln Thr Met Val Tyr

50 55 60

Leu Asn Trp Pro Ala Thr Pro Gly Gln Arg Gly Val Pro Asn Ala Ala

65 70 75 80

Ala Ser Leu Gly Ser Pro Gly Pro Ser Val Trp Gln Thr Tyr Lys Asp

85 90 95

Tyr Asn Glu Leu Tyr Leu Pro Asn Gly Gln Gln Pro Pro Ala Trp Asn

100 105 110

Asp Asn Phe Leu Ser Val Gln Arg Leu Gln Thr Arg Gly Val Ala Arg

115 120 125

Ala Leu Pro Ser Ile Arg Leu Leu Asn Ser Thr Ser Lys Val Phe Arg

130 135 140

Ala Ala Asn Ala Asn Glu Ser Pro Ala Leu Arg Glu Ile Glu Gln Val

145 150 155 160

Gly Gly Gly Val Leu Tyr Asp Gln Ala Gly Ser Pro Val Tyr Tyr Glu

165 170 175

Met Leu Val Asn Glu Val Asn Phe Asp Phe Ile Tyr Asn Asn Gln Leu

180 185 190

Tyr Asn Pro Ala Gln Gln Asn Leu Tyr Ala Lys Gln Lys Gly Ile Val

195 200 205

Leu Pro Asn Asn Ser Ile Glu Ile Lys Ala Ala Trp Lys Val Leu Ser

210 215 220

Asp Pro Asp Asn Pro Gln Arg Phe Leu Thr Ala Gln Ala Leu Leu Pro

225 230 235 240

Gly Ser Ser Thr Pro Val Thr Val Gly Leu Val Gly Leu His Val Phe

245 250 255

Gln Met Pro Ser Ser Ala Phe Asn Gln Gly Phe Trp Ala Thr Phe Gln

260 265 270

Gln Leu Asp Asn Ala Pro Thr Val Ala Gly Ala Thr Pro Gly Ala His

275 280 285

Tyr Ser Phe Asn Asn Pro Gln Cys Ala Pro Ala Gln Cys Pro Pro Asn

290 295 300

Asp Lys Thr Ser Asn Pro Thr Gln Val Val Gln Asn Phe Pro Pro Thr

305 310 315 320

Pro Glu Ala Gln Asn Ile Asn His Tyr Met Gln Asn Leu Ile Ala Gln

325 330 335

Gln Ala Pro Gly Ser Ala Leu Gln Tyr Tyr Gln Leu Val Asp Val Gln

340 345 350

Trp Pro Thr Ser Pro Gln Ala Ile Gly Gln Pro Gly Ala Thr Ala Pro

355 360 365

Ala Pro Ser Gly Thr Pro Asn His Asp Thr Leu Ile Asn Pro Val Leu

370 375 380

Glu Thr Phe Leu Gln Ala Asn His Lys Ser Cys Leu Gly Cys His Val

385 390 395 400

Tyr Ala Ser Val Ala Ala Asp Gly Ser Asn Pro Pro Thr His Tyr Gln

405 410 415

Ala Ser Phe Ser Phe Leu Leu Gly His Ala Lys Ser Pro Ala Leu Gly

420 425 430

Ser Asn Leu Lys Ser Leu Ala Gln Gln Ile Glu Asp Ala Ser Leu Ser

435 440 445

Leu Gln His

450

<210> 80

<211> 96

<212> PRT

<213> 南极假单胞菌

<400> 80

Met Lys Leu Ser Asn Val Leu Leu Leu Ser Ile Val Phe Ala Trp Gln

1 5 10 15

Gly Met Ala Phe Ala Asp Thr Gln Lys Ser Asn Ala Glu Thr Leu Leu

20 25 30

Ser Asn Asp Lys Pro Pro Leu Thr Gln Ala Ala Gln Glu Lys Glu Gln

35 40 45

Glu Asn Val Glu Ala Asp Arg Asn Glu Cys Trp Ser Ala Lys Asn Cys

50 55 60

Ser Gly Lys Ile Leu Asn Asn Lys Asp Ala His Asn Cys Lys Leu Ser

65 70 75 80

Gly Gly Lys Ser Trp Arg Ser Lys Thr Thr Gly Gln Cys Thr Asn Leu

85 90 95

<210> 81

<211> 89

<212> PRT

<213> 绿针假单胞菌

<400> 81

Met Ser Ala Gln Glu Asn Phe Val Gly Gly Trp Thr Pro Tyr His Lys

1 5 10 15

Leu Thr Pro Lys Asp Gln Glu Val Phe Lys Glu Ala Leu Ala Gly Phe

20 25 30

Val Gly Val Gln Tyr Thr Pro Glu Leu Val Ser Thr Gln Val Val Asn

35 40 45

Gly Thr Asn Tyr Arg Tyr Gln Ser Lys Ala Thr Leu Pro Gly Ser Ser

50 55 60

Glu Ser Trp Gln Ala Val Val Glu Ile Tyr Ala Pro Ile Lys Gly Lys

65 70 75 80

Pro His Ile Thr Gln Ile His Arg Ile

85

<210> 82

<211> 295

<212> PRT

<213> 恶臭假单胞菌

<400> 82

Met His Ala Pro Gly Ala Ile Pro Ser Glu Lys Glu Ser Ala His Ala

1 5 10 15

Trp Leu Thr Glu Thr Lys Ala Asn Ala Lys Ser Thr Ala Leu Arg Gly

20 25 30

Asn Ile Phe Ala Gln Asp Tyr Asn Arg Gln Leu Leu Thr Ala Thr Gly

35 40 45

Gln Ser Met Arg Ser Gly Ala Asp Ala Ile Asn Pro Phe Phe Ser Pro

50 55 60

Ala Lys Gly Thr Ala Thr Gly Ser Tyr Ala Lys Asp Ala Asp Ala Asn

65 70 75 80

Val Ser Pro Gly Ser Ala Pro Val Ser Ile Tyr Glu Gly Leu Gln Thr

85 90 95

Ala Ile Asp Ile Ala Arg Arg Arg Ser Gly Tyr Asn Pro Leu Asp Gln

100 105 110

Pro Thr Asp Gln Lys Pro Lys Ser Ala Gly Asp Arg Glu His Phe Ile

115 120 125

Ala Phe Thr Gln Gln Ile Ala Glu Ile Pro Phe Leu Ser Leu Leu Ala

130 135 140

Ala Gln Val Thr Gln Ile Gln Gln Lys Ser His Asp Ala Asn Ala Leu

145 150 155 160

Val Asp Ser Phe Val Lys Gly Phe Ile Gly Leu Lys Asn Gln Asp Val

165 170 175

Glu Gln Ile Lys Gln Ser Leu Ser Ser Leu Val Asn Ala Ala Leu Ser

180 185 190

Tyr Ser Glu Gln Thr Glu Arg Gln Ser Asn Phe Asn Gln Asn Ile Leu

195 200 205

Gln Thr Gly Asp Ser Gly Ser Val Asn Phe Met Leu Tyr Ala Ser Glu

210 215 220

Phe Thr Ile Lys Ala Ser Ser His Lys Gly Thr Ile Thr Phe Gln Ser

225 230 235 240

Ser Tyr Thr Leu Ser Gln Ala Ile Tyr Gln Leu Ser Val Glu Ser Trp

245 250 255

Asn Asn Val Lys Asp Val Phe Ser Lys Gln Gln Lys Thr Asp Thr Gln

260 265 270

Gln Trp Leu Gly Asp Thr Thr Thr Gln Val Arg Glu Gly Ser Lys Leu

275 280 285

Arg Ala Ile Cys Leu Val Ser

290 295

<210> 83

<211> 295

<212> PRT

<213> 恶臭假单胞菌

<400> 83

Met Asn Ala Pro Gly Ala Ala Pro Ser Glu Lys Glu Val Ala His Ala

1 5 10 15

Trp Leu Glu Gly Lys Ala Arg Val Lys Ser Thr Thr Ala His Gly Asn

20 25 30

Ile Phe Ala His Asp Tyr Asn His Pro His Gln Leu Thr Ser Thr Gly

35 40 45

Arg Ala Met Arg Thr Gly Ala Asp Ala Ile Asn Pro Phe Phe Ser Pro

50 55 60

Ala Ala Gly Ala Ala Thr Asp Ser Tyr Ala Asn Asp Ala Asn Lys Asn

65 70 75 80

Val Ser Pro Gly Lys Ala Pro Val Ser Ile Tyr Glu Gly Leu Gln Thr

85 90 95

Ala Ile Asp Ile Ala Arg Arg Arg Ser Glu Tyr Asn Pro Leu Asp Gln

100 105 110

Pro Thr Asp Gln Arg Pro Lys Ala Lys Gly Asp Arg Glu His Phe Ile

115 120 125

Ala Phe Thr Gln Gln Ile Ala Glu Ile Pro Phe Leu Ser Leu Leu Ala

130 135 140

Ala Gln Val Thr Gln Ile Gln Gln Lys Ser His Asp Ala Asn Ala Leu

145 150 155 160

Ile Asp Ser Phe Val Lys Gly Phe Ile Gly Leu Ala Ala Lys Asp Val

165 170 175

Glu Gln Ile Lys Lys Ser Leu Ser Ser Leu Val Asn Ala Ala Leu Ser

180 185 190

Tyr Ser Glu Gln Thr Glu Arg Gln Ser Asn Phe Asn Gln Asn Ile Leu

195 200 205

Gln Thr Gly Ile Ala Gly Ser Val Asn Phe Met Leu Tyr Ala Ser Glu

210 215 220

Phe Thr Ile Lys Ala Thr Ser Lys Lys Gly Thr Ile Thr Phe Gln Ser

225 230 235 240

Ser Tyr Thr Leu Ser Gln Ala Val Tyr Gln Leu Ser Val Glu Ser Trp

245 250 255

Glu Asn Val Arg Asp Val Phe Ala Lys Gln Gln Lys Thr Asp Thr Gln

260 265 270

Gln Trp Leu Gly Asp Thr Thr Thr Pro Val Lys Pro Gly Ser Ser Leu

275 280 285

Arg Ala Ile Cys Leu Val Ser

290 295

<210> 84

<211> 291

<212> PRT

<213> 黄褐假单胞菌

<400> 84

Met His Ala Pro Thr Val Lys Glu Leu Ala His Ala Trp Leu Thr Glu

1 5 10 15

Thr Thr Ala Lys Ala Asn Ser Thr Ile Val Arg Gly Asn Ile Phe Ala

20 25 30

His Glu Tyr Asn His Gln Leu Leu Thr Pro Thr Gly Leu Ser Met Arg

35 40 45

Ser Gly Ala Asp Ala Ile Asn Pro Phe Tyr Ser Pro Ala Ser Gly Ala

50 55 60

Ala Thr Asp Ser Tyr Ala Lys Asp Ala Asn Asn Asn Val Ser Pro Gly

65 70 75 80

Ser Ala Pro Val Ser Ile Tyr Glu Gly Leu Gln Thr Ser Ile Asp Ile

85 90 95

Ala Arg Arg Arg Ser Gly Tyr Asn Pro Leu Asp Gln Pro Thr Asp Gln

100 105 110

Lys Pro Lys Ala Ala Gly Asp Arg Glu His Phe Ile Ala Phe Thr Gln

115 120 125

Gln Ile Ala Asn Ile Pro Phe Leu Ser Leu Leu Ala Ala Gln Val Thr

130 135 140

Gln Ile Gln Gln Lys Ser His Asp Ala Asn Ala Leu Val Asp Ser Phe

145 150 155 160

Val Lys Gly Phe Ile Gly Leu Lys Asn Gln Asp Val Glu Gln Ile Lys

165 170 175

Gln Ser Leu Ser Ser Leu Val Asn Ala Ala Leu Ser Tyr Ser Glu Gln

180 185 190

Thr Glu Arg Gln Ser Asn Phe Asn Gln Asn Ile Leu Gln Thr Gly Asn

195 200 205

Gly Gly Ser Val Asn Phe Met Leu Tyr Ala Ser Glu Phe Thr Ile Lys

210 215 220

Ala Ser Ser His Lys Gly Thr Ile Thr Phe Gln Ser Ser Tyr Thr Leu

225 230 235 240

Ser Gln Ala Ile Tyr Gln Leu Ser Val Glu Ser Trp Asn Asn Val Lys

245 250 255

Asp Thr Phe Ser Lys Gln Gln Lys Thr Asp Thr Glu Gln Trp Leu Asp

260 265 270

Asp Thr Thr Thr Pro Val Lys Glu Gly Ser Lys Leu Arg Ala Ile Cys

275 280 285

Leu Val Gly

290

<210> 85

<211> 295

<212> PRT

<213> 绿针假单胞菌

<400> 85

Met Ser Thr Gln Asn His Lys His Ile Thr Glu Lys Thr Leu Ala Trp

1 5 10 15

Leu Asn Thr Thr His Glu Ser Asn Lys Leu Ser Thr Gln Thr Asn Pro

20 25 30

Asn Ile Phe Val Leu Asp Arg Ser Arg Ser Ser Phe Ser Glu Ser Leu

35 40 45

Leu Thr Pro Gly Ser Arg Ala Asp Ile Ala Asn Pro Phe Phe Ala Pro

50 55 60

Ala Gly Ser Leu Ala Thr Ala Arg Tyr Leu Gln Ala Ala Asn Asn Asn

65 70 75 80

Ala Ser Ser Gly Ser Ala Pro Thr Ser Leu Gln Asp Gly Leu Gln Thr

85 90 95

Cys Val Asn Met Ala Arg Thr Arg Ser Gly Trp Asn Pro Asn Asp Pro

100 105 110

Pro Thr Ala Ala Asn Pro His Thr Thr Gly Asp Tyr Glu His Phe Ile

115 120 125

Ser Phe Thr Lys Glu Ile Ser Arg Ile Pro Phe Leu Thr Leu Glu Ser

130 135 140

Ala Ser Ser Ser Leu Val Met Gln Gln Ser His Asn Ala Asp Asp Leu

145 150 155 160

Ile Asn Ser Phe Ala Asn Gly Phe His Gly Leu Glu Thr Ala Asp Ile

165 170 175

Glu Glu Thr Lys Arg Gly Leu Lys Glu Leu Val Lys Ala Ala Leu Ser

180 185 190

Glu Cys Glu Lys Thr Asn Arg Glu Ser Phe Phe Asn Gln His Thr Leu

195 200 205

Gln Gln Lys Asp Asp Thr Ala Ile Tyr Leu Ile Tyr Ser Ser Thr Phe

210 215 220

Ser Ile Val Ala Thr Asp Gln Lys Gly Thr Ile Asn Phe Gln Ser Ser

225 230 235 240

Tyr Leu Leu Thr Gln Ser Lys Tyr Thr Leu Ser Asn Ala Thr Trp Asp

245 250 255

Arg Ile Lys Asp Leu Phe Tyr Asp Gln Gln Lys Thr Asp Thr Asn Thr

260 265 270

Trp Leu Asn Gly Met Lys Thr Leu Pro Arg Ala Gly Ser Thr Ala Arg

275 280 285

Ala Thr Cys Leu Glu Gly Gln

290 295

<210> 86

<211> 86

<212> PRT

<213> 绿针假单胞菌

<400> 86

Met Gly Ile Thr Val Thr Asn Asn Ser Ser Asn Pro Ile Glu Val Ala

1 5 10 15

Ile Asn His Trp Gly Ser Asp Gly Asp Thr Ser Phe Phe Ser Val Gly

20 25 30

Asn Gly Lys Gln Glu Thr Trp Asp Arg Ser Asp Ser Arg Gly Phe Val

35 40 45

Leu Ser Leu Lys Lys Asn Gly Ala Gln His Pro Tyr Tyr Val Gln Ala

50 55 60

Ser Ser Lys Ile Glu Val Asp Asn Asn Ala Val Lys Asp Gln Gly Arg

65 70 75 80

Leu Ile Glu Pro Leu Ser

85

<210> 87

<211> 271

<212> PRT

<213> 喜昆虫假单胞菌

<400> 87

Met Thr Ile Lys Glu Glu Leu Gly Gln Pro Gln Ser His Ser Ile Glu

1 5 10 15

Leu Asp Glu Val Ser Lys Glu Ala Ala Ser Thr Arg Ala Ala Leu Thr

20 25 30

Ser Asn Leu Ser Gly Arg Phe Asp Gln Tyr Pro Thr Lys Lys Gly Asp

35 40 45

Phe Ala Ile Asp Gly Tyr Leu Leu Asp Tyr Ser Ser Pro Lys Gln Gly

50 55 60

Cys Trp Val Asp Gly Ile Thr Val Tyr Gly Asp Ile Tyr Ile Gly Lys

65 70 75 80

Gln Asn Trp Gly Thr Tyr Thr Arg Pro Val Phe Ala Tyr Leu Gln Tyr

85 90 95

Val Glu Thr Ile Ser Ile Pro Gln Asn Val Thr Thr Thr Leu Ser Tyr

100 105 110

Gln Leu Thr Lys Gly His Thr Arg Ser Phe Glu Thr Ser Val Asn Ala

115 120 125

Lys Tyr Ser Val Gly Ala Asn Ile Asp Ile Val Asn Val Gly Ser Glu

130 135 140

Ile Ser Thr Gly Phe Thr Arg Ser Glu Ser Trp Ser Thr Thr Gln Ser

145 150 155 160

Phe Thr Asp Thr Thr Glu Met Lys Gly Pro Gly Thr Phe Val Ile Tyr

165 170 175

Gln Val Val Leu Val Tyr Ala His Asn Ala Thr Ser Ala Gly Arg Gln

180 185 190

Asn Ala Asn Ala Phe Ala Tyr Ser Lys Thr Gln Ala Val Gly Ser Arg

195 200 205

Val Asp Leu Tyr Tyr Leu Ser Ala Ile Thr Gln Arg Lys Arg Val Ile

210 215 220

Val Pro Ser Ser Asn Ala Val Thr Pro Leu Asp Trp Asp Thr Val Gln

225 230 235 240

Arg Asn Val Leu Met Glu Asn Tyr Asn Pro Gly Ser Asn Ser Gly His

245 250 255

Phe Ser Phe Asp Trp Ser Ala Tyr Asn Asp Pro His Arg Arg Tyr

260 265 270

237页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:突变β-葡萄糖苷酶

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!