杀昆虫蛋白及其使用方法

文档序号:620847 发布日期:2021-05-07 浏览:8次 >En<

阅读说明:本技术 杀昆虫蛋白及其使用方法 (Insecticidal proteins and methods of use thereof ) 是由 D·J·阿尔捷 J·K·巴里 C·巴索罗梅 董华 R·M·盖尔伯 J·吉利亚姆 S·D· 于 2019-09-10 设计创作,主要内容包括:本发明提供了用于防治有害生物的组合物和方法。所述方法涉及用编码杀昆虫蛋白的核酸序列来转化生物体。特别地,所述核酸序列可用于制备具有杀昆虫活性的植物和微生物。因此,提供了经转化的细菌、植物、植物细胞、植物组织以及种子。组合物是细菌物种的杀昆虫核酸和蛋白。所述序列可用于构建随后转化到包括植物在内的目的生物体中的表达载体,作为用于分离其他同源(或部分同源的)基因的探针。所述杀有害生物蛋白可用于控制鳞翅目、鞘翅目、双翅目、真菌、半翅目和线虫有害生物群体,抑制其生长或将其杀灭,并且可用于生产具有杀昆虫活性的组合物。(The present invention provides compositions and methods for controlling pests. The methods involve transforming organisms with nucleic acid sequences encoding insecticidal proteins. In particular, the nucleic acid sequences are useful for the preparation of plants and microorganisms having insecticidal activity. Thus, transformed bacteria, plants, plant cells, plant tissues, and seeds are provided. The compositions are insecticidal nucleic acids and proteins of bacterial species. The sequences can be used to construct expression vectors for subsequent transformation into organisms of interest, including plants, as probes for the isolation of other homologous (or partially homologous) genes. The pesticidal proteins are useful for controlling, inhibiting the growth of, or killing lepidopteran, coleopteran, dipteran, fungal, hemipteran, and nematode pest populations, and for producing compositions having insecticidal activity.)

杀昆虫蛋白及其使用方法

以电子方式递交的序列表的引用

该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交,文件名为“6456WOPCT_SequenceListing”,创建于2019年9月10日,且具有1,557千字节大小,并与本说明书同时提交。包含在所述ASCII格式的文件中的序列表是本说明书的一部分并且通过引用以其整体并入本文。

技术领域

本公开涉及分子生物学领域。提供了编码杀有害生物蛋白的新颖基因。这些杀有害生物蛋白和编码它们的核酸序列可用于制备杀有害生物制剂和生产有害生物抗性转基因植物。

背景技术

使用微生物剂(如真菌、细菌或其他昆虫物种)对具有农业意义的昆虫有害生物进行生物控制,为合成型化学杀有害生物剂提供了环境友好且有商业吸引力的替代方案。使用生物杀有害生物剂造成污染和环境危害的风险较低,并且生物杀有害生物剂提供比传统广谱化学杀昆虫剂所特有的靶特异性更强的靶特异性。另外,生物杀有害生物剂往往生产成本较低,并且因此能提高各种作物的经济产量。

已知芽孢杆菌属(Bacillus)微生物的某些物种对一系列昆虫有害生物具有杀有害生物活性,所述昆虫有害生物包括鳞翅目(Lepidoptera)、双翅目(Diptera)、鞘翅目(Coleoptera)、半翅目(Hemiptera)等。苏云金芽孢杆菌(Bacillus thuringiensis,Bt)和日本金龟子芽孢杆菌(Bacillus popilliae)是迄今为止发现的最成功的生物控制剂。昆虫致病性还归因于幼虫芽孢杆菌(B.larvae)、缓病芽孢杆菌(B.lentimorbus)、球形芽孢杆菌(B.sphaericus)和蜡状芽孢杆菌(B.cereus)的菌株。微生物杀昆虫剂,特别是从芽孢杆菌属菌株获得的那些微生物杀昆虫剂,作为有害生物化学控制的替代品在农业上起着重要作用。

通过将作物植物进行遗传工程改造以从芽孢杆菌属产生杀有害生物蛋白,已经开发出抗昆虫增强的作物植物。例如,已经对玉米和棉花植物进行遗传工程改造以产生从苏云金芽孢杆菌菌株分离的杀有害生物蛋白。现在,这些经遗传工程改造的作物广泛应用于农业中,并且为农民提供了取代传统昆虫控制方法的环境友好型替代方案。虽然它们已被证明在商业上非常成功,但是这些经遗传工程改造的抗昆虫作物植物仅针对窄范围的经济上重要的昆虫有害生物提供抗性。在一些情况下,昆虫可以对不同杀昆虫化合物产生抗性,这就导致需要鉴定用于有害生物控制的替代性生物控制剂。

因此,仍然需要对昆虫有害生物具有不同范围的杀昆虫活性的新杀有害生物蛋白,例如针对鳞翅目和鞘翅目中的各种昆虫具有活性的杀昆虫蛋白,所述昆虫包括但不限于已对现存杀昆虫剂产生抗性的昆虫有害生物。

发明内容

在一个方面,提供了用于对细菌、植物、植物细胞、组织以及种子赋予杀有害生物活性的组合物和方法。组合物包括杀有害生物和杀昆虫多肽的核酸分子编码序列、包含那些核酸分子的载体、以及包含所述载体的宿主细胞。组合物还包括所述杀有害生物多肽序列以及针对那些多肽的抗体。组合物还包含经转化的细菌、植物、植物细胞、组织以及种子。

在另一方面,提供了编码IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽、和IPD112多肽的分离的或重组的核酸分子,所述多肽包括氨基酸取代、缺失、插入、及其杀昆虫活性部分。还涵盖了与实施例的核酸序列互补或与实施例的序列杂交的核酸序列。所述核酸序列可以在DNA构建体或表达盒中使用,以用于在多种生物体(包括微生物和植物)中进行转化和表达。所述核苷酸或氨基酸序列可以是合成序列,所述合成序列已经被设计用于在生物体中表达,所述生物体包括但不限于:微生物或植物。

在另一方面,涵盖了IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽、和IPD112多肽。还提供了分离的或重组的IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽、和IPD112多肽,以及提供了氨基酸取代、缺失、插入、其杀昆虫活性部分及其组合。

在另一方面,提供了用于生产多肽和使用那些多肽用来防治或杀灭鳞翅目、鞘翅目、线虫、真菌、和/或双翅目有害生物的方法。实施例的转基因植物表达本文公开的杀有害生物序列中的一种或多种。在不同实施例中,所述转基因植物进一步包含一种或多种另外的抗昆虫基因,例如,用于控制鞘翅目、鳞翅目、半翅目或线虫有害生物的一种或多种另外的基因。本领域技术人员将理解,所述转基因植物可以包含赋予目的农艺性状的任何基因。

在另一方面,还包括用于在样品中检测实施例的核酸和多肽的方法。提供了用于在样品中检测本公开的多肽的存在或检测编码本公开的多肽的多核苷酸的存在的试剂盒。所述试剂盒可以与实施预期试剂检测的方法所需的所有试剂和对照样品,以及使用说明书一起提供。

在另一方面,实施例的组合物和方法可用于产生具有增强的有害生物抗性或耐受性的生物体。这些生物体以及包含所述生物体的组合物对于农业目的是所希望的。实施例的组合物还可用于产生具有杀有害生物活性的经改变或改进的蛋白质,或用于检测本公开的多肽的存在。

附图说明

图1A-1B显示了使用Vector套件的模块,IPD092-1Aa多肽(SEQID NO:1)、IPD092-1Ab多肽(SEQ ID NO:3)、IPD092-1Ba多肽(SEQ ID NO:5)、IPD092-1Bb多肽(SEQ ID NO:7)、IPD092-1Ca多肽(SEQ ID NO:9)、IPD092-1Cb多肽(SEQ ID NO:11)、IPD092-1Da多肽(SEQ ID NO:13)、IPD092-1Db多肽(SEQ ID NO:15)、IPD092-1Ea多肽(SEQID NO:17)、IPD092-1Eb多肽(SEQ ID NO:19)、IPD092-1Fa多肽(SEQ ID NO:22)、IPD092-1Fb多肽(SEQ ID NO:24)和IPD092-1Fc多肽(SEQ ID NO:26)的氨基酸序列比对。突出显示了氨基酸序列之间的氨基酸序列多样性。

图2A-2B显示了使用Vector套件的模块,IPD092-2Aa多肽(SEQID NO:2)、IPD092-2Ab多肽(SEQ ID NO:4)、IPD092-2Ba多肽(SEQ ID NO:6)、IPD092-2Bb多肽(SEQ ID NO:8)、IPD092-2Ca多肽(SEQ ID NO:10)、IPD092-2Cb多肽(SEQ ID NO:12)、IPD092-2Da多肽(SEQ ID NO:14)、IPD092-2Db多肽(SEQ ID NO:16)、IPD092-2Ea多肽(SEQID NO:18)、IPD092-2Eb多肽(SEQ ID NO:20)、IPD092-2Ec多肽(SEQ ID NO:21)、IPD092-2Fa多肽(SEQ ID NO:23)、IPD092Fb-2多肽(SEQ ID NO:25)的氨基酸序列比对。突出显示了氨基酸序列之间的氨基酸序列多样性。

具体实施方式

应理解,本公开不局限于所描述的方法、方案、细胞系、属、以及试剂,因此可以变化。还应当理解的是本文所使用的术语是仅为了描述实施例的目的,并且不旨在限制本公开的范围。

如本文所用的,单数形式“一个/种(a/an)”以及“所述(the)”包括复数个指示物,除非上下文中另有明确指明。因此,例如,提及“一个/种细胞”包括多个此类细胞,并且提及“所述蛋白质”包括提及一种或多种蛋白质及其等同物。本文所用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解相同的含义,除非另有明确说明。

本公开涉及用于控制有害生物的组合物和方法。所述方法涉及用编码IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽、和IPD112多肽的核酸序列转化生物体。实施例的核酸序列可用于制备具有杀有害生物活性的植物和微生物。因此,提供了经转化的细菌、植物、植物细胞、植物组织以及种子。所述组合物包括细菌物种的杀有害生物核酸和蛋白。所述核酸序列可用于构建用于随后转化到目的生物体中的表达载体,作为用于分离其他同源(或部分同源)基因的探针,并且用于通过多种方法(例如定向诱变、结构域交换或DNA改组)产生改变的IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽、和IPD112多肽。IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽、和IPD112多肽可用于控制或杀灭鳞翅目、鞘翅目、双翅目、真菌、半翅目和线虫有害生物群体,并且可用于生产具有杀有害生物活性的组合物。目的昆虫有害生物包括但不限于:鳞翅目物种,所述鳞翅目物种包括但不限于:玉米穗蛾(CEW)(谷实夜蛾)、欧洲玉米螟(European Corn Borer)(ECB)(玉米螟(Ostrinia nubialis)),小菜蛾(diamond-backmoth),例如玉米穗虫(Helicoverpa zea Boddie);大豆夜蛾(soybean looper),例如大豆尺夜蛾(Pseudoplusia includens Walker);以及黎豆夜蛾(velvet bean caterpillar),例如梨豆夜蛾(Anticarsia gemmatalis Hübner);以及鞘翅目物种,所述鞘翅目物种包括但不限于:西方玉米根虫(Western corn rootworm)(玉米根萤叶甲(Diabroticavirgifera))-WCRW、南方玉米根虫(Southern corn rootworm)(斑点黄瓜甲虫(Diabroticaundecimpunctata howardi))-SCRW、和北方玉米根虫(Northern corn rootworm)(北方玉米根虫(Diabrotica barberi))-NCRW。

本文所用的“杀有害生物蛋白”或“杀昆虫蛋白”是指毒素或与这种蛋白质具有同源性的蛋白质,所述毒素具有针对以下一种或多种有害生物的毒性活性,所述有害生物包括但不限于:鳞翅目、双翅目、半翅目以及鞘翅目或线虫门的成员。已经从生物体中分离出杀有害生物蛋白,所述生物体包括例如,芽孢杆菌属物种、假单胞菌属(Pseudomonas)物种、发光杆菌属(Photorhabdus)物种、致病杆菌属(Xenorhabdus)物种、双酶梭菌(Clostridiumbifermentans)、和鲍比氏类芽孢杆菌(Paenibacillus popilliae)。

在一些实施例中,本公开的多肽包括从本文公开的全长核酸序列推导出的氨基酸序列和短于全长序列的氨基酸序列,这是由于使用替代的下游起始位点或由于产生具有杀有害生物活性的较短蛋白质的加工。加工可以在表达所述蛋白质的生物体内或在摄取所述蛋白质后的有害生物中发生。

因此,本文提供了赋予杀有害生物活性的新颖的分离或重组的核酸序列。还提供了本公开的多肽的氨基酸序列。由这些编码本公开的多肽的基因的翻译而产生的蛋白质允许细胞控制或杀灭摄取了该蛋白质的有害生物。

IPD092-1和IPD092-2蛋白及其变体和片段

本公开涵盖了IPD092-1和IPD092-2多肽。如本文中可互换地使用的“IPD092-1多肽”和“IPD092-1蛋白”是指具有杀昆虫活性的多肽(其与IPD092-2多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW)),并且与SEQID NO:1的IPD092-1多肽充分同源。考虑了多种IPD092-1多肽同源物。IPD092-1多肽同源物或相关蛋白的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、色杆菌属(Chromobacterium)物种、伯克霍尔德菌属(Burkholderia)物种、和木洞菌属(Woodsholea)物种的细菌物种。IPD092-1多肽同源物的氨基酸序列的比对(例如-图1A-1B)允许鉴定该家族中的天然同源物之间高度保守的残基。

本文所用的“充分同源”是指,使用标准参数、使用本文所述的比对程序之一,与参比序列相比,具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大序列同源性的氨基酸序列。在一些实施例中,所述序列同源性针对IPD092-1多肽的全长序列。在一些实施例中,所述IPD092-1多肽与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ IDNO:22、SEQ ID NO:24或SEQ ID NO:26相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。在本文中与序列同一性百分比一起使用时,术语“约”意指+/-0.5%。本领域技术人员将认识到,考虑到氨基酸相似性等,可以适当地调整这些值以确定蛋白质的相应同源性。在一些实施例中,使用ClustalW算法在Vector程序套件(英杰公司(Invitrogen Corporation),卡尔斯巴德市(Carlsbad),加利福尼亚州(Calif.))的模块中在所有默认参数下计算所述序列同一性。在一些实施例中,使用ClustalW算法在Vector程序套件(英杰公司,卡尔斯巴德市,加利福尼亚州)的模块中在所有默认参数下计算跨全长多肽的序列同一性。

在一些实施例中,所述IPD092-1多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:24或SEQ ID NO:26。

在一些实施例中,使用ClustalW算法在程序套件(英杰公司,卡尔斯巴德市,加利福尼亚州)的模块中在所有默认参数下计算跨全长多肽的序列同一性。

在一些实施例中,IPD092-1多肽包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:24或SEQ ID NO:26的氨基酸序列,其与在SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:24或SEQ IDNO:26的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95或更多个氨基酸取代。

在一些实施例中,IPD092-1多肽包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:24或SEQ ID NO:26的氨基酸序列。

如本文中可互换地使用的“IPD092-2多肽”和“IPD092-2蛋白”是指具有杀昆虫活性的多肽(其与IPD092-1多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW)),并且与SEQ ID NO:2的IPD092-2多肽充分同源。考虑了多种IPD092-2多肽同源物。IPD092-2多肽同源物或相关蛋白的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、色杆菌属(Chromobacterium)物种、伯克霍尔德菌属(Burkholderia)物种、和木洞菌属(Woodsholea)物种的细菌物种。IPD092-2多肽同源物的氨基酸序列的比对(例如-图2A-2B)允许鉴定该家族中的天然同源物之间高度保守的残基。

在一些实施例中,所述序列同源性针对IPD092-2多肽的全长序列。在一些实施例中,所述IPD092-2多肽与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:23或SEQ ID NO:25相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大序列同一性。

在一些实施例中,所述IPD092-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25。

在一些实施例中,IPD092-2多肽包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25的氨基酸序列,其与在SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23或SEQ IDNO:25的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,IPD092-2多肽包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25的氨基酸序列。

IPD095-1和IPD095-2蛋白及其变体和片段

本公开涵盖了IPD095-1和IPD095-2多肽。如本文中可互换地使用的“IPD095-1多肽”和“IPD095-1蛋白”是指具有杀昆虫活性的多肽,与IPD095-2多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ IDNO:27的IPD095-1多肽充分同源。考虑了多种IPD095-1多肽同源物。IPD095-1多肽同源物或相关蛋白的来源包括选自但不限于沙雷氏菌属(Serratia)物种、勒米诺菌属(Leminorella)物种、迪基氏菌属(Dickeya)物种、肠杆菌属(Enterobacter)物种、欧文菌属(Erwinia)物种、耶尔森菌属(Yersinia)物种、和拉恩氏菌属(Rahnella)物种的细菌物种。IPD095-1多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD095-1同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述IPD095-1多肽与SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,所述序列同源性针对IPD095-1多肽的全长序列。在一些实施例中,IPD095-1多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57或SEQ ID NO:58。

在一些实施例中,所述IPD095-1多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ IDNO:51、SEQ ID NO:54、SEQ ID NO:56或SEQ ID NO:57。

在一些实施例中,IPD095-1多肽包含SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的氨基酸序列,相比于在SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ IDNO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57或SEQ ID NO:58的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或更多个氨基酸取代。

在一些实施例中,IPD095-1多肽包含SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的氨基酸序列。

在一些实施例中,IPD095-1多肽包含SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:54、SEQ IDNO:56或SEQ ID NO:57的氨基酸序列。

如本文中可互换地使用的“IPD095-2多肽”和“IPD095-2蛋白”是指具有杀昆虫活性的多肽,与IPD095-1多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ ID NO:28的IPD095-2多肽充分同源。考虑了多种IPD095-2多肽同源物。IPD095-2多肽同源物或相关蛋白的来源包括选自但不限于沙雷氏菌属(Serratia)物种、勒米诺菌属(Leminorella)物种、迪基氏菌属(Dickeya)物种、肠杆菌属(Enterobacter)物种、欧文菌属(Erwinia)物种、耶尔森菌属(Yersinia)物种、和拉恩氏菌属(Rahnella)物种的细菌物种。IPD095-2多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD095-2同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD095-2多肽的全长序列。在一些实施例中,所述IPD095-2多肽与SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:97、SEQID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQID NO:109、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119或SEQ ID NO:120相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD095-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:90、SEQID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ IDNO:108、SEQ ID NO:109、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ IDNO:119或SEQ ID NO:120。

在一些实施例中,IPD095-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:28、SEQ IDNO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:82、SEQ IDNO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:94、SEQ ID NO:95、SEQ IDNO:96、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:103、SEQ ID NO:107、SEQID NO:119或SEQ ID NO:120。

在一些实施例中,IPD095-2多肽包含SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ IDNO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ IDNO:78、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ IDNO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ IDNO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ IDNO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101、SEQID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119或SEQ ID NO:120的氨基酸序列,相比于在SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ IDNO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ IDNO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ IDNO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ IDNO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ IDNO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ IDNO:95、SEQ ID NO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109、SEQ ID NO:110、SEQ ID NO:111、SEQID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119或SEQ ID NO:120的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85或更多个氨基酸取代。

在一些实施例中,所述IPD095-2多肽包含SEQ ID NO:28、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ IDNO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ IDNO:78、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ IDNO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ IDNO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ IDNO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101、SEQID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119或SEQ ID NO:120的氨基酸序列。

在一些实施例中,所述IPD095-2多肽包含SEQ ID NO:28、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:75、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:82、SEQ ID NO:83、SEQ IDNO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ IDNO:97、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:103、SEQ ID NO:107、SEQ ID NO:119或SEQ ID NO:120的氨基酸序列。

IPD097蛋白及其变体和片段

本公开涵盖了IPD097多肽。如本文中可互换地使用的“IPD097多肽”和“IPD097蛋白”是指具有杀昆虫活性的多肽(其针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW)),并且与SEQ ID NO:121的IPD097多肽充分同源。考虑了多种IPD097多肽同源物。IPD097多肽同源物或相关蛋白的来源包括选自但不限于嗜血杆菌属(Haemophilus)物种、气单胞菌属(Aeromonas)物种、和梭菌属(Clostridiales)物种的细菌物种。IPD097多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD097同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD097多肽的全长序列。在一些实施例中,所述IPD097多肽与SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:123、SEQ ID NO:124、SEQID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134或SEQ ID NO:135相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD097多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ IDNO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134或SEQ ID NO:135。

在一些实施例中,IPD097多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:121、SEQ IDNO:123、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:131或SEQ ID NO:132。

在一些实施例中,IPD097多肽包含SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134或SEQ ID NO:135的氨基酸序列,其与在SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134或SEQ ID NO:135的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,所述IPD097多肽包含SEQ ID NO:121、SEQ ID NO:122、SEQ IDNO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ IDNO:134或SEQ ID NO:135的氨基酸序列。

在一些实施例中,所述IPD097多肽包含SEQ ID NO:121、SEQ ID NO:123、SEQ IDNO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:131或SEQ ID NO:132的氨基酸序列。

IPD099-1、IPD099-2和IPD099-3蛋白及其变体和片段

本公开涵盖了IPD099-1、IPD099-2和IPD099-3多肽。如本文中可互换地使用的“IPD099-1多肽”和“IPD099-1蛋白”是指具有杀昆虫活性的多肽(其与IPD099-2多肽和IPD099-3组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW)),并且与SEQ ID NO:136的IPD099-1多肽充分同源。考虑了多种IPD099-1多肽同源物。IPD099-1多肽同源物或相关蛋白的来源包括选自但不限于气单胞菌属(Aeromonas)物种、嗜血杆菌属(Haemophilus)物种、伯克霍尔德菌属(Burkholderia)物种、色杆菌属(Chromobacterium)物种、欧文菌属(Erwinia)物种、沙雷氏菌属(Serratia)物种、盐弧菌属(Salinivibrio)物种、海水菌属(Aquimarina)物种、詹森菌属(Janthinobacterium)物种、单歧蓝细菌属(Tolypothrix)物种、发光杆菌属(Photobacterium)物种、詹森菌属(Janthinobacterium)物种、根瘤菌属(Rhizobium)物种、嗜冷菌属(Moritella)物种、普罗维登斯菌属(Providencia)物种、耶尔森菌属(Yersinia)物种和弧菌属(Vibrio)物种的细菌物种。IPD099-1多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD099-1同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD099-1多肽的全长序列。在一些实施例中,所述IPD099-1多肽与SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ IDNO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ IDNO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ ID NO:161、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQ ID NO:168、SEQ IDNO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQ ID NO:179、SEQ IDNO:180、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQ ID NO:190、SEQ IDNO:191、SEQ ID NO:192、SEQ ID NO:193、SEQ ID NO:194、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQ ID NO:201、SEQ IDNO:202、SEQ ID NO:203、SEQ ID NO:204、SEQ ID NO:205、SEQ ID NO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQ ID NO:212、SEQ IDNO:213、SEQ ID NO:214或SEQ ID NO:215相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD099-1多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ IDNO:146、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ IDNO:157、SEQ ID NO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ ID NO:161、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQ IDNO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQ IDNO:179、SEQ ID NO:180、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQ IDNO:190、SEQ ID NO:191、SEQ ID NO:192、SEQ ID NO:193、SEQ ID NO:194、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQ IDNO:201、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:204、SEQ ID NO:205、SEQ ID NO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQ IDNO:212、SEQ ID NO:213、SEQ ID NO:214或SEQ ID NO:215。

在一些实施例中,IPD099-1多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:136、SEQ IDNO:139、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:158、SEQ IDNO:177、SEQ ID NO:179、SEQ ID NO:180、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQ ID NO:192、SEQ ID NO:195、SEQ IDNO:196、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:205、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210或SEQ ID NO:215。

在一些实施例中,IPD099-1多肽包含SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQID NO:146、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQID NO:157、SEQ ID NO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ ID NO:161、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQID NO:179、SEQ ID NO:180、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQID NO:190、SEQ ID NO:191、SEQ ID NO:192、SEQ ID NO:193、SEQ ID NO:194、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQID NO:201、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:204、SEQ ID NO:205、SEQ ID NO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQID NO:212、SEQ ID NO:213、SEQ ID NO:214或SEQ ID NO:215的氨基酸序列,相比于在SEQID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:147、SEQ ID NO:148、SEQID NO:149、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159、SEQID NO:160、SEQ ID NO:161、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQ ID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQID NO:171、SEQ ID NO:172、SEQ ID NO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:180、SEQ ID NO:181、SEQID NO:182、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQ ID NO:190、SEQ ID NO:191、SEQ ID NO:192、SEQID NO:193、SEQ ID NO:194、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQ ID NO:201、SEQ ID NO:202、SEQ ID NO:203、SEQID NO:204、SEQ ID NO:205、SEQ ID NO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQ ID NO:212、SEQ ID NO:213、SEQ ID NO:214或SEQ ID NO:215的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,所述IPD099-1多肽包含SEQ ID NO:136、SEQ ID NO:139、SEQ IDNO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ IDNO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ ID NO:161、SEQ IDNO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQ ID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ IDNO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:180、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:183、SEQ IDNO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQ ID NO:190、SEQ ID NO:191、SEQ ID NO:192、SEQ ID NO:193、SEQ ID NO:194、SEQ IDNO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQ ID NO:201、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:204、SEQ ID NO:205、SEQ IDNO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQ ID NO:212、SEQ ID NO:213、SEQ ID NO:214或SEQ ID NO:215的氨基酸序列。

在一些实施例中,IPD099-1多肽包含SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:148、SEQ ID NO:149、SEQID NO:150、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:180、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQID NO:188、SEQ ID NO:189、SEQ ID NO:192、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:205、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210或SEQ ID NO:215的氨基酸序列。

如本文中可互换地使用的“IPD099-2多肽”和“IPD099-2蛋白”是指具有杀昆虫活性的多肽(其针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW)),并且与SEQ ID NO:137的IPD099-2多肽充分同源。考虑了多种IPD099-2多肽同源物。IPD099-2多肽同源物或相关蛋白的来源包括选自但不限于气单胞菌属(Aeromonas)物种、嗜血杆菌属(Haemophilus)物种、伯克霍尔德菌属(Burkholderia)物种、色杆菌属(Chromobacterium)物种、欧文菌属(Erwinia)物种、沙雷氏菌属(Serratia)物种、盐弧菌属(Salinivibrio)物种、海水菌属(Aquimaria)物种、詹森菌属(Janthinobacterium)物种、单歧蓝细菌属(Tolypothrix)物种、发光杆菌属(Photobacterium)物种、詹森菌属(Janthinobacterium)物种、根瘤菌属(Rhizobium)物种、嗜冷菌属(Moritella)物种、普罗维登斯菌属(Providencia)物种、耶尔森菌属(Yersinia)物种和弧菌属(Vibrio)物种的细菌物种。IPD099-2多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD099-2同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD099-2多肽的全长序列。在一些实施例中,所述IPD099-2多肽与SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:223、SEQ IDNO:224、SEQ ID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQ ID NO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234、SEQ IDNO:235、SEQ ID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQ ID NO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQ ID NO:245、SEQ IDNO:246、SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQ ID NO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:256、SEQ IDNO:257、SEQ ID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ ID NO:267、SEQ IDNO:268、SEQ ID NO:269、SEQ ID NO:270或SEQ ID NO:271相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD099-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ IDNO:223、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQ ID NO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ IDNO:234、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQ ID NO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQ IDNO:245、SEQ ID NO:246、SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQ ID NO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ IDNO:256、SEQ ID NO:257、SEQ ID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ IDNO:267、SEQ ID NO:268、SEQ ID NO:269、SEQ ID NO:270或SEQ ID NO:271。

在一些实施例中,IPD099-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:137、SEQ IDNO:216、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:249、SEQ ID NO:251、SEQ IDNO:254、SEQ ID NO:255、SEQ ID NO:262、SEQ ID NO:265、SEQ ID NO:268或SEQ ID NO:269。

在一些实施例中,IPD099-2多肽包含SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQID NO:223、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQ ID NO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQID NO:234、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQ ID NO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQID NO:245、SEQ ID NO:246、SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQ ID NO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQID NO:256、SEQ ID NO:257、SEQ ID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQID NO:267、SEQ ID NO:268、SEQ ID NO:269、SEQ ID NO:270或SEQ ID NO:271的氨基酸序列,相比于在SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:223、SEQ ID NO:224、SEQID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQ ID NO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234、SEQ ID NO:235、SEQID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQ ID NO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQ ID NO:245、SEQ ID NO:246、SEQID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQ ID NO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:256、SEQ ID NO:257、SEQID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ ID NO:267、SEQ ID NO:268、SEQID NO:269、SEQ ID NO:270或SEQ ID NO:271的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,所述IPD099-2多肽包含SEQ ID NO:137、SEQ ID NO:216、SEQ IDNO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:223、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQ IDNO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQ IDNO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQ ID NO:245、SEQ ID NO:246、SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQ IDNO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:256、SEQ ID NO:257、SEQ ID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ IDNO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ ID NO:267、SEQ ID NO:268、SEQ ID NO:269、SEQ ID NO:270或SEQ ID NO:271的氨基酸序列。

在一些实施例中,所述IPD099-2多肽包含SEQ ID NO:137、SEQ ID NO:216、SEQ IDNO:221、SEQ ID NO:222、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:254、SEQ IDNO:255、SEQ ID NO:262、SEQ ID NO:265、SEQ ID NO:268或SEQ ID NO:269的氨基酸序列。

如本文中可互换地使用的“IPD099-3多肽”和“IPD099-3蛋白”是指具有杀昆虫活性的多肽(其与IPD099-1多肽和IPD099-2多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW)),并且与SEQ ID NO:138的IPD099-3多肽充分同源。考虑了多种IPD099-3多肽同源物。IPD099-3多肽同源物或相关蛋白的来源包括选自但不限于气单胞菌属(Aeromonas)物种、嗜血杆菌属(Haemophilus)物种、伯克霍尔德菌属(Burkholderia)物种、色杆菌属(Chromobacterium)物种、欧文菌属(Erwinia)物种、沙雷氏菌属(Serratia)物种、盐弧菌属(Salinivibrio)物种、海水菌属(Aquimarina)物种、詹森菌属(Janthinobacterium)物种、单歧蓝细菌属(Tolypothrix)物种、发光杆菌属(Photobacterium)物种、詹森菌属(Janthinobacterium)物种、根瘤菌属(Rhizobium)物种、嗜冷菌属(Moritella)物种、普罗维登斯菌属(Providencia)物种、耶尔森菌属(Yersinia)物种和弧菌属(Vibrio)物种的细菌物种。IPD099-3多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD099-3同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD099-3多肽的全长序列。在一些实施例中,所述IPD099-3多肽与SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQ ID NO:279、SEQ IDNO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:284、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ IDNO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:297、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQ IDNO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:305、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:309、SEQ ID NO:310、SEQ ID NO:311、SEQ ID NO:312、SEQ IDNO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ ID NO:316、SEQ ID NO:317、SEQ ID NO:318、SEQ ID NO:319、SEQ ID NO:320、SEQ ID NO:321、SEQ ID NO:322、SEQ ID NO:323、SEQ IDNO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ ID NO:327、SEQ ID NO:328、SEQ ID NO:329、SEQ ID NO:330或SEQ ID NO:331相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD099-3多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQ IDNO:279、SEQ ID NO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:284、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ IDNO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:297、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQ IDNO:301、SEQ ID NO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:305、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:309、SEQ ID NO:310、SEQ ID NO:311、SEQ IDNO:312、SEQ ID NO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ ID NO:316、SEQ ID NO:317、SEQ ID NO:318、SEQ ID NO:319、SEQ ID NO:320、SEQ ID NO:321、SEQ ID NO:322、SEQ IDNO:323、SEQ ID NO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ ID NO:327、SEQ ID NO:328、SEQ ID NO:329、SEQ ID NO:330或SEQ ID NO:331。

在一些实施例中,IPD099-3多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更大同一性:SEQ ID NO:138、SEQ IDNO:272、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ IDNO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:307、SEQ IDNO:308、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:320、SEQ ID NO:323、SEQ ID NO:324、SEQ ID NO:326或SEQ ID NO:331。

在一些实施例中,IPD099-3多肽包含SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQID NO:279、SEQ ID NO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:284、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:297、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQID NO:301、SEQ ID NO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:305、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:309、SEQ ID NO:310、SEQ ID NO:311、SEQID NO:312、SEQ ID NO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ ID NO:316、SEQ ID NO:317、SEQ ID NO:318、SEQ ID NO:319、SEQ ID NO:320、SEQ ID NO:321、SEQ ID NO:322、SEQID NO:323、SEQ ID NO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ ID NO:327、SEQ ID NO:328、SEQ ID NO:329、SEQ ID NO:330或SEQ ID NO:331的氨基酸序列,相比于在SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQID NO:277、SEQ ID NO:278、SEQ ID NO:279、SEQ ID NO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:284、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:287、SEQID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:297、SEQ ID NO:298、SEQID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQ ID NO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:305、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:309、SEQID NO:310、SEQ ID NO:311、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ ID NO:316、SEQ ID NO:317、SEQ ID NO:318、SEQ ID NO:319、SEQ ID NO:320、SEQID NO:321、SEQ ID NO:322、SEQ ID NO:323、SEQ ID NO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ ID NO:327、SEQ ID NO:328、SEQ ID NO:329、SEQ ID NO:330或SEQ ID NO:331的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,所述IPD099-3多肽包含SEQ ID NO:138、SEQ ID NO:272、SEQ IDNO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQ ID NO:279、SEQ ID NO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ ID NO:283、SEQ IDNO:284、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ IDNO:295、SEQ ID NO:296、SEQ ID NO:297、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQ ID NO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:305、SEQ IDNO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:309、SEQ ID NO:310、SEQ ID NO:311、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ ID NO:316、SEQ IDNO:317、SEQ ID NO:318、SEQ ID NO:319、SEQ ID NO:320、SEQ ID NO:321、SEQ ID NO:322、SEQ ID NO:323、SEQ ID NO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ ID NO:327、SEQ IDNO:328、SEQ ID NO:329、SEQ ID NO:330或SEQ ID NO:331的氨基酸序列。

在一些实施例中,所述IPD099-3多肽包含SEQ ID NO:138、SEQ ID NO:272、SEQ IDNO:273、SEQ ID NO:275、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ IDNO:295、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ IDNO:312、SEQ ID NO:313、SEQ ID NO:320、SEQ ID NO:323、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:331的氨基酸序列。

IPD100-1和IPD100-2蛋白及其变体和片段

本公开涵盖了IPD100-1和IPD100-2多肽。如本文中可互换地使用的“IPD100-1多肽”和“IPD100-1蛋白”是指具有杀昆虫活性的多肽,与IPD100-2多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ IDNO:332的IPD100-1多肽充分同源。考虑了多种IPD100-1多肽同源物。IPD100-1多肽同源物或相关蛋白的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、Candidatus物种、伯克霍尔德菌属(Burkholderia)物种、杜擀氏菌属(Duganella)物种、沙门氏菌属(Salmonella)物种、黄杆菌属(Tenacibaculum)物种、迪基氏菌属(Dickeya)、地杆菌属(Pedobacter)物种、和分枝杆菌属(Mycobacterium)物种的细菌物种。IPD100-1多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD100-1同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。在一些实施例中,所述序列同源性针对IPD100-1多肽的全长序列。在一些实施例中,所述IPD100-1多肽与SEQ ID NO:332、SEQID NO:334、SEQ ID NO:335或SEQ ID NO:336相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD100-1多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:335或SEQ ID NO:336。

在一些实施例中,IPD100-1多肽包含氨基酸序列,所述氨基酸序列与SEQ ID NO:332的氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性。

在一些实施例中,IPD100-1多肽包含SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:335或SEQ ID NO:336的氨基酸序列,其与在SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:335或SEQ ID NO:336的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75或更多个氨基酸取代。

在一些实施例中,所述IPD100-1多肽包含SEQ ID NO:332、SEQ ID NO:334、SEQ IDNO:335或SEQ ID NO:336的氨基酸序列。

在一些实施例中,所述IPD100-1多肽包含SEQ ID NO:332的氨基酸序列。

如本文中可互换地使用的“IPD100-2多肽”和“IPD100-2蛋白”是指具有杀昆虫活性的多肽,与IPD100-1多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ ID NO:333的IPD100-2多肽充分同源。考虑了多种IPD100-2多肽同源物。IPD100-2多肽同源物或相关蛋白的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、Candidatus物种、伯克霍尔德菌属(Burkholderia)物种、杜擀氏菌属(Duganella)物种、沙门氏菌属(Salmonella)物种、黄杆菌属(Tenacibaculum)物种、迪基氏菌属(Dickeya)、地杆菌属(Pedobacter)物种、和分枝杆菌属(Mycobacterium)物种的细菌物种。IPD100-2多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD100-2同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD100-2多肽的全长序列。在一些实施例中,所述IPD100-2多肽与SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQ ID NO:344、SEQ IDNO:345、SEQ ID NO:346、SEQ ID NO:347、SEQ ID NO:348或SEQ ID NO:349相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,所述IPD100-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQID NO:344、SEQ ID NO:345、SEQ ID NO:346、SEQ ID NO:347、SEQ ID NO:348或SEQ ID NO:349。

在一些实施例中,所述IPD100-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQ IDNO:344或SEQ ID NO:347。

在一些实施例中,IPD100-2多肽包含SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQID NO:344、SEQ ID NO:345、SEQ ID NO:346、SEQ ID NO:347、SEQ ID NO:348或SEQ ID NO:349的氨基酸序列,其与在SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQ ID NO:344、SEQID NO:345、SEQ ID NO:346、SEQ ID NO:347、SEQ ID NO:348或SEQ ID NO:349的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,IPD100-2多肽包含SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQID NO:344、SEQ ID NO:345、SEQ ID NO:346、SEQ ID NO:347、SEQ ID NO:348或SEQ ID NO:349的氨基酸序列。

在一些实施例中,所述IPD100-2多肽包含SEQ ID NO:333、SEQ ID NO:337、SEQ IDNO:338、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQ ID NO:344或SEQ ID NO:347的氨基酸序列。

IPD105蛋白及其变体和片段

本公开涵盖了IPD105多肽。如本文中可互换地使用的“IPD105多肽”和“IPD105蛋白”是指具有杀昆虫活性的多肽(其针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW)),并且与SEQ ID NO:350的IPD105多肽充分同源。考虑了多种IPD105多肽同源物。IPD105多肽同源物或相关蛋白的来源包括选自但不限于色杆菌属(Chromobacterium)物种和色假高炳根氏菌属(Pseudogulbenkiania)物种的细菌物种。IPD105多肽同源物的氨基酸序列的比对(例如-图3A-3B)允许鉴定该家族中的天然同源物之间高度保守的残基。对于IPD092-1和IPD092-2同源物,可以按照与图1和2所示类似的方式比对IPD105同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD105多肽的全长序列。在一些实施例中,所述IPD105多肽与SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQID NO:354、SEQ ID NO:355、SEQ ID NO:356、SEQ ID NO:357、SEQ ID NO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD105多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQ ID NO:354、SEQ ID NO:355、SEQ ID NO:356、SEQ ID NO:357、SEQ IDNO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365。

在一些实施例中,IPD105多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:350、SEQ IDNO:353、SEQ ID NO:355、SEQ ID NO:357或SEQ ID NO:362。

在一些实施例中,IPD105多肽包含SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQ ID NO:354、SEQ ID NO:355、SEQ ID NO:356、SEQ ID NO:357、SEQID NO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365的氨基酸序列,相比于在SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQ ID NO:354、SEQ ID NO:355、SEQ ID NO:356、SEQID NO:357、SEQ ID NO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,IPD105多肽包含SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQ ID NO:354、SEQ ID NO:355、SEQ ID NO:356、SEQ ID NO:357、SEQID NO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365的氨基酸序列。

在一些实施例中,所述IPD105多肽包含SEQ ID NO:350、SEQ ID NO:353、SEQ IDNO:355、SEQ ID NO:357、或SEQ ID NO:362的氨基酸序列。

IPD106-1和IPD106-2蛋白及其变体和片段

本公开涵盖了IPD106-1和IPD106-2多肽。如本文中可互换地使用的“IPD106-1多肽”和“IPD106-1蛋白”是指具有杀昆虫活性的多肽,与IPD106-2多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ IDNO:366的IPD106-1多肽充分同源。考虑了多种IPD106-1多肽同源物。IPD106-1多肽同源物或相关蛋白的来源包括选自但不限于Arsenicibacter物种和噬几丁质菌属(Chitinophaga)物种的细菌物种。IPD106-1多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。对于IPD092-1和IPD092-2同源物,可以按照与图1和2所示类似的方式比对IPD106-1同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD106-1多肽的全长序列。在一些实施例中,所述IPD106-1多肽与SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:369、SEQ ID NO:370或SEQ ID NO:371相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD106-1多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:369、SEQ ID NO:370或SEQ ID NO:371。

在一些实施例中,IPD106-1多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:366、SEQ IDNO:368或SEQ ID NO:369。

在一些实施例中,IPD106-1多肽包含SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:369、SEQ ID NO:370或SEQ ID NO:371的氨基酸序列,其与在SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:369、SEQ ID NO:370或SEQ ID NO:371的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,所述IPD106-1多肽包含SEQ ID NO:366、SEQ ID NO:368、SEQ IDNO:369、SEQ ID NO:370、或SEQ ID NO:371的氨基酸序列。

在一些实施例中,所述IPD106-1多肽包含SEQ ID NO:366、SEQ ID NO:368或SEQID NO:369的氨基酸序列。

如本文中可互换地使用的“IPD106-2多肽”和“IPD106-2蛋白”是指具有杀昆虫活性的多肽,与IPD106-1多肽组合,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ ID NO:367的IPD106-2多肽充分同源。考虑了多种IPD106-2多肽同源物。IPD106-2多肽同源物的来源或相关的蛋白质包括选自但不限于Arsenicibacter物种和噬几丁质菌属(Chitinophaga)物种的细菌物种。IPD106-2多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD106-2同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD106-2多肽的全长序列。在一些实施例中,所述IPD106-2多肽与SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD106-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376。

在一些实施例中,IPD106-2多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:367、SEQ IDNO:372、SEQ ID NO:373或SEQ ID NO:376。

在一些实施例中,IPD106-2多肽包含SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376的氨基酸序列,其与在SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,所述IPD106-2多肽包含SEQ ID NO:367、SEQ ID NO:372、SEQ IDNO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376的氨基酸序列。

在一些实施例中,所述IPD106-2多肽包含SEQ ID NO:367、SEQ ID NO:372、SEQ IDNO:373或SEQ ID NO:376的氨基酸序列。

IPD107蛋白及其变体和片段

本公开涵盖了IPD107多肽。如本文中可互换地使用的“IPD107多肽”和“IPD107蛋白”是指具有杀昆虫活性的多肽,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ ID NO:377的IPD107多肽充分同源。考虑了多种IPD107多肽同源物。IPD107多肽同源物或相关蛋白的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、色杆菌属(Chromobacterium)物种、和慢生根瘤菌属(Bradyrhizobium)物种的细菌物种。IPD107多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按类似于如图1和图2所示的IPD092-1和IPD092-2同源物的方式,比对IPD107同源物,用来鉴定保守的氨基酸位置、可耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD107多肽的全长序列。在一些实施例中,所述IPD107多肽与SEQ ID NO:377、SEQ ID NO:378、SEQ ID NO:379、SEQ ID NO:380、SEQID NO:381、SEQ ID NO:382、SEQ ID NO:383、SEQ ID NO:384、SEQ ID NO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQID NO:392、SEQ ID NO:393、SEQ ID NO:394、SEQ ID NO:395、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:406、SEQ ID NO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423、SEQ ID NO:424、SEQID NO:425、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQID NO:436、SEQ ID NO:437、SEQ ID NO:438、SEQ ID NO:439、SEQ ID NO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:445、SEQ ID NO:446、SEQID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451或SEQ ID NO:452相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD107多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:377、SEQ ID NO:378、SEQ ID NO:379、SEQ ID NO:380、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:383、SEQ ID NO:384、SEQ IDNO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ ID NO:393、SEQ ID NO:394、SEQ ID NO:395、SEQ IDNO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:406、SEQ IDNO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ IDNO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423、SEQ ID NO:424、SEQ ID NO:425、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ IDNO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:438、SEQ ID NO:439、SEQ IDNO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ IDNO:451或SEQ ID NO:452。

在一些实施例中,IPD107多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:377、SEQ IDNO:378、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:393、SEQ IDNO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ IDNO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ IDNO:422、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ IDNO:438、SEQ ID NO:439、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:451或SEQ ID NO:452。

在一些实施例中,IPD107多肽包含SEQ ID NO:377、SEQ ID NO:378、SEQ ID NO:379、SEQ ID NO:380、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:383、SEQ ID NO:384、SEQID NO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ ID NO:393、SEQ ID NO:394、SEQ ID NO:395、SEQID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:406、SEQID NO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423、SEQ ID NO:424、SEQ ID NO:425、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:438、SEQ ID NO:439、SEQID NO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQID NO:451或SEQ ID NO:452的氨基酸序列,其与在SEQ ID NO:377、SEQ ID NO:378、SEQ IDNO:379、SEQ ID NO:380、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:383、SEQ ID NO:384、SEQ ID NO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ IDNO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ ID NO:393、SEQ ID NO:394、SEQ ID NO:395、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ ID NO:400、SEQ IDNO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:406、SEQ ID NO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ IDNO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ IDNO:423、SEQ ID NO:424、SEQ ID NO:425、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ IDNO:434、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:438、SEQ ID NO:439、SEQ ID NO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:444、SEQ IDNO:445、SEQ ID NO:446、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451或SEQ ID NO:452的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个氨基酸取代。

在一些实施例中,所述IPD107多肽包含SEQ ID NO:377、SEQ ID NO:378、SEQ IDNO:379、SEQ ID NO:380、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:383、SEQ ID NO:384、SEQ ID NO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ IDNO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ ID NO:393、SEQ ID NO:394、SEQ ID NO:395、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ ID NO:400、SEQ IDNO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:406、SEQ ID NO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ IDNO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ IDNO:423、SEQ ID NO:424、SEQ ID NO:425、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ IDNO:434、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:438、SEQ ID NO:439、SEQ ID NO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:444、SEQ IDNO:445、SEQ ID NO:446、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451或SEQ ID NO:452的氨基酸序列。

在一些实施例中,所述IPD107多肽包含SEQ ID NO:377、SEQ ID NO:378、SEQ IDNO:381、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:396、SEQ IDNO:397、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:410、SEQ IDNO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ IDNO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:438、SEQ IDNO:439、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:451或SEQ ID NO:452的氨基酸序列。

IPD111蛋白及其变体和片段

本公开涵盖了IPD111多肽。如本文中可互换地使用的“IPD111多肽”和“IPD111蛋白”是指具有杀昆虫活性的多肽,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ ID NO:453的IPD111多肽充分同源。考虑了多种IPD111多肽同源物。IPD111多肽同源物或相关蛋白的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、色杆菌属(Chromobacterium)物种、和伯克霍尔德菌属(Burkholderia)物种的细菌物种。IPD111多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按类似于如图1和图2所示的IPD092-1和IPD092-2同源物的方式,比对IPD111同源物,用来鉴定保守的氨基酸位置、可耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD111多肽的全长序列。在一些实施例中,所述IPD111多肽与SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQ ID NO:456、SEQID NO:457、SEQ ID NO:458、SEQ ID NO:459、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:477、SEQ ID NO:478、SEQID NO:479、SEQ ID NO:480、SEQ ID NO:481、SEQ ID NO:482、SEQ ID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQ ID NO:488、SEQ ID NO:489、SEQID NO:490、SEQ ID NO:491、SEQ ID NO:492、SEQ ID NO:493、SEQ ID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQ ID NO:500、SEQID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQ ID NO:511、SEQID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQ ID NO:522、SEQID NO:523、SEQ ID NO:524、SEQ ID NO:525、SEQ ID NO:526、SEQ ID NO:527或SEQ ID NO:528相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大序列同一性。

在一些实施例中,IPD111多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性:SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQID NO:456、SEQ ID NO:457、SEQ ID NO:458、SEQ ID NO:459、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQ ID NO:466、SEQID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:477、SEQID NO:478、SEQ ID NO:479、SEQ ID NO:480、SEQ ID NO:481、SEQ ID NO:482、SEQ ID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQ ID NO:488、SEQID NO:489、SEQ ID NO:490、SEQ ID NO:491、SEQ ID NO:492、SEQ ID NO:493、SEQ ID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQID NO:522、SEQ ID NO:523、SEQ ID NO:524、SEQ ID NO:525、SEQ ID NO:526、SEQ ID NO:527或SEQ ID NO:528。

在一些实施例中,IPD111多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:453、SEQ IDNO:454、SEQ ID NO:455、SEQ ID NO:456、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ IDNO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:489、SEQ ID NO:496、SEQ ID NO:497、SEQ IDNO:498、SEQ ID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ IDNO:509、SEQ ID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ IDNO:520、SEQ ID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524或SEQ ID NO:526。

在一些实施例中,IPD111多肽包含SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQ ID NO:456、SEQ ID NO:457、SEQ ID NO:458、SEQ ID NO:459、SEQ ID NO:460、SEQID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:477、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:480、SEQ ID NO:481、SEQ ID NO:482、SEQID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQ ID NO:488、SEQ ID NO:489、SEQ ID NO:490、SEQ ID NO:491、SEQ ID NO:492、SEQ ID NO:493、SEQID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524、SEQ ID NO:525、SEQ ID NO:526、SEQID NO:527或SEQ ID NO:528的氨基酸序列,相比于在SEQ ID NO:453、SEQ ID NO:454、SEQID NO:455、SEQ ID NO:456、SEQ ID NO:457、SEQ ID NO:458、SEQ ID NO:459、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQID NO:477、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:480、SEQ ID NO:481、SEQ ID NO:482、SEQ ID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQID NO:488、SEQ ID NO:489、SEQ ID NO:490、SEQ ID NO:491、SEQ ID NO:492、SEQ ID NO:493、SEQ ID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524、SEQ ID NO:525、SEQ ID NO:526、SEQ ID NO:527或SEQ ID NO:528的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,所述IPD111多肽包含SEQ ID NO:453、SEQ ID NO:454、SEQ IDNO:455、SEQ ID NO:456、SEQ ID NO:457、SEQ ID NO:458、SEQ ID NO:459、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQ IDNO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ IDNO:477、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:480、SEQ ID NO:481、SEQ ID NO:482、SEQ ID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQ IDNO:488、SEQ ID NO:489、SEQ ID NO:490、SEQ ID NO:491、SEQ ID NO:492、SEQ ID NO:493、SEQ ID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ IDNO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ IDNO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ IDNO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524、SEQ ID NO:525、SEQ ID NO:526、SEQ ID NO:527或SEQ ID NO:528的氨基酸序列。

在一些实施例中,所述IPD111多肽包含SEQ ID NO:453、SEQ ID NO:454、SEQ IDNO:455、SEQ ID NO:456、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQ IDNO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:489、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ IDNO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ IDNO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ IDNO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524或SEQ ID NO:526的氨基酸序列。

IPD112蛋白及其变体和片段

本公开涵盖了IPD112多肽。如本文中可互换地使用的“IPD112多肽”和“IPD112蛋白”是指具有杀昆虫活性的多肽,针对鳞翅目和/或鞘翅目的一种或多种昆虫有害生物,包括但不限于西方玉米根虫(WCRW),并且与SEQ ID NO:529的IPD112多肽充分同源。考虑了多种IPD112多肽同源物。IPD112多肽同源物或相关蛋白的来源包括选自但不限于假单胞菌属(Pseudomonas)物种和哈夫尼亚菌属(Hafnia)物种的细菌物种。IPD112多肽同源物的氨基酸序列的比对允许鉴定该家族中的天然同源物之间高度保守的残基。可以按照针对IPD092-1和IPD092-2同源物的与图1和2所示的类似的方式比对IPD112同源物,从而鉴定保守的氨基酸位置、耐受变化的位置、基序、和结构域。

在一些实施例中,所述序列同源性针对IPD112多肽的全长序列。在一些实施例中,所述IPD112多肽与SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQID NO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQ ID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ ID NO:542、SEQ ID NO:543、SEQID NO:544或SEQ ID NO:545相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在一些实施例中,IPD112多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQ IDNO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ ID NO:542、SEQ ID NO:543、SEQ ID NO:544或SEQ ID NO:545。

在一些实施例中,IPD112多肽包含氨基酸序列,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更大同一性:SEQ ID NO:529、SEQ IDNO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:537或SEQ ID NO:545。

在一些实施例中,IPD112多肽包含SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ ID NO:542、SEQ ID NO:543、SEQ ID NO:544或SEQ ID NO:545的氨基酸序列,相比于在SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:533、SEQ ID NO:534、SEQID NO:535、SEQ ID NO:536、SEQ ID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ ID NO:542、SEQ ID NO:543、SEQ ID NO:544或SEQ ID NO:545的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,所述IPD112多肽包含SEQ ID NO:529、SEQ ID NO:530、SEQ IDNO:531、SEQ ID NO:532、SEQ ID NO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQ ID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ IDNO:542、SEQ ID NO:543、SEQ ID NO:544或SEQ ID NO:545的氨基酸序列。

在一些实施例中,所述IPD112多肽包含SEQ ID NO:529、SEQ ID NO:530、SEQ IDNO:531、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:537或SEQ ID NO:545的氨基酸序列。

如本文所用的,术语“蛋白质”、“肽分子”或“多肽”包括包含五个或更多个氨基酸的任何分子。蛋白质、肽或多肽分子可以进行修饰,所述修饰包括翻译后修饰,如但不限于二硫键形成、糖基化、磷酸化或寡聚化。因此,如本文使用的,术语“蛋白质”、“肽分子”或“多肽”包括通过任何生物或非生物过程修饰的任何蛋白质。术语“氨基酸”和“多种氨基酸”是指所有天然存在的L-氨基酸。

本文所用的“重组蛋白”是指不再处于其天然环境中(例如处于体外或重组细菌或植物宿主细胞中)的蛋白质。基本上不含细胞材料的本公开的多肽包括具有小于约30%、20%、10%或5%(以干重计)的非杀有害生物蛋白(在本文中也称为“污染蛋白”)的蛋白质的制剂。

“片段”或“生物活性部分”包括包含与本公开的多肽充分同一并且显示杀昆虫活性的氨基酸序列的多肽片段。本公开的多肽的“片段”或“生物活性部分”包括包含充分同一并且具有杀昆虫活性的氨基酸序列的片段。此类生物活性部分可以通过重组技术制备并评价杀昆虫活性。在一些实施例中,多肽片段是通过以下各项进行的来自N-末端和/或C-末端的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31或更多个氨基酸的N-末端和/或C-末端截短:通过蛋白水解、通过插入起始密码子、通过缺失编码缺失的氨基酸的密码子并且同时插入起始密码子、和/或插入终止密码子。

如本文所用的“变体”是指具有与亲本氨基酸序列具有至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列的蛋白质或多肽。

本公开的多肽的氨基酸序列变体可以通过DNA突变来制备。这还可以通过若干种诱变形式之一和/或在定向进化中来完成。在一些方面,在所述氨基酸序列中所编码的改变将基本上不影响所述蛋白质的功能。此类变体将具有所需杀有害生物活性。然而,应当理解,可以在本公开的组合物上使用这些技术来改善多肽赋予杀有害生物活性的能力。

可以通过进行随机突变来制备变体,或者可以设计变体。在设计的突变体的情况下,当毒素的关键区域中保持氨基酸同一性时,很有可能产生与天然毒素具有相似活性的变体,这些关键区域导致生物活性或参与最终负责生物活性的三维构型的确定。如果取代是保守的,也将会高可能性地保留活性。氨基酸可分为以下类别:非极性、不带电的极性、碱性和酸性。其中一种类别的氨基酸被相同类别的另一种氨基酸取代的保守取代最不可能实质上改变变体的生物活性。表1提供了属于每个类别的氨基酸的实例的列表。

表1

本公开所涵盖的变体蛋白质具有生物活性,即它们仍然具有天然蛋白质所需的生物活性(即杀有害生物活性)。在一些实施例中,该变体将具有至少约10%、至少约30%、至少约50%、至少约70%、至少约80%或更高的天然蛋白质的杀昆虫活性。在一些实施例中,所述变体可以具有比天然蛋白质改善的活性。

本公开的变体核苷酸和氨基酸序列还涵盖了源自诱变和引起重组的程序(如DNA改组)的序列。通过这种程序,可以使用一个或多个不同的多肽编码区来创建具有所需特性的新多肽。以此方式,由相关序列多核苷酸的群体产生重组多核苷酸文库,所述相关序列多核苷酸包含具有基本序列同一性并且能够在体外或体内同源重组的序列区域。例如,使用这种方法,可以将编码目的结构域的序列基序在杀有害生物基因与其他已知的杀有害生物基因之间进行改组,以获得编码具有改善的目的特性(如增加的杀昆虫活性)的蛋白的新基因。用于这种DNA改组的策略可以在以下文献中找到:Stemmer,(1994)Proc.Natl.Acad.Sci.USA[美国科学院院报]91:10747-10751;Stemmer,(1994)Nature[自然]370:389-391;Crameri等人,(1997)Nature Biotech.[自然生物技术]15:436-438;Moore等人,(1997)J Mol Biol[分子生物学杂志]272:336-347;Zhang等人,(1997)Proc.Natl.Acad.Sci.USA[美国科学院院报]94:4504-4509;Crameri等人,(1998)Nature[自然]391:288-291;以及美国专利号5,605,793和5,837,458。

结构域交换或改组是用于产生改变的多肽的另一种机制。可以在多肽之间交换结构域,产生具有改进的杀昆虫活性或靶谱的杂交或嵌合毒素。用于产生重组蛋白并测试其杀有害生物活性的方法可以在以下文献中找到:Naimov等人,(2001)Appl.Environ.Microbiol.[应用与环境微生物学]67:5328-5330;de Maagd等人,(1996)Appl.Environ.Microbiol.[应用与环境微生物学]62:1537-1543;Ge等人,(1991)J.Biol.Chem.[生物化学杂志]266:17954-17958;Schnepf等人,(1990)J.Biol.Chem.[生物化学杂志]265:20923-20930;Rang等人,91999)Appl.Environ.Microbiol.[应用与环境微生物学]65:2918-2925)。

可以使用序列和结构分析方法,所述方法由四个部分组成:系统发育树构建、蛋白序列基序发现、二级结构预测以及蛋白序列和二级结构比对。关于每个部分的详细信息描述如下。

1)系统发育树构建

可以使用软件MEGA5进行系统发育分析。可以对蛋白序列进行ClustalW版本2分析(Larkin M.A等人(2007)Bioinformatics[生物信息学]23(21):2947-2948),用于多重序列比对。然后通过在基于JTT矩阵的模型基础上的最大似然法推断进化历史。获得具有最高对数似然值的树,以Newick格式导出,并进一步处理,以与在树中出现的相同顺序提取序列ID。可以为每个杀昆虫蛋白家族手动鉴定代表亚科的几个进化枝。

2)蛋白序列基序发现

根据先前构建的系统发育树对蛋白序列进行重新排序,并输入基序分析工具MEME(用于基序引出的多重EM)(Bailey T.L.和Elkan C.,Proceedings of the SecondInternational Conference on Intelligent Systems for Molecular Biology[第二届国际分子生物学智能系统会议论文集],第28-36页,AAAI Press[AAAI出版社],Menlo Park[门洛帕克],加利福尼亚州,1994),用于鉴定关键序列基序。MEME设置如下:最小位点数2,最小基序宽度5,和最大基序数30。通过视觉观察鉴定了每个亚家族独有的序列基序。基序在整个基因家族中的分布可以在HTML网页中看到。相对于每个基序的E-值的排名对基序进行编号。

3)二级结构预测

PSIPRED,排名最高的二级结构预测方法(Jones DT.(1999)J.Mol.Biol.[分子生物学杂志]292:195-202),可用于蛋白质二级结构预测。所述工具使用基于PSI-BLAST输出的两个前馈神经网络提供准确的结构预测。通过去除Uniref100中的低复杂度、跨膜和卷曲螺旋区域来创建PSI-BLAST数据库。PSIPRED结果包含预测的二级结构(α螺旋:H,β链:E和螺旋:C)和给定蛋白序列中每个氨基酸的对应置信度得分。

4)蛋白序列与二级结构的比对

可以开发脚本,以对所有蛋白质根据来自步骤1的多重蛋白序列比对来产生空位二级结构比对。将所有比对的蛋白序列和结构连接成单个FASTA文件,并然后导入到MEGA中用于可视化和鉴定保守结构。

在一些实施例中,本公开的多肽具有改性的物理性质。如本文所用的,术语“物理特性”是指适于描述蛋白质的物理化学特征的任何参数。如本文所用的,“目的物理特性”和“目的特性”可互换使用,以指正在研究和/或修饰的蛋白质的物理特性。物理特性的实例包括但不限于:蛋白质表面上的净表面电荷和电荷分布、蛋白质表面上的净疏水性和疏水残基分布、表面电荷密度、表面疏水密度、表面电离基团的总计数、表面张力、蛋白质大小及其在溶液中的分布、熔融温度、热容量、和第二位力系数。物理特性的实例还包括,多肽具有增加的表达、增加的溶解度、降低的植物毒性、和蛋白水解片段在昆虫肠道中的可消化性。通过模拟胃液消化的模型可以在以下文献中找到:Fuchs,R.L.和J.D.Astwood.FoodTechnology[食品技术]50:83-88,1996;Astwood,J.D.等人Nature Biotechnology[自然生物技术]14:1269-1273,1996;Fu TJ等人J.Agric Food Chem.[农业与食品化学杂志]50:7154-7160,2002)。

在一些实施例中,变体包括由于诱变而在氨基酸序列方面不同的多肽。本公开所涵盖的变体蛋白质具有生物活性,即它们仍然具有天然蛋白质所需的生物活性(即杀有害生物活性)。在一些实施例中,所述变体将具有至少约10%、至少约30%、至少约50%、至少约70%、至少约80%或更多的天然蛋白质的杀昆虫活性。在一些实施例中,所述变体可以具有比天然蛋白质改善的活性。

细菌基因通常在可读框的起始附近具有多个甲硫氨酸起始密码子。通常,在这些起始密码子中的一个或多个处的翻译起始将导致功能性蛋白质的产生。这些起始密码子可以包括ATG密码子。然而,细菌(如,芽孢杆菌属物种)还将密码子GTG识别为起始密码子,并且在GTG密码子处起始翻译的蛋白质在第一个氨基酸处包含甲硫氨酸。在少数情况下,细菌系统中的翻译可以在TTG密码子处起始,尽管在此事件中TTG编码甲硫氨酸。此外,通常不先验地确定细菌中天然使用了这些密码子中的哪一些。因此,应当理解,使用可替代的甲硫氨酸密码子之一也可能导致杀有害生物蛋白的产生。这些杀有害生物蛋白涵盖于本公开之中,并且可以在本公开的方法中使用。应当理解,当在植物中表达时,有必要将可替代的起始密码子改变为ATG以用于正确翻译。

在一些实施例中,提供了嵌合多肽,所述嵌合多肽包含至少两种不同的IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽或IPD112多肽的区域。

在一些实施例中,提供了嵌合IPD092-1多肽、嵌合IPD092-2多肽、嵌合IPD095-1多肽、嵌合IPD095-2多肽、嵌合IPD097多肽、嵌合IPD099-1多肽、嵌合IPD099-2多肽、嵌合IPD099-3多肽、嵌合IPD100-1多肽、嵌合IPD100-2多肽、嵌合IPD105多肽、嵌合IPD106-1多肽、嵌合IPD106-2多肽、嵌合IPD107多肽、嵌合IPD111多肽或嵌合IPD112多肽,所述多肽包含与本公开的第二IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽或IPD112多肽的C-末端区域可操作地融合的本公开的第一IPD092-1多肽、IPD092-2多肽、IPD095-1多肽、IPD095-2多肽、IPD097多肽、IPD099-1多肽、IPD099-2多肽、IPD099-3多肽、IPD100-1多肽、IPD100-2多肽、IPD105多肽、IPD106-1多肽、IPD106-2多肽、IPD107多肽、IPD111多肽或IPD112多肽的N-末端区域。

在其他实施例中,本公开的多肽可以表达为具有催化多步翻译后蛋白质剪接的间插序列的前体蛋白。蛋白质剪接涉及从多肽切除间插序列,并伴随连接侧翼序列以产生新的多肽(Chong等人,(1996)J.Biol.Chem.[生物化学杂志],271:22159-22168)。这种被称为内含肽的间插序列或蛋白质剪接元件,通过在N-末端和C-末端剪接点处的以下三个协调反应催化其自身的切除:N-末端半胱氨酸或丝氨酸的酰基重排;两个末端之间形成支链酯或硫酯中间体的酯交换反应,和与内含肽C-末端天冬酰胺的环化相偶联释放内含肽的肽键切割(Evans等人,(2000)J.Biol.Chem.[生物化学杂志],275:9091-9094)。在其他实施例中,本公开的多肽可以由两个单独的基因编码,其中前体蛋白的内含肽来自两个称为分裂内含肽的基因,并且前体的两部分通过肽键形成连接。

在一些实施例中,本公开的多肽是环形排列的变体。重组DNA方法的发展使得有可能研究序列转座对蛋白质折叠、结构和功能的影响。创建新序列中使用的方法类似于通过其氨基酸序列的线性改组对天然存在的蛋白质对进行关联的方法(Cunningham等人,(1979)Proc.Natl.Acad.Sci.U.S.A.[美国科学院院报]76:3218-3222;Teather和Erfle,(1990)J.Bacteriol.[细菌学杂志]172:3837-3841;Schimming等人,(1992)Eur.J.Biochem.[欧洲生物化学杂志]204:13-19;Yamiuchi和Minamikawa,(1991)FEBSLett.[欧洲生化学会联盟通讯]260:127-130;MacGregor等人,(1996)FEBS Lett.[欧洲生化学会联盟通讯]378:263-266)。

在另一个实施例中,提供了融合蛋白,在所述融合蛋白的氨基酸序列中包含含有本公开的多肽的氨基酸序列。编码本公开的多肽的多核苷酸可以融合到信号序列转运肽,这些信号序列转运肽将指导多肽定位于原核或真核细胞的特定区室和/或指导来自原核或真核细胞的实施例的多肽的分泌。例如,在大肠杆菌(E.coli)中,人们可能希望指导蛋白质表达至周质空间。多肽可以融合以便指导多肽表达至细菌周质空间的信号序列或蛋白质(或其片段)的实例包括但不限于:pelB信号序列、麦芽糖结合蛋白(MBP)信号序列、MBP、ompA信号序列,周质性大肠杆菌不耐热肠毒素B亚基的信号序列和碱性磷酸酶的信号序列。用于构建将指导蛋白质定位的融合蛋白的若干种载体是可商购的,如可从新英格兰生物实验室(New England Biolabs)获得的pMAL系列的载体(特别是pMAL-p系列)。在具体实施例中,本公开的多肽可以与pelB果胶酸裂合酶信号序列融合,以增加革兰氏阴性菌中这些多肽的表达和纯化的效率(参见,美国专利号5,576,195和5,846,818)。可以将编码本公开的多肽的多核苷酸融合至植物质体转运肽。质体转运肽通常与待靶向的多肽(例如,融合配偶体)进行N-末端融合。在一个实施例中,融合蛋白基本上由质体转运肽和待靶向的本公开的多肽组成。在另一个实施例中,融合蛋白包含质体转运肽和待靶向的多肽。在这类实施例中,质体转运肽优选位于融合蛋白的N-末端。然而,如果该融合蛋白至少部分地靶向质体,另外的氨基酸残基可以是在质体转运肽的N-末端。在具体实施例中,质体转运肽在融合蛋白的N-末端一半处、N-末端三分之一处或N-末端四分之一处。当插入质体时,大部分或全部质体转运肽通常从融合蛋白上切割。由于特定的细胞间条件或所使用的转运肽/融合配偶体的组合,在不同植物发育阶段,切割位置可能在植物物种之间略有变化。在一个实施例中,质体转运肽切割是均匀的,使得切割位点在融合蛋白群体中是相同的。在另一个实施例中,质体转运肽不是均匀的,使得切割位点在融合蛋白群体中相差1-10个氨基酸。质体转运肽能以若干种方式之一重组融合到第二蛋白质。例如,可以将限制性内切核酸酶识别位点引入到对应于其C-末端的位置处的转运肽的核苷酸序列中,并且可以将相同或相容的位点工程改造为在其N-末端待靶向的蛋白质的核苷酸序列。必须注意设计这些位点,以确保转运肽和第二蛋白质的编码序列保持“框内”,以允许合成所需的融合蛋白。在一些情况下,当引入新的限制性位点时,优选去除第二蛋白质的起始因子甲硫氨酸。在两个亲本分子上引入限制性内切核酸酶识别位点,以及它们随后通过重组DNA技术连接可导致在转运肽和第二蛋白质之间添加一个或多个额外的氨基酸。如果转运肽切割位点保持可及,并且在其N-末端添加这些额外的氨基酸不改变第二蛋白质的功能,这通常不影响靶向活性。可替代地,本领域技术人员可以使用基因合成(Stemmer等人,(1995)Gene[基因]164:49-53)或相似的方法在转运肽和第二蛋白质(有或没有其起始子甲硫氨酸)之间产生精确的切割位点。另外,转运肽融合可以有意地包括切割位点下游的氨基酸。成熟蛋白质N-末端的氨基酸可影响转运肽将蛋白质靶向质体的能力和/或蛋白质输入后的切割效率。这可能取决于待靶向的蛋白质。参见,例如,Comai等人,(1988)J.Biol.Chem.[生物化学杂志]263(29):15104-9。在一些实施例中,本公开的多肽与异源信号肽或异源转运肽融合。

核酸分子及其变体和片段

提供了包含编码本公开的多肽或其生物活性部分的核酸序列的分离或重组的核酸分子,以及足以用作杂交探针以鉴定编码具有序列同源性区域的蛋白质的核酸分子的核酸分子。如本文所用的,术语“核酸分子”是指DNA分子(例如,重组DNA、cDNA、基因组DNA、质粒DNA、线粒体DNA)和RNA分子(例如,mRNA)以及使用核苷酸类似物而产生的DNA或RNA的类似物。核酸分子可以是单链的或双链的,但优选地是双链的DNA。

本文所用的“分离的”核酸分子(或DNA)是指不再处于其天然环境中(例如处于体外)的核酸序列(或DNA)。本文所用的“重组的”核酸分子(或DNA)是指在重组细菌或植物宿主细胞中的核酸序列(或DNA)。在一些实施例中,“分离的”或“重组的”核酸不含有在衍生所述核酸的生物体基因组DNA中天然地位于所述核酸侧翼的序列(即,位于所述核酸的5′和3′端的序列)(优选编码蛋白质的序列)。出于本公开的目的,“分离的”或“重组的”当用于指核酸分子时排除分离的染色体。例如,在不同实施例中,编码本公开的多肽的重组核酸分子可以包含小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核酸序列,所述核酸序列在源自核酸的细胞的基因组DNA中天然地位于所述核酸分子的侧翼。

在一些实施例中,编码本公开的多肽的分离核酸分子与天然或基因组核酸序列相比具有核酸序列的一个或多个变化。在一些实施例中,天然或基因组核酸序列的改变包括但不限于:由于遗传密码的简并性造成的核酸序列改变;与天然或基因组序列相比,由于氨基酸取代、插入、缺失和/或添加造成的核酸序列的改变;一个或多个内含子的去除;一个或多个上游或下游调节区的缺失;和与基因组核酸序列相关的5′和/或3′非翻译区域的缺失。在一些实施例中,编码本公开的多肽的核酸分子是非基因组序列。

考虑了编码本公开的多肽或相关蛋白的多种多核苷酸。当可操作地连接到合适的启动子、转录终止和/或聚腺苷酸化序列上时,这类多核苷酸可用于在宿主细胞中生产本公开的多肽。这类多核苷酸还可用作用于分离编码本公开的多肽或相关蛋白的同源或基本上同源的多核苷酸的探针。

编码IPD092-1多肽的多核苷酸

编码IPD092-1多肽或相关蛋白的多核苷酸的来源是假单胞菌属(Pseudomonas)或木洞菌属(Woodsholea)细菌。

在一些实施例中,提供了编码包含氨基酸序列的IPD092-1多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:24或SEQ ID NO:26。

在一些实施例中,本公开的多核苷酸编码包含SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:24或SEQ ID NO:26的氨基酸序列的IPD092-1多肽,其与在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:24或SEQ ID NO:26的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95或更多个氨基酸取代。

在一些实施例中,编码IPD092-1多肽的核酸分子包含SEQ ID NO:546、SEQ ID NO:549、SEQ ID NO:550、SEQ ID NO:552、SEQ ID NO:554、SEQ ID NO:556、SEQ ID NO:558或SEQ ID NO:560所示的序列、及其变体、片段和互补序列。本文所用的“多核苷酸序列变体”是指除遗传密码的简并性之外编码相同多肽的核酸序列。

编码IPD092-2多肽的多核苷酸

编码IPD092-2多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、色杆菌属(Chromobacterium)物种、伯克霍尔德菌属(Burkholderia)物种、和木洞菌属(Woodsholea)物种的细菌物种。

在一些实施例中,提供了编码IPD092-2多肽的多核苷酸,所述多肽与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25。

在一些实施例中,提供了编码包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25的氨基酸序列的IPD092-2多肽的多核苷酸,所述氨基酸序列与在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25的氨基酸序列的IPD092-2多肽的多核苷酸。

在一些实施例中,编码IPD092-2多肽的多核苷酸包含SEQ ID NO:547、SEQ ID NO:548、SEQ ID NO:551、SEQ ID NO:553、SEQ ID NO:555、SEQ ID NO:557、SEQ ID NO:559或SEQ ID NO:561所示的序列、及其变体、片段和互补序列。

编码IPD095-1多肽的多核苷酸

编码IPD095-1多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于沙雷氏菌属(Serratia)物种、勒米诺菌属(Leminorella)物种、迪基氏菌属(Dickeya)物种、肠杆菌属(Enterobacter)物种、欧文菌属(Erwinia)物种、耶尔森菌属(Yersinia)物种、和拉恩氏菌属(Rahnella)物种的细菌物种。

在一些实施例中,提供了编码包含氨基酸序列的IPD095-1多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ IDNO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ IDNO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58。

在一些实施例中,提供了编码包含氨基酸序列的IPD095-1多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:38、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:54、SEQ ID NO:56或SEQ ID NO:57。

在一些实施例中,提供了编码包含SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的氨基酸序列的IPD095-1多肽的多核苷酸,相比于在SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57或SEQ ID NO:58的氨基酸序列的IPD095-1多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:54、SEQ IDNO:56或SEQ ID NO:57的氨基酸序列的IPD095-1多肽的多核苷酸。

在一些实施例中,提供了编码IPD095-1多肽的多核苷酸,所述多肽包含SEQ IDNO:562、SEQ ID NO:564、SEQ ID NO:565、SEQ ID NO:566、SEQ ID NO:567、SEQ ID NO:568、SEQ ID NO:569、SEQ ID NO:570、SEQ ID NO:571、SEQ ID NO:572、SEQ ID NO:573或SEQ IDNO:574的核酸序列。

编码IPD095-2多肽的多核苷酸

编码IPD095-2多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于沙雷氏菌属(Serratia)物种、勒米诺菌属(Leminorella)物种、迪基氏菌属(Dickeya)物种、肠杆菌属(Enterobacter)物种、欧文菌属(Erwinia)物种、耶尔森菌属(Yersinia)物种、和拉恩氏菌属(Rahnella)物种的细菌物种。在一些实施例中,本公开的多核苷酸编码包含氨基酸序列IPD095-2多肽,的所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80、SEQ IDNO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ IDNO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ IDNO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ IDNO:99、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109、SEQ IDNO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119或SEQ ID NO:120。

在一些实施例中,本公开的多核苷酸编码包含氨基酸序列的IPD095-2多肽,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:78、SEQ IDNO:79、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ IDNO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:100、SEQID NO:103、SEQ ID NO:107、SEQ ID NO:119或SEQ ID NO:120。

在一些实施例中,提供了编码包含SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ IDNO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ IDNO:78、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ IDNO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ IDNO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ IDNO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101、SEQID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119或SEQ ID NO:120的氨基酸序列的IPD095-2多肽的多核苷酸,相比于在SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80、SEQ IDNO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ IDNO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ IDNO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ IDNO:99、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109、SEQ IDNO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119或SEQ ID NO:120的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85或更多个氨基酸取代。

在一些实施例中,本公开的多核苷酸编码包含SEQ ID NO:28、SEQ ID NO:59、SEQID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQID NO:78、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83、SEQID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQID NO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:105、SEQ ID NO:106、SEQ IDNO:107、SEQ ID NO:108、SEQ ID NO:109、SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ IDNO:118、SEQ ID NO:119或SEQ ID NO:120的氨基酸序列的IPD095-2多肽。

在一些实施例中,提供了编码包含SEQ ID NO:28、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:82、SEQ ID NO:83、SEQ IDNO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ IDNO:97、SEQ ID NO:99、SEQ ID NO:100、SEQ ID NO:103、SEQ ID NO:107、SEQ ID NO:119或SEQ ID NO:120的氨基酸序列的IPD095-2多肽的多核苷酸。

在一些实施例中,提供了编码IPD095-2多肽的多核苷酸,所述多肽包含SEQ IDNO:563、SEQ ID NO:575、SEQ ID NO:576、SEQ ID NO:577、SEQ ID NO:578、SEQ ID NO:579、SEQ ID NO:580、SEQ ID NO:581、SEQ ID NO:582、SEQ ID NO:583、SEQ ID NO:584、SEQ IDNO:585、SEQ ID NO:586、SEQ ID NO:587、SEQ ID NO:588或SEQ ID NO:589的核酸序列。

编码IPD097多肽的多核苷酸

编码IPD097多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于嗜血杆菌属(Haemophilus)物种、气单胞菌属(Aeromonas)物种、和梭菌目(Clostridiales)物种的细菌物种。在一些实施例中,提供了编码包含氨基酸序列的IPD097多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:121、SEQ IDNO:122、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ IDNO:133、SEQ ID NO:134或SEQ ID NO:135。

在一些实施例中,提供了编码包含氨基酸序列的IPD097多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ IDNO:131或SEQ ID NO:132。

在一些实施例中,提供了编码包含SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134或SEQ ID NO:135的氨基酸序列的IPD097多肽的多核苷酸,所述氨基酸序列与在SEQ IDNO:121、SEQ ID NO:122、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ IDNO:132、SEQ ID NO:133、SEQ ID NO:134或SEQ ID NO:135的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:123、SEQ ID NO:124、SEQ ID NO:125、SEQ ID NO:126、SEQ ID NO:127、SEQ ID NO:128、SEQID NO:129、SEQ ID NO:130、SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134或SEQ ID NO:135的氨基酸序列的IPD097多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:127、SEQ ID NO:128、SEQ ID NO:129、SEQ ID NO:131或SEQ ID NO:132的氨基酸序列的IPD097多肽的多核苷酸。

在一些实施例中,提供了编码IPD097多肽的多核苷酸,所述多肽包含SEQ ID NO:590的核酸序列。

编码IPD099-1多肽的多核苷酸

编码IPD099-1多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于气单胞菌属(Aeromonas)物种、嗜血杆菌属(Haemophilus)物种、伯克霍尔德菌属(Burkholderia)物种、色杆菌属(Chromobacterium)物种、欧文菌属(Erwinia)物种、沙雷氏菌属(Serratia)物种、盐弧菌属(Salinivibrio)物种、海水菌属(Aquimarina)物种、詹森菌属(Janthinobacterium)物种、单歧蓝细菌属(Tolypothrix)物种、发光杆菌属(Photobacterium)物种、詹森菌属(Janthinobacterium)物种、根瘤菌属(Rhizobium)物种、嗜冷菌属(Moritella)物种、普罗维登斯菌属(Providencia)物种、耶尔森菌属(Yersinia)物种和弧菌属(Vibrio)物种的细菌物种。

在一些实施例中,提供了编码包含氨基酸序列的IPD099-1多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:136、SEQ IDNO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ IDNO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ IDNO:161、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQ ID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ IDNO:172、SEQ ID NO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQ ID NO:179、SEQ ID NO:180、SEQ ID NO:181、SEQ ID NO:182、SEQ IDNO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQ ID NO:190、SEQ ID NO:191、SEQ ID NO:192、SEQ ID NO:193、SEQ IDNO:194、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQ ID NO:201、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:204、SEQ IDNO:205、SEQ ID NO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQ ID NO:212、SEQ ID NO:213、SEQ ID NO:214或SEQ ID NO:215。

在一些实施例中,提供了编码包含氨基酸序列的IPD099-1多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:155、SEQ IDNO:157、SEQ ID NO:158、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:180、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQ IDNO:192、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:205、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210或SEQ ID NO:215。

在一些实施例中,提供了编码包含SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQID NO:146、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQID NO:157、SEQ ID NO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ ID NO:161、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQID NO:179、SEQ ID NO:180、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQID NO:190、SEQ ID NO:191、SEQ ID NO:192、SEQ ID NO:193、SEQ ID NO:194、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQID NO:201、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:204、SEQ ID NO:205、SEQ ID NO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQID NO:212、SEQ ID NO:213、SEQ ID NO:214或SEQ ID NO:215的氨基酸序列的IPD099-1多肽的多核苷酸,相比于在SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:146、SEQ IDNO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ IDNO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ ID NO:161、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQ ID NO:168、SEQ IDNO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQ ID NO:179、SEQ IDNO:180、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQ ID NO:190、SEQ IDNO:191、SEQ ID NO:192、SEQ ID NO:193、SEQ ID NO:194、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQ ID NO:201、SEQ IDNO:202、SEQ ID NO:203、SEQ ID NO:204、SEQ ID NO:205、SEQ ID NO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQ ID NO:212、SEQ IDNO:213、SEQ ID NO:214或SEQ ID NO:215的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:141、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:144、SEQ ID NO:145、SEQID NO:146、SEQ ID NO:147、SEQ ID NO:148、SEQ ID NO:149、SEQ ID NO:150、SEQ ID NO:151、SEQ ID NO:152、SEQ ID NO:153、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQID NO:157、SEQ ID NO:158、SEQ ID NO:159、SEQ ID NO:160、SEQ ID NO:161、SEQ ID NO:162、SEQ ID NO:163、SEQ ID NO:164、SEQ ID NO:165、SEQ ID NO:166、SEQ ID NO:167、SEQID NO:168、SEQ ID NO:169、SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:172、SEQ ID NO:173、SEQ ID NO:174、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177、SEQ ID NO:178、SEQID NO:179、SEQ ID NO:180、SEQ ID NO:181、SEQ ID NO:182、SEQ ID NO:183、SEQ ID NO:184、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQ ID NO:188、SEQ ID NO:189、SEQID NO:190、SEQ ID NO:191、SEQ ID NO:192、SEQ ID NO:193、SEQ ID NO:194、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:198、SEQ ID NO:199、SEQ ID NO:200、SEQID NO:201、SEQ ID NO:202、SEQ ID NO:203、SEQ ID NO:204、SEQ ID NO:205、SEQ ID NO:206、SEQ ID NO:207、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210、SEQ ID NO:211、SEQID NO:212、SEQ ID NO:213、SEQ ID NO:214或SEQ ID NO:215的氨基酸序列的IPD099-1多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:136、SEQ ID NO:139、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:145、SEQ ID NO:148、SEQ ID NO:149、SEQID NO:150、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:180、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:187、SEQID NO:188、SEQ ID NO:189、SEQ ID NO:192、SEQ ID NO:195、SEQ ID NO:196、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:205、SEQ ID NO:208、SEQ ID NO:209、SEQ ID NO:210或SEQ ID NO:215的氨基酸序列的IPD099-1多肽的多核苷酸。

在一些实施例中,提供了编码IPD099-1多肽的多核苷酸,所述多肽包含SEQ IDNO:591、SEQ ID NO:594、SEQ ID NO:595、SEQ ID NO:596、SEQ ID NO:597、SEQ ID NO:598、SEQ ID NO:599、SEQID NO:600、SEQ ID NO:601、SEQ ID NO:602的核酸序列。

编码IPD099-2多肽的多核苷酸

编码IPD099-2多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于气单胞菌属(Aeromonais)物种、嗜血杆菌属(Haemophilus)物种、伯克霍尔德菌属(Burkholderia)物种、色杆菌属(Chromobacterium)物种、欧文菌属(Erwinia)物种、沙雷氏菌属(Serratia)物种、盐弧菌属(Salinivibrio)物种、海水菌属(Aquimarina)物种、詹森菌属(Janthinobacterium)物种、单歧蓝细菌属(Tolypothrix)物种、发光杆菌属(Photobacterium)物种、詹森菌属(Janthinobacterium)物种、根瘤菌属(Rhizobium)物种、嗜冷菌属(Moritella)物种、普罗维登斯菌属(Providencia)物种、耶尔森菌属(Yersinia)物种和弧菌属(Vibrio)物种的细菌物种。

在一些实施例中,提供了编码IPD099-2多肽的多核苷酸,所述IPD099-2多肽与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:137、SEQ ID NO:216、SEQID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:223、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQID NO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQID NO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQ ID NO:245、SEQ ID NO:246、SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQID NO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:256、SEQ ID NO:257、SEQ ID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ ID NO:267、SEQ ID NO:268、SEQ ID NO:269、SEQ ID NO:270或SEQ ID NO:271。

在一些实施例中,提供了编码包含氨基酸序列的IPD099-2多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:244、SEQ ID NO:246、SEQ IDNO:249、SEQ ID NO:251、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:262、SEQ ID NO:265、SEQ ID NO:268或SEQ ID NO:269。

在一些实施例中,提供了编码包含SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQID NO:223、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQ ID NO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQID NO:234、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQ ID NO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQID NO:245、SEQ ID NO:246、SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQ ID NO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQID NO:256、SEQ ID NO:257、SEQ ID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQID NO:267、SEQ ID NO:268、SEQ ID NO:269、SEQ ID NO:270或SEQ ID NO:271的氨基酸序列的IPD099-2多肽的多核苷酸,相比于在SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ IDNO:223、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQ ID NO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQ IDNO:234、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQ ID NO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQ IDNO:245、SEQ ID NO:246、SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQ ID NO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ IDNO:256、SEQ ID NO:257、SEQ ID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ IDNO:267、SEQ ID NO:268、SEQ ID NO:269、SEQ ID NO:270或SEQ ID NO:271的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQID NO:223、SEQ ID NO:224、SEQ ID NO:225、SEQ ID NO:226、SEQ ID NO:227、SEQ ID NO:228、SEQ ID NO:229、SEQ ID NO:230、SEQ ID NO:231、SEQ ID NO:232、SEQ ID NO:233、SEQID NO:234、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:237、SEQ ID NO:238、SEQ ID NO:239、SEQ ID NO:240、SEQ ID NO:241、SEQ ID NO:242、SEQ ID NO:243、SEQ ID NO:244、SEQID NO:245、SEQ ID NO:246、SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:249、SEQ ID NO:250、SEQ ID NO:251、SEQ ID NO:252、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQID NO:256、SEQ ID NO:257、SEQ ID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQID NO:267、SEQ ID NO:268、SEQ ID NO:269、SEQ ID NO:270或SEQ ID NO:271的氨基酸序列的IPD099-2多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:137、SEQ ID NO:216、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:230、SEQ ID NO:232、SEQID NO:244、SEQ ID NO:246、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:262、SEQ ID NO:265、SEQ ID NO:268或SEQ ID NO:269的氨基酸序列的IPD099-2多肽的多核苷酸。

在一些实施例中,提供了编码IPD099-2多肽的多核苷酸,所述多肽包含SEQ IDNO:592、SEQ ID NO:603或SEQ ID NO:605的核酸序列。

编码IPD099-3多肽的多核苷酸

编码IPD099-3多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于气单胞菌属(Aeromonas)物种、嗜血杆菌属(Haemophilus)物种、伯克霍尔德菌属(Burkholderia)物种、色杆菌属(Chromobacterium)物种、欧文菌属(Erwinia)物种、沙雷氏菌属(Serratia)物种、盐弧菌属(Salinivibrio)物种、海水菌属(Aquimarina)物种、詹森菌属(Janthinobacterium)物种、单歧蓝细菌属(Tolypothrix)物种、发光杆菌属(Photobacterium)物种、詹森菌属(Janthinobacterium)物种、根瘤菌属(Rhizobium)物种、嗜冷菌属(Moritella)物种、普罗维登斯菌属(Providencia)物种、耶尔森菌属(Yersinia)物种和弧菌属(Vibrio)物种的细菌物种。

在一些实施例中,提供了编码包含氨基酸序列的IPD099-3多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:138、SEQ IDNO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQ ID NO:279、SEQ ID NO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ IDNO:283、SEQ ID NO:284、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ IDNO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:297、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQ ID NO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ IDNO:305、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:309、SEQ ID NO:310、SEQ ID NO:311、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ IDNO:316、SEQ ID NO:317、SEQ ID NO:318、SEQ ID NO:319、SEQ ID NO:320、SEQ ID NO:321、SEQ ID NO:322、SEQ ID NO:323、SEQ ID NO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ IDNO:327、SEQ ID NO:328、SEQ ID NO:329、SEQ ID NO:330或SEQ ID NO:331。

在一些实施例中,提供了编码包含氨基酸序列的IPD099-3多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更大同一性:SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:285、SEQID NO:286、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:298、SEQID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:320、SEQID NO:323、SEQ ID NO:324、SEQ ID NO:326或SEQ ID NO:331。

在一些实施例中,提供了编码包含SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQID NO:279、SEQ ID NO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:284、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:297、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQID NO:301、SEQ ID NO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:305、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:309、SEQ ID NO:310、SEQ ID NO:311、SEQID NO:312、SEQ ID NO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ ID NO:316、SEQ ID NO:317、SEQ ID NO:318、SEQ ID NO:319、SEQ ID NO:320、SEQ ID NO:321、SEQ ID NO:322、SEQID NO:323、SEQ ID NO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ ID NO:327、SEQ ID NO:328、SEQ ID NO:329、SEQ ID NO:330或SEQ ID NO:331的氨基酸序列的IPD099-3多肽的多核苷酸,相比于在SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ IDNO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQ ID NO:279、SEQ ID NO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:284、SEQ ID NO:285、SEQ IDNO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ IDNO:297、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQ ID NO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:305、SEQ ID NO:306、SEQ ID NO:307、SEQ IDNO:308、SEQ ID NO:309、SEQ ID NO:310、SEQ ID NO:311、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ ID NO:316、SEQ ID NO:317、SEQ ID NO:318、SEQ IDNO:319、SEQ ID NO:320、SEQ ID NO:321、SEQ ID NO:322、SEQ ID NO:323、SEQ ID NO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ ID NO:327、SEQ ID NO:328、SEQ ID NO:329、SEQ IDNO:330或SEQ ID NO:331的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQID NO:279、SEQ ID NO:280、SEQ ID NO:281、SEQ ID NO:282、SEQ ID NO:283、SEQ ID NO:284、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:297、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQID NO:301、SEQ ID NO:302、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:305、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:309、SEQ ID NO:310、SEQ ID NO:311、SEQID NO:312、SEQ ID NO:313、SEQ ID NO:314、SEQ ID NO:315、SEQ ID NO:316、SEQ ID NO:317、SEQ ID NO:318、SEQ ID NO:319、SEQ ID NO:320、SEQ ID NO:321、SEQ ID NO:322、SEQID NO:323、SEQ ID NO:324、SEQ ID NO:325、SEQ ID NO:326、SEQ ID NO:327、SEQ ID NO:328、SEQ ID NO:329、SEQ ID NO:330或SEQ ID NO:331的氨基酸序列的IPD099-3多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:138、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:285、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:289、SEQID NO:290、SEQ ID NO:291、SEQ ID NO:292、SEQ ID NO:293、SEQ ID NO:294、SEQ ID NO:295、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:299、SEQ ID NO:300、SEQ ID NO:301、SEQID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:307、SEQ ID NO:308、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:320、SEQ ID NO:323、SEQ ID NO:324、SEQ ID NO:326、SEQID NO:331的氨基酸序列的IPD099-3多肽的多核苷酸。

在一些实施例中,提供了编码IPD099-3多肽的多核苷酸,所述多肽包含SEQ IDNO:593、SEQ ID NO:605、SEQ ID NO:606、SEQ ID NO:607、SEQ ID NO:608、SEQ ID NO;609或SEQ ID NO:610的核酸序列。

编码IPD100-1多肽的多核苷酸

编码IPD100-1多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、Candidatus物种、伯克霍尔德菌属(Burkholderia)物种、杜擀氏菌属(Duganella)物种、沙门氏菌属(Salmonella)物种、黄杆菌属(Tenacibaculum)物种、迪基氏菌属(Dickeya)、地杆菌属(Pedobacter)物种、和分枝杆菌属(Mycobacterium)物种的细菌物种。

在一些实施例中,提供了编码IPD100-1多肽的多核苷酸,所述IPD100-1多肽与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:332、SEQ ID NO:334、SEQID NO:335或SEQ ID NO:336。

在一些实施例中,提供了编码包含氨基酸序列的IPD100-1多肽的多核苷酸,所述氨基酸序列与SEQ ID NO:332的氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性。

在一些实施例中,提供了编码包含SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:335或SEQ ID NO:336的氨基酸序列的IPD100-1多肽的多核苷酸,所述氨基酸序列与在SEQID NO:332、SEQ ID NO:334、SEQ ID NO:335或SEQ ID NO:336的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:335或SEQ ID NO:336的氨基酸序列的IPD100-1多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:332的氨基酸序列的IPD100-1多肽的多核苷酸。

在一些实施例中,提供了编码IPD100-1多肽的多核苷酸,其包含SEQ ID NO:611的核酸序列。

编码IPD100-2多肽的多核苷酸

编码IPD100-2多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、韧皮部杆菌属(Candidatus)物种、伯克霍尔德菌属(Burkholderia)物种、杜擀氏菌属(Duganella)物种、沙门氏菌属(Salmonella)物种、黄杆菌属(Tenacibaculum)物种、迪基氏菌属(Dickeya)物种、地杆菌属(Pedobacter)物种、和分枝杆菌属(Mycobacterium)物种的细菌物种。

在一些实施例中,提供了编码包含氨基酸序列的IPD100-2多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:333、SEQ IDNO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQ ID NO:344、SEQ ID NO:345、SEQ ID NO:346、SEQ ID NO:347、SEQ IDNO:348或SEQ ID NO:349。

在一些实施例中,提供了编码包含氨基酸序列的IPD100-2多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQ ID NO:344或SEQ ID NO:347。

在一些实施例中,提供了编码包含SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQID NO:344、SEQ ID NO:345、SEQ ID NO:346、SEQ ID NO:347、SEQ ID NO:348或SEQ ID NO:349的氨基酸序列的IPD100-2多肽的多核苷酸,所述氨基酸序列与在SEQ ID NO:333、SEQID NO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQ ID NO:344、SEQ ID NO:345、SEQ ID NO:346、SEQ ID NO:347、SEQID NO:348或SEQ ID NO:349的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:339、SEQ ID NO:340、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQID NO:344、SEQ ID NO:345、SEQ ID NO:346、SEQ ID NO:347、SEQ ID NO:348或SEQ ID NO:349的氨基酸序列的IPD100-2多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:333、SEQ ID NO:337、SEQ ID NO:338、SEQ ID NO:341、SEQ ID NO:342、SEQ ID NO:343、SEQ ID NO:344或SEQ ID NO:347的氨基酸序列的IPD100-2多肽的多核苷酸。

在一些实施例中,提供了编码IPD100-2多肽的多核苷酸,所述多肽包含SEQ IDNO:612或SEQ ID NO:613的核酸序列。

编码IPD105多肽的多核苷酸

编码IPD105多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于色杆菌属(Chromobacterium)物种和色假高炳根氏菌属(Pseudogulbenkiania)物种的细菌物种。

在一些实施例中,提供了编码IPD105多肽的多核苷酸,所述IPD105多肽与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQ ID NO:354、SEQ ID NO:355、SEQ ID NO:356、SEQ ID NO:357、SEQID NO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365。

在一些实施例中,提供了编码包含氨基酸序列的IPD105多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:350、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357或SEQ ID NO:362。

在一些实施例中,提供了编码包含SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQ ID NO:354、SEQ ID NO:355、SEQ ID NO:356、SEQ ID NO:357、SEQID NO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365的氨基酸序列的IPD105多肽的多核苷酸,相比于在SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQ ID NO:354、SEQ IDNO:355、SEQ ID NO:356、SEQ ID NO:357、SEQ ID NO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:350、SEQ ID NO:351、SEQ ID NO:352、SEQ ID NO:353、SEQ ID NO:354、SEQ ID NO:355、SEQ ID NO:356、SEQ ID NO:357、SEQID NO:358、SEQ ID NO:359、SEQ ID NO:360、SEQ ID NO:361、SEQ ID NO:362、SEQ ID NO:363、SEQ ID NO:364或SEQ ID NO:365的氨基酸序列的IPD105多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:350、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、或SEQ ID NO:362的氨基酸序列的IPD105多肽的多核苷酸。

在一些实施例中,提供了编码IPD105多肽的多核苷酸,其包含SEQ ID NO:614、SEQID NO:615或SEQ ID NO:616的核酸序列。

编码IPD106-1多肽的多核苷酸

编码IPD106-1多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于Arsenicibacter物种和噬几丁质菌属(Chitinophaga)物种的细菌物种。

在一些实施例中,提供了编码IPD106-1多肽的多核苷酸,所述多肽与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:369、SEQ ID NO:370或SEQ ID NO:371。

在一些实施例中,提供了编码包含氨基酸序列的IPD106-1多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:366、SEQ ID NO:368或SEQ ID NO:369。

在一些实施例中,提供了编码包含SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:369、SEQ ID NO:370或SEQ ID NO:371的氨基酸序列的IPD106-1多肽的多核苷酸,所述氨基酸序列与在SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:369、SEQ ID NO:370或SEQ ID NO:371的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:369、SEQ ID NO:370、或SEQ ID NO:371的氨基酸序列的IPD106-1多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:366、SEQ ID NO:368或SEQ ID NO:369的氨基酸序列的IPD106-1多肽的多核苷酸。

在一些实施例中,提供了编码IPD105多肽的多核苷酸,其包含SEQ ID NO:617或SEQ ID NO:619的核酸序列。

编码IPD106-2多肽的多核苷酸

编码IPD106-2多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于Arsenicibacter物种和噬几丁质菌属(Chitinophaga)物种的细菌物种。

在一些实施例中,提供了编码包含氨基酸序列的IPD106-2多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:367、SEQ IDNO:372、SEQ ID NO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376。

在一些实施例中,提供了编码包含氨基酸序列的IPD106-2多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373或SEQ ID NO:376。

在一些实施例中,提供了编码包含SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376的氨基酸序列的IPD106-2多肽的多核苷酸,所述氨基酸序列与在SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373、SEQ ID NO:374、SEQ ID NO:375或SEQ ID NO:376的氨基酸序列的IPD106-2多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:367、SEQ ID NO:372、SEQ ID NO:373或SEQ ID NO:376的氨基酸序列的IPD106-2多肽的多核苷酸。

在一些实施例中,提供了编码IPD106-2多肽的多核苷酸,其包含SEQ ID NO:618或SEQ ID NO:620的核酸序列。

编码IPD107多肽的多核苷酸

编码IPD107多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、色杆菌属(Chromobacterium)物种、和慢生根瘤菌属(Bradyrhizobium)物种的细菌物种。

在一些实施例中,提供了编码包含氨基酸序列的IPD107多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:377、SEQ IDNO:378、SEQ ID NO:379、SEQ ID NO:380、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:383、SEQ ID NO:384、SEQ ID NO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ IDNO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ ID NO:393、SEQ ID NO:394、SEQ ID NO:395、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ IDNO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:406、SEQ ID NO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ IDNO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ IDNO:422、SEQ ID NO:423、SEQ ID NO:424、SEQ ID NO:425、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ IDNO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:438、SEQ ID NO:439、SEQ ID NO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ IDNO:444、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451或SEQ ID NO:452。

在一些实施例中,提供了编码包含氨基酸序列的IPD107多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:377、SEQ ID NO:378、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:384、SEQ IDNO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:400、SEQ IDNO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ IDNO:414、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ IDNO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:438、SEQ ID NO:439、SEQ ID NO:440、SEQ ID NO:442、SEQ IDNO:443、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:451或SEQ ID NO:452。

在一些实施例中,提供了编码包含SEQ ID NO:377、SEQ ID NO:378、SEQ ID NO:379、SEQ ID NO:380、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:383、SEQ ID NO:384、SEQID NO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ ID NO:393、SEQ ID NO:394、SEQ ID NO:395、SEQID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:406、SEQID NO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423、SEQ ID NO:424、SEQ ID NO:425、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:438、SEQ ID NO:439、SEQID NO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQID NO:451或SEQ ID NO:452的氨基酸序列的IPD107多肽的多核苷酸,所述氨基酸序列与在SEQ ID NO:377、SEQ ID NO:378、SEQ ID NO:379、SEQ ID NO:380、SEQ ID NO:381、SEQ IDNO:382、SEQ ID NO:383、SEQ ID NO:384、SEQ ID NO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ IDNO:393、SEQ ID NO:394、SEQ ID NO:395、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ IDNO:404、SEQ ID NO:405、SEQ ID NO:406、SEQ ID NO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ IDNO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423、SEQ ID NO:424、SEQ ID NO:425、SEQ IDNO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:436、SEQ IDNO:437、SEQ ID NO:438、SEQ ID NO:439、SEQ ID NO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:447、SEQ IDNO:448、SEQ ID NO:449、SEQ ID NO:450、SEQ ID NO:451或SEQ ID NO:452的相应位置处的天然氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:377、SEQ ID NO:378、SEQ ID NO:379、SEQ ID NO:380、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:383、SEQ ID NO:384、SEQID NO:385、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ ID NO:393、SEQ ID NO:394、SEQ ID NO:395、SEQID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:399、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:406、SEQID NO:407、SEQ ID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423、SEQ ID NO:424、SEQ ID NO:425、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQ ID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:438、SEQ ID NO:439、SEQID NO:440、SEQ ID NO:441、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:445、SEQ ID NO:446、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:450、SEQID NO:451或SEQ ID NO:452的氨基酸序列的IPD107多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:377、SEQ ID NO:378、SEQ ID NO:381、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:387、SEQ ID NO:388、SEQID NO:389、SEQ ID NO:390、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:401、SEQ ID NO:402、SEQ ID NO:403、SEQID NO:404、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:417、SEQID NO:418、SEQ ID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:426、SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:429、SEQ ID NO:430、SEQ ID NO:431、SEQID NO:432、SEQ ID NO:433、SEQ ID NO:434、SEQ ID NO:435、SEQ ID NO:438、SEQ ID NO:439、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:446、SEQID NO:451或SEQ ID NO:452的氨基酸序列的IPD107多肽的多核苷酸。

在一些实施例中,提供了编码IPD107多肽的多核苷酸,所述多肽包含SEQ ID NO:621、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQID NO:627或SEQ ID NO:628的核酸序列。

编码IPD111多肽的多核苷酸

编码IPD111多肽同源物或相关蛋白的多核苷酸的来源包括选自但不限于假单胞菌属(Pseudomonas)物种、色杆菌属(Chromobacterium)物种、和伯克霍尔德菌属(Burkholderia)物种的细菌物种。

在一些实施例中,提供了编码包含氨基酸序列的IPD111多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性:SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQ ID NO:456、SEQ ID NO:457、SEQ ID NO:458、SEQ ID NO:459、SEQID NO:460、SEQ ID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQID NO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:477、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:480、SEQ ID NO:481、SEQID NO:482、SEQ ID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQ ID NO:488、SEQ ID NO:489、SEQ ID NO:490、SEQ ID NO:491、SEQ ID NO:492、SEQID NO:493、SEQ ID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524、SEQ ID NO:525、SEQID NO:526、SEQ ID NO:527或SEQ ID NO:528。

在一些实施例中,提供了编码包含氨基酸序列的IPD111多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的同一性:SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQ ID NO:456、SEQ ID NO:462、SEQ IDNO:463、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ IDNO:475、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:489、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ IDNO:502、SEQ ID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ IDNO:513、SEQ ID NO:514、SEQ ID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ IDNO:524或SEQ ID NO:526。

在一些实施例中,提供了编码包含SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQ ID NO:456、SEQ ID NO:457、SEQ ID NO:458、SEQ ID NO:459、SEQ ID NO:460、SEQID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:477、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:480、SEQ ID NO:481、SEQ ID NO:482、SEQID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQ ID NO:488、SEQ ID NO:489、SEQ ID NO:490、SEQ ID NO:491、SEQ ID NO:492、SEQ ID NO:493、SEQID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524、SEQ ID NO:525、SEQ ID NO:526、SEQID NO:527或SEQ ID NO:528的氨基酸序列的IPD111多肽的多核苷酸,相比于在SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQ ID NO:456、SEQ ID NO:457、SEQ ID NO:458、SEQID NO:459、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQID NO:470、SEQ ID NO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:477、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:480、SEQID NO:481、SEQ ID NO:482、SEQ ID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQ ID NO:488、SEQ ID NO:489、SEQ ID NO:490、SEQ ID NO:491、SEQID NO:492、SEQ ID NO:493、SEQ ID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQID NO:514、SEQ ID NO:515、SEQ ID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524、SEQID NO:525、SEQ ID NO:526、SEQ ID NO:527或SEQ ID NO:528的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQ ID NO:456、SEQ ID NO:457、SEQ ID NO:458、SEQ ID NO:459、SEQ ID NO:460、SEQID NO:461、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:465、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:477、SEQ ID NO:478、SEQ ID NO:479、SEQ ID NO:480、SEQ ID NO:481、SEQ ID NO:482、SEQID NO:483、SEQ ID NO:484、SEQ ID NO:485、SEQ ID NO:486、SEQ ID NO:487、SEQ ID NO:488、SEQ ID NO:489、SEQ ID NO:490、SEQ ID NO:491、SEQ ID NO:492、SEQ ID NO:493、SEQID NO:494、SEQ ID NO:495、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524、SEQ ID NO:525、SEQ ID NO:526、SEQID NO:527或SEQ ID NO:528的氨基酸序列的IPD111多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:453、SEQ ID NO:454、SEQ ID NO:455、SEQ ID NO:456、SEQ ID NO:462、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:466、SEQID NO:467、SEQ ID NO:468、SEQ ID NO:469、SEQ ID NO:470、SEQ ID NO:471、SEQ ID NO:472、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:475、SEQ ID NO:476、SEQ ID NO:478、SEQID NO:479、SEQ ID NO:489、SEQ ID NO:496、SEQ ID NO:497、SEQ ID NO:498、SEQ ID NO:499、SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQID NO:505、SEQ ID NO:506、SEQ ID NO:507、SEQ ID NO:508、SEQ ID NO:509、SEQ ID NO:510、SEQ ID NO:511、SEQ ID NO:512、SEQ ID NO:513、SEQ ID NO:514、SEQ ID NO:515、SEQID NO:516、SEQ ID NO:517、SEQ ID NO:518、SEQ ID NO:519、SEQ ID NO:520、SEQ ID NO:521、SEQ ID NO:522、SEQ ID NO:523、SEQ ID NO:524或SEQ ID NO:526的氨基酸序列的IPD111多肽的多核苷酸。

在一些实施例中,提供了编码IPD111多肽的多核苷酸,所述多肽包含SEQ ID NO:629、SEQ ID NO:630、SEQ ID NO:631、SEQ ID NO:632、SEQ ID NO:633或SEQ ID NO:634的核酸序列。

编码IPD112多肽的多核苷酸

IPD112多肽同源物或相关蛋白的来源包括选自但不限于假单胞菌属(Pseudomonas)物种和哈夫尼亚菌属(Hafnia)物种的细菌物种。

在一些实施例中,提供了编码包含氨基酸序列的IPD112多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性:SEQ ID NO:529、SEQ IDNO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQ ID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ IDNO:541、SEQ ID NO:542、SEQ ID NO:543、SEQ ID NO:544或SEQ ID NO:545。

在一些实施例中,提供了编码包含氨基酸序列的IPD112多肽的多核苷酸,所述氨基酸序列与以下氨基酸序列的全长具有至少95%、95.5%、96%、96.5%、97%、97%.5%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更大同一性:SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:534、SEQ IDNO:537或SEQ ID NO:545。

在一些实施例中,提供了编码包含SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ ID NO:542、SEQ ID NO:543、SEQ ID NO:544或SEQ ID NO:545的氨基酸序列的IPD112多肽的多核苷酸,相比于在SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ IDNO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQ ID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ ID NO:542、SEQ ID NO:543、SEQ IDNO:544或SEQ ID NO:545的相应位置处的天然氨基酸,所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90或更多个氨基酸取代。

在一些实施例中,提供了编码包含SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:533、SEQ ID NO:534、SEQ ID NO:535、SEQ ID NO:536、SEQID NO:537、SEQ ID NO:538、SEQ ID NO:539、SEQ ID NO:540、SEQ ID NO:541、SEQ ID NO:542、SEQ ID NO:543、SEQ ID NO:544或SEQ ID NO:545的氨基酸序列的IPD112多肽的多核苷酸。

在一些实施例中,提供了编码包含SEQ ID NO:529、SEQ ID NO:530、SEQ ID NO:531、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:537或SEQ ID NO:545的氨基酸序列的IPD112多肽的多核苷酸。

在一些实施例中,提供了编码IPD112多肽的多核苷酸,所述多肽包含SEQ ID NO:635、SEQ ID NO:636、SEQ ID NO:637或SEQ ID NO:638的核酸序列。

可以使用本公开的多核苷酸以在重组细菌宿主(包括但不限于农杆菌属、芽孢杆菌属、埃希氏菌属、沙门氏菌属、假单胞菌属和根瘤菌属细菌宿主细胞)中表达公开的多肽。多核苷酸还可用作用于分离编码公开的杀昆虫多肽或相关蛋白的同源或基本上同源的多核苷酸的探针。这样的探针可用于鉴定源自假单胞菌属物种的同源或基本上同源的多核苷酸。

编码公开的多肽的多核苷酸也可以从公开的多肽序列从头合成。多核苷酸基因的序列可以通过使用遗传密码从公开的多肽序列推导出来。计算机程序如“BackTranslate”(GCGTM包,阿克莱瑞公司,圣迭戈市,加利福尼亚州)可用于将肽序列转换成编码所述肽的相应核苷酸序列。此外,本公开的合成的多核苷酸序列可以被设计成使得它们在植物中表达。

在一些实施例中,编码本公开的多肽的核酸分子是非基因组核酸序列。如本文所用的,“非基因组核酸序列”或“非基因组核酸分子”或“非基因组多核苷酸”是指与天然或基因组核酸序列相比,在所述核酸序列上具有一个或多个改变的核酸分子。在一些实施例中,天然或基因组核酸分子的改变包括但不限于:由于遗传密码的简并性造成的核酸序列改变;用于在植物中表达的核酸序列的优化;与天然或基因组序列相比,引入至少一个氨基酸取代、插入、缺失和/或添加的核酸序列的改变;去除与所述基因组核酸序列相关联的一个或多个内含子;插入一个或多个异源内含子;缺失与所述基因组核酸序列相关联的一个或多个上游或下游调节区;插入一个或多个异源上游或下游调节区;缺失与所述基因组核酸序列相关的5′和/或3′非翻译区;插入异源5’和/或3’非翻译区;和聚腺苷酸化位点的修饰。在一些实施例中,所述非基因组核酸分子是合成的核酸序列。

还提供了编码转录和/或翻译产物的核酸分子,所述转录和/或翻译产物随后被剪接以最终产生本公开的功能性多肽。剪接可以在体外或体内完成,并且可以涉及顺式或反式剪接。用于剪接的底物可以是多核苷酸(例如,RNA转录物)或多肽。多核苷酸的顺式剪接的实例是去除插入到编码序列中的内含子并剪接两个侧翼外显子区域以产生本公开的多肽的编码序列。反式剪接的实例是通过将所述编码序列分离成两个或更多个片段来对多核苷酸进行加密,所述片段可以单独转录并且然后被剪接以形成全长的杀有害生物编码序列。使用可以引入到构建体中的剪接增强子序列可以促进多肽的顺式或反式剪接(美国专利号6,365,377和6,531,316)。因此,在一些实施例中,多核苷酸不直接编码本公开的全长多肽,而是编码本公开的多肽的一个或多个片段。这些多核苷酸可用于通过涉及剪接的机制来表达本公开的功能性多肽,其中剪接可以在多核苷酸(例如,内含子/外显子)和/或多肽(例如,内含肽/外显肽)的水平上发生。这可以用于,例如,控制杀有害生物活性的表达,因为如果在允许剪接过程以产生功能性产物的环境中表达所有必需的片段,则仅表达功能性杀有害生物多肽。在另一个实例中,将一个或多个插入序列引入多核苷酸中可促进与低同源性多核苷酸的重组;使用针对所述插入序列的内含子或内含肽便于去除所述间插序列,从而恢复经编码的变体的功能。

作为编码本公开的多肽的这些核酸序列的片段的核酸分子也涵盖在实施例中。如本文使用的“片段”是指编码本公开的多肽的核酸序列的部分。核酸序列的片段可以编码本公开的多肽的生物活性部分,或者它可以是可以用作使用以下公开的方法的杂交探针或PCR引物的片段。作为编码本公开的多肽的核酸序列的片段的核酸分子包含至少约150、180、210、240、270、300、330或360个连续核苷酸或高至存在于编码本文公开的本公开的多肽的全长核酸序列中的核苷酸数目,这取决于预期用途。本文所用的“连续核苷酸”是指彼此紧邻的核苷酸残基。实施例的核酸序列的片段将编码保留本公开的多肽的生物活性并因此保留杀昆虫活性的蛋白片段。“保留杀昆虫活性”在本文中用于是指具有本公开的全长多肽的至少约10%、至少约30%、至少约50%、至少约70%、80%、90%、95%或更高的杀昆虫活性。在一些实施例中,所述杀昆虫活性针对鳞翅目物种。在一个实施例中,所述杀昆虫活性针对鞘翅目物种。在一些实施例中,所述杀昆虫活性针对玉米根虫复合体的一种或多种昆虫有害生物:西方玉米根虫,玉米根萤叶甲(Diabrotica virgifera);北方玉米根虫,巴氏根萤叶甲(D.barberi);南方玉米根虫或斑点黄瓜甲虫;斑点黄瓜甲虫(Diabroticaundecimpunctata howardi),和墨西哥玉米根虫(Mexican corn rootworm,D.virgiferazeae)。在一个实施例中,所述杀昆虫活性针对根萤叶甲属(Diabrotica)物种。

为了确定两种氨基酸序列或两种核酸序列的同一性百分比,出于最佳比较目的,将序列进行比对。两个核酸的百分比同一性是这些序列共有相同位置的数目的函数(即,百分比同一性=相同位置的数目/位置总数(例如,重叠位置)×100)。在一个实施例中,两个序列具有相同的长度。在另一个实施例中,比较是在整个参比序列中进行(例如,在整个SEQID NO:1中)。可使用类似于下面所述的那些技术的技术,在容许或不容许缺口的情况下确定两个序列之间的百分比同一性。在计算百分比同一性中,典型地计数确切的匹配。

用于比较序列的数学算法的另一个非限制性实例是如下文献中所述算法:Needleman和Wunsch,(1970)J.Mol.Biol.[分子生物学杂志]48(3):443-453,使用GAP版本10软件来确定序列同一性或相似性,使用以下默认参数:对于核酸序列的%同一性和%相似性,使用GAP权重为50和长度权重为3,以及nwsgapdna.cmpii评分矩阵;对于氨基酸序列的%同一性或%相似性,使用GAP权重为8和长度权重为2,以及BLOSUM62评分程序。也可采用等效程序。本文所使用的“等效程序”是指任何序列比较程序,所述程序对于任何两个所讨论的序列产生一个比对,当与GAP版本10所产生的对应的比对相比较时,所述比对具有相同的核苷酸残基配对以及相同的序列同一性百分比。

在一些实施例中,提供了编码嵌合多肽的多核苷酸,所述嵌合多肽包含本公开的至少两种不同多肽的区域。

所述实施例还涵盖编码本公开的多肽的变体的核酸分子。编码核酸序列的本公开的多肽的“变体”包括编码本公开的多肽但是由于遗传密码的简并性而存在保守差异的那些序列以及如上所讨论的充分同一的那些序列。可以使用技术鉴定天然存在的等位基因变体,例如聚合酶链式反应(PCR)和如下文概述的杂交技术。变体核酸序列还包括合成来源的核酸序列,所述核酸序列例如通过使用定向诱变而产生,但是仍然编码如下所讨论的本公开的多肽。

本公开提供编码本公开的任何多肽的分离或重组多核苷酸。本领域普通技术人员将容易理解,由于遗传密码的简并性,存在编码本公开的多肽的许多核苷酸序列。

可以通过核酸序列的突变引入改变,从而导致编码的本公开的多肽的氨基酸序列的改变,而不改变蛋白的生物活性。因此,变体核酸分子可以通过以下方式产生:将一个或多个核苷酸取代、添加和/或缺失引入本文公开的相应的核酸序列中,这样使得将一个或多个氨基酸取代、添加或缺失引入所编码的蛋白质中。通过标准技术可以引入突变,如定向诱变和PCR介导的诱变。此类变体核酸序列也被本公开所涵盖。

可替代地,可以通过沿编码序列的全部或部分随机引入突变(如通过饱和诱变)来制备变体核酸序列,并且可以筛选所得突变体赋予杀有害生物活性以鉴定保留活性的突变体的能力。在诱变之后,所编码的蛋白质可以进行重组表达,并且所述蛋白质的活性可以使用标准的测定技术来确定。

本公开的多核苷酸及其片段任选用作各种重组和递归(recursive)重组反应的底物,除了例如Ausubel、Berger和Sambrook所述的标准克隆方法之外,即,以产生具有所需特性的另外的杀有害生物多肽同源物及其片段。用于生产本文列出的任何核酸的变体的方法(这些方法包括将此类多核苷酸与第二(或更多)多核苷酸递归重组,从而形成变体多核苷酸文库)也是本公开的实施例,所产生的文库、包含所述文库的细胞和通过此类方法产生的任何重组多核苷酸也是如此。另外,此类方法任选地包括基于杀有害生物活性从此类文库中选择变体多核苷酸,正如其中此类递归重组在体外或体内进行。

各种多样性产生方案(包括核酸递归重组方案)是可获得的并且在本领域中被充分描述。所述程序可以单独和/或组合使用以产生核酸或核酸集合的一种或多种变体,以及所编码蛋白质的变体。单独地或整体地,这些程序提供了产生多样化核酸和核酸集合(包括例如核酸文库)的稳健且广泛适用的方式,所述方式可用于,例如,具有新的和/或改善的特征的核酸、蛋白质、途径、细胞和/或生物体的工程化或快速进化。

虽然为清除起见,在随后的讨论过程中作出了区分和分类,但是应当理解,所述技术通常不是相互排斥的。实际上,各种方法可以单独使用或组合、平行或串联使用,以便取得不同的序列变体。

本文所述的任何多样性产生程序的结果可以是一种或多种核酸的产生,其可以选择或筛选具有或赋予所需特性的核酸或编码具有或者赋予所需特性的蛋白质的核酸。通过本文的或技术人员以其他方式可用的一种或多种方法进行多样化之后,可以针对所需的活性或特性(例如,杀有害生物活性)或在所需的pH下的这种活性等选择所产生的任何核酸。这可以包括通过本领域任何测定来鉴定可以例如以自动化或可自动化形式检测的任何活性,参见例如以下的杀昆虫活性筛选的讨论。各种相关(或甚至不相关)的特性可以由执业者酌情串联或平行评估。

实施例的核苷酸序列还可以用于从细菌来源分离相应的序列,这些细菌来源包括但不限于假单胞菌属物种。以这种方式,可以使用如PCR、杂交等方法来鉴定此类序列(基于其与本文所示序列的序列同源性)。实施例涵盖基于与本文所示全部序列或其片段的序列同一性选择的序列。此类序列包括作为公开序列的直向同源物的序列。术语“直向同源物”是指源自共同祖先基因并且由于物种形成而在不同物种中发现的基因。当其核苷酸序列和/或其编码的蛋白序列共有如本文其他地方所定义的基本同一性时,在不同物种中发现的基因被认为是直向同源物。直向同源物的功能通常在物种间是高度保守的。

在PCR方法中,可以设计寡核苷酸引物用于PCR反应,以从由任何目的生物体提取的cDNA或基因组DNA扩增相应的DNA序列。用于设计PCR引物以及PCR克隆的方法可以在以下文献中找到:Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册](第2版,Cold Spring Harbor Laboratory Press[冷泉港实验室出版社],Plainview[普莱恩维尤],纽约),以下为“Sambrook”中。还参见,Innis等人编辑,(1990)PCRProtocols:A Guide to Methods and Applications[PCR方案:方法和应用指南](Academic Press[学术出版社],纽约);Innis和Gelfand编辑,(1995)PCR Strategies[PCR策略](Academic Press[学术出版社],纽约);和Innis和Gelfand编辑,(1999)PCR MethodsManual[PCR方法手册](Academic Press[学术出版社],纽约)。PCR方法包括但不限于:使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。

为了从细菌集合中鉴定潜在的本公开的多肽,可以使用蛋白质印迹和/或ELISA方法用针对本公开的多肽产生的抗体筛选细菌细胞裂解物。这种类型的测定能以高通量方式进行。可以通过各种技术(如基于抗体的蛋白质纯化和鉴定)进一步分析阳性样品。

可替代地,基于质谱的蛋白质鉴定方法可以使用文献中的方案用于鉴定本公开的多肽的同源物(Scott Patterson,(1998),10.22,1-24,由约翰威利父子出版公司(JohnWiley&Son Inc)出版的Current Protocol in Molecular Biology[当前分子生物学方案])。具体来说,使用基于LC-MS/MS的蛋白质鉴定方法将给定细胞裂解物或所需分子量富集样品(从本公开的多肽的相关分子量带的SDS-PAGE凝胶切除)的MS数据与本公开的多肽的序列信息结合。肽序列中的任何匹配表明在样品中具有同源蛋白的可能性。可以使用另外技术(蛋白质纯化和分子生物学)来分离蛋白质并鉴定同源物的序列。

在杂交方法中,全部或部分杀有害生物核酸序列可用于筛选cDNA或基因组文库。用于构建此类cDNA和基因组文库的方法可以在以下文献中找到:Sambrook和Russell,(2001),同上。所谓的杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其他寡核苷酸,并且可以用一个可检测基团(如32P或任何其他可检测的标记,如其他放射性同位素、荧光化合物、酶或酶辅因子)进行标记。用于杂交的探针可以通过标记基于本文公开的编码已知的本公开的多肽的核酸序列的合成的寡核苷酸来制备。可以另外使用简并引物,这些简并引物是基于在该核酸序列或所编码的氨基酸序列中的保守性核苷酸或氨基酸残基而设计的。这种探针典型地包含以下核酸序列的区域,该核酸序列区域在严格条件下与编码本公开的多肽的核酸序列或其片段或变体的至少约12个、至少约25个、至少约50、75、100、125、150、175或200个连续核酸进行杂交。用于制备用于杂交的探针的方法可以在以下文献中找到:Sambrook和Russell,(2001),同上,其通过引用并入本文。

杂交可以在严格条件下进行。本文所用的“严格条件”或“严格杂交条件”是指探针与其靶序列杂交的程度将比它与其他序列杂交的程度可检测地更高(例如,比背景高至少2倍)的条件。严格条件是序列依赖性的,并且在不同情况下将有所不同。通过控制杂交和/或洗涤条件的严格性,可以鉴定与所述探针100%互补的靶序列(同源探测)。可替代地,可以调节严格条件以允许序列中的一些错配,以便检测到更低程度的相似性(异源探测)。通常,探针的长度为小于约1000个核苷酸,优选地长度小于500个核苷酸。

组合物

还涵盖包含至少一种本公开的多肽的组合物。在一个实施例中,所述组合物包含本公开的多肽和农业上可接受的载体。

本公开的一个实施例涉及一种组合物,所述组合物包含本公开的多肽和选自罗伯茨绿僵菌(Metarhizium robertsii)和金龟子绿僵菌(Metarhizium anisopliae)的昆虫病原真菌菌株。在某些实施例中,所述真菌昆虫病原体包含孢子、微菌核、或分生孢子。在一些实施例中,真菌昆虫病原体具有杀昆虫活性。

在一个实施例中,本公开涉及一种用于增加对植物有害生物、病原体、或昆虫的抗性或用于增加植物健康和/或产量的组合物,所述组合物包含本公开的多肽和一种或多种选自由以下组成的组的昆虫病原真菌菌株:金龟子绿僵菌15013-1(NRRL 67073)、罗伯茨绿僵菌23013-3(NRRL 67075)、金龟子绿僵菌3213-1(NRRL 67074)、或其任何组合。在另一个实施例中,本公开涉及一种组合物,所述组合物包含本公开的多肽和农业上可接受的载体和选自由以下组成的组的真菌昆虫病原体:金龟子绿僵菌15013-1、罗伯茨绿僵菌23013-3、金龟子绿僵菌3213-1、或其任何组合。在另外的实施例中,所述真菌昆虫病原体包含孢子、分生孢子、或微菌核。在另一个实施例中,本公开涉及一种组合物,所述组合物包含本公开的多肽和一种或多种选自由以下组成的组的昆虫病原真菌菌株:金龟子绿僵菌15013-1(NRRL 67073)、罗伯茨绿僵菌23013-3(NRRL 67075)、金龟子绿僵菌3213-1(NRRL 67074)、这些菌株的突变体、由本文公开的菌株(这些菌株针对植物有害生物、病原体或昆虫、或其任何组合表现出杀昆虫活性)产生的代谢物或代谢物的组合。

抗体

还涵盖本公开的多肽的抗体或者本公开的多肽的变体或片段的抗体。本公开的抗体包括保留其结合昆虫肠道中发现的本公开的多肽的能力的多克隆和单克隆抗体及其片段。

提供了用于在样品中检测本公开的多肽的存在或检测编码本公开的多肽的核苷酸序列的存在的试剂盒。在一个实施例中,试剂盒提供基于抗体的试剂,用于检测组织样品中本公开的多肽的存在。在另一个实施例中,试剂盒提供用于检测编码本公开的多肽的一种或多种多核苷酸的存在的标记的核酸探针。将所述试剂盒与用于进行检测方法的适当的试剂和对照物,以及试剂盒的使用说明书一起提供。

受体鉴定和分离

还涵盖了针对本公开的多肽或其变体或片段的受体。用于鉴定受体的方法可以在以下文献中找到:Hofmann等人,(1988)Eur.J.Biochem.[欧洲生物化学杂志]173:85-91;Gill等人,(1995)J.Biol.Chem.[生物化学杂志]27277-27282),其中可以使用来自易感昆虫的刷状缘膜囊泡将这些方法用于鉴定和分离识别本公开的多肽的受体。除了所引用的文献中列出的放射性标记方法之外,可以将本公开的多肽用荧光染料和其他常见标记如链霉亲和素进行标记。可以根据参考文献中列出的方案制备易感昆虫(如大豆夜蛾和椿象)的刷状缘膜囊泡(BBMV),并在SDS-PAGE凝胶上分离,并在合适的膜上印迹。本公开的标记的多肽可以与BBMV的印迹膜一起孵育,并且标记的本公开的多肽可以用标记的报道基因鉴定。与之相互作用的一个或多个蛋白带的鉴定可以通过基于N-末端氨基酸气相测序或基于质谱的蛋白鉴定方法进行检测(Patterson,(1998)10.22,1-24,由约翰威利父子出版公司(JohnWiley&Son Inc)出版的Current Protocol in Molecular Biology[当前分子生物学方案])。一旦鉴定出蛋白质,可以从易感昆虫的基因组DNA或cDNA文库中克隆相应的基因,并且可以直接用本公开的多肽测量结合亲和力。通过本公开的多肽的杀昆虫活性的受体功能可以通过RNAi型的基因敲除法完成验证(Rajagopal等人,(2002)J.Biol.Chem.[生物化学杂志]277:46849-46851)。

核苷酸构建体、表达盒和载体

本文使用术语“核苷酸构建体”并不旨在将实施例限制为包含DNA的核苷酸构建体。本领域普通技术人员将认识到,核苷酸构建体,特别是由核糖核苷酸构成的多核苷酸和寡核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合也可用于本文公开的方法中。实施例的核苷酸构建体、核酸和核苷酸序列另外涵盖这种构建体、分子和序列的所有互补形式。此外,实施例的核苷酸构建体、核苷酸分子和核苷酸序列涵盖能用于实施例的转化植物方法的所有核苷酸构建体、分子和序列,包括但不限于由脱氧核糖核苷酸、核糖核苷酸及其组合所构成的那些。这种脱氧核糖核苷酸和核糖核苷酸既包括天然存在的分子也包括合成的类似物。实施例的核苷酸构建体、核酸和核苷酸序列还涵盖核苷酸构建体的所有形式,所述形式包括但不限于单链形式、双链形式、发夹、茎环结构等。

另外的实施例涉及经转化的生物体,如选自以下的生物体:植物和昆虫细胞、细菌、酵母、杆状病毒、原生动物、线虫和藻的生物体。经转化的生物体包含:实施例的DNA分子、含有DNA分子的表达盒或含有表达盒的载体,它可以稳定地并入经转化的生物体的基因组。

在DNA构建体中提供实施例的序列,用于在目的生物体中表达。所述构建体将包括可操作地连接到实施例的序列的5′和3′的调节序列。如本文所用的,术语“可操作地连接”是指启动子和第二序列之间的功能性连接,其中启动子序列启动并介导相应于第二序列的DNA序列的转录。通常,可操作地连接意味着所连接的核酸序列是连续的,并且在必要时在相同阅读框中连接两个蛋白质编码区域。所述构建体可以另外含有待共转化进生物体的至少一个另外的基因。可替代地,可以在多个DNA构建体上提供一个或多个另外的基因。

提供的这种DNA构建体具有用于插入本公开的本公开的多肽基因序列的多个限制性位点,该多肽基因序列将位于调节性区域的转录调节之下。DNA构建体可以另外包含选择性标记基因。

一般来说,DNA构建体在5′至3′的转录方向上将包括:转录和翻译起始区(即启动子)、实施例的DNA序列、以及在作为宿主的生物体中起作用的转录和翻译终止区(即终止区)。针对实施例的宿主生物体和/或序列,转录起始区(即,启动子)可以是天然的、类似的、外源的或异源的。此外,所述启动子可以是天然序列,或可替代地,是合成序列。如本文所用的,术语“外源”表示在引入启动子的天然生物体中没有发现启动子。在启动子对于实施例的序列而言是“外源的”或“异源的”情况下,它是指所述启动子对于实施例的可操作地连接的序列而言不是天然的或天然存在的启动子。如本文所用的,嵌合基因包含可操作地连接到转录起始区的编码序列,所述转录起始区对于所述编码序列是异源的。当所述启动子是天然(native或natural)序列时,可操作地连接的序列的表达从野生型表达变化,这导致表型的改变。

在一些实施例中,所述DNA构建体包含编码本公开的多肽的多核苷酸。

在一些实施例中,所述DNA构建体包含编码本公开的嵌合多肽的多核苷酸。

在一些实施例中,所述DNA构建体包含多核苷酸,所述多核苷酸编码含有本公开的多肽的融合蛋白。

在一些实施例中,所述DNA构建体还可以包括转录增强子序列。如本文所用的,术语“增强子”是指可以刺激启动子活性的DNA序列,并且可以是插入以增强启动子的水平或组织特异性的启动子的先天元件或异源元件。也可以使用各种增强子,其例如包括在植物中具有基因表达增强特性的内含子(美国专利申请公开号2009/0144863)、泛素内含子(即,玉蜀黍泛素内含子1(参见,例如,NCBI序列S94464))、ω增强子或ω主要增强子(Gallie等人,(1989)Molecular Biology of RNA[RNA的分子生物学],编辑:Cech(Liss公司,纽约)237-256和Gallie等人,(1987)Gene[基因]60:217-25)、CaMV 35S增强子(参见,例如,Benfey等人,(1990)EMBO J.[欧洲分子生物学学会杂志]9:1685-96)和美国专利号7,803,992的增强子,其中每一个通过引用并入。美国专利号US 8,785,612公开了甘蔗杆状病毒(SCBV)转录增强子。以上转录增强子的列表并不意指是限制性的。任何适当转录增强子都可用于实施例中。

终止区对于转录起始区可以是天然的,对于可操作地连接的目的DNA序列可以是天然的,对于植物宿主可以是天然的,或者可以源自另一种来源(即,对于启动子、目的序列、植物宿主、或其任何组合而言是外源的或异源的)。

方便的终止区可获自根癌农杆菌(A.tumefaciens)的Ti质粒,如章鱼碱合酶和胭脂碱合酶终止区。还参见Guerineau等人,(1991)Mol.Gen.Genet.[分子遗传学和普通遗传学]262:141-144;Proudfoot,(1991)Cell[细胞]64:671-674;Sanfacon等人,(1991)GenesDev.[基因与发育]5:141-149;Mogen等人,(1990)Plant Cell[植物细胞]2:1261-1272;Munroe等人,(1990)Gene[基因]91:151-158;Ballas等人,(1989)Nucleic Acids Res.[核酸研究]17:7891-7903以及Joshi等人,(1987)Nucleic Acid Res.[核酸研究]15:9627-9639。用于在植物中表达转基因的其他有用的转录终止子包括US 8,741,634的转录终止子MYB2、KTI1、PIP1、EF1A2和MTH1。

适当时可以优化核酸以增加在宿主生物体中的表达。因此,在宿主生物体是植物的情况下,合成核酸可以使用植物偏好性密码子来合成以改善表达。有关宿主偏好性使用的讨论,参见,例如Campbell和Gowri,(1990)Plant Physiol.[植物生理学]92:1-11。例如,虽然实施例的核酸序列在单子叶和双子叶植物物种中均可以表达,但是可以修饰序列,以考虑单子叶或双子叶植物的特定偏好和GC含量偏好,因为这些偏好已经表现出了差异(Murray等人(1989)Nucleic Acids Res.[核酸研究]17:477-498)。因而,氨基酸的玉蜀黍偏好性密码子可以源自玉蜀黍的已知基因序列。来自玉蜀黍植物的28种基因的玉蜀黍使用在Murray等人(同上)的表4中列出。本领域中可获得用于合成植物偏好性基因的方法。参见,例如,Murray等人,(1989)Nucleic Acids Res.[核酸研究]17:477-498,和Liu H等人Mol Bio Rep[分子生物学报告]37:677-684,2010,其通过引用并入本文。玉米(Zea maize)使用表也可以在kazusa.or.jp//cgi-bin/show.cgi?species=4577上找到,所述网址可以使用www前缀进行访问。

大豆(Glycine max)使用表可以在kazusa.or.jp//cgi-bin/show.cgi?species=3847&aa=1&style=N上找到,所述网址可以使用www前缀进行访问。

在一些实施例中,编码本公开的多肽的重组核酸分子具有玉蜀黍优化的密码子。

已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括消除以下序列:编码假聚腺苷酸化信号的序列、编码外显子-内含子剪接位点信号的序列、编码转座子样重复序列的序列和得到充分表征的、可能不利于基因表达的其他序列。可以将序列的GC含量调整至给定细胞宿主的平均水平,如通过参考在所述宿主细胞中表达的已知基因而计算的。如本文所用的,术语“宿主细胞”是指包含载体并支持表达载体的复制和/或表达的细胞。宿主细胞可以是原核细胞如大肠杆菌,或真核细胞如酵母、昆虫、两栖类或哺乳动物细胞、或单子叶或双子叶植物细胞。单子叶宿主细胞的实例是玉蜀黍宿主细胞。当可能时,修饰序列以避免出现可预测的发夹二级mRNA结构。

表达盒可以另外包含5′前导序列。此类前导序列可以起到增强翻译的作用。翻译前导序列包括;小核糖核酸病毒前导序列,例如EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报],86:6126-6130);马铃薯Y病毒属前导序列,例如,TEV前导序列(烟草蚀纹病毒)(Gallie等人,(1995)Gene[基因]165(2):233-238)、MDMV前导序列(玉米矮花叶病毒)、人免疫球蛋白重链结合蛋白(BiP)(Macejak等人,(1991)Nature[自然]353:90-94);来自苜蓿花叶病毒的外壳蛋白mRNA的非翻译前导序列(AMV RNA 4)(Jobling等人,(1987)Nature[自然]325:622-625);烟草花叶病毒前导序列(TMV)(Gallie等人,(1989)Molecular Biology of RNA[RNA的分子生物学],Cech编著(利斯公司,纽约),第237-256页)和玉米褪绿斑驳病毒(maize chloroticmortle)前导序列(MCMV)(Lommel,等人,(1991)Virology[病毒学]81:382-385)。还参见,Della-Cioppa等人,(1987)Plant Physiol.[植物生理学]84:965-968。此类构建体还可以包含“信号序列”或“前导序列”,以促进所述肽的共翻译成或翻译后运输至某些细胞内结构,如叶绿体(或其他质体)、内质网或高尔基体。

如本文所用的,“信号序列”是指已知或怀疑导致跨细胞膜的共翻译或翻译后肽运输的序列。在真核生物中,这典型地涉及分泌到高尔基体内,伴随某些产生的糖基化。通常将细菌的杀昆虫毒素合成为原毒素,所述原毒素在所述靶标有害生物的肠中被蛋白水解激活(Chang,(1987)Methods Enzymol.[酶学方法]153:507-516)。在一些实施例中,所述信号序列位于所述天然的序列中,或可以源自实施例的序列。如本文所用的,术语“前导序列”是指当翻译时产生足以引发肽链与亚细胞器的共翻译转运的氨基酸序列的任何序列。因此,这包括通过进入内质网内、进入液泡、质体(包括叶绿体、线粒体)等中来对运输和/或糖基化进行靶向的前导序列。靶向叶绿体类囊体腔室的核编码蛋白具有由基质靶向信号肽和腔靶向信号肽组成的特征二分型转运肽。基质靶向信息位于转运肽的氨基-近端部分。腔靶向信号肽位于转运肽的羧基近端部分,并且包含用于靶向腔的所有信息。高等植物叶绿体蛋白质组学的最新研究已在鉴定许多核编码的腔蛋白质中取得了进展(Kieselbach等人FEBSLETT[欧洲生化学会联盟通讯]480:271-276,2000;Peltier等人.Plant Cell[植物细胞]12:319-341,2000;Bricker等人Biochim.Biophys Acta[生物化学与生物物理学学报]1503:350-356,2001),根据本公开可能使用所述核编码的腔蛋白质的腔靶向信号肽。Kieselbach等人,Photosynthesis Research[光合作用研究]78:249-264,2003报道了来自拟南芥属(Arabidopsis)约80种蛋白质以及来自菠菜和豌豆的同源蛋白。特别地,此公开物的表2(其通过引用并入本说明书中)公开了通过其登录号鉴定的来自叶绿体腔的85种蛋白质(还参见美国专利申请公开2009/09044298)。另外,最近公开的水稻基因组草拟版本(Goff等人,Science[科学]296:92-100,2002)是可以根据本公开使用的用于腔靶向信号肽的合适来源。

合适的叶绿体转运肽(CTP)包含嵌合CT,这些嵌合CT包括但不限于:来自以下的CTP的N-末端结构域、中心结构域或C-末端结构域:水稻(Oryza sativa)1-脱氧-D木糖-5-磷酸合酶、水稻-超氧化物歧化酶、水稻-可溶性淀粉合酶、水稻-NADP-依赖性苹果酸酶、水稻-磷酸-2-脱氢-3-脱氧庚酸醛缩酶2、水稻-L-抗坏血酸过氧化物酶5、水稻-磷酸葡聚糖水二激酶、玉米ssRUBISCO、玉米-β-葡糖苷酶、玉米-苹果酸脱氢酶、玉米硫氧还蛋白M-型(美国专利9,150,625);美国专利申请公开号US 20130210114的叶绿体转运肽。

可以针对在叶绿体中的表达来优化待靶向叶绿体的编码本公开的多肽的基因,以解决植物核与所述细胞器之间的使用差异。以此方式,可以使用叶绿体偏好性序列合成目的核酸。

在制备表达盒时,可以操作各种DNA片段,以提供处于适当取向以及合适时,处于适当阅读框中的DNA序列。为此,可采用衔接子(adapter)或接头以连接DNA片段,或可以涉及其他操作以提供方便的限制性位点、去除多余的DNA、去除限制性位点等。为此目的,可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。

许多启动子可用于实施所述实施例。可基于所需结果,选择启动子。核酸可与组成型、组织偏好性、诱导型或其他启动子组合用于在宿主生物体中的表达。用于植物宿主细胞中的合适的组成型启动子包括,例如Rsyn7启动子的核心启动子和其他在WO 1999/43838和美国专利号6,072,050中公开的组成型启动子;核心CaMV 35S启动子(Odell等人,(1985)Nature[自然]313:810-812);水稻肌动蛋白(McElroy等人,(1990)Plant Cell[植物细胞]2:163-171);泛素(Christensen等人,(1989)Plant Mol.Biol.[植物分子生物学]12:619-632和Christensen等人,(1992)Plant Mol.Biol.[植物分子生物学]18:675-689);pEMU(Last等人(1991)Theor.Appl.Genet.[理论与应用遗传学]81:581-588);MAS(Velten等人,(1984)EMBO J.[欧洲分子生物学学会杂志]3:2723-2730),US 8,168,859,US 8,420,797;泛素转录调节元件和转录调节表达元件组公开于US 9,062,316中;ALS启动子(美国专利号5,659,026)等。大豆ADF1组成型启动子公开于美国专利申请公开US 20150184174中。大豆CCP1组成型启动子公开于美国专利申请公开US 20150167011中。其他组成型启动子包括例如以下美国专利号中所讨论的那些:5,608,149;5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611。从蓝莓红环斑病毒(BRRV)分离的转录起始区公开于美国专利US 8,895,716中。从可可肿枝病毒(CSSV)分离的转录起始区公开于美国专利US 8,962,916中。

根据所需结果,从诱导型启动子表达基因可能是有益的。用于调节实施例的核苷酸序列在植物中表达的特别引人关注的是伤口诱导型启动子。这种伤口诱导型启动子可以对由昆虫取食引起的损害作出反应,并且包括马铃薯蛋白酶抑制剂(pin II)基因(Ryan,(1990)Ann.Rev.Phytopath.[植物病理学年鉴]28:425-449;Duan等人,(1996)NatureBiotechnology[自然生物技术]14:494-498);wun1和wun2,美国专利号5,428,148;win1和win2(Stanford等人,(1989)Mol.Gen.Genet.[分子遗传学和普通遗传学]215:200-208);系统素(McGurl等人,(1992)Science[科学]225:1570-1573);WIP1(Rohmeier等人,(1993)Plant Mol.Biol.[植物分子生物学]22:783-792;Eckelkamp等人,(1993)FEBS Letters[欧洲生化学会联盟通讯]323:73-76);MPI基因(Corderok等人,(1994)Plant J.[植物杂志]6(2):141-150)等,以上文献通过引用并入本文。

此外,可以在实施例的方法和核苷酸构建体中使用病原体诱导型启动子。这种病原体诱导型启动子包括来自发病相关蛋白(PR蛋白)的那些,其在病原体感染后被诱导;例如,PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等。参见,例如Redolfi等人,(1983)Neth.J.Plant Pathol.[荷兰植物病理学杂志]89:245-254;Uknes等人,(1992)Plant Cell[植物细胞]4:645-656和Van Loon,(1985)Plant Mol.Virol.[植物分子病毒学]4:111-116。还参见,WO 1999/43819,其通过引用并入本文。

引人关注的是在病原体感染部位处或附近局部表达的启动子。参见,例如Marineau等人,(1987)Plant Mol.Biol.[植物分子生物学]9:335-342;Matton等人,(1989)Molecular Plant-Microbe Interactions[分子植物-微生物相互作用]2:325-331;Somsisch等人,(1986)Proc.Natl.Acad.Sci.USA[美国科学院院报]83:2427-2430;Somsisch等人,(1988)Mol.Gen.Genet.[分子遗传学和普通遗传学]2:93-98以及Yang,(1996)Proc.Natl.Acad.Sci.USA[美国科学院院报]93:14972-14977。还参见Chen等人,(1996)Plont J.[植物杂志]10:955-966;Zhang等人,(1994)Proc.Natl.Acad.Sci.USA[美国科学院院报]91:2507-2511;Warner等人,(1993)Plant J.[植物杂志]3:191-201;Siebertz等人,(1989)Plant Cell[植物细胞]1:961-968;美国专利号5,750,386(线虫诱导型)及其中引用的参考文献。特别引人关注的是玉蜀黍PRms基因的诱导型启动子,其表达是由病原体串珠镰刀菌(Fusarium moniliforme)诱导的(参见,例如Cordero等人,(1992)Physiol.Mol.Plant Path.[生理学与分子植物病理学]41:189-200)。

可以使用化学调节型启动子以通过应用外源化学调节剂来调节植物中的基因表达。取决于目标,所述启动子可以是化学诱导型启动子,其中施用化学品来诱导基因表达,或化学抑制型启动子,其中施用化学品来抑制基因表达。化学诱导型启动子包括由苯磺酰胺除草剂安全剂激活的玉蜀黍In2-2启动子、由用作萌前除草剂的疏水亲电子化合物激活的玉蜀黍GST启动子、以及由水杨酸激活的烟草PR-1a启动子。其他目的化学调节型启动子包括类固醇应答启动子(参见,例如,Schena等人,(1991)Proc.Natl.Acad.Sci.USA[美国科学院院报]88:10421-10425和McNellis等人,(1998)Plant J.[植物杂志]14(2):247-257中的糖皮质激素诱导型启动子)以及四环素诱导型和四环素抑制型启动子(参见,例如,Gatz等人,(1991)Mol.Gen.Genet.[分子遗传学和基因组学]227:229-237,以及美国专利号5,814,618和5,789,156),其通过引用并入本文。

组织偏好性启动子可以用于靶向特定植物组织内的增强的本公开的多肽表达。组织偏好性启动子包括描述于以下文献中的那些:Yamamoto等人,(1997)Plant J.[植物杂志]12(2):255-265;Kawamata等人,(1997)Plant Cell Physiol.[植物细胞生理学]38(7):792-803;Hansen等人,(1997)Mol.Gen Genet.[分子遗传学和普通遗传学]254(3):337-343;Russell等人,(1997)Transgenic Res.[转基因研究]6(2):157-168;Rinehart等人,(1996)Plant Physiol[植物生理学]112(3):1331-1341;Van Camp等人,(1996)PlantPhysiol.[植物生理学]112(2):525-535;Canevascini等人,(1996)Plant Physiol.[植物生理学]112(2):513-524;Yamamoto等人,(1994)Plant Cell Physiol[植物细胞生理学]35(5):773-778;Lam,(1994)Results Probl.Cell Differ.[细胞分化的结果和问题]20:181-196;Orozco等人,(1993)Plant Mol Biol.[植物分子生物学]23(6):1129-1138;Matsuoka等人,(1993)Proc Natl.Acad.Sci.USA[美国科学院院报]90(20):9586-9590和Guevara-Garcia等人,(1993)Plant J.[植物杂志]4(3):495-505。另外的组织特异性启动子包括美国专利号US 8,816,152和US 9,150,624的启动子。必要的话,此类启动子可经修饰用于弱表达。

叶偏好性启动子可以在以下文献中找到:Yamamoto等人,(1997)Plant J.[植物杂志]12(2):255-265;Kwon等人,(1994)Plant Physiol.[植物生理学]105:357-67;Yamamoto等人,(1994)Plant Cell Physiol[植物细胞生理学]35(5):773-778;Gotor等人,(1993)Plant J.[植物杂志]3:509-18;Orozco等人,(1993)Plant Mol.Biol.[植物分子生物学]23(6):1129-1138以及Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报]90(20):9586-9590。

美国专利申请偏好性或根特异性的启动子可以在以下文献中找到:Hire等人,(1992)Plant Mol.Biol.[植物分子生物学]20(2):207-218(大豆根特异性谷氨酰胺合成酶基因);Keller和Baumgartner,(1991)Plant Cell[植物细胞]3(10):1051-1061(法国菜豆的GRP 1.8基因中的根特异性控制元件);Sanger等人,(1990)Plant Mol.Biol.[植物分子生物学]14(3):433-443(根癌农杆菌(Agrobacterium tumefaciens)的甘露聚糖合成酶(MAS)基因的根特异性启动子)以及Miao等人,(1991)Plant Cell[植物细胞]3(1):11-22(编码细胞溶质谷氨酰胺合成酶(GS)的全长cDNA克隆,其在大豆的根和根瘤中表达)。还参见,Bogusz等人,(1990)Plant Cell[植物细胞]2(7):633-641,其中描述了从来自固氮的非豆科植物榆科山黄麻(Parasponia andersonii)以及相关的非固氮的非豆科植物山黄麻(Trema tomentosa)的血红蛋白基因分离的两个根特异性启动子。这些基因的启动子与β-葡糖醛酸糖苷酶报告基因连接,并且被引入非豆科作物烟草(Nicotiana tabacum)和豆科作物百脉根(Lotus corniculatus)两者中,并且在两种情况下都保留了根特异性启动子活性。Leach和Aoyagi,(1991)描述了他们对发根农杆菌(Agrobacterium rhizogenes)的高表达的rolC和rolD根诱导基因的启动子的分析(参见,Plant Science[植物科学](Limerick)79(1):69-76)。他们得出结论,增强子和组织偏好性DNA决定簇在所述启动子中是解离的。Teeri等人,(1989)使用与lacZ的基因融合以显示编码章鱼碱合酶的农杆菌属T-DNA基因尤其是在根尖的表皮中有活性,并且TR2′基因在完整植物中具有根特异性并且被叶组织中的创伤刺激,这是与杀昆虫的或杀幼虫的基因一起使用的尤其希望的特征组合(参见,EMBOJ.[欧洲分子生物学学会杂志]8(2):343-350)。与nptII(新霉素磷酸转移酶II)融合的TR1′基因显示相似的特征。另外的根偏好性启动子包括VfENOD-GRP3基因启动子(Kuster等人,(1995)Plant Mol.Biol.[植物分子生物学]29(4):759-772);和rolB启动子(Capana等人,(1994)Plant Mol.Biol.[植物分子生物学]25(4):681-691)。还参见,美国专利号5,837,876、5,750,386、5,633,363、5,459,252、5,401,836、5,110,732和5,023,179。在US20130117883中公开了拟南芥(Arabidopsis thaliana)根偏好性调节序列。美国专利申请公开号US 20160097054公开了高粱根偏好性启动子PLTP。美国专利申请公开号US20160145634公开了高粱根偏好性启动子TIP2-3。美国专利号US 8,916,377公开了高粱根偏好性启动子RCc3。

“种子偏好性”启动子包括“种子特异性”启动子(在种子发育期间有活性的那些启动子如种子贮藏蛋白的启动子)以及“种子发芽性”启动子(在种子发芽期间有活性的那些启动子)。参见,Thompson等人,(1989)BioEssays[生物测定]10:108,其通过引用并入本文。此类种子偏好性启动子包括但不限于Cim1(细胞分裂素诱导的信息);cZ19B1(玉蜀黍19kDa玉米醇溶蛋白);和milps(肌醇-1-磷酸合酶)(参见,美国专利号6,225,529,其通过引用并入本文)。γ-玉米醇溶蛋白和Glb-1是胚乳特异性启动子。对于双子叶植物,种子特异性启动子包括但不限于:库尼兹(Kunitz)胰蛋白酶抑制剂3(KTi3)(Jofuku和Goldberg,(1989)Plant Cell[植物细胞]1:1079-1093)、豆-β菜豆素、油菜籽蛋白、β-伴大豆球蛋白、大豆球蛋白1、大豆凝集素、十字花科蛋白等。对于单子叶植物,种子特异性启动子包括但不限于玉蜀黍15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、蜡质、收缩素1、收缩素2、球蛋白1等。还参见WO 2000/12733,其中公开了来自end1和end2基因的种子偏好性启动子;通过引用并入本文。在双子叶植物中,种子特异性启动子包括但不限于:来自拟南芥属的种皮启动子,pBAN;和来自拟南芥属的早期种子启动子,p26、p63、和p63tr(美国专利号7,294,760和7,847,153)。在特定组织中具有“偏好性”表达的启动子在所述组织中比在至少一种其他植物组织中以更高程度表达。一些组织偏好性启动子几乎专门在特定组织中表达。

当需要低水平表达时,可使用弱启动子。通常,如本文所用的术语“弱启动子”是指以低水平驱动编码序列的表达的启动子。低水平表达旨在约1/1000转录物至约1/100,000转录物至约1/500,000转录物之间的水平。可替代地,应当认识到,术语“弱启动子”还涵盖仅在少数细胞中驱动表达但不在其他细胞中表达,从而具有低水平总表达的启动子。当启动子以不可接受的高水平驱动表达时,可以删除或修饰部分启动子序列以降低表达水平。

此类弱组成型启动子包括例如Rsyn7启动子的核心启动子(WO 1999/43838和美国专利号6,072,050)、核心35S CaMV启动子等。其他组成型启动子包括例如以下专利文献中所公开的那些:美国专利号5,608,149;5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142、6,177,611和8,697,857,所述文献通过引用并入文中。

嵌合或杂合启动子包括美国专利号US 8,846,892、US 8,822,666和US 9,181,560中公开的那些。

以上启动子的列表并不意指是限制性的。任何适当的启动子都可用于实施例中。

通常,表达盒将包含选择性标记基因,用于选择经转化的细胞。利用选择性标记基因来选择经转化的细胞或组织。标记基因包括编码抗生素抗性的基因,例如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及赋予除草剂化合物(如草胺磷、溴草腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-D))抗性的基因。合适的选择性标记基因的其他实例包括但不限于编码对如下的耐受性的基因:氯霉素(Herrera Estrella等人,(1983)EMBO J.[欧洲分子生物学学会杂志]2:987-992);甲氨蝶呤(Herrera Estrella等人,(1983)Nature[自然]303:209-213和Meijer等人,(1991)Plant Mol.Biol.[植物分子生物学]16:807-820);链霉素(Jones等人,(1987)Mol.Gen.Genet.[分子遗传学和普通遗传学]210:86-91);壮观霉素(Bretagne-Sagnard等人,(1996)Transgenic Res.[转基因研究]5:131-137);博来霉素(Hille等人,(1990)Plant Mol.Biol.[植物分子生物学]7:171-176);磺酰胺类(Guerineau等人,(1990)Plant Mol.Biol.[植物分子生物学]15:127-136);溴草腈(Stalker等人,(1988)Science[科学]242:419-423);草甘膦(Shaw等人,(1986)Science[科学]233:478-481以及美国专利申请序列号10/004,357和10/427,692);草丁膦(DeBlock等人,(1987)EMBO J.[欧洲分子生物学学会杂志]6:2513-2518)。一般参见Yarranton(1992)Curr.Opin.Biotech.[生物技术新观点]3:506-511;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:6314-6318;Yao等人,(1992)Cell[细胞]71:63-72;Reznikoff,(1992)Mol.Microbiol.[分子微生物学]6:2419-2422;Barkley等人,(1980)在The Operon[操纵子]中,第177-220页;Hu等人,(1987)Cell[细胞]48:555-566;Brown等人,(1987)Cell[细胞]49:603-612;Figge等人,(1988)Cell[细胞]52:713-722;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:5400-5404;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:2549-2553;Deuschle等人,(1990)Science[科学]248:480-483;Gossen,(1993)Ph.D.Thesis[博士学位论文],University of Heidelberg[德国海德堡大学];Reines等人,(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报]90:1917-1921;Labow等人,(1990)Mol.Cell.Biol.[分子与细胞生物学]10:3343-3356;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:3952-3956;Baim等人,(1991)Proc.Natl.Acad.Sci.USA[美国科学院院报]88:5072-5076;Wyborski等人,(1991)NucleicAcids Res.[核酸研究]19:4647-4653;Hillenand-Wissman(1989)TopicsMol.Struc.Biol.[热点分子结构生物学]10:143-162;Degenkolb等人(1991)Antimicrob.Agents Chemother.[抗菌剂与化疗]35:1591-1595;Kleinschnidt等人,(1988)Biochemistry[生物化学]27:1094-1104;Bonin,(1993)Ph.D.Thesis[博士学位论文],University of Heidelberg[德国海德堡大学];Gossen等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:5547-5551;Oliva等人(1992)Antimicrob.Agents Chemother.[抗菌剂与化疗]36:913-919;Hlavka等人,(1985)Handbook of Experimental Pharmacology[实验药理学手册],78卷(Springer-Verlag,Berlin[柏林施普林格出版社])和Gill等人,(1988)Nature[自然]334:721-724。此类公开内容通过引用并入本文。

以上选择性标记基因的列表并不意在是限制性的。任何选择性标记基因都可用于实施例中。

植物转化

所述实施例的方法涉及将多肽或多核苷酸引入植物。如本文所用的,“引入”意指将所述多核苷酸或多肽呈送给所述植物,以此类方式使得所述序列进入所述植物细胞的内部。所述实施例的方法不取决于用于将多核苷酸或多肽引入植物中的特定方法,只要所述多核苷酸或多肽进入所述植物的至少一个细胞的内部即可。将多核苷酸或多肽引入植物的方法包括稳定转化法、瞬时转化法和病毒介导法。

如本文所用的,“稳定转化”意指经引入植物中的核苷酸构建体整合到所述植物的基因组中,并且能够被其子代遗传。如本文所用的,“瞬时转化”意指将多核苷酸引入所述植物中并且不整合到所述植物的基因组中,或者将多肽引入植物中。如本文所用的,“植物”是指整株植物、植物器官(例如叶、茎、根等)、种子、植物细胞、繁殖体、及其胚胎和子代。植物细胞可以是分化的或未分化的(例如愈伤组织、悬浮培养细胞、原生质体、叶子细胞、根细胞、韧皮部细胞和花粉)。

转化方案以及将核苷酸序列引入植物中的方案可以根据要靶向转化的植物或植物细胞的类型(即,单子叶植物或双子叶植物)而异。将核苷酸序列引入到植物细胞中并随后插入到植物基因组中的合适方法包括显微注射(Crossway等人,(1986)Biotechniques[生物技术]4:320-334)、电穿孔(Riggs等人,(1986)Proc.Natl.Acad.Sci.USA[美国科学院院报]83:5602-5606)、农杆菌介导的转化(美国专利号5,563,055和5,981,840)、直接基因转移(Paszkowski等人,(1984)EMBO J[欧洲分子生物学学会杂志]3:2717-2722)以及弹道粒子加速(参见,例如美国专利号4,945,050;5,879,918;5,886,244和5,932,782;Tomes等人,(1995),Plant Cell,Tissue,and Organ Culture:Fundamental Methods[植物细胞、组织和器官培养:基本方法],Gamborg和Phillips编辑(Springer-Verlag,Berlin[德国柏林施普林格出版公司]);和McCabe等人,(1988)Biotechnology[生物技术]6:923-926);以及Lecl转化法(WO 00/28058)。对于马铃薯转化法,参见Tu等人,(1998)Plant MolecularBiology[植物分子生物学]37:829-838和Chong等人,(2000)Transgenic Research[转基因研究]9:71-78。可以在以下文献中找到另外的转化方法:Weissinger等人,(1988)Ann.Rev.Genet.[遗传学年鉴]22:421-477;Sanford等人,(1987)Particulate Scienceand Technology[微粒科学与技术]5:27-37(洋葱);Christou等人,(1988)Plant Physiol.[植物生理学]87:671-674(大豆);McCabe等人,(1988)Bio/Technology[生物/技术]6:923-926(大豆);Finer和McMullen,(1991)In Vitro Cell Dcv.Biol.[体外细胞生物学和发育生物学]27P:175-182(大豆);Singh等人,(1998)Theor.Appl.Genet.[理论与应用遗传学]96:319-324(大豆);Datta等人,(1990)Biotechnology[生物技术]8:736-740(水稻);Klein等人,(1988)Proc.Natl.Acad.Sci.USA[美国科学院院报]85:4305-4309(玉蜀黍);Klein等人,(1988)Biotechnology[生物技术]6:559-563(玉蜀黍);美国专利号5,240,855、5,322,783和5,324,646;Klein等人,(1988)Plant Physiol.[植物生理学]91:440-444(玉蜀黍);Fromm等人,(1990)Biotechnology[生物技术]8:833-839(玉蜀黍);Hooykaas-VanSlogteren等人,(1984)Nature[自然](伦敦)311:763-764;美国专利号5,736,369(谷类);Bytebier等人,(1987)Proc.Natl.Acad.Sci.USA[美国科学院院报]84:5345-5349(百合科(Liliaceae));De Wet等人,(1985)The Experimental Manipulation of Ovule Tissues[胚珠组织的实验操作],Chapman等人编辑(Longman[朗文出版社],纽约),第197-209页(花粉);Kaeppler等人,(1990)Plant Cell Reports[植物细胞报告]9:415-418和Kaeppler等人,(1992)Theor.Appl.Genet.[理论与应用遗传学]84:560-566(晶须介导的转化);D′Halluin等人,(1992)Plant Cell[植物细胞]4:1495-1505(电穿孔);Li等人,(1993)PlantCell Reports[植物细胞报告],12:250-255以及Christou和Ford,(1995)Annals ofBotany[植物学年报]75:407-413(水稻);Osjoda等人,(1996)Nature Biotechnology[自然生物技术]14:745-750(经由根癌农杆菌的玉蜀黍);将其全部通过引用并入本文。

在具体实施例中,可以使用各种瞬时转化方法将实施例的序列提供给植物。此类瞬时转化法包括但不限于将多核苷酸或其变体和片段直接引入植物中或将本公开的多肽转录物引入植物中。此类方法包括例如显微注射或粒子轰击。参见,例如,Crossway等人,(1986)Mol Gen.Genet.[分子遗传学和普通遗传学]202:179-185;Nomura等人,(1986)Plant Sci.[植物科学]44:53-58;Hepler等人,(1994)Proc.Natl.Acad.Sci.[美国科学院院报]91:2176-2180和Hush等人,(1994)Thc Journal of Cell Science[细胞科学杂志]107:775-784,将其全部通过引用并入本文。可替代地,可以使用以下技术将多核苷酸瞬时转化到植物中:例如病毒载体系统以及以阻止随后释放DNA的方式沉淀多核苷酸。因此,可以从粒子结合的DNA进行转录,但其被释放以整合至基因组的频率大大降低了。此类方法包括使用包被有聚乙烯亚胺(PEI;西格玛公司(Sigma)#P3143)的粒子。

用于将多核苷酸靶向插入植物基因组中特定位置的方法包括使用位点特异性重组系统实现将多核苷酸插入所需基因组位置。参见,例如,WO 1999/25821、WO 1999/25854、WO 1999/25840、WO 1999/25855和WO 1999/25853,将其全部通过引用并入本文。简而言之,实施例的多核苷酸可以包含在侧翼为两个不相同重组位点的转移盒内。将转移盒引入植物中,所述植物已经稳定地将靶位点并入其基因组中,所述靶位点侧翼为与转移盒的位点相对应的两个不相同的重组位点。提供适当的重组酶,并将所述转移盒整合到靶位点。由此,目的多核苷酸被整合在植物基因组中的具体染色体位置处。

植物转化载体可以由实现植物转化所需的一种或多种DNA载体组成。例如,本领域常见做法是利用由多于一个连续DNA片段组成的植物转化载体。这些载体在本领域中通常被称为“双元载体”。双元载体以及具有辅助质粒的载体最常用于农杆菌介导的转化,其中实现有效转化所需的DNA片段的大小和复杂性相当大,并且将功能分离到单独的DNA分子上是有利的。双元载体典型地含有包含T-DNA转移(如左边界和右边界)所需的顺式作用序列的质粒载体、经工程改造成能够在植物细胞中表达的选择性标记、和“目的基因”(经工程改造成能够在需要产生转基因植物的植物细胞中表达的基因)。此质粒载体上也存在细菌复制所需的序列。将顺式作用序列以允许有效转移到植物细胞中并在其中表达的方式进行排列。例如,所述选择性标记基因和杀有害生物基因位于左边界和右边界之间。通常第二质粒载体包含反式作用因子,所述反式作用因子介导从农杆菌属到植物细胞的T-DNA转化。如本领域所理解的,所述质粒通常含有允许通过农杆菌感染植物细胞、以及通过在边界序列切割进行DNA的转移和vir介导的DNA转移的毒力功能(Vir基因)(Hellens和Mullineaux,(2000)Trends in Plant Science[植物科学趋势]5:446-451)。若干种类型的农杆菌菌株(例如LBA4404、GV3101、EHA101、EHA105等)可用于植物转化。通过其他方法如显微投影、显微镜注射、电穿孔、聚乙二醇等来转化植物不需要第二质粒载体。

通常,植物转化方法涉及将异源DNA转移到靶植物细胞中(例如未成熟或成熟的胚、悬浮培养物、未分化的愈伤组织、原生质体等),随后施加最大阈值水平的适当选择(取决于选择性标记基因)以从一组未转化的细胞群中回收经转化的植物细胞。在将异源外源DNA整合到植物细胞中之后,然后在培养基中施加最大阈值水平的适当选择以杀死未转化的细胞,并通过定期转移到新鲜培养基中来分离并增殖从所述选择处理中存活的推定经转化的细胞。通过连续传代和使用合适的选择进行攻击,识别并增殖了所述用所述质粒载体转化的细胞。然后,可以使用分子和生物化学的方法来证实整合到所述转基因植物的基因组中的目的异源基因的存在。

典型地将外植体转移到新鲜供应的相同培养基中并将其常规培养。随后,在被置于补充有最大阈值水平的选择剂的再生培养基上之后,所述经转化的细胞分化成芽。然后将所述芽转移到用于回收已生根的芽或小植物的选择性生根培养基上。然后转基因的小植株成长为成熟植物并产生稔性种子(例如Hiei等人,(1994)The Plant Journal 6:271-282;Ishida等人,(1996)Nature Biotechnology[自然生物技术]14:745-750)。典型地将外植体转移到新鲜供应的相同培养基中并将其常规培养。用于生产转基因植物的技术和方法的一般描述发现于以下文献中:Ayres和Park,(1994)Critical Reviews in PlantScience[植物科学评论]13:219-239以及Bommineni和Jauhar,(1997)Maydica[美迪卡杂志]42:107-120。由于经转化的材料含有许多细胞;所以在受试的靶愈伤组织或组织或细胞群的任何部分中同时存在经转化的细胞和未经转化的细胞。杀死未经转化的细胞并允许经转化细胞增殖的能力产生经转化的植物培养物。通常,去除未经转化的细胞的能力限制经转化的植物细胞的快速恢复和转基因植物的成功生成。

可依据常规方式将已转化的细胞培育成植株。参见,例如,McCormick等人,(1986)Plant Cell Reports[植物细胞报告]5:81-84。然后可以培育这些植株,并用相同的经转化株系或者不同的株系授粉,并鉴定出具有所需表型特征的组成型或诱导型表达的所得杂合体。可以培育两代或更多代,以确保所需表型特征的表达稳定地保持并遗传,并且然后收获种子以确保已经实现了所需表型特征的表达。

可以通过使植物与病毒或者病毒核酸接触而向植物提供实施例的核苷酸构建体。通常,此类方法涉及将目的核苷酸构建体掺入病毒DNA或RNA分子内。应当认识到,可以最初将所述实施例的重组蛋白合成为病毒多蛋白的一部分,然后可以在体内或在体外通过蛋白水解加工以产生所需的本公开的多肽。还认识到,包含实施例的多肽的至少一部分氨基酸序列的这种病毒多蛋白可具有所需的杀有害生物活性。此类病毒多蛋白和编码它们的核苷酸序列涵盖在所述实施例中。为植物提供核苷酸构建体并在植物中产生编码的蛋白质的方法(涉及病毒DNA或RNA分子),例如美国专利号5,889,191、5,889,190、5,866,785、5,589,367和5,316,931;通过引用并入本文。

例如,可以使用转化叶绿体的方法:Svab等人,(1990)Proc.Natl.Acad.Sci.USA[美国科学院院报]87:8526-8530;Svab和Maliga,(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报]90:913-917;Svab和Maliga,(1993)EMBO J.[欧洲分子生物学学会杂志]12:601-606。所述方法依赖于粒子枪递送含有选择性标记的DNA和通过同源重组将DNA靶向质体基因组。另外,通过利用核编码的和质体导向的RNA合酶的组织偏好性表达,通过反式激活沉默的质体携带的转基因,实现质体转化。这种系统已被报道于以下文献中:McBride等人,(1994)Proc.Natl.Acad.Sci.USA[美国科学院院报]91:7301-7305。

所述实施例进一步涉及实施例的经转化植物的植物繁殖材料,包括但不限于种子、块茎、球茎、鳞茎、叶以及根和芽的插条。

所述实施例可用于转化任何植物物种,包括但不限于单子叶植物和双子叶植物。目的植物的实例包括但不限于玉米(corn,Zea mays),芸苔属(Brassica)物种(例如,甘蓝型油菜(B.napus)、芜菁(B.rapa)、芥菜(B.juncea))(特别是可用作种子油来源的那些芸苔属物种),苜蓿(紫花苜蓿(Medicago sariva)),水稻(rice,Oryza sariva),黑麦(rye,Secale cereale),高粱(sorghum,Sorghum bicolor,Sorghum vulgare),粟(例如,珍珠粟(pearl millet,Pennisetum glaucum)、黍(proso millet,Panicum aniliaceum)、谷子(foxtail millet,Setaria italica)、龙爪稷(finger millet,Eleusine coracana)),向日葵(sunflower,Helianthus annuus),红花(safflewer,Carthamus tinctorius),小麦(wheat,Triticum aestivum),大豆(soybean,Glycine max),烟草(tobacco,Nicotianatabacum),马铃薯(potato,Solanum tuberosum),花生(peanut,Arachis hypogaea),棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum)),甘薯(番薯(Ipomoeabatatas)),木薯(cassava,Manihot esculenta),咖啡(咖啡属(Coffea)物种),椰子(coconut,Cocos nucifera),菠萝(pineapple,Ananas comosus),柑橘树(柑橘属(Citrus)物种),可可(cocoa,Theobroma cacao),茶树(tea,Camellia sinensis),香蕉(芭蕉属(Musa)物种),鳄梨(avocado,Persea americana),无花果(fig,Ficus casica),番石榴(guava,Psidium guajava),芒果(mango,Mangifera indica),橄榄(olive,Oleaeuropaea),木瓜(番木瓜(Carica papaya)),腰果(cashew,Anacardium occidentale),溴洲坚果(macadamia,Macadamia integrifolia),巴旦杏(almond,Prunus amygdalus),甜菜(sugar beets,Beta vulgaris),甘蔗(甘蔗属(Saccharum)物种),燕麦,大麦,蔬菜,观赏植物和针叶树。

蔬菜包括番茄(tomatoes,Lycopersicon esculentum)、莴苣(例如,莴苣(Lactucasativa))、青豆(菜豆(Phaseolus vulgaris))、利马豆(lima bean,Phaseolus limensis)、豌豆(香豌豆属(Lathyrus)物种)和黄瓜属的成员例如黄瓜(cucumber,C.sativus)、香瓜(cantaloupe,C.cantalupensis)和甜瓜(musk melon,C.melo)。观赏植物包括杜鹃(杜鹃花属(Rhododendron)物种)、绣球花(hydrangea,Macrophylla hydrangea)、木槿(hibiscus,Hibiscus rosasanensis)、玫瑰(蔷薇属(Rosa)物种)、郁金香(郁金香属(Tulipa)物种)、水仙(水仙属(Narcissus)物种)、矮牵牛(petunias,Petuniahybrida)、康乃馨(carnation,Dianthus caryophyllus)、一品红(poinsettia,Euphorbia pulcherrima)和菊花。可以用于实践实施例的针叶树包括(例如)松树如火炬松(loblolly pine,Pinus taeda)、湿地松(slash pine,Pinus elliotii)、西黄松(ponderosa pine,Pinus ponderosa)、黑松(lodgepole pine,Pinus contorta)和辐射松(Monterey pine,Pinus radiata);花旗松(Douglas-fir,Pseudotsuga menziesii);西方铁杉(Western hemlock,Tsugacanadensis);北美云杉(Sitka spruce,Picea glauca);红杉(redwood,Sequoiasempervirens);枞树(true firs),如银杉(胶冷杉(Abies amabilis))和胶枞(香脂冷杉(Abies balsamea));以及雪松,如西方红雪松(北美乔柏(Thuja plicata))和阿拉斯加黄雪松(黄扁柏(Chamaecyparis nootkatensis))。所述实施例的植物包括作物植物(例如玉米、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、高粱、小麦、粟、烟草等),如玉米和大豆植物。

草坪草包括但不限于:一年生早熟禾(annual bluegrass,Poa annua);一年生黑麦草(黑麦草(Lolium multiflorum));加拿大早熟禾(Canada bluegrass,Poacompressa);紫羊茅(Chewing’sfescue,Festuca rubra);细弱翦股颖(colonialbentgrass,Agrostis tenuis);匍匐翦股颖(creeping bentgrass,Agrostis palustris);沙生冰草(crested wheatgrass,Agropyron desertorum);扁穗冰草(fairwaywheatgrass,Agropyron cristatum);硬羊茅(长叶羊茅(Festuca longifolia));草地早熟禾(Kentucky bluegrass,Poa pratensis);鸭茅(orchardgrass,Dactylis glomerata);多年生黑麦草(perennial ryegrass,Lolium perenne);红狐茅(紫羊茅(Festuca rubra));小糠草(redtop,Agrostis alba);粗茎早熟禾(rough bluegrass,Poa trivialis);羊茅(sheep fescue,Festuca ovina);无芒雀麦(smooth bromegrass,Bromus inermis);高羊茅(tall fescue,Festuca arundinacea);梯牧草(timothy,Phleum pratense);绒毛剪股颖(velvet bentgrass,Agrostis canina);碱茅(weeping alkaligrass,Puccinelliadistans);蓝茎冰草(western wheatgrass,Agropyron smithii);狗牙根(狗牙根属(Cynodon)物种);圣奥古斯丁草(St.Augustine grass,Stenotaphrum secundatum);结缕草(结缕属(Zoysia)物种);百喜草(Bahia grass,Paspalum notatum);地毯草(carpetgrass,Axonopus affinis);假俭草(centipede grass,Eremochloa ophiuroides);隐花狼尾草(kikuyu grass,Pennisetum clandesinum);海滨雀稗(seashore paspalum,Paspalumvaginatum);格兰马草(blue gramma,Bouteloua gracilis);野牛草(buffalo grass,Buchloe dactyloids);垂穗草(sideoats gramma,Bouteloua curtipendula)。

目的植物包括提供目的种子的谷物类植物、油料种子植物和豆科植物。目的种子包括谷物种子,例如玉米、小麦、大麦、水稻、高粱、黑麦、粟等。油料种子植物包括棉花、大豆、红花、向日葵、芸苔属、玉蜀黍、苜蓿、棕榈、椰子、亚麻、蓖麻、橄榄等。豆科植物包括豆类和豌豆。豆类包括瓜耳豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等。

植物转化评估

在将异源外源DNA引入植物细胞后,通过各种方法(如分析与已整合的基因相关的核酸、蛋白质和代谢物)证实异源基因在所述植物基因组中的转化或整合。

PCR分析是移植到土壤中之前在早期阶段筛选转化的细胞、组织或芽中存在并入的基因的快速方法(Sambrook和Russell,(2001)Molecular Cloning:A LaboratoryManual.[分子克隆:实验手册]Cold Spring Harbor Laboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],NY[纽约州])。使用对目的基因或农杆菌属载体背景等具有特异性的寡核苷酸引物进行PCR。

植物转化可以通过基因DNA印迹分析来证实(Sambrook和Russell,(2001),同上)。通常,从转化体中提取总DNA,用适当的限制性酶消化,在琼脂凝胶中进行分级并转移到硝化纤维或尼龙膜上。然后用例如放射性标记的32P靶DNA片段探测膜或“印迹”,以证实根据标准技术将引入的基因整合到所述植物基因组中(Sambrook和Russell,(2001),同上)。

在RNA印迹分析中,从转化体的特定组织中分离RNA,在甲醛琼脂凝胶中进行分级,并根据本领域常规使用的标准程序将其印迹到尼龙过滤器上(Sambrook和Russell,(2001),同上)。然后通过将所述过滤器与来自杀有害生物基因的放射性探针杂交来测试由所述杀有害生物基因编码的RNA的表达。

可以对转基因植物进行蛋白质印迹、生物化学测定以及类似测定,以便通过标准程序使用与本公开的多肽上存在的一个或多个表位结合的抗体来证实由该杀有害生物基因所编码的蛋白质的存在(Sambrook和Russell,2001,同上)。

将基因组编辑技术引入植物的方法

在一些实施例中,可以使用基因组编辑技术将所公开的多核苷酸组合物引入植物的基因组中,或者可以使用基因组编辑技术编辑植物基因组中先前引入的多核苷酸。例如,可以使用双链断裂技术(如TALEN、大范围核酸酶、锌指核酸酶、CRISPR-Cas等)将所公开的多核苷酸引入植物基因组中需要的位置上。例如,为了位点特异性插入,可以使用CRISPR-Cas系统将所公开的多核苷酸引入基因组中需要的位置上。植物基因组中需要的位置可以是任何对于插入来说需要的靶位点,如适于育种的基因组区域,或者可以是位于具有现有的目的性状的基因组窗口中的靶位点。现有的目的性状可能是内源性状或先前引入的性状。

在一些实施例中,在将所公开的多核苷酸先前已经引入到基因组中的情况下,可以使用基因组编辑技术来改变或修饰引入的多核苷酸序列。可以将位点特异性修饰引入所公开的多核苷酸组合物中,所述位点特异性修饰包括使用用于引入位点特异性修饰的任何方法产生的修饰,所述方法包括但不限于使用基因修复寡核苷酸(例如美国公开2013/0019349),或使用双链断裂技术,如TALEN、大范围核酸酶、锌指核酸酶、CRISPR-Cas等。此类技术可用于通过在引入的多核苷酸内的核苷酸的插入、缺失或取代来修饰先前引入的多核苷酸。可替代地,可以使用双链断裂技术向引入的多核苷酸中添加另外的核苷酸序列。可以添加的另外的序列包括另外的表达元件(如增强子序列和启动子序列)。在另一个实施例中,可以使用基因组编辑技术在植物基因组内定位紧邻本文公开的公开的多核苷酸组合物的另外的杀昆虫活性蛋白,以产生杀昆虫活性蛋白质的分子堆叠物。

“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”和“修饰的靶序列”在本文中可互换地使用,并且意指如本文公开的靶序列,当与未改变的靶序列相比时,所述靶序列包含至少一个改变。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。

转基因植物中性状的堆叠

转基因植物可以包含本文公开的一种或多种杀昆虫多核苷酸与一种或多种另外的多核苷酸的堆叠,导致多个多肽序列的产生或抑制。包含多核苷酸序列堆叠的转基因植物可以通过传统育种方法或通过遗传工程方法中的一种或两种获得。所述方法包括但不限于:育种各自包含目的多核苷酸的单个系,用随后的基因转化包含本文公开的基因的转基因植物,并将基因共转化为单个植物细胞。如本文所用的,术语“堆叠”包括使多个性状在同一植物中存在(即,将两个性状并入核基因组中,将一个性状并入核基因组中,并且将一个性状并入质体的基因组中,或者这两种性状都被并入质体的基因组中)。在一个非限制性实例中,“堆叠性状”包括其中序列在物理上彼此相邻的分子堆叠物。如本文所用的性状是指源自序列或序列组群的表型。可以使用包含多个基因或在多个载体上分别携带的基因的单一转化载体进行基因的共转化。如果通过遗传转化植物来堆叠序列,则目的多核苷酸序列可以在任意时间并以任意顺序组合。可以用共转化方案将所述性状与转化盒的任何组合所提供的目的多核苷酸一起引入。例如,若引入两个序列,则这两个序列可包含在分开的转化盒(反式)或包含在同一个转化盒(顺式)中。所述序列的表达可以通过相同的启动子或通过不同的启动子驱动。在某些情况下,可能需要引入将抑制目的多核苷酸的表达的转化盒。这可以与其他抑制盒或过度表达盒的任何组合进行组合以在所述植物中产生所需性状组合。进一步应当认识到,可以使用位点特异性重组系统在所需的基因组位置堆叠多核苷酸序列。

在一些实施例中,单独或与一种或多种另外的昆虫抗性性状堆叠的编码本公开的多肽的多核苷酸可以与一种或多种另外的输入性状(例如,除草剂抗性、真菌抗性、病毒抗性、胁迫耐受性、抗病性、雄性不育性、茎强度等)或输出性状(例如,增加的产量、改性淀粉、改善的油特性、平衡的氨基酸、高赖氨酸或甲硫氨酸、增加的消化性、改善的纤维品质、抗旱性等)堆叠。因此,多核苷酸实施例可用于提供具有灵活地且成本有效地控制任何数量的农艺有害生物的能力的经改善的作物品质的完整农艺学方案。

可用于堆叠的转基因包括但不限于:赋予对昆虫或疾病或除草剂的抗性的转基因。

植物抗病性基因。通常通过植物中抗病性基因(R)的产物与病原体中相应的无毒性(Avr)基因的产物之间的特异性相互作用来激活植物防御。可以用经克隆的抗性基因来转化植物变种,以工程改造对具体病原体菌株具有抗性的植物。参见,例如Jones等人,(1994)Science[科学]266:789(cloning of the tomato Cf-9 gene for resistance toCladosporium fulvum[克隆番茄Cf-9基因以抵抗番茄叶霉病菌]);Martin等人(1993)Science[科学]262:1432(tomato Pto gene for resistance to Pseudomonas syringaepv.tomato encodes a protein kinase[用于抵抗丁香假单胞菌番茄致病变体的番茄Pto基因编码蛋白激酶]);Mindrinos等人,(1994)Cell[细胞]78:1089(Arabidopsis RSP2gene for resistance to Pseudomonas syringae[拟南芥RSP2基因用于对抗丁香假单胞菌]),McDowell和Woffenden,(2003)Trends Biotechnol.[生物科技趋势]21(4):178-83以及Toyoda等人,(2002)Transgenic Res.[转基因研究]11(6):567-82。与野生型植物相比,对疾病具有抗性的植物对病原体更具抗性。

编码苏云金芽孢杆菌(Bacillus thuringiensis)蛋白质、其衍生物或其上建模的合成多肽的基因。参见,例如,Geiser等人,(1986)Gene[基因]48:109,其公开了Btδ-内毒素基因的克隆和核苷酸序列。此外,编码δ-内毒素基因的DNA分子可购自美国典型培养物保藏中心(American Type Culture Collection)(美国马里兰州罗克韦尔市(Rockville,Md.)),例如登录号40098、67136、31995和31998下。经遗传工程改造的苏云金芽孢杆菌转基因的其他非限制性实例在以下专利和专利申请中给出,并为此目的通过引用并入本文:美国专利号5,188,960;5,689,052;5,880,275;5,986,177;6,023,013、6,060,594、6,063,597、6,077,824、6,620,988、6,642,030、6,713,259、6,893,826、7,105,332;7,179,965、7,208,474;7,227,056、7,288,643、7,323,556、7,329,736、7,449,552、7,468,278、7,510,878、7,521,235、7,544,862、7,605,304、7,696,412、7,629,504、7,705,216、7,772,465、7,790,846、7,858,849、9,546,378;美国专利公开US 20160376607和WO 1991/14778;WO 1999/31248;WO 2001/12731;WO 1999/24581和WO 1997/40162。

也可以堆叠编码杀有害生物蛋白的基因,所述杀有害生物蛋白包括但不限于:本文所用的指示毒素或与这种蛋白质具有同源性的蛋白质的“杀有害生物蛋白”或“杀昆虫蛋白”,所述毒素具有针对以下一种或多种昆虫有害生物的毒性活性,所述有害生物包括但不限于:鳞翅目、双翅目、半翅目以及鞘翅目或线虫门的成员。已经从生物体中分离出杀有害生物蛋白,所述生物体包括例如,芽孢杆菌属物种、假单胞菌属(Pseudomonas)物种、发光杆菌属(Photorhabdus)物种、致病杆菌属(Xenorhabdus)物种、双酶梭菌(Clostridiumbifermentans)、和鲍比氏类芽孢杆菌(Paenibacillus popilliae)。杀有害生物蛋白包括但不限于:来自假单胞菌属物种的杀昆虫蛋白,如PSEEN3174(Monalysin;(2011)PLoSPathogens[PLoS病原体],7:1-13);来自假单胞菌蛋白菌(Pseudomonas protegens)菌株CHA0和Pf-5(之前为荧光假单胞菌(fluorescens))(Pechy-Tarr,(2008)EnvironmentalMicrobiology[环境微生物学]10:2368-2386;基因库登录号EU400157)的杀昆虫蛋白;来自台湾假单胞菌(Liu等人,(2010)J.Agric.Food Chem.[农业与食品化学杂志],58:12343-12349)和来自假产碱假单胞菌(Zhang等人,(2009)Annals of Microbiology[微生物学杂志]59:45-50和Li等人,(2007)Plant Cell Tiss.Organ Cult.[植物细胞,组织和器官培养杂志]89:159-168)的杀昆虫蛋白;来自发光杆菌属物种和致病杆菌属物种(Hinchliffe等人,(2010)The Open Toxicology Journal[开放毒理学杂志],3:101-118和Morgan等人,(2001)Applied and Envir.Micro.[应用与环境微生物学]67:2062-2069)的杀昆虫蛋白;来自美国专利号6,048,838和美国专利号6,379,946的杀昆虫蛋白;US 9,688,730的PIP-1多肽;US 9,475,847的AfIP-1A和/或AfIP-1B多肽;美国公开号US 20160186204的PIP-47多肽;PCT公开号WO 2016/114973的IPD045多肽、IPD064多肽、IPD074多肽、IPD075多肽、和IPD077多肽;PCT序列号PCT/US 17/56517的IPD080多肽;序列号PCT/US 17/54160的IPD078多肽、IPD084多肽、IPD085多肽、IPD086多肽、IPD087多肽、IPD088多肽、和IPD089多肽;美国专利公开号US 20160366891的PIP-72多肽;美国公开号US 20170166921的PtIP-50多肽和PtIP-65多肽;美国序列号62/521084的IPD098多肽、IPD059多肽、IPD108多肽、IPD109多肽;美国公开号US 20160347799的PtIP-83多肽;美国公开号US 20170233440的PtIP-96多肽;PCT公开号WO 2017/23486的IPD079多肽;PCT公开号WO 2017/105987的IPD082多肽、序列号PCT/US 17/30602的IPD090多肽、美国序列号62/434020的IPD093多肽;序列号PCT/US 17/39376的IPD103多肽;美国序列号62/438179的IPD101多肽;美国序列号US 62/642,644的IPD110多肽;美国序列号US 62/642,642的IPD113多肽;美国序列号US 62/508,514的IPD121多肽;和δ-内毒素,包括但不限于Cry1、Cry2、Cry3、Cry4、Cry5、Cry6、Cry7、Cry8、Cry9、Cry10、Cry11、Cry12、Cry13、Cry14、Cry15、Cry16、Cry17、Cry18、Cry19、Cry20、Cry21、Cry22、Cry23、Cry24、Cry25、Cry26、Cry27、Cry28、Cry29、Cry30、Cry31、Cry32、Cry33、Cry34、Cry35、Cry36、Cry37、Cry38、Cry39、Cry40、Cry41、Cry42、Cry43、Cry44、Cry45、Cry46、Cry47、Cry49、Cry50、Cry51、Cry52、Cry53、Cry54、Cry55、Cry56、Cry57、Cry58、Cry59、Cry60、Cry61、Cry62、Cry63、Cry64、Cry65、Cry66、Cry67、Cry68、Cry69、Cry70、Cry71、和Cry 72类的δ-内毒素多肽以及苏云金芽孢杆菌细胞溶解性cyt1和cyt2基因。这些类别的苏云金芽孢杆菌杀昆虫蛋白的成员是本领域技术人员熟知的(参见,Crickmore等人,“Bacillus thuringiensis toxin nomenclature[苏云金芽孢杆菌毒素命名法]”(2011),网址为lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/,其可以使用“www”前缀在万维网上访问)。

δ-内毒素的实例还包括但不限于:美国专利号5,880,275、7,858,849和8,878,007的Cry1A蛋白;US 9,512,187的Cry1Ac突变体;美国专利号8,304,604、8.304,605和8,476,226的DIG-3或DIG-11毒素(cry蛋白(如Cry1A、Cry3A)的α螺旋1和/或α螺旋2变体的N-末端缺失);美国专利申请序列号10/525,318、美国专利申请公开号US 20160194364和美国专利号9,404,121和8,772,577的Cry1B;PCT公开号WO 2016/61197和序列号PCT/US 17/27160的Cry1B变体;美国专利号6,033,874的Cry1C;US 20170233759的Cry1D蛋白;PCT序列号PCT/US 17/53178的Cry1E蛋白;美国专利号5,188,960和6,218,188的Cry1F蛋白;美国专利号7,070,982、6,962,705和6,713,063的Cry1A/F嵌合体;PCT公开号WO 2017/0233759的Cry1I蛋白;美国公开US 20170240603的Cry1J变体;美国专利号7,064,249的Cry2蛋白如Cry2Ab蛋白和US 7208474的Cry2A.127蛋白;Cry3A蛋白,包括但不限于通过融合至少两种不同Cry蛋白的可变区和保守区的独特组合产生的经工程改造的杂合杀昆虫蛋白(eHIP)(美国专利申请公开号2010/0017914);Cry4蛋白;Cry5蛋白;Cry6蛋白;美国专利号7,329,736、7,449,552、7,803,943、7,476,781、7,105,332、7,339,092、7,378,499、7,462,760和9,593,345的Cry8蛋白;Cry9蛋白,例如像Cry9A、Cry9B、Cry9C、Cry9D、Cry9E和Cry9F家族的成员,包括美国专利9,000,261和8,802,933以及美国序列号WO 2017/132188的Cry9蛋白;Cry15蛋白,描述于以下文献中:Naimov等人,(2008)Applied and Environmental Microbiology[应用与环境微生物学],74:7145-7151;美国专利号US 8,933,299的Cry14蛋白;美国专利号6,127,180、6,624,145和6,340,593的Cry22、Cry34Ab1蛋白;美国专利号US 8,816,157的截短的Cry34蛋白;美国专利号6,248,535、6,326,351、6,399,330、6,949,626、7,385,107和7,504,229的CryET33和cryET34蛋白;美国专利公开号2006/0191034、2012/0278954,和PCT公开号WO 2012/139004的CryET33和CryET34同源物;美国专利号6,083,499、6,548,291和6,340,593的Cry35Ab1蛋白;美国专利号9,403,881的Cry46蛋白、Cry 51蛋白、Cry二元毒素;TIC901或相关毒素;美国专利申请公开号2008/0295207的TIC807;美国专利US 8,513,493的TIC853;PCT US 2006/033867的ET29、ET37、TIC809、TIC810、TIC812、TIC127、TIC128;美国专利申请公开号US 20160150795的经工程改造的半翅目毒素蛋白,美国专利号8,236,757的AXMI-027、AXMI-036和AXMI-038;美国专利号7,923,602的AXMI-031、AXMI-039、AXMI-040、AXMI-049;WO 2006/083891的AXMI-018、AXMI-020和AXMI-021;WO 2005/038032的AXMI-010;WO 2005/021585的AXMI-003;美国专利申请公开号2004/0250311的AXMI-008;美国专利申请公开号2004/0216186的AXMI-006;美国专利申请公开号2004/0210965的AXMI-007;美国专利申请号2004/0210964的AXMI-009;美国专利申请公开号2004/0197917的AXMI-014;美国专利申请公开号2004/0197916的AXMI-004;WO 2006/119457的AXMI-028和AXMI-029;WO 2004/074462的AXMI-007、AXMI-008、AXMI-0080rf2、AXMI-009、AXMI-014和AXMI-004;美国专利号8,084,416的AXMI-150;美国专利申请公开号2011/0023184的AXMI-205;美国专利申请公开号2011/0263488的AXMI-011、AXMI-012、AXMI-013、AXMI-015、AXMI-019、AXMI-044、AXMI-037、AXMI-043、AXMI-033、AXMI-034、AXMI-022、AXMI-023、AXMI-041、AXMI-063和AXMI-064;美国专利US 8461421和US 8,461,422的AXMI046、AXMI048、AXMI050、AXMI051、AXMI052、AXMI053、AXMI054、AXMI055、AXMI056、AXMI057、AXMI058、AXMI059、AXMI060、AXMI061、AXMI067、AXMI069、AXMI071、AXMI072、AXMI073、AXMI074、AXMI075、AXMI087、AXMI088、AXMI093、AXMI070、AXMI080、AXMI081、AXMI082、AXMI091、AXMI092、AXMI096、AXMI097、AXMI098、AXMI099、AXMI100、AXMI101、AXMI102、AXMI103、AXMI104、AXMI107、AXMI108、AXMI109、AXMI110、AXMI111、AXMI112、AXMI114、AXMI116、AXMI117、AXMI118、AXMI119、AXMI120、AXMI121、AXMI122、AXMI123、AXMI124、AXMI125、AXMI126、AXMI127、AXMI129、AXMI151、AXMI161、AXMI164、AXMI183、AXMI132、AXMI137、AXMI138;美国专利申请公开号2010/0197592的AXMI-R1和相关蛋白;WO 2011/103248的AXMI221Z、AXMI222z、AXMI223z、AXMI224z和AXMI225z;WO 2011/103247的AXMI218、AXMI219、AXMI220、AXMI226、AXMI227、AXMI228、AXMI229、AXMI230和AXMI231;美国专利号8,334,431的AXMI-115、AXMI-113、AXMI-005、AXMI-163和AXMI-184;美国专利申请公开号2010/0298211的AXMI-001、AXMI-002、AXMI-030、AXMI-035和AXMI-045;美国专利申请公开号2009/0144852的AXMI-066和AXMI-076;美国专利号8,318,900的AXMI128、AXMI130、AXMI131、AXMI133、AXMI140、AXMI141、AXMI142、AXMI143、AXMI144、AXMI146、AXMI148、AXMI149、AXMI152、AXMI153、AXMI154、AXMI155、AXMI156、AXMI157、AXMI158、AXMI162、AXMI165、AXMI166、AXMI167、AXMI168、AXMI169、AXMI170、AXMI171、AXMI172、AXMI173、AXMI174、AXMI175、AXMI176、AXMI177、AXMI178、AXMI179、AXMI180、AXMI181、AXMI182、AXMI185、AXMI186、AXMI187、AXMI188、AXMI189;美国专利US 8461421的AXMI079、AXMI080、AXMI081、AXMI082、AXMI091、AXMI092、AXMI096、AXMI097、AXMI098、AXMI099、AXMI100、AXMI101、AXMI102、AXMI103、AXMI104、AXMI107、AXMI108、AXMI109、AXMI110、dsAXMI111、AXMI112、AXMI114、AXMI116、AXMI117、AXMI118、AXMI119、AXMI120、AXMI121、AXMI122、AXMI123、AXMI124、AXMI1257、AXMI1268、AXMI127、AXMI129、AXMI164、AXMI151、AXMI161、AXMI183、AXMI132、AXMI138、AXMI137;美国专利US 8,461,415的AXMI192;美国专利申请公开号US20160177332的AXMI281;美国专利号US 8,252,872的AXMI422;美国专利号8,319,019的具有修饰的蛋白水解位点的Cry蛋白如Cry1A和Cry3A;美国专利申请公开号2011/0064710的来自苏云金芽孢杆菌菌株VBTS 2528的Cry1Ac、Cry2Aa和Cry1Ca毒素蛋白。美国序列号62/607,372的Cry蛋白MP032、MP049、MP051、MP066、MP068、MP070、MP091S、MP109S、MP114、MP121、MP134S、MP183S、MP185S、MP186S、MP195S、MP197S、MP208S、MP209S、MP212S、MP214S、MP217S、MP222S、MP234S、MP235S、MP237S、MP242S、MP243、MP248、MP249S、MP251M、MP252S、MP253、MP259S、MP287S、MP288S、MP295S、MP296S、MP297S、MP300S、MP304S、MP306S、MP310S、MP312S、MP314S、MP319S、MP325S、MP326S、MP327S、MP328S、MP334S、MP337S、MP342S、MP349S、MP356S、MP359S、MP360S、MP437S、MP451S、MP452S、MP466S、MP468S、MP476S、MP482S、MP522S、MP529S、MP548S、MP552S、MP562S、MP564S、MP566S、MP567S、MP569S、MP573S、MP574S、MP575S、MP581S、MP590、MP594S、MP596S、MP597、MP599S、MP600S、MP601S、MP602S、MP604S、MP626S、MP629S、MP630S、MP631S、MP632S、MP633S、MP634S、MP635S、MP639S、MP640S、MP644S、MP649S、MP651S、MP652S、MP653S、MP661S、MP666S、MP672S、MP696S、MP704S、MP724S、MP729S、MP739S、MP755S、MP773S、MP799S、MP800S、MP801S、MP802S、MP803S、MP805S、MP809S、MP815S、MP828S、MP831S、MP844S、MP852、MP865S、MP879S、MP887S、MP891S、MP896S、MP898S、MP935S、MP968、MP989、MP993、MP997、MP1049、MP1066、MP1067、MP1080、MP1081、MP1200、MP1206、MP1233、和MP1311。Cry蛋白的杀昆虫活性是本领域技术人员所熟知的(综述参见vanFrannkenhuyzen,(2009)J.Invert.Path.[无脊椎动物病理学杂志]101:1-16)。使用Cry蛋白作为转基因植物性状是本领域技术人员熟知的,并且Cry-转基因植物(包括但不限于表达以下的植物:Cry1Ac、Cry1Ac+Cry2Ab、Cry1Ab、Cry1A.105、Cry1F、Cry1Fa2、Cry1F+CrylAc、Cry2Ab、Cry3A、mCry3A、Cry3Bb1、Cry34Ab1、Cry35Ab1、Vip3A、mCry3A、Cry9c和CBI-Bt)已获得法规性审批(参见,Sanahuja,(2011)Plant Biotech Journal[植物生物技术杂志]9:283-300和CERA(2010)环境风险评估的转基因作物数据库中心(CERA)(GM CropDatabase Center for Environmental Risk Assessment(CERA)),ILSI研究基金会(ILSIResearch Foundation),华盛顿特区,网址为cera-gmc.org/index.php?action=gm_crop_database,其可以使用“www”前缀在万维网上访问)。本领域技术人员熟知的不只一种杀有害生物蛋白也可以在植物中表达,如Vip3Ab和Cry1Fa(US 2012/0317682);Cry1BE和Cry1F(US 2012/0311746);Cry1CA和Cry1AB(US 2012/0311745);Cry1F和CryCa(US 2012/0317681);Cry1DA和Cry1BE(US 2012/0331590);Cry1DA和Cry1Fa(US2012/0331589);Cry1AB和Cry1BE(US 2012/0324606);Cry1Fa和Cry2Aa以及Cry1T和Cry1E(US 2012/0324605);Cry34Ab/35Ab和Cry6Aa(US 20130167269);Cry34Ab/VCry35Ab和Cry3Aa(US20130167268);Cry1Da和Cry1Ca(US 9796982);Cry3Aa和Cry6Aa(US 9798963);以及Cry3A和Cry1Ab或Vip3Aa(US 9,045,766)。杀有害生物蛋白还包括杀昆虫脂肪酶,所述杀昆虫脂肪酶包括美国专利号7,491,869的脂质酰基水解酶,和胆固醇氧化酶,如来自链霉菌属(Purcell等人,(1993)Biochem Biophys Res Commun[生物化学与生物物理学研究通讯]15:1406-1413)。杀有害生物蛋白还包括美国专利号5,877,012、6,107,279、6,137,033、7,244,820、7,615,686和8,237,020中的VIP(营养期杀昆虫蛋白)毒素等。其他VIP蛋白质是本领域技术人员熟知的(参见,lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/vip.html,其可以使用“www”前缀在万维网上访问)。杀有害生物蛋白还包括PCT序列号PCT/US 2017/000510的Cyt蛋白(包括Cyt1A变体);杀有害生物蛋白还包括毒素复合物(TC)蛋白,所述毒素复合物蛋白可从生物体如致病杆菌属、发光杆菌属和类芽孢杆菌属获得(参见,美国专利号7,491,698和8,084,418)。一些TC蛋白具有“独立”杀昆虫活性并且其他TC蛋白增强由相同给定生物体产生的独立毒素的活性。可以通过源自不同属的来源生物体的一种或多种TC蛋白“增效剂”来增强“独立”TC蛋白(例如来自发光杆菌属、致病杆菌属或类芽孢杆菌属)的毒性。有三种主要类型的TC蛋白。如本文所提及的,A类蛋白(“蛋白A”)是独立毒素。B类蛋白(“蛋白B”)和C类蛋白(“蛋白C”)增强了A类蛋白的毒性。A类蛋白的实例是TcbA、TcdA、XptA1和XptA2。B类蛋白的实例是TcaC、TcdB、XptB1Xb和XptC1Wi。C类蛋白的实例是TccC、XptC1Xb和XptB1Wi。杀有害生物蛋白还包括蜘蛛、蛇和蝎毒蛋白。蜘蛛毒肽的实例包括但不限于莱科毒素-1肽及其突变体(美国专利号8,334,366)。产生的组合还可以包括目的多核苷酸中的任何一个的多个拷贝。

赋予对除草剂的抗性的转基因,例如:编码对如下除草剂的抗性的多核苷酸,所述除草剂抑制生长点或分生组织,如咪唑啉酮或磺酰脲。这个类别的示例性基因编码突变体ALS和AHAS酶,例如分别如以下文献中所述:Lee等人,(1988)EMBO J.[欧洲分子生物学学会杂志]7:1241和Miki等人,(1990)Theor.Appl.Genet.[理论与应用遗传学]80:449。还参见,美国专利号5,605,011、5,013,659、5,141,870、5,767,361、5,731,180、5,304,732、4,761,373、5,331,107、5,928,937和5,378,824;美国专利申请序列号11/683,737和国际公开WO1996/33270。编码对草甘膦(分别由突变体5-烯醇丙酮酰-3-磷酸合酶(EPSP)和aroA基因赋予的抗性)和其他膦酰基化合物如草铵膦(草丁膦乙酰转移酶(PAT)和吸水链霉菌草丁膦乙酰转移酶(bar)基因)和吡啶氧基或苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)有抗性的蛋白质的多核苷酸。参见,例如Shah等人的美国专利号4,940,835,其公开了EPSPS形式的能赋予草甘磷抗性的核苷酸序列。Barry等人的美国专利号5,627,061也描述了编码EPSPS酶的基因。还参见,美国专利号6,566,587、6,338,961、6,248,876、6,040,497、5,804,425、5,633,435、5,145,783、4,971,908、5,312,910、5,188,642、5,094,945、4,940,835、5,866,775、6,225,114、6,130,366、5,310,667、4,535,060、4,769,061、5,633,448、5,510,471;Re.36,449;RE 37,287E和5,491,288以及国际公开EP 1173580;WO 2001/66704;EP1173581和EP 1173582,为此目的将以上专利通过引用并入本文。还给予植物草甘磷抗性,使所述植物表达编码草甘磷氧化还原酶的基因,这在美国专利号5,776,760和5,463,175中进行了更全面地描述,为此目的将这两份专利通过引用并入本文。另外,可通过过量表达编码草甘磷N-乙酰转移酶的基因,来赋予植物草甘磷抗性。参见,例如美国专利号7,462,481、7,405,074,以及美国专利申请公开号2008/0234130。

在一些实施例中,堆叠的性状可以处于一种或多种目的多核苷酸沉默的形式,导致对一种或多种靶标有害生物多肽的抑制。在一些实施例中,使用抑制DNA构建体来实现该沉默,包括但不限于共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制构建体、茎环抑制构建体、产生双链RNA的构建体、以及(更普遍地)RNAi(RNA干扰)构建体和小RNA构建体(如siRNA(短干扰RNA)构建体和miRNA(微小RNA)构建体)。

在一些实施例中,堆叠的性状可以选自监管部门批准的事件,这些事件可以在环境风险评估中心(cera-gmc.org/?action=gm_crop_database,其可以使用www前缀进行访问)和在国际农业生物技术应用服务部门(isaaa.org/gmapprovaldatabase/default.asp,其可以使用www前缀进行访问)找到。

在有害生物控制方面的用途

可以使用在有害生物防治或使其他生物体工程化中用于使用包含实施例的核酸序列或其变体的菌株作为杀有害生物剂的一般方法。

可以选择已知占据一种或多种目的作物的“植物圈”(叶面、叶际、根围和/或根面)的微生物宿主。选择这些微生物是为了能够在特定的环境中与野生型微生物成功竞争,提供表达本公开的多肽的基因的稳定维持和表达,并且理想的是,提供改善的保护杀有害生物剂免受环境退化和失活。

可替代地,本公开的多肽通过将异源基因导入细胞宿主而产生。异源基因的表达直接或间接地导致杀有害生物剂在细胞内产生和维持。然后,当将细胞应用于一种或多种靶有害生物的环境中时,在延长所述细胞中所产生的毒素的活性的条件下处理这些细胞。所得产物保留所述毒素的毒性。然后可以根据常规技术配制这些天然包封的本公开的多肽,以施用于靶标有害生物所寄宿的环境(例如,土壤、水和植物的叶子)中。参见,例如EPA0192319及其中引用的参考文献。

杀有害生物组合物

在一些实施例中,活性成分能以组合物的形式施用并且可以与其他化合物同时或相继施用于需要处理的作物区域或植物。这些化合物可以是在单次施用所述制剂后允许长期对靶区域进行给予的肥料、除草剂、冷冻保护剂、表面活性剂、洗涤剂、杀有害生物肥皂、休眠油、聚合物和/或延时释放的或可生物降解的运载体制剂。它们还可以是选择性除草剂、化学杀昆虫剂、杀病毒剂、杀微生物剂、杀变形虫剂、杀有害生物剂、杀真菌剂、杀细菌剂、杀线虫剂、杀软体动物剂或这些制品中的若干种的混合物,如果需要,与在制剂领域内通常使用的另外的农业上可接受的运载体、表面活性剂或促进施用的助剂一起。合适的运载体和助剂可以是固体或液体,并且对应于在制剂技术中常常采用的物质,例如天然的或再生的矿物质、溶剂、分散剂、润湿剂、增粘剂、粘合剂或肥料。类似地,制剂可以制备成可食用的“诱饵”或者塑成有害生物“陷阱”以允许靶标有害生物取食或摄取所述有害生物制剂。

施用包含由细菌菌株产生的本公开的多肽中的至少一种的活性成分或农药组合物的方法包括叶施用、种子包衣和土壤施用。施用次数和施用速度取决于相应有害生物侵染的强度。

可以将组合物配制成粉末、尘剂、丸剂、颗粒、喷雾、乳液、胶体、溶液等,并且可以通过干燥、冻干、匀浆、萃取、过滤、离心、沉降或浓缩包含所述多肽的细胞培养物等常规方法进行制备。在所有这类含有至少一种这样的杀有害生物多肽的组合物中,所述多肽能以按重量计从约1%至约99%的浓度存在。

可以通过本公开的方法在给定区域中杀灭鳞翅目、双翅目、异翅目、线虫、半翅目或鞘翅目有害生物或减少其数量,或者可以预防性地将其施用于环境区域以防止易感有害生物的侵袭。优选地,所述有害生物摄入杀有害生物有效量的多肽或与其接触。如本文使用的“杀有害生物有效量”是指能够对至少一种有害生物造成死亡或显著减少有害生物生长、取食或正常生理发育的有害生物的量。所述量将根据例如待控制的具体靶标有害生物,待处理的特定环境、地点、植物、作物或农业场所,环境条件以及杀有害生物有效的多肽组合物施用的方法、速率、浓度、稳定性和数量等因素而变化。制剂也可以根据气候条件、环境因素和/或施用频率和/或有害生物侵染的严重程度而变化。

可以通过用所需的农业上可接受的运载体配制细菌细胞、晶体和/或孢子悬浮液或分离的蛋白组分来制备所需的杀有害生物剂组合物。可以在施用之前以适当方式(如冻干、冷冻干燥、干燥)或者在水性运载体、培养基或合适的稀释剂(例如盐水或另一种缓冲液)中配制这些组合物。配制的组合物可以是尘剂或颗粒状物质的形式或者在油(植物或矿物)或水或油/水乳液中的悬浮液或者作为可湿性粉剂或者与适用于农业应用的任何其他运载体材料组合的形式。合适的农业运载体可以是固体或液体。术语“农业上可接受的运载体”涵盖通常用于杀有害生物剂制剂技术的所有助剂、惰性组分、分散剂、表面活性剂、增粘剂、粘合剂等。制剂可以与一种或多种固体或液体佐剂混合,并通过各种方法(例如通过使用常规制剂技术将杀有害生物组合物与合适的佐剂均匀混合、共混和/或研磨)制备。美国专利号6,468,523中描述了合适的制剂和施用方法,其通过引用并入本文。还可以用一种或多种化学组合物处理植物,所述化学组合物包括一种或多种除草剂、杀昆虫剂或杀真菌剂。示例性化学组合物包括:果实/蔬菜除草剂:莠去津、除草定、敌草隆、草甘膦、利谷隆、嗪草酮、西玛津、氟乐灵、吡氟禾草灵、草铵膦、氯吡嘧磺隆Gowan、百草枯、戊炔草胺、烯禾啶、氟丙嘧草酯、氯吡嘧磺隆、茚嗪氟草胺(Indaziflam);果实/蔬菜杀昆虫剂:涕灭威、苏云金芽孢杆菌、甲萘威、克百威、毒死蜱、氯氰菊酯、溴氰菊酯、二嗪磷、马拉硫磷、阿维菌素、氟氯氰菊酯/β-氟氯氰菊酯、高氰戊菊酯、λ-氯氟氰菊酯、灭螨醌、联苯肼酯、甲氧虫酰肼、双苯氟脲、环虫酰肼、噻虫啉、呋虫胺、嘧螨酯、唑虫酰胺、噻虫胺、螺螨酯、γ-氯氟氰菊酯、螺甲螨酯、多杀菌素、氯虫酰胺、氰虫酰胺、Spinoteram、杀虫脲、螺虫乙酯、吡虫啉、氯虫双酰胺、硫双威、氰氟虫腙、氟啶虫胺腈、丁氟螨酯、Cyanopyrafen、吡虫啉、噻虫胺、噻虫嗪、Spinotoram、硫双威、氟啶虫酰胺、甲硫威、因灭汀-苯甲酸盐、茚虫威、噻唑磷、苯线磷、硫线磷、蚊蝇醚、苯丁锡、噻螨酮、灭多威、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮;果实/蔬菜杀真菌剂:多菌灵、百菌清、EBDC、硫、甲基硫菌灵、嘧菌酯、霜脲氰、氟啶胺、乙膦酸、异菌脲、醚菌酯、甲霜灵/精甲霜灵、肟菌酯、噻唑菌胺、丙森锌、肟菌酯、环酰菌胺、富马酸噁咪唑、氰霜唑、咪唑菌酮、苯酰菌胺、ZorvecTM、啶氧菌酯、吡唑醚菌酯、环氟菌胺、啶酰菌胺;谷物除草剂:异丙隆、溴苯腈、碘苯腈、苯氧基类、氯磺隆、炔草酸、禾草灵、吡氟草胺、噁唑禾草灵、双氟磺草胺、氟草烟、甲磺隆、醚苯磺隆、氟酮磺隆、碘磺隆、丙苯磺隆、氟吡酰草胺、甲磺胺磺隆、氟丁酰草胺、唑啉草酯、酰嘧磺隆、噻吩磺隆甲基、苯磺隆、氟啶嘧磺隆、磺酰磺隆、磺酰草吡唑、甲氧磺草胺、氟噻草胺、肟草酮、吡咯磺隆;谷物杀真菌 :多菌灵、百菌清、嘧菌酯、环唑醇、嘧菌环胺、丁苯吗啉、氟环唑、醚菌酯、喹氧灵、戊唑醇、肟菌酯、硅氟唑、啶氧菌酯、吡唑醚菌酯、醚菌胺、丙硫菌唑、氟嘧菌酯;谷物杀昆虫剂:乐果、λ-氯氟氰菊酯、溴氰菊酯、α-氯氰菊酯、β-氟氯氰菊酯、联苯菊酯、吡虫啉、噻虫胺、噻虫嗪、噻虫啉、啶虫脒、呋虫胺、Clorphyriphos、甲胺磷、乙酰甲胺磷、抗蚜威、甲硫威;玉蜀黍除草 :莠去津、甲草胺、溴苯腈、乙草胺、麦草畏、二氯吡啶酸、(S-)二甲酚草胺、草铵膦、草甘膦、异噁唑草酮、(S-)异丙甲草胺、甲基磺草酮、烟嘧磺隆、氟嘧磺隆、Revulin;在砜嘧磺隆、磺草酮、甲酰胺磺隆、苯吡唑草酮、环磺酮、嘧啶肟草醚、噻酮磺隆、氟噻草胺、吡咯磺隆中;玉蜀黍杀昆虫剂:克百威、毒死蜱、联苯菊酯、氟虫腈、吡虫啉、λ-氯氟氰菊酯、七氟菊酯、特丁硫磷、噻虫嗪、噻虫胺、螺甲螨酯、氯虫双酰胺、杀虫脲、氯虫酰胺、溴氰菊酯、硫双威、β-氟氯氰菊酯、氯氰菊酯、联苯菊酯、虱螨脲、杀虫隆、七氟菊酯、嘧丙磷、乙虫腈、氰虫酰胺、噻虫啉、啶虫脒、呋虫胺、阿维菌素、甲硫威、螺螨酯、螺虫乙酯;玉蜀黍杀真菌剂:种衣酯、福美双、丙硫菌唑、戊唑醇、肟菌酯;水稻除草剂:丁草胺、敌稗、四唑嘧磺隆、苄嘧磺隆、氰氟草酯、杀草隆、四唑酰草胺、唑吡嘧磺隆、苯噻草胺、去稗安、吡嘧磺隆、稗草畏、二氯喹啉酸、禾草丹、茚草酮、氟噻草胺、四唑酰草胺、氯吡嘧磺隆、去稗安、苯并双环酮、环酯草醚、五氟磺草胺、双草醚、丙炔噁草酮、乙氧嘧磺隆、丙草胺、甲基磺草酮、特呋三酮、噁草酮、噁唑禾草灵、吡丙醚;水稻杀昆虫剂:二嗪磷、杀螟硫磷、仲丁威、久效磷、丙硫克百威、噻嗪酮、呋虫胺、氟虫腈、吡虫啉、异丙威、噻虫啉、环虫酰肼、噻虫啉、呋虫胺、噻虫胺、乙虫腈、氯虫双酰胺、氯虫酰胺、溴氰菊酯、啶虫脒、噻虫嗪、氰虫酰胺、多杀菌素、Spinotoram、因灭汀-苯甲酸盐、氯氰菊酯、毒死蜱、杀螟丹、甲胺磷、醚菊酯、三唑磷、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、克百威、丙硫克百威;水稻杀真菌剂:甲基硫菌灵、嘧菌酯、环丙酰菌胺、敌瘟磷、嘧菌腙、异稻瘟净、稻瘟灵、戊菌隆、噻菌灵、咯喹酮、三环唑、肟菌酯、双氯氰菌胺、氰菌胺、硅氟唑、噻酰菌胺;棉花除草剂:敌草隆、伏草隆、MSMA、乙氧氟草醚、扑草净、氟乐灵、唑草酮、烯草酮、吡氟禾草灵-丁基、草甘膦、达草灭、二甲戊乐灵、嘧硫草醚钠、三氟啶磺隆、得杀草、草铵膦、丙炔氟草胺、塞苯隆;棉花杀昆虫剂:乙酰甲胺磷、涕灭威、毒死蜱、氯氰菊酯、溴氰菊酯、马拉硫磷、久效磷、阿维菌素、啶虫脒、因灭汀-苯甲酸盐、吡虫啉、茚虫威、λ-氯氟氰菊酯、多杀菌素、硫双威、γ-氯氟氰菊酯、螺甲螨酯、啶虫丙醚、氟啶虫酰胺、氯虫双酰胺、杀虫脲、氯虫酰胺、β-氟氯氰菊酯、螺虫乙酯、噻虫胺、噻虫嗪、噻虫啉、呋虫胺、氯虫双酰胺、氰虫酰胺、多杀菌素、Spinotoram、γ-氯氟氰菊酯、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、硫双威、阿维菌素、氟啶虫酰胺、啶虫丙醚、螺甲螨酯、氟啶虫胺腈、丙溴磷、三唑磷、硫丹;棉花杀真菌剂:土菌灵、甲霜灵、喹硫磷;大豆除草剂:甲草胺、灭草松、氟乐灵、氯嘧磺隆-乙基、氯酯磺草胺、噁唑禾草灵、氟磺胺草醚、吡氟禾草灵、草甘膦、甲氧咪草烟、灭草喹、咪草烟、(S-)异丙甲草胺、嗪草酮、二甲戊乐灵、得杀草、草铵膦;大豆杀昆虫剂:λ-氯氟氰菊酯、灭多威、对硫磷、硫威(Thiocarb)、吡虫啉、噻虫胺、噻虫嗪、噻虫啉、啶虫脒、呋虫胺、氯虫双酰胺、氯虫酰胺、氰虫酰胺、多杀菌素、Spinotoram、因灭汀-苯甲酸盐、氟虫腈、乙虫腈、溴氰菊酯、β-氟氯氰菊酯、γ和λ氯氟氰菊酯、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、螺虫乙酯、螺螨酯、杀虫脲、氟啶虫酰胺、硫双威、β-氟氯氰菊酯;大豆杀真菌剂:嘧菌酯、环唑醇、氟环唑、粉唑醇、吡唑醚菌酯、戊唑醇、肟菌酯、丙硫菌唑、四氟醚唑;甜菜除草剂:杀草敏、甜菜安、乙氧氟草黄、甜菜宁、野麦畏、二氯吡啶酸、吡氟禾草灵、环草定、苯嗪草酮、喹草酸、噻草酮、氟胺磺隆、得杀草、喹禾灵;甜菜杀昆虫剂:吡虫啉、噻虫胺、噻虫嗪、噻虫啉、啶虫脒、呋虫胺、溴氰菊酯、β-氟氯氰菊酯、γ/λ氯氟氰菊酯、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、七氟菊酯、氯虫酰胺、氰虫酰胺、氟虫腈、克百威;卡诺拉油菜除草剂:二氯吡啶酸、禾草灵、吡氟禾草灵、草铵膦、草甘膦、吡草胺、氟乐灵、胺苯磺隆、喹草酸、喹禾灵、烯草酮、得杀草;卡诺拉油菜杀真菌剂:嘧菌酯、多菌灵、咯菌腈、异菌脲、丙氯灵、烯菌酮;卡诺拉油菜杀昆虫剂:克百威、有机磷酸盐类、拟除虫菊酯、噻虫啉、溴氰菊酯、吡虫啉、噻虫胺、噻虫嗪、啶虫脒、呋虫胺、β-氟氯氰菊酯、γ以及λ氯氟氰菊酯、τ-氟氰胺菊酯、乙虫腈、多杀菌素、Spinotoram、氯虫双酰胺、氯虫酰胺、氰虫酰胺、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮。

在一些实施例中,除草剂是莠去津、除草定、敌草隆、氯磺隆、甲磺隆、噻吩磺隆甲基、苯磺隆、乙草胺、麦草畏、异噁唑草酮、烟嘧磺隆、砜嘧磺隆、嘧硫草醚钠、丙炔氟草胺、氯嘧磺隆-乙基、嗪草酮、喹禾灵、精异丙甲草胺(S-metolachlor)、环己通(Hexazinne)或其组合。

在一些实施例中,杀昆虫剂是高氰戊菊酯、氯虫苯甲酰胺、灭多威、茚虫威、草氨酰或其组合。

杀有害生物和杀昆虫活性

“有害生物”包括但不限于:昆虫、真菌、细菌、线虫、螨、蜱等。昆虫有害生物包括选自以下各目的昆虫:鞘翅目、双翅目、膜翅目(Hymenoptera)、鳞翅目、食毛目(Mallophaga)、同翅目(Homoptera)、半翅目、直翅目(Orthroptera)、缨翅目(Thysanoptera)、革翅目(Dermaptera)、等翅目(Isoptera)、虱目(Anoplura)、蚤目(Siphonaptera)、毛翅目(Trichoptera)等,特别是鳞翅目和鞘翅目。

本领域的技术人员会知道,不是所有的化合物均对所有有害生物同样有效。实施例的化合物显示针对昆虫有害生物的活性,其可以包括经济上重要的农艺学、森林、温室、苗圃观赏植物、食物和纤维,公共和动物健康,国内和商业结构,家庭和储存产品有害生物。

鳞翅目幼虫包括但不限于:夜蛾科(Noctuidae)中的夜蛾、地老虎、尺蠖和实夜蛾亚科,草地贪夜蛾(Spodoptera frugiperda)(秋夜蛾(fall armyworm));菜夜蛾(Spodoptera exigua Hübner)(甜菜夜蛾(beet armyworm));斜纹夜蛾(Spodopteralitura Fabricius)(烟草夜蛾、茶蚕(cluster caterpillar));蓓带夜蛾(Mamestraconfigurata Walker)(披肩粘虫(bertha armyworm));甘蓝夜蛾(Mamestra brassicaeLinnaeus)(菜夜蛾(cabbage moth));小地老虎(Agrotis ipsilon Hufnagel)(黑切根虫(black cutworm));西方灰地老虎(Agrotis orthogonia Morrison)(西部切根虫(westerncutworm));粒肤地老虎(Agrotis subterranea Fabricius)(粒肤切根虫(granulatecutworm));棉叶波纹夜蛾(Alabama argillacea Hübner)(棉叶虫(cotton leaf worm));粉纹夜蛾(Trichoplusia ni Hübner)(甘蓝银纹夜蛾(cabbage looper));大豆尺夜蛾(Pseudoplusia includens Walker)(大豆夜蛾(soybean looper));梨豆夜蛾(Anticarsiagemmatalis Hübner)(黎豆夜蛾(velvetbean caterpillar));粗长须夜蛾(Hypena scabraFabricius)(苜猜绿夜蛾(green cloverworm));烟芽夜蛾(Heliothis virescensFabricius)(烟青虫(tobacco budworm));一星黏虫(Pseudaletia unipuncta Haworth)(夜蛾);粗皮委夜蛾(Athetis mindara Barnes and Mcdunnough)(粗皮切根虫(roughskinned cutworm));暗缘地老虎(Euxoa messoria Harris)(暗黑切根虫(darksidedcutworm));棉斑实蛾(Earias insulana Boisduval)(多刺螟蛉(spiny bollworm));翠纹钻夜蛾(Earias vittella Fabricius)(斑点螟蛉(spotted bollworm));棉铃虫(Helicoverpa armigera Hübner)(美洲螟蛉(American bollworm));玉米穗虫(玉米穗蛾(corn earworm)或棉铃虫(cotton bollworm));斑马纹夜蛾(Melanchra picta Harris)(斑马纹夜蛾(zebra caterpillar));柑橘夜蛾(Egira (Xylomyges)curialis Grote)(柑橘地老虎(citrus cutworm));来自螟蛾科玉米螟(Ostrinia nubilalis Hübner,欧洲玉米螟(European corn borer))的螟虫、鞘蛾、结网虫、锥形虫(coneworms)、和雕叶虫(skeletonizers);脐橙螟蛾(Amyelois transitella Walker)(脐橙螟(navalorangeworm));地中海粉螟(Anagasta kuehniella Zeller)(地中海粉斑螟(Mediterranean flour moth));干果斑螟(Cadra cautella Walker)(粉斑螟(almondmoth));二化螟(Chilo suppressalis Walker)(水稻螟虫(rice stem borer));斑禾草螟(Chilo partellus),(高粱螟(sorghum borer));米螟(Corcyra cephalonica Stainton)(米蛾(rice moth));玉米根草螟(Crambus caliginosellus Clemens)(玉米根结网虫(corn root webworm));早熟禾草螟(Crambus teterrellus Zincken)(早熟禾结网虫(bluegrass webworm));稻纵卷叶螟(Cnaphalocrocis medinalis Guenée)(稻纵卷叶螟(rice leaf roller))葡萄里予螟(Desmia funeralis Hübner)(葡萄野螟(grapeleaffolder));甜瓜绢野螟(Diaphania hyalinata Linnaeus)(甜瓜野螟(melon worm));黄瓜绢野螟(Diaphania nitidalis Stoll)(泡菜虫(pickleworm));巨座玉米螟(Diatraeagrandiosella Dyar)(西南玉米秆草螟(southwestern corn borer))、小蔗螟(Diatraeasaccharalis Fabricius)(甘蔗螟(surgarcane borer));墨西哥稻螟(Eoreuma loftiniDyar)(墨西哥稻螟(Mexican rice borer));烟草粉斑螟(Ephestia elutella Hübner)(烟草飞蛾(tobacco(cacao)moth));大蜡螟(Galleria mellonella Linnaeus)(大蜡蛾(greater wax moth));水稻切叶野螟(Herpetogramma licarsisalis Walker)(草地螟(sod webworm));向日葵同斑螟(Homoeosoma electellum Hulst)(向日葵螟(sunflowermoth));南美玉米苗斑螟(Elasmopalpus lignosellus Zeller)(小玉米茎蛀虫(lessercornstalk borer));小蜡螟(Achroia grisella Fabricius)(小蜡蛾(lesser waxmoth));草地螟(Loxostege sticticalis Linnaeus)(草地螟(beet webworm));茶树螟(Orthaga thyrisalis Walker)(茶树蛾(tea tree web moth));豆英野螟(Marucatestulalis Geyer)(豆英蛀螟(bean pod borer));印度谷螟(Plodia interpunctella Hübner)(印度谷螟(Indian meal moth));三化螟(Scirpophaga incertulas Walker)(三化螟(yellow stem borer));温室螟(Udea rubigalis Guenée)(芹菜卷叶螟(celeryleaftier));和卷蛾科(Tortricidae)中的卷叶虫、蚜虫、种实虫以及果实虫,西部黑头长翅卷蛾(Acleris gloverana Walsingham)(西部黑头蚜虫(Western blackheadedbudworm));东部黑头长翅卷蛾(Acleris variana Fernald)(东部黑头蚜虫(Easternblackheaded budworm));果树黄卷蛾(Archips argyrospila Walker)(果树卷叶蛾(fruittree leafroller));罗萨娜黄卷蛾(Archips rosana Linnaeus)(欧洲卷叶蛾(Europeanleaf roller));和其他黄卷蛾属物种,苹小卷叶蛾(Adoxophyes orana Fischer von)(苹果小卷蛾(summer fruit tortrix moth));条纹向日葵螟(Cochylishospes Walsingham)(带状向日葵斑蛾(banded sunflower moth));榛小卷蛾(Cydialatiferreana Walsingham)(filbertworm);苹果蠹蛾(Cydia pomonella Linnaeus)(苹果蠹蛾(coding moth));杂色卷叶蛾(Platynota flavedana Clemens)(色稻纵卷叶螟(variegated leafroller));荷兰石竹小卷蛾(Platynota stultana Walsingham)(杂食卷叶蛾(omnivorous leafroller));鲜食葡萄小卷蛾(Lobesia botrana Denis&Schiffermüller)(欧洲葡萄蛾(European grape vine moth));苹白小卷蛾(Spilonota ocellanaDenis&Schiffermüller)(苹果芽小卷叶蛾(eyespotted bud moth));萄果实虫主虫(Endopiza viteana Clemens)(葡萄小卷叶蛾(grape berry moth));女贞细卷蛾(Eupoecilia ambiguella Hübner)(葡萄果蠹蛾(vine moth));巴西苹果卷叶虫(Bonagotasalubricola Meyrick)(巴西苹果小卷叶蛾(Brazilian apple leafroller));东方果实蛾(Grapholita molesta Busck)(梨小食心虫(oriental fruit moth));向日葵芽蛾(Suleima helianthana Riley)(向日葵芽蛾(sunflower bud moth));带卷蛾属物种(Argyrotaenia spp.);卷叶蛾属物种(Choristoneura spp.)。

鳞翅目中选择的其他农艺学有害生物包括但不限于秋星尺蠖(Alsophilapometaria Harris)(秋星尺蠖(fall cankerworm));桃条麦蛾(Anarsia lineatellaZeller)(桃条麦蛾(peach twig borer));栎橙纹犀额蛾(Anisota senatoria)(橙色斑纹橡木虫(orange striped oakworm));柞蚕(Antheraea pernyi Guérin-Méneville)(中橡木柞蚕虫(Chinese Oak Tussah Moth));家蚕(Bombyx mori Linnaeus)(桑蚕(Silkworm));棉潜蛾(Bucculatrix thurberiella Busck)(棉叶潜蛾(cotton leafperforator));纹黄豆粉蝶(Colias eurytheme Boisduval)(苜蓿粉蝶(alfalfacaterpillar));核桃舟蛾(Datana integerrima Grote&Robinson)(核桃天社蛾(walnutcaterpillar));落叶松毛虫(Dendrolimus sibiricus Tschetwerikov)(西伯利亚蚕蛾(Siberian silk moth)),白尺蠖蛾(Ennomos subsignaria Hübner)(榆角尺蠖(elmspanworm));菩提尺蠖(Erannis tiliaria Harris)(椴尺蠖(linden looper));黄毒蛾(Euproctis chrysorrhoea Linnaeus)(棕尾毒蛾(browntail moth));黑拟蛉蛾(Harrisina americana Guérin-Méneville)(野棉花夜蛾(grapeleaf skeletonizer));牧草天蚕蛾(Hemileuca oliviae Cockrell)(牧草天蚕蛾(range caterpillar));美国白蛾(Hyphantria cunea Drury)(美国白蛾(fall webworm));番茄茎麦蛾(Keiferialycopersicella Walsingham)(番茄蛲虫(tomato pinworm));东部铁杉尺蠖指明亚种(Lambdina fiscellaria fiscellaria Hulst)(东部铁杉尺蠖(Eastern hemlocklooper));西部铁杉尺蠖(L.fiscellaria lugubrosa Hulst)(西部铁杉尺蠖(Westernhemlock looper));柳毒蛾(Leucoma salicis Linnaeus)(雪毒蛾(satin moth));舞毒蛾(Lymantria dispar Linnaeus)(舞毒蛾(gypsy moth));番茄天蛾(Manducaquinquemaculata Haworth)(五点天蛾(five spotted hawk moth),番茄天蛾(tomatohornworm));烟草天蛾(M sexta Haworth)(番茄天蛾(tomato hornworm)、烟草天蛾(tobacco hornworm));冬尺蠖蛾(Operophtera brumata Linnaeus)(冬尺蠖蛾(wintermoth));春尺蠖(Paleacrita vernata Peck)(春尺蠖(spring cankerworm));美洲大芷凤蝶(Papilio cresphontes Cramer)(大黄带凤蝶(giant swallowtail),柑桔凤蝶(orangedog));加州木角斗蛾(Phryganidia californica Packard)(加州槲蛾(Califomiaoakworm));柑桔潜蛾(Phyllocnistis citrella Stainton)(柑桔潜叶蛾(citrusleafminer));斑幕潜叶蛾(Phyllonorycter blancardella Fabricius)(斑点幕型潜叶虫(spotted tentiform leafminer));欧洲粉蝶(Pieris brassicae Linnaeus)(大白粉蝶(large white butterfly));菜青虫(P.rapae Linnaeus)(小白粉蝶(small whitebutterfly));暗脉菜粉蝶(P.napi Linnaeus)(绿脉菜粉蝶(green veined whitebutterfly));洋蓟葱羽蛾(Platyptilia carduidactyla Riley)(洋蓟羽蛾(artichokeplume moth));小菜蛾(Plutella xylostella Linnaeus)(小菜蛾(diamondback moth));棉红铃虫(Pectinophora gossypiella Saunders)(粉螟蛉(pink bollworm));多形云粉蝶(Pontia protodice)(Boisduval和Leconte)(南方菜青虫(Southern cabbageworm));杂食尺蠖(Sabulodes aegrotata Guenée)(杂食尺蠖(omnivorous looper));红抚天社蛾(Schizura concinna J.E.Smith)(红疣天社蛾(red humped caterpillar));麦蛾(Sitotroga cerealella Olivier)(麦蛾(Angoumois grain moth));松异带蛾(Thaumetopoea pityocampa Schiffermuller)(松树列队毛虫(pine processionarycaterpillar));幕谷蛾(Tineola bisselliella Hummel)(负袋夜蛾(webbingclothesmoth));番茄斑潜蝇(Tuta absoluta Meyrick)(番茄斑潜蝇(tomatoleafminer));苹果巢蛾(Yponomeuta padella Linnaeus)(巢蛾(ermine moth));Heliothis subflexa Guenée;天幕毛虫属(Malacosoma)物种和古毒蛾属(Orgyia)物种。

目的是鞘翅目的幼虫和成体,其包括来自长角象科(Anthribidae)、豆象科(Bruchidae)和象甲科(Curculionidae)的象鼻虫(包括但不限于:墨西哥棉铃象(Anthonomus grandis Boheman)(棉铃象甲(boll weevil));稻水象甲(Lissorhoptrusoryzophilus Kuschel)(稻水象虫(rice water weevil));谷象(Sitophilus granariusLinnaeus)(谷象(granary weevil));米象(S.oryzae Linnaeus)(米象(rice weevil));三叶草叶象(Hypera punctata Fabricius)(车轴草叶象虫(clover leaf weevil));密点细枝象(Cylindrocopturus adspersus LeConte)(向日葵茎象鼻虫(sunflower stemweevil));黄褐小爪象(Smicronyx fulvus LeConte)(红葵花籽象甲(red sunflower seedweevil));灰色小爪象(S.sordidus LeConte)(灰葵花籽象甲(gray sunflower seedweevil));玉米隐啄象(Sphenophorus maidis Chittenden)(玉米象虫(maizebillbug)));叶甲科(Chrysomelidae)的跳甲、黄瓜叶甲、根虫、叶甲、马铃薯叶甲以及潜叶虫(包括但不限于:马铃薯叶甲(Leptinotarsa decemlineata Say)(马铃薯甲虫(Coloradopotato beetle));玉米根萤叶甲指明亚种(Diabrotica virgifera virgifera LeConte)(西方玉米根虫);北方玉米根虫(D.barberi(Smith和Lawrence))(北方玉米根虫(northerncorn rootworm));黄瓜十一星叶甲食根亚种(D.undecimpunctata howardi Barber)(南方玉米根虫(southern corn rootworm));玉米铜色跳甲(Chaetocnema pulicariaMelsheimer)(玉米跳甲(corn flea beetle));十字花科跳甲(Phyllotreta cruciferaeGoeze)(十字花科蔬菜跳甲(Crucifer flea beetle));黄曲条跳甲(Phyllotretastriolata)(黄曲条跳甲(stripped flea beetle));肖叶甲褐斑(Colaspis brunneaFabricius)(葡萄肖叶甲(grape colaspis));橙足负泥虫(Oulema melanopus Linnaeus)(谷叶甲虫(cereal leaf beetle));向日葵叶甲(Zygogramma exclamationis Fabricius)(向日葵叶甲(sunflower beetle)));来自瓢虫科(Coccinellidae)的甲虫(包括但不限于:墨西哥豆瓢虫(Epilachna varivestis Mulsant)(墨西哥豆瓢虫(Mexican beanbeetle)));金龟子和来自金龟子科(Scarabaeidae)的其他甲虫(包括但不限于:日本丽金龟(Popillia japonwa Newman)(日本金龟子(Japanese beetle));北方圆头犀金龟(Cyclocephala borealis Arrow)(北方独角仙(northern masked chafer),白蛴螬(whitegrub));南方圆头犀金龟(C.immaculata Olivier)(南方独角仙(southern maskedchafer),白蛴螬(white grub));欧洲切根鳃金龟(Rhizotrogus majalis Razoumowsky)(欧洲金龟子(European chafer));长毛食叶然金龟(Phyllophaga crinita Burmeister)(白蛴螬(white grub));胡萝卜金龟(Ligyrus gibbosus De Geer)(胡萝卜金龟(carrotbeetle)));来自皮蠹科(Dermestidae)的红缘皮蠹(carpet beetle);来自叩甲科(Elateridae)、伪金针虫属物种(Eleodes spp.)、梳爪叩头虫属物种(Melanotus spp.)的金针虫;宽胸金针虫属物种(Conoderus spp.);叩甲属物种(Limonius spp.);缺隆叩甲属物种(Agriotes spp.);特尼塞拉属物种(Ctenicera spp.);埃俄罗斯属物种(Aeolusspp.);来自小蠹科(Scolytidae)的树皮甲虫和来自拟步甲科(Tenebrionidae)的甲虫。

引人关注的是双翅目的成虫和未成熟的虫,包括潜叶虫玉米斑潜蝇(Agromyzaparvicornis Loew)(玉米斑潜蝇(corn blotch leafminer));摇蚊科(包括但不限于:高粱瘿蚊(Contarinia sorghicola Coquillett)(高梁瘿蚊(sorghum midge));黑森瘿蚊(Mayetiola destructor Say)(黑森蝇(Hessian fly));麦红吸浆虫(Sitodiplosismosellana Géhin)(小麦吸浆虫(wheat midge));葵花籽蚊(Neolasiopteramurtfeldtiana Felt)(向日葵籽瘿蚊(sunflower seed midge));果蝇(实蝇科(Tephritidae))、瑞典麦秆蝇(Oscinella frit Linnaeus)(果蝇(frit flies));蛆虫(包括但不限于:灰地种蝇(Delia platura Meigen)(种蝇(seedcorn maggot));麦地种蝇(D.coarctata Fallen)(麦种蝇(wheat bulb fly))和其他地种蝇属,美洲麦秆蝇(Meromyza americana Fitch)(美洲麦秆蝇(wheat stem maggot));家蝇(Muscadomestica Linnaeus)(家蝇(house flies));夏厕蝇(Fannia canicularis Linnaeus)、小舍蝇(F.femoralis Stein)(小家蝇(lesser houseflies));厩螫蝇(Stomoxys calcitransLinnaeus)(螫蝇(stable flies));秋家蝇,角蝇,绿头苍蝇,金蝇属物种(Chrysomyaspp.);伏蝇属物种(Phormia spp.);和其他麝香蝇(muscoid fly)有害生物、马蝇虻属物种(horse flies Tabanus spp.);肤蝇胃蝇属物种(bot flies Gastrophilus spp.);狂蝇属物种(Oestrus spp.);纹皮蝇皮蝇属物种(cattle grubs Hypoderma spp.);鹿蝇斑虻属物种(deer flies Chrysops spp.);绵羊虱蝇(Melophagus ovinus Linnaeus)(绵羊蜱)和其他短角亚目(Brachycera),蚊子伊蚊属物种(mosquitoes Aedes spp.);疟蚊属物种(Anopheles spp.);家蚊属物种(Culex spp.);黑蝇原蚋属物种(black fliesProsimulium spp.);蚋属物种(Simulium spp.);吸血蠓、沙蝇、眼菌蚊(sciarid)和其他长角亚目(Nematocera)。

作为目的昆虫包括了半翅目和同翅目的成体和若虫,例如但不限于:来自球蚜科(Adelgidae)的球蚜、来自盲蝽科(Miridae)的盲蝽、来自蝉科(Cicadidae)的蝉、叶蝉、小绿叶蝉属物种(Empoasca spp.);来自叶蝉科(Cicadellidae)的,来自菱蜡蝉科(Cixiidae)、青翅飞虱科(Flatidae)、蜡蝉总科(Fulgoroidea)、瓢蜡蝉科(Issidae)和(Delphacidae)的飞虱,来自角蝉科(Membracidae)的角蝉,来自木虱科(Psyllidae)的木虱,来自粉虱科(Aleyrodidae)的粉虱,来自蚜科(Aphididae)的蚜虫,来自根瘤蚜科(Phylloxeridae)的葡萄根瘤蚜,来自粉蚧科(Pseudococcidae)的粉蚧,来自链介壳虫科(Asterolecanidae)、蚧科(Coccidae)、粉蚧科(Dactylopiidae)、盾蚧科(Diaspididae)、绒蚧科(Eriococcidae)、旌介壳虫科(Ortheziidae)、刺葵介壳虫科(Phoenicococcidae)和绵蚧科(Margarodidae)的介壳虫,来自网蝽科的网蝽,来自蝽科(Pentatomidae)的椿象,长蝽(cinch bug),土长蝽属物种(Blissus spp.);和来自长蝽科(Lygaeidae)的其他籽长蝽、来自沫蝉科(Cercopidae)的沫蝉、来自缘蝽科(Coreidae)的南瓜缘蝽和来自红蝽科(Pyrrhocoridae)的秋恙螨和棉蝽。

来自同翅目的农业上的重要成员进一步包括但不限于:豌豆蚜(Acyrthisiphonpisum Harris)(豌豆蚜虫(pea aphid));黑豆蚜(Aphis craccivora Koch)(蚕豆蚜(cowpea aphid));黑豆蚜(A.fabae Scopoli)(蚕豆蚜(black bean aphid));棉蚜(A.gossypii Glover)(棉蚜(cotton aphid),瓜叶菊蚜虫(melon aphid));玉米根蚜(A.maidiradicis Forbes,corn root aphid);苹果黄蚜(A.pomi De Geer)(苹蚜(appleaphid));绣线菊蚜(A.spiraecola Patch,spirea aphid);茄粗额蚜(Aulacorthum solaniKaltenbach)(指顶花无网长管蚜(foxglove aphid));草莓钉蚜(Chaetosiphonfragaefolii Cockerell)(草莓毛管蚜(strawberry aphid));麦双尾蚜(Diuraphis noxiaKurdjumov/Mordvilko)(俄罗斯小麦蚜虫(Russian wheat aphid));车前圆尾蚜(Dysaphisplantaginea Paaserini)(苹粉红劣蚜(rosy apple aphid));苹果绵蚜(Eriosomalanigerum Hausmann,woolly apple aphid);甘蓝蚜(Brevicoryne brassicae Linnaeus)(菜蚜(cabbage aphid));桃粉大尾蚜(Hyalopterus pruni Geoffroy)(桃大尾蚜(mealyplum aphid));萝卜蚜(Lipaphis erysimi Kaltenbach,turnip aphid);麦无网长管蚜(Metopolophium dirrhodum Walker)(麦蚜虫(cereal aphid));马铃薯长管蚜(Macrosiphum euphorbiae Thomas)(马铃薯蚜(potato aphid));桃蚜(Myzus persicaeSulzer,peach-potato aphid,green peach aphid));莴苣衲长管蚜(Nasonoviaribisnigri Mosley)(莴苣蚜(lettuce aphid));瘿绵对属物种(Graptostethus spp.)(根蚜虫(root aphids)和倍蚜(gall aphids));玉米蚜(Rhopalosiphum maidis Fitch,cornleaf aphid);禾谷缢管蚜(R.padi Linnaeus,bird cherry-oat aphid);麦二叉蚜(Schizaphis graminum Rondani,greenbug);牛鞭草蚜(Sipha flava Forbes)(甘蔗黄蚜(yellow sugarcane aphid));麦长管蚜(Sitobion avenae Fabricius,English grainaphid);苜蓿斑蚜(Therioaphis maculata Buckton,spotted alfalfa aphid);茶二叉蚜(Toxoptera aurantii Boyer de Fonscolombe)(黑色柑橘蚜(black citrus aphid)和褐色橘蚜(T.citricida Kirkaldy)(桔二叉蚜(brown citrus aphid));球属物种(Adelgesspp.)(球蚜(adelgids));长山核桃根瘤蚜(Phylloxera devastatrix Pergande)(山胡桃根瘤蚜(pecan phylloxera));烟粉虱(Bemisia tabaci Gennadius)(烟粉虱(tobaccowhitefly),甘薯粉虱(sweetpotato whitefly));银叶粉虱(B.argentifolii Bellows&Perring,silverleaf whitefly);柑橘粉虱(Dialeurodes citri Ashmead)(柑桔粉虱(citrus whitefly));结翅白粉虱(Trialeurodes abutiloneus)(带状翅白粉虱(bandedwinged whitefly)和温室粉虱(T.vaporariorum Westwood)(温室粉虱(greenhouse whitefly));马铃薯小绿叶蝉(Empoasca fabae Harris)(马铃薯叶蝉(potato leafhopper));灰飞虱(Laodelphax striatellus Fallen,smaller brownplanthopper);二点叶蝉(Macrolestes quadrilineatus Forbes)(紫菀叶蝉(asterleafhopper));黑尾叶蝉(Nephotettix cinticeps Uhler)(绿叶蝉(green leafhopper));二条斑黑尾叶蝉(N.nigropictus)(稻叶蝉(rice leafhopper));褐飞虱(Nilaparvatalugens,brown planthopper);玉米蜡蝉(Peregrinus maidis Ashmead)(玉米飞虱(corn planthopper));白背飞虱(Sogatella furcifera Horvath,white-backedplanthopper);稻条背飞虱(Sogatodes orizicola Muir)(稻飞虱(rice delphacid));苹果白叶蝉(Typhlocyba pomaria McAtee)(苹白小叶蝉(white apple leafhopper));葡萄斑叶蝉属物种(Erythroneoura spp.)(葡萄叶蝉(grape leafhoppers));十七年蝉(Magicicada septendecim Linnaeus)(周期蝉(periodical cicada));吹绵蚧(Iceryapurchasi Maskell,cottony cushion scale);梨圆蚧(Quadraspidiotus perniciosusComstock,San Jose scale);臀纹粉蚧(Planococcus citri Risso)(桔粉蚧(citrusmealybug));粉蚧属物种(Pseudococcus spp.)(其他粉蚧系群);梨木虱(Cacopsyllapyricola Foerster,pear psylla);柿木虱(Trioza diospyri Ashmead,persimmonpsylla)。

来自半翅目的农业上重要的目的物种包括但不限于:拟绿蝽(Acrosternumhilare Say)(稻绿蝽(green stink bug));南瓜缘蝽(Anasa tristis De Geer)(南瓜虫(squash bug));美洲谷长蝽指明亚种(Blissus leucopterus leucopterus Say)(麦长蝽(chinch bug));方翅网蝽(Corythuca gossypii Fabricius)(棉网蝽(cotton lacebug));番茄蝽(Cyrtopeltism odesta Distant,tomato bug);棉蝽(Dysdercussuturellus Herrich-)(棉红蝽(cotton stainer));褐臭蝽(Euschistus servusSay,brown stink bug);一斑臭蝽(E.variolarius Palisot de Beauvois,one-spottedstink bug);长蝽属物种(Graptostethus spp.)(果实蝽系群(complex of seed bugs));松叶根蝽(Leptoglossus corculus Say,leaf-footed pine seed bug);美洲牧草盲蝽(Lygus lineolaris Palisot de Beauvois)(牧草盲蝽(tarnished plant bug));牧草盲蝽(L.Hesperus Knight)(西部牧草盲蝽(Western tarnished plant bug));牧草盲蝽(L.pratensis Linnaeus,common meadow bug);长毛草盲蝽(L.rugulipennis Poppius,European tarnished plant bug);长绿盲蝽(Lygocoris pabulinus Linnaeus)(苹绿盲蝽(common green capsid));稻绿蝽(Nezara viridula Linnaeus)(南方绿椿象(southerngreen stink bug));美洲稻蝽(Oebalus pugnax Fabricius)(稻褐蝽(rice stink bug));马利筋长蝽(Oncopeltus fasciatus Dallas)(大马利筋长蝽(large milkweed bug));棉跳盲蝽(Pseudatom oscelis seriatus Reuter)(棉跳盲蝽(cotton fleahopper))。

此外,实施例可以对半翅目有效,如草莓蝽(Calocoris norvegicus Gmelin)(草莓长蝽(strawberry bug));荒野奥盲蝽(Orthops campestris Linnaeus);苹果盲蝽(Plesiocoris rugicollis Fallen)(苹盲蝽(apple capsid));番茄蝽(Cyrtopeltismodestus Distant,tomato bug);黑斑烟盲蝽(Cyrtopeltis notatus Distant)(吸蝇(suckfly));白斑盲蝽(Spanagonicus albofasciatus Reuter,whitemarkedfleahopper);皂英蝽(Diaphnocoris chlorionis Say)(皂角蝽(honeylocust plantbug));洋葱蝽(Labopidicola allii Knight)(葱盲蝽(onion plant bug));棉盲蝽(Pseudatomoscelis seriatus Reuter,cotton fleahopper);苜蓿褐盲蝽(Adelphocorisrapidus Say,rapid plant bug);四线盲蝽(Poecilocapsus lineatus Fabricius)(四线叶虫(four-lined plant bug));小长蝽(Nysius ericae Schilling)(多彩长蝽(falsechinch bug));假麦长蝽(Nysius raphanus Howard,false chinch bug);稻绿蝽(Nezaraviridula Linnaeus)(南方绿椿象(Southern green stink bug));扁盾蝽属物种(Eurygaster spp.);缘蝽科物种(Coreidae spp.);红蝽科物种(Pyrrhocoridae spp.);谷蛾科物种(Tinidae spp.);负子蝽科物种(Blostomatidae spp.);猎蝽科物种(Reduviidaespp.)物种和臭虫科物种(Cimicidae spp.)。

另外,包括蜱螨目(Acari)(螨类)的成体和幼虫,如小麦瘤瘿螨(Aceriatosichella Keifer)(小麦卷叶螨(wheat curl mite));麦岩螨(Petrobia latens Müller)(褐色小麦螨(brown wheat mite));在叶螨科(Tetranychidae)中蜘蛛螨和红螨,苹果全爪螨(Panonychus ulmi Koch)(欧洲红螨(European red mite));二斑叶螨(Tetranychus urticae Koch)(二点叶螨(two spotted spider mite));迈叶螨(T.mcdanieli McGregor)(迈叶螨(McDaniel mite));朱砂叶螨(T.cinnabarinusBoisduval,carmine spider mite);土耳其斯坦叶螨(T.turkestani Ugarov&Nikolski,strawberry spider mite);细须螨科中的葡萄短须螨,桔短须螨(Brevipalpus lewisiMcGregor,citrus flat mite);瘿螨科中的锈螨和蚜螨,和其他叶子喂养的螨虫和在人类和动物健康方面有重要影响的螨虫,即表皮螨科(Epidermoptidae)中的尘螨、蠕形螨科(Demodicidae)中的毛囊螨、和食甜螨科(Glycyphagidae)中的谷螨。

引人关注的昆虫有害生物包括椿象和其他相关昆虫的超家族,包括但不限于属于以下各科的物种:蝽科(稻绿蝽、茶翅蝽(Halyomorpha halys)、Piezodorus guildini、褐臭蝽、拟绿蝽、英雄美洲蝽(Euschistus heros)、美洲蝽(Euschistus tristigmus)、拟绿蝽、褐蝽(Dichelops melacanthus)、和蓓蝽(Bagrada hilaris)(蓓蝽(Bagrada Bug))),龟蝽科(Plataspidae)(筛豆龟蝽(Megacopta cribraria)-豆平腹蝽蟓(Bean plataspid))和土蝽科(Scaptocoris castanea-Root stink bug),以及鳞翅目物种包括但不限于:小菜蛾,例如,玉米穗虫;大豆夜蛾,例如大豆尺夜蛾,以及黎豆夜蛾(例如梨豆夜蛾)。

用于测量杀有害生物活性的方法可以在以下文献中找到:Czapla和Lang,(1990)J.Econ.Entomol.[经济昆虫学杂志]83:2480-2485;Andrews等人,(1988)Biochem.J.[生物化学杂志]252:199-206;Marrone等人,(1985)J.of Economic Entomology[经济昆虫学杂志]78:290-293以及美国专利号5,743,477,将其全部通过引用以其整体并入本文。通常,在取食测定中混合并使用了所述蛋白质。参见,例如,Marrone等人,(1985),J.of EconomicEntomology[经济昆虫学杂志]78:290-293。此类测定可以包括将植物与一种或多种有害生物接触,并且确定所述植物存活和/或造成所述有害生物死亡的能力。

线虫包括寄生线虫如根结线虫、胞囊线虫、和腐线虫,包括异皮线虫属物种(Heterodera spp.)、根结线虫属物种(Meloidogyne spp.)、和球异皮线虫属物种(Globodera spp.);特别是胞囊线虫的成员,包括但不限于:大豆异皮线虫(Heteroderaglycines)(大豆胞囊线虫(soybean cyst nematode));甜菜异皮线虫(Heteroderaschachtii)(甜菜胞囊线虫(beet cyst nematode));燕麦异皮线虫(Heterodera avenae)(谷物胞囊线虫(cereal cyst nematode))和马铃薯金线虫(Globodera rostochiensis)和马铃薯白线虫(Globodera pailida)(马铃薯胞囊线虫(potato cyst nematodes))。腐线虫包括短体线虫属物种(Pratylenchus spp)。

种子处理

为了保护并提高产量生产和性状技术,种子处理方案可以为昆虫、杂草和疾病提供另外的作物计划灵活性和成本有效的控制。种子材料可以用包含化学或生物除草剂、除草剂安全剂、杀昆虫剂、杀真菌剂、发芽抑制剂和增强剂、营养素、植物生长调节剂和激活剂、杀细菌剂、杀线虫剂、杀鸟剂和/或杀软体动物剂的组合的组合物进行处理,典型地进行表面处理。这些化合物典型地与制剂领域中通常使用的其他运载体、表面活性剂或促进施加的助剂一起配制。所述涂层可通过用液体制剂浸渍增殖材料或通过用组合的湿或干制剂进行涂覆来施加。在以下提供了可用作种子处理的各种类型的化合物的实例:ThePesticide Manual:A World Compendium,C.D.S.Tomlin Ed.,Published by the BritishCrop Production Council[农药手册:世界纲要,C.D.S.汤姆林编辑,由英国作物生产委员会出版],其通过引用并入本文。

可用于作物种子的一些种子处理包括但不限于下列一种或多种:脱落酸、阿拉酸式苯-S-甲基、阿维菌素、杀草强、阿扎康唑、固氮螺菌属、印楝素、嘧菌酯、芽孢杆菌属物种(包括蜡状芽孢杆菌,坚果芽孢杆菌,巨大芽孢杆菌,短小芽孢杆菌,球形芽孢杆菌,枯草芽孢杆菌和/或苏云金芽孢杆菌物种中的一种或多种),短根瘤菌属物种(包括bradyrhizobium betae、bradyrhizobium canariense、埃氏慢生根瘤菌、西表岛慢生根瘤菌、慢生型大豆根瘤菌、bradyrhizobium liaonigense、bradyrhizobium pachyrhizi和/或圆明慢生根瘤菌),克菌丹,萎锈灵,壳聚糖,噻虫胺,铜,溴氰虫酰胺,苯醚甲环唑,氯唑灵,氟虫腈,咯菌腈,氟嘧菌酯,氟喹唑,解草胺,氟草肟,超敏蛋白,抑霉唑,吡虫啉,种菌唑,isoflavenoids,脂质几丁寡糖,代森锰锌,锰,代森锰,精甲霜灵,甲霜灵,叶菌唑,腈菌唑,PCNB,氟唑菌苯胺,青霉菌属,吡噻菌胺,氯菊酯,啶氧菌酯,丙硫菌唑,唑菌胺酯,氯虫苯甲酰胺,S-metolachlor,皂苷,氟唑环菌胺,TCMTB,戊唑醇,噻苯咪唑,噻苯哒唑,硫威,福美双,甲基立枯磷,三唑醇,木霉属,肟菌酯,灭菌唑和/或锌。PCNB种皮是指包含喹硫磷和氯唑灵的EPA注册号00293500419。TCMTB是指2-(硫氰基甲基硫代)苯并噻唑。

可以测试具有特定转基因性状的种子品种和种子以确定哪些种子处理方案和施用率可以补充这些品种和转基因性状以增加产量。例如,具有良好产量潜力但丝黑穗病易感性的品种可以受益于使用提供针对丝黑穗病的保护的种子处理,具有良好产量潜力但胞囊线虫易感性的品种可以受益于使用提供针对胞囊线虫的保护的种子处理等。同样,涵盖赋予抗昆虫的转基因性状的品种可以从种子处理赋予的第二种作用模式中获益,涵盖赋予除草剂抗性的转基因性状的品种可以从用安全剂的种子处理中获益,这种安全剂增强植物对所述除草剂的抗性等。此外,当与种子处理组合时,正确使用种子处理所产生的良好根系建立和早期出苗可能导致更有效的氮利用,更好的抗干旱能力以及包含某种性状的一种或多种品种的产量潜力的总体增加。

用于杀灭昆虫有害生物和控制昆虫群体的方法

在一些实施例中,提供了用于杀灭昆虫有害生物的方法,所述方法包括将昆虫有害生物同时地或依次地与杀昆虫有效量的本公开的重组多肽接触。

在一些实施例中,提供了用于控制昆虫有害生物群体的方法,所述方法包括将昆虫有害生物群体同时地或依次地与杀昆虫有效量的本公开的重组多肽接触。如本文所用的,“控制有害生物群体”或“控制有害生物”是指对有害生物的任何影响,其导致对有害生物造成的损害的限制。控制有害生物包括但不限于以一定方式杀灭有害生物、抑制有害生物发育、改变有害生物能育性或生长,使得有害生物对植物造成较少的损害,减少所产生后代的数量,产生适应力较弱的有害生物,产生易受捕食者攻击的有害生物或阻止有害生物啃食植物。

在一些实施例中,提供了用于控制对杀有害生物蛋白具有抗性的昆虫有害生物群体的方法,所述方法包括将昆虫有害生物群体同时地或依次地与杀昆虫有效量的本公开的重组多肽接触。

在一些实施例中,提供了用于保护植物免受昆虫有害生物侵害的方法,所述方法包括使至少一种编码本公开的多肽的重组多核苷酸在植物或其细胞中表达。

在一些实施例中,提供了用于保护植物免受昆虫有害生物侵害的方法,该方法包括在该植物或其细胞中表达编码本公开的多肽的重组多核苷酸。

抗昆虫管理(IRM)策略

苏云金芽孢杆菌δ-内毒素在转基因玉米植物中的表达已被证明是控制农业上重要的昆虫有害生物的有效手段(Perlak等人,1990;1993)。然而,昆虫已经进化,这些昆虫对在转基因植物中表达的苏云金芽孢杆菌δ-内毒素是具有抗性的。如果这种抗性普遍存在,它将明显限制包含编码这种苏云金芽孢杆菌δ-内毒素的基因的种质的商业价值。

增加转基因杀昆虫剂对靶标有害生物的有效性并且同时减少杀昆虫剂抗性有害生物发展的一种方法是提供非转基因(即,非杀昆虫蛋白)庇护所(一部分非杀昆虫作物/玉米),用于与生产对靶标有害生物具有活性的单一杀昆虫蛋白的转基因作物一起使用。美国环境保护局(United States Environmental Protection Agency)(epa.gov/oppbppdl/biopesticides/pips/bt_corn_refuge_2006.htm,其可以使用www前缀进行访问)发布了与生产一种对靶标有害生物具有活性的单一Bt蛋白的转基因作物一起使用的要求。另外,国家玉米种植者协会(National Corn Growers Association)在其网站上(ncga.com/insect-resistance-management-fact-sheet-bt-corn,所述网址可使用www前缀访问)也提供了有关庇护所要求的类似指导。由于庇护区内的昆虫所造成的损失,较大的庇护所可能会降低总产量。

增加转基因杀昆虫剂对靶标有害生物的有效性并且同时减少杀昆虫剂抗性有害生物发展的另一种方法是具有杀昆虫基因的储存库,所述储存库可以有效地对抗昆虫有害生物的组,并通过不同的作用方式显现其作用。

在植物中表达对相同昆虫物种有毒的两种或更多种杀昆虫组合物,每种杀昆虫剂以有效水平表达是实现对抗性发展的控制的另一种方法。这是基于以下原则:对两种不同作用模式的抗性演变比仅一种远远更不可能。例如,Rouss概述了用于管理杀昆虫转基因作物的双毒素策略,也称为“金字塔结构”或“堆叠”。(The Royal Society.Phil.Trans.R.Soc.Lond.B.[皇家学会伦敦皇家学会哲学会刊B系列],(1998)353:1777-1786)。每种都能有效抵抗靶有害生物并几乎没有或没有交叉抗性的两种不同蛋白质的堆叠或金字塔结构可以允许使用较小的庇护所。美国环境保护局要求所种植非Bt玉米的结构性庇护所(通常为5%)比单一性状产品(通常为20%)显著更少。存在提供庇护所的IRM效应的各种方法,包括在田地中的各种几何种植模式和包装好(in-bag)的种子混合物,如进一步通过Roush所讨论的。

在一些实施例中,本公开的多肽可用作与其他杀有害生物蛋白(包括但不限于Bt毒素、致病杆菌属或发光杆菌属杀昆虫蛋白、其他杀昆虫活性蛋白等)组合(即,金字塔化)的抗昆虫管理策略。

提供了在促进抗昆虫管理的转基因植物中控制一种或多种鳞翅目和/或鞘翅目昆虫侵染的方法,所述方法包括在植物中表达具有不同作用模式的至少两种不同的杀昆虫蛋白。

在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染并促进抗昆虫管理的方法中包括对鳞翅目和/或鞘翅目昆虫呈现至少一种本公开的多肽。

在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵袭并促进昆虫抗性管理的方法包括在转基因植物中表达针对鳞翅目和/或鞘翅目昆虫的具有不同作用模式的本公开的多肽和Cry蛋白或其他杀昆虫蛋白。

还提供了减少对转基因植物的鳞翅目和/或鞘翅目昆虫抗性的出现的可能性并在植物中表达杀昆虫蛋白以控制昆虫物种的方法,该方法包括表达与对该昆虫物种具有不同作用模式的第二杀昆虫蛋白结合的对昆虫物种具有杀昆虫性的本公开的多肽。

还提供了转基因植物的有效鳞翅目和/或鞘翅目昆虫抗性管理的手段,该手段包括在植物中以高水平共表达对鳞翅目和/或鞘翅目具有毒性的两种或更多种杀昆虫蛋白,但是每种都展现出不同的实行其杀灭活性的模式,其中这两种或更多种杀昆虫蛋白包含本公开的多肽和Cry蛋白。还提供了转基因植物的有效鳞翅目和/或鞘翅目昆虫抗性管理的手段,该手段包括在植物中以高水平共表达对鳞翅目和/或鞘翅目具有毒性的两种或更多种杀昆虫蛋白,但是每种都展现出不同的实行其杀灭活性的模式,其中这两种或更多种杀昆虫蛋白包含本公开的多肽和Cry蛋白或其他杀昆虫活性蛋白。

此外,提供了获得用于种植或商业化表达对鳞翅目和/或鞘翅目昆虫具有杀昆虫性的蛋白的植物的法规性审批的方法,该方法包括以下步骤:参考、提交或依赖昆虫测定结合数据,这些数据显示本公开的多肽不与这些昆虫中的Cry蛋白的结合位点竞争。此外,提供了获得用于种植或商业化表达对鳞翅目和/或鞘翅目昆虫具有杀昆虫性的蛋白的植物的法规性审批的方法,该方法包括以下步骤:参考、提交或依赖昆虫测定结合数据,这些数据显示本公开的多肽不与这些昆虫中的Cry蛋白的结合位点竞争。

提高植物产量的方法

提供了用于提高植物产量的方法。所述方法包括提供表达编码本文公开的杀有害生物多肽序列的多核苷酸的植物或植物细胞,并在有害生物(所述多肽对其具有杀有害生物活性)侵袭的田地中种植所述植物或其种子。在一些实施例中,所述多肽对鳞翅目、鞘翅目、双翅目、半翅目或线虫有害生物具有杀有害生物活性,并且所述田地被鳞翅目、半翅目、鞘翅目、双翅目或线虫有害生物侵染。

如本文所定义的,植物的“产量”是指植物生产的生物质的质量和/或数量。如本文所用的,“生物质”是指任何经测量的植物产物。生物质产量的增加是所测量的植物产物的产量上的任何改善。增加植物产量具有几个商业应用。例如,增加植物叶生物质可以增加用于人或动物消耗的叶菜类的产量。此外,增加叶生物质可用于增加植物来源的药物或工业产品的产量。产量上的增加可以包括任何统计学上显著的增加,包括但不限于,与不表达杀有害生物序列的植物相比,产量上至少增加1%、至少增加3%、至少增加5%、至少增加10%、至少20%增加、至少30%、至少50%、至少70%、至少100%或更大的增加。

在特定的方法中,植物产量由于表达本公开的多肽的植物的改善的有害生物抗性而增加。本公开的多肽的表达导致有害生物侵袭植物或以植物为食的能力下降,从而改进植物产量。

加工方法

进一步提供了加工植物、植物部分或种子以从包含编码本公开的多肽的多核苷酸的植物、植物部分或种子获得食品或饲料产品的方法。可以对本文提供的植物、植物部分或种子进行加工以产生通过加工具有商业价值的植物、植物部分或种子获得的衍生物的油、蛋白质产物和/或副产品。非限制性实例包括包含编码本公开的多肽的核酸分子的转基因种子,这些转基因种子可以被处理以产生大豆油、豆制品和/或大豆副产物。

“加工”是指用于获得任何大豆产品的任何物理和化学方法,并且包括但不限于热调节(heat conditioning)、剥落和研磨、挤出、溶剂萃取或水性浸泡以及全部或部分种子萃取。

以下实例是通过说明的方式但不是通过限制的方式来提供的。

实验

实例1.鞘翅目测定

使用与Diabrotica饲料(前沿农业科学公司(Frontier AgriculturalSciences),纽瓦克市,特拉华州)混合的细胞裂解物样品对西方玉米根虫(玉米根萤叶甲指明亚种,WCRW)进行生物测定。将WCRW新生虫置于96孔板的每个孔中。测定在25℃运行四天,并且然后对昆虫死亡率和幼虫生长发育迟缓进行评分。得分记录为死亡(3)、严重发育迟缓(2)(很少或没有生长,但还活着)、发育迟缓(1)(生长到二龄但不等同于对照)或没有活性(0)。进一步研究了表现出死亡率或发育迟缓的样本。

实例2.鉴定针对WCRW有活性的细菌菌株

从在LB培养基(10g/L胰蛋白胨、5g/L酵母提取物、和10g/L NaCl)或TSB(胰蛋白酶大豆肉汤)培养基(17g/L胰蛋白胨、3g/L大豆蛋白胨、2.5g/L右旋糖、2.5g/L K2HPO4和5g/LNaCl)、2xYT培养基(酵母提取物10g/L、酪蛋白的胰消化物16g/L、氯化钠5g/L)、ISP-2培养基(酵母提取物,4g/L,麦芽提取物,10g/L,右旋糖,4g/L)中生长的细菌菌株的澄清的细胞裂解物中观察到了针对WCRW的杀昆虫活性,并且按照表2的说明进行培养。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。活性菌株及其培养条件列于表2中。

表2

实例3.活性菌株的物种鉴定和基因组测序

根据制造商的说明书,用细菌基因组DNA提取试剂盒(目录号NA2110-KT,西格玛-奥德里奇公司(Sigma-Aldrich),邮政信箱14508,圣路易,密苏里州63178)提取活性菌株的基因组DNA。使用NanoDropTM分光光度计(赛默科技公司(Thermo Scientific)),威明顿市(Wilmington),特拉华州(DE))确定DNA浓度,并将基因组DNA用无菌水稀释至40ng/μL。通过组合80ng基因组DNA、2μL(5μM)16S核糖体DNA引物TACCTTGTTACGACTT(SEQ ID NO:639)和AGAGTTTGATCMTGGCTCAG(SEQ ID NO:640)、1μL10cmM dNTP、1xHF缓冲液、和1单位高保真DNA聚合酶(新英格兰生物实验室(New England Biolabs),伊普斯威奇(Ipswich),马萨诸塞州(MA))来建立25μL PCR反应。PCR反应在MJ Research PTC-200热循环仪(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.),赫拉克勒斯(Hercules),加利福尼亚州)中按以下程序运行:96℃1min;30个循环:96℃15秒,52℃2分钟和72℃2分钟;72℃10分钟;并且保持在4℃。将PCR产物用DNA纯化试剂盒(目录号28104,凯杰公司(QIAGEN Inc.),瓦伦西亚(Valencia),加利福尼亚州)纯化。对经纯化的PCR样品进行DNA测序,并且依靠表明菌株的物种的NCBI数据库,对所得16S核糖体DNA序列进行搜索(参见表2)。

还根据依诺米那公司(Illumina)(圣地亚哥,加利福尼亚州)开发的文库构建方案制备活性菌株的基因组DNA,并使用Illumina MiSeqTM进行测序。组装核酸重叠群序列并产生可读框。

实例4.通过LC-MS/MS鉴定杀昆虫蛋白

如所述分馏和富集所有杀昆虫蛋白。为了鉴别候选物,将来自SDS PAGE凝胶的蛋白条带切除,用胰蛋白酶消化并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)在Thermo Q ExactiveTM OrbitrapTM质谱仪(Thermo Fisher)上进行分析,该质谱仪与NanoLC Ultra 1D PlusTM NanoLC系统(爱博才思公司(ABSciex))接合。可替代地,用胰蛋白酶直接消化色谱级分中的蛋白质,然后通过纳米-LC/ESI-MS/MS进行分析。在前体离子全谱扫描(survey scan)之后,以数据依赖性采集模式收集10个产品离子谱。

通过使用(矩阵科学公司(Matrix Science))通过数据库搜索进行蛋白质鉴定。所述数据库是一个内部数据库“细菌纯化”,所述数据库含有细菌基因组的注释的蛋白序列,以及其他内部蛋白序列数据库、和Swiss-Prot。

实例5.杀昆虫蛋白的分离与鉴定

IPD092-1Aa和IPD092-2Aa的分离与鉴定

在26℃下,伴随在190rpm下摇动2天,从在TSB(胰蛋白酶大豆肉汤)培养基(17g/L胰蛋白胨、3g/L大豆蛋白胨、2.5g/L右旋糖、2.5g/L K2HPO4和5g/L NaCl)中生长的罗氏假单孢菌菌株SS473A12的粗细胞裂解物观察到针对WCRW(玉米根萤叶甲)的杀昆虫活性。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

在含有无EDTA的蛋白酶抑制剂混合物Set V(Protease Inhibitor Cocktail SetV,EDTA-Free)(Calbiochem公司/默克密理博公司(EMD Millipore),达姆施塔特(Darmstadt),德国)的25mM MES缓冲液(pH 6)中重悬后,将菌株SS473A12的细胞沉淀物在约30,000psi(Constant Systems Ltd.公司,Low March,达文特里(Daventry),北安普敦郡(Northants),英国)下裂解。通过离心澄清粗裂解物,将其重新调节至pH 6,并且上样到MES缓冲液(pH 6)中平衡的串联的两个5mL HiTrapTM SP-HPTM(GE医疗集团,皮斯卡塔韦市,新泽西州)柱上。用0至300mM NaCl的梯度,经20个柱体积(CV)洗脱杀昆虫活性。合并活性级分,通过添加4M硫酸铵储备溶液将其调节至1M硫酸铵,并且上样到在25mM MES(pH 6)中平衡的串联的两个1mL HiTrapTM Phenyl HPTM(GE医疗集团,皮斯卡塔韦市,新泽西州)柱上。经22CV,施加从1至0M硫酸铵的梯度。合并洗脱的活性级分,并且使用ZebaTM(赛默科技公司(Thermo Scientific))柱将其缓冲液交换至25mM Tris(pH 8)中,并且上样到25mM Tris(pH 8)中平衡的Mono QTM(GE医疗集团,皮斯卡塔韦市,新泽西州)柱上。用从0至500mM NaCl的梯度,经30CV洗脱活性级分。合并活性级分,在10kDa分子量截留离心浓缩器(赛多利斯斯泰迪生物技术公司(Sartorius Stedim),哥廷根(Goettingen),德国)上浓缩,并且上样到在25mM Tris pH 8,150mM NaCl中平衡的SuperdexTM200柱(GE医疗集团)上。级分的SDS-PAGE分析表明,在用InstantBlueTM(Expedeon Ltd.公司,圣地亚哥,加利福尼亚州)染色后,WCRW活性与两个突出的条带一致。如实例4所述,切下大约21和22kDa的蛋白带,用胰蛋白酶消化,并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)进行分析。针对内部数据库(包括如实例3中所述产生的SS473A12的基因组序列)进行搜索鉴定IPD092-1Aa多肽(SEQ ID NO:1)和IPD092-2Aa(SEQ ID NO:2),它们分别由SEQ ID NO:546和SEQ ID NO:547的多核苷酸编码。编码IPD092-1Aa和IPD092-2Aa的基因在单个操纵子中。

克隆和重组共表达证实了IPD092-1Aa多肽(SEQ ID NO:1)和IPD092-2Aa多肽(SEQID NO:2)针对WCRW的杀昆虫活性。

IPD095-1Aa和IPD095-2Aa的分离与鉴定

在26℃下,伴随在190rpm下摇动2天,从在TSB(胰蛋白酶大豆肉汤)培养基(17g/L胰蛋白胨、3g/L大豆蛋白胨、2.5g/L右旋糖、2.5g/L K2HPO4和5g/L NaCl)中生长的Serratianematophilia菌株SS232H12的澄清细胞裂解物观察到针对WCRW(玉米根萤叶甲)的杀昆虫活性。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

在含有无EDTA的蛋白酶抑制剂混合物Set V(Protease Inhibitor Cocktail SetV,EDTA-Free)(Calbiochem公司/默克密理博公司(EMD Millipore),达姆施塔特(Darmstadt),德国)的25mM乙酸盐(pH 5)中重悬后,将菌株SS473A12的细胞沉淀物在约30,000psi(Constant Systems Ltd.公司,Low March,达文特里(Daventry),北安普敦郡(Northants),英国)下裂解。通过离心澄清粗裂解物,将其重新调节至pH 5,并且上样到25mM乙酸盐(pH 5)中平衡的串联的两个1mL HiTrapTM SP-HP(GE医疗集团,皮斯卡塔韦市,新泽西州)柱上。用0至350mM NaCl的梯度,经20个柱体积(CV)洗脱结合的蛋白。单独的洗脱级分针对WCRW无活性,但是弱活性未结合蛋白与在19至26mSi的电导率之间洗脱的级分的组合会产生强活性的池,表明两组分蛋白负责WCRW活性。在10kDa分子量截留离心浓缩器(赛多利斯斯泰迪生物技术公司(Sartorius Stedim),哥廷根(Goettingen),德国)上浓缩含有活性组分的来自HiTrapTM SP-HP柱的洗脱的级分池,并且然后上样到在25mM Na-乙酸盐、pH 5、100mM NaCl中平衡的SuperdexTM 75(GE医疗集团)柱上。直接测定时,洗脱的级分无活性,但是当与通过SP柱,先前步骤中未结合的蛋白组合时,是杀昆虫的。级分的SDS-PAGE分析表明,在用InstantBlueTM(Expedeon Ltd.公司,圣地亚哥,加利福尼亚州)染色后,WCRW活性与两个条带一致。如实例1所述,切下大约19和60kDa的蛋白带,用胰蛋白酶消化,并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)进行分析。通过在各种数据库(包括如实例3中所述产生SS232H12的基因组序列)中进行搜索来进行蛋白鉴定。这鉴定了分别由SEQ ID NO:562和SEQ ID NO:563的多核苷酸编码的IPD095-1Aa多肽(SEQ IDNO:27)和IPD095-2Aa多肽(SEQ ID NO:28)。编码IPD095-1Aa和IPD095-2Aa的基因在单个操纵子中。IPD095-1Aa(SEQ ID NO:562)和IPD095-2Aa(SEQ ID NO:563)在大肠杆菌中的重组共表达证实了多肽IPD095-1Aa(SEQ ID NO:27)和IPD095-2Aa(SEQ ID NO:28)针对WCRW的杀昆虫活性。在测试的浓度下,IPD095-1Aa(SEQ ID NO:27)和IPD095-2Aa(SEQ ID NO:28)均未单独显示出针对WCRW的杀昆虫活性。

IPD097Aa和IPD099-1Aa、IPD099-2Aa和IPD099-3Aa的分离与鉴定

在28℃下,同时在200rpm下摇动1天,从在2xYT(酵母提取物10g/L、酪蛋白的胰消化物16g/L、氯化钠5g/L)中生长的鱼嗜血杆菌(Haemophilus piscium)菌株JH58776-1的澄清细胞裂解物观察到针对WCRW(玉米根萤叶甲)的杀昆虫活性。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

在含有“完全无EDTA”蛋白酶抑制剂混合物(罗氏公司(Roche),印第安纳波利斯(Indianapolis),印第安纳州)的25mM Tris(pH 8)中重悬后,将菌株JH58776-1的细胞沉淀物在约30,000psi(Constant Systems Ltd.公司,Low March,达文特里(Daventry),北安普敦郡(Northants),英国)下裂解。通过在30,000g下离心40min澄清粗裂解物,并且然后通过缓慢添加100%饱和硫酸铵,使其达到30%硫酸铵饱和度。搅拌1hr后,将溶液在30,000g下离心15min。然后通过添加100%饱和硫酸铵,使上清液达到70%饱和度。将此溶液搅拌1hr,并且然后在25,000g下离心15min。将沉淀物悬浮在20mM Tris pH 8.0中,并且然后通过添加2M硫酸铵,20mM Tris,pH 8.0,将混合物调节至约1M硫酸铵。将悬浮的提取物在30,000g下离心30min,并且将上清液上样到在具有1M硫酸铵的20mM Tris(pH 8.0)中平衡的20mLPhenyl-5PW(东曹生物科学公司(Tosoh Bioscience),南圣弗朗西斯科(South SanFrancisco),加利福尼亚州)柱上。洗脱未结合的蛋白后,施加至20mM Tris,pH 8.0,0%硫酸铵的5CV线性梯度。合并洗脱的WCRW活性级分,并且使用10kDa分子量截留离心浓缩器(赛多利斯斯泰迪生物技术公司(Sartorius Stedim),哥廷根(Goettingen),德国)浓缩。使用在20mM Tris(pH 8.0)中平衡的26/10 G25柱(GE医疗集团)对浓缩池进行脱盐,并且然后将其上样到20mM Tris(pH 8.0)中平衡的8mL GigaCapTM Q柱(东曹生物科学公司,普鲁士王村(King of Prussia),宾夕法尼亚州)上。用3CV洗涤所述柱,并且然后施加至20mM Tris,pH8,0.4M NaCl的7.5CV梯度。合并洗脱的WCRW活性级分,浓缩并且使用在25mM Bis-Tris/亚氨基二乙酸(pH 7.0)中平衡的5mL Hi-TrapTM(GE医疗集团)脱盐柱进行脱盐。将脱盐的样品上样到在25mM Bis-Tris/亚氨基二乙酸(pH 7.0)中平衡的4mL Mono PTM色谱聚焦柱(GE医疗集团),并且用2CV洗涤。然后将缓冲液切换为1/10X Polybuffer 7-4(GE医疗集团)/亚氨基二乙酸,pH 4.0。测定洗脱液级分的WCRW活性,并且经受SDS PAGE分析,并且用GelCode染色试剂(赛默科技公司(Thermo Scientific),罗克福德市(Rockford),伊利诺伊州)染色。

WCRW活性的两个主要区域从色谱聚焦柱上洗脱下来。WCRW活性的第一个区域在pH梯度中较早被洗脱,其中级分D5和D6与SDS-PAGE凝胶上的单个染色带一致。如实例1所述,切下大约16kDa的蛋白带,用胰蛋白酶消化,并且通过纳米-LC/ESI-MS/MS进行分析。针对包括JH58776-1的基因组序列在内的各种数据库进行搜索。这鉴定了由SEQ ID NO:590的多核苷酸编码的IPD097Aa多肽(SEQ ID NO:121)。IPD097Aa(SEQ ID NO:590)在大肠杆菌中的重组表达证实了多肽IPD097Aa(SEQ ID NO:121)的杀昆虫活性。WCRW活性的第二个区域随后在pH梯度中洗脱,其中级分E5至E7与用染色试剂(赛默飞世尔科技公司(ThermoFisher))染色后,在SDS-PAGE凝胶上的条带一致。如实例1所述,切下大约38kDa的蛋白带,用胰蛋白酶消化,并且通过纳米-LC/ESI-MS/MS进行分析。针对包括JH58776-1的基因组序列在内的各种数据库进行搜索。埃德曼测序允许鉴定该蛋白的N-末端。这鉴定了由SEQ ID NO:592的多核苷酸编码的IPD099-2Aa多肽(SEQ ID NO:137)。IPD099-2Aa(SEQ ID NO:592)在大肠杆菌中的重组表达证实了IPD099-2Aa多肽(SEQ IDNO:137)的针对WCRW的杀昆虫活性。JH58776-1的基因组序列的分析表明,IPD099-2Aa基因是操纵子的一部分,所述操纵子编码两种另外的蛋白:由SEQ ID NO:591的多核苷酸编码的IPD099-1Aa(SEQ ID NO:136),和由SEQ ID NO:593的多核苷酸编码的IPD099-3Aa(SEQ IDNO:138)。通过纳米-LC/ESI-MS/MS分析洗脱的色谱聚焦柱级分表明,IPD099-1Aa(SEQ IDNO:136)和IPD099-3Aa(SEQ ID NO:138)多肽在级分F10至F1中洗脱。含有IPD099-1Aa多肽(SEQ ID NO:136)、IPD099-2Aa多肽(SEQ ID NO:137)和IPD099-3Aa多肽(SEQ ID NO:138)的级分池在其中单独的IPD099-2Aa多肽(SEQ ID NO:137)无活性的浓度下,具有活性。基于这些序列,设计PCR引物,并且用于扩增来自从JH58776-1细菌细胞制备的基因组DNA的IPD099-1/2/3Aa操纵子以及单个IPD099-1Aa(SEQ ID NO:136)、IPD099-2Aa(SEQ ID NO:137)和IPD099-3Aa(SEQ ID NO:138)基因。

经由无缝克隆,克隆IPD099-1/2/3Aa操纵子以及单个组分基因,用于表达使用pET14a标记的N-末端6xHis或使用pET-24a(无标记)的未标记蛋白,并且转化到BL21-Gold大肠杆菌细胞中。当添加到人工饲料中时,未标记的IPD099-1/2/3Aa操纵子构建体导致这三种蛋白的可溶性表达和针对WCRW的活性。当按45μg/cm2添加至饲料时,单独表达未标记的IPD099-2Aa多肽(SEQ ID NO:137)的细胞的澄清裂解物导致WCRW的严重发育迟缓。表达IPD099-1Aa多肽(SEQ ID NO:136)、IPD099-2Aa多肽(SEQ ID NO:137)和IPD099-3Aa多肽(SEQ ID NO:138)的细胞的澄清裂解物的混合物,各自单独作为未标记的蛋白,导致针对WCRW的强活性。表3显示了通过测定纯化的N-6xHis标记的IPD099-2Aa多肽(SEQ ID NO:137)与纯化的标记的IPD099-1Aa多肽(SEQ ID NO:136)和IPD099-3Aa多肽(SEQ ID NO:138)的各种组合,得出的平均WCRW活性评分(n=4)。虽然在30μg/cm2的剂量的2倍或更多倍稀释后,单独的IPD099-2Aa多肽(SEQ ID NO:137)失去活性,但是用分别含有3.8、1.9和4.7μg/cm2的IPD099-1Aa多肽(SEQ ID NO:136)、IPD099-2Aa多肽(SEQ ID NO:137)、和IPD099-3Aa多肽(SEQ ID NO:138)的测定混合物观察到WCRW的发育迟缓。此外,将75μg/cm2的IPD099-3Aa多肽(SEQ ID NO:138)添加至60μg/cm2的IPD099-1Aa多肽(SEQ ID NO:136),导致针对WCRW没有活性,并且将75μg/cm2的IPD099-3Aa多肽(SEQ ID NO:138)添加至30μg/cm2的IPD099-2Aa多肽(SEQ ID NO:137)并不导致与单独的IPD099-2Aa(SEQ ID NO:137)相比,针对WCRW的活性增加。60μg/cm2的IPD099-1Aa多肽(SEQ ID NO:136)与30μg/cm2的IPD099-2Aa多肽(SEQ ID NO:137)的混合物导致严重的发育迟缓,并且用2倍稀释的混合物,仍然可以观察到发育迟缓。

表3

IPD100Aa-1/2的分离与鉴定

在28℃下,伴随在160RPM下摇动24小时,从在TSB(胰蛋白酶大豆肉汤)培养基(17g/L胰蛋白胨、3g/L大豆蛋白胨、2.5g/L右旋糖、2.5g/L K2HPO4和5g/L NaCl)中生长的菌株JH55673-1(盖氏假单孢菌)的澄清细胞裂解物观察到针对WCRW(玉米根萤叶甲)的杀昆虫活性。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

将菌株JH55673-1的细胞沉淀物淀悬浮在20mM Tris,pH 8.0+1:100HaltTM蛋白酶抑制剂混合物中,并且在30,000psi下裂解(Constant Systems Ltd.公司,Low March,达文特里(Daventry),北安普敦郡(Northants),英国)。然后将裂解的提取物在30,000g下离心45min。通过在冷室中搅拌过夜的同时滴加100%饱和硫酸铵,使上清液达到60%硫酸铵饱和度。将提取物在30,000g下离心20分钟,并且弃去上清液。将沉淀物部分重悬在20mM Tris(pH 8.0)中,并且然后通过滴加2M硫酸铵、20mM Tris(pH 8.0),将混合物调节至约1M硫酸铵。澄清后,将上清液上样到在20mM Tris(pH 8.0)、1M硫酸铵中平衡的20mL TSKgelether-5PW柱(东曹生物科学公司)上。用3CV洗涤所述柱,并且然后施加至20mM Tris,pH8.0的7.5CV梯度。合并洗脱的具有WCRW活性的级分,并且使用5kDa离心浓缩器(赛多利斯斯泰迪生物技术公司(Sartorius Stedim),哥廷根(Goettingen),德国)浓缩,并且然后使用26/10G25脱盐柱(GE医疗集团)脱盐到20mM Tris,pH 8.0中。将脱盐的级分池上样到8mLSuperQTM-5PW柱(东曹生物科学公司,普鲁士王村(King of Prussia),宾夕法尼亚州)上。用4CV洗涤所述柱,并且然后开始20CV梯度,至20mM Tris,pH 8,0.3M NaCl。合并来自阴离子交换柱的具有WCRW活性的级分,浓缩并上样到PBS缓冲液中平衡的串联组的两个10x300mmSuperdexTM75(GE医疗集团)尺寸排阻色谱柱上。SDS-PAGE分析表明,用GelCode染色试剂(赛默飞世尔科技公司(Thermo Fisher))染色后,洗脱的WCRW活性与两个带一致。如实例1所述,切下大约17和57kDa的蛋白带,用胰蛋白酶消化,并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)进行分析。通过在各种数据库(包括如实例3中所述产生JH55673-1的基因组序列)中进行搜索来进行蛋白鉴定。这鉴定了分别由SEQ IDNO:611和SEQ ID NO:612的多核苷酸编码的IPD100-1Aa多肽(SEQ ID NO:332)和IPD100-2Aa多肽(SEQ ID NO:333)。编码IPD100-1Aa(SEQ ID NO:611)和IPD100-2Aa(SEQ IDNO:612)的基因在单个操纵子中。IPD100-1Aa(SEQ ID NO:611)和IPD100-2Aa(SEQ ID NO:612)在大肠杆菌中的重组共表达证实了多肽IPD100-1Aa(SEQ ID NO:332)和IPD100-2Aa(SEQID NO:333)的杀昆虫活性。在测试的浓度下,IPD100-1Aa(SEQ ID NO:611)和IPD100-2Aa(SEQ ID NO:612)均未单独显示出针对WCRW的杀昆虫活性。

IPD105Aa的分离与鉴定

在28℃下,同时在200RPM下摇动1天,从在2xYT培养基(酵母提取物10g/L、酪蛋白的胰消化物16g/L、氯化钠5g/L)中生长的菌株JH90961-1(水生色杆菌(Chromobacteriumaquaticum))的澄清细胞裂解物观察到针对WCRW(玉米根萤叶甲)的杀昆虫活性。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

将菌株JH90961-1(水生色杆菌(Chromobacterium aquaticum))的细胞沉淀物悬浮在PBS中,在30,000g下离心30min。弃去上清液,冷冻细胞沉淀物,并且然后解冻,然后重悬在20mM Tris,pH 9加“完全无EDTA”蛋白酶抑制剂混合物(罗氏公司(Roche),印第安纳波利斯(Indianapolis),印第安纳州)中,并且在30,000psi下裂解(Constant Systems Ltd.公司,Low March,达文特里(Daventry),北安普敦郡(Northants),英国)。然后将裂解的提取物在30,000g下离心30min。过滤上清液,并且然后用20mM Tris(pH 9)以1:1稀释,并且上样到在20mM Tris,pH 9中平衡的10mL CaptoTMQ柱(GE医疗集团)上。洗脱未结合的蛋白后,使用20mM Tris,0.6M NaCl,pH 9来洗脱具有WCRW活性的蛋白。将CaptoTM Q洗脱液的等分试样脱盐到25mM BisTris,pH 7.4中,并且上样到具有100%B等度梯度(缓冲液B:Polybuffer74,pH 4.4-用H2O1∶10稀释)的4mL Mono PTM(GE医疗集团)色谱聚焦柱上。合并具有WCRW活性的级分,并且将其脱盐到20mM Tris,pH 8中,并且上样到1mL Mono QTM(GE医疗集团)阴离子交换柱上,经至20mM Tris+0.5M NaCl,pH 8的30CV梯度)。用在9.9-14.9mS/cm的电导率下洗脱的级分观察到WCRW活性。SDS-PAGE分析表明,用GelCode染色试剂(赛默飞世尔科技公司(Thermo Fisher))染色后,洗脱的WCRW活性与带一致。如实例1所述,切下大约19kDa的蛋白带,用胰蛋白酶消化,并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)进行分析。通过在各种数据库(包括如实例3中所述产生JH90961-1的基因组序列)中进行搜索来进行蛋白鉴定。这鉴定了由SEQ ID NO:614的多核苷酸编码的IPD105Aa多肽(SEQ ID NO:350)。IPD105Aa(SEQ ID NO:614)在大肠杆菌中的重组表达证实了多肽IPD105Aa(SEQ ID NO:350)的杀昆虫活性。

IPD106Aa-1/2的分离与鉴定

在28℃下,同时在200RPM下摇动1天,从在2xYT培养基(酵母提取物10g/L、酪蛋白的胰消化物16g/L、氯化钠5g/L)中生长的菌株JH48820-1(Chitinophaga pinensis)的澄清细胞裂解物观察到针对WCRW(玉米根萤叶甲)的杀昆虫活性。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

将菌株JH48820-1(Chitinophaga pinensis)的细胞沉淀物悬浮在PBS中,在30,000g下离心30min。弃去上清液,并且冷冻细胞沉淀物,并且然后解冻,然后重悬在20mMTris,pH 8加“完全无EDTA”蛋白酶抑制剂混合物(罗氏公司(Roche),印第安纳波利斯(Indianapolis),印第安纳州)中,并且在30,000psi下裂解(Constant Systems Ltd.公司,Low March,达文特里(Daventry),北安普敦郡(Northants),英国)。然后将裂解的提取物在30,000g下离心30min。过滤上清液,并且然后将0.5M Na-甲酸盐,pH 4(1∶10)添加至50mM的最终浓度,并且添加1%甲酸,从而将pH降低至pH 4。将其在冷室中摇动,并且通过离心进行澄清,然后用50mM Na-甲酸盐(pH 4)以1∶1稀释上清液,并且将其上样到1mL CaptoTM S(GE医疗集团)阳离子交换色谱柱上。洗脱未结合的蛋白后,使用50mM Na-甲酸盐,pH 4与0.3MNaCl一起来洗脱具有WCRW活性的蛋白。然后用10kDa MWCO离心浓缩器(赛多利斯斯泰迪生物技术公司(Sartorius Stedim),哥廷根(Goettingen),德国)浓缩CaptoTM S洗脱液,然后将其上样到100mM碳酸氢铵中平衡的串联的两个的SuperdexTM200(GE医疗集团)尺寸排阻色谱柱上。合并WCRW活性级分,并且将其脱盐到20mM Tris,pH 8.7中,并且上样到1mL MonoQTM(GE医疗集团)阴离子交换色谱柱上,并且施加至20mM Tris+0.35M NaCl(pH 8.7)的30CV梯度。在5.6-8.5mS/cm的电导率下洗脱的级分中观察到严重的WCRW发育迟缓活性。SDS-PAGE分析表明,用GelCode染色试剂(赛默飞世尔科技公司(Thermo Fisher))染色后,洗脱的WCRW活性与两个带一致。如实例1所述,切下大约76和45kDa的蛋白带,用胰蛋白酶消化,并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)进行分析。通过在各种数据库(包括如实例3中所述产生JH48820-1的基因组序列)中进行搜索来进行蛋白鉴定。这鉴定了分别由SEQ ID NO:617和SEQ ID NO:618的多核苷酸编码的IPD106-1Aa多肽(SEQ ID NO:366)和IPD106-2Aa多肽(SEQ ID NO:367)。编码IPD106-1Aa和IPD106-2Aa的基因在单个操纵子中。IPD106-1Aa(SEQ ID NO:617)和IPD106-2Aa(SEQ IDNO:618)在大肠杆菌中的重组表达证实了多肽IPD1061Aa(SEQ ID NO:366)和IPD106-2Aa(SEQ ID NO:367)的杀昆虫活性。在测试的浓度下,IPD100-1Aa(SEQ ID NO:366)和IPD100-2Aa(SEQ ID NO:367)多肽均未单独显示出针对WCRW的杀昆虫活性。

IPD107Aa的分离与鉴定

在26℃下,使JH60888-1(十字花科假单胞菌(Pseudomonas brassicacearum))在ISP-2培养基(酵母提取物-4g/L、麦芽提取物-10g/L、右旋糖-4g/L)中生长,同时在250rpm下摇动1天。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

将JH60888-1的细胞沉淀物悬浮在B-PER II细菌蛋白提取试剂(Thermo Pierce公司)中,所述试剂在20mM Tris-HCl缓冲液(pH 9.0)(缓冲液A)中稀释至1/4X强度,所述缓冲液含有来自卡比化学公司(CalBiochem)的蛋白酶抑制剂混合物V、来自Epicentre公司的Ready-LyseTM溶菌酶和来自Epicentre公司(麦迪逊,威斯康星州)的OmniCleaveTM内切核酸酶。将细胞悬浮液在30℃,250rpm下孵育1小时。通过在20,000g下离心10min澄清粗裂解物,并且用1N NaOH调节至pH 8.7。将此材料上样到填充有在缓冲液A中平衡的Q SepharoseTMHP介质(GE医疗集团)的阴离子交换柱上。用缓冲液A中的至0.5M NaCl的线性梯度洗脱结合的蛋白。将级分脱盐并经受杀昆虫活性鉴定。合并活性级分,将缓冲液交换到1M硫酸铵,20mM Tris-HCl,pH 9(缓冲液B)中,并且施加到在缓冲液B中平衡的疏水相互作用PhenylSepharoseTM HP柱(GE医疗集团)上。用1M至0M硫酸铵的线性梯度洗脱蛋白质。将级分脱盐并经受杀昆虫活性鉴定。合并活性级分,脱盐到20mM Tris-HCl pH 8,150mM NaCl(缓冲液C)中,并且在10,000MWCO膜(GE医疗集团)中浓缩至0.4mL的最终体积。将浓缩的材料上样到缓冲液C中的SuperdexTM 20010/30尺寸排阻柱(GE医疗集团)上。具有WCRW活性的级分的SDS-PAGE分析显示出用蓝染料染色后的突出条带。如实例1所述,切下大约11kDa的蛋白带,用胰蛋白酶消化,并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)进行分析,并且经受通过埃德曼降解的N-末端氨基酸测序。通过在各种数据库(包括如实例3中所述产生JH60888-1的基因组序列)中进行搜索来进行蛋白鉴定。这鉴定了由SEQID NO:621的多核苷酸编码的IPD107Aa多肽(SEQ ID NO:377)。IPD107Aa(SEQ ID NO:621)在大肠杆菌中的重组表达证实了多肽IPD107Aa(SEQ ID NO:377)的杀昆虫活性。

IPD111Aa的分离与鉴定

在28℃下,使JH59138-1(Burkholderia ambifaria)在2xYT培养基(酵母提取物10g/L、酪蛋白的胰消化物16g/L、氯化钠5g/L)中生长,同时在160rpm下摇动1天。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

然后将菌株JH59138-1(Burkholderia ambifaria)的细胞沉淀物悬浮在具有“完全无EDTA”蛋白酶抑制剂混合物(罗氏公司(Roche),印第安纳波利斯(Indianapolis),印第安纳州)的20mM MOPS,pH 8缓冲液中,并且在30,000psi下裂解(Constant Systems Ltd.公司,Low March,达文特里(Daventry),北安普敦郡(Northants),英国)。通过离心澄清粗裂解物并且调节至1.0M硫酸铵。将澄清裂解物上样到在20mM MOPS,pH 7.0,1.0M硫酸铵中平衡的HiTrapTM PhenylHP柱(GE医疗集团,皮斯卡塔韦市,新泽西州)上,并且用在20mM MOPS,pH 7.0中的至0%硫酸铵的梯度洗脱。合并活性级分,并且使用HiPrepTM 26/10脱盐柱(GE医疗集团)将其脱盐到20mM Tris,pH 8.0中,然后上样到在20mM Tris,pH 8.0中平衡的Q-SepharoseTM FF柱(GE医疗集团)上,并且用0至0.4M NaCl的梯度,经30个柱体积洗脱。合并活性级分,并且使用HiPrepTM26/10脱盐柱(GE医疗集团)将其脱盐到25mM Bis-Tris,pH 6.6中,然后上样到在25mM Bis-Tris,pH 6.6中平衡的Mono PTM柱(GE医疗集团)上,并且用100%Polybuffer 74,pH 4.0,经15个柱体积洗脱。合并活性级分,并且使用HiPrepTM 26/10脱盐柱(GE医疗集团)将其脱盐到20mM MES,pH 6.0中,然后上样到在20mM MES,pH 6.0中平衡的Mono QTM柱(GE医疗集团)上,并且用0至0.2M NaCl的梯度,经40个柱体积洗脱。级分的SDS-PAGE分析表明,用GelCodeTM蓝染色试剂(Thermo Fisher)染色后,WCRW活性与突出的条带一致。如实例1所述,切下大约36kDa的蛋白带,用胰蛋白酶消化,并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)进行分析。通过在各种数据库(包括如实例3中所述产生JH59138-1的基因组序列)中进行搜索来进行蛋白鉴定。这鉴定了由SEQ ID NO:629的多核苷酸编码的IPD111Aa多肽(SEQ ID NO:453)。IPD111Aa(SEQ ID NO:629)在大肠杆菌中的重组表达证实了IPD111Aa多肽(SEQ ID NO:453)的杀昆虫活性。

IPD112Aa的分离与鉴定

在26℃下,使SSP 640H4-1(Burkholderia ambifaria)在TSB(胰蛋白酶大豆肉汤)培养基(17g/L胰蛋白胨、3g/L大豆蛋白胨、2.5g/L右旋糖、2.5g/L K2HPO4和5g/L NaCl)中生长,同时在210rpm下摇动2天。这种杀昆虫活性表现出指示蛋白质性质的热敏感性和蛋白酶敏感性。

将菌株SSP 640H4-1(Burkholderia ambifaria)的细胞沉淀物悬浮在30mM MES(pH 6)缓冲液(默克密理博公司(EMD Millipore)蛋白酶抑制剂混合物V(以1:100的体积)(默克集团(Merck KGaA),达姆施塔特,德国)、OmniCleaveTM内切核酸酶和ReadyLyse溶菌酶(Epicenter Technologies Corporation公司,芝加哥,伊利诺伊州,美国))和“完全无EDTA”蛋白酶抑制剂混合物(罗氏公司(Roche),印第安纳波利斯(Indianapolis),印第安纳州)中,并且在30,000psi下裂解(Constant Systems Ltd.公司,Low March,达文特里(Daventry),北安普敦郡(Northants),英国)。通过离心和过滤澄清粗裂解物并且通过添加1.0N HCl达到pH 6。通过在4℃下,在13,800g下离心15min使裂解物澄清,并且然后上样到在30mM MES,pH 6中平衡中的阳离子交换HiTrapTM S FF(GE医疗集团)柱上。用至30mM MESpH 6,0.6M NaCl的30个柱体积梯度洗脱具有WCRW活性的级分。合并活性级分,并且使用具有10kDa分子量截留的VivaSpinTM离心浓缩器(赛多利斯斯泰迪生物技术公司(SartoriusStedim),哥廷根(Goettingen),德国)浓缩,并且在10,000g下离心15min进行澄清。然后将浓缩和澄清的级分池上样到在具有0.15M NaCl的30mM MES中平衡的SuperdexTM Increase200 10/300 GL尺寸排阻柱(GE医疗集团,皮斯卡塔韦市,新泽西州)上。级分的SDS-PAGE分析表明,用GelCodeTM蓝染色试剂(Thermo Fisher)染色后,WCRW活性与突出的条带一致。如实例1所述,切下大约33kDa的蛋白带,用胰蛋白酶消化,并且通过纳米液相色谱/电喷雾串联质谱法(纳米-LC/ESI-MS/MS)进行分析。通过在各种数据库(包括如实例3中所述产生SSP 640H4-1的基因组序列)中进行搜索来进行蛋白鉴定。这鉴定了由SEQ ID NO:635的多核苷酸编码的IPD112Aa多肽(SEQ ID NO:529)。IPD112Aa(SEQ ID NO:635)在大肠杆菌中的重组表达证实了IPD112Aa多肽(SEQ ID NO:529)的杀昆虫活性。

实例6.基因克隆和大肠杆菌表达

首先通过使用其基因组DNA作为模板的PCR来扩增编码杀昆虫蛋白的靶基因。基于基因的5′端和3′端序列设计PCR引物,其中掺入了适当的限制性位点,或者添加了与线性化的大肠杆菌表达载体的5′和3′端重叠的序列。通过限制酶消化和连接或基于同源重组的克隆,将PCR产物克隆到选择的大肠杆菌表达载体中,即具有N-His标签的pET16b、具有C-His标签或不具有标签的pET24a。在共表达二元毒素的两种蛋白(IPD092-1/2、IPD095-1/2、IPD100-1/2、IPD106-1/2)和三元毒素的三种蛋白(IPD099-1/-2/-3)的情况下,还将它们的天然操纵子序列克隆到大肠杆菌载体之一中。将这些蛋白在BL21(DE3)、C41或大肠杆菌宿主细胞中表达,在16℃下用1mM IPTG过夜诱导。诱导后从大肠杆菌培养物中提取重组蛋白。如实例1中所述,在昆虫靶标上测定澄清细胞裂解物或纯化的蛋白。

实例7.鉴定同源物

从各种内部菌株中提取基因组DNA,鉴定出物种,并且基因组是如实例3中所述的序列。在与内部基因组和公开可用的“nr”数据库(包括所有非冗余的GenBankCDS翻译,源自3维结构布鲁克港蛋白质数据库的序列,SWISS-PROT蛋白质序列数据库、EMBL和DDBJ数据库的最后主要版本)中包含的序列相似的默认参数下,可以通过进行(基本局部比对20搜索工具(Basic Local Alignment 20 Search Tool);Altschul等人,(1993)J.Mol.Biol.[分子生物学杂志]215:403-410;还参见ncbi.nlm.nih.gov/BLAST/,其可以使用www前缀访问)搜索而确定基因同一性。分析了SEQ ID NO:SEQ ID NO:546、SEQ IDNO:547、SEQ ID NO:562、SEQ ID NO:563、SEQ ID NO:590、SEQ ID NO:591、SEQ ID NO:592、SEQ ID NO:593、SEQ ID NO:611、SEQ ID NO:612、SEQ ID NO:614、SEQ ID NO:617、SEQ IDNO:618、SEQ ID NO:621、SEQ ID NO:629、SEQ ID NO:635的多核苷酸序列。

表4显示了所鉴定的IPD092-1Aa和IPD092-2Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表5显示了,基于Needleman-Wunsch算法,如在Needle程序(EMBOSS tool套件)中实现的IPD092Aa-1同源物的总体对比的成对的同一性关系的矩阵表。

表6显示了,基于Needleman-Wunsch算法,如在Needle程序(EMBOSS tool套件)中实现的IPD092Aa-1同源物的总体对比的成对的同一性关系的矩阵表。

表4

表5

表6

表7显示了所鉴定的IPD095-1Aa和IPD095-2Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表7

表8显示了所鉴定的IPD097-1Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表8

表9显示了所鉴定的IPD099-1Aa、IPD099-2Aa、和IPD099-3Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表9

表10显示了所鉴定的IPD100-1Aa和IPD100-2Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表10

表11显示了所鉴定的IPD105Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表11

表12显示了,基于Needleman-Wunsch算法,如在Needle程序(EMBOSS tool套件)中实现的IPD105Aa同源物的总体对比的成对的同一性关系的矩阵表。

表12

表13显示了所鉴定的IPD106-1Aa和IPD106-2Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表13

表14显示了所鉴定的IPD107Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表14

表15显示了所鉴定的IPD111Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表15

表16显示了所鉴定的IPD112Aa多肽同源物,每个的序列识别号码和它们鉴定出的细菌分离物。

表16

实例8.基因亚克隆和大肠杆菌表达

首先通过使用其基因组DNA作为模板的PCR来扩增编码杀昆虫蛋白的靶基因。基于基因的5′端和3′端序列设计PCR引物,其中掺入了适当的限制性位点,或者添加了与线性化的大肠杆菌表达载体的5′和3′端重叠的序列。通过限制酶消化和连接或基于同源重组的克隆,将PCR产物克隆到选择的大肠杆菌表达载体中,即用于N-His、C-His标签表达和无标签表达的pCOLDTM1、3,pET16、24、28。在一些情况下,将pMALTM载体用于MBP融合表达。在共表达二元毒素的两种蛋白质的情况下,还将它们的天然操纵子序列克隆到大肠杆菌载体之一中。将这些蛋白质在BL21(DE3)、C41或大肠杆菌宿主细胞中表达,在16℃用1mMIPTG过夜诱导。

诱导后从大肠杆菌培养物中提取重组蛋白。如实例1中所述,针对WCRW测定细胞澄清裂解物或纯化的蛋白。

用稀释系列在每个昆虫靶标上测试纯化的重组蛋白质,并且计算最小抑制浓度(表17和表18)。

表17.IPD蛋白及其在昆虫靶标上的最低抑制浓度(基于在人工饲料生物测定中的掺入)。

表17

*禾测试

表18.IPD099和IPD111蛋白及其在昆虫靶标上的最低抑制浓度(基于覆盖人工饲料生物测定)。

表18

*未测试

表19.当在大肠杆菌中表达后,在粗大肠杆菌裂解物中被测定为未纯化的蛋白时,IPD095和IPD106蛋白针对WCRW具有活性。

表19

蛋白质 WCRW
IPD095-1Aa/IPD095-2Aa 有活性的
IPD106-1Aa/IPD106-2Aa 有活性的

实例9-农杆菌介导的玉蜀黍的稳定转化

对于杀昆虫多肽的农杆菌介导的玉蜀黍转化,采用Zhao的方法(美国专利号5,981)。简而言之,从玉蜀黍中分离未成熟的胚,并且将胚与农杆菌悬浮液接触,其中细菌能够将编码本公开的杀昆虫多肽的多核苷酸转移至至少一种未成熟胚的至少一个细胞中(步骤1:感染步骤)。在此步骤中,将未成熟胚浸泡在农杆菌悬浮液中,引发接种。使所述胚与农杆菌共培养一段时间(步骤2:共培养步骤)。将所述未成熟胚在有抗生素但没有选择剂的固体培养基上培养用于消除农杆菌,并持续经感染的细胞的静置期。接着,在含有选择剂的培养基上培养经接种的胚,并且回收正在生长的经转化的愈伤组织(步骤4:选择步骤)。在含选择剂的固体培养基上培养所述未成熟胚,使经转化的细胞选择性生长。然后将愈伤组织再生成植物(步骤5:再生步骤),并将生长在选择培养基上的愈伤组织在固体培养基上培养以再生植物。

为了检测叶组织中的杀昆虫多肽,将4个冻干叶穿孔/样品粉碎并重悬于含有0.1%TWEENTM 20的100μL PBS缓冲液(PBST)、含有1片/7mL完整迷你蛋白酶抑制剂(罗氏公司1183615301)的1%β-巯基乙醇中。将悬浮液超声处理2分钟,并且然后在4℃、20,000g下离心15分钟。向上清液等份1/3体积的3XLDS样品缓冲液(InvitrogenTM,加利福尼亚州,美国)中,添加含有1片/7mL完整迷你蛋白酶抑制剂的1%B-ME。将反应物在80℃下加热10分钟,并且然后离心。将上清液样品按照制造商(InvitrogenTM)说明书装载在具有MES运行缓冲液的4%-12%Bis-Tris Midi凝胶上,并使用装置(InvitrogenTM)转移到硝酸纤维素膜上。将硝酸纤维素膜在含有5%脱脂奶粉的PBST中孵育2小时,然后在PBST中的亲和纯化的兔抗杀昆虫多肽中孵育过夜。将膜用PBST冲洗三次并且然后在PBST中孵育15分钟,并且然后在具有山羊抗兔HRP的PBST中孵育持续3小时之前5分钟进行两次,持续2小时。使用ECL蛋白质印迹试剂(GE医疗集团,目录号RPN2106)和MR膜可以观察到所检测的蛋白质。为了检测根中的杀昆虫蛋白,将根冻干,并且将2mg粉末/样品悬浮于LDS中,添加含有1片/7mL完整迷你蛋白酶抑制剂的1%β-巯基乙醇。将反应在80℃下加热10分钟,并且然后在4℃、20,000g下离心15分钟。将上清液样品按照制造商(InvitrogenTM)说明书装载在具有MES运行缓冲液的4%-12%Bis-Tris Midi凝胶上,并使用装置(InvitrogenTM)转移到硝酸纤维素膜上。将硝酸纤维素膜在含有5%脱脂奶粉的PBST中孵育2小时,然后在PBST中的亲和纯化的多克隆兔抗杀昆虫抗体中孵育过夜。将膜用PBST冲洗三次并且然后在PBST中孵育15分钟,并且然后在具有山羊抗兔HRP的PBST中孵育持续3小时之前5分钟进行两次,持续2小时。使用ECLTM蛋白印迹试剂(GE医疗集团,目录号RPN2106)和MR膜可以检测到抗体结合杀昆虫蛋白。

使用标准生物测定法测试杀昆虫蛋白表达阳性的转基因玉蜀黍植物的杀有害生物活性。这些方法包括例如根切除生物测定和全植物生物测定。参见例如,美国专利申请公开号2003/0120054。

实例10-用于在植物中表达杀昆虫多肽的表达载体构建体

可以构建植物表达载体以包括包含杀昆虫多肽编码序列的转基因盒,所述杀昆虫多肽编码序列在与增强子元件组合的紫茉莉花叶病毒(MMV)启动子的控制下[Dey N和Maiti IB,1999,Plant Mol.Biol.[植物分子生物学]40(5):771-82]。这些构建体可用于产生转基因玉蜀黍事件,以测试通过本公开的杀昆虫多肽的表达提供的针对玉米根虫的功效。

事件的T0温室效应可以通过免受西方玉米根虫的根保护来测量。使用由Oleson等人,(2005)[J.Econ Entomol.[经济昆虫学杂志]98(1):1-8]开发的方法,根据损伤的根的节点数测量根保护(CRWNIS=玉米根虫节点损伤评分)。根损伤评分测量为从“0”到“3”,其中“0”表示无可见根损伤,“1”表示1个根损害节点,“2”表示2个根节点损害,并且“3”表示3个根节点损害的最大评分。中间评分(例如1.5)表示损害节点的额外分数(例如损伤的一个半节点)。

对本公开的各种所说明的实施例的上述描述并不旨在是详尽的或者限制范围于所公开的精确形式。虽然为了说明目的而在本文描述了具体实施例和实例,但是如相关领域的技术人员将认识到的,在本公开范围内的各种等效修饰是可能的。本文提供的教导可以应用于除了上述实例之外的其他目的。根据上述教导,许多修改和变化是可能的,并且因此在所附权利要求书的范围内。

考虑到上述详细描述,可以进行这些改变和其他改变。通常,在以下权利要求书中,所用的术语不应被解释为将范围限制于说明书和权利要求书中公开的具体实施例。

背景技术、具体实施方式和实例中引用的每个文献(包括专利、专利申请、杂志文章、摘要、手册、书籍或其他公开内容)的全部公开内容通过引用以其整体并入本文。

就使用的数字(例如量、温度、浓度等)而言,已努力确保其准确性,但仍应允许有一些实验误差和偏差。除非另有说明,份为重量份,分子量为平均分子量;温度为摄氏度;并且压力为大气压或接近大气压。

174页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:表达外源葡糖淀粉酶和木聚糖酶的酿酒酵母菌株及其在生产生物乙醇中的用途

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!