用于提高基因组工程化效率的方法

文档序号:90752 发布日期:2021-10-08 浏览:15次 >En<

阅读说明:本技术 用于提高基因组工程化效率的方法 (Methods for increasing efficiency of genome engineering ) 是由 J·F·古铁雷斯-马科斯 于 2020-01-28 设计创作,主要内容包括:本发明涉及用于真核细胞中基因组工程化的方法和材料,并且特别涉及经由递送一个或多个RKD2和RKD4基因以及基因组工程化组分来提高基因组工程化(即转化或基因组编辑)效率的方法。(The present invention relates to methods and materials for genome engineering in eukaryotic cells, and in particular to methods for increasing the efficiency of genome engineering (i.e., transformation or genome editing) via delivery of one or more RKD2 and RKD4 genes and genome engineering components.)

用于提高基因组工程化效率的方法

相关申请的交叉引用

本申请要求2019年1月29日提交的美国临时申请62/798,010的优先权,其通过引用的方式整体并入本文。

技术领域

本文描述了用于真核细胞中基因组工程化的新颖的方法和材料,特别是通过递送编码RKD2和/或RKD4的核酸和基因组工程化组分来提高基因组工程化(即转化或基因组编辑)效率的方法。

序列表

本申请案含有以电子方式提交的ASCII格式的序列表,并且通过引用的方式整体并入本文。所述ASCII副本创建于2018年11月25日,名称为KWS0304_SEQLIST_20181123_ST25.txt,大小为73,166字节。

背景技术

传统育种提供了驯化的植物和动物,而现代生物技术,特别是基因组工程,正在扩大育种能力,并能够实现仅以传统近缘物种杂交不可能实现的改进。使用生物技术已在作物中引入了如高产量、耐除草剂和抗害虫性等多种特性,使全球农业和粮食安全取得巨大进步。然而,此类生物技术产品中外源DNA的存在可引发生物安全和环境问题。

通过分离出任何整合的DNA,基因组编辑技术可用于在末端植物中不存在外源DNA的情况下生成靶基因组的位点特异性修饰。此外,通过瞬时表达,基因组编辑可具有瞬时编辑活性以创建位点特异性修饰,而无需在过程的任何时刻进行DNA整合。基因组编辑的植物,特别是衍生自瞬时活性的植物,与传统的基因组修饰的植物有很大不同,并且可能不能作为遗传修饰(GM)的植物调节。因此,基因组编辑技术,特别是经由瞬时编辑的方法,可以为农业提供高精度、安全和强有力的植物育种和发育工具。

然而,基于瞬时活性的基因组工程面临着更多的挑战。与稳定转化相比,瞬时工程化通常导致较少的修饰的细胞。在没有整合的可选择标记的情况下,识别工程化细胞并在再生植物中实现同源修饰极具挑战性。这些挑战阻碍了瞬时基因编辑作为用于植物改良的育种工具的常规实现。因此,急需提高基因组工程化效率的新颖的方法和材料。

发明内容

一方面提供了一种用于在植物细胞中进行遗传修饰的方法,所述方法包括

(a)向所述植物细胞中引入

(i)包含编码RKD2多肽或RKD4多肽的多核苷酸序列的核酸、包含所述核酸的重组基因,或包含所述核酸的DNA构建体;和

(ii)感兴趣的转基因和/或基因组工程化组分;

(b)任选地,在化学诱导后允许由核酸合成RKD2多肽或RKD4多肽的条件下培养植物细胞;和

(c)任选地,在允许在RKD2多肽或RKD4多肽存在下通过整合感兴趣的转基因和基因组工程化组分的活性而对所述植物细胞的基因组进行遗传修饰的条件下培养植物细胞;

其中编码RKD2多肽或RKD4多肽的多核苷酸序列与异源启动子可操作地连接,所述异源启动子是直接化学可诱导的或间接化学可诱导的,优选经由中间转录因子间接化学可诱导的。

在一些实施方式中,所述方法有效地提高植物再生的效率。在一些实施方式中,所述方法有效地提高植物细胞的再生能力。在一些实施方式中,在步骤(b)中,在直接或间接化学诱导异源启动子后,优选在向植物细胞中添加β-雌二醇或糖皮质激素如地塞米松后,由所述核酸合成RKD2多肽或RKD4多肽。

在一些实施方式中,异源启动子是用于化学β-雌二醇化学可诱导性的XVE/OLexA系统。在多种实施方式中,XVE/OLexA系统包含SEQ ID NO:22的核酸序列,或与SEQ ID NO:22具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核酸序列。

在一些实施方式中,异源启动子是可诱导的双向启动子。在多个实施方式中,可诱导的双向启动子与编码期望的多肽的第二核酸序列可操作地连接。在多个实施方式中,所述第二核酸序列包含报告基因和编码报告蛋白的多核苷酸。在一些实施例中,报告子是GUS或tdTomato。

在多个实施方式中,可诱导的双向启动子是地塞米松可诱导启动子。在一些特定的实施方式中,启动子是pOp1、pOp2、pOp4或pOp6。在一些特定的实施方式中,pOp6包括SEQID NO:15的核酸序列,或与SEQ ID NO:15具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核酸序列。

在一些实施方式中,在步骤(a)(i)中,将包含与强组成型启动子可操作连接的编码转录因子的多核苷酸序列的另一核酸引入植物细胞中,其中所述转录因子在与地塞米松结合后激活pOp6。在特定的实施方式中,转录因子是LhGR或LhG4。在一些实施方式中,LhGR具有SEQ ID NO:17的氨基酸序列,或与SEQ ID NO:17具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中编码LhGR的核酸包括SEQ ID NO:16的编码序列,或与SEQID NO:16具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的编码序列。

在一些实施方式中,所述强组成型启动子是泛素启动子或双35S启动子。在一些特定的实施方式中,双35S启动子包含SEQ ID NO:21的核苷酸序列,或与SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在一些特定的实施方式中,泛素启动子包含SEQ ID NO:23的核苷酸序列,或与SEQ ID NO:23具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在一些特定的实施方式中,泛素启动子额外包含泛素内含子,所述泛素内含子包含SEQ ID NO:20的核苷酸序列,或与SEQ ID NO:20具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。

在一些实施方式中,在允许在RKD2多肽或RKD4多肽存在下通过整合感兴趣的转基因和基因组工程化组分的活性而对所述植物细胞的基因组进行遗传修饰的条件下培养植物细胞;在一些特定的实施方式中,在不存在有效诱导化学可诱导的启动子的化学剂的情况下,所培养的植物细胞不表达报告基因。在一些实施方式中,植物细胞经培养产生胚性结构。在一些实施方式中,所述胚性结构经培养产生再生植物。

在多个实施方式中,RKD2多肽或RKD4多肽在植物细胞中瞬时存在、具有瞬时活性和/或瞬时表达,和/或编码RKD2多肽的核酸在植物细胞中瞬时存在、具有瞬时活性和/或瞬时表达,或编码RKD4多肽的核酸在植物细胞中瞬时存在、具有瞬时活性和/或瞬时表达。

在多个实施方式中,RKD2多肽包含SEQ ID NO:5的氨基酸序列,或与SEQ ID NO:5具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或编码RKD2多肽的所述核酸编码SEQ ID NO:5的氨基酸序列,或与SEQ ID NO:5具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。

在多个实施方式中,RKD4多肽包含SEQ ID NO:2的氨基酸序列,或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或编码RKD4多肽的所述核酸编码SEQ ID NO:2的氨基酸序列,或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。

在一些实施方式中,编码RKD2多肽的核酸包含选自以下的具有编码序列的核酸:

a)包含SEQ ID NO:3或4的核苷酸序列的核酸;

b)包含与SEQ ID NO:3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;

c)以及在严格杂交条件下与a)或b)中定义的核酸的互补链杂交的核酸。

在一些实施方式中,编码RKD4多肽的核酸包含选自以下的具有编码序列的核酸:

a)包含SEQ ID NO:1的核苷酸序列的核酸;

b)包含与SEQ ID NO:1具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和

c)在严格杂交条件下与(1)或(2)中定义的核酸的互补链杂交的核酸。

在一些实施方式中,基因组工程化组分包含:

a)诱导双链断裂(DSB)的酶或编码其的核酸,以及任选存在的修复核酸分子,其中所述DSB诱导酶优选识别所述细胞的基因组中的预定位点;

b)诱导单链断裂(SSB)的酶或编码其的核酸,以及任选存在的修复核酸分子,其中所述SSB诱导酶优选识别所述细胞的基因组中的预定位点;

c)碱基编辑酶,其任选地与去武装的DSB或SSB诱导酶融合,其中所述碱基编辑酶优选识别所述细胞的基因组中的预定位点;或

d)实现DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白核糖基化或组蛋白瓜氨酸化的酶,其任选地与去武装的DSB或SSB诱导酶融合,其中所述酶优选识别所述细胞基因组中的预定位点。

在一些实施方式中,包含DSB或SSB诱导酶或其变体的基因组工程化组分是CRISPR/Cas内切核酸酶、CRISPR/Cas9内切核酸酶、CRISPR/Cpf1内切核酸酶、CRISPR/Csm1内切核酸酶、CRISPR/MAD7内切核酸酶、CRISPR/CasX内切核酸酶、CRISPR/CasY内切核酸酶、锌指核酸酶(ZFN)、归巢内切核酸酶、大范围核酸酶或TAL效应子核酸酶。

在一些实施方式中,步骤(c)中基因组工程化组分的活性包括诱导植物细胞的基因组中的一个或多个双链断裂、植物细胞的基因组中的一个或多个单链断裂、植物细胞的基因组中的一个或多个碱基编辑事件、或植物细胞的基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白类泛素化、组蛋白核糖基化或组蛋白瓜氨酸化中的一个或多个。在特定的实施方式中,在诱导一个或多个双链断裂或一个或多个单链断裂之后,进行非同源末端连接(NHEJ)和/或通过同源重组机制对断裂进行同源定向修复(HDR)。

在一些实施方式中,步骤(a)(ii)中的转基因选自:编码对非生物胁迫的抗性或耐受性的基因,包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷酸盐缺乏、盐胁迫或水浸、除草剂抗性,所述除草剂抗性包括对草甘膦、草铵膦/草丁膦、潮霉素、原卟啉原氧化酶(PPO)抑制剂、ALS抑制剂和麦草畏的抗性;编码对生物胁迫的抗性或耐受性的基因,包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码与产量相关性状的基因,所述产量相关性状包括抗倒伏性、开花时间、抗落粒性、种子颜色、胚乳组成或营养含量。

在一些实施方式中,在步骤(c)中,所述基因组的修饰选自

i)取代至少一个核苷酸;

ii)删除至少一个核苷酸;

iii)插入至少一个核苷酸;

iv)DNA甲基化的变化;

v)组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白类泛素化、组蛋白核糖基化或组蛋白瓜氨酸化的变化;和

vi)i)-v)的任何组合。

在多个实施方式中,所述方法有效地促进细胞增殖或细胞再生,优选在遗传修饰后促进。在多个实施方式中,所述方法有效地从单个细胞诱导胚形成,优选在遗传修饰之后促进。在多个实施方式中,所述方法有效地提高转基因进入植物细胞的稳定转化效率。在多个实施方式中,所述方法有效地提高基因组工程化组分编辑植物细胞基因组的效率。

另一方面,提供了根据上述方面和实施方式中的任何一个的方法获得或可获得的遗传修饰的植物细胞。还提供了包含所述遗传修饰的植物细胞的植物或植物部分。

另一方面,提供了一种植物细胞,包含

a)编码RKD2多肽的多核苷酸;或编码RKD4多肽的多核苷酸;和

b)感兴趣的转基因和/或基因组工程化组分;

其中所述编码RKD2多肽或RKD4多肽的多核苷酸与异源启动子可操作地连接,所述异源启动子是直接化学可诱导的或间接化学可诱导的,优选经由中间转录因子间接化学可诱导的。

另一方面,提供了一种包含DNA构建体的植物细胞,其中所述DNA构建体包含

a)包含编码RKD2或RKD4多肽的多核苷酸的核酸,所述多核苷酸与化学可诱导的双向启动子可操作地连接。

b)与所述双向启动子可操作地连接的报告基因,以及

c)编码转录因子的第三重组基因,其与强组成型启动子可操作地连接。

另一方面,提供了一种用于产生遗传修饰的植物的方法,包括以下步骤:

(a)根据上述方法中的任何一种对植物细胞进行遗传修饰,以及

(b)从步骤(a)的修饰的植物细胞再生植物。

在一些实施方式中,所产生的植物不含稳定整合到植物基因组中的基因组工程化组分中的任何一个。还提供了通过所述方法获得或可获得的遗传修饰的植物或其部分。

另一方面,提供了包含编码RKD2多肽或RKD4多肽的多核苷酸的核酸、包含所述核酸的重组基因、包含所述核酸的DNA构建体用于化学诱导后提高植物再生的效率或增加植物细胞的再生能力的用途,其中编码RKD2多肽或RKD4多肽的所述多核苷酸与异源启动子可操作地连接,所述异源启动子是直接化学可诱导的或间接化学可诱导的,优选经由中间转录因子间接化学可诱导的。

附图说明

图1示出了基因表达载体pZY ZZ-TOP的图谱,所述载体携带用于GUS表达的地塞米松(Dex)化学诱导的pOp6/LHGR系统和感兴趣的发育基因。质粒包含pOp6化学可诱导的启动子。在暴露于地塞米松后,发育基因和GUS报告基因均会表达。pZY ZZ-TOP还包含与泛素启动子可操作地连接的基因LhGR。在地塞米松存在下,LhGR进入细胞核并激活pOp6。

图2是示出了诱导后由在化学可诱导启动子系统控制下的多种发育基因介导的再生效率的比较的图。用pZY-ZZ-TOP质粒转化植物,其中将不同的发育基因(即LEC2、WUS、BBM、AGL15和RKD4)插入质粒中。一些植物用地塞米松处理以诱导发育基因的表达(如X轴上的“+”所示),而另一些植物未这样处理(“-”)。Y轴上的再生效率是指体细胞胚形成的频率。

图3示出了在上述pOp6/LhGR反式激活系统中在表达RKD4的拟南芥(Arabidopsisthaliana)植物中诱导的体细胞胚形成。在根(左幅)、叶(中幅)或根和叶两者(右幅)中观察到体细胞胚的形成。

图4示出了在叶片基部用地塞米松诱导AtRKD4表达后,AtRKD4介导的蝴蝶兰(Phalaenopsis amabilis)植物的再生。从培养基中移除地塞米松后第0天(左)、7天(中)和14天(右),确定了体细胞胚(箭头)的存在。

图5示出了在普通小麦(Triticum aestivum)植物中雌二醇诱导的TaRKD2的表达。观察到了胚性结构的诱导和发育:愈伤组织形成(左幅,箭头),绿变(中幅)和出叶(右幅,箭头)。

图6示出了在大麦(Hordeum vulgare)植物中雌二醇诱导的TaRKD2的表达。观察到了胚性结构的诱导和发育:愈伤组织形成(左上幅)、枝条和根发育(右上幅,箭头)、绿变(左下幅)和幼苗形成(右下幅)。

图7示出了在玉米(Zea mays)中地塞米松诱导的AtRKD4和TaRKD2的表达。在组成型启动子存在下用红色荧光tdTomato基因共轰击地塞米松可诱导的构建体(参见实施例1)。暴露于地塞米松后,在对AtRKD4(左幅)和TaRKD2(右幅轰击后33天,可以观察到诱导形成了稳定整合了tdTomato的大量愈伤组织结构。

图8示出了携带XVE/OLexA系统的pERV1-hygro的质粒图谱,所述系统用于感兴趣的发育基因的表达的β-雌二醇化学可诱导性(Borghi,L.(2010).Inducible geneexpression systems for plants.In Plant Developmental Biology(pp.65-75).HumanaPress,Totowa,NJ.)。

具体实施方式

定义

除非另外说明,本文使用的技术和科学术语具有与本发明所属的领域内的普通技术人员通常所理解的相同的含义。

在本申请的上下文中所使用的术语“约”是指所述值的+/-10%,优选所述值的+/-5%。例如,约100个核苷酸(nt)应理解为90-110nt的值,优选95-105nt的值。

转化的或基因编辑的植物细胞的再生可能包括体细胞胚形成过程,其是从单个体细胞或体细胞群中衍生出植物或胚胎的人工过程。体细胞胚是由通常不参与胚胎发育的植物细胞形成的,即芽、叶、枝条等植物组织。此过程的应用可包括:基因上一致的植物材料的克隆繁殖;消除病毒;为基因转化提供来源组织;从单细胞如原生质体生成整株植物;合成种子技术的发展。可培养源自胜任的来源组织的细胞以形成愈伤组织。组织培养基中的植物生长调节剂如植物生长素或细胞分裂素可被操纵以诱导愈伤组织形成,并随后被改变以诱导愈伤组织形成胚胎。体细胞胚胎被描述为以两种方式发生:直接或间接。当胚胎从外植体组织开始产生完全相同的克隆时,直接胚形成。当外植体产生未分化或部分分化的细胞(即愈伤组织),其然后维持或分化成植物组织如叶、茎或根时,间接胚形成。

根据本发明使用的术语“转基因”是指包含基因或基因构建体的植物、植物细胞、组织、器官或材料,所述基因或基因构建体包含通过自然手段或通过来自另一生物的转化技术转移到所述植物、植物细胞、组织、器官或材料中的“转基因”。术语“转基因”包括核酸序列,包括DNA或RNA,或氨基酸序列,或其组合或混合物。因此,术语“转基因”并不限于通常被鉴定为“基因”的序列,即编码蛋白质的序列。它也可以指例如非蛋白质编码DNA或RNA序列。因此,术语“转基因”通常意味着相应的核酸或氨基酸序列并不自然存在于相应的靶细胞中,相应的靶细胞包括植物、植物细胞、组织、器官或材料。因此,本文中使用的术语“转基因”或“转基因的”是指从一个生物体的基因组中提取或合成产生然后通过分子生物学、遗传学等人工技术以瞬时或稳定的方式引入另一生物体中的核酸序列或氨基酸序列。本文所用的“植物材料”是指可从处于任何发育阶段的植物获得的任何材料。所述植物材料可以通过对植物或其组织或器官原位(in planta)或体外培养获得。因此,所述术语包括植物细胞、组织和器官以及已发育的植物结构,以及亚细胞成分,如核酸、多肽以及所有化学植物物质或代谢物,其可以在植物细胞或室中找到和/或可以由植物产生,或可以从任何植物细胞、组织或处于任何发育阶段的植物的提取物中获得。该术语还包括植物材料的衍生物,例如原生质体,其衍生自植物材料包含的至少一个植物细胞。因此,该术语还包括植物的分生组织细胞或分生组织。

本文中所用的术语“基因组工程化”是指对植物细胞的任何遗传信息或基因组进行遗传修饰的策略和技术,包括基因组转化、基因组编辑等。同样,“基因组编辑”是指对植物细胞的任何遗传信息或基因组进行靶向特异性修饰的技术。因此,“基因组工程化”和“基因组编辑”包括对基因编码区域的编辑,以及对基因组的基因编码区域以外的区域的编辑。这些还包括植物细胞的核(如果存在)以及其它遗传信息的编辑或工程化。此外,“基因组工程化”还包括表观遗传编辑或工程化,即靶向修饰,例如甲基化、组蛋白修饰或可能导致基因表达的可遗传变化的非编码RNA。

本文所用的术语“基因组编辑”是指对植物细胞的任何遗传信息或基因组进行靶向特异性修饰的策略和技术,包括对基因组的基因编码区域以外的区域(如内含子序列、非编码RNA、miRNA、调节元件的序列如启动子、终止子、转录激活因子结合位点、顺式或反式作用元件等)进行编辑。此外,“基因组编辑”可以包括碱基编辑以用于单核碱基的靶向替换。它还可以包括编辑核基因组以及植物细胞的其它遗传信息,即线粒体基因组或叶绿体基因组以及miRNA、pre-mRNA或mRNA。此外,“基因组编辑”可以包括可能导致基因表达的可遗传变化的表观遗传编辑或工程化,即靶向修饰,例如DNA甲基化或组蛋白修饰,如组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苏酰化、组蛋白核糖化或组蛋白瓜氨酸化。“基因组编辑”还可包括可能导致基因表达的可遗传变化的非编码RNA的表观遗传编辑或工程化。

本文所用的“碱基编辑器”是指具有与其所衍生的蛋白质相同催化活性的蛋白质或其片段,所述蛋白质或其片段单独或作为分子复合体提供时在本文称为碱基编辑复合体。碱基编辑器具有介导靶向碱基修饰的能力,即转换感兴趣的碱基从而导致感兴趣的点突变,如果碱基转换不引起沉默突变,而是转换包含待用该碱基编辑器转换的位置的密码子编码的氨基酸,则所述点突变进而可导致靶向突变。

如本文所用,“调节元件”是指不属于编码蛋白质的核苷酸序列的一部分、但介导编码蛋白质的核苷酸序列表达的核苷酸序列。调节元件包括例如启动子、顺式调节元件、增强子、内含子或终止子。根据调节元件的类型其位于编码蛋白质的核苷酸序列之前(即5'处)或之后(即3'处)的核酸分子上。调节元件在活植物细胞中起作用。术语“可操作地连接”意指调节元件通过此类方式与编码蛋白质的核苷酸序列连接,即通过此类方式相对于编码蛋白质的核苷酸序列例如核酸分子定位,使得编码蛋白质的核苷酸序列的表达在调节元件的控制下可以在活细胞中进行。

如本文所用,“上游”表示核酸分子上靠近所述核酸分子5'端的位置。同样,术语“下游”是指核酸分子上靠近所述核酸分子3'端的位置。为避免疑义,核酸分子及其序列通常以从5'到3'的方向(从左到右)表示。

如本文所用,“侧翼区域”是修复核酸分子的区域,所述修复核酸分子具有与位于预选位点侧翼(即上游或下游)的DNA区域的核苷酸序列同源的核苷酸序列。

如本文所用,“瞬时表达”是指转移的蛋白质/多肽和编码所述蛋白质/多肽的核酸片段在细胞中瞬时表达和/或具有活性,并随着细胞生长而很快关闭和/或降解的现象。

如本文所用,“双链DNA断裂诱导酶”、“诱导双链断裂的酶”或“DSBI酶”是能够在称为“识别位点”或“预定位点”的特定核苷酸序列处诱导双链DNA断裂的酶。相应地,“单链DNA断裂诱导酶”、“诱导单链断裂的酶”或“SSBI酶”是能够在称为“识别位点”或“预定位点”的特定核苷酸序列处诱导单链DNA或RNA断裂的酶。

如本文中所用,“修复核酸分子”是单链或双链DNA分子或RNA分子,其用作修饰在预选位点处的基因组DNA或RNA的模板,所述预选位点在切割位点附近或位于切割位点处。如本文所用,“用作修饰基因组DNA的模板”是指通过在侧翼区域与位于预选位点侧翼的目标基因组中的相应的同源区域之间的同源重组,任选地与在修复核酸分子的两个末端之一处的非同源末端连接(NHEJ)(例如在只有一个侧翼区域的情况下)组合,在预选位点复制或整合修复核酸分子。

如本文所用,“基因组的修饰”是指基因组在至少一个核苷酸中或通过至少一个表观遗传编辑已改变。

如本文所用,“预选位点”、“预定位点”或“预定义位点”表示基因组(例如细胞核基因组或叶绿体基因组)中的特定核苷酸序列,在该位置处希望插入、替换和/或删除一个或多个核苷酸。

如本文所用,“植物激素”或“植物生长调节剂”是指促进植物细胞分裂和/或植物形态发生的天然存在或合成的任何材料和化学物质。如本文所用,“再生”是指单个或多个细胞增殖并发育成组织、器官和最终完整的植株的过程。

如本文所用,术语“载体”或“质粒(载体)”指用于引入或转化、转染或转导到任何真核细胞中、包括根据本发明的植物、植物细胞、组织、器官或材料中的构建体,尤其包括质粒或(质粒)载体、粘粒、人工酵母或细菌人工染色体(YAC和BAC)、噬菌粒、基于细菌噬菌体的载体,表达盒,分离的单链或双链核酸序列,包括线性或环形的序列,或氨基酸序列、病毒载体,包括修饰的病毒,及其组合或混合物。

在重组基因的上下文中“重组”可以包括调节序列和/或定位序列。根据本发明的重组构建体或DNA构建体可以整合到载体中,或可以是载体(包括质粒载体),和/或它可以孤立于载体结构存在,例如以单链或双链核酸的形式存在。在例如通过生物或物理方式转化或转染引入重组基因或DNA构建体后,所述重组基因或DNA构建体可以在染色体外持续存在,即未整合到靶细胞的基因组中,例如以双链或单链DNA的形式存在。或,重组基因或DNA构建体可以稳定地整合到靶细胞的基因组中,包括细胞核基因组或靶细胞的其它遗传元件,包括像线粒体或叶绿体这样的质体的基因组。

发明人表明,编码RKD2和/或RKD4的核酸尤其在递送转基因和/或基因组工程化组分后的再生早期介导强效应。这种效应并不影响植株的发育,且再生植株在成年期表现出良好的植株生长和可育性。因此,RKD2和RKD4基因的整合可以通过杂交和选择在后代中分离出来。

RKD2和RKD4是植物特异性RWP-RK转录因子。RKD2和RKD4是在拟南芥和其它植物物种如小麦和玉米中发现的。RKD2和RKD4单独或组合可以改善基因组工程和/或改善转化或基因编辑的植物细胞的植株再生。RKD2和RKD4单独或一起可以增加植物细胞(优选来源于体细胞组织、胚胎组织、愈伤组织或原生质体)在整个植物优选可育植物中再生的性能或能力。因此,RKD2和RKD4各自或一起可调节体细胞胚形成(体细胞胚形成)和/或可提高植物细胞的增殖速率。RKD2和RKD4一起组合可能具有协同作用。在本文公开的多种方法中,RKD2、RKD4或RKD2和RKD4的组合可瞬时共表达。可以将编码RKD2或RKD4的多核苷酸引入植物细胞中。

还提供了编码RKD2或RKD4的核酸,其包含SEQ ID NO:2或5的氨基酸序列。进一步提供编码RKD2或RKD4的核酸,其包含与SEQ ID NO:2或5具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。

包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、84%、83%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列的编码RKD4的核酸可以包括包含SEQ ID NO:1的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:1具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。或,在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:1的核苷酸序列的核酸或包含与SEQ ID NO:1具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。

包含SEQ ID NO:5的氨基酸序列或与SEQ ID NO:5具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列的编码RKD2的核酸还可以包括包含SEQ ID NO:3或4的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:3具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。所述核酸可包含与SEQ ID NO:4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。或,在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:3的核苷酸序列的核酸或包含与SEQ ID NO:3具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。或,在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:4的核苷酸序列的核酸或包含与SEQ ID NO:4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。

提供了一种重组基因,其包含编码RKD2或RKD4的核酸,所述RKD2或RKD4的核酸包含SEQ ID NO:2或5的氨基酸序列,或与SEQ ID NO:2或5具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。所述核酸可以与一个或多个调节元件可操作地连接。所述调节元件可以是启动子、顺式调节元件、增强子、内含子或终止子。调节元件可以在核酸序列的5'处。调节元件可以在核酸序列的3'处。调节元件可以是定向启动子。所述核酸可以包括包含SEQ ID NO:1、3或4的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:1、3或4的核苷酸序列的核酸或包含与SEQ IDNO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。

在一些实施方式中,核酸与异源启动子可操作地连接。所述异源启动子可以是可诱导启动子。

异源启动子可以是双向可诱导启动子,如化学可诱导启动子pOp6。pOp6启动子包含优化的lac操纵序列的六个拷贝,如Samalova et al.,Plant J.,2005,41(6):919-35中所述。作为pOp6/LhGR表达系统的一部分,地塞米松调动LhGR定位到细胞核,LhGR在此激活pOp6。LhGR可以与强组成型启动子(例如泛素启动子或双35S启动子)可操作地连接。所述LhGR编码序列还可包括泛素内含子。作为替代,LhGR和强组成型启动子可以在单独的DNA构建体上表达。

在一些实施方式中,在步骤(a)(i)中,将包含与强组成型启动子可操作连接的编码转录因子的多核苷酸序列的另一核酸引入植物细胞中,其中所述转录因子在与地塞米松结合后激活pOp6。在特定的实施方式中,转录因子是LhGR或LhG4。在一些实施方式中,LhGR具有SEQ ID NO:17的氨基酸序列,或与SEQ ID NO:17具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中编码LhGR的核酸包括SEQ ID NO:16的编码序列,或与SEQID NO:16具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的编码序列。

在一些实施方式中,强组成型启动子是泛素启动子或双35S启动子。在一些特定的实施方式中,双35S启动子包括SEQ ID NO:21的核苷酸序列,或与SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在一些特定的实施方式中,泛素启动子包括SEQ ID NO:23的核苷酸序列,或与SEQ ID NO:23具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在一些特定的实施方式中,泛素启动子还包括泛素内含子,所述泛素内含子包括SEQ ID NO:20的核苷酸序列,或与SEQ ID NO:20具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。

激活的pOp6能够指导与pOp6可操作地连接的基因的转录。由于具有双向性,pOp6既能表达目的基因(如发育基因),又能表达报告基因(如GUS或tdTomato)。作为替代,也可以使用pOp1、pOp2或pOp4。

或,异源启动子可以是XVE/OlexA,例如,作为β-雌二醇可诱导的XVE/OlexA系统的一部分。在暴露于β-雌二醇后,XVE/OlexA被激活并能指导与XVE/OlexA可操作地连接的基因的转录。

由于植物中β-葡萄糖醛酸酶具有较低的活性水平,因此GUS报告系统适用于大多数植物(GUS是β-葡萄糖醛酸酶)。tDTomato基因(tDT)编码异常明亮的红色荧光蛋白,该荧光蛋白的最大激发在554nm处,最大发射在581nm处。另外,也可以使用其它报告酶,如荧光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶(CAT),以及碱性磷酸酶。

还提供了包含上述任何核酸或重组基因的DNA构建体,优选载体。所述核酸可以包括包含SEQ ID NO:1、3或4的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。或,在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:1、3或4的核苷酸序列的核酸或包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。在一些实施方式中,所述DNA构建体是质粒。在一些实施方式中,DNA构建体包含双向可诱导启动子(例如pOp6)。核酸可以与所述双向可诱导启动子可操作地连接。在一些实施方式中,DNA构建体包含XVE/OlexA启动子系统,所述启动子系统能够在暴露于β-雌二醇后诱导核酸的表达。另一报告核酸(如GUS或tdTomato)也可以与双向可诱导启动子可操作地连接。报告核酸可以帮助选择以泄漏方式表达核酸的植物,例如当没有双向可诱导启动子的诱导发生时。例如,可以选择表达GUS或tdTomato的植物,当不施用地塞米松时,GUS或tdTomato与地塞米松诱导的pOp6可操作地连接。

植物细胞

另一方面,提供了一种植物细胞,其包含本文描述的RKD2或RKD4、核酸、重组基因和DNA构建体中的一种或多种,优选转基因。在一些实施方式中,RKD2或RKD4包含SEQ IDNO:2或5的氨基酸序列。在一些实施方式中,RKD2或RKD4包含与SEQ ID NO:2或5具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。所述核酸可以包括包含SEQ ID NO:1、3或4的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:1、3或4的核苷酸序列的核酸或包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。还提供了包含植物细胞的植物、植物的一部分、种子、胚或愈伤组织。

植物细胞可以是任何类型的植物材料的一部分或源于任何类型的植物材料,优选枝条、下胚轴、子叶、茎、叶、叶柄、根、胚、愈伤组织、花、配子体或其部分,或可以是原生质体或源于原生质体。可以使用分离的植物细胞以及植物材料,即包含植物细胞的整个植物或部分植物。

植物的一部分,或多个植物的多个部分,可以附属于完整的整株植物,或与完整的整株植物分离。植物的这些部分包括但不限于植物的器官、组织和细胞,优选种子。

植物细胞、植物部分或植物可以来自任何植物物种,无论是单子叶植物还是双子叶植物。优选地,可适用于本发明的方法和用途的植物是选自以下属的植物:大麦属(Hordeum)、高粱属(Sorghum)、甘蔗属(Saccharum)、玉米属(Zea)、狗尾草属(Setaria)、稻属(Oryza)、小麦属(Triticum)、黑麦属(Secale)、小黑麦属(Triticale)、苹果属(Malus)、短柄草属(Brachypodium)、山羊草属(Aegilops)、胡萝卜属(Daucus)、甜菜属(Beta)、桉树属(Eucalyptus)、烟草属(Nicotiana)、茄属属(Solanum)、咖啡属(Coffea)、葡萄属(Vitis)、Erythrante、螺旋狸藻属(Genlisea)、黄瓜属(Cucumis)、Marus属、拟南芥属(Arabidopsis)、须弥芥属(Crucihimalaya)、碎米荠属(Cardamine)、独行菜属(Lepidium)、荠菜属(Capsella)、Olmarabidopsis属、筷子芥属(Arabis)、芸苔属(Brassica)、芝麻菜(Eruca)、萝卜属(Raphanus),柑橘属(Citrus)、麻风树属(Jatropha)、杨树属(Populus)、苜蓿属(Medicago)、鹰嘴豆属(Cicer)、木豆属(Cajanus)、菜豆属(Phaseolus)、大豆属(Glycine)、棉属(Gossypium)、黄芪属(Astragalus)、莲属(Lotus)、蝴蝶草属(Torenia)、葱属(Allium)或向日葵属(Helianthus)。更优选地,所述植物选自大麦(Hordeum vulgare)、Hordeum bulbusomuMSorghum bicolor)、甘蔗(Saccharum officinarium)、玉米属(Zeaspp.),包括玉米(Zea mays),粟(Setaria italica)、小粒稻(Oryza minuta)、水稻(Oryzasativa)、澳洲野生稻(Oryza australiensis)、高杆稻(Oryza alta)、普通小麦(Triticumaestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、小黑麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、Hordeum marinum、山羊草(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜属(Beta spp.),包括甜菜(Beta vulgaris)、美洲野胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、绒毛状烟草(Nicotiana tabacum)、本氏烟(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中粒咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、螺旋狸藻属(Genlisea aurea)、黄瓜(Cucumis sativus)、川桑(Marus notabilis)、拟南芥(Arabidopsis arenosa)、Arabidopsis lyrata、鼠耳芥(Arabidopsis thaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、Cardaminenexuosa、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芸苔(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、Cajanus cajanifolius、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉花(Gossypium sp.)、紫云英(Astragalus sinicus)、Lotus japonicas、蓝猪耳(Toreniafournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和/或韭菜(Allium tuberosum)。特别优选的是甜菜(Beta vulgaris)、玉米(Zea mays)、普通小麦(Triticum aestivum)、大麦(Hordeum vulgare)、黑麦(Secale cereale)、向日葵(Helianthus annuus)、马铃薯(Solanum tuberosum)、高粱(Sorghum bicolor)、芜菁(Brassica rapa)、油菜(Brassicanapus)、芸苔(Brassica juncacea)、甘蓝(Brassica oleracea)、萝卜(Raphanussativus)、水稻(Oryza sativa)、大豆(Glycine max)和/或棉花(Gossypium sp)。

遗传修饰的植物细胞可以是全株植物的一部分,也可以是该部分中的一部分。因此,本发明还涉及包含上述遗传修饰的植物细胞的植物或植物部分。

在允许对所述植物细胞的基因组进行遗传修饰的条件下,通过在RKD2或RKD4的存在下整合目的转基因和基因组工程化组分的活性,培养已经(共)引入基因组工程化组分的植物细胞。

植物细胞的遗传修饰

还提供了在植物细胞中进行遗传修饰的方法。所述方法包括向植物细胞中引入(i)本文所述的任何核酸、重组基因或DNA构建体;和(ii)转基因和/或基因组工程化组分。植物细胞可以在允许从核酸、重组基因或DNA构建体合成RKD2或RKD4多肽的条件下培养。植物细胞可以在允许在RKD2或RKD4多肽存在下通过基因组工程化组分的活性对所述植物细胞的基因组进行遗传修饰的条件下培养。

基因组工程化组分可以作为蛋白质和/或编码基因组工程化组分的核酸引入,特别是作为DNA诸如质粒DNA、RNA、mRNA或RNP引入。基因组工程可用于制造转基因、基因编辑或碱基编辑的植物材料。

对于要修饰的植物细胞,可以使用基于生物学途径的转化方法,例如农杆菌(Agrobacterium)转化或病毒载体介导的植物转化。常见的生物学方法是用农杆菌属进行转化,其几十年来已用于多种不同的植物材料中。病毒载体介导的植物转化也可用于将遗传物质引入目的细胞。农杆菌介导的转化是指使用根癌农杆菌(Agrobacteriumtumefaciens)将外源DNA输送到植物细胞中,根癌农杆菌是一种土壤细菌,其用作天然的基因工程载体。根癌农杆菌能侵入植物并在相当广泛的植物范围中转移外源DNA。

或,可以使用基于物理递送方法的转化方法,如粒子轰击或显微注射。粒子轰击包括基因枪转染或微粒介导的基因转移,其是指将包含核酸或目的基因构建体的包衣微粒或纳米颗粒转移到靶细胞或组织中的物理递送方法。物理引入手段适合于引入核酸即RNA和/或DNA,以及蛋白质。粒子轰击和显微注射已经成为将遗传物质引入目的植物细胞或组织的杰出技术。Helenius et al.,“Gene delivery into intact plants using the HeliosTMGene Gun”,Plant Molecular Biology Reporter,2000,18(3):287-288公开了粒子轰击作为将物质引入植物细胞的物理方法。因此,存在多种植物转化方法将基因构建体形式的遗传物质引入目的植物细胞,包括植物生物技术领域的技术人员已知的生物学和物理方法,这些方法可用于将编码至少一种壁相关激酶的至少一种基因引入植物细胞、组织、器官或整株植物中至少一个的至少一个细胞中。

本文使用的术语“粒子轰击”,也称为“基因枪转染”或“微粒介导的基因转移”是指将包含RKD2或RKD4基因、基因组工程化组分和/或转基因的包衣微粒或纳米颗粒转移到靶细胞或组织中的物理递送方法。微粒子或纳米粒子起抛射作用,并在高压下使用适当的设备(通常称为基因枪)向目的靶结构发射。通过粒子轰击的转化使用覆着有目的构建体的金属微弹,然后将其使用称为“基因枪”的设备(Sandford et al.1987)以足够快(约1500km/h)的高速射向靶细胞,以穿透靶组织的细胞壁,但不足以导致细胞死亡。对于已将细胞壁完全移除的原生质体来说,条件在逻辑上是不同的。所述至少一个微弹上沉淀的构建体在轰击后被释放到所述细胞中。微弹的加速通过高压放电或压缩气体(氦)完成。关于所使用的金属颗粒,其必须是无毒、无反应性的,并且它们的直径小于靶细胞的直径。最常用的是金或钨。基因枪及相关系统的制造商和供应商提供了大量关于其一般用途的公开信息。

在微粒轰击的特别优选实施方式中,一个或多个RKD2或RKD4基因、基因组工程化组分和/或转基因通过微载体共同递送,所述微载体包括大小在0.4-1.6微米范围内(μm)、优选0.4-1.0μm范围内的金颗粒.在示例性过程中,每次轰击使用10-1000μg的金颗粒,优选50-300μg。

RKD2或RKD4基因、基因组工程化组分和/或转基因可以例如使用Bio-Rad PDS-1000/He粒子枪或手持式Helios基因枪系统递送到靶细胞中。当使用PDS-1000/He粒子枪系统时,轰击破裂压力为450-2200psi,优选450-1100psi,而Helios基因枪系统的破裂压力为100-600psi。可以将一种以上的化学物质或构建体与基因组工程化组分同时共递送到靶细胞中。

上述用于转化和转染的递送方法可同时用于引入本发明的工具。同样,存在用于将目的核酸或氨基酸构建体特异性引入植物细胞中的特异性转化或转染方法,所述方法包括电穿孔、显微注射、纳米颗粒和细胞穿透肽(CPP)。此外,存在基于化学的转染方法以引入基因构建体和/或核酸和/或蛋白质,所述方法尤其包括用磷酸钙转染,使用脂质体(例如阳离子脂质体)转染,或用阳离子聚合物(包括DEAD-葡聚糖或聚乙烯亚胺)转染,或其组合。上述递送技术可单独或组合用于体内(包括原位)或体外方法中。

在一些实施方式中,基因组工程化组分包含:

a)诱导双链断裂(DSB)的酶或编码其的核酸,以及任选存在的修复核酸分子,其中所述DSB诱导酶任选地识别所述细胞基因组中的预定位点;

b)诱导单链断裂(SSB)的酶或编码其的核酸,以及任选存在的修复核酸分子,其中所述SSB诱导酶任选地识别所述细胞基因组中的预定位点;

c)碱基编辑酶,其任选地与去武装的DSB或SSB诱导酶融合,其中所述碱基编辑酶优选识别所述细胞基因组中的预定位点;或

d)实现DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白核糖基化或组蛋白瓜氨酸化的酶,其任选地与去武装的DSB或SSB诱导酶融合,其中所述酶优选识别所述细胞基因组中的预定位点。

为了能够在预定的靶位点处断裂,所述酶优选包括结合/识别结构域和切割结构域。能够诱导双链或单链断裂的特定的酶是核酸酶或切口酶及其变体,包括不再包含核酸酶或切口酶功能,而是与另一酶结合用作识别分子这样的酶。近年来,已经开发了许多合适的核酸酶,尤其是定制的核酸内切核酸酶,包括大范围核酸酶、锌指核酸酶、TALE核酸酶、例如源自格氏嗜盐碱杆菌(Natronobacterium gregoryi)的Argonaute核酸酶,以及CRISPR核酸酶,所述CRISPR核酸酶包括例如Cas9、Cpf1、Csm1、MAD7、casX或CasY核酸酶作为成簇规律间隔短回文重复序列(CRISPR)系统的一部分。在本发明的优选方案中,基因组工程化组分包含选自以下的DSB或SSB诱导酶或其变体:CRISPR/Cas内切核酸酶、CRISPR/Cas9内切核酸酶、CRISPR/Cpf1内切核酸酶、CRISPR/Csm1内切核酸酶、CRISPR/MAD7内切核酸酶、CRISPR/CasX内切核酸酶、CRISPR/Casy内切核酸酶、锌指核酸酶(ZFN)、归巢内切核酸酶、大范围核酸酶,以及TAL效应子核酸酶。

稀有切割核酸内切核酸酶是DSBI/SSBI酶,其具有优选约14至70个连续核苷酸的识别位点,因此即使在较大的基因组(例如大多数植物基因组)中,其也具有很低的切割频率。归巢核酸内切核酸酶,也称为大范围核酸酶,其构成了这种稀有切割核酸内切核酸酶的家族。它们可以由内含子、独立基因或间插序列编码,并具有惊人的结构和功能特性,使它们与更经典的限制酶(通常源自细菌限制性修饰II型系统)区分开来。它们的识别位点具有普遍的不对称性,这与大多数限制性内切核酸酶识别位点的特征性二元对称性相反。由内含子或内蛋白编码的几种归巢核酸内切核酸酶已显示可促进其各自的遗传元件归巢到等位基因的无内含子或无内蛋白位点中。通过在无内含子或无内蛋白等位基因中造成位点特异性双链断裂,这些核酸酶产生重组末端,这些末端参与基因转换过程,该过程复制编码序列并导致在DNA水平上插入内含子或间插序列。其它一系列稀有切割大范围核酸酶及其各自的识别位点在WO 03/004659(第17至20页)的表I(Table I)中提供(通过引用方式并入本文中)。

此外,可以使用方法来设计定制的稀有切割内切核酸酶,这些酶基本上识别所选择的任何目标核苷酸序列。简而言之,嵌合限制酶可以通过使用设计成识别特定核苷酸序列的锌指结构域与来自天然限制酶(例如FokI)的非特异性DNA切割结构域之间的杂交来制备。这种方法描述于WO 03/080809、WO 94/18313或WO 95/09233和Isalan et al.(2001)中。以HIV-1启动子为目标说明了一种快速、普遍适用的锌指工程方法。Naturebiotechnology,19(7):656;Liu et al.(1997)。用于在复杂基因组中独特寻址的多指锌指蛋白的设计。Proceedings of the National Academy of Sciences,94(11):5525-5530。

定制的内切核酸酶的另一个实例包括TALE核酸酶(TALEN),其基于与核酸酶(例如FokI或其变体)的催化结构域融合的来自细菌属黄单胞菌(Xanthomonas)的转录激活因子样效应蛋白(TALE)。这些TALE的DNA结合特异性由串联排列的34/35个氨基酸重复单元的重复可变的双连残基(RVD)定义,使得一个RVD特异性地识别目标DNA中的一个核苷酸。这些重复单元可以组装以识别基本上任何的目标序列,并与核酸酶的催化结构域融合,以产生序列特异性内切核酸酶(参见例如Boch et al.(2009).Breaking the code of DNA bindingspecificity of TAL-type III effectors.Science,326(5959),1509-1512;Moscou&Bogdanove(2009).A simple cipher governs DNA recognition by TALeffectors.Science,326(5959),1501-1501;以及WO 2010/079430、WO 2011/072246、WO2011/154393、WO 2011/146121、WO 2012/001527、WO 2012/093833、WO 2012/104729、WO2012/138927、WO 2012/138939)。WO 2012/138927进一步描述了具有多种催化结构域的单体(致密型)TALEN和TALE以及它们的组合。

最近,已经描述了一种新型的可定制的内切核酸酶系统;称为CRISPR/Cas系统。在其自然环境中的CRISPR系统描述了一种分子复合体,其包含至少一种小的单独的非编码RNA与Cas核酸酶或另一种CRISPR核酸酶(如Cpf1核酸酶或Csm1核酸酶)的组合(Zetsche etal.,“Cpf1 Is a Single RNA-Guides Endonuclease of a Class 2 CRISPR-CasSystem”,Cell,163,pp.1-13,October 2015.;US 2017/0233756 A1),所述核酸酶可以产生特定的DNA双链断裂。目前,CRISPR系统分成2类,包含5种类型的CRISPR系统,例如使用Cas9作为效应子的II型系统和使用Cpf1作为效应子分子的V型系统(Makarova et al.,NatureRev.Microbiol.,2015)。在人工CRISPR系统中,合成的非编码RNA和CRISPR核酸酶和/或任选的修饰的CRISPR核酸酶(其经修饰以充当切口酶或缺乏任何核酸酶功能),可与结合了crRNA和/或tracrRNA功能的至少一种合成或人工向导RNA或gRNA组合使用(Makarova etal.,2015,同上)。由自然界中CRISPR/Cas系统介导的免疫应答应需要CRISPR-RNA(crRNA),其中控制CRISPR核酸酶特异性激活的这种向导RNA的成熟在迄今已表征的多种CRISPR系统之间差异很大。首先,入侵的DNA(也称为间隔区)整合在CRISPR基因座近端的两个相邻重复区域之间。II型CRISPR系统编码Cas9核酸酶作为干扰步骤的关键酶,该系统既包含crRNA又包含反式激活RNA(tracrRNA)作为向导基序。这些杂交并形成双链(ds)RNA区域,这些区域被RNAseIII识别并可以切割以形成成熟的crRNA。然后这些进而与Cas分子结合,以便将核酸酶特异性地引导至目标核酸区域。重组gRNA分子既可以包含可变DNA识别区还可以包含Cas相互作用区域,因此可以独立于特定的靶核酸和所需的Cas核酸酶而进行特异性设计。

作为进一步的安全机制,PAM(前间区序列邻近基序)必须存在于靶核酸区域中;这些是直接接在识别Cas9/RNA复合体的DNA之后的DNA序列。来源于化脓性链球菌(Streptococcus pyogenes)的Cas9的PAM序列已描述为“NGG”或“NAG”(标准IUPAC核苷酸代码)(Jinek et al,“A programmable dual-RNA-guided DNA endonuclease in adaptivebacterial immunity”,Science 2012,337:816-821)。来源于金黄色葡萄球菌(Staphylococcus aureus)的Cas9的PAM序列为“NNGRRT”或“NNGRR(N)”。其它变体CRISPR/Cas9系统是已知的。因此,脑膜炎奈瑟氏菌(Neisseria meningitidis)的Cas9在PAM序列NNNNGATT处切割。嗜热链球菌(Streptococcus thermophilus)的Cas9在PAM序列NNAGAAW处切割。最近,已经针对空肠弯曲菌(Campylobacter)的CRISPR系统描述了又一PAM基序NNNNRYAC(WO 2016/021973 A1)。对于Cpf1核酸酶,已经描述了不含tracrRNA的Cpf1-crRNA复合体有效识别和切割前置有短的富含T的PAM的目标DNA,这与Cas9系统所识别的通常富含G的PAM形成对比(Zetsche et al.,同上)。此外,通过使用修饰的CRISPR多肽,可以获得特定的单链断裂。Cas切口酶与多种重组gRNA的组合使用还可以通过产生双DNA切口诱导高度特异性的DNA双链断裂。此外,通过使用两个RNA,可以优化DNA结合的特异性,并因此优化DNA切割。其它的CRISPR效应子,如最初描述细菌的CasX和CasY效应子,同时是可用的,并代表可用于基因组工程目的的另外的效应子(Burstein et al.,“New CRISPR-Cas systemsfrom uncultivated microbes”,Nature,2017,542,237-241)。

DSBI/SSBI酶的切割位点与DNA或RNA上诱导断裂的确切位置有关。切割位点可以包含或可以不包含在DSBI/SSBI酶的识别位点中(与之重叠),因此据信DSBI/SSBI酶的切割位点位于其识别位点处或附近。DSBI/SSBI酶的识别位点(有时也称为结合位点)是通过DSBI/SSBI酶(特异性)识别并决定其结合特异性的核苷酸序列。例如,TALEN或ZNF单体具有分别由其RVD重复或ZF重复确定的识别位点,而其切割位点由其核酸酶结构域(例如FokI)确定,并且通常在识别位点之外。在为二聚TALEN或ZFN的情况下,切割位点位于各自单体的两个识别/结合位点之间,其中发生切割的该间隔DNA或RNA区域被称为间隔区。

本领域技术人员能够选择识别一特定识别位点并在预选/预定位点处或其附近的切割位点处诱导DSB或SSB的DSBI/SSBI酶,或设计这种DSBI/SSBI酶。或,可以使用任何常规的转化方法或通过与其基因组中具有DSBI/SSBI酶识别位点的生物体杂交,将DSBI/SSBI酶识别位点引入目标基因组中,然后,可以在该DSBI/SSBI酶的切割位点处或附近引入任何所需的核酸。

在多个实施方式中,基因组的修饰包括以下一种或多种:i)替换至少一个核苷酸;ii)删除至少一个核苷酸;iii)插入至少一个核苷酸;iv)DNA甲基化的变化;和v)组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苏酰化、组蛋白核糖基化或组蛋白瓜氨酸化的变化。

在一些实施方式中,基因组工程化组分的活性诱导植物细胞基因组中的一个或多个双链断裂、植物细胞基因组中的一个或多个单链断裂、植物细胞基因组中的一个或多个碱基编辑事件、或植物细胞基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白类泛素化、组蛋白核糖化或组蛋白瓜氨酸化中的一个或多个。

在一些实施方式中,在诱导一个或多个双链断裂或一个或多个单链断裂之后,进行非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)对断裂进行同源定向修复。NHEJ和HDR是修复断裂的两个主要和不同的途径。同源重组需要存在同源序列作为模板(如修复核酸分子或“供体”)来指导细胞修复过程且修复结果是无错误和可预测的。在缺乏用于同源重组的模板(或修复核酸分子或“供体”)序列的情况下,细胞通常试图通过非同源末端连接(NHEJ)过程来修复断裂。

在本实施方式的特别优选方面,将修复核酸分子另外引入植物细胞中。修复核酸分子是单链或双链DNA分子或RNA分子,其用作修饰在预选位点处的基因组DNA或RNA的模板,所述预选位点在切割位点附近或位于切割位点处。在一些实施方式中,将修复核酸分子用作修饰基因组DNA的模板,其中通过在侧翼区域与位于预选位点侧翼的目标基因组中的相应的同源区域之间的同源重组,任选地与在修复核酸分子的两个末端之一处的非同源末端连接(NHEJ)(例如,在只有一个侧翼区域的情况下)组合,在预选位点复制或整合所述修复核酸分子。通过同源重组的整合允许修复核酸分子精确地连接到目标基因组直至达到核苷酸水平,而NHEJ可能导致在修复核酸分子和基因组DNA之间的连接处有较小的插入/删除。

在本文所述方面的多个实施方式中,发生了基因组的修饰,其中基因组已发生至少一个核苷酸改变。可以通过插入转基因(优选包括目的转基因的表达盒)、替换至少一个核苷酸和/或删除至少一个核苷酸和/或插入至少一个核苷酸来修饰基因组,只要导致与修饰前预选基因组靶位点的核苷酸序列相比产生至少一个核苷酸的总变化即可,从而允许例如通过技术人员很清楚的诸如测序或PCR分析等技术来识别修饰。

可在基因组(例如,细胞核基因组或叶绿体基因组)中的预选位点、预定位点或预定义位点,即特定的核苷酸序列处修饰基因组,在该位置处希望插入、替换和/或删除一个或多个核苷酸。例如,预选位点、预定位点或预定义位点可以是内源性基因座或在先前引入的外源DNA、RNA或转基因中的或与之连接的特定核苷酸序列。预选位点可以是一个特定的核苷酸位置,在该位置处(之后)打算插入一个或多个核苷酸。所述预选位点还可以包括将被交换(替换)或删除的一个或多个核苷酸的序列。

在多个实施方式中,选择侧翼区域的长度和百分比序列相同性以使得能够在所述侧翼区域与其在预选位点上游或下游对应的DNA区域之间进行同源重组。与修复核酸分子的侧翼DNA区域具有同源性的位于预选位点侧翼的DNA区域也被称为基因组DNA中的同源区。

为了具有足够的同源性以进行重组,修复核酸分子的侧翼DNA区域的长度可以不同,且其长度至少应为约10nt、约15nt、约20nt、约25nt、约30nt、约40nt或约50nt。然而,侧翼区域实际上可以尽可能长(例如,高达约100-150kb,如完整的细菌人工染色体(BAC))。优选地,侧翼区域为约50nt至约2000nt,例如约100nt、200nt、500nt或1000nt。此外,目的DNA侧翼的区域不必与同源性区域(预选位点侧翼的DNA区域)相同,并且可以与预选位点侧翼的DNA区域具有约80%至约100%的序列相同性,优选约95%至约100%的序列相同性。侧翼区域越长,对同源性的要求越不严格。此外,为了在不改变相邻DNA序列的DNA序列的情况下实现在预选位点处的目标DNA序列的交换,侧翼DNA序列优选应与预选位点侧翼的上游和下游DNA区域相同。

为了在预选位点实现序列修饰,必须选择侧翼区,使得上游侧翼区的3'端和/或下游侧翼区的5'端与预定位点的末端对齐。因此,上游侧翼区域的3'端决定了预定位点的5'端,而下游侧翼区域的5'端决定了预定位点的3'端。

预选位点位于所述切割(和/或识别)位点之外或远离所述切割(和/或识别)位点,使得其中欲进行基因组修饰的位点(预选位点)不包括DSBI/SSBI酶的切割位点和/或识别位点,从而使得预选位点不与切割(和/或识别)位点重叠。因此,就这一点而言,在外部/远离意味着位于切割(和/或识别)位点的上游或下游。

在多个实施方式中,根据本发明的至少一个碱基编辑器暂时或永久地与至少一个位点特异性DSBI/SSBI酶复合体或至少一个修饰的位点特异性DSBI/SSBI酶复合体连接,或任选地与所述至少一个位点特异性DSBI/SSBI酶复合体的组分连接。该连接可以是共价的和/或非共价的。本文公开的任何碱基编辑器或位点特异性DSBI/SSBI酶复合体、或其催化活性片段、或碱基编辑器复合体或位点特异性DSBI/SSBI酶复合体的任何组分均可以作为核酸片段引入细胞中,所述核酸片段表示或编码DNA、RNA或蛋白质效应子,或其可以作为DNA、RNA和/或蛋白质或其任何组合引入。

碱基编辑器是具有介导靶向碱基修饰的能力的蛋白质或其片段,所述能力即转换目的碱基以获得目的点突变。优选地,在本发明的背景下,所述至少一种碱基编辑器暂时或永久地与至少一种DSBI/SSBI酶、或任选地与至少一种DSBI/SSBI的组分融合。该融合可以是共价的和/或非共价的。多个出版物显示了使用与胞苷脱氨酶结构域连接的CRISPR/Cas9切口酶或非功能性核酸酶(载脂蛋白B mRNA编辑催化样多肽(APOBEC1),例如源自大鼠的APOBEC)进行靶向碱基转换,主要是从胞苷(C)转换为胸腺嘧啶(T)。胞嘧啶(C)的脱氨基化由胞苷脱氨酶催化,并产生尿嘧啶(U),尿嘧啶(U)具有与胸腺嘧啶(T)碱基配对的特性。大多数已知的胞苷脱氨酶对RNA都起作用,并且已知接受DNA的少数实例需要单链(ss)DNA。对dCas9-目标DNA复合体的研究表明,在形成Cas9-向导RNA-DNA的“R环”复合体时,置换的DNA链中的至少9个核苷酸(nt)未配对(Jore et al.,Nat.Struct.Mol.Biol.,18,529-536(2011))。实际上,在Cas9 R环复合体的结构中,被置换的DNA链上的前间隔序列的前11个核苷酸是无序的,这表明它们的运动不受严格限制。还据推测,在非模板链中Cas9切口酶诱导的胞嘧啶的突变可能是由于细胞胞嘧啶脱氨酶的可及性引起的。据推测,R环中ssDNA的这一段的子集可以作为与dCas9拴在一起的胞苷脱氨酶的有效底物,以实现DNA中C到U的直接可编程的转换(Komor et al.,同上)。最近,Goudelli et al.,Programmable baseediting of A·T to G·C in genomic DNA without DNA cleavage,Nature,2017,551(7681),464中描述了介导基因组DNA中A·T至G·C的转换的腺嘌呤碱基编辑器(ABE)。

实现DNA甲基化的酶以及组蛋白修饰酶在本领域中已鉴定。组蛋白翻译后修饰在调节染色质结构和基因表达方面起着重要作用。例如,用于组蛋白乙酰化的酶描述于Sterner D.E.,Berger S.L.(June 2000):“Acetylation of histones andtranscription-related factors”,Microbiol.Mol.Biol.Rev.64(2):435-59中。实现蛋白甲基化的酶描述于Zhang Y.,Reinberg D(2001):“Transcription regulation byhistone methylation:interplay between different covalent modifications of thecore histone tails”,Genes Dev.15(18):2343-60中。组蛋白泛素化描述于ShilatifardA(2006):“Chromatin modifications by methylation and ubiquitination:implications in the regulation of gene expression”,Annu.Rev.Biochem.75:243-69中。用于组蛋白磷酸化的酶描述于Nowak S.J.,Corces V.G.(April 2004):“Phosphorylation of histone H3:a balancing act between chromosomecondensation and transcriptional activation”,Trends Genet.20(4):214-20中。用于组蛋白类泛素化的酶描述于Nathan D.,Ingvarsdottir K.,Sterner D.E.,et al.(April2006):“Histone sumoylation is a negative regulator in Saccharomycescerevisiae and shows dynamic interplay with positive-acting histonemodifications”,Genes Dev.20(8):966-76中。用于组蛋白核糖基化的酶描述于HassaP.O.,Haenni S.S.,Elser M.,Hottiger M.O.(September 2006):“Nuclear ADP-ribosylation reactions in mammalian cells:where are we today and where are wegoing?”,Microbiol.Mol.Biol.Rev.70(3):789-829中。组蛋白瓜氨酸化是由称为肽基精氨酸脱氨酶4(PAD4,也称为PADI4)的酶催化的,它将组蛋白精氨酸(Arg)和单甲基精氨酸残基转化为瓜氨酸。

可以将实现DNA甲基化的酶和组蛋白修饰酶融合到去武装的DSB或SSB诱导酶上,所述诱导酶优选辨识出所述细胞基因组中的预定位点。

示例性转基因

在植物细胞中进行遗传修饰的方法的多个实施方式中,转基因可以是选自以下的基因:编码对非生物胁迫具有抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、缺氮、缺磷酸盐、盐胁迫或水涝、除草剂抗性,所述除草剂抗性包括对草甘膦、草铵膦/铵盐草丁膦、潮霉素、原卟啉原氧化酶(PPO)抑制剂、ALS抑制剂和麦草畏的抗性;编码对生物胁迫具有抗性或耐受性的基因,包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码与产量相关性状的基因,所述产量相关的性状包括抗倒伏性、开花时间、抗破碎性、种子颜色、胚乳组成或营养含量。

在植物细胞中进行遗传修饰的方法的多个实施方式中,所述方法有效地促进细胞增殖或细胞再生,或有效地提高转基因、基因编辑或碱基编辑的植物的再生效率。所述方法优选在遗传修饰/基因组修饰之后是有效的。在植物细胞中进行遗传修饰的方法的多个实施方式中,所述方法有效地从单个细胞(优选胚胎细胞、体细胞或原生质体)或从愈伤组织细胞诱导直接或间接(体细胞)的胚形成。所述方法优选在遗传修饰/基因组修饰之后是有效的。在多个实施方式中,所述方法有效地提高转基因进入植物细胞的稳定转化效率,或有效地提高遗传修饰的植物的产生效率。在多个实施方式中,该方法有效地提高基因组工程化组分编辑植物细胞基因组的效率,或有效地提高转基因、基因编辑或碱基编辑的植物的生成效率。

在一些实施方式中,该方法有效地提高源自顽拗基因型的植物的再生效率,有效地提高来自非常规组织类型的植物的再生效率,或优选地在遗传修饰/基因组修饰之后有效地加速再生过程。

RKD2或RKD4基因的瞬时表达

还提供了在植物细胞中RKD2或RKD4基因瞬时表达的方法。所述方法包括向植物细胞中引入(i)本文所述的核酸、重组基因或DNA构建体;和(ii)转基因和/或基因组工程化组分。

在一些实施方式中,RKD2和RKD4瞬时共表达。这种共表达可有效促进细胞增殖。这种共表达可有效促进细胞再生。这种共表达可以有效地从单个细胞诱导胚形成,从而提供无需选择就能再生同质植株的能力。共表达可通过与基因组编辑组分共递送来提高基因组编辑效率。

可以如美国临时申请案第62/685,626号中所述进行RKD2和RKD4的瞬时共递送,该案通过全文引用的方式并入本文中。

瞬时表达可通过瞬时转化/转染编码优选在化学可诱导启动子下表达的RKD2或RKD4蛋白/多肽的核酸片段来进行。通过在组织和发育特异性启动子或可诱导启动子的控制下稳定转化RKD2或RKD4基因,也可以实现编码RKD2多肽的核酸或编码RKD4多肽的核酸的瞬时表达。RKD2或RKD4基因可以表达,然后具有瞬时活性。RKD2或RKD4基因可以在植物细胞发育改变或诱导条件移除后很快被关闭和降解。例如,地塞米松可诱导启动子pOp6(SEQ IDNO:15)可用于驱动用于RKD2或RKD4基因瞬时转化。

瞬时转染、瞬时转化和稳定转化均可产生瞬时表达。“瞬时转化”和“瞬时转染”包括将外来物质[即核酸片段、蛋白质,核糖核蛋白(RNP)等]转移至宿主细胞中,从而在不整合和稳定遗传外来物质的情况下导致基因表达和/或活性。外来成分不是永久地结合到细胞基因组中,而是提供了导致基因组修饰的暂时作用。瞬时转化事件无法传递给下一代,因此是不可继承的。“稳定转化”是指将转移的核酸片段整合到宿主细胞基因组(包括细胞核和细胞器基因组两者)中从而导致核酸片段稳定遗传的事件。

例如,瞬时表达可用于瞬时基因组编辑。植物细胞中基因组工程化组分的瞬时活性和/或瞬时存在可导致植物细胞基因组中的一个或多个双链断裂、植物细胞基因组中的一个或多个单链断裂、植物细胞基因组中的一个或多个碱基编辑事件、或植物细胞基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白类泛素化、组蛋白核糖化或组蛋白瓜氨酸化中的一个或多个。植物细胞基因组中所产生的修饰例如可选自:至少一个核苷酸的替换,至少一个核苷酸的删除,至少一个核苷酸的插入,DNA甲基化的变化,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苯甲酰化、组蛋白核糖基化或组蛋白瓜氨酸化的变化,或其任何组合。

除了直接或间接化学诱导与编码RKD2多肽或RKD4多肽的多核苷酸序列可操作连接的异源启动子之外,瞬时表达也可以通过一种或多种定点的转录激活剂来实现。这种定点转录激活剂可以是美国临时申请案第62/609,508号和第62/758,068号中描述的合成转录因子,这两个临时案都通过引用的方式并入本文中。所述合成转录因子可包括至少一个识别结构域和至少一个基因表达调节结构域,特别是激活结构域,其中所述合成转录因子被配置成调节植物或植物细胞的基因组中内源基因的表达。这种内源基因优选为编码参与植物发育过程如根形成或枝条形成中的多肽的(天然)形态发生基因。在一些实施方式中,内源性形态发生基因选自编码RKD4多肽的内源性核酸或编码RKD2多肽的内源性核酸。在一些实施方式中,所述至少一个识别结构域是选自下列的分子或分子片段:至少一个TAL效应子、至少一个去武装的CRISPR/核酸酶系统、至少一个锌指结构域和至少一个去武装的归巢内切核酸酶,或其任何组合。

在一些实施方式中,所述至少一个去武装的CRISPR/核酸酶系统是CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCsm1系统、CRISPR/dMAD7系统、CRISPR/dCasX系统或CRISPR/dCasY系统,或其任何组合,并且其中所述至少一个去武装的CRISPR/核酸酶系统包括至少一个向导RNA。

在一些实施方式中,所述至少一个激活结构域选自酸性转录激活结构域,优选地,其中所述至少一个激活结构域选自水稻白叶枯病菌(Xanthomonas oryzae)的TAL效应基因、来自单纯疱疹(Herpes simplex)的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160,或其任何组合。在一些实施方式中,激活结构域是VP64。

在一些实施方式中,合成转录因子配置成通过结合位于相对于起始密码子一定距离处的调控区来调节形态发生基因的表达,优选转录。在优选的实施方式中,合成转录因子配置成通过结合位于相对于起始密码子一定距离处的调控区域来增加形态发生基因的表达,优选转录。

在一些实施方式中,定点转录激活剂子/合成转录因子或编码其的核酸包括至少一个识别结构域和至少一个激活结构域,其中所述定点转录激活剂配置成增加内源性RKD4多肽或内源性RKD2多肽的表达,优选地通过与位于相对于所述内源性RKD4多肽或内源性RKD2多肽的起始密码子一定距离处的调控区结合来进行。

本文所用的“调控区”是指在形态发生基因处或其附近的基因组中至少一个识别结构域与目标序列的结合位点。根据本文进一步公开的至少一个激活结构域和至少一个识别结构域的性质,可以有两个离散的调控区,或可以有重叠的调控区,所述合成转录因子的不同结构域可以以模块化方式组装。

在某些实施方式中,所述至少一个识别结构域可以靶向相对于目的基因的起始密码子的至少一个序列(识别位点),所述序列位于相对于目的基因的起始密码子的上游(-)或下游(+)至少1000bp、-700bp至+700bp、-550bp至+500bp、或-550bp至+425bp处。在某些实施方式中,识别启动子附近的识别结构域可能是优选的,而合成转录因子的靶向范围相比传统的或天然存在的转录因子高度扩展代表了特异性合成转录因子的优点。因为识别和/或激活域可以进行特异性设计和构造以特异性识别和靶向调节的热点。

在某些实施方式中,至少一个识别位点可位于相对于目的基因的起始密码子的-169bp至-4bp、-101bp至-48bp、-104bp至-42bp或-175bp至+450bp处(分别在上游(-)或下游(+)),以提供允许最佳调节、优选转录激活活性的最佳空间结合环境。尤其对于与作为识别部分的向导RNA一起起作用的基于CRISPR的合成转录因子,结合位点也可以位于目的基因的编码区域内(目的基因的起始密码子下游)。

在另外的实施方式中,合成转录因子的识别结构域可以结合到目的基因的5'和/或3'非翻译区(UTR)上。在采用不同识别结构域的实施方式中,至少两个识别结构域可以结合到形态发生基因的不同靶区,包括5'和/或3'UTR,但它们也可以在基因区域之外结合,但仍然与之保持至多1至1500bp的一定的距离。识别结构域可以结合的一个优选区域位于目的形态发生基因的起始密码子上游大约-4bp到大约-300bp处,优选大约-40bp至约-170p处。此外,这样一来,识别结构域的长度以及因此在目的基因组中相应的识别位点的长度可以根据合成转录因子和所采用的识别结构域的性质而变化。基于所述至少一个识别结构域的分子特征,这也将确定相应的至少一个识别位点的长度。例如,在单个锌指可为约8bp至约20bp,其中优选3至6个锌指基序的阵列的情况下,单个TALE识别位点可为约11bp至约30bp,或更多。基于CRISPR的合成转录因子的gRNA的识别位点包括与目的基因组区域杂交的gRNA的靶向或“间隔”序列,而所述gRNA包括其它结构域,包括与去武装的CRISPR效应子相互作用的结构域。基于去武装的CRISPR效应子的合成转录因子的识别位点将包括PAM基序,因为PAM序列是靶向结合任何CRISPR效应子所必需的,且确切的序列取决于CRISPR效应子的种类,即去武装的CRISPR效应子。

RKD2或RKD4基因的引入

编码RKD2或RKD4的核酸和/或基因组工程化组分可以作为DNA如质粒DNA、RNA、mRNA或RNP引入。

RKD2或RKD4基因可以与一个或多个基因组工程化组分共同递送。如本文所用,“共同递送”或“共递送”和“共同引入”或“共引入”可互换使用。就本发明而言,“共引入”是指将至少两种不同组分同时递送到同一植物细胞中的过程。因此,将基因组工程化组分和RKD2和/或RKD4一起引入同一植物细胞中。可以通过粒子轰击、显微注射、农杆菌介导转化、电穿孔、电融合、农杆菌渗入法或真空渗入共引入植物细胞中。

据信转化细胞的再生能力不如野生型细胞。由于细胞内存在外源DNA,转化细胞易受程序性细胞死亡的影响。递送(例如,轰击损伤)引起的应激也可能触发细胞死亡。因此,促进细胞分裂对修饰细胞的再生是必不可少的。此外,基因组工程的效率在很大程度上受宿主细胞状态的控制。经历快速细胞分裂的细胞,如植物分生组织中的那些,是最适合基因组工程的受体。促进细胞分裂很可能会增加在DNA复制和分裂过程中DNA的整合或修饰,从而提高基因组工程的效率。

当RKD2或RKD4多肽与转基因一起在植物细胞中表达时,所述RKD2或RKD4多肽可以增加所述转基因和由所述转基因编码的多肽的表达。当RKD2或RKD4多肽与基因组工程化组分和转基因一起在植物细胞中表达时,可以增加基因组工程化组分的活性。这种增加可能导致转基因更有效地整合到植物细胞的基因组中。

RKD4多肽编码序列可以来自本领域已知的任何数量的植物。此类植物包括但不限于玉米、拟南芥,以及普通小麦。在一些实施方式中,RKD4多肽编码序列来自普通小麦的RKD4。在一些实施方式中,RKD4多肽编码序列来自拟南芥的RKD4。在一些实施方式中,RKD4多肽编码序列来自玉米的RKD4。在一些实施方式中,RKD2多肽编码序列来自普通小麦的RKD2。在一些实施方式中,RKD2多肽编码序列来自拟南芥的RKD2。在一些实施方式中,RKD2多肽编码序列来自玉米的RKD2。

为了本发明的目的,以百分比表示的两个相关的核苷酸或氨基酸序列的“序列相同性”是指两个最佳比对序列中具有相同残基的位置数(×100)除以所比较的位置数。间隙,即比对中残基存在于一个序列中但不存在于另一个序列中的位置,视为具有不相同残基的位置。两个序列的比对通过Needleman和Wunsch算法(Needleman and Wunsch 1970)执行。上述计算机辅助序列比对可以使用标准软件程序方便地进行,例如在EuropeanMolecular Biology Open Software Suite(EMBOSS)中实现的程序NEEDLE,例如6.3.1.2版本(Trends in Genetics 16(6),276(2000)),其默认参数为:例如,蛋白质基质=EBLOSUM62,gapopen=10.0和gapextend=0.5。

如本文所用,术语“杂交”指的是通过互补核苷酸的碱基配对在两个核酸分子之间形成杂交体。术语“在严格条件下杂交”是指在特定条件下杂交。这种条件的一个实例包括在这样的条件下实质上互补的链即由具有至少80%互补性的核苷酸序列组成的链与指定的链杂交,而互补性较差的链不杂交的条件。或,这种条件是指钠盐浓度、温度和洗涤条件的特定杂交条件。作为一个实例,高度严格的条件包括在42℃,50%甲酰胺,5×SSC(150mMNaCl,15mM柠檬酸三钠),50mM磷酸钠,5×Denhardt溶液,10×硫酸葡聚糖,20mg/ml剪切鲑鱼精子DNA中孵育,以及在0.2×SSC中在约65℃洗涤(SSC代表0.15M氯化钠和0.015M柠檬酸三钠缓冲液)。或,高度严格的条件可能意味着在68℃,在0.25M磷酸钠中,pH 7.2,7%SDDS,1mM EDTA和1%BSA中杂交16小时,并用2×SSC和0.1%SDDS在68℃下洗涤2次。此外,高度严格的杂交条件例如为:在65℃下在4×SSC中杂交,然后在65℃下用0.1×SSC中多次洗涤共计约1小时,或在68℃下在0.25M磷酸钠、pH 7.2、7%SDS、1mM EDTA和1%BSA中杂交16小时,然后在68℃用2×SSC和0.1%SDS洗涤两次。

调控表观遗传的化学物质

调控表观遗传的化学物质,例如蛋白质脱乙酰酶抑制剂(ii.1),可以与基因组工程化组分共引入。根据本发明使用的示例性表观遗传调控化学物质包括但不限于组蛋白质脱乙酰酶抑制剂(HDACi),如曲古抑菌素A(trichostatin A,TSA)和DNA甲基转移酶抑制剂。

一般认为,共递送的表观遗传调控化学物质(ii.1)(特别是HDACi)使植物染色质结构放松,促进DNA对被轰击细胞中基因组工程化组分的可及性,从而促进基因组工程(即转化和基因组编辑)效率。不希望受理论束缚,遗传物质的基本结构和功能单位是核小体,在核小体中,带负电荷的DNA包裹在带正电荷的组蛋白八聚体和相关的连接组蛋白周围。核小体单元进一步折叠并组装成染色质(Andrews,A.J.,and Luger,K.(2011).Nucleosomestructure(s)and stability:Variations on a theme.Annu.Rev.Biophys.40:99-117.)。DNA的可及性很大程度上取决于核小体和染色质的致密性。染色质重塑酶动态地修饰组蛋白中的赖氨酸或其它氨基酸,从而导致改变它们的电荷以及与DNA和其它蛋白质的相互作用,且从而导致染色质折叠或展开(Bannister A.J.,Kouzarides T.(2011)Regulation ofchromatin by histone modifications.Cell Res 21:381-95.)。通过添加或去除乙酰基,组蛋白中赖氨酸残基的乙酰化和去乙酰化通常参与真核生物染色质结构的可逆调节,并介导染色质可及以及基因表达的调控。组蛋白脱乙酰酶(HDAC)是从组蛋白N端尾部上的赖氨酸残基移除乙酰基,以使组蛋白带更多正电荷,从而使组蛋白更紧密地包裹DNA的酶。抑制HDAC可能有助于染色质的展开,使DNA更容易接近。

染色质重塑和其它表观遗传修饰无疑在调控细胞全能性和再生中起到重要作用(Zhang,H.,and Ogas,J.(2009).An epigenetic perspective on developmentalregulation of seed genes.Mol.Plant 2:610-627.)。组蛋白脱乙酰酶(HDAC)活性的抑制已被证明与植物再生和小孢子胚形成有关(Miguel,C.,and Marum,L.,2011.Anepigenetic view of plant cells cultured in vitro:somaclonal variation andbeyond.J.Exp.Bot.62:3713-3725.,Li Hui et al.(2014)The Histone DeacetylaseInhibitor Trichostatin A Promotes Totipotency in the Male Gametophyte PlantCell,26:195-209.)。抑制HDAC活性或下游HDAC介导的途径在引发应激诱导的单倍体胚形成中起主要作用。一种这样的HDACi是曲古抑菌素A(TSA)。研究表明,TSA诱导甘蓝型油菜(B.napus)雄配子体中大量胚性细胞增殖。TSA处理导致培养的小孢子和花粉中孢子体细胞高频率分裂。

在存在一种或多种表观遗传调控化学物质(例如蛋白质脱乙酰酶抑制剂,尤其是HDACi)的情况下,可以使用多种方法来进一步提高基因组工程效率。这种HDACi可以是曲古抑菌素A(TSA)、N-羟基-7-(4-二甲氨基苯甲酰基)-氨基庚酰胺(M344)、辛二酰苯胺异羟肟酸(SAHA)等。这些HDACis选自针对锌依赖性HDAC的基于异羟肟酸的化学物质。

植物激素

在多个实施方式中,将一种或多种植物激素,例如生长素和细胞分裂素,如2,4-D,6-苄氨基嘌呤(6-BA)和玉米素(Zeatin),与编码RKD2或RKD4的核酸、基因组工程化组分和转基因中的一种或多种共递送。

植物体细胞能够通过体细胞胚形成或器官发生,在离体培养中恢复细胞分裂并再生为完整的植株,这在很大程度上依赖于植物激素,如生长素和细胞分裂素。

生长素之一是2,4-二氯苯氧乙酸(2,4-D),它对单子叶植物如玉米和小麦的体细胞胚形成和细胞再生几乎是不可或缺的。同时,细胞分裂素如6-苄氨基嘌呤(6-BA)或Zeatin,对植物器官发生和枝条分生组织的萌生和发育至关重要。提高基因组工程效率的方法可包括将一种或多种植物激素(2,4-D、6-BA、Zeatin等)与基因组工程化组分共递送。

可以将基因组工程化组分和至少一种表观遗传调控化学物质以及植物激素共同引入一个植物细胞中。

如本文所用,“共同递送”或“共递送”和“共同引入”或“共引入”可互换使用。就本发明而言,“共引入”是指将至少两种不同组分同时递送到同一植物细胞中的过程。因此,可以将基因组工程化组分和表观遗传调控化学物质和植物激素中的至少一种一起引入到同一植物细胞中。

可以通过粒子轰击、显微注射、农杆菌介导转化、电穿孔、农杆菌渗入法或真空渗入共引入植物细胞中。根据本发明,基于物理递送的方法,如粒子轰击、显微注射、电穿孔、纳米粒子和细胞穿透肽(CPP),对于共同引入编码RKD2或RKD4的核酸、基因组工程化组分和/或转基因是特别优选的。特别优选的是通过粒子轰击共同引入。

植物细胞再生为整株植物

根据本发明的另一方面,遗传修饰的植物细胞可以再生为完整的(可育的)植株。因此,在本发明的优选方面,在对植物细胞的遗传修饰之后进行再生植物的步骤。相应地,本发明提供了一种用于产生遗传修饰的植物的方法,包括以下步骤:

a)根据上述在植物细胞中进行遗传修饰的任何方法对植物细胞进行遗传修饰,和

b)从步骤a)的修饰过的植物细胞再生植物。

单个或多个细胞增殖并发育成组织、器官,最终发育成完整的植株。在一些实施方式中,所产生的植物不包含在步骤a)中引入或共同引入的任何基因组工程化组分、编码RKD2或RKD4的核酸。再生植物的步骤b)可以例如包括在再生培养基上培养来自步骤a)的遗传修饰的植物细胞。

通过向植物细胞中引入本文所述的任何编码RKD2或RKD4的核酸、重组基因和DNA构建体,可以提高植物再生的效率或增加植物细胞再生能力的效率。

遗传修饰的植物的产生

本发明还提供了通过上述用于产生遗传修饰的植物或其后代植物的方法获得或可获得的遗传修饰的植物。遗传修饰的植物可以包含本文所述的任何遗传修饰的植物细胞。

在多个实施方式中,所产生的植物不包含用于产生其而被引入或共同引入到植物细胞中的任何基因组工程化组分或编码RKD2或RKD4的核酸。

本发明还提供了未通过常规选择来源于上述遗传修饰的细胞的植物或种子。如本文所用,“常规选择”是指通过使用整合的选择标记,如抗生素(如卡那霉素(kanamycin)、潮霉素(hygromycin))或除草剂(如草丁膦、草甘膦)抗性基因,从野生型细胞中选择和纯化所转化的细胞的任何过程。如果没有常规的选择,这种植物或种子可能没有整合任何基因组工程化组分,因此导致不含转基因的遗传修饰的植物。

遗传修饰可以是植物细胞基因组中永久的、可遗传的变化。植物组织培养和基因组工程可以使用目前可用的方法进行,包括微粒轰击、农杆菌转化、电穿孔等。转化和转基因表达可以通过使用可见的报告基因来监测,例如,红色荧光tDTomato基因(tDT),其编码一种异常明亮的红色荧光蛋白,该荧光蛋白的最大激发在554nm处,最大发射在581nm处。基因组编辑效率可以通过下一代测序(NGS)、qPCR、标记毛细管电泳分析和Droplet DigitalPCR等方法进行分析。Sanger测序进一步证实了位点特异性修饰。

培养步骤

其中引入或共同引入编码RKD2或RKD4的核酸、基因组工程化组分和/或转基因的植物细胞,可在允许在一个或多个编码RKD2或RKD4的核酸和一个或多个转基因存在下,通过基因组工程化组分的活性对所述植物细胞基因组进行遗传修饰的条件下,进行培养。

如本文所用,“基因组的遗传修饰”包括任何类型的操作,以使得内源核苷酸改变以包括突变,例如删除、插入、转变、颠换或其组合。例如,可以删除内源性编码区。这种突变可能导致多肽具有与内源性多核苷酸编码的氨基酸序列不同的氨基酸序列。遗传修饰的另一个实例是调控序列如启动子的改变,从而导致可操作连接的内源性编码区表达的增加或减少。

“适合”进行植物基因组遗传修饰(例如多核苷酸的切割)的条件,或“适合”的条件是不阻止这种事件发生的条件。因此,这些条件允许、增强、促进和/或有利于该事件。根据各自的基因组工程组成(i),这些条件可能会有所不同。

在本发明的方法中,优选用基因组工程化组分(i)和至少一种化合物(ii)瞬时转化植物细胞。本文中所用的“瞬时转化”是指将外来物质[即核酸片段、蛋白质,核糖核蛋白(RNP)等]转移至宿主细胞中,从而在不整合和稳定遗传外来物质的情况下导致基因表达和/或活性。因此,基因组工程化组分(i)在植物细胞中为瞬时活性的和/或瞬时存在的。基因组工程化组分不是永久地结合到细胞基因组中,而是提供了导致基因组修饰的暂时作用。例如,植物细胞中基因组工程化组分的瞬时活性和/或瞬时存在可导致植物细胞基因组中的一个或多个双链断裂、植物细胞基因组中的一个或多个单链断裂、植物细胞基因组中的一个或多个碱基编辑事件、或植物细胞基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白类泛素化、组蛋白核糖化或组蛋白瓜氨酸化中的一种或多种。

在引入一个或多个双链断裂或一个或多个单链断裂之后,进行非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)对断裂进行同源定向修复。

植物细胞基因组中所产生的修饰例如可选自:转基因的插入,优选插入包含目的转基因的表达盒,至少一个核苷酸的替换,至少一个核苷酸的删除,至少一个核苷酸的插入,DNA甲基化的变化,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苯甲酰化、组蛋白核糖基化或组蛋白瓜氨酸化的变化,或其任何组合。根据本发明的一个特别优选的方面,没有与所用的基因编辑机器/系统相关的外源遗传物质被稳定地整合到植物细胞的基因组中。

遗传修饰可以是植物细胞基因组中永久的、可遗传的变化。

本发明的主旨还在于通过上述方法获得或可获得的植物细胞。因此,本发明的一个实施方式是通过上述在植物细胞中进行遗传修饰的方法获得或可获得的遗传修饰的植物细胞。与原始植物细胞相比,这些植物细胞中的遗传修饰例如可包括:转基因的插入,优选插入包含目的转基因的表达盒,至少一个核苷酸的替换,至少一个核苷酸的删除,至少一个核苷酸的插入,DNA甲基化的变化,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苯甲酰化、组蛋白核糖基化或组蛋白瓜氨酸化的变化,或其任何组合。优选地,遗传修饰的植物细胞不包含任何稳定整合到植物细胞基因组中的外源遗传物质。

遗传修饰的植物细胞可以是全株植物的一部分,也可以是该部分中的一部分。因此,本发明还涉及包含上述遗传修饰的植物细胞的植物或植物部分。

根据本发明的另一方面,遗传修饰的植物细胞可以再生为完整的(可育的)植物。因此,在本发明的优选方面,在对植物细胞遗传修饰之后进行再生植物的步骤。相应地,本发明提供了一种用于产生遗传修饰的植物的方法,包括以下步骤:

a)根据上述在植物细胞中进行遗传修饰的方法对植物细胞进行遗传修饰,和

b)从步骤a)的修饰过的植物细胞再生植物。

再生植物的步骤b)可以例如包括在再生培养基上培养来自步骤a)的遗传修饰的植物细胞。

再生技术依赖于在组织培养生长培养基中操纵某些植物激素,有时依赖于可以引入的杀生物剂和/或除草剂标记。再生可以从来自不同外植体的植物体细胞、愈伤组织细胞或胚胎细胞以及原生质体获得,外植体例如愈伤组织、未成熟或成熟的胚胎、叶、枝条、根、花、小孢子、胚胎组织、分生组织、器官或其任何部分。这种再生技术在Klee(1987)Ann.Rev.of Plant Phys.38:467-486中进行了一般性描述。从培养的原生质体进行植物再生描述于Evans et al.,Protoplasts Isolation and Culture,Handbook of Plant CellCulture,pp.124-176,Macmillan Publishing Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,pp.21-73,CRC Press,Boca Raton,1985中。为了从转化或基因编辑的细胞获得完整的植株,细胞可以在受控的环境条件下,在一系列含有营养物质和激素的培养基中生长,这一过程被称为组织培养。一旦整株植物生成并产生种子,就开始后代的评估。

本发明还提供了通过上述用于产生遗传修饰的植物或其后代植物的方法获得或可获得的遗传修饰的植物。

本发明的另一主旨在于源自上述遗传修饰的植物的植物细胞或种子。

本发明的又一主旨在于在没有进行基于标记基因的选择下,源自上述遗传修饰的细胞的植物、植物细胞或种子。如本文所用,“基于标记基因的选择”是指通过使用整合的选择标记(基因),例如抗生素抗性基因(例如卡那霉素抗性基因、潮霉素抗性基因)或除草剂抗性基因(例如草丁膦抗性基因、草甘膦抗性基因),从野生型细胞中选择、识别和/或纯化修饰的细胞,尤其是经转化、基因编辑或碱基编辑的细胞的任何过程。如果没有进行这种选择,这种植物、植物细胞或种子可能没有整合任何基因组工程化组分,从而可能产生(i)不含转基因的遗传修饰的植物或(ii)仅整合了目的转基因的修饰植物。

除非在实例中另有说明,所有的重组DNA技术都是根据标准方案进行的,如Sambrook et al.(1989)Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,NY和Ausubel et al.(1994)Current Protocolsin Molecular Biology,Current Protocols,USA的卷1和卷2中所述。植物分子工作的标准材料和方法描述于BIOS Scientific Publications Ltd(UK)和Blackwell ScientificPublications,UK联合出版的R.D.D.Cray的Plant Molecular Biology Labfax(1993)中。标准分子生物学技术的其它参考文献包括Sambrook and Russell(2001)MolecularCloning:A Laboratory Manual,Third Edition,Cold Spring Harbor LaboratoryPress,NY;Brown(1998)Molecular Biology LabFax,Second Edition,Academic Press(UK)的卷I和卷II。聚合酶链式反应的标准材料和方法可在Dieffenbach and Dveksler(1995)PCR Primer:A Laboratory Manual,Cold Spring Harbor Laboratory Press,以及in McPherson at al.(2000)PCR-Basics:From Background to Bench,First Edition,Springer Verlag,Germany中找到。

序列

本文提及或引用的所有专利、专利申请和出版物或公开(包括互联网上的出版物)均通过引用的方式整体并入本文。

实施例

通过以下实例进一步说明本发明。然而,应理解本发明不限于此类实例。在说明书中的任何地方使用这些和其它实例仅是说明性的,且不以任何方式限制本发明或任何示例性术语的范围和含义。同样,本发明不限于此处描述的任何特定优选的实施方式。事实上,本发明的许多修改和变化对于阅读本说明书的本领域技术人员是显而易见的,并且可以在不脱离本发明的精神或范围的情况下进行此类变化。因此,本发明仅由所附权利要求的条款以及这些权利要求的等同物的全部范围来限定。

实施例1.制备pZY ZZ-TOP,含有与发育基因和GUS报告基因可操作连接的双向启动子pOp6以及激活pOp6的地塞米松可诱导转录因子的质粒

生成了质粒(pZY ZZ-TOP),其带有化学(地塞米松,Dex)可诱导启动子系统(Zuo,J.,&Chua,N.H.(2000).Chemical-inducible systems for regulated expression ofplant genes.Current Opinion in Biotechnology,11(2),146-151.)。质粒的图谱如图1所示。质粒包含pOp6启动子(SEQ ID NO:15)。pOp6启动子是双向的,并且在暴露于地塞米松(Sigma-Aldrich.产品号#D4902-500MG)后,发育基因和GUS基因均表达(图1)。质粒还包含基因LhGR(DNA(SEQ ID NO:16和氨基酸(SEQ ID NO:17))。LhGR为组成型表达(例如pUbi1启动子+内含子)。LhGR是转录因子,其仅在地塞米松存在的情况下进入细胞核。进入细胞核后,LhGR激活pOp6。因此,pZY ZZ-TOP提供了地塞米松可诱导的GUS和发育基因的表达。

表达系统用于稳定转化。GUS染色用于鉴定没有化学诱导下的泄漏表达。在所有随后的实例中,只考虑没有化学诱导时不表达GUS基因的植物。不使用没有化学诱导时表达GUS的植物。

实施例2.转录因子用于通过体细胞胚形成诱导植物再生的能力的评估

在另一实例中,测试了五种不同转录因子经由体细胞胚形成诱导植物再生的效率。将AtLEC2(SEQ ID NO:6)、AtWUS(SEQ ID NO:8)、AtBBM(SEQ ID NO:10)、AtAGL15(SEQID NO:12)和AtRKD4(SEQ ID NO:1)的编码序列克隆到实例1的可诱导启动子系统pZY ZZ-TOP中。地塞米松可诱导AtLEC2、AtWUS、AtBBM、AtAGL15和AtRKD4中每一个的表达。

这些基于pOp6/LhGR反式激活系统的地塞米松可诱导二元构建体通过浸花法稳定地转化为拟南芥Col-0(Craft et al.(2005).New pOp/LhG4 vectors for stringentglucocorticoid-dependent transgene expression in Arabidopsis.The PlantJournal,41(6),899-918.)。拟南芥Col-0在受控环境条件下(16小时光照/8小时黑暗,22℃)生长在含有添加1%蔗糖的50%MS培养基的平板中。通过GUS染色检测40个独立的转基因株系的泄漏表达。

发芽后5~7天诱导非泄漏转化体。通过在含20μM地塞米松的培养板上培养7天进行基因表达的化学诱导,然后将植物转移到无诱导剂的培养基中。用Sudan Red 7B染色后通过显微成像测定体细胞胚的频率。

结果显示在图2中。RKD4具有暴露于地塞米松后形成的胚性结构的最高效率。

实施例3.在pOp6/LHGR反式激活系统中表达的RKD4具有促进地塞米松可诱导的体细胞胚形成的能力

在拟南芥中测试了控制RKD4的可诱导启动子系统的功能。拟南芥种子发芽直至形成初生根。然后将小植物转移到含Dex的平板上(如实施例2所述)。对小植物进行成像,数据如图3所示。在根(图3,左幅)、叶(图3,中幅)或两者(图3,右幅)中观察到体细胞胚形成。也可观察到叶绿素的损失。将体细胞胚结构移至无DEX培养基中后,体细胞胚结构又开始变绿。这些数据表明RKD4表达能够在缺乏激素的情况下诱导体细胞胚形成。

实施例4.在pOp6/LhGR反式激活系统中表达的AtRKD4可诱导园艺相关种类中的体细胞胚形成

如实施例1所述,使用根癌农杆菌GV3101和地塞米松可诱导AtRKD4二元构建体转化蝴蝶兰的园艺相关种类。将稳定转化的植物的叶的基部在含有含20μM地塞米松的50%MS培养基的平板中孵育两天,然后转移到不含地塞米松的培养基中。在移植后0、7和14天确定体细胞胚胎的存在,数据如图4所示。

实施例5.在pOp6/LhGR反式激活系统中表达的AtRKD4可诱导普通小麦的园艺相关种类中的体细胞胚形成

测定了诱导的RKD4在普通小麦的农业相关种类中表达的效果。用携带雌二醇可诱导TaRKD2(SEQ ID NO:3)二元构建体的Agrobacterium EHA105转化小麦未成熟胚(Valdivia et al.,2013)。授粉后12天从种子中分离出转化胚,并在含30μM的β-雌二醇的50%MS培养基中培养7天。在培养基中可观察到胚性结构的诱导(愈伤组织形成;图5,左幅)。将胚胎结构转移到无诱导剂的培养基中以诱导出体细胞胚。观察到绿变(图5,中幅),然后观察到出新叶(图5,右幅)。实施例证明了RKD4在农业相关种类中表达的效果。

实施例6.TaRKD2在大麦未成熟胚中的表达可诱导体细胞胚形成

在又一实例中,用携带雌二醇可诱导TaRKD2(SEQ ID NO:3)二元构建体的Agrobacterium EHA105转化大麦未成熟胚(Valdivia et al.,2013)。从种子中分离出转化的大麦不成熟胚,在含有30μM的β-雌二醇的50%MS培养基中生长7天(图6,左上幅),然后转移到无诱导剂的培养基中以诱导体细胞胚。从诱导培养基中去除胚性结构后,可观察到枝条和根发育(图6,右上幅)。随后,将这些结构移到光下,组织开始变绿(图6,左下幅)。初始未成熟胚分离后约60天,幼苗可形成(图6,右下幅)。

实施例7.RKD2和RKD4在玉米中的共表达

在玉米愈伤组织中可证明RKD4(来自拟南芥)和RKD2(来自小麦(SEQ ID NO:4))表达的益处。将两个序列克隆到实施例1所述的构建体中,并在组成型启动子(例如双35S启动子(SEQ ID NO:21)和泛素内含子(SEQ ID NO:20))存在下用红色荧光tdTomato基因(DNA:SEQ ID NO:18;氨基酸:SEQ ID NO:19)共轰击。暴露于地塞米松后,根据大量愈伤组织结构的形成和稳定tdTomato整合测量胚形成的诱导。33天后可观察到显示红色荧光的愈伤组织结构(图7,左幅为AtRKD4,右幅为TaRKD2)。结构来自于被两种构建体撞击的单个细胞,导致胚形成和红色荧光标记物的表达。

***

本发明的范围不受本文描述的特定实施方式的限制。实际上,除了本文所描述的之外,本发明的多种修改通过前述描述和附图对于本领域的技术人员将变得显而易见。此类修改意在落入所附权利要求书的范围内。还应理解,所有值都是近似值,且是为了描述而提供。

本申请通篇引用了专利、专利申请、出版物、产品描述和协议,出于所有目的,其公开通过引用的方式整体并入本文。

序列表

<110> 华威大学

<120> 用于提高基因组工程化效率的方法

<130> KWS0304US-P

<160> 23

<170> PatentIn version 3.5

<210> 1

<211> 771

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of AtRKD4 encoding SEQ ID NO: 2

<400> 1

atgagttcgt caaaacattc ctctgttttt aactattctg ctctgtttct atcactgttt 60

cttcaacaaa tggatcagaa ctctcttcat catctcgatt ctccaaaaat cgaaaacgag 120

tatgaaccag attcgttata cgacatgtta gataagttgc ctccgcttga ttctctccta 180

gatatggaag atttgaaacc aaatgcaggg ttgcactttc agttccatta caatagcttt 240

gaagatttct tcgaaaacat tgaagtggat aacacaattc catctgatat tcacttgttg 300

acacaagagc cctacttctc aagtgactcc tcttcctctt caccattggc tatccaaaac 360

gacggtctca tttccaacgt gaaagttgaa aaggtaacag ttaagaagaa gaggaacctt 420

aagaaaaaga ggcaagacaa attggagatg tctgagatca aacaattttt cgataggccg 480

atcatgaaag cggctaaaga actgaacgtg ggactcactg tgttgaagaa gcgatgcagg 540

gaattaggaa tttaccggtg gcctcaccgg aagctcaaga gtctaaactc tcttataaag 600

aatctcaaga atgttggaat ggaagaggaa gtgaagaact tggaggaaca taggtttctt 660

attgaacaag aacctgatgc agaactcagt gatggaacca agaagctaag gcaagcttgt 720

ttcaaagcca attataagag aagaaaatca cttggtgatg attattattg a 771

<210> 2

<211> 256

<212> PRT

<213> Arabidopsis thaliana

<400> 2

Met Ser Ser Ser Lys His Ser Ser Val Phe Asn Tyr Ser Ala Leu Phe

1 5 10 15

Leu Ser Leu Phe Leu Gln Gln Met Asp Gln Asn Ser Leu His His Leu

20 25 30

Asp Ser Pro Lys Ile Glu Asn Glu Tyr Glu Pro Asp Ser Leu Tyr Asp

35 40 45

Met Leu Asp Lys Leu Pro Pro Leu Asp Ser Leu Leu Asp Met Glu Asp

50 55 60

Leu Lys Pro Asn Ala Gly Leu His Phe Gln Phe His Tyr Asn Ser Phe

65 70 75 80

Glu Asp Phe Phe Glu Asn Ile Glu Val Asp Asn Thr Ile Pro Ser Asp

85 90 95

Ile His Leu Leu Thr Gln Glu Pro Tyr Phe Ser Ser Asp Ser Ser Ser

100 105 110

Ser Ser Pro Leu Ala Ile Gln Asn Asp Gly Leu Ile Ser Asn Val Lys

115 120 125

Val Glu Lys Val Thr Val Lys Lys Lys Arg Asn Leu Lys Lys Lys Arg

130 135 140

Gln Asp Lys Leu Glu Met Ser Glu Ile Lys Gln Phe Phe Asp Arg Pro

145 150 155 160

Ile Met Lys Ala Ala Lys Glu Leu Asn Val Gly Leu Thr Val Leu Lys

165 170 175

Lys Arg Cys Arg Glu Leu Gly Ile Tyr Arg Trp Pro His Arg Lys Leu

180 185 190

Lys Ser Leu Asn Ser Leu Ile Lys Asn Leu Lys Asn Val Gly Met Glu

195 200 205

Glu Glu Val Lys Asn Leu Glu Glu His Arg Phe Leu Ile Glu Gln Glu

210 215 220

Pro Asp Ala Glu Leu Ser Asp Gly Thr Lys Lys Leu Arg Gln Ala Cys

225 230 235 240

Phe Lys Ala Asn Tyr Lys Arg Arg Lys Ser Leu Gly Asp Asp Tyr Tyr

245 250 255

<210> 3

<211> 1104

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of TaRKD2 genotype 1 encoding SEQ ID NO: 5

<400> 3

atggagatgc aacaacaata cttcgggggg gacggcgatg cggactggtt ccatcaactc 60

gcattgcttc ccccacttcc aatctcatcg tctctccccc cactcccgat gtcagagggc 120

tcatgtctcc ctatggcagc agcagctgca gctgcactcc cccttggcga ttgctcgagc 180

gccctcatga tacgccctga ggaacagatg tcttgccttc caatgaaccc ctctccagcg 240

gtcgtcgacg atgtctactc ttcctacgca ccgaacaatg tcgacgtgtt gccgccattc 300

ccggcaggac ttgacgacgc tctgttgatg gagtcttttt ctgacatcga cctcgaggag 360

tttgctgacg catttggcca caagatcaag acagaacccc tcgacgatgc catggtcccc 420

gcggaccacg acttcgcggc tcaagcccaa caggcctgcc ctgtggtcat catgaatcag 480

caacaactca acgcacccag agacgtgcgc ctgctcattg acccggatga tgatgacagc 540

accgtggtgg ccgggggcta tgaagctgca gcggtggggt gcgccgagca gaaacaggtc 600

aggccagcac cacgtagggt gagaaagagc tcaggcggcg caagaccagc cgcgggagga 660

aagtccctcg atcacatcgg attcgaggaa ctcaggacct atttctatat gccaatcacc 720

aaggcagcga gggaaatgaa cgtggggctg acagtcctga agaagagatg ccgggaactg 780

ggggtggcgc gctggccaca cagaaagatg aagtctctga gaagcctgat cctcaacatt 840

caggagatgg ggaagggcgc aacatctccc gcagccgtgc agggggaact tgaagcgctt 900

gagaggtatt gcgccattat ggaggagaac ccggctatag agctcaccga gcaaacgaag 960

aagctcaggc aggcttgttt caaagagaat tataagcggc gtagagccgc cgcttctgtt 1020

aatcttctcg atcactgcta taacgatctg gcatctcatg agcagcaaat gcctctccca 1080

caaatgggat tctttggatt ttag 1104

<210> 4

<211> 1104

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of TaRKD2 genotype 2 encoding SEQ ID NO: 5

<400> 4

atggagatgc aacagcaata cttcggcggt gatggcgatg ctgactggtt ccaccagctc 60

gccttgctcc cgcctttgcc gatctcttcg tctctgccgc ctctccccat gagcgagggc 120

agctgcttac ccatggccgc cgccgccgcg gcggcgcttc ctcttgggga ttgctcatca 180

gctctcatga ttaggccgga agaacagatg agctgcctgc cgatgaaccc ttcgccagct 240

gttgtcgatg atgtgtacag cagctacgcc cccaacaatg tcgacgtcct cccgccgttt 300

cctgcaggtc tcgacgacgc gctgctcatg gagtccttca gcgatatcga cctggaggag 360

ttcgccgacg ccttcggcca caagattaag accgagcctc tcgacgacgc tatggtgccg 420

gcggatcacg atttcgcggc gcaagcgcaa caggcgtgcc cagtggtgat catgaaccag 480

cagcagctga atgcaccacg cgacgtgcgc ctgctcatag atcccgacga cgatgactca 540

actgtcgtcg ccgggggcta tgaggctgcg gccgttgggt gcgctgagca gaagcaggtg 600

aggccggcgc cacgtcgtgt gcgcaagagc agcggtgggg cacgcccagc cgccggtggg 660

aaaagcctcg atcacatagg gtttgaggag ctacgtacgt atttctacat gcctatcacc 720

aaggcggcgc gggagatgaa cgttggtctc accgtgctca agaagcgctg ccgagagctc 780

ggggtcgccc gctggcctca ccggaagatg aagagcctca ggtcactcat cctcaacatc 840

caggagatgg ggaagggcgc aacgtcgccg gcggctgtgc aaggggaact agaggcgctt 900

gagaggtatt gcgccataat ggaggagaac ccggcgatcg agctgactga gcagaccaag 960

aagctgcggc aggcctgctt taaggagaac tacaagagga ggagagcggc ggcctccgtc 1020

aacttgctcg accattgcta caacgacttg gccagtcatg agcagcagat gccattgcca 1080

cagatgggtt tctttgggtt ctaa 1104

<210> 5

<211> 367

<212> PRT

<213> Triticum aestivum

<400> 5

Met Glu Met Gln Gln Gln Tyr Phe Gly Gly Asp Gly Asp Ala Asp Trp

1 5 10 15

Phe His Gln Leu Ala Leu Leu Pro Pro Leu Pro Ile Ser Ser Ser Leu

20 25 30

Pro Pro Leu Pro Met Ser Glu Gly Ser Cys Leu Pro Met Ala Ala Ala

35 40 45

Ala Ala Ala Ala Leu Pro Leu Gly Asp Cys Ser Ser Ala Leu Met Ile

50 55 60

Arg Pro Glu Glu Gln Met Ser Cys Leu Pro Met Asn Pro Ser Pro Ala

65 70 75 80

Val Val Asp Asp Val Tyr Ser Ser Tyr Ala Pro Asn Asn Val Asp Val

85 90 95

Leu Pro Pro Phe Pro Ala Gly Leu Asp Asp Ala Leu Leu Met Glu Ser

100 105 110

Phe Ser Asp Ile Asp Leu Glu Glu Phe Ala Asp Ala Phe Gly His Lys

115 120 125

Ile Lys Thr Glu Pro Leu Asp Asp Ala Met Val Pro Ala Asp His Asp

130 135 140

Phe Ala Ala Gln Ala Gln Gln Ala Cys Pro Val Val Ile Met Asn Gln

145 150 155 160

Gln Gln Leu Asn Ala Pro Arg Asp Val Arg Leu Leu Ile Asp Pro Asp

165 170 175

Asp Asp Asp Ser Thr Val Val Ala Gly Gly Tyr Glu Ala Ala Ala Val

180 185 190

Gly Cys Ala Glu Gln Lys Gln Val Arg Pro Ala Pro Arg Arg Val Arg

195 200 205

Lys Ser Ser Gly Gly Ala Arg Pro Ala Ala Gly Gly Lys Ser Leu Asp

210 215 220

His Ile Gly Phe Glu Glu Leu Arg Thr Tyr Phe Tyr Met Pro Ile Thr

225 230 235 240

Lys Ala Ala Arg Glu Met Asn Val Gly Leu Thr Val Leu Lys Lys Arg

245 250 255

Cys Arg Glu Leu Gly Val Ala Arg Trp Pro His Arg Lys Met Lys Ser

260 265 270

Leu Arg Ser Leu Ile Leu Asn Ile Gln Glu Met Gly Lys Gly Ala Thr

275 280 285

Ser Pro Ala Ala Val Gln Gly Glu Leu Glu Ala Leu Glu Arg Tyr Cys

290 295 300

Ala Ile Met Glu Glu Asn Pro Ala Ile Glu Leu Thr Glu Gln Thr Lys

305 310 315 320

Lys Leu Arg Gln Ala Cys Phe Lys Glu Asn Tyr Lys Arg Arg Arg Ala

325 330 335

Ala Ala Ser Val Asn Leu Leu Asp His Cys Tyr Asn Asp Leu Ala Ser

340 345 350

His Glu Gln Gln Met Pro Leu Pro Gln Met Gly Phe Phe Gly Phe

355 360 365

<210> 6

<211> 1092

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of AtLEC2 encoding SEQ ID NO: 7

<400> 6

atggataact tcttaccctt tccctcttct aacgcaaact ctgtccaaga actctctatg 60

gatcctaaca acaatcgctc gcacttcaca acagtcccta cttatgatca tcatcaggct 120

cagcctcatc acttcttgcc tccgttttca tacccggtgg agcagatggc ggcggtgatg 180

aatcctcagc cggtttactt atcggagtgt tatcctcaga tcccggttac gcaaaccgga 240

agtgaattcg gttctctggt tggtaatcct tgtttgtggc aagagagagg tggttttctt 300

gatccgcgta tgacgaagat ggcaaggatc aacaggaaaa acgccatgat gagatcaaga 360

aacaactcta gccctaattc tagtccaagt gagttggttg attcaaagag acagctgatg 420

atgcttaact tgaaaaataa cgtgcagatc tccgacaaga aagatagcta ccaacagtcc 480

acatttgata acaagaagct tagggttttg tgtgagaagg aattgaagaa cagcgatgtt 540

gggtcactcg ggaggatagt tctaccaaag agagatgcag aagcaaatct tccgaagcta 600

tctgataaag aaggaatcgt tgtacagatg agagatgttt tctctatgca gtcttggtct 660

ttcaaataca agttttggtc caataacaag agcagaatgt atgtcctcga gaacacagga 720

gaatttgtga agcaaaatgg agctgagata ggagactttt taacaatata cgaggacgaa 780

agcaagaatc tctacttcgc catgaatgga aattcgggaa aacaaaatga aggaagagaa 840

aatgagtcga gggaaaggaa ccactacgaa gaggcaatgc ttgattacat accaagagac 900

gaagaggaag cttccattgc aatgctcatc ggaaatctaa acgatcacta tcccatccct 960

aacgatctca tggacctcac cactgacctt cagcaccatc aagccacgtc ctcatcaatg 1020

ccacctgagg atcacgcgta cgtgggttca tccgatgatc aggtgagctt taacgacttt 1080

gagtggtggt ga 1092

<210> 7

<211> 363

<212> PRT

<213> Arabidopsis thaliana

<400> 7

Met Asp Asn Phe Leu Pro Phe Pro Ser Ser Asn Ala Asn Ser Val Gln

1 5 10 15

Glu Leu Ser Met Asp Pro Asn Asn Asn Arg Ser His Phe Thr Thr Val

20 25 30

Pro Thr Tyr Asp His His Gln Ala Gln Pro His His Phe Leu Pro Pro

35 40 45

Phe Ser Tyr Pro Val Glu Gln Met Ala Ala Val Met Asn Pro Gln Pro

50 55 60

Val Tyr Leu Ser Glu Cys Tyr Pro Gln Ile Pro Val Thr Gln Thr Gly

65 70 75 80

Ser Glu Phe Gly Ser Leu Val Gly Asn Pro Cys Leu Trp Gln Glu Arg

85 90 95

Gly Gly Phe Leu Asp Pro Arg Met Thr Lys Met Ala Arg Ile Asn Arg

100 105 110

Lys Asn Ala Met Met Arg Ser Arg Asn Asn Ser Ser Pro Asn Ser Ser

115 120 125

Pro Ser Glu Leu Val Asp Ser Lys Arg Gln Leu Met Met Leu Asn Leu

130 135 140

Lys Asn Asn Val Gln Ile Ser Asp Lys Lys Asp Ser Tyr Gln Gln Ser

145 150 155 160

Thr Phe Asp Asn Lys Lys Leu Arg Val Leu Cys Glu Lys Glu Leu Lys

165 170 175

Asn Ser Asp Val Gly Ser Leu Gly Arg Ile Val Leu Pro Lys Arg Asp

180 185 190

Ala Glu Ala Asn Leu Pro Lys Leu Ser Asp Lys Glu Gly Ile Val Val

195 200 205

Gln Met Arg Asp Val Phe Ser Met Gln Ser Trp Ser Phe Lys Tyr Lys

210 215 220

Phe Trp Ser Asn Asn Lys Ser Arg Met Tyr Val Leu Glu Asn Thr Gly

225 230 235 240

Glu Phe Val Lys Gln Asn Gly Ala Glu Ile Gly Asp Phe Leu Thr Ile

245 250 255

Tyr Glu Asp Glu Ser Lys Asn Leu Tyr Phe Ala Met Asn Gly Asn Ser

260 265 270

Gly Lys Gln Asn Glu Gly Arg Glu Asn Glu Ser Arg Glu Arg Asn His

275 280 285

Tyr Glu Glu Ala Met Leu Asp Tyr Ile Pro Arg Asp Glu Glu Glu Ala

290 295 300

Ser Ile Ala Met Leu Ile Gly Asn Leu Asn Asp His Tyr Pro Ile Pro

305 310 315 320

Asn Asp Leu Met Asp Leu Thr Thr Asp Leu Gln His His Gln Ala Thr

325 330 335

Ser Ser Ser Met Pro Pro Glu Asp His Ala Tyr Val Gly Ser Ser Asp

340 345 350

Asp Gln Val Ser Phe Asn Asp Phe Glu Trp Trp

355 360

<210> 8

<211> 879

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of AtWUS encoding SEQ ID NO: 9

<400> 8

atggagccgc cacagcatca gcatcatcat catcaagccg accaagaaag cggcaacaac 60

aacaacaaca agtccggctc tggtggttac acgtgtcgcc agaccagcac gaggtggaca 120

ccgacgacgg agcaaatcaa aatcctcaaa gaactttact acaacaatgc aatccggtca 180

ccaacagccg atcagatcca gaagatcact gcaaggctga gacagttcgg aaagattgag 240

ggcaagaacg tcttttactg gttccagaac cataaggctc gtgagcgtca gaagaagaga 300

ttcaacggaa caaacatgac cacaccatct tcatcaccca actcggttat gatggcggct 360

aacgatcatt atcatcctct acttcaccat catcacggtg ttcccatgca gagacctgct 420

aattccgtca acgttaaact taaccaagac catcatctct atcatcataa caagccatat 480

cccagcttca ataacgggaa tttaaatcat gcaagctcag gtactgaatg tggtgttgtt 540

aatgcttcta atggctacat gagtagccat gtctatggat ctatggaaca agactgttct 600

atgaattaca acaacgtagg tggaggatgg gcaaacatgg atcatcatta ctcatctgca 660

ccttacaact tcttcgatag agcaaagcct ctgtttggtc tagaaggtca tcaagaagaa 720

gaagaatgtg gtggcgatgc ttatctggaa catcgacgta cgcttcctct cttccctatg 780

cacggtgaag atcacatcaa cggtggtagt ggtgccatct ggaagtatgg ccaatcggaa 840

gttcgccctt gcgcttctct tgagctacgt ctgaactag 879

<210> 9

<211> 292

<212> PRT

<213> Arabidopsis thaliana

<400> 9

Met Glu Pro Pro Gln His Gln His His His His Gln Ala Asp Gln Glu

1 5 10 15

Ser Gly Asn Asn Asn Asn Asn Lys Ser Gly Ser Gly Gly Tyr Thr Cys

20 25 30

Arg Gln Thr Ser Thr Arg Trp Thr Pro Thr Thr Glu Gln Ile Lys Ile

35 40 45

Leu Lys Glu Leu Tyr Tyr Asn Asn Ala Ile Arg Ser Pro Thr Ala Asp

50 55 60

Gln Ile Gln Lys Ile Thr Ala Arg Leu Arg Gln Phe Gly Lys Ile Glu

65 70 75 80

Gly Lys Asn Val Phe Tyr Trp Phe Gln Asn His Lys Ala Arg Glu Arg

85 90 95

Gln Lys Lys Arg Phe Asn Gly Thr Asn Met Thr Thr Pro Ser Ser Ser

100 105 110

Pro Asn Ser Val Met Met Ala Ala Asn Asp His Tyr His Pro Leu Leu

115 120 125

His His His His Gly Val Pro Met Gln Arg Pro Ala Asn Ser Val Asn

130 135 140

Val Lys Leu Asn Gln Asp His His Leu Tyr His His Asn Lys Pro Tyr

145 150 155 160

Pro Ser Phe Asn Asn Gly Asn Leu Asn His Ala Ser Ser Gly Thr Glu

165 170 175

Cys Gly Val Val Asn Ala Ser Asn Gly Tyr Met Ser Ser His Val Tyr

180 185 190

Gly Ser Met Glu Gln Asp Cys Ser Met Asn Tyr Asn Asn Val Gly Gly

195 200 205

Gly Trp Ala Asn Met Asp His His Tyr Ser Ser Ala Pro Tyr Asn Phe

210 215 220

Phe Asp Arg Ala Lys Pro Leu Phe Gly Leu Glu Gly His Gln Glu Glu

225 230 235 240

Glu Glu Cys Gly Gly Asp Ala Tyr Leu Glu His Arg Arg Thr Leu Pro

245 250 255

Leu Phe Pro Met His Gly Glu Asp His Ile Asn Gly Gly Ser Gly Ala

260 265 270

Ile Trp Lys Tyr Gly Gln Ser Glu Val Arg Pro Cys Ala Ser Leu Glu

275 280 285

Leu Arg Leu Asn

290

<210> 10

<211> 1755

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of AtBBM encoding SEQ ID NO: 11

<400> 10

atgaactcga tgaataactg gttaggcttc tctctctctc ctcatgatca aaatcatcac 60

cgtacggatg ttgactcctc caccaccaga accgccgtag atgttgccgg agggtactgt 120

tttgatctgg ccgctccctc cgatgaatct tctgccgttc aaacatcttt tctttctcct 180

ttcggtgtca ccctcgaagc tttcaccaga gacaataata gtcactcccg agattgggac 240

atcaatggtg gtgcatgcaa taacattaac aataacgaac aaaatggacc aaagcttgag 300

aatttcctcg gccgcaccac cacgatttac aataccaacg agaccgttgt agatggaaat 360

ggcgattgtg gaggaggaga cggtggtggt ggcggctcac taggcctttc gatgataaaa 420

acatggctga gtaatcattc ggttgctaat gctaatcatc aagacaatgg taacggtgca 480

cgaggcttgt ccctctctat gaattcatct actagtgata gcaacaacta caacaacaat 540

gatgatgtcg tccaagagaa gactattgtt gatgtcgtag aaactacacc gaagaaaact 600

attgagagtt ttggacaaag gacgtctata taccgcggtg ttacaaggca tcggtggaca 660

ggtagatacg aggcacattt atgggacaat agttgcaaaa gagaaggcca gactcgcaaa 720

ggaagacaag tttatctggg aggttatgac aaagaagaaa aagcagctag ggcttacgat 780

ttagccgcac taaagtattg gggaaccacc actactacta acttcccctt gagtgaatat 840

gagaaagagg tagaagagat gaagcacatg acgaggcaag agtatgttgc ctctctgcgc 900

aggaaaagta gtggtttctc tcgtggtgca tcgatttatc gaggagtaac aaggcatcac 960

caacatggaa ggtggcaagc taggatcgga agagtcgccg gtaacaaaga cctctacttg 1020

ggaactttcg gcacacagga agaggctgct gaggcttatg acattgcagc cattaaattc 1080

agaggattaa gcgcagtgac taacttcgac atgaacagat acaatgttaa agcaatcctc 1140

gagagcccga gtctacctat tggtagttct gcgaaacgtc tcaaggacgt taataatccg 1200

gttccagcta tgatgattag taataacgtt tcagagagtg caaataatgt tagcggttgg 1260

caaaacactg cgtttcagca tcatcaggga atggatttga gcttattgca gcaacagcag 1320

gagaggtacg ttggttatta caatggagga aacttgtcta ccgagagtac tagggtttgt 1380

ttcaaacaag aggaggaaca acaacacttc ttgagaaact cgccgagtca catgactaat 1440

gttgatcatc atagctcgac ctctgatgat tctgttaccg tttgtggaaa tgttgttagt 1500

tatggtggtt atcaaggatt cgcaatccct gttggaacat cggttaatta cgatcccttt 1560

actgctgctg agattgctta caacgcaaga aatcattatt actatgctca gcatcagcaa 1620

caacagcaga ttcagcagtc gccgggagga gattttccgg tggcgatttc gaataaccat 1680

agctctaaca tgtactttca cggggaaggt ggtggagaag gggctccaac gttttcagtt 1740

tggaacgaca cttag 1755

<210> 11

<211> 584

<212> PRT

<213> Arabidopsis thaliana

<400> 11

Met Asn Ser Met Asn Asn Trp Leu Gly Phe Ser Leu Ser Pro His Asp

1 5 10 15

Gln Asn His His Arg Thr Asp Val Asp Ser Ser Thr Thr Arg Thr Ala

20 25 30

Val Asp Val Ala Gly Gly Tyr Cys Phe Asp Leu Ala Ala Pro Ser Asp

35 40 45

Glu Ser Ser Ala Val Gln Thr Ser Phe Leu Ser Pro Phe Gly Val Thr

50 55 60

Leu Glu Ala Phe Thr Arg Asp Asn Asn Ser His Ser Arg Asp Trp Asp

65 70 75 80

Ile Asn Gly Gly Ala Cys Asn Asn Ile Asn Asn Asn Glu Gln Asn Gly

85 90 95

Pro Lys Leu Glu Asn Phe Leu Gly Arg Thr Thr Thr Ile Tyr Asn Thr

100 105 110

Asn Glu Thr Val Val Asp Gly Asn Gly Asp Cys Gly Gly Gly Asp Gly

115 120 125

Gly Gly Gly Gly Ser Leu Gly Leu Ser Met Ile Lys Thr Trp Leu Ser

130 135 140

Asn His Ser Val Ala Asn Ala Asn His Gln Asp Asn Gly Asn Gly Ala

145 150 155 160

Arg Gly Leu Ser Leu Ser Met Asn Ser Ser Thr Ser Asp Ser Asn Asn

165 170 175

Tyr Asn Asn Asn Asp Asp Val Val Gln Glu Lys Thr Ile Val Asp Val

180 185 190

Val Glu Thr Thr Pro Lys Lys Thr Ile Glu Ser Phe Gly Gln Arg Thr

195 200 205

Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu

210 215 220

Ala His Leu Trp Asp Asn Ser Cys Lys Arg Glu Gly Gln Thr Arg Lys

225 230 235 240

Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala

245 250 255

Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Thr Thr Thr

260 265 270

Thr Asn Phe Pro Leu Ser Glu Tyr Glu Lys Glu Val Glu Glu Met Lys

275 280 285

His Met Thr Arg Gln Glu Tyr Val Ala Ser Leu Arg Arg Lys Ser Ser

290 295 300

Gly Phe Ser Arg Gly Ala Ser Ile Tyr Arg Gly Val Thr Arg His His

305 310 315 320

Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys

325 330 335

Asp Leu Tyr Leu Gly Thr Phe Gly Thr Gln Glu Glu Ala Ala Glu Ala

340 345 350

Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Ser Ala Val Thr Asn

355 360 365

Phe Asp Met Asn Arg Tyr Asn Val Lys Ala Ile Leu Glu Ser Pro Ser

370 375 380

Leu Pro Ile Gly Ser Ser Ala Lys Arg Leu Lys Asp Val Asn Asn Pro

385 390 395 400

Val Pro Ala Met Met Ile Ser Asn Asn Val Ser Glu Ser Ala Asn Asn

405 410 415

Val Ser Gly Trp Gln Asn Thr Ala Phe Gln His His Gln Gly Met Asp

420 425 430

Leu Ser Leu Leu Gln Gln Gln Gln Glu Arg Tyr Val Gly Tyr Tyr Asn

435 440 445

Gly Gly Asn Leu Ser Thr Glu Ser Thr Arg Val Cys Phe Lys Gln Glu

450 455 460

Glu Glu Gln Gln His Phe Leu Arg Asn Ser Pro Ser His Met Thr Asn

465 470 475 480

Val Asp His His Ser Ser Thr Ser Asp Asp Ser Val Thr Val Cys Gly

485 490 495

Asn Val Val Ser Tyr Gly Gly Tyr Gln Gly Phe Ala Ile Pro Val Gly

500 505 510

Thr Ser Val Asn Tyr Asp Pro Phe Thr Ala Ala Glu Ile Ala Tyr Asn

515 520 525

Ala Arg Asn His Tyr Tyr Tyr Ala Gln His Gln Gln Gln Gln Gln Ile

530 535 540

Gln Gln Ser Pro Gly Gly Asp Phe Pro Val Ala Ile Ser Asn Asn His

545 550 555 560

Ser Ser Asn Met Tyr Phe His Gly Glu Gly Gly Gly Glu Gly Ala Pro

565 570 575

Thr Phe Ser Val Trp Asn Asp Thr

580

<210> 12

<211> 807

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of AtAGL15 encoding SEQ ID NO: 13

<400> 12

atgggtcgtg gaaaaatcga gataaagagg atcgagaatg cgaatagcag acaagtcact 60

ttttccaaga ggcgttctgg gttacttaag aaagctcgtg agctctctgt tctttgtgat 120

gctgaagttg ctgtcatcgt cttctctaag tctggcaagc tcttcgagta ctccagtact 180

ggaatgaagc aaacactttc cagatacggt aatcaccaga gttcttcagc ttctaaagca 240

gaggaggatt gtgcagaggt ggatatttta aaggatcaac tttcaaagct tcaagagaaa 300

catttacaac tgcagggcaa gggcttgaat cctctgacct ttaaagagct gcaaagcctt 360

gagcagcaac tatatcatgc attgattact gtcagagagc gaaaggaacg attgctgact 420

aaccaacttg aagaatcacg cctcaaggaa caacgagcag agttggaaaa cgagaccttg 480

cgtagacagg ttcaagaact gaggagcttt ctcccgtcgt tcacccacta tgttccatcc 540

tacatcaaat gctttgctat agatccaaag aacgctctca taaaccacga cagtaaatgc 600

agcctccaga acaccgattc agacacaact ttgcaattag ggttgccggg agaggcacat 660

gatagaagga cgaatgaagg agaaagagag agcccgtcaa gcgattcagt gacaacaaac 720

acgagcagcg aaactgcaga aagaggggat cagtctagtt tagcaaattc tccacctgaa 780

gccaaaagac aaaggttctc tgtttag 807

<210> 13

<211> 268

<212> PRT

<213> Arabidopsis thaliana

<400> 13

Met Gly Arg Gly Lys Ile Glu Ile Lys Arg Ile Glu Asn Ala Asn Ser

1 5 10 15

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala

20 25 30

Arg Glu Leu Ser Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe

35 40 45

Ser Lys Ser Gly Lys Leu Phe Glu Tyr Ser Ser Thr Gly Met Lys Gln

50 55 60

Thr Leu Ser Arg Tyr Gly Asn His Gln Ser Ser Ser Ala Ser Lys Ala

65 70 75 80

Glu Glu Asp Cys Ala Glu Val Asp Ile Leu Lys Asp Gln Leu Ser Lys

85 90 95

Leu Gln Glu Lys His Leu Gln Leu Gln Gly Lys Gly Leu Asn Pro Leu

100 105 110

Thr Phe Lys Glu Leu Gln Ser Leu Glu Gln Gln Leu Tyr His Ala Leu

115 120 125

Ile Thr Val Arg Glu Arg Lys Glu Arg Leu Leu Thr Asn Gln Leu Glu

130 135 140

Glu Ser Arg Leu Lys Glu Gln Arg Ala Glu Leu Glu Asn Glu Thr Leu

145 150 155 160

Arg Arg Gln Val Gln Glu Leu Arg Ser Phe Leu Pro Ser Phe Thr His

165 170 175

Tyr Val Pro Ser Tyr Ile Lys Cys Phe Ala Ile Asp Pro Lys Asn Ala

180 185 190

Leu Ile Asn His Asp Ser Lys Cys Ser Leu Gln Asn Thr Asp Ser Asp

195 200 205

Thr Thr Leu Gln Leu Gly Leu Pro Gly Glu Ala His Asp Arg Arg Thr

210 215 220

Asn Glu Gly Glu Arg Glu Ser Pro Ser Ser Asp Ser Val Thr Thr Asn

225 230 235 240

Thr Ser Ser Glu Thr Ala Glu Arg Gly Asp Gln Ser Ser Leu Ala Asn

245 250 255

Ser Pro Pro Glu Ala Lys Arg Gln Arg Phe Ser Val

260 265

<210> 14

<211> 16296

<212> DNA

<213> Artificial Sequence

<220>

<223> plasmid pERV1-hygro carrying TaRKD2 as CDS

<400> 14

ggtttacccg ccaatatatc ctgtcaaaca ctgatagttt aaaccgaagg cgggaaacga 60

caatctgatc gggtaccggg cccaagatct ggcccttaag gccttactag gctgcagtgc 120

agcgtgaccc ggtcgtgccc ctctctagag ataatgagca ttgcatgtct aagttataaa 180

aaattaccac atattttttt tgtcacactt gtttgaagtg cagtttatct atctttatac 240

atatatttaa actttactct acgaataata taatctatag tactacaata atatcagtgt 300

tttagagaat catataaatg aacagttaga catggtctaa aggacaattg agtattttga 360

caacaggact ctacagtttt atctttttag tgtgcatgtg ttctcctttt tttttgcaaa 420

tagcttcacc tatataatac ttcatccatt ttattagtac atccatttag ggtttagggt 480

taatggtttt tatagactaa tttttttagt acatctattt tattctattt tagcctctaa 540

attaagaaaa ctaaaactct attttagttt ttttatttaa taatttagat ataaaataga 600

ataaaataaa gtgactaaaa attaaacaaa taccctttaa gaaattaaaa aaactaagga 660

aacatttttc ttgtttcgag tagataatgc cagcctgtta aacgccgtcg atcgacgagt 720

ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 780

cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 840

ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 900

gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 960

ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc 1020

caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt 1080

cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccctct ctaccttctc 1140

tagatcggcg ttccggtcca tggttagggc ccggtagttc tacttctgtt catgtttgtg 1200

ttagatccgt gtttgtgtta gatccgtgct gctagcgttc gtacacggat gcgacctgta 1260

cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat cctgggatgg 1320

ctctagccgt tccgcagacg ggatcgatct aggataggta tacatgttga tgtgggtttt 1380

actgatgcat atacatgatg gcatatgcag catctattca tatgctctaa ccttgagtac 1440

ctatctatta taataaacaa gtatgtttta taattatttt gatcttgata tacttggatg 1500

atggcatatg cagcagctat atgtggattt ttttagccct gccttcatac gctatttatt 1560

tgcttggtac tgtttctttt gtcgatgctc accctgttgt ttggtgttac ttctgcaggt 1620

actagtattc cgggcggaat gaaagcgtta acggccaggc aacaagaggt gtttgatctc 1680

atccgtgatc acatcagcca gacaggtatg ccgccgacgc gtgcggaaat cgcgcagcgt 1740

ttggggttcc gttccccaaa cgcggctgaa gaacatctga aggcgctggc acgcaaaggc 1800

gttattgaaa ttgtttccgg cgcatcacgc gggattcgtc tgttgcagga agaggaagaa 1860

gggttgccgc tggtaggtcg tgtggctgcc ggtgaaccgt cgagcgcccc cccgaccgat 1920

gtcagcctgg gggacgagct ccacttagac ggcgaggacg tggcgatggc gcatgccgac 1980

gcgctagacg atttcgatct ggacatgttg ggggacgggg attccccggg tccgggattt 2040

accccccacg actccgcccc ctacggcgct ctggatatgg ccgacttcga gtttgagcag 2100

atgtttaccg atgcccttgg aattgacgag tacggtgggg atccgtctgc tggagacatg 2160

agagctgcca acctttggcc aagcccgctc atgatcaaac gctctaagaa gaacagcctg 2220

gccttgtccc tgacggccga ccagatggtc agtgccttgt tggatgctga gccccccata 2280

ctctattccg agtatgatcc taccagaccc ttcagtgaag cttcgatgat gggcttactg 2340

accaacctgg cagacaggga gctggttcac atgatcaact gggcgaagag ggtgccaggc 2400

tttgtggatt tgaccctcca tgatcaggtc caccttctag aatgtgcctg gctagagatc 2460

ctgatgattg gtctcgtctg gcgctccatg gagcacccag ggaagctact gtttgctcct 2520

aacttgctct tggacaggaa ccagggaaaa tgtgtagagg gcatggtgga gatcttcgac 2580

atgctgctgg ctacatcatc tcggttccgc atgatgaatc tgcagggaga ggagtttgtg 2640

tgcctcaaat ctattatttt gcttaattct ggagtgtaca catttctgtc cagcaccctg 2700

aagtctctgg aagagaagga ccatatccac cgagtcctgg acaagatcac agacactttg 2760

atccacctga tggccaaggc aggcctgacc ctgcagcagc agcaccagcg gctggcccag 2820

ctcctcctca tcctctccca catcaggcac atgagtaaca aaggcatgga gcatctgtac 2880

agcatgaagt gcaagaacgt ggtgcccctc tatgacctgc tgctggagat gctggacgcc 2940

caccgcctac atgcgcccac tagccgtgga ggggcatccg tggaggagac ggaccaaagc 3000

cacttggcca ctgcgggctc tacttcatcg cattccttgc aaaagtatta catcacgggg 3060

gaggcagagg gtttccctgc cacagtctga gagctccctg gcggaattcc cagagatgtt 3120

agctgaaatc atcactaatc agataccaaa atattcaaat ggaaatatca aaaagcttct 3180

gtttcatcaa aaatgactcg acctaactga gtaagctagc ttgttcgagt attatggcat 3240

tgggaaaact gtttttcttg taccatttgt tgtgcttgta atttactgtg ttttttattc 3300

ggttttcgct atcgaactgt gaaatggaaa tggatggaga agagttaatg aatgatatgg 3360

tccttttgtt cattctcaaa ttaatattat ttgttttttc tcttatttgt tgtgtgttga 3420

atttgaaatt ataagagata tgcaaacatt ttgttttgag taaaaatgtg tcaaatcgtg 3480

gcctctaatg accgaagtta atatgaggag taaaacacta gatccccaaa caagcttgga 3540

aactgaaggc gctcgagtta ctagatcggg gaattgatcc cccctcgaca gcttgcatgc 3600

cgcttgggct gcaggtcgag gctaaaaaac taatcgcatt atcatcccct cgacgtactg 3660

tacatataac cactggtttt atatacagca gtactgtaca tataaccact ggttttatat 3720

acagcagtcg acgtactgta catataacca ctggttttat atacagcagt actgtacata 3780

taaccactgg ttttatatac agcagtcgag gtaagattag atatggatat gtatatggat 3840

atgtatatgg tggtaatgcc atgtaatatg ctcgactcta ggatcttcgc aagacccttc 3900

ctctatataa ggaagttcat ttcatttgga gaggacacgc tgaagctagt cgactctagc 3960

ctccctaggc tgccggacga cgagctcctc ccccctcccc ctccgccgcc gccgcgccgg 4020

taaccacccc gcccctctcc tctttctttc tccgtttttt tttccgtctc ggtctcgatc 4080

tttggccttg gtagtttggg tgggcgagag gcggcttcgt gcgcgcccag atcggtgcgc 4140

gggaggggcg ggatctcgcg gctggggctc tcgccggcgt ggatccggcc cggatctcgc 4200

ggggaatggg gctctcggat gtagatctgc gatccgccgt tgttggggga gatgatgggg 4260

ggtttaaaat ttccgccatg ctaaacaaga tcaggaagag gggaaaaggg cactatggtt 4320

tatattttta tatatttctg ctgcttcgtc aggcttagat gtgctagatc ttcttctttc 4380

tttcttcttt ttgtgggtag aatttgaatc cctcagcatt gttcatcggt agtttttctt 4440

ttcatgattt gtgacaaatg cagcctcgtg cggagctttt ttgtaggcgc gggctgcagg 4500

aattcaagct tacgcgtgtc atcacaagtt tgtacaaaaa agcaggctat ggagatgcaa 4560

caacaatact tcggggggga cggcgatgcg gactggttcc atcaactcgc attgcttccc 4620

ccacttccaa tctcatcgtc tctcccccca ctcccgatgt cagagggctc atgtctccct 4680

atggcagcag cagctgcagc tgcactcccc cttggcgatt gctcgagcgc cctcatgata 4740

cgccctgagg aacagatgtc ttgccttcca atgaacccct ctccagcggt cgtcgacgat 4800

gtctactctt cctacgcacc gaacaatgtc gacgtgttgc cgccattccc ggcaggactt 4860

gacgacgctc tgttgatgga gtctttttct gacatcgacc tcgaggagtt tgctgacgca 4920

tttggccaca agatcaagac agaacccctc gacgatgcca tggtccccgc ggaccacgac 4980

ttcgcggctc aagcccaaca ggcctgccct gtggtcatca tgaatcagca acaactcaac 5040

gcacccagag acgtgcgcct gctcattgac ccggatgatg atgacagcac cgtggtggcc 5100

gggggctatg aagctgcagc ggtggggtgc gccgagcaga aacaggtcag gccagcacca 5160

cgtagggtga gaaagagctc aggcggcgca agaccagccg cgggaggaaa gtccctcgat 5220

cacatcggat tcgaggaact caggacctat ttctatatgc caatcaccaa ggcagcgagg 5280

gaaatgaacg tggggctgac agtcctgaag aagagatgcc gggaactggg ggtggcgcgc 5340

tggccacaca gaaagatgaa gtctctgaga agcctgatcc tcaacattca ggagatgggg 5400

aagggcgcaa catctcccgc agccgtgcag ggggaacttg aagcgcttga gaggtattgc 5460

gccattatgg aggagaaccc ggctatagag ctcaccgagc aaacgaagaa gctcaggcag 5520

gcttgtttca aagagaatta taagcggcgt agagccgccg cttctgttaa tcttctcgat 5580

cactgctata acgatctggc atctcatgag cagcaaatgc ctctcccaca aatgggattc 5640

tttggatttt agacccagct ttcttgtaca aagtggtgat gactcgaatt tccccgatcg 5700

ttcaaacatt tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat 5760

tatcatataa tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac 5820

gttatttatg agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat 5880

agaaaacaaa atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt 5940

actagatcgc tcgacgcggc cgccatggcc tctagtggat cagcttgcat gcctgcaggt 6000

cactggattt tggttttagg aattagaaat tttattgata gaagtatttt acaaatacaa 6060

atacatacta agggtttctt atatgctcaa cacatgagcg aaaccctata agaaccctaa 6120

ttcccttatc tgggaactac tcacacatta ttctggagaa aaatagagag agatagattt 6180

gtagagagag actggtgatt tttgcggact ccggtcggca tctactctat tcctttgccc 6240

tcggacgagt gctggggcgt cggtttccac tatcggcgag tacttctaca cagccatcgg 6300

tccagacggc cgcgcttctg cgggcgattt gtgtacgccc gacagtcccg gctccggatc 6360

ggacgattgc gtcgcatcga ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca 6420

agctctgata gagttggtca agaccaatgc ggagcatata cgcccggagc cgcggcgatc 6480

ctgcaagctc cggatgcctc cgctcgaagt agcgcgtctg ctgctccata caagccaacc 6540

acggcctcca gaagaagatg ttggcgacct cgtattggga atccccgaac atcgcctcgc 6600

tccagtcaat gaccgctgtt atgcggccat tgtccgtcag gacattgttg gagccgaaat 6660

ccgcgtgcac gaggtgccgg acttcggggc agtcctcggc ccaaagcatc agctcatcga 6720

gagcctgcgc gacggacgca ctgacggtgt cgtccatcac agtttgccag tgatacacat 6780

ggggatcagc aatcgcgcat atgaaatcac gccatgtagt gtattgaccg attccttgcg 6840

gtccgaatgg gccgaacccg ctcgtctggc taagatcggc cgcagcgatc gcatccatgg 6900

cctccgcgac cggctgcaga acagcgggca gttcggtttc aggcaggtct tgcaacgtga 6960

caccctgtgc acggcgggag atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa 7020

gcacttccgg aatcgggagc gcggccgatg caaagtgccg ataaacataa cgatctttgt 7080

agaaaccatc ggcgcagcta tttacccgca ggacatatcc acgccctcct acatcgaagc 7140

tgaaagcacg agattcttcg ccctccgaga gctgcatcag gtcggagacg ctgtcgaact 7200

tttcgatcag aaacttctcg acagacgtcg cggtgagttc aggctttttc atatcttatt 7260

gccccccggg gccctcgacc tgcagaagta acaccaaaca acagggtgag catcgacaaa 7320

agaaacagta ccaagcaaat aaatagcgta tgaaggcagg gctaaaaaaa tccacatata 7380

gctgctgcat atgccatcat ccaagtatat caagatcaaa ataattataa aacatacttg 7440

tttattataa tagataggta ctcaaggtta gagcatatga atagatgctg catatgccat 7500

catgtatatg catcagtaaa acccacatca acatgtatac ctatcctaga tcgatcccgt 7560

ctgcggaacg gctagagcca tcccaggatt ccccaaagag aaacactggc aagttagcaa 7620

tcagaacgtg tctgacgtac aggtcgcatc cgtgtacgaa cgctagcagc acggatctaa 7680

cacaaacacg gatctaacac aaacatgaac agaagtagaa ctaccgggcc ctaaccatgg 7740

accggaacgc cgatctagag aaggtagaga gggggggggg gggaggacga gcggcgtacc 7800

ttgaagcgga ggtgccgacg ggtggatttg ggggagatct ggttgtgtgt gtgtgcgctc 7860

cgaacaacac gaggttgggg aaagagggtg tggagggggt gtctatttat tacggcgggc 7920

gaggaaggga aagcgaagga gcggtgggaa aggaatcccc cgtagctgcc ggtgccgtga 7980

gaggaggagg aggccgcctg ccgtgccggc tcacgtctgc cgctccgcca cgcaatttct 8040

ggatgccgac agcggagcaa gtccaacggt ggagcggaac tctcgagagg ggtccagagg 8100

cagcgacaga gatgccgtgc cgtctgcttc gcttggcccg acgcgacgct gctggttcgc 8160

tggttggtgt ccgttagact cgtcgatcga cggcgtttaa caggctggca ttatctactc 8220

gaaacaagaa aaatgtttcc ttagtttttt taatttctta aagggtattt gtttaatttt 8280

tagtcacttt attttattct attttatatc taaattatta aataaaaaaa ctaaaataga 8340

gttttagttt tcttaattta gaggctaaaa tagaataaaa tagatgtact aaaaaaatta 8400

gtctataaaa accattaacc ctaaacccta aatggatgta ctaataaaat ggatgaagta 8460

ttatataggt gaagctattt gcaaaaaaaa aggagaacac atgcacacta aaaagataaa 8520

actgtagagt cctgttgtca aaatactcaa ttgtccttta gaccatgtct aactgttcat 8580

ttatatgatt ctctaaaaca ctgatattat tgtagtacta tagattatat tattcgtaga 8640

gtaaagttta aatatatgta taaagataga taaactgcac ttcaaacaag tgtgacaaaa 8700

aaaatatgtg gtaatttttt ataacttaga catgcaatgc tcattatctc tagagagggg 8760

cacgaccggg tcacgctgca ctgcagacta ctagagccga tcgtgaagtt tctcatctaa 8820

gcccccattt ggacgtgaat gtagacacgt cgaaataaag atttccgaat tagaataatt 8880

tgtttattgc tttcgcctat aaatacgacg gatcgtaatt tgtcgtttta tcaaaatgta 8940

ctttcatttt ataataacgc tgcggacatc tacatttttg aattgaaaaa aaattggtaa 9000

ttactctttc tttttctcca tattgaccat catactcatt gctgatccat gtagatttcc 9060

cggacatgaa gccatttaca attgaatata tcctgccgcc gctgccgctt tgcacccggt 9120

ggagcttgca tgttggtttc tacgcagaac tgagccggtt aggcagataa tttccattga 9180

gaactgagcc atgtgcacct tccccccaac acggtgagcg acggggcaac ggagtgatcc 9240

acatgggact tttaaacatc atccgtcgga tggcgttgcg agagaagcag tcgatccgtg 9300

agatcagccg acgcaccggg caggcgcgca acacgatcgc aaagtatttg aacgcaggta 9360

caatcgagcc gacgttcacg cggaacgacc aagcaagcta tgttgcgatt acttcgccaa 9420

ctattgcgat aacaagaaaa agccagcctt tcatgatata tctcccaatt tgtgtagggc 9480

ttattatgca cgcttaaaaa taataaaagc agacttgacc tgatagtttg gctgtgagca 9540

attatgtgct tagtgcatct aacgcttgag ttaagccgcg ccgcgaagcg gcgtcggctt 9600

gaacgaattg ttagacatta tttgccgact accttggtga tctcgccttt cacgtagtgg 9660

acaaattctt ccaactgatc tgcgcgcgag gccaagcgat cttcttcttg tccaagataa 9720

gcctgtctag cttcaagtat gacgggctga tactgggccg gcaggcgctc cattgcccag 9780

tcggcagcga catccttcgg cgcgattttg ccggttactg cgctgtacca aatgcgggac 9840

aacgtaagca ctacatttcg ctcatcgcca gcccagtcgg gcggcgagtt ccatagcgtt 9900

aaggtttcat ttagcgcctc aaatagatcc tgttcaggaa ccggatcaaa gagttcctcc 9960

gccgctggac ctaccaaggc aacgctatgt tctcttgctt ttgtcagcaa gatagccaga 10020

tcaatgtcga tcgtggctgg ctcgaagata cctgcaagaa tgtcattgcg ctgccattct 10080

ccaaattgca gttcgcgctt agctggataa cgccacggaa tgatgtcgtc gtgcacaaca 10140

atggtgactt ctacagcgcg gagaatctcg ctctctccag gggaagccga agtttccaaa 10200

aggtcgttga tcaaagctcg ccgcgttgtt tcatcaagcc ttacggtcac cgtaaccagc 10260

aaatcaatat cactgtgtgg cttcaggccg ccatccactg cggagccgta caaatgtacg 10320

gccagcaacg tcggttcgag atggcgctcg atgacgccaa ctacctctga tagttgagtc 10380

gatacttcgg cgatcaccgc ttccctcatg atgtttaact ttgttttagg gcgactgccc 10440

tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct 10500

tgctgcttgg atgcccgagg catagactgt accccaaaaa aacagtcata acaagccatg 10560

aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt 10620

gagcgcatac gctacttgca ttacagctta cgaaccgaac aggcttatgt ccactgggtt 10680

cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc 10740

gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag 10800

gcatacccac cggtgccttg atgtgggcgc cggcggtcga gtggcgacgg cgcggcttgt 10860

ccgcgccctg gtagattgcc tggccgtagg ccagccattt ttgagcggcc agcggccgcg 10920

ataggccgac gcgaagcggc ggggcgtagg gagcgcagcg accgaagggt aggcgctttt 10980

tgcagctctt cggctgtgcg ctggccagac agttatgcac aggccaggcg ggttttaaga 11040

gttttaataa gttttaaaga gttttaggcg gaaaaatcgc cttttttctc ttttatatca 11100

gtcacttaca tgtgtgaccg gttcccaatg tacggctttg ggttcccaat gtacgggttc 11160

cggttcccaa tgtacggctt tgggttccca atgtacgtgc tatccacagg aaagagacct 11220

tttcgacctt tttcccctgc tagggcaatt tgccctagca tctgctccgt acattaggaa 11280

ccggcggatg cttcgccctc gatcaggttg cggtagcgca tgactaggat cgggccagcc 11340

tgccccgcct cctccttcaa atcgtactcc ggcaggtcat ttgacccgat cagcttgcgc 11400

acggtgaaac agaacttctt gaactctccg gcgctgccac tgcgttcgta gatcgtcttg 11460

aacaaccatc tggcttctgc cttgcctgcg gcgcggcgtg ccaggcggta gagaaaacgg 11520

ccgatgccgg gatcgatcaa aaagtaatcg gggtgaaccg tcagcacgtc cgggttcttg 11580

ccttctgtga tctcgcggta catccaatca gctagctcga tctcgatgta ctccggccgc 11640

ccggtttcgc tctttacgat cttgtagcgg ctaatcaagg cttcaccctc ggataccgtc 11700

accaggcggc cgttcttggc cttcttcgta cgctgcatgg caacgtgcgt ggtgtttaac 11760

cgaatgcagg tttctaccag gtcgtctttc tgctttccgc catcggctcg ccggcagaac 11820

ttgagtacgt ccgcaacgtg tggacggaac acgcggccgg gcttgtctcc cttcccttcc 11880

cggtatcggt tcatggattc ggttagatgg gaaaccgcca tcagtaccag gtcgtaatcc 11940

cacacactcg ccatgccggc cggccctgcg gaaacctcta cgtgcccgtc tggaagctcg 12000

tagcggatca cctcgccagc tcgtcggtca cgcttcgaca gacggaaaac ggccacgtcc 12060

atgatgctgc gactatcgcg ggtgcccacg tcatagagca tcggaacgaa aaaatctggt 12120

tgctcgtcgc ccttgggcgg cttcctaatc gacggcgcac cggctgccgg cggttgccgg 12180

gattctttgc ggattcgatc agcggccgct tgccacgatt caccggggcg tgcttctgcc 12240

tcgatgcgtt gccgctgggc ggcctgcgcc gccttcaact tctccaccag gtcatcaccc 12300

agcgccgcgc cgatttgtac cgggccggat ggtttgcgac cgctcacgcc gattcctcgg 12360

gcttgggggt tccagtgcca ttgcagggcc ggcagacaac ccagccgctt acgcctggcc 12420

aaccgcccgt tcctccacac atggggcatt ccacggcgtc ggtgcctggt tgttcttgat 12480

tttccatgcc gcctccttta gccgctaaaa ttcatctact catttattca tttgctcatt 12540

tactctggta gctgcgcgat gtattcagat agcagctcgg taatggtctt gccttggcgt 12600

accgcgtaca tcttcagctt ggtgtgatcc tccgccggca actgaaagtt gacccgcttc 12660

atggctggcg tgtctgccag gctggccaac gttgcagcct tgctgctgcg tgcgctcgga 12720

cggccggcac ttagcgtgtt tgtgcttttg ctcattttct ctttacctca ttaactcaaa 12780

tgagttttga tttaatttca gcggccagcg cctggacctc gcgggcagcg tcgccctcgg 12840

gttctgattc aagaacggtt gtgccggcgg cggcagtgcc tgggtagctc acgcgctgcg 12900

tgatacggga ctcaagaatg ggcagctcgt acccggccag cgcctcggca acctcaccgc 12960

cgatgcgcgt gcctttgatc gcccgcgaca cgacaaaggc cgcttgtagc cttccatccg 13020

tgacctcaat gcgctgctta accagctcca ccaggtcggc ggtggcccat atgtcgtaag 13080

ggcttggctg caccggaatc agcacgaagt cggctgcctt gatcgcggac acagccaagt 13140

ccgccgcctg gggcgctccg tcgatcacta cgaagtcgcg ccggccgatg gccttcacgt 13200

cgcggtcaat cgtcgggcgg tcgatgccga caacggttag cggttgatct tcccgcacgg 13260

ccgcccaatc gcgggcactg ccctggggat cggaatcgac taacagaaca tcggccccgg 13320

cgagttgcag ggcgcgggct agatgggttg cgatggtcgt cttgcctgac ccgcctttct 13380

ggttaagtac agcgataacc ttcatgcgtt ccccttgcgt atttgtttat ttactcatcg 13440

catcatatac gcagcgaccg catgacgcaa gctgttttac tcaaatacac atcacctttt 13500

tagacggcgg cgctcggttt cttcagcggc caagctcgcc ggccaggccg cgagcttggc 13560

atcagacaaa ccggccagga tttcatgcag ccgcacggtt gagacgtgcg cgggcggctc 13620

gaacacgtac ccggccgcga tcatctccgc ctcgatctct tcggtaatga aaaacggttc 13680

gtcctggccg tcctggtgcg gtttcatgct tgttcctctt ggcgttcatt ctcggcggcc 13740

gccagggcgt cggcctcggt caatgcgtcc tcacggaagg caccgcgccg cctggcctcg 13800

gtgggcgtca cttcctcgct gcgctcaagt gcgcggtaca gggtcgagcg atgcacgcca 13860

agcagtgcag ccgcctcttt cacggtgcgg ccttcctggt cgatcagctc gcgggcgtgc 13920

gcgatctgtg ccggggtgag ggtagggcgg gggccaaact tcacgcctcg cgccttggcg 13980

gcctcgcgcc cgctccgggt gcggtcgatg attagggaac gctcgaactc ggcaatgccg 14040

gcgaacacgg tcaacaccat gcggccggcc ggcgtggtgg tgtcggccca cggctctgcc 14100

aggctacgca ggcccgcgcc ggcctcctgg atgcgctcgg caatgtccag taggtcgcgg 14160

gtgctgcggg ccaggcggtc tagcctggtc actgtcacaa cgtcgccagg gcgtaggtgg 14220

tcaagcatcc tggccagctc cgggcggtcg cgcctggtgc cggtgatctt ctcggaaaac 14280

agcttggtgc agccggccgc gtgcagttcg gcccgttggt tggtcaagtc ctggtcgtcg 14340

gtgctgacgc gggcatagcc cagcaggcca gcggcggcgc tcttgttcat ggcgtaatgt 14400

ctccggttct agtcgcaagt attctacttt atgcgactaa aacacgcgac aagaaaacgc 14460

caggaaaagg gcagggcggc agcctgtcgc gtaacttagg acttgtgcga catgtcgttt 14520

tcagaagacg gctgcactga acgtcagaag ccgactgcac tatagcagcg gaggggttgg 14580

atcgacctcg acgtacccct gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca 14640

catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 14700

ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc gcagccatga cccagtcacg 14760

tagcgatagc ggagtgtata ctggcttaac tatgcggcat cagagcagat tgtactgaga 14820

gtgcaccata tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 14880

cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 14940

gtatcagctc actcaaaggc ggtaatcggt tatccacaga atcaggggat aacgcaggaa 15000

agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 15060

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 15120

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 15180

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 15240

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 15300

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 15360

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 15420

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 15480

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 15540

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 15600

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 15660

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 15720

tggtcatgag attatcaaaa aggatcttca cctagatcct tttcggcgtc cacatcaacg 15780

gcgtcggcgg cgactgccca ggcaagaccg agatgcaccg cgatatcttg ctgcgttcgg 15840

atattttcgt ggagttcccg ccacagaccc ggattgaagg cgagatccag caactcgcgc 15900

cagatcatcc tgtgacggaa ctttggcgcg tgatgactgg ccaggacgtc ggccgaaaga 15960

gcgacaagca gatcacgctt ttcgacagcg tcggatttgc gatcgaggat ttttcggcgc 16020

tgcgctacgt ccgcgaccgc gttgagggat caagccacag cagcccactc gaccttctag 16080

ccgacccaga cgagccaagg gatctttttg gaatgctgct ccgtcgtcag gctttccgac 16140

gtttgggtgg ttgaacagaa gtcattatcg cacggaatgc caagcactcc cgaggggaac 16200

cctgtggttg gcatgcacat acaaatggac gaacggataa accttttcac gcccttttaa 16260

atatccgatt attctaataa acgctctttt ctctta 16296

<210> 15

<211> 707

<212> DNA

<213> Artificial Sequence

<220>

<223> W pOp6 W promoter

<400> 15

ctagctgtag ttgtagaatg taaaatgtaa tgttgttgtt gtttgttgtt gttgttggta 60

attgttgtaa aaatacgcgc gtctagcttc agcgtgtcct ctccaaatga aatgaacttc 120

cttatataga ggaagggtct tgcgaagatc gatccactag tctttcaatt gtgagcgctc 180

acaattcttt ctcttccctt tcttctttct agtctagtct ttcaattgtg agcgctcaca 240

attctttctc ttccctttct tctttctagt ctagtctttc aattgtgagc gctcacaatt 300

ctttctcttc cctttcttct ttctagtcta gtctttcaat tgtgagcgct cacaattctt 360

tctcttccct ttcttctttc tagtctagtc tttcaattgt gagcgctcac aattctttct 420

cttccctttc ttctttctag tctagtcttt caattgtgag cgctcacaat tctttctctt 480

ccctttcttc tttctagtct ttcaattgtg agcgctcaca attctttctc ttccctttct 540

tctttctagc tccaccgcgg tggcggccgg ccgctctagt ggatcgatct tcgcaagacc 600

cttcctctat ataaggaagt tcatttcatt tggagaggac acgctgaagc tagacgcgcg 660

tatttttaca acaattacca acaacaacaa caaacaacaa caacatt 707

<210> 16

<211> 2226

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of LhGR encoding SEQ ID NO: 17

<400> 16

atggctagtg aagctcgaaa aacaaagaaa aaaatcaaag ggattcagca agccactgca 60

ggagtctcac aagacacttc ggaaaatcct aacaaaacaa tagttcctgc agcattacca 120

cagctcaccc ctaccttggt gtcactgctg gaggtgattg aacccgaggt gttgtatgca 180

ggatatgata gctctgttcc agattcagca tggagaatta tgaccacact caacatgtta 240

ggtgggcgtc aagtgattgc agcagtgaaa tgggcaaagg cgataccagg cttcagaaac 300

ttacacctgg atgaccaaat gaccctgcta cagtactcat ggatgtttct catggcattt 360

gccctgggtt ggagatcata cagacaatca agtggaaacc tgctctgctt tgctcctgat 420

ctgattatta atgagcagag aatgtctcta ccctgcatgt atgaccaatg taaacacatg 480

ctgttcgtct cctctgagct ccagcgattg caggtatcct atgaagagta tctctgtatg 540

aaaaccttac tgcttctctc ctcagttcct aaggaaggtc tgaagagcca agagttattt 600

gatgagattc gaatgactta tatcaaagag ctaggaaaag ccatcgtcaa aagggaaggg 660

aactccagtc agaactggca acggttttac caactgacaa agcttctgga ctccatgcat 720

gaggtggttg agaatctcct tacctactgc ttccagacat ttttggataa gaccatgagt 780

attgaattcc cagagatgtt agctgaaatc atcactaatc agataccaaa gtactcaaac 840

ggtaatatca agaagcttct gtttcatcaa aaatctacta gcaaaccggt aacgttatac 900

gacgtcgctg aatacgccgg cgtttctcat caaaccgttt ctagagtggt taaccaggct 960

tcacatgtta gcgctaaaac ccgggaaaaa gttgaagctg ccatggctga gctcaactac 1020

atcccgaacc gtgttgcgca gcagctggct ggtaaacaaa gcttgctgat cggtgtcgcg 1080

acctcgagct tggccctgca cgcgccgtcg caaattgtcg cggcgattaa atctcgcgcc 1140

gatcaactgg gtgccagcgt ggtggtgtcg atggtagaac gaagcggcgt cgaagcctgt 1200

aaagcggcgg tgcacaatct tctcgcgcaa cgcgtcagtg ggctgatcat taactatccg 1260

ctggatgacc aggatgccat tgctgtggaa gctgcctgca ctaatgttcc ggcgttattt 1320

cttgatgtct ctgaccagac acccatcaac agtattattt tctcccatga agacggtacg 1380

cgactgggcg tggagcatct ggtcgcattg ggtcaccagc aaatcgcgct gttagcgggc 1440

ccattaagtt ctgtctcggc gcgtctgcgt ctggctggct ggcataaata tctcactcgc 1500

aatcaaattc agccgatagc ggaacgggaa ggcgactgga gtgccatgtc cggttttcaa 1560

caaaccatgc aaatgctgaa tgagggcatc gttcccactg cgatgctggt tgccaacgat 1620

cagatggcgc tgggcgcaat gcgcgccatt accgagtccg ggctgcgcgt tggtgcggat 1680

atctcggtag tgggatacga cgataccgaa gacagctcat gttatatccc gccgttaacc 1740

accatcaaac aggattttcg cctgctgggg caaaccagcg tggaccgctt gctgcaactc 1800

tctcagggcc aggcggtgaa gggcaatcag ctgttgcccg tctcactggt gaaaagaaaa 1860

accactagtg gatcggaatt cgccaatttt aatcaaagtg ggaatattgc tgatagctca 1920

ttgtccttca ctttcactaa cagtagcaac ggtccgaacc tcataacaac tcaaacaaat 1980

tctcaagcgc tttcacaacc aattgcctcc tctaacgttc atgataactt catgaataat 2040

gaaatcacgg ctagtaaaat tgatgatggt aataattcaa aaccactgtc acctggttgg 2100

acggaccaaa ctgcgtataa cgcgtttgga atcactacag ggatgtttaa taccactaca 2160

atggatgatg tatataacta tctattcgat gatgaagata ccccaccaaa cccaaaaaaa 2220

gagtaa 2226

<210> 17

<211> 741

<212> PRT

<213> Artificial Sequence

<220>

<223> LhGR protein

<400> 17

Met Ala Ser Glu Ala Arg Lys Thr Lys Lys Lys Ile Lys Gly Ile Gln

1 5 10 15

Gln Ala Thr Ala Gly Val Ser Gln Asp Thr Ser Glu Asn Pro Asn Lys

20 25 30

Thr Ile Val Pro Ala Ala Leu Pro Gln Leu Thr Pro Thr Leu Val Ser

35 40 45

Leu Leu Glu Val Ile Glu Pro Glu Val Leu Tyr Ala Gly Tyr Asp Ser

50 55 60

Ser Val Pro Asp Ser Ala Trp Arg Ile Met Thr Thr Leu Asn Met Leu

65 70 75 80

Gly Gly Arg Gln Val Ile Ala Ala Val Lys Trp Ala Lys Ala Ile Pro

85 90 95

Gly Phe Arg Asn Leu His Leu Asp Asp Gln Met Thr Leu Leu Gln Tyr

100 105 110

Ser Trp Met Phe Leu Met Ala Phe Ala Leu Gly Trp Arg Ser Tyr Arg

115 120 125

Gln Ser Ser Gly Asn Leu Leu Cys Phe Ala Pro Asp Leu Ile Ile Asn

130 135 140

Glu Gln Arg Met Ser Leu Pro Cys Met Tyr Asp Gln Cys Lys His Met

145 150 155 160

Leu Phe Val Ser Ser Glu Leu Gln Arg Leu Gln Val Ser Tyr Glu Glu

165 170 175

Tyr Leu Cys Met Lys Thr Leu Leu Leu Leu Ser Ser Val Pro Lys Glu

180 185 190

Gly Leu Lys Ser Gln Glu Leu Phe Asp Glu Ile Arg Met Thr Tyr Ile

195 200 205

Lys Glu Leu Gly Lys Ala Ile Val Lys Arg Glu Gly Asn Ser Ser Gln

210 215 220

Asn Trp Gln Arg Phe Tyr Gln Leu Thr Lys Leu Leu Asp Ser Met His

225 230 235 240

Glu Val Val Glu Asn Leu Leu Thr Tyr Cys Phe Gln Thr Phe Leu Asp

245 250 255

Lys Thr Met Ser Ile Glu Phe Pro Glu Met Leu Ala Glu Ile Ile Thr

260 265 270

Asn Gln Ile Pro Lys Tyr Ser Asn Gly Asn Ile Lys Lys Leu Leu Phe

275 280 285

His Gln Lys Ser Thr Ser Lys Pro Val Thr Leu Tyr Asp Val Ala Glu

290 295 300

Tyr Ala Gly Val Ser His Gln Thr Val Ser Arg Val Val Asn Gln Ala

305 310 315 320

Ser His Val Ser Ala Lys Thr Arg Glu Lys Val Glu Ala Ala Met Ala

325 330 335

Glu Leu Asn Tyr Ile Pro Asn Arg Val Ala Gln Gln Leu Ala Gly Lys

340 345 350

Gln Ser Leu Leu Ile Gly Val Ala Thr Ser Ser Leu Ala Leu His Ala

355 360 365

Pro Ser Gln Ile Val Ala Ala Ile Lys Ser Arg Ala Asp Gln Leu Gly

370 375 380

Ala Ser Val Val Val Ser Met Val Glu Arg Ser Gly Val Glu Ala Cys

385 390 395 400

Lys Ala Ala Val His Asn Leu Leu Ala Gln Arg Val Ser Gly Leu Ile

405 410 415

Ile Asn Tyr Pro Leu Asp Asp Gln Asp Ala Ile Ala Val Glu Ala Ala

420 425 430

Cys Thr Asn Val Pro Ala Leu Phe Leu Asp Val Ser Asp Gln Thr Pro

435 440 445

Ile Asn Ser Ile Ile Phe Ser His Glu Asp Gly Thr Arg Leu Gly Val

450 455 460

Glu His Leu Val Ala Leu Gly His Gln Gln Ile Ala Leu Leu Ala Gly

465 470 475 480

Pro Leu Ser Ser Val Ser Ala Arg Leu Arg Leu Ala Gly Trp His Lys

485 490 495

Tyr Leu Thr Arg Asn Gln Ile Gln Pro Ile Ala Glu Arg Glu Gly Asp

500 505 510

Trp Ser Ala Met Ser Gly Phe Gln Gln Thr Met Gln Met Leu Asn Glu

515 520 525

Gly Ile Val Pro Thr Ala Met Leu Val Ala Asn Asp Gln Met Ala Leu

530 535 540

Gly Ala Met Arg Ala Ile Thr Glu Ser Gly Leu Arg Val Gly Ala Asp

545 550 555 560

Ile Ser Val Val Gly Tyr Asp Asp Thr Glu Asp Ser Ser Cys Tyr Ile

565 570 575

Pro Pro Leu Thr Thr Ile Lys Gln Asp Phe Arg Leu Leu Gly Gln Thr

580 585 590

Ser Val Asp Arg Leu Leu Gln Leu Ser Gln Gly Gln Ala Val Lys Gly

595 600 605

Asn Gln Leu Leu Pro Val Ser Leu Val Lys Arg Lys Thr Thr Ser Gly

610 615 620

Ser Glu Phe Ala Asn Phe Asn Gln Ser Gly Asn Ile Ala Asp Ser Ser

625 630 635 640

Leu Ser Phe Thr Phe Thr Asn Ser Ser Asn Gly Pro Asn Leu Ile Thr

645 650 655

Thr Gln Thr Asn Ser Gln Ala Leu Ser Gln Pro Ile Ala Ser Ser Asn

660 665 670

Val His Asp Asn Phe Met Asn Asn Glu Ile Thr Ala Ser Lys Ile Asp

675 680 685

Asp Gly Asn Asn Ser Lys Pro Leu Ser Pro Gly Trp Thr Asp Gln Thr

690 695 700

Ala Tyr Asn Ala Phe Gly Ile Thr Thr Gly Met Phe Asn Thr Thr Thr

705 710 715 720

Met Asp Asp Val Tyr Asn Tyr Leu Phe Asp Asp Glu Asp Thr Pro Pro

725 730 735

Asn Pro Lys Lys Glu

740

<210> 18

<211> 717

<212> DNA

<213> Artificial Sequence

<220>

<223> cDNA of tdTomato encoding SEQ ID NO: 19

<400> 18

atggtgagca agggcgagga ggtcatcaaa gagttcatgc gcttcaaggt gcgcatggag 60

ggctccatga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120

ggcacccaga ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180

atcctgtccc cccagttcat gtacggctcc aaggcgtacg tgaagcaccc cgccgacatc 240

cccgattaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300

gaggacggcg gtctggtgac cgtgacccag gactcctccc tgcaggacgg cacgctgatc 360

tacaaggtga agatgcgcgg caccaacttc ccccccgacg gccccgtaat gcagaagaag 420

accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480

gagatccacc aggccctgaa gctgaaggac ggcggccact acctggtgga gttcaagacc 540

atctacatgg ccaagaagcc cgtgcaactg cccggctact actacgtgga caccaagctg 600

gacatcacct cccacaacga ggactacacc atcgtggaac agtacgagcg ctccgagggc 660

cgccaccacc tgttcctgta cggcatggac gagctgtaca agtctagagg tacctga 717

<210> 19

<211> 238

<212> PRT

<213> Artificial Sequence

<220>

<223> tdTomato protein

<400> 19

Met Val Ser Lys Gly Glu Glu Val Ile Lys Glu Phe Met Arg Phe Lys

1 5 10 15

Val Arg Met Glu Gly Ser Met Asn Gly His Glu Phe Glu Ile Glu Gly

20 25 30

Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys

35 40 45

Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro

50 55 60

Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile

65 70 75 80

Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg

85 90 95

Val Met Asn Phe Glu Asp Gly Gly Leu Val Thr Val Thr Gln Asp Ser

100 105 110

Ser Leu Gln Asp Gly Thr Leu Ile Tyr Lys Val Lys Met Arg Gly Thr

115 120 125

Asn Phe Pro Pro Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp

130 135 140

Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly

145 150 155 160

Glu Ile His Gln Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val

165 170 175

Glu Phe Lys Thr Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly

180 185 190

Tyr Tyr Tyr Val Asp Thr Lys Leu Asp Ile Thr Ser His Asn Glu Asp

195 200 205

Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ser Glu Gly Arg His His Leu

210 215 220

Phe Leu Tyr Gly Met Asp Glu Leu Tyr Lys Ser Arg Gly Thr

225 230 235

<210> 20

<211> 515

<212> DNA

<213> Artificial Sequence

<220>

<223> Ubiquitin intron

<400> 20

cgccgctcgt cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat 60

ggttagggcc cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag 120

atccgtgctg ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc 180

taacttgcca gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg 240

gatcgatcta ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg 300

catatgcagc atctattcat atgctctaac cttgagtacc tatctattat aataaacaag 360

tatgttttat aattattttg atcttgatat acttggatga tggcatatgc agcagctata 420

tgtggatttt tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg 480

tcgatgctca ccctgttgtt tggtgttact tctgc 515

<210> 21

<211> 693

<212> DNA

<213> Artificial Sequence

<220>

<223> double 35S promoter

<400> 21

gtctcagaag accaaagggc tattgagact tttcaacaaa gggtaatatc gggaaacctc 60

ctcggattcc attgcccagc tatctgtcac ttgatcaaaa ggacagtaga aaaggaaggt 120

ggcacctaca aatgccatca ttgcgataaa ggaaaggcta tcgttcaaga tgcctctgcc 180

gacagtggtc ccaaagatgg acccccaccc acgaggagca tcgtggaaaa agaagacgtt 240

ccaaccacgt cttcaaagca agtgaattga tgtgataaca tggtggagca cgacactctc 300

gtctactcca agaatatcaa agatacagtc tcagaagacc aaagggctat tgagactttt 360

caacaaaggg taatatcggg aaacctcctc ggattccatt gcccagctat cggtcacttg 420

atcaaaagga cagtagaaaa ggaaggtggc acctacaaat gccatcattg cgataaagga 480

aaggctatcg ttcaagatgc ctctgccgac agtggtccca aagatggacc cccacccacg 540

aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt ggattgatgt 600

gatatctcca ctgacgtaag ggatgacgca caatcccact atccttcgca agacccttcc 660

tctatataag gaagttcatt tcatttggag agg 693

<210> 22

<211> 4075

<212> DNA

<213> Artificial Sequence

<220>

<223> XVE/OLexA promoter system

<400> 22

ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 60

gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 120

agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 180

taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 240

aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 300

tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag 360

cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg 420

ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg 480

gcacggcagg cggcctcctc ctcctctcac ggcaccggca gctacggggg attcctttcc 540

caccgctcct tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc 600

ctctttcccc aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa 660

tccacccgtc ggcacctccg cttcaaggta cgccgctcgt cctccccccc cccccctctc 720

taccttctct agatcggcgt tccggtccat ggttagggcc cggtagttct acttctgttc 780

atgtttgtgt tagatccgtg tttgtgttag atccgtgctg ctagcgttcg tacacggatg 840

cgacctgtac gtcagacacg ttctgattgc taacttgcca gtgtttctct ttggggaatc 900

ctgggatggc tctagccgtt ccgcagacgg gatcgatcta ggataggtat acatgttgat 960

gtgggtttta ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac 1020

cttgagtacc tatctattat aataaacaag tatgttttat aattattttg atcttgatat 1080

acttggatga tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg 1140

ctatttattt gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact 1200

tctgcaggta ctagtattcc gggcggaatg aaagcgttaa cggccaggca acaagaggtg 1260

tttgatctca tccgtgatca catcagccag acaggtatgc cgccgacgcg tgcggaaatc 1320

gcgcagcgtt tggggttccg ttccccaaac gcggctgaag aacatctgaa ggcgctggca 1380

cgcaaaggcg ttattgaaat tgtttccggc gcatcacgcg ggattcgtct gttgcaggaa 1440

gaggaagaag ggttgccgct ggtaggtcgt gtggctgccg gtgaaccgtc gagcgccccc 1500

ccgaccgatg tcagcctggg ggacgagctc cacttagacg gcgaggacgt ggcgatggcg 1560

catgccgacg cgctagacga tttcgatctg gacatgttgg gggacgggga ttccccgggt 1620

ccgggattta ccccccacga ctccgccccc tacggcgctc tggatatggc cgacttcgag 1680

tttgagcaga tgtttaccga tgcccttgga attgacgagt acggtgggga tccgtctgct 1740

ggagacatga gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag 1800

aacagcctgg ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag 1860

ccccccatac tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg 1920

ggcttactga ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg 1980

gtgccaggct ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg 2040

ctagagatcc tgatgattgg tctcgtctgg cgctccatgg agcacccagg gaagctactg 2100

tttgctccta acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag 2160

atcttcgaca tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag 2220

gagtttgtgt gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc 2280

agcaccctga agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca 2340

gacactttga tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg 2400

ctggcccagc tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag 2460

catctgtaca gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggagatg 2520

ctggacgccc accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg 2580

gaccaaagcc acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac 2640

atcacggggg aggcagaggg tttccctgcc acagtctgag agctccctgg cggaattccc 2700

agagatgtta gctgaaatca tcactaatca gataccaaaa tattcaaatg gaaatatcaa 2760

aaagcttctg tttcatcaaa aatgactcga cctaactgag taagctagct tgttcgagta 2820

ttatggcatt gggaaaactg tttttcttgt accatttgtt gtgcttgtaa tttactgtgt 2880

tttttattcg gttttcgcta tcgaactgtg aaatggaaat ggatggagaa gagttaatga 2940

atgatatggt ccttttgttc attctcaaat taatattatt tgttttttct cttatttgtt 3000

gtgtgttgaa tttgaaatta taagagatat gcaaacattt tgttttgagt aaaaatgtgt 3060

caaatcgtgg cctctaatga ccgaagttaa tatgaggagt aaaacactag atccccaaac 3120

aagcttggaa actgaaggcg ctcgagttac tagatcgggg aattgatccc ccctcgacag 3180

cttgcatgcc gcttgggctg caggtcgagg ctaaaaaact aatcgcatta tcatcccctc 3240

gacgtactgt acatataacc actggtttta tatacagcag tactgtacat ataaccactg 3300

gttttatata cagcagtcga cgtactgtac atataaccac tggttttata tacagcagta 3360

ctgtacatat aaccactggt tttatataca gcagtcgagg taagattaga tatggatatg 3420

tatatggata tgtatatggt ggtaatgcca tgtaatatgc tcgactctag gatcttcgca 3480

agacccttcc tctatataag gaagttcatt tcatttggag aggacacgct gaagctagtc 3540

gactctagcc tccctaggct gccggacgac gagctcctcc cccctccccc tccgccgccg 3600

ccgcgccggt aaccaccccg cccctctcct ctttctttct ccgttttttt ttccgtctcg 3660

gtctcgatct ttggccttgg tagtttgggt gggcgagagg cggcttcgtg cgcgcccaga 3720

tcggtgcgcg ggaggggcgg gatctcgcgg ctggggctct cgccggcgtg gatccggccc 3780

ggatctcgcg gggaatgggg ctctcggatg tagatctgcg atccgccgtt gttgggggag 3840

atgatggggg gtttaaaatt tccgccatgc taaacaagat caggaagagg ggaaaagggc 3900

actatggttt atatttttat atatttctgc tgcttcgtca ggcttagatg tgctagatct 3960

tcttctttct ttcttctttt tgtgggtaga atttgaatcc ctcagcattg ttcatcggta 4020

gtttttcttt tcatgatttg tgacaaatgc agcctcgtgc ggagcttttt tgtag 4075

<210> 23

<211> 687

<212> DNA

<213> Zea mays

<400> 23

ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 60

gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 120

agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 180

taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 240

aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 300

tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag 360

cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg 420

ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg 480

gcacggcagg cggcctcctc ctcctctcac ggcaccggca gctacggggg attcctttcc 540

caccgctcct tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc 600

ctctttcccc aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa 660

tccacccgtc ggcacctccg cttcaag 687

68页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:来源于梭菌属提取物的无细胞蛋白质合成平台

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!