用于共转录加帽的rna聚合酶变体

文档序号:1966735 发布日期:2021-12-14 浏览:13次 >En<

阅读说明:本技术 用于共转录加帽的rna聚合酶变体 (RNA polymerase variants for co-transcriptional capping ) 是由 阿萨纳西奥斯·杜西斯 干乍那·拉维钱德兰 埃米·E·拉比多 玛格丽特·富兰克林 凯文·史密斯 于 2020-02-19 设计创作,主要内容包括:本公开提供用于高效转录的RNA聚合酶变体。(The present disclosure provides RNA polymerase variants for efficient transcription.)

用于共转录加帽的RNA聚合酶变体

相关申请

本申请根据35U.S.C.§119(e)要求2019年2月20日提交的美国临时申请号62/808,182、2019年4月11日提交的美国临时申请号62/832,314和2019年8月13日提交的美国临时申请号62/885,928的权益,每个文件通过引用整体并入本文。

背景技术

体外转录(IVT)使用噬菌体DNA依赖性核糖核酸(RNA)聚合酶(例如,SP6、T3和T7)来合成模板导向的mRNA转录物。IVT反应中的问题可能会导致完全失败(例如,无转录物生成)或转录物的大小不正确(例如,比预期更短或更长)。与IVT反应相关的具体问题包括例如在反应过程中产生的流产(截短)转录物、连缀转录物、polyA尾变异/3’异质性、突变的转录物和/或双链污染物。

RNA聚合酶表现出三个转录阶段—起始、延伸和终止。在起始阶段,RNA聚合酶与特定的启动子DNA序列结合,打开DNA双链体并将模板链送入活性位点。例如,T7RNA聚合酶形成一种被称为起始复合物的结构,它包括一个六螺旋束子结构域(启动子结合结构域),该子结构域与启动子相互作用以启动DNA双链体解链。当与启动子结合时,聚合酶产生许多长度为2-12个核苷酸(nt)的短(截短)转录物,这一过程通常被称为无效合成/起始。截短的RNA转录物不能被RNA聚合酶转化为全长转录物,并成为转录过程中积累的副产物。在过渡到延伸阶段并释放启动子后,聚合酶沿着DNA模板前进,产生全长RNA转录物。

在延伸阶段期间,RNA聚合酶通常会继续转录DNA并超过应该开始终止的点,从而产生比预期更长的RNA转录物(“连缀转录物”)。例如,T7RNA聚合酶在从模板“脱落”之前将核苷酸添加到转录物的末端。研究表明,由T7RNA聚合酶体外产生的转录物的70%以上可以是连缀转录物。在某些情况下,这些异常RNA产物的长度是编码序列的两倍。由于连缀转录是随机的,因此在给定的IVT反应中,产物之间通常存在很大的3’异质性。这种3’异质性对于下游应用(例如连接反应,其依赖于确定长度和/或核苷酸组成的RNA转录物)而言是有问题的。

发明内容

在一些方面,本文提供了RNA聚合酶变体和使用这些变体的体外转录方法。在一些实施方案中,本公开的RNA聚合酶变体已经显示,当用于例如体外转录反应时,聚合酶变体提高转录效率,提高共转录加帽效率,在一半浓度的盖帽类似物下增加RNA产量并提高RNA的3’同质性,提高转录保真度和/或降低dsRNA污染的量。

本公开的一些方面提供了一种核糖核酸(RNA)聚合酶变体,其包括包含至少一个氨基酸取代的RNA聚合酶。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于包含SEQ ID NO:44的氨基酸序列的RNA聚合酶在选自由E350、D351、K387、N437、K441、D506、R632、D653、S628、P657、F880和G884组成的组的位置处包含至少一个氨基酸取代。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于包含SEQ ID NO:1的氨基酸序列的野生型RNA聚合酶酸在选自由E350、D351、K387和D653组成的组的两个位置处包含氨基酸取代。在一些实施方案中,两个氨基酸取代是E350和D351。在一些实施方案中,两个氨基酸取代是E350和K387。在一些实施方案中,两个氨基酸取代是K387和D653。

在一些实施方案中,RNA聚合酶在E350处包含氨基酸取代。在一些实施方案中,RNA聚合酶在D351处包含氨基酸取代。在一些实施方案中,RNA聚合酶在K387处包含氨基酸取代。在一些实施方案中,RNA聚合酶在N437处包含氨基酸取代。在一些实施方案中,RNA聚合酶在K441处包含氨基酸取代。在一些实施方案中,RNA聚合酶在D506处包含氨基酸取代。在一些实施方案中,RNA聚合酶在R632处包含氨基酸取代。在一些实施方案中,RNA聚合酶在D653处包含氨基酸取代。在一些实施方案中,RNA聚合酶在S628处包含氨基酸取代。在一些实施方案中,RNA聚合酶在P657处包含氨基酸取代。在一些实施方案中,RNA聚合酶在F880处包含氨基酸取代。在一些实施方案中,RNA聚合酶在G884处包含氨基酸取代。

在一些实施方案中,RNA聚合酶在选自由E350、D351、K387、N437、K441、D506、R632、D653、S628、P657、F880和G884组成的组的位置处包含至少两个、至少三个、至少四个或至少五个氨基酸取代。

在一些实施方案中,RNA聚合酶在选自由以下组成的组的位置处包含氨基酸取代:E350和D351;E350和K387;E350和N437;E350和K441;E350和D506;E350和R632;E350和D653;E350和S628;E350和P657;E350和F880;E350和G884;D351和K387、D351和N437;D351和K441;D351和D506;D351和R632;D351和D653;D351和S628;D351和P657;D351和F880;D351和G884;K387和N437;K387和K441;K387和D506;K387和R632;K387和D653;K387和S628;K387和P657;K387和F880;以及K387和G884;N437和K441;N437和D506;N437和R632;N437和D653;N437和S628;N437和P657;N437和F880;N437和G884;K441和D506;K441和R632;K441和D653;K441和S628;K441和P657;K441和F880;K441和G884;D506和R632;D506和D653;D506和S628;D506和P657;D506和F880;D506和G884;R632和D653;R632和S628;R632和P657;R632和F880;R632和G884;D653和S628;D653和P657;D653和F880;D653和G884;S628和P657;S628和F880;S628和G884;P657和F880;P657和G884;以及F880和G884。

在一些实施方案中,RNA聚合酶在选自由以下组成的组的位置处包含酸取代:K387、D653和G884;E350、D351和K387;以及D653、P657和R632。

在一些实施方案中,E350处的氨基酸取代选自由E350A、E350K、E350N和E350W组成的组,任选地其中E350处的氨基酸取代是E350N。

在一些实施方案中,D351处的氨基酸取代是D351V。

在一些实施方案中,K387处的氨基酸取代选自由K387H、K387N和K387S组成的组,任选地其中K387处的氨基酸取代是K387N。

在一些实施方案中,N437处的氨基酸取代选自由N437F、N437I、N437T和N437Y组成的组,任选地其中N437处的氨基酸取代是N437F。

在一些实施方案中,K441处的氨基酸取代是K441R。

在一些实施方案中,D506处的氨基酸取代选自由D506F、D506L、D506R、D506W和D506Y组成的组。

在一些实施方案中,R632处的氨基酸取代是R632K或R632T。

在一些实施方案中,D653处的氨基酸取代选自由D653A、D653F、D653G、D653H、D653I、D653K、D653L、D653M、D653N、D653P、D653Q、D653R、D653S、D653T、D653V、D653W和D653Y组成的组,任选地其中D653处的氨基酸取代是D653W。

在一些实施方案中,S628处的氨基酸取代是S628W。

在一些实施方案中,P657处的氨基酸取代选自由P657A、P657R和P657W组成的组。

在一些实施方案中,F880处的氨基酸取代是F880Y。

在一些实施方案中,G884处的氨基酸取代选自由G884A、G884S、G884T和G884P组成的组。

在一些实施方案中,RNA聚合酶包含如权利要求61-241中任一项所述的序列。

本公开的其他方面提供了一种方法,其包括在体外转录反应中产生mRNA,该反应包含DNA模板、核苷三磷酸、本文所述的任何一种RNA聚合酶变体和任选的盖帽类似物。在一些实施方案中,反应包含盖帽类似物。在一些实施方案中,反应包含的盖帽类似物的浓度比使用包含SEQ ID NO:44的氨基酸序列的T7RNA聚合酶产生等量mRNA所需的盖帽类似物的浓度低至少5倍。

在一些实施方案中,产生的mRNA的80%以上包括功能盖帽,产生的mRNA的50%以上在3’末端是同质的,且/或反应包含小于5ng dsRNA/25μg产生的mRNA。

在一些实施方案中,盖帽类似物和核苷三磷酸是以等摩尔浓度存在于反应中,或者反应中盖帽类似物与核苷三磷酸的摩尔比大于1:1。在一些实施方案中,盖帽类似物是二核苷酸盖帽、三核苷酸盖帽或四核苷酸盖帽。在一些实施方案中,盖帽类似物是包含GAG序列的三核苷酸盖帽类似物。

在一些实施方案中,GAG盖帽类似物包括选自以下各项的化合物:

在一些实施方案中,盖帽类似物是包含GGAG序列的四核苷酸盖帽类似物。

在一些实施方案中,四核苷酸盖帽类似物包含选自以下各项的化合物:

在一些实施方案中,多核苷酸模板在模板位置+1处包括2′-脱氧胸苷残基或2′-脱氧胞苷残基。

本公开的其他方面提供了组合物或试剂盒,其包含如本文所述的RNA聚合酶变体中的任何一种和IVT反应组分,所述IVT反应组分任选地选自由多核苷酸模板、核苷三磷酸和盖帽类似物组成的组。

本公开的其他方面提供了编码如本文所述的RNA聚合酶变体中的任何一种的核酸。

附图说明

图1A-1H示出了描绘在不同水平的GAG盖帽类似物的存在下由涉及对照T7 RNA聚合酶变体(G47A+C末端G)的突变变体的体外转录(IVT)反应产生的转录RNA产物的功能特征的图表。在进行oligo dT纯化后,分析转录RNA产物的产量(图1A)、3’同质性(图1B)、dsRNA的量(图1C)、加帽RNA百分比(图1D和图1E)、根据DBAA(乙酸二丁铵)HPLC方法确定的纯度(图1F)、根据Tris RP(反相)方法确定的加尾百分比(即,包含polyA尾部的RNA的百分比)(图1G)和插入缺失频率(图1H)。

图2A-2C示出了描绘在不同水平的GGG盖帽(图2A)、m6A盖帽(图2B)和e6A盖帽(图2C)的存在下由涉及对照T7 RNA聚合酶变体(G47A+C末端G)的突变变体的体外转录(IVT)反应产生的加帽RNA百分比的图表。

图3A-3E示出了描绘在不同水平的GAG盖帽类似物的存在下由涉及对照T7 RNA聚合酶变体(G47A+C末端G)的突变变体的体外转录(IVT)反应产生的转录RNA产物的功能特征的图表。在进行oligo dT纯化后,分析转录RNA产物的浓度(图3A)、根据Tris RP(反相)方法确定的加尾百分比(即,包含polyA尾部的RNA的百分比)(图3B)、根据DBAA(乙酸二丁铵)HPLC方法确定的纯度(图3C)、3’同质性(图3D)和dsRNA的量(图3E)。

图4A-4E示出了描绘在不同水平的GAG盖帽的存在下由涉及对照T7 RNA聚合酶变体(G47A+C末端G)的突变变体的体外转录(IVT)反应产生的加帽RNA百分比的图表。

图5A-5D示出了描绘在不同水平的e6A三核苷酸(trinuc)的存在下由涉及对照T7RNA聚合酶变体(G47A+C末端G)的突变变体的IVT反应产生的加帽RNA百分比的图表。

图6A-6D示出了描绘在不同水平的m6A三核苷酸的存在下由涉及对照T7 RNA聚合酶变体(G47A+C末端G)的突变变体的IVT反应产生的加帽RNA百分比的图表。

图7示出了描绘在不同水平的GGAG四核苷酸(tetranuc)的存在下由涉及对照T7RNA聚合酶变体(G47A+C末端G)的突变变体的IVT反应产生的加帽RNA百分比的图表。GGAG四核苷酸的结构提供在图7的下半部分中。

图8A-8I示出了描绘在GAG三核苷酸、m6A三核苷酸、e6A三核苷酸或四核苷酸的存在下由涉及对照T7 RNA聚合酶变体(G47A+C末端G)的突变变体的IVT反应产生的加帽RNA百分比(图8A-8D)和相对RNA产量(图8E-8I)的图表。图8E-8I被标准化为涉及野生型T7 RNA聚合酶的IVT反应。

图9A-9D示出了描绘在GAG三核苷酸(图9A)、m6A三核苷酸(图9B)、e6A三核苷酸(图9C)和GGAG四核苷酸(图9D)的存在下由涉及对照T7 RNA聚合酶的突变变体的IVT反应产生的dsRNA含量的图表。

图10A-10D示出了描绘在GAG三核苷酸的存在下由涉及对照T7 RNA聚合酶的突变变体的IVT反应产生的3’同质性(图10A)、加帽RNA百分比(图10B)、全长RNA产物百分比(图10C)和随时间推移的粗产量(图10D)的图表。

图11示出了描绘在不同浓度的盖帽类似物的存在下由涉及D653W+G47A RNA聚合酶变体的IVT反应产生的加帽RNA百分比的图表。

图12示出了描绘在GAG三核苷酸盖帽类似物的存在下多取代RNA聚合酶变体的加帽效率的图表。

图13A-13B示出了描绘在GGAG四核苷酸盖帽类似物的存在下由涉及多取代RNA聚合酶变体的IVT反应产生的相对RNA产量(图13A)和加帽RNA百分比(图13B)的图表。

图14A-14E示出了描绘在GGAG四核苷酸盖帽类似物的存在下由涉及多取代RNA聚合酶变体和三种不同DNA模板的IVT反应产生的转录RNA产物的功能特征的图表。在进行oligo dT纯化后,分析转录RNA产物的加帽RNA百分比(图14A)、根据Tris RP(反相)方法确定的加尾RNA百分比(即,包含polyA尾部的RNA的百分比)(图14B)、根据RP HPLC方法确定的纯度(图14C)、3’同质性(图14D)和dsRNA的量(图14E)。

图15A-15E示出了描绘在GGAG四核苷酸盖帽类似物的存在下由涉及多取代RNA聚合酶变体的IVT反应产生的转录RNA产物的功能特征的图表。在进行oligo dT纯化后,分析转录RNA产物的RNA产量(图15A)、加帽RNA百分比(图15B)、dsRNA的量(图15C)、根据RP HPLC方法确定的纯度(图15D)和加尾RNA百分比(即,包含polyA尾部的RNA的百分比)(图15E)。

具体实施方式

RNA聚合酶(DNA依赖性RNA聚合酶)是一种酶,其催化核糖核苷酸顺序添加到生长RNA链的3’末端(5’→3’方向上的RNA转录),其中核苷三磷酸(NTP)充当该酶的底物并且核苷酸的序列由DNA模板指定。转录依赖于碱基的互补配对。双螺旋的两条链局部分离,其中一条分离的链充当模板(DNA模板)。RNA聚合酶然后催化游离核苷酸在DNA模板上与模板中的互补碱基对齐。因此,如果RNA聚合酶催化核糖核苷酸顺序添加到生长RNA链的3’末端,则认为该聚合酶具有RNA聚合酶活性。

DNA指导的RNA聚合酶能够在没有引物的情况下启动RNA的合成;起始的第一个催化阶段被称为从头RNA合成。从头合成是转录周期中的一个独特阶段,其中RNA聚合酶结合两个核苷酸,而不是新生RNA聚合物和单个核苷酸。对于噬菌体T7 RNA聚合酶,转录明显偏好从+1和+2位置处的GTP开始。起始核苷酸与RNA聚合酶结合的位置与针对延伸复合物所描述的位置不同(Kennedy WP等人,J Mol Biol.2007;370(2):256-68)。有利于GTP作为起始核苷酸的选择偏差是通过形状互补性、广泛的蛋白质侧链和针对酶活性位点中的鸟嘌呤部分的强碱基堆叠相互作用来实现的。因此,起始GTP为开放启动子构象提供了最大的稳定力(Kennedy等人,2007)。在一些实施方案中,本公开的RNA聚合酶变体在用于从头RNA合成的一个或多个结合位点残基处包含一个或多个氨基酸取代,其在不受理论约束的情况下例如改变RNA聚合酶对体外转录反应的盖帽类似物的亲和力,以使得在低盖帽类似物浓度下加帽效率有所提高。

因此,在一些方面,本公开提供包括RNA聚合酶的RNA聚合酶变体,该RNA聚合酶在用于从头RNA合成的结合位点残基处包含氨基酸取代。RNA聚合酶变体是具有RNA聚合酶活性并且相对于对应的野生型RNA聚合酶具有至少一个取代和/或修饰的酶。在一些实施方案中,结合位点残基处的氨基酸取代是相对于野生型RNA聚合酶在选自位置350、351、387、394、425、427、437、441、506、628、632、653、657、811和880的位置处的取代,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,结合位点残基处的氨基酸取代是相对于野生型RNA聚合酶在选自位置350、351、387、394、437、441、506、628、632、653和657的位置处的取代,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

T7 RNA聚合酶的结构研究表明,N末端结构域的构象在转录的起始阶段和延伸阶段之间发生了实质变化。N末端结构域包含C-螺旋子结构域和启动子结合结构域,该启动子结合结构域包括由子结构域H隔开的两个区段。启动子结合结构域和结合的启动子在合成8-nt RNA转录物时旋转约45度,从而允许在活性位点扩大以适应生长的异源双链时保持启动子接触。C-螺旋子结构域向其延伸构象适度移动,而子结构域H保持在其起始阶段位置而不是其距离超过70埃的延伸阶段位置。T7 RNA聚合酶起始和延伸复合物的结构比较揭示了N末端267个残基(N末端结构域)内的广泛构象变化和RNA聚合酶的其余部分的极少变化。启动子结合域的刚体旋转以及N末端C-螺旋(残基28-71)和H(残基151-190)子结构域的重折叠负责消除启动子结合位点,扩大活性位点并为RNA转录物建立退出隧道。特别地,T7 RNA聚合酶的残基E42-G47(在起始复合物中以β-环结构存在)在延伸复合物中采用α-螺旋结构。N末端结构域内的结构变化解释了延伸复合物的稳定性和持续合成能力的增加(参见,例如,Durniak,K.J.等人,Science 322(5901):553-557,2008,该文献通过引用并入本文)。

在一些方面,本文提供了促进从RNA聚合酶起始复合物到RNA聚合酶延伸复合物的构象变化的RNA聚合酶变体(例如,T7 RNA聚合酶变体)。在一些实施方案中,相对于野生型RNA聚合酶,RNA聚合酶变体包含至少一个氨基酸修饰,该氨基酸修饰导致RNA聚合酶变体的至少一个三维环结构在RNA聚合酶变体从起始复合物转变为延伸复合物时发生构象变化而形成螺旋结构。因此,在一些实施方案中,至少一个氨基酸修饰相对于野生型氨基酸具有高螺旋倾向。在一些实施方案中,RNA聚合酶变体相对于野生型RNA聚合酶在位置42、43、44、45、46和47中的一个或多个位置处包含氨基酸取代,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置47处的氨基酸取代是G47A。

环结构的实例包括但不限于T7 RNA聚合酶起始复合物(IC)构象的C-螺旋结构(例如,SEQ ID NO:1的aa 28-71)中的氨基酸(aa)42-47和IC的C-接头结构(例如,SEQ ID NO:1的aa 258-266)中的aa 257-262。

因此,本公开的一些方面提供了相对于野生型RNA聚合酶包含多个氨基酸取代和/或修饰的RNA聚合酶变体。在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其包含(a)在用于从头RNA合成的结合位点残基处的氨基酸取代;和(b)促进从RNA聚合酶起始复合物到RNA聚合酶延伸复合物的构象变化的氨基酸取代。

此外,在一些实施方案中,本文提供的RNA聚合酶变体包括在聚合酶的C末端包含至少一个额外氨基酸的氨基酸修饰。在一些实施方案中,至少一个额外的氨基酸选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸。在一些实施方案中,至少一种额外的氨基酸是极性氨基酸。在一些实施方案中,至少一种额外的氨基酸是非极性氨基酸。在一些实施方案中,至少一种额外的氨基酸是甘氨酸。在一些实施方案中,至少一种额外的氨基酸是丙氨酸。在一些实施方案中,至少一种额外的氨基酸是丝氨酸。

在一些实施方案中,例如在体外转录反应中使用本公开的RNA聚合酶变体相对于对照RNA聚合酶提高转录效率。例如,使用RNA聚合酶变体可以使转录效率(例如,RNA产量和/或转录速率)提高至少20%。在一些实施方案中,使用RNA聚合酶变体使转录效率(例如,RNA产量和/或转录速率)提高至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少10%。在一些实施方案中,使用RNA聚合酶变体使转录效率提高20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。在一些实施方案中,使用RNA聚合酶变体使总RNA产量增加至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少10%。在一些实施方案中,使用RNA聚合酶变体使总RNA产量增加20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。在一些实施方案中,使用RNA聚合酶变体使转录速率提高至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少10%。在一些实施方案中,使用RNA聚合酶变体使转录速率提高20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。在一些实施方案中,对照RNA聚合酶是包含SEQ ID NO:1的氨基酸序列的野生型RNA聚合酶(“野生型T7 RNA聚合酶”)。在其他实施方案中,对照RNA聚合酶是包含SEQ ID NO:1的氨基酸序列的RNA聚合酶变体,该氨基酸序列经修饰以包括G47A取代和在其C末端的额外甘氨酸(“对照T7 RNA聚合酶变体”或“G47A+C末端G T7 RNA聚合酶变体”或“对照RNA聚合酶变体”或“G47A+C末端G RNA聚合酶变体”)。

令人惊讶的是,本文提供的数据显示,在体外转录反应中使用本公开的RNA聚合酶变体使得能够使用低得多的浓度(量)的盖帽类似物来产生与使用野生型T7 RNA聚合酶或对照RNA聚合酶变体产生的加帽RNA等量的加帽RNA。在一些实施方案中,当在体外转录反应中使用一半浓度的盖帽类似物时,例如在体外转录反应中使用本公开的RNA聚合酶变体提高加帽RNA的产量。在一些实施方案中,当在体外转录反应中仅使用25%、50%或75%的盖帽类似物浓度时,例如在体外转录反应中使用本公开的RNA聚合酶变体提高加帽RNA的产量。例如,当在体外转录反应中仅使用25%、50%或75%的盖帽类似物浓度时,使用RNA聚合酶变体可使加帽RNA的产量提高至少20%。在一些实施方案中,当在体外转录反应中仅使用25%、50%或75%的盖帽类似物浓度时,使用RNA聚合酶变体使加帽RNA的产量提高至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在一些实施方案中,当在体外转录反应中仅使用25%、50%或75%的盖帽类似物浓度时,使用RNA聚合酶变体使加帽RNA的产量提高20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。在一些实施方案中,对照RNA聚合酶是野生型T7 RNA聚合酶。在其他实施方案中,对照RNA聚合酶是对照RNA聚合酶变体。

在一些实施方案中,使用RNA聚合酶变体使加帽RNA的总产量增加至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少10%。在一些实施方案中,使用RNA聚合酶变体使加帽RNA的总产量增加20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。

在一些实施方案中,例如在体外转录反应中使用本公开的RNA聚合酶变体提高共转录加帽效率。例如,使用RNA聚合酶变体可以使共转录加帽效率(例如,包含盖帽类似物的转录物的百分比)提高至少20%。在一些实施方案中,使用RNA聚合酶变体使共转录加帽效率(例如,包含盖帽类似物的转录物的百分比)提高至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在一些实施方案中,使用RNA聚合酶变体使共转录加帽效率提高20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。在一些实施方案中,对照RNA聚合酶是野生型T7 RNA聚合酶。在其他实施方案中,对照RNA聚合酶是对照RNA聚合酶变体。

在一些实施方案中,至少50%的mRNA包含功能盖帽类似物。例如,至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少95%或100%的mRNA可以包含盖帽类似物。在一些实施方案中,50%-100%、50%-90%、50%-80%或50%-70%的mRNA包含盖帽类似物。

在一些实施方案中,在用于体外转录反应的一半浓度的盖帽类似物下,例如在体外转录反应中使用本公开的RNA聚合酶变体提高RNA的3’同质性。例如,当在体外转录反应中仅使用25%、50%或75%的盖帽类似物浓度时,使用RNA聚合酶变体可以使RNA的3’同质性提高至少20%。在一些实施方案中,当在体外转录反应中仅使用25%、50%或75%的盖帽类似物浓度时,使用RNA聚合酶变体使3’同质性提高至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在一些实施方案中,当在体外转录反应中仅使用25%、50%或75%的盖帽类似物浓度时,使用RNA聚合酶变体使3’同质性提高20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。在一些实施方案中,对照RNA聚合酶是野生型T7 RNA聚合酶。在其他实施方案中,对照RNA聚合酶是对照RNA聚合酶变体。

在一些实施方案中,在包含本公开的RNA聚合酶变体的体外转录反应中产生的mRNA的至少50%表现出3’同质性。例如,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少95%或100%的mRNA表现出3’同质性。在一些实施方案中,50%-100%、50%-90%、50%-80%或50%-70%的mRNA表现出3’同质性。

在一些实施方案中,在包含本公开的RNA聚合酶变体的体外转录反应中产生的mRNA具有大于阈值的3’同质性。在一些实施方案中,阈值为50%或至少50%。例如,阈值可以是55%、60%、65%、70%、75%、80%、85%或90%。

在一些实施方案中,例如在体外转录反应中使用本公开的RNA聚合酶变体提高转录保真度(例如,突变率)。例如,使用RNA聚合酶变体可以将转录保真度提高至少20%。在一些实施方案中,使用RNA聚合酶变体使转录保真度提高至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在一些实施方案中,使用RNA聚合酶变体使转录保真度提高20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。提高转录保真度的本公开的RNA聚合酶变体将产生比对照RNA聚合酶具有更低的突变率或突变总数的RNA转录物(例如,mRNA转录物)。在一些实施方案中,对照RNA聚合酶是野生型T7 RNA聚合酶。在其他实施方案中,对照RNA聚合酶是对照RNA聚合酶变体。

在一些实施方案中,相对于DNA模板,使用本公开的RNA聚合酶变体产生的mRNA具有少于1个突变/100个核苷酸。例如,相对于DNA模板,所产生的mRNA的每200、300、400、500、600、700、800、900或1000个核苷酸可以具有少于1个突变。

在一些实施方案中,例如在体外转录反应中使用本公开的RNA聚合酶变体降低体外转录反应中双链RNA(dsRNA)污染的量。例如,使用RNA聚合酶变体可以使体外转录反应中dsRNA污染的量降低至少20%。在一些实施方案中,使用RNA聚合酶变体使体外转录反应中dsRNA污染的量降低至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在一些实施方案中,使用RNA聚合酶变体使体外转录反应中dsRNA污染的量降低20-100%、20-90%、20-80%、20-70%、20-60%、20-50%、30-100%、30-90%、30-80%、30-70%、30-60%、30-50%、40-100%、40-90%、40-80%、40-70%、40-60%、40-50%、50-100%、50-90%、50-80%、50-70%或50-60%。在一些实施方案中,对照RNA聚合酶是野生型T7 RNA聚合酶。在其他实施方案中,对照RNA聚合酶是对照RNA聚合酶变体。

在一些实施方案中,dsRNA污染的浓度小于10ng/25μg mRNA产物。在一些实施方案中,dsRNA污染的浓度小于5ng/25μg mRNA产物。例如,dsRNA污染的浓度可以小于4ng/25μgmRNA产物、小于3ng/25μg mRNA产物、小于2ng/25μg mRNA产物或小于1ng/25μg mRNA产物。在一些实施方案中,dsRNA污染的浓度为0.5-1、0.5-2、0.5-3、0-.4或0.5-5ng/25μg mRNA产物。

在一些实施方案中,在包含本公开的RNA聚合酶变体的体外转录反应中产生的mRNA具有低于阈值量的dsRNA。在一些实施方案中,阈值为10ng。在一些实施方案中,阈值为5ng。在一些实施方案中,阈值为4ng、3nm、2ng或1ng。

氨基酸取代和修饰

本公开的RNA聚合酶变体相对于野生型(WT)RNA聚合酶包括至少一个氨基酸取代。例如,关于具有SEQ ID NO:1的氨基酸序列的野生型T7 RNA聚合酶,位置47处的甘氨酸被认为是“野生型氨基酸”,而在位置47处用丙氨酸取代甘氨酸被认为是具有高螺旋倾向的“氨基酸取代”。在一些实施方案中,RNA聚合酶变体是相对于WT RNA聚合酶(例如,具有SEQ IDNO:1的氨基酸序列的野生型T7RNA聚合酶)包含至少一个(一个或多个)氨基酸取代的T7RNA聚合酶变体。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其包含(至少一个)氨基酸修饰,该氨基酸修饰在RNA聚合酶变体从起始复合物转变为延伸复合物时使得RNA聚合酶变体的环结构经历构象变化而形成螺旋结构。在一些实施方案中,氨基酸修饰是相对于野生型RNA聚合酶在位置42、43、44、45、46和47中的一个或多个位置处的氨基酸取代,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,氨基酸取代是高倾向性氨基酸取代。高螺旋倾向性氨基酸的实例包括丙氨酸、异亮氨酸、亮氨酸、精氨酸、甲硫氨酸、赖氨酸、谷氨酰胺和/或谷氨酸。在一些实施方案中,位置47处的氨基酸取代是G47A。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含额外的C末端氨基酸的RNA聚合酶。在一些实施方案中,额外的C末端氨基酸选自甘氨酸、丙氨酸、苏氨酸、脯氨酸、谷氨酰胺和丝氨酸。在一些实施方案中,额外的C末端氨基酸(例如,相对于包含SEQ ID NO:1的氨基酸序列的野生型RNA聚合酶在位置884处)是甘氨酸。

在一些实施方案中,RNA聚合酶变体包括在非保守氨基酸残基的位置处包含(至少一个)氨基酸修饰的RNA聚合酶。保守氨基酸残基是通常在相同蛋白质的多个同源序列之间共享的氨基酸或氨基酸类型(例如,单个氨基酸如Gly或Ser,或具有相似特性的氨基酸(诸如具有酸性官能团的氨基酸)的群组)。可以使用同源氨基酸序列的序列比对来确定保守氨基酸残基。使用基本局部比对(Basic Local Alignment)搜索获得的大约1000个RNA聚合酶序列的序列比对允许确定SEQ ID NO:1的240个位置,这些位置最有可能是所有RNA聚合酶序列中保守的。最有可能在所有RNA聚合酶序列中保守的SEQ ID NO:1的这240个位置是位置5-6、位置39、位置269-277、位置279、位置281-282、位置323-333、位置411-448、位置454-470、位置472-474、位置497-516、位置532-560、位置562-573、位置626-646、位置691、位置693-702、位置724-738、位置775-794、位置805-820、位置828-833、位置865-867和位置877-879。因此,在一些实施方案中,本公开的RNA聚合酶变体包括在不是SEQ ID NO:1的位置5-6、39、269-277、279、281-282、323-333、411-448、454-470、472-474、497-516、532-560、562-573、626-646、691、693-702、724-738、775-794、805-820、828-833、865-867和877-879中的一个的位置处包含(至少一个)氨基酸修饰的RNA聚合酶。在一些实施方案中,本文所述的RNA聚合酶变体还可以在不是SEQ ID NO:1的位置5-6、39、269-277、279、281-282、323-333、411-448、454-470、472-474、497-516、532-560、562-573、626-646、691、693-702、724-738、775-794、805-820、828-833、865-867和877-879中的一个的任意数量的位置处包含任意数量的氨基酸修饰。在一些实施方案中,包含SEQ ID NO:2-247中任一项的RNA聚合酶的RNA聚合酶变体还可以在不是位置5-6、39、269-277、279、281-282、323-333、411-448、454-470、472-474、497-516、532-560、562-573、626-646、691、693-702、724-738、775-794、805-820、828-833、865-867和877-879中的一个的位置处包含(至少一个)额外的氨基酸修饰。相反地,不保守的氨基酸位置最有可能被修饰或发生突变。因此,在一些实施方案中,本公开的RNA聚合酶变体包括在位置1-4、7-38、40-268、278、280、283-322、334-410、449-453、471、475-496、517-531、561、574-625、647-690、692、703-723、739-774、795-804、821-827、834-864、868-876和880-883处包含(至少一个)氨基酸修饰的RNA聚合酶。在一些实施方案中,包括SEQ ID NO:2-247中任一项的RNA聚合酶的RNA聚合酶变体还可以在位置1-4、7-38、40-268、278、280、283-322、334-410、449-453、471、475-496、517-531、561、574-625、647-690、692、703-723、739-774、795-804、821-827、834-864、868-876和880-883处包含(至少一个)额外的氨基酸修饰。

在一些实施方案中,包含SEQ ID NO:2-247中任一项的RNA聚合酶的RNA聚合酶变体还可以在不破坏RNA聚合酶蛋白的二级或三级结构的任何氨基酸位置处包含(至少一个)氨基酸修饰。在一些实施方案中,包括SEQ ID NO:2-247中任一项的RNA聚合酶的RNA聚合酶变体还可以在不破坏RNA聚合酶蛋白的折叠能力的任何氨基酸位置处包含(至少一个)氨基酸修饰。在一些实施方案中,包括SEQ ID NO:2-247中任一项的RNA聚合酶的RNA聚合酶变体还可以在不破坏RNA聚合酶蛋白的核酸(例如DNA)结合能力的任何氨基酸位置处包含(至少一个)氨基酸修饰。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于野生型RNA聚合酶包含(a)在选自位置350、351、387、394、425、427、437、441、506、628、632、653、657、811和880的位置处的氨基酸取代和(b)在C末端的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于野生型RNA聚合酶包含(a)在选自位置350、351、387、394、437、441、506、628、632、653和657的位置处的氨基酸取代和(b)在C末端的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置350处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置350处的赖氨酸(K)(E350K)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置350处的天冬酰胺(N)(E350N)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置350处的丙氨酸(A)(E350A)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置350处的色氨酸(E350W)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置351处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置351处的缬氨酸(V)(D351V)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置387处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置387处的丝氨酸(K387S)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置387处的组氨酸(H)(K387H)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置387处的天冬酰胺(K387N)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置394处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置425处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置427处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置437处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置437处的苏氨酸(N437T)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置437处的异亮氨酸(N437I)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置437处的酪氨酸(N437Y)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置437处的苯丙氨酸(N437F)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置441处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置441处的精氨酸(K441R)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置506处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置506处的色氨酸(W)(D506W)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置506处的氨基酸取代是D506A、D506R、D506N、D506C、D506E、D506Q、D506G、D506H、D506I、D506L、D506K、D506M、D506F、D506P、D506S、D506T、D506W、D506Y或D506V。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置628处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置628处的色氨酸(W)(S628W)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置628处的氨基酸取代是S628A、S628R、S628N、S628D、S628C、S628E、S628Q、S628G、S628H、S628I、S628L、S628K、S628M、S628F、S628P、S628T、S628W、S628Y或S628V。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置632处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置653处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置653处的色氨酸(W)(D563W)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置653处的氨基酸取代是D653A、D653R、D653N、D653C、D653E、D653Q、D653G、D653H、D653I、D653L、D653K、D653M、D653F、D653P、D653S、D653T、D653W、D653Y或D653V。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置657处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置657处的色氨酸(W)(P657W)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置811处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置657处的氨基酸取代是P657A、P657R、P657N、P657D、P657C、P657E、P657Q、P657G、P657H、P657I、P657L、P657K、P657M、P657F、P657S、P657T、P657W、P657Y或P657V。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置880处的氨基酸取代和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)、在位置880处的酪氨酸(F880Y)和/或在C末端处(在位置884处)的额外氨基酸(例如,G)的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶包含在位置47处的氨基酸取代(例如,G47A)和在C末端处(在位置884处)的额外氨基酸的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,在C末端处的额外氨基酸是苏氨酸(T)。在一些实施方案中,C末端的额外氨基酸是丝氨酸(S)。在一些实施方案中,C末端的额外氨基酸是丙氨酸(A)。在一些实施方案中,C末端的额外氨基酸是脯氨酸(P)。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置350处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置350处的氨基酸取代选自由E350R、E350K、E350H、E350D、E350Q、E350N、E350T、E350S、E350C、E350G、E350A、E350V、E350I、E350M、E350P、E350Y、E350W和E350F组成的组。在一些实施方案中,位置350处的氨基酸取代是E350R。在一些实施方案中,位置350处的氨基酸取代是E350K。在一些实施方案中,位置350处的氨基酸取代是E350H。在一些实施方案中,位置350处的氨基酸取代是E350D。在一些实施方案中,位置350处的氨基酸取代是E350Q。在一些实施方案中,位置350处的氨基酸取代是E350N。在一些实施方案中,位置350处的氨基酸取代是E350T。在一些实施方案中,位置350处的氨基酸取代是E350S。在一些实施方案中,位置350处的氨基酸取代是E350C。在一些实施方案中,位置350处的氨基酸取代是E350G。在一些实施方案中,位置350处的氨基酸取代是E350A。在一些实施方案中,位置350处的氨基酸取代是E350V。在一些实施方案中,位置350处的氨基酸取代是E350I。在一些实施方案中,位置350处的氨基酸取代是E350M。在一些实施方案中,位置350处的氨基酸取代是E350P。在一些实施方案中,位置350处的氨基酸取代是E350Y。在一些实施方案中,位置350处的氨基酸取代是E350W。在一些实施方案中,位置350处的氨基酸取代是E350F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置351处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置351处的氨基酸取代选自由D351R、D351K、D351H、D351E、D351Q、D351N、D351T、D351S、D351C、D351G、D351A、D351V、D351I、D351M、D351P、D351Y、D351W和D351F组成的组。在一些实施方案中,位置351处的氨基酸取代是D351R。在一些实施方案中,位置351处的氨基酸取代是D351K。在一些实施方案中,位置351处的氨基酸取代是D351H。在一些实施方案中,位置351处的氨基酸取代是D351E。在一些实施方案中,位置351处的氨基酸取代是D351Q。在一些实施方案中,位置351处的氨基酸取代是D351N。在一些实施方案中,位置351处的氨基酸取代是D351T。在一些实施方案中,位置351处的氨基酸取代是D351S。在一些实施方案中,位置351处的氨基酸取代是D351C。在一些实施方案中,位置351处的氨基酸取代是D351G。在一些实施方案中,位置351处的氨基酸取代是D351A。在一些实施方案中,位置351处的氨基酸取代是D351V。在一些实施方案中,位置351处的氨基酸取代是D351I。在一些实施方案中,位置351处的氨基酸取代是D351M。在一些实施方案中,位置351处的氨基酸取代是D351P。在一些实施方案中,位置351处的氨基酸取代是D351Y。在一些实施方案中,位置351处的氨基酸取代是D351W。在一些实施方案中,位置351处的氨基酸取代是D351F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置387处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置387处的氨基酸取代选自由K387R、K387H、K387E、K387D、K387Q、K387N、K387T、K387S、K387C、K387G、K387A、K387V、K387I、K387M、K387P、K387Y、K387W和K387F组成的组。在一些实施方案中,位置387处的氨基酸取代是K387R。在一些实施方案中,位置387处的氨基酸取代是K387H。在一些实施方案中,位置387处的氨基酸取代是K387E。在一些实施方案中,位置387处的氨基酸取代是K387D。在一些实施方案中,位置387处的氨基酸取代是K387Q。在一些实施方案中,位置387处的氨基酸取代是K387N。在一些实施方案中,位置387处的氨基酸取代是K387T。在一些实施方案中,位置387处的氨基酸取代是K387S。在一些实施方案中,位置387处的氨基酸取代是K387C。在一些实施方案中,位置387处的氨基酸取代是K387G。在一些实施方案中,位置387处的氨基酸取代是K387A。在一些实施方案中,位置387处的氨基酸取代是K387V。在一些实施方案中,位置387处的氨基酸取代是K387I。在一些实施方案中,位置387处的氨基酸取代是K387M。在一些实施方案中,位置387处的氨基酸取代是K387P。在一些实施方案中,位置387处的氨基酸取代是K387Y。在一些实施方案中,位置387处的氨基酸取代是K387W。在一些实施方案中,位置387处的氨基酸取代是K387F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置394处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置394处的氨基酸取代选自由R394K、R394H、R394E、R394D、R394Q、R394N、R394T、R394S、R394C、R394G、R394A、R394V、R394I、R394M、R394P、R394Y、R394W和R394F组成的组。在一些实施方案中,位置394处的氨基酸取代是R394K。在一些实施方案中,位置394处的氨基酸取代是R394H。在一些实施方案中,位置394处的氨基酸取代是R394E。在一些实施方案中,位置394处的氨基酸取代是R394D。在一些实施方案中,位置394处的氨基酸取代是R394Q。在一些实施方案中,位置394处的氨基酸取代是R394N。在一些实施方案中,位置394处的氨基酸取代是R394T。在一些实施方案中,位置394处的氨基酸取代是R394S。在一些实施方案中,位置394处的氨基酸取代是R394C。在一些实施方案中,位置394处的氨基酸取代是R394G。在一些实施方案中,位置394处的氨基酸取代是R394A。在一些实施方案中,位置394处的氨基酸取代是R394V。在一些实施方案中,位置394处的氨基酸取代是R394I。在一些实施方案中,位置394处的氨基酸取代是R394M。在一些实施方案中,位置394处的氨基酸取代是R394P。在一些实施方案中,位置394处的氨基酸取代是R394Y。在一些实施方案中,位置394处的氨基酸取代是R394W。在一些实施方案中,位置394处的氨基酸取代是R394F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置425处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置425处的氨基酸取代选自由R425K、R425H、R425E、R425D、R425Q、R425N、R425T、R425S、R425C、R425G、R425A、R425V、R425I、R425M、R425P、R425Y、R425W和R425F组成的组。在一些实施方案中,位置425处的氨基酸取代是R425K。在一些实施方案中,位置425处的氨基酸取代是R425H。在一些实施方案中,位置425处的氨基酸取代是R425E。在一些实施方案中,位置425处的氨基酸取代是R425D。在一些实施方案中,位置425处的氨基酸取代是R425Q。在一些实施方案中,位置425处的氨基酸取代是R425N。在一些实施方案中,位置425处的氨基酸取代是R425T。在一些实施方案中,位置425处的氨基酸取代是R425S。在一些实施方案中,位置425处的氨基酸取代是R425C。在一些实施方案中,位置425处的氨基酸取代是R425G。在一些实施方案中,位置425处的氨基酸取代是R425A。在一些实施方案中,位置425处的氨基酸取代是R425V。在一些实施方案中,位置425处的氨基酸取代是R425I。在一些实施方案中,位置425处的氨基酸取代是R425M。在一些实施方案中,位置425处的氨基酸取代是R425P。在一些实施方案中,位置425处的氨基酸取代是R425Y。在一些实施方案中,位置425处的氨基酸取代是R425W。在一些实施方案中,位置425处的氨基酸取代是R425F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置427处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置427处的氨基酸取代选自由Y427R、Y427K、Y427H、Y427E、Y427D、Y427Q、Y427N、Y427T、Y427S、Y427C、Y427G、Y427A、Y427V、Y427I、Y427M、Y427P、Y427W和Y427F组成的组。在一些实施方案中,位置427处的氨基酸取代是Y427R。在一些实施方案中,位置427处的氨基酸取代是Y427K。在一些实施方案中,位置427处的氨基酸取代是Y427H。在一些实施方案中,位置427处的氨基酸取代是Y427E。在一些实施方案中,位置427处的氨基酸取代是Y427D。在一些实施方案中,位置427处的氨基酸取代是Y427Q。在一些实施方案中,位置427处的氨基酸取代是Y427N。在一些实施方案中,位置427处的氨基酸取代是Y427T。在一些实施方案中,位置427处的氨基酸取代是Y427S。在一些实施方案中,位置427处的氨基酸取代是Y427C。在一些实施方案中,位置427处的氨基酸取代是Y427G。在一些实施方案中,位置427处的氨基酸取代是Y427A。在一些实施方案中,位置427处的氨基酸取代是Y427V。在一些实施方案中,位置427处的氨基酸取代是Y427I。在一些实施方案中,位置427处的氨基酸取代是Y427M。在一些实施方案中,位置427处的氨基酸取代是Y427P。在一些实施方案中,位置427处的氨基酸取代是Y427W。在一些实施方案中,位置427处的氨基酸取代是Y427F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置437处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置437处的氨基酸取代选自由N437R、N437K、N437H、N437E、N437D、N437Q、N437T、N437S、N437C、N437G、N437A、N437V、N437I、N437M、N437P、N437Y、N437W和N437F组成的组。在一些实施方案中,位置437处的氨基酸取代是N437R。在一些实施方案中,位置437处的氨基酸取代是N437K。在一些实施方案中,位置437处的氨基酸取代是N437H。在一些实施方案中,位置437处的氨基酸取代是N437E。在一些实施方案中,位置437处的氨基酸取代是N437D。在一些实施方案中,位置437处的氨基酸取代是N437Q。在一些实施方案中,位置437处的氨基酸取代是N437T。在一些实施方案中,位置437处的氨基酸取代是N437S。在一些实施方案中,位置437处的氨基酸取代是N437C。在一些实施方案中,位置437处的氨基酸取代是N437G。在一些实施方案中,位置437处的氨基酸取代是N437A。在一些实施方案中,位置437处的氨基酸取代是N437V。在一些实施方案中,位置437处的氨基酸取代是N437I。在一些实施方案中,位置437处的氨基酸取代是N437M。在一些实施方案中,位置437处的氨基酸取代是N437P。在一些实施方案中,位置437处的氨基酸取代是N437Y。在一些实施方案中,位置437处的氨基酸取代是N437W。在一些实施方案中,位置437处的氨基酸取代是N437F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置441处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置441处的氨基酸取代选自由K441R、K441H、K441E、K441D、K441Q、K441N、K441T、K441S、K441C、K441G、K441A、K441V、K441I、K441M、K441P、K441Y、K441W和K441F组成的组。在一些实施方案中,位置441处的氨基酸取代是K441R。在一些实施方案中,位置441处的氨基酸取代是K441H。在一些实施方案中,位置441处的氨基酸取代是K441E。在一些实施方案中,位置441处的氨基酸取代是K441D。在一些实施方案中,位置441处的氨基酸取代是K441Q。在一些实施方案中,位置441处的氨基酸取代是K441N。在一些实施方案中,位置441处的氨基酸取代是K441T。在一些实施方案中,位置441处的氨基酸取代是K441S。在一些实施方案中,位置441处的氨基酸取代是K441C。在一些实施方案中,位置441处的氨基酸取代是K441G。在一些实施方案中,位置441处的氨基酸取代是K441A。在一些实施方案中,位置441处的氨基酸取代是K441V。在一些实施方案中,位置441处的氨基酸取代是K441I。在一些实施方案中,位置441处的氨基酸取代是K441M。在一些实施方案中,位置441处的氨基酸取代是K441P。在一些实施方案中,位置441处的氨基酸取代是K441Y。在一些实施方案中,位置441处的氨基酸取代是K441W。在一些实施方案中,位置441处的氨基酸取代是K441F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置632处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置632处的氨基酸取代选自由R632K、R632H、R632E、R632D、R632Q、R632N、R632T、R632S、R632C、R632G、R632A、R632V、R632I、R632M、R632P、R632Y、R632W和R632F组成的组。在一些实施方案中,位置632处的氨基酸取代是R632K。在一些实施方案中,位置632处的氨基酸取代是R632H。在一些实施方案中,位置632处的氨基酸取代是R632E。在一些实施方案中,位置632处的氨基酸取代是R632D。在一些实施方案中,位置632处的氨基酸取代是R632Q。在一些实施方案中,位置632处的氨基酸取代是R632N。在一些实施方案中,位置632处的氨基酸取代是R632T。在一些实施方案中,位置632处的氨基酸取代是R632S。在一些实施方案中,位置632处的氨基酸取代是R632C。在一些实施方案中,位置632处的氨基酸取代是R632G。在一些实施方案中,位置632处的氨基酸取代是R632A。在一些实施方案中,位置632处的氨基酸取代是R632V。在一些实施方案中,位置632处的氨基酸取代是R632I。在一些实施方案中,位置632处的氨基酸取代是R632M。在一些实施方案中,位置632处的氨基酸取代是R632P。在一些实施方案中,位置632处的氨基酸取代是R632Y。在一些实施方案中,位置632处的氨基酸取代是R632W。在一些实施方案中,位置632处的氨基酸取代是R632F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置811处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置811处的氨基酸取代选自由H811R、H811K、H811E、H811D、H811Q、H811N、H811T、H811S、H811C、H811G、H811A、H811V、H811I、H811M、H811P、H811Y、H811W和H811F组成的组。在一些实施方案中,位置811处的氨基酸取代是H811R。在一些实施方案中,位置811处的氨基酸取代是H811K。在一些实施方案中,位置811处的氨基酸取代是H811E。在一些实施方案中,位置811处的氨基酸取代是H811D。在一些实施方案中,位置811处的氨基酸取代是H811Q。在一些实施方案中,位置811处的氨基酸取代是H811N。在一些实施方案中,位置811处的氨基酸取代是H811T。在一些实施方案中,位置811处的氨基酸取代是H811S。在一些实施方案中,位置811处的氨基酸取代是H811C。在一些实施方案中,位置811处的氨基酸取代是H811G。在一些实施方案中,位置811处的氨基酸取代是H811A。在一些实施方案中,位置811处的氨基酸取代是H811V。在一些实施方案中,位置811处的氨基酸取代是H811I。在一些实施方案中,位置811处的氨基酸取代是H811M。在一些实施方案中,位置811处的氨基酸取代是H811P。在一些实施方案中,位置811处的氨基酸取代是H811Y。在一些实施方案中,位置811处的氨基酸取代是H811W。在一些实施方案中,位置811处的氨基酸取代是H811F。

在一些实施方案中,RNA聚合酶变体包括相对于野生型RNA聚合酶在位置880处包含氨基酸取代的RNA聚合酶,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置880处的氨基酸取代选自由F880R、F880K、F880H、F880E、F880D、F880Q、F880N、F880T、F880S、F880C、F880G、F880A、F880V、F880I、F880M、F880P、F880Y和F880W组成的组。在一些实施方案中,位置880处的氨基酸取代是F880R。在一些实施方案中,位置880处的氨基酸取代是F880K。在一些实施方案中,位置880处的氨基酸取代是F880H。在一些实施方案中,位置880处的氨基酸取代是F880E。在一些实施方案中,位置880处的氨基酸取代是F880D。在一些实施方案中,位置880处的氨基酸取代是F880Q。在一些实施方案中,位置880处的氨基酸取代是F880N。在一些实施方案中,位置880处的氨基酸取代是F880T。在一些实施方案中,位置880处的氨基酸取代是F880S。在一些实施方案中,位置880处的氨基酸取代是F880C。在一些实施方案中,位置880处的氨基酸取代是F880G。在一些实施方案中,位置880处的氨基酸取代是F880A。在一些实施方案中,位置880处的氨基酸取代是F880V。在一些实施方案中,位置880处的氨基酸取代是F880I。在一些实施方案中,位置880处的氨基酸取代是F880M。在一些实施方案中,位置880处的氨基酸取代是F880P。在一些实施方案中,位置880处的氨基酸取代是F880Y。在一些实施方案中,位置880处的氨基酸取代是F880W。

应当理解,本公开的RNA聚合酶变体可以包括多于一个(例如,2、3、4、5个或更多个)氨基酸取代和/或修饰。还应当理解,相对于包含氨基酸序列SEQ ID NO:1的野生型RNA聚合酶,任何RNA聚合酶变体可以包括G47A取代和/或额外的C末端氨基酸,例如甘氨酸。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于野生型RNA聚合酶包含(a)在位置350、351和387处的氨基酸取代和(b)在C末端的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置350处的额外氨基酸取代是E350A。在一些实施方案中,位置350处的额外氨基酸取代是E350K。在一些实施方案中,位置350处的额外氨基酸取代是E350N。在一些实施方案中,位置350处的额外氨基酸取代是E350W。在一些实施方案中,位置351处的额外氨基酸取代是D351V。在一些实施方案中,位置387处的额外氨基酸取代是K387S。在一些实施方案中,位置387处的额外氨基酸取代是K387H。在一些实施方案中,位置387处的额外氨基酸取代是K387N。在一些实施方案中,RNA聚合酶变体包含G47A取代。在一些实施方案中,RNA聚合酶变体在C末端包含额外的甘氨酸。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于野生型RNA聚合酶包含(a)在位置437和441处的氨基酸取代和(b)在C末端的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置437处的额外氨基酸取代是N437T。在一些实施方案中,位置437处的额外氨基酸取代是N437Y。在一些实施方案中,位置437处的额外氨基酸取代是N437I。在一些实施方案中,位置437处的额外氨基酸取代是N437F。在一些实施方案中,位置441处的额外氨基酸取代是K441R。在一些实施方案中,RNA聚合酶变体包含G47A取代。在一些实施方案中,RNA聚合酶变体在C末端包含额外的甘氨酸。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于野生型RNA聚合酶包含(a)在位置880处的氨基酸取代和(b)在C末端的氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置880处的额外氨基酸取代是F880Y。在一些实施方案中,C末端的氨基酸修饰是额外的丙氨酸(A)。在一些实施方案中,C末端的氨基酸修饰是额外的丝氨酸(S)。在一些实施方案中,C末端的氨基酸修饰是额外的苏氨酸(T)。在一些实施方案中,C末端的氨基酸修饰是额外的脯氨酸(P)。在一些实施方案中,RNA聚合酶变体包含G47A取代。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于野生型RNA聚合酶包含(a)在位置632、653和657处的氨基酸取代和(b)在C末端的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置632处的额外氨基酸取代是R632K。在一些实施方案中,位置632处的额外氨基酸取代是R632T。在一些实施方案中,位置653处的额外氨基酸取代是D653T。在一些实施方案中,位置653处的额外氨基酸取代是D653K。在一些实施方案中,位置657处的额外氨基酸取代是P657W。在一些实施方案中,位置657处的额外氨基酸取代是P657R。在一些实施方案中,位置657处的额外氨基酸取代是P657A。在一些实施方案中,RNA聚合酶变体包含G47A取代。在一些实施方案中,RNA聚合酶变体在C末端包含额外的甘氨酸。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于野生型RNA聚合酶包含(a)在位置628、632、653和657处的氨基酸取代和(b)在C末端的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,位置628处的额外氨基酸取代是S628W。在一些实施方案中,位置632处的额外氨基酸取代是R632K。在一些实施方案中,位置632处的额外氨基酸取代是R632T。在一些实施方案中,位置653处的额外氨基酸取代是D653T。在一些实施方案中,位置653处的额外氨基酸取代是D653K。在一些实施方案中,位置657处的额外氨基酸取代是P657W。在一些实施方案中,位置657处的额外氨基酸取代是P657R。在一些实施方案中,位置657处的额外氨基酸取代是P657A。在一些实施方案中,RNA聚合酶变体包含G47A取代。在一些实施方案中,RNA聚合酶变体在C末端包含额外的甘氨酸。

在一些实施方案中,RNA聚合酶变体包括RNA聚合酶,其相对于野生型RNA聚合酶包含(a)在位置387、657和884处的氨基酸取代和(b)在C末端的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

还应当理解,本公开包括与本文所述的RNA聚合酶变体具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的RNA聚合酶。还应当理解,本文所述的任何RNA聚合酶变体可以与包含SEQ ID NO:1的氨基酸序列的RNA聚合酶具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%的同一性。

术语“同一性”是指通过比较序列确定的两个或更多个多肽(例如酶)或多核苷酸(核酸)的序列之间的关系。同一性还指由两个或更多个氨基酸残基或核酸残基的串列之间的匹配数量确定的序列之间或之中的序列关联性的程度。同一性度量通过特定数学模型或计算机程序(例如,“算法”)确定的具有空位比对(如果有的话)的两个或更多个序列中的较小者之间的相同匹配的百分比。可以通过已知方法容易地计算相关蛋白质或核酸的同一性。“同一性百分比(%)”在应用于多肽或多核苷酸序列时被定义为在比对序列并引入空位(有必要的话)以实现最大同一性百分比之后,候选氨基酸或核酸序列中与第二序列的氨基酸序列或核酸序列中的残基相同的残基(氨基酸残基或核酸残基)的百分比。用于比对的方法和计算机程序是本领域公知的。应理解,同一性取决于同一性百分比的计算,但由于计算中引入的空位和罚分,同一性的值可能会有所不同。通常,如通过本文所述并且本领域技术人员已知的序列比对程序和参数所确定,特定多核苷酸或多肽(例如抗原)的变体与该特定参考多核苷酸或多肽具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,但小于100%的序列同一性。此类比对工具包括BLAST套件的工具(Stephen F.Altschul等(1997),“Gapped BLAST andPSI-BLAST:a new generation of protein database search programs”,Nucleic AcidsRes.25:3389-3402)。另一种流行的局部比对技术是基于Smith-Waterman算法(Smith,T.F.和Waterman,M.S.(1981)“Identification of common molecular subsequences.”J.Mol.Biol.147:195-197)。基于动态规划的一般全局比对技术是Needleman-Wunsch算法(Needleman,SB和Wunsch,CD(1970)“A general method applicable to the search forsimilarities in the amino acid sequences of two proteins.”J.Mol.Biol.48:443-453)。最近开发了一种快速最优全局序列比对算法(FOGSAA),据称该算法比其他最优全局比对方法(包括Needleman-Wunsch算法)更快地产生核苷酸和蛋白质序列的全局比对。

核苷酸盖帽类似物

本文还提供了使用本文所述的任何RNA聚合酶变体进行核糖核酸(RNA)合成的共转录加帽方法。也就是说,RNA是在“一锅法”反应中产生的,不需要单独的加帽反应。因此,在一些实施方案中,该方法包括在体外转录反应条件下使多核苷酸模板与RNA聚合酶变体、核苷三磷酸和盖帽类似物反应以产生RNA转录物。

盖帽类似物可以是例如二核苷酸盖帽、三核苷酸盖帽或四核苷酸盖帽。在一些实施方案中,盖帽类似物是二核苷酸盖帽。在一些实施方案中,盖帽类似物是三核苷酸盖帽。在一些实施方案中,盖帽类似物是四核苷酸盖帽。

在一些实施方案中,核苷酸盖帽(例如,三核苷酸盖帽或四核苷酸盖帽)包含式(I)化合物

或其立体异构体、互变异构体或盐,其中:

环B1是修饰或未修饰的鸟嘌呤;

环B2和环B3各自独立地为核碱基或修饰的核碱基;

X2是O、S(O)p、NR24或CR25R26,其中p是0、1或2;

Y0是O或CR6R7

Y1为O、S(O)n、CR6R7或NR8,其中n为0、1或2;

每个---是单键或不存在,其中当每个---是单键时,Yi是O、S(O)n、CR6R7或NR8;并且当每个---不存在时,Y1是无效的;

Y2是(OP(O)R4)m,其中m是0、1或2,或-O-(CR40R41)u-Q0-(CR42R43)v-,其中Q0是键、O、S(O)r、NR44或CR45R46,r为0、1或2,并且u和v各自独立地为1、2、3或4;

每个R2和R2'独立地为卤基、LNA或OR3

每个R3独立地为H、C1-C6烷基、C2-C6烯基或C2-C6炔基,并且当R3为C1-C6烷基、C2-C6烯基或C2-C6炔基时,其任选地被卤基、OH和C1-C6烷氧基(任选地被一个或多个OH或OC(O)-C1-C6烷基取代)中的一个或多个取代;

每个R4和R4'独立地为H、卤基、C1-C6烷基、OH、SH、SeH或BH3 -

R6、R7和R8各自独立地为-Q1-T1,其中Q1是键或C1-C3烷基接头(任选地被卤基、氰基、OH和C1-C6烷氧基中的一个或多个取代),并且T1为H、卤基、OH、COOH、氰基或Rs1,其中Rs1为C1-C3烷基、C2-C6烯基、C2-C6炔基、C1-C6烷氧基、C(O)OC1-C6烷基、C3-C8环烷基、C6-C10芳基、NR31R32、(NR31R32R33)+、4至12元杂环烷基,或5元或6元杂芳基,并且Rs1任选地被选自由以下各项组成的组的一个或多个取代基取代:卤基、OH、氧代、C1-C6烷基、COOH、C(O)OC1-C6烷基、氰基、C1-C6烷氧基、NR31R32、(NR31R32R33)+、C3-C8环烷基、C6-C10芳基、4至12元杂环烷基和5元或6元杂芳基;

R10、R11、R12、R13、R14和R15各自独立地为-Q2-T2,其中Q2为键或任选地被卤基、氰基、OH和C1-C6烷氧基中的一个或多个取代的C1-C3烷基接头,并且T2为H、卤基、OH、NH2、氰基、NO2、N3、Rs2或ORs2,其中Rs2为C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C8环烷基、C6-C10芳基、NHC(O)-C1-C6烷基、NR31R32、(NR31R32R33)+、4至12元杂环烷基,或者5元或6元杂芳基,并且Rs2任选地被选自由以下各项组成的组的一个或多个取代基取代:卤基、OH、氧代、C1-C6烷基、COOH、C(O)OC1-C6烷基、氰基、C1-C6烷氧基、NR31R32、(NR31R32R33)+、C3-C8环烷基、C6-C10芳基、4至12元杂环烷基和5元或6元杂芳基;或者,R12与R14一起为氧代,或R13与R15一起为氧代;

R20、R21、R22和R23各自独立地为-Q3-T3,其中Q3是键或任选地被卤基、氰基、OH和C1-C6烷氧基中的一个或多个取代的C1-C3烷基接头,并且T3为H、卤基、OH、NH2、氰基、NO2、N3、RS3或ORS3,其中RS3为C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C8环烷基、C6-C10芳基、NHC(O)-C1-C6烷基、单C1-C6烷基氨基、二C1-C6烷基氨基、4至12元杂环烷基,或者5元或6元杂芳基,并且Rs3任选地被选自由以下各项组成的组的一个或多个取代基取代:卤基、OH、氧代、C1-C6烷基、COOH、C(O)OC1-C6烷基、氰基、C1-C6烷氧基、氨基、单C1-C6烷基氨基、二C1-C6烷基氨基、C3-C8环烷基、C6-C10芳基、4至12元杂环烷基和5元或6元杂芳基;

R24、R25和R26各自独立地为H或C1-C6烷基;

R27和R28各自独立地为H或OR29;或R27和R28一起形成OR30-O;每个R29独立地为H、C1-C6烷基、C2-C6烯基或C2-C6炔基,并且当R29是C1-C6烷基、C2-C6烯基或C2-C6炔基时,其任选地被卤基、OH和C1-C6烷氧基(任选地被一个或多个OH或OC(O)-C1-C6烷基取代)中的一个或多个取代;

R30是任选地被卤基、OH和C1-C6烷氧基中的一个或多个取代的C1-C6亚烷基;

R31、R32和R33各自独立地为H、C1-C6烷基、C3-C8环烷基、C6-C10芳基、4至12元杂环烷基,或者5元或6元杂芳基;

R40、R41、R42和R43各自独立地为H、卤基、OH、氰基、N3、OP(O)R47R48或任选地被一个或多个OP(O)R47R48取代的C1-C6烷基,或者一个R41和一个R43与它们所连接的碳原子和Q0一起形成C4-C10环烷基、4至14元杂环烷基、C6-C10芳基或5至14元杂芳基,并且环烷基、杂环烷基、苯基或5至6元杂芳基各自任选地被OH、卤基、氰基、N3、氧代、OP(O)R47R48、C1-C6烷基、C1-C6卤代烷基、COOH、C(O)OC1-C6烷基、C1-C6烷氧基、C1-C6卤代烷氧基、氨基、单C1-C6烷基氨基和二C1-C6烷基氨基中的一个或多个取代;

R44为H、C1-C6烷基或胺保护基;

R45和R46各自独立地为H、OP(O)R47R48或任选地被一个或多个OP(O)R47R48取代的C1-C6烷基,并且

R47和R48各自独立地为H、卤基、C1-C6烷基、OH、SH、SeH或BH3-。

应当理解,如本文所提供的盖帽类似物可以包括在2017年4月20日公布的国际公开WO 2017/066797中描述的任何盖帽类似物,该文献通过引用整体并入本文。

在一些实施方案中,B2中间位置可以是非核糖分子,例如阿拉伯糖。

在一些实施方案中,R2是基于乙基的。

因此,在一些实施方案中,三核苷酸盖帽包含以下结构:

在其他实施方案中,三核苷酸盖帽包含以下结构:

在其他实施方案中,三核苷酸盖帽包含以下结构:

在其他实施方案中,三核苷酸盖帽包含以下结构:

因此,在一些实施方案中,四核苷酸盖帽包含以下结构:

在其他实施方案中,四核苷酸盖帽包含以下结构:

在其他实施方案中,四核苷酸盖帽包含以下结构:

在其他实施方案中,四核苷酸盖帽包含以下结构:

在一些实施方案中,R是烷基(例如,C1-C6烷基)。在一些实施方案中,R是甲基(例如,C1烷基)。在一些实施方案中,R是乙基(例如,C2烷基)。在一些实施方案中,R为氢。

在一些实施方案中,三核苷酸盖帽包含选自以下序列的序列:GAA、GAC、GAG、GAU、GCA、GCC、GCG、GCU、GGA、GGC、GGG、GGU、GUA、GUC、GUG和GUU。在一些实施方案中,三核苷酸盖帽包含GAA。在一些实施方案中,三核苷酸盖帽包含GAC。在一些实施方案中,三核苷酸盖帽包含GAG。在一些实施方案中,三核苷酸盖帽包含GAU。在一些实施方案中,三核苷酸盖帽包含GCA。在一些实施方案中,三核苷酸盖帽包含GCC。在一些实施方案中,三核苷酸盖帽包含GCG。在一些实施方案中,三核苷酸盖帽包含GCU。在一些实施方案中,三核苷酸盖帽包含GGA。在一些实施方案中,三核苷酸盖帽包含GGC。在一些实施方案中,三核苷酸盖帽包含GGG。在一些实施方案中,三核苷酸盖帽包含GGU。在一些实施方案中,三核苷酸盖帽包含GUA。在一些实施方案中,三核苷酸盖帽包含GUC。在一些实施方案中,三核苷酸盖帽包含GUG。在一些实施方案中,三核苷酸盖帽包含GUU。

在一些实施方案中,三核苷酸盖帽包含选自以下序列的序列:m7GpppApA、m7GpppApC、m7GpppApG、m7GpppApU、m7GpppCpA、m7GpppCpC、m7GpppCpG、m7GpppCpU、m7GpppGpA、m7GpppGpC、m7GpppGpG、m7GpppGpU、m7GpppUpA、m7GpppUpC、m7GpppUpG和m7GpppUpU。

在一些实施方案中,三核苷酸盖帽包含m7GpppApA。在一些实施方案中,三核苷酸盖帽包含m7GpppApC。在一些实施方案中,三核苷酸盖帽包含m7GpppApG。在一些实施方案中,三核苷酸盖帽包含m7GpppApU。在一些实施方案中,三核苷酸盖帽包含m7GpppCpA。在一些实施方案中,三核苷酸盖帽包含m7GpppCpC。在一些实施方案中,三核苷酸盖帽包含m7GpppCpG。在一些实施方案中,三核苷酸盖帽包含m7GpppCpU。在一些实施方案中,三核苷酸盖帽包含m7GpppGpA。在一些实施方案中,三核苷酸盖帽包含m7GpppGpC。在一些实施方案中,三核苷酸盖帽包含m7GpppGpG。在一些实施方案中,三核苷酸盖帽包含m7GpppGpU。在一些实施方案中,三核苷酸盖帽包含m7GpppUpA。在一些实施方案中,三核苷酸盖帽包含m7GpppUpC。在一些实施方案中,三核苷酸盖帽包含m7GpppUpG。在一些实施方案中,三核苷酸盖帽包含m7GpppUpU。

在一些实施方案中,三核苷酸盖帽包含选自以下序列的序列:m7G3′OMepppApA、m7G3′OMepppApC、m7G3′OMepppApG、m7G3′OMepppApU、m7G3′OMepppCpA、m7G3′OMepppCpC、m7G3′ OMepppCpG、m7G3′OMepppCpU、m7G3′OMepppGpA、m7G3′OMepppGpC、m7G3′OMepppGpG、m7G3′OMepppGpU、m7G3′OMepppUpA、m7G3′OMepppUpC、m7G3′OMepppUpG和m7G3′OMepppUpU。

在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppApA。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppApC。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppApG。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppApU。在一些实施方案中,三核苷酸盖帽包含m7G3′ OMepppCpA。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppCpC。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppCpG。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppCpU。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppGpA。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppGpC。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppGpG。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppGpU。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppUpA。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppUpC。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppUpG。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppUpU。

在其他实施方案中,三核苷酸盖帽包含选自以下序列的序列:m7G3′OMepppA2′OMepA、m7G3′OMepppA2′OMepC、m7G3′OMepppA2′OMepG、m7G3′OMepppA2′OMepU、m7G3′OMepppC2′OMepA、m7G3′ OMepppC2′OMepC、m7G3′OMepppC2′OMepG、m7G3′OMepppC2′OMepU、m7G3′OMepppG2′OMepA、m7G3′OMepppG2′ OMepC、m7G3′OMepppG2′OMepG、m7G3′OMepppG2′OMepU、m7G3′OMepppU2′OMepA、m7G3′OMepppU2′OMepC、m7G3′ OMepppU2′OMepG和m7G3′OMepppU2′OMepU。

在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppA2′OMepA。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppA2′OMepC。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppA2′ OMepG。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppA2′OMepU。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppC2′OMepA。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppC2′OMepC。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppC2′OMepG。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppC2′OMepU。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppG2′OMepA。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppG2′OMepC。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppG2′OMepG。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppG2′OMepU。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppU2′OMepA。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppU2′OMepC。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppU2′OMepG。在一些实施方案中,三核苷酸盖帽包含m7G3′OMepppU2′OMepU。

在其他实施方案中,三核苷酸盖帽包含选自以下序列的序列:m7GpppA2′OMepA、m7GpppA2′OMepC、m7GpppA2′OMepG、m7GpppA2′OMepU、m7GpppC2′OMepA、m7GpppC2′OMepC、m7GpppC2′ OMepG、m7GpppC2′OMepU、m7GpppG2′OMepA、m7GpppG2′OMepC、m7GpppG2′OMepG、m7GpppG2′OMepU、m7GpppU2′OMepA、m7GpppU2′OMepC、m7GpppU2′OMepG和m7GpppU2′OMepU。

在一些实施方案中,三核苷酸盖帽包含m7GpppA2′OMepA。在一些实施方案中,三核苷酸盖帽包含m7GpppA2′OMepC。在一些实施方案中,三核苷酸盖帽包含m7GpppA2′OMepG。在一些实施方案中,三核苷酸盖帽包含m7GpppA2′OMepU。在一些实施方案中,三核苷酸盖帽包含m7GpppC2′OMepA。在一些实施方案中,三核苷酸盖帽包含m7GpppC2′OMepC。在一些实施方案中,三核苷酸盖帽包含m7GpppC2′OMepG。在一些实施方案中,三核苷酸盖帽包含m7GpppC2′OMepU。在一些实施方案中,三核苷酸盖帽包含m7GpppG2′OMepA。在一些实施方案中,三核苷酸盖帽包含m7GpppG2′OMepC。在一些实施方案中,三核苷酸盖帽包含m7GpppG2′OMepG。在一些实施方案中,三核苷酸盖帽包含m7GpppG2′OMepU。在一些实施方案中,三核苷酸盖帽包含m7GpppU2′OMepA。在一些实施方案中,三核苷酸盖帽包含m7GpppU2′OMepC。在一些实施方案中,三核苷酸盖帽包含m7GpppU2′OMepG。在一些实施方案中,三核苷酸盖帽包含m7GpppU2′OMepU。

在一些实施方案中,三核苷酸盖帽包含m7Gpppm6A2’OmepG。在一些实施方案中,三核苷酸盖帽包含m7Gpppe6A2’OmepG。

在一些实施方案中,三核苷酸盖帽包含GAG。在一些实施方案中,三核苷酸盖帽包含GCG。在一些实施方案中,三核苷酸盖帽包含GUG。在一些实施方案中,三核苷酸盖帽包含GGG。

在一些实施方案中,三核苷酸盖帽包含以下结构中的任一种:

在一些实施方案中,四核苷酸盖帽包含GGAG。

在一些实施方案中,四核苷酸盖帽包含以下结构中的任一种:

体外转录方法

本公开的一些方面提供产生RNA转录物(例如,mRNA转录物)的方法,其包括在引起RNA转录物产生的条件下使DNA模板与RNA聚合酶(例如,T7 RNA聚合酶如T7 RNA聚合酶变体)接触。

在一些实施方案中,所述方法包括使DNA模板与包含(至少一个)额外的C末端氨基酸(例如,Gly、Ala、GlyGly、AlaAla、GlyAla或AlaGly)的T7 RNA聚合酶变体接触。

在一些方面,本公开提供进行IVT反应的方法,其包括在引起RNA转录物产生的条件下,在核苷三磷酸和缓冲液的存在下,使DNA模板与RNA聚合酶(例如,T7 RNA聚合酶如T7RNA聚合酶变体)接触。

本公开的其它方面提供共转录加帽方法,其包括在体外转录反应条件下使多核苷酸模板与T7 RNA聚合酶变体、核苷三磷酸和盖帽类似物反应以产生RNA转录物。

在一些实施方案中,用于RNA合成的共转录加帽方法包括使多核苷酸模板与以下各项在体外转录反应条件下反应产生RNA转录物:(a)相对于野生型RNA聚合酶包含至少一个氨基酸取代的T7 RNA聚合酶变体,该氨基酸取代在RNA聚合酶变体从起始复合物转变为延伸复合物时导致RNA聚合酶变体的至少一个环结构经历构象变化而形成螺旋结构(例如,至少一个氨基酸取代位置42、43、44、45、46和/或47);(b)核苷三磷酸;和(c)包含序列GpppA2′OmepG的三核苷酸盖帽,其中该多核苷酸模板在模板位置+1处包含2′-脱氧胸苷残基。

IVT条件通常需要包含启动子的纯化线性DNA模板、核苷三磷酸、包含二硫苏糖醇(DTT)和镁离子的缓冲系统以及RNA聚合酶。转录反应中使用的确切条件取决于特定应用所需的RNA量。典型的IVT反应是通过在转录缓冲液中将DNA模板与RNA聚合酶和核苷三磷酸(包括GTP、ATP、CTP和UTP(或核苷酸类似物))一起培育来进行。该反应产生具有5’末端三磷酸鸟苷的RNA转录物。

脱氧核糖核酸(DNA)只是RNA聚合酶的核酸模板。DNA模板可以包括编码目标多肽(例如,抗原多肽)的多核苷酸。在一些实施方案中,DNA模板包括位于编码目标多肽的多核苷酸的5’端并与其可操作地连接的RNA聚合酶启动子(例如,T7 RNA聚合酶启动子)。DNA模板还可以包括位于目标基因的3’末端的编码聚腺苷酸化(polyA)尾部的核苷酸序列。

目标多肽包括但不限于生物制剂、抗体、抗原(疫苗)和治疗性蛋白质。术语“蛋白质”包括肽。

在一些实施方案中,RNA转录物是IVT反应的产物。在一些实施方案中,RNA转录物是信使RNA(mRNA),其包括编码与polyA尾部相连的目标多肽的核苷酸序列。在一些实施方案中,mRNA是修饰的mRNA(mmRNA),其包括至少一个修饰的核苷酸。

核苷酸包括含氮碱基、五碳糖(核糖或脱氧核糖)和至少一个磷酸基团。核苷酸包括核苷单磷酸、核苷二磷酸和核苷三磷酸。核苷单磷酸(NMP)包括与核糖和单个磷酸连接的核碱基;核苷二磷酸(NDP)包括与核糖和两个磷酸连接的核碱基;核苷三磷酸(NTP)包括与核糖和三个磷酸连接的核碱基。核苷酸类似物是具有核苷酸的一般结构或与核苷酸结构相似的化合物。核苷酸类似物包括例如核碱基类似物、糖类似物和/或核苷酸的磷酸基团的类似物。

核苷包括含氮碱基和5碳糖。因此,核苷加磷酸基团产生核苷酸。核苷类似物是具有核苷的一般结构或与核苷结构相似的化合物。核苷类似物包括例如核碱基类似物和/或核苷的糖的类似物。

应当理解,除非另有说明,否则术语“核苷酸”包括天然存在的核苷酸、合成核苷酸和修饰的核苷酸。本文提供的用于例如在IVT反应中产生RNA的天然存在的核苷酸的实例包括三磷酸腺苷(ATP)、三磷酸鸟苷(GTP)、三磷酸胞苷(CTP)、三磷酸尿苷(UTP)和5-甲基尿苷三磷酸(m5UTP)。在一些实施方案中,使用二磷酸腺苷(ADP)、二磷酸鸟苷(GDP)、二磷酸胞苷(CDP)和/或二磷酸尿苷(UDP)。

核苷酸类似物的实例包括但不限于抗病毒核苷酸类似物、磷酸类似物(可溶性或固定化、可水解的或不可水解的)、二核苷酸、三核苷酸、四核苷酸(例如盖帽类似物)或用于酶促加帽(牛痘或连接酶)的前体/底物、用官能团标记以促进盖帽或5’部分(IRES)的连接/缀合的核苷酸、用5’PO4标记以促进盖帽或5’部分的连接的核苷酸,或用可以化学或酶促裂解的官能团/保护基团标记的核苷酸。抗病毒核苷酸/核苷类似物的实例包括但不限于更昔洛韦(Ganciclovir)、恩替卡韦(Entecavir)、替比夫定(Telbivudine)、阿糖腺苷(Vidarabine)和西多福韦(Cidofovir)。

修饰的核苷酸可以包括修饰的核碱基。例如,本公开的RNA转录物(例如,mRNA转录物)可以包括选自以下各项的修饰的核碱基:假尿苷(ψ)、1-甲基假尿苷(m1ψ)、1-乙基假尿苷、2-硫代尿苷、4'-硫代尿苷、2-硫代-1-甲基-1-去氮杂-假尿苷、2-硫代-1-甲基-假尿苷、2-硫代-5-氮杂-尿苷、2-硫代-二氢假尿苷、2-硫代-二氢尿苷、2-硫代-假尿苷、4-甲氧基-2-硫代-假尿苷、4-甲氧基-假尿苷、4-硫代-1-甲基-假尿苷、4-硫代-假尿苷、5-氮杂-尿苷、二氢假尿苷、5-甲基尿苷、5-甲氧基尿苷(mo5U)和2'-O-甲基尿苷。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括上述修饰的核碱基中的至少两个(例如,2、3、4个或更多个)的组合。

如本文所提供的核苷三磷酸(NTP)可以包含未修饰或修饰的ATP、修饰或未修饰的UTP、修饰或未修饰的GTP和/或修饰或未修饰的CTP。在一些实施方案中,IVT反应的NTP包含未修饰的ATP。在一些实施方案中,IVT反应的NTP包含修饰的ATP。在一些实施方案中,IVT反应的NTP包含未修饰的UTP。在一些实施方案中,IVT反应的NTP包含修饰的UTP。在一些实施方案中,IVT反应的NTP包含未修饰的GTP。在一些实施方案中,IVT反应的NTP包含修饰的GTP。在一些实施方案中,IVT反应的NTP包含未修饰的CTP。在一些实施方案中,IVT反应的NTP包含修饰的CTP。

存在于IVT反应中的核苷三磷酸和盖帽类似物的浓度可以有所不同。在一些实施方案中,NTP和盖帽类似物是以等摩尔浓度存在于反应中。在一些实施方案中,反应中盖帽类似物(例如,三核苷酸盖帽)与核苷三磷酸的摩尔比大于1:1。例如,反应中盖帽类似物与核苷三磷酸的摩尔比可以是2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、15:1、20:1、25:1、50:1或100:1。在一些实施方案中,反应中盖帽类似物(例如,三核苷酸盖帽)与核苷三磷酸的摩尔比小于1:1。例如,反应中盖帽类似物(例如,三核苷酸盖帽)与核苷三磷酸的摩尔比可以是1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:15、1:20、1:25、1:50或1:100。

IVT反应中NTP的组成也可以变化。例如,可以使用多于GTP、CTP和UTP的ATP。作为非限制性实例,IVT反应可以包括7.5毫摩尔GTP、7.5毫摩尔CTP、7.5毫摩尔UTP和3.75毫摩尔ATP。相同的IVT反应可以包括3.75毫摩尔盖帽类似物(例如,三核苷酸盖帽)。在一些实施方案中,G:C:U:A:盖帽的摩尔比为1:1:1:0.5:0.5。在一些实施方案中,G:C:U:A:盖帽的摩尔比为1:1:0.5:1:0.5。在一些实施方案中,G:C:U:A:盖帽的摩尔比为1:0.5:1:1:0.5。在一些实施方案中,G:C:U:A:盖帽的摩尔比为0.5:1:1:1:0.5。

在一些实施方案中,RNA转录物(例如,mRNA转录物)包括选自假尿苷(ψ)、1-甲基假尿苷(m1ψ)、5-甲氧基尿苷(mo5U)、5-甲基胞苷(m5C)、α-硫代鸟苷和α-硫代腺苷的修饰的核碱基。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括上述修饰的核碱基中的至少两个(例如,2、3、4个或更多个)的组合。

在一些实施方案中,RNA转录物(例如,mRNA转录物)包括假尿苷(ψ)。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括1-甲基假尿苷(m1ψ)。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括5-甲氧基尿苷(mo5U)。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括5-甲基胞苷(m5C)。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括α-硫代鸟苷。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括α-硫代腺苷。

在一些实施方案中,针对特定修饰对多核苷酸(例如,RNA多核苷酸,如mRNA多核苷酸)进行均匀修饰(例如,完全修饰、在整个序列中修饰)。例如,可以用1-甲基假尿苷(m1ψ)均匀修饰多核苷酸,这意味着mRNA序列中的所有尿苷残基都被1-甲基假尿苷(m1ψ)替换。类似地,多核苷酸可以通过用修饰的残基(诸如以上列出的任一个)替换而针对序列中存在的任何类型的核苷残基进行均匀修饰。或者,多核苷酸(例如,RNA多核苷酸如mRNA多核苷酸)可以不是均匀修饰的(例如,部分修饰、部分序列被修饰)。每种可能性代表本发明的不同实施方案。

在一些实施方案中,缓冲系统包含tris。例如,用于IVT反应的tris的浓度可以是至少10mM、至少20mM、至少30mM、至少40mM、至少50mM、至少60mM、至少70mM、至少80mM、至少90mM、至少100mM或至少110mM磷酸盐。在一些实施方案中,磷酸盐的浓度为20-60mM或10-100mM。

在一些实施方案中,缓冲系统包含二硫苏糖醇(DTT)。例如,用于IVT反应的DTT的浓度可以是至少1mM、至少5mM或至少50mM。在一些实施方案中,用于IVT反应的DTT的浓度为1-50mM或5-50mM。在一些实施方案中,用于IVT反应的DTT的浓度为5mM。

在一些实施方案中,缓冲系统包含镁。在一些实施方案中,存在于IVT反应中的NTP与镁离子(Mg2+;例如MgCl2)的摩尔比为1:1至1:5。例如,NTP与镁离子的摩尔比可以是1:1、1:2、1:3、1:4或1:5。

在一些实施方案中,存在于IVT反应中的NTP+盖帽类似物(例如,三核苷酸盖帽,如GAG)与镁离子(Mg2+;例如,MgCl2)的摩尔比为1:1至1:5。例如,NTP+三核苷酸盖帽(例如,GAG)与镁离子的摩尔比可以是1:1、1:2、1:3、1:4或1:5。

在一些实施方案中,缓冲系统包含的Tris-HCl、亚精胺(例如,浓度为1-30mM)、X-100(聚乙二醇对-(1,1,3,3-四甲基丁基)-苯基醚)和/或聚乙二醇(PEG)。

将核苷三磷酸(NTP)添加到生长的RNA链的3’末端是由聚合酶(例如T7 RNA聚合酶,例如本公开的任何一种或多种T7 RNA聚合酶变体(例如,G47A))催化。在一些实施方案中,RNA聚合酶(例如,T7 RNA聚合酶变体)以0.01mg/ml至1mg/ml的浓度存在于反应(例如,IVT反应)中。例如,RNA聚合酶可以以0.01mg/mL、0.05mg/ml、0.1mg/ml、0.5mg/ml或1.0mg/ml的浓度存在于反应中。

令人惊讶的是,例如在体外转录反应中使用如本文所提供的T7RNA聚合酶变体(例如G47A)与盖帽类似物(例如GpppA2′OmepG)的组合导致产生RNA转录物,其中超过80%的产生的RNA转录物包括功能盖帽。在一些实施方案中,超过85%的产生的RNA转录物包括功能盖帽。在一些实施方案中,超过90%的产生的RNA转录物包括功能盖帽。在一些实施方案中,超过95%的产生的RNA转录物包括功能盖帽。在一些实施方案中,超过96%的产生的RNA转录物包括功能盖帽。在一些实施方案中,超过97%的产生的RNA转录物包括功能盖帽。在一些实施方案中,超过98%的产生的RNA转录物包括功能盖帽。在一些实施方案中,超过99%的产生的RNA转录物包括功能盖帽。

同样令人惊讶的是,发现使用在模板位置+1处包含2′-脱氧胸苷残基或2′-脱氧胞苷残基的多核苷酸模板产生RNA转录物,其中所产生的RNA转录物的多于80%(例如,多于85%、多于90%或多于95%)包括功能盖帽。因此,在一些实施方案中,例如在IVT反应中使用的多核苷酸(例如,DNA)模板在模板位置+1处包含2′-脱氧胸苷残基。在其他实施方案中,例如在IVT反应中使用的多核苷酸(例如,DNA)模板在模板位置+1处包含2′-脱氧胞苷残基。

多取代RNA T7聚合酶变体

本公开的各个方面提供了包含至少两个氨基酸取代的RNA T7聚合酶变体。在一些实施方案中,RNA T7聚合酶变体包含至少三个氨基酸取代。在一些实施方案中,RNA T7聚合酶变体包含至少四个氨基酸取代。在一些实施方案中,RNA T7聚合酶变体包含至少五个氨基酸取代。相对于野生型T7 RNA聚合酶(例如,包含SEQ ID NO:1的氨基酸序列)包括G47A取代的RNA T7聚合酶变体在本文中可称为“G47A T7 Pol变体”。

下表1提供了本公开的多取代RNA T7聚合酶变体的实例。应当理解,相对于包含SEQ ID NO:1的氨基酸序列的野生型T7 RNA聚合酶,表1中包括的每个T7聚合酶变体都包含G47A取代。还应当理解,相对于包含SEQ ID NO:1的氨基酸序列的野生型T7 RNA聚合酶,表1中包括的每个T7聚合酶变体在位置884处包含额外的C末端氨基酸。该额外的C末端氨基酸是甘氨酸(G884),除非另有说明:G884T表示T7 RNA聚合酶变体,其在位置884处包含苏氨酸(代替甘氨酸);G884S表示T7 RNA聚合酶变体,其在位置884处包含丝氨酸(代替甘氨酸);G884P表示T7 RNA聚合酶变体,其在位置884处包含脯氨酸(代替甘氨酸);并且G884A表示T7RNA聚合酶变体,其在位置884处包含丙氨酸(代替甘氨酸)。表1中的所有取代是相对于包含SEQ ID NO:1的氨基酸序列的野生型T7 RNA聚合酶变体。

表1.多取代RNA T7聚合酶变体

应用

根据本公开产生的RNA转录物包括mRNA(包括修饰的mRNA和/或未修饰的RNA)、lncRNA、自我复制型RNA、环状RNA、CRISPR向导RNA等。在实施方案中,RNA是编码多肽(例如治疗性多肽)的RNA(例如,mRNA或自我复制型RNA)。因此,使用本公开的RNA聚合酶变体产生的RNA转录物可用于无数应用中。

例如,RNA转录物可用于产生目标多肽,例如治疗性蛋白质、疫苗抗原等。在一些实施方案中,RNA转录物是治疗性RNA。治疗性mRNA是编码治疗性蛋白质(术语“蛋白质”包括肽)的mRNA。治疗性蛋白质在宿主细胞或受试者中介导多种效应以治疗疾病或改善疾病的体征和症状。例如,治疗性蛋白质可以替代有缺陷或异常的蛋白质,增强内源性蛋白质的功能,为细胞提供新功能(例如,抑制或激活内源性细胞活性),或充当另一种治疗化合物(例如,抗体-药物缀合物)的递送剂。治疗性mRNA可用于治疗以下疾病和病状:细菌感染、病毒感染、寄生虫感染、细胞增殖障碍、遗传障碍和自身免疫障碍。其他疾病和病状包括在本文中。

由本文提供的mRNA编码的目标蛋白质可以是基本上任何蛋白质。在一些实施方案中,治疗性蛋白质是细胞因子、生长因子、抗体或融合蛋白。治疗性蛋白质的非限制性实例包括血液因子(例如因子VIII和因子VII)、补体因子、低密度脂蛋白受体(LDLR)和MUT1。细胞因子的非限制性实例包括白介素、干扰素、趋化因子、淋巴因子等。生长因子的非限制性实例包括促红细胞生成素、EGF、PDGF、FGF、TGF、IGF、TNF、CSF、MCSF、GMCSF等。抗体的非限制性实例包括阿达木单抗(adalimumab)、英夫利昔单抗(infliximab)、利妥昔单抗(rituximab)、伊匹单抗(ipilimumab)、托珠单抗(tocilizumab)、卡那单抗(canakinumab)、伊立珠单抗(itolizumab)、曲洛金单抗(tralokinumab)。融合蛋白的非限制性实例包括例如依那西普(etanercept)、阿巴西普(阿巴西普)和贝拉西普(belatacept)。

在一些实施方案中,目标蛋白质是人促红细胞生成素、LDLR(用于抑制胆固醇)或MUT1(用于治疗甲基丙二酸血症(MMA))。在其他实施方案中,由mRNA编码的目标蛋白质是治疗性抗体,包括但不限于上面列出的抗体。

使用本文公开的RNA聚合酶变体产生的RNA转录物可以编码一种或多种生物制剂。生物制剂是一种基于多肽的分子,其可用于治疗、治愈、减轻、预防或诊断严重或危及生命的疾病或医学状况。生物制剂包括但不限于变应原提取物(例如用于过敏注射和测试)、血液成分、基因治疗产品、用于移植的人体组织或细胞产品、疫苗、单克隆抗体、细胞因子、生长因子、酶、溶栓剂和免疫调节剂等。

当前在销售或开发中的一种或多种生物制剂可以由本发明的RNA编码。尽管不希望受理论束缚,但据信将已知生物制剂的编码多核苷酸并入本公开的RNA中将会改善治疗功效,这至少部分是由于构建体设计的特异性、纯度和/或选择性。

使用本文公开的RNA聚合酶变体产生的RNA转录物可以编码一种或多种抗体。术语“抗体”包括单克隆抗体(包括具有免疫球蛋白Fc区的全长抗体)、具有多表位特异性的抗体组合物、多特异性抗体(例如,双特异性抗体、双抗体和单链分子)以及抗体片段。术语“免疫球蛋白”(Ig)在本文中与“抗体”可互换使用。单克隆抗体是指从基本上同质抗体的群体获得的抗体,即,组成该群体的个别抗体是相同的,除了可以微量存在的可能的天然存在的突变和/或翻译后修饰(例如,异构化、酰胺化)。单克隆抗体针对单一抗原位点具有高度特异性。

单克隆抗体具体包括嵌合抗体(免疫球蛋白),其中重链和/或轻链的一部分与源自特定物种或属于特定抗体种类或亚类的抗体中的相应序列相同或同源,而这些链的其余部分与源自另一物种或属于另一抗体种类或亚类的抗体中的相应序列相同或同源;以及此类抗体的片段,只要它们表现出所需的生物学活性。嵌合抗体包括但不限于“灵长类动物源化”抗体,其包含源于非人灵长类动物(例如,旧世纪猴(Old World Monkey)、猿等)的可变结构域抗原结合序列和人恒定区序列。

本公开的RNA所编码的抗体可用于治疗许多治疗领域(诸如但不限于血液、心血管、CNS、中毒(包括抗蛇毒素)、皮肤病学、内分泌学、胃肠道、医学成像、肌肉骨骼、肿瘤学、免疫学、呼吸、感觉和抗感染)的病状或疾病。

使用本文公开的RNA聚合酶变体产生的RNA转录物可以编码一种或多种疫苗抗原。疫苗抗原是一种生物制剂,可提高对特定疾病或传染原的免疫力。当前在销售或开发中的一种或多种疫苗抗原可以由本公开的RNA编码。RNA编码的疫苗抗原可用于治疗许多治疗领域中的病状或疾病,例如但不限于癌症、过敏症和传染病。在一些实施方案中,癌症疫苗可以是编码肽表位的多联体或个体RNA或其组合的形式的个性化癌症疫苗。

使用本文公开的RNA聚合酶变体产生的RNA转录物可以被设计成编码一种或多种抗微生物肽(AMP)或抗病毒肽(AVP)。已经从一系列动物(例如但不限于微生物、无脊椎动物、植物、两栖动物、鸟类、鱼类和哺乳动物)中分离和描述了AMP和AVP。抗微生物多肽可以阻断一种或多种包膜病毒(例如,HIV、HCV)的细胞融合和/或病毒进入。例如,抗微生物多肽可以包含对应于某个区域的合成肽或由其组成,该区域是例如病毒包膜蛋白(例如,HIV-1gp120或gp41)的跨膜亚基的至少约5、10、15、20、25、30、35、40、45、50、55或60个氨基酸的连续序列。HIV-1gp120或gp41的氨基酸和核苷酸序列描述在例如Kuiken等人,(2008)."HIVSequence Compendium,"Los Alamos National Laboratory。

在一些实施方案中,RNA转录物用作放射性标记的RNA探针。在一些实施方案中,RNA转录物用于非同位素RNA标记。在一些实施方案中,RNA转录物用作用于基因靶向的向导RNA(gRNA)。在一些实施方案中,RNA转录物(例如,mRNA)用于体外翻译和微注射。在一些实施方案中,RNA转录物用于RNA结构、加工和催化研究。在一些实施方案中,RNA转录物用于RNA扩增。在一些实施方案中,RNA转录物用作用于基因表达实验的反义RNA。本公开涵盖其他应用。

其它实施方案:

本公开的其他实施方案涵盖在以下编号的段落中:

1.一种包含RNA聚合酶的核糖核酸(RNA)聚合酶变体,所述RNA聚合酶包含:

(a)在用于从头RNA合成的结合位点残基处的氨基酸取代;和

(b)相对于野生型RNA聚合酶提高转录效率的氨基酸修饰。

2.如段落1所述的RNA聚合酶变体,其中当RNA聚合酶变体从起始复合物转变为延伸复合物时,氨基酸修饰使得RNA聚合酶变体的环结构经历构象变化而形成螺旋结构。

3.如段落2所述的RNA聚合酶变体,其中氨基酸修饰是相对于野生型RNA聚合酶在位置47处的氨基酸取代,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

4.如段落3所述的RNA聚合酶变体,其中位置47处的氨基酸取代是G47A。

5.如段落1-4中任一项所述的RNA聚合酶变体,其中相对于野生型RNA聚合酶,氨基酸修饰包含额外的C末端氨基酸。

6.如段落5所述的RNA聚合酶变体,其中额外的C末端氨基酸是甘氨酸。

7.如段落1-6中任一项所述的RNA聚合酶变体,其中相对于野生型RNA聚合酶,结合位点残基处的氨基酸取代产生以下益处中的至少一个:

(i)提高转录效率;

(ii)提高共转录加帽效率;

(iii)在1/2浓度的盖帽类似物下增加RNA的产量;

(iv)在1/2浓度的盖帽类似物下提高RNA的3’同质性;

(v)提高转录保真度;和/或

(vi)降低dsRNA污染的量。

8.如段落1-6中任一项所述的聚合酶变体,其中相对于(b)的氨基酸修饰,结合位点残基处的氨基酸取代产生以下益处中的至少一个:

(i)提高转录效率;

(ii)提高共转录加帽效率;

(iii)在1/2浓度的盖帽类似物下增加RNA的产量;

(iv)在1/2浓度的盖帽类似物下提高RNA的3’同质性;

(v)提高转录保真度;和/或

(vi)降低dsRNA污染的量。

9.如段落1-8中任一项所述的RNA聚合酶变体,其中在结合位点残基处的氨基酸取代是相对于野生型RNA聚合酶在选自位置350、351、387、394、425、427、437、441、506、628、632、653、657、811和880的位置处的取代,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

10.一种包含RNA聚合酶的RNA聚合酶变体,所述RNA聚合酶包含:

(a)在选自位置350、351、387、394、425、427、437、441、506、628、632、653、657、811和880的位置处的氨基酸取代;和

(b)相对于野生型RNA聚合酶,在C末端处的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

11.如段落10所述的RNA聚合酶变体,其包含(b)的额外氨基酸取代。

12.如段落11所述的RNA聚合酶变体,其中(b)的额外氨基酸取代在位置47处。

13.如段落12所述的RNA聚合酶变体,其中位置47处的额外氨基酸取代是G47A。

14.如段落10-13中任一项所述的RNA聚合酶变体,其在C末端处包含氨基酸修饰。

15如段落14所述的RNA聚合酶变体,其中在C末端处的氨基酸修饰包含额外的C末端氨基酸。

16.如段落15所述的RNA聚合酶变体,其中额外的C末端氨基酸选自甘氨酸、丝氨酸、丙氨酸、脯氨酸和苏氨酸。

17.如段落16所述的RNA聚合酶变体,其中额外的C末端氨基酸是甘氨酸。

18.如段落16所述的RNA聚合酶变体,其中额外的C末端氨基酸是丙氨酸。

19.如段落17或18所述的RNA聚合酶变体,其包含RNA聚合酶,所述RNA聚合酶包含:

(a)在选自位置350、351、387、394、425、427、437、441、506、628、632、653、657、811和880的位置处的氨基酸取代;

(b)额外的氨基酸取代;和

(c)相对于野生型RNA聚合酶,在C末端处的氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

20.如段落19所述的RNA聚合酶变体,其中额外的氨基酸取代在位置47处。

21.如段落20所述的RNA聚合酶变体,其中位置47处的额外氨基酸取代是G47A。

22.如段落19-21中任一项所述的RNA聚合酶变体,其中C末端处的氨基酸修饰包含额外的C末端氨基酸。

23.如段落22所述的RNA聚合酶变体,其中额外的C末端氨基酸选自甘氨酸、丝氨酸、丙氨酸、脯氨酸、谷氨酰胺和苏氨酸。

24.如段落23所述的RNA聚合酶变体,其中额外的C末端氨基酸是甘氨酸。

25.如段落1-24中任一项所述的RNA聚合酶变体,其中相对于野生型RNA聚合酶,(a)的额外氨基酸取代在选自位置387、350、351、506、628、653和657的位置处,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

26.如段落25所述的RNA聚合酶变体,其中额外的氨基酸取代选自K387S、K387H和K387N。

27.如段落25所述的RNA聚合酶变体,其中额外的氨基酸取代选自E350K、E350N、E350A和E350W。

28.如段落25所述的RNA聚合酶变体,其中额外的氨基酸取代是D351V。

29.如段落25所述的RNA聚合酶变体,其中额外的氨基酸取代是D506W。

30.如段落25所述的RNA聚合酶变体,其中额外的氨基酸取代是S628W。

31.如段落25所述的RNA聚合酶变体,其中额外的氨基酸取代是D653W。

32.如段落25所述的RNA聚合酶变体,其中额外的氨基酸取代是P657W。

33.如段落1-24中任一项所述的RNA聚合酶变体,其中相对于野生型RNA聚合酶,(a)的额外氨基酸取代在选自位置350、351、387和437的位置处,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

34.如段落33所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置350处,并且位置350处的额外氨基酸取代选自E350R、E350K、E350D、E350Q、E350N、E350T、E350S、E350C、E350G、E350A、E350V、E350L、E350I、E350P、E350Y、E350W和E350F。

35.如段落33所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置351处,并且位置350处的额外氨基酸取代选自D351R、D351K、D351Q、D351T、D351S、D351C、D351V、D351L、D351I、D351M、D351P、D351Y和D351W。

36.如段落33所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置387处,并且位置387处的额外氨基酸取代选自K387R、K387H、K387T、K387S、K387V、K387L、K387I和K387M。

37.如段落33所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置437处,并且位置437处的额外氨基酸取代选自N437Q、N437T、N437S、N437G和N437F。

38.如段落22所述的RNA聚合酶变体,其中额外的C末端氨基酸是丝氨酸或丙氨酸。

39.如段落33所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置350处,并且位置350处的额外氨基酸取代选自E350N、E350C、E350G、E350Y、E350W和E350F。

40.如段落33所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置351处,并且位置351处的额外氨基酸取代选自D351R、D351S、D351L、D351M、和D351Y。

41.如段落33所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置387处,并且位置387处的额外氨基酸取代选自K387R、K387T、K387L和K387M。

42.如段落33所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置437处,并且位置437处的额外氨基酸取代选自N437R、N437K、N437H、N437T、N437V、N437I和N437W。

43.如段落22所述的RNA聚合酶变体,其中额外的C末端氨基酸是谷氨酰胺、苏氨酸或脯氨酸。

44.如段落1-24中任一项所述的RNA聚合酶变体,其中相对于野生型RNA聚合酶,(a)的额外氨基酸取代在选自位置350、351、387、437、441、632和880的位置处,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

45.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置350处,并且位置350处的额外氨基酸取代选自E350R、E350K、E350D、E350Q、E350N、E350T、E350S、E350C、E350G、E350A、E350V、E350L、E350I、E350Y、E350W和E350F。

46.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置351处,并且位置351处的额外氨基酸取代选自D351R、D351K、D351Q、D351T、D351C、D351V、D351L、D351M和D351W。

47.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置387处,并且位置387处的额外氨基酸取代选自K387H、K387E、K387N、K387T、K387S、K387G、K387A、K387Y、K387W和K387F。

48.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置437处,并且位置437处的额外氨基酸取代选自N437T、N437I、N437Y、N437W和N437F。

49.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置444处,并且位置444处的额外氨基酸取代是K444R。

50.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置632处,并且位置632处的额外氨基酸取代选自R632K和R632T。

51.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置880处,并且位置880处的额外氨基酸取代是F880Y。

52.如段落22所述的RNA聚合酶变体,其中额外的C末端氨基酸是谷氨酰胺、苏氨酸和脯氨酸。

53.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置350处,并且位置350处的额外氨基酸取代选自E350K、E350N、E350A和E350W。

54.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置351处,并且位置351处的额外氨基酸取代是D351V。

55.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置387处,并且位置387处的额外氨基酸取代选自K387H、K387N和K387S。

56.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置437处,并且位置437处的额外氨基酸取代选自N437T、N437I、N437Y和N437F。

57.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置444处,并且位置444处的额外氨基酸取代选自K444R。

58.如段落44所述的RNA聚合酶变体,其中(a)的额外氨基酸取代在位置880处,并且位置880处的额外氨基酸取代是F880Y。

59.如段落22所述的RNA聚合酶变体,其中额外的C末端氨基酸是苏氨酸、丝氨酸、丙氨酸和脯氨酸。

60.一种包含RNA聚合酶的RNA聚合酶变体,所述RNA聚合酶包含:

(a)位置350、351和387处的氨基酸取代;和

(b)相对于野生型RNA聚合酶,在C末端处的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

61.如段落60所述的RNA聚合酶变体,其中:

位置350处的额外氨基酸取代选自E350A、E350K、E350N和E350W;

位置351处的额外氨基酸取代是D351V;且/或

位置387处的额外氨基酸取代选自K387S、K387H和K387N。

62.一种包含RNA聚合酶的RNA聚合酶变体,所述RNA聚合酶包含:

(a)位置437和441处的氨基酸取代;和

(b)相对于野生型RNA聚合酶,在C末端处的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

63.如段落62所述的RNA聚合酶变体,其中:

位置437处的额外氨基酸取代选自N437T、N437Y、N437I和N437F;且/或

位置441处的额外氨基酸取代是K441R。

64.一种包含RNA聚合酶的RNA聚合酶变体,所述RNA聚合酶包含:

(a)位置880处的氨基酸取代;和

(b)相对于野生型RNA聚合酶,在C末端处的氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

65.如段落64所述的RNA聚合酶变体,其中:

位置880处的额外氨基酸取代是F880Y;且/或

C末端处的氨基酸修饰是选自丙氨酸、丝氨酸、苏氨酸和脯氨酸的额外氨基酸。

66.一种包含RNA聚合酶的RNA聚合酶变体,所述RNA聚合酶包含:

(a)位置632、653和657处的氨基酸取代;和

(b)相对于野生型RNA聚合酶,在C末端处的额外氨基酸取代和/或氨基酸修饰,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

67.如段落66所述的RNA聚合酶变体,其中:

位置632处的额外氨基酸取代选自R632K和R632T;

位置653处的额外氨基酸取代选自D653T和D653K;且/或

位置657处的额外氨基酸取代选自P657W、P657R或P657A。

68.如段落60-67中任一项所述的RNA聚合酶变体,其包含(b)的额外氨基酸取代。

69.如段落68所述的RNA聚合酶变体,其中(b)的额外氨基酸取代在位置47处。

70.如段落69所述的RNA聚合酶变体,其中位置47处的(b)的额外氨基酸取代是G47A。

71.如段落60-70中任一项所述的RNA聚合酶变体,其在C末端处包含氨基酸修饰。

72.如段落71所述的RNA聚合酶变体,其中C末端处的氨基酸修饰包含额外的C末端氨基酸。

73.如段落72所述的RNA聚合酶变体,其中额外的C末端氨基酸是甘氨酸。

74.如段落1-73中任一项所述的RNA聚合酶变体,其包含与野生型RNA聚合酶的同一性为至少90%的氨基酸序列,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

75.一种方法,其包括在体外转录反应中产生核糖核酸(RNA)转录物,所述转录反应包含多核苷酸模板、核苷三磷酸、盖帽类似物和相对于野生型RNA聚合酶包含至少一个突变的RNA聚合酶,其中所述反应包含的盖帽类似物的浓度比使用野生型RNA聚合酶来产生等量的RNA转录物所需的盖帽类似物的浓度低至少5倍,任选地其中野生型RNA聚合酶是野生型T7 RNA聚合酶。

76.如段落75所述的方法,其中超过80%的产生的RNA转录物包括功能盖帽。

77.如段落75或76所述的方法,其中所产生的RNA转录物具有大于阈值的3’同质性,其中阈值3’同质性是至少50%的3’同质性。

78.如段落75-77中任一项所述的方法,其中所产生的RNA转录物具有低于阈值量的dsRNA,其中dsRNA的阈值量为5ng dsRNA/25μg mRNA。

79.一种方法,其包括在体外转录反应中产生RNA转录物,所述转录反应包含多核苷酸模板、核苷三磷酸和如段落1-74中任一项所述的RNA聚合酶变体。

80.一种方法,其包括在体外转录反应中产生RNA转录物,所述转录反应包含多核苷酸模板、核苷三磷酸、盖帽类似物和如段落1-72中任一项所述的RNA聚合酶变体。

81.如段落79或80所述的方法,其中核苷三磷酸包括未修饰或修饰的ATP、修饰或未修饰的UTP、修饰或未修饰的GTP和/或修饰或未修饰的CTP。

82.如段落80或81所述的方法,其中所述反应包含的盖帽类似物的浓度比使用野生型RNA聚合酶来产生等量RNA转录物所需的盖帽类似物浓度低至少2倍、低至少5倍或低至少10倍。

83.如段落80-82中任一项所述的方法,其中超过80%、超过85%、超过90%或超过95%的产生的RNA转录物包括功能盖帽。

84.如段落80-83中任一项所述的方法,其中核苷三磷酸和盖帽类似物以等摩尔浓度存在于反应中。

85.如段落80-84中任一项所述的方法,其中反应中盖帽类似物与核苷三磷酸的摩尔比大于1:1或等于1:1。

86.如段落80-85中任一项所述的方法,其中盖帽类似物是二核苷酸盖帽、三核苷酸盖帽或四核苷酸盖帽。

87.如段落80-86中任一项所述的方法,其中盖帽类似物是天然盖帽类似物或合成盖帽类似物。

88.如段落86或87所述的方法,其中盖帽类似物是包含选自以下序列的序列的三核苷酸盖帽:GAA、GAC、GAG、GAU、GCA、GCC、GCG、GCU、GGA、GGC、GGG、GGU、GUA、GUC、GUG和GUU。

89.如段落88所述的方法,其中三核苷酸盖帽包含选自以下序列的序列:GAG、GCG、GUG和GGG。

90.如段落89所述的方法,其中三核苷酸盖帽包含序列GAG。

91.如段落90所述的方法,其中三核苷酸盖帽包含选自以下序列的序列:

(a)m7GpppApA、m7GpppApC、m7GpppApG、m7GpppApU、m7GpppCpA、m7GpppCpC、m7GpppCpG、m7GpppCpU、m7GpppGpA、m7GpppGpC、m7GpppGpG、m7GpppGpU、m7GpppUpA、m7GpppUpC、m7GpppUpG和m7GpppUpU;

(b)m7G3′OMepppApA、m7G3′OMepppApC、m7G3′OMepppApG、m7G3′OMepppApU、m7G3′OMepppCpA、m7G3′OMepppCpC、m7G3′OMepppCpG、m7G3′OMepppCpU、m7G3′OMepppGpA、m7G3′OMepppGpC、m7G3′ OMepppGpG、m7G3′OMepppGpU、m7G3′OMepppUpA、m7G3′OMepppUpC、m7G3′OMepppUpG和m7G3′OMepppUpU;

(c)m7G3′OMepppA2′OMepA、m7G3′OMepppA2′OMepC、m7G3′OMepppA2′OMepG、m7G3′OMepppA2′OMepU、m7G3′OMepppC2′OMepA、m7G3′OMepppC2′OMepC、m7G3′OMepppC2′OMepG、m7G3′OMepppC2′OMepU、m7G3′ OMepppG2′OMepA、m7G3′OMepppG2′OMepC、m7G3′OMepppG2′OMepG、m7G3′OMepppG2′OMepU、m7G3′OMepppU2′ OMepA、m7G3′OMepppU2′OMepC、m7G3′OMepppU2′OMepG和m7G3′OMepppU2′OMepU;或

(d)m7GpppA2′OMepA、m7GpppA2′OMepC、m7GpppA2′OMepG、m7GpppA2′OMepU、m7GpppC2′OMepA、m7GpppC2′OMepC、m7GpppC2′OMepG、m7GpppC2′OMepU、m7GpppG2′OMepA、m7GpppG2′OMepC、m7GpppG2′ OMepG、m7GpppG2′OMepU、m7GpppU2′OMepA、m7GpppU2′OMepC、m7GpppU2′OMepG和m7GpppU2′OMepU。

92.如段落91所述的方法,其中三核苷酸盖帽包含GpppA2′OmepG。

93.如段落75-92中任一项所述的方法,其中多核苷酸模板在模板位置+1处包括2′-脱氧胸苷残基或2′-脱氧胞苷残基。

94.如段落75-93中任一项所述的方法,其中相对于使用野生型RNA聚合酶产生的RNA,所产生的RNA转录物在任选地以未纯化形式递送至细胞时刺激低至少50%的细胞因子反应。

95.如段落75-94中任一项所述的方法,其中所产生的双链RNA(dsRNA)转录物的浓度相对于使用野生型RNA聚合酶产生的dsRNA转录物低至少50%。

96.如段落75-95中任一项所述的方法,其中所产生的RNA转录物的少于50%、少于25%或少于10%是dsRNA。

97.如段落75-96中任一项所述的方法,其中所产生的RNA转录物的少于30%或少于20%表现出3’异质性。

98.如段落75-97中任一项所述的方法,其中所产生的RNA转录物的少于50%、少于25%或少于10%是连缀RNA转录物。

99.如段落75-98中任一项所述的方法,其中所产生的全长RNA转录物的量比多核苷酸模板的量高至少15倍。

100.如段落75-99中任一项所述的方法,其中所产生的dsRNA:全长RNA转录物的比率小于1:1。

101.如段落75-100中任一项所述的方法,其中相对于多核苷酸模板,产生的RNA转录物具有少于1个突变/100个核苷酸。

102.一种核酸,其编码如段落1-74中任一项所述的RNA聚合酶变体。

103.一种组合物,其包含如段落1-74中任一项所述的RNA聚合酶变体和任选的核苷三磷酸。

104.一种试剂盒,其包含如段落1-74中任一项所述的RNA聚合酶变体和体外转录(IVT)试剂。

105.一种核糖核酸(RNA),任选地为信使RNA(mRNA),其通过如段落75-104中任一项所述的方法产生。

106.一种包含如段落103所述的RNA的脂质纳米颗粒,任选地其中所述脂质纳米颗粒包含摩尔比为20-60%的可电离氨基脂质、5-25%的非阳离子脂质、25-55%的甾醇和0.5-15%的PEG修饰的脂质。

107.一种源自起始RNA聚合酶的RNA聚合酶变体,该RNA聚合酶变体相对于包含SEQID NO:1序列的T7 RNA聚合酶的野生型氨基酸序列具有在位置G47处的氨基酸修饰和额外的C末端氨基酸,其中该变体包含至少一个取代,该取代在RNA聚合酶变体处于用于RNA合成的从头起始的构象状态时影响第一核苷酸与RNA聚合酶变体内的D位点的结合,并且其中相对于起始RNA聚合酶,该氨基酸取代产生以下益处中的至少一个:

(i)提高转录效率;

(ii)提高共转录加帽效率;

(iii)增加RNA的产量;

(iv)提高RNA转录物的3’同质性;

(v)提高转录保真度;和

(vi)降低反应混合物中dsRNA的量。

108.一种RNA聚合酶变体,其包含SEQ ID NO:3-14、45-48或242-247中任一项的氨基酸序列,其中X是选自R、K、H、E、D、Q、N、T、S、C、G、A、V、L、I、M、P、Y、W和F的任何氨基酸。

109.如段落108所述的RNA聚合酶,其包含SEQ ID NO:47的氨基酸序列。

110.如段落109所述的RNA聚合酶,其中X是W。

111.如段落108-110中任一项所述的RNA聚合酶变体,其进一步包含G47A取代。

112.如段落108-111中任一项所述的RNA聚合酶变体,其进一步包含额外的C末端氨基酸。

113.如段落112所述的RNA聚合酶变体,其中额外的C末端氨基酸是甘氨酸。

114.一种RNA聚合酶变体,其包含SEQ ID NO:61-241中任一项的氨基酸序列。

115.一种核酸,其编码如段落114所述的RNA聚合酶变体。

116.一种方法,其包括在体外转录反应中产生RNA转录物,所述转录反应包含多核苷酸模板、核苷三磷酸和如段落114所述的RNA聚合酶变体。

117.一种方法,其包括在体外转录反应中产生RNA转录物,所述转录反应包含多核苷酸模板、核苷三磷酸、盖帽类似物和如段落114所述的RNA聚合酶变体。

118.一种包含RNA聚合酶的RNA聚合酶变体,所述RNA聚合酶包含:

(a)在位置E350、K387、N437、F880或D653处的氨基酸取代;

(b)在位置G47的氨基酸取代;和/或

(c)相对于包含SEQ ID NO:1氨基酸序列的野生型RNA聚合酶,在C末端处的氨基酸修饰。

119.如段落118所述的RNA聚合酶,其中(a)的氨基酸取代选自由E350N、K387N、N437F、F880Y和D653W组成的组。

120.如段落119所述的RNA聚合酶变体,其中(a)的氨基酸取代是D653W。

121.如段落118-120中任一项所述的RNA聚合酶变体,其中位置G47处的氨基酸取代是G47A。

122.如段落118-121中任一项所述的RNA聚合酶变体,其中在C末端处的氨基酸修饰是额外的甘氨酸、额外的丙氨酸、额外的苏氨酸或额外的脯氨酸。

123.一种包含RNA聚合酶的RNA聚合酶变体,所述RNA聚合酶相对于包含SEQ IDNO:1的氨基酸序列的野生型RNA聚合酶在选自由E350、D351、K387、N437、K441、D506、R632、D653、S628、P657和F880组成的组的两个位置处包含氨基酸取代。

124.如段落123所述的RNA聚合酶变体,其在E350和D351处包含氨基酸取代。

125.如段落123所述的RNA聚合酶变体,其在E350和K387处包含氨基酸取代。

126.如段落123所述的RNA聚合酶变体,其在K387和D653处包含氨基酸取代。

127.如段落123-125中任一项所述的RNA聚合酶变体,其中位置E350处的氨基酸取代是E350W、E350A、E350K或E350N。

128.如段落123或124所述的RNA聚合酶变体,其中位置D351处的氨基酸取代是D351V。

129.如段落123、125或126中任一项所述的RNA聚合酶变体,其中位置K387处的氨基酸取代是K387N、K387S或K387H。

130.如段落123或126所述的RNA聚合酶变体,其中位置D653处的氨基酸取代是D653T或D653K。

131.一种方法,其包括在体外转录反应中产生RNA转录物,所述转录反应包含多核苷酸模板、核苷三磷酸、盖帽类似物和如前述段落中任一项所述的RNA聚合酶变体,其中盖帽类似物是三核苷酸盖帽类似物或四核苷酸盖帽类似物。

132.如前述段落中任一项所述的方法,其中盖帽类似物是包含GAG的三核苷酸盖帽类似物。

133.如段落132所述的方法,其中GAG盖帽类似物选自:

134.如前述段落中任一项所述的方法,其中盖帽类似物是包含GGAG的四核苷酸盖帽类似物。

135.如段落134所述的方法,其中四核苷酸盖帽类似物选自:

136.如前述段落中任一项所述的方法,其中超过80%、超过85%、超过90%或超过95%的产生的RNA转录物包括盖帽类似物。

137.如前述段落中任一项所述的方法,其中所述方法产生的包含盖帽类似物的RNA转录物比包含SEQ ID NO:1的野生型RNA聚合酶的对照体外转录反应多至少50%、至少60%或至少75%。

138.如前述段落中任一项所述的方法,其中所述反应中盖帽类似物与核苷三磷酸的摩尔比在1:10和1:1之间。

139.如前述段落中任一项所述的方法,其中所产生的RNA转录物的小于1%、小于0.5%或小于0.1%是双链RNA(dsRNA)。

140.如前述段落中任一项所述的方法,其中所述反应产生至少5mg/mL、至少6mg/mL、至少7mg/mL、至少8mg/mL、至少9mg/mL或至少10mg/mL的RNA转录物。

141.如前述段落中任一项所述的方法,其中所产生的RNA转录物的至少85%、至少90%或至少95%是全长RNA转录物。

142.如前述段落中任一项所述的方法,其中所述方法产生的包含盖帽类似物的RNA转录物比包含对照RNA聚合酶变体的对照体外转录反应多至少10%、至少25%或至少50%,其中对照RNA聚合酶变体源自SEQ ID NO:1并且包含G47A突变和在C末端处的额外甘氨酸。

143.一种方法,其包括在体外转录反应中产生RNA转录物,所述转录反应包含多核苷酸模板、核苷三磷酸、盖帽类似物和野生型RNA聚合酶,其中盖帽类似物是三核苷酸盖帽类似物或四核苷酸盖帽类似物。

144.如段落143所述的方法,其中野生型RNA聚合酶包含SEQ ID NO:1的氨基酸序列。

145.如段落143或144所述的方法,其中盖帽类似物是包含GGAG的四核苷酸盖帽类似物。

146.如段落143-145中任一项所述的方法,其中四核苷酸盖帽类似物选自:

野生型T7 RNA聚合酶

MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFA(SEQ ID NO:1)

对照T7 RNA聚合酶变体(G47A+C末端G)

MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMAEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFAG(SEQ ID NO:44)

实施例

实施例1.RNA聚合酶变体的产生。

RNA聚合酶变体是利用表2-6中所示的取代产生的。

表2.RNA聚合酶变体

表3.示例性单取代变体

表4.示例性多取代变体

表5.示例性多取代+C末端G变体

表6.额外的多取代变体

实施例2.使用多取代+C末端G RNA聚合酶变体的IVT反应

使用DNA模板、GAG盖帽类似物和表5中所提供的多取代+C末端G RNA聚合酶变体进行体外转录(IVT)反应。在本实施例中使用的所有聚合酶变体都包括G47A突变、C末端G添加和在E350、D351、K487、R394、R425、Y427、N437、K441、R632、H811、F880或G884位置处的另一个遗传取代。

以下RNA聚合酶变体在IVT反应中产生的总RNA产量是使用对照RNA聚合酶变体(G47A+C末端G)进行的对照IVT反应的总产量的60%至>100%:E350R、E350K、E350D、E350Q、E350N、E350T、E350S、E350C、E350G、E350A、E350V、E350L、E350I、E350P、E350Y、E350W和E350F;D351R、D351K、D351Q、D351T、D351S、D351C、D351V、D351L、D351I、D351M、D351P、D351Y和D351W;K387R、K387H、K387T、K387S、K387V、K387L、K387I和K387M;R394K;N437Q、N437T、N437S、N437G和N437F;F880Y;和884S和884A(C末端添加)(数据未示出)。

以下RNA聚合酶变体在IVT反应中产生的RNA的3’同质性水平等于或高于在使用对照RNA聚合酶变体(G47A+C末端G)进行的对照IVT反应中产生的RNA的3’同质性水平:E350N、E350C、E350G、E350Y、E350W和E350F;D351R、D351S、D351L、D351M和D351Y;K387R、K387T、K387L和K387M;R394K;N437R、N437K、N437H、N437T、N437V、N437I和N437W;R632K和R632T;和884Q、884T和884P(C末端添加)(数据未示出)。

相对于使用对照RNA聚合酶变体(G47A+C末端G)进行的对照IVT反应中产生的RNA,以下RNA聚合酶变体产生的RNA具有相等或更高(最多增加20%)的加帽RNA%(包含GAG盖帽的总RNA的百分比):E350R、E350K、E350D、E350Q、E350N、E350T、E350S、E350C、E350G、E350A、E350V、E350L、E350I、E350Y、E350W和E350F;D351R、D351K、D351Q、D351T、D351C、D351V、D351L、D351M和D351W;K387H、K387E、K387N、K387T、K387S、K387G、K387A、K387Y、K387W和K387F;N437T、N437I、N437Y、N437W和N437F;K441R;R632K和R632T;F880Y;和884Q、884T、884S、884A和884P(C末端添加)(数据未示出)。

实施例3.多取代+C末端G RNA聚合酶变体相对于对照聚合酶变体产生具有更理想特征的RNA产物

使用DNA模板、GAG盖帽类似物(0.75mM、2.25mM、3.75mM和7.5mM)和以下各项进行体外转录反应:(1)G47A+C末端G RNA聚合酶变体(对照聚合酶变体;G47A+C末端G);(2)G47A/K387S+C末端G RNA聚合酶变体(K387S);(3)G47A/K387H+C末端G RNA聚合酶变体(K387H);(4)G47A/K387N+C末端G RNA聚合酶变体(K387N);(5)G47A/E350K+C末端G RNA聚合酶变体(E350K);(6)G47A/E350N+C末端G RNA聚合酶变体(E350N);(7)G47A/E350A+C末端G RNA聚合酶变体(E350A);(8)G47A/E350W+C末端G RNA聚合酶变体(E350W);和(9)G47A/D351V+C末端G RNA聚合酶变体(D351V)。在IVT反应之后,对来自每个反应的转录RNA产物进行表征,以描述所述RNA产物的质量,包括加帽百分比、dsRNA污染、纯度和3’同质性。

在oligo dT纯化之后,使用多取代变体(K387S、K387H、K387N、E350K、E350N、E350A、E350W和D351V)产生的总RNA的总产量与使用对照RNA聚合酶变体的产量相当(图1A)。通过UV吸收测量RNA产量。

使用RNAse T1消解测量RNA转录物的3’同质性。RNAse T1在G核苷酸后特异性地裂解mRNA。核酸内切裂解产生5’氢氧化物(OH)和3’单磷酸(mP)“疤痕”,而核酸外切裂解产生干净的5’OH/3’OH切割。因此,RNAse T1消解可用于区分在3’末端具有和没有非模板化添加的转录物。在本实施例中,相对于对照聚合酶变体,使用多取代变体产生的RNA具有相等或更高百分比的3’末端同质性(图1B)。特别地,如图1B所示,K387S、K387H、K387N和E350N变体产生的包含3’同质末端的RNA比对照变体高20个百分点以上。

在本实施例中,在IVT反应之后使用标准ELISA来评估dsRNA污染物(例如,长于40个核苷酸碱基对的dsRNA)。由多取代变体和对照变体产生的所有IVT反应混合物含有小于~4ng dsRNA/25μg mRNA(图1C)。相反地,由野生型T7聚合酶产生的IVT反应混合物含有~20ng dsRNA/25μg mRNA。

通过LC-MS分析总RNA产物以确定加帽RNA%(即,包含GAG盖帽的转录RNA的百分比)。在起始IVT反应中,在低量和高量GAG盖帽类似物下,所有多取代变体相对于对照变体产生具有更高水平的加帽RNA%的RNA(图1D-1E)。特别地,如图1D-1E所示,当使用0.75mMGAG盖帽类似物(此IVT反应系列中使用的最低盖帽浓度)时,K387S、K387H、K387N、E350A和D351V变体产生的RNA的加帽RNA%水平比对照变体高10-25个百分点。

使用DBAA(乙酸二丁铵)HPLC方法评估转录RNA的纯度。相对于对照变体,多取代变体产生的RNA具有相当的纯度(在大多数实验实施例中纯度>90%)(图1F)。

使用Tris RP(反相)方法来评估加尾RNA的百分比(即,包含polyA尾部的转录RNA的百分比)。相对于对照变体,多取代变体产生的RNA具有相当的加尾%(>85%加尾)(图1G)。

由所有多取代变体产生的转录RNA中的插入缺失频率(插入/缺失/单点突变)与由对照变体聚合酶产生的插入缺失频率相当(图1H)。在>7A的均聚物延伸段上(图1H中的A7),与由野生型聚合酶引起的~15%的发生率相比,所有变体产生~25%的插入缺失频率。然而,所有变体在5A或6A(分别为图1H中的A5和A6)的均聚物延伸段中导致与由野生型聚合酶导致的水平相等的边缘插入缺失频率。

如本文所证明,本实施例中使用的多取代变体相对于对照聚合酶变体在IVT反应中产生具有更理想的或改进的特征的RNA产物。最值得注意的是,相对于对照变体,K387S、K387H、K387N、E350K、E350N、E350A、E350W和D351V变体在所有测试浓度的GAG盖帽类似物下均显示出提高的加帽效率。

实施例4.多取代+C末端G RNA聚合酶变体相对于对照聚合酶变体产生具有提高的加帽效率的RNA产物

使用DNA模板、不同浓度的三种盖帽类似物(GGG盖帽、Gm6AG盖帽(称为m6A)和Ge6AG(称为e6A)盖帽)中的一种和以下各项进行体外转录反应:(1)G47A+C末端G RNA聚合酶变体(对照聚合酶变体;G47A+C末端G);(2)G47A/K387S+C末端G RNA聚合酶变体(K387S);(3)G47A/K387H+C末端G RNA聚合酶变体(K387H);(4)G47A/K387N+C末端G RNA聚合酶变体(K387N);(5)G47A/E350K+C末端G RNA聚合酶变体(E350K);(6)G47A/E350N+C末端G RNA聚合酶变体(E350N);(7)G47A/E350A+C末端G RNA聚合酶变体(E350A);(8)G47A/E350W+C末端G RNA聚合酶变体(E350W);(9)G47A/D351V+C末端G RNA聚合酶变体(D351V)和(10)G884RNA聚合酶变体(G884wt)。使用5’GTP启动使用GGG盖帽的IVT反应;使用5’ATP启动使用m6A和e6A盖帽的IVT反应(图2A-2C)。在IVT反应之后,对每个实验进行LC-MS以确定加帽RNA%(即,包含盖帽的转录RNA的百分比)。

在GGG盖帽类似物的所有测试浓度下,相对于对照变体,所有测试的多取代变体(K387S、K387H、K387N、E350K、E350N和E350W)当在IVT反应期间掺入GGG盖帽类似物时产生显著更高水平的加帽RNA(图2A)。在使用2倍浓度的GGG盖帽的实验中,多取代变体产生50-65%的加帽RNA。在使用2倍浓度的GGG盖帽的实验中,对照变体仅产生30%的加帽RNA。

在低(0.5倍浓度m6A)和高(2倍浓度m6A)浓度的m6A盖帽类似物下,相对于对照变体,所有测试的多取代变体(K387S、K387H、K387N、E350K、E350N、E350A、E350W和D351V)当在IVT反应期间掺入m6A盖帽类似物时产生显著更高水平的加帽RNA(图2B)。在使用2倍浓度的m6A盖帽的实验中,多取代变体产生80-85%的加帽RNA。在使用2倍浓度的m6A盖帽的实验中,对照变体仅产生60%的加帽RNA。G884变体相比于对照也产生更高水平的加帽RNA%,其中在使用2倍浓度的m6A盖帽的实验中具有>85%的加帽RNA。

在低(0.5倍浓度e6A)和高(2倍浓度e6A)浓度的e6A盖帽类似物下,相对于对照变体,测试的多取代变体(K387S、K387H、K387N、E350K、E350N、E350A、E350W和D351V)当在IVT反应期间掺入e6A盖帽类似物时产生更高水平的加帽RNA(图2C)。在使用2倍浓度的e6A盖帽的实验中,多取代变体产生80-88%的加帽RNA。在使用2倍浓度的e6A盖帽的实验中,对照变体仅产生~75%的加帽RNA。G884变体相比于对照也产生更高水平的加帽RNA%,其中在使用2倍浓度的e6A盖帽的实验中具有~90%的加帽RNA。

如本文所证明,多取代+C末端G RNA聚合酶变体(例如K387S、K387H、K387N、E350K、E350N、E350A、E350W和D351V)相对于对照聚合酶变体在掺入各种不同的盖帽类似物时产生具有更高加帽效率的转录RNA产物。

实施例5.多取代+C末端G RNA聚合酶变体相对于对照聚合酶变体产生具有更理想特征的RNA产物

使用DNA模板、GAG盖帽类似物(0.75mM和7.5mM)和以下各项进行体外转录反应:(1)野生型(WT)RNA聚合酶;(2)G47A+C末端G RNA聚合酶变体(对照聚合酶变体;G47A+C末端G);(3)G47A/D506W+C末端G RNA聚合酶变体(D506W);(4)G47A/S628W+C末端G RNA聚合酶变体(S628W);(5)G47A/D653W+C末端G RNA聚合酶变体(D653W);和(6)G47A/P657W+C末端GRNA聚合酶变体(P657W)。在IVT反应之后,对来自每个反应的转录RNA产物进行表征,以描述所述RNA产物的质量,包括加帽百分比、dsRNA污染、纯度和3’同质性。

在oligo dT纯化之后,使用S628W多取代变体产生的总RNA的总产量(基于以ng/μL计的浓度)与使用对照RNA聚合酶变体的产量相当(图3A)。尽管使用D506W、D653W和P657W多取代变体产生的总RNA产量低于使用对照RNA聚合酶变体的产量,但对于所述多取代变体的下游实验和继续使用仍保持可行的产量。通过UV吸收测量RNA产量。

使用Tris RP(反相)方法来评估加尾RNA的百分比(即,包含polyA尾部的转录RNA的百分比)。相对于对照变体和野生型聚合酶(≥90%加尾),多取代变体产生的RNA具有相当的加尾%(图3B)。

使用DBAA(乙酸二丁铵)HPLC方法评估转录RNA的纯度。相对于对照变体和野生型聚合酶(纯度≥85%),多取代变体产生的RNA具有相当的纯度(图3C)。

使用RNAse T1消解测量RNA转录物的3’同质性。RNAse T1在G核苷酸后特异性地裂解mRNA。核酸内切裂解产生5’氢氧化物(OH)和3’单磷酸(mP)'疤痕',而转录终止于3’氢氧化物(OH)。由于最后一个模板化核苷酸是G,因此可以使用RNAse T1消解来区分在3’末端有和没有非模板化添加的转录物。在本实施例中,相对于对照聚合酶变体,使用多取代变体产生的RNA具有相等或更高百分比的3’末端同质性(图3D)。特别地,D506W、D653W和P657W变体产生的包含3’同质末端的RNA比对照变体显著更高。

在本实施例中,在IVT反应之后使用标准dsRNA ELISA来评估dsRNA污染物(例如,长于40个核苷酸碱基对)。由多取代变体和对照变体产生的所有IVT反应混合物含有小于~5ng dsRNA/25μg mRNA(图3E)。相反地,由野生型T7聚合酶产生的IVT反应混合物含有大于~20ng dsRNA/25μg mRNA。

如本文所证明,本实施例中使用的多取代变体(例如D506W、D653W和P657W)相对于对照聚合酶变体在IVT反应中产生具有相当的或改进的特征的RNA产物。

实施例6.多取代+C末端G RNA聚合酶变体相对于对照聚合酶变体产生具有提高的加帽效率的RNA产物

使用DNA模板、不同浓度的三种盖帽类似物(GAG盖帽、m6A盖帽和e6A盖帽)中的一种和以下各项进行体外转录反应:(1)G47A+C末端G RNA聚合酶变体(对照聚合酶变体;G47A+C末端G);(2)G47A/D506W+C末端G RNA聚合酶变体(D506W);(3)G47A/S628W+C末端G RNA聚合酶变体(S628W);(4)G47A/D653W+C末端G RNA聚合酶变体(D653W);和(5)G47A/P657W+C末端G RNA聚合酶变体(P657W)。使用编码5’A和随后的G的DNA模板掺入使用m6A和e6A盖帽类似物的IVT反应。在IVT反应之后,对每个实验进行LC-MS以确定加帽RNA%(即,包含盖帽的转录RNA的百分比)。

在涉及5mM每种NTP的IVT反应中,相对于对照变体,所有测试的多取代变体(D653W、D506W、P657W、S628W)需要更低有效浓度的GAG盖帽类似物来产生具有50%盖帽掺入的RNA(EC50)(图4A-4D)。最值得注意的是,相对于对照变体,D653W显著改善针对GAG盖帽掺入的EC50,其中在低至0.75mM的GAG浓度下接近100%的总RNA掺入了GAG盖帽。相对于对照变体,D506W、P657W和S628W使针对GAG盖帽掺入的EC50改善(降低)1.28、2.27和1.45倍。D653W在涉及7.5mM每种NTP的IVT反应中也显著优于对照变体,其中相对于对照变体,使针对GAG盖帽掺入的EC50改善(降低)12.3倍(图4E)。

在涉及5mM每种NTP的IVT反应中,相对于对照变体,所有测试的多取代变体(D653W、D506W、P657W、S628W)需要更低有效浓度的e6A盖帽类似物来产生具有盖帽掺入的RNA(图5A-5D)。最值得注意的是,D653W在2mM e6A下使接近100%的总RNA具有掺入的e6A盖帽。相反地,即使在5mM e6A下,对照变体也仅使~40%的总RNA具有掺入的e6A。

在涉及5mM每种NTP的IVT反应中,相对于对照变体,所有测试的多取代变体(D653W、D506W、P657W、S628W)需要更低有效浓度的m6A盖帽类似物来产生具有盖帽掺入的RNA(图6A-6D)。最值得注意的是,D653W在5mM m6A下使接近100%的总RNA具有掺入的m6A盖帽。相反地,即使在5mM m6A下,对照变体也仅使小于30%的总RNA具有掺入的m6A。

在涉及7.5mM每种NTP的IVT反应中,相对于对照变体,D653W多取代变体需要更低有效浓度的GGAG四核苷酸盖帽类似物来产生具有盖帽掺入的RNA(图7)。最值得注意的是,D653W在7.5mM GGAG四核苷酸下使接近100%的总RNA具有掺入的GGAG盖帽。相反地,即使在7.5mM GGAG四核苷酸下,对照变体也仅使小于70%的总RNA具有掺入的GGAG。

如本文所证明,多取代+C末端G RNA聚合酶变体(例如D653W、D506W、P657W和S628W)相对于对照聚合酶变体在掺入各种不同的盖帽类似物(例如,GAG、e6A、m6A、GGAG四核苷酸)时产生具有更高加帽效率的转录RNA产物。

实施例7.多取代+C末端G RNA聚合酶变体相对于对照聚合酶产生具有提高的加帽效率和RNA产量的RNA产物

使用DNA模板、5mM等摩尔浓度NTP、5mM盖帽类似物(GAG三核苷酸、e6A三核苷酸、m6A三核苷酸或GGAG四核苷酸)和500nM以下T7 RNA聚合酶进行体外转录反应:(1)G47A+C末端G RNA聚合酶变体(对照聚合酶变体;G47A+C末端G);(2)G47A/D653W+C末端G RNA聚合酶变体(D653W);(3)G47A/G884P+C末端G RNA聚合酶变体(G884P);(4)G47A/G884T+C末端GRNA聚合酶变体(G884T);(5)G47A/G884A+C末端G RNA聚合酶变体(G884A);(6)G47A/F880Y+C末端G RNA聚合酶变体(F880Y);(7)G47A/N437F+C末端G RNA聚合酶变体(N437F);(8)G47A/K387N+C末端G RNA聚合酶变体(K387N);或(9)G47A/E350N+C末端G RNA聚合酶变体(E350N)。

在IVT反应之后,使mRNA产物接受oligo-dT纯化,然后通过LC-MS进行分析以确定加帽RNA%(即,包含盖帽的转录RNA的百分比)并通过HPLC进行分析以确定反应的RNA产量。

在GAG三核苷酸、e6A三核苷酸、m6A三核苷酸或GGAG四核苷酸中任一种的存在下,所有测试的多取代变体(D653W、G884P、G884T、G884A、F880Y、N437F、K387N、E350N)产生的RNA的加帽RNA百分比水平与对照聚合酶变体相当或比其更高(图8A-8I)。值得注意的是,相对于对照聚合酶变体或野生型聚合酶,D653W提供显著增加的加帽RNA百分比,特别是在m6A三核苷酸(~85%加帽)和e6A三核苷酸(~90%加帽)存在的情况下。参见图8B和8C。

在GAG三核苷酸的存在下,所有测试的多取代变体(D653W、G884P、G884T、G884A、F880Y、N437F、K387N、E350N)比对照聚合酶变体产生更高或相当的总RNA产量(图8E-8I)。在m6A三核苷酸的存在下,G884A、F880Y、K387N和E350N变体比对照聚合酶变体产生更高或相当的总RNA产量。

在GAG三核苷酸的存在下,所有测试的多取代变体(D653W、G884P、G884T、G884A、F880Y、N437F、K387N、E350N)比对照聚合酶变体产生更高的加帽RNA百分比(图8A-8D)。在m6A三核苷酸的存在下,G884A、F880Y、K387N和E350N变体比对照聚合酶变体产生更高的加帽RNA百分比。在e6A三核苷酸的存在下,F880Y比对照聚合酶变体产生更高的加帽RNA百分比。

然后进一步分析本实施例的IVT反应的双链RNA(dsRNA)(IVT反应的非所需副产物)的含量,并与其他IVT反应进行比较(图9A-9D)。值得注意的是,在IVT反应中,所测试的多取代变体(D653W、G884P、G884T、G884A、F880Y、N437F、K387N、E350N)均未产生超过~0.75ng dsRNA/2μg总RNA。这与野生型T7聚合酶形成对比,后者在所有测试的三核苷酸和四核苷酸盖帽类似物的存在下,在IVT反应中产生2-5ng dsRNA/2μg总RNA。

实施例8.G47A/D653W+C末端G RNA聚合酶相对于相关的单突变和双突变RNA聚合酶产生具有更高3’同质性和加帽效率的RNA产物

使用DNA模板、5mM等摩尔浓度NTP、0.5mM GAG三核苷酸和以下T7 RNA聚合酶进行体外转录反应:(1)野生型RNA聚合酶;(2)G47A RNA聚合酶变体;(3)G884A RNA聚合酶变体;(4)D653W RNA聚合酶变体;(5)G47A/D653W RNA聚合酶变体;(6)D653W+C末端G RNA聚合酶变体;(7)G47A/D653W+C末端G RNA聚合酶变体;或(8)G47A+C末端G RNA聚合酶变体。

在每个反应的整个过程中(120分钟)收集IVT反应的样品并分析随时间推移的粗RNA产量(图10D)。在IVT反应之后,对mRNA产物进行oligo-dT纯化,然后分析其3’同质性(图10A)、加帽RNA%(即,包含盖帽的转录RNA的百分比)(图10B)和全长产物百分比(即,包含全长转录物的总RNA的百分比)(图10C)。

G47A/D653W+C末端G RNA聚合酶在所测试的聚合酶中表现最好,而D653W+C末端GRNA聚合酶和G47A+C末端G RNA聚合酶也提供了质量和产量都很好的RNA。G47A/D653W+C末端G RNA聚合酶产生的RNA中~90%的总RNA包含3’同质性;D653W+C末端G RNA聚合酶产生的RNA中~75%的总RNA包含3’同质性;并且G47A+C末端G RNA产生的RNA中~70%的总RNA包含3’同质性。相比之下,野生型聚合酶产生的RNA中只有~10%的总RNA包含3’同质性。所有测试的包含D653W突变的聚合酶产生90-95%的加帽RNA。相比之下,野生型聚合酶在这些实验中仅产生~60%的加帽RNA。RNA聚合酶的所有突变变体都产生良好(>85%)水平的全长产物百分比。此外,如图10D所示,在这些实验中,RNA聚合酶的突变变体能够保持可接受的RNA产量(在120分钟的反应时间下为5-9mg/mL),即使同时比野生型聚合酶产生更高质量的RNA(更高的3’同质性和更高的加帽RNA百分比)。

实施例9.D653W+G47A RNA聚合酶变体相对于对照聚合酶变体产生具有提高的加帽效率的RNA产物

使用DNA模板、不同浓度的四种盖帽类似物(GGAG盖帽、Gm6AAG、Gm6AG盖帽或Ge6AG盖帽)之一(1-7mM盖帽类似物)和G47A+C末端G RNA聚合酶变体(对照聚合酶变体)或G47A+D653W RNA聚合酶变体进行体外转录反应。在IVT反应之后,对每个实验进行LC-MS以确定加帽RNA%(即,包含盖帽的转录RNA的百分比)。

相对于对照聚合酶变体,G47A+D653W RNA聚合酶变体针对所有四种测试盖帽类似物在所有盖帽类似物浓度下均产生具有更高百分比掺入的盖帽类似物的RNA(图11)。

实施例10.一组多取代RNA聚合酶变体相对于对照聚合酶变体产生具有提高的加帽效率的RNA产物

使用DNA模板、5mM等摩尔浓度NTP、0.5mM GAG三核苷酸和如表7所示的T7 RNA聚合酶变体之一进行个别体外转录反应。

在IVT反应之后,使mRNA产物接受oligo-dT纯化,然后通过LC-MS进行分析以确定加帽RNA%(即,包含盖帽的转录RNA的百分比)并通过HPLC进行分析以确定反应的RNA产量。

表7.实施例9中使用的RNA聚合酶变体

如表7中所示的42个测试的多取代变体中的41个在GAG三核苷酸的存在下比对照聚合酶变体(G47A+C末端G)或野生型RNA聚合酶产生更高相对量的加帽RNA百分比(图12)。几种变体产生超过85%的加帽RNA,包括G47A+K387N+C末端T;E350W+K387N+G47A+C末端G;D351V+E350W+K387H+G47A+C末端G;G47A+D653T+C末端A;D351V+E350W+G47A+C末端G;D351V+E350K+K387N+G47A+C末端G;K387N+G47A+C末端G;D351V+E350K+K387S+G47A+C末端G;和D351V+E350A+K387N+G47A+C末端G。

实施例11.多取代RNA聚合酶变体在低浓度GGAG盖帽类似物下产生具有高水平加帽效率的RNA产物

使用DNA模板、6mM等摩尔浓度NTP、不同量的GGAG四核苷酸盖帽类似物(0.6mM/0.1:1GGAG:NTP;0.8mM;1.0mM;1.2mM/0.2:1GGAG:NTP;1.4mM;或1.6mM)和0.025mg/mL以下T7RNA聚合酶进行体外转录反应:(1)G47A+C末端G(对照聚合酶变体;G47A+C末端G);(2)D563T+G47A+C末端G;(3)D653W+G47A;(4)E350W+D351V+G47A+C末端G;(5)D653T+G47A+C末端S(G884S);(6)E350W+K387N+G47A+C末端G;或(7)D653T+K387N+G47A+C末端G。

在IVT反应之后,使mRNA产物接受oligo-dT纯化,然后通过LC-MS进行分析以确定加帽RNA%(即,包含盖帽的转录RNA的百分比)并通过HPLC进行分析以确定反应的RNA产量。

在GGAG盖帽类似物的存在下,所有测试的多取代变体相比于比对照聚合酶变体产生具有更高水平的加帽RNA百分比的RNA,无论GGAG类似物的浓度如何(图13B)。即使在最低测试浓度的GGAG盖帽类似物(0.6mM)下,所有多取代变体仍产生至少80%的加帽RNA,远高于对照聚合酶变体产生的45%加帽RNA。在1.6mM GGAG盖帽类似物下,所有测试的变体产生约93-97%的加帽RNA。

实施例12.无论DNA模板如何,多取代RNA聚合酶变体均产生高质量RNA产物

使用三种不同的DNA模板(构建体1、2和3)、6mM等摩尔浓度NTP、1.2mM GGAG盖帽类似物和以下T7 RNA聚合酶进行体外转录反应:(1)G47A+C末端G RNA聚合酶变体(对照聚合酶变体;G47A+C末端G);(2)D653W+G47A RNA聚合酶变体;(3)D653T+K387N+G47A+C末端GRNA聚合酶变体;(4)E350W+D351V+G47A+C末端G RNA聚合酶变体;(5)E350W+K387N+G47A+C末端G RNA聚合酶变体;或(6)D653T+G47A+C末端G RNA聚合酶变体。

在IVT反应之后,使mRNA产物接受oligo-dT纯化,然后通过LC-MS进行分析以确定加帽RNA%(即,包含盖帽的转录RNA的百分比)并通过HPLC进行分析以确定反应的RNA产量。

对于所有三种DNA模板,在GGAG四核苷酸的存在下,所有测试的多取代变体均产生具有90-95%加帽RNA的RNA(图14A)。每个变体相比于对照聚合酶变体产生更高水平的加帽RNA百分比。

使用Tris RP(反相)方法来评估加尾RNA的百分比(即,包含polyA尾部的转录RNA的百分比)。对于所有三种DNA模板,多取代变体产生的RNA的加尾%与对照变体(≥90%加尾)相当(图14B)。

使用反相HPLC方法评估转录RNA的纯度。对于所有三种DNA模板,相对于对照变体和野生型聚合酶(约95%纯度),多取代变体产生具有相当纯度的RNA(图14C)。

使用RNAse T1消解测量从构建体1产生的RNA转录物的3’同质性。相对于对照聚合酶变体,使用多取代变体产生的RNA具有更高百分比的3’末端同质性(图14D),其中总RNA的约95%具有3’同质性。

在本实施例中,在IVT反应之后使用标准dsRNA ELISA来评估dsRNA污染物(例如,长于40个核苷酸碱基对)。对于所有三种DNA模板,由多取代变体和对照变体产生的所有IVT反应混合物都包含小于~0.015%(重量/重量)的dsRNA(图14E)。特别地,对于所有三种DNA模板,由以下各项产生的IVT反应混合物包含小于0.005%(重量/重量)的dsRNA:D653T+K387N+G47A+C末端G RNA聚合酶变体;E350W+D351V+G47A+C末端G RNA聚合酶变体;E350W+K387N+G47A+C末端G RNA聚合酶变体;D653T+G47A+C末端G RNA聚合酶变体。

实施例13.多取代RNA聚合酶变体产生高质量RNA产物

使用DNA模板、6mM等摩尔浓度NTP、1.5mM GGAG盖帽类似物和以下T7 RNA聚合酶进行体外转录反应:(1)野生型RNA聚合酶;(2)G47A+C末端G RNA聚合酶变体;(3)E350W+K387NRNA聚合酶变体;(4)E350W+D351V RNA聚合酶变体;(5)K387N+D653T RNA聚合酶变体;(6)E350W+K387N+G47A+C末端G RNA聚合酶变体;(7)E350W+D351V+G47A+C末端G RNA聚合酶变体;或(8)K387N+D653T+G47A+C末端G RNA聚合酶变体。

在IVT反应之后,使mRNA产物接受oligo-dT纯化,然后通过LC-MS进行分析以确定加帽RNA%(即,包含盖帽的转录RNA的百分比)并通过HPLC进行分析以确定反应的RNA产量。

在本实施例中,大多数测试的多取代变体在GGAG四核苷酸的存在下产生与野生型聚合酶相当的总RNA产量(图15A),其中总RNA为约5mg/mL。

相对于野生型聚合酶变体和G47A+C末端G聚合酶变体,本实施例中所有测试的多取代变体在GGAG四核苷酸的存在下产生具有更高量的加帽RNA的RNA(图15B)。由以下各项产生的总RNA的90-95%包含GGAG四核苷酸盖帽:E350W+K387N RNA聚合酶变体;E350W+D351V RNA聚合酶变体;K387N+D653T RNA聚合酶变体;E350W+K387N+G47A+C末端G RNA聚合酶变体;E350W+D351V+G47A+C末端G RNA聚合酶变体;和K387N+D653T+G47A+C末端G RNA聚合酶变体。

在本实施例中,使用标准dsRNA ELISA来评估由IVT反应产生的dsRNA(例如,长于40个核苷酸碱基对)。双突变聚合酶变体(E350W+K387N;E350W+D351V;和K387N+D653T)产生约0.4%至0.6%(重量/重量)的dsRNA/总RNA(图15C)。其他突变变体(E350W+K387N+G47A+C末端G;E350W+D351V+G47A+C末端G;和K387N+D653T+G47A+C末端G)产生少于0.015%(重量/重量)的dsRNA/总RNA。

使用反相HPLC方法评估转录RNA的纯度。本实施例中所有测试的多取代变体产生与G47A+C末端G变体和野生型聚合酶(纯度约90%)具有相当纯度的RNA(图15D)。

使用Tris RP(反相)方法来评估加尾RNA的百分比(即,包含polyA尾部的转录RNA的百分比)。本实施例中所有测试的多取代变体产生与G47A+C末端G变体和野生型聚合酶(≥85%加尾)具有相当的加尾%的RNA(图15E)。

实施例14.多取代RNA聚合酶变体不会导致产生的RNA中插入缺失或点突变的增加

使用DNA模板、6mM等摩尔浓度NTP、1.5mM GGAG盖帽类似物和以下T7 RNA聚合酶进行体外转录反应:(1)G47A+C末端G变体;(2)D653T+G47A+C末端G变体;(3)D653W+G47A变体;(4)E350W+K387N+G47A+C末端G变体;(5)E350W+D351V+G47A+C末端G变体;或(6)D653+K387N+G47A+C末端G变体。

使用新一代测序(Next Generation Sequencing)评估产生的mRNA,以测试产生的RNA序列中的插入和缺失(indels)以及点突变。重要的是,所测试的聚合酶变体均未产生具有大量插入缺失或点突变的mRNA。所有测试的变体产生的mRNA具有0.0-0.4%的插入缺失,低于与野生型RNA聚合酶相关的插入缺失百分比的阈值。因此,本实施例证明所测试的聚合酶变体或它们的个体突变均不会对酶的保真度产生不利影响。

本文公开的所有参考文献、专利和专利申请的主题均以引用的方式并入,这些主题在一些情况下可以涵盖整个文件。

除非明确指出相反,否则在本说明书和权利要求中使用的不定冠词“一个/一种(“a”)”和“一个/一种(“an”)”应被理解为意指“至少一个/一种”。

还应该理解的是,除非明确指出相反,否则在本文要求保护的包括多于一个步骤或动作的任何方法中,方法的步骤或动作的顺序不一定限于所叙述的该方法的步骤或动作的顺序。

在权利要求以及上述说明书中,所有过渡短语如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“持有”、“由……组成”等应被理解为是开放式的,即,意指包括但不限于。如美国专利局专利审查程序手册章节2111.03中所述,只有过渡短语“由……组成”和“基本上由……组成”应该分别是封闭式或半封闭式过渡短语。

233页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:TREM组合物及其用途

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!