抗病毒治疗剂

文档序号:1618168 发布日期:2020-01-10 浏览:15次 >En<

阅读说明:本技术 抗病毒治疗剂 (Antiviral therapeutic agent ) 是由 D·D·斯隆恩 S·勒杜 X·C·熊 M·P·豪斯利 于 2018-03-30 设计创作,主要内容包括:本公开提供了用于裂解目标病毒核酸的向导RNA。本公开还提供了用于治疗HPV感染的组合物,所述组合物包含编码Cas核酸内切酶的mRNA以及具有特定序列和修饰的向导RNA,且两种RNA都被纳米粒子包封。在一些实施方式中,向导RNA和编码Cas核酸内切酶的mRNA被包装于脂质纳米粒子中,所述纳米粒子可悬浮于运载体配制物中以供表面或局部递送至受感染的组织。在一些实施例中,向导RNA和/或编码Cas核酸内切酶的mRNA还包含促进RNA递送至并驻留在受感染细胞内的特征,如修饰的核苷酸。(The present disclosure provides guide RNAs for cleaving a target viral nucleic acid. The present disclosure also provides compositions for treating HPV infections, the compositions comprising Cas endonuclease-encoding mRNA and a guide RNA having a specific sequence and modification, and both RNAs being encapsulated by a nanoparticle. In some embodiments, the guide RNA and mRNA encoding the Cas endonuclease are packaged in lipid nanoparticles, which can be suspended in a carrier formulation for topical or local delivery to the affected tissue. In some embodiments, the guide RNA and/or mRNA encoding the Cas endonuclease further comprise features, such as modified nucleotides, that facilitate RNA delivery to and retention within the infected cell.)

抗病毒治疗剂

关于序列表的声明

与本申请相关的序列表是以文本格式代替纸质复本提供,并且特此以引用的方式并入本说明书中。含有序列表的文本文件的名称是930285_421WO_SEQUENCE_LISTING.txt。所述文本文件是145KB,创建于2018年3月28日,并且以电子方式通过EFS-Web提交。

发明领域

本公开涉及病毒治疗组合物和方法。

背景技术

在世界范围内,病毒感染是引起疾病和死亡的主要原因。例如,子***是由感染某些类型人***瘤病毒(HPV)引起的。有两种HPV类型(16和18)引起70%的子***和癌前子宫颈病变。HPV还与头颈部(口咽)、***、外阴、***和***的癌症相关。根据世界卫生组织(World Health Organization),在2012年,有约270,000名妇女死于子***。在世界范围内,子***是排名第四的最常见的女性癌症,并且在2012年,估计有530,000例新增病例,占所有女性癌症死亡的7.5%。

HPV是***瘤病毒科(Papillomaviridae),即统称为***瘤病毒的DNA病毒家族的一个成员。***瘤病毒在体表组织的基底层中复制。***瘤病毒不具有包膜,意味着病毒的外壳或衣壳未被脂膜覆盖。称为Ll的单一病毒蛋白质形成55-60纳米的衣壳。与大多数无包膜的病毒相同,衣壳具有规则的几何形状并且呈现二十面体对称性。HPV基因组是约8,000个碱基对长度的双链环状DNA分子。它与包装基因组病毒DNA的细胞组蛋白蛋白质一起被包装于Ll壳内。

存在基于Ll外壳蛋白的HPV疫苗。不过,这些疫苗必须在暴露于病毒之前施用。这些疫苗不能治疗HPV感染或HPV相关疾病如癌症,并且尚无已知的HPV感染治愈方法。

另一种具有显著健康影响的病毒是乙型肝炎。据世界卫生组织估计,有2亿5千7百万感染乙型肝炎病毒的人。乙型肝炎病毒(HBV)侵袭肝并且会引起急性和慢性疾病。HBV是带部分双链的DNA病毒,具有约3kbp长度的基因组并且含具有逆转录酶活性的DNA聚合酶的基因(Seeger和Mason,《病毒学(Virology)》479-480:672-686,2015)。所述DNA在进入目标细胞后,在细胞核中转化成共价闭合环状DNA(cccDNA),接着形成病毒mRNA合成的模板(Seeger和Mason,《病毒学》479-480:672-686,2015)。

仍需要预防和治疗病毒感染如HPV或HBV感染的治疗方法。

发明内容

在某些方面,本公开提供了靶向病毒核酸,如HPV16、HPV18或HBV核酸的向导RNA。在其它方面,本公开提供一种组合物,其包括Cas核酸内切酶以及一个或多个靶向病毒核酸的向导RNA,或编码此类Cas核酸内切酶和/或向导RNA的核酸。在一些实施方式中,本公开提供一种用于治疗病毒感染如HBV或HPV感染的组合物,其包括(a)编码Cas核酸内切酶的mRNA以及(b)一个或多个向导RNA。所述mRNA和向导RNA可以包含特定序列和修饰,并且可以被纳米粒子包封。

在一些实施方式中,所述组合物包含一个或多个对病毒目标具有特异性的向导RNA,所述病毒目标如埃-巴二氏病毒(Epstein-Barr virus,EBV)、人***瘤病毒(HPV)、卡波西氏肉瘤病毒(Kaposi sarcoma virus,KSHV)、乙型肝炎病毒(HBV)、单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、水痘带状疱疹病毒(VZV)、巨细胞病毒(CMV)、人疱疹病毒-6(HHV-6)或人疱疹病毒-7(HHV-7)。

在一些实施方式中,所述组合物包含编码修饰的Cas核酸内切酶的mRNA,以及使Cas核酸内切酶靶向HPV基因组的一个或多个向导RNA,所述HPV基因组包含以游离形式存在和/或整合至宿主基因组DNA中的全长和部分片段。在一个实施方式中,向导RNA包括与HPV16或HPV18基因组内的位点互补的靶向区域,所述位点没有出现在人类基因组中。

在另一个实施方式中,所述组合物包含编码修饰的Cas核酸内切酶的mRNA以及使Cas核酸内切酶靶向HBV基因组的一个或多个向导RNA。

在一些实施方式中,向导RNA可以包含促进所述RNA递送至并驻留于受感染细胞内的特征,如修饰的核苷酸。在一些实施方式中,RNA中的修饰的核苷酸可用于改善RNA稳定性,降低免疫原性或改善核酸内切酶活性的特异性。例如,向导RNA可以包含能防止核酸外切酶消化的特征,如在核糖环上的一个或多个2'-O-甲基、核苷酸之间的一个或多个硫代磷酸酯键或两者,并且特别是位于向导RNA的5'和3'末端附近的这些特征。在一些实施方式中,向导RNA可任选地在例如靶向区域内包含一个或多个锁核酸、桥连核酸或构象限制性核酸,其可以稳定与病毒目标的结合,减少与非病毒目标(例如人DNA)的结合,或增强核酸内切酶活性的特异性。在另外的实施方式中,相对于野生型Cas9,所述Cas核酸内切酶可以包含突变,这些突变可以增强特异性并减少脱靶活性(例如通过使向导RNA与位于目标DNA目标以外的区域的相互作用不稳定)。在又另外的实施方式中,所述RNA可以包含能使患者的免疫应答降至最低的修饰,如假尿苷或5-甲基-胞嘧啶。

在一些实施方式中,所述mRNA优选地编码可编程核酸酶,如Cas核酸内切酶或修饰的Cas核酸内切酶。在某些实施方式中,所述mRNA编码修饰的Cas核酸内切酶,相对于野生型形式,其被修饰成具有降低的免疫原性。相对于野生型,所编码的修饰的核酸酶可以在T细胞表位内包含一个或多个取代。修饰治疗剂以避免免疫应答尚面临挑战,尤其是当治疗性蛋白质以mRNA的方式递送的时候。通过使用修饰的核苷酸序列,当所述mRNA翻译成蛋白质时,相对于野生型,所得蛋白质可以具有不会触发抗药物抗体(ADA)反应的不同的或修饰的表位。本公开包含修饰的Cas核酸内切酶蛋白质序列,相对于野生型Cas核酸内切酶,其中一个或多个预测的T细胞表位具有避免或降低免疫应答的取代。具有修饰的T细胞表位的修饰的Cas核酸内切酶可以呈编码于DNA载体中的形式、呈蛋白质形式(例如以修饰的Cas核酸内切酶与抗病毒向导RNA复合的活性核糖核蛋白(RNP)形式)或呈将在目标细胞内进行翻译的mRNA形式递送至细胞。在一些实施方式中,所述核酸酶是以mRNA形式,例如连同一个或多个向导RNA一起递送。

在一个实施方式中,编码Cas9的mRNA和向导RNA被包装于脂质纳米粒子(LNP)、固体纳米粒子或脂质体中。在此类实施方式中,包封RNA的纳米粒子可被配制成用于表面、粘膜或局部递送至受感染的组织,从而避免全身递送和循环,由此使药物暴露、脱靶活性以及Cas核酸内切酶的免疫原性降到最低。在一个实施方式中,RNA被包装于脂质纳米粒子中,所述脂质纳米粒子包含例如阳离子性脂质,其平衡磷酸酯主链的电荷并且促进渗透穿过组织并进入细胞中以及在细胞内释放RNA。包封编码Cas-9的mRNA以及向导RNA的脂质纳米粒子可进一步提供于表面用配制物中,所述表面用配制物含有适合凝胶或悬浮液,如水性悬浮液,其可以包含组织驻留增强剂或增稠剂,如羟乙基纤维素或羧甲基纤维素。本文所预期的LNP配制物可以包含一种或多种增强LNP稳定性的赋形剂,如蔗糖或甘露糖醇。并且在制备供表面递送的如本文所描述的LNP配制物的情况下,所述配制物可以包含增强组织渗透的赋形剂,如月桂基硫酸钠、乙醇、二乙二醇单***(Transcutol)、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮。在某些实施方式中,根据本说明书的LNP配制物可以用如微针阵列之类装置施用,以增进RNA递送至基底上皮。

具体实施方式

中,本文中所描述的LNP配制物通过表面或局部施加至感染部位,如与HPV感染相关的高级别癌前病变。在此类实施方式中,由LNP包封的向导RNA被释放于细胞内,并且由LNP包封的mRNA被释放并由细胞核糖体翻译产生Cas核酸内切酶。用于本发明组合物和配制物情形中的Cas9核酸内切酶可以包含连接子序列以及在N末端和/或C末端处被设计用于最佳核定位的一个或多个核定位序列(NLS)。在翻译后,Cas核酸内切酶与所提供的一个或多个向导RNA复合形成活性RNP。RNP运送至细胞核并通过向导RNA的互补部分与病毒基因组内的目标之间的序列特异性相互作用而结合至病毒基因组。在结合至病毒目标后,Cas核酸内切酶将病毒基因组裂解。由此得到的病毒DNA片段可以通过细胞途径降解或修复,由此清除或破坏感染。

在一个方面,本公开提供一种组合物,其包含编码Cas核酸内切酶的mRNA;向导RNA,其包括如SEQ ID NO.:1-38、71-76和79-83中任一个所示的核酸序列或其具有修饰的碱基的形式;多个包括阳离子性脂质的纳米粒子(即,“脂质纳米粒子”或“LNP”),并且其包封所述mRNA和所述向导RNA;以及运载体配制物。在具体实施方式中,所述运载体配制物可以包含使包封mRNA和向导RNA的LNP稳定的一种或多种成分。在另外的实施方式中,所述运载体配制物可以包含使包封mRNA和向导RNA的LNP稳定的一种或多种成分,以及通过促进组织驻留和/或组织渗透来增进表面或局部递送的一种或多种成分。脂质纳米粒子中使用的阳离子性脂质可以包含1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)或N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。在某些实施方式中,所述多个LNP是分散于运载体配制物内的固体脂质纳米粒子,并且所述运载体配制物包括运载体液体、油或凝胶。包含在本文所描述的组合物中的LNP可以被聚乙二醇化。在另一个实施方式中,包封于LNP中的mRNA包括SEQ ID NO.:55、56、57或58;包封于LNP中的向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35或37;并且所述多个LNP分散于由运载体配制物所提供的运载体液体、油或凝胶内。

在一些实施方式中,Cas核酸内切酶可以是Cas9,相对于野生型Cas9,其任选地包含至少一种选自以下组的氨基酸的变化:R780、K810、K848、K855、H982、K1003及R1060。例如,Cas9可以包含K848A、K1003A和R1060A。在某些实施方式中,编码Cas9的mRNA包括SEQ IDNO.:55、56、57、58、59、60、67、68、69、70、77或78。在一些实施方式中,mRNA的编码序列包括多个5-甲基胞苷。mRNA的编码序列可以包含多个假尿苷或5甲氧基-尿苷。

在一些实施方式中,所述组合物包含Cas核酸内切酶、或编码所述Cas核酸内切酶的多核苷酸,其相对于SEQ ID NO.:63在以下内具有一个或多个(例如在1与25个之间)取代:氨基酸149-165;氨基酸235-249;氨基酸566-580;氨基酸721-735;氨基酸880-894;氨基酸952-966;或氨基酸1312-1326。在一些实施方式中,相对于SEQ ID NO.:63,所述一个或多个取代在选自以下的位置处:R152、I154、A157、F238、N240、A243、F569、K571、C574、W883、Q885、N888、V955、L1315及N1317,并且其各自被取代成以下之一:K、V、S、L、Q、R、E、T或N。

在一些实施方式中,Cas核酸内切酶可以包含至少一种核定位信号。

在一些实施方式中,向导RNA包括多个(例如在约20%与100%之间)修饰的碱基,其各自选自以下组:2'-O-甲基腺苷(am);2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在某些实施方式中,向导RNA在向导RNA的5'端和3'端各自的十个末端核苷酸之间包括一个至九个硫代磷酸酯键。向导RNA可以包含至少一个桥连核酸(BNA)、锁核酸(LNA)和/或构象限制性核苷酸(CRN)。在某些实施方式中,向导RNA包括靶向区域,其包含如SEQ ID NO.:39或SEQ ID NO.:40中所示的核酸序列。

在一些实施方式中,向导RNA是SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35及37之一,并且任选地包含多个修饰的碱基,其各自选自以下组:2'-O-甲基腺苷(am);2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在一些实施方式中,向导RNA中约20%至100%的核苷酸在核糖上包括2'-O-甲基。

在一些实施方式中,向导RNA是SEQ ID NO.:41、43和45之一,任选地其中约20%至100%的核苷酸在核糖上具有修饰,如甲基或2'-O-甲基,并且优选地包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基腺苷(am);2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在一个实施方式中,向导RNA包括选自由SEQ ID NO.:41、43、45组成的组的向导RNA,此外,其中向导RNA包括多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。

本文还提供了治疗人***瘤病毒(HPV)感染的方法。此类方法的实施方式包含向有需要患者的感染部位施用有效量的本文所描述的组合物。所述患者可能患有HPV感染或已被诊断患有HPV阳性癌前低级别或高级别病变、HPV阳性原位鳞状细胞癌或HPV阳性侵袭性癌症。

在某些方面,本发明提供一种用于治疗病毒感染的如本文所公开的组合物。所述组合物优选地包含对选自以下组的病毒中的病毒目标具有特异性的一个或多个向导RNA:埃-巴二氏病毒(EBV)、人***瘤病毒(HPV)、卡波西氏肉瘤病毒(KSHV)、乙型肝炎病毒(HBV)、单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、水痘带状疱疹病毒(VZV)、巨细胞病毒(CMV)、人疱疹病毒-6(HHV-6)、人疱疹病毒-7(HHV-7)以及人多瘤病毒(BK、JC或默克尔细胞(Merkel cell),MCV)。在一些实施方式中,所述一个或多个向导RNA对EBV、HPV或HBV具有特异性。

在一个特定实施方式中,Cas核酸内切酶包括如SEQ ID NO.:62中所示的氨基酸序列,或编码Cas核酸内切酶的多核苷酸包括SEQ ID NO.:55-60和67-78之一。在一个实施方式中,所述组合物包含呈mRNA形式的编码Cas核酸内切酶的多核苷酸。向导RNA可靶向HPV并且包含例如选自以下组的向导RNA:SEQ ID NO.:1-38和71-76。优选地,向导RNA包括选自以下组的向导RNA:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35及37,并且包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在某些实施方式中,向导RNA包括SEQ ID NO.:2、3、4、6、7、8、9、10、11、12、13、14、15、16、18、20、22、24、26、28、30、32、34、36、38、71、72、73、74、75或76。优选地,Cas核酸内切酶、或编码Cas核酸内切酶的多核苷酸被包装于脂质体或脂质纳米粒子中。例如,在一些实施方式中,所述组合物包括包覆于LNP或脂质体中的呈活性RNP形式的Cas核酸内切酶,或所述组合物包含包封于固体脂质纳米粒子中的呈mRNA形式的多核苷酸。在某些实施方式中,相对于SEQ ID NO.:63,所述一个或多个取代选自R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q。任选地,相对于SEQ ID NO.:63,所述取代包含R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q中的六个至十五个。

在另一个实施方式中,根据本说明书的组合物包含编码Cas核酸内切酶的mRNA;具有与HPV基因组中的目标互补的部分的向导RNA,所述向导RNA包括选自以下清单的向导RNA:SEQ ID NO.:1-38、71-76和79-83,其任选地具有修饰的碱基;多个固体脂质纳米粒子(LNP),其包括阳离子性脂质并包封mRNA和向导RNA;以及运载体配制物。在某些此类实施方式中,所述运载体配制物可以包含使脂质纳米粒子稳定,通过促进组织驻留来增进表面或局部递送、和/或通过促进组织渗透来增进表面或局部递送的一种或多种成分。向导RNA可以是以下之一:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75及76,并且可以包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。任选地,Cas核酸内切酶是Cas9。优选地,向导RNA包含多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。mRNA的编码序列可以包含多个假尿苷或5甲氧基-尿苷。向导RNA在向导RNA的5'端和3'端各自的十个末端核苷酸之间包含一个或多个硫代磷酸酯键。

在具体实施方式中,所述载体包含一种或多种选自以下的赋形剂:羟乙基纤维素、羧甲基纤维素、蔗糖、甘露糖醇、月桂基硫酸钠、乙醇、二乙二醇单***、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮。

在一些实施方式中,相对于野生型Cas9,Cas9包含在一个与七个之间的选自以下组的氨基酸的变化:R780、K810、K848、K855、H982、K1003、R1060。在某些实施方式中,向导RNA包括至少一个桥连核酸(BNA)、锁核酸(LNA)和/或构象限制性核苷酸(CRN)。任选地,向导RNA中至少约20%的核苷酸在核糖上包括2'-O-甲基。LNP可以被聚乙二醇化。Cas9可以包含K848A、K1003A和R1060A。阳离子性脂质可以包含例如1,2-二油酰基-sn-甘油-3磷酸乙醇胺(DOPE)或N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。任选地,mRNA包括选自以下组的mRNA:SEQ ID NO.:55、56、57和58,并且向导RNA包括选自以下组的向导RNA:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75及76,优选地具有多个(例如20%至100%)修饰的碱基。

本文所描述的组合物的实施方式可用于治疗病毒感染。在此类实施方式中,所述组合物包含相对于SEQ ID NO.:63在选自以下组的氨基酸内具有一个至二十五个取代的Cas核酸内切酶、或编码所述Cas核酸内切酶的多核苷酸:氨基酸149-165;氨基酸235-249;氨基酸566-580;氨基酸721-735;氨基酸880-894;氨基酸952-966;以及氨基酸1312-1326;以及对选自由EBV、HPV和HBV组成的组的病毒中的病毒目标具有特异性的一个或多个向导RNA。优选地,所述组合物包括包封于脂质纳米粒子中的呈mRNA形式的多核苷酸。相对于SEQID NO.:63,所述取代可在选自以下的位置处:R152、I154、A157、F238、N240、A243、F569、K571、C574、W883、Q885、N888、V955、L1315及N1317,并且其各自任选地被取代成以下之一:K、V、S、L、Q、R、E、T及N。在一些实施方式中,Cas核酸内切酶包括至少一种核定位信号。Cas核酸内切酶可以包含SEQ ID NO.:62,或编码所述Cas核酸内切酶的多核苷酸可以包含选自以下组的多核苷酸:SEQ ID NO.:55、56、57、58及61。优选地,所述组合物包含编码Cas核酸内切酶的呈mRNA形式的多核苷酸。

在一个实施方式中,向导RNA靶向HPV。向导RNA可以包含选自以下组的向导RNA:SEQ ID NO.:1-38、71-76及79-83,其任选地具有约20%至100%的修饰的碱基。在一些实施方式中,向导RNA包括选自以下组的向导RNA:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75及76,其任选地包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在某些实施方式中,向导RNA包含选自以下组的向导RNA:SEQ ID NO.:2、3、4、6、7、8、9、10、11、12、13、14、15、16、18、20、22、24、26、28、30、32、34、36、38、71-73及79-83。在Cas9中,相对于SEQ ID NO.:63,所述取代可以包含R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q。优选地,相对于SEQ IDNO.:63,所述取代包含R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q中的至少六个。

附图简要说明

图1显示组合物101,其包含编码Cas核酸内切酶的mRNA 113和向导RNA 121。向导RNA 121包括靶向区域127,所述靶向区域与病毒基因组中的目标核酸互补。一个或多个纳米粒子105(其包含阳离子性脂质107)包封mRNA 113和向导RNA 121。纳米粒子105任选地被运载体配制物135,如水、水溶液或凝胶运载。运载体配制物135任选地包含一种或多种赋形剂136。

图2显示根据某些实施方式的mRNA 113。mRNA 113包含5'帽205、5'非翻译区(UTR)211、编码Cas核酸内切酶的开放阅读框架(ORF)215、3'UTR 221及多聚A尾227(例如120个腺苷核苷酸)。

图3显示核糖核蛋白(“RNP”),包括与向导RNA 121复合的Cas核酸内切酶307,显示出靶向区域127。

图4显示可用于包封本公开的核酸分子(例如mRNA和向导RNA)的脂质体401。

图5绘示治疗HPV感染的方法501。

图6是HPV基因组图谱。

图7显示体外CRISPR核酸内切酶分析的结果。上图显示如何使用CRISPR介导的裂解***DNA片段的概念图。下图显示通过用PCR检测***的DNA片段来检测CRISPR介导的裂解。A=HPV向导RNA 1.1.1(SEQ ID NO.:2);B=HPV向导RNA E6-2(SEQ ID NO.:81);C=HPV向导RNA E7-1(SEQ ID NO.:82)。

图8A和8B显示体外分析的结果,显示CRISPR/Cas9组合物可以减少病毒DNA并杀灭病毒细胞。(A)相较于被提供非特异性向导RNA的细胞,在被提供Cas9 mRNA和HPV16靶向性向导RNA的细胞中的病毒DNA水平较低。(B)相较于被提供非特异性向导RNA的HPV16+细胞,被提供Cas9 mRNA和HPV16靶向性向导RNA的HPV16+细胞中的细胞死亡较多(左图)。细胞死亡在HPV16-293细胞中明显较低,且在被提供HPV16靶向性向导RNA的细胞与被提供非特异性向导RNA的细胞之间比较类似(右图)。

图9显示体外分析的结果,显示CRISPR/Cas9可用于杀灭HPV16+癌细胞。相较于接受非特异性向导RNA的细胞,对接受Cas9 mRNA和HPV16靶向性向导RNA的细胞的细胞毒性较高。细胞杀灭倾向于随治疗后天数而增加(左图)且随着Cas9 mRNA的量增加(右图)而增加。

图10绘示制备用于治疗HPV感染的药剂的方法1001。

图11绘示基于GUIDE-Seq技术验证所述组合物的特异性的策略(参见Tsai等人,《自然·生物技术(Nature Biotechnology)》33:187-197,2015)。

图12显示所检测到的HPV16靶向性向导RNA在不同剂量时靶向HPV16基因组部分(SEQ ID NO.:64和65)的特异性。

图13显示与HPV16靶向性向导RNA联合施用的Cas核酸内切酶的体外DNA裂解效率的测量结果,所述HPV16靶向性向导RNA对应于HPV16向导RNA 1.1.1(A,圆圈)(SEQ ID NO.:2)、1.1.3(B,正方形)(SEQ ID NO.:4)及E6-1 BNA/LNA(C,菱形)(SEQ ID NO.:83)。

图14显示HPV向导RNA的体外裂解特异性,所述HPV向导RNA对应于HPV16向导RNA1.1.1(A)(SEQ ID NO.:2)、1.1.3(B)(SEQ ID NO.:4)及E6-1 BNA/LNA(C)(SEQ ID NO.:83)。

图15显示mRNA-LNP的成功组织渗透,其中所述mRNA编码绿色荧光蛋白(GFP)。

图16显示例示性Cas9核苷酸(mRNA)序列。对于SEQ ID NO.:54-60和67-70,使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。对于SEQ ID NO.:77,使用以下关键词示出了序列特征:在核苷酸之前的“m”表示2'-O-甲基RNA碱基修饰;在核苷酸之后的“*”表示硫代磷酸酯键主链修饰;在核苷酸之前的“+”表示锁核酸或桥连核酸;“Y”表示假尿苷;“m5c”表示5-甲基胞嘧啶。对于SEQ ID NO.:78,使用以下关键词示出了序列特征:O=5-甲氧基尿苷。

图17显示例示性Cas9蛋白质序列。使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。

图18显示用于靶向HPV16的例示性向导RNA序列。对于SEQ ID NO.:1-30和71-76,使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。对于SEQ ID NO.:79-83,使用以下关键词示出了序列特征:在核苷酸之前的“m”表示2'-O-甲基RNA碱基修饰;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸。

图19显示用于靶向HPV18的例示性向导RNA序列。使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。

图20显示用于靶向HBV的例示性向导RNA序列。使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。

图21显示靶向EBV的向导RNA在EBV基因组内的例示性目标序列。

图22显示例示性目标序列。使用以下关键词示出了序列特征:n=任何核苷酸。

图23显示Cas9 mRNA+HPV16 E7向导RNA组合物的特异性。

图24A-24C显示利用构象限制性核苷酸(CRN)修饰的HPV16 E7 gRNA(SEQ ID NO.:79)增强Cas9特异性。

具体实施方式

在某些方面,本公开提供了与病毒核酸,如HPV或HBV核酸中的目标互补的向导RNA序列。在一些实施方式中,向导RNA包括各种修饰,例如2'-O-甲基修饰的核苷酸、锁核苷酸或桥连核苷酸、或在两个核苷酸之间的硫代磷酸酯键。在一些实施方式中,所述向导RNA可以与Cas核酸内切酶(例如Cas9)一起使用以裂解目标核酸。在一些实施方式中,向导RNA是以组合物形式递送至细胞或组织中,所述组合物还包括编码Cas核酸内切酶的mRNA分子。在一些实施方式中,向导RNA是作为核糖核蛋白(RNP)复合物的一部分被递送至细胞或组织中。

在某些方面,本公开提供一种组合物,其包括Cas核酸内切酶以及一个或多个靶向病毒核酸的向导RNA,或编码此类Cas核酸内切酶和/或向导RNA的核酸。在一些实施方式中,本公开提供一种用于治疗病毒感染如HBV或HPV感染的组合物,其包括(a)编码Cas核酸内切酶的mRNA以及(b)一个或多个向导RNA。

在某些方面,本公开提供了预防或治疗病毒感染的方法,其包括施用包括如本文中所描述的向导RNA的组合物。

术语表

在更加详细地阐述本公开之前,提供本文要使用的某些术语的定义可能有助于理解本公开。如本文所使用,某些条目具有以下定义的含义。除非另外定义,否则本文所使用的所有技术和科学术语具有与本发明所属领域的一般技术人员通常所了解相同的含义。

除非上下文另外规定,否则在本说明书和权利要求书通篇,词语“包括(comprise)”和其变化形式,如“包括(comprises)”和“包括(comprising)”,应解释为开放性、包涵性含义,即“包含但不限于”。“由……组成”应意思指不包括超过痕量成分的本文所公开的其它成分和实质方法步骤。术语“基本上由……组成”将权利要求的范围局限于指定材料或步骤,或局限于不会实质上影响所要求的发明的基本特征的材料或步骤。例如,主要由如本文所定义的成分组成的组合物并不排除由分离和纯化方法得到的痕量污染物,以及药学上可接受的运载体,如磷酸盐缓冲生理盐水、防腐剂等。类似地,当蛋白质包含构成所述蛋白质至多20%的长度并且大体上不会影响所述蛋白质的活性(例如使所述蛋白质的活性改变不超过50%)的额外氨基酸时,所述蛋白质主要由特定氨基酸序列组成。由这些连接词分别定义的实施方式在本公开的范围内。

本说明书通篇提到的“一个实施方式(one embodiment/an embodiment)”意味着,所描述的与实施方式有关的特定特征、结构或特性包含在至少一个本发明的实施方式中。因此,在本说明书通篇不同位置中出现的短语“在一个实施方式中(in one embodiment/inan embodiment)”未必都是指同一个实施方式。此外,所述特定特征、结构或特性也可以通过任何适合方式组合于一个或多个实施方式中。

除非上下文另外明确规定,否则如本说明书和权利要求书中所使用,单数形式“一个(种)(a/an)”和“所述”包含多个(种)指代物。例如,术语“细胞”包含多个细胞,包含其混合物。类似地,除非上下文另外明确规定,否则如本文中所描述的“组合物”在治疗或制备药剂中的用途涵盖使用一种或多种本发明的组合物进行此类治疗或制备。

使用替代选择(例如“或”)应理解为意思指替代选择之一或替代选择的任何组合。例如,“核酸分子或肽”是指所述核酸分子或所述肽,或其两者。

“可选的”或“任选地”意思指随后描述的事件或情形可能发生或可能不发生,并且所述描述包含所述事件或情形发生的情况以及所述事件或情形不发生的情况。

如本文所使用,当描述一个序列时,“多个”意思指在至少两个与所有可能数量之间。为了说明,SEQ ID NO.:1是102个核苷酸长并且包含18个胞嘧啶。陈述SEQ ID NO.:1中的多个碱基被修饰意味着在2个与102个之间的碱基被修饰。陈述SEQ ID NO.:1含有多个5-甲基-胞嘧啶修饰意味着在2个与18个之间的胞嘧啶具有5’甲基。

如本文所使用,“约”和“近似地”一般是指根据测量的性质或精确度,所测量数值的可接受程度的误差。典型的例示性误差程度可在给定值或值范围的20%、10%或5%范围内。或者,且特别是在生物系统中,术语“约”和“近似地”可指在一个数量级范围内,也可能指在给定值的5倍或2倍范围内的值。当未明确陈述时,术语“约”和“近似地”意思指等于一值,或在所述值的20%范围内。

如本文所使用,数值量精确至所报导的有效数字个数所反映的程度。例如,值0.1应理解为意思指0.05至0.14。作为另一实例,值0.1至0.2的区间包含自0.05至0.24的范围。因此,自0.1mg/mL至2mg/mL的浓度意思指自0.05mg/mL至2.4mg/mL的浓度范围。

在本说明书中,除非另外指明,否则本文所提供的任何浓度范围、百分比范围、比率范围或整数范围应理解为包含所述范围内的任何整数值并且适当时包含其分数(如整数的十分之一和百分之一)。

如本文所使用,术语“肽”、“多肽”和“蛋白质”可互换使用,并且一般是指通过肽(酰胺)键连接的氨基酸的聚合物。其可具有任何长度并且可以是线性、分支或环状的。氨基酸可以是天然存在的、非天然存在的或可以是改变的氨基酸。这一术语还可以包含多条多肽链组装成复合物。这一术语还包含天然的或人工改变的氨基酸聚合物。此类改变包含二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其它处理或改变。这一定义还包括例如含一个或两个或更多个氨基酸类似物(例如含非天然存在的氨基酸)的多肽、类肽化合物(例如类肽)及本领域中已知的其它改变。

如本文所使用,术语“功能等效的肽”是指可在结构(序列)上不同但与原始肽相同或类似的肽。功能等效的蛋白质或肽可以通过应用重组DNA技术产生,在重组DNA技术中,可以基于被改变的氨基酸特性考虑,对蛋白质结构的变化进行工程改造。本领域的技术人员可通过应用诱变技术引入所设计的变化。

“信号肽”,又称为“信号序列”、“前导序列”、“前导肽”、“定位信号”或“定位序列”,是存在去往分泌路径的新合成蛋白质的N末端处的短肽(通常是15-30个氨基酸长度)。信号肽典型地包括由在N末端处带正电的亲水性氨基酸、具有5-15个残基的中心疏水性域以及具有信号肽酶裂解位点的C末端区域形成的短链段。在真核生物中,信号肽促使新合成的蛋白质易位至内质网中,在内质网中,其被信号肽酶裂解,产生成熟蛋白质,所述成熟蛋白质接着行进至其适当目的地。

如本文所使用,“核酸”或“核酸分子”是指脱氧核糖核酸(DNA)、核糖核酸(RNA)、寡核苷酸、由例如聚合酶链反应(PCR)或由体外翻译产生的片段,以及通过连接、断裂、核酸内切酶作用或核酸外切酶作用中的任一种产生的片段。在某些实施方式中,本公开的核酸是通过PCR产生的。核酸可以由单体构成,所述单体是天然存在的核苷酸(如脱氧核糖核苷酸和核糖核苷酸)、天然存在的核苷酸的类似物(例如天然存在的核苷酸的α-对映异构形式)或两者的组合。修饰的核苷酸可以具有“修饰”或被“修饰”,其中所述核苷酸例如因糖部分(例如2'-O-甲基化)、嘧啶或嘌呤碱基部分(例如甲基化)或核苷酸之间的键联(例如硫代磷酸酯键联)的替代或修饰而不同于野生型或原始或比较核苷酸分子。核酸单体可通过磷酸二酯键或此类键联的类似物连接。磷酸二酯键联的类似物包含硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、苯胺硫代磷酸酯、苯胺磷酸酯、氨基磷酸酯等。核酸分子可以是单链或双链的。

术语“基因”意思指多肽制造中所涉及的DNA区段;其包含在编码区之前和之后的区域“前导序列和尾随序列”,以及在个别编码区段(外显子)之间的***序列(内含子)。

术语“分离”意思指将所述材料从其原始环境(例如,如果其是天然存在的,则是天然环境)移出。例如,活动物中存在的天然存在的核酸或多肽不是分离的,但与天然系统中的一些或全部共存材料分开的所述核酸或多肽是分离的。此类核酸可以作为载体的一部分和/或此类核酸或多肽可以是组合物(例如细胞裂解产物)的一部分,并且仍然是分离的,因为此类载体或组合物不是所述核酸或多肽的天然环境的一部分。

如本文所使用,术语“重组”是指通过引入外源核酸分子对细胞、微生物、核酸分子或载体进行修饰,或是指将细胞或微生物改变成使得内源性核酸分子或基因的表达受控制、失调或组成性表达,其中此类改变或修饰可以通过基因工程改造引入。基因改变可包含例如将下列引入细胞遗传物质的修饰:编码一种或多种蛋白质或酶的核酸分子(其可以包含表达控制元件,如启动子),或其它的核酸分子添加、缺失、取代,或其它功能性破坏或添加。

如本文所使用,“突变”是指核酸分子或多肽分子序列分别相较于参考或野生型核酸分子或多肽分子的改变。突变可以引起序列的若干不同类型变化,包含核苷酸或氨基酸的取代、***或缺失。

如本文所使用,“保守突变”或“保守取代”是指一个氨基酸被具有类似特性的另一个氨基酸取代。例示性保守取代是本领域中众所周知的(参见例如Lehninger,《生物化学(Biochemistry)》,第2版;Worth Publishers,Inc.,纽约州纽约(NY,NY),第71-77页,1975;Lewin,《基因IV(Genes IV)》,Oxford University Press,NY and Cell Press,马萨诸塞州剑桥(Cambridge,MA),第8页,1990)。

如本文所使用,“序列同一性”或“同一性百分比”是指一个序列中与另一个参考多核苷酸或多肽序列中的核酸或氨基酸残基一致的核酸或氨基酸残基的百分比(即,同一性%=一致位置的数量/位置总数×100),其中考虑空位的数量以及使两个或更多个序列最佳对准而需要引入的每一空位的长度。序列同一性值百分比可根据Altschul等人(1997),“带空位的BLAST和PSI-BLAST:新一代蛋白质数据库检索程序(Gapped BLAST andPSI-BLAST:a new generation of protein database search programs)”,《核酸研究(Nucleic Acids Res.)》25:3389-3402所定义,使用NCBI BLAST2.0软件产生,其中参数集设置成默认值。

在本公开通篇阐述了其它定义。

向导RNA分子

如本文所使用,“向导RNA”是指包含反式作用RNA(tracrRNA)和crispr RNA(crRNA)两种,其与核酸内切酶一起用于形成活性核糖核蛋白(RNP),或是指单分子形式,称为单向导RNA或sgRNA。如本文所使用,“核糖核蛋白或RNP”是指由向导RNA与Cas核酸内切酶缔合形成的CRISPR/Cas蛋白质复合物。RNP可在体内由向导RNA与核酸内切酶天然缔合而形成,或其可在体外组装,并使用电穿孔或转染技术直接递送至细胞中。

在一个实施方式中,向导RNA是以单向导RNA形式存在。

在一个实施方式中,向导RNA包含一个或多个呈修饰的核苷酸形式的修饰或对典型磷酸酯主链键的修饰。

在一些实施方式中,向导RNA包括与病毒基因组内的位点互补的靶向区域或靶向部分,所述位点没有出现在人类基因组中。在一个实施方式中,向导RNA包含与HPV基因组内的目标特异性杂交的靶向区域。

在一些实施方式中,向导RNA可以包含促进所述RNA递送至并驻留于受感染细胞内的特征,如修饰的核苷酸。在一些实施方式中,RNA中的修饰的核苷酸可用于改善RNA稳定性,降低免疫原性或改善核酸内切酶活性的特异性。例如,向导RNA可以包含如在核糖环上的一个或多个2'-O-甲基、核苷酸之间的一个或多个硫代磷酸酯键或两者等特征。在一些实施方式中,此类修饰可以位于向导RNA的5'和3'末端附近,由此可以防止被核酸外切酶消化。在一些实施方式中,向导RNA可任选地在例如靶向区域内包含一个或多个锁核酸、桥连核酸或构象限制性核酸,其可以使与病毒目标的结合稳定,减少与非病毒目标(例如人DNA)的结合,或增强核酸内切酶活性的特异性。在又另外的实施方式中,向导RNA可以包含能使患者的免疫应答降至最低的修饰,如假尿苷或5-甲基-胞嘧啶。

在一个实施方式中,向导RNA包括多个(例如在约20%与100%之间)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(“cm”);2'-O-甲基鸟苷(“gm”);2'-O-甲基尿苷(“um”);2'-O-甲基假尿苷(“fm”);以及2'-O-甲基腺苷(“am”)。在一个实施方式中,向导RNA在向导RNA的5'端和3'端各自的十个末端核苷酸之间包括一个至九个硫代磷酸酯键。在另一实施方式中,向导RNA可以包含至少一个桥连核酸(BNA)、锁核酸(LNA)和/或构象限制性核苷酸(CRN)。

图3显示包含向导RNA 121的RNP 301,显示出靶向区域127。对于递送编码Cas9的mRNA的组合物(参见图1),在将组合物101递送至细胞后,mRNA被翻译形成Cas9蛋白质307,所述蛋白质与向导RNA 121复合形成所描绘的酶活性RNP 301。在其它实施方式中,将RNP301直接递送至细胞中。在某些实施方式中,向导RNA 121包含SEQ ID NO.:1-30、71-76和79-83之一,其任选地具有一个或多个修饰。在某些其它实施方式中,向导RNA 121包含SEQID NO.:31-38之一,其任选地具有一个或多个修饰。修饰可以包含例如在核苷酸核糖环上的2'-O-甲基、核苷酸之间的硫代磷酸酯键、或锁核酸或桥连核酸。除非另外说明,否则RNA优选地包含标准核糖核苷酸。

向导RNA 121可以包含2'-O-甲基化核苷酸。2'-O-甲基寡核苷酸修饰的特征可以是防止常规的碱基水解和核酸酶影响的RNA类似物,并且每次添加使双链体的Tm增加1-4℃。可以发现,2'-O-甲基寡核苷酸的构形是呈类RNA样A型,而不是类DNA样B型。可能只需要连续的几个此类修饰就能实现一种形式向另一种形式的转变。2'-O-甲基的另一益处包含使RNA分子对于核酸酶活性稳定。2'-O-甲基化核苷酸购自TriLink BioTechnologies,LLC(加利福尼亚州圣地亚哥(San Diego,CA))。在一个实施方式中,在向导RNA 121的5'和3'端的前5个或6个或7个碱基内包含1个至约10个,优选地约5个2'-O-甲基以在组合物101被递送至细胞中时防止核酸外切酶活性影响。向导RNA 121还可以包含构象限制性核酸(CRN),其包含锁核酸和桥连核酸。

锁核酸(LNA),通常称为不可及RNA,是修饰的RNA核苷酸。LNA核苷酸的核糖部分用连接2'氧和4'碳的额外桥修饰。该桥将核糖“锁定”在3'-内(北)构象,这通常在A型双链体中发现。必要时,LNA核苷酸可以与寡核苷酸中的DNA或RNA残基混合,并且根据沃森克里克碱基配对规则(Watson-Crick base-pairing rules),与DNA或RNA杂交。此类寡聚物是以化学方式合成的并且可购自Exiqon,即Qiagen公司(荷兰芬洛(Venlo,Netherlands))。

桥连核酸(BNA)是修饰的RNA核苷酸。它们有时也被称为限制性或不可及RNA分子。BNA单体可含有五元、六元或甚至七元桥连结构,其具有“固定”的C3'-内糖褶皱。该桥以合成方式并入核糖的2',4'-位处,得到2',4'-BNA单体。这些单体可以使用标准磷酰胺化学并入寡核苷酸聚合物结构中。BNA是呈刚性结构的寡核苷酸,具有增加的结合亲和力和稳定性。BNA购自Bio-Synthesis,Inc.(德克萨斯州路易斯维尔(Lewisville,TX))。

在一个实施方式中,向导RNA靶向HPV基因组,如HPV16基因组、HPV18基因组、HPV6基因组或HPV11基因组。在一个实施方式中,向导RNA包括如SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75或76中所示的核酸序列,并且任选地其中所述向导RNA中的一个或多个核苷酸进一步被多个修饰的碱基取代,所述修饰的碱基各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);2'-O-甲基假尿苷(fm);以及2'-O-甲基腺苷(am)。在一些实施方式中,向导RNA中约20%至100%的核苷酸在核糖上包括2'-O-甲基。在一个实施方式中,向导RNA包括如SEQ ID NO.:2、3、4、6-16、18、20、22、24、26、28、32、34、36、38或71-73中所示的核酸序列。

在一些实施方式中,向导RNA是SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4、37、41、43及45之一,并且任选地其中约20%至100%所述核苷酸具有修饰,如在核糖上的甲基或2'-O-甲基,并且优选地包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)和2'-O-甲基腺苷(am)。优选地,向导RNA包括选自以下组的向导RNA:SEQ IDNO.:41、43、45,并且任选地其中所述向导RNA中的一个或多个核苷酸进一步被多个修饰的碱基取代,所述修饰的碱基各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);2'-O-甲基假尿苷(fm);以及2'-O-甲基腺苷(am)。

在一个实施方式中,组合物101包含(a)编码Cas核酸内切酶,或活性Cas核酸内切酶的mRNA多核苷酸,以及(b)对病毒目标具有特异性的一个或多个向导RNA,所述病毒目标如埃-巴二氏病毒(EBV)、人***瘤病毒(HPV)、卡波西氏肉瘤病毒(KSHV)、乙型肝炎病毒(HBV)、单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、水痘带状疱疹病毒(VZV)、巨细胞病毒(CMV)、人疱疹病毒-6(HHV-6)或人疱疹病毒-7(HHV-7)。

本文所描述的组合物101的实施方式可以被提供用于治疗HPV感染。在此类实施方式中,向导RNA 121可包括含SEQ ID NO.:39或SEQ ID NO.:40的靶向区域127。被提供用于治疗HPV感染的组合物中所包含的向导RNA 121可以包含以下一个或多个:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4或37,并且任选地进一步包含十个或更多个2’-O-甲基尿苷。例如,在某些实施方式中,向导RNA 121中至少约20%的核苷酸在核糖上包含2'-O-甲基。在某些实施方式中,本发明的组合物可以包含针对HPV16使用的第一向导RNA。

在某些实施方式中,向导RNA包括以下之一:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4、37、41、43、45,并且任选地包含多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。例如,向导RNA可以是以下之一:SEQ ID NO.:2、3、4、6、7、8、9、10、11、12、13、14、15、16、18、20、22、24、26、28、30、32、34、36、38、42、44及46。

在一个实施方式中,向导RNA靶向HPV,并且包含以下之一:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35及37,并且任选地包含一个或多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。例如,向导RNA可以是以下之一:SEQ ID NO.:2、3、4、6、7、8、9、10、11、12、13、14、15、16、18、20、22、24、26、28、30、32、34、36、38。

在某些实施方式中,向导RNA靶向HBV并且包括SEQ ID NO.:41、43或45之一,并且进一步任选地包含一个或多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);2'-O-甲基假尿苷(fm);以及2'-O-甲基腺苷(am)。例如,向导RNA可以是SEQ ID NO.:42、44或46之一。

在其它实施方式中,向导RNA靶向EBV并且包含大体上与SEQ ID NO.:47、48、49、50、51、52及53之一互补的靶向区域,并且优选地包含多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。SEQ ID NO.:47是EBV基因组中的第一个目标。SEQ ID NO.:48是EBV基因组中的第二个目标。SEQ ID NO.:49是EBV基因组中的第三个目标。SEQ ID NO.:50是EBV基因组中的第四个目标。SEQ ID NO.:51是EBV基因组中的第五个目标。SEQ ID NO.:52是EBV基因组中的第六个目标。SEQ ID NO.:53是EBV基因组中的第七个目标。任选地,靶向SEQ ID NO.:47-53中的任一个的向导RNA可以包含本文中结合向导RNA描述的修饰中的任一个,并且优选地在向导RNA的末端7至10个核苷酸内包含至少三个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。

在一个实施方式中,本公开提供一种合成的向导RNA,其包括向导RNA核酸分子,所述向导RNA核酸分子具有与病毒核酸中的目标互补的靶向区域。在一个实施方式中,病毒核酸是人***瘤病毒(HPV)核酸。在另一个实施方式中,病毒核酸是乙型肝炎病毒(HBV)核酸。

在一个实施方式中,本公开提供一种合成的向导RNA,其包括具有与HPV16核酸中的目标互补的靶向区域的向导RNA核酸分子,并且包括(a)SEQ ID NO.:1-30、71-76和79-83中的任一个;或(b)与SEQ ID NO.:1-30、71-76和79-83中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在一个实施方式中,所述向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76。在另一个实施方式中,向导RNA包括与SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在特定实施方式中,向导RNA包括与SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76具有至少95%同一性的序列。在一个特定实施方式中,向导RNA的靶向区域包括SEQ ID NO.:39或SEQ ID NO.:40。在又另一实施方式中,病毒核酸中的目标包括SEQ ID NO.:64或SEQ ID NO.:65。在某一实施方式中,向导RNA包括SEQ ID NO.:80。在前述实施方式中的任一个中,向导RNA可包括一个或多个修饰的碱基。在前述实施方式中的任一个中,向导RNA可包括2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA可包括多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;以及2'-O-甲基腺苷。在一些实施方式中,向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76,其中所述向导RNA中的一个或多个核苷酸进一步被具有修饰的碱基的核苷酸取代,且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA中至少约20%的核苷酸可在核糖上包括2'-O-甲基。在前述实施方式中的任一个中,向导RNA可在两个核苷之间包括硫代磷酸酯键。在前述实施方式中的任一个中,向导RNA可在所述向导RNA的5’端和3’端各自的十个末端核苷酸内包括一个或多个硫代磷酸酯键。在一些实施方式中,向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76,其中向导RNA中的一个或多个核苷间键进一步被硫代磷酸酯键取代。在一些实施方式中,向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76,其中在所述向导RNA的5’端和3’端各自的十个末端核苷酸内的一个或多个核苷间键进一步被硫代磷酸酯键取代。在这些实施方式中的任一个中,向导RNA可包括桥连核酸(BNA)、锁核酸(LNA)或构象限制性核苷酸(CRN)。在一些实施方式中,向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76,其中所述向导RNA中的一个或多个核苷酸进一步被具有构象限制性核苷酸(CRN)的核苷酸取代。在一些实施方式中,向导RNA中的一个或多个核苷酸进一步被具有以下的核苷酸取代:(a)修饰的碱基,且各修饰的碱基是2'-O-甲基胞苷、2'-O-甲基鸟苷;2'-O-甲基尿苷、2'-O-甲基假尿苷或2'-O-甲基腺苷;(b)在核糖上的2'-O-甲基;(c)在两个核苷之间的硫代磷酸酯键;(d)LNA、BNA或CRN;或(e)(a)-(d)的任何组合。

在一个实施方式中,本公开提供一种合成的向导RNA,其包括具有与HPV18核酸中的目标互补的靶向区域的向导RNA核酸分子,并且包括(a)SEQ ID NO.:31-38中的任一个;或(b)与SEQ ID NO.:31-38中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在一个实施方式中,向导RNA包括SEQ ID NO.:31-38中的任一个。在另一个实施方式中,向导RNA包括与SEQ ID NO.:31-38中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在特定实施方式中,向导RNA包括与SEQ ID NO.:31-38中的任一个具有至少95%同一性的序列。在一个特定实施方式中,向导RNA包括SEQ ID NO.:31、33、35或37。在又另一个实施方式中,向导RNA包括与SEQ ID NO.:31、33、35或37具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在前述实施方式中的任一个中,向导RNA可包括一个或多个修饰的碱基。在前述实施方式中的任一个中,向导RNA可包括2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA可包括多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;以及2'-O-甲基腺苷。在一些实施方式中,向导RNA包括SEQ IDNO.:31、33、35或37,其中所述向导RNA中的一个或多个核苷酸进一步被具有修饰的碱基的核苷酸取代,且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA中至少约20%的核苷酸可在核糖上包括2'-O-甲基。在前述实施方式中的任一个中,向导RNA可在两个核苷之间包括硫代磷酸酯键。在前述实施方式中的任一个中,向导RNA可在所述向导RNA的5'端和3'端各自的十个末端核苷酸内包括一个或多个硫代磷酸酯键。在一些实施方式中,向导RNA包括SEQ ID NO.:31、33、35或37,其中向导RNA中的一个或多个核苷间键进一步被硫代磷酸酯键取代。在一些实施方式中,向导RNA包括SEQ ID NO.:31、33、35或37,其中在所述向导RNA的5’端和3’端各自的十个末端核苷酸内的一个或多个核苷间键进一步被硫代磷酸酯键取代。在这些实施方式中的任一个中,向导RNA可包括桥连核酸(BNA)、锁核酸(LNA)或构象限制性核苷酸(CRN)。在一些实施方式中,向导RNA包括SEQ ID NO.:31、33、35或37,其中所述向导RNA中的一个或多个核苷酸进一步被具有构象限制性核苷酸(CRN)的核苷酸取代。在一些实施方式中,向导RNA中的一个或多个核苷酸进一步被具有以下的核苷酸取代:(a)修饰的碱基,且各修饰的碱基是2'-O-甲基胞苷、2'-O-甲基鸟苷;2'-O-甲基尿苷、2'-O-甲基假尿苷或2'-O-甲基腺苷;(b)在核糖上的2'-O-甲基;(c)在两个核苷之间的硫代磷酸酯键;(d)LNA、BNA或CRN;或(e)(a)-(d)的任何组合。

在一个实施方式中,本公开提供一种合成的向导RNA,其包括具有与HBV核酸中的目标互补的靶向区域的向导RNA核酸分子,并且包括(a)SEQ ID NO.:41-46和66中的任一个;或(b)与SEQ ID NO.:41-46和66中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在一个特定实施方式中,向导RNA包括SEQ IDNO.:41、43或45。在另一个实施方式中,向导RNA包括与SEQ ID NO.:41、43或45具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在前述实施方式中的任一个中,向导RNA可包括一个或多个修饰的碱基。在前述实施方式中的任一个中,向导RNA可包括2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA可包括多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;以及2'-O-甲基腺苷。在一些实施方式中,向导RNA包括SEQ ID NO.:41、43或45,其中所述向导RNA中的一个或多个核苷酸进一步被具有修饰的碱基的核苷酸取代,且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA中至少约20%的核苷酸可在核糖上包括2'-O-甲基。在前述实施方式中的任一个中,向导RNA可在两个核苷之间包括硫代磷酸酯键。在前述实施方式中的任一个中,向导RNA可在所述向导RNA的5'端和3'端各自的十个末端核苷酸内包括一个或多个硫代磷酸酯键。在一些实施方式中,向导RNA包括SEQ ID NO.:41、43或45,其中向导RNA中的一个或多个核苷间键进一步被硫代磷酸酯键取代。在一些实施方式中,向导RNA包括SEQ IDNO.:41、43或45,其中在所述向导RNA的5’端和3’端各自的十个末端核苷酸内的一个或多个核苷间键进一步被硫代磷酸酯键取代。在这些实施方式的任一个中,向导RNA可包括桥连核酸(BNA)、锁核酸(LNA)或构象限制性核苷酸(CRN)。在一些实施方式中,向导RNA包括SEQ IDNO.:41、43或45,其中所述向导RNA中的一个或多个核苷酸进一步被具有构象限制性核苷酸(CRN)的核苷酸取代。在一些实施方式中,靶向HBV核酸的向导RNA中的一个或多个核苷酸进一步被具有以下的核苷酸取代:(a)修饰的碱基,并且各修饰的碱基是2'-O-甲基胞苷、2'-O-甲基鸟苷、2'-O-甲基尿苷、2'-O-甲基假尿苷或2'-O-甲基腺苷;(b)在核糖上的2'-O-甲基;(c)在两个核苷之间的硫代磷酸酯键;(d)LNA、BNA或CRN;或(e)(a)-(d)的任何组合。

在一些方面,提供了一种DNA分子,其编码如本文所公开的向导RNA。还涵盖一种载体,其包括此类DNA分子。

本公开的用于靶向HPV16的例示性向导RNA序列显示于图18中,用于靶向HPV18的例示性向导RNA序列显示于图19中,并且用于靶向HBV的例示性向导RNA序列显示于图20中。此外,图21和22显示了例示性目标序列。

Cas9分子和核酸

在一些实施方式中,本文所公开的组合物包括Cas核酸内切酶,例如CRISPR相关细菌核酸内切酶家族的任何成员。

在一些实施方式中,Cas核酸内切酶是野生型Cas9核酸内切酶,例如由如SEQ IDNO.:54中所示核酸分子所编码和/或包括如SEQ ID NO.:63或84中所示氨基酸序列的Cas9核酸内切酶。在其它实施方式中,Cas核酸内切酶是修饰的Cas9核酸内切酶,其中所述修饰的Cas9核酸内切酶相对于野生型分子是被修饰的。例如,Cas9可以被修饰成具有降低的免疫原性(例如被修饰成相对于野生型在T细胞表位内包含一个或多个取代)。修饰治疗剂以避免免疫应答尚面临挑战,尤其是当治疗性蛋白质以mRNA的方式递送的时候。通过使用修饰的核苷酸序列,当所述mRNA翻译成蛋白质时,相对于野生型,所得蛋白质可以具有不会触发抗药物抗体(ADA)反应的不同的或修饰的表位。在一些实施方式中,本公开提供一种修饰的Cas9核酸内切酶蛋白质序列,其中相对于野生型Cas9核酸内切酶,一个或多个预测的T细胞表位具有避免或降低免疫应答的取代。在一个实施方式中,相对于野生型Cas9,所述Cas9核酸内切酶包括至少一个氨基酸变化,其包括R780、K810、K848、K855、H982、K1003及R1060中的一个或多个。在一个实施方式中,Cas9蛋白质包括K848A、K1003A或R1060A。在一个实施方式中,mRNA的编码序列包括多个5-甲基胞苷。在另一个实施方式中,mRNA的编码序列可以包含多个假尿苷或5甲氧基-尿苷。

如下文更详细地论述,mRNA 113可以由如TriLink BioTechnologies,LLC(加利福尼亚州圣地亚哥)或AmpTec GmbH(德国汉堡(Hamburg,Germany))等公司通过体外转录制造。体外转录制造mRNA典型地使用含双链DNA模板的缓冲液以及RNA聚合酶和NTP混合物。所述聚合酶合成mRNA 113。接着,DNA被酶降解。从聚合酶、游离NTP和降解的DNA中纯化出mRNA113。

在一些实施方式中,Cas9核酸内切酶以编码于DNA载体中的形式、以蛋白质形式(例如以修饰的Cas9核酸内切酶与抗病毒向导RNA复合的活性RNP形式)或以将在目标细胞内翻译的mRNA形式递送至细胞。在一个实施方式中,Cas9核酸内切酶是以mRNA形式与一个或多个向导RNA一起递送。

图2显示根据某些实施方式的mRNA 113。mRNA 113包含5’帽205、5’非翻译区(UTR)211(例如可以来源于β-球蛋白序列)、编码Cas核酸内切酶的开放阅读框架(ORF)215、3’UTR221(例如来源于β-球蛋白序列)及多聚A尾227(例如120个腺苷核苷酸)。ORF215以起始密码子(AUG,Kozak序列的一部分)开始并以终止密码子(UAG)结束。mRNA113包含3’UTR,其支持翻译终止。mRNA 113还包含约80至120个碱基的多聚(A)尾,其支持翻译因子结合并使mRNA113稳定,由此防止mRNA降解。

在一些实施方式中,对于5’帽205,7-甲基-鸟苷通过5’-5’三磷酸桥连接至第一个5’核苷酸。取决于额外甲基的数量,此可以称为帽0、帽1或帽2。在一些实施方式中,如下所述制造的mRNA未全部加帽,即,并非100%的所制造的mRNA分子都会具有5’帽。5'UTR 211提供核糖体结合和翻译因子结合的位点。5'UTR 211影响mRNA 113的表达水平。表达包含将ORF 215的序列翻译成其相应氨基酸序列。ORF 215编码Cas核酸内切酶如Cas9,并且任选地针对哺乳动物表达进行密码子优化。5'帽205可以包含帽0或帽1,即7-甲基鸟苷通过5'-5'三磷酸桥连接至第一个5'核苷酸。Kozak序列跨越5'UTR 211的3'端与ORF 215的5'端,充当翻译起始区。在一些实施方式中,ORF包括SEQ ID NO.:54、55、56、57、58、59及60之一,其中向导RNA中的多个核苷酸进一步被具有修饰的碱基的核苷酸取代,并且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;以及2'-O-甲基假尿苷;或2'-O-甲基腺苷。在一些实施方式中,相对于典型RNA核苷酸序列,所述ORF包括一个或多个修饰。在一些实施方式中,ORF包括SEQ ID NO.:56、57或58,或因遗传密码的简并性而编码相同氨基酸序列的序列,所述序列与SEQ ID NO.:56、57或58具有至少约85%同一性且包含多个假尿苷和/或5-甲基胞苷残基。在一些实施方式中,ORF 215编码如由SEQ ID NO.:56-60之一所描述的Cas9变体,或功能等效的肽。在一些实施方式中,ORF 215编码如由SEQ ID NO.:67-70、77和78之一所描述的Cas9变体,或功能等效的肽。mRNA 113的ORF 215可以针对特定生物体进行密码子优化。

本领域的普通技术人员应了解,由于遗传密码的简并性,SEQ ID NO.:54-60、67-70、77和78的某些可预测的变化将提供各自对应的功能等效物。例如,参照Cas核酸内切酶基因的DNA有义链,一部分ORF可以包含CAA CCT CAA,其编码MPQ。然而,当任何碱基处于摇摆位置时,核糖体都会引入脯氨酸(P),因此脯氨酸的密码子可表示为CCN。当摇摆碱基是嘌呤时,引入谷氨酰胺(Q),并因此Q密码子可表示(也在DNA有义链中)为CAR(在此情况下,本领域的普通技术人员应认识到,N和R分别是IUPAC关于碱基和嘌呤的模糊代码)。使用标准密码子表以及对遗传密码的了解,可产生与SEQ ID NO.:54-60之一具有低至约85%同一性,但仍编码分别与SEQ ID NO.:54-60所编码相同的蛋白质的序列。因此,应了解,mRNA113的ORF 215可以包含SEQ ID NO.:54-60之一,或与SEQ ID NO.:54-60之一具有在85%与100%之间的同一性(如通过比对两个序列并计算[(相配碱基/总碱基)*100]测定)的序列。然而,与SEQ ID NO.:54-60具有或接近100%同一性的序列(例如同一性在95%与100%之间的序列)可能是最优选的,这是由于密码子优化以及例如GC含量或避免了RNA二级结构。

在一个实施方式中,mRNA 113编码Cas核酸内切酶,如Cas9型。在一个实施方式中,Cas9核酸内切酶是野生型酿脓链球菌(S.pyogenes)Cas9(SpCas9),并且是由包括SEQ IDNO.:54的mRNA编码。

在另一个实施方式中,mRNA 113编码修饰的Cas9核酸内切酶,

SpCas9-sgRNA复合物裂解目标位点,所述目标位点由NGG PAM序列(由SpCas9识别)21-24和邻近的20bp原间隔序列(与sgRNA的5'端互补)构成。结构研究表明,SpCas9-sgRNA-目标DNA复合物包含若干SpCas9介导的DNA接触,其包含由四个SpCas9残基(N497、R661、Q695、Q926)与目标DNA链的磷酸酯主链形成的直接氢键。用丙氨酸取代这些残基中的一个、更多个或全部不会降低SpCas9的在靶裂解效率。研究显示,三重取代变体(R661A/Q695A/Q926A)和四重取代变体(N497A/R661A/Q695A/Q926A)显示出良好活性。四重取代变体已被称作SpCas9-HF1,表示高保真度(High-Fidelity)变体#1,也称为HF S.p.Cas9。可以使用基于测序的全基因组无偏双链断裂鉴别(GUIDE-seq)方法评估脱靶活性。参见Tsai,2015,GUIDE-seq能够对由CRISPR-Cas核酸酶引起的脱靶裂解进行全基因组图谱分析(GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Casnucleases.),《自然·生物技术(Nat Biotechnol)》33:187-197,以引用的方式并入。具有额外D1135E取代的SpCas9-HF1(称为SpCas9-HF2)在研究中保持70%或更高的野生型SpCas9活性并且可以被包含在组合物101中。此外,还可包含带有额外L169A或Y450A取代(这些位置的侧链被认为会介导其在PAM近端与目标DNA的非特异性疏水相互作用)的变体。参见Kleinstiver,2016,具有不可检测的全基因组脱靶的高保真度CRISPR-Cas9变体(High-fidelity CRISPR-Cas9 variants with undetectable genome-wide offtargets),《自然》529(7587):490-495,以引用的方式并入。

在一些实施方式中,相对于野生型Cas9,所述Cas9包括至少一个氨基酸变化,其包括R780、K810、K848、K855、H982、K1003或R1060中的一个或多个。在一个实施方式中,Cas9包含K848A、K1003A及R1060A中的一个、二个或全部三个。在一个实施方式中,Cas9由如SEQ IDNO.:59中所示的mRNA序列编码,例如由SEQ ID NO.:59所定义的彼此意义相同的HFS.p.Cas9、SpCas9-HF1和高保真度变体#1。在另一个实施方式中,Cas9由与SEQ ID NO.:59具有至少85%、90%、95%或100%同一性的mRNA序列编码。

在本说明书的实施方式中,可以使用特异性增强的修饰的核酸酶,如Cas9的特异性增强形式(例如eSp(1.1)Cas9;SEQ ID NO.:60)。在一些实施方式中,编码eSp(1.1)的mRNA优选地包含5’帽、5’UTR、Kozak序列、ORF、3’UTR及多聚A尾。

据Slaymaker等人报导,Cas9介导的DNA裂解可能依赖于DNA链分离。参见Slaymaker,2016,合理设计的具有改善的特异性的Cas9核酸酶(Rationally designedCas9nucleases with improved specificity),《科学(Science)》351(6268):84-88,以引用的方式并入。核酸酶活性是通过链分离活化,因而sgRNA与目标DNA之间的错配将通过减弱Cas9的解螺旋酶活性而降低脱靶位点处的裂解活性。酿脓链球菌Cas9晶体结构展现带正电的沟,其位于SpCas9中的HNH、RuvC与PAM相互作用域之间,可能涉及使目标DNA的非目标链稳定。中和所述非目标链沟中带正电的残基可能削弱非目标链结合并促进目标与非目标DNA链之间的再杂交,由此在RNA向导与目标DNA链之间需要更严格的沃森-克里克碱基配对。在所述沟内的五个取代可使脱靶位点处的活性相较于野生型SpCas9降低,同时维持在靶裂解效率。具有高效率(野生型水平的在靶***缺失形成)和特异性(在EMX(1)和VEGFA(1)脱靶处未形成能检测出的***缺失)的变体包含:SpCas9(K855A)、SpCas9(K810A/K1003A/R1060A)[又称为eSpCas9(1.0)]及SpCas9(K848A/K1003A/R1060A)[又称eSpCas9(1.1)]。一些实施方式包含由组合物101中的mRNA 113所编码的eSpCas9(1.0)或(1.1)。

在所述实施方式中的任一个中,mRNA 113可以包含5-甲基胞苷(m5c)、假尿苷(Ψ)或两者中的一个或多个。修饰的核苷可以减少先天性免疫活化并增加mRNA的翻译。未修饰的mRNA可诱导不合需要的细胞因子分泌。通过使用噬菌体RNA聚合酶由DNA模板体外转录或通过固相化学合成,可以制备出大量的RNA。假尿苷(Ψ)和5-甲基胞苷(m5C)的三磷酸酯衍生物(TriLink)可用于产生含有修饰的核苷的RNA。在RNA中并入修饰的核苷酸可以减弱其活化RNA传感器如铎样受体(Toll-like receptor,TLR)3、TLR7和TLR8、视黄酸诱导性基因I(RIG-I)及RNA依赖性蛋白激酶(PKR)的能力。修饰的核苷酸优选地包含假尿苷-(Ψ)、或5-甲基胞苷-(m5C)、5-甲氧基-尿苷及Ψ-(m5C/Ψ)核苷修饰。在一些实施方式中,m5C/Ψ-核苷修饰的mRNA引起最低量的RNA传感器活化和最高水平的翻译。用HPLC纯化从体外转录的含Ψ或m5CΨ核苷的RNA中去除dsRNA和其它污染物,得到具有高翻译水平的RNA。参见Kariko,2011,产生适于疗法的最佳mRNA:HPLC纯化消除免疫活化并改善核苷修饰以及编码蛋白质的mRNA的翻译(Generating the optimal mRNA for therapy:HPLC purificationeliminates immune activation and improves translation of nucleoside-modified,protein-encoding mRNA),《核酸研究(Nucleic Acids Res)》39(21):e142,以引用的方式并入。

所述mRNA可被转录成含有例如30、51或120nt长的多聚(A)尾。多聚(A)尾可在转录期间以模板依赖性方式添加和/或可以在转录后用酶添加。例如,在转录之后,可以用酵母多聚(A)聚合酶添加额外的多聚(A)尾。RNA可在2'-O-甲基转移酶(ScriptCap,CellScript)存在或不存在下,用例如m7G加帽试剂盒加帽,由此获得帽1或帽0。加帽可以使用TriLink的CleanCap或AmpTec的酶加帽进行,例如产生帽1。

治疗性蛋白质的免疫原性会降低治疗剂的功效,这是由于在反复暴露之后,治疗剂的半衰期会因基于免疫的经由抗药物抗体(ADA)的清除而降低。减少ADA的策略包含:免疫抑制、患者耐受化(剂量、途径和共配制物)以及修饰蛋白质内高免疫原性的T细胞表位。在一些实施方式中,Cas9或修饰的Cas9包含Cas9或修饰的Cas9中免疫原性T细胞表位的修饰。

对于基于mRNA的治疗剂,蛋白质的合成的、定向的翻译后化学修饰(例如聚乙二醇化)是不可行的。不过,可改变预测的T细胞表位内的重要氨基酸以降低免疫原性和ADA。可以采用计算机模拟建模操作来预测蛋白质内的MHC II限制性免疫原性肽。本公开的一些实施方式包含T细胞表位相对于野生型核酸酶序列被修饰的核酸酶序列。核酸酶表位T细胞表位中的修饰可以改善体内药物特性,减少ADA并且有助于重复施用。降低免疫原性的另一种方法是通过将降解肽与Cas9或sgRNA缀合以缩短CRISPR组分的半衰期来减少药物暴露。

在一个实施方式中,Cas核酸内切酶包括如SEQ ID NO.:63中所示的野生型酿脓链球菌Cas9氨基酸序列。

在一个实施方式中,Cas核酸内切酶包括野生型酿脓链球菌Cas9氨基酸序列,其包括N末端和C末端核定位序列(NLS),例如SEQ ID NO.:61。在另一个实施方式中,同一mRNA分子内可包含具有不同NLS和连接子序列的额外Cas9蛋白质变体;例如,mRNA可以包含SEQ IDNO.:56-58之一,以及编码如SEQ ID NO.:61中所示的氨基酸序列的任何mRNA。例如,在一些实施方式中,mRNA分子可以编码多种Cas9,例如SEQ ID NO.:54-60、67-70、77及78中的多个。

在一个实施方式中,一种或多种Cas9变体相对于SEQ ID NO.:61具有增强的核定位,产生较高的核酸内切酶活性、较高的效力并且允许以较低药物水平施用。这些益处可有助于降低免疫原性,以及降低药物制造的成本。

在一个实施方式中,Cas核酸内切酶是具有减少的ADA和可选末端NLS序列的变体Cas9。例如,在一个实施方式中,Cas核酸内切酶包括如SEQ ID NO.:62中所示的氨基酸序列。在某些实施方式中,本发明采用了编码修饰的Cas核酸内切酶如SEQ ID NO.:62的mRNA。

Figure BDA0002291221210000271

Figure BDA0002291221210000281

SEQ ID NO.:62提供了被工程改造成具有减少的ADA的Spy Cas9蛋白质序列,其具有N末端和C末端NLS。预测的MHC表位(参见下文和实例1)以下划线示出。每一表位内以粗体表示的氨基酸指示降低ADA风险的取代。

因此,本发明的一些实施方式包含对HLA-DRB1中潜在MHC II限制性CD4 T细胞表位的诱变。可使用预测工具预测蛋白质序列中的MHC II T细胞表位。适合的预测工具包含例如SYFPETHI、IEDB(包含以下变化形式:推荐型、Consensus、NetMHCpan、NN_align、SMM_allign、组合文库、Sturniolo)、RANKPEP、ProPred、MULTIPRED2、MHCIIPred、MHC2SKpanNetMHCII NetMHCII。在一些实施方式中,SEQ ID NO.:62含有如下七个潜在T细胞表位:表位1包含氨基酸165-181;表位2包含氨基酸251-265;表位3包含氨基酸582-596;表位4包含氨基酸737-751;表位5包含氨基酸896-910;表位6包含氨基酸968-982;以及表位7包含氨基酸1328-1342。继续参照SEQ ID NO.:62,在一些实施方式中,各表位可以具有如下子序列(参照SEQ ID NO.:62):在表位1中,特别值得关注的可以是子区1a(氨基酸168-176)或子区1b(氨基酸170-178);在表位2中,子区2a是氨基酸255-263;在表位3中,子区3a是氨基酸586-594;在表位4中,子区4a包含氨基酸741-749;在表位5中,子区5a包含氨基酸900-908;在表位6中,子区6a包含氨基酸972-980;在表位7中,子区7a包含氨基酸1332-1340。由于Cas9的前述表位和子区表示可能具有高免疫原性的推定的表位,故它们特别值得关注。在一个实施方式中,表位1-3中的许多(例如至少一半)或大体上全部残基被突变成丙氨酸(并且这些突变不会干扰Cas9结构/功能)。在一个实施方式中,表位5-7内的某些指定残基被突变,包含选自以下的一个或多个突变(参照SEQ ID NO.:63):W883、Q885、N888、V955、L1315及N1317。将带电荷的残基突变成丙氨酸可能影响直接接触所述核酸的邻近残基的局部静电状态和定位。

本公开的例示性Cas9核酸序列显示于图16中,而本公开的例示性Cas9蛋白质序列显示于图17中。

组合物

在某些方面,本公开提供组合物,其包括靶向病毒核酸的Cas核酸内切酶以及一个或多个靶向病毒核酸的向导RNA,或编码此类Cas9核酸内切酶和/或向导RNA的核酸。在一些实施方式中,本公开提供一种用于治疗病毒感染(如HBV或HPV感染)的组合物,其包括(a)编码Cas核酸内切酶的mRNA以及(b)一个或多个向导RNA。在一些实施方式中,所述组合物包括Cas9核酸内切酶和一个或多个向导RNA。在一些其它实施方式中,所述组合物包括核糖核蛋白(RNP)复合物,其中所述RNP包括与向导RNP复合或缔合的Cas9核酸内切酶。在前述实施方式中的任一个中,mRNA和向导RNA可以包含特定序列和修饰,并且可以由纳米粒子包封。在特定实施方式中,向导RNA靶向HBV或HPV核酸。

在一些实施方式中,所述组合物包含编码修饰的Cas核酸内切酶的mRNA以及使Cas核酸内切酶靶向HPV或HBV基因组的一个或多个向导RNA。这些RNA被包装于脂质纳米粒子、固体纳米粒子或脂质体中。包封RNA的纳米粒子最佳地被配制成用于表面、粘膜或局部递送至受感染的组织,从而避免全身递送和循环,由此使药物暴露、脱靶活性以及Cas核酸内切酶的免疫原性降到最低。在一些实施方式中,纳米粒子是用如微针阵列之类装置施用以增进RNA向基底上皮的递送。

所述mRNA优选地编码可编程核酸酶,如Cas核酸内切酶或修饰的Cas核酸内切酶。在一些实施方式中,Cas核酸内切酶或修饰的核酸内切酶是Cas9核酸内切酶或修饰的Cas9核酸内切酶。在某些实施方式中,所述mRNA编码修饰的Cas核酸内切酶,相对于野生型形式,其被修饰成具有降低的免疫原性。所编码的修饰的核酸酶相对于野生型可以在T细胞表位内包含一个或多个取代。修饰治疗剂以避免免疫应答尚面临挑战,尤其是当治疗性蛋白质以mRNA的方式递送的时候。通过使用修饰的核苷酸序列,当所述mRNA翻译成蛋白质时,相对于野生型,所得蛋白质可以具有不会触发抗药物抗体(ADA)反应的不同的或修饰的表位。本发明包含修饰的Cas核酸内切酶蛋白质序列,其中相对于野生型Cas核酸内切酶,一个或多个预测的T细胞表位具有避免或降低免疫应答的取代。具有修饰的T细胞表位的修饰的Cas核酸内切酶可以呈编码于DNA载体中的形式、呈蛋白质形式(例如以修饰的Cas核酸内切酶与抗病毒向导RNA复合的活性核糖核蛋白(RNP)形式)或呈打算在目标细胞内翻译的mRNA形式递送至细胞。在一些实施方式中,所述核酸酶是以mRNA形式,例如连同一个或多个向导RNA一起递送。

在一些实施方式中,向导RNA包括与病毒基因组,例如HPV16、HPV18、HBV或EBV基因组内的位点互补的靶向区域,所述位点没有出现在人类基因组中。

在一些实施方式中,向导RNA可以包含促进所述RNA递送至并驻留于受感染细胞内的特征,如修饰的核苷酸。在一些实施方式中,RNA中的修饰的核苷酸可用于改善RNA稳定性,降低免疫原性或改善核酸内切酶活性的特异性。例如,向导RNA可以包含能防止核酸外切酶消化的特征,如在核糖环上的一个或多个2'-O-甲基、核苷酸之间的一个或多个硫代磷酸酯键或两者,并且特别是位于向导RNA的5’和3’末端附近的特征。在一些实施方式中,向导RNA可任选地在例如靶向区域内包含一个或多个锁核酸、桥连核酸或构象限制性核酸,其可以使与目标的结合稳定,减少与非病毒目标(例如人DNA)的结合,或增强核酸内切酶活性的特异性。在另外的实施方式中,Cas核酸内切酶相对于野生型Cas9可以包含突变,这些突变可以增强特异性并减少脱靶活性(例如通过使与位于向导RNA目标外部的目标DNA的相互作用不稳定)。在又另外的实施方式中,所述RNA可以包含能使患者的免疫应答降至最低的修饰,如假尿苷或5-甲基-胞嘧啶。

在一些实施方式中,所述RNA被包装于脂质纳米粒子中,所述脂质纳米粒子包含例如阳离子性脂质,其平衡磷酸酯主链的电荷并且促进渗透穿过组织并进入细胞中以及在细胞内释放RNA。脂质纳米粒子可另外提供于表面配制物中,所述表面配制物含有适合的凝胶或悬浮液,如水性悬浮液,其可以包含组织驻留增强剂或增稠剂,如羟乙基纤维素或羧甲基纤维素。所述配制物可以包含增强LNP稳定性的赋形剂,如蔗糖或甘露糖醇。所述配制物可以包含增进组织渗透的赋形剂,如月桂基硫酸钠、乙醇、二乙二醇单***(Transcutol)、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮(NMP)。配制的纳米粒子可用如微针阵列之类装置施用以增进RNA向基底上皮的递送。

在一些实施方式中,所述组合物通过表面或局部施加至感染部位,如与HPV感染相关的高级别癌前病变。RNA被释放于细胞内,并且mRNA由细胞的核糖体翻译以产生Cas核酸内切酶。Cas9核酸内切酶包含连接子序列以及在N末端和/或C末端处被设计用于最佳核定位的一个或多个核定位序列(NLS)。Cas核酸内切酶与所提供的一个或多个向导RNA复合形成活性RNP。RNP运送至细胞核并通过向导RNA的互补部分与病毒基因组内的目标之间的序列特异性相互作用而结合至病毒基因组。在结合至病毒目标后,Cas核酸内切酶将病毒基因组裂解。由此得到的病毒DNA片段可以通过细胞途径降解或修复,由此清除或破坏感染。

图1显示本公开的例示性组合物101,其包含编码Cas核酸内切酶的mRNA 113和向导RNA 121。一个或多个纳米粒子105(其包含阳离子性脂质107)包封mRNA 113和向导RNA121。如下文更详细地描述,向导RNA 121包含靶向区域127,其与目标核酸互补。在一些实施方式中,向导RNA 121包括SEQ ID NO.:1-38、71-76和79-83中的任一个,并且靶向区域127与人***瘤病毒(HPV)基因组中的目标核酸互补。在一些实施方式中,向导RNA 121包括SEQID NO.:1-30、71-76和79-83中的任一个,并且靶向区域127与人***瘤病毒(HPV)基因组中的目标核酸互补。纳米粒子105任选地被运载体配制物135,如水、水溶液或凝胶运载。运载体配制物135任选地包含一种或多种赋形剂136,如月桂基硫酸钠、乙醇、二乙二醇单***(Transcutol)、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮。本文描述mRNA 113、向导RNA 121、纳米粒子105和运载体配制物135,以及治疗感染的方法和制备药剂的方法。

在某些实施方式中,Cas9 mRNA包括如SEQ ID NO.:55、56、57或58中所示的核酸;向导RNA包括如SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75及76中所示的核酸;并且Cas9 mRNA和向导RNA被包封于多个纳米粒子内,其中所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。

本公开的各方面提供了用于治疗病毒感染的组合物和方法。在一个实施方式中,所述组合物包含Cas核酸内切酶,或编码所述Cas核酸内切酶的多核苷酸,其在以下的部分内具有一个或多个取代(相对于SEQ ID NO.:63):氨基酸149-165(也称为表位1);氨基酸235-249(也称为表位2);氨基酸566-580(也称为表位3);氨基酸721-735(也称为表位4);氨基酸880-894(也称为表位5);氨基酸952-966(也称为表位6);或氨基酸1312-1326(也称为表位7)。Cas核酸内切酶可以包含一个或多个NLS(例如在任一末端处)且在一些实施方式中是由SEQ ID NO.:62表示,并且参照SEQ ID NO.:62,这七个表位如下:表位1包含氨基酸165-181;表位2包含氨基酸251-265;表位3包含氨基酸582-596;表位4包含氨基酸737-751;表位5包含氨基酸896-910;表位6包含氨基酸968-982;以及表位7包含氨基酸1328-1342。继续参照SEQ ID NO.:62,这一个或多个取代具体地说可以位于以下的一个或多个内:氨基酸168-176;氨基酸170-178;氨基酸255-263;氨基酸586-594;氨基酸741-749;氨基酸900-908;氨基酸972-980;以及氨基酸1332-1340。相对于SEQ ID NO.:63,所述一个或多个取代可在R152、I154、A157、F238、N240、A243、F569、K571、C574、W883、Q885、N888、V955、L1315及N1317处,并且其各自被取代成以下之一:A、K、V、S、L、Q、R、E、T、N。在一个实施方式中,所述取代包含以下任一个,且任选地至少约五个或八个:R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q。

包括多个向导RNA的组合物

在一些实施方式中,所述组合物包括多种向导RNA,并且所述多种向导RNA具有不同的多核苷酸序列、修饰或两者。在一个实施方式中,不同的多种向导RNA分子具有不同的多核苷酸序列。在另一个实施方式中,所述不同的多种向导RNA结合至同一病毒核酸中的不同目标。在又另一个实施方式中,所述不同的多种向导RNA结合至不同病毒核酸中的目标。

例如,在一些实施方式中,所述组合物包括多种向导RNA并且第一个向导RNA包含:UGCAAUGUUU CAGGACCCAC GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAACUUGAAAAAGU GGCACCGAGU CGGUGCUUUU UU(SEQ ID NO.:1),优选地具有某些修饰。例如,在第一个向导RNA内,在5’端的前三个核苷酸各自在核糖环上包含2'-O-甲基。类似地,在3'端的最后三个核苷酸各自在核糖环上包含2'-O-甲基。另外,前三个和最后三个核苷酸间键联包含硫代磷酸酯键。序列以使用A、C、G和U(以大写字母或小写字母表示)的典型RNA命名法给出,并且相对于典型碱基和/或主链的任何变化通过适当附加文字描述。例如,在一些实施方式中,向导RNA 121(例如SEQ ID NO.:1-38、71-76和79-83之一)进一步包含一个或多个硫代磷酸酯键。

硫代磷酸酯(PS)键用硫原子取代寡核苷酸磷酸酯主链中的非桥连氧。这一修饰优选地被包含用于防止核酸酶降解核苷酸间的键联。硫代磷酸酯键可以引入寡核苷酸5’端、3’端或两者的最后3-5个核苷酸之间以抑制核酸外切酶降解。在整个寡核苷酸内包含硫代磷酸酯键也有助于减少核酸内切酶的攻击。具有PS键的寡核苷酸可从例如Integrated DNATechnologies,Inc.(爱荷华州科勒尔维尔(Coralville,IA))订购。参见Wan,含有手性硫代磷酸酯键联的第二代反义寡核苷酸的合成、生物物理学特性及生物活性(Synthesis,biophysical properties and biological activity of second generation antisenseoligonucleotides containing chiral phosphorothioate linkages),《核酸研究》42:13456-13458,2014,以引用的方式并入。

本发明的组合物可以包含用于针对HPV16的第二向导RNA。第二向导RNA包含SEQID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4、37、74、75或76之一,任选地以及关于第一向导RNA所描述的修饰中的任一个。第二向导RNA优选地还包含十个或更多个2'-O-甲基尿苷以减少先天性免疫应答。

本发明的组合物可以包含第三向导RNA。第三向导RNA包含SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4或37之一,任选地具有关于第一向导RNA和任选地关于第二向导RNA所描述的修饰中的任一个。第三向导RNA包含至少一个桥连核酸(BNA)。在某些实施方式中,第三向导RNA在DNA结合区的特定位点处包含锁核酸或桥连核酸以增加特异性。

本发明的组合物可以包含第四向导RNA,用于治疗HPV18。第四向导RNA包含SEQ IDNO.:31、33和35之一,并且任选地包含所述修饰中的任一个,并且优选地在5’端的前三个核苷酸各自在核糖环上包含2'-O-甲基。类似地,在3’端的最后三个核苷酸各自在核糖环上包含2'-O-甲基。另外,前三个和最后三个核苷酸间键联包含硫代磷酸酯键。第四向导RNA可任选地包含十个或更多个2'-O-甲基尿苷。第四向导RNA可任选地包含一个或多个构象限制性核苷酸(例如BNA或LNA),优选地在靶向区域内包含构象限制性核苷酸。

例示性组合物

在一个实施方式中,本公开提供一种组合物,其包括:编码Cas核酸内切酶的mRNA;如本文中所描述的向导RNA;多个包括阳离子性脂质的纳米粒子,并且其包封mRNA和向导RNA;以及运载体配制物。在另一个实施方式中,所述运载体配制物使所述脂质纳米粒子稳定并通过促进组织驻留和组织渗透增进表面或局部递送。在一个实施方式中,所述向导RNA包括SEQ ID NO.:1-30、71-76和79-83中的任一个。

在另一个实施方式中,所述组合物包括多种向导RNA,并且所述多种向导RNA具有不同多核苷酸序列、修饰或两者。在一个特定实施方式中,所述组合物包括具有不同多核苷酸序列的向导RNA分子,并且所述不同的多种向导RNA结合至同一病毒核酸中的不同目标,或结合至不同病毒核酸中的目标。

在前述实施方式中的任一个中,阳离子性脂质可以包括1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)或N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。在一个特定实施方式中,纳米粒子被聚乙二醇化。在另一个实施方式中,所述多个纳米粒子分散于运载体配制物内,并且所述运载体配制物包括运载体液体、油或凝胶。

在前述组合物中的任一种中,Cas核酸内切酶可以是Cas9,并且相对于野生型Cas9,Cas9可任选地包含在一个与二十五个之间的氨基酸取代。例示性氨基酸取代包含R780、K810、K848、K855、H982、K1003或R1060,以及K848A、K1003A和R1060A。在一些实施方式中,mRNA的编码序列包括多个5-甲基胞苷、假尿苷或5甲氧基-尿苷。

在一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括(a)SEQ ID NO.:1-30、71-76和79-83中的任一个,或(b)与SEQ ID NO.:1-30、71-76和79-83中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。

在另一个实施方式中,mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括SEQ ID NO.:1-30、71-76和79-83中的任一个;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。

在又另一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括(a)SEQ ID NO.:31-38中的任一个,或(b)与SEQ ID NO.:31-38中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。

在又另一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括SEQ ID NO.:31-38中的任一个;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。

在又另一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括(a)SEQ ID NO.:41-46和66中的任一个,或(b)与SEQ ID NO.:41-46和66中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。

在又另一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括SEQ ID NO.:41-46和66中的任一个;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。

在前述实例中,阳离子性脂质可以包括1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)和N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。

在前述实例中,向导RNA可以包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4、37、41、43、45、74、75或76,其中所述向导RNA中的多个核苷酸进一步被具有修饰的碱基的核苷酸取代,并且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;以及2'-O-甲基假尿苷;或2'-O-甲基腺苷。

在前述实例中,向导RNA可以包括SEQ ID NO.:41、43、45、74、75或76,并且其中所述向导RNA中的多个核苷酸进一步被具有修饰的碱基的核苷酸取代,并且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;以及2'-O-甲基假尿苷;或2'-O-甲基腺苷。

核糖核蛋白和相关组合物也在本公开的范围内。在一些实施方式中,向导RNA包括(a)SEQ ID NO.:1-30、71-76和79-83中的任一个;(b)SEQ ID NO.:31-38中的任一个;或(c)SEQ ID NO.:41-46和66中的任一个。在一些实施方式中,Cas是Cas9,例如Cas9核酸内切酶包括:(a)如SEQ ID NO.:61、62、63或84中所示的氨基酸序列;或(b)由如SEQ ID NO.:54、55、56、57、58、59、60、67、68、69、70、77或78中所示的核酸分子所编码的氨基酸序列。包括核糖核蛋白和药学上可接受的运载体的药物组合物也涵盖在本公开中。

纳米粒子

在一些实施方式中,本文所公开的向导RNA和Cas mRNA被包装于脂质纳米粒子中,所述脂质纳米粒子包含例如阳离子性脂质,其平衡磷酸酯主链的电荷并促进渗透穿过组织并进入细胞中以及在细胞内释放RNA。脂质纳米粒子可另外提供于表面用配制物中,所述表面用配制物含有适合的凝胶或悬浮液,如水性悬浮液,其可以包含组织驻留增强剂或增稠剂,如羟乙基纤维素或羧甲基纤维素。所述配制物可以包含增强LNP稳定性的赋形剂,如蔗糖或甘露糖醇。所述配制物可以包含增进组织渗透的赋形剂,如月桂基硫酸钠、乙醇、二乙二醇单***(Transcutol)、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮。配制的纳米粒子可用如微针阵列之类装置施用以增进RNA向基底上皮的递送。

优选地,在用于治疗病毒感染的组合物和方法中,所述组合物包含Cas核酸内切酶或编码所述Cas核酸内切酶的多核苷酸,其通过脂质体或脂质纳米粒子递送。本公开的实施方式还包含包覆于脂质体中的活性RNP,或包封于脂质纳米粒子中的多核苷酸。脂质体或纳米粒子可进一步提供于适合载体,如下文所描述的悬浮液或凝胶中。本发明的方法包含将这些组合物递送至感染部位,优选地非全身性递送。在这些方面,所述组合物和方法采用了修饰的Cas核酸内切酶,其中相对于野生型,预测的T细胞表位已被修饰成减弱免疫应答,否则通过在受感染组织中递送或表达核酸酶将引发免疫应答。

阳离子性脂质可以包含1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)或N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。优选地,所述多个纳米粒子是分散于运载体配制物内的固体脂质纳米粒子,并且所述运载体配制物包括运载体液体、油或凝胶。所述纳米粒子可以被聚乙二醇化。

在一个实施方式中,所述组合物101包含多个纳米粒子105,所述纳米粒子包括阳离子性脂质107。纳米粒子105包封mRNA 113和向导RNA 121。任何适合的纳米粒子都可以包含在内。纳米粒子105可以是如图1中所示的固体脂质纳米粒子。另外或替代地,脂质体可因多个阳离子性表面基团而用于递送mRNA 113和向导RNA 121,所述阳离子性表面基团与阴离子性核酸相互作用并形成脂质体复合物(lipoplex)。

图4显示可用于包封mRNA 113和向导RNA 121的例示性脂质体401。固体脂质纳米粒子或脂质体中任一形式均包含至少一种阳离子性脂质。

一般而言,阳离子性脂质基于头部基团结构被分成三个主要类别:单价脂质,如N(1-(2,3-二油酰基氧基)丙基)-N,N,N-三甲基氯化铵(DOTMA)和1,2-二油酰基-3-三甲基铵-丙烷(DOTAP);多价脂质,如二(十八烷基)酰胺基甘氨酰基精胺(DOGS);以及阳离子性脂质衍生物,如3β-(N-(N’,N’-二甲基氨基乙烷)-氨基甲酰基)胆固醇(DC-Chol)。疏水性链使纳米粒子具有不同特征。可发现相较于C16和C18链,肉豆蔻酰基(C14)链最适用于转染。较长的链会增加相变温度并减小脂膜的流动性,这可能不利于脂膜融合。类似地,相较于饱和烷基链脂质,具有明显较高脂质流动性的不饱和烷基链可能产生较高的转染效率。

阳离子性脂质可以用作载体以通过静电相互作用聚集并递送阴离子性核酸。通过调节阳离子性脂质与核酸的比率,过量的阳离子性涂层可以辅助载体与带负电细胞表面和核内体膜的结合,由此帮助核酸的细胞质递送。阳离子性脂质头部基团与核酸主链之间的静电相互作用促使mRNA 121和向导RNA 113包封于阳离子性脂质体中。制备方法描述于下。任选地,纳米粒子105被聚乙二醇化。

LNP的直径会通常在50-200nm的尺寸范围内,并且优选地在60-120nm的尺寸范围内,并且可任选地包含如PEG之类中性聚合物表面涂层以使蛋白质结合和不想要的吸收减到最少。纳米粒子105任选地由载体135,如水、水溶液、悬浮液或凝胶运载。例如,LNP可以被包含在用于表面递送的配制物或制剂中,如悬浮液或凝胶中。此类配制物可以包含化学增强剂,如脂肪酸、表面活性剂、酯、醇、多元醇、吡咯烷酮、胺、酰胺、亚砜、萜类、烷烃及磷脂(通过扰乱上皮或角质层的高度有序结构增进表面药物渗透)。

使用LNP可以增大有效负载RNA的溶解度,实现持续和控制释放,并因高渗透长驻留(EPR)效应而将较高浓度的RNA递送至目标区域。可以使用基于脂质的纳米粒子(脂质体和固体脂质纳米粒子)。

纳米粒子的表面药物递送可以将治疗作用直接提供至目标位点,可能减少不想要的全身副作用。有多种方式可将纳米粒子配制成供在医院中表面使用的形式,例如溶液/液体配制物形式、干燥配制物或粘性配制物(即,乳膏、洗剂、凝胶、软膏)。用于使纳米粒子悬浮的介质应具有生物相容性并用于促进经皮吸收。悬浮介质还可改变药物从纳米粒子释放的动力学。参见Goyal,2016,用于表面药物递送的纳米粒子和纳米纤维(Nanoparticlesand nanofibers for topical drug delivery),《控制释放杂志(J Control Release)》240:77-92,以引用的方式并入。

所述介质可以辅助渗透屏障,如角质层。例如,当角质层包含内嵌于由游离固醇、游离脂肪酸、三酸甘油酯及神经酰胺构成的双层基质中的角质细胞时,皮肤渗透增强剂可以增加RNA的渗透。

在某些实施方式中,LNP悬浮于缓冲液中。缓冲液可以包含渗透增强剂,如月桂基硫酸钠(SLS)。SLS是一种阴离子性表面活性剂,其通过增加表皮脂质的流动性来增强皮肤中的渗透。施加部位下方脂质流动性的增加可以使SLS最佳地扩散。由此SLS可以增加表皮内药物递送,而不是增加透皮递送。方法可以包含使用缓冲液如pH=6的200mM磷酸盐缓冲液,任选地含有约1至10%wt/wt的SLS,即约35至250mM SLS。参见Piret,2000,月桂基硫酸钠增加膦甲酸表面配制物针对小鼠1型单纯疱疹病毒皮肤病变的功效(Sodium LaurylSulfate Increases the Efficacy of a Topical Formulation of Foscarnet againstHerpes Simplex Virus Type 1Cutaneous Lesions in Mice),《抗微生物剂化学疗法(Antimic Ag Chemother)》44(9):2263-2270,以引用的方式并入。

脂质纳米粒子任选地可以通过凝胶,如聚氧化乙烯-聚氧化丙烯嵌段共聚物凝胶(任选地含有SLS)递送。泊洛沙姆(Poloxamer)是由中央聚氧化丙烯(聚(环氧丙烷))疏水性链侧接两个聚氧化乙烯(聚(环氧乙烷))亲水性链构成的非离子性三嵌段共聚物。由于聚合物嵌段的长度可以定制,故存在特性略微不同的许多不同的泊洛沙姆。对于通称“泊洛沙姆”,这些共聚物通常用字母“P”(代表泊洛沙姆)后接三个数字命名:前两个数字×100得到聚氧化丙烯核心的近似分子质量,且最后一个数字×10得到聚氧化乙烯的含量百分比(例如Kolliphor P 407=聚氧化丙烯的分子质量是4,000g/mol且聚氧化乙烯含量是70%的泊洛沙姆)。对于Pluronic和Synperonic商品名,这些共聚物的编码以一个字母定义其在室温下的物理形式开始(L=液体,P=糊浆,F=片状(固体)),后接两个或三个数字,数字标号中第一个数字(三个数字编号中的两个数字)乘以300指示疏水物的近似分子量;并且最后一个数字×10得到聚氧化乙烯含量的百分比(例如L61指示1,800g/mol的聚氧化丙烯分子质量和10%的聚氧化乙烯含量)。

脂质纳米粒子可以被冷冻干燥(例如使用右旋糖(5%w/v)作为冻干保护剂)。LNP可以保持在水性悬浮液中或例如用卵磷脂乳化。

治疗方法

本公开另一方面是本文所描述的向导RNA和相关组合物治疗病毒感染的用途。例如,在一个实施方式中,提供一种治疗受试者的病毒感染的方法,其包括向所述受试者施用治疗有效量的向导RNA、DNA、载体或Cas9-向导RNA组合物。

在一些实施方式中,本公开提供一种治疗人***瘤病毒(HPV)感染的方法。一些HPV类型可引起癌前病变(即,可能转变成癌症的异常生长),或引起癌症。某些HPV类型感染生殖器和其它区域,包含***、***、***或头颈部一些区域的内部和外部。“高风险”HPV是比较可能引起癌症的HPV类型。此类感染将正常细胞转化成癌前病变或癌症。与HPV相关的癌症包含子***、口腔癌、***癌、外阴癌、***癌及***癌。

在与HPV相关的子***中,约70%是由HPV16或HPV18引起。由HPV引起的子***可表现为癌前子宫颈病变。癌前子宫颈病变,又称为上皮内病变,是子宫颈细胞异常,其最终可发展成子***。子宫颈细胞存在两个主要类型,即鳞状细胞和腺细胞,并且任一类型中都可能出现异常。最常见的癌前子宫颈病变类型包含:非典型性鳞状细胞(子宫颈鳞状细胞异常);鳞状上皮内病变(分为低级别或高级别,其中高级别病变比较可能进展成子***);以及非典型性腺细胞(子宫颈上部区域或子宫内部可能出现的癌前病变)。推荐操作可以包含HPV测试。得到阳性测试结果后,可以治疗病变以清除HPV病毒。参见Senapati,2016,HPV介导的肿瘤进展的分子机制(Molecular mechanisms of HPV mediatedneoplastic progression),《感染因素与癌症(Infect Agent Cancer)》11:59eCollection;Ghittoni,2015,人***瘤病毒在癌发生中的作用(Role of humanpapillomavirus in carcinogenesis),《Ecancermedicalscience》9:526;以及世界卫生组织(World Health Organization),2013,WHO关于筛查和治疗癌前病变以预防子***的指导原则(WHO Guidelines for screening and treatment of precancerous lesionsfor cervical cancer prevention),WHO,日内瓦(Geneva),全部以引用的方式并入。

在一些实施方式中,所述组合物通过表面或局部施加至感染部位,如与HPV感染相关的高级别癌前病变。RNA被释放于细胞内,并且mRNA由细胞的核糖体翻译以产生Cas核酸内切酶。Cas9核酸内切酶包含连接子序列以及在N末端和/或C末端处被设计用于最佳核定位的一个或多个核定位序列(NLS)。Cas核酸内切酶与所提供的一个或多个向导RNA复合形成活性核糖核蛋白(RNP)。RNP运送至细胞核并通过向导RNA的互补部分与病毒基因组内的目标之间的序列特异性相互作用而结合至病毒基因组。在结合至病毒目标后,Cas核酸内切酶将病毒基因组裂解。由此得到的病毒DNA片段可以通过细胞途径降解或修复,由此清除或破坏感染。

图5绘示治疗HPV感染的方法501。方法501包含提供(505)根据本文所描述的实施方式的组合物101。将有效量的组合物101是以组合物的有效量施用(509)于有需要患者的感染部位。组合物101包含编码Cas核酸内切酶的mRNA 113以及向导RNA 121,所述向导RNA包括选自以下清单的向导RNA:SEQ ID NO.:1-38、71-76或79-83。多个纳米粒子105包封mRNA和向导RNA。最优选地,组合物101是通过肠胃外或表面施用509,并且避免全身循环。例如,可将组合物101直接施加至感染部位的表面,或注射至感染部位中。通过此类手段,方法501可用于治疗如鳞状细胞癌病变这样的感染部位,例如高级别癌前HPV病变。方法501可用于预防癌症,如子***、***癌、口腔癌、***癌或***癌的发作。优选地,所述方法被用于预防子***。向导RNA 121优选地包含大体上与HPV基因组中的区域互补的靶向区域127,所述向导RNA包括选自由SEQ ID NO.:1-38、71-76或79-83组成的清单的向导RNA。在某些实施方式中,以HPV的E6和/或E7基因作为目标。在一个实施方式中,提供一种治疗受试者的HPV感染的方法,其包括施用治疗有效量的包括SEQ ID NO.80的向导RNA和编码Cas9核酸内切酶的mRNA。

图6是HPV基因上HPV E6和E7基因的图谱。HPV E6和E7基因可以用作目标,使用可编程核酸酶进行抗病毒治疗。由于E6和E7蛋白质可能会致癌,故利用核酸酶靶向破坏其对应的基因可能是有用的。为设计向导RNA,针对核酸酶的前间隔序列邻近基序(PAM)(例如对于Cas9来说是5’-NGG-3’)对各基因进行扫描。对于基因内发现的每一候选PAM,读取邻近于PAM的20nt并与人类基因组相比较。如果所述20nt+PAM在人类基因组内根据特定的标准未找到匹配,则可使用所述20nt+PAM作为靶向序列。匹配标准是要求不存在完美匹配。在一个实施方式中,靶向序列是20nt+PAM(例如对于Cas9来说是23nt),对于该靶向序列而言,在人类基因组内不存在匹配≥70%的23nt链段。在一个实施方式中,靶向序列是20nt+PAM,对于该靶向序列,在人类基因组内不存在这样的20nt链段:其后接有PAM,并且其中人类基因组的20nt与靶向序列的20nt匹配率≥70%(例如,如果Cas9是该核酸酶,则应将人类基因组中具有14个或更多个相配碱基且其后接有PAM的20nt链段排除用作给定序列)。

制备药剂的方法

本发明的各方面提供一种制备用于治疗病毒感染的药剂的方法。

图10绘示制备用于治疗HPV感染的药剂(例如组合物101)的方法1001。方法1001包含制备(1005)编码Cas核酸内切酶的mRNA;制备(1009)一个或多个向导RNA,其包括选自以下清单的向导RNA:SEQ ID NO.:1-38、71-76或79-83;以及将mRNA和向导RNA包封(1013)于包括阳离子性脂质的多个纳米粒子中。可将纳米粒子引入(1019)药学上可接受的运载体,例如凝胶或悬浮液如水性悬浮液中。

在一些实施方式中,向导RNA包括选自以下之一的向导RNA:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4及37,其任选地具有一个或多个修饰。向导RNA优选地通过固相合成法合成。固相合成是在固体支持物上,在使所有试剂和溶剂能够自由穿过的柱中进行,所述固体支持物可以被保持在过滤器之间。在固相合成的情况下,可使用大量过量的溶液相试剂来驱使反应迅速完成。洗掉杂质和过量的试剂并且不需要纯化。这一方法可以自动进行并且适合于在计算机控制的固相合成仪自动进行。固体支持物(也称为树脂)是不溶性粒子,通常具有50-200μm直径,寡核苷酸将与其结合。适合载体包含受控微孔玻璃和聚苯乙烯。

固体支持物通常被制造成每克树脂装载20-30μmol核苷。任何适合方法都可使用,包含例如H-膦酸酯和磷酸三酯法,以及Khorana的磷酸二酯方法。在一些实施方式中,使用了氨基磷酸酯方法,使用固相技术和自动化进行。

氨基磷酸酯寡核苷酸合成是沿3’至5’方向进行,并且每个合成循环添加一个核苷酸。用于合成的结构单元通常被称为“单体”,其是活化的RNA核苷(氨基磷酸酯)。二甲氧基三苯甲基(DMT)用于保护核苷的5’端,β-氰基乙基保护3’-亚磷酸酯部分,并且还可以包含额外基团,用来保护杂环核碱基中的反应性伯胺。选择保护基是为了防止在合成期间发生分支或其它不合需要的副反应。寡核苷酸是在固体支持物上合成。通常,所述支持物是填充有受控微孔玻璃(CPG)、聚苯乙烯或膜的小柱。寡核苷酸通常从3’至5’合成。所述合成以将装载有初始支持物结合的受保护核苷酸的反应柱添加至合成仪的柱支架中开始。第一个核苷酸结构单元或单体通常被锚定至长链烷基胺-受控微孔玻璃(LCAA-CPG)。用于寡核苷酸合成的氨基磷酸酯方法是在固体支持物上,通常在受控微孔玻璃(CPG)或聚苯乙烯上分四个步骤进行。合成是通过用溶解于二氯甲烷(DCM)中的二氯乙酸(DCA)短暂处理以裂解5’-三苯甲基起始。接下来,使经过四唑活化的单体与可用的5’-羟基偶合,产生亚磷酸酯键联。随后,通过使用THF/吡啶/H2O溶液,用碘处理使亚磷酸酯氧化,得到磷酸酯主链。用乙酸酐加帽步骤完成寡核苷酸合成循环,乙酸酐终止了不合需要的失败序列。参见McBride,1983,有关可用于合成脱氧寡核苷酸的若干脱氧核苷氨基磷酸酯的研究(An investigation ofseveral deoxynucleoside phosphoramidites useful for synthesizingdeoxyoligonucleotides.),《四面体通讯(Tetrahedron Lett)》24:245-248,1983;以及Kosuri,2014,大规模从头DNA合成:技术和应用(Large-scale de novo DNA synthesis:technologies and applications),《自然-方法(Nat Meth)》11:499-507,二者以引用的方式并入。

在一些实施方式中,编码Cas核酸内切酶的mRNA是通过合成所述mRNA制备。任何适合的合成方法均可使用。在一些实施方式中,所述mRNA是通过体外转录制备。体外转录使用了含有启动子的纯化的线性DNA模板、核糖核苷酸三磷酸酯、包含DTT和镁离子的缓冲液体系以及适当的噬菌体RNA聚合酶。DNA模板优选地包含用于结合噬菌体聚合酶的双链启动子。所述模板可以包含通过克隆工程改造的质粒构建体、通过从RNA前体合成第一条链和第二条链产生的cDNA模板,或通过PCR或通过使以化学方式合成的寡核苷酸退火产生的线性模板。模板可以是(例如线性化的)质粒。许多质粒包含噬菌体聚合酶启动子。任何适合的启动子都可以使用,例如可以使用三种常用聚合酶SP6、T7或T3中任一种的启动子。

在一些实施方式中,(TriLink)线性化质粒模板用于“失控转录(Run-offTranscription)”,即,当RNA聚合酶从DNA掉落时,转录停止。质粒编码近似多聚(A)80尾。所述程序共转录添加甲基化5’帽(“帽1”)。这一程序是由TriLink以专用名称CleanCap提供。所述程序可以使用呈任何比率的正常或修饰的NTP(5mC、5-甲氧基-尿苷(5moU))。在转录反应之后,用磷酸酶处理mRNA以从未加帽的mRNA去除任何5’三磷酸酯。HPLC纯化最终的mRNA产物。

在某些实施方式中,使用PCR引物,仅从质粒的mRNA编码区扩增双链DNA模板。一个PCR引物含有多聚(A)120尾,以防止出现质粒中多聚(A)尾损失的问题。这一程序可以使用呈任何比率的正常或修饰的NTP(5mC、Ψ),并且可以进行共转录、或转录后和用酶加帽。在转录之后,用磷酸酶处理mRNA以从未加帽的mRNA去除任何5'三磷酸酯。通过离心柱(spincolumn)纯化mRNA以去除dsRNA。这一程序是由Amp-Tec提供。

一般而言,用于转录模板的质粒载体可以通过限制酶消化线性化。由于转录进行到DNA模板末端,故线性化确保产生指定长度和序列的RNA转录物。PCR产物也可以用作转录模板。可通过在正向或反向PCR引物的5’端包含启动子序列,将启动子添加至PCR产物中。

接着,在核苷三磷酸酯(rNTP)存在下,利用T7、T3或SP6 RNA噬菌体聚合酶转录模板DNA。所述聚合酶穿过模板链并使用与DNA碱基配对来合成互补RNA链(使用尿嘧啶代替胸腺嘧啶)。RNA聚合酶从DNA模板链的3’→5’端行进,沿5’→3’方向产生RNA分子。参见Jani,2012,Gaussia荧光素酶mRNA进行体外转录和加帽,随后转染海拉细胞(In vitroTranscription and Capping of Gaussia Luciferase mRNA Followed by HeLa CellTransfection),《实验视频杂志(J Vis Exp)》61:3702,以引用的方式并入。

可通过任何适合方法将mRNA和向导RNA包封于包括阳离子性脂质的多个纳米粒子中。制备方法可以包含将阳离子性脂质体与mRNA溶液直接混合,或用mRNA溶液使薄层脂膜复溶。阳离子性脂质/mRNA复合物分散于水溶液中通常产生异质复合物,有时仍称为阳离子性脂质体,但更准确地称为脂质体复合物。脂质体复合物可以包封高达90%输入剂量的核酸货物(cargo)。参见Wang,2015,用脂质纳米粒子递送寡核苷酸(Delivery ofoligonucleotides with lipid nanoparticles),《先进药物递送综述(Adv Drug DelivRev)》87:68-80,以引用的方式并入。

在一些实施方式中,修饰的mRNA(例如用基于T7聚合酶的IVT试剂盒制备,产率是约60μg/反应)与预先形成的DOTAP(1,2-二油酰基-3-三甲基铵-丙烷)/胆固醇(1:1摩尔比)脂质体发生静电相互作用。阳离子性脂质头部基团与核酸主链之间的静电相互作用促使mRNA包封于阳离子性脂质体中。由此得到自组装的、基于脂质体的核心膜纳米粒子配制物。静电相互作用通过诱导脂质双层在核心结构上塌陷,产生具有核心/膜结构的球形固体脂质体纳米粒子,由此促进自组装。参见Wang,2013,全身性递送编码单纯疱疹病毒1胸苷激酶的修饰的mRNA用于靶向癌症基因疗法(Systematic delivery of modified mRNAencoding herpes simplex virus 1thymidine kinase for targeted cancer genetherapy),《分子治疗学(Mol Ther)》21(2):358-367,以引用的方式并入。

制备方法可以包含将阳离子性脂质体与mRNA溶液直接混合,或用RNA溶液使薄层脂膜复溶。阳离子性脂质/RNA复合物分散于水溶液中可产生异质复合物,有时仍称为阳离子性脂质体,也称为脂质体复合物。脂质体复合物可以包封高达90%输入剂量的核酸货物。参见Wang,2015,用脂质纳米粒子递送寡核苷酸,《先进药物递送综述》87:68-80,以引用的方式并入。

在一些实施方式中,修饰的mRNA(例如用基于T7聚合酶的IVT试剂盒制备,产率是约60μg/反应)与预先形成的DOTAP(1,2-二油酰基-3-三甲基铵-丙烷)/胆固醇(1:1摩尔比)脂质体发生静电相互作用。由此得到自组装的、基于脂质体的核心膜纳米粒子配制物。静电相互作用通过诱导脂质双层在核心结构上毁坏,产生具有核心/膜结构的球形固体脂质体纳米粒子,由此促进自组装。参见Wang,2013,全身性递送编码单纯疱疹病毒1胸苷激酶的修饰的mRNA用于靶向癌症基因疗法,《分子治疗学》21(2):358-367,以引用的方式并入。因此,在一些实施方式中,纳米粒子另外包括N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。纳米粒子可以包含1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)。

在某些实施方式中,HPLC纯化的含1-甲基假尿苷的mRNA可以使用自组装方法包封于LNP中。LNP是使用可离子化脂质L319、二硬脂酰基磷脂酰胆碱(DSPC)、胆固醇和PEG-DMG以55:10:32.5:2.5(L319:DSPC:胆固醇:PEG-DMG)的摩尔比制备。以脂质氮与siRNA磷酸酯比率为3引入mRNA,所述比率对应于约10:1的总脂质与mRNA重量比。使用自发囊泡形成方法制备LNP。在pH 4的10mmol/l柠檬酸盐缓冲液中将mRNA稀释至约1mg/ml。溶解脂质并以适当比率混合于乙醇中。使用注射泵分别以15ml/min和5ml/min递送mRNA溶液和脂质溶液。将含有mRNA溶液和脂质溶液的注射器连接至配有PEEK高效液相色谱管(对于siRNA溶液是0.02in ID并且对于脂质溶液是0.01in ID)的接头连接器(0.05in通孔,#P-728;华盛顿州橡港市(Oak Harbor,WA)的IDEX Health&Science)。将一定长度的PEEK高效液相色谱管(0.04in ID)连接至接头连接器的出口并通向收集管。接着去除乙醇,并用磷酸盐缓冲生理盐水(155mmol/l NaCl、3mmol/l Na2HPO4、1mmol/l KH2PO4,pH 7.5),通过透析或切向流渗滤更换外部缓冲液。最后,通过0.2μm无菌过滤器过滤LNP。LNP优选地含有可离子化阳离子性脂质/磷脂酰胆碱/胆固醇/PEG-脂质(50:10:38.5:1.5mol/mol),以约0.05(wt/wt)的RNA与总脂质比率包封,并且具有约80nm的直径。可在-80℃下储存mRNA浓度是约1μg/μl的mRNA-LNP配制物。参见Maier,2013,能够迅速地消除脂质纳米粒子的可生物降解脂质用于全身递送RNAi治疗剂(Biodegradable lipids enabling rapidly eliminating lipidnanoparticles for systemic delivery of RNAi therapeutics),《分子治疗学》21(8):1570-1578,以引用的方式并入。相关背景,参见WO 2016/089433 Al、WO 2015/006747 A2、WO 2014/093924 Al及WO2013/052523 Al,全部以引用的方式并入。

图11显示用于验证RNP特异性的策略。将CRISPR组分以及双链寡脱氧核苷(dsODN)电穿孔放入目标细胞中。将细胞与RNP一起培育并由Cas9引入的断裂捕捉dsODN。1天之后,提取基因组DNA(gDNA)并进行样品制备,其包含添加接头以建立测序文库。使用测序鉴别捕捉的dsODN。

因此,可以通过基于测序的全基因组无偏双链断裂鉴别(GUIDE-seq)方法评估脱靶活性。参见Tsai,2015,GUIDE-seq能够对由CRISPR-Cas核酸酶引起的脱靶裂解进行全基因组图谱分析,《自然·生物技术》33:187-197,以引用的方式并入。使用Tsai,2015的GUIDE-seq方法测定组合物101的脱靶作用。利用这种手段,可显示出组合物101具有可接受的低脱靶作用和高在靶特异性。

除通过所公开的mRNA和递送方法带来的良好在靶特异性外,所公开的组合物且特别是包封于脂质纳米粒子中的mRNA在目标组织和细胞中展现良好渗透和释放,其中mRNA的释放使其能够例如通过翻译成活性蛋白质进行表达。

实施例1

具有修饰的T细胞表位的Cas9蛋白质变体

对野生型酿脓链球菌Cas9氨基酸序列SEQ ID NO.:63进行表位分析。使用多个计算机模拟预测工具鉴别可能的针对HLA-DRB1的MHC II限制性CD4 T细胞表位,以进行诱变,所述工具包含:SYFPETHI、IEDB(利用默认设置完成的分析、Consensus、NetMHCpan、NN_align、SMM_allign、组合文库及Sturniolo)、RANKPEP、ProPred、MULTIPRED2、MHCIIPred、MHC2SKpan及NetMHCII。

针对SEQ ID NO.:63预测得到七个表位:表位1(包含氨基酸149-165);表位2(包含氨基酸235-249);表位3(包含氨基酸566-580);表位4(包含氨基酸721-735);表位5(包含880-894;表位6包含氨基酸952-966);以及表位7包含氨基酸(1312-1326)。

参照SEQ ID NO.:62,所述七个表位如下:表位1包含氨基酸165-181;表位2包含氨基酸251-265;表位3包含氨基酸582-596;表位4包含氨基酸737-751;表位5包含氨基酸896-910;表位6包含氨基酸968-982;以及表位7包含氨基酸1328-1342。

继续参照SEQ ID NO.:62,各表位可以具有如下子序列(参照SEQ ID NO.:62):在表位1中,特别值得关注的可以是子区1a(氨基酸168-176)或子区1b(氨基酸170-178);在表位2中,子区2a是氨基酸255-263;在表位3中,子区3a是氨基酸586-594;在表位4中,子区4a包含氨基酸741-749;在表位5中,子区5a包含氨基酸900-908;在表位6中,子区6a包含氨基酸972-980;在表位7中,子区7a包含氨基酸1332-1340。Cas9的前述表位和子区因其被鉴定为可能具有高免疫原性的潜在表位而特别值得关注。

为了分析表位的可突变性,根据apo-Cas9 3D晶体结构数据、与sgRNA结合的Cas9结构以及sgRNA-Cas9-dsDNA结构检查各表位,以确定各表位中以粗体显示的重要残基的重要性。例如,可能会发现大多数残基可以突变成丙氨酸以减少表位的电荷问题,而不可能影响结构或功能。还可能会发现,丙氨酸残基可以保守突变成丝氨酸。

实施例2

靶向HPV16的Cas9组合物

提供基因编码的mRNA DNA,通过T7噬菌体聚合酶进行转录,同时通过氨基磷酸酯合成法合成向导RNA。

作为体外测试,将Cas9、向导RNA和目标DNA混合并培育以进行体外核酸内切酶分析。如图7中所示,对消化的DNA进行DNA凝胶电泳揭示了高核酸内切酶活性。四个泳道显示E6-E7区域的PCR扩增子以及体外RNP处理的扩增子的产物的结果。泳道2-4各自显示相对于对照的差异。泳道3显示HPV基因组DNA裂解成具有独特质量的三个片段。由于gRNA被设计成在E6或E7基因内匹配,故这些数据表明,可以通过Cas9-向导RNA介导的裂解使相应蛋白质的表达停止。

图8显示体外分析的结果,显示递送(通过电穿孔)Cas9(SEQ ID NO.:54)和向导RNA(SEQ ID NO.:2)可减少SiHa细胞中HPV基因组的拷贝数。(A)在被提供HPV16靶向性向导RNA的细胞中的病毒DNA水平要低于被提供非特异性向导RNA的细胞。(B)被提供HPV16靶向性向导RNA的HPV16+SiHa细胞中的细胞死亡要多于被提供非特异性向导RNA的HPV16+细胞(左图)。HPV16阴性293细胞中的细胞死亡要低得多,不管是否提供HPV16靶向性向导RNA和或非特异性向导RNA(右图)。

图9展示,可使用CRISPR/Cas9在体外杀灭HPV16+SiHa癌细胞。相较于接受非特异性向导RNA的细胞,电穿孔放入Cas9 mRNA(SEQ ID NO.:54)和HPV16靶向性向导RNA(SEQ IDNO.:2)的细胞的细胞毒性较高。细胞杀灭往往随治疗后天数(左图)且随着Cas9 mRNA的量增加(右图)而增加。

实施例3

靶向HPV16的Cas9组合物

图12显示如实施例5中所描述,通过GUIDE-Seq检测到的在不同剂量时向导RNA针对HPV16基因组靶向部分(SEQ ID NO.:64和65)的特异性。当以SEQ ID NO.:64或SEQ IDNO.:65作为目标时,特异性是99.9%至100%。

图13显示使用无细胞DNA裂解分析测量的Cas核酸内切酶对于HPV16靶向性向导RNA 1.1.1(SEQ ID NO.:2)(圆圈);1.1.3(SEQ ID NO.:4)(正方形)及E6-1 BNA/LNA(SEQID NO.:83)(菱形)的在靶(左图)和脱靶(右图)DNA裂解效率的结果。预培育Cas9蛋白质和gRNA以形成核糖核蛋白复合物。接着添加含有gRNA目标序列的双链DNA,使CRISPR复合物裂解DNA一段较短时间,随后淬灭反应。利用毛细管凝胶电泳分离裂解和未裂解的DNA产物并定量。

原间隔序列中BNA/LNA修饰的核苷酸降低针对脱靶DNA的活性,同时维持针对在靶DNA的活性。

图14显示通过GUIDE-Seq测定的对于HPV靶向性向导RNA 1.1.1(SEQ ID NO.:2)(A)、1.1.3(SEQ ID NO.:4)(B)及E6-1 BNA/LNA(SEQ ID NO.:83)(C)的细胞内DNA裂解特异性。结果显示,包含至少一个构象限制性核苷酸如锁核酸或桥连核酸残基可明显改善体内裂解特异性。

实施例4

含有mRNA的脂质纳米粒子的组织渗透

图15显示含有编码绿色荧光蛋白(GFP)的mRNA的脂质纳米粒子成功组织渗透。在将LNP包封的mRNA***内递送至子宫颈上皮PBS之后由小鼠子宫颈得到的切片的显微照片用作阴性对照。Turbofect是可商购的转染试剂。LNP 1A是包封于脂质纳米粒子中的GFPmRNA。LNP 1B是包封于含不同脂质组成(MC3)的另一脂质纳米粒子中的GFP mRNA。所述mRNA编码GFP,由此GFP指示由LNP递送的mRNA翻译的所表达的活性蛋白质。箭头指示LNP 1A和LNP 1B的荧光明显大于PBS或Turbofect的区域。结果显示,LNP 1A和LNP 1B使得表达的蛋白质广泛分布于子宫颈上皮中。

实施例5

Cas9 mRNA+HPV16 E7 gRNA的特异性

通过无偏深度测序GUIDE-Seq方法测量HPV16靶向性向导RNA的在靶和脱靶活性。通过Guide Seq并如《自然·生物技术》2015年2月;33(2):187-197.doe:10.1038/nbt.3117中所描述,测定DNA双链断裂的无偏鉴别。

简单点说,用Cas9 mRNA(SEQ ID NO.:68,或编码高保真度Cas9变体的序列,SEQID NO.:59及SEQ ID NO.:60)、向导RNA(SEQ ID NO.:6)及整合于DNA双链断裂处的双链寡脱氧核苷酸(dsODN)共转染细胞。图7展示dsODN的成功并入。上图是并入基因组DNA(阴影线条形)中的dsODN(空心条形)的示意图。下图显示两个独特的PCR反应以及其相应凝胶电泳图像,展示35bp dsODN并入SiHa基因组DNA中。在CRISPR处理和dsODN整合之后,通过超声波处理来分离并剪切基因组DNA,接着将接头连接至剪切的DNA。在MiSeq下一代测序机器上执行dsODN特异性扩增和测序。如https://github.com/aryeelab/guideseq所描述,执行序列加工。以在靶“读段”百分比(即,通过用在靶读段的数量除以读段总数×100)来计算特异性。

如图23中所示,当在HPV16+SiHa细胞中,将对应于SEQ ID NO.:68的Cas9 mRNA与gRNA(SEQ ID NO.:6)一起使用时(上表),目标序列裂解具有高特异性,显示无脱靶作用且在靶裂解比率超过99%。使用相同的RNA,在2个HPV16阴性细胞系(C33a、293T)中未检测到脱靶读段。当用相同的gRNA(SEQ ID NO.:6)递送高保真度Cas9 mRNA序列时(下表),在靶裂解比率甚至更高(100%在靶上)。

实施例6

与构象限制性核苷酸(CRN)修饰的HPV16 E7 gRNA联用的Cas9的特异性增强

相较于未修饰的核苷酸,构象限制性核苷酸(CRN)修饰的核苷酸对于形成非沃森克里克碱基对具有较低容许度。因此,将CRN修饰添加至gRNA的靶向区域中并进行测试以确定是否相较于未修饰的核苷酸,其保持高的在靶活性以及在预测的脱靶DNA位点具有增加的特异性。

使用无细胞裂解分析评估CRN修饰的向导RNA靶向HPV16的有效性。将含有E7基因目标或已知的HPV16向导1.2的潜在脱靶位点的2kb双链DNA与预先形成的核糖核蛋白一起培育,所述核糖核蛋白由Cas9蛋白质(SEQ ID NO.:61)以及未修饰的向导RNA(SEQ ID NO.:6)或在原间隔序列中特别选择的位置处含有BNA或LNA修饰的向导RNA(SEQ ID NO.:79)组成。用作对照的向导RNA是靶向EBV基因组的向导RNA(SEQ ID NO.:47)。通过用毛细管凝胶电泳分离裂解和未裂解的DNA产物,测定裂解的目标DNA的量。如图24A中所示,当用BNA或LNA修饰的向导RNA形成RNP时,对脱靶DNA的活性相对于用未修饰的向导RNA形成的RNP减少。

为评估目标完整性,通过电穿孔(核转染)将RNA递送至HPV16+SiHa细胞中。在37℃和5%CO2下,培育细胞24小时。接着,收集总基因组DNA并使用特定探针定量扩增E7基因目标和管家基因PPIA。针对PPIA的量使每一样品归一化。如图24B中所示,CRN修饰的向导RNA针对细胞中HPV16 E7的作用与未修饰的向导RNA大致同样有效,展示脱靶活性的减小不是仅由总体活性减小引起的。

使用SiHa杀灭分析评估Cas9/向导RNA组合物杀灭病毒细胞的能力(图24C)。通过电穿孔(核转染)将RNA递送至HPV16+SiHa细胞中。在37℃和5%CO2下,培育细胞8天,之后,将细胞取出并通过流式细胞术计数。第8天活细胞的相对比例显示于图24C中,针对仅用缓冲液核转染的细胞归一化。在SiHa杀灭分析中,CRN修饰的向导RNA与未修饰的向导RNA大致同样有效。

在本说明书中提到的和/或应用数据表中所列的所有美国专利、美国专利申请公开、美国专利申请、外国专利、外国专利申请以及非专利公开,包含2017年3月31日提交的美国临时专利申请第62/479,643号和2017年5月18日提交的美国临时专利申请62/507,963,都以全文引用的方式并入本文中。必要时,可以修改这些实施方式的各方面以采用不同专利、申请以及公开的观点来提供更进一步的实施方式。

尽管已经说明和描述了本发明的具体实施方式,但应易于了解,可以组合上文所描述的各种实施方式以提供进一步的实施方式,并且可以在不脱离本发明的精神和范围的情况下对实施方式作出各种改变。根据以上详细描述,可以对实施方式进行这些改变和其它改变。

一般来说,在所附权利要求书中,所用术语不应被解释为将权利要求书限于本说明书和权利要求书中所公开的特定实施方式,而应解释为包含所有可能的实施方式以及这份权利要求书所有权获得的等效物的全部范围。因此,权利要求书不受公开内容限制。

序列表

<110> 埃吉诺维亚公司

D·D·斯隆恩

S·勒杜

X·C·熊

M·P·豪斯利

<120> 抗病毒治疗剂

<130> 930285.421WO

<140> PCT

<141> 2018-03-30

<150> US 62/507,963

<151> 2017-05-18

<150> US 62/479,643

<151> 2017-03-31

<160> 84

<170> FastSEQ for Windows Version 4.0

<210> 1

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.1.0

<400> 1

ugcaauguuu caggacccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 2

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.1.1

<220>

<221> modified_base

<222> 1

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 99, 100, 101

<223> um, 硫代磷酸酯键

<400> 2

ugcaauguuu caggacccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 3

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.1.2

<220>

<221> modified_base

<222> 1

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<220>

<221> misc_feature

<222> (1)...(102)

<223> n = um

<400> 3

ugcaangnun caggacccac gnunuagagc nagaaanagc aagnuaaaan aaggcnagnc 60

cgnuancaac ungaaaaagn ggcaccgagu cggngcnuuu uu 102

<210> 4

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.1.3

<220>

<221> modified_base

<222> 1

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 3

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 4

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 14

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 4

ugcaauguuu caggacccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 5

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.0

<400> 5

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 6

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.1

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 6

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 7

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.2

<220>

<221> modified_base

<222> 1

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 8

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 17

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 7

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 8

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.3

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 7

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 9

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 16

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 18

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 20

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 8

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 9

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.4

<220>

<221> modified_base

<222> 1

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 6, 10, 16

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 9

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 10

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.5

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 8,16,18

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 10

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 11

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.6

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 8,17,20

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 11

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 12

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.7

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 9,18

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 12

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 13

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.8

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 7,16

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 13

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 14

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.9

<220>

<221> modified_base

<222> 1

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 8,17,20

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 14

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 15

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.10

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 9,18

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 15

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 16

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.11

<220>

<221> modified_base

<222> 1

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 7,16,20

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 16

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 17

<211> 101

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.12.0

<400> 17

gcaaguguga cucuacgcuu uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101

<210> 18

<211> 101

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.2.12

<220>

<221> modified_base

<222> 1

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 8,17

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (98)...(100)

<223> um, 硫代磷酸酯键

<400> 18

gcaaguguga cucuacgcuu uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101

<210> 19

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.3.0

<400> 19

uccaccgacc ccuuauauua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 20

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.3

<220>

<221> modified_base

<222> 1

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 20

uccaccgacc ccuuauauua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 21

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.4.0

<400> 21

gcaacaagac auacaucgac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 22

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.4

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 22

gcaacaagac auacaucgac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 23

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.5.0

<400> 23

acuuucuggg ucgcuccugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 24

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.5

<220>

<221> modified_base

<222> 1

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 24

acuuucuggg ucgcuccugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 25

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.6.0

<400> 25

gaccuguuaa ugggcacacu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 26

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.6

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 26

gaccuguuaa ugggcacacu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 27

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.7.0

<400> 27

ugcagcucug ugcauaacug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 28

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.7

<220>

<221> modified_base

<222> 1

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 28

ugcagcucug ugcauaacug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 29

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.8.0

<400> 29

cauaacugug guaacuuucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 30

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 1.8

<220>

<221> modified_base

<222> 1

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 30

cauaacugug guaacuuucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 31

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV18向导 2.1.0

<400> 31

caagcuaccu gaucugugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 32

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV18向导 2.1

<220>

<221> modified_base

<222> 1

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 32

caagcuaccu gaucugugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 33

<211> 101

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV18向导 2.2.0

<400> 33

gcgcuuugag gauccaacag uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101

<210> 34

<211> 101

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV18向导 2.2

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (98)...(100)

<223> um, 硫代磷酸酯键

<400> 34

gcgcuuugag gauccaacag uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101

<210> 35

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV18向导 2.3.0

<400> 35

auuaaguaug cauggaccua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 36

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV18向导 2.3

<220>

<221> modified_base

<222> 1

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2, 3, 99, 100, 101

<223> am, 硫代磷酸酯键

<400> 36

auuaaguaug cauggaccua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 37

<211> 101

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV18向导 2.4.0

<400> 37

gagcaauuaa gcgacucagg uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101

<210> 38

<211> 101

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV18向导 2.4

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 38

gagcaauuaa gcgacucagg uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101

<210> 39

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 合成序列靶向部分 1.1

<400> 39

ugcaauguuu caggacccac 20

<210> 40

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 合成序列靶向部分 2.1

<400> 40

caagcuaccu gaucugugca 20

<210> 41

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HBV向导3.1.1.0

<400> 41

ggggcgcacc ucucuuuacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 42

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HBV向导3.1.1

<220>

<221> modified_base

<222> 1, 2, 3

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 42

ggggcgcacc ucucuuuacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 43

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HBV向导3.1.2.0

<400> 43

uccgcaguau ggaucggcag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 44

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HBV向导3.1.2

<220>

<221> modified_base

<222> 1

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2,3

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 44

uccgcaguau ggaucggcag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 45

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HBV向导3.1.3.0

<400> 45

gauugagauc uucugcgacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 46

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HBV向导3.1.3

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 4

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 46

gauugagauc uucugcgacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 47

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成序列 sgEBV1

<400> 47

gccctggacc aacccggccc 20

<210> 48

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成序列 sgEBV2

<400> 48

ggccgctgcc ccgctccggg 20

<210> 49

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成序列sgEBV3

<400> 49

ggaagacaat gtgccgcca 19

<210> 50

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成序列sgEBV4

<400> 50

tctggaccag aaggctccgg 20

<210> 51

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成序列sgEBV5

<400> 51

gctgccgcgg agggtgatga 20

<210> 52

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成序列sgEBV6

<400> 52

ggtggcccac cgggtccgct 20

<210> 53

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成序列sgEBV7

<400> 53

gtcctcgagg gggccgtcgc 20

<210> 54

<211> 4401

<212> RNA

<213> 酿脓链球菌 (Streptococcus pyogenes)

<400> 54

gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggc 60

cccaaagaag aagcggaagg ucgguaucca cggaguccca gcagccgaca agaaguacag 120

caucggccug gacaucggca ccaacucugu gggcugggcc gugaucaccg acgaguacaa 180

ggugcccagc aagaaauuca aggugcuggg caacaccgac cggcacagca ucaagaagaa 240

ccugaucgga gcccugcugu ucgacagcgg cgaaacagcc gaggccaccc ggcugaagag 300

aaccgccaga agaagauaca ccagacggaa gaaccggauc ugcuaucugc aagagaucuu 360

cagcaacgag auggccaagg uggacgacag cuucuuccac agacuggaag aguccuuccu 420

gguggaagag gacaagaagc acgagagaca ccccaucuuc ggcaacaucg uggacgaggu 480

ggccuaccac gagaaguacc ccaccaucua ccaccugaga aagaaacugg uggacagcac 540

cgacaaggcc gaccugagac ugaucuaccu ggcccuggcc cacaugauca aguucagagg 600

ccacuuccug aucgagggcg accugaaccc cgacaacagc gacguggaca agcuguucau 660

ccagcuggug cagaccuaca accagcuguu cgaggaaaac cccaucaacg ccagcggcgu 720

ggacgccaag gcuauccugu cugccagacu gagcaagagc agaaggcugg aaaaucugau 780

cgcccagcug cccggcgaga agaagaacgg ccuguucggc aaccugauug cccugagccu 840

gggccugacc cccaacuuca agagcaacuu cgaccuggcc gaggaugcca aacugcagcu 900

gagcaaggac accuacgacg acgaccugga caaccugcug gcccagaucg gcgaccagua 960

cgccgaccug uuccuggccg ccaagaaccu gucugacgcc auccugcuga gcgacauccu 1020

gagagugaac accgagauca ccaaggcccc ccugagcgcc ucuaugauca agagauacga 1080

cgagcaccac caggaccuga cccugcugaa agcucucgug cggcagcagc ugccugagaa 1140

guacaaagaa aucuucuucg accagagcaa gaacggcuac gccggcuaca ucgauggcgg 1200

cgcuagccag gaagaguucu acaaguucau caagcccauc cuggaaaaga uggacggcac 1260

cgaggaacug cucgugaagc ugaacagaga ggaccugcug agaaagcaga gaaccuucga 1320

caacggcagc aucccccacc agauccaccu gggagagcug cacgcuaucc ugagaaggca 1380

ggaagauuuu uacccauucc ugaaggacaa ccgggaaaag aucgagaaga uccugaccuu 1440

caggaucccc uacuacgugg gcccccuggc cagaggcaac agcagauucg ccuggaugac 1500

cagaaagagc gaggaaacca ucacccccug gaacuucgag gaaguggugg acaagggcgc 1560

cagcgcccag agcuucaucg agagaaugac aaacuucgau aagaaccugc ccaacgagaa 1620

ggugcugccc aagcacagcc ugcuguacga guacuucacc guguacaacg agcugaccaa 1680

agugaaauac gugaccgagg gaaugagaaa gcccgccuuc cugagcggcg agcagaaaaa 1740

ggccaucgug gaccugcugu ucaagaccaa cagaaaagug accgugaagc agcugaaaga 1800

ggacuacuuc aagaaaaucg agugcuucga cuccguggaa aucuccggcg uggaagauag 1860

auucaacgcc ucccugggca cauaccacga ucugcugaaa auuaucaagg acaaggacuu 1920

ccuggauaac gaagagaacg aggacauucu ggaagauauc gugcugaccc ugacacuguu 1980

ugaggaccgc gagaugaucg aggaaaggcu gaaaaccuac gcucaccugu ucgacgacaa 2040

agugaugaag cagcugaaga gaaggcggua caccggcugg ggcaggcuga gcagaaagcu 2100

gaucaacggc aucagagaca agcagagcgg caagacaauc cuggauuucc ugaaguccga 2160

cggcuucgcc aaccggaacu ucaugcagcu gauccacgac gacagccuga cauucaaaga 2220

ggacauccag aaagcccagg uguccggcca gggcgacucu cugcacgagc auaucgcuaa 2280

ccuggccggc agccccgcua ucaagaaggg cauccugcag acagugaagg ugguggacga 2340

gcucgugaaa gugaugggca gacacaagcc cgagaacauc gugaucgaga uggcuagaga 2400

gaaccagacc acccagaagg gacagaagaa cucccgcgag aggaugaaga gaaucgaaga 2460

gggcaucaaa gagcugggca gccagauccu gaaagaacac cccguggaaa acacccagcu 2520

gcagaacgag aagcuguacc uguacuaccu gcagaauggc cgggauaugu acguggacca 2580

ggaacuggac aucaacagac uguccgacua cgauguggac cauaucgugc cucagagcuu 2640

ucugaaggac gacuccaucg auaacaaagu gcugacucgg agcgacaaga acagaggcaa 2700

gagcgacaac gugcccuccg aagaggucgu gaagaagaug aagaacuacu ggcgacagcu 2760

gcugaacgcc aagcugauua cccagaggaa guucgauaac cugaccaagg ccgagagagg 2820

cggccugagc gagcuggaua aggccggcuu caucaagagg cagcuggugg aaaccagaca 2880

gaucacaaag cacguggcac agauccugga cucccggaug aacacuaagu acgacgaaaa 2940

cgauaagcug auccgggaag ugaaagugau cacccugaag uccaagcugg uguccgauuu 3000

ccggaaggau uuccaguuuu acaaagugcg cgagaucaac aacuaccacc acgcccacga 3060

cgccuaccug aacgccgucg ugggaaccgc ccugaucaaa aaguacccua agcuggaaag 3120

cgaguucgug uacggcgacu acaaggugua cgacgugcgg aagaugaucg ccaagagcga 3180

gcaggaaauc ggcaaggcua ccgccaagua cuucuucuac agcaacauca ugaacuuuuu 3240

caagaccgaa aucacccugg ccaacggcga gaucagaaag cgcccucuga ucgagacaaa 3300

cggcgaaacc ggggagaucg ugugggauaa gggcagagac uucgccacag ugcgaaaggu 3360

gcugagcaug ccccaaguga auaucgugaa aaagaccgag gugcagacag gcggcuucag 3420

caaagagucu auccugccca agaggaacag cgacaagcug aucgccagaa agaaggacug 3480

ggaccccaag aaguacggcg gcuucgacag cccuaccgug gccuacucug ugcugguggu 3540

ggcuaaggug gaaaagggca aguccaagaa acugaagagu gugaaagagc ugcuggggau 3600

caccaucaug gaaagaagca gcuuugagaa gaacccuauc gacuuucugg aagccaaggg 3660

cuacaaagaa gugaaaaagg accugaucau caagcugccu aaguacuccc uguucgagcu 3720

ggaaaacggc agaaagagaa ugcuggccuc ugccggcgaa cugcagaagg gaaacgagcu 3780

ggcccugccu agcaaauaug ugaacuuccu guaccuggcc ucccacuaug agaagcugaa 3840

gggcagcccu gaggacaacg aacagaaaca gcuguuugug gaacagcaua agcacuaccu 3900

ggacgagauc aucgagcaga ucagcgaguu cuccaagaga gugauccugg ccgacgccaa 3960

ucuggacaag gugcugucug ccuacaacaa gcacagggac aagccuauca gagagcaggc 4020

cgagaauauc auccaccugu ucacccugac aaaccugggc gcuccugccg ccuucaagua 4080

cuuugacacc accaucgacc ggaagaggua caccagcacc aaagaggugc uggacgccac 4140

ccugauccac cagagcauca ccggccugua cgagacaaga aucgaccugu cucagcuggg 4200

aggcgacaag agaccugccg ccacuaagaa ggccggacag gccaaaaaga agaagugagc 4260

ucgcuuucuu gcuguccaau uucuauuaaa gguuccuuug uucccuaagu ccaacuacua 4320

aacuggggga uauuaugaag ggccuugagc aucuggauuc ugccuaauaa aaaacauuua 4380

uuuucauugc gagcggccgc a 4401

<210> 55

<211> 4401

<212> RNA

<213> 人工序列

<220>

<223> 修饰的S. pyogenes Cas9 序列

<220>

<221> modified_base

<222> (1)...(4401)

<223> c = 5-甲基胞苷

<220>

<221> misc_feature

<222> (1)...(4401)

<223> n = 假尿苷

<400> 55

gggagacann ngcnncngac acaacngngn ncacnagcaa ccncaaacag ccaccanggc 60

cccaaagaag aagcggaagg ncggnancca cggagnccca gcagccgaca agaagnacag 120

cancggccng gacancggca ccaacncngn gggcngggcc gngancaccg acgagnacaa 180

ggngcccagc aagaaannca aggngcnggg caacaccgac cggcacagca ncaagaagaa 240

ccngancgga gcccngcngn ncgacagcgg cgaaacagcc gaggccaccc ggcngaagag 300

aaccgccaga agaaganaca ccagacggaa gaaccgganc ngcnancngc aagagancnn 360

cagcaacgag anggccaagg nggacgacag cnncnnccac agacnggaag agnccnnccn 420

ggnggaagag gacaagaagc acgagagaca ccccancnnc ggcaacancg nggacgaggn 480

ggccnaccac gagaagnacc ccaccancna ccaccngaga aagaaacngg nggacagcac 540

cgacaaggcc gaccngagac ngancnaccn ggcccnggcc cacanganca agnncagagg 600

ccacnnccng ancgagggcg accngaaccc cgacaacagc gacgnggaca agcngnncan 660

ccagcnggng cagaccnaca accagcngnn cgaggaaaac cccancaacg ccagcggcgn 720

ggacgccaag gcnanccngn cngccagacn gagcaagagc agaaggcngg aaaancngan 780

cgcccagcng cccggcgaga agaagaacgg ccngnncggc aaccnganng cccngagccn 840

gggccngacc cccaacnnca agagcaacnn cgaccnggcc gaggangcca aacngcagcn 900

gagcaaggac accnacgacg acgaccngga caaccngcng gcccagancg gcgaccagna 960

cgccgaccng nnccnggccg ccaagaaccn gncngacgcc anccngcnga gcgacanccn 1020

gagagngaac accgaganca ccaaggcccc ccngagcgcc ncnanganca agaganacga 1080

cgagcaccac caggaccnga cccngcngaa agcncncgng cggcagcagc ngccngagaa 1140

gnacaaagaa ancnncnncg accagagcaa gaacggcnac gccggcnaca ncganggcgg 1200

cgcnagccag gaagagnncn acaagnncan caagcccanc cnggaaaaga nggacggcac 1260

cgaggaacng cncgngaagc ngaacagaga ggaccngcng agaaagcaga gaaccnncga 1320

caacggcagc ancccccacc aganccaccn gggagagcng cacgcnancc ngagaaggca 1380

ggaagannnn nacccanncc ngaaggacaa ccgggaaaag ancgagaaga nccngaccnn 1440

caggancccc nacnacgngg gcccccnggc cagaggcaac agcaganncg ccnggangac 1500

cagaaagagc gaggaaacca ncacccccng gaacnncgag gaagnggngg acaagggcgc 1560

cagcgcccag agcnncancg agagaangac aaacnncgan aagaaccngc ccaacgagaa 1620

ggngcngccc aagcacagcc ngcngnacga gnacnncacc gngnacaacg agcngaccaa 1680

agngaaanac gngaccgagg gaangagaaa gcccgccnnc cngagcggcg agcagaaaaa 1740

ggccancgng gaccngcngn ncaagaccaa cagaaaagng accgngaagc agcngaaaga 1800

ggacnacnnc aagaaaancg agngcnncga cnccgnggaa ancnccggcg nggaaganag 1860

anncaacgcc ncccngggca canaccacga ncngcngaaa annancaagg acaaggacnn 1920

ccngganaac gaagagaacg aggacanncn ggaagananc gngcngaccc ngacacngnn 1980

ngaggaccgc gagangancg aggaaaggcn gaaaaccnac gcncaccngn ncgacgacaa 2040

agngangaag cagcngaaga gaaggcggna caccggcngg ggcaggcnga gcagaaagcn 2100

gancaacggc ancagagaca agcagagcgg caagacaanc cnggannncc ngaagnccga 2160

cggcnncgcc aaccggaacn ncangcagcn ganccacgac gacagccnga canncaaaga 2220

ggacanccag aaagcccagg ngnccggcca gggcgacncn cngcacgagc anancgcnaa 2280

ccnggccggc agccccgcna ncaagaaggg canccngcag acagngaagg nggnggacga 2340

gcncgngaaa gngangggca gacacaagcc cgagaacanc gngancgaga nggcnagaga 2400

gaaccagacc acccagaagg gacagaagaa cncccgcgag aggangaaga gaancgaaga 2460

gggcancaaa gagcngggca gccaganccn gaaagaacac cccgnggaaa acacccagcn 2520

gcagaacgag aagcngnacc ngnacnaccn gcagaanggc cggganangn acgnggacca 2580

ggaacnggac ancaacagac ngnccgacna cgangnggac canancgngc cncagagcnn 2640

ncngaaggac gacnccancg anaacaaagn gcngacncgg agcgacaaga acagaggcaa 2700

gagcgacaac gngcccnccg aagaggncgn gaagaagang aagaacnacn ggcgacagcn 2760

gcngaacgcc aagcnganna cccagaggaa gnncganaac cngaccaagg ccgagagagg 2820

cggccngagc gagcnggana aggccggcnn cancaagagg cagcnggngg aaaccagaca 2880

gancacaaag cacgnggcac aganccngga cncccggang aacacnaagn acgacgaaaa 2940

cganaagcng anccgggaag ngaaagngan cacccngaag nccaagcngg ngnccgannn 3000

ccggaaggan nnccagnnnn acaaagngcg cgagancaac aacnaccacc acgcccacga 3060

cgccnaccng aacgccgncg ngggaaccgc ccngancaaa aagnacccna agcnggaaag 3120

cgagnncgng nacggcgacn acaaggngna cgacgngcgg aagangancg ccaagagcga 3180

gcaggaaanc ggcaaggcna ccgccaagna cnncnncnac agcaacanca ngaacnnnnn 3240

caagaccgaa ancacccngg ccaacggcga gancagaaag cgcccncnga ncgagacaaa 3300

cggcgaaacc ggggagancg ngnggganaa gggcagagac nncgccacag ngcgaaaggn 3360

gcngagcang ccccaagnga anancgngaa aaagaccgag gngcagacag gcggcnncag 3420

caaagagncn anccngccca agaggaacag cgacaagcng ancgccagaa agaaggacng 3480

ggaccccaag aagnacggcg gcnncgacag cccnaccgng gccnacncng ngcnggnggn 3540

ggcnaaggng gaaaagggca agnccaagaa acngaagagn gngaaagagc ngcnggggan 3600

caccancang gaaagaagca gcnnngagaa gaacccnanc gacnnncngg aagccaaggg 3660

cnacaaagaa gngaaaaagg accngancan caagcngccn aagnacnccc ngnncgagcn 3720

ggaaaacggc agaaagagaa ngcnggccnc ngccggcgaa cngcagaagg gaaacgagcn 3780

ggcccngccn agcaaanang ngaacnnccn gnaccnggcc ncccacnang agaagcngaa 3840

gggcagcccn gaggacaacg aacagaaaca gcngnnngng gaacagcana agcacnaccn 3900

ggacgaganc ancgagcaga ncagcgagnn cnccaagaga gnganccngg ccgacgccaa 3960

ncnggacaag gngcngncng ccnacaacaa gcacagggac aagccnanca gagagcaggc 4020

cgagaananc anccaccngn ncacccngac aaaccngggc gcnccngccg ccnncaagna 4080

cnnngacacc accancgacc ggaagaggna caccagcacc aaagaggngc nggacgccac 4140

ccnganccac cagagcanca ccggccngna cgagacaaga ancgaccngn cncagcnggg 4200

aggcgacaag agaccngccg ccacnaagaa ggccggacag gccaaaaaga agaagngagc 4260

ncgcnnncnn gcngnccaan nncnannaaa ggnnccnnng nncccnaagn ccaacnacna 4320

aacnggggga nannangaag ggccnngagc ancnggannc ngccnaanaa aaaacannna 4380

nnnncanngc gagcggccgc a 4401

<210> 56

<211> 4431

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 NLS-接头变体-2

<400> 56

gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggg 60

ccccaagaag aaaagaaaag ucggaggaag uggcggcagu gguggcucug gagggucagg 120

aggcagcggg ggcuccgaca agaaguacag caucggccug gacaucggca ccaacucugu 180

gggcugggcc gugaucaccg acgaguacaa ggugcccagc aagaaauuca aggugcuggg 240

caacaccgac cggcacagca ucaagaagaa ccugaucgga gcccugcugu ucgacagcgg 300

cgaaacagcc gaggccaccc ggcugaagag aaccgccaga agaagauaca ccagacggaa 360

gaaccggauc ugcuaucugc aagagaucuu cagcaacgag auggccaagg uggacgacag 420

cuucuuccac agacuggaag aguccuuccu gguggaagag gacaagaagc acgagagaca 480

ccccaucuuc ggcaacaucg uggacgaggu ggccuaccac gagaaguacc ccaccaucua 540

ccaccugaga aagaaacugg uggacagcac cgacaaggcc gaccugagac ugaucuaccu 600

ggcccuggcc cacaugauca aguucagagg ccacuuccug aucgagggcg accugaaccc 660

cgacaacagc gacguggaca agcuguucau ccagcuggug cagaccuaca accagcuguu 720

cgaggaaaac cccaucaacg ccagcggcgu ggacgccaag gcuauccugu cugccagacu 780

gagcaagagc agaaggcugg aaaaucugau cgcccagcug cccggcgaga agaagaacgg 840

ccuguucggc aaccugauug cccugagccu gggccugacc cccaacuuca agagcaacuu 900

cgaccuggcc gaggaugcca aacugcagcu gagcaaggac accuacgacg acgaccugga 960

caaccugcug gcccagaucg gcgaccagua cgccgaccug uuccuggccg ccaagaaccu 1020

gucugacgcc auccugcuga gcgacauccu gagagugaac accgagauca ccaaggcccc 1080

ccugagcgcc ucuaugauca agagauacga cgagcaccac caggaccuga cccugcugaa 1140

agcucucgug cggcagcagc ugccugagaa guacaaagaa aucuucuucg accagagcaa 1200

gaacggcuac gccggcuaca ucgauggcgg cgcuagccag gaagaguucu acaaguucau 1260

caagcccauc cuggaaaaga uggacggcac cgaggaacug cucgugaagc ugaacagaga 1320

ggaccugcug agaaagcaga gaaccuucga caacggcagc aucccccacc agauccaccu 1380

gggagagcug cacgcuaucc ugagaaggca ggaagauuuu uacccauucc ugaaggacaa 1440

ccgggaaaag aucgagaaga uccugaccuu caggaucccc uacuacgugg gcccccuggc 1500

cagaggcaac agcagauucg ccuggaugac cagaaagagc gaggaaacca ucacccccug 1560

gaacuucgag gaaguggugg acaagggcgc cagcgcccag agcuucaucg agagaaugac 1620

aaacuucgau aagaaccugc ccaacgagaa ggugcugccc aagcacagcc ugcuguacga 1680

guacuucacc guguacaacg agcugaccaa agugaaauac gugaccgagg gaaugagaaa 1740

gcccgccuuc cugagcggcg agcagaaaaa ggccaucgug gaccugcugu ucaagaccaa 1800

cagaaaagug accgugaagc agcugaaaga ggacuacuuc aagaaaaucg agugcuucga 1860

cuccguggaa aucuccggcg uggaagauag auucaacgcc ucccugggca cauaccacga 1920

ucugcugaaa auuaucaagg acaaggacuu ccuggauaac gaagagaacg aggacauucu 1980

ggaagauauc gugcugaccc ugacacuguu ugaggaccgc gagaugaucg aggaaaggcu 2040

gaaaaccuac gcucaccugu ucgacgacaa agugaugaag cagcugaaga gaaggcggua 2100

caccggcugg ggcaggcuga gcagaaagcu gaucaacggc aucagagaca agcagagcgg 2160

caagacaauc cuggauuucc ugaaguccga cggcuucgcc aaccggaacu ucaugcagcu 2220

gauccacgac gacagccuga cauucaaaga ggacauccag aaagcccagg uguccggcca 2280

gggcgacucu cugcacgagc auaucgcuaa ccuggccggc agccccgcua ucaagaaggg 2340

cauccugcag acagugaagg ugguggacga gcucgugaaa gugaugggca gacacaagcc 2400

cgagaacauc gugaucgaga uggcuagaga gaaccagacc acccagaagg gacagaagaa 2460

cucccgcgag aggaugaaga gaaucgaaga gggcaucaaa gagcugggca gccagauccu 2520

gaaagaacac cccguggaaa acacccagcu gcagaacgag aagcuguacc uguacuaccu 2580

gcagaauggc cgggauaugu acguggacca ggaacuggac aucaacagac uguccgacua 2640

cgauguggac cauaucgugc cucagagcuu ucugaaggac gacuccaucg auaacaaagu 2700

gcugacucgg agcgacaaga acagaggcaa gagcgacaac gugcccuccg aagaggucgu 2760

gaagaagaug aagaacuacu ggcgacagcu gcugaacgcc aagcugauua cccagaggaa 2820

guucgauaac cugaccaagg ccgagagagg cggccugagc gagcuggaua aggccggcuu 2880

caucaagagg cagcuggugg aaaccagaca gaucacaaag cacguggcac agauccugga 2940

cucccggaug aacacuaagu acgacgaaaa cgauaagcug auccgggaag ugaaagugau 3000

cacccugaag uccaagcugg uguccgauuu ccggaaggau uuccaguuuu acaaagugcg 3060

cgagaucaac aacuaccacc acgcccacga cgccuaccug aacgccgucg ugggaaccgc 3120

ccugaucaaa aaguacccua agcuggaaag cgaguucgug uacggcgacu acaaggugua 3180

cgacgugcgg aagaugaucg ccaagagcga gcaggaaauc ggcaaggcua ccgccaagua 3240

cuucuucuac agcaacauca ugaacuuuuu caagaccgaa aucacccugg ccaacggcga 3300

gaucagaaag cgcccucuga ucgagacaaa cggcgaaacc ggggagaucg ugugggauaa 3360

gggcagagac uucgccacag ugcgaaaggu gcugagcaug ccccaaguga auaucgugaa 3420

aaagaccgag gugcagacag gcggcuucag caaagagucu auccugccca agaggaacag 3480

cgacaagcug aucgccagaa agaaggacug ggaccccaag aaguacggcg gcuucgacag 3540

cccuaccgug gccuacucug ugcugguggu ggcuaaggug gaaaagggca aguccaagaa 3600

acugaagagu gugaaagagc ugcuggggau caccaucaug gaaagaagca gcuuugagaa 3660

gaacccuauc gacuuucugg aagccaaggg cuacaaagaa gugaaaaagg accugaucau 3720

caagcugccu aaguacuccc uguucgagcu ggaaaacggc agaaagagaa ugcuggccuc 3780

ugccggcgaa cugcagaagg gaaacgagcu ggcccugccu agcaaauaug ugaacuuccu 3840

guaccuggcc ucccacuaug agaagcugaa gggcagcccu gaggacaacg aacagaaaca 3900

gcuguuugug gaacagcaua agcacuaccu ggacgagauc aucgagcaga ucagcgaguu 3960

cuccaagaga gugauccugg ccgacgccaa ucuggacaag gugcugucug ccuacaacaa 4020

gcacagggac aagccuauca gagagcaggc cgagaauauc auccaccugu ucacccugac 4080

aaaccugggc gcuccugccg ccuucaagua cuuugacacc accaucgacc ggaagaggua 4140

caccagcacc aaagaggugc uggacgccac ccugauccac cagagcauca ccggccugua 4200

cgagacaaga aucgaccugu cucagcuggg aggcgacaag agaccugccg ccacuaagaa 4260

ggccggacag gccaaaaaga agaagugagc ucgcuuucuu gcuguccaau uucuauuaaa 4320

gguuccuuug uucccuaagu ccaacuacua aacuggggga uauuaugaag ggccuugagc 4380

aucuggauuc ugccuaauaa aaaacauuua uuuucauugc gagcggccgc a 4431

<210> 57

<211> 4512

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 NLS-接头变体-3

<400> 57

gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggg 60

acccaagaag aaaaggaagg uggcggcugc agauuacaag gaugaugacg acaagagcag 120

acuggagccc ggggagaagc ccuacaaaug uccagaaugu ggcaaguccu ucagccagag 180

cggggcccug accaggcacc agcgcaccca cacaagggac aagaaguaca gcaucggccu 240

ggacaucggc accaacucug ugggcugggc cgugaucacc gacgaguaca aggugcccag 300

caagaaauuc aaggugcugg gcaacaccga ccggcacagc aucaagaaga accugaucgg 360

agcccugcug uucgacagcg gcgaaacagc cgaggccacc cggcugaaga gaaccgccag 420

aagaagauac accagacgga agaaccggau cugcuaucug caagagaucu ucagcaacga 480

gauggccaag guggacgaca gcuucuucca cagacuggaa gaguccuucc ugguggaaga 540

ggacaagaag cacgagagac accccaucuu cggcaacauc guggacgagg uggccuacca 600

cgagaaguac cccaccaucu accaccugag aaagaaacug guggacagca ccgacaaggc 660

cgaccugaga cugaucuacc uggcccuggc ccacaugauc aaguucagag gccacuuccu 720

gaucgagggc gaccugaacc ccgacaacag cgacguggac aagcuguuca uccagcuggu 780

gcagaccuac aaccagcugu ucgaggaaaa ccccaucaac gccagcggcg uggacgccaa 840

ggcuauccug ucugccagac ugagcaagag cagaaggcug gaaaaucuga ucgcccagcu 900

gcccggcgag aagaagaacg gccuguucgg caaccugauu gcccugagcc ugggccugac 960

ccccaacuuc aagagcaacu ucgaccuggc cgaggaugcc aaacugcagc ugagcaagga 1020

caccuacgac gacgaccugg acaaccugcu ggcccagauc ggcgaccagu acgccgaccu 1080

guuccuggcc gccaagaacc ugucugacgc cauccugcug agcgacaucc ugagagugaa 1140

caccgagauc accaaggccc cccugagcgc cucuaugauc aagagauacg acgagcacca 1200

ccaggaccug acccugcuga aagcucucgu gcggcagcag cugccugaga aguacaaaga 1260

aaucuucuuc gaccagagca agaacggcua cgccggcuac aucgauggcg gcgcuagcca 1320

ggaagaguuc uacaaguuca ucaagcccau ccuggaaaag auggacggca ccgaggaacu 1380

gcucgugaag cugaacagag aggaccugcu gagaaagcag agaaccuucg acaacggcag 1440

caucccccac cagauccacc ugggagagcu gcacgcuauc cugagaaggc aggaagauuu 1500

uuacccauuc cugaaggaca accgggaaaa gaucgagaag auccugaccu ucaggauccc 1560

cuacuacgug ggcccccugg ccagaggcaa cagcagauuc gccuggauga ccagaaagag 1620

cgaggaaacc aucacccccu ggaacuucga ggaaguggug gacaagggcg ccagcgccca 1680

gagcuucauc gagagaauga caaacuucga uaagaaccug cccaacgaga aggugcugcc 1740

caagcacagc cugcuguacg aguacuucac cguguacaac gagcugacca aagugaaaua 1800

cgugaccgag ggaaugagaa agcccgccuu ccugagcggc gagcagaaaa aggccaucgu 1860

ggaccugcug uucaagacca acagaaaagu gaccgugaag cagcugaaag aggacuacuu 1920

caagaaaauc gagugcuucg acuccgugga aaucuccggc guggaagaua gauucaacgc 1980

cucccugggc acauaccacg aucugcugaa aauuaucaag gacaaggacu uccuggauaa 2040

cgaagagaac gaggacauuc uggaagauau cgugcugacc cugacacugu uugaggaccg 2100

cgagaugauc gaggaaaggc ugaaaaccua cgcucaccug uucgacgaca aagugaugaa 2160

gcagcugaag agaaggcggu acaccggcug gggcaggcug agcagaaagc ugaucaacgg 2220

caucagagac aagcagagcg gcaagacaau ccuggauuuc cugaaguccg acggcuucgc 2280

caaccggaac uucaugcagc ugauccacga cgacagccug acauucaaag aggacaucca 2340

gaaagcccag guguccggcc agggcgacuc ucugcacgag cauaucgcua accuggccgg 2400

cagccccgcu aucaagaagg gcauccugca gacagugaag gugguggacg agcucgugaa 2460

agugaugggc agacacaagc ccgagaacau cgugaucgag auggcuagag agaaccagac 2520

cacccagaag ggacagaaga acucccgcga gaggaugaag agaaucgaag agggcaucaa 2580

agagcugggc agccagaucc ugaaagaaca ccccguggaa aacacccagc ugcagaacga 2640

gaagcuguac cuguacuacc ugcagaaugg ccgggauaug uacguggacc aggaacugga 2700

caucaacaga cuguccgacu acgaugugga ccauaucgug ccucagagcu uucugaagga 2760

cgacuccauc gauaacaaag ugcugacucg gagcgacaag aacagaggca agagcgacaa 2820

cgugcccucc gaagaggucg ugaagaagau gaagaacuac uggcgacagc ugcugaacgc 2880

caagcugauu acccagagga aguucgauaa ccugaccaag gccgagagag gcggccugag 2940

cgagcuggau aaggccggcu ucaucaagag gcagcuggug gaaaccagac agaucacaaa 3000

gcacguggca cagauccugg acucccggau gaacacuaag uacgacgaaa acgauaagcu 3060

gauccgggaa gugaaaguga ucacccugaa guccaagcug guguccgauu uccggaagga 3120

uuuccaguuu uacaaagugc gcgagaucaa caacuaccac cacgcccacg acgccuaccu 3180

gaacgccguc gugggaaccg cccugaucaa aaaguacccu aagcuggaaa gcgaguucgu 3240

guacggcgac uacaaggugu acgacgugcg gaagaugauc gccaagagcg agcaggaaau 3300

cggcaaggcu accgccaagu acuucuucua cagcaacauc augaacuuuu ucaagaccga 3360

aaucacccug gccaacggcg agaucagaaa gcgcccucug aucgagacaa acggcgaaac 3420

cggggagauc gugugggaua agggcagaga cuucgccaca gugcgaaagg ugcugagcau 3480

gccccaagug aauaucguga aaaagaccga ggugcagaca ggcggcuuca gcaaagaguc 3540

uauccugccc aagaggaaca gcgacaagcu gaucgccaga aagaaggacu gggaccccaa 3600

gaaguacggc ggcuucgaca gcccuaccgu ggccuacucu gugcuggugg uggcuaaggu 3660

ggaaaagggc aaguccaaga aacugaagag ugugaaagag cugcugggga ucaccaucau 3720

ggaaagaagc agcuuugaga agaacccuau cgacuuucug gaagccaagg gcuacaaaga 3780

agugaaaaag gaccugauca ucaagcugcc uaaguacucc cuguucgagc uggaaaacgg 3840

cagaaagaga augcuggccu cugccggcga acugcagaag ggaaacgagc uggcccugcc 3900

uagcaaauau gugaacuucc uguaccuggc cucccacuau gagaagcuga agggcagccc 3960

ugaggacaac gaacagaaac agcuguuugu ggaacagcau aagcacuacc uggacgagau 4020

caucgagcag aucagcgagu ucuccaagag agugauccug gccgacgcca aucuggacaa 4080

ggugcugucu gccuacaaca agcacaggga caagccuauc agagagcagg ccgagaauau 4140

cauccaccug uucacccuga caaaccuggg cgcuccugcc gccuucaagu acuuugacac 4200

caccaucgac cggaagaggu acaccagcac caaagaggug cuggacgcca cccugaucca 4260

ccagagcauc accggccugu acgagacaag aaucgaccug ucucagcugg gaggcgacaa 4320

gagaccugcc gccacuaaga aggccggaca ggccaaaaag aagaagugag cucgcuuucu 4380

ugcuguccaa uuucuauuaa agguuccuuu guucccuaag uccaacuacu aaacuggggg 4440

auauuaugaa gggccuugag caucuggauu cugccuaaua aaaaacauuu auuuucauug 4500

cgagcggccg ca 4512

<210> 58

<211> 4425

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 NLS-接头变体-4

<400> 58

gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggg 60

accaaagaag aaaagaaaag uaggaggagg gggcagccug gugcccaggg gcucaggagg 120

uggcggcucc gacaagaagu acagcaucgg ccuggacauc ggcaccaacu cugugggcug 180

ggccgugauc accgacgagu acaaggugcc cagcaagaaa uucaaggugc ugggcaacac 240

cgaccggcac agcaucaaga agaaccugau cggagcccug cuguucgaca gcggcgaaac 300

agccgaggcc acccggcuga agagaaccgc cagaagaaga uacaccagac ggaagaaccg 360

gaucugcuau cugcaagaga ucuucagcaa cgagauggcc aagguggacg acagcuucuu 420

ccacagacug gaagaguccu uccuggugga agaggacaag aagcacgaga gacaccccau 480

cuucggcaac aucguggacg agguggccua ccacgagaag uaccccacca ucuaccaccu 540

gagaaagaaa cugguggaca gcaccgacaa ggccgaccug agacugaucu accuggcccu 600

ggcccacaug aucaaguuca gaggccacuu ccugaucgag ggcgaccuga accccgacaa 660

cagcgacgug gacaagcugu ucauccagcu ggugcagacc uacaaccagc uguucgagga 720

aaaccccauc aacgccagcg gcguggacgc caaggcuauc cugucugcca gacugagcaa 780

gagcagaagg cuggaaaauc ugaucgccca gcugcccggc gagaagaaga acggccuguu 840

cggcaaccug auugcccuga gccugggccu gacccccaac uucaagagca acuucgaccu 900

ggccgaggau gccaaacugc agcugagcaa ggacaccuac gacgacgacc uggacaaccu 960

gcuggcccag aucggcgacc aguacgccga ccuguuccug gccgccaaga accugucuga 1020

cgccauccug cugagcgaca uccugagagu gaacaccgag aucaccaagg ccccccugag 1080

cgccucuaug aucaagagau acgacgagca ccaccaggac cugacccugc ugaaagcucu 1140

cgugcggcag cagcugccug agaaguacaa agaaaucuuc uucgaccaga gcaagaacgg 1200

cuacgccggc uacaucgaug gcggcgcuag ccaggaagag uucuacaagu ucaucaagcc 1260

cauccuggaa aagauggacg gcaccgagga acugcucgug aagcugaaca gagaggaccu 1320

gcugagaaag cagagaaccu ucgacaacgg cagcaucccc caccagaucc accugggaga 1380

gcugcacgcu auccugagaa ggcaggaaga uuuuuaccca uuccugaagg acaaccggga 1440

aaagaucgag aagauccuga ccuucaggau ccccuacuac gugggccccc uggccagagg 1500

caacagcaga uucgccugga ugaccagaaa gagcgaggaa accaucaccc ccuggaacuu 1560

cgaggaagug guggacaagg gcgccagcgc ccagagcuuc aucgagagaa ugacaaacuu 1620

cgauaagaac cugcccaacg agaaggugcu gcccaagcac agccugcugu acgaguacuu 1680

caccguguac aacgagcuga ccaaagugaa auacgugacc gagggaauga gaaagcccgc 1740

cuuccugagc ggcgagcaga aaaaggccau cguggaccug cuguucaaga ccaacagaaa 1800

agugaccgug aagcagcuga aagaggacua cuucaagaaa aucgagugcu ucgacuccgu 1860

ggaaaucucc ggcguggaag auagauucaa cgccucccug ggcacauacc acgaucugcu 1920

gaaaauuauc aaggacaagg acuuccugga uaacgaagag aacgaggaca uucuggaaga 1980

uaucgugcug acccugacac uguuugagga ccgcgagaug aucgaggaaa ggcugaaaac 2040

cuacgcucac cuguucgacg acaaagugau gaagcagcug aagagaaggc gguacaccgg 2100

cuggggcagg cugagcagaa agcugaucaa cggcaucaga gacaagcaga gcggcaagac 2160

aauccuggau uuccugaagu ccgacggcuu cgccaaccgg aacuucaugc agcugaucca 2220

cgacgacagc cugacauuca aagaggacau ccagaaagcc cagguguccg gccagggcga 2280

cucucugcac gagcauaucg cuaaccuggc cggcagcccc gcuaucaaga agggcauccu 2340

gcagacagug aagguggugg acgagcucgu gaaagugaug ggcagacaca agcccgagaa 2400

caucgugauc gagauggcua gagagaacca gaccacccag aagggacaga agaacucccg 2460

cgagaggaug aagagaaucg aagagggcau caaagagcug ggcagccaga uccugaaaga 2520

acaccccgug gaaaacaccc agcugcagaa cgagaagcug uaccuguacu accugcagaa 2580

uggccgggau auguacgugg accaggaacu ggacaucaac agacuguccg acuacgaugu 2640

ggaccauauc gugccucaga gcuuucugaa ggacgacucc aucgauaaca aagugcugac 2700

ucggagcgac aagaacagag gcaagagcga caacgugccc uccgaagagg ucgugaagaa 2760

gaugaagaac uacuggcgac agcugcugaa cgccaagcug auuacccaga ggaaguucga 2820

uaaccugacc aaggccgaga gaggcggccu gagcgagcug gauaaggccg gcuucaucaa 2880

gaggcagcug guggaaacca gacagaucac aaagcacgug gcacagaucc uggacucccg 2940

gaugaacacu aaguacgacg aaaacgauaa gcugauccgg gaagugaaag ugaucacccu 3000

gaaguccaag cugguguccg auuuccggaa ggauuuccag uuuuacaaag ugcgcgagau 3060

caacaacuac caccacgccc acgacgccua ccugaacgcc gucgugggaa ccgcccugau 3120

caaaaaguac ccuaagcugg aaagcgaguu cguguacggc gacuacaagg uguacgacgu 3180

gcggaagaug aucgccaaga gcgagcagga aaucggcaag gcuaccgcca aguacuucuu 3240

cuacagcaac aucaugaacu uuuucaagac cgaaaucacc cuggccaacg gcgagaucag 3300

aaagcgcccu cugaucgaga caaacggcga aaccggggag aucguguggg auaagggcag 3360

agacuucgcc acagugcgaa aggugcugag caugccccaa gugaauaucg ugaaaaagac 3420

cgaggugcag acaggcggcu ucagcaaaga gucuauccug cccaagagga acagcgacaa 3480

gcugaucgcc agaaagaagg acugggaccc caagaaguac ggcggcuucg acagcccuac 3540

cguggccuac ucugugcugg ugguggcuaa gguggaaaag ggcaagucca agaaacugaa 3600

gagugugaaa gagcugcugg ggaucaccau cauggaaaga agcagcuuug agaagaaccc 3660

uaucgacuuu cuggaagcca agggcuacaa agaagugaaa aaggaccuga ucaucaagcu 3720

gccuaaguac ucccuguucg agcuggaaaa cggcagaaag agaaugcugg ccucugccgg 3780

cgaacugcag aagggaaacg agcuggcccu gccuagcaaa uaugugaacu uccuguaccu 3840

ggccucccac uaugagaagc ugaagggcag cccugaggac aacgaacaga aacagcuguu 3900

uguggaacag cauaagcacu accuggacga gaucaucgag cagaucagcg aguucuccaa 3960

gagagugauc cuggccgacg ccaaucugga caaggugcug ucugccuaca acaagcacag 4020

ggacaagccu aucagagagc aggccgagaa uaucauccac cuguucaccc ugacaaaccu 4080

gggcgcuccu gccgccuuca aguacuuuga caccaccauc gaccggaaga gguacaccag 4140

caccaaagag gugcuggacg ccacccugau ccaccagagc aucaccggcc uguacgagac 4200

aagaaucgac cugucucagc ugggaggcga caagagaccu gccgccacua agaaggccgg 4260

acaggccaaa aagaagaagu gagcucgcuu ucuugcuguc caauuucuau uaaagguucc 4320

uuuguucccu aaguccaacu acuaaacugg gggauauuau gaagggccuu gagcaucugg 4380

auucugccua auaaaaaaca uuuauuuuca uugcgagcgg ccgca 4425

<210> 59

<211> 4401

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 HF S.p. Cas9

<400> 59

gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggc 60

cccaaagaag aagcggaagg ucgguaucca cggaguccca gcagccgaca agaaguacag 120

caucggccug gacaucggca ccaacucugu gggcugggcc gugaucaccg acgaguacaa 180

ggugcccagc aagaaauuca aggugcuggg caacaccgac cggcacagca ucaagaagaa 240

ccugaucgga gcccugcugu ucgacagcgg cgaaacagcc gaggccaccc ggcugaagag 300

aaccgccaga agaagauaca ccagacggaa gaaccggauc ugcuaucugc aagagaucuu 360

cagcaacgag auggccaagg uggacgacag cuucuuccac agacuggaag aguccuuccu 420

gguggaagag gacaagaagc acgagagaca ccccaucuuc ggcaacaucg uggacgaggu 480

ggccuaccac gagaaguacc ccaccaucua ccaccugaga aagaaacugg uggacagcac 540

cgacaaggcc gaccugagac ugaucuaccu ggcccuggcc cacaugauca aguucagagg 600

ccacuuccug aucgagggcg accugaaccc cgacaacagc gacguggaca agcuguucau 660

ccagcuggug cagaccuaca accagcuguu cgaggaaaac cccaucaacg ccagcggcgu 720

ggacgccaag gcuauccugu cugccagacu gagcaagagc agaaggcugg aaaaucugau 780

cgcccagcug cccggcgaga agaagaacgg ccuguucggc aaccugauug cccugagccu 840

gggccugacc cccaacuuca agagcaacuu cgaccuggcc gaggaugcca aacugcagcu 900

gagcaaggac accuacgacg acgaccugga caaccugcug gcccagaucg gcgaccagua 960

cgccgaccug uuccuggccg ccaagaaccu gucugacgcc auccugcuga gcgacauccu 1020

gagagugaac accgagauca ccaaggcccc ccugagcgcc ucuaugauca agagauacga 1080

cgagcaccac caggaccuga cccugcugaa agcucucgug cggcagcagc ugccugagaa 1140

guacaaagaa aucuucuucg accagagcaa gaacggcuac gccggcuaca ucgauggcgg 1200

cgcuagccag gaagaguucu acaaguucau caagcccauc cuggaaaaga uggacggcac 1260

cgaggaacug cucgugaagc ugaacagaga ggaccugcug agaaagcaga gaaccuucga 1320

caacggcagc aucccccacc agauccaccu gggagagcug cacgcuaucc ugagaaggca 1380

ggaagauuuu uacccauucc ugaaggacaa ccgggaaaag aucgagaaga uccugaccuu 1440

caggaucccc uacuacgugg gcccccuggc cagaggcaac agcagauucg ccuggaugac 1500

cagaaagagc gaggaaacca ucacccccug gaacuucgag gaaguggugg acaagggcgc 1560

cagcgcccag agcuucaucg agagaaugac agccuucgau aagaaccugc ccaacgagaa 1620

ggugcugccc aagcacagcc ugcuguacga guacuucacc guguacaacg agcugaccaa 1680

agugaaauac gugaccgagg gaaugagaaa gcccgccuuc cugagcggcg agcagaaaaa 1740

ggccaucgug gaccugcugu ucaagaccaa cagaaaagug accgugaagc agcugaaaga 1800

ggacuacuuc aagaaaaucg agugcuucga cuccguggaa aucuccggcg uggaagauag 1860

auucaacgcc ucccugggca cauaccacga ucugcugaaa auuaucaagg acaaggacuu 1920

ccuggauaac gaagagaacg aggacauucu ggaagauauc gugcugaccc ugacacuguu 1980

ugaggaccgc gagaugaucg aggaaaggcu gaaaaccuac gcucaccugu ucgacgacaa 2040

agugaugaag cagcugaaga gaaggcggua caccggcugg ggcgcccuga gcagaaagcu 2100

gaucaacggc aucagagaca agcagagcgg caagacaauc cuggauuucc ugaaguccga 2160

cggcuucgcc aaccggaacu ucauggcccu gauccacgac gacagccuga cauucaaaga 2220

ggacauccag aaagcccagg uguccggcca gggcgacucu cugcacgagc auaucgcuaa 2280

ccuggccggc agccccgcua ucaagaaggg cauccugcag acagugaagg ugguggacga 2340

gcucgugaaa gugaugggca gacacaagcc cgagaacauc gugaucgaga uggcuagaga 2400

gaaccagacc acccagaagg gacagaagaa cucccgcgag aggaugaaga gaaucgaaga 2460

gggcaucaaa gagcugggca gccagauccu gaaagaacac cccguggaaa acacccagcu 2520

gcagaacgag aagcuguacc uguacuaccu gcagaauggc cgggauaugu acguggacca 2580

ggaacuggac aucaacagac uguccgacua cgauguggac cauaucgugc cucagagcuu 2640

ucugaaggac gacuccaucg auaacaaagu gcugacucgg agcgacaaga acagaggcaa 2700

gagcgacaac gugcccuccg aagaggucgu gaagaagaug aagaacuacu ggcgacagcu 2760

gcugaacgcc aagcugauua cccagaggaa guucgauaac cugaccaagg ccgagagagg 2820

cggccugagc gagcuggaua aggccggcuu caucaagagg cagcuggugg aaaccagagc 2880

caucacaaag cacguggcac agauccugga cucccggaug aacacuaagu acgacgaaaa 2940

cgauaagcug auccgggaag ugaaagugau cacccugaag uccaagcugg uguccgauuu 3000

ccggaaggau uuccaguuuu acaaagugcg cgagaucaac aacuaccacc acgcccacga 3060

cgccuaccug aacgccgucg ugggaaccgc ccugaucaaa aaguacccua agcuggaaag 3120

cgaguucgug uacggcgacu acaaggugua cgacgugcgg aagaugaucg ccaagagcga 3180

gcaggaaauc ggcaaggcua ccgccaagua cuucuucuac agcaacauca ugaacuuuuu 3240

caagaccgaa aucacccugg ccaacggcga gaucagaaag cgcccucuga ucgagacaaa 3300

cggcgaaacc ggggagaucg ugugggauaa gggcagagac uucgccacag ugcgaaaggu 3360

gcugagcaug ccccaaguga auaucgugaa aaagaccgag gugcagacag gcggcuucag 3420

caaagagucu auccugccca agaggaacag cgacaagcug aucgccagaa agaaggacug 3480

ggaccccaag aaguacggcg gcuucgacag cccuaccgug gccuacucug ugcugguggu 3540

ggcuaaggug gaaaagggca aguccaagaa acugaagagu gugaaagagc ugcuggggau 3600

caccaucaug gaaagaagca gcuuugagaa gaacccuauc gacuuucugg aagccaaggg 3660

cuacaaagaa gugaaaaagg accugaucau caagcugccu aaguacuccc uguucgagcu 3720

ggaaaacggc agaaagagaa ugcuggccuc ugccggcgaa cugcagaagg gaaacgagcu 3780

ggcccugccu agcaaauaug ugaacuuccu guaccuggcc ucccacuaug agaagcugaa 3840

gggcagcccu gaggacaacg aacagaaaca gcuguuugug gaacagcaua agcacuaccu 3900

ggacgagauc aucgagcaga ucagcgaguu cuccaagaga gugauccugg ccgacgccaa 3960

ucuggacaag gugcugucug ccuacaacaa gcacagggac aagccuauca gagagcaggc 4020

cgagaauauc auccaccugu ucacccugac aaaccugggc gcuccugccg ccuucaagua 4080

cuuugacacc accaucgacc ggaagaggua caccagcacc aaagaggugc uggacgccac 4140

ccugauccac cagagcauca ccggccugua cgagacaaga aucgaccugu cucagcuggg 4200

aggcgacaag agaccugccg ccacuaagaa ggccggacag gccaaaaaga agaagugagc 4260

ucgcuuucuu gcuguccaau uucuauuaaa gguuccuuug uucccuaagu ccaacuacua 4320

aacuggggga uauuaugaag ggccuugagc aucuggauuc ugccuaauaa aaaacauuua 4380

uuuucauugc gagcggccgc a 4401

<210> 60

<211> 4401

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 eSp1.1 Cas9

<400> 60

gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggc 60

cccaaagaag aagcggaagg ucgguaucca cggaguccca gcagccgaca agaaguacag 120

caucggccug gacaucggca ccaacucugu gggcugggcc gugaucaccg acgaguacaa 180

ggugcccagc aagaaauuca aggugcuggg caacaccgac cggcacagca ucaagaagaa 240

ccugaucgga gcccugcugu ucgacagcgg cgaaacagcc gaggccaccc ggcugaagag 300

aaccgccaga agaagauaca ccagacggaa gaaccggauc ugcuaucugc aagagaucuu 360

cagcaacgag auggccaagg uggacgacag cuucuuccac agacuggaag aguccuuccu 420

gguggaagag gacaagaagc acgagagaca ccccaucuuc ggcaacaucg uggacgaggu 480

ggccuaccac gagaaguacc ccaccaucua ccaccugaga aagaaacugg uggacagcac 540

cgacaaggcc gaccugagac ugaucuaccu ggcccuggcc cacaugauca aguucagagg 600

ccacuuccug aucgagggcg accugaaccc cgacaacagc gacguggaca agcuguucau 660

ccagcuggug cagaccuaca accagcuguu cgaggaaaac cccaucaacg ccagcggcgu 720

ggacgccaag gcuauccugu cugccagacu gagcaagagc agaaggcugg aaaaucugau 780

cgcccagcug cccggcgaga agaagaacgg ccuguucggc aaccugauug cccugagccu 840

gggccugacc cccaacuuca agagcaacuu cgaccuggcc gaggaugcca aacugcagcu 900

gagcaaggac accuacgacg acgaccugga caaccugcug gcccagaucg gcgaccagua 960

cgccgaccug uuccuggccg ccaagaaccu gucugacgcc auccugcuga gcgacauccu 1020

gagagugaac accgagauca ccaaggcccc ccugagcgcc ucuaugauca agagauacga 1080

cgagcaccac caggaccuga cccugcugaa agcucucgug cggcagcagc ugccugagaa 1140

guacaaagaa aucuucuucg accagagcaa gaacggcuac gccggcuaca ucgauggcgg 1200

cgcuagccag gaagaguucu acaaguucau caagcccauc cuggaaaaga uggacggcac 1260

cgaggaacug cucgugaagc ugaacagaga ggaccugcug agaaagcaga gaaccuucga 1320

caacggcagc aucccccacc agauccaccu gggagagcug cacgcuaucc ugagaaggca 1380

ggaagauuuu uacccauucc ugaaggacaa ccgggaaaag aucgagaaga uccugaccuu 1440

caggaucccc uacuacgugg gcccccuggc cagaggcaac agcagauucg ccuggaugac 1500

cagaaagagc gaggaaacca ucacccccug gaacuucgag gaaguggugg acaagggcgc 1560

cagcgcccag agcuucaucg agagaaugac aaacuucgau aagaaccugc ccaacgagaa 1620

ggugcugccc aagcacagcc ugcuguacga guacuucacc guguacaacg agcugaccaa 1680

agugaaauac gugaccgagg gaaugagaaa gcccgccuuc cugagcggcg agcagaaaaa 1740

ggccaucgug gaccugcugu ucaagaccaa cagaaaagug accgugaagc agcugaaaga 1800

ggacuacuuc aagaaaaucg agugcuucga cuccguggaa aucuccggcg uggaagauag 1860

auucaacgcc ucccugggca cauaccacga ucugcugaaa auuaucaagg acaaggacuu 1920

ccuggauaac gaagagaacg aggacauucu ggaagauauc gugcugaccc ugacacuguu 1980

ugaggaccgc gagaugaucg aggaaaggcu gaaaaccuac gcucaccugu ucgacgacaa 2040

agugaugaag cagcugaaga gaaggcggua caccggcugg ggcaggcuga gcagaaagcu 2100

gaucaacggc aucagagaca agcagagcgg caagacaauc cuggauuucc ugaaguccga 2160

cggcuucgcc aaccggaacu ucaugcagcu gauccacgac gacagccuga cauucaaaga 2220

ggacauccag aaagcccagg uguccggcca gggcgacucu cugcacgagc auaucgcuaa 2280

ccuggccggc agccccgcua ucaagaaggg cauccugcag acagugaagg ugguggacga 2340

gcucgugaaa gugaugggca gacacaagcc cgagaacauc gugaucgaga uggcuagaga 2400

gaaccagacc acccagaagg gacagaagaa cucccgcgag aggaugaaga gaaucgaaga 2460

gggcaucaaa gagcugggca gccagauccu gaaagaacac cccguggaaa acacccagcu 2520

gcagaacgag aagcuguacc uguacuaccu gcagaauggc cgggauaugu acguggacca 2580

ggaacuggac aucaacagac uguccgacua cgauguggac cauaucgugc cucagagcuu 2640

ucuggccgac gacuccaucg auaacaaagu gcugacucgg agcgacaaga acagaggcaa 2700

gagcgacaac gugcccuccg aagaggucgu gaagaagaug aagaacuacu ggcgacagcu 2760

gcugaacgcc aagcugauua cccagaggaa guucgauaac cugaccaagg ccgagagagg 2820

cggccugagc gagcuggaua aggccggcuu caucaagagg cagcuggugg aaaccagaca 2880

gaucacaaag cacguggcac agauccugga cucccggaug aacacuaagu acgacgaaaa 2940

cgauaagcug auccgggaag ugaaagugau cacccugaag uccaagcugg uguccgauuu 3000

ccggaaggau uuccaguuuu acaaagugcg cgagaucaac aacuaccacc acgcccacga 3060

cgccuaccug aacgccgucg ugggaaccgc ccugaucaaa aaguacccug cccuggaaag 3120

cgaguucgug uacggcgacu acaaggugua cgacgugcgg aagaugaucg ccaagagcga 3180

gcaggaaauc ggcaaggcua ccgccaagua cuucuucuac agcaacauca ugaacuuuuu 3240

caagaccgaa aucacccugg ccaacggcga gaucagaaag gccccucuga ucgagacaaa 3300

cggcgaaacc ggggagaucg ugugggauaa gggcagagac uucgccacag ugcgaaaggu 3360

gcugagcaug ccccaaguga auaucgugaa aaagaccgag gugcagacag gcggcuucag 3420

caaagagucu auccugccca agaggaacag cgacaagcug aucgccagaa agaaggacug 3480

ggaccccaag aaguacggcg gcuucgacag cccuaccgug gccuacucug ugcugguggu 3540

ggcuaaggug gaaaagggca aguccaagaa acugaagagu gugaaagagc ugcuggggau 3600

caccaucaug gaaagaagca gcuuugagaa gaacccuauc gacuuucugg aagccaaggg 3660

cuacaaagaa gugaaaaagg accugaucau caagcugccu aaguacuccc uguucgagcu 3720

ggaaaacggc agaaagagaa ugcuggccuc ugccggcgaa cugcagaagg gaaacgagcu 3780

ggcccugccu agcaaauaug ugaacuuccu guaccuggcc ucccacuaug agaagcugaa 3840

gggcagcccu gaggacaacg aacagaaaca gcuguuugug gaacagcaua agcacuaccu 3900

ggacgagauc aucgagcaga ucagcgaguu cuccaagaga gugauccugg ccgacgccaa 3960

ucuggacaag gugcugucug ccuacaacaa gcacagggac aagccuauca gagagcaggc 4020

cgagaauauc auccaccugu ucacccugac aaaccugggc gcuccugccg ccuucaagua 4080

cuuugacacc accaucgacc ggaagaggua caccagcacc aaagaggugc uggacgccac 4140

ccugauccac cagagcauca ccggccugua cgagacaaga aucgaccugu cucagcuggg 4200

aggcgacaag agaccugccg ccacuaagaa ggccggacag gccaaaaaga agaagugagc 4260

ucgcuuucuu gcuguccaau uucuauuaaa gguuccuuug uucccuaagu ccaacuacua 4320

aacuggggga uauuaugaag ggccuugagc aucuggauuc ugccuaauaa aaaacauuua 4380

uuuucauugc gagcggccgc a 4401

<210> 61

<211> 1400

<212> PRT

<213> 人工序列

<220>

<223> 合成序列 具有末端核定位序列的野生型 Cas9 蛋白

<400> 61

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala

1 5 10 15

Ala Asp Lys Lys Pro Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

20 25 30

Gly Trp Ala Val Ile Thr Asp Glu Pro Lys Val Pro Ser Lys Lys Phe

35 40 45

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

50 55 60

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

65 70 75 80

Lys Arg Thr Ala Arg Arg Arg Pro Thr Arg Arg Lys Asn Arg Ile Cys

85 90 95

Pro Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

100 105 110

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

115 120 125

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Pro

130 135 140

His Glu Lys Pro Pro Thr Ile Pro His Leu Arg Lys Lys Leu Val Asp

145 150 155 160

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Pro Leu Ala Leu Ala His

165 170 175

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

180 185 190

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Pro

195 200 205

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

210 215 220

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

225 230 235 240

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

245 250 255

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

260 265 270

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Pro Asp

275 280 285

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Pro Ala Asp

290 295 300

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

305 310 315 320

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

325 330 335

Met Ile Lys Arg Pro Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

340 345 350

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Pro Lys Glu Ile Phe Phe

355 360 365

Asp Gln Ser Lys Asn Gly Pro Ala Gly Pro Ile Asp Gly Gly Ala Ser

370 375 380

Gln Glu Glu Phe Pro Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

385 390 395 400

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

405 410 415

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

420 425 430

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Pro Pro Phe

435 440 445

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

450 455 460

Pro Pro Pro Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

465 470 475 480

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

485 490 495

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

500 505 510

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

515 520 525

Leu Leu Pro Glu Pro Phe Thr Val Pro Asn Glu Leu Thr Lys Val Lys

530 535 540

Pro Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

545 550 555 560

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

565 570 575

Val Lys Gln Leu Lys Glu Asp Pro Phe Lys Lys Ile Glu Cys Phe Asp

580 585 590

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

595 600 605

Thr Pro His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

610 615 620

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

625 630 635 640

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Pro Ala

645 650 655

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Pro

660 665 670

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

675 680 685

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

690 695 700

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

705 710 715 720

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

725 730 735

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

740 745 750

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

755 760 765

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

770 775 780

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

785 790 795 800

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

805 810 815

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Pro Leu Pro Pro Leu

820 825 830

Gln Asn Gly Arg Asp Met Pro Val Asp Gln Glu Leu Asp Ile Asn Arg

835 840 845

Leu Ser Asp Pro Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

850 855 860

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

865 870 875 880

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

885 890 895

Asn Pro Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

900 905 910

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

915 920 925

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

930 935 940

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Pro Asp

945 950 955 960

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

965 970 975

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Pro Lys Val Arg

980 985 990

Glu Ile Asn Asn Pro His His Ala His Asp Ala Pro Leu Asn Ala Val

995 1000 1005

Val Gly Thr Ala Leu Ile Lys Lys Pro Pro Lys Leu Glu Ser Glu Phe

1010 1015 1020

Val Pro Gly Asp Pro Lys Val Pro Asp Val Arg Lys Met Ile Ala Lys

1025 1030 1035 1040

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Pro Phe Phe Pro Ser

1045 1050 1055

Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1060 1065 1070

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1075 1080 1085

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser

1090 1095 1100

Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1105 1110 1115 1120

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile

1125 1130 1135

Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Pro Gly Gly Phe Asp Ser

1140 1145 1150

Pro Thr Val Ala Pro Ser Val Leu Val Val Ala Lys Val Glu Lys Gly

1155 1160 1165

Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile

1170 1175 1180

Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1185 1190 1195 1200

Lys Gly Pro Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1205 1210 1215

Pro Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1220 1225 1230

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Pro

1235 1240 1245

Val Asn Phe Leu Pro Leu Ala Ser His Pro Glu Lys Leu Lys Gly Ser

1250 1255 1260

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1265 1270 1275 1280

Pro Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val

1285 1290 1295

Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Pro Asn Lys

1300 1305 1310

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1315 1320 1325

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Pro Phe Asp

1330 1335 1340

Thr Thr Ile Asp Arg Lys Arg Pro Thr Ser Thr Lys Glu Val Leu Asp

1345 1350 1355 1360

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Pro Glu Thr Arg Ile

1365 1370 1375

Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys

1380 1385 1390

Ala Gly Gln Ala Lys Lys Lys Lys

1395 1400

<210> 62

<211> 1400

<212> PRT

<213> 人工序列

<220>

<223> 合成序列 修饰的Cas9 蛋白序列

<400> 62

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala

1 5 10 15

Ala Asp Lys Lys Pro Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

20 25 30

Gly Trp Ala Val Ile Thr Asp Glu Pro Lys Val Pro Ser Lys Lys Phe

35 40 45

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

50 55 60

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

65 70 75 80

Lys Arg Thr Ala Arg Arg Arg Pro Thr Arg Arg Lys Asn Arg Ile Cys

85 90 95

Pro Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

100 105 110

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

115 120 125

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Pro

130 135 140

His Glu Lys Pro Pro Thr Ile Pro His Leu Arg Lys Lys Leu Val Asp

145 150 155 160

Ser Thr Asp Lys Ala Asp Leu Lys Leu Val Pro Leu Ser Leu Ala His

165 170 175

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

180 185 190

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Pro

195 200 205

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

210 215 220

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

225 230 235 240

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Leu Gly Gln

245 250 255

Leu Ile Ser Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

260 265 270

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Pro Asp

275 280 285

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Pro Ala Asp

290 295 300

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

305 310 315 320

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

325 330 335

Met Ile Lys Arg Pro Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

340 345 350

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Pro Lys Glu Ile Phe Phe

355 360 365

Asp Gln Ser Lys Asn Gly Pro Ala Gly Pro Ile Asp Gly Gly Ala Ser

370 375 380

Gln Glu Glu Phe Pro Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

385 390 395 400

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

405 410 415

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

420 425 430

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Pro Pro Phe

435 440 445

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

450 455 460

Pro Pro Pro Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

465 470 475 480

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

485 490 495

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

500 505 510

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

515 520 525

Leu Leu Pro Glu Pro Phe Thr Val Pro Asn Glu Leu Thr Lys Val Lys

530 535 540

Pro Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

545 550 555 560

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

565 570 575

Val Lys Gln Leu Lys Glu Asp Pro Leu Lys Arg Ile Glu Glu Phe Asp

580 585 590

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

595 600 605

Thr Pro His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

610 615 620

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

625 630 635 640

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Pro Ala

645 650 655

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Pro

660 665 670

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

675 680 685

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

690 695 700

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

705 710 715 720

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

725 730 735

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

740 745 750

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

755 760 765

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

770 775 780

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

785 790 795 800

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

805 810 815

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Pro Leu Pro Pro Leu

820 825 830

Gln Asn Gly Arg Asp Met Pro Val Asp Gln Glu Leu Asp Ile Asn Arg

835 840 845

Leu Ser Asp Pro Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

850 855 860

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

865 870 875 880

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

885 890 895

Asn Pro Thr Arg Asn Leu Leu Gln Ala Lys Leu Ile Thr Gln Arg Lys

900 905 910

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

915 920 925

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

930 935 940

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Pro Asp

945 950 955 960

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Ile Ile Thr Leu Lys Ser

965 970 975

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Pro Lys Val Arg

980 985 990

Glu Ile Asn Asn Pro His His Ala His Asp Ala Pro Leu Asn Ala Val

995 1000 1005

Val Gly Thr Ala Leu Ile Lys Lys Pro Pro Lys Leu Glu Ser Glu Phe

1010 1015 1020

Val Pro Gly Asp Pro Lys Val Pro Asp Val Arg Lys Met Ile Ala Lys

1025 1030 1035 1040

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Pro Phe Phe Pro Ser

1045 1050 1055

Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1060 1065 1070

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1075 1080 1085

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser

1090 1095 1100

Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1105 1110 1115 1120

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile

1125 1130 1135

Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Pro Gly Gly Phe Asp Ser

1140 1145 1150

Pro Thr Val Ala Pro Ser Val Leu Val Val Ala Lys Val Glu Lys Gly

1155 1160 1165

Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile

1170 1175 1180

Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1185 1190 1195 1200

Lys Gly Pro Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1205 1210 1215

Pro Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1220 1225 1230

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Pro

1235 1240 1245

Val Asn Phe Leu Pro Leu Ala Ser His Pro Glu Lys Leu Lys Gly Ser

1250 1255 1260

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1265 1270 1275 1280

Pro Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val

1285 1290 1295

Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Pro Asn Lys

1300 1305 1310

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1315 1320 1325

Phe Thr Ile Thr Gln Leu Gly Ala Pro Ala Ala Phe Lys Pro Phe Asp

1330 1335 1340

Thr Thr Ile Asp Arg Lys Arg Pro Thr Ser Thr Lys Glu Val Leu Asp

1345 1350 1355 1360

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Pro Glu Thr Arg Ile

1365 1370 1375

Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys

1380 1385 1390

Ala Gly Gln Ala Lys Lys Lys Lys

1395 1400

<210> 63

<211> 1368

<212> PRT

<213> 酿脓链球菌 (Streptococcus pyogenes)

<400> 63

Met Asp Lys Lys Pro Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Pro Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Pro Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Pro Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Pro

115 120 125

His Glu Lys Pro Pro Thr Ile Pro His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Pro Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Pro

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Pro Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Pro Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Pro Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Pro Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Pro Ala Gly Pro Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Pro Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Pro Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Pro Pro Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Pro Glu Pro Phe Thr Val Pro Asn Glu Leu Thr Lys Val Lys

515 520 525

Pro Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Pro Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Pro His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Pro Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Pro

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Pro Leu Pro Pro Leu

805 810 815

Gln Asn Gly Arg Asp Met Pro Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Pro Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Pro Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Pro Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Pro Lys Val Arg

965 970 975

Glu Ile Asn Asn Pro His His Ala His Asp Ala Pro Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Pro Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Pro Gly Asp Pro Lys Val Pro Asp Val Arg Lys Met Ile Ala Lys

1010 1015 1020

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Pro Phe Phe Pro Ser

1025 1030 1035 1040

Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1045 1050 1055

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1060 1065 1070

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser

1075 1080 1085

Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1090 1095 1100

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile

1105 1110 1115 1120

Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Pro Gly Gly Phe Asp Ser

1125 1130 1135

Pro Thr Val Ala Pro Ser Val Leu Val Val Ala Lys Val Glu Lys Gly

1140 1145 1150

Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile

1155 1160 1165

Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1170 1175 1180

Lys Gly Pro Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1185 1190 1195 1200

Pro Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1205 1210 1215

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Pro

1220 1225 1230

Val Asn Phe Leu Pro Leu Ala Ser His Pro Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1250 1255 1260

Pro Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val

1265 1270 1275 1280

Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Pro Asn Lys

1285 1290 1295

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1300 1305 1310

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Pro Phe Asp

1315 1320 1325

Thr Thr Ile Asp Arg Lys Arg Pro Thr Ser Thr Lys Glu Val Leu Asp

1330 1335 1340

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Pro Glu Thr Arg Ile

1345 1350 1355 1360

Asp Leu Ser Gln Leu Gly Gly Asp

1365

<210> 64

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成序列-目标A (HPV16 病毒序列)

<220>

<221> misc_feature

<222> (1)...(23)

<223> n = A, U, C or G

<400> 64

gcaagtgtga ctctacgctt ngg 23

<210> 65

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成序列-目标B (HPV16 病毒序列)

<220>

<221> misc_feature

<222> (1)...(23)

<223> n = A, U, C, or G

<400> 65

gcaacaagac atacatcgac ngg 23

<210> 66

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HBV向导3.1.3.1

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 4

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 66

gauugagauc uucugcgacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 67

<211> 4479

<212> RNA

<213> 人工序列

<220>

<223> 合成序列mRNA-Cas9-L-417

<400> 67

aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gccccaaaga 60

agaagcggaa ggucgguauc cacggagucc cagcagccga caagaaguac agcaucggcc 120

uggacaucgg caccaacucu gugggcuggg ccgugaucac cgacgaguac aaggugccca 180

gcaagaaauu caaggugcug ggcaacaccg accggcacag caucaagaag aaccugaucg 240

gagcccugcu guucgacagc ggcgaaacag ccgaggccac ccggcugaag agaaccgcca 300

gaagaagaua caccagacgg aagaaccgga ucugcuaucu gcaagagauc uucagcaacg 360

agauggccaa gguggacgac agcuucuucc acagacugga agaguccuuc cugguggaag 420

aggacaagaa gcacgagaga caccccaucu ucggcaacau cguggacgag guggccuacc 480

acgagaagua ccccaccauc uaccaccuga gaaagaaacu gguggacagc accgacaagg 540

ccgaccugag acugaucuac cuggcccugg cccacaugau caaguucaga ggccacuucc 600

ugaucgaggg cgaccugaac cccgacaaca gcgacgugga caagcuguuc auccagcugg 660

ugcagaccua caaccagcug uucgaggaaa accccaucaa cgccagcggc guggacgcca 720

aggcuauccu gucugccaga cugagcaaga gcagaaggcu ggaaaaucug aucgcccagc 780

ugcccggcga gaagaagaac ggccuguucg gcaaccugau ugcccugagc cugggccuga 840

cccccaacuu caagagcaac uucgaccugg ccgaggaugc caaacugcag cugagcaagg 900

acaccuacga cgacgaccug gacaaccugc uggcccagau cggcgaccag uacgccgacc 960

uguuccuggc cgccaagaac cugucugacg ccauccugcu gagcgacauc cugagaguga 1020

acaccgagau caccaaggcc ccccugagcg ccucuaugau caagagauac gacgagcacc 1080

accaggaccu gacccugcug aaagcucucg ugcggcagca gcugccugag aaguacaaag 1140

aaaucuucuu cgaccagagc aagaacggcu acgccggcua caucgauggc ggcgcuagcc 1200

aggaagaguu cuacaaguuc aucaagccca uccuggaaaa gauggacggc accgaggaac 1260

ugcucgugaa gcugaacaga gaggaccugc ugagaaagca gagaaccuuc gacaacggca 1320

gcauccccca ccagauccac cugggagagc ugcacgcuau ccugagaagg caggaagauu 1380

uuuacccauu ccugaaggac aaccgggaaa agaucgagaa gauccugacc uucaggaucc 1440

ccuacuacgu gggcccccug gccagaggca acagcagauu cgccuggaug accagaaaga 1500

gcgaggaaac caucaccccc uggaacuucg aggaaguggu ggacaagggc gccagcgccc 1560

agagcuucau cgagagaaug acaaacuucg auaagaaccu gcccaacgag aaggugcugc 1620

ccaagcacag ccugcuguac gaguacuuca ccguguacaa cgagcugacc aaagugaaau 1680

acgugaccga gggaaugaga aagcccgccu uccugagcgg cgagcagaaa aaggccaucg 1740

uggaccugcu guucaagacc aacagaaaag ugaccgugaa gcagcugaaa gaggacuacu 1800

ucaagaaaau cgagugcuuc gacuccgugg aaaucuccgg cguggaagau agauucaacg 1860

ccucccuggg cacauaccac gaucugcuga aaauuaucaa ggacaaggac uuccuggaua 1920

acgaagagaa cgaggacauu cuggaagaua ucgugcugac ccugacacug uuugaggacc 1980

gcgagaugau cgaggaaagg cugaaaaccu acgcucaccu guucgacgac aaagugauga 2040

agcagcugaa gagaaggcgg uacaccggcu ggggcaggcu gagcagaaag cugaucaacg 2100

gcaucagaga caagcagagc ggcaagacaa uccuggauuu ccugaagucc gacggcuucg 2160

ccaaccggaa cuucaugcag cugauccacg acgacagccu gacauucaaa gaggacaucc 2220

agaaagccca gguguccggc cagggcgacu cucugcacga gcauaucgcu aaccuggccg 2280

gcagccccgc uaucaagaag ggcauccugc agacagugaa ggugguggac gagcucguga 2340

aagugauggg cagacacaag cccgagaaca ucgugaucga gauggcuaga gagaaccaga 2400

ccacccagaa gggacagaag aacucccgcg agaggaugaa gagaaucgaa gagggcauca 2460

aagagcuggg cagccagauc cugaaagaac accccgugga aaacacccag cugcagaacg 2520

agaagcugua ccuguacuac cugcagaaug gccgggauau guacguggac caggaacugg 2580

acaucaacag acuguccgac uacgaugugg accauaucgu gccucagagc uuucugaagg 2640

acgacuccau cgauaacaaa gugcugacuc ggagcgacaa gaacagaggc aagagcgaca 2700

acgugcccuc cgaagagguc gugaagaaga ugaagaacua cuggcgacag cugcugaacg 2760

ccaagcugau uacccagagg aaguucgaua accugaccaa ggccgagaga ggcggccuga 2820

gcgagcugga uaaggccggc uucaucaaga ggcagcuggu ggaaaccaga cagaucacaa 2880

agcacguggc acagauccug gacucccgga ugaacacuaa guacgacgaa aacgauaagc 2940

ugauccggga agugaaagug aucacccuga aguccaagcu gguguccgau uuccggaagg 3000

auuuccaguu uuacaaagug cgcgagauca acaacuacca ccacgcccac gacgccuacc 3060

ugaacgccgu cgugggaacc gcccugauca aaaaguaccc uaagcuggaa agcgaguucg 3120

uguacggcga cuacaaggug uacgacgugc ggaagaugau cgccaagagc gagcaggaaa 3180

ucggcaaggc uaccgccaag uacuucuucu acagcaacau caugaacuuu uucaagaccg 3240

aaaucacccu ggccaacggc gagaucagaa agcgcccucu gaucgagaca aacggcgaaa 3300

ccggggagau cgugugggau aagggcagag acuucgccac agugcgaaag gugcugagca 3360

ugccccaagu gaauaucgug aaaaagaccg aggugcagac aggcggcuuc agcaaagagu 3420

cuauccugcc caagaggaac agcgacaagc ugaucgccag aaagaaggac ugggacccca 3480

agaaguacgg cggcuucgac agcccuaccg uggccuacuc ugugcuggug guggcuaagg 3540

uggaaaaggg caaguccaag aaacugaaga gugugaaaga gcugcugggg aucaccauca 3600

uggaaagaag cagcuuugag aagaacccua ucgacuuucu ggaagccaag ggcuacaaag 3660

aagugaaaaa ggaccugauc aucaagcugc cuaaguacuc ccuguucgag cuggaaaacg 3720

gcagaaagag aaugcuggcc ucugccggcg aacugcagaa gggaaacgag cuggcccugc 3780

cuagcaaaua ugugaacuuc cuguaccugg ccucccacua ugagaagcug aagggcagcc 3840

cugaggacaa cgaacagaaa cagcuguuug uggaacagca uaagcacuac cuggacgaga 3900

ucaucgagca gaucagcgag uucuccaaga gagugauccu ggccgacgcc aaucuggaca 3960

aggugcuguc ugccuacaac aagcacaggg acaagccuau cagagagcag gccgagaaua 4020

ucauccaccu guucacccug acaaaccugg gcgcuccugc cgccuucaag uacuuugaca 4080

ccaccaucga ccggaagagg uacaccagca ccaaagaggu gcuggacgcc acccugaucc 4140

accagagcau caccggccug uacgagacaa gaaucgaccu gucucagcug ggaggcgaca 4200

agagaccugc cgccacuaag aaggccggac aggccaaaaa gaagaaguga gcggccgcuu 4260

aauuaagcug ccuucugcgg ggcuugccuu cuggccaugc ccuucuucuc ucccuugcac 4320

cuguaccucu uggucuuuga auaaagccug aguaggaaga aaaaaaaaaa aaaaaaaaaa 4380

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4479

<210> 68

<211> 4521

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 Cas9-mRNA-Lv2-417.2

<220>

<221> misc_feature

<222> (1)...(4521)

<223> n = 5甲氧基尿苷

<400> 68

aggaaanaag agagaaaaga agagnaagaa gaaananaag agccaccang gcccccaaga 60

agaagcggaa ggngggcanc cacggcgngc ccgccgccga caagaagnac agcancggcc 120

nggacancgg caccaacagc gngggcnggg ccgngancac cgacgagnac aaggngccca 180

gcaagaagnn caaggngcng ggcaacaccg accggcacag cancaagaag aaccngancg 240

gcgcccngcn gnncgacagc ggcgagaccg ccgaggccac ccggcngaag cggaccgccc 300

ggcggcggna cacccggcgg aagaaccgga ncngcnaccn gcaggaganc nncagcaacg 360

aganggccaa ggnggacgac agcnncnncc accggcngga ggagagcnnc cnggnggagg 420

aggacaagaa gcacgagcgg caccccancn ncggcaacan cgnggacgag gnggccnacc 480

acgagaagna ccccaccanc naccaccngc ggaagaagcn ggnggacagc accgacaagg 540

ccgaccngcg gcngancnac cnggcccngg cccacangan caagnnccgg ggccacnncc 600

ngancgaggg cgaccngaac cccgacaaca gcgacgngga caagcngnnc anccagcngg 660

ngcagaccna caaccagcng nncgaggaga accccancaa cgccagcggc gnggacgcca 720

aggccanccn cagcgcccgg cngagcaaga gccggcggcn ggagaaccng ancgcccagc 780

ngcccggcga gaagaagaac ggccngnncg gcaaccngan cgcccngagc cngggccnga 840

cccccaacnn caagagcaac nncgaccngg ccgaggacgc caagcngcag cngagcaagg 900

acaccnacga cgacgaccng gacaaccngc nggcccagan cggcgaccag nacgccgacc 960

ngnnccnggc cgccaagaac cngagcgacg ccanccngcn gagcgacanc cngcgggnga 1020

acaccgagan caccaaggcc ccccngagcg ccagcangan caagcggnac gacgagcacc 1080

accaggaccn gacccngcng aaggcccngg ngcggcagca gcngcccgag aagnacaagg 1140

agancnncnn cgaccagagc aagaacggcn acgccggcna cancgacggc ggcgccagcc 1200

aggaggagnn cnacaagnnc ancaagccca nccnggagaa ganggacggc accgaggagc 1260

ngcnggngaa gcngaaccgg gaggaccngc ngcggaagca gcggaccnnc gacaacggca 1320

gcanccccca ccaganccac cngggcgagc ngcacgccan ccngcggcgg caggaggacn 1380

ncnaccccnn ccngaaggac aaccgggaga agancgagaa ganccngacc nnccggancc 1440

ccnacnacgn gggcccccng gcccggggca acagccggnn cgccnggang acccggaaga 1500

gcgaggagac cancaccccc nggaacnncg aggaggnggn ggacaagggc gccagcgccc 1560

agagcnncan cgagcggang accaacnncg acaagaaccn gcccaacgag aaggngcngc 1620

ccaagcacag ccngcngnac gagnacnnca ccgngnacaa cgagcngacc aaggngaagn 1680

acgngaccga gggcangcgg aagcccgccn nccngagcgg cgagcagaag aaggccancg 1740

nggaccngcn gnncaagacc aaccggaagg ngaccgngaa gcagcngaag gaggacnacn 1800

ncaagaagan cgagngcnnc gacagcgngg agancagcgg cgnggaggac cggnncaacg 1860

ccagccnggg caccnaccac gaccngcnga agancancaa ggacaaggac nnccnggaca 1920

acgaggagaa cgaggacanc cnggaggaca ncgngcngac ccngacccng nncgaggacc 1980

gggagangan cgaggagcgg cngaagaccn acgcccaccn gnncgacgac aaggnganga 2040

agcagcngaa gcggcggcgg nacaccggcn ggggccggcn gagccggaag cngancaacg 2100

gcanccggga caagcagagc ggcaagacca nccnggacnn ccngaagagc gacggcnncg 2160

ccaaccggaa cnncangcag cnganccacg acgacagccn gaccnncaag gaggacancc 2220

agaaggccca ggngagcggc cagggcgaca gccngcacga gcacancgcc aaccnggccg 2280

gcagccccgc cancaagaag ggcanccngc agaccgngaa ggnggnggac gagcnggnga 2340

aggnganggg ccggcacaag cccgagaaca ncgngancga ganggcccgg gagaaccaga 2400

ccacccagaa gggccagaag aacagccggg agcggangaa gcggancgag gagggcanca 2460

aggagcnggg cagccaganc cngaaggagc accccgngga gaacacccag cngcagaacg 2520

agaagcngna ccngnacnac cngcagaacg gccgggacan gnacgnggac caggagcngg 2580

acancaaccg gcngagcgac nacgacgngg accacancgn gccccagagc nnccngaagg 2640

acgacagcan cgacaacaag gngcngaccc ggagcgacaa gaaccggggc aagagcgaca 2700

acgngcccag cgaggaggng gngaagaaga ngaagaacna cnggcggcag cngcngaacg 2760

ccaagcngan cacccagcgg aagnncgaca accngaccaa ggccgagcgg ggcggccnga 2820

gcgagcngga caaggccggc nncancaagc ggcagcnggn ggagacccgg cagancacca 2880

agcacgnggc ccaganccng gacagccgga ngaacaccaa gnacgacgag aacgacaagc 2940

nganccggga ggngaaggng ancacccnga agagcaagcn ggngagcgac nnccggaagg 3000

acnnccagnn cnacaaggng cgggaganca acaacnacca ccacgcccac gacgccnacc 3060

ngaacgccgn ggngggcacc gcccnganca agaagnaccc caagcnggag agcgagnncg 3120

ngnacggcga cnacaaggng nacgacgngc ggaagangan cgccaagagc gagcaggaga 3180

ncggcaaggc caccgccaag nacnncnncn acagcaacan cangaacnnc nncaagaccg 3240

agancacccn ggccaacggc gaganccgga agcggccccn gancgagacc aacggcgaga 3300

ccggcgagan cgngngggac aagggccggg acnncgccac cgnccggaag gngcngagca 3360

ngccccaggn gaacancgng aagaagaccg aggngcagac cggcggcnnc agcaaggaga 3420

gcanccngcc caagcggaac agcgacaagc ngancgcccg gaagaaggac ngggacccca 3480

agaagnacgg cggcnncgac agccccaccg nggccnacag cgngcnggng gnggccaagg 3540

nggagaaggg caagagcaag aagcngaaga gcgngaagga gcngcngggc ancaccanca 3600

nggagcggag cagcnncgag aagaacccca ncgacnnccn ggaggccaag ggcnacaagg 3660

aggngaagaa ggaccnganc ancaagcngc ccaagnacag ccngnncgag cnggagaacg 3720

gccggaagcg gangcnggcc agcgccggcg agcngcagaa gggcaacgag cnggcccngc 3780

ccagcaagna cgngaacnnc cngnaccngg ccagccacna cgagaagcng aagggcagcc 3840

ccgaggacaa cgagcagaag cagcngnncg nggagcagca caagcacnac cnggacgaga 3900

ncancgagca gancagcgag nncagcaagc gggnganccn ggccgacgcc aaccnggaca 3960

aggngcngag cgccnacaac aagcaccggg acaagcccan ccgggagcag gccgagaaca 4020

ncanccaccn gnncacccng accaaccngg gcgcccccgc cgccnncaag nacnncgaca 4080

ccaccancga ccggaagcgg nacaccagca ccaaggaggn gcnggacgcc acccngancc 4140

accagagcan caccggccng nacgagaccc ggancgaccn gagccagcng ggcggcgaca 4200

gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 4260

gcnaccccna cgacgngccc gacnacgccn gagcggccgc nnaannaagc ngccnncngc 4320

ggggcnngcc nncnggccan gcccnncnnc ncncccnngc accngnaccn cnnggncnnn 4380

gaanaaagcc ngagnaggaa gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500

aaaaaaaaaa aaaaaaaaaa a 4521

<210> 69

<211> 4521

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 Cas9-mRNA-Lv3-417.3

<400> 69

aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gcccccaaga 60

agaagcggaa ggugggcauc cacggcgugc ccgccgccga caagaaguac agcaucggcc 120

uggacaucgg caccaacagc gugggcuggg ccgugaucac cgacgaguac aaggugccca 180

gcaagaaguu caaggugcug ggcaacaccg accggcacag caucaagaag aaccugaucg 240

gcgcccugcu guucgacagc ggcgagaccg ccgaggccac ccggcugaag cggaccgccc 300

ggcggcggua cacccggcgg aagaaccgga ucugcuaccu gcaggagauc uucagcaacg 360

agauggccaa gguggacgac agcuucuucc accggcugga ggagagcuuc cugguggagg 420

aggacaagaa gcacgagcgg caccccaucu ucggcaacau cguggacgag guggccuacc 480

acgagaagua ccccaccauc uaccaccugc ggaagaagcu gguggacagc accgacaagg 540

ccgaccugcg gcugaucuac cuggcccugg cccacaugau caaguuccgg ggccacuucc 600

ugaucgaggg cgaccugaac cccgacaaca gcgacgugga caagcuguuc auccagcugg 660

ugcagaccua caaccagcug uucgaggaga accccaucaa cgccagcggc guggacgcca 720

aggccauccu gagcgcccgg cugagcaaga gccggcggcu ggagaaccug aucgcccagc 780

ugcccggcga gaacaagaac ggccuguucg gcaaccugau cgcccugagc cugggccuga 840

cccccaacuu caagagcaac uucgaccugg ccgaggacgc caagcugcag cugagcaagg 900

acaccuacga cgacgaccug gacaaccugc uggcccagau cggcgaccag uacgccgacc 960

uguuccuggc cgccaagaac cugagcgacg ccauccugcu gagcgacauc cugcggguga 1020

acaccgagau caccaaggcc ccccugagcg ccagcaugau caagcgguac gacgagcacc 1080

accaggaccu gacccugcug aaggcccugg ugcggcagca gcugcccgag aaguacaagg 1140

agaucuucuu cgaccagagc aagaacggcu acgccggcua caucgacggc ggcgccagcc 1200

aggaggaguu cuacaaguuc aucaagccca uccuggagaa gauggacggc accgaggagc 1260

ugcuggugaa gcugaaccgg gaggaccugc ugcggaagca gcggaccuuc gacaacggca 1320

gcauccccca ccagauccac cugggcgagc ugcacgccau ccugcggcgg caggaggacu 1380

ucuaccccuu ccugaaggac aaccgggaga agaucgagaa gauccugacc uuccggaucc 1440

ccuacuacgu gggcccccug gcccggggca acagccgguu cgccuggaug acccggaaga 1500

gcgaggagac caucaccccc uggaacuucg aggagguggu ggacaagggc gccagcgccc 1560

agagcuucau cgagcggaug accaacuucg acaagaaccu gcccaacgag aaggugcugc 1620

ccaagcacag ccugcuguac gaguacuuca ccguguacaa cgagcugacc aaggugaagu 1680

acgugaccga gggcaugcgg aagcccgccu uccugagcgg cgagcagaag aaggccaucg 1740

uggaccugcu guucaagacc aaccggaagg ugaccgugaa gcagcugaag gaggacuacu 1800

ucaagaagau cgagugcuuc gacagcgugg agaucagcgg cguggaggac cgguucaacg 1860

ccagccuggg caccuaccac gaccugcuga agaucaucaa ggacaaggac uuccuggaca 1920

acgaggagaa cgaggacauc cuggaggaca ucgugcugac ccugacccug uucgaggacc 1980

gggagaugau cgaggagcgg cugaagaccu acgcccaccu guucgacgac aaggugauga 2040

agcagcugaa gcggcggcgg uacaccggcu ggggccggcu gagccggaag cugaucaacg 2100

gcauccggga caagcagagc ggcaagacca uccugcacuu ccugaagagc gacggcuucg 2160

ccaaccggaa cuucaugcag cugauccacg acgacagccu gaccuucaag gaggacaucc 2220

agaaggccca ggugagcggc cagggcgaca gccugcacga gcacaucgcc aaccuggccg 2280

gcagccccgc caucaagaag ggcauccugc agaccgugaa ggugguggac gagcugguga 2340

aggugauggg ccggcacaag cccgagaaca ucgugaucga gauggcccgg gagaaccaga 2400

ccacccagaa gggccagaag aacagccggg agcggaugaa gcggaucgag gagggcauca 2460

aggagcuggg cagccagauc cugaaggagc accccgugga gaacacccag cugcagaacg 2520

agaagcugua ccuguacuac cugcagaacg gccgggacau guacguggac caggagcugg 2580

acaucaaccg gcugagcgac uacgacgugg accacaucgu gccccagagc uuccugaagg 2640

acgacagcau cgacaacaag gugcugaccc ggagcgacaa gaaccggggc aagagcgaca 2700

acgugcccag cgaggaggug gugaagaaga ugaagaacua cuggcggcag cugcugaacg 2760

ccaagcugau cacccagcgg aaguucgaca accugaccaa ggccgagcgg ggcggccuga 2820

gcgagcugga caaggccggc uucaucaagc ggcagcuggu ggagacccgg cagaucacca 2880

agcacguggc ccagauccug gacagccgga ugaacaccaa guacgacgag aacgacaagc 2940

ugauccggga ggugaaggug aucacccuga agagcaagcu ggugagcgac uuccggaagg 3000

acuuccaguu cuacaaggug cgggagauca acaacuacca ccacgcccac gacgccuacc 3060

ugaacgccgu ggugggcacc gcccugauca agaaguaccc caagcuggag agcgaguucg 3120

uguacggcga cuacaaggug uacgacgugc ggaagaugau cgccaagagc gagcaggaga 3180

ucggcaaggc caccgccaag uacuucuucu acagcaacau caugaacuuc uucaagaccg 3240

agaucacccu ggccaacggc gagauccgga agcggccccu gaucgagacc aacggcgaga 3300

ccggcgagau cgugugggac aagggccggg acuucgccac cgugcggaag gugcugagca 3360

ugccccaggu gaacaucgug aagaagaccg aggugcagac cggcggcuuc agcaaggaga 3420

gcauccugcc caagcggaac agcgacaagc ugaucgcccg gaagaaggac ugggacccca 3480

agaaguacgg cggcuucgac agccccaccg uggccuacag cgugcuggug guggccaagg 3540

uggagaaggg caagagcaag aagcugaaga gcgugaagga gcugcugggc aucaccauca 3600

uggagcggag cagcuucgag aagaacccca ucgacuuccu ggaggccaag ggcuacaagg 3660

aggugaagaa ggaccugauc aucaagcugc ccaaguacag ccuguucgag cuggagaacg 3720

gccggaagcg gaugcuggcc agcgccggcg agcugcagaa gggcaacgag cuggcccugc 3780

ccagcaagua cgugaacuuc cuguaccugg ccagccacua cgagaagcug aagggcagcc 3840

ccgaggacaa cgagcagaag cagcuguucg uggagcagca caagcacuac cuggacgaga 3900

ucaucgagca gaucagcgag uucagcaagc gggugauccu ggccgacgcc aaccuggaca 3960

aggugcugag cgccuacaac aagcaccggg acaagcccau ccgggagcag gccgagaaca 4020

ucauccaccu guucacccug accaaccugg gcgcccccgc cgccuucaag uacuucgaca 4080

ccaccaucga ccggaagcgg uacaccagca ccaaggaggu gcuggacgcc acccugaucc 4140

accagagcau caccggccug uacgagaccc ggaucgaccu gagccagcug ggcggcgaca 4200

gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 4260

gcuaccccua cgacgugccc gacuacgccu gagcggccgc uuaauuaagc ugccuucugc 4320

ggggcuugcc uucuggccau gcccuucuuc ucucccuugc accuguaccu cuuggucuuu 4380

gaauaaagcc ugaguaggaa gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500

aaaaaaaaaa aaaaaaaaaa a 4521

<210> 70

<211> 4521

<212> RNA

<213> 人工序列

<220>

<223> 合成序列 Cas9-mRNA-Lv4-417.4

<220>

<221> misc_feature

<222> (1)...(4521)

<223> n = 假尿苷

<400> 70

aggaaanaag agagaaaaga agagnaagaa gaaananaag agccaccang gcccccaaga 60

agaagcggaa ggngggcanc cacggcgngc ccgccgccga caagaagnac agcancggcc 120

nggacancgg caccaacagc gngggcnggg ccgngancac cgacgagnac aaggngccca 180

gcaagaagnn caaggngcng ggcaacaccg accggcacag cancaagaag aaccngancg 240

gcgcccngcn gnncgacagc ggcgagaccg ccgaggccac ccggcngaag cggaccgccc 300

ggcggcggna cacccggcgg aagaaccgga ncngcnaccn gcaggaganc nncagcaacg 360

aganggccaa ggnggacgac agcnncnncc accggcngga ggagagcnnc cnggnggagg 420

aggacaagaa gcacgagcgg caccccancn ncggcaacan cgnggacgag gnggccnacc 480

acgagaagna ccccaccanc naccaccngc ggaagaagcn ggnggacagc accgacaagg 540

ccgaccngcg gcngancnac cnggcccngg cccacangan caagnnccgg ggccacnncc 600

ngancgaggg cgaccngaac cccgacaaca gcgacgngga caagcngnnc anccagcngg 660

ngcagaccna caaccagcng nncgaggaga accccancaa cgccagcggc gnggacgcca 720

aggccanccn gagcgcccgg cngagcaaga gccggcggcn ggagaaccng ancgcccagc 780

ngcccggcga gaagaagaac ggccngnncg gcaaccngan cgcccngagc cngggccnga 840

cccccaacnn caagagcaac nncgaccngg ccgaggacgc caagcngcag cngagcaagg 900

acaccnacga cgacgaccng gacaaccngc nggcccagan cggcgaccag nacgccgacc 960

ngnnccnggc cgccaagaac cngagcgacg ccanccngcn gagcgacanc cngcgggnga 1020

acaccgagan caccaaggcc ccccngagcg ccagcangan caagcggnac gacgagcacc 1080

accaggaccn gacccngcng aaggcccngg ngcggcagca gcngcccgag aagnacaagg 1140

agancnncnn cgaccagagc aagaacggcn acgccggcna cancgacggc ggcgccagcc 1200

aggaggagnn cnacaagnnc ancaagccca nccnggagaa ganggacggc accgaggagc 1260

ngcnggngaa gcngaaccgg gaggaccngc ngcggaagca gcggaccnnc gacaacggca 1320

gcanccccca ccaganccac cngggcgagc ngcacgccan ccngcggcgg caggaggacn 1380

ncnaccccnn ccngaaggac aaccgggaga agancgagaa ganccngacc nnccggancc 1440

ccnacnacgn gggcccccng gcccggggca acagccggnn cgccnggang acccggaaga 1500

gcgaggagac cancaccccc nggaacnncg aggaggnggn ggacaagggc gccagcgccc 1560

agagcnncan cgagcggang accaacnncg acaagaaccn gcccaacgag aaggngcngc 1620

ccaagcacag ccngcngnac gagnacnnca ccgngnacaa cgagcngacc aaggngaagn 1680

acgngaccga gggcangcgg aagcccgccn nccngagcgg cgagcagaag aaggccancg 1740

nggaccngcn gnncaagacc aaccggaagg ngaccgngaa gcagcngaag gaggacnacn 1800

ncaagaagan cgagngcnnc gacagcgngg agancagcgg cgnggaggac cggnncaacg 1860

ccagccnggg caccnaccac gaccngcnga agancancaa ggacaaggac nnccnggaca 1920

acgaggagaa cgaggacanc cnggaggaca ncgngcngac ccngacccng nncgaggacc 1980

gggagangan cgaggagcgg cngaagaccn acgcccaccn gnncgacgac aaggnganga 2040

agcagcngaa gcggcggcgg nacaccggcn ggggccggcn gagccggaag cngancaacg 2100

gcanccggga caagcagagc ggcaagacca nccnggacnn ccngaagagc gacggcnncg 2160

ccaaccggaa cnncangcag cnganccacg acgacagccn gaccnncaag gaggacancc 2220

agaaggccca ggngagcggc cagggcgaca gccngcacga gcacancgcc aaccnggccg 2280

gcagccccgc cancaagaag ggcanccngc agaccgngaa ggnggnggac gagcnggnga 2340

aggnganggg ccggcacaag cccgagaaca ncgngancga ganggcccgg gagaaccaga 2400

ccacccagaa gggccagaag aacagccggg agcggangaa gcggancgag gagggcanca 2460

aggagcnggg cagccaganc cngaaggagc accccgngga gaacacccag cngcagaacg 2520

agaagcngna ccngnacnac cngcagaacg gccgggacan gnacgnggac caggagcngg 2580

acancaaccg gcngagcgac nacgacgngg accacancgn gccccagagc nnccngaagg 2640

acgacagcan cgacaacaag gngcngaccc ggagcgacaa gaaccggggc aagagcgaca 2700

acgngcccag cgaggaggng gngaagaaga ngaagaacna cnggcggcag cngcngaacg 2760

ccaagcngan cacccagcgg aagnncgaca accngaccaa ggccgagcgg ggcggccnga 2820

gcgagcngga caaggccggc nncancaagc ggcagcnggn ggagacccgg cagancacca 2880

agcacgnggc ccaganccng gacagccgga ngaacaccaa gnacgacgag aacgacaagc 2940

nganccggga ggngaaggng ancacccnga agagcaagcn ggngagcgac nnccggaagg 3000

acnnccagnn cnacaaggng cgggaganca acaacnacca ccacgcccac gacgccnacc 3060

ngaacgccgn ggngggcacc gcccnganca agaagnaccc caagcnggag agcgagnncg 3120

ngnacggcga cnacaaggng nacgacgngc ggaagangan cgccaagagc gagcaggaga 3180

ncggcaaggc caccgccaag nacnncnncn acagcaacan cangaacnnc nncaagaccg 3240

agancacccn ggccaacggc gaganccgga agcggccccn gancgagacc aacggcgaga 3300

ccggcgagan cgngngggac aagggccggg acnncgccac cgngcggaag gngcngagca 3360

ngccccaggn gaacancgng aagaagaccg aggngcagac cggcggcnnc agcaaggaga 3420

gcanccngcc caagcggaac agcgacaagc ngancgcccg gaagaaggac ngggacccca 3480

agaagnacgg cggcnncgac agccccaccg nggccnacag cgngcnggng gnggccaagg 3540

nggagaaggg caagagcaag aagcngaaga gcgngaagga gcngcngggc ancaccanca 3600

nggagcggag cagcnncgag aagaacccca ncgacnnccn ggaggccaag ggcnacaagg 3660

aggngaagaa ggaccnganc ancaagcngc ccaagnacag ccngnncgag cnggagaacg 3720

gccggaagcg gangcnggcc agcgccggcg agcngcagaa gggcaacgag cnggcccngc 3780

ccagcaagna cgngaacnnc cngnaccngg ccagccacna cgagaagcng aagggcagcc 3840

ccgaggacaa cgagcagaag cagcngnncg nggagcagca caagcacnac cnggacgaga 3900

ncancgagca gancagcgag nncagcaagc gggnganccn ggccgacgcc aaccnggaca 3960

aggngcngag cgccnacaac aagcaccggg acaagcccan ccgggagcag gccgagaaca 4020

ncanccaccn gnncacccng accaaccngg gcgcccccgc cgccnncaag nacnncgaca 4080

ccaccancga ccggaagcgg nacaccagca ccaaggaggn gcnggacgcc acccngancc 4140

accagagcan caccggccng nacgagaccc ggancgaccn gagccagcng ggcggcgaca 4200

gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 4260

gcnaccccna cgacgngccc gacnacgccn gagcggccgc nnaannaagc ngccnncngc 4320

ggggcnngcc nncnggccan gcccnncnnc ncncccnngc accngnaccn cnnggncnnn 4380

gaanaaagcc ngagnaggaa gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500

aaaaaaaaaa aaaaaaaaaa a 4521

<210> 71

<211> 100

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV16-sgRNA-v2.417

<220>

<221> modified_base

<222> 1,2

<223> am, 硫代磷酸酯键

<220>

221> modified_base

<222> 3

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> (97)...(99)

<223> um, 硫代磷酸酯键

<400> 71

aagugugacu cuacgcuugu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60

uuaucaacuu gaaaaagugg caccgagucg gugcuuuuuu 100

<210> 72

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV16-sgRNA-BNA-v1.417

<220>

<221> modified_base

<222> 1

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 8,17

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 72

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 73

<211> 98

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV16-sgRNA-BNA-v11(eleven).417

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> um, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 5,14

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (95)...(97)

<223> um, 硫代磷酸酯键

<400> 73

gugugacucu acgcuuguuu uagagcuaga aauagcaagu uaaaauaagg cuaguccguu 60

aucaacuuga aaaaguggca ccgagucggu gcuuuuuu 98

<210> 74

<211> 100

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV16-sgRNA-v2.417-碱基

<400> 74

aagugugacu cuacgcuugu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60

uuaucaacuu gaaaaagugg caccgagucg gugcuuuuuu 100

<210> 75

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV16-sgRNA-BNA-v1.417-碱基

<400> 75

gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 76

<211> 97

<212> RNA

<213> 人工序列

<220>

<223> Synthetic sequence

HPV16-sgRNA-BNA-v11(eleven).417-碱基

<400> 76

gugugacucu cgcuuguuuu agagcuagaa auagcaaguu aaaauaaggc uaguccguua 60

ucaacuugaa aaaguggcac cgagucggug cuuuuuu 97

<210> 77

<211> 4401

<212> DNA

<213> 人工序列

<220>

<223> 合成序列野生型 S. pyogenes Cas9, 修饰的 (替代性)

<220>

<223> 包含DNA和RNA碱基

<220>

<221> modified_base

<222> (1)...(4401)

<223> c = 5-甲基胞苷

<220>

<221> misc_feature

<222> (1)...(4401)

<223> n = 假尿苷

<400> 77

gggagacann ngcnncngac acaacngtgn ncacnagcaa ccncaaacag ccaccanggc 60

cccaaagaag aagcggaagg ncggnancca cggagnccca gcagccgaca agaagnacag 120

cancggccng gacancggca ccaacncngn gggcngggcc gngancaccg acgagnacaa 180

ggngcccagc aagaaannca aggngcnggg caacaccgac cggcacagca ncaagaagaa 240

ccngancgga gcccngcngn ncgacagcgg cgaaacagcc gaggccaccc ggcngaagag 300

aaccgccaga agaaganaca ccagacggaa gaaccgganc ngcnancngc aagagancnn 360

cagcaacgag anggccaagg nggacgacag cnncnnccac agacnggaag agnccnnccn 420

ggnggaagag gacaagaagc acgagagaca ccccancnnc ggcaacancg nggacgaggn 480

ggccnaccac gagaagnacc ccaccancna ccaccngaga aagaaacngg nggacagcac 540

cgacaaggcc gaccngagac ngancnaccn ggcccnggcc cacanganca agnncagagg 600

ccacnnccng ancgagggcg accngaaccc cgacaacagc gacgnggaca agcngnncan 660

ccagcnggng cagaccnaca accagcngnn cgaggaaaac cccancaacg ccagcggcgn 720

ggacgccaag gcnanccngn cngccagacn gagcaagagc agaaggcngg aaaancngan 780

cgcccagcng cccggcgaga agaagaacgg ccngnncggc aaccnganng cccngagccn 840

gggccngacc cccaacnnca agagcaacnn cgaccnggcc gaggangcca aacngcagcn 900

gagcaaggac accnacgacg acgaccngga caaccngcng gcccagancg gcgaccagna 960

cgccgaccng nnccnggccg ccaagaaccn gncngacgcc anccngcnga gcgacanccn 1020

gagagngaac accgaganca ccaaggcccc ccngagcgcc ncnanganca agaganacga 1080

cgagcaccac caggaccnga cccngcngaa agcncncgng cggcagcagc ngccngagaa 1140

gnacaaagaa ancnncnncg accagagcaa gaacggcnac gccggcnaca ncganggcgg 1200

cgcnagccag gaagagnncn acaagnncan caagcccanc cnggaaaaga nggacggcac 1260

cgaggaacng cncgngaagc ngaacagaga ggaccngcng agaaagcaga gaaccnncga 1320

caacggcagc ancccccacc aganccaccn gggagagcng cacgcnancc ngagaaggca 1380

ggaagannnn nacccanncc ngaaggacaa ccgggaaaag ancgagaaga nccngaccnn 1440

caggancccc nacnacgngg gcccccnggc cagaggcaac agcaganncg ccnggangac 1500

cagaaagagc gaggaaacca ncacccccng gaacnncgag gaagnggngg acaagggcgc 1560

cagcgcccag agcnncancg agagaangac aaacnncgan aagaaccngc ccaacgagaa 1620

ggngcngccc aagcacagcc ngcngnacga gnacnncacc gngnacaacg agcngaccaa 1680

agngaaanac gngaccgagg gaangagaaa gcccgccnnc cngagcggcg agcagaaaaa 1740

ggccancgng gaccngcngn ncaagaccaa cagaaaagng accgngaagc agcngaaaga 1800

ggacnacnnc aagaaaancg agngcnncga cnccgnggaa ancnccggcg nggaaganag 1860

anncaacgcc ncccngggca canaccacga ncngcngaaa annancaagg acaaggacnn 1920

ccngganaac gaagagaacg aggacanncn ggaagananc gngcngaccc ngacacngnn 1980

ngaggaccgc gagangancg aggaaaggcn gaaaaccnac gcncaccngn ncgacgacaa 2040

agngangaag cagcngaaga gaaggcggna caccggcngg ggcaggcnga gcagaaagcn 2100

gancaacggc ancagagaca agcagagcgg caagacaanc cnggannncc ngaagnccga 2160

cggcnncgcc aaccggaacn ncangcagcn ganccacgac gacagccnga canncaaaga 2220

ggacanccag aaagcccagg ngnccggcca gggcgacncn cngcacgagc anancgcnaa 2280

ccnggccggc agccccgcna ncaagaaggg canccngcag acagngaagg nggnggacga 2340

gcncgngaaa gngangggca gacacaagcc cgagaacanc gngancgaga nggcnagaga 2400

gaaccagacc acccagaagg gacagaagaa cncccgcgag aggangaaga gaancgaaga 2460

gggcancaaa gagcngggca gccaganccn gaaagaacac cccgnggaaa acacccagcn 2520

gcagaacgag aagcngnacc ngnacnaccn gcagaanggc cggganangn acgnggacca 2580

ggaacnggac ancaacagac ngnccgacna cgangnggac canancgngc cncagagcnn 2640

ncngaaggac gacnccancg anaacaaagn gcngacncgg agcgacaaga acagaggcaa 2700

gagcgacaac gngcccnccg aagaggncgn gaagaagang aagaacnacn ggcgacagcn 2760

gcngaacgcc aagcnganna cccagaggaa gnncganaac cngaccaagg ccgagagagg 2820

cggccngagc gagcnggana aggccggcnn cancaagagg cagcnggngg aaaccagaca 2880

gancacaaag cacgnggcac aganccngga cncccggang aacacnaagn acgacgaaaa 2940

cganaagcng anccgggaag ngaaagngan cacccngaag nccaagcngg ngnccgannn 3000

ccggaaggan nnccagnnnn acaaagngcg cgagancaac aacnaccacc acgcccacga 3060

cgccnaccng aacgccgncg ngggaaccgc ccngancaaa aagnacccna agcnggaaag 3120

cgagnncgng nacggcgacn acaaggngna cgacgngcgg aagangancg ccaagagcga 3180

gcaggaaanc ggcaaggcna ccgccaagna cnncnncnac agcaacanca ngaacnnnnn 3240

caagaccgaa ancacccngg ccaacggcga gancagaaag cgcccncnga ncgagacaaa 3300

cggcgaaacc ggggagancg ngnggganaa gggcagagac nncgccacag ngcgaaaggn 3360

gcngagcang ccccaagnga anancgngaa aaagaccgag gngcagacag gcggcnncag 3420

caaagagncn anccngccca agaggaacag cgacaagcng ancgccagaa agaaggacng 3480

ggaccccaag aagnacggcg gcnncgacag cccnaccgng gccnacncng ngcnggnggn 3540

ggcnaaggng gaaaagggca agnccaagaa acngaagagn gngaaagagc ngcnggggan 3600

caccancang gaaagaagca gcnnngagaa gaacccnanc gacnnncngg aagccaaggg 3660

cnacaaagaa gngaaaaagg accngancan caagcngccn aagnacnccc ngnncgagcn 3720

ggaaaacggc agaaagagaa ngcnggccnc ngccggcgaa cngcagaagg gaaacgagcn 3780

ggcccngccn agcaaanang ngaacnnccn gnaccnggcc ncccacnang agaagcngaa 3840

gggcagcccn gaggacaacg aacagaaaca gcngnnngng gaacagcana agcacnaccn 3900

ggacgaganc ancgagcaga ncagcgagnn cnccaagaga gnganccngg ccgacgccaa 3960

ncnggacaag gngcngncng ccnacaacaa gcacagggac aagccnanca gagagcaggc 4020

cgagaananc anccaccngn ncacccngac aaaccngggc gcnccngccg ccnncaagna 4080

cnnngacacc accancgacc ggaagaggna caccagcacc aaagaggngc nggacgccac 4140

ccnganccac cagagcanca ccggccngna cgagacaaga ancgaccngn cncagcnggg 4200

aggcgacaag agaccngccg ccacnaagaa ggccggacag gccaaaaaga agaagngagc 4260

ncgcnnncnn gcngnccaan nncnannaaa ggnnccnnng nncccnaagn ccaacnacna 4320

aacnggggga nannangaag ggccnngagc ancnggannc ngccnaanaa aaaacannna 4380

nnnncanngc gagcggccgc a 4401

<210> 78

<211> 4485

<212> RNA

<213> 人工序列

<220>

<223> 合成序列野生型S. pyogenes Cas9, 修饰的-2

<220>

<221> misc_feature

<222> (1)...(4485)

<223> n = 5甲氧基尿苷

<400> 78

aggaaanaag agagaaaaga agagnaagaa gaaananaag agccaccang gcccccaaga 60

agaagcggaa ggngggcanc cacggcgngc ccgccgccga caagaagnac agcancggcc 120

nggacancgg caccaacagc gngggcnggg ccgngancac cgacgagnac aaggngccca 180

gcaagaagnn caaggngcng ggcaacaccg accggcacag cancaagaag aaccngancg 240

gcgcccngcn gnncgacagc ggcgagaccg ccgaggccac ccggcngaag cggaccgccc 300

ggcggcggna cacccggcgg aagaaccgga ncngcnaccn gcaggaganc nncagcaacg 360

aganggccaa ggnggacgac agcnncnncc accggcngga ggagagcnnc cnggnggagg 420

aggacaagaa gcacgagcgg caccccancn ncggcaacan cgnggacgag gnggccnacc 480

acgagaagna ccccaccanc naccaccngc ggaagaagcn ggnggacagc accgacaagg 540

ccgaccngcg gcngancnac cnggcccngg cccacangan caagnnccgg ggccacnncc 600

ngancgaggg cgaccngaac cccgacaaca gcgacgngga caagcngnnc anccagcngg 660

ngcagaccna caaccagcng nncgaggaga accccancaa cgccagcggc gnggacgcca 720

aggccanccn gagcgcccgg cngagcaaga gccggcggcn ggagaaccng ancgcccagc 780

ngcccggcga gaagaagaac ggccngnncg gcaaccngan cgcccngagc cngggccnga 840

cccccaacnn caagagcaac nncgaccngg ccgaggacgc caagcngcag cngagcaagg 900

acaccnacga cgacgaccng gacaaccngc nggcccagan cggcgaccag nacgccgacc 960

ngnnccnggc cgccaagaac cngagcgacg ccanccngcn gagcgacanc cngcgggnga 1020

acaccgagan caccaaggcc ccccngagcg ccagcangan caagcggnac gacgagcacc 1080

accaggaccn gacccngcng aaggcccngg ngcggcagca gcngcccgag aagnacaagg 1140

agancnncnn cgaccagagc aagaacggcn acgccggcna cancgacggc ggcgccagcc 1200

aggaggagnn cnacaagnnc ancaagccca nccnggagaa ganggacggc accgaggagc 1260

ngcnggngaa gcngaaccgg gaggaccngc ngcggaagca gcggaccnnc gacaacggca 1320

gcanccccca ccaganccac cngggcgagc ngcacgccan ccngcggcgg caggaggacn 1380

ncnaccccnn ccngaaggac aaccgggaga agancgagaa ganccngacc nnccggancc 1440

ccnacnacgn gggcccccng gcccggggca acagccggnn cgccnggang acccggaaga 1500

gcgaggagac cancaccccc nggaacnncg aggaggnggn ggacaagggc gccagcgccc 1560

agagcnncan cgagcggang accaacnncg acaagaaccn gcccaacgag aaggngcngc 1620

ccaagcacag ccngcngnac gagnacnnca ccgngnacaa cgagcngacc aaggngaagn 1680

acgngaccga gggcangcgg aagcccgccn nccngagcgg cgagcagaag aaggccancg 1740

nggaccngcn gnncaagacc aaccggaagg ngaccgngaa gcagcngaag gaggacnacn 1800

ncaagaagan cgagngcnnc gacagcgngg agancagcgg cgnggaggac cggnncaacg 1860

ccagccnggg caccnaccac gaccngcnga agancancaa ggacaaggac nnccnggaca 1920

acgaggagaa cgaggacanc cnggaggaca ncgngcngac ccngacccng nncgaggacc 1980

gggagangan cgaggagcgg cngaagaccn acgcccaccn gnncgacgac aaggnganga 2040

agcagcngaa gcggcggcgg nacaccggcn ggggccggcn gagccggaag cngancaacg 2100

gcanccggga caagcagagc ggcaagacca nccnggacnn ccngaagagc gacggcnncg 2160

ccaaccggaa cnncangcag cnganccacg acgacagccn gaccnncaag gaggacancc 2220

agaaggccca ggngagcggc cagggcgaca gccngcacga gcacancgcc aaccnggccg 2280

gcagccccgc cancaagaag ggcanccngc agaccgngaa ggnggnggac gagcnggnga 2340

aggnganggg ccggcacaag cccgagaaca ncgngancga ganggcccgg gagaaccaga 2400

ccacccagaa gggccagaag aacagccggg agcggangaa gcggancgag gagggcanca 2460

aggagcnggg cagccaganc cngaaggagc accccgngga gaacacccag cngcagaacg 2520

agaagcngna ccngnacnac cngcagaacg gccgggacan gnacgnggac caggagcngg 2580

acancaaccg gcngagcgac nacgacgngg accacancgn gccccagagc nnccngaagg 2640

acgacagcan cgacaacaag gngcngaccc ggagcgacaa gaaccggggc aagagcgaca 2700

acgngcccag cgaggaggng gngaagaaga ngaagaacna cnggcggcag cngcngaacg 2760

ccaagcngan cacccagcgg aagnncgaca accngaccaa ggccgagcgg ggcggccnga 2820

gcgagcngga caaggccggc nncancaagc ggcagcnggn ggagacccgg cagancacca 2880

agcacgnggc ccaganccng gacagccgga ngaacaccaa gnacgacgag aacgacaagc 2940

nganccggga ggngaaggng ancacccnga agagcaagcn ggngagcgac nnccggaagg 3000

acnnccagnn cnacaaggng cgggaganca acaacnacca ccacgcccac gacgccnacc 3060

ngaacgccgn ggngggcacc gcccnganca agaagnaccc caagcnggag agcgagnncg 3120

ngnacggcga cnacaaggng nacgacgngc ggaagangan cgccaagagc gagcaggaga 3180

ncggcaaggc caccgccaag nacnncnncn acagcaacan cangaacnnc nncaagaccg 3240

agancacccn ggccaacggc gaganccgga agcggccccn gancgagacc aacggcgaga 3300

ccggcgagan cgngngggac aagggccggg acnncgccac cgngcggaag gngcngagca 3360

ngccccaggn gaacancgng aagaagaccg aggngcagac cggcggcnnc agcaaggaga 3420

gcanccngcc caagcggaac agcgacaagc ngancgcccg gaagaaggac ngggacccca 3480

agaagnacgg cggcnncgac agccccaccg nggccnacag cgngcnggng gnggccaagg 3540

nggagaaggg caagagcaag aagcngaaga gcgngaagga gcngcngggc ancaccanca 3600

nggagcggag cagcnncgag aagaacccca ncgacnnccn ggaggccaag ggcnacaagg 3660

aggngaagaa ggaccnganc ancaagcngc ccaagnacag ccngnncgag cnggagaacg 3720

gccggaagcg gangcnggcc agcgccggcg agcngcagaa gggcaacgag cnggcccngc 3780

ccagcaagna cgngaacnnc cngnaccngg ccagccacna cgagaagcng aagggcagcc 3840

ccgaggacaa cgagcagaag cagcngnncg nggagcagca caagcacnac cnggacgaga 3900

ncancgagca gancagcgag nncagcaagc gggnganccn ggccgacgcc aaccnggaca 3960

aggngcngag cgccnacaac aagcaccggg acaagcccan ccgggagcag gccgagaaca 4020

ncanccaccn gnncacccng accaaccngg gcgcccccgc cgccnncaag nacnncgaca 4080

ccaccancga ccggaagcgg nacaccagca ccaaggaggn gcnggacgcc acccngancc 4140

accagagcan caccggccng nacgagaccc ggancgaccn gagccagcng ggcggcgaca 4200

gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaaggcgg 4260

ccgcnnaann aagcngccnn cngcggggcn ngccnncngg ccangcccnn cnncncnccc 4320

nngcaccngn accncnnggn cnnngaanaa agccngagna ggaagaaaaa aaaaaaaaaa 4380

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 4485

<210> 79

<211> 102

<212> DNA

<213> 人工序列

<220>

<223> 合成序列 HPV16向导 RNA LNA E7-14

<220>

<223> 包含DNA和RNA碱基

<220>

<221> modified_base

<222> 1

<223> 硫代磷酸酯键, 锁核酸或桥连核酸

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 8,17

<223> 锁核酸或桥连核酸

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 79

gcaagugtga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 80

<211> 97

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV向导RNA 尿苷枯竭的E7-14

<220>

<221> modified_base

<222> 1

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 2

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 3

<223> am, 硫代磷酸酯键

<220>

<221> modified_base

<222> 94

<223> cm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 95

<223> gm, 硫代磷酸酯键

<220>

<221> modified_base

<222> 96

<223> cm, 硫代磷酸酯键

<400> 80

gcaaguguga cucuacgcuu guugcggagc cggaaacggc aagucgcaau aaggcuaguc 60

cgccaccagc gcgaaagcgc ggcgccgagu cggcgcc 97

<210> 81

<211> 101

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV 向导RNA E6-2

<220>

<221> modified_base

<222> (98)...(100)

<223> um, 硫代磷酸酯键

<400> 81

caacaguuac ugcgacgugg uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60

guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101

<210> 82

<211> 102

<212> RNA

<213> 人工序列

<220>

<223> 合成序列HPV 向导RNA E7-1

<220>

<221> modified_base

<222> (99)...(101)

<223> um, 硫代磷酸酯键

<400> 82

aacccagcug uaaucaugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102

<210> 83

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成序列 具有BNA/LNA的HPV向导RNA E6-1

<220>

<223> 包含DNA和RNA碱基

<220>

<221> modified_base

<222> 1,2,3,4,5,13,14

<223> 锁核酸或桥连核酸

<400> 83

tgcaauguuu caggacccac 20

<210> 84

<211> 1368

<212> PRT

<213> 人工序列

<220>

<223> 合成序列野生型S. pyogenes Cas9蛋白 (UniProt Ref. Q99ZW2)

<400> 84

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1010 1015 1020

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser

1025 1030 1035 1040

Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1045 1050 1055

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile

1060 1065 1070

Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser

1075 1080 1085

Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1090 1095 1100

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile

1105 1110 1115 1120

Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1125 1130 1135

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly

1140 1145 1150

Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile

1155 1160 1165

Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1170 1175 1180

Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1185 1190 1195 1200

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser

1205 1210 1215

Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1220 1225 1230

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1250 1255 1260

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val

1265 1270 1275 1280

Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1285 1290 1295

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu

1300 1305 1310

Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp

1315 1320 1325

Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1330 1335 1340

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile

1345 1350 1355 1360

Asp Leu Ser Gln Leu Gly Gly Asp

1365

187页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种激活p21基因表达的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!