抗病毒治疗剂
阅读说明:本技术 抗病毒治疗剂 (Antiviral therapeutic agent ) 是由 D·D·斯隆恩 S·勒杜 X·C·熊 M·P·豪斯利 于 2018-03-30 设计创作,主要内容包括:本公开提供了用于裂解目标病毒核酸的向导RNA。本公开还提供了用于治疗HPV感染的组合物,所述组合物包含编码Cas核酸内切酶的mRNA以及具有特定序列和修饰的向导RNA,且两种RNA都被纳米粒子包封。在一些实施方式中,向导RNA和编码Cas核酸内切酶的mRNA被包装于脂质纳米粒子中,所述纳米粒子可悬浮于运载体配制物中以供表面或局部递送至受感染的组织。在一些实施例中,向导RNA和/或编码Cas核酸内切酶的mRNA还包含促进RNA递送至并驻留在受感染细胞内的特征,如修饰的核苷酸。(The present disclosure provides guide RNAs for cleaving a target viral nucleic acid. The present disclosure also provides compositions for treating HPV infections, the compositions comprising Cas endonuclease-encoding mRNA and a guide RNA having a specific sequence and modification, and both RNAs being encapsulated by a nanoparticle. In some embodiments, the guide RNA and mRNA encoding the Cas endonuclease are packaged in lipid nanoparticles, which can be suspended in a carrier formulation for topical or local delivery to the affected tissue. In some embodiments, the guide RNA and/or mRNA encoding the Cas endonuclease further comprise features, such as modified nucleotides, that facilitate RNA delivery to and retention within the infected cell.)
关于序列表的声明
与本申请相关的序列表是以文本格式代替纸质复本提供,并且特此以引用的方式并入本说明书中。含有序列表的文本文件的名称是930285_421WO_SEQUENCE_LISTING.txt。所述文本文件是145KB,创建于2018年3月28日,并且以电子方式通过EFS-Web提交。
发明领域
本公开涉及病毒治疗组合物和方法。
背景技术
在世界范围内,病毒感染是引起疾病和死亡的主要原因。例如,子***是由感染某些类型人***瘤病毒(HPV)引起的。有两种HPV类型(16和18)引起70%的子***和癌前子宫颈病变。HPV还与头颈部(口咽)、***、外阴、***和***的癌症相关。根据世界卫生组织(World Health Organization),在2012年,有约270,000名妇女死于子***。在世界范围内,子***是排名第四的最常见的女性癌症,并且在2012年,估计有530,000例新增病例,占所有女性癌症死亡的7.5%。
HPV是***瘤病毒科(Papillomaviridae),即统称为***瘤病毒的DNA病毒家族的一个成员。***瘤病毒在体表组织的基底层中复制。***瘤病毒不具有包膜,意味着病毒的外壳或衣壳未被脂膜覆盖。称为Ll的单一病毒蛋白质形成55-60纳米的衣壳。与大多数无包膜的病毒相同,衣壳具有规则的几何形状并且呈现二十面体对称性。HPV基因组是约8,000个碱基对长度的双链环状DNA分子。它与包装基因组病毒DNA的细胞组蛋白蛋白质一起被包装于Ll壳内。
存在基于Ll外壳蛋白的HPV疫苗。不过,这些疫苗必须在暴露于病毒之前施用。这些疫苗不能治疗HPV感染或HPV相关疾病如癌症,并且尚无已知的HPV感染治愈方法。
另一种具有显著健康影响的病毒是乙型肝炎。据世界卫生组织估计,有2亿5千7百万感染乙型肝炎病毒的人。乙型肝炎病毒(HBV)侵袭肝并且会引起急性和慢性疾病。HBV是带部分双链的DNA病毒,具有约3kbp长度的基因组并且含具有逆转录酶活性的DNA聚合酶的基因(Seeger和Mason,《病毒学(Virology)》479-480:672-686,2015)。所述DNA在进入目标细胞后,在细胞核中转化成共价闭合环状DNA(cccDNA),接着形成病毒mRNA合成的模板(Seeger和Mason,《病毒学》479-480:672-686,2015)。
仍需要预防和治疗病毒感染如HPV或HBV感染的治疗方法。
发明内容
在某些方面,本公开提供了靶向病毒核酸,如HPV16、HPV18或HBV核酸的向导RNA。在其它方面,本公开提供一种组合物,其包括Cas核酸内切酶以及一个或多个靶向病毒核酸的向导RNA,或编码此类Cas核酸内切酶和/或向导RNA的核酸。在一些实施方式中,本公开提供一种用于治疗病毒感染如HBV或HPV感染的组合物,其包括(a)编码Cas核酸内切酶的mRNA以及(b)一个或多个向导RNA。所述mRNA和向导RNA可以包含特定序列和修饰,并且可以被纳米粒子包封。
在一些实施方式中,所述组合物包含一个或多个对病毒目标具有特异性的向导RNA,所述病毒目标如埃-巴二氏病毒(Epstein-Barr virus,EBV)、人***瘤病毒(HPV)、卡波西氏肉瘤病毒(Kaposi sarcoma virus,KSHV)、乙型肝炎病毒(HBV)、单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、水痘带状疱疹病毒(VZV)、巨细胞病毒(CMV)、人疱疹病毒-6(HHV-6)或人疱疹病毒-7(HHV-7)。
在一些实施方式中,所述组合物包含编码修饰的Cas核酸内切酶的mRNA,以及使Cas核酸内切酶靶向HPV基因组的一个或多个向导RNA,所述HPV基因组包含以游离形式存在和/或整合至宿主基因组DNA中的全长和部分片段。在一个实施方式中,向导RNA包括与HPV16或HPV18基因组内的位点互补的靶向区域,所述位点没有出现在人类基因组中。
在另一个实施方式中,所述组合物包含编码修饰的Cas核酸内切酶的mRNA以及使Cas核酸内切酶靶向HBV基因组的一个或多个向导RNA。
在一些实施方式中,向导RNA可以包含促进所述RNA递送至并驻留于受感染细胞内的特征,如修饰的核苷酸。在一些实施方式中,RNA中的修饰的核苷酸可用于改善RNA稳定性,降低免疫原性或改善核酸内切酶活性的特异性。例如,向导RNA可以包含能防止核酸外切酶消化的特征,如在核糖环上的一个或多个2'-O-甲基、核苷酸之间的一个或多个硫代磷酸酯键或两者,并且特别是位于向导RNA的5'和3'末端附近的这些特征。在一些实施方式中,向导RNA可任选地在例如靶向区域内包含一个或多个锁核酸、桥连核酸或构象限制性核酸,其可以稳定与病毒目标的结合,减少与非病毒目标(例如人DNA)的结合,或增强核酸内切酶活性的特异性。在另外的实施方式中,相对于野生型Cas9,所述Cas核酸内切酶可以包含突变,这些突变可以增强特异性并减少脱靶活性(例如通过使向导RNA与位于目标DNA目标以外的区域的相互作用不稳定)。在又另外的实施方式中,所述RNA可以包含能使患者的免疫应答降至最低的修饰,如假尿苷或5-甲基-胞嘧啶。
在一些实施方式中,所述mRNA优选地编码可编程核酸酶,如Cas核酸内切酶或修饰的Cas核酸内切酶。在某些实施方式中,所述mRNA编码修饰的Cas核酸内切酶,相对于野生型形式,其被修饰成具有降低的免疫原性。相对于野生型,所编码的修饰的核酸酶可以在T细胞表位内包含一个或多个取代。修饰治疗剂以避免免疫应答尚面临挑战,尤其是当治疗性蛋白质以mRNA的方式递送的时候。通过使用修饰的核苷酸序列,当所述mRNA翻译成蛋白质时,相对于野生型,所得蛋白质可以具有不会触发抗药物抗体(ADA)反应的不同的或修饰的表位。本公开包含修饰的Cas核酸内切酶蛋白质序列,相对于野生型Cas核酸内切酶,其中一个或多个预测的T细胞表位具有避免或降低免疫应答的取代。具有修饰的T细胞表位的修饰的Cas核酸内切酶可以呈编码于DNA载体中的形式、呈蛋白质形式(例如以修饰的Cas核酸内切酶与抗病毒向导RNA复合的活性核糖核蛋白(RNP)形式)或呈将在目标细胞内进行翻译的mRNA形式递送至细胞。在一些实施方式中,所述核酸酶是以mRNA形式,例如连同一个或多个向导RNA一起递送。
在一个实施方式中,编码Cas9的mRNA和向导RNA被包装于脂质纳米粒子(LNP)、固体纳米粒子或脂质体中。在此类实施方式中,包封RNA的纳米粒子可被配制成用于表面、粘膜或局部递送至受感染的组织,从而避免全身递送和循环,由此使药物暴露、脱靶活性以及Cas核酸内切酶的免疫原性降到最低。在一个实施方式中,RNA被包装于脂质纳米粒子中,所述脂质纳米粒子包含例如阳离子性脂质,其平衡磷酸酯主链的电荷并且促进渗透穿过组织并进入细胞中以及在细胞内释放RNA。包封编码Cas-9的mRNA以及向导RNA的脂质纳米粒子可进一步提供于表面用配制物中,所述表面用配制物含有适合凝胶或悬浮液,如水性悬浮液,其可以包含组织驻留增强剂或增稠剂,如羟乙基纤维素或羧甲基纤维素。本文所预期的LNP配制物可以包含一种或多种增强LNP稳定性的赋形剂,如蔗糖或甘露糖醇。并且在制备供表面递送的如本文所描述的LNP配制物的情况下,所述配制物可以包含增强组织渗透的赋形剂,如月桂基硫酸钠、乙醇、二乙二醇单***(Transcutol)、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮。在某些实施方式中,根据本说明书的LNP配制物可以用如微针阵列之类装置施用,以增进RNA递送至基底上皮。
在
具体实施方式
中,本文中所描述的LNP配制物通过表面或局部施加至感染部位,如与HPV感染相关的高级别癌前病变。在此类实施方式中,由LNP包封的向导RNA被释放于细胞内,并且由LNP包封的mRNA被释放并由细胞核糖体翻译产生Cas核酸内切酶。用于本发明组合物和配制物情形中的Cas9核酸内切酶可以包含连接子序列以及在N末端和/或C末端处被设计用于最佳核定位的一个或多个核定位序列(NLS)。在翻译后,Cas核酸内切酶与所提供的一个或多个向导RNA复合形成活性RNP。RNP运送至细胞核并通过向导RNA的互补部分与病毒基因组内的目标之间的序列特异性相互作用而结合至病毒基因组。在结合至病毒目标后,Cas核酸内切酶将病毒基因组裂解。由此得到的病毒DNA片段可以通过细胞途径降解或修复,由此清除或破坏感染。
在一个方面,本公开提供一种组合物,其包含编码Cas核酸内切酶的mRNA;向导RNA,其包括如SEQ ID NO.:1-38、71-76和79-83中任一个所示的核酸序列或其具有修饰的碱基的形式;多个包括阳离子性脂质的纳米粒子(即,“脂质纳米粒子”或“LNP”),并且其包封所述mRNA和所述向导RNA;以及运载体配制物。在具体实施方式中,所述运载体配制物可以包含使包封mRNA和向导RNA的LNP稳定的一种或多种成分。在另外的实施方式中,所述运载体配制物可以包含使包封mRNA和向导RNA的LNP稳定的一种或多种成分,以及通过促进组织驻留和/或组织渗透来增进表面或局部递送的一种或多种成分。脂质纳米粒子中使用的阳离子性脂质可以包含1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)或N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。在某些实施方式中,所述多个LNP是分散于运载体配制物内的固体脂质纳米粒子,并且所述运载体配制物包括运载体液体、油或凝胶。包含在本文所描述的组合物中的LNP可以被聚乙二醇化。在另一个实施方式中,包封于LNP中的mRNA包括SEQ ID NO.:55、56、57或58;包封于LNP中的向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35或37;并且所述多个LNP分散于由运载体配制物所提供的运载体液体、油或凝胶内。
在一些实施方式中,Cas核酸内切酶可以是Cas9,相对于野生型Cas9,其任选地包含至少一种选自以下组的氨基酸的变化:R780、K810、K848、K855、H982、K1003及R1060。例如,Cas9可以包含K848A、K1003A和R1060A。在某些实施方式中,编码Cas9的mRNA包括SEQ IDNO.:55、56、57、58、59、60、67、68、69、70、77或78。在一些实施方式中,mRNA的编码序列包括多个5-甲基胞苷。mRNA的编码序列可以包含多个假尿苷或5甲氧基-尿苷。
在一些实施方式中,所述组合物包含Cas核酸内切酶、或编码所述Cas核酸内切酶的多核苷酸,其相对于SEQ ID NO.:63在以下内具有一个或多个(例如在1与25个之间)取代:氨基酸149-165;氨基酸235-249;氨基酸566-580;氨基酸721-735;氨基酸880-894;氨基酸952-966;或氨基酸1312-1326。在一些实施方式中,相对于SEQ ID NO.:63,所述一个或多个取代在选自以下的位置处:R152、I154、A157、F238、N240、A243、F569、K571、C574、W883、Q885、N888、V955、L1315及N1317,并且其各自被取代成以下之一:K、V、S、L、Q、R、E、T或N。
在一些实施方式中,Cas核酸内切酶可以包含至少一种核定位信号。
在一些实施方式中,向导RNA包括多个(例如在约20%与100%之间)修饰的碱基,其各自选自以下组:2'-O-甲基腺苷(am);2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在某些实施方式中,向导RNA在向导RNA的5'端和3'端各自的十个末端核苷酸之间包括一个至九个硫代磷酸酯键。向导RNA可以包含至少一个桥连核酸(BNA)、锁核酸(LNA)和/或构象限制性核苷酸(CRN)。在某些实施方式中,向导RNA包括靶向区域,其包含如SEQ ID NO.:39或SEQ ID NO.:40中所示的核酸序列。
在一些实施方式中,向导RNA是SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35及37之一,并且任选地包含多个修饰的碱基,其各自选自以下组:2'-O-甲基腺苷(am);2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在一些实施方式中,向导RNA中约20%至100%的核苷酸在核糖上包括2'-O-甲基。
在一些实施方式中,向导RNA是SEQ ID NO.:41、43和45之一,任选地其中约20%至100%的核苷酸在核糖上具有修饰,如甲基或2'-O-甲基,并且优选地包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基腺苷(am);2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在一个实施方式中,向导RNA包括选自由SEQ ID NO.:41、43、45组成的组的向导RNA,此外,其中向导RNA包括多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。
本文还提供了治疗人***瘤病毒(HPV)感染的方法。此类方法的实施方式包含向有需要患者的感染部位施用有效量的本文所描述的组合物。所述患者可能患有HPV感染或已被诊断患有HPV阳性癌前低级别或高级别病变、HPV阳性原位鳞状细胞癌或HPV阳性侵袭性癌症。
在某些方面,本发明提供一种用于治疗病毒感染的如本文所公开的组合物。所述组合物优选地包含对选自以下组的病毒中的病毒目标具有特异性的一个或多个向导RNA:埃-巴二氏病毒(EBV)、人***瘤病毒(HPV)、卡波西氏肉瘤病毒(KSHV)、乙型肝炎病毒(HBV)、单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、水痘带状疱疹病毒(VZV)、巨细胞病毒(CMV)、人疱疹病毒-6(HHV-6)、人疱疹病毒-7(HHV-7)以及人多瘤病毒(BK、JC或默克尔细胞(Merkel cell),MCV)。在一些实施方式中,所述一个或多个向导RNA对EBV、HPV或HBV具有特异性。
在一个特定实施方式中,Cas核酸内切酶包括如SEQ ID NO.:62中所示的氨基酸序列,或编码Cas核酸内切酶的多核苷酸包括SEQ ID NO.:55-60和67-78之一。在一个实施方式中,所述组合物包含呈mRNA形式的编码Cas核酸内切酶的多核苷酸。向导RNA可靶向HPV并且包含例如选自以下组的向导RNA:SEQ ID NO.:1-38和71-76。优选地,向导RNA包括选自以下组的向导RNA:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35及37,并且包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在某些实施方式中,向导RNA包括SEQ ID NO.:2、3、4、6、7、8、9、10、11、12、13、14、15、16、18、20、22、24、26、28、30、32、34、36、38、71、72、73、74、75或76。优选地,Cas核酸内切酶、或编码Cas核酸内切酶的多核苷酸被包装于脂质体或脂质纳米粒子中。例如,在一些实施方式中,所述组合物包括包覆于LNP或脂质体中的呈活性RNP形式的Cas核酸内切酶,或所述组合物包含包封于固体脂质纳米粒子中的呈mRNA形式的多核苷酸。在某些实施方式中,相对于SEQ ID NO.:63,所述一个或多个取代选自R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q。任选地,相对于SEQ ID NO.:63,所述取代包含R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q中的六个至十五个。
在另一个实施方式中,根据本说明书的组合物包含编码Cas核酸内切酶的mRNA;具有与HPV基因组中的目标互补的部分的向导RNA,所述向导RNA包括选自以下清单的向导RNA:SEQ ID NO.:1-38、71-76和79-83,其任选地具有修饰的碱基;多个固体脂质纳米粒子(LNP),其包括阳离子性脂质并包封mRNA和向导RNA;以及运载体配制物。在某些此类实施方式中,所述运载体配制物可以包含使脂质纳米粒子稳定,通过促进组织驻留来增进表面或局部递送、和/或通过促进组织渗透来增进表面或局部递送的一种或多种成分。向导RNA可以是以下之一:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75及76,并且可以包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。任选地,Cas核酸内切酶是Cas9。优选地,向导RNA包含多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。mRNA的编码序列可以包含多个假尿苷或5甲氧基-尿苷。向导RNA在向导RNA的5'端和3'端各自的十个末端核苷酸之间包含一个或多个硫代磷酸酯键。
在具体实施方式中,所述载体包含一种或多种选自以下的赋形剂:羟乙基纤维素、羧甲基纤维素、蔗糖、甘露糖醇、月桂基硫酸钠、乙醇、二乙二醇单***、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮。
在一些实施方式中,相对于野生型Cas9,Cas9包含在一个与七个之间的选自以下组的氨基酸的变化:R780、K810、K848、K855、H982、K1003、R1060。在某些实施方式中,向导RNA包括至少一个桥连核酸(BNA)、锁核酸(LNA)和/或构象限制性核苷酸(CRN)。任选地,向导RNA中至少约20%的核苷酸在核糖上包括2'-O-甲基。LNP可以被聚乙二醇化。Cas9可以包含K848A、K1003A和R1060A。阳离子性脂质可以包含例如1,2-二油酰基-sn-甘油-3磷酸乙醇胺(DOPE)或N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。任选地,mRNA包括选自以下组的mRNA:SEQ ID NO.:55、56、57和58,并且向导RNA包括选自以下组的向导RNA:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75及76,优选地具有多个(例如20%至100%)修饰的碱基。
本文所描述的组合物的实施方式可用于治疗病毒感染。在此类实施方式中,所述组合物包含相对于SEQ ID NO.:63在选自以下组的氨基酸内具有一个至二十五个取代的Cas核酸内切酶、或编码所述Cas核酸内切酶的多核苷酸:氨基酸149-165;氨基酸235-249;氨基酸566-580;氨基酸721-735;氨基酸880-894;氨基酸952-966;以及氨基酸1312-1326;以及对选自由EBV、HPV和HBV组成的组的病毒中的病毒目标具有特异性的一个或多个向导RNA。优选地,所述组合物包括包封于脂质纳米粒子中的呈mRNA形式的多核苷酸。相对于SEQID NO.:63,所述取代可在选自以下的位置处:R152、I154、A157、F238、N240、A243、F569、K571、C574、W883、Q885、N888、V955、L1315及N1317,并且其各自任选地被取代成以下之一:K、V、S、L、Q、R、E、T及N。在一些实施方式中,Cas核酸内切酶包括至少一种核定位信号。Cas核酸内切酶可以包含SEQ ID NO.:62,或编码所述Cas核酸内切酶的多核苷酸可以包含选自以下组的多核苷酸:SEQ ID NO.:55、56、57、58及61。优选地,所述组合物包含编码Cas核酸内切酶的呈mRNA形式的多核苷酸。
在一个实施方式中,向导RNA靶向HPV。向导RNA可以包含选自以下组的向导RNA:SEQ ID NO.:1-38、71-76及79-83,其任选地具有约20%至100%的修饰的碱基。在一些实施方式中,向导RNA包括选自以下组的向导RNA:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75及76,其任选地包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。在某些实施方式中,向导RNA包含选自以下组的向导RNA:SEQ ID NO.:2、3、4、6、7、8、9、10、11、12、13、14、15、16、18、20、22、24、26、28、30、32、34、36、38、71-73及79-83。在Cas9中,相对于SEQ ID NO.:63,所述取代可以包含R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q。优选地,相对于SEQ IDNO.:63,所述取代包含R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q中的至少六个。
附图简要说明
图1显示组合物101,其包含编码Cas核酸内切酶的mRNA 113和向导RNA 121。向导RNA 121包括靶向区域127,所述靶向区域与病毒基因组中的目标核酸互补。一个或多个纳米粒子105(其包含阳离子性脂质107)包封mRNA 113和向导RNA 121。纳米粒子105任选地被运载体配制物135,如水、水溶液或凝胶运载。运载体配制物135任选地包含一种或多种赋形剂136。
图2显示根据某些实施方式的mRNA 113。mRNA 113包含5'帽205、5'非翻译区(UTR)211、编码Cas核酸内切酶的开放阅读框架(ORF)215、3'UTR 221及多聚A尾227(例如120个腺苷核苷酸)。
图3显示核糖核蛋白(“RNP”),包括与向导RNA 121复合的Cas核酸内切酶307,显示出靶向区域127。
图4显示可用于包封本公开的核酸分子(例如mRNA和向导RNA)的脂质体401。
图5绘示治疗HPV感染的方法501。
图6是HPV基因组图谱。
图7显示体外CRISPR核酸内切酶分析的结果。上图显示如何使用CRISPR介导的裂解***DNA片段的概念图。下图显示通过用PCR检测***的DNA片段来检测CRISPR介导的裂解。A=HPV向导RNA 1.1.1(SEQ ID NO.:2);B=HPV向导RNA E6-2(SEQ ID NO.:81);C=HPV向导RNA E7-1(SEQ ID NO.:82)。
图8A和8B显示体外分析的结果,显示CRISPR/Cas9组合物可以减少病毒DNA并杀灭病毒细胞。(A)相较于被提供非特异性向导RNA的细胞,在被提供Cas9 mRNA和HPV16靶向性向导RNA的细胞中的病毒DNA水平较低。(B)相较于被提供非特异性向导RNA的HPV16+细胞,被提供Cas9 mRNA和HPV16靶向性向导RNA的HPV16+细胞中的细胞死亡较多(左图)。细胞死亡在HPV16-293细胞中明显较低,且在被提供HPV16靶向性向导RNA的细胞与被提供非特异性向导RNA的细胞之间比较类似(右图)。
图9显示体外分析的结果,显示CRISPR/Cas9可用于杀灭HPV16+癌细胞。相较于接受非特异性向导RNA的细胞,对接受Cas9 mRNA和HPV16靶向性向导RNA的细胞的细胞毒性较高。细胞杀灭倾向于随治疗后天数而增加(左图)且随着Cas9 mRNA的量增加(右图)而增加。
图10绘示制备用于治疗HPV感染的药剂的方法1001。
图11绘示基于GUIDE-Seq技术验证所述组合物的特异性的策略(参见Tsai等人,《自然·生物技术(Nature Biotechnology)》33:187-197,2015)。
图12显示所检测到的HPV16靶向性向导RNA在不同剂量时靶向HPV16基因组部分(SEQ ID NO.:64和65)的特异性。
图13显示与HPV16靶向性向导RNA联合施用的Cas核酸内切酶的体外DNA裂解效率的测量结果,所述HPV16靶向性向导RNA对应于HPV16向导RNA 1.1.1(A,圆圈)(SEQ ID NO.:2)、1.1.3(B,正方形)(SEQ ID NO.:4)及E6-1 BNA/LNA(C,菱形)(SEQ ID NO.:83)。
图14显示HPV向导RNA的体外裂解特异性,所述HPV向导RNA对应于HPV16向导RNA1.1.1(A)(SEQ ID NO.:2)、1.1.3(B)(SEQ ID NO.:4)及E6-1 BNA/LNA(C)(SEQ ID NO.:83)。
图15显示mRNA-LNP的成功组织渗透,其中所述mRNA编码绿色荧光蛋白(GFP)。
图16显示例示性Cas9核苷酸(mRNA)序列。对于SEQ ID NO.:54-60和67-70,使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。对于SEQ ID NO.:77,使用以下关键词示出了序列特征:在核苷酸之前的“m”表示2'-O-甲基RNA碱基修饰;在核苷酸之后的“*”表示硫代磷酸酯键主链修饰;在核苷酸之前的“+”表示锁核酸或桥连核酸;“Y”表示假尿苷;“m5c”表示5-甲基胞嘧啶。对于SEQ ID NO.:78,使用以下关键词示出了序列特征:O=5-甲氧基尿苷。
图17显示例示性Cas9蛋白质序列。使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。
图18显示用于靶向HPV16的例示性向导RNA序列。对于SEQ ID NO.:1-30和71-76,使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。对于SEQ ID NO.:79-83,使用以下关键词示出了序列特征:在核苷酸之前的“m”表示2'-O-甲基RNA碱基修饰;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸。
图19显示用于靶向HPV18的例示性向导RNA序列。使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。
图20显示用于靶向HBV的例示性向导RNA序列。使用以下关键词示出了序列特征:cm=2'-O-甲基胞苷;gm=2'-O-甲基鸟苷;um=2'-O-甲基尿苷;am=2'-O-甲基腺苷;m5c=5-甲基胞苷;p=假尿苷;n=任何核苷酸;n*=硫代磷酸酯键;+n=锁核酸或桥连核酸;(mo5u)=5甲氧基尿苷。
图21显示靶向EBV的向导RNA在EBV基因组内的例示性目标序列。
图22显示例示性目标序列。使用以下关键词示出了序列特征:n=任何核苷酸。
图23显示Cas9 mRNA+HPV16 E7向导RNA组合物的特异性。
图24A-24C显示利用构象限制性核苷酸(CRN)修饰的HPV16 E7 gRNA(SEQ ID NO.:79)增强Cas9特异性。
具体实施方式
在某些方面,本公开提供了与病毒核酸,如HPV或HBV核酸中的目标互补的向导RNA序列。在一些实施方式中,向导RNA包括各种修饰,例如2'-O-甲基修饰的核苷酸、锁核苷酸或桥连核苷酸、或在两个核苷酸之间的硫代磷酸酯键。在一些实施方式中,所述向导RNA可以与Cas核酸内切酶(例如Cas9)一起使用以裂解目标核酸。在一些实施方式中,向导RNA是以组合物形式递送至细胞或组织中,所述组合物还包括编码Cas核酸内切酶的mRNA分子。在一些实施方式中,向导RNA是作为核糖核蛋白(RNP)复合物的一部分被递送至细胞或组织中。
在某些方面,本公开提供一种组合物,其包括Cas核酸内切酶以及一个或多个靶向病毒核酸的向导RNA,或编码此类Cas核酸内切酶和/或向导RNA的核酸。在一些实施方式中,本公开提供一种用于治疗病毒感染如HBV或HPV感染的组合物,其包括(a)编码Cas核酸内切酶的mRNA以及(b)一个或多个向导RNA。
在某些方面,本公开提供了预防或治疗病毒感染的方法,其包括施用包括如本文中所描述的向导RNA的组合物。
术语表
在更加详细地阐述本公开之前,提供本文要使用的某些术语的定义可能有助于理解本公开。如本文所使用,某些条目具有以下定义的含义。除非另外定义,否则本文所使用的所有技术和科学术语具有与本发明所属领域的一般技术人员通常所了解相同的含义。
除非上下文另外规定,否则在本说明书和权利要求书通篇,词语“包括(comprise)”和其变化形式,如“包括(comprises)”和“包括(comprising)”,应解释为开放性、包涵性含义,即“包含但不限于”。“由……组成”应意思指不包括超过痕量成分的本文所公开的其它成分和实质方法步骤。术语“基本上由……组成”将权利要求的范围局限于指定材料或步骤,或局限于不会实质上影响所要求的发明的基本特征的材料或步骤。例如,主要由如本文所定义的成分组成的组合物并不排除由分离和纯化方法得到的痕量污染物,以及药学上可接受的运载体,如磷酸盐缓冲生理盐水、防腐剂等。类似地,当蛋白质包含构成所述蛋白质至多20%的长度并且大体上不会影响所述蛋白质的活性(例如使所述蛋白质的活性改变不超过50%)的额外氨基酸时,所述蛋白质主要由特定氨基酸序列组成。由这些连接词分别定义的实施方式在本公开的范围内。
本说明书通篇提到的“一个实施方式(one embodiment/an embodiment)”意味着,所描述的与实施方式有关的特定特征、结构或特性包含在至少一个本发明的实施方式中。因此,在本说明书通篇不同位置中出现的短语“在一个实施方式中(in one embodiment/inan embodiment)”未必都是指同一个实施方式。此外,所述特定特征、结构或特性也可以通过任何适合方式组合于一个或多个实施方式中。
除非上下文另外明确规定,否则如本说明书和权利要求书中所使用,单数形式“一个(种)(a/an)”和“所述”包含多个(种)指代物。例如,术语“细胞”包含多个细胞,包含其混合物。类似地,除非上下文另外明确规定,否则如本文中所描述的“组合物”在治疗或制备药剂中的用途涵盖使用一种或多种本发明的组合物进行此类治疗或制备。
使用替代选择(例如“或”)应理解为意思指替代选择之一或替代选择的任何组合。例如,“核酸分子或肽”是指所述核酸分子或所述肽,或其两者。
“可选的”或“任选地”意思指随后描述的事件或情形可能发生或可能不发生,并且所述描述包含所述事件或情形发生的情况以及所述事件或情形不发生的情况。
如本文所使用,当描述一个序列时,“多个”意思指在至少两个与所有可能数量之间。为了说明,SEQ ID NO.:1是102个核苷酸长并且包含18个胞嘧啶。陈述SEQ ID NO.:1中的多个碱基被修饰意味着在2个与102个之间的碱基被修饰。陈述SEQ ID NO.:1含有多个5-甲基-胞嘧啶修饰意味着在2个与18个之间的胞嘧啶具有5’甲基。
如本文所使用,“约”和“近似地”一般是指根据测量的性质或精确度,所测量数值的可接受程度的误差。典型的例示性误差程度可在给定值或值范围的20%、10%或5%范围内。或者,且特别是在生物系统中,术语“约”和“近似地”可指在一个数量级范围内,也可能指在给定值的5倍或2倍范围内的值。当未明确陈述时,术语“约”和“近似地”意思指等于一值,或在所述值的20%范围内。
如本文所使用,数值量精确至所报导的有效数字个数所反映的程度。例如,值0.1应理解为意思指0.05至0.14。作为另一实例,值0.1至0.2的区间包含自0.05至0.24的范围。因此,自0.1mg/mL至2mg/mL的浓度意思指自0.05mg/mL至2.4mg/mL的浓度范围。
在本说明书中,除非另外指明,否则本文所提供的任何浓度范围、百分比范围、比率范围或整数范围应理解为包含所述范围内的任何整数值并且适当时包含其分数(如整数的十分之一和百分之一)。
如本文所使用,术语“肽”、“多肽”和“蛋白质”可互换使用,并且一般是指通过肽(酰胺)键连接的氨基酸的聚合物。其可具有任何长度并且可以是线性、分支或环状的。氨基酸可以是天然存在的、非天然存在的或可以是改变的氨基酸。这一术语还可以包含多条多肽链组装成复合物。这一术语还包含天然的或人工改变的氨基酸聚合物。此类改变包含二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其它处理或改变。这一定义还包括例如含一个或两个或更多个氨基酸类似物(例如含非天然存在的氨基酸)的多肽、类肽化合物(例如类肽)及本领域中已知的其它改变。
如本文所使用,术语“功能等效的肽”是指可在结构(序列)上不同但与原始肽相同或类似的肽。功能等效的蛋白质或肽可以通过应用重组DNA技术产生,在重组DNA技术中,可以基于被改变的氨基酸特性考虑,对蛋白质结构的变化进行工程改造。本领域的技术人员可通过应用诱变技术引入所设计的变化。
“信号肽”,又称为“信号序列”、“前导序列”、“前导肽”、“定位信号”或“定位序列”,是存在去往分泌路径的新合成蛋白质的N末端处的短肽(通常是15-30个氨基酸长度)。信号肽典型地包括由在N末端处带正电的亲水性氨基酸、具有5-15个残基的中心疏水性域以及具有信号肽酶裂解位点的C末端区域形成的短链段。在真核生物中,信号肽促使新合成的蛋白质易位至内质网中,在内质网中,其被信号肽酶裂解,产生成熟蛋白质,所述成熟蛋白质接着行进至其适当目的地。
如本文所使用,“核酸”或“核酸分子”是指脱氧核糖核酸(DNA)、核糖核酸(RNA)、寡核苷酸、由例如聚合酶链反应(PCR)或由体外翻译产生的片段,以及通过连接、断裂、核酸内切酶作用或核酸外切酶作用中的任一种产生的片段。在某些实施方式中,本公开的核酸是通过PCR产生的。核酸可以由单体构成,所述单体是天然存在的核苷酸(如脱氧核糖核苷酸和核糖核苷酸)、天然存在的核苷酸的类似物(例如天然存在的核苷酸的α-对映异构形式)或两者的组合。修饰的核苷酸可以具有“修饰”或被“修饰”,其中所述核苷酸例如因糖部分(例如2'-O-甲基化)、嘧啶或嘌呤碱基部分(例如甲基化)或核苷酸之间的键联(例如硫代磷酸酯键联)的替代或修饰而不同于野生型或原始或比较核苷酸分子。核酸单体可通过磷酸二酯键或此类键联的类似物连接。磷酸二酯键联的类似物包含硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、苯胺硫代磷酸酯、苯胺磷酸酯、氨基磷酸酯等。核酸分子可以是单链或双链的。
术语“基因”意思指多肽制造中所涉及的DNA区段;其包含在编码区之前和之后的区域“前导序列和尾随序列”,以及在个别编码区段(外显子)之间的***序列(内含子)。
术语“分离”意思指将所述材料从其原始环境(例如,如果其是天然存在的,则是天然环境)移出。例如,活动物中存在的天然存在的核酸或多肽不是分离的,但与天然系统中的一些或全部共存材料分开的所述核酸或多肽是分离的。此类核酸可以作为载体的一部分和/或此类核酸或多肽可以是组合物(例如细胞裂解产物)的一部分,并且仍然是分离的,因为此类载体或组合物不是所述核酸或多肽的天然环境的一部分。
如本文所使用,术语“重组”是指通过引入外源核酸分子对细胞、微生物、核酸分子或载体进行修饰,或是指将细胞或微生物改变成使得内源性核酸分子或基因的表达受控制、失调或组成性表达,其中此类改变或修饰可以通过基因工程改造引入。基因改变可包含例如将下列引入细胞遗传物质的修饰:编码一种或多种蛋白质或酶的核酸分子(其可以包含表达控制元件,如启动子),或其它的核酸分子添加、缺失、取代,或其它功能性破坏或添加。
如本文所使用,“突变”是指核酸分子或多肽分子序列分别相较于参考或野生型核酸分子或多肽分子的改变。突变可以引起序列的若干不同类型变化,包含核苷酸或氨基酸的取代、***或缺失。
如本文所使用,“保守突变”或“保守取代”是指一个氨基酸被具有类似特性的另一个氨基酸取代。例示性保守取代是本领域中众所周知的(参见例如Lehninger,《生物化学(Biochemistry)》,第2版;Worth Publishers,Inc.,纽约州纽约(NY,NY),第71-77页,1975;Lewin,《基因IV(Genes IV)》,Oxford University Press,NY and Cell Press,马萨诸塞州剑桥(Cambridge,MA),第8页,1990)。
如本文所使用,“序列同一性”或“同一性百分比”是指一个序列中与另一个参考多核苷酸或多肽序列中的核酸或氨基酸残基一致的核酸或氨基酸残基的百分比(即,同一性%=一致位置的数量/位置总数×100),其中考虑空位的数量以及使两个或更多个序列最佳对准而需要引入的每一空位的长度。序列同一性值百分比可根据Altschul等人(1997),“带空位的BLAST和PSI-BLAST:新一代蛋白质数据库检索程序(Gapped BLAST andPSI-BLAST:a new generation of protein database search programs)”,《核酸研究(Nucleic Acids Res.)》25:3389-3402所定义,使用NCBI BLAST2.0软件产生,其中参数集设置成默认值。
在本公开通篇阐述了其它定义。
向导RNA分子
如本文所使用,“向导RNA”是指包含反式作用RNA(tracrRNA)和crispr RNA(crRNA)两种,其与核酸内切酶一起用于形成活性核糖核蛋白(RNP),或是指单分子形式,称为单向导RNA或sgRNA。如本文所使用,“核糖核蛋白或RNP”是指由向导RNA与Cas核酸内切酶缔合形成的CRISPR/Cas蛋白质复合物。RNP可在体内由向导RNA与核酸内切酶天然缔合而形成,或其可在体外组装,并使用电穿孔或转染技术直接递送至细胞中。
在一个实施方式中,向导RNA是以单向导RNA形式存在。
在一个实施方式中,向导RNA包含一个或多个呈修饰的核苷酸形式的修饰或对典型磷酸酯主链键的修饰。
在一些实施方式中,向导RNA包括与病毒基因组内的位点互补的靶向区域或靶向部分,所述位点没有出现在人类基因组中。在一个实施方式中,向导RNA包含与HPV基因组内的目标特异性杂交的靶向区域。
在一些实施方式中,向导RNA可以包含促进所述RNA递送至并驻留于受感染细胞内的特征,如修饰的核苷酸。在一些实施方式中,RNA中的修饰的核苷酸可用于改善RNA稳定性,降低免疫原性或改善核酸内切酶活性的特异性。例如,向导RNA可以包含如在核糖环上的一个或多个2'-O-甲基、核苷酸之间的一个或多个硫代磷酸酯键或两者等特征。在一些实施方式中,此类修饰可以位于向导RNA的5'和3'末端附近,由此可以防止被核酸外切酶消化。在一些实施方式中,向导RNA可任选地在例如靶向区域内包含一个或多个锁核酸、桥连核酸或构象限制性核酸,其可以使与病毒目标的结合稳定,减少与非病毒目标(例如人DNA)的结合,或增强核酸内切酶活性的特异性。在又另外的实施方式中,向导RNA可以包含能使患者的免疫应答降至最低的修饰,如假尿苷或5-甲基-胞嘧啶。
在一个实施方式中,向导RNA包括多个(例如在约20%与100%之间)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(“cm”);2'-O-甲基鸟苷(“gm”);2'-O-甲基尿苷(“um”);2'-O-甲基假尿苷(“fm”);以及2'-O-甲基腺苷(“am”)。在一个实施方式中,向导RNA在向导RNA的5'端和3'端各自的十个末端核苷酸之间包括一个至九个硫代磷酸酯键。在另一实施方式中,向导RNA可以包含至少一个桥连核酸(BNA)、锁核酸(LNA)和/或构象限制性核苷酸(CRN)。
图3显示包含向导RNA 121的RNP 301,显示出靶向区域127。对于递送编码Cas9的mRNA的组合物(参见图1),在将组合物101递送至细胞后,mRNA被翻译形成Cas9蛋白质307,所述蛋白质与向导RNA 121复合形成所描绘的酶活性RNP 301。在其它实施方式中,将RNP301直接递送至细胞中。在某些实施方式中,向导RNA 121包含SEQ ID NO.:1-30、71-76和79-83之一,其任选地具有一个或多个修饰。在某些其它实施方式中,向导RNA 121包含SEQID NO.:31-38之一,其任选地具有一个或多个修饰。修饰可以包含例如在核苷酸核糖环上的2'-O-甲基、核苷酸之间的硫代磷酸酯键、或锁核酸或桥连核酸。除非另外说明,否则RNA优选地包含标准核糖核苷酸。
向导RNA 121可以包含2'-O-甲基化核苷酸。2'-O-甲基寡核苷酸修饰的特征可以是防止常规的碱基水解和核酸酶影响的RNA类似物,并且每次添加使双链体的Tm增加1-4℃。可以发现,2'-O-甲基寡核苷酸的构形是呈类RNA样A型,而不是类DNA样B型。可能只需要连续的几个此类修饰就能实现一种形式向另一种形式的转变。2'-O-甲基的另一益处包含使RNA分子对于核酸酶活性稳定。2'-O-甲基化核苷酸购自TriLink BioTechnologies,LLC(加利福尼亚州圣地亚哥(San Diego,CA))。在一个实施方式中,在向导RNA 121的5'和3'端的前5个或6个或7个碱基内包含1个至约10个,优选地约5个2'-O-甲基以在组合物101被递送至细胞中时防止核酸外切酶活性影响。向导RNA 121还可以包含构象限制性核酸(CRN),其包含锁核酸和桥连核酸。
锁核酸(LNA),通常称为不可及RNA,是修饰的RNA核苷酸。LNA核苷酸的核糖部分用连接2'氧和4'碳的额外桥修饰。该桥将核糖“锁定”在3'-内(北)构象,这通常在A型双链体中发现。必要时,LNA核苷酸可以与寡核苷酸中的DNA或RNA残基混合,并且根据沃森克里克碱基配对规则(Watson-Crick base-pairing rules),与DNA或RNA杂交。此类寡聚物是以化学方式合成的并且可购自Exiqon,即Qiagen公司(荷兰芬洛(Venlo,Netherlands))。
桥连核酸(BNA)是修饰的RNA核苷酸。它们有时也被称为限制性或不可及RNA分子。BNA单体可含有五元、六元或甚至七元桥连结构,其具有“固定”的C3'-内糖褶皱。该桥以合成方式并入核糖的2',4'-位处,得到2',4'-BNA单体。这些单体可以使用标准磷酰胺化学并入寡核苷酸聚合物结构中。BNA是呈刚性结构的寡核苷酸,具有增加的结合亲和力和稳定性。BNA购自Bio-Synthesis,Inc.(德克萨斯州路易斯维尔(Lewisville,TX))。
在一个实施方式中,向导RNA靶向HPV基因组,如HPV16基因组、HPV18基因组、HPV6基因组或HPV11基因组。在一个实施方式中,向导RNA包括如SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75或76中所示的核酸序列,并且任选地其中所述向导RNA中的一个或多个核苷酸进一步被多个修饰的碱基取代,所述修饰的碱基各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);2'-O-甲基假尿苷(fm);以及2'-O-甲基腺苷(am)。在一些实施方式中,向导RNA中约20%至100%的核苷酸在核糖上包括2'-O-甲基。在一个实施方式中,向导RNA包括如SEQ ID NO.:2、3、4、6-16、18、20、22、24、26、28、32、34、36、38或71-73中所示的核酸序列。
在一些实施方式中,向导RNA是SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4、37、41、43及45之一,并且任选地其中约20%至100%所述核苷酸具有修饰,如在核糖上的甲基或2'-O-甲基,并且优选地包含多个(例如约20%至100%)修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)和2'-O-甲基腺苷(am)。优选地,向导RNA包括选自以下组的向导RNA:SEQ IDNO.:41、43、45,并且任选地其中所述向导RNA中的一个或多个核苷酸进一步被多个修饰的碱基取代,所述修饰的碱基各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);2'-O-甲基假尿苷(fm);以及2'-O-甲基腺苷(am)。
在一个实施方式中,组合物101包含(a)编码Cas核酸内切酶,或活性Cas核酸内切酶的mRNA多核苷酸,以及(b)对病毒目标具有特异性的一个或多个向导RNA,所述病毒目标如埃-巴二氏病毒(EBV)、人***瘤病毒(HPV)、卡波西氏肉瘤病毒(KSHV)、乙型肝炎病毒(HBV)、单纯疱疹病毒-1(HSV-1)、单纯疱疹病毒-2(HSV-2)、水痘带状疱疹病毒(VZV)、巨细胞病毒(CMV)、人疱疹病毒-6(HHV-6)或人疱疹病毒-7(HHV-7)。
本文所描述的组合物101的实施方式可以被提供用于治疗HPV感染。在此类实施方式中,向导RNA 121可包括含SEQ ID NO.:39或SEQ ID NO.:40的靶向区域127。被提供用于治疗HPV感染的组合物中所包含的向导RNA 121可以包含以下一个或多个:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4或37,并且任选地进一步包含十个或更多个2’-O-甲基尿苷。例如,在某些实施方式中,向导RNA 121中至少约20%的核苷酸在核糖上包含2'-O-甲基。在某些实施方式中,本发明的组合物可以包含针对HPV16使用的第一向导RNA。
在某些实施方式中,向导RNA包括以下之一:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4、37、41、43、45,并且任选地包含多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。例如,向导RNA可以是以下之一:SEQ ID NO.:2、3、4、6、7、8、9、10、11、12、13、14、15、16、18、20、22、24、26、28、30、32、34、36、38、42、44及46。
在一个实施方式中,向导RNA靶向HPV,并且包含以下之一:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35及37,并且任选地包含一个或多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。例如,向导RNA可以是以下之一:SEQ ID NO.:2、3、4、6、7、8、9、10、11、12、13、14、15、16、18、20、22、24、26、28、30、32、34、36、38。
在某些实施方式中,向导RNA靶向HBV并且包括SEQ ID NO.:41、43或45之一,并且进一步任选地包含一个或多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);2'-O-甲基假尿苷(fm);以及2'-O-甲基腺苷(am)。例如,向导RNA可以是SEQ ID NO.:42、44或46之一。
在其它实施方式中,向导RNA靶向EBV并且包含大体上与SEQ ID NO.:47、48、49、50、51、52及53之一互补的靶向区域,并且优选地包含多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。SEQ ID NO.:47是EBV基因组中的第一个目标。SEQ ID NO.:48是EBV基因组中的第二个目标。SEQ ID NO.:49是EBV基因组中的第三个目标。SEQ ID NO.:50是EBV基因组中的第四个目标。SEQ ID NO.:51是EBV基因组中的第五个目标。SEQ ID NO.:52是EBV基因组中的第六个目标。SEQ ID NO.:53是EBV基因组中的第七个目标。任选地,靶向SEQ ID NO.:47-53中的任一个的向导RNA可以包含本文中结合向导RNA描述的修饰中的任一个,并且优选地在向导RNA的末端7至10个核苷酸内包含至少三个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷(cm);2'-O-甲基鸟苷(gm);2'-O-甲基尿苷(um);以及2'-O-甲基假尿苷(fm)。
在一个实施方式中,本公开提供一种合成的向导RNA,其包括向导RNA核酸分子,所述向导RNA核酸分子具有与病毒核酸中的目标互补的靶向区域。在一个实施方式中,病毒核酸是人***瘤病毒(HPV)核酸。在另一个实施方式中,病毒核酸是乙型肝炎病毒(HBV)核酸。
在一个实施方式中,本公开提供一种合成的向导RNA,其包括具有与HPV16核酸中的目标互补的靶向区域的向导RNA核酸分子,并且包括(a)SEQ ID NO.:1-30、71-76和79-83中的任一个;或(b)与SEQ ID NO.:1-30、71-76和79-83中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在一个实施方式中,所述向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76。在另一个实施方式中,向导RNA包括与SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在特定实施方式中,向导RNA包括与SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76具有至少95%同一性的序列。在一个特定实施方式中,向导RNA的靶向区域包括SEQ ID NO.:39或SEQ ID NO.:40。在又另一实施方式中,病毒核酸中的目标包括SEQ ID NO.:64或SEQ ID NO.:65。在某一实施方式中,向导RNA包括SEQ ID NO.:80。在前述实施方式中的任一个中,向导RNA可包括一个或多个修饰的碱基。在前述实施方式中的任一个中,向导RNA可包括2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA可包括多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;以及2'-O-甲基腺苷。在一些实施方式中,向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76,其中所述向导RNA中的一个或多个核苷酸进一步被具有修饰的碱基的核苷酸取代,且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA中至少约20%的核苷酸可在核糖上包括2'-O-甲基。在前述实施方式中的任一个中,向导RNA可在两个核苷之间包括硫代磷酸酯键。在前述实施方式中的任一个中,向导RNA可在所述向导RNA的5’端和3’端各自的十个末端核苷酸内包括一个或多个硫代磷酸酯键。在一些实施方式中,向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76,其中向导RNA中的一个或多个核苷间键进一步被硫代磷酸酯键取代。在一些实施方式中,向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76,其中在所述向导RNA的5’端和3’端各自的十个末端核苷酸内的一个或多个核苷间键进一步被硫代磷酸酯键取代。在这些实施方式中的任一个中,向导RNA可包括桥连核酸(BNA)、锁核酸(LNA)或构象限制性核苷酸(CRN)。在一些实施方式中,向导RNA包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、74、75或76,其中所述向导RNA中的一个或多个核苷酸进一步被具有构象限制性核苷酸(CRN)的核苷酸取代。在一些实施方式中,向导RNA中的一个或多个核苷酸进一步被具有以下的核苷酸取代:(a)修饰的碱基,且各修饰的碱基是2'-O-甲基胞苷、2'-O-甲基鸟苷;2'-O-甲基尿苷、2'-O-甲基假尿苷或2'-O-甲基腺苷;(b)在核糖上的2'-O-甲基;(c)在两个核苷之间的硫代磷酸酯键;(d)LNA、BNA或CRN;或(e)(a)-(d)的任何组合。
在一个实施方式中,本公开提供一种合成的向导RNA,其包括具有与HPV18核酸中的目标互补的靶向区域的向导RNA核酸分子,并且包括(a)SEQ ID NO.:31-38中的任一个;或(b)与SEQ ID NO.:31-38中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在一个实施方式中,向导RNA包括SEQ ID NO.:31-38中的任一个。在另一个实施方式中,向导RNA包括与SEQ ID NO.:31-38中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在特定实施方式中,向导RNA包括与SEQ ID NO.:31-38中的任一个具有至少95%同一性的序列。在一个特定实施方式中,向导RNA包括SEQ ID NO.:31、33、35或37。在又另一个实施方式中,向导RNA包括与SEQ ID NO.:31、33、35或37具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在前述实施方式中的任一个中,向导RNA可包括一个或多个修饰的碱基。在前述实施方式中的任一个中,向导RNA可包括2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA可包括多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;以及2'-O-甲基腺苷。在一些实施方式中,向导RNA包括SEQ IDNO.:31、33、35或37,其中所述向导RNA中的一个或多个核苷酸进一步被具有修饰的碱基的核苷酸取代,且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA中至少约20%的核苷酸可在核糖上包括2'-O-甲基。在前述实施方式中的任一个中,向导RNA可在两个核苷之间包括硫代磷酸酯键。在前述实施方式中的任一个中,向导RNA可在所述向导RNA的5'端和3'端各自的十个末端核苷酸内包括一个或多个硫代磷酸酯键。在一些实施方式中,向导RNA包括SEQ ID NO.:31、33、35或37,其中向导RNA中的一个或多个核苷间键进一步被硫代磷酸酯键取代。在一些实施方式中,向导RNA包括SEQ ID NO.:31、33、35或37,其中在所述向导RNA的5’端和3’端各自的十个末端核苷酸内的一个或多个核苷间键进一步被硫代磷酸酯键取代。在这些实施方式中的任一个中,向导RNA可包括桥连核酸(BNA)、锁核酸(LNA)或构象限制性核苷酸(CRN)。在一些实施方式中,向导RNA包括SEQ ID NO.:31、33、35或37,其中所述向导RNA中的一个或多个核苷酸进一步被具有构象限制性核苷酸(CRN)的核苷酸取代。在一些实施方式中,向导RNA中的一个或多个核苷酸进一步被具有以下的核苷酸取代:(a)修饰的碱基,且各修饰的碱基是2'-O-甲基胞苷、2'-O-甲基鸟苷;2'-O-甲基尿苷、2'-O-甲基假尿苷或2'-O-甲基腺苷;(b)在核糖上的2'-O-甲基;(c)在两个核苷之间的硫代磷酸酯键;(d)LNA、BNA或CRN;或(e)(a)-(d)的任何组合。
在一个实施方式中,本公开提供一种合成的向导RNA,其包括具有与HBV核酸中的目标互补的靶向区域的向导RNA核酸分子,并且包括(a)SEQ ID NO.:41-46和66中的任一个;或(b)与SEQ ID NO.:41-46和66中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在一个特定实施方式中,向导RNA包括SEQ IDNO.:41、43或45。在另一个实施方式中,向导RNA包括与SEQ ID NO.:41、43或45具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。在前述实施方式中的任一个中,向导RNA可包括一个或多个修饰的碱基。在前述实施方式中的任一个中,向导RNA可包括2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA可包括多个修饰的碱基,其各自选自以下组:2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;以及2'-O-甲基腺苷。在一些实施方式中,向导RNA包括SEQ ID NO.:41、43或45,其中所述向导RNA中的一个或多个核苷酸进一步被具有修饰的碱基的核苷酸取代,且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;2'-O-甲基假尿苷;或2'-O-甲基腺苷。在前述实施方式中的任一个中,向导RNA中至少约20%的核苷酸可在核糖上包括2'-O-甲基。在前述实施方式中的任一个中,向导RNA可在两个核苷之间包括硫代磷酸酯键。在前述实施方式中的任一个中,向导RNA可在所述向导RNA的5'端和3'端各自的十个末端核苷酸内包括一个或多个硫代磷酸酯键。在一些实施方式中,向导RNA包括SEQ ID NO.:41、43或45,其中向导RNA中的一个或多个核苷间键进一步被硫代磷酸酯键取代。在一些实施方式中,向导RNA包括SEQ IDNO.:41、43或45,其中在所述向导RNA的5’端和3’端各自的十个末端核苷酸内的一个或多个核苷间键进一步被硫代磷酸酯键取代。在这些实施方式的任一个中,向导RNA可包括桥连核酸(BNA)、锁核酸(LNA)或构象限制性核苷酸(CRN)。在一些实施方式中,向导RNA包括SEQ IDNO.:41、43或45,其中所述向导RNA中的一个或多个核苷酸进一步被具有构象限制性核苷酸(CRN)的核苷酸取代。在一些实施方式中,靶向HBV核酸的向导RNA中的一个或多个核苷酸进一步被具有以下的核苷酸取代:(a)修饰的碱基,并且各修饰的碱基是2'-O-甲基胞苷、2'-O-甲基鸟苷、2'-O-甲基尿苷、2'-O-甲基假尿苷或2'-O-甲基腺苷;(b)在核糖上的2'-O-甲基;(c)在两个核苷之间的硫代磷酸酯键;(d)LNA、BNA或CRN;或(e)(a)-(d)的任何组合。
在一些方面,提供了一种DNA分子,其编码如本文所公开的向导RNA。还涵盖一种载体,其包括此类DNA分子。
本公开的用于靶向HPV16的例示性向导RNA序列显示于图18中,用于靶向HPV18的例示性向导RNA序列显示于图19中,并且用于靶向HBV的例示性向导RNA序列显示于图20中。此外,图21和22显示了例示性目标序列。
Cas9分子和核酸
在一些实施方式中,本文所公开的组合物包括Cas核酸内切酶,例如CRISPR相关细菌核酸内切酶家族的任何成员。
在一些实施方式中,Cas核酸内切酶是野生型Cas9核酸内切酶,例如由如SEQ IDNO.:54中所示核酸分子所编码和/或包括如SEQ ID NO.:63或84中所示氨基酸序列的Cas9核酸内切酶。在其它实施方式中,Cas核酸内切酶是修饰的Cas9核酸内切酶,其中所述修饰的Cas9核酸内切酶相对于野生型分子是被修饰的。例如,Cas9可以被修饰成具有降低的免疫原性(例如被修饰成相对于野生型在T细胞表位内包含一个或多个取代)。修饰治疗剂以避免免疫应答尚面临挑战,尤其是当治疗性蛋白质以mRNA的方式递送的时候。通过使用修饰的核苷酸序列,当所述mRNA翻译成蛋白质时,相对于野生型,所得蛋白质可以具有不会触发抗药物抗体(ADA)反应的不同的或修饰的表位。在一些实施方式中,本公开提供一种修饰的Cas9核酸内切酶蛋白质序列,其中相对于野生型Cas9核酸内切酶,一个或多个预测的T细胞表位具有避免或降低免疫应答的取代。在一个实施方式中,相对于野生型Cas9,所述Cas9核酸内切酶包括至少一个氨基酸变化,其包括R780、K810、K848、K855、H982、K1003及R1060中的一个或多个。在一个实施方式中,Cas9蛋白质包括K848A、K1003A或R1060A。在一个实施方式中,mRNA的编码序列包括多个5-甲基胞苷。在另一个实施方式中,mRNA的编码序列可以包含多个假尿苷或5甲氧基-尿苷。
如下文更详细地论述,mRNA 113可以由如TriLink BioTechnologies,LLC(加利福尼亚州圣地亚哥)或AmpTec GmbH(德国汉堡(Hamburg,Germany))等公司通过体外转录制造。体外转录制造mRNA典型地使用含双链DNA模板的缓冲液以及RNA聚合酶和NTP混合物。所述聚合酶合成mRNA 113。接着,DNA被酶降解。从聚合酶、游离NTP和降解的DNA中纯化出mRNA113。
在一些实施方式中,Cas9核酸内切酶以编码于DNA载体中的形式、以蛋白质形式(例如以修饰的Cas9核酸内切酶与抗病毒向导RNA复合的活性RNP形式)或以将在目标细胞内翻译的mRNA形式递送至细胞。在一个实施方式中,Cas9核酸内切酶是以mRNA形式与一个或多个向导RNA一起递送。
图2显示根据某些实施方式的mRNA 113。mRNA 113包含5’帽205、5’非翻译区(UTR)211(例如可以来源于β-球蛋白序列)、编码Cas核酸内切酶的开放阅读框架(ORF)215、3’UTR221(例如来源于β-球蛋白序列)及多聚A尾227(例如120个腺苷核苷酸)。ORF215以起始密码子(AUG,Kozak序列的一部分)开始并以终止密码子(UAG)结束。mRNA113包含3’UTR,其支持翻译终止。mRNA 113还包含约80至120个碱基的多聚(A)尾,其支持翻译因子结合并使mRNA113稳定,由此防止mRNA降解。
在一些实施方式中,对于5’帽205,7-甲基-鸟苷通过5’-5’三磷酸桥连接至第一个5’核苷酸。取决于额外甲基的数量,此可以称为帽0、帽1或帽2。在一些实施方式中,如下所述制造的mRNA未全部加帽,即,并非100%的所制造的mRNA分子都会具有5’帽。5'UTR 211提供核糖体结合和翻译因子结合的位点。5'UTR 211影响mRNA 113的表达水平。表达包含将ORF 215的序列翻译成其相应氨基酸序列。ORF 215编码Cas核酸内切酶如Cas9,并且任选地针对哺乳动物表达进行密码子优化。5'帽205可以包含帽0或帽1,即7-甲基鸟苷通过5'-5'三磷酸桥连接至第一个5'核苷酸。Kozak序列跨越5'UTR 211的3'端与ORF 215的5'端,充当翻译起始区。在一些实施方式中,ORF包括SEQ ID NO.:54、55、56、57、58、59及60之一,其中向导RNA中的多个核苷酸进一步被具有修饰的碱基的核苷酸取代,并且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;以及2'-O-甲基假尿苷;或2'-O-甲基腺苷。在一些实施方式中,相对于典型RNA核苷酸序列,所述ORF包括一个或多个修饰。在一些实施方式中,ORF包括SEQ ID NO.:56、57或58,或因遗传密码的简并性而编码相同氨基酸序列的序列,所述序列与SEQ ID NO.:56、57或58具有至少约85%同一性且包含多个假尿苷和/或5-甲基胞苷残基。在一些实施方式中,ORF 215编码如由SEQ ID NO.:56-60之一所描述的Cas9变体,或功能等效的肽。在一些实施方式中,ORF 215编码如由SEQ ID NO.:67-70、77和78之一所描述的Cas9变体,或功能等效的肽。mRNA 113的ORF 215可以针对特定生物体进行密码子优化。
本领域的普通技术人员应了解,由于遗传密码的简并性,SEQ ID NO.:54-60、67-70、77和78的某些可预测的变化将提供各自对应的功能等效物。例如,参照Cas核酸内切酶基因的DNA有义链,一部分ORF可以包含CAA CCT CAA,其编码MPQ。然而,当任何碱基处于摇摆位置时,核糖体都会引入脯氨酸(P),因此脯氨酸的密码子可表示为CCN。当摇摆碱基是嘌呤时,引入谷氨酰胺(Q),并因此Q密码子可表示(也在DNA有义链中)为CAR(在此情况下,本领域的普通技术人员应认识到,N和R分别是IUPAC关于碱基和嘌呤的模糊代码)。使用标准密码子表以及对遗传密码的了解,可产生与SEQ ID NO.:54-60之一具有低至约85%同一性,但仍编码分别与SEQ ID NO.:54-60所编码相同的蛋白质的序列。因此,应了解,mRNA113的ORF 215可以包含SEQ ID NO.:54-60之一,或与SEQ ID NO.:54-60之一具有在85%与100%之间的同一性(如通过比对两个序列并计算[(相配碱基/总碱基)*100]测定)的序列。然而,与SEQ ID NO.:54-60具有或接近100%同一性的序列(例如同一性在95%与100%之间的序列)可能是最优选的,这是由于密码子优化以及例如GC含量或避免了RNA二级结构。
在一个实施方式中,mRNA 113编码Cas核酸内切酶,如Cas9型。在一个实施方式中,Cas9核酸内切酶是野生型酿脓链球菌(S.pyogenes)Cas9(SpCas9),并且是由包括SEQ IDNO.:54的mRNA编码。
在另一个实施方式中,mRNA 113编码修饰的Cas9核酸内切酶,
SpCas9-sgRNA复合物裂解目标位点,所述目标位点由NGG PAM序列(由SpCas9识别)21-24和邻近的20bp原间隔序列(与sgRNA的5'端互补)构成。结构研究表明,SpCas9-sgRNA-目标DNA复合物包含若干SpCas9介导的DNA接触,其包含由四个SpCas9残基(N497、R661、Q695、Q926)与目标DNA链的磷酸酯主链形成的直接氢键。用丙氨酸取代这些残基中的一个、更多个或全部不会降低SpCas9的在靶裂解效率。研究显示,三重取代变体(R661A/Q695A/Q926A)和四重取代变体(N497A/R661A/Q695A/Q926A)显示出良好活性。四重取代变体已被称作SpCas9-HF1,表示高保真度(High-Fidelity)变体#1,也称为HF S.p.Cas9。可以使用基于测序的全基因组无偏双链断裂鉴别(GUIDE-seq)方法评估脱靶活性。参见Tsai,2015,GUIDE-seq能够对由CRISPR-Cas核酸酶引起的脱靶裂解进行全基因组图谱分析(GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Casnucleases.),《自然·生物技术(Nat Biotechnol)》33:187-197,以引用的方式并入。具有额外D1135E取代的SpCas9-HF1(称为SpCas9-HF2)在研究中保持70%或更高的野生型SpCas9活性并且可以被包含在组合物101中。此外,还可包含带有额外L169A或Y450A取代(这些位置的侧链被认为会介导其在PAM近端与目标DNA的非特异性疏水相互作用)的变体。参见Kleinstiver,2016,具有不可检测的全基因组脱靶的高保真度CRISPR-Cas9变体(High-fidelity CRISPR-Cas9 variants with undetectable genome-wide offtargets),《自然》529(7587):490-495,以引用的方式并入。
在一些实施方式中,相对于野生型Cas9,所述Cas9包括至少一个氨基酸变化,其包括R780、K810、K848、K855、H982、K1003或R1060中的一个或多个。在一个实施方式中,Cas9包含K848A、K1003A及R1060A中的一个、二个或全部三个。在一个实施方式中,Cas9由如SEQ IDNO.:59中所示的mRNA序列编码,例如由SEQ ID NO.:59所定义的彼此意义相同的HFS.p.Cas9、SpCas9-HF1和高保真度变体#1。在另一个实施方式中,Cas9由与SEQ ID NO.:59具有至少85%、90%、95%或100%同一性的mRNA序列编码。
在本说明书的实施方式中,可以使用特异性增强的修饰的核酸酶,如Cas9的特异性增强形式(例如eSp(1.1)Cas9;SEQ ID NO.:60)。在一些实施方式中,编码eSp(1.1)的mRNA优选地包含5’帽、5’UTR、Kozak序列、ORF、3’UTR及多聚A尾。
据Slaymaker等人报导,Cas9介导的DNA裂解可能依赖于DNA链分离。参见Slaymaker,2016,合理设计的具有改善的特异性的Cas9核酸酶(Rationally designedCas9nucleases with improved specificity),《科学(Science)》351(6268):84-88,以引用的方式并入。核酸酶活性是通过链分离活化,因而sgRNA与目标DNA之间的错配将通过减弱Cas9的解螺旋酶活性而降低脱靶位点处的裂解活性。酿脓链球菌Cas9晶体结构展现带正电的沟,其位于SpCas9中的HNH、RuvC与PAM相互作用域之间,可能涉及使目标DNA的非目标链稳定。中和所述非目标链沟中带正电的残基可能削弱非目标链结合并促进目标与非目标DNA链之间的再杂交,由此在RNA向导与目标DNA链之间需要更严格的沃森-克里克碱基配对。在所述沟内的五个取代可使脱靶位点处的活性相较于野生型SpCas9降低,同时维持在靶裂解效率。具有高效率(野生型水平的在靶***缺失形成)和特异性(在EMX(1)和VEGFA(1)脱靶处未形成能检测出的***缺失)的变体包含:SpCas9(K855A)、SpCas9(K810A/K1003A/R1060A)[又称为eSpCas9(1.0)]及SpCas9(K848A/K1003A/R1060A)[又称eSpCas9(1.1)]。一些实施方式包含由组合物101中的mRNA 113所编码的eSpCas9(1.0)或(1.1)。
在所述实施方式中的任一个中,mRNA 113可以包含5-甲基胞苷(m5c)、假尿苷(Ψ)或两者中的一个或多个。修饰的核苷可以减少先天性免疫活化并增加mRNA的翻译。未修饰的mRNA可诱导不合需要的细胞因子分泌。通过使用噬菌体RNA聚合酶由DNA模板体外转录或通过固相化学合成,可以制备出大量的RNA。假尿苷(Ψ)和5-甲基胞苷(m5C)的三磷酸酯衍生物(TriLink)可用于产生含有修饰的核苷的RNA。在RNA中并入修饰的核苷酸可以减弱其活化RNA传感器如铎样受体(Toll-like receptor,TLR)3、TLR7和TLR8、视黄酸诱导性基因I(RIG-I)及RNA依赖性蛋白激酶(PKR)的能力。修饰的核苷酸优选地包含假尿苷-(Ψ)、或5-甲基胞苷-(m5C)、5-甲氧基-尿苷及Ψ-(m5C/Ψ)核苷修饰。在一些实施方式中,m5C/Ψ-核苷修饰的mRNA引起最低量的RNA传感器活化和最高水平的翻译。用HPLC纯化从体外转录的含Ψ或m5CΨ核苷的RNA中去除dsRNA和其它污染物,得到具有高翻译水平的RNA。参见Kariko,2011,产生适于疗法的最佳mRNA:HPLC纯化消除免疫活化并改善核苷修饰以及编码蛋白质的mRNA的翻译(Generating the optimal mRNA for therapy:HPLC purificationeliminates immune activation and improves translation of nucleoside-modified,protein-encoding mRNA),《核酸研究(Nucleic Acids Res)》39(21):e142,以引用的方式并入。
所述mRNA可被转录成含有例如30、51或120nt长的多聚(A)尾。多聚(A)尾可在转录期间以模板依赖性方式添加和/或可以在转录后用酶添加。例如,在转录之后,可以用酵母多聚(A)聚合酶添加额外的多聚(A)尾。RNA可在2'-O-甲基转移酶(ScriptCap,CellScript)存在或不存在下,用例如m7G加帽试剂盒加帽,由此获得帽1或帽0。加帽可以使用TriLink的CleanCap或AmpTec的酶加帽进行,例如产生帽1。
治疗性蛋白质的免疫原性会降低治疗剂的功效,这是由于在反复暴露之后,治疗剂的半衰期会因基于免疫的经由抗药物抗体(ADA)的清除而降低。减少ADA的策略包含:免疫抑制、患者耐受化(剂量、途径和共配制物)以及修饰蛋白质内高免疫原性的T细胞表位。在一些实施方式中,Cas9或修饰的Cas9包含Cas9或修饰的Cas9中免疫原性T细胞表位的修饰。
对于基于mRNA的治疗剂,蛋白质的合成的、定向的翻译后化学修饰(例如聚乙二醇化)是不可行的。不过,可改变预测的T细胞表位内的重要氨基酸以降低免疫原性和ADA。可以采用计算机模拟建模操作来预测蛋白质内的MHC II限制性免疫原性肽。本公开的一些实施方式包含T细胞表位相对于野生型核酸酶序列被修饰的核酸酶序列。核酸酶表位T细胞表位中的修饰可以改善体内药物特性,减少ADA并且有助于重复施用。降低免疫原性的另一种方法是通过将降解肽与Cas9或sgRNA缀合以缩短CRISPR组分的半衰期来减少药物暴露。
在一个实施方式中,Cas核酸内切酶包括如SEQ ID NO.:63中所示的野生型酿脓链球菌Cas9氨基酸序列。
在一个实施方式中,Cas核酸内切酶包括野生型酿脓链球菌Cas9氨基酸序列,其包括N末端和C末端核定位序列(NLS),例如SEQ ID NO.:61。在另一个实施方式中,同一mRNA分子内可包含具有不同NLS和连接子序列的额外Cas9蛋白质变体;例如,mRNA可以包含SEQ IDNO.:56-58之一,以及编码如SEQ ID NO.:61中所示的氨基酸序列的任何mRNA。例如,在一些实施方式中,mRNA分子可以编码多种Cas9,例如SEQ ID NO.:54-60、67-70、77及78中的多个。
在一个实施方式中,一种或多种Cas9变体相对于SEQ ID NO.:61具有增强的核定位,产生较高的核酸内切酶活性、较高的效力并且允许以较低药物水平施用。这些益处可有助于降低免疫原性,以及降低药物制造的成本。
在一个实施方式中,Cas核酸内切酶是具有减少的ADA和可选末端NLS序列的变体Cas9。例如,在一个实施方式中,Cas核酸内切酶包括如SEQ ID NO.:62中所示的氨基酸序列。在某些实施方式中,本发明采用了编码修饰的Cas核酸内切酶如SEQ ID NO.:62的mRNA。
SEQ ID NO.:62提供了被工程改造成具有减少的ADA的Spy Cas9蛋白质序列,其具有N末端和C末端NLS。预测的MHC表位(参见下文和实例1)以下划线示出。每一表位内以粗体表示的氨基酸指示降低ADA风险的取代。
因此,本发明的一些实施方式包含对HLA-DRB1中潜在MHC II限制性CD4 T细胞表位的诱变。可使用预测工具预测蛋白质序列中的MHC II T细胞表位。适合的预测工具包含例如SYFPETHI、IEDB(包含以下变化形式:推荐型、Consensus、NetMHCpan、NN_align、SMM_allign、组合文库、Sturniolo)、RANKPEP、ProPred、MULTIPRED2、MHCIIPred、MHC2SKpanNetMHCII NetMHCII。在一些实施方式中,SEQ ID NO.:62含有如下七个潜在T细胞表位:表位1包含氨基酸165-181;表位2包含氨基酸251-265;表位3包含氨基酸582-596;表位4包含氨基酸737-751;表位5包含氨基酸896-910;表位6包含氨基酸968-982;以及表位7包含氨基酸1328-1342。继续参照SEQ ID NO.:62,在一些实施方式中,各表位可以具有如下子序列(参照SEQ ID NO.:62):在表位1中,特别值得关注的可以是子区1a(氨基酸168-176)或子区1b(氨基酸170-178);在表位2中,子区2a是氨基酸255-263;在表位3中,子区3a是氨基酸586-594;在表位4中,子区4a包含氨基酸741-749;在表位5中,子区5a包含氨基酸900-908;在表位6中,子区6a包含氨基酸972-980;在表位7中,子区7a包含氨基酸1332-1340。由于Cas9的前述表位和子区表示可能具有高免疫原性的推定的表位,故它们特别值得关注。在一个实施方式中,表位1-3中的许多(例如至少一半)或大体上全部残基被突变成丙氨酸(并且这些突变不会干扰Cas9结构/功能)。在一个实施方式中,表位5-7内的某些指定残基被突变,包含选自以下的一个或多个突变(参照SEQ ID NO.:63):W883、Q885、N888、V955、L1315及N1317。将带电荷的残基突变成丙氨酸可能影响直接接触所述核酸的邻近残基的局部静电状态和定位。
本公开的例示性Cas9核酸序列显示于图16中,而本公开的例示性Cas9蛋白质序列显示于图17中。
组合物
在某些方面,本公开提供组合物,其包括靶向病毒核酸的Cas核酸内切酶以及一个或多个靶向病毒核酸的向导RNA,或编码此类Cas9核酸内切酶和/或向导RNA的核酸。在一些实施方式中,本公开提供一种用于治疗病毒感染(如HBV或HPV感染)的组合物,其包括(a)编码Cas核酸内切酶的mRNA以及(b)一个或多个向导RNA。在一些实施方式中,所述组合物包括Cas9核酸内切酶和一个或多个向导RNA。在一些其它实施方式中,所述组合物包括核糖核蛋白(RNP)复合物,其中所述RNP包括与向导RNP复合或缔合的Cas9核酸内切酶。在前述实施方式中的任一个中,mRNA和向导RNA可以包含特定序列和修饰,并且可以由纳米粒子包封。在特定实施方式中,向导RNA靶向HBV或HPV核酸。
在一些实施方式中,所述组合物包含编码修饰的Cas核酸内切酶的mRNA以及使Cas核酸内切酶靶向HPV或HBV基因组的一个或多个向导RNA。这些RNA被包装于脂质纳米粒子、固体纳米粒子或脂质体中。包封RNA的纳米粒子最佳地被配制成用于表面、粘膜或局部递送至受感染的组织,从而避免全身递送和循环,由此使药物暴露、脱靶活性以及Cas核酸内切酶的免疫原性降到最低。在一些实施方式中,纳米粒子是用如微针阵列之类装置施用以增进RNA向基底上皮的递送。
所述mRNA优选地编码可编程核酸酶,如Cas核酸内切酶或修饰的Cas核酸内切酶。在一些实施方式中,Cas核酸内切酶或修饰的核酸内切酶是Cas9核酸内切酶或修饰的Cas9核酸内切酶。在某些实施方式中,所述mRNA编码修饰的Cas核酸内切酶,相对于野生型形式,其被修饰成具有降低的免疫原性。所编码的修饰的核酸酶相对于野生型可以在T细胞表位内包含一个或多个取代。修饰治疗剂以避免免疫应答尚面临挑战,尤其是当治疗性蛋白质以mRNA的方式递送的时候。通过使用修饰的核苷酸序列,当所述mRNA翻译成蛋白质时,相对于野生型,所得蛋白质可以具有不会触发抗药物抗体(ADA)反应的不同的或修饰的表位。本发明包含修饰的Cas核酸内切酶蛋白质序列,其中相对于野生型Cas核酸内切酶,一个或多个预测的T细胞表位具有避免或降低免疫应答的取代。具有修饰的T细胞表位的修饰的Cas核酸内切酶可以呈编码于DNA载体中的形式、呈蛋白质形式(例如以修饰的Cas核酸内切酶与抗病毒向导RNA复合的活性核糖核蛋白(RNP)形式)或呈打算在目标细胞内翻译的mRNA形式递送至细胞。在一些实施方式中,所述核酸酶是以mRNA形式,例如连同一个或多个向导RNA一起递送。
在一些实施方式中,向导RNA包括与病毒基因组,例如HPV16、HPV18、HBV或EBV基因组内的位点互补的靶向区域,所述位点没有出现在人类基因组中。
在一些实施方式中,向导RNA可以包含促进所述RNA递送至并驻留于受感染细胞内的特征,如修饰的核苷酸。在一些实施方式中,RNA中的修饰的核苷酸可用于改善RNA稳定性,降低免疫原性或改善核酸内切酶活性的特异性。例如,向导RNA可以包含能防止核酸外切酶消化的特征,如在核糖环上的一个或多个2'-O-甲基、核苷酸之间的一个或多个硫代磷酸酯键或两者,并且特别是位于向导RNA的5’和3’末端附近的特征。在一些实施方式中,向导RNA可任选地在例如靶向区域内包含一个或多个锁核酸、桥连核酸或构象限制性核酸,其可以使与目标的结合稳定,减少与非病毒目标(例如人DNA)的结合,或增强核酸内切酶活性的特异性。在另外的实施方式中,Cas核酸内切酶相对于野生型Cas9可以包含突变,这些突变可以增强特异性并减少脱靶活性(例如通过使与位于向导RNA目标外部的目标DNA的相互作用不稳定)。在又另外的实施方式中,所述RNA可以包含能使患者的免疫应答降至最低的修饰,如假尿苷或5-甲基-胞嘧啶。
在一些实施方式中,所述RNA被包装于脂质纳米粒子中,所述脂质纳米粒子包含例如阳离子性脂质,其平衡磷酸酯主链的电荷并且促进渗透穿过组织并进入细胞中以及在细胞内释放RNA。脂质纳米粒子可另外提供于表面配制物中,所述表面配制物含有适合的凝胶或悬浮液,如水性悬浮液,其可以包含组织驻留增强剂或增稠剂,如羟乙基纤维素或羧甲基纤维素。所述配制物可以包含增强LNP稳定性的赋形剂,如蔗糖或甘露糖醇。所述配制物可以包含增进组织渗透的赋形剂,如月桂基硫酸钠、乙醇、二乙二醇单***(Transcutol)、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮(NMP)。配制的纳米粒子可用如微针阵列之类装置施用以增进RNA向基底上皮的递送。
在一些实施方式中,所述组合物通过表面或局部施加至感染部位,如与HPV感染相关的高级别癌前病变。RNA被释放于细胞内,并且mRNA由细胞的核糖体翻译以产生Cas核酸内切酶。Cas9核酸内切酶包含连接子序列以及在N末端和/或C末端处被设计用于最佳核定位的一个或多个核定位序列(NLS)。Cas核酸内切酶与所提供的一个或多个向导RNA复合形成活性RNP。RNP运送至细胞核并通过向导RNA的互补部分与病毒基因组内的目标之间的序列特异性相互作用而结合至病毒基因组。在结合至病毒目标后,Cas核酸内切酶将病毒基因组裂解。由此得到的病毒DNA片段可以通过细胞途径降解或修复,由此清除或破坏感染。
图1显示本公开的例示性组合物101,其包含编码Cas核酸内切酶的mRNA 113和向导RNA 121。一个或多个纳米粒子105(其包含阳离子性脂质107)包封mRNA 113和向导RNA121。如下文更详细地描述,向导RNA 121包含靶向区域127,其与目标核酸互补。在一些实施方式中,向导RNA 121包括SEQ ID NO.:1-38、71-76和79-83中的任一个,并且靶向区域127与人***瘤病毒(HPV)基因组中的目标核酸互补。在一些实施方式中,向导RNA 121包括SEQID NO.:1-30、71-76和79-83中的任一个,并且靶向区域127与人***瘤病毒(HPV)基因组中的目标核酸互补。纳米粒子105任选地被运载体配制物135,如水、水溶液或凝胶运载。运载体配制物135任选地包含一种或多种赋形剂136,如月桂基硫酸钠、乙醇、二乙二醇单***(Transcutol)、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮。本文描述mRNA 113、向导RNA 121、纳米粒子105和运载体配制物135,以及治疗感染的方法和制备药剂的方法。
在某些实施方式中,Cas9 mRNA包括如SEQ ID NO.:55、56、57或58中所示的核酸;向导RNA包括如SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、37、74、75及76中所示的核酸;并且Cas9 mRNA和向导RNA被包封于多个纳米粒子内,其中所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。
本公开的各方面提供了用于治疗病毒感染的组合物和方法。在一个实施方式中,所述组合物包含Cas核酸内切酶,或编码所述Cas核酸内切酶的多核苷酸,其在以下的部分内具有一个或多个取代(相对于SEQ ID NO.:63):氨基酸149-165(也称为表位1);氨基酸235-249(也称为表位2);氨基酸566-580(也称为表位3);氨基酸721-735(也称为表位4);氨基酸880-894(也称为表位5);氨基酸952-966(也称为表位6);或氨基酸1312-1326(也称为表位7)。Cas核酸内切酶可以包含一个或多个NLS(例如在任一末端处)且在一些实施方式中是由SEQ ID NO.:62表示,并且参照SEQ ID NO.:62,这七个表位如下:表位1包含氨基酸165-181;表位2包含氨基酸251-265;表位3包含氨基酸582-596;表位4包含氨基酸737-751;表位5包含氨基酸896-910;表位6包含氨基酸968-982;以及表位7包含氨基酸1328-1342。继续参照SEQ ID NO.:62,这一个或多个取代具体地说可以位于以下的一个或多个内:氨基酸168-176;氨基酸170-178;氨基酸255-263;氨基酸586-594;氨基酸741-749;氨基酸900-908;氨基酸972-980;以及氨基酸1332-1340。相对于SEQ ID NO.:63,所述一个或多个取代可在R152、I154、A157、F238、N240、A243、F569、K571、C574、W883、Q885、N888、V955、L1315及N1317处,并且其各自被取代成以下之一:A、K、V、S、L、Q、R、E、T、N。在一个实施方式中,所述取代包含以下任一个,且任选地至少约五个或八个:R152K、I154V、A157S、F238L、N240Q、A243S、F569L、K571R、C574E、W883T、Q885N、N888Q、V955I、L1315I及N1317Q。
包括多个向导RNA的组合物
在一些实施方式中,所述组合物包括多种向导RNA,并且所述多种向导RNA具有不同的多核苷酸序列、修饰或两者。在一个实施方式中,不同的多种向导RNA分子具有不同的多核苷酸序列。在另一个实施方式中,所述不同的多种向导RNA结合至同一病毒核酸中的不同目标。在又另一个实施方式中,所述不同的多种向导RNA结合至不同病毒核酸中的目标。
例如,在一些实施方式中,所述组合物包括多种向导RNA并且第一个向导RNA包含:UGCAAUGUUU CAGGACCCAC GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAACUUGAAAAAGU GGCACCGAGU CGGUGCUUUU UU(SEQ ID NO.:1),优选地具有某些修饰。例如,在第一个向导RNA内,在5’端的前三个核苷酸各自在核糖环上包含2'-O-甲基。类似地,在3'端的最后三个核苷酸各自在核糖环上包含2'-O-甲基。另外,前三个和最后三个核苷酸间键联包含硫代磷酸酯键。序列以使用A、C、G和U(以大写字母或小写字母表示)的典型RNA命名法给出,并且相对于典型碱基和/或主链的任何变化通过适当附加文字描述。例如,在一些实施方式中,向导RNA 121(例如SEQ ID NO.:1-38、71-76和79-83之一)进一步包含一个或多个硫代磷酸酯键。
硫代磷酸酯(PS)键用硫原子取代寡核苷酸磷酸酯主链中的非桥连氧。这一修饰优选地被包含用于防止核酸酶降解核苷酸间的键联。硫代磷酸酯键可以引入寡核苷酸5’端、3’端或两者的最后3-5个核苷酸之间以抑制核酸外切酶降解。在整个寡核苷酸内包含硫代磷酸酯键也有助于减少核酸内切酶的攻击。具有PS键的寡核苷酸可从例如Integrated DNATechnologies,Inc.(爱荷华州科勒尔维尔(Coralville,IA))订购。参见Wan,含有手性硫代磷酸酯键联的第二代反义寡核苷酸的合成、生物物理学特性及生物活性(Synthesis,biophysical properties and biological activity of second generation antisenseoligonucleotides containing chiral phosphorothioate linkages),《核酸研究》42:13456-13458,2014,以引用的方式并入。
本发明的组合物可以包含用于针对HPV16的第二向导RNA。第二向导RNA包含SEQID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4、37、74、75或76之一,任选地以及关于第一向导RNA所描述的修饰中的任一个。第二向导RNA优选地还包含十个或更多个2'-O-甲基尿苷以减少先天性免疫应答。
本发明的组合物可以包含第三向导RNA。第三向导RNA包含SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4或37之一,任选地具有关于第一向导RNA和任选地关于第二向导RNA所描述的修饰中的任一个。第三向导RNA包含至少一个桥连核酸(BNA)。在某些实施方式中,第三向导RNA在DNA结合区的特定位点处包含锁核酸或桥连核酸以增加特异性。
本发明的组合物可以包含第四向导RNA,用于治疗HPV18。第四向导RNA包含SEQ IDNO.:31、33和35之一,并且任选地包含所述修饰中的任一个,并且优选地在5’端的前三个核苷酸各自在核糖环上包含2'-O-甲基。类似地,在3’端的最后三个核苷酸各自在核糖环上包含2'-O-甲基。另外,前三个和最后三个核苷酸间键联包含硫代磷酸酯键。第四向导RNA可任选地包含十个或更多个2'-O-甲基尿苷。第四向导RNA可任选地包含一个或多个构象限制性核苷酸(例如BNA或LNA),优选地在靶向区域内包含构象限制性核苷酸。
例示性组合物
在一个实施方式中,本公开提供一种组合物,其包括:编码Cas核酸内切酶的mRNA;如本文中所描述的向导RNA;多个包括阳离子性脂质的纳米粒子,并且其包封mRNA和向导RNA;以及运载体配制物。在另一个实施方式中,所述运载体配制物使所述脂质纳米粒子稳定并通过促进组织驻留和组织渗透增进表面或局部递送。在一个实施方式中,所述向导RNA包括SEQ ID NO.:1-30、71-76和79-83中的任一个。
在另一个实施方式中,所述组合物包括多种向导RNA,并且所述多种向导RNA具有不同多核苷酸序列、修饰或两者。在一个特定实施方式中,所述组合物包括具有不同多核苷酸序列的向导RNA分子,并且所述不同的多种向导RNA结合至同一病毒核酸中的不同目标,或结合至不同病毒核酸中的目标。
在前述实施方式中的任一个中,阳离子性脂质可以包括1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)或N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。在一个特定实施方式中,纳米粒子被聚乙二醇化。在另一个实施方式中,所述多个纳米粒子分散于运载体配制物内,并且所述运载体配制物包括运载体液体、油或凝胶。
在前述组合物中的任一种中,Cas核酸内切酶可以是Cas9,并且相对于野生型Cas9,Cas9可任选地包含在一个与二十五个之间的氨基酸取代。例示性氨基酸取代包含R780、K810、K848、K855、H982、K1003或R1060,以及K848A、K1003A和R1060A。在一些实施方式中,mRNA的编码序列包括多个5-甲基胞苷、假尿苷或5甲氧基-尿苷。
在一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括(a)SEQ ID NO.:1-30、71-76和79-83中的任一个,或(b)与SEQ ID NO.:1-30、71-76和79-83中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。
在另一个实施方式中,mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括SEQ ID NO.:1-30、71-76和79-83中的任一个;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。
在又另一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括(a)SEQ ID NO.:31-38中的任一个,或(b)与SEQ ID NO.:31-38中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。
在又另一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括SEQ ID NO.:31-38中的任一个;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。
在又另一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括(a)SEQ ID NO.:41-46和66中的任一个,或(b)与SEQ ID NO.:41-46和66中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。
在又另一个实施方式中:mRNA包括SEQ ID NO.:55、56、57、58、59、60、67、68、69、70、77或78;向导RNA包括SEQ ID NO.:41-46和66中的任一个;并且所述多个纳米粒子分散于由运载体配制物所提供的运载体液体、油或凝胶内。
在前述实例中,阳离子性脂质可以包括1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)和N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。
在前述实例中,向导RNA可以包括SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4、37、41、43、45、74、75或76,其中所述向导RNA中的多个核苷酸进一步被具有修饰的碱基的核苷酸取代,并且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;以及2'-O-甲基假尿苷;或2'-O-甲基腺苷。
在前述实例中,向导RNA可以包括SEQ ID NO.:41、43、45、74、75或76,并且其中所述向导RNA中的多个核苷酸进一步被具有修饰的碱基的核苷酸取代,并且各修饰的碱基是2'-O-甲基胞苷;2'-O-甲基鸟苷;2'-O-甲基尿苷;以及2'-O-甲基假尿苷;或2'-O-甲基腺苷。
核糖核蛋白和相关组合物也在本公开的范围内。在一些实施方式中,向导RNA包括(a)SEQ ID NO.:1-30、71-76和79-83中的任一个;(b)SEQ ID NO.:31-38中的任一个;或(c)SEQ ID NO.:41-46和66中的任一个。在一些实施方式中,Cas是Cas9,例如Cas9核酸内切酶包括:(a)如SEQ ID NO.:61、62、63或84中所示的氨基酸序列;或(b)由如SEQ ID NO.:54、55、56、57、58、59、60、67、68、69、70、77或78中所示的核酸分子所编码的氨基酸序列。包括核糖核蛋白和药学上可接受的运载体的药物组合物也涵盖在本公开中。
纳米粒子
在一些实施方式中,本文所公开的向导RNA和Cas mRNA被包装于脂质纳米粒子中,所述脂质纳米粒子包含例如阳离子性脂质,其平衡磷酸酯主链的电荷并促进渗透穿过组织并进入细胞中以及在细胞内释放RNA。脂质纳米粒子可另外提供于表面用配制物中,所述表面用配制物含有适合的凝胶或悬浮液,如水性悬浮液,其可以包含组织驻留增强剂或增稠剂,如羟乙基纤维素或羧甲基纤维素。所述配制物可以包含增强LNP稳定性的赋形剂,如蔗糖或甘露糖醇。所述配制物可以包含增进组织渗透的赋形剂,如月桂基硫酸钠、乙醇、二乙二醇单***(Transcutol)、丙二醇、聚乙二醇(PEG)酯、蔗糖酯或N-甲基吡咯烷酮。配制的纳米粒子可用如微针阵列之类装置施用以增进RNA向基底上皮的递送。
优选地,在用于治疗病毒感染的组合物和方法中,所述组合物包含Cas核酸内切酶或编码所述Cas核酸内切酶的多核苷酸,其通过脂质体或脂质纳米粒子递送。本公开的实施方式还包含包覆于脂质体中的活性RNP,或包封于脂质纳米粒子中的多核苷酸。脂质体或纳米粒子可进一步提供于适合载体,如下文所描述的悬浮液或凝胶中。本发明的方法包含将这些组合物递送至感染部位,优选地非全身性递送。在这些方面,所述组合物和方法采用了修饰的Cas核酸内切酶,其中相对于野生型,预测的T细胞表位已被修饰成减弱免疫应答,否则通过在受感染组织中递送或表达核酸酶将引发免疫应答。
阳离子性脂质可以包含1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)或N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。优选地,所述多个纳米粒子是分散于运载体配制物内的固体脂质纳米粒子,并且所述运载体配制物包括运载体液体、油或凝胶。所述纳米粒子可以被聚乙二醇化。
在一个实施方式中,所述组合物101包含多个纳米粒子105,所述纳米粒子包括阳离子性脂质107。纳米粒子105包封mRNA 113和向导RNA 121。任何适合的纳米粒子都可以包含在内。纳米粒子105可以是如图1中所示的固体脂质纳米粒子。另外或替代地,脂质体可因多个阳离子性表面基团而用于递送mRNA 113和向导RNA 121,所述阳离子性表面基团与阴离子性核酸相互作用并形成脂质体复合物(lipoplex)。
图4显示可用于包封mRNA 113和向导RNA 121的例示性脂质体401。固体脂质纳米粒子或脂质体中任一形式均包含至少一种阳离子性脂质。
一般而言,阳离子性脂质基于头部基团结构被分成三个主要类别:单价脂质,如N(1-(2,3-二油酰基氧基)丙基)-N,N,N-三甲基氯化铵(DOTMA)和1,2-二油酰基-3-三甲基铵-丙烷(DOTAP);多价脂质,如二(十八烷基)酰胺基甘氨酰基精胺(DOGS);以及阳离子性脂质衍生物,如3β-(N-(N’,N’-二甲基氨基乙烷)-氨基甲酰基)胆固醇(DC-Chol)。疏水性链使纳米粒子具有不同特征。可发现相较于C16和C18链,肉豆蔻酰基(C14)链最适用于转染。较长的链会增加相变温度并减小脂膜的流动性,这可能不利于脂膜融合。类似地,相较于饱和烷基链脂质,具有明显较高脂质流动性的不饱和烷基链可能产生较高的转染效率。
阳离子性脂质可以用作载体以通过静电相互作用聚集并递送阴离子性核酸。通过调节阳离子性脂质与核酸的比率,过量的阳离子性涂层可以辅助载体与带负电细胞表面和核内体膜的结合,由此帮助核酸的细胞质递送。阳离子性脂质头部基团与核酸主链之间的静电相互作用促使mRNA 121和向导RNA 113包封于阳离子性脂质体中。制备方法描述于下。任选地,纳米粒子105被聚乙二醇化。
LNP的直径会通常在50-200nm的尺寸范围内,并且优选地在60-120nm的尺寸范围内,并且可任选地包含如PEG之类中性聚合物表面涂层以使蛋白质结合和不想要的吸收减到最少。纳米粒子105任选地由载体135,如水、水溶液、悬浮液或凝胶运载。例如,LNP可以被包含在用于表面递送的配制物或制剂中,如悬浮液或凝胶中。此类配制物可以包含化学增强剂,如脂肪酸、表面活性剂、酯、醇、多元醇、吡咯烷酮、胺、酰胺、亚砜、萜类、烷烃及磷脂(通过扰乱上皮或角质层的高度有序结构增进表面药物渗透)。
使用LNP可以增大有效负载RNA的溶解度,实现持续和控制释放,并因高渗透长驻留(EPR)效应而将较高浓度的RNA递送至目标区域。可以使用基于脂质的纳米粒子(脂质体和固体脂质纳米粒子)。
纳米粒子的表面药物递送可以将治疗作用直接提供至目标位点,可能减少不想要的全身副作用。有多种方式可将纳米粒子配制成供在医院中表面使用的形式,例如溶液/液体配制物形式、干燥配制物或粘性配制物(即,乳膏、洗剂、凝胶、软膏)。用于使纳米粒子悬浮的介质应具有生物相容性并用于促进经皮吸收。悬浮介质还可改变药物从纳米粒子释放的动力学。参见Goyal,2016,用于表面药物递送的纳米粒子和纳米纤维(Nanoparticlesand nanofibers for topical drug delivery),《控制释放杂志(J Control Release)》240:77-92,以引用的方式并入。
所述介质可以辅助渗透屏障,如角质层。例如,当角质层包含内嵌于由游离固醇、游离脂肪酸、三酸甘油酯及神经酰胺构成的双层基质中的角质细胞时,皮肤渗透增强剂可以增加RNA的渗透。
在某些实施方式中,LNP悬浮于缓冲液中。缓冲液可以包含渗透增强剂,如月桂基硫酸钠(SLS)。SLS是一种阴离子性表面活性剂,其通过增加表皮脂质的流动性来增强皮肤中的渗透。施加部位下方脂质流动性的增加可以使SLS最佳地扩散。由此SLS可以增加表皮内药物递送,而不是增加透皮递送。方法可以包含使用缓冲液如pH=6的200mM磷酸盐缓冲液,任选地含有约1至10%wt/wt的SLS,即约35至250mM SLS。参见Piret,2000,月桂基硫酸钠增加膦甲酸表面配制物针对小鼠1型单纯疱疹病毒皮肤病变的功效(Sodium LaurylSulfate Increases the Efficacy of a Topical Formulation of Foscarnet againstHerpes Simplex Virus Type 1Cutaneous Lesions in Mice),《抗微生物剂化学疗法(Antimic Ag Chemother)》44(9):2263-2270,以引用的方式并入。
脂质纳米粒子任选地可以通过凝胶,如聚氧化乙烯-聚氧化丙烯嵌段共聚物凝胶(任选地含有SLS)递送。泊洛沙姆(Poloxamer)是由中央聚氧化丙烯(聚(环氧丙烷))疏水性链侧接两个聚氧化乙烯(聚(环氧乙烷))亲水性链构成的非离子性三嵌段共聚物。由于聚合物嵌段的长度可以定制,故存在特性略微不同的许多不同的泊洛沙姆。对于通称“泊洛沙姆”,这些共聚物通常用字母“P”(代表泊洛沙姆)后接三个数字命名:前两个数字×100得到聚氧化丙烯核心的近似分子质量,且最后一个数字×10得到聚氧化乙烯的含量百分比(例如Kolliphor P 407=聚氧化丙烯的分子质量是4,000g/mol且聚氧化乙烯含量是70%的泊洛沙姆)。对于Pluronic和Synperonic商品名,这些共聚物的编码以一个字母定义其在室温下的物理形式开始(L=液体,P=糊浆,F=片状(固体)),后接两个或三个数字,数字标号中第一个数字(三个数字编号中的两个数字)乘以300指示疏水物的近似分子量;并且最后一个数字×10得到聚氧化乙烯含量的百分比(例如L61指示1,800g/mol的聚氧化丙烯分子质量和10%的聚氧化乙烯含量)。
脂质纳米粒子可以被冷冻干燥(例如使用右旋糖(5%w/v)作为冻干保护剂)。LNP可以保持在水性悬浮液中或例如用卵磷脂乳化。
治疗方法
本公开另一方面是本文所描述的向导RNA和相关组合物治疗病毒感染的用途。例如,在一个实施方式中,提供一种治疗受试者的病毒感染的方法,其包括向所述受试者施用治疗有效量的向导RNA、DNA、载体或Cas9-向导RNA组合物。
在一些实施方式中,本公开提供一种治疗人***瘤病毒(HPV)感染的方法。一些HPV类型可引起癌前病变(即,可能转变成癌症的异常生长),或引起癌症。某些HPV类型感染生殖器和其它区域,包含***、***、***或头颈部一些区域的内部和外部。“高风险”HPV是比较可能引起癌症的HPV类型。此类感染将正常细胞转化成癌前病变或癌症。与HPV相关的癌症包含子***、口腔癌、***癌、外阴癌、***癌及***癌。
在与HPV相关的子***中,约70%是由HPV16或HPV18引起。由HPV引起的子***可表现为癌前子宫颈病变。癌前子宫颈病变,又称为上皮内病变,是子宫颈细胞异常,其最终可发展成子***。子宫颈细胞存在两个主要类型,即鳞状细胞和腺细胞,并且任一类型中都可能出现异常。最常见的癌前子宫颈病变类型包含:非典型性鳞状细胞(子宫颈鳞状细胞异常);鳞状上皮内病变(分为低级别或高级别,其中高级别病变比较可能进展成子***);以及非典型性腺细胞(子宫颈上部区域或子宫内部可能出现的癌前病变)。推荐操作可以包含HPV测试。得到阳性测试结果后,可以治疗病变以清除HPV病毒。参见Senapati,2016,HPV介导的肿瘤进展的分子机制(Molecular mechanisms of HPV mediatedneoplastic progression),《感染因素与癌症(Infect Agent Cancer)》11:59eCollection;Ghittoni,2015,人***瘤病毒在癌发生中的作用(Role of humanpapillomavirus in carcinogenesis),《Ecancermedicalscience》9:526;以及世界卫生组织(World Health Organization),2013,WHO关于筛查和治疗癌前病变以预防子***的指导原则(WHO Guidelines for screening and treatment of precancerous lesionsfor cervical cancer prevention),WHO,日内瓦(Geneva),全部以引用的方式并入。
在一些实施方式中,所述组合物通过表面或局部施加至感染部位,如与HPV感染相关的高级别癌前病变。RNA被释放于细胞内,并且mRNA由细胞的核糖体翻译以产生Cas核酸内切酶。Cas9核酸内切酶包含连接子序列以及在N末端和/或C末端处被设计用于最佳核定位的一个或多个核定位序列(NLS)。Cas核酸内切酶与所提供的一个或多个向导RNA复合形成活性核糖核蛋白(RNP)。RNP运送至细胞核并通过向导RNA的互补部分与病毒基因组内的目标之间的序列特异性相互作用而结合至病毒基因组。在结合至病毒目标后,Cas核酸内切酶将病毒基因组裂解。由此得到的病毒DNA片段可以通过细胞途径降解或修复,由此清除或破坏感染。
图5绘示治疗HPV感染的方法501。方法501包含提供(505)根据本文所描述的实施方式的组合物101。将有效量的组合物101是以组合物的有效量施用(509)于有需要患者的感染部位。组合物101包含编码Cas核酸内切酶的mRNA 113以及向导RNA 121,所述向导RNA包括选自以下清单的向导RNA:SEQ ID NO.:1-38、71-76或79-83。多个纳米粒子105包封mRNA和向导RNA。最优选地,组合物101是通过肠胃外或表面施用509,并且避免全身循环。例如,可将组合物101直接施加至感染部位的表面,或注射至感染部位中。通过此类手段,方法501可用于治疗如鳞状细胞癌病变这样的感染部位,例如高级别癌前HPV病变。方法501可用于预防癌症,如子***、***癌、口腔癌、***癌或***癌的发作。优选地,所述方法被用于预防子***。向导RNA 121优选地包含大体上与HPV基因组中的区域互补的靶向区域127,所述向导RNA包括选自由SEQ ID NO.:1-38、71-76或79-83组成的清单的向导RNA。在某些实施方式中,以HPV的E6和/或E7基因作为目标。在一个实施方式中,提供一种治疗受试者的HPV感染的方法,其包括施用治疗有效量的包括SEQ ID NO.80的向导RNA和编码Cas9核酸内切酶的mRNA。
图6是HPV基因上HPV E6和E7基因的图谱。HPV E6和E7基因可以用作目标,使用可编程核酸酶进行抗病毒治疗。由于E6和E7蛋白质可能会致癌,故利用核酸酶靶向破坏其对应的基因可能是有用的。为设计向导RNA,针对核酸酶的前间隔序列邻近基序(PAM)(例如对于Cas9来说是5’-NGG-3’)对各基因进行扫描。对于基因内发现的每一候选PAM,读取邻近于PAM的20nt并与人类基因组相比较。如果所述20nt+PAM在人类基因组内根据特定的标准未找到匹配,则可使用所述20nt+PAM作为靶向序列。匹配标准是要求不存在完美匹配。在一个实施方式中,靶向序列是20nt+PAM(例如对于Cas9来说是23nt),对于该靶向序列而言,在人类基因组内不存在匹配≥70%的23nt链段。在一个实施方式中,靶向序列是20nt+PAM,对于该靶向序列,在人类基因组内不存在这样的20nt链段:其后接有PAM,并且其中人类基因组的20nt与靶向序列的20nt匹配率≥70%(例如,如果Cas9是该核酸酶,则应将人类基因组中具有14个或更多个相配碱基且其后接有PAM的20nt链段排除用作给定序列)。
制备药剂的方法
本发明的各方面提供一种制备用于治疗病毒感染的药剂的方法。
图10绘示制备用于治疗HPV感染的药剂(例如组合物101)的方法1001。方法1001包含制备(1005)编码Cas核酸内切酶的mRNA;制备(1009)一个或多个向导RNA,其包括选自以下清单的向导RNA:SEQ ID NO.:1-38、71-76或79-83;以及将mRNA和向导RNA包封(1013)于包括阳离子性脂质的多个纳米粒子中。可将纳米粒子引入(1019)药学上可接受的运载体,例如凝胶或悬浮液如水性悬浮液中。
在一些实施方式中,向导RNA包括选自以下之一的向导RNA:SEQ ID NO.:1、5、17、19、21、23、25、27、29、31、33、35、4及37,其任选地具有一个或多个修饰。向导RNA优选地通过固相合成法合成。固相合成是在固体支持物上,在使所有试剂和溶剂能够自由穿过的柱中进行,所述固体支持物可以被保持在过滤器之间。在固相合成的情况下,可使用大量过量的溶液相试剂来驱使反应迅速完成。洗掉杂质和过量的试剂并且不需要纯化。这一方法可以自动进行并且适合于在计算机控制的固相合成仪自动进行。固体支持物(也称为树脂)是不溶性粒子,通常具有50-200μm直径,寡核苷酸将与其结合。适合载体包含受控微孔玻璃和聚苯乙烯。
固体支持物通常被制造成每克树脂装载20-30μmol核苷。任何适合方法都可使用,包含例如H-膦酸酯和磷酸三酯法,以及Khorana的磷酸二酯方法。在一些实施方式中,使用了氨基磷酸酯方法,使用固相技术和自动化进行。
氨基磷酸酯寡核苷酸合成是沿3’至5’方向进行,并且每个合成循环添加一个核苷酸。用于合成的结构单元通常被称为“单体”,其是活化的RNA核苷(氨基磷酸酯)。二甲氧基三苯甲基(DMT)用于保护核苷的5’端,β-氰基乙基保护3’-亚磷酸酯部分,并且还可以包含额外基团,用来保护杂环核碱基中的反应性伯胺。选择保护基是为了防止在合成期间发生分支或其它不合需要的副反应。寡核苷酸是在固体支持物上合成。通常,所述支持物是填充有受控微孔玻璃(CPG)、聚苯乙烯或膜的小柱。寡核苷酸通常从3’至5’合成。所述合成以将装载有初始支持物结合的受保护核苷酸的反应柱添加至合成仪的柱支架中开始。第一个核苷酸结构单元或单体通常被锚定至长链烷基胺-受控微孔玻璃(LCAA-CPG)。用于寡核苷酸合成的氨基磷酸酯方法是在固体支持物上,通常在受控微孔玻璃(CPG)或聚苯乙烯上分四个步骤进行。合成是通过用溶解于二氯甲烷(DCM)中的二氯乙酸(DCA)短暂处理以裂解5’-三苯甲基起始。接下来,使经过四唑活化的单体与可用的5’-羟基偶合,产生亚磷酸酯键联。随后,通过使用THF/吡啶/H2O溶液,用碘处理使亚磷酸酯氧化,得到磷酸酯主链。用乙酸酐加帽步骤完成寡核苷酸合成循环,乙酸酐终止了不合需要的失败序列。参见McBride,1983,有关可用于合成脱氧寡核苷酸的若干脱氧核苷氨基磷酸酯的研究(An investigation ofseveral deoxynucleoside phosphoramidites useful for synthesizingdeoxyoligonucleotides.),《四面体通讯(Tetrahedron Lett)》24:245-248,1983;以及Kosuri,2014,大规模从头DNA合成:技术和应用(Large-scale de novo DNA synthesis:technologies and applications),《自然-方法(Nat Meth)》11:499-507,二者以引用的方式并入。
在一些实施方式中,编码Cas核酸内切酶的mRNA是通过合成所述mRNA制备。任何适合的合成方法均可使用。在一些实施方式中,所述mRNA是通过体外转录制备。体外转录使用了含有启动子的纯化的线性DNA模板、核糖核苷酸三磷酸酯、包含DTT和镁离子的缓冲液体系以及适当的噬菌体RNA聚合酶。DNA模板优选地包含用于结合噬菌体聚合酶的双链启动子。所述模板可以包含通过克隆工程改造的质粒构建体、通过从RNA前体合成第一条链和第二条链产生的cDNA模板,或通过PCR或通过使以化学方式合成的寡核苷酸退火产生的线性模板。模板可以是(例如线性化的)质粒。许多质粒包含噬菌体聚合酶启动子。任何适合的启动子都可以使用,例如可以使用三种常用聚合酶SP6、T7或T3中任一种的启动子。
在一些实施方式中,(TriLink)线性化质粒模板用于“失控转录(Run-offTranscription)”,即,当RNA聚合酶从DNA掉落时,转录停止。质粒编码近似多聚(A)80尾。所述程序共转录添加甲基化5’帽(“帽1”)。这一程序是由TriLink以专用名称CleanCap提供。所述程序可以使用呈任何比率的正常或修饰的NTP(5mC、5-甲氧基-尿苷(5moU))。在转录反应之后,用磷酸酶处理mRNA以从未加帽的mRNA去除任何5’三磷酸酯。HPLC纯化最终的mRNA产物。
在某些实施方式中,使用PCR引物,仅从质粒的mRNA编码区扩增双链DNA模板。一个PCR引物含有多聚(A)120尾,以防止出现质粒中多聚(A)尾损失的问题。这一程序可以使用呈任何比率的正常或修饰的NTP(5mC、Ψ),并且可以进行共转录、或转录后和用酶加帽。在转录之后,用磷酸酶处理mRNA以从未加帽的mRNA去除任何5'三磷酸酯。通过离心柱(spincolumn)纯化mRNA以去除dsRNA。这一程序是由Amp-Tec提供。
一般而言,用于转录模板的质粒载体可以通过限制酶消化线性化。由于转录进行到DNA模板末端,故线性化确保产生指定长度和序列的RNA转录物。PCR产物也可以用作转录模板。可通过在正向或反向PCR引物的5’端包含启动子序列,将启动子添加至PCR产物中。
接着,在核苷三磷酸酯(rNTP)存在下,利用T7、T3或SP6 RNA噬菌体聚合酶转录模板DNA。所述聚合酶穿过模板链并使用与DNA碱基配对来合成互补RNA链(使用尿嘧啶代替胸腺嘧啶)。RNA聚合酶从DNA模板链的3’→5’端行进,沿5’→3’方向产生RNA分子。参见Jani,2012,Gaussia荧光素酶mRNA进行体外转录和加帽,随后转染海拉细胞(In vitroTranscription and Capping of Gaussia Luciferase mRNA Followed by HeLa CellTransfection),《实验视频杂志(J Vis Exp)》61:3702,以引用的方式并入。
可通过任何适合方法将mRNA和向导RNA包封于包括阳离子性脂质的多个纳米粒子中。制备方法可以包含将阳离子性脂质体与mRNA溶液直接混合,或用mRNA溶液使薄层脂膜复溶。阳离子性脂质/mRNA复合物分散于水溶液中通常产生异质复合物,有时仍称为阳离子性脂质体,但更准确地称为脂质体复合物。脂质体复合物可以包封高达90%输入剂量的核酸货物(cargo)。参见Wang,2015,用脂质纳米粒子递送寡核苷酸(Delivery ofoligonucleotides with lipid nanoparticles),《先进药物递送综述(Adv Drug DelivRev)》87:68-80,以引用的方式并入。
在一些实施方式中,修饰的mRNA(例如用基于T7聚合酶的IVT试剂盒制备,产率是约60μg/反应)与预先形成的DOTAP(1,2-二油酰基-3-三甲基铵-丙烷)/胆固醇(1:1摩尔比)脂质体发生静电相互作用。阳离子性脂质头部基团与核酸主链之间的静电相互作用促使mRNA包封于阳离子性脂质体中。由此得到自组装的、基于脂质体的核心膜纳米粒子配制物。静电相互作用通过诱导脂质双层在核心结构上塌陷,产生具有核心/膜结构的球形固体脂质体纳米粒子,由此促进自组装。参见Wang,2013,全身性递送编码单纯疱疹病毒1胸苷激酶的修饰的mRNA用于靶向癌症基因疗法(Systematic delivery of modified mRNAencoding herpes simplex virus 1thymidine kinase for targeted cancer genetherapy),《分子治疗学(Mol Ther)》21(2):358-367,以引用的方式并入。
制备方法可以包含将阳离子性脂质体与mRNA溶液直接混合,或用RNA溶液使薄层脂膜复溶。阳离子性脂质/RNA复合物分散于水溶液中可产生异质复合物,有时仍称为阳离子性脂质体,也称为脂质体复合物。脂质体复合物可以包封高达90%输入剂量的核酸货物。参见Wang,2015,用脂质纳米粒子递送寡核苷酸,《先进药物递送综述》87:68-80,以引用的方式并入。
在一些实施方式中,修饰的mRNA(例如用基于T7聚合酶的IVT试剂盒制备,产率是约60μg/反应)与预先形成的DOTAP(1,2-二油酰基-3-三甲基铵-丙烷)/胆固醇(1:1摩尔比)脂质体发生静电相互作用。由此得到自组装的、基于脂质体的核心膜纳米粒子配制物。静电相互作用通过诱导脂质双层在核心结构上毁坏,产生具有核心/膜结构的球形固体脂质体纳米粒子,由此促进自组装。参见Wang,2013,全身性递送编码单纯疱疹病毒1胸苷激酶的修饰的mRNA用于靶向癌症基因疗法,《分子治疗学》21(2):358-367,以引用的方式并入。因此,在一些实施方式中,纳米粒子另外包括N-[1-(2,3-二油酰基氧基)丙基]-N,N,N-三甲基铵硫酸甲酯(DOTAP)。纳米粒子可以包含1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)。
在某些实施方式中,HPLC纯化的含1-甲基假尿苷的mRNA可以使用自组装方法包封于LNP中。LNP是使用可离子化脂质L319、二硬脂酰基磷脂酰胆碱(DSPC)、胆固醇和PEG-DMG以55:10:32.5:2.5(L319:DSPC:胆固醇:PEG-DMG)的摩尔比制备。以脂质氮与siRNA磷酸酯比率为3引入mRNA,所述比率对应于约10:1的总脂质与mRNA重量比。使用自发囊泡形成方法制备LNP。在pH 4的10mmol/l柠檬酸盐缓冲液中将mRNA稀释至约1mg/ml。溶解脂质并以适当比率混合于乙醇中。使用注射泵分别以15ml/min和5ml/min递送mRNA溶液和脂质溶液。将含有mRNA溶液和脂质溶液的注射器连接至配有PEEK高效液相色谱管(对于siRNA溶液是0.02in ID并且对于脂质溶液是0.01in ID)的接头连接器(0.05in通孔,#P-728;华盛顿州橡港市(Oak Harbor,WA)的IDEX Health&Science)。将一定长度的PEEK高效液相色谱管(0.04in ID)连接至接头连接器的出口并通向收集管。接着去除乙醇,并用磷酸盐缓冲生理盐水(155mmol/l NaCl、3mmol/l Na2HPO4、1mmol/l KH2PO4,pH 7.5),通过透析或切向流渗滤更换外部缓冲液。最后,通过0.2μm无菌过滤器过滤LNP。LNP优选地含有可离子化阳离子性脂质/磷脂酰胆碱/胆固醇/PEG-脂质(50:10:38.5:1.5mol/mol),以约0.05(wt/wt)的RNA与总脂质比率包封,并且具有约80nm的直径。可在-80℃下储存mRNA浓度是约1μg/μl的mRNA-LNP配制物。参见Maier,2013,能够迅速地消除脂质纳米粒子的可生物降解脂质用于全身递送RNAi治疗剂(Biodegradable lipids enabling rapidly eliminating lipidnanoparticles for systemic delivery of RNAi therapeutics),《分子治疗学》21(8):1570-1578,以引用的方式并入。相关背景,参见WO 2016/089433 Al、WO 2015/006747 A2、WO 2014/093924 Al及WO2013/052523 Al,全部以引用的方式并入。
图11显示用于验证RNP特异性的策略。将CRISPR组分以及双链寡脱氧核苷(dsODN)电穿孔放入目标细胞中。将细胞与RNP一起培育并由Cas9引入的断裂捕捉dsODN。1天之后,提取基因组DNA(gDNA)并进行样品制备,其包含添加接头以建立测序文库。使用测序鉴别捕捉的dsODN。
因此,可以通过基于测序的全基因组无偏双链断裂鉴别(GUIDE-seq)方法评估脱靶活性。参见Tsai,2015,GUIDE-seq能够对由CRISPR-Cas核酸酶引起的脱靶裂解进行全基因组图谱分析,《自然·生物技术》33:187-197,以引用的方式并入。使用Tsai,2015的GUIDE-seq方法测定组合物101的脱靶作用。利用这种手段,可显示出组合物101具有可接受的低脱靶作用和高在靶特异性。
除通过所公开的mRNA和递送方法带来的良好在靶特异性外,所公开的组合物且特别是包封于脂质纳米粒子中的mRNA在目标组织和细胞中展现良好渗透和释放,其中mRNA的释放使其能够例如通过翻译成活性蛋白质进行表达。
实施例1
具有修饰的T细胞表位的Cas9蛋白质变体
对野生型酿脓链球菌Cas9氨基酸序列SEQ ID NO.:63进行表位分析。使用多个计算机模拟预测工具鉴别可能的针对HLA-DRB1的MHC II限制性CD4 T细胞表位,以进行诱变,所述工具包含:SYFPETHI、IEDB(利用默认设置完成的分析、Consensus、NetMHCpan、NN_align、SMM_allign、组合文库及Sturniolo)、RANKPEP、ProPred、MULTIPRED2、MHCIIPred、MHC2SKpan及NetMHCII。
针对SEQ ID NO.:63预测得到七个表位:表位1(包含氨基酸149-165);表位2(包含氨基酸235-249);表位3(包含氨基酸566-580);表位4(包含氨基酸721-735);表位5(包含880-894;表位6包含氨基酸952-966);以及表位7包含氨基酸(1312-1326)。
参照SEQ ID NO.:62,所述七个表位如下:表位1包含氨基酸165-181;表位2包含氨基酸251-265;表位3包含氨基酸582-596;表位4包含氨基酸737-751;表位5包含氨基酸896-910;表位6包含氨基酸968-982;以及表位7包含氨基酸1328-1342。
继续参照SEQ ID NO.:62,各表位可以具有如下子序列(参照SEQ ID NO.:62):在表位1中,特别值得关注的可以是子区1a(氨基酸168-176)或子区1b(氨基酸170-178);在表位2中,子区2a是氨基酸255-263;在表位3中,子区3a是氨基酸586-594;在表位4中,子区4a包含氨基酸741-749;在表位5中,子区5a包含氨基酸900-908;在表位6中,子区6a包含氨基酸972-980;在表位7中,子区7a包含氨基酸1332-1340。Cas9的前述表位和子区因其被鉴定为可能具有高免疫原性的潜在表位而特别值得关注。
为了分析表位的可突变性,根据apo-Cas9 3D晶体结构数据、与sgRNA结合的Cas9结构以及sgRNA-Cas9-dsDNA结构检查各表位,以确定各表位中以粗体显示的重要残基的重要性。例如,可能会发现大多数残基可以突变成丙氨酸以减少表位的电荷问题,而不可能影响结构或功能。还可能会发现,丙氨酸残基可以保守突变成丝氨酸。
实施例2
靶向HPV16的Cas9组合物
提供基因编码的mRNA DNA,通过T7噬菌体聚合酶进行转录,同时通过氨基磷酸酯合成法合成向导RNA。
作为体外测试,将Cas9、向导RNA和目标DNA混合并培育以进行体外核酸内切酶分析。如图7中所示,对消化的DNA进行DNA凝胶电泳揭示了高核酸内切酶活性。四个泳道显示E6-E7区域的PCR扩增子以及体外RNP处理的扩增子的产物的结果。泳道2-4各自显示相对于对照的差异。泳道3显示HPV基因组DNA裂解成具有独特质量的三个片段。由于gRNA被设计成在E6或E7基因内匹配,故这些数据表明,可以通过Cas9-向导RNA介导的裂解使相应蛋白质的表达停止。
图8显示体外分析的结果,显示递送(通过电穿孔)Cas9(SEQ ID NO.:54)和向导RNA(SEQ ID NO.:2)可减少SiHa细胞中HPV基因组的拷贝数。(A)在被提供HPV16靶向性向导RNA的细胞中的病毒DNA水平要低于被提供非特异性向导RNA的细胞。(B)被提供HPV16靶向性向导RNA的HPV16+SiHa细胞中的细胞死亡要多于被提供非特异性向导RNA的HPV16+细胞(左图)。HPV16阴性293细胞中的细胞死亡要低得多,不管是否提供HPV16靶向性向导RNA和或非特异性向导RNA(右图)。
图9展示,可使用CRISPR/Cas9在体外杀灭HPV16+SiHa癌细胞。相较于接受非特异性向导RNA的细胞,电穿孔放入Cas9 mRNA(SEQ ID NO.:54)和HPV16靶向性向导RNA(SEQ IDNO.:2)的细胞的细胞毒性较高。细胞杀灭往往随治疗后天数(左图)且随着Cas9 mRNA的量增加(右图)而增加。
实施例3
靶向HPV16的Cas9组合物
图12显示如实施例5中所描述,通过GUIDE-Seq检测到的在不同剂量时向导RNA针对HPV16基因组靶向部分(SEQ ID NO.:64和65)的特异性。当以SEQ ID NO.:64或SEQ IDNO.:65作为目标时,特异性是99.9%至100%。
图13显示使用无细胞DNA裂解分析测量的Cas核酸内切酶对于HPV16靶向性向导RNA 1.1.1(SEQ ID NO.:2)(圆圈);1.1.3(SEQ ID NO.:4)(正方形)及E6-1 BNA/LNA(SEQID NO.:83)(菱形)的在靶(左图)和脱靶(右图)DNA裂解效率的结果。预培育Cas9蛋白质和gRNA以形成核糖核蛋白复合物。接着添加含有gRNA目标序列的双链DNA,使CRISPR复合物裂解DNA一段较短时间,随后淬灭反应。利用毛细管凝胶电泳分离裂解和未裂解的DNA产物并定量。
原间隔序列中BNA/LNA修饰的核苷酸降低针对脱靶DNA的活性,同时维持针对在靶DNA的活性。
图14显示通过GUIDE-Seq测定的对于HPV靶向性向导RNA 1.1.1(SEQ ID NO.:2)(A)、1.1.3(SEQ ID NO.:4)(B)及E6-1 BNA/LNA(SEQ ID NO.:83)(C)的细胞内DNA裂解特异性。结果显示,包含至少一个构象限制性核苷酸如锁核酸或桥连核酸残基可明显改善体内裂解特异性。
实施例4
含有mRNA的脂质纳米粒子的组织渗透
图15显示含有编码绿色荧光蛋白(GFP)的mRNA的脂质纳米粒子成功组织渗透。在将LNP包封的mRNA***内递送至子宫颈上皮PBS之后由小鼠子宫颈得到的切片的显微照片用作阴性对照。Turbofect是可商购的转染试剂。LNP 1A是包封于脂质纳米粒子中的GFPmRNA。LNP 1B是包封于含不同脂质组成(MC3)的另一脂质纳米粒子中的GFP mRNA。所述mRNA编码GFP,由此GFP指示由LNP递送的mRNA翻译的所表达的活性蛋白质。箭头指示LNP 1A和LNP 1B的荧光明显大于PBS或Turbofect的区域。结果显示,LNP 1A和LNP 1B使得表达的蛋白质广泛分布于子宫颈上皮中。
实施例5
Cas9 mRNA+HPV16 E7 gRNA的特异性
通过无偏深度测序GUIDE-Seq方法测量HPV16靶向性向导RNA的在靶和脱靶活性。通过Guide Seq并如《自然·生物技术》2015年2月;33(2):187-197.doe:10.1038/nbt.3117中所描述,测定DNA双链断裂的无偏鉴别。
简单点说,用Cas9 mRNA(SEQ ID NO.:68,或编码高保真度Cas9变体的序列,SEQID NO.:59及SEQ ID NO.:60)、向导RNA(SEQ ID NO.:6)及整合于DNA双链断裂处的双链寡脱氧核苷酸(dsODN)共转染细胞。图7展示dsODN的成功并入。上图是并入基因组DNA(阴影线条形)中的dsODN(空心条形)的示意图。下图显示两个独特的PCR反应以及其相应凝胶电泳图像,展示35bp dsODN并入SiHa基因组DNA中。在CRISPR处理和dsODN整合之后,通过超声波处理来分离并剪切基因组DNA,接着将接头连接至剪切的DNA。在MiSeq下一代测序机器上执行dsODN特异性扩增和测序。如https://github.com/aryeelab/guideseq所描述,执行序列加工。以在靶“读段”百分比(即,通过用在靶读段的数量除以读段总数×100)来计算特异性。
如图23中所示,当在HPV16+SiHa细胞中,将对应于SEQ ID NO.:68的Cas9 mRNA与gRNA(SEQ ID NO.:6)一起使用时(上表),目标序列裂解具有高特异性,显示无脱靶作用且在靶裂解比率超过99%。使用相同的RNA,在2个HPV16阴性细胞系(C33a、293T)中未检测到脱靶读段。当用相同的gRNA(SEQ ID NO.:6)递送高保真度Cas9 mRNA序列时(下表),在靶裂解比率甚至更高(100%在靶上)。
实施例6
与构象限制性核苷酸(CRN)修饰的HPV16 E7 gRNA联用的Cas9的特异性增强
相较于未修饰的核苷酸,构象限制性核苷酸(CRN)修饰的核苷酸对于形成非沃森克里克碱基对具有较低容许度。因此,将CRN修饰添加至gRNA的靶向区域中并进行测试以确定是否相较于未修饰的核苷酸,其保持高的在靶活性以及在预测的脱靶DNA位点具有增加的特异性。
使用无细胞裂解分析评估CRN修饰的向导RNA靶向HPV16的有效性。将含有E7基因目标或已知的HPV16向导1.2的潜在脱靶位点的2kb双链DNA与预先形成的核糖核蛋白一起培育,所述核糖核蛋白由Cas9蛋白质(SEQ ID NO.:61)以及未修饰的向导RNA(SEQ ID NO.:6)或在原间隔序列中特别选择的位置处含有BNA或LNA修饰的向导RNA(SEQ ID NO.:79)组成。用作对照的向导RNA是靶向EBV基因组的向导RNA(SEQ ID NO.:47)。通过用毛细管凝胶电泳分离裂解和未裂解的DNA产物,测定裂解的目标DNA的量。如图24A中所示,当用BNA或LNA修饰的向导RNA形成RNP时,对脱靶DNA的活性相对于用未修饰的向导RNA形成的RNP减少。
为评估目标完整性,通过电穿孔(核转染)将RNA递送至HPV16+SiHa细胞中。在37℃和5%CO2下,培育细胞24小时。接着,收集总基因组DNA并使用特定探针定量扩增E7基因目标和管家基因PPIA。针对PPIA的量使每一样品归一化。如图24B中所示,CRN修饰的向导RNA针对细胞中HPV16 E7的作用与未修饰的向导RNA大致同样有效,展示脱靶活性的减小不是仅由总体活性减小引起的。
使用SiHa杀灭分析评估Cas9/向导RNA组合物杀灭病毒细胞的能力(图24C)。通过电穿孔(核转染)将RNA递送至HPV16+SiHa细胞中。在37℃和5%CO2下,培育细胞8天,之后,将细胞取出并通过流式细胞术计数。第8天活细胞的相对比例显示于图24C中,针对仅用缓冲液核转染的细胞归一化。在SiHa杀灭分析中,CRN修饰的向导RNA与未修饰的向导RNA大致同样有效。
在本说明书中提到的和/或应用数据表中所列的所有美国专利、美国专利申请公开、美国专利申请、外国专利、外国专利申请以及非专利公开,包含2017年3月31日提交的美国临时专利申请第62/479,643号和2017年5月18日提交的美国临时专利申请62/507,963,都以全文引用的方式并入本文中。必要时,可以修改这些实施方式的各方面以采用不同专利、申请以及公开的观点来提供更进一步的实施方式。
尽管已经说明和描述了本发明的具体实施方式,但应易于了解,可以组合上文所描述的各种实施方式以提供进一步的实施方式,并且可以在不脱离本发明的精神和范围的情况下对实施方式作出各种改变。根据以上详细描述,可以对实施方式进行这些改变和其它改变。
一般来说,在所附权利要求书中,所用术语不应被解释为将权利要求书限于本说明书和权利要求书中所公开的特定实施方式,而应解释为包含所有可能的实施方式以及这份权利要求书所有权获得的等效物的全部范围。因此,权利要求书不受公开内容限制。
序列表
<110> 埃吉诺维亚公司
D·D·斯隆恩
S·勒杜
X·C·熊
M·P·豪斯利
<120> 抗病毒治疗剂
<130> 930285.421WO
<140> PCT
<141> 2018-03-30
<150> US 62/507,963
<151> 2017-05-18
<150> US 62/479,643
<151> 2017-03-31
<160> 84
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.1.0
<400> 1
ugcaauguuu caggacccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 2
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.1.1
<220>
<221> modified_base
<222> 1
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 99, 100, 101
<223> um, 硫代磷酸酯键
<400> 2
ugcaauguuu caggacccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 3
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.1.2
<220>
<221> modified_base
<222> 1
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<220>
<221> misc_feature
<222> (1)...(102)
<223> n = um
<400> 3
ugcaangnun caggacccac gnunuagagc nagaaanagc aagnuaaaan aaggcnagnc 60
cgnuancaac ungaaaaagn ggcaccgagu cggngcnuuu uu 102
<210> 4
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.1.3
<220>
<221> modified_base
<222> 1
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 3
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 4
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 14
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 4
ugcaauguuu caggacccac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 5
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.0
<400> 5
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 6
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.1
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 6
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 7
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.2
<220>
<221> modified_base
<222> 1
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 8
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 17
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 7
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 8
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.3
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 7
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 9
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 16
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 18
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 20
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 8
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 9
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.4
<220>
<221> modified_base
<222> 1
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 6, 10, 16
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 9
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 10
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.5
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 8,16,18
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 10
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 11
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.6
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 8,17,20
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 11
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 12
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.7
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 9,18
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 12
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 13
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.8
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 7,16
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 13
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 14
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.9
<220>
<221> modified_base
<222> 1
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 8,17,20
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 14
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 15
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.10
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 9,18
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 15
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 16
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.11
<220>
<221> modified_base
<222> 1
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 7,16,20
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 16
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 17
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.12.0
<400> 17
gcaaguguga cucuacgcuu uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 18
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.2.12
<220>
<221> modified_base
<222> 1
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 8,17
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (98)...(100)
<223> um, 硫代磷酸酯键
<400> 18
gcaaguguga cucuacgcuu uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 19
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.3.0
<400> 19
uccaccgacc ccuuauauua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 20
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.3
<220>
<221> modified_base
<222> 1
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 20
uccaccgacc ccuuauauua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 21
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.4.0
<400> 21
gcaacaagac auacaucgac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 22
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.4
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 22
gcaacaagac auacaucgac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 23
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.5.0
<400> 23
acuuucuggg ucgcuccugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 24
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.5
<220>
<221> modified_base
<222> 1
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 24
acuuucuggg ucgcuccugu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 25
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.6.0
<400> 25
gaccuguuaa ugggcacacu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 26
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.6
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 26
gaccuguuaa ugggcacacu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 27
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.7.0
<400> 27
ugcagcucug ugcauaacug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 28
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.7
<220>
<221> modified_base
<222> 1
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 28
ugcagcucug ugcauaacug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 29
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.8.0
<400> 29
cauaacugug guaacuuucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 30
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 1.8
<220>
<221> modified_base
<222> 1
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 30
cauaacugug guaacuuucu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 31
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV18向导 2.1.0
<400> 31
caagcuaccu gaucugugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 32
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV18向导 2.1
<220>
<221> modified_base
<222> 1
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 32
caagcuaccu gaucugugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 33
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV18向导 2.2.0
<400> 33
gcgcuuugag gauccaacag uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 34
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV18向导 2.2
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (98)...(100)
<223> um, 硫代磷酸酯键
<400> 34
gcgcuuugag gauccaacag uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 35
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV18向导 2.3.0
<400> 35
auuaaguaug cauggaccua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 36
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV18向导 2.3
<220>
<221> modified_base
<222> 1
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2, 3, 99, 100, 101
<223> am, 硫代磷酸酯键
<400> 36
auuaaguaug cauggaccua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 37
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV18向导 2.4.0
<400> 37
gagcaauuaa gcgacucagg uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 38
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV18向导 2.4
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 38
gagcaauuaa gcgacucagg uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 39
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成序列靶向部分 1.1
<400> 39
ugcaauguuu caggacccac 20
<210> 40
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成序列靶向部分 2.1
<400> 40
caagcuaccu gaucugugca 20
<210> 41
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HBV向导3.1.1.0
<400> 41
ggggcgcacc ucucuuuacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 42
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HBV向导3.1.1
<220>
<221> modified_base
<222> 1, 2, 3
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 42
ggggcgcacc ucucuuuacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 43
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HBV向导3.1.2.0
<400> 43
uccgcaguau ggaucggcag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 44
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HBV向导3.1.2
<220>
<221> modified_base
<222> 1
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2,3
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 44
uccgcaguau ggaucggcag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 45
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HBV向导3.1.3.0
<400> 45
gauugagauc uucugcgacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 46
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HBV向导3.1.3
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 4
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 46
gauugagauc uucugcgacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列 sgEBV1
<400> 47
gccctggacc aacccggccc 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列 sgEBV2
<400> 48
ggccgctgcc ccgctccggg 20
<210> 49
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成序列sgEBV3
<400> 49
ggaagacaat gtgccgcca 19
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列sgEBV4
<400> 50
tctggaccag aaggctccgg 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列sgEBV5
<400> 51
gctgccgcgg agggtgatga 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列sgEBV6
<400> 52
ggtggcccac cgggtccgct 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列sgEBV7
<400> 53
gtcctcgagg gggccgtcgc 20
<210> 54
<211> 4401
<212> RNA
<213> 酿脓链球菌 (Streptococcus pyogenes)
<400> 54
gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggc 60
cccaaagaag aagcggaagg ucgguaucca cggaguccca gcagccgaca agaaguacag 120
caucggccug gacaucggca ccaacucugu gggcugggcc gugaucaccg acgaguacaa 180
ggugcccagc aagaaauuca aggugcuggg caacaccgac cggcacagca ucaagaagaa 240
ccugaucgga gcccugcugu ucgacagcgg cgaaacagcc gaggccaccc ggcugaagag 300
aaccgccaga agaagauaca ccagacggaa gaaccggauc ugcuaucugc aagagaucuu 360
cagcaacgag auggccaagg uggacgacag cuucuuccac agacuggaag aguccuuccu 420
gguggaagag gacaagaagc acgagagaca ccccaucuuc ggcaacaucg uggacgaggu 480
ggccuaccac gagaaguacc ccaccaucua ccaccugaga aagaaacugg uggacagcac 540
cgacaaggcc gaccugagac ugaucuaccu ggcccuggcc cacaugauca aguucagagg 600
ccacuuccug aucgagggcg accugaaccc cgacaacagc gacguggaca agcuguucau 660
ccagcuggug cagaccuaca accagcuguu cgaggaaaac cccaucaacg ccagcggcgu 720
ggacgccaag gcuauccugu cugccagacu gagcaagagc agaaggcugg aaaaucugau 780
cgcccagcug cccggcgaga agaagaacgg ccuguucggc aaccugauug cccugagccu 840
gggccugacc cccaacuuca agagcaacuu cgaccuggcc gaggaugcca aacugcagcu 900
gagcaaggac accuacgacg acgaccugga caaccugcug gcccagaucg gcgaccagua 960
cgccgaccug uuccuggccg ccaagaaccu gucugacgcc auccugcuga gcgacauccu 1020
gagagugaac accgagauca ccaaggcccc ccugagcgcc ucuaugauca agagauacga 1080
cgagcaccac caggaccuga cccugcugaa agcucucgug cggcagcagc ugccugagaa 1140
guacaaagaa aucuucuucg accagagcaa gaacggcuac gccggcuaca ucgauggcgg 1200
cgcuagccag gaagaguucu acaaguucau caagcccauc cuggaaaaga uggacggcac 1260
cgaggaacug cucgugaagc ugaacagaga ggaccugcug agaaagcaga gaaccuucga 1320
caacggcagc aucccccacc agauccaccu gggagagcug cacgcuaucc ugagaaggca 1380
ggaagauuuu uacccauucc ugaaggacaa ccgggaaaag aucgagaaga uccugaccuu 1440
caggaucccc uacuacgugg gcccccuggc cagaggcaac agcagauucg ccuggaugac 1500
cagaaagagc gaggaaacca ucacccccug gaacuucgag gaaguggugg acaagggcgc 1560
cagcgcccag agcuucaucg agagaaugac aaacuucgau aagaaccugc ccaacgagaa 1620
ggugcugccc aagcacagcc ugcuguacga guacuucacc guguacaacg agcugaccaa 1680
agugaaauac gugaccgagg gaaugagaaa gcccgccuuc cugagcggcg agcagaaaaa 1740
ggccaucgug gaccugcugu ucaagaccaa cagaaaagug accgugaagc agcugaaaga 1800
ggacuacuuc aagaaaaucg agugcuucga cuccguggaa aucuccggcg uggaagauag 1860
auucaacgcc ucccugggca cauaccacga ucugcugaaa auuaucaagg acaaggacuu 1920
ccuggauaac gaagagaacg aggacauucu ggaagauauc gugcugaccc ugacacuguu 1980
ugaggaccgc gagaugaucg aggaaaggcu gaaaaccuac gcucaccugu ucgacgacaa 2040
agugaugaag cagcugaaga gaaggcggua caccggcugg ggcaggcuga gcagaaagcu 2100
gaucaacggc aucagagaca agcagagcgg caagacaauc cuggauuucc ugaaguccga 2160
cggcuucgcc aaccggaacu ucaugcagcu gauccacgac gacagccuga cauucaaaga 2220
ggacauccag aaagcccagg uguccggcca gggcgacucu cugcacgagc auaucgcuaa 2280
ccuggccggc agccccgcua ucaagaaggg cauccugcag acagugaagg ugguggacga 2340
gcucgugaaa gugaugggca gacacaagcc cgagaacauc gugaucgaga uggcuagaga 2400
gaaccagacc acccagaagg gacagaagaa cucccgcgag aggaugaaga gaaucgaaga 2460
gggcaucaaa gagcugggca gccagauccu gaaagaacac cccguggaaa acacccagcu 2520
gcagaacgag aagcuguacc uguacuaccu gcagaauggc cgggauaugu acguggacca 2580
ggaacuggac aucaacagac uguccgacua cgauguggac cauaucgugc cucagagcuu 2640
ucugaaggac gacuccaucg auaacaaagu gcugacucgg agcgacaaga acagaggcaa 2700
gagcgacaac gugcccuccg aagaggucgu gaagaagaug aagaacuacu ggcgacagcu 2760
gcugaacgcc aagcugauua cccagaggaa guucgauaac cugaccaagg ccgagagagg 2820
cggccugagc gagcuggaua aggccggcuu caucaagagg cagcuggugg aaaccagaca 2880
gaucacaaag cacguggcac agauccugga cucccggaug aacacuaagu acgacgaaaa 2940
cgauaagcug auccgggaag ugaaagugau cacccugaag uccaagcugg uguccgauuu 3000
ccggaaggau uuccaguuuu acaaagugcg cgagaucaac aacuaccacc acgcccacga 3060
cgccuaccug aacgccgucg ugggaaccgc ccugaucaaa aaguacccua agcuggaaag 3120
cgaguucgug uacggcgacu acaaggugua cgacgugcgg aagaugaucg ccaagagcga 3180
gcaggaaauc ggcaaggcua ccgccaagua cuucuucuac agcaacauca ugaacuuuuu 3240
caagaccgaa aucacccugg ccaacggcga gaucagaaag cgcccucuga ucgagacaaa 3300
cggcgaaacc ggggagaucg ugugggauaa gggcagagac uucgccacag ugcgaaaggu 3360
gcugagcaug ccccaaguga auaucgugaa aaagaccgag gugcagacag gcggcuucag 3420
caaagagucu auccugccca agaggaacag cgacaagcug aucgccagaa agaaggacug 3480
ggaccccaag aaguacggcg gcuucgacag cccuaccgug gccuacucug ugcugguggu 3540
ggcuaaggug gaaaagggca aguccaagaa acugaagagu gugaaagagc ugcuggggau 3600
caccaucaug gaaagaagca gcuuugagaa gaacccuauc gacuuucugg aagccaaggg 3660
cuacaaagaa gugaaaaagg accugaucau caagcugccu aaguacuccc uguucgagcu 3720
ggaaaacggc agaaagagaa ugcuggccuc ugccggcgaa cugcagaagg gaaacgagcu 3780
ggcccugccu agcaaauaug ugaacuuccu guaccuggcc ucccacuaug agaagcugaa 3840
gggcagcccu gaggacaacg aacagaaaca gcuguuugug gaacagcaua agcacuaccu 3900
ggacgagauc aucgagcaga ucagcgaguu cuccaagaga gugauccugg ccgacgccaa 3960
ucuggacaag gugcugucug ccuacaacaa gcacagggac aagccuauca gagagcaggc 4020
cgagaauauc auccaccugu ucacccugac aaaccugggc gcuccugccg ccuucaagua 4080
cuuugacacc accaucgacc ggaagaggua caccagcacc aaagaggugc uggacgccac 4140
ccugauccac cagagcauca ccggccugua cgagacaaga aucgaccugu cucagcuggg 4200
aggcgacaag agaccugccg ccacuaagaa ggccggacag gccaaaaaga agaagugagc 4260
ucgcuuucuu gcuguccaau uucuauuaaa gguuccuuug uucccuaagu ccaacuacua 4320
aacuggggga uauuaugaag ggccuugagc aucuggauuc ugccuaauaa aaaacauuua 4380
uuuucauugc gagcggccgc a 4401
<210> 55
<211> 4401
<212> RNA
<213> 人工序列
<220>
<223> 修饰的S. pyogenes Cas9 序列
<220>
<221> modified_base
<222> (1)...(4401)
<223> c = 5-甲基胞苷
<220>
<221> misc_feature
<222> (1)...(4401)
<223> n = 假尿苷
<400> 55
gggagacann ngcnncngac acaacngngn ncacnagcaa ccncaaacag ccaccanggc 60
cccaaagaag aagcggaagg ncggnancca cggagnccca gcagccgaca agaagnacag 120
cancggccng gacancggca ccaacncngn gggcngggcc gngancaccg acgagnacaa 180
ggngcccagc aagaaannca aggngcnggg caacaccgac cggcacagca ncaagaagaa 240
ccngancgga gcccngcngn ncgacagcgg cgaaacagcc gaggccaccc ggcngaagag 300
aaccgccaga agaaganaca ccagacggaa gaaccgganc ngcnancngc aagagancnn 360
cagcaacgag anggccaagg nggacgacag cnncnnccac agacnggaag agnccnnccn 420
ggnggaagag gacaagaagc acgagagaca ccccancnnc ggcaacancg nggacgaggn 480
ggccnaccac gagaagnacc ccaccancna ccaccngaga aagaaacngg nggacagcac 540
cgacaaggcc gaccngagac ngancnaccn ggcccnggcc cacanganca agnncagagg 600
ccacnnccng ancgagggcg accngaaccc cgacaacagc gacgnggaca agcngnncan 660
ccagcnggng cagaccnaca accagcngnn cgaggaaaac cccancaacg ccagcggcgn 720
ggacgccaag gcnanccngn cngccagacn gagcaagagc agaaggcngg aaaancngan 780
cgcccagcng cccggcgaga agaagaacgg ccngnncggc aaccnganng cccngagccn 840
gggccngacc cccaacnnca agagcaacnn cgaccnggcc gaggangcca aacngcagcn 900
gagcaaggac accnacgacg acgaccngga caaccngcng gcccagancg gcgaccagna 960
cgccgaccng nnccnggccg ccaagaaccn gncngacgcc anccngcnga gcgacanccn 1020
gagagngaac accgaganca ccaaggcccc ccngagcgcc ncnanganca agaganacga 1080
cgagcaccac caggaccnga cccngcngaa agcncncgng cggcagcagc ngccngagaa 1140
gnacaaagaa ancnncnncg accagagcaa gaacggcnac gccggcnaca ncganggcgg 1200
cgcnagccag gaagagnncn acaagnncan caagcccanc cnggaaaaga nggacggcac 1260
cgaggaacng cncgngaagc ngaacagaga ggaccngcng agaaagcaga gaaccnncga 1320
caacggcagc ancccccacc aganccaccn gggagagcng cacgcnancc ngagaaggca 1380
ggaagannnn nacccanncc ngaaggacaa ccgggaaaag ancgagaaga nccngaccnn 1440
caggancccc nacnacgngg gcccccnggc cagaggcaac agcaganncg ccnggangac 1500
cagaaagagc gaggaaacca ncacccccng gaacnncgag gaagnggngg acaagggcgc 1560
cagcgcccag agcnncancg agagaangac aaacnncgan aagaaccngc ccaacgagaa 1620
ggngcngccc aagcacagcc ngcngnacga gnacnncacc gngnacaacg agcngaccaa 1680
agngaaanac gngaccgagg gaangagaaa gcccgccnnc cngagcggcg agcagaaaaa 1740
ggccancgng gaccngcngn ncaagaccaa cagaaaagng accgngaagc agcngaaaga 1800
ggacnacnnc aagaaaancg agngcnncga cnccgnggaa ancnccggcg nggaaganag 1860
anncaacgcc ncccngggca canaccacga ncngcngaaa annancaagg acaaggacnn 1920
ccngganaac gaagagaacg aggacanncn ggaagananc gngcngaccc ngacacngnn 1980
ngaggaccgc gagangancg aggaaaggcn gaaaaccnac gcncaccngn ncgacgacaa 2040
agngangaag cagcngaaga gaaggcggna caccggcngg ggcaggcnga gcagaaagcn 2100
gancaacggc ancagagaca agcagagcgg caagacaanc cnggannncc ngaagnccga 2160
cggcnncgcc aaccggaacn ncangcagcn ganccacgac gacagccnga canncaaaga 2220
ggacanccag aaagcccagg ngnccggcca gggcgacncn cngcacgagc anancgcnaa 2280
ccnggccggc agccccgcna ncaagaaggg canccngcag acagngaagg nggnggacga 2340
gcncgngaaa gngangggca gacacaagcc cgagaacanc gngancgaga nggcnagaga 2400
gaaccagacc acccagaagg gacagaagaa cncccgcgag aggangaaga gaancgaaga 2460
gggcancaaa gagcngggca gccaganccn gaaagaacac cccgnggaaa acacccagcn 2520
gcagaacgag aagcngnacc ngnacnaccn gcagaanggc cggganangn acgnggacca 2580
ggaacnggac ancaacagac ngnccgacna cgangnggac canancgngc cncagagcnn 2640
ncngaaggac gacnccancg anaacaaagn gcngacncgg agcgacaaga acagaggcaa 2700
gagcgacaac gngcccnccg aagaggncgn gaagaagang aagaacnacn ggcgacagcn 2760
gcngaacgcc aagcnganna cccagaggaa gnncganaac cngaccaagg ccgagagagg 2820
cggccngagc gagcnggana aggccggcnn cancaagagg cagcnggngg aaaccagaca 2880
gancacaaag cacgnggcac aganccngga cncccggang aacacnaagn acgacgaaaa 2940
cganaagcng anccgggaag ngaaagngan cacccngaag nccaagcngg ngnccgannn 3000
ccggaaggan nnccagnnnn acaaagngcg cgagancaac aacnaccacc acgcccacga 3060
cgccnaccng aacgccgncg ngggaaccgc ccngancaaa aagnacccna agcnggaaag 3120
cgagnncgng nacggcgacn acaaggngna cgacgngcgg aagangancg ccaagagcga 3180
gcaggaaanc ggcaaggcna ccgccaagna cnncnncnac agcaacanca ngaacnnnnn 3240
caagaccgaa ancacccngg ccaacggcga gancagaaag cgcccncnga ncgagacaaa 3300
cggcgaaacc ggggagancg ngnggganaa gggcagagac nncgccacag ngcgaaaggn 3360
gcngagcang ccccaagnga anancgngaa aaagaccgag gngcagacag gcggcnncag 3420
caaagagncn anccngccca agaggaacag cgacaagcng ancgccagaa agaaggacng 3480
ggaccccaag aagnacggcg gcnncgacag cccnaccgng gccnacncng ngcnggnggn 3540
ggcnaaggng gaaaagggca agnccaagaa acngaagagn gngaaagagc ngcnggggan 3600
caccancang gaaagaagca gcnnngagaa gaacccnanc gacnnncngg aagccaaggg 3660
cnacaaagaa gngaaaaagg accngancan caagcngccn aagnacnccc ngnncgagcn 3720
ggaaaacggc agaaagagaa ngcnggccnc ngccggcgaa cngcagaagg gaaacgagcn 3780
ggcccngccn agcaaanang ngaacnnccn gnaccnggcc ncccacnang agaagcngaa 3840
gggcagcccn gaggacaacg aacagaaaca gcngnnngng gaacagcana agcacnaccn 3900
ggacgaganc ancgagcaga ncagcgagnn cnccaagaga gnganccngg ccgacgccaa 3960
ncnggacaag gngcngncng ccnacaacaa gcacagggac aagccnanca gagagcaggc 4020
cgagaananc anccaccngn ncacccngac aaaccngggc gcnccngccg ccnncaagna 4080
cnnngacacc accancgacc ggaagaggna caccagcacc aaagaggngc nggacgccac 4140
ccnganccac cagagcanca ccggccngna cgagacaaga ancgaccngn cncagcnggg 4200
aggcgacaag agaccngccg ccacnaagaa ggccggacag gccaaaaaga agaagngagc 4260
ncgcnnncnn gcngnccaan nncnannaaa ggnnccnnng nncccnaagn ccaacnacna 4320
aacnggggga nannangaag ggccnngagc ancnggannc ngccnaanaa aaaacannna 4380
nnnncanngc gagcggccgc a 4401
<210> 56
<211> 4431
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 NLS-接头变体-2
<400> 56
gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggg 60
ccccaagaag aaaagaaaag ucggaggaag uggcggcagu gguggcucug gagggucagg 120
aggcagcggg ggcuccgaca agaaguacag caucggccug gacaucggca ccaacucugu 180
gggcugggcc gugaucaccg acgaguacaa ggugcccagc aagaaauuca aggugcuggg 240
caacaccgac cggcacagca ucaagaagaa ccugaucgga gcccugcugu ucgacagcgg 300
cgaaacagcc gaggccaccc ggcugaagag aaccgccaga agaagauaca ccagacggaa 360
gaaccggauc ugcuaucugc aagagaucuu cagcaacgag auggccaagg uggacgacag 420
cuucuuccac agacuggaag aguccuuccu gguggaagag gacaagaagc acgagagaca 480
ccccaucuuc ggcaacaucg uggacgaggu ggccuaccac gagaaguacc ccaccaucua 540
ccaccugaga aagaaacugg uggacagcac cgacaaggcc gaccugagac ugaucuaccu 600
ggcccuggcc cacaugauca aguucagagg ccacuuccug aucgagggcg accugaaccc 660
cgacaacagc gacguggaca agcuguucau ccagcuggug cagaccuaca accagcuguu 720
cgaggaaaac cccaucaacg ccagcggcgu ggacgccaag gcuauccugu cugccagacu 780
gagcaagagc agaaggcugg aaaaucugau cgcccagcug cccggcgaga agaagaacgg 840
ccuguucggc aaccugauug cccugagccu gggccugacc cccaacuuca agagcaacuu 900
cgaccuggcc gaggaugcca aacugcagcu gagcaaggac accuacgacg acgaccugga 960
caaccugcug gcccagaucg gcgaccagua cgccgaccug uuccuggccg ccaagaaccu 1020
gucugacgcc auccugcuga gcgacauccu gagagugaac accgagauca ccaaggcccc 1080
ccugagcgcc ucuaugauca agagauacga cgagcaccac caggaccuga cccugcugaa 1140
agcucucgug cggcagcagc ugccugagaa guacaaagaa aucuucuucg accagagcaa 1200
gaacggcuac gccggcuaca ucgauggcgg cgcuagccag gaagaguucu acaaguucau 1260
caagcccauc cuggaaaaga uggacggcac cgaggaacug cucgugaagc ugaacagaga 1320
ggaccugcug agaaagcaga gaaccuucga caacggcagc aucccccacc agauccaccu 1380
gggagagcug cacgcuaucc ugagaaggca ggaagauuuu uacccauucc ugaaggacaa 1440
ccgggaaaag aucgagaaga uccugaccuu caggaucccc uacuacgugg gcccccuggc 1500
cagaggcaac agcagauucg ccuggaugac cagaaagagc gaggaaacca ucacccccug 1560
gaacuucgag gaaguggugg acaagggcgc cagcgcccag agcuucaucg agagaaugac 1620
aaacuucgau aagaaccugc ccaacgagaa ggugcugccc aagcacagcc ugcuguacga 1680
guacuucacc guguacaacg agcugaccaa agugaaauac gugaccgagg gaaugagaaa 1740
gcccgccuuc cugagcggcg agcagaaaaa ggccaucgug gaccugcugu ucaagaccaa 1800
cagaaaagug accgugaagc agcugaaaga ggacuacuuc aagaaaaucg agugcuucga 1860
cuccguggaa aucuccggcg uggaagauag auucaacgcc ucccugggca cauaccacga 1920
ucugcugaaa auuaucaagg acaaggacuu ccuggauaac gaagagaacg aggacauucu 1980
ggaagauauc gugcugaccc ugacacuguu ugaggaccgc gagaugaucg aggaaaggcu 2040
gaaaaccuac gcucaccugu ucgacgacaa agugaugaag cagcugaaga gaaggcggua 2100
caccggcugg ggcaggcuga gcagaaagcu gaucaacggc aucagagaca agcagagcgg 2160
caagacaauc cuggauuucc ugaaguccga cggcuucgcc aaccggaacu ucaugcagcu 2220
gauccacgac gacagccuga cauucaaaga ggacauccag aaagcccagg uguccggcca 2280
gggcgacucu cugcacgagc auaucgcuaa ccuggccggc agccccgcua ucaagaaggg 2340
cauccugcag acagugaagg ugguggacga gcucgugaaa gugaugggca gacacaagcc 2400
cgagaacauc gugaucgaga uggcuagaga gaaccagacc acccagaagg gacagaagaa 2460
cucccgcgag aggaugaaga gaaucgaaga gggcaucaaa gagcugggca gccagauccu 2520
gaaagaacac cccguggaaa acacccagcu gcagaacgag aagcuguacc uguacuaccu 2580
gcagaauggc cgggauaugu acguggacca ggaacuggac aucaacagac uguccgacua 2640
cgauguggac cauaucgugc cucagagcuu ucugaaggac gacuccaucg auaacaaagu 2700
gcugacucgg agcgacaaga acagaggcaa gagcgacaac gugcccuccg aagaggucgu 2760
gaagaagaug aagaacuacu ggcgacagcu gcugaacgcc aagcugauua cccagaggaa 2820
guucgauaac cugaccaagg ccgagagagg cggccugagc gagcuggaua aggccggcuu 2880
caucaagagg cagcuggugg aaaccagaca gaucacaaag cacguggcac agauccugga 2940
cucccggaug aacacuaagu acgacgaaaa cgauaagcug auccgggaag ugaaagugau 3000
cacccugaag uccaagcugg uguccgauuu ccggaaggau uuccaguuuu acaaagugcg 3060
cgagaucaac aacuaccacc acgcccacga cgccuaccug aacgccgucg ugggaaccgc 3120
ccugaucaaa aaguacccua agcuggaaag cgaguucgug uacggcgacu acaaggugua 3180
cgacgugcgg aagaugaucg ccaagagcga gcaggaaauc ggcaaggcua ccgccaagua 3240
cuucuucuac agcaacauca ugaacuuuuu caagaccgaa aucacccugg ccaacggcga 3300
gaucagaaag cgcccucuga ucgagacaaa cggcgaaacc ggggagaucg ugugggauaa 3360
gggcagagac uucgccacag ugcgaaaggu gcugagcaug ccccaaguga auaucgugaa 3420
aaagaccgag gugcagacag gcggcuucag caaagagucu auccugccca agaggaacag 3480
cgacaagcug aucgccagaa agaaggacug ggaccccaag aaguacggcg gcuucgacag 3540
cccuaccgug gccuacucug ugcugguggu ggcuaaggug gaaaagggca aguccaagaa 3600
acugaagagu gugaaagagc ugcuggggau caccaucaug gaaagaagca gcuuugagaa 3660
gaacccuauc gacuuucugg aagccaaggg cuacaaagaa gugaaaaagg accugaucau 3720
caagcugccu aaguacuccc uguucgagcu ggaaaacggc agaaagagaa ugcuggccuc 3780
ugccggcgaa cugcagaagg gaaacgagcu ggcccugccu agcaaauaug ugaacuuccu 3840
guaccuggcc ucccacuaug agaagcugaa gggcagcccu gaggacaacg aacagaaaca 3900
gcuguuugug gaacagcaua agcacuaccu ggacgagauc aucgagcaga ucagcgaguu 3960
cuccaagaga gugauccugg ccgacgccaa ucuggacaag gugcugucug ccuacaacaa 4020
gcacagggac aagccuauca gagagcaggc cgagaauauc auccaccugu ucacccugac 4080
aaaccugggc gcuccugccg ccuucaagua cuuugacacc accaucgacc ggaagaggua 4140
caccagcacc aaagaggugc uggacgccac ccugauccac cagagcauca ccggccugua 4200
cgagacaaga aucgaccugu cucagcuggg aggcgacaag agaccugccg ccacuaagaa 4260
ggccggacag gccaaaaaga agaagugagc ucgcuuucuu gcuguccaau uucuauuaaa 4320
gguuccuuug uucccuaagu ccaacuacua aacuggggga uauuaugaag ggccuugagc 4380
aucuggauuc ugccuaauaa aaaacauuua uuuucauugc gagcggccgc a 4431
<210> 57
<211> 4512
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 NLS-接头变体-3
<400> 57
gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggg 60
acccaagaag aaaaggaagg uggcggcugc agauuacaag gaugaugacg acaagagcag 120
acuggagccc ggggagaagc ccuacaaaug uccagaaugu ggcaaguccu ucagccagag 180
cggggcccug accaggcacc agcgcaccca cacaagggac aagaaguaca gcaucggccu 240
ggacaucggc accaacucug ugggcugggc cgugaucacc gacgaguaca aggugcccag 300
caagaaauuc aaggugcugg gcaacaccga ccggcacagc aucaagaaga accugaucgg 360
agcccugcug uucgacagcg gcgaaacagc cgaggccacc cggcugaaga gaaccgccag 420
aagaagauac accagacgga agaaccggau cugcuaucug caagagaucu ucagcaacga 480
gauggccaag guggacgaca gcuucuucca cagacuggaa gaguccuucc ugguggaaga 540
ggacaagaag cacgagagac accccaucuu cggcaacauc guggacgagg uggccuacca 600
cgagaaguac cccaccaucu accaccugag aaagaaacug guggacagca ccgacaaggc 660
cgaccugaga cugaucuacc uggcccuggc ccacaugauc aaguucagag gccacuuccu 720
gaucgagggc gaccugaacc ccgacaacag cgacguggac aagcuguuca uccagcuggu 780
gcagaccuac aaccagcugu ucgaggaaaa ccccaucaac gccagcggcg uggacgccaa 840
ggcuauccug ucugccagac ugagcaagag cagaaggcug gaaaaucuga ucgcccagcu 900
gcccggcgag aagaagaacg gccuguucgg caaccugauu gcccugagcc ugggccugac 960
ccccaacuuc aagagcaacu ucgaccuggc cgaggaugcc aaacugcagc ugagcaagga 1020
caccuacgac gacgaccugg acaaccugcu ggcccagauc ggcgaccagu acgccgaccu 1080
guuccuggcc gccaagaacc ugucugacgc cauccugcug agcgacaucc ugagagugaa 1140
caccgagauc accaaggccc cccugagcgc cucuaugauc aagagauacg acgagcacca 1200
ccaggaccug acccugcuga aagcucucgu gcggcagcag cugccugaga aguacaaaga 1260
aaucuucuuc gaccagagca agaacggcua cgccggcuac aucgauggcg gcgcuagcca 1320
ggaagaguuc uacaaguuca ucaagcccau ccuggaaaag auggacggca ccgaggaacu 1380
gcucgugaag cugaacagag aggaccugcu gagaaagcag agaaccuucg acaacggcag 1440
caucccccac cagauccacc ugggagagcu gcacgcuauc cugagaaggc aggaagauuu 1500
uuacccauuc cugaaggaca accgggaaaa gaucgagaag auccugaccu ucaggauccc 1560
cuacuacgug ggcccccugg ccagaggcaa cagcagauuc gccuggauga ccagaaagag 1620
cgaggaaacc aucacccccu ggaacuucga ggaaguggug gacaagggcg ccagcgccca 1680
gagcuucauc gagagaauga caaacuucga uaagaaccug cccaacgaga aggugcugcc 1740
caagcacagc cugcuguacg aguacuucac cguguacaac gagcugacca aagugaaaua 1800
cgugaccgag ggaaugagaa agcccgccuu ccugagcggc gagcagaaaa aggccaucgu 1860
ggaccugcug uucaagacca acagaaaagu gaccgugaag cagcugaaag aggacuacuu 1920
caagaaaauc gagugcuucg acuccgugga aaucuccggc guggaagaua gauucaacgc 1980
cucccugggc acauaccacg aucugcugaa aauuaucaag gacaaggacu uccuggauaa 2040
cgaagagaac gaggacauuc uggaagauau cgugcugacc cugacacugu uugaggaccg 2100
cgagaugauc gaggaaaggc ugaaaaccua cgcucaccug uucgacgaca aagugaugaa 2160
gcagcugaag agaaggcggu acaccggcug gggcaggcug agcagaaagc ugaucaacgg 2220
caucagagac aagcagagcg gcaagacaau ccuggauuuc cugaaguccg acggcuucgc 2280
caaccggaac uucaugcagc ugauccacga cgacagccug acauucaaag aggacaucca 2340
gaaagcccag guguccggcc agggcgacuc ucugcacgag cauaucgcua accuggccgg 2400
cagccccgcu aucaagaagg gcauccugca gacagugaag gugguggacg agcucgugaa 2460
agugaugggc agacacaagc ccgagaacau cgugaucgag auggcuagag agaaccagac 2520
cacccagaag ggacagaaga acucccgcga gaggaugaag agaaucgaag agggcaucaa 2580
agagcugggc agccagaucc ugaaagaaca ccccguggaa aacacccagc ugcagaacga 2640
gaagcuguac cuguacuacc ugcagaaugg ccgggauaug uacguggacc aggaacugga 2700
caucaacaga cuguccgacu acgaugugga ccauaucgug ccucagagcu uucugaagga 2760
cgacuccauc gauaacaaag ugcugacucg gagcgacaag aacagaggca agagcgacaa 2820
cgugcccucc gaagaggucg ugaagaagau gaagaacuac uggcgacagc ugcugaacgc 2880
caagcugauu acccagagga aguucgauaa ccugaccaag gccgagagag gcggccugag 2940
cgagcuggau aaggccggcu ucaucaagag gcagcuggug gaaaccagac agaucacaaa 3000
gcacguggca cagauccugg acucccggau gaacacuaag uacgacgaaa acgauaagcu 3060
gauccgggaa gugaaaguga ucacccugaa guccaagcug guguccgauu uccggaagga 3120
uuuccaguuu uacaaagugc gcgagaucaa caacuaccac cacgcccacg acgccuaccu 3180
gaacgccguc gugggaaccg cccugaucaa aaaguacccu aagcuggaaa gcgaguucgu 3240
guacggcgac uacaaggugu acgacgugcg gaagaugauc gccaagagcg agcaggaaau 3300
cggcaaggcu accgccaagu acuucuucua cagcaacauc augaacuuuu ucaagaccga 3360
aaucacccug gccaacggcg agaucagaaa gcgcccucug aucgagacaa acggcgaaac 3420
cggggagauc gugugggaua agggcagaga cuucgccaca gugcgaaagg ugcugagcau 3480
gccccaagug aauaucguga aaaagaccga ggugcagaca ggcggcuuca gcaaagaguc 3540
uauccugccc aagaggaaca gcgacaagcu gaucgccaga aagaaggacu gggaccccaa 3600
gaaguacggc ggcuucgaca gcccuaccgu ggccuacucu gugcuggugg uggcuaaggu 3660
ggaaaagggc aaguccaaga aacugaagag ugugaaagag cugcugggga ucaccaucau 3720
ggaaagaagc agcuuugaga agaacccuau cgacuuucug gaagccaagg gcuacaaaga 3780
agugaaaaag gaccugauca ucaagcugcc uaaguacucc cuguucgagc uggaaaacgg 3840
cagaaagaga augcuggccu cugccggcga acugcagaag ggaaacgagc uggcccugcc 3900
uagcaaauau gugaacuucc uguaccuggc cucccacuau gagaagcuga agggcagccc 3960
ugaggacaac gaacagaaac agcuguuugu ggaacagcau aagcacuacc uggacgagau 4020
caucgagcag aucagcgagu ucuccaagag agugauccug gccgacgcca aucuggacaa 4080
ggugcugucu gccuacaaca agcacaggga caagccuauc agagagcagg ccgagaauau 4140
cauccaccug uucacccuga caaaccuggg cgcuccugcc gccuucaagu acuuugacac 4200
caccaucgac cggaagaggu acaccagcac caaagaggug cuggacgcca cccugaucca 4260
ccagagcauc accggccugu acgagacaag aaucgaccug ucucagcugg gaggcgacaa 4320
gagaccugcc gccacuaaga aggccggaca ggccaaaaag aagaagugag cucgcuuucu 4380
ugcuguccaa uuucuauuaa agguuccuuu guucccuaag uccaacuacu aaacuggggg 4440
auauuaugaa gggccuugag caucuggauu cugccuaaua aaaaacauuu auuuucauug 4500
cgagcggccg ca 4512
<210> 58
<211> 4425
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 NLS-接头变体-4
<400> 58
gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggg 60
accaaagaag aaaagaaaag uaggaggagg gggcagccug gugcccaggg gcucaggagg 120
uggcggcucc gacaagaagu acagcaucgg ccuggacauc ggcaccaacu cugugggcug 180
ggccgugauc accgacgagu acaaggugcc cagcaagaaa uucaaggugc ugggcaacac 240
cgaccggcac agcaucaaga agaaccugau cggagcccug cuguucgaca gcggcgaaac 300
agccgaggcc acccggcuga agagaaccgc cagaagaaga uacaccagac ggaagaaccg 360
gaucugcuau cugcaagaga ucuucagcaa cgagauggcc aagguggacg acagcuucuu 420
ccacagacug gaagaguccu uccuggugga agaggacaag aagcacgaga gacaccccau 480
cuucggcaac aucguggacg agguggccua ccacgagaag uaccccacca ucuaccaccu 540
gagaaagaaa cugguggaca gcaccgacaa ggccgaccug agacugaucu accuggcccu 600
ggcccacaug aucaaguuca gaggccacuu ccugaucgag ggcgaccuga accccgacaa 660
cagcgacgug gacaagcugu ucauccagcu ggugcagacc uacaaccagc uguucgagga 720
aaaccccauc aacgccagcg gcguggacgc caaggcuauc cugucugcca gacugagcaa 780
gagcagaagg cuggaaaauc ugaucgccca gcugcccggc gagaagaaga acggccuguu 840
cggcaaccug auugcccuga gccugggccu gacccccaac uucaagagca acuucgaccu 900
ggccgaggau gccaaacugc agcugagcaa ggacaccuac gacgacgacc uggacaaccu 960
gcuggcccag aucggcgacc aguacgccga ccuguuccug gccgccaaga accugucuga 1020
cgccauccug cugagcgaca uccugagagu gaacaccgag aucaccaagg ccccccugag 1080
cgccucuaug aucaagagau acgacgagca ccaccaggac cugacccugc ugaaagcucu 1140
cgugcggcag cagcugccug agaaguacaa agaaaucuuc uucgaccaga gcaagaacgg 1200
cuacgccggc uacaucgaug gcggcgcuag ccaggaagag uucuacaagu ucaucaagcc 1260
cauccuggaa aagauggacg gcaccgagga acugcucgug aagcugaaca gagaggaccu 1320
gcugagaaag cagagaaccu ucgacaacgg cagcaucccc caccagaucc accugggaga 1380
gcugcacgcu auccugagaa ggcaggaaga uuuuuaccca uuccugaagg acaaccggga 1440
aaagaucgag aagauccuga ccuucaggau ccccuacuac gugggccccc uggccagagg 1500
caacagcaga uucgccugga ugaccagaaa gagcgaggaa accaucaccc ccuggaacuu 1560
cgaggaagug guggacaagg gcgccagcgc ccagagcuuc aucgagagaa ugacaaacuu 1620
cgauaagaac cugcccaacg agaaggugcu gcccaagcac agccugcugu acgaguacuu 1680
caccguguac aacgagcuga ccaaagugaa auacgugacc gagggaauga gaaagcccgc 1740
cuuccugagc ggcgagcaga aaaaggccau cguggaccug cuguucaaga ccaacagaaa 1800
agugaccgug aagcagcuga aagaggacua cuucaagaaa aucgagugcu ucgacuccgu 1860
ggaaaucucc ggcguggaag auagauucaa cgccucccug ggcacauacc acgaucugcu 1920
gaaaauuauc aaggacaagg acuuccugga uaacgaagag aacgaggaca uucuggaaga 1980
uaucgugcug acccugacac uguuugagga ccgcgagaug aucgaggaaa ggcugaaaac 2040
cuacgcucac cuguucgacg acaaagugau gaagcagcug aagagaaggc gguacaccgg 2100
cuggggcagg cugagcagaa agcugaucaa cggcaucaga gacaagcaga gcggcaagac 2160
aauccuggau uuccugaagu ccgacggcuu cgccaaccgg aacuucaugc agcugaucca 2220
cgacgacagc cugacauuca aagaggacau ccagaaagcc cagguguccg gccagggcga 2280
cucucugcac gagcauaucg cuaaccuggc cggcagcccc gcuaucaaga agggcauccu 2340
gcagacagug aagguggugg acgagcucgu gaaagugaug ggcagacaca agcccgagaa 2400
caucgugauc gagauggcua gagagaacca gaccacccag aagggacaga agaacucccg 2460
cgagaggaug aagagaaucg aagagggcau caaagagcug ggcagccaga uccugaaaga 2520
acaccccgug gaaaacaccc agcugcagaa cgagaagcug uaccuguacu accugcagaa 2580
uggccgggau auguacgugg accaggaacu ggacaucaac agacuguccg acuacgaugu 2640
ggaccauauc gugccucaga gcuuucugaa ggacgacucc aucgauaaca aagugcugac 2700
ucggagcgac aagaacagag gcaagagcga caacgugccc uccgaagagg ucgugaagaa 2760
gaugaagaac uacuggcgac agcugcugaa cgccaagcug auuacccaga ggaaguucga 2820
uaaccugacc aaggccgaga gaggcggccu gagcgagcug gauaaggccg gcuucaucaa 2880
gaggcagcug guggaaacca gacagaucac aaagcacgug gcacagaucc uggacucccg 2940
gaugaacacu aaguacgacg aaaacgauaa gcugauccgg gaagugaaag ugaucacccu 3000
gaaguccaag cugguguccg auuuccggaa ggauuuccag uuuuacaaag ugcgcgagau 3060
caacaacuac caccacgccc acgacgccua ccugaacgcc gucgugggaa ccgcccugau 3120
caaaaaguac ccuaagcugg aaagcgaguu cguguacggc gacuacaagg uguacgacgu 3180
gcggaagaug aucgccaaga gcgagcagga aaucggcaag gcuaccgcca aguacuucuu 3240
cuacagcaac aucaugaacu uuuucaagac cgaaaucacc cuggccaacg gcgagaucag 3300
aaagcgcccu cugaucgaga caaacggcga aaccggggag aucguguggg auaagggcag 3360
agacuucgcc acagugcgaa aggugcugag caugccccaa gugaauaucg ugaaaaagac 3420
cgaggugcag acaggcggcu ucagcaaaga gucuauccug cccaagagga acagcgacaa 3480
gcugaucgcc agaaagaagg acugggaccc caagaaguac ggcggcuucg acagcccuac 3540
cguggccuac ucugugcugg ugguggcuaa gguggaaaag ggcaagucca agaaacugaa 3600
gagugugaaa gagcugcugg ggaucaccau cauggaaaga agcagcuuug agaagaaccc 3660
uaucgacuuu cuggaagcca agggcuacaa agaagugaaa aaggaccuga ucaucaagcu 3720
gccuaaguac ucccuguucg agcuggaaaa cggcagaaag agaaugcugg ccucugccgg 3780
cgaacugcag aagggaaacg agcuggcccu gccuagcaaa uaugugaacu uccuguaccu 3840
ggccucccac uaugagaagc ugaagggcag cccugaggac aacgaacaga aacagcuguu 3900
uguggaacag cauaagcacu accuggacga gaucaucgag cagaucagcg aguucuccaa 3960
gagagugauc cuggccgacg ccaaucugga caaggugcug ucugccuaca acaagcacag 4020
ggacaagccu aucagagagc aggccgagaa uaucauccac cuguucaccc ugacaaaccu 4080
gggcgcuccu gccgccuuca aguacuuuga caccaccauc gaccggaaga gguacaccag 4140
caccaaagag gugcuggacg ccacccugau ccaccagagc aucaccggcc uguacgagac 4200
aagaaucgac cugucucagc ugggaggcga caagagaccu gccgccacua agaaggccgg 4260
acaggccaaa aagaagaagu gagcucgcuu ucuugcuguc caauuucuau uaaagguucc 4320
uuuguucccu aaguccaacu acuaaacugg gggauauuau gaagggccuu gagcaucugg 4380
auucugccua auaaaaaaca uuuauuuuca uugcgagcgg ccgca 4425
<210> 59
<211> 4401
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 HF S.p. Cas9
<400> 59
gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggc 60
cccaaagaag aagcggaagg ucgguaucca cggaguccca gcagccgaca agaaguacag 120
caucggccug gacaucggca ccaacucugu gggcugggcc gugaucaccg acgaguacaa 180
ggugcccagc aagaaauuca aggugcuggg caacaccgac cggcacagca ucaagaagaa 240
ccugaucgga gcccugcugu ucgacagcgg cgaaacagcc gaggccaccc ggcugaagag 300
aaccgccaga agaagauaca ccagacggaa gaaccggauc ugcuaucugc aagagaucuu 360
cagcaacgag auggccaagg uggacgacag cuucuuccac agacuggaag aguccuuccu 420
gguggaagag gacaagaagc acgagagaca ccccaucuuc ggcaacaucg uggacgaggu 480
ggccuaccac gagaaguacc ccaccaucua ccaccugaga aagaaacugg uggacagcac 540
cgacaaggcc gaccugagac ugaucuaccu ggcccuggcc cacaugauca aguucagagg 600
ccacuuccug aucgagggcg accugaaccc cgacaacagc gacguggaca agcuguucau 660
ccagcuggug cagaccuaca accagcuguu cgaggaaaac cccaucaacg ccagcggcgu 720
ggacgccaag gcuauccugu cugccagacu gagcaagagc agaaggcugg aaaaucugau 780
cgcccagcug cccggcgaga agaagaacgg ccuguucggc aaccugauug cccugagccu 840
gggccugacc cccaacuuca agagcaacuu cgaccuggcc gaggaugcca aacugcagcu 900
gagcaaggac accuacgacg acgaccugga caaccugcug gcccagaucg gcgaccagua 960
cgccgaccug uuccuggccg ccaagaaccu gucugacgcc auccugcuga gcgacauccu 1020
gagagugaac accgagauca ccaaggcccc ccugagcgcc ucuaugauca agagauacga 1080
cgagcaccac caggaccuga cccugcugaa agcucucgug cggcagcagc ugccugagaa 1140
guacaaagaa aucuucuucg accagagcaa gaacggcuac gccggcuaca ucgauggcgg 1200
cgcuagccag gaagaguucu acaaguucau caagcccauc cuggaaaaga uggacggcac 1260
cgaggaacug cucgugaagc ugaacagaga ggaccugcug agaaagcaga gaaccuucga 1320
caacggcagc aucccccacc agauccaccu gggagagcug cacgcuaucc ugagaaggca 1380
ggaagauuuu uacccauucc ugaaggacaa ccgggaaaag aucgagaaga uccugaccuu 1440
caggaucccc uacuacgugg gcccccuggc cagaggcaac agcagauucg ccuggaugac 1500
cagaaagagc gaggaaacca ucacccccug gaacuucgag gaaguggugg acaagggcgc 1560
cagcgcccag agcuucaucg agagaaugac agccuucgau aagaaccugc ccaacgagaa 1620
ggugcugccc aagcacagcc ugcuguacga guacuucacc guguacaacg agcugaccaa 1680
agugaaauac gugaccgagg gaaugagaaa gcccgccuuc cugagcggcg agcagaaaaa 1740
ggccaucgug gaccugcugu ucaagaccaa cagaaaagug accgugaagc agcugaaaga 1800
ggacuacuuc aagaaaaucg agugcuucga cuccguggaa aucuccggcg uggaagauag 1860
auucaacgcc ucccugggca cauaccacga ucugcugaaa auuaucaagg acaaggacuu 1920
ccuggauaac gaagagaacg aggacauucu ggaagauauc gugcugaccc ugacacuguu 1980
ugaggaccgc gagaugaucg aggaaaggcu gaaaaccuac gcucaccugu ucgacgacaa 2040
agugaugaag cagcugaaga gaaggcggua caccggcugg ggcgcccuga gcagaaagcu 2100
gaucaacggc aucagagaca agcagagcgg caagacaauc cuggauuucc ugaaguccga 2160
cggcuucgcc aaccggaacu ucauggcccu gauccacgac gacagccuga cauucaaaga 2220
ggacauccag aaagcccagg uguccggcca gggcgacucu cugcacgagc auaucgcuaa 2280
ccuggccggc agccccgcua ucaagaaggg cauccugcag acagugaagg ugguggacga 2340
gcucgugaaa gugaugggca gacacaagcc cgagaacauc gugaucgaga uggcuagaga 2400
gaaccagacc acccagaagg gacagaagaa cucccgcgag aggaugaaga gaaucgaaga 2460
gggcaucaaa gagcugggca gccagauccu gaaagaacac cccguggaaa acacccagcu 2520
gcagaacgag aagcuguacc uguacuaccu gcagaauggc cgggauaugu acguggacca 2580
ggaacuggac aucaacagac uguccgacua cgauguggac cauaucgugc cucagagcuu 2640
ucugaaggac gacuccaucg auaacaaagu gcugacucgg agcgacaaga acagaggcaa 2700
gagcgacaac gugcccuccg aagaggucgu gaagaagaug aagaacuacu ggcgacagcu 2760
gcugaacgcc aagcugauua cccagaggaa guucgauaac cugaccaagg ccgagagagg 2820
cggccugagc gagcuggaua aggccggcuu caucaagagg cagcuggugg aaaccagagc 2880
caucacaaag cacguggcac agauccugga cucccggaug aacacuaagu acgacgaaaa 2940
cgauaagcug auccgggaag ugaaagugau cacccugaag uccaagcugg uguccgauuu 3000
ccggaaggau uuccaguuuu acaaagugcg cgagaucaac aacuaccacc acgcccacga 3060
cgccuaccug aacgccgucg ugggaaccgc ccugaucaaa aaguacccua agcuggaaag 3120
cgaguucgug uacggcgacu acaaggugua cgacgugcgg aagaugaucg ccaagagcga 3180
gcaggaaauc ggcaaggcua ccgccaagua cuucuucuac agcaacauca ugaacuuuuu 3240
caagaccgaa aucacccugg ccaacggcga gaucagaaag cgcccucuga ucgagacaaa 3300
cggcgaaacc ggggagaucg ugugggauaa gggcagagac uucgccacag ugcgaaaggu 3360
gcugagcaug ccccaaguga auaucgugaa aaagaccgag gugcagacag gcggcuucag 3420
caaagagucu auccugccca agaggaacag cgacaagcug aucgccagaa agaaggacug 3480
ggaccccaag aaguacggcg gcuucgacag cccuaccgug gccuacucug ugcugguggu 3540
ggcuaaggug gaaaagggca aguccaagaa acugaagagu gugaaagagc ugcuggggau 3600
caccaucaug gaaagaagca gcuuugagaa gaacccuauc gacuuucugg aagccaaggg 3660
cuacaaagaa gugaaaaagg accugaucau caagcugccu aaguacuccc uguucgagcu 3720
ggaaaacggc agaaagagaa ugcuggccuc ugccggcgaa cugcagaagg gaaacgagcu 3780
ggcccugccu agcaaauaug ugaacuuccu guaccuggcc ucccacuaug agaagcugaa 3840
gggcagcccu gaggacaacg aacagaaaca gcuguuugug gaacagcaua agcacuaccu 3900
ggacgagauc aucgagcaga ucagcgaguu cuccaagaga gugauccugg ccgacgccaa 3960
ucuggacaag gugcugucug ccuacaacaa gcacagggac aagccuauca gagagcaggc 4020
cgagaauauc auccaccugu ucacccugac aaaccugggc gcuccugccg ccuucaagua 4080
cuuugacacc accaucgacc ggaagaggua caccagcacc aaagaggugc uggacgccac 4140
ccugauccac cagagcauca ccggccugua cgagacaaga aucgaccugu cucagcuggg 4200
aggcgacaag agaccugccg ccacuaagaa ggccggacag gccaaaaaga agaagugagc 4260
ucgcuuucuu gcuguccaau uucuauuaaa gguuccuuug uucccuaagu ccaacuacua 4320
aacuggggga uauuaugaag ggccuugagc aucuggauuc ugccuaauaa aaaacauuua 4380
uuuucauugc gagcggccgc a 4401
<210> 60
<211> 4401
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 eSp1.1 Cas9
<400> 60
gggagacauu ugcuucugac acaacugugu ucacuagcaa ccucaaacag ccaccauggc 60
cccaaagaag aagcggaagg ucgguaucca cggaguccca gcagccgaca agaaguacag 120
caucggccug gacaucggca ccaacucugu gggcugggcc gugaucaccg acgaguacaa 180
ggugcccagc aagaaauuca aggugcuggg caacaccgac cggcacagca ucaagaagaa 240
ccugaucgga gcccugcugu ucgacagcgg cgaaacagcc gaggccaccc ggcugaagag 300
aaccgccaga agaagauaca ccagacggaa gaaccggauc ugcuaucugc aagagaucuu 360
cagcaacgag auggccaagg uggacgacag cuucuuccac agacuggaag aguccuuccu 420
gguggaagag gacaagaagc acgagagaca ccccaucuuc ggcaacaucg uggacgaggu 480
ggccuaccac gagaaguacc ccaccaucua ccaccugaga aagaaacugg uggacagcac 540
cgacaaggcc gaccugagac ugaucuaccu ggcccuggcc cacaugauca aguucagagg 600
ccacuuccug aucgagggcg accugaaccc cgacaacagc gacguggaca agcuguucau 660
ccagcuggug cagaccuaca accagcuguu cgaggaaaac cccaucaacg ccagcggcgu 720
ggacgccaag gcuauccugu cugccagacu gagcaagagc agaaggcugg aaaaucugau 780
cgcccagcug cccggcgaga agaagaacgg ccuguucggc aaccugauug cccugagccu 840
gggccugacc cccaacuuca agagcaacuu cgaccuggcc gaggaugcca aacugcagcu 900
gagcaaggac accuacgacg acgaccugga caaccugcug gcccagaucg gcgaccagua 960
cgccgaccug uuccuggccg ccaagaaccu gucugacgcc auccugcuga gcgacauccu 1020
gagagugaac accgagauca ccaaggcccc ccugagcgcc ucuaugauca agagauacga 1080
cgagcaccac caggaccuga cccugcugaa agcucucgug cggcagcagc ugccugagaa 1140
guacaaagaa aucuucuucg accagagcaa gaacggcuac gccggcuaca ucgauggcgg 1200
cgcuagccag gaagaguucu acaaguucau caagcccauc cuggaaaaga uggacggcac 1260
cgaggaacug cucgugaagc ugaacagaga ggaccugcug agaaagcaga gaaccuucga 1320
caacggcagc aucccccacc agauccaccu gggagagcug cacgcuaucc ugagaaggca 1380
ggaagauuuu uacccauucc ugaaggacaa ccgggaaaag aucgagaaga uccugaccuu 1440
caggaucccc uacuacgugg gcccccuggc cagaggcaac agcagauucg ccuggaugac 1500
cagaaagagc gaggaaacca ucacccccug gaacuucgag gaaguggugg acaagggcgc 1560
cagcgcccag agcuucaucg agagaaugac aaacuucgau aagaaccugc ccaacgagaa 1620
ggugcugccc aagcacagcc ugcuguacga guacuucacc guguacaacg agcugaccaa 1680
agugaaauac gugaccgagg gaaugagaaa gcccgccuuc cugagcggcg agcagaaaaa 1740
ggccaucgug gaccugcugu ucaagaccaa cagaaaagug accgugaagc agcugaaaga 1800
ggacuacuuc aagaaaaucg agugcuucga cuccguggaa aucuccggcg uggaagauag 1860
auucaacgcc ucccugggca cauaccacga ucugcugaaa auuaucaagg acaaggacuu 1920
ccuggauaac gaagagaacg aggacauucu ggaagauauc gugcugaccc ugacacuguu 1980
ugaggaccgc gagaugaucg aggaaaggcu gaaaaccuac gcucaccugu ucgacgacaa 2040
agugaugaag cagcugaaga gaaggcggua caccggcugg ggcaggcuga gcagaaagcu 2100
gaucaacggc aucagagaca agcagagcgg caagacaauc cuggauuucc ugaaguccga 2160
cggcuucgcc aaccggaacu ucaugcagcu gauccacgac gacagccuga cauucaaaga 2220
ggacauccag aaagcccagg uguccggcca gggcgacucu cugcacgagc auaucgcuaa 2280
ccuggccggc agccccgcua ucaagaaggg cauccugcag acagugaagg ugguggacga 2340
gcucgugaaa gugaugggca gacacaagcc cgagaacauc gugaucgaga uggcuagaga 2400
gaaccagacc acccagaagg gacagaagaa cucccgcgag aggaugaaga gaaucgaaga 2460
gggcaucaaa gagcugggca gccagauccu gaaagaacac cccguggaaa acacccagcu 2520
gcagaacgag aagcuguacc uguacuaccu gcagaauggc cgggauaugu acguggacca 2580
ggaacuggac aucaacagac uguccgacua cgauguggac cauaucgugc cucagagcuu 2640
ucuggccgac gacuccaucg auaacaaagu gcugacucgg agcgacaaga acagaggcaa 2700
gagcgacaac gugcccuccg aagaggucgu gaagaagaug aagaacuacu ggcgacagcu 2760
gcugaacgcc aagcugauua cccagaggaa guucgauaac cugaccaagg ccgagagagg 2820
cggccugagc gagcuggaua aggccggcuu caucaagagg cagcuggugg aaaccagaca 2880
gaucacaaag cacguggcac agauccugga cucccggaug aacacuaagu acgacgaaaa 2940
cgauaagcug auccgggaag ugaaagugau cacccugaag uccaagcugg uguccgauuu 3000
ccggaaggau uuccaguuuu acaaagugcg cgagaucaac aacuaccacc acgcccacga 3060
cgccuaccug aacgccgucg ugggaaccgc ccugaucaaa aaguacccug cccuggaaag 3120
cgaguucgug uacggcgacu acaaggugua cgacgugcgg aagaugaucg ccaagagcga 3180
gcaggaaauc ggcaaggcua ccgccaagua cuucuucuac agcaacauca ugaacuuuuu 3240
caagaccgaa aucacccugg ccaacggcga gaucagaaag gccccucuga ucgagacaaa 3300
cggcgaaacc ggggagaucg ugugggauaa gggcagagac uucgccacag ugcgaaaggu 3360
gcugagcaug ccccaaguga auaucgugaa aaagaccgag gugcagacag gcggcuucag 3420
caaagagucu auccugccca agaggaacag cgacaagcug aucgccagaa agaaggacug 3480
ggaccccaag aaguacggcg gcuucgacag cccuaccgug gccuacucug ugcugguggu 3540
ggcuaaggug gaaaagggca aguccaagaa acugaagagu gugaaagagc ugcuggggau 3600
caccaucaug gaaagaagca gcuuugagaa gaacccuauc gacuuucugg aagccaaggg 3660
cuacaaagaa gugaaaaagg accugaucau caagcugccu aaguacuccc uguucgagcu 3720
ggaaaacggc agaaagagaa ugcuggccuc ugccggcgaa cugcagaagg gaaacgagcu 3780
ggcccugccu agcaaauaug ugaacuuccu guaccuggcc ucccacuaug agaagcugaa 3840
gggcagcccu gaggacaacg aacagaaaca gcuguuugug gaacagcaua agcacuaccu 3900
ggacgagauc aucgagcaga ucagcgaguu cuccaagaga gugauccugg ccgacgccaa 3960
ucuggacaag gugcugucug ccuacaacaa gcacagggac aagccuauca gagagcaggc 4020
cgagaauauc auccaccugu ucacccugac aaaccugggc gcuccugccg ccuucaagua 4080
cuuugacacc accaucgacc ggaagaggua caccagcacc aaagaggugc uggacgccac 4140
ccugauccac cagagcauca ccggccugua cgagacaaga aucgaccugu cucagcuggg 4200
aggcgacaag agaccugccg ccacuaagaa ggccggacag gccaaaaaga agaagugagc 4260
ucgcuuucuu gcuguccaau uucuauuaaa gguuccuuug uucccuaagu ccaacuacua 4320
aacuggggga uauuaugaag ggccuugagc aucuggauuc ugccuaauaa aaaacauuua 4380
uuuucauugc gagcggccgc a 4401
<210> 61
<211> 1400
<212> PRT
<213> 人工序列
<220>
<223> 合成序列 具有末端核定位序列的野生型 Cas9 蛋白
<400> 61
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Pro Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Pro Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Pro Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Pro Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Pro
130 135 140
His Glu Lys Pro Pro Thr Ile Pro His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Pro Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Pro
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Pro Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Pro Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Pro Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Pro Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Pro Ala Gly Pro Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Pro Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Pro Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Pro Pro Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Pro Glu Pro Phe Thr Val Pro Asn Glu Leu Thr Lys Val Lys
530 535 540
Pro Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Pro Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Pro His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Pro Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Pro
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Pro Leu Pro Pro Leu
820 825 830
Gln Asn Gly Arg Asp Met Pro Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Pro Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Pro Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Pro Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Pro Lys Val Arg
980 985 990
Glu Ile Asn Asn Pro His His Ala His Asp Ala Pro Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Pro Pro Lys Leu Glu Ser Glu Phe
1010 1015 1020
Val Pro Gly Asp Pro Lys Val Pro Asp Val Arg Lys Met Ile Ala Lys
1025 1030 1035 1040
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Pro Phe Phe Pro Ser
1045 1050 1055
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1060 1065 1070
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1075 1080 1085
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1090 1095 1100
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1105 1110 1115 1120
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1125 1130 1135
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Pro Gly Gly Phe Asp Ser
1140 1145 1150
Pro Thr Val Ala Pro Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1155 1160 1165
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1170 1175 1180
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1185 1190 1195 1200
Lys Gly Pro Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1205 1210 1215
Pro Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1220 1225 1230
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Pro
1235 1240 1245
Val Asn Phe Leu Pro Leu Ala Ser His Pro Glu Lys Leu Lys Gly Ser
1250 1255 1260
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1265 1270 1275 1280
Pro Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1285 1290 1295
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Pro Asn Lys
1300 1305 1310
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1315 1320 1325
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Pro Phe Asp
1330 1335 1340
Thr Thr Ile Asp Arg Lys Arg Pro Thr Ser Thr Lys Glu Val Leu Asp
1345 1350 1355 1360
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Pro Glu Thr Arg Ile
1365 1370 1375
Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys
1380 1385 1390
Ala Gly Gln Ala Lys Lys Lys Lys
1395 1400
<210> 62
<211> 1400
<212> PRT
<213> 人工序列
<220>
<223> 合成序列 修饰的Cas9 蛋白序列
<400> 62
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Pro Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Pro Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Pro Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Pro Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Pro
130 135 140
His Glu Lys Pro Pro Thr Ile Pro His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Lys Leu Val Pro Leu Ser Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Pro
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Leu Gly Gln
245 250 255
Leu Ile Ser Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Pro Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Pro Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Pro Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Pro Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Pro Ala Gly Pro Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Pro Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Pro Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Pro Pro Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Pro Glu Pro Phe Thr Val Pro Asn Glu Leu Thr Lys Val Lys
530 535 540
Pro Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Pro Leu Lys Arg Ile Glu Glu Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Pro His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Pro Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Pro
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Pro Leu Pro Pro Leu
820 825 830
Gln Asn Gly Arg Asp Met Pro Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Pro Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Pro Thr Arg Asn Leu Leu Gln Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Pro Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Ile Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Pro Lys Val Arg
980 985 990
Glu Ile Asn Asn Pro His His Ala His Asp Ala Pro Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Pro Pro Lys Leu Glu Ser Glu Phe
1010 1015 1020
Val Pro Gly Asp Pro Lys Val Pro Asp Val Arg Lys Met Ile Ala Lys
1025 1030 1035 1040
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Pro Phe Phe Pro Ser
1045 1050 1055
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1060 1065 1070
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1075 1080 1085
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1090 1095 1100
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1105 1110 1115 1120
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1125 1130 1135
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Pro Gly Gly Phe Asp Ser
1140 1145 1150
Pro Thr Val Ala Pro Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1155 1160 1165
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1170 1175 1180
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1185 1190 1195 1200
Lys Gly Pro Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1205 1210 1215
Pro Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1220 1225 1230
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Pro
1235 1240 1245
Val Asn Phe Leu Pro Leu Ala Ser His Pro Glu Lys Leu Lys Gly Ser
1250 1255 1260
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1265 1270 1275 1280
Pro Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1285 1290 1295
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Pro Asn Lys
1300 1305 1310
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1315 1320 1325
Phe Thr Ile Thr Gln Leu Gly Ala Pro Ala Ala Phe Lys Pro Phe Asp
1330 1335 1340
Thr Thr Ile Asp Arg Lys Arg Pro Thr Ser Thr Lys Glu Val Leu Asp
1345 1350 1355 1360
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Pro Glu Thr Arg Ile
1365 1370 1375
Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys
1380 1385 1390
Ala Gly Gln Ala Lys Lys Lys Lys
1395 1400
<210> 63
<211> 1368
<212> PRT
<213> 酿脓链球菌 (Streptococcus pyogenes)
<400> 63
Met Asp Lys Lys Pro Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Pro Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Pro Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Pro Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Pro
115 120 125
His Glu Lys Pro Pro Thr Ile Pro His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Pro Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Pro
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Pro Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Pro Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Pro Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Pro Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Pro Ala Gly Pro Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Pro Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Pro Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Pro Pro Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Pro Glu Pro Phe Thr Val Pro Asn Glu Leu Thr Lys Val Lys
515 520 525
Pro Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Pro Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Pro His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Pro Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Pro
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Pro Leu Pro Pro Leu
805 810 815
Gln Asn Gly Arg Asp Met Pro Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Pro Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Pro Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Pro Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Pro Lys Val Arg
965 970 975
Glu Ile Asn Asn Pro His His Ala His Asp Ala Pro Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Pro Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Pro Gly Asp Pro Lys Val Pro Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Pro Phe Phe Pro Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Pro Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Pro Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Pro Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Pro Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Pro
1220 1225 1230
Val Asn Phe Leu Pro Leu Ala Ser His Pro Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Pro Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Pro Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Pro Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Pro Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Pro Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 64
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-目标A (HPV16 病毒序列)
<220>
<221> misc_feature
<222> (1)...(23)
<223> n = A, U, C or G
<400> 64
gcaagtgtga ctctacgctt ngg 23
<210> 65
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-目标B (HPV16 病毒序列)
<220>
<221> misc_feature
<222> (1)...(23)
<223> n = A, U, C, or G
<400> 65
gcaacaagac atacatcgac ngg 23
<210> 66
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HBV向导3.1.3.1
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 4
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 66
gauugagauc uucugcgacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 67
<211> 4479
<212> RNA
<213> 人工序列
<220>
<223> 合成序列mRNA-Cas9-L-417
<400> 67
aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gccccaaaga 60
agaagcggaa ggucgguauc cacggagucc cagcagccga caagaaguac agcaucggcc 120
uggacaucgg caccaacucu gugggcuggg ccgugaucac cgacgaguac aaggugccca 180
gcaagaaauu caaggugcug ggcaacaccg accggcacag caucaagaag aaccugaucg 240
gagcccugcu guucgacagc ggcgaaacag ccgaggccac ccggcugaag agaaccgcca 300
gaagaagaua caccagacgg aagaaccgga ucugcuaucu gcaagagauc uucagcaacg 360
agauggccaa gguggacgac agcuucuucc acagacugga agaguccuuc cugguggaag 420
aggacaagaa gcacgagaga caccccaucu ucggcaacau cguggacgag guggccuacc 480
acgagaagua ccccaccauc uaccaccuga gaaagaaacu gguggacagc accgacaagg 540
ccgaccugag acugaucuac cuggcccugg cccacaugau caaguucaga ggccacuucc 600
ugaucgaggg cgaccugaac cccgacaaca gcgacgugga caagcuguuc auccagcugg 660
ugcagaccua caaccagcug uucgaggaaa accccaucaa cgccagcggc guggacgcca 720
aggcuauccu gucugccaga cugagcaaga gcagaaggcu ggaaaaucug aucgcccagc 780
ugcccggcga gaagaagaac ggccuguucg gcaaccugau ugcccugagc cugggccuga 840
cccccaacuu caagagcaac uucgaccugg ccgaggaugc caaacugcag cugagcaagg 900
acaccuacga cgacgaccug gacaaccugc uggcccagau cggcgaccag uacgccgacc 960
uguuccuggc cgccaagaac cugucugacg ccauccugcu gagcgacauc cugagaguga 1020
acaccgagau caccaaggcc ccccugagcg ccucuaugau caagagauac gacgagcacc 1080
accaggaccu gacccugcug aaagcucucg ugcggcagca gcugccugag aaguacaaag 1140
aaaucuucuu cgaccagagc aagaacggcu acgccggcua caucgauggc ggcgcuagcc 1200
aggaagaguu cuacaaguuc aucaagccca uccuggaaaa gauggacggc accgaggaac 1260
ugcucgugaa gcugaacaga gaggaccugc ugagaaagca gagaaccuuc gacaacggca 1320
gcauccccca ccagauccac cugggagagc ugcacgcuau ccugagaagg caggaagauu 1380
uuuacccauu ccugaaggac aaccgggaaa agaucgagaa gauccugacc uucaggaucc 1440
ccuacuacgu gggcccccug gccagaggca acagcagauu cgccuggaug accagaaaga 1500
gcgaggaaac caucaccccc uggaacuucg aggaaguggu ggacaagggc gccagcgccc 1560
agagcuucau cgagagaaug acaaacuucg auaagaaccu gcccaacgag aaggugcugc 1620
ccaagcacag ccugcuguac gaguacuuca ccguguacaa cgagcugacc aaagugaaau 1680
acgugaccga gggaaugaga aagcccgccu uccugagcgg cgagcagaaa aaggccaucg 1740
uggaccugcu guucaagacc aacagaaaag ugaccgugaa gcagcugaaa gaggacuacu 1800
ucaagaaaau cgagugcuuc gacuccgugg aaaucuccgg cguggaagau agauucaacg 1860
ccucccuggg cacauaccac gaucugcuga aaauuaucaa ggacaaggac uuccuggaua 1920
acgaagagaa cgaggacauu cuggaagaua ucgugcugac ccugacacug uuugaggacc 1980
gcgagaugau cgaggaaagg cugaaaaccu acgcucaccu guucgacgac aaagugauga 2040
agcagcugaa gagaaggcgg uacaccggcu ggggcaggcu gagcagaaag cugaucaacg 2100
gcaucagaga caagcagagc ggcaagacaa uccuggauuu ccugaagucc gacggcuucg 2160
ccaaccggaa cuucaugcag cugauccacg acgacagccu gacauucaaa gaggacaucc 2220
agaaagccca gguguccggc cagggcgacu cucugcacga gcauaucgcu aaccuggccg 2280
gcagccccgc uaucaagaag ggcauccugc agacagugaa ggugguggac gagcucguga 2340
aagugauggg cagacacaag cccgagaaca ucgugaucga gauggcuaga gagaaccaga 2400
ccacccagaa gggacagaag aacucccgcg agaggaugaa gagaaucgaa gagggcauca 2460
aagagcuggg cagccagauc cugaaagaac accccgugga aaacacccag cugcagaacg 2520
agaagcugua ccuguacuac cugcagaaug gccgggauau guacguggac caggaacugg 2580
acaucaacag acuguccgac uacgaugugg accauaucgu gccucagagc uuucugaagg 2640
acgacuccau cgauaacaaa gugcugacuc ggagcgacaa gaacagaggc aagagcgaca 2700
acgugcccuc cgaagagguc gugaagaaga ugaagaacua cuggcgacag cugcugaacg 2760
ccaagcugau uacccagagg aaguucgaua accugaccaa ggccgagaga ggcggccuga 2820
gcgagcugga uaaggccggc uucaucaaga ggcagcuggu ggaaaccaga cagaucacaa 2880
agcacguggc acagauccug gacucccgga ugaacacuaa guacgacgaa aacgauaagc 2940
ugauccggga agugaaagug aucacccuga aguccaagcu gguguccgau uuccggaagg 3000
auuuccaguu uuacaaagug cgcgagauca acaacuacca ccacgcccac gacgccuacc 3060
ugaacgccgu cgugggaacc gcccugauca aaaaguaccc uaagcuggaa agcgaguucg 3120
uguacggcga cuacaaggug uacgacgugc ggaagaugau cgccaagagc gagcaggaaa 3180
ucggcaaggc uaccgccaag uacuucuucu acagcaacau caugaacuuu uucaagaccg 3240
aaaucacccu ggccaacggc gagaucagaa agcgcccucu gaucgagaca aacggcgaaa 3300
ccggggagau cgugugggau aagggcagag acuucgccac agugcgaaag gugcugagca 3360
ugccccaagu gaauaucgug aaaaagaccg aggugcagac aggcggcuuc agcaaagagu 3420
cuauccugcc caagaggaac agcgacaagc ugaucgccag aaagaaggac ugggacccca 3480
agaaguacgg cggcuucgac agcccuaccg uggccuacuc ugugcuggug guggcuaagg 3540
uggaaaaggg caaguccaag aaacugaaga gugugaaaga gcugcugggg aucaccauca 3600
uggaaagaag cagcuuugag aagaacccua ucgacuuucu ggaagccaag ggcuacaaag 3660
aagugaaaaa ggaccugauc aucaagcugc cuaaguacuc ccuguucgag cuggaaaacg 3720
gcagaaagag aaugcuggcc ucugccggcg aacugcagaa gggaaacgag cuggcccugc 3780
cuagcaaaua ugugaacuuc cuguaccugg ccucccacua ugagaagcug aagggcagcc 3840
cugaggacaa cgaacagaaa cagcuguuug uggaacagca uaagcacuac cuggacgaga 3900
ucaucgagca gaucagcgag uucuccaaga gagugauccu ggccgacgcc aaucuggaca 3960
aggugcuguc ugccuacaac aagcacaggg acaagccuau cagagagcag gccgagaaua 4020
ucauccaccu guucacccug acaaaccugg gcgcuccugc cgccuucaag uacuuugaca 4080
ccaccaucga ccggaagagg uacaccagca ccaaagaggu gcuggacgcc acccugaucc 4140
accagagcau caccggccug uacgagacaa gaaucgaccu gucucagcug ggaggcgaca 4200
agagaccugc cgccacuaag aaggccggac aggccaaaaa gaagaaguga gcggccgcuu 4260
aauuaagcug ccuucugcgg ggcuugccuu cuggccaugc ccuucuucuc ucccuugcac 4320
cuguaccucu uggucuuuga auaaagccug aguaggaaga aaaaaaaaaa aaaaaaaaaa 4380
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4479
<210> 68
<211> 4521
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 Cas9-mRNA-Lv2-417.2
<220>
<221> misc_feature
<222> (1)...(4521)
<223> n = 5甲氧基尿苷
<400> 68
aggaaanaag agagaaaaga agagnaagaa gaaananaag agccaccang gcccccaaga 60
agaagcggaa ggngggcanc cacggcgngc ccgccgccga caagaagnac agcancggcc 120
nggacancgg caccaacagc gngggcnggg ccgngancac cgacgagnac aaggngccca 180
gcaagaagnn caaggngcng ggcaacaccg accggcacag cancaagaag aaccngancg 240
gcgcccngcn gnncgacagc ggcgagaccg ccgaggccac ccggcngaag cggaccgccc 300
ggcggcggna cacccggcgg aagaaccgga ncngcnaccn gcaggaganc nncagcaacg 360
aganggccaa ggnggacgac agcnncnncc accggcngga ggagagcnnc cnggnggagg 420
aggacaagaa gcacgagcgg caccccancn ncggcaacan cgnggacgag gnggccnacc 480
acgagaagna ccccaccanc naccaccngc ggaagaagcn ggnggacagc accgacaagg 540
ccgaccngcg gcngancnac cnggcccngg cccacangan caagnnccgg ggccacnncc 600
ngancgaggg cgaccngaac cccgacaaca gcgacgngga caagcngnnc anccagcngg 660
ngcagaccna caaccagcng nncgaggaga accccancaa cgccagcggc gnggacgcca 720
aggccanccn cagcgcccgg cngagcaaga gccggcggcn ggagaaccng ancgcccagc 780
ngcccggcga gaagaagaac ggccngnncg gcaaccngan cgcccngagc cngggccnga 840
cccccaacnn caagagcaac nncgaccngg ccgaggacgc caagcngcag cngagcaagg 900
acaccnacga cgacgaccng gacaaccngc nggcccagan cggcgaccag nacgccgacc 960
ngnnccnggc cgccaagaac cngagcgacg ccanccngcn gagcgacanc cngcgggnga 1020
acaccgagan caccaaggcc ccccngagcg ccagcangan caagcggnac gacgagcacc 1080
accaggaccn gacccngcng aaggcccngg ngcggcagca gcngcccgag aagnacaagg 1140
agancnncnn cgaccagagc aagaacggcn acgccggcna cancgacggc ggcgccagcc 1200
aggaggagnn cnacaagnnc ancaagccca nccnggagaa ganggacggc accgaggagc 1260
ngcnggngaa gcngaaccgg gaggaccngc ngcggaagca gcggaccnnc gacaacggca 1320
gcanccccca ccaganccac cngggcgagc ngcacgccan ccngcggcgg caggaggacn 1380
ncnaccccnn ccngaaggac aaccgggaga agancgagaa ganccngacc nnccggancc 1440
ccnacnacgn gggcccccng gcccggggca acagccggnn cgccnggang acccggaaga 1500
gcgaggagac cancaccccc nggaacnncg aggaggnggn ggacaagggc gccagcgccc 1560
agagcnncan cgagcggang accaacnncg acaagaaccn gcccaacgag aaggngcngc 1620
ccaagcacag ccngcngnac gagnacnnca ccgngnacaa cgagcngacc aaggngaagn 1680
acgngaccga gggcangcgg aagcccgccn nccngagcgg cgagcagaag aaggccancg 1740
nggaccngcn gnncaagacc aaccggaagg ngaccgngaa gcagcngaag gaggacnacn 1800
ncaagaagan cgagngcnnc gacagcgngg agancagcgg cgnggaggac cggnncaacg 1860
ccagccnggg caccnaccac gaccngcnga agancancaa ggacaaggac nnccnggaca 1920
acgaggagaa cgaggacanc cnggaggaca ncgngcngac ccngacccng nncgaggacc 1980
gggagangan cgaggagcgg cngaagaccn acgcccaccn gnncgacgac aaggnganga 2040
agcagcngaa gcggcggcgg nacaccggcn ggggccggcn gagccggaag cngancaacg 2100
gcanccggga caagcagagc ggcaagacca nccnggacnn ccngaagagc gacggcnncg 2160
ccaaccggaa cnncangcag cnganccacg acgacagccn gaccnncaag gaggacancc 2220
agaaggccca ggngagcggc cagggcgaca gccngcacga gcacancgcc aaccnggccg 2280
gcagccccgc cancaagaag ggcanccngc agaccgngaa ggnggnggac gagcnggnga 2340
aggnganggg ccggcacaag cccgagaaca ncgngancga ganggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggangaa gcggancgag gagggcanca 2460
aggagcnggg cagccaganc cngaaggagc accccgngga gaacacccag cngcagaacg 2520
agaagcngna ccngnacnac cngcagaacg gccgggacan gnacgnggac caggagcngg 2580
acancaaccg gcngagcgac nacgacgngg accacancgn gccccagagc nnccngaagg 2640
acgacagcan cgacaacaag gngcngaccc ggagcgacaa gaaccggggc aagagcgaca 2700
acgngcccag cgaggaggng gngaagaaga ngaagaacna cnggcggcag cngcngaacg 2760
ccaagcngan cacccagcgg aagnncgaca accngaccaa ggccgagcgg ggcggccnga 2820
gcgagcngga caaggccggc nncancaagc ggcagcnggn ggagacccgg cagancacca 2880
agcacgnggc ccaganccng gacagccgga ngaacaccaa gnacgacgag aacgacaagc 2940
nganccggga ggngaaggng ancacccnga agagcaagcn ggngagcgac nnccggaagg 3000
acnnccagnn cnacaaggng cgggaganca acaacnacca ccacgcccac gacgccnacc 3060
ngaacgccgn ggngggcacc gcccnganca agaagnaccc caagcnggag agcgagnncg 3120
ngnacggcga cnacaaggng nacgacgngc ggaagangan cgccaagagc gagcaggaga 3180
ncggcaaggc caccgccaag nacnncnncn acagcaacan cangaacnnc nncaagaccg 3240
agancacccn ggccaacggc gaganccgga agcggccccn gancgagacc aacggcgaga 3300
ccggcgagan cgngngggac aagggccggg acnncgccac cgnccggaag gngcngagca 3360
ngccccaggn gaacancgng aagaagaccg aggngcagac cggcggcnnc agcaaggaga 3420
gcanccngcc caagcggaac agcgacaagc ngancgcccg gaagaaggac ngggacccca 3480
agaagnacgg cggcnncgac agccccaccg nggccnacag cgngcnggng gnggccaagg 3540
nggagaaggg caagagcaag aagcngaaga gcgngaagga gcngcngggc ancaccanca 3600
nggagcggag cagcnncgag aagaacccca ncgacnnccn ggaggccaag ggcnacaagg 3660
aggngaagaa ggaccnganc ancaagcngc ccaagnacag ccngnncgag cnggagaacg 3720
gccggaagcg gangcnggcc agcgccggcg agcngcagaa gggcaacgag cnggcccngc 3780
ccagcaagna cgngaacnnc cngnaccngg ccagccacna cgagaagcng aagggcagcc 3840
ccgaggacaa cgagcagaag cagcngnncg nggagcagca caagcacnac cnggacgaga 3900
ncancgagca gancagcgag nncagcaagc gggnganccn ggccgacgcc aaccnggaca 3960
aggngcngag cgccnacaac aagcaccggg acaagcccan ccgggagcag gccgagaaca 4020
ncanccaccn gnncacccng accaaccngg gcgcccccgc cgccnncaag nacnncgaca 4080
ccaccancga ccggaagcgg nacaccagca ccaaggaggn gcnggacgcc acccngancc 4140
accagagcan caccggccng nacgagaccc ggancgaccn gagccagcng ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 4260
gcnaccccna cgacgngccc gacnacgccn gagcggccgc nnaannaagc ngccnncngc 4320
ggggcnngcc nncnggccan gcccnncnnc ncncccnngc accngnaccn cnnggncnnn 4380
gaanaaagcc ngagnaggaa gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500
aaaaaaaaaa aaaaaaaaaa a 4521
<210> 69
<211> 4521
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 Cas9-mRNA-Lv3-417.3
<400> 69
aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gcccccaaga 60
agaagcggaa ggugggcauc cacggcgugc ccgccgccga caagaaguac agcaucggcc 120
uggacaucgg caccaacagc gugggcuggg ccgugaucac cgacgaguac aaggugccca 180
gcaagaaguu caaggugcug ggcaacaccg accggcacag caucaagaag aaccugaucg 240
gcgcccugcu guucgacagc ggcgagaccg ccgaggccac ccggcugaag cggaccgccc 300
ggcggcggua cacccggcgg aagaaccgga ucugcuaccu gcaggagauc uucagcaacg 360
agauggccaa gguggacgac agcuucuucc accggcugga ggagagcuuc cugguggagg 420
aggacaagaa gcacgagcgg caccccaucu ucggcaacau cguggacgag guggccuacc 480
acgagaagua ccccaccauc uaccaccugc ggaagaagcu gguggacagc accgacaagg 540
ccgaccugcg gcugaucuac cuggcccugg cccacaugau caaguuccgg ggccacuucc 600
ugaucgaggg cgaccugaac cccgacaaca gcgacgugga caagcuguuc auccagcugg 660
ugcagaccua caaccagcug uucgaggaga accccaucaa cgccagcggc guggacgcca 720
aggccauccu gagcgcccgg cugagcaaga gccggcggcu ggagaaccug aucgcccagc 780
ugcccggcga gaacaagaac ggccuguucg gcaaccugau cgcccugagc cugggccuga 840
cccccaacuu caagagcaac uucgaccugg ccgaggacgc caagcugcag cugagcaagg 900
acaccuacga cgacgaccug gacaaccugc uggcccagau cggcgaccag uacgccgacc 960
uguuccuggc cgccaagaac cugagcgacg ccauccugcu gagcgacauc cugcggguga 1020
acaccgagau caccaaggcc ccccugagcg ccagcaugau caagcgguac gacgagcacc 1080
accaggaccu gacccugcug aaggcccugg ugcggcagca gcugcccgag aaguacaagg 1140
agaucuucuu cgaccagagc aagaacggcu acgccggcua caucgacggc ggcgccagcc 1200
aggaggaguu cuacaaguuc aucaagccca uccuggagaa gauggacggc accgaggagc 1260
ugcuggugaa gcugaaccgg gaggaccugc ugcggaagca gcggaccuuc gacaacggca 1320
gcauccccca ccagauccac cugggcgagc ugcacgccau ccugcggcgg caggaggacu 1380
ucuaccccuu ccugaaggac aaccgggaga agaucgagaa gauccugacc uuccggaucc 1440
ccuacuacgu gggcccccug gcccggggca acagccgguu cgccuggaug acccggaaga 1500
gcgaggagac caucaccccc uggaacuucg aggagguggu ggacaagggc gccagcgccc 1560
agagcuucau cgagcggaug accaacuucg acaagaaccu gcccaacgag aaggugcugc 1620
ccaagcacag ccugcuguac gaguacuuca ccguguacaa cgagcugacc aaggugaagu 1680
acgugaccga gggcaugcgg aagcccgccu uccugagcgg cgagcagaag aaggccaucg 1740
uggaccugcu guucaagacc aaccggaagg ugaccgugaa gcagcugaag gaggacuacu 1800
ucaagaagau cgagugcuuc gacagcgugg agaucagcgg cguggaggac cgguucaacg 1860
ccagccuggg caccuaccac gaccugcuga agaucaucaa ggacaaggac uuccuggaca 1920
acgaggagaa cgaggacauc cuggaggaca ucgugcugac ccugacccug uucgaggacc 1980
gggagaugau cgaggagcgg cugaagaccu acgcccaccu guucgacgac aaggugauga 2040
agcagcugaa gcggcggcgg uacaccggcu ggggccggcu gagccggaag cugaucaacg 2100
gcauccggga caagcagagc ggcaagacca uccugcacuu ccugaagagc gacggcuucg 2160
ccaaccggaa cuucaugcag cugauccacg acgacagccu gaccuucaag gaggacaucc 2220
agaaggccca ggugagcggc cagggcgaca gccugcacga gcacaucgcc aaccuggccg 2280
gcagccccgc caucaagaag ggcauccugc agaccgugaa ggugguggac gagcugguga 2340
aggugauggg ccggcacaag cccgagaaca ucgugaucga gauggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggaugaa gcggaucgag gagggcauca 2460
aggagcuggg cagccagauc cugaaggagc accccgugga gaacacccag cugcagaacg 2520
agaagcugua ccuguacuac cugcagaacg gccgggacau guacguggac caggagcugg 2580
acaucaaccg gcugagcgac uacgacgugg accacaucgu gccccagagc uuccugaagg 2640
acgacagcau cgacaacaag gugcugaccc ggagcgacaa gaaccggggc aagagcgaca 2700
acgugcccag cgaggaggug gugaagaaga ugaagaacua cuggcggcag cugcugaacg 2760
ccaagcugau cacccagcgg aaguucgaca accugaccaa ggccgagcgg ggcggccuga 2820
gcgagcugga caaggccggc uucaucaagc ggcagcuggu ggagacccgg cagaucacca 2880
agcacguggc ccagauccug gacagccgga ugaacaccaa guacgacgag aacgacaagc 2940
ugauccggga ggugaaggug aucacccuga agagcaagcu ggugagcgac uuccggaagg 3000
acuuccaguu cuacaaggug cgggagauca acaacuacca ccacgcccac gacgccuacc 3060
ugaacgccgu ggugggcacc gcccugauca agaaguaccc caagcuggag agcgaguucg 3120
uguacggcga cuacaaggug uacgacgugc ggaagaugau cgccaagagc gagcaggaga 3180
ucggcaaggc caccgccaag uacuucuucu acagcaacau caugaacuuc uucaagaccg 3240
agaucacccu ggccaacggc gagauccgga agcggccccu gaucgagacc aacggcgaga 3300
ccggcgagau cgugugggac aagggccggg acuucgccac cgugcggaag gugcugagca 3360
ugccccaggu gaacaucgug aagaagaccg aggugcagac cggcggcuuc agcaaggaga 3420
gcauccugcc caagcggaac agcgacaagc ugaucgcccg gaagaaggac ugggacccca 3480
agaaguacgg cggcuucgac agccccaccg uggccuacag cgugcuggug guggccaagg 3540
uggagaaggg caagagcaag aagcugaaga gcgugaagga gcugcugggc aucaccauca 3600
uggagcggag cagcuucgag aagaacccca ucgacuuccu ggaggccaag ggcuacaagg 3660
aggugaagaa ggaccugauc aucaagcugc ccaaguacag ccuguucgag cuggagaacg 3720
gccggaagcg gaugcuggcc agcgccggcg agcugcagaa gggcaacgag cuggcccugc 3780
ccagcaagua cgugaacuuc cuguaccugg ccagccacua cgagaagcug aagggcagcc 3840
ccgaggacaa cgagcagaag cagcuguucg uggagcagca caagcacuac cuggacgaga 3900
ucaucgagca gaucagcgag uucagcaagc gggugauccu ggccgacgcc aaccuggaca 3960
aggugcugag cgccuacaac aagcaccggg acaagcccau ccgggagcag gccgagaaca 4020
ucauccaccu guucacccug accaaccugg gcgcccccgc cgccuucaag uacuucgaca 4080
ccaccaucga ccggaagcgg uacaccagca ccaaggaggu gcuggacgcc acccugaucc 4140
accagagcau caccggccug uacgagaccc ggaucgaccu gagccagcug ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 4260
gcuaccccua cgacgugccc gacuacgccu gagcggccgc uuaauuaagc ugccuucugc 4320
ggggcuugcc uucuggccau gcccuucuuc ucucccuugc accuguaccu cuuggucuuu 4380
gaauaaagcc ugaguaggaa gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500
aaaaaaaaaa aaaaaaaaaa a 4521
<210> 70
<211> 4521
<212> RNA
<213> 人工序列
<220>
<223> 合成序列 Cas9-mRNA-Lv4-417.4
<220>
<221> misc_feature
<222> (1)...(4521)
<223> n = 假尿苷
<400> 70
aggaaanaag agagaaaaga agagnaagaa gaaananaag agccaccang gcccccaaga 60
agaagcggaa ggngggcanc cacggcgngc ccgccgccga caagaagnac agcancggcc 120
nggacancgg caccaacagc gngggcnggg ccgngancac cgacgagnac aaggngccca 180
gcaagaagnn caaggngcng ggcaacaccg accggcacag cancaagaag aaccngancg 240
gcgcccngcn gnncgacagc ggcgagaccg ccgaggccac ccggcngaag cggaccgccc 300
ggcggcggna cacccggcgg aagaaccgga ncngcnaccn gcaggaganc nncagcaacg 360
aganggccaa ggnggacgac agcnncnncc accggcngga ggagagcnnc cnggnggagg 420
aggacaagaa gcacgagcgg caccccancn ncggcaacan cgnggacgag gnggccnacc 480
acgagaagna ccccaccanc naccaccngc ggaagaagcn ggnggacagc accgacaagg 540
ccgaccngcg gcngancnac cnggcccngg cccacangan caagnnccgg ggccacnncc 600
ngancgaggg cgaccngaac cccgacaaca gcgacgngga caagcngnnc anccagcngg 660
ngcagaccna caaccagcng nncgaggaga accccancaa cgccagcggc gnggacgcca 720
aggccanccn gagcgcccgg cngagcaaga gccggcggcn ggagaaccng ancgcccagc 780
ngcccggcga gaagaagaac ggccngnncg gcaaccngan cgcccngagc cngggccnga 840
cccccaacnn caagagcaac nncgaccngg ccgaggacgc caagcngcag cngagcaagg 900
acaccnacga cgacgaccng gacaaccngc nggcccagan cggcgaccag nacgccgacc 960
ngnnccnggc cgccaagaac cngagcgacg ccanccngcn gagcgacanc cngcgggnga 1020
acaccgagan caccaaggcc ccccngagcg ccagcangan caagcggnac gacgagcacc 1080
accaggaccn gacccngcng aaggcccngg ngcggcagca gcngcccgag aagnacaagg 1140
agancnncnn cgaccagagc aagaacggcn acgccggcna cancgacggc ggcgccagcc 1200
aggaggagnn cnacaagnnc ancaagccca nccnggagaa ganggacggc accgaggagc 1260
ngcnggngaa gcngaaccgg gaggaccngc ngcggaagca gcggaccnnc gacaacggca 1320
gcanccccca ccaganccac cngggcgagc ngcacgccan ccngcggcgg caggaggacn 1380
ncnaccccnn ccngaaggac aaccgggaga agancgagaa ganccngacc nnccggancc 1440
ccnacnacgn gggcccccng gcccggggca acagccggnn cgccnggang acccggaaga 1500
gcgaggagac cancaccccc nggaacnncg aggaggnggn ggacaagggc gccagcgccc 1560
agagcnncan cgagcggang accaacnncg acaagaaccn gcccaacgag aaggngcngc 1620
ccaagcacag ccngcngnac gagnacnnca ccgngnacaa cgagcngacc aaggngaagn 1680
acgngaccga gggcangcgg aagcccgccn nccngagcgg cgagcagaag aaggccancg 1740
nggaccngcn gnncaagacc aaccggaagg ngaccgngaa gcagcngaag gaggacnacn 1800
ncaagaagan cgagngcnnc gacagcgngg agancagcgg cgnggaggac cggnncaacg 1860
ccagccnggg caccnaccac gaccngcnga agancancaa ggacaaggac nnccnggaca 1920
acgaggagaa cgaggacanc cnggaggaca ncgngcngac ccngacccng nncgaggacc 1980
gggagangan cgaggagcgg cngaagaccn acgcccaccn gnncgacgac aaggnganga 2040
agcagcngaa gcggcggcgg nacaccggcn ggggccggcn gagccggaag cngancaacg 2100
gcanccggga caagcagagc ggcaagacca nccnggacnn ccngaagagc gacggcnncg 2160
ccaaccggaa cnncangcag cnganccacg acgacagccn gaccnncaag gaggacancc 2220
agaaggccca ggngagcggc cagggcgaca gccngcacga gcacancgcc aaccnggccg 2280
gcagccccgc cancaagaag ggcanccngc agaccgngaa ggnggnggac gagcnggnga 2340
aggnganggg ccggcacaag cccgagaaca ncgngancga ganggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggangaa gcggancgag gagggcanca 2460
aggagcnggg cagccaganc cngaaggagc accccgngga gaacacccag cngcagaacg 2520
agaagcngna ccngnacnac cngcagaacg gccgggacan gnacgnggac caggagcngg 2580
acancaaccg gcngagcgac nacgacgngg accacancgn gccccagagc nnccngaagg 2640
acgacagcan cgacaacaag gngcngaccc ggagcgacaa gaaccggggc aagagcgaca 2700
acgngcccag cgaggaggng gngaagaaga ngaagaacna cnggcggcag cngcngaacg 2760
ccaagcngan cacccagcgg aagnncgaca accngaccaa ggccgagcgg ggcggccnga 2820
gcgagcngga caaggccggc nncancaagc ggcagcnggn ggagacccgg cagancacca 2880
agcacgnggc ccaganccng gacagccgga ngaacaccaa gnacgacgag aacgacaagc 2940
nganccggga ggngaaggng ancacccnga agagcaagcn ggngagcgac nnccggaagg 3000
acnnccagnn cnacaaggng cgggaganca acaacnacca ccacgcccac gacgccnacc 3060
ngaacgccgn ggngggcacc gcccnganca agaagnaccc caagcnggag agcgagnncg 3120
ngnacggcga cnacaaggng nacgacgngc ggaagangan cgccaagagc gagcaggaga 3180
ncggcaaggc caccgccaag nacnncnncn acagcaacan cangaacnnc nncaagaccg 3240
agancacccn ggccaacggc gaganccgga agcggccccn gancgagacc aacggcgaga 3300
ccggcgagan cgngngggac aagggccggg acnncgccac cgngcggaag gngcngagca 3360
ngccccaggn gaacancgng aagaagaccg aggngcagac cggcggcnnc agcaaggaga 3420
gcanccngcc caagcggaac agcgacaagc ngancgcccg gaagaaggac ngggacccca 3480
agaagnacgg cggcnncgac agccccaccg nggccnacag cgngcnggng gnggccaagg 3540
nggagaaggg caagagcaag aagcngaaga gcgngaagga gcngcngggc ancaccanca 3600
nggagcggag cagcnncgag aagaacccca ncgacnnccn ggaggccaag ggcnacaagg 3660
aggngaagaa ggaccnganc ancaagcngc ccaagnacag ccngnncgag cnggagaacg 3720
gccggaagcg gangcnggcc agcgccggcg agcngcagaa gggcaacgag cnggcccngc 3780
ccagcaagna cgngaacnnc cngnaccngg ccagccacna cgagaagcng aagggcagcc 3840
ccgaggacaa cgagcagaag cagcngnncg nggagcagca caagcacnac cnggacgaga 3900
ncancgagca gancagcgag nncagcaagc gggnganccn ggccgacgcc aaccnggaca 3960
aggngcngag cgccnacaac aagcaccggg acaagcccan ccgggagcag gccgagaaca 4020
ncanccaccn gnncacccng accaaccngg gcgcccccgc cgccnncaag nacnncgaca 4080
ccaccancga ccggaagcgg nacaccagca ccaaggaggn gcnggacgcc acccngancc 4140
accagagcan caccggccng nacgagaccc ggancgaccn gagccagcng ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 4260
gcnaccccna cgacgngccc gacnacgccn gagcggccgc nnaannaagc ngccnncngc 4320
ggggcnngcc nncnggccan gcccnncnnc ncncccnngc accngnaccn cnnggncnnn 4380
gaanaaagcc ngagnaggaa gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500
aaaaaaaaaa aaaaaaaaaa a 4521
<210> 71
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV16-sgRNA-v2.417
<220>
<221> modified_base
<222> 1,2
<223> am, 硫代磷酸酯键
<220>
221> modified_base
<222> 3
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> (97)...(99)
<223> um, 硫代磷酸酯键
<400> 71
aagugugacu cuacgcuugu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60
uuaucaacuu gaaaaagugg caccgagucg gugcuuuuuu 100
<210> 72
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV16-sgRNA-BNA-v1.417
<220>
<221> modified_base
<222> 1
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 8,17
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 72
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 73
<211> 98
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV16-sgRNA-BNA-v11(eleven).417
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> um, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 5,14
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (95)...(97)
<223> um, 硫代磷酸酯键
<400> 73
gugugacucu acgcuuguuu uagagcuaga aauagcaagu uaaaauaagg cuaguccguu 60
aucaacuuga aaaaguggca ccgagucggu gcuuuuuu 98
<210> 74
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV16-sgRNA-v2.417-碱基
<400> 74
aagugugacu cuacgcuugu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60
uuaucaacuu gaaaaagugg caccgagucg gugcuuuuuu 100
<210> 75
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV16-sgRNA-BNA-v1.417-碱基
<400> 75
gcaaguguga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 76
<211> 97
<212> RNA
<213> 人工序列
<220>
<223> Synthetic sequence
HPV16-sgRNA-BNA-v11(eleven).417-碱基
<400> 76
gugugacucu cgcuuguuuu agagcuagaa auagcaaguu aaaauaaggc uaguccguua 60
ucaacuugaa aaaguggcac cgagucggug cuuuuuu 97
<210> 77
<211> 4401
<212> DNA
<213> 人工序列
<220>
<223> 合成序列野生型 S. pyogenes Cas9, 修饰的 (替代性)
<220>
<223> 包含DNA和RNA碱基
<220>
<221> modified_base
<222> (1)...(4401)
<223> c = 5-甲基胞苷
<220>
<221> misc_feature
<222> (1)...(4401)
<223> n = 假尿苷
<400> 77
gggagacann ngcnncngac acaacngtgn ncacnagcaa ccncaaacag ccaccanggc 60
cccaaagaag aagcggaagg ncggnancca cggagnccca gcagccgaca agaagnacag 120
cancggccng gacancggca ccaacncngn gggcngggcc gngancaccg acgagnacaa 180
ggngcccagc aagaaannca aggngcnggg caacaccgac cggcacagca ncaagaagaa 240
ccngancgga gcccngcngn ncgacagcgg cgaaacagcc gaggccaccc ggcngaagag 300
aaccgccaga agaaganaca ccagacggaa gaaccgganc ngcnancngc aagagancnn 360
cagcaacgag anggccaagg nggacgacag cnncnnccac agacnggaag agnccnnccn 420
ggnggaagag gacaagaagc acgagagaca ccccancnnc ggcaacancg nggacgaggn 480
ggccnaccac gagaagnacc ccaccancna ccaccngaga aagaaacngg nggacagcac 540
cgacaaggcc gaccngagac ngancnaccn ggcccnggcc cacanganca agnncagagg 600
ccacnnccng ancgagggcg accngaaccc cgacaacagc gacgnggaca agcngnncan 660
ccagcnggng cagaccnaca accagcngnn cgaggaaaac cccancaacg ccagcggcgn 720
ggacgccaag gcnanccngn cngccagacn gagcaagagc agaaggcngg aaaancngan 780
cgcccagcng cccggcgaga agaagaacgg ccngnncggc aaccnganng cccngagccn 840
gggccngacc cccaacnnca agagcaacnn cgaccnggcc gaggangcca aacngcagcn 900
gagcaaggac accnacgacg acgaccngga caaccngcng gcccagancg gcgaccagna 960
cgccgaccng nnccnggccg ccaagaaccn gncngacgcc anccngcnga gcgacanccn 1020
gagagngaac accgaganca ccaaggcccc ccngagcgcc ncnanganca agaganacga 1080
cgagcaccac caggaccnga cccngcngaa agcncncgng cggcagcagc ngccngagaa 1140
gnacaaagaa ancnncnncg accagagcaa gaacggcnac gccggcnaca ncganggcgg 1200
cgcnagccag gaagagnncn acaagnncan caagcccanc cnggaaaaga nggacggcac 1260
cgaggaacng cncgngaagc ngaacagaga ggaccngcng agaaagcaga gaaccnncga 1320
caacggcagc ancccccacc aganccaccn gggagagcng cacgcnancc ngagaaggca 1380
ggaagannnn nacccanncc ngaaggacaa ccgggaaaag ancgagaaga nccngaccnn 1440
caggancccc nacnacgngg gcccccnggc cagaggcaac agcaganncg ccnggangac 1500
cagaaagagc gaggaaacca ncacccccng gaacnncgag gaagnggngg acaagggcgc 1560
cagcgcccag agcnncancg agagaangac aaacnncgan aagaaccngc ccaacgagaa 1620
ggngcngccc aagcacagcc ngcngnacga gnacnncacc gngnacaacg agcngaccaa 1680
agngaaanac gngaccgagg gaangagaaa gcccgccnnc cngagcggcg agcagaaaaa 1740
ggccancgng gaccngcngn ncaagaccaa cagaaaagng accgngaagc agcngaaaga 1800
ggacnacnnc aagaaaancg agngcnncga cnccgnggaa ancnccggcg nggaaganag 1860
anncaacgcc ncccngggca canaccacga ncngcngaaa annancaagg acaaggacnn 1920
ccngganaac gaagagaacg aggacanncn ggaagananc gngcngaccc ngacacngnn 1980
ngaggaccgc gagangancg aggaaaggcn gaaaaccnac gcncaccngn ncgacgacaa 2040
agngangaag cagcngaaga gaaggcggna caccggcngg ggcaggcnga gcagaaagcn 2100
gancaacggc ancagagaca agcagagcgg caagacaanc cnggannncc ngaagnccga 2160
cggcnncgcc aaccggaacn ncangcagcn ganccacgac gacagccnga canncaaaga 2220
ggacanccag aaagcccagg ngnccggcca gggcgacncn cngcacgagc anancgcnaa 2280
ccnggccggc agccccgcna ncaagaaggg canccngcag acagngaagg nggnggacga 2340
gcncgngaaa gngangggca gacacaagcc cgagaacanc gngancgaga nggcnagaga 2400
gaaccagacc acccagaagg gacagaagaa cncccgcgag aggangaaga gaancgaaga 2460
gggcancaaa gagcngggca gccaganccn gaaagaacac cccgnggaaa acacccagcn 2520
gcagaacgag aagcngnacc ngnacnaccn gcagaanggc cggganangn acgnggacca 2580
ggaacnggac ancaacagac ngnccgacna cgangnggac canancgngc cncagagcnn 2640
ncngaaggac gacnccancg anaacaaagn gcngacncgg agcgacaaga acagaggcaa 2700
gagcgacaac gngcccnccg aagaggncgn gaagaagang aagaacnacn ggcgacagcn 2760
gcngaacgcc aagcnganna cccagaggaa gnncganaac cngaccaagg ccgagagagg 2820
cggccngagc gagcnggana aggccggcnn cancaagagg cagcnggngg aaaccagaca 2880
gancacaaag cacgnggcac aganccngga cncccggang aacacnaagn acgacgaaaa 2940
cganaagcng anccgggaag ngaaagngan cacccngaag nccaagcngg ngnccgannn 3000
ccggaaggan nnccagnnnn acaaagngcg cgagancaac aacnaccacc acgcccacga 3060
cgccnaccng aacgccgncg ngggaaccgc ccngancaaa aagnacccna agcnggaaag 3120
cgagnncgng nacggcgacn acaaggngna cgacgngcgg aagangancg ccaagagcga 3180
gcaggaaanc ggcaaggcna ccgccaagna cnncnncnac agcaacanca ngaacnnnnn 3240
caagaccgaa ancacccngg ccaacggcga gancagaaag cgcccncnga ncgagacaaa 3300
cggcgaaacc ggggagancg ngnggganaa gggcagagac nncgccacag ngcgaaaggn 3360
gcngagcang ccccaagnga anancgngaa aaagaccgag gngcagacag gcggcnncag 3420
caaagagncn anccngccca agaggaacag cgacaagcng ancgccagaa agaaggacng 3480
ggaccccaag aagnacggcg gcnncgacag cccnaccgng gccnacncng ngcnggnggn 3540
ggcnaaggng gaaaagggca agnccaagaa acngaagagn gngaaagagc ngcnggggan 3600
caccancang gaaagaagca gcnnngagaa gaacccnanc gacnnncngg aagccaaggg 3660
cnacaaagaa gngaaaaagg accngancan caagcngccn aagnacnccc ngnncgagcn 3720
ggaaaacggc agaaagagaa ngcnggccnc ngccggcgaa cngcagaagg gaaacgagcn 3780
ggcccngccn agcaaanang ngaacnnccn gnaccnggcc ncccacnang agaagcngaa 3840
gggcagcccn gaggacaacg aacagaaaca gcngnnngng gaacagcana agcacnaccn 3900
ggacgaganc ancgagcaga ncagcgagnn cnccaagaga gnganccngg ccgacgccaa 3960
ncnggacaag gngcngncng ccnacaacaa gcacagggac aagccnanca gagagcaggc 4020
cgagaananc anccaccngn ncacccngac aaaccngggc gcnccngccg ccnncaagna 4080
cnnngacacc accancgacc ggaagaggna caccagcacc aaagaggngc nggacgccac 4140
ccnganccac cagagcanca ccggccngna cgagacaaga ancgaccngn cncagcnggg 4200
aggcgacaag agaccngccg ccacnaagaa ggccggacag gccaaaaaga agaagngagc 4260
ncgcnnncnn gcngnccaan nncnannaaa ggnnccnnng nncccnaagn ccaacnacna 4320
aacnggggga nannangaag ggccnngagc ancnggannc ngccnaanaa aaaacannna 4380
nnnncanngc gagcggccgc a 4401
<210> 78
<211> 4485
<212> RNA
<213> 人工序列
<220>
<223> 合成序列野生型S. pyogenes Cas9, 修饰的-2
<220>
<221> misc_feature
<222> (1)...(4485)
<223> n = 5甲氧基尿苷
<400> 78
aggaaanaag agagaaaaga agagnaagaa gaaananaag agccaccang gcccccaaga 60
agaagcggaa ggngggcanc cacggcgngc ccgccgccga caagaagnac agcancggcc 120
nggacancgg caccaacagc gngggcnggg ccgngancac cgacgagnac aaggngccca 180
gcaagaagnn caaggngcng ggcaacaccg accggcacag cancaagaag aaccngancg 240
gcgcccngcn gnncgacagc ggcgagaccg ccgaggccac ccggcngaag cggaccgccc 300
ggcggcggna cacccggcgg aagaaccgga ncngcnaccn gcaggaganc nncagcaacg 360
aganggccaa ggnggacgac agcnncnncc accggcngga ggagagcnnc cnggnggagg 420
aggacaagaa gcacgagcgg caccccancn ncggcaacan cgnggacgag gnggccnacc 480
acgagaagna ccccaccanc naccaccngc ggaagaagcn ggnggacagc accgacaagg 540
ccgaccngcg gcngancnac cnggcccngg cccacangan caagnnccgg ggccacnncc 600
ngancgaggg cgaccngaac cccgacaaca gcgacgngga caagcngnnc anccagcngg 660
ngcagaccna caaccagcng nncgaggaga accccancaa cgccagcggc gnggacgcca 720
aggccanccn gagcgcccgg cngagcaaga gccggcggcn ggagaaccng ancgcccagc 780
ngcccggcga gaagaagaac ggccngnncg gcaaccngan cgcccngagc cngggccnga 840
cccccaacnn caagagcaac nncgaccngg ccgaggacgc caagcngcag cngagcaagg 900
acaccnacga cgacgaccng gacaaccngc nggcccagan cggcgaccag nacgccgacc 960
ngnnccnggc cgccaagaac cngagcgacg ccanccngcn gagcgacanc cngcgggnga 1020
acaccgagan caccaaggcc ccccngagcg ccagcangan caagcggnac gacgagcacc 1080
accaggaccn gacccngcng aaggcccngg ngcggcagca gcngcccgag aagnacaagg 1140
agancnncnn cgaccagagc aagaacggcn acgccggcna cancgacggc ggcgccagcc 1200
aggaggagnn cnacaagnnc ancaagccca nccnggagaa ganggacggc accgaggagc 1260
ngcnggngaa gcngaaccgg gaggaccngc ngcggaagca gcggaccnnc gacaacggca 1320
gcanccccca ccaganccac cngggcgagc ngcacgccan ccngcggcgg caggaggacn 1380
ncnaccccnn ccngaaggac aaccgggaga agancgagaa ganccngacc nnccggancc 1440
ccnacnacgn gggcccccng gcccggggca acagccggnn cgccnggang acccggaaga 1500
gcgaggagac cancaccccc nggaacnncg aggaggnggn ggacaagggc gccagcgccc 1560
agagcnncan cgagcggang accaacnncg acaagaaccn gcccaacgag aaggngcngc 1620
ccaagcacag ccngcngnac gagnacnnca ccgngnacaa cgagcngacc aaggngaagn 1680
acgngaccga gggcangcgg aagcccgccn nccngagcgg cgagcagaag aaggccancg 1740
nggaccngcn gnncaagacc aaccggaagg ngaccgngaa gcagcngaag gaggacnacn 1800
ncaagaagan cgagngcnnc gacagcgngg agancagcgg cgnggaggac cggnncaacg 1860
ccagccnggg caccnaccac gaccngcnga agancancaa ggacaaggac nnccnggaca 1920
acgaggagaa cgaggacanc cnggaggaca ncgngcngac ccngacccng nncgaggacc 1980
gggagangan cgaggagcgg cngaagaccn acgcccaccn gnncgacgac aaggnganga 2040
agcagcngaa gcggcggcgg nacaccggcn ggggccggcn gagccggaag cngancaacg 2100
gcanccggga caagcagagc ggcaagacca nccnggacnn ccngaagagc gacggcnncg 2160
ccaaccggaa cnncangcag cnganccacg acgacagccn gaccnncaag gaggacancc 2220
agaaggccca ggngagcggc cagggcgaca gccngcacga gcacancgcc aaccnggccg 2280
gcagccccgc cancaagaag ggcanccngc agaccgngaa ggnggnggac gagcnggnga 2340
aggnganggg ccggcacaag cccgagaaca ncgngancga ganggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggangaa gcggancgag gagggcanca 2460
aggagcnggg cagccaganc cngaaggagc accccgngga gaacacccag cngcagaacg 2520
agaagcngna ccngnacnac cngcagaacg gccgggacan gnacgnggac caggagcngg 2580
acancaaccg gcngagcgac nacgacgngg accacancgn gccccagagc nnccngaagg 2640
acgacagcan cgacaacaag gngcngaccc ggagcgacaa gaaccggggc aagagcgaca 2700
acgngcccag cgaggaggng gngaagaaga ngaagaacna cnggcggcag cngcngaacg 2760
ccaagcngan cacccagcgg aagnncgaca accngaccaa ggccgagcgg ggcggccnga 2820
gcgagcngga caaggccggc nncancaagc ggcagcnggn ggagacccgg cagancacca 2880
agcacgnggc ccaganccng gacagccgga ngaacaccaa gnacgacgag aacgacaagc 2940
nganccggga ggngaaggng ancacccnga agagcaagcn ggngagcgac nnccggaagg 3000
acnnccagnn cnacaaggng cgggaganca acaacnacca ccacgcccac gacgccnacc 3060
ngaacgccgn ggngggcacc gcccnganca agaagnaccc caagcnggag agcgagnncg 3120
ngnacggcga cnacaaggng nacgacgngc ggaagangan cgccaagagc gagcaggaga 3180
ncggcaaggc caccgccaag nacnncnncn acagcaacan cangaacnnc nncaagaccg 3240
agancacccn ggccaacggc gaganccgga agcggccccn gancgagacc aacggcgaga 3300
ccggcgagan cgngngggac aagggccggg acnncgccac cgngcggaag gngcngagca 3360
ngccccaggn gaacancgng aagaagaccg aggngcagac cggcggcnnc agcaaggaga 3420
gcanccngcc caagcggaac agcgacaagc ngancgcccg gaagaaggac ngggacccca 3480
agaagnacgg cggcnncgac agccccaccg nggccnacag cgngcnggng gnggccaagg 3540
nggagaaggg caagagcaag aagcngaaga gcgngaagga gcngcngggc ancaccanca 3600
nggagcggag cagcnncgag aagaacccca ncgacnnccn ggaggccaag ggcnacaagg 3660
aggngaagaa ggaccnganc ancaagcngc ccaagnacag ccngnncgag cnggagaacg 3720
gccggaagcg gangcnggcc agcgccggcg agcngcagaa gggcaacgag cnggcccngc 3780
ccagcaagna cgngaacnnc cngnaccngg ccagccacna cgagaagcng aagggcagcc 3840
ccgaggacaa cgagcagaag cagcngnncg nggagcagca caagcacnac cnggacgaga 3900
ncancgagca gancagcgag nncagcaagc gggnganccn ggccgacgcc aaccnggaca 3960
aggngcngag cgccnacaac aagcaccggg acaagcccan ccgggagcag gccgagaaca 4020
ncanccaccn gnncacccng accaaccngg gcgcccccgc cgccnncaag nacnncgaca 4080
ccaccancga ccggaagcgg nacaccagca ccaaggaggn gcnggacgcc acccngancc 4140
accagagcan caccggccng nacgagaccc ggancgaccn gagccagcng ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaaggcgg 4260
ccgcnnaann aagcngccnn cngcggggcn ngccnncngg ccangcccnn cnncncnccc 4320
nngcaccngn accncnnggn cnnngaanaa agccngagna ggaagaaaaa aaaaaaaaaa 4380
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 4485
<210> 79
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 合成序列 HPV16向导 RNA LNA E7-14
<220>
<223> 包含DNA和RNA碱基
<220>
<221> modified_base
<222> 1
<223> 硫代磷酸酯键, 锁核酸或桥连核酸
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 8,17
<223> 锁核酸或桥连核酸
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 79
gcaagugtga cucuacgcuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 80
<211> 97
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV向导RNA 尿苷枯竭的E7-14
<220>
<221> modified_base
<222> 1
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 2
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 3
<223> am, 硫代磷酸酯键
<220>
<221> modified_base
<222> 94
<223> cm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 95
<223> gm, 硫代磷酸酯键
<220>
<221> modified_base
<222> 96
<223> cm, 硫代磷酸酯键
<400> 80
gcaaguguga cucuacgcuu guugcggagc cggaaacggc aagucgcaau aaggcuaguc 60
cgccaccagc gcgaaagcgc ggcgccgagu cggcgcc 97
<210> 81
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV 向导RNA E6-2
<220>
<221> modified_base
<222> (98)...(100)
<223> um, 硫代磷酸酯键
<400> 81
caacaguuac ugcgacgugg uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 82
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 合成序列HPV 向导RNA E7-1
<220>
<221> modified_base
<222> (99)...(101)
<223> um, 硫代磷酸酯键
<400> 82
aacccagcug uaaucaugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列 具有BNA/LNA的HPV向导RNA E6-1
<220>
<223> 包含DNA和RNA碱基
<220>
<221> modified_base
<222> 1,2,3,4,5,13,14
<223> 锁核酸或桥连核酸
<400> 83
tgcaauguuu caggacccac 20
<210> 84
<211> 1368
<212> PRT
<213> 人工序列
<220>
<223> 合成序列野生型S. pyogenes Cas9蛋白 (UniProt Ref. Q99ZW2)
<400> 84
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
- 上一篇:一种医用注射器针头装配设备
- 下一篇:一种激活p21基因表达的方法