用于鉴定tau接种或聚集的基因修饰因子的CRISPR/Cas筛选平台

文档序号:1821174 发布日期:2021-11-09 浏览:8次 >En<

阅读说明:本技术 用于鉴定tau接种或聚集的基因修饰因子的CRISPR/Cas筛选平台 (CRISPR/Cas screening platform for identifying genetic modification factors for tau vaccination or aggregation ) 是由 马林·普里塞特 马修·高斯 温·菲里 布莱恩·扎姆布罗维兹 于 2020-03-17 设计创作,主要内容包括:提供了Cas蛋白就绪的tau生物传感器细胞、CRISPR/Cas协同激活介体(SAM)就绪的tau生物传感器细胞以及制备和使用此类细胞来筛选tau接种或聚集基因修饰因子的方法。还提供了用于使此类细胞对tau接种活性或tau聚集敏化或用于引起tau聚集的试剂和方法。(Cas protein ready tau biosensor cells, CRISPR/Cas Synergistically Activated Mediator (SAM) ready tau biosensor cells, and methods of making and using such cells to screen for tau seeding or aggregation gene modifiers are provided. Also provided are reagents and methods for sensitizing such cells to tau seeding activity or tau aggregation or for causing tau aggregation.)

用于鉴定tau接种或聚集的基因修饰因子的CRISPR/Cas筛选 平台

相关申请的交叉引用

本申请要求于2019年3月18日提交的美国申请第62/820,086号的权益,所述美国申请出于所有目的通过引用整体并入本文。

对通过EFS WEB作为文本文件提交的序列表的引用

写入文件544635SEQLIST.txt中的序列表为75.7千字节,创建于2020年3月16日,并且通过引用并入本文。

背景技术

蛋白质的异常聚集或纤维化是许多疾病的定义性特征,特别是包含若干种神经退行性疾病,如阿尔茨海默病(AD)、帕金森氏病(PD)、额颞叶痴呆(FTD)、肌萎缩侧索硬化(ALS)、慢性创伤脑病(CTE)、克雅氏病(CJD)等。在许多这些疾病中,某些蛋白质原纤维化成不溶性聚集体不仅是疾病的标志,而且还被认为是神经毒性的致病因素。此外,这些疾病的特征是聚集病理学按照刻板模式通过中枢神经系统传播,这一过程与疾病进展相关。因此,鉴定修饰异常蛋白质聚集过程或聚集体细胞间增殖过程的基因和遗传途径对于更好地理解神经退行性疾病的病因以及制定治疗干预策略具有重要价值。

发明内容

本文提供了筛选tau聚集基因修饰因子的方法、产生用于诱导或敏化tau聚集的条件培养基的方法以及产生tau聚集阳性细胞群体的方法。本文还提供了Cas-tau生物传感器细胞或此类细胞群体以及Cas-tau生物传感器细胞和条件培养基的体外培养物。本文还提供了CRISPR/Cas协同激活介体(SAM)tau生物传感器细胞或此类细胞群体以及SAM-tau生物传感器细胞和条件培养基的体外培养物。

一方面,提供了筛选tau聚集基因修饰因子的方法。一些此类方法(CRISPRn)可以包括:(a)提供包括Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域的细胞群体;(b)将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中;(c)培养所述细胞群体以允许基因组编辑和扩增,其中所述多个独特向导RNA与所述Cas蛋白形成复合物,并且所述Cas蛋白切割所述多个基因,从而导致基因功能敲除以产生经基因修饰的细胞群体;(d)使所述经基因修饰的细胞群体与tau接种剂接触以产生经接种的细胞群体;(e)培养所述经接种的细胞群体以允许形成tau聚集体,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的子集中形成以产生聚集阳性细胞群体;以及(f)相对于步骤(c)中的所述经基因修饰的细胞群体,测定在步骤(e)中鉴定的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,其中相对于步骤(c)中的经培养的细胞群体,在步骤(e)中鉴定的所述聚集阳性细胞群体中的向导RNA的富集表明由所述向导RNA靶向的所述基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的所述基因的破坏增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏增强tau聚集。

在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域是人tau重复结构域。在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括促聚集突变。任选地,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau P301S突变。

在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau四重复结构域。在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括SEQ ID NO:11。在一些此类方法中,所述第一tau重复结构域和所述第二tau重复结构域是相同的。在一些此类方法中,所述第一tau重复结构域和所述第二tau重复结构域是相同的并且各自包括包含tau P301S突变的tau四重复结构域。

在一些此类方法中,第一报告基因和所述第二报告基因是荧光蛋白。任选地,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对。任选地,所述第一报告基因是青色荧光蛋白(CFP),并且所述第二报告基因是黄色荧光蛋白(YFP)。

在一些此类方法中,所述Cas蛋白是Cas9蛋白。任选地,所述Cas蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9。任选地,所述Cas蛋白包括SEQ ID NO:21。任选地,所述Cas蛋白由包括SEQ ID NO:22中所示的序列的编码序列编码。

在一些此类方法中,所述Cas蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域在所述细胞群体中稳定地表达。在一些此类方法中,对所述Cas蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域进行编码的核酸在基因组上整合在所述细胞群体中。

在一些此类方法中,所述细胞是真核细胞。任选地,所述细胞是哺乳动物细胞。任选地,所述细胞是人细胞。任选地,所述细胞是HEK293T细胞。

在一些此类方法中,以选择的浓度引入所述多个独特向导RNA,使得大多数细胞仅接受所述独特向导RNA之一。在一些此类方法中,所述多个独特向导RNA靶向100个或更多个基因、1000个或更多个基因或10000个或更多个基因。在一些此类方法中,所述文库是全基因组文库。

在一些此类方法中,多个靶序列平均在所靶向的多个基因中的每个基因中靶向。任选地,至少三个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。任选地,约三个到约六个靶序列(例如,约三个、约四个或约六个)平均在所述多个靶向基因中的每个靶向基因中靶向。

在一些此类方法中,每个向导RNA靶向组成型外显子。任选地,每个向导RNA靶向5'组成型外显子。在一些此类方法中,每个向导RNA靶向第一外显子、第二外显子或第三外显子。

在一些此类方法中,所述多个独特向导RNA通过病毒转导被引入到所述细胞群体。任选地,所述多个独特向导RNA中的每个独特向导RNA都处于单独的病毒载体中。任选地,所述多个独特向导RNA通过慢病毒转导被引入到所述细胞群体。在一些此类方法中,所述细胞群体以小于约0.3的感染复数被感染。

在一些此类方法中,所述多个独特向导RNA与选择标志物一起引入到所述细胞群体中,并且步骤(b)进一步包括选择包含所述选择标志物的细胞。任选地,所述选择标志物赋予对药物的抗性。任选地,所述选择标志物赋予对嘌呤霉素或吉欧霉素的抗性。任选地,所述选择标志物选自新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶和杀稻瘟素S脱氨酶。任选地,所述选择标志物选自新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶、杀稻瘟素S脱氨酶和博来霉素抗性蛋白。

在一些此类方法中,在步骤(b)中引入所述多个独特向导RNA的所述细胞群体包括大于约300个细胞/独特向导RNA。

在一些此类方法中,步骤(c)为约3天到约9天。任选地,步骤(c)为约6天。

在一些此类方法中,步骤(d)包括在存在从经培养的tau聚集阳性细胞采集的条件培养基的情况下培养所述经基因修饰的细胞群体,其中tau重复结构域以聚集状态稳定地存在。任选地,所述条件培养基在处于汇合的tau聚集阳性细胞上持续约1天到约7天之后被采集。任选地,所述条件培养基在处于汇合的tau聚集阳性细胞上持续约4天之后被采集。任选地,步骤(d)包括在约75%的条件培养基和约25%的新鲜培养基中培养所述经基因修饰的细胞群体。在一些此类方法中,所述经基因修饰的细胞群体不与所述tau聚集阳性细胞共培养,其中tau重复结构域以聚集状态稳定地存在。

在一些此类方法中,步骤(e)为约2天到约6天。任选地,步骤(e)为约4天。在一些此类方法中,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对,并且步骤(e)中的所述聚集阳性细胞群体通过流式细胞术鉴定。

在一些此类方法中,通过下一代测序测定丰度。在一些此类方法中,如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(c)中的所述经培养的细胞群体中的至少1.5倍,那么所述向导RNA被视为富集的。

在一些此类方法中,步骤(f)包括在步骤(c)中的第一时间点和/或步骤(c)中的第二时间点处,相对于步骤(c)中的所述经培养的细胞群体,测定在步骤(e)中的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度。任选地,步骤(c)中的所述第一时间点处于培养所述细胞群体的第一次传代,并且所述第二时间点处于培养所述细胞群体以允许基因组编辑和扩增的中间。任选地,步骤(c)中的所述第一时间点为培养约三天之后,并且步骤(c)中的所述第二时间点为培养约六天之后。

在一些此类方法中,如果发生以下情况,则基因被视为是tau聚集基因修饰因子,其中所述基因的破坏增强tau聚集(或者tau聚集的候选基因修饰因子,其中预期所述基因的破坏增强tau聚集):(1)在步骤(c)中的所述第一时间点和步骤(c)中的所述第二时间点两者处,相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(c)中的所述经培养的细胞群体中的至少1.5倍;和/或(2)在步骤(c)中的所述第一时间点或步骤(c)中的所述第二时间点处,相对于所述多个独特向导RNA的总群体的靶向所述基因的至少两个独特向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(c)中的所述经培养的细胞群体中的至少1.5倍。

在一些此类方法中,在步骤(f)中采取以下步骤来鉴定作为tau聚集基因修饰因子的基因,其中所述基因的破坏增强tau聚集(或者tau聚集的候选基因修饰因子,其中预期所述基因的破坏增强tau聚集):(1)鉴定所述多个独特向导RNA中的哪些独特向导RNA存在于在步骤(e)中产生的所述聚集阳性细胞群体中;(2)使用公式nCn'*(x-n')C(m-n)/xCm计算在步骤(f)(1)中鉴定的所述向导RNA存在的随机机会,其中x是在步骤(b)中引入到所述细胞群体中的独特向导RNA的种类,其中m是在步骤(f)(1)中鉴定的独特向导RNA的种类,其中n是在步骤(b)中引入到所述细胞群体中的靶向所述基因的独特向导RNA的种类,并且其中n'是在步骤(f)(1)中鉴定的靶向所述基因的独特向导RNA的种类;(3)计算在步骤(f)(1)中鉴定的所述向导RNA的平均富集得分,其中向导RNA的富集得分是在步骤(e)中产生的所述聚集阳性细胞群体中的所述向导RNA的相对丰度除以步骤(c)中的所述经培养的细胞群体中的所述向导RNA的相对丰度,并且其中相对丰度是所述向导RNA的读段计数除以所述多个独特向导RNA的总群体的读段计数;以及(4)如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。

一些此类方法(CRISPRa)可以包括:(a)提供细胞群体,所述细胞群体包括包含与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白的嵌合Cas蛋白、包含与一个或多个转录激活结构域融合的衔接蛋白的嵌合衔接蛋白、连接到所述第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域;(b)将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中;(c)培养所述细胞群体以允许转录激活和扩增,其中所述多个独特向导RNA与所述嵌合Cas蛋白和所述嵌合衔接蛋白形成复合物,并且所述复合物激活所述多个基因的转录导致基因表达增加以产生经基因修饰的细胞群体;(d)使所述经基因修饰的细胞群体与tau接种剂接触以产生经接种的细胞群体;(e)培养所述经接种的细胞群体以允许形成tau聚集体,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的子集中形成以产生聚集阳性细胞群体;以及(f)相对于步骤(c)中的所述经基因修饰的细胞群体,测定在步骤(e)中鉴定的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,其中相对于步骤(c)中的经培养的细胞群体,在步骤(e)中鉴定的所述聚集阳性细胞群体中的向导RNA的富集表明由所述向导RNA靶向的所述基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的所述基因的转录激活增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活增强tau聚集。

在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域是人tau重复结构域。在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括促聚集突变。任选地,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau P301S突变。

在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau四重复结构域。在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括SEQ ID NO:11。在一些此类方法中,所述第一tau重复结构域和所述第二tau重复结构域是相同的。在一些此类方法中,所述第一tau重复结构域和所述第二tau重复结构域是相同的并且各自包括包含tau P301S突变的tau四重复结构域。

在一些此类方法中,第一报告基因和所述第二报告基因是荧光蛋白。任选地,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对。任选地,所述第一报告基因是青色荧光蛋白(CFP),并且所述第二报告基因是黄色荧光蛋白(YFP)。

在一些此类方法中,所述Cas蛋白是Cas9蛋白。任选地,所述Cas蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9。在一些此类方法中,所述嵌合Cas蛋白包括与VP64转录激活结构域融合的所述核酸酶失活Cas蛋白,任选地其中所述嵌合Cas蛋白从N端到C端包括:所述核酸酶失活Cas蛋白;核定位信号;以及所述VP64转录激活结构域。在一些此类方法中,所述衔接蛋白是MS2外壳蛋白,并且其中所述嵌合衔接蛋白中的所述一个或多个转录激活结构域包括p65转录激活结构域和HSF1转录激活结构域,任选地其中所述嵌合衔接蛋白从N端到C端包括:所述MS2外壳蛋白;核定位信号;所述p65转录激活结构域;以及所述HSF1转录激活结构域。在一些此类方法中,所述嵌合Cas蛋白包括SEQ ID NO:36,任选地其中所述嵌合Cas蛋白由包括SEQ ID NO:38中所示的序列的编码序列编码。在一些此类方法中,所述嵌合衔接蛋白包括SEQ ID NO:37,任选地其中所述嵌合衔接蛋白由包括SEQ ID NO:39中所示的序列的编码序列编码。

在一些此类方法中,所述嵌合Cas蛋白、所述嵌合衔接蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域在所述细胞群体中稳定地表达。在一些此类方法中,对所述嵌合Cas蛋白、所述嵌合衔接蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域进行编码的核酸在基因组上整合在所述细胞群体中。

在一些此类方法中,所述细胞是真核细胞。任选地,所述细胞是哺乳动物细胞。任选地,所述细胞是人细胞。任选地,所述细胞是HEK293T细胞。

在一些此类方法中,以选择的浓度引入所述多个独特向导RNA,使得大多数细胞仅接受所述独特向导RNA之一。在一些此类方法中,所述多个独特向导RNA靶向100个或更多个基因、1000个或更多个基因或10000个或更多个基因。在一些此类方法中,所述文库是全基因组文库。

在一些此类方法中,多个靶序列平均在所靶向的多个基因中的每个基因中靶向。任选地,至少三个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。任选地,约三个到约六个靶序列(例如,约三个、约四个或约六个)平均在所述多个靶向基因中的每个靶向基因中靶向。任选地,约三个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。

在一些此类方法中,每个向导RNA靶向转录起始位点上游200bp内的向导RNA靶序列。在一些此类方法中,每个向导RNA包括所述嵌合衔接蛋白可以与其特异性结合的一个或多个衔接结合元件。任选地,每个向导RNA包括所述嵌合衔接蛋白可以与其特异性结合的两个衔接结合元件。任选地,第一衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第二环内。任选地,所述衔接结合元件包括SEQ ID NO:33中所示的序列。在一些此类方法中,其中一个或多个向导RNA中的每个向导RNA是包括与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPR RNA(crRNA)部分的单向导RNA,并且所述第一环是与SEQ ID NO:17的残基13-16相对应的四环,并且所述第二环是与SEQ ID NO:17的残基53-56相对应的茎环2。

在一些此类方法中,所述多个独特向导RNA通过病毒转导被引入到所述细胞群体。任选地,所述多个独特向导RNA中的每个独特向导RNA都处于单独的病毒载体中。任选地,所述多个独特向导RNA通过慢病毒转导被引入到所述细胞群体。在一些此类方法中,所述细胞群体以小于约0.3的感染复数被感染。

在一些此类方法中,所述多个独特向导RNA与选择标志物一起引入到所述细胞群体中,并且步骤(b)进一步包括选择包含所述选择标志物的细胞。任选地,所述选择标志物赋予对药物的抗性。任选地,所述选择标志物赋予对嘌呤霉素或吉欧霉素的抗性。任选地,所述选择标志物选自新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶和杀稻瘟素S脱氨酶。任选地,所述选择标志物选自新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶、杀稻瘟素S脱氨酶和博来霉素抗性蛋白。

在一些此类方法中,在步骤(b)中引入所述多个独特向导RNA的所述细胞群体包括大于约300个细胞/独特向导RNA。

在一些此类方法中,步骤(c)为约3天到约9天。任选地,步骤(c)为约6天。

在一些此类方法中,步骤(d)包括在存在从经培养的tau聚集阳性细胞采集的条件培养基的情况下培养所述经基因修饰的细胞群体,其中tau重复结构域以聚集状态稳定地存在。任选地,所述条件培养基在处于汇合的tau聚集阳性细胞上持续约1天到约7天之后被采集。任选地,所述条件培养基在处于汇合的tau聚集阳性细胞上持续约4天之后被采集。任选地,步骤(d)包括在约75%的条件培养基和约25%的新鲜培养基中培养所述经基因修饰的细胞群体。在一些此类方法中,所述经基因修饰的细胞群体不与所述tau聚集阳性细胞共培养,其中tau重复结构域以聚集状态稳定地存在。

在一些此类方法中,步骤(e)为约2天到约6天。任选地,步骤(e)为约4天。在一些此类方法中,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对,并且步骤(e)中的所述聚集阳性细胞群体通过流式细胞术鉴定。

在一些此类方法中,通过下一代测序测定丰度。在一些此类方法中,如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(c)中的所述经培养的细胞群体中的至少1.5倍,那么所述向导RNA被视为富集的。

在一些此类方法中,步骤(f)包括在步骤(c)中的第一时间点和/或步骤(c)中的第二时间点处,相对于步骤(c)中的所述经培养的细胞群体,测定在步骤(e)中的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度。任选地,步骤(c)中的所述第一时间点处于培养所述细胞群体的第一次传代,并且所述第二时间点处于培养所述细胞群体以允许基因组编辑和扩增的中间。任选地,步骤(c)中的所述第一时间点为培养约三天之后,并且步骤(c)中的所述第二时间点为培养约六天之后。

在一些此类方法中,如果发生以下情况,则基因被视为是tau聚集基因修饰因子,其中所述基因的转录激活增强tau聚集(或者tau聚集的候选基因修饰因子,其中预期所述基因的转录激活增强tau聚集):(1)在步骤(c)中的所述第一时间点和步骤(c)中的所述第二时间点两者处,相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(c)中的所述经培养的细胞群体中的至少1.5倍;和/或(2)在步骤(c)中的所述第一时间点或步骤(c)中的所述第二时间点处,相对于所述多个独特向导RNA的总群体的靶向所述基因的至少两个独特向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(c)中的所述经培养的细胞群体中的至少1.5倍。

在一些此类方法中,在步骤(f)中采取以下步骤来鉴定作为tau聚集基因修饰因子的基因,其中所述基因的转录激活增强tau聚集(或者tau聚集的候选基因修饰因子,其中预期所述基因的转录激活增强tau聚集):(1)鉴定所述多个独特向导RNA中的哪些独特向导RNA存在于在步骤(e)中产生的所述聚集阳性细胞群体中;(2)使用公式nCn'*(x-n')C(m-n)/xCm计算在步骤(f)(1)中鉴定的所述向导RNA存在的随机机会,其中x是在步骤(b)中引入到所述细胞群体中的独特向导RNA的种类,其中m是在步骤(f)(1)中鉴定的独特向导RNA的种类,其中n是在步骤(b)中引入到所述细胞群体中的靶向所述基因的独特向导RNA的种类,并且其中n'是在步骤(f)(1)中鉴定的靶向所述基因的独特向导RNA的种类;(3)计算在步骤(f)(1)中鉴定的所述向导RNA的平均富集得分,其中向导RNA的富集得分是在步骤(e)中产生的所述聚集阳性细胞群体中的所述向导RNA的相对丰度除以步骤(c)中的所述经培养的细胞群体中的所述向导RNA的相对丰度,并且其中相对丰度是所述向导RNA的读段计数除以所述多个独特向导RNA的总群体的读段计数;以及(4)如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。

在另一方面,提供了筛选tau聚集基因修饰因子的另外的方法。一些此类方法(CRISPRn)可以包括:(a)提供包括Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域的细胞群体;(b)将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中;(c)培养所述细胞群体以允许基因组编辑和扩增,其中所述多个独特向导RNA与所述Cas蛋白形成复合物,并且所述Cas蛋白切割所述多个基因,从而导致基因功能敲除以产生经基因修饰的细胞群体;(d)使所述经基因修饰的细胞群体与tau接种剂接触以产生经接种的细胞群体;(e)培养所述经接种的细胞群体以允许形成tau聚集体,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的第一子集中形成以产生聚集阳性细胞群体,并且不在所述经接种的细胞群体的第二子集中形成以产生聚集阴性细胞群体;(f)相对于在步骤(e)中鉴定的所述聚集阴性细胞群体和/或在步骤(d)中的所述经接种的细胞群体,测定在步骤(e)中鉴定的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,和/或相对于在步骤(e)中鉴定的所述聚集阳性细胞群体和/或在步骤(d)中的所述经接种的细胞群体,测定在步骤(e)中鉴定的所述聚集阴性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,其中相对于步骤(e)中鉴定的所述聚集阳性细胞群体和/或步骤(d)中的所述经接种的细胞群体,在步骤(e)中鉴定的所述聚集阴性细胞群体中的向导RNA的富集或其中相对于步骤(e)中鉴定的所述聚集阴性细胞群体和/或步骤(d)中的所述经接种的细胞群体,在步骤(e)中鉴定的所述聚集阳性细胞群体中的向导RNA的耗竭表明由所述向导RNA靶向的所述基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的所述基因的破坏防止tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中由所述向导RNA靶向的基因的破坏预期防止tau聚集,和/或其中相对于步骤(e)中鉴定的所述聚集阴性细胞群体和/或步骤(d)中的所述经接种的细胞群体,在步骤(e)中鉴定的所述聚集阳性细胞群体中的向导RNA的富集或其中相对于步骤(e)中鉴定的所述聚集阳性细胞群体和/或步骤(d)中的所述经接种的细胞群体,在步骤(e)中鉴定的所述聚集阴性细胞群体中的向导RNA的耗竭表明由所述向导RNA靶向的所述基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的所述基因的破坏促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中由所述向导RNA靶向的所述基因的破坏预期促进或增强tau聚集。

在一些此类方法中,所述Cas蛋白是Cas9蛋白。任选地,Cas蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9。在一些此类方法中,所述Cas蛋白包括SEQ ID NO:21,任选地其中所述Cas蛋白由包括SEQ ID NO:22中所示的序列的编码序列编码。

在一些此类方法中,所述Cas蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域在所述细胞群体中稳定地表达。在一些此类方法中,对所述Cas蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域进行编码的核酸在基因组上整合在所述细胞群体中。

在一些此类方法中,每个向导RNA靶向组成型外显子。任选地,每个向导RNA靶向5'组成型外显子。在一些此类方法中,每个向导RNA靶向第一外显子、第二外显子或第三外显子。

一些此类方法(CRISPRa)包括:(a)提供细胞群体,所述细胞群体包括包含与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白的嵌合Cas蛋白、包含与一个或多个转录激活结构域融合的衔接蛋白的嵌合衔接蛋白、连接到所述第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域;(b)将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中;(c)培养所述细胞群体以允许转录激活和扩增,其中所述多个独特向导RNA与所述嵌合Cas蛋白和所述嵌合衔接蛋白形成复合物,并且所述复合物激活所述多个基因的转录导致基因表达增加以产生经基因修饰的细胞群体;(d)使所述经基因修饰的细胞群体与tau接种剂接触以产生经接种的细胞群体;(e)培养所述经接种的细胞群体以允许形成tau聚集体,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的第一子集中形成以产生聚集阳性细胞群体,并且不在所述经接种的细胞群体的第二子集中形成以产生聚集阴性细胞群体;(f)相对于在步骤(e)中鉴定的所述聚集阴性细胞群体和/或在步骤(d)中的所述经接种的细胞群体,测定在步骤(e)中鉴定的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,和/或相对于步骤(e)中鉴定的所述聚集阳性细胞群体和/或步骤(d)中的所述经接种的细胞群体,测定在步骤(e)中鉴定的所述聚集阴性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,其中相对于步骤(e)中鉴定的所述聚集阳性细胞群体和/或步骤(d)中的所述经接种的细胞群体,在步骤(e)中鉴定的所述聚集阴性细胞群体中的向导RNA的富集或其中相对于步骤(e)中鉴定的所述聚集阴性细胞群体和/或步骤(d)中的所述经接种的细胞群体,在步骤(e)中鉴定的所述聚集阳性细胞群体中的向导RNA的耗竭表明由所述向导RNA靶向的所述基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的所述基因的转录激活防止tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中由所述向导RNA靶向的基因的转录激活预期防止tau聚集,和/或其中相对于在步骤(e)中鉴定的所述聚集阴性细胞群体和/或步骤(d)中的所述经接种的细胞群体,在步骤(e)中鉴定的所述聚集阳性细胞群体中的向导RNA的富集或其中相对于在步骤(e)中鉴定的所述聚集阳性细胞群体和/或步骤(d)中的所述经接种的细胞群体,在步骤(e)中鉴定的所述聚集阴性细胞群体中的向导RNA的耗竭表明由所述向导RNA靶向的所述基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的所述基因的转录激活促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中由所述向导RNA靶向的所述基因的转录激活预期促进或增强tau聚集。

在一些此类方法中,所述Cas蛋白是Cas9蛋白。任选地,所述Cas蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9。在一些此类方法中,所述嵌合Cas蛋白包括与VP64转录激活结构域融合的所述核酸酶失活Cas蛋白,任选地其中所述嵌合Cas蛋白从N端到C端包括:所述核酸酶失活Cas蛋白;核定位信号;以及所述VP64转录激活结构域。在一些此类方法中,所述衔接蛋白是MS2外壳蛋白,并且其中所述嵌合衔接蛋白中的所述一个或多个转录激活结构域包括p65转录激活结构域和HSF1转录激活结构域,任选地其中所述嵌合衔接蛋白从N端到C端包括:所述MS2外壳蛋白;核定位信号;所述p65转录激活结构域;以及所述HSF1转录激活结构域。在一些此类方法中,所述嵌合Cas蛋白包括SEQ ID NO:36,任选地其中所述嵌合Cas蛋白由包括SEQ ID NO:38中所示的序列的编码序列编码。在一些此类方法中,所述嵌合衔接蛋白包括SEQ ID NO:37,任选地其中所述嵌合衔接蛋白由包括SEQ ID NO:39中所示的序列的编码序列编码。

在一些此类方法中,所述嵌合Cas蛋白、所述嵌合衔接蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域在所述细胞群体中稳定地表达。在一些此类方法中,对所述嵌合Cas蛋白、所述嵌合衔接蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域进行编码的核酸在基因组上整合在所述细胞群体中。

在一些此类方法中,每个向导RNA靶向转录起始位点上游200bp内的向导RNA靶序列。在一些此类方法中,每个向导RNA包括所述嵌合衔接蛋白可以与其特异性结合的一个或多个衔接结合元件。任选地,每个向导RNA包括所述嵌合衔接蛋白可以与其特异性结合的两个衔接结合元件。任选地,第一衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第二环内。任选地,所述衔接结合元件包括SEQ ID NO:33中所示的序列。任选地,一个或多个向导RNA中的每个向导RNA是包括与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPRRNA(crRNA)部分的单向导RNA,并且所述第一环是与SEQ ID NO:17的残基13-16相对应的四环,并且所述第二环是与SEQ ID NO:17的残基53-56相对应的茎环2。

在一些此类方法中,步骤(c)为约3天到约13天。在一些此类方法中,步骤(c)为约7天到约10天,为约7天或为约10天。

在一些此类方法中,步骤(d)包括在存在包括来自经培养的tau聚集阳性细胞的细胞裂解物的培养基的情况下培养所述经基因修饰的细胞群体,其中tau重复结构域以聚集状态稳定地存在。任选地,所述培养基中的所述细胞裂解物的浓度为约1到约5μg/mL。在一些此类方法中,包括所述细胞裂解物的所述培养基进一步包括脂质体或另一种转染试剂。任选地,包括所述细胞裂解物的所述培养基包括浓度为约1.5到约4μL/mL的脂质体。在一些此类方法中,所述经基因修饰的细胞群体不与所述tau聚集阳性细胞共培养,其中tau重复结构域以聚集状态稳定地存在。

在一些此类方法中,步骤(e)为约1天到约3天。任选地,步骤(e)为约2天。在一些此类方法中,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对,并且步骤(e)中的所述聚集阳性细胞群体和所述聚集阴性细胞群体通过流式细胞术鉴定。在一些此类方法中,通过下一代测序测定丰度。

在一些此类方法中,如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(e)中的所述聚集阴性细胞群体中是步骤(e)中的所述聚集阳性细胞群体和/或步骤(d)中的所述经接种的细胞群体中的至少1.5倍,那么所述向导RNA被视为在步骤(e)中的所述聚集阴性细胞群体中是富集的,并且其中如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(e)中的所述聚集阴性细胞群体和/或步骤(d)中的所述经接种的细胞群体中的至少1/1.5,那么所述向导RNA被视为在步骤(e)中的所述聚集阳性细胞群体中是耗竭的,或者其中如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(e)中的所述聚集阴性细胞群体和/或步骤(d)中的所述经接种的细胞群体中的至少1.5倍,那么所述向导RNA被视为在步骤(e)中的所述聚集阳性细胞群体中是富集的,并且其中如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(e)中的所述聚集阴性细胞群体中是步骤(e)中的所述聚集阳性细胞群体和/或步骤(d)中的所述经接种的细胞群体中的至少1/1.5,那么所述向导RNA被视为在步骤(e)中的所述聚集阴性细胞群体中是耗竭的。

在一些此类方法中,步骤(f)包括相对于步骤(e)中的所述聚集阳性细胞群体、第一时间点处步骤(c)中的所述经培养的细胞群体和第二时间点处步骤(d)中的所述经接种的细胞群体,测定步骤(e)中的所述聚集阴性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,和/或其中步骤(f)包括相对于步骤(e)中的所述聚集阴性细胞群体、第一时间点处步骤(c)中的所述经培养的细胞群体和第二时间点处步骤(d)中的所述经接种的细胞群体,测定步骤(e)中的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度。任选地,步骤(c)中的所述第一时间点处于培养所述细胞群体的第一次传代。任选地,步骤(c)中的所述第一时间点为培养约3天之后,并且步骤(c)中的所述第二时间点为培养约7天或培养约10天之后。

在一些此类方法中,如果发生以下情况,则基因被视为是tau聚集基因修饰因子,其中所述基因的破坏(CRISPRn)或转录激活(CRISPRa)防止tau聚集(或者tau聚集的候选基因修饰因子,其中预期所述基因的破坏或转录激活防止tau聚集):(1)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阴性细胞群体中是步骤(e)中的所述聚集阳性细胞群体、所述第一时间点处步骤(c)中的所述经培养的细胞群体和所述第二时间点处步骤(d)中的所述经接种的细胞群体中的至少1.5倍;和/或(2)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阴性细胞群体中是步骤(e)中的所述聚集阳性细胞群体和所述第二时间点处步骤(d)中的所述经接种的细胞群体中的至少1.5倍;和/或(3)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(e)中的所述聚集阴性细胞群体、所述第一时间点处步骤(c)中的所述经培养的细胞群体和所述第二时间点处步骤(d)中的所述经接种的细胞群体中的至少1/1.5;和/或(4)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(e)中的所述聚集阴性细胞群体和所述第二时间点处步骤(d)中的所述经接种的细胞群体中的至少1/1.5。在一些此类方法中,如果发生以下情况,则基因被视为是tau聚集基因修饰因子,其中所述基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强tau聚集(或者tau聚集的候选基因修饰因子,其中预期所述基因的破坏或转录激活促进或增强tau聚集):(1)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(e)中的所述聚集阴性细胞群体、所述第一时间点处步骤(c)中的所述经培养的细胞群体和所述第二时间点处步骤(d)中的所述经接种的细胞群体中的至少1.5倍;和/或(2)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阳性细胞群体中是步骤(e)中的所述聚集阴性细胞群体和所述第二时间点处步骤(d)中的所述经接种的细胞群体中的至少1.5倍;和/或(3)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阴性细胞群体中是步骤(e)中的所述聚集阳性细胞群体、所述第一时间点处步骤(c)中的所述经培养的细胞群体和所述第二时间点处步骤(d)中的所述经接种的细胞群体中的至少1/1.5;和/或(4)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(e)中的所述聚集阴性细胞群体中是步骤(e)中的所述聚集阳性细胞群体和所述第二时间点处步骤(d)中的所述经接种的细胞群体中的至少1/1.5;

在一些此类方法中,在步骤(f)中采取以下步骤来鉴定作为tau聚集基因修饰因子的基因,其中所述基因的破坏(CRISPRn)或转录激活(CRISPRa)防止tau聚集(或者作为tau聚集的候选基因修饰因子,其中预期所述基因的破坏(CRISPRn)或转录激活(CRISPRa)防止tau聚集):(1)鉴定所述多个独特向导RNA中的哪些向导RNA存在于步骤(e)中产生的所述聚集阴性细胞群体中;(2)使用公式nCn'*(x-n')C(m-n)/xCm计算在步骤(f)(1)中鉴定的所述向导RNA存在的随机机会,其中x是在步骤(b)中引入到所述细胞群体中的独特向导RNA的种类,其中m是在步骤(f)(1)中鉴定的独特向导RNA的种类,其中n是在步骤(b)中引入到所述细胞群体中的靶向所述基因的独特向导RNA的种类,并且其中n'是在步骤(f)(1)中鉴定的靶向所述基因的独特向导RNA的种类;(3)计算在步骤(f)(1)中鉴定的所述向导RNA的平均富集得分,其中向导RNA的富集得分是在步骤(e)中产生的所述聚集阴性细胞群体中的所述向导RNA的相对丰度除以在步骤(e)中产生的所述聚集阳性细胞群体中的或步骤(d)中的所述经接种的细胞群体中的所述向导RNA的相对丰度,并且其中相对丰度是所述向导RNA的读段计数除以所述多个独特向导RNA的总群体的读段计数;以及(4)如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。在一些此类方法中,在步骤(f)中采取以下步骤来鉴定作为tau聚集基因修饰因子的基因,其中所述基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强tau聚集(或者作为tau聚集的候选基因修饰因子,其中预期所述基因的破坏或转录激活促进或增强tau聚集):(1)鉴定所述多个独特向导RNA中的哪些独特向导RNA存在于在步骤(e)中产生的所述聚集阳性细胞群体中;(2)使用公式nCn'*(x-n')C(m-n)/xCm计算在步骤(f)(1)中鉴定的所述向导RNA存在的随机机会,其中x是在步骤(b)中引入到所述细胞群体中的独特向导RNA的种类,其中m是在步骤(f)(1)中鉴定的独特向导RNA的种类,其中n是在步骤(b)中引入到所述细胞群体中的靶向所述基因的独特向导RNA的种类,并且其中n'是在步骤(f)(1)中鉴定的靶向所述基因的独特向导RNA的种类;(3)计算在步骤(f)(1)中鉴定的所述向导RNA的平均富集得分,其中向导RNA的富集得分是在步骤(e)中产生的所述聚集阳性细胞群体中的所述向导RNA的相对丰度除以在步骤(e)中产生的所述聚集阴性细胞群体中的或步骤(d)中的所述经接种的细胞群体中的所述向导RNA的相对丰度,并且其中相对丰度是所述向导RNA的读段计数除以所述多个独特向导RNA的总群体的读段计数;以及(4)如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。

在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域是人tau重复结构域。在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括促聚集突变。任选地,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau P301S突变。

在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau四重复结构域。在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括SEQ ID NO:11。在一些此类方法中,所述第一tau重复结构域和所述第二tau重复结构域是相同的。在一些此类方法中,所述第一tau重复结构域和所述第二tau重复结构域是相同的并且各自包括包含tau P301S突变的tau四重复结构域。

在一些此类方法中,第一报告基因和所述第二报告基因是荧光蛋白。任选地,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对。任选地,所述第一报告基因是青色荧光蛋白(CFP),并且所述第二报告基因是黄色荧光蛋白(YFP)。

在一些此类方法中,所述细胞是真核细胞。任选地,所述细胞是哺乳动物细胞。任选地,所述细胞是人细胞。任选地,所述细胞是HEK293T细胞。

在一些此类方法中,以选择的浓度引入所述多个独特向导RNA,使得大多数细胞仅接受所述独特向导RNA之一。在一些此类方法中,所述多个独特向导RNA靶向100个或更多个基因、1000个或更多个基因或10000个或更多个基因。在一些此类方法中,所述文库是全基因组文库。

在一些此类方法中,多个靶序列平均在所靶向的多个基因中的每个基因中靶向。任选地,至少三个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。任选地,约三个到约六个靶序列(例如,约三个、约四个或约六个)平均在所述多个靶向基因中的每个靶向基因中靶向。任选地,约三个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。

在一些此类方法中,所述多个独特向导RNA通过病毒转导被引入到所述细胞群体。任选地,所述多个独特向导RNA中的每个独特向导RNA都处于单独的病毒载体中。任选地,所述多个独特向导RNA通过慢病毒转导被引入到所述细胞群体。在一些此类方法中,所述细胞群体以小于约0.3的感染复数被感染。

在一些此类方法中,所述多个独特向导RNA与选择标志物一起引入到所述细胞群体中,并且步骤(b)进一步包括选择包含所述选择标志物的细胞。任选地,所述选择标志物赋予对药物的抗性。任选地,所述选择标志物赋予对嘌呤霉素或吉欧霉素的抗性。任选地,所述选择标志物选自新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶和杀稻瘟素S脱氨酶。任选地,所述选择标志物选自新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶、杀稻瘟素S脱氨酶和博来霉素抗性蛋白。

在一些此类方法中,在步骤(b)中引入所述多个独特向导RNA的所述细胞群体包括大于约300个细胞/独特向导RNA。

另一方面,提供了筛选tau聚集和/或解聚的基因修饰因子的方法。一些此类方法(CRISPRn)包括:(a)提供包括Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域的细胞群体,其中所述细胞是tau聚集阳性细胞,其中tau重复结构域以聚集状态稳定地存在;(b)将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中;(c)培养所述细胞群体以允许基因组编辑和扩增,其中所述多个独特向导RNA与所述Cas蛋白形成复合物,并且所述Cas蛋白切割所述多个基因,从而导致基因功能敲除以产生经基因修饰的细胞群体,并且其中所述培养产生聚集阳性细胞群体和聚集阴性细胞群体;(d)鉴定所述聚集阳性细胞群体和所述聚集阴性细胞群体;(e)相对于步骤(d)中鉴定的所述聚集阴性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,测定步骤(d)中鉴定的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,和/或相对于步骤(d)中鉴定的所述聚集阳性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,测定步骤(d)中鉴定的所述聚集阴性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,其中相对于步骤(d)中鉴定的所述聚集阳性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,在步骤(d)中鉴定的所述聚集阴性细胞群体中的向导RNA的富集或其中相对于步骤(d)中鉴定的所述聚集阴性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,在步骤(d)中鉴定的所述聚集阳性细胞群体中的向导RNA的耗竭表明由所述向导RNA靶向的所述基因是tau解聚基因修饰因子,其中由所述向导RNA靶向的所述基因的破坏促进tau解聚,或者是tau解聚的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中由所述向导RNA靶向的基因的破坏预期促进tau解聚,和/或其中相对于步骤(d)中鉴定的所述聚集阴性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,在步骤(d)中鉴定的所述聚集阳性细胞群体中的向导RNA的富集或其中相对于步骤(d)中鉴定的所述聚集阳性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,在步骤(d)中鉴定的所述聚集阴性细胞群体中的向导RNA的耗竭表明由所述向导RNA靶向的所述基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的所述基因的破坏促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中由所述向导RNA靶向的所述基因的破坏预期促进或增强tau聚集。

在一些此类方法中,所述Cas蛋白是Cas9蛋白。任选地,Cas蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9。在一些此类方法中,所述Cas蛋白包括SEQ ID NO:21,任选地其中所述Cas蛋白由包括SEQ ID NO:22中所示的序列的编码序列编码。

在一些此类方法中,所述Cas蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域在所述细胞群体中稳定地表达。在一些此类方法中,对所述Cas蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域进行编码的核酸在基因组上整合在所述细胞群体中。

在一些此类方法中,每个向导RNA靶向组成型外显子。任选地,每个向导RNA靶向5'组成型外显子。在一些此类方法中,每个向导RNA靶向第一外显子、第二外显子或第三外显子。

一些此类方法(CRISPRa)包括:(a)提供细胞群体,所述细胞群体包括包含与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白的嵌合Cas蛋白、包含与一个或多个转录激活结构域融合的衔接蛋白的嵌合衔接蛋白、连接到所述第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域,其中所述细胞是tau聚集阳性细胞,其中tau重复结构域以聚集状态稳定地存在;(b)将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中;(c)培养所述细胞群体以允许转录激活和扩增,其中所述多个独特向导RNA与所述嵌合Cas蛋白和所述嵌合衔接蛋白形成复合物,并且所述复合物激活所述多个基因的转录导致基因表达增加以产生经基因修饰的细胞群体,并且其中所述培养产生聚集阳性细胞群体和聚集阴性细胞群体;(d)鉴定所述聚集阳性细胞群体和所述聚集阴性细胞群体;(e)相对于步骤(d)中鉴定的所述聚集阴性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,测定步骤(d)中鉴定的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个向导RNA的丰度,和/或相对于步骤(d)中鉴定的所述聚集阳性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,测定步骤(d)中鉴定的所述聚集阴性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,其中相对于步骤(d)中鉴定的所述聚集阳性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,在步骤(d)中鉴定的所述聚集阴性细胞群体中的向导RNA的富集或其中相对于步骤(d)中鉴定的所述聚集阴性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,在步骤(d)中鉴定的所述聚集阳性细胞群体中的向导RNA的耗竭表明由所述向导RNA靶向的所述基因是tau解聚基因修饰因子,其中由所述向导RNA靶向的所述基因的转录激活促进tau解聚,或者是tau解聚的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中由所述向导RNA靶向的基因的转录激活预期促进tau解聚,和/或其中相对于步骤(d)中鉴定的所述聚集阴性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,在步骤(d)中鉴定的所述聚集阳性细胞群体中的向导RNA的富集或其中相对于步骤(d)中鉴定的所述聚集阳性细胞群体和/或步骤(c)中一个或多个时间点处的经培养的细胞群体,在步骤(d)中鉴定的所述聚集阴性细胞群体中的向导RNA的耗竭表明由所述向导RNA靶向的所述基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的所述基因的转录激活促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中由所述向导RNA靶向的所述基因的转录激活预期促进或增强tau聚集。

在一些此类方法中,所述Cas蛋白是Cas9蛋白。任选地,所述Cas蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9。在一些此类方法中,所述嵌合Cas蛋白包括与VP64转录激活结构域融合的所述核酸酶失活Cas蛋白,任选地其中所述嵌合Cas蛋白从N端到C端包括:所述核酸酶失活Cas蛋白;核定位信号;以及所述VP64转录激活结构域。在一些此类方法中,所述衔接蛋白是MS2外壳蛋白,并且其中所述嵌合衔接蛋白中的所述一个或多个转录激活结构域包括p65转录激活结构域和HSF1转录激活结构域,任选地其中所述嵌合衔接蛋白从N端到C端包括:所述MS2外壳蛋白;核定位信号;所述p65转录激活结构域;以及所述HSF1转录激活结构域。在一些此类方法中,所述嵌合Cas蛋白包括SEQ ID NO:36,任选地其中所述嵌合Cas蛋白由包括SEQ ID NO:38中所示的序列的编码序列编码。在一些此类方法中,所述嵌合衔接蛋白包括SEQ ID NO:37,任选地其中所述嵌合衔接蛋白由包括SEQ ID NO:39中所示的序列的编码序列编码。

在一些此类方法中,所述嵌合Cas蛋白、所述嵌合衔接蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域在所述细胞群体中稳定地表达。在一些此类方法中,对所述嵌合Cas蛋白、所述嵌合衔接蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域进行编码的核酸在基因组上整合在所述细胞群体中。

在一些此类方法中,每个向导RNA靶向转录起始位点上游200bp内的向导RNA靶序列。在一些此类方法中,每个向导RNA包括所述嵌合衔接蛋白可以与其特异性结合的一个或多个衔接结合元件。任选地,每个向导RNA包括所述嵌合衔接蛋白可以与其特异性结合的两个衔接结合元件。任选地,第一衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第二环内。任选地,所述衔接结合元件包括SEQ ID NO:33中所示的序列。任选地,一个或多个向导RNA中的每个向导RNA是包括与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPRRNA(crRNA)部分的单向导RNA,并且所述第一环是与SEQ ID NO:17的残基13-16相对应的四环,并且所述第二环是与SEQ ID NO:17的残基53-56相对应的茎环2。

在一些此类方法中,步骤(c)为约3天到约14天。任选地,步骤(c)为约10天到约14天或约12天到约14天。

在一些此类方法中,步骤(d)包括使细胞循环进展同步以获得主要富集于S期的细胞群体。任选地,所述同步是通过双胸苷阻断实现的。

在一些此类方法中,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对,并且步骤(d)中的所述聚集阳性细胞群体和所述聚集阴性细胞群体通过流式细胞术鉴定。在一些此类方法中,通过下一代测序测定丰度。

在一些此类方法中,如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(d)中的所述聚集阴性细胞群体中是步骤(d)中的所述聚集阳性细胞群体和/或步骤(c)中一个或多个时间点处的所述经培养的细胞群体中的至少1.5倍,那么所述向导RNA被视为在步骤(d)中的所述聚集阴性细胞群体中是富集的,并且其中如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(d)中的所述聚集阳性细胞群体中是步骤(d)中的所述聚集阴性细胞群体和/或步骤(c)中一个或多个时间点处的所述经培养的细胞群体中的至少1/1.5,那么所述向导RNA被视为在步骤(d)中的所述聚集阳性细胞群体中是耗竭的,或者其中如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(d)中的所述聚集阳性细胞群体中是步骤(d)中的所述聚集阴性细胞群体和/或步骤(c)中一个或多个时间点处的所述经培养的细胞群体中的至少1.5倍,那么所述向导RNA被视为在步骤(d)中的所述聚集阳性细胞群体中是富集的,并且其中如果相对于所述多个独特向导RNA的总群体的向导RNA的丰度在步骤(d)中的所述聚集阴性细胞群体中是步骤(d)中的所述聚集阳性细胞群体和/或步骤(c)中一个或多个时间点处的所述经培养的细胞群体中的至少1/1.5,那么所述向导RNA被视为在步骤(d)中的所述聚集阴性细胞群体中是耗竭的。

在一些此类方法中,步骤(e)包括相对于步骤(d)中的所述聚集阳性细胞群体、第一时间点处步骤(c)中的所述经培养的细胞群体和第二时间点处步骤(c)中的所述经培养的细胞群体,测定步骤(d)中的所述聚集阴性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度,和/或其中步骤(e)包括相对于步骤(e)中的所述聚集阴性细胞群体、第一时间点处步骤(c)中的所述经培养的细胞群体和第二时间点处步骤(c)中的所述经培养的细胞群体,测定步骤(d)中的所述聚集阳性细胞群体中的所述多个独特向导RNA中的每个独特向导RNA的丰度。任选地,步骤(c)中的所述第一时间点处于培养所述细胞群体的第一次传代,并且所述第二时间点处于培养所述细胞群体以允许基因组编辑和扩增或转录激活和扩增的中间。任选地,步骤(c)中的所述第一时间点为培养约7天之后,并且步骤(c)中的所述第二时间点为培养约10天之后。

在一些此类方法中,如果发生以下情况,则基因被视为是tau解聚基因修饰因子,其中所述基因的破坏(CRISPRn)或转录激活(CRISPRa)促进tau解聚(或者tau解聚的候选基因修饰因子,其中预期所述基因的破坏或转录激活促进tau解聚):(1)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(d)中的所述聚集阴性细胞群体中是步骤(d)中的所述聚集阳性细胞群体、所述第一时间点处步骤(c)中的经培养的细胞群体和所述第二时间点处步骤(c)中的经培养的细胞群体中的至少1.5倍;和/或(2)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(d)中的所述聚集阴性细胞群体中是步骤(d)中的所述聚集阳性细胞群体和所述第二时间点处步骤(c)中的经培养的细胞群体中的至少1.5倍;和/或(3)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(d)中的所述聚集阳性细胞群体中是步骤(d)中的所述聚集阴性细胞群体、所述第一时间点处步骤(c)中的所述经培养的细胞群体和所述第二时间点处步骤(c)中的所述经培养的细胞群体的至少1/1.5;和/或(4)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(d)中的所述聚集阳性细胞群体中是步骤(d)中的所述聚集阴性细胞群体和所述第二时间点处步骤(c)中的所述经培养的细胞群体中的至少1/1.5。在一些此类方法中,如果发生以下情况,则基因被视为是tau聚集基因修饰因子,其中所述基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强tau聚集(或者tau聚集的候选基因修饰因子,其中预期所述基因的破坏或转录激活促进或增强tau聚集):(1)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(d)中的所述聚集阳性细胞群体中是步骤(d)中的所述聚集阴性细胞群体、所述第一时间点处步骤(c)中的所述经培养的细胞群体和所述第二时间点处步骤(c)中的所述经培养的细胞群体中的至少1.5倍;和/或(2)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(d)中的所述聚集阳性细胞群体中是步骤(d)中的所述聚集阴性细胞群体和所述第二时间点处步骤(c)中的所述经培养的细胞群体中的至少1.5倍;和/或(3)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(d)中的所述聚集阴性细胞群体中是步骤(d)中的所述聚集阳性细胞群体、所述第一时间点处步骤(c)中的所述经培养的细胞群体和所述第二时间点处步骤(c)中的所述经培养的细胞群体中的至少1/1.5;和/或(4)相对于所述多个独特向导RNA的总群体的靶向所述基因的向导RNA的丰度在步骤(d)中的所述聚集阴性细胞群体中是步骤(d)中的所述聚集阳性细胞群体和所述第二时间点处步骤(c)中的所述经培养的细胞群体中的至少1/1.5。

在一些此类方法中,在步骤(e)中采取以下步骤来鉴定作为tau解聚基因修饰因子的基因,其中所述基因的破坏(CRISPRn)或转录激活(CRISPRa)促进tau解聚(或者作为tau解聚的候选基因修饰因子,其中预期所述基因的破坏或转录激活促进tau解聚):(1)鉴定所述多个独特向导RNA中的哪些向导RNA存在于步骤(d)中鉴定的所述聚集阴性细胞群体中;(2)使用公式nCn'*(x-n')C(m-n)/xCm计算步骤(e)(1)中鉴定的所述向导RNA存在的随机机会,其中x是在步骤(b)中引入到所述细胞群体中的独特向导RNA的种类,其中m是在步骤(e)(1)中鉴定的独特向导RNA的种类,其中n是在步骤(b)中引入到所述细胞群体中的靶向所述基因的独特向导RNA的种类,并且其中n'是在步骤(e)(1)中鉴定的靶向所述基因的独特向导RNA的种类;(3)计算步骤(e)(1)中鉴定的所述向导RNA的平均富集得分,其中向导RNA的富集得分是在步骤(d)中鉴定的所述聚集阴性细胞群体中的所述向导RNA的相对丰度除以在步骤(d)中鉴定的所述聚集阳性细胞群体中的或所述第一时间点或所述第二时间点处步骤(c)中的所述经培养的细胞群体中的所述向导RNA的相对丰度,并且其中相对丰度是所述向导RNA的读段计数除以所述多个独特向导RNA的总群体的读段计数;以及(4)如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。在一些此类方法中,在步骤(e)中采取以下步骤来鉴定作为tau聚集基因修饰因子的基因,其中所述基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强tau聚集(或者tau聚集的候选基因修饰因子,其中预期所述基因的破坏或转录激活促进或增强tau聚集):(1)鉴定所述多个独特向导RNA中的哪些向导RNA存在于步骤(d)中鉴定的所述聚集阳性细胞群体中;(2)使用公式nCn'*(x-n')C(m-n)/xCm计算步骤(e)(1)中鉴定的所述向导RNA存在的随机机会,其中x是在步骤(b)中引入到所述细胞群体中的独特向导RNA的种类,其中m是在步骤(e)(1)中鉴定的独特向导RNA的种类,其中n是在步骤(b)中引入到所述细胞群体中的靶向所述基因的独特向导RNA的种类,并且其中n'是在步骤(e)(1)中鉴定的靶向所述基因的独特向导RNA的种类;(3)计算步骤(e)(1)中鉴定的所述向导RNA的平均富集得分,其中向导RNA的富集得分是在步骤(d)中鉴定的所述聚集阳性细胞群体中的所述向导RNA的相对丰度除以在步骤(d)中鉴定的所述聚集阴性细胞群体中的或所述第一时间点或所述第二时间点处步骤(c)中的所述经培养的细胞群体中的所述向导RNA的相对丰度,并且其中相对丰度是所述向导RNA的读段计数除以所述多个独特向导RNA的总群体的读段计数;以及(4)如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。

在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域是人tau重复结构域。在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括促聚集突变。任选地,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau P301S突变。

在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau四重复结构域。在一些此类方法中,所述第一tau重复结构域和/或所述第二tau重复结构域包括SEQ ID NO:11。在一些此类方法中,所述第一tau重复结构域和所述第二tau重复结构域是相同的。在一些此类方法中,所述第一tau重复结构域和所述第二tau重复结构域是相同的并且各自包括包含tau P301S突变的tau四重复结构域。

在一些此类方法中,第一报告基因和所述第二报告基因是荧光蛋白。任选地,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对。任选地,所述第一报告基因是青色荧光蛋白(CFP),并且所述第二报告基因是黄色荧光蛋白(YFP)。

在一些此类方法中,所述细胞是真核细胞。任选地,所述细胞是哺乳动物细胞。任选地,所述细胞是人细胞。任选地,所述细胞是HEK293T细胞。

在一些此类方法中,以选择的浓度引入所述多个独特向导RNA,使得大多数细胞仅接受所述独特向导RNA之一。在一些此类方法中,所述多个独特向导RNA靶向100个或更多个基因、1000个或更多个基因或10000个或更多个基因。在一些此类方法中,所述文库是全基因组文库。

在一些此类方法中,多个靶序列平均在所靶向的多个基因中的每个基因中靶向。任选地,至少三个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。任选地,约三个到约六个靶序列(例如,约三个、约四个或约六个)平均在所述多个靶向基因中的每个靶向基因中靶向。任选地,约三个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。

在一些此类方法中,所述多个独特向导RNA通过病毒转导被引入到所述细胞群体。任选地,所述多个独特向导RNA中的每个独特向导RNA都处于单独的病毒载体中。任选地,所述多个独特向导RNA通过慢病毒转导被引入到所述细胞群体。在一些此类方法中,所述细胞群体以小于约0.3的感染复数被感染。

在一些此类方法中,所述多个独特向导RNA与选择标志物一起引入到所述细胞群体中,并且步骤(b)进一步包括选择包含所述选择标志物的细胞。任选地,所述选择标志物赋予对药物的抗性。任选地,所述选择标志物赋予对嘌呤霉素或吉欧霉素的抗性。任选地,所述选择标志物选自新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶和杀稻瘟素S脱氨酶。任选地,所述选择标志物选自新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶、杀稻瘟素S脱氨酶和博来霉素抗性蛋白。

在一些此类方法中,在步骤(b)中引入所述多个独特向导RNA的所述细胞群体包括大于约300个细胞/独特向导RNA。

另一方面,提供了Cas-tau生物传感器细胞或此类细胞的群体。一些此类细胞包括一种或多种细胞的群,所述细胞群体包括Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域的细胞群体。

在一些此类细胞中,所述第一tau重复结构域和/或所述第二tau重复结构域是人tau重复结构域。在一些此类细胞中,所述第一tau重复结构域和/或所述第二tau重复结构域包括促聚集突变。任选地,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau P301S突变。

在一些此类细胞中,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau四重复结构域。在一些此类细胞中,所述第一tau重复结构域和/或所述第二tau重复结构域包括SEQ ID NO:11。在一些此类细胞中,所述第一tau重复结构域和所述第二tau重复结构域是相同的。在一些此类细胞中,所述第一tau重复结构域和所述第二tau重复结构域是相同的并且各自包括包含tau P301S突变的tau四重复结构域。

在一些此类细胞中,所述第一报告基因和所述第二报告基因是荧光蛋白。任选地,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对。任选地,所述第一报告基因是青色荧光蛋白(CFP),并且所述第二报告基因是黄色荧光蛋白(YFP)。

在一些此类细胞中,所述Cas蛋白是Cas9蛋白。任选地,所述Cas蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9。任选地,所述Cas蛋白包括SEQ ID NO:21。任选地,所述Cas蛋白由包括SEQ ID NO:22中所示的序列的编码序列编码。

在一些此类细胞中,所述Cas蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域在所述细胞中稳定地表达。在一些此类细胞中,对所述Cas蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域进行编码的核酸在基因组上整合在所述细胞中。

在一些此类细胞中,所述细胞是真核细胞。任选地,所述细胞是哺乳动物细胞。任选地,所述细胞是人细胞。任选地,所述细胞是HEK293T细胞。一些此类细胞是体外的。

在一些此类细胞中,其中所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域并不稳定地以聚集状态存在。在一些此类细胞中,所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域以聚集状态稳定地存在。

另一方面,提供了Cas-tau生物传感器细胞和条件培养基的体外培养物。一些此类体外培养物包括上文或本文别处描述的细胞群体中的任何细胞群体和包括从经培养的tau聚集阳性细胞中采集的条件培养基,其中tau重复结构域以聚集状态稳定地存在。

在一些此类体外培养物种,所述条件培养基在处于汇合的tau聚集阳性细胞上持续约1天到约7天之后被采集。任选地,所述条件培养基在处于汇合的tau聚集阳性细胞上持续约4天之后被采集。

在一些此类体外培养物种,所述培养基中包括约75%的条件培养基和约25%的新鲜培养基。在一些此类体外培养物种,所述细胞群体不与所述经培养的tau聚集阳性细胞共培养,其中tau重复结构域以聚集状态稳定地存在。

另一方面,提供了SAM-tau生物传感器细胞或此类细胞群体。一些此类细胞包括一种或多种细胞的群,所述细胞群体包括包含与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白的嵌合Cas蛋白、包含与一个或多个转录激活结构域融合的衔接蛋白的嵌合衔接蛋白、连接到所述第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域。

在一些此类细胞中,所述第一tau重复结构域和/或所述第二tau重复结构域是人tau重复结构域。在一些此类细胞中,所述第一tau重复结构域和/或所述第二tau重复结构域包括促聚集突变。任选地,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau P301S突变。

在一些此类细胞中,所述第一tau重复结构域和/或所述第二tau重复结构域包括tau四重复结构域。在一些此类细胞中,所述第一tau重复结构域和/或所述第二tau重复结构域包括SEQ ID NO:11。在一些此类细胞中,所述第一tau重复结构域和所述第二tau重复结构域是相同的。在一些此类细胞中,所述第一tau重复结构域和所述第二tau重复结构域是相同的并且各自包括包含tau P301S突变的tau四重复结构域。

在一些此类细胞中,所述第一报告基因和所述第二报告基因是荧光蛋白。任选地,所述第一报告基因和所述第二报告基因是荧光共振能量转移(FRET)对。任选地,所述第一报告基因是青色荧光蛋白(CFP),并且所述第二报告基因是黄色荧光蛋白(YFP)。

在一些此类细胞中,所述Cas蛋白是Cas9蛋白。任选地,所述Cas蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9。在一些此类细胞中,所述嵌合Cas蛋白包括与VP64转录激活结构域融合的所述核酸酶失活Cas蛋白,任选地其中所述嵌合Cas蛋白从N端到C端包括:所述核酸酶失活Cas蛋白;核定位信号;以及所述VP64转录激活结构域。在一些此类细胞中,所述衔接蛋白是MS2外壳蛋白,并且其中所述嵌合衔接蛋白中的所述一个或多个转录激活结构域包括p65转录激活结构域和HSF1转录激活结构域,任选地其中所述嵌合衔接蛋白从N端到C端包括:所述MS2外壳蛋白;核定位信号;所述p65转录激活结构域;以及所述HSF1转录激活结构域。在一些此类细胞中,所述嵌合Cas蛋白包括SEQ ID NO:36,任选地其中所述嵌合Cas蛋白由包括SEQ ID NO:38中所示的序列的编码序列编码。在一些此类细胞中,所述嵌合衔接蛋白包括SEQ ID NO:37,任选地其中所述嵌合衔接蛋白由包括SEQ ID NO:39中所示的序列的编码序列编码。

在一些此类细胞中,所述嵌合Cas蛋白、所述嵌合衔接蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域在所述细胞中稳定地表达。在一些此类细胞中,对所述嵌合Cas蛋白、所述嵌合衔接蛋白、所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域进行编码的核酸在基因组上整合在所述细胞中。

在一些此类细胞中,所述细胞是真核细胞。任选地,所述细胞是哺乳动物细胞。任选地,所述细胞是人细胞。任选地,所述细胞是HEK293T细胞。一些此类细胞是体外的。

在一些此类细胞中,其中所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域并不稳定地以聚集状态存在。在一些此类细胞中,所述连接到所述第一报告基因的第一tau重复结构域和所述连接到所述第二报告基因的第二tau重复结构域以聚集状态稳定地存在。

另一方面,提供SAM-tau生物传感器细胞和条件培养基的体外培养物。一些此类体外培养物包括上文或本文别处描述的细胞群体中的任何细胞群体和包括从经培养的tau聚集阳性细胞中采集的条件培养基,其中tau重复结构域以聚集状态稳定地存在。

在一些此类体外培养物种,所述条件培养基在处于汇合的tau聚集阳性细胞上持续约1天到约7天之后被采集。任选地,所述条件培养基在处于汇合的tau聚集阳性细胞上持续约4天之后被采集。

在一些此类体外培养物种,所述培养基中包括约75%的条件培养基和约25%的新鲜培养基。在一些此类体外培养物种,所述细胞群体不与所述经培养的tau聚集阳性细胞共培养,其中tau重复结构域以聚集状态稳定地存在。

另一方面,提供了Cas-tau生物传感器细胞或SAM-tau生物传感器细胞的体外培养物和包括来自经培养的tau聚集阳性细胞的细胞裂解物的培养基,其中tau重复结构域以聚集状态稳定地存在。一些此类体外培养物包括上文或本文别处所描述的细胞群体中的任何细胞群体。

在一些此类体外培养物中,所述培养基中的所述细胞裂解物的浓度为约1到约5μg/mL。在一些此类体外培养物中,包括所述细胞裂解物的所述培养基进一步包括脂质体或另一种转染试剂。任选地,包括所述细胞裂解物的所述培养基包括浓度为约1.5到约4μL/mL的脂质体。在一些此类体外培养物中,所述细胞裂解物是在包括蛋白酶抑制剂的缓冲液中收集所述细胞之后,通过对所述tau聚集阳性细胞进行超声处理持续约2分钟到约4分钟来产生的。

另一方面,提供了产生用于诱导或敏化tau聚集的条件培养基的方法。一些此类方法包括:(a)提供tau聚集阳性细胞群体,其中tau重复结构域以聚集状态稳定地存在;(b)在培养基中培养所述tau聚集阳性细胞群体以产生条件培养基;以及(c)采集所述条件培养基。

在一些此类方法中,所述tau聚集阳性细胞在步骤(b)中培养到汇合。任选地,所述条件培养基在步骤(c)中在处于汇合的tau聚集阳性细胞上持续约1天到约7天之后被采集。任选地,所述条件培养基在步骤(c)中在处于汇合的tau聚集阳性细胞上持续约4天之后被采集。

另一方面,提供了产生tau聚集阳性细胞群体的方法。一些此类方法包括:(a)根据上文或本文别处所描述的方法中的任何方法产生用于诱导tau聚集的条件培养基;以及(b)在包括所述条件培养基的培养基中培养包括包含tau重复结构域的蛋白质的细胞群体以产生所述tau聚集阳性细胞群体。

在一些此类方法中,所述培养基中包括约75%的条件培养基和约25%的新鲜培养基。在一些此类方法中,所述细胞群体不与用于产生所述条件培养基的方法中使用的所述tau聚集阳性细胞共培养。

在一些此类方法中,所述tau重复结构域包括促聚集突变。在一些此类方法中,所述tau重复结构域包括tau P301S突变。在一些此类方法中,所述tau重复结构域包括tau四重复结构域。在一些此类方法中,所述tau重复结构域包括SEQ ID NO:11。

另一方面,提供了产生包括来自培养的tau聚集阳性细胞的细胞裂解物的用于诱导tau聚集的培养基的方法一些此类方法包括:(a)提供tau聚集阳性细胞群体,其中tau重复结构域以聚集状态稳定地存在;(b)在包括蛋白酶抑制剂的缓冲液中收集所述tau聚集阳性细胞;(c)对所述tau聚集阳性细胞进行超声处理约2分钟到约4分钟以产生所述细胞裂解物;以及(d)将所述细胞裂解物添加到生长培养基。

在一些此类方法中,所述生长培养基中的所述细胞裂解物的浓度为约1到约5μg/mL。一些此类方法进一步包括在步骤(d)中将脂质体或另一种转染试剂添加到所述生长培养基。任选地,步骤(d)包括以约1.5到约4μL/mL的浓度添加脂质体。

另一方面,提供了产生tau聚集阳性细胞群体的方法。一些此类方法包括:(a)根据上述方法中的任何方法产生包括来自培养的tau聚集阳性细胞的细胞裂解物的培养基;以及(b)在包括来自培养的tau聚集阳性细胞的细胞裂解物的培养基中培养包括包含tau重复结构域的蛋白质的细胞群体。

在一些此类方法中,所述细胞群体不与用于产生所述条件培养基的方法中使用的所述tau聚集阳性细胞共培养。

在一些此类方法中,所述tau重复结构域包括促聚集突变。在一些此类方法中,所述tau重复结构域包括tau P301S突变。在一些此类方法中,所述tau重复结构域包括tau四重复结构域。在一些此类方法中,所述tau重复结构域包括SEQ ID NO:11。

附图说明

图1(未按比例绘制)示出了tau同种型2N4R的示意图。tau生物传感器系仅包含tau4RD-YFP和tau4RD-CFP作为转基因,而不是完整的2N4R。

图2示出了如何通过荧光共振能量转移(FRET)在tau生物传感器细胞系中监测聚集体形成的示意图。tau4RD-CFP蛋白被紫光激发并发射蓝光。tau4RD-YFP融合蛋白被蓝光激发并发射黄光。如果不存在聚集,那么由紫光进行的激发不会导致FRET。如果存在tau聚集,那么由紫光进行的激发将导致FRET和黄光发射。

图3A示出了用慢病毒Cas9表达构建体转导的tau4RD-CFP/tau4RD-YFP(TCY)生物传感器细胞克隆中相对于克隆Cas9H1的相对Cas9 mRNA表达,所述克隆Cas9H1是先前分离的相对于Cas9表达TCY克隆表现不佳的对照。

图3B示出了在分别用靶向PERK和SNCA的sgRNA转导之后三天和七天,Cas9 TCY克隆中PERK基因座和SNCA基因座处的切割效率。

图4示出了用于使用全基因组CRISPR/Cas9 sgRNA文库破坏Cas9 TCY生物传感器细胞中的靶基因的策略的示意图。

图5是示出了当用tau4RD原纤维接种tau4RD-YFP细胞时,含有稳定传播的tau聚集体的tau4RD-YFP Agg[+]亚克隆的衍生的示意图。还示出了具有tau聚集体的亚克隆的荧光显微镜图像。

图6是示出了来自tau4RD-YFP Agg[+]亚克隆的处于汇合细胞上三天后收集的条件培养基可以提供tau聚集活性的来源,而来自tau4RD-YFP Agg[-]亚克隆的培养基不能提供的示意图。将条件培养基以75%条件培养基和25%新鲜培养基的形式施加于接受者细胞。每个都示出了荧光激活细胞分选(FACS)分析图像。x轴示出了CFP(405nm激光激发),并且y轴示出了FRET(来自CFP发射的激发)。右上象限是FRET[+],右下象限是CFP[+],并且左下象限是双阴性。

图7是示出了用于鉴定促进tau聚集的修饰基因的全基因组CRISPR核酸酶(CRISPRn)筛选策略的示意图。

图8是示出了用于使用全基因组CRISPRn筛选进行下一代测序(NGS)分析的丰度和富集概念的示意图。

图9示出了二次筛选在全基因组筛选促进tau聚集的修饰基因中鉴定的靶基因1-14的示意图。

图10是示出了在用靶向靶基因1-14的sgRNA的慢病毒表达构建体转导的Cas9 TCY生物传感器细胞中tau聚集条件培养基诱导FRET的图。二次筛选证实,靶基因2和8调节细胞对tau接种/聚集的敏感性。

图11示出了用靶基因2gRNA1、靶基因8gRNA5、非靶向gRNA和无gRNA的慢病毒表达构建体转导的Cas9 TCY生物传感器细胞的FACS分析图像。细胞在条件培养基或新鲜培养基中培养。x轴示出了CFP(405nm激光激发),并且y轴示出了FRET(来自CFP发射的激发)。右上象限是FRET[+],右下象限是CFP[+],并且左下象限是双阴性。响应于tau聚集条件培养基而不是新鲜培养基,靶基因2或8的破坏会增加tau聚集体的形成。

图12示出了在用靶向靶基因2和8的sgRNA的慢病毒表达构建体转导的Cas9 TCY生物传感器细胞中进行二次筛选(包含mRNA表达分析、蛋白质表达分析和FRET分析)的示意图。两种sgRNA用于对抗靶基因2(g1和g3),一种sgRNA用于对抗靶基因8(g5),并且非靶向sgRNA(g3)用作非靶向对照。

图13示出了如在用慢病毒sgRNA表达构建体转导后第6天通过qRT-PCR评估的,靶基因2和靶基因8在Cas9 TCY生物传感器细胞中的相对表达。

图14示出了如在用慢病毒sgRNA表达构建体转导后第13天通过蛋白质印迹评估的,蛋白质2(由靶基因2编码)和蛋白质8(由靶基因8编码)在Cas9 TCY生物传感器细胞中的表达。

图15示出了在用慢病毒sgRNA表达构建体转导后第10天通过Cas9 TCY生物传感器细胞中的FRET[+]细胞百分比测量的tau聚集。没有使用脂质体。

图16示出了如通过蛋白质印迹评估的敲低Cas9 TCY细胞克隆中靶基因2和靶基因8的表达。

图17示出了如通过FRET评估的靶基因2和靶基因8敲低Cas9 TCY细胞克隆中tau聚集的表达。

图18示出了如通过蛋白质印迹评估的敲低Cas9 TCY细胞克隆中靶基因2和靶基因8的表达以及如通过蛋白质印迹评估的那些克隆中位置S262和S356处的tau磷酸化。

图19示出了来自tau-YFP Agg[+]克隆18的全细胞裂解物可以在tau生物传感器细胞中诱导tau聚集和FRET信号。测试了不同量的全细胞裂解物,并且测试了用于产生裂解物的不同超声处理条件。

图20示出了来自tau-YFP Agg[+]克隆18的全细胞裂解物可以在tau生物传感器细胞中诱导tau聚集和FRET信号。测试了不同量的全细胞裂解物,并且测试了不同量的脂质体。

图21示出了来自tau-YFP Agg[+]克隆18的全细胞裂解物可以在tau生物传感器细胞中诱导tau聚集和FRET信号,但来自Agg[-]克隆的全细胞裂解物不能。测试了不同量的全细胞裂解物,并且测试了不同量的脂质体。

图22示出了用于鉴定防止tau聚集的修饰基因的全基因组CRISPR核酸酶(CRISPRn)筛选策略的示意图。

图23是示出在FRET[-]样品中鉴定具有独特富集的sgRNA的基因的图。

图24是示出在FRET[-]样品中鉴定具有独特耗竭的sgRNA的基因的图。

图25示出了示出用于确认防止tau聚集的经鉴定的修饰基因的二次筛选策略的示意图。

图26示出了用于鉴定防止tau聚集的修饰基因的全基因组CRISPR激活(CRISPRa)筛选策略的示意图。

图27示出了用于鉴定促进tau解聚的修饰基因的全基因组CRISPR核酸酶(CRISPRn)筛选策略的示意图。

图28示出了用于分选Agg[+]、斑点[+]和Agg[-]细胞群体的门控。

图29示出了在用于鉴定促进tau解聚的修饰基因的全基因组CRISPR核酸酶(CRISPRn)筛选中使用的胸苷阻断策略的示意图。

定义

本文可互换使用的术语“蛋白质”、“多肽”、和“肽”包含任何长度的聚合形式的氨基酸,包含编码氨基酸和非编码氨基酸以及以化学方式或生物化学方式修饰的氨基酸或以化学方式或生物化学方式衍生的氨基酸。这些术语还包含已经修饰的聚合物,如具有经修饰的肽骨架的多肽。术语“结构域”是指具有特定功能或结构的蛋白质或多肽的任何部分。

蛋白质被视为具有“N端”和“C端”。术语“N端”涉及蛋白质或多肽的开始,其终止于具有游离胺基(-NH2)的氨基酸。术语“C端”是指氨基酸链(蛋白质或多肽)的末端,其终止于游离羧基(-COOH)。

本文可互换使用的术语“核酸”和“多核苷酸”包含任何长度的聚合形式的核苷酸,包含核糖核苷酸、脱氧核糖核苷酸、或其类似物或经过修饰的版本。所述核苷酸包含单链、双链和多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体、和包括嘌呤碱基、嘧啶碱基或其它天然的、以化学方式修饰的、以生物化学方式修饰的、非天然的或衍生的核苷酸碱基的聚合物。

核酸被视为具有“5'端”和“3'端”,因为以使得一个单核苷酸戊糖环的5'磷酸通过磷酸二酯键在一个方向上与其相邻的单核苷酸戊糖环的3'氧相连的方式使单核苷酸反应以形成寡核苷酸。如果寡核苷酸的5'磷酸不与单核苷酸戊糖环的3'氧相连,那么将寡核苷酸的端称为“5'端”。如果寡核苷酸的3'氧不与另一个单核苷酸戊糖环的5'磷酸相连,那么将寡核苷酸的端称为“3'端”。即使核酸序列处于更大的寡核苷酸的内部,所述核酸序列也可以被视为具有5'端和3'端。在线性或环状DNA分子中,离散元件被称为“下游”或3'元件的“上游”或5'。

术语“基因组整合的”是指已被引入到细胞中使得核苷酸序列整合到细胞的基因组中的核酸。可以将任何方案用于将核酸稳定地掺入到细胞的基因组中。

术语“靶向载体”是指可以通过同源重组、非同源末端连接介导的连接或任何其它重组方式引入到细胞的基因组中的靶位置的重组核酸。

术语“病毒载体”是指包含至少一种病毒来源的元件并且包含足以或允许包装到病毒载体颗粒中的元件的重组核酸。载体和/或颗粒可以用于在离体或体内将DNA、RNA或其它核酸转移到细胞中的目的。多种形式的病毒载体是已知的。

术语“野生型”包含具有在正常(与突变、患病、改变等相比)状态或情况下发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同形式(例如,等位基因)存在。

术语“内源性序列”是指天然存在于细胞或生物体内的核酸序列。例如,细胞或生物体的内源性MAPT序列是指天然存在于细胞或生物体中的MAPT基因座处的天然MAPT序列。

“外源性”分子或序列包含通常不以所述形式存在于细胞中的分子或序列。正常存在包含关于细胞的特定发育阶段和环境条件的存在。例如,外源性分子或序列可以包含细胞内对应的内源性序列的突变版本(如内源性序列的人源化版本),或者可以包含与细胞内的内源性序列相对应但形式不同(即,不在染色体内)的序列。相比之下,内源性分子或序列包含在特定环境条件下在特定发育阶段在特定细胞中通常以所述形式存在的分子或序列。

当在核酸或蛋白质的上下文中使用时,术语“异源的”表示核酸或蛋白质包括在同一分子中并非天然地一起存在的至少两个区段。例如,术语“异源的”,当用于指代核酸区段或蛋白质区段时,表示所述核酸或蛋白质包括在自然界中未发现彼此具有相同关系的两个或更多个子序列(例如,连接在一起)。作为一个实例,核酸载体的“异源”区域是在自然界中未发现与其它分子缔合的另一个核酸分子内或与其附接的核酸区段。例如,核酸载体的异源区域可以包含由在自然界中未发现与编码序列缔合的序列侧接的编码序列。同样,蛋白质的“异源”区域是在自然界中未发现与其它肽分子缔合的另一个肽分子(例如,融合蛋白或具有标签的蛋白质)内或与其附接的氨基酸的区段。类似地,核酸或蛋白质可以包括异源标记或异源分泌或定位序列。

术语“基因座”是指基因(或显著序列)、DNA序列、多肽编码序列或生物体的基因组的染色体上的位置的特异性定位。例如,“MAPT基因座”可以指MAPT基因、MAPT DNA序列、微管相关蛋白tau编码序列或生物体的基因组的染色体上的已被鉴定为此类序列所在位置的MAPT位置的特异性定位。“MAPT基因座”可以包括MAPT基因的调控元件,包含例如增强子、启动子、5'和/或3'非翻译区(UTR)或其组合。

术语“基因”是指染色体中的对产物(例如,RNA产物和/或多肽产物)进行编码并且包含被非编码内含子中断的编码区域和定位于5'端和3'端两者上的编码区附近而使得基因与全长mRNA(包含5'和3'非翻译序列)相对应的序列的DNA序列。术语“基因”还包含其它非编码序列,包含调节序列(例如,启动子、增强子和转录因子结合位点)、聚腺苷酸化信号、内部核糖体进入位点、沉默子、绝缘序列和基质附着区域。这些序列可以靠近基因的编码区域(例如,在10kb内)或处于远处的位点,并且所述序列影响基因的转录和翻译的水平或速率。

术语“等位基因”是指基因的变体形式。一些基因具有多种不同的形式,所述基因定位于染色体上的相同位置或基因位点处。二倍体生物体在每个遗传基因座处具有两个等位基因。每对等位基因表示特异性遗传基因座的基因型。如果在特定基因座处存在两个相同的等位基因,则基因型被描述为纯合子,并且如果两个等位基因不同,则被描述为杂合子。

“启动子”是DNA的调节区域,其通常包括能够指导RNA聚合酶II在特定多核苷酸序列的适当转录起始位点处起始RNA合成的TATA盒。启动子可以另外包括影响转录起始速率的其它区域。本文所公开的启动子序列调节可操作连接的多核苷酸的转录。启动子可以在本文所公开的细胞类型(例如,人类细胞、多能细胞、单细胞阶段胚胎、分化细胞或其组合)中的一种或多种细胞类型中具有活性。启动子可以是例如组成型活性启动子、条件型启动子、诱导型启动子、时间受限启动子(例如,受发育调节的启动子)或空间受限启动子(例如,细胞特异性或组织特异性启动子)。启动子的实例可以例如在WO 2013/176772中找到,所述文献出于所有目的通过引用整体并入本文。

“可操作的连接”或“可操作地连接”包含将两种或多种组分(例如启动子和另一种序列元件)并置使得两种组分正常发挥功能,并使得至少一种组分能够介导施加在至少一种其它组分上的功能。例如,如果启动子响应于存在或不存在一种或多种转录调节因子而控制编码序列的转录水平,则可将所述启动子可操作地连接到编码序列。可操作的连接可以包含这些彼此相邻或以反式作用的序列(例如,调节序列可以在一定距离处起作用以控制编码序列的转录)。

术语“变体”是指与群体中最普遍的序列不同(例如,相差一个核苷酸)的核苷酸序列或与群体中最普遍的序列不同(例如,相差一个氨基酸)的蛋白质序列。

当提及蛋白质时,术语“片段”意指比全长蛋白质更短或具有更少氨基酸的蛋白质。当提及核酸时,术语“片段”意指比全长核酸更短或具有更少核苷酸的核酸。片段可以是例如N端片段(即,去除蛋白质的C端的一部分)、C端片段(即,去除蛋白质的N端的一部分)或内部片段。

“序列同一性”或“同一性”在两个多核苷酸或多肽序列的上下文中是指当在指定的比较窗口上出于最大对应进行比对时两个序列中相同的残基。当提及蛋白质的序列同一性的百分比时,不相同的残基位置通常因保守性氨基酸取代而不同,其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的其它氨基酸残基取代,因此不改变分子的功能性质。当序列的保守性取代不同时,可以将百分比序列同一性向上调整以校正取代的保守性质。因此类保守性取代而不同的序列被视为具有“序列相似性”或“相似性。”用于进行这种调整的方法众所周知。通常,这涉及将保守性取代计为部分错配而不是完全错配,从而增加百分比序列同一性。因此,例如,当相同氨基酸的所得得分为1,非保守性取代的所得得分为零时,保守性取代的所得得分介于零与1之间。例如,通过在项目PC/GENE(加利福尼亚州山景城的Intelligenetics公司(Intelligenetics,Mountain View,California))中的实施方式计算保守性取代的得分。

“序列同一性百分比”包含通过在比较窗口上比较两个最佳比对序列测定的值(完全匹配残基的最大数量),其中在比较窗口中的多核苷酸序列部分与参考序列(不包括添加物或缺失部分)相比可以包括添加物或缺失部分(即缺口),以实现两个序列的最佳比对。通过测定在两个序列中出现相同核酸碱基或氨基酸残基的位置数计算百分比来得到匹配位置数,用匹配位置数除以比较窗口中的位置总数,并将结果乘以100以得到序列同一性的百分比。除非另有说明(例如较短的序列包含连接的异源序列),否则所述比较窗口为两个所比较序列中较短序列的全长。

除非另有说明,否则序列同一性/相似性值包含使用以下参数使用第10版GAP获得的值:使用GAP权重50、长度权重3以及nwsgapdna.cmp得分矩阵的核苷酸序列的同一性百分比和相似性百分比;使用GAP权重8和长度权重2以及BLOSUM62得分矩阵的氨基酸序列的同一性百分比和相似性百分比;或其任何等效程序。“等效程序”包含当与第10版GAP生成的对应比对进行比较时针对所讨论的任何两个序列产生具有相同核苷酸或氨基酸残基匹配和相同百分比序列同一性的比对的任何序列比较程序。

术语“保守性氨基酸取代”是指用具有相似大小、电荷或极性的不同氨基酸取代序列中正常存在的氨基酸。保守性取代的实例包含用非极性(疏水性)残基(如异亮氨酸、缬氨酸或亮氨酸)取代另一种非极性残基。类似地,保守性取代的实例包含用一种极性(亲水性)残基取代另一种极性残基,如精氨酸与赖氨酸之间的极性残基、谷氨酰胺与天冬酰胺之间的极性残基或甘氨酸与丝氨酸之间的极性残基。此外,用碱性残基(如赖氨酸、精氨酸或组氨酸)取代另一种碱性残基或者用一种酸性残基(如天冬氨酸或谷氨酸)取代另一种酸性残基是保守性取代另外的实例。非保守性取代的实例包含用非极性(疏水性)氨基酸残基(如异亮氨酸、缬氨酸、亮氨酸、丙氨酸或甲硫氨酸)取代极性(亲水性)残基(如半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸)和/或用极性残基取代非极性残基。典型的氨基酸分类总结如下。

表1.氨基酸分类。

“同源”序列(例如,核酸序列)包含与已知参考序列相同或基本上类似的序列,使得其例如与已知参考序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性。同源序列可以包含例如直系同源序列和旁系同源序列。例如,同源基因通常通过物种形成事件(直系同源基因)或基因复制事件(旁系同源基因)从共同的祖先DNA序列下降。“直系同源”基因包含不同物种中通过物种形成从共同祖先基因进化而来的基因。直系同源物通常在进化过程中保留相同的功能。“旁系同源”基因包含通过基因组内的复制相关的基因。旁系同源物可以在进化过程中进化出新的功能。

术语“体外(in vitro)”包含人工环境以及在人工环境(例如,试管或分离的细胞或细胞系)内发生的过程或反应。术语“体内(in vivo)”包含自然环境(例如,细胞、生物体或身体)以及在自然环境内发生的过程或反应。术语“离体(ex vivo)”包含已从个体体内去除的细胞以及在此类细胞内发生的过程或反应。

术语“报告基因”是指具有对基因产物(通常是酶)进行编码的序列的核酸,当包括与异源启动子和/或增强子元件可操作地连接的报告基因序列的构建体被引入到含有(或可以制成含有)启动子和/或增强子元件激活所必需的因子的细胞中时,所述序列可容易且可定量地测定。报告基因的实例包含但不限于对β-半乳糖苷酶(lacZ)进行编码的基因、细菌氯霉素乙酰转移酶(cat)基因、萤火虫荧光素酶基因、对β-葡萄糖醛酸酶(GUS)进行编码的基因和对荧光蛋白进行编码的基因。“报告蛋白”是指由报告基因编码的蛋白质。

如本文所使用的,术语“荧光报告蛋白”意指基于荧光可检测的报告蛋白,其中荧光可以直接来自报告蛋白、报告蛋白在荧光底物上的活性,或对与荧光标记的化合物结合具有亲和力的蛋白质。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿(Emerald)、Azami绿、单体Azami绿、CopGFP、AceGFP和ZsGreen1)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP和ZsYellow1)、蓝色荧光蛋白(例如,BFP、eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色和T-天蓝色(T-sapphire))、青色荧光蛋白(例如CFP、eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl和Midoriishi-青色)、红色荧光蛋白(例如,RFP、mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry和Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine和tdTomato),以及可以通过流式细胞术方法检测到细胞中存在的任何其它合适的荧光蛋白。

响应于双链断裂(DSB)的修复主要通过两个保守的DNA修复途径发生:同源重组(HR)和非同源末端连接(NHEJ)。参见Kasparek和Humphrey(2011)《细胞与发育生物学研讨会(Seminars in Cell&Dev.Biol.)》22:886-897,所述文献出于所有目的通过引用整体并入本文。同样,由外源供体核酸介导的靶核酸修复可以包含两种多核苷酸之间基因信息交换的任何过程。

术语“重组”包含两个多核苷酸之间基因信息交换的任何过程,并且可以通过任何机制发生。重组可以通过同源定向修复(HDR)或同源重组(HR)发生。HDR或HR包含可能需要核苷酸序列同源性的核酸修复形式,使用“供体”分子作为模板来修复“靶”分子(即经历双链断裂的分子),并且导致将基因信息从供体转移到靶标。不希望受任何特定理论的束缚,这种转移可以涉及在断裂的靶与供体之间形成的异源双链DNA的失配校正和/或合成依赖性链退火(synthesis-dependent strand annealing),其中供体用于重新合成将成为靶的一部分的遗传信息和/或相关过程。在一些情况下,供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的副本或者供体多核苷酸的副本的一部分被整合到靶DNA中。参见Wang等人,(2013)《细胞(Cell)》153:910-918;Mandalos等人(2012)《美国科学公共图书馆(PLOSONE)》7:e45768:1-9;以及Wang等人(2013)《自然生物技术(Nat Biotechnol.)》31:530-532,所述文献中的每个文献出于所有目的通过引用整体并入本文。

NHEJ包含通过将断裂末端彼此直接连接或与外源性序列直接连接来修复核酸中的双链断裂,而无需同源模板。NHEJ连接非连续序列通常会导致双链断裂位点附近的缺失、插入或易位。例如,NHEJ还可以通过断裂末端与外源性供体核酸的末端的直接连接(即,基于NHEJ的捕获)导致外源性供体核酸的靶向整合。当同源定向修复(HDR)途径不易使用时(例如,在非分裂细胞、原代细胞和执行基于同源性的DNA修复不佳的细胞中),此类NHEJ介导的靶向整合可以优选用于插入外源性供体核酸。另外,与同源定向修复相反,不需要关于侧接切割位点的序列同一性的大区域的知识,这在尝试靶向插入到具有基因组序列知识有限的基因组的生物体中时可能是有益的。整合可以通过连接外源性供体核酸与切割的基因组序列之间的平末端来进行,或者通过使用外源性供体核酸连接粘性末端(即,具有5'或3'突出端)来进行,所述外源性供体核酸侧接有与由切割的基因组序列中的核酸酶试剂产生的突出端相容的突出端。参见例如US 2011/020722、WO 2014/033644、WO 2014/089290以及Maresca等人(2013)《基因组研究(Genome Res.)》23(3):539-546,所述文献中的每个文献出于所有目的通过引用整体并入本文。如果连接平末端,则可能需要切除靶标和/或供体以产生片段连接所需的微同源性区域,这可能会在靶序列中产生不想要的改变。

“包括”或“包含”一个或多个所列举的元件的组合物或方法可以包含其它未具体列举的元件。例如,“包括”或“包含”蛋白质的组合物可以单独含有蛋白质或与其它成分组合的蛋白质。过渡短语“基本上由……组成”意指权利要求的范围应被解释为涵盖权利要求中所列举的指定要素以及对要求保护的发明的一个或多个基本和新颖特性没有实质性影响的那些要素。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”不应被解释为等同于“包括”。

“任选的(Optional)”或“任选地(optionally)”是指随后描述的事件或情况可能发生或不发生并且该描述包含所述事件或情况发生的实例以及事件或情况不发生的实例。

数值范围的指定包含所述范围内或定义所述范围的所有整数以及由所述范围内的整数定义的所有子范围。

除非从上下文中明显看出,否则术语“约”涵盖规定值的标准测量误差范围(例如,SEM)内的值。

术语“和/或”是指并且涵盖关联的所列项中的一个或多个所列项的任何和所有可能组合以及在以替代性方案(“或”)解释时组合的缺少。

术语“或”是指特定列表中的任何一个成员,并且还包含所述列表中成员的任何组合。

除非上下文另外明确指明,否则本文中的单数形式“一个/一种(a/an)”和“所述(the)”包含复数个提及物。例如,术语“蛋白质”或“至少一种蛋白质”可以包含多种蛋白质,包含其混合物。

统计学上显著意指p≤0.05。

具体实施方式

I.概述

提供了Cas蛋白就绪的tau生物传感器细胞以及制备和使用此类细胞来筛选tau接种或聚集基因修饰因子的方法。提供了CRISPR/Cas协同激活介体(SAM)就绪的tau生物传感器细胞以及制备和使用此类细胞来筛选tau接种或聚集基因修饰因子的方法。提供了Cas蛋白就绪的tau生物传感器细胞和制备和使用此类细胞来筛选tau解聚基因修饰因子的方法。提供了CRISPR/Cas协同激活介质(SAM)就绪的tau生物传感器细胞和制备和使用此类细胞来筛选tau解聚基因修饰因子的方法。还提供了用于使此类细胞对tau接种活性或tau聚集敏化的试剂和方法。还提供了用于诱导tau聚集的试剂和方法。

为了鉴定修饰异常tau蛋白聚集过程的基因和途径,开发了一种用于利用CRISPR(例如,CRISPR/Cas9)核酸酶(CRISPRn)sgRNA文库进行筛选以鉴定调节细胞被tau疾病相关蛋白聚集体“接种”的潜力的基因(例如,当暴露于tau原纤维化蛋白来源时,基因被破坏时会导致细胞更容易形成tau聚集体)的平台。为了进一步鉴定修饰异常tau蛋白聚集过程的基因和途径,开发了一种用于利用CRISPR激活(CRISPRa)sgRNA文库进行筛选以鉴定调节细胞被tau疾病相关蛋白聚集体“接种”的潜力的基因(例如,当暴露于tau原纤维化蛋白来源时,基因被转录激活时会导致细胞更容易形成tau聚集体)的平台。同样,开发了一种用于利用CRISPR(例如,CRISPR/Cas9)核酸酶(CRISPRn)sgRNA文库进行筛选以鉴定在被破坏时防止tau聚集或促进tau解聚的基因的平台。同样,开发了一种用于利用CRISPR激活(CRISPRa)sgRNA文库进行筛选以鉴定在被转录激活时防止tau聚集或促进tau解聚的基因的平台。“种子”是指使具有类似聚集结构域的其它蛋白质的聚集成核的一种或多种蛋白质。样品的接种活性是指样品使具有类似聚集结构域的蛋白质的聚集成核(即诱导)的能力。对此类基因的鉴定可以阐明tau细胞间聚集体传播的机制和控制神经元在神经退行性疾病的上下文中形成tau聚集体的敏感性的基因途径。

筛选采用tau生物传感器细胞系(例如,人类细胞系或HEK293T),所述细胞系由稳定地表达具有致病突变(例如,P301S致病突变)的tau重复结构域(例如,tau四重复结构域,tau_4RD)的细胞组成,连接到独特的报告基因,所述报告基因可以一起作为在聚集时产生可检测的信号的细胞内生物传感器。在一个非限制性实例中,细胞系含有稳定地表达与荧光蛋白CFP(例如,eCFP)或荧光蛋白YFP(例如,eYFP)融合的疾病相关蛋白变体的两种转基因:tau4RD-CFP/tau4RD-YFP(TCY),其中tau重复结构域(4RD)包括P301S致病突变。在这些生物传感器系中,tau-CFP/tau-YFP蛋白聚集产生荧光共振能量转移(FRET)信号,这是荧光能量从供体CFP转移到受体YFP的结果。本文所使用的术语CFP(青色荧光蛋白)包含eCFP(增强型青色荧光蛋白),并且本文所使用的术语YFP(黄色荧光蛋白)包含eYFP(增强型黄色荧光蛋白)。含有tau聚集体的FRET阳性细胞可以通过流式细胞术分选和分离。在基线时,未经刺激的细胞以稳定、可溶性状态表达报告基因,其中FRET信号最小。在刺激(例如,种子颗粒的质脂体转染)时,报告蛋白形成聚集体,产生FRET信号。可以通过FACS分离含有聚集体的细胞。稳定地繁殖的含有聚集体的细胞系Agg[+]可以通过Agg[-]细胞系的克隆连续稀释来分离。

对此tau生物传感器细胞系进行了若干修饰,使其可用于使用CRISPRn文库进行基因筛选。首先,通过引入表达Cas的转基因(例如,Cas9或SpCas9)对这些tau生物传感器细胞进行修饰,以用于CRISPRn筛选。其次,开发了使细胞对tau接种活性和tau聚集敏化的试剂和方法。开发了一种其中tau聚集体随时间推移在所有细胞中稳定地持续生长并多次传代的细胞系。这些细胞用于通过收集已经处于汇合的细胞上持续一段时间的培养基来产生条件培养基。然后可以将此条件培养基以使得tau聚集可以在这些接受者细胞的一小部分中被诱导的比例施加于原初tau生物传感器tau细胞,从而使所述细胞对tau接种活性和tau聚集敏化。不具有共培养的条件培养基之前没有在此上下文中用作接种剂。然而,条件培养基对于大规模全基因组筛选特别有用,因为体外产生的tau纤维是有限的资源。另外,条件培养基更具有生理相关性,因为其是由细胞产生和分泌的,而不是在体外产生和分泌的。

这些细胞系用于开发一种筛选方法,其中不具有聚集体(Agg[–])的表达Cas的tau生物传感器细胞用CRISPR向导RNA文库转导,以在每个靶基因处引入敲除突变。在培养细胞以允许进行基因组编辑和扩增之后,使细胞在条件培养基中生长以使其对接种活性敏化,并且鉴定出其中发生tau聚集的细胞。在基因组编辑和扩增期间,对相对于较早时间点在聚集阳性亚群中富集的向导RNA进行鉴定,以鉴定当暴露于外部tau接种活性来源时,可以调节细胞对tau接种的敏感性的基因。

同样,对此tau生物传感器细胞系进行若干修饰以使其可用于使用CRISPRa文库进行基因筛选(例如,与CRISPR/Cas协同激活介体(SAM)系统一起使用)。在示例性SAM系统中,若干个激活结构域相互作用以引起比可以单独由任何一种因子诱导的更大的转录激活。例如,示例性SAM系统包括嵌合Cas蛋白,所述嵌合Cas蛋白包括与一个或多个转录激活结构域(例如,VP64)融合的核酸酶失活Cas蛋白;以及嵌合衔接蛋白,所述嵌合衔接蛋白包括与一个或多个转录激活结构域融合(例如,与p65和HSF1融合)的衔接蛋白(例如,MS2外壳蛋白(MCP))。MCP自然地与MS2茎环结合。在示例性SAM系统中,MCP与工程化到CRISPR相关sgRNA中的MS2茎环相互作用,并且从而将结合的转录因子运送到适当的基因组定位。

首先,通过引入表达嵌合Cas蛋白的一种或多种转基因来修饰这些tau生物传感器细胞,所述嵌合Cas蛋白包括与一个或多个转录激活结构域(例如,VP64)融合的核酸酶失活Cas蛋白;以及嵌合衔接蛋白,所述嵌合衔接蛋白包括与一个或多个转录激活结构域融合(例如,与p65和HSF1融合)的衔接蛋白(例如,MS2外壳蛋白(MCP))。尽管本文描述了SAM系统,但也可以使用其它CRISPRa系统,如与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白,其中此类系统也不包含嵌合衔接蛋白。在这种情况下,tau生物传感器细胞将通过引入表达嵌合Cas蛋白的转基因进行修饰。

其次,开发了使细胞对tau接种活性和tau聚集敏化的试剂和方法。开发了一种其中tau聚集体随时间推移在所有细胞中稳定地持续生长并多次传代的细胞系。这些细胞用于通过收集已经处于汇合的细胞上持续一段时间的培养基来产生条件培养基。然后可以将此条件培养基以使得tau聚集可以在这些接受者细胞的一小部分中被诱导的比例施加于原初tau生物传感器tau细胞,从而使所述细胞对tau接种活性和tau聚集敏化。不具有共培养的条件培养基之前没有在此上下文中用作接种剂。然而,条件培养基对于大规模全基因组筛选特别有用,因为体外产生的tau纤维是有限的资源。另外,条件培养基更具有生理相关性,因为其是由细胞产生和分泌的,而不是在体外产生和分泌的。

这些细胞系用于开发一种筛选方法,其中不具有聚集体(Agg[–])的表达SAM的tau生物传感器细胞用CRISPRa向导RNA文库转导,以转录激活每个靶基因。在培养细胞以允许进行基因组编辑和扩增之后,使细胞在条件培养基中生长以使其对接种活性敏化,并且鉴定出其中发生tau聚集的细胞。在基因组编辑和扩增期间,对相对于较早时间点在聚集阳性亚群中富集的向导RNA进行鉴定,以鉴定当暴露于外部tau接种活性来源时,可以调节细胞对tau接种的敏感性的基因。

II.Cas/tau生物传感器和SAM/tau生物传感器细胞系和产生方法

A.Cas/tau生物传感器细胞和SAM/tau生物传感器细胞

本文公开的细胞不仅表达连接到第一报告基因的第一tau重复结构域(例如,包括tau微管结合结构域(MBD))和连接到第二报告基因的第二tau重复结构域,而且还表达Cas蛋白,如作为Cas9。本文还公开的细胞不仅表达连接到第一报告基因的第一tau重复结构域(例如,包括tau微管结合结构域(MBD))和连接到第二报告基因的第二tau重复结构域,而且还表达包括与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白的嵌合Cas蛋白和包括与一个或多个转录激活结构域融合的衔接蛋白的嵌合衔接蛋白。连接到第一报告基因的第一tau重复结构域可以稳定地表达,并且连接到第二报告基因的第二tau重复结构域可以稳定地表达。例如,可以在基因组上整合对连接到第一报告基因的第一tau重复结构域进行编码的DNA,并且可以在基因组上整合对连接到第二报告基因的第二tau重复结构域进行编码的DNA。同样,Cas蛋白可以在Cas/tau生物传感器细胞中稳定地表达。例如,可以在基因组上整合对Cas蛋白进行编码的DNA。同样,嵌合Cas蛋白和/或嵌合衔接蛋白可以在SAM/tau生物传感器细胞中稳定地表达。例如,可以在基因组上整合对嵌合Cas蛋白进行编码的DNA和/或可以在基因组上整合对嵌合衔接蛋白进行编码的DNA。细胞可以是tau聚集阴性的或可以是tau聚集阳性的。

1.连接到报告基因的tau和tau重复结构域

微管相关蛋白tau是促进微管组装和稳定性的蛋白质,并且主要在神经元中表达。tau具有稳定神经元微管的作用,并且因此促进轴突生长。在阿尔茨海默病(AD)和被称为蛋白病(tauopathies)的相关神经退行性疾病家族中,tau蛋白被异常地过度磷酸化并且聚集成细丝束(成对螺旋细丝),其表现为神经原纤维缠结。蛋白病是一组异质性神经退行性病状,其特征是大脑中异常tau的沉积。

tau重复结构域可以来自任何动物或哺乳动物(如人、小鼠或大鼠)的tau蛋白。在一个具体实例中,tau重复结构域来自人tau蛋白。示例性人tau蛋白被指定为UniProt登录号P10636。tau蛋白是从单个基因交替剪接的产物,所述单个基因在人类中被称为MAPT(微管相关蛋白tau)。tau重复结构域携带负责聚集的序列基序(即,所述重复结构域是来自tau的易聚集结构域)。根据剪接,tau蛋白的重复结构域具有三个或四个重复区域,所述重复区域构成蛋白质的易聚集核心,其通常被称为重复结构域(RD)。具体地,tau的重复结构域表示微管结合区域的核心,并且包含R2和R3中的负责Tau聚集的六肽基序。在人类大脑中,存在长度在352到441个氨基酸的范围内的六种tau同种型。除了氨基端处存在或不存在一个或两个插入结构域之外,这些同种型在羧基端根据三个重复结构域或四个重复结构域(R1-R4)的存在而变化。定位于tau羧基端一半的重复结构域被认为对于微管结合以及tau病理性聚集成成对螺旋丝(PHF)很重要,所述PHF是蛋白病中发现的神经原纤维缠结的核心成分。四个重复结构域(R1-R4)的示例性序列分别在SEQ ID NO:1-4中提供。四个重复结构域(R1-R4)的示例性编码序列在SEQ ID NO:5-8中提供。Tau四重复结构域的示例性序列在SEQID NO:9中提供。Tau四重复结构域的示例性编码序列在SEQ ID NO:10中提供。具有P301S突变的Tau四重复结构域的示例性序列在SEQ ID NO:11中提供。具有P301S突变的Tau四重复结构域的示例性编码序列在SEQ ID NO:12中提供。

在Cas/tau生物传感器细胞或SAM/tau生物传感器细胞中使用的tau重复结构域可以包括tau微管结合结构域(MBD)。在Cas/tau生物传感器细胞或SAM/tau生物传感器细胞中使用的tau重复结构域可以包括四个重复结构域(R1-R4)中的一个或多个或全部重复结构域。例如,tau重复结构域可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:1、2、3和4或与SEQ ID NO:1、2、3和4至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列中的一个或多个或全部。在一个具体实例中,tau重复结构域是在若干个tau同种型中发现的tau四重复结构域(R1-R4)。可以使用tau四重复结构域代替全长tau,因为所述四重复结构域可以在培养的细胞中可靠地形成原纤维。例如,tau重复结构域可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:9或SEQ ID NO:11或与SEQ ID NO:9或SEQ ID NO:11至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。在一个具体实例中,对tau重复结构域进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:12或与SEQ ID NO:12至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:11。在另一个具体实例中,对连接到第二报告基因的第二tau重复结构域进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:10或与SEQ ID NO:10至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:9。本文公开的细胞中的第一tau重复结构域和第二tau重复结构域可以相同、类似或不同。

连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域之一或两者可以在细胞中稳定地表达。例如,对连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域之一或两者进行编码的核酸可以在基因组上整合在细胞群体中并且可操作地连接到在细胞中有活性的启动子。

本文公开的细胞中使用的tau重复结构域还可以包括tau致病突变,如促聚集突变。此类突变可以是例如与tau蛋白病相关(例如,与其分离)或引起tau蛋白病的突变。作为一个实例,突变可以是使tau对接种敏化但不会导致tau容易地自行聚集的聚集敏化突变。例如,突变可以是疾病相关P301S突变。P301S突变意指人tau P301S突变或当与人tau蛋白最佳比对时另一种tau蛋白中的对应突变。tau中的P301S突变表现出对接种的高度敏感性,但其本身并不容易聚集。因此,尽管在基线时包括P301S突变的tau报告蛋白以稳定、可溶性形式存在于细胞内,但暴露于外源性tau种子会导致tau报告蛋白聚集。其它tau突变包含例如K280del、P301L、V337M、P301L/V337M和K280del/I227P/I308P。

第一tau重复结构域可以通过任何方式连接到第一报告基因,并且第二tau重复结构域可以连接到第二报告基因。例如,报告基因可以与tau重复结构域融合(例如,作为融合蛋白的一部分)。

第一报告基因和第二报告基因可以是一对独特报告基因,所述报告基因可以一起作为当第一蛋白质和第二蛋白质聚集时产生可检测信号的细胞内生物传感器。例如,报告基因可以是荧光蛋白,并且荧光共振能量转移(FRET)可以用于测量蛋白质聚集。具体地,第一报告基因和第二报告基因可以是FRET对。FRET对(供体和受体荧光团)的实例是众所周知的。参见例如,Bajar等人(2016)《传感器(Sensors)》巴塞尔(Basel)16(9):1488,所述文献出于所有目的通过引用整体并入本文。典型的荧光显微技术依赖于一个波长(激发)光的荧光团的吸收,然后是更长波长的二次荧光的后续发射。荧光共振能量转移的机制涉及处于激发电子状态的供体荧光团,所述供体荧光团可以通过长程偶极-偶极相互作用以非辐射方式将其激发能量转移到附近的受体发色团。例如,FRET能量供体可以是第一报告基因,并且FRET能量受体可以是第二报告基因。可替代地,FRET能量供体可以是第二报告基因,并且FRET能量受体可以是第一报告基因。在具体实例中,第一报告基因和第二报告基因是CFP和YFP。例如,分别在SEQ ID NO:13和14中提供了CFP的示例性蛋白质和编码序列。例如,分别在SEQ ID NO:15和16中提供了YFP的示例性蛋白质和编码序列。作为具体实例,CFP可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:13或与SEQ ID NO:13至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。作为另一个具体实例,YFP可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:15或与SEQ ID NO:15至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。

作为另一个实例,蛋白质片段互补策略可以用于检测聚集。例如,分裂荧光素酶可以用于从底物产生生物发光,并且第一报告基因和第二报告基因可以是荧光素酶的氨基-(NLuc)和羧基-(CLuc)端片段。荧光素酶的实例包含海肾、萤火虫、甲虫和长腹水蚤(Metridia)荧光素酶。

在一个非限制性实例中,本文公开的生物传感器细胞含有分别稳定地表达与荧光蛋白CFP或荧光蛋白YFP融合的疾病相关tau蛋白变体的两种转基因(tau4RD-CFP/tau4RD-YFP(TCY)),其中tau四重复结构域(4RD)包括P301S致病突变。在这些生物传感器系中,tau-CFP/tau-YFP蛋白聚集产生FRET信号,这是荧光能量从供体CFP转移到受体YFP的结果。含有tau聚集体的FRET阳性细胞可以通过流式细胞术分选和分离。在基线时,未经刺激的细胞以稳定、可溶性状态表达报告基因,其中FRET信号最小。在刺激(例如,种子颗粒的质脂体转染)时,报告蛋白形成聚集体,产生FRET信号。

本文公开的Cas/tau生物传感器细胞可以是聚集阳性(Agg[+])细胞,其中tau重复结构域稳定地以聚集状态存在,这意指tau重复结构域聚集体稳定地存在于所有细胞中,其中随时间推移生长并多次传代。可替代地,本文所公开的Cas/tau生物传感器细胞可以是聚集阴性的(Agg[-])。

2.Cas蛋白和嵌合Cas蛋白

本文公开的Cas/tau生物传感器细胞还包括对Cas蛋白进行编码的核酸(DNA或RNA)。任选地,Cas蛋白被稳定地表达。任选地,细胞包括在基因组上整合的Cas编码序列。同样,本文公开的SAM/tau生物传感器细胞还包括对嵌合Cas蛋白进行编码的核酸(DNA或RNA),所述嵌合Cas蛋白包括与一个或多个转录激活结构域(例如,VP64)融合的核酸酶失活Cas蛋白。任选地,嵌合Cas蛋白被稳定地表达。任选地,细胞包括在基因组上整合的嵌合Cas编码序列。

Cas蛋白是成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统的一部分。CRISPR/Cas系统包含转录本和涉及Cas基因表达或指导其活性的其它元件。CRISPR/Cas系统可以是例如I型、II型、III型系统或V型系统(例如,V-A亚型或V-B亚型)。本文公开的方法和组合物可以通过利用CRISPR复合物(包括与Cas蛋白复合的向导RNA(gRNA))用于核酸的定点结合或切割来采用CRISPR/Cas系统。

在本文公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然存在的。“非天然存在的”系统包含表明涉及人工的任何事物,如系统的一种或多种组分从其自然存在的状态改变或突变,至少基本上不含所述组分在自然界中与其天然相关的至少一种其它组分或与所述组分不与其天然相关的至少一种其它组分相关。例如,一些CRISPR/Cas系统采用包括不一起天然存在的gRNA和Cas蛋白的非天然存在的CRISPR复合物,采用不天然存在的Cas蛋白,或采用不天然存在的gRNA。

Cas蛋白通常包括可以与向导RNA相互作用的至少一个RNA识别或结合结构域。Cas蛋白还可以包括核酸酶结构域(例如,DNase结构域或RNase结构域)、DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域、二聚化结构域和其它结构域。一些此类结构域(例如,DNase结构域)可以来自天然Cas蛋白。可以添加其它此类结构域以制备经修饰的Cas蛋白。核酸酶结构域对核酸切割(其包含核酸分子共价键的断裂)具有催化活性。切割可以产生平末端或交错末端,并且其可以是单链或双链的。例如,野生型Cas9蛋白通常将产生钝性切割产物。可替代地,野生型Cpf1蛋白(例如,FnCpf1)可以产生具有5个核苷酸5'突出端的切割产物,其中切割发生在非靶向链上的PAM序列的第18个碱基对之后和靶向链上的第23个碱基之后。Cas蛋白可以具有完整的切割活性以在靶基因组基因座处产生双链断裂(例如,具有平末端的双链断裂),或者其可以是在靶基因组基因座处产生单链断裂的切口酶。

Cas蛋白的实例包含Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966以及其同源物或经修饰的版本。

示例性Cas蛋白是Cas9蛋白或源自Cas9蛋白的蛋白。Cas9蛋白来自II型CRISPR/Cas系统,并且通常共享具有保守结构的四个关键基序。基序1、2和4是类似RuvC的基序,并且基序3是HNH基序。示例性Cas9蛋白来自酿脓链球菌、嗜热链球菌(Streptococcusthermophilus)、链球菌(Streptococcus sp.)、金黄色酿脓葡萄球菌(Staphylococcusaureus)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomycespristinaespiralis)、绿产色链霉菌(Streptomyces viridochromogenes)、绿产色链霉菌(Streptomyces viridochromogenes)、链孢囊菌(Streptosporangium roseum)、链孢囊菌(Streptosporangium roseum)、酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒化芽孢杆菌(Bacillusselenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、德氏乳酸杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克氏菌目细菌(Burkholderiales bacterium)、食萘极地单胞菌(Polaromonas naphthalenivorans)、极地单胞菌(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝丝菌(Cyanothece sp.)、铜绿微囊藻(Microcystisaeruginosa)、聚球藻(Synechococcus sp.)、阿拉伯糖醋酸杆菌(Acetohalobiumarabaticum)、德根斯产氨菌(Ammonifex degensii)、热解纤维素菌(Caldicelulosiruptorbecscii)、候选金矿菌(Candidatus Desulforudis)、肉毒杆菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、丙酸降解菌(Pelotomaculum thermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)、异色变色菌(Allochromatium vinosum)、海杆菌(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、沃森亚硝化球菌(Nitrosococcus watsoni)、嗜盐假交替单胞菌(Pseudoalteromonas haloplanktis)、雷氏纤线杆菌(Ktedonobacterracemifer)、伊芙氏甲烷盐菌(Methanohalobium evestigatum)、鱼腥藻(Anabaenavariabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻(Nostoc sp.)、节旋藻(Arthrospira maxima)、盘状节旋藻(Arthrospira platensis)、节旋藻(Arthrospirasp.)、鞘丝藻(Lyngbya sp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤蓝细菌(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosiphoafricanus)、深海阿卡罗虎尾草(Acaryochloris marina)、脑膜炎奈瑟氏菌(Neisseriameningitidis)或空肠弯曲杆菌(Campylobacter jejuni)。Cas9家族成员的另外实例在WO2014/131833中进行描述,所述文献出于所有目的通过引用整体并入本文。来自酿脓链球菌的Cas9(SpCas9)(指定SwissProt登录号Q99ZW2)是示例性Cas9蛋白。示例性SpCas9蛋白和编码序列分别在SEQ ID NO:21和22中示出。来自金黄色葡萄球菌(S.aureus)的Cas9(SaCas9)(指定UniProt登录号J7RUA5)是另一种示例性Cas9蛋白。来自空肠弯曲杆菌的Cas9(CjCas9)(指定UniProt登录号Q0P897)是另一种示例性Cas9蛋白。参见例如,Kim等人(2017)《自然通讯(Nat.Comm.)》8:14500,所述文献出于所有目的通过引用整体并入本文。SaCas9小于SpCas9,并且CjCas9小于SaCas9和SpCas9。来自脑膜炎奈瑟氏菌的Cas9(Nme2Cas9)是另一种示例性Cas9蛋白。参见例如,Edraki等人(2019)《分子细胞生物学(Mol.Cell)》73(4):714-726,所述文献出于所有目的通过引用整体并入本文。来自嗜热链球菌的Cas9蛋白(例如,由CRISPR1基因座编码的嗜热链球菌LMD-9Cas9(St1Cas9)或来自CRISPR3基因座的嗜热链球菌Cas9(St3Cas9))是其它示例性Cas9蛋白。来自新凶手弗朗西丝菌(Francisella novicida)的Cas9(FnCas9)或识别替代性PAM(E1369R/E1449H/R1556A取代)的RHA新凶手弗朗西丝菌Cas9变体是其它示例性Cas9蛋白。这些和其它示例性Cas9蛋白在例如Cebrian-Serrano和Davies(2017)《哺乳动物基因组(Mamm.Genome)》28(7):247-261中进行了综述,所述文献出于所有目的通过引用整体并入本文。

作为一个实例,Cas蛋白可以是Cas9蛋白。例如,Cas9蛋白可以是酿脓链球菌Cas9蛋白。作为一个具体实例,Cas蛋白可以包括以下、基本上由以下组成或由以下组成:SEQ IDNO:21或与SEQ ID NO:21至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。作为另一个具体实例,包括核酸酶失活Cas蛋白和一个或多个转录激活结构域的嵌合Cas蛋白可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:36或与SEQ IDNO:36至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。

Cas蛋白的另一个实例是Cpf1(来自普氏菌和弗朗西斯菌1的CRISPR)蛋白。Cpf1是含有与Cas9的对应结构域同源的RuvC样核酸酶结构域以及与特征性富含精氨酸的Cas9簇的对应物的大蛋白质(约1300个氨基酸)。然而,Cpf1缺乏Cas9蛋白中存在的HNH核酸酶结构域,并且RuvC样结构域在Cpf1序列中是连续的,而Cas9则相反,其含有包含HNH结构域的长插入物。参见例如,Zetsche等人(2015)《细胞(Cell)》163(3):759-771,所述文献出于所有目的通过引用整体并入本文。示例性Cpf1蛋白来自土拉弗朗西斯菌1(Francisellatularensis 1)、新凶手亚种土拉弗朗西丝菌(Francisella tularensissubsp.novicida)、易北普氏菌(Prevotella albensis)、毛螺菌科细菌(Lachnospiraceaebacterium)MC2017 1、瘤胃产氢丁酸弧菌(Butyrivibrio proteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、俭菌超门细菌(Parcubacteriabacterium)GW2011_GWC2_44_17、志贺氏杆菌(Smithella sp.)SCADC、氨基酸球菌(Acidaminococcus sp.)BV3L6、毛螺科菌(Lachnospiraceae bacterium)MA2020、候选白蚁甲烷菌(Candidatus Methanoplasma termitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)237、稻田氏钩端螺旋体(Leptospira inadai)、毛螺菌科细菌(Lachnospiraceae bacterium)ND2006、犬口腔卟啉单胞菌(Porphyromonascrevioricanis)3、解糖胨普氏菌(Prevotella disiens)和猕猴卟啉单胞菌(Porphyromonas macacae)。来自新凶手弗朗西丝菌U112的Cpf1(FnCpf1;指定UniProt登录号A0Q7Q2)是示例性Cpf1蛋白。

Cas蛋白可以是野生型蛋白(即,自然界中存在的那些蛋白)、经修饰的Cas蛋白(即,Cas蛋白变体)或野生型或经修饰的Cas蛋白的片段。关于野生型或经修饰的Cas蛋白的催化活性,Cas蛋白也可以是活性变体或片段。关于催化活性,活性变体或片段可以包括与野生型或经修饰的Cas蛋白或其部分的至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中活性变体保留在期望的切割位点切割的能力并且因此保留双链断裂诱导活性。双链断裂诱导活性的测定是已知的,并且通常测量Cas蛋白对含有切割位点的DNA底物的整体活性和特异性。

经修饰的Cas蛋白的一个实例是经修饰的SpCas9-HF1蛋白,所述蛋白是酿脓链球菌Cas9的高保真变体,具有被设计成减少非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)。参见例如,Kleinstiver等人(2016)《自然(Nature)》529(7587):490-495,所述文献出于所有目的通过引用整体并入本文。经修饰Cas蛋白的另一个实例是被设计成减少脱靶效应的经修饰的eSpCas9变体(K848A/K1003A/R1060A)。参见例如,Slaymaker等人(2016)《科学(Science)》351(6268):84-88,所述文献出于所有目的通过引用整体并入本文。其它SpCas9变体包含K855A和K810A/K1003A/R1060A。这些和其它经修饰的Cas蛋白在例如Cebrian-Serrano和Davies(2017)《哺乳动物基因组》28(7):247-261中进行了综述,所述文献出于所有目的通过引用整体并入本文。另一种经修饰Cas9蛋白的实例是xCas9,其是可以识别扩大范围的PAM序列的SpCas9变体。参见例如,Hu等人(2018)《自然》556:57-63,所述文献出于所有目的通过引用整体并入本文。

可以修饰Cas蛋白以增加或减少核酸结合亲和力、核酸结合特异性和酶活性中的一种或多种。也可以修饰Cas蛋白以改变蛋白质的任何其它活性或性质,如稳定性。例如,可以截短Cas蛋白以去除对于所述蛋白的功能不是必需的结构域或优化(例如,增强或降低)Cas蛋白的活性或性质。作为另一个实例,Cas蛋白的一个或多个核酸酶结构域可以被修饰、缺失或失活(例如,用于包括核酸酶失活Cas蛋白的SAM/tau生物传感器细胞)。

Cas蛋白可以包括至少一个核酸酶结构域,如DNase结构域。例如,野生型Cpf1蛋白通常包括切割靶DNA的两条链的RuvC样结构域,其可能呈二聚体构型。Cas蛋白还可以包括至少两个核酸酶结构域,如DNase结构域。例如,野生型Cas9蛋白通常包括RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC结构域和HNH结构域可以各自切割双链DNA的不同的链以在DNA中产生双链断裂。参见例如,Jinek等人(2012)《科学》337:816-821,所述文献出于所有目的通过引用整体并入本文。

一个或多个或全部核酸酶结构域可以进行缺失或突变,使得所述核酸酶结构域不再具有功能或具有降低的核酸酶活性。例如,如果Cas9蛋白中的核酸酶结构域之一进行缺失或突变,则所得Cas9蛋白可以被称为切口酶,并且可以在双链靶DNA内产生单链断裂,但不会产生双链断裂(即,其可以切割互补链或非互补链,但不能同时切割两者)。如果核酸酶结构域中的两者进行缺失或突变,则所得Cas蛋白(例如,Cas9)切割双链DNA的两条链的能力将降低(例如,核酸酶无效或核酸酶失活Cas蛋白,或催化死亡的Cas蛋白(dCas))。将Cas9转化为切口酶的突变的实例是来自酿脓链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10处天冬氨酸到丙氨酸)突变。同样,来自酿脓链球菌的Cas9的HNH结构域中的H939A(在氨基酸位置839处组氨酸到丙氨酸)、H840A(在氨基酸位置840处组氨酸到丙氨酸)或N863A(在氨基酸位置N863处天冬酰胺到丙氨酸)可以将Cas9转化为切口酶。将Cas9转化为切口酶的其它突变实例包含来自嗜热链球菌的Cas9的对应突变。参见例如,Sapranauskas等人,(2011)《核酸研究(Nucleic Acids Res.)》39(21):9275-9282和WO 2013/141680,所述文献中的每个文献出于所有目的通过引用整体并入本文。可以使用如定点诱变、PCR介导的诱变或总基因合成等方法产生此类突变。产生切口酶的其它突变实例可以在例如WO 2013/176772和WO 2013/142578中找到,所述文献中的每个文献出于所有目的通过引用整体并入本文。如果Cas蛋白中的全部核酸酶结构域都进行缺失或突变(例如,Cas9蛋白中的两个核酸酶结构域都进行缺失或突变),则所得Cas蛋白(例如,Cas9)切割双链DNA的两条链的能力将降低(例如,核酸酶无效或核酸酶失活Cas蛋白)。一个具体实例是D10A/H840A酿脓链球菌Cas9双突变体或当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。另一个具体实例是D10A/N863A酿脓链球菌Cas9双突变体或当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。

xCas9的催化结构域中的失活突变的实例与上文针对SpCas9所描述的那些实例相同。金黄色葡萄球菌Cas9蛋白的催化结构域中失活突变的实例也是已知的。例如,金黄色葡萄球菌Cas9酶(SaCas9)可以包括用于产生核酸酶失活Cas蛋白的位置N580处的取代(例如,N580A取代)和位置D10处的取代(例如,D10A取代)。参见例如,WO 2016/106236,所述文献出于所有目的通过引用整体并入本文。Nme2Cas9的催化结构域中失活突变的实例也是已知的(例如,D16A和H588A的组合)。St1Cas9的催化结构域中失活突变的实例也是已知的(例如,D9A、D598A、H599A和N622A的组合)。St3Cas9的催化结构域中失活突变的实例也是已知的(例如,D10A和N870A的组合)。CjCas9的催化结构域中失活突变的实例也是已知的(例如,D8A和H559A的组合)。FnCas9和RHA FnCas9的催化结构域中失活突变的实例也是已知的(例如,N995A)。

Cpf1蛋白的催化结构域中失活突变的实例也是已知的。参考来自新凶手弗朗西丝菌U112(FnCpf1)、氨基酸球菌BV3L6(AsCpf1)、毛螺科菌ND2006(LbCpf1)和牛眼莫拉氏菌237(MbCpf1 Cpf1)的Cpf1蛋白,此类突变可以包含AsCpf1的位置908、993或1263处或Cpf1直系同源物中的对应位置处,或LbCpf1的位置832、925、947或1180或Cpf1直系同源物中的对应位置处的突变。此类突变可以包含例如AsCpf1的突变D908A、E993A和D1263A或Cpf1直系同源物中的对应突变或LbCpf1的D832A、E925A、D947A和D1180A或Cpf1直系同源物中的对应突变中的一种或多种突变。参见例如,US 2016/0208243,所述文献出于所有目的通过引用整体并入本文。

Cas蛋白也可以作为融合蛋白与异源多肽可操作地连接。例如,Cas蛋白可以与切割结构域、表观遗传修饰结构域、转录激活结构域或转录阻遏结构域融合。参见WO 2014/089290,所述文献出于所有目的通过引用整体并入本文。例如,Cas蛋白可以与转录激活结构域可操作地连接或融合,以用于SAM/tau生物传感器细胞。转录激活结构域的实例包含单纯疱疹病毒VP16激活结构域、VP64(其是VP16的四聚体衍生物)、NFκB p65激活结构域、p53激活结构域1和2、CREB(cAMP响应元件结合蛋白)激活结构域、E2A激活结构域和NFAT(激活T细胞的核因子)激活结构域。其它实例包含来自Oct1、Oct-2A、SP1、AP-2、CTF1、P300、CBP、PCAF、SRC1、PvALF、ERF-2、OsGAI、HALF-1、C1、AP1、ARF-5、ARF-6、ARF-7、ARF-8、CPRF1、CPRF4、MYC-RP/GP、TRAB1PC4和HSF1的激活结构域。参见例如US 2016/0237456、EP3045537和WO 2011/146121,所述文献中的每个文献出于所有目的通过引用整体并入。在一些情况下,可以使用包括与MS2-p65-HSF1配对的dCas9-VP64融合蛋白的转录激活系统。此类系统中的向导RNA可以被设计成具有附加到sgRNA四环和茎环2的适体序列,所述适体序列被设计成结合二聚化MS2噬菌体外壳蛋白。参见例如,Konermann等人(2015)《自然》517(7536):583-588,所述文献出于所有目的通过引用整体并入本文。转录阻遏物结构域的实例包含诱导型cAMP早期阻遏物(ICER)结构域、克鲁贝尔相关盒(Kruppel-associated box)A(KRAB-A)阻遏物结构域、YY1富含甘氨酸的阻遏物结构域、Sp1样阻遏物、E(spl)阻遏物、ΙκΒ阻遏物和MeCP2。其它实例包含来自A/B、KOX、TGF-β诱导型早期基因(TIEG)、v-erbA、SID、SID4X、MBD2、MBD3、DNMT1、DNMG3A、DNMT3B、Rb、ROM2的转录阻遏物结构域,参见例如,EP3045537和WO 2011/146121,所述文献中的每个文献出于所有目的通过引用整体并入。Cas蛋白也可以与异源多肽融合,提供增加或减少的稳定性。融合结构域或异源多肽可以定位于N端、C端或Cas蛋白内部。

Cas蛋白也可以作为融合蛋白与异源多肽可操作地连接。作为一个实例,Cas蛋白可以与提供亚细胞定位的一种或多种异源多肽融合。此类异源多肽可以包含例如一种或多种核定位信号(NLS),如用于靶向细胞核的单分SV40 NLS和/或二分α-输入蛋白NLS、用于靶向线粒体的线粒体定位信号、ER保留信号等。参见例如,Lange等人(2007)《生物化学杂志(J.Biol.Chem.)》282:5101-5105,所述文献出于所有目的通过引用整体并入本文。此类亚细胞定位信号可以定位于N端、C端或Cas蛋白内的任何位置。NLS可以包括碱性氨基酸段,并且可以是单分序列或二分序列。任选地,Cas蛋白可以包括两个或更多个NLS,包含N端处的NLS(例如,α-输入蛋白NLS或单分NLS)和C端处的NLS(例如,SV40 NLS或二分NLS)。Cas蛋白还可以包括N端处的两个或更多个NLS和/或C端处的两个或更多个NLS。

Cas蛋白也可以与细胞穿透结构域或蛋白质转导结构域可操作地连接。例如,细胞穿透结构域可以源自HIV-1TAT蛋白、来自人类乙型肝炎病毒的TLM细胞穿透基序、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透肽或聚精氨酸肽序列。参见例如WO 2014/089290和WO 2013/176772,所述文献中的每个文献出于所有目的通过引用整体并入。细胞穿透结构域可以定位于N端、C端或Cas蛋白内的任何位置。

Cas蛋白也可以与异源多肽可操作地连接以便于进行追踪或纯化,如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿、Azami绿、单体Azami绿、CopGFP、AceGFP、ZsGreenl)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如,eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色、T-天蓝色(T-sapphire))、青色荧光蛋白(例如,eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl、Midoriishi-青色)、红色荧光蛋白(例如,mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine、tdTomato)和任何其它合适的荧光蛋白。标签的实例包含谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、多(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血球凝集素(HA)、nus、Softag 1、Softag3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白。

Cas蛋白可以以任何形式提供。例如,可以以蛋白质的形式提供Cas蛋白质。例如,Cas蛋白可以作为与gRNA复合的Cas蛋白提供。可替代地,可以以对Cas蛋白进行编码的核酸形式提供Cas蛋白,如RNA(例如,信使RNA(mRNA))或DNA。任选地,可以对编码Cas蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白质。例如,与天然存在的多核苷酸序列相比,可以修饰对Cas蛋白进行编码的核酸以取代在细菌细胞、酵母细胞、人类细胞、非人类细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它感兴趣的宿主细胞中具有更高使用频率的密码子。例如,可以对编码Cas蛋白的核酸进行密码子优化以在人类细胞中进行表达。当对Cas蛋白进行编码的核酸被引入到细胞中时,Cas蛋白可以在细胞中进行瞬时、条件性或组成性表达。

可以对作为mRNA提供的Cas蛋白进行修饰以提高稳定性和/或免疫原性性质。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基进行化学修饰的实例包含假尿苷、1-甲基-假尿苷和5-甲基-胞苷。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化CasmRNA。同样,Cas mRNA可以通过使用同义密码子对尿苷进行缺失来修饰。

对Cas蛋白进行编码的核酸可以稳定地整合在细胞的基因组中,并且与在细胞中具有活性的启动子可操作地连接。在一个具体实例中,对Cas蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:22或与SEQ ID NO:22至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:21。在另一个具体实例中,对包括核酸酶失活Cas蛋白和一个或多个转录激活结构域的嵌合Cas蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:38或与SEQ ID NO:38至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:36。可替代地,对Cas蛋白进行编码的核酸可以与表达构建体中的启动子可操作地连接。表达构建体包含能够指导基因或其它感兴趣的核酸序列(例如,Cas基因)的表达并且可以将此类感兴趣的核酸序列转移到靶细胞的任何核酸构建体。可以用于表达构建体的启动子包含在例如真核细胞、人类细胞、非人类细胞、哺乳动物细胞、非人类哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导多能干(iPS)细胞或单细胞阶段胚胎中的一种或多种细胞中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。

3.嵌合衔接蛋白

本文公开的SAM/tau生物传感器细胞不仅可以包括对嵌合Cas蛋白进行编码的核酸(DNA或RNA),所述嵌合Cas蛋白包括与一个或多个转录激活结构域(例如,VP64)融合的核酸酶失活Cas蛋白;而且任选地还包括对嵌合衔接蛋白进行编码的核酸(DNA或RNA),所述嵌合衔接蛋白包括与一个或多个转录激活结构域融合(例如,与p65和HSF1融合)的衔接蛋白(例如,MS2外壳蛋白(MCP))。任选地,嵌合Cas蛋白和/或嵌合衔接蛋白被稳定地表达。任选地,细胞包括基因组整合的嵌合Cas蛋白编码序列和/或基因组整合的嵌合衔接蛋白编码序列。

此类嵌合衔接蛋白包括:(a)与向导RNA内的衔接结合元件特异性结合的衔接子(即,衔接结构域或衔接蛋白);以及(b)一个或多个异源转录激活结构域。例如,此类融合蛋白可以包括1、2、3、4、5或更多个转录激活结构域(例如,两个或更多个异源转录激活结构域或三个或更多个异源转录激活结构域)。在一个实例中,此类嵌合衔接蛋白可以包括:(a)与向导RNA中的衔接结合元件特异性结合的衔接子(即,衔接结构域或衔接蛋白);以及(b)两个或更多个转录激活结构域。例如,嵌合衔接蛋白可以包括:(a)与向导RNA中的一个或多个MS2适体(例如,向导RNA中的单独定位中的两个MS2适体)特异性结合的MS2外壳蛋白衔接子;以及(b)一个或多个(例如,两个或更多个转录激活结构域)。例如,两个转录激活结构域可以是p65和HSF1转录激活结构域或其功能片段或变体。然而,还提供了其中转录激活结构域包括其它转录激活结构域或其功能片段或变体的嵌合衔接蛋白。

一个或多个转录激活结构域可以与衔接子直接融合。可替代地,一个或多个转录激活结构域可以通过接头或接头组合或通过一个或多个另外的结构域连接到衔接子。同样,如果存在两个或更多个转录激活结构域,则所述结构域可以直接彼此融合或可以通过接头或接头组合或通过一个或多个另外的结构域彼此连接。可以用于这些融合蛋白的接头可以包含不干扰融合蛋白的功能的任何序列。示例性接头是短的(例如,2-20个氨基酸)并且通常是柔性的(例如,包括具有高自由度的氨基酸,如甘氨酸、丙氨酸和丝氨酸)。

一个或多个转录激活结构域和衔接子可以在嵌合衔接蛋白内呈任何顺序。作为一种选择,一个或多个转录激活结构域可以在衔接子的C端并且衔接子可以在一个或多个转录激活结构域的N端。例如,一个或多个转录激活结构域可以在嵌合衔接蛋白的C端,并且衔接子可以在嵌合衔接蛋白的N端。然而,一个或多个转录激活结构域可以在衔接子的C端而不在嵌合衔接蛋白的C端(例如,如果核定位信号处于嵌合衔接蛋白的C端处)。同样,衔接子可以在一个或多个转录激活结构域的N端而不在嵌合接头蛋白的N端处(例如,如果核定位信号处于嵌合衔接蛋白的N端处)。作为另一种选择,一个或多个转录激活结构域可以在衔接子的N端并且衔接子可以在一个或多个转录激活结构域的C端。例如,一个或多个转录激活结构域可以在嵌合衔接蛋白的N端,并且衔接子可以在嵌合衔接蛋白的C端。作为另一种选择,如果嵌合衔接蛋白包括两个或更多个转录激活结构域,则两个或更多个转录激活结构域可以位于衔接子的侧翼。

嵌合衔接蛋白也可以与另外的异源多肽可操作地连接或融合。融合或连接的异源多肽可以定位于N端、C端或嵌合衔接蛋白内部的任何位置。例如,嵌合衔接蛋白可以进一步包括核定位信号。此类蛋白质的具体实例包括与MS2外壳蛋白(MCP)的p65转录激活结构域C端和p65转录激活结构域的HSF1转录激活结构域C端(直接或通过NLS)连接的MS2外壳蛋白(衔接子)。此类蛋白质可以从N端到C端包括:MCP;核定位信号;p65转录激活结构域;以及HSF1转录激活结构域。例如,嵌合衔接蛋白可以包括以下、基本上由以下组成或由以下组成:与SEQ ID NO:37中所示的MCP-p65-HSF1嵌合衔接蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。同样,对嵌合衔接蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:与SEQ ID NO:39中所示的MCP-p65-HSF1嵌合衔接蛋白编码序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的序列。

衔接子(即,衔接结构域或衔接蛋白)是特异性识别并与不同序列结合(例如,与不同DNA和/或RNA序列,如序列特异性方式的适体结合)的核酸结合结构域(例如,DNA结合结构域和/或RNA结合结构域)。适体包含通过其采用特异性三维构象的能力可以以高亲和力和特异性与靶分子结合的核酸。例如,此类衔接子可以与特异性RNA序列和二级结构结合。这些序列(即,衔接结合元件)可以被工程化成向导RNA。例如,MS2适体可以被工程化成向导RNA,以特异性结合MS2外壳蛋白(MCP)。例如,衔接子可以包括以下、基本上由以下组成或由以下组成:与SEQ ID NO:40中所示的MCP序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。同样,对衔接子进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:与SEQ ID NO:41中所示的MCP编码序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。衔接子和靶标的具体实例包含例如存在于噬菌体外壳蛋白多样性内的RNA结合蛋白/适体组合。参见例如US 2019-0284572和WO 2019/183123,所述文献中的每个文献出于所有目的通过引用整体并入。

本文公开的嵌合衔接蛋白包括一个或多个转录激活结构域。此类转录激活结构域可以是天然存在的转录激活结构域,可以是天然存在的转录激活结构域的功能片段或功能变体,或者可以是工程化或合成的转录激活结构域。可以使用的转录激活结构域包含例如在US2019-0284572和WO 2019/183123中描述的那些,所述文献中的每个文献出于所有目的通过引用整体并入本文。

4.细胞类型

本文公开的Cas/tau生物传感器细胞可以是任何类型的细胞并且可以是体外的、离体的或体内的。Cas/tau生物传感器细胞系或细胞群体可以是单克隆细胞系或细胞群体。同样,本文公开的SAM/tau生物传感器细胞可以是任何类型的细胞并且可以是体外的、离体的或体内的。SAM/tau生物传感器细胞系或细胞群体可以是单克隆细胞系或细胞群体。细胞可以来自任何来源。例如,细胞可以是真核细胞、动物细胞、植物细胞或真菌(例如,酵母)细胞。此类细胞可以是鱼类细胞或鸟类细胞,或者此类细胞可以是哺乳动物细胞,如人类细胞、非人类哺乳动物细胞、啮齿动物细胞、小鼠细胞或大鼠细胞。哺乳动物包含例如人、非人灵长类动物、猴子、猿、猫、狗、马、公牛、鹿、野牛、绵羊、啮齿动物(例如,小鼠、大鼠、仓鼠、豚鼠)、家畜(例如,牛物种,如奶牛和公牛;绵羊物种,如绵羊和山羊;以及猪物种,如猪和野猪)。鸟类包含例如鸡、火鸡、鸵鸟、鹅和鸭。还包含家养动物和农业动物。术语“非人动物”排除人。在具体实例中,Cas/tau生物传感器细胞是人类细胞(例如,HEK293T细胞)。同样,在具体实例中,SAM/tau生物传感器细胞是人类细胞(例如,HEK293T细胞)。

细胞可以是,例如,全能细胞或多能细胞(例如,胚胎干(ES)细胞,如啮齿动物ES细胞、小鼠ES细胞或大鼠ES细胞)。全能细胞包含可以产生任何细胞类型的未分化细胞,并且多能细胞包含具有发育成超过一种分化细胞类型的能力的未分化细胞。此类多能和/或全能细胞可以是例如ES细胞或ES样细胞,如诱导多能干(iPS)细胞。ES细胞包含在引入到胚胎中时能够对发育胚胎的任何组织做出贡献的胚胎衍生的全能或多能细胞。ES细胞可以源自囊胚的内细胞团,并且能够分化成三种脊椎动物胚层(内胚层、外胚层和中胚层)中的任何层的细胞。

细胞也可以是原代体细胞,或不是原代体细胞的细胞。体细胞可以包含不是配子、生殖细胞、配子细胞或未分化干细胞的任何细胞。细胞也可以是原代细胞。原代细胞包含直接从生物体、器官或组织中分离的细胞或细胞培养物。原代细胞包含既不转化也不永生的细胞。所述原代细胞包含从生物体、器官或组织中获得的任何细胞,所述细胞先前未在组织培养物中进行传代,或者先前已经在组织培养物中进行传代但不能无限期地在组织培养中进行传代。此类细胞可以通过常规技术分离并且包含例如体细胞、造血细胞、内皮细胞、上皮细胞、成纤维细胞、间充质细胞、角质形成细胞、黑素细胞、单核细胞、单一核细胞、脂肪细胞、前脂肪细胞、神经元、神经胶质细胞、肝细胞、骨骼肌成肌细胞和平滑肌细胞。例如,原代细胞可以来源于结缔组织、肌肉组织、神经系统组织或上皮组织。

此类细胞还包含通常不会无限增殖但由于突变或改变而逃避正常细胞衰老而可以继续进行分裂的细胞。此类突变或改变可以天然存在或有意诱导。永生化细胞的实例包含中国仓鼠卵巢(CHO)细胞、人胚胎肾细胞(例如,HEK293T细胞)和小鼠胚胎成纤维细胞(例如,3T3细胞)。多种类型的永生化细胞是众所周知的。永生化或原代细胞包含通常用于培养或表达重组基因或蛋白质的细胞。

细胞也可以是分化细胞,如神经元细胞(例如,人神经元细胞)。

B.产生Cas/tau生物传感器细胞和SAM/tau生物传感器细胞的方法

本文公开的Cas/tau生物传感器细胞可以通过任何已知方式产生。连接到第一报告基因的第一tau重复结构域、连接到第二报告基因的第二tau重复结构域和Cas蛋白可以通过任何已知的方式以任何形式(例如,DNA、RNA或蛋白质)引入到细胞中。同样,本文公开的SAM/tau生物传感器细胞可以通过任何已知方式产生。连接到第一报告基因的第一tau重复结构域、连接到第二报告基因的第二tau重复结构域、嵌合Cas蛋白和嵌合衔接蛋白可以通过任何已知的方式以任何形式(例如,DNA、RNA或蛋白质)引入到细胞中。“引入”包含以使得序列进入细胞内部的方式向细胞呈递核酸或蛋白质。本文提供的方法不依赖于用于将核酸或蛋白质引入到细胞中的特定方法,仅依赖于核酸或蛋白质进入至少一个细胞的内部。用于将核酸和蛋白质引入到各种细胞类型中的方法是已知的,包含例如稳定转染方法、瞬时转染方法和病毒介导的方法。任选地,可以使用靶向载体。

转染方案以及用于将核酸或蛋白质引入到细胞中的方案可以不同。非限制性转染方法包含使用以下各项的基于化学的转染方法:脂质体;纳米颗粒;磷酸钙(Graham等人(1973)《病毒学(Virology)》52(2):456–67,Bacchetti等人(1977)《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》74(4):1590-4以及Kriegler,M(1991)《转移和表达:实验室手册(Transfer and Expression:A Laboratory Manual.)》纽约:弗里曼公司(W.H.Freemanand Company.)第96-97页);树枝状聚合物;或阳离子聚合物,如DEAE-葡聚糖或聚乙烯亚胺。非化学方法包含电穿孔、声波穿孔和光转染。基于颗粒的转染包含使用基因枪或磁体辅助转染(Bertram(2006)《当前制药生物技术(Current Pharmaceutical Biotechnology)》7,277–28)。病毒方法也可以用于转染。

也可以通过电穿孔、胞质内注射、病毒感染、腺病毒、腺相关病毒、慢病毒、逆转录病毒、转染、脂质介导的转染或通过核转染来介导将核酸或蛋白质引入到细胞中。核转染是使核酸底物不仅能够被递送到细胞质,而且能够通过核膜进入到细胞核中的改善的电穿孔技术。另外,在本文公开的方法中使用核转染通常需要比常规电穿孔少得多的细胞(例如,与常规电穿孔的700万相比,仅约200万)。在一个实例中,使用NUCLEOFECTORTM系统进行核转染。

也可以通过显微注射将核酸或蛋白质引入到细胞中。mRNA的显微注射优选地进入到细胞质中(例如,以将mRNA直接递送到翻译机器),而蛋白质或对蛋白质进行编码的DNA的显微注射优选地进入到细胞核中。可替代地,可以通过注射到细胞核和细胞质两者中来进行显微注射:可以首先将针头引入到细胞核中,并且注射第一量,并且从细胞中去除针头时,可以将第二量注射到细胞质中。用于进行显微注射的方法是众所周知的。参见例如,Nagy等人(Nagy A、Gertsenstein M、Vintersten K、Behringer R.,2003,《操纵小鼠胚胎(Manipulating the Mouse Embryo.)》冷泉港(Cold Spring Harbor),纽约:冷泉港实验室出版社(Cold Spring Harbor Laboratory Press));Meyer等人(2010)《美国国家科学院院刊》107:15022-15026以及Meyer等人(2012)《美国国家科学院院刊》109:9354-9359。

用于将核酸或蛋白质引入到细胞中的其它方法可以包含例如载体递送、颗粒介导的递送、外泌体介导的递送、脂质纳米颗粒介导的递送、细胞穿透肽介导的递送或植入装置介导的递送。向受试者施用核酸或蛋白质以在体内修饰细胞的方法在本文别处公开。

在一个实例中,可以通过病毒转导如慢病毒转导引入连接到第一报告基因的第一tau重复结构域、连接到第二报告基因的第二tau重复结构域和Cas蛋白。

筛选包括连接到第一报告基因的第一tau重复结构域、连接到第二报告基因的第二tau重复结构域和Cas蛋白的细胞可以通过任何已知的方式进行。

例如,报告基因可以用于筛选具有Cas蛋白、连接到第一报告基因的第一tau重复结构域或连接到第二报告基因的第二tau重复结构域的细胞。示例性报告基因包含对以下进行编码的那些报告基因:荧光素酶、β-半乳糖苷酶、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、DsRed、ZsGreen、MmGFP、mPlum、mCherry、tdTomato、mStrawberry、J-Red、mOrange、mKO、mCitrine、Venus、YPet、祖母绿、CyPet、天蓝、T-蓝宝石和碱性磷酸酶。例如,如果第一报告基因和第二报告基因是荧光蛋白(例如,CFP和YFP),则可以通过流式细胞术选择包括这些报告基因的细胞以选择双阳性细胞。然后可以将双阳性细胞组合以产生多克隆系,或者可以从单个双阳性细胞产生单克隆系。

作为另一个实例,选择标志物可以用于筛选具有Cas蛋白、连接到第一报告基因的第一tau重复结构域或连接到第二报告基因的第二tau重复结构域的细胞。示例性选择标志物包含新霉素磷酸转移酶(neor)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰转移酶(puror)、杀稻瘟素S脱氨酶(bsrr)、黄嘌呤/鸟嘌呤磷酸核糖转移酶(gpt)或单纯疱疹病毒胸苷激酶(HSV-k)。另一个示例性选择标志物是博来霉素抗性蛋白,由Sh ble基因(印度异壁链霉菌(Streptoalloteichus hindustanus)博来霉素基因)编码,其赋予吉欧霉素(腐草霉素D1)抗性。

例如,可以例如通过接种tau聚集体来产生其中tau重复结构域以聚集状态稳定地存在的聚集阳性(Agg[+])细胞,这意指tau重复结构域聚集体稳定地存在于所有细胞中,其中随时间推移生长并多次传代。例如,本文公开的原初聚集阴性(Agg[-])Cas/tau生物传感器细胞可以用重组原纤维化tau(例如,重组原纤维化tau重复结构域)处理以接种由这些细胞稳定表达的tau重复结构域蛋白的聚集。同样,本文公开的原初聚集阴性(Agg[-])SAM/tau生物传感器细胞可以用重组原纤维化tau(例如,重组原纤维化tau重复结构域)处理以接种由这些细胞稳定表达的tau重复结构域蛋白的聚集。原纤维化tau重复结构域可以与由细胞稳定表达的tau重复结构域相同、类似或不同。任选地,重组原纤维化tau可以与脂质体试剂混合。然后可以连续稀释经接种的细胞以获得单细胞衍生的克隆,并且鉴定克隆细胞系,其中tau重复结构域聚集体稳定地存在于所有细胞中,其中随时间推移生长并多次传代。

作为另一个实例,可以例如通过用来自tau聚集阳性细胞的细胞裂解物来接种细胞(例如,tau聚集阴性细胞)而产生其中tau重复结构域以聚集状态稳定地存在的聚集阳性(Agg[+])细胞,这意指tau重复结构域聚集体稳定地存在于所有细胞中,其中随时间推移生长并多次传代。这是本文实例中描述的“最大接种”。例如,可以使用包括细胞裂解物的培养基(例如,包括细胞裂解物的新鲜培养基)接种细胞。“最大接种”可以指接种本身在大多数聚集阴性tau生物传感器细胞中诱导tau聚集。“最小接种”可以指接种本身不足以在聚集阴性tau生物传感器细胞中诱导tau聚集(或仅最低限度地诱导tau聚集)但使此类细胞对聚集诱导敏化。

培养基中细胞裂解物的量或浓度可以是任何合适的量或浓度。例如,培养基中的细胞裂解物的浓度可以介于约0.1μg/mL与约50μg/mL之间、介于约0.1μg/mL与约25μg/mL之间、介于约0.1μg/mL与约10μg/mL之间、介于约0.1μg/mL与约5μg/mL之间、介于约0.1μg/mL与约4.5μg/mL之间、介于约0.1μg/mL与约4μg/mL之间、介于约0.1μg/mL与约3.5μg/mL之间、介于约0.1μg/mL与约3μg/mL之间、介于约0.1μg/mL与约2.5μg/mL之间、介于约0.1μg/mL与约2μg/mL之间、介于约0.1μg/mL与约1.5μg/mL之间、介于约0.1μg/mL与约1μg/mL之间、介于约0.5μg/mL与约50μg/mL之间、介于约0.5μg/mL与约25μg/mL之间、介于约0.5μg/mL与约10μg/mL之间、介于约0.5μg/mL与约5μg/mL之间、介于约0.5μg/mL与约4.5μg/mL之间、介于约0.5μg/mL与约4μg/mL之间、介于约0.5μg/mL与约3.5μg/mL之间、介于约0.5μg/mL与约3μg/mL之间、介于约0.5μg/mL与约2.5μg/mL之间、介于约0.5μg/mL与约2μg/mL之间、介于约0.5μg/mL与约1.5μg/mL之间、介于约0.5μg/mL与约1μg/mL之间、介于约1μg/mL与约50μg/mL之间、介于约1μg/mL与约25μg/mL之间、介于约1μg/mL与约10μg/mL之间、介于约1μg/mL与约5μg/mL之间、介于约1μg/mL与约4.5μg/mL之间、介于约1μg/mL与约4μg/mL之间、介于约1μg/mL与约3.5μg/mL之间、介于约1μg/mL与约3μg/mL之间、介于约1μg/mL与约2.5μg/mL之间、介于约1μg/mL与约2μg/mL之间、介于约1μg/mL与约1.5μg/mL之间、介于约1.5μg/mL与约50μg/mL之间、介于约1.5μg/mL与约25μg/mL之间、介于约1.5μg/mL与约10μg/mL之间、介于约1.5μg/mL与约5μg/mL之间、介于约1.5μg/mL与约4.5μg/mL之间、介于约1.5μg/mL与约4μg/mL之间、介于约1.5μg/mL与约3.5μg/mL之间、介于约1.5μg/mL与约3μg/mL之间、介于约1.5μg/mL与约2.5μg/mL之间、介于约1.5μg/mL与约2μg/mL之间、介于约2μg/mL与约50μg/mL之间、介于约2μg/mL与约25μg/mL之间、介于约2μg/mL与约10μg/mL之间、介于约2μg/mL与约5μg/mL之间、介于约2μg/mL与约4.5μg/mL之间、介于约2μg/mL与约4μg/mL之间、介于约2μg/mL与约3.5μg/mL之间、介于约2μg/mL与约3μg/mL之间、介于约2μg/mL与约2.5μg/mL之间、介于约2.5μg/mL与约50μg/mL之间、介于约2.5μg/mL与约25μg/mL之间、介于约2.5μg/mL与约10μg/mL之间、介于约2.5μg/mL与约5μg/mL之间、介于约2.5μg/mL与约4.5μg/mL之间、介于约2.5μg/mL与约4μg/mL之间、介于约2.5μg/mL与约3.5μg/mL或介于约2.5μg/mL与约3μg/mL的培养基(例如,新鲜培养基)。例如,培养基中的细胞裂解物的浓度可以介于约1μg/mL与约5μg/mL之间或浓度可以为约1.5μg/mL、约2μg/mL、约2.5μg/mL、约3μg/mL、约3.5μg/mL、约4μg/mL、约4.5μg/mL或约5μg/mL。任选地,细胞裂解物可以处于缓冲液中,如磷酸盐缓冲盐水。任选地,缓冲液可以包括蛋白酶抑制剂。蛋白酶抑制剂的实例包含但不限于AEBSF、抑肽酶、苯丁抑制素、E-64、亮抑酶肽、胃酶抑素A和乙二胺四乙酸(EDTA)。缓冲液可以包括这些抑制剂中的任何抑制剂或其任何组合(例如,缓冲液可以包括所有这些蛋白酶抑制剂)。

用于产生裂解物的细胞可以收集在缓冲液中,如磷酸盐缓冲盐水。任选地,缓冲液可以包括蛋白酶抑制剂。蛋白酶抑制剂的实例包含但不限于AEBSF、抑肽酶、苯丁抑制素、E-64、亮抑酶肽、胃酶抑素A和乙二胺四乙酸(EDTA)。缓冲液可以包括这些抑制剂中的任何抑制剂或其任何组合(例如,缓冲液可以包括所有这些蛋白酶抑制剂)。

细胞裂解物可以例如通过对tau聚集阳性细胞(例如,收集在缓冲液和蛋白酶抑制剂中的细胞,如上文所描述的)进行超声处理任何合适的时间量来收集。例如,可以将细胞超声处理约1分钟到约6分钟、约1分钟到约5分钟、约1分钟到约4分钟、约1分钟到约3分钟、约2分钟到约6分钟、约2分钟到约5分钟、约2分钟到约4分钟、约2分钟到约3分钟、约2分钟到约6分钟、约3分钟到约5分钟或约3分钟到4分钟。例如,可以将细胞超声处理约2分钟到约4分钟或约3分钟。

任选地,培养基包括脂质体或质脂体(例如,阳离子质脂体)或磷脂或另一种转染剂。任选地,培养基包括脂质体。任选地,培养基不包括脂质体或质脂体(例如,阳离子质脂体)或磷脂或另一种转染剂。任选地,培养基不包括脂质体。培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的量或浓度可以是任何合适的量或浓度。例如,培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的浓度可以介于约0.5μL/mL到约10μL/mL之间、介于约0.5μL/mL到约5μL/mL之间、介于约0.5μL/mL到约4.5μL/mL之间、介于约0.5μL/mL到约4μL/mL之间、介于约0.5μL/mL到约3.5μL/mL之间、介于约0.5μL/mL到约3μL/mL之间、介于约0.5μL/mL到约2.5μL/mL之间、介于约0.5μL/mL到约2μL/mL之间、介于约0.5μL/mL到约1.5μL/mL之间、介于约0.5μL/mL到约1μL/mL之间、介于约1μL/mL到约10μL/mL之间、介于约1μL/mL到约5μL/mL之间、介于约1μL/mL到约4.5μL/mL之间、介于约1μL/mL到约4μL/mL之间、介于约1μL/mL到约3.5μL/mL之间、介于约1μL/mL到约3μL/mL之间、介于约1μL/mL到约2.5μL/mL之间、介于约1μL/mL到约2μL/mL之间、介于约1μL/mL到约1.5μL/mL之间、介于约1.5μL/mL到约10μL/mL之间、介于约1.5μL/mL到约5μL/mL之间、介于约1.5μL/mL到约4.5μL/mL之间、介于约1.5μL/mL到约4μL/mL之间、介于约1.5μL/mL到约3.5μL/mL之间、介于约1.5μL/mL到约3μL/mL之间、介于约1.5μL/mL到约2.5μL/mL之间、介于约1.5μL/mL到约2μL/mL之间、介于约2μL/mL到约10μL/mL之间、介于约2μL/mL到约5μL/mL之间、介于约2μL/mL到约4.5μL/mL之间、介于约2μL/mL到约4μL/mL之间、介于约2μL/mL到约3.5μL/mL之间、介于约2μL/mL到约3μL/mL之间或介于约2μL/mL到约2.5μL/mL的培养基(例如,新鲜培养基)。例如,培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的浓度可以介于约1.5μL/mL与约4μL/mL之间或可以为约1.5μL/mL、约2μL/mL、约2.5μL/mL、约3μL/mL、约3.5μL/mL或约4μL/mL。

tau细胞间传播也可能是由含有聚集体的细胞分泌的tau聚集活性引起的。例如,Agg[+]细胞,或对成为Agg[+]细胞敏化(例如,对tau接种或tau聚集活性敏化)的细胞可以通过共培养具有Agg[+]细胞的Agg[-]Cas/tau生物传感器来产生。同样,Agg[+]细胞,或对成为Agg[+]细胞敏化(例如,对tau接种或tau聚集活性敏化)的细胞可以通过共培养具有Agg[+]细胞的Agg[-]SAM/tau生物传感器来产生。

Agg[+]细胞,或对成为Agg[+]细胞敏化(例如,对tau接种或tau聚集活性敏化)的细胞也可以使用从经培养的tau聚集阳性细胞中采集的条件培养基产生,其中如本文所描述的,tau重复结构域以聚集状态稳定地存在。这是本文实例中公开的“最小接种”。条件培养基是指从经培养的细胞中采集的用过的培养基。所述条件培养基含有由经培养的细胞分泌到培养基中的代谢物、生长因子和细胞外基质蛋白。条件培养基的使用不涉及与Agg[+]细胞共培养(即,原初Agg[-]细胞不与Agg[+]细胞共培养)。作为一个实例,条件培养基可以通过收集已经处于汇合的Agg[+]细胞上的培养基来产生。培养基可以已经处于汇合的Agg[+]细胞上持续约12小时、约24小时、约2天、约3天、约4天、约5天、约6天、约7天、约8天、约9天或约10天。例如,培养基可以已经处于汇合的Agg[+]细胞上持续约1到约7天、约2到约6天、约3到约5天或约4天。然后可以将条件培养基与新鲜培养基一起施加于原初(Agg[-])Cas/tau生物传感器细胞。同样,然后可以将条件培养基与新鲜培养基一起施加于原初(Agg[-])SAM/tau生物传感器细胞。条件培养基与新鲜培养基的比率可以是例如约10:1、约9:1、约8:1、约7:1、约6:1、约5:1、约4:1、约3:1、约2:1、约1:1、约1:2、约1:3、约1:4、约1:5、约1:6、约1:7、约1:8、约1:9或约1:10。例如,条件培养基与新鲜培养基的比率可以是约5:1到约1:1、约4:1到约2:1或约3:1。例如,条件培养基的使用可以包括在以下中培养经基因修饰的细胞群体:约90%条件培养基和约10%新鲜培养基、约85%条件培养基和约15%新鲜培养基、约80%条件培养基和约20%新鲜培养基、约75%条件培养基和约25%新鲜培养基、约70%条件培养基和约30%新鲜培养基、约65%条件培养基和约35%新鲜培养基、约60%条件培养基和约40%新鲜培养基、约55%条件培养基和约45%新鲜培养基、约50%条件培养基和约50%新鲜培养基、约45%条件培养基和约55%新鲜培养基、约40%条件培养基和约60%新鲜培养基、约35%条件培养基和约65%新鲜培养基、约30%条件培养基和约70%新鲜培养基、约25%条件培养基和约75%新鲜培养基、约20%条件培养基和约80%新鲜培养基、约15%条件培养基和约85%新鲜培养基或约10%条件培养基和约90%新鲜培养基。在一个实例中,条件培养基的使用可以包括在包括至少约50%条件培养基和不超过约50%新鲜培养基的培养基中培养经基因修饰的细胞群体。在具体实例中,条件培养基的使用可以包括在约75%条件培养基和约25%新鲜培养基中培养经基因修饰的细胞群体。任选地,将条件培养基施加于不含脂质体或不含质脂体(例如,阳离子质脂体)或不含磷脂的原初Agg[-]细胞。任选地,所述经基因修饰的细胞群体不与所述tau聚集阳性细胞共培养,其中tau重复结构域以聚集状态稳定地存在。

不具有共培养的条件培养基之前没有在此上下文中用作接种剂。然而,条件培养基对于大规模全基因组筛选特别有用,因为体外产生的tau纤维是有限的资源。另外,条件培养基更具有生理相关性,因为其是由细胞产生和分泌的,而不是在体外产生和分泌的。如本文所描述的条件培养基的使用提供了tau接种活性的增强(例如,如本文别处公开的通过FRET诱导测量的约0.1%)以使细胞对tau聚集敏化。

C.体外培养和条件培养基

本文还公开了包括本文所公开的Cas/tau生物传感器细胞和用于培养那些细胞的培养基的体外培养物或组合物。本文还公开了包括本文所公开的SAM/tau生物传感器细胞和用于培养那些细胞的培养基的体外培养物或组合物。细胞可以是Agg[-]细胞或Agg[+]细胞。例如,培养物或组合物可以包括Agg[-]细胞。在一个实例中,培养基包括来自如本文别处所公开的Agg[+]细胞的条件培养基。任选地,培养物或组合物中的细胞是Agg[-]细胞并且不与Agg[+]细胞共培养。培养基可以包括条件培养基和新鲜培养基的混合物。作为一个实例,条件培养基与新鲜培养基的比率可以是例如约10:1、约9:1、约8:1、约7:1、约6:1、约5:1、约4:1、约3:1、约2:1、约1:1、约1:2、约1:3、约1:4、约1:5、约1:6、约1:7、约1:8、约1:9或约1:10。例如,条件培养基与新鲜培养基的比率可以是约5:1到约1:1、约4:1到约2:1或约3:1。例如,条件培养基的使用可以包括在以下中培养经基因修饰的细胞群体:约90%条件培养基和约10%新鲜培养基、约85%条件培养基和约15%新鲜培养基、约80%条件培养基和约20%新鲜培养基、约75%条件培养基和约25%新鲜培养基、约70%条件培养基和约30%新鲜培养基、约65%条件培养基和约35%新鲜培养基、约60%条件培养基和约40%新鲜培养基、约55%条件培养基和约45%新鲜培养基、约50%条件培养基和约50%新鲜培养基、约45%条件培养基和约55%新鲜培养基、约40%条件培养基和约60%新鲜培养基、约35%条件培养基和约65%新鲜培养基、约30%条件培养基和约70%新鲜培养基、约25%条件培养基和约75%新鲜培养基、约20%条件培养基和约80%新鲜培养基、约15%条件培养基和约85%新鲜培养基或约10%条件培养基和约90%新鲜培养基。在一个实例中,条件培养基的使用可以包括在包括至少约50%条件培养基和不超过约50%新鲜培养基的培养基中培养经基因修饰的细胞群体。在具体实例中,条件培养基的使用可以包括在约75%条件培养基和约25%新鲜培养基中培养经基因修饰的细胞群体。任选地,培养基包括脂质体或质脂体(例如,阳离子质脂体)或磷脂。任选地,培养基不包括脂质体或质脂体(例如,阳离子质脂体)或磷脂。任选地,培养基不包括脂质体。

D.包括来自tau聚集阳性细胞的裂解物的体外培养物和培养基

本文还公开了包括本文所公开的Cas/tau生物传感器细胞和用于培养那些细胞的培养基的体外培养物或组合物。本文还公开了包括本文所公开的SAM/tau生物传感器细胞和用于培养那些细胞的培养基的体外培养物或组合物。在一个实例中,培养基包括来自经培养的tau聚集阳性细胞中的细胞裂解物,其中tau重复结构域以聚集状态稳定地存在。细胞可以是Agg[-]细胞或Agg[+]细胞。例如,培养物或组合物可以包括Agg[-]细胞。任选地,培养物或组合物中的细胞是Agg[-]细胞并且不与Agg[+]细胞共培养。培养基可以包括新鲜培养基和细胞裂解物的混合物。

培养基中细胞裂解物的量或浓度可以是任何合适的量或浓度。例如,培养基中的细胞裂解物的浓度可以介于约0.1μg/mL与约50μg/mL之间、介于约0.1μg/mL与约25μg/mL之间、介于约0.1μg/mL与约10μg/mL之间、介于约0.1μg/mL与约5μg/mL之间、介于约0.1μg/mL与约4.5μg/mL之间、介于约0.1μg/mL与约4μg/mL之间、介于约0.1μg/mL与约3.5μg/mL之间、介于约0.1μg/mL与约3μg/mL之间、介于约0.1μg/mL与约2.5μg/mL之间、介于约0.1μg/mL与约2μg/mL之间、介于约0.1μg/mL与约1.5μg/mL之间、介于约0.1μg/mL与约1μg/mL之间、介于约0.5μg/mL与约50μg/mL之间、介于约0.5μg/mL与约25μg/mL之间、介于约0.5μg/mL与约10μg/mL之间、介于约0.5μg/mL与约5μg/mL之间、介于约0.5μg/mL与约4.5μg/mL之间、介于约0.5μg/mL与约4μg/mL之间、介于约0.5μg/mL与约3.5μg/mL之间、介于约0.5μg/mL与约3μg/mL之间、介于约0.5μg/mL与约2.5μg/mL之间、介于约0.5μg/mL与约2μg/mL之间、介于约0.5μg/mL与约1.5μg/mL之间、介于约0.5μg/mL与约1μg/mL之间、介于约1μg/mL与约50μg/mL之间、介于约1μg/mL与约25μg/mL之间、介于约1μg/mL与约10μg/mL之间、介于约1μg/mL与约5μg/mL之间、介于约1μg/mL与约4.5μg/mL之间、介于约1μg/mL与约4μg/mL之间、介于约1μg/mL与约3.5μg/mL之间、介于约1μg/mL与约3μg/mL之间、介于约1μg/mL与约2.5μg/mL之间、介于约1μg/mL与约2μg/mL之间、介于约1μg/mL与约1.5μg/mL之间、介于约1.5μg/mL与约50μg/mL之间、介于约1.5μg/mL与约25μg/mL之间、介于约1.5μg/mL与约10μg/mL之间、介于约1.5μg/mL与约5μg/mL之间、介于约1.5μg/mL与约4.5μg/mL之间、介于约1.5μg/mL与约4μg/mL之间、介于约1.5μg/mL与约3.5μg/mL之间、介于约1.5μg/mL与约3μg/mL之间、介于约1.5μg/mL与约2.5μg/mL之间、介于约1.5μg/mL与约2μg/mL之间、介于约2μg/mL与约50μg/mL之间、介于约2μg/mL与约25μg/mL之间、介于约2μg/mL与约10μg/mL之间、介于约2μg/mL与约5μg/mL之间、介于约2μg/mL与约4.5μg/mL之间、介于约2μg/mL与约4μg/mL之间、介于约2μg/mL与约3.5μg/mL之间、介于约2μg/mL与约3μg/mL之间、介于约2μg/mL与约2.5μg/mL之间、介于约2.5μg/mL与约50μg/mL之间、介于约2.5μg/mL与约25μg/mL之间、介于约2.5μg/mL与约10μg/mL之间、介于约2.5μg/mL与约5μg/mL之间、介于约2.5μg/mL与约4.5μg/mL之间、介于约2.5μg/mL与约4μg/mL之间、介于约2.5μg/mL与约3.5μg/mL或介于约2.5μg/mL与约3μg/mL的培养基(例如,新鲜培养基)。例如,培养基中的细胞裂解物的浓度可以介于约1μg/mL与约5μg/mL之间或浓度可以为约1.5μg/mL、约2μg/mL、约2.5μg/mL、约3μg/mL、约3.5μg/mL、约4μg/mL、约4.5μg/mL或约5μg/mL。任选地,细胞裂解物可以处于缓冲液中,如磷酸盐缓冲盐水。任选地,缓冲液可以包括蛋白酶抑制剂。蛋白酶抑制剂的实例包含但不限于AEBSF、抑肽酶、苯丁抑制素、E-64、亮抑酶肽、胃酶抑素A和乙二胺四乙酸(EDTA)。缓冲液可以包括这些抑制剂中的任何抑制剂或其任何组合(例如,缓冲液可以包括所有这些蛋白酶抑制剂)。

用于产生裂解物的细胞可以收集在缓冲液中,如磷酸盐缓冲盐水。任选地,缓冲液可以包括蛋白酶抑制剂。蛋白酶抑制剂的实例包含但不限于AEBSF、抑肽酶、苯丁抑制素、E-64、亮抑酶肽、胃酶抑素A和乙二胺四乙酸(EDTA)。缓冲液可以包括这些抑制剂中的任何抑制剂或其任何组合(例如,缓冲液可以包括所有这些蛋白酶抑制剂)。

细胞裂解物可以例如通过对tau聚集阳性细胞(例如,收集在缓冲液和蛋白酶抑制剂中的细胞,如上文所描述的)进行超声处理任何合适的时间量来收集。例如,可以将细胞超声处理约1分钟到约6分钟、约1分钟到约5分钟、约1分钟到约4分钟、约1分钟到约3分钟、约2分钟到约6分钟、约2分钟到约5分钟、约2分钟到约4分钟、约2分钟到约3分钟、约2分钟到约6分钟、约3分钟到约5分钟或约3分钟到4分钟。例如,可以将细胞超声处理约2分钟到约4分钟或约3分钟。

任选地,培养基包括脂质体或质脂体(例如,阳离子质脂体)或磷脂或另一种转染剂。任选地,培养基包括脂质体。任选地,培养基不包括脂质体或质脂体(例如,阳离子质脂体)或磷脂或另一种转染剂。任选地,培养基不包括脂质体。培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的量或浓度可以是任何合适的量或浓度。例如,培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的浓度可以介于约0.5μL/mL到约10μL/mL之间、介于约0.5μL/mL到约5μL/mL之间、介于约0.5μL/mL到约4.5μL/mL之间、介于约0.5μL/mL到约4μL/mL之间、介于约0.5μL/mL到约3.5μL/mL之间、介于约0.5μL/mL到约3μL/mL之间、介于约0.5μL/mL到约2.5μL/mL之间、介于约0.5μL/mL到约2μL/mL之间、介于约0.5μL/mL到约1.5μL/mL之间、介于约0.5μL/mL到约1μL/mL之间、介于约1μL/mL到约10μL/mL之间、介于约1μL/mL到约5μL/mL之间、介于约1μL/mL到约4.5μL/mL之间、介于约1μL/mL到约4μL/mL之间、介于约1μL/mL到约3.5μL/mL之间、介于约1μL/mL到约3μL/mL之间、介于约1μL/mL到约2.5μL/mL之间、介于约1μL/mL到约2μL/mL之间、介于约1μL/mL到约1.5μL/mL之间、介于约1.5μL/mL到约10μL/mL之间、介于约1.5μL/mL到约5μL/mL之间、介于约1.5μL/mL到约4.5μL/mL之间、介于约1.5μL/mL到约4μL/mL之间、介于约1.5μL/mL到约3.5μL/mL之间、介于约1.5μL/mL到约3μL/mL之间、介于约1.5μL/mL到约2.5μL/mL之间、介于约1.5μL/mL到约2μL/mL之间、介于约2μL/mL到约10μL/mL之间、介于约2μL/mL到约5μL/mL之间、介于约2μL/mL到约4.5μL/mL之间、介于约2μL/mL到约4μL/mL之间、介于约2μL/mL到约3.5μL/mL之间、介于约2μL/mL到约3μL/mL之间或介于约2μL/mL到约2.5μL/mL的培养基(例如,新鲜培养基)。例如,培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的浓度可以介于约1.5μL/mL与约4μL/mL之间或可以为约1.5μL/mL、约2μL/mL、约2.5μL/mL、约3μL/mL、约3.5μL/mL或约4μL/mL。

III.向导RNA敲除文库

本文公开的CRISPRn筛选方法利用CRISPR向导RNA(gRNA)敲除文库,如全基因组gRNA敲除文库。Cas核酸酶如Cas9可以被编程为通过被设计成靶向特异性靶序列的gRNA在特异性基因组基因座诱导双链断裂。由于Cas蛋白的靶向特异性是由短gRNA赋予的,因此可以进行合并基因组规模的功能筛选。此类文库与如shRNA文库等文库相比具有若干优势,所述shRNA文库通过靶向mRNA来降低蛋白质表达。相比之下,gRNA文库通过在基因的基因组编码区域引入移码突变来实现敲除。

本文公开的CRISPRa筛选方法利用CRISPR向导RNA(gRNA)转录激活文库,如全基因组gRNA转录激活文库。SAM系统可以被编程为通过被设计成靶向特异性靶序列的gRNA在特异性基因组基因座处激活基因的转录。由于Cas蛋白的靶向特异性是由短gRNA赋予的,因此可以进行合并基因组规模的功能筛选。

文库中的gRNA可以靶向任何数量的基因。例如,gRNA可以靶向约50个或更多个基因、约100个或更多个基因、约200个或更多个基因、约300个或更多个基因、约400个或更多个基因、约500个或更多个基因、约1000个或更多个基因、约2000个或更多个基因、约3000个或更多个基因、约4000个或更多个基因、约5000个或更多个基因、约10000个或更多个基因或约20000个或更多个基因。在一些文库中,可以选择gRNA来靶向特定信号传导途径中的基因。一些文库是全基因组文库。

全基因组文库包含靶向基因组中的每个基因的一种或多种gRNA(例如,sgRNA)。靶向基因组可以是任何类型的基因组。例如,基因组可以是真核基因组、哺乳动物基因组、非人类哺乳动物基因组、啮齿动物基因组、小鼠基因组、大鼠基因组或人类基因组。在一个实例中,靶向基因组是人类基因组。

gRNA可以靶向每个单独靶向基因中的任何数量的序列。在一些文库中,多个靶序列平均在所靶向的多个基因中的每个基因中靶向。例如,约2到约10、约2到约9、约2到约8、约2到约7、约2到约6、约2到约5、约2到约4或约2到约3个独特靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。例如,至少约2个、至少约3个、至少约4个、至少约5个或至少约6个独特靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。作为具体实例,约6个靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。作为另一个具体实例,约3个到约6个或约4个到约6个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。

例如,文库可以以每个基因约1个、约2个、约3个、约4个、约5个、约6个、约7个、约8个、约9个或约10个gRNA的平均覆盖率靶向基因。在具体实例中,文库可以以每个基因约3-4个gRNA或每个基因约6个gRNA的平均覆盖率靶向基因。

gRNA可以靶向靶基因中的任何期望的定位。CRISPRn gRNA可以被设计成靶向基因的编码区域,使得对应Cas蛋白的切割将导致移码插入/缺失(indel)突变,从而导致功能丧失等位基因。更具体地,移码突变可以通过靶向DNA双链断裂和通过非同源末端连接(NHEJ)途径的随后诱变修复来实现,所述途径在断裂位点处产生indel。引入到DSB中的indel是随机的,其中一些indel会导致移码突变,从而导致基因过早终止。

在一些CRISPRn文库中,如果可能的话,每个gRNA都靶向组成型外显子。在一些CRISPRn文库中,如果可能的话,每个gRNA都靶向5'组成型外显子。在一些方法中,如果可能的话,每个gRNA靶向第一外显子、第二外显子或第三外显子(来自基因的5'端)。

例如,CRISPRn文库中的gRNA可以靶向组成型外显子。组成型外显子是剪接后始终保守的外显子。跨所有组织表达的外显子可以被视为是gRNA靶向的组成型外显子。文库中的gRNA可以靶向每个基因的5'端附近的组成型外显子。任选地,可以排除每个基因的第一个外显子和最后一个外显子作为潜在靶标。任选地,可以排除含有替代性剪接位点的任何外显子作为潜在靶标。任选地,选择满足上述标准的两个最早的外显子作为潜在靶标。任选地,外显子2和3被选择作为潜在靶标(例如,如果未鉴定出组成型外显子)。另外,可以选择和设计文库中的gRNA,以最小化脱靶效应。

在具体实例中,一个或多个全基因组CRISPRn gRNA文库包括靶向人类基因组中>18,000个基因的5'组成型外显子的sgRNA,其中平均覆盖率为每个基因约6个sgRNA,其中选择每个靶位点以最小化脱靶修饰。

CRISPRa gRNA可以被设计成靶向与基因的转录起始位点相邻的序列。例如,靶序列可以处于转录起始位点的1000个、900个、800个、700个、600个、500个、400个、300个、200个、190个、180个、170个、160个、150个、140个、130个、120个、110个、100个、90个、80个、70个、60个、50个、40个、30个、20个、10个、5或1个碱基对内。例如,CRISPRa库中的每个gRNA都可以靶向转录起始位点上游200bp内的序列。任选地,靶序列处于转录起始位点上游200个碱基对和转录起始位点下游1个碱基对的区域内(-200到+1)。

全基因组文库中的gRNA可以呈任何形式。例如,gRNA文库可以包装在病毒载体中,如逆转录病毒载体、慢病毒载体或腺病毒载体。在具体实例中,gRNA文库被包装在慢病毒载体中。载体可以进一步包括用于促进接受载体的细胞的选择的报告基因或选择标志物。此类报告基因和选择标志物的实例在本文别处公开。作为一个实例,选择标志物可以是赋予药物抗性的选择标志物,如新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶和杀稻瘟素S脱氨酶。另一个示例性选择标志物是博来霉素抗性蛋白,由Sh ble基因(印度异壁链霉菌(Streptoalloteichus hindustanus)博来霉素基因)编码,其赋予吉欧霉素(腐草霉素D1)抗性。例如,可以用药物(例如,嘌呤霉素)选择细胞,使得仅保存用向导RNA构建体转导的细胞以用于进行筛选。

A.向导RNA

“向导RNA”或“gRNA”是与Cas蛋白(例如,Cas9蛋白)结合并将Cas蛋白靶向于靶DNA内的特异性定位的RNA分子。向导RNA可以包括两个区段:“DNA靶向区段”和“蛋白质结合区段”。“区段”包含分子的一部分或区域,如RNA中的连续核苷酸段。一些gRNA,如Cas9的那些,可以包括两个单独的RNA分子:“激活因子RNA”(例如,tracrRNA)和“靶向因子RNA”(例如,CRISPR RNA或crRNA)。其它gRNA是单个RNA分子(单个RNA多核苷酸),所述单个RNA分子也可以被称为“单分子gRNA”、“单向导RNA”或“sgRNA”。参见例如WO 2013/176772、WO 2014/065596、WO 2014/089290、WO 2014/093622、WO2014/099750、WO 2013/142578和WO 2014/131833,所述文献中的每个文献出于所有目的通过引用整体并入。例如,对于Cas9,单向导RNA可以包括(例如,通过接头)与tracrRNA融合的crRNA。例如,对于Cpf1,只需要crRNA就可以实现与靶序列的结合。术语“向导RNA”和“gRNA”包含双分子(即,模块化)gRNA和单分子gRNA两者。

示例性双分子gRNA包括crRNA样(“CRISPR RNA”或“靶向因子RNA”或“crRNA”或“crRNA重复序列”)分子和对应的tracrRNA样(“反式作用CRISPR RNA”或“激活因子RNA”或“tracrRNA”)分子。crRNA包括gRNA的DNA靶向区段(单链)和核苷酸段,所述核苷酸段形成gRNA的蛋白质结合区段的dsRNA双链体的一半。定位于DNA靶向区段下游(3')的crRNA尾部的实例包括GUUUUAGAGCUAUGCU(SEQ ID NO:23)、基本上由其组成或由其组成。本文所公开的DNA靶向区段中的任何DNA靶向区段可以与SEQ ID NO:23的5'端连接以形成crRNA。

对应的tracrRNA(激活因子RNA)包括形成gRNA的蛋白质结合区段的dsRNA双链体的另一半的核苷酸段。crRNA的核苷酸段与tracrRNA的核苷酸段互补并且与其杂交,以形成gRNA的蛋白质结合结构域的dsRNA双链体。因此,每个crRNA可以被视为具有对应的tracrRNA。tracrRNA序列的实例包括AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:24)、基本上由其组成或由其组成。tracrRNA序列的其它实例包括AAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:28)或GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:29)中的任一个、基本上由其组成或由其组成。

在需要crRNA和tracrRNA两者的系统中,crRNA和对应的tracrRNA杂交以形成gRNA。在仅需要crRNA的系统中,crRNA可以是gRNA。crRNA另外提供与靶DNA的互补链杂交的单链DNA靶向区段。如果用于细胞内的修饰,则给定的crRNA或tracrRNA分子的确切序列可以被设计成对将使用RNA分子的物种具有特异性。参见例如,Mali等人(2013)《科学》339:823-826;Jinek等人(2012)《科学》337:816-821;Hwang等人(2013)《自然生物技术》31:227-229;Jiang等人(2013)《自然生物技术》31:233-239;以及Cong等人(2013)《科学》339:819-823,所述文献中的每个文献出于所有目的通过引用整体并入本文。

给定gRNA的DNA靶向区段(crRNA)包括与靶DNA的互补链上的序列互补的核苷酸序列,如下文更详细地描述的。gRNA的DNA靶向区段通过杂交(即,碱基配对)以序列特异性方式与靶DNA相互作用。因此,DNA靶向区段的核苷酸序列可以不同,并且测定gRNA和靶DNA将与其相互作用的靶DNA内的定位。可以修饰主题gRNA的DNA靶向区段以与靶DNA内的任何期望序列杂交。天然存在的crRNA因CRISPR/Cas系统和生物体而不同,但通常含有长度为21到72个核苷酸的由长度为21到46个核苷酸的两个直接重复序列(DR)侧接的靶向区段(参见例如,WO 2014/131833,所述文献出于所有目的通过引用整体并入本文)。在酿脓链球菌的情况下,DR为36个核苷酸长,并且靶向区段为30个核苷酸长。定位于3'的DR与对应的tracrRNA互补并杂交,后者进而与Cas蛋白结合。

DNA靶向区段的长度可以为例如至少约12、15、17、18、19、20、25、30、35或40个核苷酸。此类DNA靶向区段的长度可以为例如约12到约100、约12到约80、约12到约50、约12到约40、约12到约30、约12到约25或约12到约20个核苷酸。例如,DNA靶向区段可以为约15到约25个核苷酸(例如,约17到约20个核苷酸或约17、18、19或20个核苷酸)。参见例如,US 2016/0024523,所述文献出于所有目的通过引用整体并入本文。对于来自酿脓链球菌的Cas9,典型的DNA靶向区段的长度在16与20个核苷酸之间或长度在17与20个核苷酸之间。对于来自金黄色葡萄球菌的Cas9,典型的DNA靶向区段的长度在21与23个核苷酸之间。对于Cpf1,典型的DNA靶向区段的长度为至少16个核苷酸或长度为至少18个核苷酸。

TracrRNA可以呈任何形式(例如,全长tracrRNA或活性部分tracrRNA)并具有不同长度。TracrRNA可以包含初级转录本或经处理的形式。例如,tracrRNA(作为单向导RNA的一部分或作为作为双分子gRNA的一部分的单独分子)可以包括野生型tracrRNA序列(例如,野生型tracrRNA序列的约或超过约20、26、32、45、48、54、63、67、85或更多个核苷酸)、基本上由其组成或由其组成。来自酿脓链球菌的野生型tracrRNA序列的实例包含171-核苷酸、89-核苷酸、75-核苷酸和65-核苷酸版本。参见例如,Deltcheva等人(2011)《自然》471:602-607;WO 2014/093661,所述文献中的每个文献出于所有目的通过引用整体并入本文。单向导RNA(sgRNA)内的tracrRNA的实例包含在+48、+54、+67和+85版本的sgRNA中发现的tracrRNA区段,其中“+n”表示在sgRNA中包含野生型tracrRNA的至多+n个核苷酸。参见US8,697,359,所述文献出于所有目的通过引用整体并入本文。

向导RNA的DNA靶向区段与靶DNA的互补链之间的互补性百分比可以是至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。DNA靶向区段与靶DNA的互补链之间的互补性百分比在约20个连续核苷酸上可以为至少60%。作为实例,DNA靶向区段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'端处的14个连续的核苷酸上可以为100%并且在其余部分上低至0%。在此类情况下,DNA靶向区段可以被视为长度为14个核苷酸。作为另一个实例,DNA靶向区段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'端处的七个连续的核苷酸上可以为100%并且在其余部分上低至0%。在此类情况下,DNA靶向区段可以被视为长度为7个核苷酸。在一些向导RNA中,DNA靶向区段内的至少17个核苷酸与靶DNA的互补链互补。例如,DNA靶向区段的长度可以是20个核苷酸,并且可以包括与靶DNA的互补链的1、2或3个错配。在一个实例中,错配不与对应于原型间隔子相邻基序(PAM)序列的互补链的区域(即,PAM序列的反向补体)相邻(例如,错配处于向导RNA的DNA靶向区段的5'端中,或者错配距离对应于PAM序列的互补链的区域至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或19个碱基对)。

gRNA的蛋白质结合区段可以包括彼此互补的两个核苷酸段。蛋白质结合区段的互补核苷酸杂交形成双链RNA双链体(dsRNA)。主题gRNA的蛋白质结合区段与Cas蛋白相互作用,并且gRNA通过DNA靶向区段将结合的Cas蛋白引导到靶DNA内的特异性核苷酸序列。

单向导RNA可以包括DNA靶向区段和支架序列(即,向导RNA的蛋白质结合或Cas结合序列)。例如,此类向导RNA可以具有连接到3'支架序列的5'DNA靶向区段。示例性支架序列包括以下、基本上由以下组成或由以下组成:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1;SEQ ID NO:17);GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2;SEQ ID NO:18);GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3;SEQ ID NO:19);以及GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4;SEQ ID NO:20)。其它示例性支架序列包括以下、基本上由以下组成或由以下组成:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(版本5;SEQ ID NO:30);GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(版本6;SEQ ID NO:31);或GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(版本7;SEQ ID NO:32)。靶向本文所公开的向导RNA靶序列中的任何向导RNA靶序列的向导RNA可以包含例如与向导RNA的3'端上的示例性向导RNA支架序列中的任何支架序列融合的向导RNA的5'端上的DNA靶向区段。即,本文所公开的DNA靶向区段中的任何DNA靶向区段可以与上述支架序列中的任何支架序列的5'端连接以形成单向导RNA(嵌合向导RNA)。

向导RNA可以包含提供另外的期望特征的修饰或序列(例如,经修饰或调节的稳定性;亚细胞靶向;用荧光标记机芯追踪;蛋白质或蛋白质复合物的结合位点;等等)。此类修饰的实例包含例如5'帽(例如,7-甲基鸟苷酸帽(m7G));3'聚腺苷酸化尾部(即,3'poly(A)尾部);核糖开关序列(例如,允许蛋白质和/或蛋白质复合物调节稳定性和/或调节可及性);稳定性控制序列;形成dsRNA双链体的序列(即,发夹);将RNA靶向到亚细胞定位(例如,细胞核、线粒体、叶绿体等)的修饰或序列;提供跟踪的修饰或序列(例如,与荧光分子的直接缀合、与促进荧光检测的部分缀合、允许荧光检测的序列等);为蛋白质(例如,作用于DNA的蛋白质,包含转录激活因子、转录抑制因子、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶等)提供结合位点的修饰或序列;以及其组合。修饰的其它实例包含工程化茎环双链体结构、工程化凸起区域、茎环双链体结构的工程化发夹3'或其任何组合。参见例如,US 2015/0376586,所述文献出于所有目的通过引用整体并入本文。凸起可以是由crRNA样区域和最小tracrRNA样区域构成的双链体内的核苷酸的未配对区域。凸起在双链体的一侧可以包括未配对的5′-XXXY-3′,其中X是任何嘌呤,并且Y可以是可以与相对链上的核苷酸形成摇摆对的核苷酸;并且在双链体的另一侧包括未配对核苷酸区域。

在一些情况下,可以使用包括与MS2-p65-HSF1配对的dCas9-VP64融合蛋白的转录激活系统。此类系统中的向导RNA可以被设计成具有附加到sgRNA四环和茎环2的适体序列,所述适体序列被设计成结合二聚化MS2噬菌体外壳蛋白。参见例如,Konermann等人(2015)《自然》517(7536):583-588,所述文献出于所有目的通过引用整体并入本文。

未经修饰的核酸易于降解。外源性核酸也可以诱导先天免疫应答。修饰可以有助于引入稳定性并降低免疫原性。向导RNA可以包括经修饰的核苷和经修饰的核苷酸,包含例如以下中的一种或多种:(1)磷酸二酯骨架键中的非连接磷酸氧中的一个或两个和/或连接磷酸氧中的一个或多个的改变或替代;(2)核糖成分的改变或替代,如核糖上的2'羟基的改变或替代;(3)用脱磷接头替代磷酸部分;(4)天然存在的核碱基的修饰或替代;(5)核糖磷酸骨架的替代或修饰;(6)寡核苷酸3'端或5'的修饰(例如,末端磷酸基团的去除、修饰或替代或部分的缀合);以及(7)糖的修饰。其它可能的向导RNA修饰包含尿嘧啶或聚尿嘧啶束的修饰或替代。参见例如WO 2015/048577和US 2016/0237455,所述文献中的每个文献出于所有目的通过引用整体并入。可以对Cas编码核酸如Cas mRNA进行类似的修饰。例如,CasmRNA可以通过使用同义密码子对尿苷进行缺失来修饰。

作为一个实例,向导RNA的5'端或3'端的核苷酸可以包含硫代磷酸酯键(例如,碱基可以具有经修饰的磷酸酯基团,即硫代磷酸酯基团)。例如,向导RNA可以包含向导RNA的5'或3'端处的2、3或4个末端核苷酸之间的硫代磷酸酯键。作为另一个实例,向导RNA的5'和/或3'端的核苷酸可以具有2'-O-甲基修饰。例如,向导RNA可以包含向导RNA的5'和/或3'端(例如,5'端)的2、3或4个末端核苷酸处的2'-O-甲基修饰。参见例如WO 2017/173054 A1和Finn等人(2018)《细胞报告(Cell Reports)》22:1-9,所述文献中的每个文献出于所有目的通过引用整体并入。其它可能的修饰在本文别处更详细地描述。在具体实例中,向导RNA包含前三个5'和3'末端RNA残基处的2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。此类化学修饰可以例如提供更大的稳定性和防止核酸外切酶向导RNA,允许所述向导RNA比未经修饰的向导RNA在细胞内持续更长时间。此类化学修饰还可以例如防止先天细胞内免疫应答,所述免疫应答可以主动降解RNA或触发导致细胞死亡的免疫级联。

在一些向导RNA(例如,单向导RNA)中,向导RNA的至少一个环(例如,两个环)通过插入与一个或多个衔接子(即,衔接蛋白或结构域)结合的不同RNA序列而被修饰.此类衔接蛋白可以用于进一步募集一个或多个异源功能结构域,如转录激活结构域(例如,用于SAM/tau生物传感器细胞中的CRISPRa筛选)。包括此类衔接蛋白(即,嵌合衔接蛋白)的融合蛋白的实例在本文别处公开。例如,MS2结合环ggccAACAUGAGGAUCACCCAUGUCUGCAGggcc(SEQ IDNO:33)可以替代SEQ ID NO:17或SEQ ID NO:19(或SEQ ID NO:30或31)中所示的sgRNA支架(骨架)或WO 2016/049258和Konermann等人(2015)《自然》517(7536):583-588中所描述的酿脓链球菌CRISPR/Cas9系统的sgRNA骨架的核苷酸+13到+16和核苷酸+53到+56,所述文献中的每个文献出于所有目的通过引用整体并入本文。还参见US 2019-0284572和WO 2019/183123,所述文献中的每个文献出于所有目的通过引用整体并入。本文所使用的向导RNA编号是指向导RNA支架序列(即,向导RNA的DNA靶向区段下游的序列)中的核苷酸编号。例如,向导RNA支架的第一个核苷酸是+1,支架的第二个核苷酸是+2,等等。与SEQ ID NO:17或SEQID NO:19(或SEQ ID NO:30或31)中的核苷酸+13到+16相对应的残基是跨越SEQ ID NO:17或SEQ ID NO:19(或SEQ ID NO:30或31)中的核苷酸+9到+21的区域(本文中被称为四环的区域)中的环序列。与SEQ ID NO:17或SEQ ID NO:19(或SEQ ID NO:30或31)中的核苷酸+53到+56相对应的残基是跨越SEQ ID NO:17或SEQ ID NO:19(或SEQ ID NO:30或31)中的核苷酸+48到+61的区域(本文中被称为茎环2的区域)中的环序列。SEQ ID NO:17或SEQ ID NO:19(或SEQ ID NO:30或31)中的其它茎环序列包括茎环1(核苷酸+33到+41)和茎环3(核苷酸+63到+75)。所得结构是其中四环和茎环2序列中的每一个都被MS2结合环替代的sgRNA支架。四环和茎环2以使得添加MS2结合环不应干扰任何Cas9残基的方式从Cas9蛋白中突出。另外地,四环和茎环2位点与DNA的接近表明定位到这些定位可能导致DNA与任何募集的蛋白质如转录激活因子之间的高度相互作用。因此,在一些sgRNA中,对应于SEQ ID NO:17或SEQ ID NO:19(或SEQ ID NO:30或31)中所示的向导RNA支架的+13到+16的核苷酸和/或对应于+53到+56的核苷酸或对应残基在与这些支架/骨架中的任何支架/骨架最佳比对时被能够与一种或多种衔接蛋白或结构域结合的不同RNA序列所替代。可替代地或另外地,可以将衔接结合序列添加到向导RNA的5'端或3'端。在四环和茎环2区域中包括MS2结合环的示例性向导RNA支架可以包括SEQ ID NO:34中所示的序列、基本上由所述序列组成或由所述序列组成。在四环和茎环2区域中包括MS2结合环的示例性通用单向导RNA可以包括SEQ IDNO:35中所示的序列、基本上由所述序列组成或由所述序列组成。

可以以任何形式提供向导RNA。例如,gRNA可以以RNA的形式提供,作为两个分子(单独的crRNA和tracrRNA)或作为一个分子(sgRNA),并且任选地以与Cas蛋白的复合物的形式提供。gRNA也可以以对gRNA进行编码的DNA的形式提供。对gRNA进行编码的DNA可以编码单个RNA分子(sgRNA)或单独的RNA分子(例如,单独的crRNA和tracrRNA)。在后一种情况下,对gRNA进行编码的DNA可以作为一个DNA分子或作为分别对crRNA和tracrRNA进行编码的单独DNA分子提供。

当gRNA以DNA的形式提供时,gRNA可以在细胞中瞬时、有条件或组成型表达。对gRNA进行编码的DNA可以稳定地整合到细胞的基因组中,并且与在细胞中具有活性的启动子可操作地连接。可替代地,对gRNA进行编码的DNA可以与表达构建体中的启动子可操作地连接。例如,对gRNA进行编码的DNA可以处于包括异源核酸如对Cas蛋白进行编码的核酸的载体中。可替代地,对gRNA进行编码的DNA可以处于与包括对Cas蛋白进行编码的核酸的载体分开的载体或质粒中。可以用于此类表达构建体的启动子包含在例如真核细胞、人类细胞、非人类细胞、哺乳动物细胞、非人类哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导多能干(iPS)细胞或单细胞阶段胚胎中的一种或多种细胞中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。此类启动子也可以是例如双向启动子。合适启动子的具体实例包含RNA聚合酶III启动子,如人U6启动子、大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。

可替代地,可以通过各种其它方法制备gRNA。例如,可以使用例如T7 RNA聚合酶通过体外转录制备gRNA(参见例如,WO 2014/089290和WO 2014/065596,所述文献中的每个文献出于所有目的通过引用整体并入)。向导RNA也可以是通过化学合成制备的合成产生的分子。例如,可以化学合成向导RNA以在前三个5'和3'端RNA残基处包含2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。

向导RNA(或对向导RNA进行编码的核酸)可以处于包括一个或多个向导RNA(例如,1、2、3、4或更多个向导RNA)和增加向导RNA的稳定性(例如,延长在给定的储存条件(例如,-20℃、4℃或环境温度)下降解产物保持在阈值以下的时间,如低于起始核酸或蛋白质重量的0.5%;或增加体内稳定性)的载体的组合物中。此类载体的非限制性实例包含聚(乳酸)(PLA)微球、聚(D,L-乳酸-共乙醇酸)(PLGA)微球、质脂体、胶束、反胶束、脂质螺旋体和脂质微管。此类组合物可以进一步包括Cas蛋白,如Cas9蛋白,或对Cas蛋白进行编码的核酸。

B.向导RNA靶序列

用于向导RNA的靶DNA包含存在于gRNA的DNA靶向区段将与其结合的DNA中的核酸序列,条件是存在足够的结合条件。合适的DNA/RNA结合条件包含细胞中通常存在的生理条件。其它合适的DNA/RNA结合条件(例如,无细胞系统中的条件)是本领域已知的(参见例如,分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》第3版(Sambrook等人,冷泉港实验室出版社(Harbor Laboratory Press)2001),所述文献出于所有目的通过引用整体并入本文)。与gRNA互补并杂交的靶DNA的链可以被称为“互补链”,并且与“互补链”互补(并且因此不与Cas蛋白或gRNA互补)的靶DNA的链可以称为“非互补链”或“模板链”。

靶DNA包含向导RNA与其杂交的互补链上的序列和非互补链上的对应序列(例如,与原型间隔子相邻基序(PAM)相邻)两者。如本文所使用的,术语“向导RNA靶序列”具体指非互补链上的与向导RNA在互补链上与其杂交的序列相对应(即,其反向补体)的序列。即,向导RNA靶序列是指非互补链上的与PAM相邻(例如,在Cas9的情况下,PAM的上游或5')的序列。向导RNA靶序列相当于向导RNA的DNA靶向区段,但具有胸腺嘧啶而不是尿嘧啶。作为一个实例,SpCas9酶的向导RNA靶序列可以指非互补链上的5'-NGG-3'PAM上游的序列。向导RNA被设计成与靶DNA的互补链具有互补性,其中向导RNA的DNA靶向区段与靶DNA的互补链之间的杂交促进CRISPR复合物的形成。不一定需要完全互补,条件是存在足够的互补性来引起杂交并促进CRISPR复合物的形成。如果向导RNA在本文被称为靶向向导RNA靶序列,这意指向导RNA与靶DNA的互补链序列杂交,所述互补链序列是非互补链上的向导RNA靶序列的反向补体。

靶DNA或向导RNA靶序列可以包括任何多核苷酸,并且可以定位于例如细胞的细胞核或细胞质中或细胞的细胞器如线粒体或叶绿体内。靶DNA或向导RNA靶序列可以是细胞内源性或外源性的任何核酸序列。向导RNA靶序列可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调节序列)或可以包含两者。

对于CRISPRa和SAM系统,可能优选的是靶序列与基因的转录起始位点相邻。例如,靶序列可以处于转录起始位点的1000个、900个、800个、700个、600个、500个、400个、300个、200个、190个、180个、170个、160个、150个、140个、130个、120个、110个、100个、90个、80个、70个、60个、50个、40个、30个、20个、10个、5或1个碱基对内。任选地,靶序列处于转录起始位点上游200个碱基对和转录起始位点下游1个碱基对的区域内(-200到+1)。

Cas蛋白对靶DNA的位点特异性结合和切割可以发生在由(i)向导RNA与靶DNA的互补链之间的碱基配对互补性和(ii)靶DNA的非互补链中的短基序(被称为原型间隔子相邻基序(PAM))两者测定的定位处。PAM可以侧接向导RNA靶序列。任选地,向导RNA靶序列可以侧接在PAM的3'端上(例如,对于Cas9)。可替代地,向导RNA靶序列可以侧接在PAM的5'端上(例如,对于Cpf1)。例如,Cas蛋白的切割位点可以是PAM序列上游或下游(例如,向导RNA靶序列内)的约1到约10或约2到约5个碱基对(例如,3个碱基对)。在SpCas9的情况下,PAM序列(即,非互补链上)可以是5'-N1GG-3',其中N1是任何DNA核苷酸,并且PAM紧接着靶DNA的非互补链上的向导RNA靶序列的3'。因此,对应于互补链上的PAM的序列(即,反向补体)将是5'-CCN2-3',其中N2是任何DNA核苷酸并且紧接着向导RNA的DNA靶向区段在靶DNA的互补链上与其杂交的序列的5'。在一些此类情况下,N1和N2可以是互补的,并且N1-N2碱基对可以是任何碱基对(例如,N1=C并且N2=G;N1=G并且N2=C;N1=A并且N2=T;或N1=T,并且N2=A)。对于来自金黄色葡萄球菌的Cas9,PAM可以是NNGRRT或NNGRR,其中N可以是A、G、C或T,并且R可以是G或A。在来自空肠弯曲杆菌的Cas9的情况下,PAM可以是例如NNNNACAC或NNNNRYAC,其中N可以是A、G、C或T,并且R可以是G或A。在一些情况下(例如,对于FnCpf1),PAM序列可以处于5'端的上游并且具有序列5'-TTN-3'。

向导RNA靶序列的实例是紧接在SpCas9蛋白识别的NGG基序之前的20个核苷酸的DNA序列。例如,向导RNA靶序列加PAM的两个实例是GN19NGG(SEQ ID NO:25)或N20NGG(SEQID NO:26)。参见例如,WO 2014/165825,所述文献出于所有目的通过引用整体并入本文。5'端的鸟嘌呤可以促进细胞中RNA聚合酶的转录。向导RNA靶序列加PAM的其它实例可以包含5'端的两个鸟嘌呤核苷酸(例如,GGN20NGG;SEQ ID NO:27)用于促进体外T7聚合酶的有效转录。参见例如,WO 2014/065596,所述文献出于所有目的通过引用整体并入本文。其它向导RNA靶序列加PAM可以具有4-22个核苷酸长度的SEQ ID NO:25-27,包含5'G或GG和3'GG或NGG。又其它向导RNA靶序列加PAM可以具有14和20个核苷酸长度的SEQ ID NO:25-27。

与靶DNA杂交的CRISPR复合物的形成可以导致在对应于向导RNA靶序列(即,靶DNA的非互补链上的向导RNA靶序列和互补链上的向导RNA与其杂交的反向补体)的区域内或附近的靶DNA的一条或两条链的切割。例如,切割位点可以处于向导RNA靶序列内(例如,处于相对于PAM序列的所定义的定位处)。“切割位点”包含Cas蛋白产生单链断裂或双链断裂的靶DNA的位置。切割位点可以仅在双链DNA的一条链上(例如,当使用切口酶时)或在两条链上。切割位点可以在两条链上的相同位置(产生平末端;例如Cas9))或可以在每条链上的不同位点(产生交错末端(即,突出端);例如,Cpf1)。例如,可以通过使用两种Cas蛋白产生交错末端,其中每一种在不同链的不同切割位点处产生单链断裂,从而产生双链断裂。例如,第一切口酶可以在双链DNA(dsDNA)的第一条链上产生单链断裂,并且第二切口酶可以在dsDNA的第二条链上产生单链断裂,使得产生突出序列。在一些情况下,第一条链上的切口酶的向导RNA靶序列或切割位点与第二条链上的切口酶的向导RNA靶序列或切割位点相隔至少2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、75、100、250、500或1,000个碱基对。

IV.筛选tau接种或聚集基因修饰因子的方法

本文公开的Cas/tau生物传感器细胞系可以用于筛选tau接种或聚集基因修饰因子的方法。此类方法可以包括提供如本文别处所公开的Cas/tau生物传感器细胞群体,引入包括多个独特向导RNA的文库以及评估靶向细胞中的tau接种或聚集。

作为一个实例,方法可以包括提供Cas/tau生物传感器细胞群体(例如,包括Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域的细胞群体),将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中并且培养所述细胞群体以允许基因组编辑和扩增。所述多个独特向导RNA与所述Cas蛋白形成复合物,并且所述Cas蛋白切割所述多个基因导致基因功能敲除以产生经基因修饰的细胞群体。然后可以使经基因修饰的细胞群体与tau接种剂接触以产生经接种的细胞群体。可以培养经接种的细胞群体以允许形成tau聚集体,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的子集中形成以产生聚集阳性细胞群体。最后,相对于在引入向导RNA文库之后培养的细胞群体,可以测定在聚集阳性细胞群体中多个独特向导RNA中的每个独特向导RNA的丰度。相对于引入向导RNA文库之后培养的细胞群体,聚集阳性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的破坏增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏增强tau聚集。

类似地,本文所公开的SAM/tau生物传感器细胞系可以用于筛选tau接种或聚集基因修饰因子的方法。此类方法可以包括提供如本文别处所公开的SAM/tau生物传感器细胞群体、引入包括多个独特向导RNA的文库以及评估靶向细胞中的tau接种或聚集。

作为一个实例,方法可以包括提供SAM/tau生物传感器细胞群体(例如,细胞群体,所述细胞群体包括包含与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白的嵌合Cas蛋白、包含与一个或多个转录激活结构域融合的衔接蛋白的嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域),将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中并且培养所述细胞群体以允许转录激活和扩增。所述多个独特向导RNA与嵌合Cas蛋白和嵌合衔接蛋白形成复合物,并且所述复合物激活所述多个基因的转录导致基因表达和经修饰的细胞群体增加。然后可以使经修饰的细胞群体与tau接种剂接触以产生经接种的细胞群体。可以培养经接种的细胞群体以允许形成tau聚集体,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的子集中形成以产生聚集阳性细胞群体。最后,相对于在引入向导RNA文库之后培养的细胞群体,可以测定在聚集阳性细胞群体中多个独特向导RNA中的每个独特向导RNA的丰度。相对于引入向导RNA文库之后培养的细胞群体,聚集阳性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的转录激活增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活增强tau聚集。

所述方法中使用的Cas/tau生物传感器细胞可以是本文别处所公开的Cas/tau生物传感器细胞中的任何生物传感器细胞。同样,所述方法中使用的SAM/tau生物传感器细胞可以是本文别处所公开的SAM/tau生物传感器细胞中的任何生物传感器细胞。第一tau重复结构域和第二tau重复结构域可以不同或可以类似或相同。tau重复结构域可以是本文别处所公开的tau重复结构域中的任何重复结构域。例如,第一tau重复结构域和/或第二tau重复结构域可以是野生型tau重复结构域或可以包括促聚集突变(例如,致病性促聚集突变),如tau P301S突变。第一tau重复结构域和/或第二tau重复结构域可以包括tau四重复结构域。作为一个具体实例,第一tau重复结构域和/或第二tau重复结构域可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:11或与SEQ ID NO:11至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。在一个具体实例中,对tau重复结构域进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:12或与SEQID NO:12至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:11。

第一tau重复结构域可以通过任何方式连接到第一报告基因,并且第二tau重复结构域可以连接到第二报告基因。例如,报告基因可以与tau重复结构域融合(例如,作为融合蛋白的一部分)。报告蛋白可以是当连接到第一报告基因的第一tau重复结构域与连接到第二报告基因的第二tau重复结构域聚集时产生可检测信号的任何一对报告蛋白。作为一个实例,第一报告基因和第二报告基因可以是分裂荧光素酶蛋白。作为另一个实例,第一报告蛋白和第二报告蛋白可以是荧光共振能量转移(FRET)对。FRET是一种物理现象,其中处于其激发状态的供体荧光团以非辐射方式将其激发能量转移到相邻的受体荧光团,从而使受体发射其特征性荧光。FRET对(供体和受体荧光团)的实例是众所周知的。参见例如,Bajar等人(2016)《传感器(Sensors)》巴塞尔(Basel)16(9):1488,所述文献出于所有目的通过引用整体并入本文。作为FRET对的一个具体实例,第一报告基因可以是青色荧光蛋白(CFP),并且第二报告基因可以是黄色荧光蛋白(YFP)。作为具体实例,CFP可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:13或与SEQ ID NO:13至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。作为另一个具体实例,YFP可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:15或与SEQ ID NO:15至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。

对于Cas/tau生物传感器细胞,Cas蛋白可以是本文别处所公开的任何Cas蛋白。作为一个实例,Cas蛋白可以是Cas9蛋白。例如,Cas9蛋白可以是酿脓链球菌Cas9蛋白。作为一个具体实例,Cas蛋白可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:21或与SEQ ID NO:21至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。

Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部在所述细胞群体中稳定地表达。例如,对Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部进行编码的核酸可以在基因组上整合在所述细胞群体中。在一个具体实例中,对Cas蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQID NO:22或与SEQ ID NO:22至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:21。

对于SAM/tau生物传感器细胞,Cas蛋白可以是本文别处所公开的任何Cas蛋白。作为一个实例,Cas蛋白可以是Cas9蛋白。例如,Cas9蛋白可以是酿脓链球菌Cas9蛋白。作为一个具体实例,嵌合Cas蛋白可以包括与VP64转录激活结构域融合的核酸酶失活Cas蛋白。例如,嵌合Cas蛋白质可以从N端到C端包括:所述核酸酶失活Cas蛋白;核定位信号;以及所述VP64转录激活结构域。作为一个具体实例,衔接蛋白可以是MS2外壳蛋白,并且嵌合衔接蛋白中的一个或多个转录激活结构域可以包括p65转录激活结构域和HSF1转录激活结构域。例如,嵌合衔接蛋白质可以从N端到C端包括:所述MS2外壳蛋白;核定位信号;所述p65转录激活结构域;以及所述HSF1转录激活结构域。在一个具体实例中,对嵌合Cas蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:38或与SEQ ID NO:38至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:36。在一个具体实例中,对嵌合衔接蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:39或与SEQ ID NO:39至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:37。

嵌合Cas蛋白、嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部在所述细胞群体中稳定地表达。例如,对嵌合Cas蛋白、嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部进行编码的核酸可以在基因组上整合在所述细胞群体中。

如本文别处所公开的,细胞可以是任何类型的细胞。例如,细胞可以是真核细胞、哺乳动物细胞或人类细胞(例如,HEK293T细胞或神经元细胞)。

可以通过任何已知的方式将多个独特向导RNA引入到细胞群体中。在一些方法中,通过病毒转导如逆转录病毒、腺病毒或慢病毒转导将向导RNA引入到细胞群体中。在一个具体的实例中,可以通过慢病毒转导引入向导RNA。多个独特向导RNA中的每个独特向导RNA都可以处于单独的病毒载体中。细胞群体可以在任何感染复数下被感染。例如,感染复数可以介于约0.1与约1.0之间、介于约0.1与约0.9之间、介于约0.1与约0.8之间、介于约0.1与约0.7之间、介于约0.1与约0.6之间、介于约0.1与约0.5之间、介于约0.1与约0.4之间或介于约0.1与约0.3之间。可替代地,感染复数可以小于约1.0、小于约0.9、小于约0.8、小于约0.7、小于约0.6、小于约0.5、小于约0.4、小于约0.3或小于约0.2。在具体实例中,感染复数可以小于约0.3。

可以将向导RNA与选择标志物或报告基因一起引入到细胞群体中以选择具有向导RNA的细胞,并且所述方法可以进一步包括选择包括选择标志物或报告基因的细胞。选择标志物和报告基因的实例在本文别处提供。作为一个实例,选择标志物可以是赋予药物抗性的选择标志物,如新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶和杀稻瘟素S脱氨酶。另一个示例性选择标志物是博来霉素抗性蛋白,由Sh ble基因(印度异壁链霉菌(Streptoalloteichus hindustanus)博来霉素基因)编码,其赋予吉欧霉素(腐草霉素D1)抗性。例如,可以用药物(例如,嘌呤霉素)选择细胞,使得仅保存用向导RNA构建体转导的细胞以用于进行筛选。例如,药物可以是嘌呤霉素或吉欧霉素(腐草霉素D1)。

在一些方法中,以选择的浓度引入所述多个独特向导RNA,使得大多数细胞仅接受所述独特向导RNA之一。例如,如果向导RNA是通过病毒转导引入的,则细胞可以以低感染复数进行感染,以确保大多数细胞以高概率仅接收一种病毒构建体。作为一个具体实例,感染复数可以小于约0.3。

多个独特向导RNA被引入到其中的细胞群体可以是任何合适数量的细胞。例如,细胞群体可以包括每个独特向导RNA大于约50个、大于约100个、大于约200个、大于约300个、大于约400个、大于约500个、大于约600个、大于约700个、大于约800个、大于约900个或大于约1000个细胞。在一个具体实例中,细胞群体包括每个独特向导RNA大于约300个细胞或大于约500个细胞。

多个独特向导RNA可以靶向任何数量的基因。例如,多个独特向导RNA可以靶向约50个或更多个基因、约100个或更多个基因、约200个或更多个基因、约300个或更多个基因、约400个或更多个基因、约500个或更多个基因、约1000个或更多个基因、约2000个或更多个基因、约3000个或更多个基因、约4000个或更多个基因、约5000个或更多个基因、约10000个或更多个基因或约20000个或更多个基因。在一些方法中,可以选择向导RNA来靶向特定信号传导途径中的基因。在一些方法中,独特向导RNA文库是全基因组文库。

多个独特向导RNA可以靶向每个单独靶向基因中的任何数量的序列。在一些方法中,多个靶序列平均在所靶向的多个基因中的每个基因中靶向。例如,约2到约10、约2到约9、约2到约8、约2到约7、约2到约6、约2到约5、约2到约4或约2到约3个独特靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。例如,至少约2个、至少约3个、至少约4个、至少约5个或至少约6个独特靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。作为具体实例,约6个靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。作为另一个具体实例,约3个到约6个或约4个到约6个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。

向导RNA可以靶向靶基因中的任何期望的定位。在一些使用Cas/tau生物传感器细胞的CRISPRn方法中,如果可能的话,每个向导RNA都靶向组成型外显子。在一些方法中,如果可能的话,每个向导RNA都靶向5'组成型外显子。在一些方法中,如果可能的话,每个向导RNA靶向第一外显子、第二外显子或第三外显子(来自基因的5'端)。在一些使用SAM/tau生物传感器细胞的CRISPRa方法中,如果可能的话,每个向导RNA可以靶向转录起始位点上游200bp内的向导RNA靶序列。在使用SAM/tau生物传感器细胞的一些CRISPRa方法中,其中每个向导RNA可以包括嵌合衔接蛋白可以与其特异性结合的一个或多个衔接结合元件。在一个实例中,每个向导RNA包括嵌合衔接蛋白可以与其特异性结合的两个衔接结合元件,任选地其中第一衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第二环内。例如,衔接结合元件可以包括SEQ ID NO:33中所示的序列。在具体实例中,一个或多个向导RNA中的每个向导RNA是包括与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPR RNA(crRNA)部分的单向导RNA,并且所述第一环是与SEQ ID NO:17、19、30或31的残基13-16相对应的四环,并且所述第二环是与SEQ ID NO:17、19、30或31的残基53-56相对应的茎环2。

培养细胞群体以允许基因组编辑和扩增的步骤可以是任何合适的时间段。例如,培养可以持续约2天与约10天之间、约3天与约9天之间、约4天与约8天之间、约5天与约7天之间或约6天。同样,培养细胞群体以允许转录激活和扩增的步骤可以是任何合适的时间段。例如,培养可以持续约2天与约10天之间、约3天与约9天之间、约4天与约8天之间、约5天与约7天之间或约6天。

任何合适的tau接种剂均可以用于产生经接种的细胞群体。合适的tau接种剂在本文别处公开。一些合适的接种剂包括可以例如与第一tau重复结构域和/或第二tau重复结构域不同或类似或相同的tau重复结构域。在一个实例中,接种步骤包括在存在从经培养的tau聚集阳性细胞采集的条件培养基的情况下培养所述经基因修饰的细胞群体,其中tau重复结构域以聚集状态稳定地存在。例如,条件培养基可以在处于汇合的细胞上持续约1到约7天、约2到约6天、约3到约5天或约4天之后从汇合的tau聚集阳性细胞中采集。接种步骤可以包括以条件培养基与新鲜培养基的任何合适的比率培养经基因修饰的细胞群体。例如,条件培养基的使用可以包括在以下中培养经基因修饰的细胞群体:约90%条件培养基和约10%新鲜培养基、约85%条件培养基和约15%新鲜培养基、约80%条件培养基和约20%新鲜培养基、约75%条件培养基和约25%新鲜培养基、约70%条件培养基和约30%新鲜培养基、约65%条件培养基和约35%新鲜培养基、约60%条件培养基和约40%新鲜培养基、约55%条件培养基和约45%新鲜培养基、约50%条件培养基和约50%新鲜培养基、约45%条件培养基和约55%新鲜培养基、约40%条件培养基和约60%新鲜培养基、约35%条件培养基和约65%新鲜培养基、约30%条件培养基和约70%新鲜培养基、约25%条件培养基和约75%新鲜培养基、约20%条件培养基和约80%新鲜培养基、约15%条件培养基和约85%新鲜培养基或约10%条件培养基和约90%新鲜培养基。在一个实例中,条件培养基的使用可以包括在包括至少约50%条件培养基和不超过约50%新鲜培养基的培养基中培养经基因修饰的细胞群体。在具体实例中,条件培养基的使用可以包括在约75%条件培养基和约25%新鲜培养基中培养经基因修饰的细胞群体。任选地,所述经基因修饰的细胞群体不与所述tau聚集阳性细胞共培养,其中tau重复结构域以聚集状态稳定地存在。

培养经接种的细胞群体以允许形成tau聚集体的步骤可以是任何合适的时间长度,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的子集中形成以产生聚集阳性细胞群体。例如,培养可以持续约1天与约7天之间、约2天与约6天之间、约3天与约5天之间或约4天。聚集可以通过任何合适的方式测定,这取决于所使用的报告基因。例如,在其中第一报告基因和第二报告基因是荧光共振能量转移(FRET)对的方法中,可以通过流式细胞术鉴定聚集阳性细胞群体。

可以通过任何合适的方式测定向导RNA的丰度。在具体实例中,通过下一代测序测定丰度。下一代测序是指非基于桑格的高通量DNA测序技术。例如,测定向导RNA的丰度可以包括测量向导RNA的读段计数。

在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阳性细胞群体中是在引入向导RNA文库之后所培养的细胞群体中的至少约1.5倍,那么所述向导RNA被视为是富集的。也可以使用不同的富集阈值。例如,可以将富集阈值设置得更高以更严格(例如,至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍或至少约2.5倍)。可替代地,可以将富集阈值设置得更低以使不那么严格(例如,至少约1.4倍、至少约1.3倍或至少约1.2倍)。

在一个实例中,测定丰度的步骤可以包括相对于在培养期间的第一时间点和/或培养期间的第二时间点处引入向导RNA文库之后所培养的细胞群体,测定聚集阳性群体中的多个独特向导RNA的丰度。例如,第一时间点可以处于培养所述细胞群体的第一次传代,并且所述第二时间点可以处于培养所述细胞群体以允许基因组编辑和扩增的中间。例如,第一时间点可以在用于向导RNA与Cas蛋白形成复合物,并且Cas蛋白切割多个基因导致基因功能敲除(CRISPRn)或转录激活多个基因(CRISPRa)的足够时间量之后。然而,第一时间点理想地应处于第一次细胞传代以测定感染之后不久的gRNA文库表示(即,在进一步扩增和基因组编辑之前),并且测定每个gRNA表示是否从第一时间点进化到第二时间点和任何另外的时间点到最终时间点。这允许通过验证gRNA丰度在第一时间点与第二时间点之间没有变化来排除由于筛选过程期间细胞生长优势而导致的富集gRNA/靶标。作为具体实例,第一时间点可以在培养和扩增约1天、约2天、约3天或约4天之后,并且第二时间点可以在培养和扩增约3天、约4天、约5天或约6天之后。例如,第一时间点可以在培养和扩增约3天之后,并且第二时间点可以在培养和扩增约6天之后。在一些方法中,基因然后可以被视为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)增强(或预期增强)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是在第一时间点和第二时间点两者处引入向导RNA文库之后所培养的细胞群体中的至少1.5倍(或高于不同的所选富集阈值)。可替代地或另外地,基因可以被视为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)增强(或预期增强)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的至少两个独特向导RNA的丰度在聚集阳性细胞群体中是在第一时间点或者第二时间点处引入向导RNA文库之后所培养的细胞群体中的至少1.5倍(或高于不同的所选富集阈值)。

在一些CRISPRn方法中,采取以下步骤将基因鉴定为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)增强(或预期增强)tau聚集。同样,在一些CRISPRa方法中,采取以下步骤将基因鉴定为tau聚集基因修饰因子,其中基因的转录激活增强了tau聚集。第一步骤包括鉴定所述多个独特向导RNA中的哪些向导RNA存在于聚集阳性细胞群体中。第二步骤包括使用公式nCn'*(x-n')C(m-n)/xCm计算鉴定出的向导RNA的随机机会,其中x是引入到所述细胞群体中的独特向导RNA的种类,m是步骤(1)中鉴定的独特向导RNA的种类,n是引入到所述细胞群体的靶向所述基因的独特向导RNA的种类,并且n'是在步骤(1)中鉴定的靶向所述基因的独特向导RNA的种类。第三步骤包括计算步骤(1)中鉴定的所述向导RNA的平均富集得分。向导RNA的富集得分是聚集阳性细胞群体中的向导RNA的相对丰度除以引入向导RNA文库之后所培养的细胞群体中的向导RNA的相对丰度。相对丰度是向导RNA的读段计数除以多个独特向导RNA的总群体的读段计数。第四步骤包括如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。上文讨论了可能的阈值富集得分。作为具体实例,阈值富集得分可以设置为约1.5倍。

种类在短语“独特向导RNA的种类”中使用时意指独特向导RNA序列的数量。所述种类不是丰度,而是定性的“存在”或“不存在”。独特向导RNA的种类意指独特向导RNA序列的数量。通过下一代测序(NGS)测定独特向导RNA的种类,以鉴定细胞群体中存在的所有独特向导RNA。所述测定是通过使用识别病毒载体的恒定区域的两个引物来扩增恒定区域之间的gRNA和识别一个恒定区域以进行测序的引物来完成的。样品中存在的每个独特向导RNA将使用测序引物来产生读段计数。NGS结果将包含序列并且还包含与所述序列相对应的读段数量。读段数量将用于每个向导RNA的富集得分计算,并且每个独特序列的存在将告知存在哪些向导RNA。例如,如果基因在选择之前有三个独特向导RNA,并且在选择之后所有三个都保留,那么n和n'两者都是3。这些数字用于计算统计数据,而不是实际读段计数。然而,每个向导RNA的读段计数(在一个实例中,100、200、50,其对应于3个独特向导RNA中的每一个)将用于计算富集得分。

V.筛选防止tau聚集的tau聚集基因修饰因子的方法

本文所公开的Cas/tau生物传感器细胞系可以用于筛选tau聚集基因修饰因子(例如,防止tau聚集或预期防止tau聚集)的方法中。此类方法可以包括提供如本文别处所公开的Cas/tau生物传感器细胞群体、引入包括多个独特向导RNA的文库以及评估靶向细胞中的tau聚集。

作为一个实例,方法可以包括提供Cas/tau生物传感器细胞群体(例如,包括Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域的细胞群体),将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中并且培养所述细胞群体以允许基因组编辑和扩增。所述多个独特向导RNA与所述Cas蛋白形成复合物,并且所述Cas蛋白切割所述多个基因导致基因功能敲除以产生经基因修饰的细胞群体。然后可以使经基因修饰的细胞群体与tau接种剂接触以产生经接种的细胞群体。例如,tau接种剂可以是如本文别处所描述的“最大接种”剂,如来自tau聚集阳性细胞的细胞裂解物。可以培养经接种的细胞群体以允许形成tau聚集体,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的子集中形成以产生聚集阳性细胞群体,并且其中聚集体不在经接种的细胞群体的第二子集中形成以产生聚集阴性细胞群体。最后,相对于聚集阴性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,可以测定在聚集阳性细胞群体中多个独特向导RNA中的每个独特向导RNA的丰度。相对于聚集阳性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,聚集阴性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的破坏防止tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏防止tau聚集。同样,相对于聚集阴性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,聚集阳性细胞群体中向导RNA的耗竭表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的破坏防止tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏防止tau聚集。相对于聚集阴性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,聚集阳性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的破坏促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏促进或增强tau聚集。同样,相对于聚集阳性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,聚集阴性细胞群体中向导RNA的耗竭表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的破坏促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏促进或增强tau聚集。

类似地,本文所公开的SAM/tau生物传感器细胞系可以用于筛选tau聚集基因修饰因子(例如,防止tau聚集或预期防止tau聚集)的方法中。此类方法可以包括提供如本文别处所公开的SAM/tau生物传感器细胞群体、引入包括多个独特向导RNA的文库以及评估靶向细胞中的tau聚集。

作为一个实例,方法可以包括提供SAM/tau生物传感器细胞群体(例如,细胞群体,所述细胞群体包括包含与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白的嵌合Cas蛋白、包含与一个或多个转录激活结构域融合的衔接蛋白的嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域),将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中并且培养所述细胞群体以允许转录激活和扩增。所述多个独特向导RNA与嵌合Cas蛋白和嵌合衔接蛋白形成复合物,并且所述复合物激活所述多个基因的转录导致基因表达和经修饰的细胞群体增加。然后可以使经修饰的细胞群体与tau接种剂接触以产生经接种的细胞群体。例如,tau接种剂可以是如本文别处所描述的“最大接种”剂,如来自tau聚集阳性细胞的细胞裂解物。可以培养经接种的细胞群体以允许形成tau聚集体,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的子集中形成以产生聚集阳性细胞群体,并且其中聚集体不在经接种的细胞群体的第二子集中形成以产生聚集阴性细胞群体。最后,相对于聚集阴性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,可以测定在聚集阳性细胞群体中多个独特向导RNA中的每个独特向导RNA的丰度。相对于聚集阳性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,聚集阴性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的转录激活防止tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活防止tau聚集。同样,相对于聚集阴性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,聚集阳性细胞群体中向导RNA的耗竭表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的转录激活防止tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活防止tau聚集。相对于聚集阴性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,聚集阳性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的转录激活促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活促进或增强tau聚集。同样,相对于聚集阳性细胞群体和/或相对于接种之后的细胞群体和/或相对于引入向导RNA文库之后所培养的细胞群体,聚集阴性细胞群体中向导RNA的耗竭表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的转录激活促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活促进或增强tau聚集。

所述方法中使用的Cas/tau生物传感器细胞可以是本文别处所公开的Cas/tau生物传感器细胞中的任何生物传感器细胞。同样,所述方法中使用的SAM/tau生物传感器细胞可以是本文别处所公开的SAM/tau生物传感器细胞中的任何生物传感器细胞。第一tau重复结构域和第二tau重复结构域可以不同或可以类似或相同。tau重复结构域可以是本文别处所公开的tau重复结构域中的任何重复结构域。例如,第一tau重复结构域和/或第二tau重复结构域可以是野生型tau重复结构域或可以包括促聚集突变(例如,致病性促聚集突变),如tau P301S突变。第一tau重复结构域和/或第二tau重复结构域可以包括tau四重复结构域。作为一个具体实例,第一tau重复结构域和/或第二tau重复结构域可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:11或与SEQ ID NO:11至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。在一个具体实例中,对tau重复结构域进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:12或与SEQID NO:12至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:11。

第一tau重复结构域可以通过任何方式连接到第一报告基因,并且第二tau重复结构域可以连接到第二报告基因。例如,报告基因可以与tau重复结构域融合(例如,作为融合蛋白的一部分)。报告蛋白可以是当连接到第一报告基因的第一tau重复结构域与连接到第二报告基因的第二tau重复结构域聚集时产生可检测信号的任何一对报告蛋白。作为一个实例,第一报告基因和第二报告基因可以是分裂荧光素酶蛋白。作为另一个实例,第一报告蛋白和第二报告蛋白可以是荧光共振能量转移(FRET)对。FRET是一种物理现象,其中处于其激发状态的供体荧光团以非辐射方式将其激发能量转移到相邻的受体荧光团,从而使受体发射其特征性荧光。FRET对(供体和受体荧光团)的实例是众所周知的。参见例如,Bajar等人(2016)《传感器(Sensors)》巴塞尔(Basel)16(9):1488,所述文献出于所有目的通过引用整体并入本文。作为FRET对的一个具体实例,第一报告基因可以是青色荧光蛋白(CFP),并且第二报告基因可以是黄色荧光蛋白(YFP)。作为具体实例,CFP可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:13或与SEQ ID NO:13至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。作为另一个具体实例,YFP可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:15或与SEQ ID NO:15至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。

对于Cas/tau生物传感器细胞,Cas蛋白可以是本文别处所公开的任何Cas蛋白。作为一个实例,Cas蛋白可以是Cas9蛋白。例如,Cas9蛋白可以是酿脓链球菌Cas9蛋白。作为一个具体实例,Cas蛋白可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:21或与SEQ ID NO:21至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。

Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部在所述细胞群体中稳定地表达。例如,对Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部进行编码的核酸可以在基因组上整合在所述细胞群体中。在一个具体实例中,对Cas蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQID NO:22或与SEQ ID NO:22至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:21。

对于SAM/tau生物传感器细胞,Cas蛋白可以是本文别处所公开的任何Cas蛋白。作为一个实例,Cas蛋白可以是Cas9蛋白。例如,Cas9蛋白可以是酿脓链球菌Cas9蛋白。作为一个具体实例,嵌合Cas蛋白可以包括与VP64转录激活结构域融合的核酸酶失活Cas蛋白。例如,嵌合Cas蛋白质可以从N端到C端包括:所述核酸酶失活Cas蛋白;核定位信号;以及所述VP64转录激活结构域。作为一个具体实例,衔接蛋白可以是MS2外壳蛋白,并且嵌合衔接蛋白中的一个或多个转录激活结构域可以包括p65转录激活结构域和HSF1转录激活结构域。例如,嵌合衔接蛋白质可以从N端到C端包括:所述MS2外壳蛋白;核定位信号;所述p65转录激活结构域;以及所述HSF1转录激活结构域。在一个具体实例中,对嵌合Cas蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:38或与SEQ ID NO:38至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:36。在一个具体实例中,对嵌合衔接蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:39或与SEQ ID NO:39至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:37。

嵌合Cas蛋白、嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部在所述细胞群体中稳定地表达。例如,对嵌合Cas蛋白、嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部进行编码的核酸可以在基因组上整合在所述细胞群体中。

如本文别处所公开的,细胞可以是任何类型的细胞。例如,细胞可以是真核细胞、哺乳动物细胞或人类细胞(例如,HEK293T细胞或神经元细胞)。

可以通过任何已知的方式将多个独特向导RNA引入到细胞群体中。在一些方法中,通过病毒转导如逆转录病毒、腺病毒或慢病毒转导将向导RNA引入到细胞群体中。在一个具体的实例中,可以通过慢病毒转导引入向导RNA。多个独特向导RNA中的每个独特向导RNA都可以处于单独的病毒载体中。细胞群体可以在任何感染复数下被感染。例如,感染复数可以介于约0.1与约1.0之间、介于约0.1与约0.9之间、介于约0.1与约0.8之间、介于约0.1与约0.7之间、介于约0.1与约0.6之间、介于约0.1与约0.5之间、介于约0.1与约0.4之间或介于约0.1与约0.3之间。可替代地,感染复数可以小于约1.0、小于约0.9、小于约0.8、小于约0.7、小于约0.6、小于约0.5、小于约0.4、小于约0.3或小于约0.2。在具体实例中,感染复数可以小于约0.3。

可以将向导RNA与选择标志物或报告基因一起引入到细胞群体中以选择具有向导RNA的细胞,并且所述方法可以进一步包括选择包括选择标志物或报告基因的细胞。选择标志物和报告基因的实例在本文别处提供。作为一个实例,选择标志物可以是赋予药物抗性的选择标志物,如新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶和杀稻瘟素S脱氨酶。另一个示例性选择标志物是博来霉素抗性蛋白,由Sh ble基因(印度异壁链霉菌(Streptoalloteichus hindustanus)博来霉素基因)编码,其赋予吉欧霉素(腐草霉素D1)抗性。例如,可以用药物(例如,嘌呤霉素)选择细胞,使得仅保存用向导RNA构建体转导的细胞以用于进行筛选。例如,药物可以是嘌呤霉素或吉欧霉素(腐草霉素D1)。

在一些方法中,以选择的浓度引入所述多个独特向导RNA,使得大多数细胞仅接受所述独特向导RNA之一。例如,如果向导RNA是通过病毒转导引入的,则细胞可以以低感染复数进行感染,以确保大多数细胞以高概率仅接收一种病毒构建体。作为一个具体实例,感染复数可以小于约0.3。

多个独特向导RNA被引入到其中的细胞群体可以是任何合适数量的细胞。例如,细胞群体可以包括每个独特向导RNA大于约50个、大于约100个、大于约200个、大于约300个、大于约400个、大于约500个、大于约600个、大于约700个、大于约800个、大于约900个或大于约1000个细胞。在一个具体实例中,细胞群体包括每个独特向导RNA大于约300个细胞或大于约500个细胞。

多个独特向导RNA可以靶向任何数量的基因。例如,多个独特向导RNA可以靶向约50个或更多个基因、约100个或更多个基因、约200个或更多个基因、约300个或更多个基因、约400个或更多个基因、约500个或更多个基因、约1000个或更多个基因、约2000个或更多个基因、约3000个或更多个基因、约4000个或更多个基因、约5000个或更多个基因、约10000个或更多个基因或约20000个或更多个基因。在一些方法中,可以选择向导RNA来靶向特定信号传导途径中的基因。在一些方法中,独特向导RNA文库是全基因组文库。

多个独特向导RNA可以靶向每个单独靶向基因中的任何数量的序列。在一些方法中,多个靶序列平均在所靶向的多个基因中的每个基因中靶向。例如,约2到约10、约2到约9、约2到约8、约2到约7、约2到约6、约2到约5、约2到约4或约2到约3个独特靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。例如,至少约2个、至少约3个、至少约4个、至少约5个或至少约6个独特靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。作为具体实例,约6个靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。作为另一个具体实例,约3个到约6个或约4个到约6个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。

向导RNA可以靶向靶基因中的任何期望的定位。在一些使用Cas/tau生物传感器细胞的CRISPRn方法中,如果可能的话,每个向导RNA都靶向组成型外显子。在一些方法中,如果可能的话,每个向导RNA都靶向5'组成型外显子。在一些方法中,如果可能的话,每个向导RNA靶向第一外显子、第二外显子或第三外显子(来自基因的5'端)。在一些使用SAM/tau生物传感器细胞的CRISPRa方法中,如果可能的话,每个向导RNA可以靶向转录起始位点上游200bp内的向导RNA靶序列。在使用SAM/tau生物传感器细胞的一些CRISPRa方法中,其中每个向导RNA可以包括嵌合衔接蛋白可以与其特异性结合的一个或多个衔接结合元件。在一个实例中,每个向导RNA包括嵌合衔接蛋白可以与其特异性结合的两个衔接结合元件,任选地其中第一衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第二环内。例如,衔接结合元件可以包括SEQ ID NO:33中所示的序列。在具体实例中,一个或多个向导RNA中的每个向导RNA是包括与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPR RNA(crRNA)部分的单向导RNA,并且所述第一环是与SEQ ID NO:17、19、30或31的残基13-16相对应的四环,并且所述第二环是与SEQ ID NO:17、19、30或31的残基53-56相对应的茎环2。

培养细胞群体以允许基因组编辑和扩增的步骤可以是任何合适的时间段。例如,培养可以持续约2天与约15天之间、约3天与约13天之间、约5天与约12天之间、约7天与约11天之间或约7天或约11天。作为另一个实例,培养可以持续约2天与约14天之间、约3天与约12天之间、约5天与约11天之间、约7天与约10天之间或约7天或约10天。同样,培养细胞群体以允许转录激活和扩增的步骤可以是任何合适的时间段。例如,培养可以持续约2天与约15天之间、约3天与约13天之间、约5天与约12天之间、约7天与约11天之间或约7天或约11天。同样,培养细胞群体以允许转录激活和扩增的步骤可以是任何合适的时间段。例如,培养可以持续约2天与约14天之间、约3天与约12天之间、约5天与约11天之间、约7天与约10天之间或约7天或约10天。

任何合适的tau接种剂均可以用于产生经接种的细胞群体。合适的tau接种剂在本文别处公开。一些合适的接种剂包括可以例如与第一tau重复结构域和/或第二tau重复结构域不同或类似或相同的tau重复结构域。在一个实例中,接种步骤包括在存在包括来自经培养的tau聚集阳性细胞的细胞裂解物的情况下培养经基因修饰的细胞群体,其中tau重复结构域以聚集状态稳定地存在。任选地,所述经基因修饰的细胞群体不与所述tau聚集阳性细胞共培养,其中tau重复结构域以聚集状态稳定地存在。

培养基中细胞裂解物的量或浓度可以是任何合适的量或浓度。例如,培养基中的细胞裂解物的浓度可以介于约0.1μg/mL与约50μg/mL之间、介于约0.1μg/mL与约25μg/mL之间、介于约0.1μg/mL与约10μg/mL之间、介于约0.1μg/mL与约5μg/mL之间、介于约0.1μg/mL与约4.5μg/mL之间、介于约0.1μg/mL与约4μg/mL之间、介于约0.1μg/mL与约3.5μg/mL之间、介于约0.1μg/mL与约3μg/mL之间、介于约0.1μg/mL与约2.5μg/mL之间、介于约0.1μg/mL与约2μg/mL之间、介于约0.1μg/mL与约1.5μg/mL之间、介于约0.1μg/mL与约1μg/mL之间、介于约0.5μg/mL与约50μg/mL之间、介于约0.5μg/mL与约25μg/mL之间、介于约0.5μg/mL与约10μg/mL之间、介于约0.5μg/mL与约5μg/mL之间、介于约0.5μg/mL与约4.5μg/mL之间、介于约0.5μg/mL与约4μg/mL之间、介于约0.5μg/mL与约3.5μg/mL之间、介于约0.5μg/mL与约3μg/mL之间、介于约0.5μg/mL与约2.5μg/mL之间、介于约0.5μg/mL与约2μg/mL之间、介于约0.5μg/mL与约1.5μg/mL之间、介于约0.5μg/mL与约1μg/mL之间、介于约1μg/mL与约50μg/mL之间、介于约1μg/mL与约25μg/mL之间、介于约1μg/mL与约10μg/mL之间、介于约1μg/mL与约5μg/mL之间、介于约1μg/mL与约4.5μg/mL之间、介于约1μg/mL与约4μg/mL之间、介于约1μg/mL与约3.5μg/mL之间、介于约1μg/mL与约3μg/mL之间、介于约1μg/mL与约2.5μg/mL之间、介于约1μg/mL与约2μg/mL之间、介于约1μg/mL与约1.5μg/mL之间、介于约1.5μg/mL与约50μg/mL之间、介于约1.5μg/mL与约25μg/mL之间、介于约1.5μg/mL与约10μg/mL之间、介于约1.5μg/mL与约5μg/mL之间、介于约1.5μg/mL与约4.5μg/mL之间、介于约1.5μg/mL与约4μg/mL之间、介于约1.5μg/mL与约3.5μg/mL之间、介于约1.5μg/mL与约3μg/mL之间、介于约1.5μg/mL与约2.5μg/mL之间、介于约1.5μg/mL与约2μg/mL之间、介于约2μg/mL与约50μg/mL之间、介于约2μg/mL与约25μg/mL之间、介于约2μg/mL与约10μg/mL之间、介于约2μg/mL与约5μg/mL之间、介于约2μg/mL与约4.5μg/mL之间、介于约2μg/mL与约4μg/mL之间、介于约2μg/mL与约3.5μg/mL之间、介于约2μg/mL与约3μg/mL之间、介于约2μg/mL与约2.5μg/mL之间、介于约2.5μg/mL与约50μg/mL之间、介于约2.5μg/mL与约25μg/mL之间、介于约2.5μg/mL与约10μg/mL之间、介于约2.5μg/mL与约5μg/mL之间、介于约2.5μg/mL与约4.5μg/mL之间、介于约2.5μg/mL与约4μg/mL之间、介于约2.5μg/mL与约3.5μg/mL或介于约2.5μg/mL与约3μg/mL的培养基(例如,新鲜培养基)。例如,培养基中的细胞裂解物的浓度可以介于约1μg/mL与约5μg/mL之间或浓度可以为约1.5μg/mL、约2μg/mL、约2.5μg/mL、约3μg/mL、约3.5μg/mL、约4μg/mL、约4.5μg/mL或约5μg/mL。任选地,细胞裂解物可以处于缓冲液中,如磷酸盐缓冲盐水。任选地,缓冲液可以包括蛋白酶抑制剂。蛋白酶抑制剂的实例包含但不限于AEBSF、抑肽酶、苯丁抑制素、E-64、亮抑酶肽、胃酶抑素A和乙二胺四乙酸(EDTA)。缓冲液可以包括这些抑制剂中的任何抑制剂或其任何组合(例如,缓冲液可以包括所有这些蛋白酶抑制剂)。

用于产生裂解物的细胞可以收集在缓冲液中,如磷酸盐缓冲盐水。任选地,缓冲液可以包括蛋白酶抑制剂。蛋白酶抑制剂的实例包含但不限于AEBSF、抑肽酶、苯丁抑制素、E-64、亮抑酶肽、胃酶抑素A和乙二胺四乙酸(EDTA)。缓冲液可以包括这些抑制剂中的任何抑制剂或其任何组合(例如,缓冲液可以包括所有这些蛋白酶抑制剂)。

细胞裂解物可以例如通过对tau聚集阳性细胞(例如,收集在缓冲液和蛋白酶抑制剂中的细胞,如上文所描述的)进行超声处理任何合适的时间量来收集。例如,可以将细胞超声处理约1分钟到约6分钟、约1分钟到约5分钟、约1分钟到约4分钟、约1分钟到约3分钟、约2分钟到约6分钟、约2分钟到约5分钟、约2分钟到约4分钟、约2分钟到约3分钟、约2分钟到约6分钟、约3分钟到约5分钟或约3分钟到4分钟。例如,可以将细胞超声处理约2分钟到约4分钟或约3分钟。

任选地,培养基包括脂质体或质脂体(例如,阳离子质脂体)或磷脂或另一种转染剂。任选地,培养基包括脂质体。任选地,培养基不包括脂质体或质脂体(例如,阳离子质脂体)或磷脂或另一种转染剂。任选地,培养基不包括脂质体。培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的量或浓度可以是任何合适的量或浓度。例如,培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的浓度可以介于约0.5μL/mL到约10μL/mL之间、介于约0.5μL/mL到约5μL/mL之间、介于约0.5μL/mL到约4.5μL/mL之间、介于约0.5μL/mL到约4μL/mL之间、介于约0.5μL/mL到约3.5μL/mL之间、介于约0.5μL/mL到约3μL/mL之间、介于约0.5μL/mL到约2.5μL/mL之间、介于约0.5μL/mL到约2μL/mL之间、介于约0.5μL/mL到约1.5μL/mL之间、介于约0.5μL/mL到约1μL/mL之间、介于约1μL/mL到约10μL/mL之间、介于约1μL/mL到约5μL/mL之间、介于约1μL/mL到约4.5μL/mL之间、介于约1μL/mL到约4μL/mL之间、介于约1μL/mL到约3.5μL/mL之间、介于约1μL/mL到约3μL/mL之间、介于约1μL/mL到约2.5μL/mL之间、介于约1μL/mL到约2μL/mL之间、介于约1μL/mL到约1.5μL/mL之间、介于约1.5μL/mL到约10μL/mL之间、介于约1.5μL/mL到约5μL/mL之间、介于约1.5μL/mL到约4.5μL/mL之间、介于约1.5μL/mL到约4μL/mL之间、介于约1.5μL/mL到约3.5μL/mL之间、介于约1.5μL/mL到约3μL/mL之间、介于约1.5μL/mL到约2.5μL/mL之间、介于约1.5μL/mL到约2μL/mL之间、介于约2μL/mL到约10μL/mL之间、介于约2μL/mL到约5μL/mL之间、介于约2μL/mL到约4.5μL/mL之间、介于约2μL/mL到约4μL/mL之间、介于约2μL/mL到约3.5μL/mL之间、介于约2μL/mL到约3μL/mL之间或介于约2μL/mL到约2.5μL/mL的培养基(例如,新鲜培养基)。例如,培养基中脂质体或质脂体(例如,阳离子质脂体)或磷脂或其它转染剂的浓度可以介于约1.5μL/mL与约4μL/mL之间或可以为约1.5μL/mL、约2μL/mL、约2.5μL/mL、约3μL/mL、约3.5μL/mL或约4μL/mL。

培养经接种的细胞群体以允许形成tau聚集体的步骤可以是任何合适的时间长度,其中所述第一tau重复结构域和所述第二tau重复结构域的聚集体在所述经接种的细胞群体的子集中形成以产生聚集阳性细胞群体。例如,培养可以持续约1天与约7天之间、约2天与约6天之间、约3天与约5天之间、约1天与约3天之间或约2天。聚集可以通过任何合适的方式测定,这取决于所使用的报告基因。例如,在其中第一报告基因和第二报告基因是荧光共振能量转移(FRET)对的方法中,可以通过流式细胞术鉴定聚集阳性细胞群体。

可以通过任何合适的方式测定向导RNA的丰度。在具体实例中,通过下一代测序测定丰度。下一代测序是指非基于桑格的高通量DNA测序技术。例如,测定向导RNA的丰度可以包括测量向导RNA的读段计数。

在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体和/或经接种的细胞群体中的至少1.5倍,那么所述向导RNA被视为在聚集阴性细胞中是富集的。在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阳性细胞群体中是聚集阴性细胞群体和/或经接种的细胞群体中的至少1/1.5,那么所述向导RNA被视为在聚集阳性细胞中是耗竭的。也可以使用不同的富集/耗竭阈值。例如,可以将富集/耗竭阈值设置得更高以更严格(例如,至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍或至少约2.5倍)。可替代地,可以将富集/耗竭阈值设置得更低以使不那么严格(例如,至少约1.4倍、至少约1.3倍或至少约1.2倍)。

可替代地,在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阳性细胞群体中是聚集阴性细胞群体和/或经接种的细胞群体中的至少1.5倍,那么所述向导RNA被视为在聚集阳性细胞中是富集的。在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体和/或经接种的细胞群体中的至少1/1.5,那么所述向导RNA被视为在聚集阴性细胞中是耗竭的。也可以使用不同的富集/耗竭阈值。例如,可以将富集/耗竭阈值设置得更高以更严格(例如,至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍或至少约2.5倍)。可替代地,可以将富集/耗竭阈值设置得更低以使不那么严格(例如,至少约1.4倍、至少约1.3倍或至少约1.2倍)。

在一个实例中,测定丰度的步骤可以包括相对于聚集阴性群和/或相对于在第一时间点引入向导RNA文库之后所培养的细胞群体和/或相对于在第二时间点的经接种的细胞群体,测定聚集阳性群中多个独特向导RNA的丰度。同样,测定丰度的步骤可以包括相对于聚集阳性群和/或相对于在第一时间点引入向导RNA文库之后所培养的细胞群体和/或相对于在第二时间点的经接种的细胞群体,测定聚集阴性群中多个独特向导RNA的丰度。例如,第一时间点可以处于培养所述细胞群体的第一次传代或处于培养所述细胞群体以允许基因组编辑和扩增的中间。例如,第一时间点可以在用于向导RNA与Cas蛋白形成复合物,并且Cas蛋白切割多个基因导致基因功能敲除(CRISPRn)或转录激活多个基因(CRISPRa)的足够时间量之后。然而,在一些情况下,第一时间点理想地应处于用于测定感染之后不久的gRNA文库表示(即,在进一步扩增和基因组编辑之前),并且测定每个gRNA表示是否从第一时间点进化到第二时间点和任何另外的时间点到最终时间点的第一次细胞传代。这允许通过验证gRNA丰度在第一时间点与第二时间点之间没有变化来排除由于筛选过程期间细胞生长优势而导致的富集gRNA/靶标。作为具体实例,第一时间点可以在培养和扩增约1天、约2天、约3天或约4天之后(例如,在培养和扩增约3天时),并且第二时间点可以是在培养和扩增约5天、约6天、约7天、约8天、约9天、约10天或约11天之后。例如,第一时间点可以在培养和扩增约3天之后,并且第二时间点可以在培养和扩增约7天或约10天之后。

在一些方法中,基因可以被视为是tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)防止(或预期防止)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阴性细胞群体中是在聚集阳性细胞群体、第一时间点处的经培养的细胞群体和第二时间点处的经接种的细胞群体中的至少1.5倍。可替代地或另外地,然后可以将基因视为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)防止(或预期防止)tau聚集,如果靶相对于多个独特向导RNA的总群体的向基因的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体和第二时间点处的经接种的细胞群体中的至少1.5倍。可替代地或另外地,基因可以被视为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)防止(或预期防止)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是聚集阴性细胞群体、第一时间点处的经培养的细胞群体和第二时间点处的经接种的细胞群体中的至少1/1.5。可替代地或另外地,基因可以被视为是tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)防止(或预期防止)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是在聚集阴性细胞群体和第二时间点处的经接种的细胞群体中的至少1/1.5。

可替代地,在一个实例中,测定丰度的步骤可以包括相对于聚集阳性群和/或相对于在第一时间点引入向导RNA文库之后所培养的细胞群体和/或相对于在第二时间点的经接种的细胞群体,测定聚集阴性群中多个独特向导RNA的丰度。同样,测定丰度的步骤可以包括相对于聚集阴性群和/或相对于在第一时间点引入向导RNA文库之后所培养的细胞群体和/或相对于在第二时间点的经接种的细胞群体,测定聚集阳性群中多个独特向导RNA的丰度。例如,第一时间点可以处于培养所述细胞群体的第一次传代或处于培养所述细胞群体以允许基因组编辑和扩增的中间。例如,第一时间点可以在用于向导RNA与Cas蛋白形成复合物,并且Cas蛋白切割多个基因导致基因功能敲除(CRISPRn)或转录激活多个基因(CRISPRa)的足够时间量之后。然而,在一些情况下,第一时间点理想地应处于用于测定感染之后不久的gRNA文库表示(即,在进一步扩增和基因组编辑之前),并且测定每个gRNA表示是否从第一时间点进化到第二时间点和任何另外的时间点到最终时间点的第一次细胞传代。这允许通过验证gRNA丰度在第一时间点与第二时间点之间没有变化来排除由于筛选过程期间细胞生长优势而导致的富集gRNA/靶标。作为具体实例,第一时间点可以在培养和扩增约1天、约2天、约3天或约4天之后(例如,在培养和扩增约3天时),并且第二时间点可以是在培养和扩增约5天、约6天、约7天、约8天、约9天、约10天或约11天之后。例如,第一时间点可以在培养和扩增约3天之后,并且第二时间点可以在培养和扩增约7天或约10天之后。

在一些方法中,基因可以被视为是tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强tau聚集(或预期促进或增强tau聚集),如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是在聚集阴性细胞群体、第一时间点处的经培养的细胞群体和第二时间点处的经接种的细胞群体中的至少1.5倍。可替代地或另外地,基因可以被视为是tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强tau聚集(或预期促进或增强tau聚集),如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是在聚集阴性细胞群体和第二时间点处的经接种的细胞群体中的至少1.5倍。可替代地或另外地,基因可以被视为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强tau聚集(或预期促进或增强tau聚集),如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体、第一时间点处的经培养的细胞群体和第二时间点处的经接种的细胞群体中的至少1/1.5。可替代地或另外地,然后可以将基因视为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强tau聚集(或预期促进或增强tau聚集),如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体和第二时间点处的经接种的细胞群体中的至少1/1.5。

在一些CRISPRn方法中,采取以下步骤将基因鉴定为tau聚集基因修饰因子,其中基因的破坏防止(或预期防止)tau聚集。同样,在一些CRISPRa方法中,采取以下步骤将基因鉴定为tau聚集基因修饰因子,其中基因的转录激活防止(或预期防止)tau聚集。第一步骤包括鉴定所述多个独特向导RNA中的哪些向导RNA存在于聚集阴性细胞群体中。第二步骤包括使用公式nCn'*(x-n')C(m-n)/xCm计算鉴定出的向导RNA的随机机会,其中x是引入到所述细胞群体中的独特向导RNA的种类,m是步骤(1)中鉴定的独特向导RNA的种类,n是引入到所述细胞群体的靶向所述基因的独特向导RNA的种类,并且n'是在步骤(1)中鉴定的靶向所述基因的独特向导RNA的种类。第三步骤包括计算步骤(1)中鉴定的所述向导RNA的平均富集得分。向导RNA的富集得分是聚集阴性细胞群体中的向导RNA的相对丰度除以聚集阳性细胞或引入向导RNA文库之后所培养的细胞群体或经接种的细胞群体中的向导RNA的相对丰度。相对丰度是向导RNA的读段计数除以多个独特向导RNA的总群体的读段计数。第四步骤包括如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。上文讨论了可能的阈值富集得分。作为具体实例,阈值富集得分可以设置为约1.5倍。

可替代地,在一些CRISPRn方法中,采取以下步骤将基因鉴定为tau聚集基因修饰因子,其中基因的破坏促进或增强(或预期促进或增强)tau聚集。同样,在一些CRISPRa方法中,采取以下步骤将基因鉴定为tau聚集基因修饰因子,其中基因的转录激活促进或增强(或预期促进或增强)tau聚集。第一步骤包括鉴定所述多个独特向导RNA中的哪些向导RNA存在于聚集阳性细胞群体中。第二步骤包括使用公式nCn'*(x-n')C(m-n)/xCm计算鉴定出的向导RNA的随机机会,其中x是引入到所述细胞群体中的独特向导RNA的种类,m是步骤(1)中鉴定的独特向导RNA的种类,n是引入到所述细胞群体的靶向所述基因的独特向导RNA的种类,并且n'是在步骤(1)中鉴定的靶向所述基因的独特向导RNA的种类。第三步骤包括计算步骤(1)中鉴定的所述向导RNA的平均富集得分。向导RNA的富集得分是聚集阳性细胞群体中的向导RNA的相对丰度除以聚集阴性细胞或引入向导RNA文库之后所培养的细胞群体或经接种的细胞群体中的向导RNA的相对丰度。相对丰度是向导RNA的读段计数除以多个独特向导RNA的总群体的读段计数。第四步骤包括如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。上文讨论了可能的阈值富集得分。作为具体实例,阈值富集得分可以设置为约1.5倍。

种类在短语“独特向导RNA的种类”中使用时意指独特向导RNA序列的数量。所述种类不是丰度,而是定性的“存在”或“不存在”。独特向导RNA的种类意指独特向导RNA序列的数量。通过下一代测序(NGS)测定独特向导RNA的种类,以鉴定细胞群体中存在的所有独特向导RNA。所述测定是通过使用识别病毒载体的恒定区域的两个引物来扩增恒定区域之间的gRNA和识别一个恒定区域以进行测序的引物来完成的。样品中存在的每个独特向导RNA将使用测序引物来产生读段计数。NGS结果将包含序列并且还包含与所述序列相对应的读段数量。读段数量将用于每个向导RNA的富集得分计算,并且每个独特序列的存在将告知存在哪些向导RNA。例如,如果基因在选择之前有三个独特向导RNA,并且在选择之后所有三个都保留,那么n和n'两者都是3。这些数字用于计算统计数据,而不是实际读段计数。然而,每个向导RNA的读段计数(在一个实例中,100、200、50,其对应于3个独特向导RNA中的每一个)将用于计算富集得分。

VI.筛选tau解聚基因修饰因子的方法

本文公开的Cas/tau生物传感器细胞系可以用于筛选tau解聚基因修饰因子(例如,促进tau解聚)的方法中。此类方法可以包括提供如本文别处所公开的tau聚集阳性Cas/tau生物传感器细胞群体、引入包括多个独特向导RNA的文库以及评估靶向细胞中的tau解聚。

作为一个实例,方法可以包括提供Cas/tau生物传感器细胞群体(例如,包括Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域的细胞群体),其中所述细胞是tau聚集阳性细胞,其中tau重复结构域以聚集状态稳定地存在;将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中并且培养所述细胞群体以允许基因组编辑和扩增。所述多个独特向导RNA与所述Cas蛋白形成复合物,并且所述Cas蛋白切割所述多个基因导致基因功能敲除以产生经基因修饰的细胞群体。培养产生聚集阳性细胞群体和聚集阴性细胞群体,所述聚集阳性细胞群体和聚集阴性细胞群体然后可以被鉴定。最后,相对于聚集阴性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,可以测定在聚集阳性细胞群体中多个独特向导RNA中的每个独特向导RNA的丰度。相对于聚集阳性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,聚集阴性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau解聚基因修饰因子,其中由所述向导RNA靶向的基因的破坏促进tau解聚,或者是tau解聚的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏促进tau解聚。同样,相对于聚集阴性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,聚集阳性细胞群体中向导RNA的耗竭表明由所述向导RNA靶向的基因是tau解聚基因修饰因子,其中由所述向导RNA靶向的基因的破坏促进tau解聚,或者是tau解聚的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏促进tau解聚。相对于聚集阴性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,聚集阳性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的破坏促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏促进或增强tau聚集。同样,相对于聚集阳性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,聚集阴性细胞群体中向导RNA的耗竭表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的破坏促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的破坏促进或增强tau聚集。

类似地,本文公开的SAM/tau生物传感器细胞系可以用于筛选tau解聚基因修饰因子(例如,促进tau解聚)的方法中。此类方法可以包括提供如本文别处所公开的tau聚集阳性SAM/tau生物传感器细胞群体、引入包括多个独特向导RNA的文库以及评估靶向细胞中的tau解聚。

作为一个实例,方法可以包括提供SAM/tau生物传感器细胞群体(例如,细胞群体,所述细胞群体包括包含与一个或多个转录激活结构域融合的核酸酶失活Cas蛋白的嵌合Cas蛋白、包含与一个或多个转录激活结构域融合的衔接蛋白的嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域),其中所述细胞是tau聚集阳性细胞,其中tau重复结构域以聚集状态稳定地存在;将包括靶向多个基因的多个独特向导RNA的文库引入到所述细胞群体中并且培养所述细胞群体以允许转录激活和扩增。所述多个独特向导RNA与嵌合Cas蛋白和嵌合衔接蛋白形成复合物,并且所述复合物激活所述多个基因的转录导致基因表达和经修饰的细胞群体增加。培养产生聚集阳性细胞群体和聚集阴性细胞群体,所述聚集阳性细胞群体和聚集阴性细胞群体然后可以被鉴定。最后,相对于聚集阴性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,可以测定在聚集阳性细胞群体中多个独特向导RNA中的每个独特向导RNA的丰度。相对于聚集阳性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,聚集阴性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau解聚基因修饰因子,其中由所述向导RNA靶向的基因的转录激活促进tau解聚,或者是tau解聚的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活促进tau解聚。同样,相对于聚集阴性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,聚集阳性细胞群体中向导RNA的耗竭表明由所述向导RNA靶向的基因是tau解聚基因修饰因子,其中由所述向导RNA靶向的基因的转录激活促进tau解聚,或者是tau解聚的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活促进tau解聚。相对于聚集阴性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,聚集阳性细胞群体中向导RNA的富集表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的转录激活促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活促进或增强tau聚集。同样,相对于聚集阳性细胞群体和/或相对于在一个或多个时间点处引入向导RNA文库之后所培养的细胞群体,聚集阴性细胞群体中向导RNA的耗竭表明由所述向导RNA靶向的基因是tau聚集基因修饰因子,其中由所述向导RNA靶向的基因的转录激活促进或增强tau聚集,或者是tau聚集的候选基因修饰因子(例如,用于通过二次筛选进行进一步的测试),其中预期由所述向导RNA靶向的所述基因的转录激活促进或增强tau聚集。

所述方法中使用的Cas/tau生物传感器细胞可以是本文别处所公开的Cas/tau生物传感器细胞中的任何生物传感器细胞。同样,所述方法中使用的SAM/tau生物传感器细胞可以是本文别处所公开的SAM/tau生物传感器细胞中的任何生物传感器细胞。第一tau重复结构域和第二tau重复结构域可以不同或可以类似或相同。tau重复结构域可以是本文别处所公开的tau重复结构域中的任何重复结构域。例如,第一tau重复结构域和/或第二tau重复结构域可以是野生型tau重复结构域或可以包括促聚集突变(例如,致病性促聚集突变),如tau P301S突变。第一tau重复结构域和/或第二tau重复结构域可以包括tau四重复结构域。作为一个具体实例,第一tau重复结构域和/或第二tau重复结构域可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:11或与SEQ ID NO:11至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。在一个具体实例中,对tau重复结构域进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:12或与SEQID NO:12至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:11。

第一tau重复结构域可以通过任何方式连接到第一报告基因,并且第二tau重复结构域可以连接到第二报告基因。例如,报告基因可以与tau重复结构域融合(例如,作为融合蛋白的一部分)。报告蛋白可以是当连接到第一报告基因的第一tau重复结构域与连接到第二报告基因的第二tau重复结构域聚集时产生可检测信号的任何一对报告蛋白。作为一个实例,第一报告基因和第二报告基因可以是分裂荧光素酶蛋白。作为另一个实例,第一报告蛋白和第二报告蛋白可以是荧光共振能量转移(FRET)对。FRET是一种物理现象,其中处于其激发状态的供体荧光团以非辐射方式将其激发能量转移到相邻的受体荧光团,从而使受体发射其特征性荧光。FRET对(供体和受体荧光团)的实例是众所周知的。参见例如,Bajar等人(2016)《传感器(Sensors)》巴塞尔(Basel)16(9):1488,所述文献出于所有目的通过引用整体并入本文。作为FRET对的一个具体实例,第一报告基因可以是青色荧光蛋白(CFP),并且第二报告基因可以是黄色荧光蛋白(YFP)。作为具体实例,CFP可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:13或与SEQ ID NO:13至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。作为另一个具体实例,YFP可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:15或与SEQ ID NO:15至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。

对于Cas/tau生物传感器细胞,Cas蛋白可以是本文别处所公开的任何Cas蛋白。作为一个实例,Cas蛋白可以是Cas9蛋白。例如,Cas9蛋白可以是酿脓链球菌Cas9蛋白。作为一个具体实例,Cas蛋白可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:21或与SEQ ID NO:21至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。

Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部在所述细胞群体中稳定地表达。例如,对Cas蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部进行编码的核酸可以在基因组上整合在所述细胞群体中。在一个具体实例中,对Cas蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQID NO:22或与SEQ ID NO:22至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:21。

对于SAM/tau生物传感器细胞,Cas蛋白可以是本文别处所公开的任何Cas蛋白。作为一个实例,Cas蛋白可以是Cas9蛋白。例如,Cas9蛋白可以是酿脓链球菌Cas9蛋白。作为一个具体实例,嵌合Cas蛋白可以包括与VP64转录激活结构域融合的核酸酶失活Cas蛋白。例如,嵌合Cas蛋白质可以从N端到C端包括:所述核酸酶失活Cas蛋白;核定位信号;以及所述VP64转录激活结构域。作为一个具体实例,衔接蛋白可以是MS2外壳蛋白,并且嵌合衔接蛋白中的一个或多个转录激活结构域可以包括p65转录激活结构域和HSF1转录激活结构域。例如,嵌合衔接蛋白质可以从N端到C端包括:所述MS2外壳蛋白;核定位信号;所述p65转录激活结构域;以及所述HSF1转录激活结构域。在一个具体实例中,对嵌合Cas蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:38或与SEQ ID NO:38至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:36。在一个具体实例中,对嵌合衔接蛋白进行编码的核酸可以包括以下、基本上由以下组成或由以下组成:SEQ ID NO:39或与SEQ ID NO:39至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列,任选地其中所述核酸编码包括以下、基本上由以下组成或由以下组成的蛋白质:SEQ ID NO:37。

嵌合Cas蛋白、嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部在所述细胞群体中稳定地表达。例如,对嵌合Cas蛋白、嵌合衔接蛋白、连接到第一报告基因的第一tau重复结构域和连接到第二报告基因的第二tau重复结构域中的一种或多种或全部进行编码的核酸可以在基因组上整合在所述细胞群体中。

如本文别处所公开的,细胞可以是任何类型的细胞。例如,细胞可以是真核细胞、哺乳动物细胞或人类细胞(例如,HEK293T细胞或神经元细胞)。

可以通过任何已知的方式将多个独特向导RNA引入到细胞群体中。在一些方法中,通过病毒转导如逆转录病毒、腺病毒或慢病毒转导将向导RNA引入到细胞群体中。在一个具体的实例中,可以通过慢病毒转导引入向导RNA。多个独特向导RNA中的每个独特向导RNA都可以处于单独的病毒载体中。细胞群体可以在任何感染复数下被感染。例如,感染复数可以介于约0.1与约1.0之间、介于约0.1与约0.9之间、介于约0.1与约0.8之间、介于约0.1与约0.7之间、介于约0.1与约0.6之间、介于约0.1与约0.5之间、介于约0.1与约0.4之间或介于约0.1与约0.3之间。可替代地,感染复数可以小于约1.0、小于约0.9、小于约0.8、小于约0.7、小于约0.6、小于约0.5、小于约0.4、小于约0.3或小于约0.2。在具体实例中,感染复数可以小于约0.3。

可以将向导RNA与选择标志物或报告基因一起引入到细胞群体中以选择具有向导RNA的细胞,并且所述方法可以进一步包括选择包括选择标志物或报告基因的细胞。选择标志物和报告基因的实例在本文别处提供。作为一个实例,选择标志物可以是赋予药物抗性的选择标志物,如新霉素磷酸转移酶、潮霉素B磷酸转移酶、嘌呤霉素-N-乙酰转移酶和杀稻瘟素S脱氨酶。另一个示例性选择标志物是博来霉素抗性蛋白,由Sh ble基因(印度异壁链霉菌(Streptoalloteichus hindustanus)博来霉素基因)编码,其赋予吉欧霉素(腐草霉素D1)抗性。例如,可以用药物(例如,嘌呤霉素)选择细胞,使得仅保存用向导RNA构建体转导的细胞以用于进行筛选。例如,药物可以是嘌呤霉素或吉欧霉素(腐草霉素D1)。

在一些方法中,以选择的浓度引入所述多个独特向导RNA,使得大多数细胞仅接受所述独特向导RNA之一。例如,如果向导RNA是通过病毒转导引入的,则细胞可以以低感染复数进行感染,以确保大多数细胞以高概率仅接收一种病毒构建体。作为一个具体实例,感染复数可以小于约0.3。

多个独特向导RNA被引入到其中的细胞群体可以是任何合适数量的细胞。例如,细胞群体可以包括每个独特向导RNA大于约50个、大于约100个、大于约200个、大于约300个、大于约400个、大于约500个、大于约600个、大于约700个、大于约800个、大于约900个或大于约1000个细胞。在一个具体实例中,细胞群体包括每个独特向导RNA大于约300个细胞或大于约500个细胞。

多个独特向导RNA可以靶向任何数量的基因。例如,多个独特向导RNA可以靶向约50个或更多个基因、约100个或更多个基因、约200个或更多个基因、约300个或更多个基因、约400个或更多个基因、约500个或更多个基因、约1000个或更多个基因、约2000个或更多个基因、约3000个或更多个基因、约4000个或更多个基因、约5000个或更多个基因、约10000个或更多个基因或约20000个或更多个基因。在一些方法中,可以选择向导RNA来靶向特定信号传导途径中的基因。在一些方法中,独特向导RNA文库是全基因组文库。

多个独特向导RNA可以靶向每个单独靶向基因中的任何数量的序列。在一些方法中,多个靶序列平均在所靶向的多个基因中的每个基因中靶向。例如,约2到约10、约2到约9、约2到约8、约2到约7、约2到约6、约2到约5、约2到约4或约2到约3个独特靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。例如,至少约2个、至少约3个、至少约4个、至少约5个或至少约6个独特靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。作为具体实例,约6个靶序列可以在多个靶向基因中的每个靶向基因中进行平均靶向。作为另一个具体实例,约3个到约6个或约4个到约6个靶序列平均在所述多个靶向基因中的每个靶向基因中靶向。

向导RNA可以靶向靶基因中的任何期望的定位。在一些使用Cas/tau生物传感器细胞的CRISPRn方法中,如果可能的话,每个向导RNA都靶向组成型外显子。在一些方法中,如果可能的话,每个向导RNA都靶向5'组成型外显子。在一些方法中,如果可能的话,每个向导RNA靶向第一外显子、第二外显子或第三外显子(来自基因的5'端)。在一些使用SAM/tau生物传感器细胞的CRISPRa方法中,如果可能的话,每个向导RNA可以靶向转录起始位点上游200bp内的向导RNA靶序列。在使用SAM/tau生物传感器细胞的一些CRISPRa方法中,其中每个向导RNA可以包括嵌合衔接蛋白可以与其特异性结合的一个或多个衔接结合元件。在一个实例中,每个向导RNA包括嵌合衔接蛋白可以与其特异性结合的两个衔接结合元件,任选地其中第一衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第二环内。例如,衔接结合元件可以包括SEQ ID NO:33中所示的序列。在具体实例中,一个或多个向导RNA中的每个向导RNA是包括与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPR RNA(crRNA)部分的单向导RNA,并且所述第一环是与SEQ ID NO:17、19、30或31的残基13-16相对应的四环,并且所述第二环是与SEQ ID NO:17、19、30或31的残基53-56相对应的茎环2。

培养细胞群体以允许基因组编辑和扩增的步骤可以是任何合适的时间段。例如,培养可以持续约2天与约15天之间、约3天与约14天之间、约5天与约14天之间、约7天与约14天之间、约9天与约14天之间,约10天与约14天之间,约11天与约14天之间或约12天与约14天之间。同样,培养细胞群体以允许转录激活和扩增的步骤可以是任何合适的时间段。例如,培养可以持续约2天与约15天之间、约3天与约14天之间、约5天与约14天之间、约7天与约14天之间、约9天与约14天之间,约10天与约14天之间,约11天与约14天之间或约12天与约14天之间。

鉴定聚集阳性细胞群体和聚集阴性细胞群体的步骤可以包括同步细胞循环进程。例如,这可以用于获得主要富集于S期或主要富集于G2期的细胞群体。作为具体实例,可以通过双胸苷阻断来实现同步。

聚集可以通过任何合适的方式测定,这取决于所使用的报告基因。例如,在其中第一报告基因和第二报告基因是荧光共振能量转移(FRET)对的方法中,可以通过流式细胞术鉴定聚集阳性细胞群体。

可以通过任何合适的方式测定向导RNA的丰度。在具体实例中,通过下一代测序测定丰度。下一代测序是指非基于桑格的高通量DNA测序技术。例如,测定向导RNA的丰度可以包括测量向导RNA的读段计数。

在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体和/或在一个或多个时间点处的经培养的细胞群体中的至少1.5倍,那么所述向导RNA被视为在聚集阴性细胞中是富集的。在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阳性细胞群体中是聚集阴性细胞群体和/或在一个或多个时间点处的经培养的细胞群体中的至少1/1.5,那么所述向导RNA被视为在聚集阳性细胞中是耗竭的。也可以使用不同的富集/耗竭阈值。例如,可以将富集/耗竭阈值设置得更高以更严格(例如,至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍或至少约2.5倍)。可替代地,可以将富集/耗竭阈值设置得更低以使不那么严格(例如,至少约1.4倍、至少约1.3倍或至少约1.2倍)。

在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阳性细胞群体中是聚集阴性细胞群体和/或在一个或多个时间点处的经培养的细胞群体中的至少1.5倍,那么所述向导RNA被视为在聚集阳性细胞中是富集的。在一些方法中,如果相对于多个独特向导RNA的总群体的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体和/或在一个或多个时间点处的经培养的细胞群体中的至少1/1.5,那么所述向导RNA被视为在聚集阴性细胞中是耗竭的。也可以使用不同的富集/耗竭阈值。例如,可以将富集/耗竭阈值设置得更高以更严格(例如,至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2倍、至少约2.5倍或至少约2.5倍)。可替代地,可以将富集/耗竭阈值设置得更低以使不那么严格(例如,至少约1.4倍、至少约1.3倍或至少约1.2倍)。

在一个实例中,测定丰度的步骤可以包括相对于聚集阴性群和/或相对于在第一时间点引入向导RNA文库之后所培养的细胞群体和/或相对于在第二时间点引入向导RNA文库之后所培养的细胞群体,测定聚集阳性群中多个独特向导RNA的丰度。同样,测定丰度的步骤可以包括相对于聚集阳性群和/或相对于在第一时间点引入向导RNA文库之后所培养的细胞群体和/或相对于在第二时间点引入向导RNA文库之后所培养的细胞群体,测定聚集阴性群中多个独特向导RNA的丰度。例如,第一时间点可以处于培养细胞群体的第一次传代或在培养细胞群体以允许基因组编辑和扩增的中间,并且所述第二时间点可以处于培养所述细胞群体以允许基因组编辑和扩增的中间。例如,第一时间点可以在用于向导RNA与Cas蛋白形成复合物,并且Cas蛋白切割多个基因导致基因功能敲除(CRISPRn)或转录激活多个基因(CRISPRa)的足够时间量之后。然而,在一些情况下,第一时间点理想地应处于用于测定感染之后不久的gRNA文库表示(即,在进一步扩增和基因组编辑之前),并且测定每个gRNA表示是否从第一时间点进化到第二时间点和任何另外的时间点到最终时间点的第一次细胞传代。这允许通过验证gRNA丰度在第一时间点与第二时间点之间没有变化来排除由于筛选过程期间细胞生长优势而导致的富集gRNA/靶标。作为具体实例,第一时间点可以在培养和扩增约1天、约2天、约3天、约4天、约5天、约6天、约7天或约8天之后(例如,在培养和扩增约7天),并且第二时间点可以是在培养和扩增约5天、约6天、约7天、约8天、约9天、约10天、约11天或约12天(例如,约10天)之后。例如,第一时间点可以在培养和扩增约7天之后,并且第二时间点可以在培养和扩增约10天之后。

在一些方法中,基因可以被视为是tau解聚基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进(或预期促进)tau解聚,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阴性细胞群体中是在聚集阳性细胞群体、第一时间点处的经培养的细胞群体和第二时间点处的经培养的细胞群体中的至少1.5倍。可替代地或另外地,然后可以将基因视为tau解聚基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进(或预期促进)tau解聚,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体和第二时间点处的经培养的细胞群体中的至少1.5倍。可替代地或另外地,基因可以被视为tau解聚基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进(或预期促进)tau解聚,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是聚集阴性细胞群体、第一时间点处的经培养的细胞群体和第二时间点处的经培养的细胞群体中的至少1/1.5。可替代地或另外地,基因可以被视为是tau解聚基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进(或预期促进)tau解聚,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是在聚集阴性细胞群体和第二时间点处的经培养的细胞群体中的至少1/1.5。

在一些方法中,基因可以被视为是tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强(或预期促进或增强)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是在聚集阴性细胞群体、第一时间点处的经培养的细胞群体和第二时间点处的经培养的细胞群体中的至少1.5倍。可替代地或另外地,基因可以被视为是tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强(或预期促进或增强)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阳性细胞群体中是在聚集阴性细胞群体和第二时间点处的经培养的细胞群体中的至少1.5倍。可替代地或另外地,基因可以被视为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强(或预期促进或增强)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体、第一时间点处的经培养的细胞群体和第二时间点处的经培养的细胞群体中的至少1/1.5。可替代地或另外地,然后可以将基因视为tau聚集基因修饰因子,其中基因的破坏(CRISPRn)或转录激活(CRISPRa)促进或增强(或预期促进或增强)tau聚集,如果相对于多个独特向导RNA的总群体的靶向基因的向导RNA的丰度在聚集阴性细胞群体中是聚集阳性细胞群体和第二时间点处的经培养的细胞群体中的至少1/1.5。

在一些CRISPRn方法中,采取以下步骤将基因鉴定为tau解聚基因修饰因子,其中基因的破坏促进(或预期促进)tau解聚。同样,在一些CRISPRa方法中,采取以下步骤将基因鉴定为tau解聚基因修饰因子,其中基因的转录激活促进(或预期促进)tau解聚。第一步骤包括鉴定所述多个独特向导RNA中的哪些向导RNA存在于聚集阴性细胞群体中。第二步骤包括使用公式nCn'*(x-n')C(m-n)/xCm计算鉴定出的向导RNA的随机机会,其中x是引入到所述细胞群体中的独特向导RNA的种类,m是步骤(1)中鉴定的独特向导RNA的种类,n是引入到所述细胞群体的靶向所述基因的独特向导RNA的种类,并且n'是在步骤(1)中鉴定的靶向所述基因的独特向导RNA的种类。第三步骤包括计算步骤(1)中鉴定的所述向导RNA的平均富集得分。向导RNA的富集得分是聚集阴性细胞群体中的向导RNA的相对丰度除以聚集阳性细胞或在第一或第二时间点处引入向导RNA文库之后所培养的细胞群体中的向导RNA的相对丰度。相对丰度是向导RNA的读段计数除以多个独特向导RNA的总群体的读段计数。第四步骤包括如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。上文讨论了可能的阈值富集得分。作为具体实例,阈值富集得分可以设置为约1.5倍。

在一些CRISPRn方法中,采取以下步骤将基因鉴定为tau聚集基因修饰因子,其中基因的破坏促进或增强(或预期促进或增强)tau聚集。同样,在一些CRISPRa方法中,采取以下步骤将基因鉴定为tau聚集基因修饰因子,其中基因的转录激活促进或增强(或预期促进或增强)tau聚集。第一步骤包括鉴定所述多个独特向导RNA中的哪些向导RNA存在于聚集阳性细胞群体中。第二步骤包括使用公式nCn'*(x-n')C(m-n)/xCm计算鉴定出的向导RNA的随机机会,其中x是引入到所述细胞群体中的独特向导RNA的种类,m是步骤(1)中鉴定的独特向导RNA的种类,n是引入到所述细胞群体的靶向所述基因的独特向导RNA的种类,并且n'是在步骤(1)中鉴定的靶向所述基因的独特向导RNA的种类。第三步骤包括计算步骤(1)中鉴定的所述向导RNA的平均富集得分。向导RNA的富集得分是聚集阳性细胞群体中的向导RNA的相对丰度除以聚集阴性细胞或在第一或第二时间点处引入向导RNA文库之后所培养的细胞群体中的向导RNA的相对丰度。相对丰度是向导RNA的读段计数除以多个独特向导RNA的总群体的读段计数。第四步骤包括如果靶向所述基因的向导RNA显著低于存在的随机机会并且高于阈值富集得分,那么选择所述基因。上文讨论了可能的阈值富集得分。作为具体实例,阈值富集得分可以设置为约1.5倍。

种类在短语“独特向导RNA的种类”中使用时意指独特向导RNA序列的数量。所述种类不是丰度,而是定性的“存在”或“不存在”。独特向导RNA的种类意指独特向导RNA序列的数量。通过下一代测序(NGS)测定独特向导RNA的种类,以鉴定细胞群体中存在的所有独特向导RNA。所述测定是通过使用识别病毒载体的恒定区域的两个引物来扩增恒定区域之间的gRNA和识别一个恒定区域以进行测序的引物来完成的。样品中存在的每个独特向导RNA将使用测序引物来产生读段计数。NGS结果将包含序列并且还包含与所述序列相对应的读段数量。读段数量将用于每个向导RNA的富集得分计算,并且每个独特序列的存在将告知存在哪些向导RNA。例如,如果基因在选择之前有三个独特向导RNA,并且在选择之后所有三个都保留,那么n和n'两者都是3。这些数字用于计算统计数据,而不是实际读段计数。然而,每个向导RNA的读段计数(在一个实例中,100、200、50,其对应于3个独特向导RNA中的每一个)将用于计算富集得分。

出于所有目的,上文或下文引用的所有专利申请、网站、其它出版物、登录号等都通过引用整体并入,其程度如同每个单独的项目被单独并且具体地指出通过引用的方式并入。如果序列的不同版本与不同时间的登录号相关联,则意指在本申请的有效提交日期与该登录号相关联的版本。有效提交日期是指实际提交日期或提及登记号的优先权申请的提交日期(在适用情况下)中较早的日期。同样,如果出版物、网站等的不同版本在不同时间发布,除非另有说明,否则指在申请的有效提交日期最近发布的版本。除非另外具体说明,否则本发明的任何特征、步骤、元件、实施例或方面都可以与任何其它特征、步骤、元件、实施例或方面结合使用。尽管为了清楚和理解起见,已通过图解和实例方式详细地对本发明进行了描述,但显而易见的是,可以在所附权利要求的范围内进行某些改变和修改。

序列简要说明

使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出随附序列表中列出的核苷酸和氨基酸序列。核苷酸序列遵循从序列的5'端开始并且向前(即,在每行中从左到右)到达3'端的标准惯例。每个核苷酸序列仅示出一条链,但任何提及的显示链均应理解为包含互补链。当提供对氨基酸序列进行编码的核苷酸序列时,应当理解的是还提供了其对相同氨基酸序列进行编码的密码子简并变体。氨基酸序列遵循从序列的氨基端开始并且向前(即,在每行中从左到右)到达羧基端的标准惯例。

表2.序列说明。

实例

实例1.开发全基因组CRISPR/Cas9筛选平台以鉴定tau聚集基因修饰因子

蛋白质的异常聚集或纤维化是许多疾病的定义性特征,特别是包含若干种神经退行性疾病,如阿尔茨海默病(AD)、帕金森氏病(PD)、额颞叶痴呆(FTD)、肌萎缩侧索硬化(ALS)、慢性创伤脑病(CTE)、克雅氏病(CJD)等。在许多这些疾病中,某些蛋白质原纤维化成不溶性聚集体不仅是疾病的标志,而且还被认为是神经毒性的致病因素。此外,这些疾病的特征是聚集病理学按照刻板模式通过中枢神经系统传播,这一过程与疾病进展相关。因此,鉴定修饰异常蛋白质聚集过程或聚集体细胞间增殖过程的基因和遗传途径对于更好地理解神经退行性疾病的病因以及制定治疗干预策略具有重要价值。

为了鉴定修饰异常tau蛋白聚集过程的基因和途径,开发了一种用于利用CRISPR核酸酶(CRISPRn)sgRNA文库进行全基因组筛选以鉴定调节细胞被tau疾病相关蛋白聚集体“接种”的潜力的基因(即当暴露于tau原纤维化蛋白来源时,基因被破坏时会导致细胞更容易形成tau聚集体)的平台。对此类基因的鉴定可以阐明tau细胞间聚集体传播的机制和控制神经元在神经退行性疾病的上下文中形成tau聚集体的敏感性的基因途径。

筛选采用tau生物传感器人类细胞系,所述细胞系由稳定表达tau四重复结构域tau_4RD的HEK293T细胞组成,所述重复结构域包括具有P301S致病突变的与CFP或YFP融合的tau微管结合结构域(MBD)。即,HEK293T细胞系含有稳定地表达与荧光蛋白CFP或荧光蛋白YFP融合的疾病相关蛋白变体的两种转基因:tau4RD-CFP/tau4RD-YFP(TCY),其中tau重复结构域(4RD)包括P301S致病突变。参见图1。在这些生物传感器系中,tau-CFP/tau-YFP蛋白聚集产生FRET信号,这是荧光能量从供体CFP转移到受体YFP的结果。参见图2。含有tau聚集体的FRET阳性细胞可以通过流式细胞术分选和分离。在基线时,未经刺激的细胞以稳定、可溶性状态表达报告基因,其中FRET信号最小。在刺激(例如,种子颗粒的质脂体转染)时,报告蛋白形成聚集体,产生FRET信号。可以通过FACS分离含有聚集体的细胞。稳定地繁殖的含有聚集体的细胞系Agg[+]可以通过Agg[-]细胞系的克隆连续稀释来分离。

对此tau生物传感器细胞系进行了若干修饰,使其可用于进行基因筛选。首先,通过慢病毒载体引入Cas9表达转基因(SpCas9)来修饰这些tau生物传感器细胞。用杀稻瘟素选择表达Cas9的克隆转基因细胞系,并且通过克隆系列稀释分离以获得单细胞衍生的克隆。通过qRT-PCR(图3A)评估克隆的Cas9表达水平并且通过数字PCR(图3B)评估DNA切割活性。相对Cas9表达水平也示出在表3中。

表3.相对Cas9表达水平。

具体地,在针对两个所选靶基因转导编码gRNA的慢病毒之后3天和7天,通过数字PCR评估Cas9突变效率。切割效率受到低表达克隆中Cas9水平的限制。需要具有足够Cas9表达水平的克隆来实现最大活性。具有较低Cas9表达的若干衍生克隆无法有效切割靶序列,而具有较高表达的克隆(包含用于筛选的克隆)能够在培养三天之后以大约80%的效率在基因PERK和SNCA中的靶序列处产生突变。在gRNA转导之后3天已经观察到有效切割,其中7天之后仅略有改善。克隆7B10-C3被选择作为用于后续文库筛选的高性能克隆。

其次,开发了使细胞对tau接种活性敏化的试剂和方法。tau细胞间传播可能是由含有聚集体的细胞分泌的tau聚集活性引起的。为了研究tau聚集的细胞增殖,获得了tau-YFP细胞系的亚克隆,所述细胞系由稳定地表达tau重复结构域tau_4RD的HEK293T细胞组成,所述重复结构域包括具有P301S致病突变的与YFP融合的tau微管结合结构域(MBD)。参见图5。通过用与脂质体试剂混合的重组原纤维化tau处理这些tau-YFP细胞来获得其中tau-YFP蛋白以聚集状态(Agg[+])稳定地存在的细胞,以便接种这些细胞稳定地表达的tau-YFP蛋白的聚集。然后将“经接种的”细胞连续稀释以获得单细胞衍生的克隆。然后扩增这些克隆以鉴定克隆细胞系,其中tau-YFP聚集体在所有细胞中稳定地存在,其中随时间推移生长并多次传代。这些tau-YFP_Agg[+]克隆之一克隆18用于通过收集已经处于汇合的tau-YFP_Agg[+]细胞上持续四天的培养基来产生条件培养基。然后将条件培养基(CM)以3:1CM:新鲜培养基的比率施加于原初生物传感器tau-CFP/Tau-YFP细胞上,使得在这些接受者细胞的一小部分中诱导tau聚集。没有使用脂质体。不使用脂质体以便进行尽可能符合生理学的测定,而不使用脂质体诱使接受者细胞以强制/增加tau聚集。如通过使用流式细胞术评估产生FRET信号的细胞百分比作为聚集的量度所测量的,条件培养基在大约0.1%的细胞中始终诱导FRET。参见图6。总之,tau-YFP_Agg[+]细胞不能产生FRET信号,但所述细胞可以提供tau种子的来源。

实例2.进行全基因组CRISPR/Cas9筛选以鉴定tau聚集基因修饰因子

为了揭示tau聚集的修饰基因作为FRET[+]细胞中富集的sgRNA,不具有聚集体(Agg[–])的Cas9表达tau-CFP/tau-YFP生物传感器细胞使用慢病毒递送方法用两种人类全基因组CRISPR sgRNA转导以在每个靶基因处引入敲除突变。参见图4。每个CRISPR sgRNA文库靶向5'组成型外显子进行功能性敲除,其中每个基因的平均覆盖率为约3个sgRNA(组合的两个文库中每个基因总共有6个gRNA)。每个文库的读段计数分布(即,文库中每个gRNA的表示)是正常且类似的。sgRNA被设计成通过避免与脱靶基因组序列有两个或更少错配的sgRNA来避免脱靶效应。所述文库涵盖19,050个人类基因和1864个miRNA,以及1000个非靶向对照sgRNA。文库以<0.3的感染复数(MOI)转导,其中每个sgRNA的覆盖率>300个细胞。tau生物传感器细胞在嘌呤霉素选择下生长,以选择整合和表达独特sgRNA的细胞。嘌呤霉素选择在1μg/mL转导之后24小时开始。初次筛选中使用了五个独立的筛选复制。

在转导后第3天和第6天的细胞传代时收集完整的转导细胞群体的样品。在第6天传代之后,细胞在条件培养基中生长以使所述细胞对接种活性敏化。在第10天,使用荧光辅助细胞分选(FACS)具体分离FRET[+]细胞亚群。参见图7。筛选由五个复制的实验组成。整合sgRNA构建体的DNA分离和PCR扩增允许在每个时间点通过下一代测序(NGS)对sgRNA库进行表征。

与较早时间点第3天和第6天的sgRNA库相比,NGS数据的统计分析能够鉴定在五个实验的第10天FRET[+]亚群中富集的sgRNA。NGS分析的相对丰度和富集的概念在图8中例示。用于鉴定潜在tau修饰因子的第一策略是使用DNA测序在每个样品中使用DESeq算法产生sgRNA读段计数,以找到在第10天对第3天或第10天对第6天中但不是在第6天对第3天中更丰富的sgRNA(倍数变化(fc)≥1.5并且负二项试验p<0.01)。Fc≥1.5意指(第10天计数的平均值)/(第3天或第6天计数的平均值)的比率≥1.5。P<0.01意指第10天与第3天或第6天计数之间没有统计差异的机会<0.01。DESeq算法是用于“序列计数数据的差异表达分析”的广泛使用的算法。参见例如,Anders等人(2010)《基因组生物学(Genome Biology)》11:R106,所述文献出于所有目的通过引用整体并入本文。

具体地,在每个库中使用了两个比较来鉴定显著的sgRNA:第10天对第3天,以及第10天对第6天。对于这四个比较中的每个比较,都使用了DESeq算法,并且被视为显著的截止阈值是倍数变化≥1.5以及负二项试验p<0.01。一旦在每个文库的这些比较中的每个比较中鉴定了显著向导,如果基因满足以下两个标准之一,那么所述基因被视为是显著的:(1)对应于所述基因的至少两个sgRNA被视为在一个比较(第10天对第3天或第10天对第6天)中是显著的;(2)至少一种sgRNA在两个比较(第10天对第3天和第10天对第6天)中都是显着的。使用此算法,从第一文库中鉴定出五个基因是显著的,并且从第二文库中鉴定出四个基因。参见表4。

表4.使用策略#1鉴定的基因。

然而,第一策略要求每个实验组内的读段计数同质性水平可能过于严格。对于相同的sgRNA,许多因素会在每个实验组(第3天、第6天或第10天样品)内的样品之间产生读段计数可变性,如筛选文库中的初始病毒计数、感染或基因编辑效率以及基因编辑后的相对生长速率。因此,还基于第10天(选择后)每个样品中每个基因的向导的阳性出现(读段计数>30)而不是确切读段计数使用了第二策略。给定文库大小(x)、每个基因的向导数量(n)和选择后样品(m)中的阳性向导的总数,计算正式统计p值以积极观察选择后样品(n')中的多个向导(“数字”指的是sgRNA类型(即,独特向导RNA序列),而不是读段计数)(pn'=nCn'*(x-n')C(m-n)/xCm)。n'个向导偶然存在的概率是:pn'=nCn'*(x-n')C(m-n)/xCm。基因g偶然存在n'个或更多个向导的概率计算如下:

与预选择相比,选择后基因读段计数的总体富集被用作用于鉴定阳性基因的另外的参数:(相对丰度=[基因的读段计数]/[所有基因的读段计数]并且选择后富集=[选择后相对丰度]/[相对丰度预选择])。

更具体地,第二策略是用于CRISPR阳性选择的新的更灵敏的分析方法。CRISPR阳性选择的目标是使用DNA测序来鉴定由sgRNA进行的扰动与表型相关的基因。为了降低噪声背景,这些实验中通常使用同一基因的多个sgRNA以及实验复制。然而,要求同一基因的sgRNA之间以及技术重复之间具有一定程度的同质性/一致性的目前常用的统计分析方法效果不佳。这是因为由于许多可能的原因(例如,不同的感染或基因编辑效率、筛选文库中的初始病毒计数以及具有相同表型的其它sgRNA的存在),这些方法无法处理sgRNA和同一基因的重复之间的巨大差异。相比之下,开发了一种对大变化具有鲁棒性的方法。所述方法基于单独的实验中每个基因的向导的阳性出现次数,而不是每个sgRNA的确切读段计数。给定文库大小、每个基因的sgRNA数量以及每个实验中阳性sgRNA的总数,计算正式统计p值以在实验重复中积极观察sgRNA数量。表型选择之前和之后的相对sgRNA序列读段富集也用作参数。所述方法比目前广泛使用的方法(包含DESeq、MAGECK以及其它)表现得更好。具体地,所述方法包含以下步骤:

(1)对于每个实验,鉴定具有阳性表型的细胞中的任何存在的向导。

(2)在基因水平,计算每个实验中存在向导的随机机会:nCn'*(x-n')C(m-n)/xCm,其中x是表型选择之前向导的种类,m是表型选择之后向导的种类,n是表型选择之前基因的向导的种类,并且n'是表型选择之后基因的向导种类。跨多个实验存在的总体机会(在多个实验中产生的p值之上产生单个p值)由费希尔组合概率测试计算(参考:Fisher,R.A.;Fisher,R.A(1948)“问题和答案(Questions and answers)#14”美国统计学家)。也就是说,首先使用来自多个实验的p值计算测试统计量φ:其中pk是针对第k个实验计算的p值,并且K是实验总数。然后,K个实验的组合p值等于在自由度为2*K的卡方分布下观察φ值的概率。可替代地,通过乘以从每个实验获得的上述计算的概率来计算跨多个实验存在的总体机会。

(3)计算基因水平的向导平均富集:富集得分=选择后的相对丰度/选择前的相对丰度。相对丰度=基因的向导读段计数/所有向导的读段计数。

(4)选择显著低于所存在的随机机会以及高于特定富集得分的基因。

由两种不同方法(一种方法或两种方法)鉴定为富集在FRET[+]细胞中的十四个靶基因被选择作为最佳候选基因,以在基于读段计数数据进行视觉检查后进行进一步验证。参见表5。在二次筛选中测试了三十个单独的sgRNA以进行验证。二次筛选的示意图在图9中示出并且结果在图10中示出。多个经过测试的sgRNA破坏靶基因2或靶基因8增加了细胞响应于tau接种活性来源(条件培养基)而形成tau聚集体的敏感性。在破坏这两个靶标中的任一靶标的细胞中,FRET信号的诱导增加了15-20倍。这两个靶基因的破坏增加了响应条件培养基而不是新鲜培养基的tau聚集体的形成。参见图11。

表5.鉴定的靶标。

靶基因 sgRNA
靶基因1 g1–Lib-A
靶基因1 g5–Lib-B
靶基因2 g1–Lib-A
靶基因2 g2–Lib-A
靶基因2 g3–Lib-A
靶基因2 g6–Lib-B
靶基因3 g2–Lib-A
靶基因3 g5–Lib-B
靶基因4 g3–Lib-A
靶基因4 g5–Lib-B
靶基因5 g1–Lib-A
靶基因5 g4–Lib-B
靶基因6 g2–Lib-A
靶基因6 g5–Lib-B
靶基因7 g1–Lib-A
靶基因7 g5–Lib-B
靶基因8 g5–Lib-B
靶基因8 g6–Lib-B
靶基因9 g2–Lib-A
靶基因9 g6–Lib-B
靶基因10 g1–Lib-A
靶基因10 g6–Lib-B
靶基因11 g3–Lib-A
靶基因11 g4–Lib-B
靶基因12 g1–Lib-A
靶基因12 g6–Lib-B
靶基因13 g5–Lib-B
靶基因13 g6–Lib-B
靶基因14 g1–Lib-A
靶基因14 g4–Lib-B

然后对靶基因2和8进行了进一步的实验,以进一步验证每个基因的靶向促进tau聚集。参见图12。测试了针对靶基因2的两个不同sgRNA,并且使用了针对靶基因8的一个sgRNA。非靶向sgRNA用作阴性对照。在第0天对每个向导RNA进行了四次独立的慢病毒转导。在第6天,在有或没有脂质体的情况下用条件培养基接种tau,并且收集样品用于qRT-PCR。qRT-PCR数据示出于图13中。靶向靶基因2的两个sgRNA中的每一个均降低靶基因2mRNA表达,并且靶向靶基因8的gRNA降低靶基因8表达。在第10天,进行FACS分析以评估FRET信号的诱导。靶向靶基因2的两个sgRNA和靶向靶基因8的gRNA中的每一个都增加了tau聚集。参见图15。在第13天,收集样品用于蛋白质印迹分析。蛋白质印迹结果示出于图14中。与评估mRNA表达的qRT-PCR实验类似,蛋白质2的表达被靶向靶基因2的两个sgRNA降低,并且蛋白质8的表达被靶向靶基因8的sgRNA降低。

通过分离单独的靶基因2敲低克隆和单独的靶基因8敲低克隆以进行验证来进行靶基因2和8作为tau聚集修饰因子的进一步验证。用表达靶基因2sgRNA 1、靶基因8sgRNA 5或非靶向sgRNA的慢病毒转导不具有聚集体(Agg[–])的Cas9表达tau-CFP/tau-YFP生物传感器细胞。然后进行连续克隆稀释以选择单独的克隆。靶基因2mRNA和靶基因8mRNA的水平通过qRT-PCR评估,并且蛋白质2和蛋白质8的水平通过蛋白质印迹评估。每个靶基因2sgRNA克隆都降低了靶基因2mRNA表达(数据未示出)和蛋白质2表达(图16),并且每个靶基因8sgRNA克隆都降低了靶基因8mRNA表达(数据未示出)和蛋白质8表达(图16)。

接下来,每个克隆用条件培养基接种4天,并且进行FRET分析以评估tau聚集。敲低克隆验证了靶基因2和8作为tau聚集修饰因子。参见图17。

然后通过下一代测序进一步表征单独的克隆以测定对靶基因2和靶基因8基因座进行了哪些修饰。修饰总结在下表6中。几乎所有的突变克隆都含有某种百分比的野生型等位基因。FRET[+]细胞的百分比(tau聚集活性)与切割位点处的非同源末端连接引起的插入/缺失百分比相关(即,tau聚集与野生型等位基因的百分比成反相关——野生型等位基因的百分比越低,Fret[+]细胞的百分比越高)。参见图16和表6。

表6.靶基因2和靶基因8克隆的表征。

还通过蛋白质印迹评估了每个克隆中的tau磷酸化。发现tau在靶基因8sgRNA克隆5.7中的S262和S356处过度磷酸化。参见图18。尽管在此实验中,其中tau未被过度磷酸化的克隆似乎仍能增强FRET诱导,但克隆5.7非常不稳定,并且靶基因8涉及许多生物学过程,因此无法得出一般性结论。小鼠原代皮层神经元的进一步实验表明,在用Cas9和靶基因2sgRNA通过慢病毒递送处理的小鼠原代皮层神经元的体细胞树突区室中,phosho-tau(S356)染色增加,并且在培养物中维持14天(数据未示出)。

此验证证实了初次筛选方法在鉴定基因中的价值,所述基因可以调节细胞在暴露于tau播种活性的外部来源时对tau接种的敏感性。因此,通过筛选鉴定的靶标可能是神经退行性疾病上下文中tau病理学细胞间传播的相关靶标,并且将被进一步探索。

实例3.开发全基因组CRISPR/Cas9筛选平台以使用转录激活CRISPR/Cas9文库来鉴定tau聚集基因修饰因子

为了进一步鉴定修饰异常tau蛋白聚集过程的基因和途径,开发了一种用于利用转录激活(hSAM)CRISPRa sgRNA文库进行全基因组筛选以鉴定调节细胞被tau疾病相关蛋白聚集体“接种”的潜力的基因(即当暴露于tau原纤维化蛋白来源时,基因被转录激活时会导致细胞更容易形成tau聚集体)的平台。对此类基因的鉴定可以阐明tau细胞间聚集体传播的机制和控制神经元在神经退行性疾病的上下文中形成tau聚集体的敏感性的基因途径。

筛选采用tau生物传感器人类细胞系,所述细胞系由稳定表达tau四重复结构域tau_4RD的HEK293T细胞组成,所述重复结构域包括具有P301S致病突变的与CFP或YFP融合的tau微管结合结构域(MBD)。即,HEK293T细胞系含有稳定地表达与荧光蛋白CFP或荧光蛋白YFP融合的疾病相关蛋白变体的两种转基因:tau4RD-CFP/tau4RD-YFP(TCY),其中tau重复结构域(4RD)包括P301S致病突变。参见图1。在这些生物传感器系中,tau-CFP/tau-YFP蛋白聚集产生FRET信号,这是荧光能量从供体CFP转移到受体YFP的结果。参见图2。含有tau聚集体的FRET阳性细胞可以通过流式细胞术分选和分离。在基线时,未经刺激的细胞以稳定、可溶性状态表达报告基因,其中FRET信号最小。在刺激(例如,种子颗粒的质脂体转染)时,报告蛋白形成聚集体,产生FRET信号。可以通过FACS分离含有聚集体的细胞。稳定地繁殖的含有聚集体的细胞系Agg[+]可以通过Agg[-]细胞系的克隆连续稀释来分离。

对此tau生物传感器细胞系进行了若干修饰,使其可用于进行基因筛选。首先,此生物传感器细胞系经过进一步转基因修饰以表达CRISPR/Cas SAM转录激活系统的组分:dCas9-VP64和MS2-P65-HSF1。慢病毒dCas9-VP64和MS2-P65-HSF1构建体分别在SEQ ID NO:42和43中提供。克隆被选择作为用于后续文库筛选的高性能克隆。此克隆在激活所选靶基因方面的功效被验证。

其次,如实例1中,开发了使细胞对tau接种活性敏化的试剂和方法。可替代地,如实例5中,如果需要更多的聚集,可以使用来自Agg[+]克隆的细胞裂解物的用途。

实例4.进行全基因组CRISPR/Cas9筛选以使用转录激活CRISPR/Cas9文库来鉴定tau聚集基因修饰因子

为了进一步揭示tau聚集的修饰基因作为FRET[+]细胞中富集的sgRNA,不具有聚集体(Agg[–])的SAM表达tau-CFP/tau-YFP生物传感器细胞使用慢病毒递送方法用人类全基因组CRISPR hSAM sgRNA转导以转录激活每个靶基因。转录起始位点上游200bp范围内的文库靶位点中的sgRNA,其中每个基因的平均覆盖率为约3个sgRNA。sgRNA被设计成通过避免与脱靶基因组序列有两个或更少错配的sgRNA来避免脱靶效应。所述库涵盖18,946个人类基因。文库以<0.3的感染复数(MOI)转导,其中每个sgRNA的覆盖率>300个细胞。tau生物传感器细胞在吉欧霉素选择下生长,以选择整合和表达独特sgRNA的细胞。初次筛选中使用了五个独立的筛选复制。

在转导后第3天和第6天的细胞传代时收集完整的转导细胞群体的样品。在第6天传代之后,细胞在条件培养基中生长以使所述细胞对接种活性敏化。在第10天,使用荧光辅助细胞分选(FACS)具体分离FRET[+]细胞亚群。整合sgRNA构建体的DNA分离和PCR扩增允许在每个时间点通过下一代测序(NGS)对sgRNA库进行表征。

由于数据分析和统计分析反映了实例2中使用的方法,因此此处不再重复实例2中的所有细节。与较早时间点第3天和第6天的sgRNA库相比,NGS数据的统计分析能够鉴定在多个实验的第10天FRET[+]亚群中富集的sgRNA。用于鉴定潜在tau修饰因子的第一策略是使用DNA测序在每个样品中使用DESeq算法产生sgRNA读段计数,以找到在第10天对第3天或第10天对第6天中但不是在第6天对第3天中更丰富的sgRNA(倍数变化(fc)≥1.5并且负二项试验p<0.01)。Fc≥1.5意指(第10天计数的平均值)/(第3天或第6天计数的平均值)的比率≥1.5。P<0.01意指第10天与第3天或第6天计数之间没有统计差异的机会<0.01。DESeq算法是用于“序列计数数据的差异表达分析”的广泛使用的算法。参见例如,Anders等人(2010)《基因组生物学(Genome Biology)》11:R106,所述文献出于所有目的通过引用整体并入本文。

具体地,在每个库中使用了两个比较来鉴定显著的sgRNA:第10天对第3天,以及第10天对第6天。对于这四个比较中的每个比较,都使用了DESeq算法,并且被视为显著的截止阈值是倍数变化≥1.5以及负二项试验p<0.01。一旦在每个文库的这些比较中的每个比较中鉴定了显著向导,如果基因满足以下两个标准之一,那么所述基因被视为是显著的:(1)对应于所述基因的至少两个sgRNA被视为在一个比较(第10天对第3天或第10天对第6天)中是显著的;(2)至少一种sgRNA在两个比较(第10天对第3天和第10天对第6天)中都是显着的。

然而,第一策略要求每个实验组内的读段计数同质性水平可能过于严格。对于相同的sgRNA,许多因素会在每个实验组(第3天、第6天或第10天样品)内的样品之间产生读段计数可变性,如筛选文库中的初始病毒计数、感染或基因编辑效率以及基因编辑后的相对生长速率。因此,还基于第10天(选择后)每个样品中每个基因的向导的阳性出现(读段计数>30)而不是确切读段计数使用了第二策略。给定文库大小(x)、每个基因的向导数量(n)和选择后样品(m)中的阳性向导的总数,计算正式统计p值以积极观察选择后样品(n')中的多个向导(“数字”指的是sgRNA类型(即,独特向导RNA序列),而不是读段计数)(pn'=nCn'*(x-n')C(m-n)/xCm)。n'个向导偶然存在的概率是:pn'=nCn'*(x-n')C(m-n)/xCm。基因g偶然存在n'个或更多个向导的概率计算如下:

与预选择相比,选择后基因读段计数的总体富集被用作用于鉴定阳性基因的另外的参数:(相对丰度=[基因的读段计数]/[所有基因的读段计数]并且选择后富集=[选择后相对丰度]/[相对丰度预选择])。

更具体地,第二策略是用于CRISPR阳性选择的新的更灵敏的分析方法。CRISPR阳性选择的目标是使用DNA测序来鉴定由sgRNA进行的转录激活与表型相关的基因。为了降低噪声背景,这些实验中通常使用同一基因的多个sgRNA以及实验复制。然而,要求同一基因的sgRNA之间以及技术重复之间具有一定程度的同质性/一致性的目前常用的统计分析方法效果不佳。这是因为由于许多可能的原因(例如,不同的感染或基因编辑效率、筛选文库中的初始病毒计数以及具有相同表型的其它sgRNA的存在),这些方法无法处理sgRNA和同一基因的重复之间的巨大差异。相比之下,开发了一种对大变化具有鲁棒性的方法。所述方法基于单独的实验中每个基因的向导的阳性出现次数,而不是每个sgRNA的确切读段计数。给定文库大小、每个基因的sgRNA数量以及每个实验中阳性sgRNA的总数,计算正式统计p值以在实验重复中积极观察sgRNA数量。表型选择之前和之后的相对sgRNA序列读段富集也用作参数。所述方法比目前广泛使用的方法(包含DESeq、MAGECK以及其它)表现得更好。具体地,所述方法包含以下步骤:

(1)对于每个实验,鉴定具有阳性表型的细胞中的任何存在的向导。

(2)在基因水平,计算每个实验中存在向导的随机机会:nCn'*(x-n')C(m-n)/xCm,其中x是表型选择之前向导的种类,m是表型选择之后向导的种类,n是表型选择之前基因的向导的种类,并且n'是表型选择之后基因的向导种类。跨多个实验存在的总体机会(在多个实验中产生的p值之上产生单个p值)由费希尔组合概率测试计算(参考:Fisher,R.A.;Fisher,R.A(1948)“问题和答案(Questions and answers)#14”美国统计学家)。也就是说,首先使用来自多个实验的p值计算测试统计量φ:其中pk是针对第k个实验计算的p值,并且K是实验总数。然后,K个实验的组合p值等于在自由度为2*K的卡方分布下观察φ值的概率。可替代地,通过乘以从每个实验获得的上述计算的概率来计算跨多个实验存在的总体机会。

(3)计算基因水平的向导平均富集:富集得分=选择后的相对丰度/选择前的相对丰度。相对丰度=基因的向导读段计数/所有向导的读段计数。

(4)选择显著低于所存在的随机机会以及高于特定富集得分的基因。

总共34个靶基因(由42个不同的sgRNA靶向)通过两种不同的方法(一种方法或两种方法)被鉴定为在FRET[+]细胞中富集。

实例5.用于tau接种的tau-YFP克隆18Agg[+]细胞裂解物的制备和验证

接下来,想鉴定当被破坏时会减少tau聚集的靶基因(无论是通过阻断种子的摄取、抑制寡聚体或原纤维的形成、促进其分解,还是通过某种其它机制)。为了开发防止tau聚集的此类sgRNA筛选,需要有效的并且可以容易地大量产生的接种活性来源。如此实例中所描述的,发现了来自tau-YFP Agg[+]克隆18的全细胞裂解物可以诱导tau聚集和FRET信号,而来自tau-YFP Agg[-]的裂解物那么不会。与条件培养基或重组tau原纤维相比,全细胞裂解物在接种tau活性(不具有脂质体)方面更有效。为了在更大百分比的细胞(例如>50%)中诱导聚集(FRET),尝试了将全细胞裂解物与脂质体结合使用。还需要开发一种在缓冲液中收集细胞裂解物的方法,所述缓冲液本身对细胞没有毒性。在本文所描述的实验中,使用了磷酸盐缓冲盐水(PBS)+蛋白酶抑制剂来收集细胞并且进行超声处理以裂解细胞。对细胞裂解物进行超声处理3分钟效果最佳。

如下制备细胞以用于超声处理:(1)取6x T175 tau-YFP Agg[–]细胞板和6xT175tau-YFP克隆18Agg[+]细胞板(约5000万个细胞/T175);(2)用10mL PBS冲洗烧瓶,然后将细胞刮入5mL的PBS中;(3)将2xT175收集到15mL管中,然后用总共5mL PBS冲洗这些2xT175并将其添加到15mL管中,最终体积为15mL(应有3管tau-YFP Agg[–]细胞和3管tau-YFP克隆18Agg[+]细胞);(4)以1000rpm旋转管5分钟,吸出,添加4mL PBS/管+40μL HALTTM(六种广谱蛋白酶抑制剂AEBSF、抑肽酶、苯丁抑制素、E-64、亮抑酶肽和胃酶抑素A在高质量二甲亚砜(DMSO)中稳定化)+40μL乙二胺四乙酸(EDTA)/管(蛋白酶抑制剂);以及(5)将细胞悬浮液转移到50mL管中(超声管固持器只能容纳50mL管)并在-80℃下冷冻直至超声处理。

用于产生细胞裂解物的超声处理如下进行:(1)温水浴解冻细胞悬浮液;(2)超声处理1分钟、3分钟或6分钟;(3)将经超声处理的样品以1000rpm旋转5分钟,制成300μL等分试样,并在-80℃下冷冻。

将tau生物传感器细胞tau-CFP/tau-YFP/Cas9克隆7B10C3 Agg[–](C3)和FRET/FACS对照细胞tau-CFP、tau-YFP、HEK-HZ、tau-CFP/tau-YFP/Cas9克隆7B10C3-B2 Agg[+](B2)解冻并接种在12孔板中,并且用10μg、30μg或100μg的上文产生的细胞裂解物进行处理。结果示出于图19中。观察到剂量依赖性应答,并且3分钟超声处理效果最佳。

在随后的实验中,150,000个7B10C3 Agg[–]细胞在24孔板的每孔中一式两份地接种。每孔使用1mL新鲜培养基。添加了0(对照)、10、25或50μg的3分钟tau-YFP Agg[+]克隆18细胞裂解物+/-脂质体(每1mL培养基10μL)。在脂质体的情况下,所有细胞都是Agg[+],但在25和50μg裂解物样品中所有细胞在24小时之后以及在10μg裂解物样品中在48小时之后死亡。

接下来尝试减少使用的裂解物的量。150,000个7B10C3 Agg[–]细胞在24孔板的每孔中一式两份地接种。每孔使用1mL新鲜培养基。添加了0(对照)、1、5或10μg的3分钟tau-YFP Agg[+]克隆18细胞裂解物+/-脂质体(每1mL培养基10μL)。在脂质体的情况下,所有细胞都是Agg[+],但在24小时之后细胞看起来不健康,并且在5和10μg裂解物样品中的细胞在48小时之后死亡。在1μg裂解物样品中,细胞都是Agg[+],但在24小时时看起来有些不健康。3天之后,细胞仍然存活并且是Agg[+]。

接下来尝试减少使用的裂解物的量并且测试不同的脂质体浓度。150,000个7B10C3Agg[–]细胞在24孔板的每孔中一式两份地接种。每孔使用1mL新鲜培养基。添加了0(对照)、0.1、0.5或1μg的3分钟tau-YFP Agg[+]克隆18细胞裂解物+/-脂质体(每1mL培养基1、5或10μL)。在10μL脂质体的情况下,所有样品中的所有细胞都在24小时之后死亡。在5μL脂质体和0.5μg裂解物的情况下,细胞在48小时之后看起来正常,并且大多数是Agg[+]。类似地,在5μL脂质体和1μg裂解物的情况下,细胞在48小时之后看起来正常,并且所有都是Agg[+]。然而,5μL脂质体在0ug和0.1μg样品中是有毒的,因为细胞在48小时之后看起来不健康。在1μL脂质体的情况下,细胞在48小时之后看起来正常,并且在0.1μg裂解物样品中为约30%Agg[+],在0.5μg裂解物样品中为约40%Agg[+],并且在1μg裂解物样品中为约50%Agg[+]。参见图20。进行了类似的实验,测试了3μg、5μg或10μg的细胞裂解物和1μL、2μL或3μL的脂质体。结果示出于图21中。进行了又另一个实验,测试了0.5μg、0.7μg或1μg的细胞裂解物和3.5μL或4μL的脂质体。每种条件下聚集阳性细胞的百分比如下:0.5μg裂解物/3.5μL脂质体:73.5%;0.7μg裂解物/3.5μL脂质体:71.7%;1μg裂解物/3.5μL脂质体:75.7%;0.5μg裂解物/4μL脂质体:76.4%;0.7μg裂解物/4μL脂质体:76.7%;以及1μg裂解物/4μL脂质体:78.0%。在进一步的实验中,2μL和2.5μL脂质体对细胞没有毒性,但3μL、3.5μL、4μL、4.5μL和5μL对细胞有毒。

接下来,扩大到T25烧瓶,接种280万个7B10C3细胞+裂解物+脂质体。FACS/FRET分选在培养2天之后进行。测试了两种条件:(1)每毫升新鲜培养基1.5μg裂解物+2μL脂质体;(2)每毫升新鲜培养基2μg裂解物+2μL脂质体。在第一实验中,965,880个细胞为FRET[-](即,Agg[-])并且984,760个细胞为FRET[+](即,Agg[+])。在第二实验中,547,960个细胞为FRET[-](即,Agg[-])并且855,900个细胞为FRET[+](即,Agg[+])。得出结论的是,对于全基因组筛选,将使用每毫升新鲜培养基2.5μL脂质体并比较两种不同剂量的tau-YFP Agg[+]克隆18细胞裂解物(1.5μg和2μg),这可能会增加百分比的Agg[+]细胞,同时保持其健康。

实例6.进行全基因组CRISPR/Cas9筛选以鉴定防止tau聚集的基因修饰因子

实例2中筛选的目标是鉴定当用弱tau接种材料刺激时被破坏时会促进tau聚集体的形成的修饰基因。相比之下,在此实例中描述的筛选中,用有效的tau接种材料处理了生物传感器细胞,所述材料通常会导致大多数细胞中的tau聚集和FRET诱导。此“最大接种”材料由来自tau-YFP Agg[+]克隆18细胞的经超声处理的全细胞裂解物组成,并利用脂质体转染试剂施加。采用此方法来鉴定当被破坏时会减少tau聚集的靶基因(无论是通过阻断种子的摄取、抑制寡聚体或原纤维的形成、促进其分解,还是通过某种其它机制)。参见图22。

不具有聚集体(Agg[–])的Cas9表达tau-CFP/tau-YFP生物传感器细胞使用慢病毒递送方法用两种人类全基因组CRISPR sgRNA转导以在每个靶基因处引入敲除突变。每个CRISPR sgRNA文库靶向5'组成型外显子进行功能性敲除,其中每个基因的平均覆盖率为约3个sgRNA(组合的两个文库中每个基因总共有6个gRNA)。每个文库的读段计数分布(即,文库中每个gRNA的表示)是正常且类似的。sgRNA被设计成通过避免与脱靶基因组序列有两个或更少错配的sgRNA来避免脱靶效应。所述文库涵盖19,050个人类基因和1864个miRNA,以及1000个非靶向对照sgRNA。文库以<0.3的感染复数(MOI)转导,其中每个sgRNA的覆盖率>300个细胞。tau生物传感器细胞在嘌呤霉素选择下生长,以选择整合和表达独特sgRNA的细胞。嘌呤霉素选择在1μg/mL转导之后24小时开始。初次筛选中使用了五个独立的筛选复制。

在每个复制中,在慢病毒包装的CRISPR文库转导后第3天和第7天收集7B10C3生物传感器细胞的样品。在第7天传代时,将“最大接种”材料添加到细胞中,并且48小时之后(第9天),进行FACS以分离和收集FRET[-]和FRET[+]群体。筛选由五个复制的实验组成。整合sgRNA构建体的DNA分离和PCR扩增允许在每个时间点通过下一代测序(NGS)对sgRNA库进行表征。总共存在40个样品:5个复制筛选*2个文库*每一个4个样品(第3天、第7天、第9天FRET[-]和第9天FRET[+])。对于“最大接种”,每毫升新鲜培养基使用2.5μL脂质体,并且每毫升新鲜培养基测试不同量的细胞裂解物(2μg、4μg和5μg)。

数据分析和统计分析反映了实例2中使用的方法,因此此处不再重复实例2中的细节。比较(配对分析)FRET(-)对FRET(+)对第7天。还与第3天(更严格)进行了配对分析。分析第9天FRET[-]和FRET[+]样品的其富集或耗竭可以表明对tau聚集表型有影响的sgRNA。相对于第9天FRET[+]、第3天和第7天,在第9天FRET[-]细胞中富集的和/或相对于第9天FRET[-]、第3天和第7天,在第9天FRET[+]细胞中耗竭的sgRNA表明靶基因在被破坏时可以减少或防止tau聚集。这些sgRNA命中作为治疗干预的潜在靶标特别令人感兴趣。相对于第9天FRET[-]、第3天和第7天,在第9天FRET[+]细胞中富集的和/或相对于第9天FRET[+]、第3天和第7天,在第9天FRET[-]细胞中耗竭的sgRNA表明靶基因在被破坏时可以促进或增强tau聚集。相对于较早的时间点,在第9天FRET[+]和FRET[-]两者中均耗竭的sgRNA很可能表示在被破坏时会随时间推移降低细胞活力的必需基因。

鉴定了在FRET[-]细胞中富集或耗竭的142个显著gRNA(与FRET[+]细胞和第7天细胞相比)。其中,与第7天相比(与第3天相比不显著),46个gRNA在FRET[-]细胞中耗竭,77个gRNA在FRET[-]细胞中富集并且20个gRNA在FRET[-]细胞中富集。参见图23和24。

接下来,在二次筛选中测试了405个单独的sgRNA以进行验证。在图25中示出了二次筛选的示意图。进行了四个实验。每个实验中使用的细胞裂解物的量为5μg/mL新鲜培养基。测试了四种不同量的脂质体(每毫升新鲜培养基):1.5μL、2μL、2.5μL和3.5μL。此验证证实了初次筛选方法在鉴定可以充当tau聚集的阳性和阴性修饰因子的基因中的价值。

实例7.进行全基因组CRISPR/Cas9筛选以使用转录激活CRISPR/Cas9文库来鉴定防止tau聚集的基因修饰因子

与实例6类似,在此实例中描述的筛选中,用有效的tau接种材料处理了生物传感器细胞,所述材料通常会导致大多数细胞中的tau聚集和FRET诱导。此“最大接种”材料由来自tau-YFP Agg[+]克隆18细胞的经超声处理的全细胞裂解物组成,并利用脂质体转染试剂施加。采用此方法来鉴定当被转录激活时会减少tau聚集的靶基因(无论是通过阻断种子的摄取、抑制寡聚体或原纤维的形成、促进其分解,还是通过某种其它机制)。参见图26。

不具有聚集体(Agg[–])的SAM表达tau-CFP/tau-YFP生物传感器细胞使用慢病毒递送方法用人类全基因组CRISPR hSAM sgRNA文库转导以转录激活每个靶基因。转录起始位点上游200bp范围内的文库靶位点中的sgRNA,其中每个基因的平均覆盖率为约3个sgRNA。sgRNA被设计成通过避免与脱靶基因组序列有两个或更少错配的sgRNA来避免脱靶效应。所述库涵盖18,946个人类基因。文库以<0.3的感染复数(MOI)转导,其中每个sgRNA的覆盖率>300个细胞。tau生物传感器细胞在吉欧霉素选择下生长,以选择整合和表达独特sgRNA的细胞。初次筛选中使用了五个独立的筛选复制。

在第10天(PM)慢病毒包装的CRISPR文库转导后,将“最大接种”材料添加到细胞中,并且在第13天(AM),进行FACS以分离和收集FRET[-]和FRET[+]群体。参见图26。筛选由五个复制的实验组成。整合sgRNA构建体的DNA分离和PCR扩增允许在每个时间点通过下一代测序(NGS)对sgRNA库进行表征。对于“最大接种”,每毫升新鲜培养基使用三种量的脂质体(2.5μL、3.5μL和4μL),并且每毫升新鲜培养基测试不同量的细胞裂解物(3μg、4μg和5μg)。

分析第13天FRET[-]和FRET[+]样品的其富集或耗竭可以表明对tau聚集表型有影响的sgRNA。相对于第13天FRET[+]和第10天,在第13天FRET[-]细胞中富集的和/或相对于第13天FRET[-]和第10天,在第13天FRET[+]细胞中耗竭的sgRNA表明靶基因在被转录激活时可以减少或防止tau聚集。这些sgRNA命中作为治疗干预的潜在靶标特别令人感兴趣。相对于第13天FRET[-]和第10天,在第13天FRET[+]细胞中富集的和/或相对于第13天FRET[+]和第10天,在第13天FRET[-]细胞中耗竭的sgRNA表明靶基因在被转录激活时可以促进或增强tau聚集。如实例6中,数据在二次筛选中进行分析和测试以进行验证。统计分析反映了实例2中使用的方法。比较(配对分析)FRET(-)对FRET(+)对第10天。

实例8.进行全基因组CRISPR/Cas9筛选以鉴定tau解聚基因修饰因子

在上文实例中,进行了两个系列的全基因组筛选,旨在鉴定tau聚集的阳性和阴性调节因子。在第一筛选中,鉴定了当用弱tau接种材料刺激时被破坏时会促进tau聚集体的形成的修饰基因。此“最少接种”材料由从tau-YFP聚集体[+]细胞收集的条件培养基组成,直接施加于7B10C3细胞以在体外(DIV)3天之后触发约0.1%FRET[+]细胞。相比之下,在第二筛选中,用有效或最大的tau接种材料处理了生物传感器细胞,所述材料通常会导致大多数细胞中的tau聚集和FRET诱导。此“最大接种”材料由来自tau-YFP聚集体[+]细胞的经超声处理的全细胞裂解物组成,并利用脂质体转染试剂施加。

在此,用慢病毒包装的CRISPR文库转导了聚集体[+]7B10C3-B2或DC11-B6细胞。7B10C3-B2和DC11-B6是含有稳定传播的Tau聚集体的克隆。此筛选是在表达Cas9(克隆7B10C3)或dCas9-SAM(克隆DC11)的HEK293 tau生物传感器细胞中完成的,其中tau聚集会产生FRET信号,所述信号可以被FACS检测并用作细胞分选的手段。7B10C3和DC11克隆进一步用tau原纤维处理,以便获得含有稳定传播的Tau聚集体的亚克隆。选择这些聚集阳性聚集体[+]稳定亚克隆中的两个(被称为7B10C3-B2和DC11-B6)以进行扩增并用于筛选。

在培养两周之后,通过下一代测序(NGS)进行分离和测序,以揭示FRET[-]细胞中耗竭/富集的单向导RNA(sgRNA),假设sgRNA通过破坏其特异性靶标而导致tau聚集丧失的sgRNA将在FRET[-]群体中富集。FRET[-]细胞群体主要由没有聚集体的细胞构成。然而,观察到一些FRET[-]细胞显示斑点,由不足以发射FRET的微小聚集体构成,并且因此不被FACS识别为FRET[+]。

为了减少FRET[-]群体中的假阳性并最小化主要在有丝分裂后G1期观察到的斑点[+]细胞的数量(参见图28),通过双胸苷阻断(DNA合成抑制剂)来同步细胞循环进程(参见图29)。此同步方法的此新颖的应用使能够获得主要富集在S期的细胞群体,并且从而在有丝分裂之后同步聚集体积累。

每个文库(两个CRISPRn文库和一个CRISPRa文库)进行五次复制筛选。在每个复制中,在慢病毒包装的CRISPR文库转导后第7天和第10天收集7B10C3-B2和DC11-B6生物传感器细胞的样品。在第12天,细胞在胸苷存在下生长21小时。在去除第一阻断胸苷之后(第13天),洗涤细胞并在新鲜培养基中生长8小时以从阻断中释放细胞,并且再次与胸苷一起温育以用于第二阻断。作为此同步的结果,细胞同步地前进通过G2和有丝分裂期,并在S期开始时停止。在第14天,通过第二胸苷阻断释放细胞并在新鲜培养基中生长3小时,让所述细胞同步地前进通过G2期。进行FACS以分离和收集FRET[-]和FRET[+]群体。参见图27。

从每个样品中收集基因组DNA,并且通过PCR从每个样品中扩增sgRNA库。总共存在60个样品:5个复制筛选*3个文库*每一个4个样品(第7天、第10天、第14天FRET[-]和第14天FRET[+])。

数据分析和统计分析反映了实例2中使用的方法,因此此处不再重复实例2中的细节。相对于第14天FRET[+]、第7天和第10天,在第14天FRET[-]细胞中富集的和/或相对于第14天FRET[-]、第7天和第10天,在第14天FRET[+]细胞中耗竭的sgRNA可以表明靶基因在被破坏(或在CRISPRa筛选的情况下被转录激活)时诱导tau解聚。这些sgRNA命中作为治疗干预的潜在靶标特别令人感兴趣。相对于第14天FRET[-]、第7天和第10天,在第14天FRET[+]细胞中富集的和/或相对于第14天FRET[+]、第7天和第10天,在第14天FRET[-]细胞中耗竭的sgRNA可以表明靶基因在被破坏(或在CRISPRa筛选的情况下被转录激活)时促进或增强tau聚集。

序列表

<110> 瑞泽恩制药公司

<120> 用于鉴定tau接种或聚集的基因修饰因子的CRISPR/CAS筛选平台

<130> 057766-544635

<150> US 62/820,086

<151> 2019-03-18

<160> 43

<170> PatentIn版本3.5

<210> 1

<211> 31

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 1

Gln Thr Ala Pro Val Pro Met Pro Asp Leu Lys Asn Val Lys Ser Lys

1 5 10 15

Ile Gly Ser Thr Glu Asn Leu Lys His Gln Pro Gly Gly Gly Lys

20 25 30

<210> 2

<211> 31

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 2

Val Gln Ile Ile Asn Lys Lys Leu Asp Leu Ser Asn Val Gln Ser Lys

1 5 10 15

Cys Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly Gly Gly Ser

20 25 30

<210> 3

<211> 31

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 3

Val Gln Ile Val Tyr Lys Pro Val Asp Leu Ser Lys Val Thr Ser Lys

1 5 10 15

Cys Gly Ser Leu Gly Asn Ile His His Lys Pro Gly Gly Gly Gln

20 25 30

<210> 4

<211> 32

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 4

Val Glu Val Lys Ser Glu Lys Leu Asp Phe Lys Asp Arg Val Gln Ser

1 5 10 15

Lys Ile Gly Ser Leu Asp Asn Ile Thr His Val Pro Gly Gly Gly Asn

20 25 30

<210> 5

<211> 93

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 5

cagacagccc ccgtgcccat gccagacctg aagaatgtca agtccaagat cggctccact 60

gagaacctga agcaccagcc gggaggcggg aag 93

<210> 6

<211> 93

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 6

gtgcagataa ttaataagaa gctggatctt agcaacgtcc agtccaagtg tggctcaaag 60

gataatatca aacacgtccc gggaggcggc agt 93

<210> 7

<211> 93

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 7

gtgcaaatag tctacaaacc agttgacctg agcaaggtga cctccaagtg tggctcatta 60

ggcaacatcc atcataaacc aggaggtggc cag 93

<210> 8

<211> 96

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 8

gtggaagtaa aatctgagaa gcttgacttc aaggacagag tccagtcgaa gattgggtcc 60

ctggacaata tcacccacgt ccctggcgga ggaaat 96

<210> 9

<211> 133

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 9

Leu Gln Thr Ala Pro Val Pro Met Pro Asp Leu Lys Asn Val Lys Ser

1 5 10 15

Lys Ile Gly Ser Thr Glu Asn Leu Lys His Gln Pro Gly Gly Gly Lys

20 25 30

Val Gln Ile Ile Asn Lys Lys Leu Asp Leu Ser Asn Val Gln Ser Lys

35 40 45

Cys Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly Gly Gly Ser Val

50 55 60

Gln Ile Val Tyr Lys Pro Val Asp Leu Ser Lys Val Thr Ser Lys Cys

65 70 75 80

Gly Ser Leu Gly Asn Ile His His Lys Pro Gly Gly Gly Gln Val Glu

85 90 95

Val Lys Ser Glu Lys Leu Asp Phe Lys Asp Arg Val Gln Ser Lys Ile

100 105 110

Gly Ser Leu Asp Asn Ile Thr His Val Pro Gly Gly Gly Asn Lys Lys

115 120 125

Ile Glu Thr His Lys

130

<210> 10

<211> 399

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 10

ctgcagacag cccccgtgcc catgccagac ctgaagaatg tcaagtccaa gatcggctcc 60

actgagaacc tgaagcacca gccgggaggc gggaaggtgc agataattaa taagaagctg 120

gatcttagca acgtccagtc caagtgtggc tcaaaggata atatcaaaca cgtcccggga 180

ggcggcagtg tgcaaatagt ctacaaacca gttgacctga gcaaggtgac ctccaagtgt 240

ggctcattag gcaacatcca tcataaacca ggaggtggcc aggtggaagt aaaatctgag 300

aagcttgact tcaaggacag agtccagtcg aagattgggt ccctggacaa tatcacccac 360

gtccctggcg gaggaaataa aaagattgaa acccacaag 399

<210> 11

<211> 133

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 11

Leu Gln Thr Ala Pro Val Pro Met Pro Asp Leu Lys Asn Val Lys Ser

1 5 10 15

Lys Ile Gly Ser Thr Glu Asn Leu Lys His Gln Pro Gly Gly Gly Lys

20 25 30

Val Gln Ile Ile Asn Lys Lys Leu Asp Leu Ser Asn Val Gln Ser Lys

35 40 45

Cys Gly Ser Lys Asp Asn Ile Lys His Val Ser Gly Gly Gly Ser Val

50 55 60

Gln Ile Val Tyr Lys Pro Val Asp Leu Ser Lys Val Thr Ser Lys Cys

65 70 75 80

Gly Ser Leu Gly Asn Ile His His Lys Pro Gly Gly Gly Gln Val Glu

85 90 95

Val Lys Ser Glu Lys Leu Asp Phe Lys Asp Arg Val Gln Ser Lys Ile

100 105 110

Gly Ser Leu Asp Asn Ile Thr His Val Pro Gly Gly Gly Asn Lys Lys

115 120 125

Ile Glu Thr His Lys

130

<210> 12

<211> 399

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 12

ctgcagacag cccccgtgcc catgccagac ctgaagaatg tcaagtccaa gatcggctcc 60

actgagaacc tgaagcacca gccgggaggc gggaaggtgc agataattaa taagaagctg 120

gatcttagca acgtccagtc caagtgtggc tcaaaggata atatcaaaca cgtctcggga 180

ggcggcagtg tgcaaatagt ctacaaacca gttgacctga gcaaggtgac ctccaagtgt 240

ggctcattag gcaacatcca tcataaacca ggaggtggcc aggtggaagt aaaatctgag 300

aagcttgact tcaaggacag agtccagtcg aagattgggt ccctggacaa tatcacccac 360

gtccctggcg gaggaaataa aaagattgaa acccacaag 399

<210> 13

<211> 238

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 13

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val

1 5 10 15

Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu

20 25 30

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys

35 40 45

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu

50 55 60

Thr Trp Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln

65 70 75 80

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg

85 90 95

Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val

100 105 110

Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile

115 120 125

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn

130 135 140

Tyr Ile Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly

145 150 155 160

Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val

165 170 175

Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro

180 185 190

Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser

195 200 205

Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val

210 215 220

Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210> 14

<211> 714

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 14

gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60

gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120

aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180

gtgaccaccc tgacctgggg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240

cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300

aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360

aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420

ctggagtaca actacatcag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc 480

atcaaggcca acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540

cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600

ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660

ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caag 714

<210> 15

<211> 236

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 15

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val

1 5 10 15

Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu

20 25 30

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys

35 40 45

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe

50 55 60

Gly Tyr Gly Leu Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln

65 70 75 80

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg

85 90 95

Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val

100 105 110

Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile

115 120 125

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn

130 135 140

Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly

145 150 155 160

Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val

165 170 175

Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro

180 185 190

Val Leu Leu Pro Asp Asn His Tyr Leu Ser Tyr Gln Ser Ala Leu Ser

195 200 205

Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val

210 215 220

Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu

225 230 235

<210> 16

<211> 708

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 16

gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60

gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120

aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180

gtgaccacct tcggctacgg cctgcagtgc ttcgcccgct accccgacca catgaagcag 240

cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300

aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360

aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420

ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480

atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540

cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600

ctgagctacc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660

ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctg 708

<210> 17

<211> 77

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 17

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcu 77

<210> 18

<211> 82

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 18

guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60

aaaaguggca ccgagucggu gc 82

<210> 19

<211> 76

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 19

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugc 76

<210> 20

<211> 86

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 20

guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60

uugaaaaagu ggcaccgagu cggugc 86

<210> 21

<211> 1392

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> MISC_FEATURE

<222> (1)..(1384)

<223> Cas9

<220>

<221> MISC_FEATURE

<222> (1385)..(1392)

<223> FLAG

<400> 21

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys

1370 1375 1380

Lys Asp Tyr Lys Asp Asp Asp Asp Lys

1385 1390

<210> 22

<211> 4176

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(4152)

<223> Cas9

<220>

<221> misc_feature

<222> (4153)..(4176)

<223> FLAG

<400> 22

atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60

atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120

cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180

gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240

tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300

ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360

aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420

aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480

atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540

gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600

atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660

cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720

ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780

gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840

cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900

ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960

atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020

cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080

ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140

gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200

aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260

gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320

gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380

agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440

gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500

aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560

tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620

agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680

gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740

tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800

atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860

ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920

cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980

aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040

gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100

agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160

cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220

gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280

atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340

atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400

gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460

gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520

atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580

gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640

aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700

accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760

ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820

actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880

aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940

taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000

taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060

atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120

aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180

cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240

gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300

cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360

gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420

tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480

aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540

tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600

tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660

cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720

cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780

cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840

atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900

cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960

cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020

gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080

gacctgtctc agctgggagg cgacaagcga cctgccgcca caaagaaggc tggacaggct 4140

aagaagaaga aagattacaa agacgatgac gataag 4176

<210> 23

<211> 16

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 23

guuuuagagc uaugcu 16

<210> 24

<211> 67

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 24

agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60

gugcuuu 67

<210> 25

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> misc_feature

<222> (2)..(21)

<223> n = A、T、C或G

<400> 25

gnnnnnnnnn nnnnnnnnnn ngg 23

<210> 26

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(21)

<223> n = A、T、C或G

<400> 26

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 27

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> misc_feature

<222> (3)..(23)

<223> n = A、T、C或G

<400> 27

ggnnnnnnnn nnnnnnnnnn nnngg 25

<210> 28

<211> 72

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 28

aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa guggcaccga 60

gucggugcuu uu 72

<210> 29

<211> 82

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 29

guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60

aaaaguggca ccgagucggu gc 82

<210> 30

<211> 83

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 30

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcuuuu uuu 83

<210> 31

<211> 80

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 31

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcuuuu 80

<210> 32

<211> 92

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 32

guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60

uugaaaaagu ggcaccgagu cggugcuuuu uu 92

<210> 33

<211> 34

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 33

ggccaacaug aggaucaccc augucugcag ggcc 34

<210> 34

<211> 137

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 34

guuuuagagc uaggccaaca ugaggaucac ccaugucugc agggccuagc aaguuaaaau 60

aaggcuaguc cguuaucaac uuggccaaca ugaggaucac ccaugucugc agggccaagu 120

ggcaccgagu cggugcu 137

<210> 35

<211> 157

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(20)

<223> n为a、c、g或u

<400> 35

nnnnnnnnnn nnnnnnnnnn guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60

agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120

ccaugucugc agggccaagu ggcaccgagu cggugcu 157

<210> 36

<211> 1471

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> MISC_FEATURE

<222> (1)..(1384)

<223> dCas9

<220>

<221> MISC_FEATURE

<222> (1405)..(1409)

<223> NLS

<220>

<221> MISC_FEATURE

<222> (1410)..(1471)

<223> VP64

<400> 36

Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys

1 5 10 15

Lys Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

20 25 30

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

35 40 45

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

50 55 60

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

65 70 75 80

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

85 90 95

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

100 105 110

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

115 120 125

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

130 135 140

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

145 150 155 160

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

165 170 175

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

180 185 190

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

195 200 205

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

210 215 220

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

225 230 235 240

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

245 250 255

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

260 265 270

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

275 280 285

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

290 295 300

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

305 310 315 320

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

325 330 335

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

340 345 350

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

355 360 365

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

370 375 380

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

385 390 395 400

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

405 410 415

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

420 425 430

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

435 440 445

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

450 455 460

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

465 470 475 480

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

485 490 495

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

500 505 510

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

515 520 525

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

530 535 540

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

545 550 555 560

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

565 570 575

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

580 585 590

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

595 600 605

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

610 615 620

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

625 630 635 640

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

645 650 655

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

660 665 670

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

675 680 685

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

690 695 700

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

705 710 715 720

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

725 730 735

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

740 745 750

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

755 760 765

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

770 775 780

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

785 790 795 800

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

805 810 815

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

820 825 830

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

835 840 845

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

850 855 860

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg

865 870 875 880

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

885 890 895

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

900 905 910

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

915 920 925

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

930 935 940

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

945 950 955 960

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

965 970 975

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

980 985 990

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

995 1000 1005

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu

1010 1015 1020

Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile

1025 1030 1035

Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe

1040 1045 1050

Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu

1055 1060 1065

Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly

1070 1075 1080

Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr

1085 1090 1095

Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys

1100 1105 1110

Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro

1115 1120 1125

Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp

1130 1135 1140

Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser

1145 1150 1155

Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu

1160 1165 1170

Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser

1175 1180 1185

Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr

1190 1195 1200

Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser

1205 1210 1215

Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1220 1225 1230

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1235 1240 1245

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly

1250 1255 1260

Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His

1265 1270 1275

Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser

1280 1285 1290

Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser

1295 1300 1305

Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu

1310 1315 1320

Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala

1325 1330 1335

Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr

1340 1345 1350

Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile

1355 1360 1365

Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1370 1375 1380

Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

1385 1390 1395

Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly

1400 1405 1410

Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

1415 1420 1425

Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser

1430 1435 1440

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala

1445 1450 1455

Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Cys Thr

1460 1465 1470

<210> 37

<211> 473

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> MISC_FEATURE

<222> (1)..(130)

<223> MCP

<220>

<221> MISC_FEATURE

<222> (151)..(155)

<223> NLS

<220>

<221> MISC_FEATURE

<222> (161)..(341)

<223> P65

<220>

<221> MISC_FEATURE

<222> (350)..(473)

<223> HSF1

<400> 37

Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr

1 5 10 15

Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu

20 25 30

Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser

35 40 45

Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu

50 55 60

Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val

65 70 75 80

Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe

85 90 95

Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu

100 105 110

Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly

115 120 125

Ile Tyr Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

130 135 140

Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly Ser

145 150 155 160

Pro Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser

165 170 175

Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro

180 185 190

Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro

195 200 205

Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly

210 215 220

Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp

225 230 235 240

Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp

245 250 255

Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly

260 265 270

Val Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro

275 280 285

Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro

290 295 300

Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly

305 310 315 320

Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu

325 330 335

Ser Gln Ile Ser Ser Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser

340 345 350

Val Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val

355 360 365

Pro Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln

370 375 380

Glu Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn

385 390 395 400

Ser Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro

405 410 415

Leu Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp Leu

420 425 430

Pro Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp

435 440 445

Gly Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro

450 455 460

Pro Lys Ala Lys Asp Pro Thr Val Ser

465 470

<210> 38

<211> 4413

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(4152)

<223> dCas9

<220>

<221> misc_feature

<222> (4213)..(4227)

<223> NLS

<220>

<221> misc_feature

<222> (4228)..(4413)

<223> VP64

<400> 38

atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa ggacaagaag 60

tacagcatcg gcctggccat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120

tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180

aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240

aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300

atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360

ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420

gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480

agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540

cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600

ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660

ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720

ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggcaacct gattgccctg 780

agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840

cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900

cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960

atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020

tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080

gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140

ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200

ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260

ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320

cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380

accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440

atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500

ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560

gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620

accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680

aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740

aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800

gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860

gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920

ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980

gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040

aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100

tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160

aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220

gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280

gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340

agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400

gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460

cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520

gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccacat cgtgcctcag 2580

agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caaggcccgg 2640

ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700

cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760

agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820

cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880

gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940

gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000

cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060

gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120

agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180

tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240

acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300

aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360

ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420

gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480

gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540

gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600

aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660

gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720

gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780

ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840

tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900

gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960

caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020

aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080

gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140

ctgggaggcg acagcgctgg aggaggtgga agcggaggag gaggaagcgg aggaggaggt 4200

agcggaccta agaaaaagag gaaggtggcg gccgctggat ccggacgggc tgacgcattg 4260

gacgattttg atctggatat gctgggaagt gacgccctcg atgattttga ccttgacatg 4320

cttggttcgg atgcccttga tgactttgac ctcgacatgc tcggcagtga cgcccttgat 4380

gatttcgacc tggacatgct gattaactgt aca 4413

<210> 39

<211> 1419

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(390)

<223> MCP

<220>

<221> misc_feature

<222> (451)..(465)

<223> NLS

<220>

<221> misc_feature

<222> (481)..(1023)

<223> P65

<220>

<221> misc_feature

<222> (1048)..(1419)

<223> HSF1

<400> 39

atggcttcaa actttactca gttcgtgctc gtggacaatg gtgggacagg ggatgtgaca 60

gtggctcctt ctaatttcgc taatggggtg gcagagtgga tcagctccaa ctcacggagc 120

caggcctaca aggtgacatg cagcgtcagg cagtctagtg cccagaagag aaagtatacc 180

atcaaggtgg aggtccccaa agtggctacc cagacagtgg gcggagtcga actgcctgtc 240

gccgcttgga ggtcctacct gaacatggag ctcactatcc caattttcgc taccaattct 300

gactgtgaac tcatcgtgaa ggcaatgcag gggctcctca aagacggtaa tcctatccct 360

tccgccatcg ccgctaactc aggtatctac agcgctggag gaggtggaag cggaggagga 420

ggaagcggag gaggaggtag cggacctaag aaaaagagga aggtggcggc cgctggatcc 480

ccttcagggc agatcagcaa ccaggccctg gctctggccc ctagctccgc tccagtgctg 540

gcccagacta tggtgccctc tagtgctatg gtgcctctgg cccagccacc tgctccagcc 600

cctgtgctga ccccaggacc accccagtca ctgagcgctc cagtgcccaa gtctacacag 660

gccggcgagg ggactctgag tgaagctctg ctgcacctgc agttcgacgc tgatgaggac 720

ctgggagctc tgctggggaa cagcaccgat cccggagtgt tcacagatct ggcctccgtg 780

gacaactctg agtttcagca gctgctgaat cagggcgtgt ccatgtctca tagtacagcc 840

gaaccaatgc tgatggagta ccccgaagcc attacccggc tggtgaccgg cagccagcgg 900

ccccccgacc ccgctccaac tcccctggga accagcggcc tgcctaatgg gctgtccgga 960

gatgaagact tctcaagcat cgctgatatg gactttagtg ccctgctgtc acagatttcc 1020

tctagtgggc agggaggagg tggaagcggc ttcagcgtgg acaccagtgc cctgctggac 1080

ctgttcagcc cctcggtgac cgtgcccgac atgagcctgc ctgaccttga cagcagcctg 1140

gccagtatcc aagagctcct gtctccccag gagcccccca ggcctcccga ggcagagaac 1200

agcagcccgg attcagggaa gcagctggtg cactacacag cgcagccgct gttcctgctg 1260

gaccccggct ccgtggacac cgggagcaac gacctgccgg tgctgtttga gctgggagag 1320

ggctcctact tctccgaagg ggacggcttc gccgaggacc ccaccatctc cctgctgaca 1380

ggctcggagc ctcccaaagc caaggacccc actgtctcc 1419

<210> 40

<211> 130

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 40

Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr

1 5 10 15

Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu

20 25 30

Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser

35 40 45

Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu

50 55 60

Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val

65 70 75 80

Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe

85 90 95

Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu

100 105 110

Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly

115 120 125

Ile Tyr

130

<210> 41

<211> 390

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 41

atggcttcaa actttactca gttcgtgctc gtggacaatg gtgggacagg ggatgtgaca 60

gtggctcctt ctaatttcgc taatggggtg gcagagtgga tcagctccaa ctcacggagc 120

caggcctaca aggtgacatg cagcgtcagg cagtctagtg cccagaagag aaagtatacc 180

atcaaggtgg aggtccccaa agtggctacc cagacagtgg gcggagtcga actgcctgtc 240

gccgcttgga ggtcctacct gaacatggag ctcactatcc caattttcgc taccaattct 300

gactgtgaac tcatcgtgaa ggcaatgcag gggctcctca aagacggtaa tcctatccct 360

tccgccatcg ccgctaactc aggtatctac 390

<210> 42

<211> 6673

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 42

gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc cgagaagttg gggggagggg 60

tcggcaattg aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa agtgatgtcg 120

tgtactggct ccgccttttt cccgagggtg ggggagaacc gtatataagt gcagtagtcg 180

ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac acaggtaagt gccgtgtgtg 240

gttcccgcgg gcctggcctc tttacgggtt atggcccttg cgtgccttga attacttcca 300

cctggctgca gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt 360

cgaggccttg cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc 420

gctggggccg ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata 480

agtctctagc catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata 540

gtcttgtaaa tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg 600

gcgacggggc ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc 660

caccgagaat cggacggggg tagtctcaag ctggccggcc tgctctggtg cctggcctcg 720

cgccgccgtg tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt 780

gagcggaaag atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc 840

gctcgggaga gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag 900

ccgtcgcttc atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct 960

cgagcttttg gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc 1020

cccacactga gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct 1080

tggaatttgc cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc 1140

aaagtttttt tcttccattt caggtgtcgt gacgtacggc caccatgaaa aggccggcgg 1200

ccacgaaaaa ggccggccag gcaaaaaaga aaaaggacaa gaagtacagc atcggcctgg 1260

ccatcggcac caactctgtg ggctgggccg tgatcaccga cgagtacaag gtgcccagca 1320

agaaattcaa ggtgctgggc aacaccgacc ggcacagcat caagaagaac ctgatcggag 1380

ccctgctgtt cgacagcggc gaaacagccg aggccacccg gctgaagaga accgccagaa 1440

gaagatacac cagacggaag aaccggatct gctatctgca agagatcttc agcaacgaga 1500

tggccaaggt ggacgacagc ttcttccaca gactggaaga gtccttcctg gtggaagagg 1560

ataagaagca cgagcggcac cccatcttcg gcaacatcgt ggacgaggtg gcctaccacg 1620

agaagtaccc caccatctac cacctgagaa agaaactggt ggacagcacc gacaaggccg 1680

acctgcggct gatctatctg gccctggccc acatgatcaa gttccggggc cacttcctga 1740

tcgagggcga cctgaacccc gacaacagcg acgtggacaa gctgttcatc cagctggtgc 1800

agacctacaa ccagctgttc gaggaaaacc ccatcaacgc cagcggcgtg gacgccaagg 1860

ccatcctgtc tgccagactg agcaagagca gacggctgga aaatctgatc gcccagctgc 1920

ccggcgagaa gaagaatggc ctgttcggca acctgattgc cctgagcctg ggcctgaccc 1980

ccaacttcaa gagcaacttc gacctggccg aggatgccaa actgcagctg agcaaggaca 2040

cctacgacga cgacctggac aacctgctgg cccagatcgg cgaccagtac gccgacctgt 2100

ttctggccgc caagaacctg tccgacgcca tcctgctgag cgacatcctg agagtgaaca 2160

ccgagatcac caaggccccc ctgagcgcct ctatgatcaa gagatacgac gagcaccacc 2220

aggacctgac cctgctgaaa gctctcgtgc ggcagcagct gcctgagaag tacaaagaga 2280

ttttcttcga ccagagcaag aacggctacg ccggctacat tgacggcgga gccagccagg 2340

aagagttcta caagttcatc aagcccatcc tggaaaagat ggacggcacc gaggaactgc 2400

tcgtgaagct gaacagagag gacctgctgc ggaagcagcg gaccttcgac aacggcagca 2460

tcccccacca gatccacctg ggagagctgc acgccattct gcggcggcag gaagattttt 2520

acccattcct gaaggacaac cgggaaaaga tcgagaagat cctgaccttc cgcatcccct 2580

actacgtggg ccctctggcc aggggaaaca gcagattcgc ctggatgacc agaaagagcg 2640

aggaaaccat caccccctgg aacttcgagg aagtggtgga caagggcgct tccgcccaga 2700

gcttcatcga gcggatgacc aacttcgata agaacctgcc caacgagaag gtgctgccca 2760

agcacagcct gctgtacgag tacttcaccg tgtataacga gctgaccaaa gtgaaatacg 2820

tgaccgaggg aatgagaaag cccgccttcc tgagcggcga gcagaaaaag gccatcgtgg 2880

acctgctgtt caagaccaac cggaaagtga ccgtgaagca gctgaaagag gactacttca 2940

agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt ggaagatcgg ttcaacgcct 3000

ccctgggcac ataccacgat ctgctgaaaa ttatcaagga caaggacttc ctggacaatg 3060

aggaaaacga ggacattctg gaagatatcg tgctgaccct gacactgttt gaggacagag 3120

agatgatcga ggaacggctg aaaacctatg cccacctgtt cgacgacaaa gtgatgaagc 3180

agctgaagcg gcggagatac accggctggg gcaggctgag ccggaagctg atcaacggca 3240

tccgggacaa gcagtccggc aagacaatcc tggatttcct gaagtccgac ggcttcgcca 3300

acagaaactt catgcagctg atccacgacg acagcctgac ctttaaagag gacatccaga 3360

aagcccaggt gtccggccag ggcgatagcc tgcacgagca cattgccaat ctggccggca 3420

gccccgccat taagaagggc atcctgcaga cagtgaaggt ggtggacgag ctcgtgaaag 3480

tgatgggccg gcacaagccc gagaacatcg tgatcgaaat ggccagagag aaccagacca 3540

cccagaaggg acagaagaac agccgcgaga gaatgaagcg gatcgaagag ggcatcaaag 3600

agctgggcag ccagatcctg aaagaacacc ccgtggaaaa cacccagctg cagaacgaga 3660

agctgtacct gtactacctg cagaatgggc gggatatgta cgtggaccag gaactggaca 3720

tcaaccggct gtccgactac gatgtggacc acatcgtgcc tcagagcttt ctgaaggacg 3780

actccatcga caacaaggtg ctgaccagaa gcgacaaggc ccggggcaag agcgacaacg 3840

tgccctccga agaggtcgtg aagaagatga agaactactg gcggcagctg ctgaacgcca 3900

agctgattac ccagagaaag ttcgacaatc tgaccaaggc cgagagaggc ggcctgagcg 3960

aactggataa ggccggcttc atcaagagac agctggtgga aacccggcag atcacaaagc 4020

acgtggcaca gatcctggac tcccggatga acactaagta cgacgagaat gacaagctga 4080

tccgggaagt gaaagtgatc accctgaagt ccaagctggt gtccgatttc cggaaggatt 4140

tccagtttta caaagtgcgc gagatcaaca actaccacca cgcccacgac gcctacctga 4200

acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa gctggaaagc gagttcgtgt 4260

acggcgacta caaggtgtac gacgtgcgga agatgatcgc caagagcgag caggaaatcg 4320

gcaaggctac cgccaagtac ttcttctaca gcaacatcat gaactttttc aagaccgaga 4380

ttaccctggc caacggcgag atccggaagc ggcctctgat cgagacaaac ggcgaaaccg 4440

gggagatcgt gtgggataag ggccgggatt ttgccaccgt gcggaaagtg ctgagcatgc 4500

cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg cggcttcagc aaagagtcta 4560

tcctgcccaa gaggaacagc gataagctga tcgccagaaa gaaggactgg gaccctaaga 4620

agtacggcgg cttcgacagc cccaccgtgg cctattctgt gctggtggtg gccaaagtgg 4680

aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct gctggggatc accatcatgg 4740

aaagaagcag cttcgagaag aatcccatcg actttctgga agccaagggc tacaaagaag 4800

tgaaaaagga cctgatcatc aagctgccta agtactccct gttcgagctg gaaaacggcc 4860

ggaagagaat gctggcctct gccggcgaac tgcagaaggg aaacgaactg gccctgccct 4920

ccaaatatgt gaacttcctg tacctggcca gccactatga gaagctgaag ggctcccccg 4980

aggataatga gcagaaacag ctgtttgtgg aacagcacaa gcactacctg gacgagatca 5040

tcgagcagat cagcgagttc tccaagagag tgatcctggc cgacgctaat ctggacaaag 5100

tgctgtccgc ctacaacaag caccgggata agcccatcag agagcaggcc gagaatatca 5160

tccacctgtt taccctgacc aatctgggag cccctgccgc cttcaagtac tttgacacca 5220

ccatcgaccg gaagaggtac accagcacca aagaggtgct ggacgccacc ctgatccacc 5280

agagcatcac cggcctgtac gagacacgga tcgacctgtc tcagctggga ggcgacagcg 5340

ctggaggagg tggaagcgga ggaggaggaa gcggaggagg aggtagcgga cctaagaaaa 5400

agaggaaggt ggcggccgct ggatccggac gggctgacgc attggacgat tttgatctgg 5460

atatgctggg aagtgacgcc ctcgatgatt ttgaccttga catgcttggt tcggatgccc 5520

ttgatgactt tgacctcgac atgctcggca gtgacgccct tgatgatttc gacctggaca 5580

tgctgattaa ctgtacaggc agtggagagg gcagaggaag tctgctaaca tgcggtgacg 5640

tcgaggagaa tcctggccca atggccaagc ctttgtctca agaagaatcc accctcattg 5700

aaagagcaac ggctacaatc aacagcatcc ccatctctga agactacagc gtcgccagcg 5760

cagctctctc tagcgacggc cgcatcttca ctggtgtcaa tgtatatcat tttactgggg 5820

gaccttgtgc agaactcgtg gtgctgggca ctgctgctgc tgcggcagct ggcaacctga 5880

cttgtatcgt cgcgatcgga aatgagaaca ggggcatctt gagcccctgc ggacggtgcc 5940

gacaggtgct tctcgatctg catcctggga tcaaagccat agtgaaggac agtgatggac 6000

agccgacggc agttgggatt cgtgaattgc tgccctctgg ttatgtgtgg gagggctaag 6060

aattcgatat caagcttatc ggtaatcaac ctctggatta caaaatttgt gaaagattga 6120

ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 6180

tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 6240

tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg 6300

tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg 6360

ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc 6420

gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat 6480

catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct 6540

tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg 6600

ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg 6660

ccgcctcccc gca 6673

<210> 43

<211> 4324

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 43

gtgcccgtca gtgggcagag cgcacatcgc ccacagtccc cgagaagttg gggggagggg 60

tcggcaattg aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa agtgatgtcg 120

tgtactggct ccgccttttt cccgagggtg ggggagaacc gtatataagt gcagtagtcg 180

ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac acaggtaagt gccgtgtgtg 240

gttcccgcgg gcctggcctc tttacgggtt atggcccttg cgtgccttga attacttcca 300

cctggctgca gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt 360

cgaggccttg cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc 420

gctggggccg ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata 480

agtctctagc catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata 540

gtcttgtaaa tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg 600

gcgacggggc ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc 660

caccgagaat cggacggggg tagtctcaag ctggccggcc tgctctggtg cctggcctcg 720

cgccgccgtg tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt 780

gagcggaaag atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc 840

gctcgggaga gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag 900

ccgtcgcttc atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct 960

cgagcttttg gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc 1020

cccacactga gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct 1080

tggaatttgc cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc 1140

aaagtttttt tcttccattt caggtgtcgt gacgtacggc caccatggct tcaaacttta 1200

ctcagttcgt gctcgtggac aatggtggga caggggatgt gacagtggct ccttctaatt 1260

tcgctaatgg ggtggcagag tggatcagct ccaactcacg gagccaggcc tacaaggtga 1320

catgcagcgt caggcagtct agtgcccaga agagaaagta taccatcaag gtggaggtcc 1380

ccaaagtggc tacccagaca gtgggcggag tcgaactgcc tgtcgccgct tggaggtcct 1440

acctgaacat ggagctcact atcccaattt tcgctaccaa ttctgactgt gaactcatcg 1500

tgaaggcaat gcaggggctc ctcaaagacg gtaatcctat cccttccgcc atcgccgcta 1560

actcaggtat ctacagcgct ggaggaggtg gaagcggagg aggaggaagc ggaggaggag 1620

gtagcggacc taagaaaaag aggaaggtgg cggccgctgg atccccttca gggcagatca 1680

gcaaccaggc cctggctctg gcccctagct ccgctccagt gctggcccag actatggtgc 1740

cctctagtgc tatggtgcct ctggcccagc cacctgctcc agcccctgtg ctgaccccag 1800

gaccacccca gtcactgagc gctccagtgc ccaagtctac acaggccggc gaggggactc 1860

tgagtgaagc tctgctgcac ctgcagttcg acgctgatga ggacctggga gctctgctgg 1920

ggaacagcac cgatcccgga gtgttcacag atctggcctc cgtggacaac tctgagtttc 1980

agcagctgct gaatcagggc gtgtccatgt ctcatagtac agccgaacca atgctgatgg 2040

agtaccccga agccattacc cggctggtga ccggcagcca gcggcccccc gaccccgctc 2100

caactcccct gggaaccagc ggcctgccta atgggctgtc cggagatgaa gacttctcaa 2160

gcatcgctga tatggacttt agtgccctgc tgtcacagat ttcctctagt gggcagggag 2220

gaggtggaag cggcttcagc gtggacacca gtgccctgct ggacctgttc agcccctcgg 2280

tgaccgtgcc cgacatgagc ctgcctgacc ttgacagcag cctggccagt atccaagagc 2340

tcctgtctcc ccaggagccc cccaggcctc ccgaggcaga gaacagcagc ccggattcag 2400

ggaagcagct ggtgcactac acagcgcagc cgctgttcct gctggacccc ggctccgtgg 2460

acaccgggag caacgacctg ccggtgctgt ttgagctggg agagggctcc tacttctccg 2520

aaggggacgg cttcgccgag gaccccacca tctccctgct gacaggctcg gagcctccca 2580

aagccaagga ccccactgtc tcctgtacag gcagtggaga gggcagagga agtctgctaa 2640

catgcggtga cgtcgaggag aatcctggcc caaccatgaa aaagcctgaa ctcaccgcta 2700

cctctgtcga gaagtttctg atcgaaaagt tcgacagcgt ctccgacctg atgcagctct 2760

ccgagggcga agaatctcgg gctttcagct tcgatgtggg agggcgtgga tatgtcctgc 2820

gggtgaatag ctgcgccgat ggtttctaca aagatcgcta tgtttatcgg cactttgcat 2880

ccgccgctct ccctattccc gaagtgcttg acattgggga gttcagcgag agcctgacct 2940

attgcatctc ccgccgtgca cagggtgtca ccttgcaaga cctgcctgaa accgaactgc 3000

ccgctgttct ccagcccgtc gccgaggcca tggatgccat cgctgccgcc gatcttagcc 3060

agaccagcgg gttcggccca ttcggacctc aaggaatcgg tcaatacact acatggcgcg 3120

atttcatctg cgctattgct gatccccatg tgtatcactg gcaaactgtg atggacgaca 3180

ccgtcagtgc ctccgtcgcc caggctctcg atgagctgat gctttgggcc gaggactgcc 3240

ccgaagtccg gcacctcgtg cacgccgatt tcggctccaa caatgtcctg accgacaatg 3300

gccgcataac agccgtcatt gactggagcg aggccatgtt cggggattcc caatacgagg 3360

tcgccaacat cttcttctgg aggccctggt tggcttgtat ggagcagcag acccgctact 3420

tcgagcggag gcatcccgag cttgcaggat ctcctcggct ccgggcttat atgctccgca 3480

ttggtcttga ccaactctat cagagcttgg ttgacggcaa tttcgatgat gcagcttggg 3540

ctcagggtcg ctgcgacgca atcgtccggt ccggagccgg gactgtcggg cgtacacaaa 3600

tcgcccgcag aagcgctgcc gtctggaccg atggctgtgt ggaagtgctc gccgatagtg 3660

gaaacagacg ccccagcact cgtcctaggg caaaggatct gcagtaatga gaattcgata 3720

tcaagcttat cggtaatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 3780

ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 3840

ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc 3900

tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg 3960

acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg 4020

ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga 4080

caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct 4140

ttccttggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg 4200

tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc 4260

ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc 4320

cgca 4324

181页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:脉络丛类器官及其产生方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!