用于细胞类型特异性谱分析以鉴定药物靶标的方法
阅读说明:本技术 用于细胞类型特异性谱分析以鉴定药物靶标的方法 (Methods for cell type specific profiling to identify drug targets ) 是由 N·海因茨 X·许 于 2018-02-09 设计创作,主要内容包括:本发明提供了谱分析来自单一细胞类型的多个核的基因和蛋白质表达并比较这些谱以确定细胞群、来自不同受试者的样品和表达疾病表型的细胞之间的可变性的方法。(The present invention provides methods for profiling gene and protein expression from multiple nuclei of a single cell type and comparing these profiles to determine variability between cell populations, samples from different subjects, and cells expressing a disease phenotype.)
相关申请的交叉引用
本申请要求2017年2月10日提交的美国临时专利申请62/457,420和2017年9月14日提交的美国临时专利申请62/558,396的优先权,其各自通过引用整体并入本文。
序列表
本申请包含“冗长的”序列表,其已经通过CD-R提交以代替印刷的纸质副本,并且其全部内容通过引用并入本文。其包含如下所示的作为最初提交的主题的一部分的序列表文本文件:文件名:2111_1000PCT_SL.txt;文件大小:123,473,920字节;创建日期:2018年2月9日。这些CD-R分别标记为“CRF”、“副本1”和“副本2”,并且每个仅包含一个相同的文件,如上面所标识的那样。每个CD-R的机器可读格式是IBM-PC,并且每个光盘的操作系统是MS-Windows。
发明领域
本发明涉及谱分析来自单一细胞类型的多个核的基因和蛋白质表达以鉴定药物靶标。
发明背景
哺乳动物中枢神经系统(CNS)是包含数百种不同的混合细胞类型的复杂器官。遗传靶向(Gong,等(2003)Nature 425,917-925)和在分子上谱分析特定细胞类型(Heiman,等(2008)Cell 135,738-748)的能力已经开始提供对于哺乳动物脑的基本特征的洞察,这是在一个世纪前Ramon y Cajal的创始研究中发现的(Ramon y Cajal,S.,等(1899).Textureof the Nervous System of Man and the Vertebrates(Wein New York:Springer)。每个在解剖学上不同的经典定义的细胞类型表达一组特征性的基因(Dougherty,等(2010)Nucleic Acids Res 38,4218-4230和Doyle,等(2008)Cell 135,749-762),并且这些基因赋予对特化细胞功能必不可少的特性(Kim,I.-J.,等(2008)Nature 452,478-482;Nakajima,M.,等(2014)Cell 159,295-305)。这些基因的表达依赖于组织核功能的细胞特异性表观遗传状态的维持(Kriaucionis,等(2009)Science 324,929-930;Mellén,等(2012)Cell 151,1417-1430)。目前的谱分析技术在小鼠模型中的应用也导致实现了环境影响(Heiman,等(2008)Cell 135,738-748;Shrestha,等(2015)eLife 4,289)、内部生理诱因(Schmidt,等(2012)Cell 149,1152-1163)和引起疾病的遗传病变(Fyffe,等(2008)Neuron 59,947-958;Ingram,等(2016)Neuron 89,1194-1207)改变受影响细胞类型中的基因表达。尽管实验系统取得了进步,但人脑复杂性的基本问题仍未得到解决。例如,不知道人脑中存在多少不同的细胞类型,这些细胞类型在个体之间或物种之间如何变化,脑衰老的过程在细胞类型之间是否相同,以及为什么广泛表达基因的突变可以在一种或几种选择的细胞类型中产生破坏性后果。
尽管关于精神病和神经变性疾病中受影响的回路有着丰富的信息,但是具体调节这些回路的能力需要知道仅发现于回路中的神经元中的靶标。
先前开发了一种称为翻译核糖体亲和纯化(Translating Ribosomal AffinityPurification,TRAP)的方法,以能够鉴定在目的细胞类型中表达的所有基因。TRAP谱分析研究已经导致开发了若干种已进入临床研究的药物。尽管TRAP技术已经实现了一些药物开发,但TRAP的主要限制是靶标鉴定最初使用转基因小鼠进行。虽然小鼠和人类类似,但两种物种的CNS回路存在已知差异,并且在直系同源细胞类型中基因表达也可能存在差异。此外,尚不清楚特定细胞中有多少基因表达因个体受试者而异,以及这些差异是否影响发病机制或对治疗的响应。在TRAP中,使用BAC载体产生转基因小鼠品系。参见Doyle等,Cell,135:749-762(2008)和Heiman等,Cell,135:738-748(2008),其通过引用整体并入本文。然后该方法称为bacTRAP。
在该方法中,EGFP-L10a核掂体融合蛋白靶向期望的细胞类型,例如浦肯野细胞(Purkinje cell)。使用抗EGFP包被的磁珠对细胞特异性多核糖体RNA进行亲和纯化,如Heiman等所述。微阵列可用于分析纯化的样品。BAC通常选自由洛克菲勒大学(TheRockefeller University)的Nathaniel Heintz博士开发的基因表达神经系统图谱(geneexpression nervous system atlas,GENSAT)项目(www.gensat.org)。在一些情况下,转基因可以在多于一种细胞类型中表达。例如,Doyle等的免疫荧光显示EGFP-L10a在小脑分子层的Pvalb阳性和NeuN阴性中间神经元两者中表达,这证明星状细胞和篮细胞两者都被靶向。将mRNA免疫沉淀,并对mRNA样品进行全基因组转录谱分析。将这些结果与非免疫沉淀样品的谱分析进行比较,以鉴定细胞类型特异性的标志物。
为了开发更有效和特异性的药物,需要直接从人和人组织而不是转基因小鼠中鉴定候选靶标,并且需要确定这些靶标在个体之间变化的程度。因此,长期以来需要能够对野生型动物和人中确定的细胞类型进行分子研究的可普遍适用方法。此外,需要非遗传技术来补充模型系统中神经细胞类型和回路的特定特征的发现,并提供对人类神经系统的潜在独特特性的洞察。
发明内容
本发明的多种实施方案提供了谱分析核的基因表达的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与亲和标记物接触来标记所述经处理的组织样品中的至少一种核,所述亲和标记物与所述组织样品中包含的至少一种细胞类型的核特有的核酸转录物或蛋白质结合,其中所述核酸转录物或蛋白质由选自表19-24的基因编码;纯化至少一种标记的核;以及收集标记的核的核酸转录物和/或蛋白质表达数据,从而谱分析所述核的基因表达。
在一些实施方案中,细胞类型来源于小脑组织,并且选自:颗粒细胞、浦肯野细胞、胶质细胞、伯格曼胶质细胞、多巴胺能神经元、篮/星状细胞、星形胶质细胞、脑干运动神经元、少突胶质细胞、上运动神经元、下运动神经元和小脑深核(cerebellar deep nuclei)。在一些实施方案中,蛋白质是位于核内的转录因子。在一些实施方案中,所述细胞类型来源于基底神经节组织,并且选自:纹状体黑质中型多棘神经元(striatonigral medium-sizedspiny neuron,MSN)、纹状体苍白球MSN(striatopallidal MSN)、纹状体胆碱能中间神经元(striatal cholinergic interneuron)、丘脑底核(subthalamic nucleus)、多巴胺能神经元和终纹床核(bed nucleus of the stria terminalis,BNST)神经元。在一些实施方案中,细胞类型来源于丘脑组织,并且选自:丘脑皮质神经元、丘脑纹状体神经元和丘脑网状核神经元。在一些实施方案中,细胞类型来源于皮质组织,并且选自皮质纹状体神经元、内嗅皮质2/3层神经元、快速刺激皮质中间神经元和来自前额皮质组织的2/3层锥体细胞。细胞类型是来自松果腺的内侧缰核组织的胆碱能投射神经元。在一些实施方案中,细胞类型来源于海马组织,并且选自:海马角区域1(CA1)、海马角区域2(CA2)、海马角区域3(CA3)、和齿状回细胞。在一些实施方案中,细胞类型来源于选自以下的至少一种组织:脑组织、脑干组织和脊髓组织。
本发明的多种实施方案提供了分离颗粒细胞的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与至少一种亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与由基因Itpr、NeuN、Cdh15、Calb2、Rbfox3、Neurod1和Reln之一编码的核酸转录物或蛋白质结合,其中所述核酸转录物或蛋白质是颗粒细胞的核特有的;以及纯化至少一种标记的核。在一些实施方案中,至少一种标记的核不包含由Olig2编码的核酸转录物。
本发明的多种实施方案提供了分离浦肯野细胞的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与由基因Pcp2、Pvalb、Cabl1和Itpr1之一编码的核酸转录物或蛋白质结合;以及纯化至少一种标记的核。
本发明的多种实施方案提供了分离浦肯野细胞的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与由基因Lypd6、Pvalb、Kit、NeuN、Itpr和Sorcs3之一编码的核酸转录物或蛋白质结合;以及纯化至少一种标记的核。
本发明的多种实施方案提供了分离星形胶质细胞和少突胶质细胞的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与由基因Olig2、Pdga、Cspg4、Mag、Mbp和Mog之一编码的核酸转录物或蛋白质结合;以及纯化至少一种标记的核。
本发明的多种实施方案提供了分离星形胶质细胞的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与由基因Aldhlal、Gfap、S110b、和Slcla3之一编码的核酸转录物或蛋白质结合;以及纯化至少一种标记的核。
本发明的多种实施方案提供了分离篮细胞的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与至少一种亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与由Sorcs3和NeuN编码的核酸转录物或蛋白质结合,其中由Sorcs3编码的核酸转录物或蛋白质的组合是篮细胞的核特有的;以及纯化至少一种标记的核。
本发明的多种实施方案提供了分离多巴胺能神经元的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与至少一种亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与由FoxA1、Slc6a3、TH、FoxA2或Drd2编码的核酸转录物或蛋白质结合,其中核酸转录物或蛋白质是多巴胺能神经元的核特有的;以及纯化至少一种标记的核。
本发明的多种实施方案提供了一种分离脑干运动神经元的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与至少一种亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与由VaChT或EnB编码的核酸转录物或蛋白质结合,其中核酸转录物或蛋白质是脑干运动神经元的核特有的;以及纯化至少一种标记的核。
在一些实施方案中,亲和标记物选自抗体、RNA探针和DNA探针。在一些实施方案中,所述方法还包括收集标记的核的核酸转录物和/或蛋白质转录物数据,从而谱分析所述核的基因表达。在一些实施方案中,所述方法还包括:将所述核的基因表达与来自不同组织样品的该细胞类型的至少一种核中的基因表达进行比较,以鉴定基因表达的可变性,从而获得药物靶标。或者,在一些实施方案中,所述方法还包括将所述核的基因表达与不同细胞类型中至少一种核的基因表达进行比较,以鉴定基因表达的可变性,从而获得药物靶标。
在一些实施方案中,亲和标记物还包含荧光标签。在一些实施方案中,使用荧光激活细胞分选术(FACS)纯化所述核。在一些实施方案中,组织样品来源于哺乳动物。在一些实施方案中,哺乳动物选自:小鼠、人、大鼠和其他非人灵长类动物。在一些实施方案中,在分离核之前冷冻组织样品或不同组织样品。在一些实施方案中,在分离核之前,组织样品或不同的组织样品是新鲜的。在一些实施方案中,组织样品或不同组织样品来源于雌性。在一些实施方案中,组织样品或不同组织样品来源于雄性。在一些实施方案中,核与内质网邻接。在一些实施方案中,蛋白质是膜蛋白。在一些实施方案中,膜蛋白在内质网中合成。在一些实施方案中,蛋白质位于内质网中。在一些实施方案中,核酸转录物位于核中。在一些实施方案中,RNA探针与染色体相关转录物(CAT)或聚A转录物特异性结合。在一些实施方案中,DNA探针与转运蛋白基因特异性结合。在一些实施方案中,亲和标记物是多于一种抗体、RNA探针或DNA探针。在一些实施方案中,每种亲和标记物与不同的因子结合。在一些实施方案中,多于一种抗体、RNA探针或DNA探针与相同因子结合。
在一些实施方案中,组织样品是死后的。在一些实施方案中,组织样品或不同组织样品来源于患病受试者。在一些实施方案中,组织样品或不同组织样品来源于健康受试者。在一些实施方案中,患病受试者受选自以下的至少一种疾患的影响:共济失调、帕金森病、阿尔茨海默氏病和肌萎缩侧索硬化症(ALS)以及亨廷顿病。在一些实施方案中,细胞类型与共济失调有关,并且选自:浦肯野细胞、颗粒细胞、伯格曼胶质细胞、篮/星状细胞、星形胶质细胞、少突胶质细胞和小脑深核。在一些实施方案中,细胞类型与帕金森病相关,并且选自:黑质和VTA多巴胺能神经元。在一些实施方案中,细胞类型与阿尔茨海默氏病相关,并且选自:内嗅皮质2/3层、CA1海马和CA2/3海马。在一些实施方案中,细胞类型与ALS相关,并且选自:脑干、皮质运动神经元和脊髓运动神经元。在一些实施方案中,患病受试者表达疾病表型。在一些实施方案中,患病受试者不表达疾病表型。在一些实施方案中,所述方法还包括将来源于患病受试者的组织样品与来自健康受试者的组织样品的谱分析进行比较。在一些实施方案中,所述方法还包括将来源于至少两个不同健康受试者的组织样品的谱分析进行比较。在一些实施方案中,所述方法还包括通过将来自表达疾病表型的患病受试者的组织样品的谱分析与来自不表达疾病表型的患病受试者的组织样品的谱分析进行比较来鉴定疾病阶段之间的可变性。
在一些实施方案中,所述方法还包括对来自单一细胞类型的多个核进行基因表达谱分析。在一些实施方案中,所述方法还包括对来自不同细胞类型的多个核进行基因表达谱分析。在一些实施方案中,所述方法还包括通过将多于一种组织样品的谱分析进行比较来鉴定不同受试者之间的可变性,其中每种组织样品来自不同的受试者。在一些实施方案中,药物靶标由选自表19-24的基因编码。
本发明的多种实施方案提供了一种谱分析核的表观遗传表达的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织与亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与至少一种细胞类型特有的因子结合,其中所述亲和标记物选自抗体、RNA探针和DNA探针;纯化至少一种标记的核;以及收集有关组蛋白修饰、转录因子结合和核DNA修饰的信息,从而谱分析表观遗传表达。
本发明的多种实施方案提供了一种谱分析核的核结构的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织与亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与至少一种细胞类型特有的因子结合,其中所述亲和标记物选自抗体、RNA探针和DNA探针;纯化至少一种标记的核;以及收集有关标记的核的染色体构象的信息,从谱分析核结构。
本发明的多种实施方案提供了一种谱分析核的核结构的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织与亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物与至少一种细胞类型特有的因子结合,其中所述亲和标记物是抗体;从所述核中分离gDNA;进行氧化亚硫酸氢盐测序;以及收集标记的核的染色体构象,从而谱分析核结构。
本发明的多种实施方案提供了一种分离来自单一细胞类型的核的方法,所述方法包括:处理含有多种细胞类型的组织样品以暴露核;通过使经处理的组织样品与多于两种亲和标记物接触来从所述经处理的组织样品中分离核,所述亲和标记物对于所述细胞类型的核酸转录物和/或蛋白质的独特组合是特异性的,其中每种亲和标记物与包含选自SEQID NO:1-28,815的序列的核酸转录物特异性结合,或者所述亲和标记物与包含选自SEQ IDNO:28,816-38,643的氨基酸序列的蛋白质特异性结合;以及纯化至少一种标记的核,从而分离来自所述细胞类型的核。
附图说明
图1显示了可用于本文所述的细胞谱分析技术的分选方法的实施方案。“A”代表目的细胞类型的核,“B”代表另一细胞类型的核。
图2A显示使用Itpr1和NeuN对来自小脑的3种细胞类型的流式细胞术分选结果。Itpr1和NeuN的组合用于分离3个群体:浦肯野细胞、颗粒细胞和神经胶质。Itpr1位于x轴上,NeuN位于y轴上。Itpr1+群体是浦肯野细胞的核,NeuN+群体是胶质细胞的核。NeuN+/Itpr1-核(最大的组)代表颗粒细胞。图2B显示了来自RNAseq数据的基因表达谱,其比较了来自转基因动物(GFP分选)的浦肯野核RNA与Itpr1+核的分选。Pcp4是浦肯野标志物(与小脑未分选核相比在分选的浦肯野核中富集),而Calb2是颗粒细胞标志物(与浦肯野相比,在未分选中富集)。
图3A显示了针对多巴胺能神经元核的核染色和分选的流式细胞术分选结果。图3B比较来自未分选的中脑核和分选的多巴胺能核的RNAseq迹线。
图4提供了基因组浏览器视图,其显示小鼠、大鼠和人的三个迹线-来自颗粒细胞的核RNA水平,来自总小脑的细胞质RNA水平,以及来自总小脑的ATACseq DNA可及性-以揭示物种特异性和细胞类型特异性差异。
图5A和图5B显示来自两个不同人受试者的核的流式细胞术分选结果。
图6显示了流式细胞术分选结果,其通过前向散射光(FSC)和例向散射光(SSC)的组合来估算核的大小。
图7A、图7B、图7C和图7D显示了针对人小脑核的4种不同染色策略的流式细胞术结果。
图8提供了箱线图,其显示了细胞类型内和不同个体的细胞类型之间的成对Pearson相关系数。
图9提供了点图,其显示了按细胞类型和物种破碎的每个样品的成对Pearson相关系数。
图10是显示在5至约25小时的自溶时间内颗粒细胞、篮细胞和胶质细胞中FosB表达的变化的图。
图11A、图11B和图11C提供了散点图,其显示了三种细胞类型特异性衰老下调基因的跨年龄的基因表达。图11A显示了Aqp7的结果。图11B显示了Asic1的结果,图11C显示了Robo2的结果。
图12提供了在Fos+和Fos-个体中,三个个体中三种细胞类型之间应激响应和立即早期基因的表达。基因迹线显示来自三个Fos+和三个年龄和性别匹配的Fos-个体的合并表达。
图13A显示了颗粒细胞、星状细胞和胶质细胞中fos基因和立即早期基因的基因表达。图13B显示了这些细胞中长期应激响应基因的基因表达。图13C显示了应激相关基因的表达,例如活化的星形胶质细胞标志物GFAP、S100B、Exportin 1(Xpo1,也称为富亮氨酸核输出信号(Nes))和胶质细胞中的Musashi RNA结合蛋白1(Msi1),与更长期应激的标志物分开。
图14显示细胞类型特异性染色体相关转录物(Chromosomal AssociatedTranscript,CAT)的RNAseq数据。
具体实施方式
I.导言
复杂组织由许多细胞类型组成。先前已经使用翻译核糖体亲和纯化(translatingribosomal affinity purification,TRAP)方法来定义单个组织中不同细胞类型的分子特征。TRAP方法需要使用转基因动物,这产生了许多挑战。例如,一些疾病模型难以在动物中繁殖,并且动物模型不一定概括人类疾病的所有方面,例如对人神经元的影响。此外,对衰老的研究需要维持特定的转基因品系多年。此外,TRAP方法需要含有高质量RNA的新鲜样品进行准确谱分析。
遗传靶向细胞类型的分子特性的确定已导致对小鼠脑功能和功能障碍的基本洞察。本文描述的细胞谱分析技术的实施方案提供了用于探索广泛物种中特定细胞类型中的基因表达事件的策略,用于基因表达的深入和可重复的研究,以鉴定每种细胞类型或疾患的标志物。本文显示了小鼠、大鼠和人神经元和神经胶质的结果,并揭示了同源人细胞类型的特征。通过表达数百种直系同源的细胞特异性基因,显示经典定义的同源神经元和神经胶质细胞类型在啮齿动物和人之间不同。使用表观遗传作图、RNAseq、定量PCR和免疫荧光定位的组合获得这些基因具有差异活性的证据。对16个人死后脑的研究显示了对于衰老的细胞特异性分子响应。观察到人神经元和神经胶质对衰老的响应是细胞类型特异性的,并且对死后人脑组织的分析还揭示了对16个供体中的三个所经历的未知外部事件的共同的强烈响应的诱导。本文的组合物和方法建立了用于分析与多种人疾患中的特定途径和细胞类型相关的独特分子事件的综合方法。
人类基因组测序和分析技术的最新进展已使得对人精神病和神经疾病的复杂遗传原因的知识增加(Burguière,等(2015)Curr Opin Neurobiol 30,59-65;Hinz,F.I.,等(2017).Molecular Genetics of Neurodegenerative Dementias.PubMed-NCBI.ColdSpring Harb Perspect Biol 9,a023705;Vorstman,等(2017)Nat Rev Genet 18,362-376,每一个都是通过引用整体并入本文)。在一些情况下,重建小鼠基因组中的致病突变得到了足够准确地用于研究该疾患的分子基础的实验模型(Lombardi,等(2015)J.Clin.Invest.125,2914-2923;Lyst,等(2015).NatRev Genet 16,261-275;Orr,H.T.(2012)J.Cell Biol.197,167-177,其各自通过引用整体并入本文)并且它们已经导致发现疾病的意料之外的特征(Guy,al.(2007)Science 315,1143-1147,其通过引用整体并入本文)。在另一些情况下,信息性动物模型仍然是难以捉摸的(Lavin,M.F.(2013).DNA Repair12,612-619,其通过引用整体并入本文),并且疾病的分子机制的研究仍然困难(Biton,等(2008)DNA Repair7,1028-1038;Medina,M.,等(2014)Front.Pharmacol.5,270,其通过引用整体并入本文。
在开发本文所述的细胞谱分析技术之前使用尝试对人组织中的特定细胞类型进行全基因组谱分析的技术包括激光捕获显微切割和单细胞测序技术。这两种技术都不能产生对鉴定的细胞类型的可靠的深度剖析。激光捕获显微切割需要专门的设备和培训,并且结果非常依赖于精确的解剖方法和组织解剖学;因此,样品间结果存在巨大差异。
来自单细胞RNAseq的数据在各个细胞之间也是高度可变的。单细胞RNAseq在神经系统中也是有问题的,因为难以使神经元彼此分离。在分离神经元的研究中,仅捕获细胞体,而丢失神经元突起(neuronal processes)(轴突和树突)。本领域众所周知,与细胞体的大小相比,神经元中的突起非常大,并且还具有它们自己的局部翻译机制。因此,仅细胞体的基因表达分析对于在神经元突起中表达的基因是不足的,后者中的一些对于确定神经元身份是最重要的基因。通过谱分析核(其合成细胞的所有RNA)中的基因表达,可以避免这种偏差。来自任何单个细胞的数据深度不足以建立全面的概况,因此细胞谱分析领域的许多人不接受该方法。
人类疾病是在整个细胞群体中经历的问题。来自单细胞谱分析的细胞类型必须在事后定义,并且该谱分析可能被疾病状态模糊。此外,单细胞RNAseq的测序结果未能足够深得来检测疾病可能发生的细微变化。由于这些原因,细胞类型应被视为群体。使用单细胞方法这样做需要对数千个单个细胞进行测序,并且一些细胞类型非常罕见,因此需要富集来研究仅影响这些稀有细胞类型的疾病。不进行富集的话,几乎不能区分技术和生物可变性。
为了能够鉴定人特异性靶标,已经开发了本文所述的细胞谱分析技术用于死后人组织的特定细胞类型的分子谱分析。本文描述的细胞谱分析技术具有广泛的应用,包括研究基因表达和表观遗传变化以鉴定靶标药物或其他治疗方式。
因为CNS中的细胞具有复杂的形态并且不能彼此有效地分离,所以本文所述的细胞谱分析技术对核而不是整个细胞进行分类。在该方法的一些实施方案中,在从目的脑区域分离核后,可以用对特异性标记目的细胞类型的转录因子或转录物具有特异性的抗体对核进行免疫染色。免疫荧光确定是否可以使用针对膜蛋白的抗体标记核。在核周围的内质网(ER)中观察到染色。或者,RNA探针或DNA探针可用于标记目的细胞类型。
在一些实施方案中,在使用荧光激活细胞分选术(FACS)纯化标记群体后,分离的核可用于基因表达谱分析。图1提供了可用于本文所述的细胞谱分析技术的分选方法的实施方案。“A”代表目的细胞类型的核,“B”代表来自另一细胞类型的核。
在某些实施方案中,可使用算法鉴定单一细胞类型的细胞特异性和富集的基因表达。例如,用于鉴定和定量多个细胞群中的细胞特异性和富集的mRNA的一种分析方法被称为特异性指数(specificity index,SI),如Dougherty等,Nucleic Acids Research,38(13):4218-4230中所述,其整体通过引用并入本文。在多种细胞类型中测量基因表达。这些值首先在重复中归一化,然后跨细胞类型进行全局归一化。使用阴性对照过滤掉非特异性本底。将过滤的值与数据集中的其他未过滤样本进行迭代比较,并计算每组样本的比率。这些集合从最高到最低排名,以防止极端异常值偏离后续分析,并使分析对于难以归一化的数据集更加稳健。将这些等级平均以提供SI。置换测试用于为每个SI值指定p值以提供目的细胞类型中显著宫集基因列表。SI值越低,基因对细胞类型的特异性越强。
本文描述的细胞谱分析技术具有一系列应用,包括:鉴定用于治疗的人靶标,理解人之间的可变性如何导致治疗的可变外显率,研究人退行性疾病中发生的早期变化,鉴定药物靶标,以及基于弱势和备用细胞群的比较分析开发治疗方法。本文描述的细胞谱分析技术可用于概述任何感兴趣的细胞类型。例如,可以比较不同细胞类型的基因表达,以鉴定在感兴趣的细胞类型中独特表达的基因,以鉴定推定的药物靶标。通过比较不同患者之间的异质性还可以揭示疾病的生物标志物,其可用于在症状出现之前鉴定患者,或者选择治疗干预将更有效的患者亚组。
在其他实施方案中,使用本文描述的细胞谱分析技术比较物种(例如小鼠和人)之间的基因表达以鉴定共有和物种特异性基因。该信息还告知药物发现,因为小鼠特异性靶标在商业上不太有价值。此外,物种共有靶标允许在小鼠中的基础研究更可能转化至人类。最后,人类特异性靶标可能是人类发展某些疾病的原因,但很难使小鼠发展同样的疾病。跟进共有靶标可能会提供仅在小鼠中无法鉴定的新药物靶标。
本文描述的细胞谱分析技术的另一个应用是比较不同个体中相同组织中相同细胞类型之间的基因表达,以鉴定个体之间的可变性。目前,全基因组关联研究(GWAS)用于研究DNA水平上个体之间的可变性,但这些技术并未显示DNA的可变性是否影响基因表达和功能。通过本文描述的细胞谱分析技术产生的数据可以用于患者分层并且与GWAS数据组合以确定为什么跨个体存在响应于治疗的可变性。
与TRAP方法相反,本文描述的细胞谱分析技术不需要使用转基因动物。本文描述的细胞谱分析技术可用于来自任何物种的死后组织,包括非模型生物,例如人和其他灵长类动物。
在本发明的某些实施方案中,处理组织样品,并向样品添加对在感兴趣的细胞类型中表达的蛋白质具有特异性的抗体。然后向样品添加抗体的荧光标记。通过荧光从组织样品中分离来自感兴趣的细胞类型的核。例如,FACS用于基于荧光强度分离核。可以使用对位于核中的转录因子特异的抗体(例如,Matevossian等,J.Vis.Exp.(13),e717,doi:10.3791/717,(2008),其通过引用整体并入本文)或使用对位于内质网(ER)中的蛋白质特异的抗体进行分选。由于已经基于膜标志物鉴定了许多神经元,因此对ER中合成的膜蛋白特异的抗体可用于研究神经系统。另外,观察到部分内质网保持附着于分离的核。
可以从先前的TRAP方法研究中选择用于标记和分选来自特定细胞类型的核的抗体,以鉴定在我们感兴趣的细胞类型中特异性表达的因子。代替抗体,使用对位于感兴趣的细胞类型的核或ER中的核酸转录物特异的RNA或DNA探针。例如,Mo等(Neuron,86:1364-1384(2015),其通过引用整体并入本文)分别使用Camk2a、PV和VIP作为靶标分析了转基因小鼠中的兴奋性神经元、PV中间神经元和VIP神经元。在Mo中,约50%的皮质核为Camk2a阳性,约3%为PV阳性,约2%为VIP阳性。
本文的方法提供了人类神经退行性疾病中细胞脆弱性的研究,以及涉及强迫症(obsessive compulsive disorder)、药物成瘾、自闭症谱系障碍(autism spectrumdisorder)和年龄依赖性认知丧失的细胞类型的基于回路的分子表征。在一些实施方案中,本文描述的细胞谱分析技术的目标是获得人CNS细胞类型数据以建立涉及重要的人神经疾病和神经变性疾病的脑回路或途径的表征。例如,使用对从富集核的完全加工的聚A+RNA和染色体相关转录物(CAT)鉴定的蛋白质特异的抗体获得来自小鼠的细胞特异性数据。可以设计针对这些的RNA/DNA探针以用于额外的标记和分选。具体地,使用PolyDT珠分析来自针对TRAP方法开发的转基因动物的纯化的GFP+核和分离的RNA,以捕获作为成熟RNA的聚A+RNA。观察到与核膜邻接的ER中RNA的富集。这些数据提供了关于在靠近核的ER中富集的转录物的细节,并且这些转录物是可用于在本文所述的细胞谱分析技术中进行分选步骤的抗体和RNA/DNA探针的推定靶标。本文的方法导致产生高度可再现的细胞类型特异性数据,并通过人组织样品中新发现的细胞特异性标志物的原位杂交或免疫荧光确认细胞特异性表达谱。该数据提供了来自大量组织(例如来自脑)的转录物谱可用于鉴定新细胞特异性探针的确认。
II.基因命名
本文与ENSEMBL Gene ID一起使用的基因符号是指来自小鼠、大鼠和人的基因。除非另有说明,否则对应于每个基因符号的基因名称示于表1中。
表1.基因符号和名称
对于小鼠,表2和表2b提供了对应于本文实验中分析的小鼠基因(MUSG)、转录物(MUST)和蛋白质(如果可获得)(MUSP)的唯一ENSEMBL标识符。已修改每个ENSEMBL条目的唯一标识符,以移除标识符的在ENSMUSG、ENSMUST和ENSMUSP标签之后的前五个前导零(0)。如果没有ENSEMBL转录物或蛋白质鉴定物,则包括GenBank转录物(核酸或蛋白质)。
表2.小鼠的ENSEMBL ID
表2b含有小鼠中的其他基因。该表鉴定了对应于在本文的实验中谱分析的小鼠基因(MUSG)、转录物(MUST)和蛋白质(如果可获得)(MUSP)的唯一ENSEMBL标识符。已修改每个ENSEMBL条目的唯一标识符,以移除标识符的在ENSMUSG、ENSMUST和ENSMUSP标签之后的前五个前导零(0)。如果没有ENSEMBL转录物或蛋白质标识符,则包括GenBank转录物(核酸或蛋白质)。
表2b.小鼠的ENSEMBL和GenBank ID
对于大鼠,表3提供了对应于本文实验中分析的大鼠基因(MUSG)、转录物(MUST)和蛋白质(如果可获得)(MUSP)的唯一ENSEMBL标识符。已修改每个ENSEMBL条目的唯一标识符,以移除标识符的在ENSMUSG、ENSMUST和ENSMUSP标签之后的前五个前导零(0)。
表3.大鼠的ENSEMBL ID
对于人样品,表4提供了对应于本文实验中分析的人基因(ENSG),转录物(ENST)和蛋白质(如果可用)(ENSP)的唯一ENSEMBL标识符。已修改每个ENSEMBL条目的唯一标识符,以移除标识符的在ENSG、ENST和ENSP标签之后的前五个前导零(0)。
表4:人的ENSEMBL ID
III.用于分离和谱分析来自细胞类型的核的方法
可以在确定的细胞群中有效地研究人类生物学的许多问题。例如,由于这些疾患的遗传复杂性(Burguière,E.,等(2015)Curr Opin Neurobiol 30,59-65.;Hinz,等(2017)Cold Spring Harb Perspect Biol 9,a023705;Vorstman,等(2017)Nat Rev Genet 18,362-376,其各自通过引用整体并入本文)、神经细胞损失的概率性质(Clarke,等(2000).Nature 406,195-199和Clarke,等(2005)Brain Research Bulletin 65,59-67,其各自通过引用整体并入本文)、以及衰老对疾病发作和进展的可变影响(Corrada,等(2010)Ann.Neurol.67,114-121和Niccoli,等(2012)Current Biology 22,R741-R752,其各自通过引用整体并入本文),可以通过对来自人样品的大量细胞类型进行纵向研究来获得与人类神经退行性事件相关的分子事件的理解。考虑到这些因素,本文的方法被开发用于精确确定确定的脑细胞类型的分子特性,并且足够稳健以使用来自普通脑组织库的死后组织而不需要转基因动物。
本文描述的细胞谱分析技术被开发为用于细胞类型特异性分析的方法,其利用每种细胞类型内的核定位和核相关蛋白的独特组分,以实现对哺乳动物脑中确定细胞类型的稳健和可再现的研究。本文描述的细胞谱分析技术允许小鼠、大鼠和人死后脑的细胞类型特异性基因表达谱分析,并且这些方法可以扩展到任何器官或组织样品。
由来自啮齿动物和人脑细胞类型的本文所述的细胞谱分析技术产生的数据的比较研究揭示了来自经典定义的高度保守的小脑细胞类型的基因表达谱的进化分歧(D’Angelo,E.(2013)Handbook of the Cerebellum and Cerebellar Disorders,(Dordrecht:Springer Netherlands),第765-791页;Eccles,J.C.(1967)The Cerebellumas a Neuronal Machine(Berlin/Heidelberg/New York:Springer);Llinas,R.R.(1969).Neurobiology of Cerebellar Evolution and Development(Chicago:AmericanMedical Association);其各自通过引用整体并入本文)。数据还表明,脑衰老的分子机制在每种人类细胞类型中不同地进行。最后,数据显示,可在对照死后人脑中鉴定指示共有的外部事件的稳健的分子表型。使用本文所述的细胞谱分析技术对人类遗传和临床数据进行表达和表观遗传学研究的相关研究将提供对人脑功能和功能障碍的其他但未被认识的分子特征的了解。
先前在Doyle等(2008)Cell 135,749-762和Heiman等(2008)Cell 135,738-748(其中每一个都通过引用整体并入本文)中开发了在细胞类型特异性驱动子控制下表达EGFP-L10a核糖体蛋白融合蛋白的转基因小鼠。使用开发用于TRAP方法的这五种转基因动物系,通过使用TRAP方法的基因表达或通过使用荧光激活细胞分选术(FACS)之后的表观遗传特征从特定细胞类型纯化了EGFP+核(Kriaucionis,等(2009)Science 324,929-930和Mellén,M.,等(2012)Cell 151,1417-1430,其中每一个都通过引用整体并入本文.)。先前的研究已经确定核RNA谱对于每种细胞类型也是特有的,并且具有关于细胞功能的信息(Deal,等(2011)Nat Protoc 6,56-68;Henry等,Nucleic Acids Res.2012 Oct;40(19):9691-704;Mo,等(2015)Neuron 86,1369-1384;Steiner,等(2012)Genome Res 22,766-777;其中每一个都通过引用整体并入本文)。
相对于本文所述的细胞谱分析技术,先前开发的细胞类型特异性分子谱分析的大的限制是其需要使用转基因动物来遗传靶向感兴趣的细胞类型。为了克服这种限制,研究了核和内质网蛋白的细胞类型特异性表达,以纯化和表征来自广泛物种(包括人死后脑样品)中特定细胞类型的核。
在本发明的一些实施方案中,从野生型或转基因组织制备核,使用甲醛固定,用对感兴趣的脑区中的给定细胞类型特异的荧光抗体染色,通过流式细胞术(例如FAC)分选,然后使用RNAseq进行分析以发现物种、细胞类型或环境特异性表达谱特征。
本文描述的细胞谱分析技术可以应用于来自与特定疾病、病症或疾患相关的任何细胞类型或组织的核。例如,来源于基底神经节组织的核包括:纹状体黑质中型多棘神经元(MSN)、纹状体苍白球MSN(尾状核和伏隔核)、纹状体胆碱能中间神经元、丘脑底核、多巴胺能神经元和终纹床核(BNST)神经元。例如,来源于丘脑组织的细胞类型的核包括:丘脑皮质神经元、丘脑纹状体神经元和丘脑网状核神经元。例如,来源于皮质组织的细胞类型的核包括:内嗅皮质2/3层神经元、快速刺激皮质中间神经元和来自前额皮质组织的2/3层锥体细胞。例如,来源于海马组织的细胞类型的核包括:海马角区域1(CA1)、海马角区域2(CA2)、海马角区域3(CA3)和齿状回细胞。
细胞类型还可以与以下组织相关联:内侧缰核(胆碱能投射神经元至椎间核)、脑干(上运动神经元)、脊髓(下运动神经元)或所有组织(各种类型的中间神经元、星形胶质细胞和少突胶质细胞)。人脑中的细胞类型还可能与神经退行性疾病有关,例如共济失调、帕金森病、阿尔茨海默病和肌萎缩侧索硬化症(ALS)。例如,谱分析了与共济失调相关的描绘浦肯野细胞、颗粒细胞、伯格曼胶质细胞、篮/星状细胞和小脑深核。还可以谱分析与帕金森病相关的黑质腹侧被盖区(VTA)多巴胺能神经元,或者与阿尔茨海默病相关的内嗅皮质2/3层、CA1海马和CA2/3海马神经元。或者,谱分析与ALS相关的脑干和脊髓运动神经元。
A.使用核转录组对细胞类型进行分选
可以使用对内质网(ER)蛋白、在ER中合成的膜蛋白或核转录物特异的抗体、RNA探针或DNA探针对核进行分选。为了富集在核膜附近翻译的ER转录物,可以进行核转录物的聚A下拉。在一些实施方案中,从先前已经使用TRAP方法谱分析的转基因小鼠的组织中分离来源于感兴趣的细胞类型的核,以比较来自每种技术的细胞特征结果。开发用于TRAP方法的转基因动物的谱分析结果基于GFP标记的核糖体亚基在核仁中组装的事实。或者,作为待分选核的来源的组织是从野生型哺乳动物中提取的,例如人、非人灵长类动物、小鼠或大鼠。
图1提供了可用于本文所述的细胞谱分析技术的分选方法的实施方案,其也称为NETSseqTM技术或INSPECTIONTM。在图1中,“A”表示感兴趣的细胞类型,“B”表示图1中感兴趣的细胞类型的核。
在一些实施方案中,用于分离来自小鼠中小脑的3种细胞类型的策略包括抗体结合,其使用作为标记浦肯野细胞的靶标的Itpr1(肌醇1,4,5-三磷酸受体1型;内质网(ER)的细胞内受体)、作为标记颗粒细胞的靶标的NeuN(由RNA结合Fox蛋白家族成员编码的基因;NeuN是通常用作神经元生物标志物的神经元抗原)和作为标记胶质细胞的靶标的Gfap(胶质纤维酸性蛋白质;用于从神经胶质细胞中区分星形胶质细胞的成熟星形胶质细胞的主要中间丝蛋白之一),以确认样品中这些类型细胞的存在。然后,可以使用Itpr1和NeuN的结果组合来分离所有3个群体。或者,来自野生型小鼠的颗粒细胞的核可以分选为Itpr(Itpr+)和NeuN(NeuN+)阳性以及Olig2(Olig2-)和Sorcs3(Sorcs3-)阴性。来自浦肯野细胞的核可以分选为Itpr1+和NeuN+。来自篮细胞的核可以被鉴定为Sorcs3+和中等NeuN-。来自星形胶质细胞的核可被鉴定为Sorcs3-和NeuN-
或者,神经元分化1或Neurod1(Neurod1+)可用于分选颗粒细胞;浦肯野细胞蛋白2或Pcp2(Pcp2+)可用于分选浦肯野细胞;Septin 4或Sept4(Sept4+)可用于分选伯格曼胶质细胞;胶原蛋白β(1-O)半乳糖基转移酶2或Glt25d2,也称为Colgalt2,(Glt25d2+)用于分类皮质脑桥锥体细胞;神经降压素受体1或Ntsr1(Ntsr+)用于分类皮质丘脑锥体细胞。在一些实施方案中,以下核转录物可用于鉴定每种细胞类型的核:用于Sept4阳性细胞(伯格曼胶质细胞)的α-2-巨球蛋白(A2m),用于Colgalt2阳性细胞的Pde1a和Colgalt2(皮质脑桥锥体),用于刺激阳性细胞(兴奋性神经元)的Pde1a和硫酸乙酰肝素-葡萄糖胺3-磺基转移酶4(Hs3st4),用于Ntsr1阳性细胞(皮质丘脑锥体)的Pde1a和Hs3st4,用于PV阳性细胞(小清蛋白中间神经元)的Aristaless相关同源框(Arx)和Parvalbumin(Pvalb),用于VIP阳性细胞(VIP中间神经元)的血管活性肠肽(Vip),用于Pcp2阳性细胞(浦肯野)的溶质载体家族9成员A3(Slc9a3),以及用于NeuroD1阳性细胞(颗粒)的Grin2c。
在一些实施方案中,使用forkhead盒A1(FoxA1)和多巴胺转运蛋白溶质载体家族6成员3(Dat,也称为Slc6a3)分选来自小鼠的多巴胺能神经元的核。观察到多巴胺能神经元是FoxA1和Dat两者阳性的。在一些实施方案中,可用于分选的多巴胺能神经元的其他标志物包括:酪氨酸水解酶(TH)、forkhead盒A2(FoxA2)和多巴胺受体2(Drd2)。
在一些实施方案中,分选的核群中的下调基因也可以用作核的细胞类型的身份的证据。例如,已知多巴胺受体D1(Drd1)和谷氨酸脱羧酶(Gad)不在多巴胺能神经元中表达,因此应在来自多巴胺能神经元的分选的核群中下调。
在一些实施方案中,Wolframin ER跨膜糖蛋白(Wfs1)和B细胞CLL/淋巴瘤11B(Ctip2,也称为Bcl11b)分别可用于分选来自小鼠的皮质细胞类型2/3层锥体神经元和第5和6层锥体神经元。在一些实施方案中,ETS变体1(Etv1,也称为ER81)可用于分选第5层锥体神经元的核。先前已经观察到Etv1标记了皮质的第5层中的皮质纹状体神经元、皮质脑桥神经元和潜在的其他神经元。在一些实施方案中,wfs1可以用作碳酸酐酶1(CA1)阳性神经元的标记物,并且浦肯野细胞蛋白4(Pcp4)可以用作碳酸酐酶1(CA2)阳性齿状回的标记物。
在一些实施方案中,溶质载体家族18成员A3(VaChT,也称为Slc18a3)、软骨凝集蛋白(Chodl)和***相关受体β(EsrrB)可用作来自小鼠脑干运动神经元的核的标志物。VaChT和ErrB特异性的亲和标签特异性地标记运动神经元,并且ChodI标记除了这些神经元之外的所有。Chodl特异性抗体可以用直接标记脑干运动神经元的抗体代替。
在一些实施方案中,使用至少一种膜蛋白或核相关转录物对大鼠核进行分选。例如,来自颗粒细胞的核可以被鉴定为Itpr阴性(Itpr-)、Olig2阴性(Olig2-)、Sorcs阴性(Sorcs-)和NeuN阳性(NeuN+)。来自浦肯野细胞的核可以被鉴定为Itpr阳性(Itpr+)和NeuN+。来自篮细胞的核可以被鉴定为Itpr+和中等NeuN阴性(med NeuN-)。来自星形胶质细胞的核可被鉴定为Sorcs3阳性(Sorcs3+)和medNeuN-。来自成熟少突胶质细胞的核可以被鉴定为Sorcs3-和NeuN-。来自成熟少突胶质细胞和OPC的组合的核可以被鉴定为Olig2阳性(Olig2+)和高NeuN阴性(高NeuN-)。
在一些实施方案中,来自来源于人样品的浦肯野细胞的核可以被鉴定为Itpr+和Id2阳性(Id2+)或FoxP4阳性(FoxP4+)和Itpr1+。在一些实施方案中,来自来源于人样品的颗粒细胞的核被鉴定为FoxP4+和NcuN+。在一些实施方案中,来自成熟少突胶质细胞和OPC的核可以通过Olig2的表达水平来区分。例如,Olig2的低水平表达(Olig2+低)将核识别为成熟的少突胶质细胞,Olig2的高水平表达(Olig2+高)将核鉴定为OPC。
本文描述的核分选策略可以应用于任何物种。
B.谱分析不同物种的分选核中的细胞类型
在每种细胞类型中表达的基因定义了它们的功能,它们对内部和外部信号的响应,以及它们在物种间的进化。本文描述的细胞谱分析技术被证明可用于来自小鼠、大鼠和人脑的神经元和神经胶质的高度准确的细胞类型特异性基因表达谱分析。
在Mo等(2015)Neuron 86,1369-1384(其通过引用整体并入本文)中,使用RNAseq谱分析来自通过Cre-loxP系统表达标记的核膜蛋白的转基因小鼠的核。从来自不同来源的转基因动物和野生型动物中分离自细胞类型的核的RNAseq谱分析的比较提供了证据,即核RNA谱可用于确定细胞身份并测量不同细胞类型的相关性。在一些实施方案中,转基因动物可以在靶细胞类型中表达增强的GFP(EGFP/L10a融合蛋白)。在一些实施方案中,来自Mo等分选和表征和使用本文所述的细胞谱分析技术的核RNAseq结果的分层聚簇提供了通过细胞类型的分组,例如中间神经元(例如,VIP中间神经元和小清蛋白中间神经元)对比于锥体细胞(例如,皮质锥体、皮质下丘脑和刺激性)。
甚至经典地定义的均匀的小脑细胞类型被观察到通过数百个直系同源基因的表达而在物种之间不同,并且通常在小鼠脑的其他区域中观察到人颗粒细胞表达的基因的连续表达。实际上,核RNA谱足够敏感以区分不同的神经元亚型,例如成熟少突胶质细胞(也称为皮质脑桥锥体神经元)和少突胶质细胞祖细胞或OPC(也称为皮质丘脑元锥体神经元)。
1.来自小鼠的分选核中RNA谱的差异
在一些实施方案中,通过RNAseq分析基因表达以产生RNA谱。在一些实施方案中,将结果归一化为每个基因的所有样品的平均表达。例如,可以将颗粒细胞、浦肯野细胞、伯格曼胶质细胞、少突胶质细胞和OPC的通过FACS纯化的核的RNAseq结果中的log2倍数变化与所有细胞类型的核中250种最可变的基因的归一化RNAseq结果进行比较。在小鼠中,最可变的基因可选自1700047M11Rik、3110039M20Rik、2410124H12Rik、8030451O07Rik、9530059O14Rik、A230077H06Rik、A2m、A730036I17Rik、Aass、Acsm5、Actbl2、Adra2b、Afp、Aqp4、Arhgap25、Arx、Atp13a4、Atp1a2、Atp2a3、B230209E15Rik、B3gnt5、Barhl2、Bcl11b、Btbd17、Cacng3、Camk1g、Camkv、Car8、Caspl2、Casq2、Cbln2、Cbln3、Cckbr、Cd70、Cd9、Cdc42ep1、Cdh19、Chrm1、Chrm3、Chsy3、Clic6、Cml5、Cnpy1、Cob1、Colla2、Col4a5、Col6a1、Colgalt2、Corin、Coro6、Cpne7、Crym、Csta1、Ctxn3、Cxcl14、Cxcl5、Cxcr4、Cyp27a1、Cyp2j9、D430019H16Rik、Ddn、Ddx3y、Dlgap2、Dlx4os、Dlx6os1、Dmp1、E030003E18Rik、Ebf1、Ebf2、Ebf3、Ednrb、Egfr、Egr3、Eif2s3y、Elfn1、Emp2、En2、Enc1、Etnppl、Evala、F3、Fam107b、Fam19a1、Fat2、Fb1n2、Fezf2、Fgd3、Flrt2、Folh1、Foxg1、Frem1、Gabra6、Galnt14、Gas1、Gda、Gdf10、Gja1、Gjb6、Hjc3、Gli1、Gli3、Glt25d2、Gm11549、Gm266、Gm5083、Gm5089、Gm5468、Gm5607、Gm8179、Gpr37l1、Grik1、Grm5、Hepacam、Hes3、Hs3st2、Hs3st4、Htr2a、Icam5、Icosl、Il22、Iltifb、Irx1、Irx2、Irx5、Itih3、Itprip12、Kank1、Kcnc2、Kcnf1、Kcnj10、Kcnj16、Kcnj4、Kcnq5、Kcnt2、Kcnv1、Kctd12b、Kdm5d、Lama2、Lamp5、Lcat、Ldb2、Lfng、Lgr6、Lhx1、Lhxlos、Lhx5、Linc-md1、Lrrc7、Lyzl4、Mal2、March1、Megf10、Meis2、Mertk、Metrn、Mgst1、Miat、Mlc1、Mmp14、Mpped1、Msx2、Mybpc1、Myh6、Neto1、Nid1、Nkx2-2、Npr3、NPylr、Nrgn、Nrk、Ntsr2、Nup62c1、Oprd1、P2ry1、Paqr6、Pax3、Pcsk6、Pde1a、Pde5a、Pdgfd、Pdzph1、Pihlh3b、Pkp3、Pla2g7、Plekhd1、Plekho2、Plpp3、Plscr1、Plscr4、Ppplrl7、Prkag3、Procr、Prr5、Ptk2b、Ptpn5、Ptprz1、Rabllfip1、Rab27b、Robo3、Rtn4rl2、Rxfp1、Slpr1、Scube1、Sdc4、Serpinh1、Skor2、Slc14a1、Slc1a3、Slc24a4、Slc2a10、Slc2a4、Slc30a3、Slc39a12、Slc6a7、Slc7a10、Slc9a3、Slco4c1、Smpx、Sod3、Sparc、Stac、Stk17b、Stk32a、Sycp1、Syt10、Tbr1、Tex36、Tlcd1、Tlr3、Tmem132b、Tmem179、Tmem200a、Tnc、Tox3、Tri1、Trim30a、Trp53cor1、Ttpa、Uty、Vip、Vsig2、Vstm2b、Wif1、Zfp385c、Zfp831、Zic1、Zic2、Zic3、Zic4和Zic5,或本文鉴定的其他物质。
在小鼠中,表达可用作鉴定颗粒细胞或其核的标志物的基因包括与未分选的核中的归一化表达相比具有最大表达变化的基因,包括:2510003B16Rik、4930449E18Rik、6430548M08Rik、6530403H02Rik、9230112J17Rik、Ablin1、Ablim3、Ackr1、Adamts18、Adcy1、Airn、Ak4、Als2、Atp1a1、Atp2b3、Barh12、Bcl2l15、Boc、Brinp1、Bsn、Btg1、C130030K03Rik、Cacnalc、Cacnale、Cacna2d1、Cadm3、Cadps2、Calb2、Caln1、Camk4、Camkk2、Car10、Car15、Car4、Cbln1、Cbln3、Ccdc120、Cd300a、Cdh15、Cdh7、Cdh8、Celf4、Cerk1、Cers6、Chgb、Chn2、Chrd、Cnksr2、Cnnm4、Cntn6、Cntnap1、Cntnap4、Cplx2、Crhr1、Crtam、Dab2ip、Des、Dgkd、Diras2、Dlgap3、Dpp6、Dpysl4、Dusp5、Eif4e3、Fpb41、Epb41l4b、Epha3、Erc1、Ets2、Etv1、Exph5、Faap20、Fam135b、Fat2、Fgf14、Fzd7、Gabra6、Gabrb3、Gabrd、Galnt13、Gap43、Ggact、Gm2694、Gm7854、Gm9899、Gm996、Golga7b、Gprc5c、Grik2、Grin2a、Grin2c、Grrn4、Icall、Igfbp5、Il16、Il20rb、Inadl、Itga7、Jph3、Jph4、Kank2、Kbtbd11、Kcnc1、Kcnd2、Kchh1、Kcnip4、Kcnj12、Kcnj6、Kcnk1、Kcnk10、Kcnk12、Kcnk3、Kcnk9、Kcnt1、Khnyn、Kif26b、Lgi1、Lhfp、Lin7a、Lrrc3b、Lurap1、Mam13、Mapk11、Mapk12、Marveld2、Mctp1、Mir670、Mmp24、Mpp4、Msra、Ndrg3、Ndst3、Nedd4l、Negr1、Neto2、Neurl1a、Neurod1、Nhsl2、Nrep、Nrip2、Nrn1、Ntn4、Nxn、Olfm1、Olfm3、Pagr1a、Panx2、Pclo、Pcsk2、Pde10a、Pde3b、Pgm2l1、Pkib、Plch2、Plcl2、Plcxd3、Pld5、Ppargc1b、Ppfia4、Pqlc3、Prkce、Prr16、Prss52、Ptchd1、Ptpn22、Pxylp1、Rab15、Rab37、Raly1、Rapgef4、Rbfox1、Rbfox3、Rcan3、Reln、Rims1、Rims2、Rims3、Rnf112、Rnf152、Ror1、Rps6ka1、Rtn4r、Rtn4rl1、Ryr2、Scn2a1、Sel1l3、Sema4f、Sergef、Sgpp2、Sgsm1、Sh3gl2、Shf、Shisa8、Sidt1、Slcl6a10、Slcl7a7、Slc25a22、Slc29a4、Slc2a13、Slc35f3、Slc8a2、Slc9a5、Slit3、Slitrk4、Snap25、Snrk、Specc1、Speg、Sphkap、Sptb、St3gal5、Stap2、Stmn2、Stxbp1、Stxbp51、Sv2b、Svep1、Svop、Syndigll、Syt1、Syt12、Syt4、Tas2r143、Tbata、Tbcld8、Tenm1、Tese、Tiam1、Tll1、Tmem163、Tmem178、Tmem181c-ps、Tmem266、Tmem56、Tmem63c、Tmtc4、Trhde、Ubtd2、Unc13c、Uncx、Usp3、Vatll、Vsnl1、Wscd2、Xkr6、Xkr7、Zdbhc2、Zfp385b和Zic2。
在小鼠中,表达可用作鉴定浦肯野或其核的标志物的基因包括与未分选的核中的归一化表达相比具有最大表达变化的基因,包括:1190002N15Rik、1700008O03Rik、1700124L16Rik、2410124H12Rik、9530052E02Rik、9530059O14Rik、A330050F15Rik、Abhd3、Adam23、Adamts3、Adgrl2、Aff1、Ank1、Ankrd33b、Ankrd53、Anks1b、Apip、Arap1、Arhgap20、Arhgap26、Arhgef33、Arnt1、Atl2、Atp2a3、Atp2b2、Atp6apll、Atp6v1b1、Atrnl1、Auts2、B3gnt5、Baiap2、Bcl11a、Bean1、Brinp2、Bzrap1、Cacna1a、Cacna1g、Cacna2d2、Calb1、Camk2a、Car7、Car8、Casq2、Ccdc107、Ccdc85a、Cck、Cds1、Cep126、Cep76、Clec2l、Clic6、Clstn3、Cntn3、Cntnap5b、Cntnap5c、Col18a1、Corin、Cpeb1、Cpne9、Csta1、Cyth3、D430036J16Rik、Dach1、Dagla、Defb23、Dgkg、Dgkh、Dgkz、Dlg2、Dlx4os、Dmd、Dner、Doc2b、Dpp10、Ebf1、Ebf2、Ece1、Et14、Fam107b、Fam117a、Fam174b、Fam184b、Fam2l、Fam78b、Far2、Fbxl21、Fgd3、Fhl5、Flt3、Fmnl1、Foxp2、Foxp4、Frmpd3、Gabbr2、Garnl3、Gfra2、Gm14169、Gm5083、Gm5803、Gng13、Gpr63、Grid2、Grid2ip、Grik1、Grip1、Grm1、H2-D1、Heatr5a、Hes3、Homer3、Hpcal1、Hrh2、Hspa12a、Htr1b、Icmt、Id2、Ifhgr2、Il22、Iltifb、Inpp4a、Inpp5a、Itga3、Itpka、Itpr1、Kalrn、Kcnab1、Kcnab2、Kcnh7、Kcnip1、Kcnma1、Kctd12、Kit1、Ksr2、L3mbtl1、Large、Ldhd、Lhx1、Lhx1os、Lhx5、Linc-md1、Lpcat4、Lrfn5、Lrp8、Lrrfip1、Lsmem1、Magoh、Mcemp1、Mdfi、Mir124a-1hg、Mir138-1、Mir3470b、Mtss1、Myb10、Myo10、Nefh、Nefm、Nek2、Nell1、Nexn、Ninl、Nkiras2、Npr1、Nr2f2、Nrk、Nsg1、Nup93、Ociad2、Orai2、Paxbp1、Pcp2、Pcp4、Pde2a、Pde5a、Pde9a、Pih1h3b、Plcb3、Plekhd1、Plekhd1os、Plpp6、Plxdc1、Pnpla3、Polr1b、Ppp1r17、Ppp4r4、Prkag3、Prkcg、Prkg1、Prmt8、Psd2、Ptchd4、Ptprr、Rab43、Rbms1、Reep2、Retn、Rgs8、Rmdn3、Rnf19b、Rreb1、Rtel1、Ryr1、Scn4b、Serinc2、Sestd1、Sh2d4b、Shank1、Shisa6、Skor2、Slc16a9、Slc1a6、Slc20a1、Slc9a3、Smpx、Snhg11、Sorl1、Sos1、Sox5os3、Sptan1、Sptbn2、Stac、Steap2、Stil、Stk17b、Strip2、Strn3、Stxbp2、Svil、Sycp1、Syndig1、Syt7、Tenm4、T ex261、Thy1、Tm6sf1、Tmem255a、Trabd2b、Trpc3、Tspan11、Tt115、Tuba8、Unc5d、Vax2、Vwa5b2、Ywhah、Zbtb46、Zfand4、Zfp385a、Zfp385c和Znhit1。
在小鼠中,表达可用作鉴定篮细胞或其核的标志物的基因包括与未分选的核中的归一化表达相比具有最大表达变化的基因,包括:1700024F13Rik、1700080N15Rik、9530026P05Rik、A530058N18Rik、Acot10、Adamts15、Adamts16、Adamts2、Adarb2、Adgrl3、Adrb2、Agl、AI504432、Aldh18a1、Aldh112、Aldob、Ankrd13b、Ar、Arl4a、Arl4c、Arrdc1、Asgr1、Asic2、As1、Asns、Atplb1、Atp2b1、Bex1、Bhlhe22、Btbd11、Bzw2、Clqtnf4、Cabp1、Cacna1b、Cacna1d、Cacna2d3、Cacng2、Camk1g、Camk2n1、Cars、Ccdc136、Ccdc74a、Cd59a、Cdkl1、Cebpb、Cep70、Cgn、Chac1、Chchd7、Chd3os、Chst1、Chst9、Clmp、Cnpyl、Cnrl、Cntn4、Coro6、Cryba2、Csmd1、Csrnp3、Cx3cl1、Cyld、Cyp4xl、Cyp7bl、Dnabl1、Dock7、Efna5、Elavl4、Elmod1、Eml5、Enpp1、Ephb2、Erc2、Esrrg、Fam84a、Fev、Fgfl3、Flrt2、Frmd3、Fuca2、Gabra1、Gabrg2、Gad1、Gad2、Galnt18、Gars、Gdpd5、Gfra4、Gjd2、Glce、Gldc、Gmll780、Gml4204、Gml5631、Gm15663、Gm2762、Gpr12、Gprasp2、Grb10、Gria3、Grid1、Grik3、Grin2d、Grm8、H2afz、H2-B1、Haus4、Hcn1、Hecw1、Hnrnpa0、Hpca、Hpcal4、Hunk、Igsf3、Inhba、Inpp4b、Kcna2、Kcnab3、Kcns2、Kirrel、Kirrel3、Kit、Klhl33、Lamb1、Lrrc38、Lsmll、Ly6e、Lypd6、Maged1、Man2a1、March11、Mgat4c、Mgat5、Mir193b、Mir384、Mkx、Mpp7、Msantd4、Mtfp1、Mthfd2、Myol6、Myrip、Mytl1、Napll2、Nars、Ndn、Nef1、Neurod2、Neurod6、Nln、Nmt2、Nos1、Nos1ap、Nrxn3、Ntn1、Osbpl10、Osbpl5、Pam、Parml、Penk、Pfkp、Pgrmc1、Phactr2、Phf24、Phyhip、Pja1、Pkp4、Pla2g4e、Plch1、Plcxd2、Plppr4、Plvap、Plxna4、Plxnc1、Pnck、Ppplcc、Prdm8、Prkcd、Prrg3、Ptchd2、Purb、Rab10os、Rab3c、Rai2、Rasgrf1、Rasl10b、Rec8、Ret、Rmst、Rora、Rph3a、Rpl15、Scn9a、Sdk2、Sema3e、Serpini1、Sesn2、Sez6、Sgk1、Sgtb、Shank3、Skor1、Slc12a5、Slc19a2、Slc1a4、Slc24a3、Slc2a3、Slc32a1、Slc4a8、Slc6a7、Slc7a1、Slc7a3、Snph、Socs2、Sod2、Sorbs2、Sorcs3、Sp5、Stac2、Stard5、Stc2、Syt13、Tbcld30、Tbc1d4、Tfap2a、Tfap2b、Tmem117、Tmem132e、Tmem151b、Tmem169、Tmem25、Tramll1、Trib3、Trim67、Tro、Trpc5、Trpc7、Tspyl4、Ttc39b、Ttc9、Unc5c、Usp1、Vmn2r2、Wasf1、Wbscrl7、Wfs1、Xkr4、Zbtb18、Zcchc16和Zfp423。
在小鼠中,表达可用作鉴定星形胶质细胞或其核的标志物的基因包括与未分选的核中的归一化表达相比具有最大表达变化的基因,包括:1700066O22Rik、2810032G03Rik、3110082J24Rik、9330188P03Rik、A2m、A330033J07Rik、Abi3bp、Acotll、Acsbg1、Actr3b、Adra1a、AI464131、Akt2、Aldh111、Alms1-ps2、Apoe、AqP4、Arrb1、Atp13a4、Atp1a2、Atp1b2、AU022751、Ax1、Baalc、Bcar3、Btbd17、Cables1、Cacnb1、Cacng5、Cacng8、Cank1、Camk2g、Caskin1、Cbs、Ccdc190、Ccdc78、Cd70、Cdc42ep1、Cdc42ep4、Cdh22、Cdh4、Celrr、Clcn2、Clu、Cml5、Cmya5、Cnn3、Cpne2、Ctxn3、Cxcl14、Cyp2d22、Cyp4f14、D330050G23Rik、Dao、Ddah1、Ddo、Dmp1、E030003E18Rik、Ednrb、Efhd2、Efnb2、Egfr、Elmo2、Elovl2、Emid1、Erich5、Etnpp1、Etv4、Evala、F830045P16Rik、Fads2、Fam107a、Fam173a、Fam20a、Fam43a、Fam92b、Fgd6、Fgfr3、Frem1、Frmpd1、Fxyd1、Fxyd7、Fzd1、Gabra2、Gabra4、Gabrb1、Garem1、Gas2l3、Gdf10、Gja1、Gjb6、Gli1、Gli2、Glipr2、Gm5089、Gm6277、Gpr153、Greb1l、Gria1、Gsap、Gstm1、Hif3a、Hk2、Hopx、Hrh1、Htra3、Icos1、Id4、Igdcc3、Igdcc4、Itih3、Itpkb、Kifc3、Klf15、Lama2、Lcat、Lfng、Lgi4、Lgr6、Lrig1、Lrp3、Lrrc8a、Man1c1、Map2k6、Mertk、Metrn、Mfge8、Micalcl、Mir3093、Mir6375、Mir6390、Mlc1、Mmd2、Mpp6、Mho、Msi1、Msx2、Mt1、Mt2、Mt3、Mxra8、Mybpc1、N4bp3、Nat8、Nbl1、Ndrg2、Nhsl1、Nkain4、Nrld1、Ntsr2、Nudt14、Nwd1、Cplah、Paqr6、Paqr8、Pax3、Pbxip1、Pde8b、Pdlim4、Phf21b、Phka1、Phkg1、Phyhd1、Pitpnc1、Pitpnm2、Pla2g7、Plce1、Plekho2、Plpp3、Plscr4、Pltp、Plxnb1、Pnky、Pnp1a7、Por、Ppm1m、Prex2、Proca1、Prodh、Prr5、Ptch1、Ptch2、Pxmp2、Pyroxd2、Rab34、Rab36、Ramp2、Rasl11a、Rbm24、Rdh5、Rfx2、Rfx4、Rgl1、Rgma、Rpph1、Rpusd3、Rras、Slpr1、Sdc4、Sfxn1、Sfxn5、Sh3pxd2b、Shisa9、Sirpa、Slc12a4、Slc13a5、Slc1a2、Slc1a3、Slc25a18、Slc27a1、Slc38a1、Slc38a3、Slc39a12、Slc41a1、Slc4a4、Slc7a10、Slc8b1、Slco4a1、Smad3、Smim23、Sned1、Sod3、Sox9、Sparc、Sparcl1、Stk32a、Synpo2、Syt10、Tapbpl、Tcf7l1、Tmem198b、Tnc、Tomll1、Traf1、Trib2、Tril、Trp53cor1、Ttll3、Ttll8、Ttyh1、Ttyh3、Ucp2、Vim、Wwc1、Zfp467、Zfp641、Zic1、Zic4和Zim1。
在小鼠中,表达可用作鉴定少突胶质细胞或其核的标志物的基因包括与未分选的核中的归一化表达相比具有最大表达变化的基因,包括:1500015L24Rik、1700063D05Rik、4930474G06Rik、4933413G19Rik、5031410I06Rik、5031439G07Rik、5430431A17Rik、9330111N05Rik、9330117O12Rik、A230001M10Rik、A330049N07Rik、Aatk、Abca8a、Adamtsl4、Adap1、Adipor2、Agpat4、Ankub1、Ano4、Apod、Arc、Arhgap23、Arhgef10、Arl4d、Arrdc2、Arrdc3、Arsg、Aspa、Asphd1、B3galt5、Bche、Bcl2l1、Bicd2、Bin1、Bpgm、C030029H02Rik、C630043F03Rik、Car14、Car2、Carns1、Ccdc152、Ccp110、Cdh19、Cdk18、Cdk19、Cep97、Cers2、Chdh、Cldn11、Cnp、Cntn2、Cpm、Cpox、Creb5、Cryab、Cyp2j12、D16Ertd472e、D1Ertd622e、D7Ertd443e、Daam2、Ddit4、Ddr1、Degs1、Depdc7、Dnajb2、Dock10、Dock5、Dpy19l1、Dusp26、Edil3、Efnb3、Elovl7、Endod1、Enpp2、Enpp4、Erbb2ip、Erbb3、Ermn、Fa2h、Fam134b、Fam46a、Fbxo32、Fbxw15、Folh1、Frmd4b、Fth1、Gab1、Galnt5、Galnt6、Gatm、Gbp11、Gjb1、Gjc2、Glu1、Gm10471、Gm1979、Gm21671、Gm5535、Gm5862、Gm7361、Gm9895、Gng11、Gng8、Gpr37、Gpt、Grm3、Gstm7、Hapln2、Hebp1、I730030J21Rik、Il33、Inf2、Insc、Josd2、Kcnj2、Kcnkl3、Kctd13、Kctd3、Kif13b、Klhl2、Klk6、Kndc1、Lap3、Larp6、Lipa、Litaf、Lrrc8b、Lzts2、Mag、Mal、Map6d1、Map7、Mast3、Mast4、Mboat1、Mbp、Mcam、Mobp、Mog、Myold、Myrf、Ndrg1、Neat1、Nfe213、Nhlrc4、Nipal4、Nkain1、Nkain2、Nmral1、Olfml1、Opalin、Osbp17、Pacrg、Pacs2、Pak7、Pde4b、Pde8a、Pex51、Phlpp1、Piga、Pigz、Pik3c2b、Pim3、Pip4k2a、Pkd2l1、Pla2gl6、Plcl1、Plekhg3、Plekhh1、Plp1、Pls1、Plxnb3、Ppfibp2、Ppplrl4a、Pricklc2、Prima1、Prox1、Prr18、Prr51、Prrg1、Psat1、Pstpip2、Ptgds、Ptma、Ptprd、Qdpr、Rasgrp3、Rcbtb1、Rff1、Rhob、Rhou、Rnf220、Rnf7、Rtn4、Slpr5、SaIl1、Sccpdh、Sec11c、Sec1415、Serpinb1a、Scz6l2、Sgk2、Sh3tc2、Shisa4、Shtn1、Slain1、Slc12a2、Slc25a13、Slc38a2、Slc48a1、Slc7a15、Smad7、Sox2ot、Speer4a、Spg20、St18、St6galnac3、Stmn1、Stmn4、Stxbp6、Synj2、Sytl2、Tbcld5、Thumpd1、Tmeff1、Tmeff2、Tmem125、Tmem151a、Tmem229a、Tmem258、Tmem63a、Tmem88b、Tmem98、Tmprss5、Tnfaip6、Tnni1、Tppp、Trf、Trim36、Trim59、Tspan2、Ttll7、Tubb4a、Ugt8a、Usp31、Usp54、Vmp1、Xaf1和Zdhhc20。
在小鼠中,表达可用作鉴定少突胶质细胞祖细胞(OPC)或其核的标志物的基因包括与未分选的核中的归一化表达相比具有最大表达变化的基因,包括:1700086L19Rik、1810041L15Rik、5730559C18Rik、6330403K07Rik、8030451O07Rik、A230077H06Rik、A730017C20Rik、Abcg2、Abhd2、Abtb2、Adam12、Adm、Alcam、Amz1、Arhgap24、Asap3、Ascl1、B3gat2、B9d1、Basp1、Bcasl、Bmp4、Brinp3、Clql1、Clql2、Cacng4、Calcrl、Cavl、Cav2、Ccnd1、Cd200、Cdh13、Cdh24、Cdo1、Cfap20、Chad1、Chst11、Chst2、Chst3、Chst5、Cob1、Col11a2、Col27a1、Csga1nact1、Csnk2a2、Cspg4、Cspg5、Ctxn1、Cysrt1、Dbpht2、Dcc、Dpm3、Dpysl3、Dscam、Ebf4、Eid2b、Elfn1、Elfn2、Enpp6、Epb41l2、Epn2、Eya1、Fam19a2、Fam3c、Fam89a、Fbn2、Fdps、Fhl3、Frrs1、Ftsj2、Fzd9、G0s2、Galnt3、Gfpt2、Gfra1、Gng4、Grm5、Gsx1、H2-K1、Has2、Hiplr、Hrk、Ick、Ifitm7、Igfbp3、Itga9、Itpr2、Kcnh5、Kcnh8、Khdrbs3、Klhl5、Lbh、Lhfpl3、Limd1、Lims2、Lmcd1、Lpcat2、Lrfn2、Lrrc4c、Lrrtm4、Marcks、Matn1、Matn4、Mex3b、Mfsd2a、Miat、Mir17、Mmp15、Mmp16、Mmp2、Myc1、Myt1、Ncan、Neto1、Neu4、Nova1、Nxph1、Olfm2、Olig2、Opcml、Oprl1、Pcdh15、Pcdh17、Pcdh7、Pdgfra、Pdzd2、Pfn2、Phlda1、Pmepa1、Ppfibp1、Ppp2r2b、Prr36、Prss23、Prss48、Ptgfrn、Ptpro、Pxdc1、Qpct、Rapgef3、Rasgef1b、Rcn1、Rep15、Rgcc、Rin2、Rlbp1、Rnd2、Rnf122、Rpl13、Rprm、S100a3、S100a4、S1pr2、Sapcd2、Sce1、Scrg1、Sema3d、Sema5a、Sema5b、Serpine2、Sertm1、Sh3bp4、Sh3rf1、Slc1a1、Slc22a23、Slc35f1、Slc44a5、Slitrk3、Slitrk5、Slitrk6、Snhg5、Snx1、Snx22、Sox10、Sox4、Sox6、Spry4、Sstr1、Sulf2、Susd5、Tacl、Tes、Tgfa、Tmem100、Tmem132b、Tmem176b、Tnr、Tns3、Tox3、Tspan6、Vash1、Vcan、Vmnlr55、Vpreb1、Vstm2b、Vwc2、Xylt1、Zc3hav11、Zdhhc23、Zfp365和Zfp488。
在一些实施方案中,列出的一种、两种、三种或更多种,包括4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50种或更多种标志物的集合、子集可用于鉴定人、小鼠、大鼠或非人灵长类动物中的任一种的颗粒细胞、篮细胞、星形胶质细胞、少突胶质细胞和OPC中的任一种或多种的核。可以使用分层聚类来使RNAseq谱之间的相似程度可视化。
2.来自大鼠的分选核中RNA谱的差异
在一些实施方案中,将来自大鼠组织的核分选为来自颗粒细胞、浦肯野细胞、篮细胞、星形胶质细胞、少突胶质细胞和OPC的核组。与颗粒细胞、浦肯野细胞、星形胶质细胞、少突胶质细胞和OPC中的归一化表达相比差异表达的基因可用作标志物。例如,至少一种差异表达基因的表达或缺乏表达选自:AABR07001623.1、AABR07001734.1、AABR07006310.1、AABR07006713.1、AABR07006713.2、AABR07006727.1、AABR07013140.1、AABR07026032.2、AABR07030473.1、AABR07030880.1、AABR07046961.1、AABR07047823.1、AABR07049491.1、AABR07052897.1、AABR07058658.1、AABR07061428.1、AABR07070161.1、AABR07070161.6、AABR07070578.1、Abi3、Aqp9、Arhgef26、Arhgef33、Arl4a、B3gnt5、Bgn、C1ql1、C1ql2、Cacng5、Cadps2、Calb1、Calb2、Car4、Car8、Cav1、Cbln1、Ccnd1、Cdh15、Cdk2、Cep76、Cldn11、Clmp、Col12a1、Col5a3、Cspg4、CyP2d5、Enpp1、Ermn、Fam107b、Fam89a、Fat2、Gabra6、Gabrd、Gdf10、Gjd2、Gldc、Gli1、Gpr37、Gpr63、Grm8、Hapln2、Hpcal4、Id4、Il16、Itga7、Itga9、Itih3、Itpr1、Kcnh1、Kcnj12、Klk6、Lama3、Lfng、Lgi4、Lims2、Lypd6、Mag、Mal、March11、Mobp、Mog、Msx2、Mt2A、Nkain4、Opalin、Pdgfra、Plch1、Plk2、Plxdc1、Pme1、Pou3f2、Ppfibp1、Ppplr17、Prr5l、Prrt2、Qdpr、Rasgrp3、Rbfox3、RGD1561557、RGD1561849、Rlbp1、Ryr1、Slpr1、Scara3、Selplg、Serpine2、Slcla6、Slc25a18、Slc5a11、Slc7a10、Slc9a3、Snx22、Sorcs3、Sv2b、Tesc、Tmem255b、Tmem63a、Tmem88b、Tnc和Zfp385c,并且可用作物种特异性和细胞类型特异性标志物。
在大鼠中,表达可用作鉴定颗粒细胞或其核的标志物的基因包括与未分选的核中的归一化表达相比显著富集的Fat2和Rbfox3的表达。可用作鉴定浦肯野细胞或其核的标志物的基因包括显著富集的Car8和Calb1的表达。可用作鉴定伯格曼神经胶质或其核的标志物的基因包括显著富集的Aldh1L1和Slc1a3的表达。可用作鉴定少突胶质细胞(皮质脑桥锥体细胞)或其核的标志物的基因包括显著富集的Colgalt2的表达。可用作鉴定伯格曼神经胶质或其核的标志物的基因包括显著富集的Hs3st4的表达,其被观察到是皮质丘脑锥体细胞特异性的,而Pde1a和Csmd1被观察到少突胶质细胞和OPC(两种皮质锥体细胞类型)中表达。
在一些实施方案中,Itih3的表达可以用作小脑的伯格曼神经胶质细胞(一种星形胶质细胞)和非伯格曼神经胶质星形胶质细胞的标志物。6种细胞类型的核的其他标记物可包括:用于颗粒细胞核的Tescalcin(Tesc)、用于浦肯野细胞核的碳酸酐酶8(Car8)、用于篮细胞核的March11、用于星形胶质细胞核的间-α-胰蛋白酶抑制剂重链3(Itih3)、用于少突胶质细胞核的Mog、以及用于少突胶质细胞祖细胞核的血小板衍生生长因子受体α(Pdgfra)。
在一些实施方案中,Allen Mouse Brain Atlas原位杂交数据库用于分析标志物的定位以确认细胞类型。
在一些实施方案中,列出的一种、两种、三种或更多种,包括4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50种或更多种标志物的集合、子集可用于鉴定人、小鼠、大鼠或非人灵长类动物中的任一种的颗粒细胞、篮细胞、星形胶质细胞、少突胶质细胞和OPC中的任一种或多种的核。可以使用分层聚类来使RNAseq谱之间的相似程度可视化。
3.来自人的分选核中RNA谱的差异
对来自16个人死后脑的样品的分析揭示,衰老、性别、组织样品的自溶时间和应激的特定分子后果在细胞类型之间不同,尽管在每种情况下,参与突触发展和维持的基因的表达减弱。强力细胞类型特异性分子途径表明在16个供体中的3个脑中发生了病理生理响应。观察到三个脑样品的小脑颗粒细胞表现出对包含许多立即早期基因的224个基因的强烈诱导,并且对于指示对一些外部影响的急性响应的GO类别(蛋白质折叠/重折叠、细胞凋亡、对应激的转录响应、对外部刺激的响应、ATP酶活性等)富集;然而,这些供体没有明显的共有的临床疾患。如实施例中所述,明显没有与自溶时间的相关性并且没有诱导指示中风或脑损伤的神经胶质标志物。尽管在培养的小鼠颗粒细胞中已经广泛表征了活性依赖性基因表达变化,但是在这三个人样品中鉴定的响应是重叠但特有的。本文用于模型系统或iPS细胞的实验研究的指南结果旨在鉴定在人脑中引发这些响应的信号。使用本文描述的细胞谱分析技术的分子谱分析可以应用于任何物种,并且提供用于研究与人细胞类型功能和功能障碍相关的分子事件的途径。
在一些实施方案中,Rbfox3和Fat2的增加的表达可以用作来自人颗粒细胞的核的标志物。或者,Marchl1的增加的表达可用作人篮/星状细胞的核的标志物。或者,Aldhla1和Slcla3的增加的表达可用作人核星形胶质细胞的标志物。或者,Mog的增加的表达可用作成熟少突胶质细胞的标志物。或者,Pdgfra和硫酸软骨素蛋白多糖4(Cspg4)的增加的表达可用作OPC的标志物。
在一些实施方案中,列出的一种、两种、三种或更多种,包括4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50种或更多种标志物的集合、子集可用于鉴定人、小鼠、大鼠或非人灵长类动物中的任一种的颗粒细胞、篮细胞、星形胶质细胞、少突胶质细胞和OPC中的任一种或多种的核。可以使用分层聚类来使RNAseq谱之间的相似程度可视化。
C.直接定义人类细胞类型
本文所述的细胞谱分析技术也可以独立于已在小鼠中表征的细胞类型使用,因为来自小鼠和人的神经元之间存在差异,并且可能存在人特异性神经元亚型。通过检查来自感兴趣区域的未分选核的转录谱来鉴定用于分选的推定细胞类型特异性基因。在小鼠中,观察到在未分选的核中以低水平表达的染色体相关转录物(CAT)和聚A+转录物通常在一种或书中细胞类型中以高水平表达。针对不同细胞类型探索了物种之间的差异,并且通过原位杂交和免疫荧光支持了这些发现。在本文所述的细胞谱分析方法的背景下,使用相同的策略谱分析来自特定细胞类型的人核RNA。
IV.核谱的比较分析
本文描述了来自小鼠、大鼠和人的多种细胞类型的分离和转录谱分析核。例如,细胞类型来源于基底神经节、丘脑、小脑或海马组织。来源于小脑的细胞类型包括:浦肯野细胞、颗粒细胞、伯格曼胶质细胞、篮/星状细胞、星形胶质细胞、少突胶质细胞和小脑深核细胞。对这些样品进行测序分析以确定个体之间和物种之间的差异。在一些实施方案中,通过组织切片上的原位杂交验证结果。
开发用于表征确定的CNS细胞类型的分子特性的准确且有效的非遗传方法的驱动力是能够直接研究人类生物学。在小鼠和人之间的相同细胞类型中的基因表达之间观察到大的差异。鉴于确定人类疾病遗传原因的大量研究以及在动物模型和人二者中惊人的发现:这些可能包括涉及基因剂量简单变化的病变,所以探索正常和受影响的大脑中细胞类型的细节是必要的。因此,使用显示人细胞类型特异性特征的本文所述的细胞谱分析技术在实验系统中获得的数据的比较分析降促进对影响CNS回路的多种人类疾病的理解。
最近的进化模型(Arendt,D.(2008).Nat Rev Genet 9,868-882和Arcndt,等(2016)Nat Rev Genet 17,744-757,其各自通过引用整体并入本文)是细胞类型的有用的共识定义,用于考虑使用本文描述的细胞谱分析技术产生的数据。根据该模型,同源细胞类型的具体特征可以变化,只要其保持由独特的共有的调节装置定义即可。例如,浦肯野细胞、颗粒细胞或星形胶质细胞基因表达谱可以在物种之间变化,或甚至在一种类型的单个细胞中变化,而不丧失其细胞类型特性。由于顺式调节序列的突变,该定义适应物种间细胞类型的功能变化和细胞类型内基因表达的改变。本文的数据记录了啮齿动物和人脑之间每种细胞类型中直系同源基因表达的主要差异。数百种这些差异是细胞类型特异性的,并且在颗粒神经元中,大多数这些基因仍然在脑的其他区域中表达。这些数据表明,同源人和小鼠CNS细胞类型的微调生物化学显著不同。
这里给出的结果贡献了哺乳动物脑进化的两个主要见解。首先,尽管它们与先前公布的作为进化机制的顺式调节序列差异的实例一致(Maricic,等(2012)MolecularBiology and Evolution 30,844-852;Prud′homme,等(2006)Nature 440,1050-1053;Weyer等,Mol Biol Evol.2016 Feb;33(2):316-322,2015;其各自通过引用整体并入本文),但对于本文记录的大部分细胞特异性事件缺少高度富集的GO类别强烈地表明,调节变化是哺乳动物脑中同源细胞类型之间表型变异的主要驱动因素。这与上面提出的进化模型一致,因为其允许细胞功能特性的实质演变,同时保持定义给定细胞类型的核心调节复合物(CoRC)(Arendt,等(2016)Nat Rev Genet 17,744-757,其通过引用整体并入本文)。其次,本文记录的表达差异是大的,并且分析限于高可信度的直系同源基因。该数据补充了先前对祖细胞的研究,其报告了缺乏小鼠直系同源物的人基因表达的实质性变化(Florio等,Science.2015 Mar 27;347(6229):1465-70,其通过引用整体并入本文)。如果合在一起,这些数据集预测小鼠和人类细胞类型之间的表达差异是广泛的、细胞类型特异性和表型重要的。
在使用本文方法谱分析人样品的某些实施方案中,相关系数在样品之间(r=0.98-1.0),表明结果极其可重复,并且自溶时间对核RNA表达谱的影响很小。性别和年龄对CNS细胞类型中基因表达的不同影响的初步迹象表明,本文所述的细胞谱分析技术对于性二态人类行为和特定脑回路衰老的详细研究足够准确。例如,通过本文描述的细胞谱分析技术对人脑进行的比较分析提供了对衰老对选择性易受晚发性人类疾病影响的细胞类型的影响的见解。
A.确定不同物种之间不同的细胞类型特异性功能
尽管小脑中细胞的组织在小鼠和人之间是相似的,但仍存在许多差异。例如,与小鼠细胞相比,在人细胞中,浦肯野细胞更加分散并且NeuN-细胞在浦肯野层中扩展,这证明人小脑与小鼠相比具有不同的组织。此外,与小鼠相比,在人中浦肯野细胞体和核的尺寸更大。在一些实施方案中,RNAseq可用于比较物种之间的基因表达以鉴定物种特异性标志物。例如,来自颗粒细胞、星状细胞和神经胶质细胞的核的蛋白酪氨酸激酶2β(Ptk2b)、溶质载体家族43成员2(Slc43a2)、谷氨酸离子型受体红藻氨酸盐型亚基3(Grik3)、Itpr1、原钙粘蛋白9(Pcdh9)和RAS鸟嘌呤释放蛋白1(Rasgrp1)可用于区分人和小鼠核。由于小脑是物种间最保守的脑结构之一,因此在其他大脑区域更容易观察到更多的结构和分子差异。
尽管可以在来自相同物种的样品之间显示异质性,但是对不同物种中的每种细胞类型最具特异性的基因可以用作细胞类型的独特标志物。在一些实施方案中,超过一种基因的表达可用于鉴定特定细胞类型。与所有细胞类型(例如颗粒细胞、浦肯野细胞、星形胶质细胞、少突胶质细胞和OPC)的归一化表达相比差异表达的基因可以从分析中消除,以鉴定感兴趣的细胞类型的至少一种标志物。
在一些实施方案中,使用如本文所述的特异性指数(SI)的算法计算最特异性基因。例如,来源于人样品的颗粒细胞的核中最特异性基因(通过降低特异性排序)是Cadps2、Reln、Synpr、Galnt5、Ccm21、Srrm4、Tmem266、Cckbr、Cerkl、Chn2、Grik2、Mal2、Fat2、Adamts16、Lcn8、Fstl5、Tll1、Vsn11、Rit2、Slc8a2、Slcl7a7、Zp2、Tspanl8、Fgf5、Prag1、Slc6a7、Rims1、Cdh7、Llcam、Mical2、Ptk2b、Kcnh1、Arhgap29、Cdk15、Pde3b、Itga4、Etv1、Tmeml78、Chgb、Col13a1、Rnf152、Kcnk1、Il16、Sstr2、Als2、Barhl1、Scn2a、Cbln1、Dusp5、Ndst3、Lurap11、Kcnj12、Snai2、Ifnlr1、Neurod1、Cdyl2、Ppplrlc、Jkamp、Neurlla、Trhde、Mfsd9、Xkr7、Barhl2、Cbln3、Uncx、Ptchd1、Cblb、Runxlt1、Sphkap、Gabra6、Coro2a、Bmper、Dkk4、Camk4、Uncl3c、Trp53i11、Ephb1、Glb1l3、Mdga1、Kcnc1、Tmem252、Mpp7、Hipk4、Tmem51、Cacnb3、Cyb5a、Tmem2、6430573F11Rik、Rasgrpl、Rab37、Adarb1、Svop、Pgm5、Mthfd11、Cdh15、Vwc2、Disp2、Tspan15、Slc26a5和Lhfp。例如,来源于小鼠样品的颗粒细胞核中最特异性基因(通过降低特异性排序)是Gabra6、Grin2c、Fat2、Cadps2、Ptpn22、Chn2、Neurod1、Calb2、Trhde、Il16、Ppfia4、Cbln1、Sidt1、Tmem266、Gabrd、Reln、Kcnj12、Gprc5c、Rims3、Tlll、Cbln3、Olfn3、Slc17a7、Chgb、Kcnh1、Cdh15、Barh12、Dusp5、Kcnc1、Camk4、Des、Cerk1、Svep1、Uncx、Slc8a2、Cacna2d1、Pxylp1、Ptchd1、Sel113、Rtn4r、Cacnale、Patj、Atp2b3、Marveld2、Kcnk10、Rab15、Rapgef4、Rims1、Tmem178、Ak4、Lin7a、Igfbp5、Tesc、Neurlla、Vatll、Msra、Vsnl1、Rps6ka1、Lhfp、Kcnk3、Ryr2、Exph5、Kif26b、Adamts18、Cntnap4、Tspan18、Mmp24、Cdh8、Ablim3、Cadm3、Ntf3、Pld5、Syndig11、Galnt15、Etv1、Sh2d1a、Scn2a、Panx2、Speg、Bsn、Rnf112、Il20rb、Slc16a10、Ntn4、Adcy1、Mapk12、Boc、Syt12、Fstl5、Tead4、Clcn1、Pde3b、Pgm2ll、Tmtc4、Abcc8、Olfm1、Nedd4l、Lurap1、Krt24和Als2。例如,来源于大鼠样品的颗粒细胞的核中最特异性基因(通过降低特异性排序)是Tese、Itga7、Rbfox3、AABR07013140.1、Calb2、Kcnh1、Cdh15、AABR07030880.1、Prrt2、Gabrd、Il16、Scara3、Cbln1、AABR07026032.2、Cadps2、Sv2b、Fat2、Gabra6、Car4、Kcnj12、Nrep、AABR07043098.3、Rtn4r、Shisa8、Sel1l3、Grb7、Rgl3、Dusp5、Chn2、Lamp5、Pagr1、Cemip、Gprc5c、Shf、Wdr66、Tmem44、Reln、Tll1、Slc17a7、Pax6、Capn1、Calhm3、AABR07043098.1、Camk4、Selm、Sema3g、LOC100360491、Diras2、Agb12、Mctp1、Mvp、Tmem51、Vsnl1、Plk5、Mrgprf、LOC100910401、Ak4、Wscd2、Grin2a、Cfap74、Rnf39、Cbln3、Fzd7、Golga7b、AABR07033679.1、Ptpn22、Grin2c、Ablim1、Kcnk1、Arpp21、Clrl、Zscan30、Maf、Rtn4rl1、Barhl2、Kcnk12、Actl6b、AABR07053850.1、Sdc1、Camkk2、Nudcd3、Ccdc155、Cbfa2t3、AABR07037151.1、Etv1、Jph3、Itgal1、Rnf182、RGD1560784、Plcxd3、Ablim3、Rims1、Nyx、Uncx、AABR07034445.1、AABR07025051.3、Kcnk10、Kcnk3、Nol3和Als2。
例如,来源于小鼠样品的浦肯野细胞的核中最特异性基因(通过降低特异性排序)是Car8、Calb1、Arhgef33、Atp2a3、Itpr1、Ppplr17、Slcla6、Slc9a3、Trpc3、Casq2、Clic6、Plekhd1、Ryrl、Cacnalg、Pcp2、Sycp1、Pde5a、Tspan11、Gpr63、Nell1、Cep76、Bcll1a、Grid2ip、Htr1b、Pet100、Strip2、Plxdc1、Skor2、Dag1a、Garn13、Itpka、Myo10、Gng13、Kcnip1、Trabd2b、Rnf207、Scn4b、Arhgap20、Grip1、Pde9a、Ppp4r4、Cck、Ebf1、Bean1、Tuba8、Smpx、Ebf2、Slc19a1、Ccdc85a、Flt3、Camk2a、Sh2d4b、Homer3、Stkl7b、Clec21、Hrh2、Ksr2、Chtf18、Vax2、Foxp4、Ankrd33b、Cpne9、Corin、Il22、Prkag3、Cep126、Slc20a1、Akain1、Nrk、Pihlh3b、InPP5a、Lhx1、Sptbn2、Paxbp1、Dner、Doc2b、Tspoap1、Gfra2、Fh15、Dmd、Kcnab2、Serinc2、Car7、Dnah6、Prmt8、Prkcg、Mdfi、Dgkh、Faml17a、Nek2、Fmnl1、Atl2、Cfap161、Lin28b、Cacna2d2、Ptchd4、Pkp3、Shank1、Grid2、Nefh。例如,来源于大鼠样品的浦肯野细胞的核中最特异性基因(通过降低特异性排序)是:Arhgef33、Car8、Slc1a6、Calb1、Ppp1r17、Itpr1、Zfp385c、Ryr1、AABR07030473.1、Slc9a3、AABR07006713.1、AABR07006713.2、RGDl561557、Gpr63、AABR07049491.1、AABR07006727.1、Plxdc1、Cep76、Fam107b、B3gnt5、Far2、AC108261.1、Grid2ip、AABR07072628.1、Kcnip1、AABR07006724.1、Trpc3、Phka2、Car7、Fam117a、Hes3、Casq2、Dgkh、Arhgap26、Trabd2b、Nell1、Bcll1a、Col18a1、LOC100125362、Ptchd4、Camk2a、Dyrk4、Kitlg、Kcnab1、Nxn12、Ltk、LOC689927、AABR07056156.1、Cpne8、Htrlb、AABR07033570.1、Icmt、AABR07047598.1、Cstf2t、Grik1、Itpka、LOC100910996、Hpcal1、Efna5、Myo10、Rgs8、Skor2、Il22、Slc12a3、CBne9、AABR07007980.2、Cacna1g、Doc2b、Sptbn2、LOC108351705、AABR07035926.1、AABR07037943.1、Pcp2、AABR07061860.1、AABR07024820.1、Inpg1、Nkiras2、Krtap12-2、Tmem123、AABR07044009.1、Ptprr、Homer3、Garn13、Sos1、Kcnab1、Cntn3、LOC304725、Stk17b、AABR07047604.1、Zdhhc23、Scn4b、AC126640.1、Pde9a、Ptprb、Prkcg、Pcp4、AABR07056374.1、Fstl4、Ppp4r4和Nup93。
例如,来源于人样品的篮细胞的核中最特异性基因(通过降低特异性排序)是:Bhlhe22、March11、Kit、Tfap2b、Clmp、Lbx1、Slc38a5、Frmd3、Btbd11、Lipg、Rab3b、Lrrc38、Galnt14、Cnr1、Tcerg11、Cbln2、Siah3、Stac2、Scgn、Rspo1、Lmcd1、Lp1、Adra1b、Gad2、Chrna3、Socs2、Trpc6、Kcna3、Syn3、Em15、Nef1、Fam84a、Trpc5、KIAA1644、Hrh3、Disp3、Tfap2a、Gjd2、Adamts2、Sorcs3、Ptprk、Timp3、Gjb4、Ehd3、Cxcl12、Actc1、Pnma2、Fam43a、Adam11、Dact2、Rgs16、Slc5a8、Exph5、Cfap221、Myol6、Megf10、Cacna1d、Pax2、Efna5、Plch1、Gabrg2、Prrt4、Itga5、Sp5、Nefm、Grik3、Cx3cl1、Fbxo24、Lect2、Nefh、Efnb3、Grk3、Mpz、Syt2、Scrt1、Cdc42ep3、Trim67、Grin2b、Rab3c、Plxna4、Fzd8、Elmod1、Smim17、Slc8a3、Nrip3、Plekhg5、Arl4a、Grm8、Cntnap5a、Maats1、Loxl2、Arap3、Dcx、Nyap2、Skor1、Pvalb、Ppm1j、Slc5a4a、Tmem132e和Cygb。例如,来源于小鼠样品的篮细胞的核中最特异性基因(通过降低特异性排序)是:Adamts15、March11、Tfap2b、Socs2、Penk、Bhlhe22、Plch1、Adamtsl6、Adrb2、Frmd3、Clmp、Cacna2d3、Trpc7、Galntl8、Tbcld4、Asgr1、Kit、Tfap2a、Fam84a、Gjd2、Grik3、Lrrc38、Chst9、Flrt2、Chac1、Grm8、Esrrg、Slc6a7、Pla2g4e、Stac2、Cabpl、Phf24、Camklg、Btbdl l、Stc2、Sorcs3、Lamb1、Trpc5、Coro6、Slc32a1、Kirrel、Cdkl1、Chst1、Asns、Sp5、Cryba2、Aldh112、Kcnab3、Tg、Plxna4、Prkcd、Cgn、Tcte1、Trim67、Osbpl10、Serpini1、Slc7a1、Gpr22、Cntn4、Skor1、Slc7a3、Atplb1、Kcna2、Cebpb、Parm1、Dock7、Em15、Cnih3、Asic2、Hpcal4、Adamts2、Masp1、Plxnc1、Gabrg2、Mtfp1、Ntn1、Ret、Zfp423、Nln、Man2a1、Neurod6、Grin2d、Angptl3、Cnrl、Tmem132e、Apcdd1、Rasgrf1、Hcn1、Scnn1g、Ly6e、Pax2、Rab3c、Rph3a、Rai2、Gad2、Mpp7、Arl4a、Igsf3、Tmem179和Sorbs2。例如,来源于大鼠样品的篮细胞的核中最特异性基因(通过降低特异性排序)是:Plch1、AABR07001734.1、Lypd6、Lama3、March11、Gldc、Grm8、AABR07047823.1、AABR07001623.1、Gjd2、Arl4a、AABR07070578.1、Hpcal4、AABR07061428.1、Col12a1、Enpp1、Sorcs3、Clmp、Plk2、Arhgef26、RGD1561667、Asic2、AABR07026472.1、AC124896.1、Trpc5、AABR07052084.1、AABR07059478.1、Kit、Nt5dc2、AABR07041885.1、Hcn1、Skor1、Prdm8、Phf24、Esrrg、Grik3、Bhlhe22、Mir346、Tmem200a、AABR07003600.7、Scn9a、Inpp4b、Ace、Kcna2、Adrald、Slc32a1、Cntnap4、Gridl、Trpc7、Begain、AABR07049535.3、Frmpd4、Tfap2b、Cnr1、AABR07054088.3、Zcchc16、Trpv6、Grb10、Pax2、Nrxn3、Tyms、Grid1、Myt11、Disp3、AABR07063359.1、Btn1a1、Rn60_10_0565.6、AABR07041972.1、Osbpl10、Six4、Mir384、Tbc1d4、Cabp1、AABR07003600.2、AABR07057590.1、Adrb2、Cacnald、Plxnc1、Dusp22、Hecw1、Gdpd4、mo-mir-344a-1、Lgi2、AABR07060291.2、Adarb2、Angpt1、Rspo4、Rn50_7_1158.3、Dcx、AABR07065531.31、Onecut1、Mkx、Rgs4、Kcnc2、Hgf、Fgf13、Itga8、AABR07070578.2、Apcdd1和Trim15。
例如,来源于人样品的星形胶质细胞的核中最特异性基因(通过降低特异性排序)是:Slpr1、Gja1、Lgi4、Efemp1、Etnppl、Aqp4、Rgma、Lgr6、Lcat、Tril、Serpini2、Pgghg、Slc1a3、Gfap、Aldh1a1、Pla2g5、Fxyd1、Wdr49、Gli1、Nfatc4、Scara3、Slc4a4、Lama2、Cdc42ep4、Gabrg3、P2ry1、Gabra2、Colec12、Mlc1、Slc7a11、Aldhlll、Sox9、Lgals3、Mgst1、Gatsl3、Ahnak、Pipox、Rhoj、Arhgef26、Arhgef28、Srpx、Mt3、Atpla2、Fxyd7、Lfng、Lamb2、Gdf10、F3、Sdc4、Hspb1、Hes1、Slcl2a4、Mertk、C3、AI464131、Id4、Vit、Fjx1、Ccdc80、Adora2b、Ryr3、Mfge8、Plekho2、Elovl2、Fam179a、Cebpb、Acss1、Slcl3a5、Ednrb、Pltp、Il33、Tlr4、Fam198b、Isyna1、Glis3、Dao、Fgfr3、Ncan、Msx2、Spatc1、Pdgfrb、Tubb2b、Fat3、Fam167a、Col22a1、Tcf7l1、Ndrg2、Nhsl1、Ddit41、Pbxip1、Rasl12、Sh3bp2、Aplnr、Robo3、Rubcn1、Rab34、Gtf2a11、Fgfr2、Kank2和Rfx4。例如,来源于小鼠样品的星形胶质细胞的核中最特异性基因(通过降低特异性排序)是:Gdf10、Slcla3、Fxyd1、Dao、A2m、Lfng、Lgi4、Mybpc1、Cdc42ep4、Slco4a1、Fam20a、Lcat、Acot11、Vim、Nwd1、Slpr1、Tnc、Rbm24、Acsbg1、Ntsr2、Prex2、Cables1、Gli1、Etnpp1、Pla2g7、Phkg1、Nhsl1、Slc14a1、Plekho2、Gjb6、Plce1、Itih3、Sdc4、Mertk、Prr5、Sparcl1、Id4、Mlc1、Pax3、Gpr153、Abi3bp、Pltp、Fxyd7、Rpusd3、AqP4、Igdcc3、Fgfr3、Mt3、Atp1a2、Gabrb1、Ndrg2、Ucp2、Plpp3、Frem1、Elov12、Gli2、Efhd2、Zic4、Oplah、Cxcl14、Mfge8、Sox9、Atp13a4、AI464131、Pdlim4、Rfx4、Traf1、Dmp1、Gabra4、Gja1、Etv4、Map2k6、Wwc1、Syt10、Sparc、Tril、Slc25a18、Aldhll1、Evala、Mxra8、Lgr6、Rgma、Egfr、Slc39al2、Slc8b1、Glipr2、Ax1、Aass、Hk2、Itpkb、Ramp2、Pyroxd2、Gabra2、Tcf7l1、Garem2、Wnt6、Dfna5、Fam92b、Plxnb1和Vamp1。例如,来源于大鼠样品的星形胶质细胞的核中最特异性基因(通过降低特异性排序)是:AABR07070161.1、Itih3、Gdf10、Gli1、Slc25a18、Nkain4、Tnc、Msx2、Slpr1、Slc7a10、Aqp9、Mt2A、Lgi4、Pou3f2、Id4、Cacng5、Cyp2d5、AABR07058658.1、AABR07070161.6、Lfng、AABR070701613、Fan107a、Nat8f3、Ctxn3、Aldhll1、Entpd2、Rbm24、Slc1a3、Mlc1、Cxcl14、Hif3a、Fxyd1、Acsbg1、AABR07070161.7、Notch3、Il33、Nwd1、Cdc42ep4、Samd91、Gabrb1、Plpp3、Cxcr4、Rgma、Itm2a、Ednrb、Pdlim4、Sgca、Sncaip、Prodh1、Agt、Slc14a1、AABR07032343.1、AABR07035782.1、Marc1、Fgfr3、AABR07070161.5、AC109886.1、Prr5、AqP4、Plekho2、AABR07035780.2、Sh2b2、F3、Sparcl1、Evala、Pltp、Gfap、Cyp2d4、Crlf1、Sdc4、Sod3、Dao、Chst1、AABR07001555.1、AABR07063346.1、Mpp6、Ptch2、AABR07031767.1、AC105604.1、Grin2b、Pygm、Etnppl、Slc15a2、Casp4、Gria1、Slc4a4、Camk2g、Cbs、AABR07035175.1、Ntsr2、Gja1、Aspg、Sfxn5、Ccbe1、Ahnak、Gramd3、Ndrg2、Mt3、Shroom3和Myh11。
例如,来源于小鼠样品的少突胶质细胞的核中最特异性基因(通过降低特异性排序)是:Klk6、Mog、Gldn、Cndp1、Gm20425、Tmem98、Slc5a11、Mag、Carns1、Gpr37、Cdk18、Hhatl、Anln、Enpp2、Folh1、Sec1415、Myrf、Plp1、Mal、Gjb1、Itga2、Cpm、Plpp2、Cntn2、Ermn、Opalin、Abca8b、Lpar1、Pld1、Sall1、Cercam、Dock5、Pi16、Man2a1、Pex5l、Tmem63a、Tmem125、Gipr、Sh3tc2、D7Ertd443e、Kel、Ldb3、Ccdc152、Cldn11、Synj2、Lrp2、Ninj2、Psrc1、Ndrg1、Actn2、Sgk2、Trim59、Plekhg3、Larp6、Slc45a3、Cnp、Col4a5、Pde8a、Rhobtb1、D16Ertd472e、Qdpr、Enpp6、Rhou、Sema3c、Gsn、Cyr61、Capn3、Hoxd1、Frmd4b、Tmem144、Galnt6、Pkmyt1、Fbxo32、Pla2g16、Dpyd、Sh3g13、Prima1、Rasal1、Fa2h、Fam124a、Treh、Paqr4、Azgp1、P1ekhh1、Dapk2、Knop1、Sema3b、Elovl1、Shroom4、Car2、Necab1、Aspa、Gabl、Kif6、Hhip、Ugt8a、Iqgap1、Map6d1、Eln和Pllp。例如,来源于小鼠样品的少突胶质核中最特异性基因(通过降低特异性排序)是:Gpr37、Pex5l、Hapln2、Apod、Ermn、Prr5l、Aspa、Efnb3、Anln、Mog、Plp1、Plekhh1、Tmem63a、Il33、D7Ertd443e、Secl4l5、Cams1、Tnfaip6、Galnt6、Galnt5、Ndrg1、Cldn11、Gjc2、Pla2g16、Fth1、Opalin、Car2、Dock5、Gm20425、Sall1、Pkd2l1、Kcnk13、Ppp1r14a、Gatm、Serpinb1a、Pde8a、Tnni1、Glu1、Tmprss5、Nipal4、Trim59、Mal、Slcl2a2、Qdpr、Litaf、Gjb1、Edil3、Pls1、Mboat1、St6galnac3、Gng11、Enpp2、Cpm、Pstpip2、Trim36、Klk6、Myold、Tmem98、Synj2、4933413G19Rik、Mag、Insc、Pigh、Pik3c2b、Ninj2、Trpv3、Car14、Tmem125、Map7、Cdk18、Depdc7、Aatk、Myrf、Cnp、Stmn4、Chdh、Nek4、Frmd4b、Ugt8a、Palm2、Arsg、Ccdc152、Efemp1、Piga、Rftn1、Itgb4、Emilin2、Enpp4、Nkain2、Adamtsl4、Hcn2、Plxnb3、Dpy1911、Arhgap23、Prima1、Gipr、Sh3tc2、Tubb4a、Map6d1和Kctd13。例如,来源于大鼠样品的少突胶质细胞的核中最特异性基因(通过降低特异性排序)是:Gpr37、Pex5l、Hapln2、Apod、Ermn、Prr51、Aspa、Efnb3、Anln、Mog、Plp1、Plekhh1、Tmem63a、Il33、D7Ertd443e、Sec14l5、Carns1、Tnfaip6、Galnt6、Galnt5、Ndrg1、Cldn11、Gjc2、Pla2g16、Fth1、Opalin、Car2、Dock5、Gm20425、Sall1、Pkd2l1、Kcnk13、Ppp1r14a、Gatm、Serpinb1a、Pde8a、Tnnil、Glul、Tmprss5、Nipal4、Trim59、Mal、Slcl2a2、Qdpr、Litaf、Gjb1、Edil3、Pls1、Mboat1、St6galnac3、Gngll、Enpp2、Cpm、Pstpip2、Trim36、Klk6、Myold、Tmem98、Synj2、4933413G19Rik、Mag、Insc、Pigh、Pik3c2b、Ninj2、Trpv3、Carl4、Tmeml25、Map7、Cdk18、Depdc7、Aatk、Myrf、Cnp、Stmn4、Chdh、Nek4、Frmd4b、Ugt8a、Palm2、Arsg、Ccdcl52、Efemp1、Piga、Rftn1、Itgb4、Emilin2、Enpp4、Nkain2、Adamtsl4、Hcn2、Plxnb3、Dpyl9l1、Arhgap23、Primal、Gipr、Sh3tc2、Tubb4a、Map6d1、Kctdl3、Mog、Opalin、Mobp、Tmem63a、AABR07006310.1、Hapln2、Klk6、Qdpr、Selplg、Cldn11、Ma1、Ermn、AABR07046961.1、Abi3、Gpr37、Tmem88b、Rasgrp3、Prr5l、Slc5a11、Mag、LOC100362909、Tmem176b、LOCl00302465、Cx3crl、Ctss、Cams1、Tmeml25、Tmeml76a、Secl415、Tf、Clqb、Apod、Slpr5、Rn60_5_1374.5、Plp1、Insc、Mbp、Pls1、Tmem98、Anln、Ndrgl、PafahlB1、Pex5l、LOC361016、Galnt6、Trim36、AABR07017693.1、Gpatch4、Plekhg3、Hamp、Csf1r、Gjc2、Car14、Trim59、AABR07053870.1、Gpr84、Plekhh1、Ghr、Kndc1、Slco2b1、Cd74、Aspa、Trpv3、AABR07008030.1、Aplp1、Tgfbr2、Gjb1、Ptp4a3、Prima1、Pik3c2b、AABR07036035.1、Sall1、Plpp2、Pld4、Fam102b、Cd33、Cdkn1a、Nkd1、Elovl7、Piga、Inf2、Blnk、Enpp4、Il18、Spata13、Mettl7a、Inpp5d、Myrf、Gjc3、Trim2、AABR07012039.1、AABR07033887.1、Enpp2、Pacs2、Clqa、Trem2、Slc45a3、Hhip、Anxa3和AABR07022098.1。
例如,来源于人样品的OPC的核中最特异性基因(通过降低特异性排序)是:Fermt1、Lims2、C1ql1、Sstr1、Olig1、Bambi、Usp43、B3gnt7、Pdgfra、C1ql2、Olig2、Fmo3、Cspg5、Galr1、Gpc2、Fibin、Cspg4、Col11a1、Bche、Col9a1、Afap112、Cldn1、Plpp4、Sox13、Plat、Neu4、D630023F18Rik、Col20a1、Pxylp1、Asic4、Spsb4、Prelp、Gpr34、Best3、Stk32b、Akr1c14、Susd5、Ophn1、Mmp16、Sulf2、Prkg2、Tns3、B3galt4、Fgfbp3、Nkain3、Ntn1、Ascl1、Sema5a、Hrasls、Gal3st4、Ebf4、Tmem132d、Nt5e、Jag1、Megf11、Ildr2、Plppr1、Dcc、Ntn4、Sox6、Cacng4、Pxdn、Sapcd2、Tnk2、Slc43a3、Adamts6、Vsig8、Itm2a、Marcksl1、Alk、Smoc1、Cacna2d3、Tm4sf1、Bgn、Pdgfc、Atp2c2、Aldh1a3、Prrx1、Meis3、Cxxc4、Cd27、Sema3e、Adamts17、Akr1c20、Arhgap10、Crispld2、Sipa1l2、Ppp1r36、Gng12、Syt17、Midn、Gadd45a、Khdrbs3、Thbs4、Vipr2、Ccnd1、Iffo1、Atoh8、Exosc4和Pde7b。例如,来源于小鼠样品的OPC的核中最特异性基因(通过降低特异性排序)是:Neu4、C1ql1、Ppfibp1、3110035E14Rik、Pdgfra、Rgcc、Susd5、Itga9、Tes、Rprm、Rep15、Cspg4、Matn4、Amz1、181004lLl5Rik、Pxdc1、Tox3、Sh3bp4、Elfnl、Galnt3、Lmcd1、Serpine2、C1q12、Netol、Grm5、Mmp2、Coll1a2、Sema3d、Lims2、Cav1、Sapcd2、Rcn1、Ptpro、Ccnd1、Ptgfrn、Ncan、5730559C18Rik、Lpcat2、Olig2、Fhl3、Tspan6、Rin2、Ascl1、Basp1、Pmepa1、Fzd9、Famll4a1、Abhd2、Ctxn1、Cspg5、Cfap20、Vwc2、Cdo1、Cdh13、Marcks、Gsx1、Sertm1、Slc1a1、Matn1、Has2、Lama4、Mycl、Klhl5、Kcnh5、Kcnh8、Sema5a、Enpp6、Slc5a7、Cav2、Lbh、Adm、Adam12、S100a4、Mfsd2a、Igfbp3、Midn、Asap3、Prkg2、R1bp1、Abcg2、Vstm2b、Dock6、Fbn1、Frrs1、Khdrbs3、Slitrk6、Chstl1、Ptpn14、DPys13、Slc44a5、Eyal、Sox6、Phox2a、Col11a1、Swap70、Fam89a、Mrm2、LyPd1、Shisa7和Pcdh17。例如,来源于大鼠样品的OPC的核中最特异性基因(通过降低特异性排序)是:Fam89a、Pdgfra、RGD1561849、Rlbp1、Ccnd1、Tmem255b、Clql1、Bgn、Itga9、Ppfibp1、Snx22、Col5a3、Pmel、Cav1、Serpine2、Cspg4、Lims2、AABR07052897.1、C1ql2、Cdk2、AABR07010022.1、Cacng4、Matn4、AABR07049948.1、Susd5、Prkg2、Pxdc1、RGD1566029、AABR07003304.1、Sapcd2、Cspg5、Mmp15、Rgcc、Slc22a6、Sema5b、Qprt、Pnlip、Slc6a12、RGD1311892、AABR07003306.1、AABR07044671.1、Rbpjl、Chst5、Traf4、Sox6、Cox6b2、Pcdh15、Cd101、Xylt1、AABR07003304.2、Calcrl、Col1a1、Lama4、Elfn1、Ampd3、Fam212b、Slc6a13、Sstr1、Sema3d、AC141997.1、Cpne7、Ptgfrn、Wbscr28、Ryr3、Gpsm2、Netol、Chstll、Slc22a8、Pstpip2、AABR07044668.1、Bcas1、Igf2、Lbh、Olfm2、Ndnf、Vstm2b、AABR07058656.1、Rep15、Vtn、Eln、Ranp1、Pmepal、Gpnmb、Ptpro、Limd1、Cdh13、Nrxn2、MgP、Myt1、Marcks、LOC100362216、AABR07043601.4、LOC102553018、Masp1、Sulf2、Tle6、Fam114a1、Tmem100、Ccnd2和Rasgef1b。
在一些实施方案中,观察到小鼠和大鼠之间的特异性排名比小鼠和人之间的更保守。在一些实施方案中,可以对被认为对每种细胞类型或物种特异的基因进行基因本体论(GO)分析,以确定基因是否在相同途径中起作用。在一些实施方案中,在给定细胞类型的替代家族成员中观察到细胞类型或物种特异性标志物的表达变化。例如,Pde1c可用于小脑或其核中的小鼠细胞类型,Pde1a表达可用于小脑或其核中的人细胞类型。
在一些实施方案中,蛋白酪氨酸激酶2p(Ptk2b)、溶质载体家族43成员2(Slc43a2)、谷氨酸离子型受体红藻氨酸盐型亚基3(Grik3)、Itpr1,原钙粘蛋白9(Pcdh9)和Ras鸟嘌呤释放蛋白1(Rasgrp1)的表达水平的差异)用于区分来自人和小鼠的颗粒细胞、胶质细胞和篮/星状细胞的核。
B.分析跨物种分析的细胞类型特异性和物种特异性基因表达
在一些实施方案中,通过比较来自每种细胞类型的分选核的RNAseq结果与三种物种的归一化RNAseq结果的比较来鉴定最可变的基因。在一些实施方案中,细胞类型特异性和物种特异性基因可以通过具有细胞类型中最大变异和分析的物种中最大变异之一或两者的基因来鉴定。在一些实施方案中,观察到在物种之间具有最大表达变异的基因可以通过细胞类型进一步区分。例如,核在物种之间可能比细胞类型具有更大的差异。在一些实施例中,可以使用分层聚类来观察由每个变异组分提供的分离程度。
在一些实施方案中,Pcsk2、Pcsk6和Pcsk8用于通过细胞类型和物种对核进行分类。或者,Pcsk1和Pcsk3用于通过细胞类型对核进行分类。
在一些实施方案中,可以将核结构与基因表达调节或疾病易感性中每种细胞类型的差异进行比较。
C.人样品中临床属性的影响
在一些实施方案中,可以分析由于临床属性引起的核谱的差异以鉴定属性的标志物。例如,在自溶时间、性别、年龄和压力的不同时期观察到谱差异。
在先前的研究中观察到自溶对基因表达仅具有微小影响(Gupta等,2012,BMCGenomics 13,26,其通过引用整体并入本文)。在一些实施方案中,分选的核中至少四种基因的表达可用于定义在自溶的不同阶段来源于人样品的颗粒细胞。在一些实施方案中,至少一种基因的表达可用于定义在自溶的不同阶段来源于人样品的篮/星状细胞或神经胶质。在一些实施方案中,可以测量驱动蛋白家族成员19(Kif19)的表达水平以确定自溶时间。例如,Kif19的高水平表达表明较高的自溶时间,而Kif19的较低表达水平表明较低的自溶时间。可以将表达水平与所有样品的归一化表达进行比较。在一些实施方案中,FosB原癌基因,AP-1转录因子亚基(FosB)的更高水平表达表明中间自溶时间为约5小时至约24小时。
还可以鉴定性别特异性和细胞类型特异性基因表达以确定性别对基因表达的影响。Xist是X染色体上的基因,其参与X染色体失活并且仅在雌性中表达。接下来,我们分析性别是否影响特定细胞类型中的基因表达。Tsix是对Xist反义的基因,其被观察到仅在女性的神经胶质中表达。这是性别特异性和细胞类型特异性基因表达的一个实例。
在一些实施方案中,可以比较从雄性和雌性样品分离的核的谱,以确定性别特异性标志物。例如,与未分选的核中的归一化表达相比,KDM5D、RPS4Y1、ZFY、DDX3Y、TTTY15、TTTY14、USP9Y、UTY、GYG2P1、NLGN4Y、TXLNGY、LINC00278、PRKY和/或TTTY10的表达增加可用作来自雄性样品的核的标志物。此外,ZFX、PUDP、KDM5C、LOC389906、PIN4、MTRNR2L8、MTRNR2L6、COL4A1、DHFR、LOC101929541、TSIX、MIR6723和/或XIST的表达降低可用作来自雌性样品的核的标志物。在一些实施方案中,进一步分析表达结果以鉴定细胞类型和性别特异性标志物。例如,长基因间非蛋白编码RNA 278(LINC00278)的增加的表达可用于区分来自雌性样品的神经胶质和来自雄性样品的神经胶质。此外,与未分选核的归一化表达相比,具有序列相似性的家族8成员A4,假基因(Fam8a4p)、芳基硫酸酯酶D假基因1(Arsdp1)和Gyg2p1的表达的增加可用作来自雄性样品的星状细胞的核的标志物。
为了确定年龄是否均一地影响细胞类型,可以在来自不同年龄的人的样品中鉴定差异表达的基因。在一些实施方案中,核中以下基因的表达差异可用于确定得到样品的受试者的年龄:ABCC10、ACAP3、ACHE、ATF6B、ATP6V0B、CACNA2D3、CUL7、DNAJB5、EGR1、FZR1、GBAP1、GPR107、GRK5、KCTD21-AS1、KLHL22、LINC00499、LINGO2、LOC100132077、LOC100506990、LOC101927592、MIR9-3HG、MPND、MTRF1、POLR2J3、PPP6R2、PRSS55、PTMS、RNF17、SNAI3-AS1、SPHK2、ST3GAL2、TAOK2、TRDN、WASH7P、ZFPM1、ZNF404、ZNF496、ZNF580、ZNF585A、ZNF607、ZNF84和ZSCAN29。
在一些实施方案中,对谱的进一步分析可以提供年龄特异性和细胞类型特异性标志物。例如,与不同年龄的样品的归一化表达相比,以下基因的差异表达可用作鉴定颗粒细胞的标志物:KCNQ3、SCHLAP1、UGGT2、PLXDC2、ITGB5、DCLK1、AQP7、PTPN3、FAT1、CMTM8、FARP1、PIP4K2A、NEDD4、CATSPERG、LOC101926、941、WWC2、MPP6、SDK1、NAB2、NTNG2、LMNTD2、PLCH2、PTPRJ、MRAP2、PTMS、CDH23、SYT7、SPRED3、PLXNA1、GRK5、ZYX、FGF3、LINC01544、PCYT1B、RHBG、HCN2、ACAP3、MGAT3、C1orf61、SURF2、AHRR、FAM131A、CHGB、PLXNA4、ACHE、DYRK1B、CDK5R2、GDPD5、ZNF703、FHDC1、LOC101927、078、CREB3L2、AP1S3、DYSF、MAMSTR、KIAA0895L、TP73、PDE3A、LINC00963、ELAVL3、TTYH3、HPN、PTPRE、SLC17A7、GRIN2C、PXN、TMEM130、LRPAP1、GRM4、STEAP3、CHRD、SBNO2、ZDHHC23、GACAT2、MAP6D1、FAM53A、KIAA1549L、SLC38A7、CDK16、CALY、LPCAT4、SLC25A6、SRCIN1、ELMO1、GRAMD4、RIMS3、CPLX2、PIP5K1C、SDC3、CBLN3、PDZD7、VWA5B2、ZNF219、FAM212B、RASIP1、GYS1、ATP6V0B、NKD1、ST3GAL2、PTK7、ACOT7、ATXN7L2、DAO、SYT12、ADAM19、HIP1、GABBR1、SYT3、TP53INP2、KCNK3、TPM4、RNF152、KCNK10、EPB41L1、ABCC10、NAV2、ERGIC1、BAD、KIF3B、RAI2、XKR7、PTK2B、CHST12、TRIM67、DHDDS、NUMBL、KCND3、LRRC1、RAB37、KCNIP2、RAB6B、PC、TCEAL2、MEG8、FMNL3、MAPK4、DGCR5、REEP1、GTPBP2、KIF26B、NRXN2、ZNRF1、C14orf132、FLNB、EFR3B、RBFOX3、PPP2R2C、KLHDC4、PILRA、CLSTN3、CABIN1、NHSL2、LYRM1、KCNA2、SLC38A10、DGKA、TMEM266、FAM135B、ATP2B2、TMEM163、UNC5B、TPM3、MICAL2、GNAO1、GABBR2、KCNK1、USP4、TEX2、PRKAG2、APBA2、SUSD6、HDHD2、NAA20、CRIPT、KNTC1、RPS6KA5、PHF10、PCGF5、DPY19L4、APH1B、ZNF546、ABCA17P、CDH26、CBWD6、ZNF736、CFAP70、UBE4A、TTC32、CFAP53、PXDNL、CPVL、GLIPR1、COL25A1、MTHFD2L、LSM5、LOC100505、715、NR3C2、TOM1L1、ANKRD42、SLC8A1、-AS1、ATAD2、GAB1、CCDC146、ELMOD1、CFAP74、C1orf146、P4HA2、RANBP3L、OTUD6B、-AS1、EYS、ALS2CR11、LECT1、BHLHE40-AS1、STAB2、PXYLP1、LOC101929、710、L1NC00499、RHOBTB3、CRYBG3、NPY6R、RGS20、C2orf73、YIPF7、BUB 1B、CFAP43、LOC102724、623、LRRC69、STK3、CLIC5、CACNA2D3、C2orf27A、LOC105378、385、BEST3、EPHA6、LOC100506、393、MEF2C、GTSCR1、ELOVL2、SPATA9、PLSCR4、GCK、LINC01032、MEF2C-AS1、BMS1P21、CASP12、CLMP、ERBIN、TMC3-AS1、CXXC4、DCBLD1、GSTO2、PLOD2、P4HA2-AS1、TTC23L、CPLX3、SOX13、PRDM1、RSPO2、TSG1、MIR31HG、CTB-12O2.1、PLCH1、JAML、SEMA3G、LOC101928、203、GLRA1、SYT16、SYN3、ARHGAP32、MIR646HG、ALCAM、SCGN、LINC01515和LOC101929415。
例如,与不同年龄的样品的归一化表达相比,以下基因的差异表达可用作鉴定篮细胞的标志物:ACER3、ACSS3、ADAMTS2、ADAMTS9、ADAMTSL3、ADD2、ADGRL3、AKAP13、ALOX5、ALS2CR11、ARHGEF10L、ARHGEF6、ASIC1、ASIC2、ATP6V0B、BMP3、BTBD11、C11orf87、C14orf1、C4orf22、C9orf135、CA7、CACNA1D、CACNA2D3、CACNB4、CADM3、CADPS、CALR、CDK15、CFAP46、CLSTN3、CNTN3、CPNE8、CYYR1、DBH、DCC、DDO、DGKH、DISP3、DLG1、DLG4、DMGDH、DNAH6、DNER、E2F3、ECHDC2、ELOVL2、ENPP1、EPHB1、ERC2、FAM135B、FAM46C、FBXL21、FGF5、FHOD3、FKBP5、FRMPD4、GABBR2、GALNT18、GAP43、GBAP1、GDF11、GPR161、GPR63、GREB1、HCN4、HECTD2-AS1、IQSEC3、KCNA4、KIF26B、KRT222、LACTB2-AS1、LHFPL3、LINC00457、LINC00499、LINC01158、LOC105377448、LOC285692、LOC653602、LPCAT4、MARC2、MARCH11、MASP1、MEGF10、MTHFSD、MYRIP、NHS、NOS1、NPL、NPY6R、NTNG1、NXNL2、PAQR6、PARM1、PCP4、PEBP4、PHACTR2-AS1、PHKA1、PLPPR4、PLXNA4、PRKCG、RGMB、RNF212、RNF215、RORA、RPH3A、RPS6KA5、SCN2B、SEPSECS、SEPSECS-AS1、SHANK1、SHANK2、SLC12A5、SLC17A4、SLC25A29、SLC26A8、SLC35F4、SLC8A3、SPARCL1、SPHK2、SPON2、ST6GAL2、ST6GALNAC5、STAT5A、STK33、SV2C、SYT17、TEX9、TFAP2B、THSD7B、TMEM178B、TRAF5、TRIM67、TTC23L、TUNAR、UBASH3B、UNC5D、ZNF124和ZYG11A。
例如,与不同年龄的样品的归一化表达相比,以下基因的差异表达可用作鉴定胶质细胞的标志物:ADAMTS7、ANKRD33B、AOx1、C1orf95、CACNG4、CACNG8、CAPN9、CRTAC1、DACH1、EFHD2、EGF、ETS1、FRAS1、IMPA2、LINC00499、LINC00844、LINC01208、LOC101927078、LOC102724360、PKDCC、PLXNA4、PRR5、RHCG、ROBO2、SEMA5B、SHROOM2、SLIT2、TRDN、TXNIP、VWA5A和WNT7B。
在一些实施方案中,核中的基因表达
D.选择标志物和靶标
在一些实施方案中,与分选的核相关的改变的表达的分析发生在不同物种之间的基因直系同源物之间。例如,比较1∶1直系同源物的表达以确保结果是由于表达改变而不是物种间基因注释的差异。
在一些实施方案中,可以进行进一步的谱分析以确保改变的表达不是由于物种之间的注释差异。例如,仅具有1∶1直系同源物的基因可用于确定表达水平。谱分析可以另外限于长度大于1kb和/或物种(例如小鼠、大鼠和人)之间的长度差异小于2倍的基因。在一些实施方案中,细胞类型特异性基因或物种特异性基因可选自小鼠、大鼠和人核中250个最易变基因,包括:1810041L15Rik、2810459M11Rik、3110035E14Rik、A2m、Adamts15、Adra1a、AI593442、Aldh1a1、Anln、Apcdd1、Apod、AqP4、Arhgef33、Ascl1、Asgr1、Aspa、Atp1a2、Atp2a3、B3gnt5、B3gnt7、Bcl11a、Bhlhe22、Clql1、C1ql2、Cacnalg、Cacng4、Calb1、Camk1g、Car8、Carns1、Casq2、Cbln2、Ccdc152、Ccdc180、Ccnd2、Cd82、Cd9、Cdh19、Cdhr1、Cldn11、Clec7a、Clmn、Cmtm5、Cntn3、Cntnap5a、Cobl、Col5a3、Col6a1、Cpm、Cryab、Cspg4、Csrp1、D7Ertd443e、Ddx3y、Dock5、Dpy1912、Ebf2、Echdc2、Efna5、Enpp2、Erbb3、Ermn、Etnppl、Fa2h、Fam46a、Fgfr2、Flrt2、Fmo3、Folh1、Foxh1、Fsip2、Fxyd1、Fxyd7、Gad2、Gal3st1、Galnt5、Galnt6、Galr1、Gdf10、Gfap、Gja1、Gjb1、Gjc2、Gldn、Gli1、Glp2r、Glul、Gm136、Gnb3、Gng11、Gpr37、Gpr37l1、Gpr63、Gpx2、Gramd3、Grb14、Gria3、Grik3、Grm1、Grm5、Gsn、Hapln2、Hepacam、Hhatl、Hspalb、Htrlb、Id4、Igsf1l、Il22、Il33、Insc、Itgb8、Itih3、Itpr1、Kcnc2、Kcnj10、Kif19a、Kit、Kit1、Klk6、Leng9、Lfng、Lgi4、Lims2、Mag、Mak、Mal、Marchl1、Marcksl1、Mcam、Mff、Mfge8、Mlc1、Mog、mt-Co1、mt-Nd4、Mybpc1、Myot、Myrf、Ndrg1、Nell1、Neto1、Neu4、Ninj2、Nkx2-2、Notch1、Nrk、Olig1、Olig2、Opalin、Pax3、Pcp2、Pdc、Pdgfra、Pdzd3、Penk、Pex5l、Pgghg、Phyhip、Pkp3、Pla2g16、Plch1、Plekhd1、Plekhg3、Pllp、Plp1、Plpp3、PlPP4、Plscr1、Plxnb3、Pmp2、Pmp22、Ppfibp1、Ppplrl4a、Ppplrl7、Prex1、Prex2、Prima1、Prkcg、Prr5、Prrg3、Prrx1、Ptchd4、Ptprk、Ptprz1、Pttg1、Pvalb、Pxdc1、Qk、Rapgef3、Rassf2、Rbp2、Rbpj1、Rgcc、Rgma、Ryr1、S100b、Slpr1、Sall1、Sec14l5、Serpine2、Shisa6、Skor2、Slc1a3、Slc1a6、Slc26a3、Slc32a1、Slc4a4、Slc5a11、Slc9a3、Slitrk6、Socs2、Sorcs3、Sox10、Sox2、Sox6、Sox8、Stag3、Stk32a、Sulf2、Susd5、Tcea17、Tfap2b、Thbs2、Tmem125、Tmem132d、Tmem63a、Tmem98、Tnc、Tnfrsf13c、Tns3、Trabd2b、Tri1、Trpc3、Trpc7、Tshb、Tspan11、Tspan2、Tuba8、Tubb2b、Txnip、Ube2b、Ugt8a、Upp1、Vstm2b、Wfdc1、Xrra1、Zcchc24、Zeb2和Zfp3611。
V.调整鉴定的靶标
在一些实施方案中,选自表2-4之一的至少一种基因与至少一种疾病、病症或疾患相关。与疾病、病症或疾患相关的基因或其表达也可称为疾病靶标。在一些实施方案中,治疗疾病、病症、疾患的方法包括使用治疗方式来调节疾病靶标的表达。在一些实施方案中,治疗方式靶向选自表2-4的至少一种转录物。在一些实施方案中,治疗方式靶向选自表2-4的至少一种蛋白质。在一些实施方案中,治疗方式是药物组合物(例如小分子药物或RNA干扰(RNAi)分子(例如siRNA))、基因疗法或细胞疗法。
VI.定义
以下是术语定义的非限制性列表。
如本文所用,术语“约”当应用于一个或多个感兴趣的值时,是指与所述参考值类似的值。在某些实施方案中,术语“大约”或“约”是指落入所述参考值的任一方向(大于或小于)的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%或更小之内的值的范围,除非另有说明或从上下文中明显看出(除非此类数字超过可能的值的100%)。
如本文所用,术语“抗体”是指免疫球蛋白分子,其能够通过位于免疫球蛋白分子的可变区中的至少一个抗原识别位点与靶标(例如多核苷酸、多肽、蛋白质等)特异性结合。术语“抗体”不仅包括完整的(例如,全长)多克隆或单克隆抗体,还包括其抗原结合片段(例如Fab、Fab′、F(ab′)2、Fv)、单链(scFv)、其突变体、包含抗体部分的融合蛋白、人源化抗体、嵌合抗体、双抗体、线性抗体、单链抗体、多特异性抗体(例如,双特异性抗体)和包含所需特异性的抗原识别位点的免疫球蛋白分子的任何其他修饰构型,包括抗体的糖基化变体、抗体的氨基酸序列变体和共价修饰的抗体。抗体包括任何类别的抗体,例如IgD、IgE、IgG、IgA或IgM(或其亚类),并且抗体不需要是任何特定类别。
如本文所用,术语“细胞特异性谱分析(cell specific profiling)”是指使用核转录组准确定义细胞身份。
如本文所用,术语“染色体相关转录物(CAT)”是指在合成时保持在染色体上的转录物。
如本文所用,术语“疾病组织”或“疾病样品”是指取自经历疾病状态的受试者的样品。
如本文所用,术语“DNA探针”或“RNA探针”是指DNA或RNA的片段(通常100-1000个碱基长),其与和探针序列互补的核苷酸序列杂交。探针可以放射性、荧光的或化学(例如生物素)标记用于可视化。
如本文所用,术语“药物靶标”或“治疗靶标”是指可被药物或治疗剂作用以调节细胞类型中的基因表达的核苷酸序列。
如本文所用,术语“因子”是指通过DNA或RNA探针杂交或被抗体特异性结合的核苷酸序列,以允许精确分选特定细胞类型的核。
如本文所用,术语“基因表达”或“表达”是指以下事件中的一个或多个的水平:(1)从DNA序列产生RNA模板(例如,通过转录);(2)RNA转录物的加工(例如,通过剪接、编辑、5′帽形成和/或3′末端加工);(3)RNA翻译成多肽或蛋白质;(4)多肽或蛋白质的折叠;以及(5)多肤或蛋白质的翻译后修饰。
如本文所用,术语“细胞谱分析技术(cellular profiling technique)”是指用于对死后组织中细胞类型的群体进行分子谱分析的非遗传方法。
如本文所用,术语“聚A转录物”是指腺嘌呤核苷酸链,其在RNA加工期间添加至信使RNA(mRNA)分子以增加分子的稳定性。
如本文所用,术语“标记”是指与连接、引入或缔合至另一实体的一种或多种标志物、信号或部分,所述标志物、信号或部分容易通过本领域已知的方法检测,包括射线照相、荧光、化学发光、酶活性、吸光度等。可检测的亲和标记包括放射性同位素、荧光团、发色团、酶、染料、金属离子、配体如生物素、抗生物素蛋白、链霉亲和素和半抗原、量子点等。可检测的亲和标记物可以位于其所连接、并入或缔合的实体的任何位置。例如,当连接、并入或缔合至肽或蛋白质时,它们可以在氨基酸、肽或蛋白质内部,或位于N-末端或C-末端。
如本文所用,术语“最特异性基因”是指与其他分析基因的SI值相比具有较低特异性指数(SI)值的基因,其使用实施例1中所述的算法计算。
如本文所用,术语“组织样品”是指取自来源的等分试样或部分并提供用于分析或加工。在一些实施方案中,样品来自生物来源,例如组织、细胞或组成部分(例如体液,包括但不限于血液、粘液、淋巴液、滑液、脑脊髓液、唾液、羊水、羊膜脐带血、尿液、***液和***)。在一些实施方案中,样品可以是或包含从整个生物体或其组织、细胞或组成部分的子集制备的匀浆、裂解物或提取物,或者其级分或部分,包括但不限于,例如,血浆、血清、脊髓液、淋巴液、皮肤外部、呼吸道、肠道和泌尿生殖道、泪液、唾液、乳汁、血细胞、肿瘤、器官。在一些实施方案中,样品是或包含培养基,例如营养肉汤或凝胶,其可含有细胞组分,例如蛋白质或核酸分子。在一些实施方案中,对样品进行一个或多个处理(例如,分离、纯化等)步骤以制备用于分析或其他用途的样品。
如本文所用,术语“转基因动物”是指具有***其基因组的外源基因的动物。
如本文所用,术语“翻译核糖体亲和纯化(TRAP)”是指限定来自转基因动物的单一组织中不同细胞类型的分子特征的方法。
本文描述了用于在死后组织中对细胞类型群体进行分子谱分析的方法。在下面的说明书中阐述了本发明的一个或多个实施方案的细节。尽管与本文描述的那些类似或等同的任何材料和方法可用于本发明的实践或测试,但现在描述优选的材料和方法。根据该描述,本发明的其他特征、目的和优点将显而易见。在说明书中,除非上下文另有明确规定,否则未用数量词限定的名词包括一个/种和/或多个/种。除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。在冲突的情况下,以本说明书为准。
通过以下非限制性实施例进一步说明本发明。
实施例
实施例1.实验程序
使用以下实验程序进行本文实施例2-23中描述的实验。
A.缓冲液制备
如Kriaucionis等,Science,324(5929):929-930(2009)中所述制备缓冲液。如果包含在参与用于分离RNA的方案中的缓冲液中,则使用不含RNA酶的水,否则使用MilliQ水。
本文实施例中使用的缓冲液A是60%碘克沙醇(Optiprep,Sigma-Aldrich,St.Louis,MO;目录号D1556-250ML)。缓冲液A保持用箔覆盖直至使用。如本文实施例中使用的缓冲液B含有900mM KCl、30mM MgCl2、120mM Tricine-KOH(pH 7.8)。缓冲液A和B在室温(RT)下储存。
本文实施例中使用的缓冲液C含有50%碘克沙醇(5体积缓冲液A和1体积缓冲液B、)、0.5mM亚精胺、0.15mM精胺、不含EDTA的蛋白酶抑制剂混合物(Roche Holding AG,Basel,Switzerland;由Sigma-Aldrich,St.Louis,MO分配;目录号11836170001)、1mM DTT和200单位/mL Superasin(Thermo Fisher Scientific,Waltham,MA;目录号AM2696)。本文实施例中使用的缓冲液D含有0.25M蔗糖、150mM KCl、5mM MgCl2、20mM Tricine-KOH(pH7.8)、0.5mM亚精胺、0.15mM精胺、不含EDTA的蛋白酶抑制剂混合物、50μL 1mM DTT、200单位/mL Superasin和400单位/mL RNasin(Promega,Madison,WI;目录号N2515)。
本文实施例中使用的缓冲液E含有27%碘克沙醇(1.174体积缓冲液C与1体积缓冲液D)。用于本文实施例中的分析的洗涤/封闭缓冲液含有含0.05%TritonX-100的PBS中的3%BSA;BSA获自Jackson ImmunoResearch Laboratories,Inc.,目录号001-000-162。用于本文实施例的RNA洗涤缓冲液含有50ng/mL无RNA酶的BSA(于含有0.05%TritonX-100的PBS中)、1mM DTT和100单位/mL的Superasin。用于本文实施例中的RNA封闭缓冲液含有补充有额外50ng/mL BSA的RNA的洗涤缓冲液。本文实施例中使用的垫缓冲液(Cushion buffer)含有500μL缓冲液D、250μL50%甘油和5μL 10%NP-40。
B.核分离
核分离改编自先前出版物中描述的方案(Kriaucionis,等(2009)Science 324,929-930和Mellén,等(2012)Cell 151,1417-1430,其各自通过引用整体并入本文)。对于小鼠实验,如前所述解剖皮质和小脑。将来自C57BL/6J动物的所有组织使用液氮快速冷冻。将来自开发用于bacTRAP方法的小鼠的组织新鲜解剖并直接用于均质化。冷冻获得大鼠和人组织。在使用前将所有冷冻组织在冰上解冻至少30分钟。为了分离核,将新鲜或解冻的组织转移到5mL匀浆培养基(0.25M蔗糖、150mM KCl、5mM MgCl2、20mM Tricine pH 7.8、0.15mM精胺、0.5mM亚精胺、不含EDTA的蛋白酶抑制剂混合物、1mM DTT、20U/mL Superase-In RNA酶抑制剂、40U/mL RNasin核糖核酸酶抑制剂)。通过30次松冲程(A)然后30次紧冲程(B)玻璃杜恩斯使组织匀浆化。向匀浆物补充4.6mL 50%碘克沙醇溶液(50%碘克沙醇/Optiprep、150mM KCl、5mM MgCl2、20mM Tricine pH 7.8、0.15mM精胺、0.5mM亚精胺、不含EDTA的蛋白酶抑制剂混合物、1mM DTT、20U/mL Superase-In RNA酶抑制剂、40U/mL RNasin核糖核酸酶抑制剂),并置于27%碘克沙醇垫上。通过在Beckman Coulter XL-70超速离心机中在震荡桶转子(SW41)中在4℃下以10,000rpm离心30分钟来使核沉淀。对于小鼠、大鼠和人细胞质级分,将175uL顶层加入到175uLBuffer RLT中并储存在-80℃。将核沉淀重悬于匀浆缓冲液中。
C.抗体
在封闭缓冲液中稀释一抗和二抗。二抗购自Life Technologies或JacksonImmunoresearch,并以1∶500稀释使用。一抗和稀释系数如表5所示。在表中,NeuN代表神经元核抗原,Itpr代表肌醇1,4,5-三磷酸受体1型,Sorcs3代表含Sortilin相关VPS10结构域的受体3,EEAT1代表刺激性氨基酸转运蛋白1,并且Olig2代表少突胶质细胞转录因子2。
表5.抗体
抗原
物种
供应商
目录号
稀释
NeuN
兔
Abcam
ab177487
1∶250
NeuN
小鼠
Millipore
MAB377
1∶250
Itpr1
小鼠
Abcam
ab190239
1∶500
Sorcs3
山羊
Thermo
PA5-48023
1∶250
EEAT1
兔
Abcam
ab416
1∶250
Olig2
山羊
R&D
AF2418
1∶250
用于分离所有细胞类型的抗体的细胞类型特异性示于表6。除非另有说明,否则NeuN指兔抗体。
表6.抗体特异性
D.核固定和染色
分离后,将核通过将甲醛(不含甲醇的甲醛;Electron Microscopy Sciences,Hatfield,PA;目录号15710)添加至1%终浓度来固定并在室温下轻轻旋转孵育8分钟。通过添加甘氨酸至终浓度为125mM来猝灭甲醛。将样品在室温轻轻旋转孵育5分钟。将样品在4℃下以1000g旋转4分钟以沉淀核。倒出上清液,并将沉淀重新悬浮于缓冲液D中。将样品再次在4℃下以1000g旋转4分钟。倒出上清液,并将沉淀重悬于洗涤缓冲液(PBS、0.05%TritonX-100、50ng/mL BSA、1mM DTT、10U/uL Superase-In RNA酶抑制剂)中。然后将核转移到新管中,然后在4℃下以1000g旋转4分钟。倒出上清液,并将核重新悬浮于封闭缓中液中,并使其在室温(RT)下轻轻旋转30分钟来进行封闭。将抗体加入封闭缓冲液中的核中,并在室温下轻轻旋转孵育1小时。或者,该孵育步骤在4℃下过夜(O/N)进行。
在该阶段取出核的小等分试样,以用作流式细胞术的未染色对照。将核在4℃下以1000g沉淀3分钟,并用洗涤缓冲液(PBS、0.05%TritonX-100、50ng/mL BSA、1mM DTT、10U/uL Superase-In RNA酶抑制剂)洗涤。将这再重复两次。最后一次洗涤后,加入在封闭缓冲液中1∶500稀释的适当的二抗。将核用箔覆盖并在室温下轻轻旋转孵育30分钟。孵育后,将核在4℃以1000g沉淀3分钟并用洗涤缓冲液洗涤。将这再重复两次。然后将沉淀重悬于适量的封闭缓冲液中用于分析或分选。如果不计划立即分析,则将核储存在冰上。
E.流式细胞术分析/分选
将DyeCycleTM Ruby(dcRuby)(Thermo Fisher Scientific,Waltham,MA;目录号V10273)添加至样品:每小鼠小脑1-2μL并且200mg人组织为5-7μL,其基于样品中核的数量、缓冲液的体积、以及核是来自小鼠还是人类。根据流式细胞仪上的电压,允许dcRuby浓度的变化。
在流式细胞术之前,将核用终浓度为20μM的DyeCycleTM Ruby共染色。使用BDLSRII(BD Biosciences,San Jose,CA,USA)流式细胞仅使用488nm、561nm和640nm激光对核进行分析。使用BD FACS Aria细胞分选仪使用488nm、561nm和635/640nm激光对核进行分选。所有样品首先使用DyeCycleTM Ruby进行门控以确定单峰。使用FACS Diva(BD)或FlowJo软件进行分析。将Buffer RLT(未固定样品)或Buffer PKD(固定样品)加入至分选的核,并将样品储存在-80℃。
分选后,将核储存用于RNA分离。为了储存,将蛋白酶K消化缓冲液(FFPE RNA试剂盒,目录号80234)加入到分选的核中,并将所得混合物储存在-80℃。
将前向散射光(FSC)的测量对侧向散射光(SSC)的测量作图,并对一般散射进行门控。对dcRuby强度进行线性作图,并将电压针对单峰进行调整。对单峰进行门控。基于所使用的颜色对样品作图,并基于预期的染色模式对群体进行门控。将门控群体的百分比与感兴趣的细胞类型的预期百分比进行比较。
F.RNA和DNA的分离和纯化
使用FFPE试剂盒从同一样品中分离DNA和RNA。除了以下修改之外,根据试剂盒方案进行分离:在80℃加热步骤之前,将RNA在65℃下孵育30分钟,然后在70℃下再孵育30分钟。
使用具有柱上DNA酶消化的Micro试剂盒纯化来自细胞质级分或新鲜核的RNA。使用具有以下修改的FFPE试剂盒方案纯化来自固定核的RNA-在蛋白酶K消化后,RNA以最大速度旋转15分钟。除去上清液,并在65℃下孵育30分钟,在70℃下孵育30分钟,并且在80℃下孵育15分钟。进行柱上DNA酶消化以代替溶液内DNA酶消化。使用RNA HS Assay试剂盒测定RNA量,并使用具有RNA6000 Pico芯片的Agilent 2100 Bioanalyzer测定RNA质量。
使用(Thermo Fisher Scientific,Waltham,MA;目录号Q32854和Q32855)定量纯化的DNA和RNA。还在Bioanalyzer芯片(AgilentTechnologies,Santa Clara,CA;目录号5067-1513)上运行纯化的RNA样品用于定量和定型。将DNA储存在-20℃并用于测序或表观遗传谱分析。将RNA储存在-80℃下并用于cDNA合成。
G.使用NugenRNAseq V2试剂盒的cDNA产生和文库产生
根据试剂盒方案,使用NugenRNAseq V2试剂盒从纯化的核RNA产生cDNA。根据NugenRNAseq V2试剂盒方案,使用Reaction Cleanup Kit(目录号28206)纯化最终的cDNA。用使用D1000 ScreenTape的TapeStation(Agilent Technologies;Santa Clara,CA;目录号5067-5582,ScreenTape目录号5067-5583)评估cDNA质量。制备cDNA的1∶40稀释液用于qPCR,并检查预期标志物的富集或耗竭。使用NanoDropTM定量cDNA。
使用Illumina TruSeq DNA LT Library Preparation Kit或Illumina的NEBNextUltra DNA Library Prep Kit和Illumina的NEBNext Multiplex Oligos制备文库。使用具有D1000 High Sensitivity ScreenTapes的Agilent 2200 TapeStation system评估文库的质量。文库在洛克菲勒大学基因组学资源中心(The Rockefeller University GenomicsResource Center)在Illumina HiSeq 2500机器上测序以获得50bp单端读段或在IlluminaNextSeq 500上测序以获得75bp配对末端读段。所有数据集都已存入GEO:登录号待定。
H.氧化亚硫酸氢盐(oxBS)转化反应
如来自Cambridge Epigenetix Limited的Whole Genome Kit的用户指南中所述,从分选的核中分离基因组DNA(gDNA)。
I.免疫荧光
将小鼠深度麻醉并用磷酸盐缓冲盐水(PBS)心脏灌注,然后用PBS中的4%甲醛(w/v)灌注。将脑解剖并在4℃下后固定过夜,在PBS中的30%蔗糖中冷冻保护,OCT TissueTeck包埋,并用Leica CM3050S低温恒温器切割成20μm切片,将切片直接固定在载玻片上。将载玻片储存在-20℃。通过将载玻片浸入95-100℃的柠檬酸钠缓冲液(10mM柠檬酸钠,0.05%Tween 20,pH 6.0)中并在微波中慢煮10分钟来进行抗原回收。将载玻片冷却至室温,然后用PBS洗涤。通过以下进行免疫荧光:在IF封闭缓冲液(于含0.1%TritonX-100的PBS中的3%BSA)中封闭30分钟,与一抗孵育过夜,用PBS洗涤3次,与二抗孵育1小时,用PBS洗涤,用DAPI溶液(PBS中1ug/mL)染色15分钟,用PBS洗涤两次,并用ProlongDiamond封固剂加盖玻片覆盖。对于一些样品,如下进行酪酰胺信号放大:将载玻片与同辣根过氧化物酶缀合的二抗孵育1小时,用PBS洗涤3次,与来自TSA Cyanine 3检测试剂盒的扩增缓冲液中的Cy3孵育10分钟,用PBS洗涤,并且如上所述进行DAPI染色。所有步骤均在室温下进行。对于小鼠和人载玻片,使用相同的采集设置在Zeiss LSM700共聚焦显微镜上对载玻片成像。用适用于小鼠和人图像的相同调整,在采集后的ImageJ中进行亮度和对比度调整。除了上面列出的用于核染色的抗体之外,表7中的以下一抗用于免疫染色。
在表7中,GFAP代表胶质纤维酸性蛋白,Mog代表髓鞘少突胶质细胞糖蛋白,Mag代表髓磷脂相关糖蛋白,Pde1a代表磷酸二酯酶1A,并且Pde1c代表磷酸二酯酶1C。
表7.一抗
可使用多种方法产生、测试和/或表征本文所述的抗体。此类方法可用于确定多种特征,这些特征可包括但不限于抗体亲和力;特异性;和活性(例如激活或抑制细胞信号传导途径,或其他细胞或生物活性)。
一旦通过动物、细胞系、化学合成或重组表达产生了本公开的抗体分子,就可以通过本领域已知的任何纯化免疫球蛋白或多肽分子的方法进行纯化(即分离),例如,通过色谱法(例如,离子交换,亲和力,特别是通过对特异性抗原的亲和力,蛋白A和尺寸柱色谱法)、离心、差异溶解度、或通过用于纯化蛋白质的任何其他标准技术。另外,本公开的抗体或其片段可以与本文所述的或本领域另外巴知的异源多肽序列融合,以促进纯化。
可以使用本领域已知的一种或多种结合测定法以KD测量抗体与靶标或配体(例如用于产生给定抗体的抗原)之间的亲和力。根据给定抗体的期望靶标,可能期望变化的KD值。高亲和力抗体通常形成配体键,其KD为约10-5M或更小,例如约10-6M或更小、约10-7M或更小、约10-8M或更小、约10-9M或更小、约10-10M或更小、约10-11M或更小或约10-12M或更小。
J.DNA和RNA探针
或者或与抗体结合使用,可以根据Dayid等Biotechniques 30,769-772,2001使用聚合酶链式反应(PCR)设计和产生RNA和DNA探针,以产生基因组中感兴趣区域的反义片段。
K.实时PCR和引物列表
从来自小鼠和人小脑的细胞质级分中纯化独立的RNA样品,并将纯化的RNA如上所述使用NugenRNAseq System V2转化为cDNA并扩增。在480II system(Roche)上使用探针和480 Probe预混合物进行定量实时PCR。对于小鼠和人二者使用两个生物学重复,并且对每个生物学重复进行三次技术重复。在480软件中使用二阶导数最大值方法计算Cq值。使用ΔCq方法进行归一化,其利用三个管家基因的几何平均值:肌动蛋白β(Actb)、甘油醛-3-磷酸脱氢酶(GAPDH)和RNA聚合酶II亚基A(Polr2a)。对技术重复进行平均(算术平均),然后使用假设方差相等的双尾t检验进行统计分析。引物列于表8中。在表8中,并且如本文所用,所提及的基因是Actb、GAPDH、Polr2a、含血管性血友病因子C结构域的2(Vwc2)、含卷曲螺旋结构域的175(Ccdc175)、Clavesin 2(Clvs2)、Pde 1a、Pde 1c、内皮素转化酶1(Ecel)、CNKSR家族成员3(Cnksr3)。表中还给出了来自Integrated DNA Technologies(IDT)和Thermo Fisher(Thermo)的小鼠和人ID。
表8.引物
L.用于分析的软件
除了自定义perl脚本之外,数据处理步骤还使用Linux工具。除了标准的Linux命令(例如awk、cut、sort、uniq)之外,还使用了以下包:用于ATACseq样品的衔接子修剪的Trim Galore!(v0.4.1),用于读段对齐的STAR(v2.4.2a)和Bowtie2(v2.1.0),用于索引和去除重复项的SAMtools(v0.1.19-44428cd),用于生成用于浏览器可视化的文件的igvtools(v2.3.32),以及用于读段总结的featureCounts(v1.5.2)。使用R Studio(v1.0.143,R:v3.4.0)进行数据分析。除了基础R(用于数据争用、Pearson相关性,分层聚类等)和自定义R函数之外,还广泛使用了以下包:用于数据争用和可视化的tidyverse(v1.1.1,其包含ggplot2、reshape2等),用于原始计数归一化、差异表达分析和主组分分析的DESeq2(v1.16.1),用于热图的gplots(v3.0.1)和pheatmap(v1.0.8),用于色板的RColorBrewer(v1.1-2),以及用于GO分析的clusterProfiler(v3.4.3)。
M.ATACseq文库构建和测序
如上所述分离来自小鼠、大鼠和人小脑的核,并将50,000个在冰冷的PBS中洗涤。如先前在Buenrostro等(2013).Nat Methods 10,1213-1218和Buenrostro等(2015).CurrProtoc Mol Biol 109,21.29.1-.29.99(其两者通过引用整体并入本文)中所述制备ATACseq文库,其具有来自Chen等(2016)Nature Methods.13(12):1013-1024(其通过引用整体并入本文)的以下修改:将核重新悬浮在冰冷的裂解缓冲液中,省略在冰上的孵育步骤并离心。使用Nextera DNA Library Preparation Kit产生文库。使用来自Nextera的Tn5转座酶在37℃下进行转座反应30分钟。加入200μL反向交联溶液(50mM Tris-Cl、1mMEDTA、1%SDS、0.2MNaCl、5ng/ml蛋白酶K),并将混合物在热块中1000rpm震荡下在65℃孵育过夜,然后用 试剂盒纯化。纯化DNA片段并使用AMPure XP珠选择大小以产生100-700bp片段。将来自小鼠和人小脑的ATACseq文库在Illumina HiSeq2500上测序以获得50bp配对末端读段,并且将从大鼠小脑产生的文库在Illumina NextSeq500上测序以获得75bp配对末端读段。对所有文库进行测序以产生每个样品至少55M的读段。
N.ATACseq读段作图和可视化
使用Trim Galore!(trim_galore--stringency 3--fastqc--paired*_R1_2.fastq.gz*_R2_2.fastq.gz)修剪衔接子序列并根据质量过滤读段。使用Bowtie2(Langmead,等(2012).Nat Methods 9,357-359,其通过引用整体并入本文)将通过过滤器的读段与hg38、mm10或定制大鼠基因组对齐。使用SAMtools(Li,等(2009)Bioinformatics25,2078-2079,其通过引用整体并入本文)除去重复读段。对于数据可视化,使用igvtools生成tdf文件。
O.RNAseq读段作图、可视化和读段总结
使用STAR(Dobin,等(2013).Bioinformatics 29,15-21,其通过引用整体并入本文)和来自ENSEMBL的基因组组装来对齐RNAseq读段。除了默认的STAR参数,以下参数用于单端(--outFilterMismatchNmax 999--outFilterScoreMinOverLread 0--outFilterMatchNminOverLread 0--outFiltetMatchNmin 35--outFilterMismatchNoverLmax 0.05)和配对端数据(--outFilterMismatchNmax 999--alignMatesGapMax 1000000--outFilterScoreMinOverLread 0--outFilterMatchNminOverLread 0--outFilterMatchNmin 60--outFilterMismatchNoverLmax 0.05)。使用igvtools将对齐的bam文件转换为tdf格式以进行可视化。使用featureCounts(Liao,等(2014)Bioinformatics 30,923-930,其通过引用整体并入本文)生成原始计数。使用UCSC Table Browser工具下载整个基因的Refseq或ENSEMBL基因模型注释。使用Refseq(Zhao,等(2015).BMC Genomics 16,97,其通过引用整体并入本文)注释。选择ENSEMBL用于物种内比较注释。对于跨物种的比较谱分析,将ENSEMBL注释用于所有物种,以匹配从ENSEMBL获得的直系同源转录物的列表。除了featureCounts中的默认值之外,还使用了以下参数:对于配对末端数据,对片段计数而不是读段(-p),嵌合片段不计数(-C)。对于跨物种的比较分析,允许将读段分配给多于一个匹配的元特征(-O),以避免当基因在一个物种中重叠但在另一个物种中不重叠时的问题。对于物种内比较,作图到多个匹配的元特征的读段不计数(默认)。注释如表9所示。
表9.基因组/基因注释
目的
程序
物种
注释
来源
基因组
基因组比对
STAR/Bowtie2
小鼠
ENSEMBL
ENSEMBL
mm10
基因组比对
STAR/Bowtie2
大鼠
ENSEMBL
ENSEMBL
rn6
读段定量
STAR/Bowtie2
人
ENSEMBL
ENSEMBL
hg38
读段定量
teatureCounts
小鼠
Refseq
UCSC
mm10
读段定量
featureCounts
大鼠
ENSEMBL
UCSC
rn6
读段定量
featureCounts
人
Refseq
UCSC
hg38
直系同源读段定量
featureCounts
小鼠
ENSEMBL
ENSEMBL
mm10
直系同源读段定量
featureCounts
大鼠
ENSEMBL
ENSEMBL
rn6
直系同源读段定量
featureCounts
人
ENSEMBL
ENSEMBL
hg38
P.直系同源物注释的产生
用于产生小鼠、鼠和人直系同源物以及小鼠-人高置信度直系同源物的注释的方法可以总结如下:1)从ENSEMBL BioMart(版本88)下载跨物种的直系同源物注释,2)过滤以仅包括:高置信度对(ENSEMBL直系同源物置信度=0),1∶1直系同源物(注释为与另一物种中的多于一种转录物直系同源的转录物),总长度大干1kb的基因(包括非翻译区),以及在物种间长度变化小于2倍的基因。对于每个基因,最长的直系同源转录物用于注释。
因为大鼠基因组未被完全注释,所以与小鼠、人和大鼠之间的直系同源基因相比,在小鼠和人之间几乎多3,000个基因被鉴定为直系同源的。
Q.基因计数归一化、差异表达分析和主组分分析
将原始基因计数表加载到R中,并使用DESeq2(Love,等(2014).Genome Biology15,550,其通过引用整体并入本文)进行差异表达分析。对于年龄和自溶时间,使用数值协变量进行建模。统计学上显著的基因被定义为具有小于0.01的调整的p值。除非另有说明,否则不使用倍数变化截止值。使用rlog函数产生用于下游分析(例如,热图、聚类)的归一化计数。plotPCA函数用于进行主组分分析。没有使用方法来消除批次效应,基于预期生物学的聚类在整个过程中观察到,而不是通过批次。例如,通过使用本文所述的细胞谱分析技术,在Egfp+和分选的核之间观察到按细胞类型进行聚类,尽管存在许多差异:制备日期、组织状态(新鲜vs.快速冷冻并解冻)、核状态(未固定vs.固定)、核处理(未处理vs.抗体染色)、文库制备试剂盒(Illumina vs.NEB)、测序仪(HiSeq 2500 vs NextSeq 500)和读段类型(50bp单端vs.75bp配对末端)。
R.分层聚类
使用来自DESeq2的rlog函数产生的归一化基因计数进行分层聚类(Love,等(2014)Genome Biology 15,550,其通过引用整体并入本文)。除非另有说明,否则通过rowVars函数计算的样品中的前250个最可变基因用于聚类。默认参数(欧几里德距离和完全链接)与dist和hclust函数一起使用以产生聚类。
S.特异性指数算法
先前开发了特异性指数(SI)算法以发现与其他数据集相比在感兴趣的数据集中特异的基因(Dougherty,等(2010)Nucleic Acids Res 38,4218-4230,其通过引用整体并入本文)。因为Dougherty中的算法经设计用于微阵列数据,所以将其改编以接受RNAseq数据作为输入。添加了一项特征,其中包含来自生物重复的信息以进行计算。从原始计数计算Fpkm以避免对长基因的偏差,并且排除小于1kb的基因以避免与极短基因的偏差。接下来,记录fpkm值,并且log10(fpkm)值在-2处达到最低点以避免与长的非表达基因的偏差。为了考虑样品重复,计算细胞类型内所有基因的平均值和标准偏差。
如前所述计算SI值,但不是使用平均基因表达值作为输入,而是从具有基因表达的平均值和标准偏差的正态分布中随机选择样品。该过程执行1000次,并且在所有迭代中对最终等级进行平均。为了分析小鼠小脑中高特异性基因的分布,检查来自Allen MouseBrain Atlas的每个基因的图像(Lein,等(2007)Nature 445,168-176,其通过引用整体并入本文)。在分析时不在Atlas中的基因,或在脑的任何区域中未显示染色的基因被排除在分析之外。计算显示所分析的细胞类型的适当分布的基因百分比并在本文中给出。
T.GO分析
将显著差异表达的基因分成上调和下调(或小鼠和人富集的)基因,并使用clusterProifler(Yu,等(2012)Journal of Integrative Biology 16,284-287,其通过引用整体并入本文)进行颗粒细胞、篮细胞和神经胶质的基因本体论富集分析。重要本体定义为q值小于0.01(默认值)。针对三个领域(生物过程(BP)、分子功能(MF)、细胞组分)收集包括显著本体的GO分析结果。为了简化可视化,仅使用生物过程本体。此外,当发现许多本体时,简化功能用于移除用于可视化的冗余术语。使用enrichMap函数生成基于网络的富集图。为了简化富集图的可视化,将相关本体的组汇总到一个标签中。
实施例2.使用核转录组定义细胞身份
可以使用对组成型内质网(ER)蛋白质或在ER中合成的膜蛋白质特异的抗体对核进行分选。如实施例1中所述,首先从GFP+核中分离核RNA。为了富集野生型小鼠中在核膜附近翻译的ER转录物,进行了核转录物的聚A下拉。大多数这些转录物未被观察到是核的,但是完全成熟的核酸转录物在核周围的ER中翻译。并非膜蛋白的所有转录物都存在于这种核聚A+级分中,但是对于核附近合成的那些的知识导致可以作为核标记的靶标的因子数量的显著增加。在进行免疫荧光后,在核周围的ER中观察到染色,这证实可以使用针对膜蛋白的抗体标记核。
用于分离来自小脑的3种细胞类型的初始策略包括抗体结合,其使用Itpr1(肌醇1,4,5-三磷酸受体1型;内质网(ER)的细胞内受体)作为靶标以标记浦肯野细胞,使用NeuN(由RNA-结合FOX蛋白家族成员编码的基因;NeuN是通常用作神经元的生物标志物的神经元抗原)作为靶标以标记颗粒细胞,以及使用GFAP(胶质纤维酸性蛋白;用于区分星形胶质细胞和胶质细胞的成熟星形胶质细胞的主要中间丝蛋白)作为靶标以标记神经胶质,以确认样品中这些类型细胞的存在。然后,使用Itpr1和NeuN的结果组合来分离所有3个群体。
从先前已使用TRAP方法进行谱分析的转基因小鼠的组织中分离来源于感兴趣的细胞类型的核,以确定核转录组是否可用于精确定义细胞身份。开发用于TRAP方法的转基因动物的谱分析结果基于GFP-标记的核糖体亚基在核仁中组装的事实。使用免疫荧光,观察到GFP主要分布在来自转基因动物的小脑组织组织切片的细胞质中(其中浦肯野细胞蛋白2(pcp2)-GFP仅在浦肯野细胞中表达),但也在核中的一个点(核仁)中观察到。此外,染色结果显示来自pcp2-GFP动物的小脑的分离的核用DAPI标记,并且观察到7个核中的一个是浦肯野核(GFP+)。
实施例3.使用流式细胞术对来自开发用于TRAP方法的转基因动物的细胞进行谱 分析
来自开发用于TRAP方法的转基因动物的五种细胞系中的每一种的EGFP+核的流式细胞术结果显示在表10中。
表10.FACS纯化结果
对从先前使用TRAP方法进行谱分析的5种不同转基因小鼠系分离的核进行另外的流式细胞术。根据TRAP方法产生的先前谱,靶向浦肯野细胞蛋白2(Pcp2)以鉴定来源于浦肯野细胞的核,并且观察到约0.4%的核是Pcp2阳性的。靶向Neurod1(神经元分化1)以鉴定来源于颗粒细胞的核,并且观察到约91%的核是Neurod1阳性的。靶向Sept4(隔膜蛋白4)以鉴定来源于伯格曼胶质细胞的核,并且观察到约2%的核是Sept4阳性的。靶向Glt25d2或Colgalt2(胶原蛋白β(1-O)半乳糖基转移酶2)以鉴定来源于第5层皮质-脑桥锥体神经元的核,并且观察到约0.5%的核为Glt25d2阳性。靶向神经降压素受体1(Ntsr1)以鉴定来源于第6层皮质丘脑突出锥体神经元的核,并且观察到约1.8%的核为Ntsr1阳性。
表10中的值基于流式细胞术期间用于分选的阳性群体的保守门控,而前一段中的百分比基于流式数据的较不保守的分析。
实施例4.来源于开发用于TRAP方法的转基因动物的细胞系的谱表达
为了确定核RNA谱是否足够灵敏以区分不同亚型的神经元,将RNAseq用于从表达EGFP-L10a核糖体融合蛋白的转基因小鼠系的FACS纯化的EGFP+核中产生核表达谱,所述EGFP-L10a核糖体融合蛋白分别靶向五种不同的细胞类型:小脑浦肯野细胞、颗粒细胞、伯格曼胶质细胞、皮质脑桥锥体神经元或皮质神经元锥体神经元。已知Neurod1、Pcp2和Sept4分别驱动小脑的颗粒细胞、浦肯野细胞和伯格曼神经胶质中的表达。已知Colgalt2(或者称为Glt25d2)和Ntsr1驱动皮质的皮质脑桥和皮质丘脑锥体细胞中的表达。已证实已知标志物对每种细胞类型的核是特异性的。
表11提供了来自经开发用于TRAP方法的转基因小鼠的核RNAseq数据集的概述。
表11.核RNAseq数据集的概述
对表11中给出的五种细胞类型的核进行核RNAseq数据的分层聚类。另外,来自Mo等(Neuron 2015)的三种公开的核RNAseq数据集包括在分层聚类中:来自Camk2a-cre动物的兴奋性神经元(标记为excit),来自PV-cre动物的PV中间神经元(标记为pv)和来自VIP-cre动物的VIP中间神经元(标记为vip)。观察到锥体神经元聚类在一起。
将通过RNAseq结果计算的表达归一化至每个基因的所有样品的平均表达。与来自250种最可变基因的归一化RNAseq结果相比,五种细胞类型中的每一种的通过FACS纯化的核的RNAseq结果中的log2倍数变化示出在表12中。对于来自每种细胞类型的核的3次重复,计算表达的log2变化。负值表示与来自所分析的所有细胞类型的核的归一化值相比,该细胞类型的核中的表达降低,并且正值表示与来自所分析的所有细胞类型的核的归一化值相比表达增加。
表12.所有样品中250种最可变基因的表达的Log2倍数变化
与来自所分析的所有细胞类型的核的归一化表达相比,与Mo等(2015)Neuron 86,1369-1384(其通过引用整体并入本文)的RNAseq数据的表12中发现的相同的250种最可变基因的RNAseq结果的表达的log2倍数变化示出在表13中。负值表示与来自所分析的所有细胞类型的核的归一化值相比,该细胞类型的核中的表达降低,并且正值表示与来自所分析的所有细胞类型的核的归一化值相比表达增加。
表13.来自Mo等的样品的Log2倍数表达变化
从观察到具有增加的表达的基因鉴定出另外的细胞类型特异性核转录物:用于Sept4阳性细胞(伯格曼神经胶质)的α-2-巨球蛋白(A2m)、用于Colgalt2阳性细胞(皮质脑桥锥体细胞)的Pde1a和Colgalt2、用于兴奋阳性细胞(兴奋性神经元)的Pde1a和硫酸乙酰肝素-葡萄糖胺3-磺基转移酶4(Hs3st4)、用于Ntsr1阳性细胞(皮质丘脑锥体细胞)的Pde1a和Hs3st4、用于PV阳性细胞(小清蛋白中间神经元)的Aristaless相关同源框(Arx)和小清蛋白(Pvalb)、用于VIP阳性细胞(VIP中间神经元)的血管活性肠肽(Vip)、用于Pcp2阳性细胞(浦肯野细胞)的溶质载体家族9成员A3(Slc9a3)、和用于NeuroD1阳性细胞(颗粒细胞)的Grin2c。本文实施例中的结果提供了核RNA足以定义细胞类型的证据。
使用这八种细胞类型中的上述基因进行分层聚类,以确定核RNA谱是否可以基于预期的生物学对样品进行分组。聚类不仅按照细胞类型发生,而且还按照相关细胞类型的组发生。例如,两类中间神经元(VIP和PV)彼此聚类,而三种类型的锥体细胞(来自本文数据的皮质脑桥和皮质丘脑以及来自Mo等的所有兴奋性)聚类在一起。即使是使用不同方法和不同实验室制备的样品,这种聚类的稳健性表明核RNA谱用于指定细胞身份和测量不同类型细胞的相关性的效用。
实施例5.开发从野生型动物中分离特定核的方法
先前的细胞谱分析技术需要在转基因动物中繁殖疾病模型。一些疾病模型难以繁殖,并且对衰老的研究需要保持特定的转基因株多年。此类方法不适用于其中转基因难以进行或不道德的生物,例如人类。因此,需要开发能够对野生型动物中确定的细胞类型进行分子研究的可概括的方法。
图2A显示了使用实施例2中描述的策略的来自小鼠小脑的一类核。Itpr1位于x轴上,并且NeuN位于y轴上。Itpr1+群体是浦肯野细胞的核,并且NeuN+群体是胶质细胞的核。NeuN+/Itpr1-核(最大的组)代表颗粒细胞。
图2B显示了来自RNAseq数据的基因表达谱分析,所述数据比较了来自GFP分类的转基因动物的浦肯野核RNA组和用本文所述的细胞谱分析技术分选的Itpr1+核。Pcp4是浦肯野标志物,观察到其与小脑未分选的核(Pcp2 uns和WT uns)相比,在Pcp2-GFP+核和野生型(WT)Itpr1+核中富集。Calb2是颗粒细胞标志物,观察到其与分选的浦肯野核(Pcp2-GFP+或WT Itpr1+)相比,在未分选的样品(未分选的Pcp2和未分选的WT)中富集。
表14提供了Pearson相关性,其显示来自GFP的浦肯野核的数量与抗体分类高度相关(R=0.99)。
表14.Pearson相关性
驱动子
Pcp2 uns
Pcp2-GFP+
WT uns
WT Itpr+
Pcp2 uns
1.00
0.93
0.99
0.95
Pcp2-GFP+
1.00
0.92
0.99
WT uns
1.00
0.94
WT Itpr+
1.00
对这些因子特异的抗体将导致表达这些待分离因子的细胞类型数量的增加。
中脑中的多巴胺能神经元也用两种抗体的组合染色:一种针对转录因子FoxA1,并且另一种针对膜定位多巴胺转运蛋白(DAT)。在多巴胺能神经元的核中观察到针对FoxA1的染色。针对DAT的染色主要在轴突中观察到,尽管在高放大倍数下,其也在细胞体中观察到,但这可能是在内质网中合成。
通过流式细胞术对多巴胺能神经元核的核染色和分选示出在图3A中。分离双阳性(DP)群体(对于FoxA1和DAT呈阳性)用于RNAseq分析。图3B比较来自未分选的中脑核和分选的多巴胺能核的RNAseq迹线。观察到多巴胺能核对以下已知标志物呈阳性:溶质载体家族6成员3(DAT,也称为Slc6a3)、酪氨酸羟化酶(TH)、Forkhead盒A1(FoxA1)、Forkhead盒A2(FoxA2)和多巴胺受体D2(Drd2)。同时,观察到已知在这些神经元中不表达的基因(Drd1和谷氨酸脱羧酶(Gad))在未分选的群体中被耗竭。因此,观察到多巴胺能神经元在小鼠中成功分离。该策略也可用于人样品。
从染色观察到Wolframin ER跨膜糖蛋白(Wfs1)和B细胞CLL/淋巴瘤11B(Ctip2,也称为Bcl11b)分别是皮质细胞类型2/3层锥体神经元和第5和6层锥体神经元的推定标志物。从染色观察到的皮质细胞类型的另一个推定标志物是ETS变体1(Etv1,也称为ER81),其标记第5层锥体神经元。先前已经观察到Etv1标记皮质的第5层中的皮质纹状体神经元、皮质脑桥神经元和潜在的其他神经元。还通过染色鉴定了于海马的两种推定标志物:用于碳酸酐酶1(CA1)阳性神经元的Wfs1和用于碳酸酐酶1(CA2)阳性齿状回的浦肯野细胞蛋白4(Pcp4)。
观察到脑干运动神经元的推定标志物是溶质载体家族18成员A3(VaChT,也称为Slc18a3)、软骨凝聚蛋白(Chodl)和EsrrB。通过原位杂交观察对3种基因VaChT、Chod1和ErrB特异的抗体标记脑干中的这种神经元群。Allen Brain Atlas基因表达数据库用作参考。VaChT和ErrB专门标记运动神经元,并且ChodI标记除了这些神经元之外的所有。Chod1特异性抗体可以用直接标记脑干运动神经元的抗体代替。
实施例6.将抗体分选方法应用于来自野生型小鼠的核
为了确定本文所述的细胞谱分析技术是否可以有效地用于野生型动物中的细胞类型特异性研究,将本文所述的细胞谱分析技术应用于来自小鼠小脑的加工组织,该结构由具有特有的形态和分布的若干种经典定义的神经元和神经胶质细胞类型构成。
候选抗体特异性选自来自每种细胞类型的表达谱,所述表达谱由从开发用于TRAP方法的表达EGFP/L10a融合蛋白的转基因动物获得的数据产生(Dougherty,等(2010)Nucleic Acids Res 38,4218-4230和Doyle,等(2008)Cell 135,749-762,其各自通过引用整体并入本文)。从野生型小鼠的小脑中的三种神经元细胞类型(颗粒细胞、浦肯野细胞和篮细胞)和两种胶质细胞类型(星形胶质细胞和少突胶质细胞)收集数据。
使用与应用于来自转基因动物的细胞的策略类似的策略,对小脑中的五种不同细胞类型进行免疫荧光染色。用于每种细胞类型以确定核之间差异的抗体的特异性是用于颗粒细胞的NeuN、用于浦肯野细胞的Itpr1、用于篮细胞的Sorcs3、用于星形胶质细胞的细胞体和突起的Gfap标记、和用于少突胶质细胞的细胞体和过程的MOG标记。
为了分选,使用至少两种抗体的组合:NeuN(定位于核内的常染色质的剪接因子),其标记神经元核,以及细胞类型特异性抗体:Itpr1,定位于核膜的内质网膜蛋白,以及篮细胞标志物Sorcs3和星形胶质细胞标志物Eeat1(也称为Glast),它们是在核膜中标记的两种细胞膜蛋白。针对少突胶质细胞的标志物和转录因子Olig2的抗体显示出常染色质中的标记。
在小脑组织中,本领域中已知NeuN标记颗粒神经元的核,但不标记浦肯野和篮细胞神经元或胶质细胞。使用NeuN对组织切片的免疫荧光结果证实了这一结果。然而,使用NeuN对核进行染色显示,虽然篮细胞、星形胶质细胞和少突胶质核如预期具有较低水平的NeuN,但意外地观察到浦肯野核具有升高的水平。这不是由于浦肯野特异性标志物的光谱重叠,因为共聚焦成像显示常染色质中浦肯野核中NeuN的明亮表达——剪接因子的预期分布。因此,观察到NeuN表位的暴露在分离的核和组织切片中是不同的。
为了从少突胶质细胞中分离核,使用针对转录因子Olig2的抗体。免疫荧光用于证实这些抗体的有效性。为了从颗粒细胞中分离核,除了Itpr1、Sorcs3和Olig2的组合外,还使用NeuN以去除来自其他细胞类型的污染核。核用DAPI复染,DAPI也是异染色质的标志物。FACS结果显示在表15中。
表15.来自野生型小鼠的样品的FACS结果
细胞类型
群体
群体的百分比
颗粒细胞
Itpr1-Olig2-Sorcs3-NeuN+
90.5%
浦肯野细胞
Itpr1+NeuN+
0.1%
篮细胞
Itpr1+med NeuN-
3.03%
星形胶质细胞
Sorcs3+med NeuN-
1.94%
少突胶质细胞
Sorcs3-NeuN-
1.95%
因此,观察到用于从开发用于TRAP方法的转基因动物中分离细胞类型中的核的分选策略在来自野生型小鼠中的相同细胞类型的核中也是有效的。
实施例7.来自不同细胞分选方法的结果的相关性
通过计算来自经开发用于TRAP方法的动物的GFP+分选核样品和使用本文所述的细胞谱分析技术分选的核样品中如表16所示的归一化基因表达的成对Pearson相关系数(r)来在全基因组水平分析结果。“.g”样品是来自经开发用于TRAP方法的动物的GFP+分选样品,而“.a”样品通过本文所述的细胞谱分析技术分选。
表16.Pearson相关系数
根据该分析,观察到小脑中不同细胞类型之间的相关性高:r=0.91-0.94,并且观察到生物重复之间的相关性非常高:r=0.98-1。对于来自颗粒细胞、浦肯野细胞和伯格曼神经胶质的EGFP-L10a标记的核的基因表达谱,在遗传定义的细胞类型和细胞谱分析定义的细胞类型之间观察到非常高的相关性:对于颗粒细胞r=0.98,对于浦肯野细胞r=0.99,并且从Sept4/EGFP-L10a动物纯化的伯格曼神经胶质和通过本文所述的细胞谱分析技术纯化的星形胶质细胞之间r=0.96-0.97。由于伯格曼神经胶质是小脑星形胶质细胞的亚群,因此这两个数据集彼此之间并不完全相关是有道理的。
样品的分层聚类揭示了根据已知生物学的聚类。例如,在第一次分割时,神经元和神经胶质样品彼此分开。在第二次分割时,五种细胞类型彼此分开,而无论核是使用遗传标记或抗体标记进行纯化。总之,本文的结果证明,本文所述的细胞谱分析技术允许小鼠中的细胞类型特异性基因表达谱分析而不需要转基因动物。
实施例8.大鼠中细胞类型的基于抗体的分选
将核从大鼠小脑中分离,固定,并使用与小鼠中使用的相同抗体染色,并通过流式细胞术分析结果。对于来自Sprague Dawley大鼠的核样品,FACS结果显示在表17中。
表17.来自Sprague Dawley大鼠的样品的FACS结果
大鼠核的染色谱类似于小鼠的染色谱。尽管存在差异,例如,与小鼠小脑中显著的相比,在大鼠小脑中NeuN染色导致更明显的阳性和阴性群体。结果,通过流式细胞术分析揭示了额外的核群体,并且通过RNAseq分离和表征这些细胞。通过用对Sorcs3和NeuN特异的抗体染色来从篮细胞、星形胶质细胞和少突胶质细胞中分离核。这种灵活性允许使用四种染色方法纯化所有六种细胞类型。对于从一种以上类型的染色中分离的细胞类型,选择通过RNAseq鉴定的最富含已知标志物并且耗竭其他小脑细胞类型标志物的群体。
为了确定对每种大鼠细胞类型特异的基因的组,如实施例1中所述进行差异基因表达分析(DESeq2),以将每种细胞类型的核表达谱与未分选的小脑核进行比较。与来自每种单独细胞类型的分选的核的RNAseq结果相比,来自六种细胞类型的核的归一化RNAseq结果之间的120种差异表达基因(调整的p<0.01,倍数变化>2)的表达的log2倍数变化示出在表18中。负值表示与来自所分析的所有细胞类型的核的归一化值相比细胞类型的核中的表达降低,而正值表示与来自所分析的所有细胞类型的核的归一化值相比表达升高。分析来自每种细胞类型的两个重复的核样品。
表18.大鼠核中基因表达的Log2倍数变化
在表18中观察到了每种细胞类型的已知标志物的一般富集和所有其他细胞类型的标志物的耗竭。观察到Fat2和Rbtox3的核表达在颗粒细胞中显著富集。观察到Car8和Calb1的核表达对浦肯野细胞是特异性的。观察到Aldh1L1和Slc1a3的核表达对伯格曼神经胶质是特异性的。观察到Colgalt2的核表达对皮质脑桥锥体细胞是特异性的。观察到Hs3st4的核表达对于皮质丘脑锥体细胞是特异性的,而观察到Pde1a和Csmd1在两种皮质锥体细胞类型中表达。除了表18中的120种基因外,该数据还鉴定了在每种大鼠细胞类型中显著富集的700至1,600种表达的基因。
通过实施更新版本的特异性指数(SI)算法,还鉴定了对每种细胞类型最具特异性的基因(Dougherty,等(2010)Nucleic Acids Res 38,4218-4230,其通过引用整体并入本文)。SI的一个优点是其甚至可以鉴定感兴趣区域中非常丰富的细胞类型(例如小脑颗粒细胞)中的特异性表达的基因。
为了验证细胞类型特异性大鼠数据和更新的SI算法,使用Allen Mouse BrainAtlas原位杂交数据库确认鉴定为对每种细胞类型特异的基因的表达。对于实施例1中通过SI算法对所有细胞类型计算的前20种最特异性基因,平均93%的时间在限定的细胞类型中特异性地观察到标记。利用Allen Mouse Brain Atlas图像的前20种SI基因的百分比显示每种细胞类型的预期分布为:颗粒细胞93%、浦肯野细胞100%、篮细胞85%、星形胶质细胞93%、少突胶质细胞100%和OPC80%。还观察到星形胶质细胞特异性基因Itih3的分布是小脑的伯格曼神经胶质(一种星形胶质细胞)和非伯格曼神经胶质星形胶质细胞的特征。选择以下基因作为6种细胞类型的核的额外标志物:用于颗粒细胞核的Tescalcin(Tesc)、用于浦肯野细胞核的碳酸酐酶8(Car8)、用于篮细胞核的March11、用于星形胶质细胞核的间-α-胰蛋白酶抑制剂重链3(Itih3)、用于少突胶质细胞核的Mog、和用于少突胶质细胞祖细胞核的血小板衍生生长因子受体α(Pdgfra)。
这些结果证明,本文描述的细胞谱分析技术是可以容易地适用于任何物种的通用方法。
实施例9.鉴定和比较每个物种中最特异性基因
为了深入了解物种之间改变的细胞类型特异性功能,计算每个物种中所有基因的特异性指数。对于表19-24中的每种细胞类型,显示了每种物种的100种最特异性基因。较低的SI值表示在一个物种中比另一个物种更特异地表达的基因。
表19提供了对于人、大鼠和小鼠样品中的颗粒细胞通过如实施例1中所述的特异性指数(SI)测量的100种最特异性的基因。
表19.对于颗粒细胞通过SI测量的每个物种的100种最特异性基因
表20提供了对于人、大鼠和小鼠样品中的浦肯野细胞通过特异性指数(SI)测量的100种最特异性基因。
表20.对于浦肯野细胞通过SI测量的每个物种的100种最特异性基因
表21提供了通过人、大鼠和小鼠样品中的篮细胞通过特异性指数(SI)测量的100种最特异性的基因。
表21.对于篮细胞通过SI测量的每个物种的100种最特异性基因
表22提供了对于人、大鼠和小鼠样品中的星形胶质细胞通过特异性指数(SI)测量的100种最特异性的基因。
表22.对于星形胶质细胞通过SI测量每个物种的100种最特异性基因
表23提供了人、大鼠和小鼠样品中的少突胶质细胞通过特异性指数(SI)测量的100种最特异性的基因。
表23.对于少突胶质细胞通过SI测量的每个物种的100种最特异性基因
表24提供了对于人、大鼠和小鼠样品中OPC通过特异性指数(SI)测量的100种最特异性的基因。
表24.对于OPC通过SI测量的每个物种的100种最特异性基因
如表25中所示,将小鼠中每种细胞类型的100种最特异性基因的排名与其在大鼠或人中的排名进行比较。
表25.小鼠中前100种最特异性基因的排名的比较
观察到与小鼠和人相比,小鼠和大鼠之间的特异性排名更保守。
实施例10.确定物种之间细胞类型特异性基因的变化程度
为了进一步探索物种之间细胞类型特异性基因变化的程度,比较分析集中于来自小鼠和人核样品的数据,因为大鼠基因组的注释不太完整。通过排除大鼠基因,通过过滤ENSEMBL直系同源物,可用于比较的高置信度直系同源物的数量从11,443增加到14,273。
此外,为了关注最可能影响细胞功能的差异表达的基因,选择这样的基因:其通过严格调整的p值截止值<0.01,物种之间的变化为至少4倍,并且在每种细胞类型中以显著水平表达(平均计数数目>400且fpkm>0)。过滤表达水平(baseMean>50,log10(fpkm)>0)后留下的数目,以及过滤在小鼠和人类之间所有细胞类型差异表达的基因后留下的数目被分解为人类和小鼠富集的基因,如表26所示。
表26.富集基因
根据表26,在这些细胞类型中,鉴定了490和823种基因是小鼠或人富集的。
为了鉴定小鼠和人之间的细胞类型和物种差异而不是一般差异,从分析中除去在所分析的所有细胞类型中差异表达的基因(调整的p<0.01,倍数变化>2)。以这种方式过滤产生133和293种细胞类型和物种特异性差异表达的基因,其在小鼠中富集的那些和人中富集的那些之间大致相等地分布。
为了确认这些数据,相对于小脑中的所有其他细胞类型,颗粒细胞神经元的丰度允许两种类型的验证,其对于较不丰富的细胞类型是不能获得的:首先,除了测定新生核RNA的表达之外,检查成熟细胞质RNA的表达;第二,鉴于小脑核制备物中存在高比例的颗粒细胞基因组,使用未分选的小脑核评估染色质可用性。由于先前的研究已经证明ATACseq峰通常存在于表达基因的启动子和基因体中并且在未表达的基因中严重减少或缺失(Buenrostro,等(2013)Nat Methods 10,1213-1218;Mo,等(2015)Neuron 86,1369-1384;Su,等(2017)Nat.Neurosci.20,476-483,其各自通过引用整体并入本文),将来自小鼠、大鼠和人小脑核的ATACseq数据用于确认表达数据。
如所预期的,在来自本文所述的细胞谱分析技术的数据中鉴定为在所有三个物种中表达的蛋白质编码基因伴随着剪接的细胞质mRNA的存在,并且ATACseq峰在其启动子和基因体中是明显的。例如,管家基因Gapdh和颗粒特异性基因Etv1在小鼠、大鼠和人的颗粒细胞中强烈表达。正如预期的那样,观察到核RNA、细胞质RNA和ATACseq峰在这些基因上的存在。但对于人富集基因C1vs2和Vwc2,虽然在人类数据中存在这三种独立的活性表达测量,但在小鼠数据中没有明显的表达或染色质可用性。相反,对于小鼠富集基因Cnksr3和Ece1,在小鼠数据中观察到核和细胞质RNA表达和ATACseq峰,但在人数据中未发现。如所预期的,这些基因在大鼠中的表达与小鼠相似,但是观察到在大鼠中存在低水平的人富集基因Clvs2和Vwc2。
鉴定了小鼠和人之间表达的两个额外特征。表达的变化可能涉及给定基因组间隔的多于一种基因。例如,在含有G蛋白偶联受体135(Gpr135)、反式-L-3-羟基脯氨酸脱水酶(L3hypdb)、JNK1/MAPK8相关膜蛋白(Jkamp)、Ccdc175和浆膜蛋白1(Rtn1)的基因座中,所有五种基因在人颗粒细胞中表达,如通过图4中核和细胞质基因表达和ATACseq峰的存在所揭示的。还观察到Jkamp、L3hypdh和Gpr135在小鼠和大鼠中表达,如由通过ATACseq峰显示的启动子DNA可及性位点的存在支持的,但相对于其人直系同源物以低得多的水平表达。观察到Rtn1在小鼠中以比在大鼠和人中更低的水平表达,但对于每个样品观察到不同的ATACseq峰的模式。在小鼠和大鼠中,未观察到Ccdc175表达,并且未观察到ATACseq峰。这表明该区域中的基因形成两个不同的结构域-一个含有Rtn1,并且另一个含有Gpr135、L3hypdh、Jkamp和Ccdc175。Gpr135、L3hypdh和Jkamp可以在啮齿动物数据中同等地可及ATACseq。因此,这些基因的核和细胞质RNA水平降低可能是由于相邻和非表达基因Ccdc175的染色质结构的变化导致的。
小鼠和人类数据之间表达的第二个特征表明,改变有时涉及给定细胞类型中替代家族成员的表达。例如,Pde1基因家族含有三种钙和钙调蛋白依赖性磷酸二酯酶Pde1a、Pde1b和Pde1c。这些酶催化cAMP或cGMP的水解,并在调节神经元活动中起重要作用。ATACseq用于证实小鼠颗粒细胞小鼠仅表达Pde1c,而来自人的颗粒细胞表达高水平的Pdc1a和低水平的Pde1c。这些结果与Pde1a在人中表达但不在小鼠小脑中表达的先前发现相符:Loughney,K.,&Ferguson,K.(1996)Phosphodicsterase inhibitors(第1-19页);Loughney,等(1996)J Biol Chem 271,796-806;和Sonnenburg,等(1993)J Biol Chem268,645-652;其各自通过引用整体并入本文。由于Pde1a优先水解cGMP,而Pdc1c以相同的效率水解cAMP和cGMP(Takimoto,E.(2009)Circ.Res.105,931-933,其通过引用整体并入本文),这些差异可能导致小鼠和人类小脑的生化后果略有不同。
为了证实小鼠脑中这些mRNA的存在或不存在,分析了来自Allen Mouse BrainAtlas和GENSAT Project的公开可得的基因表达数据(Gong,等(2003)Nature 425,917-925;Lein,等(2007)Naturc 445,168-176,其各自通过引用些体并入本文)。这些数据证实在小脑的颗粒层中表达颗粒特异性标志物Etv1和小鼠富集基因Cnksr3、Ece1和Pde1c,并且不存在人富集基因Ccdc175、Clvs2、Vwc2和Pdc1a的表达。有趣的是,虽然Clvs2和Pde1a在小脑中不存在,但它们在小鼠脑中的其他区域表达,表明细胞特异性调节序列的改变可能是这些物种差异的基础(Carroll,S.B.(2005)PLoS Biol 3,c245;Carroll,S.B.(2008)Cell134(11),25-36;其各自通过引用整体并入本文)。还在小脑的浦肯野层中也观察到Ece1表达。在小鼠脑中观察到人富集基因Ccdc175、Clvs2、Vwc2和Pde1a的表达。在任何区域未检测到Ccdc175和Vwc2的染色。在齿状回中观察到Clvs2的强染色,并且在皮层第5和6层和海马CA1-3的中观察到Pde1a的强染色。
为了进一步验证数据,qPCR用于确定小鼠和人富集基因的相对表达。使用人和小鼠小脑细胞质cDNA对管家基因、人富集基因和小鼠富集基因进行基因表达的qPCR分析。每个物种使用两个生物重复,每个具有三个技术重复。将表达归一化至来自三个管家基因的表达的算术平均值。相对于人XK样品中的表达计算倍数变化。使用双尾学生t检验计算p值,假设与生物重复(平均技术重复)的平均归一化值的方差不等,并且如下:1)管家基因-Actb=0.334,Gapdh=0.141,和Polr2a=0.109;2)人富集基因-Clvs2=0.0195,Vwc2=0.0161,和Pde1a=0.00086;和小鼠富集基因-Pde1c=0.0696。无法计算Ccdc175、Cnksr3和Ece1的p值,因为至少一个生物重复的所有技术重复都未能扩增。
在所有情况下(除了一种),qPCR结果证实了RNAseq和ATACseq数据。在异常情况下,Pde1c未显示出在小鼠和人之间表达的显著变化。为了理解这种异常,通过免疫荧光在小鼠和人小脑切片中测定Pde1a和Pde1c的表达。染色进行至少两次,每次使用来自两个单独的小鼠和两个单独的人供体的切片。NeuN是颗粒细胞的标志物。与RNAseq和ATACseq数据一致,观察到Pde1c和Pde1a成员两者主要位于颗粒层中,其中Pde1c表达主要在小鼠中,并且Pde1a表达主要在人小脑中。小鼠小脑显示了颗粒细胞中特异性的Pde1c以及Pde1a的本底标记,而人小脑中显示颗粒细胞中特异性的Pde1a以及Pde1c的本底标记。
为了理解这些基因是否可以反映独立发生的表达变化,或者在物种之间改变的转录程序,对10类物种特异性基因进行基因本体论(GO)分析。四组基因产生显著的GO组:人富集的星形胶质细胞,人富集的少突胶质细胞,人富集的OPC和小鼠富集的颗粒基因。未观察到其余6个基因组具有任何显著相关的GO类别,表明这些细胞类型中的物种差异有助于广泛的途径和功能。来自星形胶质细胞、少突胶质细胞或OPC的人富集基因的GO分析显示这些基因参与细胞结构、大小调节和神经系统功能,从而潜在地反映了小鼠和人神经胶质细胞之间形态学的已知差异。颗粒细胞小鼠富集基因参与神经系统功能和多糖代谢,其可能在细胞-细胞相互作用中起作用。
总之,这些数据证明本文所述的细胞谱分析技术可用于核以准确评估啮齿动物和人脑中的细胞类型特异性基因表达,以及神经系统中的基因表达。在物种之间,观察到脑中的基因表达在特定细胞类型中高度保守。因此,观察到充分表征的细胞类型的最丰富的和细胞特异性标志物在啮齿动物和人脑之间共有。尽管存在这种共同特征,但每种细胞类型中存在表达在物种之间不保守的大量基因。这组基因通常不符合已知的GO类别,并且在许多情况下,其表达存在于其他脑区域中。细胞类型和物种特异性表达可以反映基因座内相邻基因的改变的调节,或给定基因家族的功能相关但不同的成员的选择性表达。虽然这些基因表达变化的后果必须在未来的研究中得到质疑,但本文数据表明在物种之间发生特定CNS细胞类型中基因表达的功能上重要的差异,并表明它们可能导致啮齿动物和人细胞类型的生物化学功能的重要差异。
实施例11.比较小鼠和人的核转录组
使用免疫荧光来确定分选是否导致人样品中的纯群体。观察到三个群体之间的核结构差异很大,并且每个群体的核的大小不同。观察到NEUN+颗粒神经元小且是高度异染色质的。观察到NEUN-核的大小在可能来自伯格曼神经胶质的较大核和可能来自少突胶质细胞的较小核之间混合。观察到ITPR1+核比其他两组的核更大且更常染色质的。图6显示了流式细胞术分选结果,其通过前向散射光(FSC)和侧向散射光(SSC)的组合来估算核的大小。(Dp=双阳性)。这些结果表明来自不同细胞类型的核在核结构中是不同的,这可能导致每种细胞类型之间基因表达调节或疾病易感性的差异。
尽管如此,分别在图5A和图5B中的流式细胞术结果中观察到了从两名不同的人受试者(人1和人2)分选的核的异质性。可以鉴定物种特异性标志物以区分不同细胞类型的核。
图7A、图7B、图7C和图7D提供了用于人小脑核的4种不同染色策略的流式细胞术结果,所述策略是从用于分选小鼠核的策略开发的。图7A显示了用Itpr1和Id2对浦肯野细胞进行门控的流式细胞术结果,即Itpr+和Id2+。图7B显示用Forkhead盒P4(FoxP4)和Itpr1对浦肯野细胞进行门控,即FoxP4+和Itpr+。图7C显示使用与小鼠所用的相同的分选策略用NeuN和Itpr1对颗粒细胞进行门控,即Itpr-和NeuN+。图7D显示了用Foxp4和NeuN进行门控。所有四种染色策略中最浅灰色群体提供了相同的核群,如表37中所示的来自RNAseq的基因表达谱分析所示。
自小鼠和人分选的核的RNAseq结果的基因表达谱分别显示在实施例15和17中。观察到实施例17的表37中的颗粒细胞核群体与实施例15的表31所示的来自小鼠的颗粒细胞具有相似的谱。观察到表37中的胶质细胞核群体与来自小鼠的胶质细胞(表33和34)具有相似的谱。观察到表37中来自人样品的篮细胞核群体与表32中来自小鼠的篮/星状细胞具有相似的谱。这些相似性在Rbfox3(也称为NeuN)、Fat2、兰尼碱受体1(Ryr1)、Pva1b、谷胱甘肽S-转移酶μl(Gstm1)和多效生长因子(Ptn)的RNAseq结果中特别显著。
相比之下,在表31-34和37中的RNAseq数据中对于以下观察到小鼠和人之间的显著变异:来自颗粒细胞、篮/星状细胞和胶质细胞的蛋白酪氨酸激酶2β(Ptk2b)、溶质载体家族43成员2(Slc43a2)、谷氨酸离子型受体红藻氨酸盐型亚基3(Grik3)、Itpr1、原钙粘蛋白9(Pcdh9)和RAS脒基释放蛋白1(Rasgrpl)。
来自在样品之间促成最大变异(因此一个样品与另一个样品的最大差异)的前500种基因的核RNAseq数据的分层聚类(首先按物种,然后按细胞特异性)显示,一些组的基因在细胞类型之间不同,并且另一些组的基因在物种之间不同。该分析揭示了在小鼠和人之间保守和差异的基因。
小鼠和人小脑样品的主组分分析允许使按细胞类型和按物种的聚类可视化。第一主组分(x轴)表示样品之间的最大变异,并且第二主组分表示样品之间的第二大变异来源以及它们如何按细胞类型分离。本文的分析显示细胞类型有助于样品之间方差的X%,而物种有助于样品之间方差的Y%。
实施例12.从跨物种比较中鉴定细胞类型和物种特异性基因
鉴于上述细胞特异性表达谱的高质量,分析了这些小脑细胞类型中物种之间基因表达变化的程度。为了确保结果反映出改变的表达而不是物种之间注释的差异,分析限于小鼠、大鼠和人之间的高置信度1∶1直系同源物。为了定义小鼠、大鼠和人基因的直系同源注释,从ENSEMBL下载跨物种的直系同源注释(304,147个转录物vs.19,197个基因),并过滤至仅包括:高置信度对(76,172个转录物vs.14,541个基因)→1∶1直系同源物(67,522个转录物vs.13,242个基因)→总长度大于1kb并且跨物种的长度变化小于2倍的基因(30,497个转录物vs.11,443个基因)。对于每个基因,将最长的直系同源转录物用于注释,产生11,443个转录物和11,443个基因。
7种细胞类型的核的归一化RNAseq与来自每种单独细胞类型的分选核的RNAseq结果相比较,小鼠、大鼠和人核中250种最可变基因的表达的log2倍数变化示出在表27中。负值表示与来自所分析的所有细胞类型的核的归一化值相比,该细胞类型的核中的表达降低,并且正值表示与来自所分析的所有细胞类型的核的归一化值相比表达增加。分析来自每种细胞类型的两个重复的核样品。
表27.来自大鼠样品的核的表达的Log2倍数变化
7种细胞类型的核的归一化RNAseq结果与来自每种单独细胞类型的分选核的RNAseq结果相比较,小鼠、大鼠和人核中250种最可变基因的表达的log2倍数变化示出在表28中。负值表示与来自所分析的所有细胞类型的核的归一化值相比,该细胞类型的核中的表达降低,并且正值表示与来自所分析的所有细胞类型的核的归一化值相比表达增加。分析来自每种细胞类型的两个重复的核样品。
表28.来自小鼠样品的核的表达的Log2倍数变化
对前八种主要组分前蛋白转化酶枯草杆菌蛋白酶/kexin 1型(PCSK1,也称为PC1)至前蛋白转化酶枯草杆菌蛋白酶/kexin8型(PCSK8,也称为(Pc1至Pc8),其共同占所有样品中变异性的90.5%)进行的检查揭示了,Pc1和前蛋白转化酶枯草杆菌蛋白酶/Kexin 3型(PCSK3,也称为PC3)的表达按细胞类型对样品分类,而Pc2、前蛋白转化酶枯草杆菌蛋白酶/Kexin 6型(PCSK6,也称为PC6)和PC8按物种分割样品。其他主要组分按细胞类型和物种两者组织样品。因为Pc1和Pc3占样品间变异性的47%,而Pc2、PCc6和Pc8仅占变异性的22%,所以这些谱之间最重要的差异被确定为由物种之间共有的细胞类型特异性表达基因产生的。然而,当评估不同物种中给定细胞类型的功能性质时,还要考虑物种之间表达谱的全基因组定量差异。
基于在250种最可变基因之外的所有基因中的表达,使用分层聚类来探索小鼠、大鼠和人细胞类型特异性数据集的物种之间的相似性和差异,揭示主要按物种聚类。然而,当仅使用物种之间的250种最可变基因进行聚类时,观察到聚类主要按细胞类型发生。
实施例13.谱分析来自十六个死后人脑的三种细胞类型
鉴于人群的遗传异质性、人组织处理时间的变异、以及从人组织中分离总RNA的先前研究(McCall,等(2016)Am.J.Hum.Genet.99,624-635.;Webster,M.J.(2006).Functional Genomics and Proteomics in the Clinical Neurosciences,(Elsevier),第3-14页,其各自通过引用整体并入本文)中提及的困难,来自不同个体的样品中的可变性来源也是感兴趣的,以评估在疾病中观察到的变化是由疾病本身引起还是由个体间的可变性引起的。为了更好地理解这种可变性的来源,将本文所述的细胞谱分析技术用于分析另外14个人脑样品中的细胞类型特异性基因表达。总共,样本获自16个对照供体,其具有大致等分的性别(7名男性和9名女性)和年龄(以下年龄组各4人:20-30、40-50、60-70、80-90岁)。所有样品均获自未受影响的受试者,其接受神经病理学诊断为“正常成人脑”。表29提供了关于每个供体的其他细节。
表29.供体细节
从所有16个样品中分离核,并使用针对ITPR1和NEUN的抗体染色以在单次分选中纯化来自三种不同细胞类型的核:颗粒细胞、篮细胞和总胶质细胞。表30提供了来自核的FACS分析的每种细胞类型的百分比。
表30.FACS结果
虽然样品之间的染色模式略有不同,但容易区分含有颗粒细胞的ITPR1-NEUN+群体、含有篮细胞的ITPR1+NEUN-群体和含有总胶质细胞的ITPR1-NEUN-群体。唯一的例外是来自个体WC和WO的胶质细胞群,其中ITPR1-NEUN-群体与ITPR1-NEUN+群体没有很好地分离。这两个样品的基因表达分析显示,分选未能有效地将颗粒细胞与胶质细胞分离,并且将样品从进一步分析中排除。RNAseq用于分析46个人类数据集:16个来自颗粒细胞,16个来自篮细胞,并且14个来自胶质细胞。
观察到本文所述的细胞谱分析技术降低了由细胞类型组成的差异引起的可变性,这降低了整体可变性。在本文分析的样品中几乎没有观察到可变性,因为在整个组织的正常分析中,可变性是由于组织组成的差异和每种细胞类型的可变性两者导致的。
如实施例8-14中所示,这些数据集的RNAseq分析证明了每个核样品的高纯度,因为每个样品富集该细胞类型的适当标志物,并且耗竭了其他小脑细胞类型的标志物。例如,仅来自雌性个体的样品表达X-无活性特异性转录物(XIST),而仅来自雄性的样品表达Y染色体基因,例如赖氨酸脱甲基酶5D(KDM5D)。另外,观察到每种细胞类型的生物重复之间的成对Pearson相关系数在0.98和1之间(图8)。这些数据表明,尽管在个体之间每种细胞类型的丰度存在微小差异,但通过本文所述的细胞谱分析技术获得的细胞类型特异性人表达数据是可再现的。
实施例14.总结小鼠和人之间细胞类型特异性核RNA谱的差异
通过从分选的核中分离RNA并进行RNAseq,产生小鼠和人中五种小脑细胞类型(颗粒细胞、浦肯野细胞、篮细胞、星形胶质细胞和少突胶质细胞)中的每一种的基因表达谱。
表31-34显示了小鼠和人之间基因表达的差异。为了关注最有可能影响细胞功能的差异表达基因,在物种之间的变化为至少4倍并且在每种细胞类型中以显著的水平表达(归一化计数的平均数目/DEseq2 baseMean>400并且log2(fpkm)>0)的调整后的p值<10E-5的基因。观察到119种至410种小鼠富集或人富集的基因。为了鉴定小鼠和人之间的细胞类型和物种差异而不是一般差异,从分析中除去在所分析的所有细胞类型中在小鼠和人之间差异表达的基因(调整的p<10e-5和倍数变化>2)。以这种方式过滤产生67至277种细胞类型和物种特异性差异表达的基因,其在小鼠中富集的那些和人中富集的那些之间大致相等地分布。
与来自小鼠的颗粒细胞的核的归一化RNAseq结果相比,来自人颗粒细胞的分选的核中的颗粒细胞标志物的Log2倍数变化显示在表31中。负值表示与来自所分析小鼠的颗粒细胞的核的归一化值相比,该细胞类型的核中的表达降低,并且正值表示与来自所分析小鼠的颗粒细胞的核的归一化值相比表达增加。
表31.颗粒细胞中表达的Log2倍数变化
观察到颗粒细胞标志物RNA结合蛋白,Fox-1同源物3(Rbfox3,也称为NeuN)和FAT非典型钙粘蛋白2(Fat2)在颗粒细胞中高度表达,并且未观察到在其他四种细胞类型中显著表达。在人和小鼠的颗粒细胞的核之间表达具有更大的log2倍数变化值的基因将更有效地作为来自人颗粒细胞的核的标志物。
与来自小鼠的篮细胞的分选的核的归一化表达结果相比,来自人篮细胞的分选的核中表达的log2倍数变化显示在表32中。负值表示与来自小鼠篮细胞的核的归一化值相比,人篮细胞的核中的表达降低,并且正值表示与来自小鼠篮细胞的核的归一化值相比表达增加。
表32.篮细胞中表达的Log2倍数变化
观察到篮细胞标志物Sorcs3和膜相关环-CH型指11(March11)在篮细胞中富集,并且未观察到在其他四种细胞类型中显著表达。
与来自小鼠星形胶质细胞的分选的核的归一化表达结果相比,来自人星形胶质细胞的分选的核中表达的log2倍数变化显示在表33中。负值表示与来自小鼠星形胶质细胞的核的归一化值相比,人星形胶质细胞的核中的表达降低,并且正值表示与来自小鼠星形胶质细胞的核的归一化值相比表达增加。
表33.星形胶质细胞中表达的Log2倍数变化
观察到醛脱氢酶1家族成员L1(Aldh1L1)和Slc1a3在星形胶质细胞中富集,并且未观察到在其他四种细胞类型中显著表达。与来自小鼠的少突胶质细胞的分选的核的归一化表达结果相比,来自人少突胶质细胞的分选的核中表达的log2倍数变化显示在表34中。负值表示与来自小鼠少突胶质细胞的核的归一化值相比,人少突胶质细胞的核中的表达降低,并且正值表示与来自小鼠少突胶质细胞的核的归一化值相比表达增加。
表34.少突胶质细胞中表达的Log2倍数变化
与在小鼠核中OPC的归一化基因表达相比,来自人OPC的核中差异表达基因的基因表达的log2倍数变化显示在表35中。与来自小鼠OPC的核相比,负值表示人OPC的核中基因表达降低,并且正值表示人OPC核中的基因表达增加。
表35.OPC中表达的Log2倍数变化
观察到Olig2和Mog在成熟少突胶质细胞和少突胶质细胞祖细胞(OPC)中富集,并且未观察到在其他四种细胞类型中显著表达。来自所有小脑细胞类型的核RNAseq谱的分层聚类证实,少突胶质细胞谱系分成两组,成熟少突胶质细胞和OPC,所有少突胶质细胞的组与成熟少突胶质细胞聚类。
实施例15.鉴定影响人细胞类型特异性基因表达的因素
开发本文描述的细胞谱分析技术的主要原因是能够直接检查人细胞类型特异性表达及其与可能影响细胞功能的生物和临床因素的关系。尽管表征的核是从正常小脑样品中获得的,但性别、年龄和死亡与组织保存之间的时间(自溶时间)的差异可能会影响表达数据。表36提供了由于自溶、性别和年龄而在核中观察到显著改变(调整的p值<0.01,baseMean>50)的基因数目。
表36.具有显著改变的表达的基因的数目
全部
颗粒细胞
篮细胞
胶质细胞
自溶
12
4
1
1
性别
27
15
35
25
年龄
42
274
139
31
观察到在大多数基因中年龄影响表达的显著变化。
实施例16.将细胞类型的基于抗体的分选应用于死后的人体组织
将前使用近亲繁殖的动物用于这些类型的研究,但是已经在人个体中观察到异质性。为了确定本文所述的细胞谱分析技术是否有效分析人脑中的细胞类型,来自两个供体(代码XK和PK)的死后人类小脑组织,然后分离并使用先前定义的细胞类型特异性抗体对核染色。进行来自两个个体(XK和PK)的小脑的颗粒细胞、篮细胞、所有胶质细胞、星形胶质细胞、成熟少突胶质细胞和少突胶质细胞祖细胞(OPC)核的FACS。表37列出了每组的群体的百分比。
表37.死后人组织的FACS结果
细胞类型
群体
个体
百分比
颗粒细胞
Itpr1-NeuN+
XK
91.40%
篮细胞
Itpr1+NeuN-
XK
0.85%
胶质细胞
Itpr1-NeuN-
XK
3.36%
星形胶质细胞
Itpr1-Olig2-NeuN-
XK
3.05%
少突胶质细胞-成熟
Olig2+低
XK
1.18%
少突胶质细胞-祖细胞
Olig2+高
XK
0.40%
细胞质
-
XK
-
颗粒细胞
Itpr1-NeuN+
PK
92.00%
篮细胞
Itpr1+NeuN-
PK
0.75%
胶质细胞
Itpr1-NeuN-
PK
3.58%
星形胶质细胞
Itpr1-Olig2-NeuN-
PK
1.33%
少突胶质细胞-成熟
Olig2+Low
PK
3.07%
少突胶质细胞-祖细胞
Olig2+High
PK
0.23%
细胞质
-
PK
-
来自表37中的结果的表达谱的进一步分析揭示了两个不同的群体:来自成熟少突胶质细胞的OLIG2+低核和来自少突胶质细胞前体细胞(OPC)和成熟少突胶质细胞两者的OLIG2+高核。
在对少突胶质细胞进行进一步的流式细胞术分析后,OLIG2+群体基于其水平看起来可细分。所有OLIG2+核中约有20%具有高水平的OLIG2(高),而80%具有较低水平(低)。
尽管染色的人小脑核的谱通常与啮齿动物数据相似,但存在差异。例如,用于分选颗粒细胞和篮细胞神经元、星形胶质细胞、少突胶质细胞和OPC的条件可直接转移到人死后组织,而用于分选小鼠和大鼠浦肯野核的那些条件不能成功用于分离人浦肯野核。在两个死后的人样品之间观察到染色的轻微差异:在XK中,少突胶质细胞和OPC群体很好地分离,而在个体PK中它们更难以区分。
为了评估这些差异是否会阻止人死后样品的细胞类型特异性分析,使用RNAseq在这两个个体脑中分析了从五种细胞类型(颗粒细胞、篮细胞、星形胶质细胞、少突胶质细胞、OPC)分离的核的基因表达。来自这些细胞类型中的每一种的已知标志物的检查确定相关细胞特异性标志物对于每种细胞类型是富集的,并且从其他细胞类型中耗竭。
与来自2个人样品的颗粒细胞、篮细胞、星形胶质细胞、少突胶质细胞和OPC细胞的分选的核的RNAseq结果相比,来自小鼠、大鼠和人样品的未分选核的核的归一化RNAseq结果之间的log2倍数变化示出在表38中。负值表示与来自所分析的所有细胞类型的核的归一化值相比,该细胞类型的核中的表达降低,并且正值表示与来自所分析的所有细胞类型的核的归一化值相比表达增加。表38显示了对于2个死后人样品,所有物种中250种最差异表达基因的RNAseq结果。
表38. 2个死后人样品中表达的Log2倍数变化
观察到RBFOX3(也称为NeuN)和FAT2在两种样品的颗粒细胞中显著富集。观察到MARCH11在来自两个样品的篮细胞中显著富集。观察到ALDH1L1和SLC1A3在来自两个样品的星形胶质细胞中显著富集。观察到Olig2在来自两个样品的少突胶质细胞和OPC中显著富集。观察到MOG在来自两个样品的少突胶质细胞中显著富集。观察到PDGFRA在来自两个样品的OPC中显著富集。仅Olig2+高核表达标记少突胶质细胞前体细胞(OPC)的基因,例如Pdgfra和硫酸软骨素蛋白多糖4(Cspg4)。Olig2+低核来自成熟少突胶质细胞,而Olig2+高核来自成熟少突胶质细胞和未成熟OPC的混合物。在所有情况下,仅观察到预期细胞类型中标志物的高表达。因此,鉴定Olig2(所有少突胶质细胞)、Pdgra和Cspg4(OPC)、Mag和Mog(成熟少突胶质细胞)对于进行本文所述的细胞谱分析技术是有效的。
这些结果突出了本文所述的细胞谱分析技术用于鉴定由于其高度定量性质而导致的意外亚群的效用。结果中的异质性可用于鉴定患者中的生物标志物。例如,异质性可能能够预测不同个体如何对药物的响应或鉴定治疗靶标。
实施例17.每个样品的RNAseq结果之间的相关性
表39显示了对于每种细胞类型2个死后人样品XK和PK之间的Pearson系数。
表39.XK和PK样品之间的Pearson系数
图9提供了点图,其显示按细胞类型分解的每个样品的成对Pearson相关系数,以比较人、大鼠和小鼠样品之间的结果。计算10个数据集中的成对Pearson相关系数揭示了,两个神经元细胞类型(颗粒细胞和篮细胞)在样品之间高度相关(两者的r=0.99),而胶质细胞数据的相关性略低(r=0.96-0.97)。此外,分层聚类揭示了按细胞类型的分离,表明细胞类型之间的变异强于个体样品之间的变异。观察到物种之间相同细胞类型的样品之间的相关系数范围与从相同物种分离的细胞类型的聚类类似,表明细胞类型和物种都是表达谱的重要特性。
实施例18.确定自溶对人细胞类型特异性基因表达的影响
现有文献对自溶时间定义为死亡与组织冷冻之间的时间,其与RNA质量无关并且对基因表达仅有轻微影响(Gupta等,2012,BMC Genomics13,26,其通过引用整体并入本文)。因为先前已经观察到死后人样品在自溶时间方面变化很大,所以先前表征了自溶时间对来自16个人类受试者的核样品中基因表达的影响以确定临床属性是否影响基因表达。
如表40所示,样品中最短的自溶时间为5.13小时,并且样品中最长的自溶时间为24小时。
表40.人样品中的自溶时间
样品
自溶(h)
样品
自溶(h)
XK
19.5
SG
12
TM
10.5
OR
8
WO
10
LT
10.5
WC
19.1
ZH
19.4
WI
16.5
KO
5.5
PK
14.8
KQ
13
VM
15.5
KE
24
WL
13.5
AI
5.13
仅观察到少数基因随着自溶时间具有显著改变的表达:所有死后人组织样品中的12个,颗粒细胞中的4个,篮细胞中的一个和神经胶质中的1个。对于具有不同自溶时间的人样品中差异表达基因的log2倍数变化。表41提供了由于所有样品的自溶时间引起的差异表达基因的分析(调整的p<0.01,baseMean>50)。
表41.所有人样品中差异表达的基因
与来自相同样品的未分选的核中的归一化表达相比,观察到Npas4在核中的表达具有最大的倍数变化。
表42提供了与具有不同自溶时间的人样品的归一化表达相比差异表达的颗粒细胞中的基因(调整的p<0.01,倍数变化>2)。
表42.颗粒细胞中差异表达的基因
基因
baseMean
log2倍数变化
p-值
p-adj
NPAS4
1337.014
0.925
2.46E-10
3.93E-06
FOSB
305.432
0.827
9.37E-09
4.98E-05
FOS
689.775
0.812
1.06E-09
8.49E-06
EGR1
1085.415
0.505
2.32E-06
9.24E-03
观察到在颗粒细胞的核中差异表达的四种基因也在来自所有样品的未分选的核中差异表达,如表42所示。
观察到抑制素βA亚基(Inhba)是篮细胞的核中唯一差异表达的基因(baseMean:6.673;log2倍数变化:0.466;p值:1.15E-08;padj:2.18E-04)。
仅观察到神经胶质中的驱动蛋白家族成员19(Kif19)(baseMean:126.311,log2倍数变化:-0.160,p值:7.76E-09,padj:1.25E-04)随自溶时间线性变化。观察到其他基因例如FosB原癌基因、AP-1转录因子亚基(FosB)(p-adj=3.51E-12)在所有3种细胞类型中随中间自溶时间的表达增加(图10)。
实施例19.确定性别对人细胞类型特异性基因表达的影响
为了检查性别对表达谱的影响,在来自雄性和雌性的样品之间比较基因表达以鉴定差异表达的基因(调整的p值<0.01,baseMean>50)。如所预期的,本文鉴定的大多数性别特异性基因位于X或Y染色体上,其中X染色体基因的表达在雌性样品中富集,并且Y染色体基因在雄性样品中富集。表43中显示了与雌性相比在雄生中表现出性别特异性差异表达(调整的p值<0.01,baseMean>50)的27种基因。
表43.表现出性别特异性差异表达的基因
这些基因中的7个位于X染色体上,14个位于Y上,并且6个位于常染色体上。在某些情况下,性别特异性基因在某些细胞类型中可能比其他细胞更差异表达。例如,观察到长基因间非蛋白质编码RNA 278(LINC00278)是雄性富集的,并且在神经胶质中甚至比在颗粒细胞或篮细胞中更差异表达。此外,观察到蛋白激酶,Y-连锁,假基因(Prky)的表达在颗粒细胞中最高,在神经胶质中处于中等水平,并且在篮细胞中低。
相反,糖原蛋白2假基因1(GYG2P1)被鉴定为在所有样品中为雄性富集基因(p=3.74E-42),尽管其在篮细胞中比颗粒细胞和神经胶质中更为雄性富集的。这不是由于来自重复的错误作图读段,因为糖原蛋白2(GYG2)仅在神经胶质中显著表达并且不表现出性别特异性表达。对含有GYG2P1的Y染色体基因座的检查揭示了跨越大区域的雄性特异性篮细胞表达,包括GYG2P1和下游约300kb。附近的基因睾丸特异性转录物Y 15(Ttty15)和泛素特异性肽酶9,Y-连锁(Usp9y)也是雄性富集的,但在来自神经胶质细胞、篮细胞和颗粒细胞的结果中未观察到是细胞类型特异性的。另外,还观察到Y-连锁的锌指蛋白(Zfy)和KDM5D是雄性富集的但不是细胞类型特异性的,并且在表43中观察到XIST是雌性富集的,但是在神经胶质细胞、篮细胞和颗粒细胞中不是细胞类型特异性的。在神经胶质细胞和颗粒细胞两者中表现出性别和细胞类型特异性表达的基因也是明显的。本文的结果提供了哺乳动物脑中性二态性细胞特异性功能的潜在来源。
仅在雄性中观察到基因转录,并且仅在星状细胞/篮细胞中观察到基因转录:具有序列相似性的家族8成员A4,假基因(Fam8a4p)、芳基硫酸酯酶D假基因1(Arsdp1)和Gyg2p1。
因此,观察到性别特异性基因表达以确认个体的已知性别,并且还观察到细胞类型特异性-性别特异性基因表达。
实施例20.确定年龄对人细胞类型特异性基因表达的影响
衰老研究中的一个基本问题是衰老是否在整个大脑中均匀发生,或者某些细胞类型比其他细胞类型更容易受到衰老的影响。为了解决这个问题,研究了年龄对三种小脑细胞类型中每一种中的基因表达的影响。如实施例1中所述使用DESeq2(Love,等(2014)Genome Biology 15,550,其通过引用整体并入本文)鉴定在所有样品中或者特异性在颗粒细胞、篮细胞或神经胶质中随着年龄差异表达的基因(调整的p<0.01,倍数变化>2)。在颗粒细胞中鉴定出具有差异表达的二百七十四种基因,在篮细胞中鉴定出139种,在神经胶质中鉴定出31种,并且在无论细胞类型的所有样品中鉴定出42种。
表44中显示了颗粒细胞中随着年龄具有显著改变的表达的274种基因的RNAseq结果。与来自所有样品的颗粒细胞的分选的核的归一化表达相比,来自每个人样品的颗粒细胞的分选的核的log2倍数变化示出在表44中。负值表示与来自所有样品的核的归一化值相比受试者的核中的表达降低,并且正值表示与来自分析的所有细胞类型的核的归一化值相比表达增加。
表44.颗粒细胞中基因的表达的Log2倍数变化
表45中显示了所有样品中颗粒细胞中差异表达(调整的p<0.01,baseMean>50)基因的RNAseq结果。
表45.所有样品中颗粒细胞中差异表达的基因
表46中显示了篮细胞中随年龄具有显著改变的表达的139种基因的RNAseq结果。与来自所有样品的颗粒细胞的分选的核的归一化表达相比,来自每个人样品的篮细胞的分选的核的log2倍数变化示出在表46中。负值表示与来自所有样品的核的归一化值相比受试者的核中的表达降低,并且正值表示与来自分析的所有细胞类型的核的归一化值相比表达增加。
表46.篮细胞中基因表达的Log2倍数变化
表47中显示了在所有样品中的篮细胞中差异表达的基因(调整的p<0.01,baseMean>50)的RNAseq结果。
表47.所有样品中篮细胞中差异表达的基因
表48中显示了神经胶质中随年龄具有显著改变的表达的31种基因的RNAseq结果。与来自所有样品的分选的神经胶质的归一化表达数据相比,来自每个人样品的神经胶质(星形胶质细胞和少突胶质细胞)的分选的核的log2倍数变化示出在表48中。负值表示与来自所有样品的核的归一化值相比受试者的核中的表达降低,并且正值表示与来自分析的所有细胞类型的核的归一化值相比表达增加。
表48.神经胶质中基因表达的Log2倍数变化
表49中显示了所有样品中神经胶质细胞中差异表达的基因(调整的p<0.01,baseMean>50)的RNAseq结果。
表49.所有样品中神经胶质中差异表达的基因
与由于本文分析的其他临床属性而具有差异表达的基因相比,结果显示由于年龄导致的表达变异较小。先前对小脑中衰老的研究发现较少基因具有差异表达,这表明与使用大块组织相比,在特定细胞类型的核中谱分析基因表达提供了高得多的灵敏度。
实施例21.由于年龄而导致的差异表达的重叠变化
如表50中所示,差异表达的基因(调整的p<0.01,baseMean>50)在表达增加的那些基因和表达随年龄减少的那些基因之间大致等分。表50显示了八组差异表达的衰老基因之间共有的基因的数目。
表50.具有重叠的表达变化的基因数目
在来自任何细胞类型的年龄上调基因和来自任何其他细胞类型的下调基因之间未发现重叠。
在多于一种细胞类型中,仅少数基因的表达随着年龄显著变化。例如,在所有细胞类型中鉴定为随年龄差异表达的42种基因在各种条件下看起来是异质的,并且当在每种细胞类型中单独测试时,这些基因中的大多数没有达到显著性(表51)。
表51.在所有样品中具有差异表达的基因
对于在三种细胞类型中随年龄具有差异表达的42种基因,颗粒细胞中的RNAseq结果示出在表52中。与来自所有样品中的颗粒细胞的分选的核的归一化表达相比,来自每个人样品的胶质细胞的分选的核的表达的log2倍数变化示出在表52中。负值表示与来自所有样品的核的归一化值相比受试者的核中的表达降低,并且正值表示与来自分析的所有细胞类型的核的归一化值相比表达增加。
表52.颗粒细胞中表达的Log2倍数变化
对于由于年龄导致的42种最差异表达基因,篮细胞中的RNAseq结果示出在表53中。与来自所有样品的未分选的核的归一化表达相比,来自每个人样品的篮细胞的分选的核的RNAseq结果的log2倍数变化示出在表53中。负值表示与来自所有样品的核的归一化值相比受试者的核中的表达降低,并且正值表示与来自分析的所有细胞类型的核的归一化值相比表达增加。
表53.篮细胞中表达的Log2倍数变化
对于在三种细胞类型中具有由于年龄导致的差异表达的42种基因,神经胶质中的RNAseq结果示出在表54中。与来自所有样品的未分选的核的归一化表达相比,来自每个人样品的神经胶质的分选的核的RNAseq结果的log2倍数变化示出在表54中。负值表示与来自所有样品的核的归一化值相比受试者的核中的表达降低,并且正值表示与来自分析的所有细胞类型的核的归一化值相比表达增加。
表54.神经胶质中表达的Log2倍数变化
这些数据表明,至少在小脑中衰老的特定分子后果根据细胞类型而不同。尽管在每种细胞类型中受衰老影响的基因存在差异,但通过这些变化改变的细胞过程仍然可能在细胞类型之间相关。
尽管含有不同的特定基因,但在所有三种细胞类型中随年龄下调的基因都富集了突触基因。例如,观察到水通道蛋白7(Aqp7)(p-adj=3.78E-9)和酸敏感离子通道亚基1(Asic1)(p-adj=4.07E-7)在颗粒细胞中随年龄而下调,分别如图11A和图11B所示。图11C显示环形导向受体2(Robo2)在神经胶质和篮细胞两者中下调。编码突触组分的基因随着年龄而下降的发现与先前的发现一致:在老年人的脑中轴突和树突萎缩((Burke,等(2006)Nat Rev Neurosci 7,第30-40页(2006);Dickstein,等(2013)Neuroscience 251,21-32;Freeman,等(2008)J.Neuropathol.Exp.Neurol.67,1205-1212;其各自通过引用整体并入本文)。然而,本文的数据扩展了这些观察结果,以确定该一般过程影响每种细胞类型中的不同基因。
为了测试该假设,对每种细胞类型中随年龄上调或下调的基因进行GO分析。没有观察到任何一组衰老上调基因的显著GO类别,也没有鉴定出来自“所有细胞类型”组的衰老上-下调基因的显著GO类别。
实施例22.确定应激对人细胞类型特异性基因表达的影响
立即早期基因例如Fos原癌基因,AP-1转录因子亚基(Fos,也称为c-FOS)和JunB原癌基因,AP-1转录因子亚基(Junb)的转录诱导与神经元激活相关,并且可以指示正常的行为响应或病理影响(Okuno,H.(2011)Neuroscience Research 69,175-186和Pérez-Cadahia,等(2011)Bjochem.Cell Biol.89,61-73,其各自通过引用整体并入本文)。尽管与这些事件相关的立即早期响应基因通常是共有的,但通过这些因子诱导的靶基因和途径反映了细胞或回路所经历的事件的性质(Duclot,等(2017)Front.Behav.Neurosci.11,717,其通过引用整体并入本文)。观察到应激响应在16个人类样品中的3个中诱导一组基因,并且不能通过种族、自溶时间、性别或年龄来解释。表55提供了与所有细胞类型的归一化表达相比所有样品的差异表达基因(调整的p<0.01,baseMean>50)。
表55.所有样品中差异表达的基因
观察到c-FOS在从16个个体中的三个(WI、VM和ZH)获得的颗粒细胞中被强烈诱导(图12)。为了进一步探索这种差异,进行差异表达(调整的p<0.01,baseMean>50)分析,以确定这三个个体中与其他个体相比显著上调或下调的另外基因,即进行三个fos+个体相对于其他13个样品之间的颗粒细胞的差异基因表达分析。在来自个体WI、VM和TM的颗粒细胞中显示出非常强的响应,其特征在于诱导224种基因并减少10种基因的表达,如表56中所示。
表56.颗粒细胞中差异表达的基因
在神经胶质细胞中存在包含136种差异诱导基因(调整的p<0.01,baseMean>50)的重叠但较弱的响应。结果显示在表57中。
表57.神经胶质中差异表达的基因
神经胶质中这些基因的诱导不是由于颗粒细胞的污染导致的,因为神经胶质数据中不存在高度表达的颗粒细胞标志物(例如FAT2)。这是有趣的,因为通过谷氨酸盐在神经胶质中诱导c-FOS表达被认为通过与培养的颗粒神经元中通过增加的活性诱导的机制不同的机制发生(Edling,等(2007)Glja 55,328-340,其通过引用整体并入本文)。在篮细胞数据中只有两种差异表达的基因是明显的:热休克蛋白家族A(Hsp70)成员1A(HSPA1A)(BaseMean:102.303,log2倍数变化:-3.234,p-值:1.07E-12,padj:1.06E-08)和环指蛋白122(RNF122)(Base mean:96.812,log2倍数变化:-1.552,p-值:4.20E-06,padj:0.008)。
观察到应激响应在16个样品中的3个中诱导一组基因,并且不能通过种族、自溶时间、性别或年龄来解释。在图13A中示出了活性调节的细胞骨架相关蛋白(Arc)、早期生长响应1(Egr1)、c-Fos、FosB、Jun原癌基因、AP-1转录因子亚基(Jun)、JunB和JunD原癌基因、AP-1转录因子亚基(JunD)的基因表达。观察到fos基因和应激相关基因的诱导是微小细胞类型特异性的,因为其主要发生在颗粒细胞中,尽管其也发生在神经胶质中。在星状细胞中几乎没有观察到表达变化。
观察到约355种基因在三个颗粒细胞样品中诱导,而观察到25种基因被下调。这些基因中的许多是标记神经元活性的中间早期基因,但也有许多被诱导的长期应激响应基因,如图13B所示。受影响的基因组的实例包括参与以下的那些:细胞代谢过程的调节、大分子的正调节、对未折叠蛋白的响应、对拓扑错误蛋白的响应、蛋白质折叠、蛋白质重折叠、细胞对热的响应调节、细胞凋亡过程的调节、生物过程的正调节和对化学刺激的响应。
应激响应基因,例如神经胶质中活化的星形胶质细胞标志物GFAP、S100B、Nes和Musashi RNA结合蛋白1(Msi1)显示在图13C中。在表达中观察到的唯一显著变化是在fos-核中的GFAP中。
观察到样品WI、VM和ZH具有在神经胶质和颗粒神经元中诱导的fos和应激响应基因,并且在星状神经元中为较小程度。观察到具有fos基因的诱导的基因表达的三个个体在其临床病史中似乎没有多少共同点。数据显示该应激响应途径的可再现激活,其提供与疾病相关的生物学的细节。
鉴于颗粒细胞数据中明显的稳健响应,进行GO分析以确定这些神经元中的224种诱导基因是否对于特定的功能类别富集。鉴定了fos+个体中上调基因的显著富集的GO类别,揭示了参与应激响应和蛋白质折叠的基因的富集。该分析揭示了与对外部刺激的响应、蛋白质折叠/重折叠、细胞凋亡、对应激的转录响应、ATP酶活性和RNA剪接/代谢相关的类别,如表58所示。
表58.颗粒细胞中显著上调的基因的基因本体论结果
立即早期基因表达的分析表明它们的诱导也是选择性的。例如,发生了EGR1、FOS和FOSB的诱导,但ARC的表达(良好表征的立即早期基因)没有明显差异(图12)。此外,虽然例如c-FOS的立即早期基因的表达可以在对例如缺血性中风的损伤的响应中被诱导,但没有发现神经胶质基因如GFAP和S100B的诱导,这些基因响应于中风和对脑的其他形式的损伤而标记星形胶质细胞激活(Choudhury,等(2016)Neurobiology of Disease 85,234-244;Ding,S.(2014)Neural Regen Res 9,2048-2052;Dirnagl,等(1999)Trends inNeurosciences 22,391-397;Kajihara,等(2001)Brain Research 909,92-101;Pekny,M.,等(2005)Glia 50,427-434;其各自通过引用并入本文)。
最后,对临床记录的检查未能揭示图12中的这三个个体与13个其他对照供体相区别的特征(性别、年龄、死亡原因)。尽管这些分子事件的一个或多个原因仍然模糊不清,但在选定的死后人脑样品中发现这种强烈且高度可再现的应激响应表明存在隐匿的临床疾患,并表明使用本文描述的细胞谱分析技术来分析特定细胞类型可用于发现与人类病理生理学疾患相关的途径和生物标志物。
实施例23.用RNA或DNA探针对核进行染色和分选
抗体通常具有非特异性靶标,并且可成为将本文所述的细胞谱分析技术扩展到更多细胞类型的限速。使用抗体进行标记的替代方法是使用针对细胞类型特异性核酸转录物的RNA探针。RNA探针比抗体更快并且更容易合成。针对两类转录物设计RNA探针。第一类是染色体相关转录物(CAT)-在合成时保留在染色体上的转录物。第二类核酸转录物是在与核相邻的ER中丰富的聚A+转录物。为了表征个体之间的可变性,对来自人脑的一些区域的未分选的核产生基因表达谱,然后鉴定候选CAT和聚A+转录物。在组织切片中使用原位杂交,通过解剖学和形态学鉴定描绘特定细胞类型的基因。针对这些候选物的抗体或RNA探针用于标记和分选来自人细胞类型的核,而不需要来自小鼠数据的先验知识来确定整个群体中基因表达的变异量。
CAT在合成的两个染色***点处具有两个斑点的独特标记图案,使用原位杂交观察到其具有低本底的高度特异性。图14提供了CAT的RNAseq结果。A2m是伯格曼神经胶质特异性的CAT,Itpr1是浦肯野细胞特异性的CAT,并且Fat2是颗粒细胞特异性的CAT。因此,可以从来自所有小脑核的RNAseq谱检测细胞类型特异性CAT。基于使用RNA探针标记的CAT和聚A+转录物的原位杂交结果以及用于FACS的标记核的广泛知识,可以针对任何细胞类型设计RNA探针。
等同物和范围
本领域技术人员将认识到或仅使用常规的实验就能够确定根据本文所述的本发明的具体实施方案的许多等同物。本发明的范围不限于以上描述,而是如所附权利要求中所述。
在权利要求中,未用数量词限定的名词可以表示一个或多于一个,除非相反地指出或者从上下文中显而易见。在组的一个或多个成员之间包括“或”的权利要求或描述被认为满足以下:组中一个、多于一个或所有组成员在给定产品或过程中存在、使用或以其他方式涉及,除非相反地指出或者从上下文中显而易见。本发明包括其中组的恰好一个成员在给定产品或过程中存在、使用或以其他方式涉及的实施方案。本发明包括其中多于一个或所有组成员在给定产品或过程中存在、使用或以其他方式涉及的实施方案。
还应注意,术语“包含”旨在是开放的并且允许但不要求包括额外的元件或步骤。当在本文中使用术语“包含”时,因此也涵盖和公开了术语“由......组成”。
在给出范围的情况下,包括端点。此外,应理解,除非另外指出或本领域普通技术人员从上下文和理解中另外显而易见的,否则表示为范围的值在本发明的不同实施方案中可以假设所述范围内的任何特定值或子范围,直至范围下限的十分之一单位,除非上下文另有明确规定。
另外,应理解,落入现有技术内的本发明的任何特定实施方案可以明确地从任何一个或多个权利要求中排除。由于这些实施方案被认为是本领域普通技术人员已知的,因此即使本文中未明确阐述排除,也可以排除它们。本发明组合物(例如,任何抗生素、治疗或活性成分;任何生产方法;任何使用方法等)的任何特定实施方案可以出于任何原因从任何一个或多个权利要求中排除,无论是否与现有技术的存在有关。
应当理解,已经使用的词语是描述性词语而不是限制性词语,并且可以在所附权利要求的范围内进行改变而不在较宽的方面脱离本发明的真实范围和精神。
虽然已经相对于所描述的若干实施方案以一定长度和某些特定性描述了本发明,但是并不意图将本发明限制于任何这样的细节或实施方案或任何特定实施方案,而是应该是在参考所附权利要求的前提下鉴于现有技术来提供对这些权利要求的尽可能广泛的解释,因此以有效地包含本发明的预期范围。
- 上一篇:一种医用注射器针头装配设备
- 下一篇:相对于相匹配的正常cfRNA的肿瘤