用于加工核酸分子的方法

文档序号:1803719 发布日期:2021-11-05 浏览:13次 >En<

阅读说明:本技术 用于加工核酸分子的方法 (Method for processing nucleic acid molecules ) 是由 扎哈拉·卡米拉·贝尔霍钦 杰森·贝尔 杰拉尔德·萨皮达 卡特里娜·沙利文-毕比 于 2020-02-12 设计创作,主要内容包括:本公开提供了用于加工核酸分子的方法、系统和试剂盒。一种方法可包括在分区(例如,液滴或孔)内提供模板核酸片段(例如,在细胞、细胞珠粒或细胞核内)并使所述模板核酸片段经受一个或多个过程,包括条形码化过程和单一引物延伸或扩增过程。然后可将经加工的模板核酸片段从所述分区回收并经受进一步扩增以提供用于后续测序分析的材料。本文提供的方法可允许同时加工和分析源自同一细胞、细胞珠粒或细胞核的DNA和RNA分子。(The present disclosure provides methods, systems, and kits for processing nucleic acid molecules. A method may include providing a template nucleic acid fragment (e.g., within a cell, cell bead, or cell nucleus) within a partition (e.g., a droplet or well) and subjecting the template nucleic acid fragment to one or more processes, including a barcoding process and a single primer extension or amplification process. The processed template nucleic acid fragments can then be recovered from the partitions and subjected to further amplification to provide material for subsequent sequencing analysis. The methods provided herein can allow simultaneous processing and analysis of DNA and RNA molecules derived from the same cell, cell bead, or nucleus.)

用于加工核酸分子的方法

交叉引用

本申请要求2019年2月12日提交的美国临时申请号62/804,644的权益,所述申请以引用的方式完全并入本文。

背景技术

可出于各种目的,如检测、鉴定、定量和表征样品内的部分的类型,对样品进行加工。所述样品可以是生物样品。可对生物样品进行加工,如用于检测疾病(例如癌症)或鉴定特定物质。存在各种用于加工样品的方法,如聚合酶链反应(PCR)和测序。

生物样品可在各种反应环境,如分区内进行加工。分区可以是孔或液滴。液滴或孔可用于以使得能够分配生物样品并单独加工的方式来加工生物样品。例如,此类液滴可与其它液滴流体分离,从而使得能够精确控制液滴中的相应环境。

分区中的生物样品可经受各种过程,如化学过程或物理过程。分区中的样品可经受加热或冷却,或化学反应,诸如以获得可定性或定量加工的物质。

生物样品可包含一种或多种核酸分子,如一种或多种脱氧核糖核酸(DNA)分子和/或一种或多种核糖核酸(RNA)分子。加工这种生物样品的方法可根据其中包含的核酸分子的类型而变化。

发明内容

本公开提供用于串联加工多种不同类型的核酸分子的方法、系统和试剂盒。本文提供的方法可允许分析源自相同细胞或细胞珠粒或其组分(例如,细胞核)的脱氧核糖核酸(DNA)分子和核糖核酸(RNA)分子。对不同类型的核酸分子的分析可同时或几乎同时进行。本文提供的方法可包括使用分配方案,其中材料(例如,不同类型的靶核酸分子,如包含在细胞、细胞珠粒或细胞核内的靶核酸分子)分布在多个分区,如多个液滴或孔之间。材料(例如,靶核酸分子)可与一种或多种试剂共同分配以促进靶核酸分子的加工,所述试剂如一种或多种酶、珠粒(例如,包含核酸条形码分子的珠粒)、引物、寡核苷酸、溶解剂或透化剂、缓冲剂或其他试剂。本文提供的方法可包括在使条形码化核酸产物经受一个或多个扩增过程(例如,聚合酶链反应(PCR),其可任选地批量进行)之前,产生对应于各种不同的靶核酸分子(例如,DNA和RNA分子)中的每一者的条形码化核酸产物(例如,在多个分区中的一个分区内)。

靶核酸分子(例如,DNA和RNA分子)最初可包含在细胞、细胞珠粒或细胞核中。因此,本文提供的方法提供了允许对来自目标单细胞、细胞珠粒和细胞核的核酸分子进行测序的样品制备技术。

在真核基因组中,染色体DNA将自身缠绕在组蛋白(即“核小体”)周围,从而形成称为染色质的复合物。染色质的紧密或松散堆积有助于控制基因表达。紧密堆积的染色质(“封闭染色质”)通常不允许基因表达,而染色质的更松散堆积的可接近区(“开放染色质”)与基因产物的活性转录相关。用于探测全基因组DNA可接近性的方法已被证明在鉴定各种细胞类型的调控元件和定量导致基因表达激活或阻抑的变化方面极为有效。

一种这样的方法是使用高通量测序的转座酶可接近染色质测定(ATAC-seq)。ATAC-seq方法使用人工转座子探测DNA可接近性,所述人工转座子将特定序列插入染色质的可接近区中。由于转座酶只能将序列插入染色质的未由转录因子和/或核小体结合的可接近区中,因此测序读段可用于推断染色质可接近性增加的区域。

ATAC-seq方法的传统方法需要大量细胞,批量加工细胞,并且产生代表整个细胞群体的数据,但缺乏关于细胞群体中固有存在的细胞间变异的信息(参见,例如Buenrostro,等人,Curr.Protoc.Mol.Biol.,2015年1月5日;21.29.1–21.29.9)。虽然已经开发了单细胞ATAC-seq(scATAC-seq)方法,但它们受到一些限制。例如,利用样品汇集、细胞索引和细胞分选的scATAC-seq方法(参见,例如,Cusanovich,等人,Science,2015年5月22日;348(6237):910-14)导致与任何单细胞相关的高度可变性和较少读段。其他利用可编程微流体装置来分离单细胞并在纳升反应室中执行scATAC-seq的scATAC-seq方法(参见,例如,Buenrostro,等人,Nature,2015年7月23日;523(7561):486-90)受测定通量的限制,并且可能不能在与临床决策相容的时间尺度上生成个人表观基因组谱。

在一个方面,本公开提供了一种用于加工核酸样品的方法,所述方法包括:(a)在多个分区中的一个分区内提供包含脱氧核糖核酸(DNA)分子和核糖核酸(RNA)分子的生物颗粒,其中所述分区包含(i)第一核酸条形码分子,(ii)第二核酸条形码分子,和(iii)夹板序列,其中所述第一核酸条形码分子和所述第二核酸条形码分子包含共有条形码序列,其中所述第一核酸条形码分子包含悬突序列,并且其中所述夹板序列包含与所述DNA分子互补的序列和与所述悬突序列互补的序列;(b)在所述分区内,使用所述DNA分子、所述第一核酸条形码分子和所述夹板序列产生对应于所述DNA分子的第一条形码化核酸产物,并且使用所述RNA分子和所述第二核酸条形码分子产生对应于所述RNA分子的第二条形码化核酸产物,其中所述第一条形码化核酸产物和所述第二条形码化核酸产物包含所述共有条形码序列或其互补序列;以及(c)从所述分区回收所述第一条形码化核酸产物和所述第二条形码化核酸产物。

在一些实施方案中,所述生物颗粒是细胞、细胞珠粒或细胞核。在一些实施方案中,所述方法还包括在所述分区内溶解或透化所述生物颗粒以接近其中的DNA分子和RNA分子。

在一些实施方案中,所述方法还包括,在(a)之前,用转座酶加工所述核酸样品的开放染色质结构以产生所述DNA分子。在一些实施方案中,所述转座酶包含在转座酶-核酸复合物中,所述转座酶-核酸复合物包含(i)包含第一转座子末端序列和第一测序引物或其部分或其互补序列的第一核酸分子,和(ii)包含第二转座子末端序列和第二测序引物或其部分或其互补序列的第二核酸分子。在一些实施方案中,所述第一转座子末端序列和所述第二转座子末端序列相同,并且其中所述第一转座子末端序列和所述第二转座子末端序列各自与互补序列杂交。

在一些实施方案中,产生所述第一条形码化核酸产物包括(i)使所述DNA分子和所述夹板序列经受足以使所述DNA分子的序列与所述夹板序列杂交的条件,和(ii)使所述第一核酸条形码分子和所述夹板序列经受足以使所述第一核酸条形码分子的悬突序列与所述夹板序列杂交的条件。在一些实施方案中,所述夹板序列与所述分区外的DNA分子的序列杂交。在一些实施方案中,所述方法还包括将所述第一核酸条形码分子连接至所述DNA分子。

在一些实施方案中,所述第一核酸条形码分子包含流动池序列或其互补序列;条形码序列;测序引物或其部分;独特分子标识符序列;或它们的组合。

在一些实施方案中,所述DNA分子包含一个或多个缺口,并且还包括,在(c)之前,使所述DNA分子经受延伸过程以填充所述一个或多个缺口。

在一些实施方案中,所述第二核酸条形码分子包含独特分子标识符序列、条形码序列、测序引物或其部分,或它们的组合。

在一些实施方案中,所述方法还包括,在(b)之前,在所述分区内,逆转录所述RNA分子以提供互补DNA(cDNA)分子。在一些实施方案中,在逆转录所述RNA分子之前,使所述第二核酸条形码分子与所述RNA分子的前体的序列杂交。在一些实施方案中,所述前体包含多聚A序列,并且其中所述第二核酸条形码分子包含被配置为与所述多聚A序列杂交的多聚T序列。在一些实施方案中,所述方法还包括将另外序列附加到所述cDNA分子上,其中所述另外序列是多聚(C)序列。在一些实施方案中,所述方法还包括使所述cDNA分子与模板转换寡核苷酸在足以使所述模板转换寡核苷酸与所述cDNA分子杂交的条件下接触,其中所述模板转换寡核苷酸与所述cDNA分子的另外序列杂交。在一些实施方案中,所述方法还包括延伸所述cDNA分子以产生延伸的cDNA分子,所述延伸的cDNA分子包含与所述模板转换寡核苷酸的序列互补的序列。在一些实施方案中,所述模板转换寡核苷酸包含测序引物或其部分,或其互补序列;独特分子标识符序列,或其互补序列;或它们的组合。在一些实施方案中,所述模板转换寡核苷酸是第二核酸条形码分子,并且其中所述延伸的cDNA分子是第二条形码化核酸产物。

在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子包含共有核酸序列。

在一些实施方案中,所述分区是多个液滴中的一个液滴。在一些实施方案中,所述分区是液滴并且其中(c)包括使液滴破坏或破碎。

在一些实施方案中,所述方法还包括,在(c)之后,使用(i)所述第一条形码化核酸产物来产生第一多种扩增产物和(ii)所述第二条形码化核酸产物来产生第二多种扩增产物。在一些实施方案中,产生所述第一多种扩增产物和所述第二多种扩增产物包括使用所述第一条形码化核酸产物或所述第二条形码化核酸产物进行一个或多个核酸扩增反应。在一些实施方案中,进行所述一个或多个核酸扩增反应包括将一个或多个流动池序列附接至所述第一条形码化核酸产物或所述第二条形码化核酸产物或其衍生物。

在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子偶联至珠粒。在一些实施方案中,所述珠粒是凝胶珠粒。在一些实施方案中,所述第一核酸条形码分子通过第一不稳定部分偶联至所述珠粒,并且所述第二核酸条形码分子通过第二不稳定部分偶联至所述珠粒。在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子可释放地偶联至所述珠粒。在一些实施方案中,所述第一核酸条形码分子在施加第一刺激时可从所述珠粒释放,并且所述第二核酸条形码分子在施加第二刺激时可从所述珠粒释放。

在另一个方面,本公开提供了一种用于加工核酸样品的方法,所述方法包括:(a)在多个分区中的一个分区内提供包含脱氧核糖核酸(DNA)分子和核糖核酸(RNA)分子的生物颗粒,其中所述分区包含第一核酸条形码分子和第二核酸条形码分子,其中所述第一核酸条形码分子和所述第二核酸条形码分子包含共有条形码序列;(b)在所述分区内,产生(i)来自所述DNA分子和所述第一核酸条形码分子的第一条形码化核酸产物和(ii)来自所述RNA分子和所述第二核酸条形码分子的第二条形码化核酸产物,其中所述第一条形码化核酸产物和所述第二条形码化核酸产物包含所述共有条形码序列或其互补序列;(c)从所述分区中回收所述第一条形码化核酸产物和所述第二条形码化核酸产物;(d)加工所述第一条形码化核酸产物以产生包含dA尾的经加工核酸产物;以及(e)使用(i)所述经加工核酸产物来产生第一多种扩增产物和(ii)所述第二条形码化核酸产物来产生第二多种扩增产物。

在一些实施方案中,所述生物颗粒是细胞、细胞珠粒或细胞核。在一些实施方案中,所述方法还包括在所述分区内溶解或透化所述生物颗粒以接近其中的DNA分子和RNA分子。

在一些实施方案中,所述方法还包括,在(a)之前,用转座酶加工所述核酸样品的开放染色质结构以产生所述DNA分子。在一些实施方案中,所述转座酶包含在转座酶-核酸复合物中,所述转座酶-核酸复合物包含(i)包含第一转座子末端序列和第一测序引物或其部分或其互补序列的第一核酸分子,和(ii)包含第二转座子末端序列和第二测序引物或其部分或其互补序列的第二核酸分子。在一些实施方案中,所述第一转座子末端序列和所述第二转座子末端序列相同,并且其中所述第一转座子末端序列和所述第二转座子末端序列各自与互补序列杂交。

在一些实施方案中,所述第一核酸条形码分子包含测序引物或其部分,或其互补序列。在一些实施方案中,(b)包括使所述DNA分子经受足以使所述第一核酸条形码分子与所述DNA分子杂交的条件。在一些实施方案中,所述方法还包括(i)延伸与所述DNA分子杂交的第一核酸条形码分子和(ii)将所述第一核酸条形码分子连接至所述DNA分子以产生所述第一条形码化核酸产物。

在一些实施方案中,所述方法还包括将所述第一核酸条形码分子连接至所述DNA分子。

在一些实施方案中,所述第一核酸条形码分子包含流动池序列或其互补序列;条形码序列;独特分子标识符序列;或它们的组合。

在一些实施方案中,所述DNA分子包含一个或多个缺口,并且还包括,在(c)之前,使所述DNA分子经受延伸过程以填充所述一个或多个缺口。

在一些实施方案中,所述第二核酸条形码分子包含独特分子标识符序列、条形码序列、测序引物或其部分,或它们的组合。

在一些实施方案中,所述方法还包括,在(b)之前,在所述分区内,逆转录所述RNA分子以提供互补DNA(cDNA)分子。在一些实施方案中,在逆转录所述RNA分子之前,使所述第二核酸条形码分子与所述RNA分子的前体的序列杂交。在一些实施方案中,所述前体包含多聚A序列,并且其中所述第二核酸条形码分子包含被配置为与所述多聚A序列杂交的多聚T序列。在一些实施方案中,所述方法还包括将另外序列附加到所述cDNA分子上,其中所述另外序列是多聚(C)序列。在一些实施方案中,所述方法还包括使所述cDNA分子与模板转换寡核苷酸在足以使所述模板转换寡核苷酸与所述cDNA分子杂交的条件下接触,其中所述模板转换寡核苷酸与所述cDNA分子的另外序列杂交。在一些实施方案中,所述方法还包括延伸所述cDNA分子以产生延伸的cDNA分子,所述延伸的cDNA分子包含与所述模板转换寡核苷酸的序列互补的序列。在一些实施方案中,所述模板转换寡核苷酸包含测序引物或其部分,或其互补序列;独特分子标识符序列,或其互补序列;或它们的组合。在一些实施方案中,所述模板转换寡核苷酸是第二核酸条形码分子,并且其中所述延伸的cDNA分子是第二条形码化核酸产物。在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子包含共有核酸序列。

在一些实施方案中,所述分区是多个液滴中的一个液滴。在一些实施方案中,所述分区是液滴并且其中(c)包括使液滴破坏或破碎。

在一些实施方案中,(e)包括使用所述第一条形码化核酸产物或所述第二条形码化核酸产物进行一个或多个核酸扩增反应。在一些实施方案中,(e)包括将一个或多个流动池序列附接至所述第一条形码化核酸产物或所述第二条形码化核酸产物或其衍生物。

在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子偶联至珠粒。在一些实施方案中,所述珠粒是凝胶珠粒。在一些实施方案中,所述第一核酸条形码分子通过第一不稳定部分偶联至所述珠粒,并且所述第二核酸条形码分子通过第二不稳定部分偶联至所述珠粒。在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子可释放地偶联至所述珠粒。在一些实施方案中,所述第一核酸条形码分子在施加第一刺激时可从所述珠粒释放,并且所述第二核酸条形码分子在施加第二刺激时可从所述珠粒释放。

在另一方面,本公开提供了一种用于加工核酸样品的方法,所述方法包括:(a)在多个分区中的一个分区内提供包含脱氧核糖核酸(DNA)分子和核糖核酸(RNA)分子的生物颗粒,其中所述分区包含第一核酸条形码分子和第二核酸条形码分子,其中所述第一核酸条形码分子和所述第二核酸条形码分子包含共有条形码序列,并且其中所述DNA分子包含在第一端的第一发夹部分和在第二端的第二发夹部分;(b)在所述分区内,产生(i)来自所述DNA分子和所述第一核酸条形码分子的第一条形码化核酸产物和(ii)来自所述RNA分子和所述第二核酸条形码分子的第二条形码化核酸产物,其中所述第一条形码化核酸产物和所述第二条形码化核酸产物包含所述共有条形码序列或其互补序列;(c)从所述分区中回收所述第一条形码化核酸产物和所述第二条形码化核酸产物;以及(d)使用(i)所述第一条形码化核酸产物来产生第一多种扩增产物和(ii)所述第二条形码化核酸产物来产生第二多种扩增产物。

在一些实施方案中,所述生物颗粒是细胞、细胞珠粒或细胞核。在一些实施方案中,所述方法还包括在所述分区内溶解或透化所述生物颗粒以接近其中的DNA分子和RNA分子。

在一些实施方案中,所述方法还包括在(a)之前,用转座酶加工所述核酸样品的开放染色质结构以产生所述DNA分子。在一些实施方案中,所述转座酶包含在转座酶-核酸复合物中,所述转座酶-核酸复合物包含(i)包含第一转座子末端序列和第一测序引物或其部分或其互补序列的第一核酸分子,和(ii)包含第二转座子末端序列和第二测序引物或其部分或其互补序列的第二核酸分子。在一些实施方案中,所述第一转座子末端序列和所述第二转座子末端序列相同,并且其中所述第一转座子末端序列和所述第二转座子末端序列各自与互补序列杂交。

在一些实施方案中,所述第一核酸条形码分子包含测序引物或其部分,或其互补序列。在一些实施方案中,(b)包括使所述DNA分子经受足以使所述第一核酸条形码分子与所述DNA分子杂交的条件。在一些实施方案中,所述方法还包括(i)延伸与所述DNA分子杂交的第一核酸条形码分子和(ii)将所述第一核酸条形码分子连接至所述DNA分子以产生所述第一条形码化核酸产物。

在一些实施方案中,所述方法还包括将所述第一核酸条形码分子连接至所述DNA分子。

在一些实施方案中,所述第一核酸条形码分子包含流动池序列或其互补序列;条形码序列;独特分子标识符序列;或它们的组合。

在一些实施方案中,所述DNA分子包含一个或多个缺口,并且还包括,在(c)之前,使所述DNA分子经受延伸过程以填充所述一个或多个缺口。

在一些实施方案中,所述第二核酸条形码分子包含独特分子标识符序列、条形码序列、测序引物或其部分,或它们的组合。

在一些实施方案中,所述方法还包括,在(b)之前,在所述分区内,逆转录所述RNA分子以提供互补DNA(cDNA)分子。在一些实施方案中,在逆转录所述RNA分子之前,使所述第二核酸条形码分子与所述RNA分子的前体的序列杂交。在一些实施方案中,所述前体包含多聚A序列,并且其中所述第二核酸条形码分子包含被配置为与所述多聚A序列杂交的多聚T序列。在一些实施方案中,所述方法还包括将另外序列附加到所述cDNA分子上,其中所述另外序列是多聚(C)序列。在一些实施方案中,所述方法还包括使所述cDNA分子与模板转换寡核苷酸在足以使所述模板转换寡核苷酸与所述cDNA分子杂交的条件下接触,其中所述模板转换寡核苷酸与所述cDNA分子的另外序列杂交。在一些实施方案中,所述方法还包括延伸所述cDNA分子以产生延伸的cDNA分子,所述延伸的cDNA分子包含与所述模板转换寡核苷酸的序列互补的序列。在一些实施方案中,所述模板转换寡核苷酸包含测序引物或其部分,或其互补序列;独特分子标识符序列,或其互补序列;或它们的组合。在一些实施方案中,所述模板转换寡核苷酸是第二核酸条形码分子,并且其中所述延伸的cDNA分子是第二条形码化核酸产物。

在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子包含共有核酸序列。

在一些实施方案中,所述分区是多个液滴中的一个液滴。在一些实施方案中,所述分区是液滴并且其中(c)包括使液滴破坏或破碎。

在一些实施方案中,(e)包括使用所述第一条形码化核酸产物或所述第二条形码化核酸产物进行一个或多个核酸扩增反应。在一些实施方案中,(e)包括将一个或多个流动池序列附接至所述第一条形码化核酸产物或所述第二条形码化核酸产物或其衍生物。

在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子偶联至珠粒。在一些实施方案中,所述珠粒是凝胶珠粒。在一些实施方案中,所述第一核酸条形码分子通过第一不稳定部分偶联至所述珠粒,并且所述第二核酸条形码分子通过第二不稳定部分偶联至所述珠粒。在一些实施方案中,所述第一核酸条形码分子和所述第二核酸条形码分子可释放地偶联至所述珠粒。在一些实施方案中,所述第一核酸条形码分子在施加第一刺激时可从所述珠粒释放,并且所述第二核酸条形码分子在施加第二刺激时可从所述珠粒释放。

在一个方面,本公开提供了一种用于加工核酸样品的方法,所述方法包括:(a)提供多个分区中的一个分区,其中所述分区包含源自所述核酸样品的脱氧核糖核酸(DNA)分子;(b)转录所述DNA分子以产生核糖核酸(RNA)分子;(c)逆转录所述RNA分子以产生互补DNA(cDNA)分子;以及(d)从所述分区中回收所述cDNA分子或其衍生物。

在一些实施方案中,所述分区是多个孔中的一个孔。

在一些实施方案中,所述分区是多个液滴中的一个液滴。

在一些实施方案中,所述方法还包括,在(a)之前,用转座酶加工所述核酸样品的开放染色质结构以产生所述DNA分子。在一些实施方案中,所述转座酶是Tn5转座酶。在一些实施方案中,所述DNA分子包含一个或多个缺口。在一些实施方案中,使用逆转录酶填充所述一个或多个缺口。在一些实施方案中,所述加工还包括将核酸分子附接至所述核酸样品,其中所述核酸分子包含具有第一子序列和第二子序列的序列,其中所述第一子序列与所述第二子序列互补。在一些实施方案中,所述核酸分子是发夹核酸分子。在一些实施方案中,所述核酸分子包含启动子序列。在一些实施方案中,所述启动子序列是T7启动子序列。在一些实施方案中,所述核酸分子附接至所述核酸样品的3’端。

在一些实施方案中,(b)包括使用T7聚合酶转录所述DNA分子。

在一些实施方案中,(c)包括将多聚(C)序列附加到所述RNA分子上。

在一些实施方案中,所述方法还包括在(c)之后,将核酸条形码分子附接至所述cDNA分子的5’端。在一些实施方案中,所述核酸条形码分子包含独特分子标识符序列。在一些实施方案中,所述核酸条形码分子包含条形码序列。在一些实施方案中,所述核酸条形码分子包含引物序列。在一些实施方案中,所述核酸条形码分子包含捕获序列。在一些实施方案中,所述捕获序列包含多聚(G)序列。

在一些实施方案中,所述核酸条形码分子偶联至珠粒。在一些实施方案中,所述珠粒是凝胶珠粒。在一些实施方案中,所述核酸条形码分子可释放地偶联至所述珠粒。在一些实施方案中,所述核酸条形码分子在施加刺激后可从所述珠粒释放。在一些实施方案中,所述刺激是化学刺激。在一些实施方案中,所述化学刺激是还原剂。

在一些实施方案中,所述cDNA分子是单链cDNA分子。在一些实施方案中,所述方法还包括使用所述单链cDNA分子来产生双链cDNA分子。在一些实施方案中,所述双链cDNA分子是使用5’封闭引物和Klenow片段产生的。在一些实施方案中,所述Klenow片段不具有核酸外切酶活性。

在一些实施方案中,所述cDNA分子包含偶联至RNA序列的DNA序列,并且其中在(d)之后,用RNA酶加工所述cDNA分子以消化所述RNA序列或从所述cDNA分子中除去所述RNA序列。

在一些实施方案中,所述分区是液滴,并且其中(d)包括使液滴破坏或破碎。

在一些实施方案中,所述方法还包括在(d)之后,将一个或多个流动池序列附接至所述cDNA分子或其衍生物。在一些实施方案中,所述一个或多个流动池序列通过一种或多种核酸扩增反应附接。

在一些实施方案中,所述方法还包括在(d)之后,将引物附接至所述cDNA分子或其衍生物的3’端。在一些实施方案中,所述cDNA分子包含A尾并且其中所述引物附接至所述A尾。

在一些实施方案中,所述核酸样品来自细胞或细胞核。在一些实施方案中,所述细胞或细胞核位于所述分区中。在一些实施方案中,所述细胞或细胞核包含所述DNA分子。在一些实施方案中,所述细胞或细胞核还包含第二核糖核酸(RNA)分子。在一些实施方案中,所述方法还包括溶解或透化所述细胞或细胞核以接近其中的DNA分子和/或第二RNA分子。

在一些实施方案中,所述方法还包括在(a)之前,加工信使RNA(mRNA)分子以提供所述第二RNA分子。在一些实施方案中,所述方法还包括,在所述分区内,逆转录所述第二RNA分子以提供另外cDNA分子。在一些实施方案中,在逆转录所述第二RNA分子之前,使引物分子与所述第二RNA分子的前体的序列杂交。在一些实施方案中,所述前体包含多聚A序列,并且其中所述引物分子包含被配置为与所述多聚A序列杂交的多聚T序列。在一些实施方案中,所述引物分子包含独特分子标识符序列。在一些实施方案中,所述引物分子包含条形码序列。在一些实施方案中,所述引物分子包含测序引物或其部分。在一些实施方案中,所述引物分子偶联至另外珠粒。在一些实施方案中,所述另外珠粒是凝胶珠粒。在一些实施方案中,所述引物分子通过不稳定部分偶联至另外珠粒。在一些实施方案中,所述引物分子可释放地偶联至所述另外珠粒。在一些实施方案中,所述引入分子在施加刺激后可从所述另外珠粒释放。在一些实施方案中,所述刺激是化学刺激。在一些实施方案中,所述化学刺激是还原剂。

在一些实施方案中,所述方法还包括将另外序列附加到所述另外cDNA分子上。在一些实施方案中,所述另外序列包含多聚(C)序列。在一些实施方案中,所述方法还包括在足以使模板转换寡核苷酸与所述另外cDNA分子杂交的条件下使所述另外cDNA分子与所述模板转换寡核苷酸接触。在一些实施方案中,所述模板转换寡核苷酸与所述另外cDNA分子的另外序列杂交。在一些实施方案中,所述方法还包括延伸所述另外cDNA分子以产生延伸的cDNA分子,所述延伸的cDNA分子包含与所述模板转换寡核苷酸的序列互补的序列。在一些实施方案中,所述模板转换寡核苷酸包含测序引物或其互补序列。在一些实施方案中,所述模板转换寡核苷酸包含条形码序列或其互补序列。在一些实施方案中,所述模板转换寡核苷酸包含独特分子标识符序列或其互补序列。在一些实施方案中,所述模板转换寡核苷酸偶联至另一珠粒。在一些实施方案中,所述另一珠粒是凝胶珠粒。在一些实施方案中,所述模板转换寡核苷酸通过不稳定部分偶联至另一珠粒。在一些实施方案中,所述模板转换寡核苷酸可释放地偶联至所述另一珠粒。在一些实施方案中,所述模板转换寡核苷酸在施加刺激后可从所述另一珠粒释放。在一些实施方案中,所述刺激是化学刺激。在一些实施方案中,所述化学刺激是还原剂。

在一些实施方案中,所述模板转换寡核苷酸是另一核酸条形码分子,并且其中所述延伸的cDNA分子是条形码化核酸产物。在一些实施方案中,所述另一核酸条形码分子包含流动池序列或其互补序列。在一些实施方案中,所述方法还包括使所述延伸的cDNA分子与另外核酸条形码分子在足以使所述另外核酸条形码分子与所述延伸的cDNA分子的序列杂交的条件下接触。在一些实施方案中,所述方法还包括使与所述另外核酸条形码分子杂交的延伸的cDNA分子经受延伸反应以产生条形码化核酸产物,所述条形码化核酸产物包含与所述延伸的cDNA分子的序列互补的序列。在一些实施方案中,所述另外核酸条形码分子包含测序引物或其部分,或其互补序列。在一些实施方案中,所述另外核酸条形码分子包含流动池序列或其互补序列。在一些实施方案中,所述另外核酸条形码分子包含条形码序列或其互补序列。在一些实施方案中,所述另外核酸条形码分子偶联至另一个珠粒。在一些实施方案中,所述另一个珠粒是凝胶珠粒。在一些实施方案中,所述另外核酸条形码分子通过不稳定部分偶联至另一珠粒。在一些实施方案中,所述另外核酸条形码分子可释放地偶联至另一珠粒。在一些实施方案中,所述另外核酸条形码分子在施加刺激后可从所述另一珠粒释放。在一些实施方案中,所述刺激是化学刺激。在一些实施方案中,所述化学刺激是还原剂。

在一些实施方案中,所述方法还包括从所述分区回收所述条形码化核酸产生或其衍生物。在一些实施方案中,所述方法还包括将一个或多个流动池序列附接至所述条形码化核酸产物或其衍生物。在一些实施方案中,所述一个或多个流动池序列通过一种或多种核酸扩增反应附接。

在另一个方面,本公开提供了一种用于加工核酸样品的方法,所述方法包括:(a)在多个分区中的一个分区内提供包含脱氧核糖核酸(DNA)分子和核糖核酸(RNA)分子的生物颗粒,其中所述分区包含第一多个核酸条形码分子和第二多个核酸条形码分子,其中所述第一多个核酸条形码分子和所述第二多个核酸条形码分子包含共有条形码序列;(b)在所述分区内,产生对应于所述DNA分子的第一条形码化核酸产物和对应于所述RNA分子的第二条形码化核酸产物,其中所述第一条形码化核酸产物和所述第二条形码化核酸产物包含所述共有条形码序列,或其互补序列;(c)从所述分区中回收所述第一条形码化核酸产物和所述第二条形码化核酸产物;以及(d)使用(i)所述第一条形码化核酸产物来产生第一多种扩增产物和(ii)所述第二条形码化核酸产物来产生第二多种扩增产物,其中在(b)中,所述产生不包括进行指数扩增反应。

在一些实施方案中,所述分区是多个液滴中的一个液滴。

在一些实施方案中,所述分区是多个孔中的一个孔。

在一些实施方案中,所述生物颗粒是细胞、细胞珠粒或细胞核。

在一些实施方案中,所述方法还包括在所述分区内溶解或透化所述生物颗粒以接近其中的DNA分子和RNA分子。

在一些实施方案中,所述方法还包括,在(a)之前,用转座酶加工所述核酸样品的开放染色质结构以产生所述DNA分子。在一些实施方案中,所述转座酶是Tn5转座酶。在一些实施方案中,所述转座酶包含在转座酶-核酸复合物中。在一些实施方案中,所述转座酶-核酸复合物包含(i)包含第一转座子末端序列和第一测序引物或其部分或其互补序列的第一核酸分子,和(ii)包含第二转座子末端序列和第二测序引物或其部分或其互补序列的第二核酸分子。在一些实施方案中,所述第一转座子末端序列和所述第二转座子末端序列相同,并且其中所述第一转座子末端序列和所述第二转座子末端序列各自与互补序列杂交。在一些实施方案中,所述第一测序引物或其部分或其互补序列不同于所述第二测序引物或其部分或其互补序列。

在一些实施方案中,所述第一多个核酸条形码分子各自包含测序引物或其部分,或其互补序列。在一些实施方案中,(b)包括使所述DNA分子经受足以使所述第一多个核酸条形码分子中的第一核酸条形码分子与所述DNA分子杂交的条件。在一些实施方案中,所述方法还包括延伸与所述DNA分子杂交的第一核酸条形码分子以产生所述第一条形码化核酸产物。在一些实施方案中,所述方法还包括将所述第一核酸条形码分子连接至所述DNA分子。

在一些实施方案中,所述第一多个核酸条形码分子各自包含悬突序列。在一些实施方案中,(b)包括使所述DNA分子经受足以与夹板序列杂交的条件,其中所述夹板序列包含与所述DNA分子互补的序列和与所述悬突序列互补的序列。在一些实施方案中,所述夹板序列包含3’封闭基团。在一些实施方案中,(b)包括使与所述夹板序列杂交的DNA分子经受足以使所述第一多个核酸条形码分子中的第一核酸条形码分子的悬突序列与同所述悬突序列互补的序列杂交的条件。在一些实施方案中,所述方法还包括将所述第一核酸条形码分子连接至所述DNA分子。在一些实施方案中,所述夹板序列与所述分区外的悬突序列杂交。

在一些实施方案中,所述第一多个核酸条形码分子各自包含流动池序列或其互补序列。

在一些实施方案中,所述DNA分子包含一个或多个缺口。在一些实施方案中,所述方法还包括,在(c)之前,使所述DNA分子经受延伸过程以填充所述一个或多个缺口。在一些实施方案中,所述一个或多个缺口的填充被转座酶的存在阻断。在一些实施方案中,所述方法还包括,在(c)之后,使所述DNA分子经受延伸过程以填充所述一个或多个缺口。

在一些实施方案中,所述方法还包括在(a)之前,加工信使RNA(mRNA)分子以提供所述RNA分子。在一些实施方案中,所述方法还包括,在(b)之前,在所述分区内,逆转录所述RNA分子以提供另外cDNA分子。在一些实施方案中,在逆转录所述RNA分子之前,使引物分子与所述第二RNA分子的前体的序列杂交。在一些实施方案中,所述前体包含多聚A序列,并且其中所述引物分子包含被配置为与所述多聚A序列杂交的多聚T序列。在一些实施方案中,所述引物分子包含独特分子标识符序列。在一些实施方案中,所述引物分子包含条形码序列。在一些实施方案中,所述引物分子包含测序引物或其部分。在一些实施方案中,所述引物分子是所述多个第二核酸条形码分子中的第二核酸条形码分子。在一些实施方案中,所述方法还包括将另外序列附加到所述另外cDNA分子上。在一些实施方案中,所述另外序列是多聚(C)序列。在一些实施方案中,所述方法还包括在足以使模板转换寡核苷酸与所述另外cDNA分子杂交的条件下使所述另外cDNA分子与所述模板转换寡核苷酸接触。在一些实施方案中,所述模板转换寡核苷酸与所述另外cDNA分子的另外序列杂交。在一些实施方案中,所述方法还包括延伸所述另外cDNA分子以产生延伸的cDNA分子,所述延伸的cDNA分子包含与所述模板转换寡核苷酸的序列互补的序列。在一些实施方案中,所述模板转换寡核苷酸包含测序引物或其部分,或其互补序列。在一些实施方案中,所述模板转换寡核苷酸包含独特分子标识符序列或其互补序列。在一些实施方案中,所述方法还包括使所述延伸的cDNA分子与所述第二多个核酸条形码分子中的一个第二核酸条形码分子在足以使所述第二核酸条形码分子与所述延伸的cDNA分子的序列杂交的条件下接触。在一些实施方案中,所述方法还包括使与所述第二核酸条形码分子杂交的延伸的cDNA分子经受延伸反应以产生所述第二条形码化核酸产物,所述第二条形码化核酸产物包含与所述延伸的cDNA分子的序列互补的序列。在一些实施方案中,所述第二核酸条形码分子包含测序引物或其部分,或其互补序列。在一些实施方案中,所述第二核酸条形码分子包含流动池序列或其互补序列。

在一些实施方案中,所述第一多个核酸条形码分子和所述第二多个核酸条形码分子相同。

在一些实施方案中,所述模板转换寡核苷酸是所述第二多个核酸条形码分子中的第二核酸条形码分子,并且其中所述延伸的cDNA分子是第二条形码化核酸产物。在一些实施方案中,所述第二核酸条形码分子包含流动池序列或其互补序列。

在一些实施方案中,所述分区是液滴并且其中(c)包括使液滴破坏或破碎。

在一些实施方案中,(d)包括使用所述第一条形码化核酸产物或所述第二条形码化核酸产物进行一个或多个核酸扩增反应。在一些实施方案中,所述一个或多个核酸扩增反应包括一个或多个聚合酶链反应(PCR)。在一些实施方案中,(d)包括将一个或多个流动池序列附接至所述第一条形码化核酸产物或所述第二条形码化核酸产物或其衍生物。

在一些实施方案中,所述第一多个核酸条形码分子偶联至第一珠粒,并且所述第二多个核酸条形码分子偶联至第二珠粒。在一些实施方案中,所述第一珠粒和所述第二珠粒是凝胶珠粒。在一些实施方案中,所述第一珠粒连接至所述第二珠粒。在一些实施方案中,所述第一多个核酸条形码分子通过第一不稳定部分偶联至所述第一珠粒,并且所述第二多个核酸条形码分子通过第二不稳定部分偶联至所述第二珠粒。在一些实施方案中,所述第一不稳定部分和所述第二不稳定部分是相同的。在一些实施方案中,所述第一多个核酸条形码分子可释放地偶联至所述第一珠粒,并且所述第二多个核酸条形码分子可释放地偶联至所述第二珠粒。在一些实施方案中,所述第一多个核酸条形码分子在施加第一刺激时可从所述第一珠粒释放,并且所述第二多个核酸条形码分子在施加第二刺激时可从所述第二珠粒释放。在一些实施方案中,所述第一刺激和所述第二刺激是相同的。在一些实施方案中,所述第一刺激和所述第二刺激是化学刺激。

在一些实施方案中,所述第一多个核酸条形码分子和所述第二多个核酸条形码分子偶联至珠粒。在一些实施方案中,所述珠粒是凝胶珠粒。在一些实施方案中,所述第一多个核酸条形码分子通过第一不稳定部分偶联至所述珠粒,并且所述第二多个核酸条形码分子通过第二不稳定部分偶联至所述珠粒。在一些实施方案中,所述第一不稳定部分和所述第二不稳定部分是相同的。在一些实施方案中,所述第一多个核酸条形码分子和所述第二多个核酸条形码分子可释放地偶联至所述珠粒。在一些实施方案中,所述第一多个核酸条形码分子在施加第一刺激时可从所述珠粒释放,并且所述第二多个核酸条形码分子在施加第二刺激时可从所述珠粒释放。在一些实施方案中,所述第一刺激和所述第二刺激是相同的。在一些实施方案中,所述第一刺激和所述第二刺激是化学刺激。

在一些实施方案中,所述方法还包括,在(d)之后,对所述第一多种扩增产物和所述第二多种扩增产物进行测序以分别鉴定所述DNA分子和所述RNA分子的序列。

本公开的另一方面提供了一种包括机器可执行代码的非暂时性计算机可读介质,所述机器可执行代码在由一个或多个计算机处理器执行时实现上文或本文其他地方的任何方法。

本公开的另一方面提供了一种系统,所述系统包括一个或多个计算机处理器和与所述一个或多个计算机处理器耦接的计算机存储器。所述计算机存储器包括机器可执行代码,所述机器可执行代码在由所述一个或多个计算机处理器执行时实现上文或本文其他地方的任何方法。

本公开的另外方面和优点从以下

具体实施方式

变得为本领域技术人员显而易知,其中仅示出并描述本公开的说明性实施方案。应当认识到,本公开能够具有其他和不同的实施方案,并且其若干细节能够在各种明显方面加以修改,而都不背离本公开。因此,附图和说明书应被视为在本质上是说明性的而不是限制性的。

通过引用结合

本说明书中所提及的所有公布、专利和专利申请都以引用的方式并入本文中,其引用程度就如同每个单独的公布、专利或专利申请被具体地且单独地指出以引用的方式并入一般。在以引用的方式并入的公布和专利或专利申请与本说明书中所含的公开内容矛盾的程度上,本说明书意图取代和/或优先于任何这类矛盾材料。

附图说明

本发明的新颖特征在所附权利要求书中具体阐述。通过参考阐述说明性实施方案的以下详细描述和附图(在本文中也为“图(Figure)”和“图(FIG.)”)获得对本发明的特征和优点的更好理解,在所述说明性实施方案中利用本发明的原理,其中:

图1示出用于分配单个生物颗粒的微流体通道结构的实例。

图2示出用于将携带条形码的珠粒递送至液滴的微流体通道结构的实例。

图3示出用于共同分配生物颗粒和试剂的微流体通道结构的实例。

图4示出用于将珠粒受控分配成离散液滴的微流体通道结构的示例。

图5示出用于增加液滴产生通量的微流体通道结构的实例。

图6示出用于增加液滴产生通量的微流体通道结构的另一实例。

图7A示出具有用于受控分配的几何特征的微流体通道结构的另一实例的横截面视图。图7B示出图7A的通道结构的透视图。

图8示出携带条形码的珠粒的实例。

图9示出包含转座酶、包含转座子末端序列以及第一引物序列的第一双链寡核苷酸和包含转座子末端序列以及第二引物序列的第二双链寡核苷酸的转座酶-核酸复合物。

图10示出包含转座酶、包含转座子末端序列以及第一和第二引物序列的第一双链寡核苷酸和包含转座子末端序列以及第三和第四引物序列的第二双链寡核苷酸的转座酶-核酸复合物。

图11示出包含转座酶、第一发夹分子和第二发夹分子的转座酶-核酸复合物。

图12示出串联ATAC连接和RNA模板转换的另外方案。

图13示出串联ATAC连接和RNA模板转换的另外方案。

图14示出串联ATAC连接和RNA模板转换的示例性方案。

图15示出串联ATAC连接和RNA模板转换的另外方案。

图16示出串联ATAC连接和RNA模板转换的另外方案。

图17示出串联ATAC连接和RNA模板转换的另外方案。

图18示出串联ATAC连接和RNA模板转换的另外方案。

图19示出串联ATAC连接和RNA模板转换的另外方案。

图20示出T7介导的线性扩增的方案。

图21示出修改的工作流程T7介导的线性扩增。

图22示出串联ATAC和RNA加工的方案。

图23示出串联ATAC和RNA加工的方案。

图24A和24B示出根据本公开的方法使用的珠粒。

图25示出经编程或以其它方式配置成实现本文公开的方法的计算机系统。

本申请含有至少一幅彩色绘制的附图。在提出请求并支付必要费用后,本事务所将提供具有彩色绘图的本专利申请公布的副本。

具体实施方式

尽管本文已示出和描述了本发明的各种实施方案,但对于本领域技术人员来说将显而易见,此类实施方案仅作为举例提供。本领域的技术人员可想到众多变化、改变以及取代,而不背离本发明。应了解,可采用本文所述的本发明的实施方案的各种替代方案。

如本文所用,术语“一个/种(a/an)”和“所述”通常指单数和复数参考,除非上下文另有明确规定。

当术语“至少”、“大于”或“大于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“至少”、“大于”或“大于或等于”适用于所述系列数值中的每个数值。例如,大于或等于1、2或3等效于大于或等于1、大于或等于2或大于或等于3。

当术语“不大于”、“小于”或“小于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“不大于”、“小于”或“小于或等于”适用于所述系列数值中的每个数值。例如,小于或等于3、2或1等效于小于或等于3、小于或等于2或小于或等于1。

在将值描述为范围的情况下,应理解,这种公开内容包括在此类范围内的所有可能的子范围的公开内容,以及落入此类范围内的特定数值,而不管特定数值或特定子范围是否明确说明。

如本文所用,术语“条形码”通常是指传达或能够传达关于分析物的信息的标记或标识符。条形码可以是分析物的一部分。条形码可与分析物无关。条形码可以是附接至分析物(例如,核酸分子)的标签或除分析物的内源性特征(例如,分析物或末端序列的大小)以外的标签的组合。条形码可以是唯一的。条形码可具有多种不同的格式。例如,条形码可包括:多核苷酸条形码;随机核酸和/或氨基酸序列;和合成的核酸和/或氨基酸序列。条形码可以可逆或不可逆的方式附接至分析物。在样品测序之前、期间和/或之后,可将条形码添加至例如脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段。条形码可允许鉴定和/或定量个别测序读段。

如本文所用,术语“实时”可指小于约1秒、十分之一秒、百分之一秒、毫秒或更少的响应时间。响应时间可大于1秒。在一些情况下,实时可指同时或基本上同时加工、检测或鉴定。

如本文所用,术语“受试者”通常是指动物,如哺乳动物(例如人)或禽类(例如鸟),或其他生物体(如植物)。例如,受试者可以是脊椎动物、哺乳动物、啮齿动物(例如小鼠)、灵长类动物、猿猴或人。动物可包括但不限于农场动物、运动动物和宠物。受试者可以是健康的或无症状的个体、患有或疑似患有疾病(例如,癌症)或易患疾病的个体和/或需要治疗或疑似需要治疗的个体。受试者可以是患者。受试者可以是微生物(microorganism)或微生物(microbe)(例如细菌、真菌、古生菌、病毒)。

如本文所用,术语“基因组”通常是指来自受试者的基因组信息,其可以是例如受试者遗传信息的至少一部分或全部。基因组可在DNA或RNA中编码。基因组可包含编码区(例如编码蛋白质的编码区)以及非编码区。基因组可包含生物体中所有染色体一起的序列。例如,人基因组通常具有总计46个染色体。所有这些的序列一起可构成人基因组。

术语“衔接子(adaptor)”、“衔接子(adapter)”和“标签”可以同义使用。衔接子或标签可与多核苷酸序列偶联以通过包括连接、杂交或其它方法的任何方法“标记”。

如本文所用,术语“测序”通常是指用于确定一个或多个多核苷酸中核苷酸碱基的序列的方法和技术。多核苷酸可以是例如核酸分子,如脱氧核糖核酸(DNA)或核糖核酸(RNA),包括它们的变体或衍生物(例如单链DNA)。测序可以通过现用多种系统进行,例如不限于Pacific BiosciencesOxford 或LifeTechnologies(Ion )的测序系统。可替代地或此外,可以使用核酸扩增、聚合酶链式反应(PCR)(例如数字PCR、定量PCR或实时PCR)或等温扩增。此类系统可以提供与受试者(例如人类)的遗传信息相对应的多个原始遗传数据,如通过系统从受试者提供的样品产生。在一些实例中,此类系统提供测序读段(本文中也称为“读段”)。读段可以包括与已经进行测序的核酸分子序列相对应的一串核酸碱基。在一些情形下,本文提供的系统和方法可与蛋白质组学信息一起使用。

如本文所用,术语“珠粒”通常是指颗粒。珠粒可以是固体或半固体颗粒。珠粒可以是凝胶珠粒。凝胶珠粒可以包括聚合物基质(例如由聚合或交联形成的基质)。聚合物基质可以包括一种或多种聚合物(例如具有不同官能团或重复单元的聚合物)。聚合物基质中的聚合物可以随机排列,例如在无规共聚物中,和/或具有有序结构,例如在嵌段共聚物中。交联可以经由共价、离子或感应相互作用或物理缠结。珠粒可以是大分子。珠粒可以由结合在一起的核酸分子形成。珠粒可以经由分子(例如大分子)、例如单体或聚合物的共价或非共价装配形成。此类聚合物或单体可以是天然的或合成的。此类聚合物或单体可以是或包括例如核酸分子(例如,DNA或RNA)。珠粒可由聚合物材料形成。珠粒可以是磁性的或非磁性的。珠粒可以是刚性的。珠粒可以是柔性和/或可压缩的。珠粒可以是可破裂或可溶解的。珠粒可以是用包含一种或多种聚合物的涂层覆盖的固体颗粒(例如基于金属的颗粒,包括但不限于氧化铁、金或银)。这种涂层可以是可破坏的或可溶解的。

如本文所用,术语“样品”通常是指受试者的生物样品。生物样品可包含任何数量的大分子,例如细胞大分子。样品可以是细胞样品。样品可以是细胞系或细胞培养物样品。样品可以包括一种或多种细胞。样品可以包括一种或多种微生物。生物样品可以是核酸样品或蛋白质样品。生物样品也可以是碳水化合物样品或脂质样品。所述生物样品可源自另一样品。样品可以是组织样品,如活组织检查、芯活组织检查、针抽吸物或细针抽吸物。样品可以是流体样品,例如血液样品、尿液样品或唾液样品。样品可以是皮肤样品。样品可以是颊拭子。样品可以是血浆或血清样品。样品可以是无细胞的或无细胞样品。无细胞的样品可以包括胞外多核苷酸。胞外多核苷酸可以从可以选自由以下组成的组的身体样品分离:血液、血浆、血清、尿液、唾液、黏膜排泄物、痰液、粪便和眼泪。

如本文所用,术语“生物颗粒”通常是指来源于生物样品的离散生物系统。生物颗粒可以是大分子。生物颗粒可以是小分子。生物颗粒可以是病毒。生物颗粒可以是细胞或细胞的衍生物。生物颗粒可以是细胞器。生物颗粒可以是来自细胞群体的稀少细胞。生物颗粒可以任何类型的细胞,包括但不限于原核细胞、真核细胞、细菌、真菌、植物、哺乳动物或其它动物细胞类型、支原体、正常组织细胞、肿瘤细胞或任何其它细胞类型,无论源自于单细胞还是多细胞生物体。生物颗粒可以是细胞的成分。生物颗粒可以是或可以包括DNA、RNA、细胞器、蛋白质或它们的任何组合。生物颗粒可以是或可以包括包含细胞或来自细胞(例如细胞珠粒)的一种或多种成分,例如来自细胞的DNA、RNA、细胞器、蛋白质或它们的任何组合的基质(例如凝胶或聚合物基质)。生物颗粒可以从受试者的组织获得。生物颗粒可以是硬化细胞。这种硬化细胞可包含或可以不包含细胞壁或细胞膜。生物颗粒可包含细胞的一种或多种成分,但可以不包含细胞的其他成分。此类成分的一个实例是细胞核或细胞器。细胞可以是活细胞。活细胞可以能够被培养,例如,当被包封在凝胶或聚合物基质中时被培养,或者当包含凝胶或聚合物基质时被培养。对于示例性细胞珠粒、聚合物或交联基质和细胞珠粒产生方法的描述,参见例如美国专利公布20180216162和美国专利公布20190100632,其各自以引用的方式整体并入本文。

如本文所用,术语“大分子成分”通常是指生物颗粒内所含或来自生物颗粒的大分子。大分子成分可包含核酸。在一些情况下,生物颗粒可以是大分子。大分子成分可以包含DNA。大分子成分可以包含RNA。RNA可以是编码或非编码的。例如,RNA可以是信使RNA(mRNA)、核糖体RNA(rRNA)或转移RNA(tRNA)。RNA可以是转录物。RNA可以是长度小于200个核酸碱基的小RNA,或长度大于200个核酸碱基的大RNA。小RNA可以包括5.8S核糖体RNA(rRNA)、5S rRNA、转运RNA(tRNA)、微型RNA(miRNA)、小干扰RNA(siRNA)、小核仁RNA(snoRNA)、Piwi相互作用RNA(piRNA)、源自tRNA的小RNA(tsRNA)和源自小rDNA的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环形RNA。大分子成分可以包含蛋白质。大分子成分可以包含肽。大分子成分可以包含多肽。

如本文所用,术语“分子标签”通常是指能够结合于大分子成分的分子。分子标签可以高亲和力结合于大分子成分。分子标签可以在高特异性下结合于大分子成分。分子标签可以包含核苷酸序列。分子标签可以包含核酸序列。核酸序列可以是分子标签的至少一部分或全部。分子标签可以是核酸分子或可以是核酸分子的一部分。分子标签可以是寡核苷酸或多肽。分子标签可以包含DNA适体。分子标签可以是或包含引物。分子标签可以是或包含蛋白质。分子标签可以包含多肽。分子标签可以是条形码。

如本文所用,术语“分区”通常是指可适于容纳一种或多种物质或进行一种或多种反应的空间或体积。分区可以是物理隔室,如液滴或孔。分区可以将空间或体积与另一个空间或体积分隔开。液滴可以是与第一相不混溶的第二相(例如油)中的第一相(例如水相)。液滴可以是在不与第一相相分开的第二相中的第一相,例如在水相中的胶囊或脂质体。分区可包括一个或多个其他(内部)分区。在一些情况下,分区可以是虚拟隔室,其可以在多个和/或远程物理隔室间通过索引(例如,索引文库)来限定和标识。例如,物理隔室可包括多个虚拟隔室。

本公开提供用于加工多种类型的核酸分子的方法、系统和试剂盒。本文提供的方法、系统和试剂盒可促进用于对目标细胞、细胞珠粒或细胞核中所含的核酸分子进行测序的样品制备。例如,本公开提供了用于加工细胞、细胞珠粒或细胞核内所含的脱氧核糖核酸(DNA)和核糖核酸(RNA)分子的方法。所述方法可包括以串联的高通量测序(ATAC-seq)和RNA测序(RNA-seq)测定进行转座酶可接近染色质的测定。分配和条形码化方案可用于促进所得测序读段与它们所来源的细胞、细胞珠粒或细胞核的鉴定。

本公开还提供了用于加工包含核酸分子的生物样品的方法、系统和试剂盒。所述方法可包括从多个分区(例如,多个液滴或孔)的一个分区中的核酸样品(例如,包含细胞、细胞珠粒或细胞核的样品)提供一种或多种核酸分子(例如,脱氧核糖核酸(DNA)分子和/或核糖核酸(RNA)分子)。一种或多种核酸分子可以是一种或多种DNA分子。可转录一种或多种DNA分子以产生一种或多种RNA分子,其中可逆转录所述一种或多种RNA分子以产生一种或多种互补DNA(cDNA)分子。然后可从多个分区的所述分区中回收一种或多种cDNA分子或其衍生物(例如,通过汇集所述多个分区的内容物)。一种或多种cDNA分子或其衍生物可包含一个或多个核酸条形码序列或其互补序列,其中所述一个或多个核酸条形码序列或其互补序列可在任何加工步骤期间(例如,在DNA分子的转录、RNA分子的逆转录期间等)并入核酸分子中。一个或多个核酸条形码序列或其互补序列可用于鉴定对应于来自核酸样品的一种或多种核酸分子的一种或多种cDNA分子的测序读段(例如,使用核酸测序测定获得的测序读段)。

串联DNA和RNA条形码化

在一个方面,本公开提供了一种用于加工来自细胞、细胞珠粒或细胞核的核酸分子的方法。所述方法可包括使细胞、细胞珠粒或细胞核与包含转座酶分子和一种或多种转座子末端寡核苷酸分子的转座酶-核酸复合物接触。细胞、细胞珠粒或细胞核可与本体溶液中的转座酶-核酸复合物接触,以使得细胞、细胞珠粒或细胞核通过标签化反应进行“标签化”。使细胞、细胞珠粒或细胞核与转座酶-核酸复合物接触可产生一个或多个模板核酸片段(例如,“标签化片段”)。一个或多个模板核酸片段可对应于细胞、细胞珠粒或细胞核内的一种或多种靶核酸分子(例如,脱氧核糖核酸(DNA)分子)。并行地,细胞、细胞珠粒或细胞核可与被配置为与一种或多种另外靶核酸分子(例如,核糖核酸(RNA)分子,如信使RNA(mRNA)分子)相互作用的引物分子(例如,包含多聚T序列的引物分子)接触。细胞、细胞珠粒或细胞核可与本体溶液中的引物分子接触。可替代地或除此之外,细胞、细胞珠粒或细胞核可与分区内的引物分子接触。这些部分之间的相互作用可产生一个或多个另外模板核酸片段(例如,RNA片段)。例如,引物分子可与一种或多种另外靶核酸分子(例如,mRNA分子)具有至少部分序列互补性。引物分子可与所述一种或多种另外靶核酸分子的另外靶核酸分子的序列杂交。细胞、细胞珠粒或细胞核可被分配(例如,与一种或多种试剂共同分配)到(例如,多个分区的)一个分区中。分区可以是例如液滴或孔。分区可包含一种或多种试剂,包括例如一种或多种包含一种或多种核酸条形码分子的颗粒(例如珠粒)。细胞、细胞珠粒或细胞核可进行溶解、透化、固定、交联或以其他方式操作以接近一个或多个模板核酸片段和其中的一个或多个另外模板核酸片段。一个或多个模板核酸片段和其中的一个或多个另外模板核酸片段可在分区内进行一个或多个加工步骤。例如,一个或多个模板核酸片段和/或一个或多个另外模板核酸片段可进行条形码化过程、连接过程、逆转录过程、模板转换过程、线性扩增过程和/或缺口填充过程。所得的一个或多个经加工的模板核酸片段(例如,标签化片段)和/或一个或多个经加工的另外模板核酸片段(例如,RNA片段)可各自包含条形码序列(例如,核酸条形码序列,如本文描述)。一个或多个经加工的模板核酸片段和/或一个或多个经加工的另外模板核酸片段可从分区释放(例如,与多个分区中的其他分区的内容物汇集)并且可进行一个或多个另外批量加工步骤。例如,一个或多个经加工的模板核酸片段和/或一个或多个经加工的另外模板核酸片段可进行缺口填充过程、dA加尾过程、末端转移酶过程、磷酸化过程、连接过程、核酸扩增过程或它们的组合。例如,一个或多个经加工的模板核酸片段和/或一个或多个经加工的另外模板核酸片段可经受足以进行一种或多种聚合酶链反应(PCR,如序列独立PCR)的条件以产生对应于所述一个或多个经加工的模板核酸片段(例如,标签化片段)和/或所述一个或多个经加工的另外模板核酸片段(例如,RNA片段)的扩增产物。此类扩增产物的序列可使用例如核酸测序测定来检测并且用于鉴定它们所来源于的细胞、细胞珠粒或细胞核的一种或多种靶核酸分子(例如DNA分子)和一种或多种另外靶核酸分子(例如,RNA分子)的序列。

生物样品(例如,核酸样品)可包含一种或多种细胞、细胞珠粒和/或细胞核。生物样品还可包括组织,所述组织可包含一种或多种细胞、细胞珠粒和/或细胞核。在一些情况下,生物样品可包含含有多个细胞核的多个细胞。在一些情况下,生物样品可包含多个细胞核,所述多个细胞核不包含在细胞内(例如,细胞的其他组分已降解、解离、溶解或以其他方式除去)。生物样品可包含多个无细胞核酸分子(例如,不包含在细胞内的核酸分子)。例如,生物样品可包含多个无细胞胎儿DNA(cffDNA)或循环肿瘤DNA(ctDNA)或其他无细胞核酸分子(例如,源自降解细胞)。可加工这种生物样品以使此类无细胞核酸分子与细胞、细胞珠粒和/或细胞核分离,所述细胞、细胞珠粒和/或细胞核可经受进一步加工(例如,如本文所述)。

生物样品内包含的核酸分子可包括,例如,DNA分子和RNA分子。例如,生物样品可包含含有染色质的基因组DNA(例如,在细胞、细胞珠粒或细胞核内)。生物样品可包含多个RNA分子,如多个前体mRNA或mRNA分子。mRNA分子和其他RNA分子可包含多聚A序列。细胞或细胞珠粒中所含的多个RNA分子的至少一个子集可存在于细胞核中。

核酸分子可在细胞、细胞珠粒或细胞核内进行一个或多个加工步骤。例如,细胞、细胞珠粒或细胞核内的染色质可与转座酶接触。转座酶可包含在转座酶-核酸复合物中,所述转座酶-核酸复合物可包含转座酶分子和一个或多个转座子末端寡核苷酸分子。转座酶可以是Tn转座酶,如Tn3、Tn5、Tn7、Tn10、Tn552、Tn903转座酶。或者,转座酶可以是MuA转座酶、Vibhar转座酶(例如来自哈维氏弧菌)、Ac-Ds、Ascot-1、Bs1、Cin4、Copia、En/Spm、F元件、hobo、Hsmar1、Hsmar2、IN(HIV)、IS1、IS2、IS3、IS4、IS5、IS6、IS10、IS21、IS30、IS50、IS51、IS150、IS256、IS407、IS427、IS630、IS903、IS911、IS982、IS1031、ISL2、L1、Mariner、P元件、Tam3、Tc1、Tc3、Te1、THE-1、Tn/O、TnA、Tn3、Tn5、Tn7、Tn10、Tn552、Tn903、Tol1、Tol2、TnlO、Tyl、任何原核转座酶,或与以上所列的那些相关的和/或源自以上所列的那些的任何转座酶。例如,转座酶可以是Tn5转座酶或突变的过度活跃Tn5转座酶。与亲本转座酶相关和/或源自亲本转座酶的转座酶可包含与亲本转座酶的对应肽片段具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%氨基酸序列同源性的肽片段。肽片段可以是至少约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个、约50个、约60个、约70个、约80个、约90个、约100个、约150个、约200个、约250个、约300个、约400个或约500个氨基酸长。举例来说,源自Tn5的转座酶可包含50个氨基酸长和与亲本Tn5转座酶中的对应片段约80%同源的肽片段。转座酶的行为(例如插入)可通过添加一种或多种阳离子,如一种或多种二价阳离子(例如,Ca2+、Mg2+或Mn2+)来促进和/或引发。

转座酶-核酸复合物可包含一个或多个核酸分子。例如,转座酶-核酸复合物可包含一个或多个转座子末端寡核苷酸分子。转座子末端寡核苷酸分子可包含一个或多个衔接子序列(例如,包含一个或多个引物序列)和/或一个或多个转座子末端序列。转座子末端序列可以是例如Tn5或经修饰的Tn5转座子末端序列或Mu转座子末端序列。转座子末端序列可具有例如AGATGTGTATAAGAGACA(SEQ ID NO:1)的序列。转座子末端寡核苷酸分子的引物序列可以是测序引物,如R1或R2测序引物,或其一部分。测序引物可以是例如TrueSeq或Nextera测序引物。R1测序引物区可具有TCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ IDNO:2)的序列,或其一部分。R1测序引物区可具有TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG(SEQ ID NO:3)的序列,或其一部分。转座子末端寡核苷酸分子可包含部分R1序列。部分R1序列可以是ACTACACGACGCTCTTCCGATCT(SEQ ID NO:4)。转座子末端寡核苷酸分子可包含R2测序引发区。R2测序引物区可具有GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:5)的序列,或其一部分。R2测序引物区可具有GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG(SEQ IDNO:6)的序列,或其一部分。转座子末端寡核苷酸分子可包含T7启动子序列。T7启动子序列可以是TAATACGACTCACTATAG(SEQ ID NO:7)的序列。转座子末端寡核苷酸分子可包含与SEQID NO:1-7中的任一个至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一的区域。转座子末端寡核苷酸分子可包含P5序列和/或P7序列。转座子末端寡核苷酸分子可包含样品索引序列,如条形码序列或独特分子标识符序列。转座酶-核酸复合物的一个或多个转座子末端寡核苷酸分子可附接至固体载体(例如固体或半固体颗粒,如珠粒(例如凝胶珠粒))。转座子末端寡核苷酸分子可以可释放地偶联至固体载体(例如珠粒)。转座子末端寡核苷酸分子的实例可在例如PCT专利公布号WO2018/218226、WO2014/189957,美国专利公布20180340171和美国专利10,059,989中找到;其各自以引用的方式整体并入本文。

图9包括用于本文提供的方法中的转座酶-核酸复合物的实例。转座酶-核酸复合物900(例如,包含转座二聚体)包含部分双链寡核苷酸901和部分双链寡核苷酸905。部分双链寡核苷酸901包含转座子末端序列903、第一引物序列902和与转座子末端序列903互补的序列904。部分双链寡核苷酸905包含转座子末端序列906、第一引物序列907和与转座子末端序列906互补的序列908。引物序列902和907可相同或不同。在一些情况下,引物序列902可被指定为“R1”,并且引物序列907可被指定为“R2”。转座子末端序列903和906可相同或不同。转座子末端序列903和906可以可替代地称为“嵌合末端”或“ME”序列,而它们的互补序列904和908可称为“嵌合末端反向互补序列”或“MErc”序列。

图10包括用于本文提供的方法中的转座酶-核酸复合物的另一个实例。转座酶-核酸复合物1000(例如,包含转座二聚体)包含分叉衔接子1001和1006,所述分叉衔接子是部分双链寡核苷酸。部分双链寡核苷酸1001包含转座子末端序列1003、第一引物序列1002、第二引物序列1005和与转座子末端序列1003互补的序列1004。部分双链寡核苷酸1006包含转座子末端序列1007、第一引物序列1008、第二引物序列1010和与转座子末端序列1007互补的序列1009。引物序列1002、1005、1008和1010可相同或不同。在一些情况下,引物序列1002和1008可被指定为“R1”,并且引物序列1005和1010可被指定为“R2”。或者,引物序列1002和1010可被指定为“R1”,并且引物序列1005和1008可被指定为“R2”。或者,引物序列1002和1008可被指定为“R2”,并且引物序列1005和1010可被指定为“R1”。或者,引物序列1002和1010可被指定为“R2”,并且引物序列1005和1008可被指定为“R1”。转座子末端序列1003和1007可相同或不同。这些序列可以可替代地称为“嵌合末端”或“ME”序列,而它们的互补序列1004和1009可称为“嵌合末端反向互补序列”或“MErc”序列。

图11示出包含发夹分子1101和1106的转座酶-核酸复合物1100(例如,包含转座二聚体)。发夹分子1101包含转座子末端序列1103、第一发夹序列1102、第二发夹序列1105和与转座子末端序列1103互补的序列1104。发夹分子1106包含转座子末端序列1107、第三发夹序列1108、第四发夹序列1110和与转座子末端序列1107互补的序列1109。发夹序列1102、1105、1108和1110可相同或不同。例如,发夹序列1105可与发夹序列1110相同或不同,和/或发夹序列1102可与发夹序列1108相同或不同。发夹序列1102和1108可以是间隔区序列或衔接子序列。发夹序列1105和1110可以是启动子序列,如T7识别或启动子序列和/或UMI序列。转座子末端序列1103和1107可相同或不同。转座子末端序列1103和1107可以可替代地称为“嵌合末端”或“ME”序列,而它们的互补序列1104和1109可称为“嵌合末端反向互补序列”或“MErc”序列。在一些情况下,序列1104是转座子末端序列,并且1103是与序列1104互补的序列。在一些情况下,序列1109是转座子末端序列,并且1107是与序列1109互补的序列。

使包含一种或多种靶核酸分子(例如,DNA分子)的细胞、细胞珠粒或细胞核与转座酶-核酸复合物接触可产生一个或多个模板核酸片段(例如,“标签化片段”)。一个或多个模板核酸片段可各自包含一种或多种靶核酸分子的序列(例如,靶序列)。转座酶-核酸复合物可被配置为靶向一种或多种靶核酸分子的特定区域以提供一个或多个包含特定靶序列的模板核酸片段。一个或多个模板核酸片段可包含对应于可接近染色质的靶序列。标签化片段的产生可发生在本体溶液中。在其他情况下,标签化片段的产生可发生在分区(例如,液滴或孔)内。模板核酸片段(例如,标签化片段)可包含一个或多个缺口(例如,在转座子末端序列或其互补序列与双链片段的一条或两条链上的靶序列之间)。可通过使用例如聚合酶(例如DNA聚合酶)、连接酶或逆转录酶的缺口填充过程来填充缺口。在一些情况下,酶混合物可用于修复部分双链核酸分子并填充一个或多个缺口。缺口填充可不包括链置换。可在分区内部或外部填充缺口。

可替代地或除此之外,可使一种或多种另外核酸分子与细胞、细胞珠粒或细胞核内的一种或多种捕获核酸分子接触以提供一个或多个另外模板核酸片段。例如,可使RNA分子(例如,mRNA)分子与细胞、细胞珠粒或细胞核内的引物分子接触。引物分子可包含引物序列,所述引物序列可以是靶向引物序列或非特异性引物序列(例如,随机N-聚体)。靶向引物序列可包含例如多聚T序列,所述多聚T序列可与RNA分子的多聚A序列相互作用。引物核酸分子还可包含一个或多个另外序列,如一个或多个样品索引序列、间隔区或接头序列,或一个或多个另外引物序列。另外模板核酸片段(例如,RNA片段)的产生可在本体溶液中发生。在其他情况下,另外模板核酸片段的产生可在分区(例如,液滴或孔)内发生。

细胞、细胞珠粒或细胞核内核酸分子的加工(例如,使用转座酶-核酸复合物产生模板核酸片段和/或使用捕获核酸分子产生另外模板核酸片段)可在包含多个细胞、细胞珠粒和/或细胞核的本体溶液中发生。在一些情况下,模板核酸片段(例如,标签化片段)可在本体溶液中产生,并且另外模板核酸片段(例如,RNA片段)可在分区中产生。

多个细胞、细胞珠粒和/或细胞核(例如,已经进行了加工如标签化过程的多个细胞、细胞珠粒和/或细胞核)可被分配在多个分区之间。分区可以是例如液滴或孔。可根据本文提供的方法来产生液滴(例如,水性液滴)。可根据本文提供的方法进行分配。例如,分配生物颗粒(例如,细胞、细胞珠粒或细胞核)和一种或多种试剂可包括使包含水性流体、生物颗粒和一种或多种试剂的第一相和包含与水性流体不混溶的第二相流向汇合。在第一相和第二相相互作用时,可形成包含生物颗粒和一种或多种试剂的第一相的离散液滴。多个细胞、细胞珠粒和/或细胞核可在多个分区之间分配,以使得多个分区的至少一个子集可包含至多一个细胞、细胞珠粒或细胞核。细胞、细胞珠粒和/或细胞核可与一种或多种试剂共同分配,以使得多个分区的至少一个子集的分区包含单个细胞、细胞珠粒或细胞核和一种或多种试剂。一种或多种试剂可包括例如酶(例如,聚合酶、逆转录酶、连接酶等)、核酸条形码分子(例如,包含一个或多个条形码序列的核酸条形码分子,如偶联至一个或多个珠粒的核酸条形码分子)、模板转换寡核苷酸、三磷酸脱氧核苷酸、缓冲剂、溶解剂、引物、条形码、洗涤剂、还原剂、螯合剂、氧化剂、纳米颗粒、珠粒、抗体或任何其他有用的试剂。酶可包括例如温度敏感酶、pH敏感酶、光敏酶、逆转录酶、蛋白酶、连接酶、聚合酶、激酶、限制酶、核酸酶、蛋白酶抑制剂、核酸外切酶和核酸酶抑制剂。

一种或多种试剂中的一种试剂可用于溶解或透化细胞、细胞珠粒或细胞核,或以其他方式接近其中的核酸分子和/或模板核酸片段。细胞可使用溶解剂,例如生物活性剂溶解。可用于溶解细胞的生物活性剂可以是例如酶(例如,如本文所述)。用于溶解细胞的酶可能能够或可能不能够进行另外行为,如降解一个或多个RNA分子。可替代地,可使用离子、两性离子或非离子表面活性剂来溶解细胞。表面活性剂的实例包括但不限于TritonX-100、Tween 20、肌氨酰或十二烷基硫酸钠。细胞溶解还可以使用细胞破碎方法,例如电穿孔或热、声或机械破碎方法来实现。可替代地,细胞可透化以接近其中所包含的核酸分子。透化可涉及部分或完全溶解或破碎细胞膜或其一部分。透化可通过例如使细胞膜与有机溶剂或诸如Triton X-100或NP-40的洗涤剂接触来实现。通过溶解或透化分区(例如,液滴)内的细胞、细胞珠粒或细胞核以接近其中的多个核酸分子和/或模板核酸片段,源自同一细胞、细胞珠粒或细胞核的分子可在同一分区内分离。

多个分区中的一个分区(例如,包含细胞、细胞珠粒和/或细胞核的分区)可包含一个或多个珠粒(例如,凝胶珠粒)。珠粒可以是凝胶珠粒。珠粒可包含多个核酸条形码分子(例如,各自包含一个或多个条形码序列的核酸分子,如本文所述)。珠粒可包含至少10,000个附接至珠粒的核酸条形码分子。举例来说,珠粒可包含至少100,000个、1,000,000个或10,000,000个附接至珠粒的核酸条形码分子。多个核酸条形码分子可以可释放地附接至珠粒。在施加刺激后多个核酸条形码分子可从珠粒释放。这类刺激可选自由以下组成的组:热刺激、光刺激和化学刺激。举例来说,刺激可以是还原剂,如二硫苏糖醇。刺激的施加可引起以下中的一种或多种:(i)多个核酸条形码分子的核酸条形码分子与珠粒之间的键联的裂解,以及(ii)珠粒的降解或溶解,从而从珠粒释放多个核酸条形码分子的核酸条形码分子。

附接(例如,可释放地附接)至珠粒(例如,凝胶珠粒)的多个核酸条形码分子可适用于对源自多个细胞、细胞珠粒和/或细胞核的DNA和/或RNA分子的模板核酸片段或另外模板核酸片段进行条形码化。例如,多个核酸条形码分子的核酸条形码分子可包含条形码序列、独特分子标识符(UMI)序列、引物序列、通用引物序列、测序衔接子或引物、流动池衔接子序列或任何其他有用的功能。在一个实例中,附接至珠粒的多个核酸条形码分子的核酸条形码分子可包含流动池衔接子序列(例如,P5或P7序列)、条形码序列、捕获序列和测序引物序列或其部分(例如,R1或R2序列或其部分),或这些序列中的任一者的互补序列。这些序列可以任何有用的顺序排列并且可连接或可包括一个或多个位于它们之间的间隔区序列。例如,流动池衔接子序列(如果存在)可安置在核酸条形码分子的最接近珠粒的末端附近(例如,接近),而测序引物或其部分可安置在核酸条形码分子的离珠粒最远(例如,远离)的末端(例如,最可用于模板核酸片段进行相互作用)。在另一个实例中,附接至珠粒的多个核酸条形码分子的核酸条形码分子可包含流动池衔接子序列(例如,P5或P7序列)、条形码序列、测序引物序列或其部分(例如,R1或R2序列或其部分)和UMI序列,或这些序列中的任一者的互补序列。核酸条形码分子还可包含捕获序列,所述捕获序列可以是靶向捕获序列或包含模板转换序列(例如,包含多聚C或多聚G序列)。这些序列可以任何有用的顺序排列并且可连接或可包括一个或多个位于它们之间的间隔区序列。例如,流动池衔接子序列可安置在核酸条形码分子的最接近珠粒的末端附近(例如,接近),而捕获序列或模板转换序列可安置在核酸条形码分子的离珠粒最远的末端(例如,最可用于模板核酸片段进行相互作用)。

附接(例如,可释放地附接)至多个珠粒中的一个珠粒(例如,凝胶珠粒)的所有核酸条形码分子可以是相同的。例如,附接至珠粒的所有核酸条形码分子可具有相同的核酸序列。在这种情况下,附接至珠粒的所有核酸条形码分子可包含相同的流动池衔接子序列、测序引物或其部分,和/或条形码序列。附接至多个珠粒中的一个珠粒的多个核酸条形码分子的条形码序列可不同于附接至多个珠粒中的其它珠粒的其它核酸条形码分子的其它条形码序列。例如,多个珠粒可包含多个条形码序列,以使得对于多个珠粒的至少一个子集,每个珠粒包含多个条形码序列中的不同条形码序列。这种区分可允许在多个分区之间与多个珠粒共同分配的模板核酸片段(例如,包含在细胞、细胞珠粒和/或细胞核内)在它们各自的分区内差异地条形码化,以使得模板核酸片段或源自其的分子可用它们所对应的分区(以及因此细胞、细胞珠粒和/或细胞核)来鉴定(例如,使用核酸测序测定,如本文所述)。条形码序列可包含4-20个核苷酸。条形码序列可包含一个或多个区段,所述区段的大小可在2-20个核苷酸,如4-20个核苷酸的范围内。可使用组合组装方法,如分裂池方法来组合此类片段以形成条形码序列。此类方法的细节可例如在2018年11月15日提交的PCT/US2018/061391和美国专利公布20190249226中找到,其各自以引用的方式整体并入本文。

在一些情况下附接至珠粒的核酸条形码分子可能不同。例如,附接至珠粒的多个核酸条形码分子可各自包含UMI序列,所述UMI序列在多个核酸条形码分子之间变化。附接至珠粒的多个核酸条形码分子的所有其他序列可以是相同的。

在一些情况下,珠粒可包含附接至其的多个不同的核酸条形码分子。例如,珠粒可包含第一多个核酸条形码分子和第二多个核酸条形码分子,所述第一多个核酸条形码分子不同于所述第二多个核酸条形码分子。偶联至珠粒的第一多个核酸条形码分子和第二多个核酸条形码分子可包含一个或多个共享序列。例如,第一多个核酸条形码分子的每个核酸条形码分子和第二多个核酸条形码分子的每个核酸条形码分子可包含相同的条形码序列(例如,如本文所述)。这种条形码序列可使用组合组装过程(例如,如本文所述)来制备。例如,条形码序列可包含相同的条形码序列区段。类似地,偶联至珠粒的第一多个核酸条形码分子的每个核酸条形码分子可包含与偶联至所述珠粒的第二多个核酸条形码的每个核酸条形码分子相同的流动池衔接子序列和/或测序引物或其部分。在一个实例中,偶联至珠粒的第一多个核酸条形码分子中的每个核酸条形码分子包含测序引物,并且偶联至所述珠粒的第二多个核酸条形码分子中的每个核酸条形码分子包含同一测序引物的一部分。在一些情况下,偶联至珠粒的第一多个核酸条形码分子中的每个核酸条形码分子可包含第一测序引物(例如,TruSeq R1序列)、条形码序列和第一功能序列,并且偶联至所述珠粒的第二多个核酸条形码分子中的每个核酸条形码分子可包含第二测序引物(例如,Nextera R1序列或其一部分)、条形码序列和第二功能序列。与同一珠粒偶联的不同组核酸条形码分子之间共享的序列可以相同或不同的顺序包括并且可由相同或不同的序列隔开。可替代地或另外,与珠粒偶联的第一多个核酸条形码分子和第二多个核酸条形码分子可包含一个或多个不同的序列。例如,与多个珠粒中的一个珠粒偶联的第一多个核酸条形码分子中的每个核酸条形码分子可包含流动池衔接子序列、条形码序列、UMI序列、捕获序列和测序引物或其部分中的一者或多者,而与所述珠粒偶联的第二多个核酸条形码分子中的每个核酸条形码分子可包含流动池衔接子序列(例如,同一流动池衔接子序列)、条形码序列(例如,同一条形码序列)、UMI序列、捕获序列和测序引物或其部分(例如,同一测序引物或其部分)中的一者或多者。第一多个核酸条形码分子的核酸条形码分子可不包含UMI序列或捕获序列。包含多个不同核酸条形码分子群体如第一多个核酸分子和第二多个核酸分子(例如,如上所述)的珠粒可被称为“多功能珠粒”。

包含模板核酸片段(例如,模板核酸片段和源自细胞、细胞珠粒或细胞核内所包含的DNA或RNA分子的另外模板核酸片段)的细胞、细胞珠粒或细胞核可与一个或多个珠粒共同分配(例如,如本文所述)。例如,细胞、细胞珠粒或细胞核可与第一珠粒(例如第一凝胶珠粒)和第二珠粒(例如,第二凝胶珠粒)共同分配,所述第一珠粒被配置为与第一组模板核酸片段(例如,源自DNA分子的模板核酸片段,如标签化片段)相互作用,所述第二珠粒被配置为与第二组模板核酸片段(例如,源自RNA分子的另外模板核酸片段)相互作用。第一珠粒可包含第一核酸分子,所述第一核酸分子包含流动池衔接子序列、条形码序列和测序引物或其部分,所述测序引物或其部分可被配置为与源自细胞、细胞珠粒或细胞核的DNA分子的模板核酸片段或其衍生物中所包含的互补序列相互作用(例如退火或杂交)。第二珠粒可包含第二核酸分子,所述第二核酸分子包含流动池衔接子序列、条形码序列、测序引物或其一部分、UMI序列和捕获序列,所述捕获序列可被配置为与源自细胞、细胞珠粒或细胞核的RNA分子的模板核酸片段或其衍生物的序列相互作用(例如,退火或杂交)。在一些情况下,捕获序列可被配置为与在逆转录RNA片段时产生的cDNA分子的序列相互作用。第一珠粒和第二珠粒可连接在一起(例如,共价或非共价)。第一珠粒和第二珠粒可各自包含多个核酸分子。例如,第一珠粒可包含多个第一核酸分子,并且第二珠粒可包含多个第二核酸分子,其中所述多个第一核酸分子中的每个第一核酸分子包含第一共享序列,并且所述多个第二核酸分子中的每个第二核酸分子包含第二共享序列。第一共享序列和第二共享序列可相同或不同。第一共享序列和第二共享序列可包含一种或多种共享组分,如共享条形码序列或测序引物或其部分。

或者,包含模板核酸片段(例如,模板核酸片段或源自细胞、细胞珠粒或细胞核内所包含的DNA或RNA分子的另外模板核酸片段)的细胞、细胞珠粒或细胞核可与单个珠粒(例如,凝胶珠粒)共同分配。例如,细胞、细胞珠粒或细胞核可与包含珠粒共同分配,所述珠粒包含(i)被配置为与第一组模板核酸片段(例如,源自DNA分子的模板核酸片段,如标签化片段)或其衍生物相互作用的第一多个核酸条形码分子,和(ii)被配置为与第二组模板核酸片段(例如,源自RNA分子的另外模板核酸片段)或其衍生物(如从RNA片段产生的cDNA)相互作用的第二多个核酸条形码分子。第一多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列、条形码序列和测序引物或其部分,所述测序引物或其部分可被配置为与源自细胞、细胞珠粒或细胞核的DNA分子的模板核酸片段或其衍生物中所包含的互补序列相互作用(例如退火或杂交)。第二多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列、条形码序列、测序引物或其一部分、UMI序列和捕获序列,所述捕获序列可被配置为与源自细胞、细胞珠粒或细胞核的RNA分子的模板核酸片段或其衍生物(如从RNA片段产生的cDNA)的序列相互作用(例如,退火或杂交)。第一多个核酸条形码分子可包含与第二多个核酸条形码分子大致相同数量的核酸条形码分子。或者,第一多个核酸条形码分子可包含比第二多个核酸条形码分子更多数量的核酸条形码分子,反之亦然。珠粒上核酸条形码分子的分布可通过例如珠粒上的核酸条形码分子组装期间的序列控制、浓度控制和或封闭方法来控制。此类过程的细节提供于例如2018年11月15日提交的PCT/US2018/061391和美国专利公布20190249226中,其各自以引用的方式整体并入。

图24A和24B示出根据本文提供的方法使用的珠粒的实例。图24A示出第一珠粒2401和第二珠粒2411,其可与细胞、细胞珠粒或细胞核共同分配到多个分区(例如,液滴或孔)中的一个分区中。第一珠粒2401可包含核酸分子2402。核酸分子2402可包含序列2403、2404和2405。序列2403可以是例如流动池衔接子序列(例如,P5或P7序列)。序列2404可以是例如条形码序列。序列2405可以是例如测序引物序列或其部分(例如,R1或R2引物序列或其部分)。核酸分子2402还可包含另外序列,如UMI序列。第一珠粒2401可包含多个核酸分子2402。第二珠粒2411可包含核酸分子2412。核酸分子2412可包含序列2413、2414和2415。序列2413可以是例如流动池衔接子序列(例如,P5或P7序列)。序列2414可以是例如条形码序列。序列2415可以是例如测序引物序列或其部分(例如,R1或R2引物序列或其部分)。核酸分子2412还可包含另外序列,如UMI序列和捕获序列。第二珠粒2401可包含多个核酸分子2412。

图24B示出珠粒2421(例如,具有附接或偶联至其上的两种或更多种种类的核酸条形码分子的多功能珠粒),所述珠粒可与细胞、细胞珠粒或细胞核共同分配到多个分区(例如,液滴或孔)中的一个分区中。珠粒2421可包含核酸分子2422和核酸分子2426。核酸分子2422可包含序列2423、2424和2425。序列2423可以是例如流动池衔接子序列(例如,P5或P7序列)。序列2424可以是例如条形码序列。序列2425可以是例如测序引物或其部分(例如,R1或R2引物序列或其部分,如Nextera R1序列或其部分)。在一些情况下,序列2425也可以是例如被配置为与本文别处所述的夹板寡核苷酸杂交的序列。核酸分子2426可包含序列2427、2428和2429。序列2427可以是例如流动池衔接子序列(例如,P5或P7序列)。序列2428可以是例如条形码序列(例如,与序列2424相同的条形码序列)。序列2429可以是例如测序引物或其部分(例如,R1或R2引物序列或其部分)。序列2427可以是例如测序引物或其部分(例如,R1或R2引物序列或其部分,如TruSeq R1序列或其部分)。序列2428可以是例如条形码序列(例如,与2424相同的条形码序列)。序列2429可以是例如捕获序列(例如,多聚T序列),如被配置为与靶核酸分子(例如,mRNA分子)杂交的捕获序列。序列2429可以是例如模板转换寡核苷酸(TSO)序列,其被配置为促进与靶核酸分子(例如,mRNA分子)的模板转换反应。序列2423和序列2427可以是相同的。或者,序列2423和序列2427可以是不同的。序列2424和序列2428可以是相同的。或者,序列2424和序列2428可以是不同的。序列2425和序列2429可以是相同的。或者,序列2425和序列2429可以是不同的。核酸分子2422和2426还可包含另外序列,如UMI序列和捕获序列。珠粒2421可包含多个核酸分子2422和多个核酸分子2426。

在分区内(例如,如本文所述),可加工RNA片段(例如,包含与引物分子杂交的细胞、细胞珠粒或细胞核的RNA分子的序列的分子)以提供条形码化分子。RNA片段可进行逆转录以产生互补cDNA链,所述cDNA链可被条形码化。在一些情况下,模板转换可用于增加cDNA的长度(例如,通过并入一个或多个序列,如一个或多个条形码或独特分子标识符序列)。在模板转换的一个实例中,可从模板(例如mRNA分子)的逆转录产生cDNA,其中具有末端转移酶活性的逆转录酶可如在cDNA的末端处向所述cDNA添加另外核苷酸,例如多聚C,所述核苷酸不由所述模板编码。模板转换寡核苷酸(例如转换寡核苷酸)可包含与另外核苷酸,例如多聚G(如多聚riboG)互补的序列。cDNA上的另外核苷酸(例如,多聚C)可杂交至与模板转换寡核苷酸上的另外核苷酸(例如,多聚G)互补的序列,由此所述模板转换寡核苷酸可被逆转录酶用作模板以进一步延伸cDNA。模板转换寡核苷酸可包含脱氧核糖核酸、核糖核酸、经修饰的核酸,包括锁核酸(LNA),或它们的任何组合。模板转换寡核苷酸可包含一个或多个序列,包括例如一个或多个选自由以下组成的组的序列:测序引物、条形码序列、独特分子标识符序列和均聚物序列(例如,多聚G序列),或任何前述序列的互补序列。

在一些情况下,模板转换寡核苷酸的长度可以是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250个核苷酸或更长。

在一些情况下,衔接子和/或条形码序列可通过模板转换以外的方法添加至RNA分子中。例如,可将一个或多个序列连接至RNA分子的末端。类似地,可将一个或多个序列连接至通过RNA分子的逆转录产生的cDNA分子的末端。

在一个实例中,提供了包含染色质和一种或多种RNA分子的细胞、细胞珠粒或细胞核。可加工细胞、细胞珠粒或细胞核中的染色质以提供源自所述染色质的第一模板核酸片段(例如,如本文所述的标签化片段)。染色质可在本体溶液中进行加工。可加工RNA分子以提供源自RNA分子的第二模板核酸片段(例如,如本文所述)。RNA分子可在分区内进行加工。第一模板核酸片段的构型可至少部分地取决于用于产生第一模板核酸片段的转座酶-核酸复合物的结构。例如,转座酶-核酸复合物,如图9所示的转座酶-核酸复合物可用于制备第一模板核酸片段。第一模板核酸片段可以是至少部分双链的。第一模板核酸片段可包含双链区,所述双链区包含细胞、细胞珠粒或细胞核的染色质的序列。双链区的第一链的第一末端可连接至第一转座子末端序列(例如嵌合末端序列),所述第一转座子末端序列可连接至第一测序引物或其部分。双链区的第二链的第一末端(所述末端与第一链的第一末端相对)可连接至第二转座子末端序列(例如嵌合末端序列),所述第二转座子末端序列可连接至第二测序引物或其部分。第二转座子末端序列可与第一转座子末端序列相同或不同。第一测序引物或其部分可与第二测序引物或其部分相同或不同。在一些情况下,所述第一测序引物或其部分可以是R1序列或其部分,并且第二测序引物或其部分可以是R2序列或其部分。第一转座子末端序列可与第一互补序列(例如嵌合末端反向互补序列)杂交,所述第一互补序列可以不连接至第一模板核酸片段的双链区的第二链的第二末端。类似地,第二转座子末端序列可与第二互补序列(例如嵌合末端反向互补序列)杂交,所述第二互补序列可以不连接至第一模板核酸片段的双链区的第一链的第二末端。换言之,第一模板核酸片段可包含一个或多个缺口。在一些情况下,一个或多个缺口的长度可各自为大约9bp。第二模板核酸片段(例如,另外模板核酸片段)可包含细胞、细胞珠粒或细胞核的RNA分子的序列和与引物分子(例如捕获核酸分子)杂交的序列。例如,第二模板核酸片段可包含细胞、细胞珠粒或细胞核的RNA分子的序列和与引物分子的多聚T序列杂交的多聚A序列。引物分子还可包含另外引物序列。

包含第一模板核酸片段(例如,标签化片段)的细胞、细胞珠粒或细胞核可与一种或多种试剂共同分配到多个分区中的一个分区中(例如,如本文所述)。分区可以是例如液滴或孔。分区可包含一个或多个珠粒(例如,如本文所述)。一个或多个珠粒中的一个珠粒可包含第一多个核酸条形码分子。第一多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列(例如,P5序列)、条形码序列、测序引物或其部分(例如,R1序列或其部分,或其互补序列)以及被配置为与本文别处所述的夹板寡核苷酸杂交的序列中的一者或多者。测序引物或其部分可与第一模板核酸片段的序列互补。一个或多个珠粒中的一个珠粒还可包含第二多个核酸条形码分子。第二多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列(例如,P5序列)、条形码序列、测序引物或其部分(例如,R1序列或其部分,或其互补序列)以及被配置为与如本文别处所述的夹板寡核苷酸杂交的序列中的一者或多者。例如,第一多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列(例如,P5序列)、条形码序列以及被配置为与如本文别处所述的夹板寡核苷酸杂交的序列中的一者或多者。第二多个核酸条形码分子中的核酸条形码分子可包含测序引物或其部分(例如,R1序列或其部分,或其互补序列)、条形码序列和被配置为与核酸分子(例如,RNA分子)杂交的捕获序列(例如,多聚T序列)。在一些情况下,所述第一多个核酸条形码分子和所述第二多个核酸条形码分子可以是相同的。

在分区内,可加工RNA分子以提供第二模板核酸片段(例如,如本文所述)。

在分区内,细胞、细胞珠粒或细胞核可被溶解或透化以接近其中的第一和/或第二模板核酸片段(例如,如本文所述)。第二模板核酸片段可在细胞、细胞珠粒或细胞核溶解或透化之后产生。

第一和第二模板核酸片段可在分区内进行加工。在分区内,第一模板核酸分子中的缺口可通过缺口填充延伸过程(例如,使用DNA聚合酶或逆转录酶)填充。可使所得双链核酸分子变性以提供包含染色质序列的单链,所述染色质序列侧接转座子末端序列和/或与转座子末端序列互补的序列。每个转座子末端序列和/或与转座子末端序列互补的序列可连接至测序引物或其部分,或其互补序列(例如,R1或R2序列或其一部分,或其互补序列)。第一多个核酸条形码分子中的核酸条形码分子可与单链的测序引物或其部分或其互补序列杂交。然后可使用引物延伸反应来产生单链的互补序列(例如,使用DNA聚合酶或逆转录酶)。这种过程可相当于线性扩增过程。此过程并入第一多个核酸条形码分子中的核酸条形码分子的条形码序列或其互补序列。可使所得双链分子变性以提供单链,所述单链包含第一多个核酸条形码分子中的核酸条形码分子的流动池衔接子序列或其互补序列;第一多个核酸条形码分子中的核酸条形码分子的条形码序列或其互补序列;第一多个核酸条形码分子中的核酸条形码分子的测序引物或其部分,或其互补序列;转座子末端序列和/或其互补序列;第二测序引物或其部分,或其互补序列。另外扩增过程可以或可以不在分区内进行。例如,指数扩增可以或可以不在分区内进行。

在分区内,源自细胞、细胞珠粒或细胞核的RNA分子的第二模板核酸片段可被逆转录(例如,使用逆转录酶)以提供cDNA链。逆转录过程可将序列附加到包含RNA链和cDNA链的所得双链核酸分子的链的末端,如多聚C序列。模板转换寡核苷酸可包含可与双链核酸分子的至少一部分(例如,与附加的多聚C序列)杂交并用于进一步延伸所述双链核酸分子的链的序列(例如,多聚G序列)以提供延伸的双链核酸分子。这样的序列可包含核糖碱基。模板转换寡核苷酸可包含UMI序列或其互补序列,以及测序引物或其部分或其互补序列。可使包含模板转换寡核苷酸及其互补序列的延伸的双链核酸分子和先前的双链核酸分子变性以提供单链,所述单链包含第二多个核酸条形码分子中的核酸条形码分子的测序引物或其部分或其互补序列;UMI序列或其互补序列;多聚(C)或多聚(G)序列;对应于细胞、细胞珠粒或细胞核的RNA分子的序列或其互补序列;以及捕获核酸分子的序列或其互补序列。第二多个核酸条形码分子中的核酸条形码分子可与单链的测序引物或其部分或其互补序列杂交。然后可使用引物延伸反应来产生单链的互补序列(例如,使用DNA聚合酶)。这种过程可相当于线性扩增过程。此过程并入第二多个核酸条形码分子中的核酸条形码分子的条形码序列或其互补序列。可使所得双链分子变性以提供单链,所述单链包含第二多个核酸条形码分子中的核酸条形码分子的流动池衔接子序列或其互补序列;第二多个核酸条形码分子中的核酸条形码分子的条形码序列或其互补序列;第二多个核酸条形码分子中的核酸条形码分子的测序引物或其部分,或其互补序列;UMI序列或其互补序列;多聚(C)或多聚(G)序列;对应于细胞、细胞珠粒或细胞核的RNA分子的序列或其互补序列;以及捕获核酸分子的序列或其互补序列。另外扩增过程可以或可以不在分区内进行。例如,指数扩增可以或可以不在分区内进行。

对应于在多个分区中的分区内包含的细胞、细胞珠粒或细胞核的染色质和RNA分子的线性扩增产物可从所述分区中回收。例如,可汇集多个分区的内容物以在本体溶液中提供线性扩增产物。然后可使对应于染色质的线性扩增产物经受足以进行一种或多种核酸扩增反应(例如,PCR)的条件以产生对应于染色质的一种或多种扩增产物。核酸扩增过程可并入一个或多个另外序列,如一个或多个另外流动池衔接子序列。对应于RNA分子的线性扩增产物可经受片段化、末端修复和dA加尾过程。然后可将另外引物序列(例如测序引物或其部分,如R2序列)连接至所得分子。然后可进行核酸扩增反应(例如,PCR)以产生对应于RNA分子的一种或多种扩增产物。核酸扩增过程可并入一个或多个另外序列,如一个或多个另外流动池衔接子序列(参见例如,图12)。

在RNA工作流程中,分区内模板转换可将测序引物(例如,TruSeq R1或R2序列)连接至RNA转录物的3’或5’端。携带测序引物或其部分(例如部分TruSeq R1或R2序列)的珠粒(例如,凝胶珠粒)也可用于DNA(例如染色质)工作流程中的引发。这可允许在从分区除去材料(例如破乳剂)和样品分裂后对DNA(例如ATAC)和RNA文库进行差异扩增。这种方法的另一个优点是可使用相同的酶(例如DNA聚合酶或逆转录酶)对源自DNA(例如染色质)和RNA的核酸片段进行条形码化。

图12示出对应于前一实例的示例性示意图。图1200示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图1250示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。在图中,示出了两个不同的珠粒(例如,凝胶珠粒)。然而,在每个工作流程中可使用同一珠粒(例如,可以是多功能珠粒的单个凝胶珠粒)。

如图1200所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)1204,所述模板核酸片段包含插入序列1208(例如,开放染色质的区域)及其互补序列、转座子末端序列1206及其互补序列、测序引物或其部分1202(例如,R1序列)、测序引物或其部分1210(例如,R2序列)和缺口1207。模板核酸片段1204然后可分配在分区内(例如,如本文所述的液滴或孔)。在分区内,包含模板核酸片段1204的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段1204(和一种或多种RNA分子)。可通过缺口填充延伸过程(例如,使用DNA聚合酶)来填充1212缺口1207。分区可包括与核酸条形码分子1218a偶联的珠粒(例如凝胶珠粒)1216a。核酸条形码分子1218a可包含流动池衔接子序列1220a(例如,P5序列)、条形码序列1222a和测序引物或其部分或其互补序列1202’。序列1202’可与模板核酸片段1204的序列1202或其互补序列杂交,并且进行引物延伸1214以产生包含序列1220a、1222a、1202’、1210和插入序列1208或其互补序列的链。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供链。此链可进行扩增(例如,PCR)1224以提供双链扩增产物1226,所述双链扩增产物包含核酸条形码分子1218a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列1228(例如,P7序列)。

与图1200的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图1250所示,包含RNA序列1260和多聚A序列1262的RNA分子1258可与包含多聚T序列1254和另外引物序列1256的引物分子1252接触1264。然后可使用具有末端转移酶活性的逆转录酶将RNA分子1258的多聚T序列1254逆转录1266出来,所述逆转录酶可将序列1268附加到包含cDNA序列1270的所得cDNA分子上。序列1268可以是多聚C序列。包含测序引物或其部分或其互补序列1274、独特分子标识符序列或其互补序列1276和捕获序列(例如,多聚G序列)1278的模板转换寡核苷酸1272然后可与RNA-cDNA分子杂交1280,并且模板转换可发生。分区可包括与核酸条形码分子1218b偶联的珠粒(例如,凝胶珠粒)1216b。核酸条形码分子1218b可包含流动池衔接子序列1220b(例如,P5序列)、条形码序列1222b和测序引物或其部分或其互补序列1274’。珠粒1216b可与珠粒1216a相同,以使得分区包含单个珠粒(例如,1218a和1218b附接至单个珠粒)。在这种情况下,核酸条形码分子1218b和核酸条形码分子1218a可具有相同的序列。序列1274’可与cDNA分子的序列1274或其互补序列杂交,并且进行引物延伸1282以产生包含序列1220b、1222b、1274’、1276或其互补序列1268、或其互补序列和插入序列1270或其互补序列的链。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供链。此链可进行扩增(例如,PCR)1284以提供双链扩增产物1286,所述双链扩增产物包含核酸条形码分子1218b、原始RNA分子的序列或与其对应的cDNA以及任选的另外序列1288,所述另外序列可包含测序引物或其部分(例如,R2序列)1290、样品索引序列1292和流动池衔接子序列(例如,P7序列)1294。

图13示出对应于前一实例的另一示例性示意图。图1300示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图1350示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。在图中,示出了两个不同的珠粒(例如,凝胶珠粒)。然而,在每个工作流程中可使用同一珠粒(例如,凝胶珠粒)。

如图1300所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)1304,所述模板核酸片段包含插入序列1308(例如,开放染色质的区域)及其互补序列、转座子末端序列1306及其互补序列、测序引物或其部分1302(例如,R1序列)、测序引物或其部分1310(例如,R2序列)和缺口1307。模板核酸片段1304然后可分配在分区内(例如,如本文所述的液滴或孔)。在分区内,包含模板核酸片段1304的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段1304(和一种或多种RNA分子)。可通过缺口填充延伸过程(例如,使用DNA聚合酶)来填充1312缺口1307。分区可包括与核酸条形码分子1318a偶联的珠粒(例如凝胶珠粒)1316a。核酸条形码分子1318a可包含流动池衔接子序列1320a(例如,P5序列)、条形码序列1322a和测序引物或其部分或其互补序列1302’。序列1302’可与模板核酸片段1304的序列1302或其互补序列杂交,并且进行引物延伸1314以产生包含序列1320a、1322a、1302’、1310和插入序列1308或其互补序列的链。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供链。此链可进行扩增(例如,PCR)1324以提供双链扩增产物1326,所述双链扩增产物包含核酸条形码分子1318a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列1328(例如,P7序列)。

与图1300的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图1350所示,包含RNA序列1360和多聚A序列1362的RNA分子1358可与包含多聚T序列1354、UMI序列1355和测序引物或其部分(例如,R1序列)1356的引物分子1352接触。可使用具有末端转移酶活性的逆转录酶将RNA分子1358的多聚T序列1354逆转录1364出来,所述逆转录酶可将序列1366(例如,多聚C序列)附加到包含cDNA序列1368的所得cDNA分子上。包含另外引物序列1372和与序列1366互补的同聚物序列1374(例如多聚G)序列的模板转换寡核苷酸1370然后可与cDNA分子杂交1376并且可发生模板转换。分区可包括与核酸条形码分子1318b偶联的珠粒(例如,凝胶珠粒)1316b。核酸条形码分子1318b可包含流动池衔接子序列1320b(例如,P5序列)、条形码序列1322b和测序引物或其部分或其互补序列1356’。珠粒(例如,凝胶珠粒)1316b可与珠粒(例如,凝胶珠粒)1316a相同,以使得分区包含单个珠粒(即,1318a和1318b附接至单个珠粒)。在这种情况下,核酸条形码分子1318b和核酸条形码分子1318a可具有相同的序列。序列1356’可与cDNA分子的序列1356或其互补序列杂交,并且进行引物延伸1378以产生包含序列1320b、1322b、1356’、1355或其互补序列1366、或其互补序列和插入序列1368或其互补序列的链。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供链。此链可进行扩增(例如,PCR)1380以提供双链扩增产物1382,所述双链扩增产物包含核酸条形码分子1318b、原始RNA分子的序列或与其对应的cDNA以及任选的另外序列1384,所述另外序列可包含测序引物或其部分(例如,R2序列)1390、样品索引序列1388和流动池衔接子序列(例如,P7序列)1386。

在另一个实例中,提供了包含染色质和一种或多种RNA分子的细胞、细胞珠粒或细胞核。可加工细胞、细胞珠粒或细胞核中的染色质以提供源自所述染色质的第一模板核酸片段(例如,如本文所述的标签化片段)。染色质可在本体溶液中进行加工。可加工RNA分子以提供源自RNA分子的第二模板核酸片段(例如,如本文所述)。RNA分子可在分区内进行加工。第一模板核酸片段的构型可至少部分地取决于用于产生第一模板核酸片段的转座酶-核酸复合物的结构。例如,转座酶-核酸复合物,如图9所示的转座酶-核酸复合物可用于制备第一模板核酸片段。第一模板核酸片段可以是至少部分双链的。第一模板核酸片段可包含双链区,所述双链区包含细胞、细胞珠粒或细胞核的染色质的序列。双链区的第一链的第一末端可连接至第一转座子末端序列(例如嵌合末端序列),所述第一转座子末端序列可连接至第一测序引物或其部分。双链区的第二链的第一末端(所述末端与第一链的第一末端相对)可连接至第二转座子末端序列(例如嵌合末端序列),所述第二转座子末端序列可连接至第二测序引物或其部分。第二转座子末端序列可与第一转座子末端序列相同或不同。第一测序引物或其部分可与第二测序引物或其部分相同或不同。在一些情况下,所述第一测序引物或其部分可以是R1序列或其部分,并且第二测序引物或其部分可以是R2序列或其部分。第一转座子末端序列可与第一互补序列(例如嵌合末端反向互补序列)杂交,所述第一互补序列可以不连接至第一模板核酸片段的双链区的第二链的第二末端。类似地,第二转座子末端序列可与第二互补序列(例如嵌合末端反向互补序列)杂交,所述第二互补序列可以不连接至第一模板核酸片段的双链区的第一链的第二末端。换言之,第一模板核酸片段可包含一个或多个缺口。在一些情况下,一个或多个缺口的长度可各自为大约9bp。例如,一个或多个缺口的长度可以是至少约1、2、3、4、5、6、7、8、9、10或更多bp。例如,一个或多个缺口的长度可以是至多约10、9、8、7、6、5、4、3、2或1bp。第二模板核酸片段(例如,另外模板核酸片段)可包含细胞、细胞珠粒或细胞核的RNA分子的序列和与引物分子(例如捕获核酸分子)杂交的序列。例如,第二模板核酸片段可包含细胞、细胞珠粒或细胞核的RNA分子的序列和与引物分子的多聚T序列杂交的多聚A序列。引物分子还可包含另外引物序列。

包含第一模板核酸片段(例如,标签化片段)的细胞、细胞珠粒或细胞核可与一种或多种试剂共同分配到多个分区中的一个分区中(例如,如本文所述)。分区可以是例如液滴或孔。分区可包含一个或多个珠粒(例如,如本文所述)。一个或多个珠粒中的一个珠粒(例如,凝胶珠粒)可包含第一多个核酸条形码分子。第一多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列(例如,P5序列)、条形码序列和测序引物或其部分(例如,R1序列或其部分,或其互补序列)。测序引物或其部分可与第一模板核酸片段的序列互补。流动池衔接子序列和/或条形码序列可与它们的互补序列杂交。一个或多个珠粒中的一个珠粒(例如,凝胶珠粒)也可包含第二多个核酸条形码分子。第二多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列(例如,P5序列)、条形码序列、测序引物或其部分(例如,R1序列或其部分,或互补序列)、UMI序列和捕获序列(例如,多聚G序列、多聚dT序列或靶特异性序列)。在一些情况下,第一多个核酸条形码分子和第二多个核酸条形码分子可偶联至同一珠粒,并且分区可包含单个珠粒。

在分区内,可加工RNA分子以提供第二模板核酸片段(例如,如本文所述)。

在分区内,细胞、细胞珠粒或细胞核可被溶解或透化以接近其中的第一和/或第二模板核酸片段(例如,如本文所述)。第二模板核酸片段可在细胞、细胞珠粒或细胞核溶解或透化之后产生。

第一和第二模板核酸片段可在分区内进行加工。在分区内,对应于细胞、细胞珠粒或细胞核的染色质的第一模板核酸片段的测序引物或其部分可与第一多个核酸条形码分子中的核酸条形码分子的测序引物或其部分杂交。然后可将核酸条形码分子的测序引物或其部分连接(例如,使用连接酶)至第一模板核酸片段的转座子末端序列或其互补序列,以提供对应于细胞、细胞珠粒或细胞核的染色质的部分双链核酸分子。

在分区内,源自细胞、细胞珠粒或细胞核的RNA分子的第二模板核酸片段可被逆转录(例如,使用逆转录酶)以提供cDNA链。逆转录过程可将序列附加到包含RNA链和cDNA链的所得双链核酸分子的链的末端,如多聚C序列。第二多个核酸条形码分子中的核酸条形码分子的捕获序列可与双链核酸分子的附加序列(例如,多聚C序列)杂交,并且可发生模板转换过程以提供延伸的双链核酸分子。这样的序列可包含核糖碱基。第二多个核酸条形码分子中的核酸条形码分子的序列可被认为是模板转换寡核苷酸。因此,条形码化和模板转换可同时发生以提供条形码化cDNA分子。条形码化cDNA分子(例如,包含cDNA链和RNA链的分子)的cDNA链可包含多聚C序列、与模板转换寡核苷酸的序列或其部分互补的序列(例如,与模板转换寡核苷酸的测序引物、条形码序列和UMI序列互补的序列)、cDNA序列、多聚T序列以及引物分子的另外引物序列。条形码化cDNA分子的RNA链可包含模板转换寡核苷酸的序列、mRNA序列以及与引物分子的另外引物序列互补的序列。

对应于细胞、细胞珠粒或细胞核的染色质的部分双链分子和对应于多个分区中的分区(例如,液滴或孔)内所包含的细胞、细胞珠粒或细胞核的RNA分子的条形码化cDNA分子可从所述分区中回收。例如,可汇集多个分区的内容以在本体溶液中提供这些产物。

在分区之外,对应于染色质的部分双链核酸分子中的缺口可通过缺口填充延伸过程(例如,使用DNA聚合酶或逆转录酶)来填充。缺口填充延伸过程可能不包括链置换。可使所得的缺口填充双链核酸分子变性以提供单链,所述单链可经受足以进行一种或多种核酸扩增反应(例如,PCR)的条件以产生对应于细胞、细胞珠粒或细胞核的染色质。核酸扩增过程可并入一个或多个另外序列,如一个或多个另外流动池衔接子序列。

在分区之外,对应于RNA分子的条形码化cDNA分子可经受片段化、末端修复、dA加尾过程、标签化或它们的组合。可将另外引物序列(例如测序引物或其部分,如R2序列)连接至所得分子。可替代地或此外,可进行核酸扩增反应(例如,PCR)以产生一种或多种对应于由其产生的RNA分子或cDNA分子的扩增产物。核酸扩增过程可并入一个或多个另外序列,如一个或多个另外流动池衔接子序列。

图14示出对应于前一实例的示例性示意图。图1400示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图1450示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。

如图1400所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)1404,所述模板核酸片段包含插入序列1408(例如,开放染色质的区域)及其互补序列、转座子末端序列1406及其互补序列、测序引物或其部分1402(例如,R1序列)、测序引物或其部分1410(例如,R2序列)和缺口1407。模板核酸片段1404然后可分配在分区内(例如,如本文所述的液滴或孔)。在分区内,包含模板核酸片段1404的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段1404(和一种或多种RNA分子)。分区可包括与核酸条形码分子1418a和1418b偶联的珠粒(例如凝胶珠粒)1416。核酸条形码分子1418a可包含流动池衔接子序列1420a(例如,P5序列)、条形码序列1422a和测序引物或其部分或其互补序列1402’。序列1420a和1422a可分别与互补序列1420’和1422’杂交。序列1402’可与模板核酸片段1404的序列1402或其互补序列杂交,并且序列1422’可与模板核酸片段1404的序列1402连接1412。在一些情况下,模板核酸片段1404可使用合适的激酶(例如,多核苷酸激酶(PNK),如T4 PNK)磷酸化。在一些情况下,PNK和ATP可在标签化(例如ATAC)反应中和/或在分配细胞、细胞珠粒或细胞核或其它们中的多者之前大量添加。可将15U的PNK和1mM的ATP掺杂至标签化反应中。例如,可将少于95U的PNK掺杂至标签化反应中。然后可在本体溶液中回收分区的内容物(例如,可使液滴破坏)以提供部分双链核酸分子,所述部分双链核酸分子包含在本体溶液中附接至模板核酸片段1404的核酸条形码分子1418a。在本体溶液中,可通过缺口填充延伸过程(例如,使用DNA聚合酶)填充1424缺口1407以提供双链核酸分子。此分子可进行扩增(例如,PCR)1426以提供双链扩增产物1428,所述双链扩增产物包含核酸条形码分子1418a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列1430(例如,P7序列)。可在批量加工之前填充分区中的缺口。

与图1400的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图1450所示,包含RNA序列1460和多聚A序列1462的RNA分子1458可与包含多聚T序列1454和另外引物序列1456的引物分子1452接触1464。然后可使用具有末端转移酶活性的逆转录酶将RNA分子1458的多聚T序列1454逆转录1476出来,所述逆转录酶可将序列1470附加到包含cDNA序列1468的所得cDNA分子上。序列1470可以是多聚C序列。珠粒(例如,凝胶珠粒)1416(例如,在图1400中描述的相同珠粒)可包括在分区内并且可与核酸条形码分子1418b偶联。核酸条形码分子1418b可包含流动池衔接子序列1420b(例如P5序列)、条形码序列1422b、UMI序列1472和与序列1470互补的序列1474(例如多聚G序列)。在一些情况下,核酸条形码分子1418b可包含测序引物序列1420b(例如R1序列或部分R1序列)、条形码序列1422b、UMI序列1472和与序列1470互补的模板转换序列1474(例如,多聚G序列)。核酸条形码分子1418b可用于进行模板转换1478,所述过程也可导致产生条形码化的cDNA分子。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供条形码化cDNA分子。条形码化cDNA分子可进行扩增(例如PCR)1480以提供双链扩增产物1484,所述双链扩增产物包含核酸条形码分子1418b、原始RNA分子的序列或与其对应的cDNA、流动池衔接子序列1486和另外序列1488,所述另外序列可包含测序引物或其部分(例如,R2序列)1490、样品索引序列1492和流动池衔接子序列(例如,P7序列)1494。条形码化cDNA分子还可或可替代地进行片段化、末端修复、dA加尾、一个或多个衔接子序列的连接和/或核酸扩增。

图15示出对应于前一实例的另一示例性示意图。图1500示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图1550示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。

如图1500所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)1504,所述模板核酸片段包含插入序列1508(例如,开放染色质的区域)及其互补序列、转座子末端序列1506及其互补序列、测序引物或其部分1502(例如,R1序列)、测序引物或其部分1510(例如,R2序列)和缺口1507。模板核酸片段1504然后可分配在分区内(例如,如本文所述的液滴或孔)。在分区内,包含模板核酸片段1504的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段1504(和一种或多种RNA分子)。分区可包括与核酸条形码分子1518a和1518b偶联的珠粒(例如凝胶珠粒)1516。核酸条形码分子1518a可包含流动池衔接子序列1520a(例如,P5序列)、条形码序列1522a和测序引物或其部分或其互补序列1502’。序列1520a和1522a可分别与互补序列1520’和1522’杂交。序列1502’可与模板核酸片段1504的序列1502或其互补序列杂交,并且序列1522’可与模板核酸片段1504的序列1502连接1512。在一些情况下,模板核酸片段1504可使用合适的激酶(例如,多核苷酸激酶(PNK),如T4 PNK)磷酸化。PNK和ATP可在标签化(例如ATAC)反应中和/或在分配细胞、细胞珠粒或细胞核或其多者之前大量添加。可将15U的PNK和1mM的ATP掺杂至标签化反应中。例如,可将少于95U的PNK掺杂至标签化反应中。然后可在本体溶液中回收分区的内容物(例如,可使液滴破坏)以提供部分双链核酸分子,所述部分双链核酸分子包含在本体溶液中附接至模板核酸片段1504的核酸条形码分子1518a。在本体溶液中,可通过缺口填充延伸过程(例如,使用DNA聚合酶)填充1524缺口1507以提供双链核酸分子。此分子可进行扩增(例如,PCR)1526以提供双链扩增产物1528,所述双链扩增产物包含核酸条形码分子1518a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列1530(例如,P7序列)。可在批量加工之前填充分区中的缺口。

与图1500的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图1550所示,可在分区内提供包含RNA序列1560和多聚A序列1562和珠粒(例如凝胶珠粒)1516的RNA分子1558。珠粒(例如,凝胶珠粒)1516(例如,在图1500中描述的相同珠粒)可包括在分区内并且可与核酸条形码分子1518b偶联。核酸条形码分子1518b可包含流动池衔接子序列1568(例如P5序列)、条形码序列1522b(例如与条形码序列1522a相同的条形码序列)、UMI序列1566和与多聚A序列1562互补的多聚T序列1564。在一些情况下,核酸条形码分子1518b可包含测序引物序列1568(例如,R1序列或部分R1序列)、条形码序列1522b(例如,与条形码序列1522a相同的条形码序列)、UMI序列1566和与多聚A序列1562互补的多聚T序列1564。多聚T序列1564可与RNA分子1558的多聚A序列1562杂交。RNA分子1558可从多聚T序列1564逆转录1570出来,以提供包含cDNA序列1572的cDNA分子。逆转录过程可使用具有末端转移酶活性的逆转录酶,所述逆转录酶可将序列1574附加到包含cDNA序列1572的所得cDNA分子上。序列1574可以是多聚C序列。包含引物序列1580和与序列1574互补的序列(例如多聚G序列)的模板转换寡核苷酸1578可与cDNA分子杂交并促进模板转换寡核苷酸1578上的模板转换反应。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供cDNA分子。cDNA分子可进行扩增(例如,PCR)1584。可进行另外扩增(例如,PCR)1586以提供双链扩增产物1588,所述双链扩增产物包含核酸条形码分子1518b、原始RNA分子的序列或与其对应的cDNA、流动池衔接子序列1598(例如,P7序列)和另外序列1590,所述另外序列可包含测序引物或其部分(例如,R2序列)1596、样品索引序列1594和流动池衔接子序列(例如,P5序列)1592。条形码化cDNA分子还可或可替代地进行片段化、末端修复、dA加尾、一个或多个衔接子序列的连接和/或核酸扩增。

在另一个实例中,提供了包含染色质和一种或多种RNA分子的细胞、细胞珠粒或细胞核。可加工细胞、细胞珠粒或细胞核中的染色质以提供源自所述染色质的第一模板核酸片段(例如,如本文所述的标签化片段)。染色质可在本体溶液中进行加工。可加工RNA分子以提供源自RNA分子的第二模板核酸片段(例如,如本文所述的另外核酸片段)。RNA分子可在分区内进行加工。源自RNA分子的第二模板核酸片段可根据前述实例进行加工。第一模板核酸片段的构型可至少部分地取决于用于产生第一模板核酸片段的转座酶-核酸复合物的结构。例如,转座酶-核酸复合物,如图9所示的转座酶-核酸复合物可用于制备第一模板核酸片段。相对于前述实施例,转座酶-核酸的极性可逆转,以使得测序引物(例如,R1和R2测序引物)不直接连接至染色质(参见,例如,图17)。第一模板核酸片段可以是至少部分双链的。第一模板核酸片段可包含双链区,所述双链区包含细胞、细胞珠粒或细胞核的染色质的序列。双链区的第一链的第一末端可连接至第一转座子末端序列(例如,嵌合末端序列)。双链区的第二链的第一末端(所述末端与第一链的第一末端相对)可连接至第二转座子末端序列(例如嵌合末端序列)。第二转座子末端序列可与第一转座子末端序列相同或不同。第一转座子末端序列可与第一互补序列(例如嵌合末端反向互补序列)杂交,所述第一互补序列可以不连接至第一模板核酸片段的双链区的第二链的第二末端。第一互补序列可连接至第一测序引物或其部分。类似地,第二转座子末端序列可与第二互补序列(例如嵌合末端反向互补序列)杂交,所述第二互补序列可以不连接至第一模板核酸片段的双链区的第一链的第二末端。第二互补序列可连接至第二测序引物或其部分。换言之,第一模板核酸片段可包含一个或多个缺口。在一些情况下,一个或多个缺口的长度可各自为大约9bp。例如,一个或多个缺口的长度可以是至少约1、2、3、4、5、6、7、8、9、10或更多bp。例如,一个或多个缺口的长度可以是至多约10、9、8、7、6、5、4、3、2或1bp。第一测序引物或其部分可与第二测序引物或其部分相同或不同。在一些情况下,所述第一测序引物或其部分可以是R1序列或其部分,并且第二测序引物或其部分可以是R2序列或其部分。

包含第一模板核酸片段(例如,标签化片段)的细胞、细胞珠粒或细胞核可与一种或多种试剂共同分配到多个分区中的一个分区中(例如,如本文所述)。分区可以是例如液滴或孔。分区可包含一个或多个珠粒(例如,如本文所述)。一个或多个珠粒中的一个珠粒(例如,凝胶珠粒)可包含第一多个核酸条形码分子。第一多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列(例如,P5序列)、条形码序列和测序引物或其部分(例如,R1序列或其部分,或其互补序列)。测序引物或其部分可与第一模板核酸片段的序列互补。流动池衔接子序列和/或条形码序列可与它们的互补序列杂交。同一珠粒或另一个珠粒可包含第二多个核酸条形码分子。第二多个核酸条形码分子中的核酸条形码分子可包含测序引物或其部分(例如,R1序列或其部分,或其互补序列)、条形码序列、独特分子标识符序列和捕获顺序。

在分区内,可加工RNA分子以提供第二模板核酸片段(例如,如本文所述)。例如,RNA分子(例如,mRNA分子)可与包含第一引物序列(例如,多聚T序列)和另外引物序列的引物分子接触。

在分区内,细胞、细胞珠粒或细胞核可被溶解或透化以接近其中的第一和/或第二模板核酸片段(例如,如本文所述)。第二模板核酸片段可在细胞、细胞珠粒或细胞核溶解或透化之后产生。

第一和第二模板核酸片段可在分区内进行加工。在分区内,对应于细胞、细胞珠粒或细胞核的染色质的第一模板核酸片段的测序引物或其部分可与第一多个核酸条形码分子中的核酸条形码分子的测序引物或其部分杂交。然后可将核酸条形码分子的测序引物或其部分连接(例如,使用连接酶)至第一模板核酸片段的转座子末端序列或其互补序列,以提供对应于细胞、细胞珠粒或细胞核的染色质的部分双链核酸分子。对应于RNA分子的第二模板核酸片段可使用具有末端转移酶活性的逆转录酶进行逆转录,所述逆转录酶可将序列(例如多聚C序列)附加到所得cDNA分子的cDNA链上。然后可使cDNA分子与可以是模板转换寡核苷酸的第二多个核酸条形码分子中的核酸条形码分子接触。核酸条形码分子可包含测序引物或其部分(例如,R1序列或其部分,或其互补序列)、条形码序列、独特分子标识符序列和捕获序列。捕获序列可以是与附加到cDNA链上的序列(例如,多聚G序列)互补的序列。然后可进行模板转换和条形码化以提供条形码化cDNA分子。

对应于细胞、细胞珠粒或细胞核的染色质的部分双链分子和对应于多个分区中的分区内所包含的细胞、细胞珠粒或细胞核的RNA分子(例如,如上文所述制备)的条形码化cDNA分子可从所述分区中回收。例如,可汇集多个分区的内容物以在本体溶液中提供线性扩增产物。

在分区之外,对应于染色质的部分双链核酸分子中的缺口可通过缺口填充延伸过程(例如,使用DNA聚合酶)来填充。可在批量加工之前填充分区中的缺口。可使所得的缺口填充双链核酸分子变性以提供单链,所述单链可经受足以进行一种或多种核酸扩增反应(例如,PCR)的条件以产生对应于细胞、细胞珠粒或细胞核的染色质。核酸扩增过程可并入一个或多个另外序列,如一个或多个另外流动池衔接子序列。对应于RNA分子的条形码化cDNA分子也可根据前述实例进行加工和扩增。

图16示出对应于前一实例的示例性示意图。图1600示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图1650示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。

如图1600所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)1604,所述模板核酸片段包含插入序列1608(例如,开放染色质的区域)及其互补序列、转座子末端序列1606及其互补序列、测序引物或其部分1602(例如,R1序列)、测序引物或其部分1610(例如,R2序列)和缺口1607。模板核酸片段1604然后可分配在分区内(例如,如本文所述的液滴或孔)。在分区内,包含模板核酸片段1604的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段1604(和一种或多种RNA分子)。分区可包括与核酸条形码分子1618a和1618b偶联的珠粒(例如凝胶珠粒)1616。核酸条形码分子1618a可包含流动池衔接子序列1620a(例如,P5序列)、条形码序列1622a和测序引物或其部分或其互补序列1602’。序列1602’可与模板核酸片段1604的序列1602或其互补序列杂交。然后可将序列1602’连接1612至模板核酸片段1604的转座子末端序列1606。在一些情况下,1604可使用合适的激酶(例如,多核苷酸激酶(PNK),如T4 PNK)磷酸化。在一些实例中,PNK和ATP可在标签化(例如ATAC)反应中和/或在分配细胞、细胞珠粒或细胞核或其多者之前大量添加。可将15U的PNK和1mM的ATP掺杂至标签化反应中。例如,可将少于95U的PNK掺杂至标签化反应中。然后可在本体溶液中回收分区的内容物(例如,可使液滴破坏)以提供部分双链核酸分子,所述部分双链核酸分子包含在本体溶液中附接至模板核酸片段1604的核酸条形码分子1618a。在本体溶液中,可通过缺口填充延伸过程(例如,使用DNA聚合酶)和从序列1602延伸的分子填充1614缺口1607以提供双链核酸分子。此分子可进行扩增(例如,PCR)1624以提供双链扩增产物1626,所述双链扩增产物包含核酸条形码分子1618a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列1628(例如,P7序列)。可在批量加工之前填充分区中的缺口。

与图1600的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图1650所示,包含RNA序列1660和多聚A序列1662的RNA分子1658可与包含多聚T序列1654和另外引物序列1656的引物分子1652接触1664。然后可使用具有末端转移酶活性的逆转录酶将RNA分子1658的多聚T序列1654逆转录1676出来,所述逆转录酶可将序列1670附加到包含cDNA序列1668的所得cDNA分子上。序列1670可以是多聚C序列。珠粒(例如,凝胶珠粒)1616(例如,在图1600中描述的相同珠粒)可包括在分区内并且可与核酸条形码分子1618b偶联。核酸条形码分子1618b可包含流动池衔接子序列1620b(例如P5序列)、条形码序列1622b、UMI序列1672和与序列1670互补的序列1674(例如多聚G序列)。在一些情况下,核酸条形码分子1618b可包含测序引物序列1620b(例如R1序列或部分R1序列)、条形码序列1622b、UMI序列1672和与序列1670互补的模板转换序列1674(例如,多聚G序列)。核酸条形码分子1618b可用于进行模板转换1678,所述过程也可导致产生条形码化的cDNA分子。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供条形码化cDNA分子。条形码化cDNA分子可进行扩增(例如PCR)1680以提供双链扩增产物1684,所述双链扩增产物包含核酸条形码分子1618b、原始RNA分子的序列或与其对应的cDNA、流动池衔接子序列1686和另外序列1688,所述另外序列可包含测序引物或其部分(例如,R2序列)1690、样品索引序列1692和流动池衔接子序列(例如,P7序列)1694。条形码化cDNA分子还可或可替代地进行片段化、末端修复、dA加尾、一个或多个衔接子序列的连接和/或核酸扩增。

图17示出对应于前一实例的另一示例性示意图。图1700示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图1750示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。

如图1700所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)1704,所述模板核酸片段包含插入序列1708(例如,开放染色质的区域)及其互补序列、转座子末端序列1706及其互补序列、测序引物或其部分1702(例如,R1序列)、测序引物或其部分1710(例如,R2序列)和缺口1707。模板核酸片段1704然后可分配在分区内(例如,如本文所述的液滴或孔)。在分区内,包含模板核酸片段1704的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段1704(和一种或多种RNA分子)。分区可包括与核酸条形码分子1718a和1718b偶联的珠粒(例如凝胶珠粒)1716。核酸条形码分子1718a可包含流动池衔接子序列1720a(例如,P5序列)、条形码序列1722a和测序引物或其部分或其互补序列1702’。序列1702’可与模板核酸片段1704的序列1702或其互补序列杂交。然后可将序列1702’连接1712至模板核酸片段1704的转座子末端序列1706。在一些情况下,1704可使用合适的激酶(例如,多核苷酸激酶(PNK),如T4 PNK)磷酸化。在一些实例中,PNK和ATP可在标签化反应(例如ATAC)中和/或在分配细胞、细胞珠粒或细胞核或其多者之前大量添加。可将15U的PNK和1mM的ATP掺杂至标签化反应中。例如,可将少于95U的PNK掺杂至标签化反应中。然后可在本体溶液中回收分区的内容物(例如,可使液滴破坏)以提供部分双链核酸分子,所述部分双链核酸分子包含在本体溶液中附接至模板核酸片段1704的核酸条形码分子1718a。在本体溶液中,可通过缺口填充延伸过程(例如,使用DNA聚合酶)和从序列1702延伸的分子填充1714缺口1707以提供双链核酸分子。此分子可进行扩增(例如,PCR)1724以提供双链扩增产物1726,所述双链扩增产物包含核酸条形码分子1718a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列1728(例如,P7序列)。可在批量加工之前填充分区中的缺口。

与图1700的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图1750所示,可在分区内提供包含RNA序列1760和多聚A序列1762和珠粒(例如凝胶珠粒)1716的RNA分子1758。珠粒(例如,凝胶珠粒)1716(例如,在图1700中描述的相同珠粒)可包括在分区内并且可与核酸条形码分子1718b偶联。核酸条形码分子1718b可包含流动池衔接子序列1768(例如P5序列)、条形码序列1722b(例如与条形码序列1722a相同的条形码序列)、UMI序列1766和与多聚A序列1762互补的多聚T序列1764。在一些情况下,核酸条形码分子1718b可包含测序引物序列1768(例如,R1序列或部分R1序列)、条形码序列1722b(例如,与条形码序列1722a相同的条形码序列)、UMI序列1766和与多聚A序列1762互补的多聚T序列1764。多聚T序列1764可与RNA分子1758的多聚A序列1762杂交。RNA分子1758可从多聚T序列1764逆转录1770出来,以提供包含cDNA序列1772的cDNA分子。逆转录过程可使用具有末端转移酶活性的逆转录酶,所述逆转录酶可将序列1774附加到包含cDNA序列1772的所得cDNA分子上。序列1774可以是多聚C序列。包含引物序列1780和与序列1774互补的序列(例如多聚G序列)的模板转换寡核苷酸1778可与cDNA分子杂交。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供cDNA分子。cDNA分子可进行扩增(例如,PCR)1784。可进行另外扩增(例如,PCR)1786以提供双链扩增产物1788,所述双链扩增产物包含核酸条形码分子1718b、原始RNA分子的序列或与其对应的cDNA、流动池衔接子序列1798(例如,P7序列)和另外序列1790,所述另外序列可包含测序引物或其部分(例如,R2序列)1796、样品索引序列1794和流动池衔接子序列(例如,P5序列)1792。条形码化cDNA分子还可或可替代地进行片段化、末端修复、dA加尾、一个或多个衔接子序列的连接和/或核酸扩增。

在另一个实例中,提供了包含染色质和一种或多种RNA分子的细胞、细胞珠粒或细胞核。可加工细胞、细胞珠粒或细胞核中的染色质以提供源自所述染色质的第一模板核酸片段(例如,如本文所述的标签化片段)。染色质可在本体溶液中进行加工。可加工RNA分子以提供源自RNA分子的第二模板核酸片段(例如,如本文所述)。RNA分子可在分区内进行加工。第一模板核酸片段的构型可至少部分地取决于用于产生第一模板核酸片段的转座酶-核酸复合物的结构。例如,转座酶-核酸复合物,如图9所示的转座酶-核酸复合物可用于制备第一模板核酸片段。第一模板核酸片段可以是至少部分双链的。第一模板核酸片段可包含双链区,所述双链区包含细胞、细胞珠粒或细胞核的染色质的序列。双链区的第一链的第一末端可连接至第一转座子末端序列(例如嵌合末端序列),所述第一转座子末端序列可连接至第一测序引物或其部分。双链区的第二链的第一末端(所述末端与第一链的第一末端相对)可连接至第二转座子末端序列(例如嵌合末端序列),所述第二转座子末端序列可连接至第二测序引物或其部分。第二转座子末端序列可与第一转座子末端序列相同或不同。第一测序引物或其部分可与第二测序引物或其部分相同或不同。在一些情况下,所述第一测序引物或其部分可以是R1序列或其部分,并且第二测序引物或其部分可以是R2序列或其部分。第一转座子末端序列可与第一互补序列(例如嵌合末端反向互补序列)杂交,所述第一互补序列可以不连接至第一模板核酸片段的双链区的第二链的第二末端。类似地,第二转座子末端序列可与第二互补序列(例如嵌合末端反向互补序列)杂交,所述第二互补序列可以不连接至第一模板核酸片段的双链区的第一链的第二末端。换言之,第一模板核酸片段可包含一个或多个缺口。在一些情况下,一个或多个缺口的长度可各自为大约9bp。例如,一个或多个缺口的长度可以是至少约1、2、3、4、5、6、7、8、9、10或更多bp。例如,一个或多个缺口的长度可以是至多约10、9、8、7、6、5、4、3、2或1bp。第二模板核酸片段(例如,另外模板核酸片段)可包含细胞、细胞珠粒或细胞核的RNA分子的序列和与引物分子(例如捕获核酸分子)杂交的序列。例如,第二模板核酸片段可包含细胞、细胞珠粒或细胞核的RNA分子的序列和与引物分子的多聚T序列杂交的多聚A序列。引物分子还可包含另外引物序列。

包含第一模板核酸片段(例如,标签化片段)的细胞、细胞珠粒或细胞核可与一种或多种试剂共同分配到多个分区中的一个分区中(例如,如本文所述)。分区可以是例如液滴或孔。分区可包含一个或多个珠粒(例如,如本文所述)。一个或多个珠粒中的一个珠粒(例如,凝胶珠粒)可包含第一多个核酸条形码分子。第一多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列(例如,P5序列)、条形码序列和悬突序列。分区还可包含夹板序列,所述夹板序列包含与悬突序列互补的序列和可与第一模板核酸片段的序列互补的测序引物或其部分。一个或多个珠粒中的一个珠粒还可包含第二多个核酸条形码分子。第二多个核酸条形码分子中的核酸条形码分子可包含流动池衔接子序列(例如,P5序列)、条形码序列、测序引物或其部分(例如,R1序列或其部分,或互补序列)、UMI序列和捕获序列(例如,多聚G序列或多聚dT序列)。在一些情况下,第一多个核酸条形码分子和第二多个核酸条形码分子可偶联至同一珠粒,并且分区可包含单个珠粒。

在分区内,可加工RNA分子以提供第二模板核酸片段(例如,如本文所述)。

在分区内,细胞、细胞珠粒或细胞核可被溶解或透化以接近其中的第一和/或第二模板核酸片段(例如,如本文所述)。第二模板核酸片段可在细胞、细胞珠粒或细胞核溶解或透化之后产生。

第一和第二模板核酸片段可在分区内进行加工。在分区内,对应于细胞、细胞珠粒或细胞核的染色质的第一模板核酸片段的测序引物或其部分可与夹板序列中的测序引物或其部分的互补序列杂交。夹板序列还可与第一多个核酸条形码分子中的核酸条形码分子的悬突序列杂交。然后可将核酸条形码分子的悬突序列连接(例如,使用连接酶)至第一模板核酸片段的测序引物或其部分。所得部分双链核酸分子可包含条形码序列以及一个或多个缺口。

在分区内,源自细胞、细胞珠粒或细胞核的RNA分子的第二模板核酸片段可被逆转录(例如,使用逆转录酶)以提供cDNA链。逆转录过程可将序列附加到包含RNA链和cDNA链的所得双链核酸分子的链的末端,如多聚C序列。第二多个核酸条形码分子中的核酸条形码分子的捕获序列可与双链核酸分子的附加序列(例如,多聚C序列)杂交,并且可发生模板转换过程以提供第二双链核酸分子。第二多个核酸条形码分子中的核酸条形码分子的序列可被认为是模板转换寡核苷酸。模板转换过程可产生条形码化cDNA分子。条形码化cDNA分子可包含第二多个核酸条形码分子中的核酸条形码分子的测序引物或其部分或其互补序列;第二多个核酸条形码分子中的核酸条形码分子的条形码序列或其互补序列;第二多个核酸条形码分子中的核酸条形码分子的UMI序列或其互补序列;第二多个核酸条形码分子中的核酸条形码分子的捕获序列或其互补序列;多聚(C)或多聚(G)序列;对应于细胞、细胞珠粒或细胞核的RNA分子的序列或其互补序列;以及捕获核酸分子的序列或其互补序列。

对应于细胞、细胞珠粒或细胞核的染色质的部分双链核酸分子和对应于多个分区中的分区内所包含的细胞、细胞珠粒或细胞核的RNA分子的条形码化cDNA分子可从所述分区中回收。例如,可汇集多个分区的内容物以在本体溶液中提供部分双链核酸分子和条形码化cDNA分子。

在分区之外,对应于染色质的部分双链核酸分子中的缺口可通过缺口填充延伸过程(例如,使用DNA聚合酶或逆转录酶)来填充。DNA聚合酶可能缺乏链置换活性。可使所得的缺口填充双链核酸分子变性以提供单链,所述单链可经受足以进行一种或多种核酸扩增反应(例如,PCR)的条件以产生对应于细胞、细胞珠粒或细胞核的染色质。核酸扩增过程可并入一个或多个另外序列,如一个或多个另外流动池衔接子序列。

在分区之外,对应于RNA分子的条形码化cDNA分子可经受片段化、末端修复、dA加尾过程、标签化或它们的组合。然后可将另外引物序列(例如测序引物或其部分,如R2序列)连接至所得分子。然后可进行核酸扩增反应(例如,PCR)以产生对应于RNA分子的一种或多种扩增产物。核酸扩增过程可并入一个或多个另外序列,如一个或多个另外流动池衔接子序列。

图18示出对应于前一实例的示例性示意图。图1800示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图1850示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。

如图1800所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)1804,所述模板核酸片段包含插入序列1808(例如,开放染色质的区域)及其互补序列、转座子末端序列1806及其互补序列、测序引物或其部分1802(例如,R1序列)、测序引物或其部分1810(例如,R2序列)和缺口1807。模板核酸片段1804然后可分配在分区内(例如,如本文所述的液滴或孔)。在分区内,包含模板核酸片段1804的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段1804(和一种或多种RNA分子)。分区可包含夹板序列1812,所述夹板序列可包含与测序引物或其部分1802互补的第一序列1802’和第二序列1824。序列1824可包含封闭基团(例如,3’封闭基团),所述封闭基团可防止通过逆转录延伸。分区还可包括与核酸条形码分子1818a和1812b偶联的珠粒(例如凝胶珠粒)1816。核酸条形码分子1818a可包含流动池衔接子序列1820a(例如,P5序列)、条形码序列1822a和与夹板序列的序列1824互补的悬突序列1824’。序列1824可与序列1824’杂交以提供包含核酸条形码分子1818a和模板核酸片段1804的序列的部分双链核酸分子。核酸条形码分子1818a的序列1824’可连接(例如,使用连接酶)1826至模板核酸片段1804的序列1802。在一些情况下,1804可使用合适的激酶(例如,多核苷酸激酶(PNK),如T4 PNK)磷酸化。在一些实例中,PNK和ATP可在标签化反应(例如ATAC)中和/或在分配细胞、细胞珠粒或细胞核或其多者之前大量添加。可将15U的PNK和1mM的ATP掺杂至标签化反应中。例如,可将少于95U的PNK掺杂至标签化反应中。然后可在本体溶液中回收分区的内容物(例如,可使液滴破坏)以提供部分双链核酸分子,所述部分双链核酸分子包含在本体溶液中附接至模板核酸片段1804的核酸条形码分子1818a。在本体溶液中,可通过缺口填充延伸过程(例如,使用DNA聚合酶)填充1828缺口1807以提供双链核酸分子。此分子可进行扩增(例如,PCR)1830以提供双链扩增产物1832,所述双链扩增产物包含核酸条形码分子1818a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列1834(例如,P7序列)。可在批量加工之前填充分区中的缺口。

与图1800的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图1850所示,包含RNA序列1860和多聚A序列1862的RNA分子1858可与包含多聚T序列1854和另外引物序列1856的引物分子1852接触1864。然后可使用具有末端转移酶活性的逆转录酶将RNA分子1858的多聚T序列1854逆转录1876出来,所述逆转录酶可将序列1870附加到包含cDNA序列1868的所得cDNA分子上。序列1870可以是多聚C序列。珠粒(例如,凝胶珠粒)1816(例如,在图1800中描述的相同珠粒)可包括在分区内并且可与核酸条形码分子1818b偶联。核酸条形码分子1818b可包含流动池衔接子序列1820b(例如P5序列)、条形码序列1822b、UMI序列1872和与序列1870互补的序列1874(例如多聚G序列)。在一些情况下,核酸条形码分子1818b可包含测序引物序列1820b(例如R1序列或部分R1序列)、条形码序列1822b、UMI序列1872和与序列1870互补的序列1874(例如,多聚G序列)。核酸条形码分子1818b可用于进行模板转换1878,所述过程也可导致产生条形码化的cDNA分子。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供条形码化cDNA分子。条形码化cDNA分子可进行扩增(例如PCR)1880以提供双链扩增产物1884,所述双链扩增产物包含核酸条形码分子1818b、原始RNA分子的序列或与其对应的cDNA、流动池衔接子序列1886和另外序列1888,所述另外序列可包含测序引物或其部分(例如,R2序列)1890、样品索引序列1892和流动池衔接子序列(例如,P7序列)1894。条形码化cDNA分子还可或可替代地进行片段化、末端修复、dA加尾、一个或多个衔接子序列的连接和/或核酸扩增。

图19示出对应于前一实例的示例性示意图。图1900示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图1950示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。

如图1900所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)1904,所述模板核酸片段包含插入序列1908(例如,开放染色质的区域)及其互补序列、转座子末端序列1906及其互补序列、测序引物或其部分1902(例如,R1序列)、测序引物或其部分1910(例如,R2序列)和缺口1907。模板核酸片段1904然后可分配在分区内(例如,如本文所述的液滴或孔)。在分区内,包含模板核酸片段1904的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段1904(和一种或多种RNA分子)。分区可包含夹板序列1912,所述夹板序列可包含与测序引物或其部分1902互补的第一序列1902’和第二序列1924。序列1924可包含封闭基团(例如,3’封闭基团),所述封闭基团可防止通过逆转录延伸。分区还可包括与核酸条形码分子1918a和1918b偶联的珠粒(例如凝胶珠粒)1916。核酸条形码分子1918a可包含流动池衔接子序列1920a(例如,P5序列)、条形码序列1922a和与夹板序列的序列1924互补的悬突序列1924’。序列1924可与序列1924’杂交以提供包含核酸条形码分子1918a和模板核酸片段1904的序列的部分双链核酸分子。核酸条形码分子1918a的序列1924’可连接(例如,使用连接酶)1926至模板核酸片段1904的序列1902。在一些情况下,1904可使用合适的激酶(例如,多核苷酸激酶(PNK),如T4 PNK)磷酸化。在一些情况下,PNK和ATP可在标签化反应(例如ATAC)中和/或在分配细胞、细胞珠粒或细胞核之前大量添加。可将15U的PNK和1mM的ATP掺杂至标签化反应中。例如,可将少于95U的PNK掺杂至标签化反应中。然后可在本体溶液中回收分区的内容物(例如,可使液滴破坏)以提供部分双链核酸分子,所述部分双链核酸分子包含在本体溶液中附接至模板核酸片段1904的核酸条形码分子1918a。在本体溶液中,可通过缺口填充延伸过程(例如,使用DNA聚合酶)填充1928缺口1907以提供双链核酸分子。此分子可进行扩增(例如,PCR)1930以提供双链扩增产物1932,所述双链扩增产物包含核酸条形码分子1918a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列1934(例如,P7序列)。可在批量加工之前填充分区中的缺口。

与图1900的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图1950所示,可在分区内提供包含RNA序列1960和多聚A序列1962和珠粒(例如凝胶珠粒)1916的RNA分子1958。珠粒(例如,凝胶珠粒)1916(例如,在图1900中描述的相同珠粒)可包括在分区内并且可与核酸条形码分子1918b偶联。核酸条形码分子1918b可包含流动池衔接子序列1968(例如P5序列)、条形码序列1922b(例如与条形码序列1922a相同的条形码序列)、UMI序列1966和与多聚A序列1962互补的多聚T序列1964。在一些情况下,核酸条形码分子1918b可包含测序引物序列1968(例如,R1序列或部分R1序列)、条形码序列1922b(例如,与条形码序列1922a相同的条形码序列)、UMI序列1966和与多聚A序列1962互补的多聚T序列1964。多聚T序列1964可与RNA分子1958的多聚A序列1962杂交。RNA分子1958可从多聚T序列1964逆转录1970出来,以提供包含cDNA序列1972的cDNA分子。逆转录过程可使用具有末端转移酶活性的逆转录酶,所述逆转录酶可将序列1974附加到包含cDNA序列1972的所得cDNA分子上。序列1974可以是多聚C序列。包含引物序列1980和与序列1974互补的序列(例如多聚G序列)的模板转换寡核苷酸1978可与cDNA分子杂交。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供cDNA分子。cDNA分子可进行扩增(例如,PCR)1984。可进行另外扩增(例如,PCR)1986以提供双链扩增产物1988,所述双链扩增产物包含核酸条形码分子1918b、原始RNA分子的序列或与其对应的cDNA、流动池衔接子序列1998(例如,P7序列)和另外序列1990,所述另外序列可包含测序引物或其部分(例如,R2序列)1996、样品索引序列1994和流动池衔接子序列(例如,P5序列)1992。条形码化cDNA分子还可或可替代地进行片段化、末端修复、dA加尾、一个或多个衔接子序列的连接和/或核酸扩增。

在另一个方面,本公开提供了一种用于加工生物样品(例如,核酸样品)的方法,所述方法可包括在分区内进行顺序转录和逆转录过程。所述方法可包括提供包含源自核酸样品的核酸分子(例如,DNA分子)的多个分区中的一个分区(例如,液滴或孔)。核酸分子可进行转录(例如,使用转录酶)以提供RNA分子。RNA分子然后可在分区内逆转录(例如,使用逆转录酶)以产生互补DNA(cDNA)分子。cDNA分子可在分区内进行进一步加工以提供cDNA分子的衍生物。可从分区中回收cDNA分子或其衍生物(例如,通过汇集多个分区的内容物)。分区可以是多个孔中的一个孔。或者,分区可以是多个液滴中的一个液滴。

根据本文提供的方法加工的核酸分子(例如,DNA分子)可源自细胞、细胞珠粒或细胞核。在一些情况下,核酸分子可包含在细胞、细胞珠粒或细胞核内。核酸分子可以是染色质。包含核酸分子的细胞、细胞珠粒或细胞核可包括在分区内。例如,细胞、细胞珠粒或细胞核可与一种或多种试剂(例如,如本文所述)共同分配到分区(例如,液滴或孔)中。细胞、细胞珠粒或细胞核可被溶解或透化(例如,在分区内)以接近其中的核酸分子(例如,如本文所述)。

根据本文提供的方法加工的核酸分子可以是DNA分子,如染色质。在一些情况下,所述方法还可包括用转座酶(例如,包括在转座酶-核酸复合物中)加工核酸样品的开放染色质结构以提供核酸分子。例如,可使核酸分子(例如,在细胞、细胞珠粒或细胞核内)与转座酶-核酸复合物(例如,如本文所述)接触。在这样的过程中使用的转座酶可以是例如Tn5转座酶。转座酶-核酸复合物可具有诸如图9或图10的结构的结构。或者,转座酶-核酸复合物可包含一个或多个转座子末端寡核苷酸分子,所述转座子末端寡核苷酸分子包含发夹分子。这种转座酶-核酸复合物的一个实例示于图11中。

使用包含一个或多个发夹分子的转座酶-核酸复合物加工的核酸分子可以是包含双链区的标签化片段,所述双链区包含对应于它所起源或来源的细胞、细胞珠粒或细胞核的核酸分子(例如染色质)的序列,以及附加到双链区的任一端上的一个或多个发夹分子。例如,双链区可在一端包含第一发夹分子并且在第二端包含第二发夹分子。通常,发夹分子的仅一端可附接至双链区域,以使得标签化片段在任一端包含缺口。例如,发夹分子可附接至双链区的3’端。发夹分子可包含启动子序列,如T7启动子序列和/或UMI序列。

在分区内,核酸分子(例如,标签化片段)可用逆转录酶进行缺口填充过程。逆转录酶可以是突变型逆转录酶,如但不限于莫洛尼鼠白血病病毒(MMLV)逆转录酶。在一个方面,逆转录酶是突变型MMLV逆转录酶,如但不限于酶“42B”(参见美国专利公布号20180312822)。当以例如小于1纳升(nL)的反应体积制备时,由于单细胞的细胞溶解物中存在的一种或多种未知组分,酶42B可降低对来自单细胞的mRNA逆转录的抑制。与市售的突变型MMLV RT酶(CA-MMLV)相比,酶42B可显示出改进的逆转录酶活性。这种过程可产生双链核酸分子,所述双链核酸分子包含对应于其所来源的细胞、细胞珠粒或细胞核的核酸分子(例如染色质)的双链区、在所述双链区的任一端的发夹分子的序列以及与所述发夹分子的序列互补的序列。双链核酸分子然后可用T7聚合酶进行转录,所述过程开始于发夹分子的T7启动子序列的末端。两条链都可以这种方式转录以提供两条核酸链,每条核酸链均包含T7启动子序列及其互补序列;一个或多个转座子末端序列,及其一个或多个互补序列;以及细胞、细胞珠粒或细胞核的原始核酸分子的序列。所述链还可包含一个或多个间隔区、UMI或其他序列(例如,来自发夹分子)。链然后可进行自引发过程,其中发夹分子的转座子末端序列及其互补序列彼此杂交以在所述链的末端再生发夹分子。所述发夹分子可充当逆转录的引发位点。然后可进行逆转录酶过程(例如,使用逆转录酶)。在此过程之前、期间或之后,可将序列附加到分子的末端,所述序列可以是多聚C序列。包含与附加序列(例如多聚G序列)互补的序列的模板转换寡核苷酸可与所述附加序列杂交。模板转换寡核苷酸可包含UMI序列(例如,可索引进行模板转换的转录物的第二UMI序列)、条形码序列和/或引发序列如测序引物序列或其部分(例如,R1或R2序列,或其部分)。模板转换寡核苷酸可连接至包含在分区内的珠粒(例如,凝胶珠粒)。例如,模板转换寡核苷酸可以是附接至珠粒上的多个核酸条形码分子中的核酸条形码分子(例如,如本文所述)。所得部分双链核酸分子可包含发夹部分;对应于细胞、细胞珠粒或细胞核的原始核酸分子的序列;和模板转换寡核苷酸的序列,包括条形码序列(参见例如,图20)。

部分双链核酸分子可从分区(例如,液滴或孔)中释放。从分区释放材料可包括使液滴破坏或破碎。可将多个分区中的多个分区的内容汇集在一起以提供用于进一步加工的本体溶液。多个分区的分区的核酸分子(例如,部分双链核酸分子)可各自差异地条形码化,以使得每个这样的分区的核酸分子包含不同的条形码序列。

在分区之外,可使部分双链核酸分子部分变性以提供单链分子(例如,单链cDNA分子)。RNA酶处理可用于除去发夹分子以及部分双链核酸分子的较短链(例如,RNA序列)。剩余的单链分子可包括包含条形码序列和任选的UMI序列的模板转换寡核苷酸。可提供包含与模板转换寡核苷酸的引发序列互补的引发序列的引物分子并且可与模板转换寡核苷酸的引发序列杂交。引物分子的引发序列可以是5’-封闭的引发序列。具有dA加尾活性的聚合酶(例如,具有5’→3’聚合酶活性的Klenow片段,如缺乏核酸外切酶活性的外切Klenow片段)可用于产生第二核酸链。所得的第二链可以是dA加尾的。第一链也可以是dA加尾的。然而,如果在前面的过程中使用了5’-封闭引发序列,则附加到第一链上的dA尾可能不能用作另一个部分的杂交位点。相反,包含测序引物(例如,R1序列或其互补序列)和流动池衔接子序列(例如,P5序列或其互补序列)的引发序列可与双链核酸分子的互补序列杂交。在双链核酸分子的另一端,附加到第二链末端的dA部分可充当在末端包含dT部分的引发序列、测序引物(例如,R2序列或其互补序列)和流动池衔接子序列(例如P7序列或其互补序列)的杂交位点。然后可使双链核酸分子经受足以进行一种或多种核酸扩增反应(例如,PCR)的条件,以提供对应于细胞、细胞珠粒或细胞核的原始核酸分子的扩增产物。扩增产物可在任一端包含流动池衔接子序列(例如,P5和P7序列)以促进测序(例如,如本文所述)。

本文提供的方法可克服在分区内进行逆转录的某些挑战。例如,逆转录酶可具有依赖于DNA的DNA聚合酶活性和/或末端转移酶活性。后者可导致在某些反应条件下产生可变的悬突。在本文提供的方法中,可为每个插入位点提供T7启动子,从而避免可能通过R1-R1和R2-R2相互作用遇到的损失。此外,mRNA和染色质来源的片段都可使用相同的生物化学(例如,RT模板转换)进行条形码化。对核酸分子的这两条链进行线性扩增可提供链意识并且为例如ATAC-seq过程引入新的维度。此外,这种方法可实现分区内转座酶来源的核酸片段的等温线性扩增。值得注意的是,这种方法可与本文别处描述的任何RNA工作流程相结合。

图20示出对应于前一实例的工作流程2000。工作流程2000可与RNA工作流程并行执行,如图12-19中任一个的RNA工作流程。多个珠粒可包括在分区内,每个珠粒包含被配置用于分析DNA或RNA分子的核酸条形码分子。或者,包含被配置用于分析DNA和RNA分子(例如,如本文所述)的核酸条形码分子的单个珠粒(例如,凝胶珠粒)可包括在分区内。单个珠粒(例如,在单个分区中)可包含用于RNA和DNA分析的多个相同的核酸条形码分子。在一些情况下,单个珠粒(例如,在单个分区内)包含用于DNA分析的第一多个核酸条形码分子和用于RNA分子的第二多个核酸条形码分子,其中所述第一和第二多个核酸条形码分子包含共有条形码序列。

可制备模板核酸片段(例如,标签化片段)2002(例如,使用转座酶-核酸复合物,如图11所示的转座酶-核酸复合物)并提供在分区中(如本文所述)。模板核酸片段2002可包含发夹部分2003和2004以及靶序列2005和2006。模板核酸片段2002还包含缺口2007。可使用逆转录酶(例如,42B酶)填充缺口2007,所述过程可导致产生包含对应于包含序列2005和2006以及发夹分子2003和2004的序列的细胞、细胞珠粒或细胞核的原始核酸分子(例如,染色质)的双链区域的双链核酸分子。双链核酸分子可包含转座子末端序列2008、启动子(例如,T7启动子)序列2010和UMI序列2012。双链核酸分子然后可用T7聚合酶进行转录,所述过程开始于发夹分子的T7启动子序列的末端。两条链都可以这种方式转录以提供两条核酸链。图20示出一条这样的链,其包含T7启动子序列2010及其互补序列;一个或多个转座子末端序列2008及其一个或多个互补序列;UMI序列2012以及UMI序列的互补序列;以及对应于细胞、细胞珠粒或细胞核的原始核酸分子的序列2006的RNA序列2006’。所述链然后可进行自引发过程,其中发夹分子2004的转座子末端序列及其互补序列彼此杂交以在所述链的末端再生发夹分子。再生的发夹分子2004可充当逆转录的引发位点。然后可进行逆转录和模板转换(例如,使用逆转录酶)。逆转录过程可将序列2014(例如,多聚C序列)附加到包含cDNA序列2026以及分别与序列2012和2008互补的序列2012’和2008’的所得cDNA分子。模板转换过程可包括使用偶联至包括在分区内的珠粒(例如,凝胶珠粒)2016的模板转换寡核苷酸。珠粒(例如,凝胶珠粒)2016可偶联至核酸条形码分子2018,所述核酸条形码分子是包含测序引物或其部分2020、条形码序列2022、UMI序列2024和与序列2014’互补的序列2014(例如,多聚G序列)的模板转换寡核苷酸。所得cDNA分子可包含含有核酸条形码分子2018和RNA序列2006’的第一链和含有cDNA序列2026、附加序列2014以及分别与序列2020、2022和2024互补的序列2020’、2022’和2024’的第二链。

cDNA分子可从分区(例如,液滴或孔)中释放。从分区释放材料可包括使液滴破坏或破碎。可将多个分区中的多个分区的内容汇集在一起以提供用于进一步加工的本体溶液。在分区之外,可用RNA酶处理cDNA分子以除去发夹分子以及部分双链核酸分子的较短链(例如,RNA序列)。剩余的单链分子可包含序列2020’、2022’、2024’、2014、2012’、2008’和2026。引物分子2028然后可与序列2020’杂交。引物分子2028可以是5’封闭的引物序列。具有dA加尾活性的聚合酶(例如,具有5’→3’聚合酶活性的Klenow片段,如缺乏外切核酸酶活性的外切Klenow片段)可用于产生包含与cDNA序列2026互补的序列2026’的第二核酸链。所得的第二链可以是dA加尾的。第一链也可在序列2020’的末端进行dA加尾。然而,如果在前面的过程中使用了5’-封闭引发序列,则附加到第一链上的dA尾可能不能用作另一个部分的杂交位点。包含dT部分、测序引物(例如,R2序列或其互补序列)2032和流动池衔接子序列(例如,P7序列或其互补序列)2034的引发序列2030可与双链核酸分子的dA部分杂交。包含测序引物(例如,R1序列或其互补序列)2038和流动池衔接子序列(例如,P5序列或其互补序列)2040的引发序列2036可与双链核酸分子的序列2028杂交。然后可扩增双链核酸分子以提供经扩增的产物2042,所述扩增产物可经受进一步加工,如核酸测序。

图21提供了用于加工核酸分子(例如,在细胞、细胞珠粒或细胞核内包含的核酸分子)的工作流程2100的概览。将核酸分子(例如,DNA分子,如染色质)标签化(例如,如本文所述)以产生标签化片段。标签化片段然后在分区内进行转录、逆转录和条形码化(例如,如本文所述)。所得产物从分区中释放出来并经受两个过程中的一个,第一个过程提供ATAC文库,并且第二个过程提供基因表达文库。第一个过程可能涉及RNA酶处理以除去RNA并提供cDNA、dA加尾和测序引物的连接以及PCR。第二个过程可能涉及cDNA扩增;测序引物的片段化、dA加尾和连接;和PCR。

本公开还提供了一种使用逆转录酶填充过程与条形码化过程结合来加工细胞、细胞珠粒或细胞核的核酸分子的方法。核酸分子(例如,DNA分子)可源自细胞、细胞珠粒或细胞核。在一些情况下,核酸分子可包含在细胞、细胞珠粒或细胞核内。核酸分子可以是染色质。包含核酸分子的细胞、细胞珠粒或细胞核可包括在分区内。例如,细胞、细胞珠粒或细胞核可与一种或多种试剂(例如,如本文所述)共同分配到分区(例如,液滴或孔)中。细胞、细胞珠粒或细胞核可被溶解或透化(例如,在分区内)以接近其中的核酸分子(例如,如本文所述)。

根据本文提供的方法加工的核酸分子可以是DNA分子,如染色质。在一些情况下,所述方法还可包括用转座酶(例如,包括在转座酶-核酸复合物中)加工核酸样品的开放染色质结构以提供核酸分子。例如,可使核酸分子(例如,在细胞、细胞珠粒或细胞核内)与转座酶-核酸复合物(例如,如本文所述)接触。在这样的过程中使用的转座酶可以是例如Tn5转座酶。转座酶-核酸复合物可具有诸如图9、10或11的结构的结构在产生标签化片段(例如,如本文所述)之后,转座酶-核酸复合物的转座酶可留下或被除去(例如,置换,例如通过酶置换)。或者,转座酶可保留在适当位置。标签化片段可包含对应于细胞、细胞珠粒或细胞核的原始核酸分子的序列;转座子末端序列和与其互补的序列;以及一种或多种测序引物或其部分。包含与测序引物或其部分互补的序列的夹板序列可与测序引物或其部分杂交。夹板序列可连接至标签化片段的转座子末端序列或其互补序列(例如,使用连接酶)。在夹板序列杂交和/或连接之前或之后,可将标签化片段分配到多个分区中的一个分区(例如,孔的液滴)中。标签化片段可与一种或多种试剂共同分配。标签化片段可包含在细胞、细胞珠粒或细胞核内,所述细胞、细胞珠粒或细胞核可被溶解或透化以接近其中的标签化片段(例如,如本文所述)。夹板序列的序列然后可与核酸条形码分子(例如,如本文所述的偶联至珠粒的核酸条形码分子)杂交。珠粒(例如凝胶珠粒)可包含多个核酸条形码分子,其中所述多个核酸条形码分子中的核酸条形码分子可包含例如流动池衔接子序列、条形码序列和UMI序列。核酸条形码分子还可包含与夹板序列的序列具有序列互补性的悬突序列。悬突序列可与夹板序列的序列杂交。标签化片段中保留的转座酶可在这些过程中阻止缺口填充。夹板序列然后可在分区内扩增(例如,使用逆转录酶)。

在条形码/模板转换和延伸(例如,逆转录)过程之后,多个分区的分区的内容物可从所述分区释放(例如,如本文所述)。在释放分区的内容物之前或之后,可将核酸条形码分子连接至经加工的标签化片段的测序引物上。在分区之外,核酸条形码分子可与模板核酸片段的测序引物或其部分杂交。如果转座酶保留在标签化片段中,则转座酶可留下经加工的标签化片段(例如,通过链置换聚合酶)并且可填充剩余的缺口以提供双链核酸分子。或者,可如本文别处所描述填充缺口。然后可使双链核酸分子经受核酸扩增过程(例如,如本文所述的PCR)。扩增可包括并入一个或多个另外序列,如一个或多个流动池衔接子序列(例如,P7序列)。

图22示出对应于前一实例的示例性示意图。图2200示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图2250示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。多个珠粒(例如,凝胶珠粒)可包括在分区内,每个珠粒包含被配置用于分析DNA或RNA分子的核酸条形码分子。或者,包含被配置用于分析DNA和RNA分子(例如,如本文所述)的核酸条形码分子的单个珠粒(例如,凝胶珠粒)可包括在给定分区内。

如图2200所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)2204,所述模板核酸片段包含插入序列2208(例如,开放染色质的区域)及其互补序列、转座子末端序列2206及其互补序列、测序引物或其部分2202(例如,R1序列)、测序引物或其部分2210(例如,R2序列)和缺口2207。包含模板核酸片段2204的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段2204(和一种或多种RNA分子)。可使模板核酸片段2204与夹板序列2212接触,所述夹板序列可包含与测序引物或其部分2202互补的第一序列2202’和第二序列2224。序列2224可包含封闭基团(例如,3’封闭基团),所述封闭基团可防止通过逆转录延伸。序列2202’可与模板核酸片段2204的序列2202杂交2214以提供包含夹板序列2212和模板核酸片段2204的部分双链核酸分子。序列2202’可连接2226至模板核酸片段2204的转座子末端序列2206的互补序列(例如,使用连接酶)。连接至夹板序列2212的模板核酸片段2204然后可分配在多个分区内的分区(例如,液滴或孔)内(例如,如本文所述)。分区还可包括与核酸条形码分子2218a和2218b偶联的珠粒(例如凝胶珠粒)2216。核酸条形码分子2218a可包含流动池衔接子序列2220a(例如,P5序列)、条形码序列2222a和与夹板序列2212的序列2224互补的悬突序列2224’。序列2224可与序列2224’杂交2228。夹板序列2212然后可延伸2230(例如,使用逆转录酶或DNA聚合酶)以提供与核酸条形码分子2218a的序列2220a和2222a互补的序列2220a’和2222a’。或者,序列2224可与序列2224’杂交以提供部分双链的核酸分子,并且核酸条形码分子2218a可连接(例如,使用连接酶)至模板核酸片段2204的序列2202。然后可在本体溶液中回收分区的内容物(例如,可使液滴破坏)以提供部分双链核酸分子,所述部分双链核酸分子包含在本体溶液中附接至夹板序列2212和模板核酸片段2204的核酸条形码分子2218a。核酸条形码分子2218a的序列2224’可连接(例如,使用连接酶)2232至模板核酸片段2204的序列2202。在本体溶液中,可通过缺口填充延伸过程(例如,使用DNA聚合酶)填充2234缺口2207以提供双链核酸分子。此分子也可进行扩增(例如,PCR)以提供双链扩增产物2236,所述双链扩增产物包含核酸条形码分子2218a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列2238(例如,P7序列)。可在批量加工之前填充分区中的缺口。

与图2200的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图2250所示,包含RNA序列2260和多聚A序列2262的RNA分子2258可与包含多聚T序列2254和另外引物序列2256的引物分子2252接触2264。然后可使用具有末端转移酶活性的逆转录酶将RNA分子2258的多聚T序列2254逆转录2276出来,所述逆转录酶可将序列2270附加到包含cDNA序列2268的所得cDNA分子上。序列2270可以是多聚C序列。珠粒(例如,凝胶珠粒)2216(例如,在图2200中描述的相同珠粒)可包括在分区内并且可与核酸条形码分子2218b偶联。核酸条形码分子2218b可包含流动池衔接子序列2220b(例如P5序列)、条形码序列2222b、UMI序列2272和与序列2270互补的序列2274(例如多聚G序列)。在一些情况下,核酸条形码分子2218b可包含测序引物序列2220b(例如R1序列或部分R1序列)、条形码序列2222b、UMI序列2272和与序列2270互补的序列2274(例如,多聚G序列)。核酸条形码分子2218b可用于进行模板转换2278,所述过程也可导致产生条形码化的cDNA分子。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供条形码化cDNA分子。条形码化cDNA分子可进行扩增(例如PCR)2280以提供双链扩增产物2284,所述双链扩增产物包含核酸条形码分子2218b、原始RNA分子的序列或与其对应的cDNA、流动池衔接子序列2286和另外序列2288,所述另外序列可包含测序引物或其部分(例如,R2序列)2290、样品索引序列2292和流动池衔接子序列(例如,P7序列)2294。条形码化cDNA分子还可或可替代地进行片段化、末端修复、dA加尾、一个或多个衔接子序列的连接和/或核酸扩增。

图23示出对应于前一实例的另一示例性示意图。图2300示出对应于加工来自细胞、细胞珠粒或细胞核的染色质的工作流程,并且图2350示出对应于加工来自细胞、细胞珠粒或细胞核的mRNA分子的工作流程。多个珠粒(例如,凝胶珠粒)可包括在分区内,每个珠粒包含被配置用于分析DNA或RNA分子的核酸条形码分子。或者,包含被配置用于分析DNA和RNA分子(例如,如本文所述)的核酸条形码分子的单个珠粒(例如,凝胶珠粒)可包括在给定分区内。

如图2300所示,在本体溶液中,对细胞、细胞珠粒或细胞核内所包含的染色质进行加工(例如,如本文所述)以提供模板核酸片段(例如,标签化片段)2304,所述模板核酸片段包含插入序列2308(例如,开放染色质的区域)及其互补序列、转座子末端序列2306及其互补序列、测序引物或其部分2302(例如,R1序列)、测序引物或其部分2310(例如,R2序列)和缺口2307。包含模板核酸片段2304的细胞、细胞珠粒或细胞核可被溶解、透化或以其他方式进行加工以接近其中的模板核酸片段2304(和一种或多种RNA分子)。可使模板核酸片段2304与夹板序列2312接触,所述夹板序列可包含与测序引物或其部分2302互补的第一序列2302’和第二序列2324。序列2324可包含封闭基团(例如,3’封闭基团),所述封闭基团可防止通过逆转录延伸。序列2302’可与模板核酸片段2304的序列2302杂交2314以提供包含夹板序列2312和模板核酸片段2304的部分双链核酸分子。序列2302’可连接2326至模板核酸片段2304的转座子末端序列2306的互补序列(例如,使用连接酶)。连接至夹板序列2312的模板核酸片段2304然后可分配在多个分区内的分区(例如,液滴或孔)内(例如,如本文所述)。分区还可包括与核酸条形码分子2318a和2318b偶联的珠粒(例如凝胶珠粒)2316。核酸条形码分子2318a可包含流动池衔接子序列2320a(例如,P5序列)、条形码序列2322a和与夹板序列2312的序列2324互补的悬突序列2324’。序列2324可与序列2324’杂交2328。夹板序列2312然后可延伸2330(例如,使用逆转录酶或DNA聚合酶)以提供与核酸条形码分子2318a的序列2320a和2322a互补的序列2320a’和2322a’。或者,序列2324可与序列2324’杂交以提供部分双链的核酸分子,并且核酸条形码分子2318a可连接(例如,使用连接酶)至模板核酸片段2304的序列2302。然后可在本体溶液中回收分区的内容物(例如,可使液滴破坏)以提供部分双链核酸分子,所述部分双链核酸分子包含在本体溶液中附接至夹板序列2312和模板核酸片段2304的核酸条形码分子2318a。核酸条形码分子2318a的序列2324’可连接(例如,使用连接酶)2332至模板核酸片段2304的序列2302。在本体溶液中,可通过缺口填充延伸过程(例如,使用DNA聚合酶)填充2334缺口2307以提供双链核酸分子。此分子也可进行扩增(例如,PCR)以提供双链扩增产物2336,所述双链扩增产物包含核酸条形码分子2318a、原始染色质分子的序列和任选的可以是流动池衔接子序列的另外序列2338(例如,P7序列)。可在批量加工之前填充分区中的缺口。

与图2300的染色质工作流程并行,可加工源自同一细胞、细胞珠粒或细胞核的RNA分子。如图2350所示,可在分区内提供包含RNA序列2360和多聚A序列2362和凝胶珠粒2316的RNA分子2358。珠粒(例如,凝胶珠粒)2316(例如,在图2300中描述的相同珠粒)可包括在分区内并且可与核酸条形码分子2318b偶联。核酸条形码分子2318b可包含流动池衔接子序列2368(例如P5序列)、条形码序列2322b(例如与条形码序列2322a相同的条形码序列)、UMI序列2366和与多聚A序列2362互补的多聚T序列2364。在一些情况下,核酸条形码分子2318b可包含测序引物序列2368(例如,R1序列或部分R1序列)、条形码序列2322b(例如,与条形码序列2322a相同的条形码序列)、UMI序列2366和与多聚A序列2362互补的多聚T序列2364。多聚T序列2364可与RNA分子2358的多聚A序列2362杂交。RNA分子2358可从多聚T序列2364逆转录2370出来,以提供包含cDNA序列2372的cDNA分子。逆转录过程可使用具有末端转移酶活性的逆转录酶,所述逆转录酶可将序列2374附加到包含cDNA序列2372的所得cDNA分子上。序列2374可以是多聚C序列。包含引物序列2380和与序列2374互补的序列(例如多聚G序列)的模板转换寡核苷酸2378可与cDNA分子杂交。然后可在本体溶液中回收分区的内容物(例如,液滴可能被破坏)以在本体溶液中提供cDNA分子。cDNA分子可进行扩增(例如,PCR)2384。可进行另外扩增(例如,PCR)2386以提供双链扩增产物2388,所述双链扩增产物包含核酸条形码分子2318b的序列、原始RNA分子或与其对应的cDNA、流动池衔接子序列2398(例如,P7序列)和另外序列2390,所述另外序列可包含测序引物或其部分(例如,R2序列)2396、样品索引序列2394和流动池衔接子序列(例如,P5序列)2392。条形码化cDNA分子还可或可替代地进行片段化、末端修复、dA加尾、一个或多个衔接子序列的连接和/或核酸扩增。

用于样品区室化的系统和方法

在一个方面,本文所述的系统和方法提供了将一个或多个颗粒(例如生物颗粒、生物颗粒的大分子成分、珠粒、试剂等)区室化、沉积或分配到离散的隔室或分区(本文中可互换地称为分区)中,其中每个分区保持其自身内容物与其它分区的内容物分离。分区可以是乳液中的液滴。分区可包括一个或多个其他分区。

分区可包括一个或多个颗粒。分区可包括一种或多种类型的颗粒。例如,本公开的分区可包括一个或多个生物颗粒和/或其大分子成分。分区可以包含一个或多个凝胶珠粒。分区可以包含一个或多个细胞珠粒。分区可以包括单个凝胶珠粒、单个细胞珠粒,或单个细胞珠粒和单个凝胶珠粒两者。分区可以包括一种或多种试剂。可替代地,分区可以是未被占用的。例如,分区可以不包含珠粒。细胞珠粒可以是例如经由含有生物颗粒的液滴与能够聚合或胶凝的前体的聚合而包裹在凝胶或聚合物基体内的生物颗粒和/或其大分子成分中的一种或多种。可以在液滴产生之前、之后或同时如通过微胶囊(例如珠粒)将独特标识符(如条形码)注射到液滴中,如本文其他地方所描述。微流体通道网络(例如,在芯片上)可用于产生如本文所述的分区。在分配个别生物颗粒时还可采用替代机制,包括多孔膜,细胞的水性混合物穿过所述多孔膜被挤压至非水性流体中。

分区可在流体流中流动。分区可包含例如微泡,所述微泡具有包围内部流体中心或核心的外部屏障。在一些情况下,分区可以包括能够将材料夹带和/或保留在其基质内的多孔基质。分区可以是第一相在第二相内的液滴,其中第一相和第二相不可混溶。例如,分区可包括非水性连续相(例如油相)内的水性流体的液滴。在另一实例中,分区可以是非水性流体在水相内的液滴。在一些实例中,分区可以以油包水乳液或水包油乳液的形式提供。在例如美国专利申请公布号2014/0155295中描述了多种不同的容器,所述申请出于所有目的以引用方式全文并入本文。用于在非水性或油状连续相中产生稳定液滴的乳液体系描述于例如美国专利申请公布号2010/0105112中,所述申请出于所有目的以引用方式全文并入本文。

在乳液中的液滴的情况下,在一个非限制性实例中,将单独的颗粒分配到离散分区可通过将水性流体中流动的颗粒流引入到流动的非水性流体流中,使得在两股流的汇合点处产生液滴来实现。流体性质(例如,流体流速、流体粘度等)、颗粒性质(例如,体积分数、粒度、颗粒浓度等)、微流体架构(例如,通道几何形状等)和其他参数可进行调整以控制所得分区的占用率(例如,每个分区的生物颗粒数量、每个分区的珠粒数量等)。例如,可通过提供一定浓度和/或颗粒流速的水流来控制分区占用率。为了产生单个生物颗粒分区,可选择不混溶流体的相对流速,以使得平均而言,分区可每个分区含有少于一个生物颗粒,以确保被占用的那些分区主要被单独占用。在一些情况下,多个分区中的分区可含有至多一个生物颗粒(例如,珠粒、DNA、细胞或细胞物质)。可选择或调整各种参数(例如,流体性质、颗粒性质、微流体架构等),以使得大部分分区被占用,例如,仅允许小百分比的未占用分区。可控制流量和通道架构以确保给定数量的单独占用分区、小于一定水平的未占用分区和/或小于一定水平的多重占用分区。

图1示出用于分配单个生物颗粒的微流体通道结构100的一个实例。通道结构100可包括在通道汇合点110处连通的通道区段102、104、106和108。在操作中,包含悬浮生物颗粒(或细胞)114的第一水性流体112可沿着通道段102被输送到汇合点110中,而与水性流体112不混溶的第二流体116从每个通道区段104和106递送至汇合点110,以产生流入通道区段108并从汇合点处110流走的第一水性流体112的离散液滴118、120。通道区段108可与出口储槽流体联接,可以将离散液滴储存和/或收获在出口储槽中。生成的离散液滴可包括单独的生物颗粒114(例如液滴118)。生成的离散液滴可包括多于一个的单独生物颗粒114(图1中未示出)。离散液滴可不含生物颗粒114(例如液滴120)。每个离散分区可保持其自身内容物(例如,单独的生物颗粒114)与其它分区的内容物分离。

第二流体116可包含油,如含氟油,所述油包含用于稳定化所得液滴,例如抑制所得液滴118、120的后续聚结的含氟表面活化剂。特别有用的分配流体和含氟表面活性剂的实例描述于例如美国专利申请公布号2010/0105112中,所述专利申请出于所有目的以引用的方式完全并入本文。

如应了解,可将本文所述的通道区段联接至多种不同流体来源或接收部件(包括储槽、管道、歧管)或其他系统的流体部件中的任一种。如将理解的,微流体通道结构100可具有其他几何形状。例如,微流体通道结构可具有多于一个通道汇合点。例如,微流体通道结构可以具有2、3、4或5个通道区段,每个通道区段都携带有颗粒(例如,生物颗粒、细胞珠粒和/或凝胶珠粒),这些通道区段在通道汇合点处会合。可通过一个或多个流体流动单元引导流体沿着一个或多个通道或储槽流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。流体还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管流或重力流等来控制。

所产生的液滴可包括两个液滴子集:(1)已占用液滴118,其含有一个或多个生物颗粒114,以及(2)未占用液滴120,其不含任何生物颗粒114。已占用液滴118可包含单独占用的液滴(具有一个生物颗粒)和多重占用的液滴(具有多于一个生物颗粒)。如本文别处所述,在一些情况下,大多数已占用分区可包括每个已占用分区不超过一个生物颗粒,并且一些产生的分区可未被(任何生物颗粒)占用。然而,在一些情况下,一些已占用分区可以包括多于一个生物颗粒。在一些情况下,可控制分配过程,以使得少于约25%的已占用分区含有多于一个生物颗粒,并且在许多情况下,少于约20%的已占用分区具有多于一个生物颗粒,而在一些情况下,少于约10%或甚至少于约5%的已占用分区的每个分区包括多于一个生物颗粒。

在一些情况下,可能希望最小化过多数量的空分区的产生,例如以降低成本和/或提高效率。尽管这种最小化可以通过在分配汇合点110处提供足够数量的生物颗粒(例如,生物颗粒114)例如以确保至少一个生物颗粒被包封在分区中来实现,但是泊松分布可以预期地增加包含多个生物颗粒的分区的数量。因此,在要获得单独占用的分区的情况下,所生成的分区中至多约95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%或更少可未被占用。

在一些情况下,可控制一个或多个生物颗粒(例如,在通道区段102中)的流动,或者引导到分配汇合点中的其他流体(例如,在通道区段104、106中)的流动,使得在许多情况下,不多于约50%产生的分区、不多于约25%产生的分区或不多于约10%产生的分区未被占用。可控制这些流量,以呈现单个占用分区的非泊松分布,同时提供较低水平的未占用分区。可以实现上述未占用分区的范围,同时仍提供上述任何单个占用率。例如,在许多情况下,本文所述的系统和方法的使用可产生所得分区,所得分区具有小于约25%、小于约20%、小于约15%、小于约10%的多个占用率,并且在许多情况下,小于约5%,而未占用分区小于约50%、小于约40%、小于约30%、小于约20%、小于约10%、小于约5%或更少。

如应理解,上述占用率也适用于包括生物颗粒和另外试剂的分区,包括但不限于携带条形码化核酸分子(例如,寡核苷酸)的微胶囊或珠粒(例如,凝胶珠粒)(关于图2所描述)。占用分区(例如,至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%的占用分区)可包括包含条形码化核酸分子的微胶囊(例如珠粒)和生物颗粒。

在另一个方面,除了基于液滴的分配或作为其替代方案,生物颗粒可包封在微胶囊内,所述微胶囊包括外壳、层或多孔基质,其中夹带一个或多个单独的生物颗粒或小组生物颗粒。微胶囊可包含其他试剂。生物颗粒的包封可以通过多种方法进行。此类方法可将含有生物颗粒的水洗流体与聚合物前体材料组合,所述聚合物前体材料在将特定刺激施加到聚合物前体时能够形成凝胶或其他固体或半固体基质。此类刺激可包括例如热刺激(例如,加热或冷却)、光刺激(例如,通过光固化)、化学刺激(例如,通过交联、前体的聚合引发(例如,通过添加的引发剂))、机械刺激或它们的组合。

包含生物颗粒的微胶囊的制备可通过多种方法执行。例如,气刀液滴或气溶胶发生器可用于将前体流体的液滴分配到胶凝溶液中,以形成包含个别生物颗粒或小组生物颗粒的微胶囊。同样,可以使用基于膜的包封系统来生成包含如本文所述的包封生物颗粒的微胶囊。如本文所述,本公开的微流体系统,例如图1所示的微流体系统,可以容易地用于包封细胞。具体来说,并且参考图1,包含(i)生物颗粒114和(ii)聚合物前体材料(未示出)的水性流体112流入通道汇合点110中,在那里水性流体通过非水流体流116而分配成液滴118、120。在包封方法的情况下,非水性流体116还可包含引发剂(未示出),以引起聚合物前体的聚合和/或交联,以形成包含夹带的生物颗粒的微胶囊。聚合物前体/引发剂对的实例包括在美国专利申请公布号2014/0378345中描述的那些,所述专利申请出于所有目的以引用的方式整体并入本文。

例如,在聚合物前体材料包含线性聚合物材料(如线性聚丙烯酰胺、PEG或其他线性聚合物材料)的情况下,活化剂可包含交联剂或活化所形成的微滴内的交联剂的化学品。同样,对于包含可聚合单体的聚合物前体,活化剂可包含聚合引发剂。例如,在某些情况下,在聚合物前体包含丙烯酰胺单体与N,N’-双-(丙烯酰基)胱胺(BAC)共聚单体的混合物的情况下,可在通道区段104和106中的第二流体流116内提供例如四乙基亚甲基二胺(TEMED)之类的试剂,该试剂可以引发丙烯酰胺和BAC共聚成交联的聚合物网络或水凝胶。

在第二流体流116与第一流体流112在汇合点110处接触后,在液滴形成期间,TEMED可从第二流体116扩散到包含线性聚丙烯酰胺的水性流体112中,这将活化液滴118、120内的聚丙烯酰胺的交联,从而导致形成凝胶(例如,水凝胶)微胶囊,呈夹带有细胞114的固体或半固体珠粒或颗粒形式。尽管就聚丙烯酰胺包封而言进行了描述,但是其他‘可活化的’包封组合物也可用于本文所述的方法和组合物的背景中。例如,藻酸盐液滴的形成,随后暴露于二价金属离子(例如,Ca2+离子),可用作使用所述方法的包封方法。同样,琼脂糖液滴也可通过基于温度的胶凝作用(例如,在冷却时,等等)转化成胶囊。

在一些情况下,包封的生物颗粒可以选择性地从微胶囊中释放出来,例如随着时间的推移或在施加特定刺激时,充分降解微胶囊,以允许生物颗粒(例如,细胞)或它的其它内容物降从微胶囊中释放出来,例如释放到分区(例如,液滴)中。例如,在上述聚丙烯酰胺聚合物的情况下,微胶囊的降解可通过引入适当的还原剂例如DTT等来溶解使聚合物基质交联的二硫键而实现。参见,例如,美国专利申请公布号2014/0378345,其出于所有目的以引用的方式完全并入本文。

可使生物颗粒经受足以使前体聚合或胶凝的其他条件。足以使前体聚合或胶凝的条件可包括暴露于加热、冷却、电磁辐射和/或光。足以使前体聚合或胶凝的条件可以包括足以使前体聚合或胶凝的任何条件。聚合或胶凝之后,可在生物颗粒周围形成聚合物或凝胶。聚合物或凝胶可以是化学或生化试剂可扩散性渗透的。聚合物或凝胶可以是生物颗粒的大分子成分不可扩散性渗透的。以这种方式,聚合物或凝胶可以起到允许生物颗粒经受化学或生化操作的作用,同时将大分子成分在空间上限制到由聚合物或凝胶限定的液滴区域中。聚合物或凝胶可包括以下中的一者或多者:二硫化物交联的聚丙烯酰胺、琼脂糖、藻酸盐、聚乙烯醇、聚乙二醇(PEG)-二丙烯酸酯、PEG-丙烯酸酯、PEG-硫醇、PEG-叠氮化物、PEG-炔烃、其他丙烯酸酯、壳聚糖、透明质酸、胶原、纤维蛋白、明胶或弹性蛋白。聚合物或凝胶可包含任何其他聚合物或凝胶。

可将聚合物或凝胶官能化以结合目标分析物,例如核酸、蛋白质、碳水化合物、脂质或其他分析物。聚合物或凝胶可通过被动机制聚合或胶凝。聚合物或凝胶在碱性条件或高温下可以稳定。聚合物或凝胶可具有与珠粒的机械特性相似的机械特性。例如,聚合物或凝胶可以具有与珠粒相似的大小。聚合物或凝胶可具有与珠粒相似的机械强度(例如,拉伸强度)。聚合物或凝胶的密度可低于油。聚合物或凝胶的密度可以大致类似于缓冲剂的密度。聚合物或凝胶可具有可调的孔径。可以选择孔径以例如保留变性的核酸。可以选择孔径以保持对外源化学物质(例如氢氧化钠(NaOH))和/或内源化学物质(例如抑制剂)的扩散渗透性。聚合物或凝胶可以是生物相容的。聚合物或凝胶可以维持或增强细胞活力。聚合物或凝胶可以是生物化学相容的。聚合物或凝胶可以通过热、化学、酶和/或光学方式聚合和/或解聚。

聚合物可包含经二硫键交联的聚(丙烯酰胺-共-丙烯酸)。聚合物的制备可包括双操作反应。在第一活化步骤中,可将聚(丙烯酰胺-共-丙烯酸)暴露于酰化剂,以将羧酸转化为酯。例如,可将聚(丙烯酰胺-共-丙烯酸)暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉盐酸盐(DMTMM)。可使聚丙烯酰胺-共-丙烯酸暴露于4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉鎓的其他盐。在第二交联步骤中,可将第一步中形成的酯暴露于二硫化物交联剂。例如,可以将酯暴露于胱胺(2,2’-二硫代双(乙胺))。在这两个步骤之后,生物颗粒可被通过二硫桥连接在一起的聚丙烯酰胺链包围。以这种方式,可以将生物颗粒封闭在凝胶或基质(例如,聚合物基质)内部或包含该凝胶或基质,以形成“细胞珠粒”。细胞珠粒可包含生物颗粒(例如,细胞)或生物颗粒的大分子成分(例如,RNA、DNA、蛋白质等)。细胞珠可包括单个细胞或多个细胞,或单个细胞或多个细胞的衍生物。例如在裂解和洗涤细胞后,可以将来自细胞裂解物的抑制组分洗掉,并且大分子成分可以结合为细胞珠粒。本文公开的系统和方法可适用于含有生物颗粒的细胞珠粒(和/或液滴或其它分区)和含有生物颗粒的大分子成分的细胞珠粒(和/或液滴或其它分区)两者。

包封的生物颗粒可提供与基于液滴的分区化生物颗粒相比,更易储存和更易携带的某些潜在优势。此外,在一些情况下,可能希望在分析之前允许生物颗粒孵育一段选定的时间,例如,以便表征在存在或不存在不同刺激的情况下此类生物颗粒随时间的变化。在此类情况下,包封可允许比在乳液液滴中分配更长的孵育,但是在一些情况下,液滴分区的生物颗粒也可以孵育不同的时间段,例如至少10秒、至少30秒、至少1分钟、至少5分钟、至少10分钟、至少30分钟、至少1小时、至少2小时、至少5小时或至少10小时或更多时间。生物颗粒的包封可以构成生物颗粒的分配,其他试剂在其中共分配。可替代地或另外地,包封的生物颗粒可轻易地沉积到如上文所述的其他分区(例如,液滴)中。

珠粒

分区可包含一个或多个独特标识符,诸如条形码。条形码可预先、随后或同时递送到容纳区室化或分配的生物颗粒的分区中。例如,条形码可以在液滴生成之前、之后或与之同时注入到液滴中。条码递送至特定分区允许随后将单独生物颗粒的特性归属于特定分区。条形码可经由任何合适的机制,例如在核酸分子(例如寡核苷酸)上递送至分区。条形码化核酸分子可通过微胶囊递送至分区。在一些情况下,微胶囊可包含珠粒。下面更详细地描述珠粒。

在一些情况下,条形码化核酸分子可最初与微胶囊缔合,然后从微胶囊中释放出来。条形码化核酸分子的释放可以是被动的(例如,通过扩散出微胶囊)。此外或可替代地,从微胶囊释放可以是在施加允许条形码化核酸核酸分子从微胶囊解离或从微胶囊释放的刺激时。此类刺激可以破坏微胶囊,这是一种使条形码化核酸分子偶联至微胶囊或处于微胶囊内或两者的相互作用。此类刺激可以包括,例如热刺激、光刺激、化学刺激(例如,pH的变化或还原剂的使用)、机械刺激、辐射刺激、生物刺激(例如酶)或它们的任何组合。

图2示出用于将携带条形码的珠粒递送至液滴的微流体通道结构200的一个实例。通道结构200可以包括在通道汇合点210处连通的通道区段201、202、204、206和208。在操作中,通道区段201可以将包括多个珠粒214(例如,含核酸分子、寡核苷酸、分子标签)的水性流体212沿通道区段201转运至汇合点210处。所述多个珠粒214可以来源于珠粒悬浮液。例如,通道区段201可以连接至包含珠粒214的水性悬浮液的储槽。通道区段202可以将包括多个生物颗粒216的水性流体212沿通道区段202转运至汇合点210处。所述多个生物颗粒216可以来源于生物颗粒的悬浮液。例如,通道区段202可以连接至包含生物颗粒216的水性悬浮液的储槽。在一些情况下,第一通道区段201或第二通道区段202或两个区段中的水性流体212可以包括一种或多种试剂,如下面进一步详述的。可以将与水性流体212不可混溶的第二流体218(例如,油)从通道区段204和206中的每一个递送至汇合点210处。在来自通道区段201和202中的每一个的水性流体212与来自通道区段204和206中的每一个的第二流体218在通道汇合点210处会合时,水性流体212可以在第二流体218中分配为离散液滴220并且沿通道区段208从汇合点210处流走。通道区段208可以将离散液滴递送到与通道区段208流体联接的出口储槽,在此可以将离散液滴收获在出口储槽中。

作为替代方案,通道区段201和202可在汇合点210上游的另一个汇合点处汇合。在此汇合点处,珠粒和生物颗粒可形成混合物,沿另一通道将所述混合物引导至汇合点210处,以得到液滴220。所述混合物可以以交替的方式提供珠粒和生物颗粒,使得例如液滴包含单个珠粒和单个生物颗粒。

珠粒、细胞珠粒和微滴可以基本上规则的流动剖面(例如,以常规流速)沿着通道流动。此类规则的流动曲线可以容许液滴包括单个珠粒和单个生物颗粒。此类规则的流动曲线可以容许液滴具有大于5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%的占用率(例如,具有珠粒和生物颗粒的液滴)。在例如美国专利公布号2015/0292988中提供了此类规则的流动曲线和可用于提供此类规则的流动曲线的装置,所述专利以引用的方式整体并入本文。

第二流体218可包含油,诸如含氟油,所述油包含用于稳定化所得液滴,例如抑制所得液滴220的后续聚结的含氟表面活化剂。

所产生的离散液滴可包括单独的生物颗粒216。生成的离散液滴可包括携带条形码或其它试剂的珠粒214。生成的离散液滴可以包括单独的生物颗粒和携带条形码的珠粒(例如液滴220)两者。在一些情况下,离散液滴可以包括多于一个单独的生物颗粒或不包括生物颗粒。在一些情况下,离散的微滴可包含多于一个珠粒或不含珠粒。离散液滴可未被占用(例如,无珠粒、无生物颗粒)。

有利地,将生物颗粒和携带条形码的珠粒分配的离散液滴可以有效地允许将条形码归属于分区内生物颗粒的大分子成分。分区的内容物可与其他分区的内容物保持离散。

如应了解,可将本文所述的通道区段联接至多种不同流体来源或接收部件(包括储槽、管道、歧管)或其他系统的流体部件中的任一种。如将理解的,微流体通道结构200可具有其他几何形状。例如,微流体通道结构可以具有多于一个的通道汇合点。例如,微流体通道结构可以具有2、3、4或5个通道区段,每个通道区段都携带有珠粒,这些通道区段在通道汇合点处会合。可以通过一个或多个流体流动单元引导流体沿着一个或多个通道或储槽流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。流体还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管流或重力流等来控制。

珠粒可以是多孔的、无孔的、固体、半固体、半流体、流体和/或它们的组合。在一些情况下,珠粒可以是可溶解的、可破碎的和/或可降解的。在一些情况下,珠粒可以不是可降解的。在一些情况下,珠粒可以是凝胶珠粒。凝胶珠粒可以是水凝胶珠粒。凝胶珠粒可由分子前体例如聚合物或单体物质形成。半固体珠粒可以是脂质体珠粒。固体珠粒可包含金属,包括氧化铁、金和银。在一些情况下,珠粒可以是二氧化硅珠粒。在一些情况下,珠粒可以是刚性的。在其他情况下,珠粒可以是柔性的和/或可压缩的。

珠粒可具有任何合适的形状。珠粒形状的实例包括但不限于球形、非球形、椭圆形、长方形、无定形、圆形、圆柱形及其变型。

珠粒可具有均一的尺寸或不均一的尺寸。在一些情况下,珠粒的直径可以是至少约10纳米(nm)、100nm、500nm、1微米(μm)、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更大。在一些情况下,珠粒的直径可以小于约10nm、100nm、500nm、1μm、5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、250μm、500μm、1mm或更小。在一些情况下,珠粒的直径可在约40-75μm、30-75μm、20-75μm、40-85μm、40-95μm、20-100μm、10-100μm、1-100μm、20-250μm或20-500μm的范围内。

在某些方面,珠粒可以作为具有相对单分散的粒度分布的珠粒群体或多个珠粒提供。在可能希望在分区内提供相对一致量的试剂的情况下,保持相对一致的珠粒特征(例如大小)可以有助于总体一致性。具体来说,本文所述的珠粒可具有这样的粒度分布,所述粒度分布在其横截面尺寸上的变异系数小于50%、小于40%、小于30%、小于20%,并且在一些情况下小于15%、小于10%、小于5%或更小。

珠粒可包含天然材料和/或合成材料。例如,珠粒可包含天然聚合物、合成聚合物或天然聚合物和合成聚合物两者。天然聚合物的实例包括蛋白质和糖,例如脱氧核糖核酸、橡胶、纤维素、淀粉(例如直链淀粉、支链淀粉)、蛋白质、酶、多糖、丝、聚羟基烷基酸酯、壳聚糖、葡聚糖、胶原蛋白、卡拉胶、卵叶车前子、阿拉伯胶、琼脂、明胶、虫胶、梧桐胶、黄原胶、玉米糖胶、瓜尔胶、刺梧桐胶、琼脂糖、海藻酸、海藻酸盐或它们的天然聚合物。合成聚合物的实例包括丙烯酸类、尼龙、硅酮、氨纶、粘胶人造丝、聚羧酸、聚乙酸乙烯酯、聚丙烯酰胺、聚丙烯酸酯、聚乙二醇、聚氨酯、聚乳酸、二氧化硅、聚苯乙烯、聚丙烯腈、聚丁二烯、聚碳酸酯、聚乙烯、聚对苯二甲酸乙二醇酯、聚(氯三氟乙烯)、聚(环氧乙烷)、聚(对苯二甲酸乙二醇酯)、聚乙烯、聚异丁烯、聚(甲基丙烯酸甲酯)、聚(氧化亚甲基)、聚甲醛、聚丙烯、聚苯乙烯、聚(四氟乙烯)、聚(乙酸乙烯酯)、聚(乙烯醇)、聚(氯乙烯)、聚(偏二氯乙烯)、聚(偏二氟乙烯)、聚(氟乙烯)和/或它们的组合(例如,共聚物)。珠粒也可以由除聚合物之外的材料形成,包括脂质、胶束、陶瓷、玻璃陶瓷、材料复合物、金属、其他无机材料等。

在一些情况下,珠粒可含有分子前体(例如,单体或聚合物),其可通过分子前体的聚合而形成聚合物网络。在一些情况下,前体可以是已经聚合的物质,其能够经由例如化学交联进行进一步聚合。在一些情况下,前体可以包含丙烯酰胺或甲基丙烯酰胺单体、低聚物或聚合物中的一种或多种。在一些情况下,珠粒可以包含预聚物,其是能够进一步聚合的低聚物。例如,可以使用预聚物制备的聚氨酯珠粒。在一些情况下,珠粒可以含有可进一步聚合在一起的单独聚合物。在一些情况下,可通过不同前体的聚合而产生珠粒,使得它们包含混合的聚合物、共聚物和/或嵌段共聚物。在一些情况下,珠粒可在聚合物前体(例如,单体、低聚物、线性聚合物)、核酸分子(例如,寡核苷酸)、引物和其他实体之间包含共价键或离子键。在一些情况下,共价键可以是碳-碳键、硫醚键或碳-杂原子键。

交联可以是永久性的或可逆性的,这取决于所用的特定交联剂。可逆性交联可以允许聚合物在适当的条件下线性化或解离。在一些情况下,可逆性交联也可以允许与珠粒表面结合的材料的可逆性附接。在一些情况下,交联剂可以形成二硫连键。在一些情况下,形成二硫连键的化学交联剂可以是胱胺或修饰的胱胺。

在一些情况下,可以在分子前体单元(例如,单体、低聚物或线性聚合物)或掺入珠粒中的前体与核酸分子(例如,寡核苷酸)之间形成二硫连键。胱胺(包括修饰的胱胺)例如是一种包含二硫键的有机试剂,可以用作珠粒的单独的单体或聚合物前体之间的交联剂。聚丙烯酰胺可以在胱胺或包含胱胺的物质(例如,修饰的胱胺)的存在下聚合,以产生包含二硫连键的聚丙烯酰胺凝胶珠粒(例如,包含可化学还原的交联剂的可化学降解的珠粒)。当珠粒暴露于还原剂时,二硫连键可容许珠粒降解(或溶解)。

在一些情况下,壳聚糖(一种线性多糖聚合物)可通过亲水链与戊二醛交联形成珠粒。壳聚糖聚合物的交联可通过受热、压力、pH值变化和/或辐射引发的化学反应来实现。

在一些情况下,珠粒可包含丙烯酰胺基部分,其在某些方面可用于将一种或多种核酸分子(例如,条形码序列、条形码化寡核苷酸、引物或其他寡核苷酸)附接至珠粒。在一些情况下,丙烯酰胺基部分可指由丙烯酰胺基与一种或多种物质的反应,如丙烯酰胺基与其他单体和交联剂在聚合反应期间的反应产生的丙烯酰胺基类似物。丙烯酰胺基部分可被修饰为与待附接的物质如核酸分子(例如条形码序列、条形码化核酸分子、引物或其他寡核苷酸)形成化学键。丙烯酰胺基部分可以用能够形成二硫键的硫醇基团修饰或者可以用已经包含二硫键的基团修饰。硫醇或二硫化物(通过二硫化物交换)可以用作要附接的物质的锚定点,或者可以将丙烯酰胺基部分的另一部分用于附接。在一些情况下,附接可以是可逆性的,使得当二硫键被破坏时(例如,在还原剂的存在下),所附接的物质从珠粒释放。在其他情况下,丙烯酰胺基部分包含可用于附接的反应性羟基。

用于附接核酸分子(例如,寡核苷酸)的珠粒的官能化可以通过多种不同的方法实现,所述不同的方法包括聚合物内化学基团的活化、聚合物结构中活性或可活化官能团的掺入或在珠粒产生中在预聚物或单体阶段的附接。

例如,聚合形成珠粒的前体(例如,单体,交联剂)可包含丙烯酰胺基部分,使得当生成珠粒时,珠粒还包含丙烯酰胺基部分。可以将丙烯酰胺基部分附接至核酸分子(例如,寡核苷酸),该核酸分子可以包括引物序列(例如,用于扩增靶核酸的引物、随机引物、信使RNA的引物序列)和/或一个或多个条形码序列。一个或多个条形码序列可包括对于偶联至珠粒的所有核酸分子相同的序列和/或在偶联至珠粒的所有核酸分子中不同的序列。核酸分子可掺入到珠粒中。

在一些情况下,核酸分子可包含功能序列,例如用于附接至测序流动池,例如用于测序的P5序列。在一些情况下,核酸分子或其衍生物(例如,从核酸分子产生的寡核苷酸或多核苷酸)可包含另一功能序列,例如,用于附接至测序流动池以进行Illumina测序的P7序列。在一些情况下,核酸分子可以包含条形码序列。在一些情况下,所述引物还包含独特分子标识符(UMI)。在一些情况下,引物可以包含用于Illumina测序的R1引物序列。在一些情况下,引物可以包含用于Illumina测序的R2引物序列。可以与本公开的组合物、装置、方法和系统一起使用的此类核酸分子(例如,寡核苷酸、多核苷酸等)及其用途的实例提供于美国专利公布2014/0378345和2015/0376609中,所述专利各自以引用方式全文并入本文。

图8说明携带条形码的珠粒的一个实例。核酸分子802,例如寡核苷酸,可以通过可释放连键806例如二硫化物连接子,偶联至珠粒804。同一珠粒804可偶联(例如,通过可释放的键联)至一个或多个其他核酸分子818、820。核酸分子802可以是条形码或包含条形码。如本文别处所述,条形码的结构可包含多个序列元件。核酸分子802可以包含可用于后续处理的功能序列808。例如,功能序列808可包括测序仪特异性流动池附接序列(例如用于测序系统的P5序列)和测序引物序列(例如用于测序系统的R1引物)中的一个或多个。核酸分子802可以包含对样品(例如,DNA、RNA、蛋白质等)进行条形码化的条形码序列810。在一些情况下,条形码序列810可以是珠粒特异性的,使得条形码序列810为偶联至相同珠粒804的所有核酸分子(例如,包括核酸分子802)所共有。可替代地或另外,条形码序列810可以是分区特异性的,使得条形码序列810为偶联至分配到同一分区中的一个或多个珠粒的所有核酸分子所共有。核酸分子802可包含特异性引发序列812,如mRNA特异性引发序列(例如,多聚T序列)、靶向引发序列和/或随机引发序列。核酸分子802可包含锚定序列814以确保特异性引发序列812在(例如mRNA的)序列末端杂交。例如,锚定序列814可包括核苷酸的随机短序列,如1-聚体、2-聚体、3-聚体或更长的序列,这可确保多聚T区段更可能在mRNA的多聚A尾的序列末端杂交。

核酸分子802可包含独特分子标识序列816(例如,独特分子标识符(UMI))。在一些情况下,独特分子标识序列816可包含约5至约8个核苷酸。或者,独特分子标识序列816可压缩少于约5个或多于约8个核苷酸。独特分子标识序列816可以是在偶联至单个珠粒(例如,珠粒804)的单独核酸分子(例如,802、818、820等)间不同的唯一序列。在一些情况下,独特分子标识序列816可以是随机序列(例如,随机N-聚体序列)。例如,UMI可以提供被捕获的起始mRNA分子的独特标识符,以便允许定量原始表达的RNA的数量。正如将认识到的,图8示出了偶联至珠粒804的表面的核酸分子802、818、820,单独的珠粒可以偶联至任意数量的单独核酸分子,例如从一到几十到成千上万个或甚至数百万个单独核酸分子。单个核酸分子的相应条形码可包含偶联至同一珠粒的不同单个核酸分子之间的共有序列区段或相对共有序列区段(例如,808、810、812等)和可变或独特序列区段(例如,816)。

在操作时,生物颗粒(例如,细胞、DNA、RNA等)可连同带条形码化珠粒804一起共同分配。条形码化核酸分子802、818、820可以从分区中的珠粒804中释放。举例而言,在分析样品RNA的情况下,其中一个释放的核酸分子(例如,802)的聚T区段(例如,812)可以与mRNA分子的聚A尾杂交。逆转录可产生mRNA的cDNA转录物,但是该转录物包括核酸分子802的序列区段808、810、816中的每一个。因为核酸分子802包含锚定序列814,所以将更有可能与mRNA的多聚A尾的序列末端杂交并引发逆转录。在任何给定分区内,个别mRNA分子的所有cDNA将包含共同的条形码序列区段810。然而,由分区内的不同mRNA分子产生的转录物可在独特分子标识序列812区段(例如,UMI区段)处不同。有利地,即使在分区的内容物的任何后续扩增之后,不同UMI的数量也可指示源自给定分区并因此源自生物颗粒(例如,细胞)的mRNA的量。如上所述,可以对转录物进行扩增、纯化和测序以鉴定mRNA的cDNA转录物的序列,以及对条形码区段和UMI区段进行测序。虽然描述了多聚T引物序列,但是其它靶向或随机引物序列也可以用于引发逆转录反应。同样,尽管描述为将条形码化寡核苷酸释放到分区中,但在一些情况下,结合至珠粒(例如凝胶珠粒)的核酸分子可用于杂交和捕获珠粒固相上的mRNA,例如,以促进RNA与其他细胞内容物的分离。

在一些情况下,包含反应性或能够被活化以使其变得反应性的官能团的前体可与其他前体聚合以产生包含活化的或可活化官能团的凝胶珠粒。然后可使用官能团来将另外物质(例如,二硫化物接头、引物、其他寡核苷酸等)附接至凝胶珠粒。例如,包含羧酸(COOH)基团的一些前体可与其他前体共聚合以形成也包含COOH官能团的凝胶珠粒。在一些情况下,丙烯酸(包含游离COOH基团的物质)、丙烯酰胺和双(丙烯酰基)胱胺可以共聚在一起以产生包含游离COOH基团的凝胶珠粒。凝胶珠粒的COOH基团可以被活化(例如,经由1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)和N-羟基琥珀酰亚胺(NHS)或4-(4,6-二甲氧基-1,3,5-三嗪-2-基)-4-甲基吗啉盐酸盐(DMTMM)),使得它们具有反应性(例如,当使用EDC/NHS或DMTMM活化时,对胺官能团具有反应性)。然后,活化的COOH基团可以与包含待连接到珠粒上的部分的适当物质(例如,包含胺官能团的物质,其中羧酸基团经活化以与胺官能团具有反应性)反应。

在其聚合物网络中包含二硫连键的珠粒可用另外物质,通过将一些二硫连键还原成游离硫醇而官能化。二硫键可以通过例如还原剂(例如DTT,TCEP等)的作用被还原,以生成游离硫醇基团,而不会溶解珠粒。然后,珠粒的游离硫醇可以与物质或包含另一二硫键的物质的游离硫醇反应(例如,通过硫醇-二硫化物交换),使得该物质可以与珠粒连接(例如,通过产生的二硫键)。在一些情况下,珠粒的游离硫醇可与任何其他合适的基团反应。例如,珠粒的游离硫醇可与包含丙烯酰胺基部分的物质反应。珠粒的游离硫醇基团可以通过迈克尔加成化学与丙烯酰胺基反应,使得包含丙烯酰胺基的物质与珠粒连接。在一些情况下,可以通过包含硫醇封端剂(例如N-乙基马来酰胺或碘乙酸)来防止不受控制的反应。

可控制珠粒内二硫键的活化,使得仅少量二硫键被活化。例如,可以通过控制用于生成游离硫醇基团的还原剂的浓度和/或用于在珠粒聚合中形成二硫键的试剂的浓度来进行控制。在一些情况下,低浓度的还原剂分子(例如,小于或等于约1:100,000,000,000、小于或等于约1:10,000,000,000、小于或等于约1:1,000,000,000、小于或等于约1:100,000,000、小于或等于约1:10,000,000、小于或等于约1:1,000,000、小于或等于约1:100,000、小于或等于约1:10,000的还原剂分子:凝胶珠粒比率)可用于还原。控制还原为游离硫醇的二硫连键的数量可对确保官能化期间的珠粒结构完整性有用。在一些情况下,光学活性剂例如荧光染料可通过珠粒的游离硫醇基团与珠粒偶联,并用于定量珠粒中存在的游离硫醇的数量和/或跟踪珠粒。

在一些情况下,在凝胶珠粒形成后向凝胶珠粒添加部分可以是有利的。例如,在凝胶珠粒形成之后添加寡核苷酸(例如,带条形码的寡核苷酸)可以避免链转移终止期间物质的损失,该损失可在聚合过程中发生。而且,较小的前体(例如,不包含侧链基团和所连接的部分的单体或交联剂)可用于聚合,并且可以由于粘性效应,最小限度地阻碍其生长链端。在一些情况下,在凝胶珠粒合成之后的功能化可以使要负载潜在损伤因子(例如,自由基)和/或化学环境的物质(例如,寡核苷酸)的暴露最小化。在一些情况下,所产生的凝胶可具有上临界溶解温度(UCST),其可容许珠粒受温度驱动溶胀和坍塌。此类功能性可以有助于寡核苷酸(例如,引物)在随后用寡核苷酸对珠粒进行功能化期间渗入珠粒中。产生后的功能化也可用于控制珠粒中物质的负载比,使得例如负载比的可变性最小化。物质负载也可以在分批工艺中进行,使得多个珠粒可以在单一批次中受物质功能化。

注入或以其他方式引入分区的珠粒可包含可释放、可裂解或可逆地附接的条形码。注入或以其他方式引入分区的珠粒可包含可活化的条形码。注入或以其他方式引入分区的珠粒可以是可降解的、可破坏的或可溶解的珠粒。

条形码可释放地、可裂解地或可逆地附接至珠粒,以使得条形码可通过裂解条形码分子与珠粒之间的键联而释放或可释放或通过下面的珠珠粒本身的降解释放,从而允许条形码通过其他试剂接近或可接近,或两者。在非限制性实例中,裂解可通过以下方式实现:二硫键的还原、限制酶的使用、光活化裂解或通过其它类型的刺激(例如化学、热、pH、酶刺激等)进行的裂解和/或反应,例如本文其它地方所述的。可释放条形码有时可被称为可活化的,因为它们一旦释放就可用于反应。因此,例如,可通过从珠粒(或本文所述的其他合适类型的分区)释放条形码来活化可活化的条形码。在所描述的方法和系统的背景下还设想了其他可活化配置。

除了珠粒与缔合分子(例如含有条形码的核酸分子(例如条形码化寡核苷酸))之间的可裂解键之外或作为其替代,珠粒可以在自发地或在暴露于一种或多种刺激(例如,温度变化、pH变化、暴露于特定化学物质或相、暴露于光、还原剂等)后为可降解、可破坏或可溶解的。在一些情况下,珠粒可以是可溶解的,使得当暴露于特定化学物质或环境变化,例如温度变化或pH变化时,珠粒的材料组分被溶解。在一些情况下,凝胶珠粒可在高温和/或碱性条件下降解或溶解。在一些情况下,珠粒可以是可热降解的,使得当珠粒暴露于适当的温度变化(例如,热)时,珠粒降解。与物质(例如,核酸分子,例如条形码化寡核苷酸)结合的珠粒的降解或溶解可导致物质从珠粒中释放。

从以上公开内容可以理解,珠粒的降解可以指在使物理珠粒本身的结构发生和不发生降解的情况下结合或夹带的物质从珠粒中解离。例如,珠粒的降解可涉及经由本文别处描述的一种或多种物质和/或方法裂解可裂解的键。在另一个实例中,夹带的物质可以通过由于例如改变化学环境而产生的渗透压差从珠粒中释放。举例来说,由于渗透压差所致的珠粒孔径的改变通常可在没有珠粒本身的结构降解的情况下发生。在一些情况下,由于珠粒的渗透溶胀而引起的孔径增加可容许珠粒内夹带的物质释放。在其他情况下,由于孔径收缩,珠粒的渗透收缩可使得珠粒更好地保留夹带的物质。

可以将可降解珠粒引入到分区,例如乳液液滴或孔中,使得当施加适当的刺激时,珠粒在分区内降解并且任何缔合的物质(例如,寡核苷酸)都在液滴内释放。游离物质(例如,寡核苷酸,核酸分子)可与分区中包含的其他试剂相互作用。例如,包含胱胺并通过二硫键与条形码序列连接的聚丙烯酰胺珠粒可以与还原剂在油包水乳液的液滴内组合。在液滴内,还原剂可断裂各种二硫键,导致珠粒降解并且条形码序列释放到液滴的内部水性环境中。在另一个实例中,在碱性溶液中加热包含珠粒结合的条形码序列的液滴也可导致珠粒降解并且附接的条形码序列释放到液滴的内部水性环境中。

任何合适数量的分子标签分子(例如,引物、条形码化寡核苷酸)可以与珠粒缔合,使得在从珠粒中释放后,分子标签分子(例如,引物,例如,条形码化寡核苷酸)以预先定义的浓度存在于分区中。可以选择此类预定浓度以促进在分区内产生测序文库的某些反应,例如扩增。在一些情况下,引物的预定浓度可以通过产生带有核酸分子(例如,寡核苷酸)的珠粒的过程来限制。

在一些情况下,珠粒可以非共价负载有一种或多种试剂。例如,通过使珠粒经受足以使珠粒溶胀的条件,允许有足够的时间使试剂扩散到珠粒的内部,以及使珠粒经受足以使珠粒去溶胀的条件,可以使珠粒非共价地负载。珠粒的溶胀可通过例如将珠粒置于热力学上有利的溶剂中,使珠粒经受更高或更低的温度,使珠粒经受更高或更低的离子浓度和/或使珠粒经受电场来完成。珠粒的溶胀可以通过各种溶胀方法完成。珠粒的去溶胀可通过例如转移热力学上有利的溶剂中的珠粒,使珠粒经受更低的温度或高温,使珠粒经受更低或更高的离子浓度和/或将珠粒从电场中移除来完成。珠粒的去溶胀可以通过各种去溶胀方法完成。转移珠粒可引起珠粒中的孔隙收缩。然后收缩可阻碍珠粒内的试剂从珠粒内部扩散出来。所述阻碍可能是由于试剂与珠粒内部之间的空间相互作用产生的。转移可以用微流体方式来完成。例如,可以通过将珠粒从一个共流溶剂流移动到不同的共流溶剂流来实现转移。珠粒的可溶胀性和/或孔径可通过改变珠粒的聚合物组成来调节。

在一些情况下,连接至前体的丙烯酰胺基部分、连接至前体的另一种物质或前体本身可包含不稳定键,如化学、热或光敏感键,例如二硫键、UV敏感键等。一旦丙烯酰胺基部分或包含不稳定键的其他部分并入到珠粒中,所述珠粒也可包含不稳定键。不稳定键可以例如用于将物质(例如,条形码、引物等)可逆性地连接(例如,共价连接)到珠粒上。在一些情况下,热不稳定键可以包括基于核酸杂交的附接,例如,其中寡核苷酸与附接至珠粒的互补序列杂交,使得杂交体的热解链使寡核苷酸(例如含条形码的序列)从珠粒或微胶囊中释放。

向凝胶珠粒添加多种类型的不稳定键可导致产生能够响应于不同刺激的珠粒。每种类型的不稳定键可能对相关刺激(例如,化学刺激、光、温度、酶等)敏感,使得可以通过施加适当的刺激来控制经由每种不稳定键附接至珠粒的物质的释放。此类功能性可用于物质从凝胶珠粒的控释中。在一些情况下,包含不稳定键的另一种物质可以在凝胶珠粒形成之后通过例如如上所述的凝胶珠的活化官能团与凝胶珠粒连接。如将理解的,可释放地、可裂解地或可逆地附接至本文所述的珠粒的条形码包括通过裂解条形码分子与珠粒之间的键联而释放或可释放或通过下面的珠珠粒本身的降解释放的条形码,从而允许条形码通过其他试剂访问或可访问,或两者。

如本文所述的可释放的条形码有时可以称为可活化,因为它们一旦释放,就可用于反应。因此,例如,可通过从珠粒(或本文所述的其他合适类型的分区)释放条形码来活化可活化的条形码。在所描述的方法和系统的背景下还设想了其他可活化配置。

除了热可溶解的键、二硫键和UV敏感键以外,可偶联至前体或珠粒的不稳定键的其他非限制性实例包括酯键联(例如,可用酸、碱或羟胺溶解)、邻位二醇键联(例如,可经由高碘酸钠溶解)、狄尔斯-阿尔德(Diels-Alder)键联(例如,可经由热溶解)、砜键联(例如,可经由碱溶解)、甲硅烷基醚键联(例如,可经由酸溶解)、糖苷键联(例如,可经由淀粉酶溶解)、肽键联(例如,可经由蛋白酶溶解)或磷酸二酯键联(例如,可经由核酸酶(例如,DNA酶)溶解)。如下文进一步描述的,键可通过其他核酸分子靶向酶,如限制酶(例如,限制性核酸内切酶)裂解。

可在珠粒产生期间(例如,在前体聚合期间)将物质包封在珠粒中。此类物质可以参与或可以不参与聚合。此类物质可以进入聚合反应混合物中,使得在珠粒形成后,产生的珠粒包含所述物质。在一些情况下,可以在形成之后将此类物质添加到凝胶珠粒中。此类物质可以包括例如核酸分子(例如,寡核苷酸),用于核酸扩增反应的试剂(例如,引物、聚合酶、dNTP、辅因子(例如,离子辅因子)、缓冲剂)(包括本文所述的那些),用于酶促反应的试剂(例如,酶、辅因子、底物、缓冲剂),用于核酸修饰反应(例如聚合、连接或消化)的试剂,和/或用于一个或多个测序平台的模板制备(例如,标签化)的试剂(例如,用于)。此类物质可包括本文所述的一种或多种酶,包括但不限于聚合酶、逆转录酶、限制酶(例如核酸内切酶)、转座酶、连接酶、蛋白酶K、DNA酶等。此类物质可包括本文其他地方所述的一种或多种试剂(例如,溶解剂、抑制剂、灭活剂、螯合剂、刺激物)。捕获此类物质可通过在前体聚合期间产生的聚合物网络密度、控制凝胶珠粒内的离子电荷(例如,经由连接至聚合物质的离子物质)或通过释放其他物质来进行控制。可以在珠粒降解时和/或通过施加能够使物质从珠粒中释放的刺激,使包封的物质从珠粒中释放。可替代地或另外,可以在分区形成期间或之后,将物质分配在分区(例如,液滴)中。此类物质可以包括但不限于以上提到的也可以包封在珠粒中的物质。

可降解珠粒可包含一种或多种具有不稳定键的物质,以使得当所述珠粒/物质暴露于适当的刺激物时,键被破坏并且珠粒降解。不稳定键可以是化学键(例如,共价键、离子键)或者可以是另一种类型的物理相互作用(例如,范德华相互作用、偶极-偶极相互作用等)。在一些情况下,用于产生珠粒的交联剂可包含不稳定键。暴露于适当条件时,不稳定键可断裂并且珠粒降解。例如,将包含胱胺交联剂的聚丙烯酰胺凝胶珠粒暴露于还原剂时,胱胺的二硫键可断裂并且珠粒降解。

与不降解的珠粒相比,当对珠粒施加适当的刺激时,可降解珠粒可以用于更快速地使附接的物质(例如,核酸分子、条形码序列、引物等)从珠粒释放。例如,对于与多孔珠粒的内表面结合的物质或在包封的物质的情况下,所述物质在珠粒降解后可具有更大的迁移率和对溶液中其他物质的可接近性。在一些情况下,物质还可以经由可降解连接子(例如,二硫化物连接子)与可降解珠粒连接。可降解连接子可与可降解珠粒响应于相同的刺激,或者两种可降解物质可响应于不同的刺激。例如,条形码序列可以通过二硫键与包含胱胺的聚丙烯酰胺珠粒连接。带条形码的珠粒暴露于还原剂时,珠粒会降解并且在条形码序列与珠粒之间的二硫连键以及珠粒中的胱胺的二硫连键都断裂时,条形码序列被释放。

从以上公开内容可以理解,虽然称为珠粒的降解,但在如上所述的许多情况下,所述降解可以指在使物理珠粒本身的结构发生和不发生降解的情况下结合或夹带的物质从珠粒中解离。例如,夹带的物质可以通过由于例如改变化学环境而产生的渗透压差从珠粒中释放。举例来说,由于渗透压差所致的珠粒孔径的改变通常可在没有珠粒本身的结构降解的情况下发生。在一些情况下,由于珠粒的渗透溶胀而引起的孔径增加可容许珠粒内夹带的物质释放。在其他情况下,由于孔径收缩,珠粒的渗透收缩可使得珠粒更好地保留夹带的物质。

在提供可降解珠粒的情况下,避免在给定时间之前将此类珠粒暴露于引起此类降解的一种或多种刺激可能是有益的,例如,以避免珠粒过早降解以及由此类降解引起的问题,包括例如不良的流动特征和聚集。举例来说,在珠粒包含可还原的交联基团,例如二硫基团的情况下,期望避免使此类珠粒与还原剂例如DTT或其它二硫化物溶解试剂接触。在此类情况下,将在一些情况下提供不含还原剂(例如DTT)的对本文所述珠粒的处理。因为在商业酶制剂中常常会提供还原剂,所以可能期望在处理本文所述的珠粒时提供不含还原剂(或不含DTT)的酶制剂。此类酶的实例包括例如聚合酶制剂、逆转录酶制剂、连接酶制剂以及可用于处理本文所述珠粒的许多其他酶制剂。术语“不含还原剂”或“不含DTT”的制剂可以指具有小于约1/10、小于约1/50或甚至小于约1/100下限的用于降解珠粒的此类材料的制剂。例如,对于DTT,不含还原剂的制剂可以具有小于约0.01毫摩尔(mM)、0.005mM、0.001mM DTT、0.0005mM DTT,或甚至小于约0.0001mM DTT。在许多情况下,DTT的量是不可检测的。

许多化学触发剂可以用于触发珠粒的降解。这些化学变化的实例可包括但不限于pH介导的珠粒内组分完整性的改变、通过交联键的裂解的珠粒组分的降解以及珠粒组分的解聚。

在一些实施方案中,珠粒可由包含可降解的化学交联剂例如BAC或胱胺的材料形成。此类可降解交联剂的降解可以通过许多机制完成。在一些实例中,珠粒可与化学降解剂接触,所述化学降解剂可诱导氧化、还原或其他化学变化。例如,化学降解剂可以是还原剂,例如二硫苏糖醇(DTT)。还原剂的另外实例可包括β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或其组合。还原剂可以降解在形成珠粒的凝胶前体之间形成的二硫键,并且因此可以降解珠粒。在其他情况下,溶液的pH变化(如pH的增加)可触发珠粒的降解。在其他情况下,暴露于水溶液(例如水)可触发水解降解,并且因此触发珠粒的降解。在一些情况下,刺激的任何组合可以触发珠粒的降解。例如,pH的变化可以使化学试剂(例如,DTT)成为有效的还原剂。

在施加热刺激时,还可诱导珠粒释放其内容物。温度的变化可引起珠粒的各种变化。例如,热量可以引起固体珠粒液化。热量的变化可引起珠粒熔融,使得珠粒的一部分降解。在其他情况下,热量可增加珠粒组分的内部压力,以使得珠粒破裂或爆炸。热量也可作用于用作构造珠粒的材料的热敏聚合物。

任何合适的试剂都可以降解珠粒。例如,可以使用温度或pH的变化来降解珠粒中的热敏或pH敏感键。可替代地或除此之外,化学降解剂可用于通过氧化、还原或其他化学变化降解珠粒内的化学键。例如,化学降解剂可以是还原剂,例如DTT,其中DTT可以降解在交联剂与凝胶前体之间形成的二硫键,从而降解珠粒。可以添加还原剂以降解珠粒,这可以引起或可以不引起珠粒释放其内容物。还原剂的实例可以包括二硫苏糖醇(DTT)、β-巯基乙醇、(2S)-2-氨基-1,4-二巯基丁烷(二硫代丁胺或DTBA)、三(2-羧乙基)膦(TCEP)或它们的组合。还原剂可以以0.1mM、0.5mM、1mM、5mM、10mM的浓度存在。还原剂可以以至少约0.1mM、0.5mM、1mM、5mM、10mM或高于10mM的浓度存在。还原剂可以以至多约10mM、5mM、1mM、0.5mM、0.1mM或更低的浓度存在。

任何合适数量的分子标签分子(例如,引物、条形码化寡核苷酸)可以与珠粒缔合,使得在从珠粒中释放后,分子标签分子(例如,引物,例如,条形码化寡核苷酸)以预先定义的浓度存在于分区中。可以选择此类预定浓度以促进在分区内产生测序文库的某些反应,例如扩增。在一些情况下,引物的预定浓度可以通过产生带有寡核苷酸的珠粒的过程来限制。

尽管图1和图2已经根据提供基本上单一占用的分区进行了描述,但是在上面,在某些情况下,可能期望提供多重占用的分区,例如,在单个分区内含有两个、三个、四个或更多个包含条形码化核酸分子(例如,寡核苷酸)的细胞和/或微胶囊(例如,珠粒)。因此,如上所述,可以控制含有生物颗粒和/或珠粒的流体和分配流体的流动特征,以提供此类多重占用的分区。具体而言,可以控制流动参数以提供大于约50%的分区、大于约75%,并且在某些情况下大于约80%、90%、95%或更高百分比的给定占用率。

在一些情况下,可使用另外微胶囊来将另外试剂递送至分区。在此类情况下,可能有利的是将不同的珠粒从不同的珠粒源(例如,含有不同的相关试剂)通过通入共用通道或液滴生成汇合点(例如,汇合点210)的不同通道入口引入到此类共用通道或液滴生成汇合点中。在此类情况下,可以控制不同珠粒进入通道或汇合点的流动和频率,以提供一定比率的来自每个来源的微胶囊,同时确保进入分区中的此类珠粒与给定数量的生物颗粒的配对或组合(例如,每个分区一个生物颗粒和一个珠粒)。

本文所述的分区可以包含小体积,例如小于约10微升(μL)、5μL、1μL、900皮升(pL)、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL、500纳升(nL)、100nL、50nL或更小。

例如,在基于液滴的分区的情况下,液滴的总体积可小于约1000pL、900pL、800pL、700pL、600pL、500pL、400pL、300pL、200pL、100pL、50pL、20pL、10pL、1pL或更小。在与微胶囊共同分配的情况下,将认识到在分区内的样品流体体积,例如包括共同分配的生物颗粒和/或珠粒,可以小于上述体积的约90%、小于上述体积的约80%、小于上述体积的约70%、小于上述体积的约60%、小于上述体积的约50%、小于上述体积的约40%、小于上述体积的约30%、小于上述体积的约20%或小于上述体积的约10%。

如本文其他地方所述,分配物质可产生分区群体或多个分区。在此类情况下,可生成或以其他方式提供任何合适数量的分区。例如,可生成或以其他方式提供至少约1,000个分区、至少约5,000个分区、至少约10,000个分区、至少约50,000个分区、至少约100,000个分区、至少约500,000个分区、至少约1,000,000个分区、至少约5,000,000个分区、至少约10,000,000个分区、至少约50,000,000个分区、至少约100,000,000个分区、至少约500,000,000个分区、至少约1,000,000,000个分区或更多个分区。而且,所述多个分区可以包括未占用分区(例如,空分区)和已占用分区。

试剂

根据某些方面,可以将生物颗粒连同溶解试剂一起分配,以便释放分区内生物颗粒的内容物。在此类情况下,可以在将生物颗粒引入到分配汇合点/液滴生成区(例如汇合点210)中的同时或就在之前,例如通过通道汇合点上游的一个或多个另外通道,使溶解剂与生物颗粒悬浮液接触。根据其它方面,另外或可替代地,生物颗粒可以连同其它试剂一起分区,正如下面将进一步描述的那样。

图3示出了用于将生物颗粒和试剂共同分配的微流体通道结构300的一个实例。通道结构300可以包括通道区段301、302、304、306和308。通道区段301和302在第一通道汇合点309处连通。通道区段302、304、306和308在第二通道汇合点310处连通。

在示例性操作中,通道区段301可以将包括多个生物颗粒314的水性流体312沿通道区段301转运至汇合点310处。作为替代或补充,通道区段301还可以转运珠粒(例如,凝胶珠粒)。珠粒可以包含条形码分子。

例如,通道区段301可连接至包含生物颗粒314的水性悬浮液的储槽。在第二汇合点310上游并且就在到达第二汇合点之前,通道区段301可在第一汇合点309处遇到通道区段302。通道区段302可将悬浮在水性流体312中的多种试剂315(例如,溶解剂)沿着通道区段302输送到第一接合点309中。例如,通道区段302可以连接至包含试剂315的储槽。在第一汇合点309之后,通道区段301中的水性流体312可以将生物颗粒314与试剂315两者携带到第二汇合点310处。在一些情况下,通道区段301中的水性流体312可以包括一种或多种试剂,所述试剂可以与试剂315相同或不同。可以将与水性流体312不可混溶的第二流体316(例如,油)从通道区段304和306中的每一个递送至第二汇合点310处。在来自通道区段301的水性流体312与来自通道区段304和306中的每一个的第二流体316在第二通道汇合点310处会合时,水性流体312可以在第二流体316中分配为离散液滴318并且沿通道区段308从第二汇合点310处流走。通道区段308可以将离散液滴318递送到与通道区段308流体联接的出口储槽,可以将离散液滴收获在出口储槽中。

第二流体316可包含油,诸如含氟油,所述油包含用于稳定化所得液滴,例如抑制所得液滴318的后续聚结的含氟表面活化剂。

产生的离散液滴可以包括单独的生物颗粒314和/或一种或多种试剂315。在一些情况下,生成的离散液滴可以包括携带条形码的珠粒(未示出),例如经由本文其它地方所述的其它微流体。在一些情况下,离散液滴可以未被占用(例如,无试剂、无生物颗粒)。

有利地,当溶解试剂和生物颗粒被共同分配时,溶解试剂可促进分区内生物颗粒的内容物的释放。分区中释放的内容物可与其他分区的内容物保持离散。

如应了解,可将本文所述的通道区段联接至多种不同流体来源或接收部件(包括储槽、管道、歧管)或其他系统的流体部件中的任一种。如将理解的,微流体通道结构300可具有其他几何形状。例如,微流体通道结构可以具有两个以上的通道汇合点。例如,微流体通道结构可以具有2、3、4、5个通道区段或更多,每个通道区段携带相同或不同类型的珠粒、试剂和/或生物颗粒,这些通道区段在通道汇合点处会合。可以控制每个通道区段中的流体流动以控制将不同元素分配到液滴中。可以通过一个或多个流体流动单元引导流体沿着一个或多个通道或储槽流动。流体流动单元可包括压缩机(例如,提供正压)、泵(例如,提供负压)、致动器等以控制流体的流动。流体还可以或以其他方式通过施加的压力差、离心力、电动泵送、真空、毛细管流或重力流等来控制。

裂解剂的实例包括生物活性试剂,例如用于裂解不同细胞类型(例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等)的裂解酶,例如溶菌酶、无色肽酶、溶葡球菌酶、唇形酶(labiase)、立枯丝核菌裂解酶(kitalase)、溶细胞酶,和多种其它可从例如Sigma-Aldrich,Inc.(St Louis,MO)获得的裂解酶,以及其它可商购获得的裂解酶。其它裂解剂可以另外或可替代地与生物颗粒共同分配,以引起生物颗粒的内容物释放到分区中。例如,在一些情况下,基于表面活性剂的裂解溶液可以用于裂解细胞,但是这些对于基于乳液的体系可能是不太期望的,其中表面活性剂可干扰稳定的乳液。在一些情况下,裂解溶液可包含非离子表面活性剂,例如TritonX-100和Tween 20。在一些情况下,裂解溶液可包含离子表面活性剂,例如十二烷基肌氨酸钠和十二烷基硫酸钠(SDS)。在某些情况下也可以使用电穿孔、热、声或机械细胞破坏,例如,非基于乳液的分配,例如可以作为液滴分配的补充或代替的生物颗粒包封,其中包封物的任何孔径都足够小以在细胞破裂后保留给定大小的核酸片段。

作为与上述生物颗粒共同分配的裂解剂的替代或补充,其它试剂也可与生物颗粒共同分配,包括例如DNA酶和RNA酶灭活剂或抑制剂(例如蛋白酶K)、螯合剂(例如EDTA),以及用于消除或以其它方式降低不同细胞裂解物组分的负面活性或对核酸后续加工的影响的其它试剂。另外,在包封的生物颗粒的情况下,可将生物颗粒暴露于适当的刺激下以使生物颗粒或其内容物从共同分配的微胶囊中释放。例如,在一些情况下,化学刺激可以连同包封的生物颗粒一起共同分配,以允许微胶囊降解以及细胞或其内容物释放到更大的分区中。在一些情况下,这种刺激物可与本文其他地方描述的用于从其各自的微胶囊(例如珠粒)释放核酸分子(例如寡核苷酸)的刺激物相同。在替代方面中,这可以是不同且不重叠的刺激,以便允许包封的生物颗粒在与核酸分子释放到分区中不同的时间释放到同一分区中。

另外试剂也可以与生物颗粒共同分配,例如用于使生物颗粒的DNA片段化的内切核酸酶,用于扩增生物颗粒的核酸片段并将条形码分子标签附接至扩增片段的DNA聚合酶和dNTP。其他酶可共同分配,包括但不限于聚合酶、转座酶、连接酶、蛋白酶K、DNA酶等。另外试剂还可包括逆转录酶,包括具有末端转移酶活性的酶、引物和寡核苷酸,以及可用于模板转换的转换寡核苷酸(在本文中也称为“转换寡核苷酸(switch oligos)”或“模板转换寡核苷酸”)。在一些情况下,模板转换可用于增加cDNA的长度。在一些情况下,模板转换可用于将预定义的核酸序列附加至cDNA。在模板转换的实例中,可由模板例如细胞mRNA的逆转录产生cDNA,其中具有末端转移酶活性的逆转录酶可以以模板非依赖性方式向cDNA添加附加核苷酸,例如聚C。转换寡核苷酸可以包括与附加核苷酸例如聚G互补的序列。cDNA上的附加核苷酸(例如,聚C)可以与转换寡核苷酸上的附加核苷酸(例如,聚G)杂交,由此转换寡核苷酸可以被逆转录酶用作模板以进一步延伸cDNA。模板转换寡核苷酸可以包含杂交区和模板区。杂交区可包含能够与靶标杂交的任何序列。在一些情况下,如先前所述,杂交区包含一系列G碱基以与cDNA分子的3’末端处突出的C碱基互补。所述系列G碱基可包含1个G碱基、2个G碱基、3个G碱基、4个G碱基、5个G碱基或多于5个G碱基。模板序列可包含待并入cDNA中的任何序列。在一些情况中,模板区包含至少1个(例如,至少2、3、4、5个或更多个)标签序列和/或功能序列。转换寡核苷酸可包含脱氧核糖核酸;核糖核酸;修饰的核酸,包括2-氨基嘌呤、2,6-二氨基嘌呤(2-氨基-dA)、反向dT、5-甲基dC、2’-脱氧肌苷、Super T(5-羟基丁炔基-2’-脱氧尿苷)、Super G(8-氮杂-7-脱氮杂鸟苷)、锁核酸(LNA)、解锁核酸(UNA,例如UNA-A、UNA-U、UNA-C、UNA-G)、Iso-dG、Iso-dC、2’氟碱基(例如,氟C、氟U、氟A和氟G)或任何组合。

在一些情况下,转换寡核苷酸的长度可以是至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸或更长。

在一些情况下,转换寡核苷酸的长度可以是至多约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249或250个核苷酸。

一旦细胞的内容物释放到它们各自的分区中,其中所含的大分子组分(例如,生物颗粒的大分子成分,例如RNA、DNA或蛋白质)就可以在分区内被进一步加工。根据本文所述的方法和系统,可以为单独的生物颗粒的大分子组分内容物提供独特标识符,使得在表征那些大分子组分时,可以将其归属为源自相同的一个或多个生物颗粒。通过将独特标识符特异性地分配给单独的生物颗粒或多组生物颗粒来提供将特征归属于单独生物颗粒或多组生物颗粒的能力。独特标识符(例如,为核酸条形码形式)可以分配给单独的生物颗粒或生物颗粒群体或与之缔合,以便用独特标识符标注或标记生物颗粒的大分子组分(并因此,标注或标记其特征)。然后,可以使用这些独特标识符将生物颗粒的组分和特征归属于单独的生物颗粒或一组生物颗粒。

在一些方面中,这是通过将单独的生物颗粒或多组生物颗粒组与独特标识符共同分配来进行的,例如上文所述(参考图2)。在一些方面中,独特标识符以核酸分子(例如,寡核苷酸)的形式提供,所述核酸分子包含可以与单独的生物颗粒的核酸内容物,或与核酸颗粒的其它组分,并且尤其是与那些核酸的片段附接或以其它方式缔合的核酸条形码序列。分配核酸分子,使得在分区中的核酸分子之间,其中所含的核酸条形码序列相同,但是在不同分区之间,核酸分子可以并且确实具有不同的条形码序列,或者在分析中的所有分区中至少呈现出大量不同的条形码序列。在一些方面,仅一个核酸条形码序列可与分区相关联,尽管在一些情况下,可存在两个或更多个不同的条形码序列。

核酸条形码序列可以在核酸分子(例如,寡核苷酸)的序列内包括约6至约20个或更多个核苷酸。核酸条形码序列可以包括约6至约20、30、40、50、60、70、80、90、100个或更多个核苷酸。在一些情况下,条形码序列的长度可为约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可为至少约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在一些情况下,条形码序列的长度可为至多约6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更短。这些核苷酸可以是完全连续的,即处于单一的相邻核苷酸段中,或者它们可以分离成由1个或更多个核苷酸隔开的两个或更多个分离的子序列。在一些情况下,分离的条形码子序列的长度可以为约4至约16个核苷酸。在一些情况下,条形码序列的长度可为约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码序列的长度可为至少约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在一些情况下,条形码序列的长度可以是至多约4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。

共同分配的核酸分子还可包含可用于加工来自共同分配的生物颗粒的核酸的其他功能序列。这些序列包括例如靶向或随机/通用扩增引物序列,所述序列用于扩增来自分区内的个别生物颗粒的基因组DNA、同时附接相关联的条形码序列、对引物或引物识别位点进行测序、杂交或探测序列,例如用于鉴定序列的存在或用于提取带条形码的核酸,或任何许多其他潜在的功能序列。也可以采用将寡核苷酸共同分配的其它机制,包括例如两个或更多个液滴的聚结,其中一个液滴含有寡核苷酸,或将寡核苷酸微分配到分区(例如微流体系统内的液滴)中。

在一个实例中,提供了微胶囊,例如珠粒,其各自包括大量可释放地附接至珠粒的上述条形码化核酸分子(例如,带条形码的寡核苷酸),其中附接至特定珠粒的所有核酸分子都将包括相同的核酸条形码序列,但其中在所使用的珠粒群体中呈现出大量不同的条形码序列。水凝胶珠粒(例如,包含聚丙烯酰胺聚合物基质)可用作核酸分子进入分区的固体载体和递送媒介物,因为它们能够携带大量核酸分子,并且可被配置为在暴露于特定刺激物时释放那些核酸分子,如本文其他地方所描述。在一些情况下,所述珠粒群体提供多样化条形码序列文库,所述文库包括至少约1,000个不同的条形码序列、至少约5,000个不同的条形码序列、至少约10,000个不同的条形码序列、至少约50,000个不同的条形码序列、至少约100,000个不同的条形码序列、至少约1,000,000个不同的条形码序列、至少约5,000,000个不同的条形码序列或至少约10,000,000个不同的条形码序列或更多。另外,可以为每个珠粒提供大量附接的核酸(例如,寡核苷酸)分子。具体来说,单独的珠粒上的核酸分子中包括条形码序列的分子数量可以是至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下是至少约10亿个核酸分子或更多。珠粒的核酸分子可以包括相同的(或共同的)条形码序列、不同的条形码序列,或两者的组合。珠粒的核酸分子可以包括多个集合的核酸分子。集合的核酸分子可以包括相同的条形码序列。所述相同的条形码序列可以与另一集合的核酸分子的条形码序列不同。

此外,分配珠粒群体时,所得分区群体也可包括多样化条形码文库,所述文库包括至少约1,000个不同的条形码序列、至少约5,000个不同的条形码序列、至少约10,000个不同的条形码序列、至少约50,000个不同的条形码序列、至少约100,000个不同的条形码序列、至少约1,000,000个不同的条形码序列、至少约5,000,000个不同的条形码序列或至少约10,000,000个不同的条形码序列。另外,群体的每个分区可包括至少约1,000个核酸分子、至少约5,000个核酸分子、至少约10,000个核酸分子、至少约50,000个核酸分子、至少约100,000个核酸分子、至少约500,000个核酸、至少约1,000,000个核酸分子、至少约5,000,000个核酸分子、至少约10,000,000个核酸分子、至少约50,000,000个核酸分子、至少约100,000,000个核酸分子、至少约250,000,000个核酸分子并且在一些情况下包括至少约10亿个核酸分子。

在一些情况下,可能期望在分区内掺入多个不同的条形码,无论是附接至分区内的单个珠粒还是多个珠粒。例如,在一些情况下,混合但已知的条形码序列集合可在后续处理中提供更大的标识保证,例如,通过向分区提供条形码的更强寻址或归属,作为来自分区的输出的重复或独立确认。

核酸分子(例如,寡核苷酸)在向珠粒施加特定刺激时可从珠粒释放。在一些情况下,刺激可以是光刺激,例如通过裂解光不稳定键以释放核酸分子。在其他情况下,可使用热刺激,其中珠粒环境的温度升高将导致键联的裂解或核酸分子从珠粒的其他释放。在其它情况下,可使用化学刺激,其裂解核酸分子与珠粒的键,或以其它方式导致核酸分子从珠粒释放。在一种情况下,此类组合物包括上述用于包封生物颗粒的聚丙烯酰胺基质,并且可以通过暴露于还原剂(例如DTT)而降解,以释放所附接的核酸分子。

在一些方面中,提供了用于进行受控分配的系统和方法。可以通过调节通道结构(例如,微流体通道结构)中的某些几何特征来控制液滴大小。例如,可以调节通道的扩展角、宽度和/或长度以控制液滴大小。

图4示出用于将珠粒受控分配成离散液滴的微流体通道结构的示例。通道结构400可包括在通道汇合点406(或交叉点)处与储槽404连通的通道区段402。储槽404可以是腔室。如本文所用,任何对“储槽”的提及,也可以指“腔室”。在操作时,包括悬浮珠粒412的水性流体408可以沿通道区段402转运到汇合点406处,以与储槽404中与水性流体408不可混溶的第二流体410会合,以产生流入储槽404中的水性流体408的液滴416、418。在水性流体408和第二流体410会合的汇合点406处,可以基于例如汇合点406处的流体动力、两股流体408、410的流速、流体特性以及通道结构400的某些几何参数(例如,w、h0、α等)的因素而形成液滴。可以通过将水性流体408从通道区段402连续注射通过汇合点406而将多个液滴收集在储槽404中。

生成的离散液滴可以包括珠粒(例如,如同在已占用液滴416中)。可替代地,生成的离散液滴可以包括多于一个珠粒。可替代地,生成的离散液滴可以不包括任何珠粒(例如,如同在未占用液滴418中)。在一些情况下,产生的离散液滴可包含一个或多个生物颗粒,如本文别处所述。在一些情况下,产生的离散液滴可包含一种或多种试剂,如本文别处所述。

在一些情况下,水性流体408可具有浓度或频率基本上均一的珠粒412。可以从单独的通道(图4中未示出)将珠粒412引入到通道区段402中。可以通过控制将珠粒412引入到通道区段402中的频率和/或通道区段402和单独的通道中流体的相对流速来控制通道区段402中的珠粒的频率。在一些情况下,可以从多个不同的通道将珠粒引入到通道区段402中,并因此而控制频率。

在一些情况下,通道区段402中的水性流体408可包括生物颗粒(例如,参见图1和2描述)。在一些情况下,水性流体408可以具有浓度或频率基本上均一的生物颗粒。如同珠粒一样,可以从单独的通道将生物颗粒引入到通道区段402中。可通过控制将生物颗粒引入到通道区段402中的频率和/或通道区段402和单独的通道中流体的相对流速来控制通道区段402中的水性流体408中的生物颗粒的频率或浓度。在一些情况下,可以从多个不同的通道将生物颗粒引入到通道区段402中,并因此而控制频率。在一些情况下,第一单独通道可以将珠粒引入到通道区段402中并且第二单独通道可以将生物颗粒引入到其中。引入珠粒的第一单独通道可以在引入生物颗粒的第二单独通道的上游或下游。

第二流体410可包含油,诸如含氟油,所述油包含用于稳定化所得液滴,例如抑制所得液滴的后续聚结的含氟表面活化剂。

在一些情况下,第二流体410可以不经受和/或不被引导流入和流出储槽404。例如,第二流体410在储槽404中可以是基本上静止的。在一些情况下,第二流体410可以经受在储槽404内流动,但不会流入和流出储槽404,例如通过向储槽404施加压力和/或受到汇合点406处的水性流体408的来流影响时。可替代地,第二流体410可以经受和/或被引导流入或流出储槽404。例如,储槽404可以是将第二流体410从上游引导至下游,从而转运生成的液滴的通道。

在汇合点406处或附近的通道结构400可具有某些几何特征,其至少部分地确定通过通道结构400形成的液滴的尺寸。通道区段402在汇合点406处或附近可以具有高度h0和宽度w。举例来说,通道区段402可包括矩形横截面,其通向具有较宽横截面(例如在宽度或直径方面)的储槽404。可替代地,通道区段402的横截面可以是其他形状,例如圆形、梯形、多边形或任何其他形状。在汇合点406处的储槽404的顶壁和底壁可以呈扩展角α倾斜。扩展角α使舌部(在液滴形成之前,水性流体408从汇合点406处离开通道区段402并且进入储槽404的部分)长度增加并且促进中间形成的液滴的曲率减小。液滴大小随着扩展角增大而减小。所得液滴的半径Rd可以通过以下针对前述几何参数h0、w和α的方程式来预测:

举例来说,对于w=21μm、h=21μm和α=3°的通道结构来说,预测的液滴大小为121μm。在另一个实例中,对于w=25μm、h=25μm和α=5°的通道结构来说,预测的液滴大小为123μm。在另一个实例中,对于w=28μm、h=28μm和α=7°的通道结构来说,预测的液滴大小为124μm。

在一些情况下,扩展角α可以在约0.5°至约4°、约0.1°至约10°或约0°至约90°的范围之间。例如,扩展角可以为至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更大。在一些情况下,扩展角可以为至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。在一些情况下,宽度w可以在约100μm至约500μm的范围之间。在一些情况下,宽度w可以在约10μm至约200μm的范围之间。可替代地,宽度可以小于约10μm。可替代地,宽度可以大于约500μm。在一些情况下,进入汇合点406的水性流体408的流速可以在约0.04微升(μL)/分钟(min)至约40μL/min之间。在一些情况下,进入汇合点406的水性流体408的流速可以在约0.01微升(μL)/分钟(min)至约100μL/min之间。可替代地,进入汇合点406的水性流体408的流速可以小于约0.01μL/min。可替代地,进入汇合点406的水性流体408的流速可以大于约40μL/min,例如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更高。在更低的流速下,例如大约小于或等于10微升/分钟的流速下,液滴半径可以不依赖于进入汇合点406的水性流体408的流速。

在一些情况下,生成的至少约50%的液滴可以具有均一大小。在一些情况下,生成的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有均一大小。可替代地,生成的少于约50%的液滴可以具有均一大小。

可以通过增加生成点,如增加水性流体408通道区段(例如,通道区段402)与储槽404之间的汇合点(例如,汇合点406)的数量来增加液滴生成的通过量。可替代地或另外,可以通过增加通道区段402中的水性流体408的流速来增加液滴生成的通过量。

图5示出用于增加液滴生成的通过量的微流体通道结构的一个实例。微流体通道结构500可以包括多个通道区段502和一个储槽504。所述多个通道区段502中的每一个均可与储槽504流体连通。通道结构500可以在所述多个通道区段502与储槽504之间包括多个通道汇合点506。每个通道汇合点都可以是液滴生成点。图4中来自通道结构400的通道区段402以及对其部件的任何描述可对应于通道结构500中的所述多个通道区段502中的通道区段以及对其相应部件的任何描述。来自通道结构400的储槽404以及对其部件的任何描述可对应于来自通道结构500的储槽504以及对其相应部件的任何描述。

多个通道段502中的每个通道段可包括水性流体508,所述水性流体包括悬浮珠粒512。储槽504可以包括与水性流体508不可混溶的第二流体510。在一些情况下,第二流体510可以不经受和/或不被引导流入和流出储槽504。例如,第二流体510在储槽504中可以是基本上静止的。在一些情况下,第二流体510可以经受在储槽504内流动,但不会流入和流出储槽504,例如通过向储槽504施加压力和/或受到汇合点处的水性流体508的来流影响时。可替代地,第二流体510可以经受和/或被引导流入或流出储槽504。例如,储槽504可以是将第二流体510从上游引导至下游,从而转运生成的液滴的通道。

在操作中,包括悬浮珠粒512的水性流体508可以沿着多个通道区段502输送到多个汇合点506中以与储槽504中的第二流体510相遇以产生液滴516、518。可以从每个通道区段,在与储槽504的每个相应汇合点处形成液滴。在水性流体508和第二流体510相遇的汇合点处,可以基于各种因素形成液滴,例如在汇合点处的流体动力,两种流体508、510的流速,流体性质以及通道结构500的某些几何参数(例如,w、h0、α等),如本文其他地方所述。可以通过将水性流体508从所述多个通道区段502连续注射通过所述多个汇合点506而将多个液滴收集在储槽504中。用通道结构500的平行通道构造,通过量可以显著增加。例如,具有五个包水性性流体508的入口通道区段的通道结构生成液滴的频率可以是具有一个入口通道区段的通道结构的五倍,条件是通道区段中的流体流速基本上相同。不同入口通道区段中的流体流速可以基本上相同或者可以基本上不相同。通道结构可以具有与实际和储槽大小所允许的一样多的平行通道区段。例如,通道结构可以具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、500、250、300、350、400、450、500、600、700、800、900、1000、1500、5000个或更多个平行的或基本上平行的通道区段。

对于多个通道区段502中的每个通道区段,几何参数w、h0和α可以是一致或不一致的。例如,每个通道区段在其各自与储槽504的通道汇合点处或附近,可以具有相同或不同的宽度。例如,每个通道区段在其各自与储槽504的通道汇合点处或附近,可以具有相同或不同的高度。在另一个实例中,储槽504在与所述多个通道区段502的不同通道汇合点处可以具有相同或不同的扩展角。当几何参数均一时,有益地,即使通过量增加,也可以将液滴大小控制为均一的。在一些情况下,当期望具有不同的液滴大小分布时,所述多个通道区段502的几何参数可相应地变化。

在一些情况下,生成的至少约50%的液滴可以具有均一大小。在一些情况下,生成的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有均一大小。可替代地,生成的少于约50%的液滴可以具有均一大小。

图6示出用于增加液滴产生通量的微流体通道结构的另一个实例。微流体通道结构600可包括多个通道段602,所述通道区段总体上围绕储槽604的周边呈圆形排列。所述多个通道区段602中的每一个均可与储槽604流体连通。通道结构600可以在所述多个通道区段602与储槽604之间包括多个通道汇合点606。每个通道汇合点都可以是液滴生成点。图4中来自通道结构400的通道区段402以及对其部件的任何描述可对应于通道结构600中的所述多个通道区段602中的通道区段以及对其相应部件的任何描述。来自通道结构400的储槽404以及对其部件的任何描述可对应于来自通道结构600的储槽604以及对其相应部件的任何描述。

多个通道段602中的每个通道段可包括水性流体608,所述水性流体包括悬浮珠粒612。储槽604可以包括与水性流体608不可混溶的第二流体610。在一些情况下,第二流体610可以不经受和/或不被引导流入和流出储槽604。例如,第二流体610在储槽604中可以是基本上静止的。在一些情况下,第二流体610可以经受在储槽604内流动,但不会流入和流出储槽604,例如通过向储槽604施加压力和/或受到汇合点处的水性流体608的来流影响时。可替代地,第二流体610可以经受和/或被引导流入或流出储槽604。例如,储槽604可以是将第二流体610从上游引导至下游,从而转运生成的液滴的通道。

在操作中,包括悬浮珠粒612的水性流体608可以沿着多个通道区段602输送到多个汇合点606中以与储槽604中的第二流体610相遇以产生多个液滴616。可以从每个通道区段,在与储槽604的每个相应汇合点处形成液滴。在水性流体608和第二流体610相遇的汇合点处,可基于多种因素形成液滴,例如汇合点处的流体动力,两种流体608、610的流速,流体性质以及通道结构600的某些几何参数(例如,通道区段602的宽度和高度、储槽604的扩张角等),如本文其他地方所述。可以通过将水性流体608从所述多个通道区段602连续注射通过所述多个汇合点606而将多个液滴收集在储槽604中。用通道结构600基本上平行的通道构造,通过量可以显著增加。通道结构可以具有与实际和储槽大小所允许的一样多的基本上平行的通道区段。例如,通道结构可以具有至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、1500、5000个或更多个平行的或基本上平行的通道区段。所述多个通道区段可以例如围绕储槽的边缘或外周基本上均匀地间隔开。可替代地,所述多个通道区段的间隔可以是不均匀的。

储槽604可以在每个通道汇合点处或附近具有扩张角α(图6中未示出)。所述多个通道区段602中的每个通道区段都可以在通道汇合点处或附近具有宽度w和高度h0。对于多个通道区段602中的每个通道区段,几何参数w、h0和α可以是一致或不一致的。例如,每个通道区段在其各自与储槽604的通道汇合点处或附近,可以具有相同或不同的宽度。例如,每个通道区段在其各自与储槽604的通道汇合点处或附近,可以具有相同或不同的高度。

储槽604可以在与多个通道区段602的不同通道汇合点处具有相同或不同的扩张角。例如,圆形储槽(如图6所示)可以具有圆锥形、圆顶状或半球形顶板(例如,顶壁)以便在所述多个通道连接子606处或附近为每个通道区段602提供相同或基本上相同的扩展角。当几何参数均一时,有益地,即使通过量增加,也可以将所得液滴大小控制为均一的。在一些情况下,当期望具有不同的液滴大小分布时,所述多个通道区段602的几何参数可相应地变化。

在一些情况下,生成的至少约50%的液滴可以具有均一大小。在一些情况下,生成的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有均一大小。可替代地,生成的少于约50%的液滴可以具有均一大小。注入液滴中的珠粒和/或生物颗粒可以具有或可以不具有均一大小。

图7A示出具有用于受控分配的几何特征的微流体通道结构的另一实例的横截面视图。通道结构700可包括在通道汇合点706(或交叉点)处与储槽704连通的通道区段702。在一些情况下,通道结构700及其部件中的一者或多者可对应于通道结构100及其部件中的一者或多者。图7B示出图7A的通道结构700的透视图。

包括多个颗粒716的水性流体712可以沿着通道区段702输送到汇合点706处以会合与储槽704中水性流体712不混溶的第二流体714(例如,油等),以产生流入储槽704的水性流体712的液滴720。在水性流体712和第二流体714会合的汇合点706处,可以基于各种因素形成液滴,如汇合点706处的流体动力,两种流体712、714的相对流速,流体特性以及通道结构700的某些几何参数(例如,Δh等)。多个液滴通过在汇合点706处连续地从通道区段702注入水性流体712而收集在储槽704中。

生成的离散液滴可以包含所述多个颗粒716中的一个或多个颗粒。如本文其它地方所述,颗粒可以是任何颗粒,例如珠粒、细胞珠粒、凝胶珠粒、生物颗粒的大分子成分或其它颗粒。可替代地,生成的离散液滴可以不包括任何珠粒。

在一些情况下,水性流体712可以具有基本均一浓度或频率的颗粒716。如本文别处所述(例如,参考图4),颗粒716(例如,珠粒)可从单独的通道引入通道段702(图7中未示出)。可以通过控制将颗粒716引入到通道区段702中的频率和/或通道区段702和单独的通道中流体的相对流速来控制通道区段702中的颗粒716的频率。在一些情况下,可以从多个不同的通道将颗粒716引入到通道区段702中,并因此而控制频率。在一些情况下,不同颗粒经由单独的通道引入。例如,第一单独通道可以将珠粒引入到通道区段702中并且第二单独通道可以将生物颗粒引入到其中。引入珠粒的第一单独通道可以在引入生物颗粒的第二单独通道的上游或下游。

在一些情况下,第二流体714可以不经受和/或不被引导流入和流出储槽704。例如,第二流体714在储槽704中可以是基本上静止的。在一些情况下,第二流体714可以在储槽704内流动,但不流入或流出储槽704,如通过向储槽704施加压力和/或在汇合点706处受到水性流体712的进入流的影响。可替代地,第二流体714可以经受和/或被引导流入或流出储槽704。例如,储槽704可以是将第二流体714从上游引导至下游,从而转运生成的液滴的通道。

汇合点706处或附近的通道结构700可具有某些几何特征,其至少部分地确定通过通道结构700形成的液滴的尺寸和/或形状。通道区段702可以具有第一横截面高度h1,储槽704可以具有第二横截面高度h2。第一横截面高度h1和第二横截面高度h2可以不同,使得在汇合点706处,存在高度差Δh。第二横截面高度h2可以大于第一横截面高度h1。在一些情况下,之后储槽可以逐渐增加横截面高度,例如离汇合点706越远。在一些情况下,在汇合点706处,储槽的横截面高度可以根据扩展角β而增大。高度差Δh和/或扩展角β可以使舌部(在液滴形成之前,水性流体712从汇合点706处离开通道区段702并且进入储槽704的部分)长度增加并且促进中间形成的液滴的曲率减小。例如,液滴大小可以随高度差增大和/或扩展角增大而减小。

高度差Δh可为至少约1μm。可替代地,高度差可为至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500μm或更大。可替代地,高度差可为至多约500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1μm或更小。在一些情况下,扩展角β可以在约0.5°至约4°、约0.1°至约10°或约0°至约90°的范围之间。例如,扩展角可以为至少约0.01°、0.1°、0.2°、0.3°、0.4°、0.5°、0.6°、0.7°、0.8°、0.9°、1°、2°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°、40°、45°、50°、55°、60°、65°、70°、75°、80°、85°或更大。在一些情况下,扩展角可以为至多约89°、88°、87°、86°、85°、84°、83°、82°、81°、80°、75°、70°、65°、60°、55°、50°、45°、40°、35°、30°、25°、20°、15°、10°、9°、8°、7°、6°、5°、4°、3°、2°、1°、0.1°、0.01°或更小。

在一些情况下,进入汇合点706的水性流体712的流速可以在约0.04微升(μL)/分钟(min)至约40μL/min之间。在一些情况下,进入汇合点706的水性流体712的流速可以在约0.01微升(μL)/分钟(min)至约100μL/min之间。可替代地,进入汇合点706的水性流体712的流速可以小于约0.01μL/min。可替代地,进入汇合点706的水性流体712的流速可以大于约40μL/min,例如45μL/min、50μL/min、55μL/min、60μL/min、65μL/min、70μL/min、75μL/min、80μL/min、85μL/min、90μL/min、95μL/min、100μL/min、110μL/min、120μL/min、130μL/min、140μL/min、150μL/min或更高。在更低的流动速率下,诸如大约小于或等于10微升/分钟的流动速率下,液滴半径可以不依赖于进入汇合点706的水性流体712的流动速率。第二流体714在储槽704中可以是基本上静止的。可替代地,第二流体714可以是流动的,例如以上文针对水性流动712描述的流速流动。

在一些情况下,生成的至少约50%的液滴可以具有均一大小。在一些情况下,生成的至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的液滴可以具有均一大小。可替代地,生成的少于约50%的液滴可以具有均一大小。

虽然图7A和7B说明了在汇合点706处突变(例如,阶跃增加)的高度差Δh,但是高度差也可以逐渐增加(例如,从约0μm到最大高度差)。可替代地,高度差可以从最大高度差逐渐减小(例如,渐缩)。如本文所用,高度差的逐渐增加或减小可指高度差的连续递增或递减,其中高度轮廓的任何一个差异区段与高度轮廓的紧邻差异区段之间的角度大于90°。例如,在汇合点706处,通道的底壁和储槽的底壁可以呈大于90°的角度会合。可替代地或另外,通道的顶壁(例如,顶板)和储槽的顶壁(例如,顶板)可以呈大于90°的角度会合。逐渐增加或减小可以是线性的或非线性的(例如,指数的、正弦的等)。可替代地或另外,高度差可以线性地或非线性地可变地增加和/或减小。虽然图7A和7B说明了为线性的扩展储槽横截面高度(例如,恒定的扩展角β),但是横截面高度可以非线性地扩展。例如,储槽可以至少部分地由具有可变扩展角的圆顶状(例如,半球形)形状限定。横截面高度可以以任何形状扩展。

例如,如上文或本文其他地方所述的通道网络可以流体地联接到适当的流体部件。例如,入口通道区段与它们要输送到通道连接子的适当材料来源流体联接。这些来源可以包括各种不同的流体部件中的任何一种,从限定在微流体装置的主体结构中或连接到微流体装置的主体结构的简单储槽到从装置外来源、歧管、流体流动单元(例如,致动器、泵、压缩机)等输送流体的流体导管。同样,出口通道区段(例如,通道区段208、储槽604等)可以与用于已分配的细胞的接收容器或导管流体联接以进行后续处理。再次,这可以是微流体装置的本体中所限定的储槽,或其可以是用于将所分配的细胞递送至后续工艺操作、仪器或部件的流体导管。

本文描述的方法和系统可用于大大提高单细胞应用和/或其他接收基于液滴的输入的应用的效率。例如,在分选已占用的细胞和/或适当大小的细胞之后,可以进行的后续操作可以包括产生扩增产物、纯化(例如,通过固相可逆固定(SPRI))、进一步处理(例如,剪切、连接功能序列及后续扩增(例如,通过PCR))。这些操作可在本体中(例如,在分区外)发生。在分区是乳液中的液滴的情况下,可以破坏乳液,并且合并液滴的内容物用于另外的操作。可与带有条形码的珠粒一起共分配的另外试剂可包括用于阻断核糖体RNA(rRNA)的寡核苷酸和用于消化来自细胞的基因组DNA的核酸酶。可替代地,rRNA去除剂可应用于另外的处理操作中。通过此类方法产生的构建体的构型可以帮助最小化(或避免)对测序期间的多聚T序列和/或多核苷酸序列的5’末端的测序。可以对扩增产物,例如第一扩增产物和/或第二扩增产物进行测序以进行序列分析。在一些情况下,可以使用测序用部分发夹扩增(PHASE)方法进行扩增。

多种应用需要评估生物颗粒群体内不同生物颗粒或生物体类型的存在和定量,包括例如微生物组分析和表征、环境测试、食品安全测试、流行病学分析(例如在跟踪污染中)等。

计算机系统

本公开提供了被编程为实现本公开的方法的计算机系统。图25示出计算机系统2501,所述计算机系统被编程或以其他方式配置为实现本文所述的一种或多种方法。例如,计算机系统2501可被编程或以其他方式配置为控制微流体系统(例如,流体流动),(ii)将被占用的液滴与未被占用的液滴分类,(iii)使液滴聚合,(iv)执行测序应用,和/或(v)生成和维护测序文库。计算机系统2501可调节本公开的各个方面,例如调节微流体结构中一个或多个通道中的流体流速、调节聚合应用单元等。计算机系统2501可以是相对于电子装置远程定位的用户或计算机系统的电子装置。电子装置可以是移动电子装置。

计算机系统2501包括中央处理单元(CPU,在本文中也称为“处理器”和“计算机处理器”)2505,其可为单一核心或多核心处理器,或用于并行处理的多个处理器。计算机系统2501还包括存储器或存储单元2510(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元2515(例如,硬盘)、与一个或多个其他系统通信的通信接口2520(例如,网络适配器)以及外围装置2525,如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器2510、存储单元2515、接口2520和外围装置2525经由通信总线(实线)诸如母板与CPU 2505通信。存储单元2515可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统2501可借助于通信接口2520来可操作地耦接至计算机网络(“网络”)2530。网络2530可以是互联网、互联网和/或外联网或与互联网通信的内部网和/或外联网。网络2530在一些情况下是无线电通信和/或数据网络。网络2530可包括一个或多个计算机服务器,其可实现分布式计算,诸如云计算。网络2530在一些情况下借助于计算机系统2501,可实施对等网络,其可使得耦接至计算机系统2501的装置能够作为客户端或服务器来运作。

CPU 2505可执行序列机器可读指令,所述指令可在程序或软件中具体实现。指令可存储于存储单元,诸如存储器2510中。所述指令可被引导至CPU 2505,其可随后编程或以其他方式配置CPU 2505来实现本公开的方法。由CPU 2505执行的操作的实例可包括撷取、解码、执行和写回。

CPU 2505可以是电路的一部分,如集成电路。系统2501的一个或多个其他部件可包括于电路中。在一些情况下,电路是专用集成电路(ASIC)。

存储单元2515可存储文件,诸如驱动程序、文库和保存程序。存储单元2515可存储使用者数据,例如,使用者偏好和使用者程序。计算机系统2501在一些情况下可包括一个或多个另外数据存储单元,所述数据存储单元在计算机系统2501外部,诸如位于经由内部网或互联网与计算机系统2501通信的远程服务器上。

计算机系统2501可经由网络2530与一个或多个远程计算机系统通信。举例来说,计算机系统2501可以与用户(例如操作员)的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如便携式PC)、触屏平板或平板PC(例如iPad、Galaxy Tab)、电话、智能手机(例如iPhone、安卓启动装置、)或个人数字助理。用户可经由网络2530访问计算机系统2501。

如本文描述的方法可经由机器(例如,计算机处理器)可执行代码来实施,所述代码存储于计算机系统2501的电子存储单元上,例如像,存储器2510或电子存储单元2515。机器可执行或机器可读代码可以呈软件形式提供。在使用期间,代码可由处理器2505执行。在一些情况下,代码可从存储单元2515检索并且存储在存储器2510上准备由处理器2505访问。在一些情况下,可排除电子存储单元2515,并且机器可执行指令存储于存储器2510上。

代码可以预编译和配置以用于具有被调适成执行所述代码的处理器的机器,或可以在运行时间期间编译。代码可以呈编程语言提供,所述编程语言经过选择,以使代码能够以预编译或如所编译的方式执行。

本文提供的系统和方法,诸如计算机系统2501的各个方面可在程序编制中具体实现。技术的各个方面可被认为是通常呈机器(或处理器)可执行代码和/或相关数据形式的“产品”或“制品”,所述数据承载或具体实现于一定类型的机器可读介质中。机器可执行代码可以存储在电子存储单元、例如存储器(例如只读存储器、随机存取存储器、快闪存储器)或硬盘上。“存储”型介质可以包括计算机、处理器等的任何或所有有形存储器,或其相关模块,例如各种半导体存储器、磁带驱动器、磁盘驱动器等,这些模块可以在任何时候为软件编程提供非暂时性存储。软件的全部或一部分可有时经由互联网或各种其他电信网络来传送。这类通信例如能够将软件从一个计算机或处理器装载至另一个计算机或处理器,例如从管理服务器或主机装载至应用服务器的计算机平台。因此,可以负载软件元件的另一类型介质包括光波、电波和电磁波,例如跨越本地设备之间的物理接口使用,通过有线和光学固定网络和经各种空中链路。携带这类波的物理元件,例如有线或无线链路、光链路等,也可以被认为是负载软件的介质。如本文所用,除非局限于非暂时性有形“存储”介质,否则例如计算机或机器“可读介质”的术语是指参与提供指令给处理器来执行的任何介质。

因此,例如计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或人工传输介质。非易失性存储介质包括例如光盘或磁盘,例如图式中所示的任何计算机中的任一存储装置等,例如可以用于实施数据库等。易失性存储介质包括动态存储器,例如这类计算机平台的主存储器。有形传输介质包括同轴电缆;铜丝和光纤,包括包含计算机系统内的母线的电线。载波传输介质可以采取电信号或电磁信号的形式,或声波或光波的形式,例如在射频(RF)和红外线(IR)数据通信期间产生的那些形式。常见形式的计算机可读介质因此包括例如:软盘、软磁盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、冲孔卡纸带、具有孔图案的任何其他物理存储器介质、RAM、ROM、PROM和EPROM、快闪EPROM、任何其他存储器芯片或盒、运输数据或指令的载波、运输这类载波的电缆或链路,或计算机可读取编程代码和/或数据的任何其他介质。计算机可读介质的这些形式中的许多可能参与将一系列或多个系列的一个或多个指令携带至处理器进行执行。

计算机系统2501可包括或与电子显示器2535通信,所述电子显示器包括用于提供例如测序分析的结果等的用户界面(UI)2540。UI的示例包括但不限于图形用户界面(GUI)和基于web的用户界面。

本公开的方法和系统可经由一个或多个算法来实施。算法可在由中央处理单元2505执行时经由软件来实施。例如,所述算法可执行核酸测序测定等。

本公开的装置、系统、组合物和方法可以用于各种应用,例如加工来自单细胞的单个分析物(例如RNA、DNA或蛋白质)或多种分析物(例如DNA和RNA、DNA和蛋白质、RNA和蛋白质或RNA、DNA和蛋白质)。举例来说,生物颗粒(例如细胞或细胞珠粒)被分配在分区(例如液滴)中,并将来自生物颗粒的多种分析物加工以供后续加工。多种分析物可来自单个细胞。这能够对细胞进行例如同时的蛋白质组学、转录物组和基因组分析。

尽管本文已示出和描述了本发明的优选实施方案,但对于本领域技术人员来说将显而易见,此类实施方案仅作为举例提供。并不意图本发明受本说明书内所提供的具体实施例限制。虽然本发明已经参考前述说明书进行了描述,但是对本文的实施方案的描述和说明并不意在以限制性意义进行解释。在不偏离本发明的情况下本领域技术人员现将进行各种变型、变化和替换。此外,应了解本发明的所有方面不限于本文阐述的取决于各种条件和变量的具体描述、配置或相对比例。应了解,可以采用本文所述的本发明的实施方案的多个替换方案实施本发明。因此,预期本发明还将涵盖任何此类替换方案、修改、改变或等效方案。意图以下权利要求书界定本发明的范围,并且因此涵盖在这些权利要求书范围内的方法和结构和它们的等效物。

107页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于鉴别肿瘤模型的方法和组合物

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!