高通量单细胞多组学

文档序号:1760015 发布日期:2019-11-29 浏览:18次 >En<

阅读说明:本技术 高通量单细胞多组学 (High-throughput unicellular multiple groups ) 是由 R·范 B·杜拉 于 2018-02-13 设计创作,主要内容包括:在一些实施方式中,本文提供了用于高通量单细胞多组学(例如,基因组学、表观基因组学、蛋白质组学和/或表型谱)分析的装置、系统和方法。(In some embodiments, there is provided herein the devices, systems, and methods for high-throughput unicellular multiple groups (for example, genomics, epigenomics, proteomics and/or phenotypic spectrum) analysis.)

高通量单细胞多组学

相关申请

本申请根据35 U.S.C.§119(e)要求2017年2月13日提交的美国临时申请号62/458,283的权益,其通过引用整体并入本文。

发明内容

在一些实施方式中,本文提供了用于高通量单细胞多组学(例如,基因组学、表观基因组学、蛋白质组学和/或表型谱)分析的装置、系统和方法。例如,本文提供的技术可用于在空间限定的阵列中使用确定性分子条形码并行处理数万个单细胞。利用该技术,基于细胞的空间位置和相应的分子条形码可以将多个“组学”(多组学)信息联系到相同的细胞(或细胞亚群)。例如,在一个微流体单元中可以并行处理超过400,000个单细胞。该通量高于当前的测序和基因组技术(例如,高5-10倍)。

确定性条形码用于为每个细胞分配预定分子(例如,核酸和/或蛋白质)条形码序列,其与预定位置相关联,使得相同细胞(或细胞亚群)上的多个测试可通过条形码和位置联系在一起。

该技术能够在生物系统的细胞中获取整个信息库(包括低细胞数/低质量样品),从而能够前所未有地获得构成生物复杂性的多模式分子调节层,并且可用于揭示构成这种复杂性的机制(例如,表观遗传改变如何调节转录表达和/或蛋白质信号传导)。

例如,本公开的装置、系统和方法适用于临床环境。该技术可与低质量样品(例如,包括低细胞数)一起使用,降低每个细胞的测序成本,并提高区分稀有细胞子集和检测稀有致病细胞(例如致病性细胞)的分辨率。

因此,本公开的一些方面提供了多组学多路复用装置,其包括基片,所述基片包含与Y行交叉的X列以形成X*Y斑片,其中X*Y斑片中的每一个包含固定于基片并包含多T(polyT)序列的唯一核酸条形码,其中各列包含第一组核酸链的条形码化核酸链的不同子集,并且各行包含第二组核酸链的条形码化核酸链的不同子集,并且其中第一组的核酸链与第二组的核酸链结合以形成唯一核酸条形码。参见,例如,图15D。

在一些实施方式中,X为至少10。因此,在一些实施方式中,装置包含至少10列。在一些实施方式中,X为至少20、至少50、至少100、至少1000、至少10000、或至少20000。在一些实施方式中,X为10至20000。

在一些实施方式中,Y为至少10。因此,在一些实施方式中,装置包括至少10行。在一些实施方式中,Y为至少20、至少50、至少100、至少1000、至少10000、或至少20000。在一些实施方式中,Y为10至20000。

在一些实施方式中,装置还包含与Y行交叉的Zn+1列形成Y*Z斑片,其中Y*Z斑片中的每一个包含固定到基片的分子结合配偶体(例如,抗体),并且其中n为0或更大(例如,n为1、2、3、4或5)。在一些实施方式中,n为至少1,并且Zn+1列中每个包含不同的分子结合配偶体(例如,不同的抗体,例如抗体A、抗体B等)。在一些实施方式中,n为至少2,并且Zn+1列中每个包含不同的分子结合配偶体(例如,不同的抗体,例如抗体A、抗体B、抗体C等)。在一些实施方式中,分子结合配偶体是抗体。术语“抗体”包括完整抗体和抗体片段(例如scFv和/或Fab片段)。

在一些实施方式中,装置还包含与基片耦合的微孔阵列(例如,使得每个微孔与基片形成密封),其中每个微孔包含基片的唯一分子条形码之一。参见,例如,图15D。在一些实施方式中,装置还包含与基片耦合的微孔阵列,其中每个微孔包含基片的唯一分子条形码之一和至少一个分子结合配偶体。因此,每个微孔可以由分子标签编码,其包括核酸和抗体的唯一组合。

应当理解,术语“唯一”是关于单个装置的组件,并且意味着装置的特定组件(或组件的子集)的“仅一个”。因此,包含唯一核酸条形码(或核酸条形码的唯一子集)的斑片是装置上的唯一斑片,其包括特定的唯一核酸条形码(或核酸条形码的唯一子集),使得基于唯一核酸条形码(或核酸条形码的唯一子集)能够鉴定斑片(和与斑片相关的任何微孔和微孔内的任何细胞)。

在一些实施方式中,微孔阵列(并因此,装置)包含至少20个微孔。例如,微孔阵列可包含至少50、至少100、至少1000或至少10000微孔。在一些实施方式中,微孔阵列包含10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000或40000微孔。

在一些实施方式中,第一组核酸链的核酸链包含,任选地在5'至3'方向:启动子序列(例如,T7启动子序列)、测序接头序列、第一条形码序列(例如,对于第一组核酸链是唯一和/或对第一组内的核酸链子集是唯一)和第一锚序列。在一些实施方式中,第二组核酸链的核酸链包含,任选地在5'至3'方向:多T序列、唯一分子标识符序列、第二条形码序列(例如,对于第二组核酸链是唯一和/或对第二组内的核酸链子集是唯一)和第二锚序列,其中第二锚序列与第一锚序列互补。在一些实施方式中,唯一核酸条形码包含,任选地在5'至3'方向:启动子序列、测序接头序列、第一条形码序列、第二条形码序列,任选的唯一分子标识符和多T序列。

在一些实施方式中,基片包括玻璃、硅或二氧化硅。在一些实施方式中,基片涂有聚-L-赖氨酸。

在一些实施方式中,各列和/或行的宽度为50-200微米。在一些实施方式中,各列和/或行的宽度为100微米。

在一些实施方式中,每个斑片具有400-40,000μm2的面积。在一些实施方式中,每个斑片具有10,000μm2的面积。

在一些实施方式中,单行内和/或单列内的斑片彼此间隔20-200微米。在一些实施方式中,单行内和/或单列内的斑片彼此间隔100微米。

在一些实施方式中,相邻行之间和/或相邻列之间的斑片彼此间隔20-200微米。在一些实施方式中,相邻行之间和/或相邻列之间的斑片彼此间隔100微米。

本公开的一些方面提供了多组学多路复用装置,其包含微孔阵列,微孔阵列包含至少20个微孔,其中阵列的每个微孔包含特定于单个微孔的分子条形码,并且其中每个分子条形码包含(a)核酸条形码,其包含多T序列,和(b)至少一抗体。在一些实施方式中,装置包含至少2种、至少3种或至少4种不同的抗体。在一些实施方式中,微孔(并因此,装置)包含至少50、至少100、至少1000或至少10000微孔。在一些实施方式中,唯一核酸条形码包含,任选地在5'至3'方向:启动子序列、测序接头序列、第一条形码序列、第二条形码序列,任选的唯一分子标识符和多T序列。

本公开的其他方面提供了一种生产条形码化阵列的方法,包括(a)将第一组条形码化核酸链第一溶液流动图案化(flow patterning)并固定到基片的表面上,从而产生彼此平行且空间上分离的列,其中各列包含第一组的条形码化核酸链的X斑片,其中各列中的斑片彼此空间上分离,其中各列包含条形码化核酸链的不同子集,并且其中X是大于2的数;(b)将第二组条形码化核酸链第二溶液流动图案化并固定到基片的表面上,从而产生彼此平行且空间上分离的行,其中各行包含第二组的条形码化核酸链的Y斑片,其中各行中的斑片彼此空间上分离,其中各行包含条形码化核酸链的不同子集,并且其中Y是大于2的数,从而产生X*Y斑片阵列,各斑片包含(i)第一组的条形码化核酸链的子集,结合至(ii)第二组的条形码化核酸链的子集从而形成唯一核酸条形码。

在一些实施方式中,第一组的条形码化核酸链包含,任选地从5'至3'方向:启动子序列、测序接头序列、第一条形码序列和第一锚序列。在一些实施方式中,第二组的条形码化核酸链在5'至3'方向包含:多T序列、唯一分子标识符序列、第二条形码序列和第二锚序列,其中第二锚序列与第一锚序列互补。

在一些实施方式中,方法还包括将第二组条形码化核酸链与第一组条形码化核酸链杂交并产生包含部分双链条形码化核酸的斑片。

在一些实施方式中,方法还包括将重叠斑片阵列与聚合酶、与第二条形码序列结合的引物和dNTP结合,并产生核酸链,其在5'至3'方向上包含:启动子序列、测序接头序列、第一条形码序列,第一锚序列,第二条形码序列,唯一分子标识符序列和多T序列。

在一些实施方式中,方法还包括从重叠斑片阵列中除去第二组条形码化核酸。

在一些实施方式中,方法还包括将分子结合配偶体组第三溶液流动图案化并固定在基片表面上,从而产生彼此并相对于(b)的列平行且空间上分离的列,其中各列包含分子结合配偶体的Z斑片,其中各列包含不同的分子结合配偶体,并且其中,Z是大于2的数字。

在一些实施方式中,该方法还包括将微孔阵列耦合至基片表面以产生装置,其中微孔阵列的每个微孔包含斑片,斑片包含唯一核酸条形码和任选的至少一抗体。

在一些实施方式中,使用微流体流动图案化芯片将第一和/或第二组条形码化核酸链和/或分子结合配偶体(例如抗体)图案化并固定在基片表面上。

本文还提供了多组学多路复用装置,其包含至少20个(例如,至少50个、至少100个、至少1000个、至少10000个或至少20000个)封闭的微孔,微孔由耦合至微孔阵列的基片形成,其中装置的每个微孔包含固定在基片上的唯一分子条形码,其中每个唯一分子条形码包含(a)包含第一抗体的第一斑片,其中第一斑片与(b)包含第二抗体的第二斑片相邻,其中第二斑片与(c)第三斑片相邻,第三斑片包含唯一核酸条形码,其任选包含末端多T序列,其中第三斑片与(d)包含第三抗体的第四斑片相邻,其中第四斑片与(f)包含第四抗体的第五斑片相邻,其中第一抗体与第四抗体的类型相同,第二抗体与第三抗体的类型相同。在一些实施方式中,唯一分子条形码还包含(g)包含第五抗体的第六斑片和(h)包含第六抗体的第七斑片,其中第五抗体与第六抗体的类型相同。

在一些实施方式中,装置的微孔包含单个细胞或单个亚组(例如,2或3个)细胞。细胞可以从生物样品中获得,例如血液、尿液或唾液样品。其他生物样品包括在本文中。

在一些实施方式中,使用如本文提供的单个装置测试(例如,为特定核酸和/或抗体的存在)100至1000个(例如,100、200、300、400、500、600、700、800、900或1000)细胞。

附图简要说明

图1:用于单细胞转录组捕获的大规模不同分子条形码斑片(每个芯片40,000个)的设计和制造。上图描绘了示例性流动图案化制造过程。左下图显示了微通道引导的流动图案化的横截面视图。右下图显示了结合条形码A、条形码B和其他序列(例如,启动子、测序接头、唯一分子标识符(UMI)和多T序列)的复合分子条形码的实例。

图2:设计用于产生分子条形码斑片的微流体流动图案化芯片。该实例包括具有100微米流动图案化通道的42×42阵列(通量~300-600单细胞)(条形码化斑片为100×100μm2)。相应的微孔彼此间隔100μm,使得没有两个孔可以共享相同的条形码。

图3:条形码固定化反应。使用第一微流体流动图案化芯片将包括T7启动子、测序接头和行条形码(条形码A)的寡核苷酸序列图案化并固定在玻璃表面上。然后,将列条形码序列(条形码B)杂交并通过引物延伸反应延伸。用氢氧化钠淬灭反应以除去较短的第二链,并用聚(dT)序列完成分子条形码终端。条形码序列是先验已知的,能够实现确定性条形码。

图4:通过荧光标记的杂交探针确认的分子条形码的流动图案化。行条形码(条形码A,左上)的固定。列条形码的图案化和延伸由针对聚(dT)序列的荧光标记的杂交探针(右上)确认,其显示条形码化斑片。使用针对行条形码20(右下)和列条形码19(右下)的特定条形码序列的荧光标记的杂交探针对不同的条形码序列进行质检。仅特异性标记携带第19列和第20行条形码序列的寡核苷酸序列。

图5:用于单细胞捕获的微孔阵列装置。在一个实例中,在基片的表面上制孔(左图)。在另一个实例中,在薄的基片(中间图和右图)上创建通孔微孔阵列。基片可以是玻璃、聚合物或塑料。

图6:用于将高密度条形码阵列与单个细胞相互作用(interfacing)的不对准策略。微孔随机加载细胞,使得~50-70%的孔被单个细胞占据。然后用条形码阵列密封微孔而不对准。在机械夹紧以稳定密封之后,采集荧光和明场成像以确定孔和条形码化斑片位置。对斑片进行图案化,使得一个斑片最多只能包含至多4个孔。这种不对准方法产生~10-30%的单细胞对应确定条形码化斑片。

图7:用于将高密度条形码阵列与单个细胞相互作用的确定性对准策略。微孔进行通孔制造,然后使用定制的对准平台对准并与高密度条形码化阵列结合,使得每个条形码化斑片对应于单个孔。一旦随机加载细胞,用第二载片密封微孔。在机械夹紧以稳定密封之后,进行明场成像以确定孔占用率并使条形码与细胞匹配。预期产率为条形码化斑片总数的~50-70%。

图8:用于将高密度条形码阵列与单个细胞相互作用的替代的确定性策略。不是将分子条形码图案化到平板载片上,而是将条形码图案化并产生到微孔平台上,使得不同的条形码直接固定在每个孔内。细胞加载和测定与其他版本类似。

图9:开发细胞捕捉策略,其中使用两个微孔平台来提高微孔的加载效率。首先将细胞加载到较小的微孔阵列上,其中由于尺寸排阻(每个孔尺寸~细胞直径),几乎所有孔都加载有单个细胞。一旦饱和,较小的微孔与较大的微孔阵列对准,并将细胞转移至较大的孔中。这使得能够高效加载较大的微孔阵列,例如,其为mRNA捕获提供了更大的区域。

图10:使用冻融法在微孔阵列中细胞裂解的实例。顶部图像描绘了微孔的视野,微孔装载有用绿色荧光染色标记的单细胞(细胞在明视场图像中不可见)。底部的两个图像显示了两次冻融循环后的细胞。通过荧光染料扩散到单个孔的整个体积中,细胞裂解是明显的。密封保持每个孔内的细胞裂解物,防止泄漏。可以使用其他裂解方法,包括但不限于基于去污剂的、热涂或喷涂的裂解缓冲液。

图11:在描述的系统中应用的文库制备程序的质量检查。将来自~500,000个细胞的大量细胞裂解物应用于高密度条形码阵列。作为对照,将无RNA酶的水施加到高密度条形码阵列上。按照CelSeq2协议高灵敏度生物分析仪制备文库。结果显示来自裂解物应用的条形码阵列的成功文库制备,其中样品RNA和DNA显示平均大小为300bp和400bp的预期曲线。对照条形码阵列不产生可检测的RNA或DNA。

图12:通过连续测试自相同单个细胞的多组学测试的实例。细胞加载后,通过各种显微镜成像技术对细胞成像,以记录表面标志物表达、形态、运动性和其他相关的物理表型。然后用抗体条形码阵列密封孔(参见2014年2月27日公开的国际公开号WO 2014/031997,通过引用并入本文),以测试~45种蛋白的分泌。接下来,移除抗体条形码阵列并用用于转录组学测试的高密度条形码阵列代替,。然后使用定制软件将来自相同单个细胞的数据整合并进行分析。

图13:通过确定性条形码组合多个组学分析。实施例1:单细胞转录组和微小RNA共分析。左:细胞装载和装置组装,以及芯片上细胞裂解的示意图。右:使用上部和下部载片进行相同单细胞的微小RNA和转录组测试。微小RNA和mRNA可以连系并且与相同的单个细胞相关联的机制是由于确定性分子条形码,其中每个微室(微孔)中每个分子条形码的序列和位置是已知的。

图14A-14B:通过确定性条形码组合多组学分析。实施例2:共检测整个转录组和一组从细胞分泌的蛋白质(图14A)或细胞裂解后释放的细胞内/表面蛋白质(图14B)。前者使用上述分子条形码方法用下部玻璃载片进行,其含有分子条形码微片阵列。后者是在顶部载片上图案化的抗体特征阵列进行的。蛋白质和mRNA可以连系并与相同的单个细胞相关联的机制是由于确定性的分子条形码,其中每个微室中每个分子条形码的序列和位置是已知的。

图15A-15D描绘了本公开的装置的实例,其包括基片,其包含第一子集的条形码化核酸列(图15A),第二子集的条形码化核酸行(图15B),不同抗体的子集的另外的列(由“波状”流动模式形成)(图15C)和耦合到基片的微孔(黑色方块)(图15C)。

具体实施方式

单细胞测序,特别是用于基因表达谱和表型分析的整个转录组的测序,是几乎所有生物学领域中的有利的科学发现工具。尽管如此,仍然存在几个主要问题。首先,为了定量分析复杂细胞群的表型和功能异质性,必须同时测序超过10,000个单细胞。迄今为止,没有技术可以实现这一目标。其次,为了在临床环境中使用,该技术应适用于低输入样品(例如,<50,000个细胞)和从临床标本中分离的稀有细胞群。第三,该领域仍然无法测试同一细胞中的多组学信息,例如,直接将基因表达(转录组测序)与调控元件(例如,微小RNA,表观遗传修饰)相关联,这对于理解细胞异质性的机制是重要的。本公开的技术解决了上述三个问题。

方法

本文提供了生产条形码化阵列的方法,包括(a)将第一组条形码化核酸(如DNA)链第一溶液流动图案化并固定到基片表面上,从而产生彼此平行且空间上分离的列,其中各列包含第一组的条形码化核酸链的X斑片,其中各列中的斑片彼此空间上分离,其中各列包含条形码化核酸链的不同子集,并且其中,X是大于2的数字;和(b)将第二组条形码化核酸(如DNA)链第二溶液流动图案化并固定到基片表面上,从而产生彼此平行且空间上分离的行,其中各行包含第二组的条形码化核酸链的Y斑片,其中各行中的斑片彼此空间上分离,其中各行包含条形码化核酸链的不同子集,其中行相对于列垂直,并且其中,Y是大于2的数字;从而产生X*Y重叠斑片阵列,各重叠斑片包含(i)第一组的条形码化核酸链的子集,和(ii)第二组的条形码化核酸链的子集。

流动图案化的一般方法是已知的,并且包括例如流线型流动图案化,其是流体的流动,其中其在任何点的速度是恒定的或以规则的方式变化。

在一些实施方式中,第一组的条形码化核酸链包含,在5'至3'方向:启动子序列、测序接头序列、第一条形码序列和第一锚序列。在一些实施方式中,第一组的条形码化核酸链包含,在3'至5'方向:启动子序列、测序接头序列(“测序接头”)、第一条形码序列和第一锚序列。

启动子序列是DNA序列,其限定聚合酶(例如RNA聚合酶)开始转录基因或其他下游核苷酸序列的位置。启动子序列的实例包括但不限于T7启动子序列、T3启动子序列和SP6启动子序列。

序列接头是添加到目标核酸末端的短(已知)核苷酸(例如DNA)序列。互补测序引物与序列接头结合。序列接头的长度可以变化。例如,序列接头可具有10至50个核苷酸的长度。在一些实施方式中,序列接头具有10、20、30、40或50个核苷酸的长度。

锚序列使得条形码化核酸彼此结合。如图3(步骤2)所示,条形码A具有锚序列,条形码B具有与条形码A的锚序列互补的锚序列,使得条形码A和B可以彼此结合。

条形码序列是核苷酸序列(例如,脱氧核糖核苷酸),其对核酸链的组或子集是特异性的。例如,如图1所示,子集A1(条形码A)的核酸链用特定的条形码序列编码,而子集A2、A3、A4等各自用不同的条形码序列编码,每个条形码序列特定于子集。同样地,子集B1(条形码B)的核酸链用特定条形码序列编码,而子集B2、B3、B4等各自用不同条形码序列编码,每个条形码特定于子集。因此,每个重叠斑片,其包括条形码A子集和条形码B子集的唯一组合,包含唯一复合条形码(条形码A+条形码B)。例如,包含Al+B1条形码的重叠斑片相对于其相邻的重叠斑片被唯一编码,相邻的重叠斑片包含A2+B1条形码、A1+B2条形码、A2+B2条形码等,如图1所示。

在一些实施方式中,第二组的条形码化核酸链包含,在5'至3'方向:多T序列(例如,T19V)、唯一分子标识符(UMI)序列、第二条形码序列和第二锚序列,其中第二锚序列与第一锚序列互补。在一些实施方式中,第二组的条形码化核酸链包含,在3'至5'方向:多T序列、唯一分子标识符序列、第二条形码序列和第二锚序列,其中第二锚序列与第一个锚序列互补。Kivioja T等人,自然方法Nature Methods 9,72-74(2012)描述了UMI的例子,作为参考引入本文。

方法可以进一步包括在导致第二组条形码化核酸链与第一组条形码化核酸链杂交的条件下维持(孵育)重叠斑片阵列,以产生包含部分双链条形码化核酸的斑片。核酸杂交条件是已知的。

方法还可以包括在聚合酶、与第二条形码序列结合的引物和dNTP(例如,dATP、dTTP、dCTP和dGTP)存在下,在导致DNA聚合(DNA链的产生/合成)的条件下维持重叠斑片阵列,以产生核酸链,其包含(例如,在5'至3'方向):启动子序列、测序接头序列、第一条形码序列、第一锚序列,第二条形码序列、唯一分子标识符序列和多T序列。核酸合成条件是已知的。

在一些实施方式中,方法包括从重叠斑片阵列中移除(例如,洗涤)第二组条形码化核酸。在一些实施方式中,用氢氧化钠猝灭聚合/合成反应以除去较短的第二条形码化核酸链。

表面可以是玻璃表面、硅表面或二氧化硅表面。本公开涵盖其他表面。在一些实施方式中,玻璃表面涂覆有聚-L-赖氨酸。

在一些实施方式中,基片是微孔阵列或耦合至微孔阵列,并且其中每个重叠斑片占据微孔阵列的单个微孔或与微孔阵列的单个微孔对准。

在一些实施方式中,X等于20-20000。例如,X可以等于20-50、20-100、20-500、20-1000、20-5000、20-10000、50-100、50、500、50-1000、50-5000、50-10000、50-20000、100-500、100-1000、100-5000、100-10000或100-20000。在一些实施方式中,X等于100-20000。

在一些实施方式中,Y等于20-20000。例如,Y可以等于20-50、20-100、20-500、20-1000、20-5000、20-10000、50-100、50、500、50-1000、50-5000、50-10000、50-20000、100-500、100-1000、100-5000、100-10000或100-20000。在一些实施方式中,Y等于100-20000。

至少一个(例如,至少2、3、4、5、10、20)列或每个(所有)行可具有10-500微米或50-200微米的宽度。例如,列的宽度可以是10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200微米。在一些实施方式中,列的宽度为100微米。

至少一个(例如,至少2、3、4、5、10、20)列或每个(所有)行可具有10-500微米或50-200微米的宽度。例如,行可以具有10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200微米的宽度。在一些实施方式中,行的宽度为100微米。

通常,至少一个或每个(所有)重叠斑片具有100-40000μm2的面积。例如,重叠斑片可以具有100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000或40000μm2的面积。在一些实施方式中,重叠斑片具有10000μm2的面积。因此,在一些实施方式中,斑片的尺寸可以是10×10μm至200×200μm。本公开涵盖更大或更小的重叠斑片。

在一些实施方式中,单行内的重叠斑片彼此间隔10-500微米或20-200微米。例如,单行内的重叠斑片可以彼此间隔10、20、30、40、50、60、70、80、90、100、125、150、175或200微米。在一些实施方式中,单行内的重叠斑片彼此间隔100微米。

在一些实施方式中,单个列内的重叠斑片彼此间隔10-500微米或20-200微米。例如,单个列内的重叠斑片可以彼此间隔10、20、30、40、50、60、70、80、90、100、125、150、175或200微米。在一些实施方式中,单个列内的重叠斑片彼此间隔100微米。

在一些实施方式中,相邻行之间的重叠斑片彼此间隔20-200微米。例如,相邻行之间的重叠斑片可以彼此间隔20、50、75、100、125、150、175或200微米。在一些实施方式中,相邻行之间的重叠斑片彼此间隔20-30、20-50、20-100、50-100或50-200微米。在一些实施方式中,相邻行之间的重叠斑片彼此间隔(约)100微米。

在一些实施方式中,相邻列之间的重叠斑片彼此间隔20-200微米。例如,相邻列之间的重叠斑片可以彼此间隔20、50、75、100、125、150、175或200微米。在一些实施方式中,相邻列之间的重叠斑片彼此间隔20-30、20-50、20-100、50-100或50-200微米。在一些实施方式中,相邻列之间的重叠斑片彼此间隔(约)100微米。

可以使用例如微流体流动图案化芯片将第一组条形码化核酸链图案化并固定到基片的表面上(参见例如图2)。同样地,可以使用例如微流体流动图案化芯片将第二组条形码化核酸链图案化并固定到基片的表面上(参见例如图2)。

条形码化阵列和多路复用装置

本文还提供条形码化阵列,例如,通过本文描述的任何方法产生。例如,条形码化阵列可以通过一方法产生,包括:(a)将第一组条形码化核酸链第一溶液流动图案化并固定到基片的表面上,从而产生彼此平行和空间上分离的列,其中各列包含第一组的条形码化核酸链的X斑片,其中各列中的斑片彼此空间上分离,其中各列包含条形码化核酸链的不同子集,并且其中X是大于2的数字;和(b)将第二组条形码化核酸链第二溶液流动图案化并固定到基片表面上,以产生彼此平行且空间上分离的行,其中各行包含第二组的条形码化核酸链的Y斑片,其中各行内的斑片彼此空间上分离,其中各行包含条形码化核酸链的不同子集,其中行相对于列垂直,并且其中Y是大于2的数字,从而产生X*Y重叠斑片阵列,每个重叠斑片包含(i)第一组的条形码化核酸链的子集和(ii)第二组的条形码化核酸链的子集。

本文还提供了多路复用装置,其包括耦合到微孔阵列的条形码化阵列,其中每个重叠斑片与阵列的单个微孔对准,使得每个重叠斑片对应于单个微孔。

本文进一步提供了包含条形码化阵列的多路复用装置,其中基片是微孔阵列,并且其中每个重叠的斑片占据微孔阵列的单个微孔。

在一些实施方式中,微孔阵列的每个微孔包含不超过5个细胞。例如,微孔阵列的每个微孔可以包含不超过4个、不超过3个或不超过2个细胞。在一些实施方式中,微孔阵列的每个微孔包含不超过2个细胞。在一些实施方式中,微孔的每个微孔含有单个细胞。

微孔阵列可以位于,例如,条形码化阵列和另一基片之间,使得微阵列的微孔被密封(例如,流体不能离开或进入微孔)。

在一些实施方式中,另一基片涂覆有干燥的(例如冻干的)裂解缓冲液。

在一些实施方式中,另一基片包含核酸捕获阵列,例如微RNA捕获阵列。

在一些实施方式中,另一基片包含抗体捕获阵列(参见,例如,美国专利号9,188,586,通过引用并入本文)。

本公开还包括以下编号段落中描述的实施方式:

1、一种生产条形码化阵列的方法,包括:

(a)将第一组条形码化核酸链第一溶液流动图案化并固定在基片表面上,从而产生彼此平行且空间上分离的列,其中各列包含第一组的条形码化核酸链的X斑片,其中各列中的斑片彼此空间上分离,其中各列包含条形码化核酸链的不同子集,并且其中,X是大于2的数字;

(b)将第二组条形码化核酸链第二溶液流动图案化并固定到基片表面上,从而产生彼此平行且空间上分离的行,其中各行包含第二组的条形码化核酸链的Y斑片,其中各行中的斑片彼此空间上分离,其中各行包含条形码化核酸链的不同子集,其中行与列垂直,并且其中,Y是大于2的数字;

从而产生X*Y重叠斑片阵列,各重叠斑片包含(i)第一组的条形码化核酸链的子集,和(ii)第二组的条形码化核酸链的子集。

2、根据段落1所述的方法,其中,第一组的条形码化核酸链包含,任选地在5'至3'方向:启动子序列、测序接头序列、第一条形码序列和第一锚序列。

3、根据段落1或2所述的方法,其中,第二组的条形码化核酸链包含,在5'至3'方向:多T序列、唯一分子标识符序列、第二条形码序列和第二锚序列,其中,第二锚序列与第一锚序列互补。

4、根据段落1-3任一所述的方法,还包括在导致第二组条形码化核酸链与第一组条形码化核酸链杂交的条件下维持重叠斑片阵列,以产生包含部分双链条形码化核酸的斑片。

5、根据段落4所述的方法,还包括在聚合酶、与第二条形码序列结合的引物和dNTP存在下,在导致DNA聚合的条件下维持重叠斑片阵列,以产生核酸链,其包含,在5'至3'方向:启动子序列、测序接头序列、第一条形码序列、第一锚序列,第二条形码序列、唯一分子标识符序列和多T序列。

6、根据段落5所述的方法,还包括从重叠斑片阵列中去除第二组条形码化核酸。

7、根据段落1-6中任一所述的方法,其中,表面是玻璃表面、硅或二氧化硅。

8、根据段落7所述的方法,其中,玻璃表面涂覆有聚-L-赖氨酸。

9、根据段落1-6中任一所述的方法,其中基片是微孔阵列,各重叠斑片占据微孔阵列的单个微孔。

10、根据段落1-9中任一所述的方法,其中X等于20-20000和/或Y等于20-20000。

11、根据段落10所述的方法,其中X等于100-20000和/或Y等于100-20000。

12、根据段落11所述的方法,其中X等于1000-20000和/或Y等于1000-20000。

13、根据段落12所述的方法,其中X等于10000-20000和/或Y等于10000-20000。

14、根据段落1-13中任一所述的方法,其中各列和/或行的宽度为50-200微米。

15、根据段落14所述的方法,其中各列和/或行的宽度为100微米。

16、根据段落1-15中任一所述的方法,其中每个重叠斑片具有400-40000μm2的面积。

17、根据段落16所述的方法,其中每个重叠斑片具有10000μm2的面积。

18、根据段落1-17中任一所述的方法,其中单行和/或单列内的重叠斑片彼此间隔20-200微米。

19、根据段落18所述的方法,其中单行内和/或单列内的重叠斑片彼此间隔100微米。

20、根据段落1-19中任一所述的方法,其中相邻行之间和/或相邻列之间的重叠斑片彼此间隔20-200微米。

21、根据段落20所述的方法,其中相邻行之间和/或相邻列之间的重叠斑片彼此间隔100微米。

22、根据段落1-21中任一所述的方法,其中使用微流体流动图案化芯片将第一和/或第二组条形码化核酸链图案化并固定到基片的表面上。

23、由方法产生的条形码化阵列,包括:

(a)将第一组条形码化核酸链第一溶液流动图案化并固定在基片表面上,从而产生彼此平行且空间上分离的列,其中各列包含第一组的条形码化核酸链的X斑片,其中各列中的斑片彼此空间上分离,其中各列包含条形码化核酸链的不同子集,并且其中,X是大于2的数字;

(b)将第二组条形码化核酸链第二溶液流动图案化并固定在基片表面上,从而产生彼此平行且空间上分离的行,其中各行包含第二组的条形码化核酸链的Y斑片,其中各行中的斑片彼此空间上分离,其中各行包含条形码化核酸链的不同子集,其中行与列垂直,并且其中,Y是大于2的数字;

从而产生X*Y重叠斑片阵列,各重叠斑片包含(i)第一组条形码化核酸链的子集,和(ii)第二组条形码化核酸链的子集。

24、根据权利要求23所述的条形码化阵列,其中第一组的条形码化核酸链包含,任选地在5'至3'方向:启动子序列、测序接头序列、第一条形码序列和第一锚序列。

25、根据权利要求23或24所述的条形码化阵列,其中第二组的条形码化核酸链包含,在5'至3'方向:多T序列、唯一分子标识符序列、第二条形码序列和第二锚序列,其中第二锚序列与第一锚序列互补。

26、根据权利要求23-25中任一项所述的条形码化阵列,其进一步包括将第二组条形码化核酸链与第一组条形码化核酸链杂交并产生包含部分双链条形码化核酸的斑片。

27、如权利要求26所述的条形码化阵列,还包括将重叠斑片阵列与聚合酶、与第二条形码序列结合的引物和dNTP结合,并产生核酸链,其包含,在5'至3'方向上:启动子序列、测序接头序列、第一条形码序列、第一锚序列、第二条形码序列,唯一分子标识符序列和多T序列。

28、如权利要求27所述的条形码化阵列,还包括从重叠斑片阵列中移除第二组条形码化核酸。

29、根据权利要求23-28中任一项所述的条形码化阵列,其中表面是玻璃表面、硅或二氧化硅。

30、如权利要求9的条形码化阵列,其中玻璃表面涂有聚-1-赖氨酸。

31、根据权利要求23-30中任一项所述的条形码化阵列,还包括将微孔阵列应用于基片的表面以产生装置,其中每个重叠斑片、各行或重叠斑片,或各列重叠斑片占据单个微孔阵列的单个微孔。

32、如权利要求23-31中任一项所述的条形码化阵列,其中X等于20-20000和/或Y等于20-20000,X等于100-20000和/或Y等于100-20000,X等于1000-20000和/或Y等于1000-20000,或X等于10000-20000和/或Y等于10000-20000。

33、根据权利要求23-32中任一项所述的条形码化阵列,其中各列和/或行的宽度为50-200微米,或者各列和/或行的宽度为100微米。

34、根据权利要求23-33中任一项所述的条形码化阵列,其中每个重叠斑片具有400-40000μm2的面积,或每个重叠斑片具有10000μm2的面积。

35、根据权利要求23-34中任一项所述的条形码化阵列,其中单行内和/或单列内的重叠斑片彼此间隔20-200微米,或者单行内和/或单列内的重叠斑片彼此间隔100微米。

36、根据权利要求23-35中任一项所述的条形码化阵列,其中相邻行之间和/或相邻列之间的重叠斑片彼此间隔20-200微米,或相邻行之间和/或相邻列之间的重叠斑片彼此间隔100微米。

37、根据权利要求23-36中任一项所述的条形码化阵列,其中使用微流体流动图案化芯片将第一和/或第二组条形码化核酸链图案化并固定到基片的表面上。

38、一种多路复用装置,包括根据段落23-37中任一所述的条形码化阵列,其耦合到微孔阵列,其中每个重叠斑片与阵列的单个微孔对准,使得每个重叠斑片对应于单个微孔。

39、一种多路复用装置,包括根据段落23-37中任一所述的条形码化阵列,其中基片是微孔阵列,并且其中每个重叠斑片占据微孔阵列的单个微孔。

40、根据段落38或39所述的多路复用装置,其中微孔阵列的每个微孔包含不超过5个细胞。

41、根据段落40所述的多路复用装置,其中微孔阵列的每个微孔包含不超过2个细胞。

42、根据段落41所述的多路复用装置,其中微孔阵列的每个微孔包含单个细胞。

43、根据段落23-42中任一所述的多路复用装置,其中微孔阵列位于条形码化阵列和另一基片之间,使得微阵列的微孔被密封。

44、根据段落43所述的多路复用装置,其中另一基片涂有冻干的裂解缓冲液。

45、根据段落43或44所述的多路复用装置,其中另一基片包含核酸捕获阵列。

46、根据段落45所述的多路复用装置,其中核酸捕获阵列是微RNA捕获阵列。

47、根据段落45所述的多路复用装置,其中另一基片包含抗体捕获阵列。

实施例

实施例1.制造包含40000不同分子条形码的高密度阵列

使用微流体流动图案化技术将200个唯一DNA条形码(图1,条形码A:Al、A2、A3......A200),各自具有5'接头(T7启动子+测序接头)固定在基片上。使用微流体图案化芯片将第一组条形码A分子(Al-A200;参见例如图3步骤1)图案化到聚-L-赖氨酸涂覆的玻璃载片上(图2,顶部)并孵育过夜形成“条形码A条带”。条形码浓度大于100μM,以附着对应于每个单细胞的数十亿个条形码。图案化的条形码A分子通过UV暴露并在80℃温育至少2小时与玻璃载片表面共价连接。固定的条形码A分子的3'末端可以随后进行杂交和延伸反应。在图案化第一组条形码A分子后,移除原微流体芯片,并且将第二微流体图案化芯片(图2,底部)放置在图案化玻璃载片的上部,其具有的微通道垂直于图案化条形码A条带从而添加第二组条形码B分子(图1,条形码B:B1、B2、B3......B200),每个在3'末端具有聚(dT)序列用于mRNA捕获,从而形成“条形码B条带”。这是使用引物延伸反应实现的,其中条形码B分子首先通过互补锚序列与先前图案化的条形码A分子杂交(参见,例如,图3步骤2)。杂交超过1小时后,除去微流体图案化芯片,洗去未结合的条形码,并通过DNA聚合酶I延伸杂交的条形码(参见,例如,图3步骤3)。然后用氢氧化钠淬灭反应以除去较短的链(参见,例如,图3步骤4)。得到的固定化核酸链包括条形码A和条形码B序列,其在3'端以聚(dT)尾终端,用于mRNA捕获。

通过在载片上重叠条形码A和条形码B区域(A和B的交叉)形成200×200(40,000)个正方形的不同条形码斑片的阵列(图1和4)。该阵列与单细胞加载的微室阵列相互作用,用于捕获单细胞衍生的信使RNA,用于整个转录组测序。条带的宽度为100μm,因此条形码斑片为100μm×100μm。所有分子条形码选自经验证的寡聚体文库,并且该数据库中的所有序列与人mRNA正交。

实施例2.细胞捕获平台

微孔装置(单个孔~皮升至纳升体积)用作单细胞捕获平台。使用两种类型的微孔装置(图5)。第一种装置具有在基片(玻璃、聚合物或塑料)表面上形成的微孔。该装置可与实施例3中描述的不对准策略一起使用。第二种装置是在薄基片(玻璃、聚合物或塑料)中形成的通孔微孔阵列,其可以与实施例4中描述的确定性对准策略一起使用。

实施例3.不对准策略用于单个细胞和高密度条形码阵列

为了使用高密度条形码阵列从单个细胞中可靠地捕获mRNA,每个条形码化斑片与单个细胞相互作用。可以使用至少两种技术将微孔装置与条形码阵列相互作用:在本实施例中描述的不对准技术和实施例4中描述的确定性对准技术。

使用不对准技术,使用第一种微孔阵列,并设置微孔尺寸和细胞加载方案,使得当高密度条形码阵列随机覆盖在微孔装置顶部时,10-30%条形码与单个细胞相互作用(图6)。选择微孔尺寸和细胞加载密度,使得当细胞随机加载到微孔中时,50-60%的孔接收单个细胞,而其余孔保持为空或接收多于一个细胞(基于泊松分布)。孔的尺寸也使得仅1至4个单独的孔可以适合100×100μm2区域的印迹区(对应于条形码化斑片的尺寸)。有了这些尺寸,当高密度条形码阵列重叠在微孔装置顶部而没有对准时,10-30%的条形码化斑片与单个细胞相互作用,而其余的条形码要么没有细胞,要么不止一个细胞。使用成像记录对应于单个细胞的条形码位置。为此目的,条形码化寡核苷酸用荧光团标记的杂交探针预标记,并且一旦微孔和条形码阵列重叠在一起,则使用荧光显微镜确定它们的位置。使用明视场成像确定微孔位置。使用定制软件匹配相应的孔和条形码。整个随机细胞加载和不对准方法使得能够直接操作以利用高密度条形码阵列。

实施例4.用于相互作用单个细胞与高密度条形码阵列的确定性对准策略

在本方法中,使用第二种微孔阵列(通孔),并使用精确对准工具将微孔对准条形码阵列(图7)。对准工具提供三维(X,Y和Z)方向上的平移控制以及旋转控制,以可控制地将各个微孔与条形码阵列匹配,并将两个基片放一起用于结合。微孔阵列设计成具有与条形码阵列中相似的间距尺寸,使得每个条形码斑片在适当对准后仅包含一个微孔。在对准期间,如实施例3中使用荧光标记的探针确定条形码位置,同时使用明视场图像确定微孔位置。总的来说,这种方法产生了一微孔平台,其中每个孔都用不同条形码预图案化-。对于实验,可以如实施例3随机加载细胞或使用如实施例5中所述的更确定的方法。

还开发了另一种确定性方法(图8)。不是将通孔微孔对准并结合到玻璃载片上图案化的条形码阵列上,而是按照实施例1中描述的类似制程将条形码A和B直接图案化到在不同基片(玻璃、塑料或聚合物)中制造的微孔阵列上。为此目的,首先将微流体流动图案化芯片对准到微孔阵列上,使得流动通道覆盖在孔上,并且条形码固定在各个孔内。可以基于随机分布或使用如实施例5中所述的更确定的方法进行细胞加载。

实施例5.用于~30000单细胞与高密度条形码阵列的高通量相互作用的确定性细胞捕捉和转移方法

虽然诸如实施例中描述的随机细胞加载使得能够直接操作,但是更确定的方法通过确保几乎所有条形码化斑片与单个细胞相互作用来帮助提高通量。为此目的,示出了可靠地将单个细胞放入微孔/室用于分子分析的细胞捕捉和转移方法(图9),其涉及两组微孔装置,其中之一微孔的宽度近似等于感兴趣的细胞的直径,另一个具有较大尺寸的微孔。一旦小的微孔PDMS芯片被细胞饱和,细胞进入微孔,由于尺寸排阻,每孔仅捕获一个细胞。然后,将额外的细胞洗掉,将该带有被捕捉有细胞的小微孔放置在较大尺寸的微室阵列对面,细胞通过重力并推动小微孔硅树脂芯片的背面转移到较大的室中。可以优化和重复该过程,使得几乎所有微孔(>95%)被单个细胞占据。因此,该过程能够提高通量,同时使用更大的孔(以提供涂覆有条形码化寡核苷酸的表面积的增加,用于更有效的mRNA捕获)。可以实现每个芯片大约30000个单细胞微室,这种表现远高于要求,并确保超高通量的单细胞转录组分析。

实施例6.细胞裂解和从单个细胞中捕获mRNA

一旦细胞被捕获在微孔中并用高密度条形码阵列覆盖(或在实施例4中描述的装置的情况下用顶部的第二载片密封),可以使用几个冷冻和解冻循环裂解它们(图10)。在冻融循环期间,由于形成冰,细胞膜被破裂,并且细胞内内容物释放到微孔中。类似地,更多选择性细胞裂解方法也可用于通过控制裂解溶液中使用的去污剂(detergent)的浓度来可控制地仅裂解细胞质(或细胞质和细胞核两者)。或者,可以将干燥的裂解缓冲液喷涂到高密度条形码阵列(或另一密封载片)上,一旦微孔密封,就开始裂解。裂解后,将装置温育1小时从而将mRNA捕获到以聚(dT)序列终端的条形码化寡核苷酸上。

实施例7.文库制备、测序和生物信息学

文库制备遵循Cel-seq2协议。在mRNA捕获后,将mRNA逆转录,然后进行第二链合成。然后在体外转录产生的cDNA以扩增捕获的材料。将扩增的RNA(aRNA)逆转录并通过PCR扩增添加测序接头以完成文库。使用高灵敏度生物分析仪检查文库制备的质量(图11)。使用依诺米那(Illumina)测序仪完成测序,并使用可用和定制生物信息学工具分析数据。

实施例8.多组学测试

这里描述的方法提供了从相同的单个细胞获得多组学测试的能力。这可以通过连续测试来实现,例如,可以通过将微孔与抗体条形码相互作用首先测试多达45种分泌蛋白,,然后通过将相同细胞与用于mRNA捕获的高密度条形码阵列相互作用进行转录组学测试(图12)。它也可以通过微孔阵列与两个载片结合进行平行测试来实现,一个是用于转录组测试的高密度条形码阵列,另一个是用于蛋白质、微小RNA或表观遗传测试的第二个载片(图13和14)。此外,该方法允许对每个微室中捕捉的单个细胞进行成像,从而允许同时测试活细胞行为(大小、形态、运动性等)以及基因表达和蛋白质组学分析,所有这些都在相同的单个细胞上进行。

实施例9.条形码和序列设计

行和列条形码由恒定序列分隔。行条形码设计在8到11个碱基之间,这样恒定区域将用每个较长的行条形码变换碱基,这将防止与恒定区域的测序问题相关的任何测序问题。

包含行条形码和列条形码的各序列

具有行和列条形码序列两者的完全扩展序列

本文公开的所有参考文献、专利和专利申请均通过引用并入本文,就所引用的主题,在某些情况下可涵盖整个文件。

除非明确相反指出,否则本说明书和权利要求书中使用的不定冠词“一”和“一个”应理解为表示“至少一个”。

还应该理解,除非明确相反地指出,在本文要求保护的包括一个以上步骤或动作的任何方法中,该方法的步骤或动作的顺序不必限于叙述该方法的步骤或动作的顺序。

在权利要求以及上面的说明书中,所有过渡短语,例如“由...构成”、“包括”、“携带”、“具有”、“包含”、“涉及”、“持有”、“由...合成”等等应理解为开放式的,即包括但不限于。只有过渡短语“由...组成”和“基本上由......组成”应分别为闭合或半闭合过渡短语,如美国专利局专利审查程序手册第2111.03节规定。

32页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于靶向核酸序列富集的方法及在错误纠正的核酸测序中的应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!