涉及检测重组事件和重排事件的方法和组合物

文档序号:1431858 发布日期:2020-03-17 浏览:41次 >En<

阅读说明:本技术 涉及检测重组事件和重排事件的方法和组合物 (Methods and compositions relating to the detection of recombination and rearrangement events ) 是由 弗雷德里克·W·阿尔特 胡佳志 雪莉·林 杜洲 张宇 陈欢 于 2018-02-13 设计创作,主要内容包括:本文描述了用于检测细胞中的重组事件和/或重排事件的方法和分析。在一些实施方式中,所述方法和/或分析涉及线性扩增介导的PCR((LAM)-PCR)。在一些实施方式中,所述重组事件是V(D)J重组事件。(Described herein are methods and assays for detecting recombination events and/or rearrangement events in a cell. In some embodiments, the methods and/or assays involve linear amplification mediated PCR ((LAM) -PCR). In some embodiments, the recombination event is a v (d) J recombination event.)

涉及检测重组事件和重排事件的方法和组合物

相关申请的交叉引用

根据35U.S.C.§119(e),本申请要求2017年2月13日递交的美国临时申请No.62/458,244的权益,以引用的方式将其内容整体并入本文。

政府支持

本发明是在由美国国立卫生研究院授予的基金号AI020047的政府支持下完成的。美国政府对本发明享有一定的权利。

序列表

本申请包含以ASCII格式电子提交的序列表,并在此以引用的方式将其整体并入。所述ASCII副本(创建于2018年2月9日)被命名为701039-086701-PCT_SL.txt,大小为16,157字节。

技术领域

本文描述的技术涉及通过基于高通量全基因组易位测序(high throughput,genome-wide translocation sequencing,HTGTS)的方法检测细胞中的重组事件和/或重排事件(例如V(D)J重组)。

背景技术

V(D)J重组事件的鉴定和表征在帮助理解免疫系统以及开发和优化基于抗体的治疗剂方面都是令人感兴趣的。现有的基于DNA的检测V(D)J重组的方法依赖于使用上游简并V引物和下游简并J引物,其可以覆盖大多数(但并非全部)V(D)J外显子并对可能的外显子提供不均等的覆盖。此外,此类方法仅检测两条引物之间的重排序列,因此不会发现对于大多数脱靶序列的RAG生成的接合(joins)。基于RNA的方法严重低估了由于转录水平降低导致的非生产性重排,并且由于缺乏表达而错过了基因座内的许多脱靶重排。

发明内容

本文描述了用于检测例如Ig基因座处的重组事件和/或重排事件的增强的HTGTS法。本文所述的分析和方法允许以比现有方法更高的灵敏度和更小的偏倚来检测和表征任意此类事件。

在任意实施方式的一个方面中,本文描述了用于细胞中重组事件和/或重排事件的基于高通量全基因组易位测序(HTGTS)的检测方法,所述方法包括以下步骤:

a.从细胞中提取基因组DNA和/或mRNA;

b.任选地,产生片段化的DNA和/或mRNA样品;

c.用至少一条第一基因座特异性引物通过线性扩增介导的PCR(LAM-PCR)由基因组DNA以产生单链PCR产物;和/或

用至少一条第一基因座特异性引物通过逆转录由mRNA产生cDNA;

d.通过将步骤(c)中产生的单链PCR产物或cDNA连接至衔接子,以产生连接的DNA和/或cDNA产物,其中,所述衔接子包含:

已知DNA序列的远端部分,所述已知DNA序列的远端部分可用于设计用于巢式PCR扩增的PCR引物;

随机核苷酸的近端部分;和

3'突出(overhang);

e.使用步骤(d)的连接产物,通过用衔接子特异性引物和至少一条第二基因座特异性引物进行巢式PCR以产生巢式PCR产物,从而扩增包含重组事件和/或重排事件的核酸序列;

f.任选地,用限制酶消化步骤(e)的PCR产物以阻断未重排的含诱饵片段;

g.通过对所述巢式PCR产物进行测序,以产生经测序的巢式PCR产物;以及

h.将所述经测序的巢式PCR产物与参比序列或抗原受体数据库进行比对。

在任何方面的一些实施方式中,重组事件是V(D)J重组事件。在任何方面的一些实施方式中,所述细胞选自于由如下所组成的组:成熟B淋巴细胞、发育中的B淋巴细胞、成熟T淋巴细胞或发育中的T淋巴细胞。在任何方面的一些实施方式中,所述方法进一步包括提供细胞,其中,所述细胞获取自用抗原免疫的动物。在任何方面的一些实施方式中,所述方法进一步包括提供细胞,其中,所述细胞包含经历过体细胞超突变的V(D)J外显子。在任何方面的一些实施方式中,所述细胞是生发中心B淋巴细胞。

在任何方面的一些实施方式中,在执行步骤(a)之前,所述方法进一步包括以下步骤:用抗原免疫动物;并从所述动物中获取细胞。

在任何方面的一些实施方式中,所述方法进一步包括使用多条第一基因座特异性引物和/或多条第二基因座特异性引物。在任何方面的一些实施方式中,所述多条引物特异性地退火至不同的V基因区段、D基因区段或J基因区段。

在任何方面的一些实施方式中,在进行步骤(a)之前,所述方法进一步包括使源细胞或源组织分化以启动V(D)J重组的步骤。在任何方面的一些实施方式中,所述源细胞是诱导多能干细胞。在任何方面的一些实施方式中,所述源细胞是原代干细胞。

在任何方面的一些实施方式中,在进行步骤(a)之前,用RAG1/2核酸内切酶转导细胞或源以启动V(D)J重组。在任何方面的一些实施方式中,所述方法进一步包括使所述细胞与启动V(D)J重组的一种或多种试剂接触的步骤。在任何方面的一些实施方式中,启动V(D)J重组的试剂是伊马替尼。

在任何方面的一些实施方式中,所述细胞是v-abl病毒转化的B细胞。

在任何方面的一些实施方式中,重排事件涉及癌基因(oncogene)和/或RAG脱靶切割位点。在任何方面的一些实施方式中,所述细胞选自于由如下所组成的组:表达AID的细胞;癌细胞;表达RAG核酸内切酶的细胞;或神经系统细胞。

在任何方面的一些实施方式中,第一基因座特异性引物包含亲和标签。在任何方面的一些实施方式中,所述方法进一步包括如下:通过亲和纯化对步骤(c)的产物进行分离。在任何方面的一些实施方式中,所述亲和标签是生物素。在任何方面的一些实施方式中,亲和纯化包括用链霉亲和素结合生物素。在任何方面的一些实施方式中,亲和纯化包括使步骤(c)的产物结合到底物上。在任何方面的一些实施方式中,所述底物是珠。

在任何方面的一些实施方式中,用于巢式PCR步骤的引物包含条形码序列。

在任何方面的一些实施方式中,通过超声处理或限制酶消化进行片段化。在任何方面的一些实施方式中,通过随机剪切基因组DNA进行片段化或用频繁切割的限制酶进行片段化。在任何方面的一些实施方式中,将步骤(c)的产物连接至衔接子包括使所述产物与具有相同远端部分序列和随机近端部分序列的衔接子群接触。

在任何方面的一些实施方式中,衔接子的近端部分的长度为3-10个核苷酸。在任何方面的一些实施方式中,衔接子的近端部分的长度为5-6个核苷酸。

在任何方面的一些实施方式中,衔接子包含远端部分和近端部分之间的条形码序列。

在任何方面的一些实施方式中,在测序之前,对步骤(e)中产生的PCR产物进行大小选择。在任何方面的一些实施方式中,在步骤(a)之前,所述细胞存在于组织中。在任何方面的一些实施方式中,使用下一代测序方法进行测序。在任何方面的一些实施方式中,比对步骤由非人机器进行。在任何方面的一些实施方式中,所述非人机器包含计算机可执行软件。

在任何方面的一些实施方式中,所述方法进一步包括提供用于显示比对步骤的结果的显示模块。

在任何方面的一些实施方式中,比对步骤的结果是跨越一组V(D)J重排的核苷酸序列或氨基酸序列的突变谱。

在任何方面的一些实施方式中,所述细胞是哺乳动物细胞。在任何方面的一些实施方式中,省略了阻断消化步骤(f)。在任何方面的一些实施方式中,在步骤(c)之前不进行末端修复。

附图说明

图1描绘了在前体(pro)-B细胞和脾B细胞中VH和DH使用的线性扩增介导的高通量全基因组易位测序改编的组库测序(HTGTS-Rep-seq)的图表。左侧显示了来自VDJH接合的VH组库以及读码框内/框内(in-frame)或非生产性信息;右侧显示了DJH接合中的D使用。使用JH4编码末端引物产生文库,如顶部示意图上的引物所示。由来自于纯化的pro-B细胞和脾B细胞的野生型129sve DNA制备文库。

图2描绘了HTGTS-Rep-seq的示意图。在顶部示出了简化的IgH基因座作为示例。用JH特异性生物素化引物从逆转录的总信使RNA(mRNA)或从片段化的全基因组DNA线性扩增与DJ序列和J胚系(germ-line)序列在一起的V(D)J序列。然后,将扩增产物富集并制备为HTGTS文库(Frock等,Nat Biotech,2015;Hu等,Nat Protoc,2016),以用于Illumina Miseq的配对末端测序或其它高通量测序方法。然后,使测序数据经过自定义通道,以用于基因组比对和IgBlast。

图3A-图3D。图3A描绘了在来自两个文库的代表性脾B细胞或骨髓pro-B细胞的IgH基因座中鉴别的V-DJ连结(junction)或D-J连结的基因座全视图(locus-wide view)。白色框表示JH区段,阴影三角形表示重组信号序列(RSS)。箭头表示引物位点和方向。线性图上方的黑线表示V区段、D区段和J区段的位置。从上游前导序列至下游RSS读取VH序列的约定由(+)定义;相反的方向由(-)定义。图3B描绘了在脾B细胞组库或pro-B细胞组库中使用的伪VH或功能性VH的比例。图3C描绘了来自代表性文库的v-Abl病毒转化的B细胞系的Igκ基因座中鉴定的V-J连结的基因座全视图。标签如(图3A)中所示。灰色框表示伪Jκ。RS指不具有相邻V区段或J区段的真(bona fide)RSS;在V(D)J重组过程中经常使用它来部分删除产生非生产性VJκ的等位基因上的Igκ基因座。图3D描绘了在v-Abl转化的B细胞系组库中使用的伪Vκ或功能性Vκ的比例。

图4A-图4B展示了该分析还可用于区分和量化读码框内和读码框外/框外(out-of-frame)V(D)J外显子。图4A描绘了脾B细胞或pro-B细胞中使用的功能性VH的频率图。Y轴示出了来自图3A-图3D中的代表性文库的各个VH上的组合的读码框内和读码框外读段(reads)的数量。在IgBlast分析后提取数据。如图4A中所示,图4B对v-Abl-转化的B细胞系中的Vκ进行了描绘。

图5A-图5C描绘了从IgH或Igk文库提取的缝合配对末端Ilumina Miseq序列(stitched paired-end Ilumina Miseq sequences)的两个示例。图5A描绘了从代表性pro-B细胞文库捕获的VH长度分布。恢复的VDJ外显子的约33%具有长于或等于285bp的VH比对(3353/11431)。通过使用产生较长读段长度的高通量测序方法,可以容易地大大提高该百分比。图5B描绘了从代表性JH4文库提取的示例性缝合配对末端读段序列。显示了位于JH4下游的基因座特异性引物。显示了JH区段和DH区段。显示了VH CDR1、VH CDR2和VHCDR3。显示了衔接子序列(连接到线性扩增的PCR片段上)。图5B公开了SEQ ID NO:33。图5C如图5A所示,但是示出了示例性缝合的VJκ读取。图5C公开了SEQ ID NO:34。

图6描绘了计算机设备或系统1000,其包含一个或多个处理器1030和存储器1040,所述存储器1040存储用于由一个或多个处理器1030执行的一个或多个程序1050。

图7A-图7F描绘了C57BL/6小鼠的纯化的脾B细胞和部分富集的pro-B细胞中VHDJH和DJH组库的HTGTS-Rep-seq。图7A描绘了鼠IgH基因座的示意图,示出了VH区、DH区、JH区和CH区。箭头表示JH4编码末端诱饵引物。图7B描述了具有生产性信息和非生产性信息的VH库,所述生产性信息和非生产性信息来自pro-B细胞(上)和IgM+脾B细胞(下)中的VHDJH接合。如所示,用箭头突出显示一些最常用的VH。图7C描绘了图7B中描述的HTGTS-Rep-seq文库中16个家族的功能性VH和伪VH的使用数量。图7D描绘了示出来自图7B中描述的文库的生产性VHDJH结合和非生产性VHDJH结合的平均总体百分比的饼状图。图7E描述了如所示的pro-B细胞和IgM+脾B细胞中VHDJH结合和DJH结合中的D使用。图7F描绘了如所示的pro-B细胞和IgM+脾B细胞中的DJH:VHDJH比。所有数据均以平均值±SEM显示,N=3。

图8A-图8C描绘了涉及四种JH诱饵的IgM+脾B细胞中的VHDJH和DJH组库。图8A描绘了使用如所示的各JH编码末端诱饵引物的IgM+脾B细胞中的具有来自VHDJH接合的生产性信息和非生产性信息的VH组库(左)以及示出了生产性VHDJH接合和非生产性VHDJH接合的平均总体百分比的饼状图(右)。图8B描绘了使用各JH编码末端诱饵引物的IgM+脾B细胞中的DJH接合中的D使用的比较。图8C描绘了使用各JH编码末端诱饵引物的IgM+脾B细胞中DJH:VHDJH比的比较。对于所有数据,平均值±SEM、N=3。其它分析细节如关于图7A-图7F所述。

图9A-图9C展示了使用Jκ5诱饵引物的C57BL/6小鼠IgM+脾B细胞中VJκ组库的HTGTS-Rep-seq。图9A描绘了示出Vκ和Jκ的鼠Igκ基因座的示意图。灰色棒表示功能性Vκ,分别具有指向下游Jκ的收敛转录方向和串联转录方向(convergent and tandemtranscriptional orientations)。黑色棒表示伪Vκ。箭头指示Jκ5编码末端诱饵引物。在图9B中:左图:用单独的Jκ5诱饵引物(上方)或来自组合的Jκ诱饵引物的Jκ5诱饵引物(下方)的IgM+脾B细胞中的具有来自VJκ接合的生产性信息和非生产性信息的Vκ组库。如所示,用箭头突出显示了4种不同Jκ中的一些差异利用的Vκ。右图:示出生产性VJκ接合和非生产性VJκ接合的总体百分比的饼状图。显示了来自两次重复的代表性结果。图9C描绘了跨越图9B所述组库中20个家族的功能性Vκ和伪Vκ的利用数量。

图10A-图10B展示了可以从少量起始基因组DNA生成代表性VHDJH组库。图10A描绘了IgM+脾B细胞中的具有来自VHDJH接合的生产性信息和非生产性信息的VH组库(左)和示出生产性VHDJH接合和非生产性VHDJH接合的平均总体百分比的饼状图(右),其中,使用JH4编码的末端诱饵引物从所指定的量的基因组DNA克隆而来。平均值±SEM,N=3。图10B描绘了以家族划分的VH利用数量,如图7C所示。

图11A-图11B描绘了关于HTGTS-Rep-seq的示意图。图11A描绘了经由V(D)J重组产生DJ重排和VDJ重排的示意图,其中示出了V(深灰色)、D(黑色)和J(浅灰色)。示出了代表性的DJ和VDJ接合事件。图11B描绘了HTGTS-Rep-seq方法概述的示意图。简而言之,对来自B细胞群的基因组DNA进行超声处理并用生物素化的引物进行线性扩增,所述引物使一个特异性J区段的下游退火。生物素标记的单链DNA产物用链霉亲和素珠富集,并且3'端以无偏方式(unbiased manner)与含有6个核苷酸的随机核苷酸的桥接衔接子(在矩形框中突出显示)连接。然后制备用于Illumina Miseq上的2×300bp测序的产物。用该方法中所述的Ig/TCR-Repertoire分析通道分析生成的读段。

图12A-图12F描绘了129SVE小鼠的pro-B细胞和IgM+脾B细胞中VHDJH和DJH组库的HTGTS-Rep-seq。图12A描绘了示出VH(功能性=灰色;伪=黑色)、DH和JH的鼠IgH基因座的示意图。箭头指示JH4编码末端诱饵引物。图12B展示了pro-B细胞(上方)和IgM+脾B细胞(下方)中的具有来自VHDJH接合的生产性信息和非生产性信息的VH组库。如所示,一些最常用的VH用箭头突出显示。平均值±SEM,N=3。图12C描绘了跨越图12B所述HTGTS-Rep-seq文库中16个家族的功能性VH或伪VH的利用数量。图12D描绘了示出pro-B细胞(上方)和IgM+脾B细胞(下方)中生产性VHDJH接合和非生产性VHDJH接合的平均总体百分比±SEM的饼状图。图12E描绘了如所示的pro-B细胞和IgM+脾B细胞中的DJH接合中的D使用。平均值±SEM,N=3。图12F描绘了如所示的pro-B细胞和IgM+脾B细胞中DJH:VHDJH比的比较。平均值±SEM,N=3。分析的细节如关于图7A-图7F所述。

图13A-图13C描绘了使用四种不同JH诱饵的129SVE小鼠IgM+脾B细胞中VHDJH和DJH组库的比较。图13A描绘了使用单独的JH编码末端诱饵引物的IgM+脾B细胞中的具有来自VHDJH接合的生产性信息和非生产性信息的VH组库(左)以及示出生产性VHDJH接合和非生产性VHDJH接合的平均总体百分比±SEM的饼状图(右)。图13B描绘了使用各JH编码末端诱饵引物的IgM+脾B细胞中的DJH接合中D使用的比较。图13C描绘了使用各JH编码末端诱饵引物的IgM+脾B细胞中的DJH:VHDJH比的比较。对于所有组,平均值±SEM,N=3。其它分析细节如关于图7A-图7F所述。

图14A-图14B展示了关于JH 1-JH 4的整个JH编码末端长度的读码框内VHDJH比例。图14A描绘了JH 1-JH 4的胚系序列的比对。所述序列从mm9基因组中提取,并且在129SVE和C57BL/6之间高度保守。编码WGXG的序列为红色。JH长度标有箭头状物,1表示最接近诱饵引物的核苷酸。图14A按出现的顺序分别公开了SEQ ID NO:35-SEQ ID NO:38。在图14B中,线图示出了关于各JH诱饵,每10,000个中保留了所指定JH长度的总V(D)J接合的数量(右x轴)。柱状图示出了处于各保留的JH长度的读码框内V(D)J外显子的百分比(左x轴)。平均值±SEM,N=3。

图15A-图15C描绘了使用组合的四种JH诱饵的129SVE小鼠中的IgM+脾B细胞VHDJH使用谱。图15A描绘了如图7A-图7F中的IgH基因座的示意图。红色箭头指示结合各JH下游的混合引物。图15B描绘了根据JH区段诱饵分开的VH使用谱。这里示出了一个代表性谱,其来自组合引物HTGTS-Rep-seq文库的两次重复。图15C描绘了使用各JH编码末端诱饵引物的IgM+脾B细胞中的DJH接合中的D使用。

图16A-图16B描绘了使用不同Jκ诱饵的C57BL/6小鼠IgM+脾B细胞中的Igκ组库。如图3中所示,图16A描绘了Igκ基因座的示意图。箭头指示使用的Jκ诱饵引物的位置。图16B描绘了IgM+脾B细胞中根据Jκ诱饵分开的Vκ使用谱和VJκ的总体生产性/非生产性比。在每个组中,示出了用单独的各Jκ诱饵引物(上方)或来自组合的Jκ引物的各Jκ诱饵引物(下方)而来的具有来自VJκ接合的生产性信息和非生产性信息的代表性Vκ组库。如所示,用箭头突出显示4种不同Jκ中的一些差异利用的Vκ(也参见图9)。示出了来自两次重复的代表性结果。

图17A-图17D描绘了生产性VHDJH和VJκ外显子的CDR3长度分布和共有基序。图17A描绘了用JH4诱饵引物制成的C57BL/6部分富集的pro-B文库中的生产性VHDJH外显子的CDR3长度分布。制作关于11aa-13aa长度CDR3序列的亚组的共有CDR3基序图,所述序列两端侧翼为共有半胱氨酸和共有色氨酸。图17B:如图17A所示,关于用JH4诱饵引物制成的C57BL/6脾B文库。图17C:如图17A所示,关于用四种JH诱饵引物制成的C57BL/6脾B文库。平均值±SEM,N=3(图17A-图17C)。图17D:如图17A所示,关于用Jκ5引物制成的C57BL/6脾B文库。注意,由于当前高通量测序方法(包括Illumina Miseq)的测序错误的基本水平以及不足以覆盖含有V(D)J外显子的长DNA片段整个序列的读段长度(最大600bp),我们在我们的CDR3序列分析中发现了一些错误。然而,通过在我们的分析中包括仅重叠接合的读段和/或通过提高读段质量的阈,我们消除了此类潜在的模糊性(ambiguities)。

图18A-图18B描绘了独特CDR3读段的特征。图18A描绘了来自图10的各技术重复文库的独特CDR3序列的比例。平均值±SEM,N=3。图18B描绘了在不同量的起始材料下技术重复文库之间的相同CDR3序列的数量。

图19A-图19D描绘了来自三只NP-CGG免疫的(10d)C57BL/6小鼠脾GC细胞和初始B细胞的VH使用、克隆型(CDR3)选择和VH1-VH72的SHM模式。

图20A-图20B描绘了来自三只NP-CGG免疫的(10d)C57BL/6小鼠的脾初始B细胞和PP初始B细胞之间以及脾GC B细胞和PP GC B细胞之间的VH使用的比较。

图21A-图21D描绘了PP GC B细胞与PP初始B细胞的VH使用,以及来自WTC57BL/6小鼠和AID-/-C57BL/6小鼠的克隆型(CDR3)选择。

图22A-图22B描绘了来自相同小鼠的不同个体PP中的PP GC B细胞与PP初始B细胞的VH使用。

图23展示了在PP GC中最高度富集的VH 1 47和VH 11-2确实累积突变,但在CDR区突变中未显示任何重复选择(recurrent selection)。

图24描绘了实施例5中使用的用于检测IgH组库的实验方法。

图25A描绘了JH1-JH4引物的位置,其选自高度退化的区域。图25A分别以出现的顺序公开了SEQ ID NO:39-SEQ ID NO:42。图25B描绘了由hVH12诱饵制成的hVH1-2DJ连结中各JH的比,并与由混合JH1-JH4诱饵制成的文库进行比较。

图26A描绘了所指示的个体NP-CGG免疫小鼠中脾和PP GC中的VH使用。图26B描绘了PP GC中VH172的SHM模式。

图27A-图27B描绘了来自个体未免疫小鼠的PP GC B细胞与PP初始B细胞的VH使用和VH11-2克隆型选择。

图28A-图28B描绘了来自个体AID-/-小鼠的PP GC B细胞与PP初始B细胞的VH使用,并比较了WT小鼠和AID-/-小鼠之间的PP初始B细胞平均VH组库。图28C描绘了来自所指示的AID-/-小鼠的PP GC B细胞与PP初始B细胞的VL使用。

图29A展示了,PP GC中最常用的VH1-72(虽然没有显著富集)累积了序列内在(sequence-intrinsic)SHM。图29B描绘了最高VH1-47克隆型的SHM模式。

图30描绘了来自纯化的人外周血B细胞的HTGTS-Rep-seq IGH组库、HTGTS-Rep-seq IGK组库、HTGTS-Rep-seq IGL组库。图示出了分别通过用于JH4、Jλ2/3和Jκ1编码末端的引物的IGH、IGL和IGK V使用。示出了读码框内和非生产性重排。列出了来自大多数D/J的功能性V-远端到近端(从左到右),随后是利用的伪V(*)和未定位的/孤独基因V(#)。

具体实施方式

本文描述了鉴别细胞中的重组事件和/或重排事件的稳健的线性扩增介导的高通量全基因组易位测序(HTGTS)方法。在任何方面的一些实施方式中,所述重组事件是V(D)J重组事件。该方法特别适用于鉴别Ig基因座处的重组和/或重排。

因此,该方法对于例如希望鉴别和/或表征例如V(D)J重组的任何人是有用的。同样的方法也可用于筛选试剂对V(D)J重组的作用。

在任何实施方式的一个方面,本文描述了用于细胞中重组事件和/或重排事件的基于高通量全基因组易位测序(HTGTS)的检测方法,所述方法包括以下步骤:(a)从细胞中提取基因组DNA和/或mRNA;(b)任选地,产生片段化的DNA和/或mRNA样品;(c)i)用至少一条第一基因座特异性引物通过线性扩增介导的PCR(LAM-PCR)由基因组DNA产生单链聚合酶链式反应(PCR)产物;和/或ii)用至少一条第一基因座特异性引物通过逆转录由mRNA产生互补DNA(cDNA);(d)通过将步骤(c)中产生的所述单链PCR产物或cDNA连接至衔接子,以产生连接的DNA和/或cDNA产物,其中,所述衔接子包含:已知DNA序列的远端部分,所述已知DNA序列的远端部分可用于设计用于巢式PCR扩增的PCR引物;随机核苷酸的近端部分;和3'突出;(e)使用步骤(d)的所述连接产物通过用衔接子特异性引物和至少一条第二基因座特异性引物进行巢式PCR以产生巢式PCR产物,从而扩增包含所述重组事件和/或重排事件的核酸序列;(f)任选地,用限制酶消化步骤(e)的PCR产物以阻断未重排的含诱饵片段;(g)通过对所述巢式PCR产物进行测序以产生经测序的巢式PCR产物;以及(h)将所述经测序的巢式PCR产物与参比序列或抗原受体数据库进行比对。

在任何实施方式的一个方面,本文描述了用于细胞中Ig组库序列的基于高通量组库测序的检测的方法,所述方法包括以下步骤:

a.从细胞中提取基因组DNA和/或mRNA;

b.任选地,产生片段化的DNA和/或mRNA样品;

c.用至少一条第一基因座特异性引物通过线性扩增介导的PCR(LAM-PCR)由基因组DNA产生单链PCR产物;和/或

用至少一条第一基因座特异性引物通过逆转录由mRNA产生cDNA;

d.通过将步骤(c)中产生的所述单链PCR产物或cDNA连接至衔接子,以产生连接的DNA和/或cDNA产物,其中,所述衔接子包含:

已知DNA序列的远端部分,所述已知DNA序列的远端部分可用于设计用于巢式PCR扩增的PCR引物;

随机核苷酸的近端部分;和

3'突出;

e.使用步骤(d)的所述连接产物,通过用衔接子特异性引物和至少一条第二基因座特异性引物进行巢式PCR以产生巢式PCR产物,从而扩增包含所述Ig组库序列的核酸序列;

f.任选地,用限制酶消化步骤(e)的PCR产物以阻断未重排的含诱饵片段;

g.通过对所述巢式PCR产物进行测序,以产生经测序的巢式PCR产物;以及

h.将所述经测序的巢式PCR产物与参比序列或抗原受体数据库进行比对。

如本文所用,“Ig组库(Ig repertoire)”是指在V(D)J重组、体细胞超突变、激活、选择等中至少一种发生之后细胞或有机体中产生的Ig基因序列的组(或这些序列的一部分)。获得自单一有机体的个体细胞的Ig组库可变化。在检测Ig组库时,可检测样品(例如,一个细胞或一组细胞)中的所有Ig序列或者可检测那些序列的部分(例如,使用的J基因区段,但不检测使用的V基因区段;或使用的J基因区段,但不检测SHM)。本文描述的方法适用于检测Ig组库的所有部分。

在任何方面的一些实施方式中,检测Ig组库包括至少检测V(D)J重组事件和/或体细胞超突变(SMH)。在任何方面的一些实施方式中,检测Ig组组库包括检测Ig重链、Ig轻链、V使用、D使用、J使用和CDR组库中的一种或多种。

提取基因组DNA或mRNA的方法是本领域熟知的,参见例如Tan和Yiap,J Biomedand Biotechnol 2009;以及Varma等,Biotechnol J 2007 2:386-392;以引用的方式将其各自整体并入本文。在任何方面的一些实施方式中,基因组DNA或mRNA提取可以使用市售的试剂盒进行,例如,WIZARD基因组DNA纯化试剂盒(目录号A1120;Promega,Madison,WI)或ReliaPrepTM RNA细胞和组织Miniprep系统(目录号Z6010;Promega,Madison WI)。

可通过本领域已知的任意方法使DNA和/或mRNA样品片段化,包括但不限于超声处理、限制酶消化、随机剪切、使用频繁切割限制酶的限制(restriction with afrequently-cutting restriction enzyme)、雾化、声学剪切、点-槽剪切(point-sinkshearing)、针剪切(needle shearing)和弗式压碎器(a French press)。在任何方面的一些实施方式中,核酸样品的片段化可通过限制酶消化来进行。频繁切割酶是本领域技术人员熟知的,其通常每4bp切割,并且使用靶基因组序列作为模板,人们可在计算机上(insilico)筛选它们对靶基因组的影响。例如,MspI是人细胞中合适的频繁切割酶,但是技术人员可根据对任意给定基因组的需要容地替换该酶。如本文所使用的,术语“片段化的DNA样品”或“片段化的mRNA样品”是指经历过片段化过程使得与片段化过程之前相比样品中存在统计学上显著更多数量的双链断裂(DSB)的核酸样品。在任何方面的一些实施方式中,片段化的核酸样品不再包含完整染色体。本领域技术人员可容易地选择片段化过程(包括其强度和持续时间),所述片段化过程将提供期望程度的片段化,例如,将产生预期大小的核酸分子的群。

在任何方面的一些实施方式中,核酸样品的片段化可通过超声处理进行。超声处理提供随机的、无偏(unbiased)的片段化,其不同于通过限制性消化实现的特异性片段化(例如,如美国专利公布20140234847中所述;以引用的方式将其整体并入本文)。在任何方面的一些实施方式中,在片段化之后LAM-PCR之前进行末端修复。在任何方面的一些实施方式中,不在片段化之后而在LAM-PCR之前进行末端修复。

在本文所述的各个方面的一些实施方式中,对基因组DNA和/或mRNA进行剪切,而不是通过特定的频繁切割酶(frequent cutter enzymes)消化。酶可能在连结富集的全基因组中具有偏向。

在任何方面的一些实施方式中,本文所述的方法和组合物涉及进行PCR。PCR是指特异性扩增感兴趣的核酸序列(即,增加感兴趣的核酸序列的丰度)的过程,并且在任何方面的一些实施方式中,当先前聚合酶延伸的产物作为相继几轮延伸的模板时发生指数扩增。根据本发明的PCR扩增方案包括至少一个(例如,至少1个、至少2个、至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个或更多个)迭代循环,其中,每个循环包括以下步骤:1)链分离(例如,热变性);2)寡核苷酸引物退火至模板分子;以及3)退火的引物的核酸聚合酶延伸。这些步骤中各自所需的条件和时间可由本领域普通技术人员设计。根据本文所述方法的扩增方案优选在热循环仪中进行,所述热循环仪中的许多是可商购的。

线性扩增介导的PCR(LAM-PCR)是一种PCR,在所述PCR中将针对已知序列(诱饵)的引物用于从靶核酸序列产生单链DNA(ssDNA),其中,所述PCR产物包括引物退火的位点处下游的序列。PCR产物的序列可以是未知的,例如,如果在诱饵序列附近发生了重组事件和/或重排事件。然后,将ssDNA转化为双链DNA(dsDNA),并可执行进一步的PCR扩增反应。在例如Schmidt等,Nature Methods 2007 4:1051-7;美国专利No.6,514,706;美国专利申请US2007/0037139;以及Harkey等,(2007)Stem Cells Dev.,June;16(3):381-392中,对LAM-PCR进一步详细描述;以引用的方式将其各自整体并入本文。在任何方面的一些实施方式中,LAM-PCR步骤可由基因组DNA产生单链PCR产物。

在任何方面的一些实施方式中,本文所述的方法和组合物涉及进行逆转录酶反应,例如通过使用RNA模板(cDNA)、引物和RNA依赖性DNA聚合酶进行反应。用于进行逆转录的方案和试剂是本领域熟知的并且可商购获得。在任何方面的一些实施方式中,逆转录步骤可以由mRNA产生cDNA产物。

在任何方面的一些实施方式中,使用第一基因座特异性引物进行LAM-PCR步骤。在任何方面的一些实施方式中,使用第一基因座特异性引物进行逆转录步骤。

第一基因座特异性引物是能够特异性退火至以下的引物:至少一个V区段、D区段或J区段处的已知序列;V区段、D区段或J区段侧翼的序列;或已知参与重排/怀疑参与重排的序列侧翼的序列。在任何方面的一些实施方式中,第一基因座特异性引物是能够特异性地退火至至少一个V区段、D区段或J区段的已知序列的引物。在任何方面的一些实施方式中,第一基因座特异性引物是能够特异性地退火至以下的引物:V区段、D区段或J区段侧翼的序列,例如,V区段、D区段或J区段的10bp、20bp、30bp、50bp、100bp、200bp、300bp、400bp、500bp、或1kb以内的序列。在任何方面的一些实施方式中,第一基因座特异性引物是能够特异性地退火至以下的引物:V区段、D区段或J区段侧翼序列,例如,V区段、D区段或J区段的10bp、20bp、30bp、50bp、100bp、200bp、300bp或400bp以内的序列。在任何方面的一些实施方式中,第一基因座特异性引物是能够特异性退火至以下的引物:已知参与重排或怀疑参与重排的序列侧翼的序列,例如,已知参与重排或怀疑参与重排的序列的10bp、20bp、30bp、50bp、100bp、200bp、300bp、400bp、500bp、或1kb以内的序列。在任何方面的一些实施方式中,第一基因座特异性引物是能够特异性退火至以下的引物:已知参与重排或怀疑参与重排的序列侧翼的序列,例如,已知参与重排或怀疑参与重排的序列的10bp、20bp、30bp、50bp、100bp、200bp、300bp或400bp以内的序列。

在任何方面的一些实施方式中,可使用多条第一基因座特异性引物和/或多条第二基因座特异性引物,例如,来检测多个基因座处的重组和/或重排,和/或来检测在同一基因座处的多个个体重组事件和/或重排事件。在任何方面的一些实施方式中,可使用多条第一基因座特异性引物和/或多条第二基因座特异性引物,例如,来检测多个可能的重组事件和/或重排事件,例如,来筛选发生在多个可能事件中的事件。在任何方面的一些实施方式中,多条第一基因座特异性引物或多条第二基因座特异性引物特异性地退火至如下:不同的V基因区段、D基因区段或J基因区段;不同的V区段、D区段或J区段侧翼的序列;同一V基因区段、D基因区段或J基因区段的不同部分;和/或同一V区段、D区段或J区段侧翼的不同序列。在任何方面的一些实施方式中,LAM-PCR、逆转录酶和/或巢式PCR步骤中的一种或两种可以以复用方式(multiplex fashion)进行,例如,多条引物存在于同一反应混合物中。在任何方面的一些实施方式中,多条引物存在于各自的反应混合物中,例如平行使用它们。

在任何方面的一些实施方式中,所述至少一条第一基因座特异性引物特异性地退火至J基因区段。在任何方面的一些实施方式中,使用多条第一基因座特异性引物,并且各条第一基因座特异性引物特异性地退火至不同的J基因区段。在任何方面的一些实施方式中,使用多条第一基因座特异性引物,并且所述第一基因座特异性引物共同特异性地退火至存在于细胞或有机体基因组中的各自不同的J基因区段,因为在V(D)J重组之前所述基因区段是存在的。在任何方面的一些实施方式中,使用多条第一基因座特异性引物,并且所述第一基因座特异性引物共同特异性地退火至JH1、JH2、JH3和JH4中的每一个。在任何方面的一些实施方式中,使用多条第一基因座特异性引物,并且共同地,所述第一基因座特异性引物特异性地退火至V(D)J重组之前存在于细胞或有机体基因组中的各自不同的JH基因区段、Jκ基因区段和Jλ基因区段。

在任何方面的一些实施方式中,使用多条第一基因座特异性引物,并且每个第一基因座特异性引物特异性地退火至不同的V基因区段、D基因区段和/或J基因区段。在任何方面的一些实施方式中,使用多条第一基因座特异性引物,并且共同地,因为其存在于,第一基因座特异性引物特异性地退火至存在于细胞或有机体的基因组中的各自不同的V基因区段、D基因区段和/或J基因区段,因为在V(D)J重组之前所述基因区段是存在的。

在任何方面的一些实施方式中,第一基因座特异性引物特异性地退火至靶基因区段的简并区域。在任何方面的一些实施方式中,第一基因座特异性引物特异性地退火至靶基因区段的最简并区域(most degenerate region)。

在任何方面的一些实施方式中,第一基因座特异性引物可包含亲和标签,例如,以使用具有适当亲和结构域的底物进行亲和纯化。亲和结构域和标签对可通过非共价手段使两种分子复合。在任何方面的一些实施方式中,第一基因座特异性引物可包含可特异性结合亲和结构域的亲和标签。许多亲和标签和结构域在本领域中是众所周知的,其描述于:例如,Lichty等,Protein Expr Purif 2005 41:98-105;Zhao等,J Analytical Methods inChemistry 2013;Kimple等,Current Protocols in Protein Science 2004 36:939:9.1-9.9.19;以及Giannone等,Methods and Protocols“Protein Affinity Tags"HumanaPress 2014;各自以引用的方式整体并入本文。相容性亲和结构域和亲和标签配对的非限制性示例可包括:抗体或其抗原结合片段与表位;抗His抗体或其抗原结合片段与His标签;抗HA抗体或其抗原结合片段与HA标签;抗FLAG抗体或其抗原结合片段与FLAG标签;抗myc抗体或其抗原结合片段与myc标签;抗V5抗体或其抗原结合片段与V5标签;抗GST抗体或其抗原结合片段与GST标签;抗MBP抗体或其抗原结合片段与MBP标签;衔接子和由该衔接子识别的靶分子;例如链霉亲和素与生物素。在任何方面的一些实施方式中,亲和标签和/或亲和结构域位于分子的一个末端或位于分子的一个末端的附近,例如在末端的10个核苷酸内。亲和标签和/或亲和结构域可为但不限于:抗体,抗原,凝集素,蛋白质,肽,核酸(DNA、RNA、PNA、以及为其混合物的核酸或包含核苷酸衍生物或类似物的核酸);受体分子,如胰岛素受体;用于受体的配体(例如,用于胰岛素受体的胰岛素);以及,对另一种分子有亲和力的生物分子、化学分子或其它分子。在任何方面的一些实施方式中,亲和结构域可以是衔接子。

使用亲和结构域和亲和标签来使两个分子复合的一个示例是生物素-亲和素缀合或生物素-链霉亲和素缀合。在该方法中,对待缀合在一起的分子成员之一(例如,核酸酶或模板核酸)进行生物素化,并另一分子与亲和素或链霉亲和素缀合。许多商业试剂盒可用于对分子(例如蛋白质)进行生物素化。例如,氨氧基-生物素(aminooxy-biotin,AOB)可用于将生物素共价附加至具有醛基团或酮基团的分子。此外,引物可偶联至生物素受体肽,例如AviTag或受体肽,(称为AP;Chen等,2Nat.Methods 99(2005))。通过大肠杆菌(E.coli)酶生物素连接酶(BirA;Id.),受体肽序列允许位点特异性生物素化。使用与亲和结构域/亲和标签缀合的另一非限制性示例是生物素夹心法。参见,例如,Davis等,103PNAS 8155(2006)。在该方法中,对待缀合在一起的两种分子进行生物素化,然后使用四价链霉亲和素将其缀合在一起。在任何方面的一些实施方式中,亲和标签可以是生物素。

在任何方面的一些实施方式中,所述方法可进一步包括通过亲和纯化对步骤(c)中产生的PCR产物(LAM-PCR产物或逆转录产物)进行分离。在任何方面的一些实施方式中,亲和纯化可包括将步骤(c)中产生的PCR产物和/或逆转录产物结合到底物(例如,珠和/或柱子)上。在任何方面的一些实施方式中,底物可以是珠。在任何方面的一些实施方式中,亲和纯化可包括用链霉亲和素结合生物素,例如,将生物素标记的PCR产物结合至包含链霉亲和素的珠、底物和/或柱子。

可将用第一基因座特异性引物由逆转录和/或PCR得到的产物(任选地在分离(例如亲和纯化)后)可连接到衔接分子上。在连接步骤中,人们通常使用浓度小于1.5ng/微升的核酸(例如DNA)。可使用从约1.0ng/微升至约2.5ng/微升不同的浓度,并且技术人员将可使用常规方法来优化核酸浓度。

衔接子分子是双链寡核苷酸,例如,包含已知DNA序列的远端部分的dsDNA分子,所述已知DNA序列的远端部分可用来设计用于巢式PCR扩增的PCR引物;和包含随机核苷酸和3'突出的近端部分。在任何方面的一些实施方式中,对衔接子的远端部分的3'端和近端部分的3'端进行修饰以防止自连接,例如,通过提供3'双脱氧核苷酸(例如3'ddC)。在任何方面的一些实施方式中,不含有3'突出的衔接子的末端(例如,包含远端部分的末端)是平末端。在任何方面的一些实施方式中,3'突出可以退火至ss-DNA PCR产物和/或逆转录产物。

在任何方面的一些实施方式中,衔接子的近端部分的长度可以是3个-10个核苷酸。在任何方面的一些实施方式中,衔接子的近端部分的长度可以是5个-6个核苷酸。在一些实施方式中,近端部分可具有固定的一些核苷酸。

在任何方面的一些实施方式中,衔接子分子的近端部分可由3'突出组成。在任何方面的一些实施方式中,衔接子的近端部分的长度可以是3个-10个核苷酸。在任何方面的一些实施方式中,衔接子的近端部分的长度可以是5个-6个核苷酸。

在任何方面的一些实施方式中,衔接子可进一步包含条形码序列,例如,在远端部分和近端部分之间。在任何方面的一些实施方式中,衔接子的远端部分包含与巢式PCR步骤中使用的衔接子特异性引物互补的序列。

在任何方面的一些实施方式中,将单链PCR产物连接至衔接子可包括:使PCR产物与具有相同远端部分和不同的随机近端部分序列的衔接子群接触。

在巢式PCR步骤中,使用退火至经扩增的序列的引物进行PCR反应,以增加终产物的特异性,所述经扩增的序列由第一反应(例如LAM-PCR反应和/或逆转录反应)产生。因此,用衔接子特异性引物和至少一条第二基因座特异性引物在连接的DNA产物上进行的巢式PCR将扩增和/或复制重组位点和/或重排位点周围的核酸序列。理论上,关于可使用多少轮巢式PCR,没有最小值或最大值。在任何方面的一些实施方式中,巢式PCR包含至少1轮、至少2轮或至少3轮。在任何方面的一些实施方式中,巢式PCR包含1轮、2轮或3轮。在任何方面的一些实施方式中,巢式PCR包含1轮、2轮、3轮、1轮-2轮、1轮-3轮或1轮-5轮。更多轮可能没那么有用,因为它们只能增加已经过多的序列的扩增—通过使用用于相同基因座的独立引物集,将巢式PCR(通常2轮)用于增加扩增反应的特异性。在任何方面的一些实施方式中,第三轮或第三反应可以添加测序所需的条形码,例如454测序。如果在第2轮(或巢式PCR步骤)使用条形码引物或者如果使用不需要额外条形码的其它测序方法,则可跳过这样的第三轮或第三反应。在本发明所有实施方式的一些方面,进行1轮巢式PCR和额外1轮,以将标签或标记引入PCR产物中,从而允许应用特定的测序方案来分析重组位点和/或重排位点的序列。在本发明所有实施方式的一些方面,进行2轮巢式PCR和额外1轮以将标签或标记引入PCR产物中,从而允许应用特定的测序方案来分析重组位点和/或重排位点的序列。

在任何方面的一些实施方式中,巢式PCR步骤中使用的第二基因座特异性引物可与LAM-PCR或逆转录步骤中使用的第一基因座特异性引物重叠。在任何方面的一些实施方式中,设计引物,以使得相比第一基因座特异性引物的3'端,第二基因座特异性引物的3'端退火至更接近(例如,近至少1个核苷酸,近1个-2个核苷酸,近1个-3个核苷酸,近1个-5个核苷酸等)重组位点和/或重排位点。在任何方面的一些实施方式中,第二基因座特异性引物的序列可包含第一基因座特异性引物序列的一部分。在任何方面的一些实施方式中,第二基因座特异性引物的序列可包含第一基因座特异性引物序列的3'部分。在任何方面的一些实施方式中,第二基因座特异性引物的序列可包含第一基因座特异性引物的序列。

在任何方面的一些实施方式中,用于巢式PCR步骤的一条或多条引物可包含条形码序列。如本文所使用的,“条形码(barcode)”是指用作用于鉴别靶分子的条形码或标签的DNA序列。在任何方面的一些实施方式中,相对于待分析的有机体的基因组,DNA序列是外源的和/或外来的。

在任何方面的一些实施方式中,可用阻断酶(blocking enzyme)对连接的DNA进行消化,例如,1)在巢式PCR之后但在测序之前,或2)在巢式PCR之前。阻断酶消化可阻断后续步骤(例如巢式PCR或测序期间)中未重组和/或未重排的靶标等位基因的扩增。基于发生重组或重排的基因座的DNA序列,通常需要在每个单独情况中选择阻断酶—经酶限制位点(例如I-SceI限制位点)在未重组/未重排的产物中切割并且因此应不存在于重组/重排产物中的任意常见限制酶均可用作阻断酶。选择是常规的并且基于每个单独的序列。因此,技术人员可以容易地找到用于分析的合适的阻断酶。在任何方面的一些实施方式中,不进行阻断消化,例如,省略该阻断消化。

如本文所使用的,术语“阻断酶”是指在重组位点和/或重排位点的远端(相对于第一基因座特异性引物)的未重组产物和/或未重排产物中切割的限制酶。阻断酶不会在重组位点和/或重排位点的近端(相对于第一基因座特异性引物)的未重组产物/未重排产物中切割。因此,阻断酶及其序列特异性由该方法中使用的DNA和/或mRNA的特定序列、第一基因座特异性引物的序列以及重组和/或重排确定。可以利用具有适当特异性的任意限制酶。在给定此类参数的情况下,本领域技术人员能够容易地选择具有必需特异性的限制酶。

巢式PCR产物的DNA测序可通过本领域已知的任何方法进行。在任何方面的一些实施方式中,可通过下一代测序方法进行测序。如本文所使用的,“下一代测序(next-generation sequencing)”是指由于平行地执行并读出数千至数百万的测序反应而具有以高于用常规测序方法(例如Sanger测序)可能的速率测序寡核苷酸的能力的寡核苷酸测序技术。下一代测序方法/平台的非限制性示例包括:大规模并行标签测序(LynxTherapeutics);454pyro-测序(454Life Sciences/Roche Diagnostics);固相、可逆染料-终止子测序(solid-phase,reversible dye-terminator sequencing,Solexa/Illumina):SOLiD技术(Applied Biosystems);离子半导体测序(ION Torrent);DNA纳米球测序(Complete Genomics);以及可从Pacific Biosciences、Intelligen Bio-systems、OxfordNanopore Technologies和Helicos Biosciences获得的技术。在任何方面的一些实施方式中,测序引物可包含与所选择的下一代测序方法相容的部分。下一代测序技术以及相关测序引物的约束因素和设计参数是本领域公知的(参见,例如,Shendure等,“Next-generation DNA sequencing,”Nature,2008,vol.26,No.10,1135-1145;Mardis,“Theimpact of next-generation sequencing technology on genetics”,Trends inGenetics,2007,Vol.24,No.3,pp.133-141;Su等,“Next-generation sequencing and itsapplications in molecular diagnostics”Expert Rev Mol Diagn,2011,11(3):333-43;Zhang等,“The impact of next-generation sequencing on genomics”,J GenetGenomics,2011,38(3):95-109;(Nyren,P等,Anal Biochem 208:17175(1993);Bentley,D.R.Curr Opin Genet Dev 16:545-52(2006);Strausberg,R.L.等,Drug Disc Today 13:569-77(2008);美国专利号7,282,337;美国专利号7,279,563;美国专利号7,226,720;美国专利号7,220,549;美国专利号7,169,560;美国专利号6,818,395;美国专利号6,911,345;美国公布号2006/0252077;美国公布号2007/0070349;和美国公布号20070070349;以引用的方式将其整体并入本文。

在任何方面的一些实施方式中,可在测序之前对巢式PCR产物进行大小选择。可选择任何合理的大小,例如,来排除非特异性扩增产物(例如多引物扩增产物)。在任何方面的一些实施方式中,可选择约400bp至约1kb的巢式PCR产物,例如来排除非特异性多引物扩增产物。在任何方面的一些实施方式中,可选择约200bp至约1kb的巢式PCR产物,例如,来排除非特异性多引物扩增产物。

在任何方面的一些实施方式中,可将巢式PCR产物的序列与参比序列和/或抗原受体数据库进行比对,以鉴别例如由重组和/或重排产生的序列,参与重组事件的V区段、D区段和/或J区段,或与重组和/或重排相关的变体、突变和/或超突变的存在。在任何方面的一些实施方式中,可将巢式PCR产物的序列与参比序列进行比对。参比序列可以是包含参与重组和/或重排的DNA序列的序列。或者,参比序列可以是包含在相关基因座(基因座)处发生的已知重组和/或重排产物的序列。参比序列可以是例如来自待分析的细胞类型的基因组序列。

在任何方面的一些实施方式中,可将巢式PCR产物的序列与抗原受体数据库进行比对。抗原受体数据库包含编码抗原受体的序列或可以重组以编码抗原受体的序列,例如Ig基因、V基因区段、D基因区段和/或J基因区段。抗原受体数据库是本领域已知的或可从数据组装。示例性数据库是IgBLAST,其可在万维网上在ncbi.nlm.nih.gov/igblast/免费获得,并且其允许用户输入重组序列并从胚系基因序列的数据库获得匹配。

在任何方面的一些实施例中,比对步骤可以由非人机器执行。在任何方面的一些实施例中,非人机器可包含计算机可执行软件。在任何方面的一些实施例中,该方法可进一步包括用于显示比对步骤的结果的显示模块。

图6描绘了计算机设备或系统1000,其包括一个或多个处理器1030和存储器1040,所述存储器1040存储一个或多个程序1050,以用于由所述一个或多个处理器1030执行。

在任何方面的一些实施例中,设备或计算机系统1000可进一步包含非暂时性计算机可读存储介质1060,所述非暂时性计算机可读存储介质1060存储一个或多个程序1050,以用于由所述设备或计算机系统1000的一个或多个处理器1030执行。

在任何方面的一些实施例中,所述设备或计算机系统1000可进一步包含一个或多个输入设备1010,其可被配置为向由如下所组成的组中的任何一个发送信息或从由如下所组成的组中的任何一个接收信息:外部设备(未示出)、一个或多个处理器1030、存储器1040、非暂时性计算机可读存储介质1060、和一个或多个输出设备1070。一个或多个输入设备1010可被配置为经由用于无线通信的装置(例如天线1020、收发器(未示出)等)向外部设备无线发送信息或从外部设备无线接收信息。

在任何方面的一些实施例中,所述设备或计算机系统1000可进一步包含一个或多个输出设备1070,其可被配置为向由如下所组成的组中的任何一个发送信息或从由如下所组成的组中的任何一个接收信息:外部设备(未示出)、一个或多个输入设备1010、一个或多个处理器1030、存储器1040和非暂时性计算机可读存储介质1060。一个或多个输出设备1070可被配置为经由用于无线通信的装置(例如天线1080、收发器(未示出)等)向外部设备无线发送信息或从外部设备无线接收信息。

在一个方面,本文描述了用于高通量全基因组易位测序(HTGTS)和检测重组事件和/或重排事件的计算机执行方法,所述方法包括:在具有一个或多个处理器以及存储由所述一个或多个处理器执行的一个或多个程序的存储器的设备上,所述一个或多个程序包括用于以下的指令:将经测序的巢式PCR产物与参比序列进行比对,以鉴别重组事件和/或重排事件的位点以及参与该事件的亲本序列。

在任何方面的一些实施方式中,通过比对程序进行比对步骤。在任何方面的一些实施方式中,比对程序是Bowtie2。在任何方面的一些实施例中,比对步骤包括最佳路径搜索算法以用于确定比对。在任何方面的一些实施方式中,比对步骤包括解复用序列读段(de-multiplexing sequence reads)。在任何方面的一些实施例中,解复用序列读段包括使用fastq-multx工具。在任何方面的一些实施例中,比对步骤包括修剪衔接子序列。在任何方面的一些实施例中,修剪衔接子序列包括使用SeqPrep实用程序。在任何方面的一些实施方式中,比对步骤包括使用Bowtie2将读段映射到参比序列或数据库,其中具有报告的对比得分高于50的前五十个比对,表示完美的25nt局部比对(perfect 25nt localalignment)。

在任何方面的一些实施方式中,比对步骤包括最佳路径搜索算法,以选择描述读段的组成的最佳比对序列。在任何方面的一些实施方式中,比对步骤包括过滤。在任何方面的一些实施方式中,所述过滤包括诱饵比对和猎物(prey)比对。如本文所使用的,“诱饵(bait)”是指第一基因座特异性引物将退火至的序列或与该序列临近的序列。“猎物”序列是在重组事件和/或重排事件之前与诱饵序列不相连续,但在重组序列和/或重排序列后与诱饵序列连续的序列。在任何方面的一些实施方式中,诱饵比对不超过靶标位点(例如引物退火的位点)多于10个核苷酸。在任何方面的一些实施方式中,比对步骤包括载体对照、具有多个位点的偏移切口(off-set nicking)、以及远端靶标位点的使用。在任何方面的一些实施方式中,比对步骤包括将舍弃的比对(discarded alignments)与选择的猎物比对进行比较。在任何方面的一些实施例中,如果相对于猎物比对,任何舍弃的比对在覆盖和得分阈值方面均出现超越,则由于低映射质量而将读段过滤。在任何方面的一些实施方式中,比对步骤包括使诱饵比对延伸超过引物10个核苷酸,以移除可能的引导错误事件和其它假象。在任何方面的一些实施方式中,比对步骤包括通过在所有读段中比较诱饵比对的结束的坐标和猎物比对的起始的坐标,来移除潜在的重复(duplicates)。在任何方面的一些实施例中,比对步骤包括如果读段具有偏移在另一读段的诱饵比对和猎物比对的2nt内的猎物比对以及偏移在2nt内的诱饵比对,则将该读段标记为重复。在任何方面的一些实施方式中,比对步骤包括应用过滤后严格性(post-filter stringency),以移除间隙大于30nt且诱饵序列短于50nt的连结。在任何方面的一些实施方式中,比对步骤包括移除具有与端粒重复序列猎物比对的读段。

在任何方面的一些实施方式中,所述计算机执行方法与用于细胞中重组事件和/或重排事件的基于高通量全基因组易位测序(HTGTS)的检测的方法一起使用,所述方法包括以下步骤:(a)从细胞中提取基因组DNA和/或mRNA;(b)任选地,产生片段化的DNA和/或mRNA样品;(c)用至少一条第一基因座特异性引物通过线性扩增介导的PCR(LAM-PCR)由基因组DNA产生单链PCR产物;和/或用至少一条第一基因座特异性引物通过逆转录由mRNA产生cDNA;(d)通过将步骤(c)中产生的所述单链PCR产物或cDNA连接到衔接子,以产生连接的DNA和/或cDNA产物,其中,所述衔接子包含:已知DNA序列的远端部分,所述已知DNA序列的远端部分可用来设计用于巢式PCR扩增的PCR引物;随机核苷酸的近端部分;和3'突出;(e)使用步骤(d)的连接产物,通过用衔接子特异性引物和至少一条第二基因座特异性引物进行巢式PCR来产生巢式PCR产物,从而扩增包含重组事件和/或重排事件的核酸序列;(f)任选地,用限制酶消化步骤(e)的PCR产物以阻断未重排的含诱饵片段;(g)通过对所述巢式PCR产物进行测序以产生经测序的巢式PCR产物;以及(h)将所述经测序的巢式PCR产物与参比序列或抗原受体数据库进行比对。

在一个方面,本文描述了用于细胞中重组事件和/或重排事件的基于高通量全基因组易位测序(HTGTS)的检测的计算机系统,所述计算机系统包含:一个或多个处理器和用于存储一个或多个程序的存储器,所述一个或多个程序包含用于以下的指令:将经测序的巢式PCR产物与参比序列和/或数据库进行比对,以鉴别和/或表征重组事件和/或重排事件。

在一个方面,本文描述了非暂时性计算机可读存储介质,其存储用于细胞中重组事件和/或重排事件的基于高通量全基因组易位基因测序(HTGTS)的检测的一个或多个程序,所述一个或多个程序由计算机系统的一个或多个处理器执行,所述一个或多个程序包含用于以下的指令:将经测序的巢式PCR产物与参比序列和/或数据库进行比对,以鉴别和/或表征重组事件和/或重排事件。

在任何方面的一些实施方式中,将现代比对程序(例如BOWTIE2TM)用于与参比序列比对。在任何方面的一些实施例中,最佳路径搜索算法可用于确定比对。使用此类算法允许进一步表征连结处的断点和/或使用配对末端读段。

在示例性实施方式中,可以分别使用来自ea-utils的FASTQ-MULTXTM工具(可在万维网上code.google.com/p/eautils/处获得)以及SEQPREPTM实用程序(可在万维网上github.com/jstjohn/SeqPrep处获得)对序列读段进行解复用和衔接子序列修剪。可使用BOWTIE2TM(可在万维网上bowtiebio.sourceforge.net/bowtie2/manual.shtml处获得)将读段映射到参比序列。可使用最高比对,例如前十、前二十、前三十、前四十、前五十或更多的比对。在任何方面的一些实施方式中,可使用比对评分高于阈值比对评分的比对(或最高比对)。在任何方面的一些实施例中,阈值比对评分可为50,表示完美的25nt局部比对。

在任何方面的一些实施方式中,最佳路径搜索算法可用于选择描述读段组成的最佳比对序列,通常寻找该比对。可以例如在以下条件下对比对的读段进行过滤:(1)读段必须包括诱饵比对和猎物比对,并且(2)诱饵比对不能延伸超过靶位点多于10个核苷酸。在任何方面的一些实施方式中,对于具有多个位点的偏移切口和载体对照,可使用远端靶标位点。可将舍弃的比对与所选择的猎物比对进行比较;如果相对于猎物比对,任何舍弃的比对在覆盖阈值和得分阈值方面均出现超越,则由于低的映射质量而可将该读段过滤。

在任何方面的一些实施方式中,为了移除可能的引导错误事件和其它潜在的假象,诱饵比对可以延伸超过引物10个核苷酸。通过在所有读段中比较诱饵比对结束的坐标和猎物比对起始的坐标,可移除潜在的重复。如果读段具有偏移在另一读段的诱饵比对和猎物比对的2nt内的猎物比对以及偏移在2nt内的诱饵比对,则可将该读段标记为重复。可应用过滤后严格性以移除间隙大于预定核苷酸长度(例如,10nt、20nt、30nt、40nt、50nt等)且诱饵序列短于预定长度(例如,70nt、60nt、50nt、40nt、30nt等)的连结。也可以移除具有与端粒重复序列猎物比对的读段。

以上标识的模块或程序中的每一个对应于一组指令,以用于执行上述功能。这些模块和程序(即,指令组)并不需要以单独的软件程序、过程或模块来执行,因此在各种实施方式中可将这些模块的各种亚组组合或另外重新排列。在任何方面的一些实施方式中,存储器可存储上面标识的模块和数据结构的亚组。此外,存储器可存储上面没有描述的额外的模块和数据结构。

本公开的所示方面还可在分布式计算环境(distributed computingenvironments)中实践,所述分布式计算环境中某些任务由通过通信网络链接的远程处理设备执行。在分布式计算环境中,程序模块可位于本地存储器存储设备和远程存储器存储设备中。

此外,应当理解的是,本文中所描述的各种组件可包含电路,所述电路可包括具有合适值的电路元件和组件,以便实施本创新的实施方式。此外,可以理解的是,可在一个或多个集成电路(IC)芯片上实现许多不同的组件。例如,在一个实施方式中,可以在单个IC芯片中实现一组组件。在其它实施方式中,在单独的IC芯片上制造或实现一个或多个相应的组件。

以上描述的包括本发明的实施方式的示例。当然,出于描述所要求保护的主题的目的,不可能描述组件或方法学的每一种可想到的组合,但是应当理解,本创新的许多进一步组合和排列是可能的。因此,所要求保护的主题旨在涵盖落入所附权利要求的精神和范围内的所有此类改变、修改和变化。此外,对本公开(包括摘要中所描述的)的所示实施方式的以上描述不意味着进行穷举或将所公开的实施方式限制为所公开的确切形式。尽管本文中出于说明性目的描述了具体的实施方式和实施例,然而正如相关领域的技术人员将了解的,可在此类实施方式和实施例的范围内进行各种修改。

特别地并且关于由上述组件、设备、电路、系统等执行的各种功能,除非另有指明,用于描述此类组件的术语旨在对应于执行所描述的组件的指定功能的任意组件(例如,功能等同物),即使在结构上不等同于所公开的结构,但其在所要求保护的主题的本文所示的示例性方面中执行所述功能。在这方面,还将认识到,本创新包括系统以及计算机可读存储介质,所述计算机可读存储介质具有用于执行所要求保护的主题的各种方法的动作和/或事件的计算机可执行指令。

关于若干组件/块(block)之间的交互,已经描述了上述系统/回路/模块。可以理解的是,这样的系统/线路和组件/块可包括那些组件或指定的子组件(sub-components)、指定的组件或子组件中的一些、和/或额外的组件,并且根据前述的各种排列和组合。子组件也可以通信地偶联到其它组件的组件而不是包括在父组件(parent components)内(分层)来实现。另外,应当注意,可将一个或多个组件组合成提供集成功能性的单个组件或者划分为若干个单独的子组件,并且可以提供任何一个或多个中间层(例如管理层)来通信地偶联到此类子组件以提供集成功能性。本文描述的任何组件还可与本文未具体描述但本领域技术人员已知的一种或多种其它组件相互作用。

另外,尽管关于若干实施方式中的仅一个可能公开了本创新的特定特征,但是这样的特征可与其它实施方式的一个或多个其它特征组合,因为对于任何给定或特定的应用可能是期望并有利的。此外,就在详细描述或权利要求中使用术语“包括/包含/含有(includes/including/contains)”、“具有(has)”,其变体以及其它类似词语而言,这些术语以类似于术语“包括/包含/含有(comprising)”作为开放承接词而不排除任何额外或其它要素的方式旨在为开放性的。

如在本申请中所使用的,术语“组件”、“模块(module)”、“系统(system)”等通常旨在涉及计算机相关的实体、硬件(例如,线路)、硬件和软件的组合、软件、或与具有一个或多个特定功能性的操作机器相关的实体。例如,组件可为但不限于在处理器(例如,数字信号处理器)上运行的进程、处理器、对象、可执行文件、执行的线程、程序和/或计算机。举例来说,在控制器上运行的应用和控制器都可以是组件。一个或多个组件可驻留在进程和/或执行的线程内,并且组件可定位于一个计算机上和/或分布在两个以上计算机之间。此外,“设备”可采用以下形式:专门设计的硬件;通过在其上执行软件而专门制造的通用硬件,所述软件上可使硬件能够执行具体功能;存储在计算机可读介质上的软件;或它们的组合。

此外,本文使用词语“示例”或“示例性(exemplary)”来意在充当示例、实例或例证。本文描述为“示例性”的任何方面或设计不必被解释为比其它方面或设计优选或具有优势。相反,使用词语“示例”或“示例性”旨在以具体样式呈现概念。如在本申请中所使用的,术语“或(or)”旨在表示开放性(inclusive)的“或”而不是封闭性(exclusive)的“或”。也就是说,除非另有指定或从上下文中明确,“X采用A或B”旨在意味着任何自然的开放性排列。即,如果X采用A;X采用B;或者X采用A和B两者,那么在任何前述实例下均满足“X采用A或B”。另外,本申请和所附权利要求中使用的冠词“一个/种(a/an)”通常应理解为表示“一个/种或多个/种”,除非另有指定或从上下文明确指出为单数形式。

计算设备通常包括各种介质,其可包括计算机可读存储介质和/或通信介质,其中,如下所述,这两个术语在本文中彼此不同地使用。计算机可读存储介质可为可被计算机访问的任何可获得的存储介质,通常具有非暂时性质,并且可包括易失性和非易失性的介质、可移动介质和不可移的动介质。作为示例而非限制,计算机可读存储介质可结合用于存储信息(例如,计算机可读指令、程序模块、结构化数据或非结构化数据)的任何方法或技术来实现。计算机可读存储介质可包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能光盘(DVD)或其它光盘存储、磁带盒、磁带、磁盘存储设备或其它磁存储设备,或其它有形和/或非暂时性介质,所述介质可用于存储所需信息。计算机可读存储介质可被一个或多个本地计算设备或远程计算设备访问,例如,通过访问请求、查询或其它数据检索协议,以用于关于由介质存储的信息的各种操作。

另一方面,通信介质通常在数据信号中体现计算机可读指令、数据结构、程序模块、或者其它结构化数据或非结构化数据,所述数据信号可以是暂时的(例如调制的数据信号,如载波或其它传输机制),并且包括任何信息传递或传输介质。术语“调制的数据信号”或信号是指具有如下的信号:以在一个或多个信号中编码信息这样的方式设置或改变的其特征中的一个或多个。作为示例而非限制,通信介质包括有线介质(例如有线网络或直接有线连接),以及无线介质(例如声音、RF、红外线和其它无线介质)。

鉴于上述所述的示例性系统,参考各附图的流程图将更好地理解可根据所述的主题实现的方法学。为了简化阐述,将所述方法学描绘和描述成一系列动作。然而,根据本公开的动作可以以各种顺序发生和/或同时发生,以及与本文未呈现和描述的其它动作一起发生。此外,可能不需要所有示出的动作来实现根据所公开的主题的方法学。另外,本领域技术人员将理解并意识到,所述方法学可以替代地通过状态图(state diagram)或事件被表示为一系列相互关联的状态。另外,应当理解,本说明书中公开的方法学能够存储在制品(an article of manufacture)上,以便于将此类方法学传输和转移到计算设备。本文使用的术语“制品”旨在涵盖从任何计算机可读设备或存储介质可访问的计算机程序。

在任何方面的一些实施方式中,比对步骤的结果显示在显示模块上。在任何方面的一些实施方式中,比对步骤的结果显示在计算机显视器上。在任何方面的一些实施方式中,通过可打印介质显示比对步骤的结果。显示模块可以是被配置为从计算机接收并向用户显示计算机可读信息的任何适当的设备。非限制性示例包括,例如,通用计算机(例如,基于Intel PENTIUM型处理器、Motorola PowerPC、Sun UltraSPARC、Hewlett-Packard PA-RISC处理器的计算机),可从加利福尼亚州桑尼维尔的Advanced Micro Devices(AMD)购得的多种处理器中的任一种,或任何其它类型的处理器,视觉显示设备(例如平板显示器、阴极射线管等),以及各种类型的计算机打印机。

在任何方面的一些实施方式中,万维网浏览器被用来提供用于显示基于比对结果的内容的用户界面。应当理解的是,本发明的其它模块可以调整为具有web浏览器界面。通过Web浏览器,用户可以创建从比对结果中检索数据的请求。因此,用户通常会指向并点击用户界面元素(例如,常规使用于图形用户界面中的按钮、下拉菜单、滚动条等)。

在任何方面的一些实施方式中,比对步骤的结果是跨越一组V(D)J重排的核苷酸或氨基酸序列的突变谱。在任何方面的一些实施方式中,比对步骤的结果显示为跨越一组V(D)J重排的核苷酸或氨基酸序列的突变谱。检测许多重组事件和/或重排事件(在并行或多重反应中)以及将所述事件与参比序列/数据库比对可引起对点突变、***/缺失(indels)、和/或重组/重排连结的变化的鉴别以及任选此类事件的相对频率。

本文所述的方法和分析的细胞可以是任何类型的细胞,包括但不限于:真核细胞、哺乳动物细胞、人细胞、植物细胞、神经元细胞、成纤维细胞、体外(in vitro)细胞或体内(in vivo)细胞。所述细胞可以是任何类型,只要其含有DNA即可。在任何方面的一些实施方式中,所述细胞可以是能够在培养中维持的细胞。所述细胞可以是原代细胞或永生化细胞。还可以使用分化细胞以及部分分化细胞、多能细胞和干细胞(包括胚胎干细胞)。在任何方面的一些实施方式中,所述细胞是哺乳动物细胞。在任何方面的一些实施方式中,所述细胞是人细胞。

在任何方面的一些实施方式中,所述细胞可以是经过体细胞高突变的包含V(D)J外显子的细胞,例如,所述细胞可以是生发中心B淋巴细胞。在任何方面的一些实施方式中,所述细胞是成熟B淋巴细胞、发育中B淋巴细胞、成熟T淋巴细胞或发育中T淋巴细胞。在任何方面的一些实施方式中,所述细胞是成熟B淋巴细胞、发育中B淋巴细胞、成熟T淋巴细胞、发育中T淋巴细胞、从生发中心获得的细胞和/或从派伊尔氏结获得的细胞。在任何方面的一些实施方式中,所述细胞是生发中心B淋巴细胞或派伊尔氏结B淋巴细胞。在任何方面的一些实施方式中,可使用本领域技术人员公知的激活条件激活细胞以诱导细胞***和重组事件。

在任何方面的一些实施方式中,在步骤(a)之前,所述细胞可存在于组织中(例如体内)。在任何方面的一些实施方式中,在步骤(a)之前,所述细胞可存在于动物中。在任何方面的一些实施方式中,在步骤(a)之前,细胞可存在于用抗原免疫的动物中。在任何方面的一些实施方式中,所述方法进一步包括提供细胞,其中,所述细胞获取自用抗原免疫的动物。在任何方面的一些实施方式中,在步骤(a)之前,所述方法进一步包括用抗原免疫动物并从所述动物中分离细胞。

在进行步骤(a)之前,可在细胞或细胞的来源中诱导V(D)J重组。作为非限制性示例,可通过RAG1/2核酸内切酶的转导和/或异位表达在细胞、组织或动物中诱导V(D)J重组。可诱导V(D)J重组的试剂的另一个非限制性示例是伊马替尼(imatinib)(即,GLEEVEC,甲磺酸盐,或STI-571)。在任何方面的一些实施方式中,所述细胞是v-abl转化的B细胞。

术语“试剂”一般是指通常不存在,或者不以向细胞、组织或受试者给药的水平存在的任何实体。试剂可选自包括但不限于以下试剂的组:多核苷酸,多肽,小分子,以及抗体或其抗原结合片段。多核苷酸可以是RNA或DNA,可以是单链的或双链的,并且可选自包括例如编码多肽的核酸和核酸类似物的组。多肽可以是但不限于天然存在的多肽、突变的多肽或保留多肽感兴趣的功能的片段。试剂的其它示例包括但不限于:核酸适体、肽-核酸(PNA)、锁核酸(LNA)、有机小分子或无机小分子;糖;寡糖;多糖;生物大分子、肽模拟物;核酸类似物和衍生物;由生物材料(例如细菌、植物、真菌或哺乳动物细胞或组织)制成的提取物、以及天然存在的或合成的组合物。可将试剂施用至介质,在所述介质中使其接触细胞并诱导其作用。或者,试剂可作为向细胞内引入编码所述试剂的核酸序列而为细胞内的,并且其转录导致在细胞内产生核酸和/或蛋白质环境刺激。在任何方面的一些实施方式中,所述试剂是任何化学品、实体或部分(moiety),包括但不限于合成的和天然存在的非蛋白性实体。在某些实施方式中,所述试剂是具有选自于例如以下化学部分的小分子:例如,未取代或取代的烷基、芳香族、或杂环基部分,包括大环内酯类、莱普霉素(leptomycins)和相关的天然产物或它们的类似物)。试剂可已知具有期望的活性和/或性质,或可选自于不同化合物的文库。如本文所用,术语“小分子”可以指“天然产物样”化合物,然而,术语“小分子”不限于“天然产物样”化合物。实际上,小分子的典型特征在于其含有若干碳-碳键,并且具有大于约50道尔顿、但小于约5000道尔顿(5kD)的分子量。优选地,所述小分子的分子量小于3kD、更优选小于2kD、最优选小于1kD。在一些情况中,优选小分子具有等于或小于700道尔顿的分子质量(molecular mass)。

在任何方面的一些实施方式中,在进行步骤(a)之前,所述方法可进一步包括:使源细胞或源组织分化以启动V(D)J重组的步骤。在任何方面的一些实施方式中,所述源细胞为原代干细胞。在任何方面的一些实施方式中,所述源细胞为诱导多能干细胞(IPSC)。使特定细胞和/或组织分化以启动V(D)J重组的方法为本领域所已知,例如,使细胞分化成B淋巴细胞或T淋巴细胞谱系的方法。

在任何方面的一些实施方式中,所述重排事件涉及癌基因和/或RAG脱靶切割位点。

在任何方面的一些实施方式中,所述细胞可为表达AID的细胞;癌细胞;表达RAG核酸内切酶的细胞;或神经系统细胞。

在一个方面,本文描述了包含至少一条第一基因座特异性引物的试剂盒,所述引物将在V区段、D区段或J区段的400bp内特异性退火。在任何方面的一些实施方式中,所述试剂盒可进一步包含衔接子,所述衔接子包含:已知DNA序列的远端部分,所述已知DNA序列的远端部分可用来设计用于巢式PCR扩增的PCR引物;随机核苷酸的近端部分;和3'突出。在任何方面的一些实施方式中,所述试剂盒可进一步包含至少一条第二基因座特异性引物。在任何方面的一些实施方式中,所述试剂盒可进一步包含至少一条巢式PCR引物。在任何方面的一些实施方式中,所述试剂盒可进一步包含含有亲和结构域的底物,其中,所述第一基因座特异性引物或第二基因座特异性引物包含亲和标签。在任何方面的一些实施方式中,所述试剂盒可进一步包含细胞。

试剂盒是包含至少一种试剂(例如,第一基因座特异性引物和/或第二基因座特异性引物)的任何制造品(例如,包装或容器),该制造品作为用于实施本文所述方法的单元而被宣传、分配或销售。本文所述的试剂盒可任选地包含实施本文所述方法的其它组成部分。举例来说,所述试剂盒可包含:适于实施根据本文所述方法的一种或多种反应的流体和组合物(例如,缓冲液、dNTP等),描述本文所述方法的执行的说明材料等。另外,所述试剂盒可包含说明手册和/或可提供关于所获得结果的相关性的信息。

为方便起见,下文提供了说明书、实施例和所附权利要求中所使用的一些术语和短语的含义。除非另有说明、或从上下文中有所暗示,以下术语和短语包括下面提供的含义。提供这些定义来帮助对具体实施方式进行描述,而并非旨在限制所要求保护的发明,这是因为本发明的范围仅由权利要求限定。除非另外定义,否则本文所使用的所有技术术语和科学术语具有与本发明所属领域中的普通技术人员通常理解的含义相同的含义。如果某术语在本领域中的使用与本文所提供的定义之间存在明显矛盾,应以本说明书中所提供的定义为准。

为方便起见,在此收集了本文在说明书、实施例和所附权利要求中所使用的某些术语。

如本文所使用的,“接触”是指用于将试剂递送或暴露至至少一种细胞的任何适合的手段。示例性的递送方法包括但不限于直接递送至细胞培养基、灌注、注射、或本领域技术人员公知的其它递送方法。

在各种实施方式中,本文描述的方法涉及用至少一种引物(例如寡核苷酸引物)实施PCR扩增方案。如本文所使用的,“引物”是指能够序列特异性地退火至多核苷酸模板、并提供作为模板依赖性聚合酶的底物的3'端,以产生与所述多核苷酸模板互补的延伸产物的DNA或RNA多核苷酸分子或其类似物。起始和延伸的条件通常包括在合适的缓冲液(在这一上下文中,“缓冲液”包括溶剂(通常为水性)并添加必要的辅因子(cofactors)和影响pH、离子强度等的试剂)中存在至少一种但更优选全部四种不同的脱氧核糖核苷三磷酸和聚合诱导剂(例如DNA聚合酶或逆转录酶)并处于合适的温度。本文所述方法中有用的引物通常是单链的,并且引物及其互补链可以退火形成双链多核苷酸。根据本文所述方法和组合物的引物的长度可小于或等于300个核苷酸,例如,长度小于或等于300个、或250个、或200个、或150个、或100个、或90个、或80个、或70个、或60个、或50个、或40个,并优选30个以下、或20个以下、或15个以下,但至少为10个核苷酸。

在任何方面的一些实施方式中,本文所述的PCR反应涉及使用引物组。如本文所使用的,术语“引物组”是指至少两条引物的集合,所述至少两条引物包括正向引物和反向引物,其中一条退火至靶核酸序列的第一链,并且另一条退火至该第一链的互补链。在任何方面的一些实施方式中,引物对亚组的第一引物可退火至靶核酸序列的第一链,引物对亚组的第二引物(例如,反向引物)可退火至该链的互补链。当退火至靶标和/或其互补链时,引物的取向可为使得从引物对亚组的一条引物的引物延伸开始进行的核酸合成将生成与引物对亚组的第二引物的至少一个区域互补的核酸序列。核酸靶标和/或序列的“第一链”可为包含靶核苷酸序列和/或靶位点基因座序列的双链核酸的任一链,但一旦选定,便定义其互补链为第二链。因此,如本文所使用的,“正向引物”为退火至核酸靶标的第一链的引物,而同组的“反向引物”为退火至核酸靶标第一链的互补链的引物。在特异性针对靶核酸的引物的上下文中使用时,本文所使用的“特异性”是指引物和靶标间的互补性水平,这样的互补性水平使得存在这样的退火温度:在该退火温度下,引物将退火至靶核酸并介导靶核酸的扩增,而并不退火至样品中存在的非靶标序列或介导非靶标序列的扩增。

制备引物的方法是本领域所熟知,多种商业资源提供适于提供根据本文所述方法和组合物的引物的寡核苷酸合成服务,例如,INVITROGENTM的定制DNA寡核苷酸;LifeTechnologies;Grand Island,NY或来自IDT的定制DNA寡核苷酸;Coralville,IA。

在任何方面的一些实施方式中,所述引物中的一条或多条可选自SEQ ID No:1-SEQ ID No:32或SEQ ID No:43-SEQ ID No:65。在任何方面的一些实施方式中,所述引物中的一条或多条可包含选自SEQ ID No:1-SEQ ID No:32或SEQ ID No:43-SEQ ID No:65的序列。

表4

Figure BDA0002230788130000341

Figure BDA0002230788130000351

Figure BDA0002230788130000361

PCR需要使用核酸聚合酶。如本文所使用的,短语“核酸聚合酶”指的是催化核苷三磷酸的模板依赖性聚合,以形成与模板核酸序列互补的引物延伸产物的酶。核酸聚合酶在退火引物的3'端起始合成,并在朝向模板的5'端的方向继续。多种核酸聚合酶为本领域所知晓并且为商购可得的。一组优选的核酸聚合酶为热稳定的,即,它们在经历足以使得退火的互补核酸链变性的温度(例如94℃或有时更高)后维持功能。如本领域所理解的,PCR可能需要包括链分离步骤(通常涉及对反应混合物进行加热)在内的循环。如本文所使用的,术语“链分离”或“使链分离”意味着对核酸样品进行处理,使得互补的双链分子分离为两个单链,从而能够用于退火至寡核苷酸引物。更具体地,根据本文所述方法的链分离通过将核酸样品加热至高于其Tm来实现。一般而言,对于处于适于核酸聚合酶的缓冲液中的含有核酸分子的样品而言,加热至94℃足以实现链分离。示例性的缓冲液含有50mM KCl、10mM Tric-HCl(25℃时pH为8.8)、0.5mM至3mM MgCl2,和0.1%BSA。

同样如本领域所理解的,PCR需要将引物退火至模板核酸。如本文所使用的,“退火”指的是允许两条互补或基本上互补的核酸链杂交,更具体地,当在PCR的上下文中使用时,杂交使得形成用于模板依赖性聚合酶的引物延伸底物。引物-靶核酸的退火条件根据引物的长度和序列而改变,并且以所计算的引物的Tm为基础。一般而言,扩增方案中的退火步骤涉及在链分离步骤后将温度降低至以所计算的引物序列的Tm为基础的温度,保持足以允许此类退火的时间。本领域技术人员可利用多种广泛可得的算法中的任何算法容易地预测Tm,所述算法例如OLIGOTM(Molecular Biology Insights Inc.,Colorado)引物设计软件和VENTRO NTITM(Invitrogen,Inc.,California)引物设计软件以及可在互联网上获得的程序(包括Primer3和Oligo Calculator)。例如,可用NetPrimer软件(Premier Biosoft;PaloAlto,CA;并在万维网http://www.premierbiosoft.com/netprimer/netprlaunch/Help/xnetprlaunch.ht ml上免费可得)对Tm进行计算。还可使用如下公式对引物的Tm进行计算(该公式为NetPrimer软件所使用,并在Frieir等,PNAS 198683:9373-9377中更详细地描述,以引用的方式将其整体并入本文)。Tm=ΔH/(ΔS+R*ln(C/4))+16.6log([K+]/(1+0.7[K+]))-273.15

其中,ΔH为螺旋形成的焓;ΔS为螺旋形成的熵;R为摩尔气体常数(1.987cal/℃*mol);C为核酸浓度;[K+]为盐浓度。对于大部分扩增方案而言,将退火温度选择为比预测的Tm低约5℃,然而,可使用接近和高于Tm(例如比预测的Tm低1℃-5℃,或者比预测的Tm高1℃-5℃)的温度,也可使用例如比预测的Tm低超过5℃(例如,低6℃、低8℃、低10℃或更低)的温度。一般而言,退火温度越接近Tm,退火的特异性越高。在PCR扩增方案中允许引物退火的时间很大程度上依赖于反应的体积(更大的体积需要更长的时间),但也依赖于引物和模板的浓度(与较低的相对浓度相比,引物相对于模板的相对浓度越高所需的时间越少)。依赖于体积和引物/模板的相对浓度,扩增方案中的引物退火步骤可为约1秒至5分钟,然而通常为10秒到2分钟之间、优选约30秒至2分钟。如本文所使用的,“实质上退火”指的是PCR扩增方案过程中足以生成可检测水平的特异性扩增产物的退火程度。

PCR还依赖于各循环的退火引物的聚合酶延伸。如本文所使用的,术语“聚合酶延伸”意味着借助核酸聚合酶,以模板依赖性方式将至少一个互补核苷酸掺入至退火引物的3'端。聚合酶延伸优选添加超过一个核苷酸、优选上至并包括对应于模板全长的核苷酸。聚合酶延伸的条件随聚合酶的种类而改变。聚合酶延伸所使用的温度通常以酶的已知活性性质为基础。虽然退火温度需要例如低于酶的最佳温度,使用较低的延伸温度通常是可接受的。一般而言,虽然在低于酶的最佳延伸温度的温度下该酶保留有至少部分活性,最常用的热稳定聚合酶(例如Taq聚合酶和其变体)参与的聚合酶延伸在65℃-75℃(例如68℃-72℃)进行。

引物延伸在允许退火的寡核苷酸引物延伸的条件下进行。如本文所使用的,术语“允许退火的寡核苷酸延伸从而生成延伸产物的条件”指的是包括例如温度、盐与辅因子浓度、pH和酶浓度在内的条件组,在此类条件组下核酸聚合酶催化引物延伸。此类条件将随所用核酸聚合酶的种类而改变,然而用于大量有用聚合酶的条件为本领域技术人员所熟知。一个示例性的条件为50mM KCl、10mM Tric-HCl(25℃时pH为8.8)、0.5mM-3mM MgCl2、200μM每种dNTP和0.1%BSA,72℃,在该条件下Taq聚合酶催化引物延伸。

如本文所使用的,“扩增产物”或“PCR产物”指的是由PCR反应产生的多核苷酸,该多核苷酸是特定靶核酸序列和/或其互补序列的部分的拷贝,其核苷酸序列对应于所述模板核酸序列和/或其互补序列。扩增产物可为双链的或单链的。

如本文所使用的,术语“蛋白质”和“多肽”在本文中互换使用,表示通过相邻残基的α-氨基基团和α-羧基基团之间的肽键彼此连接的一系列氨基酸残基。术语“蛋白质”和“多肽”是指氨基酸(包括经修饰的氨基酸(例如,磷酸化、糖化、糖基化等)和氨基酸类似物)的多聚物,而不考虑其大小或功能。“蛋白质”和“多肽”经常用于指代相对大的多肽,而术语“肽”经常用于指代小的多肽,然而这些术语在本领域中的使用是相互重叠的。当指代基因产物及其片段时,术语“蛋白质”和“多肽”在本文中可互换使用。因此,示例性的多肽或蛋白质包括基因产物、天然存在的蛋白质、同系物(homologs)、直系同源物(orthologs)、旁系同源物(paralogs)、片段,以及上述物质的其它等同物、变体、片段和类似物。

如本文所使用的,术语“核酸”或“核酸序列”指的是包含核糖核酸、脱氧核糖核酸或它们的类似物的单元的任何分子,优选聚合分子。所述核酸可为单链的或双链的。单链核酸可为变性双链DNA的一条核酸链。或者,单链核酸可为不衍生自任何双链DNA的单链核酸。在一个方面,核酸可为DNA。在另一方面,核酸可为RNA。合适的核酸分子为DNA,包括基因组DNA或cDNA。其它合适的核酸分子为RNA,包括mRNA。

术语“统计学显著的(statistically significant)”或“显著地(significantly)”指统计显著性,并且通常意味着2个标准差(2SD)或更大的差异。

除了在操作实施例中或另有指明的地方,本文所用的表示成分的量或反应条件的全部数值在所有情况下都应该被理解为被术语“约”修饰。与百分比相连使用时术语“约”可意味着±1%。

如本文所使用的,术语“包含/包括/含有(comprising或comprises)”用于表示对方法或组合物必要的组合物、方法和其各自的组成部分,并且无论是否必要都仍然对纳入未指定的要素保持开放。

术语“由…组成”涉及本文所述的组合物、方法及其各自的组成部分,排除没有在实施方式描述中列举的任何要素。

如本文所使用的,术语“基本上由…组成”涉及给定实施方式所需的那些要素。该术语允许存在实质上不影响该实施方式的基础和新颖性或起作用的特征的要素。

除非上下文中明确地另有所指,单数术语“一个/种(a/an)”和“/该/所述(the)”涵盖复数的所指物。相似地,除非上下文中明确地另有所指,词语“或”意在涵盖“和(and)”。尽管与本文所述的方法和材料相似或等同的方法和材料可用于本公开的实践或测试中,合适的方法和材料在下文有所描述。缩写“e.g.”源自拉丁文的例如(exempli gratia),并在本文中用于表示非限制性的示例。因此,缩写“e.g.”与术语“例如(for example)”同义。

细胞生物学和分子生物学中常用术语的定义可以在以下著作中找到:“The MerckManual of Diagnosis and Therapy”,第19版,Merck Research Laboratories出版,2006(ISBN 0-911910-19-0);Robert S.Porter等(著),The Encyclopedia of MolecularBiology,Blackwell Science Ltd.出版,1994(ISBN 0-632-02182-9);Benjamin Lewin,Genes X,Jones&Bartlett Publishing出版,2009(ISBN-10:0763766321);Kendrew等(著),Molecular Biology and Biotechnology:a Comprehensive Desk Reference,VCHPublishers,Inc.出版,1995(ISBN 1-56081-569-8);以及Current Protocols in ProteinSciences 2009,Wiley Intersciences,Coligan等(著)。

除非另有说明,使用例如如下著作中所述的标准程序来实施本发明:Sambrook等,Molecular Cloning:A Laboratory Manual(第4版),Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,USA(2012);Davis等,Basic Methods in MolecularBiology,Elsevier Science Publishing,Inc.,New York,USA(1995);或Methods inEnzymology:Guide to Molecular Cloning Techniques,第152卷,S.L.Berger和A.R.Kimmel著,Academic Press Inc.,San Diego,USA(1987);Current Protocols inProtein Science(CPPS)(John E.Coligan等著,John Wiley and Sons,Inc.),CurrentProtocols in Cell Biology(CPCB)(Juan S.Bonifacino等著,John Wiley and Sons,Inc.);以及Culture of Animal Cells:A Manual of Basic Technique by R.IanFreshney,出版者:Wiley-Liss;第5版(2005),Animal Cell Culture Methods(Methods inCell Biology,第57卷,Jennie P.Mather和David Barnes编,Academic Press,第1版,1998);以引用的方式将它们全部整体并入本文。

在本文中其它术语在本发明各个方面的描述中进行定义。

出于描述和公开的目的,在此以引用的方式将本申请通篇所引用的所有专利与其它出版物(包括文字出版物、授权专利、公开的专利申请以及共同的未决(co-pending)专利申请)明确地并入本文,例如在此类出版物中描述的可用于本文所述技术相关的方法学。这些出版物仅仅由于它们的公开早于本申请的申请日而提供。在这一方面不应当视作承认本发明人没有权利借助于先前的发明或因为任何其它原因而将此类公开内容提前。所有关于这些文件的日期的声明或这些文件的内容的表述是基于申请人可得的信息,并不构成关于这些文件的日期或内容的正确性的任何承认。

对本公开的实施方式的描述不意味着穷举或将本公开限制在所公开的确切形式。尽管本文出于说明目的对本公开的具体实施方式和实施例进行了描述,然而正如相关领域的技术人员将了解的,可在本公开的范围内作出多种等同修改。例如,将方法步骤或功能以给定的顺序给出时,其它实施方式可以不同顺序来实施功能、或可以基本上同时来实施这些功能。本文所提供的本公开的教导可以适当的方式应用于其它程序或方法。可将本文所述的各种实施方式组合以提供进一步的实施方式。如有需要的话,可对本公开的方面进行修改,以利用上述参考文献和申请中的组合物、功能和构思,来提供本公开更进一步的实施方式。此外,出于生物功能等效性的考虑,可在蛋白结构方面进行一些改变而不会在种类或量方面影响生物作用或化学作用。可根据详细描述来对本公开进行这些改变和其它改变。所有此类修饰都旨在落入所附权利要求的范围之内。

任何前述实施方式中的具体要素可进行组合或替代其它实施方式中的要素。此外,尽管与本公开的特定实施方式相关的优势已经在这些实施方式的上下文中描述,其它实施方式也可表现出此类优势,但不是所有实施方式都必须表现出此类优势才落入本公开的范围。

本文所述的技术进一步由以下实施例予以说明,但决不应当理解为本文所述的技术被进一步限定。

本文所述技术的一些实施方式可根据任何以下编号段落进行定义:

1.一种用于细胞中重组事件和/或重排事件的基于高通量全基因组易位测序(HTGTS)的检测方法,所述方法包括以下步骤:

a.从细胞中提取基因组DNA和/或mRNA;

b.任选地,产生片段化的DNA和/或mRNA样品;

c.用至少一条第一基因座特异性引物通过线性扩增介导的PCR(LAM-PCR)由基因组DNA产生单链PCR产物;和/或

用至少一条第一基因座特异性引物通过逆转录由mRNA产生cDNA;

d.通过将步骤(c)中产生的所述单链PCR产物或cDNA连接至衔接子,来产生连接的DNA和/或cDNA产物,其中,所述衔接子包含:

已知DNA序列的远端部分,所述已知DNA序列的远端部分可用来设计用于巢式PCR扩增的PCR引物;

随机核苷酸的近端部分;和

3'突出;

e.使用步骤(d)的连接产物,通过用衔接子特异性引物和至少一条第二基因座特异性引物进行巢式PCR来产生巢式PCR产物,从而扩增包含重组事件和/或重排事件的核酸序列;

f.任选地,用限制酶对步骤(e)的所述PCR产物进行消化以阻断未重排的含诱饵片段;

g.通过对所述巢式PCR产物进行测序以产生经测序的巢式PCR产物;以及

h.将所述经测序的巢式PCR产物与参比序列或抗原受体数据库进行比对。

2.如段落1所述的方法,其中,所述重组事件为V(D)J重组事件。

3.如段落2所述的方法,其中,所述细胞选自于由以下细胞所组成的组:

成熟B淋巴细胞、发育中的B淋巴细胞、成熟T淋巴细胞或发育中的T淋巴细胞。

4.如段落2-3中任一段所述的方法,其中,所述方法进一步包括提供所述细胞,其中,所述细胞获得自用抗原免疫的动物。

5.如段落2-4中任一段所述的方法,其中,所述方法进一步包括提供所述细胞,其中,所述细胞包含经历过体细胞超突变的V(D)J外显子。

6.如段落5所述的方法,其中,所述细胞为生发中心B淋巴细胞。

7.如段落2-6中任一段所述的方法,在进行步骤(a)之前,所述方法进一步包括以下步骤:

用抗原免疫动物;以及

从所述动物中获得细胞。

8.如段落1-7中任一段所述的方法,其中,所述方法进一步包括使用多条第一基因座特异性引物和/或多条第二基因座特异性引物。

9.如段落8所述的方法,其中,所述多条引物特异性地退火至不同的V基因区段、D基因区段或J基因区段。

10.如段落1-9中任一段所述的方法,在进行步骤(a)之前,所述方法进一步包括使源细胞或源组织分化以启动V(D)J重组的步骤。

11.如段落10所述的方法,其中,所述源细胞为诱导多能干细胞。

12.如段落10所述的方法,其中,所述源细胞为原代干细胞。

13.如段落1-12中任一段所述的方法,其中,在进行步骤(a)之前,用RAG1/2核酸内切酶转导所述细胞或来源以启动V(D)J重组。

14.如段落1-13中任一段所述的方法,所述方法进一步包括使所述细胞与启动V(D)J重组的一种或多种药剂接触的步骤。

15.如段落14所述的方法,其中,所述启动V(D)J重组的药剂为伊马替尼。

16.如段落15所述的方法,其中,所述细胞为v-abl病毒转化的B细胞。

17.如段落1所述的方法,其中,所述重排事件涉及癌基因和/或RAG脱靶切割位点。

18.如段落1或17所述的方法,其中,所述细胞选自于由以下细胞所组成的组:

表达AID的细胞,癌细胞,表达RAG核酸内切酶的细胞,或神经系统细胞。

19.如段落1-18中任一段所述的方法,其中,所述第一基因座特异性引物包含亲和标签。

20.如段落19所述的方法,其中,所述方法进一步包括通过亲和纯化对步骤(c)的产物进行分离。

21.如段落19-20中任一段所述的方法,其中,所述亲和标签为生物素。

22.如段落21所述的方法,其中,所述亲和纯化包括用链霉亲和素结合生物素。

23.如段落20-22中任一段所述的方法,其中,所述亲和纯化包括将步骤(c)的产物结合到底物上。

24.如段落23所述的方法,其中,所述底物是珠。

25.如段落1-24中任一段所述的方法,其中,用于巢式PCR步骤的引物包含条形码序列。

26.如段落1-25中任一段所述的方法,其中,所述片段化通过超声处理或限制酶消化进行。

27.如段落1-26中任一段所述的方法,其中,通过随机剪切基因组DNA或用频繁切割限制酶进行片段化。

28.如段落1-27中任一段所述的方法,其中,将步骤(c)的产物连接到衔接子包括使所述产物与具有相同的远端部分序列和随机近端部分序列的衔接子群接触。

29.如段落1-28中任一段所述的方法,其中,所述衔接子的近端部分的长度为3-10个核苷酸。

30.如段落1-29中任一段所述的方法,其中,所述衔接子的近端部分的长度为5-6个核苷酸。

31.如段落1-30中任一段所述的方法,其中,所述衔接子包含远端部分和近端部分之间的条形码序列。

32.如段落1-31中任一段所述的方法,其中,在测序前对步骤(e)中产生的PCR产物进行大小选择。

33.如段落1-32中任一段所述的方法,其中,在步骤(a)之前,所述细胞存在于组织中。

34.如段落1-33中任一段所述的方法,其中,所述测序使用下一代测序方法进行。

35.如段落1-34中任一段所述的方法,其中,比对步骤由非人机器进行。

36.如段落35所述的方法,其中,所述非人机器包含计算机可执行软件。

37.如段落35所述的方法,所述方法进一步包括用于显示所述比对步骤的结果的显示模块。

38.如段落34-37中任一段所述的方法,其中,所述比对步骤的结果是跨越一组V(D)J重排的核苷酸序列或氨基酸序列的突变谱。

39.如段落1-38中任一段所述的方法,其中,所述细胞为哺乳动物细胞。

40.如段落1-39中任一段所述的方法,其中,省略阻断消化步骤(f)。

41.如段落1-40中任一段所述的方法,其中,在步骤(c)之前不进行末端修复。

42.如段落1-41中任一段所述的方法,其中,所述引物中的一条或多条包含选自SEQ ID No:1-SEQ ID No:32的序列。

43.如段落1-41中任一段所述的方法,其中,所述引物中的一条或多条选自SEQ IDNo:1-SEQ ID No:32。

本文所述技术的一些实施方式可根据任何以下编号段落进行定义:

1.一种用于细胞中重组事件和/或重排事件的基于高通量全基因组易位测序(HTGTS)的检测方法,所述方法包括以下步骤:

a.从细胞中提取基因组DNA和/或mRNA;

b.任选地,产生片段化的DNA和/或mRNA样品;

c.用至少一条第一基因座特异性引物通过线性扩增介导的PCR(LAM-PCR)由基因组DNA产生单链PCR产物;和/或

用至少一条第一基因座特异性引物通过逆转录由mRNA产生cDNA;

d.通过将步骤(c)中产生的所述单链PCR产物或cDNA连接至衔接子,来产生连接的DNA和/或cDNA产物,其中,所述衔接子包含:

已知DNA序列的远端部分,所述已知DNA序列的远端部分可用来设计用于巢式PCR扩增的PCR引物;

随机核苷酸的近端部分;和

3'突出;

e.使用步骤(d)的连接产物,通过用衔接子特异性引物和至少一条第二基因座特异性引物进行巢式PCR来产生巢式PCR产物,从而扩增包含重组事件和/或重排事件的核酸序列;

f.任选地,用限制酶对步骤(e)的所述PCR产物进行消化以阻断未重排的含诱饵片段;

g.通过对所述巢式PCR产物进行测序以产生经测序的巢式PCR产物;以及

h.将所述经测序的巢式PCR产物与参比序列或抗原受体数据库进行比对。

2.如段落1所述的方法,其中,所述重组事件为V(D)J重组事件。

3.一种用于细胞中Ig组库序列的基于高通量组库测序的检测方法,所述方法包括以下步骤:

a.从细胞中提取基因组DNA和/或mRNA;

b.任选地,产生片段化的DNA和/或mRNA样品;

c.用至少一条第一基因座特异性引物通过线性扩增介导的PCR(LAM-PCR)由基因组DNA产生单链PCR产物;和/或

用至少一条第一基因座特异性引物通过逆转录由mRNA产生cDNA;

d.通过将步骤(c)中产生的所述单链PCR产物或cDNA连接至衔接子,来产生连接的DNA和/或cDNA产物,其中,所述衔接子包含:

已知DNA序列的远端部分,所述已知DNA序列的远端部分可用来设计用于巢式PCR扩增的PCR引物;

随机核苷酸的近端部分;和

3'突出;

e.使用步骤(d)的连接产物,通过用衔接子特异性引物和至少一条第二基因座特异性引物进行巢式PCR来产生巢式PCR产物,从而扩增包含Ig组库序列的核酸序列;

f.任选地,用限制酶对步骤(e)的所述PCR产物进行消化以阻断未重排的含诱饵片段;

g.通过对所述巢式PCR产物进行测序以产生经测序的巢式PCR产物;以及

h.将所述经测序的巢式PCR产物与参比序列或抗原受体数据库进行比对。

4.如段落3所述的方法,其中,所检测的组库包含V(D)J重组事件和/或体细胞超突变(SMH)。

5.如段落3-4中任一段所述的方法,其中,所检测的组库包含Ig重链、Ig轻链、V使用和CDR3组库。

6.如段落1-5中任一段所述的方法,其中,所述细胞选自于由以下细胞所组成的组:

成熟B淋巴细胞、发育中的B淋巴细胞、成熟T淋巴细胞、发育中的T淋巴细胞、从生发中心获得的细胞、以及从派伊尔氏结获得的细胞。

7.如段落1-6中任一段所述的方法,其中,所述方法进一步包括提供所述细胞,其中,所述细胞获得自用抗原免疫的动物。

8.如段落1-7中任一段所述的方法,其中,所述方法进一步包括提供所述细胞,其中,所述细胞包含经历过体细胞超突变的V(D)J外显子。

9.如段落8所述的方法,其中,所述细胞为生发中心B淋巴细胞或派伊尔氏结B淋巴细胞。

10.如段落1-9中任一段所述的方法,在进行步骤(a)之前,所述方法进一步包括以下步骤:

用抗原免疫动物;以及

从所述动物中获得细胞。

11.如段落1-10中任一段所述的方法,其中,所述至少一条第一基因座特异性引物特异性地退火至J基因区段。

12.如段落1-11中任一段所述的方法,其中,所述方法进一步包括使用多条第一基因座特异性引物和/或多条第二基因座特异性引物。

13.如段落12所述的方法,其中,所述多条引物中的各条引物特异性地退火至不同的V基因区段、D基因区段和/或J基因区段。

14.如段落13所述的方法,其中,所述多条引物中的各条引物特异性地退火至各自不同的J基因区段,所述J基因区段存在于V(D)J重组之前的细胞或有机体的基因组中。

15.如段落14所述的方法,其中,所述多条引物共同特异性地退火至JH1、JH2、JH3或JH4各自的序列。

16.如段落14所述的方法,其中,所述多条引物共同特异性地退火至JH基因区段、JK基因区段和JL基因区段各自的至少一个序列,所述JH基因区段、JK基因区段和JL基因区段存在于V(D)J重组之前的细胞或有机体的基因组中。

17.如段落1-16中任一段所述的方法,其中,所述至少一条第一基因座特异性引物特异性地退火至所述靶基因区段的简并区域。

18.如段落1-17中任一段所述的方法,在进行步骤(a)之前,所述方法进一步包括使源细胞或源组织分化以启动V(D)J重组的步骤。

19.如段落18所述的方法,其中,所述源细胞为诱导多能干细胞。

20.如段落18所述的方法,其中,所述源细胞为原代干细胞。

21.如段落1-20中任一段所述的方法,其中,在进行步骤(a)之前,用RAG1/2核酸内切酶转导所述细胞或来源以启动V(D)J重组。

22.如段落1-21中任一段所述的方法,所述方法进一步包括使所述细胞与启动V(D)J重组或SHM的一种或多种试剂接触的步骤。

23.如段落22所述的方法,其中,所述启动V(D)J重组的试剂为伊马替尼。

24.如段落23所述的方法,其中,所述细胞为v-abl病毒转化的B细胞。

25.如段落1-24所述的方法,其中,所述重排事件涉及癌基因和/或RAG脱靶切割位点。

26.如段落1-25中任一段所述的方法,其中,所述细胞选自于由以下细胞所组成的组:

表达AID的细胞,癌细胞,表达RAG核酸内切酶的细胞,或神经系统细胞。

27.如段落1-26中任一段所述的方法,其中,所述第一基因座特异性引物包含亲和标签。

28.如段落27所述的方法,其中,所述方法进一步包括通过亲和纯化对步骤(c)的产物进行分离。

29.如段落27-28中任一段所述的方法,其中,所述亲和标签为生物素。

30.如段落29所述的方法,其中,所述亲和纯化包括用链霉亲和素结合生物素。

31.如段落28-30中任一段所述的方法,其中,所述亲和纯化包括将步骤(c)的产物结合到底物上。

32.如段落31所述的方法,其中,所述底物是珠。

33.如段落1-32中任一段所述的方法,其中,用于巢式PCR步骤的引物包含条形码序列;

34.如段落1-33中任一段所述的方法,其中,所述片段化通过超声处理或限制酶消化进行。

35.如段落1-34中任一段所述的方法,其中,所述片段化通过随机剪切基因组DNA或用频繁切割限制酶进行。

36.如段落1-35中任一段所述的方法,其中,将步骤(c)的产物连接到衔接子包括使所述产物与具有相同远端部分序列和随机近端部分序列的衔接子群接触。

37.如段落1-36中任一段所述的方法,其中,所述衔接子的近端部分的长度为3-10个核苷酸。

38.如段落1-37中任一段所述的方法,其中,所述衔接子的近端部分的长度为5-6个核苷酸。

39.如段落1-38中任一段所述的方法,其中,所述衔接子包含远端部分和近端部分之间的条形码序列。

40.如段落1-39中任一段所述的方法,其中,在测序前,对步骤(e)中产生的所述PCR产物进行大小选择。

41.如段落1-40中任一段所述的方法,其中,在步骤(a)之前,所述细胞存在于组织中。

42.如段落1-41中任一段所述的方法,其中,所述测序使用下一代测序方法进行。

43.如段落1-42中任一段所述的方法,其中,所述比对步骤由非人机器进行。

44.如段落43所述的方法,其中,所述非人机器包含计算机可执行软件。

45.如段落43所述的方法,所述方法进一步包括用于显示所述比对步骤的结果的显示模块。

46.如段落1-45中任一段所述的方法,其中,所述比对步骤的结果是跨越一组V(D)J重排的核苷酸序列或氨基酸序列的突变谱。

47.如段落1-46中任一段所述的方法,其中,所述细胞为哺乳动物细胞。

48.如段落1-47中任一段所述的方法,其中,省略阻断消化步骤(f)。

49.如段落1-48中任一段所述的方法,其中,在步骤(c)之前不进行末端修复。

50.如段落1-49中任一段所述的方法,其中,所述引物中的一条或多条包含选自于SEQ ID No:1-SEQ ID No:32或SEQ ID No:43-SEQ ID No:65的序列。

51.如段落1-50中任一段所述的方法,其中,所述引物中的一条或多条选自SEQ IDNo:1-SEQ ID No:32和SEQ ID No:43-SEQ ID No:65。

实施例

实施例1:LAM-HTGTS方法对RAG靶上(On-Targets)和RAG脱靶(Off-Targets)的研究。

LAM-HTGTS鉴别与DSB相关诱饵序列接合的猎物序列(Frock等,2015)。因为V(D)J重组以在V区段、D区段和J区段的边界处的连结引起重排,可使用任何这些基因区段的引物作为诱饵来鉴别经历了V(D)J重组的祖淋巴细胞或前体淋巴细胞中RAG引发的DSB位点,以及在成熟淋巴细胞中回顾性地鉴别发育早期发生的V(D)J重组事件。利用内源性的RAG引发的DSB的LAM-HTGTS在无法通过以前的分析进行检测的发育中的B谱系细胞和T谱系细胞中鉴别RAG引发的靶上连结和脱靶连结(Hu等,2015;Zhao等,另见下文)。取决于DSB的哪一侧存在诱饵引物,LAM-HTGTS鉴别所有V(D)J编码接合或相应的RSS接合(例如Hu等,2015),包括染色体中或删除环(excision circles)中存在的那些接合(Hu等,2015)。除了定量和极其灵敏之外,对于生产性接合和非生产性接合LAM-HTGTS是无偏的,只需要单个诱饵PCR引物,读出缺失和反向接合,并且很容易鉴别甚至非常低频率的重组事件(例如在CAC脱靶处发生的重组事件,这些重组事件在以前的分析中是看不见的)。LAM-HTGTS还检测出跨越数个Mb长的重组结构域中的这些接合(Hu等,2015)。此外,LAM-HTGTS可用于密切关注多种类型的V(D)J接合中间体的接合,例如通过密切关注特定DJH重排的接合(Hu等,2015)。LAM-HTGTS还通过将个体V或D用作LAM-HTGTS诱饵来揭示该个体D或V的接合。

为了将LAM-HTGTS转化为更标准的组库测序方法(称为HTGTS-Rep-seq),对该方法进行了修改,包括将诱饵引物移动到更接近诱饵J的编码末端并使用MiSeq 300bp×2配对末端测序来捕获回收的连结中的V序列长度。还将LAM-HTGTS通道修改成包含IgBLAST,从而生成提供关于读码框内或非生产性连结、互补决定区(CDR)和突变的全面信息的分析通道。HTGTS-Rep-seq优于先前的方法。在这方面,先前基于DNA的方法依赖于上游简并V引物和下游简并J引物的使用,这会覆盖大多数但并非全部的V(D)J外显子并且很可能不是全部均等地。此外,此类方法仅检测该两种引物之间的重排序列,因此无法发现大多数脱靶序列中的RAG引发的接合(Georgiou等,2014)。基于RNA的方法仅需要一种下游引物(来自J区或恒定区),因此避免了先前基于DNA的分析中的偏差,但是这些方法严重低估了由于转录水平降低而导致的非生产性重排,并且由于缺乏表达,将会遗漏基因座内的许多脱靶重排(Georgiou等,2014)。相比之下,HTGTS-Rep-seq需要由单个引物或一类引物(例如J引物或D引物)进行的线性延伸,并检测读码框内重排和读码框外重排,甚至检测到对于RSS融合而言是次要的的一些基因座中的稳健的接合类别(其在以前的分析中是看不见的)(Hu等,2015)。

通过使用给定的J的引物,HTGTS-Rep-seq已被用来分析来自小鼠和人IgH基因座、Igλ基因座和Igκ基因座的V(D)J组库。为了说明该方法和所生成的库数据,在来自小鼠pro-B细胞的DNA上进行的RAG引发的JH4区段编码末端作为诱饵的HTGTS-Rep-seq分析在轴上方示出,在来自脾成熟B细胞的DNA上进行的RAG引发的JH4区段编码末端作为诱饵的HTGTS-Rep-seq分析在轴下方示出,以允许组库的直接比较(如图1所示)。注意,该分析相对定量地提供了DJH4重排中不同D区段的相对利用以及读码框内和非生产性中的不同VH区段的相对利用(图1)。因此,在纯化的pro-B细胞中,DJH4重排的频率远远超过V(D)JH4重排的频率,而在脾脏中它们以更接近理想化的30/70比的水平发生(图1)。此外,虽然VH81X重排是迄今为止Pro-B细胞中最丰富的重排(两倍于读码框内的非生产性重排),VH81X重排在脾B细胞中占总数的比例很低,并且几乎所有的都是非生产性的,正如预期的那样,这是由于VH81X读码框内重排的负选择(Guo等,2011b;Alt等,2013)。各种重排类型的比例在所有实验中都是一致的,包括某些远端VH的优先重排和在成熟组库中其中一些的优先呈现(图1)。该方法适用于多种小鼠Ig和TCR基因座以及所有人Ig基因座。该方法快速、相对便宜,并且可利用来自纯化的B谱系群或T谱系群的少至200ng的DNA。

实施例2

目前,免疫疗法市场和抗体研究领域都迫切寻求无偏的高通量测定,其可促进发现感兴趣的抗原的新的高亲和力抗体并帮助了解疫苗开发。此类分析还将促进新抗体的工程化设计。为了满足这一需要,本文描述了通过高通量方法进行组库测序并揭示体细胞超突变的新方法。

本文所述的方法涉及用特异性识别给定J区段下游区域的单引物进行的线性扩增方法,以扩增用于测序的V(D)J外显子;因此,本分析克服了采用不能同等地结合所有V区家族的简并V引物进行的现有方法固有的偏倚。LAM-HTGTS可确定和量化来自任何细胞来源(例如,祖细胞、前体细胞、外周细胞和细胞系)的基因组DNA(或mRNA)(尽管我们的方法消除了某些方法中mRNA存在的原因)中所有V区段家族的V(D)J外显子。

为了证明该方法,对VH和Vκ的使用进行了检查。图3A-图3D描绘了来自祖B(pro-B)细胞和外周脾B细胞的示例VH使用模式,以及来自pro-B细胞系的示例Vκ使用模式。尤其是,在pro-B细胞和成熟B细胞中利用了来自所有VH家族的大多数功能性VH,并且在v-Abl转化的pro-B细胞系中利用了除了一种以外的所有功能性Vκ。这些数据表明,与现有方法相比,本方法没有明显的偏向。

图4A-图4B证明了该分析还可用于区分和量化读码框内和读码框外V(D)J外显子。从IgH或Igκ文库中提取缝合的配对末端Iliumina Miseq序列。在超过30%的总缝合序列中包含有完整的CDR1、CDR2和CDR3;因此,该方法可用于研究体细胞超突变(图5A-图5C)。到目前为止,就任何其它方法而言,尚未报道这种对于随后的特异性免疫应答而言很关键的性质(例如,在疫苗接种实验过程中)。

实施例3

本文所述的方法与早前的方法的不同之处在于:

1.mRNA可用于生成HTGTS-Rep-seq文库。

2.引物可位于目标诱饵编码末端下游20-50bp;在先前的方法中,引物距所述编码末端至少100bp。

3.本文所述的引物是通用引物,并且可用于所有用户的HTGTS-Rep-seq文库:

表1:

Figure BDA0002230788130000531

4.HTGTS-Rep-seq不需要酶阻断,而大多数先前的HTGTS应用需要酶阻断。

5.与先前的方法相比,对于HTGTS-Rep-seq通常可使用较低量的起始材料,因为在大多数应用中V(D)J重排预期比一般易位更频繁发生。

6.通常将所有重复项都留存在HTGTS-Rep-seq分析中,而大多数先前的HTGTS应用并非如此。

7.IgBlast用于分析HTGTS-Rep-seq文库;因此,HTGTS-Rep-seq给出了抗原受体基因座内V使用、D使用和J使用的信息。

8.HTGTS-Rep-seq通道(使用IgBlast)提供关于分离的V(D)J外显子的生产性重排信息和非生产性重排信息。

9.HTGTS-Rep-seq通道提供关于分离的V(D)J外显子的CDR3信息。

10.HTGTS-Rep-seq通道提供关于一些V(D)J外显子的体细胞超突变信息,而在先前的应用分析通道中突变被忽略。

11.HTGTS-Rep-seq通道提供关于经测序的片段中的一个(V-J重组)或两个(V-D-J重组)含V接合的信息。

12.LAM-HTGTS通道提供关于经测序的片段中的D-J接合和RAG脱靶接合的信息。

13.HTGTS-Rep-seq可用于鉴别由序列读段相似性定义的克隆性谱系,以及鉴别未注释的V等位基因和/或区段。

关于HTGTS-Rep-seq,可使用300bp×2miseq测序。

实施例4:用于阐明抗体组库的高灵敏度且无偏的方法

发育中的B淋巴细胞经历V(D)J重组以将胚系V基因区段、D基因区段和J基因区段组装成编码免疫球蛋白(Ig)重(H)链和轻(L)链的抗原结合可变区的外显子。IgH链和IgL链缔合形成B细胞受体(BCR),所述B细胞受体在抗原结合后激活B细胞以分泌BCR作为抗体。大量克隆性的独立B细胞中的每一个表达独特的IgH可变区和IgL可变区的组。V(D)J重组生成广大原代B细胞组库的能力来自大量不同V区段、D区段和J区段的组合分类,加上它们之间生成用于抗原接触的互补决定区3(CDR3)的连结的多样化。深入评价初级抗体组库(primary antibody repertoires)的内容物以及最终研究它们如何由次级突变和亲和力成熟过程进一步塑造的方法对于B细胞发育、疫苗和抗体领域是非常重要的。本文描述了对抗体组库进行量化的无偏的、灵敏的且易于达到的分析(称为HTGTS组库测序(HTGTS-Rep-seq))。通过使用特异性J引物,HTGTS-Rep-seq量化地鉴别来自祖B谱系细胞和成熟小鼠B谱系细胞的绝大多数IgH V(D)J外显子和IgL V(D)J外显子,包括它们的独特CDR3序列。HTGTS-Rep-seq还在生产性构造或非生产性构造方面精确地量化了DJH中间体和V(D)J外显子。HTGTS-Rep-seq在人样品的研究(包括克隆性B细胞扩增)中有用,应该还在随后的抗体亲和力成熟过程中有用。

由适应性免疫系统的B细胞产生抗体,以清除多种病原体。体细胞基因重排过程(称为V(D)J重组)组装抗体基因区段以形成编码抗体的抗原结合区的序列。多数新生成的B细胞各自产生具有独特抗原结合序列的不同抗体;其共同形成个体的初级抗体组库。就利用特异性抗体治疗多种人疾病来说,阐明初级抗体组库的方法非常重要。本文描述了称为HTGTS-Rep-seq的对抗体组库高覆盖分析的新方法,所述方法是无偏的且灵敏度高。

引言

B淋巴细胞抗原受体(BCR)由相同的免疫球蛋白重(IgH)链和Ig轻(IgL)链组成。抗体是BCR的分泌形式。V(D)J重组过程将胚系V基因区段、D基因区段和J基因区段组装成编码BCR的抗原结合可变区外显子的外显子。RAG1和RAG2核酸内切酶(RAG)通过在V基因区段、D基因区段和J基因区段与它们的侧翼重组信号序列(RSS)之间生成DNA双链断裂(DSB)来启动V(D)J重组(1)。在该过程中,生成V编码末端、D编码末端和J编码末端作为必须打开的共价发夹,并且在通过经典的非同源末端接合进行接合之前所述编码末端经常被进一步加工(2)。V编码末端、D编码末端、J编码末端的加工可涉及在连结区域处产生核苷酸的缺失或***(2);包括通过V(D)J重组过程的末端脱氧核苷酸转移酶组成部分产生的常见的从头(denovo)添加核苷酸(3)。尤其是,V(D)J连结区编码抗体可变区的主要抗原接触区(称为互补决定区3(CDR3)),因此这些连结多样化过程对抗体多样性产生巨大贡献。

小鼠IgH基因座横跨2.7百万碱基(megabases,Mb)。在该IgH的数Mb的远端部分中存在数100种VH,其数量在某些小鼠品系中显著变化(4)。VH大约位于含有13种DH的50kb区域上游100kb处,其下游数kb紧跟着含有4种JH的2kb区域。IgH恒定区(CH)外显子位于该JH的下游。组装VHDJH外显子后,转录起始于VH的上游并终止于CH外显子的下游,而V(D)J和CH部分通过初级转录物的剪接融合到最终的IgH信使RNA(mRNA)中。由于随机连结多样化的机制,仅约1/3的组装的IgH V(D)J外显子能够产生读码框内剪接事件,所述读码框内剪接事件将V(D)J外显子和CH外显子置于同一阅读框中以产生编码IgH多肽的生产性(读码框内,且为功能性VH)重编码;其余为非生产性的(读码框外、读码框内但具有终止密码子、或利用假VH)(5)。IgL链可变区外显子仅由V区段和J区段组装,但是遵循与IgH的基本原理相似的基本原理。小鼠Igκ轻链基因座横跨3.2Mb,并在与下游5个Jκ相距20kb的3.1-Mb区域中具有数百种Vκ;而Igλ轻链基因座较小且较不复杂(6)。再次,RNA剪接将组装的VJL外显子与相应的CL外显子接合。

在B细胞发育期间,对V(D)J重组进行调控以确保特定的组库并防止不期望的重排。在发生IgL基因座的重组(其在前体B(pre-B)细胞中发生)之前,IgH V(D)J重组在祖B(pro-B)细胞中阶段特异性地发生。在将VH附加至DJH复合物之前,通常在两个等位基因上对IgH V(D)J重组进行排序,并发生D与JH接合(图11A)(2)。此外,利用生产性重排反馈调控IgH V(D)J重组的VH至DJH步骤,如果所述生产性重排仍处于DJH构造则导致另一等位基因上的V(D)J重组停止(2)。相反,初始的非生产性IgH V(D)J重排并不阻止VH与DJH重排在另一等位基因上发生。此类反馈调控通常导致在成熟B细胞中两个IgH V(D)J重排(一个生产性)与一个IgH V(D)J加上DJH重排相比为典型的40/60比(7)。同时对VH与DJH重排进行调控,以产生数百种上游VH的多样化利用。虽然近端的VH(尤其是最近端的VH(VH81X))在pro-B V(D)J重排中有些被过度利用,但使处于单独的染色体结构域中的DH和JH与VH的染色体结构域隔绝(8,9)加上基因座收缩(locus contraction)现象(10,11)允许利用甚至最远端的VH。随后,对pro-B细胞中稍有偏向的初级VH祖库实施细胞选择机制,以在新生成的B细胞中产生更正常化的初级组库(12)。

每种B细胞表达独特的BCR,并且每个个体小鼠或人具有在初级组库中产生多达1013以上种不同的BCR的能力(13),其中大部分通过IgH和IgL CDR3的连结多样化产生(14)。在这方面,量化地鉴别对初级抗体组库做出贡献的IgH和IgL可变区外显子的能力在阐明该组库对免疫应答和免疫疾病的贡献中极受关注(15)。已经开发了利用下一代测序的几个重要的组库测序分析。这些方法涉及由基因组DNA或mRNA生成组库文库(15)。大多数先前的基于DNA的方法依赖于使用上游简并V引物(其中各自被设计用于鉴别特定VH家族的成员)以及下游简并J引物;一种涵盖许多(但不一定是所有的)V(D)J外显子的方法,并且很可能并非全部均等。基于RNA的方法通常仅需要一种下游引物(来自J区或恒定区),因此避免了先前基于DNA的分析中的偏倚;但由于转录水平降低,这些方法可能会严重低估非生产性重排(15)。此外,5'RACE得到的互补DNA的长的长度也可能构成挑战,因为测序技术不能总是覆盖V(D)J外显子的整个长度。

本文所述的方法使用针对DSB相关诱饵序列的单引物,以跨诱饵-猎物连结进行线性扩增,从而以无偏的方式鉴别与诱饵DSB接合的全部猎物序列。由于V(D)J重组以在V区段、D区段和J区段的边界处的连结引发重排;在经历过V(D)J重组的祖淋巴细胞或前体淋巴细胞中,以及在用以回顾性鉴别发育早期发生的V(D)J重组事件的成熟淋巴细胞中,任何这些基因区段的引物都可以用作诱饵,以鉴别RAG引发的DSB的位点。尤其是,本文所述的方法鉴别出了RAG引发的DJH接合、删除环中的RSS接合、以及发育中B系细胞中由先前的分析未检测到的脱靶连结(22),说明了该分析的灵敏度高。

结果

LAM-HTGTS改编的组库测序的概述。对于HTGTS-Rep-seq文库,利用J区段的诱饵编码末端,以无偏的方式鉴别小鼠IgH DJH组库以及来自pro-B细胞和外周B细胞的生产性IgHV(D)J组库和非生产性IgH V(D)J组库。同样地,还对来自外周B细胞的小鼠生产性Igκ组库和非生产性Igκ组库进行了鉴别。对于所分析的所有样品,将从给定类型的B细胞池中分离的基因组DNA进行超声处理以产生平均大小约1kb的片段,因此预期其将具有IgH V(D)J或DJ重排,IgκVJ重排,或者未重排的JH或Jκ(图11B)。

退火至特定JH区段或Jκ区段的编码末端下游的序列的生物素化诱饵引物将允许线性扩增含有诱饵J区段的任何片段。随后如前所述进行链霉亲和素纯化步骤、衔接子连接步骤和文库构建步骤(16)(图11B)。为了产生更长的测序读段以更准确地比对V和D,将诱饵引物定位在更接近诱饵J的编码末端的位置,并使用MiSeq 2×300bp配对末端测序来捕获回收的接合处中的全长V(D)J序列。关于生物信息学分析,将LAM-HTGTS通道与IgBlast(23)组合以生成提供关于生产性连结或非生产性连结以及CDR3序列的全面信息的分析通道。

对于HTGTS-Rep-seq,由于如前所述的原因,可留存包括所有重复项在内的所有回收的连结用于分析(22)。为了控制实验差异,由同一的脾B细胞DNA样品生成3个技术重复的HTGTS-Rep-seq文库,由此产生相关系数(r)值为0.99的高度可重复的组库(表2)。即使对于来自3只不同小鼠的pro-B细胞或脾B细胞的生物学重复的IgH或IgL HTGTS-Rep-seq文库,相关性分析揭示出其为在大多数数据组中具有大于0.9的r值(表2和表3)的高度可重复组库。然而,如下所述,对此类文库的某些方面的详细分析(例如总组库中独特CDR3的分数)揭示了预期的生物学差异(表2)。

HTGTS-Rep-seq揭显了发育中的B细胞和成熟B细胞中的IgH VHDJH组库和IgH DJH组库

为了测试HTGTS-Rep-seq检测原代pro-B细胞IgH组库与外周B淋巴细胞IgH组库间的差异的能力,从骨髓中富集原代B220+CD43+IgM-pro-B细胞,并从野生型C57BL/6小鼠的脾中纯化B220+IgM+B细胞。使用从这些细胞群中分离的2μg基因组DNA,用JH4编码末端诱饵引物进行HTGTS-Rep-seq以捕获VHDJH4重排和DJH4重排(图7A;表2)。来自两种细胞类型的文库显示在整个IgH可变区基因座中VHDJH4重排中VH的广泛使用,其中一些VH被更频繁地利用(例如,VH5-2、VH2-2、VH3-6、VH1-26、VH1-64、VH1-72、VH1-81)(图7B)。C57BL/6IgH基因座具有大约110种潜在的功能性VH和74种伪VH(分为16个家族)(24)。在用JH4编码末端诱饵产生的IgH组库中,在VHDJH外显子中检测到来自所有16个家族的107种功能性VH,以及具有相对保守的RSS的21种伪VH(图17C)。尤其是,HTGTS-Rep-seq未检测到的三种“功能性”VH(VH1-62-1、VH2-6-8、VH7-2)也没有被另一种高通量组库测序方法发现(25),这表明它们在进行V(D)J重组的能力方面实际上可能是非功能性的。

VH与DJH重排发生在pro-B阶段,预期只有三分之一为读码框内(5)。在VHDJH4外显子中,HTGTS-Rep-seq鉴定平均65%为生产性的,相应地,35%为非生产性的(图7D)。该比例可能反映了动态分化过程,在该过程中具有两个非生产性重排的pro-B细胞被负选择,而在一个等位基因上具有生产性重排的pro-B细胞被正选择(12)。在很大程度上由于在pro-B细胞发育过程中产生性V(D)JH重排的反馈机制,大约40%的脾B细胞在两个等位基因上显示VHDJH重排(一个生产性的,一个非生产性的),剩下的60%具有一个生产性VHDJH重排和一个DJH重排(5)。因此,理论上预期脾B细胞群具有约71%的生产性VHDJH外显子和29%的非生产性VHDJH外显子。实际上,在来自脾B细胞DNA的HTGTS-Rep-seq文库中观察到非常类似的生产性VHDJH4外显子/非生产性VHDJH4外显子比(73:27)(图7D)。在HTGTS-Rep-seq揭示的DJH接合中,DH1-1(也称为DFL16.1)在来自pro-B细胞和脾成熟B细胞的文库中使用最频繁(图7E)。此外,在pro-B细胞中观察到比脾B细胞中高的多的DJH外显子百分比(45%vs.25%;图7E、图7F),与发育中的pro-B细胞的VH与DJH重排之前的两个等位基因上的D与JH重排一致(5,26,27)。

HTGTS-Rep-seq揭示的129SVE小鼠有偏向的近端VH使用。129SVE小鼠品系IgH基因座含有比C57BL/6IgH基因座更多的VH,并且结构有所不同(24)。鉴于129SVE小鼠和细胞系经常用于V(D)J重组研究,将相同的JH4诱饵引物也用于从129SVE骨髓pro-B细胞和脾B细胞生成HTGTS-Rep-seq文库(表3)。将129SVE IgH基因座VH序列中多至约1Mb注释成可变区VH,但是位于该基因座的相对大的较远端区域内的VH序列未完全注释。因此,为了产生接近的129SVE VHDJH组库,针对所有已知129SVE VH序列和从VH8-2开始的C57BL/6背景的有注释的远端VH序列的组合运行Igblast分析(图12A、图12B)。与C57BL/6文库一样,VH被广泛使用,并检测到15个VH家族的133个不同成员中的128种功能性VH和34种伪VH(图12C)。

与C57BL/6小鼠中的IgH VHDJH4组库相反,在129SVE小鼠中发现了高度偏向使用的近端VH,特别是VH5-2(也称为VH81X)和VH2-2(图7B、图12B)。pro-B细胞所有VHDJH4外显子中的9.5%(1.7%为生产性的;7.7%为非生产性的)以及129SVE小鼠脾B细胞所有VHDJH4外显子中的约4%(0.3%为生产性的;3.5%为非生产性的)使用D-近端VH5-2(图12B)。相反,在C57BL/6的富集的pro-B细胞和纯化的脾B细胞中,VH5-2分别仅以VHDJH4外显子的约3.5%(0.7%为生产性的;2.8%为非生产性的)和约1.8%(0.15%为生产性的;1.6%为非生产性的)出现(图7B)。与两个等位基因中的其它高度利用的VH(VH2-2、VH5-4、VH3-6、VH1-26、VH1-55、VH8-8、VH1-64、VH1-72、VH1-81)相比,脾B细胞中大多数含有VH5-2的VHDJH4的接合在两种小鼠品系中是非生产性的,与先前的报道一致:由于它们的自身反应性质或不能与IgL链或替代IgL链恰当配对,选择了最多的含有VH5-2的生产性重排(28-30)。作为VH5-2基因体,RSS和下游在C57BL/6与129SVE小鼠品系中是保守的,关于129SVE品系的初级库中VH5-2利用大大提高的基础仍有待确定。

129SVE pro-B细胞文库中VHDJH重排和DJH重排的比较还揭示了相对较低的生产性/非生产性VHDJH外显子的比(129SVE中为39:61,C57BL/6中为65:35),以及较低的VHDJH/DJH重排的比(129SVE中为约45:55,C57BL/6中为约55:45)(图7D-图7F;图12D-图12F)。VH5-2重排对这些差异没有实质性贡献。两个pro-B细胞文库均产生于4周龄小鼠,表明与C57BL/6pro-B细胞相比,129SVE中生产性VHDJH外显子较低的相对比例可能归因于这两个小鼠品系中B细胞检查点选择的差异时序。对于两个小鼠品系,脾B细胞文库显示出相当的生产/非生产性比和VDJ/DJ比(图7D-图7F;图12D-图12F)。

IgM+脾B细胞VHDJH外显子在不同JH中显示相似的VH使用谱。同样将诱饵引物设计用于IgH基因座中的其它三个JH和由C57BL/6和129SVE小鼠的脾B细胞制成的文库,以比较不同JH中VH和D的利用。这些分析揭示了四种不同JH的相似的VH和D利用组库,表明VHDJH接合中具体VH或D的选择在C57BL/6和129SVE小鼠中的JH之间没有显著变化(图8A,图13A)。然而,与JH1诱饵文库和JH4诱饵文库相比,使用JH2诱饵和JH3诱饵发现了更高比例的非生产性VHDJH重排(图8A,图13A)。在这方面,在JH2区段和JH3区段中从JH编码末端到对于稳定抗体结构至关重要(24)的高度保守WGXG基序的序列段相对于JH1区段和JH4区段更短(图14A)。因此,一些VHDJH2和VHDJH3接合位点可能太过靠近WGXG编码序列,并可能由于不稳定的抗体结构而被选择(图14B)。此外,在四个JH的DH使用谱中观察到中度差异,并且JH4诱饵文库中VHDJH:DJH的比较大,这可能潜在地反映了这些JH在启动V(D)J重组的重组中心中的相对位置(31)(图8B、图8C,和图13B、图13C)。最后,用组合的四组JH HTGTS-Rep-seq引物从129SVE脾B细胞制备HTGTS-Rep-seq文库(图15A,表3)。这种方法(其允许我们检测一个HTGTS-Rep-seq文库中的所有VHDJH1-VHDJH4外显子)揭示了与用单个JH的引物检测到的V(D)J组库类似的整体V(D)J组库(图15与图13)。

HTGTS-Rep-seq检测不同的IgκVJ重排。在小鼠中,Igκ基因座产生大部分表达IgL的B细胞(32)。Vκ基因座结构不同于VH基因座的结构。除了不具有D区段并且因此经历Vκ与Jκ直接重排之外,Vκ基因座包含以相对于Jκ区段正向方向和反向方向组织的V区段(6)(图9A)。因此,对于一些Vκ而言,像VH与DJH的接合一样,与Jκ的接合删除性发生,但对于其它的Vκ,它通过介于中间的序列(intervening sequence)的反转而发生。正向和反向Vκ通常出现在不同的簇(clusters)中,但也可单独散布(图9A)。为了首先评估Igκ组库,使用Jκ5编码末端诱饵引物在来自C57BL/6脾B细胞的1μg基因组DNA上进行HTGTS-Rep-seq。与IgH基因座相似,在整个基因座至Jκ中也观察到Vκ的广泛使用(图3A,图3B)。通过HTGTS-Rep-seq检测到20个Vκ家族的所有100种功能性Vκ,并且还检测到62种伪Vκ中的11种(图9C)。我们看到脾B细胞中生产性/非生产性VJκ接合的比为63:37(图9B),略低于预测的比67:33(33)。这一小偏差可能反映了在Igλ阳性细胞中存在非生产性VJκ接合(32)。

还由脾B细胞DNA产生HTGTS-Rep-seq文库,分别地或以所有4种Jκ引物的组合捕获来自三个其它功能性Jκ区段的VJκ接合。与用不同JH引物得到的IgH组库相比,Igκ组库显示出在不同的Jκ诱饵之间一些Vκ(例如Vκ6-15、Vκ6-23、Vκ19-93、Vκ10-96、Vκ1-135)明显不同的利用。此外,其它Jκ引物文库的生产/非生产比略低于用Jκ5引物观察到的情况(Jκ1:53:47;Jκ2:60:40;Jκ4:53:47;Jκ5:63:37)(图16)。利用和比例的这些差异可能反映了序贯VJκ重组事件的发生(34)。在这种背景下,含有与Jκ5上游三个Jκ的非生产性VJκ接合的等位基因具有使非生产性VJκ上游的未重排Vκ与剩下的Jκ接合的能力(34)。如果这种次级重排是反向的,则非生产性VJκ接合将保留在基因组中并添加到HTGTS-Rep-seq检测到的VJκ1、VJκ2或VJκ4接合的非生产性部分中。鉴于这种情况,如本文所述,预期VJκ5重排(其为末端重排事件)将反映理论生产/非生产比。

HTGTS-Rep-seq揭示了特征性CDR3性质。对来自pro-B细胞和脾脏B细胞中的生产性VHDJH重排和VJκ重排的CDR3序列进行分析。pro-B细胞和脾B细胞中生产性VHDJH外显子的CDR3显示出3个至24个氨基酸(aa)的多种长度范围,峰值为11aa-15aa(图17A,图17B)。来自未免疫的pro-B细胞和脾B细胞的由独特亚组制成的这些VHDJH外显子的共有CDR3基序享有如所预期的相同的VH贡献的aa序列和JH4贡献的aa序列(图17A,图17B)。鉴于JH2的基因体和JH3的基因体短于JH1的基因体和JH4的基因体,VHDJH2外显子和VHDJH3外显子的平均长度短于VHDJH1外显子和VHDJH4的平均长度(中位长度11aa vs 13aa)(图17C)。与生产性VHDJH外显子相反,来自脾B细胞的约85%的生产性VJκ外显子显示CDR3长度为9aa。VJκCDR3基序还显示出预期的侧翼半胱氨酸和苯丙氨酸(图17D)。因此,HTGTS-Rep-seq产生具有预期的来自多种诱饵基因座的CDR3特征的序列。

HTGTS-Rep-seq可利用少量的起始材料。用2μg、500ng和100ng的起始DNA量(各自从同一C57BL/6小鼠的脾B细胞中纯化得到)由JH4编码末端诱饵产生文库。由2μg和500ng基因组DNA产生的文库在VH使用和生产性/非生产性重排比方面几乎相同(r>0.97)(图10A,图10B;表2)。尽管从100ng基因组DNA产生的文库中检测到的VH数量略有下降,但它们仍显示出相似的组库谱(r=约0.8)和生产性/非生产性比(图10A,图10B),证明了HTGTS-Rep-seq可用于从少至20,000个B细胞产生非常有代表性的VHDJH组库文库。

通过比较独特CDR3序列的百分比,在这些滴定的文库中进一步评价V(D)JH连结多样性(35)。发现含有独特CDR3序列的V(D)J外显子的比例随着起始材料量的减少而显著降低(图18A),表明较高的DNA起始材料量允许检测到的高度多样化的IgH CDR3组库的部分较大。虽然测序错误在理论上可能导致对CDR3多样性的轻微高估,但这些样品中如此之高的庞大CDR3生物多样性,以至于在3个技术重复的2μg DNA文库之间在所检测的V(D)JH CDR3序列中观察到非常小的重叠部分(<1%),并且在500ng或100ng DNA文库重复亚组中甚至更少(图18B)。因此,就VH使用而言,100ng DNA足以产生代表性的V(D)JH文库,但即使是2μg的DNA也仅揭示出极小部分的极其多样性的IgH CDR3。

讨论

HTGTS-Rep-seq是仅需要单个诱饵PCR引物的基于DNA的方法,读出缺失的和倒转的V(D)J接合(deletional and inversional V(D)J joins),并且可以容易地适于鉴别先前的组库测序分析看不到的低频重组事件(22)。此外,HTGTS-Rep-seq可用于全面研究生产性和非生产性V外显子的使用。HTGTS-Rep-seq也可用于发展地评估V(D)J中间体的频率,最突出的是量化鉴别特定DJH重排的频率(22)(图7E,图7F)。HTGTS-Rep-seq也可适于通过将个体D或V用作诱饵来揭示个体D或V的接合模式。因此,该分析或其改编可用于检测在发育过程中或免疫应答过程中发生的组库变化。

HTGTS-Rep-seq需要少至100ng来自小鼠脾B细胞的基因组DNA(并且可能更少)以捕获代表性VH使用谱。因此,该技术可以应用于相对较少数量的细胞并产生精确的组库谱。在一些实施方式中,本文所述的方法可包括富集经超声处理的DNA片段(例如,含有恰好在整个Jκ区下游的序列的DNA片段)的初始步骤。

通过HTGTS-Rep-seq使用仅利用单个J引物或J引物组进行的线性扩增的能力消除了使用先前的基于DNA的组库测序方法所需的简并V引物组(以及J引物)的必要性,这些方法可能导致不同V家族或家族内不同V的不同扩增效率(15)。基于DNA,HTGTS-Rep-seq还通过量化捕获群体中Ig重排的频率而不管它们的表达水平如何或者它们是生产性的还是非生产性的,绕过了基于RNA的方法的主要局限。当前用于解决由于多重PCR或细胞之间不同表达水平引起的偏差的手段包括使用通用标识符(25,36,37)或单细胞方法(38),但HTGTS-Rep-seq可精确地鉴别群体组库谱,而无需关于合成具有随机条形码的引物或者分选单个细胞的额外成本或步骤。

令人惊讶的是,在对3个技术重复各自的约15,000种独特V(D)J重排进行测序的实验中,发现独特CDR3序列的重叠小于1%,强调了该方法的灵敏度很高。这种高度灵敏的HTGTS-Rep-seq方法可以很容易地适用于人样品。在这方面,HTGTS-Rep-seq的灵敏度提供了一种低成本且快速的方法来鉴别克隆性重排(clonal rearrangements)(甚至是DJH重排),这可诊断在某些免疫系统疾病(包括癌症)中发生的克隆性B或T淋巴细胞扩增。最后,在我们的文库中,大约三分之一的接合序列覆盖了大约370bp V(D)J外显子的整个长度,使得HTGTS-Rep-seq适用于追踪在免疫应答中抗体亲和力成熟期间B细胞组库中出现的特定V(D)J外显子的优势群体,包括特定的CDR。随着高通量测序技术的进步,该应用可得到增强,以实现更大的长度和更高的精度。

材料和方法

小鼠。野生型129SVE小鼠和野生型C57BL/6小鼠购自Charles RiverLaboratories International。所有动物实验均在波士顿儿童医院的机构动物护理和使用委员会批准的方案下进行。

从骨髓和脾中分离B细胞。骨髓来源的pro-B(B220+IgM-CD43+)细胞从129SVE纯化或通过分选并在红细胞耗尽后从C57BL/6小鼠富集。用B220-APC、CD43-PE和IgM-FITC抗体对单细胞悬浮液进行染色。使用生物素/链霉亲和素珠方法纯化脾静息B细胞(B220阳性选择(Miltenyi#130-049-501))或EasySepTM CD43-阴性B细胞选择(Stem CellTechnologies#19754)。

HTGTS-Rep-Seq。如(16)所述进行HTGTS-Rep-seq。引物列于表1。对于DJH接合分析,使用标准LAM-HTGTS生物信息学通道(16)。对于VHDJH和VJκ鉴别,使用ea-utils套件(code.google.com/p/ea-utils/)中的fastq-multx工具对MiSeq读段进行解复用,并用cutadapt软件(code.google.com/p/cutadapt/)修剪衔接子。然后,使用来自ea-utils套件的fastq-join工具将配对的读段接合(重叠区域≥10bp和错配率≤8%)。然后,将读段分组为接合的读段和未接合的,并在以下分析中分别分析。使用默认参数,针对V(D)J基因数据库使用接合的读段和未接合的读段来利用Igblastn(23)。V(D)J基因序列从IMGT(24)获得,经人工臻选,并用于生成Igblastn序列数据库。应用多种严格性来过滤可比对至V基因、D基因、J基因的读段(igblast得分>150,总比对长度>100,总错配率<0.1)。在未接合的读段中,R1读段和R2读段中鉴别的排名居前的V基因必须匹配。可以基于处理的igblast结果来计算V基因的使用。开发了名为“HTGTSrep”的通道来执行上述处理和分析,可以在Bitbucket下载(bitbucket.org/adugduzhou/htgtsrep)。测序和处理的数据存入GEO数据库GSE82126。

参考文献

1.Teng G,Schatz DG(2015)Regulation and Evolution of the RAGRecombinase.Adv Immunol 128:1-39.

2.Alt FW,Zhang Y,Meng F-L,Guo C,Schwer B(2013)Mechanisms ofprogrammed DNA lesions and genomic instability in the immune system.Cell 152(3):417-429.

3.Alt FW,Baltimore D(1982)Joining of immunoglobulin heavy chain genesegments:implications from a chromosome with evidence of three D-JH fusions,Proc Natl Acad Sci USA 79(13):4118-4122.

4.Retter I,et al.(2007)Sequence and characterization of the Ig heavychain constant and partial variable region of the mouse strain 129S1.JImmunol 179(4):2419-2427.

5.Yancopoulos GD,Alt FW(1986)Regulation of the assembly andexpression of variable-region genes.Anmu Rev Immunol 4:339-368.

6.Proudhon C,Hao B,Raviram R,Chaumeil J,Skok JA(2015)Long-RangeRegulation of V(D)J Recombination.Adv Immunol 128:123-182.

7.Jung D,Giallourakis C,Mostoslavsky R,Alt FW(2006)Mechanism andcontrol of V(D)J recombination at the immunoglobulin heavy chain locus.AnmuRev Immunol 24:541-570.

8.Guo C,et al.(2011)CTCF-binding elements mediate control of V(D)Jrecombination.Nature 477(7365):424-430.

9.Lin SG,Guo C,Su A,Zhang Y,Alt FW(2015)CTCF-binding elements 1and2in the Igh intergenic control region cooperatively regulate V(D)Jrecombination.Proc Natl Acad Sci USA 112(6):1815-1820.

10.Fuxa M,et al.(2004)Pax5 induces V-to-DJ rearrangements and locuscontraction of the immunoglobulin heavy-chain gene.Genes Dev18(4):411-422.

11.Jhunjhunwala S,et al.(2008)The 3D structure of the immunoglobulinheavy-chain locus:implications for long-range genomic interactions.Cell 133(2):265-279.

12.Melchers F(2015)Checkpoints that control B cell development.J ClinInvest 125(6):2203-2210.

13.Granato A,Chen Y,Wesemann DR(2015)Primary immunoglobulinrepertoire development:time and space matter.Curr Opin Immunol 33:126-131.

14.Schroeder HW,Zemlin M,Khass M,Nguyen HH,Schelonka RL(2010)Geneticcontrol of DHreading frame and its effect on B-cell development and antigen-specifc antibody production.Crit Rev Immunol 30(4):327-344.

15.Georgiou G,et al.(2014)The promise and challenge of high-throughput sequencing of the antibody repertoire.Nat Biotechnol32(2):158-168.

16.Hu J,et al.(2016)Detecting DNA double-stranded breaks in mammaliangenomes by linear amplification-mediated high-throughput genome-widetranslocation sequencing.Nature Protoc 11(5):853-871.

17.Chiarle R,et al.(2011)Genome-wide translocation sequencing revealsmechanisms of chromosome breaks and rearrangements in B cells.Cell 147(1):107-119.

18.Frock RL,et al.(2015)Genome-wide detection of DNA double-strandedbreaks induced by engineered nucleases.Nat Biotechnol33(2):179-186.

19.Meng F-L,et al.(2014)Convergent transcription at intragenic super-enhancers targets AID-initiated genomic instability.Cell 159(7):1538-1548.

20.Wei P-C,et al.(2016)Long Neural Genes Harbor Recurrent DNA BreakClusters in Neural Stem/Progenitor Cells.Cell 164(4):644-655.

21.Dong J,et al.(2015)Orientation-specific joining of AID-initiatedDNA breaks promotes antibody class switching.Nature 525(7567):134-139.

22.Hu J,et al.(2015)Chromosomal Loop Domains Direct the Recombinationof Antigen Receptor Genes.Cell 163(4):947-959.

23.Ye J,Ma N,Madden TL,Ostell JM(2013)IgBLAST:an immunoglobulinvariable domain sequence analysis tool.Nucleic Acids Res 41(Web Serverissue):W34-40.

24.Lefranc M-P,et al.(2015)

Figure BDA0002230788130000671

the international ImMunoGeneTicsinformation

Figure BDA0002230788130000672

25years on.Nucleic Acids Res 43(Database issue):D413-22.

25.Khan TA,et al.(2016)Accurate and predictive antibody repertoireprofiling by molecular amplifi cation fingerprinting.Sci Adv 2(3):e1501371-e1501371.

26.Alt FW,et al.(1984)Ordered rearrangement of immunoglobulin heavychain variable region segments.EMBO J 3(6):1209-1219.

27.Daly J,Licence S,Nanou A,Morgan G,

Figure BDA0002230788130000681

I-L(2007)Transcriptionof productive and nonproductive VDJ-recombined alleles after IgH allelicexclusion,EMBO J 26(19):4273-4282.

28.Yancopoulos GD,et al.(1984)Preferential utilization of the mostJH-proximal VH gene segments in pre-B-cell lines.Nature 311(5988):727-733.

29.Malynn BA,Yancopoulos GD,Barth JE,Bona CA,Alt FW(1990)Biasedexpression of JH-proximal VH genes occurs in the newly generated repertoireof neonatal and adult mice.J Exp Med 171(3):843-859.

30.Boekel ten E,Melchers F,Rolink AG(1997)Changes in the V(H)generepertoire of developing precursor B lymphocytes in mouse bone marrowmediated by the pre-B cell receptor,Immunity 7(3):357-368.

31.Schatz DG,Ji Y(2011)Recombination centres and the orchestration ofV(D)J recombination.Nat Rev Immunol 11(4):251-263.

32.Gorman JR,Alt FW(1998)Regulation of immunoglobulin light chainisotype expression.Adv Immunol 69:113-181.

33.Mostoslavsky R,Alt FW,Rajewsky K(2004)The lingering enigma of theallelic exclusion mechanism.Cell 118(5):539-544.

34.Melchers F,Boekel ten E,Yamagami T,Andersson J,Rolink A(1999)Theroles of preB and B cell receptors in the stepwise allelic exclusion of mouseIgH and L chain gene loci.Semin Immunol 11(5):307-317.

35.Pieper K,Grimbacher B,Eibel H(2013)B-cell biology anddevelopment.J Allergy Clin Immunol 131(4):959-971.

36.Vollmers C,Sit RV,Weinstein JA,Dekker CL,Quake SR(2013)Geneticmeasurement of memory B-cell recall using antibody repertoire sequencing.ProcNatl Acad Sci USA 110(33):13463-13468.

37.Egorov ES,et al.(2015)Quantitative profiling ofimmune repertoiresfor minor lymphocyte counts using unique molecular identifiers.J Immunol 194(12):6155-6163.

38.Sundling C,et al.(2014)Single-cell and deep sequencing of IgG-switched macaque B cells reveal a diverse Ig repertoire followingimmunization.J Immunol 192(8):3637-3644.

表2-来自C57BL/6小鼠的HTGTS-Rep-seq文库的VDJH接合分析的总结。

Figure BDA0002230788130000691

Figure BDA0002230788130000701

&小鼠1、小鼠2、小鼠3意思是由三只不同的小鼠进行实验;重复1、重复2、重复3意思是使用来自同一小鼠的DNA进行实验。

*相关系数值(r)通过excel中的CORREL函数从两组生产性V(D)J外显子(%)得到。值越大,两组数据越相似。

表3来自129SVE小鼠的HTGTS-Rep-seq文库总结

Figure BDA0002230788130000721

实施例5:HTGTS-V(D)J SHM-seq揭示了对在派伊尔氏结生发中心B细胞中产生的抗体组库性质的见解

B淋巴细胞通过两种主要机制使其抗原受体组库变得多样化:V(D)J重组和SHM1。V(D)J重组发生在骨髓中,并涉及胚系V区段、(D)区段和J区段的组合装配,以及它们之间产生用于抗原接触的互补决定区3(CDR3)的连结的多样化1。在抗原激活的生发中心B细胞2中,活化诱导的胞苷脱氨酶(AID)引发的SHM在整个V(D)J序列中的短热点基序(short hotspot motif)上引入点突变3。一旦驻存于卵泡中的初始B细胞被抗原激活,它们迁移到滤泡间区域以与同源T细胞(cognate T cells)相互作用,导致这些B细胞的完全激活和T细胞的T滤泡辅助(TFH)细胞表型的获得。具有相对高抗原亲和力的TFH细胞和B细胞随后迁移回到卵泡中心,以播种GC的形成2,4。在GC内部,B细胞在暗区域经历快速增殖和SHM,并且通过抗原呈递滤泡树突细胞(FDC)和TFH细胞进入明区以待被选择5,在所述明区中具有改善的抗原结合亲和力的B细胞被阳性选择以重新进入暗区,而亲和力降低的B细胞或具有失活的B细胞受体(BCR)的B细胞被阴性选择以经历凋亡。这两个区域之间的再循环有利于反复多轮的B细胞增殖、SHM和选择,导致BCR克隆性扩增以及亲和力成熟。使被选择的B细胞也经历AID引发的类别转换重组(class switch recombination,CSR)以改变它们产生的抗体类别,并最终可分化成浆细胞和记忆B细胞。

与全身性次级淋巴组织不同,派伊尔氏结(PP)是肠道相关淋巴组织(GALT),在没有特异性免疫或病原体感染的情况下具有组成型GC活性6。这些GC高度依赖于肠道微生物组,因为无菌小鼠拥有小得多的PP和最低的GC B细胞7,8。与其它位点的常规GC一样,PP GC对共生细菌的应答是强的T细胞和CD40依赖性的9,10。然而,一些研究表明,PP中诱导和维持GC应答的抗原识别要求可能不如其它淋巴组织中严格。在携带EBV LMP2A基因以代替其内源免疫球蛋白重链(IgH)基因的小鼠(其保持了BCR途径信号转导,但不产生真正的BCR)中,GC能够在PP中形成但在脾中不能形成。在具有独特的预重排VDJ敲入(编码4-羟基-3-硝基苯基乙酰基(NP)-特异性重链)的小鼠中,检测到正常量的来自PP的GC B细胞,并且VH外显子以内在的模式含有广泛的SHM12

上述发现提出了以下问题:通过SHM和/或基因转换,在小鼠和人中PP GC是否能如在鸡、绵羊和兔子中所示以抗原非特异性方式作为抗体多样化位点13-15。另一方面,发现在C57BL/6小鼠中用缀合有霍乱毒素的NP-半抗原(NP-CT)反复口服免疫在生成寡克隆和亲和力成熟的NP特异性抗体的PP中刺激出强烈的GC应答16,表明小鼠PP GC可以以常规的BCR依赖性方式起作用。尚不清楚NP-CT的口服免疫是否诱发与由肠道微生物组衍生的抗原引起的GC应答相同类型的GC应答。然而,转基因小鼠研究受其解释范围局限。因此,GC如何形成和在PP B细胞中如何起作用以及它们在缺乏特异性免疫的情况下产生的B细胞受体/抗体(可能是对肠道微生物组的应答)仍然是该领域中最令人感兴趣的问题。为了在具有完整的初级V(D)J组库的WT C57BL/6小鼠中解决免疫学领域中的这个主要问题,本文描述了研究的自发PP GC的SHM和BCR V(D)J组库的高通量组库测序(即HTGTS-V(D)J SHM-seq),其灵敏度足以分析来自单个PP的GC的组库,包括所涉及的IgH链和IgL链的完整SHM;并将它们与对免疫应答的脾GC B细胞的结果进行比较。

总结

为了阐明脾或PP生发中心B细胞的生理性抗体组库并认识可能选择它或使其成熟的机制,开发了高通量抗体组库测序分析(HTGTS-V(D)J SHM-seq),该分析的灵敏度足以密切关注脾B细胞抗原特异性应答并阐明PP GC B细胞中目前的SHM模式、CDR3、和V使用的完整IgH库和IgL组库。使用来自通用初始B细胞组库的C57BL/6小鼠PP样品和脾样品,并从中选择所有组成细胞(repertoire cells)以不同方式形成GC组库。在PP GC中,在小鼠甚至个体PP中观察到特异性VH和克隆型选择,但是其显示出广泛的体细胞超突变(SHM)模式,所述模式在没有特异性抗原选择的情况下主要表现为内在SHM靶向模式。对于在PP GC中发生的这种受限BCR选择,AID不是必需的,但确实影响选择的VDJ的频谱。

进一步显示,关于PP GC中的Igκ轻链组库,发生了类似的现象。来自相同或不同小鼠的个体PP的GC中优势IgH和IgL克隆型的比较允许以下推断:可能被一起选择的成对的特异性IgH和IgL链形成所选择的BCR以及由此而来的特异性抗体。这些发现表明,对小鼠慢性(chronic)PP GC中携带特定稀有BCR的B细胞有很强的选择,这与BCR代表具有序列内在亲和力成熟的“先天性PP BCR(innate PP BCR)”的有趣可能性一致,这可能有助于它们识别肠道抗原。

该新方法可应用于在健康或肠疾病背景下的人PP。由于可以鉴别这些稀有抗体,因此可通过产生被发现的特定抗体以对它们的靶特异性进行分析并进一步确定它们的生物学活性,来将小鼠研究扩展开来。组库测序方法的新修改还允许密切关注用设计用于诱导产生广泛中和抗体的抗原疫苗接种后的HIV小鼠疫苗接种模型中的免疫应答。此外,数据表明PP应答发生在微生物群或食物抗原的背景下。

结果

HTGTS-V(D)J-SHM-seq的概述

除了V使用和CDR3组库之外,HTGTS-V(D)J SHM-seq提供了整个Ig重链和Ig轻链的组库中的全长V(D)J SHM谱。该方法高度无偏,因为它是基于DNA的并且使用仅利用J区段引物进行的线性扩增。对于来自经超声处理的基因组DNA(例如来自GC B细胞)的IgH组库(图24),使用混合的生物素化的JH1、JH2、JH3、JH4诱饵引物线性扩增所有VDJ连结。然后,如前所述17,18,将扩增产物用链霉亲和素珠富集并标记以用于基于Illumina MiseqTM的下一代测序。

为了捕获所回收的连结中的全长V(D)J序列以用于SHM分析,将诱饵引物定位至最接近JH的编码末端的位置,并使用MiSeq 2×300-bp配对末端测序。JH1-4引物选自高度退化的区域(图25A),因此它们的使用反映了JH1-4 VDJ连接的真实组成。在这方面,使用具有人VH1-2(hVH1-2)(其取代了具有IGCR1缺失的小鼠VH81X)的小鼠模型,使得hVH1-2在成熟脾B细胞组库中占VH使用的一半19,其中从hVH1-2诱饵制做文库以确定hVH1-2DJ连结中各JH的比例,并与由混合的JH1-4诱饵制成的文库进行比较(图25B)。

来自两种诱饵的JH比例匹配非常好,相关系数r=0.94。同样地,也对混合的JK和JL引物进行了优化,用于以真正无偏的方式分析IgL组库。通过分析同一PP GC样品的IgH组库和IgL组库,可鉴别重链和轻链V(D)J序列(图28A,图28C),因此HTGTS-V(D)J SHM-seq是能够鉴别新的潜在生理学重要的肠道产生抗体的发现方法。还优化了实验条件以将所需的细胞数量最小化至数万,因此可在来自单个PP的GC上进行分析。

表5

Figure BDA0002230788130000761

修改生物信息学通道以实施更严格的过滤器,从而确保用于SHM分析的连结读段的质量控制,并纳入包括SHM剖析、克隆聚类、突变选择和谱系树等在内的全面下游分析(图24)。与基于mRNA的组库测序方法(其受转录水平影响)不同,HTGTS-V(D)J SHM-seq方法使用DNA作为模板,并给出了生产性和非生产性VDJ接合的精确测量结果17。通过从多个样品中获取非生产性VDJ序列,生成了关于几乎所有小鼠VH的内在突变模式数据库,这极大地促进了GC应答中的SHM选择分析。

NP诱导的脾GC IgH组库

为了证实HTGTS-V(D)J SHM-seq对特异性免疫应答密切关注,使用充分表征的免疫原:与鸡γ球蛋白缀合的NP(NP-CGG)。用NP-CGG腹膜内(IP)免疫C57BL/6小鼠,以刺激脾GC应答。免疫后10天收集脾,并通过FACS分选B220+GL7+CD38-GC B细胞和B220+GL7-CD38+非GC B细胞,并由这两个群体构建HTGTS-V(D)J SHM-seq文库。为了获得更纯的GC B细胞和初始B细胞的群用于分析以及消除FACS分选过程中潜在的交叉污染,通过将B220+GL7+CD38-样品的突变读段保留为GC B细胞并将B220+GL7-CD38+样品的非突变读段保留为幼稚B细胞来进一步过滤Miseq读段。通过比较来自脾GC B细胞和初始B细胞的IgH组库,可检测生产性VDJ连结中显著的VH1-72(V186.2)GC富集(图19A),其为由早期研究鉴定出的NP抗体所使用的优势VH 20-22。克隆分析显示VH1-72连结内的前两个优势克隆型作为居首的克隆为所分析的所有三只小鼠所共享(图19B),表明了脾GC中的强BCR选择。两种克隆型均含有DH1-1(DFL16.1)和JH2(关于NP应答所报道的优势D区段和J区段20-22),其具有不同的CDR3长度:分别为33nt和36nt(图19B)。

此外,还检测到位于第98位的VH1-72中的点突变的显著选择,所述点突变编码CDR1中的Trp至Leu变化(图19C),这是NP亲和力增加的标志23。注意,早在NP-CGG免疫后第10天,传统的PCR分析未鉴别出该点突变22,24。同样地,通过比较脾GC B细胞与初始B细胞的IgL组库,检测到生产性VDJ连结处中VL1的显著GC富集(图19D),该VL为早期研究鉴别出的NP抗体使用的优势VL 20-22。因此,使用HTGTS-V(D)J SHM-seq,可在免疫后相当早期阶段鉴别脾中NP特异性BCR选择的所有已知特征25,证明该分析具有可密切关注体液免疫应答的前所未有的灵敏度,以及其精确鉴别关于不典型免疫原的抗原特异性特征的潜在能力。

PP和脾的共享的初始组库

在相同的NP-CGG IP免疫小鼠中,还从每只小鼠中解剖出小肠中的所有PP,并通过FACS分离B220+GL7+CD38-GC B细胞和B220+GL7-CD38+非GC B细胞。使用HTGTS-V(D)J SHM-seq,对来自PP的初始B细胞和GC B细胞的IgH组库进行测量,并与脾的初始B细胞和GC B细胞IgH组库进行比较。引人注目的是,PP和脾初始B细胞的VH组库在所有三只小鼠中是相同的(图20A),相关系数为r=0.99,表明初始B细胞在这些组织之间循环。与此相符,一项使用光转换技术在三天内跟踪内源性PP B细胞运动的研究发现PP和脾脏之间存在明显的初始B细胞交换26。此外,不同小鼠中稳定的初始B细胞VH组成(由微小误差棒所反映,图20A)表明在所有小鼠中使用共同的基线IgH组库(a common baseline IgH repertoire)。

相反,在各小鼠中PP的GC VH组库与脾的GC VH组库非常不同(图20B,图26A),相关系数(r=0.56)低。如从免疫途径所预期的,在PP GC中未检测到NP特异性选择。具体而言,在两只小鼠中PP GC中的VH1-72使用是最小的,并且与初始B组库相比在第三只中富集(图26A)但在98位没有增加NP结合亲和力的关键突变(图26B)。因此,PP GC和脾脏GC响应于不同的刺激源。虽然脾GC VH组库在不同的NP-CGG免疫小鼠中仅略有不同,但PP GC VH组库在小鼠与小鼠之间变化很大(图20B,图26A),表明PP GC组库由似乎在共同饲养的小鼠之间是波动的多种抗原的池形成,所述抗原可能是共生菌群相关抗原。或者,可通过抗原非特异性BCR多样化来解释,如来自鸡、绵羊和兔子的PP GC中的情况13-15

VDJ选择是PP GC应答的基础

鉴于小鼠中PP GC组库相对大的变化,为了理解克隆选择是否在PP GC形成和功能中起作用,分析了来自另外六只首次用于实验的小鼠的PP组库。由于NP-CGG IP免疫不刺激PP GC应答,NP-CGG免疫的小鼠与六只首次用于实验的小鼠都包含在内,以用于分析PP GC与初始IgH组库。如果在PP GC中没有BCR依赖性克隆选择,预期每只小鼠的VH随机富集,因此来自9只小鼠的平均VH组库将类似于共有的初始B细胞组库。然而,PP GC和初始VH组库之间的相关系数低(r=0.65),其中若干VH(VH1-47、VH11-2、VH6-6、VH6-3)显著富集(图21A,图27A)。注意,VH1-47和VH11-2几乎不存在于初始组库中,在PP GC组库中的它们的使用分别平均增加14.3倍和43.6倍。VH6-6和VH6-3的频率上升了5.2倍和2.6倍。具体地,VH1-47在四只小鼠中大大富集,并且它的居首的克隆型(包含DH2-1、JH4和36-nt CDR3)为三只小鼠所共享(图21B)。VH11-2在四只小鼠中富集,其中前两种克隆型各自由两只小鼠共享(图27B)。因此,强的BCR依赖性克隆选择是PP中GC应答的基础。

该选择不依赖于AID(图21C),其在GC B细胞中特异性表达27,并且AID缺乏导致小鼠和人中SHM和CSR28,29的缺陷。PP中的CSR优先产生IgA抗体30,保护肠粘膜系统的主要Ig同种型。在AID-/-小鼠中,与初始组库相比,PP GC的VH组库仍是高度可变(r=0.51)(图21C,图28A),具有显著选择的VH1-15,它的居首的克隆型为所分析的所有三只小鼠共有(图21D)。该克隆型含有33-nt CDR3和JH1以及数种可能的DH。因此,PP GC中的克隆选择可以在缺乏SHM或CSR的情况下发生。注意,AID-/-小鼠的PP GC中的VDJ选择模式看起来与WT小鼠的不同,即使它们共享相同的初始组库(r=0.98)(图28B)。据报道,AID缺乏导致PP中的GC增生,以及小肠中的厌氧菌群扩增100倍31,32。在这方面,WT和AID-/-PP GC B细胞的不同克隆型模式可能反映了它们肠道菌群组成的已知差异。

局部抗原形成单个PP GC池

C57BL/6小鼠一般存在6-12个PP,沿着小肠的长度分布33。众所周知,肠道菌群的组成在胃肠(GI)道的不同位置处改变,上部肠中有更多的好氧物种,而下部肠和大肠中聚集厌氧菌31。例如,发现分节丝状细菌(segmented filamentous bacteria,SFB)沿胃肠道从近端到远端方向逐渐增加34。为了了解PP GC应答是否受局部共生细菌的影响,使用HTGTS-V(D)J SHM-seq方法观察来自同一小鼠中各个PP的GC B细胞组库和初始B细胞组库(图22A)。尽管它们具有相同的初始组库,在五个连续的单个PP中总体GC VH组成是高度可变的(图22B)。然而,发现数种VH在多于一种PP中富集:PP3和PP5中的VH1-47,PP5和PP6中的VH1-15,PP6和PP7中的VH1-82和VH1-12(图22B),证实了PP GC中的抗原特异性BCR选择。观察到关于该种选择的距离效应,其中VH1-47主要用于更近端的PP,VH1-15、VH1-82和VH1-12大多参与远端PP,可能与沿着小肠的微生物群物种的变化相关。

有趣的是,PP3和PP5共享用于生产性VH1-47(A)和非生产性VH9-3(B)的常用克隆型(图22B)。在PP3或PP5中A和B的频率相等,表明它们是来自相同BCR克隆的两个等位基因,所述BCR克隆在PP之间循环并且在这两个PP中针对某些抗原得到选择。这是同一小鼠中PP之间B细胞交换的有力证据。为了支持这一观点,通过光转化实验报道了初始B细胞和记忆B细胞在PP中循环26。因此,本文证明了在PP中BCR依赖性GC选择在来自不同小鼠的整个PP和来自相同小鼠的单个PP的水平上发生。

选择的BCR累积内在SHM

使用小鼠VB1-8 VDJ IgH外显子,在PP GC中VH外显子突变而没有选择12。该发现提出了有趣的可能性,PP GC B细胞的慢性活化可能允许在没有细胞选择的情况下通过SHM扩展初级抗体组库。或者,由于VB1-8模型中只有一个生产性VDJ序列,缺乏SHM选择可能是由于VB1-8外显子不与任何肠道抗原匹配的可能性。现在,鉴别了PP GC中响应于肠道抗原而反复富集的几种VH(图21A),检查了它们的突变模式。引人注目的是,与从汇集的非生产性序列产生的内在突变模式相比,PP GC中最高度富集的VH1-47和VH11-2确实积累了突变,但未显示出在CDR区突变方面的任何循环选择(图23),表明PP中缺乏亲和力成熟。与VB1-8模型的过去发现相一致,可能是由于其在初始组库中的高基线水平,PP GC中最常使用的相同VH1-72虽然没有显著富集(图21A),但也累积了序列-内在SHM(图29A)。因此,PP GC在SHM选择方面表现出与传统GC不同的行为。

参考文献

1.Alt,F.W.,Zhang,Y.,Meng,F.-L.,Guo,C.&Schwer,B.Mechanisms ofprogrammed DNA lesions and genomic instability in the immune system.Cell 152,417-29(2013).

2.De Silva,N.S.&Klein,U.Dynamics of B cells in germinalcentres.Nat.Rev.Immunol.15,137-148(2015).

3.Di Noia,J.M.&Neuberger,M.S.Molecular Mechanisms of Antibody SomaticHypermutation.Annu.Rev.Biochem.76,1-22(2007).

4.Shih,T.-A.Y.,Meffre,E.,Roederer,M.&Nussenzweig,M.C.Role of BCRaffinity in T cell dependent antibody responses in vivo.Nat.Immunol.3,570-5(2002).

5.Victora,G.D.et al.Germinal center dynamics revealed by multiphotonmicroscopy with a photoactivatable fluorescent reporter.Cell 143,592-605(2010).

6.Reboldi,A.&Cyster,J.G.Peyer’s patches:Organizing B-cell responsesat the intestinal frontier.Immunol.Rev.271,230-245(2016).

7.Weinstein,P.D.&Cebra,J.J.The preference for switching to IgAexpression by Peyer’s patch germinal center B cells is likely due to theintrinsic influence of their microenvironment.J.Immunol.147,4126-4135(1991).

8.Lécuyer,E.et al.Segmented filamentous bacterium uses secondary andtertiary lymphoid tissues to induce gut IgA and specific T helper 17cellresponses.Immunity 40,608-620(2014).

9.Bergqvist,P.,Stensson,A.,Lycke,N.Y.&Bemark,M.T Cell-Independent IgAClass Switch Recombination Is Restricted to the GALT and Occurs Prior toManifest Germinal Center Formation.J.Immunol.184,3545-3553(2010).

10.Bunker,J.J.et al.Innate and Adaptive Humoral Responses CoatDistinct Commensal Bacteria with Immunoglobulin A.Immunity 43,541-553(2015).

11.Casola,S.et al.B cell receptor signal strength determines B cellfate.Nat.Immunol.5,317-327(2004).

12.Yeap,L.,Hwang,J.K.,Kepler,T.B.,Wang,J.H.&Alt,F.W.Sequence-Intrinsic Mechanisms that Target AID Mutational Outcomes on Antibody GenesArticle Sequence-Intrinsic Mechanisms that Target AID Mutational Outcomes onAntibody Genes.1-14(2015).doi:10.1016/j.cell.2015.10.042

13.Reynaud,C.A.,Anquez,V.,Grimal,H.&Weill,J.C.A hyperconversionmechanism generates the chicken light chain preimmune repertoire.Cell 48,379-388(1987).

14.Reynaud,C.A.,Mackay,C.R.,Müller,R.G.&Weill,J.C.Somatic generationof diversity in a mammalian primary lymphoid organ:The sheep ileal Peyer’spatches.Cell 64,995-1005(1991).

15.Lanning,D.,Zhu,X.,Zhai,S.-K.K.&Knight,K.L.Development of theantibody repertoire in rabbit:gut-associated lymphoid tissue,microbes,andselection.Immunological reviews 175,214-228(2000).

16.Bergqvist,P.et al.Re-utilization of germinal centers in multiplePeyer’s patches results in highly synchronized,oligoclonal,and affinity-matured gut IgA responses.Mucosal Immmunol.6,122-135(2012).

17.Lin,S.G.et al.Highly sensitive and unbiased approach forelucidating antibody repertoires.Proc.Natl.Acad.Sci.113,7846-7851(2016).

18.Frock,R.L.et al.Genome-wide detection of DNA double-strandedbreaks induced by engineered nucleases.Nat.Biotechnol.33,(2014).

19.Tian,M.etal.Induction of HIV Neutralizing Antibody Lineages inMice with Diverse Precursor Repertoires.Cell 166,1471-1484.e18(2016).

20.Bothwell,A.L.M.et al.Heavy chain variable region contribution tothe NPb family of antibodies:somatic mutation evident in aγ2a variableregion.Cell 24,625-637(1981).

21.Cumano,A.Structure of prii nary anti-(4-hydroxy-3-nitro-pheny1)acetyl(N?)antibodies in normal and idiotypically suppressed C57BL/6mice*.Eur.J.Lmmunol 512-520(1985).

22.Jacob,J.,Przylepa,J.,Miller,C.&Kelsoe,G.In situ studies of theprimary immune response to(4-hydroxy-3-nitrophenyl)acetyl.III.The kinetics ofV region mutation and selection in germinal center B cells.J.Exp.Med.178,1293-307(1993).

23.Allen,D.,Simon,T.,Sablitzky,F.,Rajewsky,K.&Cumano,a.Antibodyengineering for the analysis of affinity maturation of an anti-haptenresponse.Embo J7,1995-2001.(1988).

24.Weiss,U.,Zoebelein,R.&Rajewsky,K.Accumulation of somatic mutantsin the B cell compartment after primary immunization with a T cell-dependentantigen.Eur.J.Immunol.22,511-7(1992).

25.Tas,J.M.J.et al.Visualizing antibody affinity maturation ingerminal centers.Science (80-.).58,7250-7(2016).

26.Lindner,C.et al.Diversification of memory B cells drives thecontinuous adaptation of secretory antibodies to gutmicrobiota.Nat.Immtnol.16,880-8(2015).

27.Muramatsu,M.et al.Specific expression of activation-inducedcytidine deaminase(AID),a novel member of the RNA-editing deaminase family ingerminal center B cells.J.Biol.Chem.274,18470-18476(1999).

28.Muramatsu,M.et al.Class Switch Recombination and HypermutationRequire Activation-Induced Cytidine Deaminase(AID),a Potential RNA EditingEnzyme.Cell 102,553-563(2000).

29.Revy,P.et al.Activation-Induced Cytidine Deaminase(AID)DeficiencyCauses the Autosomal Recessive Form of the Hyper-IgM Syndrome(HIGM2).Cell102,565-575(2000).

30.Craig,S.W.&Cebra,J.J.Peyer’s patches:an enriched source ofprecursors for IgA-producing immunocytes in the rabbit.J.Exp.Med.134,188-200(1971).

31.Fagarasan,S.et al.Critical roles of activation-induced cytidinedeaminase in the homeostasis of gut flora.Science(80-.).298,1424-1427(2002).

32.Suzuki,K.et al.Aberrant expansion of segmented filamentousbacteria in IgA-deficient gut.Proc.Natl.Acad.Sci.U.S.A.101,1981-1986(2004).

33.Heel,K.a,McCauley,R.D.,Papadimitriou,J.M.&Hall,J.C.Review:Peyer’spatches.J.Gastroenterol.Hepatol.12,122-136(1997).

34.Jiang,D.,Niwa,M.,Koong,A.C.&Diego,S.Colonization and induction ofTh17 cells by segmented filamentous bacteria in the murine intestine.48-56(2016).doi:10.1016/j.semcancer.2015.04.010.Targeting

实施例6

HTGTS-Rep-seq用于分析来自外周血B细胞的人IGH组库、IGK组库和IGL组库(图30)。

表6

Figure BDA0002230788130000841

序列表

<110> 儿童医疗中心有限公司

<120> 涉及检测重组事件和重排事件的方法和组合物

<130> 701039-086701-PCT

<140>

<141>

<150> 62/458,244

<151> 2017-02-13

<160> 65

<170> PatentIn version 3.5

<210> 1

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 1

ctgcagcatg cagagtgtg 19

<210> 2

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 2

tgacatgggg agatctgaga 20

<210> 3

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 3

accctttctg actcccaagg 20

<210> 4

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 4

ccccaacaaa tgcagtaaaa tct 23

<210> 5

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 5

gggacaaagg ggttgaatct 20

<210> 6

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 6

cccgtttgca gagaatctt 19

<210> 7

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 7

ccctcaggga caaatatcca 20

<210> 8

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 8

ctgcaatgct cagaaaactc c 21

<210> 9

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 9

ttcccagctt tgcttacgga g 21

<210> 10

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 10

agtgccagaa tctggtttca gag 23

<210> 11

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 11

attccaacct cttgtgggac ag 22

<210> 12

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 12

tccctcctta acacctgatc tgag 24

<210> 13

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 13

cgctcagctt tcacactgac tc 22

<210> 14

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 14

caggttgcca ggaatggctc 20

<210> 15

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 15

gcccctaatc tcactagctt ga 22

<210> 16

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 16

gtcaactgat aatgagccct ctcc 24

<210> 17

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 17

ctgcagcatg cagagtgtg 19

<210> 18

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 18

tgacatgggg agatctgaga 20

<210> 19

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 19

accctttctg actcccaagg 20

<210> 20

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 20

ccccaacaaa tgcagtaaaa tct 23

<210> 21

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 21

gggacaaagg ggttgaatct 20

<210> 22

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 22

cccgtttgca gagaatctt 19

<210> 23

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 23

ccctcaggga caaatatcca 20

<210> 24

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 24

ctgcaatgct cagaaaactc c 21

<210> 25

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 25

ttcccagctt tgcttacgga g 21

<210> 26

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 26

agtgccagaa tctggtttca gag 23

<210> 27

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 27

attccaacct cttgtgggac ag 22

<210> 28

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 28

tccctcctta acacctgatc tgag 24

<210> 29

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 29

cgctcagctt tcacactgac tc 22

<210> 30

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 30

caggttgcca ggaatggctc 20

<210> 31

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 31

gcccctaatc tcactagctt ga 22

<210> 32

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 32

gtcaactgat aatgagccct ctcc 24

<210> 33

<211> 460

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的多核苷酸

<400> 33

ctgcaatgct cagaaaactc cataacaaag gttaaaaata aagacctgga gaggccattc 60

ttacctgagg agacggtgac tgaggttcct tgaccccagt agtccatagc cccactacta 120

ccgtagtaat aatttgcatc tcttgcacag taataaatgg cagtgtcctc agctctcagg 180

gcattcatct gaaggtagag gatgctttgg gaagtgtctc tggagacgat gaaccgaccc 240

ttcacagatg cactgtactc tgttgtataa tcattagctt tgtttctact tgcagcaatc 300

cactccagtc tcttccctgg aggctggcgg acccactcca tgtagaaatc actgaaggtg 360

aacccagaag ttgcacagga gagtctcaga gaacccccag gctgtaccaa gcctcctcca 420

gattccacca gcttcacctc accacgcgtg ccctatagtc 460

<210> 34

<211> 493

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的多核苷酸

<400> 34

ccggttgcca ggaatggctc atttagccaa aatgtcacaa attcacacaa gttacccaaa 60

cagaaccaaa acgtcacaag taaatgagca aaagtctact tacgttttat ttccaacttt 120

gtccccgagc cgaacgtgaa tgggaggatc ctcattactt tgctgacagt aataggttgc 180

agcatcctcc tcctccacag gatggatgtt gagggtgaag tctgtcccag acccactgcc 240

actaaacctg gctgggatcc cagattctag attggatgca gcatagatga ggagtttggg 300

tggctgtcct ggtttctgtt ggtaccagtt catataacta tcaccatcat aatcaacact 360

ttggctggcc ttgcaggaga tggtggccct ctgccctaga gacacagcca aagaagctgg 420

agattgggtc agcacaatgt caccagtgga gcctggaatg ataaacacac agacccacgc 480

gtgccctata gtc 493

<210> 35

<211> 53

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 35

ctactggtac ttcgatgtct ggggcacagg gaccacggtc accgtctcct cag 53

<210> 36

<211> 48

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 36

actactttga ctactggggc caaggcacca ctctcacagt ctcctcag 48

<210> 37

<211> 48

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 37

cctggtttgc ttactggggc caagggactc tggtcactgt ctctgcag 48

<210> 38

<211> 54

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 38

attactatgc tatggactac tggggtcaag gaacctcagt caccgtctcc tcag 54

<210> 39

<211> 137

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 39

ctactggtac ttcgatgtct ggggcacagg gaccacggtc accgtctcct caggtaagct 60

ggcttttttc tttctgcaca ttccattctg aaacgggaaa agatattctc agatctcccc 120

atgtcaggcc atctgcc 137

<210> 40

<211> 134

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 40

actactttga ctactggggc caaggcacca ctctcacagt ctcctcaggt gagtccttac 60

aacctctctc ttctattcag cttaaataga ttttactgca tttgttgggg gggaaatgtg 120

tgtatctgaa tttc 134

<210> 41

<211> 131

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 41

cctggtttgc ttactggggc caagggactc tggtcactgt ctctgcaggt gagtcctaac 60

ttctcccatt ctaaatgcat gttgggggga ttctgggcct tcaggaccaa gattctctgc 120

aaacgggaat c 131

<210> 42

<211> 134

<212> DNA

<213> 小家鼠(Mus musculus)

<400> 42

attactatgc tatggactac tggggtcaag gaacctcagt caccgtctcc tcaggtaaga 60

atggcctctc caggtcttta tttttaacct ttgttatgga gttttctgag cattgcagac 120

taatcttgga tatt 134

<210> 43

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 43

tgacatgggg agatctgaga 20

<210> 44

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 44

ccccaacaaa tgcagtaaaa tct 23

<210> 45

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 45

gagaatcttg gtcctgaagg c 21

<210> 46

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 46

ctgcaatgct cagaaaactc c 21

<210> 47

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 47

cttacctgag gagacggtga c 21

<210> 48

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 48

ctcacctgag gagactgtga g 21

<210> 49

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 49

ctcacctgca gagacagtga c 21

<210> 50

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 50

agtgtgaagt ataggtatga agcag 25

<210> 51

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 51

cagtggagag cagatgagaa a 21

<210> 52

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 52

tctgaggaga gcagatgaga aa 22

<210> 53

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 53

cacctcaagt cttggagaga a 21

<210> 54

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 54

caagacaaca agggctgg 18

<210> 55

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 55

caagataaca aggcctggac 20

<210> 56

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 56

cagacataga caacggaaga aag 23

<210> 57

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 57

caaggttaga cttagtgaac aagag 25

<210> 58

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 58

cagaaccaaa acgtcacaag taa 23

<210> 59

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 59

catgaaaacc tgtgtcttac acat 24

<210> 60

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 60

acccagcacc cttatttccc 20

<210> 61

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 61

tgcagcaaaa cccttcagag 20

<210> 62

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 62

tgtgcaatca attctcgagt ttg 23

<210> 63

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 63

acacagggaa cagaagacac a 21

<210> 64

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 64

caagggtctg aacagggagg 20

<210> 65

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列的说明:合成的引物

<400> 65

accacaagtt gagacaagat aca 23

204页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于检测核酸标识符污染的测定方法和组合物

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类