用于早期癌症检测的方法和组合物

文档序号:327895 发布日期:2021-11-30 浏览:22次 >En<

阅读说明:本技术 用于早期癌症检测的方法和组合物 (Methods and compositions for early cancer detection ) 是由 翁莉 马利克·法哈姆 托拜厄斯·维特科普 卢永涛 邓凌锋 于 2020-02-21 设计创作,主要内容包括:本文提供了用于检测受试者的非转移性癌症的方法和系统,其包括测量该受试者的多个cfDNA核酸分子的总cfDNA片段大小分布,并将该受试者的所述多个cfDNA核酸分子的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA核酸分子的总cfDNA片段大小分布进行比较。(Provided herein are methods and systems for detecting a non-metastatic cancer in a subject, comprising measuring a total cfDNA fragment size distribution of a plurality of cfDNA nucleic acid molecules of the subject, and comparing the total cfDNA fragment size distribution of the plurality of cfDNA nucleic acid molecules of the subject to a total cfDNA fragment size distribution of the plurality of cfDNA nucleic acid molecules from a healthy control.)

用于早期癌症检测的方法和组合物

交叉引用

本申请要求2019年2月22日提交的第62/809,450号美国临时申请和2019年7月11日提交的第62/873,113号美国临时申请的权益,所述临时申请中的每一个均通过引用整体并入本文。

背景技术

癌症的早期检测可在癌症患者的治疗中带来更好的结果。因此,期望具有早期检测癌症的方法,例如在癌症从原发肿瘤部位转移之前。由于许多癌症在这些早期阶段没有或几乎没有表现出症状,因此进行微创的并且能够在常规健康筛查过程中提供给看似健康的个体的准确癌症检测可能是有利的。

发明内容

本文提供了检测受试者的非转移性癌症的方法。在一些实施方案中,所述方法包括:(a)获得包含所述受试者的多个无细胞脱氧核糖核酸(cfDNA)多核苷酸的样品;(b)测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;(c)将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较;以及(d)当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。本文还提供了检测受试者的非转移性癌症的方法,其包括:(a)获得包含所述受试者的多个无细胞DNA(cfDNA)多核苷酸的样品;(b)通过测序测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;(c)将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较;以及(d)当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备单链脱氧核糖核酸(DNA)文库。在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。在一些实施方案中,所述方法进一步包括:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述受试者没有被诊断为转移性癌症。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,所述方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。在一些实施方案中,所述方法进一步包括向所述受试者推荐施用化学疗法。在一些实施方案中,所述方法进一步包括向所述受试者推荐额外的癌症监测。在一些实施方案中,(d)包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基直至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些实施方案中,使用所述靶向引物或捕获探针的序列处理所述多个测序读取。

另外,本文提供了测量来自受试者的血液样品中的cfDNA大小分布的方法。在一些实施方案中,所述方法包括:(a)从所述受试者的血液样品获得包含多个无细胞DNA(cfDNA)多核苷酸的样品;(b)测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;(c)将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较;以及(d)当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述多个cfDNA多核苷酸包含少于10%的循环肿瘤DNA(ctDNA)。在一些实施方案中,所述多个cfDNA多核苷酸包含少于5%的循环肿瘤DNA(ctDNA)。在一些实施方案中,所述多个cfDNA多核苷酸包含少于2%的循环肿瘤DNA(ctDNA)。在一些实施方案中,所述多个cfDNA多核苷酸包含少于1%的循环肿瘤DNA(ctDNA)。在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备单链DNA文库。在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。在一些实施方案中,所述方法进一步包括:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述受试者没有被诊断为转移性癌症。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,所述方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。在一些实施方案中,所述方法进一步包括向所述受试者推荐施用化学疗法。在一些实施方案中,所述方法进一步包括向所述受试者推荐额外的癌症监测。在一些实施方案中,所述方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些实施方案中,使用所述靶向引物或捕获探针的序列处理所述多个测序读取。

本文进一步提供了检测受试者的肿瘤的方法。在一些实施方案中,所述方法包括:(a)从所述受试者的血液样品获得包含多个无细胞DNA(cfDNA)多核苷酸的样品;(b)测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;(c)将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较;以及(d)当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,检测到肿瘤DNA。在一些实施方案中,所述方法进一步包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备单链DNA文库。在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。在一些实施方案中,所述方法进一步包括:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述受试者没有被诊断为转移性癌症。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,所述方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。在一些实施方案中,所述方法进一步包括向所述受试者推荐施用化学疗法。在一些实施方案中,所述方法进一步包括向所述受试者推荐额外的癌症监测。在一些实施方案中,所述方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些实施方案中,使用所述靶向引物或捕获探针的序列处理所述多个测序读取。

本文还提供了用于检测受试者的非转移性癌症的系统。在一些实施方案中,所述系统包括(a)计算机,其被配置为接收用户请求以对样品进行非转移性癌症的检测;(b)扩增系统,其响应于用户请求对所述样品中的cfDNA多核苷酸或其一部分进行核酸扩增反应;(c)测序系统,其(i)对所述扩增的cfDNA多核苷酸进行测序以产生多个测序读取;(ii)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度;并且(iii)产生所述样品中多个cfDNA多核苷酸的总cfDNA片段大小分布;以及(d)向接收者发送报告的报告生成器,其中该报告包含指示所述受试者的非转移性癌症风险的结果。在一些实施方案中,所述系统包括用于从所述受试者的血液样品中分离无细胞DNA(cfDNA)多核苷酸的分离系统。在一些实施方案中,所述系统将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。在一些实施方案中,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,所述系统检测到所述受试者中的非转移性癌症。在一些实施方案中,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述系统进一步包括用于从所述受试者的所述cfDNA多核苷酸制备单链DNA文库的制备系统。在一些实施方案中,所述系统进一步包括用于从所述受试者的所述cfDNA多核苷酸制备双链DNA文库的制备系统。在一些实施方案中,所述扩增反应包括:环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;并扩增所述环状多核苷酸。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加10%。在一些实施方案中,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述受试者没有被诊断为转移性癌症。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,所述系统不从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。在一些实施方案中,所述报告进一步包含对所述受试者施用化学疗法的推荐。在一些实施方案中,所述报告进一步包含对所述受试者进行额外的癌症监测的推荐。在一些实施方案中,所述扩增系统针对一个或多个靶序列富集所述cfDNA多核苷酸。

本文进一步提供了包含代码的计算机可读介质,所述代码在被一个或多个处理器执行时实现检测受试者的非转移性癌症的方法。在一些实施方案中,方法包括:(a)接收客户请求以对来自受试者的样品进行非转移性癌症的检测;(b)对所述样品中的cfDNA多核苷酸或其部分进行核酸扩增反应;(c)进行包括以下步骤的测序分析:(i)对所扩增的cfDNA多核苷酸进行测序以产生多个测序读取;(ii)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度;以及(iii)产生所述样品中多个cfDNA多核苷酸的总cfDNA片段大小分布;以及(d)生成报告,该报告包含指示所述受试者的非转移性癌症风险的结果。在一些实施方案中,所述方法包括从所述受试者的血液样品中分离无细胞DNA(cfDNA)多核苷酸。在一些实施方案中,所述方法包括将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,检测到所述受试者中的非转移性癌症。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备单链DNA文库。在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。在一些实施方案中,所述扩增反应包括:环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;并扩增所述环状多核苷酸。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述受试者没有被诊断为转移性癌症。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,所述方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。在一些实施方案中,所述报告进一步包含对所述受试者施用化学疗法的推荐。在一些实施方案中,所述方法进一步包括向所述受试者推荐额外的癌症监测。在一些实施方案中,进行扩增反应包括针对一个或多个靶序列富集所述cfDNA多核苷酸。在一些实施方案中,在进行扩增反应之前或之后,针对所述一个或多个靶序列富集所述cfDNA多核苷酸。

本文进一步提供了检测受试者的非转移性癌症的方法,其包括:(a)获得包含所述受试者的多个无细胞DNA(cfDNA)核酸分子的样品;(b)测量所述多个cfDNA核酸分子的总cfDNA片段大小分布;以及(c)当所述总cfDNA片段大小分布显示,与来自健康对照的所述多个核酸分子的总cfDNA片段大小分布相比片段增加时,确定所述受试者患有非转移性癌症或患非转移性癌症的风险增加。

援引并入

本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。

附图说明

通过参考以下对利用本发明原理的说明性实施方案加以阐述的详细描述以及附图,将会对本发明的特征和优点获得理解,在这些附图中:

图1A显示了与突变等位基因频率为0的癌症个体相比,从健康个体获得的无细胞脱氧核糖核酸(cfDNA)的大小分布。

图1B显示了与突变等位基因频率大于0且小于5的癌症个体相比,从健康个体获得的cfDNA的大小分布。

图1C显示了与突变等位基因频率大于或等于5且小于20的癌症个体相比,从健康个体获得的cfDNA的大小分布。

图1D显示了与突变等位基因频率大于或等于20的癌症个体相比,从健康个体获得的cfDNA的大小分布。

图2A显示了说明在结直肠癌(CRC)样品与健康样品之间观察到的大小差异的图示。

图2B显示了总突变等位基因频率与使用大小范围为50个碱基至150个碱基的分子计算的突变等位基因频率(MAF)。小尺寸范围内的MAF高于总MAF,表明小片段中的ctDNA富集。然而,对于大多数总MAF<1%的样品,小尺寸范围内的MAF仍然低于5%。虚线:y=x。

图3示出了示例计算机系统。

具体实施方式

尽管已经在本文中显示并描述了本发明的多个实施方案,但是对本领域技术人员显而易见的是这些实施方案仅作为实例提供。在不偏离本发明的情况下,本领域技术人员可以想到许多改变、变化和替换。应当理解,可以使用本文所述发明的实施方案的各种替代方案。

如本文所用的,术语“约”或“大约”意指在本领域普通技术人员测定的特定值的可接受误差范围内,该可接受误差范围可部分取决于该值如何测量或测定,即,测量系统的局限性。例如,根据本领域中的实践,“约”可指在1个或大于1个标准偏差内。作为另一个实例,“约”可指给定值的最多20%、最多10%、最多5%或最多1%的范围。对于生物系统或过程,术语“约”可指在数值的数量级内,如在5倍以内,或在2倍以内。在本申请和权利要求书中描述特定值的情况下,除非另有说明,否则术语“约”意指在该特定值的可接受误差范围内。

如本文所用的,术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”通常是指任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)的聚合形式,或其类似物。多核苷酸可以具有任何三维结构,并且可以行使已知或未知的任何功能。以下是多核苷酸的非限制性实例:无细胞核酸、无细胞DNA(cfDNA)、循环肿瘤DNA(ctDNA)、基因或基因片段的编码区或非编码区、从连锁分析定义的基因座(多个基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针以及引物。多核苷酸可包含一个或多个修饰的核苷酸,如甲基化核苷酸和核苷酸类似物。如果存在的话,对核苷酸结构的修饰可以在聚合物装配之前或之后赋予。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后进一步修饰,例如通过与标记组分缀合。

如本文所用的,术语“总无细胞核酸”和“总无细胞多核苷酸”,包括但不限于“总无细胞脱氧核糖核酸(DNA)”、“总无细胞DNA”、“总cfDNA”、“总无细胞核糖核酸(RNA)”、“总无细胞RNA”和“总cfRNA”,通常是指尚未针对癌症相关突变富集的无细胞核酸群体。总无细胞核酸,包括总无细胞DNA或总无细胞RNA,可以是个体中无细胞核酸的整个群体。总无细胞核酸,包括总无细胞DNA或总无细胞RNA,也可以是个体中尚未针对癌症相关突变富集的无细胞核酸群体的代表性子集。

如本文所用的术语“受试者”通常是指个体,如脊椎动物。脊椎动物可以是哺乳动物(例如,人)。哺乳动物包括但不限于鼠、猿猴、人、农场动物、竞技动物和宠物。还包括在体内获得或在体外培养的生物实体的组织、细胞及其后代。该受试者可以是患者。受试者对于疾病(例如,癌症)而言可能是有症状的。或者,受试者对于疾病而言可能是无症状的。

本文可互换使用的术语“早期癌症”和“非转移性癌症”是指尚未在个体中转移的癌症(即,癌症尚未离开其初始位置扩散到其他位置)。确切的分期取决于癌症的类型,本文提供了其详细信息。

如本文所用的术语“肿瘤负荷”和“肿瘤负载”通常是指受试者体内的肿瘤大小或疾病(例如,癌症)的量。

如本文所用的术语“健康对照”通常是指受试者的健康状态的参考点。健康对照可以来自未患有或未怀疑患有疾病(例如,癌症)的受试者,或者虽来自患有或怀疑患有疾病的受试者但来自可另外用作非疾病参考的位置(例如,白细胞)。健康对照可以是基因组或基因组的一部分。健康对照可以是核糖核酸分子和/或脱氧核糖核酸分子。

如本文所用的术语“样品”通常是指源自或获自受试者如哺乳动物(例如,人)的样品。该样品可以是生物样品。样品可包括但不限于毛发、指甲、皮肤、汗液、泪液、眼部液体、鼻拭子或鼻咽洗液、痰、咽喉拭子、唾液、粘液、血液、血清、血浆、胎盘液、羊水、脐带血、重点流体(emphatic fluid)、腔液、耳垢、油、腺体分泌物、胆汁、淋巴、脓、微生物群、胎粪、乳汁、骨髓、骨、CNS组织、脑脊液、脂肪组织、滑液、粪便、胃液、尿液、精液、阴道分泌物、胃、小肠、大肠、直肠、胰腺、肝、肾、膀胱、肺,以及源自或获自受试者的其他组织和流体。该生物样品可以是无细胞(或不含细胞的)生物样品。

如本文所用的术语“无细胞”通常是指源自或获自受试者的不含细胞的样品。无细胞生物样品可包括但不限于血液、血清、血浆、鼻拭子或鼻咽洗液、唾液、尿液、胃液、泪液、粪便、粘液、汗液、耳垢、油、腺体分泌物、胆汁、淋巴、脑脊液、组织、精液、阴道液、间质液(包括来源于肿瘤组织的间质液)、眼部液体、脊髓液、咽喉拭子、呼气、毛发、指甲、皮肤、活检物、胎盘液、羊水、脐带血、重点流体(emphatic fluid)、腔液、痰、脓、微生物群、胎粪、乳汁和/或其他分泌物。

本文提供了用于检测或诊断受试者的非转移性或早期癌症的方法、系统和组合物。本文提供的方法还包括测量来自受试者的样品中的无细胞DNA(cfDNA)大小分布并检测来自受试者的样品中的肿瘤cfDNA。本文的方法基于以下发现:与健康受试者中的cfDNA大小分布相比,患有癌症的受试者中的cfDNA大小分布显示出大小减小的cfDNA增加。这一发现表明,通过观察较小尺寸范围内的cfDNA的量,例如大小至多为170个碱基的cfDNA的量,可以在早期检测癌症。

非转移性癌症的检测

本文提供了检测受试者的非转移性癌症的方法。在一些实施方案中,一些这样的方法包括获得包含所述受试者的多个无细胞脱氧核糖核酸(cfDNA)多核苷酸的样品并测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布。接下来,可将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。然后可以使用受试者样品,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,确定所述受试者患有非转移性癌症或处于患非转移性癌症的风险中。在一些实施方案中,该方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些情况下,该方法不包括针对靶序列进行富集。在一些情况下,该方法不包括将cfDNA多核苷酸序列与参考基因组进行比对或作图。

本文还提供了检测受试者的非转移性癌症的方法。在一些实施方案中,一些这样的方法包括获得包含所述受试者的多个cfDNA多核苷酸的样品并通过测序测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布。接下来,可将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。然后可以使用受试者样品,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,确定所述受试者患有非转移性癌症或处于患非转移性癌症的风险中。在一些实施方案中,该方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些情况下,该方法不包括针对靶序列进行富集。在一些情况下,该方法不包括将cfDNA多核苷酸序列与参考基因组进行比对或作图。

本文进一步提供了检测受试者的非转移性癌症的方法,其包括获得包含所述受试者的多个cfDNA多核苷酸的样品并测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布。接下来,可将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。然后可以使用受试者样品,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中至少2、3、4、5、6、7、8、9、10个或更多个大小在10个碱基至170个碱基范围内的cfDNA片段增加时,确定所述受试者具有增加的非转移性癌症风险或处于具有增加的非转移性癌症风险的风险中(例如,与健康受试者或健康受试者群体相比,至少增加1%、10%、20%、30%、40%、50%或更多)。

在一些情况下,本文提供的检测非转移性癌症的方法包括从受试者样品中的多核苷酸制备脱氧核糖核酸(DNA)文库。在一些情况下,该方法进一步包括从所述受试者的所述cfDNA多核苷酸制备单链DNA文库。制备单链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备单链DNA文库的方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,使用PCR);并在测序仪上对所述文库进行测序。另一种单链文库制备方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,通过PCR);在一些情况下,利用与捕获探针的杂交针对感兴趣的区域进行富集;扩增(例如,通过PCR)捕获的产物;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

所述方法可进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。制备双链DNA的任何合适的方法可在本文的方法中使用。例如,制备双链DNA文库的方法可包括将测序衔接子连接至多个DNA片段的5’和3’端,并在测序仪上对所述文库进行测序。另一种双链DNA文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR将完整的衔接子序列附接至连接的片段上;并在测序仪上对所述文库进行测序。另一种方法可包括将衔接子连接至多个DNA片段的5’和3’端;通过与连接的衔接子互补的PCR扩增连接的产物;在一些情况下,通过与捕获探针的杂交针对感兴趣的区域进行富集;PCR扩增捕获的产物;并在测序仪上对所述文库进行测序。另一种双链文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR扩增连接的产物;将双链PCR产物环化或使单链PCR产物变性并环化;在一些情况下,使用靶向特定基因的引物,通过PCR针对感兴趣的区域进行富集;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

本文提供的测量cfDNA大小分布的方法可包括任何合适的测量DNA大小的方法。测量cfDNA大小分布的合适方法的实例包括但不限于测序、生物分析仪片段分析、PCR、qPCR、高通量凝胶电泳、高通量毛细管电泳和其他任何提供DNA片段大小的合适方法。

本文提供的检测非转移性癌症的方法可进一步包括扩增和测序步骤,包括以下一个或多个:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。在一些实施方案中,检测早期或非转移性癌症的方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。

在本文提供的检测非转移性癌症的方法中,所述cfDNA片段大小分布可显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至50碱基、10个碱基至70碱基、10个碱基至105碱基、10个碱基至115碱基、10个碱基至125碱基、10个碱基至170碱基、25个碱基至50碱基、25个碱基至70碱基、25个碱基至105碱基、25个碱基至115碱基、25个碱基至125碱基、25个碱基至170碱基、50个碱基至70碱基、50个碱基至105碱基、50个碱基至115碱基、50个碱基至125碱基、50个碱基至170碱基、70个碱基至105碱基、70个碱基至115碱基、70个碱基至125碱基、70个碱基至170碱基、105个碱基至115碱基、105个碱基至125碱基、105个碱基至170碱基、115个碱基至125碱基、115个碱基至170碱基或125个碱基至170个碱基的片段增加。

在本文提供的检测非转移性癌症的方法中,所述cfDNA片段大小分布可显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加20%。

在本文提供的检测非转移性癌症的方法中,所述cfDNA片段大小分布可显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加20%。这样的增加可以是,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%、5%、10%、20%、30%、40%、50%或更多。

在本文提供的检测非转移性癌症的某些方法中,所述方法可包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加20%。

在本文提供的检测非转移性癌症的某些方法中,所述方法可包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加20%。

在本文提供的检测非转移性癌症的某些方法中,所述方法可包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加20%。

在本文提供的检测早期或非转移性癌症的方法中,在某些情况下,所述多个cfDNA多核苷酸仅包含一小部分循环肿瘤DNA(ctDNA)。例如,在一些实施方案中,所述多个cfDNA多核苷酸包含少于25%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于20%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于15%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于10%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于5%的ctDNA。

在本文提供的检测早期或非转移性癌症的方法的某些方面,在一些情况下,在可以使用常规方法检测到之前,受试者患有癌症,但处于极早期。在一些情况下,所述受试者没有被诊断为转移性癌症。或者,所述受试者具有低肿瘤负荷,例如,在一些情况下,所述受试者具有小于20%的肿瘤负荷。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述受试者具有小于9%的肿瘤负荷。在一些实施方案中,所述受试者具有小于8%的肿瘤负荷。在一些实施方案中,所述受试者具有小于7%的肿瘤负荷。在一些实施方案中,所述受试者具有小于6%的肿瘤负荷。在一些实施方案中,所述受试者具有小于5%的肿瘤负荷。或者,使用本文方法检测的早期癌症包括早期的非转移性癌症,其有时使用数字分类系统进行分类。在一些情况下,早期癌症根据癌症类型进行分期。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。

使用本文方法可检测的癌症可包括但不限于结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌或脑癌。

在本文提供的检测早期或非转移性癌症的方法中,在一些情况下,所述方法包括用于处理癌症的额外步骤。在一些实施方案中,该方法包括推荐对受试者中的癌症的治疗。在一些实施方案中,该方法包括向受试者推荐施用化学疗法。在一些实施方案中,该方法步包括向受试者推荐额外的癌症监测。

测量cfDNA大小分布

本文进一步提供了测量来自受试者的血液样品中的无细胞脱氧核糖核酸(cfDNA)大小分布的方法。在一些实施方案中,方法包括从所述受试者的血液样品获得包含多个cfDNA多核苷酸的样品并测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布。在进一步的实施方案中,方法包括将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较,以及当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,该方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些情况下,该方法不包括针对靶序列进行富集。在一些情况下,该方法不包括将cfDNA多核苷酸序列与参考基因组进行比对或作图。

本文提供的测量cfDNA大小分布的方法可包括任何合适的测量DNA大小的方法。测量cfDNA大小分布的合适的方法包括但不限于测序、生物分析仪片段分析、PCR、qPCR、高通量凝胶电泳、高通量毛细管电泳或其他任何提供DNA片段大小的合适方法。

在本文提供的测量cfDNA大小分布的方法中,在某些情况下,所述多个cfDNA多核苷酸仅包含一小部分循环肿瘤DNA(ctDNA)。例如,在一些实施方案中,所述多个cfDNA多核苷酸包含少于25%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于20%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于15%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于10%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于5%的ctDNA。

在一些情况下,本文提供的测量cfDNA大小分布的方法包括从受试者样品中的多核苷酸制备DNA文库。例如,在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备单链DNA文库。制备单链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备单链DNA文库的方法包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,使用PCR);并在测序仪上对所述文库进行测序。另一种单链文库制备方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,通过PCR);在一些情况下,利用与捕获探针的杂交针对感兴趣的区域进行富集;扩增(例如,通过PCR)捕获的产物;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

可替代地或组合地,所述方法可进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。制备双链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备双链DNA文库的方法可包括将测序衔接子连接至多个DNA片段的5’和3’端,并在测序仪上对所述文库进行测序。另一种双链DNA文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR将完整的衔接子序列附接至连接的片段上;并在测序仪上对所述文库进行测序。另一种方法可包括将衔接子连接至多个DNA片段的5’和3’端;通过与连接的衔接子互补的PCR扩增连接的产物;在一些情况下,通过与捕获探针的杂交针对感兴趣的区域进行富集;PCR扩增捕获的产物;并在测序仪上对所述文库进行测序。另一种双链文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR扩增连接的产物;将双链PCR产物环化或使单链PCR产物变性并环化;在一些情况下,使用靶向特定基因的引物,通过PCR针对感兴趣的区域进行富集;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

本文提供的测量cfDNA大小分布的方法可进一步包括扩增和测序步骤,包括以下一个或多个:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。在一些实施方案中,测量cfDNA大小分布的方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。

在本文提供的测量cfDNA大小分布的方法中,所述cfDNA片段大小分布可显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至50碱基、10个碱基至70碱基、10个碱基至105碱基、10个碱基至115碱基、10个碱基至125碱基、10个碱基至170碱基、25个碱基至50碱基、25个碱基至70碱基、25个碱基至105碱基、25个碱基至115碱基、25个碱基至125碱基、25个碱基至170碱基、50个碱基至70碱基、50个碱基至105碱基、50个碱基至115碱基、50个碱基至125碱基、50个碱基至170碱基、70个碱基至105碱基、70个碱基至115碱基、70个碱基至125碱基、70个碱基至170碱基、105个碱基至115碱基、105个碱基至125碱基、105个碱基至170碱基、115个碱基至125碱基、115个碱基至170碱基或125个碱基至170个碱基的片段增加。

在本文提供的测量cfDNA大小分布的方法中,所述cfDNA片段大小分布可显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加20%。

在本文提供的测量cfDNA大小分布的方法中,所述cfDNA片段大小分布可显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加20%。

本文进一步提供了测量受试者中的cfDNA大小分布的方法,其包括获得包含所述受试者的多个cfDNA多核苷酸的样品并测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布。接下来,可将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。然后可以使用受试者样品,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中至少2、3、4、5、6、7、8、9、10个或更多个大小在10个碱基至170个碱基范围内的cfDNA片段增加时,确定所述受试者患有非转移性癌症或处于患非转移性癌症的风险中。

在本文提供的测量cfDNA大小分布的某些方法中,所述方法可包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加20%。

在本文提供的测量cfDNA大小分布的某些方法中,所述方法可包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加20%。

在本文提供的测量cfDNA大小分布的某些方法中,所述方法包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加20%。

在本文提供的测量cfDNA大小分布的方法的某些方面,在一些情况下,在可以使用常规方法检测到之前,受试者可患有癌症,但处于极早期。在一些情况下,所述受试者没有被诊断为转移性癌症。在一些情况下,所述受试者具有低肿瘤负荷,例如,在一些情况下,所述受试者具有小于20%的肿瘤负荷。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述受试者具有小于9%的肿瘤负荷。在一些实施方案中,所述受试者具有小于8%的肿瘤负荷。在一些实施方案中,所述受试者具有小于7%的肿瘤负荷。在一些实施方案中,所述受试者具有小于6%的肿瘤负荷。在一些实施方案中,所述受试者具有小于5%的肿瘤负荷。在一些情况下,使用本文方法检测的早期癌症包括早期的非转移性癌症,其可使用数字分类系统进行分类。在一些情况下,早期癌症根据癌症类型进行分期。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。

使用本文方法可检测的癌症可包括但不限于结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌或脑癌。

在本文提供的测量cfDNA大小分布的方法中,在一些情况下,所述方法包括用于处理癌症的额外步骤。在一些实施方案中,该方法包括推荐对受试者中的癌症的治疗。在一些实施方案中,该方法包括向受试者推荐施用化学疗法。在一些实施方案中,该方法步包括向受试者推荐额外的癌症监测。

肿瘤检测

另外,本文提供了在来自受试者的血液样品中检测肿瘤的方法。在一些实施方案中,一些这样的方法包括从所述受试者的血液样品获得包含多个无细胞脱氧核糖核酸(cfDNA)多核苷酸的样品并测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布。接下来,可将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。然后可以使用受试者样品,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,检测到肿瘤DNA。在一些实施方案中,该方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些情况下,该方法不包括针对靶序列进行富集。在一些情况下,该方法不包括将cfDNA多核苷酸序列与参考基因组进行比对或作图。

在本文提供的检测肿瘤cfDNA的某些方法中,所述方法可进一步包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。

在本文提供的检测肿瘤cfDNA的方法中,在某些情况下,所述多个cfDNA多核苷酸仅包含一小部分循环肿瘤DNA(ctDNA)。例如,在一些实施方案中,所述多个cfDNA多核苷酸包含少于25%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于20%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于15%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于10%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于5%的ctDNA。

在一些情况下,本文提供的检测肿瘤cfDNA的方法包括从受试者样品中的多核苷酸制备DNA文库。例如,在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备单链DNA文库。制备单链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备单链DNA文库的方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,使用PCR);并在测序仪上对所述文库进行测序。另一种单链文库制备方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,通过PCR);在一些情况下,利用与捕获探针的杂交针对感兴趣的区域进行富集;扩增(例如,通过PCR)捕获的产物;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

所述方法可进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。制备双链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备双链DNA文库的方法可包括将测序衔接子连接至多个DNA片段的5’和3’端,并在测序仪上对所述文库进行测序。另一种双链DNA文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR将完整的衔接子序列附接至连接的片段上;并在测序仪上对所述文库进行测序。另一种方法可包括将衔接子连接至多个DNA片段的5’和3’端;通过与连接的衔接子互补的PCR扩增连接的产物;在一些情况下,通过与捕获探针的杂交针对感兴趣的区域进行富集;PCR扩增捕获的产物;并在测序仪上对所述文库进行测序。另一种双链文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR扩增连接的产物;将双链PCR产物环化或使单链PCR产物变性并环化;在一些情况下,使用靶向特定基因的引物,通过PCR针对感兴趣的区域进行富集;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

本文提供的测量cfDNA大小分布的方法可包括任何合适的测量DNA大小的方法。测量cfDNA大小分布的合适的方法包括但不限于测序、生物分析仪片段分析、PCR、qPCR、高通量凝胶电泳、高通量毛细管电泳或其他任何提供DNA片段大小的合适方法。

本文提供的检测肿瘤的方法可进一步包括扩增和测序步骤,包括以下一个或多个:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。在一些实施方案中,检测肿瘤cfDNA的方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。

在本文提供的检测肿瘤的某些方法中,所述方法可进一步包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至50碱基、10个碱基至70碱基、10个碱基至105碱基、10个碱基至115碱基、10个碱基至125碱基、10个碱基至170碱基、25个碱基至50碱基、25个碱基至70碱基、25个碱基至105碱基、25个碱基至115碱基、25个碱基至125碱基、25个碱基至170碱基、50个碱基至70碱基、50个碱基至105碱基、50个碱基至115碱基、50个碱基至125碱基、50个碱基至170碱基、70个碱基至105碱基、70个碱基至115碱基、70个碱基至125碱基、70个碱基至170碱基、105个碱基至115碱基、105个碱基至125碱基、105个碱基至170碱基、115个碱基至125碱基、115个碱基至170碱基或125个碱基至170个碱基的片段增加。

在本文提供的检测肿瘤的某些方法中,所述方法可进一步包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加20%。

在本文提供的检测肿瘤的某些方法中,所述方法可进一步包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加20%。

本文进一步提供了检测受试者的肿瘤的方法,其包括获得包含所述受试者的多个cfDNA多核苷酸的样品并测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布。接下来,可将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较;并且当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中至少2、3、4、5、6、7、8、9、10个或更多个大小在10个碱基至170个碱基范围内的cfDNA片段增加时,将所述受试者归类为具有肿瘤。

在本文提供的检测肿瘤的某些方法中,所述方法可包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加20%。

在本文提供的检测肿瘤的某些方法中,所述方法可包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加20%。

在本文提供的检测肿瘤的某些方法中,所述方法可包括当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加20%。

在本文提供的检测肿瘤cfDNA的方法的某些方面,在一些情况下,在可以使用常规方法检测到之前,受试者可患有癌症,但处于极早期。在一些情况下,所述受试者没有被诊断为转移性癌症。或者,所述受试者具有低肿瘤负荷,例如,在一些情况下,所述受试者具有小于20%的肿瘤负荷。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述受试者具有小于9%的肿瘤负荷。在一些实施方案中,所述受试者具有小于8%的肿瘤负荷。在一些实施方案中,所述受试者具有小于7%的肿瘤负荷。在一些实施方案中,所述受试者具有小于6%的肿瘤负荷。在一些实施方案中,所述受试者具有小于5%的肿瘤负荷。在一些情况下,使用本文方法检测的早期癌症包括早期的非转移性癌症,其有时使用数字分类系统进行分类。在一些情况下,早期癌症根据癌症类型进行分期。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。

使用本文方法可检测的癌症和肿瘤cfDNA可包括但不限于结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌或脑癌。

在本文提供的检测肿瘤cfDNA的方法中,在一些情况下,所述方法包括用于处理癌症的额外步骤。在一些实施方案中,该方法包括推荐对受试者中的癌症的治疗。在一些实施方案中,该方法包括向受试者推荐施用化学疗法。在一些实施方案中,该方法步包括向受试者推荐额外的癌症监测。

系统和计算机辅助方法

本文提供了用于实施本文提供的方法的系统,所述方法包括但不限于检测受试者的非转移性癌症的方法,测量来自受试者的样品中的无细胞脱氧核糖核酸(cfDNA)大小分布的方法,或检测来自受试者的样品中的肿瘤cfDNA的方法。本文的系统可包括被配置为接收用户请求的计算机和扩增系统,该扩增系统响应于用户请求,对样品或其部分中的cfDNA多核苷酸进行核酸扩增反应。该系统可进一步包括测序系统,该测序系统对扩增的cfDNA多核苷酸进行测序以产生多个测序读取,确定受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度,并产生样品中的多个cfDNA多核苷酸的总cfDNA片段大小分布。该系统可进一步包括向接收者发送报告的报告生成器。在更具体的实施方案中,本文的系统可包括被配置为接收用户请求以对样品进行非转移性癌症检测的计算机和扩增系统,该扩增系统响应于用户请求,对样品或其部分中的cfDNA多核苷酸进行核酸扩增反应。该系统可进一步包括测序系统,该测序系统对扩增的cfDNA多核苷酸进行测序以产生多个测序读取,确定受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度,并产生样品中的多个cfDNA多核苷酸的总cfDNA片段大小分布。该系统另外可包括向接收者发送报告的报告生成器,其中该报告包含指示受试者中的非转移性癌症风险的结果。在一些实施方案中,该方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些情况下,该方法不包括针对靶序列进行富集。在一些情况下,该方法不包括将cfDNA多核苷酸序列与参考基因组进行比对或作图。

在用于实施本文提供的方法的系统中,在某些实施方案中,该系统包括用于从受试者的血液样品中分离cfDNA多核苷酸的分离系统。在一些实施方案中,该分离系统包括离心机。在一些实施方案中,该分离系统包括柱,如核酸结合柱。在一些实施方案中,该分离系统包括过滤器。在一些实施方案中,该分离系统包括用于从受试者的血液样品中分离cfDNA的上述特征的组合。

在用于实施本文提供的方法的系统的某些方面,所述系统可将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。本文提供的系统可包括使用任何合适的方法测量cfDNA大小的系统。测量cfDNA大小分布的合适的方法包括但不限于测序、生物分析仪片段分析、PCR、qPCR、高通量凝胶电泳、高通量毛细管电泳或其他任何提供DNA片段大小的合适方法。

在本文提供的系统中,在某些情况下,所述多个cfDNA多核苷酸仅包含一小部分循环肿瘤脱氧核糖核酸(ctDNA)。例如,在一些实施方案中,所述多个cfDNA多核苷酸包含少于25%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于20%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于15%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于10%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于5%的ctDNA。

在一些情况下,本文提供的系统包括用于从受试者样品中的多核苷酸制备DNA文库的模块。例如,在一些实施方案中,所述方法进一步包括从所述受试者的所述cfDNA多核苷酸制备单链DNA文库。制备单链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备单链DNA文库的方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,使用PCR);并在测序仪上对所述文库进行测序。另一种单链文库制备方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,通过PCR);在一些情况下,利用与捕获探针的杂交针对感兴趣的区域进行富集;扩增(例如,通过PCR)捕获的产物;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

所述方法可进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。制备双链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备双链DNA文库的方法可包括将测序衔接子连接至多个DNA片段的5’和3’端,并在测序仪上对所述文库进行测序。另一种双链DNA文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR将完整的衔接子序列附接至连接的片段上;并在测序仪上对所述文库进行测序。另一种方法可包括将衔接子连接至多个DNA片段的5’和3’端;通过与连接的衔接子互补的PCR扩增连接的产物;在一些情况下,通过与捕获探针的杂交针对感兴趣的区域进行富集;PCR扩增捕获的产物;并在测序仪上对所述文库进行测序。另一种双链文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR扩增连接的产物;将双链PCR产物环化或使单链PCR产物变性并环化;在一些情况下,使用靶向特定基因的引物,通过PCR针对感兴趣的区域进行富集;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

本文提供的系统可进一步包括用于扩增和测序步骤的模块,包括一个或多个进行以下步骤的模块:环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸,扩增所述环状多核苷酸,对所述扩增的多核苷酸进行测序以产生多个测序读取,以及确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。在一些实施方案中,本文的系统不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。

在一些情况下,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,本文提供的系统检测到所述受试者中的非转移性癌症。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至50碱基、10个碱基至70碱基、10个碱基至105碱基、10个碱基至115碱基、10个碱基至125碱基、10个碱基至170碱基、25个碱基至50碱基、25个碱基至70碱基、25个碱基至105碱基、25个碱基至115碱基、25个碱基至125碱基、25个碱基至170碱基、50个碱基至70碱基、50个碱基至105碱基、50个碱基至115碱基、50个碱基至125碱基、50个碱基至170碱基、70个碱基至105碱基、70个碱基至115碱基、70个碱基至125碱基、70个碱基至170碱基、105个碱基至115碱基、105个碱基至125碱基、105个碱基至170碱基、115个碱基至125碱基、115个碱基至170碱基或125个碱基至170个碱基的片段增加。

在一些情况下,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,本文提供的系统检测到所述受试者中的非转移性癌症。可替代地或组合地,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。在本文提供的系统的一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加20%。

在一些情况下,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,本文提供的系统检测到所述受试者中的非转移性癌症。可替代地或组合地,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。在本文提供的系统的一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加20%。

本文进一步提供了用于检测受试者的非转移性癌症的系统,该系统包括被配置为接收用户请求的计算机和扩增系统,该扩增系统响应于用户请求,对样品或其部分中的cfDNA多核苷酸进行核酸扩增反应。该系统可进一步包括测序系统,该测序系统对扩增的cfDNA多核苷酸进行测序以产生多个测序读取,确定受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度,并产生样品中的多个cfDNA多核苷酸的总cfDNA片段大小分布。该系统可进一步包括向接收者发送报告的报告生成器。在更具体的实施方案中,本文的系统可包括被配置为接收用户请求以对样品进行非转移性癌症检测的计算机和扩增系统,该扩增系统响应于用户请求,对样品或其部分中的cfDNA多核苷酸进行核酸扩增反应。该系统可进一步包括测序系统,该测序系统对扩增的cfDNA多核苷酸进行测序以产生多个测序读取,确定受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度,并产生样品中的多个cfDNA多核苷酸的总cfDNA片段大小分布。该系统可进一步包括向接收者发送报告的报告生成器,其中该报告包含指示受试者的非转移性癌症风险的结果;其中当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中至少2、3、4、5、6、7、8、9、10个或更多个大小在10个碱基至170个碱基范围内的cfDNA片段增加时,所述报告将所述受试者归类为具有增加的非转移性癌症风险。

在本文提供的某些系统中,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,所述系统可将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加20%。

在本文提供的某些系统中,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,所述系统可将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加20%。

在本文提供的某些系统中,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,所述系统可将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加20%。

在本文提供的系统的某些方面,在一些情况下,在可以使用常规方法检测到之前,受试者可患有癌症,但处于极早期。在一些情况下,所述受试者没有被诊断为转移性癌症。或者,所述受试者具有低肿瘤负荷,例如,在一些情况下,所述受试者具有小于20%的肿瘤负荷。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述受试者具有小于9%的肿瘤负荷。在一些实施方案中,所述受试者具有小于8%的肿瘤负荷。在一些实施方案中,所述受试者具有小于7%的肿瘤负荷。在一些实施方案中,所述受试者具有小于6%的肿瘤负荷。在一些实施方案中,所述受试者具有小于5%的肿瘤负荷。或者,使用本文方法检测的早期癌症包括早期的非转移性癌症,其可使用数字分类系统进行分类。在一些情况下,早期癌症根据癌症类型进行分期。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。

使用本文系统可检测的癌症和肿瘤cfDNA可包括但不限于结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌或脑癌。

在本文提供的系统中,在一些情况下,所述系统准备包含用于处理癌症的额外步骤的报告。在一些实施方案中,该报告推荐对受试者中的癌症的治疗。在一些实施方案中,该报告向受试者推荐施用化学疗法。在一些实施方案中,该报告向受试者推荐额外的癌症监测。

本文另外提供了计算机辅助方法,例如包含代码的计算机可读介质,所述代码在被一个或多个处理器执行时可以实现本文提供的方法,包括但不限于检测受试者的非转移性癌症的方法,测量受试者样品中的cfDNA大小分布的方法,或检测受试者样品中的肿瘤cfDNA。在一些实施方案中,提供了包含代码的计算机可读介质,所述代码在被一个或多个处理器执行时实现以下方法,该方法包括接收客户请求以对来自受试者的样品进行检测或测量,并对该样品或其部分中的cfDNA多核苷酸进行核酸扩增反应。接下来,进行测序分析,包括以下操作:对扩增的cfDNA多核苷酸进行测序以产生多个测序读取;确定受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度;以及产生样品中的多个cfDNA多核苷酸的总cfDNA片段大小分布。在一些情况下,生成报告。在更具体的实施方案中,提供了包含代码的计算机可读介质,所述代码在被一个或多个处理器执行时实现检测受试者的非转移性癌症的方法,该方法包括接收客户请求以对来自受试者的样品进行非转移性癌症的检测,并对该样品或其部分中的cfDNA多核苷酸进行核酸扩增反应。接下来,可进行测序分析,包括以下操作:对扩增的cfDNA多核苷酸进行测序以产生多个测序读取;确定受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度;以及产生样品中的多个cfDNA多核苷酸的总cfDNA片段大小分布。在一些情况下,生成报告,其包含指示受试者的非转移性癌症风险的结果。

在用于实施本文提供的方法的计算机可读介质中,该计算机可读介质可以实现用于从受试者的血液样品中分离cfDNA多核苷酸的分离系统。在一些实施方案中,该分离系统包括离心机。在一些实施方案中,该分离系统包括柱,如核酸结合柱。在一些实施方案中,该分离系统包括过滤器。在一些实施方案中,该分离系统包括用于从受试者的血液样品中分离cfDNA的上述特征的组合。在一些实施方案中,该方法进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。在一些情况下,该方法不包括针对靶序列进行富集。在一些情况下,该方法不包括将cfDNA多核苷酸序列与参考基因组进行比对或作图。

在用于实施本文提供的方法的计算机可读介质的某些方面,所述方法可包括将受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。本文提供的测量cfDNA大小分布的方法可包括任何合适的测量DNA大小的方法。测量cfDNA大小分布的合适的方法可包括但不限于测序、生物分析仪片段分析、PCR、qPCR、高通量凝胶电泳、高通量毛细管电泳或其他任何提供DNA片段大小的合适方法。

在一些情况下,本文提供的计算机可读介质实现从受试者样品中的多核苷酸制备DNA文库的方法。例如,该方法可进一步包括从所述受试者的所述cfDNA多核苷酸制备单链DNA文库。制备单链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备单链DNA文库的方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,使用PCR);并在测序仪上对所述文库进行测序。另一种单链文库制备方法可包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,通过PCR);在一些情况下,利用与捕获探针的杂交针对感兴趣的区域进行富集;扩增(例如,通过PCR)捕获的产物;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

可替代地或组合地,所述方法可进一步包括从所述受试者的所述cfDNA多核苷酸制备双链DNA文库。制备双链DNA文库的任何合适的方法可在本文的方法中使用。例如,制备双链DNA文库的方法可包括将测序衔接子连接至多个DNA片段的5’和3’端,并在测序仪上对所述文库进行测序。另一种双链DNA文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR将完整的衔接子序列附接至连接的片段上;并在测序仪上对所述文库进行测序。另一种方法可包括将衔接子连接至多个DNA片段的5’和3’端;通过与连接的衔接子互补的PCR扩增连接的产物;在一些情况下,通过与捕获探针的杂交针对感兴趣的区域进行富集;PCR扩增捕获的产物;并在测序仪上对所述文库进行测序。另一种双链文库制备方法可包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR扩增连接的产物;将双链PCR产物环化或使单链PCR产物变性并环化;在一些情况下,使用靶向特定基因的引物,通过PCR针对感兴趣的区域进行富集;并在测序仪上对所述文库进行测序。该方法可进一步包括使用引物或捕获探针的序列分析所得序列(例如,测序读取),例如通过根据引物或捕获探针的序列将所得序列(例如,测序读取)分组——例如,将单独的测序读取分配到各自对应于引物或捕获探针的序列的单独组中。这可以在不将此类所得序列与基因组进行比对的情况下进行。

本文的计算机可读介质可以实现扩增和测序步骤的方法,包括一个或多个进行以下步骤的模块:环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸,扩增所述环状多核苷酸,对所述扩增的多核苷酸进行测序以产生多个测序读取,以及确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。在一些实施方案中,本文的计算机可读介质不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。

在本文提供的计算机可读介质中,所述多个cfDNA多核苷酸可能仅包含一小部分ctDNA。例如,在一些实施方案中,所述多个cfDNA多核苷酸包含少于25%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于20%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于15%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于10%的ctDNA。在一些实施方案中,所述多个cfDNA多核苷酸包含少于5%的ctDNA。

在一些情况下,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,本文提供的计算机可读介质实现检测所述受试者中的非转移性癌症的方法。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至50碱基、10个碱基至70碱基、10个碱基至105碱基、10个碱基至115碱基、10个碱基至125碱基、10个碱基至170碱基、25个碱基至50碱基、25个碱基至70碱基、25个碱基至105碱基、25个碱基至115碱基、25个碱基至125碱基、25个碱基至170碱基、50个碱基至70碱基、50个碱基至105碱基、50个碱基至115碱基、50个碱基至125碱基、50个碱基至170碱基、70个碱基至105碱基、70个碱基至115碱基、70个碱基至125碱基、70个碱基至170碱基、105个碱基至115碱基、105个碱基至125碱基、105个碱基至170碱基、115个碱基至125碱基、115个碱基至170碱基或125个碱基至170个碱基的片段增加。

在一些情况下,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,本文提供的计算机可读介质实现检测所述受试者中的非转移性癌症的方法。可替代地或组合地,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段增加时,所述方法可将所述受试者归类为具有增加的非转移性癌症风险。在本文提供的计算机可读介质的一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为10个碱基至170个碱基的片段至少增加20%。

在一些情况下,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,本文提供的计算机可读介质实现检测所述受试者中的非转移性癌症的方法。可替代地或组合地,当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,所述方法可将所述受试者归类为具有增加的非转移性癌症风险。在本文提供的计算机可读介质的一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加20%。

在一些实施方案中,提供了包含代码的计算机可读介质,所述代码在被一个或多个处理器执行时实现以下方法,该方法包括接收客户请求以对来自受试者的样品进行检测或测量,并对该样品或其部分中的cfDNA多核苷酸进行核酸扩增反应。接下来,可进行测序分析,包括以下操作:对扩增的cfDNA多核苷酸进行测序以产生多个测序读取,确定受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度,以及产生样品中的多个cfDNA多核苷酸的总cfDNA片段大小分布。可以生成报告,其中当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中至少2、3、4、5、6、7、8、9、10个或更多个大小在10个碱基至170个碱基范围内的cfDNA片段增加时,该报告将所述受试者归类为具有增加的非转移性癌症风险。

本文提供的计算机可读介质可以实现以下方法:当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加20%。

本文提供的计算机可读介质可以实现以下方法:当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加20%。

本文提供的计算机可读介质可以实现以下方法:当所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.25%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加2%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加3%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加4%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加5%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加6%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加7%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加8%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加9%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加15%。在一些实施方案中,所述cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加20%。

在本文提供的计算机可读介质的某些方面,在一些情况下,在可以使用常规方法检测到之前,受试者可患有癌症,但处于极早期。在一些情况下,所述受试者没有被诊断为转移性癌症。或者,所述受试者具有低肿瘤负荷,例如,所述受试者可具有小于20%的肿瘤负荷。在一些实施方案中,所述受试者具有小于10%的肿瘤负荷。在一些实施方案中,所述受试者具有小于9%的肿瘤负荷。在一些实施方案中,所述受试者具有小于8%的肿瘤负荷。在一些实施方案中,所述受试者具有小于7%的肿瘤负荷。在一些实施方案中,所述受试者具有小于6%的肿瘤负荷。在一些实施方案中,所述受试者具有小于5%的肿瘤负荷。或者,使用本文方法检测的早期癌症包括早期的非转移性癌症,其有时使用数字分类系统进行分类。在一些情况下,早期癌症根据癌症类型进行分期。在一些实施方案中,所述非转移性癌症为0期、1期、2期或3期。

使用本文计算机可读介质可检测的癌症和肿瘤cfDNA可包括但不限于结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌或脑癌。

在本文提供的计算机可读介质中,在一些情况下,该计算机可读介质实现包含用于处理癌症的额外步骤的报告的准备。在一些实施方案中,该报告推荐对受试者中的癌症的治疗。在一些实施方案中,该报告向受试者推荐施用化学疗法。在一些实施方案中,该报告向受试者推荐额外的癌症监测。

系统中使用的计算机可包含一个或多个处理器。处理器可与一个或多个控制器、计算单元和/或计算机系统的其他单元相关联,或者根据需要植入到固件中。如果在软件中实现,则例程可以存储在任何计算机可读存储器如RAM、ROM、闪速存储器、磁盘、光盘或其他合适的存储介质中。同样地,该软件可经由各种传送方法而传送至计算设备,所述传送方法例如包括通过诸如电话线、因特网、无线连接等通信信道,或者经由诸如计算机可读盘、闪存驱动器等可移动介质。各个步骤可以作为各个区块、操作、工具、模块或技术来实现,后者又可以以硬件、固件、软件或者硬件、固件和/或软件的任意组合来实现。当以硬件实现时,一些或所有区块、操作、技术等可以在例如定制集成电路(IC)、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、可编程逻辑阵列(PLA)等中实现。可以在系统的实施方案中使用客户端-服务器关系数据库架构。客户端-服务器架构是网络架构,其中网络上的每个计算机或进程都是客户端或服务器。服务器计算机可以是用于管理磁盘驱动器(文件服务器)、打印机(打印服务器)或网络流量(网络服务器)的强力计算机。客户端计算机包括用户运行应用程序的PC(个人计算机)或工作站,以及如本文公开的示例输出设备。客户端计算机依赖服务器计算机来获取资源,如文件、设备甚至处理能力。在一些实施方案中,服务器计算机处理所有数据库功能。客户端计算机可具有处理所有前端数据管理的软件,并且还可以接收来自用户的数据输入。

可以将系统配置用于接收关于对样品进行检测反应的用户请求。用户请求可以是直接的或间接的。直接请求的实例包括通过输入设备如键盘、鼠标或触摸屏传输的请求。间接请求的实例包括通过通信介质的传输,如通过因特网(有线或无线)的传输。

所述系统可以进一步包括扩增系统,该扩增系统响应于用户请求,对样品或其部分进行核酸扩增反应。有多种扩增多核苷酸(例如DNA和/或RNA)的方法是可获得的。扩增可以是线性的、指数式的,或在多阶段扩增过程中既涉及线性阶段又涉及指数阶段。扩增方法可涉及温度的变化,如热变性步骤,或者可以是不需要热变性的等温过程。本文描述了合适的扩增过程的非限制性实例,如关于本公开的多个方面中的任一方面所述。在一些实施方案中,扩增包括滚环扩增(RCA)。用于扩增多核苷酸的多种系统是可用的,并且可以基于待进行的扩增反应的类型而不同。例如,对于包含温度变化循环的扩增方法,扩增系统可包括热循环仪。扩增系统可包括实时扩增和检测仪器,如Applied Biosystems、Roche和Strategene制造的系统。在一些实施方案中,扩增反应包括以下步骤:(i)将单独的多核苷酸环化以形成多个环状多核苷酸,每个环状多核苷酸在5’端与3’端之间具有接点;以及(ii)扩增所述环状多核苷酸。样品、多核苷酸、引物、聚合酶和其他试剂可以是本文所述的那些,如关于多个方面中的任一方面所述。本文提供了环化过程(例如,使用和不使用衔接子寡核苷酸)、试剂(例如衔接子的类型、连接酶的使用)、反应条件(例如有利于自接合)、任何必要的额外加工(例如反应后纯化)和由此形成的接点的非限制性实例,如关于本公开的多个方面中的任一方面所述。可以选择和/或设计系统来执行任何这样的方法。

系统可进一步包括测序系统,该测序系统生成由扩增系统扩增的多核苷酸的测序读取,鉴定测序读取与参考序列之间的序列差异,并将出现在具有不同接点的至少两个环状多核苷酸中的序列差异判定为序列变体。测序系统和扩增系统可以相同,或包括重叠的设备。例如,扩增系统和测序系统可以使用相同的热循环仪。多种用于所述系统的测序平台是可获得的,并且可以基于所选的测序方法来选择。本文描述了测序方法的实例。扩增和测序可涉及使用液体处理器。几种可商购获得的液体处理系统可以用来运行这些过程的自动化(实例请参见例如来自Perkin-Elmer、Beckman Coulter、Caliper Life Sciences、Tecan、Eppendorf、Apricot Design、Velocity 11的液体处理器)。多种自动测序机器是可商购获得的,并且包括由Life Technologies(SOLiD平台和基于pH的检测)、Roche(454平台)、Illumina(例如基于流动池的系统,如Genome Analyzer装置)制造的测序仪。在2、3、4、5个或更多个自动化装置之间(例如,在液体处理器和测序装置中的一个或多个之间)的传输可以是手动的或自动的。

所述系统可进一步包括报告生成器,后者向接收者发送报告,其中该报告包含序列变体的检测结果。可以实时生成报告,如在测序读取期间或在分析测序数据时,随着过程的进展定期更新。另外或备选地,可以在分析结束时生成报告。报告可以自动生成,如当测序系统完成判定所有序列变体的步骤时。在一些实施方案中,该报告响应于来自用户的指令而生成。除了检测序列变体的结果之外,报告还可包含基于一个或多个序列变体的分析。例如,在一个或多个序列变体与特定污染物或表型相关联的情况下,该报告可以包含关于该关联的信息,如存在污染物或表型的可能性,存在的水平,以及在一些情况下,基于这些信息的建议(例如,额外的测试、监测或补救措施)。报告可以采用多种形式。可以设想,与本公开相关的数据可以通过这样的网络或连接(或用于传输信息的其他任何合适的方法,包括但不限于邮寄实物报告,如打印的报告)进行传输,以供接收者接收和/或查看。接收者可以是但不限于个体或电子系统(例如,一个或多个计算机,和/或一个或多个服务器)。

包含计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括,例如,光盘或磁盘,如任何计算机中的任何存储设备等,例如可用来实现数据库等。易失性存储介质包括动态存储器,如这样的计算机平台的主存储器。有形传输介质包括同轴电缆、铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如在射频(RF)和红外线(IR)数据通信期间生成的那些信号或波。因此,计算机可读介质的常见形式包括,例如:软盘、柔性盘、硬盘、磁带、其他任何磁性介质、CD-ROM、DVD或DVD-ROM、其他任何光学介质、穿孔卡片纸带、其他任何具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、其他任何存储器芯片或匣盒、传输数据或指令的载波、传输这类载波的线缆或链路,或者计算机可以从中读取编程代码和/或数据的其他任何介质。这些计算机可读介质形式中的许多形式可以参与将一个或多个指令的一个或多个序列运载到处理器以供执行。

本计算机可执行代码可以在包含处理器的任何合适的设备上执行,该设备包括服务器、PC或移动设备,如智能手机或平板计算机。在一些情况下,任何控制器或计算机包括监视器,该监视器可以是阴极射线管(“CRT”)显示器、平板显示器(例如,有源矩阵液晶显示器、液晶显示器等)或其他监视器。计算机电路可放置在盒子中,该盒子包含许多集成电路芯片,如微处理器、存储器、接口电路等。在一些情况下,该盒子还包含硬盘驱动器、软盘驱动器、高容量可移动驱动器如可写CD-ROM以及其他常见外围元件。在一些情况下,输入设备,如键盘、鼠标或触摸敏感屏幕,提供来自用户的输入。计算机可包括用于接收用户指令的适当软件,该指令可以是用户输入成一组参数字段的形式,例如GUI的形式,或者是预编程指令的形式,例如,针对多种不同的具体操作预编程的指令形式。

计算机系统

本公开提供了计算机系统,其被编程用于实现本公开的方法。图3示出了被编程或以其他方式配置用于实现本公开的方法的计算机系统301。计算机系统301可以调节本公开的方法的各个方面,例如用于确定受试者患病(例如,癌症)或处于患病风险中的方法。

计算机系统301包括中央处理单元(CPU,本文中也称为“处理器”和“计算机处理器”)305,中央处理单元305可以是单核或多核处理器,或者用于并行处理的多个处理器。计算机系统301还包括存储器或存储器位置310(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元315(例如,硬盘)、用于与一个或多个其他系统通信的通信接口320(例如,网络适配器)和外围设备325,如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器310、存储单元315、接口320和外围设备325通过诸如主板的通信总线(实线)与CPU 305通信。存储单元315可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统301可以借助于通信接口320可操作地耦合至计算机网络(“网络”)330。网络330可以是因特网、互联网和/或外联网,或者与因特网通信的内联网和/或外联网。网络330在一些情况下是电信和/或数据网络。网络330可以包括能够实现分布式计算如云计算的一个或多个计算机服务器。在一些情况下,网络330借助于计算机系统301可以实现对等网络,这可以使得耦合至计算机系统301的设备能够起到客户端或服务器的作用。

CPU 305可以执行一系列可以在程序或软件中体现的机器可读指令。所述指令可以存储在诸如存储器310的存储器位置中。所述指令可被导向CPU 305,其随后可对CPU 305进行编程或以其他方式进行配置,以实现本公开的方法。由CPU 305执行的操作的实例可以包括获取、解码、执行和写回。

CPU 305可以是电路如集成电路的一部分。系统301中的一个或多个其他组件可被包括在该电路中。在一些情况下,该电路是专用集成电路(ASIC)。

存储单元315可以存储文件,如驱动程序、文库和保存的程序。存储单元315可以存储用户数据,例如,用户偏好和用户程序。在一些情况下,计算机系统301可以包括位于计算机系统301外部(诸如位于通过内联网或因特网与计算机系统301通信的远程服务器上)的一个或多个附加数据存储单元。

计算机系统301可以通过网络330与一个或多个远程计算机系统通信。例如,计算机系统301可以与用户(例如,医疗保健提供者或患者)的远程计算机系统进行通信。远程计算机系统的实例包括个人计算机(例如,便携式PC)、平板或平板PC(例如,iPad、Galaxy Tab)、电话、智能电话(例如,iPhone、支持Android的设备、)或个人数字助理。用户可以通过网络330访问计算机系统301。

如本文所述的方法可通过存储在计算机系统301的电子存储位置上(例如存储器310或电子存储单元315上)的机器(例如,计算机处理器)可执行代码来实现。该机器可执行代码或机器可读代码可以以软件的形式提供。在使用期间,该代码可以由处理器305执行。在一些情况下,该代码可从存储单元315中检索并存储在存储器310上,以备处理器305访问。在一些情况下,可以不包括电子存储单元315,而将机器可执行指令存储在存储器310上。

可将所述代码预编译并配置用于与具有适于执行该代码的处理器的机器一起使用,或者可以在运行过程中对其进行编译。该代码可以以编程语言的形式提供,该编程语言可以被选择为使得该代码能够以预编译或实时编译的方式执行。

本文提供的系统和方法的各方面,如计算机系统301,可以在编程中体现。该技术的各个方面可以被认为是“产品”或“制品”,其一般为在某种类型的机器可读介质中携带或体现的机器(或处理器)可执行代码和/或关联数据的形式。机器可执行代码可以存储在电子存储单元如存储器(例如,只读存储器、随机存取存储器、闪速存储器)或硬盘上。“存储”型介质可以包括计算机、处理器等的任何或全部有形存储器,或其相关模块,如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可以随时为软件编程提供非暂时性存储。软件的全部或部分可以不时地通过因特网或各种其他电信网络进行通信。例如,这样的通信可以使软件能够从一台计算机或处理器加载到另一台计算机或处理器,例如,从管理服务器或主机加载到应用服务器的计算机平台。因此,可以承载软件元件的另一类型的介质包括光波、电波和电磁波,诸如跨越本地设备之间的物理接口、通过有线和光学陆线网络以及经由各种空中链路所使用的。携带这类波的物理元件,如有线或无线链路、光学链路等,也可以被认为是承载软件的介质。除非局限于非暂时性有形“存储”介质,否则如本文所用的诸如计算机或机器“可读介质”等术语是指参与向处理器提供指令以供执行的任何介质。

因此,机器可读介质,如计算机可执行代码,可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括,例如,光盘或磁盘,如任何计算机中的任何存储设备等,例如可用来实现附图中所示的数据库等。易失性存储介质包括动态存储器,如这样的计算机平台的主存储器。有形传输介质包括同轴电缆、铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如在射频(RF)和红外线(IR)数据通信期间生成的那些信号或波。因此,计算机可读介质的常见形式包括,例如:软盘、柔性盘、硬盘、磁带、其他任何磁性介质、CD-ROM、DVD或DVD-ROM、其他任何光学介质、穿孔卡片纸带、其他任何具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、其他任何存储器芯片或匣盒、传输数据或指令的载波、传输这类载波的线缆或链路,或者计算机可以从中读取编程代码和/或数据的其他任何介质。这些计算机可读介质形式中的许多形式可以参与将一个或多个指令的一个或多个序列运载到处理器以供执行。

计算机系统301可以包括电子显示器335或与电子显示器335通信,电子显示器335包括用于例如提供本公开的方法的结果的用户界面(UI)340。UI的实例包括但不限于图形用户界面(GUI)和基于网络的用户界面。

本公开的方法和系统可以通过一个或多个算法来实现。算法可以通过软件在由中央处理单元305执行时实现。该算法可以是,例如,经训练的算法(或经训练的机器学习算法),例如支持向量机或神经网络。

扩增和文库制备方法

本文的方法可包括扩增存在于来自受试者的样品中的多核苷酸。本文使用的扩增方法可包括滚环扩增。可替代地或组合地,本文使用的扩增方法可包括PCR。在一些情况下,本文的扩增方法包括线性扩增。在一些情况下,扩增不针对一个基因或一组基因,而是扩增整个核酸样品。在一些情况下,所述方法包括使多个多核苷酸中单独的多核苷酸环化,以形成多个环状多核苷酸,每个环状多核苷酸在5’端与3’端之间具有接点,并扩增所述环状多核苷酸以产生扩增的多核苷酸。在另外的情况下,扩增方法包括剪切所扩增的多核苷酸以产生剪切的多核苷酸,每个剪切的多核苷酸在5’端和/或3’端包含一个或多个剪切点。在一些情况下,该方法包括针对靶序列或多个靶序列进行富集。在一些情况下,该方法不包括针对靶序列进行富集。在一些情况下,该方法不包括将cfDNA多核苷酸序列与参考基因组进行比对或作图。

通常,多核苷酸的末端彼此接合以形成环状多核苷酸(直接地,或者使用一个或多个居间衔接子寡核苷酸)会产生具有接合序列的接点。当多核苷酸的5’端和3’端通过衔接子多核苷酸接合时,术语“接点”可指该多核苷酸与衔接子之间的接点(例如,5’端接点或3’端接点之一),或指多核苷酸的5’端与3’端之间由衔接子多核苷酸形成且包含衔接子多核苷酸的接点。当多核苷酸的5’端和3’端在没有居间衔接子的情况下接合时(例如单链DNA的5’端和3’端),术语“接点”是指这两个末端接合的点。接点可通过构成该接点的核苷酸序列(也称为“接合序列”)来鉴定。

在一些实施方案中,样品包含具有通过以下过程形成的末端混合物的多核苷酸:自然降解过程(如细胞裂解、细胞死亡以及多核苷酸如DNA和RNA从细胞释放到其周围环境中的其他过程,多核苷酸在该周围环境中可进一步降解,例如无细胞多核苷酸,例如无细胞DNA和无细胞RNA)。当多核苷酸末端在没有居间衔接子的情况下接合时,接合序列可通过与参考序列进行比对来鉴定。例如,在两个组成序列的顺序相对于参考序列似乎颠倒的情况下,似乎发生颠倒的点可以指示在该点处的接点。当多核苷酸末端通过一个或多个衔接子序列接合时,接点可通过与已知衔接子序列的接近度来鉴定,或者如果测序读取的长度足以从环化多核苷酸的5’和3’端均获得序列,则通过如上所述的比对来鉴定。

在一些实施方案中,单独的多核苷酸的环化通过使所述多个多核苷酸经历连接反应来实现。该连接反应可包含连接酶。在一些实施方案中,连接酶在扩增之前降解。连接酶在扩增之前降解可以提高可扩增多核苷酸的回收率。在一些实施方案中,所述多个环化多核苷酸在扩增之前不纯化或不分离。在一些实施方案中,未环化的线性多核苷酸在扩增之前降解。

多核苷酸(例如,来自样品的多核苷酸)可以在环化之前富集。这可以使用靶标特异性引物进行。或者,这可以使用捕获序列,如附接至基底上的下拉探针或捕获序列(例如,附接至阵列或珠子上的下拉探针或捕获序列)来进行。在环化之前可以使用诱饵组针对靶标特异性序列进行富集。

在一些情况下,环化包括将衔接子多核苷酸接合到所述多个多核苷酸中的多核苷酸的5’端、3’端或5’端和3’端二者的操作。如前所述,当多核苷酸的5’端和/或3’端通过衔接子多核苷酸接合时,术语“接点”可指该多核苷酸与衔接子之间的接点(例如,5’端接点或3’端接点之一),或指多核苷酸的5’端与3’端之间由衔接子多核苷酸形成且包含衔接子多核苷酸的接点。

例如,可以在连接酶降解后扩增环化的多核苷酸,以产生扩增的多核苷酸。环状多核苷酸的扩增可通过聚合酶来实现。在一些情况下,该聚合酶是具有链置换活性的聚合酶。在一些情况下,该聚合酶是Phi29DNA聚合酶。或者,该聚合酶是不具有链置换活性的聚合酶。在一些情况下,该聚合酶是T4 DNA聚合酶或T7 DNA聚合酶。可替代地或组合地,该聚合酶是Taq聚合酶或Taq聚合酶家族中的聚合酶。在一些情况下,扩增包括滚环扩增(RCA)。由RCA产生的扩增多核苷酸可包括线性多联体,或包含来自模板多核苷酸的超过一个拷贝的靶序列(例如,亚基序列)的多核苷酸。在一些实施方案中,扩增包括使环状多核苷酸经受包含随机引物的扩增反应混合物。在一些实施方案中,扩增包括使环状多核苷酸经受包含靶向引物的扩增反应混合物。或者,环状多核苷酸可以以非靶向方式扩增,并在扩增后针对一个或多个靶序列进行富集。在一些情况下,扩增包括使环状多核苷酸经受包含一种或多种引物的扩增反应混合物,每种引物通过序列互补性与不同的靶序列特异性杂交。在一些情况下,扩增包括使环状多核苷酸经受包含反向引物的扩增反应混合物。

在一些情况下,对扩增的多核苷酸进行剪切,以产生长度相对于未剪切的多核苷酸较短的剪切多核苷酸。源自相同线性多联体的两个或更多个剪切的多核苷酸可具有相同的接合序列,但可具有不同的5’和/或3’端(例如剪切末端)。

可以使用多种方法,例如但不限于物理片段化、酶方法和化学片段化,对扩增的多核苷酸进行剪切。可用于将扩增的多核苷酸片段化的物理片段化方法的非限制性实例包括声学剪切、超声处理和流体动力学剪切。在一些情况下,可使用声学剪切和超声处理。可用于将扩增的多核苷酸片段化的酶促片段化方法的非限制性实例包括使用酶,如DNA酶I和其他限制性内切核酸酶,包括非特异性核酸酶和转座酶。可用于将扩增的多核苷酸片段化的化学片段化方法的非限制性实例包括使用热和二价金属阳离子。

与未剪切的多核苷酸相比长度较短的剪切多核苷酸(也称为片段化的多核苷酸)可能需要与用于产生测序读取(也称为序列读取)的测序仪器的能力相匹配。例如,可将扩增的多核苷酸片段化(例如剪切)为取决于下游测序平台的最佳长度。本文进一步描述的各种测序仪器可以适应不同长度的核酸。在一些情况下,扩增的多核苷酸在附接可用于下游测序平台的衔接子的过程中,例如在流动池附着或测序引物结合中被剪切。在一些情况下,剪切的多核苷酸在测序之前经历扩增,以产生剪切多核苷酸的扩增产物。可能需要额外的扩增,例如,以生成足量的多核苷酸以供下游分析,例如测序分析。所得的扩增产物可包含多个拷贝的单独的剪切多核苷酸。

来自样品的无细胞多核苷酸可以是多个多核苷酸中的任意多核苷酸,包括但不限于DNA、RNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、信使RNA(mRNA),其中任意一种的片段,或其中任意两种或更多种的组合。在一些实施方案中,样品包含DNA。在一些实施方案中,样品包含无细胞基因组DNA。在一些实施方案中,样品包含通过扩增生成的DNA,例如通过使用引物和DNA聚合酶的任何合适的组合的引物延伸反应,包括但不限于聚合酶链反应(PCR)、逆转录及其组合。当引物延伸反应的模板是RNA时,逆转录的产物称为互补DNA(cDNA)。可用于引物延伸反应的引物可包含对一种或多种靶标具有特异性的序列、随机序列、部分随机序列及其组合。通常,样品多核苷酸包含样品中存在的任何多核苷酸,其可以包括或者可以不包括靶多核苷酸。多核苷酸可以是单链的、双链的或其组合。在一些实施方案中,经历本公开的方法的多核苷酸是单链多核苷酸,其可以存在或者可以不存在双链多核苷酸。在一些实施方案中,多核苷酸是单链DNA。单链DNA(ssDNA)可以是以单链形式分离的ssDNA,或以双链形式分离并随后为了本公开的方法中的一个或多个步骤而制成单链的DNA。

在一些实施方案中,在不进行提取步骤和/或不进行纯化步骤的情况下,使多核苷酸经历后续步骤(例如环化和扩增)。例如,可以在不进行提取步骤的情况下处理流体样品以除去细胞,以产生纯化的液体样品和细胞样品,随后从纯化的流体样品中分离DNA。有多种分离多核苷酸的程序是可用的,例如通过沉淀,或者与基底非特异性结合并随后洗涤该基底以释放结合的多核苷酸。在不进行细胞提取步骤的情况下从样品中分离多核苷酸时,多核苷酸将主要是细胞外或“无细胞”多核苷酸,如无细胞DNA和无细胞RNA,其可以对应于死亡或受损的细胞。这些细胞的特性可用来表征其所源自的细胞或细胞群体,如肿瘤细胞(例如癌症检测时)、胎儿细胞(例如产前诊断时)、来自移植组织的细胞(例如移植失败的早期检测时)或微生物群落的成员。

如果处理样品以便例如从样品中的细胞提取多核苷酸,则可使用多种提取方法。例如,可以通过用苯酚、苯酚/氯仿/异戊醇或类似的制剂(包括TRIzol和TriReagent)进行有机萃取来纯化核酸。提取技术的其他非限制性实例包括:(1)有机萃取后乙醇沉淀,例如,使用苯酚/氯仿有机试剂(Ausubel等人,1993,其通过引用整体并入本文),采用或不采用自动化的核酸提取器,例如,可从Applied Biosystems(Foster City,Calif.)获得的341型DNA提取器;(2)固定相吸附法(美国专利5,234,809;Walsh等人,1991,其各自通过引用整体并入本文);以及(3)盐诱导的核酸沉淀法(Miller等人,(1988),其通过引用整体并入本文),这类沉淀方法可被称为“盐析”法。核酸分离和/或纯化的另一个实例包括使用核酸能够特异性或非特异性结合的磁性颗粒,随后使用磁体分离珠子,并且洗涤并从珠子上洗脱核酸(参见,例如,美国专利5,705,628,其通过引用整体并入本文)。在一些实施方案中,上述分离方法之前可先进行酶消化步骤,以帮助从样品中除去不想要的蛋白质,例如用蛋白酶K或其他类似的蛋白酶进行消化。参见,例如,美国专利7,001,724,其通过引用整体并入本文。如果需要,可将RNA酶抑制剂加入到裂解缓冲液中。对于某些细胞或样品类型,可能希望在该方案中增加蛋白质变性/消化步骤。纯化方法可涉及分离DNA、RNA或两者。当在提取过程中或之后将DNA和RNA两者一起分离时,可以采用进一步的步骤与另一种分开地纯化一种或两者。还可生成提取的核酸的亚级分,例如,根据大小、序列或其他物理或化学特性进行纯化。除了初始核酸分离步骤外,核酸的纯化还可以在所公开的方法的任意步骤之后进行,例如用于去除过量的或不需要的试剂、反应物或产物。多种用于确定样品中的核酸量和/或核酸纯度的方法是可获得的,例如通过吸光度(例如,在260nm、280nm处的光吸收,和它们的比值)和标记物的检测(例如,荧光染料和嵌入剂,如SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoechst染色剂、SYBR金、溴化乙锭)。

如果需要,可以在进一步处理之前对来自样品的多核苷酸进行片段化。片段化可通过多种方法中的任何方法来完成,包括化学、酶促和机械片段化。在一些实施方案中,片段的平均长度或中值长度为约10个至约1,000个核苷酸,如10-800、10-500、50-500、90-200或50-150个核苷酸。在一些实施方案中,片段的平均长度或中值长度约为或少于约100、200、300、500、600、800、1000或1500个核苷酸。在一些实施方案中,片段为约90-200个核苷酸,并且/或者具有约150个核苷酸的平均长度。在一些实施方案中,片段化是以机械方式完成的,包括使样品多核苷酸经历声学超声处理。在一些实施方案中,片段化包括在适合于一种或多种酶的条件下,用一种或多种酶处理样品多核苷酸,以生成双链核酸断裂。可用于生成多核苷酸片段的酶的实例包括序列特异性核酸酶和非序列特异性核酸酶。核酸酶的非限制性实例包括DNA酶I、片段化酶、限制性内切核酸酶、其变体及其组合。例如,在不存在Mg++且存在Mn++的情况下,用DNA酶I消化可以诱导DNA中的随机双链断裂。在一些实施方案中,片段化包括用一种或多种限制性内切核酸酶处理样品多核苷酸。片段化可产生具有5’突出端、3'突出端、平端或其组合的片段。在一些实施方案中,如当片段化包括使用一种或多种限制性内切核酸酶时,对样品多核苷酸的切割留下具有可预测序列的突出端。可以通过标准方法,如柱纯化、珠纯化或从琼脂糖凝胶中分离,使片段化的多核苷酸经历对片段进行大小选择的步骤。

在一些情况下,本文的方法包括用核酸酶如DNA酶消化多核苷酸,包括DNA和cfDNA,该核酸酶切割不含DNA结合蛋白的DNA,包括cfDNA。一些这样的方法提供了用于对包括cfDNA在内的DNA上的蛋白质结合位点进行作图的信息。在这些方法中,将包括cfDNA在内的DNA分离以保留DNA-蛋白质相互作用,然后用DNA酶如DNA酶I处理以在DNA片段的无蛋白质区域切割包括cfDNA在内的DNA。使用本文提供的任何DNA提取方法进一步纯化切割的DNA(包括cfDNA)以去除蛋白质,然后用于本文提供的任何文库制备方法,包括但不限于环化、单链DNA文库制备和双链DNA文库制备。在一些情况下,DNA的DNA酶I处理包括分离DNA,用DNA酶I处理DNA,用缓冲液从处理过的DNA中去除蛋白质,用T4 DNA聚合酶处理DNA以产生平端,使用苯酚萃取和乙醇沉淀纯化DNA,在文库制备之前将连接体连接至DNA。在一些情况下,所述方法进一步包括在文库制备和测序之前用限制酶消化分离的生物素化DNA,仅产生DNA酶超敏位点的边界,如Crawford等人.Genome Res.2006.16(1)123-31所述,其通过引用整体并入本文。

在一些情况下,本文的方法包括从多核苷酸制备DNA文库。例如,本文的方法包括制备单链DNA文库。考虑任何合适的制备单链DNA文库的方法供本文的方法使用。例如,制备单链DNA文库的方法包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,使用PCR);并在测序仪上对所述文库进行测序。另一种单链文库制备方法包括使DNA样品变性以产生多个ssDNA;将衔接子连接至所述ssDNA分子的3’端;使用与该衔接子互补的引物合成第二链;将双链衔接子连接至延伸产物;使用靶向第一和第二衔接子的引物扩增第二链(例如,通过PCR);在一些情况下,利用与捕获探针的杂交针对感兴趣的区域进行富集;扩增(例如,通过PCR)捕获的产物;并在测序仪上对所述文库进行测序。

单链文库制备的进一步实例包括具有以下步骤的方法:用热不稳定的磷酸酶处理DNA以从DNA链的5’和3’端去除残留的磷酸基团;从DNA链中去除由胞嘧啶脱氨基衍生的脱氧尿嘧啶;将具有约10个核苷酸和长的3’生物素化间隔臂的5’-磷酸化衔接子寡核苷酸连接至DNA链的3’端;将衔接子连接的分子固定在链霉亲和素珠上;使用Bst聚合酶,使用与衔接子互补的5’加尾引物复制模板链;洗去过量的引物;使用T4DNA聚合酶去除3’突出端;使用平端连接将第二衔接子接合至新合成的链上;洗去过量的衔接子;通过热变性释放文库分子;使用有尾引物通过扩增添加包括条形码的全长衔接子序列;并对文库进行测序,如Gansauge等人.2013.Nature Protocols.8(4)737-748所述,其通过引用整体并入本文。

在另外的实施方案中,本文的方法包括制备双链DNA文库。考虑任何合适的制备双链DNA文库的方法供本文的方法使用。例如,制备双链DNA文库的方法包括将测序衔接子连接至多个DNA片段的5’和3’端,并在测序仪上对所述文库进行测序。另一种双链DNA文库制备方法包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR将完整的衔接子序列附接至连接的片段上;并在测序仪上对所述文库进行测序。另一种方法包括将衔接子连接至多个DNA片段的5’和3’端;通过与连接的衔接子互补的PCR扩增连接的产物;在一些情况下,通过与捕获探针的杂交针对感兴趣的区域进行富集;PCR扩增捕获的产物;并在测序仪上对所述文库进行测序。另一种双链文库制备方法包括将衔接子连接至多个DNA片段的5’和3’端;使用与连接的衔接子互补的引物,通过PCR扩增连接的产物;将双链PCR产物环化或使单链PCR产物变性并环化;在一些情况下,使用靶向特定基因的引物,通过PCR针对感兴趣的区域进行富集;并在测序仪上对所述文库进行测序。

双链文库制备的进一步实例包括Kinde等人描述的安全测序系统(Safe-Sequencing System)(Kinde等人.2011.Proc.Natl.Acad.Sci.,USA,108(23)9530-9535,其通过引用整体并入本文),其包括为每个模板分子分配唯一标识符(UID);扩增每个唯一标记的模板分子以创建UID家族;以及扩增产物的冗余测序。另一个实例包括Lv等人描述的循环单分子扩增和重测序技术(cSMART)(Lv等人.2015.Clin.Chem.,61(1)172-181,其通过引用整体并入本文),它用独特的条形码标记单分子,环化,靶向等位基因以通过反向PCR复制,然后对制备的文库进行测序并对存在的等位基因进行计数。

在本文提供的一些文库制备方法中,某些核酸分子(例如,cfDNA多核苷酸)是从多个核酸分子(例如,总cfDNA)中选择或富集的。当某些核酸分子或靶序列更有可能产生信息性结果时,可以选择或富集它们。例如,当某些核酸分子或靶序列对应于与健康受试者相比在患有癌症(例如早期癌症)的受试者中具有改变的大小差异的cfDNA序列时,可以选择这些核酸分子或靶序列。可以通过用靶标特异性引物扩增来选择或富集某些核酸分子。某些核酸分子可以通过将靶核酸分子与探针结合来选择或富集。例如,使用诱饵组选择或富集此类核酸分子。

在另外的文库制备方法中,使用抗体选择具有某些特征的cfDNA片段。在一些情况下,使用抗体选择甲基化或超甲基化的cfDNA片段。然后将选定的cfDNA片段用于本文所述的任何文库制备方法,包括环化、单链DNA文库制备和双链DNA文库制备。对此类分离的cfDNA片段进行测序可提供关于cfDNA中存在的特征的信息,包括诸如甲基化或超甲基化等修饰。

根据一些实施方案,来自样品的多个多核苷酸中的多核苷酸被环化。环化可包括将多核苷酸的5’端接合至同一多核苷酸的3’端,接合至该样品中的另一多核苷酸的3’端,或接合至来自不同来源的多核苷酸(例如,人工多核苷酸,如寡核苷酸衔接子)的3’端。在一些实施方案中,多核苷酸的5’端接合至同一多核苷酸的3’端(也称为“自接合”)。在一些实施方案中,选择环化反应的条件,以利于在特定长度范围内的多核苷酸的自接合,以便产生具有特定平均长度的环化多核苷酸群体。例如,可以选择环化反应条件,以利于长度短于约5000、2500、1000、750、500、400、300、200、150、100、50个或更少的核苷酸的多核苷酸的自接合。在一些实施方案中,偏向于长度为50-5000个核苷酸、100-2500个核苷酸或150-500个核苷酸的片段,以使得环化多核苷酸的平均长度落入各自的范围内。在一些实施方案中,80%或更多的环化片段的长度为50-500个核苷酸,例如长度为50-200个核苷酸。可以优化的反应条件包括分配给接合反应的时间长度、各种试剂的浓度和待接合的多核苷酸的浓度。在一些实施方案中,环化反应保持在环化前存在于样品中的片段长度的分布。例如,环化前样品中的片段长度以及环化多核苷酸的平均值、中值、众数(mode)和标准偏差中的一个或多个彼此在75%、80%、90%、95%或更高的百分比以内。

在一些情况下,使用一个或多个衔接子寡核苷酸,使得样品中多核苷酸的5’端和3’端通过一个或多个居间衔接子寡核苷酸接合形成环状多核苷酸,而不是优先形成自接合环化产物。例如,多核苷酸的5’端可以接合至衔接子的3’端,而同一衔接子的5’端可以接合至同一多核苷酸的3’端。衔接子寡核苷酸包括具有某种序列的任意寡核苷酸,该序列的至少一部分是已知的,它能够接合至样品多核苷酸。衔接子寡核苷酸可包含DNA、RNA、核苷酸类似物、非规范核苷酸、标记的核苷酸、修饰的核苷酸或其组合。衔接子寡核苷酸可以是单链的、双链的或部分双链体。通常,部分双链体衔接子包含一个或多个单链区和一个或多个双链区。双链衔接子可包含彼此杂交的两个单独的寡核苷酸(也称为“寡核苷酸双链体”),并且杂交可留下一个或多个平端、一个或多个3’突出端、一个或多个5’突出端、一个或多个由错配的和/或未配对的核苷酸所导致的凸起,或其任意组合。当衔接子的两个杂交区被非杂交区彼此隔开时,会产生“气泡”结构。不同种类的衔接子,例如具有不同序列的衔接子,可以组合使用。不同的衔接子可以在顺序的反应中或同时地接合至样品多核苷酸。在一些实施方案中,将相同的衔接子添加至靶多核苷酸的两端。例如,可以将第一和第二衔接子添加至同一反应中。可以在与样品多核苷酸组合之前操作衔接子。例如,可以添加或去除末端磷酸。

在使用衔接子寡核苷酸的情况下,衔接子寡核苷酸可包含多种序列元件中的一种或多种,包括但不限于一个或多个扩增引物退火序列或其互补序列、一个或多个测序引物退火序列或其互补序列、一个或多个条形码序列、一个或多个在多个不同衔接子或不同衔接子的子集之间共有的共同序列、一个或多个限制酶识别位点、一个或多个与一个或多个靶多核苷酸突出端互补的突出端、一个或多个探针结合位点(例如,用于附接至测序平台,如用于大规模平行测序的流动池,如Illumina,Inc.开发的流动池)、一个或多个随机的或接近随机的序列(例如,在一个或多个位置处从一组两个或更多个不同核苷酸中随机选择的一个或多个核苷酸,其中在一个或多个位置处选择的不同核苷酸中的每一个均呈现在包含随机序列的一组衔接子中),及其组合。在一些情况下,可以使用衔接子纯化这些含有衔接子的环,例如通过使用以包含衔接子的互补序列的寡核苷酸涂覆的珠子(为了易于处理,特别是磁珠),该珠子可以通过与之杂交而“捕获”具有正确衔接子的闭合环,洗掉那些不包含衔接子和任何未连接的组分的环,然后从珠子上释放所捕获的环。另外,在一些情况下,杂交的捕获探针与目标环的复合物可直接用来生成多联体,例如通过直接滚环扩增(RCA)。在一些实施方案中,环中的衔接子还可用作测序引物。两个或更多个序列元件可以是彼此不相邻的(例如被一个或多个核苷酸隔开)、彼此相邻的、部分重叠的或完全重叠的。例如,扩增引物退火序列还可充当测序引物退火序列。序列元件可位于或靠近3’端,位于或靠近5’端,或在衔接子寡核苷酸的内部。序列元件可以是任何合适的长度,例如约为或少于约3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或更多个核苷酸的长度。衔接子寡核苷酸可具有任何合适的长度,至少足以容纳其所包含的一个或多个序列元件。在一些实施方案中,衔接子的长度约为或少于约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200个或更多个核苷酸。在一些实施方案中,衔接子寡核苷酸的长度在约12至40个核苷酸的范围内,例如长度为约15至35个核苷酸。

在一些实施方案中,与来自一个样品的片段化多核苷酸接合的衔接子寡核苷酸包含一个或多个所有衔接子寡核苷酸所共有的序列和对于与该特定样品的多核苷酸接合的衔接子而言独特的条形码,以使得该条形码序列可用来区分来源于一个样品或衔接子接合反应的多核苷酸与来源于另一个样品或衔接子接合反应的多核苷酸。在一些实施方案中,衔接子寡核苷酸包含与一个或多个靶多核苷酸突出端互补的5’突出端、3’突出端或此两者。互补突出端的长度可以是一个或多个核苷酸,包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个核苷酸的长度。互补突出端可包含固定的序列。衔接子寡核苷酸的互补突出端可包含一个或多个核苷酸的随机序列,以使得在一个或多个位置处从一组两个或更多个不同核苷酸中随机选择一个或多个核苷酸,其中在一个或多个位置处选择的不同核苷酸中的每一个都呈现在包含该随机序列的一组具有互补突出端的衔接子中。在一些实施方案中,衔接子突出端与通过限制性内切核酸酶消化产生的靶多核苷酸突出端互补。在一些实施方案中,衔接子突出端由腺嘌呤或胸腺嘧啶组成。

多种环化多核苷酸的方法是可用的。在一些实施方案中,环化包括酶促反应,如使用连接酶(例如RNA或DNA连接酶)。多种连接酶是可用的,包括但不限于CircligaseTM(Epicentre;Madison,WI)、RNA连接酶、T4 RNA连接酶1(ssRNA连接酶,其作用于DNA和RNA两者)。另外,如果不存在dsDNA模板,T4 DNA连接酶也可以连接ssDNA,尽管这通常是缓慢的反应。连接酶的其他非限制性实例包括:NAD-依赖性连接酶,包括Taq DNA连接酶、丝状栖热菌(Thermus filiformis)DNA连接酶、大肠杆菌(E.coli)DNA连接酶、Tth DNA连接酶、水管致黑栖热菌(Thermus scotoductus)DNA连接酶(I和II)、热稳定的连接酶、Ampligase热稳定的DNA连接酶、VanC-型连接酶、9°N DNA连接酶、Tsp DNA连接酶和通过生物勘探发现的新型连接酶;ATP依赖性连接酶,包括T4 RNA连接酶、T4 DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、Pfu DNA连接酶、DNA连接酶1、DNA连接酶III、DNA连接酶IV和通过生物勘探发现的新型连接酶;以及野生型、突变同工型,及其遗传工程变体。当需要自接合时,可调节多核苷酸和酶的浓度以促进分子内环而非分子间结构的形成。反应温度和时间也可调整。在一些实施方案中,使用60℃来促进分子内环的形成。在一些实施方案中,反应时间为12-16小时。反应条件可以是所选择的酶的制造商所规定的条件。在一些实施方案中,可以包括外切核酸酶步骤,以在环化反应后消化任何未连接的核酸。即,闭环不含游离的5’或3'端,因此5’或3'外切核酸酶的引入不会消化闭环,但会消化未连接的组分。这尤其可用于多路系统中。

通常,多核苷酸的末端彼此接合以形成环状多核苷酸(直接地,或者使用一个或多个居间衔接子寡核苷酸)会产生具有接合序列的接点。当多核苷酸的5’端和3’端通过衔接子多核苷酸接合时,术语“接点”可指该多核苷酸与衔接子之间的接点(例如,5’端接点或3’端接点之一),或指多核苷酸的5’端与3’端之间由衔接子多核苷酸形成且包含衔接子多核苷酸的接点。当多核苷酸的5’端和3’端在没有居间衔接子的情况下接合时(例如单链DNA的5’端和3’端),术语“接点”是指这两个末端接合的点。接点可通过构成该接点的核苷酸序列(也称为“接合序列”)来鉴定。在一些实施方案中,样品包含具有通过以下过程形成的末端混合物的多核苷酸:自然降解过程(如细胞裂解、细胞死亡和DNA从细胞释放到其周围环境中的其他过程,DNA在该周围环境中可进一步降解,如在无细胞多核苷酸中,如无细胞DNA和无细胞RNA),作为样品处理的副产物的片段化(如固定、染色和/或储存程序),以及通过切割不限于特定靶序列的DNA的方法进行的片段化(例如,机械片段化,如通过超声处理;非序列特异性核酸酶处理,如DNA酶I、片段化酶)。当样品包含具有末端混合物的多核苷酸时,两个多核苷酸具有相同5’端或3’端的可能性很低,并且两个多核苷酸独立地均具有相同5’端和3’端两者的可能性极低。因此,在一些实施方案中,即使两个多核苷酸包含具有相同靶序列的部分,也可以使用接点来区分不同的多核苷酸。当多核苷酸末端在没有居间衔接子的情况下接合时,接合序列可通过与参考序列进行比对来鉴定。例如,在两个组成序列的顺序相对于参考序列似乎颠倒的情况下,似乎发生颠倒的点可以指示在该点处的接点。当多核苷酸末端通过一个或多个衔接子序列接合时,接点可通过与已知衔接子序列的接近度来鉴定,或者如果测序读取的长度足以从环化多核苷酸的5’和3’端均获得序列,则通过如上所述的比对来鉴定。在一些实施方案中,特定接点的形成是非常罕见的事件,使得其在样品的环化多核苷酸中是独特的。

测序方法

根据一些实施方案,使线性和/或环化的多核苷酸(或其扩增产物,其在一些情况下可能已经富集)经历测序反应以生成测序读取。这类方法产生的测序读取可以根据本文公开的其他方法来使用。多种测序方法是可获得的,尤其是高通量测序方法。实例包括但不限于Illumina制造的测序系统(诸如的测序系统)、LifeTechnologies制造的测序系统(Ion等)、Roche的454LifeSciences系统、Pacific Biosciences系统等。在一些实施方案中,测序包括使用系统产生长度约为或超过约50、75、100、125、150、175、200、250、300个或更多个核苷酸的读取。在一些实施方案中,测序包括合成测序过程,其中随着单独的核苷酸被添加至正在生长的引物延伸产物上,所述单独的核苷酸被迭代地鉴定。焦磷酸测序是合成测序法的一个实例,其通过测定所得合成混合物中测序反应副产物即焦磷酸的存在来鉴定核苷酸的并入。特别是,引物/模板/聚合酶复合物与一种类型的核苷酸接触。如果该核苷酸并入,则聚合反应切割三磷酸链的α和β磷酸之间的三磷酸核苷,从而释放焦磷酸。然后使用化学发光酶报告系统鉴定所释放的焦磷酸的存在,该系统将含有AMP的焦磷酸转化为ATP,之后用萤光素酶测量ATP以产生可测量的光信号。当检测到光时,碱基已并入,当未检测到光时,碱基未并入。在适当的洗涤步骤后,使各种碱基周期性地与该复合物接触,以连续地鉴定模板序列中的后续碱基。参见,例如,美国专利6,210,891,其通过引用整体并入本文。

在相关的测序过程中,将引物/模板/聚合酶复合物固定在基底上,并使该复合物与标记的核苷酸接触。复合物的固定可通过引物序列、模板序列和/或聚合酶进行,并且可以是共价的或非共价的。例如,该复合物的固定可通过聚合酶或引物与基底表面之间的连接来实现。在可替代的构型中,核苷酸具有以及不具有可去除的终止基团。在并入后,标记物与该复合物偶联,因此是可检测的。在携带终止子的核苷酸的情况下,使携带可单独鉴定的标记物的全部四种不同的核苷酸与该复合物相接触。标记的核苷酸的并入由于终止子的存在而阻止延伸,并将标记物添加到该复合物中,从而允许鉴定并入的核苷酸。然后将标记物和终止子从并入的核苷酸上去除,并在适当的洗涤步骤后重复该过程。在非终止的核苷酸的情况下,如焦磷酸测序那样,将一种类型的标记的核苷酸添加到复合物中,以确定其是否将会并入。在去除核苷酸上的标记基团和适当的洗涤步骤之后,将各种不同的核苷酸在同一过程中通过反应混合物进行循环。参见,例如,美国专利6,833,246,其为了所有目的通过引用整体并入本文。例如,Illumina Genome Analyzer System是基于WO98/44151中描述的技术,其中DNA分子通过锚定探针结合位点(另外也被称为流动池结合位点)结合到测序平台(流动池)上,并且在载玻片上原位扩增。在其上扩增DNA分子的固体表面可包含多个第一和第二结合寡核苷酸,第一结合寡核苷酸与靠近或位于靶多核苷酸的一个末端的序列互补,而第二结合寡核苷酸与靠近或位于靶多核苷酸的另一个末端的序列互补。这种排列允许进行桥式扩增,如US20140121116所述。DNA分子然后与测序引物退火,并且使用可逆终止子方法逐个碱基地平行进行测序。在测序引物杂交之前,可在锚定双链桥的结合寡核苷酸之一中的切割位点处切割双链桥多核苷酸的一条链,从而留下一条单链不与固体基底结合,其可通过变性去除,而另一条链结合于并且可用于与测序引物杂交。在一些情况下,Illumina基因组测序分析系统使用具有8个通道的流动池,生成长度为18至36个碱基的测序读取,每次运行生成>1.3Gbp的高质量数据(参见www.illumina.com)。

在另一种合成测序方法中,随着模板依赖性合成的进行,实时观察不同标记的核苷酸的并入。具体而言,随着荧光标记的核苷酸的并入,观察单独的固定的引物/模板/聚合酶复合物,从而允许随着碱基的添加实时地鉴定每个添加的碱基。在该方法中,标记基团附接至在并入过程中被切割的核苷酸的一部分上。例如,通过将标记基团附接至在并入过程中去除的磷酸链的一部分,即核苷多磷酸上的、β、γ或其他末端磷酸基团上,该标记物不并入新生链中,而是产生天然DNA。对单独的分子的观察可涉及将复合物光学限制在非常小的照明体积内。通过对复合物进行光学限制,创建了受监测的区域,在其中随机扩散的核苷酸存在非常短的时间,而并入的核苷酸在正在并入时在观察体积内保留更长的时间。这产生了与并入事件相关的特征信号,其还通过所添加的碱基所特有的信号谱进行表征。在相关方面,在聚合酶或复合物其他部分和并入的核苷酸上提供相互作用标记组分,如荧光共振能量转移(FRET)染料对,使得并入事件使标记组分相互邻近,并产生特征信号,这也是所并入的碱基所特有的(参见,例如,美国专利6,917,726、7,033,764、7,052,847、7,056,676、7,170,050、7,361,466和7,416,844;以及US20070134128,其各自通过引用整体并入本文)。

在一些实施方案中,可以对样品中的核酸进行连接测序。该方法可使用DNA连接酶来鉴定靶序列,例如,如在聚合酶克隆(polony)方法和在SOLiD技术(Applied Biosystems,目前为Invirogen)中使用的。通常,提供一组固定长度的所有可能的寡核苷酸,按照测序位置进行标记。将寡核苷酸退火并连接;DNA连接酶对匹配序列的优先连接产生与该位置处的互补序列相对应的信号。

本文的测序方法提供在本文的方法中有用的信息。在一些情况下,测序提供多态性区域的序列。另外,测序提供一段多核苷酸,如DNA,包括cfDNA。此外,测序提供DNA如cfDNA的断点或末端的序列。测序进一步提供蛋白质结合位点边界或DNA酶超敏位点边界的序列。

样品

在本文所述的各种方法的实施方案中,样品可以来自受试者。受试者可以是任何动物,包括但不限于牛、猪、小鼠、大鼠、鸡、猫、狗等,并且通常是哺乳动物,如人。样品多核苷酸可以从受试者分离,如组织样品、体液样品或器官样品,包括,例如,活检物、血液样品或含有核酸的流体样品(例如唾液)。在一些情况下,样品不包含完整细胞,被处理以除去细胞,或在不进行细胞提取步骤的情况下分离多核苷酸(例如分离无细胞多核苷酸,如无细胞DNA)。样品来源的其他实例包括来自血液、尿液、粪便、鼻孔、肺、肠、其他体液或排泄物,由此衍生的物质或其组合的样品。在一些实施方案中,样品是血液样品或其部分(例如血浆或血清)。血清和血浆可能是特别感兴趣的,因为与此类组织中较高恶性细胞死亡率相关的肿瘤DNA的相对富集。在一些实施方案中,来自单个个体的样品被分成多个单独的样品(例如,2、3、4、5、6、7、8、9、10个或更多个单独的样品),该单独的样品独立地经历本公开的方法,如一式两份、一式三份、一式四份或一式更多份的分析。当样品来自受试者时,参考序列也可以来源于受试者,如来自分析样品的共有序列或来自相同受试者的另一样品或组织的多核苷酸的序列。例如,可以分析血液样品的ctDNA突变,同时分析来自另一个样品(例如颊或皮肤样品)的细胞DNA,以确定参考序列。

可以根据任何合适的方法从样品中提取多核苷酸。有多种试剂盒可用于提取多核苷酸,其选择可取决于样品的类型或待分离的核酸的类型。本文提供了提取方法的实例,如关于本文公开的多个方面中的任一方面所述。在一个实例中,样品可以是血液样品,例如在EDTA管(例如BD Vacutainer)中收集的样品。可以通过离心(例如在4℃下以1900xg离心10分钟)将血浆与外周血细胞分离。以该方式在6mL血液样品上进行的血浆分离可产生2.5至3mL血浆。可以从血浆样品中提取循环无细胞DNA,如通过使用QIAmp Circulating NucleicAcid Kit(Qiagene),根据制造商的方案进行提取。然后可以对DNA进行定量(例如,采用高灵敏度DNA试剂盒(Agilent)在Agilent 2100生物分析仪上)。例如,来自健康人的这类血浆样品的循环DNA的产量可以是每毫升血浆1ng至10ng,在癌症患者样品中明显更高。

在一些实施方案中,所述多个多核苷酸包含无细胞多核苷酸,如无细胞DNA(cfDNA)、无细胞RNA(cfRNA)、循环肿瘤DNA(ctDNA)或循环肿瘤RNA(ctRNA)。无细胞DNA在健康和患病个体中循环。无细胞RNA在健康和患病个体中循环。来自肿瘤的cfDNA(ctDNA)不限于任何特定的癌症类型,但似乎是不同恶性肿瘤中常见的发现。根据一些测量,血浆中的游离循环DNA浓度在对照受试者中约为14-18ng/ml,在瘤形成患者中约为180-318ng/ml。凋亡和坏死的细胞死亡造成体液中的无细胞循环DNA。例如,在前列腺癌患者和其他前列腺疾病如良性前列腺增生和前列腺炎的血浆中观察到循环DNA水平显著升高。另外,循环肿瘤DNA存在于源自发生原发性肿瘤的器官的体液中。因此,乳腺癌检测可以在导管灌洗液中实现;结直肠癌检测在大便中实现;肺癌检测在痰中实现,并且前列腺癌检测在尿液或精液中检测。无细胞DNA可以从多种来源获得。一个常见的来源是受试者的血液样品。然而,cfDNA或其他片段化DNA可以来自多种其他来源。例如,尿液和粪便样品可以是包括ctDNA在内的cfDNA的来源。无细胞RNA可以从多种来源获得。

在一些实施方案中,在不进行提取步骤和/或不进行纯化步骤的情况下,使多核苷酸经历后续步骤(例如环化和扩增)。例如,可以在不进行提取步骤的情况下处理流体样品以除去细胞,以产生纯化的液体样品和细胞样品,随后从纯化的流体样品中分离DNA。有多种分离多核苷酸的程序是可用的,例如通过沉淀,或者与基底非特异性结合并随后洗涤该基底以释放结合的多核苷酸。在不进行细胞提取步骤的情况下从样品中分离多核苷酸时,多核苷酸将主要是细胞外或“无细胞”多核苷酸。例如,无细胞多核苷酸可包括无细胞DNA(也称为“循环”DNA)。在一些实施方案中,循环DNA是来自肿瘤细胞的,例如来自体液或排泄物(例如血液样品)的循环肿瘤DNA(ctDNA)。无细胞多核苷酸可包括无细胞RNA(也称为“循环”RNA)。在一些实施方案中,循环RNA是来自肿瘤细胞的循环肿瘤RNA(ctRNA)。肿瘤经常显示出凋亡或坏死,使得肿瘤核酸通过各种机制,以不同形式和不同水平释放到体内,包括受试者的血流中。在一些情况下,ctDNA的大小可以在较高浓度的较小片段(通常长度为70至200个核苷酸)至较低浓度的高达数千个千碱基的大片段之间。

癌症

本文的方法可以提供癌症的早期检测或非转移性癌症的检测。癌症的分期可以取决于癌症类型,其中每个癌症类型都有自己的分类系统。

下面更详细地描述了癌症分期或分类系统的实例。

本文提供的方法可以允许早期检测癌症或检测非转移性癌症。可以根据本文公开的方法检测的癌症的实例包括但不限于棘皮瘤、腺泡细胞癌、听神经瘤、肢端着色斑性黑素瘤、顶端螺旋瘤、急性嗜酸性细胞白血病、急性淋巴母细胞白血病、急性巨核母细胞白血病、急性单核细胞白血病、急性髓母细胞白血病伴成熟、急性髓样树突细胞白血病、急性髓样白血病、急性早幼粒细胞白血病、釉质瘤、腺癌、腺样囊性癌、腺瘤、牙源性腺瘤样瘤、肾上腺皮质癌、成人T细胞白血病、侵袭性NK细胞白血病、AIDS相关癌症、AIDS相关淋巴瘤、软组织腺泡状肉瘤、成釉细胞纤维瘤、肛门癌、间变性大细胞淋巴瘤、间变性甲状腺癌、血管免疫母细胞性T细胞淋巴瘤、血管肌脂瘤、血管肉瘤、阑尾癌、星形细胞瘤、非典型性畸胎样横纹肌样瘤、基底细胞癌、基底细胞样癌、B细胞白血病、B细胞淋巴瘤、Bellini管癌、胆管癌、膀胱癌、母细胞瘤、骨癌、骨瘤、脑干胶质瘤、脑瘤、乳腺癌、Brenner瘤、支气管瘤、细支气管肺泡癌、Brown瘤、伯基特淋巴瘤、原发灶不明的癌症、类癌瘤、癌、原位癌、阴茎癌、原发灶不明癌、癌肉瘤、Castleman病、中枢神经系统胚胎瘤、小脑星形细胞瘤、大脑星形细胞瘤、宫颈癌、胆管癌、软骨瘤、软骨肉瘤、脊索瘤、绒毛膜癌、脉络丛乳头状瘤、慢性淋巴细胞白血病、慢性单核细胞白血病、慢性髓性白血病、慢性骨髓增生性疾病、慢性嗜中性粒细胞白血病、透明细胞肿瘤、结肠癌、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、Degos病、隆凸性皮肤纤维肉瘤、皮样囊肿、结缔组织增生性小圆细胞瘤、弥漫性大B细胞淋巴瘤、胚胎发育不良神经上皮瘤、胚胎癌、内胚窦瘤、子宫内膜癌、子宫内膜子宫癌、子宫内膜样肿瘤、肠病相关的T细胞淋巴瘤、室管膜母细胞瘤、室管膜瘤、上皮样肉瘤、红白血病、食管癌、鼻腔神经胶质瘤、尤因家族肿瘤、尤因家族肉瘤、尤因肉瘤、颅外生殖细胞瘤、性腺外生殖细胞瘤、肝外胆管癌、乳腺外佩吉特病、输卵管癌、胎中胎、纤维瘤、纤维肉瘤、滤泡性淋巴瘤、滤泡性甲状腺癌、胆囊癌、胆囊癌症、神经节胶质瘤、神经节瘤、胃癌、胃淋巴瘤、胃肠癌、胃肠类癌瘤、胃肠间质瘤、胃肠间质肿瘤、生殖细胞肿瘤、生殖细胞瘤、妊娠性绒毛膜癌、妊娠滋养细胞瘤、骨巨细胞瘤、多形性胶质母细胞瘤、神经胶质瘤、大脑神经胶质瘤病、血管球瘤、胰高血糖素瘤、性腺母细胞瘤、粒层细胞瘤、毛细胞白血病、多毛细胞白血病、头颈癌、头颈癌症、心脏癌、血管母细胞瘤、血管外皮细胞瘤、血管肉瘤、血液系统恶性肿瘤、肝细胞癌、肝脾T细胞淋巴瘤、遗传性乳腺-卵巢癌综合征、霍奇金淋巴瘤、何杰金淋巴瘤、下咽癌、下丘脑神经胶质瘤、炎性乳腺癌、眼内黑素瘤、胰岛细胞癌、胰岛细胞瘤、幼年型粒单核细胞白血病、卡波西肉瘤、卡波济肉瘤、肾癌、Klatskin瘤、Krukenberg瘤、喉癌、喉癌症、恶性雀斑样黑素瘤、白血病、白血病、唇和口腔癌、脂肪肉瘤、肺癌、黄体瘤、淋巴管瘤、淋巴管肉瘤、淋巴上皮瘤、淋巴样白血病、淋巴瘤、巨球蛋白血症、恶性纤维组织细胞瘤、恶化纤维组织细胞瘤、骨恶性纤维组织细胞瘤、恶性神经胶质瘤、恶性间皮瘤、恶性外周神经鞘瘤、恶性杆状瘤、恶性蝾螈瘤、MALT淋巴瘤、套细胞淋巴瘤、肥大细胞白血病、纵膈生殖细胞瘤、纵膈肿瘤、甲状腺髓样癌、髓母细胞瘤、成髓细胞瘤、髓上皮瘤、黑素瘤、黑色素瘤、脑膜瘤、Merkel细胞癌、间皮瘤、间皮细胞瘤、原发灶隐匿转移性鳞状颈癌、转移性尿路上皮癌、混合Mullerian瘤、单核细胞性白血病、口腔癌、粘液瘤、多发性内分泌瘤综合征、多发性骨髓瘤、多发性骨髓瘤、蕈样肉芽肿病、蕈样肉芽肿、骨髓增生异常疾病、骨髓增生异常综合征、髓样白血病、髓样肉瘤、骨髓增生性疾病、粘液瘤、鼻腔癌、鼻咽癌症、鼻咽癌、赘生物、神经鞘瘤、神经母细胞瘤、成神经细胞瘤、神经纤维瘤、神经瘤、结节性黑素瘤、非霍奇金淋巴瘤、非何杰金淋巴瘤、非黑素瘤皮肤癌、非小细胞肺癌、眼肿瘤、少突星形细胞瘤、少突神经胶质瘤、嗜酸性粒细胞腺瘤、视神经鞘脑膜瘤、口癌、口腔癌、口咽癌、骨肉瘤、骨肉瘤、卵巢癌、卵巢癌症、卵巢上皮癌、卵巢生殖细胞瘤、卵巢低恶性潜能肿瘤、乳腺佩吉特病、Pancoast瘤、胰腺癌、胰腺癌症、乳头状甲状腺癌、乳头状瘤病、副神经节瘤、副鼻窦癌、甲状旁腺癌、阴茎癌、血管周上皮样细胞瘤、咽癌、嗜铬细胞瘤、中度分化的松果体实质瘤、松果体母细胞瘤、垂体细胞瘤、垂体腺瘤、垂体瘤、浆细胞瘤、胸膜肺母细胞瘤、多胚瘤、前体T淋巴母细胞淋巴瘤、原发性中枢神经系统淋巴瘤、原发性渗出性淋巴瘤、原发性肝细胞癌、原发性肝癌、原发性腹膜癌、原始神经外胚层瘤、前列腺癌、腹膜假粘液瘤、直肠癌、肾细胞癌、涉及染色体15上NUT基因的呼吸道癌、视网膜母细胞瘤、横纹肌瘤、横纹肌肉瘤、Richter转化、骶尾部畸胎瘤、涎腺癌、肉瘤、神经鞘瘤病(Schwannomatosis)、皮脂腺癌、继发性肿瘤、精原细胞瘤、浆液性肿瘤、Sertoli-Leydig细胞瘤、性索间质瘤、Sezary综合征、印戒细胞癌、皮肤癌、小蓝圆细胞瘤、小细胞癌、小细胞肺癌、小细胞淋巴瘤、小肠癌、软组织肉瘤、生长抑素瘤、煤烟疣、脊髓瘤、脊髓肿瘤、脾边缘区淋巴瘤、鳞状细胞癌、胃癌、浅表扩散性黑素瘤、幕上原始神经外胚层瘤、表面上皮-间质瘤、滑膜肉瘤、T细胞急性淋巴母细胞性白血病、T细胞大颗粒淋巴细胞白血病、T细胞白血病、T细胞淋巴瘤、T细胞幼淋巴细胞白血病、畸胎瘤、末期淋巴癌、睾丸癌、泡膜细胞瘤、喉癌、胸腺癌、胸腺瘤、甲状腺癌、肾盂和输尿管移行细胞癌、移行细胞癌、脐尿管癌、尿道癌、泌尿生殖系统肿瘤、子宫肉瘤、葡萄膜黑素瘤、阴道癌、Verner Morrison综合征、疣状癌、视通路神经胶质瘤、外阴癌、瓦尔登斯特伦巨球蛋白血症、Warthin瘤、维尔姆斯瘤,及其组合。

编号实施方案的部分列表

参考以下编号的实施方案的部分列表进一步阐明本文的公开内容。实施方案1.一种检测受试者的非转移性癌症的方法,该方法包括:(a)获得包含所述受试者的多个无细胞脱氧核糖核酸(cfDNA)多核苷酸的样品;(b)使用所述多个cfDNA多核苷酸或其衍生物的至少一个子集来测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;(c)计算机处理所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;以及(d)当至少部分基于(c)的结果,所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小至多为170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案2.根据实施方案1所述的方法,其中(b)通过对所述多个cfDNA多核苷酸或其衍生物的至少所述子集进行测序来进行。实施方案3.根据实施方案1或实施方案2所述的方法,其进一步包括,在(b)之前从所述受试者的所述多个cfDNA多核苷酸制备单链脱氧核糖核酸(DNA)文库。实施方案4.根据实施方案1或实施方案2所述的方法,其进一步包括,在(b)之前从所述受试者的所述多个cfDNA多核苷酸制备双链DNA文库。实施方案5.根据实施方案1至4中任一项所述的方法,其进一步包括,在(b)之前:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸以产生扩增的多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。实施方案6.根据实施方案1至5中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。实施方案7.根据实施方案1至6中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。实施方案8.根据实施方案1至7中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。实施方案9.根据实施方案1至8中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案10.根据实施方案1至9中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。实施方案11.根据实施方案1至10中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。实施方案12.根据实施方案1至11中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。实施方案13.根据实施方案1至12中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案14.根据实施方案1至13中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。实施方案15.根据实施方案1至14中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。实施方案16.根据实施方案1至15中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。实施方案17.根据实施方案1至16中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案18.根据实施方案1至17中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。实施方案19.根据实施方案1至18中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。实施方案20.根据实施方案1至19中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。实施方案21.根据实施方案1至20中任一项所述的方法,其中所述受试者没有被诊断为转移性癌症。实施方案22.根据实施方案1至21中任一项所述的方法,其中所述受试者具有小于10%的肿瘤负荷。实施方案23.根据实施方案1至22中任一项所述的方法,其中所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。实施方案24.根据实施方案1至23中任一项所述的方法,其中所述方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。实施方案25.根据实施方案1至24中任一项所述的方法,其中所述非转移性癌症为0期、1期、2期或3期。实施方案26.根据实施方案1至25中任一项所述的方法,其进一步包括向所述受试者推荐施用化学疗法。实施方案27.根据实施方案1至26中任一项所述的方法,其进一步包括向所述受试者推荐额外的癌症监测。实施方案28.根据实施方案1至27中任一项所述的方法,其中(d)包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基直至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案29.根据实施方案1至28中任一项所述的方法,其进一步包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。实施方案30.根据实施方案5所述的方法,其进一步包括在环化所述单独的cfDNA多核苷酸之前针对一个或多个靶序列富集所述多个cfDNA多核苷酸。实施方案31.根据实施方案5所述的方法,其进一步包括在扩增所述环状多核苷酸之前针对一个或多个靶序列富集所述环状多核苷酸。实施方案32.根据实施方案5所述的方法,其进一步包括在扩增所述环状多核苷酸期间针对一个或多个靶序列富集所述环状多核苷酸。实施方案33.根据实施方案5所述的方法,其进一步包括在所述测序之前针对一个或多个靶序列富集所述扩增的多核苷酸。实施方案34.根据实施方案30至33中任一项所述的方法,其中所述富集在靶向引物或捕获探针的帮助下进行。实施方案35.根据实施方案34所述的方法,其中使用所述靶向引物或捕获探针的序列处理所述多个测序读取。实施方案36.一种测量来自受试者的血液样品中的cfDNA大小分布的方法,该方法包括:(a)从所述受试者的血液样品获得包含多个无细胞脱氧核糖核酸(cfDNA)多核苷酸的样品;(b)使用所述多个cfDNA多核苷酸或其衍生物的至少一个子集来测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;(c)计算机处理所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;以及(d)当至少部分基于(c)的结果,所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案37.根据实施方案36所述的方法,其中所述多个cfDNA多核苷酸包含少于10%的循环肿瘤DNA(ctDNA)。实施方案38.根据实施方案36或实施方案37所述的方法,其中所述多个cfDNA多核苷酸包含少于5%的循环肿瘤DNA(ctDNA)。根据实施方案36至38中任一项所述的方法,其中所述多个cfDNA多核苷酸包含少于2%的循环肿瘤DNA(ctDNA)。实施方案40.根据实施方案36至39中任一项所述的方法,其中所述多个cfDNA多核苷酸包含少于1%的循环肿瘤DNA(ctDNA)。实施方案41.根据实施方案36至40中任一项所述的方法,其进一步包括,在(b)之前从所述受试者的所述多个cfDNA多核苷酸制备单链DNA文库。实施方案42.根据实施方案36至40中任一项所述的方法,其进一步包括,在(b)之前从所述受试者的所述多个cfDNA多核苷酸制备双链DNA文库。实施方案43.根据实施方案36至42中任一项所述的方法,其进一步包括,在(b)之前:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。实施方案44.根据实施方案36至43中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。实施方案45.根据实施方案36至44中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。实施方案46.根据实施方案36至45中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。实施方案47.根据实施方案36至46中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案48.根据实施方案36至47中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。实施方案49.根据实施方案36至48中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。实施方案50.根据实施方案36至49中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。实施方案51.根据实施方案36至50中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案52.根据实施方案36至51中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。实施方案53.根据实施方案36至52中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。实施方案54.根据实施方案36至53中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。实施方案55.根据实施方案36至54中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案56.根据实施方案36至55中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。实施方案57.根据实施方案36至56中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。实施方案58.根据实施方案36至57中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。实施方案59.根据实施方案36至58中任一项所述的方法,其中所述受试者没有被诊断为转移性癌症。实施方案60.根据实施方案36至59中任一项所述的方法,其中所述受试者具有小于10%的肿瘤负荷。实施方案61.根据实施方案36至60中任一项所述的方法,其中所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。实施方案62.根据实施方案36至61中任一项所述的方法,其中所述方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。实施方案63.根据实施方案36至62中任一项所述的方法,其中所述非转移性癌症为0期、1期、2期或3期。实施方案64.根据实施方案36至63中任一项所述的方法,其进一步包括向所述受试者推荐施用化学疗法。实施方案65.根据实施方案36至64中任一项所述的方法,其进一步包括向所述受试者推荐额外的癌症监测。实施方案66.根据实施方案36至65中任一项所述的方法,其进一步包括,在(b)之前针对一个或多个靶序列富集所述多个cfDNA多核苷酸。实施方案67.根据实施方案43所述的方法,其进一步包括在环化所述单独的cfDNA多核苷酸之前针对一个或多个靶序列富集所述多个cfDNA多核苷酸。实施方案68.根据实施方案43所述的方法,其进一步包括在扩增所述环状多核苷酸之前针对一个或多个靶序列富集所述环状多核苷酸。实施方案69.根据实施方案43所述的方法,其进一步包括在扩增所述环状多核苷酸期间针对一个或多个靶序列富集所述环状多核苷酸。实施方案70.根据实施方案43所述的方法,其进一步包括在所述测序之前针对一个或多个靶序列富集所述扩增的多核苷酸。实施方案71.根据实施方案67至70中任一项所述的方法,其中所述富集在靶向引物或捕获探针的帮助下进行。实施方案72.根据实施方案71所述的方法,其中使用所述靶向引物或捕获探针的序列处理所述多个测序读取。实施方案73.一种检测受试者的肿瘤的方法,该方法包括:(a)从所述受试者的血液样品获得包含多个无细胞脱氧核糖核酸(cfDNA)多核苷酸的样品;(b)使用所述多个cfDNA多核苷酸或其衍生物的至少一个子集来测量所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;(c)计算机处理所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;以及(d)当至少部分基于(c)的结果,所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,检测到肿瘤。实施方案74.根据实施方案73所述的方法,其进一步包括,至少部分基于(c)的结果,当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案75.根据实施方案73或实施方案74所述的方法,其进一步包括,在(b)之前从所述受试者的所述多个cfDNA多核苷酸制备单链DNA文库。实施方案76.根据实施方案73或实施方案74所述的方法,其进一步包括,在(b)之前从所述受试者的所述多个cfDNA多核苷酸制备双链DNA文库。实施方案77.根据实施方案73至76中任一项所述的方法,其进一步包括,在(b)之前:(a)环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;(b)扩增所述环状多核苷酸;(c)对所述扩增的多核苷酸进行测序以产生多个测序读取;以及(d)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的cfDNA多核苷酸的长度。实施方案78.根据实施方案73至77中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。实施方案79.根据实施方案73至78中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。实施方案80.根据实施方案73至79中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。实施方案81.根据实施方案73至80中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案82.根据实施方案73至81中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。实施方案83.根据实施方案73至82中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。实施方案84.根据实施方案73至83中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。实施方案85.根据实施方案73至84中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案86.根据实施方案73至85中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。实施方案87.根据实施方案73至86中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。实施方案88.根据实施方案73至87中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。实施方案89.根据实施方案73至88中任一项所述的方法,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案90.根据实施方案73至89中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。实施方案91.根据实施方案73至90中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。实施方案92.根据实施方案73至91中任一项所述的方法,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。实施方案93.根据实施方案73至92中任一项所述的方法,其中所述受试者没有被诊断为转移性癌症。实施方案94.根据实施方案73至93中任一项所述的方法,其中所述受试者具有小于10%的肿瘤负荷。实施方案95.根据实施方案73至94中任一项所述的方法,其中所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。实施方案96.根据实施方案73至95中任一项所述的方法,其中所述方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。实施方案97.根据实施方案73至96中任一项所述的方法,其中所述非转移性癌症为0期、1期、2期或3期。实施方案98.根据实施方案73至97中任一项所述的方法,其进一步包括向所述受试者推荐施用化学疗法。实施方案99.根据实施方案73至98中任一项所述的方法,其进一步包括向所述受试者推荐额外的癌症监测。实施方案100.根据实施方案73至99中任一项所述的方法,其进一步包括,在(b)之前针对一个或多个靶序列富集所述多个cfDNA多核苷酸。实施方案101.根据实施方案77所述的方法,其进一步包括在环化所述单独的cfDNA多核苷酸之前针对一个或多个靶序列富集所述多个cfDNA多核苷酸。实施方案102.根据实施方案77所述的方法,其进一步包括在扩增所述环状多核苷酸之前针对一个或多个靶序列富集所述环状多核苷酸。实施方案103.根据实施方案77所述的方法,其进一步包括在扩增所述环状多核苷酸期间针对一个或多个靶序列富集所述环状多核苷酸。实施方案104.根据实施方案77所述的方法,其进一步包括在所述测序之前针对一个或多个靶序列富集所述扩增的多核苷酸。实施方案105.根据实施方案101至104中任一项所述的方法,其中所述富集在靶向引物或捕获探针的帮助下进行。实施方案106.根据实施方案105所述的方法,其中使用所述靶向引物或捕获探针的序列处理所述多个测序读取。实施方案107.一种用于检测受试者的非转移性癌症的系统,该系统包括(a)计算机,其被配置为接收用户请求以对包含多个无细胞脱氧核糖核酸(cfDNA)多核苷酸的样品进行非转移性癌症的检测;(b)扩增单元,其响应于用户请求对所述多个cfDNA多核苷酸或其衍生物的至少一个子集进行核酸扩增反应,以产生扩增的cfDNA多核苷酸;(c)测序单元,其(i)对所述扩增的cfDNA多核苷酸或其衍生物进行测序以产生多个测序读取;(ii)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度;(iii)产生所述样品中多个cfDNA多核苷酸的总cfDNA片段大小分布;并且(iv)计算机处理所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;以及(d)向接收者发送报告的报告生成器,其中该报告包含指示所述受试者的非转移性癌症风险的结果。实施方案108.根据实施方案107所述的系统,其中所述系统包括用于从所述受试者的血液样品中分离无细胞DNA(cfDNA)多核苷酸的分离系统。实施方案109.根据实施方案107或实施方案108所述的系统,其中所述系统将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。实施方案110.根据实施方案107至109中任一项所述的系统,其中当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,所述系统检测到所述受试者中的非转移性癌症。实施方案111.根据实施方案107至110中任一项所述的系统,其中当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。实施方案112.根据实施方案107至111中任一项所述的系统,其进一步包括用于从所述受试者的所述多个cfDNA多核苷酸制备单链DNA文库的制备系统。实施方案113.根据实施方案107至111中任一项所述的系统,其进一步包括用于从所述受试者的所述多个cfDNA多核苷酸制备双链DNA文库的制备系统。实施方案114.根据实施方案107至113中任一项所述的系统,其中所述扩增反应包括:环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;并扩增所述环状多核苷酸。实施方案115.根据实施方案107至114中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。实施方案116.根据实施方案107至115中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。实施方案117.根据实施方案107至116中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。实施方案118.根据实施方案107至117中任一项所述的系统,其中当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。实施方案119.根据实施方案107至118中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。实施方案120.根据实施方案107至119中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。实施方案121.根据实施方案107至120中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。实施方案122.根据实施方案107至121中任一项所述的系统,其中当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。实施方案123.根据实施方案107至122中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。实施方案124.根据实施方案107至123中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。实施方案125.根据实施方案107至124中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。实施方案126.根据实施方案107至125中任一项所述的系统,其中当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,所述报告生成器将所述受试者归类为具有增加的非转移性癌症风险。实施方案127.根据实施方案107至126中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。实施方案128.根据实施方案107至127中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。实施方案129.根据实施方案107至128中任一项所述的系统,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。实施方案130.根据实施方案107至129中任一项所述的系统,其中所述受试者没有被诊断为转移性癌症。实施方案131.根据实施方案107至130中任一项所述的系统,其中所述受试者具有小于10%的肿瘤负荷。实施方案132.根据实施方案107至131中任一项所述的系统,其中所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。实施方案133.根据实施方案107至132中任一项所述的系统,其中所述系统不从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。实施方案134.根据实施方案107至133中任一项所述的系统,其中所述非转移性癌症为0期、1期、2期或3期。实施方案135.根据实施方案107至134中任一项所述的系统,其中所述报告进一步包含对所述受试者施用化学疗法的推荐。实施方案136.根据实施方案107至135中任一项所述的系统,其中所述报告进一步包含对所述受试者进行额外的癌症监测的推荐。实施方案137.根据实施方案107至136中任一项所述的系统,其中所述扩增单元针对一个或多个靶序列富集所述多个cfDNA多核苷酸。实施方案138.一种包含代码的计算机可读介质,该代码在被一个或多个计算机处理器执行时实现检测受试者的非转移性癌症的方法,该方法包括:(a)接收用户请求以对来自受试者的包含多个无细胞脱氧核糖核酸(cfDNA)多核苷酸的样品进行非转移性癌症的检测;(b)对所述多个cfDNA多核苷酸或其衍生物的至少一个子集进行核酸扩增反应,以产生扩增的cfDNA多核苷酸;(c)进行包括以下步骤的测序分析:(i)对所述扩增的cfDNA多核苷酸进行测序以产生多个测序读取;(ii)确定所述受试者的所述多个cfDNA多核苷酸中每个单独的多核苷酸的长度;(iii)产生所述样品中多个cfDNA多核苷酸的总cfDNA片段大小分布;以及(iv)处理所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布;以及(d)生成报告,该报告包含指示所述受试者的非转移性癌症风险的结果。实施方案139.根据实施方案138所述的计算机可读介质,其中所述方法包括从所述受试者的血液样品中分离无细胞DNA(cfDNA)多核苷酸。实施方案140.根据实施方案138或实施方案139所述的计算机可读介质,其中所述方法包括将所述受试者的所述多个cfDNA多核苷酸的总cfDNA片段大小分布与来自健康对照的所述多个cfDNA多核苷酸的总cfDNA片段大小分布进行比较。实施方案141.根据实施方案138至140中任一项所述的计算机可读介质,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,检测到所述受试者中的非转移性癌症。实施方案142.根据实施方案138至141中任一项所述的计算机可读介质,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案143.根据实施方案138至142中任一项所述的计算机可读介质,其进一步包括从所述受试者的所述多个cfDNA多核苷酸制备单链DNA文库。实施方案144.根据实施方案138至142中任一项所述的计算机可读介质,其进一步包括从所述受试者的所述多个cfDNA多核苷酸制备双链DNA文库。实施方案145.根据实施方案138至144中任一项所述的计算机可读介质,其中所述扩增反应包括:环化所述受试者的所述多个cfDNA多核苷酸中单独的cfDNA多核苷酸以形成多个环状多核苷酸;并扩增所述环状多核苷酸。实施方案146.根据实施方案138至145中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加0.5%。实施方案147.根据实施方案138至146中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加1%。实施方案148.根据实施方案138至147中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至170个碱基的片段至少增加10%。实施方案149.根据实施方案138至148中任一项所述的计算机可读介质,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案150.根据实施方案138至149中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加0.5%。实施方案151.根据实施方案138至150中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加1%。实施方案152.根据实施方案138至151中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至125个碱基的片段至少增加10%。实施方案153.根据实施方案138至152中任一项所述的计算机可读介质,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案154.根据实施方案138至153中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加0.5%。实施方案155.根据实施方案138至154中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加1%。实施方案156.根据实施方案138至155中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至115个碱基的片段至少增加10%。实施方案157.根据实施方案138至156中任一项所述的计算机可读介质,其中所述方法包括当所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段增加时,将所述受试者归类为具有增加的非转移性癌症风险。实施方案158.根据实施方案138至157中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加0.5%。实施方案159.根据实施方案138至158中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加1%。实施方案160.根据实施方案138至159中任一项所述的计算机可读介质,其中所述总cfDNA片段大小分布显示,与所述健康对照相比,所述受试者中大小为50个碱基至105个碱基的片段至少增加10%。实施方案161.根据实施方案138至160中任一项所述的计算机可读介质,其中所述受试者没有被诊断为转移性癌症。实施方案162.根据实施方案138至161中任一项所述的计算机可读介质,其中所述受试者具有小于10%的肿瘤负荷。实施方案163.根据实施方案138至162中任一项所述的计算机可读介质,其中所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑素瘤、子宫内膜癌、食管癌、胃癌、卵巢癌、胰腺癌和脑癌。实施方案164.根据实施方案138至163中任一项所述的计算机可读介质,其中所述方法不包括从总cfDNA多核苷酸中分离肿瘤cfDNA多核苷酸。实施方案165.根据实施方案138至164中任一项所述的计算机可读介质,其中所述非转移性癌症为0期、1期、2期或3期。实施方案166.根据实施方案138至165中任一项所述的计算机可读介质,其中所述报告进一步包含对所述受试者施用化学疗法的推荐。实施方案167.根据实施方案138至166中任一项所述的计算机可读介质,其进一步包括向所述受试者推荐额外的癌症监测。实施方案168.根据实施方案138至167中任一项所述的计算机可读介质,其中进行扩增反应包括针对一个或多个靶序列富集所述多个cfDNA多核苷酸。实施方案169.一种检测受试者的非转移性癌症的方法,其包括:(a)获得包含所述受试者的多个无细胞脱氧核糖核酸(cfDNA)核酸分子的样品;(b)使用所述多个cfDNA多核苷酸或其衍生物的至少一个子集来测量所述多个cfDNA核酸分子的总cfDNA片段大小分布;以及(c)当至少部分基于(b)的结果,所述总cfDNA片段大小分布显示,与来自健康对照的所述多个核酸分子的总cfDNA片段大小分布相比片段增加时,确定所述受试者患有非转移性癌症或患非转移性癌症的风险增加。

图1显示了cfDNA大小的分布图,Y轴为百分比,X轴为大小。在此显示了五个类别的受试者,每个类别具有一个分布。该分布图显示,在小尺寸范围(即50-150bp)中具有最低百分比的分布来自健康受试者的样品。该分布图然后显示了三个分布,它们显示出非常相似的百分比,刚好高于小尺寸范围(即50-150bp)中的健康受试者分布,这些样品来自患有癌症并且突变等位基因频率为0%、介于0%与5%之间或介于5%与20%之间的受试者。该分布图然后显示了在来自患有癌症并且突变等位基因频率大于20%的受试者的样品的小尺寸范围(即50-150bp)中具有最高百分比的分布。该图说明,可以通过测量cfDNA大小来鉴别患有极早期癌症的受试者。

图1A显示了cfDNA大小的分布图,Y轴为百分比,X轴为大小。该分布图显示,在小尺寸范围(即50-150bp)中具有最低百分比的分布来自健康受试者的样品,而突变等位基因频率为0的患有癌症的个体在小尺寸范围内的片段增加。该图说明,可以通过测量cfDNA大小来鉴别患有极早期癌症的受试者。

图1B显示了cfDNA大小的分布图,Y轴为百分比,X轴为大小。该分布图显示,在小尺寸范围(即50-150bp)中具有最低百分比的分布来自健康受试者的样品,而突变等位基因频率大于0且小于5的患有癌症的个体在小尺寸范围内的片段增加。该图说明,可以通过测量cfDNA大小来鉴别患有极早期癌症的受试者。

图1C显示了cfDNA大小的分布图,Y轴为百分比,X轴为大小。该分布图显示,在小尺寸范围(即50-150bp)中具有最低百分比的分布来自健康受试者的样品,而突变等位基因频率大于或等于5且小于20的患有癌症的个体在小尺寸范围内的片段增加。该图说明,可以通过测量cfDNA大小来鉴别患有极早期癌症的受试者。

图1D显示了cfDNA大小的分布图,Y轴为百分比,X轴为大小。该分布图显示,在小尺寸范围(即50-150bp)中具有最低百分比的分布来自健康受试者的样品,而突变等位基因频率大于或等于20的患有癌症的个体在小尺寸范围内的片段增加。该图说明,可以通过测量cfDNA大小来鉴别患有极早期癌症的受试者,并且更晚期的癌症显示小尺寸cfDNA片段进一步增加。

图2A显示了来自不同分期(包括0期、健康受试者、I期、II期、III期和IV期)的健康和癌症样品的归一化cfDNA片段大小的箱线图。每个患有癌症(包括早期癌症)的受试者都显示出小尺寸cfDNA片段的增加。该图说明,可以通过测量cfDNA大小来鉴别患有极早期癌症的受试者。

图2B显示了突变等位基因频率与使用大小范围为50bp-150bp的分子计算的突变等位基因频率的散点图。小尺寸范围内的MAF高于总MAF,表明小片段中的ctDNA富集。然而,对于大多数总MAF<1%的样品,小尺寸范围内的MAF仍然低于5%。虚线:y=x。该图说明了小cfDNA片段中突变等位基因的富集。

实施例

给出以下实施例是为了说明本发明的各个实施方案的目的,而并非意味着以任何方式限制本发明。这些实施例以及目前代表优选实施方案的本文所述方法是示例性的,而非旨在限制本发明的范围。本领域技术人员将会想到包含在由权利要求范围所限定的本发明精神之内的其变化以及其他用途。

实施例1:获得cfDNA大小分布

单链cfDNA的表征:

通过在95℃下加热30秒并在冰上冷却2分钟使12μl纯化的cfDNA片段变性。然后,将包含2μl 10x CircLigase缓冲液、4μl 5M甜菜碱、1μl 50mM MnCl2和1μl CircLigase II的8μl连接混合物加入到变性DNA样品中,并将反应在60℃下孵育1小时。

环状靶多核苷酸的滚环扩增:

对于每个反应,添加5μl等温扩增缓冲液、0.75uL dNTP混合物(各25mM)、2μl 10μM基因特异性引物、20.25μl水。将反应在80℃下加热1分钟,并在63℃下孵育5分钟,之后冷却至4℃。接下来,向每个反应中加入15个单位的Bst 2.0热启动DNA聚合酶,并在热循环仪中按照以下程序孵育:60℃30秒;70℃4.5分钟;94℃20秒;和58℃10秒,4个循环。

第二轮PCR和测序:

按照制造商对剩余洗涤步骤的说明,通过添加45μL Ampure珠子来纯化滚环扩增产物。在25μl洗脱缓冲液中洗脱。使用含有测序衔接子的引物,通过PCR进一步扩增纯化的RCA产物。通过NGS对所得的扩增产物进行测序。

NGS数据分析:

将FASTQ文件与包含靶序列的参考文件进行比对。基于测序数据计算cfDNA片段大小。对cfDNA片段大小分布作图。

实施例2:来自具有不同突变等位基因频率的健康和结直肠癌(CRC)患者样品的 cfDNA片段大小的比较

使用针对KRAS、NRAS、PIK3CA和BRAF基因的一组引物,如方案所述对来自24个健康和63个CRC患者血液样品的cfDNA进行环化和扩增。在多联体错误校正并与人类参考基因组(hg19)进行比较后,确定变体。计算总变异等位基因频率。样品分为以下5组:1.健康,2.最大突变等位基因频率=0%的CRC,3.0%<最大突变等位基因频率<5%的CRC,4.5%≤最大突变等位基因频率<20%的CRC,5.20%≤最大突变等位基因频率的CRC。

绘制每组的平均cfDNA片段大小分布并将其叠加以供比较(图1)。

实施例3:来自不同癌症分期的健康样品和CRC样品的cfDNA片段大小的比较。

使用一组针对以下表28中的基因的引物,如方案所述对来自426名健康个体和197名CRC患者(8个分期、32个I期、64个II期、69个III期、24个IV期)的cfDNA进行环化和扩增。

为每个样品计算大小范围为50个碱基至105个碱基的cfDNA片段的分数。计算所有样品(健康和CRC)的分数的平均值和标准偏差。然后通过减去平均值并随后除以标准偏差对每个样品的分数进行归一化。图2A显示了来自不同分期的健康和癌症样品的归一化cfDNA片段大小的箱线图。

在多联体错误校正并与人类参考基因组(hg19)进行比较后,确定变体。计算大小范围为50个碱基至105个碱基的分子的突变等位基因频率,并与总突变等位基因频率进行比较。(图2B)。

实施例4:筛查非转移性癌症

个体到诊所进行例行检查。从个体采集血液样品以确定他们是否患有早期癌症或处于患早期癌症的风险中。从样品中分离无细胞DNA(cfDNA),然后在测序前进行扩增。该个体显示在50至170个碱基的大小范围内的cfDNA增加,表明该个体患有早期或非转移性癌症,或者他们处于患癌症的风险中。建议该个体向可以评估癌症状态或分期的肿瘤学家寻求治疗。该个体接受癌症治疗,并在无癌症的情况下存活10年。

虽然本文已经显示并描述了本发明的优选实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员现将想到许多变化、改变和替换。应当理解,可以使用本文所述的实施方案的各种替代方案。旨在以所附权利要求书限定本发明的范围,由此涵盖这些权利要求范围内的方法和结构及其等同物。

105页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于片材的改进切割的装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!