改善游离dna质量

文档序号:538562 发布日期:2021-06-01 浏览:1次 >En<

阅读说明:本技术 改善游离dna质量 (Improvement of free DNA quality ) 是由 卢煜明 曾卓豪 江培勇 王思朗 赵慧君 于 2019-10-22 设计创作,主要内容包括:提供了一种用于改善游离DNA的质量以进行分析的方法,所述方法可以修复游离DNA中的链内缺陷。对游离DNA中的所述缺陷进行的修复然后可以使这些经过修复的游离DNA通过包含测序和靶向捕获富集的技术进行分析。(A method for improving the quality of free DNA for analysis is provided that can repair intra-strand defects in free DNA. Repair of the defects in free DNA can then be analyzed by techniques including sequencing and targeted capture enrichment.)

改善游离DNA质量

相关申请的交叉引用

本申请要求于2018年10月22日提交的题为“改善游离DNA质量(IMPROVING CELL-FREE DNA QUALITY)”的美国临时申请第62/748,767号的优先权,所述美国临时申请的公开内容出于所有目的通过引用以其整体并入。

背景技术

自1997年被发现1以来,对母体血浆中的循环游离胎儿DNA(cfDNA)进行的检测已经越来越多地用于无创性产前测试(NIPT)。不同来源的cfDNA分子具有特征大小分布,其中母体cfDNA分子具有最丰富的峰值166-bp,并且胎儿cfDNA分子具有相对突出的峰值143-bp2。胎儿cfDNA与母体cfDNA之间的大小差异已经用于开发基于大小的NIPT2-4。胎儿DNA分数是成功的NIPT的主要贡献因素。已经表明即使测序深度很浅,对胎儿DNA分数进行估计也是可实现的5。尽管在国际上采用NIPT,但许多问题需要进一步完善,所述问题包含假阴性结果和无响应(no-call)结果6。为此,已经探索了许多方法以使来自母体血浆的胎儿DNA富集3,7,8。然而,这些方法中的所有方法都有其缺点。

DNA损伤(例如单链切口)存在并分布在整个cfDNA分子9,10中。被认为是cfDNA产生的主要机制之一的细胞凋亡涉及核碎裂期间的DNA碎裂,随后是形成并产生凋亡小体11-13。常用的测序文库制备方法采用仅对DNA末端进行修复,从而导致损伤的cfDNA片段(如具有单链切口10,14,15的那些片段)的丢失。因此,通过当前的双端大规模平行测序(MPS)平台对这些损伤的cfDNA分子进行检测具有挑战性。

下文所描述的系统和方法解决了DNA损伤和其它DNA问题。由于所述系统和方法,用于测序文库制备和/或其它分析的游离DNA的质量可以改善。

发明内容

本发明的实施例提供了改善游离DNA的质量以进行分析。游离DNA可以包含具有缺陷的DNA,所述缺陷不允许利用如测序和靶向捕获富集等技术对那些DNA进行分析。这些缺陷可以是所述DNA的链内的缺陷并且不存在于所述DNA的末端处。本发明的实施例修复游离DNA中的这些链内缺陷。对游离DNA中的所述缺陷进行的修复然后可以使这些经过修复的游离DNA通过包含测序和靶向捕获富集的技术进行分析。

修复游离DNA可以增加可用于分析的DNA的量和/或可能允许对更长的DNA片段进行分析。由于修复后将可获得更多无缺陷的DNA,因此在无缺陷的DNA的量不足以进行分析或不足以实现从分析中得到具有统计意义的结论的一些情况下,对DNA进行分析将是可能的。另外,更长的DNA片段可能更易于通过本文描述的技术修复缺陷。然后,修复缺陷可以实现对更长的DNA片段进行分析。长的DNA片段允许在最小数量的基因座上重复进行利用序列谱式对病症和病状进行的分析。

游离DNA的缺陷的谱式或严重程度可以是病症或病状的指示。例如,某种病症的游离DNA中的缺陷可以比未患有所述病症的受试者的游离DNA中的缺陷多。然后可以将缺陷的数量或谱式用于提供个体是否患有病症的分类。

参考以下详细描述和附图,可以更好地理解本发明的实施例的本质和优点。

附图说明

图1A、1B和1C示出了根据本发明的实施例的影响DNA的不同缺陷模式。

图2A和2B示出了根据本发明的实施例的母体血浆中的cfDNA的大小谱的修复变化。

图3A-3D示出了根据本发明的实施例的由于对数刻度的修复而导致的大小谱的变化。

图4A和4B示出了根据本发明的实施例的治疗修复胎儿来源和母体来源两者的cfDNA分子。

图5示出了根据本发明的实施例的经过修复的cfDNA的胎儿DNA分数表征。来自妊娠头三个月和妊娠末三个月的母体血浆的伪处理cfDNA或经过修复的cfDNA的胎儿DNA分数

图6A和6B示出了根据本发明的实施例的在伪处理治疗或修复治疗之后的妊娠头三个月和妊娠末三个月的母体血浆cfDNA的大小分级的胎儿DNA分数。

图7示出了根据本发明的实施例的来自妊娠头三个月和妊娠末三个月的母体血浆的伪处理cfDNA与经过修复的cfDNA之间的错误率比较。

图8示出了根据本发明的实施例的在靶标捕获文库中进行的修复治疗之后的长cfDNA分子的富集。

图9A示出了根据本发明的实施例的通过染色体Y靶向捕获增加胎儿cfDNA分子的测序深度。

图9B示出了根据本发明的实施例的在伪处理治疗或修复治疗之后来自妊娠头三个月和妊娠末三个月的母体血浆的短cfDNA染色体Y分子和长cfDNA染色体Y分子的定量。

图10示出了根据本发明的实施例的修复治疗使长于250bp的cfDNA分子富集。

图11示出了根据本发明的实施例的通过来自M12490妊娠末三个月的母体血浆DNA的不同方案来制备的文库的大小谱比较。

图12示出了根据本发明的实施例的来自具有修复和不具有修复的小鼠的cfDNA的大小谱。

图13示出了根据本发明的实施例的来自携带21三体的胎儿的孕妇的母体血浆的短(0-250bp)cfDNA片段和长(>250bp)cfDNA片段的大小分布表。

图14A和14B示出了根据本发明的实施例的来自五名各自携带21三体的胎儿的女性的具有修复和不具有修复的平均大小谱。图14A是具有对数刻度的曲线图,并且图14B是具有线性刻度的曲线图。

图15示出了根据本发明的实施例的在伪处理修复或PreCR修复治疗之后来自五名各自携带21三体的胎儿的女性的短(0-250bp)cfDNA分子和长(251-600bp)cfDNA分子的定量。

图16示出了根据本发明的实施例的在PreCR修复治疗之后的21三体的改善的无创性产前测试(NIPT)性能。

图17示出了根据本发明的实施例的用于改善对三体型的测定的接收器操作特征曲线。

图18示出了根据本发明的实施例的从其提取cfDNA的SLE患者的表。

图19示出了根据本发明的实施例的来自四名SLE患者的具有修复和不具有修复的DNA片段的按对数刻度计的大小谱。

图20示出了根据本发明的实施例的来自四名SLE患者的具有修复和不具有修复的DNA片段的线性羽轴上的大小谱。

图21A和21B示出了根据本发明的实施例的来自4名SLE患者(2名非活性SLE;2名活性SLE)的伪处理修复的cfDNA和PreCR修复的cfDNA的平均大小谱比较。图21A是具有对数刻度的曲线图,并且图21B是具有线性刻度的曲线图。

图22示出了根据本发明的实施例的在cfDNA修复之后活性SLE患者和非活性SLE患者中的DNA片段的不同大小范围的百分比变化和百分比的表。

图23示出了根据本发明的实施例的在cfDNA修复之后活性SLE患者和非活性SLE患者中的DNA片段的不同大小范围的变化的表。

图24A和图24B绘制了根据本发明的实施例的使用伪处理DNA片段和修复DNA片段的SLE患者的分子诊断潜力。

图25示出了根据本发明的实施例的正常细胞中的DNA包装方案。

图26示出了根据本发明的实施例的患有脆性X综合征(FXS)的患者中的CGG三联体重复cfDNA片段的存在。

图27示出了根据本发明的实施例的对HLA基因进行的等位基因单倍型分析。

图28示出了根据本发明的实施例的对先天性肾上腺增生症(CAH)进行的连接分析。

图29示出了根据本发明的实施例的制备生物样品的测序文库的方法。

图30示出了根据本发明的实施例的判定个体是否患有病症的分类的方法。

图31展示了根据本发明的实施例的系统。

图32示出了可与根据本发明的实施例的系统和方法一起使用的示例计算机系统的框图。

术语

如本文所使用的,术语“基因座(locus)”或其复数形式“基因座(loci)”是跨基因组变异的任何长度的核苷酸(或碱基对)的位置或地址。“序列读段”是指从核酸分子的任何部分或全部测序的核苷酸串。例如,序列读段可以是从核酸片段测序的短核苷酸串(例如,20-150个)、核酸片段的一端或两端处的短核苷酸串或对存在于生物样品中的整个核酸片段进行的测序。序列读段可以通过多种方式获得,例如使用测序技术或使用探针,例如通过杂交阵列或捕获探针或扩增技术,如聚合酶链反应(PCR)或使用单引物的线性扩增或等温扩增。

“组织”与组合在一起作为功能单元的一组细胞相对应。单个组织中可以存在超过一种类型的细胞。不同类型的组织可以由不同类型的细胞(例如,肝细胞、肺泡细胞或血细胞)组成,而且可以与来自不同生物体(母亲和胎儿)的组织或与健康细胞对示出病症的细胞相对应。

“生物样品”是指取自受试者(例如,人类,如孕妇、患有病症的个人、或疑似患有病症的个人、器官移植接受者或疑似患有涉及器官的疾病(例如心肌梗塞的心脏、中风的大脑或贫血的造血系统)过程的受试者)且含有一个或多个所关注的核酸分子的任何样品。生物样品可以是体液,如血液、血浆、血清、尿液、阴道液、水囊肿(例如,睾丸)液、阴道冲洗液、胸膜液、腹水液、脑脊髓液、唾液、汗液、泪液、痰液、支气管肺泡灌洗液、乳头排出液、来自身体不同部位(例如,甲状腺、乳房)的抽吸液等。也可以使用粪便样品。在各个实施例中,已经富集了游离DNA的生物样品(例如,通过离心方案获得的血浆样品)中的大部分DNA可以是游离的,例如,大于50%、60%、70%、80%、90%、95%或99%的DNA可以是游离的。离心方案可以包含例如在3,000g x 10分钟下获得流体部分,并在例如30,000g下再-离心另外10的分钟以去除残留的细胞。样品中的游离DNA可以源自各种组织的细胞,并且因此样品可以包含游离DNA的混合物。

“核酸”可以指呈单链或双链的形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。所述术语可以涵盖含有已知的核苷酸类似物或经修饰的主链残基或键的核酸,所述核酸是合成的、天然存在的和非天然存在的,所述核酸具有与参考核酸类似的结合性质,并且以类似于参考核苷酸的方式进行代谢。此类类似物的实例可以包含但不限于硫代磷酸酯、亚磷酰胺、甲基膦酸酯、手性甲基膦酸酯、2-O-甲基核糖核苷酸、肽核酸(PNA)。

除非另外指出,否则特定的核酸序列还隐含地涵盖其保守修饰的变体(例如,简并密码子取代)和互补序列,以及明确指出的序列。具体地说,简并密码子取代可以通过生成序列来实现,在所述序列中,一个或多个所选的(或全部)密码子的第三位被混合碱基和/或脱氧肌苷残基取代(Batzer等人,《核酸研究(Nucleic Acid Res)》,19:5081(1991);Ohtsuka等人,《生物化学杂志(J.Biol.Chem.)》,260:2605-2608(1985);Rossolini等人,《分子与细胞探测(Mol.Cell.Probes)》,8:91-98(1994))。术语核酸可与基因、cDNA、mRNA、寡核苷酸和多核苷酸互换使用。

术语“核苷酸”除了指天然存在的核糖核苷酸或脱氧核糖核苷酸单体之外,还可以理解为指其相关的结构变体,包含衍生物和类似物,除非上下文另有明确指示,否则这些衍生物和类似物在使用核苷酸的特定情况下(例如,与互补碱基的杂交)在功能上是等同的。

“序列读段”是指从核酸分子的任何部分或全部测序的核苷酸串。例如,序列读段可以是存在于生物样品中的完整核酸片段。可以从单分子测序获得序列读段。“单分子测序”是指对单个模板DNA分子进行测序以获得序列读段,而无需解释来自模板DNA分子的克隆拷贝的碱基序列信息。单分子测序可以对整个分子或仅部分DNA分子进行测序。可以对大多数DNA分子进行测序,例如,大于50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%。

“分类”是指与样品的特定性质相关联的任何一个或多个数字或一个或多个其它特性。例如,符号“+”(或词语“正”)可以表示样品被归类为具有缺失或扩增。分类可以是二进制的(例如,正或负)或具有更多的分类等级(例如,从1到10或0到1的标度)。术语“截止值”和“阈值”是指在操作中使用的预定数字。例如,截止大小可以指超过一定大小则不包含片段的大小。阈值可以是高于或低于特定分类所应用的值。这些术语中的任一术语可以在这些上下文中的任一种中使用。

术语“大小谱”总体上涉及生物样品中的DNA片段的大小。大小谱可以是直方图,其提供各种大小的DNA片段的数量的分布。各种统计参数(也称为大小参数或恰参数)可以用于将一种大小谱与另一种大小谱区分开。一个参数是相对于所有DNA片段或相对于另一个大小或范围的DNA片段的特定大小或大小范围的DNA片段的百分比。

如本公开所使用的术语“截止值”或量意指用于在生物样品的两个或更多个分类状态之间进行仲裁的数值或量——例如,存在或不存在与特定表型病状或疾病相关或连接或易患有表型病状或疾病的基因序列。例如,如果参数大于截止值,则对定量数据进行第一分类,或者如果参数小于截止值,则对定量数据进行不同的分类。

具体实施方式

母体血浆和其它生物样品中的游离DNA可以用于诊断目的和其它目的。然而,游离DNA分子可能会在双链核酸分子的链内受损。损伤可能是由于生物样品的原因(例如,热、搅拌、紫外线)或生物样品内部的原因(例如,复制错误)引起的。常规测定(包含测序和使用靶向探针)可能无法测定来自这些具有链内缺陷的双链核酸分子的读段。因此,受损的游离DNA可能不提供可以用于分析的任何信息。本发明的实施例可以允许从生物样品中的游离DNA产生更多的信息和更准确的信息。

图1A示出了完整的双链DNA和链内缺陷。完整的dsDNA示出了糖磷酸骨架或碱基对中没有缺陷。有切口的DNA示出两个相邻核苷酸之间的骨架缺失。具体地,相邻核苷酸之间不存在磷酸二酯键。有空位的DNA是链中的一个或多个核苷酸缺失的情况。无碱基DNA是当一个或多个碱基缺失,而骨架未受影响的情况。

图1B示出了可能影响DNA内的碱基的其它缺陷。当相邻的胸腺嘧啶碱基通过碳-碳双键彼此结合时(通常在存在紫外线辐射的情况下),可以形成胸苷二聚体。因此,与腺嘌呤结合的胸腺嘧啶碱基对断裂。氧化嘧啶包含鸟嘌呤被氧化以形成8-氧代鸟嘌呤的情况。脱氨基胞嘧啶包含胞嘧啶损失胺基并形成尿嘧啶的情况。

图1C示出了DNA-蛋白质交联缺陷。双链DNA与蛋白质交联。DNA-蛋白质交联缺陷可以通过反向交联来解决,所述反向交联可以通过添加高浓度的氯化钠来实现。

为了挽救受损的DNA分子,假设使用Taq DNA聚合酶、Bst DNA聚合酶、Taq DNA连接酶、核酸内切酶VIII、核酸内切酶IV、T4核酸内切酶V(PDG)、8-氧代鸟嘌呤糖基化酶(FPG)或尿嘧啶-DNA糖基化酶(UDG)的修复混合物可以用于修复母体血浆中的cfDNA。修复混合物的实例是PreCR修复混合物(PreCR Repair Mix)。具有更高的DNA完整性的经过修复的母体血浆DNA可能会增强下游分析的成功率。由于胎儿源性cfDNA分子比母体源性cfDNA分子2,16更短且更碎裂,提出胎儿cfDNA分子造成更多的DNA损伤。通过修复这些受损的胎儿cfDNA分子,可以使胎儿DNA分数富集。

在此研究中,对来自妊娠头三个月和妊娠末三个月的孕妇的母体血浆的cfDNA应用修复治疗。对经过修复的cfDNA样品与其伪处理对照物之间的大小谱和胎儿DNA分数进行研究和比较。还将讨论修复治疗对NIPT的性能以及评估个体是否患有病症的性能的潜在影响。

I.利用母体血浆的DNA修复研究

处理来自母体血浆的DNA片段以修复链内缺陷,如图1A中的那些链内缺陷。分析经过修复的DNA片段对短片段和长片段以及胎儿DNA和母体DNA的影响。

A.材料和方法

1.受试者、样品收集和DNA提取

此研究得到机构研究伦理委员会的批准。在知情同意的情况下,从香港威尔斯亲王医院妇产科学系(Department of Obstetrics and Gynaecology,Prince of WalesHospital,Hong Kong)募集怀有单例男性胎儿的怀孕妇女。如先前所述2,从20mL EDTA抗凝性母体外周血中分离血浆。对于妊娠末三个月的病例,在分娩后,从2cm深且距脐带插入(umbilical cord insertion)5cm的区新鲜解剖1cm3的胎盘组织。对于妊娠头三个月的病例,获得绒毛膜绒毛样品(CVS)。分别使用QIAamp DSP DNA血液迷你试剂盒(凯杰公司(Qiagen))和QIAamp DNA血液迷你试剂盒(凯杰公司)提取血浆和血沉棕黄层基因组DNA,并且通过Qubit 3.0(英杰公司(Invitrogen))进行定量。根据制造商的方案使用QIAamp DNA迷你试剂盒(凯杰公司)提取胎盘DNA和绒毛膜绒毛DNA。

2.血浆cfDNA修复和测序文库制备

使用PreCR修复混合物(新英格兰生物实验室(New England Biolabs))对10ng提取的血浆DNA进行DNA修复。与相同量的DNA输入并行进行伪处理对照。伪处理对照物包含反应缓冲液,但不含活性酶。在这种情况下,伪处理对照物不包含PreCR修复混合物的活性酶。通过去除由反应缓冲液引起的潜在偏差,相对于正常控制物(也就是说,无反应缓冲液),优选伪处理对照物。简言之,在49μl反应中,将10ng提取的DNA与1X ThermoPol缓冲液、100μMdNTP、1X NAD+和H2O混合,随后添加1μl的H2O(伪处理)或PreCR修复混合物(修复)。通过MinElute反应清洁试剂盒(凯杰公司)来去除残留的酶和试剂,随后进行双端测序文库制备,从而使伪处理治疗或修复治疗的血浆DNA纯化。如先前所述生成双链DNA(dsDNA)文库17。通过Accel-NGS 1S加DNA文库试剂盒(斯威夫特生物科学(SWIFT Biosciences))来生成衔接子-连接单链DNA(LIG-ssDNA)。通过Qubit dsDNA HS测定试剂盒(赛默飞世尔科技公司(Thermo Fisher Scientific))和实时定量PCR(KAPA文库定量试剂盒)在LightCycler 96系统(罗氏)上对文库进行定量。通过具有高灵敏度D1000 ScreenTape(安捷伦(Agilent))的Agilent 4200TapeStation系统来检查测序文库的大小谱,以确认成功文库制备,之后进行测序。

3.靶向捕获富集和大规模平行测序

如所描述地执行测序文库的靶向捕获18。捕获探针(罗氏Nimblegen(RocheNimblegen))主要将序列靶向Chr6和ChrY。获得每碱基152X的平均测序深度(从82X到210X)。通过定量实时PCR验证靶标捕获富集效率。在NextSeq 500系统(依诺米那(Illumina))上以75bp x 2的双端(PE)格式对所有文库进行测序。去除衔接子序列和低质量碱基(也就是说,质量评分<5),并且使用短寡核苷酸比对程序2(SOAP2)19将测序读段与非重复掩蔽的人参考基因组(hg19)进行比对。末端读段的每个成员允许最多两个核苷酸不匹配,但不是插入缺失。

4.单分子实时(SMRT)测序

将具有依诺米那格式衔接子的预靶标捕获测序文库合并,并使用SMRTbell模板制备试剂盒1.0-SPv3(太平洋生物科学公司(Pacific Biosciences))进行SMRT测序模板构建。将靶标捕获后的依诺米那测序文库类似地合并,并进一步进行SMRT测序文库构建。使用扩增子模板制备和测序方案,其中具有微小修改:用1.8x AMPure PB珠使DNA纯化,并使用TapeStation仪器(安捷伦)估算文库大小。用SMRT Link v5.1.0软件(太平洋生物科学公司)计算了测序引物退火和聚合酶结合条件。简言之,将测序引物v3退火到测序模板,然后使用Sequel结合和内部控制试剂盒2.1(太平洋生物科学公司)将聚合酶与模板结合。在Sequel SMRT细胞1M v2上执行测序。用Sequel测序试剂盒2.1(太平洋生物科学公司)在Sequel系统上收集测序影像,持续10小时。

5.微阵列基因分型和单核苷酸多态性(SNP)鉴定

使用Infinium Omni2.5-8V1.3试剂盒和iScan系统(依诺米那)对胎儿基因组DNA样品和母体基因组DNA样品进行基因分型。SNP由Birdseed v2算法20调用。将CVS和胎盘的基因型与母亲的基因型进行比较,以鉴定胎儿特异性和母体特异性SNP等位基因。如果SNP在母亲中是纯合且在胎儿中是杂合的,则SNP被认为是胎儿特异性的,并且如果情况相反,则认为是母体特异性SNP。如所述2推导胎儿DNA分数。在大小分级的胎儿分数分析中,如先前所述17,用经修改的大小分析范围将胎儿DNA片段分为10-bp的直条。错误率由以下等式推导:

对于小鼠血浆cfDNA修复,在10-12周龄时通过心脏穿刺获得来自两只野生型(WT)C57BL/6小鼠的全血样品。如先前所述21,将血液收集到含EDTA的收集管中并分离血浆。对10ng cfDNA输入进行伪处理或修复治疗,之后进行dsDNA测序文库制备。

B.结果

对来自母体血浆的cfDNA的修复治疗的结果表明,修复治疗可以重新获得胎儿来源和母体来源两者的长(>250bp)cfDNA分子的子集。修复治疗使胎儿分数出现很小但一致的增加。来自分析经过修复的DNA的结果表明,当与母体对应物相比时,修复后的胎儿长cfDNA分子(>250bp)相对较高地富集。未发现修复治疗会改变用于分子诊断的下游测定的DNA保真度。发现修复双链DNA的缺陷比修复单链DNA上的缺陷更为有效。

1.来自妊娠头三个月和妊娠末三个月的母体血浆样品的伪处理cfDNA或经过修复的cfDNA的大小谱特性

首先研究在伪处理治疗或PreCR DNA修复治疗之后母体血浆中是否出现cfDNA的任何大小谱的变化。总体而言,伪处理组和修复组之间的大小谱未示出来自测区的位于0-250bp范围内的主要差异。两组的主峰大小均在166bp左右,并且一系列峰为70-150bp,周期性为10-bp。然而观察到,与伪处理对应物相比,在修复治疗之后,短(0-250bp)cfDNA片段平均减少2.4%(96.64%到94.33%),而长(251-600bp)cfDNA片段平均增加68.8%(3.36%到5.67%)。统计分析表明,两种变化均是显著的(两者p<0.01;司徒顿(Student's)配对t测试)。使用IBM SPSS统计(IBM)执行司徒顿配对t测试和威尔科克森符号秩测试(WilcoxonSigned rank test)。小于0.05的p值被认为具有统计学意义。

图2A示出了来自代表性妊娠末三个月的母体血浆(M12778)的伪处理cfDNA和经过修复的cfDNA的大小谱比较。下图表示长cfDNA分子的经过放大的大小谱(黑框)。所述图示出了片段的分数百分比的251-600bp的增加。

此趋势在所有测试的受试者中都是一致的,所述受试者包含来自妊娠头三个月和妊娠末三个月的所有母体血浆样品(图2B)。图2B示出了在伪处理治疗或修复治疗之后在妊娠头三个月和妊娠末三个月的母体血浆中具有不同大小的cfDNA分子的定量。在修复之后,短(0-250bp)cfDNA分子的分数一致减少,而长(251-600bp)cfDNA分子的分数一致增加。司徒顿配对t测试,p<0.01。观察到短分子的分数百分比的减少是修复后长分子数量增加的结果。

图3A、3B、3C和3D呈现来自图2A和2B中的样品的按对数刻度计的数据,以更好地说明更长片段的频率的增加。图3A示出了来自代表性妊娠末三个月的母体血浆(M12778)的伪处理cfDNA和经过修复的cfDNA的以对数刻度表示的大小谱比较。图3B-3D示出了伪处理cfDNA和经过修复的cfDNA的平均大小谱比较。图3B示出了来自所有病例的结果。图3C仅示出了妊娠头三个月。图3D仅示出了妊娠末三个月。在这些图中突出显示了经过修复的测序文库中长(>250bp)cfDNA分子的富集。

接下来,需要了解修复治疗之后的这些大小变化是否表明与cfDNA分子的胎儿或母体来源有任何关系。使用基于SNP的基因型,将所有受试者的cfDNA片段分为其相应的母体来源和胎儿来源。分离携带胎儿或母体特异性SNP等位基因的cfDNA片段,并且分别被视为胎儿特异性cfDNA分子或母体特异性cfDNA分子17。在来自胎儿来源和母体来源两者的经过修复的cfDNA分子中观察到类似的趋势(图4A)。图4A示出了来自左侧的胎儿来源和来自右侧的母体源性伪处理cfDNA和经过修复的cfDNA的平均大小谱比较。下图表示长cfDNA分子的经过放大的大小谱(黑框)。

在修复治疗之后,长胎儿cfDNA分子和母体cfDNA分子的分别平均增加82.7%(2.26%到4.13%)和66.7%(3.42%到5.7%)(图4B)。图4B示出了左侧胎儿cfDNA和右侧母体cfDNA分子中的短(0-250bp)cfDNA分子和长(251-600bp)cfDNA分子的定量。所示数据来自伪处理治疗或修复治疗之后的妊娠头三个月和妊娠末三个月的母体血浆。统计分析表明,两种增加均是显著的(两者p<0.01;司徒顿(Student's)配对t测试)。这些结果表明,当与母体对应物相比时,修复后的胎儿长cfDNA分子相对较高地富集。

2.来自妊娠头三个月和妊娠末三个月的母体血浆样品的伪处理cfDNA或经过修复的cfDNA的胎儿DNA分数特性

由于胎儿DNA分数是成功进行NIPT的重要参数,因此增加此度量可能有益于NIPT的灵敏度,特别是在胎儿贡献不足的情况6下。因此,对在伪处理治疗和修复治疗后的来自妊娠头三个月和妊娠末三个月样品的母体血浆的总胎儿DNA分数进行表征并比较。当将来自所有8个样品的数据合并在一起时,观察到与伪处理对照物相比,在修复治疗之后的胎儿DNA分数一致增加了4.31%(21.85%到22.79%)(图5)。修复治疗使胎儿分数出现很小但一致的增加。统计分析表明,此类增加是显著的(p=0.012;威尔科克森符号秩测试)。胎儿DNA分数的此类轻度增加的来源可能来自新修复的胎儿长cfDNA分子。为了证明这一点,对伪处理受试者和经过修复的受试者两者均应用了大小分级的胎儿分数分析。将胎儿DNA片段分为10-bp的条带,范围为0bp到600bp。然后单独推导每个条带内的胎儿DNA分数17。观察到,此类胎儿DNA分数增加主要是由于大小在300bp左右的胎儿cfDNA分子的增加引起的(图6A和6B)。图4A示出了妊娠头三个月的母体血浆。图6B示出了妊娠末三个月的母体血浆。长(大约300bp)cfDNA分子中的胎儿DNA分数在经过修复组中出现轻度增加。综合起来,这些结果表明,在母体血浆中,长胎儿cfDNA分子比其母体对应物具有更高的富集度。

DNA损伤可能是导致测序错误22的普遍原因。可以通过cfDNA修复方案的多个步骤(如氧化核苷酸的双链置换和校正)将新颖错误引入到cfDNA中。因此,接下来检查经过修复的库中的错误率是否有显著变化。在妊娠头三个月和妊娠末三个月病例两者的情况中均未观察到错误率的显著变化(图7)。这表明修复治疗不会改变用于分子诊断的下游测定的DNA保真度。

由于胎儿cfDNA分子是母体血浆中的少数物种,因此大部分从总母体血浆cfDNA测序中获得的数据都由母体源性cfDNA分子控制。为了获得胎儿cfDNA分子的增加的测序深度,使用了利用探针与Chr6和ChrY上的序列杂交的靶标捕获方法18。实现了对于所有伪处理样品和经过修复的样品,每碱基平均测序深度为152X。来自靶向测序结果的观察与非靶标捕获数据一致,其中在修复治疗后,大小介于250bp与600bp之间的长cfDNA分子的富集度为13.6%(10.53%到11.96%)(图8)。靶向捕获探针在Chr6和ChrY的序列上杂交。来自合并的妊娠头三个月和妊娠末三个月的母体血浆的伪处理cfDNA或经过修复的cfDNA的平均大小谱比较。下图是长cfDNA分子的经过放大的大小谱(黑框)。

当仅对捕获的胎儿cfDNA分子进行计数时,观察到与伪处理对应物相比,在修复治疗之后,长染色体Y cfDNA分子的平均富集度为14.8%(6.36%到7.3%)(图9A)。上方的曲线图示出了在妊娠头三个月(左侧)和妊娠末三个月(右侧)的母体血浆中来自染色体Y的伪处理cfDNA分子和经过修复的cfDNA分子的平均大小谱比较。下图表示长cfDNA分子的经过放大的大小谱(黑框)。图9B示出了在伪处理治疗或修复治疗之后来自妊娠头三个月和妊娠末三个月的母体血浆的短(0-250bp)和长(251-600bp)cfDNA染色体Y cfDNA分子的定量。统计分析表明,此类增加是显著的(p<0.01;司徒顿(Student's)配对t测试)。因此,已经证明修复治疗可以重新获得胎儿来源和母体来源两个方面的母体血浆中的长(>250bp)cfDNA分子的子集。修复之后的胎儿总DNA分数的很小但一致的增加是由于长胎儿cfDNA分子比其母体对应物具有更高的富集而引起的。

3.在修复治疗之后来自母体血浆的长于250bp的cfDNA分子的富集

由于长于250bp的cfDNA分子上存在伪处理cfDNA与修复cfDNA之间的主要大小差异,因此通过常规NGS平台(如依诺米那平台)检测此类分子由于其短读段长度而可能不是优选的。来自太平洋生物科学公司的采用SMRT技术的第三代测序平台可以实现超过20kb的测序读段长度23。假设使用此类技术,可能会提高在母体血浆中观察到长于250bp的cfDNA分子的能力。由于最小cfDNA输入的限制,合并了所有依诺米那格式化的靶标捕获前和捕获后文库,并且将所述文库在SMRT测序平台在重新测序,而不是直接对DNA模板进行测序。期望在修复治疗后出现长cfDNA分子的富集。与来自依诺米那平台的测序数据一致,在修复治疗之后观察到在具有或不具有靶标捕获的合并文库中长于250bp的cfDNA分子的富集度分别为31.3%和28.9%(图10)。靶标捕获前(左)和捕获后(右)文库的合并样品表明,在修复治疗后出现长于250bp的cfDNA分子的富集,其中长于400bp的分子富集更为突出。对于长于600bp的cfDNA分子,这些富集甚至更为显著(在靶标捕获前和靶标捕获后文库中分别为52%和50.4%)。这些数据不仅进一步证实了先前在双端的短读段测序平台中在修复治疗之后观察到长cfDNA分子富集,而且还阐明了在先前研究中未通过大规模并行测序进行分析的长cfDNA分子的群体。

4.cfDNA修复在不同文库制备方案中的性能

由于先前已经表明,通过单链DNA(ssDNA)测序文库制备方法17来使超短片段富集,因此值得评估的是,在此类方案相对于在常规双链DNA(dsDNA)方法中的cfDNA修复性能。假设通过衔接子-连接ssDNA(LIG-ssDNA)方案获得的超短cfDNA片段的某些分数实际上是从受损的DNA结构中释放的,其中双链DNA结构的单链中存在切口和/或空位。推测cfDNA修复可以通过填充DNA链上的切口和空位来减少通过LIG-ssDNA方案富集的此类超短cfDNA片段(<100bp)。为了验证此类假设,在伪处理治疗或PreCR治疗之后执行并行dsDNA和LIG-ssDNA文库制备方法。与伪处理对应物相比,在经过修复后的LIG-ssDNA文库中观察到超短cfDNA片段(<100bp)的减少。对于长于250bp的cfDNA片段,cfDNA片段的增加非常有限(图11)。得出的结论是,尽管在修复之后减少了超短cfDNA片段的某个部分,但是没有证据表明,此类部分会导致较长cfDNA片段增加。因此,LIG-ssDNA文库中长cfDNA片段重新获得的能力不如dsDNA文库。使用PreCR修复缺陷对单链DNA文库制备方案的效果不如对双链DNA文库制备方案的效果。

5.在来自小鼠血浆的cfDNA中的cfDNA修复性能

为了验证非人类哺乳动物中是否也存在cfDNA损伤的修复,评估在来自小鼠的cfDNA中cfDNA修复的性能。从两只C57BL/6野生型(WT)小鼠中分离血浆,从血浆中提取DNA,随后进行伪处理治疗或修复治疗。在确切的人场景中制备测序dsDNA文库。在修复治疗后观察到长(200-1000bp)cfDNA片段增加了70%(图12)。在经过修复的治疗中长(>200bp)cfDNA片段的富集是没有修复治疗的对应物中长cfDNA片段的富集的1.41倍。cfDNA片段频率以对数刻度呈现。此结果与人队列一致,这表明类似的cfDNA损伤谱式由高级生物体(如哺乳动物)共享。

II.用胎儿三体型和SLE患者进行的DNA修复研究

处理来自另外的受试者的DNA片段以修复链内缺陷。修复了来自怀孕妇女的母体血浆的DNA片段,每名怀孕妇女携带单例21三体胎儿。另外,修复了来自患有活性或非活性系统性红斑狼疮(SLE)患者的DNA片段。分析经过修复的DNA片段对短片段和长片段以及其在检测样品病状时的影响。章节II中的参考文献与在其它章节中的参考文献单独标记,并且在所述章节的结束时在列表中提供参考文献。

A.材料和方法

此研究得到机构伦理委员会的批准。募集了怀有单例男性胎儿的十名妊娠头三个月的怀孕妇女和十名妊娠末三个月的怀孕妇女。还募集了五名怀有单例21三体胎儿的怀孕妇女。募集了四名患有系统性红斑狼疮(SLE)的患者。所有SLE患者都符合美国风湿病学院(American College of Rheumatology)的诊断标准,并且其红斑狼疮疾病活性通过SLE疾病活动指数(SLEDAI)来评估,所述SLEDAI是对疾病活性的临床测量1。两名患者患有非活性SLE(SLEDAI中位数:1;范围为0-2),而其它两名患有活性SLE(SLEDAI均等于8)。还在采血的时候测量了所有患者的抗dsDNA抗体水平。从香港威尔斯亲王医院妇产科学系募集所有怀孕样品。从香港威尔斯亲王医院医学与治疗学系(Department of Medicine andTherapeutics,Prince of Wales Hospital,Hong Kong)募集SLE样品。所有受试者都已知情同意。

1.文库制备

如先前所述2,从20mL EDTA抗凝性母体外周血中分离血浆。对于妊娠末三个月的病例,在分娩后,从2cm深且距脐带5cm的区新鲜解剖1cm3的胎盘组织。对于妊娠头三个月的病例,获得绒毛膜绒毛样品(CVS)。分别使用QIAamp DSP DNA血液迷你试剂盒(凯杰公司(Qiagen))和QIAamp DNA血液迷你试剂盒(凯杰公司)提取血浆和血沉棕黄层基因组DNA并且通过Qubit 3.0(英杰公司(Invitrogen))进行定量。根据制造商的方案使用QIAamp DNA迷你试剂盒(凯杰公司)提取胎盘DNA和绒毛膜绒毛DNA。对于游离DNA(cfDNA)修复,通过使用PreCR修复混合物(新英格兰生物实验室)来修复每个受试者的10ng提取的血浆DNA输入。

与相同量的DNA输入和仅反映缓冲液并行进行伪处理对照。所有DNA修复治疗或伪处理治疗均根据制造商的说明进行。通过MinElute反应清洁试剂盒(凯杰公司)来去除残留的酶和试剂,随后进行测序文库制备,从而使伪处理治疗或修复治疗的血浆DNA纯化。双链DNA(dsDNA)文库由用于依诺米那的KAPA HTP文库制备(KAPA生物系统公司(KAPABiosystems))根据制造商的说明产生。衔接子-连接单链DNA(LIG-ssDNA)文库由Accel-NGS1S加DNA文库试剂盒(斯威夫特生物科学)生成。在LightCycler 96系统(罗氏)上通过Qubit和实时定量PCR对文库进行定量。通过安捷伦高灵敏度D1000 ScreenTape系统(安捷伦)检查测序文库的大小谱。在NextSeq 500系统(依诺米那(Illumina))上以75bp x2的双端(PE)格式对所有文库进行测序。去除衔接子序列和低质量碱基(也就是说,质量评分,<5),并且使用短寡核苷酸比对程序2(SOAP2)3。将文库与非重复掩蔽的人参考基因组(hg19)进行比对。末端读段的每个成员允许最多两个核苷酸不匹配,但不是插入缺失。

对于小鼠血浆cfDNA修复,在10-12周龄时通过心脏穿刺获得来自两只野生型(WT)C57BL/6小鼠的全血样品。如先前所述4,将血液收集到含EDTA的收集管中并分离血浆。对10ng cfDNA输入进行伪处理或修复治疗,之后进行dsDNA测序文库制备。对于SLE血浆样品,将每个样品的所有提取的cfDNA平均地分成伪处理治疗或修复治疗,之后进行dsDNA测序文库制备。

2.微阵列基因分型和单核苷酸多态性(SNP)鉴定

使用Infinium Omni2.5-8V1.3试剂盒和iScan系统(依诺米那)对胎儿基因组DNA样品和母体基因组DNA样品进行基因分型。SNP由Birdseed v2算法5通过0.15的置信度评分截止值来调用。将CVS和胎盘的基因型与母亲的基因型进行比较,以鉴定胎儿特异性和母体特异性SNP等位基因。如果SNP在母亲中是纯合且在胎儿中是杂合的,则SNP被认为是胎儿特异性的,并且如果情况相反,则认为是母体特异性SNP。如所述2推导胎儿DNA分数。简言之,使用下式通过胎儿特异性SNP等位基因(p)与母亲和胎儿共享的常见SNP等位基因(q)之间等位基因比率推导出胎儿DNA分数(F):6

在大小分级的胎儿分数分析中,如先前所述7,用经修改的大小分析范围将胎儿DNA片段分为10-bp的直条。为了检测21三体,使用下式通过z评分对每个样品的Chr21的过量表达进行定量:

其中GRchr21是染色体21的基因组表示(GR)。

B.结果

发现修复DNA片段会使来自携带单例三体胎儿的怀孕妇女的生物样品以及来自活性和非活性SLE患者的生物样品中的较长片段富集。发现修复来自母体血浆的DNA片段会提高测定胎儿三体型的灵敏度和特异性。PreCR修复治疗在没有显著丢失较短的(<166bp)cfDNA分子的情况下使较长的(>250bp)cfDNA分子富集。与没有修复的生物样品相比,修复DNA片段使来自生物样品的更多DNA片段能够用于分析三体型或SLE或其它病状。修复DNA片段在非活性SLE样品与活性SLE样品之间提供更大的绝对分离差异。这转化为对潜在的分子诊断开发的相对33.7%改进。

1.来自21三体母体血浆样品的伪处理修复或PreCR修复的cfDNA的大小谱特性

图13示出了来自携带21三体的胎儿的孕妇的母体血浆的短(0-250bp)cfDNA片段和长(>250bp)cfDNA片段的大小分布表。与来自妊娠头三个月和妊娠末三个月的母体血浆样品类似,在PreCR修复治疗之后,在所有21三体样品中观察到短(0-250bp)cfDNA片段的平均3.3%绝对减少(95.5%-92.2%)以及长(>250bp)cfDNA片段的平均3.7%绝对增加(4.1%-7.8%)。

图14A和14B示出了修复之前和修复之后21三体样品中的DNA片段的大小谱。图14A和图14B是总频率的分数百分比相对于DNA片段大小的曲线图。图14A示出了按对数刻度计的分数百分比,并且图14B示出了相同数据的按线性刻度计的分数百分比。在每个曲线图上绘制了伪处理治疗和PreCR修复治疗的片段。PreCR修复的片段比伪处理片段示出更长片段的更大分数。

图15示出了在伪处理修复或PreCR修复治疗之后来自五名各自携带21三体的胎儿的女性的短(0-250bp)cfDNA分子和长(251-600bp)cfDNA分子的定量。图15中的曲线图示出了伪处理治疗片段和修复治疗片段两者的总频率的分数百分比。短片段表明分数百分比下降。长片段表明分数百分比增加。统计分析表明,两种变化均是显著的(两者p<0.01;司徒顿配对t测试)。

2.在PreCR修复治疗之后改善21三体的NIPT性能

由于经过修复的cfDNA样品具有可从胎儿分析获得的更多完整的长cfDNA分子,因此旨在证明所述样品用于产前诊断的潜在应用。募集了五名怀有21三体胎儿的孕妇,并将Chr21的染色体代表与10例妊娠头三个月的整倍体病例进行比较,所述整倍体病例将是NIPT的临床上最相关的样品。在PreCR修复治疗之后,观察到21三体病例的Chr21 z评分表明,平均增加了17.3%(范围在14.4%到19.8%),并且表现出更好地与整倍体样品的z评分分离(图16)。

在图16中,在左侧示出了五个21三体样品的染色体21z评分,并且在右侧示出了10个整倍体样品的染色体21z评分。经过修复的21三体样品表明z得分增加,并且与整倍体样品更大的分离。这些结果表明,PreCR修复治疗可以改善21三体孕妇的NIPT性能。修复治疗可以允许将较低的胎儿分数用于非整倍体分析。在非整倍体的未经修复的DNA将不会表明用于作为非整倍体分类的足够高的z评分的情况下,所述修复还可以实现非整倍体的分类。修复治疗可以产生具有比没有修复治疗的方法的灵敏度、特异性和/或准确度增加的方法。

a)模拟细节

为了定量证明血浆DNA的修复效果,执行了模拟分析,随后进行接受者操作特征(ROC)分析以使用映射到携带21三体胎儿的怀孕妇女的chr21的DNA读段来判定使用经过修复的血浆DNA读段是否比没有修复的血浆DNA读段具有优势。在模拟中,假设胎儿分数为1%,并且假设总经测序读段为3百万。将在PreCR修复之后的胎儿分数的相对增加设定为4.8%。

在计算机模拟中,假设源自特定染色体的血浆DNA的经测序读段的数量遵循二项式分布。对于携带整倍体胎儿的怀孕妇女,将源自染色体21(chr21)的血浆DNA的经测序读段的比例表示为GR21。在总经测序读段(n)中,源自chr21(E)的读段数将遵循以下分布:

E~Binom(n,GR21),(1)

其中“Binom”表示二项分布。

对于携带三体型胎儿的怀孕妇女,将源自chr21的血浆DNA的经测序读段的比例表示为GR'21

其中f是怀孕妇女的母体血浆DNA中的胎儿DNA分数。在总经测序读段(n)中,源自chr21(T)的读段数将遵循以下分布:

T~Binom(n,GR'21), (3)

这可以改写为:

在测序之前修复血浆DNA之后,f将增加到f',这由下式决定:

f′=(1+α)×f, (5)

其中α是在血浆DNA修复之后胎儿DNA分数的相对增加。在这种场景中,对于携带三体型胎儿的怀孕妇女,在总经测序读段(n)中,源自chr21(G)的读段数将遵循以下分布:

根据(1)、(4)和(6),对分别来自携带整倍体胎儿的怀孕妇女和那些携带21三体胎儿的怀孕妇女的100个血浆DNA样品模拟了源自chr21的经测序读段。还对100个血浆DNA进行模拟,随后对那些携带21三体胎儿的怀孕妇女进行DNA修复。对于每个样品,假设胎儿分数为1%,并且假设总经测序读段(n)为3百万。与携带整倍体胎儿的怀孕妇女相比,使用接受者操作特征(ROC)分析来测定在具有或不具有映射到携带21三体胎儿的怀孕妇女的chr21的DNA修复的血浆DNA读段的百分比的诊断差异。

用R函数rbinom生成二项式分布。用R包pROC(1.15.3版本)绘制具有或不具有DNA修复的组的ROC曲线。采用德龙测试(DeLong's test)对ROC曲线进行比较,以判定与不具有DNA修复的方法相比,使用具有DNA修复方案的方法对21三体检测进行的改善是否具有统计学意义。

b)模拟结果

图17示出了将检测具有DNA修复和不具有DNA修复的21三体进行比较的模拟结果的ROC曲线。结果表明,修复后曲线下面积(AUC)从0.729改善到0.822。使用德龙测试进行的统计分析表明,改善是显著的(伪处理相对于修复,德龙测试:p=0.006013)。因此,修复DNA可以改善使用来自母体血浆的DNA片段测定胎儿的三体型的灵敏度和特异性。

3.在PreCR修复治疗之后在来自SLE患者的血浆中增加的较长cfDNA分子

与正常受试者相比8,来自SLE患者的cfDNA分子的cfDNA大小谱是不同的。先前已经报道8了短于115bp的cfDNA片段的突出富集。此外,疾病的严重程度对应于此类超短cfDNA片段的量,也就是说,活跃的SLE患者在其血浆中具有更多的超短片段。基于这种情况,旨在探讨PreCR修复治疗对来自SLE患者的cfDNA分子的大小谱的影响。募集了2名非活性(SLEDAI=0-2)和2名活性(SLEDAI=8)SLE患者,从其血浆中提取cfDNA,并进行伪处理治疗或修复治疗。

图18包含SLE患者的样品数量、SLE疾病活动指数(SLEDAI)水平、抗ds DNA抗体水平以及来自血浆的总DNA量。SLEDAI和抗ds DNA抗体水平是疾病活动的临床测量结果。较高的SLEDAI和较高的抗ds DNA抗体水平对应于更为活性SLE状态。

在修复之后观察到较长cfDNA片段的增加,这类似于来自母体血浆样品的结果。

图19和图20示出了来自SLE患者中的每名患者的具有修复和不具有修复的cfDNA的大小谱。图19示出了分数的对数相对于DNA片段的大小。图19示出了按线性刻度计的相同数据。分析来自四名患者(S113、S117、S312、S494)的样品,其中每名患者都具有伪处理样品和修复样品。伪处理数据用虚线示出,而经过修复的数据用实线示出。两名患者患有非活性SLE,并且两名患者患有活性SLE。所述曲线图示出了具有修复的较长DNA片段(>250bp)的增加。较短的DNA片段(<200bp)示出具有修复的轻微降低。

图21A和图21B示出了在图19和图20中显示的来自非活性和活性SLE患者的平均结果。图21A示出了对数分数相对于DNA片段大小。图21B示出了按线性刻度计的相同数据。所述曲线图示出了具有修复的较长DNA片段(>250bp)的增加。较短的DNA片段(<200bp)示出具有修复的轻微降低。

图22示出了在cfDNA修复之后活性SLE患者和非活性SLE患者中的DNA片段的不同大小范围的百分比变化和百分比的表。图22涉及在图19和图20中显示的相同数据。所述表有四个不同的大小范围:短(0-250bp)、长(>250bp),0-115bp和>200bp。0-115bp和>200bp的大小范围是在Chan等人,《美国国家科学院院刊(PNAS)》(2014)8中使用的范围。报道了非活性SLE患者和活性SLE患者的每个大小范围。表中的每个单元格中的前两个百分比是修复之前和修复之后的大小范围的百分比。括号中的百分比指示修复后的相对百分比的增加或减少。

图23示出了修复后的非活性SLE患者和活性SLE患者的平均百分比变化。图23示出了在平均来自患者的数据之后的百分比变化,这类似于图21A和图21B中绘制的数据。对于非活性SLE患者,在PreCR修复治疗之后,短(0-250bp)cfDNA片段平均减少2.3%(97.4%-95.2%),而长(251-600)cfDNA片段平均增加88.0%(2.6%-4.8%)。对于活性SLE患者,在PreCR修复治疗之后,短cfDNA片段平均减少1.4%(97.2%-95.8%),而长cfDNA片段平均增加49.3%(2.8%-4.2%)。然而,未观察到大小短于或等于166bp的cfDNA分子的量存在任何显著变化。

当将短DNA片段和长DNA片段的大小范围分别修改为0-115bp和>200bp时,所述变化类似于0-250bp和>250bp的变化。对于非活性SLE样品,在PreCR修复治疗之后,短(0-115bp)和长(>250bp)cfDNA片段分别平均相对减少14.5%(4.3%-3.7%)和增加46.8%(5.4%-7.6%)。对于活性SLE患者,在PreCR修复治疗之后,短(0-115bp)和长(>250bp)cfDNA片段分别平均相对减少4.3%(11.8%-11.3%)和增加21.7%(7.8%-9.4%)。PreCR修复治疗增加了可用于SLE诊断的DNA片段的数量。为了评估使用PreCR修复的SLE患者的诊断潜力,进行了大小合并(限制为120-130bp),并单独绘制了在伪处理治疗或PreCR修复治疗后非活性和活性SLE样品的绝对百分比。

图24A和图24B绘制了使用伪处理DNA片段和修复DNA片段的SLE患者的分子诊断潜力。图24A是图22中120-130bp的数据的图形表示。图24A绘制了在伪处理治疗或PreCR修复治疗之后非活性和活性SLE样品的绝对百分比。将大小合并设定为120-130bp。D1和D2分别表示在伪处理治疗或PreCR修复治疗之后非活性SLE样品与活性SLE样品之间的绝对分离差异。图24B绘制了条形图,其示出了在经过修复的SLE样品中绝对分离差异相对增加了33.7%。与未经修复的DNA片段相比,在测定患者中的SLE水平时,在PreCR修复后非活性SLE样品与活性SLE样品之间的这种更佳分离是优势。测试了多个大小范围,其中120-130bp大小范围表明在修复治疗之后非活性SLE样品与活性SLE样品之间具有最佳分离。然而,还可以使用其它大小范围,包含100-110bp、110-120bp、130-140bp或140-150bp。

4.章节II、III.B和III.C的参考文献

1.Bombardier C、Gladman DD、Urowitz MB、Caron D、Chang CH.“SLEDAI的由来——红斑狼疮患者的疾病活动指数(Derivation of the SLEDAI.A disease activityindex for lupus patients)”.SLE预后研究委员会(The Committee on PrognosisStudies in SLE).《关节炎与风湿病(Arthritis Rheum.)》1992;35(6):630-640。

2.Lo YM、Chan KC、Sun H等人.“母体血浆DNA测序揭示胎儿的全基因组遗传和突变概况(Maternal plasma DNA sequencing reveals the genome-wide genetic andmutational profile of the fetus)”.《科学转化医学杂志(Sci Transl Med.)》2010;2(61):61ra91。

3.Li R、Yu C、Li Y等人.“SOAP2:用于短读段比对的改善的超快工具(SOAP2:animproved ultrafast tool for short read alignment)”.《生物信息学(Bioinformatics.)》2009;25(15):1966-1967。

4.Cheng THT、Lui KO、Peng XL等人.“在敲除小鼠模型中,DNase1在血浆DNA碎裂中似乎没有发挥主要作用(DNase1 Does Not Appear to Play a Major Role in theFragmentation of Plasma DNA in a Knockout Mouse Model)”.《临床化学(ClinChem.)》2018;64(2):406-408。

5.Hong H、Xu L、Tong W.“使用HapMap样品评估全基因组人SNP阵列6.0的基因型调用算法Birdseed版本之间的一致性。(Assessing consistency between versions ofgenotype-calling algorithm Birdseed for the Genome-Wide Human SNP Array6.0using HapMap samples)”.《实验医学与生物学进展(Adv Exp Med Biol.)》2010;680:355-360。

6.Jiang P、Peng X、Su X等人.FetalQuant.《NPJ基因组医学(NPJ Genom Med.)》2016;1:16013。

7.Vong JSL、Tsang JCH、Jiang P等人.“单链DNA文库制备优先富集母体血浆中的短母体DNA(Single-Stranded DNA Library Preparation Preferentially EnrichesShort Maternal DNA in Maternal Plasma)”.《临床化学》2017;63(5):1031-1037。

8.Chan RW、Jiang P、Peng X等人.“系统性红斑狼疮中的通过基因组和甲基组测序揭示的血浆DNA畸变(Plasma DNA aberrations in systemic lupus erythematosusrevealed by genomic and methylomic sequencing)”.《美国国家科学院院刊(Proc NatlAcad Sci U S A.)》2014;111(49):E5302-5311。

9.Chen EZ、Chiu RW、Sun H等人.“通过母体血浆DNA测序对胎儿18三体和13三体进行无创性产前诊断(Noninvasive prenatal diagnosis of fetal trisomy 18andtrisomy 13by maternal plasma DNA sequencing)”.《公共科学图书馆·综合(PLoSOne)》.2011;6(7):e21791。

10.Chiu RW、Akolekar R、Zheng YW等人.“通过多重母体血浆DNA测序对21三体进行无创性产前评估:大规模有效性研究(Non-invasive prenatal assessment of trisomy21by multiplexed maternal plasma DNA sequencing:large scale validity study)”.《英国医学期刊(BMJ.)》2011;342:c7401。

11.Palomaki GE、Deciu C、Kloza EM等人.“对母体血浆进行的DNA测序可靠地鉴定18三体和13三体以及唐氏综合症:国际合作研究(DNA sequencing of maternal plasmareliably identifies trisomy 18and trisomy 13as well as Down syndrome:aninternational collaborative study)”.《遗传学与医学(Genet Med.)》2012;14(3):296-305。

12.Nicolaides KH、Syngelaki A、Ashoor G、Birdir C、Touzet G.“常规筛查的妊娠头三个月群体中胎儿三体型的无创型产前测试(Noninvasive prenatal testing forfetal trisomies in aroutinely screened first-trimester population)”.《美国妇产科杂志(Am J Obstet Gynecol.)》2012;207(5):374.e371-376。

13.Pergament E、Cuckle H、Zimmermann B等人.“高风险和低风险队列中基于单核苷酸多态性的无创性产前筛查(Single-nucleotide polymorphism-based noninvasiveprenatal screening in a high-risk and low-risk cohort)”.《妇产科杂志(ObstetGynecol.)》2014;124(2Pt 1):210-218。

14.Cervera R、Khamashta MA、Font J等人.“在10年期间系统性红斑狼疮的发病率和死亡率:在1,000名患者队列中早期和晚期表现的比较(Morbidity and mortality insystemic lupus erythematosus during a 10-year period:a comparison of earlyand late manifestations in a cohort of 1,000patients)”.《医学(Medicine)》(巴尔的摩(Baltimore)).2003;82(5):299-308。

15.Raptis L、Menard HA.“正常人和患有系统性红斑狼疮的患者的血浆DNA的定量和表征(Quantitation and characterization of plasma DNA in normals andpatients with systemic lupus erythematosus)”.《临床研究杂志(J Clin Invest.)》1980;66(6):1391-1399。

16.Chen JA、Meister S、Urbonaviciute V等人.“患有系统性红斑狼疮的患者的血浆/血清DNA的灵敏检测(Sensitive detection of plasma/serum DNA in patientswith systemic lupus erythematosus)”.《自身免疫(Autoimmunity)》.2007;40(4):307-310。

III.讨论

调查结果证明,使用修复混合物(例如,PreCR修复混合物)进行的cfDNA修复可以重新获得母体血浆中和来自SLE患者的血浆的长cfDNA分子的子集。修复后的长cfDNA分子比短cfDNA分子的相对富集表明,长cfDNA分子比短对应物含有更多可修复的DNA损伤。考虑到长cfDNA分子(例如>250bp)以痕量存在于母体循环中,通过修复进行的任何富集可能会导致相对地显著增加。实际上,来自依诺米那和太平洋生物科学公司SMRT测序平台的数据说明,长于250bp的cfDNA分子的富集度分别为68.8%和31.3%。当关注甚至更长的cfDNA分子时,富集变得甚至更加值得注意。例如,对于大小在450bp与600bp之间的cfDNA分子,如使用依诺米那和太平洋生物科学公司SMRT平台测得的富集量分别为109.4%和44.3%。对于如通过太平洋生物科学公司SMRT平台测量的长于600bp的cfDNA分子,DNA修复之后的富集度为50.4%。简言之,修复治疗可以成功地从母体血浆中重新获得长cfDNA分子。似乎cfDNA分子越长,富集度就越高。

出于若干种原因,先前未执行在游离DNA中修复链内缺陷。生物样品中游离DNA的浓度相对低,并且具有缺陷的游离DNA的浓度甚至更低。因此认为修复链内缺陷对分析几乎没有益处。另外,修复后临床相关DNA的分数可能不会显著增加。例如,图5表明从伪处理样品和修复样品测得的胎儿DNA分数通常不变。因此,修复游离DNA中的缺陷可能不会比修复非临床相关DNA中的缺陷增强临床相关DNA的信号。然而,发现修复游离DNA对短游离DNA和长游离DNA具有不同的作用。

不同的机制可能对于在血浆中产生长cfDNA分子和短cfDNA分子起作用。例如,短于200bp的cfDNA分子很可能是在细胞凋亡期间通过酶消化产生的。另一方面,长(>250bp)cfDNA分子很可能是由其它细胞死亡机制(如坏死)11,24-27产生的。如之前所讨论的,通过修复富集cfDNA分子在250bp与600bp之间更为突出。后者的长度让人联想到二核小体谱式和三核小体谱式(分别大约为330bp和500bp)。

图25示出了正常细胞中的DNA包装方案。将DNA包裹在核小体周围,所述核小体由4个核心组蛋白的八聚体(从而形成由147bp的DNA以约10bp的螺旋重复序列包裹的“核小体核心”)、连接子组蛋白和连接子DNA(平均大小大约为20bp)构成。已经证明血浆DNA不是随机碎裂的。高分辨率血浆DNA大小谱分析揭示,在166bp处存在主峰并且在150bp以下存在10-bp的周期性。2已经提出此大小谱与核小体结构密切相关。166bp处的峰对应于包裹在一个核小体核心周围的DNA的长度。250bp与450bp之间的峰(例如,图8)可以对应于包裹在两个核小体核心周围的DNA的长度。450bp与600bp之间的峰可以对应于包裹在三个核小体核心周围的DNA的长度。修复游离DNA可以允许分析更多的二核小体和三核小体的DNA长度。

根据数据,在修复后的长而不是短cfDNA分子的富集表明,大多数可修复的DNA损伤可能源于细胞死亡机制而不是细胞凋亡(例如坏死)。相比之下,在修复治疗之后缺少短cfDNA分子富集表明此类短cfDNA分子可能不含有可修复的DNA损伤。

将总cfDNA分解为胎儿分数和母体分数,数据表明DNA损伤并非随机分布在不同来源的整个cfDNA分子中。尽管数据揭示了在胎儿cfDNA分子和母体cfDNA分子两者中均出现长cfDNA富集,但长胎儿cfDNA分子的富集幅度(82.3%)高于母体源性cfDNA分子的富集幅度(66.7%)(图2)。与此相符,修复后的很小但一致的总胎儿分数增加表明,胎儿cfDNA分子可能承受更多的DNA损伤(图5)。这种观察结果的可能原因可能是由于DNA切割酶28对胎儿cfDNA分子的可接近性更高。与非捕获的富集度相比(82.3%),在靶标捕获的文库中进行DNA修复后,长胎儿cfDNA分子的相对低的富集度(14.7%)可能是由于在靶标探针杂交期间不同长度的DNA模板之间存在竞争效应而导致的。

修复治疗恢复受损DNA的能力开创了许多潜在应用。在产前诊断中,对cfDNA进行的修复可以提高NIPT的成功率。具体地,由于胎儿DNA分数不足29-33或cfDNA质量差导致的不可报告的NIPT结果的场景可以通过DNA修复得到改善。此类场景的实例可以包含非常早期妊娠中的NIPT、从高身体质量指数的怀孕妇女获得的样品等.34-37。此外,cfDNA修复以揭示血浆中更多可分析的长cfDNA分子的能力可以开创将NIPT用于长基因组靶标(例如涉及三联体重复病症,如脆性X综合征(FXS))的可能性。在FXS中,在具有完全突变的FMR1等位基因的患者中CGG串联重复序列的长度可能会长于600bp38,39。下面描述了对用于在测定FXS中使用的游离DNA进行的修复。

cfDNA修复的应用还可能会延伸到单基因疾病的基于连接的NIPT的开发。随着可分析的cfDNA长度的增加,对于所选基因组区,可以在母体血浆中检测到来自两侧为多态性标志物的亲本载体的单个基因的突变等位基因。这种方法可能对于串联出现高浓度SNP集群的基因组区(如人白细胞抗原(HLA)区)是可行的。下文描述了使用通过对HLA区进行分析的经过修复的游离DNA。

总之,此研究揭示了在修复治疗后优先重新获得母体血浆和来自SLE患者的血浆中的长cfDNA分子。通过较高的胎儿源性cfDNA分子富集产生总胎儿DNA分数的很小但一致的增加。希望此处呈现的数据可以促进将这些观察结果转化为NIPT的临床增强的另外的研究。

A.游离DNA修复在分子诊断中的优势

在多个细胞过程期间(如在细胞增殖期间的代谢活动和DNA复制)将DNA损伤引入到细胞中。在大多数情况下,细胞能够鉴定DNA损伤的类型,并通过不同类型的DNA损伤修复过程来处理损伤。对于不可修复的DNA损伤,细胞注定会经历细胞凋亡,以防止致癌突变的积聚。据信细胞凋亡和坏死是循环中存在的游离DNA(cfDNA)的主要来源中的两个主要来源10,27,40。与基因组DNA类似,存在多种cfDNA损伤,即DNA物理断裂,如DNA切口、空位和双链断裂的形成、DNA分子的修饰,如氧化、水解,如脱氨基、DNA碱基丢失以及嘧啶-二聚体的形成。此类DNA损伤可能会降低cfDNA的完整性并可能对分子诊断中的下游分析(如下一代测序(NGS)、定量PCR(qPCR)、大小谱表征等)造成次优影响。

大多数cfDNA片段的峰值大小为166bp,这类似于146-bp的单核小体结构加20-bp的连接子区。除了这些主要的cfDNA物质之外,还有长度更长的在166bp到600bp以上的范围内的少数cfDNA物质。此类稀有的cfDNA物质可能携带与那些较短的cfDNA物质携带的信息一样重要的有价值的信息。然而,由于当前下一代测序(NGS)平台的大小范围检测的限制,检测此类长cfDNA物质需要另外的高通量才能实现合理的测序覆盖率,这是不切实际的且成本效率低下的。尽管存在技术障碍,但最近的第三代单分子实时(SMRT)测序在某种程度上部分削弱了读段长度的限制,其中可以从单个循环的cfDNA分子中产生超高读段长度(>20kb)。但仍然,在循环中探索超长cfDNA物质仍然是一项艰巨的任务。

相比而言,cfDNA修复是一种用于在不改变测序通量和测序文库结构的情况下实现长cfDNA富集的相对具有成本效率、快速且用户友好的方法。目前,一种DNA修复试剂盒是新英格兰生物实验室的PreCR修复混合物。PreCR修复混合物能够修复多种天然存在的DNA损伤,如无碱水解、切口、碱性氧化和胸苷二聚作用41。然而,所述修复混合物无法修复DNA片段化和DNA-蛋白质交联。

B.用于检测胎儿三体型的游离DNA修复

PreCR修复混合物恢复受损DNA的能力开创了许多潜在应用。在产前诊断中,数据(例如,图16)证明PreCR修复治疗可能有助于改善21三体筛查的NIPT性能。经过修复的21三体样品的Z评分与经过修复的整倍体样品的Z评分更好地分离。这种情况对于Chr21 z评分为边界线并且接近没有修复治疗的整倍体-非整倍体截止值的情况尤其重要。组合模拟和ROC分析进一步证实了此类NIPT的改善可能显著增加测试的灵敏度和特异性。除了增强对整倍体和非整倍体进行区分的统计置信度之外,修复cfDNA还可以改善NIPT的调用率。具体地,由于胎儿DNA分数不足9-13或cfDNA质量差导致的不可报告的NIPT结果的场景可以通过DNA修复得到改善。

C.游离DNA修复以评估SLE

SLE是可以在多个部位引起慢性炎症,从而导致组织损伤和器官衰竭的系统性自身免疫疾病。此类的实例为肾并发症、感染和心肌梗死14。还报道,SLE与血浆中cfDNA的升高有关15,16。还报道,SLE患者的具有大小短于115bp的cfDNA比例更高8。活性SLE患者的血浆中的此类cfDNA分子的量比健康个体的血浆中的此类cfDNA分子的量高三倍8。与非活性SLE患者中的cfDNA分子的升高相比,活性SLE患者中这些较短(<115bp)cfDNA分子的升高更为明显8。因此,通过PreCR修复混合物来改善cfDNA质量的能力可能会影响SLE患者中这些cfDNA分子的大小谱。PreCR修复治疗在不显著缺失较短(<166bp)的cfDNA分子的情况下使较长(>250bp)的cfDNA分子富集的观察结果表明,大多数可修复的cfDNA分子长于250bp。作为严重的SLE患者的特征8的富集的超短cfDNA(<115bp)通常无法通过PreCR修复混合物进行修复。PreCR治疗修复DNA片段,从而允许针对SLE或其它病状分析更多片段。另外的研究需要揭示此类cfDNA分子携带的DNA损伤的性质。出于诊断的目的,在PreCR修复治疗之后非活性SLE样品与活性SLE样品之间的更好的分离改善SLE评估。

D.cfDNA修复的潜在应用

可以在广泛的DNA测定和分子测试之前应用DNA修复,所述测定和分子测试如法医学中的DNA指纹识别、用于分类学和物种分类的DNA考古学样品检索、从旧的、归档的FFPE样品中重新获得DNA等。在cfDNA领域中,修复预先治疗的cfDNA可能会提高NIPT的准确性和灵敏度。具体地,可以通过母体血浆中完整的、可测定的胎儿DNA来改善由于cfDNA输入低或cfDNA质量差导致的无信息NIPT测试结果的情况。此类病状的实例是妊娠头三个月妇女和肥胖妇女中的NIPT,其中胎儿cfDNA稀疏且难以测定。此外,通过使用单核苷酸多态性(SNP)18,42,43将cfDNA修复应用到当前基于单倍型的NIPT方案中,检测和鉴别特殊的妊娠病状(如单基因疾病、消失的双胞胎和三倍体妊娠)将更加有效和准确。

E.cfDNA修复的扩展应用超出了当前的检测极限

cfDNA修复在循环中可视化长cfDNA片段的能力开创了对各种疾病进行分子诊断的潜在扩展应用。在一个实例中,在携带疑似三联体重复病症的患者的循环中检测长串联重复序列和重复的微卫星物质是困难且乏味的,因为这些物质极为稀少且受到严重损伤。这导致通过NIPT对此类疾病进行分子诊断变得十分困难。然而,利用cfDNA修复的优势,可以检测此类长串联重复序列和微卫星物质。

图26示出了在患有脆性X综合征(FXS)的患者中存在CGG三联体重复cfDNA片段,其中完全突变的FMR1等位基因的长度可以达到600bp或更多(Garber,Kathryn B.、JeannieVisootsak和Stephen Warren T.“脆性X综合征(Fragile X Syndrome)”Nature.com,自然出版集团(Nature Publishing Group),2008年4月9日。网络2016年9月9日)。在完全突变的(致病的)FMR1等位基因中,CGG重复序列数目可能超过200。传统上,FXS的产前诊断仍然是侵入性的;通过三联体重复引发-PCR(TP-PCR)结合萨瑟恩印迹杂交(Southern blothybridization)44,45来检测FMR1的扩增的CGG串联重复序列。

使用NIPT进行的FXS的诊断受cfDNA长度检测极限的限制。实际上,FXS的NIPT诊断要求要测序的扩增的FMR1等位基因具有相当大的完整性,来自完全突变的FMR1等位基因的CGG串联重复序列越长,所述串联重复序列受损程度就越大。关注FMR1启动子区46的相对甲基化状态的筛查方法允许进行FXS的NIPT。这项工作的研究人员在FMR1上游基因座处发现独特的DNA甲基化边界,从而防止DNA甲基化从上游末端扩散到FMR1的基因启动子和基因体。研究人员还发现此边界被破坏,并且甲基化渗透到FMR1启动子中,从而导致FMR1沉默。通过cfDNA修复,来自高甲基化或去甲基化的FMR1启动子及其近侧上游末端的富集的cfDNA片段将准确地检测DNA甲基化边界并提高FXS的NIPT成功率。

在另一个实例中,cfDNA修复还可应用于需要足够量的具有相当长的长度的cfDNA片段的测定中。一个实例是HLA和HBB基因的等位基因单倍型分析,所述两种基因均是高度多态的,具有串联SNP集群的浓度。HLA和HBB基因座中相对较短的SNP间距离使用具有存在于循环中的连接的和近侧串联SNP的cfDNA允许潜在的单倍型分析可能性。HLA分型是在脐带血和骨髓移植中匹配供体和受体之前的关键步骤。HLA配对不匹配可能导致被称为移植物抗宿主(GVHD)病的移植后并发症。重要的是,靶基因座内的串联SNP的成功检测取决于完整的、可测定的cfDNA片段的存在。

图27示出了对HLA基因进行的等位基因单倍型分析。HLA区覆盖染色体6的短臂的HLA区。对HLA基因进行单倍型分析使用长度较长的DNA,以鉴定特定HLA基因组序列47。覆盖多个HLA基因的较长DNA片段有助于通过正确的连接进行准确的单倍型分析。

此类单倍型分析方法的可行性还可以进一步应用于其它单基因疾病(如先天性肾上腺增生症(CAH))的单倍型分析。图28示出了用于CAH的连接分析。CAH是由CYP21A2基因的突变引起的常染色体隐性病症。可以通过定位和连接突变位点18两侧的2个近侧SNP来实现连接分析。通过使用更长的DNA来促进这种连接分析。突变位点与附近的SNP之间的距离会有所变化,这取决于突变基因组区的特定SNP密度。突变位点与附近SNP之间的距离越近,可能会产生更好的结果,因为cfDNA在母体循环中高度碎裂。在连接分析的情况下,覆盖突变位点和两侧为SNPS的长cfDNA提供了连锁单倍型信息。

在另一个实例中,cfDNA修复可以促进在治疗过程中对各种疾病病状的实时监测。重要的是,通过差异cfDNA甲基化特征测量进行的组织映射为cfDNA起源48,49的检测提供了强大的工具。在妊娠相关的病状(子痫前期和滋养细胞发育异常)中,实时检测母体血浆中的胎盘源性cfDNA成为强大的监测工具。任何疾病或病症的复发都可能会立即被检测到并解决,以实现最佳治疗。对于移植后的接受者,类似的实时组织映射可以应用于更有效地监测可能的器官排斥。然而,在测序文库的DNA亚硫酸氢盐修饰的过程中,亚硫酸氢盐测序方案的关键步骤在测序文库中产生外部DNA损伤。此类损伤可以通过将可测序片段转化为无信息的物质来降低组织映射的灵敏度。亚硫酸氢盐处理后可能进行的另外的修复治疗设法将那些受损的由亚硫酸氢盐转化的片段挽救成完整的可测序物质。

在另一个实例中,cfDNA可修复性的检测可以帮助检测、评估和监测与cfDNA损伤相关的病状(例如自身免疫性病症和炎性病状)的疾病进展。具体地,cfDNA损伤的量可以通过经过修复的样品与其非修复对照物之间的差异来推导;也就是说,较高的伪处理-修复差异可以反映较高的cfDNA损伤含量。在自身免疫和炎性病状(如系统性红斑狼疮(SLE))中,超短cfDNA分子的比例(≤115bp)远高于健康个体的cfDNA分子的比例。疾病的进展(从非活性到活性形式)与此类超短cfDNA分子的增加相关50。怀疑在这些疾病中,尤其是在呈严重或活性形式的疾病中DNA损伤的程度和性质也会有所不同。

对cfDNA损伤程度或相反地,可修复程度进行的检测将允许检测和评估此类疾病。DNA损伤的程度越高或可修复程度越高将反映此类疾病的存在或疾病的高活性或更高的严重程度。可修复程度的测量可以基于比较具有或不具有DNA修复的各种大小的DNA分子的量。另外,对DNA损伤程度的评估可以基于比较来自未患有疾病或患有轻度疾病的人的测试样品和对照样品采集之间的DNA修复程度(添加修复步骤与省去修复步骤之间的差异)。可以使此类参数通用化以表征cfDNA损伤。类似地,在进行任何下游分析或测定之前,还可以通过测量DNA可修复性来评估任何cfDNA/gDNA/ctDNA样品的质量。例如,具有高DNA可修复性的样品表明DNA质量差,并且建议在下游方案(如测序文库制备)之前进行另外的修复治疗步骤。

DNA损伤也可以以时间依赖性方式获取并积累。DNA片段被释放并停留在循环中的时间越长,其获取和积累DNA损伤的机会就越大。因此,实时监测DNA损伤的程度可能是治疗效率的潜在方法。

F.cfDNA修复作为分子诊断的有价值的工具

由于某种组织的微环境中的不同细胞类型具有不同的代谢周转率,因此不同的组织可能具有其独特的“损伤特征”。不同的cfDNA可能会从不同的受损组织中释放。通过组织映射(Sun等人,《美国国家科学院院刊》2015),可以追踪和鉴定cfDNA的起源。组织映射可以(例如,使用标记的dNTP)与循环中的cfDNA损伤的定量并行进行。因此,然后可以推导和检测一定时间段内的来自某个器官的动态“损伤特征”。

未来cfDNA修复发展的另一个主要问题是可修复DNA的多样性。目前,存在许多无法反向的DNA损伤,即DNA碎裂和DNA-蛋白质交联。这是因为DNA碎裂的修复(作为一种双链断裂(DSB))需要一系列修复复合物蛋白以在生物学条件下进行非同源端连接(NHEJ)。然而,当前的商业修复反应不含有此类修复复合物。因此,修复DNA碎裂仍然是当前的挑战。为了解决这种情况,可能需要添加DSB修复所需的NHEJ蛋白,如Mre11-Rad50-Nbs1(MRN)复合物和Ku-DNA-PKcs复合物。DSB修复之后的DNA定相问题可以通过借助于在常规DNA修复步骤与DSB修复步骤之间设计的分子条形码系统的生物信息学方式来解决。

与DNA碎裂相比,DNA交联(如链间交联和DNA-蛋白质交联)远远更难以修复。DNA链与蛋白质之间的共价键的很强的粘附力使得很难断裂。由于在循环的附近存在各种大量的DNA结合蛋白的性质,结合蛋白的部分可以非常容易地形成DNA-蛋白质交联。如果主要血浆蛋白(如人血清白蛋白(HSA))发生这种情况,将导致大量cfDNA与HSA交联,在没有反向交联的程序的情况下这是很难实现的。因此,内在需要使cfDNA-蛋白质交联断裂并释放那些在下游不受约束地测定的cfDNA分子。遇到这种情况,应设计反向交联步骤并将其包含在DNA修复程序中。

除了DNA损伤类型表征之外,cfDNA分子上的损伤位置在未来的分子诊断中也可能是一条有价值的信息。重要的是,DNA损伤谱式是可追溯的,了解cfDNA分子上的DNA损伤的确切定位将可用于推导此类损伤的来源。然而,在开发此类“基于修复的液体活检”方法时,要克服许多挑战。首先,在没有多种核酸酶的已知切口谱式和切割突出端的情况下,就不可能通过调查存在于循环中的cfDNA损伤类型的整个池来回顾性地推导损伤引发的机制。例如,负责cfDNA碎裂的典型核酸酶(如DNaseI和DNase1-样-3)不含有一致性切割位点。这些酶倾向于以随机的方式切割DNA分子。相反,这些酶对DNA分子具有其独特的攻击谱式;DNase1倾向于攻击和切割裸露的DNA分子,其中DNase1-样-3倾向于产生多核小体谱式51

第二,积聚所有含有损伤的cfDNA片段及其确切的损伤位置的图谱对于分子诊断学的发展将是必要的。利用cfDNA修复来使长cfDNA片段恢复,可以检测到先前未发现的cfDNA物质,其中一条链的中间有很大的空位,而另一条链具有超长的突出端。同样,只要损伤是可修复的,结合多种损伤类型的cfDNA分子也可以被系统地揭示。

第三,可以通过添加标记的和无毒的dNTP来解决在数量众多的完整cfDNA分子中追踪经过修复的cfDNA分子。标记的dNTP可以用于修复缺陷。损伤程度可以通过单个cfDNA分子中未标记和标记的dNTP的比例来计算。这在通过测量修复动态来持续监测疾病进展和治疗效果中特别有用。总之,分子诊断中cfDNA的最终目标几乎可以肯定的是,随着DNA修复技术的改善,在循环中“寻觅”新型未发现的、受损cfDNA分子将是可能的。

IV.示例方法

A.改善游离核酸的质量

图29示出了改善对第一生物样品的分析的方法2900。第一生物样品可以包含游离核酸分子。第一生物样品可以包含来自怀有胎儿的女性受试者的母体血浆或来自患有病症或疑似患有病症的受试者的血浆。可以从血液样品中提取血浆。第一生物样品可以是在添加非源自受试者或受试者的胎儿的任何组分之前的样品。

在框2902处,可以从游离核酸分子中获得双链核酸分子以产生第二生物样品。所述多个双链核酸分子中的一个或多个双链核酸分子各自具有一个或多个缺陷。对于所述一个或多个双链核酸分子中的具有所述一个或多个缺陷中的缺陷的每个双链核酸分子,所述缺陷存在于相应的双链核酸分子中,位于距相应的双链核酸分子的最近端至少一个核苷酸的位置处。换句话说,所述缺陷可以是链内缺陷,而不是双链核酸分子的任一链的任一端处的缺陷。在一些实施例中,所述缺陷可以位于距相应双链核酸分子的最近端2个、3个、4个、5个、10个、15个、20个、25个或30个或更多个核苷酸的位置处。

所述一个或多个缺陷可以包含选自由以下组成的组的一个或多个缺陷:切口、空位、无碱基位点、胸苷二聚体、氧化嘧啶、脱氨基胞嘧啶、封闭的3'端缺陷或其组合。

所述一个或多个双链核酸分子的长度的范围可以在251到600bp、251到450bp或451bp到600bp内。长度可以与二核小体或三核小体核酸分子有关。

在框2904处,可以向第二生物样品中添加包含酶的混合物。所述酶可以包含聚合酶、连接酶、核酸内切酶或糖基化酶中的至少一种。所述混合物可以包含以下中的至少一种酶:Taq DNA聚合酶、Bst DNA聚合酶、Taq DNA连接酶、核酸内切酶VIII、核酸内切酶IV、T4核酸内切酶V(PDG)、8-氧代鸟嘌呤糖基化酶(FPG)或尿嘧啶-DNA糖基化酶(UDG)。在一些实施例中,所述混合物可以包含Taq DNA聚合酶、Bst DNA聚合酶、Taq DNA连接酶、核酸内切酶VIII、核酸内切酶IV、T4核酸内切酶V(PDG)、8-氧代鸟嘌呤糖基化酶(FPG)和尿嘧啶-DNA糖基化酶(UDG)。所述混合物还可以包含NAD+、ThermoPol反应缓冲液和脱氧核苷三磷酸(dNTP)的任何组合。

在框2906处,可以使用所述酶修复所述一个或多个双链核酸分子中的每个双链核酸分子中的一个或多个缺陷,以产生一组经过修复的双链核酸分子。所述组经过修复的双链核酸分子可以没有所述一个或多个缺陷,包含本文所述的任何缺陷。修复所述一个或多个缺陷可以包含与长度为0到250bp的核酸分子的数量相比,修复更多数量的长度为251到600bp的核酸分子。换句话说,与单核小体核酸分子相比,可以从二核小体和/或三核小体核酸分子修复更多的缺陷。

对于含有临床相关的DNA(如胎儿DNA)的生物样品,修复所述一个或多个双链核酸分子中的缺陷可能会增加临床相关DNA的分数,以实现另外的分析。例如,如果第一生物样品是从怀有胎儿的女性受试者获得的,则所述一个或多个具有缺陷的双链核酸分子可以包含多个胎儿源性核酸分子。在修复所述一个或多个缺陷之后,第二生物样品可以由胎儿分数表征,所述胎儿分数由根据分析所述组经过修复的双链核酸分子中获得的读段计算。胎儿分数可以大于另外的分析优选或需要的阈值分数。例如,修复后的胎儿分数可以大于或等于0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09或0.10。根据读段计算的修复后的胎儿分数可以大于根据修复前的读段计算的胎儿分数。然而,来自胎儿的DNA的实际分数可能不会变化。相反,修复后计算的胎儿分数可能会增加,因为只有在修复后才能获得胎儿源性DNA的读段。

方法可以包含对所述多个双链核酸分子或所述组经过修复的双链核酸分子执行平端连接。平端连接不是修复框2906中的所述一个或多个缺陷,因为平端连接处理双链核酸分子末端处的核苷酸,而不是链内缺陷。

在框2908处,可以使用所述组经过修复的双链核酸分子产生测序文库。将所述组经过修复的双链核酸分子进行测序文库制备程序,包含末端修复、A加尾、测序衔接子连接和索引PCR扩增。

在框2912处,可以分析测序文库以测定一组读段。在一些实施例中,分析至少1,000个游离DNA分子。在其它实施例中,可以分析至少10,000个或50,000个或100,000个或500,000个或1,000,000个或5,000,000个游离DNA分子或更多。可以通过对测序文库进行测序来测定所述组读段。测序技术可以包含双端测序、大规模并行测序、单分子实时(SMRT)测序、PCR、逆转录PCR(RT-PCR)、数字PCR或测序。在一些实施例中,可以通过指向靶向捕获富集来测定所述组读段。所述组读段可以不包含来自具有一个或多个缺陷的双链核酸分子的读段。例如,所述组读段可以不包含来自来自具有一个或多个缺陷的双链核酸分子中的任一单链核酸分子或的读段。在一些实施例中,所述组读段可以仅来自双链核酸分子中的一条链。在其它实施例中,所述组读段可以来自双链核酸分子中的两条链。

方法可以包含使用利用所述组经过修复的双链核酸分子制备的测序文库。方法可以包含从母体血浆样品中检测胎儿中的非整倍体。在一些实施例中,方法可以包含检测序列不平衡。方法可以包含检测胎儿中的微扩增或微缺失。另外,方法可以包含检测本文所述的任何病症。

例如,一种方法可以包含判定第二生物样品中是否存在序列不平衡。可以从所述组经过修复的双链核酸分子中获得多个序列读段。所述多个序列读段可以由计算机系统分析。分析序列读段可以包含通过将所述序列读段与参考基因组进行比对来鉴定所述序列读段在所述参考基因组中的位置。可以由计算机系统测定来自使用所鉴定的位置的基因组区的序列读段的量。可以获得针对来自基因组区的序列读段的量的归一化参数的值。可以将归一化参数的值与截止值进行比较。可以基于比较判定序列不平衡是否存在。基因组区可以是染色体,并且序列不平衡可以是非整倍体。

所述组经过修复的双链核酸分子可以用于其中优选具有较长核酸分子的方法。例如,所述组经过修复的双链核酸分子可以用于使用来自怀有胎儿的女性受试者的第一生物样品判定脆性X综合征(FXS)是否存在的分类。所述方法可以包含使来自FMR1启动子区和FMR1启动子的近侧上游末端的所述组经过修复的双链核酸分子富集以形成一组富集的双链核酸分子。可以对所述组富集的双链核酸分子执行甲基化感知测定。在一些实施例中,甲基化感知测定可以包含亚硫酸氢盐测序。可以获得来自所述组富集的双链核酸分子的多个序列读段。可以将所述多个序列读段与参考基因组进行比对。使用经过比对的序列读段检测指示FXS位于FMR1启动子上游位置处的DNA-甲基化边界的存在或缺失。分类可以是当不存在DNA-甲基化边界时存在FXS。

方法可以包含对所述组经过修复的双链核酸分子进行单倍型分析。可以对HLA基因进行单倍型分析。可以通过从所述组经过富集的双链核酸分子中获得多个序列读段来对单基因疾病进行单倍型分析。可以将所述多个序列读段与参考基因组进行比对。可以使用经过比对的多个序列读段鉴定两个近侧SNP之间的基因座处的突变。单基因疾病可能是先天性肾上腺增生症。

B.分类病症

图30示出了判定个体是否患有病症的分类的方法3000。所述病症可以包含系统性红斑狼疮(SLE)、先天性肾上腺增生症(CAH)、脆性X综合征、移植物抗宿主(GVHD)病、妊娠相关病症(例如,子痫前期和滋养细胞发育异常)、非整倍体、序列不平衡或本文所述的任何病症。

在框3002处,可以接收第一样品。第一样品可以包含源自生物样品中的游离核酸分子的第一组双链核酸分子。生物样品可以是本文所述的任何生物样品。所述第一组双链核酸分子中的一个或多个双链核酸分子可以各自具有一个或多个缺陷。所述一个或多个缺陷可以存在于相应的双链核酸分子中,位于距相应的双链核酸分子的最近端至少一个核苷酸的位置处。所述一个或多个缺陷可以是本文所述的任何缺陷。

在框3004处,可以接收第二样品。第二样品可以包含源自生物样品中的游离核酸分子的第二组双链核酸分子。例如,可以通过将生物样品分成两个样品来制备第一样品和第二样品。在一些实施例中,第一样品和第二样品的体积可以相等,其中相等可以包含在实验误差内不同的体积。第一样品的体积可以为第二样品的体积的5%、10%或15%之内。

在框3006处,可以向第一样品中添加包含酶的第一混合物。第一混合物和酶可以是本文所述的任何混合物和酶。例如,混合物可以包含本文所述的多种酶。

在框3008处,可以使用酶修复所述第一组双链核酸分子中的所述一个或多个双链核酸分子中的每个双链核酸分子中的一个或多个缺陷。可以由修复产生第一组经过修复的双链核酸分子。

可以由包括第三组双链核酸分子的第三样品形成第二样品。可以向第三样品中添加第二混合物以产生所述第二组双链核酸分子。第二混合物可以不包括酶。例如,第二混合物可以是包含第一混合物的除了修复链内缺陷的一种或多种酶之外的组分的伪处理混合物。所述第二组双链核酸分子可以与所述第三组双链核酸分子相同或不同。在其它实施例中,第二样品没有向其添加的伪处理混合物。

在框3010处,可以测定表征所述第一组经过修复的双链核酸分子与所述第二组双链核酸分子之间的缺陷差异的参数的值。

可以使用根据所述第一组经过修复的双链核酸分子和所述第二组双链核酸分子测定的读段来测定参数的值。例如,方法可以包含对所述第一组经过修复的双链核酸分子进行测序或对其执行靶向捕获富集以测定第一组读段。方法还可以包含对所述第二组双链核酸分子进行测序或对其执行靶向捕获富集以测定第二组读段。所述第一组读段和所述第二组读段可以不包含来自具有一个或多个缺陷的双链核酸分子的读段。在末端修复过程中存活的受损DNA片段可能会形成集群(基于依诺米那的测序步骤之一)。受损DNA可能会导致集群形成失败,从而导致PCR失败或DNA聚合酶停滞。当核苷酸取代发生时,不匹配也可能发生,这导致测序错误。所述第一组读段可以具有第一读段量。所述第二组读段可以具有第二读段量。

所述参数的所述值可以是使用所述第一读段量和所述第二读段量测定的。例如,所述参数的所述值可以是使用所述第一读段量与所述第二读段量之间的差异测定的。在其它实施例中,所述参数的所述值可以是使用所述第一读段量与所述第二读段量的比率测定的。可以利用以下计算比例:第一量除以第二量、第二量除以第一量、第一量除以第一量与第二量之和,或第二量除以第一量与第二量之和。在一些实施例中,读段量可以限制为特定大小范围或特定基因组位置的读段。读段量可以是归一化的读段量(例如,百分比、分数或浓度)。

所述值可以根据描述所述组读段的大小的统计值来测定。方法可以包含计算表征所述第一组读段的大小的第一统计值,以及计算表征所述第二组读段的大小的第二统计值。统计值可以是描述所述组读段的核酸分子大小的中位数、众数、平均数或百分位数。所述值可以是使用第一统计值和第二统计值测定的。例如,所述值可以是统计值之间的差异或统计值的比率。

参数可以是多维的。参数的第一维度可以基于核酸分子的大小。第一维度可以是大小范围。在其它实施例中,第一维度可以是核酸分子的大小与参考大小的比率的范围。参数的第二维度可以包含核酸分子的量。例如,参数可以是某些大小的核酸分子的核酸分子量的矩阵。又例如,参数可以是某些大小的核酸分子的核酸分子量的曲线图(例如,直方图)。

在一些实施例中,参数的第一维度可以包含在参考基因组的核酸分子中的位置。第二维度可以包含核酸分子的量。然后所述参数可以描述参考基因组中某些位置处的核酸分子的量。

参考值也可以是多维的。参考值可以指定不同大小的核酸分子的核酸分子量。参考值可以是不同大小下的阈值量,或者是不同大小中的某个谱式的量(例如,量会在某个大小下达到峰值)。在一些实施例中,参考值可以指定参考基因组中某些位置处的核酸分子的量。这些基因组位置可以对应于核小体之间的位置。可以使用一个或多个被鉴定为患有或不患有病症的受试者来测定参考值。

在框3012处,可以将参数的值与参考值进行比较。比较参数的值可以包含判定参数的值是否超过参考值(例如,参数的值比参考值更正或更负)。参考值可以是阈值。

在框3014处,可以基于参数的值与参考值的比较来判定个体是否患有病症的分类。可以通过比较来测定病症的水平或严重程度。严重程度可能取决于参数的值和参考值之间的差异。更大的差异可能意味着更严重的病症。当差异大于截止值时,所述病症可以被分类为更严重。可以使用若干截止值,其中每个截止值与不同的严重程度相关。

在一些实施例,方法可以包含在分类个体患有病症或个体具有高可能性患有病症时治疗特定病症。实施例可以包含在测定患者的疾病或病状的水平之后治疗患者的疾病或病状。治疗可以包含任何合适的疗法、药物或手术,包含本文提到的参考文献中描述的任何治疗。参考文献中关于治疗的信息通过引用并入本文。

V.示例系统

图31展示了根据本发明的实施例的系统3100。所示系统包含样品3105,如样品固持器3110内的游离DNA分子,其中样品3105可以与测定物3108接触以提供物理特征信号3115。在一些实施例中,样品3105可以是具有核酸材料的单细胞。样品固持器的实例可以是包含测定物的探针和/或引物的流动池或液滴移动通过的管(其中液滴包含测定物)。检测器3120检测来自样品的物理特征3115,如荧光强度值等。检测器可以间隔地(例如,周期性间隔)进行测量以获得构成数据信号的数据点。在一个实施例中,模拟数字转换器多次将来自检测器的模拟信号转换为数字形式。将数据信号3125从检测器3120发送到逻辑系统3130。数据信号3125可以存储在本地存储器3135、外部存储器3140或存储装置3145中。

逻辑系统3130可以是或可以包含计算机系统、ASIC、微处理器等。其还可以包含显示器(例如,监视器、LED显示器等)和用户输入装置(例如,鼠标、键盘、按钮等)或与所述显示器和用户输入装置耦接。逻辑系统3130和其它组件可以是独立或网络连接的计算机系统的一部分,或者其可以直接附接到热循环仪装置或并入热循环仪装置中。逻辑系统3130还可以包含在处理器3150中执行的优化软件。

本文提到的计算机系统中的任何计算机系统都可以使用任何合适数量的子系统。此类子系统的实例在图32中在计算机系统10中示出。在一些实施例中,计算机系统包含单个计算机设备,其中子系统可以是计算机设备的组件。在其它实施例中,计算机系统可以包含具有内部组件的多个计算机设备,每个计算机设备是子系统。计算机系统可以包含台式计算机和膝上型计算机、平板计算机、移动电话和其它移动装置。

图32中展示的子系统是通过系统总线75互连。展示其它子系统,如打印机74、键盘78、存储装置79、与显示适配器82耦接的监测器76等。耦接到I/O控制器71的外围装置和输入/输出(I/O)装置可以通过所属领域中已知的任何数量的连接,如输入/输出(I/O)端口77(例如USB、)连接到计算机系统。例如,I/O端口77或外部接口81(例如以太网、Wi-Fi等)可以用于将计算机系统10连接到广域网,如因特网、鼠标输入装置或扫描仪。通过系统总线75的互连允许中央处理器73与每个子系统通信并控制来自系统存储器72或一个或多个存储装置79(例如,如硬盘驱动器或光盘等固定盘)的多个指令的执行、以及子系统之间信息的交换。系统存储器72和/或一个或多个存储装置79可以体现为计算机可读介质。另一个子系统是数据收集装置85,如相机、麦克风、加速计等。本文提及的数据中的任何数据可以从一个组件输出到另一个组件且可以输出到用户。

计算机系统可以包含多个例如通过外部接口81或通过内部接口连接在一起的相同的组件或子系统。在一些实施例中,计算机系统、子系统或设备可以通过网络进行通信。在此类情况下,一个计算机可以视为客户端且另一个计算机视为服务器,其中每一个可以是同一个计算机系统的一部分。客户端和服务器可以各自包含多个系统、子系统或组件。

实施例的各个方面可以使用硬件(例如,专用集成电路或现场可编程门阵列)和/或使用具有以模块化或集成方式的一般可编程处理器的计算机软件以控制逻辑的形式实施。如本文所使用的,处理器包含单核处理器、在同一集成芯片上的多核处理器,或者在单个电路板上或联网的多个处理单元。基于本文提供的公开内容和教导,本领域普通技术人员将了解并且意识到使用硬件以及硬件和软件的组合来实现本发明的实施例的其它方式和/或方法。

本申请中描述的任何软件组件或功能可以实施为被处理器使用任何合适的计算机语言,例如Java、C、C++、C#、Objective-C、Swift或如Perl或Python等脚本语言使用例如,常规或面向对象的技术执行的软件代码。软件代码可以存储为计算机可读介质上用于存储和/或传输的一系列指令或命令。适合的非暂时性计算机可读媒体可以包含随机存取存储器(RAM)、只读存储器(ROM)、如硬盘驱动器或软盘等磁性媒体或如光盘(CD)或DVD(数字通用光盘)等光学媒体、闪存等。计算机可读介质可以是此类存储或传输装置的任何组合。

也可以使用适于经由符合各种协议的有线、光学和/或无线网络(包含因特网)传输的载波信号来编码和传输此类程序。因此,计算机可读介质可以使用以此类程序编码的数据信号产生。用程序代码编码的计算机可读介质可以与兼容装置打包在一起或与其它装置分开提供(例如,通过因特网下载)。任何此类计算机可读介质可以驻留在单个计算机产品(例如,硬盘驱动器、CD或整个计算机系统)上或内,并且可以存在于系统或网络内的不同计算机产品上或内。计算机系统可以包含监测器、打印机或用于向用户提供本文提及的任何结果的其它合适的显示器。

本文描述的任何方法可以用包含一个或多个处理器的计算机系统完全或部分地执行,所述计算机系统可以被配置成执行操作。因此,实施例可以针对被配置成执行本文描述的任何方法的操作的计算机系统,所述计算机系统可能具有执行相应操作或相应操作组的不同组件。尽管以编号的操作呈现,但本文中的方法的操作可以同时或按不同的顺序执行。另外,这些操作的一部分可以与来自其它方法的其它操作的一部分一起使用。并且,操作的全部或部分可以是任选的。另外,任何方法的任何操作都可以用模块、单元、电路或用于执行这些操作的其它装置来执行。

本文使用的章节标题仅用于组织目的,并且不应被解释为限制所描述的主题。

应当理解,本文描述的方法不限于本文描述的特定方法、方案、受试者和测序技术,并且因此可以变化。还应理解,本文中所用的术语仅出于描述具体实施例的目的而并不旨在限制本文所描述的方法和组合物的范围,所述范围将仅由所附权利要求限制。尽管本文中已经展示和描述本公开的一些实施例,但所属领域的技术人员将显而易见,此类实施例是仅作为实例提供。所属领域的技术人员现将在不脱离本公开的情况下意识到大量变型、变化以及取代。应理解,本文中描述的本公开的实施例的各种替代例可以用于实践本公开。意图是,以下权利要求限定了本公开的范围以及由此覆盖在这些权利要求和其等效物的范围内的方法和结构。

参考示例应用描述了若干方面以进行说明。除非另外指示,否则任何实施例都可以与任何其它实施例组合。应理解,阐述许多具体细节、关系和方法以提供对本文中所描述的特征的完整理解。然而,所属领域的技术人员将容易认识到,本文中所描述的特征可以在不存在一个或多个具体细节的情况下或使用其它方法实践。本文中所描述的特征不限于动作或事件的所说明排序,因为一些动作可以按不同次序和/或与其它动作或事件同时发生。此外,实施根据本文描述的特征的方法不需要所有说明的动作或事件。

尽管本文中已经示出并且描述了本发明的一些实施例,但是对于本领域的技术人员而言将显而易见的是,此类实施例仅通过举例的方式提供。本发明并不旨在受本说明书内所提供的具体实例限制。尽管已经参考上述说明书描述本发明,但本文中的实施例的描述和说明并不打算以限制意义理解。在不脱离本发明的情况下,本领域的技术人员现在将想到许多变化、改变和替代。

此外,应当理解,本发明的所有方面都不限于本文中阐述的取决于多种条件和变量的特定描绘、配置或相对比例。应理解,本文所描述的本发明的实施例的不同替代方案可以用于实践本发明。因此预期本发明也应涵盖任何此类替代例、修改、变型或等效物。意图是,以下权利要求限定本发明的范围,并且以下权利要求覆盖处于这些权利要求和其等效物的范围内的方法和结构。

在提供了值的范围的情况下,应当理解的是,也具体地公开了所述范围的上限与下限之间的至下限的第十个单位(除非上下文明确另外指出)的每个中间值。涵盖了在所陈述的范围内的任何所陈述的值或中间值与所陈述的范围内的任何其它所陈述的值或中间值之间的每个较小范围。这些较小范围的上限和下限可以独立地包含在所述范围内或排除在其外,并且每个范围(其中两个极限之一、没有一个、或都包含在所述较小范围内)也涵盖在本发明内,服从所述范围中任何特别排除的限值。在所陈述的范围包含所述限制中的一个或两个的情况下,也包含排除所述包含的限制中的一个或两个的范围。

如本文和所附权利要求中所使用的,除非上下文另外明确指出,否则单数形式“一个/一种(a/an)”和“所述(the)”包含复数指代物。因此,例如,提及“方法”时包含多个此类方法并且提及“所述颗粒”时包含提及本领域技术人员已知的一种或多种颗粒及其等同物等。出于明确性和理解的目的,现已详细描述了本发明。然而,应当了解,在所附权利要求的范围内可以实践某些改变和修改。

VI.不包括章节II、III.B和III.C中的那些参考文献的参考文献

1.Lo YM、Corbetta N、Chamberlain PF等人.“母体血浆和血清中存在胎儿DNA(Presence of fetal DNA in maternal plasma and serum)”.《柳叶刀(Lancet.)》1997;350(9076):485-487。

2.Lo YM、Chan KC、Sun H等人.“母体血浆DNA测序揭示胎儿的全基因组遗传和突变概况”.《科学转化医学杂志》2010;2(61):61ra91。

3.Lun FM、Tsui NB、Chan KC等人.“通过母体血浆中DNA上的数字大小选择和相对突变剂量对单基因疾病进行无创性产前诊断(Noninvasive prenatal diagnosis ofmonogenic diseases by digital size selection and relative mutation dosage onDNA in maternal plasma)”.《美国国家科学院院刊》2008;105(50):19920-19925。

4.Yu SC、Chan KC,Zheng YW等人.“使用血浆DNA进行无创性产前测试进行基于大小的分子诊断(Size-based molecular diagnostics using plasma DNA fornoninvasive prenatal testing)”.《美国国家科学院院刊》2014;111(23):8583-8588。

5.Jiang P、Peng X、Su X等人.FetalQuant.《NPJ基因组医学》2016;1:16013。

6.Chan KC、Ding C、Gerovassili A等人.“母体血浆中的高甲基化RASSF1A:提高无创性产前诊断的可靠性的通用胎儿DNA标志物(Hypermethylated RASSF1A in maternalplasma:A universal fetal DNA marker that improves the reliability ofnoninvasive prenatal diagnosis)”.《临床化学》2006;52(12):2211-2218。

7.Dhallan R、Au WC、Mattagajasingh S等人.“用于增加从母体循环中重新获得的游离胎儿DNA的百分比的方法(Methods to increase the percentage of free fetalDNA recovered from the maternal circulation)”.《美国医学协会杂志(JAMA)》2004;291(9):1114-1119。

8.Li Y、Di Naro E、Vitucci A、Zimmermann B、Holzgreve W、Hahn S.“使用母体血浆中的大小分级游离DNA检测β-地中海贫血的父本遗传的胎点突变(Detection ofpaternally inherited fetal point mutations for beta-thalassemia using size-fractionated cell-free DNA in maternal plasma)”.《美国医学协会杂志》2005;293(7):843-849。

9.Burnham P、Kim MS、Agbor-Enoh S等人.“单链DNA文库制备揭示了血浆中超短游离DNA的起源和多样性(Single-stranded DNA library preparation uncovers theorigin and diversity of ultrashort cell-free DNA in plasma)”.《科技报告(SciRep.)》,2016;6:27859。

10.Snyder MW、Kircher M、Hill AJ、Daza RM、Shendure J.“游离DNA包括告知其起源组织的体内核小体足迹(Cell-free DNA Comprises an In Vivo NucleosomeFootprint that Informs Its Tissues-Of-Origin)”.《细胞(Cell)》.2016;164(1-2):57-68。

11.Nagata S.“细胞凋亡DNA碎裂(Apoptotic DNA fragmentation)”.《实验细胞学研究(Exp Cell Res.)》2000;256(1):12-18。

12.Stroun M、Lyautey J、Lederrey C、Olson-Sand A、Anker P.“关于循环DNA细胞凋亡和活性DNA释放的可能起源和机制(About the possible origin and mechanismof circulating DNA apoptosis and active DNA release)”.《临床化学学报(Clin ChimActa.)》2001;313(1-2):139-142。

13.van der Vaart M、Pretorius PJ.“循环游离DNA的起源(The origin ofcirculating free DNA)”.《临床化学》2007;53(12):2215。

14.Mouliere F、El Messaoudi S、Pang D、Dritschilo A、Thierry AR.“对朝大肠癌个性化药物循环游离DNA的多标志物分析(Multi-marker analysis of circulatingcell-free DNA toward personalized medicine for colorectal cancer)”.《分子肿瘤学(Mol Oncol.)》2014;8(5):927-941。

15.Chandrananda D、Thorne NP、Bahlo M.“由于游离DNA的非随机切割导致的序列特征的高分辨率表征(High-resolution characterization of sequence signaturesdue to non-randomcleavage of cell-free DNA)”.《BMC医学基因组学(BMC MedGenomics.)》2015;8:29。

16.Chan KC、Zhang J、Hui AB等人.“母体血浆中母体和胎儿DNA的大小分布(Sizedistributions of maternal and fetal DNA in maternal plasma)”.《临床化学》2004;50(1):88-92。

17.Vong JSL、Tsang JCH、Jiang P等人.“单链DNA文库制备优先富集母体血浆中的短母体DNA”.《临床化学》2017;63(5):1031-1037。

18.New MI、Tong YK、Yuen T等人.“使用母体血浆中的游离胎儿DNA对先天性肾上腺增生症进行无创性产前诊断(Noninvasive prenatal diagnosis of congenitaladrenal hyperplasia using cell-free fetal DNA in maternal plasma)”.《临床内分泌代谢杂志(J Clin Endocrinol Metab.)》2014;99(6):E1022-1030。

19.Li R、Yu C、Li Y等人.“SOAP2:用于短读段比对的改善的超快工具”.《生物信息学》2009;25(15):1966-1967。

20.Hong H、Xu L、Tong W.“使用HapMap样品评估全基因组人SNP阵列6.0的基因型调用算法Birdseed版本之间的一致性”.《实验医学与生物学进展》2010;680:355-360。

21.Cheng THT、Lui KO、Peng XL等人.“在敲除小鼠模型中,DNase1在血浆DNA碎裂中似乎没有发挥主要作用”.《临床化学》2018;64(2):406-408。

22.Chen L、Liu P、Evans TC、Ettwiller LM.“DNA损伤是测序错误的普遍原因,从而直接使变体鉴定混淆(DNA damage is a pervasive cause of sequencing errors,directly confounding variant identification)”.《科学(Science)》2017;355(6326):752-756。

23.Ardui S、Ameur A、Vermeesch JR、Hestand MS.“单分子实时(SMRT)测序已经成熟:用于医疗诊断的应用程序和实用程序(Single molecule real-time(SMRT)sequencing comes of age:applications and utilities for medical diagnostics)”.《核酸研究(Nucleic Acids Res)》2018;46(5):2159-2168。

24.Giacona MB、Ruben GC、Iczkowski KA、Roos TB、Porter DM、Sorenson GD.“人血浆中游离DNA:患有胰腺癌的患者和健康对照组的长度测量(Cell-free DNA in humanblood plasma:length measurements in patients with pancreatic cancer andhealthy controls)”.《胰腺(Pancreas.)》1998;17(1):89-97。

25.Holdenrieder S、Stieber P、T等人.“患有实体瘤的患者的血清中的细胞凋亡(Apoptosis in serum of patients with solid tumours)”.《抗癌研究(AnticancerRes.)》,1999;19(4A):2721-2724。

26.Jahr S、Hentze H、Englisch S等人.“癌症患者的血浆中的DNA片段:源自细胞凋亡和坏死细胞的定量和证据(DNA fragments in the blood plasma of cancerpatients:quantitations and evidence for their origin from apoptotic andnecrotic cells)”.《癌症研究(Cancer Res.)》,2001;61(4):1659-1665。

27.Thierry AR、El Messaoudi S、Gahan PB、Anker P、Stroun M.“肿瘤学中循环DNA的起源、结构和功能(Origins,structures,and functions of circulating DNA inoncology)”.《癌症和转移综述(Cancer Metastasis Rev.)》2016;35(3):347-376。

28.Sun K、Jiang P、Wong AIC等人.“母体血浆DNA中的大小标记的优选末端阐明了产生机理并在无创性产前测试中表明实用性(Size-tagged preferred ends inmaternal plasma DNA shed light on the production mechanism and show utilityin noninvasive prenatal testing)”.《美国国家科学院院刊》2018;115(22):E5106-E5114。

29.Chen EZ、Chiu RW、Sun H等人.“通过母体血浆DNA测序对胎儿18三体和13三体进行无创性产前诊断”.《公共科学图书馆·综合》.2011;6(7):e21791。

30.Chiu RW、Akolekar R、Zheng YW等人.“通过多重母体血浆DNA测序对21三体进行无创性产前评估:大规模有效性研究”.《英国医学期刊》2011;342:c7401。

31.Palomaki GE、Deciu C、Kloza EM等人.“对母体血浆进行的DNA测序可靠地鉴定18三体和13三体以及唐氏综合症:国际合作研究”.《遗传学与医学》2012;14(3):296-305。

32.Nicolaides KH、Syngelaki A、Ashoor G、Birdir C、Touzet G.“常规筛查的妊娠头三个月群体中胎儿三体型的无创型产前测试”.《美国妇产科杂志》2012;207(5):374.e371-376。

33.Pergament E、Cuckle H、Zimmermann B等人.“高风险和低风险队列中基于单核苷酸多态性的无创性产前筛查”.《妇产科杂志》2014;124(2Pt 1):210-218。

34.Canick JA、Palomaki GE、Kloza EM、Lambert-Messerlian GM、Haddow JE.“母体血浆DNA胎儿分数对下一代常见胎儿非整倍体的测序测试的影响(The impact ofmaternal plasma DNA fetal fraction on next generation sequencing tests forcommon fetal aneuploidies)”.《产前诊断(Prenat Diagn.)》2013;33(7):667-674。

35.Dar P、Curnow KJ、Gross SJ等人.“使用基于大规模单核苷酸多态性的无创性产前非整倍体测试的临床经验和随访(Clinical experience and follow-up with largescale single-nucleotide polymorphism-based noninvasive prenatal aneuploidytesting)”.《美国妇产科杂志》2014;211(5):527.e521-527.e517。

36.Norton ME、Wapner RJ.“用于三体型的无创型检查的游离DNA分析(Cell-freeDNA Analysis for Noninvasive Examination of Trisomy)”.《新英格兰医学期刊》2015;373(26):2582。

37.Yared E、Dinsmoor MJ、Endres LK等人.“肥胖增加了无创性产前筛查失败的风险,无论其孕龄如何(Obesity increases the risk of failure of noninvasiveprenatal screening regardless of gestational age)”.《美国妇产科杂志》2016;215(3):370.e371-376。

38.Nolin SL、Brown WT、Glicksman A等人.“具有突变前或中间等位基因的女性中脆性X CGG重复序列的扩增(Expansion of the fragile X CGG repeat in femaleswith premutation or intermediate alleles)”.《美国人类遗传学期刊(Am J HumGenet.)》2003;72(2):454-464。

39.McLennan Y、Polussa J、Tassone F、Hagerman R.“脆性X综合征”.《当代遗传学(Curr Genomics.)》2011;12(3):216-224。

40.Lui YY、Chik KW、Chiu RW、Ho CY、Lam CW、Lo YM.“在性别不匹配的骨髓移植后血浆和血清中游离DNA的主要造血起源(Predominant hematopoietic origin of cell-free DNA in plasma and serum after sex-mismatched bone marrowtransplantation)”.《临床化学》2002;48(3):421-427。

41.Diegoli TM、Farr M、Cromartie C、Coble MD、Bille TW.“用于将PreCRTM修复混合物法医学应用于UV受损DNA的多重STR扩增的优化方案(An optimized protocol forforensic application of the PreCRTM Repair Mix to multiplex STR amplificationof UV-damaged DNA)”.《国际法医学:遗传学(Forensic Sci Int Genet.)》2012;6(4):498-503。

42.Ye J、Chen C、Yuan Y等人.“通过母体血浆的靶向测序对高苯丙氨酸血症进行基于单倍型的无创性产前诊断(Haplotype-based Noninvasive Prenatal Diagnosis ofHyperphenylalaninemia through Targeted Sequencing of Maternal Plasma)”.《科技报告》,2018;8(1):161。

43.Ma D、Yuan Y、Luo C等人.“使用母体血浆DNA的靶标捕获测序对21-羟化酶缺乏症进行无创性产前诊断(Noninvasive prenatal diagnosis of 21-Hydroxylasedeficiency using target capture sequencing of maternal plasma DNA)”.《科技报告》,2017;7(1):7427。

44.Rajan-Babu IS、Lian M、Cheah FSH等人.“FMR1 CGG重复序列扩增突变检测和连接的单倍型分析用于对脆性X综合征进行可靠且准确的植入前基因诊断(FMR1 CGGrepeat expansion mutation detection and linked haplotype analysis forreliable and accurate preimplantation genetic diagnosis of fragile Xsyndrome)”.《分子医学的专家评论(Expert Rev Mol Med.)》2017;19:e10。

45.Tural S、Tekcan A、Kara N、Elbistan M、Güven D、Ali Tasdemir H.“通过TP-PCR对患有卵巢功能早衰和脆性X的患者进行FMR1基因突变筛查(FMR1 gene mutationscreening by TP-PCR in patients with premature ovarian failure and fragile-X)”.《妇科内分泌学(Gynecol Endocrinol.)》2015;31(3):191-195。

46.Naumann A、Hochstein N、Weber S、Fanning E、Doerfler W.“FMR1启动子的5'-上游序列中的独特的DNA甲基化边界与核蛋白结合,并在脆性X综合征中丢失(Adistinct DNA-methylation boundary in the 5'-upstream sequence of the FMR1promoter binds nuclear proteins and is lost in fragile X syndrome)”.《美国人类遗传学期刊》2009;85(5):606-616。

47.Hosomichi K、Shiina T、Tajima A、Inoue I.“下一代测序技术对HLA研究的影响(The impact of next-generation sequencing technologies on HLA research)”.《人类遗传学期刊(J Hum Genet.)》2015;60(11):665-673。

48.Sun K、Jiang P、Chan KC等人.“通过全基因组甲基化测序进行血浆DNA组织映射用于无创性产前、癌症和移植评估(Plasma DNA tissue mapping by genome-widemethylation sequencing for noninvasive prenatal,cancer,and transplantationassessments)”.《美国国家科学院院刊》2015;112(40):E5503-5512。

49.Lehmann-Werman R、Neiman D、Zemmour H等人.“使用循环DNA的甲基化谱式鉴定组织特异性细胞死亡(Identification of tissue-specific cell death usingmethylation patterns of circulating DNA)”.《美国国家科学院院刊》2016;113(13):E1826-1834。

50.Chan RW、Jiang P、Peng X等人.“系统性红斑狼疮中的通过基因组和甲基组测序揭示的血浆DNA畸变”.《美国国家科学院院刊》2014;111(49):E5302-5311。

51.Napirei M、Ludwig S、Mezrhab J、Mannherz HG.“鼠血清核酸酶-纤溶酶和肝素对DNase1和DNase1-样-3(DNase1l3)的活性的相反作用(Murine serumnucleases--contrasting effects of plasmin and heparin on the activities ofDNase1 and DNase1-like 3(DNase1l3))”.《欧洲联合生化学会杂志(FEBS J.)》2009;276(4):1059-1073。

81页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于鉴定目的蛋白质的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!