用于药物基因组学筛选的整合全组学方法

文档序号:1580715 发布日期:2020-01-31 浏览:31次 >En<

阅读说明:本技术 用于药物基因组学筛选的整合全组学方法 (Integrated whole-group method for pharmacogenomic screening ) 是由 卡米尔·R·施瓦兹 约翰·利特勒 查尔斯·约瑟夫·瓦斯克 约翰·扎卡里·桑伯恩 于 2018-06-07 设计创作,主要内容包括:可能在等位基因之间差异性分布的复杂基因型、尤其是多个单核苷酸变异可以使用来自这些等位基因的RNA转录物的下一代测序和RNA转录物的等位基因分数信息有效地绘制在基因的每个等位基因中。等位基因之间的这样重构的单核苷酸变异可以与癌症疗法的预期效力相关,以更新或产生患者的记录或者调整该癌症疗法的剂量和时间表以减少该癌症疗法的不期望的效力。(Such reconstructed single nucleotide variations between alleles can be correlated with expected efficacy of a cancer therapy to update or generate patient records or adjust the dose and schedule of the cancer therapy to reduce undesired efficacy of the cancer therapy.)

用于药物基因组学筛选的整合全组学方法

本申请要求2017年6月8日提交的序列号为62/517,022和2017年10月3日提交的序列号为62/567,719的我们共同未决的美国临时申请的优先权。

技术领域

本发明的领域是与癌症疗法相关的药物基因组学分析。

背景技术

背景描述包括可用于理解本发明的信息。并不承认本文提供的任何信息是现有技术或与当前要求保护的发明相关,也不承认具体地或隐含地引用的任何出版物是现有技术。

本文中的所有出版物和专利申请都通过引用并入,其程度如同每个单独的出版物或专利申请被具体地且单独地指明通过引用并入一样。在并入的参考文献中的术语的定义或用法与本文提供的该术语的定义不一致或相反的情况下,适用本文提供的该术语的定义,而不适用该术语在该参考文献中的定义。

个体患者之间的遗传变异通常影响个体患者对多种药理学物质(尤其是通过特定代谢途径和/或酶代谢以提供最佳的药效和降低的毒性的那些)的反应。已经鉴定出影响癌症药物相关表型(例如,药效、药物毒性等)的几种基因,包括硫嘌呤甲基转移酶基因(TPMT)、编码细胞色素P450混合功能氧化酶系统成员的基因(CYP2D6)和编码有机阴离子转运多肽1B1的基因(SLCO1B1),并且已经进一步鉴定出它们的单核苷酸变异,这提示使用基因组学信息来定制癌症疗法以获得其最大和最佳结果。例如,作为急性成淋巴细胞性白血病的典型治疗的巯嘌呤治疗可能会对一些具有TPMT的变体等位基因的患者造成致命的毒性,并且强烈建议进行个体基因分型以在治疗之前鉴定此类对巯基嘌呤治疗而言致命的等位基因的存在。然而,主要障碍之一在于难以绘制等位基因特异性的单核苷酸变异,其通过传统基因组基因测序无法轻易鉴定出,尤其是由于两个单核苷酸变异之间的距离较大。

为了规避此类困难,已经努力使用RNA等位基因频率和DNA拷贝数变异来鉴定等位基因特异性单核苷酸点突变。例如,Edsgard等人(Bioinformatics[生物信息学],32(19),2016,3038-3040)披露了使用单细胞RNA-seq数据进行单倍型推断,该数据显示了读段数分布的特定模式。读段数分布的特定模式与测序数据相关,以推断两个序列变体是否位于同一等位基因中。类似地,Berger等人(2015,Research in Computational MolecularBiology[计算分子生物学研究]第28-29页)披露,两个等位基因中的单核苷酸变异通常显示为RNA转录物的不同读段数,可以使用定相该HapTree-X框架从中重构单倍型。然而,没有人提供在各种类型的癌症患者之间彻底和大规模的筛选可能影响多种癌症药物的功效和/或毒性的多个基因中的等位基因特异性单核苷酸变异分布。

因此,即使已知使用RNA转录物的等位基因频率来定相单核苷酸变异的一般方法,在很大程度上仍未彻底研究如何通过绘制与药物代谢相关的特定基因中的等位基因特异性单核苷酸变异来鉴定和修改癌症疗法。因此,仍然需要改善的方法和系统以便使用组学数据来在各种类型癌症患者之间综合表征可能影响癌症疗法的功效和毒性的目的基因的等位基因中的单核苷酸变异。

发明内容

本发明主题涉及使用组学数据来在各种类型的癌症患者之间综合表征目的基因的等位基因中的单核苷酸变异的多种方法,这些方法是通过分析包括单核苷酸变异在内的RNA转录物之间的等位基因分数分布的模式来进行。因此,本发明主题的一方面包括减轻癌症疗法在患有肿瘤的患者中的不良反应的方法。此方法包括获得患者的转录组学数据的步骤,该数据分别包含从具有第一和第二核苷酸变异的基因转录的RNA分子的第一和第二基因座的等位基因分数信息。然后,该方法继续进行使用等位基因分数信息以重构第一和第二RNA基因座的单倍型的步骤。优选地,第一和第二RNA基因座的等位基因分数信息源自患者的肿瘤组织。然后,可以将这样重构的单倍型与癌症疗法的预期效力相关,并且可以将其用于产生或更新患者的记录。在一些实施例中,该方法还可以包括基于预期效力调整癌症疗法的推荐剂量和时间表的步骤。优选地,通过使用患者的基因组学、转录组学和蛋白质组学数据中的至少两种的途径分析来鉴定癌症疗法。

最典型地,转录组学数据可以从RNAseq获得,并且该基因是CYP3A5、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15中的至少一种。尽管癌症疗法的预期效力可能会根据基因和突变的类型而变化,但是此类预期效力可以包括药效、药物毒性、药物的代谢率和患者的预期寿命。因此,在一个实施例中,该基因是CYP2D6,并且预期效力包含由于癌症疗法的缓慢代谢导致的癌症疗法的毒性增加。

优选地,第一和第二RNA基因座在RNA转录物中相距至少300bp、相距至少500bp或相距至少1kbp,使得第一和第二基因座的RNA-seq序列数据不重叠。当具有第一和第二核苷酸变异的第一和第二RNA基因座的等位基因分数相差小于10%、小于15%或小于20%时,将该单倍型重构为在该基因的等位基因中具有第一和第二核苷酸变异。

另外地,转录组学数据可以包含第一和第二RNA基因座的拷贝数,并且该方法还可以包括确定RNA转录物的第一和第二基因座中至少一个的扩增以及用与癌症疗法的预期效力相关的基因的扩增信息产生或更新患者的记录的步骤。在这样的实施例中,该基因可以是CYP2D6,并且预期效力可以包含由于癌症疗法的快速代谢导致的癌症疗法的功效降低。

此外,转录组学数据还可以包括源自患者健康组织的第一和第二RNA基因座的等位基因分数信息。在这样的实施例中,该方法还可以包括以下步骤:使用健康组织的等位基因分数信息以重构健康组织单倍型,以及将源自肿瘤组织的等位基因分数信息与源自健康组织的等位基因分数信息进行比较以获得肿瘤特异性等位基因分数信息。然后,可以用等位基因分数信息和肿瘤特异性等位基因分数信息产生或更新患者的记录。另外,可以基于重构的健康组织单倍型和肿瘤特异性单倍型的比较进一步调整癌症疗法的推荐剂量和时间表。

在本发明主题的又另一方面,诸位发明人设想到了治疗患有肿瘤的患者的方法。此方法包括获得患者的转录组学数据的步骤,该数据分别包含从具有第一和第二核苷酸变异的基因转录的RNA分子的第一和第二RNA基因座的等位基因分数信息。然后,该方法继续进行使用等位基因分数信息以重构第一和第二RNA基因座的单倍型的步骤。优选地,第一和第二RNA基因座的等位基因分数信息源自患者的肿瘤组织。可以针对单倍型推断癌症疗法的预期效力,并且可以基于推断的预期效力来调整或确定癌症疗法的推荐剂量和时间表。优选地,通过使用患者的基因组学、转录组学和蛋白质组学数据中的至少两种的途径分析来鉴定癌症疗法。

最典型地,转录组学数据可以从RNAseq获得,并且该基因是CYP3A5、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15中的至少一种。尽管癌症疗法的预期效力可能会根据基因和突变的类型而变化,但是此类预期效力可以包括药效、药物毒性、药物的代谢率和患者的预期寿命。因此,在一个实施例中,该基因是CYP2D6,并且预期效力包含由于癌症疗法的缓慢代谢导致的癌症疗法的毒性增加。

优选地,第一和第二RNA基因座相距至少300bp、相距至少500bp或相距至少1kbp,使得第一和第二基因座的RNA-seq序列数据不重叠。当具有第一和第二核苷酸变异的第一和第二RNA基因座的等位基因分数相差小于10%、小于15%或小于20%时,将该单倍型重构为在该基因的等位基因中具有第一和第二核苷酸变异。

另外地,转录组学数据可以包含RNA转录物的第一和第二基因座的拷贝数,并且该方法还可以包括确定第一和第二RNA基因座中至少一个的扩增以及用与癌症疗法的预期效力相关的基因的扩增信息产生或更新患者的记录的步骤。在这样的实施例中,该基因可以是CYP2D6,并且预期效力可以包含由于癌症疗法的快速代谢导致的癌症疗法的功效降低。

此外,转录组学数据还可以包括源自患者健康组织的第一和第二RNA基因座的等位基因分数信息。在这样的实施例中,该方法还可以包括以下步骤:使用健康组织等位基因分数信息以重构健康组织单倍型,以及将源自肿瘤组织的等位基因分数信息与源自健康组织的等位基因分数信息进行比较以获得肿瘤特异性等位基因分数信息。然后可以使用等位基因分数信息和肿瘤特异性等位基因分数信息来调整癌症疗法的推荐剂量和时间表。另外,可以用与癌症疗法的预期效力相关的重构的单倍型进一步产生和/或更新患者的记录。

本发明主题的多个对象、特征、方面和优点将根据以下关于优选实施例的详细描述和附图而变得更清楚。

附图说明

图1A描绘了在患者的正常组织和肿瘤组织中DNA等位基因分数的示例图。

图1B描绘了相对于患者的肿瘤DNA等位基因分数,肿瘤RNA等位基因分数的示例图。

图2A示出了相对于患者的正常DNA等位基因分数,肿瘤RNA等位基因分数的示例图,在该患者体内两个单核苷酸变异(α和β)在同一单倍型中。

图2B示出了相对于患者的肿瘤DNA等位基因分数,肿瘤RNA等位基因分数的示例图,在该患者体内两个单核苷酸变异(α和β)在同一单倍型中。

图3A示出了在没有等位基因的任何缺失或扩增的情况下CYP2D6和CYP2D7基因的每个外显子的读段覆盖率的图。

图3B示出了在有等位基因缺失的情况下CYP2D6和CYP2D7基因的每个外显子的读段覆盖率的图。

图3C示出了在有等位基因扩增的情况下CYP2D6和CYP2D7基因的每个外显子的读段覆盖率的图。

具体实施方式

诸位发明人设想到了患者之间的基因组变异(尤其是在与患者肝脏中代谢化学物质相关的基因中)影响包括癌症药物在内的多种癌症治疗的效力。此类基因组变异通常是等位基因特异性的(例如,仅存在于两个等位基因之一中)和/或跨越几个外显子或内含子的,使得难以绘制一个基因中和多个基因中的等位基因特异性基因组变异。另外,尽管经常有必要进行覆盖患者多个基因中的多个基因组变异的基因组筛选以优化癌症治疗的类型和治疗方案,但是针对不同类型的癌症患者的一揽子综合大规模基因组变异筛选已经无法解释。

从不同的角度来看,诸位发明人发现,使用RNA分子的等位基因分数信息并且进一步用等位基因信息重构单倍型可以容易地确定等位基因特异性基因组变异,这些RNA分子的序列在存在基因组变异的区域重叠。诸位发明人还发现,可以从患者获得与药效和/或毒性相关的多个基因的RNA分子的等位基因分数信息,使得可以定制和个性化药物治疗计划。因此,在本发明主题的一个尤其优选的方面,诸位发明人设想到了一种通过使用等位基因分数信息重构在一个或多个基因中具有多个等位基因特异性单核苷酸变异的单倍型以减轻癌症疗法在患有肿瘤的患者中的不良反应的方法。这样重构的单倍型信息可以用于产生或更新与癌症疗法的预期效力相关的患者记录。

如本文所用,术语“肿瘤”是指以下项并且可与以下项互换使用:一种或多种癌细胞、癌组织、恶性肿瘤细胞或恶性肿瘤组织,它们可以位于或者发现于人体的一或多个解剖位置中。应当注意,如本文所用的术语“患者”包括经诊断患有病症(例如,癌症)的个体以及出于检测或鉴定病症的目的经历检查和/或测试的个体二者。因此,患有肿瘤的患者是指经诊断患有癌症的个体以及被怀疑患有癌症的个体二者。如本文所用,术语“提供(provide)”或“提供(providing)”是指并且包括制造、产生、放置、使得能使用、转移或使得即可使用的任何行为。

如本文所用,术语“基因座(locus)”(或复数“基因座(loci)”)是指基因、基因的转录物或衍生自基因或基因的转录物的核酸分子的一部分或在基因、基因的转录物或衍生自基因或基因的转录物的核酸分子中的位置。

获得组学数据

设想到了获得组学数据的任何合适的方法和/或程序。例如,可以通过获得来自个体的组织并且处理该组织以获得来自该组织的DNA、RNA、蛋白质或任何其他生物物质以进一步分析相关信息来获得组学数据。在另一个实例中,可以从存储个体的组学信息的数据库中直接获得组学数据。

在从个体的组织获得组学数据的情况下,设想到了从患者获得肿瘤样品(肿瘤细胞或肿瘤组织)或健康组织的任何合适的方法。最典型地,可以经由活检(包括液体活检、或在手术或独立的活检程序期间经由组织切除术获得的等)获得来自患者的肿瘤样品或健康组织样品,其可以是新鲜的或经处理的(例如,冷冻的等),直到用于从组织获取组学数据的进一步过程为止。例如,组织或细胞可以是新鲜的或冷冻的。在另一个实例中,组织或细胞可以呈细胞/组织提取物的形式。在一些实施例中,组织或细胞可以从单个或多个不同的组织或解剖区域获得。例如,可以从患者的***以及其他器官(例如,肝、脑、***、血液、肺等)获得转移性乳腺癌组织用作转移的乳腺癌组织。在另一个实例中,可以从身体或器官的任何部分(优选地从肝脏、血液或肿瘤附近的任何其他组织(在接近解剖距离等))获得患者的健康组织或匹配的正常组织(例如,患者的非癌性乳腺组织)。

在一些实施例中,为了确定在相关时间段内肿瘤样品的任何变化,可以在多个时间点从患者获得肿瘤样品。例如,可以在样品被确定或诊断为癌性之前和之后获得肿瘤样品(或疑似肿瘤样品)。在另一个实例中,可以在一次或一系列抗肿瘤治疗(例如,放疗、化疗、免疫疗法等)之前、期间和/或之后(例如,完成后等)获得肿瘤样品(或疑似肿瘤样品)。在仍另一个实例中,在鉴定新的转移的组织或细胞后,可以在肿瘤进展期间获得肿瘤样品(或疑似肿瘤样品)。

从获得的肿瘤样品(细胞或组织)或健康样品(细胞或组织)中,可以将DNA(例如,基因组DNA、染色体外DNA等)、RNA(例如,mRNA、miRNA、siRNA、shRNA等)和/或蛋白质(例如,膜蛋白、胞质蛋白、核蛋白等)分离并且进一步分析以获得组学数据。可替代地和/或另外地,获得组学数据的步骤可以包括从存储一位或多位患者和/或健康个体的组学信息的数据库接收组学数据。例如,可以从患者肿瘤组织中分离的DNA、RNA和/或蛋白质获得患者肿瘤的组学数据,并且所获得的组学数据可以与患有相同类型的肿瘤或不同类型的肿瘤的其他患者的其他组学数据集一起存储在数据库(例如,云数据库、服务器等)中。从健康个体或患者的匹配的正常组织(或健康组织)获得的组学数据也可以存储在数据库中,使得在分析时可以从数据库中检索相关的数据集。同样,在获得蛋白质数据的情况下,这些数据也可以包括蛋白质活性,尤其是在蛋白质具有酶活性(例如,聚合酶、激酶、水解酶、裂解酶、连接酶、氧化还原酶等)的情况下。

如本文所用,组学数据包括但不限于与基因组学、蛋白质组学和转录组学以及特定的基因表达或转录物分析和细胞的其他特征和生物学功能相关的信息。关于基因组学数据,合适的基因组学数据包括DNA序列分析信息,其可以通过肿瘤和匹配的正常样品的全基因组测序和/或外显子组测序(典型地在至少10倍、更典型地至少20倍的覆盖深度下)获得。可替代地,还可以从来自先前序列测定的已建立的序列记录(例如,SAM、BAM、FASTA、FASTQ或VCF文件)提供DNA数据。因此,数据集可以包括未处理的或已处理的数据集,并且示例性数据集包括具有BAM格式、SAM格式、FASTQ格式或FASTA格式的那些。然而,尤其优选的是,以BAM格式或作为BAMBAM diff对象提供数据集(例如,US 2012/0059670A1和US 2012/0066001A1)。组学数据可以源自全基因组测序、外显子组测序、转录组测序(例如,RNA-seq)或源自基因特异性分析(例如,PCR、qPCR、杂交、LCR等)。同样,可以按多种方式进行序列数据的计算分析。然而,在最优选的方法中,如例如在US 2012/0059670A1和US 2012/0066001A1中披露的使用BAM文件和BAM服务器通过对肿瘤和正常样品进行位置引导的同步比对在计算机中进行分析。这样的分析有利地减少假阳性新表位,并且显著地减少对存储器和计算资源的需求。

在需要获得肿瘤特异性组学数据的情况下,认为许多方式适用于本文,只要此类方法将能够在肿瘤和匹配的正常序列之间产生差异序列对象或位置特异性差异的其他识别即可。示例性方法包括与外部参考序列(例如,hg18或hg19)的序列比较、与内部参考序列(例如,匹配的正常序列)的序列比较以及与已知的常见突变模式(例如,SNV)的序列处理。因此,在肿瘤和匹配的正常、肿瘤和液体活检以及匹配的正常和液体活检之间检测突变的设想到的方法和程序包括iCallSV(URL:github.com/rhshah/iCallSV)、VarScan(URL:varscan.sourceforge.net)、MuTect(URL:github.com/broadinstitute/mutect)、Strelka(URL:github.com/Illumina/strelka)、Somatic Sniper(URL:gmt.genome.wustl.edu/somatic-sniper/)和BAMBAM(US 2012/0059670)。

然而,在本发明主题的尤其优选的方面,通过第一序列数据(肿瘤样品)与第二序列数据(匹配的正常样品)的增量同步比对来进行序列分析,例如使用如例如描述于CancerRes[癌症研究]2013年10月1日;73(19):6036-45、US 2012/0059670和US 2012/0066001的算法以如此产生患者和肿瘤的特定突变数据。如将容易理解的,序列分析也可以按这样的方法进行,将来自肿瘤样品的组学数据与匹配的正常组学数据进行比较,以便如此进行如下分析,其不仅可以告知使用者对于患者体内的肿瘤而言真正的突变,还可以告知使用者在治疗期间新出现的突变(例如,经由匹配的正常和匹配的正常/肿瘤的比较、或经由肿瘤的比较)。另外,使用此类算法(尤其是BAMBAM),可以容易地确定特定突变的等位基因频率和/或克隆群体,这可以有利地提供关于特定肿瘤细胞部分或群体的治疗成功的指示。因此,组学数据分析可以揭示错义和无义突变、拷贝数变化、杂合性丢失、缺失、***、倒位、易位、微卫星变化等。

此外,应当注意,一些数据集优选地反映了同一患者的肿瘤和匹配的正常样品,以便如此获得患者和肿瘤的具体信息。在此类实施例中,可以排除不引起肿瘤的遗传种系改变(例如,沉默突变、SNP等)。当然,应当认识到,肿瘤样品可能来自初始肿瘤、来自开始治疗时的肿瘤、来自复发性肿瘤或转移部位等。在大多数情况下,患者的匹配的正常样品可能是血液或来自与肿瘤相同的组织类型的未患病的组织。

优选地,基因组学数据包括等位基因特异性序列信息和拷贝数。在这样的实施例中,基因组学数据集包括基因的至少一部分的所有读段信息,优选地至少10x、至少20x或至少30x。使用动态开窗方法来计算等位基因特异性拷贝数(更具体地说,多数和少数拷贝数),该方法根据种系数据中的覆盖率扩大和缩小窗口的基因组学宽度,如在US 9824181中所详细描述的,将其通过引用并入本文。如本文所用,多数等位基因是具有多数拷贝数(>总拷贝数的50%(读段支持)或最多的拷贝数)的等位基因,并且少数等位基因是具有少数拷贝数(<总拷贝数的50%(读段支持)或最少的拷贝数)的等位基因。

另外,癌症和/或正常细胞的组学数据包含如下转录组数据集,其包括从患者(从患者的癌症组织(患病组织)和/或匹配的健康组织)或健康个体获得的一种或多种RNA(优选细胞mRNA)的序列信息和表达水平(包括表达分析、拷贝数或剪接变体分析)。本领域已知许多转录组分析方法,并且所有已知方法都被认为适用于本文(例如,RNAseq、RNA杂交阵列、qPCR等)。因此,优选的材料包括mRNA和初级转录物(hnRNA),并且RNA序列信息可以从逆转录的polyA+-RNA获得,该逆转录的polyA+-RNA进而从同一患者的肿瘤样品和匹配的正常(健康的)样品获得。同样,应当注意,尽管典型地优选polyA+-RNA作为转录组的代表,但是其他形式的RNA(hn-RNA、非多聚腺苷酸化RNA、siRNA、miRNA等)也被认为适用于本文。优选的方法包括定量RNA(hnRNA或mRNA)分析和/或定量蛋白质组学分析,尤其是包括RNAseq。在其他方面,使用基于RNA-seq、qPCR和/或rtPCR的方法进行RNA定量和测序,尽管多种可替代的方法(例如,基于固相杂交的方法)也被认为是合适的。从另一个角度来看,转录组学分析(单独地或与基因组分析组合)可能适合于鉴定和定量具有癌症特异性突变和患者特异性突变的基因。

优选地,转录组学数据集包括等位基因特异性序列信息和拷贝数信息。在这样的实施例中,转录组学数据集包括基因的至少一部分的所有读段信息,优选地至少10x、至少20x或至少30x。使用动态开窗方法来计算等位基因特异性拷贝数(更具体地说,多数和少数拷贝数),该方法根据种系数据中的覆盖率扩大和缩小窗口的基因组学宽度,如在US9824181中所详细描述的,将其通过引用并入本文。如本文所用,多数等位基因是具有多数拷贝数(>总拷贝数的50%(读段支持)或最多的拷贝数)的等位基因,并且少数等位基因是具有少数拷贝数(<总拷贝数的50%(读段支持)或最少的拷贝数)的等位基因。

应当理解,可以针对特定疾病(例如,癌症等)、疾病阶段、特定突变或甚至基于个人突变谱或所表达的新表位的存在来选择一种或多种所需核酸或基因。可替代地,在需要发现或扫描新突变或特定基因的表达变化的情况下,优选的是RNAseq,以便如此覆盖患者转录组的至少一部分。此外,应当理解,可以静态地进行分析,或者在重复取样的时间过程中进行分析以获得动态图片,而无需对肿瘤或转移进行活检。

此外,癌症和/或正常细胞的组学数据包含如下蛋白质组学数据集,其包括蛋白质表达水平(蛋白质分子的定量)、翻译后修饰、蛋白质-蛋白质相互作用、蛋白质-核苷酸相互作用、蛋白质-脂质相互作用等。因此,还应当理解,如本文呈现的蛋白质组学分析还可以包括选定的蛋白质的活性测定。可以从新鲜切除的组织、从冷冻或以其他方式保存的组织、甚至从FFPE组织样品进行这样的蛋白质组学分析。最优选地,蛋白质组学分析是定量的(即,提供表达的多肽的定量信息)和定性的(即,提供多肽的数字或定性指定活性)。设想到了任何合适类型的分析。然而,特别优选的蛋白质组学方法包括基于抗体的方法和质谱方法。此外,应当注意,蛋白质组学分析不仅可以提供有关蛋白质本身的定性或定量信息,而且也可以包括蛋白质具有催化活性或其他功能活性的蛋白质活性数据。用于进行蛋白质组学测定的一种示例性技术描述于通过引用并入本文的US 7473532中。鉴定并且甚至定量蛋白质表达的进一步合适的方法包括多种质谱分析(例如,选择反应监测(SRM)、多反应监测(MRM)和连续反应监测(CRM))。

组学数据分析和作为治疗的癌症药物的选择

诸位发明人设想到了可以使用组学数据、优选地两种或更多种类型的组学数据来确定肿瘤组织的分子谱或分子标签。尽管可以使用任何类型或亚型的组学数据来确定肿瘤组织的分子谱或分子标签,但是设想到了优选的组学数据的类型可以基于肿瘤的类型、基于所需信息(例如,关于固有药物敏感性、肿瘤细胞干细胞特性等的信息)和/或肿瘤的预后(例如,转移的、免疫抗性的等)而变化。可能与肿瘤发展相关的基因组学数据的示例性亚型可以包括但不限于基因组扩增(如代表的基因组拷贝数畸变)、体细胞突变(例如,点突变(例如,无义突变、错义突变等)、缺失、***等)、基因组重排(例如,染色体内重排、染色体外重排、易位等)、染色体外基因组的出现和拷贝数(例如,双微染色体等)。另外,基因组数据还可以包括肿瘤突变负荷,其通过在预定时间段内或相关时间段内由肿瘤细胞携带的或出现在肿瘤细胞中的突变的数目来测量。

除了基因组学数据外,一种或多种亚型的转录组学数据也可以用于确定肿瘤组织的分子谱或分子标签。示例性转录组学数据包括但不限于如通过mRNA的量、mRNA的成熟水平(例如,poly A尾的存在等)和/或转录物的剪接变体测量的多个mRNA的表达水平。基因的数目(至少两个、至少五个、至少十个、至少十五个等)、转录物或RNA的类型(mRNA、miRNA等)或用于确定肿瘤组织的分子谱或分子标签的基因的选择可以基于肿瘤的类型、基于所需的信息(例如,关于固有药物敏感性、肿瘤细胞干细胞特性等的信息)和/或肿瘤的预后(例如,转移的、免疫抗性的等)而变化。例如,用于确定与肿瘤干细胞特性相关的分子标签的基因选择和/或基因数目可以不同,或和用于确定与细胞对特定化疗药物的敏感性相关的分子标签的基因选择和/或基因数目具有最小重叠。设想到了要包括在相关转录组学数据集中以区分肿瘤样品(从匹配的正常样品中或在具有不同生理特征的肿瘤样品中)的基因可以包括任何肿瘤特异性基因、炎症相关基因、DNA修复相关基因(例如,碱基切除修复、错配修复、核苷酸切除修复、同源重组、非同源末端连接等)、与对DNA损伤剂的敏感性相关的基因、DNA复制机器相关基因。然而,还设想到了要包括在相关转录组学数据集中以区分肿瘤样品的基因可以包括与疾病无关的基因(例如,管家基因),包括但不限于与转录因子、RNA剪接、tRNA合成酶、RNA结合蛋白、核糖体蛋白或线粒体蛋白或者非编码RNA(例如,微小RNA、小干扰RNA、长非编码RNA(lncRNA)等)相关的那些基因。

任选地,一种或多种亚型的蛋白质组学数据可以用于确定肿瘤组织的分子谱或分子标签。示例性蛋白质组学数据包括但不限于一种或多种蛋白质或肽的量、一种或多种蛋白质或肽的翻译后修饰(例如,磷酸化、糖基化、形成二聚体、泛素化等)和/或蛋白质或肽的亚细胞定位。

不希望受任何特定理论的束缚,诸位发明人设想到了肿瘤组织的突变谱和/或RNA表达谱独立地或共同地影响细胞内信号传导网络,从而可能改变肿瘤组织或细胞的固有特性。因此,可以将如此确定的肿瘤组织的突变谱和/或RNA表达谱整合到途径模型中,以产生经修饰的途径或肿瘤特异性途径。最典型地,该途径模型包含通过一个或多个调节节点连接的多种途径元素(例如,蛋白质)。例如,途径模型[A]是基于因子图的途径模型(例如,PARADIGM途径模型),其包含通过调节节点I(在元素A和B之间)以及另一个调节节点II(在元素B和C之间)连接的途径元素A、B和C(A-I-B-II-C)。调节节点I和II代表可能会影响B和C的活性的除A或B以外的任何因子。因此,途径模型[A]可以经由调节节点I和II之一与另一个途径模型[B]耦合。因此,在一些实施例中,该途径模型可以包括单个途径(例如,PKA介导的细胞凋亡途径等)。因此,在一些实施例中,该途径模型可以是单度模型,其包括一个或多个彼此平行或基本独立的信号传导途径。在其他实施例中,该途径模型可以是多度模型,其可以包括经由一个或多个调节节点耦合的多个信号传导途径(例如,具有途径[A]和[B]的二度模型,其中途径[A]和[B]在途径[A]的调控节点耦合;具有途径[A]、[B]和[C]的三度模型,其中途径[A]和[B]在途径[A]的调控节点耦合,并且途径[B]和[C]在途径[B]的调节节点耦合)。

可以如在WO 2014/193982中所述的在中心法则模块中使用组学数据作为输入来推断或计算每种途径元素的途径元素活性(DNA-RNA-蛋白质-蛋白质活性),将该专利通过引用并入本文。例如,在编码蛋白质A的基因在外显子组中携带多个基因组突变,并且在药物治疗后该基因的RNA表达水平增加的情况下,可以从此类基因组和转录组学谱推断出,由于关键的翻译后修饰残基中的错义突变,该蛋白质的量可能会增加,而此种蛋白质的活性可能在信号传导途径(其中蛋白质A是该信号传导途径的元素)中提供显性负作用。基于这样推断的个体途径元素活性,可以在同一信号传导途径或通过调节节点连接的另一个信号传导途径中推断下游信号传导途径元素的活性。

因此,可以将各种类型的组学数据整合到单个途径模型中,以便如此允许在经测量的属性(例如,DNA拷贝数和/或突变、RNA转录水平、蛋白质量和/或活性)的基础上计算推断的属性(例如,没有从样品获得数据的DNA拷贝数和/或突变、RNA转录水平、蛋白质量和/或活性),并且还计算推断的途径活性。有利地,此类计算可以利用全部可用的组学数据,或者仅使用与相应的正常值有显著偏差的组学数据(例如,由于拷贝数变化、过表达或低表达、蛋白活性丧失等)。使用此种系统,应当理解,可以检测细胞信号传导活性和此类信号传导途径的变化而不是仅分析单个或多个标记,否则当仅考虑单个或多个标记而无视其功能时,这些信号传导活性和这些信号传导途径的变化将不会被注意。

优选地,可以经由机器学***)和/或状态(例如,突变的类型和位置、磷酸化蛋白质的磷酸化数目等)和/或调节节点I的任何因子(例如,影响途径元素A活性的酶的活性等)中的每个或至少一个,以推断途径元素B的活性(例如,蛋白质B的量、状态)。

因此,这样训练的途径模型可以用作预测肿瘤组织中途径或途径元素将如何变化的模板。例如,可以使用PARADIGM(或可以经机器训练并产生可靠的输出数据的任何合适的途径模型)将从患者获得的组学数据(并且优选地与匹配的正常组织或来自健康个体的健康组织比较)整合到基于因子图的模型中,以推断或预测与匹配的正常组织或来自健康个体的健康组织相比,由于肿瘤特异性组学数据的变化,哪些途径元素将变化以及将如何变化。因此,合适的途径模型包括基于基因集合富集分析(GSEA,布罗德研究所(BroadInstitute))的模型、基于信号传导途径影响分析(SPIA,Bioconductor)的模型和病理学家途径模型(NCBI)以及基于因子图的模型,尤其是如在均通过引用并入本文的WO 2011/139345A2、WO 2013/062505A1和WO 2014/059036中描述的PARADIGM。

因此,基因组突变谱、RNA表达谱和任选的蛋白质组分析(从样品测得或通过途径分析推断)可以进一步共同用于鉴定或预测相关信号传导途径中在肿瘤组织中变化最显著的信号传导途径元素,使得可以选择对于一种或多种肿瘤治疗最理想的靶标。此外,诸位发明人还设想到了基于此种途径分析,可以推断出信号传导途径(总体上)或甚至包含多个信号传导途径的信号传导网络的活性响应于事件(例如,药物治疗等)如何变化或修饰,以指示增加对抗肿瘤治疗的敏感性或易感性、产生或获得对抗肿瘤治疗的抗性或对抗肿瘤治疗的无反应性。因此,考虑到药物选择和治疗的途径分析可以为***选择最佳和个性化的一种或多种治疗方案提供指导。

定相不同基因座的RNA分子并且确定等位基因单倍型

即使使用患者的组学数据从途径分析中鉴定出具有成功***的高可能性的癌症药物,如果由于患者的特异性遗传变异该癌症药物无法以有效的方式代谢和/或对患者的正常组织或细胞产生毒性,该癌症药物也可能无法有效地用于治疗患者的肿瘤。已经鉴定出可能会影响一些当前可用的癌症药物的效力的几种基因和在那些基因上的单核苷酸变异。在那些基因中的一些中,每个单核苷酸变异和/或单核苷酸变异中的一些的组合和/或具有单核苷酸变异的不同组合的不同类型的等位基因的组合的影响可能关于癌症药物的预期效力和/或毒性而变化。例如,已经鉴定出具有单核苷酸变异的不同组合的CYP2D6的多种等位基因类型及其功能水平(正常功能、降低的功能、无功能等)。有趣的是,在两种类型的等位基因含有共同的单核苷酸变异1662G->C和4181G->C的情况下,该基因产物的功能降低(在此类变异与另一个单核苷酸变异100C->T共存于同一等位基因中的情况下),并且该基因产物无功能(在此类变异与其他单核苷酸变异882G->C和2851C->T共存于同一等位基因中的情况下)。

另外,基于形成基因的双倍型的等位基因类型的组合,基因的整体功能可能改变,这可能与多种临床意义联系。表1示出了影响癌症药物的效力的基因的多个等位基因的代表性实例。例如,如果患者在他的/她的CYP2D6基因中具有*10等位基因,则可能的是,他莫昔芬对该患者的治疗可能不如对另一名患者有效,因为在该患者体内内昔芬(endoxifen)浓度低并且在他莫昔芬治疗后肿瘤复发的机会相对较高。

Figure BDA0002306277020000151

表1

因此,在本发明主题的一方面,可以确定患者的等位基因单倍型以在向患者给予癌症疗法之前提供癌症疗法的预期效力。尽管设想到了以等位基因特异性方式准确地绘制多个单核苷酸变异的合适的方法,但是优选的方法通过分析基因座的等位基因分数,使用从单个基因转录的不同基因座中的多个RNA分子的定相。最典型地,这些基因座是基因的非重叠部分,至少一个等位基因特异性单核苷酸变异位于其中。因此,与从该基因的另一个基因座转录的另一个RNA分子相比,从该基因的一个基因座转录的每个RNA分子都含有不同的等位基因特异性单核苷酸变异(或集)。优选地,两个基因座彼此相距至少100个碱基对、至少300个碱基对、至少500个碱基对、至少1000个碱基对或至少2000个碱基对。优选地,通过下一代测序(RNA-seq)获得RNA分子的每个基因座的组学数据,使得平均读段长度在50-500个碱基对之间、优选地在50-300个碱基对之间、更优选地在50-200个碱基对之间。

在一个优选实施例中,每个基因座的测序深度是至少10x、优选地至少15x、更优选地至少20x、最优选地至少30x。换言之,在种系等位基因(母体或父体等位基因)的每个基因座中的每个单核苷酸变异将被至少10个读段、至少15个读段、至少20个读段或至少30个读段覆盖。诸位发明人设想到了在只有一个等位基因具有必需的读段支持(所有读段对应于相同的核酸序列)的情况下,等位基因是纯合的;并且在两个等位基因具有必需的读段支持的情况下,等位基因是杂合的。因此,在等位基因是杂合的情况下,每个基因座的读段(10个读段、20个读段、30个读段等)可以分为两组(例如,五个读段对应于序列A,并且另外五个读段对应于序列B)。因此,对于每个基因座,可以基于对应于每个等位基因的读段数的比率来计算等位基因分数(由差异序列鉴定)。例如,在对于同一基因座,对应于具有单核苷酸变异的一个等位基因的读段数为20分之6,并且对应于没有单核苷酸变异的另一个等位基因的读段数为20分之14的情况下,具有单核苷酸变异的等位基因的等位基因分数为0.3(总计1),并且没有单核苷酸变异的等位基因的等位基因分数为0.7。

不希望受任何特定理论的束缚,诸位发明人设想到了通过杂合等位基因的RNA-seq测得的读段数通常不平衡,并且这种不平衡持续存在于从单个基因转录的RNA分子的多个基因座之间。从不同的角度来看,在单个基因中,来自每个等位基因的RNA转录物以特定模式表达(例如,父本与母本比为7:3等)。因此,可能的是,如果与同一基因座的所有或其他序列读段的分数比相同或基本上相似,则来自RNA转录物的基因座C的一部分读段与来自基因座D的一部分读段来自同一等位基因,并且因此,可以基于等位基因分数模式重构基因座的单倍型。例如,具有T201的读段(碱基对位置201处的序列为T)的等位基因分数是0.3,具有C201的读段(碱基对位置201处的序列为C)的等位基因分数是0.7,具有A607的读段(碱基对位置607处的序列为A)的等位基因分数是0.3,并且具有C607的读段(碱基对位置607处的序列为C)的等位基因分数是0.7。在这种情况下,基于等位基因分数模式相似度,可以确定T201和A607位于同一等位基因中,而C201和C607位于同一等位基因中。

优选地,用于重构基因单倍型的等位基因分数距离0.5足够远,使得来自不同等位基因的两个序列不会被错误地重构为单个等位基因,或者读段中的任何序列错误不会导致两个基因座的单倍型从两个不同的等位基因重构为单个等位基因。因此,等位基因分数优选地小于0.45、优选地小于0.4、更优选地小于0.35,或大于0.55、优选地大于0.6、或更优选地大于0.65。在其他实施例中,两个等位基因之间的等位基因分数相差大于5%、优选地大于10%、更优选地大于20%、或大于30%。

用于等位基因分数分析和单倍型重构的基因的类型和数目可以根据疾病的类型、疾病的预后和/或所需的信息(例如,药物毒性、药物效力等)而变化。例如,在研究与基因组变异相关的药物毒性和/或药物效力的情况下,目的基因可以包括编码在患者体内代谢癌症药物的酶的基因,这些基因可以包括但不限于CYP3A5、CYP2C19、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15。表2呈现了如上所述使用DNA测序数据分析测量的患者之间的特异性等位基因类型的频率。在此项研究中,诸位发明人开发了临床药物基因组学面板(panel),其包括与15种癌症疗法的毒性相关的10个基因中的32种标记(单核苷酸变异),这10个基因包括CYP3A5、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15。用1879个具有各种类型的癌症(例如,肾上腺癌、膀胱癌等)的患者样品进行测试以确定单倍型和在单倍型中标记单核苷酸变异的存在。如图所示,测量的频率与基因的相同等位基因类型的已知群体频率(如在ExAC数据库中报道)基本上相似。所有测试都根据先前通过独立的CLIA验证的基于PCR的面板基因分型的患者的群组以及根据一组合成数据进行了验证。

基因 等位基因 频率 群体频率
CYP3A5 *3 85.74% 85%-95%
CYP3A5 *6 0.43% 1.19%
CYP2D6 *10 4.23% [2.5-42.4]%
TPMT *3A 5.69% 4.50%
TPMT *3B 5.53% 2.75%
TPMT *3C 7.08% 3.67%
TPMT *2 0.16% 0.14%
F5 rs6025 2.13% 2.15%
DPYD *2A 0.48% 0.58%
DPYD rs67376798 0.48% 0.29%
G6PD 地中海 1.22% 0.24%
G6PD A- 1.12% 1.13%
NUDT15 *3 1.44% 2.62%
NUDT15 *4 0.08% 0.24%

表2

诸位发明人进一步研究了可能影响癌症药物功效或毒性的基因组变异在患有各种类型的癌症患者之间的发生率。如表3所示,在测试组(panel)中,几乎所有(超过96%)患有各种类型的癌症的患者在至少一个基因中具有至少一个基因组变异。此外,几乎8%的患者具有可能导致致命的或严重的药物毒性的基因组变体。

Figure BDA0002306277020000191

在一些实施例中,可以用患者的匹配的正常或健康组织的组学数据以及获得的患者的肿瘤组织的组学数据来进行使用RNA定相的单倍型确定,以确定癌症疗法的潜在差异作用和/或毒性。例如,在与药物毒性和功效相关的健康组织和肿瘤组织的基因组变异不同的情况下,对患者的全身药物治疗可能会导致仅对健康组织的严重毒性和药物治疗对肿瘤的功效降低。

图2A和图2B示出了示例性等位基因分数图,根据该图,具有两个不同的单核苷酸变异的单倍型在同一等位基因中。在此实例中,针对正常DNA等位基因分数(图2A)或肿瘤DNA等位基因分数(图2B)绘制具有TPMT基因的单核苷酸变异之一的肿瘤RNA转录物的两个基因座的等位基因分数。TMPT*3A等位基因包含两个单核苷酸变异(rs1142345和rs1800460),其中的每个单独地也分别标识为*3B(rs1800460)或*3C(rs1142345)。如果两个单核苷酸变异位于同一等位基因中,则该基因型可以标识为*1/*3A。如果两个单核苷酸变异位于不同的等位基因中,则该基因型可以标识为*3B/*3C。由于那两个单核苷酸变异位于基因组或RNA转录物的远处,因此在技术上不可能经由使用读段对的直接定相来定位两个单核苷酸变异。诸位发明人发现,通过确定两个单核苷酸变异的等位基因分数相同或基本上相似(例如,小于10%、小于15%等),至少两名患者具有在同一等位基因中的两个单核苷酸变异(rs1142345和rs1800460),因此具有*1/*3A基因型。例如,在第一名患者中,包括rs1142345(显示为α,单箭头)的RNA转录物的第一基因座的等位基因分数和包括rs1800460(显示为β,单箭头)的RNA转录物的第二基因座的等位基因分数都是约0.4。在另一个实例中,在第二名患者中,包括rs1142345(显示为α,双箭头)的RNA转录物的第一基因座的等位基因分数和包括rs1800460(显示为β,双箭头)的RNA转录物的第二基因座的等位基因分数都是约0.2。

在另一个实例中,在由于等位基因特异性缺失和/或扩增,肿瘤组织具有进一步的基因组变异的情况下,由于相对于完整的单倍型,来自缺失或扩增的单倍型的表型减少或增强,肿瘤组织可能对癌症疗法的毒性具有不同的敏感性或耐受性。如图1A所示,健康组织中的DNA等位基因分数大部分在0.4和0.6之间,这表明给定基因的两个等位基因的拷贝数基本上是相同的,并且在健康组织基因组中几乎不存在等位基因特异性扩增或缺失事件。相比之下,肿瘤组织中的DNA等位基因分数在0和1之间更广泛地分布,这表明在肿瘤细胞中在大量基因中的两个等位基因的拷贝数之间存在相当大的失衡,这潜在地由于等位基因特异性扩增或缺失事件。

图1B示出了对于在肿瘤组织中的基因中的多个基因座,DNA等位基因分数和RNA等位基因分数的相关性。如图所示,许多基因的RNA等位基因分数与其相应的DNA等位基因分数不同,这表明至少两个因素:等位基因特异性DNA拷贝数(例如,通过等位基因特异性扩增或缺失)和基因转录物的等位基因特异性转录水平的不平衡可能会影响与同一患者的健康组织相比的肿瘤特异性药物敏感性和/或毒性。

因此,在一些实施例中,关于一个或多个等位基因的缺失或扩增,诸位发明人设想到了对与癌症疗法的毒性相关的基因(例如,CYP3A5、CYP2C19、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15)进行基因组数据分析。可以通过对特定基因组区域的等位基因特异性拷贝数进行计数来确定基因的等位基因的缺失或扩增。最典型地,使用动态开窗方法计算等位基因特异性拷贝数,该方法根据在具有或预期具有杂合等位基因的基因的肿瘤或正常种系数据中的覆盖率来扩大和缩小窗口的基因组宽度。用零宽窗口初始化该过程。来自肿瘤或种系序列数据的每个唯一读段都将计入肿瘤计数(Nt)或种系计数(Ng)。每个读段的开始和停止位置将定义窗口的区域,随着新的读段超出当前窗口的边界而扩大。当肿瘤或种系计数超过用户定义的阈值时,记录窗口的大小和位置以及Nt、Ng和相对覆盖率Nt。根据局部读段覆盖率定制Ng窗口的大小将在覆盖率低的区域(例如,重复区域)中创建大窗口,或在表现出体细胞扩增的区域中创建小窗口,从而提高扩增子的基因组分辨率并且增强我们定义扩增的边界的能力。更详细的程序描述于美国专利号9,824,181中,将其通过引用而并入。

设想到了等位基因特异性拷贝数用于鉴定表现出杂合性丢失(拷贝中性和拷贝丢失)以及特异于单个等位基因的扩增或缺失的基因组区域。这最后一点对于帮助区分潜在地引起疾病的等位基因尤其重要,因为那些等位基因在肿瘤序列数据中被扩增或未被缺失。此外,经历半合子丢失的区域(例如,一条亲本染色体臂)可以用于直接估计在测序的肿瘤样品中正常污染物的量。

图3A-图3C示出了CYP2D6(外显子1-9)和CYP2D7(外显子1-9)的各个外显子的拷贝数(显示为读段覆盖率或读段数)的示例图。如图所示,在具有正常等位基因基因型(*1/*41),而在CYP2D6和CYP2D7的外显子中无缺失或扩增的样品NA17234中,拷贝数的平均数约为30,并且标准偏差为±10(图3A)。相比之下,在样品NA17244中,拷贝数的平均数增加到40以上,这表明在CYP2D6和CYP2D7中的一些外显子中存在扩增(图3B)。具体而言,例如,与样品NA17244的拷贝数相比,CYP2D6的外显子6、外显子8以及CYP2D7的外显子4和外显子9显示的拷贝数增加了50%-100%,这表明那些外显子的等位基因之一可能被扩增。另外,在样品NA17235中,拷贝数的平均数减少至约20,这表明在CYP2D6和CYP2D7中的一些外显子中可能存在缺失(图3C)。具体而言,例如,CYP2D6的外显子1和外显子2显示减少正常基因型(NA17244)的一半左右的拷贝数,这表明那些外显子的等位基因之一可能被缺失。

这样获得的RNA定相信息和基因组学拷贝数信息可以一起用于鉴定在肿瘤和/或健康组织中的差异等位基因单倍型。例如,对于每个健康组织和肿瘤组织,可以如上所述使用RNA定相来鉴定和确定与多个单核苷酸变异相关的等位基因单倍型。另外,通过分析每个外显子的全基因组拷贝数或外显子组拷贝数,可以鉴定和确定在一部分外显子的一个或多个中的与扩增和/或缺失相关的等位基因单倍型。

诸位发明人进一步设想到了这样鉴定的等位基因单倍型可以与特定药物在特定癌症中的效力和/或毒性相关。例如,CYP2D6酶催化许多临床上重要的药物(包括癌症药物和阿片类药物)的代谢。关于CYP2D6酶的活性(例如,正常功能、降低的功能、无功能等),已经鉴定出具有单核苷酸变异和/或缺失的不同组合的多个等位基因。预期在CYP2D6基因包括引起CYP2D6酶功能降低或无功能的单倍型的情况下,由于癌症药物可能被更缓慢地催化,该癌症药物或疗法可能对组织具有增加的毒性。由癌症药物导致的此种增加的毒性可能对健康组织、尤其是对代谢全身循环药物的肝脏组织产生有害影响。相反,预期在CYP2D6基因包括引起CYP2D6酶的功能增强的单倍型的情况下(例如,由于基因的扩增和产生的多种正常功能酶),由于癌症药物可能被催化得太快,该癌症药物或疗法可能具有降低的效力。

另外,诸位发明人还设想到了可以通过比较和/或分析患者的肿瘤组织和健康组织的等位基因单倍型来评估特定药物在特定癌症中的效力和/或毒性。例如,肿瘤组织可以具有与健康组织相比具有一种或多种不同单倍型的基因(例如,单核苷酸变异和/或外显子的扩增或缺失的不同组合等),其可能导致对药物的反应不同或由于暴露于药物的毒性不同。

因此,可以从患者的基因的确定的等位基因单倍型和等位基因单倍型的组合中估计、计算和/或推断用于治疗患者的特定类型的癌症的癌症药物或疗法的总体效力和/或毒性。最典型地,从患者组学数据的途径分析中,可以选择可能对治疗患者的癌症具有积极结果的几种癌症治疗或癌症药物。然后,基于所选择的癌症治疗和/或药物,可以选择与对所选择的癌症治疗和/或药物的敏感性、效力和/或由所选择的癌症治疗和/或药物导致的毒性相关的一个或多个基因进行单倍型分析。使用RNA定相和基因组学拷贝数分析的单倍型分析可以确定所选择的基因的每个等位基因的单倍型,并且关于对所选择的癌症治疗和/或药物的敏感性、效力和/或由所选择的癌症治疗和/或药物导致的毒性,可以为每个等位基因的每种单倍型分配或提供可量化的得分或值。例如,在患者的CYP2D6基因具有两个等位基因的情况下:一个与降低的酶功能相关,并且另一个与正常的酶功能相关,与降低的酶功能相关的等位基因可以比与正常的酶功能相关的等位基因具有更低的估值得分。另外地,在与正常的酶功能相关的等位基因被扩增的情况下,则可以为此个等位基因分配比与降低的酶功能相关的等位基因甚至更高的得分。可以将来自每个等位基因的得分组合或合并在一起,以计算关于对所选择的癌症治疗和/或药物的敏感性、效力和/或由所选择的癌症治疗和/或药物导致的毒性,该基因的总体得分。因此,应当理解,根据反应的类型(敏感性、效力和/或毒性)、癌症治疗和/或药物的类型和/或癌症的类型,为等位基因的单倍型分配的得分对于同一基因而言可能不同。

在一些实施例中,可以将从健康组织和肿瘤组织中的基因的等位基因计算出的得分进行比较,以计算该基因对治疗的最佳得分。例如,在健康组织中该基因的等位基因与毒性的高风险相关,而肿瘤组织中该基因的等位基因与癌症药物的低效力相关的情况下,则该基因对癌症药物的最佳得分将作为对于健康组织的高毒性的低得分(或甚至负得分)和对肿瘤组织的低效力的低得分的组合(例如,两个得分之和)变低。

诸位发明人进一步设想到了,基于等位基因单倍型信息,尤其是基因的每个等位基因的得分、具有异质等位基因的基因的得分或与癌症药物效力和/或毒性相关的基因的最佳得分,可以产生或更新患者的记录,可以推荐新的治疗计划,或可以更新以前使用的治疗计划。例如,在与癌症药物效力和/或毒性相关的基因的最佳得分低(表明对健康组织可能具有高毒性而对肿瘤组织没有理想的作用量)的情况下则可以用等位基因信息和/或基于等位基因信息计算出的得分更新患者的记录,并且为了避免此种治疗或癌症药物对患者的潜在不良反应,不管是否具有预期的结果和副作用,任选地建议不要为患者使用此种治疗或癌症药物。

在一些实施例中,基于等位基因单倍型信息,尤其是基因的每个等位基因的得分、具有异质等位基因的基因的得分或与癌症药物效力和/或毒性相关的基因的最佳得分,可以调整或修改患者的治疗方案。例如,在与癌症药物效力和/或毒性相关的基因的最佳得分中等(表明用该癌症药物***细胞有可能成功,但是对健康组织可能具有高毒性)的情况下,可以改变给予癌症药物的剂量和/或时间表(例如,较小剂量以降低对健康组织的毒性和/或在减少给予药物的频率(例如,每天一次而不是每天两次等)、使用相同剂量的药物进行更频繁的给予时间表以克服药物的快速代谢等)。

可替代地和/或另外地,可以基于等位基因单倍型信息,尤其是基因的每个等位基因的得分、具有异质等位基因的基因的得分或与癌症药物效力和/或毒性相关的基因的最佳得分,改变同一癌症药物的治疗方法。例如,在与癌症药物效力和/或毒性相关的基因的最佳得分中等(表明用该癌症药物***细胞有可能成功,但是对健康组织可能具有高毒性)的情况下,为了最小化在癌症药物到达肿瘤之前健康组织对癌症药物的暴露,可能建议可以将向患者给予癌症药物的方法从全身给药(例如,静脉内注射等)变为局部给药(例如,肿瘤内注射)。

应当理解,本发明主题使用综合途径分析,该综合途径分析使用多种类型的组学数据以鉴定在成功***中具有高可能性的癌症治疗或癌症药物。此外,本发明主题使用对携带等位基因特异性单核苷酸变异和/或扩增/缺失的异质等位基因的一种或多种等位基因单倍型的综合途径分析,该综合途径分析使用RNA-seq定相和DNA拷贝数分析以便以患者特异性方式预测癌症治疗的效力和/或毒性。因此,此方法允许简化癌症治疗方案的定制,以最大化效力,同时避免癌症治疗的任何不良反应,包括可能的致命的副作用。

对于本领域技术人员应当清楚的是,在不脱离本文的发明构思的情况下,除了已经描述的那些之外的更多修改是可能的。因此,除了在所附权利要求的范围中之外,本发明主题不受限制。此外,在解释说明书和权利要求书时,所有术语应当以与上下文一致的尽可能广泛的方式解释。特别地,术语“包含(comprises)”和“包含(comprising)”应当被解释为以非排他性方式指代元素、组件或步骤,从而指示所提及的元素、组件或步骤可以与未明确提及的其他元素、组件或步骤一起存在、或使用、或组合。在说明书权利要求书涉及选自由A、B、C……和N组成的组中的至少一种的情况下,该文字应当被解释为只需要该组中的一个元素,而不是A加N、或B加N等。

权利要求书(按照条约第19条的修改)

1.一种减轻癌症疗法在患有肿瘤的患者中的不良反应的方法,该方法包括:

获得该患者的转录组学数据,该转录组学数据包含从基因转录的RNA分子的第一和第二基因座的等位基因分数信息,其中该第一和第二基因座分别具有第一和第二单核苷酸变异;

使用等位基因分数信息以重构该第一和第二基因座的单倍型;以及

用与该癌症疗法的预期效力相关的重构的单倍型产生或更新该患者的记录。

2.如权利要求1所述的方法,其中该第一和第二基因座的等位基因分数信息源自该患者的肿瘤。

3.如前述权利要求中任一项所述的方法,其中该基因是CYP3A5、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15中的至少一种。

4.如前述权利要求中任一项所述的方法,其中该第一和第二基因座相距至少300bp。

5.如前述权利要求中任一项所述的方法,当具有该第一和第二核苷酸变异的第一和第二基因座的等位基因分数相差大于10%时,将该单倍型重构为在该基因的等位基因中具有该第一和第二核苷酸变异。

6.如前述权利要求中任一项所述的方法,其中该基因是CYP2D6,并且该预期效力包含由于该癌症疗法的缓慢代谢导致的该癌症疗法的毒性增加。

7.如前述权利要求中任一项所述的方法,其中该转录组学数据包含该第一和第二基因座的拷贝数,并且该方法还包括:

确定第一和第二基因座中至少一个的扩增;以及

用与癌症疗法的预期效力相关的基因的扩增信息产生或更新该患者的记录。

8.如权利要求7所述的方法,其中该基因是CYP2D6,并且癌症疗法的该预期效力包含由于该癌症疗法的快速代谢导致的该癌症疗法的效力降低。

9.如前述权利要求中任一项所述的方法,该方法还包括基于该预期效力调整该癌症疗法的推荐剂量和时间表。

10.如权利要求2-9中任一项所述的方法,其中该转录组学数据还包含源自该患者的健康组织的该第一和第二基因座的等位基因分数信息。

11.如权利要求10所述的方法,该方法还包括:

使用源自该健康组织的等位基因分数信息以重构健康组织单倍型;

将源自该肿瘤组织的等位基因分数信息与源自该健康组织的等位基因分数信息进行比较以获得肿瘤特异性等位基因分数信息;以及

用该等位基因分数信息和该肿瘤特异性等位基因分数信息产生或更新该患者的记录。

12.如权利要求10所述的方法,该方法还包括基于重构的健康组织单倍型和该肿瘤特异性单倍型的比较来调整该癌症疗法的推荐剂量和时间表。

13.如前述权利要求中任一项所述的方法,其中通过使用该患者的基因组学、转录组学和蛋白质组学数据中的至少两种的途径分析来鉴定该癌症疗法。

14.如权利要求1所述的方法,其中该基因是CYP3A5、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15中的至少一种。

15.如权利要求1所述的方法,其中该第一和第二RNA基因座相距至少300bp。

16.如权利要求1所述的方法,当具有该第一和第二核苷酸变异的第一和第二基因座的等位基因分数相差小于10%时,将该单倍型重构为在该基因的等位基因中具有该第一和第二核苷酸变异。

17.如权利要求1所述的方法,其中该基因是CYP2D6,并且该预期效力包含由于该癌症疗法的缓慢代谢导致的该癌症疗法的毒性增加。

18.如权利要求1所述的方法,其中该转录组学数据包含该第一和第二RNA基因座的拷贝数,并且该方法还包括:

确定第一和第二RNA基因座中至少一个的扩增;以及

用与癌症疗法的预期效力相关的基因的扩增信息产生或更新该患者的记录。

19.如权利要求18所述的方法,其中该基因是CYP2D6,并且癌症疗法的该预期效力包含由于该癌症疗法的快速代谢导致的该癌症疗法的效力降低。

20.如权利要求1所述的方法,该方法还包括基于该预期效力调整该癌症疗法的推荐剂量和时间表。

21.如权利要求2所述的方法,其中该转录组学数据还包含源自该患者的健康组织的该第一和第二RNA基因座的等位基因分数信息。

22.如权利要求21所述的方法,该方法还包括:

使用源自该健康组织的等位基因分数信息以重构健康组织单倍型;

将源自该肿瘤组织的等位基因分数信息与源自该健康组织的等位基因分数信息进行比较以获得肿瘤特异性等位基因分数信息;以及

用该等位基因分数信息和该肿瘤特异性等位基因分数信息产生或更新该患者的记录。

23.如权利要求22所述的方法,该方法还包括基于重构的健康组织单倍型和该肿瘤特异性单倍型的比较来调整该癌症疗法的推荐剂量和时间表。

24.如权利要求1所述的方法,其中通过使用该患者的基因组学、转录组学和蛋白质组学数据中的至少两种的途径分析来鉴定该癌症疗法。

25.一种治疗患有肿瘤的患者的方法,该方法包括:

获得该患者的转录组学数据,该转录组学数据包含从基因转录的RNA分子的第一和第二RNA基因座的等位基因分数信息,其中该第一和第二基因座分别具有第一和第二核苷酸变异;

使用等位基因分数信息以重构该第一和第二RNA基因座的单倍型;

针对该单倍型推断癌症疗法的预期效力;以及

基于该预期效力调整该癌症疗法的推荐剂量和时间表。

26.如权利要求25所述的方法,其中该第一和第二基因座的等位基因分数信息源自该患者的肿瘤。

27.如权利要求25-26中任一项所述的方法,其中该基因是CYP3A5、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15中的至少一种。

28.如权利要求25-27中任一项所述的方法,其中该第一和第二RNA基因座相距至少300bp。

29.如权利要求25-28中任一项所述的方法,当具有该第一和第二核苷酸变异的第一和第二基因座的等位基因分数相差小于10%时,将该单倍型重构为在该基因的等位基因中具有该第一和第二核苷酸变异。

30.如权利要求25-29中任一项所述的方法,其中该基因是CYP2D6,并且该预期效力包含由于该癌症疗法的缓慢代谢导致的该癌症疗法的毒性增加。

31.如权利要求25-30中任一项所述的方法,其中该转录组学数据包含该第一和第二RNA基因座的拷贝数,并且该方法还包括:

确定第一和第二RNA基因座中至少一个的扩增;以及

使用与癌症疗法的预期效力相关的基因的扩增信息调整该癌症疗法的推荐剂量和时间表。

32.如权利要求31所述的方法,其中该基因是CYP2D6,并且癌症疗法的该预期效力包含由于该癌症疗法的快速代谢导致的该癌症疗法的效力降低。

33.如权利要求25-32中任一项所述的方法,该方法还包括用与该癌症疗法的预期效力相关的重构的单倍型产生或更新该患者的记录。

34.如权利要求25-33中任一项所述的方法,其中该转录组学数据还包含源自该患者的健康组织的该第一和第二RNA基因座的等位基因分数信息。

35.如权利要求34所述的方法,该方法还包括:

使用源自该健康组织的等位基因分数信息以重构健康组织单倍型;

将源自该肿瘤组织的等位基因分数信息与源自该健康组织的等位基因分数信息进行比较以获得肿瘤特异性等位基因分数信息;以及

使用该等位基因分数信息和该肿瘤特异性等位基因分数信息调整该癌症疗法的推荐剂量和时间表。

36.如权利要求35所述的方法,该方法还包括基于重构的健康组织单倍型和该肿瘤特异性单倍型的比较来调整该癌症疗法的推荐剂量和时间表。

37.如权利要求25-36中任一项所述的方法,其中通过使用该患者的基因组学、转录组学和蛋白质组学数据中的至少两种的途径分析来鉴定该癌症疗法。

38.如权利要求25所述的方法,其中该基因是CYP3A5、CYP2D6、TPMT、F5、DPYD、G6PD和NUDT15中的至少一种。

39.如权利要求25所述的方法,其中该第一和第二RNA基因座相距至少300bp。

40.如权利要求25所述的方法,当具有该第一和第二核苷酸变异的第一和第二基因座的等位基因分数相差小于10%时,将该单倍型重构为在该基因的等位基因中具有该第一和第二核苷酸变异。

41.如权利要求25所述的方法,其中该基因是CYP2D6,并且该预期效力包含由于该癌症疗法的缓慢代谢导致的该癌症疗法的毒性增加。

42.如权利要求25所述的方法,其中该转录组学数据包含该第一和第二RNA基因座的拷贝数,并且该方法还包括:

确定第一和第二RNA基因座中至少一个的扩增;以及

用与癌症疗法的预期效力相关的基因的扩增信息产生或更新该患者的记录。

43.如权利要求42所述的方法,其中该基因是CYP2D6,并且癌症疗法的该预期效力包含由于该癌症疗法的快速代谢导致的该癌症疗法的效力降低。

44.如权利要求25所述的方法,该方法还包括用与该癌症疗法的预期效力相关的重构的单倍型产生或更新该患者的记录。

45.如权利要求25所述的方法,其中该转录组学数据还包含源自该患者的健康组织的该第一和第二RNA基因座的等位基因分数信息。

46.如权利要求45所述的方法,该方法还包括:

使用源自该健康组织的等位基因分数信息以重构健康组织单倍型;

将源自该肿瘤组织的等位基因分数信息与源自该健康组织的等位基因分数信息进行比较以获得肿瘤特异性等位基因分数信息;以及

基于重构的健康组织单倍型和该肿瘤特异性单倍型的比较来调整该癌症疗法的推荐剂量和时间表。

47.如权利要求40所述的方法,该方法还包括用该等位基因分数信息和该肿瘤特异性等位基因分数信息产生或更新该患者的记录。

48.如权利要求25所述的方法,其中通过使用该患者的基因组学、转录组学和蛋白质组学数据中的至少两种的途径分析来鉴定该癌症疗法。

34页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于检测循环肿瘤DNA的组合物和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!