铁死亡模型构建方法与应用

文档序号:1955241 发布日期:2021-12-10 浏览:13次 >En<

阅读说明:本技术 铁死亡模型构建方法与应用 (Iron death model construction method and application ) 是由 王芬 肖士郎 刘晓明 袁玲芝 于 2021-09-18 设计创作,主要内容包括:本发明属于人工智能技术应用领域,具体涉及铁死亡模型构建方法与应用。具体包括:采用现有基因表达数据库和铁死亡调控分子,筛选出多个表达水平变化大的铁死亡调控分子,采用共识聚类方法将胃癌进行分型;将胃癌亚型之间进行基因表达差异分析,获得差异表达基因;采用单基因Cox回归分析从差异表达基因中筛选出生存预后相关差异基因及其回归系数,获取待分析患者的生存相关差异基因i,统计生存相关差异基因i的表达量Exp-(i),并根据生存相关差异基因i对应的回归系数beta-(i),构建铁死亡模型为:铁死亡分数=∑-(i)beta-(i)*Exp-(i)。该铁死亡评分能很好的预测胃癌患者的生存预后、化疗药物敏感性及免疫治疗疗效。(The invention belongs to the field of artificial intelligence technology application, and particularly relates to a construction method and application of an iron death model. The method specifically comprises the following steps: screening a plurality of iron death regulatory molecules with large expression level change by adopting the existing gene expression database and the iron death regulatory molecules, and typing the gastric cancer by adopting a consensus clustering method; carrying out gene expression differential analysis among gastric cancer subtypes to obtain differential expression genes; screening survival prognosis related differential genes and regression coefficients thereof from the differential expression genes by adopting single-gene Cox regression analysis, obtaining survival related differential genes i of a patient to be analyzed, and counting the expression quantity Exp of the survival related differential genes i i And according to regression coefficient beta corresponding to survival related difference gene i i The iron death model is constructed as follows: iron death fraction ═ Σ i beta i *Exp i . The iron dieThe death score can well predict the survival prognosis, the chemotherapy drug sensitivity and the immunotherapy curative effect of the gastric cancer patient.)

铁死亡模型构建方法与应用

技术领域

本发明属于人工智能技术应用领域,具体涉及铁死亡模型构建方法,所述铁死亡模型用用预测胃癌患者的生存预后、化疗药物敏感性及免疫治疗疗效。

背景技术

胃癌是全球排名前10位的恶性肿瘤,每年有超过100万新诊断病例。由于诊断和治疗的不及时,胃癌是第三大最常见癌症死亡原因,每年约有78000 胃癌患者死亡。特别对于胃癌晚期及发生远处转移的患者,无论其接受何种治疗,5年总生存率仅5%,中位生存期不到1年。并且由于肿瘤细胞的遗传高度异质性以及肿瘤微环境的动态变化,胃癌患者对化疗药物的敏感性也存在明显的差异,因此如何对胃癌患者实现精准治疗已经成为研究的热点。

目前仍仅有三种生物标志物被证明可以预测胃癌患者靶向治疗的治疗反应:HER2阳性患者对曲妥珠单抗敏感、处于微卫星不稳定性(MSI)状态或 PD-L1高度表达患者对帕博利珠单抗敏感。因此,鉴定新的生物标志物来预测胃癌患者的个体预后及治疗反应具有重要的临床意义。目前大量研究已表明铁死亡参与了胃癌多种生物学行为,如增殖、转移、细胞干性,药物敏感性。铁死亡是一个复杂的生物学过程,受到多种分子的调控,而调控分子之间也存在着相互作用。因此,铁死亡调控分子表达模式的差异决定了不同肿瘤组织的铁死亡状态,进而造成了肿瘤生物学行为的差异。但是目前并没有任何研究利用铁死亡调控分子的相关信息用于对胃癌治疗进行预测。

发明内容

基于此,针对上述问题,本发明根据铁死亡调控分子表达模式对胃癌患者进行分型,并依靠铁死亡亚型建立生物学标志物:铁死亡评分,用于预测胃癌患者的生存预后及对化疗药物敏感性。

基于上述目的,本发明提供了一种铁死亡模型构建方法,所述构建方法具体包括:

获取多个胃癌队列的基因表达芯片数据并进行预处理后进行合并,获得合并队列数据;并从所述合并队列数据中筛选出多个表达水平变化大的铁死亡调控分子;

根据筛选出来的铁死亡调控分子的表达量,采用共识聚类方法将胃癌队列分成3种胃癌亚型;

将胃癌队列中的胃癌亚型之间进行基因表达差异分析,获得差异表达基因;

采用单基因Cox回归分析从所述差异表达基因中筛选出生存预后相关差异基因数据库,所述生存预后相关差异基因数据库包括生存预后相关差异基因及其回归系数;

获取待分析患者的生存相关差异基因i,统计所述生存相关差异基因i的表达量,并根据所述生存预后相关差异基因数据库中生存相关差异基因i对应的回归系数betai,构建铁死亡模型为:

铁死亡分数=∑ibetai*Expi

进一步的,所述获取多个胃癌队列的基因表达芯片数据并进行预处理后进行合并步骤中的预处理具体包括:

将获取的多个胃癌队列基因表达芯片数据利用“affy”(R包)的背景调整及分数归一化进行数据标准化,并通过“sva”(R包)的“combat”算法去除队列之间的批次效应。

进一步的,所述从所述合并队列数据中筛选出多个表达水平变化大的铁死亡调控分子步骤具体包括:

获取已报道的铁死亡调控分子,以绝对中位差≥1为界限,筛选出多个在合并队列数据中表达水平变化大的铁死亡调控分子。

基于上述发明构思的,利用上述方法构建的铁死亡模型在预测生存预后中的应用。

基于上述发明构思的,利用上述方法构建的铁死亡模型在预测胃癌患者药物敏感性及免疫治疗效果中的应用。

有益效果:

本发明利用现有胃癌队列基因表达数据以及铁死亡调控分子,从中筛选出表达水平变化大的铁死亡调控分子,并根据其表达量进行聚类,将胃癌队列分成三种亚型,再将不同亚型进行基因表达差异分析,获得多个差异表达基因,然后采用单基因Cox回归分析筛选出生存预后相关的差异基因及其回归系数,针对于待分析的胃癌患者时,获取其生存预后相关差异基因,并统计其表达量,计算铁死亡评分。通过验证分析,铁死亡评分是胃癌患者的地理生存预后因素,可以很好的预测胃癌患者的总体生存率;且铁死亡评分能够有效预测癌症患者的药物敏感性及免疫治疗效果。该方法无需对患者进行任何创伤性的检测,只需要进行基因分析,计算相应的铁死亡评分,就能够实现生存率、药物敏感性以及免疫治疗效果的预测,实现了智能化预测。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的铁死亡模型构建方法的流程图;

图2为本发明实施例提供的胃癌队列的三种亚型图以及不同亚型的主成分分析图;

图3为本发明实施例提供的不同亚型的生存预后率和不同亚型的通路富集情况;

图4为本发明实施例提供的亚型之间进行差异分析的韦恩图、不同铁死亡评分亚型之间的生存差异分析图、不同铁死亡评分组中胃癌亚型的组成、肿瘤相关通路与铁死亡评分的相关性;

图5为本发明实施例提供的单基因Cox回归分析图、铁死亡评分的时间依赖性ROC曲线、胃癌不同分期的铁死亡评分分布图、已有转移灶病人与未发生转移的病人之间铁死亡评分比较;

图6为本发明实施例提供的分别在GSE34942、GSE57303、GSE14549、合并的GEO胃癌队列及TCGA-STAD队列中,对不同铁死亡评分的患者进行生存分析、在GSE62254胃癌队列中,不同铁死亡评分亚组之间无进展生存时间差异、在TCGA-STAD队列中进行基因Cox回归分析;

图7为本发明实施例提供的药物敏感性(IC50)与铁死亡评分之间的相关性、与铁死亡评分相关的药物所靶向针对的通路;

图8为本发明实施例提供的免疫检查点分子(A)及免疫治疗相关通路 (B)在高低铁死亡评分组中的表达差异、在免疫治疗队列中,不同铁死亡评分组的生存差异在免疫治疗队列中,不同免疫治疗反应组中铁死亡评分的比较、高低铁死亡评分组中不同临床反应亚组的组成情况。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如图1所示,在本发明实施例中,提出了一种铁死亡模型构建方法,所述构建方法具体包括:

步骤S101,获取多个胃癌队列的基因表达芯片数据并进行预处理后进行合并,获得合并队列数据;并从所述合并队列数据中筛选出多个表达水平变化大的铁死亡调控分子。

在本发明实施例中,从GEO数据库中获取GSE14549、GSE34942、 GSE57303、GSE62254等四个胃癌队列的基因表达芯片数据,并利用“affy” (R包)的背景调整及分数归一化功能对其进行数据标准化,然后通过“sva” (R包)的“combat”算法去除队列之间的批次效应,将上述胃癌队列合并 (合并的GEO队列);然后从Ferrdb数据库中获得已报道的铁死亡调控分子,并以绝对中位差≥1为界限,选出36个在合并GEO队列中表达水平变化大的铁死亡调控分子。

步骤S102,根据筛选出来的铁死亡调控分子的表达量,采用共识聚类方法将胃癌队列分成3种胃癌亚型。

在本发明实施例中,常见的聚类方法包括层次聚类、划分聚类和共识聚类。其中共识聚类依赖于所选聚类算法对数据子集的多次迭代,相比于前两种聚类方法,共识聚类可以直接通过视觉指标来评价聚类的稳定性及参数选择。本发明根据36个铁死亡调控分子表达量,使用共识聚类算法(Consensus Clustering)将胃癌队列分为三种亚型1-3(详见图2-A)

在本发明实施例中,对三种亚型进行主成分分析,所述主成分分析是一种降维统计学方法,其借助于正交转换,将原来的变量转换为若干个互不相干的新随机变量(主成分),其中每个随机变量为原先变量的线性组合。主成分的方差越大代表其包含的信息越丰富,能更好的区分样本之间的差异。根据方差的大小,我们人为的将其分为第一主成分、第二主成分等等。在实际数据分析过程中,我们常借助主成分分析将多个变量(>3)转换为主成分,并根据前两个主成分,分析样本在二维平面的分布情况,进一步了解各样本在主分量中的地位及大致分类情况。在本发明中借助于“FactoMineR”及“factoextra”(R包)对这36个铁死亡调控分子(变量)进行主成分分析,并画出胃癌样本在二维平面的分布情况。分布图2-B结果显示:同一亚型样本聚在一起,并且不同亚型的样本显著分开,这提示每种亚型有着特定的铁死亡调控分子表达模式。

在本发明实施例中,对三种亚型之间的生物学行为差异进行分析:对不同亚型的生存差异进行log-rank检验,其结果为相对于1、3亚型,亚型2有更差的生存预后(图3-A),说明基于铁死亡建立的未死亡亚型具有临床意义。接着通过GSVA富集分析比较肿瘤相关通路在各亚型中的富集情况:发现众多致癌通路及基质活化通路如WNT通路、MAPK通路、TGF-β通路及粘着斑(focal adhension)通路在亚型2中发生显著富集,而DNA破坏修复相关通路及能量代谢相关通路分别在亚型1和亚型3中显著活化(图3B-C)。

步骤S103,将胃癌队列中的胃癌亚型之间进行基因表达差异分析,获得差异表达基因。

在本发明实施例中,由于GSE62254胃癌队列有最全面的临床资料,我们选择其作为训练集,其余GEO胃癌队列和TCGA-STAD队列作为验证集。首先,我们借助“limma”(R包)在胃癌亚型两两之间进行基因表达的差异分析,以调整后的p值<0.001为阈值,挑选出差异表达基因。然后取三次表达差异分析结果(差异表达基因)的交集作接下来的分析,最终总共有933个基因用于下游铁死亡评分的建立(图4-A)。

步骤S104,采用单基因Cox回归分析从所述差异表达基因中筛选出生存预后相关差异基因数据库,所述生存预后相关差异基因数据库包括生存预后相关差异基因及其回归系数。

在本发明实施例中,所述单基因Cox比例风险模型是常用与医学研究中的回归模型,通常用于研究预测变量与生存时间的关系,通过单基因Cox回归分析,以p<0.001为阈值,进一步筛选出与患者生存预后相关的差异基因,并获得生存预后相关差异基因的回归系数值(beta值),所述beta值可以衡量变量对患者生存的影响力,beta值越大患者的死亡风险越高。

步骤S105,获取待分析患者的生存相关差异基因i,统计所述生存相关差异基因i的表达量,并根据所述生存预后相关差异基因数据库中生存相关差异基因i对应的回归系数betai,构建铁死亡模型为:

铁死亡分数=∑ibetai*Expi 公式(1)

在本发明实施例中,当对患者进行分析时,首先对患者进行基因分析,获取胃癌患者的生存相关差异基因i,并统计上述基因的表达量,并从生存预后相关差异基因数据库中获取与生存相关差异基因i对应的回归系数betai,采用公式(1)计算铁死亡评分。

在本发明实施例中,对GSE62254胃癌队列中的不同患者进行铁死亡评分的计算,并统计其生存预后,如图4-B:高铁死亡评分的患者有着更差的生存预后。本研究根据“survminer”R包的“surv-cutpoint”功能确定铁死亡分数的截断值,并根据截断值将GSE62254胃癌队列患者分为高风险组(高铁死亡评分)及低风险组(低铁死亡评分)。高风险组的患者几乎都是亚型2,而低风险组的患者主要由亚型1和亚型3组成(图4-C)。通过对肿瘤相关通路与铁死亡评分的相关性分析,发现铁死亡评分与富集于亚型2的信号通路 (如间充质转变通路、MAPK通路、血管生成通路等)呈显著的正相关关系,而与富集于亚型1/3的通路呈显著的负相关关系(图4-D),说明铁死亡评分能够很好的反映三个胃癌亚型的生物学特点,能够帮助我们快速精准的判断胃癌亚型。

铁死亡评分的应用实例:

实施例1

铁死亡评分与胃癌患者临床病例参数的相关性:

在本发明中,通过多因素Cox回归分析也证实低铁死亡评分是胃癌患者的独立生存预后因素(风险比:0.376195%置信区间(0.2467-0.5733))如图 5-A。进一步通过时间依赖性的ROC曲线来判断铁死亡分数对胃癌患者生存的预测价值:风险评分对患者1年、3年及5年的总体生存情况预测效率分别为0.65、0.66、0.65(图5-B),结果显示铁死亡评分可以很好的预测胃癌患者总体生存率,相比于低级别胃癌样本(stageI/II),高级别胃癌(stageIII/IV) 样本有更高的铁死亡评分(图5-C),已有转移病灶的胃癌患者也有更高的铁死亡评分(图5-D),由上述结果可知,铁死亡评分对胃癌进展有很好的预测能力。

在GSE34942、GSE57303、GSE14549、合并的GEO胃癌队列及 TCGA-STAD队列,低风险组均有着更好的总体生存时间及临床结局(图 6-A-E)。其次,在GSE62254胃癌队列中,低风险组有更长的无疾病进展期 (图6-F);也在TCGA-STAD队列中也进一步证明低风险评分是独立的生存预后因素(风险比:0.624495%置信区间(0.4413-0.8814))。上述结果均证明了铁死亡评分有可靠生存预测能力(图6-G)。

实施例2

铁死亡评分与癌症患者的药物敏感性及免疫治疗效果的相关性:

在本发明实施例中,从GDSC数据库中下载癌症细胞系芯片表达数据及相应的药敏学数据。其次使用上述提到的铁死亡评分公式,计算每种细胞系的铁死亡评分;然后计算铁死亡评分与药物半数最大抑制浓度(IC50)的 spearman相关系数(图7-A)。在研究中,当|spearman相关系数|≥0.15和p<0.05 时,认为该种药物的抑瘤效果与铁死亡评分相关。当相关系数大于0时,该药物的IC50值随铁死亡评分的增高而降低,这说明高铁死亡评分患者对该药物更敏感,反之则相反。相关性分析结果显示,总共有66种药物的抑瘤效果与铁死亡评分相关,其中27种药物对高铁死亡评分组更有效,39种药物对低评分组更有效。其次对这些药物所靶向的通路进行了总结,分析结果显示:高评分组的患者对针对MAPK信号通路和PI3K/MTOR通路的药物敏感,而低风险组对靶向于组蛋白乙酰化、细胞周期、凋亡、能量代谢等生物学过程的药物敏感(图7-B)。发现在TCGA-STAD队列中,多种免疫检查点分子及免疫治疗相关通路在低铁死亡评分组中高度表达(图8-A、图 8-B)。而目前研究表明免疫检查点的高表达及相关通路高度活化是预测免疫治疗疗效的重要指标,因此也探讨了铁死亡评分对免疫治疗疗效的预测效果:在IMvigor210治疗队列中,高铁死亡评分组有着更差的预后(图8-C),相比于无效组(稳定组(SD),进展组(PD)),免疫治疗有效组(完全缓解组(CR)、部分缓解组(PR)) 有着更低的铁死亡评分,治疗有效的患者也相对集中在低铁死亡评分组(图 8-D、图 8-E)。由上述结果可知:低评分组对免疫治疗更敏感,铁死亡评分可以有效的预测免疫治疗效果。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种判断二代测序检测基因编辑结果可信度的方法及应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!