一种胆囊癌患者放化疗后生存获益的预测模型建立方法

文档序号:170978 发布日期:2021-10-29 浏览:24次 >En<

阅读说明:本技术 一种胆囊癌患者放化疗后生存获益的预测模型建立方法 (Establishment method of prediction model for survival benefit of gallbladder cancer patient after radiotherapy and chemotherapy ) 是由 刘厚宝 万文泽 倪小健 于 2021-08-23 设计创作,主要内容包括:本发明涉及一种胆囊癌患者放化疗后生存获益的预测模型建立方法,包括获取胆囊癌患者的临床和病理数据;按照TNM分期将获取的数据划分为若干组数据,分别判断各期患者是否从辅助治疗中获益;将对应TNM分期的数据分为建模组和内部验证组;通过单因素COX风险比例模型分析建模组数据的临床、病理变量对总生存时间OS的预测能力,筛选出显著影响建模组患者总生存时间OS的风险因素;将筛选出的风险因素纳入多因素COX风险比例模型分析,筛选出显著影响患者总生存时间OS的影响变量;根据获得的影响变量,绘制用于预测总生存时间OS的列线图,获得预测模型;对模型进行验证。与现有技术相比,本发明具有为GBC患者提供可信的预测与分析结果、操作简便等优点。(The invention relates to a method for establishing a prediction model for survival benefit of a gallbladder cancer patient after radiotherapy and chemotherapy, which comprises the steps of obtaining clinical and pathological data of the gallbladder cancer patient; dividing the acquired data into a plurality of groups of data according to the TNM stages, and respectively judging whether the patients in each stage benefit from the auxiliary treatment; dividing data corresponding to the TNM stages into a building module and an internal verification group; analyzing the prediction capability of clinical and pathological variables of the modeling group data on the total survival time OS through a single-factor COX risk proportion model, and screening out risk factors which obviously influence the total survival time OS of patients in the modeling group; bringing the screened risk factors into multi-factor COX risk proportion model analysis, and screening influence variables which obviously influence the total survival time OS of the patient; drawing a nomogram for predicting the total survival time OS according to the obtained influence variables to obtain a prediction model; and verifying the model. Compared with the prior art, the method has the advantages of providing credible prediction and analysis results for GBC patients, being simple and convenient to operate and the like.)

一种胆囊癌患者放化疗后生存获益的预测模型建立方法

技术领域

本发明涉及预后评价技术领域,尤其是涉及一种胆囊癌患者放化疗后生存获益的预测模型建立方法。

背景技术

胆囊癌(GBC)是胃肠道肿瘤中发病率第五的肿瘤,年发病率为每10万人2至27人。尽管相对少见,但GBC是胆道最具侵袭性的恶性肿瘤,5年生存率约为5%。手术切除是治疗GBC的唯一方法。但完全切除后的复发率高,往往导致不良预后。因此,术后化疗、化疗联合放疗等辅助治疗被应用于GBC患者,以改善患者预后。

但由于GBC发病率较低,GBC辅助治疗指征及术后化疗、化疗联合放疗疗效差异尚存争议。目前,现有技术中对术后化疗、化疗联合放疗的疗效差异缺乏深入研究,目前尚无较好方法预测GBC患者接受化疗或化疗联合放疗的预后,无法对预后进行可靠分析。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种为GBC患者提供可信的预测与分析结果、操作简便的胆囊癌患者放化疗后生存获益的预测模型建立方法。

本发明的目的可以通过以下技术方案来实现:

一种胆囊癌患者放化疗后生存获益的预测模型建立方法,所述的预测模型建立方法为:

步骤1:获取胆囊癌患者的临床和病理数据;

步骤2:按照TNM分期将步骤1获取的数据划分为若干组数据,并比较若干组数据对应的TNM分析患者接受不同辅助治疗后的生存差异,分别判断各期患者是否从辅助治疗中获益,若对应的TNM分期患者可以从辅助治疗中获益,则执行步骤3,否则,直接输出该期患者无法从辅助治疗中获益;

步骤3:按照步骤2获得的结果,将步骤1中的对应TNM分期的数据分为建模组和内部验证组;

步骤4:通过单因素COX风险比例模型分析建模组数据的临床、病理变量对总生存时间OS的预测能力,筛选出显著影响建模组患者总生存时间OS的风险因素;

步骤5:将步骤4筛选出的风险因素纳入多因素COX风险比例模型分析,筛选出显著影响患者总生存时间OS的影响变量;

步骤6:根据步骤5获得的影响变量,绘制用于预测总生存时间OS的列线图,获得预测模型;

步骤7:对模型进行验证。

优选地,所述的步骤1中胆囊癌患者的临床和病理数据包括:患者的性别、年龄、肿瘤分化程度、TNM分期、手术方式、清扫淋巴结个数、术后辅助治疗方式以及总生存时间OS;所述的手术方式包括无辅助治疗NCRT、化疗CT合格化疗联合放疗CRT。

更加优选地,所述的步骤2具体为:

步骤2-1:按照TNM分期,将步骤1中的数据划分为若干组数据;

步骤2-2:采用广义增强模型GBM计算倾向评分PS;

步骤2-3:采用倾向评分PS对各组数据进行逆概率加权IPTW;

步骤2-4:比较IPTW加权前后各组变量差异;

步骤2-5:通过Kaplan-Meier法对IPTW加权前后的样本进行生存分析,判断各期患者是否从辅助治疗中获益,若对应的TNM分期患者可以从辅助治疗中获益,则执行步骤3,否则,直接输出该期患者无法从辅助治疗中获益。

更加优选地,所述步骤2-3中进行逆概率加权IPTW时样本的权重为倾向评分的倒数,即:

其中,w为样本权重,PS为样本的倾向评分。

更加优选地,所述步骤2-4中采用绝对标准差异比较IPTW加权前后各组变量的差异;所述的绝对标准差异的计算方法为:

其中,Ptreat为处理组相应参数值;Pcontrol为对照组相应参数值。

更加优选地,所述的步骤2-5还包括:采用log-rank检验比较生存曲线的差异。

优选地,所述的步骤4具体为:

通过单因素COX风险比例模型分析建模组数据的临床、病理变量对总生存时间OS的预测能力,筛选出分析结果中p<0.05的因素作为显著影响建模组患者总生存时间OS的风险因素。

优选地,所述的步骤5具体为:

将步骤4筛选出的风险因素纳入多因素COX风险比例模型分析,筛选出分析结果中p<0.05的变量作为显著影响患者总生存时间OS的影响变量。

优选地,所述的步骤3还包括:在将步骤1中的对应TNM分期的数据分为建模组和内部验证组的同时获取外部验证组。

更加优选地,所述的步骤7具体为:

使用内部验证组和外部验证组数据对预测模型进行验证,模型的验证通过C-index指数以及一致性曲线分析完成。

与现有技术相比,本发明具有以下有益效果:

一、为GBC患者提供可信的预测与分析结果:本发明中的胆囊癌患者放化疗后生存获益的预测模型建立方法利用采集患者常规临床病理指标提取特征建模列线图预测模型,结果客观准确,对特定的个体分别进行预测分析,提供可信的预测与分析结果。

二、操作简便:本发明中的胆囊癌患者放化疗后生存获益的预测模型建立方法操作过程简便、直观、易于重复,住院医师均可以完成。

附图说明

图1为本发明中胆囊癌患者放化疗后生存获益的预测模型建立方法的流程示意图;

图2(a)为本发明实施例中II期GBC患者NCRT\CT匹配、加权前后基线指标差异变化图;

图2(b)为本发明实施例中II期GBC患者NCRT\CRT匹配、加权前后基线指标差异变化图;

图2(c)为本发明实施例中II期GBC患者CT\CRT匹配、加权前后基线指标差异变化图;

图3(a)为本发明实施例中II期GBC患者匹配前K-M生存曲线图;

图3(b)为本发明实施例中II期GBC患者匹配后K-M生存曲线图;

图4(a)为本发明实施例中III-IV期GBC患者NCRT\CT匹配、加权前后基线指标差异变化图;

图4(b)为本发明实施例中III-IV期GBC患者NCRT\CRT匹配、加权前后基线指标差异变化图;

图4(c)为本发明实施例中III-IV期GBC患者CT\CRT匹配、加权前后基线指标差异变化图;

图5(a)为本发明实施例中III-IV期GBC患者匹配前K-M生存曲线图;

图5(b)为本发明实施例中III-IV期GBC患者匹配后K-M生存曲线图;

图6为本发明实施例中III-IV期GBC患者预后列线图;

图7(a)为本发明实施例中建模组数据获得的12、24、36个月预测生存率一致性曲线图;

图7(b)为本发明实施例中内部验证组数据获得的12、24、36个月预测生存率一致性曲线图;

图7(c)为本发明实施例中外部验证组数据获得的12、24、36个月预测生存率一致性曲线图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

本实施例涉及一种胆囊癌患者放化疗后生存获益的预测模型建立方法,其流程如图1所示,包括:

步骤1:获取胆囊癌患者的临床和病理数据,包括:患者的性别、年龄、肿瘤分化程度、TNM分期、手术方式、清扫淋巴结个数、术后辅助治疗方式以及总生存时间OS,手术方式包括无辅助治疗NCRT、化疗CT合格化疗联合放疗CRT;

步骤2:按照TNM分期将步骤1获取的数据划分为若干组数据,并比较若干组数据对应的TNM分析患者接受不同辅助治疗后的生存差异,分别判断各期患者是否从辅助治疗中获益,若对应的TNM分期患者可以从辅助治疗中获益,则执行步骤3,否则,直接输出该期患者无法从辅助治疗中获益;

步骤2具体为:

步骤2-1:按照TNM分期,将步骤1中的数据划分为若干组数据;

步骤2-2:采用广义增强模型GBM计算倾向评分PS;

步骤2-3:采用倾向评分PS对各组数据进行逆概率加权IPTW;

进行逆概率加权IPTW时样本的权重为倾向评分的倒数,即:

其中,w为样本权重,PS为样本的倾向评分;

步骤2-4:比较IPTW加权前后各组变量差异;

采用绝对标准差异比较IPTW加权前后各组变量的差异,绝对标准差异的计算方法为:

其中,Ptreat为处理组相应参数值;Pcontrol为对照组相应参数值;

步骤2-5:通过Kaplan-Meier法对IPTW加权前后的样本进行生存分析,同时采用log-rank检验比较生存曲线的差异,判断各期患者是否从辅助治疗中获益,若对应的TNM分期患者可以从辅助治疗中获益,则执行步骤3,否则,直接输出该期患者无法从辅助治疗中获益;

步骤3:按照步骤2获得的结果,将步骤1中的对应TNM分期的数据分为建模组和内部验证组,同时获取外部验证组;

步骤4:通过单因素COX风险比例模型分析建模组数据的临床、病理变量对总生存时间OS的预测能力,筛选出分析结果中p<0.05的因素作为显著影响建模组患者总生存时间OS的风险因素;

步骤5:将步骤4筛选出的风险因素纳入多因素COX风险比例模型分析,筛选出分析结果中p<0.05的变量作为显著影响患者总生存时间OS的影响变量;

步骤6:根据步骤5获得的影响变量,绘制用于预测总生存时间OS的列线图,获得预测模型;

步骤7:使用内部验证组和外部验证组数据对预测模型进行验证,模型的验证通过C-index指数以及一致性曲线分析完成。

下面提供一种具体的应用案例:

(1)收集数据

收集2004-2015年SEER数据库中接受手术的2689例GBC患者及2016-2018年在某医院接受手术的88例GBC患者。

收集临床、病理资料如下:性别,年龄,肿瘤分化程度,TNM分期,手术方式,清扫淋巴结个数,术后辅助治疗方式,总生存时间(OS)。

(2)判断是否可以从辅助治疗中获益

将SEER数据库2689例GBC患者按TNM分期,分为II期和III-IV期组。采用广义增强模型(Generalized Boosted Models,GBM)计算倾向评分(propensity score,PS),采用逆概率加权(inverse probability of treatment weighting,IPTW)均衡各组中无辅助治疗、化疗、化疗联合放疗患者性别、年龄、肿瘤分化程度、手术方式、清扫淋巴结个数等变量后,绘制Kaplan-Meier生存曲线,比较II期和III-IV期接受不同辅助治疗后生存差异。发现III-IV期GBC患者可从辅助治疗中获益。

(2.1)使用GBM模型计算样本的倾向评分PS

经典的PS估计大多是采用参数线性logistic回归模型或变量选择技术筛选出交互项或非线性项而得出的,这样很可能会遗漏重要的混杂变量或错误指定模型中协变量与处理选择之间的函数关系。本发明基于GBM模型,GBM模型是一种结合多种回归树,获得在干预分配和预处理协变量间的复杂非线性关系的迭代过程,且不会过度拟合数据的模型。其总模型由若干子模型根据相应权值累加而成,子模型的假设空间没有特别的限制,可以为任意离散或连续的函数。GBM借助迭代算法可按类别输出概率值,即为各组PS。

对II期GBC患者,纳入其年龄,性别,分化等级,手术方式,淋巴结清扫个数等变量,计算其PS。对III-IV期GBC患者纳入其年龄,性别,分化等级,T分期,N分期,手术方式,淋巴结清扫个数等变量计算PS。通过R软件(V 4.0.2)的Twang包实现。

(2.2)使用倾向评分PS对样本进行逆概率加权IPTW

假定不存在未识别的混杂因素,加权调整是基于两种在一定条件下反事实事件的概率对数据进行调整:即假设每个观察对象均接受处理因素和均不接受处理两种情况。利用倾向性评分估计的权重对各观察单位加权产生一个虚拟的标准人群(所谓的产生虚拟人群是指权重是多少,就复制权重个人数),在该虚拟人群中,两组混杂因素趋于一致,均近似于某一预先选定的标准人口分布。倾向性评分加权法在计算得出倾向性评分的基础上,利用标准化法的原理,通过倾向性评分值赋予每个研究对象一个相应的权重进行加权,使得各组中倾向性评分分布一致,从而达到消除混杂因素影响的目的。因此倾向性评分加权法是一种基于个体的标准化法。IPTW是以所有观察对象为“标准人群”进行调整的一种加权方法。样本权重w为倾向评分PS的倒数,即w=1/PS。

(2.3)使用绝对标准差异(Absolute Standardized difference)比较IPTW前后各组变量差异

绝对标准差异的计算方法为:

一般认为绝对标准差异小于10%时,可认为组间均衡性较好。由图2(a)、图2(b)和图2(c)中可见IPTW加权后接受不同辅助治疗的II期GBC患者变量趋于平衡。由图4(a)、图4(b)和图4(c)中可见IPTW加权后接受不同辅助治疗的III-IV期GBC患者变量趋于平衡。

(2.4)生存分析

通过Kaplan-Meier法对IPTW加权前后的样本进行生存分析,采用log-rank检验比较生存曲线的差异,检验水准α=0.05。图3(a)和图3(b)分别为IPTW加权前,后II期GBC患者接受不同辅助治疗方式生存情况,可见NCRT、CT和CRT组患者预后无显著差异。图5(a)和图5(b)分别为IPTW加权前,后III-IV期GBC患者接受不同辅助治疗方式生存情况,可见III-IV期GBC患者接受CRT治疗预后优越CT治疗,接受CT治疗其预后优于NCRT。因此III-IV期GBC患者可从CT和CRT辅助治疗中获益。

(3)将SEER数据库1496例III-IV期接受手术的GBC患者按确诊时间分为建模组(2004-2012年确诊)和内部验证组(2013-2015年确诊),2016-2018年在某医院接受手术的88例GBC患者作为外部验证组。

(4)使用SPSS软件(V 19.0统计软件)首先通过单因素COX风险比例模型分析建模组性别,年龄,分化等级,T分期,N分期,手术方式,淋巴结清扫数量,辅助治疗方式等变量对OS的预测能力,分析结果中有统计学意义p<0.05变量被认为显著与OS相关并纳入多因素分析。

本实施例筛选出性别,年龄,分化等级,T分期,N分期淋巴结清扫数量,辅助治疗方式等变量在单因素COX风险比例模型中与患者OS显著相关。

(5)将步骤4分析获得的所有与OS相关因素输入,进行多因素COX风险比例模型分析,将分析结果中p<0.05的变量纳入最后的列线图模型。

本实施例筛选出年龄,分化等级,T分期,N分期,淋巴结清扫数量,辅助治疗方式在多因素COX风险比例模型中与OS显著相关。

(6)将步骤5分析获得的变量,使用R软件(V 4.0.2)的survival和rms包绘制用于预测OS的列线图。

在图6所示的列线图中,第一行为分值标尺(Points),分值范围为0~10。第二行为年龄(Age),第三行为分化等级(Differentitation Grade),第四行T分期(TStage),第五行为N分期(N Stage),第六行为淋巴结清扫数量(Lymphadenectomy),第七行为辅助治疗方式(Adjuvant Therapy)。第八行为总得分(Total Points),分值范围0~35分。第九行为1年生存率(1-year survial rate),第十行为2年生存率(2-year survial rate),第十一行为3年生存率(3-year survial rate),第十二行为中位生存时间(Median Survial Time)。

(7)在列线图模型建立后,使用内部验证组和外部验证组数据对模型进行验证。模型的验证通过C-index指数以及一致性曲线分析完成。建模组、内部验证组、外部验证组C-index指数分别为0.673(95%CI:0.654-0.692)、0.707(95%CI:0.677-0·739)和0.729(95%CI:0.688-0·775)。对应的一致性曲线见图7(a)、图7(b)和图7(c)。

对于任意接受手术切除的GBC患者,通过列线图第二行至第七行中各临床病理变量的实际情况进行打分,各变量具体的分值刻度即为与第一行对应位置的分值。6个变量的分值求和后可确定该患者的总分,并在第八行找到对应的分值位置,继而可根据总分在第十行、第十一行和第十二行的对应位置得出该患者在第12、24、36个月内存活的预测概率,及其中位OS时间。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种肺功能下降预测装置及其预测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!