基于影像组学的肝癌肝外转移预测模型、其构建方法及应用

文档序号:154912 发布日期:2021-10-26 浏览:17次 >En<

阅读说明:本技术 基于影像组学的肝癌肝外转移预测模型、其构建方法及应用 (Liver cancer extrahepatic metastasis prediction model based on image omics, construction method and application thereof ) 是由 朱呈瞻 何颖 董冰子 董蒨 陈鑫 聂佩 魏宾 于 2021-07-30 设计创作,主要内容包括:本发明提出一种基于影像组学的肝癌肝外转移预测模型、其构建方法及应用,能解决现有技术中尚未研发出成熟、有效的基于影像组学方法预测肝癌肝外转移模型的技术问题。该构建方法包括:采集原始医学影像和临床信息;将肝癌患者按比例随机分为训练集和验证集;提取初步影像组学特征;LASSO回归模型对训练集中的初步影像组学特征进行降维和筛选,得第一目标影像组学特征,利用其构建多种分类器模型;使用SMOTE算法扩增第一目标影像组学特征,得扩增后的影像组学特征数据;LASSO回归模型和RFC-RFE算法降维和筛选扩增后的影像组学特征数据,得第二目标影像组学特征,利用其构建多种分类器模型、计算影像学评分;评估分类器模型筛选最佳分类器模型。(The invention provides a liver cancer extrahepatic metastasis prediction model based on imaging omics, a construction method and application thereof, and can solve the technical problem that a mature and effective liver cancer extrahepatic metastasis prediction model based on an imaging omics method is not developed in the prior art. The construction method comprises the following steps: collecting original medical images and clinical information; randomly dividing liver cancer patients into a training set and a verification set according to a proportion; extracting the primary image omics characteristics; the LASSO regression model performs dimensionality reduction and screening on the preliminary image omics characteristics in the training set to obtain first target image omics characteristics, and a plurality of classifier models are constructed by using the first target image omics characteristics; amplifying the first target image omics characteristics by using a SMOTE algorithm to obtain amplified image omics characteristic data; reducing the dimension of an LASSO regression model and an RFC-RFE algorithm, screening the amplified image omics characteristic data to obtain a second target image omics characteristic, and constructing various classifier models and calculating the image science score by using the second target image omics characteristic; evaluating the classifier model to screen the best classifier model.)

基于影像组学的肝癌肝外转移预测模型、其构建方法及应用

技术领域

本发明属于肝癌肝外转移预测模型构建领域,尤其涉及一种基于影像组学的肝癌肝外转移预测模型、其构建方法及应用。

背景技术

目前,肝细胞癌(HCC)是全球第四大常见癌症,也是导致癌症相关死亡的第二大原因。已有研究报道,13.5-42%的患者在确诊时有肝外转移,肝外复发的患者往往接受全身化疗或靶向治疗,其生存率远低于未发生肝外转移的患者。近期有研究表明,积极处理肝外转移可能提高患者的生存率,因此,肝外转移高危人群的识别是一个重要的问题,以改善患者的生存。

计算机断层扫描CT作为一种无创的肿瘤早期诊断方法,已广泛应用于多种临床疾病检查和辅助诊断。值得注意的是,影像组学得益于图像分析算法和影像组学技术的进步,通过应用生物信息学方法从医学图像中提取大量影像学特征,以此预测潜在的肿瘤生物学行为,从而对多种疾病尤其是恶性肿瘤提供了诊断、治疗及预后价值,进而为临床决策提供支持。

对于肝癌患者而言,影像组学特征可能预示着总体生存、肿瘤复发和治疗反应。目前,影像组学已成功应用于鼻咽癌、非小细胞癌的研究。但目前利用影像组学方法预测肝癌肝外转移尚未研究出有效的解决方案,因此,如何建立一种基于影像组学的肝癌肝外转移预测模型具有很高的应用价值。

发明内容

本发明针对现有技术中尚未研发出成熟、有效的基于影像组学方法预测肝癌肝外转移模型等的技术问题,提出一种精确度高的基于影像组学的肝癌肝外转移预测模型、其构建方法及应用。

为了达到上述目的,本发明采用的技术方案为:

基于影像组学的肝癌肝外转移预测模型的构建方法,包括如下步骤:

采集经肝切除术治疗的肝癌患者的原始医学影像和临床信息;

将肝癌患者按比例随机分为训练集和验证集;

从所述原始医学影像上提取影像组学特征,得到初步影像组学特征;

采用LASSO回归模型对训练集中的初步影像组学特征进行降维和分析筛选,得到第一目标影像组学特征,并利用所述第一目标影像组学特征构建多种分类器模型;

使用SMOTE算法对所述第一目标影像组学特征进行少数过采样处理,得到扩增后的影像组学特征数据;

采用LASSO回归模型和RFC-RFE算法对所述扩增后的影像组学特征数据进行降维和分析筛选,得到第二目标影像组学特征,并利用所述第二目标影像组学特征构建多种分类器模型、计算影像学评分;

对基于第一目标影像组学特征和第二目标影像组学特征构建的分类器模型进行评估,筛选最佳分类器模型,即得到肝癌肝外转移预测模型。

作为优选,所述影像组学特征包括但不限于一阶统计学特征、形态学特征、灰度共生矩阵特征、灰度游程特征、灰度区域大小矩阵特征、灰度依赖矩阵特征、小波变化特征、拉普拉斯变化特征以及邻域灰度差别矩阵特征。

作为优选,所述第一目标影像组学特征包括:一阶统计学特征1个、灰度共生矩阵特征3个、灰度游程特征2个、灰度区域大小矩阵特征4个、灰度依赖矩阵特征1个,共计11个特征;

所述第二目标影像组学特征包括:灰度共生矩阵特征5个、灰度区域大小矩阵特征1个、灰度游程特征4个、灰度依赖矩阵特征4个、邻域灰度差别矩阵特征1个,共计15个特征。

作为优选,所述多种分类器模型包括:逻辑回归模型、支持向量机模型、随机森林模型、决策树模型和朴素贝叶斯模型。

作为优选,所述影像学评分根据以下公式计算得到:

式中:A为筛选出的影像组学特征所对应的数值,β为筛选出的影像组学特征所对应的回归系数。

作为优选,所述对基于第一目标影像组学特征和第二目标影像组学特征构建的分类器模型进行评估,包括以下步骤:

从所述第一目标影像组学特征和第二目标影像组学特征中筛选最重要的影像组学特征;

利用AUC和ACC分别对基于第一目标影像组学特征和第二目标影像组学特征构建的分类器模型进行性能评估,并在验证集中进行验证,从而筛选出最佳分类器模型。

作为优选,所述构建方法还包括临床模型构建步骤和联合模型构建步骤,具体包括:

采用单因素分析确定肝癌肝外转移患者的临床特征对预后的影响,筛选出p<0.05的临床特征作为临床因素,基于所述最佳分类器模型结合临床因素建立临床模型,利用所述临床因素结合影像学评分,建立联合模型;

采用ROC曲线下面积AUC和ACC评估所述肝癌肝外转移预测模型、临床模型和联合模型的预测性能,并以列线图展示训练集模型的结果。

作为优选,所述临床因素包括微血管浸润、瘤径、体重指数、中性粒细胞计数和t分期。

本发明还提出了一种基于影像组学的肝癌肝外转移预测模型,该预测模型利用上述任一优选技术方案所述的肝癌肝外转移预测模型的构建方法构建得到。

本发明又提出了一种基于影像组学的肝癌肝外转移预测模型在肝癌肝外转移预测中的应用。

与现有技术相比,本发明的优点和积极效果在于:

1、本发明提出的肝癌肝外转移预测模型的构建方法,该方法先采用LASSO回归模型进行特征选择,随后对筛选后的特征进行扩增后,采用LASSO回归模型和RFC-RFE算法相结合的方式对扩增后的特征进行二次选择,可进一步消除不相关的特征,从而提升肝癌肝外转移预测模型的性能;

2、本发明提出的肝癌肝外转移预测模型的构建方法,该构建方法运用五种分类器分别对“LASSO回归模型”特征选择后的目标特征和“LASSO回归模型和RFC-RFE算法”进行特征选择后的目标特征进行五种分类器模型建立,进行性能评估,并在验证集中进行验证,从而筛选出最佳分类器模型,即为肝癌肝外转移预测模型;

3、本发明提出的肝癌肝外转移预测模型的构建方法,利用该方法构建得到一种肝癌肝外转移预测模型,该模型能够对肝癌患者是否发生肝外转移进行预估,从而实现了辅助医生制定个性化的治疗方案,并辅助医生对病人的存活和复发时间进行评估,实现个体化及精准化医疗的技术效果。

附图说明

图1为本发明实施例所提供的基于LASSO回归模型筛选得到的11个第一目标影像组学特征构建的5个分类器模型的训练集和验证集性能测定结果示意图,其中,左图为训练集,右图为验证集;

图2为本发明实施例所提供的结合SMOTE算法后,基于LASSO回归模型和RFC-RFE算法筛选得到的15个第二目标影像组学特征构建的5个分类器模型的训练集和验证集性能测定结果示意图,其中,左图为训练集,右图为验证集;

图3为本发明实施例所提供的肝癌肝外转移预测模型、临床模型以及联合模型的训练集ROC曲线;

图4为本发明实施例所提供的肝癌肝外转移预测模型、临床模型以及联合模型验证集ROC曲线;

图5为本发明实施例所提供的临床影像列线图和影像组学列线图,其中,左图为临床影像列线图,右图为影像组学列线图;

图6为本发明实施例所提供的训练集中临床放射学列线图和放射组学列线图的校准曲线,左图为临床放射学列线图的校准曲线,右图为放射组学列线图的校准曲线;

图7为本发明实施例所提供的各个分类器模型的决策曲线分析。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种基于影像组学的肝癌肝外转移预测模型的构建方法,包括如下步骤:

S1、采集经肝切除术治疗的肝癌患者的原始医学影像和临床信息;

S2、将肝癌患者按比例随机分为训练集和验证集;

S3、从所述原始医学影像上提取影像组学特征,得到初步影像组学特征;

S4、采用LASSO回归模型对训练集中的初步影像组学特征进行降维和分析筛选,得到第一目标影像组学特征,并利用所述第一目标影像组学特征构建多种分类器模型;

S5、使用SMOTE算法对所述第一目标影像组学特征进行少数过采样处理,得到扩增后的影像组学特征数据;

S6、采用LASSO回归模型和RFC-RFE算法对所述扩增后的影像组学特征数据进行降维和分析筛选,得到第二目标影像组学特征,并利用所述第二目标影像组学特征构建多种分类器模型、计算影像学评分;

S7、对基于第一目标影像组学特征和第二目标影像组学特征构建的分类器模型进行评估,筛选最佳分类器模型,即得到肝癌肝外转移预测模型。

在上述技术方案中,本发明实施例提出了一种基于影像组学的肝癌肝外转移预测模型的构建方法,该方法运用五种分类器分别对“LASSO回归模型”特征选择后的目标特征和“LASSO回归模型和RFC-RFE算法”进行特征选择后的目标特征进行五种分类器模型建立,进行性能评估,并在验证集中进行验证,从而筛选出最佳分类器模型,即为肝癌肝外转移预测模型。

还需进一步说明的是,本发明实施例先采用LASSO回归模型进行特征选择,随后对筛选后的特征进行扩增后,采用LASSO回归模型和RFC-RFE算法相结合的方式对扩增后的特征进行二次选择的原因在于:可进一步消除不相关的特征,从而提升肝癌肝外转移预测模型的性能。

在一优选实施例中,所述影像组学特征包括但不限于一阶统计学特征、形态学特征、灰度共生矩阵特征(GLCM)、灰度游程特征(GLRLM)、灰度区域大小矩阵特征(GLSZM)、灰度依赖矩阵特征(GLDM)、小波变化特征、拉普拉斯变化特征以及邻域灰度差别矩阵特征(NGTDM)。

在一优选实施例中,所述第一目标影像组学特征包括:一阶统计学特征1个、灰度共生矩阵特征3个、灰度游程特征2个、灰度区域大小矩阵特征4个、灰度依赖矩阵特征1个,共计11个特征;

所述第二目标影像组学特征包括:灰度共生矩阵特征5个、灰度区域大小矩阵特征1个、灰度游程特征4个、灰度依赖矩阵特征4个、邻域灰度差别矩阵特征1个,共计15个特征。

在一优选实施例中,所述多种分类器模型包括:逻辑回归模型(LR)、支持向量机模型(SVM)、随机森林模型(RFC)、决策树模型(DTC)和朴素贝叶斯模型(GNB)。

在上述实施例中,选择上述5种分类器建立模型的原因在于:

(1)逻辑回归算法速度较快,适合二分类问题,模型的可解释性非常好,从特征的权重可以看到不同特征对最后结果的影响;

(2)支持向量机使用核函数可以解决非线性的问题,分类效果好;

(3)随机森林算法能够处理很高维度(特征很多)的数据,模型的泛华能力很强,训练速度快,能够检测到特征之间相互影响,该分类器对噪声和异常值具有鲁棒性,对于不平衡数据来说可以平衡误差,有很大的优势;

(4)决策树算法分类精确度高,生成的模式简单,对噪声数据有很好的健壮性;

(5)朴素贝叶斯算法数据不大时表现较好,减少了模型的复杂性,有稳定的分类效率;

此外,LASSO(最小绝对值收缩和选择算子)是影像组学中较常用的一种降维方式可以减少模型的过度拟合,并且过程中使用交叉验证可以增强模型的稳定性,可以很好的反应自变量与因变量的显著性;

随机森林-递归特征消除法是提出的一种用于基因选择和癌症分类的嵌入式方法。该方法对过拟合数据的鲁棒性优于包装和滤波方法。研究表明,混合特征选择方法可以提高特征选择的有效性,这种算法组合也在我们的研究中得到了进一步的评估。我们之所以选择这些算法因为他们在文献中的普及性和高计算效率。

在一优选实施例中,所述影像学评分根据以下公式计算得到:

式中:A为筛选出的影像组学特征所对应的数值,β为筛选出的影像组学特征所对应的回归系数。

在上述实施例中,基于lasso所筛选的特征,得出这些原始特征(未经过标准化处理的数据)的均值和标准差。进一步转换系数,得到最终的系数和截距,Radscore即所有特征与对应系数的乘积求和加上截距值得到的影像学评分。

在一优选实施例中,所述对基于第一目标影像组学特征和第二目标影像组学特征构建的分类器模型进行评估,包括以下步骤:

(1)从所述第一目标影像组学特征和第二目标影像组学特征中筛选最重要的影像组学特征;

(2)利用AUC和ACC分别对基于第一目标影像组学特征和第二目标影像组学特征构建的分类器模型进行性能评估,并在验证集中进行验证,从而筛选出最佳分类器模型。

在一优选实施例中,所述构建方法还包括临床模型构建步骤和联合模型构建步骤,具体包括:

(1)采用单因素分析确定肝癌肝外转移患者的临床特征对预后的影响,筛选出p<0.05的临床特征作为临床因素,基于所述最佳分类器模型结合临床因素建立临床模型,利用所述临床因素结合影像学评分,建立联合模型,将P<0.05特征纳入多因素分析,结果表明瘤径,T分期和Radscore是肝癌患者转移的独立预测因素(P<0.05);

(2)采用ROC曲线下面积AUC和ACC评估所述肝癌肝外转移预测模型、临床模型和联合模型的预测性能,并以列线图展示训练集模型的结果。

在上述实施例中,建立临床模型和联合模型的原因:由于在临床上,医生要根据患者的临床症状和影像学因素做出疾病的诊断,治疗和判断预后,所以我们在观察了影像学模型和临床模型的预测性能后,有必要将二者结合起来,观察联合模型的性能,进而更全面综合的评估病人的预后以便辅助治疗。

在一优选实施例中,所述临床因素包括微血管浸润、瘤径、体重指数、中性粒细胞计数和t分期。

本发明还提供了一种基于影像组学的肝癌肝外转移预测模型,该预测模型利用上述任一优选实施例所述的肝癌肝外转移预测模型的构建方法构建得到。

本发明实施例还提出了一种基于影像组学的肝癌肝外转移预测模型在肝癌肝外转移预测中的应用。

为了更清楚详细地介绍本发明实施例所提供的基于影像组学的肝癌肝外转移预测模型、其构建方法及应用,下面将结合具体实施例进行描述。

实施例1

本实施例提出一种基于影像组学的肝癌肝外转移预测模型的建立方法,包括以下步骤:

(1)纳入277例经病理证实为肝细胞癌并且予以肝切除术治疗的患者作为数据集,按照7:3的比例将其随机分为训练组(n=193)和验证组(n=84);

(2)采集经肝切除术治疗的肝癌患者的原始医学影像和临床信息,从每个患者的CT图像上分别提取了1130个影像学特征,即初步影像组学特征,其中,1130个影像学特征包括:一阶统计学特征、形态学特征、灰度共生矩阵特征(GLCM)、灰度游程特征(GLRLM)、灰度区域大小矩阵特征(GLSZM)、灰度依赖矩阵特征(GLDM)、小波变化特征、拉普拉斯变化特征以及邻域灰度差别矩阵特征;

(3)使用类内和类间相关系数(ICCs)来评估特征提取的观察者内和观察者间的再现性,当ICC在观察者内和观察者间均超过0.75时,认为该特征具有较好的一致性;

(4)采用LASSO回归模型对训练集中的初步影像组学特征进行降维和分析筛选,并使用10折交叉验证以防止模型过度拟合,得到11个第一目标影像组学特征,包括:一阶统计学特征1个、灰度共生矩阵特征3个、灰度游程特征2个、灰度区域大小矩阵特征4个、灰度依赖矩阵特征1个,利用11个第一目标影像组学特征分别构建逻辑回归模型、支持向量机模型、随机森林模型、决策树模型和朴素贝叶斯模型,并利用下述公式计算影像学评分:

式中:A为筛选出的影像组学特征所对应的数值,β为筛选出的影像组学特征所对应的回归系数。

(5)使用SMOTE算法对所得第一目标影像组学特征进行少数过采样处理,得到扩增后的影像组学特征数据;

(6)采用LASSO回归模型和RFC-RFE算法对扩增后的影像组学特征数据进行降维和分析筛选,得到15个第二目标影像组学特征,包括:灰度共生矩阵特征5个、灰度区域大小矩阵特征1个、灰度游程特征4个、灰度依赖矩阵特征4个、邻域灰度差别矩阵特征1个,并利用第二目标影像组学特征分别构建逻辑回归模型、支持向量机模型、随机森林模型、决策树模型和朴素贝叶斯模型,并利用步骤(4)中的公式计算影像学评分;

(7)从第一目标影像组学特征和第二目标影像组学特征中筛选最重要的影像组学特征,利用AUC分别对基于第一目标影像组学特征和第二目标影像组学特征构建的分类器模型进行性能评估,并在验证集中进行验证,从而筛选出最佳分类器模型,即得到基于影像组学的肝癌肝外转移预测模型。

实施例2

本实施例提出一种临床模型和联合模型的构建方法,包括如下步骤:

(1)采用单因素分析确定肝癌肝外转移患者的临床特征对预后的影响,筛选出p<0.05的临床特征纳入多因素回归分析,通过单因素分析确定3个临床特征,即体重指数(BMI)、中性粒细胞计数(NEUT)和t分期,2个影像学定性特征,即肿瘤直径、MVI和Radscore(均P<0.05);

(2)对上述临床特征和影像学定性特征进行多变量logistic回归分析,分析可知,肿瘤直径(OR 0.721[95%CI,0.542-0.959)],P=0.025)、t分期(P<0.0001)和放射组学评分(OR,1.618e6[95CI,17.438-3.666e10],P=0.005)是肝癌发生的独立预测因素;

(3)采用性能最佳的logistic回归分类器建立临床模型,将单因素分析中P值<0.05的临床因素纳入模型,并与影像学评分建立联合模型;

(4)采用ROC曲线和列线图评估所述肝癌肝外转移预测模型、临床模型和联合模型的预测性能。

分类器模型性能测试

该性能测试实验具体采用AUC法对实施例1中基于LASSO回归模型筛选得到的11个第一目标影像组学特征构建的5个分类器模型以及结合SMOTE算法后,基于LASSO回归模型和RFC-RFE算法筛选得到的15个第二目标影像组学特征构建的5个分类器模型分别进行了性能测试,测定结果见下表:

表1 AUC法测定各分类器模型性能结果统计

由上表所示的实验结果可知,基于LASSO回归模型筛选所得特征构建的分类器模型的验证集中,分类器LR、SVC和GNB的ACC最高,为0.87,而SVC和RFC模型的灵敏度、特异性、f1-score和精确度最低;在分类器与SMOTE相结合的情况下,分类器LR和DTC在验证集中的AUC最高,为0.81;DTC的ACC最高,分别为0.88(训练组)和0.83(验证组);

在训练数据集中,DTC与SMOTE相结合的分类器AUC最高,为0.92,其次是LR(AUC=0.91);在没有添加SMOTE的训练集中,分类器DTC的AUC最低,为0.6(训练组)和0.53(验证组),而分类器LR的AUC最高,为0.88。此外,分类器LR和DTC的ACC最高,为0.9;在其他分类器中也得到了相同的结果,添加了SMOTE算法的分类器的AUC值高于未添加SMOTE算法的分类器,同时,上述实验结果也证明了逻辑回归模型在预测肝癌转移中表现最稳定。

肝癌肝外转移预测模型、临床模型以及联合模型性能测试

本发明还对实施例1-2构建得到的肝癌肝外转移预测模型、临床模型以及联合模型分别使用AUC法、ROC曲线和列线图进行了性能预测,测定结果如下表所示:

表2肝癌肝外转移预测模型、临床模型以及联合模型性能测试结果

从表2所示的实验结果可知,与肝癌肝外转移预测模型相比,训练集和验证集中,联合模型的AUC和ACC最高,这表明联合模型的预测能力最好,也符合临床实际情况。

15页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种中医女性健康管理轻问诊系统和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!