一种三阴乳腺癌预后预测装置、预测模型及其构建方法

文档序号:1818153 发布日期:2021-11-09 浏览:35次 >En<

阅读说明:本技术 一种三阴乳腺癌预后预测装置、预测模型及其构建方法 (Triple negative breast cancer prognosis prediction device, prediction model and construction method thereof ) 是由 贾永峰 刘霞 康畅元 施琳 云芬 梁俊青 陈永霞 安彦榕 于 2021-08-13 设计创作,主要内容包括:本发明公开了一种三阴乳腺癌预后预测模型构建方法,包括以下步骤:实现三阴乳腺癌样本原始基因表达数据和相应的临床生存数据的收集,并实现基因表达数据的标准化处理后,获得基因表达矩阵;获取三阴乳腺癌独立的成癌特异基因,并获取此类基因表达量;从获取的独立的成癌特异基因中筛选出构建预后预测模型的参数并获取对应的回归系数,所述参数为多个基因类型;基于筛选出的基因,根据其表达量和对应的回归系数,计算风险评分,得到三阴乳腺癌预后预测模型。本发明构建的三阴乳腺癌预后预测模型,实现了三阴乳腺癌患者预后的风险分层,显著地将高低风险的患者分开,进而可以预测三阴乳腺癌的临床结果,指导个体化治疗,具有较高的临床应用价值。(The invention discloses a method for constructing a prognosis prediction model of triple negative breast cancer, which comprises the following steps: the method comprises the steps of collecting original gene expression data and corresponding clinical survival data of a triple negative breast cancer sample, and obtaining a gene expression matrix after standardized processing of the gene expression data is realized; acquiring independent oncogene specific genes of the triple-negative breast cancer, and acquiring the expression quantity of the genes; screening parameters for constructing a prognosis prediction model from the obtained independent cancer-forming specific genes and obtaining corresponding regression coefficients, wherein the parameters are of a plurality of gene types; and calculating a risk score based on the screened genes according to the expression quantity and the corresponding regression coefficients to obtain a prognosis prediction model of the three-negative breast cancer. The three-negative breast cancer prognosis prediction model constructed by the invention realizes risk stratification of prognosis of three-negative breast cancer patients, remarkably separates high-risk and low-risk patients, can predict clinical results of the three-negative breast cancer, guides individualized treatment, and has higher clinical application value.)

一种三阴乳腺癌预后预测装置、预测模型及其构建方法

技术领域

本发明涉及医疗领域,具体涉及一种三阴乳腺癌预后预测装置、预测模型及其构建方法。

背景技术

乳腺癌具有多种生物学行为、临床病理特点和分子特征各不相同的差异。根据临床诊断标记的差异将乳腺癌分为不同的分子亚型,包括管腔A型(1uminal subtype A)、管腔B/C型(1uminal subtype B/C)、正常乳腺样型(normal breast— like subtype)、HER一2过表达型(HER一2 over— expression subtype)以及基底细胞样型(basal—likesubtypel),不同亚型乳腺癌的临床特点、治疗反应性和预后均存在明显差异。

三阴性乳腺癌(tripie—negative breast cancer,TNBC)是乳腺癌中的一种临床病理类型,表现为雌激素受体(estrogen receptor,ER)、孕激素受体(progesteronereceptor,PR)和HER2/neu均无表达或呈低表达。它与基底细胞样型呈一定的交叉关系,大约有80%~90%的三阴性乳腺癌属于基底细胞样乳腺癌,也有少数的基底细胞样乳腺癌表达激素受体。

由于此类型乳腺癌缺乏有效的内分泌治疗和抗HER2/neu靶向治疗,临床上大多采用常规治疗手段,肿瘤具有局部复发和远处转移快,病死率高,预后差,治疗效果不佳的特点。且此类型的预后与肿瘤大小记忆淋巴结状况关系不大,复发相对迅速,1-3年是复发高峰。其组织学特征为导管基底样细胞来源,肿瘤的侵袭能力强,远处转移的风险性高,内脏转移几率较骨转移高,脑转移发生率也较高,3年之内为转移高峰,之后转移风险可能会有所下降,但其预后仍较差,死亡风险较高。对于三阴乳癌的治疗来说,一般综合性治疗比较常见,即运用临床的专业治疗同时在生活中进行辅助。近年来ICB治疗有了新的发展,虽对治疗三阴乳腺癌有一定效果,但从长期角度来讲仍不乐观。三阴乳腺癌的死亡风险比其他类型的乳腺癌要高很多。

发明内容

本发明的目的在于提供一种三阴乳腺癌预后预测装置、预测模型及其构建方法,从分子病理学角度和基因组学水平实现了三阴乳腺癌患者预后的风险分层,显著地将高低风险的患者分开,进而可以预测三阴乳腺癌的临床结果,指导个体化治疗,具有较高的临床应用价值。

为实现上述目的,本发明采取的技术方案为:

一种三阴乳腺癌预后预测模型构建方法,包括以下步骤:

S1、实现三阴乳腺癌样本原始基因表达数据和相应的临床生存数据的收集,并实现基因表达数据的标准化处理后,获得基因表达矩阵;

S2、获取三阴乳腺癌独立的成癌特异基因,并获取此类基因表达量;

S3、从获取的独立的成癌特异基因中筛选出构建预后预测模型的参数并获取对应的回归系数,所述参数为多个基因类型;

S4、基于筛选出的基因,根据其表达量和对应的回归系数,计算风险评分,得到三阴乳腺癌预后预测模型。

进一步地,所述步骤S1中, 基于UCSC-TCGA数据库实现三阴乳腺癌样本原始基因表达数据和相应的临床生存数据的收集,在收集过程中需去除临床数据不完整和总生存时间小于一个月的样本数据。

进一步地,所述步骤S3具体包括如下步骤:

S31、首先筛取成癌特异基因中的蛋白通路核心基因,然后实现蛋白通路核心基因的单因素COX分析,筛选与临床预后相关的预后核心基因;

S32、以筛选所得的预后核心基作为建立三阴乳腺癌独立的临床预测模型的参数,采用LASSO回归算法并采用交叉验证法根据方差最小确定最优调整参数λ,从而确定用于构建预测模型的最优变量;所述LASSO回归算法具体为:LASSO目标函数=残差平方和+λ*系数的绝对值之和,公式表达为:

其中,loss(w)是LASSO目标函数,yj是n*1观测向量,xji为预测变量,即预后核心基因,wi是系数;用交叉验证方法确定最优调整参数λ。

进一步地,所述的构建预后预测模型的参数包括ARL9,NCCRP1,SBSN,RERG,TPSB2,TPSAB1,C15orf59,GPR158,SRRM3,PSORS1C2,DSC2,SEPT3,PTPRN2,ALX3,KLHDC7A。

进一步地,所述三阴乳腺癌预后预测模型基于循环COX建立,具体表示为:I=∑F*C;其中,I为风险评分,F为各模型基因的相对比值,C为各模型基因对应的回归系数。

本发明还提供了一种三阴乳腺癌预后预测模型,该模型采用上述的构建方法构建而成。

本发明还提供了一种三阴乳腺癌预后预测装置,基于上述的三阴乳腺癌预后预测模型实现,包括数据收集模块、模型基因类型分析模块、参数筛选模块、预后模型构建模块以及预测输出模块;所述数据收集模块用于收集三阴乳腺癌样本原始基因表达数据和相应的临床生存数据,并对收集的数据进行预处理和标准化;所述模型基因类型分析模块用于获取肿瘤组织内模型基因并计算各模型基因的相对比值;所述参数筛选模块用于从模型基因类型中筛选出用于构建预后预测模型的参数并获取相对应的回归系数;所述预后模型构建模块用于根据被选为参数的模型基因类型的相对比值及其对应的回归系数,计算风险评分,构建三阴乳腺癌预后预测模型;所述预测输出模块用于通过最大选择等级统计确定cutoff值,将得到的风险评分与cutoff值进行比较,输出被测患者的风险值。

进一步地,所述输出被测患者的风险值具体为,小于或等于cutoff值,被测患者属于低风险,大于cutoff值,被测患者属于高风险。

本发明具有以下有益效果:

1)、本发明基于分子病理学角度和基因组学水平构建三阴乳腺癌预后预测模型,实现了三阴乳腺癌患者预后的风险分层,显著地将高低风险的患者分开,进而可以预测三阴乳腺癌的临床结果,指导个体化治疗,具有较高的临床应用价值;

2)、本发明找到与三阴乳腺癌生存相关的模型基因亚型,并建立了这些模型基因亚型和生存时间之间的预后模型;

3)、本发明建立的模型是从开源的公共数据库中下载三阴乳腺癌患者的基因表达数据和临床数据,解决了样品收集难,测序费用高,以及对病人随访的问题。

具体实施方式

为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例1

一种三阴乳腺癌预后预测模型构建方法,包括以下步骤:

S1、实现三阴乳腺癌样本原始基因表达数据和相应的临床生存数据的收集,并实现基因表达数据的标准化处理后,获得基因表达矩阵;具体的,基于UCSC-TCGA数据库实现三阴乳腺癌样本原始基因表达数据和相应的临床生存数据的收集,在收集过程中需去除临床数据不完整和总生存时间小于一个月的样本数据;

S2、获取三阴乳腺癌独立的成癌特异基因,并获取此类基因表达量;

S3、从获取的独立的成癌特异基因中筛选出构建预后预测模型的参数并获取对应的回归系数,所述参数为多个基因类型,包括ARL9,NCCRP1,SBSN,RERG,TPSB2,TPSAB1,C15orf59,GPR158,SRRM3,PSORS1C2,DSC2,SEPT3,PTPRN2,ALX3,KLHDC7A;

S31、首先筛取成癌特异基因中的蛋白通路核心基因,然后实现蛋白通路核心基因的单因素COX分析,筛选与临床预后相关的预后核心基因;S32、以筛选所得的预后核心基作为建立三阴乳腺癌独立的临床预测模型的参数,采用LASSO回归算法并采用交叉验证法根据方差最小确定最优调整参数λ,从而确定用于构建预测模型的最优变量;

所述LASSO回归算法具体为:LASSO目标函数=残差平方和+λ*系数的绝对值之和,公式表达为:

其中,loss(w)是LASSO目标函数,yj是n*1观测向量,xji为预测变量,即预后核心基因,wi是系数;用交叉验证方法确定最优调整参数λ;

S4、基于筛选出的基因,根据其表达量和对应的回归系数,计算风险评分,得到三阴乳腺癌预后预测模型。所述三阴乳腺癌预后预测模型基于循环COX建立,具体表示为:I=∑F*C;

其中,I为风险评分,F为各模型基因的相对比值,C为各模型基因对应的回归系数。

实施例2

一种三阴乳腺癌预后预测模型,该模型采用实施例1所述的构建方法构建而成。

实施例3

一种三阴乳腺癌预后预测装置,基于实施例2所述的三阴乳腺癌预后预测模型实现,包括数据收集模块、模型基因类型分析模块、参数筛选模块、预后模型构建模块以及预测输出模块;

所述数据收集模块用于收集三阴乳腺癌样本原始基因表达数据和相应的临床生存数据,并对收集的数据进行预处理和标准化;所述模型基因类型分析模块用于获取肿瘤组织内模型基因并计算各模型基因的相对比值;所述参数筛选模块用于从模型基因类型中筛选出用于构建预后预测模型的参数并获取相对应的回归系数;所述预后模型构建模块用于根据被选为参数的模型基因类型的相对比值及其对应的回归系数,计算风险评分,构建三阴乳腺癌预后预测模型;所述预测输出模块用于通过最大选择等级统计确定cutoff值,将得到的风险评分与cutoff值进行比较,输出被测患者的风险值。

进一步地,所述输出被测患者的风险值具体为,小于或等于cutoff值,被测患者属于低风险,大于cutoff值,被测患者属于高风险。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

7页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于基准集的基因组结构变异性能检测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!