一种用于预测肝癌患者术后晚期复发风险的生物标志物及检测试剂盒

文档序号:128536 发布日期:2021-10-22 浏览:33次 >En<

阅读说明:本技术 一种用于预测肝癌患者术后晚期复发风险的生物标志物及检测试剂盒 (Biomarker and detection kit for predicting postoperative late-stage recurrence risk of liver cancer patient ) 是由 李臻 张玉元 李鑫 吕培杰 詹鹏超 吴阳 葛鹏磊 王彩鸿 谢滢滢 谢炳灿 叶书文 于 2021-08-27 设计创作,主要内容包括:本发明属于医药生物技术领域,具体公开了一种用于预测肝癌患者术后晚期复发风险的生物标志物,所述标志物为ANGPT4基因、FAM78B基因、COLEC12基因、TRABD2A基因、AMFR基因和LMTK3基因的组合;所述试剂盒含有用于检测上述生物标志物表达量的试剂。通过检测HCC患者肝癌组织中ANGPT4基因、FAM78B基因、COLEC12基因、TRABD2A基因、AMFR基因和LMTK3基因的表达水平,能够实现肝癌患者术后晚期复发风险的预测。(The invention belongs to the technical field of medical biology, and particularly discloses a biomarker for predicting postoperative late stage recurrence risk of a liver cancer patient, wherein the marker is a combination of an ANGPT4 gene, a FAM78B gene, a COLEC12 gene, a TRABD2A gene, an AMFR gene and an LMTK3 gene; the kit contains a reagent for detecting the expression level of the biomarker. By detecting the expression levels of the ANGPT4 gene, the FAM78B gene, the COLEC12 gene, the TRABD2A gene, the AMFR gene and the LMTK3 gene in the liver cancer tissue of the HCC patient, the prediction of the postoperative late-stage recurrence risk of the liver cancer patient can be realized.)

一种用于预测肝癌患者术后晚期复发风险的生物标志物及检 测试剂盒

技术领域

本发明属于医药生物技术领域,具体涉及一种用于预测肝癌患者术后晚期复发风险的生物标志物及检测试剂盒。

背景技术

肝细胞癌(HCC)是一种高度恶性肿瘤,预后差。目前,肝切除术和介入治疗已成为I-III期HCC患者的主流治疗方法,但高复发率仍是提高长期生存率的主要障碍,近70%的患者术后5年内复发。相对于从手术到初次复发的时间,HCC复发通常分为早期复发(EarlyRelapse,ER)和晚期复发(Late Relaps,LR),通常以2年作为临界值,HCC患者从手术切除开始计算,2年后复发的记作晚期复发。在临床实践中,许多肝癌根治性肝切除术后2年仍存活且无肿瘤复发的患者没有定期监测,当出现症状时可能失去治疗的机会。因此,有必要预测HCC晚期复发的易感患者,并进一步提供复发监测和治疗的优化策略。

据报道,HCC早期和晚期复发患者的初始复发模式和程度不同。HCC晚期复发可能与潜在的慢性肝病的演化有关,晚期复发通常被认为是一种新生肿瘤,与HCC早期复发相比具有不同的生物学行为。研究表明肝硬化与HCC晚期复发之间的关系具有临床“表面效应”,因为慢性肝炎炎症和纤维化通过在肝脏中产生一种致癌的微环境而加速HCC的发展,称为“场效应”。因此,鉴于基因组改变在肿瘤发生、发展中的关键作用,有必要破译HCC晚期复发患者的基因组景观。此外,我们希望将这些知识转化为新的生物标志物以及药物作用靶点进一步影响疾病监测和肿瘤治疗的决策,最终改善HCC患者的临床结局。

目前临床医生普遍根据肿瘤-淋巴结-转移(TNM)分期选择合理的治疗策略。然而,相同TNM分期的HCC患者预后往往不同,因此需要更多的个体化治疗策略。直到最近发表的关于HCC晚期复发的研究仍然很少,且大多局限于临床特征。例如,东方肝胆外科医院的一项研究调查了乙型肝炎病毒(HBV)相关性HCC肝切除术后晚期复发的危险因素。在这项研究中,Wang等发现复发率在术后1-2年和4-5年出现高峰(分别为每年23%和35%),并得出结论,男性、肝硬化和术前高HBV-DNA载量与HCC晚期复发有关。然而,以往的大多数研究并没有详细阐明如何对HCC晚期复发进行准确预测,以及HCC晚期复发高危患者的合理干预。因此,亟需研究一种能够用于预测HCC患者晚期复发风险的产品。

发明内容

针对现有技术中存在的问题和不足,本发明的目的旨在提供一种用于预测肝癌患者术后晚期复发风险的生物标志物及检测试剂盒。

为实现发明目的,本发明采用的技术方案如下:

本发明第一方面提供了一种可用于预测肝癌患者术后晚期复发风险的生物标志物,所述生物标志物为ANGPT4基因、FAM78B基因、COLEC12基因、TRABD2A基因、AMFR基因和LMTK3基因的组合。ANGPT4基因、FAM78B基因、COLEC12基因、TRABD2A基因、AMFR基因和LMTK3基因在HCC晚期复发患者肝癌组织中表达上调。

本发明第二方面提供了一种用于检测上述第一方面所述生物标志物表达量的试剂在制备用于预测肝癌患者术后晚期复发风险的产品中的应用。

根据上述的应用,优选地,所述产品为通过RT-PCR、实时定量PCR、原位杂交、Northern blotting、芯片或高通量测序平台检测样本中所述生物标志物的表达量。

根据上述的应用,优选地,所述试剂为扩增所述生物标志物的特异性引物或与所述生物标志物杂交的探针。

根据上述的应用,优选地,通过RT-PCR或实时定量PCR检测样本中所述生物标志物表达量的试剂包含扩增所述生物标志物的特异性引物。

根据上述的应用,优选地,通过原位杂交检测样本中所述生物标志物表达量的试剂包含与所述生物标志物的核苷酸序列杂交的探针。

根据上述的应用,优选地,通过Northern blotting检测样本中所述生物标志物表达量的试剂包含与所述生物标志物的核苷酸序列杂交的探针。

根据上述的应用,优选地,通过芯片检测样本中所述生物标志物表达量的试剂包含与所述生物标志物的核苷酸序列杂交的探针。

根据上述的应用,优选地,扩增ANGPT4基因的特异性引物的核苷酸序列如SEQ IDNO.1和SEQ ID NO.2所示;扩增FAM78B基因的特异性引物的核苷酸序列如SEQ ID NO.3和SEQ ID NO.4所示;扩增COLEC12基因的特异性引物的核苷酸序列如SEQ ID NO.5和SEQ IDNO.6所示;扩增TRABD2A基因的特异性引物的核苷酸序列如SEQ ID NO.7和SEQ ID NO.8所示;扩增AMFR基因的特异性引物的核苷酸序列如SEQ ID NO.9和SEQ ID NO.10所示;扩增LMTK3基因的特异性引物的核苷酸序列如SEQ ID NO.11和SEQ ID NO.12所示。

根据上述的应用,优选地,所述样本包括(但不限于)组织、细胞、体液(血液、淋巴液)。更加优选地,所述样本为组织、血液。

根据上述的应用,优选地,所述产品为芯片、制剂或试剂盒。

根据上述的应用,优选地,所述产品预测肝癌患者术后晚期复发风险的风险预测值计算公式如式I所示:

风险预测值=0.356+0.06×ANGPT4+0.110×FAM78B+0.046×COLEC12+0.063×TRABD2A+0.049×AMFR+0.004×LMTK3 式I

式I中,ANGPT4表示检测样本中ANGPT4基因的表达量,FAM78B表示检测样本中FAM78B基因的表达量;COLEC12表示检测样本中COLEC12基因的表达量;TRABD2A表示检测样本中TRABD2A基因的表达量;AMFR表示检测样本中AMFR基因的表达量;LMTK3表示检测样本中LMTK3基因的表达量。更加优选地,式I中,ANGPT4表示采用qRT-PCR检测HCC患者肝癌组织中ANGPT4基因表达的表达量,FAM78B表示采用qRT-PCR检测HCC患者肝癌组织中FAM78B基因表达的表达量;COLEC12表示采用qRT-PCR检测HCC患者肝癌组织中COLEC12基因表达的表达量;TRABD2A表示采用qRT-PCR检测HCC患者肝癌组织中TRABD2A基因表达的表达量;AMFR表示采用qRT-PCR检测HCC患者肝癌组织中AMFR基因的表达量;LMTK3表示采用qRT-PCR检测HCC患者肝癌组织中LMTK3基因的表达量。

本发明第三方面提供了一种用于预测肝癌患者术后晚期复发风险的试剂盒,该试剂盒含有用于检测上述第一方面所述生物标志物表达量的试剂。

根据上述的试剂盒,优选地,所述试剂为通过RT-PCR、实时定量PCR、原位杂交、Northern blotting、芯片或高通量测序平台检测样本中所述生物标志物表达量的试剂。

根据上述的试剂盒,优选地,通过RT-PCR或实时定量PCR检测样本中所述生物标志物表达量的试剂包含扩增所述生物标志物的特异性引物。

根据上述的试剂盒,优选地,通过原位杂交检测样本中所述生物标志物表达量的试剂包含与所述生物标志物的核苷酸序列杂交的探针。

根据上述的试剂盒,优选地,通过Northern blotting检测样本中所述生物标志物表达量的试剂包含与所述生物标志物的核苷酸序列杂交的探针。

根据上述的试剂盒,优选地,通过芯片检测样本中所述生物标志物表达量的试剂包含与所述生物标志物的核苷酸序列杂交的探针。

根据上述的试剂盒,优选地,扩增ANGPT4基因的特异性引物的核苷酸序列如SEQID NO.1和SEQ ID NO.2所示;扩增FAM78B基因的特异性引物的核苷酸序列如SEQ ID NO.3和SEQ ID NO.4所示;扩增COLEC12基因的特异性引物的核苷酸序列如SEQ ID NO.5和SEQID NO.6所示;扩增TRABD2A基因的特异性引物的核苷酸序列如SEQ ID NO.7和SEQ ID NO.8所示;扩增AMFR基因的特异性引物的核苷酸序列如SEQ ID NO.9和SEQ ID NO.10所示;扩增LMTK3基因的特异性引物的核苷酸序列如SEQ ID NO.11和SEQ ID NO.12所示。

根据上述的试剂盒,优选地,所述样本包括(但不限于)组织、细胞、体液(血液、淋巴液)。更加优选地,所述样本为组织、血液。

根据上述的试剂盒,优选地,所述产品为芯片、制剂或试剂盒。

根据上述的试剂盒,优选地,所述产品预测肝癌患者术后晚期复发风险的风险预测值计算公式如式I所示:

风险预测值=0.356+0.06×ANGPT4+0.110×FAM78B+0.046×COLEC12+0.063×TRABD2A+0.049×AMFR+0.004×LMTK3 式I

其中,ANGPT4表示检测样本中ANGPT4基因的表达量,FAM78B表示检测样本中FAM78B基因的表达量;COLEC12表示检测样本中COLEC12基因的表达量;TRABD2A表示检测样本中TRABD2A基因的表达量;AMFR表示检测样本中AMFR基因的表达量;LMTK3表示检测样本中LMTK3基因的表达量。更加优选地,式I中,ANGPT4表示采用qRT-PCR检测HCC患者肝癌组织中ANGPT4基因表达的表达量,FAM78B表示采用qRT-PCR检测HCC患者肝癌组织中FAM78B基因表达的表达量;COLEC12表示采用qRT-PCR检测HCC患者肝癌组织中COLEC12基因表达的表达量;TRABD2A表示采用qRT-PCR检测HCC患者肝癌组织中TRABD2A基因表达的表达量;AMFR表示采用qRT-PCR检测HCC患者肝癌组织中AMFR基因的表达量;LMTK3表示采用qRT-PCR检测HCC患者肝癌组织中LMTK3基因的表达量。

本发明中,术语“引物”是指能够互补地与模板结合并使逆转录酶或DNA聚合酶能够启动模板复制的具有自由3’羟基的核酸序列。引物是具有与特定基因核酸序列互补的序列的核苷酸。本发明中,除非另有指出,术语“探针”通常指能通过互补碱基配对与另一多核苷酸(往往称为“靶多核苷酸”)结合的多核苷酸探针。根据杂交条件的严谨性,探针能和与该探针缺乏完全序列互补性的靶多核苷酸结合。本发明中,术语“术后”是指肝癌患者进行肝癌切除手术后。

与现有技术相比,本发明取得的积极有益效果为:

(1)本发明通过研究HCC晚期复发患者和HCC不复发患者肝癌组织基因的转录组数据,首次发现ANGPT4基因、FAM78B基因、COLEC12基因、TRABD2A基因、AMFR基因和LMTK3基因在HCC晚期复发患者肝癌组织和HCC不复发患者肝癌组织中存在差异表达,而且差异具有统计学意义,因此,ANGPT4基因、FAM78B基因、COLEC12基因、TRABD2A、AMFR基因和LMTK3基因的组合可以作为预测肝癌患者术后晚期复发风险的生物标志物,通过检测HCC患者肝癌组织中ANGPT4基因、FAM78B基因、COLEC12基因、TRABD2A基因、AMFR基因和LMTK3基因的表达水平,能够实现肝癌患者术后晚期复发风险的预测。

(2)本发明根据筛选到的可用于预测肝癌患者术后晚期复发风险的生物标志物,构建了一个可用于预测肝癌患者术后晚期复发风险的风险预测值模型,经单因素、多因素Cox回归分析发现,该风险预测值模型为HCC患者晚期复发预测的独立危险因素;而且,本发明构建的用于预测肝癌患者术后晚期复发风险的风险预测值模型用于区分HCC晚期复发患者和HCC不复发患者的ROC曲线的AUC达到了0.94(验证组),具有较高的准确度;因此,本发明构建的风险预测值模型可用于预测肝癌患者术后晚期复发风险,便临床医生根据预测的HCC患者术后复发的概率,来制定个体化的术后复查或随访方案,若预测HCC患者术后晚期复发的概率较高,则应缩短患者每次复查或随访的间隔,以及时根据病情变化调整治疗方案;若预测HCC患者术后晚期复发的概率较低,可适当延长复查或随访间隔,以减轻患者经济与心理负担。

附图说明

图1为TCGA-LIHC样本、GSE76427样本中筛选在LR组、NR组差异表达基因的热图、火山图及筛选的差异化表达基因的富集分析;其中,A为TCGA-LIHC样本中差异表达基因的热图;B为TCGA-LIHC样本中差异表达基因的火山图;C为GSE76427样本中差异表达基因的热图;D为GSE76427样本中差异表达基因的火山图;E为筛选得到的差异化表达基因的富集分析结果图;

图2为TCGA-LIHC样本、GSE76427样本中HCC晚期复发高危组和HCC晚期复发低危组的Kaplan-Meier生存分析结果图;其中,Low表示HCC晚期复发低危组;High表示HCC晚期复发高危组;

图3为Lasso logistic回归分析的结果图,其中,A为LASSO模型最优基因个数筛选的结果图;B为LASSO模型的调优参数选择的Ten-time交叉验证结果图;

图4为TCGA-LIHC样本、GSE76427样本中每位患者的复发时间、风险评分及6个基因的表达量的统计结果图;其中,A为TCGA-LIHC样本;B为GSE76427样本;

图5为TCGA-LIHC样本、GSE76427样本中HCC晚期复发高危组和HCC晚期复发低危组风险评分与无复发生存期的Kaplan-Meier生存分析图;其中,Low表示HCC晚期复发低危组;High表示HCC晚期复发高危组;A为TCGA-LIHC样本;B为GSE76427样本;

图6为TCGA-LIHC样本、GSE76427样本中风险评分模型诊断区分HCC晚期复发患者和HCC不复发患者的ROC曲线图;其中,A为TCGA-LIHC样本;B为GSE76427样本;

图7为103例临床样本中HCC晚期复发高危组和HCC晚期复发低危组6个差异基因的表达水平图;其中,Low表示HCC晚期复发低危组;High表示HCC晚期复发高危组;

图8为103例临床样本中每位患者的复发时间、风险评分及6个基因的表达量的统计结果图;

图9为103例临床样本中HCC晚期复发高危组和HCC晚期复发低危组风险评分与无复发生存期的Kaplan-Meier生存分析图、ROC曲线图和复发率统计结果图;其中,A为Kaplan-Meier生存分析图,B为ROC曲线图,C为复发率统计结果图;其中,Low表示HCC晚期复发低危组;High表示HCC晚期复发高危组。

具体实施方式

以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、部件和/或它们的组合。

下列实施例中未注明具体条件的实验方法,均采用本技术领域常规技术,或按照生产厂商所建议的条件;所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。

为了使得本领域技术人员能够更加清楚地了解本发明的技术方案,以下将结合具体的实施例详细说明本发明的技术方案。

实施例1:与HCC晚期复发显著相关的基因的筛选和预测HCC晚期复发风险的风险评分模型的构建

1、实验样本的选取、数据采集和整理

按照纳入标准:(1)原发性肝细胞肝癌;(2)AJCC I-III期;(3)具有复发数据,从TCGA数据库(TCGA,https://portal.gdc.cancer.gov/)和GEO数据库(GEO,https:// www.ncbi.nlm.nih.gov/geo/,GEO ID:GSE76427)中选取实验样本。

经筛选,TCGA数据库中有73例患者符合标准,73例患者(记作TCGA-LIHC样本)中晚期复发患者26例(记作LR组),不复发患者47例(记作NR组),73例患者样本的转录组数据和临床数据均从TCGA数据库获取,并对73例样本的RNA-seq数据进行FPKM归一化处理,转化为log2FPKM;73例样本中不复发患者和晚期复发患者的临床数据信息统计如表1所示。GEO数据库中有21例患者(记作GSE76427样本)符合标准,21例患者中晚期复发(LR)患者9例,不复发(NR)患者12例,21例患者样本的芯片谱和临床数据均从GEO数据库获取,采用lumi R软件包对21例样本的芯片原始数据进行归一化处理。

表1 TCGA-LIHC样本中不复发患者和晚期复发患者的临床数据信息

2、与HCC晚期复发显著相关的基因的筛选和和验证

为了寻找HCC中与HCC晚期复发显著相关的基因,采用DEseq2包对TCGA-LIHC样本的转录组数据进行分析,筛选出在LR组、NR组差异表达的基因;采用limma R包对GSE76427样本的芯片谱数据进行分析,筛选出在LR组、NR组差异表达的基因。差异表达基因的筛选条件为矫正P值小于0.05。

DEseq2包筛选TCGA-LIHC样本中在LR组、NR组差异表达基因的热图和火山图分别如图1中A、B所示。经筛选,TCGA-LIHC样本中共筛选出1890个差异表达基因,其中,在LR组上调基因有1236个,下调基因有654个。limma R包筛选GSE76427样本中在LR组、NR组差异表达基因的热图和火山图分别如图1中C、D所示。经筛选,GSE76427样本中共筛选出1070个差异表达基因,其中,在LR组上调基因有506个,下调基因有564个。

取TCGA-LIHC样本和GSE76427样本筛选出的上调基因、下调基因的交集,共确定出14个重叠的上调基因和16个重叠的下调基因。进一步采用KEGG对30个重叠基因进行功能富集分析,探究这些基因的生物学功能。KEGG分析结果如图1中E所示。KEGG分析提示,30个重叠基因主要参与与癌症相关和代谢相关的通路,包括Ras信号通路、MAPK信号通路、α-亚麻酸通路和血管平滑肌收缩。

在TCGA-LIHC样本中,采用单因素COX回归分析和Kaplan-Meier分析对筛选出的30个重叠基因进行进一步的筛选,共筛选出6个与HCC晚期复发显著相关的重叠基因,6个重叠基因分别为ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因。根据TCGA-LIHC样本中每例患者6个重叠基因的表达量,分别采用survminer包确定ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因诊断区分LR组、NR组的最佳截断值;根据每个基因的最佳截断值将TCGA-LIHC样本中的患者划分为HCC晚期复发高危组和HCC晚期复发低危组,然后采用Kaplan-Meier法及Log-rank检验分析HCC晚期复发高危组和HCC晚期复发低危组患者6个重叠基因表达量与无复发生存期(RFS)之间的关系,其结果如图2中A~F所示。由图2中A~F可知,HCC晚期复发高危组患者的无复发生存时间与HCC晚期复发低危组有显著差异,HCC晚期复发高危组患者的无复发生存时间较短,预后差;说明ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因、TRABD2A基因的表达值与肝癌晚期复发之间显著相关。

在GSE76427样本中,根据每个样本中6个重叠基因的表达量,分别采用survminer包确定ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因诊断区分LR组、NR组的最佳截断值;根据每个基因的最佳截断值将GSE76427样本中的患者划分为HCC晚期复发高危组和HCC晚期复发低危组,然后采用Kaplan-Meier法及Log-rank检验分析HCC晚期复发高危组和HCC晚期复发低危组患者6个重叠基因表达量与无复发生存期(RFS)之间的关系,其结果如图2中G~L所示。由图2中G~L可知,HCC晚期复发高危组患者的无复发生存时间与HCC晚期复发低危组有显著差异,HCC晚期复发高危组患者的无复发生存时间较短,预后差;提示6个基因的表达值与肝癌晚期复发显著相关。

3、构建预测肝癌晚期复发风险的风险评分模型

在TCGA-LIHC样本中,根据筛选得到的6个与HCC晚期复发显著相关的基因(ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因),采用LASSO(最小绝对收缩与选择算子)logistic回归分析,利用glmnet软件包建立HCC晚期复发风险预测模型。通过十倍交叉验证,当部分似然偏差达到最小值(λ=0.012)时生成最优lambda。基于最优lambda,选择非零系数的基因建立预测模型。采用LASSO模型加权系数计算每个患者的风险评分如下:

式中n为关键基因数,Coef(i)为基因i的LASSO系数,Exp(i)为基因i的表达量。

LASSO logistic回归分析的结果如图3中A、B所示。经LASSO logistic回归分析,得到了HCC患者术后晚期复发的风险评分模型:风险评分=0.356+0.06×ANGPT4+0.110×FAM78B+0.046×COLEC12+0.063×TRABD2A+0.049×AMFR+0.004×LMTK3式I。

式I中,ANGPT4表示检测样本中ANGPT4基因的表达量,FAM78B表示检测样本中FAM78B基因的表达量;COLEC12表示检测样本中COLEC12基因的表达量;TRABD2A表示检测样本中TRABD2A基因的表达量;AMFR表示检测样本中AMFR基因的表达量;LMTK3表示检测样本中LMTK3基因的表达量。

实施例2:本发明预测肝癌晚期复发风险的风险评分模型预测能力评估及验证

以实施例1纳入的TCGA-LIHC样本为训练集,以GSE76427样本为验证集,评估并验证本发明预测肝癌晚期复发风险的风险评分预测模型与HCC晚期复发预后的关系。

1、本发明预测肝癌晚期复发风险的风险评分模型预测能力评估

在训练集中,采用survminer包确定风险评分模型诊断区分LR组、NR组的最佳截断值,并根据实施例1中构建的风险评分模型计算训练集中每个样本的风险评分(根据危险评分将训练集中73位患者排序,结果如图4中A所示,A中由上向下分别展示了训练集中73位患者的复发时间、风险评分及6个基因的表达量),然后根据最佳截断值及每个样本的风险评分,将训练集中的样本划分为HCC晚期复发高危组和HCC晚期复发低危组,然后采用Kaplan-Meier法及Log-rank检验分析HCC晚期复发高危组和HCC晚期复发低危组患者风险评分与无复发生存期(RFS)之间的关系,其结果如图5中A所示。由图5中A可知,HCC晚期复发高危组患者的无复发生存时间与HCC晚期复发低危组有显著差异(P=0.003),HCC晚期复发高危组患者的无复发生存时间较短,预后差。

进一步为了评估本发明实施例1构建的风险评分模型的有效性,根据训练集中每个样本的风险评分制作风险评分模型诊断区分HCC晚期复发患者和HCC不复发患者的ROC曲线,其结果如图6中A所示。由图6中A可知,本发明构建的风险评分模型诊断区分HCC晚期复发患者和HCC不复发患者的ROC曲线的AUC为0.73,其灵敏度为76.9%,特异度为61.6%,由此说明,本发明构建的预测肝癌晚期复发风险的风险评分模型具有较高的准确度。

2、本发明预测肝癌晚期复发风险的风险评分模型预测能力验证

在验证集中,采用survminer包确定风险评分模型诊断区分LR组、NR组的最佳截断值,并根据实施例1中构建的风险评分模型计算验证集中每个样本的风险评分(根据危险评分将验证集中21位患者排序,结果如图4中B所示,B中由上向下分别展示了验证集中21位患者的复发时间、风险评分及6个基因的表达量),然后根据最佳截断值及每个样本的风险评分,将训练集中的样本划分为HCC晚期复发高危组和HCC晚期复发低危组,然后采用Kaplan-Meier法和和Log-rank检验分析HCC晚期复发高危组和HCC晚期复发低危组患者风险评分与无复发生存期(RFS)之间的关系,其结果如图5中B所示。由图5中B可知,HCC晚期复发高危组患者的无复发生存时间与HCC晚期复发低危组有显著差异(P=0.003),HCC晚期复发高危组患者的无复发生存时间较短,预后差。

进一步为了验证本发明实施例1构建的风险评分模型的有效性,根据验证集中每个样本的风险评分制作风险评分模型诊断区分HCC晚期复发患者和HCC不复发患者的ROC曲线,其结果如图6中B所示。由图6中B可知,本发明构建的风险评分模型诊断区分HCC晚期复发患者和HCC不复发患者的ROC曲线的AUC为0.94,其灵敏度为88.9%,特异度为100%,由此说明,本发明构建的预测肝癌晚期复发风险的风险评分模型具有较高的准确度。

3、风险评分模型作为肝癌晚期复发患者RFS独立预后预测指标的可能性评估:

(1)在训练集样本中评估风险评分模型作为肝癌晚期复发患者RFS独立预后预测指标的可能性

在训练集中,应用R语言对可能与肝癌晚期复发相关的临床指标分别进行单因素Cox回归分析和多因素Cox回归分析,评估临床指标对肝癌晚期复发患者RFS的预后预测价值。其结果如表2和表3所示。

表2训练集样本中肝癌晚期复发患者RFS的单因素Cox回归分析结果

由表2可知,风险评分和肌酐在单因素Cox回归分析中有统计学意义,是肝癌晚期复发的危险因素,而年龄、性别、分期、分级及凝血酶原时间没有统计学意义。

表3训练集样本中肝癌晚期复发患者RFS的多因素Cox回归分析结果

由表3可知,多因素Cox回归进一步得出风险评分是肝癌晚期复发独立的危险因素。

(2)在验证集样本中验证风险评分模型作为肝癌晚期复发患者RFS独立预后预测指标的可能性

在验证集中,应用R语言对可能与肝癌晚期复发相关的临床指标分别进行单因素Cox回归分析和多因素Cox回归分析,评估临床指标对肝癌晚期复发患者RFS的预后预测价值。其结果如表4和表5所示。

表4验证集样本中肝癌晚期复发患者RFS的单因素Cox回归分析结果

由表4可知,风险评分及TNM分期是肝癌晚期复发的危险因素。

表5验证集样本中肝癌晚期复发患者RFS的多因素Cox回归分析结果

由表5可知,风险评分及TNM分期是肝癌晚期复发的独立危险因素。

实施例3:临床样本验证本发明预测肝癌晚期复发风险的风险评分模型预测能力

采用qRT-PCR对临床收集的103例HCC患者肝癌组织样本中ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因的表达量进行检测,根据检测结果验证验证本发明预测肝癌晚期复发风险的风险评分模型的预测能力。

1、实验样本

收集来自郑州大学第一附属医院的103例AJCC I-III期HCC患者手术切除肝癌组织样本,103例患者的纳入标准为:(1)原发性肝细胞肝癌;(2)手术切除;(3)有复发数据。103例患者中晚期复发患者42例(记作LR组),不复发患者61例(记作NR组)。103例样本的临床数据信息如表6所示。

表6 103例临床样本的临床数据信息统计

2、采用qRT-PCR对临床103例HCC样本中ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因的表达量进行检测

使用RNAiso Plus试剂(Takara,中国大连),按照制造商的说明书,肝癌组织中分离总RNA。RNA质量使用NanoDrop One C(Waltham,MA,USA)进行评估,RNA完整性使用琼脂糖凝胶电泳进行评估。使用mRNA逆转录试剂盒(TaKaRa BIO,Japan)将1μg总RNA逆转录为互补DNA(cDNA)。然后采用SYBR Assay I Low ROX(Eurogentec,USA)和GreenPCRMasterMix(Yeason Shanghai,China)对所有样本的cDNA进行qRT-PCR反应,检测样本中ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因的表达量。将目的基因的表达值归一化为GAPDH,然后转化log2进行后续分析。6个基因与GAPDH的引物序列见表7。

表7 qRT-PCR扩增引物

根103例临床样本的qRT-PCR检测结果,分别采用survminer包确定ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因诊断区分LR组、NR组的最佳截断值,根据每个基因的最佳截断值将103例临床样本中的患者划分为HCC晚期复发高危组和HCC晚期复发低危组,HCC晚期复发高危组和HCC晚期复发低危组的基因表达量差异如图7所示。由图7可知,6个基因在HCC晚期复发高危组的表达量均明显高于和HCC晚期复发低危组,差异具有统计学意义。

3、在103例临床样本中验证本发明预测肝癌晚期复发风险的风险评分模型预测能力

在103例临床样本中,根据qRT-PCR检测的6个基因(ANGPT4基因、AMFR基因、COLEC12基因、FAM78B基因、LMTK3基因和TRABD2A基因)的表达量,采用survminer包确定实施例1中构建的风险评分模型诊断区分LR组、NR组的最佳截断值,并根据风险评分模型计算103例临床样本中每个样本的风险评分(根据危险评分将临床103例患者排序,结果如图8所示,图8中由上向下分别展示了临床103例患者的风险评分、复发时间及6个基因的表达量),然后根据最佳截断值及每个样本的风险评分,将训练集中的样本划分为HCC晚期复发高危组和HCC晚期复发低危组,然后采用Kaplan-Meier法和和Log-rank检验分析HCC晚期复发高危组和HCC晚期复发低危组患者风险评分与无复发生存期(RFS)之间的关系,其结果如图9中A所示。由图9中A可知,HCC晚期复发高危组患者的无复发生存时间与HCC晚期复发低危组有显著差异(P<0.001),HCC晚期复发高危组患者的无复发生存时间较短,预后差。

进一步为了验证本发明实施例1构建的风险评分模型的有效性,根据103例临床样本中每个样本的风险评分制作风险评分模型诊断区分HCC晚期复发患者和HCC不复发患者的ROC曲线,其结果如图9中B所示。由图9中B可知,本发明构建的风险评分模型诊断区分HCC晚期复发患者和HCC不复发患者的ROC曲线的AUC为0.851,其灵敏度为81%,特异度为82%。由此说明,本发明构建的预测肝癌晚期复发风险的风险评分模型具有较高的准确度。

此外,统计HCC晚期复发高危组、HCC晚期复发低危组患者中实际发生晚期复发的患者人数,根据统计结果计算HCC晚期复发高危组、HCC晚期复发低危组的晚期复发率,结果如图9中C所示。由图9中C可知,HCC晚期复发高危组中实际发生晚期复发的复发率为69%,HCC晚期复发低危组中实际发生晚期复发的复发率为13%,HCC晚期复发高危组中实际发生晚期复发的复发率明显高于HCC晚期复发低危组,差异具有统计学意义(p<0.001)。

应用R语言对103例临床样本中可能与肝癌晚期复发相关的临床指标分别进行单因素Cox回归分析和多因素Cox回归分析,评估临床指标对肝癌晚期复发患者RFS的预后预测价值,其单因素Cox回归分析和多因素Cox回归分析结果分别如表8和表9所示。

表8 103例临床样本中肝癌晚期复发患者RFS的单因素Cox回归分析结果

表9 103例临床样本中肝癌晚期复发患者RFS的多因素Cox回归分析结果

由表8和表9可知,危险评分、男性、肝硬化及微血管侵犯是肝癌患者晚期复发的独立危险因素,这与我们试验的预期结果一致。由此说明,风险评分模型可以作为肝癌患者RFS独立预后预测指标。

综上所述,103例临床样本的实验结果与训练集、验证集基本保持一致,说明本发明构建的预测HCC晚期复发风险的风险评分模型可以作为肝癌患者术后RFS的独立预后预测指标,而且预测结果准确度高。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

序列表

<110> 郑州大学第一附属医院

<120> 一种用于预测肝癌患者术后晚期复发风险的生物标志物及检测试剂盒

<160> 12

<170> SIPOSequenceListing 1.0

<210> 1

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

tccttaaaga cacctaagcc agtg 24

<210> 2

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

ggtcctctgg aaatttacgc ttcc 24

<210> 3

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

cctgcactgc tctagctact tc 22

<210> 4

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

gatcccaatt tcaactgtga gatc 24

<210> 5

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

gaagctagta gactccaagc 20

<210> 6

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ctctcctttc tgtcccttgt 20

<210> 7

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

ttctttggca caatccatgt cc 22

<210> 8

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gggagcacat cttggaggtt 20

<210> 9

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

gaccaggaag agggagaaac ttc 23

<210> 10

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

cctccaggcg aggactga 18

<210> 11

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

aatgtctgcg taaccgcacg 20

<210> 12

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

ggcgaatcca tcggggtg 18

23页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:小分子标志物相关的产品在诊断疾病中的用途

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!