基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒

文档序号:139193 发布日期:2021-10-22 浏览:22次 >En<

阅读说明:本技术 基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒 (System and kit for diagnosing hepatocellular carcinoma based on multiple urine proteins ) 是由 孙薇 贺福初 赵颖华 牟劲松 邢宝才 刘万里 于 2020-04-17 设计创作,主要内容包括:本公开涉及基于多个尿液蛋白诊断肝细胞癌的系统,该系统包括输入装置、计算装置和输出装置;其中,所述多个尿液蛋白包括HPX、APOH、GLRX和PLG,所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值。通过上述技术方案,本公开为肝细胞癌诊断提供了高特异性、高灵敏度的分子标记物、试剂盒及诊断系统,能够对肝细胞癌进行快速、灵敏、准确的诊断。(The present disclosure relates to a system for diagnosing hepatocellular carcinoma based on a plurality of urine proteins, the system comprising an input device, a computing device, and an output device; wherein the plurality of urine proteins comprise HPX, APOH, GLRX and PLG, and the relative expression score is a score of the expression values of the plurality of urine proteins relative to their respective expression thresholds at which they are abnormally expressed in hepatocellular carcinoma. Through the technical scheme, the molecular marker, the kit and the diagnosis system with high specificity and high sensitivity are provided for hepatocellular carcinoma diagnosis, and hepatocellular carcinoma can be diagnosed quickly, sensitively and accurately.)

基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒

技术领域

本公开涉及生物医学技术领域,具体地,涉及基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒。

背景技术

肝细胞癌(hepatocellularcarcinoma,HCC)是常见的恶性肿瘤之一,在全世界范围内,肝细胞癌的发病率排名第六,死亡率排名第四,并且其发病率有逐渐增高的趋势。乙型肝炎病毒(hepatitisBvirus,HBV)慢性感染是诱发肝细胞癌的高危因素,具有HBV感染背景的慢性乙肝肝炎(chronichepatitisB)和肝硬化(livercirrhosis,LC)患者是发生肝细胞癌的高危人群。目前肝细胞癌患者的5年生存率较差,肝细胞癌的早期诊断能够使肝细胞癌患者得到及时治疗,对于提高肝细胞癌患者的生存率具有重要意义。

在相关技术中,主要通过B超等影像学检查联合血清标志物甲胎蛋白(alpha-fetoprotein,AFP)水平检测来进行肝细胞癌的临床诊断。

然而,利用甲胎蛋白作为标志物进行肝细胞癌诊断的灵敏度较低,而且甲胎蛋白来源于血清,血清中含有大量高丰度蛋白,影响甲胎蛋白检测结果的准确性。

发明内容

本公开的目的是提供与肝细胞癌密切相关的新的生物标记物,能够灵敏、准确地对受试者是否患有肝细胞癌进行诊断。

为了实现上述目的,第一方面,本公开提供一种基于多个尿液蛋白诊断肝细胞癌的系统,该系统包括输入装置、计算装置和输出装置;其中,

所述输入装置用于输入受试者的多个尿液蛋白的相对表达分值,其中所述多个尿液蛋白包括HPX、APOH、GLRX和PLG,所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值;

所述计算装置包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被配置为执行所述存储器中存储的计算机程序,以实现建模算法和如式(1)所示的判别函数的算法;

F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]

式(1),

式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值;

所述输出装置用于输出肝细胞癌的诊断结果。

可选地,所述多个尿液蛋白包括HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS,则所述判别函数如式(2)所示:

f(c)=sgn[f1(c1)+f2(c2)+f3(c3)+f4(c4)+f5(c5)+f6(c6)+f7(c7)+b2]

式(2),

式(2)中,f(c)表示受试者是否患有肝细胞癌的诊断结果,f(c)返回值为1表示受试者患有肝细胞癌,f(c)返回值为-1表示受试者未患有肝细胞癌;c1、c2、c3、c4、c5、c6和c7依次分别表示HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的相对表达分值;f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)和f7(c7)分别为依据建模算法训练得到的核函数,b2为依据建模算法训练得到的临界打分值。

可选地,尿液蛋白在肝细胞癌中的异常表达包括高表达和低表达,则所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值,包括:

若尿液蛋白在肝细胞癌中的异常表达为高表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的高表达阈值的打分值;

若尿液蛋白在肝细胞癌中的异常表达为低表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的低表达阈值的打分值。

可选地,当尿液蛋白在肝细胞癌中的异常表达为高表达时,若所述尿液蛋白的表达值大于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一正相关分值,优选地,所述第一正相关分值的取值为1;若所述尿液蛋白的表达值小于等于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一负相关分值,优选地,所述第一负相关分值的取值为0;

当尿液蛋白在肝细胞癌中的异常表达为低表达时,若所述尿液蛋白的表达值小于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二正相关分值,优选地,所述第二正相关分值的取值为1;若所述尿液蛋白的表达值大于等于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二负相关分值,优选地,所述第二负相关分值的取值为0。

可选地,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值;

式(2)中,f1(c1)=c1,f2(c2)=c2,f3(c3)=c3,f4(c4)=c4,f5(c5)=c5,f6(c6)=c6,f7(c7)=c7,b2为大于-5小于-4的任意数值。

可选地,所述受试者包括具有乙型肝炎病毒感染背景的受试者,优选地,所述受试者包括慢性乙型肝炎患者和/或肝硬化患者。

第二方面,本公开提供用于检测分子标记物的表达值的试剂在制备诊断肝细胞癌的试剂盒和/或系统中的用途,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。

可选地,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;

所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。

第三方面,本公开提供一种用于诊断肝细胞癌的试剂盒,所述试剂盒含有分子标记物和/或用于检测分子标记物的表达值的试剂,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。

可选地,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;

所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。

通过上述技术方案,本公开为肝细胞癌诊断提供了高特异性、高灵敏度的分子标记物、试剂盒及诊断系统,能够对肝细胞癌进行快速、灵敏、准确的诊断。

本公开的其他特征和优点将在随后的

具体实施方式

部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:

图1是本公开实施例发现集中排名前10的尿液蛋白。

图2是本公开实施例发现集中排名前10的尿液蛋白的ROC分析结果图。

图3是本公开实施例发现集中肝细胞癌判别模型的ROC曲线图。

图4是本公开实施例验证集中肝细胞癌判别模型的ROC曲线图。

图5是本公开实施例发现集中又一肝细胞癌判别模型的ROC曲线图。

图6是本公开实施例发现集中又一肝细胞癌判别模型的ROC曲线图。

图7是本公开实施例验证集中又一肝细胞癌判别模型的ROC曲线图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。

本公开的第一方面提供一种基于多个尿液蛋白诊断肝细胞癌的系统,该系统包括输入装置、计算装置和输出装置;其中,所述输入装置用于输入受试者的多个尿液蛋白的相对表达分值,其中所述多个尿液蛋白包括HPX、APOH、GLRX和PLG,所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值;所述计算装置包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被配置为执行所述存储器中存储的计算机程序,以实现建模算法和如式(1)所示的判别函数的算法;

F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]

式(1),

式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值;所述输出装置用于输出肝细胞癌的诊断结果。

可选地,所述多个尿液蛋白包括HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS,则所述判别函数如式(2)所示:

f(c)=sgn[f1(c1)+f2(c2)+f3(c3)+f4(c4)+f5(c5)+f6(c6)+f7(c7)+b2]

式(2),

式(2)中,f(c)表示受试者是否患有肝细胞癌的诊断结果,f(c)返回值为1表示受试者患有肝细胞癌,f(c)返回值为-1表示受试者未患有肝细胞癌;c1、c2、c3、c4、c5、c6和c7依次分别表示HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的相对表达分值;f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)和f7(c7)分别为依据建模算法训练得到的核函数,b2为依据建模算法训练得到的临界打分值。

其中,HPX为血红素结合蛋白,UniProt数据库编号为P02790,NCBI数据库编号为3263;GOT1为谷氨酸草酰乙酸转氨酶1,UniProt数据库编号为P17174,NCBI数据库编号为2805;APOH为载脂蛋白H,UniProt数据库编号为P02749,NCBI数据库编号为350;APCS为血清淀粉样蛋白P组分,UniProt数据库编号为P02743,NCBI数据库编号为325;GLRX为谷氧还蛋白,UniProt数据库编号为P35754,NCBI数据库编号为2745;PLG为血纤维蛋白溶酶原,UniProt数据库编号为P00747,NCBI数据库编号为5340;NCR3LG1为自然杀伤细胞毒性受体3配体1,UniProt数据库编号为Q68D85,NCBI数据库编号为374383。

目前常用的肝细胞癌诊断分子标记物主要来源于血清,然而血清中含有大量高峰度蛋白,对肝细胞癌诊断分子标记物的检测非常不利,导致血清中肝细胞癌诊断分子标记物的检测灵敏度低,肝细胞癌诊断结果不够准确;而且,对于需要进行肝细胞癌诊断的患者来说,特别是容易发生肝细胞癌的高危人群,需要定期进行肝细胞癌的临床诊断,然而血清的采集是有创的,长期的血清采集容易影响患者身体健康。

尿液中蛋白质组分的复杂程度较低,高峰度蛋白含量较少,因此尿液中的低丰度蛋白容易被检出,检测灵敏度较高;而且,尿液的采集完全无创,可以连续、大量地采集,不会对患者身体健康造成影响。

通过上述技术方案,本公开提供的肝细胞癌的诊断系统,能够根据受试者尿液中多种尿液蛋白的相对表达分值来判断受试者是否患有肝细胞癌,该多种尿液蛋白来自尿液,尿液中蛋白质组分的复杂程度较低,高峰度蛋白含量较少,因此,该多种尿液蛋白容易被检出,检测结果准确,检测灵敏度高。

可选地,尿液蛋白在肝细胞癌中的异常表达包括高表达和低表达,则所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值,包括:若尿液蛋白在肝细胞癌中的异常表达为高表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的高表达阈值的打分值;若尿液蛋白在肝细胞癌中的异常表达为低表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的低表达阈值的打分值。

示例性地,HPX在肝细胞癌中的异常表达为高表达,表达阈值可以为9.5;APOH在肝细胞癌中的异常表达为高表达,表达阈值可以为9.4;GLRX在肝细胞癌中的异常表达为低表达,表达阈值可以为8.3;PLG在肝细胞癌中的异常表达为高表达,表达阈值可以为8.1;NCR3LG1在肝细胞癌中的异常表达为低表达,表达阈值可以为4.4;GOT1在肝细胞癌中的异常表达为低表达,表达阈值可以为6.6;APCS在肝细胞癌中的异常表达为高表达,表达阈值可以为5.0。上述表达阈值仅用于对本公开的解释说明,并不用于限制本公开,在实际运用中,表达阈值的具体取值可能会随着检测方法的改变而改变,也可能会随着训练数据集的数据规模大小等因素发生改变。

可选地,当尿液蛋白在肝细胞癌中的异常表达为高表达时,若所述尿液蛋白的表达值大于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一正相关分值;若所述尿液蛋白的表达值小于等于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一负相关分值;当尿液蛋白在肝细胞癌中的异常表达为低表达时,若所述尿液蛋白的表达值小于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二正相关分值;若所述尿液蛋白的表达值大于等于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二负相关分值。

根据本公开,当某一尿液蛋白的相对表达分值为第一正相关分值或者第二正相关分值时,说明该尿液蛋白此时的表达值对肝细胞癌的发生具有促进作用;当某一尿液蛋白的相对表达分值为第一负相关分值或者第二负相关分值时,说明该尿液蛋白此时的表达值对肝细胞癌的发生不具有促进作用。其中,上述第一正相关分值、第一负相关分值、第二正相关分值和第二负相关分值的取值可以在较大的范围内变化,只要其取值能够准确表征其是否会促进肝细胞癌的发生即可,例如,第一正相关分值和第二正相关分值可以为大于0的任意数值,第一负相关分值和第二负相关分值可以为小于等于0的任意数值。优选地,所述第一正相关分值的取值为1,所述第一负相关分值的取值为0,所述第二正相关分值的取值为1,所述第二负相关分值的取值为0。

根据本公开,作为本公开的一个具体实施例,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值;式(2)中,f1(c1)=c1,f2(c2)=c2,f3(c3)=c3,f4(c4)=c4,f5(c5)=c5,f6(c6)=c6,f7(c7)=c7,b2为大于-5小于-4的任意数值。需要说明的是,F1(c1)、F2(c2)、F3(c3)、F4(c4)、f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)、f7(c7)、b1和b2均可能会随着尿液蛋白的表达值检测手段的偏性而发生改变,也可能会随着训练数据集的数据规模大小等因素发生改变。

优选地,所述受试者包括具有乙型肝炎病毒感染背景的受试者,优选地,所述受试者包括慢性乙型肝炎患者和/或肝硬化患者。

可选地,该系统还可以包括多个尿液蛋白的表达值的检测装置。多个尿液蛋白的表达值的检测装置能够直接或间接地检测尿液样本中的多个尿液蛋白的表达值,并将检测结果通过输入装置输入值计算装置。

优选地,所述多个尿液蛋白的表达值的检测装置可以包括尿液蛋白表达值检测芯片和芯片信号读取器,所述尿液蛋白表达值检测芯片包括分别检测HPX、GOT1、APOH、APCS、GLRX、PLG和NCR3LG1的表达值的探针。

可选地,所述输入装置与所述计算装置之间通过有线方式和/或无线方式连接,所述计算装置和所述输出装置之间通过有线和/或无线方式连接;所述计算装置为电脑主机、中央处理器或网络服务器,所述输出装置为显示器、打印机或音频输出装置。

本公开的第二方面提供用于检测分子标记物的表达值的试剂在制备诊断肝细胞癌的试剂盒和/或系统中的用途,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。

可选地,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。

本公开的第三方面提供一种用于诊断肝细胞癌的试剂盒,所述试剂盒含有分子标记物和/或用于检测分子标记物的表达值的试剂,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。

可选地,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。

以下通过实施例进一步详细说明本发明。

本公开实施例所涉及的名词解释:

受试者工作特征(receiver(relative)operatingcharacteristic,ROC)曲线反映了灵敏度与特异度间的平衡,ROC曲线下面积是重要的试验准确度指标。分别计算各个试验的ROC曲线下的面积(AUC)进行比较,面积大者,试验的诊断价值大。

灵敏度(真阳性率):实际有病而按试验标准被正确判断为有病的百分率,灵敏度越大越好,理想灵敏度为100%。

特异度(真阴性率):实际无病而按试验标准被正确判断为无病的百分率,特异度越大越好,理想特异度100%。

约登指数:灵敏度+特异度-1,约登指数越大说明筛查实验的效果越好,真实性越大。

下述实施例中所使用的实验方法如无特殊说明,均为常规方法。

下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

实施例1

本实施例用于说明本公开的生物标志物的发现

一、实验材料

尿液样本来自:有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR)43例;有HBV慢性感染背景的肝细胞癌患者(HCC)36例。

其中,肝炎,肝硬化以及肝细胞癌患者均为临床确诊病人。

二、实验方法

通过蛋白质组学方法对尿液样本进行鉴定和非标定量,找到差异蛋白,构建联合应用模型进行HCC诊断。所用质谱仪器为ThermoFisher公司HF质谱仪,超滤管为Millipore公司3kDa超滤管(货号:UFC500396),胰酶为Promega公司的胰蛋白酶(货号:V5111),Bradford蛋白定量试剂购自ThermoFisher公司,试剂二硫苏糖醇(DTT),碘乙酰胺(IAA),尿素,碳酸氢钠,甲酸购自Sigma公司。具体方法如下:

1、取1ml尿液样本加入超滤管中,14000g离心浓缩至100微升,得到浓缩尿液;

2、在浓缩尿液中加入10微升1MDTT溶液,37摄氏度还原30分钟;

3、加入40微升1MIAA溶液,避光反应30分钟,14000g离心20min;

4、加入100微升8M尿素溶液,14000g离心20min洗一次;

5、加入100微升50mM碳酸氢铵溶液,14000g离心20min,重复两次,使最终尿素浓度低于1M;

6、使用Bradford试剂进行蛋白定量,取20微克蛋白,按照酶:蛋白=1:50的比例加入胰蛋白酶,进行滤膜辅助酶切,37摄氏度过夜酶切;

7、第二天将样品14000g离心20min,滤出液即酶切后的肽段,在滤膜内加入50微升质谱级水,14000g离心20min,合并滤液,进行真空干燥;

8、用含0.1%甲酸的水溶液复溶肽段,取500ng进行质谱上样;

9、质谱采用75分钟梯度,得到的质谱文件通过MaxQuant软件搜库得到定性和非标定量信息,蛋白定量数据通过总面积法进行标准化,并进行log2转换,缺失值以最小值填充;

10、在43例HR和36例HCC尿液样本组成的发现集里,利用R软件,筛选两组间表达量差异显著的蛋白(Wilcoxon检验,p<0.05),通过递归特征消除(RFE)的策略筛选其中排名前十的10个蛋白,分别为HPX、GOT1、APOH、APCS、TMEM27、GLRX、PLG、NCR3LG1、LPA和TINAG,如图1所示;

11、对上述10个蛋白进行ROC分析,曲线下面积分别为0.85,0.76,0.76,0.77,0.71,0.77,0.77,0.80,0.75和0.72,可见所有蛋白的AUC均在0.7以上,如图2所示,最大约登指数高于50%的蛋白有7个蛋白,分别为HPX、GOT1、APOH、APCS、GLRX、PLG和NCR3LG1,说明这7个蛋白在分类的时候具有更好的诊断效果。

实施例2

本实施例用于验证NCR3LG1诊断肝细胞癌的预测性能

本实施例中直接利用尿液NCR3LG1的表达值与其在HCC的表达阈值来进行肝细胞癌的诊断,NCR3LG1在肝细胞癌中的异常表达为低表达,当NCR3LG1的表达值低于其在HCC的低表达阈值时,说明受试者患有肝细胞癌,当NCR3LG1的表达值高于其在HCC的低表达阈值时,说明受试者患未有肝细胞癌。对发现集中诊断结果进行ROC分析,结果显示AUC=0.80,灵敏度为86%、特异度为67%,说明本公开提供的尿液蛋白NCR3LG1可用于肝细胞癌的诊断。

重新选取19例有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR);18例有HBV慢性感染背景的肝细胞癌患者(HCC),组成验证集,获取每个患者的尿液样本,并按照实施例1的方法检测每个患者的尿液样本中NCR3LG1的表达值,进行ROC分析,结果显示AUC=0.73,灵敏度为89%、特异度为68%。

实施例3

本实施例用于说明如式(1)所示的预测模型的建立

利用R软件,计算实施例1尿液样本中HPX、APOH、GLRX和PLG的最大约登指数,确定其阈值(cutoff),将每个样本中此4个蛋白的表达值与阈值对比,根据表达情况进行打分,高于HCC组高表达蛋白的阈值或者低于HCC组低表达蛋白的阈值记为1分,否则为0分,每个样本的得分为4个蛋白打分之和,利用此方法构建投票模型,整合多个蛋白进行诊断,该模型如式(1)所示:

F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]

式(1),

式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值。具体地,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值,例如b1=-2.5,也就是说判别函数具体可以为:

F(C)=sgn[C1+C2+C3+C4-2.5]式 (3)

在发现集中进行ROC分析,AUC为AUC=0.92,灵敏度为81%、特异度为83%,如图3所示。

实施例4

本实施例用于说明如式(3)所示的预测模型的验证

重新选取19例有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR);18例有HBV慢性感染背景的肝细胞癌患者(HCC)组成验证集,获取每个患者的尿液样本,通过实施例1的方法检测每个患者的尿液样本中HPX、APOH、GLRX和PLG的表达值,并利用验证集对式(3)的诊断效果进行验证,验证结果显示,AUC=0.86,灵敏度为78%、特异度为89%,如图4所示。

对比例1

在进行实施例3的同时,在筛选出来的差异尿液蛋白中选取不同于HPX、APOH、GLRX和PLG的组合的尿液蛋白组合,作为诊断肝细胞癌的生物标志物,具体为GOT1、TMEM27、LPA和TINAG。

在进行实施例4的同时,采用与实施例4相同的方法进行评估,结果显示,AUC=0.72,灵敏度为72%、特异度为53%。

实施例5

本实施例用于说明标志物HPX、APOH、GLRX和PLG的验证

重新选取20例有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR);20例有HBV慢性感染背景的肝细胞癌患者(HCC),获取每个患者的尿液样本,通过多重反应监测(MRM)方法检测每个患者的尿液样本中HPX、APOH、GLRX和PLG的表达值。利用R软件,计算这4个蛋白的最大约登指数,确定其阈值(cutoff),分别为:HPX:9.3,APOH:5.7,GLRX:4.8,PLG:5.0。将每个样本中此4个蛋白的表达值与阈值对比,根据表达情况进行打分,高于HCC组高表达蛋白的阈值或者低于HCC组低表达蛋白的阈值记为1分,否则为0分,每个样本的得分为4个蛋白打分之和,利用此方法构建投票模型,整合多个蛋白进行诊断,该模型如式(1)所示:

F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]

式(1),

式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值。具体地,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值,例如b1=-2.7,也就是说判别函数具体可以为:

F(C)=sgn[C1+C2+C3+C4-2.7]式 (4)

在MRM数据集中进行ROC分析,AUC=0.91,灵敏度为90%、特异度为80%,如图5所示。

实施例6

本实施例用于说明如式(2)所示的预测模型的建立

利用R软件,对实施例1的尿液样本中HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的最大约登指数进行计算,确定其阈值(cutoff),将每个样本中此7个蛋白的表达值与阈值对比,根据表达情况进行打分,高于HCC组高表达蛋白的阈值或者低于HCC组低表达蛋白的阈值记为1分,否则为0分,每个样本的得分为7个蛋白打分之和,利用此方法构建投票模型,整合多个蛋白进行诊断,该模型如式(2)所示:

f(c)=sgn[f1(c1)+f2(c2)+f3(c3)+f4(c4)+f5(c5)+f6(c6)+f7(c7)+b2]

式(2),

式(2)中,f(c)表示受试者是否患有肝细胞癌的诊断结果,f(c)返回值为1表示受试者患有肝细胞癌,f(c)返回值为-1表示受试者未患有肝细胞癌;c1、c2、c3、c4、c5、c6和c7依次分别表示HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的相对表达分值;f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)和f7(c7)分别为依据建模算法训练得到的核函数,b2为依据建模算法训练得到的临界打分值。具体地,式(2)中,f1(c1)=c1,f2(c2)=c2,f3(c3)=c3,f4(c4)=c4,f5(c5)=c5,f6(c6)=c6,f7(c7)=c7,b2为大于-5小于-4的任意数值,例如b2=-4.5,也就是说判别函数具体为:

f(c)=sgn[c1+c2+c3+c4+c5+c6+c7-4.5]式 (5)

在发现集中进行ROC分析,AUC=0.96,灵敏度为89%、特异度为88%,如图6所示。

实施例7

本实施例用于说明如如式(5)所示的预测模型的验证。

重新选取19例有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR);18例有HBV慢性感染背景的肝细胞癌患者(HCC),获取每个患者的尿液样本,并按照实施例1的方法检测每个患者的尿液样本中HPX、GOT1、APOH、APCS、GLRX、PLG和NCR3LG1的表达值,组成验证集,并利用验证集对式(4)的诊断效果进行验证,验证结果显示,AUC=0.90(图7),灵敏度为100%、特异度为79%。

对比例2

在进行实施例5的同时,在筛选出来的差异尿液蛋白中选取不同于HPX、GOT1、APOH、APCS、GLRX、PLG和NCR3LG1的组合的尿液蛋白组合,作为诊断肝细胞癌的生物标志物,具体为TMEM27、LPA、TINAG、MASP2、ALDH1A1、ACY1和RAB7A。

在进行实施例6的同时,采用与实施例6相同的方法进行评估,结果显示,AUC=0.79,灵敏度为83%、特异度为63%。

以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。

此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于医学检验数据的多病种预测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!