基于质谱技术发现胃癌多肽谱生物标志物的一种无创快捷的筛选方法及其应用

文档序号:499599 发布日期:2022-01-07 浏览:12次 >En<

阅读说明:本技术 基于质谱技术发现胃癌多肽谱生物标志物的一种无创快捷的筛选方法及其应用 (Noninvasive and rapid screening method for discovering gastric cancer polypeptide spectrum biomarkers based on mass spectrometry technology and application thereof ) 是由 黄飞娟 吴正治 黄东娜 蔡元哲 刘展艳 从文娟 杨世伟 张玉 李光熙 于 2020-06-18 设计创作,主要内容包括:本发明涉及基于质谱技术发现胃癌多肽谱生物标志物的一种无创快捷的筛选方法及其应用,包括如下步骤:(1)取肿瘤患者和健康人临床唾液样本,进行多肽提取;(2)对提取到的多肽样本进行多肽谱峰分析;(3)将得到的多肽谱峰分析结果进行统计分析,得到显著差异肽峰;(4)进一步地,进行诊断小组的建立与验证、鉴定显著差异肽峰的蛋白归属。本发明采用该筛选方法从唾液中筛选出系列可以用于胃癌诊断的生物标志物,这些胃癌生物标志物的敏感度显著高于常用的血清肿瘤标志物CEA、CA72-4、CA125和CA19-9。且这些生物标志物来源于唾液,因此为肿瘤的诊断提供了新的非侵入性检测方法。本方法具有无创、高通量、微上样量、快速便捷等特点。(The invention relates to a noninvasive and rapid screening method for discovering gastric cancer polypeptide spectrum biomarkers based on a mass spectrometry technology and application thereof, and the noninvasive and rapid screening method comprises the following steps: (1) taking clinical saliva samples of tumor patients and healthy people, and extracting polypeptides; (2) performing polypeptide peak analysis on the extracted polypeptide sample; (3) performing statistical analysis on the obtained polypeptide spectrum peak analysis result to obtain a significant difference peptide peak; (4) further, the establishment and verification of a diagnostic group are carried out, and the protein attribution of the peptide peak with the significant difference is identified. The screening method is adopted to screen a series of biomarkers which can be used for gastric cancer diagnosis from saliva, and the sensitivity of the gastric cancer biomarkers is remarkably higher than that of the common serum tumor markers CEA, CA72-4, CA125 and CA 19-9. And the biomarkers are from saliva, so that a novel non-invasive detection method is provided for the diagnosis of tumors. The method has the characteristics of no wound, high flux, micro sample loading, rapidness, convenience and the like.)

基于质谱技术发现胃癌多肽谱生物标志物的一种无创快捷的 筛选方法及其应用

技术领域

本发明属于分子诊断技术领域,具体涉及一种胃癌多肽谱生物标志物的筛选方法及其应用,尤其涉及一种基于质谱技术发现胃癌多肽谱生物标志物的一种无创快捷的筛选方法及其应用。

背景技术

胃癌是世界上第六大最常见的癌症,在所有癌症死亡率中排名第三,胃癌是多因素疾病,高脂肪、高盐、高糖饮食、EB病毒、遗传因素、胃癌前病变和吸烟会增加胃癌的发生机率。胃癌在地理上有高度异质性,胃癌患者的性别结构有差异。胃癌是一种侵袭性疾病,肿瘤具有生物学和遗传学上的异质性,其致癌作用在分子水平上尚不清楚。胃癌(GC)患者的预后很差,如果早期诊断为胃癌,生存率将显著提高,一旦扩散,生存率将急剧下降。因此,早期检测、定时复查、积极监测,选择合适的治疗方案,是降低胃癌死亡率的关键。

CN110484624A公开了一种基于外周血的胃癌生物标志物及其检测方法和应用。该发明同时公开了通过检测外周血RNA m6A水平来诊断胃癌的试剂或试剂盒。该发明提供的特异的外周血RNA m6A通过单独或联合相关mRNA或联合血清肿瘤标志物检测组合作为诊断胃癌的中间结果,有助于医师结合临床症状、病史或其他检查信息进行胃癌的诊断。

CN108490179A公开了Metaxin-2作为胃癌诊断标志物的应用。本发明研究发现,胃癌患者Metaxin-2基因或蛋白的表达水平与健康人或者癌旁组织相比,表达水平显著降低,因此可作为胃癌诊断标志物,用于制备胃癌诊断制剂和试剂盒产品。该发明提供了一种新的特异性的胃癌生物标志物Metaxin-2,并给出了具有参考价值的Metaxin-2的检测方法。该胃癌生物标志物Metaxin-2用于胃癌的胃癌筛查/诊断效果好,准确性高,具有很好的应用前景,值得大范围推广。

CN108872599A公开了PDLIM3作为胃癌诊断标志物的应用。该发明研究发现,胃癌患者PDLIM3基因或蛋白的表达水平与健康人或者癌旁组织相比,表达水平显著升高,因此可作为胃癌诊断标志物,用于制备胃癌诊断制剂和试剂盒产品。

基于临床信息和综合基因组分析鉴定生物标志物,可提高诊断和预后。质谱仪和生物信息学工具可以对待测样品进行高精确度、高特异性的蛋白质组学分析,但现有技术中利用该策略进行胃癌生物标志物筛选的报道还鲜少。

发明内容

针对现有技术的不足,本发明的目的在于提供一种胃癌多肽谱生物标志物的筛选方法及其应用,尤其提供基于质谱技术发现胃癌多肽谱生物标志物的一种无创快捷的筛选方法及其应用。

所述“快捷”是指本发明所涉及的筛选方法借助Clin-TOF-MS质谱技术,唾液样本可用96孔板点样上机检测,进行大样本高通量检测,具有快速简便(仅需30min)的特点。

为达到此发明目的,本发明采用以下技术方案:

第一方面,本发明提供基于质谱技术发现胃癌多肽谱生物标志物的一种无创快捷的筛选方法,所述筛选方法包括如下步骤:

(1)取胃癌患者临床唾液样本和健康人临床唾液样本,对其进行高通量一步法多肽提取;

(2)对步骤(1)提取到的多肽样本进行多肽谱峰分析;

(3)将步骤(2)得到的多肽谱峰分析结果进行统计分析,得到显著差异肽峰;

(4)建立及验证胃癌诊断小组,筛选出AUC值大于0.5的诊断小组,即为所述胃癌生物标志物。

所述显著差异肽峰表达数据用均值、中位数和四分位间距表示,其通过BioExplorer TM 1.0软件统计得到。

优选地,步骤(1)所述多肽提取是使用蛋白磁珠试剂盒进行多肽提取;

示例性地,所述蛋白磁珠试剂盒包括:20μL磁珠(Invitrogen,10mg/mL,Cat.no.354.01)、150μL磁珠结合缓冲液(CB)、500μL磁珠清洗液缓冲液(CW)、10μL磁珠洗脱液(1%TFA)。

多肽提取试剂盒以弱阳离子交换原理为基础采用磁珠在高盐低pH溶液中特异性吸附蛋白多肽样品中的蛋白多肽,低盐溶液中释放蛋白多肽分子的原理,在特定介质条件下,捕获生物样本中的蛋白多肽,被提取出来的蛋白多肽可直接用于基质辅助激光解析电离飞行时间质谱的分析。

所述使用蛋白磁珠试剂盒进行多肽提取的方法示例性地可以包括:4℃冰箱取出磁珠试剂盒,手动上下颠倒,使磁珠混匀。取200μL八连排样品管置于孔板上,加入20μL磁珠、150μL磁珠结合缓冲液(CB)、10μL唾液样品,用排枪上下吸打混匀,避免气泡,室温静止5min。将样品管在磁珠分离器上静置1min,磁珠贴壁,与悬浮的液体分离,液体应该清澈。吸去悬浮的液体,枪头应避免吸走磁珠。将唾液样品放入孔板中,加入180μL磁珠清洗液缓冲液(CW),用排枪上下吸打混匀,避免气泡,静置2min。然后将样品管在磁珠分离器上静置1min,吸去悬浮的液体。重复前一步骤一次,保证悬浮液完全被吸走。将样品放置于孔板上,加入10μL磁珠洗脱液(1%TFA)反复吸打十次以上,放置5min,使磁珠和洗脱液混悬均匀,吸打过程严格避免气泡。将样品放置于磁珠分离器上,静置1min,使磁珠与悬浮液充分分离,将上清液移出到已标记的0.2mL样品管。加入磁珠稳定缓冲液的洗脱液可以用来直接进行质谱分析或者冻存于-20℃,24h之内进行质谱分析。

优选地,步骤(2)所述多肽谱峰分析采用Clin-TOF-MS进行分析,分析的参数包括:线性模式、加速电压20kV、脉冲电压1.9kV、阳离子离子源200μm、初始激光值110,激光频率40Hz、激光能量60μJ、收集有效峰数400shots、图谱累加数100,累计每张谱图轰击数5、平均分子量的偏差<100ppm。具体操作方法示例性地可以包括:进入电脑MALDI Control操作页面,点击Acquisition进行装板,待真空指示灯不闪烁时表示可以开始检测样品,设置Experiment Queue参数后校正。校正完成后即可开始检测样品,在电子靶板上选择点样孔,开始激打。在激打过程中控制打击不同的位置获得质谱数据。

从正常组、肿瘤组各取三个样本,使用Clin-TOF-MS质谱仪在同一96孔板上进行三次点样以确定偏差,检测组内相关系数(ICC),组内相关系数(ICC)>0.75表示实验数据可信度良好。经SPSS统计,组内相关系数(ICC)分别为0.819,肿瘤组的组内相关系数为0.76,说明此实验数据重复性较好。

优选地,步骤(3)检测组间及组内相关系数,系数大于0.75表示试验数据的重复性和可信度良好。

优选地,步骤(3)所述显著差异肽峰是指检出率大于90%、P值小于0.05的差异肽峰。

优选地,步骤(3)所述得到显著差异肽峰后还包括:采用ROC曲线分析显著差异肽峰并计算其AUC值。

所述采用ROC曲线分析显著差异肽峰并计算其AUC值通过SPSS软件统计得到。受试者工作特征曲线(ROC)曲线和曲线下面积(AUC)用于评估单个差异肽峰和诊断小组模型的诊断性能:AUC≤0.5为无诊断性价值,AUC>0.5-0.7为诊断准确性较低,AUC≥0.7-0.9为诊断准确性较好,AUC>0.9表示诊断准确性高。

优选地,步骤(4)所述建立及验证胃癌诊断小组,其方法包括如下步骤:

采用CFS算法选择最优肽峰组合同时根据各峰值间隔选取显著差异肽峰的组合,将其分别形成诊断小组,然后用KNN算法建立诊断小组模型并计算各诊断小组的准确度、特异度、敏感度和AUC值,筛选出AUC值大于0.5的诊断小组,优选AUC值大于0.7的诊断小组,进一步优选AUC值最大的诊断小组即最佳诊断组,作为所述胃癌生物标志物。

优选地,所述根据各峰值间隔选取显著差异肽峰的组合形成诊断小组的具体方法为:根据整体峰值间隔,将峰值较为接近的几个肽峰中取其一或至少两种的组合纳入诊断小组,其他排除出诊断小组,依据此规律逐步排除显著差异肽峰,逐步形成若干个诊断小组。

优选地,所述用KNN算法计算各诊断小组的准确度、特异度、敏感度和AUC值时将所有样本数据随机分为训练集和验证集,训练集与验证集的份额比为3:1。

优选地,步骤(4)所述筛选出诊断小组后还包括:采用质谱仪鉴定诊断小组中各显著差异肽峰所对应的多肽的氨基酸序列,然后使用数据库鉴定氨基酸序列所属蛋白,即为所述胃癌生物标志物。

优选地,所述质谱仪包括纳米液相色谱-电喷雾电离-串联质谱仪(nano-LC/ESI-MS/MS),质谱分析参数包括:电喷雾离子源、喷雾电压2kV、离子源温度250℃、高能碰撞解离源HCD、MS/MS离子阈值1×105

优选地,所述数据库包括Mascot 2.4.1(Matrix Science,London,UK)数据库,搜索结果仅限于智人,肽质量公差设定为±20ppm,片段质量公差设定为±0.2Da。

第二方面,本发明提供一系列采用如上所述的筛选方法筛选得到的胃癌生物标志物,根据上述筛选方法的内容,可以将胃癌生物标志物归纳如下:

(Ⅰ)胃癌生物标志物包括质荷比为3276.4m/z、3371.3m/z、3770.7m/z、4019.5m/z、4060.8m/z、4131.5m/z、4610m/z、5420.4m/z、5433.2m/z、5468.2m/z、5489.1m/z、6346.1m/z或6517.3m/z中任意一种肽峰。

(Ⅱ)胃癌生物标志物包括质荷比为3770.7m/z、4610m/z、5433.2m/z和6346.1m/z的肽峰组合。

(Ⅲ)胃癌生物标志物包括质荷比为3276.4m/z、3770.7m/z、4610m/z、5433.2m/z和6346.1m/z的肽峰组合。

(Ⅳ)胃癌生物标志物包括质荷比为3276.4m/z、3770.7m/z、4019.5m/z、5433.2m/z和6346.1m/z的肽峰组合。

(Ⅴ)胃癌生物标志物包括质荷比为3276.4m/z、3770.7m/z、4019.5m/z、4610m/z、5433.2m/z、6346.1m/z和6517.3m/z的肽峰组合。

(Ⅵ)胃癌生物标志物包括质荷比为3276.4m/z、3371.3m/z、3770.7m/z、4019.5m/z、4131.5m/z、4610m/z、5433.2m/z、6346.1m/z和6517.3m/z的肽峰组合。

(Ⅶ)胃癌生物标志物包括质荷比为3276.4m/z、3371.3m/z、3770.7m/z、4019.5m/z、4060.8m/z、4131.5m/z、4610m/z、5420.4m/z、5433.2m/z、5468.2m/z、5489.1m/z、6346.1m/z和6517.3m/z的肽峰组合。

(Ⅷ)所述胃癌生物标志物包括α-淀粉酶和/或Gal-3结合蛋白。

第三方面,本发明提供一种如上所述的胃癌生物标志物在制备胃癌诊断试剂中的应用。本发明所涉及的胃癌生物标志物来源于唾液,因此为胃癌的诊断提供了新的非侵入性检测方法。且本发明所涉及的胃癌生物标志物的敏感度、特异度和准确度最高均可达70%以上,显著高于目前常用的血清肿瘤标志物CEA、CA72-4、CA125和CA19-9,其敏感度分别仅为33.0%、25.5%、31.1%和38.7%左右。

第四方面,本发明提供一种用于胃癌诊断的试剂盒,所述试剂盒包括特异性检测如上所述的胃癌生物标志物的试剂。

第五方面,本发明提供一种胃癌生物标志物的筛选系统,所述筛选系统包括如下筛选单元:

(1)多肽提取单元,用于对胃癌患者临床唾液样本和健康人临床唾液样本进行多肽提取;

(2)质谱分析单元,用于对提取到的多肽样本进行多肽谱峰分析;

(3)统计分析单元,用于对得到的多肽谱峰分析结果进行统计分析,以得到显著差异肽峰;

(4)胃癌诊断小组的建立与验证单元,所述胃癌诊断小组的建立与验证单元筛选出AUC值大于0.5的诊断小组,作为胃癌生物标志物。

优选地,所述多肽提取是使用蛋白磁珠试剂盒进行多肽提取。

优选地,所述多肽谱峰分析采用蛋白质组学基质辅助激光解吸电离飞行时间质谱Clin-TOF-MS进行分析,分析的参数包括:线性模式、加速电压20kV、脉冲电压1.9kV、阳离子离子源200μm、初始激光值110,激光频率40Hz、激光能量60μJ、收集有效峰数400shots、图谱累加数100,累计每张谱图轰击数5、平均分子量的偏差<100ppm。

优选地,所述统计分析采用BioExplorer TM 1.0软件和SPSS 26.0统计学软件。

优选地,所述显著差异肽峰是指检出率大于90%、P值小于0.05的差异肽峰。

优选地,所述筛选系统还包括ROC评估单元,所述ROC评估单元用于计算显著差异肽峰的AUC值,。

优选地,所述筛选系统还包括胃癌诊断小组建立及验证单元,所述胃癌诊断小组建立及验证单元采用CFS算法选择最优肽峰组合,同时根据各峰值间隔选取显著差异肽峰的组合,分别形成若干个诊断小组,然后用KNN算法建立诊断小组模型并计算各诊断小组的准确度、特异度、敏感度和AUC值,筛选出AUC值大于0.5的诊断小组,优选AUC值大于0.7的诊断小组,进一步优选AUC值最大的诊断小组即最佳诊断小组,作为胃癌生物标志物。

优选地,所述根据各峰值间隔选取显著差异肽峰的组合形成诊断小组的具体方法为:根据整体峰值间隔,将峰值较为接近的几个肽峰中取其一或至少两种的组合纳入诊断小组,其他排除出诊断小组,依据此规律逐步排除显著差异肽峰,逐步形成若干个诊断小组。

优选地,所述用KNN算法计算各诊断小组的准确度、特异度、敏感度和AUC值时将所有样本数据随机分为训练集和验证集,训练集与验证集的份额比为3:1。

优选地,所述筛选系统还包括蛋白归属鉴定单元,所述蛋白归属鉴定单元采用质谱鉴定诊断小组中各显著差异肽峰所对应的多肽的氨基酸序列,并使用数据库鉴定氨基酸序列所属蛋白。

优选地,所述质谱鉴定采用纳米液相色谱-电喷雾电离-串联质谱仪,质谱分析参数包括:电喷雾离子源、喷雾电压2kV、离子源温度250℃、高能碰撞解离源HCD、MS/MS离子阈值1×105

优选地,所述数据库包括Mascot 2.4.1数据库。

第六方面,本发明提供利用如上所述的筛选系统筛选得到的胃癌生物标志物,所述胃癌生物标志物包括质荷比为3276.4m/z、3371.3m/z、3770.7m/z、4019.5m/z、4060.8m/z、4131.5m/z、4610m/z、5420.4m/z、5433.2m/z、5468.2m/z、5489.1m/z、6346.1m/z或6517.3m/z中任意一种肽峰。

优选地,所述胃癌生物标志物包括质荷比为3770.7m/z、4610m/z、5433.2m/z和6346.1m/z的肽峰组合。

优选地,所述胃癌生物标志物包括质荷比为3276.4m/z、3770.7m/z、4610m/z、5433.2m/z和6346.1m/z的肽峰组合。

优选地,所述胃癌生物标志物包括质荷比为3276.4m/z、3770.7m/z、4019.5m/z、5433.2m/z和6346.1m/z的肽峰组合。

优选地,所述胃癌生物标志物包括质荷比为3276.4m/z、3770.7m/z、4019.5m/z、4610m/z、5433.2m/z、6346.1m/z和6517.3m/z的肽峰组合。

优选地,所述胃癌生物标志物包括质荷比为3276.4m/z、3371.3m/z、3770.7m/z、4019.5m/z、4131.5m/z、4610m/z、5433.2m/z、6346.1m/z和6517.3m/z的肽峰组合。

优选地,所述胃癌生物标志物包括质荷比为3276.4m/z、3371.3m/z、3770.7m/z、4019.5m/z、4060.8m/z、4131.5m/z、4610m/z、5420.4m/z、5433.2m/z、5468.2m/z、5489.1m/z、6346.1m/z和6517.3m/z的肽峰组合。

优选地,所述胃癌生物标志物包括α-淀粉酶和/或Gal-3结合蛋白。

第七方面,本发明提供一种如上所述的胃癌生物标志物在制备胃癌诊断试剂中的应用。

第八方面,本发明提供一种用于胃癌诊断的试剂盒,所述试剂盒包括特异性检测如上所述的胃癌生物标志物的试剂。

相对于现有技术,本发明具有以下有益效果:

本发明创造性地基于临床信息和蛋白质组学分析,采用新的胃癌生物标志物的筛选方法从唾液中筛选出一系列可以用于胃癌诊断的生物标志物,这些胃癌生物标志物的敏感度、特异度和准确度最高均可达70%以上,显著高于目前常用的血清肿瘤标志物CEA、CA72-4、CA125和CA19-9,其敏感度分别仅为33.0%、25.5%、31.1%和38.7%左右。且这些胃癌生物标志物来源于唾液,因此为胃癌的诊断提供了新的非侵入性检测方法。同时,本发明所涉及的筛选方法借助Clin-TOF-MS质谱技术,唾液样本可用96孔板点样上机检测,进行大样本高通量检测,具有快速简便(仅需30min)、高通量、微上样量(1μL)、大样本检测等特点。

附图说明

图1是健康人唾液多肽样本的质谱图;

图2是胃癌患者唾液多肽样本的质谱图;

图3是最佳诊断小组成员3276.4m/z的峰强度对比图和ROC曲线图(a为峰强度对比图、b为ROC曲线图);

图4是最佳诊断小组成员3770.7m/z的峰强度对比图和ROC曲线图(a为峰强度对比图、b为ROC曲线图);

图5是最佳诊断小组成员4019.5m/z的峰强度对比图和ROC曲线图(a为峰强度对比图、b为ROC曲线图);

图6是最佳诊断小组成员5433.2m/z的峰强度对比图和ROC曲线图(a为峰强度对比图、b为ROC曲线图);

图7是最佳诊断小组成员6346.1m/z的峰强度对比图和ROC曲线图(a为峰强度对比图、b为ROC曲线图);

图8是实施例1的操作流程示意图。

具体实施方式

下面通过具体实施方式来进一步说明本发明的技术方案。本领域技术人员应该明了,所述实施例仅仅是帮助理解本发明,不应视为对本发明的具体限制。

下述实施例中通过胃癌生物标志物的筛选方法来展示本发明所涉及的肿瘤生物标志物的筛选方法,其他类型的肿瘤标志物的筛选均可参照本方法。所述训练集是指用于构建模型样本的集合,验证集是指用于验证模型样本的集合。

实施例1

本实施例提供一种胃癌生物标志物的筛选方法,包括如下步骤:

(一)取胃癌患者临床唾液样本1-47和健康人临床唾液样本1-32,其中胃癌患者临床唾液样本选择在湖南省肿瘤医院、湖南省中医附一院和湖南省中医药研究院进行治疗的经病理确认的病例47例。经知情同意后,选取病人唾液15mL;其中健康人临床唾液样本1-32来源于湖南省中医院随机样本。

(二)对上述样本进行多肽提取,具体过程为:4℃冰箱取出磁珠试剂盒,手动上下颠倒,使磁珠混匀。取200μL八连排样品管置于孔板上,加入20μL磁珠、150μL磁珠结合缓冲液(CB)、10μL唾液样品,用排枪上下吸打混匀,避免气泡,室温静止5min。将样品管在磁珠分离器上静置1min,磁珠贴壁,与悬浮的液体分离,液体应该清澈。吸去悬浮的液体,枪头应避免吸走磁珠。将唾液样品放入孔板中,加入180μL磁珠清洗液缓冲液(CW),用排枪上下吸打混匀,避免气泡,静置2min。然后将样品管在磁珠分离器上静置1min,吸去悬浮的液体。重复前一步骤一次,保证悬浮液完全被吸走。将样品放置于孔板上,加入10μL磁珠洗脱液(1%TFA)反复吸打十次以上,放置5min,使磁珠和洗脱液混悬均匀,吸打过程严格避免气泡。将样品放置于磁珠分离器上,静置1min,使磁珠与悬浮液充分分离,将上清液移出到已标记的0.2mL样品管,加入磁珠稳定缓冲液的洗脱液直接进行质谱分析。

(三)对提取到的多肽样本用Clin-TOF进行质谱分析,进入电脑MALDI Control操作页面,点击Acquisition进行装板,待真空指示灯不闪烁时表示可以开始检测样品,设置Experiment Queue参数后校正。校正完成后即可开始检测样品,在电子靶板上选择点样孔,开始激打。在激打过程中控制打击不同的位置获得质谱图。质谱分析参数包括:线性模式、加速电压20kV、脉冲电压1.9kV、阳离子离子源200μm、初始激光值110,激光频率40Hz、激光能量60μJ、收集有效峰数400shots、图谱累加数100,累计每张谱图轰击数5、平均分子量偏差<100ppm。

(四)将原始质谱图导入BioExplorer TM 1.0软件,选取质荷比为2000-7000m/z的显著差异肽峰,并导入SPSS 26.0统计学软件进行统计分析,差异蛋白表达数据用均值、中位数、四分位间距表示,在2000-7000m/z内,胃癌组和健康对照组有386个不同的肽峰,其中检出率≥90%的显著差异肽峰(P<0.05)13个,如表1所示:13个差异肽峰中,有12个上调差异肽峰(ratio>1.2),1个下调差异肽峰(ratio≤0.8)。健康人样本30和胃癌患者样本17的质谱图分别如图1和图2所示。

同时从正常组、胃癌组各取三个样本,使用Clin-TOF质谱仪在同一96孔板上进行三次点样以确定偏差,检测组内相关系数(ICC),组内相关系数(ICC)>0.75表示实验数据可信度良好。经SPSS统计,组内相关系数(ICC)分别为0.819,胃癌组的组内相关系数为0.76,说明此实验数据重复性较好。

表1

(五)采用ROC曲线(受试者工作特征曲线)分析上述13种显著差异肽峰并计算其AUC值,如表1所示。

(六)采用Weka 3.7中的CFS算法(基于关联规则的特征选择算法)选择出最优肽峰5433.2m/z,其AUC值为0.68,为了进一步确定更好的肽峰组合,根据各峰值间隔选取显著差异肽峰组成诊断小组,具体方法为:根据整体峰值间隔,将峰值较为接近的几个肽峰中取其一或至少两种的组合纳入诊断小组,其他排除出诊断小组,依据此规律逐步排除显著差异肽峰,逐步形成若干个诊断小组,得到下述8种诊断小组:

(a)3276.4m/z,4610m/z,5433.2m/z,6346.1m/z

(b)3770.7m/z,4610m/z,5433.2m/z,6346.1m/z

(c)3276.4m/z,3770.7m/z,4610m/z,5433.2m/z,6346.1m/z

(d)3276.4m/z,3770.7m/z,4019.5m/z,5433.2m/z,6346.1m/z

(e)3276.4m/z,4019.5m/z,4610m/z,5433.2m/z,6346.1m/z,6517.3m/z

(f)3276.4m/z,3770.7m/z,4019.5m/z,4610m/z,5433.2m/z,6346.1m/z,6517.3m/z

(g)3276.4m/z,3371.3m/z,3770.7m/z,4019.5m/z,4131.5m/z,4610m/z,5433.2m/z,6346.1m/z,6517.3m/z

(h)3276.4m/z,3371.3m/z,3770.7m/z,4019.5m/z,4060.8m/z,4131.5m/z,4610m/z,5420.4m/z,5433.2m/z,5468.2m/z,5489.1m/z,6346.1m/z,6517.3m/z

(七)然后将所有样本数据以3:1随机分为训练集和验证集,验证集内胃癌患者13例,健康对照组7例,训练集内胃癌患者34例,健康对照组25例,用KNN算法(k=3)计算各诊断小组的准确度、特异度、敏感度和AUC值(P<0.05为有统计学意义),结果如表2所示:其中AUC值大于0.5的诊断小组可以作为胃癌生物标志物,AUC值大于0.7的诊断小组(d)和(g)作为胃癌生物标志物具有更好的诊断准确性,其中(d)3276.4m/z,3770.7m/z,4019.5m/z,5433.2m/z,6346.1m/z为最佳诊断小组,诊断小组的敏感度为71.40%、特异度为76.90%、准确度为75.00%,AUC为0.79,具有良好的诊断准确性。

对比表1和表2数据可知:虽然3770.7m/z是诊断性能差的单项肽峰(AUC值仅为0.317),但对比(a)与(b)、(a)与(c)的数据可以看出诊断性能差的单项肽峰在联合诊断中反而可能增强联合检测的诊断性能,且联合检测对胃癌诊断模型的性能有明显的提高。同时,也不是诊断小组成员越多诊断准确性就越好。

最佳诊断小组成员3276.4m/z、3770.7m/z、4019.5m/z、5433.2m/z、6346.1m/z的峰强度对比图和ROC曲线图分别如图3-图7所示(其中a为峰强度对比图、b为ROC曲线图)。

表2

(a) (b) (c) (d) (e) (f) (g) (h)
敏感度 71.90% 28.60% 42.90% 71.40% 57.10% 57.10% 71.40% 85.70%
特异度 42.90% 76.90% 61.50% 76.90% 53.80% 38.50% 61.50% 53.80%
准确度 53.80% 60.00% 55.00% 75.00% 55.00% 45.00% 65.00% 65.00%
AUC 0.44 0.55 0.68 0.79 0.54 0.57 0.72 0.67

(八)使用由Aquity TM UPLC系统(Waters,Milford,MA,USA)和配备纳米ESI源的LTQ Orbitrap XL质谱仪(Thermo Fisher Scientifc,Pittsburgh,PA,USA)组成的纳米液相色谱-电喷雾电离-串联质谱(nano-LC/ESI-MS/MS)鉴定AUC值大于0.5的诊断小组中各显著差异肽峰所对应的多肽的氨基酸序列,然后使用Mascot 2.4.1(Matrix Science,London,UK)数据库搜索结果仅限于智人,肽质量公差设定为±20ppm,片段质量公差设定为±0.2Da,鉴定氨基酸序列所属蛋白,成功鉴定出2个差异肽峰的所属蛋白:3276.4m/z的序列为iYVDAVINHMcGNAVSAGTSSTcGSyFNPGSR,被鉴定为α-淀粉酶,为上调肽峰;3770.7m/z的氨基酸序列为tPPRLFWVWLLVAGTQGVNDGDmRLADGG ATNQGR,所属蛋白为Gal-3结合蛋白,为下调肽峰,这两种肽峰也是步骤(七)中最佳诊断小组中的成员,因此,α-淀粉酶或Gal-3结合蛋白可以作为胃癌生物标志物,且具有良好的诊断准确性。

申请人声明,本发明通过上述实施例来说明本发明的肿瘤生物标志物及其筛选方法和应用,但本发明并不局限于上述实施例,即不意味着本发明必须依赖上述实施例才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。

以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。

15页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:几种代谢产物作为结核病生物标志物的用途

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!