一种分析识别***浸润的方法

文档序号:1143094 发布日期:2020-09-11 浏览:7次 >En<

阅读说明:本技术 一种分析识别***浸润的方法 (Method for analyzing and identifying lymphatic vessel infiltration ) 是由 张健 钟熹 袁亚维 于 2020-02-08 设计创作,主要内容包括:本发明一种分析识别淋巴管浸润的方法,包括:获取预设数量的头颈部鳞状细胞癌患者的患病数据,分析病患数据的基因数据,得到基因中处于预设的标准基因范围内的差异表达基因;基于差异表达基因的表达及患病数据中的临床特征数据,构建共表达模块网络;选取共表达模块网络中有显著预后差异的特征基因;对特征基因进行蛋白表达分析得到特征基因的表达水平和回归系数,采用多变量Cox回归分析建立预后风险公式;根据预后风险公式得到风险临界值;接收测试者的测试基因,根据预后风险公式计算测试基因的测试风险评分,在测试风险评分超过风险临界值时,判定测试者为淋巴管浸润高风险。本发明可以准确地识别淋巴管浸润风险低与高。(The invention relates to a method for analyzing and identifying lymphatic infiltration, which comprises the following steps: acquiring diseased data of a preset number of patients with head and neck squamous cell carcinoma, and analyzing gene data of the diseased data to obtain a differential expression gene in a preset standard gene range in the gene; constructing a co-expression module network based on the expression of the differential expression genes and clinical characteristic data in the diseased data; selecting characteristic genes with obvious prognosis difference in a co-expression module network; carrying out protein expression analysis on the characteristic genes to obtain the expression level and regression coefficient of the characteristic genes, and establishing a prognosis risk formula by adopting multivariate Cox regression analysis; obtaining a risk critical value according to a prognosis risk formula; and receiving the test genes of the testers, calculating the test risk scores of the test genes according to a prognosis risk formula, and judging the testers as high risk of lymphatic vessel infiltration when the test risk scores exceed a risk critical value. The method can accurately identify the low and high lymphatic vessel infiltration risks.)

一种分析识别***浸润的方法

技术领域

本发明涉及识别***浸润的技术领域,尤其涉及一种分析识别***浸润的方法。

背景技术

头颈部鳞状细胞癌是最常见的病理亚型之一,几乎占头颈部癌的90%。转移是治疗失败的主要原因,也是影响头颈部鳞状细胞癌预后的重要因素,***转移性疾病被认为是头颈部鳞状细胞癌生存率低的独立因素,一些临床病理参数已被证实与***转移有关,如肿瘤大小、肿瘤深度、肿瘤分化、组织学分级和***浸润(LOI)。因此,了解***转移的基因组变化可能是减少***转移的一个有价值的途径。

在头颈部鳞状细胞癌中,晚期TNM分期、组织学分级和***状态是预后不良的指标。而***浸润与头颈部鳞状细胞癌的***转移有关,***浸润是头颈部鳞状细胞癌的一个重要病理特征,因此,了解有效的***浸润分子预测因子是降低头颈部鳞状细胞癌转移风险的有效途径。

***浸润预后较差,然而,相关的临床特征仍不确定,其分子机制在很大程度上尚不清楚。根据最近的研究,***浸润的临床特征和参数尚不确定。例如,在头颈部鳞状细胞癌中***浸润的发生率不一致,从14%到47%不等。这种巨大的差异可能是由于小样本、分布差异和头颈部鳞状细胞癌的异质性造成的。同时,在大样本临床研究的基础上,分析***浸润的基因组学和临床特征也迫在眉睫。因此,阐明***浸润的基因组变化及其机制对于促进新的治疗靶点的开发,提高头颈部鳞状细胞癌的生存率具有重要的系统性意义。

肿瘤基因组图谱为头颈部鳞状细胞癌提供了全面的分子特征,为头颈部鳞状细胞癌提供了10年随访的组织病理学注释和临床生存信息。临床资源可以用于系统地评价***浸润与基因特征之间的关系,阐明头颈部鳞状细胞癌***浸润的关键基因模块,从而从基因组水平和预后水平对***浸润有一个全面、系统的认识。

因此,如何提供一种能够准确稳定地识别***浸润的方案是本领域亟待解决的技术问题。

发明内容

针对现有技术中的技术问题,本发明提供一种分析识别***浸润的方法。

该方法包括:

获取预设数量的头颈部鳞状细胞癌患者的患病数据,分析所述病患数据的基因数据,得到基因中处于预设的标准基因范围内的差异表达基因;

基于所述差异表达基因的表达及所述患病数据中的临床特征数据,构建共表达模块网络;选取所述共表达模块网络中有显著预后差异的特征基因;

对所述特征基因进行蛋白表达分析得到所述特征基因的表达水平和回归系数,采用多变量Cox回归分析建立预后风险公式;根据所述预后风险公式得到风险临界值;

接收测试者的测试基因,根据所述预后风险公式计算所述测试基因的测试风险评分,在所述测试风险评分超过所述风险临界值时,判定所述测试者为***浸润高风险。

可选地,其中,分析所述患病数据的基因数据,得到基因中处于预设的标准基因范围内的差异表达基因,为:

分析所述病患数据的基因数据,计算病患基因的病患差异倍数和病患显著性;

将所述基因数据中病患差异倍数绝对值处于差异倍数阈值范围内,且病患显著性处于病患显著性阈值范围内的基因作为差异表达基因。

可选地,其中,选取所述共表达模块网络中有显著预后差异的特征基因,为:

在所述共表达模块网络中,矩阵处于无标度拓扑准则的软阈值功率范围内时,将前一个相关矩阵转化为邻接矩阵,然后利用基于R语言TOM的相异性中的相似性函数将其转化为拓扑重叠矩阵,并计算其基因得到聚类树状图;

在所述聚类树状图中,以预设的最小模块大小和分类高度得到关键基因模块;选取所述关键基因模块中连接度大于预设连接度阈值的核心基因;

对所述核心基因进行单变量生存分析,选择预后差异处于预设的显著预后差异阈值范围内的特征基因。

可选地,其中,该方法还包括:

选择所述关键基因模块中异常表达的基因进行GO功能分析和KEGG途径分析;

在功能检测具有统计学意义时,确认所述关键基因模块。

可选地,其中,对所述核心基因进行单变量生存分析,选择预后差异处于预设的显著预后差异阈值范围内的特征基因,为:

利用GEPIA数据库对所述核心基因进行表达分析,得到所述核心基因的mRNA表达;

利用HPA数据库对头颈部鳞状细胞癌和正常组织中的所述核心基因进行蛋白表达分析,得到所述核心基因的验证蛋白表达;

根据所述测蛋白表达谱及验证蛋白表达谱,采用Kaplan-Meier分析得到所述核心基因的预后差异;

选择预后差异处于预设的显著预后差异阈值范围内的特征基因。

可选地,其中,该方法还包括:

采用Cox比例风险比和95%可信区间进行分析,在所述核心基因的预后差异具有统计学意义时,确认所述预后差异;

利用最小绝对收缩和选择LASSO模型,分析所述预后差异是否处于预设的显著预后差异阈值范围内。

可选地,其中,在所述聚类树状图中,以预设的最小模块大小和分类高度得到关键基因模块;选取所述关键基因模块中连接度大于预设连接度阈值的核心基因,为:

在所述聚类树状图中,以预设的最小模块大小和分类高度分类;

以预设的检测准则策略对分类的所述基因模块进行分子复合物检测,得到核心基因模块;

选取所述核心基因模块中连接度大于预设连接度阈值的核心基因。

可选地,其中,所述检测准则策略,为:分子复合物检测的度截止=2,节点截止=0.2,最大深度=100,k值=2。

可选地,其中,该方法还包括:

在DrugBank数据库中,映射所述共表达模块网络中的所述特征基因对应的模块;

以预设的连接性得分临界值,对以头颈部鳞状细胞癌***浸润为靶点的分子药物进行鉴定。

可选地,其中,根据所述预后风险公式得到风险临界值,为:

根据所述预后风险公式,计算所有的所述头颈部鳞状细胞癌患者的患者风险得分;

选取所述患者风险得分的中位数作为风险临界值。

本发明的分析识别***浸润的方法,采用加权基因共表达网络分析法构建基因共表达网络,探讨各模块与***浸润LOI临床特征的关系,利用DAVID数据库对差异表达基因进行功能富集和KEGG途径富集分析,构建了一个与头颈部鳞状细胞癌患者总生存显著相关的关键的基因标记,它可以准确地识别***浸润风险低的患者和***浸润风险高的患者。利用Cytoscape构建蛋白质相互作用网络,利用MCODE进行模块分析,生存分析、GEPIA分析和HPA数据库进一步验证了预后作用和表达分析。采用多变量Cox回归分析建立预测风险公式,并用受试者操作特征曲线下面积(AUCs)评价预测效率,并根据DrugBank数据库获取临界值鉴定了潜在的***浸润LOI分子靶向药物。

附图说明

为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。

图1为本发明实施例中一种分析识别***浸润的方法的流程示意图;

图2为本发明实施例中第二种分析识别***浸润的方法的流程示意图;

图3为本发明实施例中第三种分析识别***浸润的方法的流程示意图;

图4为本发明实施例中第四种分析识别***浸润的方法的流程示意图;

图5为本发明实施例中第五种分析识别***浸润的方法的流程示意图;

图6为本发明实施例中第六种分析识别***浸润的方法的流程示意图;

图7为本发明实施例中第七种分析识别***浸润的方法的流程示意图;

图8为本发明实施例中第八种分析识别***浸润的方法的流程示意图;

图9为本发明实施例中第九种分析识别***浸润的方法的流程示意图;

图10为本发明实施例中共表达模块网络中软阈值功率的示意图;

图11为本发明实施例中共表达模块网络结果可视化的示意图;

图12为本发明实施例中模块特征与临床特征的相关分析的示意图;

图13为本发明实施例中绿松石和粉色两个关键模块中的GO和KEGG分析的示意图;

图14为本发明实施例中通过PPI网络识别的核心基因的示意图;

图15为本发明实施例中核心基因在头颈部鳞状细胞癌中的表达分析及预后价值的示意图;

图16为本发明实施例中整合两个基因的风险评分分布、生存状态和时间依赖性ROC分析的示意图。

具体实施方式

下面将结合本发明中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通的技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明的保护范围。

在头颈部鳞状细胞癌中,晚期TNM分期、组织学分级和***状态是预后不良的指标,***浸润与头颈部鳞状细胞癌的***转移有关。因此,了解有效的***浸润分子预测因子是降低头颈部鳞状细胞癌转移风险的有效途径。例如,在头颈部鳞状细胞癌中***浸润的发生率不一致,从14%到47%不等。这种巨大的差异可能是由于小样本、分布差异和头颈部鳞状细胞癌的异质性造成的。同时,在大样本临床研究的基础上,分析***浸润的基因组学和临床特征也迫在眉睫。因此,阐明***浸润的基因组变化及其机制对于促进新的治疗靶点的开发,提高头颈部鳞状细胞癌的生存率具有重要的系统性意义。

肿瘤基因组图谱为头颈部鳞状细胞癌提供了全面的分子特征,为头颈部鳞状细胞癌提供了10年随访的组织病理学注释和临床生存信息。临床资源使我们能够系统地评价***浸润与基因特征之间的关系,阐明头颈部鳞状细胞癌***浸润的关键基因模块,从而从基因组水平和预后水平对***浸润有一个全面、系统的认识。

本发明实施例的一种分析识别***浸润的方法,如图1所示,为该分析识别***浸润的方法的流程示意图,具体地,该方法包括以下步骤:

步骤101、获取预设数量的头颈部鳞状细胞癌患者的患病数据,分析病患数据的基因数据,得到基因中处于预设的标准基因范围内的差异表达基因。

步骤102、基于差异表达基因的表达及患病数据中的临床特征数据,构建共表达模块网络;选取共表达模块网络中有显著预后差异的特征基因。

可选地,共表达模块网络的构建,基于mRNA表达,共表达模块网络构建了共表达的无标度基因模块。为了保证共表达网络的可靠性,基于欧氏距离进行层次聚类,剔除2个异常样本,模-性状相关被认为是临床表型和模特征基因之间的重要临床特征。分析了模块-特征相关,并阐明了与LOI临床特征密切相关的相关模块。选择满足无标度拓扑准则的软阈值功率,将前一个相关矩阵转化为邻接矩阵,然后利用基于R语言TOM的相异性中的相似性函数将其转化为拓扑重叠矩阵,并计算其mRNA得到聚类树状图和模块颜色。在聚类树中,最小模块大小和分类高度分别设置为30和0.25。对于关键基因模块,基因显著性和模块隶属度意味着RNA表达谱与***浸润临床表型、RNA表达谱与临床模特征基因呈显著正相关。

步骤103、对特征基因进行蛋白表达分析得到特征基因的表达水平和回归系数,采用多变量Cox回归分析建立预后风险公式;根据预后风险公式得到风险临界值。

步骤104、接收测试者的测试基因,根据预后风险公式计算测试基因的测试风险评分,在测试风险评分超过风险临界值时,判定测试者为***浸润高风险。

通过全面的生物信息学分析来识别***浸润,构建了一个与头颈部鳞状细胞癌患者总生存显著相关的关键的两个基因(mRNA)标记,它可以准确地识别***浸润风险低的患者和***浸润风险高的患者。

如图2所示,为本实施例中第二种分析识别***浸润的方法的部分流程示意图,与图1中不同的是,分析患病数据的基因数据,得到基因中处于预设的标准基因范围内的差异表达基因,为:

步骤201、分析病患数据的基因数据,计算病患基因的病患差异倍数和病患显著性。

步骤202、将基因数据中病患差异倍数绝对值处于差异倍数阈值范围内,且病患显著性处于病患显著性阈值范围内的基因作为差异表达基因。

如图3所示,为本实施例中第三种分析识别***浸润的方法的部分流程示意图,与图1中不同的是,选取共表达模块网络中有显著预后差异的特征基因,为:

步骤301、在共表达模块网络中,矩阵处于无标度拓扑准则的软阈值功率范围内时,将前一个相关矩阵转化为邻接矩阵,然后利用基于R语言中TOM的相异性中的相似性函数将其转化为拓扑重叠矩阵,并计算其基因得到聚类树状图。

步骤302、在聚类树状图中,以预设的最小模块大小和分类高度得到关键基因模块;选取关键基因模块中连接度大于预设连接度阈值的核心基因。

步骤303、对核心基因进行单变量生存分析,选择预后差异处于预设的显著预后差异阈值范围内的特征基因。

如图4所示,为本实施例中第四种分析识别***浸润的方法的部分流程示意图,与图3中不同的是,该方法还包括:

步骤401、选择关键基因模块中异常表达的基因进行GO功能分析和KEGG途径分析。

步骤402、在功能检测具有统计学意义时,确认关键基因模块。

如图5所示,为本实施例中第五种分析识别***浸润的方法的部分流程示意图,与图3中不同的是,对核心基因进行单变量生存分析,选择预后差异处于预设的显著预后差异阈值范围内的特征基因,为:

步骤501、利用GEPIA数据库对核心基因进行表达分析,得到核心基因的预测mRNA表达值。

步骤502、利用HPA数据库对头颈部鳞状细胞癌和正常组织中的核心基因进行蛋白表达分析,得到核心基因的验证蛋白表达谱。

步骤503、根据测蛋白表达谱及验证蛋白表达谱,采用Kaplan-Meier分析得到核心基因的预后差异。

步骤504、选择预后差异处于预设的显著预后差异阈值范围内的特征基因。

如图6所示,为本实施例中第六种分析识别***浸润的方法的部分流程示意图,与图5中不同的是,该方法还包括:

步骤601、采用Cox比例风险比和95%可信区间进行分析,在核心基因的预后差异具有统计学意义时,确认预后差异。

步骤602、利用最小绝对收缩和选择LASSO模型,分析预后差异是否处于预设的显著预后差异阈值范围内。

如图7所示,为本实施例中第七种分析识别***浸润的方法的部分流程示意图,与图3中不同的是,在聚类树状图中,以预设的最小模块大小和分类高度得到关键基因模块;选取关键基因模块中连接度大于预设连接度阈值的核心基因,为:

步骤701、在聚类树状图中,以预设的最小模块大小和高度分类。

步骤702、以预设的检测准则策略对分类的基因模块进行分子复合物检测,得到核心基因模块。

步骤703、选取核心基因模块中连接度大于预设连接度阈值的核心基因。

可选地,检测准则策略,为:分子复合物检测的度截止=2,节点截止=0.2,最大深度=100,k值=2。

如图8所示,为本实施例中第八种分析识别***浸润的方法的部分流程示意图,与图1中不同的是,该方法还包括:

步骤801、在DrugBank数据库中,映射共表达模块网络中的特征基因对应的模块。

步骤802、以预设的连接性得分临界值,对以头颈部鳞状细胞癌***浸润为靶点的分子药物进行鉴定。

如图9所示,为本实施例中第九种分析识别***浸润的方法的部分流程示意图,与图1中不同的是,根据预后风险公式得到风险临界值,为:

步骤901、根据预后风险公式,计算所有的头颈部鳞状细胞癌患者的患者风险得分。

步骤902、选取患者风险得分的中位数作为风险临界值。

可选地,如下是本实施例中一种具体的应用实施,该方法还包括:

病人选择和数据预处理:从肿瘤基因组图谱数据库下载头颈部鳞状细胞癌患者的数据信息。获得500例患者的基因(RNA)表达谱和临床生存数据。在这500例患者中,有339例患者的临床预后资料。根据差异倍数(|logFC|>1)和显著性阈值(P<0.05),筛选出2248个符合标准的基因作为差异表达基因。NCBI基因数据库和OMIM数据库中的差异表达基因的交叉使用R语言中的韦恩图表包执行。

关键共表达模块分析的富集:选择关键基因模块中异常表达的mRNA进行GO功能分析和KEGG途径分析,在GO分析中,通过生物过程分析将相应的基因分为两类。利用KEGG分析,对关键共表达模块的基因进行功能检测,P<0.05,具有统计学意义。

核心基因的PPI网络分析与识别:进一步探索了关键基因共表达模块,使用置信度大于0.9的字符串数据库预测基因功能相关性。细胞景观被用于筛选PPI网络中的重要基因对[16]。通过分子复合物检测(MCODE)分析进一步筛选PPI网络的模块。MCODE的准则如下:度截止=2,节点截止=0.2,最大深度=100,k-核心=2。最后,选取24个基因作为核心基因,进行单变量生存分析。选择7个有显著预后差异的基因作为特征基因,P<0.05。

mRNA表达分析:利用GEPIA数据库(http://GEPIA.cancer-pku.cn/)对7个核心基因的mRNA表达进行分析,了解7个核心基因的mRNA表达情况。

免疫组织化学分析:验证7个核心基因的蛋白表达,利用HPA数据库(https://www.proteinatlas.org/)对头颈部鳞状细胞癌(n=519)和正常组织(n=44)(标尺=200μm)中的7个核心基因进行蛋白表达分析。所有的免疫组织图像都由经过认证的病理学家手工标注。

核心基因的生存分析:根据特征基因的表达谱,进一步采用Kaplan-Meier分析探讨预后差异,采用Cox比例风险比和95%可信区间进行分析。P<0.05具有统计学意义。然后用最小绝对收缩和选择LASSO模型从预后中心基因中寻找重要的mRNA。LASSO方法采用R软件中的“glmnet”软件包(3.5.1版)。

预后风险评分公式的建立:根据核心基因的表达水平和回归系数,采用多变量Cox回归分析建立了预后风险公式。每个患者的风险评分按上述公式计算。最后,利用风险评分中值作为临界值,将所有患者分为高风险组和低风险组。其次,用Kaplan-Meier生存曲线评价低危组和高危组的预后。采用时间依赖的ROC曲线评估头颈肿瘤患者1年、3年和5年预测患者预后的敏感性与准确性。P<0.05被认为具有统计学意义。

小分子药物的鉴定:DrugBank是一个综合的、系统的资源,用于探索详细的药物靶点相互作用信息。将PPI网络中的绿松石和粉红色模块映射到DrugBank数据库中。以连接性得分2作为临界值,对以头颈部鳞状细胞癌***浸润为靶点的分子药物进行鉴定。

统计分析:采用SPSS 17.0进行单变量分析(SPSS Inc.,芝加哥,伊利诺伊州,美国),用Kaplan-Meier和log-rank检验计算和分析累积生存时间。两组间的差异用卡方检验或Fisher精确检验进行检验,P值<0.05被认为具有统计学意义。

对结果进行加权共表达网络构建及关键模块分析:首先使用平均连锁法进行了初始质量评估,聚类后去除两个离群样本。其余339份癌症样本和44份具有***浸润临床资料的对照样本用于后续分析。样本中2601个变异基因经平均连锁层次聚类后方差最大。

为了建立无标度网络,计算了标度指数和平均连接性,从中发现无标度拓扑的拟合指数达到0.85时,β=7的幂值。根据表达的关联性,不同的基因随后被分为不同的模块。此外,通过平均连锁聚类,可以将表达模式相似的基因放入不同的模块中。最后,共识别出10个模块。探讨了模块与***浸润性状的相关性。结果表明10个共表达模块与***浸润表型相关,显示10个共表达模块与癌症状态相关,特别是绿松石和粉红色的关键模块。然后,分别绘制了绿松石和粉色模块中的模块与***浸润状态的基因相关性散点图,这表明两个模块中的基因与***浸润状态显著相关。相关值分别为0.4(绿松石)和0.59(粉色),P值分别为1.4×10-30(绿松石)和1.8×10-8(粉色),说明绿松石和粉色模块与***浸润状态高度相关。

关键共表达模块的丰富性分析:为了了解关键共表达模块中基因的功能,进行了GO和KEGG分析。GO分析表明,绿松石模块与DNA复制、有丝***核***、染色体分离、核***和DNA依赖性DNA复制有关。KEGG分析发现,绿松石模块与细胞周期、DNA复制、错配修复和p53信号通路有关(P<0.05)。GO分析表明,粉红模块不仅参与表皮细胞分化、角质形成细胞分化、皮肤发育、表皮发育、角质化等鳞状细胞功能,还参与肽酶活性、蛋白分泌的负调控蛋白水解、肽酶活性负调节和内肽酶活性负调节(P<0.05)。这些结果表明,绿松石模块和粉红色模块在头颈部鳞状细胞癌的***浸润中起重要作用。

PPI分析与核心基因:为了了解关键模块中的核心基因,对STRING数据库进行了PPI分析,连接阈值用于定义核心基因,89个基因包括绿松石模块中的前5位基因、KIF18B、BUB1、BUB1B、KIF4A和EXO1(连接阈值>0.25),38个基因包括前5位基因、KRT78、CNFN、SLURP1,粉红模块(连接阈值>0.10)中的PRSS27和CRCT1被筛选为候选hub基因。此外,进一步利用连接度(>6)定义核心基因,然后将24个基因(绿松石模块18个基因,粉红模块6个基因)定义为核心基因。

核心基因表达与预后分析:排除无生存信息/生存时间小于1个月的样本后,使用339个癌症样本评估24个hub基因的预后。预后分析显示,有***浸润的头颈部鳞状细胞癌较无***浸润的头颈部鳞状细胞癌临床疗效差(P<0.05),说明LOI是HNSCC的重要组织学特征。进一步用R包生存率对hub基因进行单变量生存分析,结果表明CNFN与头颈部鳞状细胞癌的良好生存率相关,而KIF18B、KIF23、PRC1、CCNA2、DEPDC1和TTK与头颈部鳞状细胞癌的***浸润生存率相关(P<0.05)。

为了确定7个核心基因(CNFN、KIF18B、KIF23、PRC1、CCNA2、DEPDC1和TTK)的mRNA表达水平,我们使用GEPIA数据库验证mRNA表达,发现CNFN在头颈部鳞状细胞癌中显著下调,KIF18B、KIF23、PRC1、CCNA2、DEPDC1和TTK显著上调(P<0.05)。为了进一步探讨七个基因(CNFN、KIF18B、KIF23、PRC1、CCNA2、DEPDC1和TTK)的蛋白质表达,我们进一步使用HPA数据库进行蛋白质表达分析。统计分析表明,CNFN表达较低且未检测到(100%;n=4);KIF18B(66.7%;n=3)、KIF23(100%;n=4)、PRC1(75.0%;n=4)、CCNA2(66.7%;n=3)、DEPDC1(100%;n=3)和TTK(66.7%;n=3)为显著的中高表达。

预后风险评分模型的建立:采用LASSO方法和多变量Cox回归分析,确定两种mRNA(CNFN和DEPDC1)作为头颈部鳞状细胞癌患者的综合预后生物标志物。然后,根据两个预后mRNA的表达谱及其回归系数建立了一个预后风险评分公式。预后风险评分公式如下:风险评分=EXPDEPDC1*0.32636+EXPCNFN*(-0.07544)。计算所有患者的风险得分,并将患者分为高风险组(n=165)和低风险组(n=165),方法是将风险得分中位数作为临界值,显示出患者的风险评分和生存状态的分布。然后,我们使用Kaplan-Meier分析评估上述风险公式的预后价值。从中发现,低风险组的总生存比高风险组好(P<0.001)。此外,时间相关ROC分析也被用来评估风险公式的预测能力。ROC曲线下1年、3年和5年的面积分别为0.582、0.634和0.636,这表明整合的两个mRNA标记比每个单独的标记具有更好的预测患者风险。

小分子试剂的鉴定:为了了解针对绿松石和粉色模块中***浸润的小分子药物,在DrugBank数据库中搜索了所有药物基因相互作用,用连接度>2和P<0.05筛选药物模块,绿松石模块中的5种药物模块相互作用(XL844、AT7519、AT9283、夫拉平度和奈拉滨)和粉色模块中的3种药物模块相互作用(苯甲酰胺、L-谷氨酰胺和锌)可用于靶向***浸润(P<0.05)。为了进一步了解8种小分子药物在头颈部肿瘤或实体瘤中的临床应用,使用临床试验材料(https://clinicaltrials.gov/ct2/home)分析了这些小分子药物的临床试验注册情况。虽然对苯甲酰胺的研究还未展开,但已进行了三项L-谷氨酰胺(NCT 03015077、NCT022282839、NCT 0006994)和三项锌(NCT 00036881、NCT 0353119、NCT 0286815)治疗头颈肿瘤的临床试验。同时,还研究了XL844(NCT00475917)、AT7519(NCT00390117、NCT02503709)、AT9283(NCT00443976、NCT00985868)、夫拉平度(NCT0080990)和奈拉滨(NCT01376115)在实体瘤或肿瘤中的作用。这些结果表明,苯甲酰胺、L-谷氨酰胺、锌、XL844、AT7519、AT9283、夫拉平度和奈拉滨可能为阻断***转移提供了新的途径。

转移是头颈部鳞状细胞癌治疗失败的主要原因,***转移性疾病被认为是头颈部鳞状细胞癌生存率低的独立因素。一些临床病理参数已被证实与***转移有关,如肿瘤大小、肿瘤深度、肿瘤分化、组织学分级和LOI。通过综合整合基因组分析,从分子水平到临床水平对头颈部鳞状细胞癌的***浸润进行了系统分析。建立了一个新的双mRNA标记来预测头颈部鳞状细胞癌的***浸润风险,生存曲线显示低危组和高危组头颈部鳞状细胞癌的mRNA表达水平存在显著的预后差异。时间相关ROC分析表明,mRNA特征对OS的预测具有较高的准确性。苯甲酰胺、L-谷氨酰胺、锌、XL844、AT7519、AT9283、夫拉平度和奈拉滨等小分子药物可能为阻断LOI提供新的途径。

随着测序技术的应用,基因组学研究已经从单个基因的异常表达转化为基因组突变和染色质重塑的系统整合研究。然而,***浸润的分子机制尚不清楚,TCGA数据库列举了世界范围内对头颈部鳞状细胞癌的多个基因组图谱研究,为整合基因组学数据,了解***浸润的分子变化提供了一个机会。进行头颈部鳞状细胞癌共表达网络模块的研究,发现绿松石和粉红色模块与***浸润显著相关。功能富集分析表明,关键基因模块功能不仅参与表皮细胞分化、角质形成细胞分化、皮肤发育、表皮发育和角质化等鳞状细胞功能,还参与肽酶活性等蛋白质分泌的调节,蛋白质水解的负调节,肽酶活性的负调节,内肽酶活性和DNA功能的负调节,如DNA复制,有丝***核***,核***和DNA依赖性DNA复制。路径富集分析证实了关键模块基因在细胞周期、DNA复制、错配修复和p53信号转导途径中的富集,表明关键模块在头颈部鳞状细胞癌的***浸润中起重要作用。

***被肿瘤微环境重塑,包括癌细胞、致癌驱动基因突变、免疫检查点信号及其受体的相互作用。系统地分析339例头颈部鳞状细胞癌和44例正常标本的mRNA表达,发现2522个基因有显著差异表达。蛋白-蛋白质相互作用网络和模块分析显示,绿松石模块中有18个基因,如KIF18B、BUB1、BUB1B、KIF4A、EXO1,粉红色模块中有6个基因,如KRT78、CNFN、SLURP1、PRSS27、CRCT1与头颈部鳞状细胞癌的***浸润相关。然而,这24个基因在肿瘤微环境的代谢和免疫重塑中的作用和机制还有待进一步探讨。

对于早期诊断***浸润至关重要,因为有***浸润的头颈部鳞状细胞癌患者可能需要更及时的治疗。尽管MRI和PET-CT在头颈部鳞状细胞癌的***浸润评估中得到了发展和应用,但早期***浸润的检出率仍然很少低。筛选与***浸润相关的关键模块的核心基因,预后分析和表达分析显示CNFN表达下调,与预后良好相关,KIF18B、KIF23、PRC1、CCNA2、DEPDC1和TTK表达上调,与预后不良相关。这两个mRNA表达可以分析***浸润的风险,预测头颈部鳞状细胞癌的总生存。但是,也有一些局限性。首先,这两个mRNA的特征需要进一步研究。第二个限制是基于两个mRNA的预测效能不太令人满意,有待进一步探讨。第三,未评估这两种mRNA的生物学功能和机制。

尽管***浸润的靶向治疗缺乏且不可靠,但DrugBank提供了关于药物及其治疗***浸润靶点的全面分子信息。基于药物与关键模块的相互作用,发现了8种小分子药物可以靶向LOI,包括苯甲酰胺、L-谷氨酰胺、锌、XL844、AT7519、AT9283、夫拉平度和奈拉滨。最近的一项研究发现,AT7519和Alvocidib(细胞周期蛋白依赖性激酶抑制剂)通过靶向CDK1被证明对癌症治疗具有潜在的抗癌作用[31-35]。XL844是有丝***纺锤体检查点激酶-1和有丝***纺锤体检查点激酶-2激酶的特异性抑制剂,被发现能有效地使癌细胞增敏,诱导细胞周期阻滞。8种小分子药物的临床试验注册分析也表明,这些小分子药物在头颈部肿瘤和实体瘤中也得到了广泛的应用。这些结果表明,8种小分子药物可作为头颈部鳞状细胞癌的靶向***浸润。

如图10所示,在共表达模块网络中软阈值功率的确定,头颈部鳞状细胞癌软阈值幂(β)的无标度指数分析,b头颈部鳞状细胞癌中各种软阈值幂的平均连通性分析。头颈部鳞状细胞癌中β=7时连接性分布的c直方图。d检查头颈部鳞状细胞癌中β=7时的无标度拓扑。

如图11所示,共表达模块网络结果可视化,通过基于TOM的差异性的层次聚类分析得到的mRNA聚类树状图,对应的模块颜色由颜色行表示。每一个有颜色的行代表有颜色编码的模块,它包含一组高度连接的mRNA。每种颜色代表构建的基因共表达网络中的一个模块。b热图描绘共表达模块网络分析中所有基因之间的拓扑重叠矩阵,浅色表示低重叠,逐渐变深的红色表示较高重叠。

如图12所示,模块特征与临床特征的相关分析,a该列对应于LOI表型性状,标记如下。行列中每个单元格的热图包含该模块和***浸润特征之间的p值。绿松石模块与***浸润表型性状(cor=0.25;P=5e-07)和粉红模块与***浸润表型性状(cor=-0.23;P=4e-06)的相关显著。与LOI状态相关的10个共表达模块的显著水平的b条形图。(c和d)绿松石(c)和粉红(d)模块中***浸润状态的基因显著性与模块成员之间的相关性分析。

如图13所示,绿松石和粉色两个关键模块中的GO和KEGG分析,生物过程中绿松石模块的Go富集分析。KEGG通路绿松石模块的b-Go富集分析。生物过程中粉红模块的c-Go富集分析。

如图14所示,模块中通过PPI网络识别的核心基因,(a和b)绿松石模块(a)和粉红模块(b)中差异基因的PPI交互网络。

如图15所示,7个核心基因在头颈部鳞状细胞癌中的表达分析及预后价值。有或无***浸润的头颈部鳞状细胞癌患者的10年累积生存率。(b-h)CNFN(b)、KIF18B(c)、KIF23(d)、PRC1(e)、CCNA2(f)、DEPDC1(g)和TTK(h)的10年生存分析。基于GEPIA数据库的7个核心基因基因(CNFN、KIF18B、KIF23、PRC1、CCNA2、DEPDC1和TTK)在HNSCC(n=519;红色)和正常组织(n=44;蓝色)中的mRNA表达。基于人类蛋白质图谱数据库的头颈癌7个核心基因(CNFN、KIF18B、KIF23、PRC1、CCNA2、DEPDC1和TTK)的免疫组化研究。人类病理图谱数据库中IHC分析头颈癌中蛋白表达水平。**P<0.01,*P<0.05。

如图16所示,整合两个基因的风险评分分布、生存状态和时间依赖性ROC分析。a风险评分分布b 330例患者的总体生存状态。c以中位风险评分将患者分为低风险组和高风险组,Kaplan-Meier曲线分析两组总生存率。D时间相关ROC分析头颈肿瘤患者1年、3年和5年生存概率。

本实施例中通过构建与头颈部鳞状细胞癌患者总生存显著相关的关键的基因标记,它可以准确地识别***浸润风险低的患者和***浸润风险高的患者。

以上借助具体实施例对本发明做了进一步描述,但是应该理解的是,这里具体的描述,不应理解为对本发明的实质和范围的限定,本领域内的普通技术人员在阅读本说明书后对上述实施例做出的各种修改,都属于本发明所保护的范围。

23页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:构建体外检测乳腺癌的数学模型的方法及其应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!