与肺癌相关的生物标志物及其在诊断癌症中的应用

文档序号:44798 发布日期:2021-09-28 浏览:44次 >En<

阅读说明:本技术 与肺癌相关的生物标志物及其在诊断癌症中的应用 (Biomarkers associated with lung cancer and their use in diagnosing cancer ) 是由 吴稚冰 江皓 兰芬 徐执政 劳征虹 祝鑫海 饶远权 赖建军 于 2021-06-29 设计创作,主要内容包括:本发明公开了与肺癌相关的生物标志物及其在诊断癌症中的应用。本发明的生物标志物包括AIM2、RERGL、VSTM2L和/或TREM1。本发明为肺癌的诊断提供一种有效的手段。(The invention discloses a biomarker related to lung cancer and application thereof in diagnosing cancer. Biomarkers of the invention include AIM2, RERGL, VSTM2L, and/or TREM 1. The invention provides an effective means for the diagnosis of lung cancer.)

与肺癌相关的生物标志物及其在诊断癌症中的应用

技术领域

本发明涉及疾病诊断领域,更具体地,本发明涉及与肺癌相关的生物标志物及其在诊断癌症中的应用。

背景技术

肺癌目前是全球癌症相关死亡的主要原因之一。有研究报道,2010年全球肺癌死亡人数接近150万,占该年癌症相关死亡病例总数的19%(Lozano R,Naghavi M,ForemanK,et al.Global and regional mortality from 235causes of death for 20agegroups in 1990and 2010:A systematic analysis for the Global Burden of DiseaseStudy 2010[J].Lancet,2012,380(9859):2095-2128.)。由于环境污染的加重和烟草控制力度不足,在过去10年中国肺癌的发病率显著增加(Chen WQ,Zheng RS,Zhang SW,Zeng HMand Zou XN.The incidences and mortalities of major cancers in China,2010[J].Chin J Cancer,2014,33:402-405.)。随着全球人口的老龄化日益加重,预计到2030年肺癌将成为第六大最常见导致死亡的疾病。以组织学表型与细胞起源为依据,可将肺癌划分成小细胞肺癌(small cell lung cancer,SCLC)、非小细胞肺癌(non-small cell lungcancer,NSCLC)这2大类,其中NSCLC在肺癌占比达70%~80%(EsengülUzel,UfukTreatment of Early Stage Non-Small Cell Lung Cancer:Surgery orStereotactic Ablative Radiotherapy?[J].Balkan Journal of Medical Genetics,2015,32(1):8-16.)。在所有的肺癌患者中,早期NSCLC患者可以通过手术切除获得较好的治疗效果(Hamaji M,Ali S O,Burt B M.A Meta-Analysis of Resected MetachronousSecond Non-Small Cell Lung Cancer[J].Annals of Thoracic Surgery,2015,99(4):1470-1478.),但由于早中期肺癌患者起病隐匿且没有明显症状,超过一半患者确诊时已发展为局部晚期或者出现了远处其他器官的转移。因此这些年,除传统治疗手段外(外科手术疗法、放射疗法以及化学疗法等),新兴的治疗方法正在快速研发和投入到临床,为肺癌患者提供了更多的选择,如免疫治疗、靶向治疗等等,然而肺癌患者的高复发率、高死亡率现象依然未显著改善。总体而言肺癌的治愈率仍然较低,5年总体生存率小于15%(Zhou C,WuYL,Chen G,et al.Erlotinib versus chemotherapy as first-line treatment forpatients with advanced EGFR mutation-positive non-small-cell lung cancer(OPTIMAL,CTONG-0802):a multicentre,openlabel,randomised,phase 3study[J].Lancet Oncol,2011,12:735-742.)。对于提高肺癌病人的生存率提升而言,NSCLC的及时诊断与治疗起着关键性作用,因此针对NSCLC的发生发展的机制展开研究迫在眉睫。近些年来,全球学者关于肺癌做了大量的研究,但目前仍为阐明肺癌发生发展的根本分子机制。因此,针对肺癌发生和发展的基本分子机制,研究肺癌发展进程中的相关基因对于肺癌的早期发现和靶向治疗具有重要的意义。

发明内容

为了弥补现有技术的不足,本发明提供了如下技术方案:

本发明提供了生物标志物在制备诊断或预测早期肺癌的产品中的应用,所述生物标志物包括AIM2、RERGL、VSTM2L、TREM1中的至少两种。

进一步,所述生物标志物选自AIM2、RERGL、VSTM2L、TREM1的任意两种。

进一步,所述生物标志物选自AIM2、RERGL、VSTM2L、TREM1的任意三种。

进一步,所述生物标志物选自AIM2、RERGL、VSTM2L和TREM1。

进一步,所述产品包括检测样本中至少一种生物标志物或其功能片段的存在、不存在和/或量的试剂。

进一步,所述试剂包括通过数字成像技术、蛋白免疫技术、染料技术、核酸测序技术、核酸杂交技术、色谱技术、质谱技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂。

进一步,采用蛋白免疫技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括抗体,所述抗体对生物标志物或其功能片段的表位具有特异性。

进一步,所述抗体为标记抗体。

进一步,采用染料技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括染料,所述染料对生物标志物或其功能片段具有特异性。

进一步,采用核酸测序技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括引物,所述引物与生物标志物或其功能片段的序列结合。

进一步,采用核酸杂交技术检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括探针,所述探针与生物标志物或其功能片段的序列互补。

进一步,所述探针为标记探针。

进一步,所述样本包括组织、体液。

本发明提供了一种诊断或预测早期肺癌的产品,所述生物标志物包括检测生物标志物的试剂,所述生物标志物包括AIM2、RERGL、VSTM2L、TREM1中的至少两种。

进一步,所述生物标志物选自AIM2、RERGL、VSTM2L、TREM1的任意两种。

进一步,所述生物标志物选自AIM2、RERGL、VSTM2L、TREM1的任意三种。

进一步,所述生物标志物选自AIM2、RERGL、VSTM2L和TREM1。

进一步,所述产品包括芯片、试剂盒。

进一步,所述试剂盒包括qPCR试剂盒、免疫印迹检测试剂盒、免疫层析检测试剂盒、流式细胞分析试剂盒、免疫组化检测试剂盒、ELISA试剂盒和电化学发光检测试剂盒。

进一步,所述试剂盒还包括用于诊断或预测早期肺癌的说明书。

本发明提供了一种体系,包含:

样本;

一种或多种探针和/或染色剂,所述探针和/或染色剂与至少一种生物标志物和/或其同源序列结合;以及

一种或多种设备,所述设备能够定量至少一种探针或染色剂的存在、不存在和/或量,所述探针或染色剂与所述生物标志物和/或其同源序列结合。

本发明提供了一种诊断对象是否患有早期肺癌或存在患肺癌风险的系统/装置,

包括:

处理器;

输入模块,用于输入生物样本中生物标志物的水平,所述生物标志物选自;AIM2、RERGL、VSTM2L和/或TREM1;

包含指令的计算机可读介质,所述指令在由所述处理器执行时在至少两种基因和/或其表达产物的输入水平上执行第一算法;以及

输出模块,其提供基于所述至少两种基因和/或其表达产物的输入水平的一种或多种标记,其中所述一种或多种标记指示受试者存在肺癌。

进一步,所述系统进一步包含针对所述生物标志物的试剂。

进一步,所述系统的生物标志物包括:AIM2、RERGL、VSTM2L、TREM1中的至少两种。

进一步,包括AIM2、RERGL、VSTM2L、TREM1任意三种。

进一步,包括AIM2、RERGL、VSTM2L和TREM1。

本发明提供了一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现前面所述的系统/装置。

本发明提供了生物标志物在制备治疗肺癌的药物组合物中的应用,其所述生物标志物包括AIM2、RERGL、VSTM2L、TREM1的一种或多种。

进一步,所述药物组合物包括促进或抑制所述生物标志物表达水平的促进剂或抑制剂。

进一步,所述促进剂促进在肺癌中表达下调的生物标志物的表达水平,所述抑制剂抑制在肺癌中表达上调的生物标志物的表达水平。

进一步,表达下调的生物标志物选自TREM1或RERGL。

进一步,表达上调的生物标志物选自AIM2或VSTM2L。

附图说明

图1显示AIM2基因mRNA差异表达图,其中图A:TCGA;图B:GEO;

图2显示TREM1基因mRNA差异表达图,其中图A:TCGA;图B:GEO;

图3显示RERGL基因mRNA差异表达图,其中图A:TCGA;图B:GEO;

图4显示VSTM2L基因mRNA差异表达图,其中图A:TCGA;图B:GEO;

图5显示AIM2基因诊断肺腺癌的ROC曲线图,其中图A:TCGA;图B:GEO;

图6显示TREM1基因诊断肺腺癌的ROC曲线图,其中图A:TCGA;图B:GEO;

图7显示RERGL基因诊断肺腺癌的ROC曲线图,其中图A:TCGA;图B:GEO;

图8显示VSTM2L基因诊断肺腺癌的ROC曲线图,其中图A:TCGA;图B:GEO;

图9显示AIM2+TREM1+RERGL+VSTM2L联合诊断肺腺癌的ROC曲线图,其中图A:TCGA;图B:GEO。

具体实施方式

早中期肺癌患者起病隐匿且没有明显症状,超过一半患者确诊时已发展为局部晚期或者出现了远处其他器官的转移,因此需要用于改善肺癌(肺腺癌)患者的检测或预测的方法、产品、系统/装置。

生物标志物/基因表达产物

术语“生物标志物”是指某些生物学状态或疾病的可测量的指示。在一些情况下,生物标志物可以是在受试者中发现的物质,该物质的量或某种其他指示物。例如,生物标志物可以是样本中蛋白质和/或其他基因表达产物的量。在一些实施方案中,生物标志物是全长未修饰的蛋白质。在其他实施方案中,生物标志物是剪接的、翻译后切割的或翻译后化学修饰的(例如,甲基化、磷酸化、糖基化、甲酰化等)蛋白质。

在本发明的具体实施方式中,所述生物标志物包括AIM2、TREM1、RERGL和/或VSTM2L。

在本发明中,生物标志物例如AIM2(geneID:9447)、TREM1(geneID:54210)、RERGL(geneID:79785)、VSTM2L(geneID:128434)包括基因及其编码的蛋白及其同源物,突变,和同等型。该术语涵盖全长,未加工的生物标志物,以及源自细胞中加工的任何形式的生物标志物。该术语涵盖生物标志物的天然发生变体(例如剪接变体或等位变体)。

样本

在本公开中描述了用于检测受试者中的分子(例如,核酸、蛋白质等)以检测、诊断、监测、预测或评估肺癌状态或结果的方法。

本文公开的方法,产品和系统/装置可用于对来自一个或多个受试者的一个或多个样本进行分类。样本可以是包含待测试对象的组织、细胞、核酸、基因、基因片段、表达产物、蛋白质、多肽、外泌体、基因表达产物或基因表达产物片段的任何材料。样本可以包括但不限于组织、细胞、血浆、血清或来自细胞或源自个体细胞的任何其他生物材料。样本可以是细胞或组织的异质或同质群体。样本可以是无细胞或细胞贫乏的流体(例如血浆或血清)。在某些情况下,样本来自单个患者。在某些情况下,该方法包括例如通过对蛋白质阵列等进行大规模平行的多重表达分析来一次分析多个样本。

如本文所用,“获得样本”包括直接或间接获得样本。在一些实施方案中,样本由随后从样本中获取生物标志物数据的同一方(例如测试实验室)从受试者获取。在一些实施方案中,样本是从另一实体接收的(例如,通过测试实验室),所述另一实体是从受试者(例如,医师、护士、抽血者或医疗照顾者)收集样本的。在一些实施方案中,样本由医学专业人员在分离的实体(例如,测试实验室)的指导下从受试者获取,然后提供给所述实体(例如,测试实验室)。在一些实施方案中,样本由受试者或受试者的照料者在家中采集,并且随后提供给从样本中获取生物标志物数据的一方(例如,测试实验室)。

样本数据

本文公开的方法、试剂盒和系统可包括与一种或多种样本或其用途有关的数据。数据可以代表一种或多种生物标志物(例如本文所述的各种蛋白质)的量或浓度。换句话说,数据可以是核酸、蛋白质或多肽的表达水平数据。本文描述的生物标志物的表达水平数据可以是蛋白质或多肽的表达水平数据,可以通过蛋白质阵列、蛋白质组学、表达蛋白质组学、质谱法(例如液相色谱-质谱法(LC-MS)、多反应监测(MRM)、选择反应监测(SRM)、scheduled MRM、scheduled SRM)、2D PAGE、3D PAGE、电泳、蛋白质组芯片、蛋白质组微阵列、Edman降解、直接或间接ELISA、免疫吸附测定、免疫PCR、邻近延伸分析、Luminex分析或均质分析,、时间分辨的荧光共振能量转移、时间分辨荧光(TRF)、荧光氧通道免疫分析(FOCI)或发光氧通道免疫测定法。

在一些实施方案中,本文所述的方法、产品、装置/系统利用各种夹心、竞争或非竞争性测定形式的标记分子来确定本文所述生物标志物的表达水平。此类方法产生与一种或多种本文所述蛋白的存在或量有关的信号。合适的测定形式还包括色谱法、质谱法和蛋白质“印迹”法。另外,某些方法和装置,例如生物传感器、光学免疫测定、免疫吸附测定和酶免疫测定,可以用于确定分析物的存在或数量而无需标记分子。酶免疫测定法(EIA)的实例包括化学发光酶免疫测定法、电化学发光免疫测定法(ECLIA)和酶联免疫吸附测定法(ELISA)。

在一些实施方案中,本文所述的方法、产品、装置/系统利用任何可靠的方法来测量样本中的水平或数量。通常,可通过各种已知用于mRNA的方法从样本(包括其级分)(诸如分离的RNA的样本)中检测以及定量,各种已知方法包括,例如,基于扩增的方法(例如,聚合酶链反应(PCR)、实时聚合酶链反应(RT-PCR)、定量聚合酶链反应(qPCR)、滚环扩增等)、基于杂交的方法(例如,杂交阵列(例如,微阵列)、NanoString分析、Northern Blot分析、分支DNA(bDNA)信号扩增、原位杂交等),以及基于测序的方法(例如,下一代测序方法,例如,使用Illumina或IonTorrent平台)。其他示例性技术包括核糖核酸酶保护测定法(RPA)和质谱法。

试剂盒

在一些实施方案中,本公开内容提供了用于分析本文中包括的用于检测肺腺癌的任何一组生物标志物的分析试剂盒。在某些情况下,测定试剂盒包含一种或多种检测试剂。所述检测试剂包括但不限于探针、引物、抗体。

探针或引物可以包括标准(A,T或U,G和C)碱基,或修饰的碱基。修饰的碱基包括,但不限于,AEGIS碱基。在某些方面,碱基通过天然磷酸二酯键或不同的化学键连接。不同的化学键包括,但不限于,肽键或锁核酸(LNA)键。

在某些实施方案中,扩增反应中的一种或多种引物可以包括标记。在更进一步的实施方案中,不同的探针或引物包含可彼此区分的可检测标记。在一些实施方案中,核酸,诸如探针或引物,可以用两种或更多种可区分的标记来标记。

在一些方面,标记附着于一种或多种探针并具有以下性质中的一种或多种:(i)提供可检测信号;(ii)与第二标记相互作用以修饰由第二标记提供的可检测信号,例如,FRET(荧光共振能量转移);(iii)稳定杂交,例如,形成双链体;以及(iv)提供结合复合物或亲和组的成员,例如亲和力、抗体-抗原、离子复合物、半抗原-配体(例如,生物素-亲和素)。在另外其他方面,标记的使用可以使用大量已知技术中的任何一种(该已知技术采用已知标记、键、连接基团、试剂、反应条件以及分析和纯化方法)来实现。

如本文所用,术语“探针”是指能够选择性结合特定预期目标生物分子的任何分子。在一些实施方案中,本文中,术语“探针”是指可间接地或直接地、共价地或非共价地结合至本文公开的任何底物和/或反应产物和/或蛋白酶的任何分子或与其相关,并且其相关或结合可使用本文公开的方法检测。在一些实施方案中,探针是荧光探针、抗体或基于吸光度的探针。如果是基于吸光度的探针,发色团pNA(对硝基苯胺)可用作检测和/或定量本文公开的靶核酸序列的探针。在一些实施方案中,探针可以是包含荧光分子或底物的核酸序列,该荧光分子或底物在暴露于酶时变为发荧光的,并且该核酸序列与一种核酸序列的片段互补。

术语“引物”或“探针”涵盖具有特定序列的寡核苷酸或具有特定序列的寡核苷酸。在其他实施方案中,通过间接检测方法检测核酸。例如,生物素化的探针可以与链霉亲和素缀合的染料组合以检测结合的核酸。链霉亲和素分子结合扩增的生物标志物上的生物素标记,并且结合的生物标志物通过检测附着在链霉亲和素分子上的染料分子来检测。在一个实施方案中,缀合链霉亲和素的染料分子包含PHYCOLINK。链霉亲和素R-藻红蛋白(PROzyme)。其他缀合染料分子是本领域技术人员已知的。

如本文所用,术语“抗体”包括但不限于单克隆或多克隆抗体、抗体的抗原结合片段(例如Fab、Fab′、F(ab)2、F(abc)2、或Fv片段)、或抗体衍生物(例如双抗体、限行抗体或scFv)。

在一些实施方案中,提供的测定产品如试剂盒适用于多重均质生物标志物测定,适用于在单个反应中(例如,在同一溶液室中)检测所有分析物。在此类测定中,提供了针对同一分析物/生物标志物的多种抗体或抗原检测试剂,它们结合了不同的表位,并且两种抗体与同一分子分析物/生物标志物的结合/相互作用的同时结合/相互作用的检测可用于检测该样本中的分析物/生物标志物。因此,此类试剂盒针对每种分析物提供了两种抗体或抗原结合试剂。

在一些实施方案中,提供的测定产品如试剂盒适用于多重非均质生物标志物测定,所述多重非均质生物标记测定适用于在分开的反应中(例如在分开的溶液室中)检测所有分析物。在这样的测定的一些实施方案中(例如夹心ELISA),提供针对相关生物标志物组的抗体或抗原结合试剂连接至底物(例如,在多孔板的孔中或在横向流动分析通道中)。还提供了针对连接至底物上的所提供的每种生物标志物的第二种游离抗体。该抗体可以被标记(例如,用荧光染料、化学发光酶或发光酶)或未标记。在提供未标记的抗体的情况下,提供对第二游离抗体具有结合特异性的第二标记的(例如,用荧光染料、化学发光酶或发光酶)抗体或抗原结合试剂。

装置或系统

本文公开的产品和系统/装置可包含算法或其用途。可以使用一种或多种算法来对来自一个或多个受试者的一个或多个样本进行分类。可以将一种或多种算法应用于来自一个或多个样本的数据。该数据可以包括生物标志物表达数据。

本文公开的产品和系统/装置可以包括将分类分配给来自一个或多个受试者的一个或多个样本。将分类分配给样本可以包括将算法应用于表达水平。在某些情况下,基因表达水平被输入到数据分析系统,该系统包括训练好的算法。用于将样本区分为正常对照和肺癌(肺腺癌);在一些实施例中,算法可以作为其执行的一部分,计算样本的指数,并将样本的指数与阈值进行比较;预定关系可以指示样本属于特定分类的可能性。

该算法可以提供其输出的记录,包括样本的分类和/或置信度。在一些情况下,算法的输出可以是受试者患有肺腺癌的可能性。

数据分析系统可以是已训练的算法。该算法可以包括线性分类器。在一些情况下,线性分类器包括线性判别分析、费舍尔线性判别、朴素贝叶斯分类器、逻辑回归、感知机、支持向量机或其组合中的一种或多种。线性分类器可以是支持向量机(SVM)算法。该算法可以包括双向分类器。双向分类器可以包括一个或多个决策树、随机森林、贝叶斯网络、支持向量机、神经网络或逻辑回归算法。

该算法可以包括一个或多个线性判别分析(LDA)、基本感知器、弹性网络、逻辑回归、(内核)支持向量机(SVM)、对角线性判别分析(DLDA)、Golub分类器、基于Parzen、(内核)费舍尔判别分类器、k最近邻、迭代缓解、分类树、最大似然分类器、随机森林、最近质心、微计算机程序阵列(PAM)预测分析、k中值聚类、模糊C均值聚类、高斯混合模型、已分级响应(GR)、梯度提升方法(GBM)、弹性网络逻辑回归、逻辑回归或其组合。该算法可以包括对角线性判别分析(DLDA)算法。该算法可以包括最近质心算法。该算法可以包括随机森林算法。在一些实施方案中,为了区分肺腺癌和正常对照,逻辑回归、随机森林和梯度增强方法(GBM)的性能优于线性判别分析(LDA)、神经网络和支持向量机(SVM)。

本文公开的产品、系统或装置可包括至少一个计算机程序或它们的使用。计算机程序可以包括在数字处理设备的CPU(即,处理器)中可执行的被编写为执行指定任务的指令序列。可以将计算机可读指令实现为执行特定任务或实现特定抽象数据类型的程序模块,例如功能、对象、应用程序编程接口(API)、数据结构等。根据本文提供的公开,本领域技术人员将认识到可以用各种语言的各种版本来编写计算机程序。

可以在各种环境中根据需要组合或分布计算机可读指令的功能。该计算机程序通常将提供来自一个位置或多个位置的一系列指令。

本文进一步公开了用于分类(或排除分类)一个或多个样本的系统及其用途。该系统可以包括:(a)数字处理设备,其包括被配置为执行可执行指令的操作系统和存储设备;(b)计算机程序,其包括可由数字处理设备执行以对来自受试者的样本进行分类的指令,包括:(i)第一软件模块,其被配置为从来自受试者的样本中接收一个或多个生物标志物的生物标志物表达谱;(ii)第二软件模块,其配置为分析来自受试者的生物标志物表达谱;(iii)第三软件模块,被配置为基于分类系统对来自受试者的样本进行分类。在一些实施例中,分类系统包括两个类别。在其他实施例中,分类系统包括两个或更多个类别。至少两个类别可以选自肺腺癌、正常对照。分析来自受试者的生物标志物表达谱可以包括应用算法。分析生物标志物表达概况可包括归一化来自受试者的生物标志物表达概况。

数字处理装置或设备

本文公开的产品、系统或装置可以包括数字处理设备或数字处理设备的使用。在另外的实施例中,数字处理设备包括执行该设备的功能的一个或多个硬件中央处理单元(CPU)。在其他实施例中,数字处理设备还包括被配置为执行可执行指令的操作系统。在一些实施例中,数字处理设备可选地连接到计算机网络。在另外的实施例中,数字处理设备可选地连接到因特网,使得其访问万维网。在其他实施例中,数字处理设备可选地连接至云计算基础设施。在其他实施例中,数字处理设备可选地连接到内联网。在其他实施例中,数字处理设备可选地连接到数据存储设备。

根据本文的描述,作为非限制性示例,合适的数字处理设备包括服务器计算机、台式计算机、膝上型计算机、笔记本计算机、子笔记本计算机、上网本计算机、上网平板计算机、机顶计算机、手持式计算机、互联网设备、移动智能手机、平板电脑、个人数字助理、视频游戏机和车辆。本领域技术人员将认识到,许多智能电话适用于本文所述的系统。本领域技术人员还将认识到,具有可选的计算机网络连接性的选定的电视、视频播放器和数字音乐播放器适用于本文所述的系统。合适的平板计算机包括本领域技术人员已知的具有小册子、平板和可转换构造的那些。

该数字处理设备通常将包括被配置为执行可执行指令的操作系统。操作系统是例如包括程序和数据的软件,其管理设备的硬件并提供用于执行应用程序的服务。

该设备通常包括存储和/或存储设备。该存储和/或存储设备是一个或多个物理设备,用于临时或永久地存储数据或程序。在一些实施例中,该设备是易失性存储器,并且需要电力来维持存储的信息。在一些实施例中,该设备是非易失性存储器,并且在数字处理设备不通电时保留所存储的信息。在其他实施例中,非易失性存储器包括闪存。在一些实施例中,非易失性存储器包括动态随机存取存储器(DRAM)。在一些实施例中,非易失性存储器包括铁电随机存取存储器(FRAM)。在一些实施例中,非易失性存储器包括相变随机存取存储器(PRAM)。在其他实施例中,该设备是存储设备,作为非限制性示例,其包括CD-ROM、DVD、闪存设备、磁盘驱动器、磁带驱动器、光盘驱动器和基于云计算的存储。在其他实施例中,存储和/或记忆设备是诸如本文公开的那些设备的组合。

通常,将向用户发送视觉信息的显示器初始化。显示器的示例包括阴极射线管(CRT)、液晶显示器(LCD)、薄膜晶体管液晶显示器(TFT-LCD、有机发光二极管(OLED)显示器)。在各种其他实施例中,在OLED显示器上是无源矩阵OLED(PMOLED)或有源矩阵OLED(AMOLED)显示器。在一些实施例中,显示器可以是等离子显示器、视频投影仪或诸如本文公开的那些的设备的组合。

该数字处理设备通常将包括输入设备以从用户接收信息。输入设备可以是例如键盘、指示设备(作为非限制性示例,包括鼠标、轨迹球、轨迹板、操纵杆、游戏控制器或手写笔)、触摸屏或多点触摸屏、用于捕获语音或其他声音输入的麦克风、用于捕获运动或视觉输入的摄像机或诸如本文公开的设备的组合。

灵敏度、特异度、AUC和准确度

本文公开的用于鉴定、分类(或排除分类)或表征样本的产品、系统或装置可以通过使用本文公开的方法具有至少约60%的特异度来表征。在一些实施方案中,方法的特异度为至少约70%。在一些实施方案中,方法的特异度为至少约80%。在一些实施方案中,特异度为至少约90%。在一些实施方案中,特异度至少约95%。

在一些实施方案中,本发明提供了使用本文公开的方法鉴定、分类(或排除分类)或表征样本的方法,该方法给出至少约60%的灵敏度。在一些实施方案中,该方法的灵敏度为至少70%。在一些实施方案中,该方法的灵敏度为至少80%。在一些实施方案中,该方法的灵敏度为至少90%。在一些实施方案中,该方法的灵敏度为至少95%。

本文公开的方法、试剂盒和系统可改善当前监测或预测肺腺癌的状态或结果或确定或排除样本的分类的方法的AUC。本文公开的方法、产品、系统或装置的AUC可以为至少约50%、53%、55%、57%、60%、63%、65%、67%、70%、72%、75%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或介于这些值之间的任何范围。以下结合附图对本申请的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本申请,并不用于限制本申请。

实施例 与肺癌诊断相关的基因标志物

1、数据下载

用基因表达综合数据库GEO(https://www.ncbi.nlm.nih.gov/geo/)和癌症基因组图谱数据库TCGA(https://cancergenome.nih.gov/),检索数据库中的肺腺癌的表达谱数据。排除临床信息缺失的样本,纳入有匹配癌和癌旁的样本,TCGA纳入了59例癌旁样本,500例肺腺癌样本;GEO纳入了20例癌旁组织样本和226例的肺腺癌样本。

2、数据处理与分析

对于TCGA中的数据集,基因表达的RNA测序数据(FPKM值)和临床信息从UCSC Xena(https://gdc.xenahubs.net)下载,将FPKM值转化为每千碱基百万(TPM)值的转录本。

对于GEO数据库下载GSE31210的原始“CEL”文件,在affy软件包中使用RMA算法进行背景调整和分位数归一化。并利用注释文件对其注释,多个探针对应同一个基因的取平均值作为其表达量,然后获得基因表达矩阵文件。

TCGA数据集作为发现队列,GEO数据集作为验证队列。

3、差异表达分析

使用R软件中的“limma”包,对标准化后的基因表达数据,通过加权或广义最小二乘法对每个基因拟合线性模型,并通过经验贝叶斯计算出适度的t统计值、F统计值和差异表达值,最后获得差异基因分析结果,筛选标准为:adj.Pvalue的最大阈值为0.05;log2FC最小绝对阈值为1。

4、诊断效能分析

使用R包“pROC”绘制受试者工作曲线(ROC),分析差异表达基因作为检测变量的AUC值、敏感性和特异性,判断指标单独或者联合的诊断效能。

在判断指标联合的诊断效能时,首先是使用glmnet对基因进行logistics回归,利用建立的Logistic回归模型,对数据进行预测,绘制预测结果的ROC曲线,计算曲线下面积,分析敏感性、特异性。

5、结果

1)基因差异表达

AIM2、TREM1、RERGL、VSTM2L在TCGA和GEO数据库中差异表达情况见图1-图4,AIM2、VSTM2L在肺癌患者中表达上调,TREM1、RERGL在肺癌患者中表达下调,差异具有统计学意义。

2)ROC曲线分析

AIM2、TREM1、RERGL、VSTM2L和组合的诊断效能数据参见表1、表2和图5-图9。

表1 TCGA诊断效能分析

指标 AUC 特异性 敏感性
AIM2 0.798 0.881 0.69
TREM1 0.778 0.864 0.674
RERGL 0.787 0.864 0.642
VSTM2L 0.745 0.966 0.522
AIM2+TREM1 0.879 0.831 0.852
AIM2+RERGL 0.857 0.847 0.778
AIM2+VSTM2L 0.841 0.915 0.708
TREM1+RERGL 0.858 0.966 0.682
TREM1+VSTM2L 0.879 0.864 0.794
RERGL+VSTM2L 0.839 0.814 0.778
AIM2+TREM1+RERGL 0.903 0.881 0.842
AIM2+TREM1+VSTM2L 0.927 0.831 0.902
AIM2+RERGL+VSTM2L 0.886 0.966 0.726
TREM1+RERGL+VSTM2L 0.914 0.966 0.778
AIM2+TREM1+RERGL+VSTM2L 0.944 0.881 0.926

表2 GEO诊断效能分析

以上结合附图详细描述了本申请的优选实施方式,但是,本申请并不限于上述实施方式中的具体细节,在本申请的技术构思范围内,可以对本申请的技术方案进行多种简单变型,这些简单变型均属于本申请的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本申请对各种可能的组合方式不再另行说明。

此外,本申请的各种不同的实施方式之间也可以进行任意组合,只要其不违背本申请的思想,其同样应当视为本申请所公开的内容。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于预测肺癌预后的生物标志物

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!