一种用于预测胃癌免疫治疗的肿瘤微环境评分系统的构建方法以及分子探针

文档序号:128378 发布日期:2021-10-22 浏览:40次 >En<

阅读说明:本技术 一种用于预测胃癌免疫治疗的肿瘤微环境评分系统的构建方法以及分子探针 (Construction method of tumor microenvironment scoring system for predicting gastric cancer immunotherapy and molecular probe ) 是由 廖旺军 曾东强 于 2021-06-01 设计创作,主要内容包括:本发明提供了一组用于检测评估肿瘤微环境的基因集的分子探针,包括44条序列如SEQ ID NO:1~44所示的核苷酸序列。本发明筛选出的探针,在同一孔中对目的基因的表达进行NanoString数字化表达检测,绘制数字基因表达谱,可用于免疫治疗效果的评估。本发明还提供了用于评价胃癌肿瘤微环境的多基因评分模型的构建方法,筛选出得到的44个可代表不同微环境分型的基因集,可用于建立评估患者的肿瘤微环境多基因评分模型。本发明模型通过有效地评估肿瘤微环境,不仅能作为良好的预后生物标志物,还能够预测多种肿瘤的检查点抑制剂免疫治疗反应,对于实现个体化医疗的同时节约医疗资源,具有重要的意义和临床应用价值。(The invention provides a group of molecular probes for detecting and evaluating a gene set of a tumor microenvironment, which comprise 44 nucleotide sequences with sequences shown as SEQ ID NO: 1-44. The probe screened by the invention carries out NanoString digital expression detection on the expression of a target gene in the same hole, draws a digital gene expression profile, and can be used for evaluating the immunotherapy effect. The invention also provides a construction method of the polygene scoring model for evaluating the gastric cancer tumor microenvironment, and the 44 screened gene sets which can represent different microenvironment typing can be used for establishing the polygene scoring model for evaluating the tumor microenvironment of patients. The model can be used as a good prognosis biomarker by effectively evaluating the tumor microenvironment, can also be used for predicting the immunotherapy response of checkpoint inhibitors of various tumors, and has important significance and clinical application value for realizing individual medical treatment and saving medical resources.)

一种用于预测胃癌免疫治疗的肿瘤微环境评分系统的构建方 法以及分子探针

技术领域

本发明属于生物信息领域,涉及评估肿瘤微环境的基因集、评分系统的构建方法以及检测基因集各基因表达水平的分子探针。

背景技术

胃癌是我国居民高发的恶性肿瘤,根据GLOBOCAN 2012年的数据显示,中国新增的胃癌病例占全球发病总数的42.5%,死亡病例数占全球45%。晚期胃癌患者预后差,一线化疗后复发或疾病进展发生率高,患者生存率低,同时可选择的后线治疗手段有限。免疫治疗最大的挑战在于只有部分患者才能从中获益,如何精准得筛选出能从检查点抑制剂中获益的患者群体,是胃癌免疫治疗面临的最大挑战。迄今为止,用于预测PD-1/PD-L1单抗疗效的生物标志物包括PD-L1的免疫组化表达水平(CPS),高度微卫星不稳定性(MSI-H)和肿瘤突变负荷(TMB)。

然而,PD-L1作为生物标志物预测检查点抑制剂疗效存在局限性。比如帕博利珠单抗开展的KEYNOTE-061研究,比较帕博利珠单抗与紫杉醇在PD-L1CPS≥1的晚期胃/胃食管结合部腺癌二线治疗中的疗效,遗憾的是,在总体人群中,帕博利珠单抗对比紫杉醇,PFS和OS未达到统计学差异,亚组分析提示可能需要在生物标志物上进一步探索人群。此项三期的临床随机对照研究表明,PD-L1的表达水平存在局限性:①PD-L1在肿瘤中的表达存在异质性,不同瘤种以及同一肿瘤的不同区域,肿瘤病灶和转移灶之间都可存在PD-L1的表达差异;②抗体和染色情况缺乏标准化,PD-L1表达水平主要通过免疫组化染色情况进行评估。而目前临床研究中用于PD-L1免疫组化染色的抗体不一,染色情况也受制于评估者的主观判断;③关于PD-L1有效性的界定标准模糊,PD-L1表达强度,即多少百分比判定为“阳性”存在争议。在KEYNOTE-010研究中证实了PD-L1表达水平(>50%)与临床获益之间的相关性。PD-L1 28-8 pharm Dx(Dako)IHC检测在晚期NSCLC和接受纳武利尤单抗的黑素瘤患者中被批准,其评分系统定义PD-L1表达<1%为阴性,低表达为1%-5%,中间表达为5%-10%,高表达为>10%。

微卫星是短DNA序列的串联重复序列,在真核生物的基因组中广泛存在。人类错配修复基因(MMR基因)经转录翻译后可表达相应的错配修复蛋白,如果任一MMR蛋白表达缺失可造成细胞的错配修复功能缺陷,则对DNA复制过程中的碱基错配丧失修复功能而造成累积,导致微卫星不稳定(MSI)的发生。2017年,美国FDA批准PD-1抑制剂帕博利珠单抗治疗微卫星高度不稳定(MSI-H)/错配修复缺陷(dMMR)的实体瘤患者,瘤种覆盖结直肠癌、胃癌、非小细胞肺癌等15个不同部位的恶性肿瘤。然而,尽管这类患者可通过免疫治疗获益,却只占所有胃癌患者的6%,且在晚期胃癌中发生率低,并不能适用于大多数胃癌患者;除此之外,CheckMate-032(I/II期)研究显示,Nivolumab的疗效与MSI无关,其单药在MSI-H和non-MSI-H均表现出临床疗效和总生存获益。

肿瘤突变负荷(TMB)定义为肿瘤基因组中每个编码区的突变总数,其范围包含几个到数千个突变。越来越多证据表明,对检查点抑制剂与多种肿瘤的高肿瘤突变负荷相关。然而,首个证实TMB可作为免疫治疗效果预测标志物的前瞻性临床研究CHECKMATE-227在2019年3月更新的随访数据结果显示,TMB水平与最终的患者生存结果不相关。除此之外,两项对比非小细胞肺癌一线化疗与免疫治疗优劣性的临床研究,KEYNOTE-021和KEYNOTE-189的研究结果表明,不同肿瘤突变负荷的患者疗效表现一致。

综上,目前多种生物标志物在预测PD-1/PD-L1单抗疗效的稳定性欠佳,且都集中于肿瘤细胞本身,存在一定局限性,忽略了对肿瘤生存环境,既肿瘤微环境状况的评估,从免疫治疗的作用机理来说并不全面,这也一部分解释了多项生物标志物的临床试验中胃癌对检查点抑制剂反应率不高的原因;因此,亟需更精准的生物标志物用于预测免疫检查点抑制剂PD-1/PD-L1单抗的疗效。

随着免疫治疗在实体肿瘤中取得的巨大突破,人们逐渐认识到肿瘤微环境(TME,Tumor microenvironment)的重要性,肿瘤细胞并不是孤立存在的个体,其所处的微环境是肿瘤发生发展的主动参与者。肿瘤微环境中各类免疫细胞和间质细胞的浸润情况对肿瘤的杀伤和肿瘤免疫逃逸都起着非常重要的作用。肿瘤微环境中各类免疫细胞和间质细胞的浸润模式以及错综复杂的相互作用,与单一生物标志物PD-L1、MSI-H、TMB相比,更能全面反映肿瘤免疫治疗的演变规律。通过肿瘤微环境特征预测免疫检查点抑制剂PD-L1/PD-1单抗的反应性是提高当前胃癌免疫检查点抑制剂治疗成功率和开发下一代免疫疗法的重要举措。

NanoString数字化基因检测技术是新一代的多重核酸定量技术,在基因表达谱的验证、研究和临床应用中扮演了越来越重要的角色。NanoString技术在一个体系中可进行逾八百个的颜色条码探针和特异性序列的杂交反应,最后直接以数字化输出的形式读取定量结果。该技术自动化程度高,反应中无需酶逆转录及扩增的过程,避免了相关偏差,其检测敏感性、准确性与实时荧光定量PCR技术相当。目前,NanoString数字基因检测技术在高通量研究结果验证、基因调控机理、疾病临床分子分型等方面发挥了重要作用。其研究涉及动植物发育、炎症、免疫、干细胞、肿瘤、药物耐药、信号转导等多个领域。

发明内容

本发明的目的在于提供一组用于检测评估肿瘤微环境的基因集的分子探针,其特征在于,所述分子探针由报告探针和捕获探针按5'-3'方向串联而成;所述报告探针为荧光分子条形码;所述捕获探针为3'端带有生物素的DNA分子,且可与目标基因转录得到的mRNA特异性结合。

优选地,所述探针包括44条序列如SEQ ID NO:1~44所示的核苷酸序列。可与本发明的筛选出的44肿瘤微环境相关的基因的表达水平,所述探针精确地识别目的基因,与目的基因杂家结合。通过NanoString nCounter分析系统可精确获得目的基因的表达水平。探针设计的序列会影响系统检测出的目的基因的表达水平。因此,为了准确的检测出44个基因表达水平,本发明通过大量实验筛选出了序列如SEQ ID NO:1~44所示的探针。

本发明还提供了一种用于评估肿瘤微环境的试剂盒,所述试剂盒包括如上所述的分子探针。

本发明还提供了如上所述的试剂盒在制备用于评估肿瘤微环境评分模型的NanoString nCounter分析系统中的应用。

优选地,所述试剂盒还包括内参基因,以及检测所述内参基因的分子探针,所述探针的序列如SEQ ID NO:46~54所示。

优选地,所述内参基因包括ACTB、ABCF1、B2M、G6PD、GAPDH、GUSB、PGK1、RPLPO、TFRC、TUBB。在NanoString nCounter分析系统引入内参基因使得检测出的目的基因的表达水平更准确。

本发明还提供了一种用于评估肿瘤微环境的多基因评分模型的构建方法,包括如下步骤:

(1)收集肿瘤患者的测序数据;

(2)通过CIBERSORT和MCP-counter算法对所述测序数据进行肿瘤微环境免疫细胞的成分评估;

(3)通过consensuclusterplus2进行肿瘤微环境免疫细胞的无监督聚类,得到不同的肿瘤微环境分型;

(4)通过两两差异分析和随机森林降维,最终确定可评估肿瘤微环境评分的基因集;

(5)收集了免疫治疗队列数据;

(6)评估步骤(4)中得到的基因集中每个基因在所述免疫治疗队列中预测免疫治疗反应的显著性差异得到相应的P值,P值除以相应队列的样本数量得到特征重要性,将所有队列中每个基因的特征重要性相加得到每个基因的特征重要性总和,通过Shapiro-Wilk检验得到重要性指数正太分布,取双侧95%区间外的基因为筛选得到的重要基因;

(7)基于步骤(6)得到的基因表达数据经Z-score转化,采用PCA分析方法构建用于评估肿瘤微环境的多基因评分模型,所述模型为TMEscore_plus=TMEscoreA_plus-TMEscoreB_plus;TMEscoreA_plus为免疫评分,TMEscoreB_plus为间质评分。

本发明利用肿瘤的基因转录组数据,通过机器学习算法发现了胃癌的肿瘤微环境浸润模式,并通过基因的差异分析和随机森林算法获得了能评估肿瘤微环境的相关基因,通过输入相关的肿瘤微环境基因,使用主成分分析的算法来量化评估患者的肿瘤微环境细胞浸润模式,建立了一种用于评价肿瘤微环境的多基因评分模型。

针对不同的数据类型需要进行标准化处理,如果是Affymetrix的芯片数据,可以转化为RMA的文件格式,如果是RNAseq的数据,需要转化为TPM/FPKM的格式,作为下一个步骤的输入文件。

关于CIBERSORT、MCP-counter和consensuclusterplus2算法分别参考文献1~3:

1.M.Newman et al.,Robust enumeration of cell subsets from tissueexpression profiles.Nat Methods 12,453-457(2015)

2.E.Becht et al.,Estimating the population abundance of tissue-infiltrating immune and stromal cell populations using gene expression.GenomeBiol 17,218(2016)

3.S.Monti,P.Tamayo,J.Mesirov,T.Golub,Consensus Clustering:AResampling-Based Method for Class Discovery and Visualization of GeneExpression Microarray Data.Machine Learning 52,91-118(2003)。

两两差异分析和随机森林降维参考文献4、5:

4.M.E.Ritchie et al.,limma powers differential expression analysesfor RNA-sequencing and microarray studies.Nucleic Acids Research 43,e47-e47(2015)

5.M.B.Kursa,W.R.Rudnicki,Feature Selection with the BorutaPackage.Journal of Statistical Software 036,(2010)。

所需测序数据包括通过实时荧光定量PCR、基因芯片、二代高通量测序、Panomics或NanoString等技术来检测基因的mRNA表达水平;使用二代测序平台或者Affymetrix芯片技术检测的数据时需注意:FFPE的样本由于RNA降解的问题,建议大于2年的组织样本进行Affymetrix芯片或NanoString技术进行检测。

各样本原始数据的经过滤、标准化、批次校正、基因注释,根据平均值表达量进行重复基因的去除。

TMEscore_plus的计算为根据筛选得到的代表不同微环境分型的基因集,通过对基因表达数据进行Z-score转化,并使用主成分分析的算法(PCA)量化得到。TMEscore_plus计算相关的代码参考如下:

#安装TMEscore R包

devtools::install_github("DongqiangZeng0808/TMEscore")

#加载R包

library('TMEscore')

#输入基因表达矩阵-并进行肿瘤微环境评分的计算

tmescore<-tmescore(eset=eset_stad,classify=T)

详细代码和参数参考所在链接:https://github.com/DongqiangZeng0808/TMEscore

所述代码核心为PCA算法,PCA分析的计算原理如下:

1)将原始数据按列组成n行m列矩阵X;

2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值;

3)求出协方差矩阵;

4)求出协方差矩阵的特征值及对应的特征向量;

5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P;

6)Y=PX即为降维到k维后的数据。

本发明还提供了用于评估肿瘤微环境的基因集,包括肿瘤微环境免疫相关基因和肿瘤微环境间质相关基因;所述肿瘤微环境免疫相关基因包括:CDT1、PSAT1、IDO1、BRIP1、WARS、DTL、GBP5、KIF18A、UBD、GZMB、CCL4、CCL5、RCC1、HELLS、GNLY、TAP1、CD8A、CXCL11、GBP4、ETV7、ZNF367、CXCL10、KLRC2、CXCL9和IFNG;所述肿瘤微环境间质相关基因包括:MIR100HG、PRICKLE2、PAPLN、PLEKHH2、TNS1、MCC、MAMDC2、C14orf132、SYNPO、PID1、MCEMP1、ZCCHC24、PROS1、JAM3、TGFB1I1、MXRA7、FILIP1、CRYAB和ANTXR2。

通过对300例胃癌患者的Affymetrix芯片标准化后数据(数据来源于GSE62254)进行筛选、建模,通过上述步骤(1)~(4)共筛选得到244个基因,进一步通过步骤(5)、(6)缩减得到上述44个重要基因。所述基因集相比进一步筛选前更精简,经评估,精简后的基因集评估肿瘤微环境效能一致,在预测免疫治疗上的效能有显著提高。

本发明还提供了一种评估肿瘤微环境的多基因评分模型,所述模型包括TMEscore_plus,TMEscore_plus=TMEscoreA_plus-TMEscoreB_plus;TMEscoreA_plus为免疫评分,TMEscoreB_plus为间质评分;所述免疫评分和所述间质评分为根据如权利要求4所述的基因集的表达数据计算得到,计算方法为:对基因表达数据进行Z-score转化,采用PCA分析方法分别计算所述免疫评分和所述间质评分。

本发明还提供了如上所述的基因集在制备用于评估肿瘤微环境的试剂盒中的用途。

本发明的有益效果为:本发明筛选出与胃癌预后相关性最高的44个基因,设计了用于检测各基因转录本mRNA的探针,在同一孔中对这些标志基因的表达进行NanoString数字化表达检测,绘制数字基因表达谱,可用于免疫治疗效果的评估。与现有技术相比,本发明至少具有以下优点:检测通量高,手工操作耗时短,所用标本量少,可重复性好,准确性和敏感性高,检测结果与RT-PCR定量技术相当。本发明还提供了用于评价胃癌肿瘤微环境的多基因评分模型的构建方法,并筛选出得到的44个可代表不同微环境分型的基因集,所述基因集可用于建立评估患者的肿瘤微环境多基因评分模型。本发明模型通过有效地评估肿瘤微环境,不仅能作为良好的预后生物标志物,还能够预测多种肿瘤的检查点抑制剂免疫治疗反应,对于实现个体化医疗的同时节约医疗资源,具有重要的意义和临床应用价值。

附图说明

图1为肿瘤微环境重要基因的筛选和评估示意图。A图表示244个肿瘤微环境基因的预测免疫疗效重要性分布;图B是选择出来的44个基因的重要性排序;图C表示精简模型后的评分模型与精简模型前的评分模型在评估肿瘤微环境上具有一致性。

图2为在多中心的NanoString数据中验证了肿瘤微环境预测胃癌免疫治疗评分的准确性示意图。图A所示,肿瘤有效的患者的TMEscoreA_plus(免疫评分)明显高于不发应的肿瘤(进展性疾病,PD;稳定性疾病,SD),TMEscoreB_plus与晚期胃癌的免疫治疗效果呈负相关,TMEscore_plus,TMEscoreA_plus和TMEscoreB_plus的统计学P值分别为6.1E-6、0.047和0.00046,表明基质激活是I免疫治疗原发性耐药的关键机制,也说明联合免疫评分和间质激活评分可提高预测准确性;图B所示,本发明的TMEscore_plus预测准确性高于其他权威的基因评分,ROC等于0.877;图C显示TMEscore_plus的预测准确性显著高于单独检测某个检查点抑制剂基因;图DEFG所示,在胃癌的多中心NanoSring数据中,19例患者接受了免疫单药治疗,29例患者接受免疫联合化疗或其他抑制剂治疗。我们系统地评价了上述生物标志物在免疫治疗单药和联合治疗中的预测准确性。大多数免疫检查点抑制剂相关基因和免疫激活相关基因评分与单用免疫治疗反应呈正相关(图2DE)。然而,它们的预测效果在联合治疗组中显著下降(图2F),尤其是与免疫激活相关的特征基因评分(图2G)。然而,TMEscore_plus在这两种情况下都具有较好的预测能力。

具体实施方式

为了更加简洁明了的展示本发明的技术方案、目的和优点,下面结合具体实施例详细说明本发明的技术方案。如无特殊说明,本发明实施例中所涉及的试剂均为市售产品,均可以通过商业渠道购买获得。实施例中所用的技术手段为本领域技术人员所熟知的常规手段。

实施例1本发明肿瘤微环境的多基因评分模型及其构建方法

用于评价肿瘤微环境的多基因评分模型的构建方法,步骤如下:

(1)300例胃癌患者的Affymetrix芯片标准化后数据;所述数据源于GSE62254(从NCBI公开数据库获得);

(2)通过CIBERSORT和MCP-counter算法对所述测序数据进行肿瘤微环境免疫细胞的成分评估,得到23种免疫细胞的成分评估结果;

(3)通过consensuclusterplus2进行肿瘤微环境免疫细胞的无监督聚类,得到不同的肿瘤微环境分型;

(4)通过两两差异分析和随机森林机器学习算法,最终确定244个可评估肿瘤微环境评分的基因集;

(5)为了进一步实现该评分模型的临床转化和更高的经济效益,我们收集了6个免疫治疗队列数据进行重要基因的筛选;所述6个免疫治疗队列数据参考文献6~11;

6.S.T.Kim et al.,Comprehensive molecular characterization ofclinicalresponses to PD-1inhibition in metastatic gastric cancer.Nat Med 24,1449-1458(2018)

7.S.Mariathasan et al.,TGFbeta attenuates tumour response to PD-L1blockade by contributing to exclusion of T cells.Nature 554,544-548(2018)

8.J.D.Minna et al.,Contribution of systemic and somatic factors toclinical response and resistance to PD-L1 blockade in urothelial cancer:Anexploratory multi-omic analysis.PLOS Medicine 14(2017)

9.F.Ulloa-Montoya et al.,Predictive gene signature in MAGE-A3antigenspecific cancer immunotherapy.J Clin Oncol 31,2388-2395(2013)

10.W.Hugo et al.,Genomic and Transcriptomic Features of Response toAnti-PD-1Therapy in Metastatic Melanoma.Cell 165,35-44(2016)

11.P.L.Chen et al.,Analysis of Immune Signatures in LongitudinalTumor Samples Yields Insight into Biomarkers of Response and Mechanisms ofResistance to Immune Checkpoint Blockade.Cancer Discov 6,827-837(2016);

(6)首先评估每个基因在每个队列中预测免疫治疗反应的显著性差异,得到每个基因在对应队列的统计学差异P值(P value),P值除以对应队列的样本数量获得特征重要性,然后将6个队列中每个基因的特征重要性数据相加,获得244个基因的特征重要性总和;通过Shapiro-Wilk检验得到重要性指数正太分布,根据重要性指数的分布规律,取指数95%区间以外的基因,即[-∞,-90]和[80,+∞]区间的基因作为简易模型的输入基因,最终获得44个基因;

附图1A显示了244个基因的特征重要性分布,附图1B显示了所述输入基因包括肿瘤微环境免疫相关基因和肿瘤微环境间质相关基因(共44个基因);所述肿瘤微环境免疫相关基因包括:CDT1、PSAT1、ID01、BRIP1、WARS、DTL、GBP5、KIF18A、UBD、GZMB、CCL4、CCL5、RCC1、HELLS、GNLY、TAP1、CD8A、CXCL11、GBP4、ETV7、ZNF367、CXCL10、KLRC2、CXCL9和IFNG;所述肿瘤微环境间质相关基因包括:MIR100HG、PRICKLE2、PAPLN、PLEKHH2、TNS1、MCC、MAMDC2、C14or f 132、SYNPO、PID1、MCEMP1、ZCCHC24、PROS1、JAM3、TGFB1I1、MXRA7、FILIP1、CRYAB和ANTXR2;附图1C显示了精简模型后的评分模型(命名为:TMEscore plus,44个基因)与精简模型前的评分模型(命名为:TMEscore,244个基因)在评估肿瘤微环境上的一致性,表明前后两个评分的相关性依然很高,说明虽然基因减少了,但基因集合评估肿瘤微环境的效能没有改变;

(7)基于步骤(6)得到的输入基因构建用于评估肿瘤微环境的多基因评分模型,所述模型为TMEscore_plus=TMEscoreA_plus(免疫评分)–TMEscoreB_plus(间质评分);

计算方式如下:A组25个免疫基因的表达矩阵进行PCA算法的降维,并取PC1作为免疫微环境的评分(TMEscore A),B组19个间质基因的表达矩阵进行PCA算法的阵维,并取PC1作为间质微环境的评分(TMEscore B),免疫评分减去间质评分获得TMEscore_plus,即肿瘤微环境评分。

步骤(7)中相关的代码参考如下:

#安装TMEscore R包

devtools::install_github(“DongqiangZeng0808/TMEscoreN”)

#加载R包

library('TMEscore')

#输入基因表达矩阵并进行肿瘤微环境评分的计算

tmescore<-tmescore(eset=eset_stad,classify=T)

在数据(GSE15459、GSE57303、GSE62254、GSE84437和TGGA-STAD)中,对精简前后两个基因集(TMEscore、TMEscore plus)评估肿瘤微环境的效能进行了评估,结果如图1C所示。由评估结果可得,虽然基因数量减少了,但前后两个评分的相关性依然很高,说明前后两个基因集评估肿瘤微环境的效能几乎没有改变。

*TMEscore为根据所述构建方法,但不进行步骤(5)、(6)得到的基因集,计算得到的值表示为TMEscore,具体亦可参考文献12。

*TMEscore、GEPs评分模型参考文献12、13:

12.D.Zeng et al.,Tumor Microenvironment Characterization in GastricCancer Identifies Prognostic and Immunotherapeutically Relevant GeneSignatures.Cancer Immunology Research 7,737-750(2019)

13.R.Cristescu et al.,Pan-tumor genomic biomarkers for PD-1checkpointblockade-based immunotherapy.Science 362(2018)。

实施例2胃癌患者样本检测实例

本实施例中在收集了共5个临床中心(南方医科大学南方医院、中山大学肿瘤中心、广东省中医院、中山大学第六附属医院、中山大学第一附属医院)的70份标本中,48份标本具有较好的RNA质量用于后续的检测。收集多个临床中心的患者在接受检查点免疫治疗前的福尔马林固定石蜡包埋(FFPE)或新鲜冰冻肿瘤组织。根据RECIST 1.1标准评价肿瘤的免疫治疗反应。

步骤一:

1、提取胃癌患者肿瘤组织的RNA

①首先,将肿瘤样本的组织直接放入研钵中,加入少量的液氮,迅速研磨,待组织变软,再加入少量的液氮,再研磨,重复三次;

②将组织样品按50-100mg加入1ml Trizol,转移入离心管。另外组织体积不能超过Trizol体积的10%,再用电动均浆器充分均浆1-2min;

③然后,在12000r/min下离心五分钟,弃沉淀,按每毫升Trizol加入200微升的氯仿,盖紧离心管,用手振荡混匀15s,室温放置十分钟;

④然后,在四摄氏度12000g离心十五分钟,吸取上层水相,移至另一新的离心管中,按每毫升Trizol加入0.6ml异戊醇,混匀放置室温5-10min;

⑤然后,在四摄氏度12000g离心十分钟,弃上清液,按每毫升Trizol加入1ml的75%乙醇,温和振荡,悬浮沉淀;

⑥然后,在室温晾干或真空干燥5-10min,再测260nm下吸光值定量RNA浓度;

最后,RNA可进行mRNA分离,或储存于70%乙醇中并保存于-70摄氏度下,加氯仿前的均浆液可以保存一个月以上;

或者1、提取福尔马林固定后的蜡块组织(FFPE)标本的RNA

注意事项:对于FFPE的样本,建议样本的储存时间小于2年;

①切取石蜡切片(5-10μm厚)5-8张;

②加入PBS涡旋振荡混匀室温离心,弃上清,重复3次;

③将样本装于无菌离心管中,加入二甲苯,剧烈涡旋;

④使用罗氏公司的High Pure FFPET RNA Isolation Kit提取高纯度的RNA。

步骤二:RNA定量检测

采用NanoString的nCounter平台进行RNA的定量

①杂交:荧光条码探针直接与液相中的目标分子杂交。其中报告探针携带信号,捕获探针用来固定复合物以进行数据采集;

在使用NanoString方法检测免疫基因和间质基因表达水平的过程中,发明人还针对这44个基因设计了分子探针,所述分子探针由报告探针和捕获探针组成,所述报告探针的5'端载有不同颜色的荧光分子条形码,捕获探针的3'端载有生物素。

本发明中的44个探针及对应的基因名称具体如下表1:

表1:

②纯化固定:转移样品至nCounter Prep Station,多余探针被洗脱,探针与目标分子的复合物结合、固定并排列在样品板上;

③数字数据采集:样品板放在计数器数字分析仪中进行数据采集。对每个目标分子的荧光条码进行计数并以表格形式呈现;

④通过nSolver软件进行分析:将上述44个基因表达数据输入nSolver中,然后将10个内参基因选择为参照,点击菜单栏目的normalization进行数据的标准化,将下机的RCC数据导入到nSovler软件中,与数据库一起进行数据标准化分析后,计算该样本中各个基因的表达值,获得的表达值即为各个基因的表达水平。

该步骤中所述10个内参基因分别为:ACTB、ABCF1、B2M、G6PD、GAPDH、GUSB、PGK1、RPLPO、TFRC、TUBB。

步骤三:肿瘤微环境评分的计算

使用以下方法计算每个肿瘤患者的评分:

1、计算免疫评分(TMEscoreA_plus)=25个肿瘤微环境A基因的算术平均数;2、计算间质评分(TMEscoreB_plus)=19个肿瘤微环境B基因的算术平均数;

(算术平均数为是表征数据集中趋势的一个统计指标。它是一组数据之和,除以这组数据个数/项数)

3、TMEscore_plus=免疫评分-间质评分,即该患者的肿瘤微环境评分;

所述算术平均数为各基因数值之和除于基因个数。

步骤四:验证上述预测模型的效果

用本发明的肿瘤微环境评分模型预测上述标本的胃癌免疫治疗疗效。分别使用非参数检验(wilcoxon:秩和检验)和ROC的方法评估肿瘤微环境评分的预测免疫治疗效果,结果如图2所示,肿瘤微环境评分高的患者显著富集了能从治疗中获益的患者,P=6.1e-6,TMEscore_plus预测准确性的ROC=0.877,与其他预测指标相比ROC值均高于其他模型。表明本发明的TMEscore_plus评分模型无论在单用免疫治疗组还是联合治疗组都具有较好的预测稳定性。

最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

SEQUENCE LISTING

<110> 南方医科大学南方医院

<120> 一种用于预测胃癌免疫治疗疗效的肿瘤微环境评分系统的构建方法以及分子探针

<130> 5.13

<160> 54

<170> PatentIn version 3.3

<210> 1

<211> 100

<212> DNA

<213> 合成

<400> 1

gaagcttcct cgcaactttg tggtagatta ctatgagacc agcagcctct gctcccagcc 60

agctgtggta ttccaaacca aaagaagcaa gcaagtctgt 100

<210> 2

<211> 100

<212> DNA

<213> 合成

<400> 2

agtgtgtgcc aacccagaga agaaatgggt tcgggagtac atcaactctt tggagatgag 60

ctaggatgga gagtccttga acctgaactt acacaaattt 100

<210> 3

<211> 100

<212> DNA

<213> 合成

<400> 3

gctcagggct ctttcctcca caccattcag gtctttcttt ccgaggcccc tgtctcaggg 60

tgaggtgctt gagtctccaa cggcaaggga acaagtactt 100

<210> 4

<211> 100

<212> DNA

<213> 合成

<400> 4

gcggagcgtc tttgtgtccg aacgcaagcc tgcgctcagc atggaggtgg cctgtgccag 60

gatggtgggc agctgttgta ctatcatgag ccctggggaa 100

<210> 5

<211> 100

<212> DNA

<213> 合成

<400> 5

gccataattg ttcttagttt gcagttacac taaaaggtga ccaatgatgg tcaccaaatc 60

agctgctact actcctgtag gaaggttaat gttcatcatc 100

<210> 6

<211> 100

<212> DNA

<213> 合成

<400> 6

ttcaaaagag gacgctgtct ttgcataggc cctggggtaa aagcagtgaa agtggcagat 60

attgagaaag cctccataat gtacccaagt aacaactgtg 100

<210> 7

<211> 100

<212> DNA

<213> 合成

<400> 7

caccatctcc catgaagaaa gggaacggtg aagtactaag cgctagagga agcagccaag 60

tcggttagtg gaagcatgat tggtgcccag ttagcctctg 100

<210> 8

<211> 100

<212> DNA

<213> 合成

<400> 8

gtatgagctg ctccagtaca tcaagaccca gcggcgagcc ctggtgtgtg ggcccttttt 60

tggagggatc ttcaggctga agacgcccac ccagcactct 100

<210> 9

<211> 100

<212> DNA

<213> 合成

<400> 9

ttctacaaga tatgccatgg gccttttcac aggggacaca ggcttcttaa aacaacccgg 60

cttcctcacc ctatgtcctt tatttacaaa gctgtgctcc 100

<210> 10

<211> 100

<212> DNA

<213> 合成

<400> 10

attacagact gaccaggctc tcacagagac ggaaaaaaag aagaaagagg cacaagtgaa 60

agcagaagct gaaaaggctg aagcgcaaag gttggcggcg 100

<210> 11

<211> 100

<212> DNA

<213> 合成

<400> 11

tgccggctcc tcgcttcctc gatccagaat ccactctcca gtctccctcc cctgactccc 60

tctgctgtcc tcccctctca cgagaataaa gtgtcaagca 100

<210> 12

<211> 100

<212> DNA

<213> 合成

<400> 12

acactacaag aggtgaagat gacagtgcag gaagatcgaa agtgcgaatc tgacttacgc 60

cattattacg acagtaccat tgagttgtgc gtgggggacc 100

<210> 13

<211> 100

<212> DNA

<213> 合成

<400> 13

gatgggtcca tgtcttactc agagagagaa aaaaacatgc acagcttcaa cacggatcca 60

gaggtgttta tcttcttagt gagtacacga gctggtggcc 100

<210> 14

<211> 100

<212> DNA

<213> 合成

<400> 14

atcaccatgg catatgtgtg gggcaaaggt catggagatg tccgtaaggt cttgccaaga 60

aatattgctg ttccttactg ccaactctcc aagaaactgg 100

<210> 15

<211> 100

<212> DNA

<213> 合成

<400> 15

atactatcca gttactgccg gtttgaaaat atgcctgcaa tctgagccag tgctttaatg 60

gcatgtcaga cagaacttga atgtgtcagg tgaccctgat 100

<210> 16

<211> 100

<212> DNA

<213> 合成

<400> 16

catagacttg caatgttgaa aactcgtcgc tcctacctgg agaaaaggag ggaggaggaa 60

ttgaagcaat ttgatgagaa tactaattgg ctccatcgtg 100

<210> 17

<211> 100

<212> DNA

<213> 合成

<400> 17

tatgtgagtc agcttatagg aagtaccaag aacagtcaaa cccatggaga cagaaagtag 60

aatagtggtt gccaatgtct cagggaggtt gaaataggag 100

<210> 18

<211> 100

<212> DNA

<213> 合成

<400> 18

tggggtctcc tgggttcagc ggctgttgat tcaaggtcaa cattgaccat tggaggagtg 60

gtttaagagt gccaggcgaa gggcaaactg tagatcgatc 100

<210> 19

<211> 100

<212> DNA

<213> 合成

<400> 19

atatttggct cagaacaggt gtccatggga caaaaaagaa cgatcctcca cttgaccaag 60

aaaaaagtga ttctcccaga agcacaaagc atactcttgc 100

<210> 20

<211> 100

<212> DNA

<213> 合成

<400> 20

gtggctgcag tgggacaaga gccacaggta tttggaagaa gtcttcaaga aaatattgcc 60

tatggcctga cccagaagcc aactatggag gaaatcacag 100

<210> 21

<211> 100

<212> DNA

<213> 合成

<400> 21

gcaaagccaa atctcaggga agtccttggt tgatgtatct gggtctcctc tggagcactc 60

tgccctcctg tcacccagta gagtaaataa acttccttgg 100

<210> 22

<211> 100

<212> DNA

<213> 合成

<400> 22

ggcccagagc agatactgtc cgcgatttaa taaatgaagg agagcattca tccagcagaa 60

tccgttgtaa catctgtaat agggtgtttc cacgggagaa 100

<210> 23

<211> 100

<212> DNA

<213> 合成

<400> 23

aacatgcaaa ggtcatcaat gcagcctcaa gtcagttgcc ttttctaagt ttgagaaagc 60

tgtattctgt acgggtggaa gagatggcaa cattatggtc 100

<210> 24

<211> 100

<212> DNA

<213> 合成

<400> 24

cctcctccag gtgcgaaggt ccagctcagt ggcacaagtg aaagcaatga tcgagactaa 60

gacgggtata atccctgaga cccagattgt gacttgcaat 100

<210> 25

<211> 100

<212> DNA

<213> 合成

<400> 25

gatgtgcaaa gcctgggata tagaagaact tgtcagcctg gggaagaaac taaaggcctg 60

tccatattac acagcccgag aactaataca agatgctgac 100

<210> 26

<211> 100

<212> DNA

<213> 合成

<400> 26

gaggcaaaga tatccaggtc acttggggct agtgtttatt gtgttggtgt ccttgatttt 60

gaacaagcac agcttgaaag aattgctgat tccaaggagc 100

<210> 27

<211> 100

<212> DNA

<213> 合成

<400> 27

cgacgccgtc ttgctatgga ttgccatcat agctacgctg gggaacatcg tggtggtggg 60

cgtggtgtat gccttcacct tctgaggacg gcacaccctg 100

<210> 28

<211> 100

<212> DNA

<213> 合成

<400> 28

taaaacaaga aagtttcccc accagtgaat gaaagtcttg tgactagtgc tgaagcttat 60

taatgctaag ggcaggccca aattatcaag ctaataaaat 100

<210> 29

<211> 100

<212> DNA

<213> 合成

<400> 29

ggctggatag tttttgagaa ctcgaatctg tcttgggctg tgagacaagc cactgggttc 60

ttcaaaggat aaactaccta catagaggac atacctttgg 100

<210> 30

<211> 100

<212> DNA

<213> 合成

<400> 30

aattattggg ggggttctgg ttgtccttgc tgtactggcc ctgatcacgt tgggcatctg 60

ctgtgcatac agacgtggct acttcatcaa caataaacag 100

<210> 31

<211> 100

<212> DNA

<213> 合成

<400> 31

agggaggtta tgttgccctg gatgatattt cattctctcc tgttcactgc cagaatcaga 60

cagaacttct gttcagtgcc gtggaagcca gctgcaattt 100

<210> 32

<211> 100

<212> DNA

<213> 合成

<400> 32

cctgagcaaa gtgggatgtg catggctctt ttttgtgatt aagcaggcat caaatgggca 60

gttttcattt tcactgacac agaaacatgt ggctgaagca 100

<210> 33

<211> 100

<212> DNA

<213> 合成

<400> 33

catcatcctg tcagccttca tcatggtgaa gaatgctgag atgtccaagg agctgctggg 60

ctttaaaagg gagctttgga atgtctcaaa ctccgtacaa 100

<210> 34

<211> 100

<212> DNA

<213> 合成

<400> 34

atttagagtg acttacagaa gatcgaactt tggagtgtgg cagagtaagg gatggaaacc 60

gggccctcca gttcactatc agtagctttt gcactggtct 100

<210> 35

<211> 100

<212> DNA

<213> 探针

<400> 35

gggcctgagg aggaggacgg agaaggcttc tccttcaaat acagccccgg gaagctgagg 60

ggaaaccagt acaagaagat gatgaccaaa gaggagctgg 100

<210> 36

<211> 100

<212> DNA

<213> 合成

<400> 36

cctactacag cgccccaaac aagtgtgaac tgaactgcat tcccaagggg gagaacttct 60

actacaagca cagggaggct gtggttgatg ggacgccctg 100

<210> 37

<211> 100

<212> DNA

<213> 合成

<400> 37

ataagtagca gccctttcct ggatgactca tctgggtcag aggaagaaga cagctccaga 60

tccagctccc ggacgtcaga gtcagactca cgcagtagga 100

<210> 38

<211> 100

<212> DNA

<213> 合成

<400> 38

tcagggcgct ttccttctgt catatagttg tgggatctct accaagtgtg aaggtgaatg 60

aggtaaggga gatcagaacc atgcttcctg gtttttcata 100

<210> 39

<211> 100

<212> DNA

<213> 合成

<400> 39

atagatgaat gctctgagaa catgtgtgct cagctttgtg tcaattaccc tggaggttac 60

acttgctatt gtgatgggaa gaaaggattc aaacttgccc 100

<210> 40

<211> 100

<212> DNA

<213> 合成

<400> 40

cacaatccgc cagccaccga tgtcaatcag aacccaccgg caactgttgt cccacagagc 60

ctgccacttt ctagcatcca acagaattcc tcagaggccc 100

<210> 41

<211> 100

<212> DNA

<213> 合成

<400> 41

gccaccgtgg gacatcaagt ggaagaactt gtttgcttga aagtatctca gacccaaggc 60

acctcaggtc tctttgctgt gcctccacta tattgtcgtg 100

<210> 42

<211> 100

<212> DNA

<213> 合成

<400> 42

tctcatttcc caatgcctct ctgtgggaga gctccatgcc agttttcacc acgctcaggc 60

aaatactctg cagctgttat tggatgggcc attccgatct 100

<210> 43

<211> 100

<212> DNA

<213> 合成

<400> 43

aatcatgtct cagttcccat ctagcaaggt ggcttcagga gagcagaagg aggaccagtc 60

tgaagataag aaaagaccca gcctcccttc cagcccgtct 100

<210> 44

<211> 100

<212> DNA

<213> 合成

<400> 44

agctttattt ggggagtttc acccagaatg gtgggagaaa cctcccaggt gccaggtacc 60

ccgcatcgtg acccttcact tggtgtctta ggaagtcaag 100

<210> 45

<211> 100

<212> DNA

<213> 合成

<400> 45

acaacatcgc ctgcgttatc ctcaccttca aggagccctt tggcactgag ggtcgcgggg 60

gctatttcga tgaatttggg atcatccggg acgtgatgca 100

<210> 46

<211> 100

<212> DNA

<213> 合成

<400> 46

gaacgggaag cttgtcatca atggaaatcc catcaccatc ttccaggagc gagatccctc 60

caaaatcaag tggggcgatg ctggcgctga gtacgtcgtg 100

<210> 47

<211> 100

<212> DNA

<213> 合成

<400> 47

tgcagaagga gatcactgcc ctggcaccca gcacaatgaa gatcaagatc attgctcctc 60

ctgagcgcaa gtactccgtg tggatcggcg gctccatcct 100

<210> 48

<211> 100

<212> DNA

<213> 合成

<400> 48

ccgatttcat gactgaacag tcaccgacga gagtgctggg gaataaaaag gggatcttca 60

ctcggcagag acaaccaaaa agtgcagcgt tccttttgcg 100

<210> 49

<211> 100

<212> DNA

<213> 合成

<400> 49

gcaagaagta tgctgaggct gtcactcggg ctaagcagat tgtgtggaat ggtcctgtgg 60

gggtatttga atgggaagct tttgcccggg gaaccaaagc 100

<210> 50

<211> 100

<212> DNA

<213> 合成

<400> 50

gatgtcctcc cgccaagcca tgttagaaaa tgcatctgac atcaagctgg agaagttcag 60

catctccgct catggcaagg agctgttcgt caatgcagac 100

<210> 51

<211> 100

<212> DNA

<213> 合成

<400> 51

tactgaagaa tggagagaga attgaaaaag tggagcattc agacttgtct ttcagcaagg 60

actggtcttt ctatctcttg tactacactg aattcacccc 100

<210> 52

<211> 100

<212> DNA

<213> 合成

<400> 52

cgaaatgttt cattgtggga gcagacaatg tgggctccaa gcagatgcag cagatccgca 60

tgtcccttcg cgggaaggct gtggtgctga tgggcaagaa 100

<210> 53

<211> 100

<212> DNA

<213> 合成

<400> 53

cagtttccac catctcggtc atcaggattg cctaatatac ctgtccagac aatctccaga 60

gctgctgcag aaaagctgtt tgggaatatg gaaggagact 100

<210> 54

<211> 100

<212> DNA

<213> 合成

<400> 54

ttctaagtat gtccatttcc catctcagct tcaagggagg tgtcagcagt attatctcca 60

ctttcaatct ccctccaagc tctactctgg aggagtctgt 100

27页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:治疗遗传性视神经病变的组合物和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!