一种通过大样本转录组测序鉴定结直肠癌中特异分子的方法

文档序号:70755 发布日期:2021-10-01 浏览:37次 >En<

阅读说明:本技术 一种通过大样本转录组测序鉴定结直肠癌中特异分子的方法 (Method for identifying specific molecules in colorectal cancer through large sample transcriptome sequencing ) 是由 曾凡新 张红雨 李洁 高敏 李诗林 于 2021-06-19 设计创作,主要内容包括:本发明公开了一种通过大样本转录组测序鉴定结直肠癌中特异分子的方法。本发明通过大样本临床数据研究,可以鉴定出结直肠癌中显著变化的分子,对研究治疗结直肠癌的治疗方法具有深远意义。同时,针对显著变化的分子进行靶向药物设计,可以缓解患者的耐药情况,延长患者的生存时间。(The invention discloses a method for identifying specific molecules in colorectal cancer through large sample transcriptome sequencing. The invention can identify the molecules with obvious changes in the colorectal cancer through the research of large sample clinical data, and has profound significance for researching the treatment method for treating the colorectal cancer. Meanwhile, the targeted drug design is carried out aiming at the molecules with obvious changes, so that the drug resistance condition of the patient can be relieved, and the survival time of the patient is prolonged.)

一种通过大样本转录组测序鉴定结直肠癌中特异分子的方法

技术领域

本发明涉及医学领域,具体涉及一种通过大样本转录组测序鉴定结直肠癌中特异分子的方法。

背景技术

结直肠癌(Colorectal Cancer,CRC)是一种始于结肠(大肠)或直肠的癌症。这两个器官都位于消化系统的下部。美国癌症协会(ACS)估计,大约每23名男性和每25名女性中就有1 人会在他们的一生中罹患结肠直肠癌。国际癌症研究机构2018年全球评估显示,每年约有180 万结直肠癌的新发病例,并且90万人死于结直肠癌,使其成为第三大最常见的恶性肿瘤和第二大癌症死亡原因。某些固定的因素,如既往有结肠息肉病史、肠道疾病史、结直肠癌家族史、某些遗传综合症(如家族性腺瘤性息肉病(FAP))、东欧犹太人或非洲人后裔、年龄等会增加患结肠直肠癌的风险。此外,工业化和经济增长导致西方饮食模式、久坐不动的生活方式和日益增加的肥胖,都是结直肠癌的危险因素。近年来由于结肠镜筛查的应用,结直肠癌患者的发病率和死亡率有所下降,但约25%的患者仍然存在IV期疾病,而IV期患者的 5年生存率不超过10%。

不同的结直肠癌分期以及患者的整体健康状况直接决定着结直肠癌的治疗方式的选择。在结直肠癌早期阶段,切除根治术是首选的治疗方式,之后使用卡培他滨(Xeloda)、氟尿嘧啶、铂(Eloxatin)、伊立替康(Camptosar)等化疗药物或者放射对癌细胞进行后续控制。此外,靶向药物和免疫治疗也是结直肠癌治疗的有效方式,一般用于治疗转移性或晚期结肠直肠癌,根据患者靶基因的表达情况,选择合适的药物。但是目前仍有部分患者对靶向或者免疫治疗药物不敏感。

因此,研究结直肠癌相关的靶向分子和细胞活动,对于结直肠癌的治疗具有显著的意义。针对鉴定出来的靶向基因设计药物或者治疗方案可以为患者提供更多的治疗方案,延长患者的生存时间。

发明内容

本发明的目的在于,基于大样本的结直肠癌患者的组织转录组数据,利用生物信息学的方法鉴定出在结直肠癌组织中显著变化的基因与信号通路,这有助于更加利用显著变化的基因对结直肠癌的个性化治疗和预后判断提供依据。为实现上述目的,本发明采用如下技术方案:

一种通过大样本转录组测序鉴定结直肠癌中特异分子的方法,包括如下步骤:

S1.数据采集

选取并大样本量采集诊断为结直肠癌的患者,在术中收集患者的癌组织与癌旁组织;

S2.转录组测序

使用TRIZOL试剂提取组织样本的总RNA,使用安捷伦2100RNANano6000检测试剂盒检测总RNA的完整性和浓度;总RNA样本合格后,选择磁珠进行富集和纯化,目的片段经琼脂糖凝胶电泳提取,PCR扩增,然后采用PE150测序策略的Illumina平台对合格的文库进行测序;

S3.数据分析

S3-1.运用R语言中的“DSeq2”包来筛选差异基因,筛选标准:log2foldofchange&padj< 0.05;然后用主成分分析方法根据差异基因表达对患者进行聚类;

S3-2.利用GSEA软件对癌组织和癌旁组织的显著变化的信号通路进行鉴定;

S3-3.根据差异基因的表达情况,进一步筛选差异基因;

S3-4.用验证集对筛选出来的差异基因的表达情况进行验证。

本发明所述方法筛选出来的特征因子有6个,分别为:IGHG1、CA2、COL1A1、 RNA5-8SN2、MIR3648-1与AQP8。

作为改进,S1数据采集中所述患者的选取标准为:排除其他重大疾病与精神疾病患者,排除样本临床信息资料不全的患者。

作为改进,鉴定出的特异因子应用于靶向药物的设计。

本发明的优点在于:

本发明通过大样本临床数据研究,可以鉴定出结直肠癌中显著变化的分子,对研究治疗结直肠癌的治疗方法具有深远意义。同时,针对显著变化的分子进行靶向药物设计,可以缓解患者的耐药情况,延长患者的生存时间。

附图说明

图1为差异基因的火山图、热图和主成分分析图;

图2为MTORC1、OXIDATIVE_PHOSPHORYLATION、DNA_REPAIR信号通路GSEA 展示图;

图3为IGHG1、CA2、COL1A1、RNA5-8SN2、MIR3648-1与AQP8表达条形图;

图4为验证集中IGHG1、CA2、COL1A1、RNA5-8SN2、MIR3648-1、AQP8的ROC分析;

图5为AQP8、CA2和COL1A1表达量与预后。

具体实施方式

下面通过具体实施例对本发明进行详细和具体的介绍,以使更好的理解本发明,但是下述实施例并不限定本发明的保护范围。

实施例1

本实施例公开了一种通过大样本转录组测序鉴定结直肠癌中特异分子的方法,包括如下步骤:

S1.数据采集

选取并采集大样本量诊断为结直肠癌的患者,在术中收集患者的癌组织与癌旁组织;数据采集中所述患者的选取标准为:排除其他重大疾病与精神疾病患者,排除样本临床信息资料不全的患者。

S2.转录组测序

使用TRIZOL试剂提取组织样本的总RNA,使用安捷伦2100RNANano6000检测试剂盒检测总RNA的完整性和浓度;总RNA样本合格后,选择磁珠进行富集和纯化,目的片段经琼脂糖凝胶电泳提取,PCR扩增,然后采用PE150测序策略的Illumina平台对合格的文库进行测序。

S3.数据分析

S3-1.运用R语言中的“DSeq2”包来筛选差异基因,筛选标准:log2foldofchange&padj< 0.05;然后用主成分分析方法根据差异基因表达对患者进行聚类;

S3-2.利用GSEA软件对癌组织和癌旁组织的显著变化的信号通路进行鉴定;

S3-3.根据差异基因的表达情况,进一步筛选差异基因;

S3-4.用验证集对筛选出来的差异基因的表达情况进行验证。

发明人按照实施例1所用方法对所在医院的结直肠癌患者进行分析鉴定:

S1.数据采集

选取2018年2月至2019年10月,在医院病理诊断为结直肠癌的144名患者,排除有其他重大疾病与精神疾病的患者,以及样本临床信息不全的患者,在术中收集患者的癌组织与癌旁组织,其中2018年2月至2019年3月的队列作为训练队列,2019年4月至2019年10月的患者作为验证队列。

S2.转录组测序

使用TRIZOL试剂提取组织样本的总RNA;使用安捷伦2100RNANano6000检测试剂盒检测总RNA的完整性和浓度;总RNA样本合格后,选择磁珠进行富集和纯化。目的片段经琼脂糖凝胶电泳提取,PCR扩增。然后采用PE150测序策略的Illumina平台对合格的文库进行测序。

S3.数据分析

S3-1:

运用R语言中的“DSeq2”包来筛选差异基因,根据筛选标准:log2foldofchange&padj<0.05 共筛选出839个显著变化的基因,其中648个基因显著上调,191个基因显著下调。差异基因的热图和火山图如图1A-B所示。进一步运用主成分分析方法根据差异基因表达对患者进行聚类,结果表明差异基因能显著区分癌组织与癌旁组织(图1C)。

S3-2:

利用GSEA软件对癌组织和癌旁组织的显著变化的信号通路进行鉴定,通过比对HALLMARK数据库的50条经典信号通路,其中41信号通路在癌组织中显著激活,9条信号通路在癌旁组织中显著激活。图2展示了其中三条经典的信号通路(MTORC1、 OXIDATIVE_PHOSPHORYLATION、DNA_REPAIR)的激活图。

S3-3:

根据差异基因的表达情况进一步筛选出6个差异基因,IGHG1、CA2、COL1A1、 RNA5-8SN2、MIR3648-1与AQP8。如图3所示,在癌组织中CA2和AQP8显著降低, IGHG1、COL1A1、RNA5-8SN2与MIR3648-1显著增加。

S3-4:

筛选出来的6个差异基因进一步用验证集对其表达情况进行验证,利用ROC曲线,结果表明上述6个分子可独立筛选出癌组织与癌旁组织,并且具有良好的曲线下面积:IGHG1 (0.752:0.662-0.842)、CA2(0.832:0.753-0.912)、COL1A1(0.769:0.680-0.857)、RNA5-8SN2(0.902:0.849-0.956)、MIR3648-1(0.865:0.800-0.930)、AQP8(0.869: 0.799-0.938)。

进一步利用GEPIA在线数据库对CA2、COL1A1和AQP8表达量与预后的关系进行关联分析,结果显示高表达的AQP8患者有显著增加的总生存期(P<0.05),高表达的CA2患者表现出更好的总生存期(P=0.076),低表达的COL1A1表现出更好的总生存期(P=0.067) (图5)。

本次分析鉴定结果鉴定出6个在结直肠癌中显著变化的特异分子:IGHG1、CA2、COL1A1、 RNA5-8SN2、MIR3648-1与AQP8。对研究治疗结直肠癌的治疗方法具有深远意义。同时,针对显著变化的分子进行靶向药物设计,可以缓解患者的耐药情况,延长患者的生存时间。

本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不等同于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,不脱离本发明的精神和范围下所做的均等变换和修改,都应涵盖在本发明的范围内。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种蛋白纳米孔氨基酸序列的筛选方法、蛋白纳米孔及其应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!