一种copd早期诊断标志物及其应用
阅读说明:本技术 一种copd早期诊断标志物及其应用 (COPD early diagnosis marker and application thereof ) 是由 刘持 秦岭 袁琳 杜茜子 秦晓群 向阳 瞿湘萍 刘惠君 于 2019-09-30 设计创作,主要内容包括:本发明涉及医药技术领域,具体涉及用于COPD的生物标志物及其应用。本发明提供了一种COPD早期诊断药物标志物及包含此标志物的诊断药物试剂盒,所述标志物为8个在COPD中差异表达的衰老相关基因:FOXO3,TP53,TGFβ1,HDAC1,NUF2,ATG3,AREG,E2F1中的一个或任意几个的组合,或在COPD中差异表达的衰老相关基因的13个甲基化位点的一个或任意几个的组合。本发明标志物在对照组与COPD组的甲基化程度有统计学意义(P<0.05),可作为生物标志物应用于临床COPD的诊断药物。(The invention relates to the technical field of medicines, in particular to a biomarker for COPD and application thereof. The invention provides a COPD early diagnosis drug marker and a diagnosis drug kit comprising the marker, wherein the marker comprises 8 senescence-associated genes which are differentially expressed in COPD: FOXO3, TP53, TGF β 1, HDAC1, NUF2, ATG3, AREG, E2F1, or one or any combination of 13 methylation sites of senescence-associated genes differentially expressed in COPD. The marker has statistical significance (P <0.05) in the methylation degree of a control group and a COPD group, and can be used as a biomarker applied to clinical COPD diagnosis medicines.)
技术领域
本发明涉及医药技术领域,具体涉及用于鉴定慢性阻塞性肺疾病的生物标志物及其检测应用。
背景技术
慢性阻塞性疾病(chronic obstructive pulmonary disease,COPD)是一种以不完全可逆的气流受限为特点的疾病状态,这种气流受限通常呈进行性加重,其病理特征是持续进行性的气流阻塞和气道炎症的持续加重。COPD是目前世界范围内高发病率及致死率的疾病之一,其发病率呈逐渐升高的趋势。预测到2020年,COPD将成为世界第三大死因,其在发病率,入院率和医药治疗方面为全球带来严重的健康负担。特别值得注意的是,现阶段COPD的易感风险筛查和早期诊断药物难度非常大,临床上尚无针对于COPD的有效治疗方案。COPD确诊时的病情通常较为严重且呈进行性加重趋势,是呼吸系统疾病防治领域的重点和难点。因此,通过对COPD发病机制及临床特征的深入研究,进而探寻针对COPD的早期风险筛查和临床诊断药物的生物学标志物,具有十分重要的意义。
大量的临床流行病学数据和实验室研究发现,加速的肺衰老是COPD的重要致病机制。流行病学资料明确显示COPD在65岁以上的老年人群发病率明显较高。在COPD患者中已经检测到端粒缩短,细胞衰老和干细胞衰竭等衰老相关细胞分子信号明显增强,且抗衰老分子如组蛋白脱乙酰酶和去乙酰化酶的表达降低。有效的抗衰老干预和清除肺部衰老细胞可以明显改善肺部炎症程度和COPD的临床进展,以上数据强烈提示衰老相关基因的表达和调控异常参与诱导COPD的发生发展。
最近的一系列证据表明,调控表观遗传机制可能是衰老相关基因表达调控的主要方式。DNA甲基化是表观遗传调控中研究得最早,也是最重要的一种修饰方式,它参与了基因/环境间复杂的相互作用,与基因调控、生物发育以及疾病的发生密切相关。DNA甲基化主要表现为DNA序列中的腺嘌呤或胞嘧啶碱基在DNA甲基化转移酶的催化下与甲基发生共价结合,在细胞***过程中传递给子细胞的表观遗传现象,并且一般发生在CpG位点(胞嘧啶-磷酸-鸟嘌呤位点,即DNA序列中胞嘧啶后紧连鸟嘌呤的位点)。已有研究证实,DNA甲基化的水平与COPD发病密切相关,他们可以作为肿瘤、COPD等疾病发病早期风险预测的生物标志物。另外,DNA甲基化序列是以一种高度稳定的形式存在于人类血清中,能够抵御RNA酶,蛋白酶的消化作用以及细胞的各种应激状态。
综上所述,COPD的发病率和病死率近年来呈逐年上升趋势,临床上仍然不能早期预测,一旦确诊呈进行性加重,不能根治,造成了严重的家庭经济负担和社会健康问题。但是,COPD作为一类多基因遗传与环境因素相互作用导致的复杂疾病,到目前为止临床上尚无有效的风险预测标志物。由于血清相对比较容易获取,循环血清中的DNA甲基化生物标志物有望作为非侵入式的风险标志物用于COPD发病的早期诊断药物。
发明内容
针对现有技术的不足,本发明目的是提供一种COPD早期诊断药物标志物及包含此标志物的诊断药物试剂盒。本发明用筛选出的甲基化位点进一步验证COPD样本组和健康对照样本血液中的变异率,结果显示本发明中筛选出的13个甲基化位点在对照组与COPD组的甲基化程度有统计学意义(P<0.05),并且筛选出的13个甲基化位点可作为生物标志物应用于临床COPD的诊断药物(P<0.01)。
一种COPD早期诊断药物标志物,所述标志物为8个在COPD中差异表达的衰老相关基因中的一个或任意几个的组合,所述8个在COPD中差异表达的衰老相关基因分别是:FOXO3,TP53,TGFβ1,HDAC1,NUF2,ATG3,AREG,E2F1。
优选的,所述标志物为8个在COPD中差异表达的衰老相关基因的13个甲基化CpG位点的一个或任意几个的组合,分别为:chr6:108879506,chr20:32274142,chr3:112281632,chr20:32274387,chr3:112280747,chr6:108879098,chr1:32757856,chr19:41858066,chr6:108880486,chr6:108879086,chr3:112280605,chrl:163292017,chr19:41858034。
一种上述的标志物在COPD早期诊断药物中的应用,是通过8个在COPD中差异表达的衰老相关基因中的一个或任意几个的组合的表达水平区分COPD人群与健康人群。
一种上述的标志物在COPD早期诊断药物中的应用,是通过13个甲基化位点的一个或任意几个的组合位点的甲基化水平和变异率区分COPD人群与健康人群。
上述的标志物在COPD早期诊断药物中的应用,包括以下步骤:
(1)收集COPD患者和健康对照测试者的外周血;
(2)通过ROC曲线评估13个甲基化位点区分COPD人群与健康人群的诊断药物准确性;
(3)评估甲基化位点的最佳的诊断药物界限值;通过ROC曲线评估13个甲基化位点的最佳的诊断药物界限值,根据约登指数(敏感性+特异性-1)最大值所对应的的甲基化表达水平确定各甲基化位点的最佳诊断药物界限值;根据此界限值,将甲基化位点甲基化水平从连续性变量转化为分类变量,即根据最佳的诊断药物界限值,确定各甲基化位点甲基化水平是否发生变化;
(4)评估各样本中13个甲基化位点发生变化的变异率。
优选的,所述步骤(4)中判断是否为COPD患者的依据是变异率为0-23.08%提示COPD阴性,变异率为23.08%-61.54%提示COPD高风险,变异率为61.54-100%提示COPD阳性。
一种早期诊断药物COPD的试剂盒,所述试剂盒含有13对用于扩增上述标志物的甲基化PCR引物对。
优选的,所述试剂盒中含有Taq酶聚合酶链式反应体系和13对用于扩增所述13个甲基化位点的的甲基化PCR引物对,所述Taq酶聚合酶链式反应体系包括:Taq酶,PCR缓冲液,dNTPs。
优选的,所述试剂盒包括Taq酶聚合酶链式反应体系和以下甲基化位点所对应的引物对:
所述试剂盒包括:Taq酶2.6μl,10*PCR缓冲液32.5μl,dNTPs 19.5μl,ddH2O222μl,13种甲基化位点的10μM上下游引物各1μl。
一种筛选所述标志物的方法,包括以下步骤:
1、筛选衰老相关基因;
2、大样本量验证在COPD患者中差异表达的衰老相关基因;
3、对在COPD患者中差异表达的衰老相关基因进行二代甲基化测序和差异CpG位点分析;确定区分COPD人群与健康人群的DNA甲基化生物标志物;
4、大样本量验证13个关键差异CpG位点的甲基化水平和变异率作为生物标志物区分COPD人群与健康人群的可行性。
优选的,所述筛选衰老相关基因的具体步骤为:
S1、筛选健康对照外周血mRNA基因表达谱芯片衰老相关基因;
S2、健康对照与COPD外周血的转录组测序及差异基因分析;
S3、筛选在COPD中差异表达的衰老相关基因。
优选的,所述S1筛选健康对照外周血mRNA基因表达谱芯片衰老相关基因的具体步骤为:
(1)筛选衰老数据库:在NCBI中,以“aging”,“senescence”为关键词,查找种属为人类,样本为外周血/外周血单核细胞的数据库。排除标准为:1.缺乏研究对象的具体年龄信息;2.研究对象患有明确的疾病或在研究期间接受某种干预;3.样本量小于30。最终纳入的3个数据库分别为GSE58137,GSE65219,GSE74786。
(2)筛选衰老相关基因:通过调整的线性回归模型分别分析3个数据库中伴随增龄的差异表达基因,随后对三个数据库所产生的差异表达基因通过韦恩图取交集得到衰老相关基因。
优选的,所述S2的健康对照与COPD外周血的转录组测序及差异基因分析,具体步骤为:
(1)收集临床明确诊断药物为COPD病人及健康对照测试者的外周血;
(2)健康对照与COPD外周血的转录组测序及差异基因分析。
优选的,所述转录组测序的步骤为
①提取RNA,具体步骤如下:
a.裂解外周血中的红细胞,离心后,加入Trizol、氯仿,摇匀后离心;
b.取离心液上层水相,加入异丙醇后离心;
c.醇洗、干燥后溶于无核酶水,用紫外分光光度计测定RNA的浓度。
②RNA质量检测,具体步骤如下:
a.测定RNA的浓度和总量:Qubit精确定量浓度,并根据浓度和体积计算出总量;
b.测定RNA的纯度:用Nanodrop检测OD260/280和260/230的比值;
c.测定RNA的完整度:采用琼脂糖凝胶电泳和Agilent 2100 Bioanalyzer检测RNA的降解程度;
RNA样品总量在1-4μg之间,260/280比值在1.8-2.0之间,或者Agilent 2100Bioanalyzer检测的RIN≥8代表RNA数量足够且完整度高。
③分选纯化mRNA及片段化mRNA:
利用带有oligo-dT的磁珠特异性结合带有poly(A)结构的mRNA的机理,通过带有oligo-dT的磁珠两轮的纯化,最大限度降低rRNA与分选磁珠的非特异性结合,达到从总RNA中富集,纯化mRNA的效果。
在第二轮磁珠纯化后,加入由洗脱液、片段化mRNA和随机引物组成的缓冲液,方便下一步cDNA合成中的随机引物结合片段化mRNA。(片段化mRNA:将磁珠94℃高温孵育,洗脱结合的mRNA同时进行热断裂,使片段分布在100-300bp之间。根据RNA的质量,调整孵育时间来优化片段化效果)
④合成第一链cDNA:
以片段化且结合了随机逆转录引物的短片段mRNA为模板,在Invitrogen逆转录酶SuperScript IV(SS IV)的作用下进行第一链cDNA的合成。
⑤合成第二链cDNA:
向合成一链cDNA的体系中加入第二链合成预混体系(缓冲液、dNTPs、RNase H和DNA polymerase I),水解消化RNA/cDNA杂合链上的RNA,并以一链cDNA为模板,通过DNA聚合酶合成第二链cDNA,经过AgencourtAMpure XP磁珠纯化,最终得到双链cDNA(Double-strand cDNA,ds cDNA);
⑥双链cDNA末端修复反应:
向纯化后的ds cDNA加入末端补齐体系,其中含有修复cDNA两端不规则末端的酶组合,具体如下:外切酶(Exonuclease)活性消化3’端的单链突出,聚合酶(Polymerase)活性补齐5’端的突出;同时磷酸激酶(PNK)在5’末端加上后续连接反应必需的磷酸基团,经过Agencourt AMpure XP磁珠纯化,最终得到5’端含有磷酸基团的平末端ds cDNA短片段文库;
⑦3’末端加“A”反应:
向上述体系中加入3’末端加“A”缓冲反应体系(缓冲液,RNA末端腺苷酸转移酶,ATP)。在末端修饰完成的ds cDNA两边3’末端加上单个腺苷酸“A”,防止cDNA片段之间的平末端自连,而且可以与下一步测序接头5’末端的单个“T”突出互补配对,准确连接,有效降低文库片段之间自身的串联;
⑧连接测序接头:
向上述反应体系中加入连接缓冲液、T4 DNA连接酶和双链测序接头,利用T4 DNA连接酶将illumina测序接头连接至文库DNA两端。
⑨文库片段筛选:
对于加上接头的文库,应用Agencourt SPRIselect核酸片段筛选试剂盒在纯化文库的同时,进行片段大小筛选。采用两步法筛选(Double Size selection),先用SPRI磁珠去掉目标区域左侧小片段(Left-side Size selection),再去掉位于目标片段区域右侧的大片段(Right-side Size selection)。最终筛选出片段峰值在300bp的原始文库,用于下一步的PCR扩增。经过纯化后的文库,去掉了体系中过量的测序接头,和接头自连的产物,避免PCR放大过程的无效扩增,消除对上机测序的影响;
⑩PCR扩增cDNA文库:
在50μL反应体系中应用高保真的聚合酶放大原始文库,以保证上测序仪的足够文库总量。同时也只有两端都带上接头的DNA片段能够被扩增,去除掉只连接单端接头的片段。PCR扩增循环数控制在12-15之间(一般1μg起始的总RNA,最终文库放大控制在15个循环)。在保证产物足够的前提下,减少因扩增循环数过大而引入的bias。放大后的文库经过磁珠纯化即成为可以上机的测序文库;
文库的质量检测:
对构建好的测序文库进行质检和定量。应用Qubit准确定量文库浓度,用于准确混样,保证每个样本的数据量合适均衡。应用Agilent2100Bioanalyzer确定文库片段大小分布,评估适合上机;
混样并进行上机测序:
对于质检合格的样品经过稀释后按等摩尔数对多个样品进行混样上机。采用illumina Hiseq平台,2×150的双端测序策略对文库进行测序。
高通量转录组测序数据分析:
对测序结果进行生物信息学分析,使用tophat2将质量控制后的序列和参考基因组进行比对,利用cufflinks的分析流程对已知的基因和转录本进行表达定量,利用cuffdiff软件分析差异表达基因。当adj.p-value<0.05时,认为mRNA显著差异表达。
优选的,所述S3筛选在COPD中差异表达的衰老相关基因,具体步骤为:
通过NCBI对衰老相关基因进行肺内表达丰度筛选,得到了在肺内表达丰度高的衰老相关基因,随后通过韦恩图对衰老相关基因与在COPD中差异表达的基因取交集,确定COPD中差异表达的衰老相关基因。
所述大样本量验证在COPD患者中差异表达的衰老相关基因,具体步骤如下:
(1)按照步骤2中的方法收集COPD患者和健康对照测试者的外周血;
(2)按照步骤2中的方法提取外周血RNA;
(3)逆转录:使用Sigma公司的反转录试剂盒进行操作,具体步骤如下:取1μgRNA,根据上述已测的RNA浓度,计算出需要加入的RNA体积,应用随机引物1μl Oligo引物1μl和无核酶水配制12μl反应体系,在65℃条件下变性5min。应用AMV逆转录酶和RNase抑制剂在25℃5min,42℃60min,70℃5min条件下进行逆转录反应。
(4)Real-Time qPCR,具体步骤如下:
①设计qPCR扩增引物;
②配置qPCR反应体系;
③进行PCR反应。
优选的,所述衰老相关基因的二代甲基化测序和差异CpG位点分析,具体步骤如下:
(1)二代甲基化测序:
①按照步骤2中的方法收集COPD患者和健康对照测试者外周血;
②通过外周血基因组DNA提取试剂盒提取DNA;
③样品质控,具体为:琼脂糖凝胶电泳检测基因组DNA完整性;Nanodrop 2000检测基因组DNA质量;
④选择位于靶基因近端启动子中CpG岛;
⑤设计引物并优化单位点PCR条件:基于软件设计测序引物,挑选能够以经重亚硫酸盐处理的人基因组为模板,扩增获得清晰单一条带的引物用于后续实验;
⑥多重PCR引物panel优化:将经步骤④优化后的引物混合为多重PCR引物panel,并使用多重PCR技术,以标准人基因组为模板进行扩增,基于毛细管电泳的特殊方法,判断多重体系中每对引物是否高效、特异地进行扩增,并以此调整,优化多重PCRpanel中的引物组成及浓度;
⑦重亚硫酸盐处理:
使用EZ DNA Methylation-Gold Kit进行样本处理,将基因组DNA未被甲基化修饰的胞嘧啶C转化为胸腺嘧啶U;
⑧样本目标片段多重PCR反应:
使用优化后的多重PCR引物panel,以转化后的样品基因组为模板,进行多重PCR扩增;经质控后,将以同一个样品基因组DNA为模板的所有多重PCR引物panel的扩增产物混合,并确保每个位点引物扩增产物的量相当;
⑨样本添加特异性标签序列:
利用带有Index序列的引物,通过PCR扩增向文库末端引入和illumina平台兼容的特异性标签序列;
⑩定量后上机测序:
将样品Index PCR扩增产物等量混合,并经割胶回收获得最终的MethylTarget测序文库,文库的片段长度分布经Agilent 2100 Bioanalyzer验证;文库摩尔浓度精确定量后,最终于Illumina Hiseq/Nextseq平台,以2×150bp的双端测序模式进行高通量测序,获得FastQ数据;
优选的,所述差异CpG位点分析具体为:对测序结果进行分析,将质量控制后的测序数据和参考基因组进行比对,对目标片段富集效率,片段有效reads及盐化效率进行统计,分析每个CpG位点在样本中甲基化的比例;对所有甲基化结果,根据样本的分组信息,进行差异显著性分析,分析方法为T检验,单变量逻辑回归与多变量逻辑回归,当P value<0.05时,认为CpG位点甲基化显著差异表达。
所述差异CpG位点的甲基化水平与COPD患者临床参数的相关性分析,具体方法如下:
根据样品的分组信息,Benjamin-Hochberg方法用于控制错误发现率(FDR),皮尔森相关性用于评估差异CpG位点的甲基化水平和COPD患者临床参数的关联。
下面对本发明进行进一步的解释:COPD患者的存在不同程度的肺衰老,我们思考这种加速的肺衰老可能是由于衰老相关基因的DNA甲基化调控异常所引起。因此,衰老相关基因的关键CpG位点甲基化及其甲基化水平可能参与并构成COPD的发病过程。
为了获得一种COPD的非侵入式的血清标志物用于COPD发病风险的早期诊断药物,我们检测了在COPD病人和健康对照人群中差异表达的衰老相关基因候选CpG位点的甲基化表达水平,并评估了差异CpG位点的DNA甲基化水平与COPD患者的临床参数之间的相关性。随后进一步在大样本量临床标本中检测了衰老相关基因关键差异CpG位点的甲基化水平及甲基化变异率,验证衰老相关基因的关键差异CpG位点的甲基化水平和变异率作为生物标志物区分COPD人群与健康人群的可行性。
我们通过Gene Expression Omnibus(GEO)的3个衰老相关数据库对衰老相关基因进行初步筛选,通过COPD患者外周血转录组测序对其进行二次筛选以确定在COPD患者中差异表达的衰老相关基因,并且在mRNA水平验证这些衰老相关基因在COPD患者中的差异表达。在此基础上,我们评估了衰老相关基因候选CpG位点及其甲基化水平,以及差异CpG位点的DNA甲基化水平与COPD患者的临床参数之间的相关性,包括FEV1,FEV1%,FEV/FVC,mMRC评分,急性发作频率和CAT评分。结果显示差异表达的衰老相关基因的DNA调控区中存在13个甲基化位点与COPD患者的临床参数存在相关性。最后,我们收集大样本量临床标本检测以上13个甲基化位点在COPD患者中的甲基化水平及甲基化变异率。结果显示差异表达衰老相关基因的13个甲基化位点的甲基化变异率可作为生物标志物有效区分COPD人群与健康人群。综上所述,作为COPD早期诊断药物生物标志物的衰老相关基因的甲基化位点为:chr6:108879506,chr20:32274142,chr3:112281632,chr20:32274387,chr3:112280747,chr6:108879098,chr1:32757856,chr19:41858066,chr6:108880486,chr6:108879086,chr3:112280605,chr1:163292017,chr19:41858034。
由此可见,本发明所提供的这13个甲基化位点组成的血清DNA甲基化生物标志物谱可以适用于COPD的早期诊断药物。另外,将COPD病人按照年龄,性别进行分层比较,显示这些临床因素均与衰老相关基因的甲基化水平无关(P>0.05),因此这13个甲基化位点谱可以作为COPD的早期诊断药物的生物标志物。
根据本发明的实验数据,衰老相关基因的差异甲基化位点谱是COPD早期诊断药物的生物标志物,上述衰老相关基因DNA甲基化位点谱还可以用于制备COPD早期诊断药物试剂盒。
与现有技术相比,本发明的有益效果如下:
本发明提供了一种COPD早期诊断药物标志物和试剂盒,试验结果显示本发明中筛选出的13个甲基化位点在对照组与COPD组的甲基化程度有统计学意义(P<0.05),并且筛选出的13个甲基化位点的变异率可作为生物标志物应用于临床COPD的诊断药物(P<0.01)。
附图说明
图1是本发明的8个衰老相关基因在COPD患者外周血差异表达结果图。
图2是本发明通过ROC曲线评估13个甲基化位点区分COPD人群与健康人群的诊断药物准确性的结果图。
具体实施方式
以下将结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1
1.利用含有不同年龄阶段的健康对照外周血的mRNA基因表达谱芯片筛选衰老相关基因。
(1)筛选衰老数据库:在NCBI中,以“aging”,“senescence”为关键词,查找种属为人类,样本为外周血/外周血单核细胞的数据库。排除标准为:1.缺乏研究对象的具体年龄信息;2.研究对象患有明确的疾病或在研究期间接受某种干预;3.样本量小于30。最终纳入的3个数据库分别为GSE58137,GSE65219,GSE74786。
(2)筛选衰老相关基因:通过调整的线性回归模型分别分析3个数据库中伴随增龄的差异表达基因,随后对三个数据库所产生的差异表达基因通过韦恩图取交集得到衰老相关基因。
筛选结果:根据韦恩图结果,在三个衰老数据库中重合的衰老相关基因有128个。
2.利用健康对照和COPD患者的外周血进行转录组测序,进一步筛选在COPD患者中差异表达的衰老相关基因。
(2)收集临床明确诊断药物为COPD病人及健康对照测试者的外周血
COPD组选取的对象为中南大学湘雅医院确诊并且符合诊断药物标准的6人,对照组选择同一时间段在中南大学湘雅医院体检无明显异常人群6人。所有受试者均告知入组的目的,并且全部都签署了知情同意书,并对两组间的性别、年龄、身高进行比较发现无显著性差异。收集病例的时间为2017年1月到2018年12月。
COPD诊断药物标准
2019版慢性阻塞性肺疾病全球倡议(GOLD指南)的COPD的诊断药物标准,具体如下:
①存在呼吸困难,慢性咳嗽或咳痰,和/或有危险因素暴露史的患者,需考虑COPD这一诊断药物。
②需通过肺功能检查确诊;吸入支气管扩张剂后,FEV1/FVC<0.70,确认存在持续性气流受限。
(2)健康对照与COPD外周血的转录组测序及差异基因分析;转录组测序步骤参考文献:RNA-Seq:a method for comprehensive transcriptome analysis.Curr ProtocMol Biol.2010;PMID:20069539,具体如下:
①提取RNA,具体步骤如下:
d.通过红细胞裂解液裂解外周血中的红细胞,离心后彻底吸除上层液体,下层即为白细胞沉淀,加入1ml Trizol混匀后转移至1.5ml离心管,室温放置5分钟后,加入0.2ml氯仿,剧烈震荡15s,室温放置3min。4℃,12000g,离心15min。
e.取上层水相,加入0.5ml异丙醇,轻轻震荡5s,室温放置10min。4℃,12000g,离心15min。
f.75%乙醇洗两次,室温放置至干燥。将RNA溶于50μl无核酶水,用紫外分光光度计测定RNA的浓度。
②RNA质量检测
d.RNA的浓度和总量:Qubit精确定量浓度;
e.RNA的纯度:Nanodrop检测OD260/280和260/230的比值;
f.RNA的完整度:琼脂糖凝胶电泳和Agilent 2100 Bioanalyzer检测RNA的降解程度;
RNA样品总量在1-4μg之间,260/280比值在1.8-2.0之间,或者Agilent 2100Bioanalyzer检测的RIN≥8。
③分选纯化mRNA及片段化(Purify and Fragment mRNA)
取1μg的总RNA分选mRNA,利用带有oligo-dT的磁珠特异性结合带有poly(A)结构的mRNA通过两轮的纯化,最大限度降低rRNA等与分选磁珠的非特异性结合,达到从总RNA中富集,纯化mRNA的效果。
在第二轮磁珠纯化后,加入洗脱、片段化和随机引物组成的缓冲液,方便下一步cDNA合成中的随机引物结合。将磁珠94℃高温孵育,洗脱结合的mRNA同时进行热断裂,使片段分布在100-300bp之间。根据RNA的质量,调整时间来优化片段化效果。
④合成第一链cDNA(Synthesize First Strand cDNA)
以片段化且结合了随机逆转录引物的短片段mRNA为模板,在Invitrogen逆转录酶SuperScript IV(SS IV)的作用下进行第一链cDNA的合成。
⑤合成第二链cDNA(Synthesize Second Strand cDNA)
向合成一链cDNA的体系中加入二链合成预混体系,水解消化RNA/cDNA杂合链上的RNA,并以一链cDNA为模板,DNA聚合酶合成二链cDNA,经过Agencourt AMpure XP磁珠纯化,最终得到双链cDNA(Double-strand cDNA,ds cDNA);
⑥双链cDNA末端修复反应(End Repair)
向纯化后的ds cDNA加入末端补齐体系,含有修复cDNA两端不规则末端的酶组合。其中的外切酶(Exonuclease)活性消化3’端的单链突出,而聚合酶(Polymerase)活性补齐5’端的突出;同时磷酸激酶(PNK)在5’末端加上后续连接反应必需的磷酸基团,经过AgencourtAMpureXP磁珠纯化,最终得到5’端含有磷酸基团的平末端ds cDNA短片段文库;
⑦3’末端加“A”反应(Adenlylate 3’Ends)
向上述体系中加入3’末端加“A”缓冲反应体系。在末端修饰完成的双链cDNA两边3’末端加上单个腺苷酸“A”,防止cDNA片段之间的平末端自连,而可以与下一步测序接头5’末端的单个“T”突出互补配对,准确连接,有效降低文库片段之间自身的串联;
⑧连接测序接头(Ligate Adapters)
向上述反应体系中加入连接缓冲液和双链测序接头,利用T4 DNA连接酶将illumina测序接头连接至文库DNA两端。50ul反应体系在30℃孵育10分钟,快速有效的进行连接反应;
⑨文库片段筛选(Select Size)
对于加上接头的文库,应用Agencourt SPRIselect核酸片段筛选试剂盒在纯化文库的同时,进行片段大小筛选。采用两步法筛选(Double Size selection),先用SPRI磁珠去掉目标区域左侧小片段(Left-side Size selection),再去掉位于目标片段区域右侧的大片段(Right-side Size selection)最终筛选出片段峰值在300bp的原始文库,用于下一步的PCR扩增。经过纯化后的文库,去掉了体系中过量的测序接头,和接头自连的产物,避免PCR放大过程的无效扩增,消除对上机测序的影响;
⑩PCR扩增cDNA文库(PCR Amplification)
在50μL反应体系中应用高保真的聚合酶放大原始文库,以保证上测序仪的足够文库总量。同时也只有两端都带上接头的DNA片段能够被扩增,去除掉只连接单端接头的片段。PCR扩增循环数控制在12-15之间(一般1μg起始的总RNA,最终文库放大控制在15个循环)。在保证产物足够的前提下,减少因扩增循环数过大而引入的bias。放大后的文库经过磁珠纯化即成为可以上机的测序文库;
文库的质量检测(Library Quality Check)
对构建好的测序文库进行质检和定量。应用Qubit准确定量文库浓度,用于准确混样,保证每个样本的数据量合适均衡。应用Agilent2100 Bioanalyzer确定文库片段大小分布,评估适合上机;
混样并进行上机测序(Pool Library and Sequencing)
对于质检合格的样品经过稀释后按等摩尔数对多个样品进行混样上机。采用illumina Hiseq平台,2×150的双端测序策略对文库进行测序。
高通量转录组测序数据分析
对测序结果进行生物信息学分析,使用tophat2将质量控制后的序列和参考基因组进行比对,利用cufflinks的分析流程对已知的基因和转录本进行表达定量,利用cuffdiff软件分析差异表达基因。当adj.p-value<0.05时,认为mRNA显著差异表达。
(3)筛选在COPD中差异表达的衰老相关基因
通过NCBI对从衰老数据库得出的128个衰老相关基因进行肺内表达丰度筛选,得到了25个在肺内表达丰度高的衰老相关基因,随后通过韦恩图对这25个衰老相关基因与在COPD中差异表达的基因取交集,确定了8个在COPD中差异表达的衰老相关基因,分别是:FOXO3,TP53,TGFβ1,HDAC1,NUF2,ATG3,AREG,E2F1。
3.大样本量验证在COPD患者中差异表达的衰老相关基因
(1)按照2中的方法收集COPD患者外周血92份,健康对照测试者外周血79份。
(2)按照2中的方法提取外周血RNA。
(3)逆转录:
使用Sigma公司的反转录试剂盒进行操作,具体步骤如下:取1μgRNA,根据上述已测的RNA浓度,计算出需要加入的RNA体积,应用随机引物1μl Oligo引物1μl和无核酶水配制12μl反应体系,在65℃条件下变性5min。应用AMV逆转录酶和RNase抑制剂在25℃5min,42℃60min,70℃5min条件下进行逆转录反应。
(4)Real-Time qPCR:
①引物设计:根据Genebank中基因序列设计qPCR扩增引物,由上海生物生工技术服务有限公司合成。具体引物序列如下:
表1 8个在COPD中差异表达的衰老相关基因的qPCR扩增引物
②配置25μl反应体系:SYBR green Mix 12.5μl,去离子水8.5μl,正(反)向引物1μl,模板2μl,混合均匀。其中SYBRgreenMix购自于TAKARA公司。
③PCR反应条件:95℃30s,95℃5s,60℃30s,40cycles。以SYBR Green作为荧光标志物,在荧光定量PCR仪上进行PCR反应,通过ΔCT法进行相对定量。
(5)结果
结果如图1所示,相对于健康对照,8个衰老相关基因在COPD患者外周血表达下调,差异具有统计学差异(P<0.05)。
4.8个衰老相关基因进行二代甲基化测序和差异CpG位点分析
(1)二代甲基化测序
①按照2中的方法收集COPD患者外周血23份,健康对照测试者外周血21份。
②通过外周血基因组DNA提取试剂盒提取DNA。
③样品质控
a.琼脂糖凝胶电泳检测基因组DNA完整性:电泳条带清晰可见,无明显降解,且无RNA污染。
b.Nanodrop 2000检测基因组DNA质量:浓度≥20ng/μL,总量≥1μg(可供10个多重PCR Panel的检测),OD260/280=1.7~2.0,OD260/230≥1.8;
④位于靶基因近端启动子中CpG岛选择
a.最小长度为200bp;
b.GC含量≥50%或更高;
c.观察到的/预期的二核苷酸CpG的比例大于等于0.60。
⑤引物设计与单位点PCR条件优化
基于软件设计测序引物,挑选能够以经重亚硫酸盐处理的人基因组为模板,扩增获得清晰单一条带的引物用于后续实验。
⑥多重PCR引物panel优化
将经步骤④优化后的引物混合为多重PCR引物panel。并使用多重PCR技术,以标准人基因组为模板进行扩增。基于毛细管电泳的特殊方法,判断多重体系中每对引物是否高效、特异地进行扩增,并以此调整,优化多重PCRpanel中的引物组成及浓度。
⑦重亚硫酸盐处理
使用EZ DNA Methylation-Gold Kit进行样本处理,将基因组DNA未被甲基化修饰的胞嘧啶C转化为胸腺嘧啶U。
⑧样本目标片段多重PCR反应
使用优化后的多重PCR引物panel,以转化后的样品基因组为模板,进行多重PCR扩增。经质控后,将以同一个样品基因组DNA为模板的所有多重PCR引物panel的扩增产物混合,并确保每个位点引物扩增产物的量相当。
⑨样本添加特异性标签序列
利用带有Index序列的引物,通过PCR扩增向文库末端引入和illumina平台兼容的特异性标签序列。反应采用11个循环数的PCR程序,尽可能降低PCR的倾向性。
⑩定量后上机测序
将样品Index PCR扩增产物等量混合,并经割胶回收获得最终的MethylTarget测序文库,文库的片段长度分布经Agilent 2100 Bioanalyzer验证。文库摩尔浓度精确定量后,最终于Illumina Hiseq/Nextseq平台,以2×150bp的双端测序模式进行高通量测序,获得FastQ数据。
(2)差异CpG位点分析
对测序结果进行分析,将质量控制后的测序数据和参考基因组进行比对,对目标片段富集效率,片段有效reads及盐化效率进行统计,分析每个CpG位点在样本中甲基化的比例。对所有甲基化结果,根据样本的分组信息,进行差异显著性分析,分析方法为T检验,单变量逻辑回归与多变量逻辑回归,当p value<0.05时,认为CpG位点甲基化显著差异表达。
(3)结果
结果显示:相对于健康对照,8个衰老相关基因共有157个CpG位点在COPD患者外周血中甲基化水平发生显著改变,差异具有统计学差异(P<0.05)。
5.通过差异CpG位点的甲基化水平与COPD患者临床参数的相关性分析,确定区分COPD人群与健康人群的DNA甲基化生物标志物。
根据样品的分组信息,Benjamin-Hochberg方法用于控制错误发现率(FDR),皮尔森相关性用于评估差异CpG位点的甲基化水平和COPD患者临床参数的关联,结果显示共有13个CpG位点的甲基化水平与COPD患者临床参数存在相关性,提示这13个甲基化位点可能作为生物标志物应用于COPD的早期诊断药物,具体甲基化位点见表2,13个差异CpG位点在COPD组和对照组中的表达结果见表3。
表2 13个差异CpG位点的甲基化水平及甲基化PCR引物
表3 13个差异CpG位点在COPD组和对照组中的表达结果
6.大样本量验证13个关键差异CpG位点的甲基化水平和变异率作为生物标志物区分COPD人群与健康人群的可行性。
(1)与3中的样本来源相同:COPD患者外周血92份,健康对照测试者外周血79份。
(2)评估13个甲基化位点对COPD诊断药物的准确性:
通过ROC曲线评估13个甲基化位点区分COPD人群与健康人群的诊断药物准确性,结果显示13个甲基化位点区分COPD人群与健康人群的AUC为0.610-0.722,具体见表4与附图2。
表4评估13个甲基化位点对COPD诊断药物的准确性
(3)评估13个甲基化位点的最佳的诊断药物界限值:
通过ROC曲线评估13个甲基化位点的最佳的诊断药物界限值,根据约登指数(敏感性+特异性-1)最大值所对应的的甲基化表达水平确定各甲基化位点的最佳诊断药物界限值,具体见表4与附图2。根据此界限值,将甲基化位点甲基化水平从连续性变量转化为分类变量,即根据最佳的诊断药物界限值,确定各甲基化位点甲基化水平是否发生变化。
(4)评估各样本中13个甲基化位点发生变化的变异率:
根据13个甲基化位点的最佳的诊断药物界限值,评估各样本中该13个甲基化位点发生变化的变异率。
(5)结果
统计结果显示在COPD人群和健康人群中该13个甲基化位点发生变化的变异率具有统计学差异(P<0.01),提示该13个甲基化位点的变异率可作为生物标志物应用于临床COPD的早期诊断药物。在COPD人群和健康人群变异率重叠处设置2个诊断药物点,将变异率划分为3个范围:COPD阴性、COPD高风险和COPD阳性。结果显示:变异率为0-23.08%提示COPD阴性,变异率为23.08%-61.54%提示COPD高风险,变异率为61.54-100%提示COPD阳性。
6.建立与COPD相关的衰老基因甲基化谱试剂盒
根据以上结果,我们制备了一个可用于COPD早期诊断药物的试剂盒,试剂盒中含有Taq酶聚合酶链式反应体系和用于扩增所述13个甲基化位点的的甲基化PCR引物对,所述试剂盒包括:Taq酶2.6μl,10*PCR缓冲液32.5μl,dNTPs 19.5μl,ddH2O222μl,13种甲基化位点的10μM上下游引物各1μl。可用于检测亚硫酸氢盐修饰后样本基因组DNA中所述13个甲基化位点的变异率,从而进行COPD的早期诊断药物。
上述实施例阐明的内容应当理解为这些实施例仅用于更清楚地说明本发明,而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落入本申请所附权利要求所限定的范围。
SEQUENCE LISTING
<110> 中南大学
<120> 一种COPD早期诊断标志物及其应用
<130>
<160> 42
<170> PatentIn version 3.5
<210> 1
<211> 27
<212> DNA
<213> 人工合成
<400> 1
gttgattggt ygyggttatt agttttt 27
<210> 2
<211> 20
<212> DNA
<213> 人工合成
<400> 2
cttcctcccr tccrctatcc 20
<210> 3
<211> 23
<212> DNA
<213> 人工合成
<400> 3
ttygtagggg tttyggttaa ggt 23
<210> 4
<211> 23
<212> DNA
<213> 人工合成
<400> 4
tcacraccra aacaaccaat tat 23
<210> 5
<211> 20
<212> DNA
<213> 人工合成
<400> 5
ttygagggaa aagasgagga 20
<210> 6
<211> 28
<212> DNA
<213> 人工合成
<400> 6
tcctacrtca acctccaaaa taactaaa 28
<210> 7
<211> 27
<212> DNA
<213> 人工合成
<400> 7
gtygttgttt gtaaagttty ggttatt 27
<210> 8
<211> 24
<212> DNA
<213> 人工合成
<400> 8
cctaatacca tccraacaaa acct 24
<210> 9
<211> 26
<212> DNA
<213> 人工合成
<400> 9
gggagagttt agtgttaygt gaggtt 26
<210> 10
<211> 19
<212> DNA
<213> 人工合成
<400> 10
atcctcrcac cccaaacaa 19
<210> 11
<211> 27
<212> DNA
<213> 人工合成
<400> 11
gtttgtttat tagygtaygt gggtgtt 27
<210> 12
<211> 29
<212> DNA
<213> 人工合成
<400> 12
aaaaacaacc taactatctc rcraacaac 29
<210> 13
<211> 20
<212> DNA
<213> 人工合成
<400> 13
tttttgggty ggaygttgag 20
<210> 14
<211> 19
<212> DNA
<213> 人工合成
<400> 14
ccctcrcaac ctcctctcc 19
<210> 15
<211> 25
<212> DNA
<213> 人工合成
<400> 15
ttagagggtg ttaggaaagt gagag 25
<210> 16
<211> 26
<212> DNA
<213> 人工合成
<400> 16
aaaactcrat tcctccrcta awctcc 26
<210> 17
<211> 20
<212> DNA
<213> 人工合成
<400> 17
ttygggagag gagggagaag 20
<210> 18
<211> 29
<212> DNA
<213> 人工合成
<400> 18
acraccaaca tcttatctcr aatattacc 29
<210> 19
<211> 27
<212> DNA
<213> 人工合成
<400> 19
gtttgtttat tagygtaygt gggtgtt 27
<210> 20
<211> 29
<212> DNA
<213> 人工合成
<400> 20
aaaaacaacc taactatctc rcraacaac 29
<210> 21
<211> 26
<212> DNA
<213> 人工合成
<400> 21
gggagagttt agtgttaygt gaggtt 26
<210> 22
<211> 19
<212> DNA
<213> 人工合成
<400> 22
atcctcrcac cccaaacaa 19
<210> 23
<211> 28
<212> DNA
<213> 人工合成
<400> 23
aggaaggaag tttgtagata gaygtttt 28
<210> 24
<211> 25
<212> DNA
<213> 人工合成
<400> 24
caatttcaac tcaaactcrt cttct 25
<210> 25
<211> 25
<212> DNA
<213> 人工合成
<400> 25
ttagagggtg ttaggaaagt gagag 25
<210> 26
<211> 26
<212> DNA
<213> 人工合成
<400> 26
aaaactcrat tcctccrcta awctcc 26
<210> 27
<211> 20
<212> DNA
<213> 人工合成
<400> 27
tgtcgctctt gatactcggc 20
<210> 28
<211> 20
<212> DNA
<213> 人工合成
<400> 28
aggcatttca ctcacagggg 20
<210> 29
<211> 21
<212> DNA
<213> 人工合成
<400> 29
gtgttcagtt cacccatgca g 21
<210> 30
<211> 25
<212> DNA
<213> 人工合成
<400> 30
ttaacagcca ttttgccact aatct 25
<210> 31
<211> 21
<212> DNA
<213> 人工合成
<400> 31
cgatggcctg tttgagttct g 21
<210> 32
<211> 23
<212> DNA
<213> 人工合成
<400> 32
ccctctggtg atactttagc agt 23
<210> 33
<211> 23
<212> DNA
<213> 人工合成
<400> 33
tgttaagcaa tacaaacgca cag 23
<210> 34
<211> 21
<212> DNA
<213> 人工合成
<400> 34
tgccttttca ataccgtcgt g 21
<210> 35
<211> 21
<212> DNA
<213> 人工合成
<400> 35
catcccagga ggtcacttct g 21
<210> 36
<211> 20
<212> DNA
<213> 人工合成
<400> 36
gacaacagcg gttcttgctc 20
<210> 37
<211> 19
<212> DNA
<213> 人工合成
<400> 37
cggacaaacg gctcactct 19
<210> 38
<211> 21
<212> DNA
<213> 人工合成
<400> 38
ggacccgcat gaatcgacta t 21
<210> 39
<211> 20
<212> DNA
<213> 人工合成
<400> 39
cgactcgcca gagtggttat 20
<210> 40
<211> 20
<212> DNA
<213> 人工合成
<400> 40
gctaaggcga aagccctcaa 20
<210> 41
<211> 24
<212> DNA
<213> 人工合成
<400> 41
aagtctgtga cttgcacgta ctcc 24
<210> 42
<211> 24
<212> DNA
<213> 人工合成
<400> 42
gtcatgtgct gtgactgctt gtag 24
- 上一篇:一种医用注射器针头装配设备
- 下一篇:心房颤动的诊断标志物