获得稳定核小体遗传标记的方法及其在降解dna检验中的应用

文档序号:1871904 发布日期:2021-11-23 浏览:5次 >En<

阅读说明:本技术 获得稳定核小体遗传标记的方法及其在降解dna检验中的应用 (Method for obtaining stable nucleosome genetic marker and application thereof in degradation DNA detection ) 是由 董春楠 丛斌 王琳 李淑瑾 马春玲 于 2021-08-26 设计创作,主要内容包括:本发明提供了一种获得稳定核小体遗传标记的方法及其在降解DNA检验中的应用,其包括以下步骤:(a)对待检测样本进行预处理,获得包含DNA的样品;(b)将样品分组,分别用高、中、低剂量水平的微球菌核酸酶对相应样品进行消化;(c)使用试剂盒提取消化后样品中的DNA,获得核小体核心区DNA;(d)对获得的核小体核心区DNA进行测序,将相同微球菌核酸酶消化水平的两个样本数据使用生物信息学工具DANPOS进行比较,进而筛选出稳定核小体定位信息,(f)获取稳定核小体遗传标记。本发明为高度降解检材的DNA分型提供了一种可靠的新方法。(The invention provides a method for obtaining a stable nucleosome genetic marker and application thereof in a degraded DNA test, which comprises the following steps: (a) pretreating a sample to be detected to obtain a sample containing DNA; (b) grouping the samples, and digesting the corresponding samples by using micrococcus nuclease with high, medium and low dose levels respectively; (c) extracting DNA in a digested sample by using a kit to obtain nucleosome core region DNA; (d) sequencing the obtained nucleosome core region DNA, comparing two sample data with the same micrococcus nuclease digestion level by using a bioinformatics tool DANPOS, and further screening out stable nucleosome positioning information, and (f) obtaining a stable nucleosome genetic marker. The invention provides a reliable new method for DNA typing of highly degraded test materials.)

获得稳定核小体遗传标记的方法及其在降解DNA检验中的 应用

技术领域

本发明涉及法医鉴定技术领域,具体地说是一种获得稳定核小体遗传标记的方法及其在降解DNA检验中的应用。

背景技术

法医检案过程中经常会遇到各种各样的降解生物检材。在细胞死亡后,生物检材同时受到内源性因素(如内源性核酸酶、各种水解酶、微生物分泌的消化酶等酶类的分解)和外源性因素(如高温、潮湿、土壤微生物、暴晒、强酸、强碱和紫外辐射等因素)的作用,使DNA发生降解。在这种情况下,后续实验过程中常常会有PCR扩增缺失或错误扩增,STR分型出现Ladder-like条带、Sutter峰、等位基因不平等扩增及丢失等现象,使DNA分型成功率大大降低,导致案件侦破变得困难。目前用于分析降解DNA的MiniSTR、SNP等遗传标记仍会出现等位基因丢失等现象,不能解决全部问题。因此仍然缺乏能够解决法医检案中这一难题的方法。

核小体是真核生物染色质最基本的结构单位,由DNA和组蛋白构成。每个核小体DNA长约200bp,其中缠绕在组蛋白八聚体上的核心DNA(core DNA)约146bp,两个组蛋白八聚体间的DNA(linker DNA)约20~50bp。研究发现在细胞凋亡或程序性细胞死亡过程中,核小体DNA序列能够逃脱酶促反应的切割。另有研究对4000年前的因纽特人发干进行基因组测序,发现由于核小体对DNA的保护作用而形成的核小体图谱。提示核小体对核心DNA序列的有保护作用。这种保护作用能否应用于法医降解生物检材的检测已有法医工作者进行了探索,但存在一定争议。Freire-Aradas等使用生物信息学软件RECON筛选出核小体核心区18个SNPs并构建复合扩增体系,该体系对降解检材的分型成功率较SNP for ID高6%,并且明显高于miniSTR体系。Phuvadol Thanakiatkrai等使用生物信息软件NXSensor和nuScore对60个STR位点的核小体定位情况进行评分,结果显示这些STR基因座已经在一定程度上受到了保护核小体降解。建议在选择遗传标记时尽量选择可以受到保护的基因座。但该团队后续进行的实验验证结果显示不同评分STR位点间检出率并无差异。

基于以上情况,我们认为出现不同结果的原因可能是核小体动态性和核小体定位方法的差异。国外团队均是基于预测软件对核小体核心区域进行定位。这种整体上属于分类预测的方法并不是解决核小体定位问题的根本途径。目前微球菌核酸酶消化结合高通量测序(MNase-seq)是最常用的核小体定位方法,能够获得高分辨率图谱。但是由于该方法易受到实验条件和核小体本身动态性的影响,无法获得精确的核小体定位,影响遗传标记的获得。因此,研究一种可获得高精确度核小体定位的方法对于降解DNA的检验具有重要意义。

发明内容

本发明的目的就是提供一种获得稳定核小体遗传标记的方法及其在降解DNA检验中的应用,以解决现有技术中无法获得精确的核小体定位,影响遗传标记获得的问题。

本发明的目的是这样实现的:一种获得稳定核小体遗传标记的方法,包括以下步骤:

(a)对待检测样本进行预处理,获得包含DNA的样品;

(b)将样品分组,分别用高、中、低剂量水平的微球菌核酸酶对相应样品进行消化,消化条件为37℃孵育2-4小时;其中,高剂量水平为微球菌核酸酶∶裸DNA量=110-130U∶17μg,中剂量水平为微球菌核酸酶∶裸DNA量=25-40U∶17μg,低剂量水平为微球菌核酸酶∶裸DNA量=10-20U∶17μg;

(c)使用试剂盒提取消化后样品中的DNA,获得核小体核心区DNA;

(d)对获得的核小体核心区DNA进行测序,将测序数据导入bwa软件,并与人类参考基因组GRCh38进行比对;将相同微球菌核酸酶消化水平的两个样本数据使用生物信息学工具DANPOS进行比较,基于泊松分布以单核苷酸分辨率计算核小体差异信号,从而获得基因组相同位置上的每个核小体的位移、模糊度和占据水平的变化值;

(e)根据设定的筛选条件获得平移定位稳定的核小体信息;

(f)利用ANNOVAR软件对核小体序列的SNPs和InDels进行注释,LobSTR软件识别STRs。

步骤(a)中,所述样本为不同人的外周血,所述包含DNA的样品为将外周血裂解后获得的白细胞。

步骤(b)中,消化液中加入CaCl2溶液,所述CaCl2溶液的浓度为80-120mM,CaCl2溶液的加入量与裸DNA量的比为230-270μL∶17μg。

步骤(b)中,每个样本以裸DNA消化作为对照,其步骤为先将样本提取DNA,然后加入微球菌核酸酶进行消化,消化条件为37℃孵育2-4小时,微球菌核酸酶∶裸DNA量=0.45U∶1μg。

步骤(d)中,将裸DNA消化对照组获得的信息作为背景,利用DANPOS,对中、高剂量消化水平的数据分别进行校正。

步骤(d)中,使用bwa软件将测序获得的reads与人类参考基因组GRCh38进行比对,对raw reads进行精细过滤,得到clean reads,所有样品产生的BED文件均通过DANPOS算法运行并比较。

步骤(d)中,每个样本的测序方法和数据分析方法保持一致。

步骤(e)中,稳定核小体的筛选条件如下:

核小体中心位移treat2control_dis=0;

模糊度满足:fuzziness_diff_log10pval≥-10,并且|fuzziness_log2FC|≤1;

占据水平满足:control_smt_val>0,并且treat_smt_val>0。

上述方法获得的稳定核小体遗传标记在降解DNA检验中的应用。

一种降解DNA的检验方法,其包含上述方法所述的步骤。

本发明提供了一种获得稳定核小体遗传标记的方法,本发明的稳定核小体指在不同样本间定位一致的核小体,其对于法医鉴定来说可靠性更高。我们筛选稳定核小体上的遗传标记(STRs,SNPs,InDels)用于降解DNA分析,SNPs和InDels大概有300000个和40000个。本发明对位于稳定核小体区域和连接区域的SNPs进行抗降解性比较,验证了其抗降解能力。为高度降解检材的DNA分型提供了一种可靠的新方法。

本发明在检测和数据分析过程中尽量避免噪音的干扰,主要措施有(1)精确实验条件,例如MNase的消化水平、切割特点,(2)保证测序方法一致性,例如测序平台,单端还是双端测序,测序深度等,(3)数据分析方法一致性,例如检测核小体峰的算法。最终,我们通过筛选稳定核小体并且去除噪音,获得了高精确度核小体定位信息,进而得到其遗传标记信息。

附图说明

图1为样品在裸DNA校正前后的模糊分数分布。

图2为样品在裸DNA校正前与校正后GC含量与占据水平的相关性。A为校正前样品数据,B为校正后样品数据。

图3为SNP位点rs2983217的熔解曲线。

图4为样本在DNaseⅠ消化各时间点的DNA含量变化趋势。

图5为样本在DNaseⅠ消化各时间点的DNA含量。

图6为位点在DNaseⅠ消化各时间点的DNA含量。

具体实施方式

下面结合具体实施例对本发明的技术方案进行详细说明。本发明实施例中未提到的试验条件和操作均按本领域常规方法或制造商建议的条件进行。

实施例1

本实施例方法包括以下步骤:

(一)设置三个不同MNase消化程度,获得全面、精确的核小体定位图谱

从2个健康人外周血收集白细胞,使用微球菌核酸酶(micrococcal nuclease,MNase)对血液裂解后白细胞进行消化。在显微镜下对白细胞进行计数,5×106个细胞分为1管。每个样本制备3组白细胞样品。每个样本的每组白细胞中分别加入MNase(thermoscientific)15、30、120U,同时加入CaCl2溶液(浓度为100mM用量为250μl),均于37℃孵育3小时,最后加150微升500mM EDTA终止反应。使用E.Z.N.A.TM Blood DNA Midi Kit(OMEGA)提取纯化DNA。使用GX Touch24对MNase消化后DNA进行分析,获得各片段的浓度,计算消化程度。切取琼脂糖凝胶电泳的单核小体片段(150bp左右),使用Wizard SVGel and PCR clean-up System(promega)回收并纯化DNA。每个个体样本制备一份裸DNA对照样品,方法与前述的6组样品相同,不同的地方是首先从血液白细胞中提取出DNA,再加入0.45U MNase,琼脂糖凝胶电泳切胶回收150bp条带。对核小体DNA使用配对末端(2×150bp)方法在Novaseq 6000平台上测序。

共8组样品的测序数据使用bwa将测序获得的reads与人类参考基因组GRCh38进行比对,对raw reads进行精细过滤,得到clean reads。所有样品产生的BED文件均通过DANPOS算法运行,在该算法中,将重复reads去除以排除任何潜在的PCR扩增偏差,调整reads长度以提高信号与噪音的比例。DANPOS使用默认参数运行。获得每个样本全基因组上的每个核小体的位置,模糊度评分和占据评分。

(二)以裸DNA对照样品,对部分MNase消化的核小体定位数据进行校正,排除不完全消化带来的噪音。

由于MNase在部分消化时有序列偏好性,为了消除这种偏差同时去除背景噪音,提高核小体定位的精确度,我们将裸DNA信号作为背景,利用生物信息学工具DANPOS,对中、高两个消化程度MNase-seq数据分别进行校正。获得每个样本在校正后的全基因组上的每个核小体位置,模糊度评分和占据评分。对比同一样本校正前后的变化,结果显示,4组样品校正后核小体模糊度均降低,表明核小体定位的精确度提高(图1)。此外4组样品校正后GC含量与核小体占据水平相关性系数R减小(图2),表明GC偏好性降低。

(三)对MNase消化水平相同的核小体定位数据进行比较,排除消化水平带来的噪音,筛选稳定核小体。每个样本的测序方法和数据分析保持一致,尽可能去除噪音。在本实验中,稳定核小体的筛选条件是:1.核小体中心位移为0(treat2control_dis=0),2.模糊度无差异(fuzziness_diff_log10pval≥-10,并且|fuzziness_log2FC|≤1),3.占据水平均大于检测阈值(control_smt_val>0并且treat_smt_val>0)。本实施例获得了来源于2个不同样本,在三种MNase消化水平下的稳定核小体平均为925897、843359、862330个。分别占总核小体数量的10.13%,10.47%,14.01%。远远多于单一MNase条件下的数量。

(四)获取稳定核小体中的遗传标记,包括SNVs(单核苷酸变异位点),Indels(插入缺失多态性位点),STRs(短串联重复序列多态性位点)。测序的成对末端读码被映射到ensembl人类基因组版本38,使用bowtie2的局部比对选项。对齐的读取被过滤为mapping质量(MAPQ>20),并使用SAM-tools和BEDtools进一步处理。利用ANNOVAR软件对核小体序列的SNPs和InDels进行注,LobSTR软件识别STRs。

实施例2

稳定核小体DNA抗降解性验证

(一)我们选择前期测序所获稳定核小体SNPs中已在dbSNP_138数据库中存在记录的SNPs为具体研究对象,并根据最小等位基因频率等条件进一步筛选确定最终实验对象。具体筛选标准如下:

(1)最小等位基因频率(MAF)≥0.2;

(2)在基因组中分布广泛,彼此之间无连锁不平衡存在。

根据以上筛选标准最终确定稳定核小体核心DNA区域内SNPs,记录为核小体组SNPs。随机选择不存在于原始测序数据中的SNPs为非核小体核心DNA区域SNPs,记录为非核小体组SNPs。

(二)设计扩增引物使片段长度≤147bp。对核小体SNP与非核小体SNP就扩增效率,片段长度等进行一致化处理,并经过预实验和统计分析确定核小体SNP与非核小体SNP在扩增效率和片段长度等方面无差异。

我们根据如下原则对核小体组和非核小体组SNP位点PCR扩增引物进行了设计和评估。在Primer Premier 5中导入位点侧翼序列,按以下参数设计PCR引物:

1)引物长度:18-30个碱基;

2)产物长度:≤147bp,并保持核小体组SNPs和非核小体组SNPs扩增片段长度无差异。

3)Tm值:60±2℃,且同一位点上下游引物间差值≤5℃;

4)GC含量:40-60%。

其余遵循一般引物设计原则,如尽量避免引物之间及引物自身形成二聚体或发卡结构,四种碱基随机分布等。

设计好的引物应用Oligo 7软件对其一般属性进行评估和优化。登陆http://blast.ncbi.nlm.nih.gov/Blast.cgi,将设计的引物与基因组序列进行比对,保证引物的特异性。

所有引物均由上海生工生物工程股份有限公司合成,采用PAGE纯化。

(三)制备DNase I消化不同时间点(0、5、10、20、30分钟)降解检材。降解检材来自3个个体血液样本,使用终浓度为0.01U/μl l DNase I消化10μg DNA至0、5、10、20和30分钟时间点,于每个时间点进行取样。

(四)使用日本TakaraPremix Ex Taq TMⅡ试剂盒进行上述36个SNPs的实时荧光定量分析。按下列组成配制实时荧光定量PCR反应体系:

实时荧光定量PCR反应以ROX作为校正染料进行定量分析。按以下条件进行PCR反应:95℃30s预变性;95℃5s,60℃34s,共40个循环。每次实验均以2800男性DNA作为阳性对照进行扩增并进行熔炼曲线的分析。

稳定核小体DNA具有良好抗降解性的实验结果

经过筛选、设计引物和引物扩增特异性验证,我们最终确定了核小体组SNPs 20个,非核小体组SNPs 16个。两组SNPs的详细信息和引物信息见表1和表2。对设计的引物进行扩增效率验证,设计的引物得到了成功的扩增,熔解曲线均为单峰(图3),并且扩增效率达到了90%~110%。相关系数R2>0.90。为了消除扩增片段长度影响,我们使用两独立样本T检验分析了核小体组与非核小体组扩增子片段长度的差异。结果显示两组片段长度无差异。

P=0.650>0.05)

每次实验均用2800M DNA制作5个稀释梯度的标准曲线,对核小体组SNPs和非核小体组SNPs在3个DNA样本(A、B、C),5个不同的降解时间点(0、5、10、20和30min)的含量进行绝对定量。采用SPSS 21.0中的重复测量方差分析和多元方差分析对两组核小体在0-30min不同时间点时的基因座含量进行比较,以P<0.05为有统计学差异。结果显示伴随着DNaseⅠ消化时间的增加,在3例降解DNA中各位点的含量均呈现明显的下降趋势(图4)。我们使用重复测量方差分析和多元方差分析对各时间点核小体组SNPs和非核小体组SNPs位点含量进行了分析。球形检验显示P<0.05(PA=0.000<0.05,PB=0.000<0.05,PC=0.000<0.05,说明5次重复测量的数据间存在高度的相关性,宜用多元方差分析进行检验。我们比较了两组位点在每一个时间点时(0min、5min、10min、20min、30min)的差异(表3,图5,图6)。结果显示在初始DNA状态下(0min),3个样本的核小体组SNPs与非核小体组SNPs均不存在差异,在5min、10min、20min、30min时,3个样本的核小体组SNPs与非核小体组SNPs均存在差异。这一结果表明在DNA被降解至某些程度(10μg完整DNA被0.01U/μlDNase I消化5,10,20,30min)时,由于得到核小体组蛋白八聚体的保护位于核小体核心区域的遗传标记较非核心区域遗传标记更易在降解DNA中得到扩增。核小体的保护作用确实存在。

表1. 20个稳定核小体SNPs信息

表2. 16个非核小体SNPs信息

表3. 3例人工降解检材实时荧光定量分析结果

图5中,星号表示经过多元方差分析在该时间点稳定核小体组DNA含量较非核小体组有明显差异(P<0.05)。代表样本B在DNaseⅠ消化的5、10、20和30min时稳定核小体较非核小体具有明显差异,各时间点两组差异的P值分别为0.001,0.001,0.006,0.007。

图6中,星号表示经过多元方差分析在该时间点稳定核小体组DNA含量较非核小体组有明显差异(P<0.05)。代表位点rs2983217在DNaseⅠ消化的5、10、20和30min时稳定核小体较非核小体具有明显差异,各时间点两组差异的P值分别为0.000,0.001,0.000,0.03。

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:多重引导RNA

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!