基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途

文档序号:16771 发布日期:2021-09-21 浏览:25次 >En<

阅读说明:本技术 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途 (Method, composition and use for detecting microsatellite instability of non-control sample based on next generation sequencing technology ) 是由 郎继东 田埂 于 2018-09-10 设计创作,主要内容包括:本发明公开基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途。本发明的方法包括利用扩增引物组合物对组织样本进行建库并测序;从测序数据中提取出样本数据,并进一步提取所需的测序序列;计算该测序序列的长度,并统计各长度所分配的测序序列数,选取分配测序序列最多的长度作为生物标志物的计算值;根据扩增引物组合物在人血液数据库中计算出各生物标志物中扩增引物所对应的序列长度的平均值及标准差;计算Z值,并基于Z值绝对值大小判断生物标志物的稳定性,进而基于该生物标志物的稳定性判断组织样本的稳定性。本发明的方法不需要对照样本,降低了成本及分析的复杂度。(The invention discloses a method, a composition and application for detecting microsatellite instability of a sample without a control sample based on a next-generation sequencing technology. The method of the invention comprises the steps of utilizing the amplification primer composition to perform library construction and sequencing on a tissue sample; extracting sample data from the sequencing data, and further extracting a required sequencing sequence; calculating the length of the sequencing sequence, counting the number of sequencing sequences distributed by each length, and selecting the length with the most distributed sequencing sequences as a calculation value of the biomarker; calculating the average value and the standard deviation of the sequence lengths corresponding to the amplification primers in each biomarker in a human blood database according to the amplification primer composition; and calculating the Z value, judging the stability of the biomarker based on the absolute value of the Z value, and further judging the stability of the tissue sample based on the stability of the biomarker. The method of the invention does not need a reference sample, thereby reducing the cost and the complexity of analysis.)

基于二代测序技术检测无对照样本的微卫星不稳定的方法、 组合物和用途

本申请是中国专利申请201811050997.6的分案申请,原申请的申请日为2018年09月10日,发明名称为基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途。

技术领域

本发明属于基因检测领域,具体涉及基于二代测序技术检测无对照样本的微卫星不稳定的方法。

背景技术

在原核和真核基因组中,广泛分布着许多短而串联重复的DNA序列(1-6碱基),即微卫星序列(MicroSatellite,MS)。而在DNA复制过程中,这些序列常发生小范围的碱基缺失、插入或者替换,呈现不稳定性。即为微卫星不稳定性(MicroSatellite Instability,MSI)。MSI现象于1993年被Jacobs等人在结直肠癌中首次发现,与癌症发生有关,可用于癌症检测(William R.Jacobs,et al,Science,1993,260:816-818)。2016年Ronald J Hause等人利用基因组全外显子测序技术,分析了18中癌症5930个基因组,发现其中14种癌症患者癌细胞中发生MSI,其中子宫内膜癌MSI频率最高为30%,胃癌与结肠癌为19%(Classification and characterization of microsatellite instabilityacross18cancer types.Hause RJ,Pritchard CC,Shendure J,Salipante SJ.NatMed.2016Nov;22(11):1342-1350.doi:10.1038/nm.4191)。根据结直肠癌中MSI被检测出的频率可以将其分为三类,Microsatellite stability(MSS),Microsatelliteinstability-low(MSI-L)及Microsatellite instability-high(MSI-H)(Frequentinactivation of PTEN by promoter hypermethylation in microsatelliteinstability-highsporadic colorectal cancers.Goel A,Arnold CN,Niedzwiecki D,Carethers JM,Dowell JM,Wasserman L,Compton C,Mayer RJ,Bertagnolli MM,BolandCR.Cancer Res.2004May 1;64(9):3014-21)。NCCN结直肠癌指南中提到MSI检测应在所有结直肠癌史的病人中进行,可以作为结直肠癌预后的良好的标志物;并且MSI-H的结直肠癌II期病人有较好的预后(https://www.nccn.org/professionals/physician_gls/pdf/colon.pdf)。FDA在2017年7月批准了免疫化疗药物nivolumab用于转移性结直肠癌的患者(https://www.cancer.gov/news-events/cancer-currents-blog/2017/nivolumab-fda-colorectal),而2018年7月又批准了ipilimumab与nivolumab联合用于治疗12岁以上的MSI-H/mismatch repair deficient(dMMR)的转移性及直肠癌患者(https://www.fda.gov/drugs/informationondrugs/approveddrugs/ucm613227.htm)。可见在结直肠癌中检测MSI及其在临床应用中的重要性。

基于NGS检测MSI的方法现在有很多,主要方法可以归为通过比较组织及对照的微卫星序列的长度大小分布差异(Applicability of next generation sequencingtechnology in microsatellite instability testing.Genes(Basel).2015Feb 12;6(1):46-59.doi:10.3390/genes6010046)或多态性差异两种(MSIsensor:microsatelliteinstability detection using paired tumor-normal sequencedata.Bioinformatics.2014Apr 1;30(7):1015-6.doi:10.1093/bioinformatics/btt755),虽然效果很明显,但都是基于组织与对照来进行检测,对于无组织对照样本的检测目前为止并没有非常好的方法及结果。

发明内容

为解决现有技术中的至少部分技术问题,本发明提供基于二代测序技术检测无对照样本的微卫星不稳定(MSI)的方法。本发明的方法弥补了现有技术空缺,从而降低实验、测序及分析成本。具体地,本发明包括以下内容。

本发明的第一方面,提供一种基于二代测序技术检测无对照样本的微卫星不稳定的方法,其包括以下步骤:

(1)利用扩增引物组合物对组织样本进行建库得到样本文库,对所述样本文库进行测序得到测序数据,其中该步骤中不包括对照样本;

(2)利用所述样本的特异标签序列从所述测序数据中提取出样本数据,并根据所述扩增引物组合物从所述样本数据中提取出各所述MSI的生物标志物对应的测序序列;

(3)计算各生物标志物的测序序列的长度,并统计各长度所分配的测序序列数,选取各生物标志物中分配测序序列最多的长度作为所述生物标志物的计算值;

(4)根据所述扩增引物组合物在人血液数据库中计算出所述各生物标志物中扩增引物所对应的测序序列最多的序列长度的平均值及标准差;

(5)利用式(I)计算Z值,如果|Z值|>=3,则认为所述生物标志物不稳定,如果|Z值|<3,则认为该生物标志物稳定,如果有2个以上的生物标志物不稳定,则认为所述组织样本是高频不稳定型,即MSI-H型,如果有1个以下的生物标志物不稳定,则认为所述组织样本是稳定型,即MSS型,其中式(I):Z值=(计算值-平均值)/标准差。

根据本发明所述的基于二代测序技术检测无对照样本的微卫星不稳定的方法,优选地,所述扩增引物组合物中的各引物特异性结合至MSI的生物标志物的至少部分序列,其中所述生物标志物来自选自由KIT、MSH2、BIRC3、SLC7A8、ZNF2、MAP4K3、REEP5、DEFB105A、DEFB105B、ACVR2A、RNF43、DOCK3、GTF2IP1、LOC100093631、ARHGEF12、NOMO1、PIP5K1A、KIF14(dist.=4,175bp)和DDX59(dist.=19,111bp)组成的组中的至少一种基因。

根据本发明所述的基于二代测序技术检测无对照样本的微卫星不稳定的方法,优选地,所述扩增引物组合物包括第一扩增引物对、第二扩增引物对、第三扩增引物对、第四扩增引物对和第五扩增引物对,其中所述各扩增引物对分别特异性结合至MSI的5种不同的生物标志物的至少部分序列。

根据本发明所述的基于二代测序技术检测无对照样本的微卫星不稳定的方法,优选地,所述扩增引物组合物包括SEQ ID NO:1-10所示的序列。

根据本发明所述的基于二代测序技术检测无对照样本的微卫星不稳定的方法,优选地,步骤(1)通过包括第一轮扩增和第二轮扩增的过程来建库,其中第一轮扩增以50ng/μl以下的来自所述组织样本的DNA为模板,采用98℃30s、98℃10s、58℃15s、72℃20s、72℃2min,4℃∞,共20个循环的扩增程序,第二轮扩增以第一轮扩增产物为模板,采用98℃30s、98℃10s、58℃15s、72℃20s、72℃2min,4℃∞,共20个循环的扩增程序。

根据本发明所述的基于二代测序技术检测无对照样本的微卫星不稳定的方法,优选地,步骤(1)中所述的测序为二代测序。

根据本发明所述的基于二代测序技术检测无对照样本的微卫星不稳定的方法,优选地,所述组织样本为潜在癌症组织,并不包括血液或其成分。

根据本发明所述的基于二代测序技术检测无对照样本的微卫星不稳定的方法,优选地,在步骤(1)建库后向所得样本文库中添加特异标签序列的步骤。

本发明的第二方面,提供一种用于基于二代测序技术检测无对照样本的微卫星不稳定的组合物,其包括用于对组织样本进行建库得到样本文库的扩增引物组合物、样本的特异标签序列、用于引物延伸和扩增反应的试剂。

本发明的第三方面,提供本发明第二方面所述的组合物在制备用于基于二代测序技术检测无对照样本的微卫星不稳定的检测剂中的用途。

本发明的方法不仅不需要常规检测微卫星不稳定(MSI)必须需要的血液对照样本,而且节省了对照样本的实验、测序及分析的步骤,从而降低了成本及分析的复杂度。

附图说明

图1为3730阅微试剂盒对sample1组织的检测结果。

图2为3730阅微试剂盒对sample1血液的检测结果。由图1和图2比较可以,BAT25不稳定,BAT26不稳定,MONO27稳定,NR21不稳定,NR24稳定。

具体实施方式

现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。

应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。

除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。除非另有说明,否则“%”为基于重量的百分数。

本发明所述的“微卫星不稳定”有时也称作“MSI”,是指以DNA微卫星重复序列长度改变为特征的基因突变,是基因组不稳定的一种类型,可导致多种肿瘤,例如结直肠癌。

本发明所述的“无对照样本”是指在检测微卫星不稳定的过程中无需设置对照物、参考物或标准物,包括来自同一个体的对照物、参考物或标准物,也包括来自不同个体的对照物、参考物或标准物。这与现有技术中的方法明显不同。现有方法中通常以血液中的白细胞中提取的DNA作为对照物。本发明的方法避免通过手术或者活检取材获得正常组织作为对照,减少了患者痛苦。

[基于二代测序技术检测无对照样本的微卫星不稳定的方法]

本发明的第一方面,提供一种基于二代测序技术检测无对照样本的微卫星不稳定的方法,有时也称作“本发明的方法”,其至少包括以下步骤(1)-(5)。

步骤(1)

本发明的步骤(1)包括建库步骤和测序步骤。具体地,步骤(1)包括利用扩增引物组合物对组织样本进行建库得到样本文库,还包括对样本文库进行测序得到测序数据。需要说明的是,该步骤中不需要对照样本。

本发明的建库包括第一轮扩增和第二轮扩增的过程。本发明发现通过分别进行的两轮扩增非常有利于得到适合后绪测序的样本文库,提高检测准确性。优选地,本发明的第一轮扩增包括以来自组织样本的DNA为模板,采用98℃30s、98℃10s、58℃15s、72℃20s、72℃2min,4℃∞,共20个循环的程序进行扩增。第一轮扩增中模板的浓度为50ng/μl以下,优选40ng/μl以下,更优选20ng/μl以下。如果浓度过高,则不利于两轮扩增的进行。本发明的第二轮扩增包括以第一轮扩增产物为模板,采用98℃30s、98℃10s、58℃15s、72℃20s、72℃2min,4℃∞,共20个循环的程序扩增的步骤。其中第二轮扩增的模板(即,第一轮扩增产物)的量可为全部第一轮扩增产物,也可使用其中的部分。

本发明的建库步骤完成后,优选包括向所得样本文库添加特异标签序列的步骤。特异标签序列可使用本领域已知的任何序列。优选使用测序时采用的barcode(index)6或8bp的碱基序列。特异标签序列的添加用来区分不同样本文库。

本发明的测序通过二代测序技术进行。可以利用二代测序技术进行双端测序或单端测序。二代测序可使用本领域已知的仪器或平台,例如Illumina MiniSeq、NextSeq等进行。通过二代测序得到的测序数据的长度一般为50-500bp,优选为80-450bp,更优选为100-400bp,还优选150-300bp。

本发明的步骤(1)的组织样本为来自个体的任何组织。其可来自机体的任何部位。优选为潜在癌症组织,还优选地,本发明的组织样本不包括血液或来自血液的成分,例如血浆或其血液中的细胞。

本发明的步骤(1)的扩增引物组合物包括用于得到样本文库的多种不同引物的组合,其不同于测序时的测序引物。本发明的扩增引物组合物包括用于扩增特定生物标志物或其部分序列的多对引物对。即,本发明的扩增引物组合物的各引物特异性结合至MSI的生物标志物的至少部分序列。优选地,生物标志物来自选自由KIT、MSH2、BIRC3、SLC7A8、ZNF2、MAP4K3、REEP5、DEFB105A、DEFB105B、ACVR2A、RNF43、DOCK3、GTF2IP1、LOC100093631、ARHGEF12、NOMO1、PIP5K1A、KIF14(dist.=4,175bp)和DDX59(dist.=19,111bp)组成的组中的至少一种基因。更优选地,生物标志物选自由KIT基因的BAT25突变、MSH2基因的BAT26突变、BIRC3基因的NR27突变、SLC7A8基因的NR21突变、ZNF2基因的NR24突变、MAP4K3基因的MONO-27突变、REEP5基因的D5S346突变、DEFB105A或DEFB105B基因的(A)9突变、ACVR2A基因的(A)8突变、RNF43基因的(C)7突变、DOCK3基因的(C)7突变、GTF2IP1或LOC100093631基因的(T)13突变、ARHGEF12基因的(T)8(C)5突变、NOMO1基因的(A)9突变、PIP5K1A基因的(T)9(C)6突变、KIF14(dist.=4,175bp)基因的(T)8突变和DDX59(dist.=19,111bp)基因的(T)8突变组成的组中的至少一种。

在某些实施方案中,本发明的扩增引物组合物包括第一扩增引物对、第二扩增引物对、第三扩增引物对、第四扩增引物对和第五扩增引物对,其中所述各扩增引物对分别特异性结合至BAT25、BAT26、MONO27、NR21和NR24这5种不同的生物标志物的至少部分序列。更优选地,本发明的扩增引物组合物包括下述SEQ ID NO:1-10所示序列的引物。

BAT25引物:

引物1:TCTGCATTTTAACTATGGCTC(SEQ ID NO:1)

引物2:CTCGCCTCCAAGAATGTAAGT(SEQ ID NO:2)

BAT26引物:

引物1:CTGCGGTAATCAAGTTTTTAG(SEQ ID NO:3)

引物2:AACCATTCAACATTTTTAACCC(SEQ ID NO:4)

MONO27引物:

引物1:GAAATGGTGGGAACCCAG(SEQ ID NO:5)

引物2:GGTGGATCAAATTTCACTTGG(SEQ ID NO:6)

NR21引物:

引物1:GAGTCGCTGGCACAGTTCTA(SEQ ID NO:7)

引物2:CTGGTCACTCGCGTTTACAA(SEQ ID NO:8)

NR24引物:

引物1:ATTGTGCCATTGCATTCCAA(SEQ ID NO:9)

引物2:GTGTCTTGCTGAATTTTACCTCCTGAC(SEQ ID NO:10)

上述SEQ ID NO:1-10示出了不同引物的序列,同时本发明还以计算机可读形式提供了上述SEQ ID NO:1-10的序列。在本文所示序列与计算机可读形式所示序列不同的情况下,以本文所示序列内容为准。

步骤(2)

本发明的步骤(2)为从测序数据中提取所需测序序列的步骤。具体地,包括利用样本的特异标签序列从测序数据中提取出样本数据,并根据扩增引物组合物从样本数据中提取出各MSI的生物标志物对应的测序序列。

如上所述,特异标签序列是用于对样本数据进行标记的序列。通过特异标签序列可以将一般的测序数据与样本数据进行区分。在利用特异标签序列提取出样本数据后,再根据扩增引物组合物中的各扩增引物进一步提取出各生物标志物对应的测序序列。即,由扩增引物对扩增得到的作为各生物标志物的至少一部分序列的测序序列,其通常在100-300bp之间,优选150-250bp之间。

例如,在扩增引物包括第一扩增引物对、第二扩增引物对、第三扩增引物对、第四扩增引物对和第五扩增引物对,且第一扩增引物对特异性结合至BAT25的至少部分序列的情况下,通过第一扩增引物对可以提取出由第一扩增引物对扩增得到的测序序列。类似地,通过第二扩增引物对可以提取出由第二扩增引物扩增得到的测序序列。

步骤(3)

本发明的步骤(3)计算各生物标志物的计算值的步骤。具体地,包括计算对应于各生物标志物的测序序列的长度,并统计各长度所分配的测序序列数,选取各生物标志物中分配测序序列最多的长度作为所述生物标志物的计算值。

步骤(4)

本发明的步骤(4)包括根据扩增引物组合物在人血液数据库中计算出各生物标志物中扩增引物所对应的序列长度的平均值及标准差。其中人血液数据库为已知数据组成的库。其可以使用目前已知数据的组合,也可以通过收集目前已公开数据并组合成的新数据库。另外,各公司或单位也可根据需要而自行收集组成人血液数据库。

步骤(5)

本发明的步骤(5)为计算Z值,并基于Z值的绝对值来评价生物标志物是否稳定的步骤。具体地,包括利用式(I):Z值=(计算值-平均值)/标准差计算Z值。如果|Z值|>=3,则认为所述生物标志物不稳定,如果|Z值|<3,则认为该生物标志物稳定。

本发明的步骤(5)进一步包括根据生物标志物不稳定来评价组织样本是否稳定的步骤。具体地,根据上述步骤评价来自同一组织样本的至少5个生物标志物的稳定性。如果有2个以上的生物标志物不稳定,则认为该组织样本是高频不稳定型,即MSI-H型。如果有1个以下的生物标志物不稳定,则认为该组织样本是稳定型,即MSS型。

[用于基于二代测序技术检测无对照样本的微卫星不稳定的组合物]

本发明的第二方面,提供用于基于二代测序技术检测无对照样本的微卫星不稳定的组合物,本发明有时简作“本发明的组合物”。本发明的组合物至少包括用于对组织样本进行建库得到样本文库的扩增引物组合物、样本的特异标签序列和用于引物延伸和扩增反应的试剂。

本发明的扩增引物组合物和样本的特异标签序列已在本发明的第一方面进行了说明,对于重复部分在此不再赘述。以下内容为在第一方面公开内容的基础上进行的补充说明。

本发明的扩增引物组合的存在形式不特别限定,可以干粉或溶液形式存。本发明引物组合物可以是全部引物组成的混合物形式,也可以是各引物分别单独存在的形式,还可以是两种以上的部分引物组成混合物,以多种不同混合物的形式存在。

本发明的用于引物延伸和扩增反应的试剂可采用本领域已知的试剂或组分。例如,在一些实施方案中,用于引物延伸和扩增反应的试剂可包括一种或多种下列组分:DNA聚合酶(诸如热稳定性DNA聚合酶等)、聚合酶链式反应缓冲液、逆转录缓冲液和脱氧核苷三磷酸(dNTP)。可选地,包括用于进行杂交分析的试剂。还可包括核苷酸类似物和/或标记部分,如直接可检测部分如荧光团(荧光染料)或放射性同位素,或者间接可检测部分,如结合对的成员例如生物素,或能够催化非可溶性比色或发光反应(luminometric reaction)的酶。另外,本发明的组合物可进一步包括用于核酸电泳检测用试剂的至少一种容器。此类试剂包括直接检测核酸的那些,如荧光嵌合剂或银染试剂,或用于检测标记的核酸的那些试剂。

[用途]

本发明的第三方面,提供本发明第二方面所述的组合物在制备用于基于二代测序技术检测无对照样本的微卫星不稳定的检测剂中的用途,本发明有时简称“本发明的用途”。

本发明的检测剂可以以试剂盒的形式提供。在以试剂盒形式提供的情况下,本发明的的试剂盒还可包括以政府机构规定的形式与调控制造、使用或销售诊断试剂盒相关的注意事项。试剂盒还可提供有使用、储存和故障排除的详细说明书。试剂盒还可任选地设置在适合的优选用于以高通量设置的机器人操作的装置中。

本发明的试剂盒的组分可提供为干粉。当试剂和/或组分提供为干粉时,粉末可通过添加适合的溶剂来恢复原状。预期该溶剂还可设置于另一容器中。容器通常会包括至少一种小瓶、试管、烧瓶、瓶、注射器和/或其它容器手段,其中可选等分地放置溶剂。试剂盒还可包括用于包含无菌、药学上可接受的缓冲液和/或其它溶剂的第二容器手段。

在试剂盒中存在超过一种组分的情况下,该试剂盒还通常会包含可单独放置另外的组分的第二、第三或其它另外的容器。另外,可在容器中包含各多种组分的组合。

本发明的试剂盒还可包括保持或维持DNA的组分,例如抗核酸降解的试剂。此类组分可为例如或无RNase或具有抗RNase的保护的核酸酶。本文所述的任何组合物或试剂可为试剂盒中的组分。

实施例1

选取10例已知通过3730阅微试剂盒(专利号:ZL 2011 1 0152226.X)验证MSI结果的单组织样本。共3例MSI-H高频不稳定型,7例MSS稳定型。

通过本发明的分析方法来检测MSI。具体步骤如下:

本实施例以sample1举例(3730阅微试剂盒验证结果如图1和图2所示)进行说明。

1.选择5个检测微卫星不稳定(MSI)的生物标志物,分别为BAT25、BAT26、MONO27、NR21及NR24,并对各个标志物设计扩增引物,如下:

BAT25引物:

引物1:TCTGCATTTTAACTATGGCTC

引物2:CTCGCCTCCAAGAATGTAAGT

BAT26引物:

引物1:CTGCGGTAATCAAGTTTTTAG

引物2:AACCATTCAACATTTTTAACCC

MONO27引物:

引物1:GAAATGGTGGGAACCCAG

引物2:GGTGGATCAAATTTCACTTGG

NR21引物:

引物1:GAGTCGCTGGCACAGTTCTA

引物2:CTGGTCACTCGCGTTTACAA

NR24引物:

引物1:ATTGTGCCATTGCATTCCAA

引物2:GTGTCTTGCTGAATTTTACCTCCTGAC

2.根据步骤1所设计引物,对单组织样本sample1进行常规的扩增子建库;将所提gDNA按照试剂盒要求稀释到相应nano drop浓度,sample1样本DNA为20ng/ul并且按照以下条件配制20ul体系:phoenix buffer 5ul,Taq0.1ul,dNTP 2ul,sample1样本DNA 40ng,正反向引物根据位点不同加入不同的量,MONO27及BAT26的终浓度为900nM,NR24的终浓度为600nM,其余位点为250nM;使用life扩增仪进行PCR扩增,扩增程序为:98℃30s,98℃10s,58℃15s,72℃20s,72℃2min,4℃∞,共20个循环;1.6倍磁珠纯化产物,20ul水洗脱后,取19ul作为下一轮模板,配制第二轮30ul扩增体系如下:phoenix buffer 6ul,Taq 0.15ul,dNTP3ul,模板19ul,正反向引物各1ul;使用life扩增仪进行PCR扩增,扩增程序为:98℃30s,98℃10s,58℃15s,72℃20s,72℃2min,4℃∞,共20个循环;1.6倍磁珠纯化产物后20ul水洗脱,进行Qubit及2100质检。

3.将每个生物标志物的文库进行pooling,对sample1样本的5个生物标志物的pooling文库加1个特异的标签序列,运用Illumina Miseq测序仪进行双端读长300bp测序。

4.根据特异的标签序列将sample1样本的数据从测序得到的总数据中拆分出来。

5.根据步骤1中的5个生物标志物的引物序列在sample1的测序数据中将5个生物标志物的测序数据提取出来。

6.分别计算5个生物标志物测序序列的长度,并统计每个长度所分配的测序序列数。

7.分别选取5个生物标志物中分配测序序列数最多的长度代表该生物标志物的“计算值”,从而得到BAT25的“计算值”为122;BAT26的“计算值”为177;MONO27的“计算值”为169;NR21的“计算值”为107;NR24的“计算值”为133。

8.根据步骤1所设计的5个生物标志物的正反向扩增引物在人血液样本数据库(自主积累)中计算出5个生物标志物的分配测序序列数最多的长度的平均值及标准差,分别为BAT25的平均值为123.9038462,标准差为0.533564241;BAT26的平均值为179.0666667,标准差为0.393122697;MONO27的平均值为171.5357143,标准差为2.088620995;NR21的平均值为110.9642857,标准差为0.631427984;NR24的平均值为133.8653846,标准差为0.595039829。

9.利用步骤7中所得到的5个生物标志物的“计算值”与步骤8中所得到的相应生物标志物的血液的平均值和标准差计算Z-score值(Z值),分别得到BAT25的Z-score值为-3.568166693,BAT26的Z-score值为-5.25705,MONO27的Z-score值为-1.21406,NR21的Z-score值为-6.278286386,NR24的Z-score值为-1.454330573。

10.生物标志物稳定性判断标准:如果|Z-score|>=3,则认为该生物标志物不稳定,如果|Z-score|<3,则认为该生物标志物稳定。基于该标准,判定BAT25、BAT26、NR21为不稳定型,MONO27、NR24为稳定型。该结果与3730阅微试剂盒验证结果一致。

11.组织稳定性判断标准:如果有2个以上的生物标志物不稳定,则认为该组织样本是高频不稳定(MSI-H)型,如果有0个或者1个生物标志物不稳定,则认为该组织样本是稳定(MSS)型。基于该标准,则sample1样本有4个标志物为不稳定型,由此可判定sample1样本为高频不稳定(MSI)型。这与3730阅微试剂盒验证结果一致。

实施例2-10

除了将组织样本分别变为sample2-10以外,以与实施例1相同的方式进行验证。实施例2-10的验证结果如表1所示。

表1本发明所述方法的验证结果表

注:“+”代表不稳定,“-”代表稳定,表中灰色部分表示不稳定的标志物。

在不背离本发明的范围或精神的情况下,可对本发明说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。

序列表

<110> 元码基因科技(北京)股份有限公司

<120> 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途

<130> BH2110329

<141> 2021-06-28

<160> 10

<170> SIPOSequenceListing 1.0

<210> 1

<211> 21

<212> DNA

<213> 人工序列()

<400> 1

tctgcatttt aactatggct c 21

<210> 2

<211> 21

<212> DNA

<213> 人工序列()

<400> 2

ctcgcctcca agaatgtaag t 21

<210> 3

<211> 21

<212> DNA

<213> 人工序列()

<400> 3

ctgcggtaat caagttttta g 21

<210> 4

<211> 22

<212> DNA

<213> 人工序列()

<400> 4

aaccattcaa catttttaac cc 22

<210> 5

<211> 18

<212> DNA

<213> 人工序列()

<400> 5

gaaatggtgg gaacccag 18

<210> 6

<211> 21

<212> DNA

<213> 人工序列()

<400> 6

ggtggatcaa atttcacttg g 21

<210> 7

<211> 20

<212> DNA

<213> 人工序列()

<400> 7

gagtcgctgg cacagttcta 20

<210> 8

<211> 20

<212> DNA

<213> 人工序列()

<400> 8

ctggtcactc gcgtttacaa 20

<210> 9

<211> 20

<212> DNA

<213> 人工序列()

<400> 9

attgtgccat tgcattccaa 20

<210> 10

<211> 27

<212> DNA

<213> 人工序列()

<400> 10

gtgtcttgct gaattttacc tcctgac 27

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种染色体结构变异断点的定位方法及装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!