利用天然丰度稳定同位素和dna基因分型鉴定生物制品

文档序号:39310 发布日期:2021-09-24 浏览:64次 >En<

阅读说明:本技术 利用天然丰度稳定同位素和dna基因分型鉴定生物制品 (Identification of biological products using natural abundance stable isotopes and DNA genotyping ) 是由 约翰·P·贾斯帕 于 2019-11-15 设计创作,主要内容包括:大量材料的天然丰度稳定同位素分析和生物材料的DNA基因分型的组合应用,是在供应链中识别此类产品的高度特异性(约1:1×10~(17))的指纹识别方法。(The combination of natural abundance stable isotope analysis of bulk material and DNA genotyping of biological material shouldIt is used to identify the high specificity of such products in the supply chain (about 1: 1X 10) 17 ) The fingerprint identification method of (1).)

利用天然丰度稳定同位素和DNA基因分型鉴定生物制品

技术领域

一种稳定同位素和DNA基因分型相组合的方法,包括在生物样品中发现的同位素的浓度比和来自DNA或RNA的共存遗传信息的数学阵列,所述数学阵列以计算机可读形式呈现,并且与分析结果相当,由此可以将样品与其他类似样品区分开来,所述计算机可读形式还通过存储的样品信息来索引。所述存储的样品信息可以在需要时显示。通过本发明的组合稳定同位素和DNA鉴定,样品可以通过供应链安全地追踪,以用于样品的制造、销售和使用。

背景技术

在生态学和遗传学中,反应规范(reaction norm),也被称为反应的规范(normofreaction),描述了同一基因型在一系列环境中的表型表达模式。反应规范的一种用途是描述不同物种(尤其是相关物种)如何对不同的环境做出反应。但是,同一物种内不同的基因型也会相对于特定的表型性状和环境变量表现出不同的反应规范。对于每种基因型、表型性状和环境变量,可能存在不同的反应标准;换句话说,决定性状的遗传因素和环境因素之间的相互关系可能存在相当复杂性。

基因-环境的交互作用(或基因型-环境交互作用或G×E)是指两种不同的基因型以不同的方式对环境变化作出反应。反应规范是当表型差异持续存在时,显示基因和环境因素之间关系的图表。它们可以帮助说明G×E的相互作用。当反应规范不平行时,存在与环境相互作用的基因。这表明每个基因型以不同的方式对环境变化做出反应。环境变化可以是物理、化学、生物、行为模式或生活事件。

因此,需要提供评估基因-环境相互作用的方法,但目前的方法无法达到所需的特异性程度。本发明克服了当前方法的缺点。

发明内容

本发明涉及客观表征包含基因组、蛋白质组、分解代谢组或代谢成分的生物样品的方法,包括:

(a)从存在于所述样品中的元素获得同位素数据;提供包括所述同位素数据的数学阵列,所述数学阵列以可读形式固定,其上固定有所述数学阵列的所述可读形式为所述样品的标识,

(b)获取样品的基因组、蛋白质组、分解代谢组或代谢组学数据,

(c)根据在步骤(a)中获得的同位素数据和在步骤(b)中获得的基因组、蛋白质组、分解代谢组或代谢组学数据构建集成识别数据阵列,

(d)提供生物样品的客观表征。

在其他实施方案中,本发明涉及一种方法,其中同位素数据不包括从标记剂获得的数据。

在其他实施方案中,本发明涉及一种方法,其中所述元素选自具有两个或多个同位素的元素。

在其他实施方案中,本发明涉及一种方法,其中元素选自氢、碳、氮、氧、硫、氯和溴及其组合。

在其他实施方案中,本发明涉及一种方法,其中同位素是稳定同位素。

在其他实施方案中,本发明涉及一种方法,其中稳定同位素选自1H、2H、12C、13C、14N、15N、16O、18O、32S、34S、35Cl、37Cl、79Br和81Br及其组合。

在其他实施方案中,本发明涉及一种方法,其中同位素选自下列成对同位素:1H和2H、12C和13C、14N和15N、16O和18O、32S和34S、35Cl和37Cl、79Br和81Br。

在其他实施方案中,本发明涉及一种方法,其中同位素选自以下同位素比:2H/1H、13C/12C、15N/14N、18O/16O、34S/32S、37Cl/35Cl和81Br/79Br。

在其他实施方案中,本发明涉及一种方法,其中同位素数据和基因组、蛋白质组、分解代谢组或代谢组学数据是产品的固有数据。

在其他实施方案中,本发明涉及一种方法,其中集成数据(c)以计算机或机器可读形式固定。

在其他实施方案中,本发明涉及一种方法,其中生物产品包含遗传组分,并且通过基因分型获得基因组数据。

在其他实施方案中,本发明涉及一种方法,其中遗传组分选自DNA、RNA、核苷酸片段和核酸。

在其他实施方案中,本发明涉及一种方法,其中根据参考标准给出同位素数据。

在其他实施方案中,本发明涉及一种用于客观表征包含遗传组、蛋白质组、分解代谢组或代谢成分的生物样品的数据阵列,包括:

(a)来自存在于所述样品中的元素的同位素数据;提供包括所述同位素数据的数学阵列,所述数学阵列以可读形式固定,其上固定有所述数学阵列的所述可读形式为所述样品的标识,以及

(b)样品的基因组、蛋白质组、分解代谢组或代谢组学数据,

其中(a)的同位素数据和(b)的基因组、蛋白质组、分解代谢组或代谢组学数据被整合到用于客观表征生物样品的识别数据阵列中。

在其他实施方案中,本发明涉及数据阵列,其中元素选自具有两个或多个同位素的元素。

在其他实施方案中,本发明涉及数据阵列,其中元素选自氢、碳、氮、氧、硫、氯和溴及其组合。

在其他实施方案中,本发明涉及数据阵列,其中同位素是稳定同位素。

在其它实施方案中,本发明涉及数据阵列,其中稳定同位素选自1H、2H、12C、13C、14N、15N、16O、18O、32S、34S、35Cl、37Cl、79Br和81Br及其组合。

在其他实施例中,本发明涉及数据阵列,其中同位素选自下列成对同位素:1H和2H、12C和13C、14N和15N、16O和18O、32S和34S、35Cl和37Cl、79Br和81Br。

在其它实施方案中,本发明涉及数据阵列,其中同位素选自以下同位素比:2H/1H、13C/12C、15N/14N、18O/16O、34S/32S、37Cl/35Cl和81Br/79Br。

在其他实施方案中,本发明涉及数据阵列,其中同位素数据和基因组、蛋白质组、分解代谢组或代谢组学数据是产品的固有数据。

在其他实施方案中,本发明涉及数据阵列,其中集成数据以计算机或机器可读的形式固定。

在其他实施方案中,本发明涉及数据阵列,其中生物产品包含遗传组分,并且基因组数据通过基因分型获得。

在其他实施方案中,本发明涉及数据阵列,其中遗传组分选自DNA、RNA、核苷酸片段和核酸。

在其他实施方案中,本发明涉及数据阵列,其中同位素数据根据参考标准给出。

附图说明

图1示出了本发明的G×E指纹识别过程的流程图。

图2A、2B和2C示出了本发明的G×E发明中用于表示种子样本的典型生物分析物的三个图形,以易于区分生长在不同条件(例如不同地区)下的不同品种的不同植物种子。图2A说明了相同的G,不同的E:即相同的基因组成,不同的生长/生物合成环境。图2B显示了不同的G,相同的E:即不同的基因构成,相同的生长/生物合成环境。图2C说明了相同和不同的G和E:即相同和不同的基因组成,以及相同和不同的生长/生物合成环境。

图3为以椭圆分布形式表示G×E样本分析数据的统计分布的二维曲线图。椭圆表示为“e”,椭圆的质心表示为“c”。

图4示出了用于G×E样本分析构建的三维曲线图的裸轴。在本示例中,x轴表示水的同位素组成,表示国际原子能机构(IAEA)标准对水的氢和氧(H,O)的同位素差(δ1)。y轴代表样品的整体生物质的同位素组成(例如来自样品的碳水化合物、蛋白质、脂质和核酸等),它表示为IAEA标准对碳、氮和硫(C,N,S)的同位素差异(δ2)。z轴代表基于0到1标度的遗传样品同源性或差异性的遗传参数(G)。

图5示出了使用图4所示的坐标系进行G×E样本分析得到的三维曲线图。x轴限定了氘和氧18的PC1(主要成分1),PC1(δD,δ18O)。y轴限定了碳13的PC2(主要成分2),以及可选的氮15和/或硫34,PC2(δ13C,或可选的δ15N和/或δ34S)。z轴表示基于0到1标度的遗传样本的同源性或差异性的遗传参数(G)。该图显示了从x,y,z坐标的原点到椭球体中心(即质心“c”)的向量为“v”的椭球体“e”。

图6示出了来自图5的G×E样本分析的三维曲线图,显示了椭球体在(x,y)、(y,z)和(x,z)平面中的每个平面上的投影。

具体实施方式

G×E:G(基因遗传学)×E(环境)是一个强大而精细的概念,用于通过稳定同位素追踪和鉴定生物材料-即含有DNA或RNA的材料(如玉米、小麦、棉花等植物种子)-相对于环境。

在本发明中,我们断言一种基因型存在G×E关系:例如,在爱荷华州种植的“爱荷华州”(基因型)大豆很可能与在中国种植的“爱荷华州”大豆具有非常不同的(C,H,O,N,S)同位素组成-相同的DNA,不同的同位素信号。这种差异可以通过多种方式表现出来,例如X-Y图(DNA表型与大量同位素)。

虽然G×E的概念是众所周知的,但本发明用于确定和定量G×E的方法和数据阵列被认为是新颖的。如本文所示,本方法和数据允许用于鉴定生物样品或鉴定和/或区分两个或多个生物样品的新的及有用的应用。本方法和数据为执行以前无法执行的操作提供了强大的手段。本发明采用遗传指纹数据(即基因组或测序数据)与高分辨率同位素比值质谱数据的独特组合和整合,以提供可用于本文所述方法的整合数据阵列。

同位素比值质谱法(IRMS)是质谱学的一个专门分支,它利用特定样品中同位素的相对丰度进行质谱分析。该方法允许精确测量天然存在的同位素混合物。用于这种精确测定同位素比值的仪器大都是扇形磁场型。由于不同同位素之间的质量差异会导致同位素分馏,因此IRMS领域很受关注。这种分馏的影响使得样品的同位素组成能够测量,从而提供了了解它们的生物学史或物理学历史的窗口。考虑以下示例。氢同位素氘(D或2H)的质量几乎是普通氢(1H)的两倍。因此,普通的水H2O分子和HDO(水分子中的一个氢被氘取代的水分子)的质量有很大的不同。涉及到水的蒸发或氢水键断裂或水和/或其他分子之间氢键解离的过程将表现出分馏现象。因此,地球上不同位置的水源很可能会有不同的同位素比率或能区别D到H的“指纹”。

同位素比值通常是相对于一个标准给出的,给定一个δ值就可以计算出相对同位素丰度。参考标准可以见Hayes,J.M.,Practice and Principles ofIsotopicMeasurements in Organic Geochemistry,第2版,2002年8月,第1~15页表1,表1的要点摘录于此,该参考文献通过引用整体并入本文。

核酸测序,如DNA或RNA测序,可用于确定单个基因(DNA)或编码RNA结构的基因(如核糖体16S亚基)的序列,以用于基因鉴定。这种方法被用来研究基因组及其编码的蛋白质。相对便宜和快速的测序方法的出现使得DNA和RNA序列能够从生物样本中确定,从而对其进行鉴定。这些方法催生了基因组学领域,该领域专注于基因组的结构、功能、演化图谱和编辑,即生物体的遗传物质。在准备用于测序的样品时,聚合酶链式反应(PCR)被用来复制特定的DNA片段。换句话说,DNA序列被指数级扩增,以产生足够数量的基因测序材料。

图1示出了本发明的G×E指纹识别过程的流程图。生物样品被分成两条不同的平行路径。在一条路径中,样品被准备用于同位素比值(IR)质谱分析。这通常涉及将样品燃烧成小分子,如CO2、N2、SO2等,然后在同位素比质谱仪中分析它们的同位素比值。在另一条路径中,样品被准备用于遗传分析。这可能涉及从样品中分离DNA或RNA的各种提取、纯化和浓缩方案,之后是诸如PCR等扩增过程。随后使用常规测序方法对DNA或RNA材料进行测序,以从基因上表征样品以提供基因表达谱。从两个单独的分析途径收集的数据被整合或组合以产生同位素比值质谱数据和遗传数据的单个阵列,或G×E谱。如下所述,可以以不同方式执行两个数据路径的组合。

DNA的相对特异性与稳定同位素分析

DNA分析 稳定同位素分析

GMW:DNA,大肠杆菌:约3×109 GMW:跨度约2至109道尔顿

特异性:约1:107 轻同位素的特异性

其中,GMW为(克分子量)

DNA和天然稳定同位素(每个同位素的特异性约为107)的组合是一对特别强的配对,产生了非常高的特异性。

我们评估了稳定同位素与人DNA的复合能力。我们估计特异性为约1/1017,非常高。从我们的观点来看,DNA是我们通常会进行同位素指纹识别的众多化合物中的一种。其他生物化合物包括RNA、蛋白质、肽和氨基酸、分解代谢产物和代谢物。

我们评估了大量稳定同位素与细菌DNA的复合力-DNA特异性为3×1017。我们估计的特异性为约3/1017,对于此类评估而言,这是非常高的。

在上文中,δ是相对于国际公认标准的千分之几(每密耳或“‰”)差异(正值或负值)的量度。例如,考虑碳12和碳13,δ13C确定为:

δ13C={[(13C/12C)样品/(13C/12C)标准]-1}x1000‰。

其他同位素比值的测定和计算也是类似的。

DNA是我们可以用同位素指纹图谱鉴定的众多化合物之一。因此,我们可以评估生物样品(例如,小麦种子、棉花)的总体组成,并分别评估共存的DNA基因型的定量指标。DNA分子(作为整体有机相)及其基因型的稳定同位素指纹图谱将成为我们方法重点应用的一个实例。通常,我们可以对散装(bulk)材料(例如散装小麦种子等)及其DNA基因型的定量指标进行同位素指纹识别。虽然对样品中的遗传物质(如DNA、RNA、核酸片段、核酸)进行基因组鉴定(即基因分型)是该方法的一个重要应用,但也可以为此目的分析和鉴定其他生物材料。例如,蛋白质组学可以用来获得样品中蛋白质、肽和氨基酸的鉴定信息。分解代谢组学和代谢组学可以用来获得样品中分解代谢产物和代谢产物的鉴定信息。同样,也可以从其他生物成分获得其他“组学”的技术和信息。

DNA是由编码遗传信息的四个碱基对的核苷酸(G-鸟嘌呤、T-胸腺嘧啶、A-腺嘌呤和C-胞嘧啶)组成的线性序列。此外,还涉及基于核苷酸(G-鸟嘌呤、U-尿嘧啶、A-腺嘌呤和C-胞嘧啶)的RNA。

如上所述,天然丰度稳定同位素(如C、H、O、N、S)以极高的特异性记录了生物材料的同位素来源。特别是,水的稳定同位素H和O记录了材料生物合成的环境(E)。C、N和S同位素记录了生物材料本身的同位素组成,以提供高度特异性的同位素指纹。

在一个实施例中,G×E的应用可以在图2A、2B和2C所示的双变量曲线图(x,y-图)上显示。其中特别列举了三个实施例:

图2A说明了在不同环境中生长的生物植物材料的相同遗传来源。换言之,相同的G,但不同的E。在两种不同环境中生长的样品的A1和A2的预期数据椭圆范围来说明这一结果。

图2B说明了生长在相同环境中的不同遗传来源的生物植物材料。换言之,不同的G,但相同的E。即使椭圆A1和B1在E轴上显示为正上方,但由于样品的元素组成因遗传差异而不同,预计它们将显示出不依赖于环境的同位素差异。图中虚线椭圆(偏移量)说明了遗传因素导致的这种同位素效应,预计偏移量将从椭圆中心偏离。但是,如果存在环境影响,则预计会比实施例2C的所示大得多。

图2C示出了相同或不同来源的生物植物材料在相同或不同环境中生长的情况。换言之,基于相同或不同的G和相同或不同的E的数组。这种情况用椭圆A1、B1、A2和B2来说明,其中虚线的椭圆表示可能的偏移量。

参数化遗传学:线性DNA分子由两种类型的序列组成:DNA链的保守区域和可变区域,均由四个碱基对(ATCG或AUCG)组成。这些DNA序列随后可以翻译成蛋白质或以蛋白质的形式被表达。

对于这些序列,我们可以使用DNA或蛋白质的相关系数(r2)作为参考区域或位置。这些参考部分的相关系数从0到1,r2=0表示没有相关性,r2=1表示完全匹配。

图3将来自G×E样本分析的数据的统计分布以椭圆分布形式的二维曲线图(具有质心的椭圆“e”)表示。椭圆的大小和形状取决于样本的统计分布。这组数据的质心描述了给定维度中所有数据点的统计平均值。

图4示出了用于G×E样本分析构建的三维曲线图的裸轴。x轴表示水的同位素组成,表示为国际原子能机构标准对水的氢和氧(H,O)的同位素差(δ1)。该方面基于样品的吸水率,并高度依赖于地理和地球化学参数,即位置和生物条件。y轴表示样品的整体生物量的同位素组成(例如来自样品的碳水化合物、蛋白质、脂质和核酸等),表示为国际原子能机构的碳、氮、硫(C,N,S)标准的同位素差(δ2)。此方面描述了生物质的同位素组成,这些生物质是在一组给定的环境条件下产生的。z轴表示基于0到1标度的遗传样品的同源性或差异性的遗传参数(G)。这些数据是使用标准测序技术和算法以及用于评估生物样本之间的遗传相似性或差异性的计算来获得的。

图5示出了使用图4所示的坐标系进行G×E样本分析得到的三维曲线图。

x轴限定了氘和氧18的PC1(主要成分1),PC1(δD,δ18O)。y轴限定了碳13的

PC2(主要成分2),以及可选地氮15和/或硫34,PC2(δ13C、δ15N、δ34S)。z轴表示基于0到1标度的遗传样本的同源性或差异性的遗传参数。该图显示了一个椭球体“e”,其中从x、y、z坐标的原点到椭圆体的中心(即质心“c”)的向量为“v”,该向量在比较两个或更多样品之间的差异时很有用,每个样品都有自己独特的椭球体。

图6示出了来自图5的G×E样本分析的三维曲线图,将三维椭球体作为二维椭球体投影到任一(x,y)、(y,z)和(x,z)平面中。图6的目的是将数据拆分成二维组,以更易于可视化、解释和分析。

实施例

下列实施例进一步描述和证明了本发明的范围。在不脱离本发明的精神和范围的情况下,许多变化都是可能的,因而这些实施例仅用于说明目的,并不被解释为本发明的限制。

实施例1

在索诺玛谷和纳帕谷种植的同一种酿酒葡萄

这是在两个相似但不同的地理条件和气候环境下种植基因相同的酿酒葡萄品种的一个实例。

在这个实例中,遗传基因(G)是相同的,但是葡萄生长的环境条件(E)是不同的。预计基因图谱是相同的,但由于土壤、水、肥料等生长条件的不同,葡萄的最终产品应该有所不同。

预期数据如图2A所示。

实施例2

在索诺马山谷种植的两种不同的酿酒葡萄

这是在相同的地理条件和气候环境下种植基因不同的酿酒葡萄品种的一个实例。

在这个实例中,遗传基因(G)是不同的,但葡萄生长的环境条件(E)是相同的。预计基因图谱会有所不同。由于葡萄成分的同位素差异叠加在不同的生长条件(如土壤、水、肥料等)上,葡萄的最终产品应该有所不同。预计这种环境差异将表现为更大的同位素差异,其远远大于遗传因素造成的同位素差异。

预期数据如图2B所示。

实施例3

索诺马山谷和纳帕谷种植的两种不同的酿酒葡萄

这是不同的酿酒葡萄品种生长在两个相邻但不同的地理条件和气候环境下的实例。

在这个实例中,遗传基因(G)是不同的,葡萄生长的环境条件(E)也是不同的。预计基因图谱会有所不同。由于土壤、水、肥料等生长条件的不同,葡萄的最终产品也会有所不同。

预期数据如图2C所示。

实施例4

用两种不同的氮肥种植的相同的种子作物,如玉米

这是一个基因相同的玉米品种在同一块土地上种植的实例,一部分地用合成氮源(哈伯法合成肥料)施肥,另一块地用有机氮源(粪肥)施肥。

在这个实例中,遗传基因(G)是相同的,但玉米生长的环境条件(E)是不同的。预计基因图谱是相同的,但由于氮源的不同,玉米的最终产品应该有所不同。

预期数据如图2A所示。

实施例5

生长在两个不同的地方的阿拉比卡和罗布斯塔咖啡

在这个实例中,阿拉伯或阿拉比卡咖啡(Coffea Arabica)和罗布斯塔咖啡(Coffea canephora,也称为Coffea robusta)(两种不同的G)种植在两个不同的地区,例如巴西和越南(两个不同的E)。与罗布斯塔咖啡相比,阿拉比卡咖啡通常更受欢迎,因为它的质量更好,口感和香气也更好。罗布斯塔咖啡被认为是低档的,一般被描述为更刺鼻和更苦涩。阿拉比卡咖啡豆的售价一般高出罗布斯塔咖啡豆的1.5倍以上。阿拉比卡豆类约占世界产量的60%,罗布斯塔豆类约占40%。因此,需要确定咖啡样品及其产地,以鉴别在巴西或越南种植的阿拉比卡咖啡与在这两个相同地点种植的罗布斯塔咖啡。避免生长在越南的罗布斯塔咖啡被误认为是生长在巴西的高品质阿拉比卡咖啡,或生长在巴西的罗布斯塔咖啡被误认为是巴西阿拉比卡咖啡,将是非常可取的。

预期数据如图2C所示。

参考文献

U.S Patent No.7,323,341B1,Stable Isotopic Identification and MethodFor Identifying Products By Isotopic Concentration,to Jasper,issued January29,2008.

U.S.Patent No.8,367,414B2,Tracing Processes Between Precursors andProducts By Utilizing Isotopic Relationships,to Jasper,issued February 5,2013.

PCT Application Publication No.WO2015/103183,Method for ContinuouslyMonitoring Chemical orBiological Processes,to Jasper,published July 9,2015.

PCT Application Publication No.WO2016/109631,Isotopic Identificationand Tracing ofBiologic Products,to Jasper,publishedNovember 12,2015.

PCT Application Publication No.WO2015/103183,Molecular IsotopicEngineering,to Jasperpublished July 7,2016.

Hayes,J.M.,Practice and Principles of Isotopic Measurements inOrganic Geochemistry,Revision 2,August 2002,pages 1-15,particularly Table 1.

引用并入

本文提及的每个专利文件的全部公开内容,包括更正证书、专利申请文件、科学文献、政府报告、网站和其他参考文献,出于所有目的通过引用整体并入本文。如有术语冲突,以本说明书为准。

等同物

在不脱离本发明的精神或实质特征的情况下,本发明可以以其他具体形式实施。上述实施例在所有方面均是说明性的,而不是限制在此描述的本发明。在本发明的方法和系统的各种实施例中,术语包括用于描述所述步骤或组件,还预期所述方法和系统由或基本上由这些步骤或组件组成。此外,只要本发明保持可操作性,步骤的顺序或执行某些操作的顺序是无关紧要的。并且,可以同时进行两个或更多个步骤或操作。

在说明书中,除非上下文另有明确说明,单数形式还包括复数形式。除非另有定义,否则本文使用的所有技术和科学术语与本发明所属领域的普通技术人员通常理解的含义相同。如有冲突,以本说明书为准。

此外,应当认识到,在某些情况下,组合物可以被描述为由混合之前的组分组成,因为在混合时,某些组分可以进一步反应或转化为其他材料。

本文中使用的所有百分比和比率,除非另有说明,均以重量计。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:具有故障安全状态机的医疗装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!