一种鉴别牦牛奶掺假的方法及应用

文档序号:904931 发布日期:2021-02-26 浏览:6次 >En<

阅读说明:本技术 一种鉴别牦牛奶掺假的方法及应用 (Method for identifying yak milk adulteration and application ) 是由 韦晓群 陈元佳 李梦霜 张世伟 冯沛彦 成杰 孙琳媛 莫惠欣 郑玲燕 胡浩鑫 李 于 2020-10-10 设计创作,主要内容包括:本发明公开了一种鉴别牦牛奶掺假的方法及应用。通过对牦牛奶真假样品进行适当的前处理操作,控制电子鼻测试条件采集样品信息,再结合Simca计量统计学软件运用帕累托标度模式(Par)对数据信息进行适当预处理,分析电子鼻在60~105s稳定区数据以建立牦牛奶的定性鉴别模型,本发明建立的牦牛奶鉴别模型能够实现对真实牦牛奶、假牦牛奶及掺假牦牛奶的准确判别,且具有操作简单便捷、快速、准确的优点。(The invention discloses a method for identifying yak milk adulteration and application thereof. The method comprises the steps of carrying out proper pretreatment operation on a yak milk true and false sample, controlling an electronic nose testing condition to collect sample information, properly preprocessing data information by combining Simca metrological statistics software and applying a Partor scale mode (Par), and analyzing data of the electronic nose in a 60-105 s stable region to establish a yak milk qualitative identification model.)

一种鉴别牦牛奶掺假的方法及应用

技术领域

本发明涉及牦牛奶鉴伪技术领域。更具体地,涉及一种鉴别牦牛奶掺假的方法及应用。

背景技术

牦牛是我国青藏高原地区特有的珍稀牛种之一,仅在四川、西藏、青海、新疆省分布。牦牛奶富含免疫球蛋白、乳糖和共轭亚油酸等,营养价值显著高于市售商品奶。牦牛是季节性泌乳,年产量有限,所以市场价格远高于普通牛奶。一些不法商家在利益的驱动下以次充好,将普通牛乳掺入牦牛乳甚至是用其他与牦牛乳风味相似的牛乳,比如犏牛乳、水牛乳来假冒,以牟取暴利。这种欺诈行为不仅损害消费者权益,扰乱市场,还可能威胁到过敏人群的生命健康。因此,建立准确、快速的牦牛乳掺假鉴别方法,对保障牦牛乳品质和乳制品安全具有重要意义。

目前已有许多针对乳制品掺假鉴别的方法的报道,如基于蛋白质差异的检测方法,包括电泳法、酶联免疫法、色谱法等,是最常用的鉴别方法。但牛奶和乳制品加热后蛋白容易变形,导致这类方法的灵敏度和准确度下降。色谱法能区别出不同种类间蛋白质的差异,但实验操作复杂且耗时,检测成本也高。DNA具有一定的热稳定性和物种特异性,以其作为研究对象的检测方法具有更高的灵敏度和特异性。聚合酶链式反应PCR是应用最广泛的技术,原理是根据不同物种间DNA序列的差异设计特异性的引物,然后对其DNA模板进行PCR扩增,进而达到区分不同物种的目的。

公开号为CN107447003A的中国发明专利提供了一种检测DGAT1基因突变的PCR-SSCP引物及其在牦牛乳品质预测和鉴别方法中的应用。由于奶中的DNA主要来自白细胞和脱落的乳腺细胞,这与动物的品种、饲养以及生理期有关,奶中DNA含量不稳定,难以建立标准化的检测方法。电子鼻,是一种模拟人嗅觉的传感技术,操作简单、检测快速,对检测样品无损,已有文献报道通过电子鼻能实现不同品牌牛乳的鉴别、牛奶腐败度的检测,但将电子鼻运用于牦牛奶的鉴别还未见报道,且目前缺乏一种操作简单便捷、能实现快速、准确鉴定牦牛乳掺假的方法。

发明内容

本发明旨在提供一种鉴别牦牛奶掺假的方法及应用,利用电子鼻采集真假牦牛奶样品数据,再结合计量统计学软件挖掘得到的数据信息,进一步建立牦牛奶鉴别模型,本方法建立的牦牛奶真实判别模型具有较高的准确率,能够准确分辨出牦牛奶真样本、假样本及掺假样本。

本发明的首要目的是提供一种鉴别牦牛奶掺假的方法。

本发明的再一目的是提供上述方法在鉴别牦牛奶真伪方面的应用。

为了实现上述目的,本发明是通过以下方案实现的:

本发明提供了一种鉴别牦牛奶掺假的方法,包括如下步骤:

S1.采集牦牛奶真样品和假样品,分别将样品装入电子鼻检测玻璃样品瓶中,加入盐类化合物过饱和得到待测样品;

S2.对步骤S1的待测样品进行电子鼻测试,样品传感器清洗时间设为50~80s,自动调零时间8~15s,预进样时间4~8s,样品测试时间120s,进样流量为500~700mL/min,初始喷射流与室流量为130~180mL/min;

S3.选择电子鼻测得的各样品在60~105s的数据,导入化学计量学软件进行数据前处理;

S4.将牦牛奶真样品、假样品处理后的数据划分为训练样本集和验证样本集;

S5.利用训练样本集建立牦牛奶鉴别模型;

S6.取待测样品根据步骤S1~S3获得待测样品电子鼻测试数据,再调入步骤S5所建立的鉴别模型中进行真伪的鉴别。

优选地,步骤S3所述数据前处理模式为帕累托标度模式(Par)。

本发明上述方法中,通过对样品进行适当的前处理操作,控制电子鼻测试条件采集样品信息,再结合化学计量学软件对数据信息进行适当预处理后,建立牦牛奶的定性鉴别模型。通过优化模型参数比较,选择电子鼻第一次采集样本的60~105s稳定区内的数据用于建模和分析预测,模型数据前处理方式为Par模式,有利于模型建立的稳健性和预测的准确性。

优选地,步骤S1所述待测样品的制备方法为:取2~8mL液体奶装入电子鼻检测玻璃样品瓶中,同时加入盐类化合物过饱和得到。

优选地,步骤S1所述盐类化合物为NaCl。

优选地,步骤S1所述假样品为与牦牛奶真样品不同种类的奶、不同品种的牛奶或不同品牌的牛奶,或在牦牛奶真样品中掺入其他牛奶制得的混合奶样品。

上述混合奶样品为分别向牦牛奶中掺入5%、10%、25%、50%的特仑苏牛奶制得的样品。

优选地,步骤S2中,对每个样品测量前后,传感器都进行清洗和标准化,以消除漂移现象并减少实验误差。

优选地,步骤S4所述化学计量学软件为Simca软件。

本发明优选的Simca软件为Simca 14.1软件。

优选地,步骤S3所述各样品的数据为待测样品第一次检测得到的数据。

优选地,步骤S5建立鉴别模型后,还包含对模型验证的步骤:使用训练样本集和验证样本集内的待测样品第一次检测在60~105s的数据对该模型分别进行内部验证和外部验证。本发明实验过程中,利用上述内部验证和外部验证均可准确分辨出真实牦牛奶和非牦牛奶及掺假牦牛奶。

优选地,所述利用训练样本集建立牦牛奶鉴别模型具体是:先对电子鼻测得的数据集进行适当预处理,剔除数据中的异常值,选出稳定可分析的数据集;处理后的数据矩阵结合PCA分析,初步判断建模的可能性;将牦牛乳真样本、其他品种牛乳及掺假混合样本划分为“训练样本集”和“验证样本集”。训练样本集是模型的已知分类样本,真假牦牛奶的判别模型基于训练集的设定进行建立,选取牦牛奶真样品数据设为训练集C组(真实组),假样品数据设为训练集F组(造假组)。

验证样本集用于验证模型的可靠性,这类样本对于模型来说是未知分类样本,样本范围包括:牦牛奶真样本、训练集范围内的部分假样本,训练集范围外的假样本。

优选地,所述电子鼻为德国Airsense公司生产的PEN2便携式电子鼻。

此外,使用待测样品第一次检测的稳定时间内的数据对上述模型进行外部验证,结果发现该模型不仅能鉴别出训练集中包括的假样本,还能判断出不同种类的驼奶、羊奶、不同品牌的牛奶、不同比例掺假的牦牛奶为非真实样本,真实组模型的AUC值为1。本发明得到的鉴别模型能够实现对真实牦牛奶、假牦牛奶及掺假牦牛奶的准确判别,相较于其他鉴别方法,具有操作简单便捷、快速、准确鉴定的优点,适用多种形式掺假样品的鉴定,应用范围广,且可推广用于其他液态乳的真伪鉴定。

因此,本发明还请求保护上述方法在鉴别牦牛奶真伪方面的应用。

与现有技术相比,本发明的有益效果在于:

通过对样品进行适当的前处理操作,控制电子鼻测试条件采集样品信息,再结合Simca计量统计学软件对数据信息进行适当预处理,分析电子鼻60~105s稳定区数据以建立牦牛奶的定性鉴别模型,能够实现对真实牦牛奶、假牦牛奶及掺假牦牛奶的准确判别,相较于其他鉴别方法,具有操作简单便捷、快速、准确鉴定的优点。

附图说明

图1为训练集样本在C组模型的DModX PS+图;

图2为与训练集相同的预测样本在C组模型的DModX PS+图;

图3为与训练集相同的预测样本在C组模型的Common’s Plot图;

图4为不同种类、不同品牌预测集在C组模型的DModX PS+图;

图5为不同种类、不同品牌预测集在C组模型的Common’s Plot图;

图6为不同掺假比例预测集在C组模型的DModX PS+图;

图7为不同掺假比例预测集在C组模型的Common’s Plot图;

图8为训练集中4个牦牛真实样本60~105s在PCA-X模型中的Hotelling’s T图;

图9为训练集中4个牦牛真实样本60~105s在PCA-C模型中的DModX图;

图10为牦牛奶1~120s内数据点为预测集在C组模型的DModX PS+图;

图11为牦牛奶1~120s内数据点为预测集在C组模型的Common’s Plot图;

图12为电子鼻对牦牛奶样本测试挥发性气味响应图;

图13为同一样本首次与重复采集数据为预测集在C组模型的DModX PS+图;

图14为同一样本首次与重复采集数据为预测集在C组模型的Common’s Plot图。

具体实施方式

以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。

除非特别说明,以下实施例所用试剂和材料均为市购。

1、牛奶样品信息如表1所示。

2、仪器:电子鼻(德国Airsense公司PEN2便携式电子鼻系统)。

实施例1牦牛奶鉴别模型的建立

(1)训练集样品的制备方法:采集牦牛奶真样品、假样品(犏牛奶、水牛奶、伊利纯牛奶、蒙牛纯牛奶、特仑苏纯牛奶)及分别量取5mL液体奶装入15mL电子鼻检测玻璃样品瓶中,同时加入3.0g NaCl过饱和得到待测样品。

(2)对各待测样品进行电子鼻测试,设置电子鼻的测试条件设置为:样品传感器清洗时间设为60s,自动调零时间10s,预进样时间5s,样品测试时间120s,进样流量为600mL/min,室流量为150mL/min,初始喷射流与室流量一致。每个样品测量前后,传感器都进行清洗和标准化,以消除漂移现象并减少实验误差。

(3)用Excel整理电子鼻测得的每个样品的数据,先对电子鼻测得的数据集进行适当预处理,剔除数据中的异常值,选出稳定区60~105s的数据集,导入化学计量学软件simca 14.1进行处理,数据前处理模式为Par,处理后的数据矩阵结合PCA分析,初步判断建模的可能性。

(4)训练样本集选取了牦牛奶样本数据设为训练集C组(真实组),犏牛奶、水牛奶、伊利纯牛奶、蒙牛纯牛奶、特仑苏纯牛奶设为训练集F组(造假组)。真假牦牛奶的判别模型将基于训练集的设定进行建立。

实施例2内部训练样本预测

1、实验方法

将实施例1的训练集中每个样本取稳定时间区间的随机3个时间点的数据组成预测集,以进行判别模型内部验证。预测集共有42个数据点,其中牦牛真实样本有12个点,假样本有30个点。

2、验证结果

Distance to Model X(DModx)图可以识别出数据中的异常点,它的椭圆临界极限的显著性水平均为0.05(95%的可信度)。以C组(牦牛奶真实样本)建立的Class模型,在该模型的DModX PS+图中,样本高于Dcrit(0.05)两倍的数据点被确定为与模型训练集C组(真实组)不同的异常数据点,即可认为是假样本。结果如图1所示,牦牛真实样本到模型平面估计的距离值(DModX)均低于Dcrit(0.05),假样本均远高于Dcrit(0.05),该模型的灵敏度(SEN)和准确度(SPE)均为1。因此,该模型内部验证的准确率为100%,模型有一定的可靠性。

实施例3外部验证样本集预测

外部验证样本预测可分为两种情况,一是对模型训练样本范围内的奶样本进行预测,二是对模型训练样本范围以外的其他掺假样本进行预测,分为其他种类的奶和牦牛奶掺假两种预测。

1、实验方法

(1)外部验证集样本数据采集:采集牦牛奶真样品、假样品(伊利纯牛奶、特仑苏纯牛奶、燕塘纯牛奶、温氏纯牛奶、风行纯牛奶、山羊奶、骆驼奶)及掺假样本(牦牛奶真样品中掺入5%、10%、25%、50%的特仑苏牛奶),样本制备方法、电子鼻采集方法、数据处理方法同上文实施案例1中的方法。

(2)训练样本范围内的验证样本集预测:预测样本共30个样本点,其中与训练集中假样本种类一样的牛奶20个样本,牦牛奶10个真实样本,样本选择分析的时间点都在60~105s的稳定范围内。

(3)训练样本范围外的其他奶验证样本预测集:所包括的预测样本共35个样本点都为不同形式的假样本,其中与训练集不同品牌的牛奶15个样本,不同种类的奶20个样本,羊奶10个,骆驼奶10个。样本选择分析的时间点都在60~105s的稳定范围内。

(4)训练样本范围外牦牛乳掺假验证样本预测集:主要由牦牛乳、牛乳和四个比例(5%、10%、25%、50%)混合样本组成,共有60个样本点,其中每类样本有10个样本。样本选择分析的时间点都在60~105s的稳定范围内。

2、验证结果

(1)训练样本范围内的验证样本集预测:从图2可以看出,牦牛真实样本在C组模型中的DModX值均低于DCrit(0.05),其他假样本值均高于DCrit(0.05),且模型的AUC为1;Common’s Plot图中,横坐标为预测样本点到训练集中的真实样本模型的距离,纵坐标为到训练集中假样本模型的距离。如图3所示,蓝色数据点在X轴的DModX值小于DCrit(0.05),且高于Y轴的DCrit(0.05),可认为这类样本属于真实样本类。红色数据点的DModX值高于X轴和Y轴的DCrit(0.05),被模型判定为不属于训练集中的任何一类。预测结果都与实际相符。因此,该模型可用于判断牦牛正样本和非牦牛样本,且有较高的准确率,不能用于预测假样本属于哪一类掺假。

(2)训练样本范围外的其他奶验证样本预测:从图4可以看出,该预测集所有样本数据与C组模型的DModX值均大于Dcrit(0.05),可初步判断这些样本与C组真牦牛样本不是一类,与实际情况相符。图5Common’s Plot图中风行牛奶的样本数据点分布在Y轴的Dcrit(0.05)红线上下,且有2个数据点低于Dcrit(0.05)的值,即1.55521,推测风行牛奶与用于训练集建模的牛奶样本较为相似。另外两个品牌的牛奶燕塘、温氏牛奶虽不在红线内,数据点分布也接近1.55521。而山羊、骆驼两种其他种类的奶的数据点分布远离X、Y轴的Dcrit(0.05)红线。因此,这一模型也可以预测出建模训练集样本范围之外的,不同品牌或不同种类的奶为假样本;从Common’s plot图数据的分布区域大致判断预测样本与训练样本的相似度,但还不能准确判断假样本属于哪类掺假。

(3)训练样本范围外牦牛乳掺假验证样本预测:如图6所示,预测集中0掺假的牦牛样本与C组模型的DModX值均小于Dcrit(0.05),其余不同比例的掺假样本均高于红线判断不属于真实样本。在图7中,红色样本在X轴的红线内,判断为与训练集中的真实样本为同一类,即0掺假的牦牛真实样本;黄色样本在Y轴红线内,判断为与训练集中假样本为同一类,即100%掺假的牛奶假样本;蓝色样本超出X、Y轴的红线,判断为掺了不同比例牛奶的牦牛奶假样本。预测结果与实际情况完全相符。因此该模型还可以准确分辨出牦牛真实样本和牦牛掺假样本,但要具体判断掺假样本中的掺假比例需要用另一模型进一步判断。

实施例4稳定区数据选择

为了提高模型的稳定性,识别并移除数据集中的异常点是必须的一步。Hotelling’s T和Distance to Model X(DModx)图分别可以识别出强异常点和中等异常点,两者的椭圆临界极限的显著性水平均为0.05(95%的可信度)。在Hotelling’s T图中,若样本的T2范围值高于95%则表示他们是较强的异常值。在DModx图中,样本高于Dcrit(0.05)两倍的数据点高于2倍的被确定为中度异常值。选择样品电子鼻测得的60~105s数据进行分析时.

从图8~9可以看出,184个牦牛样本的DMOD X值小于Dcrit值的两倍。仅有2个样本点(yak3-98、yak4-94)的T2范围高于95%的置信区限(9.84888),表明它们是较强的异常值。因此,电子鼻采集牦牛奶1~120s数据中,可用于分析的稳定数据区间为60~105s,样本编号为yak3-98、yak4-94被直接移除以进一步作为真实样本建模。

实施例5数据处理方法在模式的选择

1、实验方法

为了减少数据矩阵中不相关变量的影响,建立一个准确率高的分类判别模型,一种合适的数据处理方法在模式过程中至关重要。本研究比较了单位方差标度(UV)、帕累托标度(Par)、平均定心(Ctr)作为预处理方法PCA-Class模型的准确率。将所有的验证样本集进行预测。

2、实验结果

表2预测集C(真实)验证模型数据前处理的优化

数据前处理模式 UV Par Ctr None
主成分个数 3 4 5 1
AUC 1 1 1 1
整体准确率 48.06% 66.67% 52.71% 55.04%

四种数据前处理模式得到模型的相关参数如表2所示。主成分个数是自动拟合的最优解,曲线下的面积(AUC)表示这一分类模型的定量性能度量,它从0.5(随机预测值)到1.0(完美预测值)不等;整体准确率表示牦牛奶C组和非牦牛组F组两种模型的正确分类百分比的平均值。从表2可以看出,四种模式的AUC值都为1,有良好的预测的能力,其中模型整体准确率最高的为Par。综合考虑,选择Par模式作为训练集数据前处理方式。

实施例6假阴性出现的分析

研究中导致假阴性结果出现的原因主要有两个,一是采用牦牛真实样本稳定区外的数据进行预测,二是同一样品重复采集。

训练集的建立是采用了60~105s稳定时间的样本点建立,样本稳定区外假阴性的预测集由3个牦牛真实样本组成,在0~120s的原始测试数据中每10s的区间内随机选一个时间点,每个样本各有12个数据点,共36个分析数据。

图10和11中红色柱状条和红色数据点的样本的DModX值在红线以下,分布在X轴的Dcrit(0.05)红线内,判断为与训练集中的真实样本为一类,可从样品名称中看出这些数据点的时间基本都在稳定区间60~105s间。稳定区间外的数据点的DModX值基本大于Dcrit(0.05),且采集前期的样本超出红线最多,这是因为电子鼻测试前期数据还未稳定发生数据发生较大的波动(图12)。因此,应用这一模型进行预测时,用于分析的样品点的采集时间应在60~105s时间范围内,否则可能出现假阴性的情况。另外在预测时,建议一个样本采集5个时间点以上的数据,避免实验误差,提高准确度。

同一样本重复采样的预测集由2个牦牛真实样本第一次采集的数据和第二次采集的数据组成,每个样品取5个数据点,用于分析的数据点都在60~105s的稳定区内,共有20个数据点。Yak 9个yak 11为第一次采集的数据,yak 10和yak 12分别为它们的第二次采集数据。从图13~14可以看出第一次采集的红色样本点,在Dcrit(0.05)的红线以内,模型可以实现正确预测;第二次采集的数据均在在Dcrit(0.05)的红线之外,被判定为非牦牛样本,这与实际情况不符。因此在使用这一模型预测时,要采用样品第一次采集的数据,同一样品重复测试采集得到的数据会造成预测结果假阴性。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种婴幼儿奶粉剩余保质期的预测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!