一种基于介电谱技术的掺杂牛初乳定性识别方法

文档序号:1919868 发布日期:2021-12-03 浏览:9次 >En<

阅读说明:本技术 一种基于介电谱技术的掺杂牛初乳定性识别方法 (Qualitative identification method of doped bovine colostrum based on dielectric spectrum technology ) 是由 朱新华 安长青 方东根 王旭东 朱杰亮 陆畅 于 2021-10-18 设计创作,主要内容包括:本发明公开了一种基于介电谱技术的掺杂牛初乳定性识别方法,属于食品快速检测领域。该方法采用介电特性测量系统测量一批牛初乳及掺杂牛初乳的介电参数。首先对样品介电谱进行预处理,以提高模型预测精度,其中噪声消除类预处理方法明显优于散射消除类,且Savitzky-Golay平滑与二阶导数组合的效果最优。进而以全谱和经主成分分析提取的介电谱数据为模型输入,分别建立2种线性模型和2种非线性模型。其中基于全谱建立的线性判别分析模型为最优模型,其测试集识别准确率为97.37%。该模型对其他来源的验证牛乳样品的识别准确率为93.18%。本发明基于介电谱技术定性识别掺杂牛初乳,具有成本低、精度高、检测迅速、可用于现场检测等优点。(The invention discloses a qualitative identification method of doped bovine colostrum based on a dielectric spectrum technology, and belongs to the field of rapid detection of food. The method adopts a dielectric property measurement system to measure dielectric parameters of a batch of bovine colostrum and doped bovine colostrum. The method comprises the steps of preprocessing a sample dielectric spectrum to improve model prediction accuracy, wherein a noise elimination preprocessing method is obviously superior to a scattering elimination preprocessing method, and the effect of combining Savitzky-Golay smoothing and a second derivative is optimal. And then, taking the full spectrum and the dielectric spectrum data extracted by the principal component analysis as model input, and respectively establishing 2 linear models and 2 nonlinear models. The linear discriminant analysis model established based on the full spectrum is an optimal model, and the identification accuracy of the test set is 97.37%. The model has 93.18% of identification accuracy on verified milk samples from other sources. The method qualitatively identifies the doped bovine colostrum based on the dielectric spectrum technology, and has the advantages of low cost, high precision, rapid detection, capability of being used for field detection and the like.)

一种基于介电谱技术的掺杂牛初乳定性识别方法

技术领域

本发明属于食品快速检测领域,特别是涉及一种基于介电谱技术的掺杂牛初乳定性识别方法。

背景技术

牛初乳是指健康奶牛在分娩后3天内所分泌的乳汁。牛初乳中含有丰富的蛋白质、脂肪等营养成分,以及提高人体免疫力的免疫球蛋白等,具有更高的营养价值,因此广受消费者青睐。然而,牛初乳的产量很低,因此其价格远高于常乳。为了获取较高的利润,一些牛乳销售商常常在牛初乳中添加一定量的常乳。这种行为不仅严重影响了牛初乳及其乳制品的质量和营养价值,而且侵犯了消费者的合法权益。因此,检测牛初乳中常乳掺杂具有重要意义。

与常乳相比,牛初乳中脂肪、蛋白质等含量更高,粒度分布更大,较强的非均质特性进一步增加了初乳的识别难度,仅凭颜色、密度、粘度等物理特性难以准确评判牛初乳品质。实验室中常用的化学分析方法如放射免疫扩散法、酶分析法和免疫透射比浊法等虽然可以提高检测精度,但存在检测费时费力,成本高及对操作者技术要求高等问题。近红外光谱技术在评估牛初乳品质上具有一定的可能性,但该技术易受牛初乳中脂肪、蛋白质等大颗粒的影响,存在较强的散射效应,因此检测精度难以令人满意。因此,探索一种成本低、精度高、检测迅速、可用于现场检测的方法对牛初乳及其产品品质的保障具有重要意义。

介电谱技术是一种在较宽频率范围内获取物质电学特性的技术,可以获取样品更多的成分与结构信息。此外,介电谱技术具有快速、可用于现场和在线检测的优点。因此已广泛应用于牛乳品质检测方面,如牛乳中脂肪、蛋白质、乳糖和水的检测。此外,介电谱具有更大的波长范围和更深的穿透深度,不易受脂肪球等大颗粒散射影响,对于非均质牛乳检测具有一定优势。然而目前尚未见基于介电谱技术的牛初乳掺杂的识别方法,为此有必要开发出一种基于介电谱技术的掺杂牛初乳定性识别方法,其重点在于选择合适的预处理及建模方法以提高识别准确率,为牛初乳掺杂提供一种成本低、精度高、检测迅速、可用于现场检测的定性识别技术。

发明内容

针对现有技术中的缺陷与不足,本发明的目的在于提供掺杂牛初乳定性识别方法。通过介电谱测量仪器采集一批牛初乳及掺杂牛初乳的介电频谱,根据牛初乳强非均质的特点,选择噪声消除类方法和散射消除类方法进行预处理,以消除介电谱测量过程中产生的噪声干扰或由于牛初乳非均质特性产生的散射影响。以优选的方法对牛乳样品介电谱预处理后,进而建立定性识别掺杂牛初乳的线性或非线性模型,对比分析模型识别准确率,确定最佳模型。将未知牛初乳样品经预处理后的介电谱数据代入最佳模型即可对其定性识别。

一种基于介电谱技术的掺杂牛初乳定性识别方法,其特征在于,包括以下步骤:

步骤一:采集来自不同地区、季节、饲养条件的不同奶牛牛乳样本;牛初乳样品为奶牛分娩3天内的乳,常乳样品为正常泌乳期奶牛的乳;在室温下保存牛初乳及常乳样品,试验前依次将牛初乳样品按掺杂质量分数为10%、20%、30%、40%及50%的比例与常乳样品混合得到掺杂牛初乳样品;将每个牛初乳样品和配制的掺杂牛初乳样品分为3份备用;

步骤二:测试前预热网络分析仪1h ,然后对其依次进行开路、短路和50 Ω 负载校准。设置仪器测量参数,主要包括频率测量范围、测量点数,最后校准末端开路的同轴探头;测量样品介电谱前,将制备好的样品放于振荡器上摇匀2 min左右,使乳成分分布均匀。每个样品重复测量3次,3次结果的平均值为最终结果。测量期间,样品温度为25±1 ºC;

步骤三:根据牛初乳强非均质的特点,选择噪声消除类方法—Savitzky-Golay平滑、二阶导数及其组合方法和散射消除类方法—标准正态变量变换、多元散射校正及其组合方法进行预处理,以消除介电谱测量过程中产生的噪声干扰或由于牛初乳非均质特性产生的散射影响;利用经典样本划分方法Kennard-Stone按3:1的比例将预处理后的牛初乳及各个比例下掺杂牛初乳划分为校正集和测试集;

步骤四:基于噪声消除类及散射消除类预处理方法,对比线性偏最小二乘判别分析与非线性支持向量机模型识别牛初乳及掺杂牛初乳的准确率,优选出Savitzky-Golay平滑与二阶导数组合的介电谱预处理方法;

步骤五:以优选的Savitzky-Golay平滑与二阶导数组合预处理方法处理原始介电谱数据,以全谱和经主成分分析降维提取后的介电谱数据作为模型输入,建立偏最小二乘判别分析和线性判别分析两种线性模型以及支持向量机和多层感知机两种非线性模型。基于线性模型及非线性模型的识别准确率,对比确定最优模型为基于全谱的线性判别分析模型;

步骤六:对于不同来源的未知牛初乳样品,按照步骤二完成介电谱的采集,将采集的未知牛初乳样品介电谱数据经步骤四确定的Savitzky-Golay平滑与二阶导数组合预处理后,代入步骤五确定的线性判别分析模型中,对该样品快速准确识别。

其中,步骤四中噪声消除类预处理明显优于散射消除类预处理,表明基于介电谱法识别掺杂牛初乳的不利影响为噪声干扰,而非由牛初乳非均质特性引起的散射;步骤五中基于介电谱技术识别掺杂牛初乳所建立的线性模型预测效果明显优于非线性模型。

该发明所提出的预处理方法及模型选择方法不排除用于哺乳类动物初乳掺杂常乳的定性识别,其初乳及常乳源于同种动物。

本发明可以取得的有益技术效果:

(1)检测迅速,操作简单、便于在线测量。本发明提供的方法只需测量未知牛初乳样品的介电谱,并对介电谱进行预处理后即可通过相应模型对其进行识别。基于本发明提供的方法有利于开发专用的检测仪器,实现掺杂牛初乳的在线快速检测;

(2)识别准确率高。本发明中对牛初乳样品介电谱进行降噪预处理后,所建立的掺杂牛初乳定性识别的线性判别分析模型,其校正集和测试集准确率分别为99.14%和97.37%。该模型对其他来源的验证牛乳样品的识别准确率为93.18%。因此基于本发明的掺杂牛初乳定性识别方法可以获得较高的识别精度,实用性较强。

附图说明

图1是本发明一种基于介电谱技术的掺杂牛初乳定性识别方法的流程图;

图2是介电特性测量系统的原理图;

图3是试验所用不同比例掺杂牛初乳的平均介电谱图;

图4是优选的噪声消除类方法对样品介电谱预处理的结果图;

图5是基于介电谱技术建立的最优模型对未知牛乳样品的识别结果;

附图标记:

1.网络分析仪,2.同轴探头,3.温度计,4.水浴锅,5.升降装置,6.计算机。

具体实施方式

本发明对不同品种奶牛的掺杂牛初乳定性识别具有良好适应性;由于奶牛品种较多,本发明以‘荷斯坦’奶牛分娩3天内所产的牛初乳及正常泌乳期奶牛所产的常乳样品为实施例,其他奶牛掺杂牛初乳定性识别均可以参照该实施例的方法进行。具体根据所测牛初乳样品,合理选择介电谱预处理方法及建模方法,即可对牛初乳样品快速准确判别。

下面结合发明人给出的说明书附图和实施例对本发明一种基于介电谱技术的掺杂牛初乳定性识别方法做进一步说明。

依据本发明实施例的方法包括以下步骤:

步骤一:采集来自不同地区,季节,饲养条件的不同奶牛牛乳样本,牛初乳样品为奶牛分娩3天内的乳,常乳样品为正常泌乳期奶牛的乳。本实施例中用于建立模型的牛乳样品均采自陕西省杨凌区三个不同奶场饲养的‘荷斯坦’奶牛,用于验证模型的牛乳样品采自杨凌区另一个不同的奶场。

牛初乳及常乳主要成分指标见表1。牛初乳的蛋白质和非脂乳固体的含量远大于常乳,其脂肪含量稍大于常乳,但其乳糖含量和含水率小于常乳。牛初乳较高的粒子浓度增强了其非均质特性。需要指出的是,由于养殖条件、母牛个体以及泌乳时间等存在差异,试验用牛初乳及常乳样品成分有较大的范围,这也表明试验牛乳样品有较好的代表性。

表1 试验牛初乳及常乳样品主要成分含量,(g/100g)

牛奶样品 脂肪 蛋白质 非脂固体 乳糖
牛初乳 4.20±1.03 9.70±1.45 14.63±1.40 3.49±0.29 80.35±1.39
常乳 4.06±0.52 3.61±0.27 9.11±0.21 4.71±0.16 86.70±0.95

牛初乳与常乳中粒度分布情况如表2所示,牛初乳的d(0.5)与D[3,2]平均值分别为2.435、1.710 μm,略大于常乳;而牛初乳的d(0.9)与D(4,3)的平均值分别为7.394、3.270μm,显著高于常乳。这表明牛初乳中有更大的粒度分布范围,非均质特性更强。

表2 牛初乳及常乳的粒度分布

粒度分布参数(μm) d(0.5) d(0.9) D[4,3] D[3,2]
牛初乳 2.435±0.225 7.394±0.796 3.270±0.471 1.710±0.102
常乳 2.425±0.055 5.459±0.169 2.689±0.150 1.700±0.034

表2中符号说明:d(0.5)和d(0.9)分别表示样品的累计粒度分布百分数达到50%和90%时所对应的粒径;D[4,3]、D[3,2]分别表示粒子体积矩和表面体积平均直径。

通过分析牛初乳与常乳的主要成分和粒度分布可知,牛初乳中蛋白质、脂肪、非脂固体等成分含量较高,含水率较低,各成分含量的标准差远大于常乳;另一方面,牛初乳中粒度分布参数d(0.9)和D[4,3]远大于常乳,二者都将影响其介电特性,为应用介电谱技术定性识别掺杂牛初乳的可行性提供了有力证明。

本实施例中由不同的牛初乳和常乳样品按照掺杂质量分数为10%、20%、30%、40%和50%配置掺杂牛初乳样本。每次采集3份牛初乳和3份常乳,依次将原始牛初乳样品按掺杂质量分数为10%、20%、30%、40%和50%的比例与正常乳样品混合,从而得到15个掺杂牛初乳,其中每个掺杂水平下各3个重复。为了获得更多的牛初乳样品,每次试验等量混合3个不同奶牛的原始牛初乳样品,得到新的混合牛初乳样品4个,即每次试验共得到7个牛初乳样品。建立模型的试验共开展7次,最终得到154个样本。验证模型的试验共开展2次,最终得到44个样本。室温下保存牛初乳及常乳样品,并在5h内完成样品配置和介电谱采集;将每个牛初乳样品和配制的掺杂牛初乳样品分为3份备用。

步骤二:本实施例中采用马来西亚AgilentTechnology公司的网格分析仪、同轴探头和85070软件测量样品介电参数。图2显示了介电参数测量系统原理图,测试前预热网络分析仪1h,然后对其依次进行开路、短路和50 Ω负载校准。启动 85070 软件后,设定测量频率范围为20~4500 MHz,测量频率点数为 201 个。最后对同轴探头进行开路、短路和 25ºC的去离子水校准。测量介电谱前,将制备好的样品放于振荡器上摇匀2 min左右,使乳成分分布均匀。每个样品重复测量3次,3次测量的平均值为最终结果。测量期间,样品温度为25±1 ºC。

图3是试验所用不同比例掺杂牛初乳的平均介电谱图;图3(a) 表明对于样品平均介电谱ε′曲线,在被调查的大部分频段内(约50MHz以上),牛初乳样品的ε′值随着常乳掺杂水平增加而增大。水属于极性分子,牛初乳的ε′主要由水主导。随着常乳的掺入,样品中自由水分子增加,分子取向极化效应逐渐增强,在介电谱中表现为ε′的值增大。图3(b) 为牛初乳、常乳掺入量为20%、50%的牛初乳及常乳样品所对应的平均介电谱ε"曲线。ε"随着常乳的掺入水平提高先降后增,改变发生在约2000 MHz。

步骤三:预处理原始介电频谱曲线。为了探明非均质特性对基于介电谱法的掺杂牛初乳识别的主要影响因素,消除介电谱测量过程中产生的噪声干扰或由于牛初乳非均质特性的散射影响,提高模型预测性能,结合牛初乳非均质的特点,采用了噪声消除类方法—Savitzky-Golay平滑、二阶导数及其组合方法和散射消除类方法—标准正态变量变换、多元散射校正及其组合方法两类预处理方法。同时,对比分析Savitzky-Golay平滑与标准正态变量变换组合预处理对识别效果的影响。

其中,Savitzky-Golay平滑为Savitzky-Golay,二阶导数为second derivative,标准正态变量变换为standard normal variate,多元散射校正为multiplicativescatter correction。Savitzky-Golay平滑和二阶导数预处理可以减少由于电信号干扰等引起的随机噪声,提高信噪比。标准正态变量变换和多元散射校正预处理可以消除由于样品颗粒分布不均匀及颗粒大小不同产生的散射对谱线的影响。

利用经典样本划分方法Kennard-Stone法将样本按照3:1的比例划将预处理后的牛初乳及各个比例下掺杂牛初乳划分为校正集和测试集。

步骤四:基于不同介电谱预处理下,对比偏最小二乘判别分析与支持向量机模型识别牛初乳及掺杂牛初乳的准确率,优选出Savitzky-Golay平滑与二阶导数组合的介电谱预处理方法。表3列出了154个样本介电谱数据分别经噪声消除类预处理—Savitzky-Golay平滑、二阶导数及其组合,以及散射消除类方法—标准正态变量变换、多元散射校正及其组合及Savitzky-Golay平滑与标准正态变量变换组合7种预处理后线性偏最小二乘判别分析和非线性支持向量机模型模型的识别结果,同时列出未经介电谱预处理的预测结果作为对照。由表3可知,当样本划分比例为3:1,基于噪声消除类方法的Savitzky-Golay平滑、二阶导数及Savitzky-Golay平滑与二阶导数组合三种预处理对模型精度提高效果优于基于散射消除类方法的标准正态变量变换、多元散射校正及标准正态变量变换和多元散射校正组合预处理,且均提高了线性偏最小二乘判别分析和非线性支持向量机两类模型的识别准确率,这表明牛初乳非均质特性对介电谱法预测不利影响的主要影响为噪声、基线漂移等,而非由于非均质特性引起的散射效应。这一现象在非线性支持向量机模型中表现尤为突出。此外,噪声消除类方法与散射消除类方法的组合预处理—Savitzky-Golay平滑与标准正态变量变换效果优于标准正态变量变换,进一步表明介电谱中消除噪声干扰可以提高模型预测性能。同时,由表3可知,预处理方法为Savitzky-Golay平滑与二阶导数组合时偏最小二乘判别分析模型测试集准确率最高,达97.37%。因此优选Savitzky-Golay平滑与二阶导数组合的介电谱预处理方法。

表3 不同组合方法下两种模型的准确率

表3中符号说明:

Untreated表示介电谱未经预处理;S-G表示Savitzky-Golay平滑预处理;SD表示二阶导数预处理;S-G+SD表示Savitzky-Golay平滑与二阶导数组合预处理;SNV表示标准正态变量变换预处理;MSC表示多元散射校正预处理;SNV+MSC表示标准正态变量变换与多元散射校正组合预处理;S-G+SNV表示Savitzky-Golay平滑与标准正态变量变换组合预处理。

图4是优选的噪声消除类方法对样品介电谱预处理的结果图,即Savitzky-Golay平滑、二阶导数及Savitzky-Golay平滑与二阶导数组合预处理后的样品ε′ε"曲线。图4(a)表明Savitzky-Golay平滑去除了原始介电谱中存在的噪声影响,得到更加光滑平稳介电谱曲线;图4(b)二阶导数处理后的介电谱特征更加明显,同时去除了原始介电谱中噪声和基线漂移等干扰。图4(c)中Savitzky-Golay平滑与二阶导数具有很好的互补性,两者组合处理既减小了原始介电谱中的噪声干扰,又凸显了介电谱中的成分差异信息,增强介电谱信噪比。

图4中符号说明:S-G表示Savitzky-Golay平滑;SD表示二阶导数;S-G+SD表示Savitzky-Golay平滑与二阶导数组合。

步骤五:以优选的Savitzky-Golay平滑与二阶导数组合预处理方法处理原始介电谱数据,结合牛初乳及掺杂牛初乳介电谱特点,以全谱和经主成分分析降维提取后的介电谱数据作为输入,建立偏最小二乘判别分析和线性判别分析两种线性模型以及支持向量机和多层感知机两种非线性模型,以确定定性识别牛初乳和掺杂牛初乳的最佳模型。其中,偏最小二乘判别分析为partial least squares discriminant analysis,是一种基于偏最小二乘回归的判别分析方法。线性判别分析为linear discriminant analysis,原理是通过寻找分类的有效投影方向,使得投影后两类样本之间的距离尽可能大。支持向量机为support vector machine,是一种基于风险最小化思想的分类方法,其原理是建立一个最优的分类超平面,使不同样本之间空白区域最大化。多层感知机为multilayerperceptron,是一种前馈人工神经网络模型,其将输入的多个数据集映射到单一的输出的数据集上。对掺杂牛初乳定性识别结果如表4所示。

以灵敏度、特异性和准确率综合评价线性和非线性模型的识别性能。灵敏度指牛初乳样品被正确判别为牛初乳样品的比例,%;特异性指掺杂牛初乳样品被正确判别为掺杂牛初乳样品的比例,%;准确率为牛初乳和掺杂牛初乳样品被正确判别的比例,%。

通过比较线性和非线性模型掺杂牛初乳定性识别准确率,可以发现,基于全频率建立线性及非线性模型识别准确率均高于基于principal component analysis,即主成分分析提取主成分建立的模型准确率,这表明主成分分析提取主成分过程中去掉了与牛初乳样品信息相关的变量,而全谱数据经Savitzky-Golay平滑与二阶导数预处理去掉了噪声干扰、基线漂移等,因此取得较好的识别效果。基于全谱的线性模型测试集识别准确率均为97.37%,高于基于全谱的非线性模型的94.74%。这表明线性模型更有利于掺杂牛初乳的识别。其中,基于全谱的线性判别分析模型具有最好的识别性能,其校正集和测试集准确率分别为99.14%和97.37%。因此,针对本实施例,定性识别掺杂牛初乳的最佳模型为基于全谱的线性判别分析模型。结果表明,合理选择介电谱预处理方法及模型对提高本发明一种基于介电谱技术识别掺杂牛初乳模型精度具有重要意义。

表4 线性和非线性模型对掺杂牛初乳定性判别结果

表4中符号说明:PLS-DA、LDA、SVM及MLP分别表示偏最小二乘判别分析、线性判别分析、支持向量机和多层感知机模型;FS表示全谱,PCA表示经主成分分析从全谱中提取特征波长。

步骤六:对于不同来源的未知牛初乳样品,按照步骤二完成介电谱的采集,将采集的未知牛初乳样品介电谱数据经步骤四确定的Savitzky-Golay平滑与二阶导数组合预处理后,代入步骤五确定的线性判别分析模型中,对该样品快速准确识别。

本实施例中用于模型验证的未知样本有44个,其中牛初乳14个,掺杂牛初乳30个,用来进一步验证所建立基于介电谱技术识别掺杂牛初乳模型的性能。图5是基于介电谱技术建立的最优模型对未知牛乳样品的识别结果。所建立的线性判别模型对未知样本中样品灵敏度、特异性和识别准确率分别为85.71%、96.67%和93.18%,表明该方法对不同来源的牛乳样品具有良好的识别性能和适用性。所建立的模型对未知样本的识别准确率低于对建模所用样本的识别准确率,这主要是因为样品来源和采集时间不同。

由以上实施例可以看出,本发明利用介电谱技术可以快速、准确的对掺杂牛初乳进行定性识别。

要说明的是,以上内容仅用以说明本发明的一种技术方案,而非对本发明保护范围的限制,本领域的技术人员对本发明的技术方案进行的简单修改或者等同替换均不超过本发明所述的范围。

12页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种用于电化学传感器中的电极的制备方法及应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类