一种有效提升酒糟样品预测准确率的方法

文档序号:1906630 发布日期:2021-11-30 浏览:26次 >En<

阅读说明:本技术 一种有效提升酒糟样品预测准确率的方法 (Method for effectively improving prediction accuracy of vinasse sample ) 是由 刘浩 闫晓剑 赵浩宇 王毅 李光尧 于 2021-09-02 设计创作,主要内容包括:本发明公开了一种有效提升酒糟样品预测准确率的方法,该方法首先采集水分含量已知酒糟样品的光谱数据,记录为原始样本,然后将酒糟样品的水分含量参比值划分为均匀分布的区间,并计算每个区间的样本上限,接着,随机剔除超过区间样本上限的样本,得到上限均匀样本,加权填补未超过区间样本上限的样本,得到下限均匀样本。最后,整合均匀样本,并进行光谱建模,再使用该模型对未知水分含量的酒糟样品进行预测并与原始样本建模预测结果做对比。该方法可以有效解决酒糟样品分布不均匀造成的光谱模型权重偏移的问题,进而可以有效提升酒糟样品的预测准确率。(The invention discloses a method for effectively improving the prediction accuracy of a vinasse sample, which comprises the steps of firstly collecting spectral data of the vinasse sample with known moisture content, recording the spectral data as an original sample, then dividing a reference value of the moisture content of the vinasse sample into uniformly distributed intervals, calculating the upper limit of the sample of each interval, then randomly eliminating the samples exceeding the upper limit of the samples of the intervals to obtain uniform samples of the upper limit, weighting and filling the samples not exceeding the upper limit of the samples of the intervals to obtain uniform samples of the lower limit. And finally, integrating the uniform samples, carrying out spectrum modeling, predicting the vinasse sample with unknown water content by using the model, and comparing the prediction result with the original sample modeling prediction result. The method can effectively solve the problem of spectrum model weight deviation caused by uneven distribution of the vinasse sample, and further can effectively improve the prediction accuracy of the vinasse sample.)

一种有效提升酒糟样品预测准确率的方法

技术领域

本发明涉及光谱预测技术领域,尤其涉及一种有效提升酒糟样品预测准确率的方法。

背景技术

酒糟是酿酒环节的必要产物,酒糟类物质主要是由谷物发酵而成,成分含有大量含氢基团,包含C-H、S-H、O-H和N-H等,在酒糟的发酵过程中,酒糟中水分、淀粉、酸度和糖等物质成分的含量将直接影响酒品质量,是衡量酒糟是否适宜及酒糟发酵过程是否正常的主要依据。然而酒糟是一种固液混合物,颗粒大小不一,组分分布不均,挥发十分严重,给成分分析造成了极大的困扰。

近年来,酒厂开始使用大型近红外光谱仪检测酒糟主要成分,该方法虽然定量准确灵敏度高,但该类设备体积庞大,对环境条件要求很高,仍需要专门的检测室和专业分析人员,酿酒工人无法现场检测,实时性较差。同时,由于大型近红外光谱仪价格昂贵,酒厂无法大量配置,难以对每口窖池、每批样品都进行检测,与酒厂的实际需要仍有很大差距。

便携式近红外光谱仪体积小巧,价格低廉,可以大量购置以实现每批酒糟的检测。但是便携式近红外光谱仪受光源、检测器、使用方法、环境条件等影响,精度、灵敏度、稳定性、重现性、波长范围、分辨率等指标都有明显的性能降低,直接延用大型近红外设备的光谱建模方法则会出现预测准确率低问题,如何能够有效提高便携式近红外设备对酒糟样品的预测准确率成为了一个必须解决的问题。

目前,市场上出现了部分样本加权、均匀化的数据分析处理方法,但这些方法均运用于普通的统计分析,针对酒糟样品的组分分析,这些方法并不适用,无法达到良好的效果。

发明内容

本发明的目的在于克服现有技术中存在的不足,提供一种有效提升酒糟样品预测准确率的方法。该方法首先采集水分含量已知酒糟样品的光谱数据,记录为原始样本,然后将酒糟样品的水分含量参比值划分为均匀分布的区间,并计算每个区间的样本上限,接着,随机剔除超过区间样本上限的样本,得到上限均匀样本,加权填补未超过区间样本上限的样本,得到下限均匀样本。最后,整合均匀样本,并进行光谱建模,再使用该模型对未知水分含量的酒糟样品进行预测并与原始样本建模预测结果做对比。该方法可以有效解决酒糟样品分布不均匀造成的光谱模型权重偏移的问题,进而可以有效提升酒糟样品的预测准确率。

为了实现上述目的,本发明采用的技术方案是:一种有效提升酒糟样品预测准确率的方法,包括如下步骤:

一种有效提升酒糟样品预测准确率的方法,包括如下步骤:

a.采集水分含量已知酒糟样品的光谱数据,记录为原始样本;

b.将酒糟样品的水分含量参比值划分为均匀分布的区间,并计算每个区间的样本上限;

c.随机剔除超过区间样本上限的样本,得到上限均匀样本;

d.加权填补未超过区间样本上限的样本,得到下限均匀样本;

e.整合均匀样本,并进行光谱建模,再使用该模型对未知水分含量的酒糟样品进行预测并与原始样本建模预测结果做对比。

进一步的技术方案为,步骤a中所述采集水分含量已知酒糟样品的光谱数据,记录为原始样本,选择具有代表性的酒糟样本组成建模样品集,并用经典化学分析方法测定酒糟样品水分含量,再用规范的方法使用便携式近红外光谱仪对这些酒糟样品进行光谱数据采集,将这些酒糟样品记录为原始样本。

进一步的技术方案为,步骤b具体为查找所有原始酒糟样本中的水分含量值,其中水分含量最高的值为Max,最低的值为Min,设定划分的区间数目为k,该区间数目根据酒糟样品总数X及预测误差范围w决定,区间数目k的计算公式如下:

每个区间的水分含量值范围b为:

进一步结合酒糟区间数目k及样品总数X可以计算出每个区间的样本上限T为:

进一步的技术方案为,步骤c中将原始酒糟样品的水分含量参比值划分为均匀分布的区间,从小到大的区间范围分别为[(Min,Min+b),(Min+b,Min+2b),(Min+2b,Min+3b)......(Min+k-1b,Max)],将原始酒糟样品的水分参比值对应放入各个区间范围,将超过样本上限T的区间进行酒糟样本的随机删除,直至该区间的最终样本数为T,经过随机剔除之后的酒糟样本定义为上限均匀样本。

进一步的技术方案为,步骤d具体为对酒糟样品中未能达到样本上限T的区间进行加权填补,对于未能达到区间样本上限T的区间,假定该区间中有m个样本,重复n次使用区间内的样本,那么重复使用的次数n=T/m,并向下取整。此时仍有未能达到区间样本上限的情况,缺失的个数r为r=T-n*m,缺失个数通过当前区间样本数m中随机选取r个样本得到,将经过加权填补之后的酒糟样本定义为下限均匀样本。

进一步的技术方案为,步骤e具体为对上限均匀样本各个区间中未能达到区间样本上限T的区间进行区间样本删除操作,对下限均匀样本中各个区间中超出区间样本上限T的区间进行区间样本删除操作,将进行过删除操作后的上限均匀样本及下限均匀样本进行整理合并,得到酒糟样品均匀样本;使用样品均匀样本进行光谱建模,再使用该光谱模型对未知水分含量的酒糟样品进行预测,预测完成后,对未知水分含量的酒糟样品进行化学分析方法测定其水分参比值,在误差范围w内,如果参比值与预测值的差值绝对值小于w,则说明预测准确,如果参比值与预测值的差值绝对值大于w,则说明预测错误,最后将预测准确的数目除以样品总数即可获得预测准确率;对于原始样本,采用同样的建模方式对原始样本进行光谱建模,并使用原始模型对同样未知水分含量的酒糟样品进行预测,同时在相同的误差范围w内判断预测准确率;对比均匀样本的预测准确率以及原始样本的预测准确率,判断酒糟样品预测准确率是否得到有效提升。

与现有技术相比,本发明具有如下有益效果:本发明提出的针对酒糟样品的处理方法,不仅能良好的契合样品特点,同时,结合酒糟样品的误差范围、样本数目、组分含量值,分析出最优样本区间,并结合最优样本区间,组分含量标定值对酒糟样本进行均匀化处理,有效的提升酒糟预测的准确率,是其他数据分析方法所不能达到的。

附图说明

图1是本发明有效提升酒糟样品预测准确率的方法的示意图。

具体实施方式

下面结合附图和具体的实施方式对本发明作进一步详细的描述。

图1中101是采集水分含量已知酒糟样品的光谱数据,记录为原始样本。选择具有代表性的酒糟样本组成建模样品集,并用经典化学分析方法测定酒糟样品水分含量,再用规范的方法使用便携式近红外光谱仪对这些酒糟样品进行光谱数据采集,将这些酒糟样品记录为原始样本。

在本实施例中,选择具有代表性的X个酒糟样本组成建模样品集,并使用经典化学分析方法测定该批次酒糟样品的水分含量,测定完毕后,使用便携式近红外光谱仪对这些酒糟样品进行光谱数据采集,并将各个样品光谱数据与其水分含量做一一对应,采集过程中,每一个样品对应采集三条光谱数据,并将三条光谱数据做均值运算,均值后的数据为该样品的实际光谱数据,这样的好处在于可以有效减少采集误差,增加数据的可靠性。

图1中102是将酒糟样品的水分含量参比值划分为均匀分布的区间,并计算每个区间的样本上限。查找酒糟样品水分含量参比值的最大值及最小值,并计算出其差值,结合该差值划分均匀分布的区间,并结合区间数及样本个数计算出每个区间的样本上限。

在本实施例中,查找所有原始酒糟样本中的水分含量值,其中水分含量最高的值为Max,最低的值为Min,设定划分的区间数目为k,该区间数目根据酒糟样品总数X及预测误差范围w决定,区间数目k的计算公式如下:

每个区间的水分含量值范围b为:

进一步结合酒糟区间数目k及样品总数X可以计算出每个区间的样本上限T为:

图1中103是随机剔除超过区间样本上限的样本,得到上限均匀样本。将每个区间的样本个数与样本上限数做对比,超过样本上限数的区间做上限均匀样本处理,具体方式为在超出的区间中随机剔除超过区间样本上限的样本数。

在本实施例中,步骤102中将原始酒糟样品的水分含量参比值划分为均匀分布的区间,从小到大的区间范围分别为[(Min,Min+b),(Min+b,Min+2b),(Min+2b,Min+3b)......(Min+k-1b,Max)],将原始酒糟样品的水分参比值对应放入各个区间范围,将超过样本上限T的区间进行酒糟样本的随机删除,直至该区间的最终样本数为T,经过随机剔除之后的酒糟样本定义为上限均匀样本。

图1中104是所述加权填补未超过区间样本上限的样本,得到下限均匀样本。将每个区间的样本个数与样本上限数对比,未超过样本上限数的区间做下限均匀样本处理,具体方式为通过加权及随机挑选的形式对未超过样本上限的区间进行样本填补。

在本实施例中,利用加权的思想重复多次使用已知样本,使得每个区间内的样本数量等于区间样本数上限T。具体的实施方式为对酒糟样品中未能达到样本上限T的区间进行加权填补,对于未能达到区间样本上限T的区间,假定该区间中有m个样本,重复n次使用区间内的样本,那么重复使用的次数n=T/m,并向下取整。此时仍有未能达到区间样本上限的情况,缺失的个数r为r=T-n*m,缺失个数通过当前区间样本数m中随机选取r个样本得到,将经过加权填补之后的酒糟样本定义为下限均匀样本。

图1中105是整合均匀样本,并进行光谱建模,再使用该模型对未知水分含量的酒糟样品进行预测并与原始样本建模预测结果做对比。将上限均匀样本与下限均匀样本进行数据整合,并在完成整合后对该数据进行光谱建模,并使用得到的模型对未知水分含量的酒糟样品进行预测,在一定误差范围内判断预测准确率。同时采用相同的建模方式对原始样本进行光谱建模,并使用原始模型对未知水分含量的酒糟样品进行预测,同时在相同的误差范围内判断预测准确率,对比两者预测准确率的情况,进而判断酒糟样品预测准确率是否得到有效提升。

在本实施例中,整合均匀样本的具体实施方式为:对上限均匀样本各个区间中未能达到区间样本上限T的区间进行区间样本删除操作,对下限均匀样本中各个区间中超出区间样本上限T的区间进行区间样本删除操作,将进行过删除操作后的上限均匀样本及下限均匀样本进行整理合并,得到酒糟样品均匀样本。光谱预测的具体实施方式为:对于均匀样本,使用该样本进行光谱建模,再使用该光谱模型对未知水分含量的酒糟样品进行预测,预测完成后,对未知水分含量的酒糟样品进行化学分析方法测定其水分参比值,在一定的误差范围w内,如果参比值与预测值的差值绝对值小于w,则说明预测准确,如果参比值与预测值的差值绝对值大于w,则说明预测错误,最后将预测准确的数目除以样品总数即可获得预测准确率。对于原始样本,采用同样的建模方式对原始样本进行光谱建模,并使用原始模型对同样未知水分含量的酒糟样品进行预测,同时在相同的误差范围w内判断预测准确率。对比均匀样本的预测准确率以及原始样本的预测准确率,可以直观的观察出均匀样本预测准确率在原始样本的基础上有明显的提升。

尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于Surrogate的氢能系统碱性电解槽的安全故障预测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!