一种烤烟烟丝的产地及等级识别方法

文档序号:1576338 发布日期:2020-01-31 浏览:20次 >En<

阅读说明:本技术 一种烤烟烟丝的产地及等级识别方法 (Method for identifying producing area and grade of flue-cured tobacco shreds ) 是由 毕一鸣 廖付 张立立 何文苗 李永生 帖金鑫 李石头 田雨农 郝贤伟 赵振杰 许 于 2019-10-16 设计创作,主要内容包括:本发明提供一种烤烟烟丝产地及等级识别方法,该方法包括如下步骤:步骤1)获取多个烟叶(烟丝)样本的表征指标,所述的表征指标包括化学指标、香型指标与部位特征;步骤2)获取步骤1)中多个烟叶(烟丝)样本的近红外光谱,利用偏最小二乘方法分别对步骤1)获得的表征指标、步骤2)获得的近红外光谱进行关联,建立模型;步骤3)将全国各产地、各等级烟叶样本的历史近红外光谱应用到步骤2)所述的模型中,得到全国各产地、各等级烟叶样本的模型计算值;统计各产地、等级的各模型阈值范围,建立匹配矩阵;步骤4)获取未知样本的近红外光谱,通过步骤2)模型预测出表征指标后,结合步骤3)的匹配矩阵,预测其产地及等级。(The invention provides a method for identifying the producing areas and the grades of flue-cured tobacco shreds, which comprises the following steps of 1) obtaining characterization indexes of a plurality of tobacco leaf (shred) samples, wherein the characterization indexes comprise chemical indexes, odor indexes and position characteristics, 2) obtaining near infrared spectrums of the tobacco leaf (shred) samples in the step 1), respectively correlating the characterization indexes obtained in the step 1) and the near infrared spectrums obtained in the step 2) by using a partial least square method, establishing a model, 3) applying historical near infrared spectrums of tobacco leaf samples in all producing areas and all grades in the country to the model in the step 2) to obtain model calculation values of the tobacco leaf samples in all producing areas and all grades in the country, counting threshold value ranges of the models in all producing areas and grades, establishing a matching matrix, 4) obtaining the near infrared spectrums of unknown samples, and predicting the representing indexes through the model in the step 2) and then combining the matching matrix in the step 3) to predict the producing areas and the grades.)

一种烤烟烟丝的产地及等级识别方法

技术领域

本发明属于烤烟烟丝属性识别与产地鉴别领域,具体涉及一种基于近红外光谱的烤烟产 地与等级的鉴别方法。

背景技术

在市售商品中,烟草主要以烟丝形式存在,无法从外观对其产地,等级等进行鉴别。作 为一种农产品,目前尚无有力的分析手段,快速识别烟叶的等级、产地等,仅能依靠感官评 吸进行有限的判断。在鉴别违法烟叶等实际需求中缺乏客观的识别方法。

近红外光谱分析技术是一种快速、准确和无损的检测技术。近红外光谱主要是对含氢基 团振动的倍频和合频吸收,其中包含了大多数类型有机化合物的组成信息,与烟叶化学成分 关联的信息非常丰富,有利于通过光谱反映烟叶信息及溯源。

王胜鹏等公开一种近红外光谱快速判定茶鲜叶产地的方法,应用近红外光谱仪,扫描获得 不同产地鲜叶样品近红外光谱,然后对鲜叶样品光谱进行主成分分析,再以主成分为输入值 建立多种信息传递方式的鲜叶产地人工神经网络预测模型,对茶叶是否是恩施玉露茶进行了 判别。

蔡逢煌等公开了一种近红外光谱快速检测三叶青产地方法,对五个产地的三叶青进行了 鉴别。

施丰成等利用基于近红外光谱的PLS-DA算法判别烟叶产地,对四川、云南、重庆、福 建4个产区单料烟分别建立产地判别模型,对各个产区内验证集样本预测精度大于93%。王 -丁等对烤烟全波段光谱特征信息进行预处理,建立的烤烟香型风格PLS-DA定性判别模型, 识别正确率达100%;

Y.Zhang,Duan J,X.Liu等分别提出了利用近红外光谱对烟叶化学成分进行建模的方法。

Ni,Hana,Shao,Tan等分别提出利用近红外光谱对烟叶或卷烟进行属性或品牌分类的方 法。

上述技术主要针对特定农产品的部分产地或其他属性,利用近红外光谱及模式识别方法 进行建模。上述方法中仅提供3、4个产地的识别,在实际需求中,涉及十几个烟草种植省份, 多个烟叶等级。上述方法中基于近红外光谱直接建模,无法应对这种十类以上的分类问题。 且上述报道中所用的研究样本量较少,模型结果的推广性较低。

参考文献:

施丰成,李东亮,冯广林,等.基于近红外光谱的PLS-DA算法判别烤烟烟叶产地[J].烟草 科技,2013(4).

王一丁,赵铭钦,付博,等.利用可见-近红外光谱鉴定不同香型风格烤烟的方法[J].中国 烟草科学,2015(6).

王胜鹏等一种近红外光谱快速判定茶鲜叶产地的方法申请号:201610930724.5

蔡逢煌等一种近红外光谱快速检测三叶青产地方法申请号:201710371389.4

Y.Zhang,Q.Cong,Y.Xie,J.Yang,B.Zhao,Quantitative analysis of routinechemical constituents in tobacco by near-infrared spectroscopy and supportvector machine,Spectrochim. Acta A 71(2008)1408-1413.

Duan J,Huang Y,LiZ,et al.Determination of 27 chemical constituents inChinese southwest tobacco by FT-NIR spectroscopy[J].Industrial Crops andProducts,2012,40(none):21-26.

X.Liu,H.-C.Chen,T.-A.Liu,Y.-L.Li,Z.-R.Lu,W.-C.Lu,Application of PCA-SVR to NIR prediction model for tobacco chemical composition,Spectrosc.Spectral Anal.27(2007)2460-2463.

L.-J.Ni,L.-G.Zhang,J.Xie,J.-Q.Luo,Pattern recognition of Chineseflue-cured tobaccos by an improved and simplified K-nearest neighborsclassification algorithm on near infrared spectra. Anal.Chim.Acta 633(2009)43-50.

M.Hana,W.F.McClure,T.B.Whitaker,M.W.White,D.R.Bahler,Applyingartificial neural networks:Part II.Using near infrared data to classifytobacco types and identify native grown tobacco,J.Near Infrared Spectrosc.5(1997)19-25.

Y.Shao,Y.He,Y.Wang,A new approach to discriminate varieties oftobacco using vis/near infrared spectra,Eur.Food Res.Technol.224(2007)591-596.

C.Tan,M.Li,X.Qin,Study of the feasibility of distinguishingcigarettes of different brands using an Adaboost algorithm and near-infraredspectroscopy,Anal.Bioanal.Chem.389(2007) 667-674.

发明内容

针对上述问题,本发明提供一种基于近红外光谱烤烟烟丝产地及等级识别方法,该方法 包括如下步骤:步骤1)获取多个烟叶(烟丝)样本的表征指标,所述的表征指标包括化学指 标、香型指标与部位特征;所述化学指标至少包括总糖含量、烟碱含量、还原糖含量、氯含 量、钾含量、总氮含量;所述的香型指标至少包括清香指数,中间香指数与浓香指数;部位 特征选自上部叶、中部叶或下部叶;

步骤2)获取步骤1)中多个烟叶(烟丝)样本的近红外光谱,利用偏最小二乘方法分别 对步骤1)获得的表征指标、步骤2)获得的近红外光谱进行关联,建立模型;

步骤3)将全国各产地、各等级烟叶样本的历史近红外光谱应用到步骤2)所述的模型中, 得到全国各产地、各等级烟叶样本的模型计算值;统计各产地、等级的各模型阈值范围,建 立匹配矩阵;

步骤4)获取未知样本的近红外光谱,通过步骤2)模型预测出表征指标后,结合步骤3) 的匹配矩阵,预测其产地及等级。

作为优选,步骤1)中的建模样本涵盖全国主要的烤烟产地及等级,样本数量不少于500 个;优选地,烤烟产地及等级涵盖全国14个烤烟产区:安徽、重庆、福建、广西、贵州、湖 南、湖北、河南、四川、山东、云南、江西、黑龙江、辽宁,9个主要等级:B3F、B2F、B1F、 C1F、C2F、C3F、C4F、X2F、X3F。

作为优选,本发明涉及的香型模型,仅用云南、贵州、湖北和湖南样本建模,其中,云 南为清香型,标记为[1 0 0],贵州和湖北标记为中间香型,标记为[0 1 0],湖南为浓香型,标 记为[0 0 1];具体地,步骤1)中香型指标,清香型标记为[1 0 0],中间香型标记为[0 1 0],浓 香型标记为[0 0 1];步骤1)中的部位特征,上部叶:1;中部叶:2;下部叶:3。

作为优选,步骤(1)中的化学模型,参考值总糖、烟碱、还原糖、氯、钾、总氮为流动分析仪测得。

作为优选,步骤2)中将采集到的近红外光谱并进行光谱预处理;优选地,所述预处理方 法包括平滑,1阶导,2阶导或标准正态校正;更优选地,采用1阶导+标准正态校正。

作为优选,步骤2)化学指标与部位特征采用PLS1,每个指标单独建模;香型指标采用 PLS2,三个指标一起建模。

作为优选,步骤3)中,按产地、等级统计,计算各模型(化学、香型等)表征指标的均值及标偏;以均值±一倍的标偏为阈值范围,即

其中mi,si分别表示某产地某等级的第i指标的均值与标准偏差;yi为待测样品的第i指 标模型预测值,ki为计数值,如在阈值条件范围内计数为1,否则计数为0;

统计历史烟叶样本数据中的产地和等级,生成匹配矩阵,该矩阵的行列数分别为历史数 据中的产区数和等级数;矩阵中的每一个元素由公式(1)计算得出。

作为优选,所述步骤4)中,将未知样本预测的表征指标与步骤3)得到的匹配矩阵相比 较,若化学、香型、部位三者都符合的产地和等级,认定为未知样本所属的产地和等级;若 有某一项或多项超出阈值,则未知样本不在现有建模的产区和等级内,实施投票算法,该算 法具体包括如下步骤:

Figure BDA0002236187280000032

K代表10项指标的综合匹配度;K的最大值为10,代表某样本所有10项指标均落入某 产区某等级的阈值范围内;K的最小值为0,代表某样本所有10项指标均未落入某产区某等 级的阈值范围内;

根据将未知样本的预测指标应用到计算历史数据库中所有产区及等级的K值,将K值最 大值所代表的产区和等级认定为该未知样本的产区和等级;

计算历史数据库中所有产区及等级的K值,将K值最大值所代表的产区和等级认定为该 未知样本的产区和等级。

本发明提供的方法对未知样本在化学、香型、部位三个属性利用步骤(2)中的模型进行 预测,称之为原烟侧写;统计历史数据中的产地和等级,生成匹配矩阵,该矩阵的行列数分 别为历史数据中的产区数和等级数。矩阵中的每一个元素由公式(1)计算得出。侧写结果结 合匹配矩阵进行投票,其中,化学计算为6项指标符合阈值最多产地、等级。化学、香型、部 位三者都符合的产地和等级,认定为未知样本所属的产地和等级。如果有某一项或多项超出 阈值,则未知样本不在现有建模的产区和等级内。

与现有技术相比,本发明具有以下几个优点:

1.本方法可判定烟丝产区及等级,不借助于外观及感官评价。

2.基于近红外光谱,结合化学、部位、香型多个个指标判定未知样本的产地等级,现有的 识别方法均使用单一指标判定。

3.本方法可以同时判定产区和等级。

4.本方法可判定14个省市9个等级的样本属性,较其他报道方法更全面具体。

5.本发明提供的产地及登记识别方法稳定可靠。

附图说明

图1为部位模型的训练数据及建模结果;

图2为本发明提供的识别方法的实施流程图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,本发明的保护范围不受实 施例的限制,本发明的保护范围由权利要求书决定。基于本发明中的实施例,本领域普通技 术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

一种基于近红外光谱烤烟烟丝产地及等级识别方法,包括如下步骤:

(1)选取某企业烤烟样本1282个;取样后将样本按照烟草行业标准《YC/T 31-1996烟草 及烟草制品试样的制备和水分测定烘箱法》制备成粉末样本(将烟叶置于烘箱中,40℃下干 燥4h,用旋风磨(FOSS)磨碎过40目筛),密封平衡1d后进行光谱测量;

(2)对步骤(1)中的获取光谱进行平滑及求取一阶导数处理;

(3)利用453个带有流动检测数据的样本进行化学建模;建模方法为偏最小二乘,模型 的潜变量数、建模结果(RMSEC)和交叉验证结果(RMSECV)见下表1;

根均方误差的计算公式为:

ypre是模型预测值,yref流动检测值,N是样本数量;RMSEC由建模样本计算获得,RMSECV由交叉验证样本计算获得。

表1化学值模型建模结果

成分 范围(%) 均值(%) 潜变量数 RMSEC R<sup>2</sup> RMSECV RMSEP
总糖 15.62-43.12 29.46 20 0.51 0.99 0.66 0.50
烟碱 0.63-4.52 2.47 20 0.07 0.99 0.10 0.08
还原糖 14.21-35.69 25.36 13 0.63 0.98 0.80 0.92
0.05-2.91 0.38 14 0.05 0.97 0.08 0.05
0.83-4.94 2.09 21 0.15 0.94 0.26 0.46
总氮 1.35-2.89 1.98 12 0.09 0.90 0.13 0.07

(4)以546个样本进行部位建模,标签由部位指定。其中B1F、B2F、B3F为上部,标记为1;C1F、C2F、C3F、C4F为中部,标记为2;X2F、X3F为下部,标记为3;建模方法为偏 最小二乘,建模样本的标记值与预测值见图1;以1.5和2.5作为区分上中,中下的阈值,样 本训练精度为78.9%,与经验中人工判别80%的正确率接近。

(5)以295个样本进行香型建模,其中,清香型样本106个,中间香型样本93个,浓香型样本96个;建模方法为偏最小二乘判别分析,建模准确率为93.2%;

(6)对于一待测未知样本,通过计算化学(6项),香型(3项)和部位(1项)预测结果,与数据库中的各省份各等级样本分布进行对比,如某指标落入均值+-标偏为阈值范围,则计 分1,否则计分0;统计所有数据后,生成该样本的分布计分图,表2给出某一预测样本(样本取自四川德昌的统计计分图。

表2预测样本的计分图。

B3F B2F B1F C1F C2F C3F C4F X2F X3F
安徽 0 0 0 0 0 1 2 5 0
重庆 0 3 2 0 0 6 0 3 0
福建 0 0 1 0 2 3 2 4 2
广西 0 1 0 0 2 0 3 4 0
贵州 0 3 2 0 4 2 3 7 0
湖南 0 0 1 0 1 0 1 4 0
湖北 0 3 2 0 2 1 1 5 0
河南 0 3 2 0 3 4 0 5 0
四川 0 3 3 0 8 9 7 9 0
山东 0 1 1 0 1 0 0 0 0
云南 0 1 1 0 4 3 5 7 0
江西 0 0 0 0 0 0 3 0 0
陕西 0 0 0 0 0 0 0 0 0
黑龙江 0 0 0 0 0 0 0 0 0
辽宁 0 0 0 0 0 3 0 0 0
山西 0 0 0 0 0 0 0 0 0

表2中加粗数值为计分最大值,其行列代表该样本最可能的产地和等级。

(7)为验证方法的有效性,另取20个样本做验证。样本信息及模型预测结果见表3。由表3 看出,在所有样本中,预测结果都涵盖了验证样本的原产地-四川。其中,对于满分样本(计 分为10分),预测模型给出的产地与样本来源一致。其等级也基本涵盖在预测结果之内。

表3 20个验证样本信息及预测结果

编号 省份 地市 等级 年份 得分 预测1 预测2 预测3
1 四川 德昌 C2FA1 2018 9 四川 C3F 四川 X2F
2 四川 德昌 C2FC3 2018 7 四川 X2F
3 四川 德昌 C3FA1 2018 9 四川 C3F 四川 X2F
4 四川 会东 C2FA1 2018 10 四川 C2F 四川 X2F
5 四川 会东 C2FC3 2018 7 四川 C3F 四川 X2F 云南 X2F
6 四川 会东 C3FA1 2018 10 四川 C3F 四川 C4F
7 四川 会理 C2FA1 2018 10 四川 C4F 四川 X2F
8 四川 会理 C2FC3 2018 9 四川 X2F
9 四川 会理 C3FAl 2018 10 四川 C3F 四川 C4F 四川 X2F
10 四川 盐源 C2FA1 2018 10 四川 C2F
11 四川 盐源 C2FC3 2018 9 四川 C3F 四川 X2F 云南 X2F
12 四川 盐源 C3FA1 2018 10 四川 X2F
13 四川 宁南 C2FA1 2018 9 四川 C2F 四川 C3F
14 四川 宁南 C2FC3 2018 10 四川 C2F 四川 C3F
15 四川 宁南 C3FA1 2018 9 四川 C2F 四川 C3F
16 四川 普格 C2FA1 2018 10 四川 C2F
17 四川 普格 C2FC3 2018 9 四川 C3F
18 四川 普格 C3FA1 2018 9 四川 C2F
19 四川 攀枝花 C2FA1 2018 9 四川 C2F 四川 C3F
20 四川 攀枝花 C2FC3 2018 9 四川 C3F 云南 C4F

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于TDLAS直接吸收光谱的气体浓度标定及测量方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!