商品的编码方法、电子设备及计算机可读存储介质

文档序号:1953398 发布日期:2021-12-10 浏览:11次 >En<

阅读说明:本技术 商品的编码方法、电子设备及计算机可读存储介质 (Commodity encoding method, electronic device and computer-readable storage medium ) 是由 何浩 刘佳伟 黄小明 于 2021-09-03 设计创作,主要内容包括:本申请涉及海关商品编码技术领域,公开了商品的编码方法、电子设备及计算机可读存储介质。该方法包括:获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码。通过上述方式,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。(The application relates to the technical field of customs commodity coding, and discloses a commodity coding method, electronic equipment and a computer readable storage medium. The method comprises the following steps: acquiring data information of commodities to be classified; acquiring at least one piece of key information from the data information; determining a plurality of reference commodity codes for each key information; and determining a target commodity code of the commodity to be classified from the plurality of reference commodity codes. By the aid of the method, customs commodity codes can be automatically recommended to commodities to be classified, user operation is reduced, and working efficiency is improved.)

商品的编码方法、电子设备及计算机可读存储介质

技术领域

本申请涉及海关商品编码技术领域,特别是涉及商品的编码方法、电子设备及计算机可读存储介质。

背景技术

海关商品归类是海关实施征税、监管、缉私、统计工作的重要基础,是海关准确、统一执法的重要保障。《中华人民共和国海关进出口货物商品归类管理规定》明确规定,商品归类是指在《商品名称及编码协调制度公约》商品分类目录体系下,以《中华人民共和国进出口税则》(简称《税则》)为基础,按照《进出口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、商品归类决定的要求,确定进出口货物商品编码(以下简称“商品编码,HS Code”)的活动。

商品归类在进出口业务中具有重要意义,商品编码(HS Code)决定了货物的关税率、贸易管制要求、出口退税率、能否享受减免税等。商品归类的准确与否,反映了企业进出口管理的合规性水平。

同时,商品归类具有相当的技术难度,影响商品正确归类的因素很多,即便是微小的商品规格型号差异都可能导致归类结果的不同。错误的商品编码还会对企业的运营成本带来重大影响,例如增加缴税成本、对进出口货品产生不必要的限制、影响通关效率等等。

发明内容

本申请主要解决的技术问题是提供商品的编码方法、电子设备及计算机可读存储介质,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。

为了解决上述问题,本申请采用的一种技术方案是提供一种商品的编码方法,该方法包括:获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码。

其中,为每个关键信息确定多个参考商品编码,包括:将每个关键信息与所有海关商品编码的每一关键信息进行比对,得到比对结果;根据比对结果确定多个参考商品编码。

其中,根据比对结果确定多个参考商品编码,包括:获取超过预设值的比对结果;将超过预设值的比对结果对应的海关商品编码确定为参考商品编码。

其中,从多个参考商品编码中确定待归类商品的目标商品编码,包括:计算每一参考商品编码对应的信息熵;基于信息熵计算每一参考商品编码对应的信息增益;将信息增益最大的参考商品编码确定为待归类商品的目标商品编码。

其中,采用以下公式进行计算:其中,D表示所有参考商品编码数量,pk表示D中第k类参考商品编码所占的比例;基于信息熵计算每一参考商品编码对应的信息增益,包括:采用以下公式进行计算:其中,Gain表示信息增益,a表示参考商品编码,Dv表示第v个节点包含了D中所有在特征α上取值为αv的样本总数,表示第v个节点的权重。

其中,该方法还包括:构建海关商品编码推荐模型;将训练样本输入至海关商品编码推荐模型,以得到海关商品编码推荐模型输出的第一预测编码;利用第一预测编码和训练样本中的真实编码确定分类错误率;利用分类错误率对海关商品编码推荐模型进行修正。

其中,海关商品编码推荐模型包括多个分支节点;利用分类错误率对海关商品编码推荐模型进行修正,包括:根据每个分支节点的分类错误率及每个分支节点的权重,计算每一分支节点的第一分类错误率;计算每一分支节点被修剪后的第二分类错误率;若第二分类错误率大于第一分类错误率,则保留分支节点。

其中,该方法还包括:获取真实编码的关键信息;将关键信息输入至海关商品编码推荐模型,以得到海关商品编码推荐模型输出的第二预测编码;利用第二预测编码和真实编码确定分类错误率;利用分类错误率对海关商品编码推荐模型进行修正。

为了解决上述问题,本申请采用的另一种技术方案是提供一种电子设备,该电子设备包括处理器以及与处理器耦接的存储器;其中,存储器用于存储计算机程序,处理器用于执行计算机程序,以实现如上述技术方案提供的方法。

为了解决上述问题,本申请采用的另一种技术方案是提供一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,计算机程序在被处理器执行时,用于实现如上述技术方案提供的方法。

本申请的有益效果是:区别于现有技术的情况,本申请的一种商品的编码方法,该方法通过获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码的方式,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:

图1是本申请提供的商品的编码方法一实施例的流程示意图;

图2是本申请提供的商品的编码方法另一实施例的流程示意图;

图3是本申请提供的商品的编码方法另一实施例的流程示意图;

图4是本申请提供的商品的编码方法另一实施例的流程示意图;

图5是本申请提供的商品的编码方法另一实施例的流程示意图;

图6是本申请提供的步骤54一实施例的流程示意图;

图7是本申请提供的商品的编码方法另一实施例的流程示意图;

图8是本申请提供的电子设备一实施例的结构示意图;

图9是本申请提供的计算可读存储介质一实施例的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

海关商品归类是海关实施征税、监管、缉私、统计工作的重要基础,是海关准确、统一执法的重要保障。《中华人民共和国海关进出口货物商品归类管理规定》明确规定,商品归类是指在《商品名称及编码协调制度公约》商品分类目录体系下,以《中华人民共和国进出口税则》(简称《税则》)为基础,按照《进出口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、商品归类决定的要求,确定进出口货物商品编码(以下简称“商品编码,HS Code”)的活动。

商品归类在进出口业务中具有重要意义,商品编码(HS Code)决定了货物的关税率、贸易管制要求、出口退税率、能否享受减免税等。商品归类的准确与否,反映了企业进出口管理的合规性水平。

同时,商品归类具有相当的技术难度,影响商品正确归类的因素很多,即便是微小的商品规格型号差异都可能导致归类结果的不同。错误的商品编码还会对企业的运营成本带来重大影响,例如增加缴税成本、对进出口货品产生不必要的限制、影响通关效率等等。

为了解决上述问题,本申请提出以下技术方案:

参阅图1,图1是本申请提供的商品的编码方法一实施例的流程示意图。该方法包括:

步骤11:获取待归类商品的数据信息。

待归类商品的数据信息包含有该待归类商品的相关信息,如以液晶显示屏为例子,数据信息可以是:“液晶显示屏、42英寸、带背光,不带触摸功能、视频接口、解码板、高频头板、已灌液晶、已切割、1.27kg/片”。

步骤12:从数据信息中获取至少一个关键信息。

从数据信息中获取至少一个关键信息,如上述液晶显示屏的例子,可以将液晶、不带触摸功能、视频接口、高频头板、42英寸作为关键信息。

步骤13:为每个关键信息确定多个参考商品编码。

此时,可以根据每一个关键信息确定对应的多个参考商品编码。

步骤14:从多个参考商品编码中确定待归类商品的目标商品编码。

然后从多个参考商品编码中确定待归类商品的目标商品编码。

在一些实施例中,可以将获取的待归类商品的数据信息输入至已训练的海关商品编码推荐模型,以使海关商品编码推荐模型输出待归类商品的目标商品编码。

在海关商品编码推荐模型中,会对每个关键信息确定多个参考商品编码,然后根据多个参考商品编码确定待归类商品的目标商品编码。

在本实施例中,通过获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码的方式,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。

参阅图2,图2是本申请提供的商品的编码方法另一实施例的流程示意图。该方法包括:

步骤21:获取待归类商品的数据信息。

步骤22:从数据信息中获取至少一个关键信息。

步骤21-步骤22与上述实施例的技术方案相同或相似,这里不做赘述。

步骤23:将每个关键信息与所有海关商品编码的每一关键信息进行比对,得到比对结果。

在一些实施例中,可以为每一海关商品的编码设置权重,在执行指标23时,可以根据对应的权重来计算每个关键信息与所有海关商品编码的每一关键信息的比对结果。

步骤24:根据比对结果确定多个参考商品编码。

在一些实施例中,参阅图3,步骤24可以是如下流程:

步骤241:获取超过预设值的比对结果。

步骤242:将超过预设值的比对结果对应的海关商品编码确定为参考商品编码。

步骤25:从多个参考商品编码中确定待归类商品的目标商品编码。

在一些实施例中,参阅图4,步骤25可以是如下流程:

步骤251:计算每一参考商品编码对应的信息熵。

采用以下公式进行计算:

其中,D表示所有参考商品编码数量,pk表示D中第k类参考商品编码所占的比例。

步骤252:基于信息熵计算每一参考商品编码对应的信息增益。

采用以下公式计算每一参考商品编码对应的信息增益:

其中,Gain表示信息增益,a表示关键信息,Dv表示第v个节点包含了D中所有在特征α上取值为av的样本总数,表示第v个节点的权重。

步骤253:将信息增益最大的参考商品编码确定为待归类商品的目标商品编码。

在本实施例中,通过上述方式,能够实现对待归类商品自动推荐海关商品编码,减少用户操作,提升工作效率。

参阅图5,图5是本申请提供的商品的编码方法另一实施例的流程示意图。

步骤51:构建海关商品编码推荐模型。

步骤52:将训练样本输入至海关商品编码推荐模型,以得到海关商品编码推荐模型输出的第一预测编码。

步骤53:利用第一预测编码和训练样本中的真实编码确定分类错误率。

步骤54:利用分类错误率对海关商品编码推荐模型进行修正。

结合下表1进行说明:

决策树学习的关键在于如何选择最优的划分属性,所谓的最优划分属性,对于二元分类而言,就是尽量使划分的样本属于同一类别,即“纯度”最高的属性。那么如何来度量特征(features)的纯度,这时候就要用到“信息熵(informationentropy)”。先来看看信息熵的定义:假如当前样本集D中第k类样本所占的比例为Pk(k=1,2,3,...|K|),K为类别的总数(对于二元分类来说,K=2)。则样本集的信息熵为:

Ent(D)的值越小,则D的纯度越高。再来看一个概念信息增益(informationgain),假定离散属性α有V个可能的取值(a1,a2,...,an},如果使用特征α来对数据集D进行划分,则会产生V个分支结点,其中第v个节点包含了数据集D中所有在特征α上取值为αv的样本总数,记为Dv。因此可以根据上面信息熵的公式计算出信息熵,再考虑到不同的分支节点所包含的样本数量不同,给分支节点赋予权重即样本数越多的分支节点的影响越大,因此,能够计算出特征α对样本集D进行划分所获得的“信息增益”:

一般而言,信息增益越大,则表示使用特征α对数据集划分所获得的“纯度提升”越大。所以信息增益可以用于决策树划分属性的选择,其实就是选择信息增益最大的属性,ID3算法就是采用的信息增益来划分属性。

数据集是类别为二元的20个样本,有效样本为17个,正例(类别为1的样本)占的比例为:反例(类别为0的样本)占的比例为:根据信息熵的公式能够计算出数据集D的信息熵为:

其中,D1对应表1的关键信息A,D2对应表1的关键信息B,D3对应表1的关键信息C。

以此类推对每一关键信息进行信息增益计算,

因此,商品编码9013803090取得最大增益,将此商品编码最为最优值被推荐使用。

在其他实施例中,海关商品编码推荐模型包括多个分支节点;参阅图6,步骤54可以是以下流程:

步骤541:根据每个分支节点的分类错误率及每个分支节点的权重,计算每一分支节点的第一分类错误率。

步骤542:计算每一分支节点被修剪后的第二分类错误率。

步骤543:若第二分类错误率大于第一分类错误率,则保留分支节点。

通过这种方式,对分支节点进行修剪,以减少海关商品编码推荐模型的计算,提升运算能力,从而提高对待归类商品推荐海关商品编码的效率。

在一些实施例中,海关商品的归类都会在流入系统后进行自然语言识别、智能提取、智能分词的动作,通过关务人员选择为系统提供正反馈和负反馈,完成机器学习训练,构建供应链行业模型,将数据分类进入不同的类别。

在推荐系统内,每次关务人员的选择,都会把当前操作的每一条数据对应的每一个关键信息进行重新计算权重的操作,同一个关键信息重复被选中为同一个商品编码,其权重会在权重基数的基础上增加其权重,系统关键字段加权。推荐出系统内匹配度最高的N条数据,由关务人员进行选择操作,逐步形成供应链行业的数据模型。

在选择过程中,加入决策树算法,在决策树充分生长后,修剪掉多余的分支。根据每个分支的分类错误率及每个分支的权重,计算该节点不修剪时预期分类错误率;对于每个非叶节点,计算该节点被修剪后的分类错误率,如果修剪后分类错误率变大,即放弃修剪;否则将该节点强制为叶节点,并标记类别。产生一系列修剪过的决策树候选之后,利用测试数据(未参与建模的数据)对各候选决策树的分类准确性进行评价,保留分类错误率最小的决策树。

通过这种方式,能够提高海关商品编码推荐模型推荐海关商品编码的准确性。

进一步,参阅图7,在执行步骤54后,该方法还包括:

步骤71:获取真实编码的关键信息。

步骤72:将关键信息输入至海关商品编码推荐模型,以得到海关商品编码推荐模型输出的第二预测编码。

步骤73:利用第二预测编码和真实编码确定分类错误率。

步骤74:利用分类错误率对海关商品编码推荐模型进行修正。

通过步骤71-74的方案,在利用训练样本对海关商品编码推荐模型训练后,使用真实编码的关键信息对海关商品编码推荐模型进行验证,以提升海关商品编码推荐模型的准确性。

在上述训练过程中,通过多次迭代上述过程,使海关商品编码推荐模型输入的预测编码无限接近真实编码,此时则结束训练,并将训练后的模型用于上述商品的编码方法。

可以理解,在上述海关商品编码推荐模型训练完成后,每一关键信息均对应有相应的参考商品编码,以及对应的权重,在需要对海关商品编码时,将海关商品的数据输入至海关商品编码推荐模型中,海关商品编码推荐模型根据数据中的关键信息,获取对应的参考商品编码以及权重,然后根据这些参考商品编码以及权重计算出最佳的海关商品编码,作为该海关商品的海关商品编码。

参阅图8,图8是本申请提供的电子设备一实施例的结构示意图,该电子设备80包括处理器81以及与处理器81耦接的存储器82;其中,存储器82用于存储计算机程序,处理器81用于执行计算机程序,以实现以下方法:

获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码。

可以理解,处理器81还用于执行计算机程序,以实现上述任一实施例提供的方法。

参阅图9,图9是本申请提供的计算可读存储介质一实施例的结构示意图。该计算机可读存储介质90用于存储计算机程序91,计算机程序91在被处理器执行时,用于实现以下方法:

获取待归类商品的数据信息;从数据信息中获取至少一个关键信息;为每个关键信息确定多个参考商品编码;从多个参考商品编码中确定待归类商品的目标商品编码。

可以理解,计算机程序91在被处理器执行时,还用于实现上述任一实施例提供的方法。

在本申请所提供的几个实施方式中,应该理解到,所揭露的方法以及设备,可以通过其它的方式实现。例如,以上所描述的设备实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

上述其他实施方式中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:多模态信息提取方法、装置、设备及计算机可读存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!