一种基于大数据技术的工业能力标签方法

文档序号:1831338 发布日期:2021-11-12 浏览:10次 >En<

阅读说明:本技术 一种基于大数据技术的工业能力标签方法 (Industrial capacity labeling method based on big data technology ) 是由 罗红宇 吴家宏 于 2021-08-12 设计创作,主要内容包括:本发明涉及一种基于大数据技术的工业能力标签方法,该方法包括:获取标注对象;确定标注对象的业务来源、数据来源和需求来源;根据标注对象的业务来源、数据来源和需求来源,从标签系统的标签库中确定最终标签;根据最终标签确定融合度;根据融合度,生成最终标签的标签图;将标签图作为标注对象的标注标签进行标注。现有通过单一特性标签查找关键信息时因为考虑的不全面造成查找的信息只符合需求中的一个方面而不符合整体需求,而本发明提供的方法,根据标签的融合度生成标签图,并基于标签图进行标注,使得标注体现了数据的融合特性,该标签能够反应工业信息的整体属性,提升了在海量工业信息中快速准确查询关键信息的速度和准确性。(The invention relates to an industrial capacity labeling method based on a big data technology, which comprises the following steps: acquiring a labeling object; determining a service source, a data source and a demand source of the labeled object; determining a final label from a label library of a label system according to a service source, a data source and a demand source of the labeled object; determining the fusion degree according to the final label; generating a label graph of the final label according to the fusion degree; and marking the label graph as a marking label of the marking object. According to the method provided by the invention, the label graph is generated according to the fusion degree of the label, and labeling is carried out based on the label graph, so that the labeling embodies the fusion characteristic of data, the integral attribute of industrial information can be reflected by the label, and the speed and the accuracy for quickly and accurately querying key information in massive industrial information are improved.)

一种基于大数据技术的工业能力标签方法

技术领域

本发明涉及标签领域,尤其涉及一种基于大数据技术的工业能力标签方法。

背景技术

随着工业现代化的发展,工业产品的相关信息呈爆炸式增长。在海量的工业信息中如何快速、准确的找到关键信息,成为相关人员较为关注的问题。

目前,一种解决方法是构建标签系统,通过为工业产品打上标签实现对产品相关数据的运维,如溯源等。

但是,随着产品多元化的发展,具备单一属性的产品逐渐变少,更多的是多属性融合的跨多领域产品,而现有的标签系统中标签之间仍为独立关系,因此,对于多元化产品,通过现有标签系统打的标签会很长,很多,依然很难在众多标签中找到最为关键的标签,也很难体现产品的多元化特点,因此急需一种能够体现融合特性的标签系统。

发明内容

(一)要解决的技术问题

鉴于现有技术的上述缺点、不足,本发明提供一种基于大数据技术的工业能力标签方法。

(二)技术方案

为了达到上述目的,本发明采用的主要技术方案包括:

一种基于大数据技术的工业能力标签方法,所述方法包括:

S101,获取标注对象;

S102,确定标注对象的业务来源、数据来源和需求来源;

S103,根据标注对象的业务来源、数据来源和需求来源,从标签系统的标签库中确定最终标签;

S104,根据所述最终标签确定融合度;

S105,根据所述融合度,生成所述最终标签的标签图;

S106,将所述标签图作为所述标注对象的标注标签进行标注。

可选地,所述标签系统包括:业务源域、数据源域、需求源域、标签库;

所述业务源域,用于表征标注对象的业务来源;

所述数据源域,用于表征标注对象的数据来源;

所述需求源域,用于表征标注对象的需求来源;

所述标签库,包括具体的标签;

所述标签库中的任一标签,与所述业务源域中的一个或多个业务源对应,同时与数据源域中的一个或多个数据源对应,同时与需求源域中的一个或多个需求源对应;

所述标签库中的任一标签具有三维属性,第一维属性为所述任一标签对应业务源域中的各业务源以及与每个业务源的对应度I1;第二维属性为所述任一标签对应数据源域中的各数据源以及每个数据源的对应度I2;第三维属性为所述任一标签对应需求源域中的各需求源以及每个需求源的对应度I3。

可选地,所述S103具体包括:

S103-1,确定标注对象的业务来源与所述业务源域中各业务来源之间的相似度S1,并获取S1最高的D1个业务来源,形成业务来源集合A1;其中,D1为预设的业务来源获取阈值;

S103-2,确定标注对象的数据来源与所述数据源域中各数据来源之间的相似度S2,并获取S2最高的D2个数据来源,形成数据来源集合A2;其中,D2为预设的数据来源获取阈值;

S103-3,确定标注对象的需求来源与所述需求源域中各需求来源之间的相似度S3,并获取S3最高的D3个需求来源,形成需求来源集合A3;其中,D3为预设的需求来源获取阈值;

S103-4,依次从A1、A2、A3中任选一个元素,形成组合;所述组合的数量为D1*D2*D3个;

S103-5,对于任一组合,确定标签库中是否存在与所述任一组合对应的标签,如果存在,则将该标签作为备选标签;

S103-6,根据备选标签的三维属性,确定最终标签。

可选地,所述S103-6具体包括:

若备选标签为一个,则确定所述备选标签为最终标签;

若备选标签为多个,则确定每一个备选标签的I1均值I2均值和I3均值确定所有备选标签的均值、的均值和的均值;计算各备选标签的的均值,的均值,的均值;若存在P1、P2、P3均不小于0.5的备选标签,则将该备选标签作为最终标签;若不存在P1、P2、P3均不小于0.5的备选标签,则计算各备选标签的P4=P1+P2+P3,按P4从到小对各备选标签进行排序,选择排序靠前的D4个备选标签作为最终标签。

可选地,所述D4=[备选标签总数*D5];

其中,D5为min{各备选标签I1的方差,各备选标签I2的方差,各备选标签I3的方差}。

可选地,所述S104具体包括:

若所述最终标签为1个,则确定融合度为max{所述最终标签对应的业务源与所述标注对象的业务来源之间的相似度的最大值,所述最终标签对应的数据源与所述标注对象的数据来源之间的相似度的最大值,所述最终标签对应的需求源与所述标注对象的需求来源之间的相似度的最大值}。

可选地,所述S105具体包括:

获取所述最终标签对应的三维属性;

将所述最终标签作为一个点Z,且将融合度作为Z的属性进行标注;

将对应的三维属性中的每一业务源作为一个点Z1,且每个Z1均与Z连接一条边;将每个业务源的I1*融合度的值作为该业务源对应的点与Z点连接的边的属性进行标注;

将对应的三维属性中的每一数据源作为一个点Z2,且每个Z2均与Z连接一条边;将每个业务源的I2*融合度的值作为该数据源对应的点与Z点连接的边的属性进行标注;

将对应的三维属性中的每一需求源作为一个点Z3,且每个Z3均与Z连接一条边;将每个需求源的I3*融合度的值作为该需求源对应的点与Z点连接的边的属性进行标注;

将由所有点和边构成的图作为标签图。

可选地,所述S104具体包括:

若所述最终标签为多个,则确定总融合度为max{所有最终标签对应的业务源与所述标注对象的业务来源之间的相似度的最大值,所有最终标签对应的数据源与所述标注对象的数据来源之间的相似度的最大值,所有最终标签对应的需求源与所述标注对象的需求来源之间的相似度的最大值};

根据任意两个最终便签的三维属性,确定任意两个终端便签之间的融合度;

将任意两个终端便签之间的融合度和总融合度均作为融合度。

可选地,所述根据任意两个最终便签的三维属性,确定任意两个终端便签之间的融合度具体包括:

对于任意两个最终便签u、v,最终标签u和最终标签v之间的融合度为max{第一数值,第二数值,第三数值};

其中,

第一数值为:最终标签u对应的业务源和最终标签v对应的业务源中相同的业务源数量*相同的业务源中与所述标注对象的业务来源之间的相似度的最大值;

第二数值为:最终标签u对应的数据源和最终标签v对应的数据源中相同的数据源数量*相同的数据源中与所述标注对象的业务来源之间的相似度的最大值;

第三数值为:最终标签u对应的需求源和最终标签v对应的需求源中相同的需求源数量*相同的需求源中与所述标注对象的需求来源之间的相似度的最大值。

可选地,所述S105具体包括:

获取各最终标签对应的三维属性;

将各最终标签均作为一个点Y,所有Y相互连接,且将总融合度作为各Y的属性进行标注,将两个最终标签之间的融合度作为两个最终标签对应点之间连接的边的属性进行标注;

将各最终标签对应的三维属性中的每一业务源作为一个点Y1,且每个Y1均与其对应的最终标签连接一条边;将每个业务源的I1*总融合度的值作为该业务源对应的点与对应最终标签对应的点之间连接的边的属性进行标注;

将各最终标签对应的三维属性中的每一数据源作为一个点Y2,且每个Y2均与其对应的最终标签连接一条边;将每个数据源的I2*总融合度的值作为该数据源对应的点与对应最终标签对应的点之间连接的边的属性进行标注;

将各最终标签对应的三维属性中的每一需求源作为一个点Y3,且每个Y3均与其对应的最终标签连接一条边;将每个需求源的I3*总融合度的值作为该需求源对应的点与对应最终标签对应的点之间连接的边的属性进行标注;

将由所有点和边构成的图作为标签图。

(三)有益效果

本发明的基于大数据技术的工业能力标签方法,获取标注对象;确定标注对象的业务来源、数据来源和需求来源;根据标注对象的业务来源、数据来源和需求来源,从标签系统的标签库中确定最终标签;根据最终标签确定融合度;根据融合度,生成最终标签的标签图;将标签图作为标注对象的标注标签进行标注。现有通过单一特性标签查找关键信息时因为考虑的不全面造成查找的信息只符合需求中的一个方面而不符合整体需求,而本发明提供的方法,根据标签的融合度生成标签图,并基于标签图进行标注,使得标注体现了数据的融合特性,该标签能够反应工业信息的整体属性,提升了在海量工业信息中快速准确查询关键信息的速度和准确性。

附图说明

图1为本发明一实施例提供的一种基于大数据技术的工业能力标签方法的流程示意图。

具体实施方式

为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。

随着工业现代化的发展,工业产品的相关信息呈爆炸式增长。在海量的工业信息中如何快速、准确的找到关键信息,成为相关人员较为关注的问题。

目前,一种解决方法是构建标签系统,通过为工业产品打上标签实现对产品相关数据的运维,如溯源等。但是,随着产品多元化的发展,具备单一属性的产品逐渐变少,更多的是多属性融合的跨多领域产品,而现有的标签系统中标签之间仍为独立关系,因此,对于多元化产品,通过现有标签系统打的标签会很长,很多,依然很难在众多标签中找到最为关键的标签,也很难体现产品的多元化特点,因此急需一种能够体现融合特性的标签系统。

基于此,本发明一种基于大数据技术的工业能力标签方法,该方法包括:获取标注对象;确定标注对象的业务来源、数据来源和需求来源;根据标注对象的业务来源、数据来源和需求来源,从标签系统的标签库中确定最终标签;根据最终标签确定融合度;根据融合度,生成最终标签的标签图;将标签图作为标注对象的标注标签进行标注。现有通过单一特性标签查找关键信息时因为考虑的不全面造成查找的信息只符合需求中的一个方面而不符合整体需求,而本发明提供的方法,根据标签的融合度生成标签图,并基于标签图进行标注,使得标注体现了数据的融合特性,该标签能够反应工业信息的整体属性,提升了在海量工业信息中快速准确查询关键信息的速度和准确性。

参见图1,本实施例提供的基于大数据技术的工业能力标签方法,实现过程如下:

S101,获取标注对象。

其中,标注对象可以为待标注的工业产品,每个工业产品均是基于业务和需求确定的,而工业产品相应的数据也存储在相应的存储位置,因此,每个代表数的工业产品均会具有业务来源(表征工业产品对应的业务)、数据来源(表征工业产品对应数据的存储位置)和需求来源(表征工业产品对应的需求)。

S102,确定标注对象的业务来源、数据来源和需求来源。

S103,根据标注对象的业务来源、数据来源和需求来源,从标签系统的标签库中确定最终标签。

其中,标签系统包括:业务源域、数据源域、需求源域、标签库。

业务源域,用于表征标注对象的业务来源。

数据源域,用于表征标注对象的数据来源。

需求源域,用于表征标注对象的需求来源。

标签库,包括具体的标签。

标签库中的任一标签,与业务源域中的一个或多个业务源对应,同时与数据源域中的一个或多个数据源对应,同时与需求源域中的一个或多个需求源对应。

标签库中的任一标签具有三维属性,第一维属性为任一标签对应业务源域中的各业务源以及与每个业务源的对应度I1。第二维属性为任一标签对应数据源域中的各数据源以及每个数据源的对应度I2。第三维属性为任一标签对应需求源域中的各需求源以及每个需求源的对应度I3。

基于上述标签系统,本步骤的实现过程为:

S103-1,确定标注对象的业务来源与业务源域中各业务来源之间的相似度S1,并获取S1最高的D1个业务来源,形成业务来源集合A1。

其中,D1为预设的业务来源获取阈值。

另外,相似度S1可以根据业务来源描述与业务源域的描述确定,如确定两个描述的语义,将语义的相似度作为S1。

S103-2,确定标注对象的数据来源与数据源域中各数据来源之间的相似度S2,并获取S2最高的D2个数据来源,形成数据来源集合A2。

其中,D2为预设的数据来源获取阈值。

另外,相似度S2可以根据数据来源与数据源域的关系确定,如根据是否源于同一数据库,同一数据空间等确定。

S103-3,确定标注对象的需求来源与需求源域中各需求来源之间的相似度S3,并获取S3最高的D3个需求来源,形成需求来源集合A3。

其中,D3为预设的需求来源获取阈值。

另外,相似度S3可以根据需求来源描述与需求源域的描述确定,如确定两个描述的语义,将语义的相似度作为S3。

S103-4,依次从A1、A2、A3中任选一个元素,形成组合。

其中,组合的数量为D1*D2*D3个。

S103-5,对于任一组合,确定标签库中是否存在与任一组合对应的标签,如果存在,则将该标签作为备选标签。

S103-6,根据备选标签的三维属性,确定最终标签。

具体的,

若备选标签为一个,则确定备选标签为最终标签。

若备选标签为多个,则

1)确定每一个备选标签的I1均值I2均值和I3均值

2)确定所有备选标签的均值、的均值和的均值。

3)计算各备选标签的的均值,的均值,的均值。

4)若存在P1、P2、P3均不小于0.5的备选标签,则将该备选标签作为最终标签。

若不存在P1、P2、P3均不小于0.5的备选标签,则计算各备选标签的P4=P1+P2+P3,按P4从到小对各备选标签进行排序,选择排序靠前的D4个备选标签作为最终标签。

D4=[备选标签总数*D5]。

其中,D5为min{各备选标签I1的方差,各备选标签I2的方差,各备选标签I3的方差}。

S104,根据最终标签确定融合度。

具体的,

·若最终标签为1个,则

确定融合度为max{最终标签对应的业务源与标注对象的业务来源之间的相似度的最大值,最终标签对应的数据源与标注对象的数据来源之间的相似度的最大值,最终标签对应的需求源与标注对象的需求来源之间的相似度的最大值}。

·若最终标签为多个,则

a)确定总融合度为max{所有最终标签对应的业务源与标注对象的业务来源之间的相似度的最大值,所有最终标签对应的数据源与标注对象的数据来源之间的相似度的最大值,所有最终标签对应的需求源与标注对象的需求来源之间的相似度的最大值}。

b)根据任意两个最终便签的三维属性,确定任意两个终端便签之间的融合度。

具体的,对于任意两个最终便签u、v,最终标签u和最终标签v之间的融合度为max{第一数值,第二数值,第三数值}。

其中,

第一数值为:最终标签u对应的业务源和最终标签v对应的业务源中相同的业务源数量*相同的业务源中与标注对象的业务来源之间的相似度的最大值。

第二数值为:最终标签u对应的数据源和最终标签v对应的数据源中相同的数据源数量*相同的数据源中与标注对象的业务来源之间的相似度的最大值。

第三数值为:最终标签u对应的需求源和最终标签v对应的需求源中相同的需求源数量*相同的需求源中与标注对象的需求来源之间的相似度的最大值。

c)将任意两个终端便签之间的融合度和总融合度均作为融合度。

S105,根据融合度,生成最终标签的标签图。

·若最终标签为1个,则

A.1)获取最终标签对应的三维属性。

A.2)将最终标签作为一个点Z,且将融合度作为Z的属性进行标注。

A.3)将对应的三维属性中的每一业务源作为一个点Z1,且每个Z1均与Z连接一条边。将每个业务源的I1*融合度的值作为该业务源对应的点与Z点连接的边的属性进行标注。

A.4)将对应的三维属性中的每一数据源作为一个点Z2,且每个Z2均与Z连接一条边。将每个业务源的I2*融合度的值作为该数据源对应的点与Z点连接的边的属性进行标注。

A.5)将对应的三维属性中的每一需求源作为一个点Z3,且每个Z3均与Z连接一条边。将每个需求源的I3*融合度的值作为该需求源对应的点与Z点连接的边的属性进行标注。

A.6)将由所有点和边构成的图作为标签图。

·若最终标签为多个,则

B.1)获取各最终标签对应的三维属性。

B.2)将各最终标签均作为一个点Y,所有Y相互连接,且将总融合度作为各Y的属性进行标注,将两个最终标签之间的融合度作为两个最终标签对应点之间连接的边的属性进行标注。

B.3)将各最终标签对应的三维属性中的每一业务源作为一个点Y1,且每个Y1均与其对应的最终标签连接一条边。将每个业务源的I1*总融合度的值作为该业务源对应的点与对应最终标签对应的点之间连接的边的属性进行标注。

B.4)将各最终标签对应的三维属性中的每一数据源作为一个点Y2,且每个Y2均与其对应的最终标签连接一条边。将每个数据源的I2*总融合度的值作为该数据源对应的点与对应最终标签对应的点之间连接的边的属性进行标注。

B.5)将各最终标签对应的三维属性中的每一需求源作为一个点Y3,且每个Y3均与其对应的最终标签连接一条边。将每个需求源的I3*总融合度的值作为该需求源对应的点与对应最终标签对应的点之间连接的边的属性进行标注。

B.6)将由所有点和边构成的图作为标签图。

S106,将标签图作为标注对象的标注标签进行标注。

本方法通过业务来源、数据来源和需求来源来确定标签的融合度,通过该融合度可以多方面的描述工业产品的属性,通过该标签的融合度进行标注,可以保证通过该标签查询出的数据更符合需求,而不是符合某一方面需求,保证了数据的准确检索。

本实施例提供的基于大数据技术的工业能力标签方法,该方法包括:获取标注对象;确定标注对象的业务来源、数据来源和需求来源;根据标注对象的业务来源、数据来源和需求来源,从标签系统的标签库中确定最终标签;根据最终标签确定融合度;根据融合度,生成最终标签的标签图;将标签图作为标注对象的标注标签进行标注。现有通过单一特性标签查找关键信息时因为考虑的不全面造成查找的信息只符合需求中的一个方面而不符合整体需求,而本发明提供的方法,根据标签的融合度生成标签图,并基于标签图进行标注,使得标注体现了数据的融合特性,该标签能够反应工业信息的整体属性,提升了在海量工业信息中快速准确查询关键信息的速度和准确性。

为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更清楚、透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。

应当注意的是,在权利要求中,不应将位于括号之间的任何附图标记理解成对权利要求的限制。词语“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的词语“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的权利要求中,这些装置中的若干个可以是通过同一个硬件来具体体现。词语第一、第二、第三等的使用,仅是为了表述方便,而不表示任何顺序。可将这些词语理解为部件名称的一部分。

此外,需要说明的是,在本说明书的描述中,术语“一个实施例”、“一些实施例”、“实施例”、“示例”、“具体示例”或“一些示例”等的描述,是指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管已描述了本发明的优选实施例,但本领域的技术人员在得知了基本创造性概念后,则可对这些实施例作出另外的变更和修改。所以,权利要求应该解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种修改和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也应该包含这些修改和变型在内。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于知识图谱的工业能力对接技术方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!