基于行业分类的检索方法、检索装置及可读存储介质

文档序号:1658687 发布日期:2019-12-27 浏览:13次 >En<

阅读说明:本技术 基于行业分类的检索方法、检索装置及可读存储介质 (Industry classification-based retrieval method and retrieval device and readable storage medium ) 是由 许赵云 许明峰 胡新平 陈明忠 毛瑞彬 赵剑 宋娜 李爱文 于 2019-08-27 设计创作,主要内容包括:本发明公开一种基于行业分类的检索方法、检索装置及可读存储介质,所述基于行业分类的检索方法,包括:获取与行业分类相关的行业分类文件;对所述行业分类文件的内容进行共现处理得到共现关键词;根据所述共现关键词更新所述预设行业分类词;根据更新后的所述预设行业分类词对关联的公司信息重新分类,其中,在接收到检索请求后,根据检索关键词对应的预设行业分类词获取对应的公司信息。本发明提供一种基于行业分类的检索方法、检索装置及可读存储介质,解决了现有技术中对新兴行业的检索数据不完整不准确的问题。(The invention discloses a retrieval method, a retrieval device and a readable storage medium based on industry classification, wherein the retrieval method based on the industry classification comprises the following steps: acquiring an industry classification file related to industry classification; co-occurrence processing is carried out on the contents of the industry classification files to obtain co-occurrence keywords; updating the preset industry classification word according to the co-occurrence key word; and reclassifying the associated company information according to the updated preset industry classification words, wherein after receiving a retrieval request, acquiring the corresponding company information according to the preset industry classification words corresponding to the retrieval keywords. The invention provides a retrieval method, a retrieval device and a readable storage medium based on industry classification, which solve the problem that the retrieval data of emerging industries is incomplete and inaccurate in the prior art.)

基于行业分类的检索方法、检索装置及可读存储介质

技术领域

本发明涉及信息检索技术领域,尤其涉及一种基于行业分类的检索方法、检索装置及可读存储介质。

背景技术

信息检索是在已有的信息数据库中检索与要求相关的信息内容,在基于行业分类的检索中,通过参考公司的行业特征和经营产品的特征对相似的公司或产品进行检索,从而获得相近的公司或相近的产品,方便用户对不同公司之间或不同产品之间进行对比及分析。

在现有技术中,随着新兴行业的出现以及现有公司的跨行业经营,在对公司进行行业分类时,由于新兴行业无法准确的通过现有行业分类的规则进行确定,因此在对涉及新兴行业的内容进行检索时,无法准确的获取与新兴行业相关的信息,从而导致检索数据不完整切不准确。

发明内容

本发明提供一种基于行业分类的检索方法、检索装置及可读存储介质,旨在解决现有技术中对新兴行业的信息检索数据不完整不准确的问题。

为实现上述目的,本发明提出了一种于行业分类的检索方法,所述基于行业分类的检索方法,包括:

获取与行业分类相关的行业分类文件;

对所述行业分类文件的内容进行共现处理得到共现关键词;

根据所述共现关键词更新预设行业分类词;

根据更新后的所述预设行业分类词对关联的公司信息重新分类,其中,在接收到检索请求后,根据检索关键词对应的预设行业分类词获取对应的公司信息。

可选地,所述对所述行业分类文件的内容进行共现处理得到共现关键词的步骤,包括:

对所述行业分类文件进行聚类处理得到至少一个文件组;

对所述文件组内的行业分类文件的内容进行共现处理得到所述文件组对应的共现关键词。

可选地,所述对所述行业分类文件进行聚类处理得到至少一个文件组的步骤,包括:

获取各个所述行业分类文件的文件向量,并获取各个所述文件向量之间的距离;

将所述距离小于预设距离的所述文件向量对应的行业分类文件聚类为一个所述文件组。

可选地,所述对所述文件组内的行业分类文件的内容进行共现处理得到所述文件组对应的共现关键词的步骤,包括:

提取各个所述行业分类文件的内容中的关键词;

获取各个所述关键词重复出现的次数;

将所述次数大于预设次数的关键词作为所述共现关键词。

可选地,所述根据所述共现关键词更新所述预设行业分类词的步骤,包括:

获取所述共现关键词的词向量;

根据所述词向量与预设词向量,更新所述预设行业分类词。

可选地,所述根据所述词向量与预设词向量,更新所述预设行业分类词的步骤,包括:

获取所述词向量与所述预设词向量的相似度;

当所述相似度大于或等于预设相似度时,采用所述词向量相关联的所述共现关键词更新所述预设行业分类词。

可选地,所述根据所述共现关键词更新所述预设行业分类词的步骤之前,还包括:

对所述共现关键词进行筛选;

所述根据所述共现关键词更新所述预设行业分类词的步骤包括:

采用所述筛选后的所述共现关键词更新所述预设行业分类词。

可选地,所述对所述共现关键词进行筛选的步骤,包括:

检索所述共现关键词相关联的行业数据;

当未检索到与所述共现关键词相关联的所述行业数据时,删除所述共现关键词。

为实现上述目的,本申请提出一种基于行业分类的检索装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的基于行业分类的检索程序,所述处理器执行所述基于行业分类的检索程序时实现如上述任一项实施方式所述的方法。

为实现上述目的,本申请提出一种可读存储介质,其上存储有基于行业分类的检索程序,该基于行业分类的检索程序被处理器执行时实现如上述任一项实施方式所述的方法。

本申请提出的技术方案中,在获取与行业分类相关的行业分类文件后;对所述行业分类文件的内容进行共现处理得到共现关键词,并根据所述共现关键词更新所述预设行业分类词;根据更新后的所述预设行业分类词对关联的公司信息重新分类,调整公司行业类别,从而在接收到检索请求时,能够根据检索请求在获取与检索请求符合公司信息,通过从行业文件中提取共现关键词,对行业分类词进行补充和更新后,使所述行业分类词更加准确,从而解决了现有技术中,对新兴行业的检索信息不完整不准确的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;

图2是本发明基于行业分类的检索方法第一实施例的流程示意图;

图3是本发明基于行业分类的检索方法第二实施例的流程示意图;

图4是本发明基于行业分类的检索方法第三实施例的流程示意图;

图5是本发明基于行业分类的检索方法第四实施例的流程示意图;

图6是本发明基于行业分类的检索方法第五实施例的流程示意图;

图7是本发明基于行业分类的检索方法第六实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。

另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图。

本发明实施例装置可以包括计算机等装置的控制装置如服务器、移动终端设备和集控器等。

如图1所示,该装置可以包括:控制器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述控制器1001的存储装置。

本领域技术人员可以理解,图1中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

该拍摄提示装置可以包括:处理器1001,例如CPU,存储器1002,通信总线1003,网络接口1004。其中,通信总线1003用于实现该装置中各组成部件之间的连接通信。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1002可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1002可选的还可以是独立于前述处理器1001的存储装置。如图1所示,作为一种可读存储介质的存储器1002中可以包括操作系统、网络通信模块以及基于行业分类的检索程序。

本领域技术人员可以理解,图1中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1004中可以包括操作系统、网络通信模块、用户接口模块以及基于行业分类的检索程序。

在图1所示的服务器中,屏幕1003主要用于显示装置结构的内容,而控制器1001可以用于调用存储器1004中存储的应用程序,并执行以下操作:

获取与行业分类相关的行业分类文件;

对所述行业分类文件的内容进行共现处理得到共现关键词;

根据所述共现关键词更新预设行业分类词;

根据更新后的所述预设行业分类词对关联的公司信息重新分类,其中,在接收到检索请求后,根据检索关键词对应的预设行业分类词获取对应的公司信息。

进一步地,控制器1001可以调用存储器1004中存储的应用程序,还执行以下操作:

对所述行业分类文件进行聚类处理得到至少一个文件组;

对所述文件组内的行业分类文件的内容进行共现处理得到所述文件组对应的共现关键词。

进一步地,控制器1001可以调用存储器1004中存储的应用程序,还执行以下操作:

获取各个所述行业分类文件的文件向量,并获取各个所述文件向量之间的距离;

将所述距离小于预设距离的所述文件向量对应的行业分类文件聚类为一个所述文件组。

进一步地,控制器1001可以调用存储器1004中存储的应用程序,还执行以下操作:

提取各个所述行业分类文件的内容中的关键词;

获取各个所述关键词重复出现的次数;

将所述次数大于预设次数的关键词作为所述共现关键词。

进一步地,控制器1001可以调用存储器1004中存储的应用程序,还执行以下操作:

获取所述共现关键词的词向量;

根据所述词向量与预设词向量,更新所述预设行业分类词。

进一步地,控制器1001可以调用存储器1004中存储的应用程序,还执行以下操作:

获取所述词向量与所述预设词向量的相似度;

当所述相似度大于或等于预设相似度时,采用所述词向量相关联的所述共现关键词更新所述预设行业分类词。

进一步地,控制器1001可以调用存储器1004中存储的应用程序,还执行以下操作:

对所述共现关键词进行筛选。

采用所述筛选后的所述共现关键词更新所述预设行业分类词。

进一步地,控制器1001可以调用存储器1004中存储的应用程序,还执行以下操作:

检索所述共现关键词相关联的行业数据;

当未检索到与所述共现关键词相关联的所述行业数据时,删除所述共现关键词。

第一实施例

请参照图2,本实施例提出的基于行业分类的检索方法,包括:

S100,获取与行业分类相关的行业分类文件;

其中,所述行业分类文件是指与行业相关的文本资料,所述行业分类文件的内容包括企业公告,研究报告及相关新闻内容,所述行业分类文件的内容还可以来源于杂志、网络文章或报刊等多种载体上的资料。具体的,获取所述行业分类文件的方式可以是通过检索装置对网络上的内容进行搜索后,获取与行业相关的内容资料,还可以是通过用户手动添加的方式,获取与行业相关的资料,另外,资料的表现形式不限于文本形式,还可以为多媒体形式,当资料为多媒体形式时,可以通过文字识别的方式识别多媒体资料的内容。

S200,对所述行业分类文件的内容进行共现处理得到共现关键词;

其中,所述共现关键词是指所述行业分类文件中重复出现的词汇,具体的,当所述行业分类文件中包含与某一行业相关的内容时,会多次出现与该行业相关的词语。所述共现处理是指统计所述行业分类文件中词语重复出现的次数,并根据重复出现的次数确定共现关键词。具体的,当所述行业分类文件中的某一特定词汇多次出现,并且出现的次数超过预设的数值时,判定该特定词汇为共现关键词。

S300,根据所述共现关键词更新预设行业分类词;

其中,所述预设行业分类词为现有技术中,已经公开或已经使用的用于进行行业分类的词汇,用户可以根据所述预设行业分类词,对现有的公司或现有的产品进行分类,从而确定公司与产品的类别与属性。具体的,在获取所述共现关键词后,根据所述共现关键词与所述预设行业分类词之间的关系,将所述共现关键词添加至所述预设行业分类词中,使与所述共现关键词相关联的行业能够准确的通过所述预设行业分类词进行分类。

S400,根据更新后的所述预设行业分类词对关联的公司信息重新分类,其中,在接收到检索请求后,根据检索关键词对应的预设行业分类词获取对应的公司信息。

其中,在确定所述预设行业分类词后,将不同的公司按照所述预设行业分类词进行分类,具体的,当公司的主营产品为单一产品或者所述参考公司的主营行业为单一行业时,公司从所述预设行业分类词中选取相关联的行业分类,作为改公司的行业分类信息;当该公司的主营产品为多个或者该公司的主营行业为多个行业时,该公司从所述预设行业分类词中选取多个与所述参考公司相关联的预设行业分类词,并根据不同行业在所述参考公司中的比重,确定所述参考公司中多个行业的权重值,从而确定所述参考公司的所述行业分类信息。

在确定所述参考公司的所述行业分类信息后,当检索装置检测到用户的检索请求后,根据所述检索请求对公司或公司的经营产品进行检索。具体的,当所述检索请求为对相似的公司进行检索时,在确定所述待检索公司的公司行业后,在对所述参考公司中进行检索时,当检索到与所述待检索公司具有相同的行业名词的所述参考公司时,判断所述参考公司与所述待检索的公司相似;在所述检索请求为对产品进行检索时,在确定所述待检索公司的待检索产品后,确定产品所属的相关行业,并在所述参考公司中进行检索是否存在与相关行业具有相同或相似的产品,当检索到与所述待检索产品具有相同的行业名词时候,判断检索到的产品与所述待检索的产品相同或相似。

本实施例提出的技术方案中,在获取与行业分类相关的行业分类文件后;对所述行业分类文件的内容进行共现处理得到共现关键词,并根据所述共现关键词更新所述预设行业分类词;根据更新后的所述预设行业分类词对关联的公司信息重新分类,调整公司行业类别,从而在接收到检索请求时,能够根据检索请求在获取与检索请求符合公司信息,通过从行业文件中提取共现关键词,对行业分类词进行补充和更新后,使所述行业分类词更加准确,从而解决了现有技术中,对新兴行业的

检索信息不完整不准确的问题。

第二实施例

请参照图3,在上述第一实施例中,步骤S200包括:

S210,对所述行业分类文件进行聚类处理得到至少一个文件组;

其中,所述聚类处理是指通过计算不同所述行业分类文件之间的相似度来确定不同所述行业分类文件之间的关系,具体的,当一所述行业分类文件与另一所述行业分类文件的内容均与冶金行业相关时,这两个所述行业分类文件的相似度较高,可以将两个所述行业分类文件归为同一类别,当一所述行业分类文件与冶金行业相关,另一所述行业分类文件与纺织行业相关时,虽然两个所述行业分类文件均与制造行业相关联,但是两个所述行业分类文件的差别较大,相似度较低,因此不能将两个所述行业分类文件归入同一类别。

S220,对所述文件组内的行业分类文件的内容进行共现处理得到所述文件组对应的共现关键词。

其中,所述共现关键词是指在已有资料中出现,但未存在于现有的预设行业名词中的行业名词。因此可以通过分析所述已有资料,确定所述共现关键词。

具体的,与行业相关的词汇通常多次出现于所述行业分类文件中,通过统计在所述行业分类文件中重复出现的词语组合,从而及确定所述行业分类文件中词语的共现关系。具体来说,当所述行业分类文件中着重对某一特定行业进行介绍时,通常会多次提及与该特定行业相关的行业用语,通过对所述行业用语进行统计,确定所述行业用语的出现次数,从而确定行业分类文件的中可能存在的所述第一新行业名词。

在第二实施例中,上述步骤S300,之前还包括:

对所述共现关键词进行筛选。

在上述实施例的条件下,步骤S300,包括:

采用所述筛选后的所述共现关键词更新所述预设行业分类词。

其中,在确定所述共现关键词后,所述共现关键词中不可避免的包括冗余词汇,所述冗余词汇包括部分新兴行业名词,但该新兴行业还未有明确的主营公司或相关产品,因此该新兴行业名词无法查询到除行业词汇本身外的其他资料内容。在这种情况下,需要对所述共现关键词进行去重处理。具体的,去重处理可以通过对所述行业分类文件进行分析,判断所述行业分类文件中所述共现关键词出现的次数,从而判断所述共现关键词的重要程度,与另一实施方式中,可以通过判断与所述共现关键词相关联行业的营业公司,当不存在与所述共现关键词相关联行业的营业公司时,表示所述共现关键词相关联行业的受关注程度较低,暂时不存在一定的商业潜质,因此可以对所述共现关键词进行去重。

在上述第二实施例中,所述对所述共现关键词进行筛选的步骤包括:

检索所述共现关键词相关联的行业数据;

当未检索到与所述共现关键词相关联的所述行业数据时,删除所述共现关键词。

其中,所述行业数据是指与所述共现关键词相关联的行业的行业信息,所述行业数据可以为主营公司信息或产品信息。

具体的,当一个行业存在投资价值时,会存在以该行业为主营业务的公司,当所述共现关键词对应的行业不存在或存在较少的主营公司时,则无法以该行业作为目标开展投资工作,因此即使所述共现关键词与行业内容相关,但是由于暂时未达到行业规模要求,因此需要将所述共现关键词与相近的行业名称进行合并。

可以理解的是,于另一实施方式中,当一个行业受到相关从业人员重视时,会存在与该行业相关的行业分析资料,所述行业分析资料包括但不限于对其行业的市场规模、竞争格局、发展情况等内容的分析,当无法查询与该行业相关的行业分析资料时,那么表示该行业暂时还无法独立存在或未受到关注,因此需要将所述共现关键词与相近的行业名称进行合并。

第三实施例

请参照图4,在上述第二实施例中,上述步骤S210,包括:

S211,获取各个所述行业分类文件的文件向量,并获取各个所述文件向量之间的距离;

S212,将所述距离小于预设距离的所述文件向量对应的行业分类文件聚类为一个所述文件组。

其中,通过所述数学模型,根据所述行业分类文件中不同的内容信息,将所述行业分类文件进行计算后转换为文本向量,所述文本向量之间的距离可以为欧氏距离或曼哈顿距离或夹角余弦或其他能够用于评价向量之间关系的量,在计算不同的行业分类文件是否属于同一类别时,通过不同所述行业分类文件对应的文件向量之间的距离,当不同所述行业分类文件对应的文件向量的距离大于预设距离时,该不同的所述行业分类文件不属于同一类别,当不同所述行业分类文件对应的文件向量的距离小于或等于预设距离时,该不同的所述行业分类文件属于同一类别,具体的,一所述行业分类文件转换后的所述文本向量与另一所述行业分类文件转换后的所述文本向量的距离较近时,表示一所述行业分类文件提及的行业内容与另一所述行业分类文件体积的行业内容相关联。

第四实施例

请参照图5,在上述第二实施例中,上述步骤S220,包括:

S221,提取各个所述行业分类文件的内容中的关键词;

其中,所述关键词是指在所述行业分类文件中出现,能够体现对应行业的词汇,具体来说,在通信行业中,所述关键词包括但不限于链路、参考信号、无线网络,通过上述关键词,用户或所述检索装置能够判断出与所述行业分类文件相关的行业。

S222,获取各个所述关键词重复出现的次数;

S223,将所述次数大于预设次数的关键词作为所述共现关键词。

其中,当所述行业分类文件中涉及多个关联的行业时,根据所述不同行业的关键词判断所述行业分类文件中的主要相关行业。在具体的实施方式中,当所述行业分类文件同时涉及计算机与通信行业时,所述行业分类文件中可能包括路由,连接,热点等相关词汇,对所述行业分类文件中的不同行业关键词进行统计后,确定所述行业分类文件中的计算机行业词汇比通信行业的关键词重复出现次数多,那么判断所述行业分类文件主要为计算机行业的所述行业分类文件。

其中,当所述行业分类中的关键词的出现次数大于预设次数时,那么判断所述关键词与所述行业分类文件的主要内容相关,因此将所述关键词作为所述行业分类文件的共现关键词。

第五实施例

请参照图6,在上述第一至第四实施例中,步骤S300,包括:

S310,获取所述共现关键词的词向量;

S320,根据所述词向量与预设词向量,更新所述预设行业分类词;

其中,为了获取所述预设词向量,需要将所述预设行业分类词加入数学模型,对所述数学模型进行训练后,通过所述行业分类文件与所述数学模型,获取行业特征词,并将所述行业特征词加入所述数学模型获取预设词向量;然后根据所述词向量与所述预设词向量,更新所述预设行业分类词。

具体的,对所述数学模型进行训练主要用于调节所述数学模型中的参数,从而提高所述数学模型对所述行业分类词的筛选准确性,具体的,所述预设行业分类词是指已经确定的用于行业分类的词汇,由于所述预设行业分类词为准确的行业分类词,将所述预设与行业分类词带入所述数学模型后,能够调整所述数学模型的参数,从而完成对所述数学模型的训练过程。

在对所述数学模型完成训练后,将所述行业分类文件代入所述数学模型,根据已训练的所述数学模型,对所述行业分类文件进行分析,从而确定由所述数学模型在所述行业分类文件中筛选的所述行业分类词。

所述词向量用于表示所述共现关键词通过所述数学模型评估后的向量,所述预设词向量用于表示所述行业特征词通过所述数学模型评估的向量,由于所述共现关键词是通过所述行业分类文件进行共现处理后得到的词语,因此所述共现关键词中会存在与行业分类不相关的词语,而所述行业特征词是根据已训练后的所述数学模型,将所述行业分类文件代入所述数学模型后获得的词语,因此所述行业特征词中均为行业分类词,但会收到所述数学模型的局限性,从而导致所述行业特征词的不完整。通过对比所述词向量与所述预设词向量,确定所述词向量与所述预设词向量的相近程度,从而判断所述词向量的有效性。

第六实施例

请参照图7,在上述实施例中,步骤S320包括:

S321,获取所述词向量与所述预设词向量的相似度;

S322,当所述相似度大于或等于预设相似度时,采用所述词向量相关联的所述共现关键词,并通过所述共现关键词更新所述预设行业分类词。

其中,所述相似度用于表示所述词向量与所述预设词向量的行业分类的相似程度,具体的,所述相似度可以通过所述词向量与所述预设词向量之间的距离进行表示,当所述词向量与所述预设词向量的距离较远时,所述词向量与所述预设词向量的相似度小于预设相似度,那么代表所述词向量对应的所述共现关键词与行业名词相差较大,因此删除所述词向量对应的共现关键词,当所述词向量与所述预设词向量的距离较近,所述词向量与所述预设词向量的相似度大于或等于预设相似度时,代表所述词向量对应的所述贡献关键词与行业名称相关程度较大,因此保留所述词向量对应的共现关键词。在对所述共现关键词去重后,将去重后保留的所述共现关键词根据与所述预设词向量最相近的行业分类更新至所述预设行业分类词中,从而完成所述预设行业分类词的更新。

为实现上述目的,本申请提出一种基于行业分类的检索装置,所述基于行业分类的检索装置包括存储器、处理器及存储在存储器上并可在处理器上运行的基于行业分类的检索程序,所述处理器执行所述基于行业分类的检索程序时实现如上述任一项实施方式所述的方法。

为实现上述目的,本申请提出一种种可读存储介质,其上存储有基于行业分类的检索程序,其特征在于,该基于行业分类的检索程序被处理器执行时实现如上述任一项实施方式所述的方法。

在一些可选的实施方式中,所述处理器可以是中央处理单元(CentralProcessing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器可以是设备的内部存储单元,例如设备的硬盘或内存。所述存储器也可以是设备的外部存储设备,例如设备上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器还可以既包括设备的内部存储单元也包括外部存储设备。所述存储器用于存储所述计算机程序以及设备所需的其它程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:阴虚宜养数据分析与展示方法及装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!