一种用于对企业信息进行多维度组合检索的方法及其系统

文档序号:1937435 发布日期:2021-12-07 浏览:23次 >En<

阅读说明:本技术 一种用于对企业信息进行多维度组合检索的方法及其系统 (Method and system for carrying out multi-dimensional combined retrieval on enterprise information ) 是由 黄永辉 袁石良 于 2021-09-07 设计创作,主要内容包括:本发明公开了一种用于对企业信息进行多维度组合检索的方法及其系统,具体包括以下步骤:步骤一、基础构建;步骤二、学习完善;步骤三、检索展示;步骤四、检索优化;本发明涉及信息检索技术领域。该用于对企业信息进行多维度组合检索的方法及其系统,通过互联网收集企业相关信息资料,先由NLP相关技术去构建词典,再采用bert+bilstm+crf模型架构去学习完善识别方法,构成基于fastapi的python微服务框架+docker+NLP与深度学习的技术框架,利用智能识别算法识别企业信息,以多维度组合检索的方式提供检索服务,不仅不需要大量的检索技巧,还可以满足大量用户的需求,提升用户的体验感,减少了网站跳出率,也对网站排名具有积极方向的帮助。(The invention discloses a method and a system for carrying out multi-dimensional combined retrieval on enterprise information, which specifically comprise the following steps: step one, constructing a foundation; step two, learning is completed; step three, retrieval and display; step four, retrieval optimization; the invention relates to the technical field of information retrieval. According to the method and the system for carrying out the multi-dimensional combined retrieval on the enterprise information, the enterprise related information data is collected through the Internet, a dictionary is built by the NLP related technology, then a bert &#43; bilstm &#43; crf model architecture is adopted to complete the learning and recognition method, a technical framework based on a fastapi python micro-service framework &#43; docker &#43; NLP and deep learning is formed, the enterprise information is recognized by an intelligent recognition algorithm, retrieval service is provided in a multi-dimensional combined retrieval mode, a large number of retrieval skills are not needed, the requirements of a large number of users can be met, the experience of the users is improved, the website jump rate is reduced, and the website ranking is helped in an active direction.)

一种用于对企业信息进行多维度组合检索的方法及其系统

技术领域

本发明涉及信息检索技术领域,具体为一种用于对企业信息进行多维度组合检索的方法及其系统。

背景技术

在互联网上检索一个企业相关的信息,往往无法有效定位到用户需求的信息,在检索时不仅需要叠加大量的关键词,还需要用户去逐条的筛选,非常耗时耗力,且需要一定的检索技巧,对于不具备检索技巧的普通用户而言,往往无法检索到对应的企业信息,导致无法满足用户需求的情况,为此,特提出一种用于对企业信息进行多维度组合检索的方法及其系统,通过多维度组合检索的方式,满足用户的需求。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种用于对企业信息进行多维度组合检索的方法及其系统,解决了上述的问题。

(二)技术方案

为实现上述目的,本发明提供了如下技术方案:一种用于对企业信息进行多维度组合检索的方法,具体包括以下步骤:

步骤一、基础构建:构建fastapi+python的微服务框架,通过docker引擎,收集互联网上的企业信息,并通过NLP相关技术对收集的企业信息进行词典构建,生成对应企业信息的初始检索标签库;

步骤二、学习完善:将步骤一中生成对应企业信息的初始检索标签库导入到bert模型中,输入企业信息语句到bilstm+crf模型架构中,根据输出结果对初始检索标签库中存储的检索标签进行微调,完善步骤一中构建的词典后,将调整后的检索标签扩展至步骤一中的初始检索标签库中,形成微调检索标签库;

步骤三、检索展示:接收用户自然语言形式的输入,利用深度学习算法通过用户输入语句的关键词获得更高级别的特征,即用户检索背后的多层需求,根据需求比照检索标签库,获取多层需求对应的检索标签,检索对应检索标签的企业信息,并进行信息整合,整合后的信息直接投放在展示界面;

步骤四、检索优化:采集用户的浏览对应展示界面展示信息的频次,根据频次结果判断对用户输入语句的分析是否符合用户需求,判断出不够符合用户需求时,采集用户后续输入语句的关键词,串联不符合用户需求时的语句关键词,重复步骤三的操作,实现检索优化。

通过采用上述技术方案,通过互联网收集企业相关信息资料,先由NLP相关技术去构建词典,再采用bert+bilstm+crf模型架构去学习完善识别方法,构成基于fastapi的python微服务框架+docker+NLP与深度学习的技术框架,利用智能识别算法识别企业信息,以多维度组合检索的方式提供检索服务,不仅不需要大量的检索技巧,还可以满足大量用户的需求,提升用户的体验感,减少了网站跳出率,也对网站排名具有积极方向的帮助。

本发明进一步设置为:所述步骤二中输入的语句,句中的每个单词是一条包含词嵌入和字嵌入的词向量,词嵌入为事先训练好的,字嵌入则是随机初始化的,向bilstm+crf模型架构中输入词嵌入向量,之后输出每个单词对应的预测标签,根据预测标签对步骤一中生成的初始检索标签库中对应的初始检索标签进行调整。

通过采用上述技术方案,进行初始检索标签的调整,保证检索结果的精准度。

本发明进一步设置为:所述步骤四中对于是否符合用户需求的判断具体如下:在频次数量较少时,较为符合用户需要,反之,在频次较多时,表示不够符合用户需求。

通过采用上述技术方案,根据用户在得到需要信息后,很少会去浏览其他信息,即对检索结果浏览频次的判断,来确定检索结果是否符合用户需求。

本发明还公开了一种用于对企业信息进行多维度组合检索的系统,包括基础构建单元,所述基础构建单元用于构建服务框架,并针对互联网上的企业信息生成初始检索标签,所述基础构建单元与学习完善单元对接,用于确定初始检索标签的精准度,所述基础构建单元与检索展示单元对接,用于获取多维度检索标签,并对多维度检索标签对应的检索结果进行整合,用于向用户展示用户检索背后的需求信息,所述检索展示单元与检索优化单元对接,用于根据用户浏览检索结果信息频次,判断检索结果是否符合用户需求,并做出对应调整,用于进行检索结果优化。

通过采用上述技术方案,在用户输入检索指令后,即可对指令进行更高级别特征的分析,实现多维度组合检索的目的,再对检索结果进行整合,得到符合用户需求的检索结果,并且可以对用户的需求的满意度进行判断,实现检索的优化。

本发明进一步设置为:所述基础构建单元用于构建fastapi+python的微服务框架,通过docker引擎,收集互联网上的企业信息,并通过NLP相关技术对收集的企业信息进行词典构建,生成对应企业信息的初始检索标签库。

通过采用上述技术方案,实现互联网上企业相关信息的整合,构建出词典和初始检索标签。

本发明进一步设置为:所述学习完善单元还包括词向量输入模块、结果输出模块和比照调整模块,用于将对应企业的初始检索标签库导入到bert模型中,输入企业信息语句到bilstm+crf模型架构中,根据输出结果对初始检索标签库中存储的检索标签进行微调,完善词典的构建后,将调整后的检索标签扩展至初始检索标签库中,形成微调检索标签库。

本发明进一步设置为:所述检索展示单元还包括语义分析模块、索引模块和信息整合展示模块,用于接收用户自然语言形式的输入,利用深度学习算法通过用户输入语句的关键词获得更高级别的特征,即用户检索背后的多层需求,根据需求比照检索标签库,获取多层需求对应的检索标签,检索对应检索标签的企业信息,并进行信息整合,整合后的信息直接投放在展示界面。

本发明进一步设置为:所述检索优化单元还包括频次统计模块和语句整合模块,用于采集用户的浏览对应展示界面展示信息的频次,根据频次结果判断对用户输入语句的分析是否符合用户需求,判断出不够符合用户需求时,采集用户后续输入语句的关键词,串联不符合用户需求时的语句关键词,重复检索展示操作,实现检索优化。

(三)有益效果

本发明提供了一种用于对企业信息进行多维度组合检索的方法及其系统。具备以下有益效果:

(1)该用于对企业信息进行多维度组合检索的方法及其系统,通过互联网收集企业相关信息资料,先由NLP相关技术去构建词典,再采用bert+bilstm+crf模型架构去学习完善识别方法,构成基于fastapi的python微服务框架+docker+NLP与深度学习的技术框架,利用智能识别算法识别企业信息,以多维度组合检索的方式提供检索服务,不仅不需要大量的检索技巧,还可以满足大量用户的需求,提升用户的体验感,减少了网站跳出率,也对网站排名具有积极方向的帮助。

(2)该用于对企业信息进行多维度组合检索的方法及其系统,通过学习完善的方式,以bert+bilstm+crf模型架构进行初始检索标签的调整,保证检索结果的精准度。

(3)该用于对企业信息进行多维度组合检索的方法及其系统,通过根据用户在得到需要信息后,很少会去浏览其他信息,即对检索结果浏览频次的判断,来确定检索结果是否符合用户需求,随后通过后续检索时输入语句的关键词串联进行检索,得到更加详细的检索结果,达到检索优化的目的。

附图说明

图1为本发明基础构建单元的系统原理框图;

图2为本发明学习完善单元的系统原理框图;

图3为本发明检索展示单元的系统原理框图;

图4为本发明检索优化单元的系统原理框图。

图中,1、基础构建单元;2、学习完善单元;3、检索展示单元;4、检索优化单元。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-4,本发明实施例提供以下两种技术方案:

实施例一、

一种用于对企业信息进行多维度组合检索的方法,具体包括以下步骤:

步骤一、基础构建:构建fastapi+python的微服务框架,通过docker引擎,收集互联网上的企业信息,并通过NLP相关技术对收集的企业信息进行词典构建,生成对应企业信息的初始检索标签库;

步骤二、学习完善:将步骤一中生成对应企业信息的初始检索标签库导入到bert模型中,输入企业信息语句到bilstm+crf模型架构中,根据输出结果对初始检索标签库中存储的检索标签进行微调,完善步骤一中构建的词典后,将调整后的检索标签扩展至步骤一中的初始检索标签库中,形成微调检索标签库;

步骤三、检索展示:接收用户自然语言形式的输入,利用深度学习算法通过用户输入语句的关键词获得更高级别的特征,即用户检索背后的多层需求,根据需求比照检索标签库,获取多层需求对应的检索标签,检索对应检索标签的企业信息,并进行信息整合,整合后的信息直接投放在展示界面;

步骤四、检索优化:采集用户的浏览对应展示界面展示信息的频次,根据频次结果判断对用户输入语句的分析是否符合用户需求,判断出不够符合用户需求时,采集用户后续输入语句的关键词,串联不符合用户需求时的语句关键词,重复步骤三的操作,实现检索优化,进一步说明,通过互联网收集企业相关信息资料,先由NLP相关技术去构建词典,再采用bert+bilstm+crf模型架构去学习完善识别方法,构成基于fastapi的python微服务框架+docker+NLP与深度学习的技术框架,利用智能识别算法识别企业信息,以多维度组合检索的方式提供检索服务,不仅不需要大量的检索技巧,还可以满足大量用户的需求,提升用户的体验感,减少了网站跳出率,也对网站排名具有积极方向的帮助。

实施例二、

本实施例作为上一实施例的改进,一种用于对企业信息进行多维度组合检索的方法,具体包括以下步骤:

步骤一、基础构建:构建fastapi+python的微服务框架,通过docker引擎,收集互联网上的企业信息,并通过NLP相关技术对收集的企业信息进行词典构建,需要说明的是,NLP相关技术具体包括文本检索,用于大规模数据的检索;机器翻译,用于跨语种翻译;文本分类;信息抽取,用于从不规则文本中抽取想要的信息;序列标注,用于给文本中的每一个字/词打上相应的标签;文本摘要,用于从给定的文本中,聚焦到最核心的部分,自动生成摘要;生成对应企业信息的初始检索标签库,需要说明的是,初始检索标签库就是一个对应企业信息的初始检索标签;

步骤二、学习完善:将步骤一中生成对应企业信息的初始检索标签库导入到bert模型中,输入企业信息语句,需要说明的是,句中的每个单词是一条包含词嵌入和字嵌入的词向量,词嵌入为事先训练好的,字嵌入则是随机初始化,向bilstm+crf模型架构中输入词嵌入向量,根据输出结果对初始检索标签库中存储的检索标签进行微调,需要说明的是,输出结果为每个单词对应的预测标签,进一步的,根据预测标签对初始检索标签库中对应的初始检索标签进行替换调整,完善步骤一中构建的词典后,将调整后的检索标签扩展至步骤一中的初始检索标签库中,形成微调检索标签库;

步骤三、检索展示:接收用户自然语言形式的输入,利用深度学习算法通过用户输入语句的关键词获得更高级别的特征,即用户检索背后的多层需求,根据需求比照检索标签库,获取多层需求对应的检索标签,检索对应检索标签的企业信息,并进行信息整合,整合后的信息直接投放在展示界面;

步骤四、检索优化:采集用户的浏览对应展示界面展示信息的频次,根据频次结果判断对用户输入语句的分析是否符合用户需求,在频次数量较少时,较为符合用户需要,反之,在频次较多时,表示不够符合用户需求,需要说明的时,频次数量具体判断标准由设定标准频次数量,作为比较阈值,即频率和次数低于或者比较阈值,属于频次数量较少,高于比较阈值时,属于频次数量较多,判断出不够符合用户需求时,采集用户后续输入语句的关键词,串联不符合用户需求时的语句关键词,重复步骤三的操作,实现检索优化。

实施例二相对于实施例一的优点在于:通过根据用户在得到需要信息后,很少会去浏览其他信息,即对检索结果浏览频次的判断,来确定检索结果是否符合用户需求,随后通过后续检索时输入语句的关键词串联进行检索,得到更加详细的检索结果,达到检索优化的目的。

本发明还公开了一种用于对企业信息进行多维度组合检索的系统,包括基础构建单元1,基础构建单元1用于构建服务框架,并针对互联网上的企业信息生成初始检索标签,具体的,基础构建单元1用于构建fastapi+python的微服务框架,通过docker引擎,收集互联网上的企业信息,并通过NLP相关技术对收集的企业信息进行词典构建,生成对应企业信息的初始检索标签库。

作为优选方案,基础构建单元1与学习完善单元2对接,用于确定初始检索标签的精准度,具体的,如附图2所示,学习完善单元2还包括词向量输入模块、结果输出模块和比照调整模块,用于将对应企业的初始检索标签库导入到bert模型中,输入企业信息语句到bilstm+crf模型架构中,根据输出结果对初始检索标签库中存储的检索标签进行微调,完善词典的构建后,将调整后的检索标签扩展至初始检索标签库中,形成微调检索标签库。

作为优选方案,基础构建单元1与检索展示单元3对接,用于获取多维度检索标签,并对多维度检索标签对应的检索结果进行整合,用于向用户展示用户检索背后的需求信息,具体的,如附图3所示,检索展示单元3还包括语义分析模块、索引模块和信息整合展示模块,用于接收用户自然语言形式的输入,利用深度学习算法通过用户输入语句的关键词获得更高级别的特征,即用户检索背后的多层需求,根据需求比照检索标签库,获取多层需求对应的检索标签,检索对应检索标签的企业信息,并进行信息整合,整合后的信息直接投放在展示界面。

检索展示单元3与检索优化单元4对接,用于根据用户浏览检索结果信息频次,判断检索结果是否符合用户需求,并做出对应调整,用于进行检索结果优化,具体的,如附图4所示,检索优化单元4还包括频次统计模块和语句整合模块,用于采集用户的浏览对应展示界面展示信息的频次,根据频次结果判断对用户输入语句的分析是否符合用户需求,判断出不够符合用户需求时,采集用户后续输入语句的关键词,串联不符合用户需求时的语句关键词,重复检索展示操作,实现检索优化。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种数据可视化方法、装置和系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!