关键词联想方法、装置、电子设备及存储介质

文档序号:1921696 发布日期:2021-12-03 浏览:17次 >En<

阅读说明:本技术 关键词联想方法、装置、电子设备及存储介质 (Keyword association method and device, electronic equipment and storage medium ) 是由 宗宇 李婷 丁锐 于 2021-09-18 设计创作,主要内容包括:本发明提供一种关键词联想方法、装置、电子设备及存储介质,可应用于人工智能领域或金融领域,对于一个用户,可以根据其对知识库的搜索记录来计算表征其对不同主题偏好程度的主题特征,进而获取表征知识库中不同关键词热门程度的关键词特征,再以主题特征和关键词特征来向该用户推荐相关的目标关键词。基于本发明,能够实现对用户的个性化联想词推荐,从而更加符合用户的期望,提升搜索体验和效率。(The invention provides a keyword association method, a keyword association device, electronic equipment and a storage medium, which can be applied to the field of artificial intelligence or the field of finance. Based on the invention, the personalized suggested word recommendation for the user can be realized, so that the expectation of the user is better met, and the search experience and efficiency are improved.)

关键词联想方法、装置、电子设备及存储介质

技术领域

本发明涉及人工智能技术领域,更具体地说,涉及一种关键词联想方法、装置、电子设备及存储介质。

背景技术

搜索的智能提示是应用搜索的利器,主要作用是避免用户输入错误的搜索词,将用户引导到相应的关键词上,提升用户体验。

但是,传统的按照热门推荐关键词的方式常无法符合用户的期望。

发明内容

有鉴于此,为解决上述问题,本发明提供一种关键词联想方法、装置、电子设备及存储介质,技术方案如下:

一种关键词联想方法,所述方法包括:

根据目标用户对知识库的搜索记录计算所述目标用户的主题特征,所述主题特征能够表征所述目标用户对不同主题的偏好程度;

获取所述知识库的关键词特征,所述关键词特征能够表征所述知识库中不同关键词的热门程度;

根据所述主题特征和所述关键词特征向所述目标用户推送与其相关的目标关键词。

优选的,所述根据目标用户对知识库的搜索记录计算所述目标用户的主题特征,包括:

调取所述目标用户在目标时段内对所述知识库的目标搜索记录,并从所述目标搜索记录中提取搜索指标,所述搜索指标至少包括所述目标用户对不同主题下知识的点击量;

针对每个主题来说,根据所述目标用户在该主题下知识的点击量计算该主题的搜索次数;

根据不同主题的搜索次数确定所述主题特征。

优选的,所述搜索指标还包括:所述目标用户对不同主题下知识的浏览时长;

所述根据目标用户对知识库的搜索记录计算所述目标用户的主题特征,还包括:

针对每个主题来说,根据所述目标用户在该主题下知识的浏览时长计算该主题的搜索时长;

相应的,所述根据不同主题的搜索次数确定所述主题特征,包括:

根据不同主题的搜索次数和搜索时长确定所述主题特征。

优选的,所述根据所述主题特征和所述关键词特征向所述目标用户推送与其相关的目标关键词,包括:

获取所述主题特征的第一权重系数、以及所述关键词特征的第二权重系数;

对于所述知识库中的每个关键词来说,根据所述主题特征中该关键词所属主题的第一特征、所述第一权重系数、所述关键词特征中该关键词的第二特征和所述第二权重系数,计算该关键词与所述目标用户的关联程度;

以关联程度由高到低的次序,将所述知识库中的不同关键词排序输出。

优选的,所述获取所述主题特征的第一权重系数、以及所述关键词特征的第二权重系数,包括:

通过逻辑回归模型获取所述第一权重系数和所述第二权重系数。

一种关键词联想装置,所述装置包括:

主题特征计算模块,用于根据目标用户对知识库的搜索记录计算所述目标用户的主题特征,所述主题特征能够表征所述目标用户对不同主题的偏好程度;

关键词特征获取模块,用于获取所述知识库的关键词特征,所述关键词特征能够表征所述知识库中不同关键词的热门程度;

关键词推送模块,用于根据所述主题特征和所述关键词特征向所述目标用户推送与其相关的目标关键词。

优选的,所述主题特征计算模块,具体用于:

调取所述目标用户在目标时段内对所述知识库的目标搜索记录,并从所述目标搜索记录中提取搜索指标,所述搜索指标至少包括所述目标用户对不同主题下知识的点击量;针对每个主题来说,根据所述目标用户在该主题下知识的点击量计算该主题的搜索次数;根据不同主题的搜索次数确定所述主题特征。

优选的,所述关键词推送模块,具体用于:

获取所述主题特征的第一权重系数、以及所述关键词特征的第二权重系数;对于所述知识库中的每个关键词来说,根据所述主题特征中该关键词所属主题的第一特征、所述第一权重系数、所述关键词特征中该关键词的第二特征和所述第二权重系数,计算该关键词与所述目标用户的关联程度;以关联程度由高到低的次序,将所述知识库中的不同关键词排序输出。

一种电子设备,所述电子设备包括:至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述存储器存储的程序,所述程序用于实现所述的关键词联想方法。

一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行所述的关键词联想方法。

相较于现有技术,本发明实现的有益效果为:

本发明提供一种关键词联想方法、装置、电子设备及存储介质,对于一个用户,可以根据其对知识库的搜索记录来计算表征其对不同主题偏好程度的主题特征,进而获取表征知识库中不同关键词热门程度的关键词特征,再以主题特征和关键词特征来向该用户推荐相关的目标关键词。基于本发明,能够实现对用户的个性化联想词推荐,从而更加符合用户的期望,提升搜索体验和效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的关键词联想方法的方法流程图;

图2为本发明实施例提供的关键词联想方法的部分方法流程图;

图3为本发明实施例提供的关键词联想方法的另一部分方法流程图;

图4为本发明实施例提供的关键词联想方法的再一部分方法流程图

图5为本发明实施例提供的关键词联想装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明实施例提供一种关键词联想方法,能够改善关键词联想的排序,为用户提供更满意的关键词推荐,参见图1所示的方法流程图,该方法包括如下步骤:

S10,根据目标用户对知识库的搜索记录计算目标用户的主题特征,主题特征能够表征目标用户对不同主题的偏好程度。

本发明实施例中,当检测到目标用户登录到搜索界面后,通过调取其在知识库中的搜索记录,搜索记录中包含该目标用户每次搜索所产生的信息,比如搜索时间、搜索的关键词,搜索到的知识、浏览的知识等信息。

此外,为使用户在知识库中搜索到其需要的知识,根据知识的内容可以从中提取关键词,用户使用该关键词即可在知识库中匹配该知识。此外,考虑到不同知识具有相应的主题,因此可以对知识库设置多个主题,每个主题下包含相应知识的关键词。

由此,通过调取目标用户的搜索记录,根据其以往浏览的知识可以确定用户对于不同主题的喜好程度。

具体实现过程中,步骤S10“根据目标用户对知识库的搜索记录计算目标用户的主题特征”可以采用如下步骤,方法流程图如图2所示:

S101,调取目标用户在目标时段内对知识库的目标搜索记录,并从目标搜索记录中提取搜索指标,搜索指标至少包括目标用户对不同主题下知识的点击量。

本发明实施例中,可以对搜索记录调取的时段进行设置,比如将距离当前最近的一周作为目标时段,以调用目标用户在该目标时段内对知识库的搜索记录,即目标搜索记录。

对于目标搜索记录,其中包含目标用户每次对知识库搜索所产生的信息,因此可以从目标搜索记录中提取指定的搜索指标,比如目标用户对不同主题下知识的点击量。具体的,先从目标搜索记录中确定目标用户在该目标时段内浏览的多条知识,而由于每条知识被浏览前需要由目标用户对知识进行点击,以此统计到目标用户在该目标时段内的点击量,而由于每条知识具有相应的主题,因此可以将知识的点击量划分到不同主题下,获得不同主题下所有知识的点击量之和,以此作为主题的点击量。

S102,针对每个主题来说,根据目标用户在该主题下知识的点击量计算该主题的搜索次数。

本发明实施例中,目标用户在目标时段内浏览的每条知识,都具有相应的主题,对此在将知识的点击量划分到不同主题下之后,可以根据每个主题下知识的点击量确定该主题的搜索次数,比如可以直接将知识的点击量作为主题的搜索次数。

S103,根据不同主题的搜索次数确定主题特征。

本发明实施例中,可以以搜索次数对主题进行排序,搜索次数越高表示目标用户对该主题的偏好程度越高。当然,还可以根据不同主题的搜索次数,计算每个主题的搜索次数占比,搜索次数占比越高表示目标用户对该主题的偏好程度越高。

在其他一些实施例中,为优化主题特征,搜索指标还包括目标用户对不同主题下知识的浏览时长。相应的,在图2所示的方法流程图的基础上,还包括如下步骤,方法流程如图3所示:

S104,针对每个主题来说,根据目标用户在该主题下知识的浏览时长计算该主题的搜索时长。

本发明实施例中,对于每个主题来说,一方面统计其搜索次数、另一方面统计其搜索时长。具体的,可以将每个主题下知识的浏览时长之和作为主题的搜索时长。

相应的,步骤S103“根据不同主题的搜索次数确定主题特征”可以采用如下步骤:

根据不同主题的搜索次数和搜索时长确定主题特征。

本发明实施例中,目标用户对某一主题的偏好程度受两方面影响,第一方面是该主题的搜索次数、第二方面是该主题的搜索时长。对于搜索次数和搜索时长对偏好程度的影响,可以按照实际场景来设置。具体的,可以使用一个算法模型来预测,将一个主题的搜索次数和搜索时长输入到该算法模型中,由该算法模型输出该主题对应的偏好程度。

S20,获取知识库的关键词特征,关键词特征能够表征知识库中不同关键词的热门程度。

本发明实施例中,对于知识库中所有知识的关键词,可以根据关键词被全量用户的搜索次数来确定该关键词的热门程度,搜索次数越高表示该关键词越热门。

S30,根据主题特征和关键词特征向目标用户推送与其相关的目标关键词。

本发明实施例中,根据主题特征和关键词特征,计算知识库中的不同关键词与目标用户的关联程度,将关联程度高于对应阈值的关键词作为向目标用户推送的目标关键词。

具体实现过程中,步骤S30“根据主题特征和关键词特征向目标用户推送与其相关的目标关键词”可以采用如下步骤,方法流程图如图3所示:

S301,获取主题特征的第一权重系数、以及关键词特征的第二权重系数。

本发明实施例中,对于主题特征和关键词特征均设置一权重参数,该权重参数可以由管理者配置,还可以根据逻辑回归模型计算得到。

S302,对于知识库中的每个关键词来说,根据主题特征中该关键词所属主题的第一特征、第一权重系数、关键词特征中该关键词的第二特征和第二权重系数,计算该关键词与目标用户的关联程度。

本发明实施例中,对于知识库中的每个关键词来说,其可以在主题特征中找到其所属主题对应的目标用户的偏好程度,以此获得第一特征。当然,如果该关键词所属的主题从未被目标用户搜索过,则第一特征为空。此外,对于知识库中的每个关键词来说,其可以在关键词特征中找到其对应的热门程度,以此获得第二特征。

进一步,以加权计算的方式来计算该关键与目标用户的关联程度,具体的,将第一特征*第一权重系数+第二特征*第二权重系数的计算结果作为关联程度。

S303,以关联程度由高到低的次序,将知识库中的不同关键词排序输出。

本发明实施例中,按照关联程度由高到低的次序,对不同关键词进行排序,输出关联程度最高的K个关联词,K可以由管理者配置,还可以由目标用户配置,本发明实施例对此不做限定。

本发明实施例提供的关键词联想方法,对于一个用户,可以根据其对知识库的搜索记录来计算表征其对不同主题偏好程度的主题特征,进而获取表征知识库中不同关键词热门程度的关键词特征,再以主题特征和关键词特征来向该用户推荐相关的目标关键词。基于本发明,能够实现对用户的个性化联想词推荐,从而更加符合用户的期望,提升搜索体验和效率。

基于上述实施例提供的关键词联想方法,本发明实施例则对应提供执行该关键词联想方法的装置,该装置的结构示意图如图4所示,包括:

主题特征计算模块10,用于根据目标用户对知识库的搜索记录计算目标用户的主题特征,主题特征能够表征目标用户对不同主题的偏好程度;

关键词特征获取模块20,用于获取知识库的关键词特征,关键词特征能够表征知识库中不同关键词的热门程度;

关键词推送模块30,用于根据主题特征和关键词特征向目标用户推送与其相关的目标关键词。

可选的,主题特征计算模块10,具体用于:

调取目标用户在目标时段内对知识库的目标搜索记录,并从目标搜索记录中提取搜索指标,搜索指标至少包括目标用户对不同主题下知识的点击量;针对每个主题来说,根据目标用户在该主题下知识的点击量计算该主题的搜索次数;根据不同主题的搜索次数确定主题特征。

可选的,搜索指标还包括:目标用户对不同主题下知识的浏览时长;

主题特征计算模块10,还用于:

针对每个主题来说,根据目标用户在该主题下知识的浏览时长计算该主题的搜索时长;

相应的,根据不同主题的搜索次数确定主题特征的主题特征计算模块10,具体用于:

根据不同主题的搜索次数和搜索时长确定主题特征。

可选的,关键词推送模块30,具体用于:

获取主题特征的第一权重系数、以及关键词特征的第二权重系数;对于知识库中的每个关键词来说,根据主题特征中该关键词所属主题的第一特征、第一权重系数、关键词特征中该关键词的第二特征和第二权重系数,计算该关键词与目标用户的关联程度;以关联程度由高到低的次序,将知识库中的不同关键词排序输出。

可选的,关键词推送模块30,还用于:

通过逻辑回归模型获取第一权重系数和第二权重系数。

需要说明的是,本发明实施例中各模块的细化功能可以参见上述关键词联想方法实施例对应公开部分,在此不再赘述。

基于上述实施例提供的关键词联想方法,本发明实施例则对应提供一种电子设备,电子设备包括:至少一个存储器和至少一个处理器;存储器存储有程序,处理器调用存储器存储的程序,程序用于实现关键词联想方法。

基于上述实施例提供的关键词联想方法,本发明实施例则对应提供一种存储介质,存储介质中存储有计算机可执行指令,计算机可执行指令用于执行关键词联想方法。

需要说明的是,本发明提供的关键词联想方法、装置、电子设备及存储介质可用于人工智能领域或金融领域。上述仅为示例,并不对本发明提供的关键词联想方法、装置、电子设备及存储介质的应用领域进行限定。

以上对本发明所提供的一种关键词联想方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素,或者是还包括为这些过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:视频推荐方法、装置、电子设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!