一种股票资讯信息推送方法、设备及存储介质

文档序号:1889423 发布日期:2021-11-26 浏览:3次 >En<

阅读说明:本技术 一种股票资讯信息推送方法、设备及存储介质 (Stock information pushing method, equipment and storage medium ) 是由 黎原 于 2021-08-26 设计创作,主要内容包括:本发明公开了一种股票资讯信息推送方法、设备及存储介质,该方法包括以下步骤:获取至少一条资讯信息;对所述至少一条资讯信息中每条资讯信息进行语义分析,得到至少一条资讯信息的关键实体;分别计算所述至少一条资讯信息中每条资讯信息的关键实体与偏好表中偏好项的匹配度,筛选出与偏好表中偏好项的匹配度超过一匹配阈值的关键实体;推送与偏好表中偏好项的匹配度超过一匹配阈值的关键实体对应的资讯信息。本方案通过对资讯信心进行语义分析得到关键实体,通过关键实体与偏好表中偏好项的匹配度筛选用户关心且对用户投资有用的资讯,提高资讯信息对用户投资的可参考性。其推送用户关心的资讯,提高用户投资的可参考性。(The invention discloses a stock information pushing method, equipment and a storage medium, wherein the method comprises the following steps: acquiring at least one piece of information; performing semantic analysis on each piece of information in the at least one piece of information to obtain a key entity of the at least one piece of information; respectively calculating the matching degree of the key entity of each piece of information in the at least one piece of information and the preference item in the preference table, and screening out the key entities of which the matching degree with the preference item in the preference table exceeds a matching threshold; pushing information corresponding to the key entities with the matching degree of the preference items in the preference table exceeding a matching threshold. According to the scheme, the key entities are obtained by performing semantic analysis on the information confidence, the information which is concerned by the user and is useful for the user investment is screened according to the matching degree of the key entities and the preference items in the preference table, and the referential of the information to the user investment is improved. It pushes the information concerned by the user and improves the referential of the investment of the user.)

一种股票资讯信息推送方法、设备及存储介质

技术领域

本发明属于信息推送技术领域,具体地涉及一种股票资讯信息推送方法、设备及存储介 质。

背景技术

在证券类APP或网站等平台中,给用户推荐资讯,供用户参考,用户可从资讯中获取信 息从而更好的管理自己的投资。但是,现有证券类APP或网站等平台中,证券垂直行业提供 的资讯过于平面化且维度单一,即在统一的窗口推送一致的内容,所有用户的看到的内容均 相同,用户关联度较低。用户从海量资讯中获取关联的资讯的需求,其耗时和精准度都会大 打折扣,为用户提供精准资讯参考的作用性不强。

发明内容

为了解决现有现有证券类平台推送信息与用户关联度低的问题,本发明提供一种股票资 讯信息推送方法、设备及存储介质,其推送用户关心的资讯,提高用户投资的可参考性。

本发明通过以下技术方案实现:

本发明第一方面提供一种股票资讯信息推送方法,包括以下步骤:

获取至少一条资讯信息;

对所述至少一条资讯信息中每条资讯信息进行语义分析,得到至少一条资讯信息的关键 实体;

分别计算所述至少一条资讯信息中每条资讯信息的关键实体与偏好表中偏好项的匹配 度,筛选出与偏好表中偏好项的匹配度超过一匹配阈值的关键实体;

推送与偏好表中偏好项的匹配度超过一匹配阈值的关键实体对应的资讯信息。

本方案通过对资讯信心进行语义分析得到关键实体,通过关键实体与偏好表中偏好项的 匹配度筛选用户关心且对用户投资有用的资讯,提高资讯信息对用户投资的可参考性。

在一种可能的设计中,所述对所述至少一条资讯信息中每条资讯信息进行语义分析,包 括:

对所述至少一条资讯信息进行分段,得到至少一个段落;

对所述至少一个段落中的每个段落进行分词处理,得到每个段落的分词集,所述分词集 包括至少一个分词;

分别对分词集中的分词进行实体类的命名实体识别,得到每个分词集的命名实体;

对所述命名实体进行分类,得到至少一个类别,所述类别包括第一类别和第二类别,所 述第一类别包括组织机构名、组织机构代码、人名和证券板块名,所述第二类别包括除第一 类别之外的命名实体;

根据所述第一类别中的命名实体确定关键字集,所述关键字集包括至少一个关键字;

分别计算所述第二类别中所有命名实体与所述关键字集中所有关键字的匹配度;

根据匹配度对所述第二类别中的命名实体进行筛选,将第二类别中筛选出的命名实体与 第一类别中命名实体共同构成对应资讯信息的关键实体。

本方案通过资讯信息进行分段分词处理后各分词进行实体类的命名实体识别,识别出资 讯信息中的各实体,在对各命名实体进行分类,其中,第一类别为与证券相关最直接的内容, 通过对第二类别中命名实体进行占比计算,可筛选出与组织机构名、组织机构代码和人名相 关资讯内容中与证券投资关系不大的资讯,提高关键实体识别的准确性,提高资讯信息推荐 的准确性。

在一种可能的设计中,所述分别计算所述至少一条资讯信息中每条资讯信息的关键实体 与偏好表中偏好项的匹配度,筛选出与偏好表中偏好项的匹配度超过一匹配阈值的关键实 体,包括:

分别计算每条资讯信息关键实体中所述第一类别所有命名实体与偏好表中偏好项的匹 配度,

若第一类别中有至少一个命名实体与偏好表中偏好项完全匹配,则计算第二类别所有命 名实体与偏好表中偏好项的匹配度;

筛选出第二类别中与偏好表中偏好项的完全匹配的命名实体,得到待确认命名实体集, 所述待确认命名实体集包括至少一个命名实体;

计算待确认命名实体中所有命名实体在所述资讯信息中次数,将第二类别中次数超过一 匹配阈值的命名实体作为关键实体。

在证券投资中,用户关心与自己感兴趣的投资标的,通过匹配第一类别中命名实体与偏 好表中偏好项,实现投资标的的识别,在确定有用户感兴趣的投资标的后,再通过第二类别 中命名实体的匹配,筛选用户感兴趣的内容,提高资讯信息推荐的准确性。

在一种可能的设计中,所述方法还包括:

更新偏好表中偏好项。

本方案通过更新偏好表中偏好项,提高资讯内容的匹配度,提高资讯信息推荐的准确性。

在一种可能的设计中,所述更新偏好表中偏好项包括:

获取用户的自选股项,所述自选股项包括股票名、股票代码和板块信息;

根据所述自选股项构建偏好表;

获取用户标记内容,所述标记内容包括被标记股和至少一条与被标记股对应的标记内 容;

分别对所述至少一条与被标记股对应的标记内容中每条标记内容进行实体类的命名实 体识别,得到所述标记内容的命名实体;

构建所述标记内容的命名实体与被标记股之间的对应关系,并根据所述对应关系更新偏 好项。

本发明第二方面提供一种股票资讯信息推送设备,包括依次信号连接的资讯获取单元、 关键实体获取单元、匹配单元和推送单元;

所述资讯获取单元用于获取至少一条资讯信息;

所述关键实体获取单元用于对所述至少一条资讯信息中每条资讯信息进行语义分析,得 到至少一条资讯信息的关键实体;

所述匹配单元用于分别计算所述至少一条资讯信息中每条资讯信息的关键实体与偏好 表中偏好项的匹配度,筛选出与偏好表中偏好项的匹配度超过一匹配阈值的关键实体;

所述推送单元用于推送与偏好表中偏好项的匹配度超过一匹配阈值的关键实体对应的 资讯信息。

在一种可能的设计中,所述关键实体获取单元包括依次信号连接的分段单元、分词单元、 命名实体识别单元、分类单元、关键字获取单元、匹配度计算单元和确认单元;

所述分段单元用于对所述至少一条资讯信息进行分段,得到至少一个段落;

所述分词单元用于对所述至少一个段落中的每个段落进行分词处理,得到每个段落的分 词集,所述分词集包括至少一个分词;

所述命名实体识别单元用于分别对分词集中的分词进行实体类的命名实体识别,得到每 个分词集的命名实体;

所述分类单元用于对所述命名实体进行分类,得到至少一个类别,所述类别包括第一类 别和第二类别,所述第一类别包括组织机构名、组织机构代码、人名和证券板块名,所述第 二类别包括除第一类别之外的命名实体;

所述关键字获取单元用于根据所述第一类别中的命名实体确定关键字集,所述关键字集 包括至少一个关键字;

所述匹配度计算单元用于分别计算所述第二类别中所有命名实体与所述关键字集中所 有关键字的匹配度;

所述确认单元用于根据匹配度对所述第二类别中的命名实体进行筛选,将第二类别中筛 选出的命名实体与第一类别中命名实体共同构成对应资讯信息的关键实体。

本发明第三方面提供一种股票资讯信息推送设备,包括依次通信连接的存储器和控制器, 所述存储器上存储有计算机程序,所述处理器用于读取所述计算机程序,执行第一方面及其 任一种可能中所述的一种股票资讯信息推送方法。

本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令, 当所述指令在计算机上运行时,执行第一方面及其任一种可能中所述的一种股票资讯信息推 送方法。

本发明与现有技术相比,至少具有以下优点和有益效果:

本发明通过对资讯信心进行语义分析得到关键实体,通过关键实体与偏好表中偏好项的 匹配度筛选用户关心且对用户投资有用的资讯,提高资讯信息对用户投资的可参考性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术 描述中所需要使用的附图作简单地介绍。

图1是本发明的流程图。

具体实施方式

下面结合附图及具体实施例来对本发明作进一步阐述。在此需要说明的是,对于这些实 施例方式的说明虽然是用于帮助理解本发明,但并不构成对本发明的限定。本文公开的特定 结构和功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明, 并且不应当理解为本发明限制在本文阐述的实施例中。

应当理解,尽管本文可能使用术语第一、第二等等来描述各种单元,但是这些单元不应 当受到这些术语的限制。这些术语仅用于区分一个单元和另一个单元。例如可以将第一单元 称作第二单元,并且类似地可以将第二单元称作第一单元,同时不脱离本发明的示例实施例 的范围。

应当理解,对于本文中可能出现的术语“和/或”,其仅仅是一种描述关联对象的关联 关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同 时存在A和B三种情况。

应当理解,本文使用的术语仅用于描述特定实施例,并不意在限制本发明的示例实施例。 若本文所使用的,单数形式“一”、“一个”以及“该”意在包括复数形式,除非上下文明 确指示相反意思。

应当理解,在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而, 本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。例如可以 在框图中示出系统,以避免用不必要的细节来使得示例不清楚。在其他实例中,可以不以非 必要的细节来示出众所周知的过程、结构和技术,以避免使得示例实施例不清楚。

如图1所示,本实施例公开了一种股票资讯信息推送方法,该方法可以应用 于电子设备,也可是单独的应用程序,示例性的,该电子设备可以是手机、平板 电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实 (virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等电子设备上,本申请实施例对电子设备的具体类型不作任何

步骤S101、获取至少一条资讯信息。该步骤中,资讯信息可以是相关终端上传的资讯信 息,可以是云服务器存储的资讯信息,也可以是本地存储的资讯信息。资讯信息的获取方式 可以是有线方式,也可以是无线方式,其优选采用周期性获取的方式,减小内容推送的频率, 周期性可以是一天一次、一周一次或者每间隔一定时间一次。

步骤S102、对所述至少一条资讯信息中每条资讯信息进行语义分析,得到至少一条资讯 信息的关键实体。具体的,该步骤包括步骤S1021~步骤S1027。

步骤S1021、对所述至少一条资讯信息进行分段,得到至少一个段落。每条资讯信息可 能具有多个段落,通过对资讯信息进行分段处理,以减小后续一次处理的工作量。分段可以 按照预设文本字数进行划分,也可按照实际段落进行划分,在此不做限定。

步骤S1022、对所述至少一个段落中的每个段落进行分词处理,得到每个段落的分词集, 所述分词集包括至少一个分词。

该步骤中,对段落进行分词处理,可采用预训练完成的神经网络模型实现,神经网络模 型的选择可以是LeNet网络、AlexNet网络、VGGNet网络、NiN网络、GooLeNet网络、ResNet 网络或DenseNet网络。具体且优选的,采用YOLO模型。YOLO模型用于分词处理时,具有速 度快、错误率低、通用性强的优势。

步骤S1023、分别对分词集中的分词进行实体类的命名实体识别,得到每个分词集的命 名实体。

命名实体包括多个类别,比如实体类、时间类、数字类等,本方案仅需对分词进行实体 类命名实体识别,减小识别量,且提高后续方法的计算量。命名实体识别可采用多种方式实 现,比如可采用双向预训练语言模型Bert实现,双向预训练语言模型Bert需实现利用训练 集进行训练,较佳的,训练集为证券行业的相关语料数据。

步骤S1024、对所述命名实体进行分类,得到至少一个类别,所述类别包括第一类别和 第二类别,所述第一类别包括组织机构名、组织机构代码、人名和证券板块名,所述第二类 别包括除第一类别之外的命名实体。此处需要说明的是人名为相关组织结构的法人人名和重 要领导的人名。组织机构名、组织机构代码、上述人名和证券板块名与证券交易中标的物密 切相关,通过将其归为一类,提高资讯信息匹配度。

以一资讯信息的某段为例,其内容为:电池生产商、锂电池行业的2000亿市值龙头某 某锂能(3000**)公告称,公司拟与某股份合作在荆门设立合资公司,该合资公司将专注于锂 离子电池隔离膜和涂布膜的制造,年产能为16亿平米湿法基膜以及与之产能完全匹配的涂 布膜,并优先向公司及其子公司供应,项目计划投资总额为52亿元。合资公司注册资本为 16亿元,其中,某股份指定出资人认缴8.8亿元,持有合资公司55%股权;公司认缴7.2亿 元,持有合资公司45%股权。某股份作为锂电池四大原材料之一的锂电隔膜龙头,今年自2 月底以来涨幅超140%。最新股价为252元每股,市值高达2247亿元。

通过上述步骤S1022至S1024处理得到的的第一类别中的命名实体包括锂电池、电池、 某某锂能、3000**、某股份,第二类别中的命名实体包括合资、隔离膜、涂布膜、湿法基膜、 涨幅、股价等。

步骤S1025、根据所述第一类别中的命名实体确定关键字集,所述关键字集包括至少一 个关键字。此处的关键字类似于标签,即第一类别中命名实体可能涉及到的行业、产品等信 息。以某某锂能(3000**)为例,可避免将该公司组织外出旅游类的资讯信息推送给用户。

关键字与第一类别中命名实体存在对应关系,优选可将其存储在本地,当确认到第一类 别中的所有命名实体时,直接根据对应关系进行调用即可。关键字与第一类别中命名实体存 在对应关系可实时更新,以提高资讯信息匹配的准确度。

步骤S1026、分别计算所述第二类别中所有命名实体与所述关键字集中所有关键字的匹 配度。以上述资讯为例,若根据某某锂能(3000**)的关键字集包括隔离膜、涂布膜、湿法基 膜、NPL**等,则上述隔离膜、涂布膜、湿法基膜可实现与关键字的完全匹配,合资、涨幅、 股价等则不能匹配。

步骤S1027、根据匹配度对所述第二类别中的命名实体进行筛选,将第二类别中筛选出 的命名实体与第一类别中命名实体共同构成对应资讯信息的关键实体。具体的,将可与所述 关键字的完全匹配的命名实体作为关键实体。此时,得到的关键实体包括锂电池、电池、某 某锂能、3000**、某股份、隔离膜、涂布膜、湿法基膜。

步骤S103、分别计算所述至少一条资讯信息中每条资讯信息的关键实体与偏好表中偏好 项的匹配度,筛选出与偏好表中偏好项的匹配度超过一匹配阈值的关键实体。

具体的,该步骤先分别计算每条资讯信息关键实体中所述第一类别所有命名实体与偏好 表中偏好项的匹配度。该步骤中,偏好表中偏好项是根据用户行为来生成的,偏好表中偏好 项需要进行更新,更新可以在任何时候进行。

此处的偏好表中偏好项的更新方法为:获取用户的自选股项,所述自选股项包括股票名、 股票代码和板块信息;此处的板块信息包括但不限于股票名对应公司的产品、原材料等。根 据所述自选股项构建偏好表;获取用户标记内容,所述标记内容包括被标记股和至少一条与 被标记股对应的标记内容;分别对所述至少一条与被标记股对应的标记内容中每条标记内容 进行实体类的命名实体识别,得到所述标记内容的命名实体;构建所述标记内容的命名实体 与被标记股之间的对应关系,并根据所述对应关系更新偏好项。

若此时用户没有标记内容,其生成的偏好表中偏好项则包括股票名、股票代码和板块信 息。

若第一类别中有至少一个命名实体与偏好表中偏好项完全匹配,则计算第二类别所有命 名实体与偏好表中偏好项的匹配度。

再筛选出第二类别中与偏好表中偏好项的完全匹配的命名实体,得到待确认命名实体 集,所述待确认命名实体集包括至少一个命名实体。此时,待确认命名实体集包括隔离膜、 涂布膜、湿法基膜。

最后计算待确认命名实体中所有命名实体在所述资讯信息中次数,将第二类别中次数超 过一匹配阈值的命名实体作为关键实体。若隔离膜、涂布膜、湿法基膜分别在该资讯信息中 出现的次数为3、1、1,匹配阈值为3,则该资讯确认为待推送的资讯。

步骤S104、推送与偏好表中偏好项的匹配度超过一匹配阈值的关键实体对应的资讯信 息。

本发明第二方面提供一种股票资讯信息推送设备,包括依次信号连接的资讯获取单元、 关键实体获取单元、匹配单元和推送单元;

所述资讯获取单元用于获取至少一条资讯信息;

所述关键实体获取单元用于对所述至少一条资讯信息中每条资讯信息进行语义分析,得 到至少一条资讯信息的关键实体;

所述匹配单元用于分别计算所述至少一条资讯信息中每条资讯信息的关键实体与偏好 表中偏好项的匹配度,筛选出与偏好表中偏好项的匹配度超过一匹配阈值的关键实体;

所述推送单元用于推送与偏好表中偏好项的匹配度超过一匹配阈值的关键实体对应的 资讯信息。

在一种可能的设计中,所述关键实体获取单元包括依次信号连接的分段单元、分词单元、 命名实体识别单元、分类单元、关键字获取单元、匹配度计算单元和确认单元;

所述分段单元用于对所述至少一条资讯信息进行分段,得到至少一个段落;

所述分词单元用于对所述至少一个段落中的每个段落进行分词处理,得到每个段落的分 词集,所述分词集包括至少一个分词;

所述命名实体识别单元用于分别对分词集中的分词进行实体类的命名实体识别,得到每 个分词集的命名实体;

所述分类单元用于对所述命名实体进行分类,得到至少一个类别,所述类别包括第一类 别和第二类别,所述第一类别包括组织机构名、组织机构代码、人名和证券板块名,所述第 二类别包括除第一类别之外的命名实体;

所述关键字获取单元用于根据所述第一类别中的命名实体确定关键字集,所述关键字集 包括至少一个关键字;

所述匹配度计算单元用于分别计算所述第二类别中所有命名实体与所述关键字集中所 有关键字的匹配度;

所述确认单元用于根据匹配度对所述第二类别中的命名实体进行筛选,将第二类别中筛 选出的命名实体与第一类别中命名实体共同构成对应资讯信息的关键实体。

本发明第三方面提供一种股票资讯信息推送设备,包括依次通信连接的存储器和控制 器,所述存储器上存储有计算机程序,所述处理器用于读取所述计算机程序,执行第一方面 及其任一种可能中所述的一种股票资讯信息推送方法。具体举例的,所述存储器可以但不限 于包括随机存取存储器(Random-Access Memory,RAM)、只读存储器(Read-OnlyMemory, ROM)、闪存(Flash Memory)、先进先出存储器(First Input First Output,FIFO)和 或先进后出存储器(First Input Last Output,FILO)等等;所述处理器可以不限于采用 型号为STM32F105系列的微处理器。此外,所述计算机设备还可以但不限于包括有电源单元、 显示屏和其它必要的部件。

本发明第二方面、第三方面公开的设备,其运行原理与第一方面相同,在此不再赘述。

本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指 令,当所述指令在计算机上运行时,执行第一方面及其任一种可能中所述的一种股票资讯信 息推送方法。其中,所述计算机可读存储介质是指存储数据的载体,可以但不限于包括软盘、 光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等,所述计算机可以是通用计算机、 专用计算机、计算机网络、或者其他可编程装置。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发 明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的 技术方案进行修改,或者对其中部分技术特征进行等同替换。而这些修改或者替换,并不使 相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:资源推荐模型的训练方法、资源推荐方法、装置及服务器

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!