会议纪要的生成方法及装置、电子设备及存储介质

文档序号:1156525 发布日期:2020-09-15 浏览:4次 >En<

阅读说明:本技术 会议纪要的生成方法及装置、电子设备及存储介质 (Method and device for generating conference summary, electronic equipment and storage medium ) 是由 吴猛 赵小柱 梁亮 李婷姝 张珍 王弄笛 胡盼盼 王玉婷 郭旦萍 赵瑞丰 于 2020-06-05 设计创作,主要内容包括:本申请提供的会议纪要的生成方法及装置、电子设备及存储介质,对发言者的音频进行语音识别得到发言者的发言文本,并依据会议中每个发言者对应的发言文本,生成会议纪要初稿,可以避免采用人工记录速度慢或人为主观的因素导致的记录准确率低的问题,同时,从预设的知识库中获取会议纪要初稿的关键词(例如关键工作项目)对应的目标信息集,并将目标信息集写入会议纪要初稿预设的位置中,得到会议纪要。因为目标信息集包括的信息与关键字关联的历史信息,所以从会议纪要中可以了解到关键工作项目的发展历程的信息。(The application provides a method and a device for generating a conference summary, an electronic device and a storage medium, wherein voice recognition is performed on the audio of a speaker to obtain a speech text of the speaker, and a conference summary first draft is generated according to the speech text corresponding to each speaker in a conference, so that the problem of low recording accuracy caused by the fact that manual recording speed is slow or artificial subjective factors are adopted can be avoided, meanwhile, a target information set corresponding to keywords (such as key work items) of the conference summary first draft is obtained from a preset knowledge base, and the target information set is written into a preset position of the conference summary first draft to obtain the conference summary. Because the target information set includes information associated with the historical information of the keywords, information of the development history of the key work items can be known from the conference summary.)

会议纪要的生成方法及装置、电子设备及存储介质

技术领域

本申请涉及数据处理领域,尤其涉及会议纪要的生成方法及装置、电子设备及存储介质。

背景技术

在公司的管理过程中,经常需要对各项工作进行会议报告讨论,会议中通常通过会议记录员对会议中各个发言者的内容进行记录整理,形成会议纪要。目前,通过人工记录的方式得到的会议纪要往往准确率低(例如,因为记录速度慢导致记录遗漏部分内容,以及人为主观的因素导致记录偏差等)且记录的会议纪要只展示本次会议的情况,不便于了解会议中所讨论到的各个关键工作项目的发展历程。

所以,如何提高会议纪要的正确率以及更全面的展示会议的各个工作项目的信息,成为亟待解决的问题。

发明内容

为了实现上述目的,本申请提供了以下技术方案:

一种会议纪要的生成方法,包括:

依据会议中每个发言者对应的发言文本,生成会议纪要初稿,所述发言文本依据对所述发言者的发言音频进行语音识别得到;

确定所述会议纪要初稿中包括的关键字;

获取与所述关键字对应的目标信息集,所述目标信息集中包括与所述关键字关联的历史信息;

将所述目标信息集写入所述会议纪要初稿中,得到会议纪要。

上述的方法,可选的,依据会议中每个发言者对应的发言文本,生成会议纪要初稿,包括:

按照各个所述发言文本的标记时间,以及所述发言文本之间的逻辑连接关系,确定各个所述发言文本的连接顺序;所述标记时间为采集所述发言文本对应的发言音频的初始时间点;

针对每个所述发言文本,将所述发言文本对应的发言者的身份信息添加至所述发言文本中;所述发言文本对应的发言者的身份信息,依据所述发言者的所述发言音频以及预先存储的所述发言者的声纹特征确定;

对添加所述身份信息的每个所述发言文本进行分析,保留所述发言文本中预设的句子组成成分,得到所述发言文本对应的目标文本;

按照各个所述目标文本对应的所述发言文本的所述连接顺序,在预设的会议纪要模板中依次写入各个所述目标文本;得到所述会议纪要初稿。

上述的方法,可选的,所述获取所述关键字对应的目标信息集,包括:

确定目标实体节点,所述目标实体节点为所述关键字在预先构建的知识图谱模型中对应的实体节点;所述知识图谱中包括的所述实体节点依据历史会议纪要中包括知识点得到;

将与所述目标实体节点存在连接边的所有所述实体节点,作为所述目标信息集中包括的目标信息。

上述的方法,可选的,所述得到所述会议纪要之后,还包括:

输出所述会议纪要,并在接收到用户输入的确认所述会议纪要无误的指令后,将所述会议纪要中包括的各个知识点作为所述实体节点存储至所述知识图谱中。

上述的方法,可选的,所述确定所述会议纪要初稿中包括的关键字,包括:

将所述会议纪要输入识别模型中,使所述识别模型依据预设的关键字提取算法,从所述会议纪要中提取并输出所述关键字。

上述的方法,可选的,所述将所述目标信息集写入所述会议纪要初稿中,得到所述会议纪要,包括:

为所述目标信息集和与所述目标信息集对应的关键字设定匹配标识;所述匹配标识用于指示所述目标信息集与所述关键字对应;所述目标信息集对应的关键字为所述目标信息集依据所述关键字得到;

将携带所述匹配标识的所述目标信息集,写入所述会议纪要初稿的预设位置中,得到所述会议纪要。

上述的方法,可选的,还包括:在所述目标信息集包括多条不同的目标信息的情况下,按照每条所述目标信息的生成时间的顺序,在所述目标信息集中依次排列各条所述目标信息。

一种会议纪要的生成装置,包括:

第一生成单元,用于依据会议中每个发言者对应的发言文本,生成会议纪要初稿,所述发言文本依据对所述发言者的发言音频进行语音识别得到;

确定单元,用于确定所述会议纪要初稿中包括的关键字;

获取单元,用于获取与所述关键字对应的目标信息集,所述目标信息集中包括与所述关键字关联的历史信息;

第二生成单元,用于将所述目标信息集写入所述会议纪要初稿中,得到会议纪要。

一种电子设备,包括:处理器和存储器,所述存储器用于存储程序;所述处理器用于运行所述程序,以实现上述的会议纪要的生成的方法。

一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的会议纪要的生成方法。

本申请提供的方法及装置,对发言者的音频进行语音识别得到发言者的发言文本,并依据会议中每个发言者对应的发言文本,生成会议纪要初稿,可以避免采用人工记录速度慢或人为主观的因素导致的记录准确率低的问题,同时,从预设的知识库中获取会议纪要初稿的关键词(例如关键工作项目)对应的目标信息集,并将目标信息集写入会议纪要初稿中,得到会议纪要。因为目标信息集中包括与关键字关联的历史信息,所以从会议纪要中可以了解到关键工作项目的发展历程的信息。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的会议纪要的生成方法的流程图;

图2为本申请实施例公开的依据会议中每个发言者对应的发言文本,生成会议纪要初稿方法的流程图;

图3为本申请实施例公开的会议纪要的生成装置的结构示意图;

图4为本申请实施例公开的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

图1为本申请实施提供的一种会议纪要的生成方法,可以包括以下步骤:

S101、依据会议中每个发言者对应的发言文本,生成会议纪要初稿。

本实施例中,实时采集会议中每位发言者的发言音频,并基于预设的语音识别工具对发言音频进行语音识别,得到对应的发言内容。具体的语音识别方法可以参考现有技术。

本步骤中,生成的会议纪要初稿是对每个发言文本进行预处理后得到的文本,具体实现方式可以参考图2所示的流程图。

S102、确定会议纪要初稿中包括的关键字。

本步骤的实施方式可以是:将会议纪要输入预设的识别模型中,使识别模型依据预设的关键字提取算法,从会议纪要中提取并输出关键字。关键字提取算法可以是TF-IDF算法或TextRank算法等,利用TF-IDF算法或TextRank算法,获取得到文档的关键字的详细过程可以参考现有技术。

当然,还可以将会议纪要初稿与预设的关键词库进行匹配,将会议纪要初稿中包括的且存在于关键词库中的词语作为会议纪要初稿的关键词。其中,关键词库中包括的词语可以结合需求自行设定。

S103、获取与关键字对应的目标信息集。

本实施例中,目标信息集中包括与关键字关联的历史信息,例如,关键字为某一项目,则关联的历史信息可以是关于项目的介绍信息,以及项目的历史进展信息等。

本步骤的具体实施方式可以包括步骤A1至步骤A2:

步骤A1、确定目标实体节点。

目标实体节点为关键字在预先构建的知识图谱模型中对应的实体节点。

构建得到的知识图谱由多个实体节点组成,知识图谱中包括的实体节点为历史会议纪要中包括知识点,历史会议纪要是历史召开的会议产生的会议纪要。进一步的,本实施例的知识图谱中的每个实体节点可以携带对应会议的会议名称以及会议举办时间,实体节点对应的会议为,实体节点为会议的会议纪要的知识点。本实施例中,根据知识点构建知识图谱的详细过程可以参考现有技术。此处不再赘述。

本步骤中,可以通过将关键字与知识图谱中的各个实体节点进行匹配,并将匹配得到的实体节点,确定为关键字在的知识图谱模型中对应的实体节点。关键字与实体节点匹配可以是,关键字与实体节点相同,或相似度达到预设的阈值。

步骤A2、将与目标实体节点存在连接边的所有实体节点,作为目标信息集中包括的目标信息。

本实施例中,任意两个通过连接边连接的实体节点,为存在关联关系的节点,任意一个实体节点可以通过连接边与多个不同的实体节点连接。例如,第一实体节点为项目名称,则与第一实体节点连接的第二实体节点可以是,项目的成立时间、项目的负责人、或者项目的进度情况等。

本实施例中,将与实体节点存在连接边的所有实体节点,作为目标信息集中包括的目标信息,使目标信息集中包括的每个目标信息都是与关键字关联的信息。进一步的,因为知识图谱中包括的实体节点为历史生成的会议纪要中包括知识点,所以,目标信息集中包括的目标信息为与关键字关联的历史会议中涉及到的信息。

S104、将目标信息集写入会议纪要初稿中,得到会议纪要。

本步骤的具体实施方式包括步骤B1和步骤B2:

步骤B1、为目标信息集和与目标信息集对应的关键字设定匹配标识。

匹配标识用于指示目标信息集与关键字对应,目标信息集对应的关键字为目标信息集依据关键字得到。匹配标识可以是匹配编码,也是在连接目标信息集与关键字的匹配线条,任何可以指示目标信息集与关键字对应的标识都可以作为匹配标识。

步骤B2、将携带匹配标识的目标信息集,写入会议纪要初稿的预设位置中,得到会议纪要。

本步骤中,将将携带匹配标识的目标信息集,写入会议纪要初稿,使得到的会议纪要为可以展示出与关键字关联的目标信息。

本实施中,在目标信息集包括多条不同的目标信息的情况下,可以按照每条目标信息中包括的时间点(例如会议召开的时间点)的先后顺序,在目标信息集中依次排列各条目标信息,使展示的目标信息集中的目标信息按照时间顺序排列,具有更好的可读性。

本实施例提供的方法,对发言者的音频进行语音识别得到发言者的发言文本,并依据会议中每个发言者对应的发言文本,生成会议纪要初稿,可以避免采用人工记录速度慢或人为主观的因素导致的记录准确率低的问题,同时,从预设的知识库中获取会议纪要初稿的关键词(例如关键工作项目)对应的目标信息集,并将目标信息集写入会议纪要初稿预设的位置中,得到会议纪要。因为目标信息集包括为与关键字关联的历史信息,所以从会议纪要中可以了解到关键工作项目的发展历程的信息。

上述实施例中,得到会议纪要后,输出会议纪要,并在接收到用户输入的确认会议纪要无误的指令后,存储会议纪要,获取会议纪要中的各个知识点,并将会议纪要中包括的各个知识点作为实体节点存储至知识图谱中。

图2为上述实施例的S101中依据会议中每个发言者对应的发言文本,生成会议纪要初稿的具体实施方式,可以包括以下步骤:

S201、按照各个发言文本的标记时间,以及发言文本之间的逻辑连接关系,确定各个发言文本的连接顺序。

本实施例中,发言文本的标记时间为采集发言文本对应的发言音频的初始时间点,也是发言者开始发言对应的时间点。

本步骤的具体实现方式为:将各个发言文本的标记时间的从前到后的顺序,作为各个发言文本的第一连接顺序,采用自然语言处理技术确定发言文本之间的逻辑连接关系,并基于发言文本之间的逻辑连接关系,对各个发言文本的第一连接顺序进行调整,例如,各个发言文本的第一连接顺序为:发言文本A-发言文本B-发言文本C-发言文本D,发言文本之间的逻辑连接关系为发言文本A连接发言文本D,则将第一连接顺序调整为发言文本A-发言文本D-发言文本B-发言文本C。最后将调整后的各个发言文本的连接顺序,作为最终的连接顺序。其中,逻辑连接关系包括上下文逻辑关系、以及事件关联关系等。具体的,采用自然语言处理技术确定发言文本之间的逻辑连接关系的详细方式可以参考现有技术。

S202、针对每个发言文本,将发言文本对应的发言者的身份信息添加至发言文本中。

发言者的身份信息可以是发言者的姓名,发言文本对应的发言者的身份信息,依据发言者的音频以及预先存储的发言者的声纹特征确定,

本步骤的具体实现方式为:对采集得到的发言音频进行声纹识别,得到发言者的声纹特征,将发言者的声纹特征与预先存储的声纹特征进行匹配,并将匹配得到的声纹特征预设对应的身份信息,作为发言文本对应的发言者的身份信息。在将发言者的声纹特征与预先存储的声纹特征进行匹配,得不到匹配结果的情况下,可以采用预设的备用身份信息,作为发言文本对应的发言者的身份信息。最后按照句子成分,将发言者的身份信息作为至发言文本的主语,将发言者的身份信息添加至发言文本中。

S203、对添加身份信息的每个发言文本进行分析,保留发言文本中预设的句子组成成分,得到发言文本对应的目标文本。

本步骤中,采用自语言处理方法对每个发言文本进行预处理,删除各种语气词等非必要的句子组成成分(例如形容词成分),保留发言文本中预设的句子组成成分,(例如主语成分、谓语成分以及宾语成分等)从而得到发言文本对应的目标文本。

S204、按照各个目标文本对应的发言文本的连接顺序,在预设的会议纪要模板中依次写入各个目标文本,得到会议纪要初稿。

本步骤中,可以采用每个目标文本之间换行的方式,依次将各个目标文本写入会议纪要模板中。

本实施例提供的方法,根据各个发言文本的标记时间的从前到后的顺序,以及逻辑连接关系,确定每个发言者对应的发言文本在会议纪要初稿中的顺序,以及对发言文本进行句子成分的预处理,保留发言文本中预设的必要句子组成成分,使得到的会议纪要初稿具有更好的可读性。

图3为本申请实施例提供的一种会议纪要生成的装置300的结构示意图,包括:

第一生成单元301,用于依据会议中每个发言者对应的发言文本,生成会议纪要初稿,发言文本依据对发言者的发言音频进行语音识别得到。

确定单元302,用于确定会议纪要初稿中包括的关键字。

获取单元303,用于获取与关键字对应的目标信息集,目标信息集中包括与所述关键字关联的历史信息。

第二生成单元304,用于将目标信息集写入会议纪要初稿中,得到会议纪要。

可选的,上述的装置300还包括,存储单元305,用于输出所述会议纪要,并在接收到用户输入的确认会议纪要无误的指令后,将会议纪要中包括的各个知识点作为实体节点存储至知识图谱中。

可选的,第一生成单元301依据会议中每个发言者对应的发言文本,生成会议纪要初稿的具体实现方式为:

按照各个发言文本的标记时间,以及发言文本之间的逻辑连接关系,确定各个发言文本的连接顺序;标记时间为采集发言文本对应的发言音频的初始时间点;

针对每个发言文本,将发言文本对应的发言者的身份信息添加至发言文本中;发言文本对应的发言者的身份信息,依据发言者的发言音频以及预先存储的发言者的声纹特征确定;

对添加身份信息的每个发言文本进行分析,保留发言文本中预设的必要句子组成成分,得到发言文本对应的目标文本;

按照各个目标文本对应的发言文本的所述连接顺序,在预设的的会议纪要模板中依次写入各个所述目标文本,得到会议纪要初稿。

可选的,获取单元303获取关键字对应的目标信息集的具体实现方式为,确定关键字在预先构建的知识图谱模型中对应的实体节点;知识图谱中包括的实体节点依据历史会议纪要中包括知识点得到;将与实体节点存在连接边的所有实体节点,作为目标信息集包括的目标信息。

可选的,确定单元302确定会议纪要初稿中包括的关键字,包括:将会议纪要输入识别模型中,使识别模型依据预设的关键字提取算法,从会议纪要中提取并输出关键字。

可选的,第二生成单元304将目标信息集写入会议纪要初稿中,得到会议纪要的具体实施方式为:为目标信息集和与目标信息集对应的关键字设定匹配标识;匹配标识用于指示目标信息集与所述关键字对应;目标信息集对应的关键字为目标信息集依据关键字得到;将携带匹配标识的目标信息集,写入会议纪要初稿的预设位置中,得到会议纪要。

可选的,第二生成单元304还用于,在所述目标信息集包括多条不同的目标信息的情况下,按照每条所述目标信息的生成时间的顺序,在所述目标信息集中依次排列各条所述目标信息。

本申请提供的装置,对发言者的音频进行语音识别得到发言者的发言文本,并依据会议中每个发言者对应的发言文本,生成会议纪要初稿,可以避免采用人工记录速度慢或人为主观的因素导致的记录准确率低的问题,同时,从预设的知识库中获取会议纪要初稿的关键词(例如关键工作项目)对应的目标信息集,并将目标信息集写入会议纪要初稿预设的位置中,得到会议纪要。因为目标信息集包括为与关键字关联的历史信息,所以从会议纪要中可以了解到关键工作项目的发展历程的信息。

本申请实施例还提供了一种电子设备400,其结构示意图如图4所示,具体包括:处理器401和存储器402,存储器402用于存储程序;处理器401用于运行程序,以实现本申请实施例中会议纪要的生成方法。

本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行本申请实施例中会议纪要的生成方法。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:将WORD文档生成符合S1000D标准描述类数据模块的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!