信息处理方法、装置及计算机可读存储介质

文档序号：1617234 发布日期：2020-01-10 浏览：4次 >En<

阅读说明：本技术 信息处理方法、装置及计算机可读存储介质 (Information processing method, device and computer readable storage medium ) 是由陈昊亮许敏强于 2019-10-15 设计创作，主要内容包括：本发明公开了一种信息处理方法,包括如下步骤：获取视频会议系统所接收到的音频信息,以及所述音频信息对应的用户信息；基于所述音频信息和所述用户信息,确定视频会议当前发言人所发言的文字信息；基于所述文字信息,在所述视频会议系统的显示屏幕中的视频文本框显示所述文字信息。本发明还公开了一种信息处理装置及计算机可读存储介质。本发明实时将发言人当前发言的音频信息和发言人的用户信息转换成文字信息,并将文字信息实时显示于视频会议系统中的显示屏幕上,解决了参会人员容易错漏会议的重要内容的问题,并且能够快速在显示屏幕上输出会议记录的内容,提高了时效性和实用性,方便参会人员更好地了解和掌握会议内容。(The invention discloses an information processing method, which comprises the following steps: acquiring audio information received by a video conference system and user information corresponding to the audio information; determining the text information spoken by the current speaker of the video conference based on the audio information and the user information; displaying the text information in a video text box in a display screen of the video conference system based on the text information. The invention also discloses an information processing device and a computer readable storage medium. The invention converts the current speaking audio information of the speaker and the user information of the speaker into the text information in real time, and displays the text information on the display screen in the video conference system in real time, thereby solving the problem that participants easily miss important contents of the conference, rapidly outputting the recorded contents of the conference on the display screen, improving the timeliness and the practicability, and facilitating the participants to better understand and master the conference contents.)

信息处理方法、装置及计算机可读存储介质

技术领域

本发明涉及通信技术领域，尤其涉及一种信息处理方法、装置及计算机可读存储介质。

背景技术

视频会议具有面向用户的设计思路，以及多方交互的用户界面，用户在自己的办公室或公司的会议室里可以非常方便地自主召集会议并进行会议控制，为企业或者用户带来了极大的便利。

但是，目前的视频会议中，用户注册并且登录视频会议系统的账号后，在进行远程视频会议的过程中，用户需要在视频会议系统中通过键盘手动打字以将会议过程的内容要点输出至公屏，供参与会议人员查看。但实际上，由于手动打字输入慢以及会议的讲话人内容过多，存在容易错漏会议的重要内容的问题。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种信息处理方法、装置及计算机可读存储介质，旨在解决容易错漏会议的重要内容的技术问题。

为实现上述目的，本发明提供一种信息处理方法，所述信息处理方法包括以下步骤：

获取视频会议系统所接收到的音频信息，以及所述音频信息对应的用户信息；

基于所述音频信息和所述用户信息，确定视频会议当前发言人所发言的文字信息；

基于所述文字信息，在所述视频会议系统的显示屏幕中的视频文本框显示所述文字信息。

在一实施例中，所述获取视频会议系统所接收到的音频信息，以及所述音频信息对应的用户信息的步骤包括：

获取所述视频会议系统所接收到的所述音频信息；

基于所述音频信息，确定所述音频信息中的声纹特征信息；

基于所述声纹特征信息，确定预设声纹信息库中与所述声纹特征信息相匹配的用户信息。

在一实施例中，所述基于所述声纹特征信息，确定预设声纹信息库中与所述声纹特征信息相匹配的用户信息的步骤包括：

检测所述预设声纹信息库中是否存在与所述声纹特征信息相匹配的用户信息；

若所述预设声纹信息库中存在与所述声纹特征信息相匹配的用户信息，则获取所述用户信息；

若所述预设声纹信息库中不存在与所述声纹特征信息相匹配的用户信息，则在所述预设声纹信息库中创建所述声纹特征信息对应的用户信息，并对应存储所述声纹特征信息。

在一实施例中，所述基于所述音频信息和所述用户信息，确定视频会议当前发言人所发言的文字信息的步骤包括：

基于所述音频信息，确定所述音频信息对应的音轨信息；

基于所述音轨信息，确定所述音频信息对应的多个语句块；

基于所述多个语句块和所述用户信息，确定所述视频会议当前发言人所发言的文字信息。

在一实施例中，所述多个语句块包括第一语句块、第二语句块或第三语句块，所述基于所述音轨信息，确定所述音频信息对应的多个语句块的步骤包括：

检测所述音轨信息中的停顿信息；

若所述停顿信息大于或等于第一预设阈值，则确定所述音频信息对应的所述第一语句块；

若所述停顿信息小于所述第一预设阈值且大于第二预设阈值，则确定所述音频信息对应的所述第二语句块，其中，所述第二预设阈值小于所述第一预设阈值；

若所述停顿信息小于或等于所述第二预设阈值，则确定所述音频信息对应的所述第三语句块。

在一实施例中，所述基于所述音频信息和所述用户信息，确定视频会议当前发言人所发言的文字信息的步骤之后，还包括：

获取所述视频会议系统中的会议模板信息；

基于所述文字信息和所述会议模板信息，确定所述视频会议的会议记录内容；

基于所述会议记录内容，确定视频会议过程的会议记录文本。

在一实施例中，所述获取视频会议系统所接收到的音频信息，以及所述音频信息对应的用户信息的步骤之前，还包括：

若检测到所述视频文本框的第一开启指令，则在所述视频会议系统的显示屏幕中显示第一预设区域和第二预设区域，并在所述第一预设区域中显示所述视频会议的第一视频图像，在所述第二预设区域中显示所述视频文本框。

在一实施例中，其特征在于，所述基于所述文字信息，在所述视频会议系统的显示屏幕中的视频文本框显示所述文字信息的步骤之后，还包括：

若检测到所述视频文本框的第二开启指令，则在所述视频会议系统的显示屏幕中显示所述视频会议的第二视频图像，并在所述视频图像上显示所述视频文本框。

此外，为实现上述目的，本发明还提供一种信息处理装置，所述信息处理装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的信息处理程序，所述信息处理程序被所述处理器执行时实现如上述的信息处理方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有信息处理程序，所述信息处理程序被处理器执行时实现如上述的信息处理方法的步骤。

本发明通过获取视频会议系统所接收到的音频信息，以及所述音频信息对应的用户信息，基于所述音频信息和所述用户信息，确定视频会议当前发言人所发言的文字信息，基于所述文字信息，在所述视频会议系统的显示屏幕中的视频文本框显示所述文字信息，实时将发言人当前发言的音频信息和发言人的用户信息转换成文字信息，并将文字信息实时显示于视频会议系统中的显示屏幕上，参会人员可看到当前发言人所发言的内容和发言人的身份，解决了由于手动打字输入慢以及发言人讲话内容过多，使参会人员容易错漏会议的重要内容的问题，并且能够快速在显示屏幕上输出会议记录的内容，提高了时效性和实用性，方便参会人员更好地了解和掌握会议内容。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的信息处理装置结构示意图；

图2为本发明信息处理方法第一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的信息处理装置结构示意图。

如图1所示，该信息处理装置可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，信息处理装置还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。

本领域技术人员可以理解，图1中示出的信息处理装置结构并不构成对信息处理装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及信息处理程序。

在图1所示的信息处理装置中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的信息处理程序。

在本实施例中，信息处理装置包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的信息处理程序，其中，处理器1001调用存储器1005中存储的信息处理程序时，并执行以下操作：

获取视频会议系统所接收到的音频信息，以及所述音频信息对应的用户信息；

基于所述音频信息和所述用户信息，确定视频会议当前发言人所发言的文字信息；

基于所述文字信息，在所述视频会议系统的显示屏幕中的视频文本框显示所述文字信息。