一种基于语音识别的操作票防误方法

文档序号:70655 发布日期:2021-10-01 浏览:35次 >En<

阅读说明:本技术 一种基于语音识别的操作票防误方法 (Operation ticket anti-error method based on voice recognition ) 是由 杜凡 朱润杭 张敏 杨再鹤 伞晨峻 张馨介 莫熙 蒋迪 史文博 于 2021-05-11 设计创作,主要内容包括:本发明涉及一种基于语音识别的操作票防误方法,其技术特点是:步骤1、对调度命令进行语音识别及语义分析,将调度命令语音转换为调度命令文本数据;步骤2、操作票命令编写防误并进行校验。本发明设计合理,其通过对调度命令进行语音识别、对于调度命令语音进行语义分析以及操作票智能防误处理,可以自动监测调度电话下令是否准确,复诵是否准确,为智能防误提高了便捷性,极大地提高了调度员的工作效率,保障电网的安全稳定运行。(The invention relates to an operation ticket anti-error method based on voice recognition, which is technically characterized by comprising the following steps of: step 1, carrying out voice recognition and semantic analysis on a scheduling command, and converting the scheduling command voice into scheduling command text data; and step 2, writing an operation order to prevent errors and verifying. The intelligent anti-error management system is reasonable in design, can automatically monitor whether the order of the dispatching telephone is accurate or not and whether the repeating is accurate or not by performing voice recognition on the dispatching command, performing semantic analysis on the voice of the dispatching command and performing intelligent anti-error processing on the operation order, improves convenience for intelligent anti-error, greatly improves working efficiency of a dispatcher, and ensures safe and stable operation of a power grid.)

一种基于语音识别的操作票防误方法

技术领域

本发明属于电力调控

技术领域

,涉及调度语音识别方法,尤其是一种基于语音识别的操作票防误方法。

背景技术

随着电网调控一体化的全面推进,调控中心的任务越来越重,调度人员的工作越来越大。操作票是调控过程中的一项重要内容,在调控过程中,调控中心和站端经常需要通过语音方式完成操作票的处理工作。

随着人语音识别技术的不断发展,使得语音识别的实时自学习可能得到实现。近年来,电力部门采用语音识别技术对调度电话语音进行自动识别,以提高调度系统的自动化水平。如果要完成自动识别功能,必要要对语音进行准确识别,才能为严肃的调度工作带来实用化的便利。由于语音通话存在口音以及背景噪声干扰等众多因素,现有技术很难对电话语音进行准确识别,因此,如何有效地对语音识别的操作票进行防误处理,是目前迫切需要解决的问题。

发明内容

本发明的目的在于克服现有技术的不足,提供一种设计合理、准确可靠的基于语音识别的操作票防误方法。

本发明解决现有的技术问题是采取以下技术方案实现的:

一种基于语音识别的操作票防误方法,包括以下步骤:

步骤1、对调度命令进行语音识别及语义分析,将调度命令语音转换为调度命令文本数据;

步骤2、操作票命令编写防误并进行校验。

进一步,所述步骤1的具体实现方法包括以下步骤:

步骤1.1、对调度命令的语音信号进行预处理;

步骤1.2、通过端点检测,得到真实有效的语音段落;

步骤1.3、提取出随着时间变化的特征参数;

步骤1.4、通过语音训练数据和噪声数据建立声学模型,通过文本训练数据建立语言模型;

步骤1.5、将特征参数与语言模型里的参数模版进行匹配,确定语音内容。

进一步,所述步骤1.1中的预处理包括对输入的语音信号进行预加重、分帧和加窗处理,其中使用高通滤波器对语音信号进行预加重。

进一步,所述步骤1.2采用隐马尔可夫模型算法检测语音信号中的呼吸、噪音成分,从而检测出真实有效的语音段落。

进一步,所述随着时间变化的特征参数包括梅尔频率倒谱系数和线性预测倒谱系数。

进一步,所述步骤1.4的具体实现方法为:使用动态时间弯曲算法或基于人工神经网络的算法进行匹配搜索;通过词性标注配合模式匹配,提取名词短语。

进一步,所述步骤2的具体实现方法包括以下步骤:

步骤2.1、基于语言模型进行操作票命令编写防误;

步骤2.2、基于语音识别的下令校核;

步骤2.3、基于声纹识别与语音识别的复诵校核:

步骤2.4、进行实时状态对接进行操作票智能防误。

进一步,所述步骤2.1的具体实现方法为:通过语言模型自动生成对于操作命令的分词,再结合D5000模型和现场方式断面,进行命令编写的校核。

进一步,所述步骤2.2实现方法为:将调度指令转换为因素表后,再与操作命令进行比对校核。

进一步,所述步骤2.3在进行复诵校核前,需要对现场操作人员进行上岗培训,并录入声音进行声纹分析;在复诵校验时,对语音片段进行声纹分析从而进行身份确认。

本发明的优点和积极效果是:

本发明设计合理,其通过对调度命令进行语音识别、对于调度命令语音进行语义分析以及操作票智能防误处理,可以自动监测调度电话下令是否准确,复诵是否准确,为智能防误提高了便捷性,极大地提高了调度员的工作效率,保障电网的安全稳定运行。

附图说明

图1为本发明的语音识别的模型训练过程示意图;

图2为操作票系统的语音检测结果示意图。

具体实施方式

以下结合附图对本发明实施例做进一步详述。

一种基于语音识别的操作票防误方法,包括以下步骤:

步骤1、对调度命令进行语音识别及语义分析,将调度命令语音转换为调度命令文本数据。

本步骤的具体实现方法,如图1所示,包括以下步骤:

步骤1.1、对调度命令的语音信号进行预处理。

在本步骤中,对语音信号进行预处理是要对输入的信号做预加重、分帧以及加窗等处理,方便后续操作。

研究表明,发声过程中的声门激发可能影响语音的功率谱。信号从时域转变为频域后,其频谱可以平滑,这是非常有帮助的频谱分析。因此,为了减少语音信号高频部分的下降,保证频域频谱分析的工作,需要使语音信号经过高通滤波器,对语音信号进行预加重。

步骤1.2、通过端点检测,得到真实有效的语音段落。

在本步骤中,使用隐马尔可夫模型算法,可以检测出语音信号中的呼吸、噪音等非语音成分的声音,从而检测出真实有效的语音段落。除了隐马尔可夫模型的算法,还有许多常见算法大致可分为几类:频谱分析,基音检测,倒谱分析,能量阈值以及现行预测等。

步骤1.3、提取出随着时间变化的特征参数。

在本步骤中,提取两种随时间变化的特征参数为:梅尔频率倒谱系数(Mel-FrequencyCepstralCoefficients,MFCC)和线性预测倒谱系数(Linear PredictiveCepstral Coding,LPCC)。MFCC特征参数的提取主要分为四个步骤:预处理、快速傅立叶变换、通过Mel滤波器组能量计算谱能量和DCT倒谱计算。快速傅立叶变换(Fast Fouriertransform,FFT)是指对语音信号的每一帧进行子帧加窗后的FFT变换,将语音信号从初始时域数据转换为频域数据。其公式为:X(i.k)=FFT[xi(m)]

步骤1.4、通过语音训练数据和噪声数据建立声学模型,通过文本训练数据建立语言模型。

声学模型的建立方法为:根据语音训练数据和噪声数据并使用门循环单元-手动对齐方式(Gate Recurrent Unit-Connectionist Temporal Classification,GRU-CTC)的结构搭建声学模型,循环神经网络可以利用语音上下文相关的信息,得到更加准确地识别结果,而GRU选择性的保留了需要的长时信息,使用双向神经网络(Recurrent NeuralNetwork,RNN)能够充分的利用上下文信号。

语言模型的建立方法为:根据文本训练数据进行训练建立语言模型,能够起到识别汉字的作用。例如,拼音输入的本质上就是一个序列到序列的模型:输入拼音序列,输出汉字序列。

步骤1.5、模版库匹配搜索:将步骤1.3提取出的特征参数和声学模型及语言模型里的参数模版进行匹配,确定语音内容。

模版库匹配搜索通常可以使用动态时间弯曲算法或基于人工神经网络的算法等进行匹配搜索。通过词性标注配合模式匹配,提取名词短语。通常来说一个句子的单词会聚合成组块(chunking)短语,例如常见的名词短语组块,动词组块等。查看标注的数据集发现,大部分关键词都是名词短语组块,可以通过规则进行模式匹配高效提取这类关键词。

通过上述语音识别及语义分析过程,可以将调度命令语音转换为调度命令文本数据。

步骤2、进行操作票命令编写防误并进行校验。

本步骤的具体实现方法为:

步骤2.1、基于语言模型进行操作票命令编写防误。

当我们针对调度命令术语进行训练后,语言模型可以自动生成对于操作命令的分词,再结合D5000模型和现场方式断面,进行命令编写的校核。如果误写成辛安I线206开关,我们可以通过语义分析与拓扑模型连接分析,提示将206开关替换成203开关。完成编写校核。

步骤2.2、基于语音识别的下令校核。

当调度员下令时:“下令:辛安站220kV辛集I线203开关由运行转热备用。”对于调度指令进行语音识别,然后和操作命令进行比对,进行校核。此处难点在于识别调度的专业术语,例如#2主变,AVC,PT,保护等中英结合或者是符号的识别;或者因为调度下令十分严肃,稍有干扰,识别稍有不准确就会判定为误判。因此我们将语音指令转为音素表,与语音识别发音进行匹配,排除语言模型的干扰。

步骤2.3、基于声纹识别与语音识别的复诵校核。

在当现场操作人员持证上岗培训时,可以录入声音进行声纹分析。每当复诵时,对语音片段进行声纹分析从而进行身份确认。执行信息与2.2方法一致,如果复诵错误,进行校核提示。

步骤2.4、操作票智能防误。

在本步骤中,进行实时状态对接,语音校核同时通过拓扑与实时状态校核是否有带电拉合地刀,拆挂地线,地线需要明显间隔,是否掉负荷,是否造成环网,重过载等操作,如果有,进行防误提醒。

图2给出操作票系统的语音检测结果,通过该系统可以有效地防止语音命令是否与操作票票面一致。其中文本命令为:拉开翟固站辛翟II线251开关。语音命令为:拉开翟固站辛翟I线251开关。经操作票系统成功识别出来语音命令与操作票票面不一致,从而有效地实现了操作票防误功能。

本发明在应用时,对于安全性要求较高的电力系统,语音应用技术依赖于电话网络和互联网的安全性能。为了保证网络数据的安全性和完整性,需要在通信基础设施、网络传输协议和系统管理等方面采取良好的安全措施。安全协议和标准协议是语音应用发展中的重要问题。可以使用SM2、SM4或MD5方式对语音流进行加密,虽然降低了传输效率,但是可以加强安全性。

需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于摘要提取的语音评分方法和系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!