电网调控运行知识库的构建方法及装置

文档序号:1953935 发布日期:2021-12-10 浏览:14次 >En<

阅读说明:本技术 电网调控运行知识库的构建方法及装置 (Method and device for constructing power grid regulation and control operation knowledge base ) 是由 张雨璇 李�杰 王海云 刘辉 陈茜 沙立成 张再驰 张印宝 杨莉萍 王永 汪伟 于 2021-09-07 设计创作,主要内容包括:本申请公开了一种电网调控运行知识库的构建方法及装置。其中,该方法包括:获取构建电网调控运行知识库所需的知识材料;确定知识材料的类型,其中,类型包括:问答形式、标题加描述形式以及纯文本形式;依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式;按照导入方式将知识材料导入电网调控运行知识库。本申请解决了目前电力系统调控人员的工作效率较低的技术问题。(The application discloses a method and a device for constructing a power grid regulation and control operation knowledge base. Wherein, the method comprises the following steps: acquiring knowledge materials required for constructing a power grid regulation and control operation knowledge base; determining a type of knowledge material, wherein the type comprises: question-answer form, title plus description form and plain text form; determining an importing mode for importing the knowledge materials into a power grid regulation and control operation knowledge base according to the types of the knowledge materials; and importing the knowledge material into a power grid regulation and control operation knowledge base according to an importing mode. The technical problem that the work efficiency of the current power system regulating personnel is low is solved.)

电网调控运行知识库的构建方法及装置

技术领域

本申请涉及电网调度运行领域,具体而言,涉及一种电网调控运行知识库的构建方法及装置。

背景技术

电力系统调控人员是确保电网稳定运行的重要因素,岗位对于人员的要求极高,工作强度也很大。一方面,电力调控方面的知识和技能日新月异,而调控人员由于其岗位的特殊性和工作性质的急迫性,需要迅速获取和掌握大量的电力系统相关知识,而现有调控应用系统不完全具备相关能力,调控人员获取知识的渠道相对狭窄且不规范;另一方面,调控人员需要快速、全面、准确地掌握电网当前的运行状态,同时又要与历史上出现过的运行状态进行对比,就是说需要在大量信息之中进行检索和分析,单靠人工则费时费力、效率低下。

调控员日益繁重的日常工作与保持电网安全稳定运行和正确控制调节的矛盾越来越突出,如果能够通过解析调控人员的语音输入来掌握其意图,自动检索相关信息并给出相应的反馈,将大大提升调控员的工作质量和效率,因此非常有必要进行电网调控智能问答技术的研究。

针对目前电力系统调控人员的工作效率较低的问题,目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种电网调控运行知识库的构建方法及装置,以至少解决目前电力系统调控人员的工作效率较低的技术问题。

根据本申请实施例的一个方面,提供了一种电网调控运行知识库的构建方法,包括:获取构建电网调控运行知识库所需的知识材料;确定知识材料的类型,其中,类型包括:问答形式、标题加描述形式以及纯文本形式;依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式;按照导入方式将知识材料导入电网调控运行知识库。

可选地,依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式,包括:如果知识材料的类型为问答形式,将知识材料包括的问题作为导入电网调控运行知识库的知识条目的基本问,将问题的答案作为导入电网调控运行知识库的知识条目的答案。

可选地,依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式,包括:如果知识材料的类型为标题加描述形式,将知识材料的包括标题转换为导入电网调控运行知识库的知识条目的基本问,将标题对应的描述段落作为导入电网调控运行知识库的知识条目的答案。

可选地,确定导入电网调控运行知识库的知识条目的基本问之后,上述方法还包括:利用自然语言理解模型将基本问转换为多条扩展问,其中,扩展问与基本问的描述方式不同,语义相同。

可选地,依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式,包括:如果知识材料的类型为纯文本形式,统计预设关键字词在知识材料中出现的频率,并将频率、知识材料中语句的编号以及知识材料包括的文本信息作为一个导入电网调控运行知识库的知识条目。

可选地,统计预设关键字词在知识材料中出现的频率之前,上述方法还包括:将全部的知识材料按照自然段进行划分;利用分词工具分别对每个自然段进行分析,分别从每个自然段中提取出多个关键字词;按照以下公式分别计算每个关键字词的TF-IDF数值:

将TF-IDF数值高于第一预设阈值的关键字词作为预设关键字词。

可选地,按照导入方式将知识材料导入电网调控运行知识库之后,上述方法还包括:获取从电网调控运行知识库中查找知识条目的检索指令;从电网调控运行知识库中查找与检索指令对应的扩展问,并返回扩展问对应的答案。

可选地,如果返回的答案与检索指令的匹配度低于第二预设阈值,从电网调控运行知识库中查找与检索指令对应的预设关键词,并返回该预设关键词所在的知识条目。

根据本申请实施例的另一方面,还提供了一种电网调控运行知识库的构建装置,包括:获取模块,用于获取构建电网调控运行知识库所需的知识材料;第一确定模块,用于确定知识材料的类型,其中,类型包括:问答形式、标题加描述形式以及纯文本形式;第二确定模块,用于依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式;导入模块,用于按照导入方式将知识材料导入电网调控运行知识库。

根据本申请实施例的再一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以上的电网调控运行知识库的构建方法。

根据本申请实施例的再一方面,还提供了一种处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行以上的电网调控运行知识库的构建方法。

在本申请实施例中,采用获取构建电网调控运行知识库所需的知识材料;确定知识材料的类型,其中,类型包括:问答形式、标题加描述形式以及纯文本形式;依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式;按照导入方式将知识材料导入电网调控运行知识库的方式,通过提出问答条目和知识文本等两种电网调控知识的基本形式,面对不同类型的电网知识文本材料,采用直接导入、标题转问题和关键字检索等三种知识导入方式构建电网调控运行知识库,从而实现了快速收集和展示电网调控人员所需信息,替代人工进行信息检索的工作,辅助电网调控运行,提升调控人员的工作效率的技术效果,进而解决了目前电力系统调控人员的工作效率较低技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的一种电网调控运行知识库的构建方法的流程图;

图2是根据本申请实施例的一种问答形式的知识条目的示意图;

图3是根据本申请实施例的一种电网调控运行知识库的构建方法和应用方法示意图;

图4是根据本申请实施例的一种电网调控运行知识库的构建装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例,提供了一种电网调控运行知识库的构建方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本申请实施例的一种电网调控运行知识库的构建方法的流程图,如图1所示,该方法包括如下步骤:

步骤S102,获取构建电网调控运行知识库所需的知识材料;

电网调控人员日常最主要的工作,就是根据电网当前状态或发生的事件,依照调控管理规程来对电网进行下一步的调控操作。电网调控知识库主要是为了解决调控依据的快速检索问题,包括调控管理规程、电力系统基本知识等,来源于调度中心已有的文字材料。

电网调控知识库的知识材料依据其存储形式可分为两类:

1)问答形式的知识条目,这类信息一旦命中则通常就是调控人员的所需内容,匹配程度较高,但适合这类信息的材料一般较少,如果采用人工录入又会过于消耗人力。其中,知识条目的问题为文本信息,包括一个基本问题和若干个扩展问,扩展问的作用主要是提供问题的多种话术表达方式,提升问题命中率;知识条目的答案可包括文本、表格、图片等形式,文本又可包括播报文本和展示文本,分别给出简略和详细的描述,便于用户提取其中的有效信息。图2是根据本申请实施例的一种问答形式的知识条目的示意图。

2)文本形式的知识条目,这类材料来源广泛,并且量非常大,可以覆盖调控运行的全部环节,但需要与调控人员的意图进行匹配才能达到较好的应用效果。

此类知识条目主要通过关键字的方式进行检索,因此在知识库中主要包含编号、关键字词频以及知识文本等3个组成部分。

步骤S104,确定知识材料的类型,其中,类型包括:问答形式、标题加描述形式以及纯文本形式;

步骤S106,依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式;

电网知识材料非常多,如果单纯依靠人工方式进行录入则工作量极大,难以完成,必须通过程序针对不同特点、不同形式的材料进行自动导入。同时,由上述知识库构成形式和特点可知,所有知识应尽量采用问答形式进行存储。现有电网调控领域的知识材料主要以文字信息为主体,具体又包含三种形式,本申请提供的实施例采用不同方式进行导入。

步骤S108,按照导入方式将知识材料导入电网调控运行知识库。

通过上述步骤,通过提出问答条目和知识文本等两种电网调控知识的基本形式,面对不同类型的电网知识文本材料,采用直接导入、标题转问题和关键字检索等三种知识导入方式构建电网调控运行知识库,从而实现了快速收集和展示电网调控人员所需信息,替代人工进行信息检索的工作,辅助电网调控运行,提升调控人员的工作效率的技术效果。

根据本申请的一个可选的实施例,步骤S106可以通过以下方法实现:如果知识材料的类型为问答形式,将知识材料包括的问题作为导入电网调控运行知识库的知识条目的基本问,将问题的答案作为导入电网调控运行知识库的知识条目的答案。

知识材料为问答形式,通常包含1个问题和1个答案,其中问题为文本形式。本申请提供的实施例将问题导入作为知识条目的基本问,把答案导入作为知识条目的答案;同时,采用自然语言理解模型(NLU)把基本问自动转换为5条意思相近的扩展问,此外也允许用户手工进行扩展或修改。

根据本申请的另一个可选的实施例,步骤S106可以通过以下方法实现:如果知识材料的类型为标题加描述形式,将知识材料的包括标题转换为导入电网调控运行知识库的知识条目的基本问,将标题对应的描述段落作为导入电网调控运行知识库的知识条目的答案。

知识材料为标题加描述的形式,包含1个标题和1段文字描述,这类知识材料常见于电网调控管理规程、电网调度运行稳定规定等文档中,其标题具有明确的意义,便于通过NLU模型转换为问题形式,如下文中的示例可把“电网故障及异常处理的原则”转换为“电网故障及异常处理的原则是什么?”。本申请提供的实施例可自动读取此类材料,把标题转化为问题并作为知识条目的基本问,把对应描述段落作为知识条目的答案,同时再进行问题扩展。

标题加描述形式的知识材料示例:

11.1电网故障及异常处理的原则

11.1.1值班调度员为处理电网故障及异常的指挥者,对处理的正确性负责。

11.1.2在处理故障时,值班调控员的主要任务是迅速对故障情况作出正确判断,限制故障发展,切除故障的根源,并解除对人身和设备安全的威胁。

在本申请的一些可选的实施例中,确定导入电网调控运行知识库的知识条目的基本问之后,利用自然语言理解模型将基本问转换为多条扩展问,其中,扩展问与基本问的描述方式不同,语义相同。

在上文中提到,采用自然语言理解模型(NLU)把基本问自动转换为5条(也可以设置为其他数量)意思相近的扩展问。通过该方法可以提升后续从电网控运行知识库中检索相关知识条目的准确率。

需要说明的是,本申请提供的实施例在进行标题转化问题、基本问转扩展问等步骤均需要进行问题自动生成,主要涉及自然语言理解(Natural Language Understanding,NLU)和自动语言生成(Natural Language Generation,NLG)等关键技术。

自然语言理解是指,根据用户输入(用户主动发问或者应答),获得用户的对话意图以及所传递的信息。本申请采用基于深度学习的算法,完成对标题或基本问的向量化表示,即每段文本(用户问题或知识相似问等)均被模型转换为同一维度的向量(编码过程)。这些向量具有的特征是,语义接近的问题,向量距离会也会接近。因此在计算时,以向量的相似度(余弦距离)代表语义相似度。

自然语言生成是指,根据选取的动作和上下文信息,自动生成对应文本的过程。本申请首先构建和训练与上一步编码模型对应的解码模型;然后以问题的向量表示为基础,对向量进行随机微调,生成新的表示向量作为解码模型的输入;最后通过解码模型自动生成新的扩展问。本步骤生成问题的过程全部可以自动完成,但是为了提高生成文本的有效性,可以通过人工方式对生成文本进行进一步地筛选或修改。

在本申请的另一些可选的实施例中,步骤S106还可以通过以下方法实现:如果知识材料的类型为纯文本形式,统计预设关键字词在知识材料中出现的频率,并将频率、知识材料中语句的编号以及知识材料包括的文本信息作为一个导入电网调控运行知识库的知识条目。

知识材料为单纯文本形式,此类知识材料在导入过程中,需要根据事先定义好的关键字来进行词频统计,然后把自动生成的编号、词频统计以及文本信息作为一个知识条目导入到电网调控知识库之中。

根据本申请的一个可选的实施例,统计预设关键字词在知识材料中出现的频率之前,还需要通过以下方法确定上述预设关键词:将全部的知识材料按照自然段进行划分;利用分词工具分别对每个自然段进行分析,分别从每个自然段中提取出多个关键字词;按照以下公式分别计算每个关键字词的TF-IDF数值:

将TF-IDF数值高于第一预设阈值的关键字词作为预设关键字词。

对于单纯的文字材料,可通过统计关键词在各段落中的出现频率,再选择拟合度高(关键词频率高)的段落进行推送。其中,关键字除了电网重要设备、厂站名称以及人工指定的关键字以外,还需要包含电网调控知识材料中的常见词。常见词的选取可通过如下步骤完成:

A.把全部文字材料按照自然段进行分割和存储,每个自然段作为一个输入文档;

B.采用分词工具对全部文本材料进行分析,同时去除其中的无意义词;

C.采用TF-IDF算法进行词频统计:

D.TF-IDF数值较高的词作为关键字,保存至知识库,并按照新的关键字对已有文本材料进行词频统计和记录。

TF-IDF(term frequency-inverse document frequency)是一种用于信息检索与数据挖掘的加权技术,TF是词频,IDF是逆文本频率指数。

在本申请的另一个可选的实施例中,步骤S108执行完成之后,获取从电网调控运行知识库中查找知识条目的检索指令;从电网调控运行知识库中查找与检索指令对应的扩展问,并返回扩展问对应的答案。

根据本申请的一个可选的实施例,如果返回的答案与检索指令的匹配度低于第二预设阈值,从电网调控运行知识库中查找与检索指令对应的预设关键词,并返回该预设关键词所在的知识条目。

需要说明的是,上述检索指令可以是文本指令也可以是语音指令。

图3是根据本申请实施例的一种电网调控运行知识库的构建方法和应用方法示意图,如图3所示,当前系统中已完成2000条电网业务相关QA知识录入,其中1900条来源于问答条目,100条来源于标题转问题;事先定义了200个关键字,并从各类电网文本资料中提取了约300段文字条目,共同构成电网调控知识库。

知识库实际应用时采用问题匹配和关键字匹配两段式搜索方法,优先进行问题匹配,当问题匹配度满足阈值时,则返回并播报,否则继续进行关键字匹配。这种两段式的搜索方法可提高命中率,同时避免失配情况。

本申请提供的上述方法构建了一种电网调控运行的知识库,包含问答条目和文本条目两种组成形式;针对不同形式的电网知识材料,提出了直接导入、标题转问题和关键字索引等三种导入方法;实际应用中,采用问题匹配和关键字匹配两段式搜索方法,提高了知识命中的有效性。通过本申请所构建的知识库,可以方便地完成以文字作为输入的电网调控知识检索,未来与语音识别等功能模块进行对接,实现高效、便捷的电网调控知识问答等功能。

图4是根据本申请实施例的一种电网调控运行知识库的构建装置的结构框图,如图4所示,该装置包括:

获取模块40,用于获取构建电网调控运行知识库所需的知识材料;

第一确定模块42,用于确定知识材料的类型,其中,类型包括:问答形式、标题加描述形式以及纯文本形式;

第二确定模块44,用于依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式;

导入模块46,用于按照导入方式将知识材料导入电网调控运行知识库。

需要说明的是,图4所示实施例的优选实施方式可以参见图1所示实施例的相关描述,此处不再赘述。

本申请实施例还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以上的电网调控运行知识库的构建方法。

上述非易失性存储介质用于存储执行以下功能的程序:获取构建电网调控运行知识库所需的知识材料;确定知识材料的类型,其中,类型包括:问答形式、标题加描述形式以及纯文本形式;依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式;按照导入方式将知识材料导入电网调控运行知识库。

本申请实施例还提供了一种处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行以上的电网调控运行知识库的构建方法。

上述处理器用于运行执行以下功能的程序:获取构建电网调控运行知识库所需的知识材料;确定知识材料的类型,其中,类型包括:问答形式、标题加描述形式以及纯文本形式;依据知识材料的类型确定将知识材料导入电网调控运行知识库的导入方式;按照导入方式将知识材料导入电网调控运行知识库。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

12页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:级联效应的推断方法、装置及计算机可读存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!