一种基于人工智能的智慧社区知识库体系的快速建立方法

文档序号:135780 发布日期:2021-10-22 浏览:23次 >En<

阅读说明:本技术 一种基于人工智能的智慧社区知识库体系的快速建立方法 (Rapid establishing method of intelligent community knowledge base system based on artificial intelligence ) 是由 崔俊 赵凯 于 2021-07-20 设计创作,主要内容包括:本发明提出了一种基于人工智能下社区知识库体系的快速建立方法,对收集的聊天信息进行筛选,留存针对民生类问题的有效聊天语句;对筛选好的聊天语句进行中文分词,利用NLP智能文本分类技术对聊天语句进行分类,得到聊天语句的问题标签,并结合语义分析,对陈述语句进行候选答案抽取、关系推演、吻合程度判断、噪声过滤得到答案匹配度,将匹配度最高的陈述句标识为问题标签的最佳答案;对中文分词的实体词条进行频次判断,选取频次达到阈值的实体词条,对比更新本地问题标签库。本发明不仅能够有效针对新兴知识快速自动的完善社区知识库,避免了人工操作的麻烦,保证了知识库的时效性,并且能够自动追踪热点话题,提高了知识库的专业覆盖量。(The invention provides a quick establishing method of a community knowledge base system based on artificial intelligence, which screens collected chatting information and retains effective chatting sentences aiming at the problems of livelihood; performing Chinese word segmentation on the screened chat sentences, classifying the chat sentences by using an NLP intelligent text classification technology to obtain problem labels of the chat sentences, performing candidate answer extraction, relation deduction, coincidence degree judgment and noise filtration on the statement sentences by combining semantic analysis to obtain answer matching degrees, and identifying the statement sentence with the highest matching degree as the best answer of the problem labels; and performing frequency judgment on the entity entries of the Chinese word segmentation, selecting the entity entries of which the frequency reaches a threshold value, and comparing and updating the local problem label library. The invention not only can effectively and automatically perfect the community knowledge base aiming at emerging knowledge, avoids the trouble of manual operation, ensures the timeliness of the knowledge base, but also can automatically track hot topics and improve the professional coverage of the knowledge base.)

一种基于人工智能的智慧社区知识库体系的快速建立方法

技术领域

本发明涉及计算机应用领域,特别是一种基于人工智能下社区知识库体系的快速建立方法。

背景技术

自然语言中存在人类生活中的各类事件的描述,一个动作或一个历史事件,同时也包括事件产生的事件、地点、人物、状态以及事件之间的联系。随着互联网时代的兴起,人们的沟通越来越多的依赖QQ、微信等社交软件来进行沟通交流,获取信息,而这些信息往往呈现出海量、剧增、冗余等特性。为了能够更加快速有效的监控和运用其中有效的信息,人为的收集分析显然无法解决效率问题,计算机应用能够自动分析文本消息显得尤为重要,这关系到逐渐兴起的人工智能对话在社区治理领域的应用能力。

在社区治理中,使用社区专业领域的知识库结合人工智能对话系统,相较于其他传统语料检索的对话系统,具备了社区民生等专有知识的识别能力,能够更懂老百姓的话,让老百姓觉得是在和一位专业的社区网络员在聊天。但是,传统的知识库更多的追求领域覆盖率,专业领域知识的挖掘不够,往往在某个行业内的回复内容不够准确,知识也相对陈旧,更新频率还远远达不到标准。

发明内容

本发明的目的在于提出了一种基于人工智能下社区知识库体系的快速建立方法。

实现本发明目的的技术解决方案为:一种基于人工智能下社区知识库体系的快速建立方法,包括如下步骤:

第一步,以社区为单位建立微信群;

第二步,基于建立的微信群,以街道为单位植入群机器人自动收集聊天信息;

第三步,对收集的聊天信息进行筛选,留存针对民生类问题的有效聊天语句;

第四步,对筛选好的聊天语句进行中文分词,利用NLP智能文本分类技术对聊天语句进行分类,得到聊天语句的问题标签,并结合语义分析,对陈述语句进行候选答案抽取、关系推演、吻合程度判断、噪声过滤,得到答案匹配度,将匹配度最高的陈述句标识为问题标签的最佳答案;

第五步,对中文分词的实体词条进行频次判断,选取频次达到阈值的实体词条,对比更新本地问题标签库。

进一步的,第三步,对收集的聊天信息进行筛选,留存针对民生类问题的有效聊天语句,其中,有效聊天语句是剔除表情、语音和视频以后的文字信息。

进一步的,第四步,对筛选好的聊天语句进行中文分词,利用NLP智能文本分类技术对民生类问题进行分类,得到聊天语句的问题标签,并结合语义分析,对陈述语句进行候选答案抽取、关系推演、吻合程度判断、噪声过滤得到答案匹配度,将匹配度最高的陈述句标识为问题标签的最佳答案,具体方法为:

步骤4-1、初步分类,对初步筛选后的数据进行粗略分类,按照事先定义的分类用问题标签批量查找出相关聊天内容,以问答形式给问题标签存储在知识库的问答数据表;

步骤4-2、结合语义和意图分析技术,针对有问题标签的语句,将陈述语句经过候选答案抽取、关系推演、吻合程度判断、噪声过滤这些步骤得到答案匹配度,将匹配度最高的陈述句标识为该问题标签的最佳答案;

步骤4-3、循环步骤4-2,处理定时任务下的所有陈述句,得到准确的问答知识库。

一种基于人工智能下社区知识库体系的快速建立系统,基于任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。

本发明与现有技术相比,其显著优点为:(1)可以有效快速的收集居民提出的各种民生问题。(2)不仅能够有效针对新兴知识快速自动的完善社区知识库,同时避免了人工操作的麻烦,保证知识库的时效性。(3)自动追踪热点话题,提高了知识库的专业覆盖量。

附图说明

图1是本发明基于人工智能下社区知识库体系的快速建立方法的流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

如图1所示,一种基于人工智能下社区知识库体系的快速建立方法,其步骤如下:

步骤1、数据采集

以社区为单位建立微信群,目前微信最能有效快速反映出老百姓的关注点,依托微信群机器人的强大功能,可以自动快速收集老百姓的关注话题,具体过程如下:

步骤1-1、社工建群,社区网络员针对自己管辖范围的小区进行建群,群名按照一定规律比如小区名称几群这样,方便居民可以快速加入微信群;

步骤1-2、居民入群,当微信群建立后,由各居委会组织引导居民加入微信群。

步骤2、数据提取

基于第一步微信群植入群机器人,可以7*24小时全天候在线为民服务不打烊,是数据分析统计的基石,具体过程如下:

以街道为单位在建立的微信群中植入微信机器人,当各街道的微信群都建立完成后,需要把微信机器人加入每个微信群中,建立起应用和居民的联系。

步骤3、数据筛选

采集到居民的对话后,针对民生相关问题进行筛选,具体过程如下:

根据筛选规则,将收集的所有文字(非表情、语音、视频等)聊天数据保存至各社区的聊天记录库中。

步骤4、数据分类

对上一步的有效语料以现有智能分词技术进行话题分类,结合语义分析将陈述句标识答案匹配度,具体过程如下:

步骤4-1、初步分类,对初步筛选后的数据进行粗略分类,按照事先定义的分类用问题标签批量查找出相关聊天内容,以问答形式给问题标识标签存储在知识库的问答数据表;

步骤4-2、结合现有语义和意图分析技术,针对有问题标签的语句,将陈述语句经过候选答案抽取、关系推演、吻合程度判断、噪声过滤这些步骤得到答案匹配度,将匹配度最高的陈述句标识为所述问题的最佳答案。

步骤5、知识库完善

设定定时任务,循环步骤4中的答案匹配操作,不断优化各民生问题的答案使知识库得以完善,具体过程如下:

步骤5-1、创建定时任务,抽选问题标签的语句;

步骤5-2、筛选陈述语句;

步骤5-3、对陈述语句进行语义和意图分析,查询出针对问题答案的匹配度;

步骤5-4、按照答案的匹配度排序得到所述问题的最佳答案;

步骤5-5、处理标签更新,依据智能分词以及频度判断,选取频次较高(达到阈值)实体词条,对比更新本地问题标签库。

本发明还提出一种基于人工智能下社区知识库体系的快速建立系统,基于任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一项所述的方法,进行基于人工智能下社区知识库体系的快速建立。

实施例

为了验证本发明方案的有效性,进行如下仿真实验。

一种基于人工智能下社区知识库体系的快速建立方法,步骤如下:

第一步,以社区为单位建立微信群,平均每个社区建立10个群,由社区网格员或者社工来担任群主;

第二步,在创建好的微信群里植入群机器人,由群主将群机器人拉入群并开启群聊天收集功能;

第三步,对收集的聊天信息针对对于民生问题进行筛选,留存有效的聊天语句;

第四步,对筛选好的聊天语句进行中文分词,利用现有的NLP智能文本分类技术进行分类,进而得到所述聊天语句的问题标签;

第五步,对筛选好的聊天语句进行语意和意图分析,当聊天语句的属性为陈述句,将陈述语句经过候选答案抽取、关系推演、吻合程度判断、噪声过滤这些步骤得到答案匹配度,将匹配度最高的陈述句标识为该问题标签的最佳答案;

第六步,系统后台创建定时任务,重复第五步的答案匹配操作,可以不断对知识库进行优化完善;

第七步,依据中文分词以及频度判断,选取频次较高(达到阈值)实体词条,对比更新本地问题标签库。比如“某小区出现一例无症状确诊病例,在哪个定点医院收治?”,系统利用现有人工智能分词技术,得到“小区”、“无症状”、“病例”、“定点医院”等实体词条,记录下这些实体词条的出现频率,如果出现频率高于设置的阈值,系统会去比对本地问题标签库,将新的实体词条存入本地问题标签库。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

7页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种公告内容分析方法、系统、电子设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!