CN113779050A - 一种客服机器人知识库的管理方法和装置 - Google Patents
一种客服机器人知识库的管理方法和装置 Download PDFInfo
- Publication number
- CN113779050A CN113779050A CN202010580233.9A CN202010580233A CN113779050A CN 113779050 A CN113779050 A CN 113779050A CN 202010580233 A CN202010580233 A CN 202010580233A CN 113779050 A CN113779050 A CN 113779050A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- user
- knowledge base
- service robot
- customer service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 48
- 238000003745 diagnosis Methods 0.000 claims abstract description 41
- 238000005457 optimization Methods 0.000 claims abstract description 18
- 230000000875 corresponding Effects 0.000 claims description 64
- 230000004044 response Effects 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 239000000203 mixture Substances 0.000 description 9
- 239000000463 material Substances 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 229910001220 stainless steel Inorganic materials 0.000 description 6
- 239000010935 stainless steel Substances 0.000 description 6
- 238000007726 management method Methods 0.000 description 5
- 230000003287 optical Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006011 modification reaction Methods 0.000 description 3
- 239000010963 304 stainless steel Substances 0.000 description 2
- 229910000589 SAE 304 stainless steel Inorganic materials 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000000644 propagated Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 210000003666 Nerve Fibers, Myelinated Anatomy 0.000 description 1
- 230000003190 augmentative Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
Abstract
本发明公开了一种客服机器人知识库的管理方法和装置,涉及计算机技术领域。该方法的一种具体实施方式包括:获取客服机器人接收的一个或多个用户问题及所述客服机器人基于知识库为所述用户问题提供的答复结果;根据所述答复结果以及所述用户问题在所述知识库中命中的知识条目,对所述用户问题进行诊断分析;根据所述诊断分析的结果对所述知识库进行优化。该实施方式实现了对知识库的自动诊断分析,并基于诊断分析结果实现了对知识库的自动优化,提升了知识库的诊断、优化效率。
Description
技术领域 本发明涉及计算机技术领域,尤其涉及一种客服机器人知识库的管理方法和装置。 背景技术 知识库是指基于知识且具有智能性的系统或专家系统。作为客服机器人的重要组成部分,知识库是客服机器人能够向用户提供咨询服务的核心,且知识库越丰富的客服机器人在与用户交流时会显得越智能。 但由于在初期建设的知识库具有一定的局限性,客服机器人无法基于初期建立的知识库解答用户提出的任何用户问题,因而需要不断地扩充、完善客服机器人的知识库。目前,知识库的优化都是在人为地判断知识库问题的基础上人工手动配置完成的,操作繁琐需要消耗大量的人力物力,且对知识库的优化不及时。 发明内容 有鉴于此,本发明实施例提供了一种服机器人知识库的管理方法和装置,能够通过动态获取客服机器人接收的用户问题及提供的答复结果,实现对知识库的自动诊断分析,并基于诊断分析结果实现对知识库的自动优化,提升了知识库的诊断、优化效率。 为实现上述目的,根据本发明实施例的一个方面,一种客服机器人知识库的管理方法,包括: 获取客服机器人接收的一个或多个用户问题及所述客服机器人基于知识库为所述用户问题提供的答复结果,所述知识库包括一个或多个知识条目,所述知识条目指示了一个或多个与所述知识条目匹配的用户问题及一个或多个答案,所述答复结果指示了所述用户问题是否匹配到所述知识条目,以及在所述用户问题匹配到所述知识条目时所述客服机器人提供的答案的未匹配原因; 根据所述答复结果以及所述用户问题在所述知识库中命中的知识条目,对所述用户问题进行诊断分析; 根据所述诊断分析的结果对所述知识库进行优化。 可选地,通过消息队列获取所述客服机器人推送至所述消息队列的所述用户问题、所述答复结果。 可选地,在所述客服机器人将所述用户问题、所述答复结果推送至所述消息队列之前,所述客服机器人通过动态埋点技术获取所述用户问题及所述答复结果。 可选地,所述根据所述答复结果以及所述用户问题在所述知识库中命中的知识条目,对所述用户问题进行诊断分析,包括: 在所述答复结果为所述用户问题未匹配到任何所述知识条目的情况下,采用聚类算法对所述用户问题进行聚类以生成新的知识条目; 在所述答复结果为所述用户问题匹配到所述知识条目的情况下,统计所匹配到的知识条目中对应于所述用户问题的答案的未匹配原因以及对应的用户问题数量。 可选地,还包括: 在采用聚类算法对所述用户问题进行聚类以生成新的知识条目之前,判断未匹配到所述知识条目的用户问题数量是否大于阈值用户问题数量; 在所述用户问题数量大于阈值用户问题数量的情况下采用聚类算法对所述用户问题进行聚类以生成新的知识条目。 可选地,所述根据所述诊断分析的结果对所述知识库进行优化,包括: 在所述答复结果为所述用户问题匹配到所述知识条目的情况下,根据所述用户问题的答案的未匹配原因及对应的用户问题数量,更新所述知识库中所述知识条目指示的答案。 可选地,所述答案的未匹配原因包括下述一种或多种:有效时间不匹配、商品标识不匹配、商品分类不匹配、用户不满意。 可选地,所述根据所述用户问题的答案的未匹配原因及对应的用户问题数量,更新所述知识库中所述知识条目指示的答案,包括: 在所述答案的未匹配原因为商品标识不匹配的情况下,根据所述用户问题中商品标识的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品标识; 在答案的未匹配原因为商品分类不匹配的情况下,根据所述用户问题中商品分类的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品分类。 可选地,还包括: 判断所述知识库是否存在未指示答案或未指示兜底答案的知识条目,以在所述知识库中存在未指示答案或未指示兜底答案的知识条目的情况下,在所述知识库中增加所述知识条目对应的答案或兜底答案。 为实现上述目的,根据本发明实施例的另一个方面,提供了一种客服机器人知识库的管理装置,包括:信息获取模块、诊断分析模块、知识库优化模块;其中, 所述信息获取模块,用于获取客服机器人接收的一个或多个用户问题及所述客服机器人基于知识库为所述用户问题提供的答复结果,所述知识库包括一个或多个知识条目,所述知识条目指示了一个或多个与所述知识条目匹配的用户问题及一个或多个答案,所述答复结果指示了所述用户问题是否匹配到所述知识条目,以及在所述用户问题匹配到所述知识条目时所述客服机器人提供的答案的未匹配原因; 所述诊断分析模块,用于根据所述用户问题在所述知识库中命中的答复结果及所述知识条目,对所述用户问题进行诊断分析; 所述知识库优化模块,用于根据所述诊断分析的结果对所述知识库进行优化。 可选地,所述信息获取模块,用于通过消息队列获取所述客服机器人推送至所述消息队列的所述用户问题、所述答复结果。 可选地,在所述客服机器人将所述用户问题、所述答复结果推送至所述消息队列之前,所述客服机器人通过动态埋点技术获取所述用户问题及所述答复结果。 可选地,所述根据所述答复结果的类型以及所述用户问题在所述知识库中命中的知识条目,对所述用户问题进行诊断分析,包括: 在所述答复结果为所述用户问题未匹配到任何所述知识条目的情况下,采用聚类算法对所述用户问题进行聚类以生成新的知识条目; 在所述答复结果为所述用户问题匹配到所述知识条目的情况下,统计每一个所匹配到的知识条目中对应于所述用户问题的答案的未匹配原因以及对应的用户问题数量。 可选地,所述诊断分析模块,还用于, 在采用聚类算法对所述用户问题进行聚类以生成新的知识条目之前,判断未匹配到所述知识条目的用户问题数量是否大于阈值用户问题数量; 在所述用户问题数量大于阈值用户问题数量的情况下采用聚类算法对所述用户问题进行聚类以生新的知识条目。 可选地,所述根据所述诊断分析的结果对所述知识库进行优化,包括: 在所述答复结果为所述用户问题匹配到所述知识条目的情况下,根据所述用户问题的答案的未匹配原因及对应的用户问题数量,更新所述知识库中所述知识条目指示的答案。 可选地,所述答案的未匹配原因包括下述一种或多种:有效时间不匹配、商品标识不匹配、商品分类不匹配、用户不满意。 可选地,所述根据所述用户问题的答案的未匹配原因及对应的用户问题数量,更新所述知识库中所述知识条目指示的答案,包括: 在所述答案的未匹配原因为商品标识不匹配的情况下,根据所述用户问题中商品标识的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品标识; 在所述答案的未匹配原因为商品分类不匹配的情况下,根据所述用户问题中商品分类的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品分类。 可选地,所述诊断分析模块,还用于, 判断所述知识库是否存在未指示答案或未指示兜底答案的知识条目,以在所述知识库中存在未指示答案或未指示兜底答案的知识条目的情况下,在所述知识库中增加所述知识条目对应的答案或兜底答案。 为实现上述目的,根据本发明实施例的又一个方面,提供了一种用于客服机器人知识库的管理的电子设备,包括: 一个或多个处理器; 存储装置,用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现如上所述的客服机器人知识库管理方法中任一所述的方法。 为实现上述目的,根据本发明实施例的再一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的客服机器人知识库管理方法中任一所述的方法。 上述发明中实施例具有如下优点或有益效果:通过动态获取客服机器人接收的用户问题及客服机器人基于知识库提供的答复结果,实现了对知识库的自动诊断分析;基于诊断分析结果,通过聚类算法生成新的知识条目,实现了对知识库的扩充;同时,在答案的未匹配原因为商品不匹配或商品分类不匹配的情况下,通过统计用户问题中出现的商品标识或商品分类,实现了对知识库中用户问题对应的商品标识或商品分类的更新。此外,还通过实时监测知识库中知识条目是否配置有答案或者兜底答案的方式,进一步实现了对知识库的管理及优化,提升了知识库的提升了知识库的诊断、优化效率。 上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。 附图说明 附图用于更好地理解本发明,不构成对本发明的不当限定。其中: 图1是根据本发明实施例的客服机器人知识库的管理方法的主要流程的示意图; 图2是根据本发明实施例的另一客服机器人知识库的管理方法的主要流程的示意图; 图3是根据本发明实施例的客服机器人知识库的优化方法的主要流程的示意图; 图4是根据本发明实施例的客服机器人知识库的管理装置的主要模块的示意图; 图5是本发明实施例可以应用于其中的示例性系统架构图; 图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。 具体实施方式 以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。 图1是根据本发明实施例的客服机器人知识库的管理方法的主要流程的示意图,如图1所示,该客服机器人知识库的管理方法具体可以包括的步骤如下: 步骤S101,获取客服机器人接收的一个或多个用户问题及所述客服机器人基于知识库为所述用户问题提供的答复结果,所述知识库包括一个或多个知识条目,所述知识条目指示了一个或多个与所述知识条目匹配的用户问题及一个或多个答案,所述答复结果指示了所述用户问题是否匹配到所述知识条目,以及在所述用户问题匹配到所述知识条目时所述客服机器人提供的答案的未匹配原因。 用户问题是指用户在使用客服机器人进行咨询时可能提出的任何问题,如“这个是304不锈钢的?”、“你好!材质是304不锈钢吗”、“这个是不锈钢的吗?”、“这个能涮火锅么?”、“今天天气怎么样?”等。知识条目是指可以采用单字、术语、短语、语句、符号等任意形式表述的人物、概念、种类、产品等任何信息。可以理解的是,由于知识库中知识条目的有限性,客服机器人在根据接收到的用户问题去知识库中进行搜索时,可能会基于用户问题的相似度匹配到知识条目,也可能匹配不到知识条目,而在匹配到知识条目的情况下,基于知识库提供的用户问题对应的答案也不一定是能够解决用户问题的答案或者用户会采纳的答案,也即存在知识条目匹配但答案不匹配的情况。 如下表1所示,该知识库包含天气、材质、功能等多个知识条目,而每一个知识条目下又包括了一个或多个相似的用户问题,且该用户问题均与知识条目相匹配,也即根据知识条目可以在知识库中搜索到所有与知识条目相关的用户问题。为在接收到用户问题的情况下,客服机器人能在知识库中匹配到知识条目并根据知识条目下指示的用户问题进行答复,需要在知识库中预先设置知识条目下的用户问题与答案的对应关系。但可以理解的是,由于知识库囊括的知识条目数据巨大,且知识条目仍处于不断地更新扩充中,因而知识条目下的用户问题可能存在未设置有对应的答案或者兜底答案的情况;而同一知识条目下的多个用户问题对应的答案可能相同也可能不相同,因此,知识条目下的用户问题与答案,既可能存在一对一的关系,也可能存在多对一、一对多的关系。 表1知识库示例
在此基础上,为提高知识库中答案的质量,客服机器人在为接收的用户问题提供答案的同时,还可以为用户提供一个或多个与答案相关的限制条件,如商品标识(如商品名称、商品编号等)、商品分类、有效时间等,以供用户在浏览答案时根据限制条件判断是否采纳该答案。在此基础上,在用户不采纳客服机器人提供的答案的情况下则可以根据用户过滤答案时采用的限制条件即答案的未匹配原因,更新知识库中的答案。本实施例仅以提供的答案的未匹配原因包括下述一种或多种为例进行说明:有效时间不匹配、商品标识不匹配、商品分类不匹配、用户不满意。 如表2所示,获取到的用户问题及答复结果的示例如下,其中,用户问题“这个不锈钢么?”在知识库中未匹配到知识条目;用户问题“今天下雨么?”虽匹配到了知识条目“天气”,但提供的答案用户不满意;用户问题“这个功率是多少?”匹配到了知识条目“功率”;但对应的答案有效时间已过期,用户未采纳;用户问题“这个有什么功能?”虽匹配到了知识条目“功能”,但提供的答案相关的商品标识不匹配,不是用户希望获得的答案,用户未采纳;而用户问题“这个是什么材质?”虽匹配到了知识条目“材质”,但对应的答案的商品分类不匹配,用户未采纳。可以理解的是,不同的用户问题可能匹配到相同的知识条目,而对应的答案的未匹配原因可能相同,也可能不相同。因此,在对获取到的用户问题及答复结果进行诊断分析之前,在用户问题匹配到知识条目的情况下,需要根据知识条目对不同的用户问题及答案的未匹配的原因进行统计。 表2用户问题及答复结果示例
在一种可选的实施方式中,通过消息队列获取所述客服机器人推送至所述消息队列的所述用户问题、所述答复结果。 消息队列是指使用Redis或Kafka、RabbitMQ、RocketMQ等消息中间件实现的消息队列。如此,通过将动态获取的用户问题、答复结果、知识条目推送至消息队列的方式,实现了动态获取用户问题与分析诊断用户问题之间的解耦,进而可以在获取到用户问题、答复结果、知识条目的基础上,可以根据客服机器人的应用场景等实际需求实现对用户问题、答复结果、知识条目的个性化诊断分析。 可以理解的是,在所述客服机器人将所述用户问题、所述答复结果推送至所述消息队列之前,所述客服机器人通过动态埋点技术获取所述用户问题及所述答复结果。也即是说,通过动态埋点SDK向客服机器人提供接口,以供客服机器人调用的方式,实时记录客服机器人接收的用户问题及客服机器人提供的答复结果。 步骤S102,根据所述答复结果以及所述用户问题在所述知识库中命中的知识条目,对所述用户问题进行诊断分析。 一方面,在所述答复结果为所述用户问题未匹配到任何所述知识条目的情况下,采用聚类算法对所述用户问题进行聚类以生成新的知识条目。具体地,参见下表3提供的用户问题聚类结果,则聚类以后得到两个含有相似用户问题的类簇,对应的新的知识条目为“不锈钢”、“处理器”。如此,可以将“不锈钢”、“处理器”作为新的知识条目增加至知识库并在知识库中为对应的用户问题配置一个或多个答案,以使后续客服机器人在接收到与“不锈钢”或“处理器”相关的用户问题时,可以在知识库中匹配到知识条目“不锈钢”、“处理器”,并提供相应的答案,以提升客服机器人的用户体验。其中,可采用的聚类算法包括但不限于下述任一种:K-means算法、层次聚类算法、均值漂移聚类算法。 参见表3用户问题聚类结果示例
在此基础上,为保证参与聚类的用户问题数量足够多,以提高聚类效果,在采用聚类算法对所述用户问题进行聚类以生成新的知识条目之前,判断未匹配到所述知识条目的用户问题数量是否大于阈值用户问题数量;在所述用户问题数量大于阈值用户问题数量的情况下采用聚类算法对所述用户问题进行聚类以生成新的知识条目。 其中,阈值用户问题数量是根据聚类算法等实际需求预先设定的,如以阈值用户问题数量为1000为例进行说明:在从消息队列中获取到用户问题及用户问题对应的答复结果以后,在答复结果为未匹配到知识条目的情况下,可以采用MySQL等数据库存储未匹配到知识条目的用户问题,并判断当前存储的未匹配到知识条目的用户问题数量是否大于1000条了,若不大于1000,则继续从消息队列中获取未匹配到知识条目的用户问题,若大于1000,则可以采用K-means算法、层次聚类算法、均值漂移聚类算法等中的任一种聚类算法对1000多条未匹配到知识条目的用户问题进行聚类,以生成一个或多个类簇,每一个类簇中包括一个或多个相似度较高的用户问题,且可以通过类簇包含的最小用户问题数量及用户问题相似度最低值来对类簇进行筛选,基于筛选后的类簇生成新的知识条目,且使得新的知识条目与类簇中的用户问题相匹配。在此基础上,可以将新的知识条目及该知识条目对应的类簇中的一个或多个用户问题添加至知识库中,同时在知识库中为用户问题设置一个或多个答案,以丰富扩充知识库。 更具体地,在使用聚类算法生成新的知识条目的过程中,通过可以TF-IDF(TermFrequency–Inverse Document Frequency,词频-逆向文件频率)技术,即一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术,对用户问题进行处理,以通过将用户问题转化为向量并计算用户问题对应的向量间的相似度来确定用户问题的相似度,进而实现用户问题聚类。 另一方面,在所述答复结果为所述用户问题匹配到所述知识条目的情况下,统计所匹配到的知识条目中对应于所述用户问题的答案的未匹配原因以及对应的用户问题数量。具体地,根据知识条目统计的每一个匹配到的知识条目对应的答案的未匹配原因、用户问题数量如下表4所示,其中,匹配到知识条目“材质”的用户问题具有多个,且对应的答案因商品分类不匹配而被过滤掉的用户问题数量最多为50个。可以理解的是,用户问题数量越多,则表明对应的答案被采纳的可能性越低,即该答案越需要更新。因此,可以基于统计后每一个知识条目对应的答案的未匹配原因以及用户问题数量,确定知识库中需要更新的答案或答案相关的商品分类、商品标识、有效时间等信息。 表4基于知识条目的统计结果示例
步骤S103,根据所述诊断分析的结果对所述知识库进行优化。 一方面,在根据未匹配到知识条目的用户问题聚类生成新的知识条目的基础上,可以将新的知识条目增加至知识库并在知识库中为对应的用户问题配置一个或多个答案,以丰富扩充知识库。 另一方面,在所述答复结果为所述用户问题匹配到所述知识条目的情况下,根据所述用户问题的答案的未匹配原因及对应的用户问题数量,更新所述知识库中所述知识条目指示的答案。如仍以表4为例进行说明,则可以在知识库中更新或者丰富知识条目“天气”指示的用户问题对应的答案;同时,还可以根据当前时间段,更新知识条目“功率”指示的用户问题对应的答案;而对于知识条目“功能”和“材质”,则需要分别更新与答案相关的商品标识及商品分类等信息。 更进一步地,为使得更新后的商品标识、商品分类更加符合用户预期,以提高用户对答案的满意度,在所述答案的未匹配原因为商品标识不匹配的情况下,根据所述用户问题中商品标识的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品标识;在答案的未匹配原因为商品分类不匹配的情况下,根据所述用户问题中商品分类的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品分类。具体地,以用户问题中出现的商品标识分别为AAA、BBB、CCC,且对应的出现频率分别为10、5、1为例,则可以优先出现频率最高的商品标识AAA替代知识库中答案相关的商品标识;而若用户问题中出现的商品分类分别为111、222、333,且对应的出现频率分别为3、2、1为例,则可以优先出现频率最高的商品分类111替代知识库中答案相关的商品份分类。 此外,随着知识库的不断优化更新,为尽可能的避免知识库中存在未配置答案或者兜底答案的知识条目,在整个知识库管理过程中,可以实时监测所述知识库是否存在未指示答案或未指示兜底答案的知识条目,以在所述知识库中存在未指示答案或未指示兜底答案的知识条目的情况下,在所述知识库中增加所述知识条目对应的答案或兜底答案。 基于上述实施例,通过动态获取客服机器人接收的用户问题及客服机器人基于知识库提供的答复结果,实现了对知识库的自动诊断分析;基于诊断分析结果,通过聚类算法生成新的知识条目,实现了对知识库的扩充;同时,在答案的未匹配原因为商品不匹配或商品分类不匹配的情况下,通过统计用户问题中出现的商品标识或商品分类,实现了对知识库中用户问题对应的商品标识或商品分类的更新。此外,还通过实时监测知识库中知识条目是否配置有答案或者兜底答案的方式,进一步实现了对知识库的管理及优化,提升了知识库的提升了知识库的诊断、优化效率。 参见图2,在上述实施例的基础上,本发明实施例提供了另一种客服机器人知识库的管理方法,该方法具体可以包括的步骤如下: 步骤S201,获取客服机器人接收的一个或多个用户问题及所述客服机器人基于知识库为所述用户问题提供的答复结果。具体地,可以通过消息队列接收客服机器人推送的用户问题、答复结果。 步骤S202,判断所述用户问题是否匹配到知识条目;若答复结果为用户问题匹配到知识条目则继续执行步骤S206,若答复结果为用户问题未匹配到知识条目则继续执行步骤S203。 步骤S203,在答复结果为用户问题未匹配到知识条目的情况下,判断未匹配到知识条目的用户问题数量是否大于阈值用户问题数量;若大于,则继续执行下述步骤S204,若不大于,则继续执行下述步骤S201,即继续从消息队列中获取用户问题、答复结果以及知识条目。 步骤S204,采用聚类算法对所述用户问题进行聚类以生成新的知识条目。 步骤S205,将新的知识条目添加至所述知识库。同时,还应该为新的知识条目指示的用户问题配置一个或多个答案。 步骤S206,统计所匹配到的知识条目中对应于所述用户问题的答案的未匹配原因以及对应的用户问题数量。 步骤S207,根据所述用户问题的答案的未匹配原因及对应的用户问题数量,更新所述知识库中所述知识条目指示的答案。 参见图3,在上述实施例的基础上,本发明实施例提供了一种客服机器人知识库的优化方法,以对上述步骤S207的实施方式进行详细的说明,具体可以包括的步骤如下: 步骤S2071,判断答案的未匹配原因;若答案的未匹配原因为商品分类不匹配,则继续执行步骤S2075,若答案的未匹配原因为商品标识不匹配,则继续执行步骤S2073,若答案的未匹配原因为用户不满意、有效时间不匹配等其他原因,则继续执行步骤S2072。 步骤S2072,在答案的未匹配原因为用户不满意或有效时间不匹配等其他原因的情况下,更新所述知识库中所述知识条目指示的答案。 步骤S2073,统计所述用户问题中的商品标识及所述商品标识的出现频率。 步骤S2074,根据所述商品标识的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品标识。 步骤S2075,统计所述用户问题中的商品分类及所述商品分类的出现频率。 步骤S2076,根据所述商品分类的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品分类。 参见图4,在上述实施例的基础上,本发明实施例提供了一种客服机器人知识库的管理装置400,包括:信息获取模块401、诊断分析模块402、知识库优化模块403;其中, 所述信息获取模块401,用于获取客服机器人接收的一个或多个用户问题及所述客服机器人基于知识库为所述用户问题提供的答复结果,所述知识库包括一个或多个知识条目,所述知识条目指示了一个或多个与所述知识条目匹配的用户问题及一个或多个答案,所述答复结果指示了所述用户问题是否匹配到所述知识条目,以及在所述用户问题匹配到所述知识条目时所述客服机器人提供的答案的未匹配原因; 所述诊断分析模块402,用于根据所述答复结果及所述用户问题在所述知识库中命中的知识条目对所述用户问题进行诊断分析; 所述知识库优化模块403,用于根据所述诊断分析的结果对所述知识库进行优化。 在一种可选的实施方式中,所述信息获取模块401,用于通过消息队列获取所述客服机器人推送至所述消息队列的所述用户问题、所述答复结果。 在此基础上,在所述客服机器人将所述用户问题、所述答复结果推送至所述消息队列之前,所述客服机器人通过动态埋点技术获取所述用户问题及所述答复结果。 在一种可选的实施方式中,所述根据所述答复结果的类型以及所述用户问题在所述知识库中命中的知识条目,对所述用户问题进行诊断分析,包括: 在所述答复结果为所述用户问题未匹配到任何所述知识条目的情况下,采用聚类算法对所述用户问题进行聚类以生成新的知识条目; 在所述答复结果为所述用户问题匹配到所述知识条目的情况下,统计每一个所匹配到的知识条目中对应于所述用户问题的答案的未匹配原因以及对应的用户问题数量。 在一种可选的实施方式中,所述诊断分析模块403,还用于, 在采用聚类算法对所述用户问题进行聚类以生成新的知识条目之前,判断未匹配到所述知识条目的用户问题数量是否大于阈值用户问题数量; 在所述用户问题数量大于阈值用户问题数量的情况下采用聚类算法对所述用户问题进行聚类以生新的知识条目。 在一种可选的实施方式中,所述根据所述诊断分析的结果对所述知识库进行优化,包括: 在所述答复结果为所述用户问题匹配到所述知识条目的情况下,根据所述用户问题的答案的未匹配原因及对应的用户问题数量,更新所述知识库中所述知识条目指示的答案。 在一种可选的实施方式中,所述答案的未匹配原因包括下述一种或多种:有效时间不匹配、商品标识不匹配、商品分类不匹配、用户不满意。 在一种可选的实施方式中,所述根据所述用户问题的答案的未匹配原因及对应的用户问题数量,更新所述知识库中所述知识条目指示的答案,包括: 在所述答案的未匹配原因为商品标识不匹配的情况下,根据所述用户问题中商品标识的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品标识; 在所述答案的未匹配原因为商品分类不匹配的情况下,根据所述用户问题中商品分类的出现频率,更新所述知识库中所述知识条目指示的答案对应的商品分类。 在一种可选的实施方式中,所述诊断分析模块403,还用于, 判断所述知识库是否存在未指示答案或未指示兜底答案的知识条目,以在所述知识库中存在未指示答案或未指示兜底答案的知识条目的情况下,在所述知识库中增加所述知识条目对应的答案或兜底答案。 图5示出了可以应用本发明实施例的客服机器人知识库的管理方法或客服机器人知识库的管理装置的示例性系统架构500。 如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。 用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。 终端设备501、502、503可以是具有显示屏并且支持用户咨询问题的各种电子设备,包括但不限于智能客服机器人等。 服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503发送的用户问题及答复结果进行分析,以对知识库进行优化的服务器。后台管理服务器可以对接收到的用户问题及答复结果等数据进行分析等处理,并将处理结果反馈给终端设备。 需要说明的是,本发明实施例所提供的客服机器人知识库的管理方法一般由服务器505执行,相应地,客服机器人知识库的管理装置一般设置于服务器505中。 应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。 下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。 如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。 以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。 特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。 需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。 附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。 描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括信息获取模块诊断分析模块、知识库优化模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,知识库优化模块还可以被描述为“用于根据诊断分析的结果对知识库进行优化的模块”。 作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取客服机器人接收的一个或多个用户问题及所述客服机器人基于知识库为所述用户问题提供的答复结果,所述知识库包括一个或多个知识条目,所述知识条目指示了一个或多个与所述知识条目匹配的用户问题及一个或多个答案,所述答复结果指示了所述用户问题是否匹配到所述知识条目,以及在所述用户问题匹配到所述知识条目时所述客服机器人提供的答案的未匹配原因;根据所述答复结果以及所述用户问题在所述知识库中命中的知识条目对所述用户问题进行诊断分析;根据所述诊断分析的结果对所述知识库进行优化。 根据本发明实施例的技术方案,通过动态获取客服机器人接收的用户问题及客服机器人基于知识库提供的答复结果,实现了对知识库的自动诊断分析;基于诊断分析结果,通过聚类算法生成新的知识条目,实现了对知识库的扩充;同时,在答案的未匹配原因为商品不匹配或商品分类不匹配的情况下,通过统计用户问题中出现的商品标识或商品分类,实现了对知识库中用户问题对应的商品标识或商品分类的更新。此外,还通过实时监测知识库中知识条目是否配置有答案或者兜底答案的方式,进一步实现了对知识库的管理及优化,提升了知识库的提升了知识库的诊断、优化效率。 上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。