一种智能母婴知识服务方法及系统

文档序号:1407035 发布日期:2020-03-06 浏览:12次 >En<

阅读说明:本技术 一种智能母婴知识服务方法及系统 (Intelligent mother and infant knowledge service method and system ) 是由 熊杰 金炎芳 于 2019-10-24 设计创作,主要内容包括:本发明公开了一种智能母婴知识服务方法及系统,该方法包括:周期性或实时采集大量的母婴数据信息,并储存在数据库中;所述母婴数据信息包括:母婴相关知识问题及相关知识答案;根据储存在数据库中的母婴数据信息,构建问答知识库;获取用户发送的母婴知识查询请求,将所述查询请求在所述问答知识库中查找相对应的信息;所述查询请求包括:用户问题;将查找的相对应的信息反馈给用户;本发明通过建立问答知识库,有效的解决了现有母婴知识服务方法不能完整的展现一种从孕妇备孕到孕妇分娩,再到孩子养育的全过程,缺乏人性化智能的展现方式,展现形式单一的问题。(The invention discloses an intelligent mother-infant knowledge service method and system, wherein the method comprises the following steps: collecting a large amount of mother and infant data information periodically or in real time, and storing the information in a database; the maternal and infant data information includes: mother and infant related knowledge questions and related knowledge answers; constructing a question-answer knowledge base according to mother-infant data information stored in the database; acquiring a mother-infant knowledge query request sent by a user, and searching corresponding information in the question-answer knowledge base by the query request; the query request includes: a user question; feeding back the searched corresponding information to the user; by establishing the question-answer knowledge base, the problems that the whole process from pregnancy preparation of the pregnant woman to delivery of the pregnant woman and then to child nurturing cannot be completely shown by the conventional maternal and infant knowledge service method, a humanized and intelligent showing mode is lacked, and the showing form is single are effectively solved.)

一种智能母婴知识服务方法及系统

技术领域

本发明属于母婴保健技术及计算机互联网领域,特别涉及一种智能母婴知识服务方法及系统。

背景技术

随着互联网的快速发展,计算机技术已经在各行各业方便着人们的生活。在医疗领域也不例外。在网络上潜藏着大量的母婴专业数据,这些信息对于母婴保健问题的解决,就像黄金一样零零散散的隐没在沙子里。虽然很有用,但是不够系统、不够完整,缺乏灵活智能的组织和人性化的展现方式,最终不能很好的发挥作用。

经过调查,目前市场上存在的“育儿网”、“babytree”、“YY网”等育儿平台,他们更加关注于儿童,因此对于育儿而言也更加专业。但是,他们只是关注于保健以及育儿知识的普及,没有对孕前准备、孕期检查等孕妇相关的知识进行普及,也没有对信息进行有效的构建和整理,以形成知识库从而为用户更好地服务。

因此,为了使网络上的母婴专业数据更加的系统完整,如何开发出一种方法及系统对母婴知识进行搜集整理成为该行业亟待解决的技术问题。

发明内容

为了解决现有技术中存在的不能对信息进行有效的构建和整理,不能为用户更好的进行服务的问题,本发明提供了一种智能母婴知识服务方法及系统,其通过构建问答知识库,对大量母婴专业数据进行有效的构建和整理,使得有关母婴的信息更加的系统完整。

为了解决上述技术问题,第一方面,本发明实施例提供一种智能母婴知识服务方法,包括:

S1、周期性或实时采集大量的母婴数据信息,并储存在数据库中;所述母婴数据信息包括:母婴相关知识问题及相关知识答案;

S2、根据储存在数据库中的母婴数据信息,构建问答知识库;

S3、获取用户发送的母婴知识查询请求,将所述查询请求在所述问答知识库中查找相对应的信息;所述查询请求包括:用户问题;

S4、将查找的相对应的信息反馈给用户。

在一个实施例中,将所述查询请求在所述问答知识库中查找相对应的信息,包括:

S31、预处理:通过繁简转换、分词器切分、主体以及领域识别对用户的所述查询请求进行处理;

S32、检索:根据预处理中获得的主体以及领域识别结果缩小问答知识库的搜索域,计算用户问题与问答知识库中问题的语义相似度,召回问答知识库中与用户问题相似的问题,构成候选问题集;

S33、匹配:根据不同的维度度量用户问题与候选问题集之间的相似度特征值;所述不同维度包括编辑距离和语义相似度;

S34、排序:根据所述相似度特征值对候选问题集进行排序,反馈最相近问题的答案给用户。

在一个实施例中,计算用户问题与问答知识库中问题的语义相似度,包括:

S321、对所述问答知识库中所有的问题计算语义向量P;

S322、根据生成的语义向量P构建对应的语义树,对所述用户问题计算语义向量Pˊ;

S323、计算两个问题的语义向量余弦相似度,计算公式如下:

Figure BDA0002246357810000021

其中,cos(PPˊ)表示语义向量余弦相似度;所述语义向量余弦相似度为语义相似度。

在一个实施例中,所述步骤S322中构建对应的语义树,包括:根据预处理中基于主体以及领域识别的结果,对所述问答知识库中的问题,利用annoy算法预先建立语义树索引。

在一个实施例中,所述步骤S34包括:对所述相似度特征值进行加权,根据加权结果进行排序。

第二方面,本发明还提供一种智能母婴知识服务系统,包括:

采集模块:用于周期性或实时采集大量的母婴数据信息,并储存在数据库中;所述母婴数据信息包括:母婴相关知识问题及相关知识答案;

构建模块:用于根据储存在数据库中的母婴数据信息,构建问答知识库;

查找模块:获取用户发送的母婴知识查询请求,将所述查询请求在所述问答知识库中查找相对应的信息;所述查询请求包括:用户问题;

反馈模块:用于将查找的相对应的信息反馈给用户。

在一个实施例中,所述查找模块包括:

预处理子模块:用于通过繁简转换、分词器切分、主体以及领域识别对用户的所述查询请求进行处理;

检索子模块:用于根据预处理中获得的主体以及领域识别结果缩小问答知识库的搜索域,计算用户问题与问答知识库中问题的语义相似度,召回问答知识库中与用户问题相似的问题,构成候选问题集;

匹配子模块:用于根据不同的维度度量用户问题与候选问题集之间的相似度特征值;所述不同维度包括编辑距离和语义相似度;

排序子模块:用于根据所述相似度特征值对候选问题集进行排序,反馈最相近问题的答案给用户。

在一个实施例中,所述检索子模块包括:

第一计算单元:对所述问答知识库中所有的问题计算语义向量P;

第二计算单元:根据生成的语义向量P构建对应的语义树,对所述用户问题计算语义向量Pˊ;

第三计算单元:计算两个问题的语义向量余弦相似度,计算公式如下:

Figure BDA0002246357810000031

其中,cos(PPˊ)表示语义向量余弦相似度;所述语义向量余弦相似度为语义相似度。

在一个实施例中,所述第二计算单元中构建对应的语义树,包括:根据预处理中基于主体以及领域识别的结果,对所述问答知识库中的问题,利用annoy算法预先建立语义树索引。

在一个实施例中,所述排序子模块用于对所述相似度特征值进行加权,根据加权结果进行排序。

本发明的优点在于,提出了一种智能母婴知识服务方法及系统,通过构建问答知识库,使母婴知识更加的系统完整,解决了现有母婴知识服务方法不能完整的展现一种从孕妇备孕到孕妇分娩,再到孩子养育的全过程,缺乏人性化智能的展现方式,展现形式单一的问题。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明实施例提供的智能母婴知识服务方法流程图。

图2为本发明实施例提供的查找对应信息的流程图。

图3为本发明实施例提供的计算语义相似度的流程图。

图4为本发明提供的智能母婴知识服务系统图。

图5为本发明提供的智能母婴知识服务系统中查找模块的运行流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明提供的一种智能母婴知识服务方法,参照图1所示,包括:

S1、周期性或实时采集大量的母婴数据信息,并储存在数据库中;母婴数据信息包括:母婴相关知识问题及相关知识答案;

S2、根据储存在数据库中的母婴数据信息,构建问答知识库;

S3、获取用户发送的母婴知识查询请求,将查询请求在问答知识库中查找相对应的信息;查询请求包括:用户问题;

S4、将查找的相对应的信息反馈给用户。

在本实施例中,共涉及三方:用户客户端、系统服务器和与系统服务器连接的数据库服务器。其中:用户客户端比如可以是PC端或是移动终端。

在步骤S1中信息采集是系统服务器在后台运行的第一道程序,虽然用户无法直接看到,但是其为知识构建模块提供素材。因此,作为整个系统服务器的基础,其重要性不言而喻。通过周期性或实时性的信息采集可以实时的进行信息更新获得该领域的最新资料信息,且本申请不仅可以对网站上的信息进行采集还可以对与母婴知识相关的书籍进行采集。比如,对网站上的信息进行采集可以利用爬虫程序进行定时下载,解析最新的母婴数据,储存在数据库中。

其信息采集的流程是:比如首先选择几个比较权威的网站(妈妈网、太平洋亲子网、育儿网等),然后定时的爬取其数据,然后解析,去除无用标签、广告,最后持久化到数据库中;其中,爬虫程序是一个自动下载网页的程序,它根据既定的抓取目标,有选择的访问万维网上的网页与相关的链接,获取所需要的信息。爬虫程序并不追求大的覆盖,而将目标定为抓取与某一特定主题内容相关的网页,为面向主题的用户查询准备数据资源。本发明实施例对采集的来源不作限定。

步骤S2-S4中,根据储存在数据库中的母婴数据信息构建问答知识库,使得母婴的相关的数据信息更加的系统完整,在获取用户问题之后,对用户问题进行预处理,然后对处理之后的结果在问答知识库中进行检索,接着根据在问答知识库中检索出来的问题与用户的问题进行特征匹配,最后根据匹配的结果进行排序,并将与用户问题最相似的问题答案反馈给用户。

如图2所示,在一个实施例中,将查询请求在问答知识库中查找相对应的信息,包括:

S31、预处理:通过繁简转换、分词器切分、主体以及领域识别对用户的查询请求进行处理;

S32、检索:根据预处理中获得的主体以及领域识别结果缩小问答知识库的搜索域,计算用户问题与问答知识库中问题的语义相似度,召回问答知识库中与用户问题相似的问题,构成候选问题集;

S33、匹配:根据不同的维度度量用户问题与候选问题集之间的相似度特征值;不同维度包括编辑距离和语义相似度。

S34、排序:根据相似度特征值对候选问题集进行排序,反馈最相近问题的答案给用户。

在本实施例中,步骤S31中,对用户问题进行繁简转换等操作,再此基础上进行分词处理,依据主体以及领域识别,最后获得用户问题的主体以及领域识别结果。其中,分词器的分词原理为:其是按照一定的策略将待分析的字符串与一个“充分大的”机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词),通过分词处理可以更加容易的识别用户问题中的主体以及领域,缩小搜索范围。

步骤S32中,以用户问题的主体以及领域识别结果缩小问答知识库中问题的搜索范围,例如问题的主体是孕妇,领域识别结果是孕期检查,那么就只在对应的问题集下检索。检索方式是计算用户问题与问题集的语义相似度,按照语义相似度从大到小排列,取较为靠前对应的问题集作为候选问题集,如,选择前一百个对应的问题,将该问题构成候选问题集。

步骤S33-S34中,通过在编辑距离和语义相似度两个维度度量用户问题与候选问题集之间的相似度特征值,将相似度特征值进行加权之后进行排序,返回最相近问题的答案给用户。

其中,编辑距离是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,***一个字符,删除一个字符。一般来说,编辑距离越小,两个字符串的相似度越大。

在一个实施例中,如图3所示,计算用户问题与问答知识库中问题的语义相似度,包括:

S321、对问答知识库中所有的问题计算语义向量P;

S322、根据生成的语义向量P构建对应的语义树,对用户问题计算语义向量Pˊ;

S323、计算两个问题的语义向量余弦相似度,计算公式如下:

Figure BDA0002246357810000061

其中,cos(PPˊ)表示语义向量余弦相似度;语义向量余弦相似度为语义相似度。

上述步骤S322中构建对应的语义树,具体包括:根据预处理中基于主体以及领域识别的结果,对问答知识库中的问题,利用annoy算法预先建立语义树索引。

上述步骤S34包括:对相似度特征值进行加权,根据加权结果进行排序。

本发明公开的一种智能母婴知识服务方法,通过建立问答知识库,有效的解决了现有母婴知识服务方法不能完整的展现从孕妇备孕到孕妇分娩,再到孩子养育的全过程,缺乏人性化智能的展现方式,展现形式单一的问题。该方法对大量母婴专业数据进行有效的构建和整理,使得有关母婴的信息更加的系统完整,并通过计算用户问题与问答知识库中问题的语义相似度,提高匹配的准确性,并将相似度特征值进行加权,根据加权结果进行排序,最终反馈给用户,提高了用户的使用体验。

基于同一发明构思,本发明实施例还提供了一种智能母婴知识服务的系统,由于该系统所解决问题的原理与前述方法相似,因此该系统的实施可以参见前述方法的实施,重复之处不再赘述。

第二方面,本发明还提供一种智能母婴知识服务的系统,参照图4所示,包括:

采集模块1:用于周期性或实时采集大量的母婴数据信息,并储存在数据库中;所述母婴数据信息包括:母婴相关知识问题及相关知识答案;

构建模块2:用于根据储存在数据库中的母婴数据信息,构建问答知识库;

查找模块3:获取用户发送的母婴知识查询请求,将查询请求在问答知识库中查找相对应的信息;查询请求包括:用户问题;

反馈模块4:用于将查找的相对应的信息反馈给用户。

如图4-5所示,在一个实施例中,查找模块3包括:

预处理子模块31:用于通过繁简转换、分词器切分、主体以及领域识别对用户的查询请求进行处理;

检索子模块32:用于根据预处理中获得的主体以及领域识别结果缩小问答知识库的搜索域,计算用户问题与问答知识库中问题的语义相似度,召回问答知识库中与用户问题相似的问题,构成候选问题集;

匹配子模块33:用于根据不同的维度度量用户问题与候选问题集之间的相似度特征值;不同维度包括编辑距离和语义相似度;

排序子模块34:用于根据相似度特征值对候选问题集进行排序,反馈最相近问题的答案给用户。

在一个实施例中,在一个实施例中,检索子模块32包括:

第一计算单元321:对问答知识库中所有的问题计算语义向量P;

第二计算单元322:根据生成的语义向量P构建对应的语义树,对用户问题计算语义向量Pˊ;

第三计算单元323:计算两个问题的语义向量余弦相似度,计算公式如下:

Figure BDA0002246357810000071

其中,cos(PPˊ)表示语义向量余弦相似度;语义向量余弦相似度为语义相似度。

在一个实施例中,第二计算单元322中构建对应的语义树,包括:根据预处理中基于主体以及领域识别的结果,对问答知识库中的问题,利用annoy算法预先建立语义树索引。

在一个实施例中,排序子模块34用于对相似度特征值进行加权,根据加权结果进行排序。

本发明提供的一种智能母婴知识服务系统,对母婴信息进行有效的构建和整理,以问答知识库的形式呈现给用户,解决了现有母婴知识服务方法不能完整的展现从孕妇备孕到孕妇分娩,再到孩子养育的全过程全过程,缺乏人性化智能的展现方式,展现形式单一的问题。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种优化肝复乐抗肝癌组方药理学分析方法和系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!