一种基于网络数据的在线医疗患者满意度测量方法

文档序号：1955268 发布日期：2021-12-10 浏览：19次 >En<

阅读说明：本技术 一种基于网络数据的在线医疗患者满意度测量方法 (Online medical patient satisfaction measuring method based on network data ) 是由由丽萍王世兴于 2021-08-16 设计创作，主要内容包括：本发明属于医疗服务评价领域,公开了一种基于网络数据的在线医疗患者满意度测量方法,包括以下步骤：获取在线医疗评论文本；S2、对在线医疗评论文本进行情感语义分析,得到情感语义标注文本；S3、识别评论文本对应的患者满意度评价属性；S4、确定评价文本中各个评价属性的评价值；S5、将医疗评论的情感分析结果转化为向量,以医生为评价对象,得到各个评价对象的评价值向量；基于TF-IDF计算各个评价属性的权值；S6、根据权值和评价值向量,计算各个评价对象的满意度值。本发明以语义深度的情感分析提取患者评论文本中的评价属性体系和评估值；以优化的多评价属性决策法对评论数据进行计算,得到综合测量结果,提高了医疗服务评价的效率和准确性。(The invention belongs to the field of medical service evaluation, and discloses an online medical patient satisfaction measuring method based on network data, which comprises the following steps: acquiring an online medical comment text; s2, performing sentiment semantic analysis on the online medical comment text to obtain a sentiment semantic annotation text; s3, identifying the patient satisfaction evaluation attribute corresponding to the comment text; s4, determining the evaluation value of each evaluation attribute in the evaluation text; s5, converting emotion analysis results of the medical comments into vectors, and obtaining evaluation value vectors of all the evaluation objects by taking doctors as the evaluation objects; calculating the weight of each evaluation attribute based on TF-IDF; and S6, calculating the satisfaction value of each evaluation object according to the weight and the evaluation value vector. The evaluation attribute system and the evaluation value in the comment text of the patient are extracted by emotion analysis of semantic depth; the comment data are calculated by an optimized multi-evaluation attribute decision method to obtain a comprehensive measurement result, so that the efficiency and the accuracy of medical service evaluation are improved.)

技术领域

本发明属于医疗服务管理与评价领域，具体地说，涉及一种基于网络数据的在线医疗患者满意度测量方法。

背景技术

患者满意度(Patient Satisfaction，PS)是患者在治疗过程中的实际体验与其期望相比其需求被满足的程度。国际上患者满意度被视为测量和报告医疗服务质量的关键组成部分，开发了多种评价量表，主要有美国兰德公司学者Ware 1976年研制的系列患者满意度问卷、英国Baker 1990年研制的全科医学服务患者满意度问卷、Grol等1999年开发的欧洲全科医疗服务满意度问卷以及2000年澳大利亚维多利亚住院患者满意度监测等。

但是，传统的患者满意度测量主要依靠专家法和问卷调查数据，难以适应在线医疗环境下提高患者体验的需要。因此，如何适应新时代的技术和数据，充分利用网络信息资源，得到更为丰富的评价属性体系，得到结构良好的、量化的患者满意度测量结果，成为摆在管理者面前需要迫切解决的问题。

发明内容

本发明克服现有技术存在的不足，所要解决的技术问题为：提供一种基于网络数据的在线医疗患者满意度测量方法。

为了解决上述技术问题，本发明采用的技术方案为：一种基于网络数据的在线医疗患者满意度测量方法，包括以下步骤：

S1、获取在线医疗评论文本；

S2、对在线医疗评论文本进行情感语义分析，得到情感语义标注文本，所述情感语音标注文本中标注了语义类、语义角色以及情感词；

S3、根据所述情感语义标注文本中的语义类标识、语义角色标识，匹配患者满意度评价属性数据库，识别评论文本对应的患者满意度评价属性；

S4、根据所述情感语义标注文本中的情感词标识，确定评价文本中各个评价属性的评价值；

S5、将医疗评论的情感分析结果转化为向量，所述向量包括每一条患者评论所涉及的评价属性及其评价值，以医生为评价对象，得到各个评价对象的评价值向量；基于TF-IDF计算各个评价属性的权值；

S6、根据权值和评价值向量，计算各个评价对象的满意度值。

所述步骤S2中，对在线医疗评论文本进行情感语义分析时，采用语义词典和模式匹配规则相结合的语义分析方法，识别医疗在线评论中的情感信息，将在线评论转化为由情感语义类、语义角色组成的结构化信息；

其中，语义词典按以下方法构建：首先从在线医疗应用平台爬取多个患者评论文本；然后对其进行进行分词、词性标注预处理，提取其中的动词和形容词，存储为初始词表；对词表中表达同类情感范畴的词归入同一语义类，添加语义类的定义和描述，描述内容包括语义类名称、该类别的所有词语、每个词语的情感值；其中情感值的标注根据词语的情感极性及其强度确定，取值范围为(0-1.0)。

所述步骤S3中，还包括构建患者满意度评价属性数据库的步骤，所述患者满意度评价属性数据库的构建方法为：基于语义标注的在线评论数据，抽取“语义类-语义角色”对，采用层次聚类法对其进行聚类，形成患者满意度评价属性体系，并储存在患者满意度评价属性数据库中。

所述步骤S3中，在匹配过程中，如遇评价属性数据库未收录词，则计算其与已有词语的语义相似度，根据相似度最高的词语，确定其所属类别；如遇数据库未收录语义角色或语义角色缺省，则仅以语义类匹配评价属性数据库；如果在数据库中该语义类对应多个评价属性类别，则以频率最高者为最终的评价属性识别结果。

所述步骤S4中，各个评级评价属性的评价值以词典中词语的情感值为基础，再依据语义角色和上下文特征而定，其中，上下文特征主要为程度副词修饰语和否定词修饰语，程度副词修饰语调整情感值的高低，而否定词的作用是使情感值取反值。

所述步骤S5中，各个评价对象的评价值向量D_i＝(f_i1,f_i2,…,f_im)中各个元素的计算公式为：

其中，D_i表示第i个评价对象的评价值向量，f_ij表示第i个评价对象在第j个评价属性上的标准化评价值，A_ij表示第i个评价对象在第j个评价属性上的评价值之和。

所述步骤S5中，各个评价属性的权值计算公式为：

W_j＝TF_j×IDF_j；

其中，TF_j表示第j个评价属性的词频，IDF_j表示第j个评价属性的逆向文件频率。

各个评价属性的词频和逆向文件频率的计算公式为：

其中，n_j(d)和n_k(d)分别表示第j和第k个评论评价属性在评论文本集d中的出现次数，|D|为总评论条数，|{j：t_i∈d_m}|为包含第j个评价属性的评论条数，t_i表示第i条评论，d_m表示全部评论。

所述步骤S6中，各个评价对象满意度的计算公式为：

其中，Qi表示第i个评价对象的满意度，v表示第二权重，S*表示群体效用值S_i中的最小值，S-表示群体效用值S_i中的最大值，R*表示个体遗憾值R_i中的最小值，R-表示个体遗憾值R_i中的最大值，即：S^*＝minS_i，S^-＝maxS_i，R^*＝minR_i，R^-＝maxR_i；S_i表示第i个评价对象的个体遗憾值，R_i表示第i个评价对象的个体遗憾值；

其中，S_i和R_i的计算公式为：

其中，W_j表示第j个评价属性的权重，f_j*和f_j ^—分别表示各个评价对象的评价值向量中，第j个评价属性评估值中的最大值和最小值，f_ij表示第i个评价对象在第j个评价属性上的评价值。

本发明提供了一种基于网络数据的在线医疗患者满意度测量方法，该方法以语义深度的情感分析作为数据收集和处理方式，提取患者评论文本中的评价属性体系和评估值；以优化的多评价属性决策法对评论数据进行计算，得到综合测量结果，与现有技术相比具有以下有益效果：

(1)以基于语义深度的情感分析实现医疗在线评论的深度挖掘，突破以往情感分析语义理解不足、精准度低、领域深度不够的问题。

(2)以大规模医疗在线评论为数据来源，实现患者满意度评价属性的提取和分类，突破以往基于专家法和问卷数据的评价属性构建的局限性。

(3)基于优化的多评价属性法测量患者满意度，既反映与患者需求相关的评价属性，也兼顾不合意愿的评价属性，使评价结果更符合在线环境特点。

附图说明

图1为本发明实施例提供的一种基于网络数据的在线医疗患者满意度测量方法的流程示意图；

图2为本发明实施例中，基于语义的在线医疗评论情感分析的流程示意图；

图3为本发明实施例中，对在线医疗评论的标注结果示意图；

图4为本发明实施例中依存句法分析的示意图；

图5为本发明实施例中患者满意度评价属性识别与分类流程图；

图6为本发明实施例中采用的评价值算法的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种基于网络数据的在线医疗患者满意度测量方法，以大规模医疗在线评论为数据来源，实现患者满意度评价属性的提取和分类，突破以往基于专家法和问卷数据的局限性；(2)在语义深度分析在线评论的情感信息，突破以往情感分析语义理解不足、精准度低、领域深度不够的问题，为患者满意度评价提供结构化数据；(3)基于一种优化的多评价属性法测量患者满意度，既反映与患者需求相关的评价属性，也兼顾不合意愿的评价属性，使评价结果更符合在线环境特点。如图1所示，本发明主要包括以下几个步骤。

S1、获取在线医疗评论文本。

S2、对在线医疗评论文本进行情感语义分析，得到情感语义标注文本，所述情感语音标注文本中标注了语义类、语义角色以及情感词。

如图2所示，为本实施例中在线医疗评论文本进行情感语义分析的流程示意图。本实施例中，首先采用语义词典和模式匹配规则相结合的语义分析方法，对医疗在线评论进行情感语义分析，识别医疗在线评论中的情感信息，将在线评论转化为由情感语义类、语义角色组成的结构化信息。其中，语义词典按以下方法构建：首先从在线医疗应用平台爬取大量患者评论文本；然后，对其进行进行分词、词性标注预处理；然后，提取其中的动词和形容词，存储为初始词表；对词表中表达同类情感范畴的词归入同一语义类，添加语义类的定义和描述，描述内容包括语义类名称、该类别的所有词语、每个词语的情感值。其中语义类的归类参考《现代汉语词典》、《新编同义词词林》(新编同义词词林[M].上海辞书出版社,亢世勇.2015.)等资源。其中情感值的标注根据词语的情感极性及其强度确定，取值范围为(0-1.0)。各个语义类下的词语对应的情感值举例如表1所示。

表1医疗领域语义分类词典示例

语义分析采用基于词典和规则的方法，过程为：首先对评论文本进行分词、词性标注，然后对其进行依存句法分析，然后基于情感语义词典和模式匹配规则进行语义标注。其中模式匹配规则主要依据句子的句法依存关系，以句法成分与语义角色之间的对应关系确定语义标注规则。根据大规模在线医疗评论文本的分析，归纳语义标注规则如下：

(1)若分句只有一个情感词而没有其他成分，即独词句，则不标注任何语义角色；

(2)若情感词所在分句的句法结构为主谓依存关系，则标注依存结构中的被支配成分(即主语)的语义角色为“评价对象”；

(3)若情感词所在分句的句法结构为定中依存关系，则标注依存结构中的被支配成分(即定语)的语义角色为“评价对象”。

标注系统核心功能采用python语言开发，利用pymysql、progress、owlready2、rdflib、xlwt等相关包，使用MySQL服务器存储评论文本，处理结果如图3所示。

以某一医疗评论为例：

原文：觉得这个医生负责并且医术高明，对人特别亲切，是非常好的医生。

断句、分词、词性标注：

分句1：觉得/v这个/r医生/n负责/v并且/c医术/n高明/a

分句2：对/p人/n特别/d亲切/a

分句3：是/v非常/d好/a的/u医生/n

其中，“/”后面的字母表示对应的词的词性，依存句法分析的结果如图4所示。图4中，HED表示句法结构中的谓语中心语，VOB表示宾语，ATT表示定语，SBV表示主语，ADV表示状语，POB表示介词宾语，RAD表示助词附加语。

最后得到的情感语义标注文本如表2所示。

表2情感语义分析结果示例

编号	情感词	语义类	语义角色	程度词	否定词
						00101	负责	责任心	这个医生	无	无
00102	高明	能干	医术	无	无
						00103	亲切	社交行为评价	无	特别	无
00104	好	合意性	医生	非常	无

S3、根据所述情感语义标注文本中的语义类标识、语义角色标识，匹配患者满意度评价属性数据库，识别评论文本对应的患者满意度评价属性；

所述步骤S3中，还包括构建患者满意度评价属性数据库的步骤，所述患者满意度评价属性数据库的构建方法为：基于语义标注后的在线评论数据，抽取“语义类-语义角色”对，采用层次聚类法对其进行聚类，形成患者满意度评价属性体系，并储存在患者满意度评价属性数据库中。评价属性体系如表3所示。

表3患者满意度评价属性体系

从步骤S2得到的情感语义标注数据中，抽取语义类、语义角色以及频率信息，与患者满意度评价属性分类体系建立映射关系，储存在患者满意度评价属性数据库中。如表4所示，列出了部分医术评价属性对应的语义类、语义角色及频率。

表4医术评价属性对应的语义类、语义角色及频率(部分)

基于情感语义标注文本，根据语义类、语义角色标识，匹配患者满意度评价属性数据库，从而识别评论文本所对应的患者满意度评价属性。在匹配过程中，如遇评价属性数据库未收录词，则计算其与已有词语的语义相似度，根据相似度最高的词语，确定其所属类别。如遇数据库未收录语义角色或语义角色缺省，则仅以语义类匹配评价属性数据库；如果在数据库中该语义类对应多个评价属性类别，则以频率最高者为最终的评价属性识别结果。其中，语义相似度以0.7为有效值下限。

具体处理流程如图5表示。

示例：协和医院的大夫不仅口碑和知名度高，而且医术真的很好。

语义标注：E1{F(高):高低,Obj:口碑}；

E2{F(高):高低,Obj:知名度}；

E3{F(好):合意性,Obj:医术}；

其中，F表示一个语义类，Obj表示语义角色“评价对象”。“合意性+医术”根据知识库匹配至“医术”主题下；“高低+知名度”匹配至“整体”主题下。“高低+口碑”中，评价对象“口碑”未被收录，于是计算其与“高低”语义类下词语的语义相似度。

表5评价对象“口碑”和“高低”语义类下各词语语义相似度

从表5可见，“口碑”与“知名度”的语义相似度为0.875200，高于0.7有效，所以，“高低+口碑”属于评价属性“整体”。

S4、根据所述情感语义标注文本中的情感词标识，确定评价文本中各个评价属性的评价值。

医疗在线评论的评价值以情感词的情感值为基础，再依据语义角色和上下文特征而定。例如上下文出现副词“很”，则情感值±0.1，即情感强度增强0.1，正面评价则加0.1，负面评价则减0.1；出现否定修饰语，则以(1－原值)为最终评价值。具体算法如图6所示。

例如上文评论句的评价值标注结果如表6所示。

表6评价值标注结果

编号	语义类	程度词	否定词	评价值
					00101	负责	无	无	0.6
00102	高明	无	无	0.6
					00103	亲切	特别	无	0.8
00104	好	非常	无	0.8

S5、将医疗评论的情感分析结果转化为向量，所述向量包括每一条患者评论所涉及的评价属性及其评价值，以医生为评价对象，得到各个评价对象的评价值向量。

(1)评论向量的构建

将医疗评论的情感分析结果转化为向量，表示一条患者评论所包含的评价属性，以及各评价属性的评价值：R_k＝(a_k1，a_k2，...，a_km)；其中，R_k表示第k条患者评论；a_kj表示该评论中在第j个评价属性上给出的评价值。

以医生为评价对象，测量每个医生分评价属性的评价值，即用评价属性所对应的所有评论标注的评价值之和表示，

其中，D表示作为评价对象的某一医生得到的患者评价向量，R_k代表针对此医生的第k条患者评论的向量，a_kj为第k条患者评论在第j个评价属性上的评价值。设第i个评价对象在第j个评价属性上的评价值之和为A_ij，则对其进行标准化处理，公式为：

通过式(2)，可以计算得到第i个评价对象的评价值向量：D_i＝(f_i1，f_i2，...，f_im)。f_ij表示第i个评价对象在第j个评价属性上的标准化评价值，A_ij表示第i个评价对象在第j个评价属性上的评价值之和。

(2)基于TF-IDF的权值计算

以评价属性词条的TF-IDF指数计算评价属性的权重。其中，词频(TermFrequency，TF)是指评价属性所对应词语在评论文本中的频率：

其中TF_j表示第j个评价属性的词频，n_j为第j个评价属性在评论文本集d中的出现次数，n_k为第k个评价属性在评论文本集中的出现次数，分母的求和表示所有评价属性在该文本集中的出现次数。

逆向文件频率(IDF，Inverse Document Frequency)是一个评价属性的普遍重要程度的度量值。总评论条数(|D|)除以包含该评价属性词条的评论(j)的条数，再取以10为底的对数：

其中，|D|为总评论条数，|{j：t_i∈d_m}|为包含第j条评价属性的评论条数，t_i表示第i条评论，d_m表示全部评论。

最后，权重的计算为TF与IDF的乘积，即某一评价属性出现的频率(TF)越高，且其在评论集合中的文件频率越低，则其权重越高：

W_j＝TF_j×IDF_j；(5)

其中，W_j表示第j个评价属性的权重。

S6、根据权值和评价值向量，计算各个评价对象的满意度值。

首先，确定每个评价属性标准化评价值中的最大值f^* _j和最小值f_j ^-，即在所有医生评价对象中确定评价属性j所对应标准化评价值的最大值和最小值。然后，计算评价对象的标准化评价值与其中的最大值的加权距离

之后，计算每一个评价对象的S_i值和R_i值，S_i值代表群体效用值，R_i值代表个体遗憾值。计算公式为：

最后，计算总体患者满意度：

其中，有：

S^*＝minS_i，S^-＝maxS_i，R^*＝minR_i，R^-＝maxR_i；(8)

式(7)中，Q_i表示第i个评价对象的满意度，v表示第二权重，表征了群体最大效用和个体遗憾的权重，S*表示各个群体效用值S_i中的最小值，S-表示各个群体效用值S_i中的最大值，R*表示各个个体遗憾值R_i中的最小值，R-表示各个个体遗憾值R_i中的最大值。式(7)中，可以设置第二权重v的值为0.5，即均衡考虑群体最大效用和个体遗憾。

从在线医疗网站“好大夫在线”上爬取10万条患者评论，包括评价文本、星级数量、整体评分等。对爬取数据进行分词、词性标注和语义标注。通过构建患者评论向量，计算分评价属性的患者满意度计算。表7为评估值，标准化为0到1之间取值。

表7标准化的评估值

注：数字后上标“*”表示最大值，上标“-”表示最小值。

计算总体患者满意感。首先确定每个评价属性的最大值和最小值。然后，计算各评价值与其加权距离，即最后，以第二权值v＝0.5，即平衡考虑群体最大效用和个体遗憾对总体满意度的影响，得到排名结果：A>D>E>F>B>C。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

17页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：晚期卵巢癌满意肿瘤细胞减灭术前评估与预测模型的建立与改良

一种基于网络数据的在线医疗患者满意度测量方法

相关技术

网友询问留言