手术编码方法以及电子设备、存储装置

文档序号:782689 发布日期:2021-04-09 浏览:12次 >En<

阅读说明:本技术 手术编码方法以及电子设备、存储装置 (Operation encoding method, electronic device and storage device ) 是由 周开银 吴及 刘喜恩 刘少辉 尤心心 于 2020-12-21 设计创作,主要内容包括:本申请公开了一种手术编码方法以及电子设备、存储装置,其中,手术编码方法包括:获取待编码手术名,并获取若干个对应有手术编码的标准手术名;提取标准手术名的第一语义表示,并提取待编码手术名的第二语义表示;其中,第二语义表示包括:待编码手术名内文字、分词中至少一者的语义信息,待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息;基于第二语义表示分别与若干标准手术名的第一语义表示之间的第一相似度,得到待编码手术名的手术编码。上述方案,能够提高手术编码的效率和准确性。(The application discloses a surgery encoding method, electronic equipment and a storage device, wherein the surgery encoding method comprises the following steps: acquiring operation names to be coded and acquiring a plurality of standard operation names corresponding to operation codes; extracting a first semantic representation of a standard operation name and extracting a second semantic representation of an operation name to be coded; wherein the second semantic representation comprises: semantic information of at least one of characters and participles in the operation name to be coded, semantic information of key words related to the operation in the operation name to be coded and semantic information of word categories of the key words; and obtaining the operation code of the operation name to be coded based on the first similarity between the second semantic representation and the first semantic representations of the plurality of standard operation names respectively. By the scheme, the efficiency and the accuracy of operation coding can be improved.)

手术编码方法以及电子设备、存储装置

技术领域

本申请涉及自然语言理解技术领域,特别是涉及一种手术编码方法以及电子设备、存储装置。

背景技术

手术编码是对临床医师给出的手术名进行规范化,是病案管理中的一项基本工作。手术编码不仅能为医院统计、科研、教学以及医疗管理提供可靠的检索依据,也能够为医疗纠纷、事故等提供法律依据。

目前,众多医疗机构均通过病案管理人员人工完成手术编码,效率较低。此外,由于临川医师书写习惯的差异,更是增加了病案管理人员正确识别并编码手术名的难度,从而可能导致编码出错。有鉴于此,如何提高手术编码的效率和准确性成为亟待解决的问题。

发明内容

本申请主要解决的技术问题文本是提供一种手术编码方法以及电子设备、存储装置,能够提高手术编码的效率和准确性。

为了解决上述问题文本,本申请第一方面提供了一种手术编码方法,包括:获取待编码手术名,并获取若干个对应有手术编码的标准手术名;提取标准手术名的第一语义表示,并提取待编码手术名的第二语义表示;其中,第二语义表示包括:待编码手术名内文字、分词中至少一者的语义信息,待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息;基于第二语义表示分别与若干标准手术名的第一语义表示之间的第一相似度,得到待编码手术名的手术编码。

为了解决上述问题文本,本申请第二方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的手术编码方法。

为了解决上述问题文本,本申请第三方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的手术编码方法。

上述方案,通过获取待编码手术名,并获取若干个对应有手术编码的标准手术名,从而提取标准手术名的第一语义表示,并提取待编码手术名的第二语义表示,且第二语义表示包括:待编码手术名内文字、分词中至少一者的语义信息,待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息,进而基于第二语义表示分别与若干标准手术名的第一语义表示之间的第一相似度,得到待编码手术名的手术编码,由于在第二语义表示融入了待编码手术名内文字、分词中至少一者的语义信息、待编码手术名中与手术相关的关键词语的语义信息、关键词语的词语类别的语义信息等多种不同粒度的信息,故能够充分挖掘待编码手术名中的丰富信息,从而能够提高第二语义表示的准确性,进而能够有利于提高手术编码的准确性,且由于无需人工即可对待编码手术名进行编码,故还能够提高手术编码的效率。

附图说明

图1是本申请手术编码方法一实施例的流程示意图;

图2是本申请手术编码方法一实施例的状态示意图;

图3是提取待编码手术名的第二语义表示一实施例的流程示意图;

图4是节点关系图一实施例的框架示意图;

图5是提取待编码手术名的第二语义表示一实施例的状态示意图;

图6是图1中步骤S13一实施例的流程示意图;

图7是本申请手术编码方法另一实施例的流程示意图;

图8是手术编码模型的训练方法一实施例的流程示意图;

图9是本申请电子设备一实施例的框架示意图;

图10是本申请存储装置一实施例的框架示意图。

具体实施方式

下面结合说明书附图,对本申请实施例的方案进行详细说明。

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。

请参阅图1,图1是手术编码方法一实施例的流程示意图。具体而言,可以包括如下步骤:

步骤S11:获取待编码手术名,并获取若干个对应有手术编码的标准手术名。

需要说明的是,本公开实施例中所指的“手术”可以包括:切除、修补、矫正、取出、止血、引流、缝合、移植等各种外科操作。例如,“鼻背瘢痕切除术”、“鼻窦瘘修补术”、“鼻窦异物取出术”、“髌骨内固定物取出术”、“鼻甲电凝止血术”、“鼻腔切开引流术”、“唇撕裂缝合术”、“鼻中隔软骨移植术”等等,在此不再一一举例。此外,本公开实施例中所指的“手术”也可以包括诸如检查、探查、灌洗等各种医学操作。例如,“大肠活组织检查”、“大肠探查术”、“肺灌洗术”等等,在此不再一一举例。

在一个实施场景中,若干个对应有手术编码的标准手术名可以是从诸如ICD-9-CM(International Classification of Diseases,Ninth Revision,ClinicalModification,即国际疾病分类-第9次修订-临床修改)中获取得到的。例如,标准手术名“左心室冠状静脉导联植入术”其对应的手术编码为0.52001;或者,标准手术名“颅内脓肿引流术”其对应的手术编码为1.24009;或者,标准手术名“颅骨部分切除术”其对应的手术编码为1.25002;或者,标准手术名“脑脊液鼻瘘修补术”其对应的手术编码为2.12001;或者,标准手术名“脊髓探查术”其对应的手术编码为3.092;或者,标准手术名“脊髓活组织检查”其对应的手术编码为3.32001;或者,标准手术名“骶神经刺激电极取出术”其对应的手术编码为3.94001等等,在此不再一一举例。

在现实场景中,待编码手术名可能带有临床医师个人书写习惯,从而导致待编码手术名具有不同类型的多样性。例如,待编码手术名包含英文缩写,或者存在错别字,或者含有近义词,或者存在冗余描述,或者存在信息缺失,或者蕴含推理信息。

在一个具体的实施场景中,待编码手术名中可能含有英文缩写。例如,待编码手术名“UPPP”,其对应的标准手术名为“悬雍垂-软腭-咽成形术”。

在另一个具体的实施场景中,待编码手术名还可能存在错别字。例如,待编码手术名“经皮穿刺球囊扩张椎体成型术”,其对应的标准手术名为“经皮椎体球囊扩张成形术”,即将“成形术”错写为“成型术”。

在又一个具体的实施场景中,待编码手术名还可能含有近义词。例如,待编码手术名“右上肺叶切除淋巴结廓清术”,其对应的标准手术名为“肺叶切除术”,即将“切除术”以近义词“廓清术”替代。

在又一个具体的实施场景中,待编码手术名还可能存在冗余描述。例如,待编码手术名“DSA引导下左侧L3-5脊髓和神经根粘连松解术”,其对应的标准手术名为“脊髓和神经根粘连的松解术”,即“DSA引导下左侧L3-5”为冗余描述。

在又一个具体的实施场景中,待编码手术名还可能存在信息缺失。例如,待编码手术名“VVI型永久性心脏起搏器植入术(ST.JUDE)”,可见待编码手术名中未强调是“单腔”还是“双腔”起搏器植入。

在又一个具体的实施场景中,待编码手术名还可能蕴含推理信息。例如,待编码手术名“右肺上叶后段切除术”,其中“右肺上叶后段”本质上指的就是“肺节段”,即其对应的标准手术名为“肺节段切除术”。

在一个实施场景中,请结合参阅图2,图2是本申请手术编码方法一实施例的状态示意图。如图2所示,基于待编码手术名的多样性,为了提高后续编码的准确性,可以在提取待编码手术名的第二语义表示之前,先对待编码手术名进行预处理,预处理操作具体可以包括以下至少一者:将待编码手术名中的英文缩写还原为英文缩写的中文全称,以更新待编码手术名;将待编码手术名中的关键词语替换为关键词语的标准词语,以更新待编码手术名。需要说明的是,在对待编码手术名进行预处理的情况下,如无特别说明,后续语义提取等相关处理步骤,均是针对预处理之后的待编码手术名执行的。

在一个具体的实施场景中,可以获取手术名英文缩写字典,并在手术名英文缩写字典中查找待编码手术名中的英文缩写所对应的中文全称,从而可以将查找到的中文全称替换待编码手术名中的英文缩写,以更新待编码手术名。此外,为了提高更新待编码手术名的准确性,该手术名英文缩写字典可以长期维护,例如,在出现新的手术名英文缩写的情况下,可以将新出现的手术名英文缩写及其中文全称添加至该手术名英文缩写字典;或者,在手术名英文缩写及其中文全称中任一者发生变化的情况下,可以对手术名英文缩写字典中手术名英文缩写及其中文全称进行更新。上述方式,通过将待编码手术名中的英文缩写还原为英文缩写的中文全称,以更新待编码手术名,能够有利于提高后续手术编码的准确性。

在另一个具体的实施场景中,待编码手术名中的关键词语可以包括但不限于:术式、部位等等,在此不做限定。例如,关于术式的标准词语“切除术”其对应的近义词可以包括但不限于:“廓清术”;或者,关于部位的标准词语“脑部”其对应的近义词可以包括但不限于:“脑”,上述举例仅仅是实际应用过程中可能存在的一种情况,并不因此而限定实际应用过程中可能存在的其他情况,在此不再一一举例。在此基础上,可以获取术式近义词字典、部位近义词字典中的至少一者,从而可以识别待编码手术名中关于术式、部位中至少一者的关键词语,并在术式近义词字典、部位近义词字典的至少一者中,查找与上述识别得到的关键词语对应的标准词语,并将待编码手术名中的关键词语替换为其标准词语,以更新待编码手术名。此外,为了提高更新待编码手术名的准确性,上述术式近义词字典、部位近义词字典可以长期维护,例如,在出现新的术式或其近义词的情况下,可以将新出现的术式或其近义词添加至术式近义词字典。上述方式,通过将待编码手术名中的关键词语替换为关键词语的标准词语,以更新待编码手术名,能够有利于提高后续手术编码的准确性。

步骤S12:提取标准手术名的第一语义表示,并提取待编码手术名的第二语义表示。

本公开实施例中,第二语义表示包括:待编码手术名内文字、分词中至少一者的语义信息,待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息。具体地,如前所述,词语类别除上述术式、部位之外,还可以包括入路、辅助医技、疾病性质等等,在此不做限定。

在一个具体的实施场景中,待编码手术名中的关键词语及其词语类别可以通过诸如结巴分词等NER(Named Entity Recognition,命名实体识别)工具识别得到,具体的NER工具在此不做限定。

在另一个具体的实施场景中,以待编码手术名“经皮穿刺球囊扩张椎体成型术”为例,其经近义词替换之后,可以更新为“经皮穿刺球囊扩张椎体成形术”,则其中与手术相关的关键词语可以包括:词语类别为“术式”的关键词语“成形术”、词语类别为“部位”的关键词语“椎体”、词语类别为“入路”的关键词语“皮穿刺”、词语类别为“辅助医技”的关键词语“球囊扩张”。其他情况可以以此类推,在此不再一一举例。

在又一个具体的实施场景中,以待编码手术名“右上肺叶切除淋巴结廓清术”为例,经近义词替换之后,可以更新为“右上肺叶切除淋巴结切除术”,则其中与手术相关的关键词语可以包括:词语类别为“术式”的关键词语“切除术”、词语类别为“部位”的关键词语“右上肺叶”、词语类别为“疾病性质”的关键词语“淋巴结”。其他情况可以以此类推,在此不再一一举例。

需要说明的是,待编码手术名内文字、分词为两种不同粒度的字符,通常分词的粒度大于文字的粒度。此外,关键词语及其词语类别又是与上述文字、分词中任一者粒度不同的字符,通常关键词语的粒度大于文字的粒度,且关键词语的粒度大于或等于分词的粒度。以待编码手术名“右上肺叶切除淋巴结廓清术”为例,其经过近义词替换后为“右上肺叶切除淋巴结切除术”,其中文字可以包括:“右”、“上”、“肺”“叶”、“切”、“除”、“淋”、“巴”、“结”、“切”、“除”、“术”,其中分词可以包括:“右上”、“肺叶”、“切除”、“淋巴结”、“切除术”。此外,如前所述,其关键词语包括:“切除术”、“右上肺叶”、“淋巴结”,其词语类别包括:“术式”、“部位”、“疾病性质”。其他情况可以以此类推,在此不再一一举例。

在一个实施场景中,对于标准手术名,可以将其进行分词,得到标准手术名中若干分词,并将上述若干分词进行向量映射,得到每一分词的向量表示,最后将若干分词的向量表示进行融合,得到标准手术名的第一语义表示。

在一个具体的实施场景中,可以采用诸如结巴分词等NER工具对标准手术名进行分词。具体的NER工具除上述结巴分词外,还可以包括但不限于:HanLP等等,在此不做限定。

在另一个具体的实施场景中,可以通过word2vec等词向量工具对分词进行向量映射,得到分词的向量表示。具体的词向量工具除上述word2vec外,还可以包括但不限于:glove等等,在此不做限定。

在又一个具体的实施场景中,通过向量映射,可以得到预设维度(如,128维)的向量表示。在此基础上,对于每一标准手术名,可以将该标准手术名中分词的向量表示相加,得到标准手术名的第一语义表示。

在另一个实施场景中,为了提高语义表示的提取效率,还可以预先训练一个语义提取模型,该语义提取模型可以包括但不限于:BERT(Bidirectional EncoderRepresentation from Transformers,即双向Transformer的Encoder)等。在此基础上,从而可以利用语义提取模型对标准手术名进行语义提取,得到标准手术名的第一语义表示。上述语义提取模型的具体训练过程,在此不再赘述。

在一个实施场景中,对于待编码手术名,可以提取其内文字、分词中至少一者的语义信息,并提取待编码手术名中与手术相关的关键词语的语义信息,以及提取关键词语的词语类别的语义信息,最终将上述语义信息进行融合,得到待编码手术名的第二语义表示。

在一个具体的实施场景中,如前所述,为了提高语义表示的抽取效率,可以预先训练一个语义提取模型(如,BERT等),从而可以利用语义提取模型对待编码手术名及其中关键词语的词语类别进行语义提取,得到待编码手术名内文字、分词中至少一者的语义信息语义信息、关键词语的语义信息以及词语类别的语义信息。

在另一个具体的实施场景中,上述文字、分词中至少一者的语义信息语义信息、关键词语的语义信息以及词语类别的语义信息三者可以均为预设维度(如,128维)的向量表示,则可以将上述预设维度的向量表示相加,从而实现将上述语义信息进行融合,最终可以将相加之后的向量表示,作为待编码手术名的第二语义表示。

在另一个实施场景中,为了提高第二语义表示的准确性,可以将待编码手术名内文字、分词中至少一者、关键词语以及关键词语的词语类别,分别作为节点,从而可以利用节点之间的节点关系,提取节点的节点语义表示,最终将各个节点的节点语义表示进行融合,可以得到第二语义表示。具体过程可以参阅下述相关实施例,在此暂不赘述。

在一个具体的实施场景中,待编码手术名内文字、分词中的至少一者可以仅包括待编码手术名内文字,也可以仅包括待编码手术名内分词。此外,为了提高第二语义表示中不同粒度语义信息丰富度,还可以同时包括待编码手术名内文字和分词。具体可以根据实际应用需要进行设置,在此不做限定。

在另一个具体的实施场景中,上述节点关系可以包括但不限于:相邻关系、包含关系、从属关系等等,在此不做限定。具体地,相邻文字之间为相邻关系,相邻分词之间也为相邻关系;而分词和分词中文字为包含关系,关键词语和关键词语中分词也为包含关系;关键词语及其所属的词语类别为从属关系。仍以待编码手术名“右上肺叶切除淋巴结廓清术”为例,其经过近义词替换后为“右上肺叶切除淋巴结切除术”,其中文字可以包括:“右”、“上”、“肺”“叶”、“切”、“除”、“淋”、“巴”、“结”、“切”、“除”、“术”,其中分词可以包括:“右上”、“肺叶”、“切除”、“淋巴结”、“切除术”。此外,如前所述,其关键词语包括:“切除术”、“右上肺叶”、“淋巴结”,其词语类别包括:“术式”、“部位”、“疾病性质”,文字“右”和文字“上”为相邻关系,而分词“右上”和文字“右”、“上”为包含关系,关键词语“右上肺叶”和分词“右上”、“肺叶”为包含关系,关键词语“右上肺叶”和词语类别“部位”为从属关系。其他情况可以以此类推,在此不再一一举例。

步骤S13:基于第二语义表示分别与若干标准手术名的第一语义表示之间的第一相似度,得到待编码手术名的手术编码。

在一个实施场景中,第一相似度具体可以是第一语义表示和第二语义表示之间的余弦相似度。

在另一个实施场景中,标准手术名的第一语义表示其向量维度可能较大,在此情况下,可以先分别对若干标准手术名的第一语义表示进行全连接变换,以压缩标准手术名的第一语义表示的向量维度,从而能够有利于降低后续计算第一语义相似度的计算负荷。

在又一个实施场景中,可以计算第二语义表示分别与若干标准手术名的第一语义表示之间的内积,之后再利用softmax对上述内积进行归一化,得到第二语义表示分别与若干标准手术名的第一语义表示之间的第一相似度。

在又一个实施场景中,可以将最高的第一相似度所对应的标准手术名的手术编码,作为待编码手术名的手术编码。需要说明的是,此处“待编码手术名”指的是前述预处理之前原始的待编码手术名。仍以待编码手术名“右上肺叶切除淋巴结廓清术”为例,其经过近义词替换后为“右上肺叶切除淋巴结切除术”,经过语义提取以及相似度计算,最终可以确定与标准手术名“肺叶切除术”之间的第一相似度最高,在此基础上,可以将“肺叶切除术”的手术编码(如,“肺叶切除术”在ICD-9-CM中的手术编码“32.4”)作为原始的待编码手术名“右上肺叶切除淋巴结廓清术”的手术编码。其他情况可以以此类推,在此不再一一举例。

上述方案,通过获取待编码手术名,并获取若干个对应有手术编码的标准手术名,从而提取标准手术名的第一语义表示,并提取待编码手术名的第二语义表示,且第二语义表示包括:待编码手术名内文字、分词中至少一者的语义信息,待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息,进而基于第二语义表示分别与若干标准手术名的第一语义表示之间的第一相似度,得到待编码手术名的手术编码,由于在第二语义表示融入了待编码手术名内文字、分词中至少一者的语义信息、待编码手术名中与手术相关的关键词语的语义信息、关键词语的词语类别的语义信息等多种不同粒度的信息,故能够充分挖掘待编码手术名中的丰富信息,从而能够提高第二语义表示的准确性,进而能够有利于提高手术编码的准确性,且由于无需人工即可对待编码手术名进行编码,故还能够提高手术编码的效率。

请参阅图3,图3是提取待编码手术名的第二语义表示一实施例的流程示意图。具体可以包括如下步骤:

步骤S31:将待编码手术名内文字、分词中至少一者、关键词语以及关键词语的词语类别,分别作为节点。

如前述公开实施例所述,待编码手术名内文字、分词中至少一者可以仅包括待编码手术名内文字,也可以仅包括待编码手术名内分词。此外,为了提高第二语义表示中不同粒度语义信息丰富度,还可以同时包括待编码手术名内文字和分词。具体可以根据实际应用需要进行设置,在此不做限定。

在一个具体的实施场景中,仍以待编码手术名“右上肺叶切除淋巴结廓清术”为例,其经过近义词替换后为“右上肺叶切除淋巴结切除术”,其中文字可以包括:“右”、“上”、“肺”“叶”、“切”、“除”、“淋”、“巴”、“结”、“切”、“除”、“术”,其中分词可以包括:“右上”、“肺叶”、“切除”、“淋巴结”、“切除术”。此外,如前所述,其关键词语包括:“切除术”、“右上肺叶”、“淋巴结”。在此基础上,可以将上述文字、分词、关键词语及其词语类别均作为节点。其他情况可以以此类推,在此不再一一举例。

步骤S32:利用节点之间的节点关系,提取节点的节点语义表示。

如前述公开实施例所述,节点关系可以包括但不限于:相邻关系、包含关系、从属关系等等,在此不做限定。具体可以参阅前述公开实施例中相关描述,在此不再赘述。

在一个实施场景中,为了提高节点语义表示的准确性,可以采用图神经网络来提取节点的节点语义表示。在此基础上,可以先利用节点以及节点之间的节点关系,构建节点关系图,且节点关系图中,存在节点关系的节点之间具有预设权值的连接边,从而可以将节点关系图输入图神经网络,得到各个节点语义表示。上述方式,通过利用节点以及节点之间的节点关系,构建节点关系图,且节点关系图中,存在节点关系的节点之间具有预设权值的连接边,从而将节点关系图输入图神经网络,得到各个节点语义表示,进而对于每一节点,能够通过图神经网络聚合其本身的语义信息以及与其存在连接边的节点的语义信息,故能够使得每一节点的节点语义表示均能够包含多种粒度的语义信息,有利于提高节点语义表示的准确性。

在一个具体的实施场景中,预设权值可以根据实际应用需要进行设置,例如,可以设置为1。此外,不存在节点关系的节点之间不具有预设权值的连接边,即可以认为不存在节点关系的节点之间其权值为0。

在另一个具体的实施场景中,请结合参阅图4,图4是节点关系图一实施例的框架示意图。如图4所示,圆形表示节点,其中,左上矩形区域内以斜线填充圆形表示文字,左下矩形区域内以网格填充圆形表示分词,这两部分均直接来源于待编码手术名,而右上矩形区域内以点填充圆形表示关键词语,右下矩形区域内以水平线填充圆形表示词语类别,这两部分均是从待编码手术名中提取出来的手术知识。请继续结合参阅图4,节点之间以线连接表示两者之间存在节点关系。具体地,以两端无箭头的实线连接表示两者之间存在相邻关系,以两端无箭头的虚线连接表示两者之前存在包含关系,以两端有箭头的实线连接表示两者之间存在从属关系。图4所示仅仅为实际应用中可能存在的一种节点关系图,在此并不因此而限定节点关系图的具体框架结构,具体可以根据实际情况进行设置,在此不再一一举例。

在又一个具体的实施场景中,图神经网络可以聚合节点的邻居节点(即与该节点存在节点关系的节点)的语义信息来更新本节点表征。具体地,图神经网络可以包括图卷积网络(Graph Convolutional Network,GCN),从而可以利用GCN直接聚合各邻居节点的信息。

在又一个具体的实施场景中,为了能够在聚合过程中,学习到不同邻居节点对于本节点的重要程序,以差别性地聚合邻居节点的语义信息,图神经网络还可以包括门控图神经网络(Gated Graph Neural Network,GGNN)。具体地,GGNN的计算过程可以表示为:

at=Ah(t-1)Wa……(1)

zt=σ(Wzat+Uzh(t-1)+bz)……(2)

rt=σ(Wrat+Urh(t-1)+br)……(3)

上述公式(1)至公式(5)中,Wa、Wz、Uz、bz;Wr、Ur、br;Wh、Uh、bh均表示GGNN的网络参数,上述网络参数可以在训练过程中进行调整。A表示节点关系图的邻接矩阵,且A∈R|V|*|V|,即邻接矩阵是一个|V|*|V|大小的实数矩阵,|V|表示节点关系图中的节点数量。邻接矩阵中每一元素表示两个节点之间的权值,如前所述,在两个节点存在节点关系的情况下,两者之间的权值为预设权值(如,1),在两个节点不存在节点关系的情况,两者之间的权值为其他权值(如,0)。σ表示sigmoid函数,用于将数值归一化至0~1范围内。h(t-1)表示节点在t-1时刻的向量表示。此外,zt和rt可以均视为门控,其中,zt控制遗忘信息,rt控制新产生信息。公式(4)所示的即为新产生信息,公式(5)中h(t-1)*(1-zt)即为选择遗忘t-1时刻哪些信息,而即为选择选择记住t时刻哪些新产生信息,ht即为节点在t时刻更新后的向量表示。由此可见,通过zt和rt可以有效控制邻居节点传递给待更新节点的信息,从而可以学习到不同邻居节点对于本节点的重要程序,以差别性地聚合邻居节点的语义信息。GGNN的具体处理过程在此不再赘述。

步骤S33:将各个节点的节点语义表示进行融合,得到第二语义表示。

在一个实施场景中,可以将各个节点的节点语义表示相加,得到第二语义表示,从而可以降低融合的复杂度。

在另一个实施场景中,为了提高第二语义表示的准确性,可以将各个节点的节点语义表示进行最大池化处理,得到第一融合语义表示,并将各个节点的节点语义表示进行平均池化处理。得到第二融合语义表示,最后利用第一融合语义表示和第二融合语义表示,得到第二语义表示。具体地,可以将第一融合语义表示和第二融合语义表示相加,得到第二语义表示。上述方式,通过将各个节点的节点语义表示进行最大池化处理,得到第一融合语义表示,并将各个节点的节点语义表示进行平均池化处理。得到第二融合语义表示,从而利用第一融合语义表示和第二融合语义表示,得到第二语义表示,进而能够有利于提高第二语义表示的准确性。

在一个具体的实施场景中,请结合参阅图5,图5是提取待编码手术名的第二语义表示一实施例的状态示意图。如图5所示,节点关系图中各个圆形分别表示节点,如包含节点h1、h2、h3、h4、h5、h6、h7,此外,以不同形式填充的圆形分别表示文字、分词、关键词语和词语类别,且节点之间的连线表示节点间存在节点关系,具体可以参阅前述相关描述,在此不再赘述。在节点关系图输入GGNN之后,即可对节点的语义信息进行聚合。如图5所示,以节点h5为例,与其存在节点关系的节点为h1、h3、h4、h6,上述四个节点的语义信息经过聚合之后,可以更新节点h5的语义信息,为了区别描述记为h5’,其他节点可以以此类推,在此不再一一举例。在各个节点均更新完毕之后,可以得到h1’、h2’、h3’、h4’、h5’、h6’、h7’。在此基础上,通过最大池化可以得到第一融合语义表示,通过平均池化可以得到第二融合语义表示,再将两者进行融合,可以得到待编码手术名的第二语义表示hG

在另一个具体的实施场景中,为了便于描述,可以以hi表示不同节点,并以hi′表示经GGNN更新之后的节点,则第二语义表示hG可以表示为:

上述公式(6)中,V表示节点关系图,|V|表示节点关系图中节点数量,maxpooling表示最大池化。

区别于前述实施例,通过将待编码手术名内文字、分词中至少一者、关键词语以及关键词语的词语类别,分别作为节点,从而利用节点之间的节点关系,提取节点的节点语义表示,进而将各个节点的节点语义表示进行融合,得到第二语义表示,能够有利于通过节点之间的节点关系,聚合节点本身语义信息和其邻居节点的语义信息,有利于提高节点语义表示的准确性,继而能够有利于提高第二语义表示的准确性。

请参阅图6,图6是图1中步骤S13一实施例的流程示意图。具体可以包括如下步骤:

步骤S61:按照第一相似度由高到低的顺序,选取若干标准手术名,作为候选手术名。

在一个实施场景中,若干标准手术名的个数可以根据实际应用需要进行设置。例如,可以设置为3个、4个、5个等等,在此不做限定。

在一个具体的实施场景中,以若干标准手术名的个数为5个为例,为了便于后续描述,可以分别记为候选手术名1、候选手术名2、候选手术名3、候选手术名4、候选手术名5。

步骤S62:获取候选手术名中与关键词语匹配的目标词语,并基于目标词语的词语类别,得到候选手术名的命中合理度。

在一个实施场景中,如前述公开实施例所述,可以采用NER工具识别候选手术名中各个词语,为了便于区分,可以将候选手术名中与手术相关的词语,记为第一关键词语,并将待编码手术名中关键词语记为第二关键词语。在此基础上,为了从第一关键词语中筛选与第二关键词语匹配的目标词语,可以将第一关键词语替换为相应的标准词语,并将第二关键词语也替换为相应的标准词语,从而若第一关键词语和第二关键词语在替换后一致,则可以认为第一关键词语与第二关键词语匹配,并将该第一关键词语作为目标词语。

在一个具体的实施场景中,为了准确地替换标准词语,可以利用标准词语字典(如,术式字典、部位字典)来替换第一关键词语和第二关键词语。例如,标准词语字典中标准词语“切除术”对应有非标准词语“廓清术”,则在第一关键词语和/或第二关键词语为“廓清术”的情况下,将其替换为“切除术”。其他情况可以以此类推,在此不再一一举例。

在一个实施场景中,在目标词语的词语类别包括术式和部位的情况下,可以将候选手术名的命中合理度设置为第一数值,在目标词语的词语类别仅包括术式的情况下,将候选手术名的命中合理度设置为第二数值,在目标词语的词语类别仅包括部位的情况下,将候选手术名的命中合理度设置为第三数值,且第一数值大于第二数值,第二数值大于第三数值。例如,第一数值为3、第二数值为2、第三数值为1,在此不做限定。上述方式,通过在目标词语的词语类别包括术式和部位的情况下,将第二候选手术名的命中合理度设置为第一数值,在目标词语的词语类别包括术式的情况下,将第二候选手术名的命中合理度设置为第二数值,在目标词语的词语类别包括部位的情况下,将第二候选手术名的命中合理度设置为第三数值,且第一数值大于第二数值,第二数值大于第三数值,从而能够按照术式和部位均匹配、仅术式匹配、仅部位匹配的优先级顺序关注候选手术名,进而能够在手术编码过程中,不仅考虑语义相似度,还能够进一步关注候选手术名的合理性。

步骤S63:利用命中合理度和第一相似度,选择一个候选手术名,并将选择的候选手术名的手术编码,作为待编码手术名的手术编码。

具体地,可以在命中合理度最高的若干候选手术名中,选择第一相似度最高的候选手术名。仍以前述5个候选手术名为例,经过上述匹配过程中,可以得到候选手术名1的命中合理度为3、候选手术名2的命中合理度也为3,候选手术名3至候选手术名5的命中合理度为2,则候选手术名1和候选手术名2的命中合理度最高,且由于候选手术名1的第一相似度为0.9,候选手术名2的第一相似度为0.85,则可以选择候选手术名1,并将候选手术名1的手术编码,作为待编码手术名的手术编码。其他情况可以以此类推,在此不再一一举例。

区别于前述实施例,通过按照第一相似度由高到低的顺序,选取若干标准手术名,作为候选手术名,从而获取候选手术名中与关键词语匹配的目标词语,并基于目标词语的词语类别,得到候选手术名的命中合理度,进而利用命中合理度和第一相似度,选择一个候选手术名,并将选择的候选手术名的手术编码,作为待编码手术名的手术编码,故此能够在手术编码过程中,不仅考虑语义相似度,还能够进一步关注候选手术名的合理性,能够有利于提高手术编码的准确性。

请参阅图7,图7是本申请手术编码方法另一实施例的流程示意图。具体而言,可以包括如下步骤:

步骤S71:获取待编码手术名,并获取若干个对应有手术编码的标准手术名。

具体可以参阅前述公开实施例中相关步骤,在此不再赘述。

步骤S72:提取标准手术名的第一语义表示,并提取待编码手术名的第二语义表示。

本公开实施例中,第二语义表示包括:待编码手术名内文字、分词中至少一者的语义信息,待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息。具体可以参阅前述公开实施例中相关步骤,在此不再赘述。

请结合参阅图2,如图2所示,在预处理之后,待编码手术名需经过“粗选”,“粗选”的具体步骤可以参阅如下描述。

步骤S73:获取待编码手术名与各个标准手术名之间的第二相似度。

在一个实施场景中,第二相似度包括字符相似度,字符相似度具体表示待编码手术名与各个标准手术名在字符层面的相似度。具体地,针对每一标准手术名,获取标准手术名中各个词语对标准手术名的重要程度。在此基础上,可以分别将每一标准手术名作为当前手术名,并基于当前手术名中与分词相同的词语中的重要程度,得到当前手术名与待编码手术名之间的字符相似度。上述方式,通过将第二相似度设置为包括字符相似度,并针对每一标准手术名,获取标准手术名中各个词语对标准手术名的重要程度,从而分别将每一标准手术名,作为当前手术名,进而基于当前手术名中与分词相同的词语的重要程度,得到当前手术名与待编码手术名之间的字符相似度,故此能够有利于提高字符相似度的准确性。

在一个具体的实施场景中,可以通过TF-IDF(Term Frequency-Inverse DocumentFrequency)来获取标准手术名中各个词语对标准手术名的重要程度。具体可以参阅下式:

tfidfi,j=tfi,j*idfi……(9)

上述公式(7)至公式(9)中,tfi,j表示第i个词语在第j个标准手术名中出现的频率,又可以称为词频,其中,ni,j表示第i个词语在第j个标准手术名中出现的次数,∑knk,j表示第j个标准手术名中总词数。idfi表示第i个词语对于当前标准手术名的重要度,|D|表示标准手术名的个数,|{j:ti∈dj}|表示包含第i个词语的标准手术名的个数,最后通过计算tfi,j和idfi的乘积,可以得到第j个标准手术名中各个词语的重要程度。需要说明的是,tfidfi,j越大表示第j个标准手术名中第i个词语对于第j个标准手术名越重要。

在另一个具体的实施场景中,具体可以将当前手术名中与分词相同的词语的重要程度之和,作为当前手术名与待编码手术名之间的字符相似度。以共计3个标准手术名为例,分别记为标准手术名A和标准手术名B,其中标准手术名A包括词语A1、A2和A3,标准手术名B包括词语B1、B2和B3,则对于包含词语D1、D2和D3的待编码手术名D而言,可以将标准手术名A作为当前手术名,基于词语D1与标准手术名A中分词A1相同,可以将分词A1的重要程度作为待编码手术名D与标准手术名A之间的字符相似度,类似地,可以基于词语D1与标准手术名B中分词B1相同,且词语D2与标准手术名B中分词B2相同,可以将分词B1的重要程度和分词B2的重要程度之和,作为待编码手术名D与标准手术名B之间的字符相似度。其他情况可以以此类推,在此不再一一举例。

在另一个实施场景中,还可以通过编辑距离来获取待编码手术名与各个标准手术名之间的字符相似度。为了与上述通过TF-IDF而得到的字符相似度进行区分,可以将通过编辑距离获取到的字符相似度称之为第一字符相似度,并将通过TF-IDF获取到的字符相似度称之为第二字符相似度。需要说明的是,待编码手术名经过若干次编辑操作(如,删除、替换、插入等)之后与标准手术名相同,则执行编辑操作的次数可以作为待编码手术名与标准手术名之间的编辑距离。编辑距离越小,表示待编码手术名与标准手术名之间的第一字符相似度越高,反之,编辑距离越大,表示待编码手术名与标准手术名之间的第一字符相似度越低。

在又一个实施场景中,第二相似度还可以进一步包括语义相似度,语义相似度具体表示待编码手术名与各个标准手术名在语义层面的相似度。在获取到各个标准手术名的第一语义表示的基础上,可以进一步获取待编码手术名的第三语义表示,从而利用待编码手术名的第三语义表示和各个标准手术名的第一语义表示,可以得到待编码手术名分别与各个标准手术名之间的语义相似度。具体地,可以将待编码手术名进行分词,得到待编码手术名中若干分词,并将上述若干分词进行向量映射,得到待编码手术名的第三语义表示。

在一个具体的实施场景中,如前述公开实施例所述,可以采用诸如结巴分词等NER工具对待编码手术名进行分词。具体的NER工具除上述结巴分词外,还可以包括但不限于:HanLP等等,在此不做限定。

在另一个具体的实施场景中,如前述公开实施例所述,可以通过word2vec等词向量工具对分词进行向量映射,得到分词的向量表示。具体的词向量工具除上述word2vec外,还可以包括但不限于:glove等等,在此不做限定。

在又一个具体的实施场景中,如前述公开实施例所述,通过向量映射,可以得到预设维度(如,128维)的向量表示。在此基础上,可以将待编码手术名中分词的向量表示相加,得到待编码手术名的第三语义表示。

在又一个具体的实施场景中,具体可以计算待编码手术名的第三语义表示和各个标准手术名的第一语义表示之间的余弦相似度,得到待编码手术名分别与各个标准手术名之间的语义相似度。

步骤S74:基于第二相似度,选取若干标准手术名,作为第一候选手术名。

如前所述,第二相似度包括字符相似度和语义相似度,在此基础上,可以按照字符相似度由高到低的顺序,选取第四数值个标准手术名,作为第一候选手术名,并按照语义相似度由高到低的顺序,选取第五数值个标准手术名,作为第一候选手术名,且第四数值个标准手术名与第五数值个标准手术名不重复。上述方式,按照字符相似度由高到低的顺序,选取第一数值个标准手术名,作为第一候选手术名,并按照语义相似度由高到低的顺序,选取第二数值个标准手术名,作为第一候选手术名,且第一数值个标准手术名与第二数值个标准手术名不重复,能够通过字符相似度和语义相似度来选取第一候选手术名,从而能够有利于提高第一候选手术名的精确度,进而能够有利于提高后续手术编码的准确性。

在一个实施场景中,具体可以先按照字符相似度由高到低的顺序,选取第一数值个标准手术名,作为第一候选手术名,再按照语义相似度由高到低的顺序,选取第二数值个标准手术名,作为第一候选手术名,且第一数值可以大于第二数值。例如,第一数值可以为30,第二数值可以为20,在此不做限定。上述方式,先按照字符相似度由高到低的顺序,选取第一数值个标准手术名,再按照语义相似度由高到低的顺序,选取第二数值个标准手术名,得到第一候选手术名,由于按照字符级相似度选取第一候选手术名的精确性相对较高,故能够有利于进一步提高第一候选手术名的精确度。

在另一个实施场景中,在按照字符相似度由高到低的顺序,选取第一数值个标准手术名的过程中,具体可以先按照第二字符相似度由高到底的顺序,选取若干个标准手术名,再按照第一字符相似度由高到低的顺序,选取若干个不重复的标准手术名,且上述两次所选取得到的标准手术名的总数为第一数值。上述方式,先按照第二字符相似度由高到底的顺序,选取若干个标准手术名,再按照第一字符相似度由高到低的顺序,选取若干个不重复的标准手术名,得到第一数值个第一候选手术名,由于按照第二字符相似度选取候选手术名的精确性相对较高,故能够有利于进一步提高第一候选手术名的精确度。

请继续结合参阅图2,经过上述处理,即可完成“粗选”处理,并“粗选”得到若干第一候选手术名。在此基础上,可以进一步进行“细选”处理,并通过“细选”最终得到待编码手术名的手术编码。“细选”处理具体可以参阅如下描述:

步骤S75:基于第二语义表示分别与第一候选手术名的第二语义表示之间的第一相似度,得到待编码手术名的手术编码。

具体地,可以按照第一相似度由高到低的顺序,选取若干第一候选手术名,作为第二候选手术名,并获取第二候选手术名中与关键词语匹配的目标词语,并基于目标词语的词语类别,得到第二候选手术名的命中合理度,从而利用命中合理度和第一相似度,选择一个第二候选手术名,并将选择的第二候选手术名的手术编码,作为待编码手术名的手术编码。具体可以参阅前述公开实施例,在此不再赘述。

区别于前述实施例,在获取第一相似度之前,先获取待编码手术名与各个标准手术名之间的第二相似度,并基于第二相似度,选取若干标准手术名,作为第一候选手术名,在此基础上,再基于第二语义表示分别与第一候选手术名的第二语义表示之间的第一相似度,得到待编码手术名的手术编码,能够缩小第一候选手术名的范围,从而能够有利于降低手术编码的复杂度。

请参阅图8,图8是手术编码模型的训练方法一实施例的流程示意图。本公开实施例中,待编码手术名的第二语义表示是利用手术编码模型提取得到的。此外,手术编码模型可以包括图神经网络,关于图神经网络具体可以参阅前述公开实施例相关描述,在此不再赘述。本公开实施例具体可以包括如下步骤:

步骤S81:获取标注有实际标准手术名的样本待编码手术名,并获取若干个标准手术名。

本公开实施例中,实际标准手术名是指:样本待编码手术名实际对应的标准手术名。此外,如前所述公开实施例所述,标准手术名可以对应有手术编码。

关于样本待编码手术名以及标准手术名,具体可以参阅前述公开实施例中相关描述,在此不再赘述。

此外,如前述公开实施例所述,在提取第二样本语义表示之前,还可以对样本待编码手术名进行预处理。具体地,预处理的操作可以包括以下至少一者:将样本待编码手术名中的英文缩写还原为英文缩写的中文全称,以更新样本待编码手术名;将样本待编码手术名中的关键词语替换为关键词语的标准词语,以更新样本待编码手术名。具体可以参阅前述公开实施例中相关描述,在此不再赘述。在此基础上,可以将更新前的样本待编码手术名和更新后的样本待编码手术名的组合,作为新的样本待编码手术名,并利用新的样本待编码手术名进行后续的语义提取等步骤。

步骤S82:提取标准手术名的第一样本语义表示,并利用手术编码模型提取样本待编码手术名的第二样本语义表示。

本公开实施例中,第二样本语义表示包括:样本待编码手术名内文字、分词中至少一者的语义信息,样本待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息。

具体可以参阅前述公开实施例中相关描述,在此不再赘述。

步骤S83:基于第二样本语义表示分别与若干标准手术名的第一样本语义表示之间的第一相似度,得到待编码手术名的预测标准手术名。

本公开实施例中,预测标准手术名指的是:基于第一相似度所预测得到的样本待编码手术名所对应的标准手术名。

具体可以参阅前述公开实施例中相关描述,在此不再赘述。

步骤S84:利用实际标准手术名与预测标准手术名之间的差异,调整手术编码模型的网络参数。

具体地,可以利用softmax将上述第一相似度进行归一化,并利用交叉熵损失函数处理归一化后的第一相似度与实际标准手术名的one-hot标签向量,得到手术编码模型的损失值。

此外,具体可以采用随机梯度下降(Stochastic Gradient Descent,SGD)、批量梯度下降(Batch Gradient Descent,BGD)、小批量梯度下降(Mini-Batch GradientDescent,MBGD)等方式,利用损失值对手术编码模型的网络参数进行调整,其中,批量梯度下降是指在每一次迭代时,使用所有样本来进行参数更新;随机梯度下降是指在每一次迭代时,使用一个样本来进行参数更新;小批量梯度下降是指在每一次迭代时,使用一批样本来进行参数更新,在此不再赘述。

需要说明的是,上述one-hot标签向量中实际标准手术名所在位置元素值为1,其他标准手术名所在位置元素值为0。此外,上述归一化后的第一相似度是按照由高到低排序的,在此基础上,在上述预测标准手术名中不包含实际标准手术名的情况下,可以将实际标准手术名的one-hot标签向量中最后一个元素值设置为1。

区别于前述实施例,通过获取样本待编码手术名,并获取若干个对应有手术编码的标准手术名,从而提取标准手术名的第一样本语义表示,并利用手术编码模型提取样本待编码手术名的第二样本语义表示,且第二样本语义表示包括:样本待编码手术名内文字、分词中至少一者的语义信息,样本待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息,进而基于第二样本语义表示分别与若干标准手术名的第一样本语义表示之间的第一相似度,预测得到待编码手术名对应的标准手术名,并利用实际标准手术名与预测标准手术名之间的差异,调整手术编码模型的网络参数,由于在第二样本语义表示融入了样本待编码手术名内文字、分词中至少一者的语义信息、样本待编码手术名中与手术相关的关键词语的语义信息、关键词语的词语类别的语义信息等多种不同粒度的信息,故能够充分挖掘样本待编码手术名中的丰富信息,从而能够提高第二样本语义表示的准确性,进而能够有利于提高手术编码的准确性,且由于通过手术编码模型即可实现手术编码,故还能够提高手术编码的效率。

请参阅图9,图9是本申请电子设备90一实施例的框架示意图。电子设备90包括相互耦接的存储器91和处理器92,存储器91中存储有程序指令,处理器92用于执行程序指令以实现上述任一手术编码方法实施例中的步骤,或实现上述任一手术编码模型的训练方法实施例中的步骤。具体地,电子设备90可以包括但不限于:台式计算机、笔记本电脑、平板电脑、服务器、手机等等,在此不做限定。

具体而言,处理器92用于控制其自身以及存储器91以实现上述任一手术编码方法实施例中的步骤,或实现上述任一手术编码模型的训练方法实施例中的步骤。处理器92还可以称为CPU(Central Processing Unit,中央处理单元)。处理器92可能是一种集成电路芯片,具有信号的处理能力。处理器92还可以是通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器92可以由集成电路芯片共同实现。

本公开实施例中,处理器92用于获取待编码手术名,并获取若干个对应有手术编码的标准手术名;处理器92用于提取标准手术名的第一语义表示,并提取待编码手术名的第二语义表示;其中,第二语义表示包括:待编码手术名内文字、分词中至少一者的语义信息,待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息;处理器92用于基于第二语义表示分别与若干标准手术名的第一语义表示之间的第一相似度,得到待编码手术名的手术编码。

上述方案,通过获取待编码手术名,并获取若干个对应有手术编码的标准手术名,从而提取标准手术名的第一语义表示,并提取待编码手术名的第二语义表示,且第二语义表示包括:待编码手术名内文字、分词中至少一者的语义信息,待编码手术名中与手术相关的关键词语的语义信息和关键词语的词语类别的语义信息,进而基于第二语义表示分别与若干标准手术名的第一语义表示之间的第一相似度,得到待编码手术名的手术编码,由于在第二语义表示融入了待编码手术名内文字、分词中至少一者的语义信息、待编码手术名中与手术相关的关键词语的语义信息、关键词语的词语类别的语义信息等多种不同粒度的信息,故能够充分挖掘待编码手术名中的丰富信息,从而能够提高第二语义表示的准确性,进而能够有利于提高手术编码的准确性,且由于无需人工即可对待编码手术名进行编码,故还能够提高手术编码的效率。

在一些公开实施例中,处理器92用于将待编码手术名内文字、分词中至少一者、关键词语以及关键词语的词语类别,分别作为节点;处理器92用于利用节点之间的节点关系,提取节点的节点语义表示;处理器92用于将各个节点的节点语义表示进行融合,得到第二语义表示。

区别于前述实施例,通过将待编码手术名内文字、分词中至少一者、关键词语以及关键词语的词语类别,分别作为节点,从而利用节点之间的节点关系,提取节点的节点语义表示,进而将各个节点的节点语义表示进行融合,得到第二语义表示,能够有利于通过节点之间的节点关系,聚合节点本身语义信息和其邻居节点的语义信息,有利于提高节点语义表示的准确性,继而能够有利于提高第二语义表示的准确性。

在一些公开实施例中,处理器92用于利用节点以及节点之间的节点关系,构建节点关系图;其中,节点关系图中,存在节点关系的节点之间具有预设权值的连接边;处理器92用于将节点关系图输入图神经网络,得到各个节点语义表示。

区别于前述实施例,通过利用节点以及节点之间的节点关系,构建节点关系图,且节点关系图中,存在节点关系的节点之间具有预设权值的连接边,从而将节点关系图输入图神经网络,得到各个节点语义表示,进而对于每一节点,能够通过图神经网络聚合其本身的语义信息以及与其存在连接边的节点的语义信息,故能够使得每一节点的节点语义表示均能够包含多种粒度的语义信息,有利于提高节点语义表示的准确性。

在一些公开实施例中,图神经网络包括:门控图神经网络;和/或,节点关系包括以下至少一种:相邻关系、包含关系、从属关系。

区别于前述实施例,通过将图神经网络设置为包括门控图神经网络,能够在聚合过程中,学习到不同邻居节点对于本节点的重要程序,以差别性地聚合邻居节点的语义信息;而通过将节点关系设置为包括以下至少一种:相邻关系、包含关系、从属关系,能够有利于提高信息聚合的准确性,从而能够有利于提高第二语义表示的准确性。

在一些公开实施例中,处理器92用于将各个节点的节点语义表示进行最大池化处理,得到第一融合语义表示;以及,处理器92用于将各个节点的节点语义表示进行平均池化处理,得到第二融合语义表示;处理器92用于利用第一融合语义表示和第二融合语义表示,得到第二语义表示。

区别于前述实施例,通过将各个节点的节点语义表示进行最大池化处理,得到第一融合语义表示,并将各个节点的节点语义表示进行平均池化处理。得到第二融合语义表示,从而利用第一融合语义表示和第二融合语义表示,得到第二语义表示,进而能够有利于提高第二语义表示的准确性。

在一些公开实施例中,处理器92用于获取待编码手术名与各个标准手术名之间的第二相似度;处理器92用于基于第二相似度,选取若干标准手术名,作为第一候选手术名;处理器92用于基于第二语义表示分别与第一候选手术名的第二语义表示之间的第一相似度,得到待编码手术名的手术编码。

区别于前述实施例,在获取第一相似度之前,先获取待编码手术名与各个标准手术名之间的第二相似度,并基于第二相似度,选取若干标准手术名,作为第一候选手术名,在此基础上,再基于第二语义表示分别与第一候选手术名的第二语义表示之间的第一相似度,得到待编码手术名的手术编码,能够缩小第一候选手术名的范围,从而能够有利于降低手术编码的复杂度。

在一些公开实施例中,第二相似度包括字符相似度,处理器92用于针对每一标准手术名,获取标准手术名中各个词语对标准手术名的重要程度;处理器92用于分别将每一标准手术名,作为当前手术名;处理器92用于基于当前手术名中与分词相同的词语的重要程度,得到当前手术名与待编码手术名之间的字符相似度。

区别于前述实施例,通过将第二相似度设置为包括字符相似度,并针对每一标准手术名,获取标准手术名中各个词语对标准手术名的重要程度,从而分别将每一标准手术名,作为当前手术名,进而基于当前手术名中与分词相同的词语的重要程度,得到当前手术名与待编码手术名之间的字符相似度,故此能够有利于提高字符相似度的准确性。

在一些公开实施例中,第二相似度包括字符相似度和语义相似度,处理器92用于按照字符相似度由高到低的顺序,选取第一数值个标准手术名,作为第一候选手术名;处理器92用于按照语义相似度由高到低的顺序,选取第二数值个标准手术名,作为第一候选手术名;其中,第一数值个标准手术名与第二数值个标准手术名不重复。

区别于前述实施例,按照字符相似度由高到低的顺序,选取第一数值个标准手术名,作为第一候选手术名,并按照语义相似度由高到低的顺序,选取第二数值个标准手术名,作为第一候选手术名,且第一数值个标准手术名与第二数值个标准手术名不重复,能够通过字符相似度和语义相似度来选取第一候选手术名,从而能够有利于提高第一候选手术名的精确度,进而能够有利于提高后续手术编码的准确性。

在一些公开实施例中,处理器92用于按照第一相似度由高到低的顺序,选取若干标准手术名,作为第二候选手术名;处理器92用于获取第二候选手术名中与关键词语匹配的目标词语,并基于目标词语的词语类别,得到第二候选手术名的命中合理度;处理器92用于利用命中合理度和第一相似度,选择一个第二候选手术名,并将选择的第二候选手术名的手术编码,作为待编码手术名的手术编码。

区别于前述实施例,通过按照第一相似度由高到低的顺序,选取若干标准手术名,作为候选手术名,从而获取候选手术名中与关键词语匹配的目标词语,并基于目标词语的词语类别,得到候选手术名的命中合理度,进而利用命中合理度和第一相似度,选择一个候选手术名,并将选择的候选手术名的手术编码,作为待编码手术名的手术编码,故此能够在手术编码过程中,不仅考虑语义相似度,还能够进一步关注候选手术名的合理性,能够有利于提高手术编码的准确性。

在一些公开实施例中,处理器92用于在目标词语的词语类别包括术式和部位的情况下,将第二候选手术名的命中合理度设置为第三数值;处理器92用于在目标词语的词语类别包括术式的情况下,将第二候选手术名的命中合理度设置为第四数值;处理器92用于在目标词语的词语类别包括部位的情况下,将第二候选手术名的命中合理度设置为第五数值;其中,第三数值大于第四数值,且第四数值大于第五数值。

区别于前述实施例,通过在目标词语的词语类别包括术式和部位的情况下,将第二候选手术名的命中合理度设置为第三数值,在目标词语的词语类别包括术式的情况下,将第二候选手术名的命中合理度设置为第四数值,在目标词语的词语类别包括部位的情况下,将第二候选手术名的命中合理度设置为第五数值,且第三数值大于第四数值,第四数值大于第五数值,从而能够按照术式和部位均匹配、仅术式匹配、仅部位匹配的优先级顺序关注候选手术名,进而能够在手术编码过程中,不仅考虑语义相似度,还能够进一步关注候选手术名的合理性。

在一些公开实施例中,处理器92用于在命中合理度最高的若干第二候选手术名中,选择第一相似度最高的第二候选手术名。

区别于前述实施例,通过在命中合理度最高的若干第二候选手术名中,选择第一相似度最高的第二候选手术名,够在手术编码过程中,优先关注候选手术名的合理性,再考虑语义相似度,从而能够有利于在确保候选手术名的合理性的前提下,提高手术编码的准确性。

在一些公开实施例中,处理器92用于执行以下任一者:将待编码手术名中的英文缩写还原为英文缩写的中文全称,以更新待编码手术名;将待编码手术名中的关键词语替换为关键词语的标准词语,以更新待编码手术名。

区别于前述实施例,通过将待编码手术名中的英文缩写还原为英文缩写的中文全称,以更新待编码手术名,能够有利于提高后续手术编码的准确性;而通过将待编码手术名中的关键词语替换为关键词语的标准词语,以更新待编码手术名,能够有利于提高后续手术编码的准确性。

在一些公开实施例中,词语类别包括以下至少一者:术式、部位、入路、辅助医技、疾病性质;和/或,第一相似度为第一语义表示和第二语义表示之间的余弦相似度。

请参阅图10,图10是本申请存储装置100一实施例的框架示意图。存储装置100存储有能够被处理器运行的程序指令101,程序指令101用于实现上述任一手术编码方法实施例中的步骤,或实现上述任一手术编码模型的训练方法实施例中的步骤。

上述方案,由于在第二语义表示融入了待编码手术名内文字、分词中至少一者的语义信息、待编码手术名中与手术相关的关键词语的语义信息、关键词语的词语类别的语义信息等多种不同粒度的信息,故能够充分挖掘待编码手术名中的丰富信息,从而能够提高第二语义表示的准确性,进而能够有利于提高手术编码的准确性,且由于无需人工即可对待编码手术名进行编码,故还能够提高手术编码的效率。

在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

27页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于字符嵌入的汉字编码方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!