疾病分类编码识别方法、装置及存储介质

文档序号:1271767 发布日期:2020-08-25 浏览:16次 >En<

阅读说明:本技术 疾病分类编码识别方法、装置及存储介质 (Disease classification code recognition method, device and storage medium ) 是由 陈逸龙 于 2020-04-13 设计创作,主要内容包括:本发明各实施例公开了一种疾病分类编码识别方法、装置、计算机设备及存储介质,其中,所述疾病分类编码识别方法包括:获取诊断数据;将所述诊断数据作为源语言输入机器翻译模型,所述机器翻译模型包括编码网络和解码网络;通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征;将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,所述目标语言为所述诊断数据匹配的疾病分类编码。采用本发明所提供的疾病分类编码识别方法、装置、计算机设备及存储介质解决了现有技术中疾病分类编码识别的准确率不高的问题。(The embodiments of the invention disclose a disease classification code recognition method, a device, a computer device and a storage medium, wherein the disease classification code recognition method comprises the following steps: acquiring diagnostic data; inputting the diagnostic data as a source language into a machine translation model, the machine translation model comprising an encoding network and a decoding network; extracting the features of the source language through the coding network to obtain the features of the source language; inputting the features of the source language into the decoding network for decoding, so that the source language is translated into a target language, and the target language is a disease classification code matched with the diagnosis data. The disease classification code identification method, the device, the computer equipment and the storage medium provided by the invention solve the problem of low accuracy of disease classification code identification in the prior art.)

疾病分类编码识别方法、装置及存储介质

技术领域

本发明涉及计算机技术领域,尤其涉及一种疾病分类编码识别方法、装置及存储介质。

背景技术

随着医学技术的发展,国际疾病分类(ICD, International Classification ofDiseases)编码已被广泛地应用于描述病人病情,例如病因、损伤、死因等等。因此,如何快速地将医生关于病人病情描述的非标准化的数据转化为标准化的疾病分类编码便具有重要意义。

通常,上述非标准化至标准化的转化过程,是由医院专门的编码员为医生给出的关于病人病情描述的数据赋予疾病分类编码。这就要求编码员需要掌握许多特殊技能,例如医学知识、编码规则、医学术语等等,进而导致依赖于人工实现的疾病分类编码识别不仅人力成本非常昂贵,而且效率过于低下。

为此,基于计算机设备的疾病分类编码识别应运而生,然而,无论是基于字典检索技术的疾病分类编码识别,或者基于分类学习的疾病分类编码识别,虽然在一定程度上缓解了人工实现的困境,但不可避免地存在因数据稀疏,而难以保证疾病分类编码识别的准确率。

由上可知,现有的疾病分类编码识别尚存在准确率不高的缺陷。

发明内容

本发明各实施例提供一种疾病分类编码识别方法、装置、计算机设备及存储介质,以解决相关技术中存在的疾病分类编码识别的准确率不高的问题。

其中,本发明所采用的技术方案为:

根据本发明实施例的一个方面,一种疾病分类编码识别方法,包括:获取诊断数据;将所述诊断数据作为源语言输入机器翻译模型,所述机器翻译模型包括编码网络和解码网络;通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征;将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,所述目标语言为所述诊断数据匹配的疾病分类编码。

根据本发明实施例的一个方面,一种疾病分类编码识别装置,包括:数据获取模块,用于获取诊断数据;数据输入模块,用于将所述诊断数据作为源语言输入机器翻译模型,所述机器翻译模型包括编码网络和解码网络;编码模块,用于通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征;解码模块,用于将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,所述目标语言为所述诊断数据匹配的疾病分类编码。

在一个实施例中,所述编码网络包括第一嵌入层和若干个编码子层;所述编码模块,包括:编码映射单元,用于在所述第一嵌入层中,将所述源语言中的分词映射为待编码向量;特征提取单元,用于通过若干个所述编码子层对所述待编码向量进行特征提取,得到所述源语言的特征。

在一个实施例中,所述编码子层包括第一多头注意力层、第一全连接层和第一残差连接层;所述特征提取单元,包括:第一输入子单元,用于针对每一个编码子层,接收该编码子层的输入向量作为所述第一多头注意力层的输入向量,由所述第一多头注意力层的输入端输入;所述待编码向量作为第一个编码子层的输入向量;第一融合子单元,用于通过连接于所述第一多头注意力层的第一残差连接层,使得所述第一多头注意力层的输入向量与输出向量融合,并传输至所述第一全连接层;第二融合子单元,用于通过连接于所述第一全连接层的第一残差连接层,使得所述第一全连接层的输入向量与输出向量融合,得到该编码子层的输出向量;该编码子层的输出向量作为后一个编码子层的输入向量;第一输出子单元,用于将最后一个编码子层的输出向量作为所述源语言的特征。

在一个实施例中,所述第一多头注意力层的输入端包括Q1输入端、K1输入端和V1输入端;所述第一输入子单元,包括:第一向量输入子单元,用于在所述编码子层中,将所述编码子层的输入向量通过Q1输入端、K1输入端和V1输入端输入所述第一多头注意力层,分别作为所述第一多头注意力层的Q端输入向量、K端输入向量和V端输入向量。

在一个实施例中,所述解码网络包括第二嵌入层和若干个解码子层;所述解码模块,包括:解码映射单元,用于将所述源语言的特征输入所述第二嵌入层进行映射,得到待解码向量;特征解码单元,用于通过若干个所述解码子层进行所述待解码向量的解码,得到所述目标语言。

在一个实施例中,所述解码子层包括第二多头注意力层、第三多头注意力层、第二全连接层、第二残差连接层和第三残差连接层;所述特征解码单元,包括:第二输入子单元,用于针对每一个解码子层,接收该解码子层的输入向量作为所述第二多头注意力层的输入向量,由所述第二多头注意力层的输入端输入;所述待解码向量作为第一个解码子层的输入向量;第三融合子单元,用于通过连接于所述第二多头注意力层的第二残差连接层,使得所述第二多头注意力层的输入向量与输出向量融合,并传输至所述第三多头注意力层;第四融合子单元,用于通过所述第三残差连接层,将对应于该解码子层的编码子层的输出向量作为所述第三多头注意力层的输入向量,由所述第三多头注意力层的输入端输入,以及,通过连接于所述第三多头注意力层的第二残差连接层,使得所述第三多头注意力层的输入向量与输出向量融合,并传输至所述第二全连接层;第五融合子单元,用于通过连接于所述第二全连接层的第二残差连接层,使得所述第二全连接层的输入向量与输出向量融合,得到该解码子层的输出向量;该解码子层的输出向量作为后一个解码子层的输入向量;第二输入单元,用于由最后一个解码子层的输出向量得到所述目标语言。

在一个实施例中,所述第二多头注意力层的输入端包括Q2输入端、K2输入端和V2输入端;所述第二输入单元,包括:第二向量输入子单元,用于在所述解码子层中,将所述解码子层的输入向量通过Q2输入端、K2输入端和V2输入端输入所述第二多头注意力层,分别作为所述第二多头注意力层的Q端输入向量、K端输入向量和V端输入向量。

在一个实施例中,所述第三多头注意力层的输入端包括Q3输入端、K3输入端和V3输入端;所述第三融合单元,包括:第三向量输入子单元,用于在所述第三多头注意力层中,将对应于该解码子层的编码子层的输出向量通过K3输入端和V3输入端输入所述第三多头注意力层,分别作为所述第三多头注意力层的K端输入向量和V端输入向量;以及,第四向量输入子单元,用于将所述第二多头注意力层的输入向量与输出向量融合的结果通过Q3输入端输入所述第三多头注意力层,作为所述第三多头注意力层的Q端输入向量;所述第三融合单元,还包括:向量融合子单元,用于通过连接于所述第三多头注意力层的第二残差连接层,使得所述第三多头注意力层的Q端输入向量与输出向量融合。

根据本发明实施例的一个方面,一种计算机设备,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的疾病分类编码识别方法。

根据本发明实施例的一个方面,一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的疾病分类编码识别方法。

在上述技术方案中,利用机器翻译模型,对作为源语言的诊断数据进行翻译,得到目标语言,以作为该诊断数据匹配的疾病分类编码。

具体而言,获取诊断数据,以将该诊断数据作为源语言输入机器翻译模型,通过机器翻译模型中的编码网络进行源语言的特征提取,得到源语言的特征,进而将源语言的特征输入机器翻译模型中的解码网络进行解码,得到目标语言,作为诊断数据匹配的疾病分类编码,由此,实现了源语言到目标语言的翻译,既不涉及字典检索技术,也不涉及分类学习,故而无需考虑数据稀疏问题,从而能够保证疾病分类编码识别的准确率,以此有效地解决了现有技术中存在的疾病分类编码识别的准确率不高的问题。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。

图1是根据本发明所涉及的实施环境的示意图。

图2是根据一示例性实施例示出的一种计算机设备的硬件结构图。

图3是根据一示例性实施例示出的一种疾病分类编码识别方法的流程图。

图4是图3对应实施例所涉及的机器翻译模型的结构示意图。

图5是根据一示例性实施例示出的编码网络的结构示意图。

图6是图3对应实施例中步骤350在一个实施例的流程图。

图7是图5对应实施例所涉及的第一多头注意力层的结构示意图。

图8是根据一示例性实施例示出的解码网络的结构示意图。

图9是图3对应实施例中步骤370在一个实施例的流程图。

图10是图8对应实施例所涉及的第二多头注意力层和第三多头注意力层的结构示意图。

图11是根据一示例性实施例示出的一种疾病分类编码识别装置的框图。

图12是根据一示例性实施例示出的一种计算机设备的框图。

图13是根据一示例性实施例示出的一种存储介质的框图。

通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。

具体实施方式

这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1为一种疾病分类编码识别方法所涉及的实施环境的示意图。该实施环境包括用户端110和服务端130。

具体地,用户端110,用于提供医生关于病人病情描述的非标准化的数据,即诊断数据。该用户端110可以是台式电脑、笔记本电脑、平板电脑、智能手机、掌上电脑、便携移动终端等等具有通信功能的电子设备,在此不构成具体限定。

服务端130,该服务端130可以是台式电脑、笔记本电脑、服务器等等计算机设备,还可以是由多台服务器构成的服务器集群,甚至是由多台服务器构成的云计算中心。其中,服务器是为用户提供后台服务的计算机设备,例如,后台服务包括但不限于疾病分类编码识别服务等等。

服务端130与用户端110之间预先通过有线或者无线等方式建立通信连接,并通过该通信连接实现服务端130与用户端110之间的数据传输。传输的数据包括但不限于:疾病分类编码、诊断数据等等。

通过用户端110与服务端130的交互,用户端110将收集到的诊断数据上传至服务端130,以使服务端130基于该诊断数据提供疾病分类编码识别服务。

对于服务端130而言,在接收到用户端110上传的诊断数据之后,便能够调用疾病分类编码识别服务,获得该诊断数据匹配的疾病分类编码,并返回至用户端110。

基于上述过程,实现高效且准确的疾病分类编码识别。

图2是根据一示例性实施例示出的一种计算机设备的硬件结构框图。该种计算机设备适用于图1所示出实施环境的服务端130。

需要说明的是,该种计算机设备只是一个适配于本发明的示例,不能认为是提供了对本发明的使用范围的任何限制。该种计算机设备也不能解释为需要依赖于或者必须具有图2中示出的示例性的计算机设备200中的一个或者多个组件。

计算机设备200的硬件结构可因配置或者性能的不同而产生较大的差异,如图2所示,计算机设备200包括:电源210、接口230、至少一存储器250、以及至少一中央处理器(CPU, Central Processing Units)270。

具体地,电源210用于为计算机设备200上的各硬件设备提供工作电压。

接口230包括至少一有线或无线网络接口,用于与外部设备交互。例如,进行图1所示出实施环境中用户端110与服务端130之间的交互。

当然,在其余本发明适配的示例中,接口230还可以进一步包括至少一串并转换接口233、至少一输入输出接口235以及至少一USB接口237等,如图2所示,在此并非对此构成具体限定。

存储器250作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统251、应用程序253及数据255等,存储方式可以是短暂存储或者永久存储。

其中,操作系统251用于管理与控制计算机设备200上的各硬件设备以及应用程序253,以实现中央处理器270对存储器250中海量数据255的运算与处理,其可以是WindowsServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTM等。

应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序,其可以包括至少一模块(图2中未示出),每个模块都可以分别包含有对计算机设备200的一系列计算机可读指令。例如,疾病分类编码识别装置可视为部署于计算机设备200的应用程序253。

数据255可以是存储于磁盘中的照片、图片等,还可以是诊断数据、疾病分类编码等等,存储于存储器250中。

中央处理器270可以包括一个或多个以上的处理器,并设置为通过至少一通信总线与存储器250通信,以读取存储器250中存储的计算机可读指令,进而实现对存储器250中海量数据255的运算与处理。例如,通过中央处理器270读取存储器250中存储的一系列计算机可读指令的形式来完成疾病分类编码识别方法。

此外,通过硬件电路或者硬件电路结合软件也能同样实现本发明,因此,实现本发明并不限于任何特定硬件电路、软件以及两者的组合。

请参阅图3,在一示例性实施例中,一种疾病分类编码识别方法适用于计算机设备,例如,图1所示实施环境的服务端130,该计算机设备的结构可以如图2所示。

该种疾病分类编码识别方法可以由计算机设备执行,也可以理解为由计算机设备中运行的应用程序(例如疾病分类编码识别装置)执行。在下述方法实施例中,为了便于描述,以各步骤的执行主体为计算机设备加以说明,但是并不对此构成限定。

该种疾病分类编码识别方法可以包括以下步骤:

步骤310,获取诊断数据。

其中,诊断数据,指的是医生关于病人病情描述的非标准化的数据。

关于诊断数据的来源,回请参阅图1,可以是用户端实时收集到的诊断数据,也可以是用户端中存储的一历史时间段内收集到的诊断数据。换而言之,对于服务端而言,诊断数据的获取,既可以是接收用户端实时收集并主动上报的诊断数据,还可以是服务端主动读取用户端中存储的诊断数据,亦即是主动读取一历史时间段内用户端收集到的诊断数据,此处并未加以限定。

相应地,在获取到诊断数据之后,计算机设备可以对诊断数据进行实时处理,也可以存储了再处理。例如,在计算机设备内存占用率较低的时候处理,或者,按照编码员的指示进行处理,以此有利于提升疾病分类编码识别的识别效率。

步骤330,将所述诊断数据作为源语言输入机器翻译模型。

首先说明的是,机器翻译模型,实质是在源语言与目标语言之间建立了数学映射关系,由此,当作为源语言的诊断数据输入机器翻译模型,便可基于该数学映射关系,将源语言翻译为目标语言,即视为该诊断数据匹配的疾病分类编码。

在此,机器翻译模型,是通过多个训练样本对基础模型加以训练生成的。其中,基础模型包括但不限于:神经网络模型等等。

关于训练样本,实质是通过匹配校正使得诊断数据与疾病分类编码相匹配而生成的。换而言之,训练样本,指的是携带ICD-10标签的诊断数据,该ICD-10标签用于指示该诊断数据匹配的疾病分类编码。

举例来说,诊断数据为右肺气肿(并肺大泡形成),通过匹配校正,与该诊断数据匹配的ICD-10标签为J43.901,J43.900,那么,训练样本可以表示为:右肺气肿(并肺大泡形成)——J43.901,J43.900。

关于训练,则是通过多个训练样本,对基础模型的参数进行优化,使得特定函数收敛,进而使得源语言与目标语言之间的数学映射关系达到最优,则由基础模型收敛得到机器翻译模型。其中,特定函数包括但不限于:最大似然函数、激活损失函数、期望函数等等。

下面以激活损失函数作为特定函数,举例说明机器翻译模型的训练过程。

具体地,对基础模型的参数进行随机初始化,并基于随机初始化的参数和其中一个训练样本,计算已构建的激活损失函数的损失值。其中,该激活损失函数的构建与随机初始化的参数有关。

如果该激活损失函数的损失值达到最小,则该激活损失函数视为收敛,此时,由基础模型收敛得到机器翻译模型。也即是,机器翻译模型相当于携带随机初始化的参数的基础模型。

反之,如果该激活损失函数的损失值未达到最小,则更新基础模型的参数,并基于更新的参数和后一个训练样本,再次计算重新构建的激活损失函数的损失值。其中,该激活损失函数的重新构建与更新的参数有关。

如此循环优化,直至该激活损失函数的损失值达到最小,由基础模型收敛得到机器翻译模型。也即是,机器翻译模型相当于携带更新的参数的基础模型。

当然,考虑训练效率,还可以设置迭代次数,该迭代次数可以根据应用场景的实际需要灵活地调整,例如,对疾病分类编码识别的准确率要求较高的应用场景,设置较大的迭代次数。

此时,如果迭代次数达到最大,即使激活损失函数的损失值尚未达到最小,也停止训练,视为该激活损失函数已收敛,由基础模型收敛得到机器翻译模型。

由此,当训练完成,机器翻译模型便具备了翻译能力,方能够实现源语言至目标语言的翻译,进而实现疾病分类编码识别。

其次,机器翻译模型的结构属于encoder-decoder型,也可以理解为,所述机器翻译模型包括编码网络和解码网络。

在一个实施例中,编码网络和解码网络采用rnn-rnn结构。

具体而言,如图4(a)所示,编码网络包括嵌入层、双向长短期记忆层(BLSTM, Bi-Long Short Term Memory)和自注意力层(Self-Attention)。其中,嵌入层采用字符级别的embedding,以此克服医学领域中诊断数据涉及大量医学术语导致分词处理不够精准的问题。双向长短期记忆层,由于具备出色的序列建模能力,不仅有利于以诊断数据为源语言的特征提取,而且能够很好地避免因梯度消失而导致模型训练不足的问题。自注意力层,进一步地考虑源语言中各分词的上下文语义关系以及各分词在源语言中的位置关系,从而能够更加有效地提升特征对源语言的表示效果。

解码网络,则用于将源语言的特征解码为目标语言,亦即是诊断数据匹配的疾病分类编码。其中,为了保证解码器能够更加准确地区分不同源语言的特征所解码得到的目标语言的不同,解码器采用单向长短期记忆层(LSTM, Long Short Term Memory)实现。

在另一个实施例中,编码网络和解码网络采用transformer-transformer结构。

具体而言,如图4(b)所示,所述编码网络包括第一嵌入层和若干个编码子层。其中,第一嵌入层,采用字符级别的embedding,用于抽取源语言中各分词的上下文语义特征word embedding以及位置特征position embedding,以便于计算机设备能够识别自然语言形式表达的源语言。通过若干个编码子层提取得到源语言的特征,来唯一且准确地表示源语言,以此充分地保障疾病分类编码识别的准确率。

所述解码网络包括第二嵌入层和若干个解码子层。其中,第二嵌入层,仍然采用字符级别的embedding,实质是进一步地抽取源语言中各分词的上下文语义特征wordembedding以及位置特征position embedding,使得计算机设备能够更好地识别自然语言形式表达的源语言。通过若干个解码子层进行的解码,最终使得源语言被翻译为目标语言。

步骤350,通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征。

本实施例中,编码网络适用于transformer-transformer结构,如图4(b)所示,即编码网络包括第一嵌入层和若干个编码子层。

具体地,在所述第一嵌入层中,将所述源语言中的分词映射为待编码向量,以使自然语言形式表达的源语言转换为计算机设备能够识别的机器语言。通过若干个所述编码子层对所述待编码向量进行特征提取,得到所述源语言的特征,来唯一且准确地表示源语言。

步骤370,将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,所述目标语言为所述诊断数据匹配的疾病分类编码。

本实施例中,解码网络适用于transformer-transformer结构,如图4(b)所示,即所述解码网络包括第二嵌入层和若干个解码子层。

具体地,将所述源语言的特征输入所述第二嵌入层进行映射,得到待解码向量,以进一步地转换自然语言形式表达的源语言为计算机设备能够识别的机器语言,使得计算机设备能够更好地识别自然语言形式表达的源语言。通过若干个所述解码子层进行所述待解码向量的解码,得到所述目标语言,亦即是,诊断数据匹配的疾病分类编码。

通过如上所述的过程, 实现了基于机器翻译模型的疾病分类编码识别,即将诊断数据作为源语言,该诊断数据匹配的疾病分类编码则作为目标语言,在源语言至目标语言的翻译过程中,既不涉及字典检索技术,也不涉及分类学习,由此避免了因数据稀疏问题而导致疾病分类编码识别的准确率不高的问题,从而有效地提升了疾病分类编码识别的准确率。

请参阅图5,在一示例性实施例中,所述编码子层包括第一多头注意力层、第一全连接层和第一残差连接层。其中,第一多头注意力层用于局部特征的提取,第一全连接层用于全局特征的提取,第一残差连接层用于在编码子层内部进行特征传播。

可选地,编码子层还包括第一标准化层,用于进行层标准化。

下面结合图6以及图5中示出的编码子层的结构,对源语言的特征提取过程进行详细地说明。

如图6所示,步骤350可以包括以下步骤:

步骤351,针对每一个编码子层,接收该编码子层的输入向量作为所述第一多头注意力层的输入向量,由所述第一多头注意力层的输入端输入。

其中,所述待编码向量作为第一个编码子层的输入向量。

步骤353,通过连接于所述第一多头注意力层的第一残差连接层,使得所述第一多头注意力层的输入向量与输出向量融合,并传输至所述第一全连接层。

步骤355,通过连接于所述第一全连接层的第一残差连接层,使得所述第一全连接层的输入向量与输出向量融合,得到该编码子层的输出向量。

其中,该编码子层的输出向量作为后一个编码子层的输入向量。

步骤357,将最后一个编码子层的输出向量作为所述源语言的特征。

具体而言,如图5所示,在每一个编码子层中,经由该编码子层中的第一多头注意力层的输入端输入该编码子层的输入向量,并输出得到该编码子层的局部向量。所述待编码向量作为第一个编码子层的输入向量。

经由该编码子层中连接于该第一多头注意力层的第一残差连接层,将该编码子层的输入向量传输至该编码子层中连接于该第一多头注意力层的第一标准化层,并与该编码子层的局部向量进行特征融合和层标准化,得到该编码子层的中间向量。

将该编码子层的中间向量输入该编码子层中的第一全连接层,经由该第一全连接层输出得到该编码子层的全局向量。

经由该编码子层中连接于该第一全连接层的第一残差连接层,将该编码子层的中间向量传输至该编码子层中连接于该第一全连接层的第一标准化层,并与该编码子层的全局向量进行特征融合和层标准化,得到该编码子层的输出向量。

对编码网络中的各编码子层进行遍历,将相应地获得各编码子层的输出向量,以前一个编码子层的输出向量作为后一个编码子层的输入向量。

直至编码网络中的各编码子层完成遍历,将最后一个编码子层的输出向量作为所述源语言的特征。

上述过程中,基于第一残差连接层实现了编码子层中各层之间的特征传播,避免使用卷积操作,由此可避免特征传播的瓶颈问题。

此外,通过第一标准化层中进行的编码子层中各层之间的特征融合,使得不同分辨率不同尺度的特征能够相互关联,而并非孤立的,有利于进一步地提升疾病分类编码识别的准确率。

进一步地,请参阅图7,在一示例性实施例中,所述第一多头注意力层的输入端包括Q1输入端、K1输入端和V1输入端。

在所述编码子层中,将所述编码子层的输入向量通过Q1输入端、K1输入端和V1输入端输入所述第一多头注意力层,分别作为所述第一多头注意力层的Q端输入向量、K端输入向量和V端输入向量。

应当说明的是,Q表示query,K表示keys,V表示values,使得第一多头注意力层得以关注源语言中各分词的上下文语义关系以及各分词在源语言中的位置关系,以此进一步地保证疾病分类编码识别的准确率。

请参阅图8,在一示例性实施例中,所述解码子层包括第二多头注意力层、第三多头注意力层、第二全连接层、第二残差连接层和第三残差连接层。其中,第二多头注意力层、第三多头注意力层均用于局部特征的提取,第二全连接层用于全局特征的提取,第二残差连接层用于在解码子层内部进行特征传播,第三残差连接层用于在解码子层及其对应的编码子层之间进行特征传播。

可选地,解码子层还包括第二标准化层,用于进行层标准化。

下面结合图9以及图8中示出的解码子层的结构,对源语言的特征解码过程进行详细地说明。

如图9所示,步骤370可以包括以下步骤:

步骤371,针对每一个解码子层,接收该解码子层的输入向量作为所述第二多头注意力层的输入向量,由所述第二多头注意力层的输入端输入。

其中,所述待解码向量作为第一个解码子层的输入向量。

步骤373,通过连接于所述第二多头注意力层的第二残差连接层,使得所述第二多头注意力层的输入向量与输出向量融合,并传输至所述第三多头注意力层。

步骤375,通过所述第三残差连接层,将对应于该解码子层的编码子层的输出向量作为所述第三多头注意力层的输入向量,由所述第三多头注意力层的输入端输入。

步骤376,通过连接于所述第三多头注意力层的第二残差连接层,使得所述第三多头注意力层的输入向量与输出向量融合,并传输至所述第二全连接层。

步骤377,通过连接于所述第二全连接层的第二残差连接层,使得所述第二全连接层的输入向量与输出向量融合,得到该解码子层的输出向量。

其中,该解码子层的输出向量作为后一个解码子层的输入向量。

步骤379,由最后一个解码子层的输出向量得到所述目标语言。

具体而言,如图8所示,在每一个解码子层中,经由该解码子层中的第二多头注意力层的输入端输入该解码子层的输入向量,并输出得到该解码子层的局部向量。所述待解码向量作为第一个解码子层的输入向量。

经由该解码子层中连接于该第二多头注意力层的第二残差连接层,将该解码子层的输入向量传输至该解码子层中连接于该第二多头注意力层的第二标准化层,并与该解码子层的局部向量进行特征融合和层标准化,得到该解码子层的第一中间向量,并传输至第三多头注意力层,作为该第三多头注意力层的输入向量。

经由连接在该解码子层及其对应的编码子层之间的第三残差连接层,将该解码子层对应的编码子层的输出向量也传输至第三多头注意力层,作为该第三多头注意力层的输入向量。

经由该解码子层中连接于该第三多头注意力层的第二残差连接层,将该第三多头注意力层的输入向量传输至该解码子层中连接于该第三多头注意力层的第二标准化层,并与该第三多头注意力层的输出向量进行特征融合和层标准化,得到该解码子层的第二中间向量。

将该解码子层的第二中间向量输入该解码子层中的第二全连接层,经由该第二全连接层输出得到该解码子层的全局向量。

经由该解码子层中连接于该第二全连接层的第二残差连接层,将该解码子层的第二中间向量传输至该解码子层中连接于该第二全连接层的第二标准化层,并与该解码子层的全局向量进行特征融合和层标准化,得到该解码子层的输出向量。

对解码网络中的各解码子层进行遍历,将相应地获得各解码子层的输出向量,以前一个解码子层的输出向量作为后一个解码子层的输入向量。

直至解码网络中的各解码子层完成遍历,便可由最后一个解码子层的输出向量得到所述目标语言。

上述过程中,基于第二残差连接层实现了解码子层中各层之间的特征传播,以及,基于第三残差连接层实现了解码子层及其对应的编码子层之间的特征传播,避免使用卷积操作,由此可避免特征传播的瓶颈问题。

此外,通过第二标准化层中进行的解码子层中各层之间的特征融合,以及,解码子层及其对应的编码子层之间的特征融合,使得不同分辨率不同尺度的特征能够相互关联,而并非孤立的,有利于进一步地提升疾病分类编码识别的准确率。

进一步地,请参阅图10,在一示例性实施例中,所述第二多头注意力层的输入端包括Q2输入端、K2输入端和V2输入端。

在所述解码子层中,将所述解码子层的输入向量通过Q2输入端、K2输入端和V2输入端输入所述第二多头注意力层,分别作为所述第二多头注意力层的Q端输入向量、K端输入向量和V端输入向量。

更进一步地,请继续参阅图10,在一示例性实施例中,所述第三多头注意力层的输入端包括Q3输入端、K3输入端和V3输入端。

在所述第三多头注意力层中,将对应于该解码子层的编码子层的输出向量通过K3输入端和V3输入端输入所述第三多头注意力层,分别作为所述第三多头注意力层的K端输入向量和V端输入向量。

同时,将所述第二多头注意力层的输入向量与输出向量融合的结果通过Q3输入端输入所述第三多头注意力层,作为所述第三多头注意力层的Q端输入向量。

相应地,通过连接于所述第三多头注意力层的第二残差连接层,使得所述第三多头注意力层的Q端输入向量与输出向量融合。

应当说明的是,同理于第一多头注意力层,Q表示query,K表示keys,V表示values,使得第二多头注意力层、第三多头注意力层得以进一步地关注源语言中各分词的上下文语义关系以及各分词在源语言中的位置关系,以此进一步地保证了疾病分类编码识别的准确率。

通过上述各实施例的配合,基于机器翻译模型的疾病分类编码识别,不仅能够满足疾病分类编码识别的精度要求,准确率precision高达97.86%,而且通过不同的残差连接层在机器翻译模型中实现了便捷的特征传播,有利于实现机器翻译模型中关于不同分辨率不同尺度特征的特征融合,进一步充分地保障了疾病分类编码识别的准确率,相较于现有的疾病分类编码,F值(f1-score)由82.88%提高至87.58%,召回率(recall)由79.38%提高至87.19%。

下述为本发明装置实施例,可以用于执行本发明所涉及的疾病分类编码识别方法。对于本发明装置实施例中未披露的细节,请参照本发明所涉及的疾病分类编码识别方法的方法实施例。

请参阅图11,在一示例性实施例中,一种疾病分类编码识别装置900包括但不限于:数据获取模块910、数据输入模块930、编码模块950及解码模块970。

其中,数据获取模块910,用于获取诊断数据。

数据输入模块930,用于将所述诊断数据作为源语言输入机器翻译模型,所述机器翻译模型包括编码网络和解码网络。

编码模块950,用于通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征。

解码模块970,用于将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,所述目标语言为所述诊断数据匹配的疾病分类编码。

需要说明的是,上述实施例所提供的疾病分类编码识别装置在进行疾病分类编码识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即疾病分类编码识别装置的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。

另外,上述实施例所提供的疾病分类编码识别装置与疾病分类编码识别方法的实施例属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。

请参阅图12,在一示例性实施例中,一种计算机设备1000,包括至少一处理器1001、至少一存储器1002、以及至少一通信总线1003。

其中,存储器1002上存储有计算机可读指令,处理器1001通过通信总线1003读取存储器1002中存储的计算机可读指令。

该计算机可读指令被处理器1001执行时实现上述各实施例中的疾病分类编码识别方法。

请参阅图13,在一示例性实施例中,一种存储介质1100,其上存储有计算机程序1101,该计算机程序1101被处理器执行时实现上述各实施例中的疾病分类编码识别方法。

上述内容,仅为本发明的较佳示例性实施例,并非用于限制本发明的实施方案,本领域普通技术人员根据本发明的主要构思和精神,可以十分方便地进行相应的变通或修改,故本发明的保护范围应以权利要求书所要求的保护范围为准。。

24页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于任务层面课程式学习的非自回归机器翻译模型的训练方法和训练系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!