肺结节属性特征信息的提取方法及系统

文档序号：1756162 发布日期：2019-11-29 浏览：7次 >En<

阅读说明：本技术 肺结节属性特征信息的提取方法及系统 (The extracting method and system of Lung neoplasm attributive character information ) 是由马杰超崔星田希陈宽王少康于 2019-08-30 设计创作，主要内容包括：本发明公开了一种肺结节属性特征信息的提取方法及系统,获取目标信息；采用预设特征提取深度学习模型对目标信息进行特征提取,得到第一特征信息；采用预设数据挖掘算法对目标信息进行特征提取,得到第二特征信息；根据第一特征信息和第二特征信息进行融合并生成维度矢量；将维度矢量输入至目标分类器中,得到目标信息的肺结节属性特征信息。在本发明中可以基于深度学习模型获得目标信息中的低维度像素特征,基于数据挖掘算法获得高维度的语义信息特征,这样使得获得的特征信息更加完整和准确,然后基于对上述特征信息的融合和分类,使得获得的肺结节属性特征信息更加准确,从而可以提升肺结节润侵性的分级的准确性。(The invention discloses the extracting methods and system of a kind of Lung neoplasm attributive character information, obtain target information；Feature extraction is carried out to target information using default feature extraction deep learning model, obtains fisrt feature information；Feature extraction is carried out to target information using preset data mining algorithm, obtains second feature information；It is merged according to fisrt feature information and second feature information and generates dimension vector；Dimension vector is input in object classifiers, the Lung neoplasm attributive character information of target information is obtained.The low dimensional pixel characteristic in target information can be obtained based on deep learning model in the present invention, high-dimensional semantic information feature is obtained based on data mining algorithm, make the characteristic information obtained more complete and accurate in this way, it is then based on the fusion and classification to features described above information, so that the Lung neoplasm attributive character information obtained is more accurate, so as to promote the accuracy that Lung neoplasm moistens the classification of invading property.)

肺结节属性特征信息的提取方法及系统

技术领域

本发明涉及信息处理技术领域，特别是涉及一种肺结节属性特征信息的提取方法及系统。

背景技术

肺癌是全球癌症相关死亡的主要原因，随着多层螺旋计算机断层扫描(CT)技术的发展和低剂量螺旋CT筛查的普及，早起可能会发现越来越多的肺癌病例，从而大大减少了死亡人数。致肺癌在高分辨率CT(HRCT)中，结节显示实性，部分实性或非实性病变，并且大部分部分实性和非实性病变被鉴定为恶性。为了解决肺结节的准确分类问题，国际肺癌研究协会(IASLC)、美国胸科学会(ATS)和欧洲呼吸学会(ERS)提出了一种新的肺腺癌分类方法。根据病变的大小和病例分析中实性成分的存在，磨玻璃结节(ggsn)被分为非典型腺癌性增生(AAH)、原位腺癌(AIS)、微创癌腺(MIA)或侵袭性腺癌(IAC)。由于不同病例亚型的预后差异较大，新分类对患者的治疗选择和随访有重要影响。

现有的肺结节的润侵程度分类都是依靠医务人员进行分析，使得医务人员的工作量巨大，并且受不同医生的主管因素的影响会使得分类结果存在差异性。虽然现有技术中也有通过计算机技术来解决肺结节的润侵程度的分类问题，但是会存在着对肺结节属性特征信息的提取不准确，并会对关键信息丢失，最终使得根据提取到的肺结节属性信息实现分级结果不准确。

发明内容

针对于上述问题，本发明提供一种肺结节属性特征信息的提取方法及系统，实现了对肺结节属性特征信息的准确提取，以提升对肺结节润侵程度的准确分类。

为了实现上述目的，本发明提供了如下技术方案：

一种肺结节属性特征信息的提取方法，该方法包括：

获取目标信息，所述目标信息是根据待分析的肺结节CT图生成的；

采用预设特征提取深度学习模型对所述目标信息进行特征提取，得到第一特征信息，其中，所述预设特征提取深度学习模型的参数是通过对多个所述肺结节CT图进行训练得到的，所述第一特征信息表征低维度像素特征；

采用预设数据挖掘算法对所述目标信息进行特征提取，得到第二特征信息，其中，所述预设数据挖掘算法是根据对所述肺结节CT图进行关联分析得到的，所述第二特征信息表征高维度的语义信息特征；

根据所述第一特征信息和所述第二特征信息进行融合处理，并根据融合后的特征生成维度矢量；

将所述维度矢量输入至目标分类器中，得到所述目标信息的肺结节属性特征信息，所述肺结节属性特征信息表征肺结节润侵性的分级信息。

可选的，所述获取目标信息，包括：

获取目标患者的肺部电子计算机断层扫描CT图像；

在所述目标患者的肺部电子计算机断层扫描CT图像中提取肺结节图像，得到目标信息。

可选的，所述预设特征提取深度学习模型包括卷积层、池化层和全连接层，其中，所述卷积层用来学习输入的所述肺结节CT图的特征映射，所述池化层用来减少所述深度学习模型的计算复杂度，所述全连接层用来对学习得到的特征映射进行格式转换，使得获得的特征信息能够被所述目标分类器进行识别。

可选的，采用预设数据挖掘算法对所述目标信息进行特征提取，得到第二特征信息，包括：

采用预设数据挖掘算法对所述目标信息进行特征提取，获得初始特征信息，所述初始特征信息包括形状特征、强度特征、纹理特征和高阶特征；

对所述初始特征进行特征选择，并对选择后的初始特征进行特征分析，获得第二特征信息。

可选的，所述根据所述第一特征信息和所述第二特征信息进行融合处理，并根据融合后的特征生成维度矢量，包括：

利用所述全连接层对所述第一特征信息进行处理，获得包含N个值的一维特征矢量；

利用所述预设数据挖掘算法对所述第二特征信息进行编码，生成包括M个值的一维矢量；

根据通道级别对所述包含N个值的一维特征矢量和所述包括M个值的一维矢量进行组合叠加，生成维度矢量，所述维度矢量为M+N个值大小的一维矢量，其中，N和M为数值不同的正整数。

可选的，所述特征分析包括相关性分析、聚类分析和主成分分析中的一种或多种。

一种肺结节属性特征信息的提取系统，该系统包括：

信息获取单元，用于获取目标信息，所述目标信息是根据待分析的肺结节CT图生成的；

第一提取单元，用于采用预设特征提取深度学习模型对所述目标信息进行特征提取，得到第一特征信息，其中，所述预设特征提取深度学习模型的参数是通过对多个所述肺结节CT图进行训练得到的，所述第一特征信息表征低维度像素特征；

第二提取单元，用于采用预设数据挖掘算法对所述目标信息进行特征提取，得到第二特征信息，其中，所述预设数据挖掘算法是根据对所述肺结节CT图进行关联分析得到的，所述第二特征信息表征高维度的语义信息特征；

矢量生成单元，用于根据所述第一特征信息和所述第二特征信息进行融合处理，并根据融合后的特征生成维度矢量；

分类单元，用于将所述维度矢量输入至目标分类器中，得到所述目标信息的肺结节属性特征信息，所述肺结节属性特征信息表征肺结节润侵性的分级信息。

可选的，所述获取信息获取单元，包括：

图像获取子单元，用于获取目标患者的肺部电子计算机断层扫描CT图像；

图像提取子单元，用于在所述目标患者的肺部电子计算机断层扫描CT图像中提取肺结节图像，得到目标信息。

可选的，所述预设特征提取深度学习模型包括卷积层、池化层和全连接层，其中，所述卷积层用来学习输入的所述肺结节CT图的特征映射，所述池化层用来减少所述深度学习模型的计算复杂度，所述全连接层用来对学习得到的特征映射进行格式转换，使得获得的特征信息能够被所述目标分类器进行识别；

所述第二提取单元，包括：

特征提取子单元，用于采用预设数据挖掘算法对所述目标信息进行特征提取，获得初始特征信息，所述初始特征信息包括形状特征、强度特征、纹理特征和高阶特征；

分析子单元，用于对所述初始特征进行特征选择，并对选择后的初始特征进行特征分析，获得第二特征信息；所述特征分析包括相关性分析、聚类分析和主成分分析中的一种或多种。

可选的，所述矢量生成单元包括：

信息处理子单元，用于利用所述全连接层对所述第一特征信息进行处理，获得包含N个值的一维特征矢量；

编码子单元，用于利用所述预设数据挖掘算法对所述第二特征信息进行编码，生成包括M个值的一维矢量；

生成子单元，用于根据通道级别对所述包含N个值的一维特征矢量和所述包括M个值的一维矢量进行组合叠加，生成维度矢量，所述维度矢量为M+N个值大小的一维矢量，其中，N和M为数值不同的正整数。

相较于现有技术，本发明提供了一种肺结节属性特征信息的提取方法及系统，获取目标信息；采用预设特征提取深度学习模型对所述目标信息进行特征提取，得到第一特征信息；采用预设数据挖掘算法对所述目标信息进行特征提取，得到第二特征信息；根据所述第一特征信息和所述第二特征信息融合后生成维度矢量；将所述维度矢量输入至目标分类器中，得到所述目标信息的肺结节属性特征信息。在本发明中采用了深度学习模型和数据挖掘算法同时对目标信息处理，可以基于深度学习模型获得目标信息中的低维度像素特征，基于数据挖掘算法获得高维度的语义信息特征，这样使得获得的特征信息更加完整和准确，然后基于对上述特征信息的融合和分类，使得获得的肺结节属性特征信息更加准确，这样为实现肺结节润侵性的分级提供了准确的参考信息，从而可以提升肺结节润侵性的分级的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种肺结节属性特征信息的提取方法的流程示意图；

图2为本发明实施例提供的一种深度学习模型的架构示例图；

图3为本发明实施例提供的一种利用数据挖掘算法提取属性信息的示意图；

图4为本发明实施例提供的将数据挖掘和深度学习结合的处理方式的示意图；

图5为本发明实施例提供的一种肺结节属性特征信息的提取系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象，而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元，而是可包括没有列出的步骤或单元。

在本发明实施例中提供了一种肺结节属性特征信息的提取方法，该方法应用于对目标信息进行处理的服务器或者数据分析端，例如，服务器或者数据处理终端。其中，目标信息是根据待分析的肺结节CT图生成的。参见图1，该方法可以包括以下步骤：

S101、获取目标信息。

其中，目标信息是根据待分析的肺结节CT图生成的。在获得了患者的肺结节CT图后，可以获取到该CT图中呈现的基本信息，例如，不同位置的像素信息，轮廓信息等。需要说明的是，肺结节CT图通常不是直接得到的，是通过计算机断层扫描技术对患者的肺部进行扫描，获得患者的肺部电子计算机断层扫描CT图像，然后从该扫描获得的CT图像中来提取肺结节图像，并且可以对提取到的肺结节图像进行预处理，例如，图像格式转换、图像灰度处理等。

S102、采用预设特征提取深度学习模型对所述目标信息进行特征提取，得到第一特征信息；

其中，所述预设特征提取深度学习模型的参数是通过对多个所述肺结节CT图进行训练得到的，所述第一特征信息表征低维度像素特征。

基于深度学习模型一般是通过机器学习的方法来解决问题的。例如，使用支持矢量机(Support Vector Machine，SVM)来对目标信息提取出来的特征进行属性归类。参见图2，为本发明实施例提供的一种深度学习模型的架构示例图。该深度学习模型包括卷积层(convolution)、池化层(如，最大池化层Max-pooling)和全连接层，从而来预测属性特征的分类。具体的，属性特征可以分为非典型腺癌性增生(AAH)、原位腺癌(AIS)、微创癌腺(MIA)或侵袭性腺癌(IAC)。其中，卷积层用来学习输入图像的一些特征映射，池化层用来保证映射图像的效果不变前提下，来减少模型的计算复杂度。而全连接层就是将这些学到的特征映射进行一系列的转换，变成可以输入到分类器的格式的操作。因此，可以利用深度学习模型对学习到的特征进行直接的分类，预测肺结节的润侵程度。

S103、采用预设数据挖掘算法对所述目标信息进行特征提取，得到第二特征信息。

其中，所述预设数据挖掘算法是根据对所述肺结节CT图进行关联分析得到的，所述第二特征信息表征高维度的语义信息特征。

参见图3，其示出了利用数据挖掘算法提取属性信息的示意图。数据挖掘算法是根据数据创建数据挖掘模型的一组试探法和计算，为了创建模型，算法首先分析提供的数据，并查找特定类型的模式和趋势。在本申请实施例中的所提供的待分析的数据就是目标信息，即对肺结节CT图进行关联分析。在利用数据挖掘算法对特征信息进行提取的时候，首先会获得一些初始特征信息，如形状特征、强度特征、纹理特征和高阶特征。本发明实施例中的形状特征是结节的形状，并按照圆形到毛刺的程度对该特征进行形状特征标注(圆形为1，毛刺为5)；强度特征，是按照图像上的像素值对结节分类为1-5的5类强度分级；纹理特征，包括肺结节表面的能量、相关、对比度、逆差距、熵等图像纹理性质。然后，可以利用特征选择方法对上述特征进行选择，可以通过方差选择、K-Bset、Lasso算法进行特征选择。进行特征选择的目的，一方面可以减少特征数量、降维，使得模型泛化能力更强，减少过拟合。另一方面是增强对特征和特征值之间的理解。例如，对于上述得到的初始特征信息，可以过滤一些可能会对模型一起偏差的特征进行过滤。并且对于一些相关程度不高的特征进行过滤。具体过滤方法为：对于方差小于0.8的特征进行过滤，并且对这些得到的特征，在此进行特征的重要程度分析，使用k best的方法得到p-value较大的特征进行保留。

同时需要对选择后的初始特征进行特征分析，具体的，分析方法可以包括相关性分析、聚类分析、主成分分析等。聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的实验数据进行分组归类以了解数据集的内在结构，并且对每一个数据集进行描述的过程。其主要依据是聚到同一个数据集中的样本应该彼此相似，而属于不同组的样本应该足够不相似；主成分分析就是设法将原来众多具有一定相关性的数据，重新组合成一组新的互相无关的综合数据来代替原来的数据。综合数据即为主成分。所得出的少数几个主成分，要尽可能多地保留原始变量的信息，且彼此不相关；相关性分析是指对两个或多个具备相关性的变量元素进行分析，从而衡量两个变量因素的相关密切程度。

S104、根据所述第一特征信息和所述第二特征信息进行融合处理，并根据融合后的特征生成维度矢量；

S105、将所述维度矢量输入至目标分类器中，得到所述目标信息的肺结节属性特征信息，所述肺结节属性特征信息表征肺结节润侵性的分级信息。

参见图4，其示出了本申请实施例中将数据挖掘和深度学习结合的处理方式的示意图。在本申请实施例中基于数据挖掘和深度学习结合的方式，对于输入的目标信息即肺结节CT图像进行分析，对于一些高维的带一些语义信息的特征，使用数据挖掘算法提取出一系列能够反映结节的一些量化特征。并且对这两个特征(低维像素特征和高维语义特征)进行融合。对于低维像素特征，在经过一层全连接层以后生成一个一维矢量，包含若干个值(N)。而对于高维语义特征，对过滤后的各个特征进行量化编码，而生成有M个值得一维矢量。对于一个深度学习分类器的softmax，对这两个维度的特征按照通道级别进行组合叠加，生成一个M+N个值得一维矢量，并放入分类器进行训练测试。在训练网络中，在本实施例中固定高维语义信息的参数，将损失函数回传到低维像素特征，使得该回传信息中也带有了一定的语义信息。

通过高效地结合高维语义信息和低维像素信息，能够更好地对肺结节的润侵程度进行分级，更好地对影像医生的阅片习惯进行建模，即根据影像表现的病人报告上的信息作出判断。协助影像科医生更准确地确定T1期肺结节的侵袭性。例如，可以将提取到的肺结节属性特征信息，即其属于哪个分类的分类结果体现在CT图像中的注释信息中，可以作为影像医生的辅助参考信息。

本发明提供了一种肺结节属性特征信息的提取方法及系统，获取目标信息；采用预设特征提取深度学习模型对所述目标信息进行特征提取，得到第一特征信息；采用预设数据挖掘算法对所述目标信息进行特征提取，得到第二特征信息；根据所述第一特征信息和所述第二特征信息融合后生成维度矢量；将融合后的维度矢量输入至目标分类器中，得到所述目标信息的肺结节属性特征信息。在本发明中采用了深度学习模型和数据挖掘算法同时对目标信息处理，可以基于深度学习模型获得目标信息中的低维度像素特征，基于数据挖掘算法获得高维度的语义信息特征，这样使得获得的特征信息更加完整和准确，然后基于对上述特征信息的融合和分类，使得获得的肺结节属性特征信息更加准确，这样为实现肺结节润侵性的分级提供了准确的参考信息，从而可以提升肺结节润侵性分级的准确性。

在本发明实施例中还提供了一种肺结节属性特征信息的提取系统，参见图5，该系统包括：

信息获取单元10，用于获取目标信息，所述目标信息是根据待分析的肺结节CT图生成的；

第一提取单元20，用于采用预设特征提取深度学习模型对所述目标信息进行特征提取，得到第一特征信息，其中，所述预设特征提取深度学习模型的参数是通过对多个所述肺结节CT图进行训练得到的，所述第一特征信息表征低维度像素特征；

第二提取单元30，用于采用预设数据挖掘算法对所述目标信息进行特征提取，得到第二特征信息，其中，所述预设数据挖掘算法是根据对所述肺结节CT图进行关联分析得到的，所述第二特征信息表征高维度的语义信息特征；

矢量生成单元40，用于根据所述第一特征信息和所述第二特征信息进行融合处理，并根据融合后的特征生成维度矢量；

分类单元50，用于将所述维度矢量输入至目标分类器中，得到所述目标信息的肺结节属性特征信息，所述肺结节属性特征信息表征肺结节润侵性的分级信息。

在上述实施例的基础上，所述获取信息获取单元，包括：

图像获取子单元，用于获取目标患者的肺部电子计算机断层扫描CT图像；

图像提取子单元，用于在所述目标患者的肺部电子计算机断层扫描CT图像中提取肺结节图像，得到目标信息。

在上述实施例的基础上，所述预设特征提取深度学习模型包括卷积层、池化层和全连接层，其中，所述卷积层用来学习输入的所述肺结节CT图的特征映射，所述池化层用来减少所述深度学习模型的计算复杂度，所述全连接层用来对学习得到的特征映射进行格式转换，使得获得的特征信息能够被所述目标分类器进行识别；

所述第二提取单元，包括：

在上述实施例的基础上，所述矢量生成单元包括：

信息处理子单元，用于利用所述全连接层对所述第一特征信息进行处理，获得包含N个值的一维特征矢量；

编码子单元，用于利用所述预设数据挖掘算法对所述第二特征信息进行编码，生成包括M个值的一维矢量；

在本发明中通过第一提取单元和第二提取单元采用了深度学习模型和数据挖掘算法同时对目标信息处理，可以基于深度学习模型获得目标信息中的低维度像素特征，基于数据挖掘算法获得高维度的语义信息特征，这样使得获得的特征信息更加完整和准确，然后基于对上述特征信息的融合和分类，使得获得的肺结节属性特征信息更加准确，这样为实现肺结节润侵性的分级提供了准确的参考信息，从而可以提升肺结节润侵性的分级的准确性。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其他实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

12页详细技术资料下载

肺结节属性特征信息的提取方法及系统

相关技术

网友询问留言