一种基于深度学习的藏医尿液颜色自动识别方法

文档序号：1756164 发布日期：2019-11-29 浏览：12次 >En<

阅读说明：本技术 一种基于深度学习的藏医尿液颜色自动识别方法 (A kind of Tibetan medicine's urine color automatic recognition method based on deep learning ) 是由刘勇国张艺杨尚明李巧勤华尔江泽翁拥忠降拥四郎杜春慧朱嘉静郑子强于 2019-10-14 设计创作，主要内容包括：本发明提供了一种基于深度学习的藏医尿液颜色自动识别方法,包括如下步骤：采集尿液图像,并对每幅图像进行标注；根据所述尿液图像构建基于深度卷积神经网络CNN的尿液颜色识别模型；根据所述尿液颜色识别模型识别尿液颜色特征,从而完成基于深度学习的藏医尿液颜色的自动识别。本发明通过以上设计能自动识别尿液在尿热阶段的颜色,通过深度卷积神经网络从训练数据中自动学习特征,而不是采用手工设计的特征,学习到的特征对于尿液颜色识别更有效,为医师诊断提供辅助支持。此外,所提出的算法直接在原始像素上运行,不需要预处理技术,在一定程度上节约时间。(The present invention provides a kind of Tibetan medicine's urine color automatic recognition method based on deep learning includes the following steps: to acquire urine image, and is labeled to each image；Urine color identification model according to the urine picture construction based on depth convolutional neural networks CNN；Urine color characteristic is identified according to the urine color identification model, to complete the automatic identification of Tibetan medicine's urine color based on deep learning.The present invention is by design energy automatic identification urine above in the color for urinating the hot stage, by depth convolutional neural networks from training data automatic learning characteristic, rather than the feature of hand-designed is used, the feature learnt identifies more effectively urine color, provides auxiliary for doctor diagnosed and supports.In addition, the algorithm proposed is directly run on original pixels, preconditioning technique is not needed, saves the time to a certain extent.)

技术领域

本发明属于尿液识别技术领域，尤其涉及一种基于深度学习的藏医尿液颜色自动识别方法。

背景技术

藏医是中国传统医学的重要组成部分，有两千三百多年历史，是藏族人民通过长期实践，不断积累完善而形成的具有完整理论体系、独特治疗方法和浓郁民族特色的医学体系。藏医尿诊是通过观察患者尿液诊断疾病的医学技术，是藏医最具特色的诊断手段之一，属于望、触、问三大诊断方法中的望诊范畴，在《月王药诊》、《四部医典》等书中均有记载，距今有两千多年历史。尿液是人体津液代谢的产物，尿液的生成与排除不仅与***有关，而且其它五脏六腑也参与其中。藏医认为尿液是人体摄入的饮食经过体内反复分化而生成，尿液能反映身体寒热等内在信息，所以尿液的性状不仅反映***本身的病变，临床所见人体几乎所有的病理改变都可能引起尿液特征的变化，因此，藏医尿诊对于机体病变具有重要的临床价值。

从总体上看，藏医尿诊过程分为三个阶段，即“三时九诊”，依次为：尿热阶段，观察颜色、蒸汽、气味、泡沫；尿温阶段，观察悬浊物、漂浮物；尿凉阶段，观察尿液变化时间、变化方式及回旋情况。其中，尿热阶段的颜色特征是尿诊的重要特征之一，尿液颜色主要分为九大类，分别是：黄色、白色、红色、赤色、褐色、黑色、绿色、青色、蓝色。藏医中的尿液颜色特征是用于诊断患者所患疾病类型的重要特征，可用于区分赤巴病、培根病、隆病。当尿液的颜色如池水，色清且稀者是隆型疾病；黄色是赤巴型疾病，白色是培根型疾病。总验尿法从尿热、尿温、尿凉单个阶段观察尿液特征，久置后尿液的颜色会有所变化，而反映不同疾病类型的主要是尿热阶段的颜色。因此，尿液颜色识别主要针对尿热阶段的颜色进行识别。

传统藏医尿液颜色识别由藏医医生观察并根据经验判断相关诊断意见。医生诊疗经验、技能水平以及外界的环境条件等都会直接影响到最终诊断结果，因而主观性强，可重复性差，缺乏颜色评判标准。基于仪器设备的方法容易受环境光影响、分辨率低误差大的缺陷，因而难以准确的识别物体颜色；机器学习方法分类识别颜色，其中，颜色直方图是全局颜色统计的结果，因此缺失了像素的位置性；颜色矩的维度较少，不能很好的表达高位数据；颜色集采用的搜索区域方法使得算法性能不稳定。传统机器学习是基于手工设计的特征，此过程需要人为的判断颜色相似性，在一定程度上会忽视一部分特征，造成颜色识别准确率较低；而目前基于深度学习的颜色识别都是针对固态物体，还未涉及到液体颜色识别。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于深度学习的藏医尿液颜色自动识别方法，能自动识别尿液在尿热阶段的颜色，为医师诊断提供辅助支持。

为了达到以上目的，本发明采用的技术方案为：一种基于深度学习的藏医尿液颜色自动识别方法，包括如下步骤：

S1、采集尿液图像，并对每幅图像进行标注；

S2、根据所述尿液图像构建基于深度卷积神经网络CNN的尿液颜色识别模型；

S3、根据所述尿液颜色识别模型识别尿液颜色特征，从而完成基于深度学习的藏医尿液颜色的自动识别。

进一步地，所述步骤S1中对每幅图像进行标注，其具体为：

将所采集的尿液图像标注为黄色、白色、红色、赤色、褐色、黑色、绿色、青色以及蓝色图像，并将所有尿液图像调整至224×224的大小。

再进一步地，所述步骤S2中构建的尿液颜色识别模型包括依次连接的输入层、第一卷积单元C1、第二卷积单元C2、第三卷积单元C3、第四卷积单元C4、第五卷积单元C5、第一全连接单元FC1、第二全连接单元FC2、第三全连接单元FC3以及输出层。

再进一步地，所述第一卷积单元C1包括依次连接的第一卷积层Conv1、第一非线性层Relu1以及第一池化层Pool1，所述第一卷积层Conv1包括大小为11×11，步长为4的96个卷积核，所述第一池化层Pool1的步长为2；

所述第二卷积单元C2包括依次连接的第二卷积层Conv2、第二非线性层Relu2以及第二池化层Pool2，所述第二卷积层Conv2包括大小为5×5，步长为1的256个卷积核，所述第二池化层Pool2的步长为2；

所述第三卷积单元C3包括依次连接的第三卷积层Conv3和第三非线性层Relu3，所述第三卷积层Conv3包括大小为3×3，步长为1的384个卷积核；

所述第四卷积单元C4包括依次连接的第四卷积层Conv4和第四非线性层Relu4，所述第四卷积层Conv4包括大小为3×3，步长为1的384个卷积核；

所述第五卷积单元C5包括依次连接的第五卷积层Conv5、第五非线性层Relu5以及第三池化层Pool3，所述第五卷积层Conv5包括大小为3×3，步长为1的256个卷积核，所述第三池化层Pool3的步长为2；

所述第一全连接单元FC1包括依次连接的第一全连接层fc1和第六非线性层Relu6；

所述第二全连接单元FC2包括依次连接的第二全连接层fc2和第七非线性层Relu7；

所述第三全连接单元FC3包括与所述输出层连接的第三全连接层fc3。

再进一步地，所述第一卷积层Conv1、第二卷积层Conv2、第三卷积层Conv3、第四卷积层Conv4以及第五卷积层Conv5的输出映射均为：

其中，M^l-1表示输入的尿液颜色的特征数量，l和m分别表示层数和尿液特征图的索引，n表示滤波器的索引，表示滤波器，*表示卷积操作，表示第m层的第l个尿液输入向量，表示第l层的第n个尿液输出特征的偏置。

再进一步地，所述第一非线性层Relu1、第二非线性层Relu2、第三线性层Relu3、第四非线性层Relu4、第五非线性层Relu5、第六非线性层Relu6以及第七非线性层Relu7的激活函数f(y)均为：

f(y)＝max(0,y)

其中，y表示当前层的输入。

再进一步地，所述步骤S3具体为：

根据所述尿液颜色识别模型，利用softmax函数预测输入尿液图像在九类尿液颜色上的概率分布，从而完成基于深度学习的藏医尿液颜色的自动识别。

再进一步地，所述概率分布p_u的表达式为：

其中，O_n表示第n输出层的线性组合，C表示总的尿液颜色类别数，O_u表示第u输出层的线性组合，n表示线性组合的第n个向量，M表示第一全连接单元FC1、第二全连接单元FC2和第三全连接单元FC3生成的1024维特征向量，x_m表示输出层的第m个输入映射，W_n,m表示权重，b_n表示尿液输出特征的偏置，*表示卷积操作。

再进一步地，所述九类尿液颜色分别为：黄色、白色、红色、赤色、褐色、黑色、绿色、青色和蓝色。

本发明的有益效果：

(1)本发明通过深度卷积神经网络从训练数据中自动学习特征，而不是采用手工设计的特征，学习到的特征对于尿液颜色识别更有效。此外，所提出的算法直接在原始像素上运行，不需要预处理技术，在一定程度上节约时间；

(2)本发明将深度学习方法应用到解决尿液颜色分类问题上，能自动识别尿液在尿热阶段的颜色，为医师诊断提供辅助决策支持

(3)本发明采用自主设计的尿液采集系统进行尿液图片采集，有效地提高了尿液颜色识别模型训练的效率；

(4)本发明中采用步长为2的最大池化，很大程度上减少了输入尿液图片的空间维度，同时大大减少了参数和权重的数量，从而降低了计算成本，避免过拟合，提高尿液颜色识别模型的泛化能力；

(5)本发明中利用非线性层，在提高尿液颜色识别模型的训练速度的同时，不损害其模型输出的准确性，并有助于缓解消失的梯度问题。

附图说明

图1为本发明的方法流程图。

图2为本深度卷积神经网络的结构图。

图3为藏医尿液颜色识别框图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

实施例

如图1所示，本发明提供了一种基于深度学习的藏医尿液颜色自动识别方法，其实现方法如下：

S1、采集尿液图像，并对每幅图像进行标注，其具体为：将所采集的尿液图像标注为黄色、白色、红色、赤色、褐色、黑色、绿色、青色以及蓝色图像，并利用python软件将所有尿液图像调整至224×224的大小。

本实施例中，本发明采用藏医尿诊数字化采集装置，通过甘孜州藏医医院和青海大学附属医院获取患者尿液图像，藏医医师根据临床经验对收集到的每幅图像进行标注，分为黄色、白色、红色、赤色、褐色、黑色、绿色、青色、蓝色。由于拍摄的原始尿液图像尺寸较大，为了提高模型训练的效率，采用python统一将所有图像调整至224×224固定大小。

S2、根据所述尿液图像构建基于深度卷积神经网络CNN的尿液颜色识别模型：如图2所示，包括依次连接的输入层、第一卷积单元C1、第二卷积单元C2、第三卷积单元C3、第四卷积单元C4、第五卷积单元C5、第一全连接单元FC1、第二全连接单元FC2、第三全连接单元FC3以及输出层。所述第一卷积单元C1包括依次连接的第一卷积层Conv1、第一非线性层Relu1以及第一池化层Pool1，所述第一卷积层Conv1包括大小为11×11，步长为4的96个卷积核，所述第一池化层Pool1为大小为3×3，步长为2的池化层；所述第二卷积单元C2包括依次连接的第二卷积层Conv2、第二非线性层Relu2以及第二池化层Pool2，所述第二卷积层Conv2包括大小为5×5，步长为1的256个卷积核，所述第二池化层Pool2为大小为3×3，步长为2的池化层；所述第三卷积单元C3包括依次连接的第三卷积层Conv3和第三非线性层Relu3，所述第三卷积层Conv3包括大小为3×3，步长为1的384个卷积核；所述第四卷积单元C4包括依次连接的第四卷积层Conv4和第四非线性层Relu4，所述第四卷积层Conv4包括大小为3×3，步长为1的384个卷积核；所述第五卷积单元C5包括依次连接的第五卷积层Conv5、第五非线性层Relu5以及第三池化层Pool3，所述第五卷积层Conv5包括大小为3×3，步长为1的256个卷积核，所述第三池化层Pool3包括大小为3×3，步长为2的池化层；所述第一全连接单元FC1包括依次连接的第一全连接层fc1和第六非线性层Relu6；所述第二全连接单元FC2包括依次连接的第二全连接层fc2和第七非线性层Relu7；所述第三全连接层包括与所述输出层连接的第三全连接层fc3。

本实施例中，CNN是一个多层感知机网络，包含卷积层、池化层和全连接层，可以从原始尿液图片中自动提取尿液颜色特征，避免手工设计的输入特征。

1)卷积层：卷积层由若干卷积单元组成，卷积运算的目的是提取输入尿液图片的不同特征，卷积层第一层可提取一些低级的特征如边缘，其它层则从低级特征中迭代提取更复杂的特征。对卷积层的输入执行二维卷积操作，l和m分别为层数和特征图的索引，通过卷积核表示的滤波器，n为滤波器的索引。l层的第n个输出映射计算如下:

2)池化：池化包含最大池化、平均池化和L2-norm池化方式，本方案采用步长为2的最大池化。池化层很大程度上减少了输入尿液图片的空间维度，同时大大减少了参数和权重的数量，从而降低了计算成本，避免过拟合，提高模型泛化能力。

3)ReLU：线性整流单元(ReLU)是非线性层(或激活层)，通常在卷积层之后使用，其目的是在系统中引入非线性，允许网络训练得更快，而不损害准确性，并有助于缓解消失的梯度问题。因此本方案采用ReLu激活函数f(y)＝max(0,y)，其中，y表示当前层的输入，f(y)将所有负激活都更改为0。

4)全连接层：该层获取前一个卷积层或池化层或线性整流单元的输出并生成一个M维向量，本发明采用VGG16网络结构，三个全连接层之后生成1024维特征向量，即M＝1024。利用softmax分类器对输入尿液图片的颜色标签概率进行预测。设x_m表示输出层的第m个输入映射，则线性组合O_n定义为:

通过softmax函数预测输入数据在九类尿液上的概率分布:

所述九类尿液颜色分别为：黄色、白色、红色、赤色、褐色、黑色、绿色、青色和蓝色。

本实施例中，如图2所示的CNN体系结构。网络由五个卷积层{C1,C2,C3,C4,C5}和三个全连接层{fc6,fc7,fc8}组成，特征学习网络设置如表1所示。将224×224×3的藏医尿液颜色数据作为第一个卷积层的输入，通过大小为11×11，步长为4的96个卷积核卷积后，输入数据变为55×55×96，经过ReLu1之后数据还是55×55×96，接着通过3×3，步长为2的pool1后，数据变为27×27×96。第一个卷积层的输出27×27×96作为第二个卷积层的输入，通过大小为5×5，步长为1的256个卷积核操作之后，数据变为27×27×256，经过ReLu2后数据还是27×27×256，接着通过步长为2的pool2后数据降维到13×13×256。第二个卷积层的输出13×13×256作为第三个卷积层的输入，通过大小3×3，步长为1的384个卷积核操作之后，数据变为13×13×384，经过ReLu3后数据是13×13×384。第三个卷积层的输出13×13×384作为第四个卷积层的输入，通过大小3×3，步长为1的384个卷积核操作之后，数据变为13×13×384，经过ReLu4后数据还是13×13×384。第四个卷积层的输出13×13×384作为第五个卷积层的输入，通过大小3×3，步长为1的256个卷积核操作之后，数据变为13×13×256，经过ReLu5后数据还是13×13×256，接着通过步长为2的pool5后，数据变为6×6×256。第五卷积层的输出6×6×256作为全连接fc6的输入，将6×6×256转换为向量形式，此时向量为4096维。

表1

C1	Convolution(11×11kernel,stride 4),ReLu,Pooling(2×2)
		C2	Convolution(5×5kernel,stride 1),ReLu,Pooling(2×2)
C3	Convolution(3×3kernel,stride 1),ReLu
		C4	Convolution(3×3kernel,stride 1),ReLu
C5	Convolution(3×3kernel,stride 1),ReLu,Pooling(2×2),
		fc6	Relu,4096neurons
fc7	Relu,4096neurons
		fc8	9neurons(the number of classes)

深度卷积神经网络过滤器识别到的是尿液颜色特征。为了学习更有辨别力的表示特征，训练深度卷积神经网络框架。计算每个全连接层的输出Y_t＝W_t-1Y_t-1+B_t-1，其中，Y为全连接层的输出，W为权重，B为偏置。参数W和B在训练阶段学习。

S3、如图3所示，根据所述尿液颜色识别模型识别尿液颜色特征，从而完成基于深度学习的藏医尿液颜色的自动识别。

本发明通过以上设计能自动识别尿液在尿热阶段的颜色，通过深度卷积神经网络从训练数据中自动学习特征，而不是采用手工设计的特征，学习到的特征对于尿液颜色识别更有效，为医师诊断提供辅助支持。此外，所提出的算法直接在原始像素上运行，不需要预处理技术，在一定程度上节约时间。

11页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：一种车辆尾气检测方法和装置

一种基于深度学习的藏医尿液颜色自动识别方法

相关技术

网友询问留言