一种医学ct图像存储与检索方法

文档序号:987761 发布日期:2020-11-06 浏览:12次 >En<

阅读说明:本技术 一种医学ct图像存储与检索方法 (Medical CT image storage and retrieval method ) 是由 刘杨 刘子超 于 2020-06-17 设计创作,主要内容包括:本发明涉及一种医学CT图像存储与检索方法,属于图像存储与检索技术领域。本发明获取若干医学CT图像组建数据库,对其进行压缩、计算DCT矩阵等环节,生成64位哈希指纹;接着对哈希指纹建立多位索引进行存储;对待检索医学CT图像也生成64位哈希指纹,根据多位检索算法在数据库中检索与待检索医学CT图像的哈希指纹相似的哈希指纹,将其所对应的医学CT图像、标签属性等信息输出。本发明与现有技术相比,主要解决了现有技术针对海量医学CT图像相似检索时存在的效率不高、有疾病界限等现象,在保持相似精度的同时优化了检索效率,实现了跨疾病相似检索。(The invention relates to a medical CT image storage and retrieval method, and belongs to the technical field of image storage and retrieval. The method comprises the steps of acquiring a plurality of medical CT image building databases, compressing the medical CT image building databases, calculating DCT matrixes and the like, and generating 64-bit hash fingerprints; establishing a multi-bit index for the hash fingerprint for storage; and generating 64-bit hash fingerprints for the medical CT image to be retrieved, retrieving the hash fingerprints similar to the hash fingerprints of the medical CT image to be retrieved in the database according to a multi-bit retrieval algorithm, and outputting the corresponding medical CT image, label attribute and other information. Compared with the prior art, the method mainly solves the problems of low efficiency, disease boundary and the like existing in the prior art when the similarity search of massive medical CT images is carried out, optimizes the search efficiency while keeping the similarity precision, and realizes the cross-disease similarity search.)

一种医学CT图像存储与检索方法

技术领域

本发明涉及一种医学CT图像存储与检索方法,属于图像存储与检索技术领域。

背景技术

在疾病诊断中,随着影像设备的复杂化,检测疾病的图像数量不断增加,导致医生的工作负荷日益加大。随着大数据和人工智能的发展,在云计算环境中,在大量医学CT图像中快速检索到相似医学CT图像特征对疾病的诊断有重大意义。

就医学CT图像而言,不同的病例往往会导致医学CT图像特征的不同,但相似医学CT图像特征在相似病例中有着极强的相似性。现有技术公开了申请号为201810757397.7的一种随机森林哈希的医学CT图像存储与检索方法,该技术通过在医学CT图像集上训练得到随机森林哈希模型,保存模型及图像库对应的哈希码库;当用户输入一张需要检索的新的图像时,首先,模型将该图像映射为哈希码;然后在哈希码库中检索与之最近的K个哈希码;最后,将这个K个哈希码利用树的决策路径所定义的最大相容规则解码重构为图像并返回给用户。该技术虽可进行医学CT图像的检索,但其利用决策树生成哈希码,在检索时难免会导致检索效率上的不合格,为了提高影像诊断的效率,还是需要一种可以快速检索过去相似病例疾病名称、治疗信息的技术,以便为医生诊断病情提供参考。

发明内容

本发明要解决的技术问题是针对现有技术的局限和不足,提供一种医学CT图像存储与检索方法,以解决现有技术针对海量医学CT图像相似检索时存在的效率不高、有疾病界限等问题。

本发明的技术方案是:一种医学CT图像存储与检索方法,具体步骤为:

Step1:获取若干医学CT图像imgi,i∈[1,D]组建数据库,其中D为医学CT图像的个数,另外医学CT图像imgi,i∈[1,D]应具有标签属性labeli,i∈[1,D],即医学CT图像imgi,i∈[1,D]所对应的疾病名称。

Step2:对数据库中医学CT图像imgi,i∈[1,D]进行压缩、计算DCT矩阵等环节,生成64位哈希指纹hashi,i∈[1,D],该哈希指纹可唯一代表医学CT图像imgi,i∈[1,D]。

Step3:对64位哈希指纹hashi,i∈[1,D]建立多位索引进行存储。

Step4:对待检索医学CT图像retimg根据Step2中所述生成哈希指纹的流程对其也生成64位哈希指纹rethash。

Step5:根据多位检索算法在数据库中检索与待检索医学CT图像retimg的哈希指纹rethash相似的哈希指纹hashi,i∈[1,D],若两者哈希指纹的海明距离N≤α,则将哈希指纹hashi,i∈[1,D]所对应的医学CT图像imgi,i∈[1,D]、标签属性labeli,i∈[1,D]等信息输出,通常令α=3。

进一步地,所述Step1中,医学CT图像包括正常医学CT图像和患者医学CT图像,且其数量呈均匀分布。

进一步地,所述步骤Step2中,医学CT图像imgi,i∈[1,D]所生成哈希指纹hashi,i∈[1,D]的具体实施步骤如下:

Step2.1:将医学CT图像imgi,i∈[1,D]的大小压缩至32×32,或将其切割成大小为32×32的小方块儿形式。

Step2.2:将压缩后的医学CT图像imgi,i∈[1,D]转化为256阶灰度图像,并表示为矩阵形式Ii,i∈[1,D],其中Ii(m,k),i∈[1,D],m∈[1,32],k∈[1,32]为矩阵元素值。

Step2.3:计算矩阵Ii,i∈[1,D]的DCT矩阵Ti,i∈[1,D],其中矩阵元素值表示为Ti(m,k),i∈[1,D],m∈[1,32],k∈[1,32]。

Step2.4:保留DCT矩阵Ti,i∈[1,D]的左上角8×8低频部分,删除其余部分。

Step2.5:计算DCT矩阵Ti,i∈[1,D]的平均值ui,i∈[1,D],将DCT矩阵Ti,i∈[1,D]按照从上至下,m=1→8、从左至右,k=1→8的规则,根据公式(1)进行二值化,并对其连接生成医学CT图像imgi,i∈[1,D]的64位哈希指纹hashi,i∈[1,D]。

Figure BDA0002542892410000021

进一步地,所述步骤Step3中,多位索引指的是将哈希指纹hashi,i∈[1,D]按照M段进行切分,如公式(2)所示,其中M>α,hashi,j,i∈[1,D],j∈[1,M]表示hashi,i∈[1,D]的子指纹,之后将哈希指纹hashi,i∈[1,D]的M段子指纹hashi,j,i∈[1,D],j∈[1,M]进行(M-α)位排列组合建立倒排索引表,即每个哈希指纹hashi,i∈[1,D]将有个索引指向它,并将索引从上至下记为索引1、索引2、……、索引

Figure BDA0002542892410000023

当M=5时的倒排索引表如公式(3)所示;数据库中所有哈希指纹hashi,i∈[1,D]的倒排索引表称为倒排索引总库。

hashi=[hashi,1,hashi,2,…,hashi,M],i∈[1,D] (2)

Figure BDA0002542892410000031

进一步地,所述步骤Step5中,多位检索算法的具体实施步骤如下:

Step5.1:对待检索医学CT图像retimg的哈希指纹rethash同样进行M段切分,如公式(4)所示,并将其按照Step3所述方法进行(M-α)位排列组合建立倒排索引表;当M=5时的倒排索引表如公式(5)所示;

rethash=[rethash1,rethash2,…,rethashM] (4)

Figure BDA0002542892410000032

Step5.2:在倒排索引总库中检索出与待检索医学CT图像retimg的哈希指纹rethash的索引号相同且索引值也相同的哈希指纹集[hash1,hash2,…,hashK],其中K表示与其索引号相同且索引值也相同的哈希指纹的个数,并将其称为待比较哈希指纹集。

Step5.3:计算待检索医学CT图像retimg的哈希指纹rethash与待比较哈希指纹集[hash1,hash2,…,hashK]中每个哈希指纹hashk,k∈[1,K]的海明距离N,若N≤α则将哈希指纹hashk,k∈[1,K]所对应的医学CT图像imgi,i∈[1,D]、标签属性labeli,i∈[1,D]等信息输出。

本发明的有益效果是:本发明与现有技术相比,主要解决了现有技术针对海量医学CT图像相似检索时存在的效率不高、有疾病界限等现象,在保持相似精度的同时优化了检索效率,实现了跨疾病相似检索。

附图说明

图1是本发明的步骤流程图;

图2是本发明实施例中M=5时建立的倒排索引表示意图;

图3是本发明实施例中M=6时建立的倒排索引表示意图。

具体实施方式

下面结合附图和具体实施方式,对本发明作进一步说明。

实施例1:如图1所示,一种医学CT图像存储与检索方法,首先获取若干医学CT图像组建数据库,对其进行压缩、计算DCT矩阵等环节,生成64位哈希指纹;接着对哈希指纹建立多位索引进行存储;对待检索医学CT图像也生成64位哈希指纹,根据多位检索算法在数据库中检索与待检索医学CT图像的哈希指纹相似的哈希指纹,将其所对应的医学CT图像、标签属性等信息输出。

其具体步骤为:

Step1:获取若干医学CT图像imgi,i∈[1,D]组建数据库,其中D为医学CT图像的个数,另外医学CT图像imgi,i∈[1,D]应具有标签属性labeli,i∈[1,D],即医学CT图像imgi,i∈[1,D]所对应的疾病名称;

Step2:对数据库中医学CT图像imgi,i∈[1,D]进行压缩、计算DCT矩阵等环节,生成64位哈希指纹hashi,i∈[1,D],该哈希指纹可唯一代表医学CT图像imgi,i∈[1,D];

Step3:对64位哈希指纹hashi,i∈[1,D]建立多位索引进行存储;

Step4:对待检索医学CT图像retimg根据Step2中所述生成哈希指纹的流程对其也生成64位哈希指纹rethash;

Step5:根据多位检索算法在数据库中检索与待检索医学CT图像retimg的哈希指纹rethash相似的哈希指纹hashi,i∈[1,D],若两者哈希指纹的海明距离N≤α,则将哈希指纹hashi,i∈[1,D]所对应的医学CT图像imgi,i∈[1,D]、标签属性labeli,i∈[1,D]等信息输出,通常令α=3。

所述步骤Step1中,医学CT图像应包括正常医学CT图像和患者医学CT图像,且其数量呈均匀分布。

所述步骤Step2中,医学CT图像imgi,i∈[1,D]所生成哈希指纹hashi,i∈[1,D]的具体实施步骤如下:

Step2.1:将医学CT图像imgi,i∈[1,D]的大小压缩至32×32,或将其切割成大小为32×32的小方块儿形式;

Step2.2:将压缩后的医学CT图像imgi,i∈[1,D]转化为256阶灰度图像,并表示为矩阵形式Ii,i∈[1,D],其中Ii(m,k),i∈[1,D],m∈[1,32],k∈[1,32]为矩阵元素值;

Step2.3:计算矩阵Ii,i∈[1,D]的DCT矩阵Ti,i∈[1,D],其中矩阵元素值表示为Ti(m,k),i∈[1,D],m∈[1,32],k∈[1,32];

Step2.4:保留DCT矩阵Ti,i∈[1,D]的左上角8×8低频部分,删除其余部分;

Step2.5:计算DCT矩阵Ti,i∈[1,D]的平均值ui,i∈[1,D],将DCT矩阵Ti,i∈[1,D]按照从上至下(m=1→8)、从左至右(k=1→8)的规则,根据公式(1)进行二值化,并对其连接生成医学CT图像imgi,i∈[1,D]的64位哈希指纹hashi,i∈[1,D]。

所述步骤Step3中,多位索引指的是将哈希指纹hashi,i∈[1,D]按照M段进行切分,如公式(2)所示,其中M>α,hashi,j,i∈[1,D],j∈[1,M]表示hashi,i∈[1,D]的子指纹,之后将哈希指纹hashi,i∈[1,D]的M段子指纹hashi,j,i∈[1,D],j∈[1,M]进行(M-α)位排列组合建立倒排索引表,即每个哈希指纹hashi,i∈[1,D]将有个索引指向它,并将索引从上至下记为索引1、索引2、……、索引当M=5时的倒排索引表如公式(3)所示;数据库中所有哈希指纹hashi,i∈[1,D]的倒排索引表称为倒排索引总库。

hashi=[hashi,1,hashi,2,…,hashi,M],i∈[1,D] (2)

Figure BDA0002542892410000054

如图2和图3所示,所述步骤Step5中多位检索算法的具体实施步骤详细描述如下:

Step5.1:对待检索医学CT图像retimg的哈希指纹rethash同样进行M段切分,如公式(4)所示,并将其按照Step3所述方法进行(M-α)位排列组合建立倒排索引表;当M=5时的倒排索引表如公式(5)所示;

rethash=[rethash1,rethash2,…,rethashM] (4)

Step5.2:在倒排索引总库中检索出与待检索医学CT图像retimg的哈希指纹rethash的索引号相同且索引值也相同的哈希指纹集[hash1,hash2,…,hashK],其中K表示与其索引号相同且索引值也相同的哈希指纹的个数,并将其称为待比较哈希指纹集;

Step5.3:计算待检索医学CT图像retimg的哈希指纹rethash与待比较哈希指纹集[hash1,hash2,…,hashK]中每个哈希指纹hashk,k∈[1,K]的海明距离N,若N≤α则将哈希指纹hashk,k∈[1,K]所对应的医学CT图像imgi,i∈[1,D]、标签属性labeli,i∈[1,D]等信息输出。

若M=5,则每个哈希指纹将有

Figure BDA0002542892410000062

个索引指向它;若每段分为12bit、13bit、13bit、13bit、13bit,那么相对于计算数据库中全部D个哈希指纹的海明距离来讲,优化后只需要计算个哈希指纹,又因每个哈希指纹将有10个索引指向它,故算法效率比优化前快了229/10倍(理想状态)。

若M=6,则每个simhash指纹将有个索引指向它;若每段分为10bit、10bit、11bit、11bit、11bit、11bit,那么相对于计算数据库中全部D个哈希指纹的海明距离来讲,优化后只需要计算

Figure BDA0002542892410000065

个哈希指纹,又因每个哈希指纹将有20个索引指向它,故算法效率比优化前快了233·11/20倍(理想状态);当然并不是M值越大越好,M值越大使用的空间也就越大,对计算机的运行内存空间要求较高,并且在建立倒排索引表时每个哈希指纹的索引太多也会大幅度会影响检索效率,故要根据具体的D值估算,同时兼顾效率和空间两个维度选择合适的M值。

以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于图数据库的网络拓扑图生成方法、装置和系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!