心房颤动人工智能实验选择指标的方法及预测决策树在房颤预测中的应用

文档序号:1435752 发布日期:2020-03-20 浏览:20次 >En<

阅读说明:本技术 心房颤动人工智能实验选择指标的方法及预测决策树在房颤预测中的应用 (Method for selecting indexes through atrial fibrillation artificial intelligence experiment and application of prediction decision tree in atrial fibrillation prediction ) 是由 张树龙 张敏 杨慧英 冯雪颖 于 2018-09-13 设计创作,主要内容包括:心房颤动人工智能实验选择指标的方法及预测决策树在房颤预测中的应用,属于数据处理领域,为了解决选择更为准确反映心房颤动的指标的问题,包括S1.构建决策树;S2.调整参数以优化决策树;S3.对各种参数可能的取值均进行实验,最后选取最优实验结果,该结果作为决策树预测的主要指标,本发明通过人工智能及大数据处理,对房颤预测指标作出了更为合理的选择,该指标是经过大数据处理以得到的能够更为准确反映房颤的指标,使用这些指标评估房颤能降低对房颤对漏检。(A method for selecting indexes through an atrial fibrillation artificial intelligence experiment and application of a prediction decision tree in atrial fibrillation prediction belong to the field of data processing, and aim to solve the problem of selecting indexes which more accurately reflect atrial fibrillation, the method comprises the following steps of S1, constructing a decision tree; s2, adjusting parameters to optimize a decision tree; and S3, performing experiments on possible values of various parameters, and finally selecting an optimal experiment result as a main index of decision tree prediction.)

心房颤动人工智能实验选择指标的方法及预测决策树在房颤 预测中的应用

技术领域

本发明属于数据处理领域,涉及一种构建房颤预测决策树的方法及心房颤动人工智能实验选择指标的方法。

背景技术

房颤是一种以快速、无序心房电活动为特征的室上性快速性心律失常。房颤在心电图上主要表现为:P波消失,代之以不规则的心房颤动波;RR间期绝对不规则(房室传导存在时)。这也是现在医学等方面用于判断房颤的主要依据。医学上主要根据房颤发作的持续时间将房颤分为阵发性房颤(paroxysmal AF)、持续性房颤(persistent AF)、长程持续性房颤 (long-standing persistent AF)和永久性房颤(permanent AF)。具体分类如表1。

表1.1医学上房颤的详细分类

Figure RE-GDA0001851358430000011

心房颤动在临床上是一种非常常见的心律失常,在我国其发病率在0.5%-1%,随着年龄的增加发病的概率就越高。而高血压患者发生房颤的风险较血压正常者高1.7倍,目前已有 33%房颤患者的发生归于高血压。针对高血压患者房颤的高发病率,有人甚至认为,房颤是高血压靶器官损害的另一种表现。但目前临床上尚无较好的指标预测高血压患者AF的发生。此外,一些房颤患者并无明显临床症状,导致这些患者无意识地暴露在各种危重病症的风险之下,当临床症状出现或突发疾病时,往往已导致心血管发生器质性病变,从而极大地影响患者的身体健康甚至危及生命。因此,研究高血压患者人群中患有房颤的概率则显得尤为重要。

现阶段预测房颤的方法很多,在医学领域,从房颤的治疗方面着手。在国际上虽然有 CHA2DS2-VASc评分(高血压、年龄、糖尿病、中风、血管病变、性别、充血性心力衰竭) 和HATCH评分(高血压、年龄、脑缺血发作、慢阻肺、心衰)用于预测房颤,但是这两种评分都存在各种局限性,使得预测方法不规范,预测结果不准确。在计算机领域,大家普遍根据的是患者的心电图,根据判断P波、分析RR间期分布随时间的变化规律等因素来判断患者是否患有房颤,用到的算法有统计学方面的还有机器学习方面的。还有通过智能手表来检验人体一些特征指标从而来预测,通过智能手机扫描脸部通过人的脸色来预测,甚至有时对于无症的患者,直接借用医学仪器测试患者的Holter心率来预测。但这些仍然缺乏规范性、无特定标准。

发明内容

为了解决选择更为准确反映心房颤动的指标的问题,本发明提出如下方案:

一种心房颤动人工智能实验选择指标的方法:

S1.构建决策树;

S2.调整参数以优化决策树;

S3.对各种参数可能的取值均进行实验,最后选取最优实验结果,该结果作为决策树预测的主要指标。

进一步的,所述的主要指标是心脏超声的属性中的A峰、ef和lasd三个属性。

进一步的,所述的主要指标是XGN(心功能等级)、A峰(心脏超声指标)、FS(风湿性心脏瓣膜病)、FJB(间质性肺疾病)、LVPWD(心脏超声指标)、EF(心脏超声指标)、FDMB1(肺动脉瓣血流速度)、FDMB(肺动脉瓣)、LAD(心脏超声指标)、GXB(冠心病)、TNB(糖尿病)、 MCHC(血红蛋白浓度)、E峰(心脏超声指标)。

进一步的,构建决策树的方法是:

步骤1:如果数据集S属于同一个类别,则创建一个叶子结点,并标记相应类标号,停止构建树;否则,进行步骤2;

步骤2:计算数据集S中所有属性的信息增益率Gain-rate(A);

步骤3:选取最大信息增益率的属性A;

步骤4:将属性A建立为决策树T的根节点,T是要构建的决策树;

步骤5:根据属性A的不同取值对数据集进行划分成多个子集,对子集Sv循环执行步骤1-4,构建子树Tv,Sv是属性A取值为v的样本子集;

步骤6:将子树Tv添加到决策树T相应的分支中;

步骤7:循环结束,得出决策树T。

本发明还涉及一种预测决策树在房颤预测中的应用。

有益效果:本发明通过人工智能及大数据处理,对房颤预测指标作出了更为合理的选择,该指标是经过大数据处理以得到的能够更为准确反映房颤的指标,使用这些指标评估房颤能降低对房颤对漏检,本发明还给出了能用于房颤预测的决策树的构建方法,完整的阐述了该决策树的建立过程,使得在房颤预测领域,能够建立一个标准的以数学方法构建决策树的模型,并给出了决策树对于用于确定影响房颤的一些重要参考指标,具有重要指导意义。

附图说明

图1是决策树结构示意图;

图2是医疗数据原稿示意图;

图3是导成Excel表格示意图;

图4是心脏超声属性示意图;

图5是4weka操作界面示意图;

图6是均使用默认值决策树示意图;

图7是决策树准确率示意图;

图8是154项因素的决策树示意图;

图9是决策树准确率示意图。

具体实施方式

实施例1:

为了解决房颤预测的构建决策树构建问题,本发明提出如下技术方案:一种构建房颤预测决策树的方法,包括:

步骤1:如果数据集S属于同一个类别,则创建一个叶子结点,并标记相应类标号,停止构建树;否则,进行步骤2;

步骤2:计算数据集S中所有属性的信息增益率Gain-rate(A);

步骤3:选取最大信息增益率的属性A;

步骤4:将属性A建立为决策树T的根节点,T是要构建的决策树;

步骤5:根据属性A的不同取值对数据集进行划分成多个子集,对子集Sv循环执行步骤1-4,构建子树Tv,Sv是属性A取值为v的样本子集;

步骤6:将子树Tv添加到决策树T相应的分支中;

步骤7:循环结束,得出决策树T。

进一步的,数据处理的方法是:对于类标签缺失,直接删除该条信息;对于属性值缺失的,将值并入最常见的某一类中或者以最常用的值代替;处理连续值首先要多数据进行排序,以每个数据为阈值划分数据集,计算各个划分的信息增益,根据最大增益选择阈值,使用阈值对数据集进行划分。

进一步的,对决策树进行剪枝操作:

1)分别计算三种预测错分样本数:计算子树Tv的所有叶节点预测错分样本数之和,记为E1;计算子树Tv被剪枝以叶节点代替时的预测错分样本数,记为E2;计算子树Tv 的最大分支预测错分样本数,记为E3;

2)进行比较:E1最小时,不剪枝;E2最小时,进行剪枝,以一个叶节点代替子树Tv;E3最小时,用最大分支代替子树Tv。

进一步的,根据信息增益率选择***属性:

信息熵的公式为:

Info_Gain(A)=H(S)-H(A)

Figure RE-GDA0001851358430000041

其中S代表数据集,ci代表数据集的第i个分类,p(ci)代表ci这个类别被选择的概率;

在决策树划分时,计算的一般是某个特征属性的信息熵,假设特征属性A有n个不同的值,则特征属性A将数据集S划分成n个小数据集,用si表示,每个小数据集被选择的概率为p(si),根据公式(1)可知,每个小数据集si的信息熵为H(si),特征属性A的信息熵计算公式为:

Figure RE-GDA0001851358430000042

信息增益计算公式为:

Info_Gain(A)=H(S)-H(A)(3)

信息增益率计算公式为:

Figure RE-GDA0001851358430000043

进一步的,通过改变决策树算法的参数,不断调整所构造的决策树,使得构造的决策树准确率和分支属性值都达到最优:J48算法可修改参数共有11项,其中binarySplits、debug、 saveInstance、subtreeRaising、unpruned、useLaplace均采用默认值,对ConfidenceFactor、 minNumObj、numFolds、seed、ReduceErrorPruning五个参数进行修改、验证以不断逼近医疗数据的准确值;将做完数据处理的数据文件放入weka软件中,选取算法以及对算法相应的参数进行修改,运行出结果,对各种参数可能的取值均进行实验,最后选取最优实验结果;

实验分为两支:

第一分支实验,对心脏超声指标的若干项属性进行实验,其中最后一列为类标签,f为房颤,z为正常,算法的各个参数均使用默认值;根据决策树可知,在心脏超声的属性中,对房颤影响大的为A峰、ef和lasd三个属性,具体到决策树中根节点A峰,该属性是信息增益率最大的,它的正常范围是41到87,决策树的第一个分支,当a<=0时,a指代的是A 峰的值,患者发生房颤,由于数据中没有非0数,所以也就是当a=0时,判断该患者发生房颤;当a>0时,需要继续考虑ef属性,当ef值小于58时,则判断该患者为正常;

第二分支实验,采集患者的特征指标,其中包括血常规、甲功、凝血像、肝功、血脂、心脏超声指标检测项作为属性列,最后一列为类标签,f为房颤,z为正常,算法的各个参数均使用默认值,根据决策树,对房颤起作用的有XGN(心功能等级)、A峰(心脏超声指标)、 FS(风湿性心脏瓣膜病)、FJB(间质性肺疾病)、LVPWD(心脏超声指标)、EF(心脏超声指标)、FDMB1(肺动脉瓣血流速度)、FDMB(肺动脉瓣)、LAD(心脏超声指标)、GXB(冠心病)、TNB(糖尿病)、MCHC(血红蛋白浓度)、E峰(心脏超声指标),具体到决策树中,根节点为XGN,当XGN等级大于1时即判断患者为房颤,当XGN等级小于等于1,继续考虑A峰,当A峰为0时,继续考虑FS,当FS大于0时,判断患者患有房颤,否则继续考虑FJB,当FJB小于等于0,考虑LVPWD,当LVPWD小于等于9时,继续考虑EF的值(即决策树中的EF1),当EF小于等于57时,则判断该患者为正常,否则为房颤;继续回溯到LVPWD的右支,当LVPWD大于9时,考虑FDMB1的值,当该值小于等于101时,则判断该患者为房颤,否则考虑LAD,当LAD小于等于50时,则判断患者是房颤,否则则判断患者为正常;继续回溯到FJB的右支,当FJB大于0时,考虑GXB,当GXB小于等于2,则判断患者为正常,否则判断患者为房颤;继续回溯到FS的右支,当FS大于0,则判断患者为房颤;继续回溯到A峰的右支,当A大于0,则考虑TNB,当TNB小于等于 0时,则判断患者为正常,否则考虑FDMB当FDMB大于0,则判断患者为正常,否则考虑E值,当E大于72时,则判断患者为房颤,否则考虑MCHC值,当MCHC小于等于338,则判断患者为房颤,否则为正常,遍历整棵决策树。

实施例2:

本公开采用数据挖掘的方法建立一棵规范的决策树模型来供医学参考。

其中涉及的标准术语解释:

数据挖掘(Data Mining,DM),面对海量的、数据来源多方面的、长时间积累下来的数据,提取出人类已经认识的有价值的模式、联系和知识等。它是在事先没有假设的前提下去挖掘数据、发现知识。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。本发明做的则是分类分析,分析高血压患者中是否患有房颤。

决策树算法是数据挖掘领域用于分类预测的一种典型算法,其具有较低的计算复杂度以及直观的输出结果。本发明将决策树算法引入到预测高血压患者中患有房颤的概率中。

决策树,是一种基本的分类与回归方法,本发明主要采用的是分类决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。相比朴素贝叶斯分类,决策树的优势在于构造过程中不需要任何领域知识或参数设置,因此在实际应用中,对于探测式的知识发现,决策树更加适用。决策树算法包括ID3算法、C4.5算法和CART算法。本发明则采用C4.5算法进行实验。C4.5主要是在ID3的基础上进行了改进,在ID3算法中信息增益选择属性时偏向选择取值比较多的属性。为了解决这个问题,在C4.5算法中用信息增益率来代替信息增益。决策树是一个树形结构,由一个根节点,一系列的内部节点及叶子结点构成,每一结点只有一个父节点和两个或多个子节点,结点间通过分支相连。决策树的每个内部结点对应一个非类别属性或属性的结合,每条边对应该属性的每个可能取值,每个叶子结点对应一个类别属性值。决策树结构示例如图1所示。

针对上述决策树的公知含义,本发明将其适用于房颤预测的指标分类,该方法如下:

C4.5算法流程

步骤1:如果数据集S属于同一个类别,则创建一个叶子结点,并标记相应类标号,停止构建树;否则,进行步骤2;

步骤2:计算数据集S中所有属性的信息增益率Gain-rate(A);

步骤3:选取最大信息增益率的属性A;

步骤4:将属性A建立为决策树T的根节点,T是要构建的决策树;

步骤5:根据属性A的不同取值对数据集进行划分成多个子集,对子集Sv循环执行步骤1-4,构建子树Tv,Sv是属性A取值为v的样本子集;

步骤6:将子树Tv添加到决策树T相应的分支中;

步骤7:循环结束,得出决策树T。

数值处理:能够处理具有缺失属性值的训练数据。对于类标签缺失,直接删除该条信息;对于属性值缺失的,将这些值并入最常见的某一类中或者以最常用的值代替。可处理连续值属性。处理连续值首先要多数据进行排序,以每个数据为阈值划分数据集,计算各个划分的信息增益,根据最大增益选择阈值,使用阈值对数据集进行划分。

剪枝:通过上面决策树的生成流程,我们可以构建一棵基于训练数据集的决策树,但是决策树的准确性,以及其他一些性能,这个是需要我们评估这棵树应该做的一些工作。因为我们得到的决策树是纯粹基于训练数据集的,所以会存在一些过拟合的问题。为了解决这个问题,我们需要对决策树进行剪枝操作。决策树修剪的基本思想是去掉一部分对未知检验样本的分类精度没有帮助的树(子树),生成简单、更容易理解的树有两种改进的递归分枝方法:预剪枝和后剪枝。

预剪枝:在分支前作出决策防止数据集生成过多的分支。构造决策树的同时进行剪枝。

后剪枝:主要是为解决噪声影响,修剪掉多余的树枝。

因为本发明采用的J48算法是后剪枝,所以这里详细介绍一下后剪枝方法。后剪枝方法有:REP(Reduced Error Pruning),PEP(Pessimistic Error Pruning),MEP(MinimumError Pruning),CCP(Cost-Complexity Pruning)等。C4.5算法默认的剪枝方法是REP剪枝法。基本思路为:

1)分别计算三种预测错分样本数:计算子树Tv的所有叶节点预测错分样本数之和,记为E1;计算子树Tv被剪枝以叶节点代替时的预测错分样本数,记为E2;计算子树 Tv的最大分支预测错分样本数,记为E3。

2)进行比较。E1最小时,不剪枝;E2最小时,进行剪枝,以一个叶节点代替子树Tv;E3最小时,采用“嫁接”策略,即用这个最大分支代替子树Tv。

***属性选择:***属性选择的评判标准是决策树算法之间的根本区别。上文已经提到 ID3是通过信息增益选择***属性,C4.5是通过信息增益率选择***属性。信息熵是信息的期望值,针对数据集而言,信息熵表述的是数据集的无序程度。数据集包含的类别越多,对应信息熵越大。公式为:

Figure RE-GDA0001851358430000071

其中S代表数据集,ci代表数据集的第i个分类,p(ci)代表ci这个类别被选择的概率;

在决策树划分时,计算的一般是某个特征属性的信息熵,假设特征属性A有n个不同的值,则特征属性A将数据集S划分成n个小数据集,用si表示,每个小数据集被选择的概率为p(si),根据公式(1)可知,每个小数据集si的信息熵为H(si),特征属性A的信息熵计算公式为:

信息增益计算公式为:

Info_Gain(A)=H(S)-H(A) (3)

信息增益率计算公式为:

Figure RE-GDA0001851358430000082

算法应用

数据描述:本发明采用的数据是大连市某医院提供,由高血压患者实测产生,共360 份。实验报告单主要包括白细胞计数(WBC)、粒细胞绝对值(Neu#)、NT-proBNP、EF(射血分数)、LVEF(左室射血分数)、高血压等级、是否患有房颤等。如图2所示是部分的原始数据项。

数据预处理:Weka平台上运行的数据文件类型为.csv文件,我们的数据文件为Excel 表格数据,所以第一步现需要将数据文件转化成.csv文件。将医院所给数据中本发明不考虑的其他指标过滤掉,仅留下研究对象。对异常数据进行删除,空缺值属性J48算法自动处理。由于154维数据各取值存在很大的数量级,所以本发明将通过相关医学标准,有目标性的提取其中的11维数据即心脏超声指标进行更加具体的实验。如ef(射血分数)、a峰、e峰等。简化为如图3所示。

运行环境:怀卡托智能分析环境(Waikato Environment for KnowledgeAnalysis,WEKA) 一款免费的、非商业化的基于JAVA境下开源的机器学***台,集成了大量能承担数据挖掘任务的机器学***台和操作界面如图4所示。如若使用weka软件,先需将控制平台打开,选取第一个选项Explorer开始实验,打开的界面如操作界面图所示,第一步现需要通过openfile选项来选择自己要进行的实验,然后根据自己实验的要求对数据做不同实验,比如有数据预处理,分类算法,聚类算法,关联规则等选项参数。本发明根据实验要求,选取分类算法中的J48算法进行实验。软件操作界面如图5所示。

决策树构建:决策树的构建不是唯一的,遗憾的是最优决策树的构建属于NP问题。因此如何构建一棵好的决策树是研究的重点。本发明通过改变决策树算法的参数,来不断地调整构造的决策树,使得构造的决策树准确率和分支属性值都达到最优。J48算法可修改参数共有11项,其中binarySplits、debug、saveInstance、subtreeRaising、unpruned、useLaplace 均采用默认值,对ConfidenceFactor、minNumObj、numFolds、seed、ReduceErrorPruning五个参数进行修改。本发明实验主要对剩余六个参数进行修改验证不断逼近医疗数据的准确值,使得决策树的准确率,可行性更强。weka软件类似于一个黑盒子,只要将处理好的数据文件放入weka中选取自己想要的算法以及对算法相应的参数进行修改,即可运行出结果。对各种参数可能取值均进行实验,最后选取最优实验结果如下。实验总的分为两个分支,一部分是对心脏超声的11项属性进行实验,其中最后一列为类标签,f为房颤,z为正常。实验数据共含有360个,其中男性有186人,女性有174人。房颤的有178人,正常的有182 人(这里的正常人指的是纯高血压患者)。算法的各个参数均使用默认值,实验结果如图6 所示。

通过上面决策树,可以知道在心脏超声的属性中,对房颤影响大的为A峰、ef和lasd 三个属性。具体到决策树中根节点A峰(当消失的时候,意味着房颤已经发生。)这个属性是信息增益率最大的,它的正常范围是41到87。第一个分支我们可以看到,当a<=0时,患者发生房颤,由于数据中没有非0数,所以也就是当a=0时,可以判断该患者发生房颤。当a>0时,需要继续考虑ef属性,当ef值小于58时,则判断该患者为正常。依此类推分析决策树。决策树准确率截图包括准确率、错误率、Kappa值等,这些因素都可以用来评估该算法的好坏。本发明主要根据准确率为判断依据。从图7中可以看到准确率为83.0556%。

第二部分实验数据共含有308个数据。154项患者的特征指标,其中包括血常规、甲功、凝血像、肝功、血脂、心脏超声等指标检测项作为属性列,最后一列为类标签,f为房颤,z为正常。在数据中男性有162人,女性有146人。房颤患者有128人,正常患者有180人。和上面类似的,算法的各个参数均使用默认值,实验结果如图8所示。

通过决策树我们可以看到在154项属性中对房颤起作用的有XGN(心功能等级)、A峰 (心脏超声指标)、FS(风湿性心脏瓣膜病)、FJB(间质性肺疾病)、LVPWD(心脏超声指标)、EF(心脏超声指标)、FDMB1(肺动脉瓣血流速度)、FDMB(肺动脉瓣)、LAD(心脏超声指标)、GXB(冠心病)、TNB(糖尿病)、MCHC(血红蛋白浓度)、E峰(心脏超声指标)。这13项指标在医学中有的还未引起足够的注意。比如血红蛋白浓度对房颤的影响。

具体到决策树中,根节点为XGN,说明这项指标对房颤的发生有很大的作用,当XGN等级小于等于1,继续考虑A峰,当A峰为0时,继续考虑FS,当FS大于0时,判断患者患有房颤,否则继续考虑FJB,当FJB小于等于0,考虑LVPWD,当LVPWD小于等于 9时,继续考虑EF的值(即决策树中的EF1),当EF小于等于57时,则判断该患者为正常,否则为房颤;继续回溯到LVPWD的右支,当LVPWD大于9时,考虑FDMB1的值,当该值小于等于101时,则判断该患者为房颤,否则考虑LAD,当LAD小于等于50时,则判断患者是房颤,否则则判断患者为正常;继续回溯到FJB的右支,当FJB大于0时,考虑 GXB,当GXB小于等于2,则判断患者为正常,否则判断患者为房颤;继续回溯到FS的右支,当FS大于0,则判断患者为房颤;继续回溯到A峰的右支,当A大于0,则考虑TNB,当TNB小于等于0时,则判断患者为正常,否则考虑FDMB当FDMB大于0,则判断患者为正常,否则考虑E值,当E大于72时,则判断患者为房颤,否则考虑MCHC值,当MCHC 小于等于338,则判断患者为房颤,否则为正常,以此类推,遍历整棵决策树。这个模型的准确性为85.0649%。

通过上面不同的实验,综合考虑决策树、准确率,本发明将选取图8作为最终模型。该模型考虑因素多,较为全面。对于医学工作者则更加简洁大方。该模型也得到医学方面的认可。

本发明针对医学界对于没有统一规范的模型用于预测房颤以及高血压患者比普通人患有房颤概率高的问题,参考了医学上对房颤预测的综述,提出了基于决策树的房颤预测方法来解决这个问题。通过该方法建立一颗直观简洁的决策树供医学研究参考。该模型结合大量真实的医学数据,尽可能全面的保证该模型的准确性,该模型准确性为85.0649%。模型建立过程中不仅可以挖掘出高血压患者各医学指标之间的潜在关系,而且可以挖掘出哪项指标更可能引起房颤,以及有些指标在医学中一开始并未深度关注的。在接下的工作中,第一点将会加大数据量,使模型更具有泛化能力,防止过拟合。第二点,用机器学习的算法做大更好的分类,建立一颗实用、规范的决策树。

实施例3:

本发明为了解决选择更为准确反映心房颤动的指标的问题,构建一种心房颤动人工智能实验选择指标的方法:

S1.构建决策树;

S2.调整参数以优化决策树;

S3.对各种参数可能的取值均进行实验,最后选取最优实验结果,该结果作为决策树预测的主要指标。

进一步的,所述的主要指标是心脏超声的属性中的A峰、ef和lasd三个属性。

进一步的,所述的主要指标是XGN(心功能等级)、A峰(心脏超声指标)、FS(风湿性心脏瓣膜病)、FJB(间质性肺疾病)、LVPWD(心脏超声指标)、EF(心脏超声指标)、FDMB1(肺动脉瓣血流速度)、FDMB(肺动脉瓣)、LAD(心脏超声指标)、GXB(冠心病)、TNB(糖尿病)、 MCHC(血红蛋白浓度)、E峰(心脏超声指标)。

其构建决策树的方法如实施例1、2所述。

本发明还涉及一种预测决策树在房颤预测中的应用。

本发明通过人工智能及大数据处理,对房颤预测指标作出了更为合理的选择,该指标是经过大数据处理以得到的能够更为准确反映房颤的指标,使用这些指标评估房颤能降低对房颤对漏检,本发明还给出了能用于房颤预测的决策树的构建方法,完整的阐述了该决策树的建立过程,使得在房颤预测领域,能够建立一个标准的以数学方法构建决策树的模型,并给出了决策树对于用于确定影响房颤的一些重要参考指标,具有重要指导意义。

实施例4:

心房颤动(atrial fibrillation,AF,简称房颤),是临床上最常见的心律失常之一,在总体人群中的患病率约为0.4%-1.0%,并且患病率随年龄的增加而增加,研究显示,<55 岁人群患病率仅为0.1%,而>80岁人群患病率高达9%。房颤常见的临床并发症为体循环血栓栓塞,脑卒中是房颤引起的主要栓塞性事件,同时也是房颤患者致残率最高的并发症,房颤患者与非房颤患者比较,脑卒中发生率增加5倍,病死率增加2倍,缺血性脑卒中是病死率增加的主要原因,而房颤是发生缺血性脑卒中的独立危险因素,其发病率随年龄增加而增加。房颤其他危害包括:心房辅助泵功能的丧失等原因导致心衰、电紊乱导致猝死、不规则及快心室率等导致身心障碍。

精准的预测房颤发生并应用有效的预防手段是房颤治疗过程中的重要一环。目前,房颤的诊断,主要基于心电图及心电图的延伸如动态心电图、监护心电图及植入长程心电图。近年将心电图技术与人工智能融合也取得了较大成就,但基于传统100余年的心电图技术诊断房颤准确率较高,但漏诊率也高,特别对发作不频繁的阵发性房颤及无症状性房颤,而其危害并不逊于有症状的房颤。本技术基于临床大数据结合人工智能(AI)开发新的房颤诊断系统,以期取代传统的心电图诊断技术,至少作为心电图检查前房颤高危患者的筛查诊断系统,作为经典心电图检查的重要补充。

方法与技术:本研究利用申请人附属医院-大连大学附属中山医院的信息集成平台,对高血压病患者临床、影像、检验等所有资料进行分析,通过大数据处理手段,如实施例3 中所述的决策树手段,制作自动智能诊断模型,如决策树模型,在此基础上,利用该模型对高血压病患者合并房颤进行诊断分析,进一步利用AI系统深度学习的手段对该模型进行进一步修正和不断改进,最终开发出完善的房颤人工智能诊断系统。本发明将临床大数据与 AI紧密结合,通过大数据处理和AI自我学习,必定能为预测AF发生开辟新的突破口,对于房颤防治策略提供重要的诊断手段。

AI模型制作:利用申请人附属医院-大连大学附属中山医院的信息集成平台,对2010 年1月-2017年12月在我院注册登记的高血压病患者临床资料(病史、体格检查、理化检查等)进行大数据处理,建立初级诊断模型。

AI模型验证:利用初级AI模型,将在我院住院诊断高血压病患者的相关参数资料输入计算机,检验该AI模型的诊断能力(包括预测灵敏度、特异度、符合率及预测效能)

AI模型完善:通过AI自我深度学习的能力,不断修正和完善该模型,逐步发展、完善。

以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:远程临床会诊平台系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!