面向多种心电信号存储的xml文档标准化方法及系统

文档序号:1798810 发布日期:2021-11-05 浏览:24次 >En<

阅读说明:本技术 面向多种心电信号存储的xml文档标准化方法及系统 (XML document standardization method and system for multiple electrocardiosignal storage ) 是由 王志远 徐占飞 孙庆华 王聪 于 2021-08-16 设计创作,主要内容包括:本发明公开了面向多种心电信号存储的XML文档标准化方法及系统,获取多种待标准化的原始心电信号;对每一种待标准化的原始心电信号进行信息抽取;对抽取的信息进行检验,得到检验编码;对抽取的信息进行数据标准化处理;设计目标XML文档数据结构;将检验编码与数据标准化处理后的信息,填充到目标XML文档数据结构中,得到标准化的心电信号XML文档。标准化处理后的XML文档拥有统一且简单的数据结构和统一的数据格式,比较的适用于读取分析。(The invention discloses an XML document standardization method and system for various electrocardiosignal storage, which are used for acquiring various original electrocardiosignals to be standardized; extracting information of each original electrocardiosignal to be standardized; checking the extracted information to obtain a check code; carrying out data standardization processing on the extracted information; designing a target XML document data structure; and filling the information after the check coding and data standardization processing into a target XML document data structure to obtain a standardized electrocardiosignal XML document. The standardized XML document has a uniform and simple data structure and a uniform data format, and is suitable for reading and analyzing.)

面向多种心电信号存储的XML文档标准化方法及系统

技术领域

本发明涉及标准化和信息技术领域,特别是涉及面向多种心电信号存储的XML文档标准化方法及系统。

背景技术

本部分的陈述仅仅是提到了与本发明相关的

背景技术

,并不必然构成现有技术。

近几年,利用常规12导联心电数据生成的心电动力学图已经成为心肌缺血检测的一种手段,为了进一步研究心电动力学图,需要从医院获取大量心电数据,这些数据由XML文档存储。而这些XML档是由多种厂家的心电图机生成的,分别使用不同的XML文档数据结构存储数据,并且包含的信息也不尽相同,不能按照统一的方式读取。另外,原始心电信号XML文档包含一些额外的信息,存储和传输这些数据时需要付出额外的代价。

因此,需要一种标准化处理方法,将原始心电信号XML文档进行处理,包括:用统一的XML文档数据结构存储数据,避免存储无效数据,标记有误的原始心电信号XML文档,统一数据格式等。以此提高心电数据的规范性,同时减少其存储消耗。

发明内容

为了解决现有技术的不足,本发明提供了面向多种心电信号存储的XML文档标准化方法及系统;目的是多种心电图机生成的心电信号XML文档进行标准化处理,生成标准化的心电信号XML文档,便于后续分析。

第一方面,本发明提供了面向多种心电信号存储的XML文档标准化方法;

面向多种心电信号存储的XML文档标准化方法,包括:

获取多种待标准化的原始心电信号;对每一种待标准化的原始心电信号进行信息抽取;

对抽取的信息进行检验,得到检验编码;

对抽取的信息进行数据标准化处理;

设计目标XML文档数据结构;

将检验编码与数据标准化处理后的信息,填充到目标XML文档数据结构中,得到标准化的心电信号XML文档。

第二方面,本发明提供了面向多种心电信号存储的XML文档标准化系统;

面向多种心电信号存储的XML文档标准化系统,包括:

获取模块,其被配置为:获取多种待标准化的原始心电信号;对每一种待标准化的原始心电信号进行信息抽取;

检验模块,其被配置为:对抽取的信息进行检验,得到检验编码;

标准化处理模块,其被配置为:对抽取的信息进行数据标准化处理;

结构设计模块,其被配置为:设计目标XML文档数据结构;

填充模块,其被配置为:将检验编码与数据标准化处理后的信息,填充到目标XML文档数据结构中,得到标准化的心电信号XML文档。

第三方面,本发明还提供了一种电子设备,包括:

存储器,用于非暂时性存储计算机可读指令;以及

处理器,用于运行所述计算机可读指令,

其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。

第四方面,本发明还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。

与现有技术相比,本发明的有益效果是:

1)标准化处理后的XML文档拥有统一且简单的数据结构和统一的数据格式,比较的适用于读取分析;

2)标准化后的XML文档只保留有效信息,减少了存储消耗,比较的便于传输和存储;

3)可以用编程语言实现自动化处理,处理速度较快。

本发明附加方面的优点将在下面的描述中部分给出,或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

图1为本发明实施例一的面向多种心电信号XML文档的标准化方法的流程图;

图2(a)~图2(d)为本发明实施例一的采取策略的合并效果展示;

图3为本发明实施例一的设计的XML文档数据结构图;

图4为本发明实施例一的XML Schema文档编写内容。

具体实施方式

应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

术语解释:XML(可扩展标记语言(eXtensible Markup Language))

实施例一

本实施例提供了面向多种心电信号存储的XML文档标准化方法;

如图1所示,面向多种心电信号存储的XML文档标准化方法,包括:

S101:获取多种待标准化的原始心电信号;对每一种待标准化的原始心电信号进行信息抽取;

S102:对抽取的信息进行检验,得到检验编码;

S103:对抽取的信息进行数据标准化处理;

S104:设计目标XML文档数据结构;

S105:将检验编码与数据标准化处理后的信息,填充到目标XML文档数据结构中,得到标准化的心电信号XML文档。

进一步地,所述S101:获取多种待标准化的原始心电信号;具体包括:

获取不同厂家心电图仪器采集的原始心电信号XML文档。

进一步地,所述S101:对每一种待标准化的原始心电信号进行信息抽取;具体包括:

抽取患者基本信息、心电信号基本信息、导联数据和其他信息;

所述患者基本信息,包括:患者ID、姓名、性别、年龄和心电信号自动诊断;

所述心电信号基本信息,包括:心电信号创建时间、采样时间、采集时长、分辨率、描述时间的单位和描述电位的单位;

导联数据,包括:12导联采样点数值;

其他信息,包括:测量科室和数据来源。

示例性的,所述S101:从医院获取的心电信号XML文档主要有三种,分别由迈瑞的R12、纳龙RAGE-12和理邦SE-12心电图机生成。其中迈瑞R12和理邦SE-12心电图机生成的心电信号XML文档,患者基本信息和导联数据同时存储在一份XML文档中,纳龙RAGE-12生成的心电信号XML文档患者基本信息和导联数据分别存储在一份XML文档中,即一份心电图由2份XML分档存储。

阅读各种XML文档,确定每种文档包含的信息,根据需要选择抽取的信息,分为患者基本信息、心电图基本信息、导联数据和其他信息。其中,患者基本信息包括:患者ID、姓名、性别、年龄和心电图自动诊断;心电图基本信息包括:心电图创建时间、采样时间、采集时长、分辨率、描述时间的单位和描述电位的单位;导联数据:常规12导联的采样点数值;其他信息:测量科室和数据来源。

将原始心电信号XML文档存入指定磁盘路径,依次读取,根据不同心电图机生成的心电信号XML文档的固有格式自动识别并选择对应读取方式读取相应的信息。

进一步地,所述S102:对抽取的信息进行检验,得到检验编码;具体包括:

检验患者ID的格式是否正确和各个导联的采样点个数是否正确;

检验完成,根据错误类型生成检验编码;

所述检验编码,包括:00、01、10和11;

其中,“00”表示检验通过,“01”表示患者ID格式错误,“10”表示12导联数据长度错误,“11”表示患者ID格式错误与12导联数据长度错误同时发生。

进一步地,所述S103:对抽取的信息进行数据标准化处理;具体包括:

缺失信息补充、数据格式统一和心电信号时长统一。

进一步地,所述缺失信息补充,是指将缺失的年龄信息设置为默认值0。

进一步地,所述数据格式统一,是指:将不同分辨率的心电数据转换为统一的分辨率。

进一步地,心电信号时长统一,是指将两个或多个原始心电信号合并到一个XML文档。

进一步地,所述将两个原始心电信号合并到一个XML文档中,具体包括:

以V4导联为依据,将T波终点到紧邻的后向P波起点之间的段称为T-P段;

(1)从两个原始心电信号合并处向前、向后分别计算两个邻近T-P段;

(2)分别计算两个邻近T-P段的点的个数m和n,取平均值

(3)由合并处之前的最近T波终点向后取点,取点个数为得到数列A;

由合并处之后的最近P波起点向前取点,取点个数为得到数列B;

对B数列倒序,得到数列C,将A数列和C数列对应位置取平均值,得到数列D。数列A、B、C、D的长度均为使用数列D代替合并处之前的最近T波终点到合并处之后最近P波起点之间的采样点的数值。

应理解的,标准化后的XML文档记录的心电信号需要满足一定的时长需求,可能受心电图机功能限制,需要连续采集2次或多次心电信号生成2个或多个XML文档。

示例性的,所述S103:对抽取的信息进行标准化处理;

抽取的信息中,年龄、采集时长及对应时长的常规12导联数据和分辨率信息在3种心电信号XML文档中存储时存在差异,如表1所示。

表1

年龄信息 采集时长 电压分辨率
迈瑞R12 10s 1uV
理邦SE-12 20s 2.52uV
纳龙RAGE-12 20s 1uV

标准化处理如下:

年龄信息存在缺失时,标准化处理为缺失时将年龄设置为默认值0。

其中迈瑞R12心电图机生成的XML文档只保存了10s的心电图数据,使用该心电图机测量时会连续测量两次,所以需将连续测量的心电图数据对应的XML文档合并处理,标准化处理为采取一定策略将第二份XML文档存储的12导联数据分别合并于第一份XML文档存储的12导联数据之后,并修改采集时长。

合并策略是:合并策略是:以V4导联为依据,下面将T波终点到紧邻的后向P波起点之间的段称为T-P段。第一,从心电信号合并处向前向后分别计算2个邻近T-P段;第二,分别计算各个T-P段的点的个数,取平均值;第三,由合并处之前的最近T波终点向后取点,合并处之后的最近P波起点向前取点,取点个数为第二步中计算的平均值,对取出的点的对应的两个值取平均值,代替合并处之前的最近T波终点到合并处之后最近P波起点之间的采样点。示例如图2(a)~图2(d)(以V4导联为例)所示。

3种心电图机测量心电数据时,分辨率不同,标准化处理为在可接受的误差范围内,将分辨率统一变换为1uV,然后根据转换后的分辨率重新计算12导联数据,即采样点数值。

进一步地,所述S104:设计目标XML文档数据结构;具体包括:

根据需要存储的信息,设计出目标XML文档数据结构,使用XML Schema文档加以描述。

目标XML文档数据结构,包括:患者基本信息、心电图基本信息、导联数据和其他信息;

所述患者基本信息,包括:患者ID、姓名、性别、年龄和心电图自动诊断;

所述心电图基本信息,包括:心电图创建时间、采样时间、采集时长、分辨率、描述时间的单位和描述电位的单位;

所述导联数据,包括:转换分辨率后12导联的采样点数值;

所述其他信息,包括:检验编码、测量科室和数据来源。

设计了如图3所示的XML文档数据结构,并由XML编辑器(Oxygen XML Editor23.1)编写XML Schema文档加以描述,如图4。

进一步地,所述S105:将检验编码与数据标准化处理后的信息,填充到目标XML文档数据结构中,得到标准化的心电信号XML文档;具体包括:

将检验编码与数据标准化处理后的信息,对应存储于XML文档的标签中,并由XMLSchema文档验证通过后,保存文档。所述验证包括:元素的顺序,元素之间以及元素和属性之间的关系,元素和属性的数据格式及二者的值是否满足约束。

使用XML编辑器(Oxygen XML Editor 23.1)由XML Schema文档生成空XML文档。读取空XML文档,将信息对应存储于XML文档的标签中,生成新的标准化后的心电信号XML文档,由XML Schema文档验证通过后,保存文档。验证时,使用XML Schema文档验证标准化后心电信号XML文档。

应理解的,标准化后的心电信号XML文档具有简单规范的数据结构,比较小的体积,比较高的安全性和统一的数据格式,便于读取、存储和传输。

实施例二

本实施例提供了面向多种心电信号存储的XML文档标准化系统;

面向多种心电信号存储的XML文档标准化系统,包括:

获取模块,其被配置为:获取多种待标准化的原始心电信号;对每一种待标准化的原始心电信号进行信息抽取;

检验模块,其被配置为:对抽取的信息进行检验,得到检验编码;

标准化处理模块,其被配置为:对抽取的信息进行数据标准化处理;

结构设计模块,其被配置为:设计目标XML文档数据结构;

填充模块,其被配置为:将检验编码与数据标准化处理后的信息,填充到目标XML文档数据结构中,得到标准化的心电信号XML文档。

此处需要说明的是,上述获取模块、检验模块、标准化处理模块、结构设计模块和填充模块对应于实施例一中的步骤S101至S105,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。

所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。

实施例三

本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。

应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。

在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。

实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。

本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

实施例四

本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:图神经网络的预训练方法、训练方法、装置、设备及介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!