在表征生理系统时配置和使用神经网络的方法和系统

文档序号:157371 发布日期:2021-10-26 浏览:17次 >En<

阅读说明:本技术 在表征生理系统时配置和使用神经网络的方法和系统 (Method and system for configuring and using neural networks in characterizing physiological systems ) 是由 A·库索斯 T·W·F·伯顿 H·吉林斯 S·拉姆昌达尼 W·桑德斯 I·沙德弗斯 于 2019-12-23 设计创作,主要内容包括:例示方法和系统有助于通过生物物理信号数据集配置和训练神经网络或其全部(例如深度神经网络、卷积神经网络(CNN)等)或其全部,用于对受试者中疾病或病理的存在或不存在进行确定地估计并对疾病或病理进行评估和/或分类,包括例如对受试者中此类疾病或病理的严重性进行评估和/或分类。在心脏的环境下,本文描述的方法和系统有助于通过心脏信号数据集配置和训练神经网络或其全部,以对冠状动脉疾病的存在或不存在或冠状动脉病理进行确定的估计。(The example methods and systems facilitate configuration and training of a neural network, or all thereof (e.g., a deep neural network, a Convolutional Neural Network (CNN), etc.), or all thereof, through a biophysical signal dataset for deterministically estimating and assessing and/or classifying the presence or absence of a disease or pathology in a subject, including, for example, assessing and/or classifying the severity of such disease or pathology in a subject. In the context of the heart, the methods and systems described herein facilitate the configuration and training of neural networks, or all thereof, from cardiac signal datasets to make a deterministic estimate of the presence or absence of coronary artery disease or coronary artery pathology.)

在表征生理系统时配置和使用神经网络的方法和系统

相关申请的交叉引用

本PCT国际申请要求于2018年12月26日提交的、发明名称为“Method and Systemto Configure and Use Convolutional Neural Network to Assess Medical Disease”的美国专利临时申请第62/784,925号以及于2019年9月27日提交的发明名称为“Methodsand Systems to Configure and Use Convolutional Neural Networks inCharacterizing Physiological Systems”的美国专利临时申请第62/907,141号的优先权和权益,所述申请的每一个通过引用整体并入于此。

技术领域

本公开大体涉及用于表征心血管和其他生理系统的非侵入性方法和系统。更具体地,在一个方面,本公开涉及利用相空间数据、根据采集的生物物理信号(例如,心脏信号、脑/神经学信号、与其他生物系统相关联的信号等)生成相空间分析数据集/图像的非侵入性方法,特别是用于预测和定位心肌层的冠状动脉狭窄并表征心肌缺血,以及其他心脏和非心脏疾病和病理。

背景技术

缺血性心脏病(也称为心脏缺血或心肌缺血)是以通常由冠状动脉疾病(CAD)引起的心肌供血减少为特点的一种疾病或一组疾病。CAD通常发生在为心肌层或心肌供血的冠状动脉内壁发生动脉粥样硬化时(内壁硬化或变硬以及斑块在其中积聚,通常伴有异常炎症)。随着时间的推移,CAD还会使心肌削弱并导致例如心绞痛、心肌梗塞(心脏骤停)、心力衰竭和心律失常。心律失常是一种异常的心律,其可以包括心脏电传导序正顺序的任何变化,在某些情况下会导致心脏骤停。

CAD的评价可能是复杂的,并且使用许多技术和工具来评估病症的存在和严重性。在心电图(即,其中分析心脏的电活动以获得有关其结构和功能的信息心脏病学领域)的情况下,严重的缺血性心脏病可以改变在冠状动脉下游的灌注床中心肌的心室传导特性变窄或阻滞。这种病理学可以在心脏的不同位置以不同的严重程度表现出来,这使得准确诊断变得具有挑战性。此外,心肌的导电特性可能因人而异,其他因素(例如与测量探头的放置相关的测量的变异性以及与此类探头及其相关组件相关的寄生损耗)也会影响在心脏的电生理检查期间捕获的生物物理信号。此外,当心肌的传导特性被捕获为相对较长的心脏相位梯度信号时,它们可能表现出复杂的非线性变异性,而传统建模技术无法有效地捕获这些变异性。

机器学习技术根据输入数据的集合来预测结果。例如,机器学习技术被用于识别模式和图像、补充医疗诊断等。机器学习技术依赖于使用训练数据集(即观察的数据集,在每次观察中要预测的结果是已知的)生成的一组特征,每个特征代表观察带的数据的一些可测量方面,以生成和调整一个或多个预测模型。例如,可以分析观察到的信号(例如,来自多个受试者的心跳信号)以收集关于这些信号的频率、平均值和其他统计信息。机器学习技术可以使用这些特征来生成和调整将这些特征与一个或多个病症(例如某种形式的心血管疾病(CVD),包括冠状动脉疾病(CAD))相关联的模型,然后将该模型应用于结果未知的数据源,例如未诊断的患者或未来的模式等。

传统上,在心血管疾病的背景下,这些特征是从传统的心电图中手动选择的并由与领域专家合作的数据科学家进行组合。

发明内容

本文描述的例示方法和系统有助于通过相位梯度生物物理信号数据集(例如,宽带相位梯度生物物理信号数据集)对神经网络(例如,深度神经网络、卷积神经网络(CNN)等)或其全部进行配置和训练,以对受试者的疾病进行评估和/或分类。在心脏的背景下,本文描述的方法和系统有助于通过相位梯度心脏信号数据集(例如,宽带相位梯度心脏信号数据集)对神经网络(例如,深度神经网络、卷积神经网络(CNN))或其全部进行配置和训练,以对受试者的冠状动脉疾病进行评估和/或分类。值得注意的是,该实施例中的例示系统已显示具有如下诊断能力:使用在每搏基础(在此也称为“逐搏”)上测量人的相位梯度生物物理信号的完全非侵入性方法来评估AUC分数为0.61或更高的患者的整体冠状动脉疾病。在一些实施例中,例示系统还被配置为定位主要冠状动脉(例如,右冠状动脉(RCA)、左前降支(LAD)动脉和/或左回旋支动脉(LCX)等)中冠状动脉疾病的存在。在一些实施例中,例示系统被配置为与冠状动脉疾病评估和定位一起生成和共同呈现相空间分析数据集/图像。尽管在心脏信号的背景下进行了讨论,但本文描述的例示方法和系统有助于通过其他生物物理信号(例如,神经信号、肺等)对神经网络(例如,深度神经网络、卷积神经网络(CNN)等)或其全部进行配置和训练,以对受试者的疾病或受试者的特定解剖结构或器官中的疾病进行评估和/或分类。

如本文所使用地,术语“心脏信号”是指与心血管系统的结构、功能和/或活动相关的一个或多个信号——包括该信号的电/电化学传导的方面——例如引起收缩心肌的。在一些实施例中,心脏信号可以包括心电图信号,例如通过心电图(ECG)或其他形式采集的那些信号。

如本文所使用的,术语“神经信号”是指与中枢和外周神经系统的结构、功能和/或活动相关的一个或多个信号,包括脑、脊髓、神经及其相关神经元和其他结构等,并且包括该信号的电/电化学传导方面。在一些实施例中,神经信号可以包括脑电图信号,例如通过脑电图(EEG)或其他形式采集的那些信号。

术语“生物物理信号”不限于心脏信号、神经学信号或光电容积图信号,而是涵盖可从中获得信息的任何生理信号。不受示例的限制,生物物理信号可以被分为可包括如下的类型或者类别:例如电信号(例如,可以通过以下技术观察、识别和/或量化的某些心脏和神经系统相关信号:诸如测量电压/电势、阻抗、电阻率、电导率、电流等,在各种域、例如时域和/或频域)、磁信号、电磁信号、光学信号(例如可以通过以下技术观察、识别和/或量化的信号:例如反射、干涉、光谱、吸光度、透射率、目视观察、光电容积图等)、声学信号、化学信号、机械信号(例如,与流体流动、压力、运动、振动、位移、应变有关的信号)、热信号和电化学信号(例如,可以与某些分析物(例如葡萄糖)的存在相关联的信号)。在某些情况下,可以在以下生理系统的环境下描述生物物理信号:例如,呼吸系统、循环系统(心血管、肺)、神经、淋巴、内分泌、消化、排泄、肌肉、骨骼、肾/泌尿/排泄、免疫、表皮/外分泌和生殖系统)、器官系统(例如,可能是心脏和肺独有的信号(因为它们一起工作)),或者在组织(例如,肌肉、脂肪、神经、结缔组织、骨骼)、细胞、细胞器、分子(例如,水、蛋白质、脂肪、碳水化合物、气体、自由基、无机离子、矿物质、酸和其他化合物、元素及其亚原子成分)的环境下描述生物物理信号。除非另有说明,否则术语“生物物理信号采集”通常是指从生理系统(例如哺乳动物或非哺乳动物生物体)采集生物物理信号的任何被动或主动方式。被动和主动生物物理信号采集通常是指对身体组织的自然或感应的电、磁、光和/或声学发射量的观察。被动和主动生物物理信号采集手段的非限制性示例包括,例如,以电压/电势、电流、磁、光、和声和其他非主动方式来观察身体组织的自然辐射,并且在一些情况下,诱导这种辐射。被动和主动生物物理信号采集手段的非限制性示例包括例如超声波、无线电波、微波、红外线和/或可见光(例如,用于脉搏血氧测定或光电容积图)、可见光、紫外光等主动方式询问身体组织(不涉及电离能量或辐射(例如X射线))。主动生物物理信号采集可能涉及激发-发射光谱(包括例如激发-发射荧光)。主动生物物理信号采集还可涉及将电离能量或辐射(例如,X射线)(也称为“电离生物物理信号”)传输到身体组织。被动和主动生物物理信号采集手段可以与侵入式程序(例如,通过手术或侵入式放射干预协议)结合执行或可以非侵入性地执行(例如,通过成像)。

如本文所用,“光电容积脉搏波信号”是指从光学传感器采集的信号波形,其对应于氧合和脱氧血红蛋白的光吸收的测量的变化,例如具有红色和红外光谱中的波长的光。在一些实施例中,光电容积脉搏波信号包括通过脉搏血氧计或光电容积脉搏波图(PPG)采集的原始信号。在一些实施例中,光电容积脉搏波信号是从定制的或专用的器械或电路(包括现成的设备)采集的,器械或电路被配置为采集这样的信号波形以用于诊断疾病或异常病症的目的。光电容积脉搏波信号通常包括红色光电容积脉搏波信号(例如,可见光谱中主要具有大约625至740纳米波长的电磁信号)和红外光电容积脉搏波信号(例如,从可见光谱的标称红色边缘延伸高达约1毫米的电磁信号),但根据所采用的PPG的类型和/或模式,也可以以不同的组合使用其他光谱(如近红外、蓝色和绿色)。

在本文的各种实施例中描述的方法和系统不限于此并且可以在另一个生理系统或活体的系统、器官、组织、细胞等的任何环境下使用。仅作为示例,可用于心血管环境的两种生物物理信号类型包括可通过常规心电图(ECG/EKG)设备采集的心脏信号、可从其他设备(例如在此描述的那些设备)采集的双极宽带生物电势(心脏)信号,以及可以通过各种容积描述技术例如光电容积图(photoplethysmography)采集的信号。

在本公开的上下文中,描述了用于采集和分析生物物理信号的技术,特别是用于诊断心血管(或心脏)系统中的、与心血管(或心脏)系统相关的、或影响该心血管(或心脏)系统的某些疾病状态或病症的存在、不存在、定位(在适用的情况下)和/或严重性,包括例如肺动脉高压(PH)、冠状动脉疾病(CAD)和心力衰竭(例如,左侧或右侧心力衰竭)。

肺动脉高压、心力衰竭和冠状动脉疾病是与心血管或心脏系统相关的三种疾病/病症。肺动脉高压(PH)通常是指肺的动脉中的高血压,其可包括一系列病症。PH通常具有复杂且多因素的病因并且具有不同严重程度的隐匿性临床发作。PH可能会发展出并发症,例如右心衰竭,并且在许多情况下是致命的。世界卫生组织(WHO)将PH分为五组或5个类型。WHO分类的第一PH组是肺动脉高血压(PAH)。PAH是一种目前无法治愈的慢性疾病,尤其是,它会导致肺动脉壁收紧和变硬。PAH至少需要心脏导管插入术进行诊断。PAH的特征是肺动脉血管病变,在心导管术中定义为平均肺动脉压为25mmHg或更高。一种形式的肺动脉高血压被称为特发性肺动脉高血压——没有明确原因下发生的PAH。此外,PAH的亚类包括遗传性PAH、药物和毒素诱导的PAH,以及与其他全身性疾病(例如结缔组织病、HIV感染、门静脉高压症和先天性心脏病)相关的PAH。PAH包括导致肺血管结构变窄的所有原因。对于PAH,肺动脉床逐渐变窄是由于血管活性介质(包括前列环素、一氧化氮和内皮素-1)失衡所致。这会导致右心室后负荷增加、右心衰竭和过早死亡。WHO分类的第二PH组是左心疾病引起的肺动脉高压。这组疾病通常以心脏左侧的问题为特征。随着时间的推移,这些问题会导致肺动脉发生变化。特定的子组包括左心室收缩功能障碍、左心室舒张功能障碍、瓣膜疾病,最后是非瓣膜疾病引起的先天性心肌病和梗阻。第二PH组的治疗往往侧重于潜在问题(例如,更换心脏瓣膜的手术、各种药物等)。WHO分类的第三PH组庞大而多样,通常与肺部疾病或缺氧有关。子组包括慢性阻塞性肺病、间质性肺病、睡眠呼吸障碍、肺泡低通气障碍、慢性高海拔暴露和发育性肺病。第四PH组被WHO归类为慢性血栓栓塞性肺动脉高压,其血凝块进入或在肺部形成时引起,阻塞血液通过肺动脉的流动。第五组PH组被WHO归类为包括导致PH的罕见病,例如血液系统疾病、系统性疾病(例如累及肺部的结节病)、代谢紊乱和其他疾病的子亚组。对这第五组中PH的机制知之甚少。

所有形式的PH在常规体检中都很难诊断,因为PH最常见的症状(气短、疲劳、胸痛、水肿、心悸、头晕)与许多其他病症有关。血液测试、胸部X光测试、心电图和超声心动图、肺功能测试、运动耐量测试和核扫描都被广泛用于帮助医生诊断特定形式的PH。如上所述,诊断PH,尤其是PAH的“黄金标准”是通过直接测量肺动脉的压力而对心脏右侧进行心脏导管插入术。如果怀疑受试者患有PAH,可以进行多项调查中的一项以确认病症,例如心电图、胸片和肺功能测试等。通常可以看到心电图显示右心劳损和胸片显示明显肺动脉或心脏肥大的证据。然而,正常的心电图和胸片不能排除PAH的诊断。可能需要进一步的测试来确认诊断并确定病因和严重程度。例如,可以进行血液测试、运动测试和过夜血氧测定测试。此外,还可以执行成像测试。成像测试示例包括同位素灌注肺扫描、高分辨率计算机断层扫描、计算机断层扫描肺血管造影和磁共振肺血管造影。如果这些(可能还有其他)非侵入性检查支持PAH的诊断,通常需要右心导管插入术通过直接测量肺压来确认诊断。它还允许使用肺动脉楔压测量心输出量和估计左心房压力。虽然存在非侵入性技术来确定受试者中是否存在PAH,但除非进行侵入性右心导管插入术,否则这些技术不能可靠地确认PAH的诊断。共同拥有的美国专利申请第16/429,593号中公开了用于评估PH的方法和系统的方面和实施例,该申请的全部内容通过引用并入本文。

仅在美国,心力衰竭就影响了近600万人,每年有超过870,000人被诊断为心力衰竭。术语“心力衰竭”(有时称为充血性心力衰竭或CHF)通常是指一种慢性、渐进性病症或过程,其中心肌无法泵出足够的血液来满足身体的需要,要么是因为心脏肌肉变弱或僵硬,或者因为存在妨碍正常循环的缺陷。这会导致例如血液和液体回流到肺部、水肿、疲劳、头晕、昏厥、心跳加快和/或不规则、干咳、恶心和呼吸急促。心力衰竭的常见原因是冠状动脉疾病(CAD)、高血压、心肌病、心律失常、肾脏疾病、心脏缺陷、肥胖、吸烟和糖尿病。舒张性心力衰竭(DHF)、左或左侧心力衰竭/疾病(也称为左心室心力衰竭)、右或右侧心力衰竭/疾病(也称为右心室心力衰竭)和收缩期心力衰竭(SHF)是常见的心力衰竭类型。

左侧心力衰竭进一步分为两种主要类型:收缩性衰竭(或射血分数降低或左心室功能降低的心力衰竭)和舒张衰竭/功能障碍(或射血分数保留或左心室功能保留的心力衰竭)。通常用于确定患者是否患有左侧心力衰竭的程序和技术包括心导管插入术、X射线、超声心动图、心电图(EKG)、电生理学研究、放射性核苷酸成像和各种跑步机测试,包括测量峰值VO2的测试。射血分数(EF)是一种测量值,其表示为每次收缩时心室泵出的血液量的百分比(在左侧心力衰竭的情况下为左心室),其最常通过无创方式经由超声心动图获得。正常的左心室射血分数(LVEF)范围从约55%到约70%。

当发生收缩衰竭时,左心室不能有力地收缩以保持全身血液正常循环,从而剥夺了身体的正常血液供应。随着左心室更用力地泵送用于补偿,它变得越来越弱和薄。结果,血液向后流入器官,导致肺部积液和/或身体其他部位肿胀。超声心动图、磁共振成像和核医学扫描(例如,多门控采集)是用于非侵入性测量射血分数(EF)的技术,射血分数表示为左心室泵血体积相对于其填充体积的百分比,以帮助用于诊断收缩衰竭。特别是,低于55%的左心室射血分数(LVEF)值表明心脏的泵血能力低于正常值,在严重的情况下可以测量到低于约35%。一般来说,当这些LVEF值低于正常值时,可以做出或有助于诊断收缩衰竭。

当发生舒张性心力衰竭发生时,左心室变得僵硬或变厚,从而失去其正常放松的能力,这又意味着心脏的左下腔不能适当地充血。这减少了泵出到身体的血液量。随着时间的推移,这会导致血液在左心房内积聚,然后在肺部积聚,从而导致液体堵塞和心力衰竭症状。在这种情况下,LVEF值倾向于保持在正常范围内。因此,其他测试(例如侵入性导管插入术)可用于测量左心室舒张末压(LVEDP),以帮助诊断舒张性心力衰竭以及其他形式的具有正常EF的心力衰竭。通常,LVEDP通过在左心室中放置导管而直接测量或通过在肺动脉中放置导管测量肺毛细血管楔压来间接测量。这种导管插入技术,就其性质而言,增加了患者感染和其他并发症的风险并且往往是昂贵的。因此,用于在诊断舒张性心力衰竭以及无数其他形式的具有正常EF的心力衰竭的存在或不存在和/或严重性时确定或估计LVEDP的非侵入性方法和系统是合乎需要的。此外,用于诊断舒张性心力衰竭以及无数其他形式的具有正常EF的心力衰竭的存在或不存在和/或严重性的非侵入性方法和系统(不一定包括异常LVEDP的确定或估计)是合乎需要的。本公开的实施例解决了所有这些需要。

右侧心力衰竭通常由于左侧心力衰竭而发生,此时虚弱的和/或僵硬的左心室失去将血液有效地泵送到身体其他部位的能力。结果,液体被迫通过肺部回流,削弱了心脏的右侧,导致右侧心力衰竭。这种回流在静脉中倒退,导致腿部、脚踝、胃肠道和肝脏中的液体膨胀。在其他情况下,某些肺部疾病(例如慢性阻塞性肺病和肺纤维化)会导致右侧心力衰竭,即使左侧的心脏功能是正常的。通常用于确定患者是否患有左侧心力衰竭的程序和技术包括血液检查、心脏CT扫描、心导管插入术、X射线、冠状动脉造影、超声心动图、心电图(EKG)、心肌活检、肺功能研究和各种形式的压力测试,例如跑步机测试。

肺动脉高压与心力衰竭密切相关。如上所述,PAH(第一WHO PH分组)可导致右心室后负荷增加、右心衰竭和过早死亡。由左心力衰竭引起的PH(第二WHO PH组)被认为是PH的最常见原因。

缺血性心脏病(也称为心脏缺血或心肌缺血)以及相关的病症或病理也可以用本文公开的技术来估计或诊断。缺血性心脏病是一种疾病或一组疾病,其特征是心肌供血减少,通常由冠状动脉疾病(CAD)引起。CAD与心力衰竭密切相关,是其最常见的原因。CAD通常发生在为心肌或心脏肌肉供血的冠状动脉内壁发生动脉粥样硬化时(内壁硬化或变硬以及斑块在其中积聚,通常伴有异常炎症)。随着时间的推移,CAD还会削弱心脏肌肉并导致例如心绞痛、心肌梗塞(心脏骤停)、心力衰竭和心律失常。心律失常是一种异常的心律,可能包括心脏电传导正常顺序的任何变化,在某些情况下会导致心脏骤停。PH、心力衰竭、CAD和其他疾病和/或状况的评价可能很复杂,并且使用许多侵入性技术和工具来评估上述状况的存在和严重程度。此外,这些疾病和/或病症的症状之间的共性以及呼吸系统和心血管系统之间的基本联系——由于它们共同作用来为身体的细胞和组织供氧——表明了可用于改进此类疾病和/或病症的检测和最终治疗的一个复杂的生理相互关联性。在这种情况下,评估这些生物物理信号的传统方法在为医疗保健提供者提供用于准确检测/诊断此类疾病和病症的存在或不存在的工具方面仍然存在重大挑战。

例如,在心电图术——其中分析心脏的电活动以获得关于其结构和功能的信息的心脏病学领域——已经观察到显著的缺血性心脏病可以改变冠状动脉下游灌注床心肌的心室传导特性,使其变窄或闭塞,病理可以在心脏的不同位置并且在不同的严重程度阶段表现出来,从而使准确诊断具有挑战性。此外,心肌的导电特性可能因人而异,其他因素(例如与测量探头的放置相关的测量变异性以及与此类探头及其相关组件相关的寄生损耗)也会影响在心脏电生理检查期间捕获的生物物理信号。此外,当心肌的传导特性被捕获为相对较长的心脏相位梯度信号时,它们可能表现出复杂的非线性变异性,而传统建模技术无法有效地捕获这些变异性。

在一个方面,公开了一种方法(例如,使用相位梯度生物物理信号数据集(例如,宽带相位梯度生物物理信号数据集、相位梯度心脏信号数据集、宽带相位梯度心脏信号数据集)来促进神经网络(例如,深度神经网络、卷积神经网络(CNN)等)或其全部的配置和训练,以评估受试者中的冠状动脉疾病和/或对其进行分类)。该方法包括:通过处理器接收从一个或多个传感器的一个或多个通道采集的受试者的生物物理信号数据集;以及对所述生物物理信号数据集进行预处理以生成一个或多个经预处理的数据集,其中每个经预处理的数据集包括单个孤立的完整心动周期(其中来自每个采集通道的预处理数据集是相位同步/对齐的);以及由所述处理器通过将经预处理的数据集直接输入到一个或多个神经网络(一个或多个深度神经网络,一个或多个卷积神经网络等)或其全部来确定指示心脏病或病症(例如冠状动脉疾病、肺动脉高压、肺动脉高血压、左心衰竭、右心衰竭和左心室舒张末压异常(LVEDP))存在或不存在的值(例如风险/可能性、二进制指示),所述深度神经网络是使用从如下患者处采集的一组训练生物物理信号数据集而训练的:该患者被诊断患有心脏病或病症并且被标记有心脏病或病症的存在或不存在(例如,其中基于冠状动脉中疾病位置的Gensini分数或二进制值进行所述标记)(例如,其中分段数据集在其他采集通道的相应生物物理信号数据集之间相位对齐),其中,基于指示心脏病或病症存在的所确定的值,经由报告和/或显示器输出一输出数据集(例如,以辅助或用于诊断所述受试者中存在或不存在心脏病或症状)。

在一些实施例中所述心脏病或病症是冠状动脉疾病,并且其中确定指示心脏病或病症存在的值的步骤包括:将所述经预处理的数据集输入(例如直接输入)到一个或多个神经网络的集合(例如,一个或多个深度神经网络的集合,一个或多个卷积神经网络的集合等)或其全部中,所述深度神经网络是使用从被标记有存在或不存在冠状动脉疾病(例如,显著冠状动脉疾病)的诊断的多个患者处采集的一个或多个生物物理信号数据集训练的,(例如用于标记冠状动脉疾病存在的标签包括基于Gensini的分数,该分数被确定为针对在所述心肌层中诊断出的冠状病变的严重性加权分数和位置加权分数的组合)其中所述一个或多个神经网络的输出(例如,深度神经网络的输出,卷积神经网络的输出)或其全部作为输出数据集经由所述报告和/或所述显示器输出。

在一些实施例中,所述生物物理信号数据集是从两个或多个采集通道采集的,并且来自每个所述采集通道的经预处理的数据集是相位同步的。

在一些实施例中,对所述生物物理信号数据集进行预处理的步骤包括:通过所述处理器将与所述一个或多个采集通道中的第一采集通道相关联的生物物理信号数据集的一部分或从该生物物理信号数据集的一部分导出的归一化数据集分割成一个或多个第一分段数据集,其中每个所述第一分段数据集包括单个孤立的完整心动周期(例如用于每博分析)作为第一单个孤立的完整心动周期,其中所述第一单个孤立的完整心动周期具有关联的时间窗口;以及通过所述处理器将与所述一个或多个采集通道中的第二采集通道相关联的生物物理信号数据集的另一部分或从所述生物物理信号数据集的另一部分导出的归一化数据集分割成一个或多个第二分段数据集,其中所述一个或多个第二分段数据集中的每一个包括第二单个孤立的完整心动周期,其中所述第二单个孤立完整心动周期具有与所述第一单个孤立的完整心动周期的时间窗口相对应的关联时间窗口以提供相位同步数据集。

在一些实施例中,用于标记冠状动脉疾病存在的标签包括基于Gensini的分数,该分数被确定为针对在所述心肌层中诊断出的冠状病变的严重性加权分数和位置加权分数的组合。

在一些实施例中,所述基于Gensini的分数被线性化(例如,经由对数运算符)。

在一些实施例中,该方法包括:由所述处理器通过将所述经预处理的数据集或修改版本的所述经预处理的数据集输入(例如直接输入)到一个或多个第二神经网络(例如,一个或多个第二深度神经网络、一个或多个第二卷积神经网络)或其全部来确定指示给定冠状动脉处存在或不存在心脏病或病症的一个或多个位置值,所述第二深度神经网络是使用从多个受试者采集的一个或多个生物物理信号数据集(例如冠状动脉疾病定位阵列)训练的,所述多个患者被标记(二进制标记)为在由如下构成的群组中选择的冠状动脉处存在或不存在冠状动脉疾病的诊断:左主动脉(LMA)、左回旋支近端(Prox LCX)、左回旋支中段(mid LCX)、左回旋支远端(Dist LCX)、LPAV、第一钝缘(OM1)、第二钝缘(OM2)、第三钝缘(OM3)、左前降支近端(Prox LAD)、左前降支中段(Mid LAD)、左前降支远端(Dist LAD)、LADD1、LAD D2、右冠状动脉近端(Prox RCA),右冠状动脉中段(Mid RCA)、右冠状动脉远端(Dist RCA)和右后降支的急性边缘分支(AcM R PDA),其中,所确定的一个或多个位置值作为输出数据集经由所述报告和/或所述显示器输出。

在一些实施例中,所述方法还包括:通过所述处理器,将所述指示心脏疾病或病症存在的值(例如,风险/可能性,二进制指示)与阈值进行比较,其中确定指示给定冠状动脉处存在心脏病或病症的一个或多个位置值的步骤是基于所述比较来执行的(例如,其中指示存在心脏病或病症的值表示存在心脏病或病症的阳性状态)。

在一些实施例中,该方法还包括:通过所述处理器对接收到的生物物理信号数据集或所述经预处理的数据集进行相空间操作,以生成一个或多个相空间数据集/图像;以及通过所述处理器输出一个或多个生成的相空间数据集/图像,其中所述一个或多个生成的相空间数据集/图像与所述输出数据集同时和/或同步地呈现在所述报告和/或所述显示器中。

在一些实施例中,对所述生物物理信号数据集进行预处理以生成一个或多个经预处理的数据集的步骤还包括从由以下各项组成的组中选择的第二预处理操作:执行下采样操作;执行基线漂移去除操作;和执行归一化操作(例如将数据集归一化到0至1之间)。

在一些实施例中,基于超参数搜索循环配置所述一个或多个神经网络(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)中的至少一个或其全部,其中所述超参数搜索循环的实施包括:通过所述处理器生成用于模板神经网络(例如模板深度圣经网络、模板卷积神经网络、其全部的模板等)的多个超参数集合,其中所述多个超参数集合中的每一个是通过随机或伪随机选择从一组候选超参数中生成的,所述候选超参数集合中的至少一个超参数选自由以下参数构成的群组:批尺寸、学习率、卷积层、滤波器大小、第一卷积层中的滤波器数量、后续层中滤波器的增加量、附加密集层的数量、附加密集层的大小、激活函数类型、目标、扩张率和丢弃;针对多个超参数集合中的每一个,通过所述处理器训练所述模板神经网络,其中,在每个评定实例中,所述模板神经网络配置有所述多个超参数集合中的超参数集合;和针对多个超参数集合中的每一个,由所述处理器训练模板神经网络,由所述处理器使用第一确认数据集评定经训练的神经网络(例如,经训练的深度神经网络,经训练的卷积神经网络等)或其全部,其中每个评定生成分数(例如“曲线下方的区域”或者AUC分数或真实AUC分数)。

在一些实施例中,一个或多个神经网络(例如一个或多个深度神经网络、一个或多个卷积神经网络等)中的至少一个或其全部基于贝叶斯超参数优化来配置。

在一些实施例中,对经训练的神经网络(例如,经训练的深度神经网络、卷积神经网络等)或其全部的评定包括生成准确度分数、加权准确度分数、阳性预测分数、阴性预测分数、F分数、敏感性分数、特异性分数和/或诊断比值比分数。

在一些实施例中,基于超参数搜索循环来配置所述一个或多个第二神经网络(例如一个或多个第二深度神经网络、一个或多个第二卷积神经网络等)中的至少一个或其全部(例如,其中用于配置的所述超参数集合中的至少一个超参数选自由以下参数构成的群组:批量大小、学习率、卷积层、滤波器大小、第一卷积层中的滤波器数量、后续层中滤波器的增加量、步幅、附加密集层的数量、附加密集层的大小、激活函数类型、最大池大小、丢弃和扩张率)。

在一些实施例中,从被标记有在冠状动脉处存在或不存在冠状动脉疾病的诊断的多个患者处采集的所述一个或多个生物物理信号数据集被配置为冠状动脉疾病定位阵列,并且其中所述定位阵列包括多个元素,每个元素对应于指示在冠状动脉中的给定位置处存在或不存在心脏病或病症的标记。

在一些实施例中,方法还包括:基于一个或多个附加预测模型修改指示心脏疾病或病症存在的值,其中所述一个或多个附加预测模型涉及基于与所述生物物理信号数据集在相空间中的几何形状或拓扑相关的几何特征的分析。

在一些实施例中,方法还包括:将指示心脏病或病症存在的值与指示心脏病或病症存在的第二预测值合并,其中指示心脏病或病症存在的第二预测值基于一个或多个附加预测模型,其中所述一个或多个附加预测模型涉及基于与所述生物物理信号数据集在相空间中的几何形状或拓扑相关的几何特征的分析。

在一些实施例中,与所述生物物理信号数据集在相空间中的几何形状或拓扑相关的所述几何特征包括以下至少其中之一:VDfA-B特征、VDp特征、VR_VDO_A-B特征、VDT_A-B特征、m ADa特征、VRcVDcPA-C特征、AD_VR_A特征、tnVDp特征、VDTA-A特征、tnVRp特征、VR_VDO_A-A特征、LCXp特征、VDfA-A特征、rA-D特征、rA-C特征、rA-B特征、rA-A特征和VRc_VDcPA-A特征。

在一些实施例中,VDp特征是相空间中被识别的心室去极化轨迹占据的区域中的生物物理信号数据集的量化。

在一些实施例中,VDFA特征是相空间中生物物理信号数据集的基准点的量化,其中所述基准点包括以下至少其中之一:机器识别的最大心室去极化、在最大心室去极化之前的机器识别的点、以及心室去极化的机器识别结论。

在一个方面,公开了一种方法,包括以下步骤:通过处理器接收受试者的生物物理信号数据集,其中所述生物物理信号数据集与通过至少一个电极从所述受试者经由相应数量的采集通道同时采集的多个相位梯度心脏信号相关;对来自至少一个所述采集通道的生物物理信号数据集进行预处理以生成一个或多个经预处理的数据集,其中每个经预处理的数据集包括单个孤立的完整心动周期;以及由所述处理器通过将所述经预处理的数据集直接输入到一个或多个深度神经网络的集合(一个或多个深度神经网络的集合,一个或多个卷积神经网络的集合等)或其全部中来确定指示心脏疾病或其他病症(例如冠状动脉疾病、肺动脉高压、肺动脉高血压、左心衰竭、右心衰竭和左心室舒张末压异常(LVEDP))存在或不存在的值(例如风险/可能性、二进制指示),该一个或多个深度神经网络是使用从多个患者或受试者处采集的一个或多个生物物理信号数据集(例如一个或多个相位梯度生物物理信号数据集、一个或多个相位梯度心脏信号数据集等)训练的,所述多个患者或受试者标记有在患者或受试者中存在冠状动脉疾病的诊断(例如,显著的冠状动脉疾病)(例如,其中用于标记冠状动脉疾病存在的标签包括基于Gensini的评分,该评分确定为心肌层中诊断的冠状动脉病变的严重性加权评分和位置加权评分的组合,并且其中给定的采集通道的经预处理的数据集以相位对齐的方式分割到其他采集通道的相应生物物理信号数据集;其中,输出数据集是基于指示心脏疾病或病症的二进制存在的所确定的值而经由报告和/或显示器输出的。

在一个方面,公开了一种方法,包括以下步骤:通过处理器接收受试者的生物物理信号数据集,其中所述生物物理信号数据集与通过至少一个电极从所述受试者经由相应数量的采集通道同时采集的多个相位心脏梯度信号相关;以及由所述处理器通过将经预处理的数据集或修改版本的所述经预处理的数据集输入到一个或多个第二神经网络(例如一个或多个第二深度神经网络、一个或多个第二卷积神经网络等)或其全部来确定指示一个或多个冠状动脉处存在心脏病或病症的一个或多个位置值,所述第二深度神经网络是使用从多个患者或受试者采集的一个或多个生物物理信号数据集(冠状动脉疾病定位阵列)训练的,所述多个患者或受试者中的每一个被标记为在由如下构成的群组中选择的冠状动脉或相关心肌层区域处存在或不存在冠状动脉疾病的诊断:左主动脉(LMA)、左回旋支近端(Prox LCX)、左回旋支中段(mid LCX)、左回旋支远端(Dist LCX)、LPAV、第一钝缘(OM1)、第二钝缘(OM2)、第三钝缘(OM3)、左前降支近端(Prox LAD)、左前降支中段(Mid LAD)、左前降支远端(Dist LAD)、LAD D1、LAD D2、右冠状动脉近端(Prox RCA),右冠状动脉中段(MidRCA)、右冠状动脉远端(Dist RCA)和右后降支的急性边缘分支(AcM R PDA),其中基于指示在一个或多个冠状动脉处存在心脏病或病症的所确定的值,经由报告和/或显示器输出输出数据集。

在另一个方面,公开了一种配置神经网络(例如,深度神经网络、卷积神经网络等)或其全部以检测受试者中冠状动脉疾病或病症的存在或估计冠状动脉疾病或病症的定位的方法,该方法包括:通过处理器为模板神经网络(例如,模板深度神经网络、模板卷积神经网络等)生成多个超参数集合,其中所述多个超参数集合中的每一个是通过随机或伪随机选择从一组超参数中而生成的,其中所述超参数集合中的至少一个超参数选自由以下参数构成的群组:批尺寸、学习率、卷积层、滤波器大小、第一卷积层中的滤波器数量、后续层中滤波器器的增加量、附加密集层的数量、附加密集层的大小、激活函数类型、目标、扩张率和丢弃;针对多个超参数集合中的每一个,通过所述处理器训练所述模板神经网络,其中在每个评定实例中,所述模板神经网络(例如,模板深度神经网络、模板卷积神经网络等)配置有所述多个超参数集合中的超参数集合;和针对多个超参数集合中的每一个,通过所述处理器使用第一验证数据集评定经训练的神经网络(例如,深度神经网络、卷积神经网络等),其中每个评估生成分数(例如AUC分数或真实AUC分数),其中经训练的神经网络(例如,经训练的深度神经网络、经训练的卷积神经网络等)随后用于诊断所述受试者的冠状动脉疾病的存在和/或定位。

在一些实施例中,经训练的神经网络(例如,经训练的深度神经网络、经训练的卷积神经网络等)包括生成准确度分数、加权准确度分数、阳性预测分数、阴性预测分数、F分数、敏感性分数、特异性分数和/或诊断比值比分数。

在另一个方面,公开了一种系统,包括:一个或多个处理器;和其上存储有指令的存储器,其中由所述一个或多个处理器执行所述指令使得所述一个或多个处理器执行如上所述的方法。

在另一个方面,公开了一种系统,包括:用于采集相位梯度生物物理信号(例如宽带相位梯度生物物理信号数据集、相位梯度心脏信号数据集、宽带相位梯度心脏信号数据集等)的设备;和直接或间接耦合到所述设备的评估系统,该评估系统包括:一个或多个处理器;和其上存储有指令的存储器,其中由所述一个或多个处理器执行所述指令使得所述一个或多个处理器执行如上所述的方法。

在另一个方面,公开了一种系统,包括:存储区域网络,被配置为接收和存储从被配置为采集宽带相位梯度信号的设备生成的采集相位梯度信号数据集(例如宽带相位梯度生物物理信号数据集、相位梯度心脏信号数据集、宽带相位梯度心脏信号数据集等);和直接或间接耦合到所述存储区域网络的评估系统,该评估系统包括:一个或多个处理器;和其上存储有指令的存储器,其中由所述一个或多个处理器执行所述指令使得所述一个或多个处理器执行如上所述的方法。

在另一个方面,公开了一种其上存储有指令的非暂时性计算机可读介质,其中由一个或多个处理器执行所述指令使得所述一个或多个处理器执行如上所述的方法。

附图说明

包含在本申请文件中并构成本申请文件一部分的附图示出了实施例并且与说明书一起用于解释这里包含的方法和系统的原理。当结合附图阅读时,可以从以下详细描述中更好地理解实施例。附图包括以下图:

图1是根据示例性实施例的被配置为使用神经网络(例如,深度神经网络、卷积神经网络等)或其全部(esemble)、非侵入性地评估人的冠状动脉疾病的存在或不存在的例示性系统的图。

图2A是根据心血管环境下的示例性实施例的、包括一个或多个神经网络(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部的系统的示意图,其中该系统被配置为预测冠状动脉疾病或病症的存在。

图2B是根据心血管环境下的示例性实施例的、包括一个或多个神经网络(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部的系统的示意图,其中该系统被配置为预测冠状动脉中冠状动脉疾病的存在/不存在。

图2C是示出根据示例性实施例的、可以通过图2A和2B的用于检测冠状动脉疾病的神经网络(例如,深度神经网络、卷积神经网络等)或其全部来进行分类的冠状动脉的图。

图3是示出根据示例性实施例的图1的预处理操作的图。

图4是示出根据心血管环境下的示例性实施例的图3的生物物理信号数据集的逐搏隔离的图。

图5是示出根据示例性实施例的、用于训练图1的神经网络(例如,深度神经网络、卷积神经网络等)或其全部的方法的图。

图6示出了根据示例性实施例的用于根据一组随机选择的超参数构建神经网络模型(例如,深度神经网络模型、卷积神经网络模型等)的可执行代码。

图7是示出根据示例性实施例的、使用开发、验证和选通数据集来进行图6的神经网络模型(例如,深度神经网络模型、卷积神经网络模型等)或其全部的构建的图。

图8A示出了根据示例性实施例的将表面电极或探针放置到受试者或患者的胸部和背部的侧视图。

图8B示出了根据示例性实施例的将表面电极或探针放置到同一患者的正视图。

图9是示出根据示例性实施例的、用于生成一个或多个神经网络模型(例如,一个或多个深度神经网络模型、一个或多个卷积神经网络模型等)的具体流水线处理的图,所述神经网络模型被配置为非侵入性地评估人的冠状动脉疾病或症状的存在或不存在。

图10是示出了根据示例性实施例的、用于选择神经网络模型(例如,深度神经网络模型、卷积神经网络模型等)的处理的图,所述神经网络模型被配置为非侵入性地评估人的冠状动脉疾病或病症的存在或不存在。

图11示出了其中可以实施例示实施例和方面的例示计算环境。

具体实施方式

在此描述的每一个特征以及两个或更多个这些特征的组合中的每个都包括在本发明的范围内,只要这个组合中包括的特征彼此不矛盾。

虽然本公开涉及在心脏相关病理和病症和/或神经学相关病理和病症的诊断和治疗中对生物物理信号的有益评估,但是此类评估可应用于诊断和治疗(包括手术、微创和/或药物治疗)其中生物物理信号涉及活体的任何相关系统的任何病理或病症。心脏环境的一个例子是CAD的诊断及其通过多种疗法的治疗(单独或组合),例如在冠状动脉中放置支架,进行旋切术、血管成形术,开具药物治疗处方,以及/或开具运动处方、改变营养和其他生活方式等。可以诊断的其他心脏相关病理或病症包括例如心律失常、充血性心力衰竭、瓣膜衰竭、肺动脉高压(例如肺动脉高血压、左心疾病引起的肺动脉高压、肺病引起的肺动脉高压、慢性血栓引起的肺动脉高压和其他疾病(如血液或其他疾病)引起的肺动脉高压)、左心衰竭、右心衰竭和异常左心室舒张末压(LVEDP)、以及其他与心脏相关的病理、病症和/或疾病。可诊断的神经相关疾病、病理或病症的非限制性实例包括例如癫痫、精神分裂症、帕金森病、阿尔茨海默病(和所有其他形式的痴呆)、自闭症谱系(包括阿斯伯格综合征)、注意力缺陷多动障碍、亨廷顿病、肌营养不良症、抑郁症、双相情感障碍、脑/脊髓肿瘤(恶性和良性)、运动障碍、认知障碍、语言障碍、各种精神病、脑/脊髓/神经损伤、慢性创伤性脑病、丛集性头痛、偏头痛、神经病(各种形式,包括周围神经病)、幻肢/疼痛、慢性疲劳综合征、急性和/或慢性疼痛(包括背痛、背部手术失败综合征等)、运动功能障碍、焦虑症、由感染或外来因素(如莱姆病、脑炎、狂犬病)引起的病症、发作性睡病和其他睡眠障碍、创伤后应激障碍、与中风、动脉瘤、出血性损伤等相关的神经系统病症/影响、耳鸣和其他与听力相关的疾病/病症以及与视力相关的疾病/病症。

示例系统

图1是根据示例性实施例的被配置为使用神经网络(例如,深度神经网络、卷积神经网络等)(例如非侵入性地)评估人的冠状动脉疾病的存在或不存在的例示性系统100的图。如本文所述,生理系统可以指身体的心血管系统、肺系统、肾系统、神经系统和身体的其他功能系统和子系统。在心血管系统的环境下,图1中所示的系统100的特定实施例通过在相空间中检查这种系统可能在多个周期中表现出的状态或相位来促进对心脏的复杂非线性系统的研究。

在图1中,测量系统102是非侵入性实施例(显示为“测量系统(生物物理)”102),其经由任意数量的测量探针114(示为探针114a、114b、114c、114d、114e和114f)从受试者106采集多个生物物理信号104(例如,相位梯度生物物理信号)以产生生物物理数据集108。生物物理信号数据集108包括多个采集的信号(例如,从三个不同的通道采集的信号),其可以组合在一起以生成多维数据集的生物物理信号数据集108(例如的三维相空间表示)。测量系统102被配置为例如通过通信传输系统和/或网络、或通过直接连接,将所采集的生物物理信号数据集108或从其导出或根据其处理的数据集传输到可由非侵入性生物物理信号评估系统110访问的储存库(例如,存储区域网络)(未示出),以便由分析引擎进行评定,该分析引擎对采集的生物物理信号数据集108的确定性混沌或准周期性特征执行相空间分析,以确定临床输出112(包括对所研究的生理系统的疾病存在或不存在的评估和/或估计的生理特征)。在一些实施例中,临床输出包括对所研究的生理系统的疾病、病症的存在或不存在的评估和/或估计的生理特征。在其他实施例中,没有临床输出,而是输出信息,临床医生可以使用这些信息的输出来提供他们自己对于与正在评估其信号的患者有关的信息的临床评估。

在一些实施例中,测量系统102被配置为经由生物电势感测电路采集可以基于身体的生物电势的生物物理信号作为生物电势生物物理信号。在心脏和/或心电图环境中,测量系统102被配置为捕获活体(例如人)的心脏相关生物电势信号或电生理信号作为生物电势心脏信号数据集。在一些实施例中,测量系统102被配置为采集宽带心脏相位梯度信号作为生物电势信号或其他信号类型(例如,电流信号、阻抗信号、磁信号、光信号、超声或声学信号等)。关于采集的信号及其对应数据集的术语“宽带”是指频率范围显著大于感兴趣的生理系统的最高主频率的奈奎斯特采样率的信号。对于通常具有约0.5Hz到约80Hz之间的主频率分量的心脏信号,宽带心脏相位梯度信号或宽带心脏生物物理信号包括从以下范围构成的群组中选择的频率处的心脏频率信息:约0.1Flz到约1KHz之间,约0.1Hz到约2KHz之间,约0.1Hz到约3KHz之间,约0.1Hz到约4KHz之间,约0.1Hz到约5KHz之间,约0.1Hz到约6KHz之间、约0.1Hz到约7KHz之间、约0.1Hz到约8KHz之间、约0.1Hz到约9KHz之间、约0.1Hz到约10KHz之间以及约0.1Hz到大于10KHz之间(例如,0.1Hz到50KHz或0.1Hz到500KHz)。除了捕获主要频率分量之外,宽带采集还有助于捕获其他感兴趣的频率。此类感兴趣频率的例子可包括QRS频率分布图(其频率范围可高达250Hz)等。与采集的信号和相应的数据集有关的术语“相位梯度”,其是指在身体的不同有利位置点采集的信号,以观察对于感兴趣的生理系统的一组不同事件/功能的相位信息。在信号采集之后,术语“相位梯度”是指通过使用非失真信号处理和预处理硬件、软件和技术(例如,相位线性滤波器和信号处理算子和/或算法)保留相位信息。

在神经学环境下,测量系统102被配置为捕获活体(例如人)的神经学相关生物电势或电生理学信号作为神经学生物物理信号数据集。在一些实施例中,测量系统102被配置为采集宽带神经相位梯度信号作为生物电势信号或其他信号类型(例如,电流信号、阻抗信号、磁信号、超声、光信号、超声或声音信号等)。测量系统102的例子在公开号为2017/0119272和2018/0249960的美国专利申请中进行了描述,它们中的每一个通过引用整体并入于此。

在一些实施例中,测量系统102被配置为捕获宽带生物电势生物物理相位梯度信号作为未滤波的电生理信号,使得信号的频谱分量不被改变。实际上,在这样的实施例中,宽带生物电势生物物理相位梯度信号在不被滤波(如果被滤波,将会影响感兴趣的生物物理信号的相位线性)(例如通过例如硬件电路和/或数字信号处理技术等)的情况下被捕获、转换甚至分析(例如,在数字化之前)。在一些实施例中,宽带生物电势生物物理相位梯度信号以处于或显著低于常规心电图、脑电图和其他生物物理信号采集仪器的本底噪声的微伏或亚微伏分辨率被捕获。在一些实施例中,宽带生物电势生物物理信号被同时采样,其具有小于约1微秒的时间偏差或“滞后”,并且在其他实施例中,具有不超过约10飞秒的时间偏差或滞后。值得注意的是,例示化系统最大限度地减少了采集的宽带相位梯度信号中的非线性失真(例如,那些可以经由某些滤波器引入的失真)以不影响其中的信息。

仍然参考图1A,评估系统110包括预处理模块116,其被配置为在心脏信号的环境下接收所采集的生物物理信号数据集108并对其进行预处理以生成一个或多个经预处理的数据集118,该经预处理的数据集中的每一个具有一组单独的孤立的完整心动周期,作为逐搏心脏数据集。

评估系统110包括第一组的一个或多个神经网络132a(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部,在该实施例中每个神经网络是使用从被诊断患有心脏病或病症的患者或受试者采集的一组训练心脏信号数据集来训练的。在一些实施例中,如图1所示,评估系统110包括第二组的一个或多个神经网络132b(例如,第二组的一个或多个深度神经网络、第二组的一个或多个卷积神经网络等)或其全部,在本实施例中每个神经网络使用从如下患者处采集的一组训练心脏信号数据集进行训练,该患者被诊断患有心脏病或病症并被标记为在心肌层或特定冠状动脉(例如,来自一组冠状动脉)的区域中存在/定位和/或不存在/未定位的心脏病或病症。在一些实施例中,所述一个或多个神经网络132a接收经预处理的数据集118以训练分类器和/或对接收到的输入执行分类。当用于分类时,在一些实施例中,第一组的一个或多个神经网络132a(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部的输出是指示心脏疾病或病症存在的值(134a),例如二进制值或风险/可能性分数。在一些实施例中,第二组的一个或多个神经网络132b(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部的输出是指示在心肌层的区域和/或冠状动脉中的一位置处心脏疾病或病症的存在/位置的值(134b),例如二进制值或风险/可能性分数。在一些实施例中,输出134a和134b是从相同的一个或多个神经网络(例如,132a或132b)(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部生成的。

如本文所用,术语“神经网络”(和人工神经网络(ANN))是指受生物神经网络启发的机器学习算法系列或框架,其可在计算硬件中实例化并被训练以执行任务,包括学习从一组训练数据集生成的一组特征,以例如优化一个或多个预测模型,这些模型可以应用于具有未知结果的数据源。具有全连接层的神经网络可以定义一系列由网络元素的权重参数化的函数。深度神经网络就是这种多层互连神经网络的例子,它们被配置为以最少的预处理直接从数据集中识别模式。深度神经网络类别的例子包括但不限于例如前馈神经网络、循环神经网络(recurrent neural network)、多层感知器(MLP)、卷积神经网络、递归神经网络(recursive neural network)、深度信念网络、卷积深度信念网络、自组织图、深度玻尔兹曼机、堆叠降噪自动编码器等。卷积神经网络(“CNN”)等被特别优化以直接从多维数据集(例如,图像)识别模式。流行的卷积神经网络的例子包括GoogLeNets、ResNets、ResNeXts、DenseNets、DualPathNets等,它们中的每一个都可以应用于预测或估计疾病状态的存在或不存在。在一些实施例中,神经网络使用诸如CNN的深度学习方法来基于机器可提取的特征将多维数据集分类为一个或多个正类和/或一个或多个负类。如本文所用,对一个或多个神经网络的引用可包括相同类型的神经网络架构的一个或多个实例以及不同类型的神经网络架构的一个或多个实例或组合的实例。

神经网络的描述在http://cs231n.github.io/neurai-networks-1/处公开了,卷积神经网络在http://cs231n.github.io/conventional-networks/处公开,其通过引用整体并入于此。

在图1中,在一些实施例中,系统100包括医疗保健提供者门户(portal)(示为“门户”128),其被配置为在相空间分析报告和/或血管造影等效报告中显示神经网络的输出(例如,134a、134b)(以及其他数据集),或与相空间分析报告和/或血管造影等效报告一起显示神经网络的输出。门户128(在一些实施例中可以被称为医师或临床医生门户128)被配置为从存储库(例如,存储区域网络)访问、检索和/或显示或呈现报告和/或神经网络的输出(例如,134a、134b)(和其他数据)用于报告。

在一些实施例中,如图1所示,医疗保健提供者门户128被配置为在解剖映射报告130a、冠状动脉树报告130b和/或17-节段报告130c中显示或连同解剖映射报告130a、冠状动脉树报告130b和/或17-节段报告130c一起显示神经网络或其全部的输出(例如134a、134b)(例如,深度神经网络、卷积神经网络等)。门户128可以例如实时(例如,作为网页对象)、以电子文档和/或以其他标准化或非标准化图像可视化/医疗数据可视化/科学数据可视化格式来呈现数据。医疗保健提供者门户128和/或存储库可以符合患者信息和其他个人数据隐私法律和法规(例如,1996年美国健康保险流通和责任法案以及欧盟通用数据保护条例)以及与医疗设备的营销相关的法律(例如,美国联邦食品和药品法案和欧盟医疗器械法规)。在公开号为2018/0078146、发明名称为“Method and System for Visualizationof Heart Tissue at Risk”的美国专利申请中提供了示例医疗保健提供者门户128的进一步描述,其通过引用整体并入于此。尽管在某些实施例中,医疗保健提供者门户128被配置为向医疗保健专业人员呈现患者医疗信息,但在其他实施例中,门户128可以被患者、研究人员、学者和/或其他门户用户访问并且对于他们是有用的。

在一些实施例中,解剖映射报告130a包括受影响心肌层的心脏区域的可旋转的(且可选地可缩放的)三维解剖图的一个或多个描绘。在一些实施例中,解剖映射报告130a被配置为显示具有被识别的心肌层区域的模型的一组一个或多个三维视图和/或一组二维视图并在它们之间切换。在一些实施例中,冠状动脉树报告130b包括主要冠状动脉的一个或多个二维视图。在一些实施例中,17-节段报告130c包括心肌的相应区域的一个或多个二维17-节段视图。在每个报告中,指示心肌中某个位置存在心脏病或病症的值(134b)以及指示存在心脏病的标签(134a)可以呈现为指示预测的阻塞区域的静态和动态可视化元素(例如,通过受影响心肌层区域的颜色突出显示以及通过将受影响冠状动脉区域突出显示的动画序列)。在一些实施例中,每个报告包括指示心脏疾病的存在或不存在(例如,显著冠状动脉疾病的存在)的文本标签以及指示给定的冠状动脉疾病中心脏疾病的存在(即,位置)的文本标签。

在一些实施例中,在心血管系统的环境下,医疗保健提供者门户(和相应的图形用户接口)被配置为呈现识别处于危险的心肌层的心肌层组织和/或被阻塞的冠状动脉的概要信息可视化。用户接口可以是具有有输入能力的触摸敏感屏幕或预触摸敏感屏幕的图形用户接口(“GUI”)。例如,用户接口可用于指导患者的诊断和治疗和/或评估研究中的患者。对于给定的研究报告,可视化可包括以下多个描绘:受影响心肌层的心脏区域的可旋转三维解剖图、主要冠状动脉的相应二维视图和主要冠状动脉的相应二维17-节段视图,以促进对心肌层结构特征的解释和评估,用以表征心脏和心血管功能的异常。对于给定的研究报告,可视化可以包括神经网络(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部的输出(例如,134a、134b)的多个描述,例如作为指示存在或不存在心脏病(例如,存在显著冠状动脉疾病)的文本标签以及指示在给定冠状动脉疾病和/或在相关的心肌层区域中存在心脏病(即,位置)的文本标签。

为了生成相空间体积数据集/图像,如图1所示的系统包括相空间分析模块124。在一些实施例中,相空间分析模块124有助于将生理系统的确定性混沌与将被显示为生理系统的功能量化(例如,显示为相位空间分析数据集/图像)的其他类型的生理行为(其与解剖学行为相对)分离。在一些实施例中,相空间分析模块124被配置为使用模型(例如,从稀疏近似算法(例如匹配追踪)生成)来估计和/或预测经预处理的生物物理信号数据集118(或所采集的生物物理信号数据集108)中的确定性混沌作为预处理的生物物理信号数据集的残差(例如,通过模型做减法得到)。为了对生理系统的确定性混沌行为和/或特性建模,评估系统110的分析引擎被配置为准确地对所采集的生物物理信号数据集进行建模(例如,大于95%的准确度)。在一些实施例中,模型是根据建模准确度大于99%的建模算法(例如,稀疏近似算法)生成的。在一些实施例中,建模算法具有大于99.9%的准确度。在一些实施例中,建模算法具有大于99.99%的准确度。在一些实施例中,建模算法具有大于99.999%的准确度。在一些实施例中,建模算法具有大于99.9999%的准确度。在一些实施例中,建模算法被配置为迭代和递归地选择候选基函数以添加到模型,直到达到停止条件(例如,评估的准确度值达到预定义的准确度值(例如,X%),模型达到了最大允许的候选数量,和/或模型已包含所有可用的候选)。

有用的相空间概念和分析的例子在以下文献中进行了描述:公开号为2018/0000371、发明名称为“Non-invasive Method and System for Measuring MyocardialIschemia,Stenosis Identification,Localization and Fractional Flow ReserveEstimation”的美国专利申请;于2018年12月26日提交的公开号为2019/0214137、发明名称为“Method and System to Assess Disease Using Phase Space Volumetric Objects”的美国专利申请;以及公开号为2019/0200893、发明名称为“Method and System toAssess Disease Using Phase Space Tomography and Machine Learning”的美国专利申请,每篇文献以引用方式并入于此。

使用神经网络预测冠状动脉疾病

图2A是包括一个或多个神经网络232a、232b(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部的系统100a的图,其被配置为预测冠状动脉疾病的存在(例如,根据心血管环境下的示例性实施例,在患者中和/或在冠状动脉的位置中)。其他神经网络132、132b(例如,深度神经网络、卷积神经网络等)或其全部(如关于图1所描述的)可以用作232a、232b的替代。

卷积神经网络(例如GoogLeNets、ResNets、ResNeXts、DenseNets、DualPathNets)包括一种架构,该架构可以包括一个或多个输入层、一个或多个CONV层(例如,配置为计算各个神经元的权重与小连接区域之间的点积)、一个或多个RELU/ELU层(例如,包括逐元素激活函数)、一个或多个POOL层(例如,包括下采样算子)和一个或多个FC(全连接)层(例如,包括类分数计算)等。

如图2A所示,非侵入性测量系统102经由测量探针或电极114(示为探针114a、114b、114c、114d、114e和114f)穿过多个通道从受试者106采集多个生物物理信号104,以产生生物物理数据集108a。

在采集之后,评估系统110a通过网络(即,通信网络)或包括存储区域网络的数据储存库从测量系统102直接或间接地接收生物物理数据集108a。评估系统110a包括预处理模块116a和一组一个或多个神经网络232a、232b(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部,每个神经网络都是使用从患者处采集的一组训练生物物理信号数据(例如,相位梯度生物物理数据集、宽带相位梯度生物物理信号数据集)训练的,所述患者被诊断患有心脏病或病症并被标记在患者中存在心脏病或病症和/或在特定冠状动脉(例如,来自一组冠状动脉)中存在/不存在心脏病或病症。

在心血管环境下,预处理模块116a被配置为对来自采集通道中至少一个的生物物理数据集108a进行预处理(通过例如相位线性预处理技术)以生成来自每个采集通道的一个或多个经预处理的数据集118a,其中每个经预处理的数据集118a包括单个隔离的完整心动周期并且与其他通道中的其他对应的隔离完整心动周期是相位对齐的。

评估系统110通过将经预处理的数据集直接输入到一组一个或多个神经网络232a、232b(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部来确定指示心脏疾病或病症(例如,冠状动脉疾病、肺动脉高压、肺动脉高血压、左心衰竭、右侧心力衰竭、左心室舒张末压(LVEDP))的存在的值(例如,风险/可能性、二元指示),该神经网络使用是从多个患者中采集的一个或多个生物物理信号数据集进行训练的,这些患者被标记有存在冠状动脉疾病(例如,显著冠状动脉疾病)的诊断。在一些实施例中,标记冠状动脉疾病存在的标签包括基于Gensini的分数,该分数被确定为针对患者心肌层中诊断的冠状动脉病变的严重性加权评分和位置加权评分的组合。

在一些实施例中,神经网络232a(例如,深度神经网络、卷积神经网络等)或其全部接收包括患者/受试者的Gensini分数(例如,如本文所述的修改的Gensini分数)的训练数据。

在一些实施例中,神经网络232b(例如,深度神经网络、卷积神经网络等)或其全部接收包括二进制数组的训练数据,在该二进制数组中每个元素都映射到在给定冠状动脉处诊断的冠状动脉疾病。在一些实施例中,阵列二进制阵列包括映射到选自由以下构成的群组的冠状动脉的疾病状态:左主动脉(LMA)、左回旋支近端(Prox LCX)、左回旋支中段(midLCX)、左回旋支远端(Dist LCX)、LPAV、第一钝缘(OM1)、第二钝缘(OM2)、第三钝缘(OM3)、左前降支近端(Prox LAD)、左前降支中段(Mid LAD)、左前降支远端(Dist LAD)、LAD D1、LADD2、右冠状动脉近端(Prox RCA),右中冠状动脉中段(Mid RCA)、右冠状动脉远端(DistRCA)和右后降支的急性边缘分支(AcM R PDA)。也可以包括其他冠状动脉。

图2B是根据心血管环境下的示例性实施例的、包括一个或多个神经网络232a、232b(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部的系统100b的图,该系统被配置为预测冠状动脉中冠状动脉疾病的存在/位置。如图2B所示,非侵入性测量系统102经由测量探针114(示为探针114a、114b、114c、114d、114e和114f)从受试者106采集多个生物物理信号104以产生生物物理数据集108c。

在采集之后,评估系统110b通过网络或包括例如存储区域网络的数据储存库从测量系统102直接或间接地接收生物物理数据集108b。

在该实施例中,评估系统110b包括用于每组的所述一个或多个神经网络(例如,深度神经网络、卷积神经网络等)或其全部的单独的预处理模块(显示为预处理116b和116c)。预处理模块116b、116c被配置为对来自采集通道中的至少一个通道的生物物理数据集108b进行预处理以生成一个或多个经预处理的数据集(示为118b和118c)。

此外,如图2B所示,在该实施例中,评估系统110b配置有用于所述每组的一个或多个神经网络232a、232b(例如,一个或多个深度神经网络、一个或多个卷积神经网络等)或其全部的单独的聚合模块(显示为“聚合”模块202a、202b)。

图2C是示出冠状动脉的图,冠状动脉可以由根据示例性实施例的图2A和图2B的神经网络(例如,深度神经网络、卷积神经网络等)或其全部来进行分类,以用于检测冠状动脉疾病。如图2C所示,左主干冠状动脉向心肌的左侧供血,并分为两个分支:左前降支(LAD)动脉和左旋回动脉(LCX)。LAD为心脏左侧的前部提供血液,而LCX向心肌的后部和外侧供血。RCA为右心房、右心室以及两个心室的底部和隔膜的后部供血。冠状动脉疾病(CAD)的定位至关重要,因为它将帮助心脏病专家制定干预、药物治疗或两者兼而有之的策略。

图3是示出了根据心血管环境中的示例性实施例的图1的预处理操作的图。

方法300包括例如从测量系统102或从已经从测量系统102接收生物物理数据集的数据储存库采集(如步骤302所示)生物物理信号数据集108,如相对于图1描述的。在一些实施例中,六个同时采样的信号作为原始差分通道信号数据集(例如,包括可以称为“ORTHF”、“ORTH2”和“ORTH3”的通道)从静息受试者处捕获,其中信号嵌入了特定于受试者的所采集信号的导联间定时和相位信息。可以使用由去极化波的相平面与其他正交导联的干扰而产生的几何对比度,这可以促进相空间信息在心脏的三维表示上的叠加。无噪声子空间进一步促进了对这些波的相位的观察。也就是说,正交导联的相位携带关于结构的信息并在图像中产生几何对比度。相差(phase contrast)利用了不同生物电结构具有不同阻抗的事实,因此光谱和非光谱传导使得相空间轨道通过心脏的轨迹延迟并使其弯曲了不同的量。在心血管环境方面,轨迹的这些微小变化可以被归一化和逐博量化,并针对异常或不良的引线放置进行校正,并且归一化的相空间积分可以映射到几何网格以进行可视化。

在一些实施例中,非侵入性测量系统102被配置为对于正交放置在受试者上的三个差分通道中的每一个,以大约大于1kHz(例如,8kHz)的采样率对生物物理信号(例如,双极生物电势信号)进行采样,持续约30至约1400秒之间的持续时间,例如约210秒。也可以使用其他持续时间和采样率。

在一些实施例中,然后在步骤304,评估系统110从采集的原始信号中去除基线。在一些实施例中,基线漂移去除操作被实现为相位线性二阶高通滤波器(例如,具有0.67Hz截止频率的二阶正向-反向高通滤波器)。正向和反向操作确保了所得的经预处理的生物物理信号数据集是相位线性的。可以使用其他相位线性操作,例如基于小波滤波器等。

在其他实施例中,使用多级移动平均滤波器(中值滤波器,例如,具有1500毫秒的量级,用1Hz低通滤波器平滑)来从每个输入原始差分通道信号中提取偏差信号(biassignal)。然后通过使用核平滑函数计算的概率密度的最大值减去信号的估计,从信号中去除偏差。

在一些实施例中,该信号运行通过信号质量测试,其中相关输出是适合分析的信号的时间指标(具有足够质量)。发明名称为“Method and System for AutomatedQuantification of Signal Quality”的美国临时申请第_/_/_中描述了信号质量测试的一个例子,其与本申请同时提交(代理机构卷号为10321-036pv1)并且通过引用整体并入于此。

在一些实施例中,评估系统110在步骤306处对输入信号或预处理信号进行下采样(例如,到1kHz)。在一些实施例中,下采样操作是平均算子或抽取算子。

在一些实施例中,该方法还包括对输入的所采集的生物物理信号数据集108或预处理信号118进行归一化。类似类型的下采样、基线漂移和/或归一化操作可以应用于其他生物物理信号数据集。

在一些实施例中,该方法包括仅使用所采集的生物物理信号数据集的一部分,例如,在预定义时间或数据集偏移之后(例如,在前31秒之后)。观察到在一些实施例中,这样的操作可以最小化和/或减少在测量采集开始时可以由受试者的移动引入的运动伪影(并且因此提高信号质量)。还观察到,这种操作可以最小化和/或减少测量中的失真(并因此提高信号质量),这种失真可能是由于探头放置和触点造成的,并且通常观察到在测量采集过程中这种失真随着探头放置好而减少。可以使用其他时间或数据集偏移技术,例如,基于所采集的生物物理数据集中噪声的量化的技术,所述噪声可能是以下导致的结果或与之相关:生物物理信号采集协议(指令)、使用的探针或电极的类型,以及组件的类型和/或配置(例如用于传输信号的电缆、生物物理信号测量系统、生物物理信号采集空间/环境、接近其他医疗器械等)。

在一些实施例中,评估系统110在步骤308处以每搏为基础从采集的生物物理信号数据集(或其他中间信号,例如,如本文所讨论的)中提取多个“干净”的子信号。

图4是示出根据示例性实施例的图3的逐搏隔离的图。如图4所示,评估系统110检测所采集的生物物理信号数据集108(或从生物物理信号数据集导出的中间数据集,例如下采样信号数据集)中的最大峰值(示为402a、402b、402c),然后将每个搏动隔离为在固定窗口(示为404a、404b、404c)中定义的数据集,该固定窗口位于最大峰值(108a、108b、108c)周围且峰值位于窗口中心。在一些实施例中,评估系统110a使用Pan and Tompkins的“AReal-Time QRS Detection Algorithm,”中的Pan-Tompkins算法,该文献发表在IEEETrans.Bioemed.Eng.第32卷第3期(1985年3月),通过引用将其整体并入于此,以检测下采样信号数据集(108a、108b、108c)中的峰值(402a、402b、402c)。在一些实施例中,评估系统110产生大约0.75秒的固定窗口,其对应于每秒80次跳动的心率。可以使用其他窗口大小和居中技术。

在一些实施例中,为了在所采集的生物物理数据集(或在评估分析中处理的中间数据集)中保存相位梯度信息,评估系统110应用相同的时间窗口(例如,404a、404b、404c),如在第一通道(例如,ORTH1)的峰值检测中获得的,以从一个或多个其他通道(例如,ORTH2和ORTH3)中提取心跳。如图所示,评估系统110从通道“1”(也称为通道“ORTH1”)生成第一逐搏片段(406a),其与来自通道“2”(也称为通道“ORTH2”)的逐搏片段(406b)和来自通道“3”(也称为通道“ORTH3”)的逐搏片段(406c)相位对齐,它们可以共同用作为卷积神经网络的一个输入。第二组输入显示为来自通道“1”的逐搏片段(408a)、来自通道“2”的逐搏片段(408b)和来自通道“3”的逐搏片段(408c)。第三组输入显示为来自通道“1”的逐搏片段(410a)、来自通道“2”的逐搏片段(410b)和来自通道“3”的逐搏片段(410c)。实际上,预处理模块116的输出将作为输入提供给一个或多个神经网络(例如,深度神经网络,如卷积神经网络等)或其全部,该输出是来自每个采集通道或一部分采集通道的相位对齐时间窗口(例如,0.75秒窗口)的一组数据片段(包括单个完整的心动周期)。在一些实施例中,从预处理模块116提取的所有数据片段作为输入被提供给神经网络132(例如,深度神经网络、卷积神经网络等)或其全部(例如,用于训练或分析)。在其他实施例中,从一些而非全部采集通道中提取的数据片段被提供给神经网络132(例如,深度神经网络、卷积神经网络等)或其全部(例如,用于训练或分析)。在其他实施例中,从给定采集通道中的一些通道但不是全部通道提取的数据片段被提供给神经网络132(例如,深度神经网络、卷积神经网络等)或其全部。

返回参考图3,在提取逐搏片段之后,评估系统110被配置为在步骤310将逐搏片段中的每一个归一化,作为神经网络(例如,深度神经网络、卷积神经网络等)或其全部的输入。在一些实施例中,评估系统110被配置为根据等

式1缩放每个通道上的每个心跳:

如图所示,系统将每个通道除以其在该窗口中的最大绝对值,以提供由-1到+1的范围限制的数据集。评估系统110然后将1与结果相加并除以2以提供在0到1的范围内的信号。评估系统110然后通过将结果减去窗口化的数据集的平均值,然后加0.5,以提供介于0和1之间的均值为0.5的信号数据集。对其他通道执行相同的操作,以为所有训练例子提供相似的范围和均值,从而帮助网络更好地学习和泛化。可以使用其他归一化操作。

仍然参考图3,评估系统110被配置为接着将归一化的逐搏数据集输入到神经网络132(例如,深度神经网络、卷积神经网络等)或其全部。在步骤312,系统可以应用归一化的逐搏数据集来训练神经网络132(例如,深度神经网络、卷积神经网络等)或其全部。系统可以替代地应用归一化的逐搏数据集,以在步骤314由经训练的神经网络(例如,经训练的深度神经网络、经训练的卷积神经网络等)或经训练的全部对该逐博数据集进行分类,以预测患者中疾病状态或病症的存在或不存在(例如,冠状动脉疾病或其他病症的存在或不存在)和/或冠状动脉中疾病或病症的存在/位置。

在一些实施例中,评估系统110被配置有一个以上的神经网络132a、132b(例如,深度神经网络、卷积神经网络等)或其全部。神经网络132a、132b(例如,深度神经网络、卷积神经网络等)中的每一个或其全部可以接收归一化的逐搏数据集并生成组合的一组预测器(例如,通过如图2A所示的聚合运算子202;或通过如图2B所示的运算子202a、202b)。

优化/训练卷积神经网络的方法

图5是示出根据示例性实施例的训练神经网络(例如,深度神经网络、卷积神经网络等)、(例如,132a、132b、232a、232b)或全部的方法500的图。在图5中,由图3的预处理过程提供的归一化数据集被提供作为训练阶段的输入。在训练阶段,一组随机生成的神经网络配置(例如,生成的深度神经网络配置、生成的卷积神经网络配置等)或其全部使用生物物理信号数据的开发集进行训练(例如,相位梯度生物物理信号数据、宽带相位梯度生物物理信号数据),该生物物理信号数据按照关于图3讨论的步骤进行归一化和预处理,并使用相位梯度生物物理信号数据集的确认集(validation set)进行评定。在一些实施例中,评估系统110被配置为使用基于Gensini的评分作为对随机生成的神经网络(例如,随机生成的深度神经网络、随机生成的卷积神经网络等)或其全部的一部分输入。

在一些实施例中,评估系统110将单个基于Gensini的分数分配给受试者(即,分配给采集的宽带相位梯度数据集,以及从采集的宽带相位梯度数据集导出的归一化数据集),其反映了由冠状动脉病变引起的心肌层上的总负担,这些病变通过冠状动脉造影进行定位和量化。在一些实施例中,基于Gensini的分数基于发表于Futura Pub.Co(1975)的Goffredo G.Gensini的“Coronary arteriography”中描述的等式2,其整体以引用方式并入于此:

Gensini_score=∑iSeverityixLocationi (等式2)

在等式2中,i是识别的冠状动脉病变的编号,severityi是用于每个冠状动脉病变i的评定的直径减少25%、50%、70%、90%、99%和100%的值的严重性权重{1、2、4、8、16或32},并且locationi是位置权重{5...0.5},其为针对位置、根据其对其他位置、对整个冠状循环的相对影响而定义的。事实上,如果病变位于冠状循环通路的更上游(例如,靠近主动脉),那么该病变对循环的影响比在循环中非常靠下位置(远端)的病变更大。例子中的位置分数的范围为5到0.5,其中5.0的值分配给对循环影响最大的位置,而0.5的值分配给影响最小的位置(例如,根据Gensini度量)。可以使用其他评分值。

在一些实施例中,评估系统110将修改的基于Gensini的分数分配给受试者(即,分配给所采集的相位梯度生物物理数据集、所采集的宽带相位梯度生物物理信号数据集)或从其导出的归一化数据集,根据等式3,其反映了由冠状动脉造影定位和量化的最坏冠状病变引起的负担:

Gensini_score=select_max(SeverityixLocationi) (等式3)

实际上,如等式3中所提供的,系统仅考虑最坏情况的病变,即具有严重性权重乘以位置权重的最大值的病变。

仍然参考图5,对于每个数据准备和学习步骤(称为时期(epoch)),评估系统110遍历所有训练数据集并根据确认数据集计算AUC分数。因为可以将单个相位梯度生物物理数据集(例如,宽带相位梯度生物物理信号数据集)分割成多个窗口化数据集,所以在一些实施例中,系统被配置为通过平均算子来组合对多个患者的心跳的预测的所有或大部分,以提供组合的AUC分数。评估系统110可以在一个循环中执行学习和评定步骤,该循环可以在不同步的情况下同时跨多个机器运行。

在一些实施例中,评估系统110被配置为以分层方式对数据集进行采样,以便在训练数据集和确认集两者中具有CAD阳性数据集和CAD阴性数据集的相似的比率。

仍然参考图5,评估系统110被配置为从一组候选中生成随机的超参数集合和神经网络架构(例如,深度神经网络架构、卷积神经网络架构等),如表1中提供的,它显示了用于逐搏的、基于神经网络的分析(例如,基于深度神经网络的分析、基于CNN的分析等)的例示超参数搜索空间。

表1

实际上,评估系统110被配置成为模板神经网络(例如,模板深度神经网络、模板卷积神经网络等)或其全部生成多个超参数集,其中多个超参数集中的每一个是通过随机或伪随机选择从一组超参数(例如批量大小、学习率、卷积层、滤波器大小、第一卷积层中的滤波器数量、后续层中滤波器的增加、附加密集层的数量、附加密集层的大小、激活函数类型、目标、扩张率和丢弃)中生成的。在一些实施例中,评估系统110被配置为通过贝叶斯超参数优化来优化神经网络(例如,深度神经网络、卷积神经网络等)或其全部。

表2示出了用于基于神经网络的冠状动脉疾病定位分析(例如,基于深度神经网络的冠状动脉疾病定位分析、基于CNN的冠状动脉疾病定位分析)的一组超参数搜索空间类别和候选值。可以采用在表1和表2的精神和等价范围内的其他超参数搜索空间类别和相应的候选值。在表1和表2中,在一些实施例中,评估系统110使用来自“{}”中定义的集合的单个元素,并且评估系统110使用范围“[]”中的值。

表2

图6示出了根据示例性实施例的、根据随机选择的超参数集合构建神经网络模型(例如,深度神经网络模型、卷积神经网络模型等)的可执行代码。图6的可执行代码被配置为在Keras开源神经网络库中运行,并以Python显示。在Journal of Machine LearningResearch 13,第281-305页(2012年2月)发表的Bergstra和Yoshua的“Random search forhyper-parameter optimization”中描述了用于超参数优化的基于随机的搜索例子,该文献通过引用整体并入于此。

参考图5,评估系统110在步骤504在几个时段训练一组神经网络模型(例如,深度神经网络、卷积神经网络等)或其全部,其中每个时段包括一次遍历整个训练集。在每个时段结束时,评估系统110计算一组训练和确认AUC分数。在一些实施例中,评估系统110选择计算出的AUC的最小值作该时段的分数,做为最坏情况性能,以低估而不是高估正在研究中的神经网络模型(例如,深度神经网络、卷积神经网络)或其集合的预测性能。

实际上,评估系统110被配置为(i)针对多个超参数集合中的每一个训练模板神经网络(例如,模板深度神经网络、模板卷积神经网络等),其中在每个评定的实例中,模板神经网络(例如,模板深度神经网络、模板卷积神经网络等)配置有多个超参数集中的超参数集,并且(ii)针对多个超参数集中的每一个,使用第一确认数据集,评定经训练的神经网络(例如,深度神经网络、卷积神经网络等)或其全部,其中每个评定生成AUC分数(例如,真实AUC分数)。在一些实施例中,对经训练的神经网络116(例如,经训练的深度神经网络、经训练的卷积神经网络等)或其全部的评定可以包括生成准确度分数、加权准确度分数、阳性预测分数、阴性预测分数、F分数、敏感性分数、特异性分数和/或诊断比值比(diagnosticodds ratio)分数中的一个或多个分数。为此,评估系统110被配置为通过将经预处理的数据集直接输入到一个或多个神经网络的集合(例如,一个或多个深度神经网络的集合,一个或多个卷积神经网络的集合等等)或其全部,以确定指示心脏疾病或病症(例如,冠状动脉疾病、肺动脉高压、肺动脉高血压、左心衰竭、右侧心力衰竭、异常左心室舒张末压(LVEDP))的存在的值(例如,风险/可能性、二进制指示),所述神经网络使用从多个患者中采集的一个或多个生物物理信号数据集进行训练,这些患者被标记有存在显著冠状动脉疾病的诊断,其中标签包括基于Gensini的分数,该分数被确定为在心肌层区域或特定冠状动脉(例如,来自一组冠状动脉)中诊断出冠状病变的严重性加权评分和位置加权评分的组合。

评估系统110被配置为在步骤506针对每个时段确定是否停止训练和搜索循环的执行。在一些实施例中,停止的标准包括是否已经执行了预定义数量的其中没有观察到更高的分数的时段(例如,10),。在运行结束时,最佳评分模型与所选参数和各种输出(例如对验证集的预测)一起保存。然后,该算法使用新的、不同的参数和CNN架构进行下一次运行。

在一些实施例中,在将数据集应用于训练操作之前,评估系统110被配置为评定并拒绝具有过多电力线噪声、高频噪声和/或周期可变性噪声的信号。在一些实施例中,评估系统110被配置为执行信号质量测试以确定宽带相位梯度信号是否具有足够的信号质量用于后续分析。

真实AUC评分

在一些实施例中,为了提供对预测(即,分类)算法的改进评估,评估系统110被配置为在确定AUC分数时考虑错误的成本和目标类别的平衡。可以使用的因素包括已知的统计数据、性能目标和度量(例如,误报阳性的成本、误报阴性的成本)。

例如,如果系统预测患者患有冠状动脉疾病,则受试者可能会接受进一步调查——因此,就患者安全和健康而言,假阳性的成本是“低的”,因为进一步调查将确认是否存在该疾病。另一方面,如果系统预测患者没有患病而实际上他或她患有疾病,那么受试者可能不会针对该诊断采取进一步动作,因此假阴性的成本“很高”,因为患者的安全和健康可能会受到影响。事实上,与假阳性相比,假阴性会给患者和临床团队带来更多的成本(同样地,在患者安全和健康方面),因此在这种情况下应该为假阴性的实例分配更大的权重(例如,假阴性的成本是假阳性成本的两倍)。

在一些实施例中,该系统被配置成生成不包括AUC(ROC曲线下的区域)测量的修改的接收器工作特征(ROC)图。AUC曲线通常假设对分类器ROC曲线上所有可能的点感兴趣。

在一些实施例中,作为AUC测量的替代,系统被配置为使用1:1成本。在这样的实施例中,系统可以认为对于每个真阳性的增加(或假阴性的减少),假阳性的增加是可接受的。例如,从ROC图的左下角开始,系统可能会使一个真阳性和一个假阳性的增量为“1”(沿y轴)并且使假阳性率(沿x轴)由于类别不平衡而增加“1”的分数(例如,1/15)。实际上,通过从ROC图的左下角发出一条具有斜率的线,系统可以保持1:1成本的所需平衡。

在一些实施例中,作为AUC测量的替代,系统被配置为使用1:2的成本比用于真阳性与假阳性。在这样的实施例中,系统可以维持7.5的斜率(例如,作为维持1:2成本比的边界)。组合线可被称为“按成本分类”的比率线。实际上,可以认为合适的分类器具有ROC曲线,其点位于或高于按成本分类的比率线。可以根据上述因素设置其他比率值,例如统计数据、性能目标和度量(例如,假阳性成本、假阴性成本)。

开发、验证和选通数据集

图7是示出根据示例性实施例的通过开发、验证和选通数据集来构建图6的卷积神经网络模型的图。如图7所示,第一组相位梯度数据集(例如,宽带相位梯度生物物理数据集)用于训练数据集(示为“训练数据集”702);第二组相位梯度数据集(例如宽带相位梯度生物物理数据集)用于验证数据集(示为“验证数据集”704);以及第三组相位梯度数据集(例如宽带相位梯度生物物理数据集)用于选通数据集(gating data set)(示为“选通数据集”706)。数据集702、704、706提供不同层次的测试。在一些实施例中,不断测试所述训练数据集以优化和训练神经网络(例如,深度神经网络、卷积神经网络等)。验证数据集是一个保留集(withheld set),该保留集仅偶尔被评定以确认经训练的神经网络(例如,经训练的深度神经网络、经训练的卷积神经网络等)的性能。选通数据集用于选通,即将经训练的神经网络(例如,经训练的深度神经网络、经训练的卷积神经网络等)移动到最终/锁定配置中。例如,选通可能只被评估一次或两次。

在一些实施例中,通过冠状血管造影术评定每个相位梯度数据集(702、704和706)以定位和量化受试者的冠状动脉病变。相位梯度数据集(702、704和706)中的每一个如关于图3所描述的那样被预处理以产生逐搏心脏数据集。

宽带相位梯度心脏生物物理数据集

图8A和8B是示出根据示例性实施例的将诸如探针114a-114f的表面电极在患者或受试者的胸部和背部处放置以采集与心脏信号数据集相关联的生物电势信号的例子的图。图8A示出了根据示例性实施例的将表面电极114a-114g放置到患者胸部和背部的侧视图。图8B示出了根据示例性实施例的将表面电极106a-106g放置到患者胸部和背部的正视图。如图所示,表面电极位于(i)靠近受试者右腋前线对应于第5肋间隙的第一位置;(ii)靠近左腋前线对应于第5肋间隙的第二位置;(iii)靠近胸骨左缘对应于第一肋间隙的第三位置;(iv)靠近患者胸骨下方的左胸骨边界和剑突外侧的第四位置;(v)靠近左胸骨边界对应于第三肋间隙的第五位置;(vi)靠近背部的第六位置,与第五个位置正对,在患者脊柱的左侧;(viii)靠近患者右上象限的第七位置,对应于沿左腋线的第二肋间隙。

实验结果

CADLAD研究。“冠状动脉疾病-学习算法开发”(CADFAD)研究被进行,该研究涉及两个不同的阶段,以支持机器学习算法的开发和测试。

在CADLAD研究的第一阶段,配对的临床数据被用于指导预处理、特征提取和开发的机器学习阶段的设计和开发。也就是说,收集的临床研究数据分为三个队列:训练队列(50%)、确认队列(25%)和验证队列(25%)。与上述处理来自患者的信号以进行分析的步骤类似,首先对每个采集的数据集进行预处理以清理和归一化数据。在预处理的处理之后,从信号中提取一组特征,其中每组特征与真实条件的表示配对——例如,存在或不存在显著CAD的二元分类或在给定的冠状动脉中存在显著CAD的评分分类。阶段1的最终输出是嵌入在测量系统中的固定算法。

在CADLAD研究的第2阶段,机器学习算法用于提供针对先前未经测试的临床数据池(即验证数据集)的显著CAD的确定。疾病的标准是根据美国心脏病学会(ACC)临床指南中定义的标准确定的,特别是血管造影术的狭窄大于70%或流线术的血流分数小于0.80。

在CADLAD研究的另一个方面,开发了一种评估系统,其自动和迭代地探索各种功能排列中的特征组合,目的是找到能够基于特征成功匹配预测的那些组合。为了避免训练数据的解的过度拟合,确认集被用作比较器。一旦开发了候选预测器,它们就会被手动应用于验证数据集,以针对根本没有用于生成预测器的数据来评估预测器性能。

逐搏卷积神经网络。根据从CADLAD研究采集的数据而进行的实验表明,例示的系统(例如,110、110a、110b)可以通过神经网络(例如,卷积神经网络(CNN))检测显著冠状动脉疾病(CAD),其中该神经网络使用来自宽带相位梯度生物电势信号数据集的逐搏分段数据进行训练。宽带相位梯度生物电势数据集仅被预处理以去除基线漂移、将数据范围归一化,并在每搏基础上隔离采集的数据以进行逐搏分析。

尽管已经表明机器学习可用于根据ECG记录来诊断不规则的心律(即心律失常)(其为用于诊断此类病症的标准护理),但用于诊断冠状动脉疾病的标准通常包括涉及心脏导管插入术的侵入性血管造影检查。该例示系统通过仅使用身体的生物物理信号的非侵入性测量来有益地预测冠状动脉疾病的存在或不存在。

用于生成B2B CNN的方法。为了生成用于实验的卷积神经网络,开发了一种训练系统,并将其用于通过随机搜索来评定大量潜在架构和超参数。

图9是示出了根据示例性实施例的用于生成一个或多个卷积神经网络模型的详细流水线处理的图,该一个或多个卷积神经网络模型被配置为非侵入性地评估人的冠状动脉疾病的存在或不存在。

在如图9所示的实验中,该配置中的系统在步骤902从采集测量设备(例如,相位信号记录器或PSR)以8kHz检索患者的原始相位信号数据。系统在步骤904从采集的原始信号中去除不想要的基线信号以生成中心化的数据集。该系统使用被配置为不会引入任何相位失真(没有相位响应)的二阶正反向滤波器。滤波器配置有0.8Hz的有效高通截止频率。单独地,系统评定采集信号的信号质量,并从随后的分析中拒绝没有通过测试的任何采集信号。

然后,在步骤906,系统使用平均算子将中心化的数据集从所获取的8KHz的采样率下采样到1KHz,以生成下采样的中心化的数据集。

在下采样操作906之后,系统在步骤908从下采样的中心化的数据集中提取一组心跳片段数据,每个心跳片段数据包括单个孤立的完整心动周期。该系统使用Pan等人发表在IEEE Trans.Bioemed.Eng.第32卷第3期(1985年3月)的“AReal-Time QRS DetectionAlgorithm”中描述的Pan-Tompkins算法,用于检测峰值并针对每个采集通道隔离每个完整的心动周期。在这个实验中,输出是大约0.75秒的固定窗口数据集,它以最高振幅点为中心,包含完整的心动周期,以提供所有心跳片段数据集之间的对齐。使用相同的处理以从每个采集通道中提取心动周期数据集合。在实验期间,由于在三个采集通道之一中观察到了周期变异性噪声,因此在分析中仅使用从其中两个测量通道中采集的数据(即,来自通道ORTH1和ORTH3的数据),但是在其他实施例中在分析中可以使用所有三个测量通道或任何两个或一个通道的数据。

系统然后在步骤910将每个提取的心搏数据集的数值范围归一化。该系统通过将数据集除以对于给定窗口的数据的所确定的最大绝对值来归一化每个通道的每个心跳片段数据,从而将数据限定在-1至+1的范围之间。然后系统将比例缩小到+0.5至-0.5,并添加了0.5的偏移量以将范围调整为0.0到1.0。因此,在本实验中,每个通道的每个心跳片段数据集的平均值为0.5,范围在0.0到1.0之间。通过归一化和对齐操作,给定CNN的输入接收到所有训练数据集的相似范围和均值,从而产生更强的分类器。归一化也使信号无单位。

从CADLAD研究采集的数据集在该实验的步骤912被划分为开发池、确认池和选通池,其中开发池和确认池用于训练和初始确认,确认池和选通池用于验证和选通。

该系统使用如下数据集进行训练和确认:使用第一代相位空间记录器(1.0和1.1版本)从730名患者采集的数据集,该第一代相位空间记录器配置有单极宽带相位梯度电压捕获用于训练和确认;以及使用第二代相位空间记录器(1.2版本)从334名患者采集的数据集,该第二代相位空间记录器配置有双极宽带相位梯度电压捕获。观察到,与使用来自单一硬件类型的数据集相比,使用来自不同采集系统的数据集改进了预测器的性能。系统选择AUC≥0.57的评定的CNN模型。该系统还使用了第二验证数据集,其包括使用第二代相空间记录器(1.2版)从164名患者采集的数据。该系统还使用了第三选通数据集,其包括使用第二代相空间记录器(1.2版本)从243名患者采集的数据。

使用Python3进行实验。所使用的包包括NumPy、Pandas、SciKit-Learn和Keras,并且使用TensorFlow用于神经网络的后端分析。所有开发和实验均在Amazon Web Services(AWS)服务器上进行。

在步骤914,系统拒绝所采集的具有过多电力线干扰噪声、过多高频噪声和过多周期变异性噪声的生物物理信号数据集,使其不能用作训练、验证或选通数据集。一旦所有这些预处理步骤完成,模型搜索循环就开始了。这个循环可以在不同步的情况下同时跨多台机器地无限期地运行。在4个p2.xlarge AWS服务器上的典型运行将在实验中进行60小时,这个时间被发现是足以生成满足确认AUC为0.6的模型。

系统在步骤916处针对通过模型搜索循环的每次运行,根据开发集生成250个信号的随机确认集。通过使用SciKit-Learn包中的StratifiedShuffleSplit函数,使用分层采样以在训练集和确认集中具有相同比例的CAD阳性数据集和CAD阴性数据集,StratifiedShuffleSplit函数在http://scikit-learn.org/stable/modules/generated/ sklearn.model_selection.StratifiedShuffleSplit.html中进行了描述,其通过引用整体并入于此。开发集中未用于确认集的剩余数据集被用于训练(共814个)。

在步骤918,系统从表1中提供的搜索空间随机生成一组用于CNN架构的超参数。这些超参数特定于实验工作并且被发现覆盖了在研究的实验中所有参数的感兴趣范围。该系统使用Keras开源神经网络库(例示代码如图6所示)以根据超参数搜索空间构建CNN模型。

在步骤920,系统在多个时段(epoch)训练CNN模型,其中每个时段包括对整个训练集的单次遍历。在每个时段结束时,实验中的系统计算训练AUC和确认AUC。系统使用观察到的最坏情况而不是最佳情况,来计算该时段的分数作为当前版本模型的AUC最小值用于训练和确认信号,用于选择CNN模型。

在步骤922,系统在其中没有观察到新的高分的10个时段之后终止训练。

在每次运行时,系统在步骤924保存最佳评分模型以及对应的超参数和对验证数据集的对应预测。

图10是示出根据示例性实施例的用于选择卷积神经网络模型的处理的图,其中该卷积神经网络模型被配置为非侵入性地评估人的冠状动脉疾病的存在或不存在。

在实验中从模型搜索中选择得分最高的模型,例如,在确认集中对男性和女性分别具有0.58或更高的AUC的那些模型,以在验证集上进行测试。选择那些在验证集上AUC≥0.57的模型以在更大的选通集上进一步评定其性能。选择这些AUC作为阈值,因为发现它们是允许生成所需数量的具有不同特征的预测模型的最佳值。对那些被选择为在选通集上进行测试的所有模型同时进行测试,以避免模型选择过程出现偏差。在针对验证集和选通集性能的实验中,还使用Matlab R2016b函数bootci计算Bootstrap置信区间(CI)。

B2B CNN的训练标签。系统在实验中使用通过基于Gensini的分数导出的训练标签(其为数据集分配了这样一个分数,该分数反映了由冠状动脉造影定位和量化的受试者的冠状动脉病变所引起的心肌层上的总负担)。

Gensini定义的这个分数包括严重性权重和位置权重。根据严重程度权重,冠状动脉病变根据各自的直径减少25%、50%、75%、90%、99%和100%被分配了1、2、4、8、16和32(指数比例)的值。根据位置权重,为冠状动脉病变分配0.5到5之间的值,其反映了根据其位置对整个心肌层的相对影响。例如,如果病变位于冠状循环的上游(例如,靠近主动脉),那么该病变对心肌层区域的循环的影响比位于循环下游(远端)的病变更大。将对循环影响最大的位置赋值为5,将对循环影响最小的位置赋值为0.5。

评估了两个基于Gensini的评分。第一个基于Gensini的评分使用所有加权分数的总和作为给定数据的训练标签。第二个基于Gensini的评分仅使用最坏情况的病变,即严重程度乘以位置为最大值的病变。据观察,第二个修改后的Gensini分数对于机器学习模型来说更容易处理。此外,系统对修改后的Gensini分数应用对数运算,以将指数分布更改为线性分布,从而使标签更易于机器学习模型处理。

B2B CNN实验的结果CNN性能的实验结果显示在表3和表4(使用选通数据集评定)、表5(使用验证数据集评定)和表6(使用验证和选通数据集的组合)中。

表3和4显示了使用85%阈值根据N=213个受试者的选通数据集评定的两个模型的性能分数(其中92名女性,在这92名女性中有14名被诊断患有CAD;其中121名男性,在这121名男性中有55人被诊断患有CAD)。Bootstrap置信区间(“Cl”)显示在括号中。阈值是根据验证集上所需的性能确定的,即特异性≥0.65,灵敏度尽可能高。观察到两个模型(称为“Model 85”和“Model 129”)满足选择标准。

表3

表4

表5显示了使用85%的噪声阈值根据N=130的验证集评定的两个模型的性能分数(其中58名是女性,在这58名女性中有12名被诊断患有CAD;其中72名是男性,在这72名男性中有35名被诊断患有CAD)。阈值是根据该集合的所需性能确定的,即特异性≥0.65,灵敏度尽可能高。Bootstrap CI显示在括号中。如表所示,所有这些模型的AUC分数都在0.62和0.65的范围内。

表5

表6显示了使用85%的噪声阈值根据N=343的验证和选通的组合数据集评定的两个模型的性能分数(其中150名是女性,在这150名女性中有26名被诊断患有CAD;其中193名是男性,在这193名男性中有95名患有CAD)。阈值是根据该集合的所需性能确定的,即特异性≥0.65,灵敏度尽可能高。Bootstrap CI显示在括号中。如表4所示,这两个模型的AUC分数都在0.62和0.65的范围内。

表6

B2B CNN模型如上所述,观察到两个CNN模型(称为“Model85”和“Model 129”)在确认集上满足选择标准。表7示出了两个CNN模型的超参数。

表7

定位卷积神经网络根据从CADLAD研究中采集的数据进行的实验表明,例示系统可以通过卷积神经网络(CNN)(其使用宽带相位梯度生物电势信号数据集训练)检测受试者特定冠状动脉中显著冠状动脉疾病(CAD)的位置。与B2B CNN模型类似,宽带相位梯度电压数据仅经过预处理以去除基线漂移、将数据范围归一化,并在每搏基础上隔离所采集的数据,用于进行逐搏分析。实验针对三个冠状动脉进行,即左前降支(LAD)、左回旋支(LCX)和右冠状动脉(RCA)。

用于生成定位CNN的方法为了生成用于实验的卷积神经网络,开发了训练系统并将其用于通过随机搜索来评定大量潜在架构和超参数。图9显示了完整的模型生成流水线的处理。

如上所述,并且如图9所示,系统(例如,如参考实施例110、110a、110b所描述的)从采集测量设备或储存库检索原始收集的患者的相位信号。系统从采集的原始信号中去除不需要的基线信号以生成中心化数据集。该系统使用了配置为不会引入任何相位失真(即,没有相位响应)的二阶正反向滤波器(second-order forward-reverse filter)。滤波器配置有0.8Hz的有效高通截止频率。单独地,系统评定所采集信号的信号质量,并将没有通过测试的如何采集信号从随后的分析排除。

如上所述,系统然后使用平均算子对中心化的数据集从8KHz的采样率向下采样到1KHz,以生成下采样的中心化数据集。

如上所述,在下采样操作之后,系统从下采样的中心化数据集中提取一组心跳片段数据集,每个心跳片段数据集包括单个孤立的完整心动周期。该系统使用Pan-Tompkins算法来检测峰值并针对每个采集通道隔离每个完整的心动周期。输出是大约0.75秒的固定窗口数据集,它以最高振幅点为中心,包含完整的心动周期,以提供所有心跳片段数据集之间的对齐。使用相同的处理从每个采集的通道中提取多组心动周期。在实验过程中,由于在三个采集通道之一中观察到了所观察的周期变异性噪声,因此在分析中仅使用了从其中两个测量通道中采集的数据(即来自通道ORTH1和ORTH3的数据)。

如上所述,系统然后将每个提取的心搏的数值范围归一化。系统通过将数据集除以给定窗口的数据的所确定的最大绝对值来归一化每个通道的每个心跳片段数据,从而将数据限定在-1到+1的范围之间。然后系统将比例缩小到+0.5到-0.5,并加上0.5的偏移量以将范围调整为0.0到1.0。结果,每个通道的每个心跳片段数据集的平均值为0.5,介于0.0和1.0之间的范围内。通过归一化和对齐操作,给定CNN的输入接收到所有训练数据集的相似范围和均值,从而产生更强的分类器。归一化也使信号无单位。从CADLAD研究中采集的数据集被分为开发池和确认池。

该系统使用第一代相位空间记录器(1.0和1.1版本)从730名患者采集的数据集用于训练和确认,该第一代相位空间记录器配置有单极宽带相位梯度电压捕获用于训练和确认;以及使用第二代相位空间记录器(1.2版本)从334名患者采集的数据集,该第二代相位空间记录器配置有双极宽带相位梯度电压捕获。观察到,与使用来自单一硬件类型的数据集相比,使用来自不同采集系统的数据集改进了预测器的性能。系统选择AUC≥0.57的评定的CNN模型。该系统还使用了第二验证数据集,其包括使用第二代相空间记录器(1.2版)从164名患者采集的数据。该系统还使用了第三选通数据集,其包括使用第二代相空间记录器(1.2版本)从243名患者采集的数据。

系统从搜索空间生成用于CNN架构的一组超参数,如表8中提供的。系统使用图6中所示的修改版本的Keras代码,以从超参数搜索空间构建CNN模型。该系统在几个时段内训练CNN模型,其中每个时段都包括对整个训练集的单次遍历。在每个时段结束时,系统计算训练和确认AUC。系统使用观察到的最坏情况而不是最佳情况来计算该时段的分数作为当前版本模型的AUC最小值用于训练和确认信号,用于选择CNN模型。系统在其中没有观察到新的高分的10个时段后终止运行。在每次运行时,系统都会保存最佳评分模型以及相应的超参数和对验证数据集的相应预测。

表8

超参数 候选值
批量大小 1024
学习率 0.000272669120574
卷积层数量 4
第一卷积层滤波器大小 17
第一卷积层中的滤波器数量 14
步幅 1
附加密集层的数量 1
附加密集层的大小 10
激活函数 ‘tanh’
目标 [‘LAD’、‘LCX’、‘RCA’]
输入频率 1000Hz
最大池化的大小 1
丢弃 0.224455889694
损失函数 ‘mean_squared_error’
优化器 ‘Adam’
输入通道 [ORTH1、ORTH2]

因为需要来自CAD模型的至少一个阳性预测才能对定位模型进行阳性预测,所以系统被配置为当从CAD模型确定阳性预测时触发来自定位模型的预测。

用于定位CNN的训练标签一旦系统确定了候选超参数集,系统就会在训练集上训练神经网络,以学习LAD、LCX和RCA的二进制标签(例如,“0”表示没有疾病,“1”表示有疾病)。根据CADLAD研究方案从患者的血管造影报告中获得并且评估标签。对于这项研究,目标是长度为3的向量,具有LAD、LCX和RCA的二进制值。比如,target[1,0,1]表示LAD标签为1,LCX标签为0,RCA标签为1。因此,模型的预测也是长度为3的向量形式,其具有分别针对LAD、LCX和RCA的预测。

定位CNN实验的结果表9示出了使用选通和验证数据集评定的定位CNN性能的实验结果。表9示出了N=411名受试者的测试集的定位模型结果,其中101人被诊断在LAD中有CAD,66人在LCX中被诊断为CAD,72人在RCA中被诊断为CAD。结果既提供了所有三个动脉预测相结合的整体情况的统计数据,也提供了每个单独动脉的统计数据。系统计算阈值,使得对于每种情况,灵敏度和特异性(当所有三个预测组合在一组中时)在75%的灵敏度和65%特异性的值上最大化,导致对于LAD、LCX和RCA预测的阈值分别约为-0.01169、约-0.0311和约0.0178。对于CAD预测为阳性的病例,该方法对几乎所有动脉都产生了阳性预测。

表9

模型 AUC 灵敏度 特异性
整体 0.67(0.64,0.70) 0.74(0.68,0.79) 0.60(0.57,0.63)
LAD 0.69(0.64,0.75) 0.76(0.66,0.84) 0.63(0.57,0.69)
LCX 0.67(0.61,0.72) 0.76(0.63,0.85) 0.58(0.53,0.64)
RCA 0.67(0.61,0.73) 0.72(0.61,0.82) 0.61(0.56,0.66)

为了避免或最小化对于动脉阳性的过度预测的可能性,系统被配置为分别选择数值为0.1116、0.1596和0.1840的阈值,以提供针对LAD的72%的CAD阳性,针对LCX的45%的CAD阳性以及针对RCA的53%的CAD阳性。换句话说,对于LAD,该阈值导致如下阳性预测:受试者的实例中有72%在LCAD中为CAD阳性;受试者的实例中有45%在LCX中为CAD阳性;受试者的实例中有53%在RCA中为CAD阳性。

表10显示了测试集中所有患者的整体和单个动脉的结果(N=411名患者,其中101名被诊断在LAD中有CAD,66名被诊断在LCX中有CAD,并且72名被诊断在RCA中有CAD)。

表10

对于定位CNN的讨论定位CNN研究表明,女性(至少在CADLAD研究中观察到的女性)倾向于在单动脉中患有CAD。此外,女性(至少在CADLAD研究中观察到的女性)经常在小动脉中发展为CAD。这些观察结果可能表明更难发现女性的CAD;因此,即使在血管造影期间,女性也未得到充分诊断。这些结果进一步表明,为了正确诊断女性CAD,应该使用患病女性比例更高的、更大、更多样化的数据集。

在美国临时申请第62/907,141号中提供了如在CADLAD研究中执行的额外的实验数据和方法(包括视觉特征分析)以及本文描述的方法的额外细节,其通过引用整体并入于此。

此外,在美国临时申请第62/907,141号中提供了如本文所述的B2B CNN和/或定位CNN的示例集成,以生成用于指示疾病存在的预测分数,包括冠状动脉疾病。此外,本文所述的B2B CNN和/或定位CNN可单独使用或与其他方法结合使用以表征LHF、异常LVEDP等病理。

讨论

神经网络模型(例如深度神经网络模型、如本文所述的卷积神经网络模型)具有跨测试集(即确认集、验证集和选通集)的预测能力,并且可以与其他预测算法结合使用以进一步提高卷积神经网络模型的性能。如本文所述的卷积神经网络模型搜索方法可以产生AUC为0.65或更大的算法。更大的确认集可以对模型在更大的人群集中的真实性能提供更好的度量。例如,具有更大的数据集可以提供每种疾病分布的更多示例,即仅LAD、仅LCX、仅RCA、LAD/LCX、LAD/RCA、LCX/RCA和LAD/LCX/RCA。这些类别可能具有不同的疾病迹象——因此更大的数据集可以为更严格地研究每个类别提供更多的训练示例。

示例计算环境

图11示出了其中可以实现例示实施例和方面的例示化计算环境。

计算设备环境只是一个合适的计算环境的例子,并不表明对使用范围或功能进行任何限制。

可以使用许多其他通用或专用计算设备环境或配置。可能适合使用的众所周知的计算设备、环境和/或配置示例包括但不限于:个人计算机、服务器计算机、手持或膝上型设备、多处理器系统、基于微处理器的系统、网络个人计算机(PC)、小型机、主机计算机、嵌入式系统、包括任意上述系统或设备的分布式计算环境。

可以使用由计算机执行的计算机可执行指令,例如程序模块。一般来说,程序模块包括例程、程序、对象、组件、数据结构等,它们执行特定的任务或实现特定的抽象数据类型。在任务由通过通信网络或其他数据传输介质连接起来的远程处理设备执行的情况下,可以使用分布式计算环境。在分布式计算环境中,程序模块和其他数据可能位于本地和远程计算机存储介质(包括内存存储设备)中。

参照图11,用于实现本文所描述的方面的例示系统包括计算设备,例如计算设备1100。在其最基本的配置中,计算设备1100通常包括至少一个处理单元1102和存储器1104。根据计算设备的具体配置和类型,存储器1104可能是易失性的(如随机存取存储器(RAM)),非易失性的(如只读存储器(ROM),闪存等),或两者的某种组合。这个最基本的配置如图11中通过虚线1106所示。

计算设备1100可以有额外的特征/功能。例如,计算设备1100可包括额外的存储装置(可移除的和/或不可移除的),包括但不限于磁盘或光盘或磁带。这种额外的存储装置在图11示出为可移除的存储装置1108和不可移除的存储装置1110。

计算设备1100通常包括各种计算机可读介质。计算机可读介质可以是设备1100可以访问的任何可用介质,包括易失性和非易失性介质、可移除的和不可移除的介质。

计算机存储介质包括以任何方法或技术实现的易失性和非易失性、以及可移动和不可移动的介质,用于存储信息,如计算机可读指令、数据结构、程序模块或其他数据。内存1104、可移动存储设备1108和不可移动存储设备1110都是计算机存储介质的例子。计算机存储介质包括但不限于:RAM、ROM、电可擦程序只读存储器(EEPROM)、闪存或其他存储技术、CD-ROM、数字通用磁盘(DVD)或其他光存储、磁带、磁带、磁盘存储或其他磁性存储设备、或任何其他可以用来存储所需信息并可通过计算设备1100访问的介质。任何这样的计算机存储介质都可以是计算设备1100的一部分。

计算设备1100可能包含通信连接1112,其允许该设备与其他设备通信。计算设备1100也可以具有输入设备1114,如键盘、鼠标、笔、语音输入设备、触摸输入设备等(单独或组合的)。输出设备1116(如显示器、扬声器、打印机、振动机构等)也可以单独或组合地包括在内。所有这些设备都是本领域众所周知的,不需要在这里详细讨论。

应该理解的是,这里描述的各种技术可能与硬件组件或软件组件相关联,或者在适当的情况下,通过两者的组合来实现。可以使用的硬件组件的示例类型包括图形处理单元(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSPs)、片上系统(SOC)、复杂可编程逻辑器件(CPLD)等。目前公开的主题的方法和设备或其某些方面或部分可采取程序代码(即指令)的形式,具体体现在有形介质中(如软盘、CD-ROM、硬盘驱动器或任何其他机器可读存储介质,其中,当程序代码被加载到机器(如计算机)中并由其执行时,该机器就成为实践目前公开的主题的装置。

尽管例示的实施可能指在一个或多个独立的计算机系统的环境下使用目前公开的主题,但是主题却不限于此,而是可以在任何计算环境、如网络或分布式计算环境下实现。此外,目前所公开的主题事项的各个方面可以在多个处理芯片或设备中或跨多个处理芯片或设备实现,存储装置也可以类似地跨多个设备实现。例如,这些设备可包括个人计算机、网络服务器、手持设备和可穿戴设备。

虽然主题已经用特定于结构特征和/或方法行为的语言进行了描述,但需要理解的是,所附权利要求书中定义的主题并不一定限于上述的特定特征或行为。相反,上面描述的具体特征和行为是作为实施权利要求的示例形式公开的。

可以与例示方法和系统一起使用的处理的其他例子在一下文献中进行了描述:专利号为9,289,150、发明名称为“Non-invasive Method and System for CharacterizingCardiovascular Systems”的美国专利;专利号为9,655,536、发明名称为“Non-invasiveMethod and System for Characterizing Cardiovascular Systems”的美国专利;专利号为9,968,275、发明名称为“Non-invasive Method and System for CharacterizingCardiovascular Systems”的美国专利;专利号为8,923,958、发明名称为“System andMethod for Evaluating an Electrophysiological Signal”的美国专利;专利号为9,408,543、发明名称为“Non-invasive Method and System for CharacterizingCardiovascular Systems and All-Cause Mortality and Sudden Cardiac Death Risk”的美国专利;专利号为9,955,883、发明名称为“Non-invasive Method and System forCharacterizing Cardiovascular Systems and All-Cause Mortality and SuddenCardiac Death Risk”的美国专利;专利号为9,737,229、发明名称为“NoninvasiveElectrocardiographic Method for Estimating Mammalian Cardiac Chamber Size andMechanical Function”的美国专利;专利号为10,039,468、发明名称为“NoninvasiveElectrocardiographic Method for Estimating Mammalian Cardiac Chamber Size andMechanical Function”的美国专利;专利号为9,597,021、发明名称为“NoninvasiveMethod for Estimating Glucose,Glycosylated Hemoglobin and Other BloodConstituents”的美国专利;专利号为9,968,265、发明名称为“Method and System forCharacterizing Cardiovascular Systems From Single Channel Data”的美国专利;专利号为9,910,964、发明名称为“Methods and Systems Using Mathematical Analysisand Machine Learning to Diagnose Disease”的美国专利;公开号为2017/0119272、发明名称为“Method and Apparatus for Wide-Band Phase Gradient Signal Acquisition”的美国专利申请;PCT公开号为WO2017/033164、发明名称为“Method and Apparatus forWide-Band Phase Gradient Signal Acquisition”的国际申请;公开号为2018/0000371、发明名称为“Non-invasive Method and System for Measuring Myocardial Ischemia,Stenosis Identification,Localization and Fractional Flow Reserve Estimation”的美国专利申请;PCT公开号为WO2017/221221、发明名称为“Non-invasive Method andSystem for Measuring Myocardial Ischemia,Stenosis Identification,Localizationand Fractional Flow Reserve Estimation”的国际申请;专利号为10,292,596、发明名称为“Method and System for Visualization of Heart Tissue at Risk”的美国专利;申请号为16/402,616、发明名称为“Method and System for Visualization of HeartTissue at Risk”的美国专利申请;公开号为2018/0249960、发明名称为“Method andSystem for Wideband Phase Gradient Signal Acquisition”的美国专利申请;申请号为16/232,801、发明名称为“Method and System to Assess Disease Using Phase SpaceVolumetric Objects”的美国专利申请;PCT申请号为IB/2018/060708、发明名称为“Methodand System to Assess Disease Using Phase Space Volumetric Objects”的国际申请;公开号为US2019/0117164、发明名称为“Methods and Systems of De Noising Magnetic-Field Based Sensor Data of Electrophysiological Signals”的美国专利申请;2018年12月26日提交的公开号为2019/0214137、发明名称为“Method and System to AssessDisease Using Phase Space Tomography and Machine Learning”的美国专利申请;PCT申请号为PCT/IB2018/060709、发明名称为“Method and System to Assess DiseaseUsing Phase Space Tomography and Machine Learning”的国际申请;于2019年6月18日提交的公开号为2019/0384757、发明名称为“Methods and Systems to Quantify andRemove Asynchronous Noise in Biophysical Signals”的美国专利申请;与本申请同时提交的申请号为_/_/_、发明名称为“Method and System to Assess Disease UsingPhase Space Tomography and Machine Learning”的美国专利申请(代理人案卷编号10321-034usl,并要求美国专利临时申请第62/784,984号和第62/835,869号的优先权);公开号为US2019/0365265、发明名称为“Methods and Systems to Assess PulmonaryHypertension Using Phase Space Tomography and Machine Learning”的美国专利申请;申请号为_/_/_、发明名称为“Method and System for Automated Quantification ofSignal Quality”的美国专利申请(代理机构案卷号10321-036usl并要求美国专利临时申请第62/784,962号的优先权);申请号为15/653,433、发明名称为“Discovering NovelFeatures to Use in Machine Learning Techniques,such as Machine LearningTechniques for Diagnosing Medical Condition”的美国专利申请;申请号为15/653,431、发明名称为“Discovering Genomes to Use in Machine Learning Techniques”的美国专利申请;申请号为_/_/_(代理机构案号为10321-040pvl要求美国专利临时申请第62/862,991号的优先权)、发明名称为“Method and System to Assess Disease UsingDynamic Analysis of Biophysical Signals”的美国专利申请;申请号_/_/_(代理机构案号为10321-041pvl并且要求美国专利临时申请第62/863,005号的优先权)、发明名称为“Method and System to Assess Disease Using Dynamical Analysis of Cardiac andPhotoplethysmographic Signals”的美国临时专利申请,每篇文献均通过引用整体并入本文。

除非另有明确说明,否则不打算将本文中阐述的任何方法解释为要求其步骤以特定顺序执行。因此,如果方法权利要求实际上并未叙述其步骤所遵循的顺序,或者在权利要求或说明书中没有另外具体说明这些步骤将被限制为特定顺序,则在任何方面绝不认为该顺序是意图推断。这适用于任何可能的非明确解释基础,包括:关于步骤安排或操作流程的逻辑问题;源自语法组织或标点符号的简单含义;说明书中描述的实施例的数量或类型。

虽然已经结合某些实施例和具体示例描述了方法和系统,但不旨在将范围限制于所阐述的特定实施例,因为本文中的实施例旨在在所有方面是说明性的而不是限制性的。

本文所述的方法、系统和处理可用于产生狭窄和FFR输出,以用于与诸如将血管支架放置在诸如活体(例如人)受试者的动脉之类的血管内的程序以及其他介入和手术系统或处理一起使用。在一个实施例中,本文描述的方法、系统和处理可以被配置为使用FFR/狭窄输出来确定和/或修改手术中要放置在活体(例如,人)中的支架的数量,包括它们在给定血管内的最佳部署位置等。

可以使用例示方法和系统整体或部分地分析的其他生物物理信号的例子包括但不限于:心电图(ECG)数据集、脑电图(EEG)数据集、伽马同步信号数据集、呼吸功能信号数据集、脉搏血氧饱和度信号数据集、灌注数据信号数据集、准周期生物信号数据集、胎儿ECG数据集、血压信号、心脏磁场数据集和心率信号数据集。

示例性分析可用于心脏相关病理和病症和/或神经系统相关病理和病症的诊断和治疗,此类评估可应用于诊断和治疗(包括手术、微创和/或药物治疗)其中生物物理信号涉及活体的任何相关系统的任何病理或病症。心脏方面的一个例子是CAD的诊断及其通过多种疗法的治疗(单独或组合),例如在冠状动脉中放置支架,进行旋切术,血管成形术,药物治疗处方,以及/或运动处方、营养和其他生活方式改变等。可以诊断的其他心脏相关病理或病症包括例如心律失常、充血性心力衰竭、瓣膜衰竭、肺动脉高压(例如肺动脉高血压、左心疾病引起的肺动脉高压、肺病引起的肺动脉高压、慢性血栓引起的肺动脉高压和其他疾病(如血液或其他疾病)引起的肺动脉高压)、以及其他与心脏相关的病理、病症和/或疾病。可诊断的神经相关疾病、病理或病症的非限制性实例包括例如癫痫、精神分裂症、帕金森病、阿尔茨海默病(和所有其他形式的痴呆)、自闭症谱系(包括阿斯伯格综合征)、注意力缺陷多动障碍、亨廷顿病、肌营养不良症、抑郁症、双相情感障碍、脑/脊髓肿瘤(恶性和良性)、运动障碍、认知障碍、语言障碍、各种精神病、脑/脊髓/神经损伤、慢性创伤性脑病、丛集性头痛、偏头痛、神经病(各种形式,包括周围神经病)、幻肢/疼痛、慢性疲劳综合征、急性和/或慢性疼痛(包括背痛、背部手术失败综合征等)、运动功能障碍、焦虑症、由感染或外来因素(如莱姆病、脑炎、狂犬病)引起的病症、发作性睡病和其他睡眠障碍、创伤后应激障碍、与中风、动脉瘤、出血性损伤等相关的神经系统病症/影响、耳鸣和其他与听力相关的疾病/病症以及与视力相关的疾病/病症。

当这里描述任何数值或者范围时,除非另外明确的说明,否则该数值或者范围是近似的。当这里描述任何范围时,除非另外明确的说明,否则该范围包括其中的所有值以及其中的子范围。这里通过参考引入的任何材料(美国专利/外国专利,美国专利申请/外国专利申请,书籍,文章等)中的任何信息仅仅是在这些信息与这里阐述的其他陈述和附图之间不存在冲突的情况下通过参考而引入的。在出现冲突的情况下,包括那些会导致这里的任何权利要求无效或者无法要求优先权的冲突,那么通过参考材料引入的任何这些冲突信息特别地没有通过参考而引入。

55页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:分体式连接

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!