使用语音分析检测认知衰退的系统和方法

文档序号：1894135 发布日期：2021-11-26 浏览：5次 >En<

阅读说明：本技术 使用语音分析检测认知衰退的系统和方法 (System and method for detecting cognitive decline using speech analysis ) 是由 V·纳拉扬 S·瓦拉万于 2020-04-14 设计创作，主要内容包括：本发明公开了使用分类系统检测受检者认知衰退的系统和方法,该分类系统用于基于语音样本检测受检者的认知衰退。使用对应于正常患者和认知衰退患者的语音音频记录的语音数据来训练分类系统,以生成包括集成模块和多个分量分类器的集成分类器。多个分量分类器中的每个分量分类器为被配置为生成将样本数据识别为对应于正常患者或认知衰退患者的分量输出的机器学习分类器。基于可用特征子集来生成机器学习分类器。集成模块接收来自所有分量分类器的分量输出,并且基于该分量输出生成将样本数据识别为对应于正常患者或认知衰退患者的集成输出。(Systems and methods for detecting cognitive decline in a subject using a classification system for detecting cognitive decline in a subject based on speech samples are disclosed. A classification system is trained using speech data corresponding to speech audio recordings of normal patients and cognitive decline patients to generate an integrated classifier that includes an integration module and a plurality of component classifiers. Each component classifier of the plurality of component classifiers is a machine learning classifier configured to generate a component output that identifies the sample data as corresponding to a normal patient or a cognitively declining patient. A machine learning classifier is generated based on the subset of available features. An integration module receives the component outputs from all of the component classifiers and generates an integration output based on the component outputs that identifies the sample data as corresponding to a normal patient or a cognitively declining patient.)

使用语音分析检测认知衰退的系统和方法

优先权声明

本申请要求于2019年4月15日提交的名称为“System and Method forPredicting Cognitive Decline”的美国临时申请序列号62/834,170的优先权，该文献的整个内容据此以引用方式并入本文。

背景技术

轻度认知损害(MCI)导致认知能力(包括记忆力和思维能力)出现轻微但明显且可测量的衰退。由MCI导致的变化还没有严重到影响日常生活，并且患有MCI的人可能不符合针对痴呆的诊断指南。然而，患有MCI的那些人最终发展成阿尔茨海默病(AD)或另一种类型的痴呆的风险增大。早期的治疗干预可提供更好的成功前景。

情节记忆是对事件或“情节”的记忆。其包括顺行(新遇到的信息)组成部分或逆行(过去的事件)组成部分。语言情节记忆衰退最早出现在患有临床前/前驱期AD的患者中，并且对疾病进展进行预测。MCI中语言情节记忆衰退的评估表示早期认知变化，并且可用作用于及时检测和启动早期/临床前AD的治疗的筛选工具。

发明内容

本发明的一个示例性实施方案涉及一种用于检测受检者认知衰退的方法。该方法包括：获取受检者基线语音数据，该受检者基线语音数据对应于受检者的响应于提供给受检者的第一指令集的多个语音音频记录；以及获取受检者试验语音数据，该受检者试验语音数据对应于受检者的响应于提供给受检者的第二指令集的另外的语音音频记录。该方法还包括以下步骤：从受检者基线语音数据和受检者试验语音数据提取多个特征；以及通过使用受检者基线语音数据归一化受检者试验语音数据来生成受检者测试数据。该方法进一步包括使用经训练的集成分类器来分析受检者测试数据。经训练的集成分类器包括集成模块和多个分量分类器。多个分量分类器中的每个分量分类器被配置为生成将受检者测试数据识别为对应于正常患者或认知衰退患者的分量输出。每个分量分类器被配置为分析选自多个特征的特征子集。集成模块被配置为接收来自分量分类器的分量输出，并且基于该分量输出生成将受检者测试数据识别为对应于正常患者或认知衰退患者的集成输出。使用对应于正常患者和认知衰退患者组的响应于第一指令集的先前语音音频记录的训练基线语音数据来训练多个分量分类器，并且训练试验语音数据对应于正常患者和认知衰退患者组的响应于第二指令集的先前语音音频记录。

提供了一种用于检测受检者认知衰退的装置。该装置包括：被配置为生成音频输出的音频输出布置结构；被配置为接收音频信号并生成对应于音频信号记录的数据的音频输入布置结构；以及显示器。该装置还包括处理器和非暂态计算机可读存储介质，该非暂态计算机可读存储介质包括能够由处理器执行的指令集。该指令集能够操作以：指示音频输出布置结构多次向受检者可听地提供第一指令集；从音频输入布置结构接收对应于受检者的响应于第一指令集的多个语音音频记录的受检者基线语音数据；指示音频输出布置结构向受检者可听地提供第二指令集；从音频输入布置结构接收对应于受检者的响应于第二指令集的另外的语音音频记录的受检者试验语音数据；从受检者基线语音数据和受检者试验语音数据提取多个特征；通过使用受检者基线语音数据归一化受检者试验语音数据来生成受检者测试数据；使用经训练的集成分类器来分析受检者测试数据，以生成指示受检者是否可能遭受认知衰退的输出；以及指示显示器向用户提供输出的视觉表示。该装置还包括被配置为存储经训练的集成分类器的存储器。经训练的集成分类器包括集成模块和多个分量分类器。多个分量分类器中的每个分量分类器被配置为生成将受检者测试数据识别为对应于正常患者或认知衰退患者的分量输出。每个分量分类器被配置为分析选自多个特征的特征子集。集成模块被配置为接收来自分量分类器的分量输出，并且基于该分量输出生成将受检者测试数据识别为对应于正常患者或认知衰退患者的集成输出。使用对应于正常患者和认知衰退患者组的响应于第一指令集的先前语音音频记录的训练基线语音数据来训练多个分量分类器，并且训练试验语音数据对应于正常患者和认知衰退患者组的响应于第二指令集的先前语音音频记录。

在另一个示例性实施方案中，提供了一种用于训练分类系统的计算机实现的方法。分类系统被配置为基于受检者的语音样本来检测受检者的认知衰退。该方法包括从正常患者和认知衰退患者组获取训练基线语音数据和训练试验语音数据。训练基线语音数据对应于正常患者和认知衰退患者组的响应于第一指令集的语音音频记录，并且训练试验语音数据对应于正常患者和认知衰退患者组的响应于第二指令集的语音音频记录。该方法还包括从(i)训练基线语音数据和(ii)训练试验语音数据提取多个特征。该方法还包括生成包括集成模块和多个分量分类器的集成分类器。多个分量分类器中的每个分量分类器被配置为生成将样本数据识别为对应于正常患者或认知衰退患者的分量输出。每个分量分类器被配置为分析选自多个特征的特征子集。集成模块被配置为接收来自分量分类器的分量输出，并且基于该分量输出生成将样本数据识别为对应于正常患者或认知衰退患者的集成输出。该方法还包括：通过使用训练基线语音数据归一化训练试验语音数据来生成训练数据集；以及使用训练数据集来训练集成分类器。

还提供了一种用于训练分类系统的系统。分类系统被配置为基于受检者的语音样本来检测受检者的认知衰退。该系统包括被配置为存储来自正常患者和认知衰退患者组的训练基线语音数据和训练试验语音数据的数据库。训练基线语音数据对应于正常患者和认知衰退患者组的响应于第一指令集的语音音频记录，并且训练试验语音数据对应于正常患者和认知衰退患者组的响应于第二指令集的语音音频记录。系统还包括能够被操作地连接以与数据库通信的计算装置。计算装置包括处理器和非暂态计算机可读存储介质，该非暂态计算机可读存储介质包括能够由处理器执行的指令集。该指令集能够操作以：从数据库检索训练基线语音数据和训练试验语音数据；从(i)训练基线语音数据和(ii)训练试验语音数据提取多个特征；生成包括集成模块和多个分量分类器的集成分类器。多个分量分类器中的每个分量分类器被配置为生成将样本数据识别为对应于正常患者或认知衰退患者的分量输出。每个分量分类器被配置为分析选自多个特征的特征子集。集成模块被配置为接收来自分量分类器的分量输出，并且基于该分量输出生成将样本数据识别为对应于正常患者或认知衰退患者的集成输出。该指令集进一步能够操作为：通过使用训练基线语音数据归一化训练试验语音数据来生成训练数据集；以及使用训练数据集来训练集成分类器。该系统还包括被配置为存储经训练的集成分类器的存储器。

对于本领域的技术人员而言，在阅读本发明的以下详细描述(包括附图和所附权利要求书)之后，本发明的这些方面和其他方面将变得显而易见。

附图说明

图1示出了根据本申请的一个示例性实施方案的用于训练分类系统的系统，该分类系统用于基于受检者的语音样本来检测认知衰退。

图2示出了根据本申请的一个示例性实施方案的用于训练分类系统的方法，该分类系统用于基于受检者的语音样本来检测认知衰退。

图3示出了根据本申请的一个示例性实施方案的包括集成模块和多个分量分类器的集成分类器。

图4示出了用于为图3的示例性集成分类器的每个分量分类器独立地选择语音特征子集的方法。

图5示出了根据本申请的一个示例性实施方案的用于基于受检者的语音样本来检测认知衰退的装置。

图6示出了根据本申请的一个示例性实施方案的用于基于受检者的语音样本来检测认知衰退的方法。

图7示出了根据本申请的实施例I的用于基于受检者的语音样本来检测认知衰退的示例性系统，该示例性系统包括集成分类器。

图8示出了根据本申请的实施例I的对应于词语的平均数的数据，这些词语在雷伊听觉语言学习测试(RAVLT)的示例性实施方案中在不同步骤中被回忆。

具体实施方式

本申请涉及用于通过使用计算机实现的方法分析对应于从神经心理测试诸如词语表回忆(WLR)测试获取的受检者或患者的语音样本的数据来检测和/或预测认知衰退(特别是MCI)的装置和方法。神经心理测试能够筛选受检者的认知能力，包括例如记忆力。另外，本申请包括用于被配置为基于受检者的WLR语音样本来检测认知衰退(例如，MCI)和/或预测认知衰退或痴呆(例如，AD)的发作的训练分类系统的系统和方法。

图1示出了用于训练分类系统的系统100的示例性实施方案，该分类系统用于基于受检者的语音样本检测和/或预测认知衰退，特别是MCI。系统100包括数据库110，该数据库用于存储各种类型的数据，包括对应于先前施用的WLR测试的音频记录的数据。具体地讲，数据库110包括训练基线语音数据112，以及各自在不同实验条件下获取的训练试验语音数据114的一个或多个集，如下文将进一步所述。数据库110可存储在一个或多个非暂态计算机可读存储介质上。

数据库110可以能够被操作地连接到计算装置120，用于将存储在数据库110内的数据的一部分或全部提供给计算装置120，或用于允许计算装置120检索存储在数据库110内的数据的一部分或全部。如图1所示，数据库110经由通信网络140(例如，互联网、广域网、局域网、蜂窝网络等)连接到计算装置120。然而，还设想数据库110可经由有线连接直接连接到计算装置120。该实施方案中的计算装置120包括处理器122、计算机可访问介质124和输入/输出装置126，该输入/输出装置用于向和/或从计算装置120接收和/或传输数据和/或指令。处理器122可包括例如一个或多个微处理器，并且使用存储在计算机可访问介质124(例如，存储器存储装置)上的指令。计算机可访问介质124可例如为其中包含可执行指令的非暂态计算机可访问介质。系统100可进一步包括存储器存储装置130，该存储器存储装置与计算机可访问介质124分开提供，用于存储由系统100生成并训练的集成分类器300。存储器存储装置130可为计算装置120的一部分，或可在计算装置120的外部并且能够被操作地连接到计算装置。存储器存储装置130还可连接到用于检测和/或预测受检者的认知衰退的单独计算装置(未示出)。在另一个实施方案中，集成分类器300可存储在另一个存储器存储装置(未示出)上，该另一个存储器存储装置连接到用于检测和/或预测受检者的认知衰退的单独计算装置(未示出)。

图2示出了用于训练分类系统的方法200的示例性实施方案，该分类系统用于基于受检者的语音样本检测和/或预测认知衰退。具体地讲，方法200生成并训练集成分类器300，该集成分类器用于分析语音样本(例如，WLR语音样本)，以确定样本与正常患者的样本还是与认知衰退患者(例如，MCI患者)的样本更相关。WLR语音样本可从数据库110采集，该数据库可存储对应于先前记录的来自各种WLR测试的音频文件的数据，诸如例如使用RAVLT来评估语言情节记忆的实验。RAVLT是基于词语表的检查者施用的工具，其可用于测量语言情节记忆。其可用于检测和/或生成与语言记忆相关的分数，包括与认知能力相关的学习速率、短期和延迟语言记忆、干扰刺激后回忆表现、认知记忆和学习模式(系列位置效应)。

在步骤202中，计算装置110从数据库110接收训练基线语音数据112的多个集，该多个集对应于正常患者和认知衰退患者组的先前语音音频记录的多个集。训练基线语音数据112的每个集对应于正常患者和认知衰退患者组的响应于同一指令集的语音，该同一指令集用于收听词语表并回忆和说出同一词语表。例如，训练基线语音数据112对应于正常患者和认知衰退患者组的响应于第一指令集的语音，该第一指令集用于收听第一词语表并立即回忆和说出第一词语表。在一个具体实施方案中，训练基线语音数据112可包括对应于来自WLR测试诸如例如RAVLT测试的学习试验的正常患者和认知衰退患者组的语音音频记录的数据。步骤202可利用训练基线语音数据112的任何合适数量的集来建立平均基线特性，可将训练试验语音数据114与该平均基线特征进行比较，以识别和/或增强包含在训练试验语音数据114内的特征判别信号。具体地讲，训练基线语音数据112可包括来自任何合适的WLR测试的学习阶段数据。训练基线语音数据112(具体地讲，学习阶段数据)用作基线特征，可将训练试验语音数据114与该基线特性进行比较，以生成正常患者和认知衰退患者组的认知负荷的定量表示。在一些实施方案中，可使用训练基线语音数据112的至少3个集、至少5个集或至少10个集。在一个示例性实施方案中，使用训练基线语音数据112的5个集。

计算装置110还从数据库110接收训练试验语音数据114的一个集。方法200使用训练试验语音数据114的该集，以生成用于训练集成分类器300的训练数据集330和/或生成集成分类器300，如将在下文进一步所述。与训练基线语音数据112相比，训练试验语音数据114对应于正常患者和认知衰退患者组的响应于至少一个不同指令集的先前语音音频记录，该至少一个不同指令集用于回忆和说出。例如，不同指令集可指示患者收听不同词语表并立即回忆和说出不同词语表。又如，不同指令集可指示患者收听与用于训练基线语音数据112的词语表相同的词语表，但在注意力分散任务之后和/或在延迟一段时间(例如，至少或约10分钟，至少或约20分钟，或至少或约30分钟)之后回忆和说出词语表。在一个具体实施方案中，训练试验语音数据112可包括对应于来自WLR测试诸如例如RAVLT测试的注意力分散试验、注意力分散后试验和/或延时试验的正常患者和认知衰退患者组的语音音频记录的数据。

在一个具体实施方案中，用于训练基于受检者的语音样本来检测和/或预测受检者的认知衰退的分类系统的方法200可利用作为RAVLT测试的一部分从正常患者和MCI患者获取的临床试验数据。图8中提供了对应于在RAVLT测试的示例性实施方案的不同步骤中被回忆的词语的平均数的数据。如图8所示，RAVLT测试可包括为RAVLT试验的学习阶段802的一部分的多个不同试验(例如，试验I-V 811-815)。在步骤202中，计算装置110可检索为RAVLT试验的该学习阶段802的一部分的语音数据，作为训练基线语音数据112。图8还示出了RAVLT测试包括不同类型的回忆试验：注意力分散试验B 822、注意力分散后回忆824和20分钟延迟回忆826。计算装置110可检索在这些回忆试验中的任一者期间收集的语音数据，作为步骤202的训练试验语音数据114。

在步骤204中，计算装置110从接收自数据库110的语音数据集((i)训练基线语音数据112的多个集，以及(ii)训练试验语音数据114的集)中的每一者分析并提取多个语音特征。具体地讲，计算装置110从上述数据集中的每一者提取相同类型的语音特征集。计算装置110可从语音数据集中提取任何合适类型的声学属性作为语音特征，用于分析口语语音的音频记录，包括对应于此类声学属性的平均数据值和标准偏差数据值。例如，语音特征可包括下表1中列出和定义的语音音频记录的示例性声学属性中的一个或多个声学属性。在一些实施方案中，语音特征可包括对应于语音音频记录的帧上的这些示例性声学属性的平均数据值和/或标准偏差数据值的全部或子集。

表1.

计算装置120可从每个语音数据集中提取任何合适数量的语音特征。增加数量的语音特征可改善本申请的系统和方法的预测性能和/或分析性能，但在计算上可能变得麻烦。因此，可选择适当数量的语音特征以在预测性能和/或分析性能与计算效率之间实现平衡。在一些实施方案中，计算装置120可从每个语音数据集提取至少24个、至少30个、至少50个或至少100个不同的语音特征。在一个实施方案中，计算装置120可从每个语音数据集提取5个至150个语音特征、10个至100个语音特征、12个至50个语音特征。

在步骤206中，计算装置120基于从数据库110接收的训练试验语音数据114的集和在前一步骤(步骤204)中获取的训练试验语音数据114的相关语音特征来生成集成分类器300。如图3所示，集成分类器300包括多个分量分类器310和一个集成模块320。每个分量分类器310是被配置为生成将样本数据识别为对应于正常患者或认知衰退患者的样本数据的分量输出的机器学习分类器。当使用从正常患者和MCI患者获取的数据来训练分量分类器310时，分量分类器310各自是被配置为生成将样本数据识别为对应于正常患者或MCI患者的样本数据的分量输出的机器学习分类器。更具体地讲，分量分类器310中的每个分量分类器是支持向量机(SVM)。还设想分量分类器310中的每个分量分类器可另选地利用其他合适的监督学习模块，诸如例如逻辑回归模块、极端梯度提升模块、随机森林模块或朴素贝叶斯模块。分量分类器310中的每个分量分类器由计算装置120生成，以分析训练试验语音数据114的语音特征的降采样子集。对于每个分量分类器310，使用图4所示并且在下文进一步描述的方法400独立地选择语音特征子集。集成分类器300可包括任何合适数量(N)的分量分类器310。例如，集成分类器300可包括至少10个、至少20个、至少30个或至少50个分量分类器310。在一个具体实施方案中，集成分类器300包括30个分量分类器310。

集成模块320被配置为接收来自所有分量分类器310的分量输出，并且基于该分量输出生成将样本数据识别为对应于正常患者或MCI患者的集成输出340。集成模块320可利用任何合适的方法，基于由分量分类器310中的每个分量分类器提供的分量输出来确定集成输出340。例如，集成模块320可利用以相等权重接收并考虑来自分量分类器310中的每个分量分类器的分量输出的装袋法或聚合法。另选地，集成模块320可利用其中分量输出被不同地加权的其他方法，例如，自适应提升方法或梯度提升方法。

图4示出了用于为每个分量分类器310独立地选择语音特征子集的方法400的示例性实施方案。每次步骤206选择语音特征的期望降采样子集以用于生成每个分量分类器310时，计算装置120重复方法400。换句话讲，计算装置120使用方法400分析训练试验语音数据114以选择用于生成第一分量分类器311的语音特征的期望降采样子组，重复该分析以选择语音特征的不同降采样子集以生成下一个分量分类器312，并且进一步重复该分析以生成后续分量分类器313至317，直到计算装置120已经选择语音特征的降采样子集并生成第N个分量分类器317。方法400为分量分类器310中的每个分量分类器选择语音特征的不同降采样子集，这允许计算装置120生成具有分量分类器310的集成分类器300，每个分量分类器仅对所有可用语音特征子集进行建模，但在更多数量的语音特征上进行共同采样。集成分类器300的该结构提供了具有改善的预测性能和/或分析性能的模块，该模块结合更多数量的语音特征，同时限制分量分类器310中的每个分量分类器仅分析每个分量分类器的语音特征的所选子集，以提供改进的计算效率。

在步骤402中，计算装置120分析训练试验语音数据114以获取训练试验语音数据114的二次采样样本。如下所述，计算装置120使用该二次采样样本来识别针对减少数量的语音特征生成的分量分类器310的期望参数和特征。二次采样样本包括训练试验语音数据114的来自正常患者的第一数量样本和训练试验语音数据114的来自认知衰退患者的第二数量样本。可从训练试验语音数据114中来自正常患者的条目中随机选择第一数量样本。类似地，可从训练试验语音数据114中来自认知衰退患者的条目中随机选择第二数量样本。为了在步骤402中在两个不同患者类别(即，正常患者和认知衰退患者)之间提供基本平衡，第二数量样本为第一数量样本的至少80％、第一数量样本的至少90％或第一数量样本的至少95％。优选地，平衡二次采样样本，使得第一数量样本与第二数量样本的比率为1:1。这种优选的二次采样允许方法400的其余部分继续处理在正常患者和认知衰退患者这两个类别之间同等平衡的数据。通常，训练试验语音数据114可包括比认知衰退患者更多的正常患者，并且因此提供在这两个类别之间不平衡的数据。平衡的二次采样有助于解决训练试验语音数据114中可能出现的任何类别不平衡，这种类别不平衡原本将导致偏向较大类别(正常患者)的分类器，这可导致分类器中的假阴性并遗漏原本应被识别为对应于认知衰退患者的患者。因此，集成分类器300针对使用基本上相等或相等比例的正常患者和认知衰退患者选择的语音特征子集组合若干单个分量分类器310，并且因此提供在不同语音特征的样本中平衡并且因此能够从整个训练数据集学习的分类器。

在步骤404中，计算装置120分析训练试验语音数据114的二次采样样本的所有语音特征并且基于预定标准对语音特征进行排序。语音特征可基于任何合适的统计标准进行排序，用于识别对特征判别信号贡献最显著的那些特征，如在训练试验语音数据114的二次采样样本中所观察到的。具体地讲，可基于语音特征中的每一者对训练试验语音数据114的二次采样样本的特征重要性来对语音特征进行排序。具体地讲，当分量分类器310是SVM时，计算装置120可基于语音特征在指定正常患者和认知衰退患者之间的差异(例如，决策边界)方面的重要性来对语音特征进行排序，如在从先前步骤(步骤402)获取的二次采样样本中所观察到的。更具体地讲，每个语音特征可基于训练试试验语音数据114的二次采样样本，按照其对SVM超平面(例如，决策边界)的对应系数来排序。对SVM超平面具有较低系数的语音特征被认为对于指定SVM的决策边界相对不太重要，并且因此具有较低的特征重要性和较低的等级。

在步骤406中，计算装置120基于预定排序阈值(例如，仅针对前x个语音特征进行选择)从由前一步骤(步骤404)生成的语音特征的排序中选择语音特征子集。计算装置120使用x个语音特征的所选子集来生成用于分析降采样的x个特征的分量分类器310。通过选择前x个排序的语音特征，计算装置120生成分量分类器310，该分量分类器将对训练试验语音数据114内包含的特征判别信号贡献最显著的那些特征进行建模，同时将分量分类器310的计算成本限制为降采样数量的x个语音特征。设想可选择任何合适数量(x)的高排序特征。例如，步骤406可选择高排序特征中的至少10个、至少20个、至少30个。在一个具体实施方案中，针对每个分量分类器310，选择排序前20的特征。

返回方法200，在步骤208中，计算装置120生成训练数据集330，用于训练从前一步骤(步骤206)生成的集成分类器300。具体地讲，计算装置120生成训练数据集330，该训练数据集包括用训练基线语音数据112(具体地讲，训练基线语音数据112的多个集)归一化的训练试验语音数据114。在一个实施方案中，训练基线数据112包括来自WLR测试(例如，RAVLT测试)的学习阶段数据，并且通过用来自WLR测试的学习阶段数据归一化训练试验语音数据114来生成训练数据集330。从该实施方案所得的训练数据集提供对应于正常患者和认知衰退患者组的认知负荷的定量值。具体地讲，计算装置120生成训练数据集330，该训练数据集包括用训练基线语音数据112的多个集上的对应特征的平均值归一化的训练试验语音数据114的每个特征。更具体地讲，训练数据集330的每个特征可通过从训练试验语音数据114的特征中减去训练基线语音数据112的多个集上的特征的平均值来获取。用训练基线语音数据112的多个集对训练试验语音数据114的语音特征进行归一化，可增强包含在训练试验语音数据114内的特征判别信号，并且改善用此类归一化数据训练的集成分类器300的预测性能和/或分析性能。

在步骤210中，计算装置120使用由步骤208生成的训练数据集330来训练集成分类器300以生成经训练的集成分类器516。用训练数据集330的降采样部分来训练分量分类器310中的每个分量分类器，降采样部分对应于特征的被分量分类器选来建模的子集。因此，提供训练数据集330的唯一降采样部分以训练分量分类器310中的每个分量分类器。换句话讲，训练数据集330的用于训练分量分类器311的降采样部分不同于训练数据集330的用于训练其他分量分类器312至317的降采样部分。经训练的集成分类器516包括分量分类器310，每个分量分类器已选择语音特征子集以及由用训练数据集330训练分量分类器310生成的每个特征的对应加权系数值。经训练的集成分类器516可存储在任何合适的存储器中，并且可被加载到用于分析新患者语音数据的用户装置，以检测和/或预测受检者的认知衰退，特别是MCI。

图5示出了用于基于受检者的语音样本来检测和/或预测受检者的认知衰退的示例性装置500。装置500利用经训练的集成分类器516，如通过上述方法200所生成和训练的。装置500包括用于接收音频信号并生成对应于音频信号记录的数据的音频输入布置结构506。例如，音频输入布置结构506可包括用于捕获受检者的发声语音的麦克风。装置500还可包括用于生成音频输出的音频输出布置结构508。例如，音频输出布置结构508可包括用于向受检者可听地提供针对WLR测试的指令的扬声器。装置500还包括用于向用户生成视觉输出的显示器512。装置500可还包括用于向或从装置500接收和/或传输数据或指令的输入/输出装置510。装置500还包括处理器502和计算机可访问介质504。处理器502能够被操作地连接到音频输出布置结构508和显示器512，以控制装置500的音频输出和视觉输出。处理器502还能够被操作地连接到音频输入布置结构506，以接收和分析对应于由音频输入布置结构506捕获的音频记录的数据。处理器502可包括例如一个或多个微处理器，并且使用存储在计算机可访问介质504(例如，存储器存储装置)上的指令。计算机可访问介质504可例如为其中包含可执行指令的非暂态计算机可访问介质。装置500可进一步包括存储器存储装置514，该存储器存储装置与计算机可访问介质504分开提供，用于存储经训练的集成分类器516。存储器存储装置514可为装置500的一部分，或可在装置500的外部并且能够被操作地连接到该装置。

图6示出了根据本申请的一个示例性实施方案的用于基于受检者的语音样本来检测和/或预测受检者的认知衰退的示例性方法600。具体地讲，方法600从受检者获取WLR语音样本，以确定该样本与正常患者的样本还是与认知衰退患者的样本更相关。在步骤602中，由操作装置500的临床医生或由处理器502多次向受检者提供第一指令集，该处理器指示音频输出布置结构506向患者可听地提供第一指令集，并且处理器502从音频输入布置结构506接收对应于受检者的响应于第一指令集的多个语音音频记录的受检者基线语音数据。由临床医生或由处理器502向受检者提供第二指令集，该处理器指示音频输出布置结构506可听地提供第二指令集，并且处理器502从音频输入布置结构506接收对应于受检者的响应于第二指令集的语音音频记录的受检者试验语音数据。第一指令集可对应于上述步骤202中用于生成训练基线语音数据112的那些指令，并且第二指令集可对应于步骤202中用于生成训练试验语音数据114的那些指令。

在步骤604中，处理器502以与上文相对于步骤204所述类似的方式从受检者基线语音数据和受检者试验语音数据分析并提取多个特征。在步骤606中，处理器502以与上文相对于步骤208中的训练数据集所述类似的方式生成受检者测试数据，该受检者测试数据包括用受检者基线语音数据的对应特征归一化的受检者试验语音数据的每个特征。类似于步骤208，在一个实施方案中，受检者基线语音数据包括来自施用给受检者的WLR测试(例如，RAVLT测试)的学习阶段数据，并且通过用来自WLR测试的学习阶段数据归一化受检者试验语音数据来生成受检者测试数据。得自该实施方案的所得受检者测试数据提供对应于受检者认知负荷的定量值。在步骤608中，处理器502使用经训练的集成分类器516分析受检者测试数据。经训练的集成分类器516的多个分量分类器310中的每个分量分类器分析受检者测试数据，以生成将受检者测试数据识别为对应于正常患者或认知衰退患者的分量输出。经训练的集成分类器516的集成模块320接收来自分量分类器310的分量输出，并且分析该分量输出以生成将受检者测试数据识别为对应于正常患者或认知衰退患者的集成输出。处理器502还可基于由经训练的集成分类器516通过分析受检者测试数据生成的集成输出来生成输出，指示受检者是否具有增加的神经退行性变风险和/或可能遭受认知衰退。当集成输出将受检者测试数据识别为对应于认知衰退患者时，输出可指示受检者具有增加的神经退行性变风险和/或可能遭受认知衰退。相比之下，当集成输出将受检者测试数据识别对应于正常患者时，输出可指示受检者不具有增加的神经退行性变风险和/或不太可能遭受认知衰退。在步骤610中，处理器502指示显示器512提供显示输出的视觉显示。

可将由经训练的集成分类器516通过分析受检者测试数据生成的集成输出和/或由装置500生成的输出提供给临床医生，以筛选和识别具有增加的神经退行性变风险和/或遭受认知衰退的那些患者，包括但不限于语言情节记忆衰退、学习速率降低、短期语言记忆衰退、延迟语言记忆衰退、干扰刺激后回忆表现衰退、识别记忆衰退等。受检者测试数据被集成输出识别为对应于认知衰退患者的受检者可能具有增加患神经退行性疾病(诸如AD或另一种类型的痴呆)的风险。因此，通过分析受检者测试数据生成的集成输出和/或由装置500生成的输出可帮助临床医生引导具有风险的患者进行进一步的认知测试，以便确认集成输出和/或来自方法600的输出。因此，本申请的装置和方法能够比神经退行性疾病、痴呆或AD的常规诊断更早地识别那些具有神经退行性变风险的患者，并且为这些具有风险的患者提供更好的护理，和/或在认知衰退的早期阶段开始治疗。此外，当集成输出指示受检者测试数据对应于认知衰退患者并且/或者由装置500生成的输出指示受检者具有增加的神经退行性变风险和/或可能遭受认知衰退时，处理器502生成用于向受检者施用治疗的指令。在一些实施方案中，指令可指示自动施用治疗，而无需任何介入的用户干预。

合适的治疗可包括用于改善认知能力的治疗和/或用于延缓认知能力劣化的治疗。在一个示例中，治疗可包括非药理学治疗，诸如例如数字疗法(例如，脑训练模块)，以改善受检者的认知能力。在一些实施方案中，当集成输出指示受检者测试数据对应于认知衰退患者并且/或者由装置500生成的输出指示受检者具有增加的神经退行性变风险和/或可能遭受认知衰退时，可自动发起数字疗法。脑训练模块包括指令集，该指令集能够由处理器执行，用于施用脑训练练习以改善受检者的认知能力。脑训练模块可连接到用户界面，以向受检者显示脑训练练习指令并且接收来自用户的响应于此类指令的输入。

在另一个示例中，治疗可包括施用一种或多种用于预防和/或延缓神经退行性变进展的药物活性剂。具体地讲，治疗可包括施用一种或多种用于预防和/或延缓痴呆进展(或更具体地讲，用于预防和/或延缓AD进展)的药物活性剂。合适的药物活性剂可包括一种或多种用于预防或减少大脑中β-淀粉样蛋白或tau蛋白的聚集、改善大脑的突触或细胞弹性、调节ApoE4基因的表达、调节神经炎症相关通路等的药物活性剂。在一个示例中，药物活性剂可包括安定药、乙酰胆碱酯酶抑制剂等。

本领域的技术人员应当理解，本文所述的示例性实施方案可以任何数量的方式实现，包括以单独的软件模块形式、以硬件和软件的组合形式等。例如，示例性方法可以是存储在非暂态存储介质中并且包含代码行的一个或多个程序中的实施方案，该代码行在被编译时可由一个或多个处理器内核或单独的处理器执行。根据一个实施方案的系统包括多个处理器内核和在多个处理器内核上执行以执行上述示例性方法的一组指令。处理器内核或单独的处理器可结合在任何合适的电子器件中或可与任何合适的电子器件(例如在装置内的板处理布置结构或装置外部的处理布置结构上)进行通信，所述电子器件例如移动计算装置、智能电话、计算平板电脑、计算装置等，其可与装置的至少一部分进行通信。

实施例

实施例I

在实施例I中，示例性词语表回忆测试由检查者手动施用(类似于RAVLT测试的检查者)，并且还经由计算机装置施用给总共106名患者，其中84名是正常患者，22名患者遭受MCI。向患者中的每个患者提供用于收听第一词语表并立即回忆和说出第一词语表的第一指令集。第一词语表包括以下词语：鼓、头盔、音乐、咖啡、学校、父母、机器、花园、收音机、农夫、鼻子、水手、色彩、房屋、河流。记录每个患者的语音，以生成对应于语音记录的基线语音数据集。针对整个患者组，第一词语表的呈现和立即回忆总共重复5次，以生成5个不同的基线语音数据集。

然后使患者经受分散注意力任务。具体地讲，随后向每个患者提供用于收听第二词语表并回忆和说出第二词语表的第二指令集。第二词语表包括以下词语：桌子、游骑兵、鸟、鞋、炉子、山、眼镜、毛巾、云、船、羊羔、钟、铅笔、教堂、鱼。记录每个患者的语音，以生成对应于注意力分散试验的语音记录的试验语音数据集。在分散注意力任务之后，随后要求患者回忆和说出第一词语表。记录每个患者的语音，以生成对应于注意力分散后试验的语音记录的试验语音数据集。在20分钟延迟之后，随后再次要求患者回忆和说出第一词语表。记录每个患者的语音，以生成对应于延迟回忆试验的语音记录的试验语音数据集。

示例性语音特征集(例如，在语音音频记录的语音帧上的示例性声学属性(如上表1中所列)的平均值和标准偏差值)从5个不同基线语音数据集、注意力分散试验的试验语音数据集、注意力分散后试验的试验语音数据集和延迟回忆试验的试验语音数据集中的每一者中提取。图7中示出了实施例I的示例性集成分类器700。如图7所示，实施例I的集成分类器700包括30个分量分类器701至730，每个分量分类器是基于前20个特征的降采样子集生成的支持向量机(SVM)，这些特征是基于在与对照患者相关的训练数据和与MCI患者相关的训练数据之间平衡的训练数据的二次采样样本来确定的。具体地讲，二次采样样本包括对应于对照患者的20个条目和对应于MCI患者的20个条目。

如图7所示，集成分类器700使用数据集760通过10折交叉验证进行训练和验证，该数据集包括用5个基线语音数据集上的对应特征的平均值归一化的试验语音数据的每个特征。如图7所示，数据760随机分布并划分成相等大小的10折。在这些10折分区中，来自9个折的数据被用作集成分类器700的训练数据770，剩余的折被用作验证数据780。使用与验证数据780不同的折来重复训练和验证，同时将剩余折用作训练数据770，直到每个折都已用作验证数据780一次。尽管实施例I采用10折交叉验证方法，但设想可使用k折交叉验证方法来验证集成分类器700，其中k是任何合适的正整数。

基于在注意力分散试验、注意力分散后试验和延迟回忆试验中的每一者的10折中的每一者上的验证数据而生成的某些表现量度的平均值提供于下表2中。如表2的表现量度所示，注意力分散后试验在MCI患者和正常患者之间具有最高判别信号，之后是注意力分散试验，然后是延迟回忆试验。

表2.

本文描述和受权利要求书保护的本发明的范围不受本文所公开的具体实施方案的限制，因为这些实施方案旨在作为本发明的若干方面的示例。任何等同的实施方案旨在处于本发明的范围内。实际上，除了本文所示和所述的那些之外，根据前面的描述，本发明的各种修改形式对于本领域的技术人员将变得显而易见。此类修改也旨在落入所附权利要求书的范围内。本文引用的所有公布全文以引用方式并入。

23页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：用于机器人软组织评估的系统和方法

使用语音分析检测认知衰退的系统和方法

相关技术

网友询问留言