用于编码/解码振动触觉信号的编码/解码设备和方法

文档序号:1046906 发布日期:2020-10-09 浏览:21次 >En<

阅读说明:本技术 用于编码/解码振动触觉信号的编码/解码设备和方法 (Encoding/decoding apparatus and method for encoding/decoding vibrotactile signal ) 是由 安德烈亚斯·诺尔 巴萨科·居勒克于兹 埃克哈德·施泰因巴赫 于 2020-03-30 设计创作,主要内容包括:本发明提供了用于编码/解码振动触觉信号的编码/解码装置和方法,涉及对于振动触觉信号进行编码和解码。对这样的振动触觉信号进行编码的编码装置包括:第一变换单元,用于执行信号的离散小波变换;第二变换单元,用于生成信号的频域表示;心理触觉模型单元,用于基于所生成的采样信号的频域表示并且基于以人类触觉感知为基础的预定感知模型,生成至少一个离散化控制信号;离散化单元,用于对于由所执行的离散小波变换产生并由该离散化控制信号进行调整的小波系数进行离散化;压缩单元,用于压缩离散化的小波系数;比特流生成单元,用于基于经压缩的离散化的小波系数来生成与编码信号相对应的比特流。(The present invention provides an encoding/decoding apparatus and method for encoding/decoding a vibrotactile signal, and relates to encoding and decoding a vibrotactile signal. An encoding device for encoding such vibrotactile signals includes: a first transform unit for performing discrete wavelet transform of a signal; a second transform unit for generating a frequency domain representation of the signal; a psycho-tactile model unit for generating at least one discretized control signal based on the generated frequency domain representation of the sampled signal and on a predetermined perception model based on human tactile perception; a discretization unit for discretizing wavelet coefficients generated by the performed discrete wavelet transform and adjusted by the discretization control signal; a compression unit for compressing the discretized wavelet coefficients; a bitstream generation unit for generating a bitstream corresponding to the encoded signal based on the compressed discretized wavelet coefficients.)

用于编码/解码振动触觉信号的编码/解码设备和方法

技术领域

本发明涉及用于对振动触觉信号进行编码或解码的编码设备和解码设备。此外,本发明涉及用于振动触觉信号的编码方法和解码方法。另外,本发明涉及通信系统中的包括编码或解码设备的发送器和接收器。此外,本发明涉及一种包括指令的计算机程序,当该程序由计算机执行时,该指令使计算机执行编码或解码方法。本发明在物联网(IoT)中具有特定的应用。然而,本发明的编码/解码设备和方法也可用于需要在包括编码设备的发送器和包括解码设备的接收器之间发送由触觉传感器生成的信号的其他领域。

背景技术

触觉互联网将是物联网(IoT)的下一场革命,涵盖人机交互和机器对机器交互。它将实现具有多种工业、社会和业务用途情况的实时交互系统。特别地,触觉互联网已经成为互联网未来应用的有前途的领域。在这种情况下的一种愿景是使触摸感能够传输。

触觉互联网被(ITU)定义为将超低延迟与极高的可用性、可靠性和安全性相结合的互联网网络。尽管当前5G技术的移动互联网已经可以在移动中交换数据和多媒体内容,但是IoT正在实现智能设备的互连。对触觉互联网的一个需求是它应能够实时地控制IoT装置。这通过实现触知感觉和触觉感觉而增加了人机交互的新维度,同时还实现了机器交互。

因此,触觉互联网将使人和机器能够在移动的同时实时地并在一定的空间通信范围内与其环境交互。触觉互联网还可以实现具有视觉反馈的触觉交互。在此,术语“触觉”涉及触摸的感觉,特别是涉及使用触摸和本体感受对物体的感知和操纵。本体感受是身体各部位的相对定位和运动中所使用的力量强度的感受。

由于触觉互联网(包括“触觉”一词)基于人类的“触摸”或“触摸感知”,因此不仅视觉和/或听觉数据(视觉反馈)必须在发送器和接收器之间发送,而且通常由触觉传感器生成的触摸信号或感觉信号(以下称为“振动触觉信号”)本身也必须在发送器和接收器之间发送。例如,当要在发送器和接收器之间传输触摸感觉时,可以通过加速度计或产生振动触觉信号的其他测量单元来检测用户在粗糙表面上移动手指时的触摸感觉。该信号是“振动的”,因为触摸感觉通常会生成由运动或触摸动作期间的振动组成的信号。将该信号或这些信号进行A/D转换、编码并发送到接收器侧,在该接收器侧,例如对应的致动器将在接收器侧为用户重新生成感觉。接收器侧的用户感觉应准确模拟用户在发送器侧所产生的感觉。以这种方式,发送器侧和接收器侧的感觉应该是相同的。

在其他情况下,在物联网中,网络发送器侧的用户将控制接收器侧的机器(人机交互),并且在这种情况下,在接收器侧生成的感觉的准确性也应准确模拟所创建的发送器侧的感觉。新的应用情况例如在虚拟现实和增强现实以及其他领域内。

因此,还考虑物联网的实时方面,在发送器和接收器之间传输振动信号时,有两个方面很重要。一方面是要实时传输的数据量,第二方面是在传输路径上产生的干扰或在生成信号时产生的干扰(噪声)可能如何影响传输和准确性并可能导致接收感觉与发送感觉不匹配。

因此,需要在发送侧和接收侧使用复杂的编码器和解码器。

对现有技术的描述

例如,从MP3(声音/音频)或JPEG(视觉)的先前标准中已知了用于使接收器侧的视觉和听觉效果与发送器侧的对应效果相匹配的信号的编码和解码。MP3和JPEG的基本概念是不对整个频谱进行传输和编码/解码,而是将频谱细分为几个单独编码和传输的频带。MP3标准特别针对具有特定属性的声音信号的处理以便消除冗余信息,并且仅传输有用的信息从而减少要传输的数据量。如下所述,类似的概念与JPEG中的不同种类的编码器一起使用。

类似于音频和视频传输,本发明旨在实现跨越距离的表面或物体的记录和回放。由于需要减少要传输的数据量,因此有效的编码器/解码器设备对于实现该目标至关重要。然而,MPEG和JPEG专门适用于音频和视频传输,不适合与触觉或振动触觉信号一起使用。

MPEG Layer-3和AAC使用复杂的音频编解码器。原则上,这样的编码器将滤波器组用于输入信号块,其中,滤波器将它们分为例如32个频带。然后,这些子频带信号通过MDCT(修正离散余弦变换)进行变换。并行地,心理声学模型旨在从输入信号中提取信息并控制MDCT以及随后的离散化器,该离散化器处理MDCT的输出系数。在离散化器之后存在霍夫曼编码阶段,该阶段进一步减小了冗余度。AAC扩展了MPEG Layer-3的原理,以提供更大的灵活性以及更好的压缩性能。有关这些编解码器工作原理的更多详细信息,可以在下面的文献PA1中找到。

但是,不可能以直接的方式将这些音频编解码器应用于振动触觉输入信号。即使稍作修改以使编解码器能够处理振动触觉信号,它也不会产生满意的结果。这是由于以下事实:编解码器的许多元素是为音频信号而不是为振动触觉信号定制的。例如,具有相等大小的频率范围的32个子频带滤波器组不能解决振动触觉信号的总体结构。此外,已为采样频率约为44.8kHz的音频信号选择的编码器参数会对振动触觉信号产生长延迟和高不准确性,因为这些参数的采样频率通常在2-4kHz的范围内。

关于图像压缩(视觉),JPEG和JPEG2000是使用最广泛使用和复杂的压缩程序。JPEG2000通过首先对图像块进行DWT(离散小波变换)来对其进行操作。然后,使用固定的标量离散化器对块进行离散化。每个频带中的小波系数都通过经验确定的比例因子进行缩放。这些比例因子与输入信号无关,并且源自人的视觉感知。离散化后,称为EBCOT的算法进一步消除冗余并进一步压缩。有关JPEG2000工作原理的更多详细信息,也可以在下面的文献PA2中找到。

但是,改编或使用JPEG2000使其处理振动触觉信号将导致较差的压缩性能。这是因为图像和振动触觉信号的总体结构和人类感知它们的方式的差异很大。与信号无关的离散化不适用于后一种信号,因为它无法解决诸如掩蔽(masking)现象。另外,JPEG2000是为图像设计的,其中整个信号可以立即使用。另一方面,振动触觉信号是随时间变化的信号,这意味着所有操作都必须在原地进行。

现有技术参考文献列表

[PA1]K.Brandenburg,“MP3和AAC的解释(MP3 and AAC explained)”音频工程学会会议:第17届国际会议:高质量音频编码。音频工程学会,1999年。

[PA2]D.S.Taubman和M.W.Marcellin,“JPEG2000:图像压缩的基本原理、标准和实践(JPEG2000:Image compression fundamentals,standards,and practice)”,KluwerAcademic,2002年。

如上所述,由于本质上是由运动时引起的振动产生的信号的振动触觉信号的特定特性,因此尚不存在以可接受性能压缩振动触觉信号的直接的解决方案。而且,使用MP3和JPEG编码器时的特定缺点是它们会导致高失真并导致要传输的数据量很大。因此,本发明的目的是提供一种克服这些缺点的用于对振动触觉信号进行编码/解码的方法和设备。特别地,本发明的目的是提供能够有效且高质量地压缩振动触觉信号的编码设备/方法和解码设备/方法。

发明内容

该目的通过根据权利要求1所述的编码装置来实现。该用于编码振动触觉(vibrotactile)信号的编码装置包括:第一变换单元,用于执行所述信号的离散小波变换;第二变换单元,用于生成所述信号的频域表示;心理触觉(psychohaptic)模型单元,用于基于所生成的采样信号的频域表示并且基于以人类触觉感知为基础的预定感知模型,生成至少一个离散化控制信号;离散化单元,用于对于由所执行的离散小波变换产生并由所述离散化控制信号进行调整的小波系数进行离散化;压缩单元,用于压缩离散化的小波系数;以及比特流生成单元,用于基于经压缩的离散化的小波系数来生成与所编码的信号相对应的比特流。

此外,该目的通过根据权利要求14所述的解码装置来实现。该用于从比特流解码振动触觉信号的解码设备包括:解压缩单元,用于解压缩所述比特流,其中,特别地,提供基于分层树逆向集合分割的算法用于所述解压缩;去离散化单元,用于对于解压缩的比特流进行去离散化;以及第三变换单元,用于对于经去离散化的比特流执行逆离散小波变换。

此外,该目的通过根据权利要求15所述的编码方法来实现。该用于编码振动触觉信号的编码方法包括以下步骤:对所述信号执行离散小波变换;生成所述信号的频域表示;基于所生成的所述信号的频域表示并且基于以人类触觉感知为基础的预定感知模型,来生成至少一个离散化控制信号;使小波系数离散化,所述小波系数由所执行的离散小波变换产生并由所述离散化控制信号进行调整;压缩离散化的小波系数;以及基于经压缩的离散化的小波系数来生成与所编码的信号相对应的比特流。

此外,该目的通过根据权利要求16所述的解码方法来实现。该用于从比特流解码振动触觉信号的解码方法包括以下步骤:解压缩所述比特流,其中,特别地,提供基于分层树逆向集合分割的算法用于所述解压缩,对解压缩的比特流进行去离散化;以及对于经过去离散化的比特流执行逆离散小波变换。

此外,该目的通过一种通信系统中的发射器来实现,该发射器包括根据权利要求1所述的编码装置。

此外,该目的通过一种通信系统中的接收器来实现,该接收器包括根据权利要求14所述的解码装置。

此外,该目的通过一种包括指令的计算机程序来实现,当由计算机执行所述指令时,所述指令使所述计算机执行根据权利要求15或16所述的方法。

本发明的另外有利实施例和改进列出在从属权利要求中。

例如,特别有利的是,本发明的编码装置还包括分块单元,该分块单元用于将所述振动触觉信号分成多个连续的块。

在本发明的编码装置的优选实施例中,所述第一变换单元用于通过使用双正交小波,特别是科恩-道贝基斯-佛维波小波(Cohen–Daubechies–Feauveau-wavelet),特别优选9/7-科恩-道贝基斯-佛维波小波,来执行所述离散小波变换。

在本发明的编码装置的更优选实施例中,所述第二变换单元用于通过使用对于所述采样信号的离散傅立叶变换、快速傅立叶变换、离散余弦变换或离散正弦变换来生成所述频域表示。

在本发明的编码装置的更优选实施例中,所述心理触觉模型单元用于识别信号谱中的峰,其中,每个峰对应于频率和幅度,并且其中,所述心理触觉模型单元包括用于存储每个识别出的峰的频率和幅度的存储器。

在本发明的编码装置的更优选实施例中,所述心理触觉模型单元用于基于每个峰的频率和幅度来计算不同频率下的峰的掩蔽阈值。

在本发明的编码装置的更优选实施例中,所述心理触觉模型单元还用于计算在不同频率下的感知的绝对阈值,所述绝对阈值对应于人类在特定频率下能够感知信号所需的信号幅度,特别是平均信号幅度。

在本发明的编码装置的更优选实施例中,所述心理触觉模型单元还用于基于所述掩蔽阈值和所述绝对阈值来计算全局掩蔽阈值。

在本发明的编码装置的更优选实施例中,所述心理触觉模型单元用于基于不同频率下的全局掩蔽阈值的能量之和并且基于信号的能量,来计算信号掩蔽比,特别是计算所述离散小波变换的小波系数的每个频带的所述信号掩蔽比。

在本发明的编码装置的更优选实施例中,所述离散化单元用于通过基于掩蔽噪声比,针对所述小波系数的每个频带分配比特,来使小波系数离散化,其中,所述掩蔽噪声比基于所述信号掩蔽比和信噪比来计算,所述信号噪声比基于信号的能量和通过离散化而引入的噪声的能量来计算。

在本发明的编码装置的更优选实施例中,所述压缩单元用于使用基于多层树集合分割的算法来压缩小波系数。

在本发明的编码装置的更优选实施例中,所述离散化单元用于通过所述离散化控制信号而被调整,使得相对于所述感知模型的感知掩蔽阈值,在不同频率范围内的所述采样信号的离散化期间引入的失真是人类无法感知的。

在本发明的编码装置的更优选实施例中,所述离散化单元包括嵌入式死区离散化器。

如上面所说明的,在本申请中,编码方法与解码方法和发送侧(编码器侧)的编码装置与接收侧(解码器侧)的解码装置使用特殊的心理触觉模型来影响在离散化器中比特的设置,使得经解码的振动触觉信号更好地匹配到发射器侧的触摸或触觉感觉,并且减少发送的数据量。

附图说明

在下文中,将参考附图参考其有利实施方式描述本发明。在全部独立的视图中相同的附图标记指代相同或功能相似的元件的这些附图以及下面的详细说明被并入说明书中并构成说明书的一部分,并用于进一步说明包括所要求保护的发明的概念的实施方式,并且说明这些实施方式的各种原理和优点。

在附图中:

图1示出了根据本发明的一个实施方式的编码设备;

图2示出了图1所示的本发明的编码设备100的实施方式的心理触觉模型单元(psychohaptic model unit)8的内部元件;

图3示出了描绘示例性块的幅度谱、计算出的掩蔽阈值、计算出的感知绝对阈值以及所得到的全局掩蔽阈值的示意图;

图4示出了一维多级树集合***(SPIHT)算法的一维小波系数的示例;

图5示出一维SPIHT算法的树结构;

图6示出了根据本发明的一个实施方式的用于至少解码由触觉传感器从比特流收集的信号的解码设备200;

图7示出了根据本发明的一个实施方式的用于对振动触觉信号进行编码的编码方法的流程图;

图8示出了根据本发明的一个实施方式的用于从比特流中解码振动触觉信号的解码方法的流程图;

图9示出了针对不同压缩率(CR)对280个测试信号计算出的信噪比(SNR);

图10示出了针对不同压缩率(CR)对280个测试信号计算出的峰值信噪比(PSNR);

图11示出了示意性描绘本发明的编码/解码设备/方法的表现对信号形状的图;以及

图12示出了根据本发明的一个实施方式的离散化器的框图;以及

图13示出了针对不同压缩率(CR)对280个测试信号计算出的频谱时间相似度(ST-SIM)。

具体实施方式

本发明提出了一种触觉编解码器。本质上,所提出的编解码器使用具有DWT和后续离散化的感知方法。考虑到心理触觉模型,离散化器被设计为自适应的。离散化后,使用SPIHT算法生成要传输的比特流。整个过程是模块化的,因此编码器可以与任何心理触觉模型一起工作(尽管下面在一个实施方式中还描述了特定的模型)。这允许将来精进。

图1示出了根据本发明的一个实施方式的编码设备。如图1所示,编码设备100包括:分块单元2,其被配置为将由触觉传感器收集的采样信号(即,振动触觉信号)分为多个连续块;第一变换单元4,其被配置为执行离散小波变换(DWT);以及第二变换单元6,其被配置为执行离散傅立叶变换(DFT)以便生成采样信号的频域表达。

编码设备100还包括:心理触觉模型单元8,其被配置为基于所生成的采样信号的频域表达和基于人的触觉感知的预定感知模型来生成至少一个离散化控制信号;离散化单元10,其被配置为对由执行的离散小波变换产生并由离散化控制信号调整的小波系数取离散值;以及压缩单元12,其被配置为压缩离散化的小波系数。

人的触觉感知的心理触觉模型实质上是描述人类如何感知触摸或振动。已经针对不同的模型假设研究和调查了人类感知的触摸感觉(触觉)与频率有关且与振幅有关。即,人类触觉知觉的固有模型首先基于引起依赖于频率的感觉所必需的(测量的)阈值振幅。然而,还发现了,这种频率相关的感觉阈值不独立于所感测的(振动触觉)信号(如上所述,由于振动而生成的信号)的实际频谱。这是由于不同的输入频率和(测量的)阈值引起的掩蔽效应(如下文进一步所述)。因此,心理触觉模型描述了如何根据输入频谱将理论的频率相关的感觉振幅阈值修改为修改后的频率相关的振幅阈值,该修改后的频率相关的振幅阈值表示在每个频率下针对所考虑的特定输入信号引起感觉实际需要的特定频率下的振幅幅度。

本发明的一方面是,已经通过特别选择的心理触觉模型(描述了理论阈值如何修改为真实的掩蔽阈值)考虑了输入信号(频谱)的这样的修改阈值(以下称为“掩蔽阈值”)通过离散化控制信号在离散化器中分配比特。离散化控制信号基于频率相关的掩蔽(由所使用的心理触觉模型修改后的)阈值,并且由于离散化器在不同频带中进行操作/取离散值,因此它可以使用关于每个频率区域中的阈值(振幅)的该信息来使在不同频带之间分配的比特数的分配可根据感觉掩蔽阈值调整。由于修改(掩蔽)阈值代表针对依赖于频率的特定振动触觉输入信号的人的真实感觉/感知,因此每个频带下的比特分配变得与感知相关。这也以动态方式应用,即,当信号随时间变化时,频谱变化,阈值根据描述了如何根据频率和幅度修改阈值的模型而变化,因此每个频带中的比特分配也可能会动态地变化。

由于现在基本上已经知道了每个频带中的振幅感知阈值,因此离散化控制信号在不同频带之间分配可用比特,使得噪声/失真(在每个频带中进行离散化时由离散化器不可避免地引入)尽可能不能感知(依赖于可用比特数)。即,离散化控制信号提供有关频带的阈值,然后离散化器查看该频率范围内的离散化噪声水平(即,失真),并分配尽可能多的比特以使噪声水平低于或至少在那个频率范围内尽可能接近阈值。这是可能的,因为在特定频率范围内(可用比特数中的)的比特越多引起的噪声越少,而比特越少引起的噪声越多。

本发明的第二方面是,修改后的掩蔽阈值(由基于输入频谱对理论阈值的修改的(任何)心理触觉模型修改的)使频带中的比特分配可变,使得在离散化期间引入采样信号的失真相对于在该频率范围内的感知掩蔽阈值是人类无法感知的。这减少了要传输的数据量,或者换句话说,仅以低噪声传输/编码适于人类感知的信号的可用数据。

在下文中,下面描述创建和使用心理触觉模型来进行阈值相关的噪声调整和比特分配的特定实施方式。

压缩单元12可以采用任何无损压缩,其允许从压缩数据完美地重构原始数据。特别地,为压缩过程提供了基于分层树中的集合***算法。

编码设备100还包括报头编码单元14,其被配置为在每个压缩块的前面添加报头以将一些辅助信息并入与编码信号对应的比特流中,使得对应的解码器能够正确地对信号进行解压缩。另外,编码设备100包括比特流生成单元16,其被配置为基于压缩的离散化小波系数以及具有辅助信息的报头来生成比特流。

由图1所示的报头编码单元14添加的报头由512个样本块的最多30比特组成,并编码以下信息:

-1至4比特:块长,

-14比特:属于一个块的以下比特流段的长度,

-4比特:编码分配给DWT频带的最大比特数的整数数量,

-8比特:编码当前块的最大小波系数值的定点数(加1个信号比特)。

在未被示出的另外优选的实施方式中,信号被分块单元2分成具有较小块长度的较小块。因此,报头的长度减小了。编码设备处理的块长度可以被选择为32、64、128、256或512个输入信号样本。为了用信号通知对应的解码设备,采用具有可变比特长度的编码。代码1对应于块长度32,代码01对应于块长度64,代码001对应于块长度128,代码0001对应于块长度256,代码0000对应于块长度512。

图1所示的第一变换单元4被配置为通过应用基于9/7-Cohen-Daubechies-Feauveau-小波(9/7-CDF-小波)的滤波器来对块执行DWT操作。选择这些滤波器是因为它们具有对称的脉冲响应,这意味着线性相位。因此,当已经输入信号值时,在每个块中获得相同数量的小波系数。另外,9/7-CDF小波滤波器几乎是正交的,这在计算小波域中的信号能量值时会导致可接受的准确度。

DWT lDWT的级数由以下公式给出:

其中LB代表块长度。因此,对于较长的块长度LB,增加DWTlDWT的级数以便实现更好的去相关性能。

在应用心理触觉模型之前,执行长度为2LB的当前信号块的DFT。之后,将结果通过进行归一化,使得能够直接计算光谱域中的能量。之后,将光谱再次切成原始块长度LB,以获得单面光谱。由此,实现了频谱值到小波系数的直接映射。

图2示出了图1中所示的本发明的编码设备100的实施方式的心理触觉模型单元8的内部元件。该心理触觉模型单元8旨在调整离散化单元10以在失真最不可感知的地方引入失真,并且包括模型提供单元20、模型应用单元30和幅度提取单元22,该幅度提取单元被配置为在执行信号的DFT之后提取信号的幅度并以dB表示结果。

模型提供单元20包括峰提取子单元24、掩蔽阈值计算子单元26、感知阈值子单元25和功率相加组合(power additive combination)子单元28。模型应用单元30包括频带能量计算子单元32和SMR计算子单元34。

峰提取子单元24被配置为通过识别具有一定突出度和水平的峰而基于提取的信号幅度来识别峰。特别地,最小突出度可以选择为15dB,最小水平选择为-42dB。峰之间的最小间隔为10Hz是优选的。然而,也可以不设置最小间隔值。每个峰对应于频率fp和幅度ap。触觉模型单元包括适于存储每个识别峰的频率fp和幅度ap的存储器(未被示出)。

掩蔽阈值计算子单元26被配置为基于每个峰的频率fp和幅度ap以及适合于对信号采样的采样单元的频率fS来计算针对不同频率f下的峰的掩蔽阈值。使用以下公式计算对于每个峰的在不同频率f下的掩蔽阈值mp(f):

感知阈值子单元25被配置为计算在不同频率下的感知绝对阈值(由于人类以不同方式感知不同频率下的信号的事实),该感知绝对阈值对应于人类在一定的频率下能够感知信号所需的信号幅度、特别是平均信号幅度。使用以下公式计算在不同频率f下的感知绝对阈值t(f):

Figure BDA0002431921950000112

功率相加组合子单元28被配置为使用功率相加组合将感知绝对阈值t(f)与掩蔽阈值mp(f)相加来计算全局掩蔽阈值。

频带能量计算子单元32被配置为计算每个DWT频带ES,b中的信号的能量。SMR计算子单元34被配置为基于每个频带EM,b中的全局掩蔽阈值的能量之和以及所计算出的每个DWT频带ES,b中的信号的能量来计算每个DWT频带的信号掩蔽比(SMR)。通过将ES,b除以EM,b并以dB表示结果,获得每个频带的SMR。所有频带的SMR值与ES,b的值一起被传递至离散化单元10。

图3示出了描绘示例性块的幅度谱(用实线36表示)、计算出的掩蔽阈值(用虚线38表示)、计算出的感知绝对阈值(用虚线40表示)以及所得到的全局掩蔽阈值(用虚线42表示)的示意图。根据图3,水平坐标轴以Hz为单位表示频率,垂直坐标轴以dB为单位表示幅度。在此示意性示出了模型提供单元20、模型应用单元30以及它们的一些子单元的输出。

在另一优选的实施方式中,每个块的离散化的小波系数的编码是通过分层树中的一维集合***(SPIHT)算法来执行的。然而,本发明不限于使用SPIHT算法,而是可以采用去除信号的冗余并且适合于DWT的任何无损压缩算法。

由于一维SPIHT算法的输入是一维信号,因此SPIHT适于编码一维离散化的小波系数。SPIHT是基于零树的编码方法,其利用两种类型的零树并通过连续的排序和细化过程(refinement pass)对有效系数和零树进行编码。在SPIHT中,每个离散化的小波系数都带有幅度比特平面和对应的符号平面。这些系数之间的父子关系是基于所应用的DWT级定义的,并在通过排序和细化过程的迭代对比特平面进行编码时使用。

所得到的一维小波系数和树结构的例子在图4和图5中示出。对于16个离散化的小波系数和3级DWT的一维块,图4中描绘了所得到的频带和对应的系数,其中Ci(i=1,2,…,或15)表示系数,并且L和H分别表示低频带和高频带。在图5中提供了这些系数之间的父子关系的对应树结构。

SPIHT定义了三个列表,即有效像素列表(LSP)、无效像素列表(LIP)和无效集列表(LIS)。在排序过程中,系数的位置在系数有效时***LSP中,在系数无效时***LIP中,或者在对应的树的系数无效时***LIS中。此外,如果系数是LIP或LIS,则将系数在幅度位平面中的比特***编码比特流。在细化过程中,将在最后一遍细化过程之前属于LSP的系数的幅度比特平面中的比特***到编码后的比特流中。对于每个幅度比特平面重复这些过程。SPIHT模块的最终输出是离散化的一维DWT系数的无损压缩的比特流。

图6示出了根据本发明的一个实施方式的用于解码由触觉传感器从比特流收集的振动触觉信号的解码设备200。解码设备200包括:比特流去复用单元44,其被配置为根据具有辅助信息的比特流对压缩块进行去复用;作为解压缩单元的逆向SPIHT(ISPIHT)单元46,其被配置为对压缩块进行解压缩;去离散化单元48,其被配置为对解压缩的块去离散化;以及作为第三变换单元的逆向DWT(IDWT)单元50,其被配置为对去离散化的信号执行逆向DWT。

图7示出了根据本发明的一个实施方式的用于对振动触觉信号进行编码的编码方法的流程图。

在步骤S1中,接收振动触觉信号。在步骤S2中,将接收到的信号分成块。在步骤S3中,通过应用DFT获取信号块的频谱。在步骤S4中,根据本发明的心理触觉模型计算全局掩蔽阈值。与步骤S3并行地,通过应用DWT来分解信号块(S5)。

离散化单元10根据本发明的心理触觉模型将特定的比特预算分配给不同的DWT频带,以便在不引入任何可感知的失真的情况下显著降低速度。为了完成该任务,离散化单元10考虑来自心理触觉模型的SMR值(从步骤S4得到)。在图7所示的循环中,总共n比特被分配给每个频带。

在步骤S5之后,开始从n比特的总比特预算中为每个DWT带分配比特(0bits)(S6)。在每次迭代(S7,S9,S10)中,使用由心理触觉模型传递的每个频带中的信号能量值和由离散化引入的噪声能量,以dB为单位计算SNR。然后,利用公式“MNR=SNR-SMR”来计算掩蔽噪声比(MNR)(S9)。然后,将一比特分配给具有最低MNR值的频带,并重复直到所有n比特被分配。

在图12中示出了根据本发明的离散化单元10的实施方式,即嵌入式死区离散化器。如上总体所述,该离散化单元接收不同频带中的DWT变换系数以及离散化控制信号输出,该离散化控制信号输出由心理触觉模型单元输出并表示频率相关的掩蔽阈值。在图12中,水平实线60表示每个离散化区间62的边界。圆点64表示根据以下过程将对应区间离散化为的值。针对四个不同数量的离散化比特示出了该原理。

图12中的结构是有益的,因为通常频带具有不同数量的离散化比特。计算当前块的最大小波系数wmax。该值被离散化为定点数。如果wmax<1,则使用7个分数比特,而不使用整数比特。对于wmax≥1,通过上限运算获得3个整数比特和4个分数比特以接收

Figure BDA0002431921950000131

可以使用一个附加的比特来发信号通知wmax是小于1还是大于1。代表该最大值的7比特作为辅助信息传递到比特流编码。然后,离散化单元10采用分配给每个频带的比特和该最大值来确定离散化区间为

其中b是分配给特定频带的比特数。然后根据公式对小波系数进行离散化:

因此,小波系数被离散化为原始范围。该公式还意味着增加一个符号比特。在分配了所有比特之后(S7),因此所有小波系数都已被离散化(S8),所有离散化的小波系数都按以下比例缩放为整数:

将这些离散化的整数小波系数传递给SPIHT算法以压缩信号(S11)。

之后,收集辅助信息并将其与经编码的信号进行复用(S12),以生成比特流(S13)。

图8示出了根据本发明的一个实施方式的用于从比特流中解码振动触觉信号的解码方法的流程图。

在步骤S21中,接收比特流。在步骤S22中,将接收到的比特流去复用为辅助信息和编码信号。在步骤S23中,从编码信号中提取信号块。在步骤S24中,对接收到的编码块执行ISPHIT以便对编码块进行解压缩。在步骤S25中,使解压缩的块去离散化。在步骤S26中,将IDWT应用于去离散化的信号块。然后,将解码块合并(S27)以生成重构信号(S28)。

图9和图10示出了针对不同压缩率(CR)对280个测试信号计算出的信噪比(SNR)和峰值信噪比(PSNR),以便示出本发明的编码/解码设备/方法的性能。

为了检查速率失真表现,对由加速度计记录的280个振动触觉信号组成的测试数据集进行编码。测试数据集包含针对不同探索速度的各种材料的信号。使用512个样本的块长度和7级的DWT对信号进行压缩。

所有信号都经过编码、解码,然后将输出结果与原始信号进行比较。离散化单元10的比特预算在8比特和128比特之间变化,以实现不同速率并因此获得质量等级。压缩率(CR)被定义为原始速率和压缩速率之间的比。之后,针对不同的CR值计算所有280个测试信号的SNR和PSNR。图9和图10给出了所有三个度量标准与平均值的相应的散点图。如图9和图10所示,实点50是所有测试信号在不同速率下的散点图,实线55表示所有测试信号的平均值。从图9和图10可以清楚地看出,质量随着压缩的增加而降低。CR为10时,SNR约为10.5dB,PSNR约为55dB。

图11示出了示意性描绘了本发明的编码/解码设备/方法的表现对信号形状的图。这可能有助于获得对所引入的失真的可感知性的一定的进一步直觉。

如图11所示,将原始信号(os)及其前200个样本与n=8(l1)、16(l2)、32(l3)、64(l4)的重构信号一起绘制曲线。从图11可以看出,即使在非常高的压缩水平下,信号的总体结构也得以保留(n=8在此等效于CR≈39.77)。在n=64时,两个信号(os和l4)非常接近,使得可以假设没有感知到失真。

图13示出了针对不同压缩率(CR)对280个测试信号的计算出的频谱时间相似度(ST-SIM),以便示出本发明的编码/解码设备/方法的性能。R.Hassen和E.Steinbach的文章“Vibrotactile signal compression based on sparse linear prediction and humantactile sensitivity function(基于稀疏线性预测和人的触觉敏感度功能的振动信号压缩)”中介绍的ST-SIM度量标准可用于执行计算。

如图13所示,实点70是所有测试信号在不同速率下的散点图,并且代表所有信号的平均ST-SIM的实线75是中值,这避免了下限和上限影响。从图13可以清楚地看出,平均ST-SIM随着压缩率的增加而逐渐减小。在CR为10时,中值ST-SIM约为0.903(90.3%)。这意味着信号的感知质量相当好,因此,本发明的编解码器是高度通透的。

工业适用性

总而言之,所描述的发明提供了噪声低和要传输的数据量少的振动触觉信号的编码和解码。尽管已经特别着重于物联网振动触觉信号描述了本发明,但是本发明当然总体可应用于其他技术领域中的触觉信号的有效传输。

在前述说明书中,已经描述了具体实施方式。然而,本领域的普通技术人员将理解的是,在不脱离所附权利要求书所给出的本发明的范围的情况下,可以进行各种修改和改变。因此,说明书和附图应被认为是说明性的而不是限制性的,并且所有这样的修改旨在被包括在本教导的范围内。

益处、优点、问题的解决方案以及可能导致任何益处、优点或解决方案出现或变得更加明显的任何一个或多个要素都不应解释为任何或所有权利要求的关键、必需或必要特征或要素。本发明仅由所附权利要求书来定义,包括在本申请待决期间所作的任何修改以及所公布的那些权利要求的所有等同形式。

此外,在本文件中,诸如第一和第二、顶部和底部等关系术语可以仅用于将一个实体或动作与另一实体或动作区分开,而不必要求或暗示这样的实体或动作之间的任何实际的这种关系或顺序。术语“包含”、“包括”、“具有”或其任何其他变体旨在涵盖非排他性包含,因此,包含、具有、包括一系列要素的过程、方法、物品或设备不仅包含那些要素,而且还可以包含未明确列出或此类过程、方法、物品或设备固有的其他要素。在没有更多限制的情况下,前面存在“包括一个……”、“具有一个……”或“包含一个……”的要素不排除在包括、具有或包含该要素的过程、方法、物品或设备中存在其他相同要素。除非本文另外明确说明,否则术语“一个”和“一种”被定义为一个或多个。术语“实质上”、“基本上”、“大约”、“约”或其任何其他形式被定义为与本领域普通技术人员所理解的接近,并且在一个非限制性实施方式中,该术语被定义为在10%以内,在另一个实施方式中在5%以内,在另一个实施方式中在1%以内,在另一个实施方式中在0.5%以内。本文中使用的术语“耦合”被定义为连接,但是不一定是直接连接并且不一定是机械连接。以某种方式“配置”的装置或结构至少以这种方式配置,但也可以以未列出的方式配置。

将意识到,一些实施方式可以包括一个或多个通用或专用处理器(或“处理设备”,例如微处理器、数字信号处理器、定制处理器)和现场可编程门阵列(FPGA)以及唯一的存储程序指令(包括软件和固件),该指令控制一个或多个处理器以结合某些非处理器电路来实现本文描述的方法和/或设备的一些、大部分或全部功能。替代地,一些或全部功能可以由没有存储的程序指令的状态机来实现,或者在一个或多个专用集成电路(ASIC)中实现,其中每个功能或某些功能的某些组合被实现为定制逻辑。当然,可以使用两种方法的组合。

可以使用包含用于执行所描述的单元中的功能和方法步骤的软件指令的软件程序。因此,一个或多个实施方式可以被实现为其上存储有用于对计算机(例如,包括处理器)进行编程以执行本文所描述和要求保护的方法的计算机可读代码的计算机可读存储介质。这样的计算机可读存储介质的例子包括但不限于硬盘、CD-ROM、光存储设备、磁存储设备、ROM(只读存储器)、PROM(可编程只读存储器)、EPROM(可擦可编程只读存储器)、EEPROM(电可擦可编程只读存储器)和闪存。此外,期望受到本文公开的概念和原理的指导时,尽管可能付出巨大的努力和例如由于可用时间、当前技术和经济考虑而引起的许多设计选择,但是本领域的普通技术人员将容易能够以最少的实验生成此类软件指令、程序和IC。

提供本公开的摘要以允许读者快速地确定技术公开的性质。提交该摘要时,应理解为不会将其用于解释或限制权利要求的范围或含义。

另外,在前面的详细描述中,可以看出,出于简化本公开的目的,在各个实施方式中将各个特征组合在一起。本公开的方法不应被解释为反映了以下意图:所要求保护的实施方式需要比每个权利要求中明确叙述的特征更多的特征。相反,如所附权利要求所反映的,发明主题在于少于单个公开实施方式的所有特征。因此,以下权利要求由此结合到详细描述中,其中每个权利要求独立地作为单独要求保护的主题。

27页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种视频编码系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类