前滤波或后滤波
一种摄像头自动布撤防方法、装置及系统
本申请涉及摄像监控技术领域,公开了一种摄像头自动布撤防方法、装置及系统,包括:获取人脸信息;基于人脸信息,获取人脸信息与预设的人脸白名单的匹配度;若匹配度高于第一预设值,则发送隐私模式开启信号给摄像头,摄像头响应于隐私模式开启信号并开启摄像头的隐私模式;基于已开启的隐私模式,采集室内的声音,基于采集的声音获取声音分贝值;若声音分贝值高于第二预设值,则发送隐私模式关闭信号给摄像头,摄像头响应于隐私模式关闭信号并关闭摄像头的隐私模式。本申请具有能降低手动进入隐私模式和退出隐私模式的繁琐度的效果。

2021-11-02

访问量:25

烟雾报警声识别方法及系统
本申请公开了一种烟雾报警声识别方法及系统,其涉及火灾报警技术领域,该方法包括如下步骤:采集外界环境中的声音信号;对所述声音信号进行处理,得到处理后声音信号;基于特征分析对所述处理后声音信号进行分析筛选,筛选出报警声音信号,所述报警声音信号由烟雾传感器发出;根据所述报警声音信号生成报警信息;将所述报警信息发送至所述用户客户端。本申请具有发生火灾时不仅可以提醒在场人员避险还可以远程告知其他人员的效果。

2021-11-02

访问量:38

滤波系统及滤波方法
本发明公开一种滤波系统及滤波方法,该滤波方法包含:接收一声音信号;依据声音信号的频率,将声音信号分解出一主要(primary)肺音信号及一参考(reference)心音信号;依据一权重值调整参考心音信号,以产生一调整心音信号;以及将主要肺音信号与调整心音信号相减,以产生一滤波后肺音信号。

2021-10-26

访问量:53

一种说话人识别方法、装置、存储介质及设备
本申请公开了一种说话人识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标语音,确定其采样率,提取其第一声学特征;并基于其采样率,对第一声学特征进行处理,得到第二声学特征,然后再将第二声学特征输入至预先构建的说话人识别模型,识别得到目标说话人的目标表征向量;其中,说话人识别模型是利用不同采样率的语音共同训练得到的;接着,可以根据目标表征向量,对目标说话人进行识别,得到目标说话人的识别结果。可见,由于本申请通过将第二声学特征输入至预先构建的说话人识别模型,既保证了输入高频语音声学特征时没有效果损失,又补偿了输入低频语音声学特征引起的效果下降,从而提升了识别结果的准确率。

2021-10-19

访问量:33

基于参数共享非自回归语音识别训练解码方法及系统
本发明公开了基于参数共享非自回归语音识别训练解码方法及系统,训练方法:提取语音训练数据的特征,构成声学特征序列;将声学特征序列进行声学编码,输出声学编码状态序列;将声学编码状态序列和空白填充序列进行非自回归解码,结合文本标注训练数据,计算非自回归交叉熵损失;将声学编码状态序列和文本标注训练数据进行自回归解码,结合文本标注训练数据,计算自回归交叉熵损失;根据非自回归交叉熵损失和自回归交叉熵损失加权,得到联合损失,计算梯度,并进行反向传播;循环执行,直至训练完成;解码方法:通过训练好的模型进行语音识别;系统包括声学特征序列提取模块、声学编码器、非自回归解码器、自回归解码器、联合损失计算模块。

2021-10-08

访问量:42

基于快速跳跃解码的语音转写识别训练解码方法及系统
本发明公开了基于快速跳跃解码的语音转写识别训练解码方法及系统,包括声学特征提取模块,提取声学特征序列;声学编码器,将声学特征序列转变为声学编码状态序列;解码器,基于声学编码状态序列,在预测概率分布,训练阶段计算损失;在解码阶段预测当前位置,将非空格标记为触发解码位置;语言预测器,用于建模文本标记之间的时序依赖关系;联合网络模块,通过声学编码状态序列和文本编码状态序列组合,在训练阶段预测得到概率分布;在解码阶段基于概率分布,使用搜索算法对解码路径进行更新;联合损失计算模块,训练阶段,根据解码器得到的概率分布,以及联合网络模块预测得到的概率分布,计算联合损失,根据联合损失计算梯度,进行反向传播。

2021-10-08

访问量:45

谐波滤波器工具的谐度依赖控制
本公开提供了对音频编解码器的谐波滤波器工具执行谐度依赖控制的装置和方法,所述装置包括:音调估计器,被配置为确定要被音频编解码器处理的音频信号的音调;谐度测量器,被配置为使用音调来确定音频信号的谐度的测量;时间结构分析器,被配置为根据音调确定对音频信号的时间结构的特性进行测量的至少一个时间结构测量;控制器,被配置为根据时间结构测量和谐度的测量控制谐波滤波器工具。本公开还提供了相应的音频编码器或音频解码器、系统、基于变换的编码器和计算机程序。

2021-09-28

访问量:52

一种基于变张成广义子空间的多通道频域语音增强算法
本发明公开了一种基于变张成广义子空间的多通道频域语音增强算法,本发明将时域的数据变换到频域,通过广义子空间追踪算法提取更新的信号协方差矩阵的广义特征向量构建变张成滤波器,该滤波器对频域数据不同子频带进行滤波处理,滤波后的信号取得了和纯净语音信号相近的统计量,取得了良好的滤波效果。本发明具有一定拓展性,可以协调语音输出信噪比和语音失真的平衡,同时可以应用在实时语音降噪处理场合。

2021-09-17

访问量:47

注册成为会员可查看更多数据。