以提取参数类型为特征的
一种音频处理方法、装置及电子设备
本发明公开了一种音频处理方法、装置及电子设备,该方法包括:获取待处理的目标音频;获取选定的特征向量,其中,特征向量包括影响音频的评分的至少一个特征;获取特征向量与评分之间的映射函数;根据映射函数和目标音频的特征向量的向量值,获得目标音频的预测评分。

2021-11-02

访问量:34

音频类别的确定方法、装置、存储介质及电子装置
本发明实施例提供了一种音频类别的确定方法、装置、存储介质及电子装置,其中,该方法包括:确定获取到的目标音频数据的目标特征;使用目标模型对目标特征进行分析,以确定目标音频数据中包括的每帧音频数据属于每个声音类别的第一概率,其中,目标模型为使用多组目标训练数据通过机器学习训练出的,多组目标训练数据中的每组数据包括:音频数据的特征和每帧音频的声音类别,每组数据均是进行了增强处理后所得到的数据,目标模型中包括多个卷积层;基于第一概率确定目标音频数据中包括的每帧音频数据所属的目标声音类别。通过本发明,解决了相关技术中存在的确定音频类别对训练音频要求高的问题。

2021-11-02

访问量:34

音频数据的评测方法、装置、电子设备及存储介质
本申请实施例提供了一种音频数据的评测方法、装置、电子设备及存储介质,涉及人工智能技术领域,可以用于口语评测等场景。该方法包括:获取音频数据和与该音频数据对应的文本数据;基于音频数据与文本数据进行不确定性分析,确定采用评测模型对音频数据进行评测所得结果的不确定性分析结果;基于不确定性分析结果确定采用评测模型或其他评测方式对音频数据进行评测的评测结果作为最终评测结果。本申请方案的实施可以有效提高音频数据评测的准确性。

2021-11-02

访问量:26

音频播放方法和电子设备
本申请公开了一种音频播放方法和电子设备,属于人工智能领域。该方法包括:首先基于针对目标视频聊天场景所获取的人脸图像信息,确定与目标视频聊天场景对应的背景音乐音频信息;以及,基于针对目标视频聊天场景所获取的用户语音信息,确定目标视频聊天场景中目标用户的语音特征参数信息;然后基于语音特征参数信息,调整背景音乐音频信息的音频特征参数信息,并基于音频特征参数信息播放背景音乐音频信息。

2021-10-29

访问量:32

一种发动机异响识别方法及其相关设备
本申请实施例公开了一种发动机异响识别方法及其相关设备,该方法包括:在获取到待识别声音信号之后,先按照预设窗口参数从该待识别声音信号中提取出至少一个待使用音频数据;再对该至少一个待使用音频数据分别进行特征提取,得到至少一个待使用音频特征;最后,根据该至少一个待使用音频特征和预先构建的异响识别模型,确定该待识别声音信号的异响识别结果,以使该异响识别结果能够准确地表示出该待识别声音信号中是否存在异响,如此能够尽可能地克服避免人工识别发动机异响存在的缺陷,从而能够提高发动机异响识别的准确性,进而有利于提高车辆故障诊断的准确性。

2021-10-29

访问量:44

一种基于深度学习声纹识别的困难气道评估方法及装置
本发明涉及一种基于深度学习声纹识别的困难气道评估方法及装置,方法包括以下步骤:获取患者的语音数据;对所述语音数据进行特征提取,得到声学特征、声纹特征和语音识别特征;构建基于语音技术的困难气道分类器,通过训练好的困难气道分类器对提取的所述声学特征、声纹特征和语音识别特征进行分析并对困难气道严重程度进行评分,得到困难气道的评估结果。本发明能够精准的对临床麻醉中困难气道做出预警。

2021-10-29

访问量:31

依据音频信号产生动作的方法及电子装置
本发明提供一种依据音频信号产生动作的方法及电子装置。所述方法包括:接收音频信号,并从中撷取高阶音频特征;从高阶音频特征中撷取潜在音频特征;反应于判定音频信号对应于节拍,依据潜在音频特征取得关节角度分布矩阵;反应于判定音频信号对应于音乐,基于关节角度分布矩阵取得对应于关节点的多个指定关节角度;依据前述指定关节角度调整虚拟化身上各关节点的关节角度。借此,本发明可让虚拟化身随着当下音乐即兴呈现对应的动作。

2021-10-29

访问量:27

音频处理方法、装置、设备及存储介质
本发明公开了一种音频处理方法、装置、设备及存储介质,涉及音频处理技术领域,方法包括:获取包括至少两种不同音色音频信号的第一音频数据;对第一音频数据进行特征提取,获得音频特征向量;根据音频特征向量、目标音频信号的声音样本特征以及生成对抗网络,获得第二音频数据,第二音频数据不包括目标音频信号,生成对抗网络用于生成目标音频信号的伪信号,并根据伪信号获得第二音频数据,伪信号与目标音频信号之间的差异值小于阈值。本发明解决了现有技术在消除乐曲音频中指定乐器的声音时,容易导致原音损失的问题,实现了获得更自然且更完整的输出音频的效果。

2021-10-29

访问量:52

视频识别模型训练方法与装置、视频识别方法与装置
本公开提供了一种视频识别模型训练方法,包括:从第一视频样本中提取第一预设时长的视频样本的音频信息和图像信息,以得到第一音频样本和多帧第一图像样本,第一视频样本具有分类标签;基于预设预处理方法分别对多帧第一图像样本进行预处理,得到多帧第二图像样本;将多帧第二图像样本输入初始模型中的图像特征提取网络中,得到多个第一图像特征向量;将第一音频样本输入初始模型中的音频特征提取网络中,得到多个第一音频特征向量;对多个第一音频特征向量和多个第一图像特征向量进行相似性分析,得到相似性分析结果;基于相似性分析结果和第一视频样本的分类标签来计算第一损失值,以训练音频特征提取网络和图像特征提取网络。

2021-10-29

访问量:32

基于无监督领域对抗学习的说话人无关语音情感识别方法及系统
本发明公开了一种基于无监督领域对抗学习的说话人无关语音情感识别方法及系统,对情感语音数据进行预处理,获得高质量的情感语音样本,从所述情感语音样本中提取出单通道梅尔频谱作为时频特征,对所述时频特征经过深度卷积神经网络,得到语音情感的局部特征和全局特征,作为分层特征,建立无监督的深度领域对抗神经网络,将有标签的训练数据和无标签的测试数据提取分层特征后作为输入,对深度领域对抗网络进行训练,将待识别的情感语音数据预处理后输入训练好的深度领域对抗网络,得到语音情感识别结果。本发明识别效果更好、识别率更高。

2021-10-26

访问量:31

注册成为会员可查看更多数据。