首页
最新技术
特色专题
技术名词
热点聚焦
行业风向
登录
注册
以提取参数类型为特征的
一种音频处理方法、装置及电子设备
本发明公开了一种音频处理方法、装置及电子设备,该方法包括:获取待处理的目标音频;获取选定的特征向量,其中,特征向量包括影响音频的评分的至少一个特征;获取特征向量与评分之间的映射函数;根据映射函数和目标音频的特征向量的向量值,获得目标音频的预测评分。
2021-11-02
访问量:35
音频类别的确定方法、装置、存储介质及电子装置
本发明实施例提供了一种音频类别的确定方法、装置、存储介质及电子装置,其中,该方法包括:确定获取到的目标音频数据的目标特征;使用目标模型对目标特征进行分析,以确定目标音频数据中包括的每帧音频数据属于每个声音类别的第一概率,其中,目标模型为使用多组目标训练数据通过机器学习训练出的,多组目标训练数据中的每组数据包括:音频数据的特征和每帧音频的声音类别,每组数据均是进行了增强处理后所得到的数据,目标模型中包括多个卷积层;基于第一概率确定目标音频数据中包括的每帧音频数据所属的目标声音类别。通过本发明,解决了相关技术中存在的确定音频类别对训练音频要求高的问题。
2021-11-02
访问量:34
音频数据的评测方法、装置、电子设备及存储介质
本申请实施例提供了一种音频数据的评测方法、装置、电子设备及存储介质,涉及人工智能技术领域,可以用于口语评测等场景。该方法包括:获取音频数据和与该音频数据对应的文本数据;基于音频数据与文本数据进行不确定性分析,确定采用评测模型对音频数据进行评测所得结果的不确定性分析结果;基于不确定性分析结果确定采用评测模型或其他评测方式对音频数据进行评测的评测结果作为最终评测结果。本申请方案的实施可以有效提高音频数据评测的准确性。
2021-11-02
访问量:26
音频播放方法和电子设备
本申请公开了一种音频播放方法和电子设备,属于人工智能领域。该方法包括:首先基于针对目标视频聊天场景所获取的人脸图像信息,确定与目标视频聊天场景对应的背景音乐音频信息;以及,基于针对目标视频聊天场景所获取的用户语音信息,确定目标视频聊天场景中目标用户的语音特征参数信息;然后基于语音特征参数信息,调整背景音乐音频信息的音频特征参数信息,并基于音频特征参数信息播放背景音乐音频信息。
2021-10-29
访问量:34
一种发动机异响识别方法及其相关设备
本申请实施例公开了一种发动机异响识别方法及其相关设备,该方法包括:在获取到待识别声音信号之后,先按照预设窗口参数从该待识别声音信号中提取出至少一个待使用音频数据;再对该至少一个待使用音频数据分别进行特征提取,得到至少一个待使用音频特征;最后,根据该至少一个待使用音频特征和预先构建的异响识别模型,确定该待识别声音信号的异响识别结果,以使该异响识别结果能够准确地表示出该待识别声音信号中是否存在异响,如此能够尽可能地克服避免人工识别发动机异响存在的缺陷,从而能够提高发动机异响识别的准确性,进而有利于提高车辆故障诊断的准确性。
2021-10-29
访问量:44
一种基于深度学习声纹识别的困难气道评估方法及装置
本发明涉及一种基于深度学习声纹识别的困难气道评估方法及装置,方法包括以下步骤:获取患者的语音数据;对所述语音数据进行特征提取,得到声学特征、声纹特征和语音识别特征;构建基于语音技术的困难气道分类器,通过训练好的困难气道分类器对提取的所述声学特征、声纹特征和语音识别特征进行分析并对困难气道严重程度进行评分,得到困难气道的评估结果。本发明能够精准的对临床麻醉中困难气道做出预警。
2021-10-29
访问量:32
依据音频信号产生动作的方法及电子装置
本发明提供一种依据音频信号产生动作的方法及电子装置。所述方法包括:接收音频信号,并从中撷取高阶音频特征;从高阶音频特征中撷取潜在音频特征;反应于判定音频信号对应于节拍,依据潜在音频特征取得关节角度分布矩阵;反应于判定音频信号对应于音乐,基于关节角度分布矩阵取得对应于关节点的多个指定关节角度;依据前述指定关节角度调整虚拟化身上各关节点的关节角度。借此,本发明可让虚拟化身随着当下音乐即兴呈现对应的动作。
2021-10-29
访问量:27
音频处理方法、装置、设备及存储介质
本发明公开了一种音频处理方法、装置、设备及存储介质,涉及音频处理技术领域,方法包括:获取包括至少两种不同音色音频信号的第一音频数据;对第一音频数据进行特征提取,获得音频特征向量;根据音频特征向量、目标音频信号的声音样本特征以及生成对抗网络,获得第二音频数据,第二音频数据不包括目标音频信号,生成对抗网络用于生成目标音频信号的伪信号,并根据伪信号获得第二音频数据,伪信号与目标音频信号之间的差异值小于阈值。本发明解决了现有技术在消除乐曲音频中指定乐器的声音时,容易导致原音损失的问题,实现了获得更自然且更完整的输出音频的效果。
2021-10-29
访问量:53
视频识别模型训练方法与装置、视频识别方法与装置
本公开提供了一种视频识别模型训练方法,包括:从第一视频样本中提取第一预设时长的视频样本的音频信息和图像信息,以得到第一音频样本和多帧第一图像样本,第一视频样本具有分类标签;基于预设预处理方法分别对多帧第一图像样本进行预处理,得到多帧第二图像样本;将多帧第二图像样本输入初始模型中的图像特征提取网络中,得到多个第一图像特征向量;将第一音频样本输入初始模型中的音频特征提取网络中,得到多个第一音频特征向量;对多个第一音频特征向量和多个第一图像特征向量进行相似性分析,得到相似性分析结果;基于相似性分析结果和第一视频样本的分类标签来计算第一损失值,以训练音频特征提取网络和图像特征提取网络。
2021-10-29
访问量:33
基于无监督领域对抗学习的说话人无关语音情感识别方法及系统
本发明公开了一种基于无监督领域对抗学习的说话人无关语音情感识别方法及系统,对情感语音数据进行预处理,获得高质量的情感语音样本,从所述情感语音样本中提取出单通道梅尔频谱作为时频特征,对所述时频特征经过深度卷积神经网络,得到语音情感的局部特征和全局特征,作为分层特征,建立无监督的深度领域对抗神经网络,将有标签的训练数据和无标签的测试数据提取分层特征后作为输入,对深度领域对抗网络进行训练,将待识别的情感语音数据预处理后输入训练好的深度领域对抗网络,得到语音情感识别结果。本发明识别效果更好、识别率更高。
2021-10-26
访问量:31
注册成为会员可查看更多数据。
热门专题
左旋肉碱的制备方法 左旋肉碱生产工艺 左旋肉碱相关技术资料
免烧砖的制造方法及应用 免烧砖相关专利技术
水溶肥制备方法和应用 水溶肥相关技术资料
保温砂浆及其制备方法 保温砂浆相关技术资料
聚羧酸减水剂的配方 聚羧酸减水剂制备方法 聚羧酸减水剂相关技术资料
除湿机的结构设计 新型工业除湿机的制造 除湿机相关技术资料
脱硫剂的制备方法及系统 脱硫剂数字化评价装置及其评价方法
硅基材料的生产工艺 新型硅基负极材料 硅基材料相关生产制备工艺
柔性电池的制备方法 柔性电池的工艺原理 柔性电池相关生产制备技术资料
汽车充电桩的设计原理 新型汽车充电桩 汽车充电桩的生产制造设计工艺
技术分类
本小类其他组不包括的技术主题
判别语音信号之间的浊音和清音部分
语音信号的音调确定
语音信号内离散点的检测
从噪声判别声音
从音乐中判别声音
语音信号存在或不存在的检测
模拟声道参数
用于发送分析结果
用于评估合成或解码语音信号
提取与健康状况相关的参数
情感状态估计
语音信号的质量检测
用于处理视频信号
为检索
比较或判别
专门适用于特定用途
以分析窗类型为特征的
利用遗传算法
利用混沌理论
利用模糊逻辑
利用神经网络
以分析方法为特征的
提取参数的倒谱
提取参数的功率信息
提取参数的每个子带的频谱信息
提取参数的共振信息
提取参数的预测系数
提取参数的零交叉率
提取参数的相关性系数
以提取参数类型为特征的
不限于组G10L15/00-G10L21/00的语言或者声音分析技术
转换处理的零部件
转换成非可视形式
通过显示频域信息
通过显示时域信息
转换成可视信息
将语音转换成非可听表达形式,例如语音可视化、触觉辅助的语音处理
用于提高可识度
用于与其他信号的同步,例如,视频信号
拨打电话
下载资料
栏目导航
会员登录