情感状态估计
一种外呼时的智能选号方法及系统
本发明提供了一种外呼时的智能选号方法及系统,其中方法包括:对后台服务器发送请求获取选号规则;坐席外呼或自动外呼时,指定任一选号规则,根据选号规则与数据库内外显号码池中外显号码的参数从数据库内外显号码池的外显号码中确定初始外显号码发起外呼;获取外呼通话信息并将外呼通话信息发送至消息队列;对外呼通话信息进行处理,得到最新统计数据;基于最新统计数据对数据库内外显号码池中外显号码的参数进行更新;基于外呼时的智能选号方法的系统可以更灵活、智能的选择外显号,摆脱了之前针对坐席配置固定外显号,或由管理人员根据报表人工配置外显号的方法,提高了管理人员工作效率,降低了企业的外呼、获客成本,提高了企业运营效率。

2021-11-02

访问量:44

语音分类网络训练方法、装置、计算设备及存储介质
本发明涉及人工智能技术领域,尤其涉及一种语音分类网络训练方法、装置、设备及存储介质。该语音分类网络训练方法包括获取小样本数据集;将同一类别的训练音频样本作为对比模型学习的训练集,以基于训练集预训练对比模型,计算对比模型的模型损失;通过模型损失迭代训练对比模型,以得到训练好的对比模型;其中,训练好的对比模型包括目标特征提取器;将目标特征提取器与一分类器连接,以构建语音分类网络;采用小样本学习方式基于小样本数据集对语音分类网络进行微调,得到训练好的语音分类网络。该方法通过引入有监督学习方式预训练对比模型保证新任务的数据表达能力的稳定性,从而保证模型对于新任务的预测准确性。

2021-11-02

访问量:39

一种声纹识别方法及装置
本申请公开了一种声纹识别方法及装置,响应于用户的来电呼叫,接通后,获取用户提供的初始语音信息。当确定需要对用户进行身份认证且确定用户已开通声纹识别功能后,将用户的初始语音信息进行信息处理和特征提取,获取用户的声学特征参数。将声学特征参数输入隐马尔可夫模型,获取模型输出的目标对数似然度概率得分。确定目标对数似然度概率得分对应的声纹识别数据集中的目标声学特征参数,进而确定目标声学特征参数对应的身份信息,将身份信息对应的用户确定为目标用户。获取目标声学特征参数和用户对应的声学特征参数的相关性。当相关性满足预设条件时,确定用户的身份识别通过。在用户无感的情况下,对用户进行了身份识别。

2021-11-02

访问量:36

基于互补特征学习框架的语音情感识别方法及装置
本发明涉及一种基于互补特征学习框架的语音情感识别方法及装置。本发明所述的基于互补特征学习框架的语音情感识别方法包括:构建互补特征学习框架,框架包括相互并行的第一独立特征学习通道、第二独立特征学习通道和融合特征学习通道,还包括注意力融合模块;将MFCC系数和手工制作特征分别通过独立特征学习通道进行特征提取,得到特征F1和特征F2;再将二者同时输入所述融合特征学习通道进行特征提取,得到特征F3;将特征F1、特征F2和特征F3输入所述注意力融合模块进行特征提取和细化,得到分类特征;对所述分类特征进行分类,得到最终的情感识别与分类结果。本发明所述的语音情感识别方法结合了独立训练和融合训练的优点,情感识别结果更加准确。

2021-11-02

访问量:37

语音情绪识别模型训练方法及电子设备
本发明公开了一种语音情绪识别模型训练方法及电子设备,方法包括:获取语者识别语料;从所述语者识别语料中提取频域特征数据;使用所述频域特征数据进行训练,获得语音情绪特征抽取器;获取语音情绪语料;利用所述语音情绪特征抽取器从所述语音情绪语料中提取语音情绪特征数据;使用语音情绪特征数据进行训练,获得语音情绪识别模型。本发明仅需少量的语音情绪语料就能使得训练得到的语音情绪识别模型也具有较高的精确度。

2021-11-02

访问量:30

一种基于深度学习的语音情感识别方法
一种基于深度学习的语音情感识别方法,属于语音识别领域。现有语音情感识别率低。本发明方法的一种基于深度学习的语音情感识别方法包括,待测语音信息的预处理;情感特征提取;对提取的情感特征参数进行归一化处理的过程;设计DNN瓶颈层结合决策树和特征融合的语音情感识别系统;利用归一化处理的情感特征参数对识别系统进行训练;利用训练后的DNN瓶颈层结合决策树和特征融合的语音情感识别系统对获取待测语音信息进行语音识别。本发明方法提高了语音情感识别率。

2021-11-02

访问量:42

一种基于声学的疲劳驾驶和分心驾驶的检测方法、装置、设备及介质
本发明公开了一种基于声学的疲劳驾驶和分心驾驶的检测方法、装置、设备及介质,其方法为:发射FMCW信号,接收信号进行预处理,得到通过LOS路径传输的FMCW信号和反射的回波信号;根据每个回波信号相对接收到FMCW信号的时间差,计算得到不同反射对象相对于麦克风的距离时间序列;从所有距离时间序列中,提取出驾驶员头部和转向手的距离时间序列;根据头部和转向手的距离时间序列及已知的多种危险驾驶动作,对驾驶员是否执行各种危险驾驶动作进行判断;加权融合所有危险驾驶动作在预设时间段内的次数,判断驾驶员当前是否进入疲劳与分心驾驶的状态。本发明可准确提取驾驶员头和手的回波,实现对疲劳与分心驾驶状态的准确检测。

2021-11-02

访问量:57

一种用于网约车的安全监控方法及系统
本发明提出了一种用于网约车的安全监控方法及系统,包括:基于网约车订单,建立乘客终端、网约车终端及监控平台三方互联互通的信息群;乘客终端接收网约车平台根据网约车订单的起点和终点按照预设规则确定若干条路径;乘客选择目标路径,并确定安全区域发送至信息群;在执行网约车订单的过程中,实时获取网约车的行驶轨迹,并判断行驶轨迹是否在安全区域范围内,在确定行驶轨迹不在安全区域范围内时,将实时采集的车内的声音信号传输至信息群;根据声音信号判断司机与乘客是否发生争吵,在确定司机与乘客发生争吵时,发出争吵预警提示并对争吵事件进行及时处理。可以实现对网约车进行有效的安全监控。

2021-11-02

访问量:40

一种深度融合面部表情和语音的驾驶员路怒症识别方法
本发明一种深度融合面部表情和语音的驾驶员路怒症识别方法,包括:从驾驶员面部视频影像信息中提取出驾驶员的面部影像信息和语音信息;对面部影像帧信息进行预处理并输入到多层卷积神经网络中获得面部表情特征;对语音信息首先提取其梅尔倒谱系数及其一阶和二阶系数值进行初始特征提取,并拼接2段语音片段初始特征输入到全连接层网络中获得与面部表情帧对应的判别性语音帧特征;将得到的面部帧表情特征和语音帧特征进行低秩双线性池化融合获得融合特征;对面部表情特征、语音特征和融合特征进行决策融合后获取到最终的路怒症识别结果。本发明在复杂驾驶环境下,依然能实现高精度地输出驾驶员愤怒症识别结果,进而有效地进行安全驾驶预警。

2021-11-02

访问量:46

一种说话人自适应的多视角对话情感识别方法及系统
本发明公开了一种说话人自适应的多视角对话情感识别方法及系统,方法包括:S1,将多轮对话中,每条对话语句的说话人,映射到对应的说话人ID序列,去除说话人具体身份;S2,对说话人ID标记后的多轮对话,进行融合说话人信息的上下文编码,得到对话中每个语句的上下文编码表征;S3,基于上下文编码表征,进行说话人自适应的多视角全局对话信息融合编码,得到对话的多视角全局融合信息;S4,将多视角的全局融合信息,进行自适应的信息汇总,并对语句最终情感进行识别;系统包括:依次连接的多轮对话预处理模块、上下文编码模块、多视角全局融合编码模块和情感识别模块。

2021-10-29

访问量:23

注册成为会员可查看更多数据。