一种基于神经网络的饮水机出水自动控制方法

文档序号:1837299 发布日期:2021-11-16 浏览:33次 >En<

阅读说明:本技术 一种基于神经网络的饮水机出水自动控制方法 (Water dispenser water outlet automatic control method based on neural network ) 是由 王文韬 赵亚丽 缪炜 于 2021-08-27 设计创作,主要内容包括:本发明公开了一种基于神经网络的饮水机出水自动控制方法,构建了用户指令识别模型和水位检测模型。本发明中,神经网络模型一作为用户指令识别模型,能够识别人声,解放双手,而且不受光线的限制,可在黑暗环境下使用,神经网络模型二作为水位检测模型,能够代替人工判断杯中水位,更好地泛化于多种类型的杯子上,不因杯子类型区别而影响判断的准确程度,具有更好的用户体验。(The invention discloses a water dispenser water outlet automatic control method based on a neural network, and a user instruction identification model and a water level detection model are established. In the invention, the first neural network model serves as a user instruction identification model, can identify voice, liberates hands, is not limited by light, can be used in a dark environment, and the second neural network model serves as a water level detection model, can replace manual judgment of water level in cups, is better generalized on various types of cups, does not influence the accuracy of judgment due to cup type difference, and has better user experience.)

一种基于神经网络的饮水机出水自动控制方法

技术领域

本发明涉及饮水机出水技术领域,尤其涉及一种基于神经网络的饮水机出水自动控制方法。

背景技术

使用饮水机接水时,如果想要在杯中接指定水位的水,通常需要人用眼睛耳朵人为判断杯中的水位,这样,在饮水机出水时,人就需要手动打开出水开关,并且时刻关注杯中的水位,判断是否达到自己想要的水位,或者是否接满等,则需要人在此分配注意力,非常不方便。另外,有时需要在光线较暗的环境下接水,仅凭听觉,人很难判断水位。

为了解决“使用饮水机接水时需要人分配注意力观察水位”这个问题,目前也有饮水机采用流出指定水量的方法,每次流出指定水量的水。但是这种方法对于不同尺寸的杯子不适用。同样的水量,对于容量较小的杯子,水可能会溢出,对于容量较大的杯子,水又太少。人在接水时,一般更加关注当前水位高度占杯子高度的百分比。对于不同尺寸的杯子,接50%高度,70%高度或者接满水所需的水量是不一样的。如果使用这种方法,对于不同尺寸的杯子,如果人想要接50%高度的水,70%高度的水或者接满水,还是要分配注意力人为控制流水量,仍旧无法解决“使用饮水机接水时需要人分配注意力观察水位”这个问题。

在使用饮水机接水时,由于水杯中空气柱的震动,会产生声音,且声音模式会随着杯中水位高度发生变化。可利用这种特性,通过接水时的声音模式,进行水位检测,然后控制饮水机停止出水。对于接水时声音模式的检测的方式,如果使用传统音频算法对水杯接水时的声音建模,难以在不同类型的杯子上都达到好的效果,另外,目前在使用饮水机时,通常需要手动按动出水按钮,不够方便。

因此,提出一种基于神经网络的饮水机出水自动控制方法。

发明内容

本发明的目的在于:为了解决上述的问题,而提出的一种基于神经网络的饮水机出水自动控制方法。

为了实现上述目的,本发明采用了如下技术方案:一种基于神经网络的饮水机出水自动控制方法,包括以下步骤:

(一)构建用户指令识别模型

a.采集饮水机支持的声控指令;

b.使用收集的用户指令语音数据训练神经网络模型一,对用户指令的声音模式进行建模。

(二)构建水位检测模型

c.采集饮水机出水时,各种类型的杯子接水时发出的声音;

d.使用收集的数据训练神经网络模型二,对接水时杯中不同水位情况下的声音进行建模。

作为上述技术方案的进一步描述:

所述b步骤之前对采集的语音进行预处理。

作为上述技术方案的进一步描述:

所述b步骤中的神经网络模型一沿输出方向依次设有40*100维输入、CNN层1、ReLU层2、CNN层3、ReLU层4、线性变换层5、ReLU层6、线性变换层7、ReLU层8、线性变换层9、softmax层10以及11维输出。

作为上述技术方案的进一步描述:

所述d步骤中的神经网络模型二沿输出方向依次设有1200维输入,线性变换层1,LSTM结构2,线性变换层3,sigmoid函数层4以及1维输出。

作为上述技术方案的进一步描述:

在所述b和d步骤中,神经网络模型一和神经网络模型二使用Adam优化器,损失函数为交叉熵。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

本发明中,神经网络模型一作为用户指令识别模型,能够识别人声,解放双手,而且不受光线的限制,可在黑暗环境下使用,神经网络模型二作为水位检测模型,能够代替人工判断杯中水位,更好地泛化于多种类型的杯子上,不因杯子类型区别而影响判断的准确程度,具有更好的用户体验。

附图说明

图1示出了根据本发明实施例提供的神经网络模型一结构示意图;

图2示出了根据本发明实施例提供的神经网络模型二结构示意图;

图3示出了根据本发明实施例提供的饮水机自动出水流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1-3,本发明提供一种技术方案:一种基于神经网络的饮水机出水自动控制方法,包括以下步骤:

(一)构建用户指令识别模型

a.采集饮水机支持的声控指令,具体为采集300人以上的说话人的语音数据,语音数据包括饮水机支持声控的指令,比如“接水50%高度”,“接水70%高度”,“自动满水”,“停止接水”等词条;

b.使用收集的用户指令语音数据训练神经网络模型一,对用户指令的声音模式进行建模,b步骤之前对采集的语音进行预处理,对采集到的命令词数据加一些日常生活中的常用噪声,联合原始录制数据一起,作为训练数据;以25ms为窗长提取语音的40维的fbank特征,每10ms移动一次窗口;

用户指令识别模型在训练完成后使用时,需要对指令词设置指令词唤醒阈值。当模型在某指令词维度上的输出大于等于指令词唤醒阈值时,认为该指令生效。例如,设置指令词唤醒阈值为0.9,模型在“接水80%高度”对应维度上的输出为0.95,大于0.9,则认为“接水80%高度”指令生效,即可得到停止出水的阈值0.8;

b步骤中的神经网络模型一沿输出方向依次设有40*100维输入、CNN层1、ReLU层2、CNN层3、ReLU层4、线性变换层5、ReLU层6、线性变换层7、ReLU层8、线性变换层9、softmax层10以及11维输出;

具体的,40维的fbank特征,前后拼一共100帧,先经过64个卷积核为40*7的CNN层1和ReLU层2,再经过128个卷积核为64*7的CNN层3和ReLU层4,再经过线性变换层5和ReLU层6、线性变换层7和ReLU层8、线性变换层9,最后于softmax层10输出,得到11维输出。其中,11维输出的每个维度分别标示每个指令词被识别出来的概率(0到1之间)。

(二)构建水位检测模型

c.采集饮水机出水时,各种类型的杯子接水时发出的声音,声音数据包括从空杯到接满整个时间段的数据,收集数据时,对不同水位时的声音时刻进行标记,例如“水杯中水位高度为30%时,此时为接水音频2s时刻”,水位高度每隔10%标记一次,一直到水位达到满水,即100%;

d.使用收集的数据训练神经网络模型二,对接水时杯中不同水位情况下的声音进行建模;

其中,水位检测模型包含LSTM结构,用于建模时序信息。输出为水位。模型输出层为sigmoid函数,将输出约束在0至1之间,方便表示当前水位高度占水杯的高度的比例。

录制音频为48kHz采样音频。按照帧长25ms、帧移10ms进行分帧,则每帧包含采样点数为1200个,相邻帧之间间隔采样点数为480个。则每隔10ms,即480个采样点,模型输入25ms的音频数据,即1200个采样点;

d步骤中的神经网络模型二沿输出方向依次设有1200维输入,线性变换层,LSTM结构,线性变换层,sigmoid函数层以及1维输出;

具体的,1200个采样点数据作为模型的1200维输入,1200维输入首先经过线性变换层1,将输入从1200维变换成64维。线性变换层1的输出输入LSTM结构2,LSTM结构2的输出的维度为64维。LSTM结构2的输出进入线性变换层3,线性变换层3将64维数据变换为1维,线性变换层3的输出输入sigmoid函数层4,由sigmoid函数层4输出最终结果。最终输出为1维,为一个0至1之间的数值。

在b和d步骤中,神经网络模型一和经网络模型二使用Adam优化器,损失函数为交叉熵。

饮水机的接水流程为:

步骤1,将杯子放置在接水处。

步骤2,用户发出语音指令,设置想要的水位,作为停止出水的阈值,例如“接水80%高度”,此时对应的阈值为0.8,用户发出语音指令后,饮水机即开始出水。

步骤3,在饮水机出水时,将杯子接水时发出的声音录制下来,并实时传输至水位检测模型。

步骤4,通过水位检测模型,判断杯中当前水位,每隔10ms输出一次结果,结果为0至1之间的数值。0为最低水位,1为最高为水位。例如数值为0.6时,认为水位达到杯子高度的60%。

步骤5,每输出一次结果,进行一次判断,当结果大于等于阈值时,出水开关收到关闭信号,饮水机自动停止出水;水位有最高限值,数值达到0.95时,已经接近最大值1,认为水已接满,出水开关收到关闭信号,饮水机自动停止出水。

另外,在饮水机出水的任何时刻,只要用户下达“停止出水”的指令,饮水机则停止出水。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:冲奶配比控制方法、智能冲泡设备及可读存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类