语音交互方法及洗衣机

文档序号:1965049 发布日期:2021-12-14 浏览:18次 >En<

阅读说明:本技术 语音交互方法及洗衣机 (Voice interaction method and washing machine ) 是由 丁晓鹏 许升 于 2020-05-25 设计创作,主要内容包括:本发明实施例提供一种语音交互方法及洗衣机,该方法应用于语音交互设备,该方法包括:采集语音唤醒指令;获取所述用户的状态信息,所述状态信息包括下述至少一项:所述语音交互设备与所述用户的距离、所述用户的行为;根据所述用户的状态信息,确定是否响应所述语音唤醒指令。由于用户的状态信息能够反映出用户是否有唤醒语音交互设备的意图,因此,本方法根据用户的状态信息可以准确的判断是否响应语音唤醒指令,从而可以避免误唤醒的情况。(The embodiment of the invention provides a voice interaction method and a washing machine, wherein the method is applied to voice interaction equipment and comprises the following steps: collecting a voice awakening instruction; acquiring the state information of the user, wherein the state information comprises at least one of the following items: the distance between the voice interaction device and the user, and the behavior of the user; and determining whether to respond to the voice awakening instruction or not according to the state information of the user. Because the state information of the user can reflect whether the user has the intention of waking up the voice interaction equipment, the method can accurately judge whether to respond to the voice wake-up instruction according to the state information of the user, thereby avoiding the situation of mistaken wake-up.)

语音交互方法及洗衣机

技术领域

本发明实施例涉及语音交互技术领域,尤其涉及一种语音交互方法及洗衣机。

背景技术

在语音交互

技术领域

中,通常采用如下方式实现语音交互:用户对语音交互设备说出唤醒词,语音交互设备在识别出唤醒词后被唤醒,然后用户就可以和语音交互设备交流,语音交互设备做出对应的应答或者动作。

例如在手机导航软件中,手机导航软件预设了唤醒词“A”,当用户需要手机导航软件导航到地点B时,用户首先说出唤醒词“A”,手机导航软件识别出唤醒词“A”后被唤醒,用户此时再说出“导航到地点B”,手机导航软件即可根据用户的请求规划到地点B的导航路线,并显示给用户。

再例如支持语音交互的洗衣机,洗衣机预设了唤醒词“C”,当用户需要语音控制洗衣机脱水时,用户首先说出唤醒词“C”,洗衣机识别出唤醒词“C”后被唤醒,用户此时再说出“脱水”,洗衣机即可根据用户的请求开始执行脱水动作。

然而,在一些场景中,用户在打电话、聊天或播放音乐时,可能会因为话语或者环境噪音与设备的唤醒词近似,而导致语音交互设备被误唤醒。

发明内容

本发明实施例提供的语音交互方法及洗衣机,以克服语音交互设备被误唤醒的问题。

本申请第一方面提供了一种语音交互方法,所述方法应用于语音交互设备,所述方法包括:

采集语音唤醒指令;

获取用户的状态信息,所述状态信息包括下述至少一项:所述语音交互设备与所述用户的距离、所述用户的行为;

根据所述用户的状态信息,确定是否响应所述语音唤醒指令。

可选地,所述获取用户的状态信息,具体包括:

根据采集的用户图像,获取所述用户的状态信息。

可选地,所述根据所述用户的状态信息,确定是否响应所述语音唤醒指令,具体包括:

若所述语音交互设备与所述用户的距离大于或等于预设距离,或者,所述用户的行为是预设行为,则确定不响应所述语音唤醒指令。

可选地,所述根据所述用户的状态信息,确定是否响应所述语音唤醒指令,具体包括:

若所述语音交互设备与所述用户的距离小于所述预设距离,且,所述用户的行为非所述预设行为,则确定所述用户的唤醒值,所述唤醒值与下述至少一项相关:所述用户的朝向、所述用户是否发音;

根据所述用户的唤醒值,确定是否响应所述语音唤醒指令。

可选地,所述用户为一个,所述根据所述用户的唤醒值,确定是否响应所述语音唤醒指令,包括:

若所述用户的唤醒值大于或等于唤醒阈值,则确定响应所述语音唤醒指令;或者,

若所述用户的唤醒值小于所述唤醒阈值,则确定不响应所述语音唤醒指令。

可选地,所述用户为多个;所述根据所述用户的唤醒值,确定是否响应所述语音唤醒指令,包括:

根据每个所述用户的唤醒值,获取所述语音唤醒指令对应的唤醒值;

若所述语音唤醒指令对应的唤醒值大于或等于唤醒阈值,则确定响应所述语音唤醒指令;或者,

若所述语音唤醒指令对应的唤醒值小于所述唤醒阈值,则确定不响应所述语音唤醒指令。

可选地,所述根据每个所述用户的唤醒值,获取所述语音唤醒指令对应的唤醒值,包括:

将每个所述用户和所述语音交互设备的距离作为每个所述用户的唤醒值的权值,对所述多个用户的唤醒值进行加权平均,获取所述语音唤醒指令对应的唤醒值。

可选地,所述方法还包括:

在进行语音播放时,获取所述用户的状态信息;

根据所述用户的状态信息,确定语音播放时的播放音量。

可选地,所述根据所述用户的状态信息,确定语音播放时的播放音量,包括:

若所述语音交互设备与所述用户的距离小于预设距离,且,所述用户的行为是预设行为,则降低语音播放时的播放音量;或者,

若所述语音交互设备与所述用户的距离大于或等于所述预设距离,或,所述用户的行为非所述预设行为,则将预设音量作为语音播放时的播放音量。

本申请第二方面提供了一种语音交互装置,所述装置应用于语音交互设备,所述装置包括:

采集模块,用于采集语音唤醒指令;

处理模块,用于获取用户的状态信息;根据所述用户的状态信息,确定是否响应所述语音唤醒指令;所述状态信息包括下述至少一项:所述语音交互设备与所述用户的距离、所述用户的行为。

可选地,所述处理模块,具体用于根据采集的用户图像,获取所述用户的状态信息。

可选地,所述处理模块,具体用于当所述语音交互设备与所述用户的距离大于或等于预设距离,或者,所述用户的行为是预设行为时,确定不响应所述语音唤醒指令。

可选地,所述处理模块,具体用于当所述语音交互设备与所述用户的距离小于所述预设距离,且,所述用户的行为非所述预设行为时,确定所述用户的唤醒值;根据所述用户的唤醒值,确定是否响应所述语音唤醒指令;所述唤醒值与下述至少一项相关:所述用户的朝向、所述用户是否发音。

可选地,所述用户为一个;

所述处理模块,具体用于当所述用户的唤醒值大于或等于唤醒阈值时,确定响应所述语音唤醒指令;或者,当所述用户的唤醒值小于所述唤醒阈值时,确定不响应所述语音唤醒指令。

可选地,所述用户为多个;

所述处理模块,具体用于根据每个所述用户的唤醒值,获取所述语音唤醒指令对应的唤醒值;当所述语音唤醒指令对应的唤醒值大于或等于唤醒阈值时,确定响应所述语音唤醒指令;或者,当所述语音唤醒指令对应的唤醒值小于所述唤醒阈值时,确定不响应所述语音唤醒指令。

可选地,所述处理模块,具体用于将每个所述用户和所述语音交互设备的距离作为每个所述用户的唤醒值的权值,对所述多个用户的唤醒值进行加权平均,获取所述语音唤醒指令对应的唤醒值。

可选地,所述处理模块,还用于在进行语音播放时,获取所述用户的状态信息;根据所述用户的状态信息,确定语音播放时的播放音量。

可选地,所述处理模块,具体用于当所述语音交互设备与所述用户的距离小于预设距离,且,所述用户的行为是预设行为时,降低语音播放时的播放音量;或者,当所述语音交互设备与所述用户的距离大于或等于所述预设距离,或,所述用户的行为非所述预设行为时,将预设音量作为语音播放时的播放音量。

本申请第三面提供了一种语音交互装置,包括:至少一个处理器和存储器;

所述存储器存储计算机执行指令;

所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述装置执行第一方面任一项所述的方法。

本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现第一方面任一项所述的方法。

第五方面,本发明实施例提供一种洗衣机,所述洗衣机用于执行第一方面任一项所述的方法。

本发明实施例提供的语音交互方法及洗衣机,语音交互设备采集语音唤醒指令,并获取用户的状态信息,由于用户的状态信息能够反映出用户是否有唤醒语音交互设备的意图,因此,本方法根据用户的状态信息可以准确的判断是否响应语音唤醒指令,从而可以避免误唤醒的情况。

附图说明

下面参照附图并结合具体的实施例来描述本申请提供的程序更新的方法的优选实施方式。附图为:

图1是本发明实施例提供的一种洗衣机的结构示意图;

图2是本发明实施例提供的一种语音交互方法的流程示意图;

图3是本发明实施例提供的另一种语音交互方法的流程示意图;

图4是本发明实施例提供的又一种语音交互方法的流程示意图;

图5是本发明实施例提供的再一种语音交互方法的流程示意图;

图6是本发明实施例提供的再一种语音交互方法的流程示意图;

图7是本发明实施例提供的一种语音交互装置的结构示意图;

图8为本发明实施例提供的另一种语音交互装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请的实施例,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

近些年来,语音交互技术已经在众多应用场景中得到应用,例如导航软件、智能音箱、家用电器等,其中,家用电器例如可以支持语音交互的洗衣机、冰箱、空调、微波炉、电视机等等。

然而,在一些场景中,用户在打电话、聊天或播放音乐时,可能会因为话语或者环境噪音与设备的唤醒词近似,而导致语音交互设备被误唤醒。

示例性的,某洗衣机支持语音交互,假设洗衣机的唤醒词为“大白”。当用户在打电话过程中,说到“大白菜”时,洗衣机误将用户说出的“大白菜”中的前两个字识别为唤醒词,进而唤醒洗衣机,造成洗衣机被误唤醒。

由于用户的状态能够反映出用户是否有唤醒语音交互设备的意图,因此,为了克服前述所描述的技术问题,本发明实施例借助用户的状态信息,来确定是否影响用户输入的语音唤醒指令,以避免出现误唤醒的情况。

本发明实施例的执行主体为语音交互设备,该语音交互设备设置有麦克风、扬声器和摄像头。其中,麦克风用于采集语音,扬声器用于播放语音,摄像头用于采集图像。

该语音交互设备例如可以是洗衣机、冰箱、空调、智能音箱、手机等。

下面以语音交互设备为洗衣机为例,图1是本发明实施例提供的一种洗衣机的结构示意图。如图1所示,洗衣机包括本体11、麦克风12、扬声器13和摄像头14,麦克风12和扬声器例如可以设置在本体11的正面或侧面(图1以侧面为例),摄像头14例如可以设置在本体11的正面,用来采集洗衣机正前方视野覆盖范围内的图像。

下面结合具体的实施例,对本发明提供的语音交互方法的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或者相似的概念或者过程可能在某些实施例不再赘述。

图2是本发明实施例提供的一种语音交互方法的流程示意图。如图2所示,本发明该方法可以包括:

S101、采集语音唤醒指令。

示例性的,语音交互设备为洗衣机时,参照图1,洗衣机可以通过麦克风12采集语音,并基于现有的语音识别技术,识别该语音是否为语音唤醒指令。例如洗衣机可以判断该语音是否为预设的唤醒词或者是否包括预设的唤醒词,当识别到该语音是预设的唤醒词,或者包括预设的唤醒词时,确定该语音为语音唤醒指令。

S102、获取用户的状态信息。

状态信息包括下述至少一项:语音交互设备与用户的距离、用户的行为。

示例性的,可以根据采集的用户图像,获取用户的状态信息,也可以根据采集的用户语音,获取用户的状态信息,还可以通过安装于用户身上的传感器采集用户的动作轨迹,获取用户的状态信息。

以采集的用户图像为例,获取语音交互设备与用户的距离,至少可以采用如下两种方式:

一种可能的实现方式中,语音交互设备可以通过摄像头14采集用户图像,该用户图像可以为一帧用户图像、也可以为连续的多帧用户图像,具体可以根据实际情况确定。其中,用户图像中可以包括一个用户,也可以包括多个用户。语音交互设备可以从用户图像中提取参照物在用户图像中的尺寸,语音交互设备可以基于参照物在图像中的尺寸、参照物的实际尺寸、以及用户在图像中的尺寸确定语音交互设备与用户的距离。其中,参照物位于摄像头视野范围内,参照物的实际尺寸可以是预先存储在语音交互设备中的,当语音交互设备连接网络时,还也可以通过网络获取参照物的实际尺寸。

另一种可能的实现方式中,语音交互设备可以通过摄像头14采集用户图像,然后标定的摄像头安装高度和视场最近端的距离,然后获取用户图像中用户的顶部和底部在图像中的距离值以及用户在图像中的横向距离,然后利用摄像头拍摄用户图像对应地面的角度和摄像头中心投影的透视几何关系,将语音交互设备与用户的距离转化为用户图像的对地视角,从而可以根据标定的摄像头安装高度和视场最近端的距离确定语音交互设备与用户的距离。

当存在一个用户时,可以获取语音交互设备到该用户的距离;当存在多个用户时,可以获取语音交互设备到每个用户的距离。

以采集的用户图像为例,获取用户的行为,至少可以采用如下两种方式:

一种可能的实现方式中,语音交互设备可以通过摄像头14采集用户图像,然后将用户图像输入到用户行为识别模型中识别用户的行为。用户行为识别模型可以是将标定了用户行为的用户图像样本集输入到用户行为识别模型中训练得到的。

另一种可能的实现方式中,语音交互设备可以通过摄像头14采集用户图像,然后在用户图像中提取用户的轮廓,将用户图像中用户的轮廓与轮廓模型进行比对,每个轮廓模型指示一种对应的行为,当用户的轮廓和某一个轮廓模型相似度大于一定阈值时,即可识别出用户的行为是该轮廓模型对应的行为。

当存在一个用户时,可以获取该用户的行为;当存在多个用户时,可以获取每个用户的行为。

S103、根据用户的状态信息,确定是否响应语音唤醒指令。

当语音交互设备与用户的距离、用户的行为指示用户有唤醒语音交互设备的意图时,确定响应语音唤醒指令;当语音交互设备与用户的距离、用户的行为指示用户没有唤醒语音交互设备的意图时,确定不响应语音唤醒指令,以避免语音交互设备被误唤醒。

其中,响应语音唤醒指令,例如在图1所示的洗衣机中,可以通过扬声器13向用户播放预设的语音信息,以响应语音唤醒指令。

本发明实施例,语音交互设备采集语音唤醒指令,并获取用户的状态信息,由于用户的状态信息能够反映出用户是否有唤醒语音交互设备的意图,因此,本方法根据用户的状态信息可以准确的判断是否响应语音唤醒指令,从而可以避免误唤醒的情况。

在上述实施例的基础上,下述实施例将着重介绍,当存在一个用户时,如何根据语音交互设备与用户的距离、用户的行为,确定是否响应语音唤醒指令。

图3是本发明实施例提供的另一种语音交互方法的流程示意图。在图2的基础上,如图3所示,该方法还可以包括:

S201、判断语音交互设备与用户的距离是否大于或等于预设距离。

其中,预设距离可以是根据实际情况设置的。

若语音交互设备与用户的距离大于或等于预设距离,说明用户距离语音交互设备的距离较远,在距离较远的情况下,用户通常没有唤醒语音交互设备的意图,此时执行步骤S203。

若语音交互设备与用户的距离小于预设距离,说明用户可能有唤醒语音交互设备的意图,此时执行步骤S202。

S202、判断用户的行为是否为预设行为。

其中,预设行为例如可以为打电话、交谈、写作等,具体可以根据用户的需求设定。其中,用户的需求可以通过洗衣机控制面板中的菜单中选择,用户也可以在手机APP中设定完成后,通过手机发送给洗衣机。

若用户的行为是预设行为,说明用户正在做其他事情,例如打电话、交谈、写作等,用户没有唤醒语音交互设备的意图,此时执行步骤S203。

若用户的行为非预设行为,说明用户可能有唤醒语音交互设备的意图,此时执行步骤S204。

S203、确定不响应语音唤醒指令。

此时通过不响应语音唤醒指令,可以避免语音交互设备被误唤醒。

S204、确定用户的唤醒值。

唤醒值与下述至少一项相关:用户的朝向、用户是否发音。

其中,例如可以通过识别用户图像获取用户的朝向。

例如还可以通过识别用户图像中用户的唇动获取用户是否发音,示例性的,可以基于获取的连续多帧用户图像,判断用户的嘴唇是否有闭合和张开的动作,进而获取用户是否发音。进一步的还可以根据采集的语音进一步排除用户的唇动并非咀嚼等。

用户的唤醒值可以基于用户的朝向、用户是否发音中的任一项获取。

例如在基于用户的朝向确定用户的唤醒值时,用户正面朝向语音交互设备时,确定用户的唤醒值为a1,用户背面朝向语音交互设备时,确定用户的唤醒值为a2,用户侧面朝向语音交互设备时,用户的唤醒值为a3,其中a1>a3>a2。例如还可以为用户侧身的角度设置多个角度区间,当用户侧身的角度位于对应的区间时,确定该区间对应的用户的唤醒值。

例如在基于用户是否发音确定用户的唤醒值时,用户发音时确定用户的唤醒值为b1,用户不发音时确定用户的唤醒值为b2,其中,b1>b2。例如还可以在用户发音的时长与用户说出唤醒词的时长相同时,确定用户的唤醒值为c1,用户不发音时确定用户的唤醒值为c2,用户发音的时长与用户说出唤醒词的时长不同时,确定用户的唤醒值为c3,其中,c1>c3>c2。

用户的唤醒值可以基于用户的朝向和用户是否发音获取,具体可以将基于用户的朝向确定的用户的唤醒值,和用户是否发音确定的用户的唤醒值相加得到用户的唤醒值。还可以对用户的朝向和用户是否发音设置权值,将基于用户的朝向确定的用户的唤醒值,和用户是否发音确定的用户的唤醒值与对应的权值相乘后,再相加得到用户的唤醒值。

S205、根据用户的唤醒值,确定是否响应语音唤醒指令。

当用户的唤醒值大于或等于唤醒阈值时,说明用户有唤醒语音交互设备的意图,此时可以确定响应语音唤醒指令。

当用户的唤醒值小于唤醒阈值时,说明用户没有唤醒语音交互设备的意图,此时可以确定不响应语音唤醒指令。

其中,唤醒阈值可以根据实际情况设置。

示例性的,如图1所示的洗衣机,洗衣机通过摄像头14获取用户图像,并根据用户图像获取了洗衣机与用户的距离和用户的行为。当洗衣机与用户的距离大于预设距离4米,或者用户正在打电话时,洗衣机不会被唤醒。当洗衣机与用户的距离小于预设距离4米,以及用户没有打电话、交谈或者写作时,进一步根据用户的朝向、用户是否发音确定用户的唤醒值。假设唤醒阈值为60,当唤醒值为70时,洗衣机被唤醒,当唤醒值为30时,洗衣机不会被唤醒。

本发明实施例根据语音交互设备与用户的距离、用户的行为判断用户是否有唤醒语音交互设备的意图,当用户没有唤醒语音交互设备的意图时,确定不响应语音唤醒指令;当用户有唤醒语音交互设备的意图时,再进一步根据用户的朝向、用户是否发音中的至少一项确定唤醒值,并和唤醒阈值相比较以进一步确定用户是否有唤醒语音交互设备的意图。本发明基于上述方法,可以准确识别用户是否有唤醒语音交互设备的意图,进而能够有效避免语音交互设备被误唤醒。

下述实施例将着重介绍,当存在多个用户时,如何根据语音交互设备与用户的距离、用户的行为,确定是否响应语音唤醒指令。

图4是本发明实施例提供的又一种语音交互方法的流程示意图。在图2的基础上,如图4所示,该方法还可以包括:

S301、判断语音交互设备与多个用户的距离是否大于或等于预设距离。

若语音交互设备与每个用户的距离大于或等于预设距离,说明每个用户距离语音交互设备的距离较远,在距离较远的情况下,多个用户没有唤醒语音交互设备的意图,此时执行步骤S303。

若语音交互设备与至少一个用户的距离小于预设距离,说明至少一个用户可能有唤醒语音交互设备的意图,此时执行步骤S302。

S302、判断多个用户的行为是否为预设行为。

若每个用户的行为是预设行为,说明用户正在做其他事情,例如打电话、交谈、写作等,多个用户没有唤醒语音交互设备的意图,此时执行步骤S303。

若至少一个用户的行为非预设行为,说明至少一个用户可能有唤醒语音交互设备的意图,此时执行步骤S304。

S303、确定不响应语音唤醒指令。

此时通过不响应语音唤醒指令,可以避免语音交互设备被误唤醒。

S304、确定多个用户的唤醒值。

每个用户的唤醒值与下述至少一项相关:用户的朝向、用户是否发音。

其中,用户的唤醒值可以基于用户的朝向、用户是否发音中的任一项获取的具体方式,可以参见前述步骤S204的描述,对此不再赘述。

S305、根据多个用户的唤醒值,确定是否响应语音唤醒指令。

根据每个用户的唤醒值,获取语音唤醒指令对应的唤醒值。

一种可能的实现方式中,可以计算多个用户的唤醒值的平均值,将该平均值作为语音唤醒指令对应的唤醒值。

例如当用户为3个时,3个用户的唤醒值分别记为x1、x2、x3,则语音唤醒指令对应的唤醒值xn可以记为:xn=(x1+x2+x3)/3。

另一种可能的实现方式中,将每个用户和语音交互设备的距离作为每个用户的唤醒值的权值,对多个用户的唤醒值进行加权平均,获取语音唤醒指令对应的唤醒值。

例如当用户为3个时,3个用户的唤醒值分别记为x1、x2、x3,3个用户和语音交互设备的距离分别记为r1、r2、r3,则语音唤醒指令对应的唤醒值xn可以记为:xn=(x1*r1+x2*r2+x3*r3)/3。

当语音唤醒指令对应的唤醒值大于或等于唤醒阈值时,说明用户有唤醒语音交互设备的意图,此时可以确定响应语音唤醒指令。

当语音唤醒指令对应的唤醒值小于唤醒阈值时,说明用户没有唤醒语音交互设备的意图,此时可以确定不响应语音唤醒指令。

本发明实施例根据语音交互设备与多个用户的距离、多个用户的行为判断多个用户是否有唤醒语音交互设备的意图,当多个用户没有唤醒语音交互设备的意图时,确定不响应语音唤醒指令;当多个用户中存在至少一个用户有唤醒语音交互设备的意图时,再进一步根据多个用户的朝向、多个用户是否发音中的至少一项确定多个用户唤醒值,并基于多个用户的唤醒值和唤醒阈值相比较以进一步确定多个用户是否有唤醒语音交互设备的意图。本发明基于上述方法,可以准确识别多个用户是否有唤醒语音交互设备的意图,进而能够有效避免语音交互设备被误唤醒。

在上述实施例的基础上,当存在一个用户时,本发明还可以在语音交互设备被唤醒后,基于用户的状态信息,调整语音播放的音量、延迟响应语音应答,以避免用户在打电话、交谈时影响用户,提升用户体验。

图5是本发明实施例提供的再一种语音交互方法的流程示意图。如图5所示,该方法还可以包括:

S401、在进行语音播放时,获取用户的状态信息。

其中,用户的状态信息可以包括下述至少一项:语音交互设备与用户的距离、用户的行为等,具体可以参照上述步骤S102。

S402、根据用户的状态信息,确定语音播放时的播放音量。

一种可能的实现方式中,若语音交互设备与用户的距离小于预设距离,且,用户的行为是预设行为,此时可以降低语音播放时的播放音量,以避免影响用户,提升用户体验。若语音交互设备与用户的距离大于或等于预设距离,或,用户的行为非预设行为,此时可以将预设音量作为语音播放时的播放音量,以便于用户和语音交互设备进行交互。其中,预设音量可以根据实际情况设置。

另一种可能的实现方式中,仅考虑语音交互设备与用户的距离,不考虑用户的行为。例如,若语音交互设备与用户的距离小于预设距离,此时可以降低语音播放时的播放音量,以避免影响用户,提升用户体验。若语音交互设备与用户的距离大于或等于预设距离,此时可以将预设音量作为语音播放时的播放音量,以便于用户和语音交互设备进行交互。

再一种可能的实现方式中,仅考虑用户的行为,不考虑语音交互设备与用户的距离。例如,若用户的行为是预设行为,此时可以降低语音播放时的播放音量,以避免影响用户,提升用户体验。若用户的行为非预设行为,此时可以将预设音量作为语音播放时的播放音量,以便于用户和语音交互设备进行交互。

除了采用步骤S402的方法外,还可以根据用户的状态信息,延迟响应语音应答。

一种可能的实现方式中,若语音交互设备与用户的距离小于预设距离,且,用户的行为是预设行为,此时可以暂不响应语音应答,以避免影响用户,提升用户体验。当语音交互设备与用户的距离大于或等于预设距离,或,用户的行为非预设行为时,此时可以响应语音应答,以便于用户和语音交互设备进行交互。

举例说明,假设预设距离为4米,用户在距离语音交互设备2米的地方打电话,此时洗衣机洗完衣服后准备播放“洗衣完成”的应答时,为避免影响用户打电话,暂不播放,等到用户不再打电话、或者语音交互设备与用户的距离超出4米后,再播放“洗衣完成”。

另一种可能的实现方式中,仅考虑语音交互设备与用户的距离,不考虑用户的行为。例如,若语音交互设备与用户的距离小于预设距离,此时可以暂不响应语音应答,以避免影响用户,提升用户体验。当语音交互设备与用户的距离大于或等于预设距离,此时可以响应语音应答,以便于用户和语音交互设备进行交互。

再一种可能的实现方式中,仅考虑用户的行为,不考虑语音交互设备与用户的距离。例如,若用户的行为是预设行为,此时可以暂不响应语音应答,以避免影响用户,提升用户体验。当用户的行为非预设行为时,此时可以响应语音应答,以便于用户和语音交互设备进行交互。

本发明实施例通过在进行语音播放时,获取用户的状态信息,并根据用户的状态信息,确定语音播放时的播放音量,或者延迟响应用户的语音应答,可以避免用户在打电话、交谈时影响用户,提升用户体验。

在上述实施例的基础上,当存在多个用户时,本发明还可以在语音交互设备被唤醒后,基于用户的状态信息,调整语音播放的音量、延迟响应语音应答,以避免用户在打电话、交谈时影响用户,提升用户体验。

图6是本发明实施例提供的再一种语音交互方法的流程示意图。如图6所示,该方法还可以包括:

S501、在进行语音播放时,获取多个用户的状态信息。

其中,用户的状态信息可以包括下述至少一项:语音交互设备与用户的距离、用户的行为等,具体可以参照上述实施例。

S502、根据多个用户的状态信息,确定语音播放时的播放音量。

一种可能的实现方式中,若语音交互设备与至少一个用户的距离小于预设距离,且,该至少一个用户的行为是预设行为,此时可以降低语音播放时的播放音量,以避免影响用户,提升用户体验。若语音交互设备与每个用户的距离大于或等于预设距离,或,每个用户的行为非预设行为,此时可以将预设音量作为语音播放时的播放音量,以便于用户和语音交互设备进行交互。其中,预设音量可以根据实际情况设置。

另一种可能的实现方式中,仅考虑语音交互设备与用户的距离,不考虑用户的行为。例如,若语音交互设备与至少一个用户的距离小于预设距离,此时可以降低语音播放时的播放音量,以避免影响用户,提升用户体验。若语音交互设备与每个用户的距离大于或等于预设距离,此时可以将预设音量作为语音播放时的播放音量,以便于用户和语音交互设备进行交互。

再一种可能的实现方式中,仅考虑用户的行为,不考虑语音交互设备与用户的距离。例如,若至少一个用户的行为是预设行为,此时可以降低语音播放时的播放音量,以避免影响用户,提升用户体验。若每个用户的行为非预设行为,此时可以将预设音量作为语音播放时的播放音量,以便于用户和语音交互设备进行交互。

除了采用步骤S502的方法外,还可以根据用户的状态信息,延迟响应语音应答。其中,语音应答为用户请求语音交互设备需要进行语音应答的指令。

一种可能的实现方式中,若语音交互设备与至少一个用户的距离小于预设距离,且,该至少一个用户的行为是预设行为,此时可以暂不响应语音应答,以避免影响用户,提升用户体验。当语音交互设备与每个用户的距离大于或等于预设距离,或,每个用户的行为非预设行为时,此时可以响应语音应答,以便于用户和语音交互设备进行交互。

另一种可能的实现方式中,仅考虑语音交互设备与用户的距离,不考虑用户的行为。例如,若语音交互设备与至少一个用户的距离小于预设距离,此时可以暂不响应语音应答,以避免影响用户,提升用户体验。当语音交互设备与每个用户的距离大于或等于预设距离,此时可以响应语音应答,以便于用户和语音交互设备进行交互。

再一种可能的实现方式中,仅考虑用户的行为,不考虑语音交互设备与用户的距离。例如,若至少一个用户的行为是预设行为,此时可以暂不响应语音应答,以避免影响用户,提升用户体验。当每个用户的行为非预设行为时,此时可以响应语音应答,以便于用户和语音交互设备进行交互。

本发明实施例通过在进行语音播放时,获取多个用户的状态信息,并根据多个用户的状态信息,确定语音播放时的播放音量,或者延迟响应用户的语音应答,可以避免用户在打电话、交谈时影响用户,提升用户体验。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

图7是本发明实施例提供的一种语音交互装置的结构示意图,如图7所示,该装置应用于语音交互设备,该装置可以包括:采集模块21、处理模块22。其中,

采集模块21,用于采集语音唤醒指令。

处理模块22,用于获取用户的状态信息;根据用户的状态信息,确定是否响应语音唤醒指令;状态信息包括下述至少一项:语音交互设备与用户的距离、用户的行为。

可选地,在一些可能的实现方式中,处理模块22,具体用于根据采集的用户图像,获取用户的状态信息。

可选地,在一些可能的实现方式中,处理模块22,具体用于当语音交互设备与用户的距离大于或等于预设距离,或者,用户的行为是预设行为时,确定不响应语音唤醒指令。

可选地,在一些可能的实现方式中,处理模块22,具体用于当语音交互设备与用户的距离小于预设距离,且,用户的行为非预设行为时,确定用户的唤醒值;根据用户的唤醒值,确定是否响应语音唤醒指令;唤醒值与下述至少一项相关:用户的朝向、用户是否发音。

可选地,在一些可能的实现方式中,用户为一个;

处理模块22,具体用于当用户的唤醒值大于或等于唤醒阈值时,确定响应语音唤醒指令;或者,当用户的唤醒值小于唤醒阈值时,确定不响应语音唤醒指令。

可选地,在一些可能的实现方式中,用户为多个;

处理模块22,具体用于根据每个用户的唤醒值,获取语音唤醒指令对应的唤醒值;当语音唤醒指令对应的唤醒值大于或等于唤醒阈值时,确定响应语音唤醒指令;或者,当语音唤醒指令对应的唤醒值小于唤醒阈值时,确定不响应语音唤醒指令。

可选地,在一些可能的实现方式中,处理模块22,具体用于将每个用户和语音交互设备的距离作为每个用户的唤醒值的权值,对多个用户的唤醒值进行加权平均,获取语音唤醒指令对应的唤醒值。

可选地,在一些可能的实现方式中,处理模块22,还用于在进行语音播放时,获取用户的状态信息;根据用户的状态信息,确定语音播放时的播放音量。

可选地,在一些可能的实现方式中,处理模块22,具体用于当语音交互设备与用户的距离小于预设距离,且,用户的行为是预设行为时,降低语音播放时的播放音量;或者,当语音交互设备与用户的距离大于或等于预设距离,或,用户的行为非预设行为时,将预设音量作为语音播放时的播放音量。

本发明图7所示的实施例提供的语音交互装置,可以执行上述方法实施例中语音交互设备的动作。例如,该语音交互装置可以是语音交互设备本身,也可以是语音交互设备的一个芯片。

图8为本发明实施例提供的另一种语音交互装置的结构示意图,如图8所示,该装置包括:存储器91和至少一个处理器92。

存储器91,用于存储程序指令。

处理器92,用于在程序指令被执行时实现本发明实施例中的语音交互方法,具体实现原理可参见上述实施例,本实施例此处不再赘述。

该语音交互装置还可以包括及输入/输出接口93。

输入/输出接口93可以包括独立的输出接口和输入接口,也可以为集成输入和输出的集成接口。其中,输出接口用于输出数据,输入接口用于获取输入的数据,上述输出的数据为上述方法实施例中输出的统称,输入的数据为上述方法实施例中输入的统称。

本申请还提供一种可读存储介质,可读存储介质中存储有执行指令,当语音交互装置的至少一个处理器执行该执行指令时,当计算机执行指令被处理器执行时,实现上述实施例中的语音交互方法。

本申请还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。语音交互装置的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得语音交互装置实施上述各种实施方式提供的语音交互方法。

本发明实施例提供一种语音交互设备,该语音交互设备用于实现上述方法实施例。该语音交互设备例如可以为:洗衣机、冰箱、空调等。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

在上述服务器或者终端的实施例中,应理解,处理模块可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

19页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!