语音控制

文档序号：1410167 发布日期：2020-03-06 浏览：20次 >En<

阅读说明：本技术 语音控制 (Voice control ) 是由 R.马吉尔瑟于 2018-07-16 设计创作，主要内容包括：一种控制由照明系统的一个或多个光照源发出的光照的方法,该方法包括自动执行以下操作：从语音识别系统接收指示第一语音命令的第一输入；响应于第一输入,控制照明系统从包括光照的参数的第一值的第一状态转变为包括参数的第二值的第二状态；从语音识别系统接收指示第二语音命令的第二输入,第二输入指示：第二语音命令指定参数的进一步改变；将第二输入映射到至少部分基于参数的第一值与第二值来定义的调节；和通过调节参数,控制照明系统从第二状态转变为进一步调节的状态。(A method of controlling illumination emitted by one or more illumination sources of a lighting system, the method comprising automatically performing the operations of: receiving a first input indicative of a first voice command from a voice recognition system; in response to a first input, controlling the lighting system to transition from a first state comprising a first value of a parameter of the illumination to a second state comprising a second value of the parameter; receiving a second input from the speech recognition system indicative of a second speech command, the second input indicative of: the second voice command specifies a further change of the parameter; mapping the second input to an adjustment defined based at least in part on the first value and the second value of the parameter; and controlling the lighting system to transition from the second state to a further adjusted state by adjusting the parameter.)

语音控制

技术领域

本公开涉及语音识别在执行声音命令以控制照明系统中的使用。

背景技术

声音控制作为用户能够利用来控制在家或甚至在其他地方诸如办公室周围的各种电器的手段而正变得越来越普遍。例如，智能扬声器是被嵌入有虚拟数字助理的扬声器设备，其中虚拟数字助理使得用户既能够控制通过扬声器播放出的音乐又能够执行其他的功能，例如，订购外卖、制作待办事项清单等。类似地，虚拟数字助理现在时常被包括在许多其他形式的用户终端诸如智能手机、平板计算机、台式计算机和膝上型计算机以及可穿戴智能设备诸如智能手表和智能眼镜中。

基于声音的控制也正成为用户能够利用来控制在家或办公室周围的实用程序(utility)的手段。一个这样的示例是使用语音来控制无线连接的照明系统。这可以基于在照明系统的组件（例如，在照明系统的情况中的照明桥或墙板）中包括的专用声音识别代理(agent)来实现。或者越来越多地，照明系统的控制可以经由在用户设备上运行的通用数字助理来实施，其中通用数字助理能够经由在用户终端和实用程序系统之间的有线或更经常无线（例如，Wi-Fi、Bluetooth（蓝牙）或ZigBee）连接而接口至实用程序系统。作为示例，用户能够简单地在他/她家的房间中大声说出声音命令，诸如“将灯光调至70％”或“将气氛设置为舒适的”，并且在收听范围中任何合适连接的智能设备（例如用户的智能扬声器、移动终端、台式PC或可穿戴设备）上的虚拟数字助理将检测到这个并相应地控制灯光。

虚拟数字助理（有时也仅被称为数字助理或虚拟助理）可以指代任何的采用语音识别作为用户能够利用来控制任何种类的电器的功能的手段的软件代理。在虚拟数字助理背后的完整功能原则上可以被包括在所谈论的本地用户设备上的同一应用中，但是更经常，VDA事实上是前端客户端应用，其访问在服务器上托管(host)的更复杂的后端服务。不管怎样，用户至代理的接口通过用户在其上面安装VDA的特定用户设备。

声音控制接口和声音启用助理在过去的几年里已变得非常受欢迎、普通并受到追捧，并且现在是流行文化的一部分。与此同时，能够使用声音命令来控制的系统诸如所连接的照明系统也已受益于消费者兴趣的激增。用于内部应用的远场声音控制正被越来越多的消费者接受。看来声音控制将成为用于控制许多应用的标准方法，并且对于一些（应用）来说，情况可能已经如此。

发明内容

虽然用于智能家电的声音控制系统能够简化人与系统之间的交互，但是它们当前无法实现某些种类的命令。例如，在自然语音中，人们时常以相对或主观术语(term)说话。另一个人将能够判断说话者打算说什么。然而，现有计算设备无法理解这样的命令。

进一步，现有声音接口不允许光设置的直观微调。这在试图控制预设照明状态并尝试微调那个预设状态时是特别成问题的。

为了解决这样的问题或类似的问题，本公开描述一种机制，藉此用户能够从第一光状态转变(transition)为第二光状态，并且随后使用语音命令来微调那个第二光状态及其相关联的参数。例如，这些语音命令能够是通常将被认为是与上下文有关的、主观的或缺少定义的参数诸如“多一点”或“少一点”的命令。

根据在本文公开的第一方面，提供一种控制由照明系统的一个或多个光照(illumination)源发出的光照的方法，该方法包括自动执行以下操作：从语音识别系统接收指示利用语音识别系统识别的第一语音命令的第一输入；响应于第一输入，控制照明系统从包括所发出的光照的至少一个参数的第一值的第一状态转变为包括所述至少一个参数的第二值的第二状态；从语音识别系统接收指示第二语音命令的第二输入，第二输入指示：第二语音命令指定所述参数相对于所述转变的进一步改变；将所述第二输入映射到至少部分基于所述参数的第一值和第二值定义的调节；和通过利用所述调节来调节该参数，控制照明系统从第二状态转变为进一步调节的状态。

因而，通过在先前转变的第一值和第二值的上下文中解释由用户仅以相对方式定义的命令，该方法有利地对于这样的命令赋予含义。例如，这样的命令能够相对于先前场景改变的上下文来解释。调节可以（至少部分）基于第一值和第二值之间的增量(delta)的符号和/或量级(magnitude)来定义。

在实施例中，第二语音命令指定进一步改变的方向，但是仅相对于所述转变的方向来指定进一步改变的方向，所述第二输入指示相对方向；以及所述映射包括：确定第二值和第一值之间的差的符号，并且相应地设置所述调节的符号。

在实施例中，所述映射包括：基于从参数的第一值到第二值的转变来定义用于所述参数的标度(scale)，并且将所述第二输入映射到相对于所述标度设置的调节。

在实施例中，第二语音命令没有在数字上指定进一步改变的程度，并因此第二输入也没有在数字上指定进一步改变的程度；所述标度的定义包括至少确定第一值和第二值之间的差的量级；并且所述调节被设置为所述量级的分数(fraction)，该分数在零与一之间但是不等于零。

换言之，该调节部分(part way)但不是全部(full way)沿着第一值和第二值之间的间隔来设置。注意：在本公开提及在0与1之间的分数的情况下，这在任何给定的实现方式中不限制该分数在计算机或电路中被表示为从0到1的标度上的数字。一般而言，分数能够被表示为部分沿着从代表零的值到代表单一(unity)的值的任何标度的值（例如，0至100％，或0至n比特标度上的2ⁿ-1）。

在实施例中，所述标度的定义包括从第二输入中至少识别：进一步改变反转从第一值到第二值的转变的方向，并在此条件下确定在第一值和第二值之间的范围；并且基于此，所述调节被约束为仅部分沿着在第一值和第二值之间的所述范围来设置。

即，当用户对第二状态进行非客观调节时，这不应该引起参数恢复到小于其在第一状态中的值。

该调节可以通过被约束成被设置为在第一值和第二值之间的范围的分数（在零和单一之间）来约束。替代地，该调节能够是预定量，但是其被限在第一值和第二值之间。

在实施例中，第一状态包括多个参数中的每一个的各自第一值，并且第二状态包括多个参数中的每一个的各自第二值；所述标度的定义包括在利用多个参数定义的二维或更多维的参数空间中拟合(fit)通过第一状态和第二状态的直线(line)或曲线。

在实施例中，所述多个参数包括颜色空间的颜色通道。

在实施例中，所述标度的定义包括从第二输入中识别：进一步改变在与从第一值到第二值的转变相同的方向，并且如果那个方向为正的，则确定在第二值与一个或多个光照源的上限(upper)能力之间的范围，或者如果所述方向为负的，则确定在第二值与一个或多个光照源的下限(lower)能力之间的范围；并且分别地，所述调节被约束为被部分设置在第二值和上限能力或下限能力之间。

在实施例中，所述映射包括分别地将所述调节设置为第二值与上限能力或下限能力之间的差的分数，所述分数在零与一之间但是不等于零。

换言之，该调节可以部分但不是全部沿着在第二值与最大值或最小值之间的间隔来设置。

替代地，该调节能够是预定量，但是其分别被限在上限值或下限值之间。

在实施例中，语音命令仅通过主观话语(utterance)来定义进一步改变的程度，并且所述第二输入包括主观话语的指示；以及所述映射包括：基于将不同可能的主观话语映射到不同的各自潜在调节的函数，依赖于主观话语来选择所述调节。

程度的指示可以是主观的，原因至少在于它是非数字的（例如，未指定增加或减少5％或10 Lux或诸如之类）。例如，主观指示可以包括术语诸如“一点”、“很少”、“很多”、“更少”、“更多”、“相当”、“几乎”等等。

在实施例中，所述函数可以包括查找表。替代地，所述函数包括利用机器智能算法基于对于该方法的以前试验的之前用户反馈来学习的学习型模型。

在实施例中，第一状态包括多个参数的各自第一值；第二状态包括所述多个参数的各自第二值；并且利用第二语音命令指定的进一步改变包括所述参数之中的至少一个参数，但是少于所述多个参数。

在实施例中，所述至少一个参数包括以下至少之一：控制所发出的光照的强度的参数，和/或控制所发出的光照的颜色的参数。

例如，该参数可以是强度本身的直接测量或相关测量，诸如照度、亮度或功率等。

例如，该参数可以是色温；或颜色空间诸如RGB颜色空间中的红色、绿色或蓝色的通道，或YUV颜色空间中的色调或饱和度。

在实施例中，第一状态和第二状态各包括由多个光照源渲染的预定义照明场景，第一状态包括多个光照源中的每个光照源的至少一个参数的各自第一值，并且第二状态包括多个光照源中的每个光照源的至少一个参数的各自第二值；以及所述映射包括将所述第二输入映射到至少部分基于所述参数的各自第一值和第二值为这些光照源之中的每一个光照源定义的各自调节；并且所述调节包括利用这些光照源中的每一个的各自调节来调节该参数。

根据第二方面，提供一种计算机程序产品，其包括被收录在计算机可读存储器上的代码，其被配置以便当运行在一个或多个处理单元上时执行根据第一方面或其任何实施例的操作。

根据第三方面，提供一种照明控制系统，其包括存储代码的存储器和被安排为运行所述代码的一个或多个处理单元，所述代码被配置以便当因而运行时执行根据第一方面或其任何实施例的操作。

根据在本文公开的另一方面，提供一种包括所述照明控制系统和该照明系统的系统。根据在本文公开的另一方面，提供一种控制系统，其包括照明控制系统和语音识别系统。根据在本文公开的另一方面，提供一种系统，其包括照明控制系统、语音识别系统和照明系统。

附图说明

为了帮助理解本公开和显示如何可以将实施例付诸实施，通过示例参考附图，其中：

图1是包括照明系统的环境的示意图，

图2是用于控制照明的安排的示意框图，和

图3显示使用颜色空间色度图的颜色的二维表示。

具体实施方式

如上所述，包括照明系统的智能家居系统现在能够利用发布给虚拟数字助理(VDA)等的语音命令来控制。实际上，支持声音控制的平台和应用的数量已急剧增加，并且能够利用声音控制来触发的数字助理的数量正在增加。然而，当用户给照明系统提供声音命令时，他或她时常使某些改变不确定。这样，如同系统解释一样执行命令可能是不受欢迎的。

当前的声音控制应用典型地允许用户调用或激活其照明系统中的内容，诸如照明场景。另一众所周知的控制机制是：用户将直接控制命令发送到灯光组。例如：“接通厨房里的灯光”或“将客厅里我的灯光设置为红色”。然而，用户必须提供所定义的状态，并且时常不可能偏离那个状态。

以下描述一种系统和方法，籍此用户能够（从以前的光状态）转变到新的光状态，并随后使用诸如“多一点”或“少一点”之类的命令来微调那些光设置。

换言之，用户能够从状态A转变到状态B，并且随后能够使用声音命令来微调状态B。声音命令明确地指定或“Increase(增加)”或“Decrease(降低)”之一，但是没有客观地定义增加或降低的程度。照明系统随后能够自动计算“增加”或“降低”在状态A和状态B的上下文中应该是什么意思。

例如，由语音识别系统识别的语音命令规定用于控制照明系统的第一输入，以致照明系统可以从第一状态A转变为第二状态B。每个状态包括所发出的光照的至少一个参数的值。语音识别系统随后可以识别第二语音命令，以致第二输入被提供给照明系统。第二输入指示：第二命令指定将针对状态B进行的进一步改变。进一步改变涉及从状态A到状态B的转变的同一更改的参数。以这种方式，能够为进一步改变并且至少部分基于状态A和B的参数值来定义调节。照明系统随后能够通过执行所定义的调节来执行从第二状态B到进一步调节状态的转变。

例如，在实施例中，这可以通过以下来实现：（a）确定在前一场景与当前场景之间的增量（例如，颜色和/或强度）；以及随后（b）将正/负函数映射到所述增量的分数，以致选择正（函数）增加增量（即，外推），而（选择）负（函数）降低增量（即，移动更接近前一场景，但是不完全接近前一场景）。

作为示例使用实例，第二语音命令可以是“多一点”。这个命令被识别为“增加”语句。如果状态A是起点并且状态B是当前状态，则可以执行进一步改变，以致根据状态A和状态B之间的参数值差并以增加这个改变的方式来调节状态B的参数。

图1举例说明其中可以采用在本文公开的实施例的示例环境102。环境102可以采取以下形式：室内空间，诸如家、办公室或其他建筑物的一个或多个房间；室外空间，诸如花园或公园；部分覆盖的空间，诸如凉亭；或者这样的空间的组合，诸如包括室内和室外空间二者的校园或体育场。

环境102被配备有在整个环境102的不同位置上安装或以其他方式部署的多个照明器104。照明器可以指代用于照亮被用户106占用的环境或环境的一部分的任何种类的光照设备，无论是提供环境照明还是任务照明。这些照明器104之中的每一个照明器可以采取各种各样可能形式之中的任何一种，诸如吸顶式或壁挂式照明器、独立式落地或台式照明器或者不太传统的形式，诸如被嵌入家具的表面或物品中的照明器（并且环境102中的不同照明器104不必采取彼此相同的形式）。无论采取什么形式，每个照明器104包括至少一盏灯（光照元素）以及任何相关联的外壳、灯座和/或支架。合适灯的示例包括基于LED的灯或者传统的白炽灯泡或气体放电灯。

环境102也被配备有一个或多个麦克风108，这些麦克风被部署在整个环境102的一个或多个位置上。这些麦克风108之中的每一个麦克风可以采取独立麦克风设备的形式，或者替代地，每一个麦克风可以采取被集成在另一用户设备诸如静态或移动用户终端中的麦克风的形式。具有就目前而言可以访问的麦克风108的用户终端的示例包括：被放置在家或办公室周围的膝上型或台式计算机；移动终端，诸如智能手机或平板计算机；用户个人随身携带或穿戴在用户个人身上的可穿戴设备；或媒体设备，诸如智能扬声器、智能电视机或机顶盒、家庭媒体中心等。在另一替代的或附加的示例中，这些麦克风之中的一个或多个麦克风各自能够被嵌在这些照明器104之中的各自一个照明器中。

在一些情景中，环境102可以被划分为多个不同的区域或地区102a、102b，诸如不同的房间，每一个利用不同的各自子集的一个或多个照明器104来照亮。当然将领会到：用户的环境102事实上可以包括任何数量的房间（例如，家中的客厅、厨房、门厅、浴室和多个卧室；或者办公大楼中的多个办公室、走廊、接待处和食堂或休息室）。为了说明的目的,仅仅显示两个。

图2举例说明一种安排，其使得用户106能够基于由用户106说出并利用一个或多个麦克风108中的至少一个麦克风捕获的语音命令来控制由照明器104之中的一个或多个照明器发出的照明。这可以是为了控制在与用户106在其中说出声音命令的环境102a的相同部分或不同部分102b中（例如，在用户106在楼下102a的同时，在楼上房间102b中）的照明。

该安排包括语音识别算法208，其被安排为从环境102或其一部分接收利用至少一个麦克风108捕获的音频信号，其中有时音频信号将包括由用户106在环境102的相关部分中说出的语音命令。该安排进一步包括照明控制器210，其被耦合到语音识别算法208，以便接收利用语音识别算法在接收到的音频信号中识别的控制元素的指示。照明控制器210也被耦合到照明系统204，其包括结合图1所讨论的照明器104。照明系统204具有至少利用多个设置或参数205定义的状态。照明控制器210被安排为基于利用语音识别算法208识别的所识别的控制元素来调节这些设置205并藉此能够依赖于说出的语音命令来控制照明系统204，以便调节由照明器104发出的光照的一个或多个方面。例如，这能够是接通或关闭来自这些照明器104之中的一个或多个照明器的光照、调亮或调暗光照水平、调节所发出的光照的颜色或者设置动态效果。

设置205包括定义光系统的状态的参数的值。也就是说，在任何时间点上，光系统的任何一个或多个光的设置可以被存储为状态。当用户发出第一语音命令时，该系统在接收到该命令后将当前状态存储为状态A。目标状态即已利用第一语音命令请求的状态被存储为状态B。对于当从状态A移动到状态B时调节的每个连续参数，该系统能够创建范围标度。这个标度利用在状态A中指定的值被定义在低端。在高端，它受到灯在那个具体参数上的性能的限制。例如，亮度被约束在1与254之间。如果状态B具有254的亮度值，则标度的最大值为254。这个示例假定：当从状态A转变到状态B时，该参数的值在增加。如果应该是转变减少参数的值，则限制将被逆转。也就是说，标度将利用在状态A中指定的值（例如，150）被定义在上端，并且低端将受到灯的性能（例如，1）的限制。

当用户接着在调用状态B之后立即发出命令时，他们能够通过发出指示增加或降低命令的第二语音命令在该范围标度上移动。当用户指定指示降低的短语时，控制器通过将该参数的值沿着标度调节到减少的量来响应。该量可以是总范围标度的预定义百分比或分数或者某个其他定义的范围（例如5％、10％、1⁄2、3⁄4等）。类似地，如果用户发出指示增加的语音命令，则控制器将该参数的值沿着标度移动到增加的量，如上面参考沿着标度降低所解释的。

在实施例中，控制系统202的控制器210被配置为：至少依据当前在一组离散的预定义区域102a、102b之中的哪一个（例如，哪个房间）中找到用户106，自动确定用户106的位置。

此外，根据在本文公开的实施例，图2的安排包括在任何合适的存储位置中存储的度量211，用于确定将要完成的进一步调节。通过参考度量211，控制器210被安排为确定从语音识别算法208接收的控制元素是用于当前状态的参数的增加还是降低。在实施例中，这个度量211可以包括一组预定规则，用于将接收到的输入与当前状态的一个或多个参数的改变的方向和/或程度相关。这可以是一种字典，从中能够将相对或上下文术语变换为数学值，以供控制器用于控制照明系统。例如，如同“一点”、“很少”、“更多”、“更少”、“相当”、“几乎”、“一点点”等等的词。这可以被称为主观话语。主观话语提供进一步改变的程度的唯一指示，并且这个的指示被包括在来自语音算法210的第二输入252内。随后基于在度量211中给出的函数或规则、依赖于这个主观话语来选择将要提供的调节。函数或规则211将不同可能的主观话语映射到不同的各自潜在调节。例如，“一点”可以映射到10％，“很少”可以映射到5％，“更多”可以映射到20％，“几乎”可以映射到2％，或者“一点点”可以映射到1％，等等。

就物理实现方式而言，语音识别算法208和照明控制器210之中的每一个可以采用被存储在内存上并且被安排为在处理装置上运行的代码（软件）的形式来实现。其中存储这些模块208、210之中的任何给定一个模块的内存可以包括一个或多个存储单元，其采用被安置在一个或多个地理站点(site)上的一个或多个设备中的一个或多个（例如，电子、磁性或光学）存储媒体。这些模块208、210中的任何给定一个模块在其上运行的处理装置可以包括一个或多个处理单元，其被安置在一个或多个地理站点上的一个或多个设备中。在需要时，分布式存储和处理技术本身对于本领域技术人员来说是已知的。

在替代的实现方式中，不排除语音识别算法208和/或控制器210可以采用硬连线电路或者可配置或可重新配置硬件诸如PGA或FPGA或硬件或软件的任何组合的形式来实现。

无论以什么形式来实现，这些模块208、210中的每一个可以被实现在各种各样物理位置之中任何一个或多个位置上的任何一个或多个设备中。语音识别算法208和控制器210可以被实现在彼此相同的设备或单独安置的设备中。进一步，这些之中的任何给定一个能够被实现在单个设备中或被分布在多个设备上。再次注意到：分布式计算技术本身在本领域中是已知的。

例如，语音识别算法208和控制器210之中的任何一个或二者可以被实现在以下之中：用户终端，诸如台式计算机、膝上型计算机、平板计算机或智能扬声器，其被部署在用户的家或环境102的周围；或照明系统204的专用组件，诸如专用墙板或智能灯光开关；或便携式用户终端，诸如用户个人随身携带的智能手机或平板计算机；或穿戴在用户个人身上的可穿戴设备；和/或远程位置上的服务器（该服务器包括在一个或多个地理站点上的一个或多个服务器单元）。语音识别算法208和控制器210中的一个或二者可以被实现为在这些照明器104之中的每一个中嵌入的分布函数。（多个）麦克风108可以被并入与语音识别算法208、控制器210和/或光照源之中的任何一个或多个相同的设备中或者被并入不同的一个或多个设备中。

至于光照设置205和度量211（即，所存储的数据结构），这些再次可以被存储在任何合适的一个或多个存储位置中。在其中存储这些数据结构205、211中的任何给定一个数据结构的存储器可以包括一个或多个存储单元，其采用被安置在一个或多个地理站点上的一个或多个设备中的一个或多个（例如，电子、磁性或光学）存储媒体。光照设置205和/或度量211可以被存储在彼此相同的存储位置或不同的位置上，并且可以被存储在与语音识别算法208和/或照明控制器210相同的存储位置或不同的一个或多个位置上。在其中实现这个存储(器)的一个或多个设备能够是与前述组件中的任何一个组件（例如，麦克风208）相同的（多个）设备和/或一个或多个单独设备（例如，上述的任何种类的用户终端，或包括在一个或多个地理站点上的一个或多个服务器单元的服务器）。

在本文公开的这些模块208、210；设备104和数据结构205、211之中的任何一个需要彼此进行外部通信和/或在它们自己的不同的分布式部件之间进行通信的情况下，这个通信可以借助于任何合适的有线或无线连接或网络或者这样的组合来实现。合适有线技术的示例包括Ethernet（以太网）、DMX和Internet（因特网）。合适无线技术的示例包括Wi-Fi、Bluetooth（蓝牙）、ZigBee等。在本文无论在哪里描述从这些模块208、210；设备104和/或数据结构205、211中的任何一个或多个传送信息到这些之中的一个或多个其他设备，将明白：这个信息能够直接地或代理地进行传送。例如，该信息可以利用一跳或多跳来传送，并且可以经由任何一个或多个中间设备或者甚至经由多个组成网络来传送。进一步，在说到信息被传送或诸如此类的情况下，这指的是什么正在被传送的实质内容或含义而不是信号的格式。因此，并不排除：基础信息在传送期间能够从一种形式变换为另一种形式。例如，假设：上下文信息将从环境102中的另一联网设备（例如，从照明控制设备诸如墙板、智能开关或在用户终端上运行的控制应用）被传递到照明控制器210。这个信息可以经由环境102外部的服务器来发送，并且可以在始发设备和照明控制器210之间改变形式。尽管如此，从环境102中的设备导出的信息仍被说成已从那个设备被传送到照明控制器210。

无论物理实现采用什么形式，语音识别算法208被配置成在由用户说出的语音命令中识别用户106的意图，以便控制照明系统204中的照明器104之中的一个或多个。

语音命令在本文指代利用（多个）麦克风108捕获的音频信号中的音频内容250。语音命令典型地包括一个以上的说出组分（spoken component），每个组分指定该命令的不同方面。这些组分中的至少一个指示控制照明的用户的愿望，这典型地是按时间顺序说出的第一元素，但不一定。例如，简单命令可以是“灯光接通（lights on）”。第一元素“灯光”指示用户想要控制照明，而第二元素“接通”指定参数on/off（接通/关闭）的希望值。作为另一示例，该命令包括至少三个组分：一个表示控制灯光的愿望，一个指定光参数，以及一个指定实施控制的位置。所指定的光参数可以是例如：接通/关闭，调光水平的改变，颜色参数，或动态效果的名称（即，时变或时空效应）。例如，这三个组分能够是：“调亮……”，“……灯光……”，“……在厨房”。在这个示例中，第一组分指定参数改变来增加总强度，第二组分表示控制照明的愿望，而第三组分指定将仅在厨房102a实施改变。另一示例将是：“系统，将卧室里的灯光设置为舒适的色温”。在这个示例中，第一组分告诉语音识别算法208：用户106打算发出照明控制命令，第二组分指定用于控制的位置将是卧室102b，并且第三组分指定颜色参数（在这种情况中被表示为所希望的照明气氛）。

语音识别算法208可以是通用语音识别算法，其被实现为虚拟数字助理（有时仅仅被称为数字助理或虚拟助理）的一部分。替代地，语音识别算法208可以专用于照明控制。无论哪种方式，它可以被配置为在每一个说出组分中例如基于关键字识别或基于更复杂的技术诸如自然语言处理（NLP）来识别用户106的意图。语音识别本身是已知技术。语音识别因而将语音命令的每一个识别的说出组分变换为对应控制元素，即，对应数据项，每个数据项是从语音命令的各自组分中识别的用户意图的抽象表示。

控制器210从语音识别算法208接收这些识别的控制元素之中的每一个的指示252。基于这些，照明控制器210制定由照明系统204可执行的对应照明控制命令254，以便根据从语音识别算法208接收的控制元素的指示252来控制照明系统204的参数205之中的一个或多个。照明控制命令利用照明系统204的任何合适的控制组件例如每一个照明器104中的个别控制单元或集中控制单元（未示出）来执行。

语音命令的处理因而包括至少两个方面：利用语音识别算法208进行的语音250的识别，以及利用照明控制器210进行的对应照明控制254命令的制定。

然而，上述方案具有的问题是：语音识别算法208只能从语音命令中明确说出的组分中确定用户的意思，而在实践中，用户106时常没有说出该命令的一个或多个隐含方面。如果这样的命令被解析，则一些方面可能没有正确地或根本没有被包括在照明控制命令254中。这可能导致系统的意外行为或根本没有行为。

为了解决这样的局面，根据本公开，照明控制器210被配置为相对于在度量211中定义的一个或多个规则来评估从语音识别算法208中指示的控制元素252，并基于此来检测：除了以前执行的从状态A到状态B的转变之外，进一步调节的状态是所希望的。照明控制器210随后将把第二输入映射到至少部分基于来自状态A和B的参数的第一值和第二值定义的调节。照明控制器210然后能够控制照明系统从第二状态转变为进一步调节的状态，利用定义的调节来调节参数，并且相应地输出照明控制命令254。照明控制命令254对应于由用户106在语音命令250中暗示但是没有明确陈述的命令。

下面描述基于语音命令的一些示例调节，其中语音命令指示相对于前一语音命令的增加或降低的愿望。不同的参数可能需要调节的范围、标度和方向（即，相对于从状态A到状态B的转变而言的正或负方向）依赖于不同的值来设置。

表1显示两个状态即状态A和状态B的亮度和色温值以及能够对其执行进一步调节的范围。

表1

状态A	状态B	范围标度
			On：真	On：真	N/A（不连续）
亮度：100	亮度：200	100-254
			色温：3000k	色温：6000k	3000-6000k

表1给出两个状态即状态A和状态B的一些参数。“On（接通）”参数不是连续的参数，它不会从状态A改变为状态B，并因此没有范围标度被设置。“Brightness（亮度）”参数是连续的，并因此范围标度被设置，如在本文所解释的。亮度可以涉及强度的直接测量或者相关测量诸如照度或功率等。

这个示例显示当从状态A转变为状态B时系统生成的范围标度是如何依赖于此的。在这个示例中，如果该系统在状态B中并且语音命令被发出来“减少”，则该系统将降低亮度（例如，降至小于200的值，例如190）并降低色温（例如，降至小于6000K的值，例如 5700K）。由控制器210从语音识别算法208的输出252和度量211中确定指示参数的值的递减调节的语音识别。作为这个的结果，能够确定从状态A到状态B的转变的方向。在这个示例中，转变对于两个参数而言是正的。作为与这个前一正转变有关的“降低”的希望调节的确定指示自状态B的负调节以达到所希望的进一步调节的状态。第二语音命令因而指定进一步改变的方向，但是仅相对于（从状态A到状态B）转变的方向，并因而输入指示相对方向。因此，在这种情况中将第二语音命令映射到调节包括：确定第二值和第一值之间的差（即，状态A和状态B的值之间的差）的符号，并相应地设置所述调节的符号。

在这个示例中，在颜色转变的情况下，该系统以相同的方式操作。例如，当第一语音命令指示从绿色到红色的转变时，绿色和红色二者对于该系统能够具有固定值。基于第二语音命令的指示的调节随后能够相对于这两个状态及其参数值来完成。

在实施例中，在确定基于来自第二语音命令的第二输入的调节导致反转从第一值到第二值（从状态A到状态B）的转变的方向的进一步改变的情况下，范围被定义在第一值和第二值之间。也就是说，所定义的范围受到状态A和B的值的限定，并且灯的限制不被考虑。也就是说，调节被约束为仅部分沿着在第一值和第二值之间的所述范围来设置。

在上面的示例实施例中，John（约翰）到达家里。灯光经由运动传感器接通到默认状态：亮度100％，以及2700K的色温。当John将其外套放在架子上时，他激活其放松场景，即“设置我的放松场景”。该系统进入60％的调光亮度并将色温降至2200K。John说“少一点”，以及该系统将亮度增到65％并将色温增到2300K。

在实施例中，第二语音命令没有在数字上指定进一步改变的程度，并因此第二输入也没有在数字上指定进一步改变的程度。在这种情况下，参数值的调节可以是使用范围的量级可定义的。该范围可以被确定在状态A和状态B的参数值之间。值的调节随后能够被确定为范围的量级的分数，其中作为小数的分数在零与一之间但是不等于零。在该范围被确定在利用状态B给出的第二值的值与灯的上限能力或下限能力之间的情况下，能够进行相同的调节的定义。

应该明白：可以给出一系列命令，其中由用户106仅提供相对的语音命令。例如，“更多”、“多一点”、“多一点点”。作为这样的主观语音命令链的结果，原始范围可能需要进行重新评估。然而，可以维持取自所确定的在最后两个定义的语音命令之间的范围的量级（即，其中语音命令包括所定义的值）。也就是说，可以维持在用于状态A和状态B的值之间建立的范围作为任何进一步的基于分数或百分比的调节的基础。以这种方式，后续的没有定义值的语音命令将彼此一致，以致“多一点”不会取自与“更多”不同的量级。这允许用户更准确感知所请求的改变和所递送的改变。

参考图3和表2，描述基于颜色的调节的示例。

表2

状态A	状态B	范围标度
			On：真	On：真	N/A（不连续）
颜色：[x:0.2293, y:0.6206]（绿色）	颜色：[x:0.6519, y:0.3114]（红色）	100-254

表2给出两个状态即状态A和状态B的一些参数。“On”参数不是连续的参数，它不从状态A改变为状态B，并因此没有范围标度被设置。在这个示例中，基于图3所示的图形，采用x, y坐标格式来表示颜色参数。

图3所示的图形是颜色的二维表示，其被称为颜色空间色度图。在实施例中，可以使用多个参数，每一个参数用于颜色空间的不同颜色通道。图3也包括三个色域304、306和308。色域是在给定情况中诸如在给定颜色空间内或利用某设备能够准确表示的颜色的子集。在图3中，色域308是特定光照源即特定灯的色域。利用色域308表示的光照源的显色能力范围利用以虚线308标记的三角形的边缘来设定。色域304和306表示其他的光照源。这些可以是在共同位置中并且可能用于提供场景的其他光照源或一起用于不同功能的其他光照源。能够看出：当确定光照源的能力范围以及基于此的任何调节时，可以如何为不同的光照源及其各自调节来输出显著不同的标度。

参考表2，在图3中已在对应颜色坐标上标记了状态A和状态B。再次在这个示例中，转变在状态A（定义初始状态）至状态B（作为指示第一语音命令的第一输入的结果来定义状态）的方向。该范围随后利用颜色A的起点来定义。通过拟合直线（开始于色点A）、通过状态B的色点直至灯的性能的终点、色域308的边缘，定义范围标度的终点。在实施例中，定义标度可以包括拟合通过两个或更多状态的曲线。

在实施例中，参数空间可以包括利用多个参数定义的两个或更多的维度。在目前示例中，当用户说“少一点”时，颜色将移向橙色和黄色。也就是说，颜色将在点A和B之间并且朝向点A沿着直线302向后移动。当用户说“多一点”时，颜色将移向深红色，并且甚至进一步远离绿色。也就是说，在这种情况中的调节使得颜色沿着直线302从点B继续，但是在与从点A到点B的前一转变相同的方向。

在上面的示例实施例中，John到达家里。他说：“接通我的客厅里的灯光并将它们设置为绿色”。稍后，他说“将我的灯光设置为红色”。灯光接着从绿色转变为红色。John随后说“多一点”。灯光变成深红色。

参考表3，描述两个场景之间的调节的示例。

上述的控制机制也能够针对场景控制工作。场景典型地利用多盏灯的光状态来定义。在本文描述的方法因而为每盏灯并且为调节的每个参数创建范围标度。第一状态和第二状态（状态A和B）包括预定义的照明场景。场景利用多个光照源来渲染。因此，每一个状态包括多个光照源之中的每一个的至少一个参数的各自值。因而，用于这些光照源之中的每一个光照源的各自调节被映射到来自第二语音命令的第二输入，其中各自调节至少部分基于（即，来自状态A和状态B）至少一个参数的各自第一值和第二值来定义。各自光照源之中的每一个随后利用其各自调节来调节，以致参数值被调节来提供进一步调节的状态。

表3

表3给出两个光照源（灯1和灯2）的两个状态即状态A和状态B的三个参数。为每一个各自光照源基于在每一个各自状态上的每一个各自参数值来计算范围。以这种方式，用户能够在场景之间进行不同程度的转变并且微调最终结果。

在上面的示例实施例中，John到达家里。他使用Hue Tap（色调抽头）接通灯光至表示日落的场景。那天晚上晚些时候，他看电视并说“设置我的电视场景”。灯光进入利用调用场景所定义的其正确状态。对John来说，有点太暗了，于是他说“少一点”。场景输出改变，以致参数值更接近前一日落场景。

在示例实施例中，用户可以给出涉及调用场景的全部参数之中的仅仅一个或仅仅几个参数的语音命令。例如，如果该场景具有许多参数，则用户可以针对多个参数之中仅仅一个参数来指定调节，并因而进一步调节将仅包括组成该场景的参数之一的一个值。例如，如果John在设置其电视场景之后说“多一点红色”，则只有电视场景的红色通道参数的值将被调节。在这个示例中，该值将基于在前一日落场景和电视场景之间的红色通道参数的值的改变的量级来调节。类似地，John可以给出“亮一点”的第二语音命令。在这种情况下，只有亮度参数将基于日落和电视场景的各自亮度来调节。

各种合适的定位技术本身对于本领域技术人员来说是熟悉的并且将不在本文赘述。也可以采用技术的组合来提高定位精度。

无论选择什么技术，因而使得检测到的位置可用于控制器210。定位算法能够被包括作为照明控制器210的一部分或者更可能作为未示出的单独位置系统（例如，被托管在包括一个或多个地理站点上的一个或多个服务器单元的服务器上）。

度量211的（多个）预定规则可以利用任何合适的手段来定义。在一些实施例中，这些规则211中的一个、一些或全部可以由照明系统的制造商来定义。替代地或附加地，这些规则中的一个、一些或全部可以在安装照明系统之后例如由调试技术人员或由用户106他或她自己来定义。在后一种情况中，合适的用户设备（例如台式计算机、膝上型计算机、平板计算机、智能手机或可穿戴设备）被配置为提供用户界面，其使得用户106能够手动设置这些规则之中的一个或多个规则。这能够经由图形用户界面或语音界面。用户设备进一步被配置为经由任何合适的有线或无线连接或网络（例如，前述的那些之中的任何一个）来访问规则数据库，并基于此，根据用户通过用户设备输入的用户输入来设置该（多个）规则。

将领会到：仅通过示例描述了上面的实施例。

例如，用于预测用户意图的度量211并不限于被实现为一个或多个预定义规则的集合。在替代的或附加的实现方式中，度量211可以包括通过机器学习算法基于用户输入来学习的学习型知识模型。在这种情况中，当用户使用具有相同的第二输入以及由此产生的调节的相同的第二语音命令来连续校正预定义场景时，这可以变成预定义场景。换言之，在相同的调节被提供给相同的场景之后，所学到的这是优选形式的预定义场景的知识可以被存储并在下次那个场景被调用时被使用。

通过研究附图、公开内容和所附的权利要求书，本领域技术人员在实践所请求保护的发明时能够明白和实现针对所公开实施例的其他变型。在权利要求书中，词“包括”并不排除其他的元素或步骤，并且不定冠词“一”或“一个”并不排除多个。单个处理器或其他单元可以履行在权利要求书中叙述的若干项的功能。在互不相同的从属权利要求中叙述某些措施的纯粹事实并不指示不能有利使用这些措施的组合。计算机程序可以被存储/被分布在合适的介质诸如与其他硬件的一部分一起供应或作为其一部分供应的光学存储介质或固态介质上，但是也可以采用其他形式诸如经由Internet或者其他的有线或无线电信系统来分发。权利要求书中的任何参考符号不应被解释为限制范畴。

18页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：等离子枪的优化中性极叠堆冷却

语音控制

相关技术

网友询问留言