一种在线拾音主电单元、方法及可穿戴设备

文档序号:1908675 发布日期:2021-11-30 浏览:22次 >En<

阅读说明:本技术 一种在线拾音主电单元、方法及可穿戴设备 (Online pickup main power unit and method and wearable device ) 是由 钱忠根 安康 于 2021-08-30 设计创作,主要内容包括:本申请公开了一种在线拾音主电单元、方法及可穿戴设备,该电路应用于可穿戴设备,包括骨声纹传感器、麦克风和麦克风电源控制电路;麦克风电源控制电路连接在骨声纹传感器的输出端与麦克风的电源端之间,用于在骨声纹传感器拾取到可穿戴设备佩戴者讲话时骨骼的振动信号后,启动麦克风拾取语音信号。本申请根据骨声纹传感器的输出唤醒麦克风拾音,如此既避免了高功耗的麦克风因持续工作而增加能耗,又可在用户说话时及时启动麦克风、防止语音信号漏检,实现了拾音功能的随时在线,极大提高了用户体验。(The application discloses an online pickup main power unit, a method and wearable equipment, wherein the circuit is applied to the wearable equipment and comprises a bone voiceprint sensor, a microphone and a microphone power supply control circuit; the microphone power supply control circuit is connected between the output end of the bone voiceprint sensor and the power supply end of the microphone and used for starting the microphone to pick up voice signals after the bone voiceprint sensor picks up vibration signals of bones when a wearable device wearer speaks. This application awakens up the microphone pickup according to the output of bone vocal print sensor, so both avoided the microphone of high-power consumption to increase the energy consumption because of lasting work, can in time start the microphone again when the user speaks, prevent that voice signal from missing to examine, realized being online at any time of pickup function, greatly improved user experience.)

一种在线拾音主电单元、方法及可穿戴设备

技术领域

本申请涉及语音识别技术领域,特别涉及一种在线拾音主电单元、方法及可穿戴设备。

背景技术

随着技术的发展,人机交互模式已经由最初的卡带交互、键盘交互发展到触屏交互、乃至当前更为智能化的语音交互,许多智能可穿戴设备中均配备了语音交互功能,可以依据用户发出的语音指令而执行对应的操作。

麦克风(microphone,MIC)是常用的拾音元器件。麦克风进行拾音后,便会将语音信号交由语音模块进行语音识别,而该过程的功耗是比较大的。因此,为了避免功耗过大,相关技术中一般都需要主动按键来打开麦克风的拾音功能,所以并不能实现拾音功能的一直在线即always on拾音。并且,在打开了拾音功能之后,环境噪音、其他人发出的声音等也会对现有技术中的语音识别造成干扰,导致语音识别率不高,用户发出的语音指令无法被及时正确地响应,降低了用户体验。

鉴于此,提供一种解决上述技术问题的方案,已经是本领域技术人员所亟需关注的。

发明内容

本申请的目的在于提供一种在线拾音主电单元、方法及可穿戴设备,以便在不影响功耗的情况下提供随时拾音的功能。

为解决上述技术问题,一方面,本申请公开了一种在线拾音主电单元,应用于可穿戴设备,所述在线拾音主电单元包括骨声纹传感器、麦克风和麦克风电源控制电路;

所述麦克风电源控制电路连接在所述骨声纹传感器的输出端与所述麦克风的电源端之间,用于在所述骨声纹传感器拾取到可穿戴设备佩戴者讲话时骨骼的振动信号后,启动所述麦克风拾取语音信号。

可选地,所述麦克风电源控制电路包括:

信号放大单元,用于对所述振动信号进行功率放大;

与所述信号放大单元连接的自举单元,用于基于功率放大后的振动信号输出驱动信号;

与所述自举单元连接的开关单元,用于基于所述驱动信号闭合所述麦克风的电源开关;

与所述自举单元连接的延时单元,用于从所述驱动信号吸收能量以延迟所述开关单元的开关闭合动作。

可选地,所述信号放大单元包括第一电容、第二电容、第一电阻、第二电阻和运放;

所述运放的正输入端连接参考电压,负输入端经串联的所述第一电容、所述第一电阻与所述骨声纹传感器的输出端连接;所述第二电容、所述第二电阻并联在所述运放的负输入端与输出端之间。

可选地,所述自举单元包括第三电容、第三电阻、第四电阻和第一开关管,所述第一开关管高电平开通;

所述第一开关管的控制端经串联的所述第三电容、所述第三电阻与所述运放的输出端连接,所述第一开关管的输入端经所述第四电阻连接至电源。

可选地,所述开关单元包括第五电阻、第六电阻、第七电阻、第八电阻、第二开关管和第三开关管;所述第二开关管高电平开通,所述第三开关管低电平开通;

所述第二开关管的控制端经所述第五电阻连接至所述第一开关管的输出端,并经所述第六电阻接地;所述第二开关管的输出端接地;

所述第二开关管的输入端经所述第七电阻连接至所述第三开关管的控制端;所述第三开关管的输入端连接至电源;所述第三开关管的输出端连接至所述麦克风的电源端;所述第八电阻连接在所述第三开关管的输入端与控制端之间。

可选地,所述延时单元包括第四电容和第九电阻,所述第四电容和所述第九电阻均并联在所述第二开关管的输出端与地线之间。

可选地,还包括:

语音芯片,分别与所述骨声纹传感器和所述麦克风连接,用于对接收到的所述振动信号和所述语音信号进行信号融合处理,并基于融合后的处理信号进行语音识别。

可选地,所述语音芯片包括语音活动检测单元和微处理器;所述语音活动检测单元用于根据对所述振动信号的语音活动检测结果唤醒所述微处理器进行信号融合处理。

又一方面,本申请还公开了一种在线拾音方法,应用于可穿戴设备,所述可穿戴设备中设置有骨声纹传感器、麦克风和麦克风电源控制电路;所述方法包括:

基于所述骨声纹传感器实时监测可穿戴设备佩戴者讲话时骨骼的振动信号;

在拾取到所述振动信号后,经所述麦克风电源控制电路启动所述麦克风拾取语音信号。

又一方面,本申请还公开了一种可穿戴设备,包括如上所述的任一种在线拾音主电单元。

本申请所提供的在线拾音主电单元、方法及可穿戴设备所具有的有益效果是:本申请基于相关电路可自动根据骨声纹传感器的输出唤醒麦克风拾音,如此既避免了高功耗的麦克风因持续工作而增加能耗,又可在用户说话时及时启动麦克风、防止语音信号漏检,实现了拾音功能的随时在线,极大提高了用户体验。

附图说明

为了更清楚地说明现有技术和本申请实施例中的技术方案,下面将对现有技术和本申请实施例描述中需要使用的附图作简要的介绍。当然,下面有关本申请实施例的附图描述的仅仅是本申请中的一部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图,所获得的其他附图也属于本申请的保护范围。

图1为现有技术中的一种在线拾音主电单元的结构框图;

图2为本申请实施例公开的一种在线拾音主电单元的结构框图;

图3为本申请实施例公开的又一种在线拾音主电单元的结构框图;

图4为本申请实施例公开的一种麦克风电源控制电路的电路结构图;

图5为本申请实施例公开的一种语音识别过程的原理示意图;

图6为本申请实施例公开的一种在线拾音方法的流程图。

具体实施方式

本申请的核心在于提供一种在线拾音主电单元、方法及可穿戴设备,以便在不影响功耗的情况下提供随时拾音的功能。

为了对本申请实施例中的技术方案进行更加清楚、完整地描述,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行介绍。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

当前,许多智能可穿戴设备中均配备了语音交互功能,可以依据用户发出的语音指令而执行对应的操作。参见图1,图1为现有技术公开的一种麦克风拾音方案的架构框图。

如图1所示,麦克风进行拾取人声和环境音,输出对应的语音信号唤醒语音芯片,语音芯片便对该语音信号进行语音识别。其中,语音芯片的功耗比较大,大约几到几百mA。整个架构中最主要的功耗是语音芯片,其次是MIC;所以在开启拾音功能后,也需要减少语音芯片的误动作,因为语音芯片一旦跑起来后,功耗是成几何的上升。

当前,为了避免功耗过大,相关技术中一般都需要主动按键来打开麦克风的拾音功能,所以并不能实现拾音功能的一直在线即always on拾音。并且,在打开了拾音功能之后,环境噪音、其他人发出的声音等也会对现有技术中的语音识别造成干扰,导致语音识别率不高,用户发出的语音指令无法被及时正确地响应,降低了用户体验。

鉴于此,本申请提供了一种在线拾音方案,可有效解决上述问题。

参见图2所示,本申请实施例公开了一种在线拾音主电单元,应用于可穿戴设备,该在线拾音主电单元包括骨声纹传感器(Voice Pick Up,VPU)100、麦克风(microphone,MIC)200和麦克风电源控制电路300;

麦克风电源控制电路300连接在骨声纹传感器100的输出端与麦克风200的电源端之间,用于在骨声纹传感器100拾取到可穿戴设备佩戴者讲话时骨骼的振动信号后,启动麦克风200拾取语音信号。

具体地,本申请所公开的在线拾音主电单元可具体应用于具有拾音功能需求的可穿戴设备中,这些可穿戴设备包括但不限于耳机、AR(Augmented Reality,增强现实)产品、VR(Virtual Reality,虚拟现实)产品等。需要指出的是,本申请具体利用了骨声纹传感器参与控制麦克风的拾音。本申请通过在可穿戴设备的在线拾音主电单元中设置骨声纹传感器,可以准确获取可穿戴设备的佩戴者说话时的骨声纹信息。这种骨传导技术将声音转化为不同频率的机械振动,通过人的颅骨、骨迷路、内耳淋巴液传递、螺旋器、听神经、听觉中枢来传递声波。

基于骨声纹传感器帮助进行语音识别具有多种优势。首先,容易理解的是,声音在固体传导的速度远远大于声音在空气中的传播速度,而且衰减也少的多,因此基于骨声纹传感器获取的振动信号的信息保有量较为可观。

其次,骨声纹传感器感应的仅仅是可穿戴设备佩戴者本人头部骨骼等传导的振动,因此可有效杜绝环境噪音或者其他人的语音造成的误触发,可有效提高对用户本人的语音识别率。

此外,骨声纹传感器自身的功耗很低,可以实现实时在线、随时响应佩戴者的语音命令。因此,本申请令骨声纹传感器实时监测,并以骨声纹传感器的输出来唤醒麦克风工作。如此,本申请一方面可以实现拾音功能的always on,另一方面可以有效减少功耗较大的后接元器件(如麦克风、语音芯片)的误触发,从而降低系统总体的功耗。

其中,麦克风电源控制电路用于依据骨声纹传感器的输出信号来控制麦克风的开启。顾名思义,麦克风电源控制电路是由电路元器件构成、用于控制麦克风上电的电路。本领域技术人员容易理解的是,电路中相关元器件参数可以决定在骨声纹传感器有输出之后的多久时间内打开麦克风的电源。因此本领域技术人员可以自行通过调整相关元器件参数来增大或者减少麦克风电源控制电路的动作延迟时长,以满足对麦克分在线拾音功能的需求。

容易理解的是,由于本申请是由纯硬件电路来自动控制麦克风的上电,因此,相比于软件方法启动麦克风,本申请可以有效省却利用软件算法进行上电确认的处理功耗和延时;并且,本申请中还可以进一步通过调整电路参数来调节延迟时长,满足多种实际应用情况的需求。

可见,本申请实施例所公开的在线拾音主电单元,基于相关电路可自动根据骨声纹传感器的输出唤醒麦克风拾音,如此既避免了高功耗的麦克风因持续工作而增加能耗,又可在用户说话时及时启动麦克风、防止语音信号漏检,实现了拾音功能的随时在线,极大提高了用户体验。

参见图3,图3为本申请实施例公开的又一种在线拾音主电单元的结构框图。

如图3所示,作为一种具体实施例,本申请实施例所公开的在线拾音主电单元在上述内容的基础上,麦克风电源控制电路300包括:

信号放大单元301,用于对振动信号进行功率放大;

与信号放大单元301连接的自举单元302,用于基于功率放大后的振动信号输出驱动信号;

与自举单元302连接的开关单元303,用于基于驱动信号闭合麦克风的电源开关;

与自举单元302连接的延时单元304,用于从驱动信号吸收能量以延迟开关单元的开关闭合动作。

具体地,信号放大单元301基于运放A对VPU输出的信号进行放大,然后输出给自举单元302。信号放大单元301可具体选择低功耗运放A,功耗一般在几百nA到几十uA范围内。自举单元302主要用于输出对应的电平的驱动信号(一般抬高电平),以便驱动后端开关单元303中的开关管打开或关闭MIC的电源。自举单元302和开关单元303的功耗比较低,根据阻值和容值设定,一般为几uA。延迟单元304能够调节开关单元303打开MIC电源的延迟时长,即延迟时长随延时单元的电路参数可调。当延迟单元304的电路元器件的电路参数发生变化时,麦克风上电的延迟时间也将发生变化。

参见图4,图4为本申请实施例提供的一种麦克风电源控制电路的电路结构图。作为一种具体实施例,本申请实施例所公开的在线拾音主电单元在上述内容的基础上,如图4所示,信号放大单元301包括第一电容C1、第二电容C2、第一电阻R1、第二电阻R2和运放A;

运放A的正输入端连接参考电压Vref,负输入端经串联的第一电容C1、第一电阻R1与骨声纹传感器的输出端连接;第二电容C2、第二电阻R2并联在运放A的负输入端与输出端之间。

具体地,参考电压Vref的大小决定了运放A正输入端的电位,所以,参考电压与骨声纹传感器输出电压的差值、以及信号放大单元的放大倍数,将进一步影响了运放A的输出电压大小。一般地,参考电压可采用常用的3.3V。此外,R2/R1的值即为信号放大单元的放大倍数,通过调节R2和R1的阻值大小便可调节信号放大的倍数;倍数越大,打开后端电路开关管所需要的信号能量就越少。

作为一种具体实施例,本申请实施例所公开的在线拾音主电单元在上述内容的基础上,自举单元302包括第三电容C3、第三电阻R3、第四电阻R4和第一开关管,第一开关管高电平开通;

第一开关管的控制端经串联的第三电容C3、第三电阻R3与运放A的输出端连接,第一开关管的输入端经第四电阻R4连接至电源。

其中,在图4中,Q1具体为NPN型三极管,基极为控制端,集电极为输入端,发射极为输出端。当VPU输出振动信号经信号放大单元301放大后,Q1便被导通,其放射极输出高电平的驱动信号。

进一步地,自举单元302还可以包括稳压管D,稳压管D的阴极连接至第一开关管的控制端,阳极连接至第一开关管的输出端,对第一开关管进行稳压保护。当然,本领域技术人员也可以采用NMOS管作为Q1;又或者,本领域技术人员可以配合高低电平转换电路,选择使用低电平开通的第一开关管,本申请对此并不进行限定。

作为一种具体实施例,本申请实施例所公开的在线拾音主电单元在上述内容的基础上,开关单元303包括第五电阻R5、第六电阻R6、第七电阻R7、第八电阻R8、第二开关管和第三开关管;第二开关管高电平开通,第三开关管低电平开通;

第二开关管的控制端经第五电阻R5连接至第一开关管的输出端,并经第六电阻R6接地;第二开关管的输出端接地;

第二开关管的输入端经第七电阻R7连接至第三开关管的控制端;第三开关管的输入端连接至电源;第三开关管的输出端连接至麦克风的电源端;第八电阻R8连接在第三开关管的输入端与控制端之间。

具体地,图4中Q2具体为NPN型三极管,基极为控制端,集电极为输入端,发射极为输出端。Q1的发射极输出高电平的驱动信号后,当Q2的基极电压大于其阈值电压后,Q2便会导通接地。将R8的阻值设置为远大于R7,则与Q2连接的R7也被下拉至低电平。例如,可具体设置R8为1000KΩ,R7为100KΩ。

Q3作为低电平开通的开关管,可具体选用PMOS管,其栅极为控制端,源极为输入端,漏极为输出端。Q2导通后拉低Q3的栅极电压,便使Q3导通,从而使MIC接通电源进行拾音。

作为一种具体实施例,本申请实施例所公开的在线拾音主电单元在上述内容的基础上,延时单元304包括第四电容C4和第九电阻R9,第四电容C4和第九电阻R9均并联在第二开关管的输出端与地线之间。

具体地,电容具有储能、稳定电压的作用,当电量足够多时才会抬升电压。因此C4电容越大、R9电阻越小,延迟时间越长,如此便需要等待更多个驱动信号的波形来开启Q2进而开启MIC。也就是说,影响延迟时长的电路参数包括了C4的电容值和R9的阻值。例如,可通过调整C4、R9的大小,令Q1输出5个周期的波形后才开启Q2;又或者,可通过调整C4、R9的大小,令Q1输出2个周期的波形后便开启Q2。

作为一种具体实施例,本申请实施例所公开的在线拾音主电单元在上述内容的基础上,还包括:

语音芯片400,分别与骨声纹传感器100和麦克风200连接,用于对接收到的振动信号和语音信号进行信号融合处理,并基于融合后的处理信号进行语音识别。

具体地,人声拾音之后可进一步用于语音识别。本实施例中还设置有语音芯片,骨声纹传感器在检测到佩戴者说话并输出振动信号后,一方面将控制麦克风上电,一方面将唤醒语音芯片进行处理。需要指出的是,本申请中语音芯片将同时以骨声纹传感器输出的振动信号和麦克风拾音输出的语音信号为依据,将两个信号进行信号融合之后再进行语音识别。并且进一步地,可以在将振动信号、语音信号经自适应滤波之后再进行信息融合。具体可参见图5,图5为本申请实施例公开的一种语音识别过程的原理示意图。

其中,骨声纹传感器虽然能准确拾取佩戴者说话的振动信号,但相对麦克风而言频宽较窄,语音信息不丰富;麦克风虽然易受环境噪声和他人语音影响,但是可以接收到很宽的信号频段。因此,本申请结合两种信号进行语音识别,既能有效去除噪声,也能尽量完整地还原语音信号,可有效提高语音识别的准确率。

作为一种具体实施例,本申请实施例所公开的在线拾音主电单元在上述内容的基础上,语音芯片400包括语音活动检测(Voice Activity Detection,VAD)单元和微处理器;语音活动检测单元用于根据对振动信号的语音活动检测结果唤醒微处理器进行信号融合处理。

语音活动检测即VAD又称语音端点检测、语音边界检测,其目的是从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源的作用。当VAD单元对语音活动的检测值达到一定阈值后便可唤醒语音芯片的微处理器。一般地,该微处理器可具体采用DSP(Digital Signal Processing,数字信号处理器)。

参见图6所示,本申请实施例公开了一种在线拾音方法,应用于可穿戴设备,可穿戴设备包括骨声纹传感器、麦克风和麦克风电源控制电路和语音芯片;该方法包括:

S101:基于骨声纹传感器实时检测可穿戴设备佩戴者讲话时骨骼的振动信号。

S102:在拾取到振动信号后,经麦克风电源控制电路启动麦克风拾取语音信号。

可见,本申请所提供的在线拾音方法,基于相关电路可自动根据骨声纹传感器的输出唤醒麦克风拾音,如此既避免了高功耗的麦克风因持续工作而增加能耗,又可在用户说话时及时启动麦克风、防止语音信号漏检,实现了拾音功能的随时在线,极大提高了用户体验。

作为一种具体实施例,所述可穿戴设备还包括分别与骨声纹传感器和麦克风连接的语音芯片;本申请实施例所提供的在线拾音方法在上述内容的基础上,还包括:

基于语音芯片对振动信号和语音信号进行信号融合处理,

基于语音芯片基于信号融合处理结果进行语音识别。

作为一种具体实施例,语音芯片包括语音活动检测单元和微处理器;本申请实施例所提供的在线拾音方法在上述内容的基础上,基于语音芯片对振动信号和语音信号进行信号融合处理,包括:

基于语音活动检测单元对振动信号进行语音活动检测;

根据语音活动检测结果唤醒微处理器进行信号融合处理。

关于上述语音识别方法的具体内容,可参考前述关于在线拾音主电单元的详细介绍,这里就不再赘述。

进一步地,本申请实施例还公开了一种可穿戴设备,包括如上所述的任一种在线拾音主电单元。

关于上述可穿戴设备的具体内容,可参考前述关于在线拾音主电单元的详细介绍,这里就不再赘述。

本申请中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的设备而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

还需说明的是,在本申请文件中,诸如“第一”和“第二”之类的关系术语,仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。此外,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请所提供的技术方案进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请的保护范围内。

12页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:线性谐振致动器控制器

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!