语音识别方法、装置、移动终端及计算机可读存储介质

文档序号:1088616 发布日期:2020-10-20 浏览:42次 >En<

阅读说明:本技术 语音识别方法、装置、移动终端及计算机可读存储介质 (Voice recognition method, device, mobile terminal and computer readable storage medium ) 是由 张刘立 于 2020-07-27 设计创作,主要内容包括:本申请涉及人工智能和语音处理,提供一种语音识别方法、装置、移动终端及计算机可读存储介质,该方法包括:以间隔第一预设时间确定所述移动终端是否处于定位盲区;当确定所述移动终端处于定位盲区时,以间隔第二预设时间基于所述移动终端的传感器数据更新所述移动终端的历史位置信息;当获取到用户的语音数据时,若所述移动终端仍处于定位盲区,则根据更新后的历史位置信息,获取目标语音识别模型;根据所述目标语音识别模型对所述语音数据进行识别,得到所述语音数据对应的标准普通话文本。本申请能够解决移动终端位于定位盲区时,无法定位移动终端的位置信息,进而无法保证语音识别的准确率的问题。(The application relates to artificial intelligence and speech processing, and provides a speech recognition method, a speech recognition device, a mobile terminal and a computer-readable storage medium, wherein the method comprises the following steps: determining whether the mobile terminal is in a positioning blind area at intervals of first preset time; when the mobile terminal is determined to be in a positioning blind area, updating historical position information of the mobile terminal based on sensor data of the mobile terminal at intervals of second preset time; when voice data of a user are obtained, if the mobile terminal is still in a positioning blind area, obtaining a target voice recognition model according to the updated historical position information; and recognizing the voice data according to the target voice recognition model to obtain a standard mandarin text corresponding to the voice data. The method and the device can solve the problem that when the mobile terminal is located in the positioning blind area, the position information of the mobile terminal cannot be positioned, and therefore the accuracy of voice recognition cannot be guaranteed.)

语音识别方法、装置、移动终端及计算机可读存储介质

技术领域

本申请涉及人工智能中的语音识别技术领域,尤其涉及一种语音识别方法、装置、移动终端及计算机可读存储介质。

背景技术

随着语音识别技术的快速发展,语音识别技术逐渐应用于移动终端,使得移动终端可以对用户的语音数据进行识别,得到文本数据,然而,在对用户的语音数据进行识别时,会受到用户的口音以及方言的影响和干扰,语音识别的准确率较低。目前,可通过GPS定位装置、基站或者移动网络定位移动终端的位置信息,并根据位置信息匹配方言识别模型,然后通过方言识别模型以及方言与标准普通话之后的映射关系,对语音数据进行处理,得到标准普通话文本,以提高语音识别的准确率。然而,在某些情况下,无法根据GPS定位装置、基站或者移动网络定位移动终端的位置信息,使得无法通过用户的位置信息匹配方言识别模型,语音识别的准确率较低,用户体验不好。

发明内容

本申请的主要目的在于提供一种语音识别方法、装置、移动终端及计算机可读存储介质,旨在解决移动终端位于定位盲区时,无法定位移动终端的位置信息,进而无法保证语音识别的准确率的问题。

第一方面,本申请提供一种语音识别方法,包括:

以间隔第一预设时间确定所述移动终端是否处于定位盲区;

当确定所述移动终端处于定位盲区时,以间隔第二预设时间基于所述移动终端的传感器数据更新所述移动终端的历史位置信息;

当获取到用户的语音数据时,若所述移动终端仍处于定位盲区,则根据更新后的历史位置信息,获取目标语音识别模型;

根据所述目标语音识别模型对所述语音数据进行识别,得到所述语音数据对应的标准普通话文本。

第二方面,本申请还提供一种语音识别装置,所述语音识别装置包括:

确定模块,用于以间隔第一预设时间确定所述移动终端是否处于定位盲区;

位置更新模块,用于当确定所述移动终端处于定位盲区时,以间隔第二预设时间基于所述移动终端的传感器数据更新所述移动终端的历史位置信息;

获取模块,用于当获取到用户的语音数据时,若所述移动终端仍处于定位盲区,则根据更新后的历史位置信息,获取目标语音识别模型;

语音识别模块,用于根据所述目标语音识别模型对所述语音数据进行识别,得到所述语音数据对应的标准普通话文本。

第三方面,本申请还提供一种移动终端,所述移动终端包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上所述的语音识别方法的步骤。

第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上所述的语音识别方法的步骤。

本申请提供一种语音识别方法、装置、移动终端及计算机可读存储介质,本申请通过以间隔第一预设时间确定移动终端是否处于定位盲区,并当确定移动终端处于定位盲区时,以间隔第二预设时间基于移动终端的传感器数据更新移动终端的历史位置信息,然后当获取到用户的语音数据时,若移动终端仍处于定位盲区,则根据更新后的历史位置信息获取目标语音识别模型,并根据该目标语音识别模型对语音数据进行识别,得到该语音数据对应的标准普通话文本,上述技术方案能够在根据GPS定位装置、基站或者移动网络无法定位移动终端的位置信息时,仍可以定位移动终端的位置信息,从而匹配准确的语音识别模型,提高语音识别的准确率,极大的提高了用户体验。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种语音识别方法的流程示意图;

图2为图1中的语音识别方法的子步骤流程示意图;

图3为本申请实施例提供的一种语音识别装置的示意性框图;

图4为图3中的语音识别装置的子模块的示意性框图;

图5为本申请实施例提供的一种移动终端的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参阅附图做进一步说明。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。

本申请实施例提供一种语音识别方法、装置、移动终端及计算机可读存储介质。其中,该语音识别方法可应用于终端设备中,该终端设备可以手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

请参阅图1,图1为本申请实施例提供的一种语音识别方法的流程示意图。

如图1所示,该语音识别方法包括步骤S101至步骤S104。

步骤S101、以间隔第一预设时间确定所述移动终端是否处于定位盲区。

其中,移动终端可以通过全球定位系统(Global Positioning System,GPS)、基站定位技术和网络定位技术等定位移动终端的位置信息,定位盲区是指无法通过GPS定位技术、基站定位技术和/或网络定位技术等给移动终端定位的区域,第一预设时间可基于实际情况进行设置,本申请对此不做具体限定,例如,第一预设时间为10秒或者30秒。

在一实施例中,移动终端以间隔第一预设时间通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度尝试对移动终端进行定位,而当无法通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度对移动终端进行定位时,确定移动终端处于定位盲区,即定位盲区是指无法通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度对移动终端进行定位的空间区域,而若可以通过GPS定位装置对移动终端进行定位,或者可以通过基站定位程序对移动终端进行定位,或者通过网络对移动终端进行定位,则可以确定移动终端不处于定位盲区。

示例性的,移动终端以间隔第一预设时间通过GPS定位装置,尝试对移动终端进行定位,若定位失败,则通过基站定位程序尝试对移动终端进行定位,若再次失败,则获取移动终端的网络信号强度,并确定移动终端的网络信号强度是否为零,若确定移动终端的网络信号强度为零,则可以确定移动终端处于定位盲区。

步骤S102、当确定所述移动终端处于定位盲区时,以间隔第二预设时间基于所述移动终端的传感器数据更新所述移动终端的历史位置信息。

其中,移动终端包括加速度传感器、方向传感器和气压传感器等,历史位置信息包括移动终端未处于定位盲区时,通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度确定的移动终端的位置信息,例如,移动终端以间隔第一预设时间通过通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度对移动终端进行定位时,当定位到移动终端的位置信息时,存储定位得到的位置信息,便于后续当确定移动终端处于定位盲区时,获取存储的位置信息,得到历史位置信息,第二预设时间可基于实际情况进行设置,本申请对此不做具体限定,例如,第二预设时间为15秒或20秒。

在一实施例中,该传感器数据包括移动终端的加速度传感器输出的移动终端的加速度和方向传感器输出的移动终端的移动方向,基于移动终端的传感器数据更新移动终端的历史位置信息的方式可以为:根据加速度和第二预设时间,确定移动终端的移动距离;根据移动距离和移动方向,更新移动终端的历史位置信息。其中,通过在移动终端的第二预设时间对加速度进行二次积分计算即可得到移动终端的移动距离,即先在移动的第二预设时间内对加速度进行积分,得到移动速度,即v为移动速度,a为加速度,t为第二预设时间,之后在移动的第二预设时间内对移动速度进行积分,得到移动距离,即d为移动距离,v为移动速度,t为第二预设时间。

在一实施例中,根据移动距离和移动方向,更新移动终端的历史位置信息的方式可以为:在预设离线地图内标记移动终端的历史位置信息,得到移动终端的历史位置点;根据移动距离、移动方向和历史位置点,确定移动终端的在预设离线地图上的当前位置点;获取该当前位置点在预设离线地图上的位置信息,并将位置信息作为更新后的历史位置信息,以实现对移动终端的历史位置信息进行更新。

步骤S103、当获取到用户的语音数据时,若所述移动终端仍处于定位盲区,则根据更新后的历史位置信息,获取目标语音识别模型。

当获取到用户的语音数据时,通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度尝试对移动终端进行定位,而当无法通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度对移动终端进行定位时,确定移动终端仍处于定位盲区,则根据更新后的历史位置信息,获取目标语音识别模型,而当可以通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度对移动终端进行定位时,确定移动终端由定位盲区移动至可定位区域,因此,获取通过GPS定位装置、基站定位程序和/或移动终端的网络信号强度对移动终端进行定位得到的当前定位信息,并基于当前定位信息获取目标语音识别模型。

在一实施例中,根据更新后的历史位置信息,获取目标语音识别模型的方式可以为:获取更新后的历史位置信息所处地域的地域编码;获取与地域编码绑定的语音识别模型,得到目标语音识别模型。其中,提前基于不同的地域,建立不同的语音识别模型,并建立语音识别模型与地域编码之间的绑定关系,并将语音识别模型与地域编码之间的绑定关系存储在移动终端的存储器内,从而可以基于地域编码和语音识别模型与地域编码之间的绑定关系,获取与地域编码绑定的语音识别模型,地域编码可以按照划分的城市确定。

在一实施例中,如图2所示,步骤S103包括子步骤S1031至子步骤S1032。

子步骤S1031、确定所述语音数据所属的方言类型。

其中,方言类型包括官话、晋语、吴语、湘语、粤语、赣语、徽语、闽语、客家话和平话等,官话又进一步可分为北京官话、东北官话、冀鲁官话、江淮官话、西南官话、胶辽官话、中原官话和兰银官话等。

在一实施例中,从该语音数据提取梅尔倒谱特征、基频轮廓特征、时长特征和能量特征;将梅尔倒谱特征输入预设发音类型识别模型,得到每个音节片段的发音类型;将基频轮廓特征、时长特征和能量特征输入预设声调识别模型,得到每个音节片段的声调;根据该发音类型和声调确定该语音数据所属的方言类型。其中,预设发音类型识别模型是将梅尔倒谱特征和梅尔倒谱特征对应的发音类型作为样本数据,对神经网络模型进行训练得到的,预设声调识别模型是将基频轮廓特征、时长特征和能量特征以及与基频轮廓特征、时长特征和能量特征对应的声调作为样本数据,对神经网络模型进行训练得到的。

在一实施例中,根据该发音类型和声调,确定语音数据所属的方言类型的方式可以为:获取预存的发音类型、声调和方言类型之间的映射关系表,并根据该映射关系表以及该发音类型和声调,确定语音数据所属的方言类型,即基于该发音类型和声调查询该映射关系表,得到与该发音类型和声调对应的方言类型,并将与该发音类型和声调对应的方言类型作为该语音数据所属的方言类型。其中,预存的发音类型、声调和方言类型之间的映射关系表可基于实际情况进行设置,本申请对此不做具体限定。

在一实施例中,从该语音数据提取每个音节片段的梅尔倒谱特征、基频轮廓特征、时长特征和能量特征;将该每个音节片段的梅尔倒谱特征输入预设发音类型识别模型,得到每个音节片段的发音类型;将每个音节片段的发音类型输入至第一预设方言类型识别模型,得到语音数据分别属于每个方言类型各自对应的第一概率;将每个音节片段的基频轮廓特征、时长特征和能量特征输入第二预设方言类型识别模型,得到语音数据分别属于每个方言类型各自对应的第二概率;根据语音数据分别属于每个方言类型各自对应的第一概率和第二概率,确定所述语音数据所属的方言类型。通过每个音节片段的梅尔倒谱特征、基频轮廓特征、时长特征和能量特征可以准确的确定语音数据所属的方言类型。

在一实施例中,预设发音类型识别模型是使用发音类型和梅尔倒谱特征,对高斯混合模型训练而成的,第一预设方言类型识别模型是将发音类型、发音类型的位置关系和音节片段所属方言类型的概率作为样本数据对三层神经网络进行训练得到的,第二预设方言类型识别模型是使用基频轮廓特征、时长特征、能量特征以及与基频轮廓特征、时长特征、能量特征对应的声调所属的方言类型的概率,对高斯混合模型训练而成的,基频轮廓特征、时长特征和能量特征能够较好的描述声调的调型及持续性等特征。

在一实施例中,三层神经网络包括观测层、隐含层和输出层,观测层为音节片段的梅尔倒谱特征、隐含层为梅尔倒谱特征对应的发音类型片段,并且约定由上到下对应声母、韵头韵腹和韵尾下的发音类型,输出层为方言归类,从而输出语音数据分别属于每个方言类型各自对应的第一概率。

其中,音节片段是将每个音节根据声母、韵母划分成的三个音节片段;第一音节片段位置对应的发音类型是塞音、擦音、塞擦音、鼻音和边音;第二音节片段位置对应的发音类型是开口呼、齐齿呼、合口呼和撮口呼;第三音节片段位置对应的发音类型是塞音、擦音和鼻音。现代音韵学认为声调、声母和韵母是构成汉语音节的基本要素。如果不计声调,汉语音节的音位构成是四位结构。其中,声母占了第一个位子,韵母进一步分为韵头、韵腹和韵尾,占了第二三四位子。按发音方法,声母可分为塞音、擦音、塞擦音、鼻音和边音等五类发音类型,韵母中按照韵头和韵腹的组合可分为开口呼、齐齿呼、合口呼和撮口呼等四类发音类型,而韵母中的韵尾可分为塞音、擦音和鼻音等三类发音类型。如此,一个汉字音节则由3个发音类型组成,而汉语方言的差异可归纳为不同发音类型出现的频率以及不同发音类型在音节中出现的次序。

在一实施例中,所述根据语音数据分别属于每个方言类型各自对应的第一概率和第二概率,确定所述语音数据所属的方言类型的方式可以为:根据该语音数据分别属于每个方言类型各自对应的第一概率和第二概率,计算该语音数据分别属于每个方言类型各自对应的平均概率,并将该语音数据分别属于每个方言类型各自对应的平均概率作为该语音数据分别属于每个方言类型各自对应的目标概率;将该目标概率最大的方言类型作为语音数据所属的方言类型。

子步骤S1032、根据所述方言类型和更新后的历史位置信息,获取目标语音识别模型。

在一实施例中,获取与该方言类型绑定的第一地域编码,并获取更新后的历史位置信息所处地域的第二地域编码;根据第一地域编码和第二地域编码,获取目标语音识别模型,即确定第一地域编码与第二地域编码是否相同,当确定第一地域编码与第二地域编码相同时,获取与第二地域编码绑定的语音识别模型,得到目标语音识别模型,而当确定第一地域编码与第二地域编码不同时,获取与第一地域编码绑定的语音识别模型,得到目标语音识别模型。其中,获取更新后的历史位置信息所处地域的第二地域编码的方式可以为:确定更新后的历史位置信息所处的经纬度范围,并获取与该经纬度范围绑定的地域编码,且将与该经纬度范围绑定的地域编码作为第二地域编码。

步骤S104、根据所述目标语音识别模型对所述语音数据进行识别,得到所述语音数据对应的标准普通话文本。

在确定目标语音识别模型之后,先根据目标语音识别模型将该语音数据转换为带有方言的文本,并查询方言文本与标准普通话文本的对应关系,得到方言的文本中每个方言文字对应的标准普通话文字,并将方言的文本中每个方言文字替换为对应的标准普通话文字,从而得到语音数据对应的标准普通话文本。其中,方言文本与标准普通话文本的对应关系是预先存储在移动终端的存储内的,方言文本与标准普通话文本的对应关系可基于实际情况进行设置,本申请对此不做具体限定。

上述实施例提供的语音识别方法,通过以间隔第一预设时间确定移动终端是否处于定位盲区,并当确定移动终端处于定位盲区时,以间隔第二预设时间基于移动终端的传感器数据更新移动终端的历史位置信息,然后当获取到用户的语音数据时,若移动终端仍处于定位盲区,则根据更新后的历史位置信息获取目标语音识别模型,并根据该目标语音识别模型对语音数据进行识别,得到该语音数据对应的标准普通话文本,上述技术方案能够在根据GPS定位装置、基站或者移动网络无法定位移动终端的位置信息时,仍可以定位移动终端的位置信息,从而匹配准确的语音识别模型,提高语音识别的准确率,极大的提高了用户体验。

请参阅图3,图3为本申请实施例提供的一种语音识别装置的示意性框图。

如图3所示,该语音识别装置200包括:确定模块210、位置更新模块220、获取模块230和语音识别模块240,其中:

所述确定模块210,用于以间隔第一预设时间确定所述移动终端是否处于定位盲区;

所述位置更新模块220,用于当确定所述移动终端处于定位盲区时,以间隔第二预设时间基于所述移动终端的传感器数据更新所述移动终端的历史位置信息;

所述获取模块230,用于当获取到用户的语音数据时,若所述移动终端仍处于定位盲区,则根据更新后的历史位置信息,获取目标语音识别模型;

所述语音识别模块240,用于根据所述目标语音识别模型对所述语音数据进行识别,得到所述语音数据对应的标准普通话文本。

在一实施例中,所述传感器数据包括移动终端的加速度传感器输出的所述移动终端的加速度和方向传感器输出的所述移动终端的移动方向;所述位置更新模块220还用于:

根据所述加速度和第二预设时间,确定所述移动终端的移动距离;

根据所述移动距离和移动方向,更新所述移动终端的历史位置信息。

在一实施例中,所述位置更新模块220还用于:

在预设离线地图内标记所述移动终端的历史位置信息,得到所述移动终端的历史位置点;

根据所述移动距离、移动方向和历史位置点,确定所述移动终端在所述预设离线地图上的当前位置点;

获取所述当前位置点在所述预设离线地图上的位置信息,并将所述位置信息作为更新后的历史位置信息。

在一实施例中,所述获取模块230还用于:

获取更新后的历史位置信息所处地域的地域编码;

获取与所述地域编码绑定的语音识别模型,得到目标语音识别模型。

在一实施例中,如图4所示,所述获取模块230包括:

确定子模块231,用于确定所述语音数据所属的方言类型;

获取子模块232,用于根据所述方言类型和更新后的历史位置信息,获取目标语音识别模型。

在一实施例中,所述确定子模块231还用于:

从所述语音数据提取梅尔倒谱特征、基频轮廓特征、时长特征和能量特征;

将所述梅尔倒谱特征输入预设发音类型识别模型,得到每个音节片段的发音类型;

将所述基频轮廓特征、时长特征和能量特征输入预设声调识别模型,得到每个音节片段的声调;

根据所述发音类型和声调确定所述语音数据所属的方言类型。

在一实施例中,所述获取子模块232还用于:

获取与所述方言类型绑定的第一地域编码,并获取更新后的历史位置信息所处地域的第二地域编码;

根据所述第一地域编码和第二地域编码,获取目标语音识别模型。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述语音识别方法实施例中的对应过程,在此不再赘述。

上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图5所示的移动终端上运行。

请参阅图5,图5是本申请实施例提供的一种移动终端的结构示意性框图。该移动终端可以为服务器或终端。

如图5所示,该移动终端包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种语音识别方法。

处理器用于提供计算和控制能力,支撑整个移动终端的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种数据泄露提醒方法。

该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的移动终端的限定,具体的移动终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的移动终端的限定,具体的移动终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中,在一实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:

以间隔第一预设时间确定所述移动终端是否处于定位盲区;

当确定所述移动终端处于定位盲区时,以间隔第二预设时间基于所述移动终端的传感器数据更新所述移动终端的历史位置信息;

当获取到用户的语音数据时,若所述移动终端仍处于定位盲区,则根据更新后的历史位置信息,获取目标语音识别模型;

根据所述目标语音识别模型对所述语音数据进行识别,得到所述语音数据对应的标准普通话文本。

在一实施例中,所述传感器数据包括移动终端的加速度传感器输出的所述移动终端的加速度和方向传感器输出的所述移动终端的移动方向;所述基于所述移动终端的传感器数据更新所述移动终端的历史位置信息,包括:

根据所述加速度和第二预设时间,确定所述移动终端的移动距离;

根据所述移动距离和移动方向,更新所述移动终端的历史位置信息。

在一实施例中,所述根据所述移动距离和移动方向,更新所述移动终端的历史位置信息,包括:

在预设离线地图内标记所述移动终端的历史位置信息,得到所述移动终端的历史位置点;

根据所述移动距离、移动方向和历史位置点,确定所述移动终端在所述预设离线地图上的当前位置点;

获取所述当前位置点在所述预设离线地图上的位置信息,并将所述位置信息作为更新后的历史位置信息。

在一实施例中,所述根据更新后的历史位置信息,获取目标语音识别模型,包括:

获取更新后的历史位置信息所处地域的地域编码;

获取与所述地域编码绑定的语音识别模型,得到目标语音识别模型。

在一实施例中,所述根据更新后的历史位置信息,获取目标语音识别模型,包括:

确定所述语音数据所属的方言类型;

根据所述方言类型和更新后的历史位置信息,获取目标语音识别模型。

在一实施例中,所述根据所述方言类型和更新后的历史位置信息,获取目标语音识别模型,包括:

获取与所述方言类型绑定的第一地域编码,并获取更新后的历史位置信息所处地域的第二地域编码;

根据所述第一地域编码和第二地域编码,获取目标语音识别模型。

在一实施例中,所述确定所述语音数据所属的方言类型,包括:

从所述语音数据提取梅尔倒谱特征、基频轮廓特征、时长特征和能量特征;

将所述梅尔倒谱特征输入预设发音类型识别模型,得到每个音节片段的发音类型;

将所述基频轮廓特征、时长特征和能量特征输入预设声调识别模型,得到每个音节片段的声调;

根据所述发音类型和声调确定所述语音数据所属的方言类型。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的移动终端的具体工作过程,可以参考前述语音识别方法实施例中的对应过程,在此不再赘述。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台移动终端(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参阅本申请语音识别方法的各个实施例。

其中,所述计算机可读存储介质可以是前述实施例所述的移动终端的内部存储单元,例如所述移动终端的硬盘或内存。所述计算机可读存储介质也可以是所述移动终端的外部存储设备,例如所述移动终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。

进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:语音关键词识别方法和装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!