一种安卓客户端基于人工智能与语音识别的截屏方法

文档序号：38362 发布日期：2021-09-24 浏览：37次 >En<

阅读说明：本技术 一种安卓客户端基于人工智能与语音识别的截屏方法 (Screen capturing method of android client based on artificial intelligence and voice recognition ) 是由徐云峰吕晓光于 2021-06-18 设计创作，主要内容包括：本发明提供一种安卓客户端基于人工智能与语音识别的截屏方法,涉及智能终端技术领域。该安卓客户端基于人工智能与语音识别的截屏方法包括以下步骤：S1、录制语音截屏指令：进入智能移动终端系统内置的语音识别模块,录制用来截屏的语音指令,存放于语音识别模块；S2、声控麦克风：在语音识别模块中插入麦克风调整相关语音指令,其指令包括麦克风打开指令、音量调大指令、音量调小指令以及麦克风关闭指令。本发明,通过对现有的语音截屏功能进行完善,反复的对截屏语音指令进行训练,提高了语音截屏功能的灵敏度,特别是遇到在不同的场景下,移动终端仍能保持一个快速并准确的截屏模式,给使用者进一步带来了许多的便利。(The invention provides a screen capture method of an android client based on artificial intelligence and voice recognition, and relates to the technical field of intelligent terminals. The screen capturing method of the android client based on artificial intelligence and voice recognition comprises the following steps: s1, recording a voice screen capture instruction: entering a voice recognition module built in the intelligent mobile terminal system, recording a voice instruction for screen capturing, and storing the voice instruction in the voice recognition module; s2, sound control microphone: and inserting a microphone adjusting related voice instruction into the voice recognition module, wherein the instruction comprises a microphone opening instruction, a volume increasing instruction, a volume decreasing instruction and a microphone closing instruction. According to the invention, the existing voice screen capturing function is perfected, the screen capturing voice command is repeatedly trained, the sensitivity of the voice screen capturing function is improved, especially in different scenes, the mobile terminal can still maintain a quick and accurate screen capturing mode, and a lot of convenience is further brought to users.)

技术领域

本发明涉及智能终端

技术领域

，具体为一种安卓客户端基于人工智能与语音识别的截屏方法。

背景技术

随着智能终端的迅速发展，具有移动操作系统的智能手机的迅速发展，安卓手机已经占据相当大的市场份额，移动应用的爆发使得截屏操作成为智能终端必不可少的功能。解放双手，实现一种更便利，更智能的语音指令截屏方案迫在眉睫。

目前，在市面上也出现了相关语音截屏的智能设备，确实给我们的生活带来了许多的便利，但是，通过使用发现，现有的语音截屏功能存在一个灵敏度较差的问题，特别是遇到在不同的场景下，经常无法触发截屏模式，给使用者带来了一定的不便。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种安卓客户端基于人工智能与语音识别的截屏方法，解决了现有技术中存在的缺陷与不足。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：一种安卓客户端基于人工智能与语音识别的截屏方法，所述截屏方法包括以下步骤：

S1、录制语音截屏指令：进入智能移动终端系统内置的语音识别模块，录制用来截屏的语音指令，存放于语音识别模块，在语音识别模块录制语音过程中同一语音指令至少录制三遍；

S2、声控麦克风：在语音识别模块中插入麦克风调整相关语音指令，其指令包括麦克风打开指令、音量调大指令、音量调小指令以及麦克风关闭指令，在需要截屏的时候，通过发送语音指令打开麦克风；

S3、训练录制的截屏语音指令：录制多个不同用户的截屏语音指令，在不同场景下触发该截屏语音指令，训练截屏语音指令的识别度；

S4、测试麦克风识别语音截屏指令：通过麦克风输入截屏语音指令，语音识别模块判断输入语音指令和样本语音指令相似度匹配程度，麦克风接收到语音输入之后，与步骤一种录制好的语音指令进行相似度分析，判断两者匹配程度；

S5、输出语音指令匹配结果：当语音识别模块通过语义分析比较两者为同一指令时，调用系统截屏模块截取屏幕画面，若分析比较两者不为同一指令时其它截屏模式。

优选的，所述步骤1中对于同一用户在语音识别模块录制语音过程中同一语音指令录制不少于三遍，同时每一遍录制时，移动智能终端生成不同的场景音效，在多遍录制之后，相识度在90％以上即录制成功；

所述录制过程采用TensorFlow或keras框架实现对录制过程中的语音进行监督学习模型的构建。

优选的，所述步骤1中录制语音截屏指令时可以选择添加新的用户，录制的不同用户的截屏语音指令可以共存，在同一台移动终端上触发截屏的语音指令。

优选的，所述步骤3中训练录制的截屏语音指令时，包括以下步骤：

1)将同一终端上所有用户录制的截屏语音指令存储于移动终端系统中，将所有的指令建立一个指令数据库；

2)在建立完指令数据库之后，通过麦克风调整相关语音指令打开麦克风，然后输入截屏语音指令，并判断移动终端是否触发截屏模式；

3)针对同一用户的截屏语音指令，设置不同的场景音效，然后再次输入截屏语音指令，并判断移动终端是否触发截屏模式；

4)对所有用户的截屏语音指令进行反复训练，直到移动终端触发截屏模式概率达到90％以上。

优选的，所述步骤4中在测试麦克风识别语音截屏指令时，若存在发送真实指令但无法触发截屏模式的情况，则进入步骤3中再次进行训练。

优选的，所述步骤5中其它截屏模式包括选择移动终端自带的其它截图方式，也可选择利用其他用户的语音指令进行触发截屏模式。

优选的，所述监督学习模型选择为Tri-training，其中Tri-training模型训练包括以下步骤：

1)对录制语音进行重采样，以获得多个有标记的录制语音样本；

2)从每个录制语音样本中产生一个分类器；

3)若两个分类器将某个录制语音样本预测为正类,而第三个分类器预测为反类,则该录制语音样本被作为伪标记正样本提供给第三个分类器进行学习；

4)最终三个分类器通过投票机制作为一个分类器集成进行使用。

(三)有益效果

本发明提供了一种安卓客户端基于人工智能与语音识别的截屏方法。具备以下有益效果：

本发明，通过对现有的语音截屏功能进行完善，反复的对截屏语音指令进行训练，提高了语音截屏功能的灵敏度，特别是遇到在不同的场景下，移动终端仍能保持一个快速并准确的截屏模式，给使用者进一步带来了许多的便利。

附图说明

图1为本发明流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例：

如图1所示，本发明实施例提供一种安卓客户端基于人工智能与语音识别的截屏方法，所述截屏方法包括以下步骤：

对于同一用户在语音识别模块录制语音过程中同一语音指令录制不少于三遍，同时每一遍录制时，移动智能终端生成不同的场景音效，在多遍录制之后，相识度在90％以上即录制成功；录制过程采用TensorFlow或keras框架实现对录制过程中的语音进行监督学习模型的构建；录制语音截屏指令时可以选择添加新的用户，录制的不同用户的截屏语音指令可以共存，在同一台移动终端上触发截屏的语音指令；

S3、训练录制的截屏语音指令：录制多个不同用户的截屏语音指令，在不同场景下触发该截屏语音指令，训练截屏语音指令的识别度；

1)将同一终端上所有用户录制的截屏语音指令存储于移动终端系统中，将所有的指令建立一个指令数据库；

2)在建立完指令数据库之后，通过麦克风调整相关语音指令打开麦克风，然后输入截屏语音指令，并判断移动终端是否触发截屏模式；

3)针对同一用户的截屏语音指令，设置不同的场景音效，然后再次输入截屏语音指令，并判断移动终端是否触发截屏模式；

4)对所有用户的截屏语音指令进行反复训练，直到移动终端触发截屏模式概率达到90％以上；

S4、测试麦克风识别语音截屏指令：通过麦克风输入截屏语音指令，语音识别模块判断输入语音指令和样本语音指令相似度匹配程度，麦克风接收到语音输入之后，与步骤一种录制好的语音指令进行相似度分析，判断两者匹配程度，测试麦克风识别语音截屏指令时，若存在发送真实指令但无法触发截屏模式的情况，则进入步骤3中再次进行训练；

S5、输出语音指令匹配结果：当语音识别模块通过语义分析比较两者为同一指令时，调用系统截屏模块截取屏幕画面，若分析比较两者不为同一指令时其它截屏模式，其它截屏模式包括选择移动终端自带的其它截图方式，也可选择利用其他用户的语音指令进行触发截屏模式。

本发明中，监督学习模型选择为Tri-training，其中Tri-training模型训练包括以下步骤：

1)对录制语音进行重采样，以获得多个有标记的录制语音样本；

2)从每个录制语音样本中产生一个分类器；

3)若两个分类器将某个录制语音样本预测为正类,而第三个分类器预测为反类,则该录制语音样本被作为伪标记正样本提供给第三个分类器进行学习；

4)最终三个分类器通过投票机制作为一个分类器集成进行使用。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个引用结构”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

8页详细技术资料下载

一种安卓客户端基于人工智能与语音识别的截屏方法

相关技术

网友询问留言