关键词检测方法和装置、电子设备、存储介质

文档序号：1921695 发布日期：2021-12-03 浏览：15次 >En<

阅读说明：本技术 关键词检测方法和装置、电子设备、存储介质 (Keyword detection method and device, electronic equipment and storage medium ) 是由俞皓于 2021-09-07 设计创作，主要内容包括：本实施例提供一种关键词检测方法和装置、电子设备、存储介质,属于人工智能技术领域。该方法包括：根据预先设置的登录脚本中的路径信息,识别出查询系统的登录页面,将登录脚本中的登录信息输入到登录页面,以登录查询系统,本实施例不需要用户手动找到登录页面,且不需要用户手动输入登录信息来登录查询系统,实现了自动登录查询系统的功能,在登录查询系统后,自动对查询系统的浏览页面进行截图处理,得到目标页面截图,接着对目标页面截图进行文字识别,识别出目标文字,最后将目标文字与预设的关键词进行匹配,得到与关键词对应的检测结果,用户根据检测结果就能了解查询系统是否包含关键词,提高关键词的检测效率。(The embodiment provides a keyword detection method and device, electronic equipment and a storage medium, and belongs to the technical field of artificial intelligence. The method comprises the following steps: according to the method, the login page of the query system is identified according to the preset path information in the login script, the login information in the login script is input into the login page to log in the query system, a user does not need to manually find the login page in the embodiment, and the user does not need to manually input the login information to log in the query system, so that the function of automatically logging in the query system is realized.)

技术领域

本申请涉及人工智能技术领域，尤其涉及一种关键词检测方法和装置、电子设备、存储介质。

背景技术

随着互联网技术的快速发展，大数据时代下的互联网信息呈指数型增长，大量信息资源通过网络服务共享，其中，浏览系统网站，是当下使用率最高的网络服务之一。为了进一步对系统进行优化，例如对查询系统进行优化，需要对查询系统的页面进行关键词的检测。目前，主要是通过人工的方式对查询系统的页面进行关键词检测，需要用户手动登录查询系统、手动找到需要进行关键词检测的页面，还需要人工检查页面中是否包含关键词信息，但是这样会导致关键词检测效率不高。因此，亟需一种对关键词检测效率更高的方法。

发明内容

本公开实施例的主要目的在于提出一种关键词检测方法和装置、电子设备、存储介质，能够提高关键词检测的效率。

为实现上述目的，本公开实施例的第一方面提出了一种关键词检测方法，包括：

根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，路径信息用于指示登录查询系统的登录页面的路径；

按照登录脚本中的登录信息登录查询系统；

在查询系统的浏览页面进行截图处理，以得到目标页面截图；

对目标页面截图进行文字识别，以识别出目标文字；

将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果。

在一些实施例，根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，包括：

根据路径信息识别出登录页面的登录按钮；

按照登录脚本中的登录信息登录查询系统，包括：

调用登录脚本中的登录信息，并填充到登录页面中预设的登录框中；

通过登录脚本触发登录按钮，以登录查询系统。

在一些实施例，根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，包括：

根据路径信息识别出登录页面的登录按钮；

按照登录脚本中的登录信息登录查询系统，包括：

在将登录脚本中的登录信息输入到登录页面情况下，通过登录脚本触发登录按钮，以登录查询系统。

在一些实施例，登录页面包括账号输入框和密码输入框，登录信息包括登录账号和登录密码，按照登录脚本中的登录信息登录查询系统，包括：

将登录账号和登录密码分别输入账号输入框和密码输入框，以登录查询系统。

在一些实施例，登录页面还包括验证码输入框，在登录查询系统之前，方法还包括：

将预设的万能验证码输入验证码输入框。

在一些实施例，在查询系统的浏览页面进行截图处理，以得到目标页面截图，包括：

进入查询系统的一级菜单界面；

确定一级菜单界面中的当前菜单是否被浏览过；

如果当前菜单没有被浏览过，则打开当前菜单下的全部二级菜单；

将当前菜单下的全部二级菜单的页面截图作为目标页面截图。

在一些实施例，对目标页面截图进行文字识别，以识别出目标文字，包括：

对当前菜单的全部二级菜单的页面截图进行文字识别，以识别出目标文字。

在一些实施例，对目标页面截图进行文字识别，以识别出目标文字，包括：

对目标页面截图进行二值化处理，得到二值化图像；

根据像素灰度值从二值化图像中提取目标字符信息；

将目标字符信息与预设字符信息进行比对，得到比对结果；

若字符信息与预设字符信息相同，则将字符信息转换成目标文字。

在一些实施例，根据像素灰度值从二值化图像中提取目标字符信息，包括：

根据像素灰度值将二值化图像分为多个初始区域；其中初始区域的所有像素的像素灰度值相同；

从多个初始区域中提取像素灰度值为零的区域，作为文字区域；

对文字区域进行文字识别，得到初始字符信息；

根据文字区域的字符间隔情况，对初始字符信息进行分割处理，得到目标字符信息。

在一些实施例，将目标文字与预设的关键词进行匹配，以得到关键词对应的检测结果，包括：

获取预设的关键词；

根据目标文字的文字排序顺序依次获取目标文字的单个文字；

将目标文字的每一单个文字与关键词进行匹配，以得到匹配结果；

若匹配结果为查找到与关键词一致的目标文字，则得到对应的关键词的目标文字。

本公开实施例的第二方面提出了一种关键词检测装置，包括：登录模块和检测模块，其中登录模块具体用于：

根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，路径信息用于指示登录查询系统的登录页面的路径；

按照登录脚本中的登录信息登录查询系统；

检测模块具体用于：

在查询系统的浏览页面进行截图处理，以得到目标页面截图；

对目标页面截图进行文字识别，以识别出目标文字；

将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果。

本公开实施例的第三方面提出了一种电子设备，电子设备包括存储器和处理器，其中，存储器中存储有程序，程序被处理器执行时处理器用于执行如本申请第一方面实施例任一项的方法。

本公开实施例的第四方面提出了一种计算机可读存储介质，其中，存储器中存储有程序，程序被处理器执行时处理器用于执行如本申请第一方面实施例任一项的方法。

本公开实施例提出的关键词检测方法和装置、电子设备、存储介质，属于人工智能技术领域。该方法包括：根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，将登录脚本中的登录信息输入到登录页面，以登录查询系统，本实施例不需要用户手动找到登录页面，且不需要用户手动输入登录信息来登录查询系统，实现了自动登录查询系统的功能，在登录查询系统后，自动对查询系统的浏览页面进行截图处理，得到目标页面截图，接着对目标页面截图进行文字识别，识别出目标文字，最后将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果，用户根据检测结果就能了解查询系统是否包含关键词，提高关键词的检测效率。也就是说，本申请方案中，通过自动登录查询系统，并在进入查询系统后通过自动获取页面截图，最终再识别出目标文字，都是自动化的实现的，大大提高了关键词的检测效率。

附图说明

图1是本公开实施例提供的关键词检测方法的流程图；

图2是图1中的步骤S300的流程图；

图3是图1中的步骤S400的流程图；

图4是本公开实施例提供的初始图像的示意图；

图5是对图4的初始图像进行处理后得到的二值化图像的示意图；

图6是图3中的步骤S420的流程图；

图7是对图5的二值化图像进行处理后得到的标签图像的示意图；

图8是本公开实施例提供的关键词检测装置的模块结构框图；

图9是本公开实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

首先，对本申请中涉及的若干名词进行解释：

UI自动化测试：使用工具或者脚本对需要测试的软件的前端界面在预设的条件下和已知的测试数据下运行系统或者应用程序，并获取其前端页面显示的数据结果进行校验，评估得出测试结论。

OCR(optical character recognition)文字识别：是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。

string：string是C++、java、VB等编程语言中的字符串，是用双引号引起来的几个字符，如“Abc”，“一天”，字符串是一个特殊的对象，属于引用类型。在java、C#中，String类对象创建后，字符串一旦初始化就不能更改，因为string类中所有字符串都是常量，数据是无法更改，由于string对象的不可变，所以可以共享。对String类的任何改变，都是返回一个新的String类对象。C++标准库中string类以类型的形式对字符串进行封装，且包含了字符序列的处理操作。

java关键词(keywords)：是电脑语言里事先定义的，有特别意义的标识符，有时又叫保留字，还有特别意义的变量。Java的关键词对Java的编译器有特殊的意义，他们用来表示一种数据类型，或者表示程序的结构等，关键词不能用作变量名、方法名、类名、包名和参数。

可扩展标记语言路径语言(Xml Path Language，XPath)：它是一种用来确定XML文档中某部分位置的语言，XPath基于XML的树状结构，提供在数据结构树中找寻节点的能力。

脚本(Script)：脚本语言又被称为扩建的语言，或者动态语言，脚本语言是一种编程语言，用来控制软件应用程序，脚本通常是以文本保存，只是在被调用时进行解释或者编译。

web应用程序：是一种可以通过Web访问的应用程序，程序的最大好处是用户很容易访问应用程序，用户只需要有浏览器即可，不需要再安装其他软件。

大津法(otsu)：是一种确定图像二值化分割阈值的算法，从大津法的原理上来讲，该方法又称作最大类间方差法，因为按照大津法求得的阈值进行图像二值化分割后，前景与背景图像的类间方差最大，它是按图像的灰度特性，将图像分成背景和前景两部分。因方差是灰度分布均匀性的一种度量，背景和前景之间的类间方差越大，说明构成图像的两部分的差别越大，当部分前景错分为背景或部分背景错分为前景都会导致两部分差别变小。因此，使类间方差最大的分割意味着错分概率最小。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

基于此，本公开实施例提供一种关键词检测方法和装置、电子设备、存储介质，能够提高关键词的检测效率。

本公开实施例提供的关键词检测方法和装置、电子设备、存储介质，具体通过如下实施例进行说明，首先描述本公开实施例中的关键词检测方法。

本公开实施例提供的关键词检测方法，涉及人工智能技术领域。本公开实施例提供的关键词检测方法可应用于终端中，也可应用于服务器端中，还可以是运行于终端或服务器端中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑、台式计算机或者智能手表等；服务器端可以配置成独立的物理服务器，也可以配置成多个物理服务器构成的服务器集群或者分布式系统，还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network，CDN)以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是实现关键词检测方法的应用等，但并不局限于以上形式。

本公开实施例可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

参照图1，根据本公开实施例的关键词检测方法，包括但不限于步骤S100至步骤S500。

S100，根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面；

S200，按照登录脚本中的登录信息登录查询系统；

S300，在查询系统的浏览页面进行截图处理，以得到目标页面截图；

S400，对目标页面截图进行文字识别，以识别出目标文字；

S500，将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果。

在步骤S100中，根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，其中，脚本就是一条条的文字命令，这些文字命令是可以看到的，脚本程序在执行时，是由系统的一个解释器，将其一条条的翻译成机器可识别的指令，并按程序顺序执行，在本申请实施例中，登录脚本就是用于登录查询系统的登录页面的文字命令，登录脚本的内容包括登录页面的路径信息，路径信息是用于指示登录查询系统的登录页面的路径，即登录页面的网页地址，登录页面指的是用于登录查询系统的页面。例如，登录脚本中用于登录的文字命令为：通过登录脚本存储的XPath，获取登录页面的网页地址，接着输入登录页面的网页地址，跳转至查询系统的登录页面。其中，查询系统可以是商标查询系统，商标查询系统具体可以是商标局的商标查询系统，也可以是其他第三方公司开发的商标查询系统，通过对商标查询系统进行关键词检测，能够预防商标的侵权，需要说明的是，查询系统还可以是专利查询系统或著作权查询系统，本申请实施例的查询系统并不局限于以上所举例的查询系统。

在步骤S200中，将登录脚本中的登录信息输入到登录页面，以登录查询系统，其中，登录信息指：在登录所述查询系统之前，需要在登录页面的页面元素中所要填写的信息，页面元素包括但不限于在登录页面上所显示的所有要素，例如图像、文本框、按钮、下拉列表、视频等，在登录页面中填写好登录信息后，才能登录查询系统。

在一些实施例中，根据登录脚本登录查询系统的步骤为：根据路径信息识别出登录页面的登录按钮，调用登录脚本中的登录信息，并填充到登录页面中预设的登录框中；通过登录脚本触发登录按钮，以登录查询系统。其中，根据路径信息识别出登录页面的登录按钮的过程具体为：获取登录按钮的属性信息，属性信息为能够唯一标识登录按钮的信息，比如登录按钮的ID、登录按钮的名称等，接着根据属性信息从路径信息中获取登录按钮的按钮路径，根据按钮路径识别登录按钮，需要说明的是，路径信息中包含了各页面元素的属性信息以及元素在页面中对应的元素位置。

在一些实施例中，步骤S100提到的路径信息为：登录页面中用于指示登录按钮在登录页面所在位置的路径，根据登录按钮的路径信息能够识别出登录页面的登录按钮，在登录脚本中的登录信息输入到登录页面的情况下，通过登录脚本的文字命令在登录按钮上触发click操作，以实现登录，需要说明的是，click操作相当于“点击”操作。

在一些实施例中，登录页面包括账号输入框和密码输入框，登录信息包括登录账号和登录密码，在登录页面中，将登录账号和登录密码分别输入账号输入框和密码输入框，以登录查询系统。

在一些实施例中，在登录查询系统之前，除了要在登录页面输入登录账号和登录密码之外，还需要在验证码输入框输入预设的万能验证码，以登录查询系统，其中，对于web应用来说，大部分的系统在用户登录时都要求用户输入验证码，验证码的类型的很多，例如字母、数字、汉字等，对于系统来说，使用验证码可以有效地防止采用机器猜测方法对口令的刺探，在一定程度上增加了安全性，由于大部分系统中的验证码是随机产生的，并不是一个固定的值，对于本申请实施例中的自动化登录，如果采用常规的方式去识别登录页面中的验证码，会导致过程繁琐，如果直接把验证码去掉，则会给查询系统带来一定的风险，考虑到以上情况，本申请实施例通过预设的万能验证码进行验证，万能验证码指的是，预先将验证码设置为某个特定的值，例如“ab13c”，只要用户在输入框输入预设的万能验证码“ab13c”，程序就自动认为验证通过，如果用户在输入框输入的不是预先设置的万能验证码，则按照原先的验证码验证方式进行验证，即保证查询系统的安全性，又能减少不必要的验证码识别步骤。

在步骤S300中，在查询系统的浏览页面进行截图处理，以得到目标页面截图，浏览页面指的是在查询系统中能够显示的网页，在实际应用中，对浏览页面进行截图可以采用以下方式：利用程序中自带的方法，对整个浏览页面进行截图，并将得到的目标页面截图保存在指定路径下，为了避免图像名称的重复，可以同时以日期和时间的格式对图像进行命名，例如可以将某个目标页面截图命名为“20210720-163656.png”，需要说明的是，对图像命名的方式不限于上述步骤，本领域技术人员还可以根据实际需求以图像的尺寸、类型等进行命名，在此不再赘述。

在一些实施例中，如图2所示，步骤S300包括但不限于步骤S310至步骤S340：

S310，进入查询系统的一级菜单界面；

S320，确定一级菜单界面中的当前菜单是否被浏览过；

S330，如果当前菜单没有被浏览过，则打开当前菜单下的全部二级菜单；

S340，获取当前菜单下的全部二级菜单的页面截图；

在步骤S310至步骤S320中，进入查询系统的一级菜单界面，一级菜单界面指的是查询系统的主菜单，确定一级菜单界面中的当前菜单是否被浏览过，如果当前菜单没有被浏览过，则打开当前菜单下的全部二级菜单，并获取当前菜单下的全部二级菜单的页面截图，二级菜单是指主菜单的子菜单，需要说明的是，菜单栏实际是一种树形结构，子菜单是菜单栏的一个分支，子菜单指的是主菜单里面某个项目里包含的选项。例如菜单1里有4个选项，分别是“选项1”，“选项2”，“选项3”，“选项4”，查看“选项2”时，里面有“子菜单1”，“子菜单2”，“子菜单3”，“子菜单4”，“子菜单1”，“子菜单2”，“子菜单3”，“子菜单4”，就构成了“选项2”的子菜单，如果当前菜单并没有被浏览过，说明当前菜单下的二级菜单均没有被浏览过，需要对二级菜单的所有页面进行截图，如果当前菜单已经被浏览过，则说明当前菜单下的二级菜单全部或部分被浏览过，需要进一步确定二级菜单是否被浏览过，对未浏览过的二级菜单进行截图，需要说明的是，某个菜单界面被浏览时，可以标记该菜单界面为的浏览状态为已浏览状态，以便根据浏览状态判断某个菜单界面是否被浏览过。

在步骤S400中，对目标页面截图进行文字识别，以识别出目标文字，目标文字为对目标页面截图进行文字识别后，识别出来的文字，在实际应用中，可通过OCR技术对目标页面截图进行文字识别。

在一些实施例中，对步骤S340中提到的当前菜单的全部二级菜单的页面截图进行文字识别，得到每个页面对应的目标文字。

在一些实施例中，如图3所示，步骤S400包括但不限于步骤S410至步骤S440：

S410，对目标页面截图进行二值化处理，得到二值化图像；

S420，根据像素灰度值从二值化图像中提取目标字符信息；

S430，将目标字符信息与预设字符信息进行比对，得到比对结果；

S440，若字符信息与预设字符信息相同，则将字符信息转换成目标文字。

在步骤S410中，对目标页面截图进行处理，得到二值化图像，即对目标页面截图进行图像的预处理操作，可以采用otsu算法对图像进行二值化处理，即通过合适的分割阈值将目标页面截图分割成2组，将一组灰度，例如灰度值为0对应为目标，将另一组灰度，例如灰度值为255对应为背景，根据目标和背景得到二值化图像。

在一些实施例中，在实际应用中，对目标页面截图进行处理，得到二值化图像的具体过程如下，需要理解的是，下面描述仅是示例性说明，而不是对本申请的具体限制。

步骤一：初始化目标页面截图的参数，具体为：将目标页面截图的目标和背景的分割阈值定为t，目标点数占目标页面截图的比例为W0，平均灰度为U0，背景点数占目标页面截图的比例为W1，平均灰度为U1。

步骤二：计算目标点数占目标页面截图的比例和背景点数占目标页面截图的比例，具体为：若目标页面截图的大小为M*N，目标页面截图中像素的灰度值小于t的像素个数为N0，像素灰度大于t的像素个数为N1则W0＝N0/(M*N)、W1＝N1/(M*N)。

步骤三：计算目标页面截图的总平均灰度以及目标和背景的方差和总平均灰度，具体地：目标页面截图的总平均灰度U＝W0*U0+W1*U1，将目标页面截图的目标和背景的方差设为g＝W0(U0-U)(U0-U)+W1(U1-U)(U1-U)，将U＝W0*U0+W1*U1代入后，得到目标页面截图的目标和背景的方差值为g＝W0*W1*(U0-U1)(U0-U1)。

步骤四：通过遍历的方式，求出目标页面截图的目标和背景的方差g在最大值时，t的取值。

步骤五：将目标页面截图中小于t的像素的灰度值置为0(对应目标)，将大于t的像素的灰度值置为255(对应背景)。

下面以一个具体实施例进行举例说明，对目标页面截图进行预处理的过程，为了方面描述，在下文中，将目标页面截图命名为初始图像，需要理解的是，下面描述仅是示例性说明，而不是对本申请的具体限制。

步骤一：对图4中6*6像素的初始图像进行灰度检测后，如表1所示，表1为初始图像中每个像素的灰度值：

0	0	51	204	204	255
						0	51	153	204	153	204
51	153	204	102	51	153
						204	204	153	51	0	0
255	204	102	51	0	0
						255	255	204	153	51	0

表1

步骤二，将分割阈值设置为153，计算阈值即t＝153的情况，具体为：

计算目标点数占初始图像的比例W0为：W0＝N0/(M*N)＝17/36＝0.4722；计算目标点数占初始图像的平均灰度U0为：U0＝(0*8+51*7+102*2)/17＝33；计算背景点数占初始图像的比例W1为：W1＝N1/(M*N)＝19/36＝0.5278；计算背景点数占初始图像的平均灰度U1为：U1＝(153*6+204*9+255*4)/19＝198.6316；计算初始图像的目标和背景的方差g为：g＝W0*W1*(U0-U1)(U0-U1)＝0.4722*0.5278*165.6316*165.6316＝6837.254。

步骤三：根据步骤二得到的数据判断，在t＝153时，g最大为6837.254，将小于153的像素，灰度值都置为0(对应目标)，将大于t的像素，灰度值置为255(对应背景)，以得到二值化图像，具体的二值化图像如图5所示。

在一些实施例中，如图6所示，步骤S420包括但不限于步骤S421至步骤S424：

S421，根据像素灰度值将二值化图像分为多个初始区域；

S422，从多个初始区域中提取像素灰度值为零的区域，作为文字区域；

S423，对文字区域进行文字识别，得到初始字符信息；

S424，根据文字区域的字符间隔情况，对初始字符信息进行分割处理，得到目标字符信息。

在步骤S421至步骤S422中，根据二值化图像中各像素的灰度值，得到二值化图像的文字区域，其中初始区域的所有像素的像素灰度值相同，进一步的，文字区域的像素灰度值为零，具体为，对二值化图像进行扫描，在二值化图像中获取灰度值相同的连通区域，对该区域下的各像素赋予相同的标签值，通过在不同的连通区域设置不同的标签值，来区分不同的连通区域，本申请实施例提到的连通区域为二值化图像的文字区域。

下面以一个具体实施例进行举例说明，对二值化图像进行文字区域划分的过程，需要理解的是，下面描述仅是示例性说明，而不是对本申请的具体限制。

步骤一，对图5中的二值化图像的每一行像素(图5的二值化图像包括5行像素)进行第一次扫描，需要说明的是，[x,y]表示在二值化图像中某些像素的相对坐标点或者坐标区域，例如当x＝1,y＝3时，[1,3]表示在初始图像中第一行像素中的第1个像素、第2个像素和第3个像素，Label为标签值。对二值化图像具体的扫描结果为，第一行：一共有1个团(表示第一行的像素中，只有一个连通区域的像素为0)，即[1,3],将Label标记为1；第二行：一共有1个团，即[1，2],由于第二行的团与第一行的团有连续，故第二行的Label也标记为1，表示第二行的团与第一行的团能够组成一个连通区域；第三行：一共有两个团，即[1,1]和[4,5],由于第三行的第一个团和第二行的团有连续，故将第三行的第一个团的Label标记为1，由于第三行的第二个团与其余的团都不连续，为了区分，将第三行的第二个团的Label标记为2；第四行：一共有1个团，即[4,6]，由于第四行的团与第三行的第二个团有连续，故将第四行的Label标记为2；第五行：一共有两个团，分别为[3,3]和[4,6]，由于第一个团[3,3]与上一行没有连续，故标记Label为3，由于第二个团[4,6]与上一行有连续，故标记Label为2；第六行：一共有一个团，即[5,6]，由于这个团与第五行的第二个团有连续，故标记Label为2，由此对二值化图像进行第一遍扫描完成。

步骤二，基于步骤一的图像，进行第二次扫描，具体为：对第一遍扫描的结果进行优化，判断第一遍扫描中每个团之间是否还能进行连通，对可以连通但是标签值不一致的团，进行标签值的修正，例如：第一遍扫描中，将第五行的第一个团的Label标记为3，在进行第二遍扫描中，能够检测出，第五行的第一个团与第二个团是连通的，但是标签值却不一致，需要对第五行的第一个团的Label修改为2，以得到准确的标签图像，如图7所示，可以根据标签值Label确定二值化图像包含的两个文字区域。

在步骤S423至步骤S424中，对文字区域进行文字识别，得到初始字符信息，具体为：检测步骤S421的文本区域中每一行文本的开始位置和结束位置，并通过文本区域中各个像素的坐标，采用最小二乘法拟合基线，即将基线位于像素点最密集的位置，找到二值化图像中，每一行的排列情况，利用ORC对每一行的字符进行识别，得到初始字符信息，根据文字区域的字符间隔情况，对初始字符信息进行分割处理，得到目标字符信息，将目标字符信息

在步骤S430至步骤S440中，将目标字符信息与预设的字符信息进行比对，得到比对结果，根据比对结果，得到目标文字。其中，预设的字符信息可以指存储多种字符的字符库，将目标字符信息与字符库中的字符进行比对，如果比对的结果为相同，则表示目标字符信息与字符库中的字符一致，可以将目标字符文字转换为目标文字，例如，目标字符信息为“好”，如果字符库中存储有字符信息为“好”，在比对的过程中，发现目标字符信息与预设的字符信息一致，则可以认为目标字符信息所对应的目标文字为“好”，如果在预设的字符信息中没有匹配到与目标字符信息一致的字符信息，则考虑对目标字符信息进行二次切割，将错误分割的字符重新进行合并，再进行字符精细的切分，精细切分完成后，再与字符库的字符进行比对，重新识别字符，从而完成基于ORC识别图像的过程。

在步骤S500中，将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果，预设的关键词为用户预先设置好的，例如，将预设的关键词设置为“测试”，当目标文字中包含“测试”，就认为目标文字包含关键词，此外，本申请实施例还能对目标文字中包含关键词的位置进行定位，从而方便用户依据关键词的位置，在查询系统中找到对应的页面，对关键词进行修改，本申请实施例中预设的关键词还能够支持全局配置，即通过修改全局参数就能够进行关键词的修改，支持动态配置，当关键词修改后，系统仍然可以根据修改后的关键词进行自动化检测。

在一些实施例中，步骤S500具体包括步骤：获取预设的关键词，根据目标文字的文字排序顺序依次获取目标文字的单个文字，将目标文字的每一单个文字与关键词进行匹配，以得到匹配结果；若匹配结果为查找到与关键词一致的目标文字，则得到对应的关键词的目标文字，需要说明的是，在本申请实施例中，若能在目标文字找到与关键词一致的目标文字，则检测结果为与关键词一致的目标文字，若不能在目标文字中找到与关键词一致的目标文字，则检测结果为失败，即目标文字没有包含关键词。

本公开实施例提出关键词检测方法，能够根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，将登录脚本中的登录信息输入到登录页面，以登录查询系统，本实施例不需要用户手动找到登录页面，且不需要用户手动输入登录信息来登录查询系统，实现了自动登录查询系统的功能，在登录查询系统后，自动对查询系统的浏览页面进行截图处理，得到目标页面截图，接着对目标页面截图进行文字识别，识别出目标文字，最后将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果，用户根据检测结果就能了解查询系统是否包含关键词，提高关键词的检测效率。

本公开实施例还提供一种关键词检测装置600，可以实现上述关键词检测方法，如图8所示，该装置包括：登录模块601和检测模块602；

其中，登录模块601具体用于：根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，路径信息用于指示登录查询系统的登录页面的路径；将登录脚本中的登录信息输入到登录页面，以登录查询系统；

检测模块602具体用于：在查询系统的浏览页面进行截图处理，以得到目标页面截图；对目标页面截图进行文字识别，以识别出目标文字；将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果。

本公开实施例提出的关键词检测装置600，通过实现上述关键词检测方法，根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，将登录脚本中的登录信息输入到登录页面，以登录查询系统，本实施例不需要用户手动找到登录页面，且不需要用户手动输入登录信息来登录查询系统，实现了自动登录查询系统的功能，在登录查询系统后，自动对查询系统的浏览页面进行截图处理，得到目标页面截图，接着对目标页面截图进行文字识别，识别出目标文字，最后将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果，用户根据检测结果就能了解查询系统是否包含关键词，提高关键词的检测效率。

本公开实施例还提供了一种电子设备，包括：电子设备包括存储器和处理器，其中，存储器中存储有程序，程序被处理器执行时处理器用于执行如本申请实施例任一项的方法。

下面结合图9对电子设备的硬件结构进行详细说明，电子设备可以包括处理器701和存储器702。

处理器701，可以采用通用的中央处理器(Central Processing Unit，CPU)、微处理器、应用专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本公开实施例所提供的技术方案；

存储器702，可以采用只读存储器(ReadOnlyMemory，ROM)、静态存储设备、动态存储设备或者随机存取存储器(RandomAccessMemory，RAM)等形式实现。存储器702可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器702中，并由处理器701来调用执行本公开实施例的关键词检测方法；

该电子设备还可以包括输入/输出接口703、通信接口704和总线705。

输入/输出接口703，用于实现信息输入及输出；

通信接口704，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信；和

总线705，在设备的各个组件(例如处理器701、存储器702、输入/输出接口703和通信接口704)之间传输信息；

其中处理器701、存储器702、输入/输出接口703和通信接口704通过总线705实现彼此之间在设备内部的通信连接。

本公开实施例还提供一种存储介质，存储器中存储有程序，程序被处理器执行时处理器用于执行如本申请实施例任一项的方法。

本公开实施例提出的关键词检测方法和装置、电子设备、存储介质，根据预先设置的登录脚本中的路径信息，识别出查询系统的登录页面，将登录脚本中的登录信息输入到登录页面，以登录查询系统，本实施例不需要用户手动找到登录页面，且不需要用户手动输入登录信息来登录查询系统，实现了自动登录查询系统的功能，在登录查询系统后，自动对查询系统的浏览页面进行截图处理，得到目标页面截图，接着对目标页面截图进行文字识别，识别出目标文字，最后将目标文字与预设的关键词进行匹配，得到与关键词对应的检测结果，用户根据检测结果就能了解查询系统是否包含关键词，提高关键词的检测效率。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本公开实施例描述的实施例是为了更加清楚的说明本公开实施例的技术方案，并不构成对于本公开实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本公开实施例提供的技术方案对于类似的技术问题，同样适用。

本领域技术人员可以理解的是，图1-3、图6中示出的技术方案并不构成对本公开实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序的介质。

以上参照附图说明了本公开实施例的优选实施例，并非因此局限本公开实施例的权利范围。本领域技术人员不脱离本公开实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本公开实施例的权利范围之内。

20页详细技术资料下载

0	0	51	204	204	255
						0	51	153	204	153	204
51	153	204	102	51	153
						204	204	153	51	0	0
255	204	102	51	0	0
						255	255	204	153	51	0

0	0	51	204	204	255
						0	51	153	204	153	204
51	153	204	102	51	153
						204	204	153	51	0	0
255	204	102	51	0	0
						255	255	204	153	51	0

关键词检测方法和装置、电子设备、存储介质

相关技术

网友询问留言

0	0	51	204	204	255
						0	51	153	204	153	204
51	153	204	102	51	153
						204	204	153	51	0	0
255	204	102	51	0	0
						255	255	204	153	51	0