一种网页页面内容加密方法及设备

文档序号:153401 发布日期:2021-10-26 浏览:18次 >En<

阅读说明:本技术 一种网页页面内容加密方法及设备 (Webpage content encryption method and equipment ) 是由 高力 胡金涌 丁兆鹏 于 2020-04-23 设计创作,主要内容包括:本申请的目的是提供一种网页页面内容加密方法及设备,本申请通过获取用户的访问请求对应的网页页面内容;基于预置的页面加密配置信息,获得所述网页页面内容对应的网页页面的元素定位位置,并确定网页页面内容中的字体加密类型;从预设字体库中随机选择一目标字体库,并将目标字体库添加至网页页面内容中;按照所述字体加密类型,将所述网页页面内容中的元素定位位置上的页面内容,替换为目标字体库中的内容,实现了对网页页面的精确加密处理,不仅精准地保护了网页上的关键数据信息,起到防爬虫的效果,同时,对于正常通过浏览器进行访问的访客,也不存在误杀的风险,访客可看到网页上呈现的全部内容信息,提高用户体验。(The application aims to provide a webpage content encryption method and equipment, and webpage content corresponding to an access request of a user is obtained; based on preset page encryption configuration information, acquiring an element positioning position of a webpage corresponding to the webpage content, and determining a font encryption type in the webpage content; randomly selecting a target font library from a preset font library, and adding the target font library to the webpage content; according to the font encryption type, the page content on the element positioning position in the webpage content is replaced by the content in the target font library, so that the accurate encryption processing of the webpage is realized, the key data information on the webpage is accurately protected, the effect of preventing the crawler is achieved, meanwhile, the risk of mistaken killing does not exist for the visitor who normally visits through the browser, the visitor can see all content information presented on the webpage, and the user experience is improved.)

一种网页页面内容加密方法及设备

技术领域

本申请涉及计算机领域,尤其涉及一种网页页面内容加密方法及设备。

背景技术

现有技术中,随着互联网的发展,使用互联网进行购物、交易、社交、获知新闻信息等等的网民数量日益增多。互联网也逐渐成为经济发展、社会文明建设的重要途径。与此同时,互联网上暴露的海量数据,在各种利益的驱使下,通过未授权且有针对性的搜集程序进行网站数据爬取收集、整理、分析计算,最终用以非法竞争、非法盗用等等已牟取暴利。据相关的统计,互联网上,每天大约有80%的流量是由爬虫软件发起的。因此,对爬虫的识别和防护,可以有效保护网站业务,保护知识产权。然而,现有的防护爬虫的技术多是治标不治本的策略,仍然存在诸多缺点。

现有方案一:通过访问频率限制,限制爬取行为。存在如下缺点:1、易误杀正常访客,难以衡量出一个适当的频率阈值用于区分正常访客和爬虫的访问频率;2、防爬虫效果不佳,爬虫软件可进行频率调制,绕过设定的访问频率限制。现有方案二:通过浏览器行为验证识别爬虫访问,如cookie验证、javascript验证、验证码等浏览器行为验证策略。存在如下缺点:1、上述验证策略容易被爬虫软件绕过,很多的爬虫脚本或程序都可以具备cookie验证、js验证功能等;并且,现在有很多提供破解验证码的第三方服务,可以较为方便的破解验证码。2、用户访问网站时额外使用验证码,容易造成用户体检不佳。现有方案三:将访问网站的IP与已经构建好的IP库(即爬虫情报库)进行比对,识别出爬虫IP(Internet Protocol网际互连协议)从而实现防护。存在如下缺点:1、完全依赖于IP库,信息具有一定的延后性,从而不能及时的识别与防护爬虫攻击。2、爬虫IP容易绕过所述IP库,特别是在IP库不健全的时候,可以使用各种代理IP进行绕过。

因此,一种既可以保护互联网上的关键信息数据、又不影响正常访客的防爬虫方案是亟需的。

发明内容

本申请的一个目的是提供一种网页页面内容加密方法及设备,以解决现有技术中如何保护互联网中网页上关键数据信息,同时不影响正常访客对网页访问的问题。

根据本申请的一个方面,提供了一种网页页面内容加密方法包括:

获取用户的访问请求对应的网页页面内容;

基于预置的页面加密配置信息,获得所述网页页面内容对应的网页页面的元素定位位置,并确定所述网页页面内容中的字体加密类型;

从预设字体库中随机选择一目标字体库,并将所述目标字体库添加至所述网页页面内容中;

按照所述字体加密类型,将所述网页页面内容中的所述元素定位位置上的页面内容,替换为所述目标字体库中的内容。

进一步地,上述网页页面内容加密方法还包括:

从用户设备获取所述用户的网站业务需求;

根据所述网站业务需求为所述用户待获取的网页页面配置所述预置的页面加密配置信息和第一启用条件。

进一步地,上述网页页面内容加密方法中,获得所述网页页面内容对应的网页页面的元素定位位置,还包括:

对所述网页页面内容进行页面加密元素的定位以得到元素定位位置。

进一步地,上述网页页面内容加密方法中,所述获取用户的访问请求对应的网页页面内容之前,所述方法还包括:

开启所述用户请求访问的网页页面的内容加密功能;

判断所述用户请求访问的所述网页页面是否配置开启所述内容加密功能的第一启用条件,

若未配置,则系统默认所述用户请求访问的所述网页页面满足开启所述内容加密功能的第二启用条件;

若配置,则将所述用户请求访问的所述网页页面与配置的所述第一启用条件进行条件匹配。

进一步地,上述网页页面内容加密方法中,所述预置的页面加密配置信息包括第一页面加密元素范围配置信息和/或第一字体加密类型配置信息,其中,所述基于预置的页面加密配置信息,对所述网页页面内容进行页面加密元素的定位以得到元素定位位置,并确定所述网页页面内容中的字体加密类型,包括:

判断所述预置的页面加密配置信息中是否配置有页面加密元素范围,

若未配置,则按照系统默认的第二页面加密元素范围配置信息,对所述网页页面内容进行页面加密元素的定位以得到元素定位位置,

若配置,则按照所述第一页面加密元素范围配置信息,对所述网页页面内容进行页面加密元素的定位以得到元素定位位置;

基于所述第一字体加密类型配置信息,确定所述网页页面内容中的字体加密类型。

进一步地,上述网页页面内容加密方法中,所述基于所述第一字体加密类型配置信息,确定所述网页页面内容中的字体加密类型,包括:

判断所述预置的页面加密配置信息中是否配置有字体加密类型,

若未配置,则将系统默认的第二字体加密类型配置信息中配置的字体加密类型确定为所述网页页面内容中的字体加密类型;

若配置,则将所述第一字体加密类型配置信息中配置的字体加密类型确定为所述网页页面内容中的字体加密类型。

进一步地,上述网页页面内容加密方法还包括:

将所述网页页面内容替换后的新页面内容发送给所述用户对应的用户设备。

进一步地,上述网页页面内容加密方法还包括:

实时或周期性地对所述预设字体库中的各字体库进行更新。

根据本申请的另一方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行时,使所述处理器实现如上述任一项所述的方法。

根据本申请的另一方面,还提供了一种网页页面内容加密设备,该设备包括:

一个或多个处理器;

计算机可读介质,用于存储一个或多个计算机可读指令,

当所述一个或多个计算机可读指令被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述中任一项所述的方法。

与现有技术相比,本申请通过获取用户的访问请求对应的网页页面内容;基于预置的页面加密配置信息,获得所述网页页面内容对应的网页页面的元素定位位置,并确定所述网页页面内容中的字体加密类型;从预设字体库中随机选择一目标字体库,并将所述目标字体库添加至所述网页页面内容中;按照所述字体加密类型,将所述网页页面内容中的所述元素定位位置上的页面内容,替换为所述目标字体库中的内容,即通过将网页页面的元素定位位置上关键的数据信息(即页面内容)使用一目标字体库进行替换,实现了对网页页面的精确加密处理,不仅精准地保护了网页上的关键数据信息,使爬虫程序难以获取到想要爬取的网页页面的数据,从而起到防爬虫的效果,同时,对于正常通过浏览器进行访问的访客,也不存在误杀的风险,访客可看到网页上呈现的全部内容信息,提高用户体验。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1示出根据本申请一个方面的一种网页页面内容加密方法的流程示意图;

图2示出根据本申请一个方面的一种网页页面内容加密方法的模块交互示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本申请作进一步详细描述。

在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如中央处理器(Central Processing Unit,CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-Change RAM,PRAM)、静态随机存取存储器(Static Random Access Memory,SRAM)、动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory,EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Versatile Disk,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

图1示出根据本申请一个方面的一种网页页面内容加密方法的流程示意图,该方法适用于基于互联网的各种访问网站的场景,应用于网站访问的网站接入云平台或CDN(Content Delivery Network,内容分发网络)系统,该方法包括步骤S11、步骤S12、步骤S13及步骤S14,其中,具体包括:

步骤S11,获取用户的访问请求对应的网页页面内容;在此,获取所述用户的访问请求对应的网页页面内容的具体步骤可以包括如下步骤:如图2所示,首先,接收访问设备的访问请求;然后,基于访问请求向网站真实服务器转发访问请求,网站真实服务器获得与访问请求对应的网站页面内容,并将响应的与访问请求对应的网站页面内容发送给云平台或CDN系统节点,以完成对用户的访问请求对应的网站页面内容的获取。

步骤S12,基于预置的页面加密配置信息,获得所述网页页面内容对应的网页页面的元素定位位置,并确定所述网页页面内容中的字体加密类型,实现对所述网页页面内容的元素的定位和字体加密类型的确定。

步骤S13,从预设字体库中随机选择一目标字体库,并将所述目标字体库添加至所述网页页面内容中,如图2所示,在边缘服务器中的自定义字体库生成模块生成用于对网页页面的内容进行替换的预设字体库,以便后续在需要对网页页面的内容进行加密替换时,能够从所述预设字体库中随机选取一目标字体库进行需要加密的网页页面的内容的加密替换。

步骤S14,按照所述字体加密类型,将所述网页页面内容中的所述元素定位位置上的页面内容,替换为所述目标字体库中的内容。在此,所述目标字体库在浏览器上可以以图像的方式正常渲染出需要展示的数据信息(即网页页面内容中的所述元素定位位置上的页面内容),而对于爬虫程序获取到的则是一串随机的乱码数据,无法获取到正确的数据信息,从而达到防护爬虫爬取数据信息的目的,同时又不会影响正常访客对网站的访问,从根本上防护爬虫。

通过上述步骤S11至步骤S14,首先获取用户的访问请求对应的网页页面内容;然后基于预置的页面加密配置信息,获得所述网页页面内容对应的网页页面的元素定位位置,并确定所述网页页面内容中的字体加密类型;接着从预设字体库中随机选择一目标字体库,并将所述目标字体库添加至所述网页页面内容中;最后按照所述字体加密类型,将所述网页页面内容中的所述元素定位位置上的页面内容,替换为所述目标字体库中的内容。即通过将网页页面的元素定位位置上关键的数据信息(即页面内容)使用一目标字体库进行替换,实现了对网页页面的精确加密处理,不仅精准地保护了网页上的关键数据信息,使爬虫程序难以获取到想要爬取的网页页面的数据,从而起到防爬虫的效果,同时,对于正常通过浏览器进行访问的访客,也不存在误杀的风险,访客可看到网页上呈现的全部内容信息,提高用户体验。

例如:首先,获取用户的访问请求对应的网页页面内容;然后,基于预置的页面加密配置信息,获得所述网页页面内容对应的网页页面的元素定位位置,并确定所述网页页面内容中的字体加密类型;然后,从预设字体库中随机选择一目标字体库,并向网页页面内容中添加选定好的目标字体库信息,比如:style标签信息、字体库文件链接信息等;最后,按照所述字体加密类型,将所述网页页面内容中的所述元素定位位置上的页面内容,替换为所述目标字体库中的内容,实现对用户访问的网页页面内容中的待加密的页面内容进行替换加密处理。

本申请的一实施例提供的一种网页页面内容加密方法还包括:

从用户设备获取所述用户的网站业务需求;

根据所述网站业务需求为所述用户待获取的网页页面配置所述预置的页面加密配置信息和第一启用条件。如图2所示,在配置控制台根据用户的网站业务需求为所述用户待获取的网页页面配置所述预置的页面加密配置信息和第一启用条件,即为用户待获取的网页页面配置网站配置数据。

在此,所述第一启用条件是根据用户需求进行配置的,包括但不限于指定启用字体防爬虫的URL(Uniform Resource Locator,统一资源定位符)或URL列表(支持精确匹配、模糊匹配)、资源类型、IP或IP列表、IP类型、区域地理位置、时间范围控制、请求的referer(引用页)信息、请求的User-Agent(用户代理)等条件;同时,在实际的使用场景中,可以将第一启用条件中的各个条件进行单独使用或任意组合使用,实现灵活、精确的配置。

例如,用户可根据自身实际的网站业务需求,进行有针对性的高级配置,包括确定资源类型、IP或IP列表、IP类型、区域地理位置、时间范围控制、请求的referer信息等要求。用户设备获取所述用户的网站业务需求;根据所述网站业务需求为所述用户待获取的网页页面配置所述预置的页面加密配置信息和第一启用条件,实现了对预置的页面加密配置信息和第一启用条件更加灵活精确的配置,以便后续通过配置的所述预置的页面加密配置信息和所述第一启用条件,更精确保护所述网页页面内容中的关键信息,达到防爬虫的效果。

接着本申请的上述实施例,所述步骤S12中获得所述网页页面内容对应的网页页面的元素定位位置,还包括:对所述网页页面内容进行页面加密元素的定位以得到元素定位位置,实现对所述网页页面内容的页面加密元素的定位,有利于进一步确定所述网页页面内容中的字体加密类型。

接着本申请的上述实施例,所述步骤S11之前,所述方法还包括:

开启所述用户请求访问的网页页面的内容加密功能;在此,该方法可以直接基于云平台或CDN系统进行开发达到快速部署的效果,需要使用该网页页面内容加密功能的网站,无需进行任何的二次开发,只需在对应的云平台或CDN系统中开启功能后,即可无缝的启用该网页页面内容加密功能,更加灵活。

判断所述用户请求访问的所述网页页面是否配置开启所述内容加密功能的第一启用条件,

若未配置,则系统默认所述用户请求访问的所述网页页面满足开启所述内容加密功能的第二启用条件;在此,所述第二启用条件可以是包括但不限于是系统默认的条件,可以是一些放行条件或者任何可访问网页的条件等。

若配置,则将所述用户请求访问的所述网页页面与配置的所述第一启用条件进行条件匹配,实现了对用户请求访问的所述网页页面更精准的保护,同时避免对不需要保护的网页页面内容进行处理造成资源浪费。

例如,首先,开启所述用户请求访问的网页页面的内容加密功能。当所述用户请求访问的所述网页页面未配置所述开启所述内容加密功能的第一启用条件时,系统默认所述用户请求访问的所述网页页面满足开启所述内容加密功能的第二启用条件输出yes,并执行步骤S11获取用户的访问请求对应的网页页面内容。当所述用户请求访问的所述网页页面配置有所述开启所述内容加密功能的第一启用条件时,将所述用户请求访问的所述网页页面与配置的所述第一启用条件进行条件匹配。若所述用户请求访问的所述网页页面满足所述第一启用条件,则输出yes,并执行步骤S11获取用户的访问请求对应的网页页面内容。若所述用户请求访问的所述网页页面不满足所述第一启用条件,则直接退出所述网页页面的内容加密功能,实现了对用户请求访问的所述网页页面更精准的保护,同时避免了对不需要进行加密保护的网页页面内容进行处理造成资源浪费。

接着本申请的上述实施例,所述预置的页面加密配置信息包括第一页面加密元素范围配置信息和/或第一字体加密类型配置信息,在此,所述第一页面加密元素范围配置信息是用户根据自身实际的网站业务需求而设置的,可以包括但不限于是需要加密的网页页面元素范围,其中所述网页页面元素范围包括但不限于全部页面元素范围、特定网页页面元素范围、特定标签、特定元素,即精度上可精确到页面上的具体位置的元素。例如,只对网页的标题进行加密;对<tabel>标签中的内容进行加密;对标签属性classs值为btn的内容进行加密等。所述第一字体加密类型配置信息是用户亦根据自身实际的网站业务需求而设置的,可以包括但不限于是数字、字母、常见汉字,以及数字、字母、汉字的任意组合等,实现了对网页页面需要进行加密时的页面元素及字体加密类型进行灵活精确的配置。

其中,所述步骤S12,包括:

判断所述预置的页面加密配置信息中是否配置有页面加密元素范围,

若未配置,则按照系统默认的第二页面加密元素范围配置信息,对所述网页页面内容进行页面加密元素的定位以得到元素定位位置;在此,所述第二页面加密元素范围配置信息是系统默认的,比如:如果未配置,则按照内置的所述第二页面加密元素范围配置信息进行定位(所述第二页面加密元素范围配置信息包括但不限于默认的元素范围如<div>标签中的内容,内置的页面加密元素配置信息可进行调整,不局限于例子中的条件)。

若配置,则按照所述第一页面加密元素范围配置信息,对所述网页页面内容进行页面加密元素的定位以得到元素定位位置;

基于所述第一字体加密类型配置信息,确定所述网页页面内容中的字体加密类型。

例如,在对所述访问请求对应的网页页面进行加密之前,需要判断所述预置的页面加密配置信息中是否配置有页面加密元素范围,当所述预置的页面加密配置信息中配置有页面加密元素范围时,按照所述第一页面加密元素范围配置信息,对所述网页页面内容进行页面加密元素的定位以得到元素定位位置;若定位失败,则退出所述用户请求访问的网页页面的内容加密功能。若定位成功,则基于所述第一字体加密类型配置信息,确定所述网页页面内容中的字体加密类型。当所述预置的页面加密配置信息中未配置有页面加密元素范围时,则按照系统默认的第二页面加密元素范围配置信息,对所述网页页面内容进行页面加密元素的定位以得到元素定位位置,然后,基于所述第一字体加密类型配置信息,确定所述网页页面内容中的字体加密类型,实现了对所述元素定位位置和字体加密类型的确定,以便继续执行步骤S13从预设字体库中随机选择一目标字体库,并将所述目标字体库添加至所述网页页面内容中,有利于保护所述网页页面内容的关键信息,起到准确并且实在的防爬虫效果。

接着本申请的上述实施例,所述步骤S12中的基于所述第一字体加密类型配置信息,确定所述网页页面内容中的字体加密类型,包括:

判断所述预置的页面加密配置信息中是否配置有字体加密类型,

若未配置,则将系统默认的第二字体加密类型配置信息中配置的字体加密类型确定为所述网页页面内容中的字体加密类型;在此,所述第二字体加密类型配置信息是系统默认的,比如,如果未配置指定防护字体类型,则使用内置的默认防护字体类型,即所述第二字体加密类型配置信息(其中,默认的字体防护类型如数字、或数字+字母,内置的字体加密类型可进行调整,不局限于例子中)。

若配置,则将所述第一字体加密类型配置信息中配置的字体加密类型确定为所述网页页面内容中的字体加密类型,实现了对所述网页页面内容的字体加密类型的确定。

例如,所述步骤S12在对所述网页页面内容进行页面加密元素的定位之后,还判断所述预置的页面加密配置信息中是否配置有字体加密类型,当所述预置的页面加密配置信息中配置有字体加密类型,则将所述第一字体加密类型配置信息中配置的字体加密类型确定为所述网页页面内容中的字体加密类型,更精准的保护了网页上的关键数据信息,使爬虫程序难以获取到想要爬取的数据从而起到防爬虫的效果。当所述预置的页面加密配置信息中未配置有字体加密类型,则将系统默认的第二字体加密类型配置信息中配置的字体加密类型确定为所述网页页面内容中的字体加密类型,实现了对网页页面内容的字体加密类型的确定。

在步骤S12中确定了所述网页页面内容进行页面加密元素的元素定位位置和字体加密类型后,所述步骤S13从预设字体库中随机选择一目标字体库,并将选定好的所述目标字体库(比如style标签信息、字体库文件链接信息等)添加至当前的所述网页页面内容中;在所述步骤S14中,结合在步骤S12中确定的所述字体加密类型,对所述网页页面内容中的所述元素定位位置上的页面内容进行替换,替换为所述目标字体库中的内容,实现了将需要进行加密处理的网页页面的内容替换为从自定义的预设字体库中选取的目标字体库中所表达的内容,从而实现对网页页面内容的加密,以达到对用户请请求访问的网页页面内容的安全性进行保障的目的。

本申请的又一实施例提供的一种网页页面内容加密方法还包括:

将所述网页页面内容替换后的新页面内容发送给所述用户对应的用户设备,使得所述用户对应的用户设备在获取请求访问的网页页面内容的过程中,获取到的所述新的网页页面内容是经过网页页面内容替换加密后得到的新的网页页面内容信息,即爬虫程序获取到的是一串随机的乱码数据,不能窃取到用户请求访问的网页页面内容的真实信息,实现了对网页页面的精确加密处理,更精准的保护了网页上的关键数据信息,起到防爬虫的效果。

本申请的又一实施例提供的一种网页页面内容加密方法还包括:

实时或周期性地对所述预设字体库中的各字体库进行更新。在此,实时或周期性地对所述预设字体库中的各字体库进行更新包括但不限于是对预设字体库中的某个字体库中的数据进行增加、删除、修改或是对整个预设字体库进行字体库的增加、删除和修改等,实现了对预设字体库的更新,提高了网页页面内容的加密效果,从而更精准的保护了网页上的关键数据信息,达到防爬虫的目的。

例如,实时或周期性地对所述预设字体库中的各字体库进行更新,并最终同步到各个云平台或CDN系统节点上,供各个云平台或CDN系统节点使用,实现了对预设字体库的更新,提高了网页页面内容的加密效果,从而更精准的保护了网页上的关键数据信息,达到防爬虫的目的。

根据本申请的另一个方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行时,使所述处理器实现如上述控制用户对垒方法。

根据本申请的另一个方面,还提供了一种网页页面内容加密设备,其特征在于,该设备包括:

一个或多个处理器;

计算机可读介质,用于存储一个或多个计算机可读指令,

当所述一个或多个计算机可读指令被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述在设备上控制用户对垒方法。

在此,所述设备的各实施例的详细内容,具体可参见上述设备端的控制用户对垒方法实施例的对应部分,在此,不再赘述。

综上所述,本申请通过获取用户的访问请求对应的网页页面内容;基于预置的页面加密配置信息,获得所述网页页面内容对应的网页页面的元素定位位置,并确定所述网页页面内容中的字体加密类型;从预设字体库中随机选择一目标字体库,并将所述目标字体库添加至所述网页页面内容中;按照所述字体加密类型,将所述网页页面内容中的所述元素定位位置上的页面内容,替换为所述目标字体库中的内容,即通过将网页页面的元素定位位置上关键的数据信息(即页面内容)使用一目标字体库进行替换,实现了对网页页面的精确加密处理,不仅精准地保护了网页上的关键数据信息,使爬虫程序难以获取到想要爬取的网页页面的数据,从而起到防爬虫的效果,同时,对于正常通过浏览器进行访问的访客,也不存在误杀的风险,访客可看到网页上呈现的全部内容信息,提高用户体验。

需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。

另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种数据处理方法、装置、系统、设备及介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类