一种pdf文档展示方法、计算机设备及存储介质

文档序号:550497 发布日期:2021-05-14 浏览:2次 >En<

阅读说明:本技术 一种pdf文档展示方法、计算机设备及存储介质 (PDF document display method, computer equipment and storage medium ) 是由 郑侃炜 肖盼 于 2021-01-25 设计创作,主要内容包括:本发明适用于计算机领域,提供了一种PDF展示方法、计算机设备及存储介质,一种PDF展示方法,包括:获取待展示的目标PDF文档;从所述目标PDF文档中提取若干待展示内容,并拼接成待显示图片;对所述待显示图片上的所述待展示内容之间的拼接痕迹进行模糊处理;将所述待显示图片进行输出展示;本方法在将待显示内容拼接为待显示图片后对该图片的拼接处进行了模糊处理,清除了待显示图片的拼接痕迹,使待显示图片形成了一个整体。(The invention is applicable to the field of computers, and provides a PDF display method, computer equipment and a storage medium, wherein the PDF display method comprises the following steps: acquiring a target PDF document to be displayed; extracting a plurality of contents to be displayed from the target PDF document and splicing the contents into a picture to be displayed; fuzzy processing is carried out on splicing traces among the contents to be displayed on the picture to be displayed; outputting and displaying the picture to be displayed; according to the method, after the contents to be displayed are spliced into the pictures to be displayed, the splicing positions of the pictures are subjected to fuzzy processing, splicing traces of the pictures to be displayed are eliminated, and the pictures to be displayed form a whole.)

一种PDF文档展示方法、计算机设备及存储介质

技术领域

本发明属于计算机领域,尤其涉及一种PDF展示方法、计算机设备及存储介质。

背景技术

在户外的大型内容展示投影墙,或大屏幕公告栏中,由于展示区域的局限以及视觉效果的需求,往往需要一次性把众多内容展示出来。

由于保密或其它原因,所展示的内容往往来自于PDF文档;在通常情况下,工作人员将每张PDF文档中需要的页面进行手动截图,再利用现有画图软件,建立好一张大画布,接着把每张图片依次放入,再调整间距等具体细节,最后保存为一张用于展示的图片。

上述方法将待显示内容拼接为用于展示的图片后未对该图片的拼接处进行模糊处理,使其拼接痕迹明显,图片的整体性较差。

发明内容

本发明实施例的目的在于提供一种PDF展示方法,旨在解决目前将PDF文件中的内容拼接为一张图片的方法未对该图片的拼接处进行模糊处理,使其拼接痕迹明显,图片的整体性较差的问题。

本发明实施例是这样实现的,一种PDF展示方法,所述方法包括:

获取待展示的目标PDF文档;

从所述目标PDF文档中提取若干待展示内容,并拼接成待显示图片;

对所述待显示图片上的所述待展示内容之间的拼接痕迹进行模糊处理;

将所述待显示图片进行输出展示。

本发明实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述PDF展示方法的步骤。

本发明实施例的另一目的在于提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述PDF展示方法的步骤。

本发明实施例提供的一种PDF展示方法,在目标PDF文档中自动提取待展示内容,并将其拼接成待显示图片,经过在拼接处进行模糊处理后将其输出展示,本方法在将待显示内容拼接为待显示图片后对该图片的拼接处进行了模糊处理,清除了待显示图片的拼接痕迹,使待显示图片形成了一个整体。

附图说明

图1为本发明实施例提供的一种PDF展示方法的应用环境图;

图2为本发明实施例提供的一种PDF展示方法的流程图;

图3为本发明实施例提供的一种从目标PDF文档中提取若干待展示内容,并拼接成待显示图片的流程图;

图4为本发明实施例提供的一种对待显示图片上的所述待展示内容之间的拼接痕迹进行模糊处理的流程图;

图5为本发明实施例提供的一种对待显示图片进行进一步处理的流程图;

图6为本发明实施例提供的一种对待显示图片中满足设定条件的内容进行突出显示并添加标注的流程图;

图7为本发明实施例提供的一种对所述待显示图片进行修饰操作的流程图;

图8为本发明实施例提供的一种计算机设备的内部结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。

图1为本发明实施例提供的一种PDF展示方法的应用环境图,如图1所示,在该应用环境中,包括外部存储介质110、计算机设备120、输出设备130。

外部存储介质110可以是软盘存储器、硬盘存储器、U盘存储器、磁带存储器、光盘存储器等。

计算机设备120可以是独立的物理服务器或终端,也可以是多个物理服务器构成的服务器集群,可以是提供云服务器、云数据库、云存储和CDN等基础云计算服务的云服务器;终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端110以及计算机设备120可以通过网络进行连接,本发明在此不做限制。

输出设备130可以是显示屏幕,也可以是投影设备及其配套的投影承接屏。

如图2所示,在一个实施例中,提出了一种PDF展示方法,本实施例主要以该方法应用于上述图1中的计算机设备120来举例说明。一种PDF展示方法,具体可以包括以下步骤:

步骤S202,获取待展示的目标PDF文档;

其中,目标PDF文档为包含用户所要展示的内容的PDF文档,将存有目标PDF文档的外部存储介质110与计算机设备120连接,从而使计算机设备120获取含有待展示内容的PDF文档。

步骤S204,从所述目标PDF文档中提取若干待展示内容,并拼接成待显示图片;

其中,待展示内容包含于目标PDF文档中,提取待展示内容依据用户的设定进行,待展示内容为包含有用户需要展示的图像内容和/或文字内容的PDF页面;在提取待展示内容时,以PDF格式规范文档ISO 32000-1:2008为依据,并且以二进制流的方法从后向前读取目标PDF文档,其中PDF格式规范文档中包括字体,文字间距、页面大小等多方面的规范信息,可提升对目标PDF文档读取的规范性;另外,对于目标PDF文档进行读取时,将用户设定的一个或若干个关键词和/或构图元素与目标PDF文档中的文字内容和图像内容进行识别配比,以确定待展示内容所在的PDF页面;若待展示的内容位于所有PDF页面,则对所有PDF页面进行读取;若待展示的内容仅位于部分PDF页面,则在含有待展示内容的PDF页面上设置页面参数,比如“1、3、7-11”,再根据页面参数逐一对PDF页面进行读取;

步骤S206,对所述待显示图片上的所述待展示内容之间的拼接痕迹进行模糊处理;

其中,步骤S206的目的在于去除各第一图片之间的拼接痕迹,以提升所得到的待显示图片的整体性,其中第一图片包含有待展示内容,由所提取的包含用户需要展示的图像内容和/或文字内容的PDF页面及承接该PDF页面的载体共同保存得到。

步骤S208,将所述待显示图片进行输出展示。

其中,通过与计算机设备相连接的输出设备130对待显示图片进行输出展示,输出设备130可以是显示屏幕,包括台式电脑显示屏,平板电脑显示屏,电视机,户外LED显示屏等,此为可选的具体实现方式,本发明对此不作具体限定;输出设备130还可以是投影设备及其配套的投影承接屏,通过与计算机设备120连接的投影设备将待显示图片投影至投影承接屏进行展示。

在一个实施例中,如图3所示,步骤S204具体可以包括:

步骤S302,针对每一个所述待展示内容均配置一个对应的第一画布;

其中,第一画布为包含用户需要展示的图像内容和/或文字内容的PDF页面的承接载体,第一画布的尺寸依据PDF格式规范文档中规定的PDF页面尺寸标准进行确定,其中PDF格式规范文档中对于页面大小的衡量单位为‘英寸’。

步骤S304,将各所述待展示内容分别写入对应的第一画布中,并分别保存为第一图片;

其中,根据用户的设定,既可对所保存的第一图片进行旋转调节,又可对其尺寸进行调节,以使各第一图片实现多种形式的配合拼接。

步骤S306,确定用于写入第一图片的第二画布的尺寸,并引入所述第二画布;

其中,第二画布为第一图片的承接载体,每一张第二画布承接若干张第一图片,第二画布的尺寸依据用户设定的待显示图片的尺寸进行设置;或者,当用户未对待显示图片的尺寸进行限定,则依据第一图片的数量及其标准尺寸进行计算得到第二画布的尺寸,其中第一图片的标准尺寸为预设的第一图片默认保存尺寸;具体的,根据第一图片的总数量以及预设的图片排列标准确定将第一图片进行标准排列时的行数和列数,并根据第一图片的标准长度以及行数计算得到第二画布的长度尺寸,根据第一图片的标准宽度以及列数计算得到第二画布的宽度尺寸。

步骤S308,在所述第二画布中写入部分或者所有第一图片,并保存为所述待显示图片。

其中,若用户将待显示图片设定为满屏图片,则将各第一图片从左至右逐行写入第二画布:若用户将待显示图片设定为留白图片,即具有空白的图片,则根据用户在第二画布上设定的留白位置确定第一图片的放置位置,并将各第一图片写入第二画布上的留白位置;在将第一图片写入第二画布的过程中,若第一图片超出了第二画布的范围,则对第二画布的尺寸进行实时调节,以适应第一图片的尺寸,保证所有的第一图片均在第二画布范围内。

在一个实施例中,如图4所示,步骤206的具体可以包括:

步骤S402,确定各所述第一图片间的连接位置,所述连接位置为待模糊处理区域;

其中,第一图片的连接位置即第二画布内的每一张第一图片的长边或宽边与另外的一张或多张第一图片的长边或宽边的重合处。

步骤S404,循环执行预设的模糊算法,以对各模糊区域逐一进行模糊处理,直至所有的所述模糊区域被处理完成。

其中,所述预设的模糊算法为高斯模糊算法、粒状模糊算法、散景模糊算法;经过模糊处理后,第二画布中的各第一图片之间相重合的边界线得到清除,即清除了各第一图片之间的拼接痕迹,使第一图片由简单的拼接组合形成了一个整体。

进一步,高斯模糊算法是一种数据平滑技术,可把图片某一点周围的像素色值按高斯曲线进行统计,采用数学上加权平均的计算方法得到该点的像素色值,使该点的像素色值与周围的像素色值相仿,进而达到图片模糊的效果;其中,高斯曲线的密度函数为高斯函数,其一维形式为:

其中,μ是x的均值,σ是x的方差,x为周围像素距离中心像素的水平距离;当计算平均值时,中心点为0,即μ=0公式(1)可化为:

对一维高斯函数进行积分,可推导出二维高斯函数:

其中,y为周围像素距离中心像素的垂直距离。

在一个实施例中,如图5所示,一种PDF展示方法还可以包括:

步骤S502,对所述待显示图片进行优化处理;

其中,对待显示图片进行优化处理包括对待显示图片进行图片去噪处理,图片去雾处理以及对图片亮度进行调节;其中,图片去噪处理通过去噪卷积神经网络和/或卷积盲去噪网络进行,以减少所述待显示图片在数字化传输过程中受到成像设备或外部噪声的干扰;图片去雾处理通过暗通道先验去雾算法进行,以提升图片中明暗区域最亮的白和最暗的黑之间不同亮度层级差异的范围,进而提升图片的对比度,使图片显示色彩更为生动、丰富;另外,通过对数图像增强算法对所述待显示图片的亮度进行调节,使待显示图片的明亮程度符合展示要求。

步骤S504,对所述待显示图片中满足设定条件的内容进行突出显示并添加标注;

其中,步骤S504的实施前提为拼接成所述待显示图片的第一图片中既包括图像内容又包括文字内容,其目的是将文字内容与其所对应的图像内容建立起联系,并进行突出显示,以使受众得以直观便捷地获取待显示图片中满足设定条件的内容,其中满足设定条件的内容即为用户预先设定的其所要重点展示的内容,用户可设定需展示内容的关键词的出线频率标准次数(例如3次,5次,在不作具体限定),若待显示图片中的某一段落文字内容中的关键词出线次数达到标准次数,则可判定该文字内容为满足设定条件的内容。

步骤S506,对所述待显示图片进行修饰操作。

其中,步骤S506的实施前提为拼接成所述待显示图片的第一图片中包括文字内容和/或图像内容,其目的在于根据第一图片中的文字内容和/或图像内容获取待显示图片的整体主题及其风格特点,并基于其主题和风格特点选择适配的修饰元素对其进行修饰,以增强该待显示图片的美观性,提升其对受众的吸引力;其中,修饰元素为用于对待显示图片中图像内容和文字内容起到烘托美化作用、对待显示图片本身起到装饰作用的元素,修饰元素可以是图片画框,卡通形象,也可以是对图像内容的情景烘托元素,图像标注的文字修饰元素,此为可选的具体实现方式,本发明实施例对此不作具体限定。

在一个实施例中,步骤S504具体可以包括:

步骤S602,若第一文字内容满足设定条件,则采用标识符号对其进行标记,不同的文字内容分别对应不同形状和/或颜色的标识符号;

其中,设定条件即为用户设定的需展示内容的关键词的出线频率标准次数,对于达到该标准次数的第一文字内容用标识符号进行标记,为了便于受众对不同文字内容进行区分,对于不同的文字内容采用不同类型的标识符号进行标记,标识符号的区别在于其形状和/或颜色的不同;比如,用红色矩形框将满足设定条件的第一文字内容框选出来,用蓝色中括号将满足设定条件的第一文字内容括出,用黄色波浪线在满足设定条件的第一文字内容下进行标记。

步骤S604,根据所述第一文字内容,确定与其描述内容对应的第一图像内容,并用所述第一文字内容所对应的标识符号对所述图像内容进行标记;

其中,在步骤S604中,根据对目标PDF文档的整体内容的关键词进行识别以确定其所属的领域,并引入该领域的图像数据库,通过对第一文字内容关键词进行识别,并将该关键词与引入的图像数据库中的图像名称进行匹配,以确定该关键词的内容所描述的图像主体,并将该图像主体与待显示图片中的第一图像内容进行匹配,以锁定第一图像内容中相对应的图像主体,并用标记其对应的第一文字内容的标识符号对该图像主体进行标识,使第一文字内容与第一图像内容建立起了联系,进而使受众能够迅速通过第一文字内容找到其所描述的图像内容,加快了受众对待显示图片所展示的内容的理解。

步骤S606,在所述第一图像内容处添加标注,所述标注的内容为该所述第一图像内容对应的第一文字内容和/或所述第一文字内容的关键词。

其中,标注可以是标注框,也可以是文字标注;当采用标注框作为标注时,将标注的内容导入标注框中;当采用文字标注时,依据其周围的图像颜色对文字的颜色进行适应性调节,对其进行突出显示;另外,当第一文字内容超过设定字数时(例如10字、20字,或者其他字数,具体不限制),可以采用第一文字内容的关键词作为标注内容;当第一文字内容不超过设定字数时,可采用第一文字内容和/或所述第一文字内容的关键词作为标注内容;通过步骤603,将第一文字内容或者其关键词标注在对应的第一图像内容旁,使用户直接看第一图像内容即可获知待显示图片所要展示的核心内容,进一步提升了受众对于待显示图片所要展示内容的理解速度。

在一个实施例中,步骤S506具体可以包括:

步骤S702,若所述第一图片中包括文字内容,识别所述文字内容的关键词;

其中,根据用户的设定,所识别的文字内容的关键词可以是一个,也可以是若干个;若待匹配的关键词的个数设定为一个,则取出现次数最多的词作为关键词;若待匹配的关键词的个数设定为若干个,比如3个,则取出现次数排名前3的词作为关键词。

步骤S704,若所述第一图片中包括图像内容,识别所述图像内容的构图元素;

其中,构图元素为有组织的、相互协调的,并且可表达图像主体思想的元素,包括图像的主体、陪体、环境、前景、背景等元素,根据用户的设定,所识别的图像内容的构图元素可以是一个,也可以是若干个;若待匹配的构图元素的个数设定为一个,则取使用次数最多的构图元素作为待匹配的构图元素;若待匹配的构图元素的个数设定为若干个,比如3个,则取使用次数排名前3的构图元素作为待匹配的构图元素。

步骤S706,将识别的所述关键词和/或所述构图元素与图片修饰元素数据库中的修饰元素进行匹配,并采用适配的修饰元素对所述待显示图片进行修饰;

其中,若识别的内容只有关键词,则将关键词与图片修饰元素数据库中的修饰元素的类别与名称进行配比,以确定一个或多个修饰元素用于对待显示图片进行修饰;若识别的内容只有构图元素,则将构图元素与图片修饰元素数据库中的修饰元素进行配比,以确定一个或多个修饰元素用于对待显示图片进行修饰;若识别的内容既包括关键词又包括构图元素,则取通过上述两种方法所确定的修饰元素的交叉元素对待显示图片进行修饰。

本方法实现了自动提取目标PDF文档中的待展示内容,并将各待展示内容拼接合成待显示图片,随后对待显示图片进行模糊处理以清除拼接痕迹,并对待显示图片进行优化处理、重点内容突出标注以及修饰操作,最后将其输出展示,在整个提取、拼接、处理以及展示的全流程均实现了自动操作,提升了工作效率,降低了人工成本,并且避免了由于人工操作所带来的操作误差。

在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取待展示的目标PDF文档;

从所述目标PDF文档中提取若干待展示内容,并拼接成待显示图片;

对所述待显示图片上的所述待展示内容之间的拼接痕迹进行模糊处理;

将所述待显示图片进行输出展示。

其中,该计算机设备还包括网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现PDF展示方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行PDF展示方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:

获取待展示的目标PDF文档;

从所述目标PDF文档中提取若干待展示内容,并拼接成待显示图片;

对所述待显示图片上的所述待展示内容之间的拼接痕迹进行模糊处理;

将所述待显示图片进行输出展示

应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种电子文档结构化方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!