一种面向知识产权统计数据构建虚拟区域的方法

文档序号:190514 发布日期:2021-11-02 浏览:30次 >En<

阅读说明:本技术 一种面向知识产权统计数据构建虚拟区域的方法 (Method for constructing virtual area for intellectual property statistical data ) 是由 李娜 杨洪志 于 2021-07-30 设计创作,主要内容包括:本发明涉及一种面向知识产权统计数据构建虚拟区域的方法,属于数据分析技术领域,本方法基于地理坐标的动态微分录入方法,首先通过将区域的数据录入系统;其次利用电子地图技术根据提供的区域四至范围,把区域范围转化为电子地图经纬度坐标;再次利用地理坐标解析技术解析专利地址得到专利地址的经纬度信息;再次遍历专利数据利用算法计算专利的经纬度是否处于区域经纬度范围内,如果在,标识专利属于该区域。最后标识完成后,再汇总计算虚拟区域内的专利量,具有统计准确,效率高的特点。(The invention relates to a method for constructing a virtual area by statistical data facing intellectual property, which belongs to the technical field of data analysis; secondly, converting the area range into longitude and latitude coordinates of the electronic map by utilizing the electronic map technology according to the provided area range from four to four; analyzing the patent address by using a geographic coordinate analysis technology to obtain longitude and latitude information of the patent address; and traversing the patent data again, and calculating whether the longitude and latitude of the patent are in the longitude and latitude range of the area by using an algorithm, and if so, identifying that the patent belongs to the area. And finally, after the identification is finished, summarizing and calculating the patent amount in the virtual area, and the method has the characteristics of accurate statistics and high efficiency.)

一种面向知识产权统计数据构建虚拟区域的方法

技术领域

本发明属于数据分析技术领域,涉及到一种构建虚拟区域的方法,具体为面向知识产权统计数据构建虚拟区域的方法。

背景技术

近年来,我国持续推进知识产权知识产权保护力度,但是不用同于行政区域划分,对于特定的区域没有一个专门的行政区划来设定此类区域的范围,如一些地方的高新区,工业园区,科技开发区等。需要在这类特定区域统计知识产权数量时却无法进行统计,这类区域作为重点的专利产出区,管理者需要详细了解其中专利数量、种类等统计结果,使用现有的行政区域划分或者人工叠加的统计方法,一方面数据统计模糊,可靠性低;一方面效率地下,人力成本高,费时费力。

发明内容

本发明为了解决上述问题,设计了一种面向知识产权统计数据构建虚拟区域的方法,具有统计准确,效率高的特点。

本发明的具体技术方案是:

一种面向知识产权统计数据构建虚拟区域的方法,本方法基于地理坐标的动态微分录入方法,包括区域数据录入步骤,区域经纬度转换步骤,专利坐标解析步骤,区域范围确认步骤和数量汇总步骤,具体包括:

专利地理坐标解析步骤,录入区域的基础数据,包括区域名称、区域类型、所属城市名称、区县名称、省级四至范围、市级四至范围等内容;

区域转化经纬度步骤,利用电子地图技术,根据电子地图所提供的区域四至范围,把区域范围转化为电子地图的经纬度坐标;

专利坐标解析步骤,将专利的地址信息,解析为具体的经纬度信息。

区域范围确认步骤,遍历专利数据利,计算专利的经纬度是否处于区域经纬度范围内;

数量汇总步骤:汇总计算指定区域内的专利量,并进行统计。

所述地理坐标解析步骤,包括:

S1-1:构建区域录入系统,所述区域录入系统包括名称存储单元、四至范围存储单元和区域数据存储单元,在所述名称存储单元内录入区域名称、区域类型、所属城市名称、区县名称信息,在所述的四至范围存储单元录入省级四至范围、市级四至范围信息;

S1-2:保存S1-1中的信息,并将所述区域名称、所述城市名称与所述省市级四至范围相对应,存入区域数据存储单元作为区域数据集M。

所述区域经纬度转换步骤包括,

S2-1:坐标点标记,以电子地图为基底,根据经纬度建立坐标系,根据电子地图,两两选取坐标点并连成直线段,建立多条首尾相接的连线段,直到形成封闭区域,对于包含多个闭区域子集的同一个名称的区域,记作Z={Z1,Z2,Z3,…},并将该信息存储入区域数据集M中;

S2-2:将集合Z与区域数据集M中的信息相结合,实现四至范围和坐标的结合;

S2-3:将所述S2-2中的数据以大文本字段保存。

其中经纬度用“X,Y”表示,每个封闭区域用线段的顶点集合表示。

所述专利坐标解析步骤包括:

S3-1:设置专利数据存储单元,从专利数据库中查询要解析的专利数据,存储入专利数据存储单元,作为专利数据集合Ps;

S3-2:从所述专利数据集合Ps中,提取每个专利的地址信息,通过Web API调用电子地图的地理编码,同时结合区域数据集M的坐标信息,得到每个专利相应的经纬度信息(XP,YP);

S3-3:设置专利坐标存储单元,将所述S3-2中的每个专利所对应的经纬度信息添加到所述专利坐标存储单元内。

区域范围确认步骤包括:

S4-1:从所述专利坐标存储单元内提取每个专利的坐标信息;

S4-2:计算每一个专利相应的坐标信息是否在指定区域的范围内,如果在,则标记区域唯一标识到专利P。

所述S4-2中,具体计算方法包括:

step1:创建用于记录相交次数的计数器C;

step2:遍历所统计区域的每个坐标点,取两坐标点A(X1,Y1)和B(X2,Y2);

step3:对于专利坐标P(XP,YP),判断如果YP<min(Y1,Y2)或YP>max(Y1,Y2),则该专利不属于该指定区域;判断如果XP<min(X1,X2)或XP>max(X1,X2),则该专利不属于该指定区域,否则执行以下操作;

step4:将点P(XP,YP)与A(X1,Y1)、B(X2,Y2)两点分别相连,若两条线段斜率相等,则点P在AB边界线上,则在需统计的区域内;

step5:计算相交点的x坐标$X,

$X=[(YP-Y1)×(X1-X2)/(Y1-Y2)]+X1

如果$X>XP,则判断为相交点在专利坐标P的右边,计数器C执行+1操作;

step6:重复step2-step5,对所有连线段的相交点进行操作,若C为偶数,则该专利不在统计区域内,否则在区域内;

step7:将带有区域唯一标识的专利结合所述区域数据集M,存储入所述区域存储单元。

所述数量汇总步骤包括:

S5-1:查询带区域唯一标识的专利数据;

S5-2:统计每个区域唯一表示的专利数量;

S5-3:得到每个相关联区域内所有的专利数量。

本发明的有益效果是:

该方法首先通过将区域的数据录入系统;其次利用电子地图技术根据提供的区域四至范围,把区域范围转化为电子地图经纬度坐标;再次利用地理坐标解析技术解析专利地址得到专利地址的经纬度信息;再次遍历专利数据利用算法计算专利的经纬度是否处于区域经纬度范围内,如果在,标识专利属于该区域。最后标识完成后,再汇总计算虚拟区域内的专利量。

本发明提出的一种面向知识产权统计数据而构建虚拟区域的方法具有以下的有益效果:

1、本专利的有益效果在于把区域信息电子化,并建立区域电子地图系统,把文字性说明转化为更直观的电子地图数据,在方便展示的同时,为专利所属区域做数据基础。

2、把专利地址解析为电子地图经纬度数据,可以在电子地图更直观的展示专利分布。

3、根据区域电子地图坐标和专利电子地图坐标计算出区域内专利数量解决了计算区域内专利数量的难题。

附图说明

图1为本发明的流程框图。

具体实施方式

以下结合具体实施例及附图对本发明的技术方案作进一步详细的描述,但本发明的保护范围及实施方式不限于此。

具体实施例,如说明书附图1所示,一种面向知识产权统计数据构建虚拟区域的方法,本方法基于地理坐标的动态微分录入方法,包括区域数据录入步骤,区域经纬度转换步骤,专利坐标解析步骤,区域范围确认步骤和数量汇总步骤,具体包括:

专利地理坐标解析步骤,录入区域的基础数据,包括区域名称、区域类型、所属城市名称、区县名称、省级四至范围、市级四至范围等内容;

区域转化经纬度步骤,利用电子地图技术,根据电子地图所提供的区域四至范围,把区域范围转化为电子地图的经纬度坐标;

专利坐标解析步骤,将专利的地址信息,解析为具体的经纬度信息。

本发明面向缺乏在非行政区划内的区域要统计知识产权数量的情况,并建立地理坐标解析模型,解决虚拟区域的问题。

区域范围确认步骤,遍历专利数据利,计算专利的经纬度是否处于区域经纬度范围内;

数量汇总步骤:汇总计算指定区域内的专利量,并进行统计。

所述地理坐标解析步骤,包括:

S1-1:构建区域录入系统,所述区域录入系统包括名称存储单元、四至范围存储单元和区域数据存储单元,在所述名称存储单元内录入区域名称、区域类型、所属城市名称、区县名称信息,在所述的四至范围存储单元录入省级四至范围、市级四至范围信息;

S1-2:保存S1-1中的信息,并将所述区域名称、所述城市名称与所述省市级四至范围相对应,存入区域数据存储单元作为区域数据集M。

所述区域经纬度转换步骤包括,

S2-1:坐标点标记,以电子地图为基底,根据经纬度建立坐标系,根据电子地图,两两选取坐标点并连成直线段,建立多条首尾相接的连线段,直到形成封闭区域,对于包含多个闭区域子集的同一个名称的区域,记作Z={Z1,Z2,Z3,…},并将该信息存储入区域数据集M中;

S2-2:将集合Z与区域数据集M中的信息相结合,实现四至范围和坐标的结合;

S2-3:将所述S2-2中的数据以大文本字段保存。

通过以上方法,可以得到相应的地理信息,为后续流程做准备。

其中经纬度用“X,Y”表示,每个封闭区域用线段的顶点集合表示。通过多条小线段,围成所指定的虚拟区域,当小线段足够多,且足够短时,直线段所谓区域就不断趋向于真实区域。当该系统使用的时间越长,所描点密度越高,区域范围越准确。

所述专利坐标解析步骤包括:

S3-1:设置专利数据存储单元,从专利数据库中查询要解析的专利数据,存储入专利数据存储单元,作为专利数据集合Ps;

S3-2:从所述专利数据集合Ps中,提取每个专利的地址信息,通过Web API调用电子地图的地理编码,同时结合区域数据集M的坐标信息,得到每个专利相应的经纬度信息(XP,YP);

S3-3:设置专利坐标存储单元,将所述S3-2中的每个专利所对应的经纬度信息添加到所述专利坐标存储单元内。

通过以上步骤得到每个专利的位置位置信息,并使之可与专利坐标解析步骤的地图信息相匹配。

区域范围确认步骤包括:

S4-1:从所述专利坐标存储单元内提取每个专利的坐标信息;

S4-2:计算每一个专利相应的坐标信息是否在指定区域的范围内,如果在,则标记区域唯一标识到专利P。

所述S4-2中,具体计算方法包括:

step1:创建用于记录相交次数的计数器C;

step2:遍历所统计区域的每个坐标点,取两坐标点A(X1,Y1)和B(X2,Y2);

step3:对于专利坐标P(XP,YP),判断如果YP<min(Y1,Y2)或YP>max(Y1,Y2),则该专利不属于该指定区域;判断如果XP<min(X1,X2)或XP>max(X1,X2),则该专利不属于该指定区域,否则执行以下操作;

step4:将点P(XP,YP)与A(X1,Y1)、B(X2,Y2)两点分别相连,若两条线段斜率相等,则点P在AB边界线上,则在需统计的区域内;

step5:计算相交点的x坐标$X,

$X=[(YP-Y1)×(X1-X2)/(Y1-Y2)]+X1

如果$X>XP,则判断为相交点在专利坐标P的右边,计数器C执行+1操作;

step6:重复step2-step5,对所有连线段的相交点进行操作,若C为偶数,则该专利不在统计区域内,否则在区域内;

step7:将带有区域唯一标识的专利结合所述区域数据集M,存储入所述区域存储单元。

所述数量汇总步骤包括:

S5-1:查询带区域唯一标识的专利数据;

S5-2:统计每个区域唯一表示的专利数量;

S5-3:得到每个相关联区域内所有的专利数量。

通过区域唯一表示,可以保证所统计的数据不会出现重复统计或遗漏统计的问题,保证了数据的可靠性。

9页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:遥感解译样本点的显示方法、装置、电子设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!