基于svc自动生成地震灾害风险评估中定性图件的方法及系统

文档序号:1201202 发布日期:2020-09-01 浏览:12次 >En<

阅读说明:本技术 基于svc自动生成地震灾害风险评估中定性图件的方法及系统 (SVC-based method and system for automatically generating qualitative graph in earthquake disaster risk assessment ) 是由 陈小芳 戚洪飞 李三凤 刘辉 黄宽 俞岗 于 2020-05-21 设计创作,主要内容包括:本发明提供了一种基于SVC自动生成地震灾害风险评估中的定性图件的方法,其包括以下成图步骤:S1:基于系统获取第一成图数据。S2:将第一成图数据做归一化处理,得到第二成图数据。S3:用第二成图数据构建矩阵点,得到第三成图数据。S4:将第二成图数据作为训练样本,对第三成图数据进行训练,得到第四成图数据。S5:用第四成图数据构建栅格。S6:栅格矢量化,生成矢量分布图。将上述步骤编程集成,即构成系统中自动成图功能模块。本发明还提供了一种基于SVC自动生成地震灾害风险评估中定性图件的系统,其采用上述方法自动生成地震灾害风险评估中的定性图件,以对地震灾害风险进行评估。本发明的方法可以对定性的离散点进行更加合理的分类,而不是简单的使用具体数值进行插值而分类。这个成图过程可以修正插值分类的缺陷,为工程人员以及其他专业人员提供准确的评估图。此外,本发明的成图方法不再使用人工勾画,提高了成图效率与精度,降低了人工成本。(The invention provides a method for automatically generating a qualitative graph in earthquake disaster risk assessment based on SVC, which comprises the following steps of mapping: s1: first imaging data is acquired based on the system. S2: and normalizing the first imaging data to obtain second imaging data. S3: and constructing matrix points by using the second imaging data to obtain third imaging data. S4: and taking the second imaging data as a training sample, and training the third imaging data to obtain fourth imaging data. S5: the grid is constructed with the fourth imaging data. S6: and carrying out grid vectorization to generate a vector distribution map. The steps are integrated in a programming mode, and an automatic mapping function module in the system is formed. The invention also provides a system for automatically generating the qualitative map in the earthquake disaster risk assessment based on the SVC, and the method is adopted to automatically generate the qualitative map in the earthquake disaster risk assessment so as to assess the earthquake disaster risk. The method of the invention can carry out more reasonable classification on qualitative discrete points, rather than simply carrying out classification by interpolation by using specific numerical values. The mapping process can correct defects of interpolation classification and provide accurate evaluation maps for engineers and other professionals. In addition, the mapping method does not use manual drawing any more, thereby improving the mapping efficiency and precision and reducing the labor cost.)

基于SVC自动生成地震灾害风险评估中定性图件的方法及 系统

技术领域

本发明涉及地震灾害风险评估技术领域,尤其涉及基于SVC自动生成地震灾害风险评估中定性图件的方法及系统。

背景技术

我国是世界上地震灾害损失较严重的国家。一旦发生地震,往往会带来十分严重的人员伤亡和巨大的经济损失。人们对地震灾害风险的正确评估和科学管理成为实现减灾的最佳途径。对于地震灾害的风险评估,图件可以给人们提供直观的评估结果。这里的地震灾害风险评估中的图件是指场地土类型分布图、场地类别分布图、砂土液化分布图、软土震陷分布图等,还包括由这些图生成的城市用地各类图件以及与之相类似的灾害图件。场地土类型分布图是根据研究区每个离散点钻孔的土的类型生成,如岩石、坚硬土或软质岩石、中硬土、中软土、软弱土类型。场地类别分布图是根据研究区每个离散点钻孔的场地类别生成,如Ⅰ0、Ⅰ1、Ⅱ、Ⅲ、Ⅳ类。砂土液化分布图是根据研究区每个离散点钻孔是否液化(即液化、不液化)或轻微液化、中等液化、严重液化的等级生成。软土震陷分布图是根据研究区每个离散点钻孔是否震陷(即震陷、不震陷)生成。以上各图均为面状类型。

目前常用的成图方法是根据研究区的离散点的结果人工勾画,费时费力。当遇到研究区面积大,如达到上千平方公里,且离散点不均匀分布时,弊端更加显现。还有一种方法是对离散点属性强制赋予0、1数值,然后进行插值网格化,即针对离散点插值(采用距离反比)生成栅格,根据栅格分类输出为矢量图的评估方法,其从逻辑上不能真实反映场地的客观情况,不能满足应用需求,且这个方法需要大量的数据样本为基础,才能勉强生成较为可靠的评估结果。

发明内容

为了克服现有的分析评估方法的不足,解决现有技术中的缺陷,本发明提供了一种基于SVC(Support vector classification)的自动成图方法及系统,其具有完善的将SVC作为分类工具的成图流程,体现了SVC在样本点数量较少,且不密集情况下的技术优势。

本发明提供了一种基于SVC自动生成地震灾害风险评估中的定性图件的方法,其包括以下成图步骤:

S1:基于系统获取第一成图数据。所述第一成图数据包括钻孔原始点位及对应的属性信息。优选地,所述第一成图数据用文本文件保存,格式为每行记录X、Y、Z,其中X轴和Y轴表示位置坐标,Z为分类,且必须是整型数值(INT)。

S2:将第一成图数据做归一化处理,得到第二成图数据。优选地,将第一成图数据中的原始点位的X、Y轴数据作归一化处理。

S3:用第二成图数据构建矩阵点,得到第三成图数据。优选地,以第二成图数据的原始点位的外包矩形为边界和归一化之后设置的间距进行插值构建矩阵点,得到第三成图数据,所述第三成图数据为N×M个矩阵点,即为SVC训练模型。N和M的范围需要经验确定,一般2000以内可在效率与结果逼真度上取得平衡。M、N的值越大,对应的网格越密,SVC预测越接近可信数据,但是计算量也更大。优选地,N=2000,M=2000。

S4:将第二成图数据作为训练样本,对第三成图数据进行训练,得到第四成图数据。优选地,所述第四成图数据为SVC预测模型,且将所述SVC预测模型保存为文本文件。优选地,将归一化之后的钻孔点信息作为训练样本,对SVC训练模型进行训练,获得N×M矩阵预测点的属性值,生成SVC预测模型,并将其保存到文本文件中。优选地,训练SVC模型中的核函数K选用高斯核函数。

S5:用第四成图数据构建栅格。优选地,以第四成图数据的X、Y、Z数据构建栅格。

S6:栅格矢量化,生成矢量分布图。优选地,用评估范围进行裁剪,最终生成指定范围内的分布图。

将上述步骤编程集成,即构成系统中自动成图功能模块。

本发明还提供了一种基于SVC自动生成地震灾害风险评估中定性图件的系统,其采用上述方法自动生成地震灾害风险评估中的定性图件,以对地震灾害风险进行评估。

本发明提供的基于SVC自动生成地震灾害风险评估中的定性图件的方法可以对定性的离散点进行更加合理的分类,而不是简单的使用具体数值进行插值而分类。插值分类方法依赖于离散点的密集程度,往往很生硬,且容易弱化掉一些不突出的点,把本该归为A类的点归为B类。而本发明的基于SVC的方法,通过构建矩阵、训练SVC模型以修正矩阵点的属性值、将修正后的矩阵栅格矢量化,获得准确的评估图。这个成图过程可以修正插值分类的缺陷,为工程人员以及其他专业人员提供准确的评估图。此外,本发明的成图方法不再使用人工勾画,提高了成图效率与精度,降低了人工成本。

附图说明

图1示出了本发明基于SVC自动生成地震灾害风险评估中定性图件的方法流程图;

图2示出了实施例1中基于SVC自动生成地震灾害风险评估中场地土类型定性图件的方法流程图;

图3-1示出了现有技术生成的实施例1中研究区场地土类型分布图(带点位数据);

图3-2示出了现有技术生成的实施例1中研究区场地土类型分布图(不带点位数据);

图3-3示出了现有技术生成的实施例1中研究区场地土类型分布图(局部放大,带点位数据);

图4-1示出了基于SVC自动生成的实施例1中研究区场地土类型分布图(带点位数据);

图4-2示出了基于SVC自动生成的实施例1中研究区场地土类型分布图(不带点位数据);

图4-3示出了基于SVC自动生成的实施例1中研究区场地土类型分布图(局部放大,带点位数据);

图5示出了实施例1中基于SVC自动生成场地土类型分布图的程序界面;

图6示出了实施例2中基于SVC自动生成地震灾害风险评估中软土震陷定性图件的方法流程图;

图7-1示出了现有技术生成的实施例2中研究区软土震陷分布图(带点位数据);

图7-2示出了现有技术生成的实施例2中研究区软土震陷分布图(不带点位数据);

图7-3示出了现有技术生成的实施例2中研究区软土震陷分布图(局部放大,带点位数据);

图8-1示出了基于SVC自动生成的实施例2中研究区软土震陷分布图(带点位数据);

图8-2示出了基于SVC自动生成的实施例2中研究区软土震陷分布图(不带点位数据);

图8-3示出了基于SVC自动生成的实施例2中研究区软土震陷分布图(局部放大,带点位数据);

图9示出了实施例2中基于SVC自动生成软土震陷分布图的程序界面。

具体实施方式

SVM(Support Vector Machine,支持向量机)是与相关的学习算法有关的监督学习模型,可以分析数据、识别模型,用于分类和回归分析。根据输入的数据不同可做不同的模型。当将SVM用于分类分析时,其输入标签为分类值,此时其也被称为SVC。SVC不仅可以用于普通的线性分类,其对一些线性不可分的问题也同样适用,因为一些线性不可分的问题可能是非线性可分的。在将SVC用于非线性分类时,通常需要使用核函数来协助分类。核函数可以根据实际情况构造,也可以选用现有的核函数。然而对于构造的核函数,验证其对输入空间内的任意格拉姆矩阵为半正定矩阵是困难的,因此通常的选择是使用现成的核函数。在进行SVC分类分析时候,核函数的构造和选择将极大简化计算的复杂度。

图1示出了本发明的基于SVC自动生成地震灾害风险评估中定性图件的方法流程图,其具体步骤为:

S1:基于系统获取第一成图数据;所述第一成图数据包括钻孔原始点位及对应的属性信息。优选地,所述第一成图数据用文本文件保存,格式为每行记录X、Y、Z,其中X轴和Y轴表示位置坐标,Z为分类,且必须是整型数值(INT)。Z值是系统利用钻孔实测信息,如剪切波速、标贯或地层信息等,按《建筑抗震设计规范》GB 50011-2010、《岩土工程勘察规范》GB50021-2001(2009版)、《软土地区岩土工程勘探规程》JGJ83-2011等一系列国家标准和行业规范计算得到。将这些原始信息用文本文件保存,格式为每行记录X、Y、Z。分类信息Z对应生成场地土类型分布图、场地类别分布图、砂土液化分布图、软土震陷分布图等图件的属性信息,如(1)场地土类型分布图对应研究区每个离散点钻孔的场地土类型:岩石、坚硬土或软质岩石、中硬土、中软土、软弱土;(2)场地类别分布图对应研究区每个离散点钻孔的场地类别:Ⅰ0、Ⅰ1、Ⅱ、Ⅲ、Ⅳ类;(3)砂土液化分布图对应研究区每个离散点钻孔是否液化:液化、不液化,或液化等级:、轻微液化、中等液化、严重液化;以及(4)软土震陷分布图对应研究区每个离散点钻孔是否震陷:震陷、不震陷。

S2:将第一成图数据做归一化处理,得到第二成图数据。优选地,将第一成图数据中的原始点位的X、Y轴数据作归一化处理。

由于步骤S1中收集的原始数据的坐标值是实际坐标,数值较大,导致后期SVC训练模型出现异常并且分类效果欠佳,故此处做归一化处理,默认范围是[-1,1],更加便于程序调整网格间距。

S3:用第二成图数据构建矩阵点。优选地,以第二成图数据中的原始点位的外包矩形为边界和归一化之后设置的间距进行插值构建矩阵点,得到第三成图数据,所述第三成图数据为N×M个矩阵预测点,即为SVC训练模型。

根据原始的坐标点的外包范围和步骤S2中归一化之后设置的间距进行插值,构建N×M矩阵预测点,其属性值需要预测,即为预测值Z,N和M的范围需要经验确定,一般2000以内可在效率与结果逼真度上取得平衡。N、M越大,对应的网格越密,SVC预测越接近可信数据,但是计算量也更大,耗时越多。

S4:将第二成图数据作为训练样本,对第三成图数据进行训练,得到第四成图数据。优选地,所述第四成图数据为SVC预测模型。优选地,将归一化之后的钻孔点信息作为训练样本,对SVC训练模型进行训练,获得N×M矩阵预测点的属性值,生成SVC预测模型,并将其保存到文本文件中(txt格式)。

SVC就是用一定规则把无法进行线性分割的样本映射到更高纬度的空间里,然后找出超平面,因此其核心就是找出合适的参数,使得分割超平面间距最大,且能正确对数据进行分类。核函数K就是指K(x,y)=<f(x),f(y)>,其中x和y是n维的输入值,f(x)和f(y)是从n维到m维的映射(通常m>>n),<f(x),f(y)>是x和y的内积。核函数包括线性核函数、多项式核函数、高斯核函数等。在该步骤中,使用python脚本代码,python脚本经pyinstaller打包成exe,在.NET环境中以进程方式调用,此方法极大地简化了系统集成的复杂度。

在点密集且杂乱的情况下,不能使用线性核函数,但若使用多项式核函数(kernel=’poly’时)则训练耗时,时间代价太大,因此选择高斯核函数(kernel=’rbf’)。高斯核函数在SVM中也称为径向基函数(Radial Basis Function,RBF),它是非线性分类SVM最主流的核函数,公式为

Figure BDA0002502171950000051

由于K(x(i),x(j))=Ф(x(i))TФ(x(i)),经过合适的数学变换,可得高斯核函数对应的特征变换函数为前面无限多项的累加器物理意义是把特征向量转换到无限多维向量空间里,即高斯函数可以把输入特征扩展到无限多维空间里。公式的推导会用到泰勒公式。

Figure BDA0002502171950000053

其中K(x(i),x(j))是高斯核函数,ai只在支持向量对应的样本处不为0。由此可知,预测函数时中心点在支持向量机处的高斯函数的线性组合,其线性组合的系数为aiy(i)。因此,高斯核函数也称为RBF核函数,即反钟形函数的线性组合。

当用径向基(RBF)内核去训练SVC,有两个参数必须要去考虑:C惩罚系数和gamma。参数C用来权衡模型准确性和复杂性,与决策表面的简单性相抗衡,可以对训练样本的误分类进行有价转换。较小的C会使决策表面更平滑,同时较高的C旨在正确地分类所有训练样本。Gamma定义了单一训练样本能起到多大的影响。较大的gamma会更让其他样本受到影响。直观地,该gamma参数定义了单个训练样例的影响达到了多远,低值意味着“远”,高值意味着“接近”。所述gamma参数可以被看作是由模型支持向量选择的样本的影响的半径的倒数。该C参数将训练样例的错误分类与决策表面的简单性相对应。低值C使得决策表面平滑,而高值C旨在通过给予模型自由选择更多样本作为支持向量来正确地对所有训练样本进行分类。

S5:用第四成图数据构建栅格。优选地,以第四成图数据的X、Y、Z轴数据构建栅格。

S6:将步骤S5中构建的栅格进行栅格矢量化,生成矢量分布图。优选地,用评估范围进行裁剪,最终生成指定范围内的分布图。

由于步骤S4的矩阵坐标和对应的属性值数据都通过了SVC模型训练,数据准确,所以将步骤S5中的栅格矢量化,相当于囊括了整个评估范围的点,从而获得了整个评估范围的相应属性的评估图件。

将上述步骤编程集成,即构成系统中自动成图功能模块。成图时只需点击成图菜单即可生成定性评估图件。

下面将详细介绍本发明基于SVC自动生成地震灾害风险评估中不同的定性图件的方法。

实施例1:场地土类型分布图

以广州市部分城区518km2范围为研究区,517个钻孔为离散点,自动生成地震灾害评估中场地土类型分布图作为实施例具体说明该方法,其具体步骤如图2所示。

S1:在成图系统中,添加钻孔图层,获取钻孔点数据。系统根据已经编入系统的《建筑抗震设计规范》GB 50011-2010中的相关算法,利用钻孔实际波速测试数据,计算得到各钻孔点的场地土类型属性信息(岩石、坚硬土或软质岩石、中硬土、中软土、软弱土)见表1。由于数据过于庞大,表中仅显示通过计算获得结果的字段及部分数据供参考。

表1场地土类型属性表

Figure BDA0002502171950000061

将获得的数据信息以文本文件(txt格式)保存,每行记录X,Y,Z。其中X,Y分别代表钻孔点的具***置坐标,Z为分类,必须为整形(INT),比如1/2/3/4/5分别代表岩石/坚硬土或软质岩石/中硬土/中软土/软弱土。

S2:将步骤S1中的原始X、Y轴数据做归一化处理,避免大数据范围内插值过于密集超出计算时长。

S3:以原始点位的外包矩形为边界和归一化之后设置的间距进行插值构建N×M个矩阵点,即为SVC训练模型。N和M的范围需要经验确定,一般2000以内可在效率与结果逼真度上取得平衡。M、N的值越大,对应的网格越密,SVC预测越接近可信数据,但是计算量也更大。在本实施例中,N、M取值均为2000。

S4:将第二步获取的归一化之后的场地土类型结果的钻孔点数据作为训练样本,对SVC训练模型进行训练,获得N×M个矩阵预测点的属性值,生成SVC预测模型,并将其保存到文本文件中。针对场地土类型的数据,由于点密集且分布不均匀,所以不能使用线性核函数,而多项式核函数(kernel='poly'时),样本数据训练耗时,时间代价太大。因此选择高斯核函数(kernel='rbf'时),经过反复调参,确定gamma取50,效果和时间成本相对最优。由于样本分布不均匀,为了避免部分数据被当成噪声点弱化掉,采用均衡权重(class_weight='balanced')。其他参数使用默认值,样本数据SVC训练代码如下:

Figure BDA0002502171950000071

S5:根据步骤S4文本文件中的X、Y、Z数据构建栅格,得到2000×2000的栅格。

S6:对2000×2000的栅格进行矢量化,并用评估范围对结果进行裁剪,生成场地土类型分布图,参见附图4-2。

将上述步骤编程集成,即构成系统中自动生成场地土类型分布图功能模块。成图时选取参与成图的钻孔,点击程序界面(见附图5)中的“场地土类型”,进入“场地土分布图”界面,点击图中右下角的“生成分区图”菜单即可生成场地土类型分布图。图3-1(带点位数据)、图3-2(不带点位数据)和图3-3(局部放大,带点位数据)示出了利用现有技术生成的实施例1中研究区场地土类型分布图。图4-1(带点位数据)、图4-2(不带点位数据)和图4-3(局部放大,带点位数据)示出了利用本发明基于SVC自动生成的实施例1中研究区场地土类型分布图。局部放大范围两种方法相同。将两种方法自动生成的图件进行对比,可以明显发现在该研究区内,现有技术生成的图3-1在不同土的归类成图时存在较多误差,如最下方两处软弱土的范围内既分布有软弱土的钻孔点,也分布有中软土的钻孔点,显然划分不合理;左边上部一块中硬土范围内分布有占有范围较大的中软土钻孔点,也不合理……,这种现象在图3-3中可以更清晰地表现出来,同时可以看到几个范围非常小的中硬土、中软土分区中无钻孔分布等。而分析本发明生成的图4-1,并结合图4-3,可以发现各类土的分区与钻孔点土的种类分布对应得很好,这是因为本发明的方法对定性的离散点进行更加合理的分类,而不是简单的使用具体数值进行插值而分类,分析结果更准确。由此可见,两种成图方法获得图件给技术人员提供了不同的分析结果。

将地形、地貌、水系等数据与上述两种方法生成的结果叠加,结合专家经验发现,基于SVC方法生成的成果图更为可靠。

实施例2:软土震陷分布图

以广州市部分城区638km2范围为研究区,5766个钻孔为离散点,自动生成地震灾害评估中软土震陷分布图为实施例具体说明该方法,其具体步骤如图6所示。

S1:在成图系统中,添加钻孔图层,获取钻孔点位数据。系统根据已经编入系统的《岩土工程勘察规范》GB50021-2001(2009版)、《软土地区岩土工程勘探规程》JGJ83-2011、《建筑抗震设计规范》GB50011-2010等规范中的相关判别方法与算法,利用钻孔实际波速测试数据和地层信息中的软土厚度,计算获得各钻孔的软土震陷属性信息(震陷/不震陷)见表2。由于数据过于庞大,仅显示部分数据供参考。

表2软土震陷属性表

将获得的钻孔点位信息以txt格式保存,每行记录X,Y,Z。其中X,Y分别代表钻孔点的具***置坐标,Z为分类,必须为整形(INT),比如2,5分别代表震陷/不震陷。

S2:将步骤S1中的原始X、Y轴数据做归一化处理,避免大数据范围内插值过于密集超出计算时长。

S3:以原始点位的外包矩形为边界和归一化之后设置的间距进行插值构建N×M个矩阵点,即为SVC训练模型。N和M的范围需要经验确定,一般2000以内可在效率与结果逼真度上取得平衡。M、N的值越大,对应的网格越密,SVC预测越接近可信数据,但是计算量也更大。在本实施例中,N、M取值均为2000。

S4:将第二步获取的归一化之后的软土震陷结果的钻孔点数据作为训练样本,对SVC训练模型进行训练,获得N×M个矩阵预测点的属性值,生成SVC预测模型,并将其保存到文本文件中。针对软土震陷的数据,由于点密集且分布不均匀,所以不能使用线性核函数,而多项式核函数(kernel='poly'时),样本数据训练耗时,时间代价太大。因此选择高斯核函数(kernel='rbf'时),经过反复调参,确定gamma取50效果和时间成本相对最优。由于样本分布不均匀,为了避免部分数据被当成噪声点弱化掉,采用均衡权重(class_weight='balanced')。其他参数使用默认值,样本数据SVC训练代码如下:

Figure BDA0002502171950000091

S5:根据步骤S4文本文件中的X、Y、Z数据构建栅格,得到2000×2000的栅格。

S6:对2000×2000的栅格进行矢量化,并用评估范围对结果进行裁剪,生成软土震陷分布图,参见附图8-2。

将上述步骤编程集成,即构成系统中自动生成软土震陷分布图功能模块。成图时选取参与成图的钻孔,点击程序界面(见图9)中“软土震陷”菜单,进入“软土震陷分布图界面”,点击图中右下角“震陷判别”菜单获得各钻孔点的判别结果,点击图中最右下角的“生成分区图”菜单即可生成软土震陷分布图。

图7-1(带点位数据)、图7-2(不带点位数据)和图7-3(局部放大,带点位数据)示出了利用现有技术生成的实施例2中研究区软土震陷分布图。图8-1(带点位数据)、图8-2(不带点位数据)和图8-3(局部放大,带点位数据)示出了利用本发明基于SVC自动生成的实施例2中研究区软土震陷分布图。局部放大范围两种方法相同。将图7-1与图8-1进行对比,可以明显发现在该研究区域内,现有技术生成的图件中划分的震陷范围内仍然分布有许多不震陷的钻孔点,即未把能划出的不震陷的钻孔点划分到不震陷区域中,而本该划入震陷范围的震陷钻孔点未划入。而本发明生成的图件,将现有钻孔点的结果进行合理分类,将适当的区域划入震陷范围,其中震陷钻孔点分布合理;与现有技术生成的图件不同,在右下角处有部分范围被划分为非震陷区,排除了更多不会产生震陷风险的范围。将图7-3(局部放大,带点位数据)与图8-3(局部放大,带点位数据)进行对比,这种误差更加清楚地显示出来。本发明的方法对定性的离散点进行更加合理的分类,而不是简单的使用具体数值进行插值而分类,分析结果更准确。由此可见,两种成图方法获得图件给技术人员提供了不同的分析结果。

将地形、地貌、水系等图层与上述两种方法生成的结果叠加发现,基于SVC方法生成的成果图更为可靠。

本发明并不局限于上述实施方式,如果对本发明的各种改动或变型不脱离本发明的精神和范围,倘若这些改动和变型属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变动。

21页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:图像处理装置、图像处理方法及记录介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!