一种机器学习框架下高维特征约束的初至拾取方法及系统

文档序号：1612828 发布日期：2020-01-10 浏览：14次 >En<

阅读说明：本技术 一种机器学习框架下高维特征约束的初至拾取方法及系统 (First arrival picking method and system for high-dimensional feature constraint under machine learning framework ) 是由张金淼罗飞孙文博朱振宇翁斌王小六郝振江王艳冬糜芳杨俊� 于 2019-10-11 设计创作，主要内容包括：本发明涉及一种机器学习框架下高维特征约束的初至拾取方法及系统,其特征在于,包括以下步骤：1)获取地震数据,并对地震数据进行预处理,得到地震数据的若干地震特征；2)将得到的若干地震特征作为样本输入至预先构建的改进度量方式的模糊聚类算法框架中,对地震数据的地震特征进行筛选,使得地震数据中提取的若干地震特征自动分为初至走时和非初至走时两类,完成地震初至走时的拾取,本发明可以广泛应用于地震勘探领域中。(The invention relates to a first arrival picking method and a system of high-dimensional feature constraint under a machine learning framework, which are characterized by comprising the following steps of: 1) acquiring seismic data, and preprocessing the seismic data to obtain a plurality of seismic characteristics of the seismic data; 2) the obtained seismic characteristics are input into a pre-constructed fuzzy clustering algorithm frame with an improved measurement mode as samples, the seismic characteristics of the seismic data are screened, the seismic characteristics extracted from the seismic data are automatically divided into first arrival travel time and non-first arrival travel time, and the first arrival travel time of the earthquake is picked up.)

技术领域

本发明是关于一种机器学习框架下高维特征约束的初至拾取方法及系统，属于地震勘探领域。

背景技术

走时的拾取是地震数据处理的重要一步，在层析成像、静校正、速度分析、AVO分析和地质解释中起着重要的作用，许多地球物理学家均提出了算法，用以进行走时的拾取，这些方法均有各自的优缺点和适用范围。因此，走时自动拾取方法的研究有其现实意义，算法的稳定性和准确性在经济上具有重要价值。

传统走时拾取方法大体可分为滑动时窗法和相干法(Molyneux和Schmitt，1999)两类。在滑动时窗方法中，地震信号序列其属性在连续或重叠的移动窗口中计算，相干类方法依赖于使用一些相似度测量方法比较单个或多个波形，同时，近几年来，由于人工智能的迅猛发展，机器学习算法在地球物理勘探领域的应用越来越广泛。鉴于传统走时拾取方法大多是以单道或两道为基础的处理思路，随着地震数据量的日益增大，孤立的讨论单道的地震事件提取而忽视数据的横向空间连续性，这样没有充分的利用数据的特征信息。因此，考虑如何在机器学习框架下引入高维地震数据特征约束，增强走时拾取的自动化能力，提升走时拾取的精度是很有必要的。

发明内容

针对上述问题，本发明的目的是提供一种能够增强走时拾取的自动化能力和提升走时拾取精度的机器学习框架下高维特征约束的初至拾取方法及系统。

为实现上述目的，本发明采取以下技术方案：一种机器学习框架下高维特征约束的初至拾取方法，其特征在于，包括以下步骤：1)获取地震数据，并对地震数据进行预处理，得到地震数据的若干地震特征；2)将得到的若干地震特征作为样本输入至预先构建的改进度量方式的模糊聚类算法框架中，对地震数据的地震特征进行筛选，使得地震数据中提取的若干地震特征自动分为初至走时和非初至走时两类，完成地震初至走时的拾取。

进一步地，所述地震特征包括能量特征、瞬时走时特征和/或基于图像分割的高维走时特征。

进一步地，所述能量特征为：

其中，E(i)为能量特征，d为地震数据，i为某一采样点，w为时窗大小，E(i)为地震数据中第i点的能量。

进一步地，所述瞬时走时特征为：

其中，ω为角频率，Δω为频率采样间隔，ω_max为最大频率，ω_min为最小频率，T(t,ω)为瞬时走时的时频表征，且：

其中，H(t,ω)为地震数据h(t)的时频变换。

进一步地，所述基于图像分割的高维走时特征的具体获取过程为：①通过下述公式将地震数据转化为灰度图：

D₂(x,t)＝|D(x,t)|

其中，D为地震数据的二维表示，x为地震道数，t为地震数据的纵向采样时间；

②采用高斯滤波器，对灰度图D₂(x,t)进行高斯平滑处理；③基于一阶差分，获取高斯平滑结果中每一点梯度的幅度和方向，得到灰度图中每一点的边缘强度和法向矢量；④采用非极大值，根据灰度图中每一点的边缘强度和法向矢量，确定灰度图的边缘点；⑤采用双阈值算法，连接各边缘点，得到初至走时基于图像分割的高维特征。

进一步地，所述改进度量方式的模糊聚类算法框架的构建过程为：a)确定基于子波相位的特征度量方式；b)根据确定的基于子波相位的特征度量方式，构建改进度量方式的模糊聚类算法框架。

进一步地，所述步骤a)中基于子波相位的特征度量方式为：

L₂(x_j,c_i)＝max_pcos(x_j,W(c_i,p))

其中，L₂(x_j,c_i)为样本x_j与类中心c_i局部区域内的相位变化，W为一个窗函数，p为窗函数的大小。

进一步地，所述步骤b)的具体过程为：I)初始化隶属度，使其满足约束条件；II)计算地震特征的类中心c_i：

其中，u_ij为隶属度，x_j为某一样本，c_i为某一类i的类中心，n为样本个数，m为一个隶属度的因子；III)采用基于子波相位的特征度量方式，计算地震特征的子波相位L₂(x_j,c_i)，如果地震特征的子波相位L₂(x_j,c_i)小于预设的阈值，则停止迭代，使得地震数据中代表初至走时的地震特征与代表非初至的地震特征分开，完成地震特征的分类；如果地震特征的子波相位L₂(x_j,c_i)不小于预设的阈值，则进入步骤IV)；IV)根据下述公式，计算新的隶属度，并进入步骤II)：

其中，c_k为第k类的类中心。

进一步地，所述步骤I)中的约束条件为：

一种机器学习框架下高维特征约束的初至拾取系统，其特征在于，包括：地震特征获取模块，用于获取地震数据，并对地震数据进行预处理，得到地震数据的若干地震特征；地震特征筛选模块，用于将得到的若干地震特征作为样本输入至预先构建的改进度量方式的模糊聚类算法框架中，对地震数据的地震特征进行筛选，使得地震数据中提取的若干地震特征自动分为初至走时和非初至走时两类，完成地震初至走时的拾取。

本发明由于采取以上技术方案，其具有以下优点：1、本发明在传统基于一维地震特征拾取走时的基础上，引入个高维地震数据特征(属性)，从而考虑地震数据的横向连续性，使拾取的初至走时更加具有物理意义，提升了自动拾取初至走时的精度。2、本发明采用一种基于子波相位的特征度量方式来替换传统模糊聚类算法中基于欧几里得距离的特征度量方式，使机器学习算法中的度量方式更具物理意义，提高模糊聚类分析算法的精度。3、本发明将几种经过筛选的对初至走时敏感的地震特征与机器学习算法框架有机的结合在了一起，提高了地震数据在处理解释时的信息利用率，有助于地震走时的自动化提取，具有重要的理论和应用价值，对油气、矿产资源勘探的发展有一定的推动作用。

附图说明

图1是本发明方法的流程图；

图2是本发明中举例说明的几种地震特征的对比示意图，其中，图2(a)为某一合成的原始地震数据，图2(b)为对图2(a)的地震数据进行加噪处理后的地震数据，图2(c)为地震数据的能量特征示意图，图2(d)为地震数据的瞬时走时特征示意图，图2(f)为地震数据的基于图像分割的高维走时特征示意图；

图3是本发明实施例中采用本发明的方法得到的地震数据初至拾取结果示意图，其中，黑线表示拾取结果。

具体实施方式

以下结合附图来对本发明进行详细的描绘。然而应当理解，附图的提供仅为了更好地理解本发明，它们不应该理解成对本发明的限制。

如图1所示，本发明提供的机器学习框架下高维特征约束的初至拾取方法，包括以下步骤：

1)获取地震数据，并对地震数据进行预处理，得到地震数据的若干地震特征，具体为：

如图2(a)和(b)所示，为获取的地震数据以及对该地震数据进行加噪处理后的地震数据，对于机器学习框架而言，需要输入若干对初至走时信息敏感的地震特征，该类特征应具有普适性。对于地震数据的初至走时而言，初至到达前后的能量差异最大。因此，本发明筛选下述几种地震特征相配合，用于模糊聚类分析。

1.1)能量特征

对于获取的地震数据，初至走时的位置一般定义为地震子波的起跳或是波峰位置，因此，如图2(c)所示，地震数据的能量E(i)变化是一个很好的初至走时标定特征：

其中，d为地震数据，i为某一采样点，w为时窗大小。公式(1)的含义是地震数据中第i点的能量E(i)等于地震数据中第i点局部范围(i-w,i+w)取值的平方和。基于公式(1)得到的能量特征能够放大初至走时处的能量，从而使初至走时特征更加明显，利于识别。

1.2)瞬时走时特征

传统的瞬时走时特征的提取基于傅里叶变换，而傅里叶变换仅适用于平稳数据，而地震数据一般为非平稳数据，故引入时频变换的概念，使得走时特征关于时间也是局部的，同时，不同信号的到达时间互相被孤立开，提取走时特征更加精确。基于此，如图2(d)所示，瞬时走时特征T(t)可以重新定义为：

其中，H(t,ω)为地震数据h(t)的时频变换，Im{}为取虚部，ω为角频率，Δω为频率采样间隔，ω_max为最大频率，ω_min为最小频率，T(t)则为地震数据的瞬时走时特征，T(t,ω)为瞬时走时的时频表征，且：

根据公式(2)和(3)，计算带限信号的瞬时走时可以分为互不干涉的两步：①通过公式(2)将某一地震数据映射到时间-频率域；②通过公式(3)沿着频率方向加权将时频域T(t,ω)重新映射回时间域T(t)。

1.3)基于图像分割的高维走时特征

图像分割方法在信号分析、图像处理中均已经得到广泛应用，而地震数据初至走时处的能量一般会出现跃变，形成一个较为明显的边缘。顾名思义，边缘是一个高维的概念，因此，基于Canny边缘检测器(1986)，能将初至走时在高维空间形成的一个大概边缘勾勒出来，得到高维的走时特征。

1.3.1)通过下述公式(4)将地震数据转化为灰度图：

D₂(x,t)＝|D(x,t)| (4)

其中，D为地震数据的二维表示，x为地震道数，t为地震数据的纵向采样时间。

1.3.2)采用高斯滤波器，对灰度图D₂(x,t)进行高斯平滑处理。

1.3.3)基于一阶差分，获取高斯平滑结果中每一点梯度(即每一点的一阶偏导)的幅度和方向，得到灰度图中每一点的边缘强度和法向矢量。

1.3.4)采用非极大值，根据灰度图中每一点的边缘强度和法向矢量，确定灰度图的边缘点。

1.3.5)采用双阈值算法(Otsu法)，检查和连接各边缘点，得到初至走时基于图像分割的高维特征。

如图2(f)所示，为采用上述方法得到的二维地震数据的高维特征的一道示意图，正好与前两种一维地震特征进行对比，可见高维特征对初至走时更为敏感，得到的结果更为精确。

本发明介绍了上述三种对地震初至走时较为敏感的特征，但是作为模糊聚类算法输入时，并不局限于这三种，对特征明显的地震数据可以选取两种特征即可。对于复杂地震数据，还可以按照上述思路寻找更多与初至走时相关的地震特征，但是高维地震特征的引入，才能够更合理的拾取地震初至走时。

2)构建改进度量方式(距离)的模糊聚类算法框架。

神经网络类方法，属于有监督的学习，需要大量的样本输入，而聚类分析数据无监督学习，可以根据数据的特征，自行的分为两类(地震事件和非地震事件)。因此，本发明选取模糊聚类算法作为框架，模糊聚类算法(FCM，Fuzzy C-means)的原理如下：

假定数据集为X，如果将数据集划分为C类，则对应有c个类中心，每一样本j属于某一类i的隶属度为u_ij，定义一个FCM的目标函数J及其约束条件如下：

其中，隶属度u_ij是一个样本相似于不同结果的一个程度指标；x_j为某一样本；c_i为某一类i的类中心；n为样本个数。上述公式(5)是由相应样本的隶属度与该样本到各个类中心的距离(欧几里得距离)相乘组成的，m为一个隶属度的因子(属于某样本的轻缓程度)。公式(6)为约束条件，即一个样本属于所有类的隶属度之和为1。

采用拉格朗日乘数法，求解带约束的上述公式(5)，则上述公式(5)可写成：

目标函数J对隶属度u_ij求偏导，并化简为：

根据上述公式(6)，消掉λ，得到隶属度u_ij：

其中，c_k为第k类的类中心；上述公式(9)的分子表示某点相对于某一类的类中心距离，分母表示该点相对于所有类的类中心的距离求和，两者相除表示该点到某一类中心在该点到所有类中心的距离和的比重。当求和内的分子越小，越接近于该类，则u_ij就越大，表示数据越属于该类。

同理，目标函数J对类中心c_i求偏导，并化简为：

上述公式(10)为类中心的更新法则，实质是一个所有点的加权平均，加权系数

乘以x_j即为该点对于类i的贡献值。

传统FCM算法的一般步骤为：

I初始化隶属度u使其满足公式(6)的约束条件。

II采用上述公式(10)计算类中心c_i。

III计算目标函数J，如果目标函数J小于预设的阈值，则停止迭代；如果目标函数J不小于预设的阈值，则进入步骤IV。

IV根据公式(9)，计算新的隶属度u，并进入步骤II。

基于上述原理，本发明中构建改进度量方式的模糊聚类算法框架的具体过程为：

2.1)确定基于子波相位的特征度量方式。

众所周知，有很大一部分的机器学习算法均会引入距离的概念来判别不同类别的差异，例如聚类分析。根据上述公式(5)可知，传统FCM算法的度量方式是该样本到各个类中心的距离L₁(x_j,c_i)(欧几里得距离)：

L₁(x_j,c_i)＝||x_j-c_i||² (11)

本发明在此基础上提出一种新的基于子波相位特征的度量方式，如下述公式(12)所示：

L₂(x_j,c_i)＝max_pcos(x_j,W(c_i,p)) (12)

其中，L₂(x_j,c_i)为样本x_j与类中心c_i局部区域内的相位变化，W为一个窗函数，p为窗函数的大小。上述公式(12)即为新的基于子波相位特征的度量方式，其与公式(11)即传统的欧几里得距离度量形式存在明显差异。其物理含义是，公式(12)不仅保证该样本距离其某一类的距离最短，同时要保证，样本x_j与类中心c_i局部区域内的子波相位保持一致。

2.2)根据确定的基于子波相位的特征度量方式即公式(12)，构建改进度量方式的模糊聚类算法框架。

地震数据均包括子波相位特征，地震事件和非地震事件的子波相位存在明显不同。因此，本发明将传统的FCM算法流程中步骤III的目标函数J(即公式(5))替代为公式(12)，构成改进度量方式的模糊聚类算法框架。只有在样本邻近类中心同时子波相位差异不大时，残差才能达到最小，才能将地震数据自行的分为两类(地震事件和非地震事件)，同时保证分类更具有物理意义，精度更高，即本发明的改进度量方式的模糊聚类算法框架包括以下内容：

2.2.1)初始化隶属度u，使其满足公式(6)的约束条件。

2.2.2)采用上述公式(10)，计算地震特征的类中心c_i。

2.2.3)采用基于子波相位的特征度量方式，计算地震特征的子波相位L₂(x_j,c_i)，如果地震特征的子波相位L₂(x_j,c_i)小于预设的阈值，则停止迭代，使得地震数据中代表初至走时的地震特征与代表非初至的地震特征分开，完成地震特征的分类；如果地震特征的子波相位L₂(x_j,c_i)不小于预设的阈值，则进入步骤2.2.4)，其中，阈值可以根据实际情况进行设定，在此不多做赘述。

2.2.4)根据上述公式(9)，计算新的隶属度u后，进入步骤2.2.2)。

3)将得到的若干地震特征作为样本x_j输入至构建的模糊聚类算法框架中，对地震数据的地震特征进行筛选，使得地震数据中提取的若干地震特征自动分为初至走时和非初至走时两类，完成地震初至走时的拾取。

结合地震特征，上述公式(5)中的x_j和c_j应该是高维函数，函数某一分量则代表一种特征，其维度就是特征的个数。根据步骤1)给出的几种地震特征，采用公式(12)的改进模糊聚类算法，便能全自动地将地震数据分为初至走时和非初至走时两类，从而实现自动拾取地震初至走时的目的。

如图3所示，为对BZ29地区某一实际地震数据采用本发明的方法得到的地震数据初至拾取结果示意图，可以看出，本发明的方法能够成功的拾取450-550道(吸收衰减，能量较弱区域)以及600道附近(信噪比较低的区域)的初至走时信息。这是因为本发明的方法不仅考虑地震数据的横向连续性，同时考虑了子波的一致性，相比传统的初至拾取方法而言，拾取精度更高，也更具有物理意义。

基于上述机器学习框架下高维特征约束的初至拾取方法，本发明还提供一种机器学习框架下高维特征约束的初至拾取系统，包括：

地震特征获取模块，用于获取地震数据，并对地震数据进行预处理，得到地震数据的若干地震特征；地震特征筛选模块，用于将得到的若干地震特征作为样本输入至预先构建的改进度量方式的模糊聚类算法框架中，对地震数据的地震特征进行筛选，使得地震数据中提取的若干地震特征自动分为初至走时和非初至走时两类，完成地震初至走时的拾取。

上述各实施例仅用于说明本发明，其中各部件的结构、连接方式和制作工艺等都是可以有所变化的，凡是在本发明技术方案的基础上进行的等同变换和改进，均不应排除在本发明的保护范围之外。

12页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：一种井震标定方法

一种机器学习框架下高维特征约束的初至拾取方法及系统

相关技术

网友询问留言