文章快速检索  
  高级检索
基于非线性分类网络的气体钻井风险智能识别方法
夏文鹤1, 赵宗旭1, 李皋2, 李永杰2, 李宬晓3, 陈向东4    
1. 西南石油大学电气信息学院, 四川 成都 610500;
2. 西南石油大学石油与天然气工程学院, 四川 成都 610500;
3. 中石油川庆钻探钻采工程技术研究院, 四川 德阳 618300;
4. 西南交通大学信息科学与技术学院, 四川 成都 610031
摘要: 针对气体钻井领域现有的风险智能识别方法泛化性差,且在风险发生初期识别正确率偏低,导致风险正确识别时间点滞后的问题,对气体钻井随钻监测数据进行挖掘分析,并提出了一种适用于该场景下的改进卷积神经网络模型,用于钻井工况的风险识别。该模型采用卷积层提取多个随钻监测参数随时间变化的关联特征,采用具有非线性分类能力的RBF(radial basis function)网络替换全连接层进行特征分类,提升分类精度的同时,也将工况过渡阶段风险识别的时间点进一步提前。引入K均值算法对RBF聚类中心以及中心宽度值进行初始化,解决不合理初始值导致模型对工况样本训练无法收敛的问题。引入基于距离均方误差的损失函数分量,对整个网络模型进行训练来优化模型参数,以保证网络训练过程中能不断调整最佳聚类中心。制定了一种隐藏层节点数选取准则以提高模型的计算效率和泛化性。与传统卷积神经网络模型进行了现场应用对比,结果显示,该网络模型对产气、出水、卡钻三种常见风险识别时间点提前56 s、16 s、8 s,充分展现了非线性分类神经网络在油气田勘探开发领域的适用性。
关键词: 气体钻井    钻井风险智能识别    非线性分类    卷积神经网络    RBF神经网络    K均值算法    
Intelligent Identification Method of Gas Drilling Risk Based on Nonlinear Classification Network
XIA Wenhe1, ZHAO Zongxu1, LI Gao2, LI Yongjie2, LI Chengxiao3, CHEN Xiangdong4    
1. School of Electrical Engineering and Information, Southwest Petroleum University, Chengdu 610500, China;
2. School of Oil & Gas Engineering, Southwest Petroleum University, Chengdu 610500, China;
3. CCDC Drilling & Production Engineering Technology Research Institute, Deyang 618300, China;
4. School of Information Science and Technology, Southwest Jiaotong University, Chengdu 610031, China
Abstract: The existing risk intelligent identification methods in the field of gas drilling have poor generalization, and the low recognition rate in the early stages of risk leads to a delay in the correct risk identification. In this study, we perform data mining analysis of gas drilling while drilling monitoring data and propose an improved convolutional neural network model to identify the risk of drilling conditions. In this model, we extract the time-varying correlation features of multiple monitoring parameters while drilling using the convolution layer. We also replace the full connection layer for feature classification by using a radial basis function (RBF) network with nonlinear classification ability. The use of RBF improves classification accuracy and reduces the time of risk identification in the transitional stage of working conditions. Since the model cannot converge to the working condition sample training due to an unreasonable initial value, we introduce the K-means algorithm to initialize the RBF clustering center and center width to resolve this issue. We introduce the loss function component based on the distance mean square error to train the whole network model. The loss function also allows the optimization of model parameters, ensuring the continuous adjustment of the optimal clustering center in the process of network training. We also formulate a criterion for selecting the number of hidden layer nodes so as to improve calculation efficiency and facilitate the generalization of the model. The network model is then compared with the traditional convolution neural network model for field application. Our experimental results show that the identification time points of three common risks, i.e., gas production, water production, and sticking drill, are advanced by 56 s, 16 s and 8 s when using our network model. This finding fully demonstrates the applicability of nonlinear classification neural network in the field of oil and gas field exploration and development.
Keywords: gas drilling    intelligent identification of drilling risk    nonlinear classification    convolutional neural network    RBF neural network    K-means algorithm    

0 引言

近年来,气体钻井在国内发展迅速,但同时也存在着一些安全问题[1]。目前,对于气体钻井安全风险的监测手段仍存在不足,监测数据出现异常时,需要监测人员及时、准确地进行判断[2]。这就导致现场对于异常风险的诊断存在较强的主观性和滞后性[3],同时因不同地区钻井条件的差异性导致反映异常风险是否发生的相关参数特征差异较大,也增加了现场监测的难度。如何及时、准确地识别随钻安全风险并做出相应处理,已经成为了保证气体钻井成功率的重要环节[4]。2014年,艾二鑫等[5]对地层出水、钻具失效等异常风险进行了分析,为气体钻井部分异常风险的诊断提供了一定的理论基础。2015年,李皋等[6]总结了气体钻井过程中地层产气、地层出水、井壁失稳、井下燃爆等主要风险发生时的风险表征参数,建立了不同安全风险参数变化的关系模型。2017年,管志川等[7]针对常见的井下工程风险提出利用模糊数学理论建立不同程度的隶属度函数进行风险概率计算。2019年,孙挺等[8]提出基于支持向量机的钻井风险智能识别方法,建立了多个智能识别模型,利用数据驱动的方式实现对正常钻进的风险诊断,提高了钻井时效。可见,钻井技术在向智能化的方向发展,但目前主要通过数据分析以及传统算法建模对风险进行预测或者理论研究,缺乏对于异常风险现场实时诊断的案例。2022年,胡万俊等[9]对气体钻井过程中的地层产气、地层出水、卡钻和接立柱等风险进行了相关性分析,构建了不同风险对应的数据模型,并利用卷积神经网络进行风险诊断,准确率达到90%左右,但该方法需要设计结构复杂的全连接层才能有效处理钻井现场高度复杂的非线性问题,导致网络泛化性差,且计算量大,在现场应用过程中对新接收数据的诊断存在一定时延,不能很好地满足钻井风险处理分秒必争的应用需求,故目前国内外钻井尤其是欠平衡钻井领域,尚无较成熟的随钻风险智能识别和评价系统。

因此,本文提出了一种基于RBF分类器的改进卷积神经网络,实现对气体钻井风险快速准确的识别。RBF神经网络相较传统全连接神经网络而言可以将低维数据映射到高维数据,在一定程度上实现非线性分类任务,同时RBF神经网络还是对连续函数的最佳逼近,存在“局部映射”的特点,因此泛化能力更好,计算速度更快[10-11]。另外,引入K均值算法对RBF聚类中心及中心宽度值进行了初始化,解决了不合理初始值导致模型对工况样本训练无法收敛的问题。实验以及现场应用结果表明,该方法相较于传统卷积神经网络,能够在提高识别精度的同时,进一步将工况过渡阶段风险识别的时间点提前,对处理气体钻井作业过程中随时突发的风险赢得了关键的时间。

1 气体钻井随钻风险智能识别模型 1.1 安全风险样本模型

气体钻井随钻监测系统监测仪器众多,钻井现场的随钻监测传感器每2 s向监控室传输一组数据,数据繁杂,整个监测过程中有很多都是无风险发生的正常钻进数据,且同一风险在不同地区的表征参数可能存在较大差异。本文参考胡万俊等[9]所做的各类风险相关性分析结果,在其基础上对气体钻井随钻监测过程中常见的3个安全风险:地层产气、地层出水和卡钻进行了相关表征参数的分析总结。由于地层产气和卡钻风险发生时相关表征参数变化迅速且幅度较大,所以构建参数模型时以60 s为一个样本时间跨度。发生地层出水时相关参数变化缓慢且幅度较小,为了充分体现地层出水时参数变化趋势,因此选择120 s为一个样本时间跨度。根据多次现场测试经验,最终针对不同风险构建了一个风险表征参数模型如表 1所示。

表 1 安全风险表征参数模型 Tab.1 Safety risk characterization parameter model
安全风险类型 样本时间跨度120 s 样本时间跨度60 s
大钩负荷 立管压力 出口湿度 转盘转速 转盘扭矩 管线排压A 管线排压B 甲烷浓度 管线差压 氧气浓度
地层产气
地层出水
卡钻
1.2 安全风险识别网络模型 1.2.1 特征提取网络模型

本文所设计的风险识别模型结构如图 1所示。将建立好的风险表征参数模型作为卷积层的输入样本,输入层样本为p×n(p=30,60)的矩阵。常规的卷积神经网络的卷积层采用一层一层叠加的方式并且每层只有一个尺寸的卷积核[12],而本设计中卷积层C1C2均使用了3个不同尺度的卷积核用于提取输入数据之间的隐含信息。卷积核C1的目的是为了提取各参数本身所隐含的特征信息,卷积层C2的目的是为了提取各参数之间所隐含的联系,最后将不同尺度的特征结合起来得到更丰富的特征信息。

图 1 神经网络模型结构图 Fig.1 Structure diagram of neural network model

各个风险的输入数据模型结构不同,因此针对不同风险下所使用的卷积核尺寸如表 2所示。输入数据每一列表示参数随时间变化的关系,卷积层C1的卷积核尺寸为m×1,m表示卷积核C1的长度,由于本文卷积层C1使用了不同尺寸卷积核,下文用m1m2m3表示。利用卷积层C1对各个参数在时间信息上的特征进行提取,通过多个卷积核计算使得特征更加丰富。卷积层C2同样使用了多个尺寸为1×n的卷积核,n表示卷积层C2的卷积核宽度,用于提取风险发生时表征参数之间的相互关系,其中n表示该风险发生时的表征参数个数。另外,因为ELU(exponential linear units)函数相比于其它激活函数能够改进学习特性,有效地防止梯度消失且具有更好的泛化性能[13],所以将各层卷积层卷积后的结果利用ELU函数激活。ELU函数的表达式为

(1)
表 2 卷积层C1C2参数取值 Tab.2 Parameter values of convolution layer C1 and C2
安全风险类型 m1 m2 m3 n
地层产气 10 20 30 5
地层出水 10 30 60 3
卡钻 5 15 30 2

式中,α为超参数,用于控制对负输入的响应值。

1.2.2 非线性分类网络模型

气体钻井的异常风险发生过程中各监测数据呈现出高度复杂的非线性特征。将多井次收集的卡钻风险监测数据与正常钻进风险监测数据经特征提取处理后映射到2维平面PC1与PC2上,可得到如图 2所示的投影结果。

图 2 数据点2维空间投影图 Fig.2 2D spatial projection of data points

图 2中类别1表示卡钻风险未发生,类别2表示风险发生。由图 2可以看出虽然转盘转速和转盘扭矩参数与卡钻风险高度关联,并可在一定程度表征卡钻风险,但在2维平面上无法直接通过一条直线将两类风险数据点进行准确区分,也即转盘转速和转盘扭矩参数与卡钻风险发生与否存在一定非线性关系,是一个典型的线性不可分割问题。传统卷积神经网络对数据进行分类往往通过全连接层进行处理,全连接层在处理这种复杂非线性问题时,各层之前所有节点均通过线性加权的方式对数据进行拟合:

(2)

式中,yk表示整个网络输出结果,r表示隐藏层节点数,ωkj表示权重,φj表示第j个隐藏层节点输出,b表示偏置。

如需对复杂的非线性数据进行分类处理,全连接层可通过增加隐藏层层数或者节点数的方式实现近似非线性分类的效果,但由于结构自身的局限性,往往难以达到理想的结果。结构复杂则会导致参数过多,计算效率低,无法满足钻井现场对于计算速度的需求,且泛化性较低[14]。因此本文提出采用非线性网络作为分类器来对数据进行分类处理。通过综合对比,选择RBF网络实现上述功能,其分类网络结构如图 1所示。

RBF神经网络是一个3层前馈神经网络,由输入层、隐藏层和输出层组成[15]。输入层到隐藏层是一个非线性的信息传递过程,隐藏层通常用高斯核函数作为径向基函数[16],通过计算输入向量与聚类中心之间的欧氏距离及调整中心向量的宽度来控制径向作用范围,再计算其高斯值得到隐藏层节点输出为

(3)

式中,xi表示第i个样本点,cj表示第j个隐藏层节点的中心点,δj表示第j个隐藏层节点中心点的宽度,A为幅值。选取不同中心向量以及中心向量的宽度的2维高斯核函数图如图 3所示,取幅值

图 3 2维高斯核函数图 Fig.3 2D Gaussian kernel function diagram

高斯核函数作为非线性函数,通过调整δj2参数值来控制函数映射范围,函数的输入样本点xi靠近函数的中心区域时,输出值越大,当输入距离值为0时,函数输出最大值A,反之,当输入距离逐渐增加,模型输出呈现非线性递减状态。由此可以看出径向基函数对输入信号在局部产生响应,且具有局部非线性逼近能力,也即通过计算数据点的高斯核函数值,将其映射到更高维的空间内。根据Cover定理,将输入向量从低维线性不可分的情况映射到高维空间后数据将变得线性可分。如本节选取中心坐标为(0,0),δj2=0.01并通过式(3)的高斯核函数对图 3中的数据点进行一次升维后得到的结果如图 4所示。

图 4 中心坐标(0,0)的3维空间投影图 Fig.4 3D projection of central coordinates (0, 0)

可以看出高斯核函数是一个关于中心向量对称的函数,升维后的3维空间数据点分布在高斯曲面上,相较于2维空间,存在一个平面使数据变得更接近直接线性可分的条件,虽然仍然存在部分数据点不可直接分割,但数量已大幅下降,也意味着分类精度的大幅提升。若进一步采用更高维的空间,分类精度可继续提升。对网络结构而言,当输入样本点xi越靠近中心点cj时,隐藏层节点的响应越强,对最终输出结果影响也越大,反之,则影响很小,充分体现了RBF网络计算速度快的特点以及局部逼近特性。利用高斯核函数的特性,一个简单的3层网络结构的RBF神经网络理论上可以逼近任意非线性函数,可以模拟出数据内部难以解析的规律性[17]。因此,以RBF网络作为分类器能更好满足气体钻井风险识别场合下对实时性以及适应性的需求。

最后,通过对隐藏层节点输出进行式(2)的加权求和得到神经网络的输出Y=[y1y2]T,并通过Softmax函数激活后表示某种安全风险发生的概率。

2 网络模型参数设置及优化 2.1 K均值算法确定RBF结构模型初始参数

本节根据图 2所示的数据点随机选取(-5,5)作为中心坐标,通过式(3)计算对相应的高斯值,对数据进行升维,得到3维图像,如图 5所示。

图 5 中心坐标(-5,5)的3维空间投影图 Fig.5 3D space projection of central coordinates (-5, 5)

图 5可以看出标记的位置有大量不同类别的数据点混合,且在其余位置仍然存在少部分不同类别数据点相互混合。相较于图 4选取(0,0)做高斯核函数中心点时的3维图像,图 5很难找出一个平面能尽可能地将两类数据点进行直接划分,由此可知RBF神经网络的聚类中心以及宽度直接影响着整个模型的最终结果[18]

1988年,MOODY等[10]提出用无监督学习的算法来初始化聚类中心,所选取损失函数计算公式为

(4)

式中,yk*(·)表示该输入向量对应的标签值。

此外MOODY等也证明有监督学习利用梯度下降使误差最小化的方式来优化中心点cj、宽度δj和权重ωkj,会将学习视为非线性优化问题,故往往需使用初始化权重从头开始优化整个网络模型,导致了收敛缓慢。

基于上述分析,本文利用K均值算法对卷积网络所识别的特征信息进行聚类中心初始化。K均值算法是典型的无监督学习方式,由MACQUEEN提出[19],对于输入数据不需要定义标签,只根据样本之间的距离作为相似性的评判标准,符合本研究应用场景。基于K均值算法优化RBF层参数步骤为:

步骤1  将卷积神经网络所提取的输入样本特征信息作为K均值算法的输入X={X1X2,…,XN}。选取h个不同的输入样本特征信息作为随机初始化的聚类中心。

步骤2  计算输入样本点Xi与初始化聚类中心cj(s)之间的距离:

(5)

式(5)中s表示模型迭代次数。将输入样本X按照最小距离准则进行划分,将根据式(5)所计算的最小欧氏距离对应的输入样本点Xi划入类簇λj(s)中,即Xiλj(s),类簇λj(s)数量与初始聚类中心cj(s)数量相同。

步骤3  根据新划分的类重新计算聚类中心:

(6)

步骤4  重复步骤2、步骤3的操作,当新的聚类中心不再发生变化时,输出最终的中心点cj,并按照式(7)计算隐藏层节点的宽度δj

(7)

式中,σ表示重叠系数,表示第j个聚类中心点与其相距最近的样本中心点cr之间的距离。将通过K均值算法求得的初始化中心点cj与宽度δj代入式(3)即可得到各个隐藏层节点的输出,再将隐藏层节点的输出进行加权求和即可得到安全风险工况发生概率。

2.2 反向传播训练网络模型

第2.1节采用的K均值优化方法已经根据训练样本的特点确定了网络的初始中心点以及宽度,但是在图 1的CNN-RBF(convolutional neural network-radial basis function)网络模型训练过程中,CNN层所提取的特征信息会不断得到优化,最佳的聚类中心可能会发生改变,这会导致一开始通过K均值算法初始化的聚类中心和宽度变得不适合。因此,为了达到更快的训练效率和更准确的识别效果,本节在第2.1节采用方法的基础上根据式(4)提出了一个新的损失函数分量,用于训练更新K均值算法的聚类中心:

(8)

式(8)表示将每个样本与聚类中心距离的均方误差求和。CNN-RBF网络模型训练过程中损失函数的计算方法可修改为

(9)

式(9)中lossul表示无监督学习部分的均方误差损失函数。反向传播过程使用Adam优化器,在反向传播训练时对整个神经网络的所有权重、偏置进行优化,并优化cj以及δj

2.3 隐藏层节点数选取准则

在限定隐藏层数的条件下,隐藏层节点数对RBF分类器的性能有着重大影响,隐藏层节点数过少会导致模型出现欠拟合现象,而节点数过多会导致模型结构变得复杂,泛化性降低,训练时间过长[20]。在气体钻井工况智能识别场景中,对模型计算效率以及泛化性的要求都较高。因此,为了满足现场应用的需求,对于隐藏层节点数的合理选择变得极为重要。本文提出了一种隐藏层节点数选择的方法,该方法对网络模型的测试集准确率以及训练时间赋予权重,并根据不同隐藏层节点数对应的两个参数的比值来判定隐藏层节点的选取是否合理。其具体实现过程为:

1) 根据实际问题确定网络模型的基本结构,如输入层以及输出层的节点个数。

2) 根据经验法选取初始的隐藏层节点个数:

(10)

式中,r表示隐藏层节点数,i表示输入层节点数,k表示输出层节点数,ε选取为[0, 10]区间的常系数。

3) 对网络进行训练得到最终训练时间T以及测试集准确率B,为了消除指标之间的量纲影响,将训练时间以及测试集准确率进行0-1归一化。再根据时间以及准确率的重要性分别赋予权重μν,得到不同隐藏层节点数对应评价值C(r):

(11)

4) 针对不同风险识别模型设置不同的隐藏层节点数增量Δr,并重复步骤3)得到新的评价值C(r+1)。若新的评价值持续降低或者趋于不变则停止增加隐藏层节点数。

5) 为了便于观察又不改变数据之间的关系,将不同隐藏层节点数对应的评价值进行0-1归一化[21],将归一化后评价值C(r)为100%的点对应的隐藏层节点数作为最优节点数。

在本文所提出的隐藏层选取规则下,3种工况所得到的评价值与隐藏层节点数关系如图 6所示。从图 6可以看出地层产气与卡钻模型分别在隐藏层节点数为29和25时评价值为100%。根据经验选取两个模型的隐藏层节点数增量都为1,且在评价结果达到最优以后逐渐变差。出水模型在隐藏层节点数为40时评价值达到100%,隐藏层节点数增量为5,在达到最优评价结果后,随着隐藏层节点数增加评价结果逐渐变差。

图 6 不同风险的隐藏层节点数评价结果 Fig.6 Evaluation results of hidden layer nodes with different risks
3 网络模型训练结果与现场应用 3.1 神经网络模型训练效果

本文的数据来自于不同地区气体钻井随钻监测系统所采集到的监测数据,将10余口井的历史监测数据按照地层产气、地层出水、卡钻风险发生时的相关表征参数进行整理,建立本文第1.1节所示的样本模型,将其划分为测试集和验证集。为了验证本文所提出的网络模型性能,使用2.3节所选取的不同风险对应的最佳隐藏层节点数构建分类网络,并将本文所提出的网络模型与传统的卷积神经网络的实验结果进行对比。另外,为了验证本文所提出的模型相较于单一的RBF神经网络效果是否变得更好,本节按照相同方式构建了一个RBF网络模型来进行性能对比。

地层产气风险的样本训练集训练结果如图 7所示。将本文改进的CNN-RBF神经网络、卷积神经网络和RBF神经网络同时训练8 000次。地层产气风险的表征参数较多,样本中所蕴含的特征信息丰富。由图 7可以看出改进的CNN-RBF网络训练效果最好,在训练4 000次左右loss值基本收敛,最终训练集的准确率达到98%。

图 7 地层产气风险训练结果 Fig.7 Training results of formation gas production risk training set

地层出水风险的样本训练集训练结果如图 8所示。由图 8可以看出,3种神经网络在训练8 000次后损失值最终都收敛。RBF神经网络对地层出水训练集的准确率仅有83%,卷积神经网络对训练集准确率达到94%,而改进后的CNN-RBF神经网络对训练集准确率在训练步数达到4 000次以后基本不变最终达到95%。

图 8 地层出水风险训练结果 Fig.8 Training results of formation water production risk training set

卡钻风险的表征参数有转盘钻速和转盘扭矩两个参数。3种网络的训练结果如图 9所示。可以看出3种神经网络的损失值都收敛的很快且准确率都达到了90%以上,这表明3种神经网络训练效果良好。

图 9 卡钻风险训练结果 Fig.9 Training results of sticking drill risk training set

测试集在3种神经网络中的准确率如表 3所示。在不同风险下的网络训练损失值都收敛,说明3种神经网络都具有良好的训练效果,但从对测试集的最终识别结果可以看出,3种神经网络对测试集的识别准确率存在差异。由表 3可以看出改进的CNN-RBF神经网络对3种风险的测试集的准确率分别达到97.32%、95.25%、93.78%,均好于卷积神经网络以及RBF神经网络的测试结果。

表 3 测试集测试结果对比 Tab.3 Test result comparison of the test sets  
单位: %
安全风险 测试集准确率
CNN-RBF CNN RBF
地层产气 97.32 92.49 89.01
地层出水 95.25 88.96 82.45
卡钻 93.78 89.27 92.01

实验结果表明在对气体钻井风险识别的场合下,本文所提出的神经网络表现出了更突出的性能优势,能成功推理出数据内部所蕴含的规律性。卷积层采用多个卷积核同时提取特征信息的方式使得网络模型对于数据具有更丰富的特征提取能力,将RBF神经网络作为分类器应用于卷积神经网络,网络模型对于数据之间所蕴含特征信息的分析处理能力得到了有效地增强。

3.2 现场应用

3.1节对测试集样本进行测试后,结果表明CNN-RBF方法具有更好的识别效果,为了进一步验证该方法对钻进风险即将发生的过渡阶段也有良好的分类识别效果,在地质环境差异较大的油气区块进行现场钻井风险监测识别服务和测试,把训练好的网络模型与气体钻井随钻监测系统相结合,将现场实时采集的相关参数,按照本文第1.1节所提出的方式建立不同数据模型,输入不同网络模型进行实时风险识别,得到网络模型的输出为风险发生的概率。

3.2.1 地层产气风险应用

以产气风险为例,钻井现场情况复杂,关闭降尘水,改变注气量等操作都有可能会影响地层产气风险表征参数变化,尤其当甲烷浓度变化较小时,现场监控人员往往难以第一时间做出反应。金浅A井和新B井发生产气风险时的表征参数变化如图 10所示,现场监测时报与测试结果如表 4所示。两口井的产气阶段前期数据变化趋势不同,且部分表征参数存在较为复杂的变化趋势,呈现典型的非线性变化特征。这些变化对网络的分类识别准确度有较大影响,而准确的识别结果直接关系着钻井现场的安全性,因此快速获得准确的识别结果,也是算法识别效果的重要体现。

图 10 产气风险前期表征参数变化情况 Fig.10 Changes of characterization parameters in the early stage of gas production risk
表 4 产气风险过渡阶段监测时报与测试结果 Tab.4 Monitoring times and test results of gas production risk transition stage
井名 监测时报风险时间点 风险发生时间点识别概率值/%
CNN-RBF CNN RBF
金浅A 4∶55 60.46 41.35 19.25
B 19∶30 61.66 34.97 27.62

金浅A井在现场人员判定产气风险发生前红外甲烷含量就已经达到1%,氧气浓度始终处于比较平稳的阶段,但管线排压在宏观上存在先下降再上升趋势以及微观上的剧烈波动。对于这种非典型的变化过程,CNN-RBF网络在4∶ 55∶ 42时间点输出产气工况标签,而此时采用全连接分类器的CNN网络未能及时有效的识别工况,直到4∶ 56∶ 38才输出产气工况标签,滞后接近1 min。

B井在红外甲烷含量剧烈上涨前出现了排压的大幅上涨后再骤降现象,氧气浓度在甲烷浓度上升到6%后骤降。这种变化过程在以往的监测过程中较为少见,但CNN-RBF网络在红外甲烷值小幅上涨后的19∶ 30∶ 54时间点立即输出产气工况标签,而此时采用全连接分类器的CNN网络仍未能及时有效的识别工况,直到19∶ 31∶ 16才输出产气工况标签,滞后22 s。

根据专家经验将风险识别阈值设为60%,当网络输出高于60%时认定为风险发生。随后现场钻井监控人员根据现场监测数据以及网络风险提示,在监测时报中确定金浅A井在4∶ 55发生地层产气风险,新B井在19∶ 30发生地层产气风险。对图 10表 4进行分析可以看出3种神经网络都能识别出风险发生,但是无论在金浅A井和新B井的风险发生前期当CNN-RBF判定产气风险发生时,CNN和RBF都远达不到判定风险发生的标准,因此CNN-RBF对该阶段的监测数据能够更早的进行识别,识别结果更加符合现场监测时报的结论,且对钻井现场复杂的非线性数据具有更优秀的分析处理能力。在后续多次现场应用中得到证明,CNN-RBF识别风险发生的时间点始终比传统算法更早,也充分说明了该算法对于不同区块风险识别的有效性和稳定性。

3.2.2 地层出水风险应用

本节选取新A井和新盛B井在随钻监测过程中地层出水时间段的测试结果进行说明。测试方式以及判定风险是否发生的方式与地层产气风险识别方式相同,其中新A井地层出水风险发生前期测试结果如图 11所示。

图 11A井出水风险前期表征参数变化情况 Fig.11 Changes of characterization parameters in the early stage of water production risk in Xin A well

图 11可已看出新A井地层出水前期,立管压力一直在缓慢上升,大钩负荷在出口湿度突然上升前出现了突变和抖动。本文所提出的网络模型在现场出口湿度还未发生显著变化时,于10∶ 27∶ 19即根据多个表征参数的变化判定地层出水风险发生,比CNN网络提前了8 s,比RBF网络提前了22 s,由表 5可知在此时CNN和RBF网络的识别概率仅为47.03%、35.12%,并未达到判定风险发生的标准。随后现场钻井监控人员根据现场监测数据以及网络风险提示,在监测时报中判定出水时间点发生在钻井时间10∶ 27,认可CNN-RBF网络识别结果。

表 5 出水风险过渡阶段监测时报与测试结果 Tab.5 Monitoring times and test results of water production risk transition stage
井名 监测时报风险时间点 风险发生时间点识别概率值/%
CNN-RBF CNN RBF
A 10∶27 60.18 47.03 35.12
新盛B 5∶42 63.66 39.15 40.62

在另一井场新盛B井的现场应用过程中,CNN-RBF模型在现场时间5∶ 41∶ 51判定地层出水,相较CNN和RBF网络识别结果提前了16 s。由表 5可知监测时报专家结论表明新盛B井地层出水发生在5∶ 42,CNN-RBF识别结果比监测时报汇报时间更早。由此表明本文所提出的网络模型在识别地层出水风险时,能有效地根据相关风险发生时的表征参数变化对风险进行及时的判断,达到较好的识别效果。

3.2.3 卡钻风险应用

卡钻风险往往直接影响气体钻井是否还能正常钻进,因此对卡钻风险的及时识别非常重要,本文提出的改进的CNN-RBF网络模型反应迅速,能够及时给监控人员提供辅助判断,通知司钻处理,确保整个钻井过程的顺利进行。在丰谷A井发生卡钻风险过程中,改进的CNN-RBF神经网络在现场时间21∶ 52∶ 37提示发生卡钻风险,相较于卷积神经网络和RBF神经网络识别结果分别提前了8 s和7 s。监测时报专家结论表明丰谷A井卡钻发生在井深4 609.99 m,时间为21∶ 52,识别结果与监测时报基本符合。

4 结论

本文提出CNN-RBF神经网络模型对气体钻井风险进行快速有效的识别,对于维护气体钻井正常运行,降低钻井成本等方面具有重要意义。经过多次现场应用表明,本文所提出的风险识别模型对不同地区气体钻井安全风险都能准确识别,且相较于传统CNN,最高提前56 s识别出地层产气风险,提前16 s识别出地层出水风险,提前8 s识别出卡钻风险,具有良好的时效性以及泛化性。目前油气田勘探开发领域各类、各型海量数据呈现非线性关系特征,急待采用合理的方法实现挖掘和利用,这为非线性分类神经网络模型提供了广阔的应用前景。

参考文献
[1]
许期聪, 刘奇林, 侯伟. 四川油气田气体钻井技术[J]. 天然气工业, 2007(3): 60-62.
XU Q C, LIU Q L, HOU W. Gas drilling technology in Sichuan oil and gas field[J]. Natural Gas Industry, 2007(3): 60-62.
[2]
李海涛. 气体钻井安全监测数据的随钻分析与应用[D]. 成都: 西南石油大学, 2016.
LI H T. Analysis and application of gas drilling safety monitoring data while drilling[D]. Chengdu: Southwest Petroleum University, 2016.
[3]
李宬晓, 周长虹, 邓柯. 基于BP神经网络的气体钻井复杂工况预警技术研究与应用[J]. 钻采工艺, 2018, 41(2): 13-15.
LI C X, ZHOU C H, DENG K. Research and application of early warning technology for complex working conditions of gas drilling based on BP neural network[J]. Drilling & Production Technology, 2018, 41(2): 13-15.
[4]
WU H, CHEN P, FAN X Y, et al. Research on rapid identification and evaluation technology for gas formation during underbalanced drilling[J/OL]. Geofluids, 2017[2021-02-20]. https://www.hindawi.com/journals/geofluids/2017/2742637/. DOI: 10.1155/2017/2742637.
[5]
艾二鑫, 陈庆, 石陕龙. 气体欠平衡钻井的特点分析与研究[J]. 辽宁化工, 2014, 43(3): 333-335, 339.
AI E X, CHEN Q, SHI S L. Analysis and research on characteristics of gas underbalanced drilling[J]. Liaoning Chemical Industry, 2014, 43(3): 333-335, 339.
[6]
李皋, 李诚, 孟英峰. 气体钻井随钻安全风险识别与监控[J]. 天然气工业, 2015(7): 66-72.
LI G, LI C, MENG Y F. While-driling safety risk identification and monitoring in air drilling[J]. Natural Gas Industry, 2015(7): 66-72.
[7]
管志川, 赵廷峰, 胜亚楠. 复杂地层钻井风险程度判别方法研究[J]. 石油钻采工艺, 2015, 37(3): 11-14, 22.
GUAN Z C, ZHAO T F, SHENG Y N. Study on discrimination method of drilling risk degree in complex formation[J]. Oil Drilling & Production Technology, 2015, 37(3): 11-14, 22.
[8]
孙挺, 赵颖, 杨进. 基于支持向量机的钻井风险实时智能识别方法[J]. 石油钻探技术, 2019, 47(5): 28-33.
SUN T, ZHAO Y, YANG J. Real time intelligent identification method of drilling conditions based on support vector machine[J]. Petrolume Drilling Techniques, 2019, 47(5): 28-33.
[9]
胡万俊, 夏文鹤, 李永杰. 气体钻井随钻安全风险智能识别方法[J]. 石油勘探与开发, 2022, 49(2): 377-384.
HU W J, XIA W H, LI Y J. An intelligent identification method of safety risk while drilling in gas drilling[J]. Petroleum Exploration and Development, 2022, 49(2): 377-384.
[10]
MOODY J, DARKEN C. Fast learning in networks of locally-tuned processing units[J]. Neural Computation, 1989, 1(2): 281-294.
[11]
GIROSI F, POGGIO T. Networks and the best approximation property[J]. Biological Cybernetics, 1990, 63: 169-176.
[12]
孟琭, 孙霄宇, 赵滨, 等. 基于卷积神经网络的铁轨路牌识别方法[J]. 自动化学报, 2020, 46(3): 518-530.
MENG L, SUN X Y, ZHAO B, et al. Recognition method of railway sign based on convolution neural network[J]. Acta Automatica Sinica, 2020, 46(3): 518-530.
[13]
DJORK-ARNÉ C, UNTERTHINER T, HOCHREITER S. Fast and accurate deep network learning by exponential linear units (ELUs)[J]. Computer Science, 2015, 21(19): 289-295.
[14]
TIAN Q, YUAN S, QU H. Intrusion signal classification using stochastic configuration network with variable increments of hidden nodes[J/OL]. Optical Engineering, 2019, 58(2)[2021-03-04]. https://www.spiedigitallibrary.org/journals/optical-engineering/volume-58/issue-2/026105/Intrusion-signal-classification-using-stochastic-configuration-network-with-variable-increments/10.1117/1.OE.58.2.026105.short?SSO=1. DOI: 10.1117/1.OE.58.2.026105.
[15]
马金. 基于深度神经网络的序列异常检测研究[D]. 成都: 电子科技大学, 2018.
MA J. Research on sequential anomaly detection based on deep neural network[D]. Chengdu: University of Electronic Science and Technology of China, 2018.
[16]
YANG L, CHEN H. Fault diagnosis of gearbox based on RBF-PF and particle swarm optimization wavelet neural network[J]. Neural Compute & Applica, 2019, 31(9): 4463-4478.
[17]
席剑辉, 王海丹. 基于改进RBF网络的多变量序列建模和预测[J]. 信息与控制, 2012, 41(2): 159-164.
XI J H, WANG H D. Modeling and prediction of multivariate series based on an improved RBF network[J]. Information and Control, 2012, 41(2): 159-164.
[18]
MARKOPOULOS A P, GEORGIOPOULOS S, MANOLAKOS D E. On the use of back propagation and radial basis function neural networks in surface roughness prediction[J]. Journal of Industrial Engineering International, 2016, 12(3): 389-400.
[19]
MACQUEEN J. Some methods for classification and analysis of multivariate observations[J]. Proceedings of the fifth Berkeley Symposium on Mathematical Statistics & Probability, 1967, 1(14): 281-297.
[20]
郝晓丽, 张靖. 基于改进自适应聚类算法的RBF神经网络分类器设计与实现[J]. 计算机科学, 2014, 41(6): 260-263.
HAO X L, ZHANG J. Design and implementation of RBF neural network classifier based on improved adaptive clustering algorithm[J]. Computer Science, 2014, 41(6): 260-263.
[21]
LYU X X, WANG H X, XIN Z, et al. Adaptive fault diagnosis of sucker rod pump systems based on optimal perceptron and simulation data[J]. Petroleum Science, 2022, 19(2): 743-760.
http://dx.doi.org/10.13976/j.cnki.xk.2023.2180
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

夏文鹤, 赵宗旭, 李皋, 李永杰, 李宬晓, 陈向东
XIA Wenhe, ZHAO Zongxu, LI Gao, LI Yongjie, LI Chengxiao, CHEN Xiangdong
基于非线性分类网络的气体钻井风险智能识别方法
Intelligent Identification Method of Gas Drilling Risk Based on Nonlinear Classification Network
信息与控制, 2023, 52(4): 455-465.
Information and Control, 2023, 52(4): 455-465.
http://dx.doi.org/10.13976/j.cnki.xk.2023.2180

文章历史

收稿/录用/修回: 2022-04-26/2022-11-18/2022-11-17

工作空间