结合SKNet与U-Net的盐体识别方法

来源:优秀文章 发布时间:2022-12-09 点击:

程国建,刘 宁,万晓龙,姚卫华,魏新善

(1.西安石油大学计算机学院,陕西 西安 710065;
2.中国石油长庆油田分公司勘探开发研究院,陕西 西安 710018)

盐体构造是指由于岩盐或其他蒸发岩的流动变形所形成的地质变形体,包括盐变形体本身及其周围的其他变形岩层[1-2]。由于盐体运动可以形成良好的圈闭,其对于油气的生成、聚集和最终定位具有重要影响,并且盐体在常温常压下会发生假塑性流动,从而导致油井钻探过程中会遇到许多问题。地下的地质构造一般通过收集地震反射信号呈现出来,其地震图像需要专家进行人工识别盐体,这无疑非常费时费力[3-7]。随着计算机视觉技术的发展,边缘检测、图像分割等技术应用到盐体识别中。早期,研究者们使用传统的图像处理方法如归一化割、水平集等,这些方法具有较高的计算复杂度,在真实场景中很难实施部署。WANG 等将地震属性与机器学习算法相结合,常用的地震属性有视觉显著性和无序性等[8]。DI 等对6 种机器学习分类器在盐体识别问题上进行对比,得到类似的盐体分割结果,表明盐体识别问题对机器学习算法不太敏感[9]。

随着卷积神经网络(CNN,Convolutional Neural Network)的出现,网络模型实现了端到端的特征选择与分割。WALDELAND 等首次将CNN 应用到盐体识别中,将3D 地震图像切分成小块,以预测当前小块中心像素是否为盐体,获得了较好的盐体分割效果[10]。全卷积神经网络(FCN,Fully Convolutional Networks)的发明,把图像级别的分类进一步延伸到像素级别,从而进行端到端的分割[11]。为了克服FCN 没有充分考虑上下文信息和实时性较差等缺点,出现了基于编码器-解码器的网络模型,U-Net是其代表之一[12]。U-Net 是一个对称的结构,由收缩路径和扩张路径组成,并通过跨层连接将编解码器联系起来。ISLAM 等结合U-Net 和SE-ResNet 卷积模块,验证了基于跳跃连接的CNN 体系结构在学习基本地震特征的能力[13]。上述方法都采用固定的3×3的卷积核,不能提取丰富的盐体上下文信息,从而出现盐体边界分割不清晰或盐体狭长处分割不准确等问题。为此,笔者提出将SKNet(Selective Kernel Network)[14]与U-Net 相结合的方法,其可自适应地调节感受野,获得更丰富的盐体特征;
并在U-Net的编解码器之间引入位置和通道自注意力机制[15],获得盐体的长距离依赖关系,增强盐体特征表示,将所提出的方法命名为USKNet,该方法取得了较好的盐体识别效果。

USKNet模型架构基于U-Net改进(图1)。在编码器部分,将SKNet34替换原始堆叠的卷积、批量归一化与激活层,从而使编码器可以根据盐体的大小或形状动态地选择3×3 或5×5 的卷积核。特征图经过编码器过程中,最大池化或卷积步长为2 的操作使特征图像素从128×128 缩小至8×8,通道数则从8维增加至512 维。在编解码器中间部分,经过2 个卷积操作后,使用位置和通道自注意力机制,捕捉长距离依赖关系,同时抑制无关特征或噪声。在解码器部分,与原始U-Net基本保持一致,将编码器每层的输出与解码器经过反卷积的结果拼接,再进行卷积操作。为了融合盐体的多尺度特征,使用了超柱体方法[16],将解码器每层的输出进行拼接,最后通过1×1 的卷积核和sigmoid 函数运算得到像素级盐体或非盐体分类概率。同时,为了减少数据集中不包含盐体的图片样例对分割结果的干扰,受PSPNet 的启发,在编码器末端引入辅助的二分类器用来识别图像中是否包含盐体[17]。

图1 USKNet模型架构Fig.1 USKNet model architecture

SK unit 结构是USKNet 模型架构编码器的主要组成部分,由一个3×3的卷积核和SK卷积构成。SK卷积模块(图2)可分为拆分、融合、选择3 个阶段。在拆分阶段,特征图可从多个路径输入,路径数用M表示,当M为2时,分别对应3×3和5×5的卷积核,为了保持感受野的大小且减少参数,使用3×3、空洞数为2 的空洞卷积代替5×5 的卷积核。受ResNeXt 影响[18],在卷积操作时使用了分组卷积,分组数用G表示,设定G为32。在融合阶段,将每个路径得到的特征图相加,之后进行全局平均池化,特征图维度由H×W×C变为1×C,接着通过维度为C×d的全连接层降维至1×d的输出向量z,d为一个可调节的参数,一般为C/32且最小值为32。在选择阶段,在通道维度上运用softmax 函数,通过软注意力机制进行特征图选择,2条路径的注意力权重表达式分别为:

图2 SK卷积模块Fig.2 SK convolution module

当M=2 时,各通道对应特征图矩阵的表达式为:

其中:

自注意力机制是获得长距离依赖的一种方式,可动态地生成不同连接的权重,通常采用查询、键、值模式,其表达式为:

编码器和解码器的中间部分为位置和通道自注意力机制模块(图3)。位置自注意力机制模块将输入的特征图通过3 个卷积操作分别得到特征图D,E和F,其中特征图D和E经过维度调整和soft⁃max函数运算得到维度为(H×W)×(H×W)的矩阵,此矩阵表示特征图D和E不同位置的相关性,2 个位置的特征表示越相似,其相关性就越大。通道自注意力机制模块经过维度调整和softmax 函数运算得到维度为C×C的矩阵,此矩阵表示通道之间的互相影响程度。为了充分利用长距离依赖信息,对这2个自注意力机制模块得到的特征图进行聚合。

图3 位置和通道自注意力机制模块Fig.3 Position and channel self-attention mechanism module

2.1 数据集预处理

TGS 盐体识别数据集由包含标签的4 000 个训练集数据和不包含标签的18 000 个测试集数据组成,每个数据是由地下三维地震数据进行二维切片得到的单通道灰度图像,像素为101×101。标签图像掩码分为2类,即255(白色)代表盐体,0(黑色)代表非盐体。在数据集中,由于每张图像盐体分布不均衡,在划分训练集与验证集时,为了数据分布的一致性,按盐体占比为4∶1的比例进行分层抽样,得到3 200 个数据的训练集和800 个数据的验证集。在预处理时,先将每张图像的像素从101×101 调整至128×128,以便更易使用卷积操作;
再使用数据增强技术来扩充训练集,考虑到盐体分布与深度具有一定的关系,因而避免使用垂直翻转操作。对原始图像尺寸调整后,按随机概率通过水平翻转、亮度调整、小角度旋转来数据增强(图4)。

图4 数据增强Fig.4 Data augmentation

2.2 损失函数优选

对于判断是否包含盐体的二分类器,其所需要的标签可根据盐体占比来获得,盐体占比为0 表示不包含盐体,盐体占比不为0 表示包含盐体。二分类器的优化运用二值交叉熵(BCE)损失函数计算,其表达式为:

对于盐体的语义分割,由于盐体与非盐体占比较不平衡且优化的目标是交并比(IoU),故二值交叉熵损失函数不适用。同时交并比损失函数是非凸的,不易收敛到最小值,因此选择lovasz-hinge 损失函数来优化分割效果[19]。盐体的分割损失和辅助损失总和的表达式为:

二分类器为辅助损失,在整体损失中占比较小,本模型中α取值为0.05;
在数据集中,盐体占比较多的图像约占50%,本模型中β取值为0.5。

3.1 评价指标

在语义分割中,通常采用像素准确率(PA)和交并比来衡量真实值与预测值的差距,评价指标的范围都为[0,1],数值越大表示真实值与预测值的差距越小。像素准确率和交并比的表达式分别为:

3.2 训练过程

为节省训练时间,结合迁移学习的方法,编码器使用了在ImageNet 数据集上预训练的SKNet34。由于预训练模型需要输入三通道图像进行归一化,因此将灰度图像通过Open CV以彩色模式读取再输入模型,训练集与验证集比例为4∶1,设置batchsize为32,优化算法为SGD,初始学习率为0.01,学习率调整策略采用余弦退火策略[20],其表达式为:

模型训练了140 个epoch,每2 个epoch 进行一次验证并保存IoU最高的模型权重,得到训练集与验证集的PA及IoU曲线(图5)。

图5 训练集与验证集的PA和IoU曲线Fig.5 PA and IoU curves of training set and validation set

4.1 不同损失函数对USKNet的影响

为了探究不同损失函数对盐体的语义分割效果,对比了dice 与lovasz-hinge 损失函数。从USKNet在2种损失函数下的评价指标(表1)可以看出,采用lovasz-hinge损失的IoU和PA比dice损失分别提高2.16%和0.6%。结果表明,lovasz-hinge 损失函数更适用于盐体的语义分割。

表1 不同损失函数对USKNet的影响Table1 Influence of different loss functions on USKNet %

4.2 SKNet与自注意力机制对USKNet的影响

为验证SKNet提取盐体特征的有效性和自注意力机制的效果,在使用辅助损失函数和超柱体方法的前提下,SKNet+U-Net 的方法在IoU和PA上比UNet 分别提高了7.18%和2.0%;
加入自注意力机制后,IoU和PA又分别提高了0.95%和0.2%,证明SKNet 与自注意力机制可有效提高盐体识别效果(表2)。

表2 SKNet与自注意力机制对USKNet的影响Table2 Influence of SKNet and self-attention mechanism on USKNet %

4.3 USKNet与其他模型对比

将USKNet与U-Net,PSPNet盐体的语义分割评价指标(表3)进行对比,USKNet 在IoU和PA上都具有较大优势。从不同盐体占比图像在3种模型下的语义分割效果(图6)可以看出,USKNet 在边界处分割的更清晰,在面对小目标盐体和复杂盐体形状时也更具有鲁棒性。

表3 不同模型下盐体的语义分割评价指标Table3 Evaluation indexes of semantic segmentation of salt bodies by different models %

图6 不同模型下盐体的语义分割效果Fig.6 Results of semantic segmentation of salt bodies by different models

USKNet 模型可自适应地获取不同大小感受野的盐体特征,同时通过位置与通道自注意力机制来增强盐体特征表示,进一步提升了盐体识别效果,改善了盐体边界、狭长处和小目标盐体的语义分割效果。但本文提出的模型只验证了在二维地震图像上具有较好的盐体识别效果,对于三维地震数据,实际应用中更需要准确地识别出三维盐体形状,未来的研究工作聚焦于将该方法推广到三维地震数据以便提高模型在不同地质环境下的泛化能力。

符号解释

猜你喜欢 编码器卷积损失 洪涝造成孟加拉损失25.4万吨大米今日农业(2022年15期)2022-09-20基于全卷积神经网络的猪背膘厚快速准确测定农业工程学报(2022年12期)2022-09-09基于ResNet18特征编码器的水稻病虫害图像描述生成农业工程学报(2022年12期)2022-09-09WV3650M/WH3650M 绝对值旋转编码器传感器世界(2022年4期)2022-08-05WDGP36J / WDGA36J编码器Wachendorff自动化有限公司传感器世界(2022年3期)2022-05-24一种基于卷积神经网络的地磁基准图构建方法北京航空航天大学学报(2021年9期)2021-11-02基于3D-Winograd的快速卷积算法设计及FPGA实现北京航空航天大学学报(2021年9期)2021-11-02一种并行不对称空洞卷积模块①计算机系统应用(2021年9期)2021-10-11基于Beaglebone Black 的绝对式编码器接口电路设计*数字技术与应用(2021年1期)2021-03-24两败俱伤小天使·二年级语数英综合(2019年10期)2019-11-08推荐访问:识别 方法 SKNet
上一篇:中国共产党百年统一战线建设的基本经验
下一篇:肝部分切除联合胆肠吻合术治疗肝内胆管结石患者临床疗效及术后结石复发危险因素分析*

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有