基于胶囊神经网络的轴承故障诊断方法研究

来源:优秀文章 发布时间:2023-03-10 点击:

郭占广,尹 帅,谢敬玲,宫 辉

(青岛杰瑞工控技术有限公司,青岛 266520)

近年来随着科学技术的飞速发展,我国新型轨道交通技术已经融入到人们的生活当中。城市轨道交通行业对我国经济发展、社会安全、改善民生有着至关重要的作用[1]。数据显示最近几年我国城市轨道交通行业运送客流量急剧增加,运营里程数迅速增长,如何在列车高效快速运行环境中保证行车安全,逐渐成为每个城市面对的重大难题[2]。

由中国中车研制的我国首列中国标准地铁列车下线,该列车作为未来城市轨道交通建设的重点车型,其车辆技术规范中明确要求对列车关键部件实现在线安全监测[3]。走行部是城市轨道车辆关键的部件之一,负责列车运行方向的导引以及车体承重,列车走行部一旦出现故障,轻则停运、抽线、救援,重则引起重大安全事故,走行部的实时状态关系着整车的运营安全[4]。

走行部轴承作为城市轨道列车应用最易损耗的部件之一,其健康状态对列车的安全运行有着重大影响[5]。我国针对城轨列车轴承在线故障诊断研究开始相对较晚,目前城市轨道列车走行部的状态检测、运行维护主要靠运维人员在当日列车回库后进行目视检查[6],人为因素较大,实时性不强,多数情况下不能及时发现问题,容易存在安全隐患,降低列车运行的可靠性和安全性[7]。目前国内许多专家学者就轴承诊断问题进行研究,文献[8]基于MPE和PSO-SVM 建立了轴承故障诊断模型;
文献[9]通过联合MOMEDA 实现故障特征的提取;
文献[10]基于GA-BP 神经网络针对轴承状态建立了预防模型。但国内目前研究结果还不能实际应用到轴承故障预测中,如果能够实时感知轴承状态,跟踪潜在故障,进行针对性的维修,将可以有效地降低列车发生故障的概率。

因此本文针对走行部轴承的实时状态,提出了基于胶囊神经网络的轴承状态识别算法,实验结果表明该模型具有良好的鲁棒性、实时性,能够准确地识别走行部轴承的健康状态,对列车关键部件实现实时监测具有重要的推动作用,为研究和开发实用有效的列车关键部件自检系统奠定良好的基础。

卷积神经网络作为深度学习的代表算法,其在特征提取方向上有良好的表象能力,与常规的人工特征提取方法相比,卷积神经网络通过池化技术有效地降低数据特征维度,改善了模型的泛化性能。但是卷积神经网络仍然存在一些问题,为保证模型的准确率,卷积神经网络需要庞大的数据集进行训练且不能很好地应对模糊性,卷积神经网络会在池化层丢失大量的信息,从而降低空间分辨率。胶囊神经网络的提出解决了卷积神经网络这一难题。

2017 年10 月份全球顶级机器学习会议“神经信息处理系统大会(NIPS)”中,深度学习之父Hinton教授提出了胶囊神经网络。胶囊神经网络摒弃了传统神经网络事无巨细的特征提取方式,提出胶囊的概念,利用胶囊表示一个事物整体的一个局部特征,进行高纬度分类,具体核心思路概括为以下两点:第一,与传统神经网络不同,胶囊神经网络的基本单元是胶囊(Capsule),胶囊中包含多个神经元,胶囊的输入输出均为向量,且向量的长度代表传统神经元中的概率,向量方向则用来表示其他信息(位置、颜色等信息);
第二,胶囊神经网络的动态路由机制替代了传统卷积神经网络的最大池化方法。

2.1 编码结构

胶囊神经网络与卷积神经网络在结构上有所不同。以手写体数字识别为例,编码结构如图1 所示,胶囊神经网络的第1 层为卷积层(Conv1 层),数据输入到胶囊神经网络首先经过卷积层进行卷积计算,进行特征的初步提取,此卷积层通过ReLU 激活函数来激活神经元,卷积层输出的特征传递到胶囊神经网络的下一层的基础胶囊层中。

图1 编码结构Fig.1 Encoding structur

胶囊神经网络在卷积层后面加入了基础胶囊层(Primary Caps)和数字胶囊层(Digit Caps)替代原卷积神经网络中的采样层。基础胶囊层是一种特殊的卷积结构,可以通过多个卷积核获得最低级的多维实体特征,并将这些特征进行组合。数字胶囊层与全连接层相似,胶囊单元接受来自基础胶囊层的输出矢量,其耦合系数决定每个胶囊信息的接受程度。动态路由机制仅在基础胶囊层和数字胶囊层之间进行[11]。

2.2 解码结构

胶囊神经网络的解码结构共包含3 个全连接层,如图2 所示。

图2 解码结构Fig.2 Decoding structure

原始数据输入到胶囊神经网络,首先进行编码,对原始数据进行特征提取获得多维度输出,而后经过数字胶囊层得到每种结果的预测概率,概率最高的被送入解码结构进行重建,获得重建损失。

2.3 训练过程

胶囊神经网络引入Squashing 函数作为激活函数,确保输出的向量长度能够归一化。表达式如式(1)所示:

式中:Vj为j 个胶囊的总输出向量;
Sj为j 个胶囊的总输入向量。

传统网络通过加权求和的方式获得网络的输出,胶囊神经网络在传统加权求和的基础上增加了耦合系数cij,表达式如式(2)和式(3)所示:

式中:ui表示第l 层的第i 个胶囊,ui储存局部信息;
Wij代表第l 层的第i 个胶囊和第l+1 层的第j 个胶囊的权重矩阵,通过仿射变换,将ui储存的局部信息映射为整体信息;
代表l+1 层的第j 个胶囊在第l 层的第i 个胶囊下的整体信息预测结果。

其中Cij为每一个底层胶囊与之相对应的高层胶囊之间的权重,由采用的动态路由算法中的softmax 函数决定,表达式如式(4)所示:

动态路由算法的具体计算过程,如图3 所示。其中bij为胶囊i 与胶囊j 相互耦合的先验概率,bij只依赖于两个胶囊的位置与类型。

图3 胶囊神经网络路由算法运算流程Fig.3 Capsule neural network routing algorithm operation flow chart

2.4 胶囊神经网络损失函数

胶囊神经网络的损失函数为SVM 中的Margin Loss 函数,如式(5)所示:

式中:Tk为分类指示函数(k 类存在即为1,不存在为0);
vk代表网络输出数据;
m+为上界,惩罚假阳性;
m-为下界,惩罚假阴性,本文选取经验值m+=0.9,m-=0.1;
λ 为比例系数,调整两者比重,默认初始值为0.5[12]。

3.1 实验环境

由于胶囊神经网络结构比较复杂,训练数据集庞大,故选择高性能服务器来实现模型训练提速。本实验所用服务器CPU 为i9 12900KF 型号,显卡采用RTX 3090 Ti,内存32 GB。操作系统为Windows10 64 位,胶囊神经网络模型通过开源的Keras 模块搭建,软件编程环境为python3.0。

3.2 数据集

美国凯斯西储大学(Case Western Reserve University,CWRU)的滚动轴承数据作为本次实验的数据集。该数据集作为当前轴承故障诊断领域里公认用于研究测试的数据集,在故障诊断研究领域的顶级期刊《机械系统和信号处理》上,有超过41 篇文章是基于该数据集做的研究。为验证本文建立的模型的有效性以及效果的客观性,本文将基于此数据集做模型的实验测试,并与其他基于该数据集的轴承故障诊断方法进行比较。

3.3 数据集预处理

本文选取CWRU 数据集中的部分数据作为实验数据集,其中实验数据集为电动机驱动端的轴承振动加速度信号,采样频率为48 kHz,轴承型号为6205-2RS JEM SKF 型轴承,电机转速为1797 r/min,数据集共包含7 中状态类型,分别是正常状态、轴承内圈轻故障、轴承内圈重故障,轴承外圈轻故障、轴承外圈重故障、滚子轻故障、滚子重故障。每种状态共包含100000 条数据。具体故障类型及编号如表1 所示。

表1 本文实验数据说明Tab.1 Experimental data in this paper

为消除实验数据中不同量纲带来的影响,加快网络模型的训练速度,本文采用Min-Max(minmax normalization)标准化方式对每种故障类型的每个传感器数据进行归一化处理。计算方法如式(6)所示:

将处理后的数据集按4∶1 的比例划分为训练集和验证集,即每组数据训练集为80000 条数据,验证集为20000 条数据。

3.4 网络结构

本文提出轴承故障诊断模型(BFD-Caps)共包括4 个结构层:2 个卷积层,2 个胶囊层,与原始的CapsNet 相比,模型网络结构更深,提高了分类精度。具体网络结构如表2 和图4 所示。基础胶囊层与数字胶囊层之间全连接,所有权重由动态路由算法确定。

图4 网络结构Fig.4 Network structure

表2 网络结构及参数Tab.2 Network structure and parameters

3.5 实验结果与分析

实验经过3000 次迭代训练,训练时间花费约7 h,本文构建的模型在实验中的准确率如图5 所示,其中测试集准确率高达98.65%,验证集准确率高达97.58%,可见该模型对轴承故障分类的准确率极高,且具有良好的泛化能力,可应用到实际中去。

图5 训练效果Fig.5 Training results

不同的轴承故障诊断模型在CWRU 数据集中的识别结果,如表3 所示。可以看出本文基于胶囊神经网络的轴承故障诊断模型识别率略低于RS-LSTM模型,但本文实验训练时间远远少于RS-LSTM 模型的40 h,实验结果表明本文模型改善了传统故障诊断算法识别率低,训练速度慢的的问题。在较差的硬件配置下,花费更少的训练时间获得较高的准确识别率。

表3 本文算法与其他算法比较Tab.3 Proposed algorithm is compared with other algorithms

本文通过实验证实了胶囊神经网络比其他方法更适合走行部轴承的故障诊断,胶囊神经网络结构简易,训练速度大幅提升。同时,由于胶囊神经网络的空间特性提炼出了更完整的振动信号特征,提升了识别精确度。目前胶囊神经网络仍处于起步阶段,在以后的学习工作中去探索和已经成熟的模型相结合,进一步改善其应用场景。

猜你喜欢 故障诊断轴承卷积 轴承知识哈尔滨轴承(2022年2期)2022-07-22轴承知识哈尔滨轴承(2022年1期)2022-05-23基于包络解调原理的低转速滚动轴承故障诊断一重技术(2021年5期)2022-01-18基于3D-Winograd的快速卷积算法设计及FPGA实现北京航空航天大学学报(2021年9期)2021-11-02轴承知识哈尔滨轴承(2021年2期)2021-08-12轴承知识哈尔滨轴承(2021年1期)2021-07-21卷积神经网络的分析与设计电子制作(2019年13期)2020-01-14从滤波器理解卷积电子制作(2019年11期)2019-07-04数控机床电气系统的故障诊断与维修电子制作(2018年10期)2018-08-04基于傅里叶域卷积表示的目标跟踪算法北京航空航天大学学报(2018年1期)2018-04-20推荐访问:神经网络 胶囊 轴承
上一篇:全自动运行系统区间水位异常联动防护方案研究与分析
下一篇:基于高低频电压幅值比的直流配电网线路保护技术

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有