基于双线性特征融合的皮肤病分类研究

来源:优秀文章 发布时间:2023-04-14 点击:

黄志伦,刘 俊,郑 萌

(1.武汉科技大学 计算机科学与技术学院,湖北 武汉 430065;
2.智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学),湖北 武汉 430065;
3.武汉理工大学 计算机科学与技术学院,湖北 武汉 430070)

皮肤容易受到感染并引发炎症,因为皮肤作为人体最大的器官,是直接与外界的细菌或者病毒等感染源接触,所以皮肤病在所有年龄段的人群都比较常见。它主要由3个部分组成,表皮、真皮和皮下组织[1]。位于隔绝外界的第一层防护是表皮,表皮处于整个皮肤结构的最外层,可以直接观察并触摸到。位于隔绝外界的第二层防护是真皮,这是一种结缔组织,用于连接第一层防护和第二层防护。位于隔绝外界的第三层防护是皮下组织,皮下组织的作用主要是使表皮和真皮可以贴合地附着在骨骼和肌肉之上。实际上,导致感染皮肤病的原因一般并不是单一的某个外界因素,而是内部因素和外部因素结合在一起共同作用的结果。常见的内部因素有细胞核分层遗传、激素分泌过度、免疫系统异常等。

但不管导致皮肤感染并发生炎症的原因是什么,有相关研究人员发现,只要在早期阶段及时发现这些皮肤病,及时开展治疗行动,就一定可以很快得到治愈。皮肤病的早期发现一般是通过肉眼观察和直接触摸,然后通过皮肤镜分析进一步诊断。对于可能感染皮肤病的患者前往医院的常见检测方案一般有贴片测试、表皮培养[2]。为了确定感染源,患者可能需要花费一笔不菲的费用用于多个步骤的检测,收入较低的患者难以承受。

Celebi等人[3]提出了一种顺序流水线方法,他要求实验者必须遵循一系列明确定义的步骤,每一个步骤的固定输出作为另一个步骤的输入。这种方法能有效地将皮肤镜图像分为良性或者黑色素瘤,分为以下4个步骤:(1)分割皮肤病灶;
(2)从病变边界和病变内的区域提取基于颜色和形状的特征;
(3)筛选出判别特征的子集;
(4)使用机器学习分类器进行区分。在这之后,陆续出现了很多这种顺序流水线的变体,改进或者省略其中的步骤,但是这种机器学习的方法步骤过于繁琐。Codella等人[4]发现可以从数据中学习特征,而不是针对特定皮肤病学标准设计的特征。他应用了一种无监督稀疏编码方法来学习稀疏数量的模式,从而最大限度地减少图像重构误差。Miglani等人[5]尝试使用预训练的EfficientNet架构,通过微调进行皮肤病图像的分类训练,但是性能还存在不少提升空间。李亚娥等人[6]提出一种自适应的参数设置方法,通过确定delta的最佳取值范围来提高分类的精度。

针对常规分类方法存在的不足,该文提出一种改进双线性特征融合模型。首先,使用Inception-ResNet-v1和v2用来并行提取图像特征映射,这两个子网络需要进行适当的剪枝以适用于文中分类任务,两个不同的特征提取网络可以提取到不同阶数的特征图,然后考虑到皮肤镜病理图像中不同区域的可参考性不尽相同,在经过双线性特征融合后设计额外的软注意力模块,对每个位置给予不同的权重以加强模型的效果,与多个网络训练结果的对比验证了该方法的有效性。

双线性网络(Bilinear CNN)[7]由2个CNN特征提取器组成,其输出在图像的每个位置使用外部积乘以图像表示。由于BCNN可以以平移不变的方式对局部成对特征交互进行建模,所以该模型对于细粒度分类尤其有效。当用于分类任务时,有定义一个四元组M=(fA,fB,P,C) 。其中fA和fB是2个CNN特征函数,P是池化函数,C是分类函数。通过BCNN提取的深度视觉为:

(1)

式中, bilinear(l,I,fA,fB)是每个位置l∈L处的fA和fB的双线性特征组合。映射函数f为每个输出位置的特征向量,分类时使用图像特征φ训练函数C。

2.1 双线性特征融合结构

该文使用基于Inception模块的更高级的Inception-ResNet-v1和v2作为双线性特征融合提取器。Inception-ResNet-v1是Inception根据残差思想设计出来的变体,具体的做法是在卷积层输出的地方加上一个基于残差思想设计的跳跃连接,通过这种跳跃连接做到直接把Inception的输出作为输入添加到残差计算中,此时需要在原始卷积层中添加一个1*1的卷积用于保证在进行卷积运算之后输入的维度和输出的维度是一致的,这样原先的Inception模块中的一个池化操作要被更新为残差连接。

对于另外一个特征提取器,使用的是Inception-ResNet-v2,这是一个结合了Inception v4[8]和ResNet[9]的混合模型。此前的Inception-ResNet-v1设计之初是为了与Inception-v3[10]进行横向对比,因为在大多数的情况下所能使用的硬件资源是有限的,所以Inception-ResNet-v1并没有对模型加深很多和添加更多的参数,在保持和Inception-v3的计算开销和资源消耗几乎持平的情况下探究这种糅合设计在同样使用环境下的极限性能。而这里的Inception-ResNet-v2没有这种限制性的目的。

完整的Inception-v4总网络图从对输入图像的预处理模块Stem开始,然后连接多个Inception子模块,最后进行平均池化和正则化并进行分类,图1包含Inception-ResNet-A的模块图。这里使用的子模块同样使用了多层卷积并行处理的思想,同时需要注意的是,与以往的人工神经网络相比,Inception模块并不用人为指定使用哪一个过滤器,而是把所有这些参数的值全部添加进该人工神经网络模型中。Inception模块可以做到自行学习,并可以确定理想使用的参数。在并行卷积然后汇总在一起进行拼接特征图映射的时候,这里增加的1*1 Conv是为了匹配输入进来的特征维度。因为可以看到,在之前通过卷积层的特征提取过程中有使用不带激活函数的卷积层来通过过滤器进行降维,这时输入的图像的通道数会被压缩。而由于这里使用了基于跳跃连接的残差思想,所以会把输入的特征映射与并行卷积后得到的特征映射联合,这里为了保证两者的通道数相同,需要添加额外的卷积层来扩增并行拼接的特征映射的通道数。剩余的Inception-ResNet-B和Inception-ResNet-C同样也在图1给出。v1和v2版本的Inception-ResNet-A、B、C结构上是相同的,区别在于参数设置,用表1罗列出。

表1 两个版本的A模块不同卷积的通道数

图1 Inception-ResNet-A(上)、B(中)、C(下)结构

Inception-ResNet-A、B、C三个子模块只是整个Inception-ResNet的一部分,完整的剪枝网络结构通过嵌入Reduction结构以耦合。这是一个融合了稀疏思想和残差思想的网络结构,这两种思想都可以在网络深度增加的时候缓解模型的退化问题。在这里的子模块使用残差思想的跳跃连接会把输入层的特征映射和卷积之后的特征映射拼接在一起,单独使用稀疏结构的Inception模块只会并行使用不同大小的卷积层提取特征信息,结合了跳跃连接的残差结构可以做到相比较于单独的Inception模块性能得到一定程度的提升。

2.2 软注意力模块

为了加强训练,该文考虑使用软注意力提高模型的性能。注意力机制是目前深度学习人工卷积神经网络领域非常流行的一个概念,这种思想借鉴于人类的视觉注意力。使用注意力可以做到更加关注与当前目标和期望相关的特征信息,在一定程度上忽视掉图像中与训练目标无关的源域信息[11]。一般来说,注意力被分为硬注意力和软注意力。硬注意力指只选择到某一个位置或者几个位置的信息,软注意力则是会选择全部的信息,计算所有输入信息的加权聚合。一般来说,硬注意力会更加强调点的变化,强调一个随机的预测过程。但是,如果是选取概率最高的那一个点,这个步骤是不可微分的,这使得硬注意力相对于软注意力难以被训练[12]。

软注意力的做法是让所有的信息都去加权,通过权重比分离出最需要的信息,避免受到过多无用的噪声干扰,最终提高准确率。软注意力是可以微分的,这意味着可以通过神经网络计算梯度,并通过反馈直接学习到软注意力的权重,这是软注意力相比较于硬注意力更加被广泛使用的主要原因。但是软注意力也有不太完美的地方,部分输入信息对结果是完全没有影响的,但由于软注意力的全局信息再加权的机制,还是必须要让这些完全不会对结果产生影响的信息加入运算,这会造成一定程度的资源消耗[13]。相关的计算公式如下:

(2)

其中,li是通过预测softmax函数作为原始图像中与特定区域对应的第i个位置上的K×K图像的概率而应用的注意力图,Xi表示从特征提取器模块中提取的图像特征,i的取值范围为1到K×K。实际上,软注意力就是两个特征映射矩阵对应位置元素进行乘积的过程,即注意力特征图和输入特征图。

完整的皮肤病图像分类模型见图2。分别使用Inception-ResNet-v1和Inception-ResNet-v2的剪枝模型来提取皮肤镜下病理图像的特征信息,然后进行双线性融合。由于结合了稀疏思想和残差思想,人工卷积神经网络可以做到在网络变的更深的情况下保证性能加强。考虑到皮肤镜下病理图像的不同区域对于进行文中目标工作图像分类产生影响的权重不同,所以考虑使用软注意力来加强对无用特征的过滤。注意力一般分为硬注意力和软注意力,由于硬注意力难以计算,所以一般使用软注意力加强对重要信息的聚合。最后的步骤是整合提取的特征信息并使用softmax分类。

图2 双线性特征融合网络整体结构

3.1 数据集介绍和实验环境

实验使用的数据集是skin-cancer-classesisic,包括2 923张皮肤疾病图像,其中黑色素瘤图像、皮肤痣和良性角化病的图像占据多数,分别有454张、873张和478张,实例图像见图3。实验环境为64位Windows 10操作系统,GPU为GTX 1080Ti,显存是11G,使用Python 3.6作为编程语言,使用Tensorflow作为深度学习框架。

图3 共7种皮肤病图像展示

3.2 预处理

由于该数据集包含的图像数量过少,该文进行镜像、翻转等方式的数据增强。扩充后设置训练集、测试集、验证集的比例为80%、15%、5%,见表2,然后把图像大小全部设置为128*128并归一化到0~1。

表2 扩充后的训练集、验证集、测试集

3.3 评价指标

选择合适的评价指标是至关重要的,因为它给出了一个尺度和标准来衡量深度神经网络模型的优劣,然后在接下来的完善过程中又会遵循这个评价指标来优化。一般综合使用多种参考指标,以减少偶然性。为了便于表示,这里使用TP代表真阳性,FP代表假阳性,TN代表真阴性,FN则代表假阴性。

精度的含义是成功预测阳性样本的能力,即占所有预测为阳性样本(无论是否预测正确)的比例,其计算公式如下:

(3)

召回率是从另一个角度衡量预测阳性样本的能力,表示为成功预测为阳性样本的个数占所有阳性样本个数(其中包含误测)的比例,其计算公式如下:

(4)

F1 Score综合考虑精度和召回率,兼顾了阳性样本的误报和漏报,是一种相对更均衡的评价标准,其计算公式如下:

(5)

3.4 实验结果与分析

本节实验设置使用Inception-ResNet-v1和Inception-ResNet-v2作为双线性特征提取器的网络为BCNN(IRv1,IRv2),在训练时初始学习率设置为0.005,批量大小设置为64。每经过10个epoch将学习率衰减为原先的80%。在第100个epoch之后把批量大小设置为16。

表3显示了文中使用的BCNN(IRv1,IRv2)的分类结果。Precision主要表示预测的阳性样本中有多少是被正确预测的,即衡量模型是否预测得准确。Recall主要表示有多少阳性样本是被正确预测的,即衡量模型是否预测得全面。在实际预测中通常还需要F1-Score,这是一个同时兼顾分类模型精确率和召回率的评价指标。可以看出,文中算法尽管在黑色素瘤上的表现不是特别优秀,但是在其他6种皮肤疾病上都维持一个不错的水平。在皮肤痣上,文中算法可以在Precision上达到0.96,在Recall上达到0.98,F1-Score同样高达0.97。分类结果的混淆矩阵见图4。

表3 文中模型分类结果

图4 分类结果的混淆矩阵

表4中则是列出文中分类模型和其他3种模型的实验比较。文献[14]设计了一个基于CNN的皮肤病分类的交互Web平台,便于用户的使用。文献[15]设计了轻量级的卷积网络,同时也可以取得不错的效果。文献[16]设计带有增量结构的分类模型,同样可以提高分类的性能。表中的三种指标都是加权平均值,可以看出在这3个指标上文中模型均优于另外三种,由此可见,使用剪枝后的Inception-ResNet-v1和v2并行提取图像特征,然后对提取到的映射图进行双线性融合,辅以软注意模块加强训练,能够取得较好的效果。

表4 使用共4种分类模型的表现

为了解决皮肤病图像在分类时由于皮肤病图像之间存在类间相似性和类内差异性而分类困难的问题,采用双线性特征融合的思想,使用剪枝后的Inception-ResNet-v1和v2作为双线性特征提取器。这种特殊的网络结构采用稀疏思想和残差思想,能够在一定程度上保证网络模型变深的同时性能不会因此退化。然后考虑到皮肤镜下病理图像中不同区域的特征信息对分类目标结果的影响大小不同,在进行双线性特征汇合后添加软注意力模块,使网络模型可以屏蔽掉无用的特征,专注于更重要的纹理部分。最后在实验部分验证双线性特征提取器的优越性和使用软注意力的加强效果。该工作还可以进一步做分割训练,会更加便于为医师提供计算机辅助诊断,未来的研究将会着眼于此。

猜你喜欢皮肤病特征提取残差基于双向GRU与残差拟合的车辆跟驰建模网络安全与数据管理(2022年3期)2022-05-23草药在皮肤病中的应用中国民间疗法(2021年2期)2021-05-22夏秋重护肤 远离皮肤病基层中医药(2020年8期)2020-11-16基于残差学习的自适应无人机目标跟踪算法北京航空航天大学学报(2020年10期)2020-11-14基于递归残差网络的图像超分辨率重建自动化学报(2019年6期)2019-07-23基于Daubechies(dbN)的飞行器音频特征提取电子制作(2018年19期)2018-11-14夏秋重护肤 远离皮肤病基层中医药(2018年8期)2018-11-10Bagging RCSP脑电特征提取算法自动化学报(2017年11期)2017-04-04实事求是 报喜告忧 喜读《中西医结合治疗皮肤病》中国中西医结合皮肤性病学杂志(2016年4期)2016-07-18平稳自相关过程的残差累积和控制图河南科技(2015年8期)2015-03-11推荐访问:皮肤病 融合 特征
上一篇:融合多模态数据的药物合成反应的虚拟筛选
下一篇:基于多头注意力的电网调度领域命名实体识别

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有