基于自适应超像素的少样本极化SAR,图像特征增强方法研究*

来源:优秀文章 发布时间:2023-01-19 点击:

任吉宏,刘畅

(1.中国科学院 空天信息创新研究院,北京 100190;
2.中国科学院大学,北京 100049)

合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种具有主动微波成像能力的遥感监测手段,可以实现全天时全天候高分辨率持续对地观测。极化SAR 采用多通道多极化的工作模式,可以捕获地表目标丰富的物理散射特性[1],因此在目标检测[2]、变化检测[3]、地物目标分类[4]等SAR 图像解译任务中发挥重要作用。地物分类作为极化SAR 图像的一项基本解译任务,可以为农林监测[5]、灾害定位[6]、地质勘探[7]等遥感观测实际应用提供重要判据。

基于数据驱动的极化SAR 图像地物分类方法包括有监督、无监督和半监督等分类器学习方式。有监督学习借助标注样本学习特征空间,包括Wishart、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forests,RF)等分类器。无监督学习根据样本特征相似性划分特征空间,其中,H/α 分类通过极化统计特征区分典型地物散射类别。针对极化SAR 图像的成像机理,基于极化信息的散射特征可以有效利用物理散射特征实现同质区域聚类[8-10]。

近年来,大量研究专注于利用深度神经网络模型构建分类器。深度学习方法在获得更优分类指标的同时依赖更多先验标注数据,且随着网络加深,模型学习的算力和时间成本也在不断增加[11-13]。

地物分类的任务目标是实现图像像素的类别映射,而获取大量准确的像素标注信息十分困难。极化SAR图像中目标分辨单元间存在明确的地理空间邻接关系,因此具有时空谱多维相关的鲜明特点。在仅有少量标注信息的前提下,基于区域的分类方法充分利用空间邻域同质特性,将同质区域作为基本分类单元,在减少冗余计算的同时保持邻域类别一致性,但存在分割与分类过程紧耦合的问题[14]。

针对以上问题,本文利用极化统计特征和超像素聚类算法,提出一种结合空间同质邻域一致性特征的逐像素特征增强方法。本文方法可以通过有效结合同质极化信息提升极化特征表达鲁棒性,因此更适应仅含少量标注样本的复杂地物分类场景。

1.1 基于极化统计特征的HSV 伪彩色图像生成算法

极化SAR 利用四种极化收发组合收集和测量观测目标散射过程的线性变化关系。在以水平和垂直极化作为一对线性极化基的散射空间坐标系下,观测目标的后向散射过程可以描述为复散射矩阵:

其中SRT(R∈{H,V},T∈{H,V})表示在接收极化(R)和发送极化(T)组合下对应的复散射系数。在单站互易条件下,散射矩阵S 满足SHV=SVH,可以通过Pauli 基矩阵分解为Pauli 特征向量:

Pauli 特征向量各分量分别可以描述奇次散射、偶次散射和体散射三种典型散射机制,因此Pauli 伪彩色图像是一种高效的极化SAR 图像可视化手段。

通过Pauli 特征向量可以得到描述特征自相关性的单视相干矩阵:

其中上标H 表示复数共轭转置。相干矩阵是一个具有二阶统计描述的3×3 半正定复值矩阵,其对角线元素为Pauli 特征分量的功率表示。观测区域内相邻分辨单元的相干矩阵可以通过集合平均聚合为一个多视相干矩阵:

其中L 表示多视视数,〈·〉表示集合平均。多视集合平均可以有效压缩回波数据、抑制相干噪声,因此,极化SAR图像解译任务通常选择多视相干矩阵作为特征表示。

Cloude-Pottier 分解是一种基于特征分析的相干矩阵特征提取方法。相干矩阵可以通过特征分解表示为:

其中,λi表示特征值,满足λ1≥λ2≥λ3≥0,ui是与特征值λi对应的特征向量,可以参数化表示为:

其中αi表示物理散射角,蕴含观测目标的散射类型信息。

引入极化统计二阶描述子可以简化特征分解参数分析,并赋予明确的物理意义。通过特征分析可以进一步得到观测目标散射总功率为:

极化熵为:

其中pi=λi/Span 表示不同特征分量所占比重。

平均散射角为:

极化熵H 可以描述观测目标散射类型的复杂程度,当观测目标为海域时,其散射构成以平面散射为主,H趋近于0,当观测复杂目标时,H 可能受多种散射机制影响,取值相对较高,最大取值为1。平均散射角蕴含观测目标的典型散射类型,α 取值0°、45°、90°分别对应奇次散射、体散射和偶次散射。

极化特征分析保持基不变性,因此H 和α 具有旋转不变性,取值不依赖观测目标朝向。Span、H、α 可以从统计角度描述极化SAR 观测目标的散射特性,因此在复杂散射场景和成像噪声干扰下更为鲁棒。

极化SAR 伪彩色图像的颜色特征具有高效的极化特性表达能力[15]。相比于Pauli 伪彩色图像中典型散射类型描述的RGB 颜色特征,极化统计散射信息表达能力更加丰富,判别信息更加多元。本文将以Span、H、α三种极化统计特征作为具有正交关系的HSV 色彩空间通道,结合逐通道直方图均衡生成具有统计信息描述的伪彩色颜色特征表示。具体算法流程如下:

(1)初始化多视相干矩阵 〈T〉,直方图均衡化函数hist_equal

(2)极化分解:Span、H、α ←〈T〉

(3)dB 功率转换:Span ←10 * log10Span

(4)定义色彩空间:image :=[H,S,V]

(5)α ←hist_equal(α)

(6)H ←hist_equal(H)

(7)Span ←hist_equal(Span)

(8)image ←[α,H,Span]

(9)返回伪彩色图像image

1.2 自适应SLIC 超像素聚类

简单线性迭代聚类(Simple Linear Iterative Cluster,SLIC)是一种受空间距离约束的K-means 无监督聚类算法[16],同时将空间距离和特征距离作为像素相似性的依据。SLIC 的距离度量可以具体表示为:

其中dc和ds分别表示特征和空间距离,S 表示初始化聚类中心的均匀采样步长,m 是用于调节特征和空间距离相对权重的规范化超参数。在CIELAB 色彩空间中,m的取值范围通常为1 到40,当m 取值较大时,空间距离作为像素相似性度量的主导因素,超像素块尽可能挖掘受限空间邻域内的同质像素,对特征一致性容忍度更高;
当m 取值较小时,特征相似性更为重要,超像素块边界依附性更强,对邻域特征一致性要求更高。CIELAB色彩空间相比于RGB 色彩空间更加接近人眼的视觉机理,同质区域的颜色特征距离度量具有线性一致性[16]。

在式(10)中,采样步长S 和规范化因子m 同样也可以表示为超像素块类内的空间和特征距离上界。为缓解在复杂散射场景中设置固定超参数m 可能导致的边缘吸附性不一致问题以及提升聚类算法在地物分类任务中的易用性,自适应SLIC(Adaptive-SLIC,ASLIC)可以针对每个超像素块自适应地调节特征和空间距离间的相对权重。ASLIC 的距离度量可以具体表示为:

其中mc和ms分别表示超像素块的最大特征距离和空间距离。在ASLIC 聚类过程中,mc和ms可以通过当前超像素块计算得到,因此可以自适应调节同质超像素块的边界依附性。

在ASLIC中,均匀采样步长S 决定超像素块的平均大小。特别地,极化SAR 图像地物分类任务假定空间邻域内存在同质区域特征一致性,因此步长S 可以根据原始数据的空间分辨率决定,具有物理可解释性。

1.3 基于同质邻域信息的特征增强方法

极化SAR 数据可以根据极化分解和直方图均衡表示为HSV 伪彩色图像I。通过设置采样步长S,ASLIC 可以将图像I 分割为同质超像素块:

其中Ck表示第k 个同质超像素块内所有像素的集合。极化SAR 图像在空间邻域内存在特征一致性,因此同质超像素块内的邻域共享信息可以稳定表达该区域的地物类别特征。对于任意一个超像素块Ck,其类内平均特征可以表示为:

其中f 表示特征图,[·]表示特征图上的空间子集。平均特征图fˉ蕴含同质像素块共享信息,且内部像素特征具有同源表示。

极化SAR 成像易受稀疏强散射目标和相干斑噪声干扰,同质邻域共享信息可以修正像素特征,提升训练样本特征的表达能力和鲁棒性。平均特征图与原特征图的距离度量可以定义为:

其中‖·‖2表示L2范数。距离度量d 可以表示当前样本与所在同质邻域共享信息的特征差异。

本文提出基于同质邻域平均特征的指数平均特征增强方法:

其中fe表示指数平均后的增强特征图。当像素特征与类内平均特征相近时,增强后的像素特征可以较好保留原始特征;
当差异较大时,增强后的像素特征则会沿类内平均特征的方向偏移修正。在极化SAR 图像地物分类任务中,相干斑噪声和强散射目标等因素都可能导致当前观测地物类别散射属性发生偏移,而借助同质邻域的同源特征修正原始特征可以有效缓解这一问题。

本文实验选用两个AIRSAR L 波段基准数据集,使用由欧航局提供的PolSARpro v6.0(Biomass Edition)数据处理工具实现极化SAR 数据提取,通过空域窗口为7×7的精改Lee 滤波抑制相干斑噪声,将多视相干矩阵〈T〉展开得到的实值向量[T11,T22,T33,Re(T12),Im(T12),Re(T13),Im(T13),Re(T23),Im(T23)]作为分类器的学习特征,并使用z-score 标准化数据分布。

为验证提出方法的有效性,实验选择支持向量机(M1)、马尔可夫随机场(Markov Random Field,MRF)边界一致性后处理的支持向量机(M2)以及在M2 基础上加入本文特征增强方法的M3 三种分类方法对比评价指标,所有分类器超参数均通过训练过程10 次交叉验证获得。MRF 是一种基于图的标签后处理方法,利用同质邻域先验假设保持邻域标签传播的平滑性,因此可以有效利用同质邻域信息[17]。为定量评估对比,实验使用生产者精度(Producer Accuracy,PA)和使用者精度(User Accuracy,UA)作为类别评价指标,使用总体精度(Overall Accuracy,OA)、平均精度(Average Accuracy,AA)和Kappa 系数作为总体评价指标。所有评价指标均由10 次重复实验得到均值和95%置信区间。

2.1 AIRSAR L 波段San Francisco地区

San Francisco 数据集是由NASA/JPL AIRSAR 于1989 年获取的L 波段极化SAR 图像,观测区域为美国San Francisco 地区,图像分辨率为900×1 024,空间分辨率为10 m×10 m,入射角为5°~60°。图1 为观测地区的Pauli 伪彩色图像和真实地物标注信息。

图2 (a) 为描述San Francisco 地区散射特征分布的H/α 极化平面。结合极化平面和真实标注可以看出,观测区域存在以平面散射为主的海域、近海裸土区域以及建筑植被混杂的复杂散射区域,其中城市建筑结构表现出多变的散射信息。值得注意是,该观测区域以海域和城区为主,存在类别分布不均衡问题。

图3 为San Francisco 地区数据集在不同训练样本量和不同特征表示下的平均精度对比。在类别样本不均衡的地物分类场景下,总体精度指标倾向于描述主要地物目标分类精度,忽略样本占比较小的弱势地物目标,而平均精度可以有效克服这一问题。图示曲线包含三种不同特征实验方案,分别为原始特征、基于Pauli RGB 伪彩色图像的增强特征和基于α/H/Span HSV 伪彩色图像的增强特征,其中分类器均采用SVM。对比图示曲线表明,在不使用精改Lee 滤波抑制相干斑噪声的条件下,基于伪彩色图像的特征增强方案可以有效提高少量训练样本下的分类器指标,本文提出的α/H/Span HSV 伪彩色图像相比于仅用典型散射机制作为色彩通道表示的Pauli RGB 伪彩色图像具有更高效、更稳定的特征增强能力。在使用精改Lee 滤波的条件下,不同特征表示的平均分类精度更加接近,本文提出的特征增强方法仍可以有效提升分类器的平均分类精度,并具有更小的置信区间,因此本文方法在少量标注样本下表现更加鲁棒。

表1 为San Francisco 数据集在各类别样本量为50时多种分类方法下的总体指标对比。其中,M1 对应SVM 分类器的分类指标,作为实验基准。M2 在M1 的基础上引入MRF 一致性后处理,MRF 基于同质邻域一致性修正预测标签,因此可以缓解SVM 逐像素分类可能导致的局部非一致性预测问题,提升分类指标。M3 在M2 的基础上引入增强后的特征表示,在SVM 的决策过程提供同质共享信息。对比表中各项指标可以看出,M3的总体指标相比于M2 有1% 的小幅提升,且多次随机采样实验下指标误差更小,分类表现更稳定。因此,本文方法可以在特征准备阶段融合空间邻域同质信息,与一致性后处理方法互为补充,有效提高分类指标,并提升分类稳定性。

表1 San Francisco 数据集不同分类方法总体指标对比(± 表示95%置信区间)

表2 为San Francisco 数据集在各类别样本量为50时M2 分类方法使用特征增强方法前后的各类别及总体分类指标对比。从表中结果可以看出,本文提出的特征增强方法可以在稳定提升弱势类别裸土、山区、植被PA 的条件下大幅提升UA,提高标注样本召回率。海域和近海裸土区域散射类型相近,但裸土熵值较高,因此本文方法对相似地物目标区分能力更强。对于山区、植被等熵值较高的复杂散射区域,本文方法可以有效提升特征抗干扰能力。在其他简单地形中,本文方法可以充分利用同质信息,在提升分类指标的前提下保持分类稳定性。对于所有评价指标,本文方法都具有更窄的置信区间,因此增强特征更为鲁棒,分类结果更加稳定。

表2 San Francisco 数据集各类别及总体分类指标对比(± 表示95%置信区间)

2.2 AIRSAR L波段San Francisco地区

Flevoland 数据集是由NASA/JPL AIRSAR 于1991 年获取的L 波段极化SAR 数据,观测区域为荷兰Flevoland地区,图像分辨率为1 279×1 024,空间分辨率为6 m×12 m,入射角为20°~ 60°。图4 为Flevoland 地区的Pauli伪彩色图像和由地球科学与遥感学会(GRSS)数据融合大赛提供的真实地物标注信息(Http://dase.grss-ieee.org/)。图2(b)为观测区域的H/α 极化平面,与标注信息一致,观测地区为以体散射为主的农作物区域。

在Flevoland 数据集中,分别选取各类别训练样本数为10、30、50,对比本文方法在小样本学习任务中的有效性。从表3 可以看出,标注训练样本越少,本文提出的特征增强方法对分类指标提升越明显,且在不同训练样本规模下,特征增强方法都可以稳定提升分类精度,并具有更小的置信区间。因此,本文方法通过结合同质邻域信息,可以有效提升分类样本特征的鲁棒性和判别性。值得注意的是,随训练样本规模增大,特征增强方法对分类精度提升能力减弱,这可能是因为当训练样本相对充足时,像素原始特征已经可以稳定支撑特征空间的判别边界,因此对发挥引导作用的同质邻域信息依赖减小。

表3 Flevoland 数据集在不同训练样本量下的总体分类指标对比(± 表示95%置信区间)

为充分利用极化SAR 图像的空间邻域信息,实现依赖少量标注样本的鲁棒地物分类目标,本文借助同质邻域极化统计信息对原始像素特征进行增强变换,在仅有少量标注样本的条件下提升分类精度和稳定性。本文实验结果表明,受空间约束的超像素聚类算法有助于识别和提取极化SAR 图像地物目标同质区域,引入极化统计信息的颜色特征可以有效提高同质区域的识别准确率,结合有效同质共享信息可以提升样本特征鲁棒性和分类稳定性。事实上,本文方法在数据滤波、极化特征提取和同质邻域提取阶段均只需引入一个决定空间邻域大小的超参数,而这一参数可以根据数据采集载荷参数进行全局设定,因此也具有一定的易用性和扩展能力。

猜你喜欢 同质邻域极化 基于混合变邻域的自动化滴灌轮灌分组算法农业工程学报(2022年7期)2022-07-09认知能力、技术进步与就业极化现代财经-天津财经大学学报(2022年5期)2022-06-01极化雷达导引头干扰技术研究航天电子对抗(2022年2期)2022-05-24基于干扰重构和盲源分离的混合极化抗SMSP干扰北京航空航天大学学报(2021年9期)2021-11-02含例邻域逻辑的萨奎斯特对应理论逻辑学研究(2021年3期)2021-09-29非理想极化敏感阵列测向性能分析航天电子对抗(2019年4期)2019-06-02尖锐特征曲面点云模型各向异性邻域搜索计算机应用与软件(2018年12期)2018-12-13“形同质异“的函数问题辨析(上)理科考试研究·高中(2017年7期)2017-11-04近现代中国与西方体育文化间性研究首都体育学院学报(2017年3期)2017-06-05浅谈同质配件发展历程汽车零部件(2015年1期)2015-12-05推荐访问:极化 样本 自适应
上一篇:一种片上嵌入式Flash,测试接口的设计
下一篇:粤港澳大湾区与世界其他湾区高校群基础科学研究比较分析

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有