摘要
针对高分辨率遥感图像标签稀缺和标签技术增长缓慢限制了多时相语义变化检测发展的问题,提出了采用有噪声、低分辨率的弱标签替代高分辨率标签进行多时相语义变化检测的方法。首先,采用低分辨率卫星数据平滑高分辨率遥感图像输入的质量差异。其次,通过将缩影(epitomes)模型和标签超分辨率算法作为统计推理算法相结合的方法预估高分辨率遥感图像分类图,并拟合一个小型FCN网络对生成的遥感图像分类图进行后处理来改善其分类的效果。最后,通过对比不同时相土地覆盖分类图像之间的差异得出变化检测结果。结果表明,本研究提出的方法与其他多时相语义变化检测方法FCN/all相比,平均交并比(mIoU)提高了8.9个百分点,能够有效检测土地覆盖分类变化。
随着对地观测技术的不断进
影响多时相语义变化检测任务发展的主要因素是高空间分辨率和高时间分辨率传感器的激增无法完全与同样丰富的标签相匹
但是上述深度卷积网络方法也存在一些缺陷。如深度卷积网络模型很难解释,这种缺陷使得该模型很难通过向体系中添加常识性先验知识来进行改进。而且促进深度卷积网络在图像中的远距离推理架构上具有一定的局限性,由于深度卷积网络的有效感受野通常只有十几个像素,相对来说较
综上所述,鉴于缩影模型在大型的数据集上表现出的性能比较好,并且基于缩影表示的标签超分辨率方法来进行多时相遥感语义变化检测具备可行性。本研究提出了一种基于缩影的标签超分辨率与遥感图像分类标签后处理相结合的多时相遥感语义变换检测方法,通过弱监督策略,充分利用多源和多时相数据生成具有不匹配噪声标签的高精度和高分辨率土地覆盖变化图,旨在为农业土地覆盖变化检测等提供参考。
本研究使用的数据为2013年至2014年美国东北部切萨皮克湾流域的相关数据,

图1 数据集示例
Fig.1 Example dataset
A:NAIP影像 NAIP imagery; B:地面真实土地覆盖标签 Ground truth land cover labels; C:Landsat 8图像 Landsat 8 image; D:NLCD土地覆盖标签 NLCD land cover label.
1)低分辨率数据增强。高分辨率遥感图像在生成过程中难免受到噪声的影响导致图像质量下降,而采用大时间范围内平均的低分辨率Landsat 8图像增强高分辨率图像可以提高模型的性能。选取同一区域的Landsat 8图像和NAIP图像,将低分辨率Landsat 8图像重新采样到与高分辨率NAIP图像相同的维度,然后将2个图像源连接起来,得到新的输入图像。如
2)输入颜色增强。在小的地理区域内,单个像素颜色是土地覆盖分类的一个非常具有预测性的特征。向输入的NAIP图像添加随机颜色增强,对NAIP图像的每个通道的亮度和对比度随机调整5%。对于NAIP图像的单个通道,求出该通道的平均像素强度,采样参数在0.95~1.05随机选择,并对该通道里面的所有像素进行调整。最后,对NAIP图像的所有通道应用此方法,计算出颜色随机变化后的图像。
采用基于缩影表示的标签超分辨率方法,缩影是图像的浓缩版本,它仍然包含重建图像所需要的纹理信息和形状基元,可以实现从稀疏标签中学习并执行标签超分辨率算法从而生成高分辨率土地覆盖制图。该方法首先是实现基于缩影模型的弱监督语义分割,再通过标签超分辨率算法生成高分辨率土地覆盖制图。
1)基于缩影的语义分割。缩影是图像块高斯混合模型的升级版本,由图像块展开为向量组成的训练集,其中是图像块中的坐标,是光谱通道,使用One-hot标签嵌入对应的向量,进行计算。在本研究提出的缩影混合模型中,遥感图像、遥感图像标签数据上的分布借助潜在变量表示,其公式为:
(1) |
其中,是混合分量的概率,而条件概率描述了潜在变量生成的遥感图像块中允许的变化,描述了遥感图像块上可能生成的标签。在本研究的模型下,对1张新遥感图像的期待分割结果的估计为:
(2) |
的自然选择为对角高斯分布:
(3) |
是遥感图像标签上分类分布的简单乘积。混合分量s的均值包含像素值,而协方差矩阵用其对角元素表示,即各个像素的不同颜色通道k的方差。如

图2 缩影中2个重叠的窗口共享参数
Fig.2 Two overlapping windows in a miniature share parameters
缩影是训练的遥感图像中自相似性的总结。因此,它们应该包含比训练图像少得多的像素数量,但比用于训练它们的缩影图像块要大得多。缩影中的每个像素都包含在大小为K×K的图像块中,并且可以通过遥感图像块映射追溯到许多遥感图像中的不同位置。这种图像映射使得在遥感图像的缩影经过训练后能够将其标签嵌入到缩影中,再将有标签的缩影组合到遥感图像中,完成基于缩影模型的语义分割。缩影中的每个位置都将具有(软)标签指示符,计算公式为:
(4) |
其中,表示从开始的缩影窗口,即缩影中属于混合分量的K×K坐标集合。从后验中能得出遥感图像块与缩影中目标位置重叠的每个分量的映射强度。标签在块中的对应位置是,因此,被添加到位置处的标签的计数器上。
2)标签超分辨率。对于1 m分辨率的遥感图像,NLCD的30 m低分辨率土地覆盖产品相当于每个3030像素块被标记为16个类别中的1个,标签超分辨率就是将每个类别由4个不同的高分辨率标签代替,形成高分辨率土地覆盖制图。
标签超分辨率技术假设先验知道低分辨率类中高分辨率标签的组合,下面给出了NLCD类别和4个简化高分辨率标签之间的近似对应关系,如
(5) |
其中,是数据中观察到的低分辨率类的比例,作为低分辨率标签c数据在s上的后验值。首先,推导了一个EM算法,用于解决等
该限定对于所有的分布都是成立的,并且对以下情况是严格的:
(6) |
对进行优化,可以得到:
(7) |
通过迭代等
NLCD类别名称 NLCD class name | 类别标签 Category label | 近似类别频率/% Approximate class frequencies | |||
---|---|---|---|---|---|
水 Water | 树冠类 Tree canopy | 低植被类 Low vegetation | 不透水面类 Impervious surface | ||
开阔水域 Open water | 水 Water | 98 | 2 | 0 | 0 |
城市开放空间 Developed,open space | 复合型 Mixed | 0 | 39 | 49 | 12 |
低密度城市 Developed,low intensity | 复合型 Mixed | 0 | 31 | 34 | 35 |
中密度城市 Developed,medium intensity | 不透水面 Impervious surface | 1 | 13 | 22 | 64 |
高密度城市Developed, high intensity | 不透水面 Impervious surface | 0 | 3 | 7 | 90 |
荒地 Barren land | 低矮植被 Low vegetation | 5 | 13 | 43 | 40 |
落叶林 Deciduous forest | 树冠 Tree canopy | 0 | 93 | 5 | 0 |
常绿林 Evergreen forest | 树冠 Tree canopy | 0 | 95 | 4 | 0 |
混交林 Mixed forest | 树冠 Tree canopy | 0 | 92 | 7 | 0 |
灌木/灌丛 Shrub/scrub | 树冠 Tree canopy | 0 | 58 | 38 | 4 |
草地/草本植被 Grassland/herbaceous | 低矮植被 Low vegetation | 1 | 23 | 54 | 22 |
牧场/枯草 Pasture/hay | 低矮植被 Low vegetation | 0 | 12 | 83 | 3 |
栽培作物 Cultivated crops | 低矮植被 Low vegetation | 0 | 5 | 92 | 1 |
森林沼泽 Woody wetlands | 树冠 Tree canopy | 0 | 94 | 5 | 0 |
挺水湿地 Emergent wetlands | 树冠 Tree canopy | 8 | 86 | 5 | 0 |

图3 缩影的区域迭代
Fig.3 The area iteration of the miniature
A:512像素×512像素的NAIP图像NAIP image of 512×512;B:1~6表示299×299缩影参数训练的逐步迭代过程1-6 indicates the step-by-step iterative process of 299×299 microfilm parameter training.
因此,标签超分辨率所需要的只是概率分布,该分布能显示出来每个混合成分在低分辨率类别中出现的频率。给出低分辨率的标记数据,即成对和经过训练的遥感图像块的混合模型,得出的结果是:
(8) |
即该算法遍历了所有的遥感图像块,查看它们分配给原型索引的后置,来计算每个原型索引与每个类的关联次数。
具有参数共享的缩影(epitomics)表示法在此还有额外的优势。对于标准的高斯混合的图像块(patches),可以完成的标签超分辨率的水平是由分析中使用的遥感图像块缩影的大小定义的,因为所有推理都是在遥感图像块索引的水平上进行的,而不是在单个像素上。因此,为了获得在单个像素水平的标签超分辨率,可以通过将统计数据分配给缩影中的各个位置,而不是使用整个缩影图像块的统计信息。
(9) |
其中,是后验位置,
综上所述,LSR算法使用K×K图像块的缩影模块,使用
在标签超分辨率的最终结果输出之后,拟合一个小型神经网络作为后处理步骤。如

图4 后处理完全卷积网络结构
Fig.4 Post-processing fully convolutional network structure
语义变化检测是一种多分类问题,通过对比不同时相土地覆盖分类图像之间的差异得出变化检测结果。变化检测的预测图(predictions,P)的表达公式为:
(10) |
其中,、代表前后2个不同时相的土地分类标签图像,表示高分辨率土地分类标签类别, =4。
经历过变化的单个像素既会在一个时间点的数据中“获得”1个类,又会在另1个时间点数据中“失去”1个类。因此,最后会生成2张独立的土地覆盖的预测图。土地覆盖变化分为减少的土地覆盖类别图和增加的土地覆盖类别图,减少的土地覆盖图用
(11) |
(12) |
为了评价标签超分辨率算法对于多时相语义变化检测的性能,采用像素准确率(pixel accuracy,PA)和平均交并比(mean intersection over union,mIoU)精度指标衡量算法检测结果的好坏。其中,PA为预测正确类别的像素点与总像素点的比值,计算公式为:
(13) |
为了对变化检测进行评估,确定2个NAIP图像之间的8种高分辨率的变化类型:(1)水类的增加和损失;(2)树冠类的增加和损失;(3)低矮植被的增加和减少;(4)不透水面的增益和损失。评分指标是8个类别的预测标签和地面真实标签之间的交并比(IoU),即4个目标类别中每个的损失和增益,不包括没有变化的类别。虽然没有计算无变化类的IoU,但对没有变化的像素的变化预测仍然会降低
(14) |
将8个类别的IoU累加之后进行平均处理得到评价指标平均交并比(mean intersection over union,mIoU):
(15) |
公式(
试验环境为NVIDIA Tesla V100显卡,16 G显存,GPU加速库采用CUDA-10.1。在Ubuntu16.04.7下另外安装Anaconda3并创建既有Python 3.6和Pytorch 1.5.1的软件环境。使用Pytorch框架搭建整个网络,输入的图像大小均为512像素×512像素,在将图像送入网络之前,低分辨率输入增强和随机颜色增强将被应用于传入的遥感图像。构建了1个299像素×299像素的缩影模型。试验中的具体参数见
模型 Model | 参数名称 Parameter name | 参数值Parameter | |
---|---|---|---|
缩影模型Epitomes model (299299) | 可变大小的块w Variable size block w | 1111~3131 | |
平滑概率依据 Smoothed Probability basis | 2 | ||
均值() Mean | 0.5+unif(0,0.1) | ||
方差() Variance | 初始值 Initial value | 10 | |
范围 Range | 1~100 | ||
先验在对数域参数化Prior | 初始值 Initial value | 0 | |
范围 Range | -4~4 | ||
学习率 Learning rate | 0.003 | ||
优化器 Optimizer | Adam | ||
迭代次数 Number of iterations | 50 000 | ||
批处理大小 Batch size | 256 | ||
位置推广阈值 Location promotion threshold |
1 | ||
计数器重置阈值() Counter reset threshold | 0.05 | ||
FCN模型 FCN model | 训练 Epoch | 50 | |
批处理大小 Batch size | 64 | ||
学习率(α) Learning rate(α) | 0.001 |
方法 Method | 像素准确率 PA | 平均交并比 mIoU |
---|---|---|
Epitomic LSR | 85.4 | 58.6 |
Epitomic LSR+LR+Color | 86.3 | 63.5 |
Epitomic LSR+LR+NS | 86.8 | 65.2 |
Epitomic LSR+LR+Color+NS | 87.6 | 68.1 |
从
将本研究提出的算法与NLCD diff、FCN/逐块(FCN/tile)、FCN/整体 (FCN/all)、U-Net/逐块(U-Net/tile)、U-Net/整体(U-Net/all)等5种基线多时相语义变化检测方法进行比较。依据4个目标类别的增益和损失的IoU得分与最终的mIoU进行分析,以验证所提出的多时相语义变化检测算法的有效性。
方法 Method | -W | -TC | -LV | -I | +W | +TC | +LV | +I | mIoU |
---|---|---|---|---|---|---|---|---|---|
NLCD diff | 14.8 | 16.7 | 28.2 | 1.4 | 3.1 | 0.1 | 10.6 | 36.2 | 13.9 |
FCN/tile | 64.1 | 43.6 | 40.7 | 9.1 | 25.5 | 7.3 | 30.2 | 52.8 | 34.2 |
FCN/all | 58.4 | 64.4 | 60.1 | 40.0 | 29.2 | 18.1 | 60.7 | 71.6 | 50.3 |
U-Net/tile | 27.5 | 48.3 | 47.7 | 29.1 | 15.8 | 14.8 | 35.1 | 51.6 | 33.7 |
U-Net/all | 32.5 | 48.4 | 47.6 | 30.7 | 23.7 | 20.5 | 34.2 | 51.7 | 36.1 |
Epitomic LSR | 71.3 | 50.0 | 72.5 | 26.6 | 58.2 | 68.7 | 61.4 | 20.9 | 53.7 |
Epitomic LSR+LR+Color | 74.3 | 52.2 | 70.1 | 37.2 | 62.6 | 67.3 | 63.0 | 22.1 | 56.1 |
Epitomic LSR+LR+NS | 77.2 | 58.3 | 75.2 | 32.7 | 59.2 | 72.1 | 64.2 | 19.4 | 57.3 |
Epitomic LSR+LR+Color+NS | 78.0 | 62.7 | 76.3 | 29.1 | 62.9 | 68.8 | 71.5 | 24.6 | 59.2 |
由

图5 几种多时相语义变化检测方法检测结果示例
Fig.5 Examples of detection results from several multi temporal semantic change detection methods
A~E:NLCD diff、FCN/逐块、FCN/整体、U-Net/逐块、U-Net/整体的检测结果Detection of NLCD diff,FCN/tile,FCN/all,U-Net/tile,U-Net/all;F:本研究的结果Results of the method proposed herein;G:真实的地面标签The true ground label.
本研究中提出了一种基于缩影的多时相遥感语义变化检测方法。缩影模型采用简单的图像块混合模型,类似被训练的图像,因此该模型是可解释的。基于该优点,建模所需要的不变性可以直接用额外的隐藏变量即通过向该模型中加入直观且易于理解的先验知识来实
未来遥感应用的重要基础是实时的大数据服务平台。为提高本研究方法的实用性,可选择利用实时遥感数据平台结合基于缩影的多时相语义变化检测技术实现实时观测和开展区域或土地覆盖变化检测的研究。GEE平台公共数据库中提供了目前经常使用的遥感影像数据、地理空间数据集,可以快速、批量处理海量的遥感大数据。使用GEE平台进行长时间序列和大范围土地利用变化遥感监测研究和应用,具有很强的平台优势和技术先进性。
参考文献 References
阎守邕.现代遥感技术系统及其发展趋势[J].环境遥感,1995(1):52-62.YAN S Y.Modern remote sensing technical system and its development trends[J].National remote sensing bulletin,1995(1):52-62(in Chinese with English abstract). [百度学术]
张良培,武辰.多时相遥感影像变化检测的现状与展望[J].测绘学报,2017,46(10):1447-1459.ZHANG L P,WU C.Advance and future development of change detection for multi-temporal remote sensing imagery[J].Acta geodaetica et cartographica sinica,2017,46(10):1447-1459(in Chinese with English abstract). [百度学术]
SOHL T L.Change analysis in the United Arab Emirates:an investigation of techniques[J].Photogrammetric engineering and remote sensing, 1999,65(4):475-484. [百度学术]
BERBEROGLU S,AKIN A.Assessing different remote sensing techniques to detect land use/cover changes in the eastern Mediterranean[J].International journal of applied earth observation and geoinformation,2009,11(1):46-53. [百度学术]
程腾辉,范文义,吴国明.多时相PolInSAR数据土地覆盖类型分类研究[J].森林工程,2022,38(5):10-17.CHENG T H,FAN W Y,WU G M.Research on land cover type classification of multi-temporal PolInSAR data[J].Forest engineering,2022,38(5):10-17 (in Chinese with English abstract). [百度学术]
MOU L C,BRUZZONE L,ZHU X X.Learning spectral-spatial-temporal features via a recurrent convolutional neural network for change detection in multispectral imagery[J].IEEE transactions on geoscience and remote sensing,2018,57(2):924-935. [百度学术]
ZHANG C X,YUE P,TAPETE D,et al.A multi-level context-guided classification method with object-based convolutional neural network for land cover classification using very high resolution remote sensing images[J/OL].International journal of applied earth observation and geoinformation,2020,88:102086[2022-08-02].https://doi.org/10.1016/j.jag.2020.102086. [百度学术]
YANG K P,XIA G S,LIU Z C,et al.Asymmetric Siamese networks for semantic change detection in aerial images[J].IEEE transactions on geoscience and remote sensing,2022,60:1-18. [百度学术]
吴伟斌,唐婷,刘强,等.基于语义分割的山地果茶园道路识别技术研究[J].华中农业大学学报,2022,41(1):246-254. WU W B,TANG T,LIU Q,et al. Semantic segmentation based road recognition technology of hilly fruit and tea garden[J].Journal of Huazhong Agricultural University,2022,41(1):246-254(in Chinese with English abstract). [百度学术]
郭海涛,卢俊,袁洲,等.Siam-DeepLabv3+网络遥感影像语义变化检测方法[J].测绘科学技术学报,2021,38(6):597-603.GUO H T,LU J,YUAN Z,et al.A semantic change detection method for remote sensing images based on Siam-DeepLabv3+[J].Journal of geomatics science and technology,2021,38(6):597-603(in Chinese with English abstract). [百度学术]
王利民,刘佳,季富华.中国农业遥感技术应用现状及发展趋势[J].中国农学通报,2021,37(25):138-143.WANG L M,LIU J,JI F H.Status quo and development trend of agriculture remote sensing technology application in China[J].Chinese agricultural science bulletin,2021,37(25):138-143(in Chinese with English abstract). [百度学术]
史舟,梁宗正,杨媛媛,等.农业遥感研究现状与展望[J].农业机械学报,2015,46(2):247-260.SHI Z,LIANG Z Z,YANG Y Y,et al.Status and prospect of agricultural remote sensing[J].Transactions of the CSAM,2015,46(2):247-260(in Chinese with English abstract). [百度学术]
CHI M M,PLAZA A,BENEDIKTSSON J A,et al.Big data for remote sensing:challenges and opportunities[J].Proceedings of the IEEE,2016,104(11):2207-2219. [百度学术]
MALKIN N,ROBINSON C,JOJIC N.High-resolution land cover change from low-resolution labels:simple baselines for the 2021 IEEE GRSS Data Fusion Contest[DB/OL].arXiv,2019:2101.01154[2022-08-02].https://arxiv.org/abs/2101.01154. [百度学术]
YOKOYA N,GHAMISI P,HANSCH R,et al.2021 data fusion contest:geospatial artificial intelligence for social good technical committees[J].Geoscience and remote sensing,2021,9(4):274-277. [百度学术]
FU K,LU W X,DIAO W H,et al.WSF-NET:weakly supervised feature-fusion network for binary segmentation in remote sensing image[J/OL].Remote sensing,2018,10(12):1970[2022-08-02].https://doi.org/10.3390/rs10121970. [百度学术]
WANG S,CHEN W,XIE S M,et al.Weakly supervised deep learning for segmentation of remote sensing imagery[J/OL].Remote sensing,2020,12(2):207[2022-08-02].https://doi.org/10.3390/rs1202207. [百度学术]
PATHAK D,KRÄHENBÜHL P,DARRELL T.Constrained convolutional neural networks for weakly supervised segmentation[C]//2015 IEEE International Conference on Computer Vision (ICCV),December 7-13,2015,Santiago,Chile,USA.[S.l.]:IEEE,2016:1796-1804. [百度学术]
ROBINSON C,HOU L,MALKIN K,et al.Large scale high-resolution land cover mapping with multi-resolution data[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),June 15-20,2019,Long Beach,CA,USA.[S.l.]:IEEE,2020:12718-12727. [百度学术]
MALKIN K, ROBINSON C, HOU L, et al. Label super-resolution networks[C]//Proceedings of the International Conference on Learning Representations,Apr 30-May 3,2018,Vancouver,Canada.Vancouver:ICLR,2018. [百度学术]
ZHAO M Z,HOU L,LE H,et al.Label super resolution with inter-instance loss[DB/OL].arXiv,2019:1904.04429[2022-08-02].https://arxiv.org/abs/1904.04429. [百度学术]
SHELHAMER E,LONG J,DARRELL T.Fully convolutional networks for semantic segmentation[J].IEEE transactions on pattern analysis and machine intelligence,2017,39(4):640-651. [百度学术]
JOJIC N,FREY B J,KANNAN A.Epitomic analysis of appearance and shape[C]//Proceedings of the Ninth IEEE International Conference on Computer Vision,October 13-16,2003,Nice,France.[S.l.]:IEEE,2008:34-41. [百度学术]
MALKIN N,ORTIZ A,JOJIC N.Mining self-similarity:label super-resolution with epitomic representations[C]//Computer Vision-ECCV 2020:16th European Conference,August 23-28,2020,Glasgow,UK.New York:ACM,2020:531-547. [百度学术]
HOMER C,DEWITZ J,YANG L M,et al.Completion of the 2011 national land cover database for the conterminous United States:representing a decade of land cover change information[J].Photogrammetric engineering & remote sensing,2015,81(5):345-354. [百度学术]
ROBINSON C,MALKIN K,HU L,et al.Weakly supervised semantic segmentation in the 2020 IEEE GRSS data fusion contest[C]//IGARSS 2020 - 2020 IEEE International Geoscience and Remote Sensing Symposium,September 26-October 2,2020,Waikoloa,HI,USA.Waikoloa:IEEE,2021:7046-7049. [百度学术]
FREY B J,JOJIC N.Transformed component analysis:joint estimation of spatial transformations and image components[C]//Proceedings of the Seventh IEEE International Conference on Computer Vision,September 20-27,1999,Kerkyra,Greece.Kerkyra:IEEE,2002:1190-1196. [百度学术]