Deep U-net Optimization Method for Forest Type Classification with High Resolution Multispectral Remote Sensing Images

WANG Ya-hui; CHEN Er-xue; GUO Ying; LI Zeng-yuan; JIN Yu-dong; ZHAO Jun-peng; ZHOU Yao

doi:10.13275/j.cnki.lykxyj.2020.01.002

Objective Full convolution neural network U-net can effectively improve the effect of remote sensing target recognition and object classification. Method The test site is located in Wangyedian Forest Farm, Chifeng district, Inner Mongolia Autonomous Region. The GF-2 multispectral data, ZY-3 DOM data, ZY-3 DEM data, subcompartment data and field survey data were employed as the key data sources. Based on the U-net network model and the optimization ideas of the previous FCN-8s model, the standard Normalize Different Vegetation Index (NDVI) was added to the original band in the training process, and the CRF post-processing process was added to construct the network and the final classification results were obtained. Result (1) The overall classification accuracy of the optimized U-net model was 84.89%, and the Kappa coefficient was 0.82, which was higher than that of the U-net model without NDVI feature and U-net model without CRF post-processing; (2) Compared with the classification results of FCN-8s, SVM and RF using the same strategy, the classification accuracy of the optimized U-net model was greatly improved. Conclusion The classification effect of U-net model can be improved by adjusting the relevant remote sensing features and using CRF post-processing method. This method is suitable for the classification of high resolution multispectral remote sensing images of forest types.

HTML

深度学习模型是近年来新兴的一类机器学习算法，已被有效的应用于许多领域当中。其中，在遥感领域，该类方法的应用效果也得到了有效的证明。对于遥感地物分类的应用问题，研究表明全卷积类深度神经网络方法（Fully Convolutional Networks，FCN）可有效的解决该问题。方旭等^[1]证明通过将均值漂移分割算法与FCN-8s方法相结合能够有效提高高分辨率遥感影像的分类精度，与传统机器学习分类方法SVM相比提高了10%以上的精度。邓国徽等^[2]将FCN-8s应用于高分遥感数据的语义分割，以分割图像中的施工场地为例，结果表明：提出的改进全卷积网络模型能够较为显著的提高了施工场地的识别率。Piramanayagam^[3]利用FCN将高分辨率遥感影像的光谱信息与DSM的几何信息有效融合，从而提高了高分辨遥感图像的语义分割能力。条件随机场方法（Conditional Random Field，CRF）作为图像处理中常用的能量优化算法，也已被学者证明可有效的改善FCN网络的分类效果^[4-5]。

U-net网络是全卷积神经网络模型中常用的一种，该模型通过一个收缩网络以及一个扩张网络，构成了一个U型结构，与经典的FCN网络相比，该网络在上采样过程中可以结合更多层的不同的特征，能够最大程度地保留下采样过程中的一些重要的特征信息^[6]。研究表明，该类网络可有效的进行遥感图像信息提取。陈睿敏等^[7]使用UNet深度学习模型对红外遥感影像进行5类地物信息提取，其分类效果与传统机器学习方法相比提高了6%。Li等^[8]提出了一种卷积块代替卷积层的深度卷积神经网络DeepUNet，提高了海岸线的分割精度。

有研究表明，通过少量的调整相关遥感特征，可以优化FCN深度学习模型的效果^[2，9]。邓国徽等^[2]提出了融合蓝板房光谱识别指数和裸土光谱识别指数的改进全卷积网络模型，结果表明：添加的指数可以较为显著的提高了施工场地的识别率；Cao Q等^[9]将NDVI与CNN的高级特征进行了融合，该算法对土地类型分类效果良好。

本研究借鉴前人对FCN-8s模型的优化思路，基于U-net网络模型，在模型训练过程中通过在原始波段的基础上加入NDVI特征，并增加CRF后处理过程，以期改善U-net深度学习模型用于森林类型分类的效果。

2. 研究方法

2.1. 森林类型分类

依据研究区出现的地类及其空间分布特点，在外业调查数据和已有小班数据的支持下，通过对GF-2遥感影像进行预分类，对能够有效区分的潜在地类进行了分析，最终确定了本研究的待分类类别包括：落叶松、油松、白桦、耕地、建设用地和其他。其中前3个地类属于有林地的细分类别，是以林地上林分的优势树种类型名称作为类别名称。其他地类主要包括在该研究区面积占比很小的樟子松、云杉、榆树等。

2.2. 分类总技术方法

本文研究从3个部分展开分类方法研究：首先，提取NDVI特征，其次，基于NDVI特征和原始影像4个波段，共计5个特征的数据构建深度U-net模型并进行分类；最后，对分类结果进行CRF后处理。在本研究中，将上述流程简称为U-net-NDVI-CRF方法。

2.2.1. U-net网络

U-net网络由一个收缩网络以及一个扩张网络构成，一共包含23个卷积层。其网络的结构具体为：收缩网络主要用于重采样的过程，随着网络深度的增加，提取高维抽象特征，每一次重采样都包含两个3×3的卷积操作，使用修正线性单元（rectified linear unit，ReLU）作为激活函数。每一次重采样的卷积操作将图片的尺寸变为原来图片尺寸大小的1/2，特征通道变为原来的两倍；扩张网络主要对收缩网络中的特征进行过采样的工作，每一次过采样包含两个3×3的卷积操作，同样使用RuLU作为激活函数。在每一次上采样后，图片大小变为原来的2倍，特征数量变为原来的1/2^[6]。在上采样操作中，将每一次输出的特征与对应的收缩网络特征合并在一起，补全中间丢失的特征信息。最后，加入1×1的卷积操作将之前所获得的特征映射到所属类别上^[6]。

2.2.2. 网络训练

U-net模型基于Tensorflow框架训练，使用Adam方法作为优化器来训练网络，学习率为0.001。网络的权重共更新10 000次。网络在一块NVIDIA Quadro K5200显卡上训练，GPU内存为8G。

本研究使用SVM和RF分类器作对比实验^[12-13]。针对SVM模型，设置核函数为GRBF（Gaussian radial basis function），使用的目标函数类型是C-支持向量分类（C-SVC），最优惩罚因子C和核函数参数γ进行自动寻优。针对RF模型，实验中设置的决策树的数量为100，每个决策树随机选择的5个特征构建模型，并通过投票法得到分类类别。

2.3. 分类精度检验

以外业调查样本地类为各地类真值，对分类的正确性进行检验，采用的评价指标包括分类混淆矩阵，得到制图精度、用户精度、总体分类精度及Kappa系数。

4. 讨论

（1）本研究采用U-net网络模型结合CRF对5个特征（原始四波段以及NDVI）的GF-2 PMS 3.2 m的遥感数据进行森林类型分类，总体分类精度为84.89%，与传统的机器学习分类方法RF、SVM在同等五波段时的分类结果相比，提高了8.04%至12.54%，提升效果显著，该结论与已有的将深度学习网络模型用于土地覆盖/利用遥感分类的文献所得到的结论一致^{[2, 5, 9]}。

（2）虽然深度学习方法，可以自动提取遥感特征，但是现有文献[2]、[9]表明，可以通过加入NDVI等少量特征可以提高分类精度。本研究为与机器学习分类方法在数据上形成对等性，不进行过多的手动提取和选择特征的步骤，选取NDVI与影像原始4个波段组成5个特征的数据进行分类，机器学习SVM、RF分类精度低于U-net的分类精度。

（3）由于采用的遥感影像成像时间和光谱限制，其他地类（主要包括榆树、杨树、柞树等植被类型）均属于落叶性植被，他们的光谱曲线和NDVI特征与白桦差异较小，造成目视解译困难，对分类结果造成了一定的影响。因此，考虑使用生长季影像对其他地类进行细化之后进行深度学习精细分类。

（4）本研究实验采用的数据是GF-2 PMS 3.2 m分辨率的遥感数据，而全色数据的分辨率可达0.8 m，结合纹理信息丰富的全色数据进行实验，对比在更高分辨率下地物的边缘信息是否更好的保留为下一步的研究方向。且本研究的GF-2 PMS遥感数据的时相为4月，使得其他地类的光谱差异不明显，使用生长季的数据进行森林类型的精细分类是下一步的研究方向。

5. 结论及展望

针对国家森林资源规划设计调查业务对高分辨率多光谱遥感分类技术的应用需求，发展了一种深度学习森林类型遥感分类方法。研究结果表明，通过加入NDVI特征可有效提高U-net网络森林类型分类结果的精度，采用CRF后处理则可以有效改善分类效果，且与FCN-8s、SVM、RF相比，优化后的U-net分类效果有较大的提升。

与传统机器学习分类方法相比，本研究所发展的方法可以自动提取遥感特征，从而可有效避免传统方法由于手工提取和选择特征等而导致的分类结果容易受人为因素影响的问题，具有更高的可操作性。当然，目前深度学习方法还存在对高性能GPU计算机依赖性强，模型训练耗时，技术门槛较高等问题。随着我国高性能GPU计算机的快速普及和计算能力的快速提高，这些制约深度学习分类方法林业业务化应用的障碍将很快得到克服，在本研究研究的基础上，针对林业遥感业务特点，通过深度学习网络结构的创新设计，进一步提高分类精度和效率，具有重要的研究和应用价值。

Reference (13)

[1]	方旭, 王光辉, 杨化超, 等. 结合均值漂移分割与全卷积神经网络的高分辨遥感影像分类[J]. 激光与光电子学进展, 2018, 55(2):1-9.
[2]	邓国徽, 高　飞, 罗志鹏. 基于改进的全卷积神经网络高分遥感数据语义分割研究[C]//第四届高分辨率对地观测学术年会论文集, 2017: 1-13.
[3]	Piramanayagam S. Classification of remote sensed images using random forests and deep learning framework[J]. Proceedings of the Spie, 2016, 4: 1-8
[4]	Chen L C, Papandreou G, Kokkinos I, et al. DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2016, 40(4): 834-848.
[5]	夏梦, 曹国, 汪光亚, 等. 结合深度学习与条件随机场的遥感图像分类[J]. 中国图象图形学报, 2017, 22(9):1-13.
[6]	Ronneberger O, Fischer P, Brox T. U-Net: Convolutional Networks for Biomedical Image Segmentation[M]. Medical Image Computing and Computer-Assisted Intervention, 2015: 234-241.
[7]	陈睿敏, 孙胜利. 基于深度学习的红外遥感信息自动提取[J]. 红外, 2017, 38(8):1-7.
[8]	Li R, Liu W, Yang L, et al. DeepUNet: A Deep Fully Convolutional Network for Pixel-level Sea-Land Segmentation[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2018: 1-9.
[9]	Cao Q, Zhong Y, Ma A, et al. Urban Land Use/Land Cover Classification Based on Feature Fusion Fusing Hyperspectral Image and Lidar Data[C]//IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium. IEEE, 2018: 8869-8872.
[10]	郝建亭, 杨武年, 李玉霞, 等. 基于FLAASH的多光谱影像大气校正应用研究[J]. 遥感信息, 2008(1):78-81.
[11]	高永年, 张万昌. 遥感影像地形校正研究进展及其比较实验[J]. 地理研究, 2008, 27(2):467-477.
[12]	刘怡君, 庞勇, 廖声熙, 等. 机载LiDAR和高光谱融合实现普洱山区树种分类[J]. 林业科学研究, 2016, 29(3):407-412.
[13]	任冲, 鞠洪波, 张怀清, 等. 天水市近30年林地动态变化遥感监测研究[J]. 林业科学研究, 2017, 30(1):25-33.

类别名称 Informational classes	油松 Pinus tabulaeformis	落叶松 Larix principis- rupprechtii	其他 Other lands	白桦 Betula platyphylla	耕地 Cultivated land	建设用地 Construcuion land	总计 Total
油松 Pinus tabulaeformis	74	15	1	0	0	0	90
落叶松 Larix principis-rupprechtii	0	51	2	1	0	0	54
其他 Other lands	0	1	29	4	3	0	37
白桦 Betula platyphylla	0	2	13	41	0	0	56
耕地 Cultivated land	0	0	0	0	30	1	31
建设用地 Construcuion land	0	0	1	0	3	39	43
总计 Total	74	69	46	46	36	40	311
制图精度 Producer accuracy/%	100	73.91	63.04	89.13	83.33	97.5
用户精度 User accuracy/%	82.22	94.44	78.38	73.21	96.77	90.7
注：总体精度：84.89%；Kappa系数：0.82。Note:Overall accuracy: 84.89%; Kappa coefficient: 0.82.

项目 Items	油松 Pinus tabulaeformis	落叶松 Larix principis-rupprechtii	其他 Other lands	白桦 Betula platyphylla	耕地 Cultivated land	建设用地 Construcuion land	总体精度 Overall accuracy	Kappa系数 Kappa
RGB-IR	100%	72.46%	45.65%	100%	69.44%	97.5%	81.99%	0.79
RGB-IR-NDVI	100%	71.01%	60.87%	89.13%	83.33%	100%	84.24%	0.81
RGB-IR-NDVI CRF	100%	73.91%	63.04%	89.13%	83.33%	97.5%	84.89%	0.82
注：所有精度均为制图精度。Note:All accuracy is producer accuracy.

模型 Model	油松 Pinus tabulaeformis	落叶松 Larix principis- rupprechtii	其他 Other lands	白桦 Betula platyphylla	耕地 Cultivated land	建设用地 Construcuion land	总体精度 Overall accuracy	Kappa系数 Kappa
RF	95.95%	75.36%	47.83%	67.39%	66.67%	62.5%	72.35%	0.66
SVM	97.30%	91.30%	36.96%	89.13%	58.33%	62.5%	76.85%	0.72
FCN-8s	100%	81.16%	34.78%	86.96%	52.78%	97.5%	78.46%	0.74
U-net	100%	73.91%	63.04%	89.13%	83.33%	97.5%	84.89%	0.82
注：所有精度均为制图精度。Note:All accuracy is producer accuracy.

Deep U-net Optimization Method for Forest Type Classification with High Resolution Multispectral Remote Sensing Images

Abstract

References

Proportional views

通讯作者: 陈斌, bchen63@163.com

Proportional views

Deep U-net Optimization Method for Forest Type Classification with High Resolution Multispectral Remote Sensing Images

Corresponding author: GUO Ying, guoying@ifrit.ac.cn;