• 中国中文核心期刊
  • 中国科学引文数据库(CSCD)核心库来源期刊
  • 中国科技论文统计源期刊(CJCR)
  • 第二届国家期刊奖提名奖

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于机载LiDAR数据估测林分平均高

赵勋 岳彩荣 李春干 张丽梅 谷雷

引用本文:
Citation:

基于机载LiDAR数据估测林分平均高

    通讯作者: 岳彩荣, cryue@163.com
  • 中图分类号: S771.8

Estimation of Forest Stand Mean Height Based on Airborne LiDAR Point Cloud Data

    Corresponding author: YUE Cai-rong, cryue@163.com ;
  • CLC number: S771.8

  • 摘要: 目的 以2016年9月广西壮族自治区高峰林场实验区获取的机载LiDAR点云数据为基础,通过提取30 m×30 m空间林分尺度下的LiDAR点云特征变量实现对林分平均高的估测。 方法 首先将105块实测林分平均高度的样地数据按照3:1的比例随机划分为训练样本(79)和检验样本(26),采用随机森林回归(RFR)和支持向量回归(SVR)两种机器学习算法对79个训练样本与对应的林分LiDAR点云特征变量回归建模。建模方案包括随机森林模型、支持向量机模型及随机森林+支持向量机组合模型。其次利用26个检验样本数据评价模型预测精度。最后统计3个模型中训练样本和检验样本对应的精度评价指标,以一个预测精度高、泛化能力强的模型作为最终模型进行林分平均高制图。 结果 表明:随机森林模型的训练样本和检验样本的决定系数(R2)分别为0.886 1和0.837 5,均方根误差(RMSE)分别为1.22和1.56;支持向量机模型的训练样本和检验样本的决定系数(R2)分别为0.886 4和0.840 9,均方根误差(RMSE)分别为1.21和1.54;组合模型的训练样本和检验样本的决定系数(R2)分别为0.859 8和0.853 2,均方根误差(RMSE)分别为1.35和1.48; 结论 组合模型的泛化能力及预测精度最好,支持向量机次之,最后为随机森林。利用组合模型可有效完成研究区林分平均高制图。
  • 图 1  研究区位置图

    Figure 1.  The location map of study area

    图 2  特征变量重要性

    Figure 2.  Importance of characteristic variables

    图 3  随机森林回归模型预测林分平均高和实测平均高对比图

    Figure 3.  Comparison of stand mean height between and the RFR model estimations the ground measured values

    图 4  支持向量机回归模型预测林分平均高和实测平均高对比图

    Figure 4.  Comparison of stand mean height between and the SVR model estimations the ground measured values

    图 5  组合回归模型预测林分平均高和实测平均高对比图

    Figure 5.  Comparison of stand mean height between and the RFR&SVR model estimations the ground measured values

    图 6  组合模型(RFR&SVR)林分平均高制图

    Figure 6.  Stand mean height map based on combined model (RFR&SVR)

    表 1  随机森林模型特征优选

    Table 1.  RF model feature selection

    序号 Order变量 Variable重要性 Importance
    1H800.100 73
    2H950.073 89
    3H750.069 96
    4H600.066 89
    5H900.061 01
    6Hvar0.058 46
    7H700.057 75
    8Hmax0.050 81
    9Hstd0.042 36
    10Hmean0.040 72
    11D30.034 92
    12Hmedian0.033 50
    13H300.028 55
    14Hcv0.025 59
    15H400.025 08
    16D80.022 87
    17D40.020 97
    下载: 导出CSV

    表 2  模型精度评价指标Table 2 Model accuracy evaluation index

    回归模型
    Regression model
    训练样本
    Training sample
    检验样本
    Test sample
    差值
    Difference
    R2RMSE/mR2RMSE/mR2RMSE/m
    RFR0.886 11.220.837 51.560.048 60.34
    SVR0.886 41.210.840 91.540.045 50.33
    RFR&SVR0.859 81.350.853 21.480.006 60.13
    下载: 导出CSV
  • [1]

    Næsset E. Predicting forest stand characteristics with airborne scanning laser using a practical two-stage procedure and field data[J]. Remote Sensing of Environment, 2002, 80(1): 88-99. doi: 10.1016/s0034-4257(01)00290-5
    [2]

    Magnussen S, Boudewyn P. Derivations of stand heights from airborne laser scanner data with canopy-based quantileestimators[J]. Canadian Journal of Forest Research, 2011, 28(7): 1016-1031. doi: 10.1139/cjfr-28-7-1016
    [3]

    Garcia M, Saatchi S, Ferraz A,<italic> et al</italic>. Impact of data model and point density on aboveground forest biomass estimation from airborne LiDAR[J]. Carbon Balance and Management, 2017, 12(1): 4. doi: 10.1186/s13021-017-0073-1
    [4] 穆喜云, 张秋良, 刘清旺, 等. 基于机载LiDAR数据的林分平均高及郁闭度反演[J]. 东北林业大学学报, 2015, 43(9):84-89. doi: 10.13759/j.cnki.dlxb.20150721.018

    [5]

    Popescu S C, Wynne R H, Nelson R F. Estimating plot-level tree heights with lidar: local filtering with a canopy-height based variable window size[J]. Computers and Electronics in Agriculture, 2002, 37(1-3): 71-95. doi: 10.1016/s0168-1699(02)00121-7
    [6]

    Popescu S C. Estimating biomass of individual pine trees using airborne lidar[J]. Biomass and Bioenergy, 2007, 31(9): 646-655. doi: 10.1016/j.biombioe.2007.06.022
    [7]

    Feng L, Chang T, Gui Z,<italic> et al</italic>. Estimation of forest parameter and biomass for individual pine trees using airborne LiDAR[J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(9): 219-224+242. doi: 10.6041/j.issn.1000-1298.2013.09.039
    [8] 穆喜云, 张秋良, 刘清旺, 等. 基于机载激光雷达的寒温带典型森林高度制图研究[J]. 北京林业大学学报, 2015, 37(7):58-67.

    [9]

    Urbazaev M, Thiel C, Cremer F,<italic> et al</italic>. Estimation of forest aboveground biomass and uncertainties by integration of field measurements, airborne LiDAR, and SAR and optical satellite data in Mexico[J]. Carbon Balance and Management, 2018, 13(1): 5. doi: 10.1186/s13021-018-0093-5
    [10]

    Bouvier M, Durrieu S, Fournier R A,<italic> et al</italic>. Generalizing predictive models of forest inventory attributes using an area-based approach with airborne LiDAR data[J]. Remote Sensing of Environment, 2015, 156: 322-334. doi: 10.1016/j.rse.2014.10.004
    [11]

    Montealegre A L, Lamelas M T, La Riva J D,<italic> et al</italic>. Use of low point density ALS data to estimate stand-level structural variables in Mediterranean Aleppo pine forest[J]. Forestry, 2016, 89(4): 373-382. doi: 10.1093/forestry/cpw008
    [12] 高 婷, 李卫忠, 赵鹏祥, 等. 基于ArboLiDAR的大野口林区森林参数估测[J]. 西北林学院学报, 2017, 32(4):172-177+223. doi: 10.3969/j.issn.1001-7461.2017.04.30

    [13] 庞 勇, 赵 峰, 李增元, 等. 机载激光雷达平均树高提取研究[J]. 遥感学报, 2008,(1):152-158.

    [14]

    Kwak D A, Cui G, Lee W K,<italic> et al</italic>. Estimating plot volume using lidar height and intensity distributional parameters[J]. International Journal of Remote Sensing, 2014, 35(13): 4601-4629. doi: 10.1080/01431161.2014.915592
    [15]

    Silva C A, Carine K, Hudak A T,<italic> et al</italic>. Modeling and mapping basal area of <italic>Pinustaeda L.</italic> plantation using airborne LiDAR data[J]. Anais da Academia Brasileira de Ciências, 2017, 89(3): 1895-1905. doi: 10.1590/0001-3765201720160324
    [16] 徐 婷, 曹 林, 申 鑫, 等. 基于机载激光雷达与Landsat 8 OLI数据的亚热带森林生物量估算[J]. 植物生态学报, 2015, 39(4):309-321.

    [17] 刘 浩, 张峥男, 曹 林. 机载激光雷达森林垂直结构剖面参数的沿海平原人工林林分特征反演[J]. 遥感学报, 2018, 22(5):872-888. doi: 10.11834/jrs.20187465

    [18]

    Osborne J W, Waters E. Four assumptions of multiple regression that researchers should always test[J]. Practical Assessment, Research & Evaluation, 2002, 8(2). doi: 10.7275/r222-hv23
    [19]

    Dalponte M, Bruzzone L, Gianelle D. Estimation of tree biomass volume in alpine forest areas using multireturn Lidar data and support vector regression[C]// Image and Signal Processing for Remote Sensing XIV. International Society for Optics and Photonics, 2008. doi: 10.1117/12.801669
    [20]

    Gleason C J, Im J. Forest biomass estimation from airborne LiDAR data using machine learning approaches[J]. Remote Sensing of Environment, 2012, 125: 80-91. doi: 10.1016/j.rse.2012.07.006
    [21]

    Li M, Im J, Quackenbush L J,<italic> et al</italic>. Forest biomass and carbon stock quantification using airborne LiDAR data: A case study over huntingtonwildlife forest in the Adirondack Park[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(7): 3143-3156. doi: 10.1109/JSTARS.2014.2304642
    [22] 鲁 林, 周小成, 余治忠, 等. 随机森林算法在机载LiDAR数据林分平均树高估算中的应用研究[J]. 地球信息科学学报, 2016, 18(8):1133-1140.

    [23]

    Alberto S C, Carine K, Hudak A T,<italic> et al</italic>. Estimating stand height and tree density in <italic>Pinus taeda</italic> plantations using in-situ data, airborne LiDAR and k-Nearest neighbor imputation[J]. Anais da Academia Brasileira de Ciências, 2018, 90(1): 295-309. doi: 10.1590/0001-3765201820160071
    [24]

    Monnet J M, Chanussot J, Berger, Frédéric. Support vector regression for the estimation of forest stand parameters using airborne laser scanning[J]. IEEE Geoscience & Remote Sensing Letters, 2011, 8(3): 580-584. doi: 10.1109/LGRS.2010.2094179
    [25]

    Tompalski P, White J C, Coops N C,<italic> et al</italic>. Demonstrating the transferability of forest inventory attribute models derived using airborne laser scanning data[J]. Remote Sensing of Environment, 2019, 227: 110-124. doi: 10.1016/j.rse.2019.04.006
    [26] 洪奕丰, 张守攻, 陈 伟, 等. 基于机载激光雷达的落叶松组分生物量反演[J]. 林业科学研究, 2019, 32(5):83-90. doi: 10.13275/j.cnki.lykxyj.2019.05.011

    [27]

    Axelsson P. DEM generation from laser scanner data using adaptive TIN models[J]. International Archives of Photogrammetry and Remote Sensing, 2000, 33(B4/1, PART 4): 111-118.
    [28]

    Naesset E, Bjerknes K. Estimating tree heights and number of stems in young forest stands using airborne laser scanner data[J]. Remote Sensing of Environment, 2001, 78(3): 328-340. doi: 10.1016/S0034-4257(01)00228-0
    [29]

    Tesfamichael S G, Ahmed F B, Van Aardt J A N. Investigating the impact of discrete-return lidar point density on estimations of mean and dominant plot-level tree height in <italic>Eucalyptus grandis</italic> plantations[J]. International Journal of Remote Sensing, 2010, 31(11): 2925-2940. doi: 10.1080/01431160903144086
    [30] 庞 勇, 李增元, 谭炳香, 等. 点云密度对机载激光雷达林分高度反演的影响[J]. 林业科学研究, 2008, 21(Z1):14-19. doi: 10.3321/j.issn:1001-1498.2008.z1.003

  • [1] . 基于低密度机载LiDAR和CCD数据的林分平均高提取. 林业科学研究, 2010, 23(2): 151-156.
    [2] 胡圣元庞勇蒙诗栎岳彩荣 . 时间序列Landsat 8 OLI数据森林年扰动检测. 林业科学研究, 2020, 33(6): 65-72. doi: 10.13275/j.cnki.lykxyj.2020.06.008
    [3] 庞勇李增元谭炳香刘清旺赵峰周淑芳 . 点云密度对机载激光雷达林分高度反演的影响. 林业科学研究, 2008, 21(Z1): 14-19.
    [4] 李军玲庞勇李增元荚文 . 云阴影区机载高光谱影像森林树种分类. 林业科学研究, 2019, 32(5): 136-141. doi: 10.13275/j.cnki.lykxyj.2019.05.018
    [5] 李春明 . 基于纵向数据非线性混合模型的杉木林优势木平均高研究. 林业科学研究, 2011, 24(1): 68-73.
    [6] 刘怡君庞勇廖声熙荚文陈博伟刘鲁霞 . 机载LiDAR和高光谱融合实现普洱山区树种分类. 林业科学研究, 2016, 29(3): 407-412.
    [7] 牛思圆刘鹏举雷相东任怡高影 . 基于连清样地数据的全国杉木人工林平均木树高-胸径模型. 林业科学研究, 2023, 36(1): 117-123. doi: 10.12403/j.1001-1498.20220322
    [8] 姜慧泉张会儒徐海生陈新美刘奉强 . 一种新的估计林分算术平均高抽样方法的验证与应用. 林业科学研究, 2010, 23(5): 703-707.
    [9] 周梅李春干李振余铸 . 点云密度对无人机激光雷达森林参数估测精度的影响. 林业科学研究, 2024, 37(2): 39-47. doi: 10.12403/j.1001-1498.20230242
    [10] 曾伟生唐守正 . 非线性模型对数回归的偏差校正及与加权回归的对比分析. 林业科学研究, 2011, 24(2): 137-143.
    [11] 潘孝政 . 浙南五种丛生竹测树因子的相关回归分析. 林业科学研究, 1993, 6(1): 105-111.
    [12] 欧光龙王俊峰肖义发胥辉 . 思茅松天然林单木生物量地理加权回归模型构建. 林业科学研究, 2014, 27(2): 213-218.
    [13] 解雅麟雷相东王海燕秦倩倩李翔 . 长白落叶松叶面积回归模型及比叶面积估计. 林业科学研究, 2019, 32(4): 57-63. doi: 10.13275/j.cnki.lykxyj.2019.04.008
    [14] 谭美杨志玲杨旭程小燕 . 厚朴野生资源的野外回归植株苗期适应性评价. 林业科学研究, 2019, 32(1): 125-132. doi: 10.13275/j.cnki.lykxyj.2019.01.017
    [15] 张博陈科屹周来Sajjad Saeed张雅馨孙玉军 . 基于分位数回归的杉木人工林地位级划分方法研究. 林业科学研究, 2021, 34(4): 103-110. doi: 10.13275/j.cnki.lykxyj.2021.04.012
    [16] 刘美爽邢艳秋吴红波尤号田 . 基于ICESat-GLAS波形估测平均树高的研究. 林业科学研究, 2014, 27(3): 309-315.
    [17] 国红雷渊才郎璞玫 . 年龄无关的生长模型研究—以落叶松平均高为例. 林业科学研究, 2020, 33(5): 129-136. doi: 10.13275/j.cnki.lykxyj.2020.05.016
    [18] 齐力旺李玲韩一凡韩素英Dietrich Ewald . 落叶松胚性愈伤组织诱导培养基中激素的311-A最优回归设计筛选. 林业科学研究, 2001, 14(3): 251-257.
    [19] 王震鲁乐乐张雄清张建国姜丽段爱国 . 基于贝叶斯模型平均法构建杉木林分蓄积量生长模型. 林业科学研究, 2021, 34(3): 64-71. doi: 10.13275/j.cnki.lykxyj.2021.03.007
    [20] 洪玲霞陆元昌雷相东 . 金沟岭林场森林景观分类及景观变化研究. 林业科学研究, 2004, 17(6): 717-725.
  • 加载中
图(6) / 表(2)
计量
  • 文章访问数:  4862
  • HTML全文浏览量:  3459
  • PDF下载量:  89
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-09-18
  • 录用日期:  2020-03-05
  • 网络出版日期:  2020-05-29
  • 刊出日期:  2020-08-01

基于机载LiDAR数据估测林分平均高

    通讯作者: 岳彩荣, cryue@163.com
  • 1. 西南林业大学林学院,云南 昆明 650224
  • 2. 广西大学林学院,广西 南宁 530004
  • 3. 西南林业大学园林园艺学院,云南 昆明 650224

摘要:  目的 以2016年9月广西壮族自治区高峰林场实验区获取的机载LiDAR点云数据为基础,通过提取30 m×30 m空间林分尺度下的LiDAR点云特征变量实现对林分平均高的估测。 方法 首先将105块实测林分平均高度的样地数据按照3:1的比例随机划分为训练样本(79)和检验样本(26),采用随机森林回归(RFR)和支持向量回归(SVR)两种机器学习算法对79个训练样本与对应的林分LiDAR点云特征变量回归建模。建模方案包括随机森林模型、支持向量机模型及随机森林+支持向量机组合模型。其次利用26个检验样本数据评价模型预测精度。最后统计3个模型中训练样本和检验样本对应的精度评价指标,以一个预测精度高、泛化能力强的模型作为最终模型进行林分平均高制图。 结果 表明:随机森林模型的训练样本和检验样本的决定系数(R2)分别为0.886 1和0.837 5,均方根误差(RMSE)分别为1.22和1.56;支持向量机模型的训练样本和检验样本的决定系数(R2)分别为0.886 4和0.840 9,均方根误差(RMSE)分别为1.21和1.54;组合模型的训练样本和检验样本的决定系数(R2)分别为0.859 8和0.853 2,均方根误差(RMSE)分别为1.35和1.48; 结论 组合模型的泛化能力及预测精度最好,支持向量机次之,最后为随机森林。利用组合模型可有效完成研究区林分平均高制图。

English Abstract

  • 林分平均高是评价森林生产力、计算森林生物量和蓄积量、研究森林碳循环的重要参考指标[1-3]。传统的森林参数调查中,需要花费大量人力物力,在地形复杂、人迹罕至的地方,甚至无法实现人工地面调查。

    20世纪80年代中期,激光雷达技术被应用于森林参数的获取[4]。机载LiDAR技术由于其具有测量精度高、实时性好、方便灵活等特点被广泛用于森林参数的获取。利用机载LiDAR点云数据获取森林参数可根据点云密度大小分为两类:即利用高密度点云直接获取单木参数,包括单木树高、冠幅、冠面积和材积等[5-7]。这一类方法往往需要高密度的激光点云,通常点云密度需达15点·m−2以上,数据获取成本较高,大区域范围难以应用。另一类利用相对稀疏的点云密度获取林分测树因子,如平均高、郁闭度、蓄积量等林分因子。通过建立机载LiDAR点云数据的统计特征和野外样地的林分调查因子的相关模型完成大范围的森林参数制图[8-9]。这一类方法对机载LiDAR点云数据密度要求较低,通常利用2点·m−2以上的低密度LiDAR点云即可与样地统计数据建立模型,完成大区域下森林参数的获取[10-12]

    近年来,已有大量研究利用机载LiDAR点云数据结合样地调查数据建立模型估测林分参数。这些模型主要分为参数模型和非参数模型。参数模型以线性回归为代表,Næsset、穆喜云、庞勇等[1, 4, 13]分别对挪威东南部的针叶林、内蒙古大兴安岭生态站典型的森林类型、山东省泰安市徂徕山林场人工林为主的林分利用机载LiDAR点云数据建立线性回归模型估测林分平均高都得到了较好的结果。Kwak、Silva、刘浩、徐婷等[14-17]基于机载LiDAR点云数据采用线性回归建立模型估测生物量、蓄积量、平均胸径、胸高断面积等森林参数也都取得了较好的效果。然而,虽然线性回归模型简单明了,但以此建立模型对数据要求较高,它假设数据满足正态性、方差齐性、独立性和线性相关等严苛的条件才能建立模型[18],实际应用中数据并非能满足以上的条件。非参数模型主要有支持向量机、随机森林、K近邻法(K-NN)、人工神经网络(ANN)、决策树等,这些方法都已被成功应用于森林参数估测[19-21]。鲁林等[22]基于机载LiDAR点云数据探索了随机森林算法在估测林分平均高中的适用性。Alberto等[23]基于机载LiDAR点云数据构建K近邻回归模型对位于巴西的火炬松(Pinus taeda L.)种植园进行了林分平均高和优势高估测,模型的相关性(R2)分别为94%和90%。Monnet等[24]基于机载LiDAR点云数据构建支持向量机和普通最小二乘模型对林分优势高进行估计,结果显示支持向量机和普通最小二乘估测精度相近,但支持向量机模型精度更高。Tompalski等[25]利用最小二乘模型、随机森林、K-NN 3个模型测试模型的可移植性,基于不同区域、不同点云特征对断面积加权平均高、断面积平均木直径和总材积进行估测,显示了机器学习算法在森林参数估测上具有巨大的优势性。洪奕丰等[26]基于机载LiDAR点云数据对长白落叶松(Larix olgensis Henry.)组分生物量使用随机森林算法反演建模,随机森林模型的精度(R2)均高于0.91。由于机载LiDAR点云数据的特殊性,能从三维结构上反映森林的垂直结构,因此,机载LiDAR点云数据可提供更多描绘森林的特征来估测森林参数。对于多特征参数的应用,更好的挖掘机载LiDAR点云数据获取森林参数的潜力,无疑机器学习提供了更加便利的技术手段。

    国外已有多位研究者基于机载LiDAR点云数据使用不同的机器学习方法对森林参数进行了估测研究,而国内相应研究较少。鉴于此,本研究以广西壮族自治区高峰林场试验区为研究区,采用2016年9月获取的机载LiDAR点云数据为基础,结合105块同步获取的样地数据,使用随机森林、支持向量机、支持向量机+随机森林的组合模型分别对研究区林分平均高进行建模估测。评价不同方法在使用机载LiDAR点云数据估测林分平均高应用中的适应性,采用模型精度高、泛化能力强的模型完成研究区林分平均高制图。

    • 试验区位于广西壮族自治区南宁市北部的国有高峰林场内,为一个呈东北-西南走向的近矩形区域,中心地理位置为108°23′45″ E, 22°58′33″ N,长11.2 km,宽4.2 km,面积约为4 770 hm2。研究区位置见图1。研究区属低山地貌,海拔90~460 m,地形封闭,一般坡度为24°~34°,坡度大于24°的面积占研究区面积的75%。属亚热带季风气候,年均温度21.6°左右,年均降水量1 300 mm,相对温度79%,热量充足,雨水充沛,林木生长迅速。森林覆盖率为90%以上,人工林约为95%,除桉树外,年龄大多在15 a以上,主要树种有尾叶桉(Eucalyptus urohpylla S.T. Blake)、巨尾桉(Eucalyptus grandis×E. urohpylla)、马尾松(Pinus massoniana Lamb.)、湿地松(Pinus elliottii Engelmann)、八角(lllicium verum Hook. f.)、红椎(Castanopsis hystrix Miq.)、火力楠(Michelia macclurei Dandy)、米老排(Mytilaria laosensis Lec.)、厚荚相思(Acacia crassicarpa Benth.)等。60%的林分为人工天然混交林,在沟谷内有少量天然杂木。

      图  1  研究区位置图

      Figure 1.  The location map of study area

    • 研究区划分为4个优势树种组,分别设置22块杉木样地、25块桉树样地(尾叶桉、巨尾桉)、29块松树样地(马尾松、湿地松、杂交松)、29块一般阔叶树样地(红椎、火力楠、米老排、八角、厚荚相思和天然杂木林),共计105块样地。在GIS软件中,基于小班空间分布图上根据优势树种(组)分布按照相对均匀分布的原则随机布设样地,确定样地中心点的图面坐标,根据图面坐标采用手持双频差分GPS导航至样地中心,观察周围林分情况,若该中心四周30 m内林分均属于同一类型,则该中心即为样地中心,否则,移动该中心至合适位置。如果无论怎样移动样地中心,样地都无法只包含一个林分类型,可包含两个类型,但不能包含无林地。最后在样地中心西北方向20 m处附近,随机确定样地西北角点,用森林罗盘仪和激光测距仪测设样地边界,样地面积为30 m×30 m。样地分布位置图见图1。在测设的样地内每木检尺,用胸径尺测量胸高直径,起测胸高直径为5 cm。用超声波测高仪(Haglóf VERTEX Ⅳ)测定3株平均木高和1株优势木高。样地计算指标包括:平均直径、平均树高、断面积、每公顷株数、每公顷蓄积量,其中每公顷蓄积量计算根据断面积和平均高采用形高表计算。林分平均高采用断面积加权法计算,计算公式为式(1)。以此方法完成105块样地调查。

      $H = \frac{{\displaystyle\sum\limits_i^n {{h_i}{g_i}} }}{{\displaystyle\sum\limits_i^n {{g_i}} }}$

      (1)

      式(1)中:H为林分平均高,hi为第i株树木的林木高度,gi为第i株树木的胸高断面积,n为林分株数。

    • 2016年9月使用R44直升机搭载奥地利RIEGL公司的VUX-1LR激光雷达系统获取整个研究区数据,飞行覆盖范围108°20′9″~108°27′33″ E,23°0′28″~22°56′3″ N。飞行总覆盖面积约为55 Km2,共飞行3驾次,每次约为5 h。该系统集激光测距、全球定位系统(GPS)和惯性导航系统(IMS)于一体。激光器工作波长为1 550 nm,激光束发散角为0.5 mrad,获得的平均点云密度约为2点每m2

      首先对机载LiDAR数据进行预处理,预处理包括去噪、滤波、分类。本研究选用阈值法消除噪点,使用不规则三角格网滤波算法[27],完成整个研究区的地面点和非地面点分类;由于森林地形的复杂性,目前很难有一种普适性的地面滤波算法可以科学准确的分类出地面点。因此由此方法得到的地面点需进一步目视解译,人工修正一些未分类正确的点,最终准确得到整个研究区的地面点。对于非地面点部分,研究区位于森林,所以只将非地面点区分为植被点和其他点,其他点不做处理。最后利用植被点与基于地面点插值生成的数字地面模型(DEM)作差得到整个研究区归一化后的植被点云。

      利用归一化的植被点云提取相关点云特征统计量。具体包括:高度百分位数13个(H5, H10, H20, H25, H30, H40, H50, H60, H70, H75, H80, H90, H95)、密度变量10个(D0, D1, D2, D3, D4, D5, D6, D7, D8, D9)、变异系数(Hcv)、最大值(Hmax)、最小值(Hmin)、平均值(Hmean)、中位数(Hmedian)、标准差(Hstd)、方差(Hvar)、高度百分位数四分位数间距(Hiq)等8个高度变量。由于LiDAR点云的首次回波对树冠表面探测更为敏感,因此本次研究使用首次回波提取以上LiDAR特征。为了便于地面样地数据匹配,统计空间林分尺度设置为30 m×30 m。

    • 基于LiDAR点云数据获取的31个特征变量结合实测样地数据采用随机森林、支持向量机回归及两种方法的组合回归建模。其中,组合回归建模利用随机森林优选特征,最后利用优选特征进行支持向量机回归建模。首先将105块样地数据按照3:1的比例随机划分为79个训练样本数据,26个检验样本数据,以79个训练样本数据作为建立模型的基础数据。其次利用格网搜索算法与十折交叉验证方法寻找最优参数,完成模型的建立。最后采用26个检验样本数据检验模型,完成模型的精度评价。精度评价主要采用决定系数(R2),均方根误差(RMSE)对比随机森林、支持向量机回归及两种方法的组合模型在机载LiDAR点云数据估测林分平均高中的适应性。以上回归模型建立均使用python语言实现。

    • 基于79个训练样本数据与机载LiDAR数据提取的30 m×30 m空间林分尺度下的特征变量回归建模。使用网格搜索算法结合十折交叉验证方法分别对随机森林、支持向量机及组合回归模型进行参数寻优。(1)随机森林主要对构建决策树的数量,使树节点分裂的最小特征数,最小叶子节点3个参数进行寻优。最终参数最优解的结果为:构建决策树的数量75,树节点分裂的最小特征数为2,最小叶子节点为2;(2)支持向量机模型参数寻优中选用常用的3个核函数,即线性核、RBF和多项式核函数分别进行。寻优结果为: 核函数为RBF,惩罚参数(C)为10,gamma参数为0.02。(3)根据参数寻优建立的随机森林回归模型得到参与建模LiDAR特征变量的重要性,如图2。图中重要性值越高,该特征对林分平均高估测越重要。由图2可以看出,LiDAR特征变量中几个高度分位数的重要性值都较大,其中以H80高度分为数最大;其次为点云的几个统计变量(HvarHmeanHstd等)。说明植被点云的首次回波中75%~95%的高度分位数或最大高度分位数(Hmax)有利于拟合林分平均高或优势木平均高,这与前人研究结果一致[22, 28-30]。密度变量重要性值较大的有D3D4D8等。其中D3被选中与刘浩等[17]的研究结果一致。研究中选择大于80%信息累计贡献的特征变量使用支持向量机回归建模,随机森林回归模型优选后的特征变量具体见表1。依据网格参数寻优方法,进一步得到组合模型的参数最优解:核函数为RBF,惩罚参数(C)为10,gamma参数为0.01。

      表 1  随机森林模型特征优选

      Table 1.  RF model feature selection

      序号 Order变量 Variable重要性 Importance
      1H800.100 73
      2H950.073 89
      3H750.069 96
      4H600.066 89
      5H900.061 01
      6Hvar0.058 46
      7H700.057 75
      8Hmax0.050 81
      9Hstd0.042 36
      10Hmean0.040 72
      11D30.034 92
      12Hmedian0.033 50
      13H300.028 55
      14Hcv0.025 59
      15H400.025 08
      16D80.022 87
      17D40.020 97

      图  2  特征变量重要性

      Figure 2.  Importance of characteristic variables

    • 使用79个训练样本数据和26个检验样本数据分别利用3个回归模型进行林分平均高预测,进一步分析3个模型的预测林分平均高和实测林分平均高的相关关系。图345分别为随机森林模型、支持向量机模型以及两种方法组合模型的预测林分平均高和实测平均高的相关关系。

      图  3  随机森林回归模型预测林分平均高和实测平均高对比图

      Figure 3.  Comparison of stand mean height between and the RFR model estimations the ground measured values

      图  4  支持向量机回归模型预测林分平均高和实测平均高对比图

      Figure 4.  Comparison of stand mean height between and the SVR model estimations the ground measured values

      图  5  组合回归模型预测林分平均高和实测平均高对比图

      Figure 5.  Comparison of stand mean height between and the RFR&SVR model estimations the ground measured values

      3个模型精度评价指标见表2。表中差值一项反映了3个模型中训练数据和检验数据对应的精度指标之差,差值越小,模型泛化能力越强。由表2可知,3个模型的决定系数(R2)均大于0.85,RMSE也都较小。从检验样本的精度指标及其与模型精度的差值看,组合模型(RFR&SVR)的差值最小,泛化能力最强,说明利用组合模型更适合推演到区域尺度完成林分平均高制图。最后,采用python语言读取整个研究区的对应的LiDAR变量特征,利用组合模型完成整个研究区林分平均高制图,图6为研究区林分平均高分布图。

      表 2  模型精度评价指标Table 2 Model accuracy evaluation index

      回归模型
      Regression model
      训练样本
      Training sample
      检验样本
      Test sample
      差值
      Difference
      R2RMSE/mR2RMSE/mR2RMSE/m
      RFR0.886 11.220.837 51.560.048 60.34
      SVR0.886 41.210.840 91.540.045 50.33
      RFR&SVR0.859 81.350.853 21.480.006 60.13

      图  6  组合模型(RFR&SVR)林分平均高制图

      Figure 6.  Stand mean height map based on combined model (RFR&SVR)

    • (1)随机森林回归模型中,从训练样本的随机抽样到特征选择的随机抽样,两层随机抽样保证了模型的稳定性,在预测林分平均高中具有较强的抗噪声能力,使得随机森林模型在预测林分平均高中表现较好,训练数据和检验数据的预测精度均高于80%。同时,每棵决策树的建立,投票选择出对林分平均高解释性最强的特征变量,取每个特征的均值作为最终在模型中的贡献程度,相比于支持向量机模型而言可以更好的解释特征变量。

      (2)使用支持向量机预测林分平均高,通过核函数由低维到高维映射,解决了高维空间计算复杂的问题。同时,支持向量机寻找最少的支持向量构建支撑面,对噪声异值敏感度降低。回归过程中引入误差损失函数,使得误差容忍度提高,模型精度有所提高。对于小样本数据,支持向量机表现较优,研究结果也证明了这一点。较随机森林而言,支持向量机在利用105块实测样地数据建模预测林分平均高中精度优于随机森林模型。

      (3)组合模型利用了随机森林模型优选特征的可解释性和科学性,同时结合了支持向量机模型对小样本数据回归预测的优势,更好的完成林分平均树高的预测。研究结果得到组合模型的泛化能力最强,估测精度也与前两种方法相差较小,更适合于模型的推演与制图。

      (4)随机森林和支持向量机这一类机器学习算法,在模型的构建中,模型参数的优化是精确的预测林分平均高的关键。使用格网搜索算法进行参数的选择,是一种高效快捷的方式,它利用交叉验证的方法对每一组参数进行打分,最终选取出最优的参数组合,避免了在预测林分平均高建模中盲目调节参数的目的。

      (5)利用105块实测数据对研究区内的林分平均高建模回归预测,虽然取得了较好的结果,但由于本次研究中受样地数量的限制,没有分树种进行估测,一定程度会影响树高的估测精度。因此,后期需要分树种建模预测林分平均高,进一步改善预测精度。

    • 基于LiDAR点云数据提取的31个特征变量,以105块样地数据为基础,使用随机森林、支持向量机、两种方法的组合模型对广西壮族自治区高峰林场实验区的林分平均高进行预测。3种模型的模型精度和检验精度都较高。其中随机森林模型的决定系数(R2)和均方根误差(RMSE)为0.886 1和1.22,独立样本检验结果R2RMSE为0.837 5和1.56;支持向量机模型的决定系数(R2)和均方根误差(RMSE)分别为0.886 4和1.21,独立样本检验结果R2RMSE分别为0.840 9和1.54;两种方法的组合模型的决定系数(R2)和均方根误差(RMSE)分别为0.859 8和1.35,独立样本检验结果R2RMSE分别为0.853 2和1.48。总体上组合模型在基于机载LiDAR点云数据估测林分平均高中模型泛化能力最强、制图精度最高,更适合研究区完成森林林分平均高制图。

      由于本次研究区仅限于高峰林场,研究范围有限,研究中的3种估测方法及其效果差异是否适用广西其它地区还有待进一步试验。基于机载LiDAR点云数据开展可移植性的森林参数估测方法是今后深入研究的重要内容,也是笔者今后努力的方向。

      致谢:本次实验的机载LiDAR点云数据及野外调查地面数据由广西省壮族自治区林业勘测设计院提供,在此表示衷心感谢。

参考文献 (30)

目录

    /

    返回文章
    返回