-
胸径、树高是森林经营和森林调查中的重要因子[1]。在实际调查中,树高的测量耗时费力而且易产生误差[2],而胸径的测量相比树高更加便捷、准确,因此通常只实测部分树木的树高,通过不同树种的树高—胸径模型来预测缺失的树高[3]。关于树高—胸径模型,传统的研究方法通常需要先从较常用的树高曲线模型或其扩展形式中选择若干模型作为候选树高曲线模型,然后分别进行拟合,再根据模型决定系数、参数值等指标,并借助于树高预测-实测对比图、树高预测值-残差图等最终决定适宜的模型[4]。然而候选模型的选择往往依赖于前人研究或由研究者凭经验主观判断,不同研究者选择的候选模型种类、数量都存在较大差异。有的候选模型数量较少,只有几种[4-5],而有的则多达十几种[6]甚至几十种[7],候选模型数量少则精确度不足,数量多则使得工作量加大而效率降低,然而受限于模型本身对数学函数的依赖性以及候选模型数量的有限性,导致其难以最大限度地逼近林分生长的复杂非线性关系。人工神经网络非常适合应用于非线性建模,其在建模过程中不依赖于现存模型并且具有无限逼近任意非线性的能力[8-10]。BP(Back Propagation)人工神经网络是Rumelhart和McCelland领导的科研小组于1986提出的一种按照误差逆向传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP人工神经网络也是林业研究中常用的一种, 马天晓等[11],董云飞等[12]运用BP人工神经网络分别拟合毛白杨(Populus tomentosa Carr.)和杉木(Cunninghamia lanceolata (Lamb.) Hook.)的树高曲线,结果表明BP神经网络具有泛化能力强,精确度高、误差小等优点。
目前应用BP神经网络的研究对象多为人工林[11-13],栎类(Quercus)天然林[14]、兴安落叶松(Larix gmelinii(Rupr.) Kuzen.)天然林[15]等也有应用,但总体来看在天然林中应用较少。本研究以吉林省汪清林业局金沟岭林场的天然云冷杉针阔混交林为对象,分树种(组)通过人工神经网络建立天然云冷杉针阔混交林标准树高模型,并与传统模型进行比较,探讨BP模型在天然针阔混交林中应用的可行性,为森林经营管理中更加高效、准确的建立树高模型提供理论参考。
HTML
-
采用金沟岭林场的12块天然云冷杉针阔混交林样地,每块样地面积为1 hm2。调查样地主要乔木树种有冷杉(Abies nephrolepis(Trautv.) Maxim.)、鱼鳞云杉(Picea jezoensis Carr. var. microsperma(Lindl.)Cheng et L.K.Fu)、红松(Pinus koraiensis Siebold et Zuccarini)、红皮云杉(Picea koraiensis Nakai)、长白落叶松(Larix olgensis Henry)、大青杨(Populus ussuriensis Kom.)、紫椴(Tilia amurensis Rupr.)、色木(Acer mono Maxim.)、黄檗(Phellodendron amurense Rupr.)、榆树(Ulmus pumila Linn.)、白桦(Betula platyphylla Suk.)、水曲柳(Fraxinus mandschurica Rupr.)和枫桦(Betula costata Trautv.)等。实测树高1.3 m以上树木的胸径和树高,共得到观测数据12 953对。为便于建模,将树种进行分组,其中:落叶松1 303对,云杉(包括鱼鳞云杉和红皮云杉,下同)1 073对,冷杉3 111对,红松965对,慢阔(色木、水曲柳、黄檗、紫椴和枫桦)4 335对,中阔(白桦、大青杨、榆树和杂木)2 141对数据。选择其中8块样地的数据用于建模,剩下的4块样地数据用于模型检验,取样地中树高最大的100棵树的平均树高作为林分优势高,数据概况见表 1。
树种(组)
Tree species
(groups)建模样地Modeling plots 检验样地Test plots 两种样地数据曼惠特
尼U检验
Mann-Whitney U test数据类型
Data type平均值
Mean标准差
SD最大值
Max最小值
Min平均值
Mean标准差
SD最大值
Max最小值
Min落叶松
Larix olgensisD/cm 21.1 6.3 43.3 2.3 18.3 4.3 34.8 5.4 极显著very significant H/m 21.7 4.5 34.2 2.4 20.3 3.7 28.7 7.6 极显著very significant Ht/m 25.1 1.2 27.0 23.7 24.9 0.4 25.2 24.2 极显著very significant 云杉
Picea spp.D/cm 16.1 10.9 55.5 1.0 14.0 9.5 56.0 1.0 极显著very significant H/m 13.3 7.8 33.0 1.7 12.1 7.2 28.8 1.5 极显著very significant Ht/m 25.1 1.2 27.0 23.7 24.9 0.4 25.2 24.2 极显著very significant 冷杉
Abies nephrolepisD/cm 10.0 8.9 53.0 1.0 9.4 8.5 40.3 1.0 极显著very significant H/m 9.0 7.3 31.0 1.6 8.9 7.3 28.2 1.5 极显著very significant Ht/m 25.1 1.2 27.0 23.7 24.9 0.4 25.2 24.2 极显著very significant 红松
Pinus koraiensisD/cm 16.9 12.0 54.0 1.0 17.8 11.1 72.0 1.0 不显著not significant H/m 12.8 7.1 28.0 1.5 13.6 6.2 25.9 1.7 不显著not significant Ht/m 25.1 1.2 27.0 23.7 24.9 0.4 25.2 24.2 极显著very significant 慢阔
deciduous tree group 1D/cm 13.0 8.4 54.3 1.0 13.9 8.5 53.2 1.2 极显著very significant H/m 19.2 21.9 32.2 1.0 14.3 6.8 31.1 2.1 极显著very significant Ht/m 25.1 1.2 27.0 23.7 24.9 0.4 25.2 24.2 极显著very significant 中阔
deciduous tree group 2D/cm 12.2 8.1 54.8 1.2 15.1 9.6 46.2 2.0 极显著very significant H/m 12.4 6.3 32.7 2.1 14.7 7.6 34.4 3.4 极显著very significant Ht/m 25.1 1.2 27.0 23.7 24.9 0.4 25.2 24.2 极显著very significant 注:D为胸径,H为单木树高,Ht为林分优势高, 慢阔包括色木、水曲柳、黄檗、紫椴和枫桦,中阔包括白桦、大青杨、榆树和杂木。D is diameter at breast height, H is individual tree height, Ht is dominant height, deciduous tree group 1 includes mono maple (Acer mono), ash (Fraxinus mandschurica), amur corktree (Phellodendron amurense), amur linden (Tilia amurensis), ribbed birch (Betula costata), deciduous tree group 2 includes white birch (Betula platyphylla), poplar (Populus ussuriensis), elm (Ulmus pumila) and weedtrees. Table 1. Summary of statistics of 8 modeling plots and 4 test plots
-
BP网络的拓扑结构包括:输入层、隐层和输出层(图 1),输入层将刺激信号传送到隐藏层,隐藏层由神经元之间联系的强弱(权重)和传递规则(激活函数)将刺激信号传送到输出层,输出层整合隐藏层处理后的刺激产生最终结果。如果存在正确结果,则比较正确结果和产生结果得出误差,然后逆推对神经网中的链接权重进行反馈修正,进而完成神经网络的学习过程。神经元的结构模型见图 2,(x1、x2、…、xn)为神经元的输入量,y为神经元的输出(也是下一层神经元的输入),(ω1、ω2、…、ωn)为权值,θ为阀值,f为激活函数,$ y = f\left( {\sum\limits_{i = 1}^n {{\omega _i}} {x_i}} \right)$。根据Kolmogorov定理,单隐层BP网络就能无限逼近任何连续的非线性曲线[16]。
-
基于Matlab(2014b)及软件自带的nntool工具箱建立单隐层BP神经网络模型以估测树高,其中,网络的输入层为胸径和林分优势高,输出层为树高,根据经验,BP神经网络隐层节点数可用Nh=$ \sqrt {{N_{in}} + {N_{out}}} $+h计算[17],式中:Nh为隐层节点数;Nin、Nout分别为输入层和输出层节点数;h取1~10之间的整数)来确定取值范围。本研究采用试凑法在此范围内逐个取值,根据拟合精度确定隐层节点。节点数确定后就可以得到模型的适宜结构,简化表现为Nin:Nh:Nout。
数据在参与建模前需要进行归一化处理,以加快训练网络的收敛速度,公式为:Y=(X-Min)/(Max-Min)(式中X、Y分别为转换前和转换后的值,Max、Min分别为样本的最大值、最小值)。
建模时,设置学习速率为0.01,目标精度为0.001,最大迭代次数为1 000,以logsig函数(Y=1/(1+e-x),X,Y分别为自变量和因变量)作为隐层神经元传递函数,以purelin函数(Y=aX+b,X,Y分别为自变量和因变量) 作为输出层传递函数,以Levenberg—Marquardt法作为训练算法。
-
根据前人的研究,从传统树高曲线研究中选择了两个应用较广的代表性模型:传统模型1:H=1.3+aDbe-c/Ht式中H为树高,D为胸径,Ht为林分优势高,a、b、c为参数[5];传统模型2:H=1.3+(a+bHt)/(c+D) 式中H为树高,D为胸径,Ht为林分优势高,a、b、c为参数[18]。
-
使用决定系数(R2)、平均绝对误差(MAE)和均方根误差(RMSE)来评价模型精度。决定系数越大、平均绝对误差、均方根误差越小,模型拟合精度越高。
2.1. 数据来源
2.2. BP人工神经网络
2.3. BP神经网络模型建立
2.4. 传统树高曲线建立
2.5. 模型评价和检验
-
构建以胸径和林分优势高作为输入变量,树高为输出变量,隐层节点数为Nh的BP神经网络。由经验公式计算得出Nh在2.732~11.732之间,为增加模型的容错性将隐层节点数范围稍稍扩大即调整为2~11的整数值,分树种(组)根据试凑法依次取节点数为2到11,每个节点训练20次并计算对应的平均R2和平均RMSE(见表 2)。由结果可知,R2随节点数的增大而增大,而RMSE随节点数增大而减小,也即:隐层节点数越大,模型精度越高。
树种(组)
Tree species
(group)落叶松
Larix olgensis云杉
Picea spp.冷杉
Abies nephrolepis红松
Pinus koraiensis慢阔
Deciduous tree
group 1中阔
Deciduous tree
group 2节点数
Nodes决定
系数
R2均方根
误差
RMSE决定
系数
R2均方根
误差
RMSE决定
系数
R2均方根
误差
RMSE决定
系数
R2均方根
误差
RMSE决定
系数
R2均方根
误差
RMSE决定
系数
R2均方根
误差
RMSE2 0.608 5 2.823 9 0.902 4 2.437 8 0.922 6 2.057 9 0.922 0 2.143 8 0.790 5 2.861 6 0.810 4 2.751 2 3 0.627 6 2.773 8 0.903 1 2.422 1 0.923 3 2.022 5 0.923 4 1.993 1 0.790 8 2.859 1 0.811 7 2.743 1 4 0.636 4 2.746 8 0.903 9 2.408 3 0.924 8 2.010 6 0.924 4 1.981 9 0.792 2 2.854 9 0.812 3 2.725 8 5 0.636 9 2.739 9 0.904 4 2.398 7 0.925 7 1.990 6 0.925 7 1.957 7 0.793 2 2.853 4 0.813 3 2.722 4 6 0.637 1 2.722 1 0.905 2 2.376 0 0.927 5 1.962 8 0.926 7 1.941 3 0.794 4 2.849 8 0.814 6 2.723 3 7 0.638 7 2.729 4 0.906 8 2.364 5 0.928 6 1.961 3 0.927 3 1.933 1 0.795 1 2.848 3 0.815 2 2.717 8 8 0.639 7 2.711 9 0.907 7 2.354 3 0.930 5 1.925 6 0.928 2 1.931 8 0.786 2 2.846 6 0.816 0 2.702 7 9 0.640 5 2.707 0 0.908 4 2.334 4 0.931 7 1.906 8 0.929 7 1.930 8 0.797 9 2.845 2 0.816 9 2.702 4 10 0.645 0 2.700 4 0.909 6 2.323 9 0.932 9 1.903 5 0.931 0 1.925 1 0.798 2 2.843 4 0.818 1 2.701 0 11 0.646 4 2.695 5 0.910 3 2.312 2 0.933 0 1.856 8 0.932 4 1.920 9 0.799 8 2.827 0 0.819 4 2.688 1 Table 2. Average statistics of fitting 6 tree species (groups) with different hidden layers for 20 times
由于隐层节点数不能为无限大,为进一步确定隐藏节点数,将神经网络的输出变量(树高)与其对应的输入变量(胸径)建立散点图,当散点图出现失真现象时说明此时模型的隐层节点数已不可取。图 3为落叶松、云杉、冷杉、红松、慢阔、中阔在隐层节点数分别为6、6、9、5、8、5时的散点图,图中反映胸径-树高关系的点所组成的曲线出现了不同程度的分化以及变形,因此判定此时的图像出现了失真现象。综合考虑模型的简化性和实用性,故选择图像失真时隐层节点数的前一个作为最佳隐层节点数,即落叶松、云杉、冷杉、红松、慢阔、中阔的隐层节点数分别为5、5、8、4、7、4。
-
节点数确定后,经过不断重复的训练,选择适宜的结构Nin:Nh:Nout作为最终模型,得到相应神经网络模型的传递函数表达式如下:
(1) 落叶松:适宜模型结构(即输入层节点数:隐藏层节点数:输出层节点数)为2:5:1
(2) 云杉:适宜模型结构为2:5:1
(3) 冷杉:适宜模型结构为2:8:1
(4) 红松:适宜模型结构为2:4:1
(5) 慢阔(色木、水曲柳、黄檗、紫椴和枫桦):适宜模型结构为2:7:1
(6) 中阔(白桦、大青杨、杂木和榆树)适宜模型结构为2:4:1
以上式中,H为树高值;hi为隐层神经元的传递输出;i = 1,2…;purelin为线性函数;logsig为对数S型函数;D和Ht分别为胸径和林分优势高。
-
根据所选用的胸径和林分优势高,在传统树高曲线研究中选择了两个模型(传统模型1和传统模型2),运用相同的8块建模样地数据预估各参数值,将建模样地数据代入到3个模型中,并比较其建模表现(表 3)。由表 3可知,BP神经网络的R2均大于传统模型,MAE和RMSE均小于传统模型,可见BP模型的拟合效果优于传统模型。
树种(组)
Tree species(group)模型
Models平均绝对误差
MAE决定系数
R2均方根误差
RMSE落叶松 模型1 model 1 2.003 2 0.595 0 2.872 8 Larix olgensis 模型2 model 2 2.031 7 0.594 9 2.873 2 BP 1.974 3 0.635 5 2.721 6 云杉 模型1 model 1 1.515 3 0.895 4 2.515 6 Picea spp. 模型2 model 2 1.754 1 0.876 5 2.732 8 BP 1.501 8 0.910 6 2.323 9 冷杉 模型1 model 1 1.602 8 0.909 5 2.193 3 Abies nephrolepis 模型2 model 2 1.405 6 0.903 7 2.262 9 BP 1.244 1 0.930 5 1.925 6 红松 模型1 model 1 1.674 7 0.910 4 2.135 3 Pinus koraiensis 模型2 model 2 1.796 6 0.895 1 2.310 4 BP 1.532 9 0.922 4 1.981 9 慢阔 模型1 model 1 2.491 7 0.779 6 2.930 1 Deciduous tree 模型2 model 2 2.674 3 0.770 8 2.850 6 group 1 BP 2.443 1 0.794 1 2.844 8 中阔 模型1 model 1 2.316 6 0.781 3 2.946 8 Deciduous tree 模型2 model 2 2.172 6 0.805 7 2.777 8 group 2 BP 2.076 2 0.817 9 2.684 1 注:模型1 H=1.3+aDbe-c/Ht式中H为树高,D为胸径,Ht为林分优势高,a、b、c为参数[5]。
Model 1 H=1.3+aDbe-c/Ht, H is tree height, D is diameter at breast height, Ht is dominant height, a, b and c are parameters.
模型2 H=1.3+(a+bHt)/(c+D)式中H为树高,D为胸径,Ht为林分优势高,a、b、c为参数[18]。
Model 2 H=1.3+(a+bHt)/(c+D), H is tree height, D is diameter at breast height, Ht is dominant height, a, b and c are parameters.Table 3. Comparison of performances between BP model and traditional models with 8 modeling plots
运用相同的4块检验样地数据代入到3个模型中,计算出相应的平均绝对误差(MAE)和均方根误差(RMSE)并比较其表现(表 4)。由表 4可知,BP神经网络的MAE和RMSE分别在1.251 8~2.454 6、2.006 0~3.1273之间,且均小于传统模型,可见BP模型的精度比传统的方程要高。
树种(组)
Tree species(group)模型
Models平均绝对误差
MAE均方根误差
RMSE落叶松 模型1 model 1 2.017 0 2.630 2 Larix olgensis 模型2 model 2 2.051 2 2.633 6 BP 1.986 7 2.587 3 云杉 模型1 model 1 1.523 1 2.146 0 Picea spp. 模型2 model 2 1.776 1 2.290 6 BP 1.512 3 2.122 0 冷杉 模型1 model 1 1.614 1 2.140 8 Abies nephrolepis 模型2 model 2 1.418 7 2.101 9 BP 1.251 8 2.006 0 红松 模型1 model 1 1.683 5 2.207 5 Pinus koraiensis 模型2 model 2 1.804 9 2.317 1 BP 1.543 6 2.172 9 慢阔 模型1 model 1 2.503 8 3.178 4 Deciduous tree 模型2 model 2 2.683 1 3.350 1 group 1 BP 2.454 6 3.127 3 中阔 模型1 model 1 2.321 4 3.062 8 Deciduous tree 模型2 model 2 2.181 1 2.906 6 group 2 BP 2.081 1 2.828 9 Table 4. Comparison of error analysis between BP model and traditional models with 4 test plots
图 4为使用随机选取的6块样地(其中2块样地的林分优势树高比较接近)数据代入BP模型中的预测结果。可以看出,在林分优势高一定的情况下,胸径越大,树高越大;在胸径一定的条件下,树高随林分优势高增大而增大。模型表现符合树木生长的客观规律。