-
沙柳(Salix psammophila C.Wang et Ch.Y. Yang)又名北沙柳,在库布齐沙漠有广泛分布,常作固沙造林树种[1-2],也是我国北部地区防风固沙的优良树种和当地典型的能源树种[2-3]。通常情况下,沙柳在沙丘中下部有少量分布,在滩地沙区大量密集分布[4]。沙柳具备生长速率较快的特点,并且人工栽培沙柳在短时间内就能产生体积很大的灌丛,因此能够在水土保持与荒漠化防治、水源涵养、气候调节等生态效益方面起到重要的作用[5]。由于沙柳木质优良,还可以广泛用于造纸、人造板等工业用途[6]。
在干旱半干旱风沙区,沙生灌木有着防风固沙、水土保持等作用,通常野外调查使用的直接收割法会对地表造成破坏从而发生土壤侵蚀现象[7]。因此探究灌木生物量与易测因子间的关系,建立沙生灌木生物量模型对沙生灌木生物量研究有很大的助力。目前,国内外学者在生物量模型方面有大量的研究[8-10],通常选取林木因子作为自变量构建灌木生物量模型,但是由于各区域之间自然环境条件的巨大差别,以及不同气候区灌木植被的形态特性等具有很大不同,因此很多地区灌木的生物量预测模型仅在当地有较好的解释力。因此对于灌木构建适应其生境的生物量预测模型是十分必要的[11]。
近年来,许多学者将BP神经网络应用在林业上[12-14]。研究发现,BP神经网络模型精度相较于传统更好[15-19]。但是目前的研究大多集中在高大乔木的生物量估算方面,对于运用BP神经网络进行灌木,尤其是沙生灌木的生物量估算却鲜有报道。因此,利用沙柳的不同林木因子建立BP神经网络生物量估算模型,探究BP神经网络在沙生灌木生物量方面的应用是必要的。本研究以库布其沙漠沙柳为研究对象,建立了沙柳BP神经网络的生物量预测模型,探究不同林木因子对沙柳BP神经网络生物量预测模型的影响,以期为沙柳以及其他沙生灌木生物量建模与估测工作提供参考依据。
-
研究区域地处库布齐沙漠,处于鄂尔多斯市杭锦旗独贵塔拉镇境内,地理坐标为108°15′~108°24′ E ,40°48′~40°39′ N ,属于典型温带大陆性干旱、半干旱季风气候。年均降水量约400 mm[20]。其范围内木本野生植物主要有小叶杨(Populus simonii Carr),沙枣(Elaeagnus angutifolia Linn),沙柳(Salix psammophila C.Wang et Ch.Y. Yang)等[6]。
-
外业数据采集时间为2017年4月。在研究地选择迎风坡风蚀、丘间低地沙埋和未沙埋3种立地条件,共选择91株沙柳。根据沙柳的形态学特性,选取用于BP神经网络生物量预测模型建模的因子有丛高(H)、地径(D)、冠幅(C)、基部分支数(Nt)、单枝最大分支数(Nb)、单枝最大分枝次数(Nbt)、枝条粗度(Db)、芽眼数(Ne)。采用皮尺和游标卡尺对以上林木因子进行测量和记录(表1)。记录工作结束后,将所选取的沙柳齐地面刈割,使用电子天平现场称取鲜质量。将现场刈割的沙柳枝条带回实验室使用烘箱70℃烘干24 h至恒质量,使用天平称取干质量,计算沙柳地上部分生物量。
表 1 建模数据统计
Table 1. Summary statistics for model modeling and validation
丛高(H)
Height/m地径(D)
Ground
diameter/m冠幅(C)
Crown
width/m基部分枝数
(Nt)
Number of
basal branches枝条粗度
(Db)
Branch
diameter/cm芽眼数(Ne)
Number of
eyes单枝最大分
支数(Nb)
Maximum number
of branches单枝最大分
枝次数(Nbt)
Maximum
branch level生物量(B)
Biomass/kg平均值 2.97 0.54 2.92 45.62 1.33 67.07 16.91 4.16 4.65 最大值 4.45 1.89 4.93 173.00 2.90 115.00 51.00 6.00 33.92 最小值 0.96 0.04 1.43 3.00 0.61 21.00 4.00 2.00 0.05 标准差 0.53 0.37 0.89 36.34 0.42 20.67 6.92 0.91 5.69 -
BP神经网络由包括输入层、隐层和输出层共3部分组成(图1),BP神经网络中神经元结构如图2所示,
$ x_1 \sim x_n $ (1, 2, 3, ···, n)为输入信号,$ \omega _1 \sim \omega_ n $ (1, 2, 3, ···, n)为权重,b为偏置,∑为求和节点,$ \sigma $ 为激活函数。按照Kolmog-orov定理,单隐层的BP神经网络将能够无限接近任意连续的非线性曲线[21]。但过分拟合会导致模型的泛化能力差,所以在实际的应用中还要结合样本本身的特性来控制拟合程度。 -
构建沙柳BP神经网络生物量预测模型使用Matlab软件中的nntool工具箱,以沙柳林木因子作为输入层,沙柳生物量实测值为训练目标。
$ N_{\text{h}} = \sqrt {N_{\text{in}} + N_{\text{out}}} + h $ 为确定BP神经网络的隐层节点数的经验公式,其中:Nh为隐层节点数,Nin为输入层节点数,Nout为输出层节点数,对比其估测精确度及泛化能力以确定最佳隐层节点数。建模时,设置目标精度为0.001,最大迭代次数为1 000,学习率为0.01,隐层传递函数为logsig,输出层传递函数为purelin,使用后的模型训练算法为L-M算法。 -
对于参与建模的数据采取归一化处理,可以让神经网络的训练效率有所提升,并且在拟合后还必须对输出数据采取反归一处理,使输出数据重新转换回沙柳的生物量的输出值。据此,本研究通过下列公式对输入因子数据和输入目标数据进行归一化处理:
$ Y = Y_{\min} + \frac{{Y_{\max} - Y_{\min} }}{{X_{\max} - X_{\min} }}(X - X_{\min} ) $
式中:X为未进行处理的值;Xmax、Xmin为代表未进行处理数据组中的最大和最小值;Y为进行处理后的值;Ymax和Ymin分别为进行处理后的数据组中的最大和最小值。
当BP神经网络拟合结束后,对所得数据进行反归一处理,也就是将程序运行得到的数据映射到实际预测值。
-
采用决定系数R²,均方根误差(RMSE)和平均绝对误差(MAE)对模型性能进行评价。
-
前期可供作为输入因子的备选指标有丛高(H)、地径(D)、冠幅(C)、基部分支数(Nt)、单枝最大分支数(Nb)、单枝最大分枝次数(Nbt)、枝条粗度(Db)、芽眼数(Ne),对各因子与生物量(B)之间进行相关性分析,结果如图3所示。
其中各因子与生物量相关性表现为:冠幅(0.751)>基部分支数(0.677)>地径(0.631)>枝条粗度(0.589)>芽眼数(0.555)>丛高(0.550)>单枝最大分枝次数(0.179)>单枝最大分枝数(0.132),其中丛高、地径、冠幅、基部分支数、芽眼数、枝条粗度与生物量间表现为极显著相关(P<0.01);单枝最大分枝次数与生物量间表现为显著相关(P<0.05);单枝最大分枝数与生物量之间显著相关。由此选取丛高、地径、冠幅、基部分支数、芽眼数、枝条粗度为模型最终输入因子。对于传统生物量模型而言,将丛高、地径、冠幅、基部分支数、芽眼数、枝条粗度分别作为自变量拟合生物量模型。对于BP神经网络模型而言,根据其相关性高低逐个加入模型输入层,确定输入层为输入因子数为1~6。
-
根据相关性大小,共设置6组输入变量Nin分别为1~6。输出变量Nout为生物量。由于输出值都为1,输入变量为1~6,则根据经验公式
$ N_{\text{h}} = \sqrt {N_{\text{in}} + N_{\text{out}}} + h $ 可得,当输入因子数为1时,BP神经网络隐层数Nh的取值范围为2.41~11.41之间;当输入因子数为2~5时,BP神经网络隐层数Nh的取值范围最小值为2.73~3.45,隐层数Nh的取值范围最大值为11.73~12.45;当输入因子数为6时,BP神经网络隐层数Nh的取值范围为3.65~12.65。由于神经网络训练结果有一定的波动,为增加模型的容错率,则将隐层数Nh选取为整数,当输入因子数为1时,BP神经网络隐层数Nh的取值范围为2~11的整数;当输入因子数为2~5时,BP神经网络隐层数Nh的取值范围为3~12的整数;当输入因子数为6时,BP神经网络隐层数Nh的取值范围为4~13的整数。对不同输入因子数各10隐层的模型分别训练10次,不同输入变量拟合情况见表2。表 2 BP神经网络模型不同输入变量拟合优势度评价
Table 2. Evaluation of fitting dominance of different input variables in BP neural network model
输入因子
Input factor决定系
数均值
Coefficient of
determination
R2均方根
误差均值
Root mean
square error
RMSE平均绝对
误差均值
Mean absolute
error
MAEC 0.70 2.97 1.90 C、Nt 0.75 2.10 1.36 C、Nt、D 0.86 1.99 1.30 C、Nt、D、Db 0.89 1.37 0.90 C、Nt、D、Db、Ne 0.90 1.31 0.82 C、Nt、D、Db、Ne、H 0.91 1.24 0.78 说明:H:丛高(Height);D:地径(Ground diameter);C:冠幅(Crown width);Nt:基部分枝数(Number of basal branches);Db:枝条粗度(Branch diameter);Ne:芽眼数(Number of eyes);Nb:单枝最大分支数(Maximum number of branches);Nbt:单枝最大分枝次数(Maximum branch level);B:生物量(Biomass)。 可以看出,模型的精度随着输入因子个数的增加而增加(图4),当输入因子数量为5时,模型精度相比输入因子数量为4时提升不明显,为了平衡模型的易用性和精度,则选择4输入因子为模型的最优输入变量数。
-
当输入因子数为4时BP神经网络隐层数Nh的取值范围为3~12的整数,不同节点数的模型拟合情况(见表3),其中当隐层数为9时,其R2在各隐层数中表现为最大,RMSE和MAE表现为最小,由此得知,当隐层数为9时,模型拟合效果最好。
表 3 输入因子数为4时BP神经网络模型拟合优势度评价
Table 3. Evaluation of fitting dominance of BP neural network model when the Nin factors is 4
节点数
Nodes训练数据
Training测试数据
TestR2 RMSE MAE R2 RMSE MAE 3 0.802 2.035 1.272 0.920 1.431 0.853 4 0.891 1.534 1.090 0.879 1.506 0.897 5 0.893 1.322 0.870 0.701 2.646 1.776 6 0.894 1.518 0.882 0.784 2.579 1.315 7 0.951 0.859 0.600 0.831 2.068 1.014 8 0.872 1.639 1.101 0.800 2.488 1.192 9 0.968 0.666 0.503 0.961 1.102 0.768 10 0.833 1.933 1.185 0.858 1.848 1.001 11 0.900 1.288 0.858 0.929 1.385 0.812 12 0.938 0.883 0.613 0.937 1.304 0.809 由此,最佳输入变量和最佳隐层数确定后,在同一个隐层节点数的基础上不断训练模型,最终选择合适的结构为最后的模型,其中:最优结构[输入层节点数(Nin)∶隐层节点数(Nh)∶输出层节点数(Nout)]=4∶9∶1。经过训练所得传递函数模型为:
H = purelin (1.506 1h1 + 1.151 6h2 + 0.226 53h3−1.447 2h4−0.234 79h5 + 1.225 4h6−1.263 5h7−0.155 27h8−2.062 6h9−0.853 28);
h1 = logsig (0.844 89C + 1.865 2Nt + 3.207 6D−4.063 2Db + 6.167 7);
h2 = logsig (6.942C + 0.381 08Nt + 4.981 5D−1.046 5Db−5.647 2);
h3 = logsig (1.635C−2.413 6Nt−0.163 18D−4.040 7Db−2.106 9);
h4 = logsig (0.940 89C + 2.839 6Nt−6.912 5D−1.823 8Db−1.757 9);
h5 = logsig (1.224C−2.715 7Nt−2.839 4D−4.562 5Db−2.169);
h6 = logsig (1.193 2C + 3.811 7Nt−7.989 1D−0.911 14Db−0.853 18);
h7 = logsig (1.955 4C−2.838 1Nt + 2.935 2D−1.89Db + 3.127 6);
h8 = logsig (−3.880 3C + 0.570 5Nt−2.167 3D−2.634 9Db−3.617 8);
h9 = logsig (−3.781 5C + 2.025 1Nt + 2.536 2D + 0.408 18Db−4.022 4);
基于BP神经网络的沙柳地上生物量预测模型
Aboveground Biomass Model of Salix psammophila Based on BP Neural Network
-
摘要:
目的 以库布其沙漠沙柳为研究对象,建立基于BP神经网络的沙柳生物量模型,探究不同建模因子下的沙柳生物量估算模型变化,以期探究沙柳生物量估算模型的最优形式。 方法 选取6种沙柳生长因子,并根据与生物量相关性大小加入输入变量,从而组成6组不同输入变量,输入变量包含因子数量逐步增加(1 ~ 6种)。对比BP神经网络沙柳生物量模型不同输入变量所拟合模型的性能,确定最佳输入变量,并在最优输入变量的基础上,确定BP神经网络隐层数量,经过反复训练,建立基于BP神经网络的沙柳生物量估算模型。 结果 基于BP神经网络的沙柳生物量模型最优结构,即输入层节点数(Nin)∶隐层节点数(Nh)∶输出层节点数(Nout)为:4∶9∶1。其中训练数据R2=0.97,RMSE=0.67,MAE=0.50;测试数据R2=0.96,RMSE=1.10,MAE=0.77。 结论 基于BP神经网络的沙柳生物量,随着输入变量中输入因子的数量不断增加,发现其R2、RMSE、MAE所表现出的模型性能逐渐变好,但是输入变量每增加1种后,当输入因子数量为5时,模型精度相比输入因子数量为4时提升幅度较小,考虑模型使用时的精度和野外工作的便利性,输入层最优输入因子数为4种,当隐层数为9时模型性能表现为最优。 Abstract:Objective To accurately predict the aboveground biomass of Salix psammophila in Kubuqi Desert, the aboveground biomass models including different predictors were developed using BP neural network. Methods Six independent variables were selected and added to the biomass model according to their correlation coefficients. The number of input variables gradually increased from 1 to 6. The best BP biomass model with the optimal input variables was selected based on the model performance. Results The best structure of S. psammophila BP biomass model was that the number of input layer nodes (Nin), hidden layer nodes (Nh) and output layer nodes (Nout) were 4∶9∶1, respectively. R2, RMSE, and MAE output from training data was 0.97, 0.68, 0.50, respectively; and 0.96, 1.16, 0.78, respectively from test data. Conclusion The performance of S. psammophila aboveground biomass model based on BP neural network became better with the increasing number of input variables. However, when the number of input variables was 5, the improvement of model performance was slightly better than the model with 4 input variables. Considering the model accuracy and model application, the optimal number of input variables in the input layer is 4, and the model performance is the best when the number of hidden layers is 9. -
Key words:
- Salix psammophila
- / biomass model
- / BP neural network
- / Kubuqi desert
-
表 1 建模数据统计
Table 1. Summary statistics for model modeling and validation
丛高(H)
Height/m地径(D)
Ground
diameter/m冠幅(C)
Crown
width/m基部分枝数
(Nt)
Number of
basal branches枝条粗度
(Db)
Branch
diameter/cm芽眼数(Ne)
Number of
eyes单枝最大分
支数(Nb)
Maximum number
of branches单枝最大分
枝次数(Nbt)
Maximum
branch level生物量(B)
Biomass/kg平均值 2.97 0.54 2.92 45.62 1.33 67.07 16.91 4.16 4.65 最大值 4.45 1.89 4.93 173.00 2.90 115.00 51.00 6.00 33.92 最小值 0.96 0.04 1.43 3.00 0.61 21.00 4.00 2.00 0.05 标准差 0.53 0.37 0.89 36.34 0.42 20.67 6.92 0.91 5.69 表 2 BP神经网络模型不同输入变量拟合优势度评价
Table 2. Evaluation of fitting dominance of different input variables in BP neural network model
输入因子
Input factor决定系
数均值
Coefficient of
determination
R2均方根
误差均值
Root mean
square error
RMSE平均绝对
误差均值
Mean absolute
error
MAEC 0.70 2.97 1.90 C、Nt 0.75 2.10 1.36 C、Nt、D 0.86 1.99 1.30 C、Nt、D、Db 0.89 1.37 0.90 C、Nt、D、Db、Ne 0.90 1.31 0.82 C、Nt、D、Db、Ne、H 0.91 1.24 0.78 说明:H:丛高(Height);D:地径(Ground diameter);C:冠幅(Crown width);Nt:基部分枝数(Number of basal branches);Db:枝条粗度(Branch diameter);Ne:芽眼数(Number of eyes);Nb:单枝最大分支数(Maximum number of branches);Nbt:单枝最大分枝次数(Maximum branch level);B:生物量(Biomass)。 表 3 输入因子数为4时BP神经网络模型拟合优势度评价
Table 3. Evaluation of fitting dominance of BP neural network model when the Nin factors is 4
节点数
Nodes训练数据
Training测试数据
TestR2 RMSE MAE R2 RMSE MAE 3 0.802 2.035 1.272 0.920 1.431 0.853 4 0.891 1.534 1.090 0.879 1.506 0.897 5 0.893 1.322 0.870 0.701 2.646 1.776 6 0.894 1.518 0.882 0.784 2.579 1.315 7 0.951 0.859 0.600 0.831 2.068 1.014 8 0.872 1.639 1.101 0.800 2.488 1.192 9 0.968 0.666 0.503 0.961 1.102 0.768 10 0.833 1.933 1.185 0.858 1.848 1.001 11 0.900 1.288 0.858 0.929 1.385 0.812 12 0.938 0.883 0.613 0.937 1.304 0.809 -
[1] 米志英, 高 永, 白存德, 等. 库布齐沙漠沙柳无性快速培育技术对比研究[J]. 中国沙漠, 2008(2):318-321. [2] 陈国鹏, 赵文智. 毛乌素沙地南缘沙柳(Salix psammophila)丛生枝年龄结构与动态特征[J]. 中国沙漠, 2015, 35(6):1520-1526. doi: 10.7522/j.issn.1000-694X.2015.00001 [3] Li X, Huang Y, Gong J, et al. A study of the development of bio-energy resources and the status of eco-society in China[J]. Energy, 2010, 35(11): 4451-4456. doi: 10.1016/j.energy.2009.04.018 [4] 米志英. 库布齐沙漠沙柳培育关键技术研究[D]. 呼和浩特: 内蒙古农业大学, 2008. [5] 刘志刚. 典型沙生灌木平茬技术与机具研究[D]. 北京: 中国农业大学, 2013. [6] 张 岑. 人工平茬沙柳固碳能力的研究[D]. 呼和浩特: 内蒙古农业大学, 2018. [7] 杨昊天, 李新荣, 王增如, 等. 腾格里沙漠东南缘4种灌木的生物量预测模型[J]. 中国沙漠, 2013, 33(6):1699-1704. doi: 10.7522/j.issn.1000-694X.2013.00254 [8] 赵 蓓, 郭泉水, 牛树奎, 等. 大岗山林区几种常见灌木生物量估算与分析[J]. 东北林业大学学报, 2012, 40(9):28-33. doi: 10.3969/j.issn.1000-5382.2012.09.008 [9] 季 蕾, 亢新刚, 张 青, 等. 吉林金沟岭林场不同密度天然云冷杉林林下主要灌木生物量模型[J]. 浙江农林大学学报, 2016, 33(03):394-402. [10] 王文栋, 白志强, 阿里木·买买提, 等. 天山林区6种优势种灌木林生物量比较及估测模型[J]. 生态学报, 2016, 36(9):2695-2704. [11] 童新风, 杨红玲, 宁志英, 等. 科尔沁沙地优势固沙灌木的生物量预测模型[J]. 中国沙漠, 2018, 38(3):553-559. doi: 10.7522/j.issn.1000-694X.2018.00033 [12] 王立海, 邢艳秋. 基于人工神经网络的天然林生物量遥感估测[J]. 应用生态学报, 2008, 19(2):261-266. [13] 黄家荣, 孟宪宇, 关毓秀. 马尾松人工林直径分布神经网络模型研究[J]. 北京林业大学学报, 2006, 28(1):28-31. [14] 车少辉, 张建国, 段爱国, 等. 杉木人工林胸径生长神经网络建模研究[J]. 西北农林科技大学学报:自然科学版, 2012, 40(3):84-92. [15] 王轶夫, 孙玉军, 郭孝玉. 基于BP神经网络的马尾松立木生物量模型研究[J]. 北京林业大学学报, 2013, 35(2):17-21. [16] 卯光宪, 谭 伟, 柴宗政, 等. 基于BP神经网络的马尾松人工林胸径-树高模型预测[J]. 浙江农林大学学报, 2020, 37(4):752-760. [17] 刘 鑫, 王海燕, 雷相东, 等. 基于BP神经网络的天然云冷杉针阔混交林标准树高-胸径模型[J]. 林业科学研究, 2017, 30(3):368-375. [18] 徐步强, 张秋良, 弥宏卓, 等. 基于BP神经网络的油松人工林生长模型[J]. 东北林业大学学报, 2011, 39(12):33-35. doi: 10.3969/j.issn.1000-5382.2011.12.010 [19] 陈佳琦, 赵鹏祥, 祁 宁, 等. 基于BP神经网络的油松人工林树高模型研究[J]. 西北林学院学报, 2020, 35(1):212-217. doi: 10.3969/j.issn.1001-7461.2020.01.32 [20] 唐宽燕. 库布齐沙漠东缘植被动态与环境的关系[D]. 北京: 中国农业科学院, 2017. [21] Tianyun, Jiazhiqing, Yangxiaohui. Improving shrub biomass estimations in the Qinghai-Tibet Plateau: Age-based Caragana intermedia allometric models[J]. NRC Research Press, 2014, 90(2): 154-160. [22] 曾伟生, 唐守正. 利用度量误差模型方法建立相容性立木生物量方程系统[J]. 林业科学研究, 2010, 23(6):797-803. [23] 梁瑞婷, 王轶夫, 邱思玉, 等. 人工神经网络与相容性生物量模型预测单木地上生物量的比较[J/OL]. 应用生态学报: 1-10. [2021-10-01]. https://doi.org/10.13287/j.1001-9332.202201.001.