基于随机森林算法的冬小麦生物量遥感估算模型对比-岳继博.pdf

上传人:1890****070 文档编号:100153 上传时间:2018-05-12 格式:PDF 页数:8 大小:1.15MB
返回 下载 相关 举报
基于随机森林算法的冬小麦生物量遥感估算模型对比-岳继博.pdf_第1页
第1页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基于随机森林算法的冬小麦生物量遥感估算模型对比-岳继博.pdf》由会员分享,可在线阅读,更多相关《基于随机森林算法的冬小麦生物量遥感估算模型对比-岳继博.pdf(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第 32 卷 第 18 期 农 业 工 程 学 报 Vol.32 No.18 2016年 9月 Transactions of the Chinese Society of Agricultural Engineering Sep. 2016 175 基于随机森林算法的冬小麦生物量遥感估算模型对比岳继博1,2,杨贵军2,3,4,5,冯海宽2,3,4,5( 1.河南理工大学测绘与国土信息工程学院,焦作, 454000; 2.北京农业信息技术研究中心,北京 100097; 3.国家农业信息化工程技术研究中心,北京 100097; 4.农业部农业信息技术重点实验室,北京 100097; 5.北京市农

2、业物联网工程技术研究中心,北京 100097) 摘 要: 为了寻求高效的冬小麦生物量估算方法,该研究获取了 2014 年陕西省杨凌区拔节期、抽穗期和灌浆期的冬小麦生物量和对应的 RADARSAT-2 全极化雷达、 GF1-WFV 多光谱数据,并利用随机森林算法( random forest, RF)将光谱、雷达后向散射、光学植被指数和雷达植被指数结合进行冬小麦生物量回归建模。将相关系数分析( correlation coefficient,r) 、袋外数据( out-of-bag data, OOB)重要性和灰色关联分析 (grey relational analysis, GRA)与随机森林

3、算法( RF)进行整合,构建了 3 种冬小麦生物量估算模型: r-RF、 OOB-RF 和 GRA-RF,并分别利用 3 种估算模型对冬小麦生物量进行了估算。结果表明: r-RF、 OOB-RF 和 GRA-RF3 种模型分别采用 3、 4、 10 组数据时,验证决定系数分别为 0.70、 0.70 和0.65,平均绝对误差分别为 0.162、 0.164 和 0.172 kg/m2,均方根误差分别为 0.218、 0.221 和 0.236 kg/m2, r-RF 和 OOB-RF比 GRA-RF 对冬小麦生物量有更好而的预测能力。研究结果证实了随机森林算法对冬小麦生物量进行遥感估算的潜力。

4、 关键词: 遥感;生物量;模型;冬小麦;随机森林;灰色关联 doi: 10.11975/j.issn.1002-6819.2016.18.024 中图分类号: S25 文献标志码: A 文章编号: 1002-6819(2016)-18-0175-08 岳继博,杨贵军,冯海宽. 基于随机森林算法的冬小麦生物量遥感估算模型对比J. 农业工程学报,2016,32(18):175182. doi: 10.11975/j.issn.1002-6819.2016.18.024 http:/www.tcsae.org Yue Jibo, Yang Guijun, Feng Haikuan. Comparat

5、ive of remote sensing estimation models of winter wheat biomass based on random forest algorithmJ. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(18): 175 182. (in Chinese with English abstract) doi: 10.11975/j.issn.1002-6819.2016.18.024 http:/ww

6、w.tcsae.org 0 引 言农业管理部门需要根据作物的生长情况对农业生产进行管理和决策,精确的作物参数对于“精准农业”有着极为重要的意义。地面生物量是冬小麦生长发育过程中的一个重要的生理参数,它常常用来作为作物长势和产量估测的一个重要指标1。 近些年来随着遥感技术在农业中的广泛应用,使用遥感技术来进行冬小麦种植面积、生物量、叶面积指数、叶绿素、氮素等作物参数2-10的估算成为农业遥感中的重点和热点。遥感技术中对地观测的传感器平台主要有地面、机载和星载 3 种11,但大面积的冬小麦长势监测,星载传感器数据是最为方便与实用的数据源12-13。目前在轨的星载高分辨率成像光谱仪较少,星载高分辨率

7、多光谱和合成孔径雷达( synthetic aperture radar, SAR)则相对较多,因此,大范围作物生理参数的估算较多使用星载多光谱和合成孔径雷达数据。 随机森林 ( random forest, RF) 是一种统计学习方法,收稿日期: 2016-03-10 修订日期: 2016-08-23 基金项目:国家自然科学基金( 41601346) ;北京市自然科学基金项目( 4141001) ;国家科技支撑项目( 2012BAH29B04) 。 作者简介:岳继博,主要从事农业定量遥感研究与应用。焦作 河南理工大学测绘与国土信息工程学院, 454000。 Email: 通信作者:杨贵军,

8、北京农业信息技术研究中心研究员,主要从事农业定量遥感研究。北京 北京农业信息技术研究中心, 100097。 Email: 它由 Breiman14于 2001 年提出,利用 bootsrap 重抽样方法从原始样本中抽取多个样本,组合很多个相对独立的决策树,建立决策树“森林”,进行“投票”决定最终预测结果。 RF 预测有较高的准确率,对异常值和噪声具有较好的容忍度,对高光谱遥感等高维度数据训练和学习效果较佳。最近,已有国内研究人员将其应用于农业遥感研究,李粉玲等7利用高分一号数据对冬小麦叶片SPAD 值进行了遥感估算,韩兆迎等15用 RF 建立了估测苹果树冠的 LAI 模型, 上述研究表明 R

9、F 在农业定量遥感中的前景。但是,农业遥感研究人员利用 RF 估算作物参数时, 采取的方式大都是将各种植被指数直接输入 RF 模型,没有对 RF 模型的最优数据输入进行过研究。考虑到不同星载传感器的特点, 研究基于 RF 模型的输入数据选择,有助于提高 RF 模型反演作物参数的精度。 本文利用 RADARSAT-2 全极化雷达数据和GF1-WFV 多光谱数据,结合了相关系数( correlation coefficient, r)、袋外数据集16( out-of-bag data, OOB)重要性和灰色关联分析17(grey relational analysis, GRA),分析了 3 种数

10、据分析法选择数据对模型精度的影响,并进行对比试验,构建了利用随机森林算法估算冬小麦生物量的模型,为 RF 模型选择输入数据方法提供了参考。 1 材料与方法 1.1 研究区概况 研究区位于中国陕西省杨凌农业高新技术产业示范农业工程学报( http:/www.tcsae.org) 2016 年 176 区 (图 1, 简称杨陵区, 34.0402 34.1230N, 107.0861108.1563E),地处关中平原,属于典型的干旱半干旱气候。杨凌区北部为山地,中部和南部均为平原,总面积约 94 km2,是中国重要的冬小麦产区,当地冬小麦种植品种有 3 种,分别是陕北 139、小偃 22 和西农

11、9871。 图 1 研究区内采样小区分布情况 Fig.1 Distribution of sample plots in study area 1.2 数据获取 1.2.1 冬小麦生物量测量 在 2014 年,联合试验在杨凌区展开,地面试验由数个测量小组在 RADARSAT-2 过境时同步进行, 地面进行了冬小麦生物量测量,同时获取测量点的 GPS 坐标(天宝手持式 GPS,水平精度优于 1 m; Trimble geoexplorer 2008 Series GeoXH, trimble navigation limited, USA)。在拔节期( 2014 年 3 月 29 日)、抽穗期(

12、 2014 年 4 月22 日)和灌浆期( 2014 年 5 月 16 日)的 3 次测量中,共收集 102 组生物量数据(表 1)。采集冬小麦生物量样本时,在每个采样小区内随机选取能够代表作物整体长势的冬小麦植株样本,然后封装带回实验室,置于烘箱105 杀青 30 min, 最后设置恒温 70 烘干至恒质量 (约24 h),记录干质量,最后除以取样面积即为生物量。 表 1 研究区采样点生物量描述统计 Table 1 Descriptive statistics of sampling points in study area 生育期 Period 采样 小区个数 Sample area 最小

13、值 Min/ (kgm-2) 最大值 Max/ (kgm-2) 平均值 Mean/ (kgm-2) 标准差 Standard deviation/(kgm-2)拔节期 51 0.211 0.795 0.508 0.128 抽穗期 32 0.479 1.248 0.856 0.194 灌浆期 29 0.916 2.516 0.916 0.377 1.2.2 遥感数据获取 RADARSAT-2 传感器于 2007 年发射,重访周期24 d,可以在 20 49范围内进行扫描,全极化精细模式地面扫描范围约 25 km。遥感数据共获取了 C 波段( 5.405 GHz) RADARSAT-2( sing

14、le look image, SLC)单视复数影像 3 景(表 2),数据处理使用 PLSARpro4.2( european space agency, https:/earth.esa.int/web/polsarpro)软件。具体步骤如下: 1)辐射校正:根据 RADARSAT-2数据文件中的查找表, 将雷达影像 DN 值转换为雷达后向散射数据,并根据雷达入射角度进行辐射校正,使用 55的 Box car 滤波器进行滤波,以减少雷达数据的噪声; 2)几何校正: 使用 30 m 的 DEM( GDEM, http:/gdem.ersdac. jspacesystems.or.jp/) 数据

15、对 RADARSAT-2 数据进行正射校正,将 RADARSAT-2 与经过精校正的 SPOT6 影像进行配准,投影方式为通用横轴墨卡托投影( UTM, 49);3)平均后向散射提取:根据试验区域小区边界,提取RADARSAT-2 影像在小区内各极化平均后向散射。 “高分一号”于 2013 年发射,装配有 4 台 16 m 分辨率多光谱宽幅相机, WFV1、 WFV2、 WFV3 和 WFV4,4 台 16 m 多光谱宽幅相机,呈“一字形”排列,重访周期为 4 d,成像的幅宽大于 830 km。遥感数据共获取了同期的 GF1-WFV (中国资源卫星应用中心,http:/218.247.138.

16、121/DSSPlatform/index.html)多光谱影像 3 景(表 2)。数据处理使用 ENVI 5.0,具体步骤包括:1)辐射校正:在 ENVI5.0 中使用 Flaash 大气校正模块对 GF1-WFV 进行大气校正18; 2)几何校正:使用几何校正模块将其与经过精校正的 SPOT6 影像进行配准; 3)平均光谱提取:根据小区边界提取采样小区的平均光谱。 表 2 遥感影像和同步情况 Table 2 Detailed information of acquired remote sensing image 传感器 Sensors 日期 Data 采样时间差 Sampling tim

17、e difference RADARSAT-2 2014-03-29 同步 RADARSAT-2 2014-04-22 同步 RADARSAT-2 2014-05-16 同步 GF1-WFV 2014-03-26 早 3 d GF1-WFV 2014-04-28 早 6 d GF1-WFV 2014-05-19 晚 3 d 表 3 预处理数据和方法 Table 3 Pretreated data and type 组 Group 数据类型Data type 方法 Method 参考 ReferenceHH 0hh 19 HV 0hv 19 雷达各极化后向散射Backscatter of rad

18、ar VV 0vv 19RVI(Radar)000 082hvvv hh hv +20 HH/HV 00/hh hv 21 HH/VV 00/hh vv 21雷达植被指数 Radar vegetation index HV/VV 00/hv vv 21 B RR蓝 G RG绿 R RB红 光谱通道反射率 Spectral reflectanceNIR RNIR近红外NDVI ()/()NIR R NIR RRRR+ 22 RVI(Optical) /NIR RRR 23 SAVI (1 )( ) /( )NIR R NIR RL RRR L+ +; L=0.5 24 OSAVI ()/( 0.

19、16)NIR R NIR RRRR+ 25 EVI 2.5( ) /(1 6 7.5 )NIR R NIR R BRR R R+ 26 光谱植被指数 Optical vegetation indices MTVI2 21.51.2( ) 2.5( )(2 1) (6 5 0.5)NIRG RGNIR NIR RRR RRRR + 27 注:0hh 、0hv 和0vv 分别表示 RADARSAT-2 HH、 HV 和 VV 极化后向散射,RR、 RG、 RB和 RNIR分别为 GF1-WFV 红绿蓝通道反射率, SAVI 中 L 表示植被密度变化的参数,当植被覆盖度很高时为 0,很低时为 1。

20、Note: 0hh , 0hv and 0vv are represent by HH, HV and VV backscatter of RADARSAT-2, RR, RG, RBand RNIRare represent by Red, Green, Blue and NIR band reflectance of GF1-WFV. In SAVI, L is a parameter that indicates the degree of vegetation coverage, when the vegetation coverage is very high, L is 0, Wh

21、en the vegetation coverage is very low, L is 1. 第 18 期 岳继博等:基于随机森林算法的冬小麦生物量遥感估算模型对比 177 本研究在使用星载雷达和光谱数据来进行生物量估算时,根据 RADARSAT-2 数据和 GF1-WFV 数据提取了冬小麦的反射率和雷达后向散射,然后计算获得了多种植被指数,共获取 17 组(表 3)数据。 1.3 方 法 本文算法流程图如图 2 所示。 图 2 遥感数据处理和 RF 建模流程图 Fig.2 Flow chart of remote sensing data processing and random for

22、est modeling 1.3.1 袋外数据集重要性分析 RF 是决策树的组合,用 Bagging 方法产生不同的训练集,对每一个产生的训练集,利用随机特征选取法生成决策树, 用 Bagging 方法产生的训练集中每个样本未被抽取的概率28(1 1 / )nPn= 。 ( 1) n 为样本个数,当 n 趋近无穷大时, P1/e36.79%,即原始数据样本中,有 36.79%的数据未被抽中,这些属于袋外数据。 Breiman16的研究表明,基于 OOB 的估计可以代替使用测试集。 Tibshirani29根据其研究也认为OOB 可以进行泛化误差估计。基于 OOB,可以对输入数据的重要性进行验证

23、,其原理是随机改变某参数输入,然后计算所造成的估算误差,根据误差来计算此参数的重要性,重要性值越大表示越重要。 1.3.2 相关性分析 相关性分析是指对 2 个或多个具备相关性的变量元素进行分析,相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析,它可以衡量遥感数据与冬小麦生物量的相关密切程度。 1.3.3 灰色关联分析 灰色关联分析是灰色系统分析方法的一种,是根据因素之间发展趋势的相似或相异程度,即“灰色关联度”。作为衡量因素间关联程度的一种方法,它定量描述了数据之间的变化态势。 1.3.4 回归试验设计 利用 RF 算法, 对表 3 中 17 组数据进行生物量回归,筛选并对比不

24、同组数据,减少可行性较差的数据对模型的影响。利用相关性、 OOB 重要性和 GRA 分析结果,按从大到小分别排序 17 组数据。分别根据上述 3 种分析结果建模,第一次建模仅使用第一组数据,第二次建模使用前两组数据,第 m 次建模使用前 m 组数据,第 17次建模使用全部 17 组数据。完成三种分析方法建模时,共进行 51 次回归建模。 回归试验使用了 MATLAB 软件代码( Windows- precompiled-RF_mexstandalone-v0.02, mex/standalone interface to Andy Liaw et al.s C code, added by a

25、bhishek jaiantilal,Version: 0.02),构建了 1 000 棵决策树,分割节点为 5 个。 1.4 模型精度评价 1.4.1 留一法交叉验证 留一法交叉验证( leave one out cross validation,LOOCV)被用来对样本结果精度进行验证,每次选出 1个样本进行验证,其他样本全部作为训练样本,然后建模并验证选出样本的误差,直至所有样本均参与了验证。留一法交叉验证是 K-折交叉验证 ( K-fold cross validation)的极端情况,避免了试验设计中建模样本和验证样本间的选择问题,所有值都参与建模和验证,此方法可以有效对模型可靠性和

26、稳定性做出评价。 1.4.2 决定系数 决定系数( coefficient of determination, R2)被用来作为评价遥感估算生物量和实测生物量相关性的标准,其计算公式为 222 12211()()() ()niiinniixxyyRx xyy=。 ( 2) 其中, xi和 yi为样本值, n 为样本个数, x 和 y 为样本平均值。结果中,若 R2越大,表示参与评价的变量间相关性越好,参考价值越大; R2越小,表示两者相关性较差,参考价值越低。 1.4.3 均方根误差和平均绝对误差 均方根误差( root mean square error, RMSE)和平均绝对误差( mea

27、n absolute error, MAE)被用来作为评价估算生物量和实测生物量误差的标准。其计算公式为 21()RMSEnmsix xn=, ( 3) 1MAEnmsix xn=。 ( 4) 农业工程学报( http:/www.tcsae.org) 2016 年 178 其中, xm表示测量值, xs表示模拟值, n 为样本个数。本文中,对于生物量,单位为 kg/m2。 RMSE 对较大误差非常敏感, RMSE 越小, 表示估算结果精确度越高。 RMSE加大了对单个的数据的惩罚(平方项的惩罚),因而评测更加苛刻, MAE 将各次测量的绝对误差取绝对值后再求平均值,平均绝对误差由于离差被绝对值

28、化,平均绝对误差能更好地反映预测值误差的实际情况,同时使用RMSE 和 MAE 有助于更好的分析误差情况, 避免个别误差值造成 RMSE 过大。 2 结果与分析 2.1 遥感数据与冬小麦生物量相关性分析 利用冬小麦的拔节期、抽穗期和灌浆期的遥感数据与生物量进行相关性分析, 样本数 n=102 个, 结果见表 4。冬小麦光谱反射率、雷达后向散射强度和植被指数和生物量之间相关性分析结果中, OSAVI、 RVI(Optical)、NDVI、 HH/VV、 HH 和 VV 与冬小麦生物量不存在显著相关关系,而 NIR, G, B, R, RVI(Radar), HV, HH/HV,VV/HV, EV

29、I, SAVI, MTVI2 与冬小麦生物量均存在极显著关系( P0.01)。按照 |r|对光谱、雷达和植被指数与冬小麦生物量之间相关性进行排序,相关性最大的为NIR,相关性为 0.65,最小的是 VV,相关性为 0.01。相关性从大到小依次为: NIR, G, B, R, RVI(Radar), HV,HH/HV, VV/HV, EVI , SAVI, MTVI2、 OSAVI、RVI(Optical)、 NDVI、 HH/VV、 HH 和 VV。根据对相关性分析结果的排序,进行 r-RF 回归。 表 4 遥感数据与冬小麦生物量之间相关性分析 (n=102) Table 4 Analysis

30、 of correlation between input data and winter wheat biomass (n=102) 编号 Number 数据 Data 相关系数 绝对值 |r| Absolute value of correlation coefficient |r| 编号 Number 数据 Data 相关系数 绝对值 |r| Absolute value of correlation coefficient |r|1 NIR 0.65* 10 SAVI 0.28* 2 G 0.55* 11 MTVI2 0.27* 3 B 0.47* 12 OSAVI 0.14NS4 R

31、 0.47* 13 RVI(Optical) 0.13NS5 RVI(Radar) 0.43* 14 NDVI 0.08NS6 HV 0.39* 15 HH/VV 0.06NS7 HH/HV 0.35* 16 HH 0.01NS8 VV/HV 0.33* 17 VV 0.01NS9 EVI 0.30* 注: *、 NS 表示显著性水平为 0.01 和不显著。 Note: Probability levels are indicated by * and NS for 0.01 and not significant. 2.2 遥感数据与冬小麦生物量 OOB 重要性分析 利用 2014 年杨凌区

32、相关数据,样本数 n=102 个,对拔节期、抽穗期和灌浆期的 3 次测量的冬小麦光谱反射率、雷达后向散射强度和植被指数和生物量进行基于 RF的 OOB 重要性分析,重要性越大,表明数据在 RF 回归中起到的作用越大,因此越重要。重要性分析研究结果见表 5。 其中重要性均大于 1 的数据分别是 B、 NIR、 HV、G,重要性小于 0.5 的有 EVI、 HH、 MTVI2、 VV、 SAVI、HH/VV、 RVI(Optical)、 NDVI、 OSAVI。根据对基于 OBB重要性分析结果的排序,进行 OOB-RF 回归。 表 5 RF 模型中估算冬小麦生物量的输入数据重要性 (n=102)

33、Table 5 Importance of input data in RF models for estimating winter wheat biomass (n=102) 编号 Number 数据 Data 重要性 Importance 编号 Number 数据 Data 重要性 Importance1 B 3.08 10 HH 0.42 2 NIR 2.77 11 MTVI2 0.38 3 HV 2.04 12 VV 0.38 4 G 1.86 13 SAVI 0.37 5 R 0.87 14 HH/VV 0.31 6 RVI(Radar) 0.72 15 RVI(Optical)

34、0.27 7 VV/HV 0.64 16 NDVI 0.26 8 HH/HV 0.62 17 OSAVI 0.24 9 EVI 0.47 2.3 遥感数据与冬小麦生物量的 GRA 分析 利用 GRA 分析,获取冬小麦 3 个生育期的遥感数据与生物量的灰色关联度,样本数 n=102 个,分辨系数=0.5。表 6 中表示各个数据和生物量的灰色关联度大小排序结果。研究结果表明,在所有的数据中,灰色关联度超过 0.9 的共有 7 组, 分别为 RVI(Radar)、 NDVI、 EVI、OSAVI、 SAVI、 MTVI2和 NIR, 其灰色关联度分别是 0.96、0.95、 0.94、 0.94、

35、0.93、 0.91 和 0.91。 表 6 遥感数据与冬小麦生物量之间 GRA 分析( n=102) Table 6 Grey correlation degree between rank of input data and winter wheat biomass (n=102) 编号Number数据 Data 灰色关联度(=0.5) Grey relational degree (=0.5) 编号 Number 数据 Data 灰色关联度 (=0.5) Grey relationaldegree (=0.5)1 RVI(Radar) 0.96 10 G 0.89 2 NDVI 0.95

36、 11 R 0.88 3 EVI 0.94 12 VV 0.88 4 OSAVI 0.94 13 HV 0.88 5 SAVI 0.93 14 HH/VV 0.84 6 MTVI2 0.91 15 VV/HV 0.83 7 NIR 0.91 16 HH/HV 0.66 8 HH 0.89 17 RVI(Optical) 0.59 9 B 0.89 注: 为分辨系数。 Note: is a resolution coefficient. 2.4 冬小麦生物量估算 利用 LOOCV 方法, r-RF、 OOB-RF 和 GRA-RF 模型的冬小麦生物量估计结果精度见图 3,其中, r-RF 和OO

37、B-RF模型结果的 R2的变化呈现先增加后减小的趋势,相应的 MAE 和 RMSE 先减小后增加。当 r-RF 建模(图3a),使用了 NIR、 G 和 B 三组数据时,回归结果 R2最高, MAE 和 RMSE 最小,此时,冬小麦生物量估算值与实测值(散点图见图 4a)关系为: y=0.65x+0.30(其中 y代表估算值, x 代表实测值,下同), R2=0.70,MAE=0.162 kg/m2, RMSE=0.218 kg/m2;当 OOB-RF 建模(图 3b),使用了数据 B、 NIR、 HV 和 G 时,回归结果 R2最高, MAE 和 RMSE 最小,此时,冬小麦生物量第 18

38、期 岳继博等:基于随机森林算法的冬小麦生物量遥感估算模型对比 179 估算值与实测值 (散点图见图 4b) 关系为: y=0.62x+0.32,R2=0.70, MAE=0.164kg/m2, RMSE=0.221 kg/m2;对于GRA-RF 建模(图 3c),当使用了关联度前 10 组数据进行建模时,回归结果 R2最高, MAE 和 RMSE 最小,此10 组数据分别为 RVI(Radar)、 NDVI、 EVI、 OSAVI、 SAVI、MTVI2、 NIR、 HH、 B 和 G,冬小麦生物量估算值与实测值(散点图见图 4c)关系为: y=0.60x+0.34, R2=0.65,MAE=

39、0.172 kg/m2, RMSE=0.236 kg/m2。 注:图 3a、 2b 和 2c 中,横轴编号 m 对应的纵坐标值代表了三种模型采用表 4、表 5、表 6 中前 m 组数据建模结果精度。 Note: In Figure 3a, 3b and 3c, the corresponding value of ordinate axis number (m) represents the modeling results accuracy when using the first m sets of data of Table4, Table5 and Table 6. 图 3 RF 估算

40、冬小麦生物量结果对比 Figure.3 Comparison of estimated biomass of winter wheat by RF models 图 4 冬小麦生物量估算值与实测值关系 Fig.4 Relationship between estimated and measured of winter wheat biomass 3 讨 论 目前,基于星载遥感数据的作物参数反演机理并不明确8,30,反演模型多属于经验模型,包括单或多波段、植被指数的线性和非线性模型等,研究结果差异较大,这是因为上述经验模型多根据单波段、植被指数与作物参数敏感性而构建,其模型受作物自身条件和生长

41、环境因素影响较大,而且不同的生育期敏感指数不同6,造成多个生育期遥感方法估算生物量非常困难,因此不同研究人员往往取得不同结果12-13。干旱区植被指数受干旱影响较大,而且研究区大田采样范围较大,不同采样点作物含水量差异较大,作物含水量会造成光谱特征差异31-32,另外, RADARSAT-2 数据为同步获取,而 GF1-WFV 数据与地面测量存在时间差,上述多重原因导致了植被指数与生物量相关性较低,增加了冬小麦生物量的估算难度。 单一的植被指数和波段包含的信息存在不同程度的饱和,单独进行地面生物量估算时误差较大,许多研究认为结合多种数据的估算模型是解决饱和性的一种方法21,33。本文中 r-R

42、F 最优回归结果出现在采用相关性前 3 的数据输入时, OOB-RF 模型最优出现在采用重要性前 4 的数据输入时, r-RF 和 OOB-RF 模型的最优结果相近,而GRA-RF 模型在输入关联度前 10 的数据时,模型才取得了最优效果,而且模型精度比 r-RF 和 OOB-RF 差得多。参考相关性分析、重要性分析和灰色关联分析结果,相关性分析和重要性分析结果顺序差异较小,且建模精度均较高;灰色关联分析与前两者差异较大,且建模结果精度相对较差,此处体现出 r-RF 和 OOB-RF 模型在选择多种数据估算生物量时的优势。从图 3 中 R2、 MAE 和RMSE 的动态变化曲线可以看出,增加较

43、低相关性和重要性的数据,结果表现出平均绝对误差和均方根误差变农业工程学报( http:/www.tcsae.org) 2016 年 180 大,同时决定系数下降,但总体建模精度并没有太大的降低, 说明 RF 具有较强的抗噪性, 这与 Breiman 和 Cutler对 RF 的研究14一致。 RF 算法虽然无法对回归给出明确的数据公式解释,但是通过对输入数据和建模精度的分析可以选择最佳的输入数据,进而提高 RF 建模精度。 4 结 论 基于 RADARSAT-2 全极化雷达、 GF1-WFV 多光谱数据和地面测量冬小麦生物量,本文利用随机森林算法对冬小麦生物量进行了回归试验,结合相关性分析、袋

44、外数据集重要性和灰色关联分析探讨了利用随机森林算法估算冬小麦生物量的最佳方法。本研究主要有以下结论: 1)随机森林算法在遥感估算冬小麦生物量具有重要的潜力。本试验中,使用相关性分析 -随机森林建模,采用了近红外、绿和蓝光谱三组数据时,利用留一法交叉验证获得最优方法的结果:决定系数为 0.70,平均绝对误差为 0.162 kg/m2,均方根误差为 0.218 kg/m2; 2)利用随机森林算法进行地面冬小麦生物量回归时,需要进行有效的输入数据选择。相关性分析 -随机森林建模和袋外数据集重要性分析 -随机森林建模分别使用数据分析后的前 3 和 4 组数据进行回归时,取得了最优结果,但继续增加输入相

45、关性或重要性较低的数据时,结果表现出平均绝对误差和均方根误差变大,同时决定系数下降。 参 考 文 献 1 王纪华,赵春江,黄文江 . 农业定量遥感基础与应用 M. 北京:科学出版社, 2008. 2 吴素霞,冯蜀青,毛任钊,等 . 冬小麦叶片叶绿素相对含量遥感估算模型研究 J. 干旱地区农业研究, 2006,24(05): 137 140. Wu Suxia, Feng Shuqing, Mao Renzhao, et al. The estimating model of chlorophyll relative content in leaves of winter wheat by re

46、mote sensingJ. Agricultural Research in the Arid Areas, 2006, 24(05): 137 140. (in Chinese with English abstract) 3 隋学艳,朱振林,李少昆,等 . 基于种植制度利用 MODIS数据提取冬小麦种植面积 J. 农业工程学报, 2010, 26(增刊 1): 225 229. Sui Xueyan, Zhu Zhenlin, Li Shaokun, et al. Extracting winter wheat planting area based on cropping system

47、 with MODIS dataJ. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(Supp.1): 225 229. (in Chinese with English abstract) 4 谭昌伟,王纪华,赵春江,等 . 利用 Landsat TM 遥感数据监测冬小麦开花期主要长势参数 J. 农业工程学报,2011, 27(5): 224 230. Tan Changwei, Wang Jihua, Zhao Chunjiang, et al. Monitoring wheat main growth parameters at anthesis stage by Landsat TMJ. Transactions of the Chinese Society of Agricul

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 论证报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com