1.农业农村部农业遥感机理与定量遥感重点实验室,北京农业信息技术研究中心,北京 100097; 2.国家农业信息化工程技术研究中心,北京 100097; 3.北京农业智能装备技术研究中心,北京 100097; 4.江苏诺丽慧农农业科技有限公司,南京 210001; 5.北京市农业物联网工程技术研究中心,北京 100097
摘要: 植被分类是高光谱影像分类中的特定应用问题,光谱特征和空间特征是植被分类中常用的两类特征,比较这两类特征的性能,对实际植被分类应用中选择合适的特征类型或两者的有效结合具有指导意义。用主成分分析(PCA)提取光谱特征时,常选择前几个主成分(PCs)作为光谱特征,虽然它们包含较大的信息量但并不能保证较高的类别可分性和分类正确率,针对这一问题本研究提出了一种混合特征提取方法,对高光谱影像在PCA的基础上用改进的基于分散矩阵的特征选择方法选出具有较高类别可分性的PCs用于后续分类。利用一景AVIRIS高光谱植被影像,从分类精度的角度,首先比较了所提出的混合特征提取方法和原始PCA、独立主成分分析(ICA)及线性判别分析(LDA)3种常用子空间特征提取方法在高光谱影像植被分类中的性能。试验结果表明所提出的混合特征提取方法在研究中数据集1和2上均获得了最高的总体分类正确率,分别为82.7%和86.5%。与原始PCA相比,本研究提出的混合特征提取方法的总体分类正确率,在数据集1和2上分别提高了1.5%和2.5%。由此阐明了所提出的混合特征提取方法在高光谱植被分类中的有效性。对光谱特征和空间特征在高光谱影像植被分类性能的比较中,总体上空间特征获得的分类正确率比光谱特征高,特别是Gabor特征,在两个数据集上均获得了最高的总体分类正确率分别为95.5%和96.7%。由此表明空间特征较光谱特征在高光谱影像植被分类中更具优势。本研究结果为后续改进空-谱特征方法及其两者有效结合,进一步提高植被分类正确率提供了参考。
关键词: 高光谱影像;植被分类;光谱特征;空间特征;混合特征提取方法;分散矩阵;主成分分析
中图分类号: S127 文献标志码: A 文章编号: 201911-SA005
引文格式:付元元, 杨贵军, 段丹丹, 张永涛, 顾晓鹤, 杨小冬, 徐新刚, 李振海. AVIRIS高光谱数据空-谱特征在植被分类中的对比分析[J]. 智慧农业(中英文), 2020, 2(1): 68-76.
Citation:Fu Yuanyuan, Yang Guijun, Duan Dandan, Zhang Yongtao, Gu Xiaohe, Yang Xiaodong, Xu Xingang, Li Zhenhai. Comparison analysis of spatial and spectral feature in vegetation classification based on AVIRIS hyperspectral image[J]. Smart Agriculture, 2020, 2(1): 68-76.
1 引言
随着光学传感器和遥感数据获取平台的发展,高光谱遥感影像在农业中的应用呈现递增趋势。高光谱影像与传统多光谱影像相比,具有更高的光谱分辨率,能更精细地捕捉地物光谱间的差异,在植被分类、作物种植区提取、作物表型和作物育种等研究应用中具有显著的优势[1-3]。植被分类是开展作物长势监测、作物估产和病虫害监测等研究的基础,基于高光谱遥感影像进行植被分类或作物种植区提取属于高光谱影像分类的一个特定应用。
高光谱影像分类中常用的两类主要特征是光谱特征和空间特征[4]。获取光谱特征的方法主要有特征选择和特征提取两种。特征选择是根据一定准则从原始特征集合中选取一个特征子集,该特征子集保持了原有特征空间的物理意义,具有较好的可解释性,但所选特征之间常存在一定的冗余性[5]。特征选择最常用的方法是过滤式(Filter)特征选择,这类方法构造的特征选择准则完全与分类器脱离,而仅作为分类前的一个预处理操作选择出一个特征子集用于后续分类[6]。付元元[7]对比分析了几种代表性的基于互信息的过滤式特征选择方法在植被分类中的性能,结果表明双输入对称关联法(Double Input Symmetrical Relevance,DISR)在分类精度和算法稳定性上均优于其它方法。夏道平等[8]构建了一种新的基于分散矩阵的过滤式特征选择方法,并将其应用于高光谱影像植被分类中。与典型的基于互信息的过滤式特征选择方法相比,该方法取得了较高的植被分类精度。特征提取是通过特定的空间变换将影像从原始特征空间变换到新的特征空间,使变换后的特征在某种统计意义上最优,这种方法产生了新的特征而没有保留原始波段的物理意义
[5],主成分分析(Principal Component Analysis, PCA)就属于这类方法。在利用PCA进行高光谱遥感影像分类时,由于前几个主成分(Principal Components, PCs)包含原始影像大部分信息,因此常将前几个PCs作为特征用于高光谱影像分类[9,10]。但PCA作为一种非监督特征提取方法,前几个PCs虽然包含较大的信息量但并不能保证较高的类别可分性,针对这一问题,本研究提出了一种混合特征提取方法,将PCA和改进的基于分散矩阵的特征选择方法[8]进行结合,以期选择出具有较高类别可分性的PCs用于后续的分类中,提高总体分类正确率。
光谱特征主要是从光谱维提取的特征,而空间特征主要是从空间维提取的特征。常用的空间维特征有基于灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)的特征[11]、Gabor特征[12]和形态学特征[13]。王增茂等[14]融合GLCM纹理特征和形态学特征,在高光谱影像分类中获得了较高分类精度。Jia等[15]通过设置一系列Gabor过滤器提取高光谱影像空间特征,并将其与光谱特征融合,在包含16类地物(含有植被和非植被)的Indian Pines高光谱影像上,仅为每类选取3个训练样本,获得了75.45%的总体分类正确率。
本研究在高光谱影像植被分类这一背景下,以一幅公开的AVIRIS高光谱影像为例,尝试比较光谱特征提取方法和空间特征提取方法的性能,分析它们在植被分类中的特点,为后续空-谱特征提取方法的改进及其两者有效结合提供参考。研究结果对实际高光谱植被分类应用将具有指导意义。
2 数据与方法
2.1 数据及数据集设置
所用试验数据为一景大小为145×145像素,空间分辨率为20m的AVIRIS(Airborne Visible/Infrared Imaging Spectrometer)高光谱影像(数据来源:http://www.ehu.eus/ccwintco/index.php/Hyperspectral_Remote_Sensing_Scenes#Indian_Pines)。影像共有235个波段,其中受噪声和水汽影响较大的共有35个波段(波段1-3,波段103-112,波段148-165和波段217-220), 为了排除这些波段对最终结果的影响,后续试验分析中没有用到这些波段。影像获取区域为美国印第安纳州西部农业区,是普渡大学专门为了验证高光谱影像分类相关算法的性能而采集的。为了增加植被区分的难度,在成像区域特意种植了具有较高光谱相似性的植被,如玉米、大豆和小麦等,这对相关处理算法提出了较大的挑战。为了方便计算各个分类算法的分类正确率,较客观公正地比较各类算法的性能,普渡大学还提供了与这幅影像对应的地面真实地物类别标记图,因此这幅影像被广泛用于验证和比较高光谱影像处理相关算法[16-19]。此外这幅影像是标准数据库影像,已经经过相关图像预处理,因此后续分析中未对这幅影像进行额外的预处理。基于以上原因,同时考虑到本研究主要的应用背景是高光谱影像植被分类,因此也用这幅影像数据验证和比较本研究所涉及的算法,所选择的植被类型及相应的样本数目为玉米(1428个)、大豆(2455个)、小麦(205个)、森林(1265个)和草地(386个)。图1为AVIRIS高光谱图像假彩色合成图像及对应类别的地面真实标记图像。
图1 (a)AVIRIS高光谱影像假彩色合成图像(波段50,27和17);(b)对应类别的地面真实标记图像
Fig. 1 (a) AVIRIS hyperspectral image of three-band color composite image (band 50, 27 and 17); (b) Ground truth
为了验证所提出的混合特征提取方法的有效性,比较光谱特征和空间特征在高光谱植被分类中的性能,本研究设置了两个数据集,分别命名为数据集1和数据集2,两个数据集中各个类别的训练样本数分别为100个和150个,这些训练样本是随机选择的,余下的样本为测试样本集。研究中所用到的分类算法为支持向量机(Support Vector Machine,SVM)软件包LIBSVM[20]中的一对一(OAO)多类别SVM分类器,选取的核函数为径向基核函数(Radial Basis Function,RBF),采用五重交叉验证网格搜索的方法确定建模过程中涉及到的2个重要参数即正则化参数C和核函数参数σ。为了定量化衡量算法的性能,选取了总体分类正确率、Kappa系数和生产者精度3个指标,这3个指标的值越接近于1,说明算法的性能越好。
2.2 光谱特征提取方法
本研究中光谱特征选择方法仅考虑Filter特征选择方法,其代表性方法有最大相关最小冗余法(Minimal-Redundancy and Maximal-Relevance,mRMR)
[21],联合互信息法(Joint Mutual Information,JMI)[22],条件互信息最大化法(Conditional Mutual Information Maximization,CMIM)[22],双输入对称关联法 [23]和Jeffreys-Matusita(JM)特征选择方法[24]。Filter特征选择方法在特征选择的过程中与具体采用的分类算法无关,仅依赖于构造的特征选择准则和搜索算法,这一特点方便本研究在同一分类算法下评估所涉及的特征选择/提取算法的性能。光谱特征提取方法考虑的代表性方法有PCA[9],独立主成分分析(Independent Component Analysis,ICA)[25]和线性判别分析(Linear Discriminant Analysis,LDA)[26]。上述所提到算法的具体细节可以参考相应的文献,不在文中详述。
PCA是一种非监督子空间特征提取方法,在高光谱影像分类时常选取前几个主成分作为光谱维特征用于后续的分类。虽然前几个主成分的信息量占有很大的比例,但是由于PCA的非监督本质使得所选的前几个主成分并不能保证较好的类别可分性,因此,不能保证较高的分类正确率。为了改善这一问题,本研究将原始PCA和改进的基于分散矩阵的特征选择方法[8]结合,先对高光谱影像进行主成分分析,然后利用改进的基于分散矩阵的特征选择方法选择出具有较高类别可分性的主成分。改进的基于分散矩阵的特征选择方法[8]从每两个类别出发计算可分性准则,然后取它们的平均值作为可分性度量,在优化这一准则时,将增大所选择特征的分散性,通过这种方式能有效避免传统的基于分散矩阵的特征选择方法易于选择出具有一定区分性但相互冗余的特征集合的缺陷[27]。后面将所提出的混合光谱特征提取方法记为PCA_ScatterMatrix。
2.3 空间特征提取方法
基于灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)的空间特征的基本思想是通过统计影像中各个像元邻域内的灰度共现频率,用来表征影像不同的纹理和结构特性[11]。Haralick等[11]基于GLCM提出了14个纹理统计量,其中常用的4个纹理特征为角二阶矩、熵、对比度和均匀性,它们在已有的高光谱影像分类研究中表现出较好的性能[28],故在后续的研究中也采用这4个统计量代表基于GLCM的纹理特征。
传统二维Gabor特征已在表征自然场景和航空影像的纹理特征中展现出了较好的性能[29-31],Gabor滤波器[12]如公式(1)所示。
(1)
其中,z=(x,y)表示像素;波向量 定义为 ,其中 , ; 是最大频率;f是频率域中核之间的间距因子, 表示高斯窗宽度与波长的比值。实际应用中将影像与Gabor滤波器进行卷积操作,得到的幅度部分包含影像局部变化信息,作为纹理特征。由于Gabor滤波器可以对输入影像进行m个尺度和n个方向的Gabor变换,因此对于影像中的每个像元,可以获得m×n个特征。
形态学特征是通过对影像进行一系列数学形态学运算得到的[13]。传统的开和闭运算容易改变影像中地物的形状,这一问题可以通过对影像进行数学形态学重构得到较好的解决。因此常对影像进行基于重构的开运算和闭运算,由此得到的特征作为形态学特征。由于高光谱影像有较多波段,如果对影像中的每一个波段都进行空间特征提取,不仅计算量较大,而且最终得到的特征维数庞大且冗余性高,不利于后续的分类识别。因此本研究首先对高光谱影像进行主成分分析,保留前几幅能代表地物特性的主成分图像,然后在选取的主成分图像上,进行基于GLCM的特征、Gabor特征和形态学特征的提取。
3 结果与分析
3.1 混合光谱特征提取方法的性能
为了验证所提出的混合特征提取方法(PCA_ScatterMatrix)的有效性,在两个数据集上,将PCA_ScatterMatrix与原始PCA、ICA和LDA三种子空间特征提取方法进行了比较。
图2(a)和图2(b)分别显示了在数据集1和数据集2上,PCA、PCA_ScatterMatrix和ICA随所选特征数量的变化所得的总体分类正确率(在测试样本中,被正确分类的样本数与所有训练样本数的比值)。由于LDA方法最多可以选择类别数-1个特征,因此没有在图2中画出LDA方法随特征数量增加所对应总体分类正确率的变化趋势。从图2(a)和图2(b)可以看出随着训练样本数量的增加和提取特征数量的增加,每种方法总体分类正确率都大致呈增加趋势,其中ICA方法的总体分类正确率最低。随着提取特征数量的增加,所提出的PCA_ScatterMatrix方法的总体分类正确率开始时比PCA略低,随后它的总体分类正确率比原始PCA要高。随着特征数的增加,PCA方法的总体分类正确率先增加,在特征数量为6时达到最大值,随后降低趋于平稳。这表明排序在前的主成分虽然方差贡献率较高,但并不代表它们具有较好的类别可分性。
(a) 数据集1 |
(b) 数据集2 |
图2 在选择不同特征数量情况下,PCA、ICA和PCA_ScatterMatrix的总体分类正确率
Fig. 2 Overall classification accuracy of PCA, ICA and PCA_ScatterMatrix under different numbers of the selected spectral features
表1列出了在数据集2上,PCA和PCA_ScatterMatrix总体分类正确率达到最高时所选择的主成分序号。PCA方法选择了前六个主成分,它们的累积方差贡献百分比已经达到了95.2%。PCA_ScatterMatrix方法除了选择了前六个主成分外还选择了第7、8、10、11、12、13和68 主成分,由此表明后面的几个主成分虽然包含的信息量较少,但在类别可分性中仍起着重要的作用。
表1 PCA和PCA_ScatterMatrix方法在数据集2上获得最高分类正确率时所选取的主成分序号
Table 1 Selected principal components when PCA and PCA_ScatterMatrix got the highest overall accuracy
on data set 2
选取的主成分的序号 | |
PCA | 1,2,3,4,5,6 |
PCA_ScatterMatrix | 1,2,3,4,5,6,7,8,10,11,12,13,68 |
表2给出了在数据集2上PCA、ICA、LDA和提出的PCA_ScatterMatrix方法在取得最高总体分类正确率情况下的生产者精度和Kappa系数。从表2可以看出PCA_ScatterMatrix方法的总体分类正确率与PCA方法相比提高了2.5%,与ICA方法相比提高了3.8%,与LDA方法相比提高了4.1%。结果表明PCA_ScatterMatrix方法能提高原始PCA方法的总体分类正确率,同时也间接地表明改进的基于分散矩阵的特征选择方法能够较好地选择出有效的特征便于后续的分类。
表2 在数据集2上各光谱特征提取方法的总体分类正确率、生产者精度和Kappa系数的比较
Table 2 Performance of the feature extraction methods investigated overall classification accuracy, producer's accuracy and Kappa coefficient on data set 2
特征数目 | 总体分类正确率 | Kappa系数 | 生产者精度 | |||||
玉米 | 大豆 | 小麦 | 森林 | 草地 | ||||
PCA | 6 | 0.840 | 0.764 | 0.807 | 0.824 | 0.982 | 0.932 | 0.712 |
ICA | 15 | 0.827 | 0.746 | 0.822 | 0.822 | 1.000 | 0.843 | 0.792 |
PCA_ScatterMatrix | 13 | 0.865 | 0.799 | 0.820 | 0.878 | 0.982 | 0.909 | 0.746 |
LDA | 4 | 0.824 | 0.743 | 0.815 | 0.784 | 0.982 | 0.905 | 0.856 |
3.2 光谱特征提取方法与空间特征提取方法的性能比较
参与性能比较的光谱特征提取方法除了混合特征提取方法还包括JMI、mRMR、CMIM、DISR和JM方法5种特征选择方法。参与性能比较的空间特征有基于GLCM的纹理特征、Gabor特征和Morph形态学特征3种特征,多次试验结果表明在进行GLCM特征提取时滑动窗口大小设置为[17,17]最优;Gabor特征提取时窗口设置为[31,31] 最优;Morph特征提取时采用星型结构元素,大小分别设置为2、4、6、8和10时最优。Gabor特征提取过程中的窗口设定和Morph特征提取中采用的结构元素的类型参考已有文献[13]、[31]和算法调试过程中分类性能的优劣确定。结构元素大小设置为2、4、6、8和10的原因是与Gabor特征提取中采用的5个尺度相对应。目前没有统一可接受的规则来指导这些参数的确定,在实际应用中常采用试错的方式来确定。
表3和表4分别列出了以上方法在数据集1和数据集2上取得最高总体分类正确率时用到的特征数量、Kappa系数和生产者精度。从表3和表4中可以看出,随着训练样本数量的增加,所有光谱特征和空间特征的总体分类正确率均增加。在光谱特征选择方法中,CMIM和DISR受训练样本数量影响较小,最高总体分类正确率分别为0.9%和1.3%。对比表2和表4,可以看出总体上光谱特征选择方法比光谱特征提取方法的总体分类正确率高,但若考虑到所用的特征数量,光谱特征提取方法在达到最高分类正确率时用到的特征数量要比光谱特征选择方法用到的特征数量少,如PCA方法在数据集2上达到最高分类正确率84.0%时仅选择了6个特征,而DISR方法达到最高分类正确率84.4%时选择了23个特征。因此如果实际应用中偏重于时效性,光谱特征提取方法占有优势。同时也可以较明显地发现,空间特征的总体分类正确率比光谱特征的总体分类正确率高。以JMI方法和Gabor方法为例,在JMI光谱特征选择方法下玉米的分类正确率为82.3%,而在Gabor空间特征提取方法下玉米的分类正确率提高到98.4%,这主要是因为各类别植被的光谱维特征具有较高的相似性,而它们在空间维的特征具有较好的可区分性。在GLCM、Morph和Gabor三种空间特征提取方法中,Gabor特征的总体分类正确率最高,说明Gabor特征在植被分类中能较好的刻画其在影像中的空间特征。
表3 在数据集1上光谱特征和空间特征在高光谱影像植被分类中的性能
Table 3 Performance of the spectral and spatial features of hyperspectral image vegetation classification on data set 1
波段数目 | 总体正确率 | Kappa系数 | 生产者精度 | |||||
玉米 | 大豆 | 玉米 | 森林 | 草地 | ||||
JMI | 33 | 0.778 | 0.847 | 0.846 | 0.830 | 0.990 | 0.904 | 0.703 |
mRMR | 40 | 0.725 | 0.603 | 0.632 | 0.742 | 0.905 | 0.813 | 0.591 |
CMIM | 32 | 0.837 | 0.764 | 0.791 | 0.836 | 0.990 | 0.900 | 0.752 |
DISR | 40 | 0.858 | 0.795 | 0.860 | 0.849 | 0.981 | 0.882 | 0.780 |
JM | 19 | 0.803 | 0.718 | 0.808 | 0.758 | 0.971 | 0.882 | 0.773 |
GLCM | 8 | 0.857 | 0.798 | 0.864 | 0.803 | 1.000 | 0.915 | 0.990 |
Gabor | 80 | 0.955 | 0.935 | 0.980 | 0.918 | 1.000 | 0.986 | 1.000 |
Morph | 20 | 0.904 | 0.860 | 0.870 | 0.884 | 0.990 | 0.967 | 0.941 |
表4 在数据集2上光谱特征和空间特征在高光谱影像植被分类中的性能
Table 4 Performance of the spectral and spatial features of hyperspectral image vegetation classification on data set 2
波段数目 | 总体正确率 | Kappa系数 | 生产者精度 | |||||
玉米 | 大豆 | 小麦 | 森林 | 草地 | ||||
JMI | 40 | 0.863 | 0.798 | 0.823 | 0.861 | 0.982 | 0.913 | 0.839 |
mRMR | 40 | 0.757 | 0.644 | 0.708 | 0.732 | 0.945 | 0.883 | 0.623 |
CMIM | 32 | 0.846 | 0.773 | 0.784 | 0.844 | 0.982 | 0.917 | 0.839 |
DISR | 23 | 0.844 | 0.768 | 0.760 | 0.852 | 0.982 | 0.938 | 0.750 |
JM | 24 | 0.856 | 0.788 | 0.843 | 0.843 | 1.000 | 0.899 | 0.818 |
GLCM | 8 | 0.874 | 0.818 | 0.894 | 0.825 | 1.000 | 0.921 | 0.987 |
Gabor | 80 | 0.967 | 0.951 | 0.984 | 0.944 | 1.000 | 0.987 | 1.000 |
Morph | 20 | 0.926 | 0.890 | 0.871 | 0.928 | 1.000 | 0.970 | 0.987 |
4 结论与展望
4.1 结论与讨论
光谱特征和空间特征是高光谱影像分类中两类主要特征,本研究选取了高光谱影像分类领域中常用的光谱特征和空间特征表征方法,比较了它们在植被分类中的性能,为后续将这两者有效结合,进一步提高植被分类正确率提供了参考。
研究中提出了一种混合特征提取方法,该方法将PCA和改进的基于分散矩阵的特征选择方法结合,以期选出具有较高类别可分性的主成分用于后续分类,并得到以下结论:
(1)与原始PCA、ICA和LDA三种光谱特征提取方法相比,PCA_ScatterMatrix方法在两个数据集上均获得了最高的总体分类正确率,对比PCA和PCA_ScatterMatrix获得最高总体分类正确率用到的主成分序号,发现PCA_ScatterMatrix除了选择了前几个主成分外还选择了信息贡献量较小的主成分,由此印证了仅依赖前几个主成分并不能保证较高的分类正确率,从而阐明了PCA_ScatterMatrix方法的有效性。
(2)总体上光谱特征选择方法(如JMI、CMIM和JM)比光谱特征提取方法(如PCA、LDA和ICA)的分类正确率高,这主要是因为这些代表性的Filter特征选择方法在选择特征时是基于构造的类别可分性或者信息量互补性准则进行的,这些准则用到了类别信息,而原始的PCA和ICA特征提取方法未用到类别信息,是典型的非监督特征提取方法。虽然这两种方法达到了降维的目的,但是在分类识别问题中,非监督特征提取方法明显处于劣势,这一点也可以从PCA、ICA、PCA_ScatterMatrix和LDA的性能比较中看出(表2),在这4种方法中,PCA_ScatterMatrix和LDA是监督特征提取方法,它们在分类中的性能明显优于原始PCA和ICA,由于LDA算法自身的缺陷导致所能选择的成分数较少,因此在分类中的性能受到限制。总体上特征选择方法较特征提取方法在分类中用到的特征数量多(表2、表3和表4),因此若实际应用中偏重时效性,光谱特征提取方法具占有优势。
(3)在比较光谱特征和空间特征在高光谱影像植被分类中的性能时,空间特征表征方法所获得的总体分类正确率明显比光谱特征表征方法的要高,由此说明空间特征在区分光谱相似性较高的植被时占有优势,特别是Gabor空间特征。
4.2 下一步研究展望
随着无人机遥感技术的发展,获取高光谱遥感影像的成本愈来愈低,空间分辨率愈来愈高,因此可以提供地物更多的空间细节特征,但同时也使得同类地物类内的光谱差异增大,不同地物类间的光谱差异减少,较高的光谱类内变化和较低的类间差异,降低了各种目标地物在光谱域的模式可分性。在此情况下,充分挖掘影像的空间特征,将会对后续的地物分类起到积极的作用,特别是在高光谱影像植被分类这一特定应用下,各种植被类型光谱之间本身存在的差异性就较低,充分挖掘其空间信息显得尤为重要。
本研究在进行方法对比时,仅用了一幅影像验证算法的性能,后续需要在更多的以农作物为下垫面的高光谱影像中验证算法有效性。但是有一点通识,即农作物之间光谱相似性较高,仅依赖光谱信息在单幅影像中很难将它们区分开,在这种情况下,分析植被的空间特征是否有助于区分农作物之间光谱相似性,是需要研究的问题。由于大部分植被(如作物)都有生长初期、发展和衰老的生命周期,在不同的生长阶段,它们表现的光谱特征和空间特征都在随之变化,因此后续将会研究植被不同生长阶段光谱特征和空间特征在分类中的性能,同时将尝试采用多时相影像,挖掘植被时相特征,并探索其与光谱特征和空间特征结合在农作物分类中的性能。
参考文献
[1] Yang G, Liu J, Zhao C, et al. Unmanned aerial vehicle remote sensing for field-based crop phenotyping: Current status and perspectives[J]. Front Plant Sci, 2017, 8: 1111.
[2] 陈仲新, 郝鹏宇, 刘佳, 等. 农业遥感卫星发展现状及我国监测需求分析[J]. 智慧农业, 2019,1(1): 32-42.
Chen Z, Hao P, Liu J, et al. Technical demands for agricultural remote sensing satellites in China[J]. Smart Agriculture, 2019, 1(1): 32-42.
[3] Li Z, Li Z, Fairbairn D, et al. Multi-LUTs method for canopy nitrogen density estimation in winter wheat by field and UAV hyperspectral[J]. Computers and Electronics in Agriculture, 2019, 162: 174-182.
[4] Xu Y, Zhang L, Du B, et al. Spectral-spatial unified networks for hyperspectral image classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, (99): 1-17.
[5] Sun W, Du Q. Hyperspectral band selection: A review[J]. IEEE Geoscience and Remote Sensing Magazine, 2019, 7(2): 118-139.
[6] Fu Y, hao C, Wang J, et al. An improved combination of spectral and spatial features for vegetation classification in hyperspectral images[J]. Remote Sensing, 2017, 9(3): no. 261.
[7] 付元元. 基于遥感数据的作物长势参数反演及作物管理分区研究[D]. 杭州: 浙江大学, 2015.
Fu Y. Remote sensing data based crop growth parameters retrieval and crop management zone delineation research [D]. Hangzhou: Zhejiang University, 2015.
[8] 夏道平, 付元元, 王纪华, 等. 分散矩阵特征选择方法改进及在高光谱影像植被分类中的应用[J]. 农业工程学报, 2016, 32(21): 196-201.
Xia D, Fu Y, Wang J, et al. An improved scatter-matrix-based feature selection method for vegetation classification of hyperspectral image[J]. Transactions of the CSAE, 2016, 32(21): 196-201.
[9] Cgerutadat A, Bruce L M. Why hyperspectral component analysis is not an appropriate feature extraction method for hyperspectral data[J]. IEEE International Geoscience and Remote Sensing Symposium, 2003, 6: 3420-3422.
[10] Uddin M P, Mamun M A, Hossain M A. Effective feature extraction through segmentation-based folded-PCA for hyperspectral image classification[J]. International Journal of Remote Sensing, 2019, 40: 1-31.
[11] Haralick R M, Shanmugam K, Dinstein I. Textural features for image classification[J]. Studies in Media and Communication, 1973, SMC-3(6): 610-621.
[12] Jia S, Deng X, Zhu J, et al. Collaborative representation-based multiscale superpixel fusion for hyperspectral image classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(10): 7770-7784.
[13] Benediktsson J A, Palmason J A, Seveinsson J R. Classification of hyperspectral data from urban areas based on extended morphological profiles[J]. IEEE Transactions on Geoscience and Remote Sensing. 2005, 43(3): 480-491.
[14] 王增茂, 杜博, 张良培, 等. 基于纹理特征和形态特征融合的高光谱影像分类法[J]. 光子学报, 2014, 43(8):122-129.
Wang Z, Du B, Zhang L, et al. Based on texture feature and extend morphological profile fusion for hyperspectral image classification[J]. Acta Photonica Sinca, 2014, 43(8): 122-129.
[15] Jia S, Wu K, Zhu J, et al. Spectral-spatial Gabor surface feature fusion approach for hyperspectral imagery classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 57(2): 1142-1154.
[16] Lv F, Han M. Hyperspectral image classification based on multiple reduced kernel extreme learning machine[J]. International Journal of Machine Learning and Cybernetics, 2019, 10: 3397-3405.
[17] Xue Z. A general generative adversarial capsule network for hyperspectral image spectral-spatial classification[J]. Remote Sensing Letters, 2020, 11(1): 19-28.
[18] Huang H, Duan Y, He H, et al. Spatial-spectral local discriminant projection for dimensionality reduction of hyperspectral image[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2019, 156: 77-93.
[19] Li J, Huang X, Gamba P, et al. Multiple feature learning for hyperspectral image classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(3): 1592-606.
[20] Chang C, Lin C. LIBSVM: A library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2011, 2(3): 27.
[21] Peng H, Long F, Ding C. Feature selection based on mutual information criteria of max-dependency, max-relevance, and min-redundancy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(8): 1226-1238.
[22] Brown G, Pocock A, Zhao M J, et al. Conditional likelihood maximisation: A unifying framework for information theoretic feature selection[J]. Journal of Machine Learning Research, 2012, 13: 27-66.
[23] Meyer P E, Schretter C, Bontempi G. Information-theoretic feature selection in microarray data using variable complementarity[J]. IEEE Journal of Selected Topics in Signal Processing, 2008, 2(3): 261-274.
[24] Sun K, Geng X, Ji L. A new sparsity-based band selection method for target detection of hyperspectral image[J]. IEEE Geoscience and Remote Sensing Letters, 2015, 12(2): 329-333.
[25] Wang J, Chang C. Independent component analysis-based dimensionality reduction with applications in hyperspectral image analysis[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(6): 1586-1600.
[26] Du Q. Unsupervised real-time constrained linear discriminant analysis to hyperspectral image classification[J]. Pattern Recognition, 2007, 40: 1510-1519.
[27] Zhou L, Wang L, Shen C. Feature selection with redundancy-constrained class separability[J]. IEEE Transactions on Neural Networks. 2010, 21(5): 853-858.
[28] Huang X, Liu X, Zhang L. A multichannel gray level co-occurrence matrix for multi/hyperspectral image texture representation[J]. Remote Sensing, 2014, 6(9): 8424-8445.
[29] Jiang L, Narayanan R M. Integrated spectral and spatial information mining in remote sensing imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2004, 42(3): 673-685.
[30] Manjunath B S, Ma W Y. Texture features for browsing and retrieval of image data[J]. IEEE Transaction on Pattern Analysis and Machine Intelligence, 1996, 18(8): 837-842.
[31] Zhang L, Zhang L, Tao D, et al. A multifeature tensor for remote-sensing target recognition[J]. IEEE Geoscience and Remote Sensing Letters, 2011, 8(2): 374-378.
Comparison analysis of spatial and spectral feature in vegetation classification based on AVIRIS hyperspectral image
Yuanyuan Fu1,2, Guijun Yang1,2*, Dandan Duan3, Yongtao Zhang4, Xiaohe Gu1,
Xiaodong Yang2,5, Xingang Xu2, Zhenhai Li2
(1.Key Laboratory of Quantitative Remote Sensing in Agriculture of Ministry of Agriculture and Rural Affairs,
Beijing Research Center for Information Technology in Agriculture, Beijing 100097, China;
2.National Engineering Research Center for Information Technology in Agriculture, Beijing 100097, China;
3.Beijing Research Center of Intelligent Equipment for Agriculture, Beijing 10097, China;
4.Jiangsu Nuoli Huinong Agricultural Technology Co., Ltd, Nanjing 210001, China;
5.Beijing Engineering Research Center for Agriculture Internet of Things, Beijing 100097, China)
Abstract: With the development of hyperspectral sensor technology and remote sensing data acquisition platform, the application of hyperspectral data is becoming more and more popular in precision agriculture. Spectral features and spatial features are two main kinds of features used in hyperspectral image classification. The comparison of spectral features and spatial features in vegetation classification of hyperspectral image is a special application in hyperspectral image classification. Therefore, this study compared the performance of several typical spectral features and spatial features in vegetation classification of hyperspectral image. The considered spatial features include grey level co-occurrence matrix (GLCM) based features, Gabor features and morphological features. The considered spectral feature selection or extraction methods include minimal-redundancy-maximal-relevance (mRMR), joint mutual information (JMI), conditional mutual information maximization (CMIM), double input symmetrical relevance (DISR), Jeffreys-Matusita (JM), principal component analysis (PCA), independent component analysis (ICA) and linear discriminant analysis (LDA). PCA, an effective subspace feature extraction method, is widely used in the feature extraction of hyperspectral image. The first several principal components (PCs) are usually selected as spectral features in hyperspectral image classification. However, the first several PCs have no guarantee to achieve good class separability and classification accuracy. Considering that, a hybrid feature extraction approach named as PCA_ScatterMatrix was proposed which combined PCA and an improved scatter-matrix-based feature selection method, aiming to select PCs with high class separability and get high overall classification accuracy. The experiments and comparative analyses were conducted with a widely used hyperspectral image, which was collected over the agricultural area in northwestern Indiana, USA (United States of America) by the AVIRIS (Airborne Visible / Infrared Imaging Spectrometer). The experimental results indicated that: (1) The proposed hybrid feature extraction method PCA_ScatterMatrix got the highest overall classification accuracy on both data sets (82.7% and 86.5%) among three classic subspace feature extraction methods (PCA, ICA and LDA) and respectively improved overall classification accuracy by 1.5% and 2.5% on both data sets, comparing to original PCA; (2) Compared to spectral features, spatial feature extraction methods generally got higher overall classification accuracy, especially Gabor spatial features got the highest overall classification accuracy on both data sets (95.5% and 96.7%). The results suggest that the proposed method is effective in vegetation classification of hyperspectral image and the spatial features play a much more important role in vegetation classification of hyperspectral image, comparing with spectral features.
Key words: hyperspectral image; vegetation classification; spectral feature; spatial feature; hybrid feature extraction method; scatter-matrix; principal component analysis
收稿日期:2019-11-27 修订日期:2020-02-27
基金项目:国家自然科学青年基金(41801225);国家重点研发计划(2017YFE0122500);北京市自然科学基金(6182011)
作者简介:付元元(1987-),女,博士,助理研究员,研究方向:农业定量遥感,Email:fyy0201@163.com。
* 通讯作者:杨贵军(1976-),男,博士,研究员,研究方向:农业定量遥感机理及应用,电话:010-51503647,Email:yanggj@nercita.org.cn。
doi: 10.12133/j.smartag.2020.2.1.201911-SA005