【例会】An effective feature selection method for hyperspectral image classification based on genetic algorithm and support vector machine论文学习报告

主持人:唐晨

参会老师:杨矫云

参会学生:唐晨,滕越,肖勇博,刘硕,赵春阳,程坤

请假学生:段优,贵芳,刘杰,明鉷,韩朋,李雨龙,江思源

时间:2018年8月1日

本次例会学习讨论了以下文章:

Li S, Wu H, Wan D, et al. An effective feature selection method for hyperspectral image classification based on genetic algorithm and support vector machine[J]. Knowledge-Based Systems, 2011, 24(1):40-48.

这篇文章提出了使用条件互信息、遗传算法-支持向量机、分支定界搜索算法用于高光谱图像的特征选择。当前在百度学术的被引量为145.

一、背景(background)

目前使用高光谱图像进行分类的任务越来越多,如目标检测和土地覆盖调查。而高光谱图像通常由数十或数百个近光谱带组成,这将导致高光谱图像分类中的高冗余度和大量计算。如何从那些大量的波段中选择最小和有效的子集是一个非常关键的问题。

常用的降维方法分为两类:特征选择和特征提取。由于高光谱数据的每个波段都有自己的相应图像,通过线性或非线性变换将高维特征空间映射到低维空间的特征提取方式无法保持图像的原始物理解释。因此,特征提取方法不适合于高光谱图像的降维。

特征选择分为包装式,过滤式和嵌入式方法,论文采用遗传算法和支持向量机(GA-SVM)相结合的搜索策略。由于高光谱图像中有数百个波段,GA直接在原始波段空间上的搜索空间将太大。所以首先采用条件互信息将波段划分为不相交的子空间,从而获得非冗余的波段集,同时减少搜索空间。其次,采用GA-SVM来搜索波段的最佳组合。最后,利用分支定界搜索算法(BB)从GA-SVM的结果中删除不相关的波段,从而得到分类任务的最小相关集。

二、问题与假设(problem and hypothesis )

问题:如何减少不相关的波段数目,提高分类的准确性

假设:使用GA-SVM、分支定界搜索算法和互信息组合方法可以获得冗余度小的最小相关波段集,提高分类的准确性。

三、方法(method)

使用条件互信息来测量相邻波段之间的相关性,将高相关性的相邻波段合并为一组,冗余度较小的相邻波段分成不同的组。 然后可以从每个组中选择代表性的波段。虽然互信息能表达波段之间的关系,但条件MI不仅可以表示波段的相关性,还可以表示类与特征(波段)之间的关系。

简单的GA有时提供的解决方案较差,克服这种限制的一种实用有效的方法是通过结合特定领域的知识来混合GA。 在本文中,高光谱带的特征可以作为领域知识结合GA。这里不选择常见的二进制编码方法作为遗传编码模式。 如果使用这种方法,无法确保在突变和交叉后的波段组合中每个频段组中只有一个波段。 因此,算法使用整数编码模式。使用的核函数是径向基函数(RBF函数),遗传算法种群数为30,突变概率为0.2,交叉概率为0.8,最大代数为100。

为了确保波段分组和GA-SVM处理后波段组合具有最小波段数,使用分支定界算法(BB)来进一步搜索具有最小波段数量的组合。

四、实验(Experiment)

实验数据集为Washington DC Mall data set和Indian Pine data set,第一组数据,在可见光和红外光谱的0.4-2.4μm区域中收集210个波段,可用为191个波段。第二组数据由1992年6月在NW Indian Pine上获得的AVIRIS图像的145 ×145像素部分组成。总共220个原始波段,可用为202个波段 。

对于Washington DC Mall data set进行了三个对比试验,实验一为使用没有波段选择的所有191个波段作为SVM的输入(表示为非选择算法)以及使用没有波段分组的所有191个波段作为GA-SVM的输入与本文算法比较。实验二是为了证明BB对初始波段分组进行修剪的必要性和有效性,使用不进行条件MI分组和进行条件MI分组不进行BB分组同本文算法进行对比。实验三是为了说明本文算法的优点,特别是基于条件MI分析的波段分组方案,通过实现了另外两种用于高光谱图像分类的均匀分组方法,与本文算法进行比较。

对于Indian Pine data set数据集设置了两个对比实验,实验四为了证明BB对原始波段分组进行修剪的必要性和有效性,使用基于BB分组后波段组的GA-SVM算法搜索最佳波段组合,与不使用BB分组的进行对比。 实验五使用本文算法与现有的波段选择搜索算法进行对比。

五、结果分析(analysis)

从实验结果可以看出本文使用的波段选择算法,利用基于条件MI和BB修剪的波段分组,可以找到具有最小波段数的非冗余波段组合,并排除不相关的组并减少波段组的数量,从而使分类精度更高。此外,我们使用GA-SVM来获得比传统算法更好的波段组合。与两个基准数据集上的其他最先进算法的比较结果表明,所提出的方法在分类精度和选择波段数方面具有优势。

六、展望(future work)

研究如何从条件MI中挖掘高光谱图像波段分组信息,使分类精度更高。以及如何重新制定波段分组方案并获得更高的分类准确性。

anyShare分享到:
This entry was posted in 例会, 新闻动态. Bookmark the permalink.

发表评论