您好、欢迎来到现金彩票网!
当前位置:斗牛棋牌 > 纹理分割 >

一种将数字规划地图(DLG)数据用于高分辨率遥感图像地表覆盖分

发布时间:2019-07-25 05:51 来源:未知 编辑:admin

  本发明的针对遥感地表覆盖分类应用,特别是对于中国高分辨率全国地表覆盖数据产品的生产,提供一种有效利用历史数字规划地图(DLG)数据辅助地表覆盖分类的技术。首先对图像计算纹理矩阵,并进行SLIC分割,将分割斑块的光谱与纹理特征作为分类样本;同时将同区域DLG数据多边形面状要素与地表覆盖分类类别对应,并转为栅格图像;然后根据DLG栅格图像与分割图像将样本划分为训练样本与待分类样本;最后利用支持向量机分类(SVM)对训练样本进行训练,利用训练的模型对待分类样本分类,得到地表覆盖分类图。本技术结合目前中国对生产高分辨率地表覆盖数据产品的需求与现有DLG数据积累的现状定制,具有自动化程度高、处理速度快的特点。

  1.一种将数字规划地图(DLG)数据用于高分辨率遥感图像地表覆盖分类的方法,该方法针对遥感图像地表覆盖分类应用,特别是针对中国区域利用高分辨率多光谱遥感图像完成地表覆盖分类的工程应用,其特征在于包括以下实施步骤:A对待分类图像进行分割,并对分割斑块编号,计算待分类图像的纹理矩阵,统计分割斑块的光谱与纹理特征向量作为分类样本;

  B同区域DLG数据多边形面状要素与地表覆盖分类类别对应,矢量数据转栅格图像;

  C根据DLG栅格图像与分割图像将分类样本划分为训练样本与待分类样本两类;

  D采用支持向量机分类(SVM)方法对训练样本进行训练,样本筛选与参数优选;

  E利用训练得到的SVM模型对待分类样本进行分类,保留概率高的分类样本,低概率分类样本保持待分类类别;

  步骤A中所述对待分类图像进行分割,采用SLIC(Simple Linear Iterative Clustering)超像素分割算法,并采用层次区域合并(Hierarchical Stepwise Region Merging)算法对分割斑块进行整合;所述计算待分类图像的纹理矩阵,指通过先计算灰度共生矩阵,再在灰度共生矩阵的基础上计算由能量、熵、对比度三个特征量所表示的纹理特征;所述统计分割斑块的光谱与纹理特征向量作为分类样本,是统计斑块内所有像素对应到原始待分类图像的每个波段的平均像素值与纹理图像的能量、熵、对比度平均值构成的超像素向量。

  步骤B中所述的同区域DLG数据多边形面状要素与地表覆盖分类类别对应,是根据DLG数据具体的要素类别与地表覆盖分类的类别体系确定;所述的矢量数据转栅格图像,是将DLG矢量数据转化为和待分类图像像素尺寸、分辨率、地图投影一致的栅格图像,对有对应类别的多边形面状要素,多边形区域内像素值设为地表覆盖分类类别值,对未确定类别的多边形区域外,像素值设为背景值,一般设为0。

  步骤C中所述的根据DLG栅格图像与分割图像将分类样本划分为训练样本与待分类样本两类,具体实现是统计每个分割斑块内对应到DLG栅格图像中的不同类别所含的像素个数,如果超过半数的像素对应到某一类别,则将该斑块对应的样本划分为该类别,并作为训练样本,否则该样本划分为待分类样本。

  步骤D中所述的样本筛选与参数优选,具体实现是首先对归一化到[1-,1]的训练样本进行第一次训练,得到一个SVM模型;然后利用该SVM模型对归一化训练样本进行分类,并输出每个训练样本对于各分类类别的隶属度,也就是概率,样本筛选是去除隶属于最高概率类别的值低于一定阈值的样本,阈值取值范围[0.5,0.7];最后对筛选后的样本再次进行训练,并采用交叉验证选择最佳参数,使得训练的SVM模型对 筛选后的样本分类精度尽量高,比较第一次训练与优选参数后得到的训练模型,选择精度较高的分类模型作为最终分类模型。

  步骤E中所述的保留概率高的分类样本,采用的阈值范围为[0.5,0.7],具体阈值范围根据待分类样本分类结果的概率分布进行调整,使得剩余的待分类样本数量不超过分类前所有待分类样本的四分之一的条件下,阈值取值尽量高。

  步骤F中所述的对剩余待分类样本赋予邻接斑块的类别,具体是对所有剩余待分类样本对应分割斑块,查找否与已确定类别的斑块邻接,若有则将邻接边缘像素最多的斑块所在类别赋予待分类类别的斑块,循环直到所有待分类类别斑块都有确定类别。

  [0001] 本发明涉及遥感图像分类技术,具体的说,涉及一种针对高分辨率多光谱遥感图像的地表覆盖分类技术。

  [0002] 遥感影像分类是利用计算机通过对遥感影像中的各类地物的光谱信息和空间信息进行分析,选择特征,将影像中每个像元按照某种规则或算法划分为不同的类别的过程。遥感分类是从遥感图像上获取信息的重要手段,是遥感技术应用中的热点研究方向,每年都会有新的分类方法被提出。

  [0003] 地表覆盖(Land Cover)是指地球表面各种物质类型及其自然属性与特征的综合体。由于其空间分布直接影响着地球表面的物质和能量循环过程,且时间变化综合地反映着人类活动和气候变化对自然环境的影响,近年来国际社会一直致力于利用空间遥感技术研究全球地表覆盖及其变化。迄今仅有美国和欧盟完成了空间分辨率为1公里和300米的全球地表覆盖数据产品,但其总体精度较低,分类体系和时空分辨率均难以有效满足全球变化与地球系统研究的需求。我国目前很多机构都在开展利用高分辨率遥感卫星数据进行地表覆盖制图的研究。例如国家基础地理信息中心牵头的863重点项目“全球地表覆盖遥感制图与关键技术研究”首次以30米空间分辨率的多光谱卫星图像制作了全球地表覆盖分类图,在地表覆盖分类工程化制图方面积累了经验。[0004] DLG(Digital Line Graphic)数字规划地图是保存地图要素的矢量数据集,我国的DLG数据库基本以《1∶2.5万、1∶5万、1∶10万地形图图式》(GB 12342-90)为标准制作,DLG数据库中的基本元素是点、线、面,最基本的显示也是点、线、有色或无色填充面,其要素内容参照矢量地形数据生产技术规定。其中1∶5万DLG数据库是我国迄今为止现势性最强、功能最完备、最具权威性的国家级数字地形图数据库,它包含了政区、水系、居民地、交通、测量控制点、地貌等要素内容以及它们的属性信息,1∶5万DLG数据库是以1∶5万地形图为主要数据源,选取相对主要的要素内容,应用SPOT卫星影像、航空影像、车载GPS采集的国省道数据、地名数据成果等方法来对数据内容进行更新。1∶5万地形图是进行工程项目可行性研究和规划不可缺少的基础图件,是编制更小比例尺地形图或专题地图的基础资料。利用1∶5万DLG数据库进行地表覆盖分类具有成本低、成图周期短、工作效率高等优势。[0005] 目前大区域的地表覆盖分类制图过程仍然是需要复杂的人机交互,工作量大,如何提高遥感分类的自动化程度、提高地表覆盖分类制图的工作效率成为遥感分类方法的研究的一个课题,尤其是近年来国产高分辨率遥感卫星的发射进入井喷期,面临对海量遥感数据进行工程化处理的情况下,有关提高遥感地表覆盖分类工作效率的研究变得非常迫切。本发明的出发点是利用历史积累的DLG数据库提高对高分辨率遥感图像地表覆盖分类的效率。发明内容[0006] 本发明的目的是针对遥感地表覆盖分类应用,提供一种DLG数据辅助分类技术,特别是对于中国高分辨率全国地表覆盖数据产品的生产,提供一种有效利用历史DLG数据辅助地表覆盖分类的技术流程。本技术基于现有的遥感图像分割与分类算法,根据目前中国对生产高分辨率地表覆盖数据产品的需求、现有DLG数据积累、以及近年来国产高分辨率多光谱遥感影像数据大量获取的现状定制的地表覆盖分类算法流程。[0007] 本发明的基本思路为:将高分辨率多光谱遥感图像作为地表覆盖分类的对象,将同区域的最新DLG数据作为分类的辅助数据,首先对待分类图像进行超像素分割,划分成大量斑块,并根据待分类的类别特性选取DLG数据中的多边形面状要素,根据这些多边形将待分类图像的斑块划分为多边形内的已确定类别斑块区域与多边形外的未确定类别斑块区域两部分,然后在已确定类别区域内自动选取待分类各类别样本斑块,并利用支持向量机分类方法(SVM)对样本进行训练获取分类预测模型,最后利用训练得到的预测模型对未确定类别区域的斑块进行分类,得到地表覆盖分类结果。[0008] 所述的高分辨率多光谱遥感图像,数据获取的平台可以是卫星、无人机,空间分辨率优于30米,波段至少包含R、G、B三个波段。同区域的DLG数据要求至少覆盖待分类图像地理覆盖区域的一半,并且包含的多边形面状要素覆盖所有待分类类别。待分类图像获取时间与DLG数据制图时间尽量接近,两者相差年份过大,则需要检查地表覆盖变化区域的大小,保证DLG数据已确定类别的多边形面状区域内对应的待分类图像区域类别是对应的。[0009] 本发明的技术方案提供的将DLG数据用于高分辨率遥感图像地表覆盖分类的方法,其特征在于包括以下实施步骤:[0010] A 对待分类图像进行分割,并对分割斑块编号,计算待分类图像的纹理矩阵,统计分割斑块的光谱与纹理特征向量作为分类样本;[0011] B 同区域DLG数据多边形面状要素与地表覆盖分类类别对应,矢量数据转栅格图像;[0012] C 根据DLG栅格图像与分割图像将分类样本划分为训练样本与待分类样本两类;[0013] D 采用支持向量机分类(SVM)方法对训练样本进行训练,样本筛选与参数优选;[0014] E 利用训练得到的SVM模型对待分类样本进行分类,保留概率高的分类样本,低概率分类样本保持待分类类别;[0015] F 对剩余待分类样本赋予邻接斑块的类别,输出最终地表覆盖分类图。[0016] 上述实施步骤的特征在于:[0017] 步骤A中所述对待分类图像进行分割,采用SLIC(simple  linear iterativeclustering)超像素分割算法,并采用层次区域合并(Hierarchical Stepwise Region Merging)算法对分割斑块进行整合;所述计算待分类图像的纹理矩阵,指通过先计算灰度共生矩阵,再在灰度共生矩阵的基础上计算由能量、熵、对比度三个特征量所表示的纹理特征;所述统计分割斑块的光谱与纹理特征向量作为分类样本,是统计斑块内所有像素对应到原始待分类图像的每个波段的平均像素值与纹理图像的能量、熵、对比度平均值构成的超像素向量。

  [0018] 步骤B中所述的同区域DLG数据多边形面状要素与地表覆盖分类类别对应,是根据DLG数据具体的要素类别与地表覆盖分类的类别体系确定;所述的矢量数据转栅格图像,是将DLG矢量数据转化为和待分类图像像素尺寸、分辨率、地图投影一致的栅格图像,对有对应类别的多边形面状要素,多边形区域内像素值设为地表覆盖分类类别值,对未确定类别的多边形区域外,像素值设为背景值,一般设为0。[0019] 步骤C中所述的根据DLG栅格图像与分割图像将分类样本划分为训练样本与待分类样本两类,具体实现是统计每个分割斑块内对应到DLG栅格图像中的不同类别所含的像素个数,如果超过半数的像素对应到某一类别,则将该斑块对应的样本划分为该类别,并作为训练样本,否则该样本划分为待分类样本。[0020] 步骤D中所述的采用支持向量机分类(SVM)方法对训练样本进行训练,使用台湾大学林智仁等开发SVM模式识别与回归软件包LIBSVM,采用C-SVC分类,核函数采用RBF核;所述样本筛选与参数优选,具体实现是首先对归一化到[1-,1]的训练样本进行第一次训练,得到一个SVM模型;然后利用该SVM模型对归一化训练样本进行分类,并输出每个训练样本对于各分类类别的隶属度,也就是概率,样本筛选是去除隶属于最高概率类别的值低于一定阈值的样本,阈值取值范围[0.5,0.7];最后对筛选后的样本再次进行训练,并采用交叉验证选择最佳参数C与g,使得训练的SVM模型对筛选后的样本分类精度尽量高,比较第一次训练与优选参数C与g后得到的训练模型,选择精度较高的分类模型作为最终分类模型。[0021] 步骤E中所述的保留概率高的分类样本,采用的阈值范围为[0.5,0.7],具体阈值范围根据待分类样本分类结果的概率分布进行调整,使得剩余的待分类样本数量不超过分类前所有待分类样本的四分之一的条件下,阈值取值尽量高。[0022] 步骤F中所述的对剩余待分类样本赋予邻接斑块的类别,具体是对所有剩余待分类样本对应分割斑块,查找否与已确定类别的斑块邻接,若有则将邻接边缘像素最多的斑块所在类别赋予待分类类别的斑块,循环直到所有待分类类别斑块都有确定类别;所述的输出最终地表覆盖分类图,所有像素都有确定的类别值,符合地表覆盖分类数据产品特性。[0023] 本发明与现有技术相比有如下特点:本发明提供了一种将DLG数据用于高分辨率遥感图像地表覆盖分类的解决方案,通过将DLG数据中的多边形面状要素对应到地表覆盖分类体系中的部分类别,利用超像素分割得到的斑块作为分类样本的统计单元,样本向量针对高分辨率多光谱遥感图像的特征,结合了光谱信息与纹理信息,采用SVM分类方法对已确定类别样本进行训练,并用训练的模型对未确定类别样本进行分类。本方案利用我国现有丰富的DLG历史数据源,服务于当前我国高分辨率遥感地表覆盖分类制图需求,有着明确的技术开发需求与迫切性。本发明算法自动化程度高,处理过程无需过多人机交互,用户仅需在分类结果上进行进一步的修编获得最终的地表覆盖分类产品,极大地提高了工程化生产全国地表覆盖分类产品的效率。本发明涉及的关键分类步骤采用成熟的LIBSVM软件包实现,具有较高的稳定性与适用性。对于高分辨率遥感图像地表覆盖分类产品的生产提供了关键的技术支撑。附图说明:

  [0024] 图1是将DLG数据用于高分辨率遥感图像地表覆盖分类的流程图;[0025] 图2是DLG数据多边形面状要素与分类类别对应并栅格化的图像示意图;[0026] 图3是超分辨率分割结果与合并结果示意图;[0027] 图4是层次区域合并示意图;[0028] 图5是地表覆盖分类结果图像示意图。具体实施方式:

  [0029] 本发明实现将DLG数据用于高分辨率遥感图像地表覆盖分类的流程如图1所示,现结合附图对其具体实施方式进行描述。附图1所示的流程中,数据单元编号从a到j,处理单元编号从1到9。各部分具体实施细节如下:[0030] 数据单元a.DLG矢量数据,要求至少覆盖待分类图像地理覆盖区域的一半,并且包含的多边形面状要素覆盖所有待分类类别。[0031] 数据单元b.高分辨率多光谱图像,数据获取的平台可以是卫星、无人机,空间分辨率优于30米,波段至少包含R、G、B三个波段,如果包含近红外波段,则可以进一步计算归一化植被指数(NDVI)作为植被类别判断参考。[0032] 处理单元1.类别对应,是根据DLG数据具体的要素类别与地表覆盖分类的类别体系确定,例如DLG数据中的某河流、某湖泊多边形面状要素划分到地表覆盖分类体系中的水体,DLG数据中的某工厂、某道路多边形面状要素划分到地表覆盖分类体系中的建筑区,等等。[0033] 处理单元2.矢量转栅格,依据待分类图像。是根据待分类图像的地理范围、分辨率、地图投影,将DLG矢量数据转化为和待分类图像像素尺寸一致的栅格图像,对有对应类别的多边形面状要素,多边形区域内像素值设为地表覆盖分类类别值,对未确定类别的多边形区域外,像素值设为背景值,一般为0值。DLG矢量数据转转栅格图像可根据DLG数据中面状要素与地表覆盖分类类别的对应关系编写专门的代码完成,实现数据的批量转换。同时考虑到工程生产中DLG数据的复杂性与地表覆盖的多样性,很多情况下需要对DLG数据中的面状要素进行人工筛选,只将部分符合地表覆盖分类的面状要素对应到地表覆盖分类的类别,这种情况下可以利用商业的地理信息系统软件ArcGIS完成灵活的DLG要素筛选与矢量栅格化转换。DLG数据多边形面状要素与分类类别对应并栅格化的图像示意图见图2,其中栅格化后的DLG图像中黑色部分为待分类区域。[0034] 数据单元e.DLG栅格图。通过矢量转栅格得到的结果图像,图像中待分类的区域像素值为0,已分类的区域像素值为具体的类别值,保存为外部临时文件,数据存储格式为Byte型的8位栅格TIF图像,像素尺寸、地理坐标与地图投影与原始待分类图像相同。[0035] 处理单元3.超像素分割,对于待分类的高分辨率多光谱遥感图像进行分割、合并、编号处理,形成编号的斑块数据,后续的分类操作将以超像素代表的斑块为待分类的样本。[0036] 超像素概念是2003年Xiaofeng Ren提出和发展起来的图像分割技术,是指具有相似颜色、纹理等特征的像素构成的不规则像素块。它利用像素之间特征的相似性将像素分组,用少量的超像素代替所有像素来表达图片特征,降低了图像后处理的复杂度,目前已经广泛用于图像分割、姿势估计、目标跟踪、目标识别等计算机视觉应用。常见的超像素分割方法有TurboPixel、SLIC(simple linear iterativeclustering)、NCut、Graph-based、Watershed(Marker-based Watershed)、Meanshift等等。这里采用SLIC算法,理由是相比其他的超像素分割方法,SLIC在运行速度、生成超像素的紧凑度、轮廓保持方面都比较理想,且参数设置简单。[0037] 基于SLIC算法的思想,整个分割、合并、编号处理具体实现的步骤如下:[0038] 1.SLIC超像素分割。首先初始化种子点:按照设定的超像素平均尺寸大小,在图像内均匀的分配种子点。假设超像素期望尺寸为K个像素,则对于长M像素、宽N像素的图像,网格化种子点的布置数量为(M/K)×(N/K)。然后扰乱种子点(Perturb Seeds),在种子点的n×n(n=3)邻域内计算所有像素点的梯度值,将种子点移到该邻域内梯度最小的地方。这样可以避免种子点落在梯度较大的轮廓边界上,以免影响后续聚类效果。在每个种子点周围的邻域内为每个像素点分配类标签。若期望的超像素尺寸为K×K,则搜索范围为2K×2K。之后计算距离度量,包括颜色距离和空间距离,对于每个搜索到的像素点,分别计算它和该种子点的距离。距离计算公式如下:[0039][0040][0041][0042] 其中,dc为颜色距离,ds为空间距离,S为类内最大空间距离,可取值S=sqrt(N/K),C为最大颜色距离,取值为固定常数,取值范围[1,40],一般取10。由于每个像素点都会被多个种子点搜索到,所以每个像素点都会有一个与周围种子点的距离,取最小值对应的种子点作为该像素点的聚类中心。分割过程需要迭代优化,理论上上述步骤不断迭代直到误差收敛,统计上10次迭代对绝大部分图片都可以得到较理想效果,所以一般迭代次数取10。最后对分割的结果进行粗合并。经过上述计算得到的结果会出现多连通、超像素尺寸过小,单个超像素被切割成多个不连续超像素等情况,通过粗合并解决这些问题。遍历所有超像素,将不连续的超像素、尺寸过小超像素重新分配给邻近的超像素,遍历过的像素点分配给相应的标签,直到所有点处理完毕为止。[0043] 2.超像素合并。超像素合并是实现比较精细的分割重要方法,尤其是对于遥感图像分类,超像素合并可以SLIC分割结果中将零散的、相邻的、邻接部分不存在边界的超像素斑块合并,这对于后续分类结果的精度提升是非常重要的。这里采用层次区域合并(Hierarchical Stepwise Region Merging)算法,层次区域合并精合并前后比较参见图3。层次区域合并采用K.Harris的经典方法(K.Harris,1998IEEE TIP,Hybrid image segmentation using watershed and fast region merging),先构建区域邻接图,根据区域邻接关系构建的区域邻接图示例见图4。对于相邻的两个斑块区域,邻接边的权重计算公式为:

  [0044][0045] 其中ni与nj表示斑块i与斑块j的像素数量,与 为斑块每个波段的平均像素值。计算所有斑块邻接边的权重dij后,便可通过分析每次区域合并对整个图像误差的影响决定每个邻接边是否进行合并。

  [0046] 每次斑块合并都会导致整图的误差增加,何时终止区域合并过程对于后续斑块分类影响非常大,这里将终止合并的阈值作为关键的设置参数,对于不同影像的精确分割,如果对最终的分割合并结果不满意,则需要手动设置合并阈值的大小。为了方便该阈值的设定,我们采用的方法是设计专门的分割用户交互软件图像显示界面,用户通过鼠标拖拽阈值设定滑块键,对整幅图像局部区域进行快速的分割结果预览,根据预览结果决定阈值参数的数值。[0047] 3.斑块编号。斑块编号是对分割合并后的每个斑块所有像素赋予一个连续的整数值的过程,斑块编号的目的是便于后续分类标记编程实现。斑块编号从300开始,编号顺序从左到右,从上到下。例如一幅图像被分割为1234个斑块,则斑块编号后,斑块编号的最小值为300,最大值为1533,编号为300的斑块里所有像素的值为300。[0048] 由于遥感图像像素尺寸通常较大,长宽普遍超过1万个像素,对遥感图像的处理一般不会将整个图像全部读入内存处理,而是采用分块处理的方式,将图像按照一定的块大小,比如2048×2048像素,分成网格,按照从左到右,从上到下的顺序分块处理。SLIC超像素分割与超像素合并的计算便是以分块为单位处理的,而斑块编号则是对整幅图像进行的。[0049] 在后续的分类中,将像素值超过300的斑块作为待分类斑块,确定类别的斑块则赋予具体的类别值,由于分类结果图像采用Byte型8位数据存储,数值不超过255,所以确定类别的斑块像素值不会与待分类类别编号冲突。[0050] 数据单元c.分割图像。通过SLIC超像素分割、超像素合并与斑块编号得到的结果图像,保存为外部临时文件,数据存储格式为Int型的32位栅格TIF图像,像素尺寸、地理坐标与地图投影与原始待分类图像相同。[0051] 处理单元4.计算纹理。通过灰度共生矩阵(Gray-level co-occurrence matrix)灰度的空间相关特性描述纹理,具体包括能量、熵、对比度。[0052] 首先将多波段的待分类遥感图像转化为单波段灰度图像,采用固定参数,将R、G、B三个波段乘上固定的转换系数并相加得到,公式为R×0.299+G×0.587+B×0.114。[0053] 在灰度图像上计算灰度共生矩阵,该矩阵定义为像素对的联合分布概率,它反映图像灰度在相邻的方向、相邻间隔、变化幅度的综合信息,以及相同的灰度级像素之间的位置分布特征,是计算纹理特征的基础。设f(x,y)为一幅数字图像,其大小为M×N,灰度级别为Ng,这里采用16个灰度级别,则满足一定空间关系的灰度共生矩阵为:[0054] G(i,j)=#(x1,y1),(x2,y2)∈M×Nf(x1,y1)=i,f(x2,y2)=j}[0055] 其中#(x)表示集合x中的元素个数,G为Ng×Ng的矩阵,若(x1,y1)与(x2,y2)间距离为d,两者与坐标横轴的夹角为θ,则可以得到各种间距及角度的灰度共生矩阵(i,j,d,θ)。其中元素(i,j)的值表示一个灰度为i,另一个灰度为j的两个相距为d的像素对在角的方向上出现的次数。这里d取9,θ取定义水平方向的0值。

  [0056] 在计算得到灰度共生矩阵之后,便可在此基础上计算纹理特征量,这里包括能量、熵、对比度。[0057] 能量是灰度共生矩阵各元素值的平方和,是对图像纹理的灰度变化稳定程度的度量,反应了图像灰度分布均匀程度和纹理粗细度。能量值大表明当前纹理是一种规则变化较为稳定的纹理。计算公式:[0058][0059] 熵是图像包含信息量的随机性度量。当共生矩阵中所有值均相等或者像素值表现出最大的随机性时,熵最大;因此熵值表明了图像灰度分布的复杂程度,熵值越大,图像越复杂。计算公式:[0060][0061] 对比度度量矩阵的值是如何分布和图像中局部变化的多少,反应了图像的清晰度和纹理的沟纹深浅。纹理的沟纹越深,反差越大,效果清晰;反之,对比值小,则沟纹浅,效果模糊。计算公式:[0062][0063] 数据单元d.纹理图像。通过计算纹理得到的结果图像,包含记录能量、熵、对比度的三个波段,保存为外部临时文件,数据存储格式为Float型的32位栅格TIF图像,像素尺寸、地理坐标与地图投影与原始待分类图像相同。[0064] 处理单元5.计算斑块样本。在本发明中,分类的样本通过统计每个编号斑块的特征值获得,是一种自定义的超像素向量值,该值由像素的光谱信息与纹理信息共同组成。斑块样本的具体计算方式是利用数据单元c编号的分割图像,将每个斑块对应到原始待分类图像与数据单元d的纹理图像中,统计斑块内所有像素对应到原始待分类图像的每个波段的平均像素值与纹理图像的能量、熵、对比度平均值。斑块样本值,即斑块的超像素向量,作为后续分类的样本。超像素向量包含元素的个数等于原始待分类图像波段数与纹理图像波段数的和。[0065] 斑块样本的具体实现方法是:首先定义一个存储斑块样本的数据结构,包括斑块样本的编号、分类类别、斑块所含像素数量、斑块对应到原始待分类图像中各波段的像素平均值、斑块对应到纹理图像中各波段的平均值;然后申请一个存储该数据结构的数组,数组所含元素的个数为分割斑块的总数;最后通过统计所有斑块的编号、像素数目、各波段光谱均值与纹理均值,完成斑块样本的初始化。由于数据单元c的分割图像每个斑块都有不同的编号,且编号即像素值,所以对斑块样本的初始化统计可简单地通过同时对分割图像、原始待分类图像与纹理图像进行一遍逐像素遍历即可。遍历后得到每个斑块样本的像素数目、各波段光谱累计值与纹理累计值,再对斑块样本数组进行一遍遍历,将各斑块各波段光谱累计值与纹理累计值除以像素数目,得到各波段光谱与纹理的均值。[0066] 数据单元f.样本数据。通过计算斑块样本得到的数组,包含斑块样本的编号、分类类别、斑块所含像素数量、斑块对应到原始待分类图像中各波段的像素平均值、斑块对应到纹理图像中各波段的平均值信息,保存在内存中。[0067] 处理单元6.划分样本。根据数据单元e.DLG栅格图与数据单元c.分割图像,将数据单元f.样本数据划分为已分类与待分类两个类别,并按照后续分类的需求,将已分类与待分类两个类别的样本按照固定格式输出到外部文件。[0068] 划分样本的具体实现过程是:首先根据待分类类别数定义一个存储数据结构,包括斑块样本的编号与每个分类类别所包含的像素数目;然后申请一个存储该数据结构的数组,数组所含元素的个数为分割斑块的总数;最后通过统计所有斑块的中每个分类类别所包含的像素数目,将所含像素数量最多的类别作为该编号下样本的分类类别,赋值给数据单元f.样本数据中对应编号的样本。由于数据单元c的分割图像每个斑块都有不同的编号,且编号即像素值,可逐像素对应到数据单元e.DLG栅格图像中,根据DLG栅格图像的像素值确定像素对应类别,所以划分样本可简单地通过同时对分割图像与DLG栅格图像进行一遍逐像素遍历即可。遍历后得到每个斑块样本所含各分类类别的像素数目,再对斑块样本数组进行一遍遍历,得到包含像素数量最多的类别值。[0069] 数据单元g.训练样本。通过划分样本得到的已分类样本,分类类别编号为实际类别值,数值小于255,按照后续分类处理的输入要求,按照固定格式保存的外部文件,存储文件类型为txt。[0070] 数据单元h.待分类样本。通过划分样本得到的待分类样本,类别编号保持与数据单元f.样本数据相同,即为数据单元c.分割图像对应斑块的编号值,数值大于300,按照后续分类处理的输入要求,按照固定格式保存的外部文件,存储文件类型为txt。[0071] 处理单元7.SVM模型训练。包含参数优选与样本筛选两部分,采用的工具是LIBSVM。[0072] LIBSVM是台湾大学林智仁(Chih-Jen Lin)博士等开发设计的一个操作简单、易于使用、快速有效的通用SVM软件包,可以解决分类问题(C-SVC、n-SVC)、回归问题(e-SVR、n-SVR)以及分布估计(one-class-SVM)等问题,提供了线性、多项式、径向基和S形函数四种常用的核函数供选择,可以有效地解决多类问题、交叉验证选择参数、对不平衡样本加权、多类问题的概率估计等。LIBSVM是一个开源的软件包,可以从网站http://~cjlin/处获得。软件包不仅包含LIBSVM的C++语言的算法源代码,还包含Python、Java、R、MATLAB、Perl、Ruby、LabVIEW以及各种语言的接口,可以在Windows或UNIX平台下使用。利用LIBSVM下载包中的C++源代码可编译生成可执行文件,包括:对训练数据与测试数据进行缩放操作的svmscale.exe,进行支持向量机训练的svmtrain.exe,以及根据已获得的支持向量机模型对数据集进行预测的svmpredict.exe。

  [0073] LIBSVM使用的一般步骤是:首先,利用svmscale.exe将数据归一化到[-1,1];然后,采用交叉验证选择最佳参数C与g;采用最佳参数C与g对整个训练集进行训练获取支持向量机模型;最后,利用获取的模型进行测试与预测。[0074] 这里使用LIBSVM与一般步骤不同之处在于对训练样本的筛选。由于本发明中使用的训练样本是通过DLG数据库中的面状要素对应地表分类类别得到的,是一种粗对应,并不精确。以斑块为单位就算超像素向量作为样本,实际上存在很多错误样本,作为噪声存在。在进行参数优选之前有必要进行样本筛选。样本筛选的方法是:首先对数据单元g的训练样本利用svmscale.exe归一化到[-1,1];然后利用svmtrain.exe进行第一次训练,采用C-SVC分类,核函数采用RBF核,关键参数C与g采用默认值,得到一个SVM模型;最后将SVM模型输入svmpredict.exe,对归一化的训练样本进行分类,并输出每个训练样本对于分类类别的隶属度,也就是概率。样本筛选是去除隶属于每个类别的最高概率值低于一定阈值的样本,阈值取值范围[0.5,0.7]。

http://paris-hotels-fr.com/wenlifenge/298.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有