On the Comprehensive Evaluation of the Data Quality for OSM Road Network from the Perspectives of Multi-level and Multi-granularity

  • ZHU Fuxiao ,
  • WANG Yanhui , *
Expand
  • 1. Beijing key Laboratory of Resource Environment and Geographic Information System, Capital Normal University,Beijing 100048, China
  • 2. Key Laboratory of 3-Dimensional Information Acquisition and Application, Ministry of Education, Capital Normal University, Beijing 100048, China
  • 3.State Key Laboratory Incubation Base of Urban Environmental Processes and Digital Simulation, Capital Normal University ,Beijing 100048, China
*Corresponding author: WANG Yanhui, E-mail:

Received date: 2017-05-09

  Request revised date: 2017-07-25

  Online published: 2017-11-10

Copyright

《地球信息科学学报》编辑部 所有

Abstract

OpenStreetMap (hereinafter short for OSM) data quality evaluation only considered the one-sided evaluation index or single level assessment of the object. This paper takes the authoritative data of government planning agency as the reference data and designs a data quality assessment model of OSM road network at a multi-level and multi-granularity scale. This model is based on the method of fuzzy integrated evaluation and is the combination of quality evaluation index and spatial level. From three aspects: single target, group goals and overall goals, this paper builts the evaluation indexes system of data quality and sets the control of number of individual and group structure in one, then sovles the crucial technical problems, such as the determining of membership function and the optimal combination weight. This paper also achieves the combinations of macro and micro, global and local. The results show that OSM data qualities of the single level and the overall level are superior. The group level is the general. The qualities of the single target and most indexes of group goal are superior so that it’s consistent and logical that the overall level is superior. This shows the method is feasible and practical. Some industries which are based on VGI data source can use this empirical basis and reliable data quality evaluation method for reference.

Cite this article

ZHU Fuxiao , WANG Yanhui . On the Comprehensive Evaluation of the Data Quality for OSM Road Network from the Perspectives of Multi-level and Multi-granularity[J]. Journal of Geo-information Science, 2017 , 19(11) : 1422 -1432 . DOI: 10.3724/SP.J.1047.2017.01422

1 引言

近年来,在互联网产业迅猛发展的浪潮下,地理信息服务走进了大众的视野。美国科学院院士Goodchild[1]提出“人人都是传感器”的概念,将地理信息领域一由用户贡献地图内容的UGC(User Generated Content)现象定义为自发地理信息(Volunteered Geographic Information, VGI)。VGI的出现则打破了传统地理信息数据的获取方式,大量非专业人士参与创建地理信息数据。其中,英国伦敦大学学院虚拟现实中心等单位发起的OpenStreetMap(OSM)是目前应用最广泛、最具有代表性的VGI特色项目之一,其旨在建立免费的、开放的地图数据源,允许用户依据开放许可协议自由上传和使用;同时强调使用贡献者的本地知识,利用航空图像、GPS设备与传统的地区地图OSM的精确性和时效性。但由于OSM数据提供者多为非专业志愿者,未经过专业的制图训练,提供的数据可能存在精度、完整度及结构不一致的问题,数据的无序性、不规范性、冗余性、真实可靠性需进一步论证。因此,为了确保OSM数据的实用性,对其空间实体表达的准确性、一致性及完整性进行数据质量评估显得尤为重要。
近十年来,国内外学者采用对比参照数据法、数据匹配法、可信度度量等方法,从志愿者信誉度、数据的处理与提炼、数据管理存储与索引结构、以及地理信息系统的互操作等诸多方面展开了包括OSM在内的VGI数据质量评估及其应用研究[2-8]。就OSM数据质量评估而言,从方法实用性、简便性的角度,对比参照法是其中最常用的方法之一,而设计合适的评估指标体系,构建合理的评估模型则是研究者关注的重点。如Haklay[9]和Ather[10]先后从位置和属性精度、名称完整性和一致性方面将伦敦和英格兰的OSM数据与英国测量局的数据进行对比分析,发现数据已经达到很高的精确度。 Zielstra和Zipf[11]以德国的OSM为例做了大量统计发现数据覆盖不均勾。Girres等[12]扩展了Haklay的研究方法,从几何,属性,语义与时间精度、完整性和逻辑一致性方面对比统计了法国的OSM数据。Siebritz[13]采用定性和定量2种评估方式探究了OSM用于专业数据更新的可行性。国内学者关于VGI质量评估的研究尚属于起步阶段。王明等[14]、Zheng[15]、范博文[16]、马超等[17]等选择武汉、上海、昆明和深圳等不同研究区,选用参照数据探讨OSM数据评估的技术框架,从完整性与精确性2方面统计了不同研究区OSM数据质量差异。但上述这些研究大多是采用分指标线性汇总统计的方法,仅分别从不同角度利用单一层次数据质量评估元素进行了数据比对,评估指标即质量元素的完整性和系统性也有待凝练。而且实际上各评估质量元素之间是相互关联、相互影响的,数据质量的“好”与“坏”本就是相对的概念,各评价等级之间没有绝对的界限,只有模糊的区别[18],仅靠单一的定量对比难以客观地对其进行判断。另外,城市地图数据集中往往会存在路网数据非均匀分布现象,此种单一微观个体信息一致性的数量特征度量方式不足以表征其中观层面上群体结构一致性特征和宏观整体质量,难以全面系统地衡量VGI数据质量的好或坏。
在此背景下,针对现有OSM数据质量评价对象层次单一及评价指标完整性不足、实用性受限,以及数据质量可能携带的随机性和不确定性问题,拟引入模糊数学中基于模糊理论的模糊综合评价法。此评价法在很多领域被广泛应用,如韩利等[19]、胡圣武等[20]和季佳佳等[21]采用多层次模糊综合评判的原理和方法,分别对企业安全、GIS数据质量和土地变更调查数据进行评价。Zhang等[22]建立了油藏地震活动风险评估的层次模型,验证了多层次模糊综合评价的有效性。因此,本文集个体数量控制与群体结构控制于一体,基于空间相似性理论,建立质量评价指标与空间层次相结合的多粒度多层次综合质量模糊评价模型,在顾及要素的几何、属性、拓扑等多尺度表达属性的基础上,分别从单一目标、群组目标和整幅地图角度构建多层次多维评价指标体系,以突破传统评价方法及评价指标只考虑图形指标或只考虑单一层次指标的局限性,从全局与局部相结合、整体与细节相互兼顾的角度多维度多层次度量其综合数据质量,并选用典型研究区验证模型的可行性和科学性,为全面评估VGI数据质量提供评价方法支撑。

2 多层次多粒度评估模型

针对单一层次评估指标体系存在的指标体系完整性不足、无法反映数据集内部结构精度等问题,本文基于空间相似性理论,建立单一、群组和整体相结合的多层次多粒度OSM数据质量综合评价指标体系,采用基于离差平方和的最优组合赋权方法来综合主客观权重,构建多层次模糊综合评价模型。

2.1 多层次多粒度OSM数据质量评价指标体系

2.1.1 基本框架
空间相似性是指根据特定内容和比例尺对空间的匹配和排序[23]。它强调2个空间目标或2个空间场景之间在某一方面或多个方面的相同程度,能帮助解释一定的现象和它们周围的环境。相似度的量算通过将差异度进行标准化后取补来实现。基于对比参照法的数据质量评估的目标就是拟基于要素本身的特征及其与周边要素的关系特征,识别出不同数据源中表示同一现实地物的要素的差异程度。因此,为了综合系统的评估OSM数据质量,本文引入空间相似性理论,分别针对单个目标、群组目标和整幅地图的图形特征、属性特征和空间关系特征,建立质量评价指标与空间层次相结合的、集个体数量控制与群体结构控制于一体的数据质量评估指标体系。另外,本文假设待评估数据集与参照数据集中的要素已经采用改进的概率松弛法[24],建立起1:1、1:M和M:N的对应匹配关系,并在本研究试验区数据的初步整理中,排除了极少出现的1:M和M:N的情况,只研究具有1:1匹配关系的要素相似度。
图1所示,从空间粒度细分的角度,本文涉及的评价指标集合由三级指标体系组成:一级指标包括单一目标、群组目标和整体目标3个维度。单一目标(路段)是数据集中的微观基础指标,其质量评价指标可概括为方位精度、数据完整性、属性精度。群组目标(网眼)是根据道路网的中观局部结构特征抽取的单一目标的集合,其评价指标包括几何、语义和空间关系精度。对于整体目标而言,则是群组目标质量评估在整幅地图中的全局扩展,可将群组目标中的评价指标应用到对整个数据集的评价中。从层级细分的角度,二级指标分解为各一级指标的几何、属性、空间关系特征,三级指标为各二级指标对应的基本度量指数。
Fig. 1 Data quality evaluation index system of OSM road network

图1 OSM路网数据质量评价指标体系

三级指标从宏观与微观相结合、全局与局部相结合的角度系统构成了多层次多粒度多维度OSM评价指标体系。该指标体系不仅考虑了单一要素特征,而且关注了因数据非均匀分布导致的群组要素的评价单元和其结构特征,还考虑了OSM与参照数据方位平衡性保持和分布特征保持等全局一致性和完整性特征。能够较为全面地考虑各因素之间的相互作用及影响,更客观系统地反映OSM路网数据质量的特点。
2.1.2 单一目标
(1) 完整性:代表属性和几何长度的完整性,即在特定时间点上的数据集中所含要素的缺失程度,主要用来衡量OSM道路属性的名称、类型和路段的方位,即分别计算OSM数据的属性个数和长度与参照数据对应信息的比值。本文分别以这3种属性的完整性综合衡量OSM的属性完整性,如式(1)所示:
C = C osm C ref × 100 % (1)
式中:Cosm表示OSM数据的属性信息所含个数;Cref表示参照数据的属性信息所含个数。
(2) 方向相似度:由于只有2条线的方向趋于一致时才有可能表示同一个地理实体,因此“方向”也是研究线要素相似性的一个重要参数。考虑实际应用中,经常会出现2条线要素的总体“走势”一致,本文用曲线两端点连线与水平线的夹角所对应的弧度来表示道路的方向[25]。设线的方向为Lθ,表示线要素首末端点连线与x轴的夹角,如图2所示。
Fig. 2 The direction of the line feature

图2 线要素的方向[25]

设线L的首末点分别为P0,Pn,坐标为(x0,y0)和(xn,yn),线方向Lθ计算公式如式(2)所示。
L θ = arctg y n - y 0 x n - x 0 (2)
具体实现中,可利用Arctoolbox中的要素顶点转点的工具,获取每条道路的首尾顶点,再利用该公式分别求出对用2条线的夹角。相似度用OSM数据与参照数据的夹角对应弧度的相对差值来表示。
(3)曲折度:即为弯曲度S,是对线要素形状的量化描述,计算公式如式(3)所示。线要素形状也是考量其质量的重要因素之一。
S = L osm L S × 100 % (3)
式中:Losm表示OSM道路线要素的实际长度;LS表示该道路端点连线的直线长度。
(4)方位精度:也称为线要素的位置精度,既是评价众源地理空间数据几何精确度最重要的指标,也是评价众源地理空间数据可用性的重要指标。本文选用缓冲区分析的方法对OSM数据进行位置精度的评估。根据经验值,对参照道路数据按道路宽度6 m建立缓冲区,再用OSM数据集和缓冲区进行叠加,以落在对应参考道路数据缓冲区中的OSM道路长度比例作为OSM数据的位置精度。由图3可以看出有部分OSM数据没有落进缓冲区内,这部分落入不一致的范围。
Fig.3 Location precision calculation based on buffer analysis

图3 基于缓冲区分析的位置精度估算

2.1.3 群组目标
群组目标是从表征路网中观局部结构特征角度抽取的若干道路网单一表达目标的集合。本文从几何角度将之用网眼表达,即由网状相交的路网线状要素封闭环绕形成的简单面要素,其可以进一步从数据集的结构特征上对OSM数据的空间关系、几何特征和语义特征进行综合评估。
2.1.3.1 空间关系要素
(1)拓扑相似度:也称为拓扑一致性。对OSM和参照数据分别进行拓扑检查,比较其拓扑结构是否一致。根据城市道路的现实情况,本文设置的一致性规则分别是:不能有悬挂点、不能有伪结点、不能自相交、不能相交、不能自重叠、不能重叠、不能相交或内部接触必须单一。如图4所示,有的相交点几乎重叠,有的相距很远,因此本文从拓扑错误个数和拓扑错误点的邻近程度2个角度来评价其拓扑相似度。
Fig.4 Topology check of OSM

图4 OSM 拓扑检测

(2)方向相似度:网眼的方向相似度主要是指组成网眼的多边形顶点的排列顺序[26]。本文利用简单多边形相邻3点坐标所组成的行列式的正负来判断这3点位置关系。若行列式的值大于零,此时多边形走向为逆时针:反之多边形走向为顺时针。行列式值为零,则3点共线,不予考虑。本文利用上述计算原理分别计算出参照数据和OSM数据的多边形顶点的排列顺序,利用行列式的值作为衡量不同等级道路所形成的网眼的方向,分别计算OSM和参照数据的方向值并加以对比,得出拓扑一致性的量化值。
(3)距离相似度:是对要素地理坐标准确性的评估,用来分析待评估数据集多边形对象与真实对象之间的空间位移,对于多边形而言,其几何中心的位置坐标代表了该多边形这一整体的位置坐标。如图5所示,分别把参照数据和OSM数据集的不同等级道路所形成的网眼多边形转化为其几何中心的点要素,对比2个点数据集的邻近距离,以此来衡量对应网眼的相近程度,以小于平均距离的OSM网眼面积与参照数据集网眼面积的比值作为最后结果。
Fig. 5 Nearest distance

图5 邻近距离

(4)位置相似度:是指来自OSM和参照数据对应网眼图层所形成的多边形的重合程度,也可以用表面距离来表示,即周长和面积之间的比值关系。比值的区间为[0,1]。如果距离为0,则2个多边形完全重合,如果距离是1,则二者不相交。用Arcmap中的叠置分析对两种数据集的网眼进行叠加处理,再计算出叠加部分的面积。
2.1.3.2 几何特征要素
(1)长度相似度:是衡量群组层面上的几何特征,对多边形网眼而言,用其基础度量属性-周长来衡量。利用Arcmap中的属性表计算出网眼多边形的周长,把参照数据与OSM数据集网眼周长进行对比即可得到该指标度量值。
(2)平均长度相似度:构成网眼的路段个数与该网眼周长的比值,即平均长度相似度。以平均值的角度来描述整体的相似性,也是对其网眼周长的相似性补充。
(3)曲折度相似度:曲折度原指线要素的弯曲程度,是对线要素形状的量化描述。以此类推,在群组层面上,也可以用于多边形形状的描述,即网眼的形状相似度,对网眼等面状要素进行形状的量化描述。本文利用紧凑度这一表示多边形形状紧凑程度的度量算子来表征曲折度[27],用来测量网眼多边形的形状偏离预定义形状的程度,进而通过对比参照数据与OSM数据的网眼紧凑度来衡量其形状的差异程度。此处预定义形状为圆,紧凑度C的计算公式如下:
C = S 0.282 × C w 2 (4)
式中:S表示网眼面积;Cw表示网眼周长。
(4)密度相似度:即单位面积内网眼的长度,用于描述网眼分布的结构属性。通过对比参照数据与OSM数据的各个等级道路所形成的网眼密度来衡量其相似程度。
2.1.3.3 语义特征要素
语言特征要素为文本相似度,又称编辑距离,指2个字串之间,由一个转成另一个所需的最少编辑操作次数,其实就是比较2个文本的差异性。本文用文本相似度来比较参照数据与OSM的道路名称、类型和方位等属性的差异,在EXCEL表格中利用文本函数中的EXACT函数判断OSM和参照数据之间线要素的名称是否相同,以参照数据为标准,计算待评估数据的缺失情况,即OSM要素与参照数据中对应要素集与参照数据集之比。
2.1.4 整体目标
整体目标包括OSM数据集的全体对象,是从宏观全局的角度对单一目标和群组目标的综合统计,此处采用下文的综合模糊模型把单一目标和群组目标进行加权组合,便可以得到整体OSM数据的质量评语集。

2.2 多层次多粒度模糊综合评价模型

多层次模糊综合评判模型是以模糊变换理论为基础,以模糊推理为主的定性和定量相结合、精确与非精确相统一的分析评判方法,适用于较为复杂的评判系统,评判级别包含2个及以上。多层次模糊综合评判是从最底层(第k层)开始,向上逐层运算,直至得到最后的评语集B。第k层评判结果就是第k-1层因素的隶属度。多层次模糊综合评判模型不仅可以反映评判因素的不同层次,而且避免了由于因素过多而难于分配权重的问题。
为了能更加合理与全面地评估OSM数据质量,本文利用多层次模糊理论系统地对上述单一目标、群组目标以及整体目标所产生的评判结果进行融合,建立综合评判模型。其涉及的元素与具体构建流程如下:
(1)由评价指标构成的集合:U={U1,U2Um};
(2)由评价等级构成的集合:V={v1,v2vn}={优,良,中,一般,差};
(3)选取隶属度函数:
选择合适的隶属度函数是研究模糊现象的基础。也是目前阻碍模糊数学应用的一个主要问题。对隶属度的确定有许多方法,如模糊统计法、三分法、增量法、待定系数法以及专家打分法等。由于每个指标含义不同,精度不同,标准也就不同,因此,本文选用模糊统计法确定隶属度:各指标取值归一化处理,采用等间隔的方式从最小值到100%等分为5个等间隔区间,以此将评语集依次划分为5个等级“优、良、中、一般、差”,即V=(V1,V2,V3,V4,V5),分别对每个基础指标按其取值进行评定,将其隶属度归纳到“优、良、中、一般、差”对应等级中。
(4)由评价指标与评价等级构成的模糊评价矩阵:
R = r 11 r 12 r 21 r 22 r 1 n r 2 n r m 1 r m 2 r mn (5)
式中:0≤rij≤1,i=1,2,…,m, j=1,2,…,n,rij表示第i个因素对第j种评语的隶属度,由隶属度函数计算得出。
(5)评价指标赋权。三层评价指标包括单一、群组和整体目标,每一指标又包括不同的评价内容,各评价因素的权值不同。数据集的单一目标与群组目标同等重要,因此赋予二者同等的权重Wi[27];由于只有基础指标才有采样值,因此二级指标的权重Wj无法进行客观赋权,此处采用主观的层次分析法得出;对于基础指标,为兼顾对属性的偏好,同时又力争减小主观随意性,使对属性的赋权达到主观与客观的统一,引入基于离差平方和的、层次分析法(AHP)与熵权法相结合的主客观综合赋权方法[28],求出基础指标的组合赋权系数Wk,从而使求解多属性决策问题更客观、准确、有效。
AHP法的主观权重如式(6)所示。
X m = X 1 , X 2 , , X m (6)
利用熵权法确定的客观权重如式(7)所示。
Y n = ( Y 1 , Y 2 , , Y n ) (7)
根据线性加权法,由组合赋权系数向量 W=(Xm,YnT计算而得的第i个决策方案Si的多属性综合评价值可表示为:
D i = j = 1 n b ij W j i = 1,2 , , m (8)
式中:bi为样本值。一般而言,Di总是愈大愈好,Di愈大表示决策方案愈优。根据前述基本思想,应该使m个决策方案总的离差平方和达到最大。于是可构造如下目标函数[28]
J ( W k ) = i = 1 m i 1 = 1 m [ j = 1 n ( b ij - b i 1 j ) W j ] 2 = j 1 n j 2 n [ i = 1 m i 1 = 1 m ( b i j 1 - b i 1 j 1 ) ( b i j 2 - b i 1 j 2 ) ] W j 1 W j 2 (9)
B 1 = i = 1 m i 1 = 1 m ( b i j 1 - b i 1 j 1 ) ( b i j 2 - b i 1 j 2 ) ] ,显然B1n阶对称方阵,于是基于m个决策方案总的离差平方和的最优组合赋权方法即为如式(10)所示的最优化问题。
maxF θ = θ T X m T B 1 Y n θ / θ T θ (10)
设λmax为矩阵XmTB1Yn的最大特征根,θ*为最大特征根所对应的单位化特征向量,则F(θ)的最大值为λmax,求出θ*后,把它代入式(10)即得基础指标的最优组合赋权系数。
W k = Wθ* (11)
式中:W=(Xm,YnT;Wk为基础指标的权重系数。
(6)由模糊矩阵与权值得到的模糊综合评判结果即模糊集。式(12)是多层次模糊综合评价模型的计算公式,由最外层基础指标层的隶属度R111R211R221等与其权重Wk之积得出完整性R11、空间关系B21、几何特征B22和语义特征B23等二级指标的评语集。然后根据第二层评语集,并结合二级指标的权重wj得出一级指标的评语集B1B2。根据最大隶属原则,即可确定OSM数据的最终质量等级评语集B
B = W i * B 1 B 2 = W i * W j * B 11 B 12 B 13 B 14 W j * B 21 B 22 B 23 = W i * W j * W k * R 111 R 112 R 113 B 12 B 13 B 14 W j * W k * R 211 R 212 R 213 W k * R 221 R 222 R 223 W k * R 231 (12)

3 实验分析

根据上述模型,由数据可获取性原则选择典型研究区进行实验,验证了基于模糊综合评价法的多层次多粒度OSM路网目标数据质量评估模型的可行性。

3.1 数据源

由于市中心道路分布密集有序,具有较强的可研究性,在权威数据较为完整的情况下,本文从OSM网站中选取加拿大Alberta省的卡尔里加市中心的数据集(图6),面积约49.2万公亩。参照数据集来自较为权威的加拿大政府规划机构路网数据,选用其中的road线要素数据与待评估数据的进行综合对比。考虑参照数据在属性表中主要被分为二级、三级和居住区道路,不包含一级道路,因此本文以二级道路为最高等级道路,针对这三级研究对象进行评估。所有实验结果均利用SPSS软件由描述性统计表格的形式得出。
Fig. 6 Overview of study area

图6 研究区概况

3.2 单一目标层次数据质量分析

根据上文数据质量评估方法进行验证,表1为参照数据与OSM数据方向相似度差值的最大值、最小值等相关描述性统计信息,反映出数据集的变异趋势。所有单一目标要素质量评价结果如表2所示。
表1来看,参照数据与待评估数据相比,二、三级道路的方向相似度差值和中位数较小,主要由于其为城市主干道,引起的歧义较少,非专业人员上传数据时引起的异质性较低,使得OSM数据集中的二三级道路与参照数据匹配程度高。而居住区道路数量较多,结构复杂,贡献者上传的数据随机性大,可能引起某些道路的变形位移。例如,Cliff街道西南方位(图7),由于OSM数据与参照数据的道路长度在弯道处相差200 m,更能影响到其首尾两端点连线与水平线之间的夹角的大小,因此居住区的道路方向相似度的差异较大。
Tab. 1 Statistical results of directional similarity difference

表1 方向相似度差值统计结果

统计对象 整体方向相似度差值 二级道路方向相似度差值 三级道路方向相似度差值 居住区道路方向相似度差值
最大值 74.83 56.93 36.54 74.83
最小值 0 0.02 0.02 0
平均值 5.97 6.68 4.48 5.70
中位数 1.52 1.42 1.50 1.52
标准差 12.59 12.64 12.87 12.59
样本 394 28 40 287
Fig. 7 Overview of Cliff Street in south west

图7 Cliff街道西南向示意图

表2中可以看出,单一目标各个评价指标的质量较高,基本都在90%以上。二级道路的街道数量的属性完整性达到100%,这是由于道路名称与类型一般是用户进行路径规划引导时最常利用和关注的属性,因此用户上传至OSM网站时较少缺漏;二级道路的方位精度也达到100%,再次体现出越高级道路准确率越高的规律。具体指标层面,OSM数据集在完整度、曲折度和方位精度较为良好,而方向精度稍有落后,这可能是由于OSM数据与参照数据之间有一定角度的旋转错位。
Tab.2 Data quality evaluation results of a single target (%)

表2 单一目标的数据质量评价结果(%)

U1单一目标 U11完整性 U12方向相似度 U13曲折度 U14方位精度
U111名称 U112类型 U113方位
居住区道路 长度 98.54 98.54 98.54 85.49 96.85 96.72
街道数量 99.40 99.70 92.30 99.70
二级街道 长度 98.19 98.19 98.19 86.79 97.80 94.89
街道数量 100.00 100.00 97.10 100
三级街道 长度 87.00 87.00 87.00 86.18 96.49 95.31
街道数量 93.30 91.10 86.70 97.60
整体 长度 93.43 93.43 93.43 85.13 96.67 98.24
街道数量 97.50

3.3 群组目标层次数据质量分析

在计算拓扑相似度的过程中,悬挂点的个数在参照数据集和OSM数据集中的差别最大,这是因为OSM数据集采集时具有自发性、无序性、不规范性,使得OSM数据集的悬挂点增多,从而影响整体的数据质量。
Fig.8 Distribution of hanging node within nearest distance

图8 邻近距离内悬挂节点分布

图8可以看出参照数据与OSM数据拓扑错误点之间的偏差距离多集中在1~5 m之间,因此用小于平均近距离5.58 m的OSM数据集的悬挂节点个数与总节点数的比值来表示拓扑一致性。另外,分别统计参照数据与OSM数据中拓扑错误个数和拓扑错误的邻近距离,并加以对比(表3)。可以看出,悬挂点的数量最大差值较大,体现了OSM数据采集的自发性,且2个对应悬挂点的最大距离达到187.81 m,这在现实中也是非常大的误差。由此可见,2个数据源的拓扑结构的相近程度在局部区域较差,有一定的位移误差。数量精度排除精度差异造成的误差,中位数在1%左右,相似度较高,因此取二者的平均数作为衡量拓扑一致性的表征值。
Tab. 3 The statistics of hanging node and nearest distance

表3 悬挂节点和邻近距离描述性统计信息

统计类型 悬挂节点数量差值 邻近距离/m
最大值 49.11% 187.81
最小值 0 0.000121
中位数 1.01% 2.97
平均值 7.97% 5.58
标准差 15.85% 10.20
样本总数/个 8 2358
精度/% 92.03 88.04
由于拓扑一致性是从整体角度进行的全局检查,因此只有一个结果。如表4所示,居住区道路与二级道路评估结果基本都在90%以上,说明在群组层面上,居住区道路形成的聚集数据集质量较高,这可能是由于相关贡献者对其交通线路虽没有精细的量算,但对其整体的结构有较为全面的把握。因此,尽管在单一要素层面上居住区的路网数据质量不高,但是更宏观层面上的聚集质量却有所提高;在大城市或城市等较大的城市居住区内,三级道路连接了当地的商店,学校或郊区,道路数据较少且使用频率可能较低,导致贡献者上传的数据的整体质量不高,平均长度相似性为最低的42.21%。
Tab. 4 Data quality evaluation results of group goals (%)

表4 群组目标的数据质量评价结果(%)

U2群组
目标
U21空间关系 U22几何特征 U23语义特征
U211拓扑一致性 U212方向相似度 U213距离相似度 U214位置相似度 U221长度相似性 U222平均长度相似性 U223曲折度相似度 U224密度相似度 U231文本相似度
居住区道路 90.04 94.35 63.38 94.33 99.18 89.61 99.16 98.97 98.54
二级街道 97.13 95.66 89.26 99.20 63.60 97.03 96.34 98.54
三级街道 67.18 89.80 94.16 88.69 42.21 84.18 84.10 87.00
整体 81.84 99.54 90.40 98.73 90.66 99.24 98.49 93.43

3.4 整体数据质量分析

根据上文赋权方法,OSM数据质量评价指标权重的计算结果如表5所示。利用上文中构建的多层次多粒度模糊综合评价模型,按极大隶属度原则,一级指标及部分二级指标的评估结果如表6所示。
Tab. 5 Weights

表5 权重

目标层Z 准则层Y 权重Wi 方案层 权重Wj 基础指标层 权重Wk
VGI数据质量评价 U1单一目标 0.5 U11完整性 0.1284 U111名称 0.3670
U112类型 0.3830
U113方位 0.2490
U12方向相似度 0.0775
U13曲折度 0.3102
U14方位精度 0.4839
U2群组目标 0.5 U21空间关系 0.6044 U211拓扑一致性 0.2820
U212方向相似度 0.0390
U213距离相似度 0.1250
U214位置相似度 0.2410
U22几何特征 0.3347 U221长度相似性 0.0686
U222平均长度相似性 0.0586
U223曲折度相似度 0.2113
U224密度相似度 0.0896
U23语义特征 0.0609 U231文本相似度 0.0361
Tab.6 The overall evaluation results of each level’s index

表6 各级指标的总体评价结果

指标 完整性 空间关系 几何特征 语义特征 单一目标 群组目标 整体目标
评估结果 一般 一般
表6所示,单一层次上的完整性为优。群组层次上的空间关系的质量为一般,几何特征和语义特征质量都为优,群组目标的总体质量为一般,可以看出空间关系权重较大,其质量可能影响群组层次的整体质量。由于单一目标、几何特征、语义特征和完整性等评价指标的质量都为优,并且占大多数,研究区OSM数据的整体质量结果也为优,表现出前后的一致性,符合客观事实,验证了该模型可以有效、客观地对OSM数据的各个层次进行评估。
类似地,用该方法也可以从不同道路等级角度得出各等级道路的质量评估结果(表7)。表7可以看出,二级道路的质量为优,三级道路与居住区道路质量较差,说明研究区OSM数据集中,高等级道路的完整度与精度较高。
综上,从单一到整体层次的数据质量均在一般以上:研究区单一层次与整体层次的数据质量为优,群组层次数据质量较差,表现为一般。基础数据的质量较好使得整体数据集的结构形态与权威数据较为接近。
Tab. 7 The overall evaluation results of each grade’s road

表7 各个等级道路的总体评价结果

指标 二级道路 三级道路 居住区道路
评估结果 一般

4 结论与讨论

本文引入空间相似性理论,设计质量评价指标与空间层次相结合的多粒度多层次OSM数据质量综合评价指标体系,构建多层次模糊综合评价模型,针对单一目标、群组目标以及整体目标,从宏观与微观相结合、全局与局部相结合的角度多维度多层次综合度量OSM数据质量,突破传统只考虑片面的评价指标或只考虑单一层次评估对象的局限性,使得评价指标更全面,评价结果更系统客观。实验结果表明了该方法的可行性与实用性,为基于VGI数据源实现相关行业应用提供实证依据和可靠的数据质量评估方法。
当然,如前所述,关于VGI数据质量评价方法中,对比参照数据法是运用最早,也是最成熟的评估方法,但是面临着权威数据不易获取的显著性问题,多尺度数据的一致性评估模型也亟待深入推动。限于时间与数据获取处理等原因,本文尚未与其他方法进行对比性实验,未选取国内外更多研究区进行模型的进一步推广验证,相关算子的估量方法有待进一步推敲;另外,更新速度快是自发式地理信息数据的一个重要特点,本文还没有建立对于时间精度有效的评估方法,这些都是下一步的重点研究方向。

The authors have declared that no competing interests exist.

[1]
Goodchild. Citizens as sensors: The world of volunteered geography[J]. GeoJournal, 2007,69(4):211-221.In recent months there has been an explosion of interest in using the Web to create, assemble, and disseminate geographic information provided voluntarily by individuals. Sites such as Wikimapia and OpenStreetMap are empowering citizens to create a global patchwork of geographic information, while Google Earth and other virtual globes are encouraging volunteers to develop interesting applications using their own data. I review this phenomenon, and examine associated issues: what drives people to do this, how accurate are the results, will they threaten individual privacy, and how can they augment more conventional sources? I compare this new phenomenon to more traditional citizen science and the role of the amateur in geographic observation.

DOI

[2]
Flanagin A J, Metzger M J.The credibility of volunteered geographic information[J]. GeoJournal, 2008,72(3-4):137-148.The proliferation of information sources as a result of networked computers and other interconnected devices has prompted significant changes in the amount, availability, and nature of geographic info

DOI

[3]
陈舒燕. 基于OpenStreetMap的出行可达性分析与实现[D].上海:上海师范大学,2010.

[ Chen S Y.A Web-based accessibility analysis service using OpenStreetMap data[D]. Shanghai: Shanghai Normal University, 2010. ]

[4]
Diaz L, Granell C, Could M, et al.Managing user-generated information in geospatial cyberinfrastructures[J]. Future Generation Computer Systems, 2011,27(3):304-314.Information systems built using standards-based distributed services have become the default computing paradigm adopted by the geospatial community for building information infrastructures also known as Spatial Data Infrastructures (SDIs). Government mandates such as the INSPIRE European Directive recommend standards for sharing resources (e.g., data and processes) with the goal of improving environmental (and related) decision making.Although SDIs present benefits to data providers in terms of data sharing and management, most geospatial infrastructures have been built following a top-down approach in which official providers (most commonly mapping agencies) are permitted to deploy and maintain resources. Because the mechanisms to deploy resources in these infrastructures are technologically complex, there has been limited participation from users, resulting in a scarcity of deployed resources.To address these limitations, we present a distributed architecture based on INSPIRE principles and extended with a Service Framework component. This component improves ad hoc integration and deployment of geospatial data resources within geospatial information infrastructures. The Service Framework addresses the need to improve the availability of geospatial data resources by providing mechanisms to assist users in wrapping resources to generate INSPIRE-based services.Research highlights? User-driven methodologies to maintain information infrastructures? Assist users in these steps during the resource life cycle? Concealing technology to integrate user content generating standard components? New middleware components in SOAs to help users to participate actively

DOI

[5]
田文文,朱欣焰,呙维.一种VGI矢量数据增量变化发现的多层次蔓延匹配算法[J].武汉大学学报·信息科学版,2014,39(8):963-968.ObjectiveVolunteered geographic information(VGI)contributed by Internet users is more and morewidely used as data updating source for industries such as navigation,and for disaster emergencies.This way of data acquisition is faster and cheaper than traditional surveying and mapping data.Howto detect and extract changed information in massive amounts of VGI data in a timely way is a problemto be solved.The high precision results of vector feature matching can help to find the changed fea-tures faster.VGI vector data has rich geometric and semantic information,traditional vector featurematching algorithm is not suitable for this purpose.In this paper,we proposed a multilevel spreadingalgorithm in vector feature matching,and applied the city road network as the research content,tocompare VGI vector data to the data from the professional surveying and mapping departments to real-ize the change detection in a road network.

DOI

[ Tian W W, Zhu X Y, Guo W.A VGI vector road data increment distinguishing research based on multilevel spreading algorithm[J]. Geomatics and Information Science of Wuhan University, 2014,39(8):963-968. ]

[6]
Zhou X, Zeng L, Jiang Y, et al.Dynamically Integrating OSM Data into a Borderland Database[J]. ISPRS International Journal of Geo-Information, 2015,4:1707-1728.Spatial data are fundamental for borderland analyses of geography, natural resources, demography, politics, economy, and culture. As the spatial data used in borderland research usually cover the borderland regions of several neighboring countries, it is difficult for anyone research institution of government to collect them. Volunteered Geographic Information (VGI) is a highly successful method for acquiring timely and detailed global spatial data at a very low cost. Therefore, VGI is a reasonable source of borderland spatial data. OpenStreetMap (OSM) is known as the most successful VGI resource. However, OSM's data model is far different from the traditional geographic information model. Thus, the OSM data must be converted in the scientist鈥檚 customized data model. Because the real world changes rapidly, the converted data must be updated incrementally. Therefore, this paper presents a method used to dynamically integrate OSM data into the borderland database. In this method, a basic transformation rule base is formed by comparing the OSM Map Feature description document and the destination model definitions. Using the basic rules, the main features can be automatically converted to the destination model. A human-computer interaction model transformation and a rule/automatic-remember mechanism are developed to interactively transfer the unusual features that cannot be transferred by the basic rules to the target model and to remember the reusable rules automatically. To keep the borderland database current, the global OsmChange daily diff file is used to extract the change-only information for the research region. To extract the changed objects in the region under study, the relationship between the changed object and the research region is analyzed considering the evolution of the involved objects. In addition, five rules are determined to select the objects and integrate the changed objects with multi-versions over time. The objects鈥 change-type evolution is analyzed, and seven rules are used to determine the change-type of the changed objects. Based on these rules and algorithms, we programmed an automatic (or semi-automatic) integrating and updating prototype system for the borderland database. The developed system was intensively tested using OSM data for Vietnam and Pakistan as the experimental data.

DOI

[7]
赵肄江,周晓光.地理信息志愿者信誉度评估的版本相似度模型-以面目标为例[J].测绘学报,2015,44(5):578-584.针对自发地理信息中存在大量恶意、虚假、低质量数据,提出了一种基于版本相似度的VGI志愿者信誉度计算模型。该模型将每个志愿者对某个地理空间目标的一次编辑结果定义为一个版本,当其他用户编辑该目标版本时,通过计算版本相似度来获得其他用户对该志愿者这个目标版本的支持度;然后通过计算其他贡献者对某志愿者所贡献的每个目标的支持度,对所有目标的支持度进行加权平均获得该志愿者的综合信誉度。其中版本相似度综合目标空间和属性相似性的主要因素进行加权计算。然后以面目标为例阐述了本文志愿者信誉度计算过程。为了验证本文信誉度计算模型的合理性,笔者采用德国柏林OpenStreetMap数据进行试验,试验表明通过本文模型计算获得的用户信誉度与其贡献的要素质量总体上正相关。

DOI

[ Zhao Y J, Zhou X G.Version simi larity-based model for volunteers’ reputation of volunteered geographic information: A case study of polygon[J]. Acta Geodaetica et Cartographica Sinica, 2015,44(5):578-584. ]

[8]
马超,孙群,徐青,等.自发地理信息可信度及其评价[J].地球信息科学学报,2016,18(10):1305-1311.由于自发地理信息数据主要来源于志愿者上传,不可避免地存在数据质量缺乏保障等问题,故限制了其广泛应用。针对自发地理信息数据质量未知、参考数据难以获取等问题,本文引入了数据可信度的概念,从区域内用户信誉度之和与数据变化趋势2个方面对自发地理信息的可信度进行评价,将定性分析结果进行量化表达。首先,利用李纳斯定理计算区域内用户的信誉度之和获取数据质量的相关信息,以志愿者上传数据中保留的点所占比重作为志愿者的信誉度,构建了基于点统计的志愿者信誉度模型。接着,从数据量变化的趋势中获取数据的质量信息,通过计算研究区域内数据量的变化程度进行数据变化趋势度量。最后,以北京等地区OpenStreetMap数据作为实验对象,验证了方法的有效性。实验结果表明,利用该方法所得出的实验结果与基于参考数据的质量评价结果总体上保持一致。

DOI

[ Ma C, Sun Q, Xu Q, et al.The credibility and evaluation of volunteered geographic information[J]. Journal of Geo-information Science, 2016,18(10):1305-1311. ]

[9]
Haklay M.How good is Open Street Map information? A comparative study of Open Street Map and Ordnance Survey datasets for London and the rest of England[J]. Under review in Environment & Planning B, 2008,37(4):682-703.Within the framework of Web 2.0 mapping applications, the most striking example of a geographical application is the OpenStreetMap (OSM) project. OSM aims to create a free digital map of the world and is implemented through the engagement of participants in a mode similar to software development in Open Source projects. The information is collected by many participants, collated on a central database, and distributed in multiple digital formats through the World Wide Web. This type of information was termed 鈥榁olunteered Geographical Information鈥 (VGI) by Goodchild, 2007. However, to date there has been no systematic analysis of the quality of VGI. This study aims to fill this gap by analysing OSM information. The examination focuses on analysis of its quality through a comparison with Ordnance Survey (OS) datasets. The analysis focuses on London and England, since OSM started in London in August 2004 and therefore the study of these geographies provides the best understanding of the achievements and difficulties of VGI. The analysis shows that OSM information can be fairly accurate: on average within about 6 m of the position recorded by the OS, and with approximately 80% overlap of motorway objects between the two datasets. In the space of four years, OSM has captured about 29% of the area of England, of which approximately 24% are digitised lines without a complete set of attributes. The paper concludes with a discussion of the implications of the findings to the study of VGI as well as suggesting future research directions.

DOI

[10]
Ather A.A quality analysis of openstreetmap data[D]. London: University College London, 2009.

[11]
Zielstra D, Zipf A.A comparative study of proprietary geodata and volunteered geographic information for germany[A]. In Proceedings of the 13th AGILE International Conference on Geographic Information Science[C]. Guimaraes: Agile International Conference on Geographic Information Science, 2010.

[12]
Girres J, Touya G.Quality assessment of the French OpenStreetMap dataset[J]. Transactions in GIS, 2010,14(4):435-459.The concept of Volunteered Geographic Information (VGI) has recently emerged from the new Web 2.0 technologies. The OpenStreetMap project is currently the most significant example of a system based on VGI. It aims at producing free vector geographic databases using contributions from Internet users. Spatial data quality becomes a key consideration in this context of freely downloadable geographic databases. This article studies the quality of French OpenStreetMap data. It extends the work of Haklay to France, provides a larger set of spatial data quality element assessments (i.e. geometric, attribute, semantic and temporal accuracy, logical consistency, completeness, lineage, and usage), and uses different methods of quality control. The outcome of the study raises questions such as the heterogeneity of processes, scales of production, and the compliance to standardized and accepted specifications. In order to improve data quality, a balance has to be struck between the contributors' freedom and their respect of specifications. The development of appropriate solutions to provide this balance is an important research issue in the domain of user-generated content.

DOI

[13]
Siebritz. Assessing the accuracy of open street map data in south africa for the purpose of integrating it with authoritative data[D]. Cape Town: Department of Architecture, Planning and Geomatics University of Cape Town, 2014.

[14]
王明,李清泉,胡庆武等.面向众源开放街道地图空间数据的质量评价方法[J].武汉大学学报·信息科学版,2013,38(12):1490-1494.为了解决来自非专业用户协同编辑的众源地理空间数据质量问题,提出了一种众源地理空间数据质量评价技术框架。针对众源开放街道地图(open street map,OSM)数据特点,选取数据完整性、属性信息准确性和定位精度三方面质量要素,提出了面向众源开放街道地图(OSM)空间数据的质量模型和计算方法。

[ Wang M, Li Q Q, Hu Q W.Quality analysis on crowd sourcing geographic data with open street map data[J]. Geomatics and Information Science of Wuhan University, 2013,38(12):1490-1494. ]

[15]
Zheng S, Zheng J.Assessing the completeness and positional accuracy of OpenStreetMap in China[M].// Thematic Cartography for the Society. Berlin: Springer International Publishing, 2014.

[16]
范博文. 众源地理数据质量研究[D].云南:云南大学,2015.

[ Fan B W.The study on data quality of the openstreetMap dataset[D]. Yunnan: Yunnan University, 2015. ]

[17]
马超,孙群,徐青.一种基于参考数据的志愿者地理信息质量评价方法[J].测绘与空间地理信息,2017(3):1-5.

[ Ma C, Sun Q, Xu Q.An approach for volunteered geographic information quality evaluation based on reference data[J]. Geomatics & Spatial Information Technology, 2017,3:1-5. ]

[18]
Forghani M, Delavar M R.A quality study of the OpenStreetMap dataset for tehran[J]. ISPRS International Journal of Geo-Information, 2014,3(2):750-763.There has been enormous progress in geospatial data acquisition in the last decade. Centralized data collection, mainly by land surveying offices and local government agencies, has changed dramatically to voluntary data provision by citizens. Among a broad list of initiatives dealing with user generated geospatial information, OpenStreetMap (OSM) is one of the most famous crowd-sourced products. It is believed that the quality of collected information remains a valid concern. Therefore, qualitative assessment of OSM data as the most significant instance of volunteered geospatial information (VGI) is a considerable issue in the geospatial information community. One aspect of VGI quality assessment pertains to its comparison with institutionally referenced geospatial databases. This paper proposes a new quality metric for assessment of VGI accuracy and as well as for quality analysis of OSM dataset by evaluating its consistency with that of a reference map produced by Municipality of Tehran, Iran. A gridded map is employed and heuristic metrics such as Minimum Bounding Geometry area and directional distribution (Standard Deviational Ellipse), evaluated for both VGI and referenced data, are separately compared in each grid. Finally, in order to have a specific output as an integrated quality metric for VGI, its consistency with ground-truth data is evaluated using fuzzy logic. The results of this research verify that the quality of OSM maps in the study area is fairly good, although the spatial distribution of uncertainty in VGI varies throughout the dataset.

DOI

[19]
韩利,梅强,陆玉梅,等.AHP-模糊综合评价方法的分析与研究[J].中国安全科学学报,2004,14(7):89-92,3.系统安全评价是保证生产系统安全生产的基础.笔者在简要分析层次分析(AHP)与模糊综合评价两种方法的特点的基础上,结合这两种方法的优点,提出了多层次的AHP-模糊综合评价法,并应用于企业作实证分析.结果表明:该方法具有这两种方法的优点,能够较好地保证评价结果的客观性.

DOI

[ Han L, Mei Q, Lu Y M, et al.Analysis and study on ahp-Fuzzy comprehensive evaluation[J]. China Safety Science Journal, 2004,14(7):89-92,93. ]

[20]
胡圣武,李长春,王新洲,等.基于多层次模糊综合评判的GIS质量综合评价[J].长江科学院院报,2005,22(3):21-24. 针对GIS质量综合评价在对模糊不确定性引起的质量因素进行评价方面的不足,采用模糊数学中的多层次模糊综合评判原理对GIS质量进行评价。结果表明,模糊综合评价方法不仅能够比较全面地考虑各种因素的影响及其相互作用,实现对GIS质量的合理、定量分析,并能在一定程度上反映出影响GIS质量的关键因素,为进一步提高GIS质量提供决策依据,而且该方法使用简单,且结果具有科学性和合理性。

[ Hu S W, Li C C, Wang X Z.Synthesis evaluation on GIS quality based on multilevel fuzzy synthesis judgment[J]. Journal of Yangtze River Scientific Research Institute, 2005,22(3):21-24. ]

[21]
季佳佳,赵冬玲,杨建宇,等.基于多层次模糊综合评判法的土地变更调查数据质量评价研究[J].中国土地科学,2015,29(4):90-96.

[ Li J J, Zhao D L, Yang J Y.Quality assessment of land changing investigation data based on multi-level fuzzy comprehensive evaluation method[J]. China Land Science, 2015,29(4):90-96. ]

[22]
Zhang Q, Zhong M.Using multi-level fuzzy comprehensive evaluation to assess reservoir induced seismic risk[J]. Journal of Computers, 2011,6(8):1670-1676.Reservoir-induced seismicity is a very important issuein the study of geological analysis and eco-environmentalimpact assessment in hydraulic and hydro-power engineering.On the other hand, reservoir-induced seismicity is a necessaryconsideration in the feasibility study of hydropower project.Due to the complexity in the process of reservoir-inducedearthquake and the uncertainty of the influencing factor, therisk assessment can be viewed as a multiple-attribute decisionprocess. Therefore, this paper aims to provide a forecastingapproach towards reservoir induced seismicity, in which twophase procedures are proposed. The first stage utilizes analytichierarchy process (AHP) to obtain the weights of influencingfactors, in the second stage fuzzy comprehensive evaluation(FCE) is applied to determine the dangerous class which areservoir belongs to. This study establishes a hierarchicalmodel in reservoir-induced seismicity risk assessment, realizesthe transformation from qualitative analysis to quantitativeanalysis. In addition, a case study is also presented to make thisapplication more understandable. It shows that the multi-levelfuzzy comprehensive evaluation is very effective in thereservoir induced seismicity risk assessment.

DOI

[23]
Holt A.Spatial similarity and GIS: The grouping of spatial kinds[J]. Dunedin: University of Otago, 1999: 241-250.ABSTRACT This paper outlines the general concept of similarity. The background on the research undertaken on similarity is detailed and its application in GIS is discussed. This is an introductory paper to spatial similarity and more detailed concepts such as context and similarity measures can be found in other articles by the author. The example given in this paper is called Huntervale and is a property application. The example aims to highlight the influence of spatial attributes on similarity.

[24]
Zhang J C, Wang Y H, Wen J Z.An improved probabilistic relaxation method for matching multi-scale road networks[J]. International Journal of Digital Earth. DOI: 10.1080/17538947.2017.1341557.react-text: 374 The paper presents the dynamic change of wetland landscape pattern from 2002 to 2009 using RS and GIS technology along the lower Yellow River. Results show that: (1) the total area of wetland reduces obviously. (2) Disturbed by human activity, landscape diversity index ascends. (3) The total area of the rice wetland and mud flat decreases while the other area increases. /react-text react-text: 375 /react-text

DOI

[25]
李媛媛,王俊超,徐立,等.几何地理要素的相似性度量方法研究[J].测绘与空间地理信息,2014(3):31-34.几何地理数据相似性是地理数据匹配处理的基础,决定着地理数据匹配结果的成功率和准确率。本文分别从点、线、面3个角度对几何地理数据的相似性进行深入分析,通过对点、线、面三种地理要素特点的深入研究,给出了几何地理数据的相似性算法和度量模型。通过实验,初步验证了所提算法的可行性,为地理数据的相似性匹配研究奠定了基础。

DOI

[ Li Y Y, Wang J C, Xu L, et al.Geometric similarity measure of geographical elements method research[J]. Geomatics & Spatial Information Technology, 2014,3:31-34. ]

[26]
刘晓平,吴磊.简单多边形方向及顶点凹凸性的快速判定[J].工程学图图报,2005,26(4):124-129.

[ Liu X P, Wu L.A rapid identification for the orientation and vertices convexity-Concavity of simple polygon[J]. Journal of Graphics, 2005,26(4):124-129. ]

[27]
李红梅,翟亮,朱熀.基于本体的地理空间实体类型语义相似度计算模型的研究[J].测绘科学,2009,34(2):12-14.地理空间实体类型语义相似度对于类型数据库综合具有重要理论意义。本文以本体作为揭示实体深层次语义信息的方法论,提出了符合认知特性的地理空间实体类型语义相似度计算模型,并通过计算土地利用类型语义相似度对模型进行了验证.

DOI

[ Li H M, Zhai L, Zhu. Semantic similarities calculative modeling for geospatial entity classes based on ontology[J]. Science of Surveying and Mapping, 2009,34(2):12-14. ]

[28]
陈伟,夏建华.综合主、客观权重信息的最优组合赋权方法[J].数学的实践与认识,2007,37(1):17-22.首先构造了一种多属性决策主观权重确定的偏好比率法,介绍了属性客观权重确定的熵值法,提出了一种基于离差平方和的最优组合赋权方法,并给出了具体算例.通过提出的方法可以将多属性决策问题中主、客观权重的信息进行有效地综合.

DOI

[ Chen L, Xia J H.An optimal weights combination method considering both subjective and objective weight information[J]. Mathematics in Practice and Theory, 2007,37(1):17-22. ]

Outlines

/