地球信息科学学报 ›› 2018, Vol. 20 ›› Issue (1): 37-47.doi: 10.12082/dqxxkx.2018.170323
收稿日期:
2017-07-11
修回日期:
2017-08-06
出版日期:
2018-01-20
发布日期:
2018-01-20
通讯作者:
杨雅萍
E-mail:czgbjy@year.net;yangyp@igsnrr.ac.cn
作者简介:
作者简介:陈祖刚(1989- ),男,河南信阳人,博士生,主要从事地学数据挖掘研究,E-mail:
基金资助:
Received:
2017-07-11
Revised:
2017-08-06
Online:
2018-01-20
Published:
2018-01-20
Contact:
YANG Yaping
E-mail:czgbjy@year.net;yangyp@igsnrr.ac.cn
Supported by:
摘要:
传统的地理实体空间相关度算法存在适应的实体和拓扑关系类型较少、没有考虑空间尺度依赖性而导致数据区分能力差的问题。本研究提出一种能依据指定的空间尺度(本文所指“空间尺度”是指定的地理空间范围),计算出相应的地理实体空间相关度的算法。该算法以地理学第一定律和Egenhofer关于空间相关度的论述为理论依据,分析点、线、面实体的拓扑关系和度量关系而建立不同的相关度计算公式。通过对比分析,本算法不仅能计算出不同类型和不同拓扑关系下的地理实体间相关度,而且计算结果随着空间尺度的变化而改变,与人类通常的认知相符合。最后,以地理空间数据检索为例,介绍了本算法的应用。与传统的关键词匹配检索方法相比,应用本算法能提高数据检索的F1-measure值,并且能对文档按照与检索词的相关度进行排序。本算法可应用于地理信息检索、数据发现、数据推荐和关联数据等领域。
陈祖刚, 杨雅萍. 耦合尺度的地理实体空间相关度算法的建立与应用[J]. 地球信息科学学报, 2018, 20(1): 37-47.DOI:10.12082/dqxxkx.2018.170323
CHEN Zugang,YANG Yaping. A Case of Establishment and Application of Spatial Correlation Degree Algorithm for Geographic Entities Coupling Scales[J]. Journal of Geo-information Science, 2018, 20(1): 37-47.DOI:10.12082/dqxxkx.2018.170323
表3
不同尺度上空间相关度对比表"
实体一 | 实体二 | 类型 | 拓扑关系 | 相关度 (全国尺度) | 相关度 (区域尺度) | 相关度 (传统算法) |
---|---|---|---|---|---|---|
漯河南街村 | 漯河南街村 | 点-点 | 相等 | 1.000 | 1.000 | 1.000 |
河南特色小镇(2016) | 许昌神垕镇 | 多点-点 | 包含/被包含 | 0.749 | 0.744 | * |
河南十佳美丽乡村(2014) | 河南特色小镇(2016) | 多点-多点 | 重叠 | 0.533 | 0.531 | * |
焦作陈家沟村 | 信阳郝堂村 | 点-点 | 相离 | 0.311 | 0.134 | 9.760×10-7 |
开封杜良收费站 | G220(河南) | 点-线 | 包含/被包含 | 0.659 | 0.617 | 1.000 |
封丘县赵寨村村道 | 封丘县赵寨村 | 点-线 | 相接 | 0.499 | 0.496 | * |
郑州西泰山村 | 封丘县赵寨村村道 | 点-线 | 相离 | 0.327 | 0.284 | 3.965×10-6 |
南阳化山村 | 河南省南阳市 | 点-面 | 包含/被包含 | 0.664 | 0.624 | 0.667 |
新乡市封丘县 | 封丘县东柳园村 | 点-面 | 相接 | 0.499 | 0.494 | * |
漯河南街村 | 河南省许昌市 | 点-面 | 相离 | 0.330 | 0.308 | 2.650×10-5 |
东郑线 | 东郑线 | 线-线 | 相等 | 1.000 | 1.000 | 1.000 |
G220(河南) | 东郑线 | 线-线 | 包含/被包含 | 0.721 | 0.707 | 0.528 |
023乡道 | 齐边线 | 线-线 | 重叠 | 0.50209 | 0.50208 | 0.502 |
G220(河南) | G310(河南) | 线-线 | 相接 | 0.411 | 0.383 | 0.333 |
S32 | G45(河南段) | 线-线 | 相交 | 0.411 | 0.387 | * |
G220(河南) | S32 | 线-线 | 相离 | 0.328 | 0.292 | 4.840×10-6 |
齐边线 | 县级开封市 | 线-面 | 包含/被包含 | 0.50175 | 0.50174 | 0.670 |
G220(河南) | 河南省开封市 | 线-面 | 相交 | 0.357 | 0.356 | 0.385 |
开柳公路 | 县级开封市 | 线-面 | 相接 | 0.333 | 0.328 | 0.333 |
河南省漯河市 | G220(河南) | 线-面 | 相离 | 0.163 | 0.133 | 4.099×10-6 |
郑州大都市区 | 郑州大都市区 | 面-面 | 相等 | 1.000 | 1.000 | 1.000 |
河南省郑州市 | 郑州市中牟县 | 面-面 | 包含/被包含 | 0.728 | 0.723 | 0.531 |
郑州大都市区 | 郑洛新自主创新示范区 | 面-面 | 重叠 | 0.553 | 0.548 | 0.600 |
河南省洛阳市 | 河南省郑州市 | 面-面 | 相接 | 0.495 | 0.461 | 0.357 |
河南省洛阳市 | 河南省漯河市 | 面-面 | 相离 | 0.320 | 0.221 | 3.470×10-6 |
河南省洛阳市 | 河南省信阳市 | 面-面 | 相离 | 0.310 | 0.122 | 1.810×10-6 |
表5
本研究提出算法检索结果"
数据名称 | 匹配度 |
---|---|
上海市1:10万土地利用数据(2008年) | 1.000 |
上海市1:10万土地利用数据(1980s) | 1.000 |
上海市1:10万土地利用数据(1995年) | 1.000 |
长三角1:10万土地利用数据(2005年) | 0.892 |
长三角地区1980s、1995年、2000年1:25万土地利用数据集 | 0.892 |
中国分省土地利用面积数据(1980s、1995年、2005年) | 0.889 |
中国1:100万土地利用区划(1996年) | 0.889 |
中国地区土地利用/土地覆盖数据集 | 0.889 |
中国1 km网格土地利用数据(1980s、1995年、2000年) | 0.889 |
[1] | Hill L L.Access to Geographic concepts in online bibliorgraphic files: Effectiveness of current practices and the potential of a graphic interface[D]. Pittsburgh: University of Pittsburgh, 1990. |
[2] | 李霖,应申.空间尺度基础性问题研究[J].武汉大学学报·信息科学版,2005,30(3):199-203. |
[ Li L, Ying S.Fundamental problems on spatial scales[J]. Geomatics and Information Science of Wuhan University, 2005,30(3):199-203. ] | |
[3] |
Robinson W S.Ecological correlations and the behavior of individuals[J]. International Journal of Epidemiology, 2011,40(4):351-357.
doi: 10.1093/ije/dyn357 pmid: 19179346 |
[4] | Openshaw S, Taylor P J.A million or so correlation coefficients: Three experiments on the modifiable areal unit problem[M]. London: Pion, 1979:127-144. |
[5] |
Goodchild M F.The Aggregation Problem in Location-Allocation[J]. Geographical Analysis, 1979,11(3):240-255.
doi: 10.1111/j.1538-4632.1979.tb00692.x |
[6] | Dudley G.Modifiable areal units and human geographical inquiry: An empitical investigation, in Department of Geography[D]. Ontario: University of Waterloo, 1991. |
[7] |
Marceau D J, Howarth P J, Gratton D J.Remote sensing and the measurement of geographical entities in a forested environment: The scale and spatial aggregation problem[J]. Remote Sensing of Environment, 1994,49(2):93-104.
doi: 10.1016/0034-4257(94)90046-9 |
[8] | Tversky A.Features of similarity[J]. Psychological Review, 1977,84(4):290-302. |
[9] |
Medin D L, Goldstone R L, Gentner D.Respects for Similarity[J]. Psychological Review, 1993,100(2):254-278.
doi: 10.1037/0033-295X.100.2.254 |
[10] |
Rodriguez M A, Egenhofer M J.Determining semantic similarity among entity classes from different ontologies[J]. IEEE Transactions on Knowledge and Data Engineering, 2003,15(2):442-456.
doi: 10.1109/TKDE.2003.1185844 |
[11] |
Rodriguez M A, Egenhofer M J.Comparing geospatial entity classes: an asymmetric and context-dependent similarity measure[J]. International Journal of Geographical Information Science, 2004,18(3):229-256.
doi: 10.1080/13658810310001629592 |
[12] |
Egenhofer M J, Franzosa R D.Point-set topological spatial relations[J]. International Journal of Geographical Information Systems, 1991,5(2):161-174.
doi: 10.1080/02693799108927841 |
[13] |
Walker D R F, Newman I A, Medyckyj-Scott D J, et al. A system for identifying datasets for GIS users[J]. International Journal of Geographical Information Systems, 1992,6(6):511-527.
doi: 10.1080/02693799208901932 |
[14] | Janée G, Frew J. Spatial Search, Ranking, and Interoperability[C]. Workshop on Geographic Information Retrieval, 2004. |
[15] |
Beard K, Sharma V.Multidimensional ranking for data in digital spatial libraries[J]. International Journal on Digital Libraries, 1997,1(2):153-160.
doi: 10.1007/s007990050011 |
[16] |
Li B, Fonseca F.TDD-A comprehensive model for qualitative spatial similarity assessment[J]. Spatial Cognition and Computation, 2006,6(1):31-62.
doi: 10.1207/s15427633scc0601_2 |
[17] | Frontiera P L.A probabilistic approach to spatial ranking for geographic information retrieval[D]. Berkeley: University of California, 2004. |
[18] | 刘家骏,李浩然,钟翔,等.地理信息检索中空间相似性度量的一种模糊方法[J].地理与地理信息科学,2015,31(4):38-42. |
[ Liu J J, Li H R, Zhong X, et al.A fuzzy method to measure spatial similarity in geographic information retrieval[J]. Geography and Geo-Information Science, 2015,31(4):38-42. ] | |
[19] | 赵红伟,诸云强,杨宏伟,等.地理空间数据本质特征语义相关度计算模型[J].地理研究,2016,35(1):58-70. |
[ Zhao H W, Zhu Y Q, Yang H W, et al.The computation model of semantic relevancy on essential features of geospatial data[J]. Geographical Research, 2016,35(1):58-70. ] | |
[20] |
李红梅,翟亮,朱熀.基于本体的地理空间实体类型语义相似度计算模型的研究[J].测绘科学,2009,34(2):12-14.
doi: 10.3771/j.issn.1009-2307.2009.02.003 |
[ Li H M, Zhai L, Zhu H.A study on calculative modeling of semantic similarities for geospatial entity classes based on ontology[J]. Science of Surveying and Mapping, 2009,34(2):12-14. ]
doi: 10.3771/j.issn.1009-2307.2009.02.003 |
|
[21] |
杨娜娜,张青年,牛继强.基于本体结构的空间实体语义相似度计算模型[J].测绘科学,2015,40(3):107-111.
doi: 10.16251/j.cnki.1009-2307.2015.03.022 |
[ Yang N N, Zhang Q N, Niu J Q.Computational model of geospatial semantic similarity based on ontology structure[J]. Science of Surveying and Mapping, 2015,40(3):107-111. ]
doi: 10.16251/j.cnki.1009-2307.2015.03.022 |
|
[22] | Janowicz K.Towards a Similarity-Based Identity Assumption Service for Historical Places[C]. The 4th International Conference on Geographic Information Science (GIScience), 2006. |
[23] | Janowicz K.Sim-DL: Towards a semantic similarity measurement theory for the description logic ALCNR in geographic information retrieval[C]. The 2nd international workshop on semantic-based geographical information systems (SeBGIS06), 2006. |
[24] | Bruns H T, Egenhofer M J.Similarity of spatial scenes[C]. Seventh International Symposium on Spatial Data Handling, 1996. |
[25] |
Clementini E, Felice P D.A Model for Representing Topological Relationships between Complex Geometric Features in Spatial Databases[J]. Information Sciences, 1996,90:121-136.
doi: 10.1016/0020-0255(95)00289-8 |
[26] |
Frontiera P, Larson R, Radke J.A comparison of geometric approaches to assessing spatial similarity for GIR[J]. International Journal of Geographical Information Science, 2008,22(3):337-360.
doi: 10.1080/13658810701626293 |
[27] |
TOBLER W R.A computer movie simulating urban growth in the detroit region[J]. Economic Geography, 1970,46:234-240.
doi: 10.2307/143141 |
[28] | Egenhofer M J, Herring J R.Categorizing binary topological relations between regions, lines, and points in geographic databases[J]. Statistics and Information Forum, 1990. |
[29] |
赵红伟,诸云强,侯志伟,等.地理空间元数据关联网络的构建[J].地理科学,2016,36(8):1180-1189.
doi: 10.13249/j.cnki.sgs.2016.08.008 |
[ Zhao H W, Zhu Y Q, Hou Z W, et al.Construction of geospatial metadata association network[J]. Scientia Geographica Sinica, 2016,36(8):1180-1189. ]
doi: 10.13249/j.cnki.sgs.2016.08.008 |
|
[30] | 黄茂军. 地理本体的形式化表达机制及其在地图服务中的应用研究[D].武汉:武汉大学,2005. |
[ Huang M J.Study on formal representation of geographic ontology and its application in map services[D]. WuHan: Wuhan University, 2005. ] | |
[31] | Randell D A, Cui Z, Cohn A G.A spatial logic based on regions and connection[C]. The 3rd International Conference on Knowledge Representation and Reasoning, 1992. |
[32] | Egenhofer M J.A Formal Definition of Binary Topological Relationships[C]. Foundations of Data Organization and Algorithms 3rd International Conference, 1989. |
[33] |
Clark B L.Individuals and Points[J]. Notre Dame Journal of Formal Logic, 1985,26(1):61-75.
doi: 10.1305/ndjfl/1093870761 |
[34] |
马蔚纯,赵海君,李莉,等.区域规划环境评价的空间尺度效应——对上海高桥镇和浦东新区的案例研究[J].地理科学进展,2015,34(6):739-748.
doi: 10.18306/dlkxjz.2015.06.009 |
[ Ma W C, Zhao H J, Li L, et al.Spatial scale effects of environmental impact assessment of regional planning: The Gaoqiao Town and Pudong New District cases in Shanghai, China[J]. Progress in Geography, 2015,34(6):739-748. ]
doi: 10.18306/dlkxjz.2015.06.009 |
|
[35] |
Saaty L T.How to make a decision: The analytic hierarchy process[J]. European Journal of Operational Research, 1990,48(1):9-26.
doi: 10.1016/0377-2217(90)90057-I |
[1] | 李锐, 石佳豪, 董广胜, 刘朝辉. 多粒度时空对象组成结构表达研究[J]. 地球信息科学学报, 2021, 23(1): 113-123. |
[2] | 刘俊楠, 刘海砚, 陈晓慧, 郭漩, 郭文月, 朱新铭, 赵清波. 面向多源地理空间数据的知识图谱构建[J]. 地球信息科学学报, 2020, 22(7): 1476-1486. |
[3] | 孙思奥,任宇飞,张蔷. 多尺度视角下的青藏高原水资源短缺估算及空间格局[J]. 地球信息科学学报, 2019, 21(9): 1308-1317. |
[4] | 高嘉良,余丽,仇培元,陆锋. 基于通用知识库的地理实体开放关系过滤方法[J]. 地球信息科学学报, 2019, 21(9): 1392-1401. |
[5] | 洪必文, 曹青, 张翎, 龙毅, 寇萱. 基于自然语言形态描述的地理实体模拟表达方法[J]. 地球信息科学学报, 2019, 21(10): 1491-1501. |
[6] | 王姬卜, 陆锋, 吴升, 余丽. 基于自动回标的地理实体关系语料库构建方法[J]. 地球信息科学学报, 2018, 20(7): 871-879. |
[7] | 曹青, 洪必文, 张翎, 阮陵, 龙毅. 基于自然语言空间关系描述的地图近似表达方法[J]. 地球信息科学学报, 2018, 20(11): 1541-1549. |
[8] | 于天星, 李锐, 吴华意. 面向对象的地理实体时空位置多粒度表达[J]. 地球信息科学学报, 2017, 19(9): 1208-1216. |
[9] | 卫春阳, 徐丹丹, 董凯凯, 刘兆礼. 遥感影像空间格局变异函数分析研究进展[J]. 地球信息科学学报, 2017, 19(4): 540-548. |
[10] | 孙凯, 诸云强, 潘鹏, 罗侃, 王东旭, 侯志伟. 形态本体及其在地理空间数据发现中的应用研究[J]. 地球信息科学学报, 2016, 18(8): 1011-1021. |
[11] | 钟翔, 高勇, 邬伦. 基于链接分析的网页文本核心地名提取方法[J]. 地球信息科学学报, 2016, 18(4): 435-442. |
[12] | 余丽, 陆锋, 刘希亮, 程诗奋, 张雪英. 稀疏地理实体关系的关键词提取方法[J]. 地球信息科学学报, 2016, 18(11): 1465-1475. |
[13] | 高永刚, 徐涵秋. 基于最大公约数的遥感影像空间尺度转换算法[J]. 地球信息科学学报, 2015, 17(12): 1520-1528. |
[14] | 周静, 张书亮, 张小波. 顾及地理实体的地名信息检索方法研究[J]. 地球信息科学学报, 2015, 17(11): 1362-1369. |
[15] | 叶娟娟, 杨昕, 熊礼阳, 严艳梓, 王婷婷. 南京市老城区城市建筑点格局研究[J]. 地球信息科学学报, 2015, 17(11): 1404-1411. |
|