地球信息科学学报 ›› 2018, Vol. 20 ›› Issue (6): 744-752.doi: 10.12082/dqxxkx.2018.180113
• 2017年中国地理信息科学理论与方法学术年会优秀论文专辑 • 上一篇 下一篇
杨杰1,2(), 诸云强1,3,4,*(
), 宋佳1,3, 陆锋1, 孙凯1,2, 李威蓉5
收稿日期:
2018-02-23
修回日期:
2018-04-18
出版日期:
2018-06-20
发布日期:
2018-06-20
作者简介:
作者简介:杨 杰(1990-),男,湖南凤凰人,硕士生,研究方向为地理空间模型自动数据匹配和地学数据共享。 E-mail:
基金资助:
YANG Jie1,2(), ZHU Yunqiang1,3,4,*(
), SONG Jia1,3, LU Feng1, SUN Kai1,2, LI Weirong5
Received:
2018-02-23
Revised:
2018-04-18
Online:
2018-06-20
Published:
2018-06-20
Contact:
ZHU Yunqiang
Supported by:
摘要:
随着现代地学研究的深入与交叉融合,地理空间模型变得日益复杂,需要的输入数据也越来越多。为了快速、高效准备输入数据,一种有效的方法就是为模型自动匹配网络上已经共享的数据。在此背景下,本文针对不完全匹配数据需要自动转换处理的需求,开展了匹配结果精准表达方法研究。首先分析了自动数据匹配流程,在此基础上,提出了匹配结果精准表达结构及其形式化方法。匹配结果包含数据内容、空间和时间3个本质特征项,以及数据类型、格式和结构等形态特征项,每个特征项通过基于XML的相似度、匹配关系、匹配范围分别对共享数据与模型输入数据是否一致、差异在哪、差异有多大等问题进行精准的形式化表达。如果某一数据特征项相似度为1或本质特征项相似度为0时,意味着该特征项完全满足或完全不满足模型的需求,则没有必要进一步精准表达匹配结果;否则需要按上述方法对该数据特征项的匹配结果进行精准的形式化表达。湖南省2010年土壤生产潜力计算实践表明,本文方法可以为后继数据处理服务的自动组合及其数据的自动处理,以及最终向模型推荐完全符合需求的数据奠定基础。
杨杰, 诸云强, 宋佳, 陆锋, 孙凯, 李威蓉. 地理空间模型自动数据匹配结果精准表达方法[J]. 地球信息科学学报, 2018, 20(6): 744-752.DOI:10.12082/dqxxkx.2018.180113
YANG Jie,ZHU Yunqiang,SONG Jia,LU Feng,SUN Kai,LI Weirong. A Precise Description Approach on the Result of Automatic Data Matching for Geo-spatial Model[J]. Journal of Geo-information Science, 2018, 20(6): 744-752.DOI:10.12082/dqxxkx.2018.180113
表1
各特征项数据匹配结果精准表达
匹配特征项 | 匹配关系 | 匹配范围 | 相似度 | 备注说明 | ||
---|---|---|---|---|---|---|
内容 | 内容概念 | 内容概念 | 相同 | 不记录 | Si=1 | |
上位概念 | TD概念属性项 | 0<Si<1 | ||||
下位概念 | SD概念属性项 | |||||
交叉概念 | 交叉部分概念属性项 | |||||
完全不同 | 不记录 | Si =0, St=0 | 当属性值不存在分类体系时,不考虑此匹配项 | |||
内容语义 | 分类体系 (可选) | 一致 | 不记录 | Si =1 | ||
不一致 | SD、TD分类标准代码 | 0<Si<1 | ||||
数值单位 (可选) | 一致 | 不记录 | Si =1 | 当属性值无量纲时,不考虑此匹配项 | ||
不一致 | SD、TD数值单位 | 0<Si<1 | ||||
空间 | 空间范围 | 空间拓扑 | 相同 | 不记录 | Si =1 | |
包含 | TD空间范围 | 0<Si<1 | 采用坐标或TD要求的行政区粒度进行对空间范围表达 | |||
被包含 | SD空间范围 | |||||
相交 | 相交部分空间范围 | |||||
相邻 | 不记录 | Si =0, St=0 | ||||
相离 | 不记录 | Si =0, St=0 | ||||
空间尺度 | 比例尺/分辨率 | 一致 | 不记录 | Si =1 | 矢量数据记录比例尺分母,栅格数据记录分辨率。通过空间降或升尺度实现数据的转换 | |
高精度 | SD、TD比例尺分母或分辨率 | 0<Si<1 | ||||
低精度 | ||||||
空间基准 | 投影 (可选) | 一致 | 不记录 | Si =1 | 当空间数据是球面坐标系时,不考虑投影匹配项 | |
不一致 | SD、TD投影名称及参数 | 0<Si<1 | ||||
坐标系 | 一致 | 不记录 | Si =1 | |||
不一致 | SD、TD坐标系名称及参数 | 0<Si<1 | ||||
时间 | 时间范围 | 时间拓扑 | 相同 | 不记录 | Si =1 | |
包含 | TD时间范围 | 0<Si<1 | 以TD要求的时间分辨率记录时间范围 | |||
被包含 | SD时间范围 | |||||
相交 | 相交部分时间范围 | |||||
邻近 | 不记录 | Si =0, St=0 | ||||
相离 | 不记录 | Si =0, St=0 | ||||
时间尺度 | 时间尺度 | 一致 | 不记录 | Si =1 | ||
粗粒度 | SD、TD时间尺度 | 0<Si<1 | 通过时间降或升尺度实现数据的转换 | |||
细粒度 | ||||||
形态 | 数据类型 | 数据类型 | 相同类型 | 不记录 | Si =1 | |
不同类型 | 0<Si<1 | |||||
数据格式 | 数据格式 | 相同格式 | 不记录 | Si =1 | ||
同家族格式 | SD、TD数据格式及版本 | 0<Si<1 | 同家族格式是指同厂商的格式,转换相对容易,如ArcGIS家族格式 | |||
不同格式 | ||||||
数据结构 (可选) | 数据结构 (可选) | 相同结构 | 不记录 | Si =1 | 当SD、TD的数据格式不是标准格式或者不公开,或是过于灵活(如TXT),则需要进一步描述数据结构 |
表2
目标输入数据与共享源数据特征描述
特征项 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
数据 | 内容 | 空间 | 时间 | 形态 | ||||||
内容概念 | 内容语义 | 空间范围 | 空间尺度 | 空间基准 | 时间范围 | 时间尺度 | 数据类型 | 数据格式 | 数据结构 | |
模型应用需要的输入数据 | ||||||||||
年均降雨量(TD1) | 降雨量 | 数值单位:mm | 湖南省 | 1 km | WGS84坐标系,Albers投影 | 2010年 | 年平均 | 栅格 | Geotiff | - |
Geodata.CN共享数据 | ||||||||||
中国1 km栅格逐年平均降雨数据(SD11) | 降雨量 | 数值单位:mm | 中国 | 1 km | WGS84坐标系,Albers投影 | 2000-2010年 | 年平均 | 栅格 | Geotiff | - |
中国多年500 m分辨率平均降雨分布图(SD12) | 降雨量 | 数值单位:mm | 中国 | 500 m | WGS84坐标系,Albers投影 | 建站-1996年 | 多年 平均 | 栅格 | ArcGIS Coverage | - |
中国30 m分辨率的降雨侵蚀力图(SD13) | 降雨 侵蚀力 | 数值单位:MJ·mm/ha·h·a | 中国 | 30 m | WGS84坐标系,Albers投影 | 1981-2010年 | 多年 平均 | 栅格 | ESRI Grid | - |
中原经济区近百年逐月降雨数据库(SD14) | 降雨量 | 数值单位:mm | 中原 城市群 | 2 km | 西安80坐标系,Albers投影 | 2000-2012年 | 逐月 | 栅格 | ESRI Grid | - |
…… |
[1] | 徐建华. 地理建模方法[M].北京:科学出版社,2010:5-7. |
[ Xu J H.Geographical modeling methods[M]. Beijing: Science Press, 2010:5-7. ] | |
[2] | 陆大道. “未来地球”框架文件与中国地理科学的发展——从“未来地球”框架文件看黄秉维先生论断的前瞻性[J].地理学报,2014,69(8):1043-1051. |
[ Lu D D.The framework document of "Future Earth" and the development of Chinese geographical science: The foresight of academician Huang Bingwei's statement[J]. Acta Geographica Sinica, 2014,69(8):1043-1051. ] | |
[3] |
Zhu Y Q, Zhu A X, Feng M, et al.A similarity-based automatic data recommendation approach for geographic models[J]. International Journal of Geographical Information Science, 2017,31(7):1403-1424.
doi: 10.1080/13658816.2017.1300805 |
[4] | 刘喜平,万常选,刘德喜,等.空间关键词搜索研究综述[J].软件学报,2016,27(2):329-347. |
[ Liu X P, Wan C X, Liu D X, et al.Survey on spatial keyword search[J]. Journal of Software, 2016,27(2):329-347. ] | |
[5] |
杨柳. 空间数据全文检索方法研究[J].测绘工程,2012,21(6):8-12.
doi: 10.3969/j.issn.1006-7949.2012.06.003 |
[ Yang L.Study on full-text retrieval of spatial data based on geocoding[J]. Engineering of Surveying and Mapping, 2012,21(6):8-12. ]
doi: 10.3969/j.issn.1006-7949.2012.06.003 |
|
[6] |
Li W, Goodchild M F, Raskin R.Towards geospatial semantic search: exploiting latent semantic relations in geospatial data[J]. International Journal of Digital Earth, 2014,7(1):17-37.
doi: 10.1080/17538947.2012.674561 |
[7] | 许泉立,易俊华,杨昆.基于地理本体的空间信息检索机制初探[J].测绘地理信息,2015,40(1):65-68. |
[ Xu Q L, Yi J H, Yang K.Geo-ontology-Driven retrieval mechanism of Geo-Information[J]. Journal of Geomatics, 2015,40(1):65-68. ] | |
[8] |
王东旭,诸云强,潘鹏,等.地理数据空间本体构建及其在数据检索中的应用[J].地球信息科学学报,2016,18(4):443-452.
doi: 10.3724/SP.J.1047.2016.00443 |
[ Wang D X, Zhu Y Q, Pan P, et al.Construction of geodata spatial ontology and its application in data retrieval[J]. Journal of Geo-information Science, 2016,18(4):443-452. ]
doi: 10.3724/SP.J.1047.2016.00443 |
|
[9] |
侯志伟,诸云强,高星,等.时间本体及其在地学数据检索中的应用[J].地球信息科学学报,2015,17(4):379-390.
doi: 10.3724/SP.J.1047.2015.00379 |
[ Hou Z W, Zhu Y Q, Gao X, et al. Time-Ontology and its application in geodata retrieval[J]. Journal of Geo-information Science, 2015,17(4):379-390. ]
doi: 10.3724/SP.J.1047.2015.00379 |
|
[10] |
孙凯,诸云强,潘鹏,等.形态本体及其在地理空间数据发现中的应用研究[J].地球信息科学学报,2016,18(8):1011-1021.
doi: 10.3724/SP.J.1047.2016.01011 |
[ Sun K, Zhu Y Q, Pan P, et al.Research on Morphology-Ontology and its application in geospatial data discovery[J]. Journal of Geo-information Science, 2016,18(8):1011-1021. ]
doi: 10.3724/SP.J.1047.2016.01011 |
|
[11] |
李威蓉,诸云强,宋佳,等.地理空间数据来源本体及其在数据关联中的应用[J].地球信息科学学报,2017,19(10):1261-1269.
doi: 10.3724/SP.J.1047.2017.01261 |
[ Li W R, Zhu Y Q, Song J, et al.Geospatial data provenance-ontology and its application in data linking[J]. Journal of Geo-information Science, 2017,19(10):1261-1269. ]
doi: 10.3724/SP.J.1047.2017.01261 |
|
[12] |
Buccella A, Cechich A, Gendarmi D, et al.Building a global normalized ontology for integrating geographic data sources[J]. Computers & Geosciences, 2011,37(7):893-916.
doi: 10.1016/j.cageo.2011.02.022 |
[13] |
Lacasta J, Nogueras-Iso J, Muro-Medrano P R, et al. A web ontology service to facilitate interoperability within a spatial data infrastructure: Applicability to discovery[J]. Data & Knowledge Engineering, 2007,63(3):947-971.
doi: 10.1016/j.datak.2007.06.002 |
[14] |
Lutz M, Klien E.Ontology based retrieval of geographic information[J]. International Journal of Geographical Information Science, 2006,20(3):233-260.
doi: 10.1080/13658810500287107 |
[15] | 杨小忠,贾占军,刘士彬,等.基于应用本体的多卫星遥感数据检索[J].遥感信息,2007(1):30-36. |
[ Yang X Z, Jia Z J, Liu S B, et al.Into digitization: Some concepts and methods of Chinese historical geographic information system[J]. Historical Geography, 2002(1):30-36. ] | |
[16] |
刘红泉,张亮峰.布尔逻辑检索模型的分析探讨[J].现代情报, 2004,24(9):4-6.
doi: 10.3969/j.issn.1008-0821.2004.09.002 |
[ Liu H Q, Zhang L F.Analysis and discussion of boolean retrieval model[J]. Journal of Modern Information, 2004,24(9):4-6. ]
doi: 10.3969/j.issn.1008-0821.2004.09.002 |
|
[17] | 王娟琴. 三种检索模型的比较分析研究:布尔,概率,向量空间模型[J].情报科学,1998,16(3):225-230. |
[ Wang J Q.Studies on three retrieval modeles: Boolean retrieval model, probability retrieval model, vector retrieval model[J]. Information Science, 1998,16(3):225-230. ] | |
[18] | 李晓光,王大玲,于戈.基于统计语言模型的信息检索[J].计算机科学,2005,32(8):124-127. |
[ Li X G, Wang D L, Yu G.Information retrieval based on statistical language model[J]. Computer Science, 2005,32(8):124-127. ] | |
[19] |
谢斌,俞乐,张登荣.基于GIS服务链的遥感影像分布式融合处理[J].国土资源遥感,2011,23(1):138-142.
doi: 10.6046/gtzyyg.2011.01.28 |
[ Xie B, Yu L, Zhang D R.Distributed fusion process for remotely sensed images based on GIS services chain[J]. Remote Sensing for Land & Resources, 2011,23(1):138-142. ]
doi: 10.6046/gtzyyg.2011.01.28 |
|
[20] | 张登荣,俞乐,邓超,等.基于OGC WPS的Web环境遥感图像处理技术研究[J].浙江大学学报(工学版),2008,42(7):1184-1188. |
[ Zhang D R, Yu L, Deng C, et al.OGC WPS-based remote sensing image processing in web environment[J]. Journal of Zhejiang University(Engineering Science), 2008,42(7):1184-1188. ] | |
[21] | 李锦辉,徐敬海.基于网络的导航信息服务系统研究[J].测绘科学,2009,34(1):207-209. |
[ Li J H, Xu J H.Research on the method of foundational surveying engineering supervision[J]. Science of Surveying and Mapping, 2009,34(1):207-209. ] | |
[22] |
俞志强,司文才,李东阳,等.地理信息服务的智能化无缝聚合方法研究[J].测绘地理信息,2015,40(6):70-72.
doi: 10.14188/j.2095-6045.2015.06.021 |
[ Yu Z Q, Si W C, Li D Y, et al.An intelligent seamless aggregation method for geographic information service[J]. Journal of Geomatics, 2015,40(6):70-72. ]
doi: 10.14188/j.2095-6045.2015.06.021 |
|
[23] | 王艳军,路立娟.国土资源管理中典型地理信息服务链应用研究[J].测绘通报,2016(9):38-42. |
[ Wang Y J, Lu L J.Into digitization: Some concepts and methods of Chinese historical geographic information system[J]. Historical Geography, 2002(9):38-42. ] | |
[24] |
杜武,樊红,厉剑.模型驱动的空间信息服务组合[J].测绘地理信息,2015,40(2):62-66.
doi: 10.14188/j.2095-6045.2015.02.018 |
[ Du W, Fan H, Li J.Model-Driven geospatial web service composition[J]. Journal of Geomatics, 2015,40(2):62-66. ]
doi: 10.14188/j.2095-6045.2015.02.018 |
|
[25] | International Organization for Standardization. ISO 19115-1:2014(E), Geographic information-Metadata-Part1: Fundamentals[S]. 2014. |
[26] | Open Geospatial Consortium.OGC 06-042, Web Map Server Implementation Specification[S]. 2006. |
[27] |
Gregersen J B, Gijsbers P J A, Westen S J P. OpenMI: Open modelling interface[J]. Journal of Hydroinformatics, 2007,9(3):175-191.
doi: 10.2166/hydro.2007.023 |
[28] | Open Geospatial Consortium.OGC 05-007r7, Web Processing Service[S]. 2007. |
[29] |
Yue S, Wen Y, Chen M, et al.A data description model for reusing, sharing and integrating geo-analysis models[J]. Environmental Earth Sciences, 2015,74(10):7081-7099.
doi: 10.1007/s12665-015-4270-5 |
[30] |
Zhu Y Q, Zhu A X, Song J, et al.Multidimensional and quantitative interlinking approach for Linked Geospatial Data[J]. International Journal of Digital Earth, 2017,10(9):1-21.
doi: 10.1080/17538947.2016.1264490 |
[31] |
赵红伟,诸云强,杨宏伟,等.地理空间数据本质特征语义相关度计算模型[J].地理研究,2016,35(1):58-70.
doi: 10.11821/dlyj201601006 |
[ Zhao H W, Zhu Y Q, Yang H W, et al.The semantic relevancy computation model on essential features of geospatial data[J].Geographical Research, 2016,35(1):58-70. ]
doi: 10.11821/dlyj201601006 |
|
[32] | Open Geospatial Consortium.12-063r5, Geographic information - Well-known text representation of coordinate reference systems[S]. 2015. |
[33] | Open Grid Forum. Data Format Description Language (DFDL) v1.0 Specification.2011, . |
[34] |
孙伟,诸云强,郭春霞.湖南粮食生产潜力空间分异特征与农机总动力投入的关系[J].农机化研究,2014(9):36-41.
doi: 10.3969/j.issn.1003-188X.2014.09.008 |
[ Sun W, Zhu Y Q, Guo C X.Into digitization: Some concepts and methods of Chinese historical geographic information system[J]. Historical Geography, 2002(9):36-41. ]
doi: 10.3969/j.issn.1003-188X.2014.09.008 |
[1] | 杨雅萍, 姜侯, 孙九林. 科学数据共享实践:以国家地球系统科学数据中心为例[J]. 地球信息科学学报, 2020, 22(6): 1358-1369. |
[2] | 王末, 王卷乐, 赫运涛. 地学数据共享网用户Web行为预测及数据推荐方法[J]. 地球信息科学学报, 2017, 19(5): 595-604. |
[3] | 王末, 王卷乐. Web环境下地学数据共享用户行为模式分析[J]. 地球信息科学学报, 2016, 18(9): 1174-1183. |
[4] | 王东旭, 诸云强, 潘鹏, 罗侃, 侯志伟. 地理数据空间本体构建及其在数据检索中的应用[J]. 地球信息科学学报, 2016, 18(4): 443-452. |
[5] | 苗茹, 诸云强, 宋佳, 冯敏, 潘鹏. 基于云计算的地球系统科学数据共享研究与实践[J]. 地球信息科学学报, 2014, 16(2): 264-272. |
[6] | 田江鹏, 贾奋励, 夏青, 吴金兵. 语义驱动的层次化地图符号设计方法[J]. 地球信息科学学报, 2012, 14(6): 736-743. |
[7] | 黄风华 , 晏路明. 基于SOA的税收征管网络GIS平台[J]. 地球信息科学学报, 2012, 14(2): 209-216. |
[8] | 韩坤英, 庞健峰, 逯永光, 丁孝忠, 范本贤, 剧远景, 王震洋. "同一个地质"计划的地质图空间数据网络共享研究——以中国1:100万MapGIS格式的地质图数据为例[J]. 地球信息科学学报, 2011, 13(6): 742-749. |
[9] | 黄丽, 周卫, 王芙蓉. 地理数据共享效应的评价方法与应用[J]. 地球信息科学学报, 2011, 13(5): 617-622. |
[10] | 王卷乐, 李锐, 徐永芬, 徐育林, 贾文臣, 邓凤东. 面向数据共享的城镇化信息快速提取技术方法与应用——以江苏盐城为例[J]. 地球信息科学学报, 2010, 12(3): 399-405. |
[11] | 诸云强, 孙九林, 廖顺宝, 杨雅萍, 朱华忠, 王卷乐, 冯敏, 宋佳, 杜佳. 地球系统科学数据共享研究与实践[J]. 地球信息科学学报, 2010, 12(1): 1-8. |
[12] | 陈旻, 盛业华, 温永宁, 苏红军, 郭飞. 面向地理问题求解的数据表达模型研究[J]. 地球信息科学学报, 2009, 11(3): 333-341. |
[13] | 诸云强, 冯敏, 宋佳, 刘润达. 基于SOA的地球系统科学数据共享平台架构设计与实现[J]. 地球信息科学学报, 2009, 11(1): 1-9. |
[14] | 冯敏, 诸云强, 张鸣之, 赵慧, 喻孟良. 多源遥感影像共享平台的设计与实现[J]. 地球信息科学学报, 2008, 10(1): 102-108. |
[15] | 安基文, 庄大方, 袁文. 面向地学计算的资源环境科学数据共享平台的设计[J]. 地球信息科学学报, 2007, 9(3): 34-39. |
|