地理空间数据来源本体及其在数据关联中的应用
作者简介:李威蓉(1991-),男,江西萍乡人,硕士生,研究方向为地学数据来源及数据关联。E-mail: liwr@lreis.ac.cn
联系方式
收稿日期: 2017-06-12
要求修回日期: 2017-08-11
网络出版日期: 2017-10-20
基金资助
科技基础性工作专项重点项目(2013FY110900)
国家自然科学基金重点项目(41631177)
贵州省公益性基础性地质工作项目(黔国土资地环函[2014]23号)
贵州省公益性基础性地质工作项目(黔国土资源函[2016]269号)
国家自然科学基金项目(41371381)
Geospatial Data Provenance-Ontology and Its Application in Data Linking
Received date: 2017-06-12
Request revised date: 2017-08-11
Online published: 2017-10-20
Copyright
数据来源是数据可靠性评价的重要参考因素,是地理空间数据本体的重要研究内容。本文针对来源这一重要的地理空间数据研究对象,系统地分析了地理空间数据来源的涵义,建立了地理空间数据来源本体模型,在此基础上,提出了地理空间数据来源本体的概念体系和来源本体概念间关系及其属性的形式化表达方法,并构建出地理空间数据来源本体。最后,以“科技基础性工作专项”项目数据资料为例,基于来源本体库,利用RDF从来源角度实现数据的语义关联,通过web前端框架D3.js技术实现数据与其来源信息的可视化。结果表明,基于来源本体的数据关联可以有效解决数据来源信息描述不规范的问题以及能够支持地学数据语义检索、智能推荐等应用,为促进地学数据共享和数据关联应用提供了一种新方法和新思路。
李威蓉 , 诸云强 , 宋佳 , 孙凯 , 杨杰 . 地理空间数据来源本体及其在数据关联中的应用[J]. 地球信息科学学报, 2017 , 19(10) : 1261 -1269 . DOI: 10.3724/SP.J.1047.2017.01261
Data provenance is an important reference factor of data reliability evaluation and important research content of geospatial data ontology. Taking consideration of provenance, an important research object of geospatial data, we constructed a geospatial data provenance conceptual model based on systemic analysis of the meaning of geospatial data provenance. Based on it, we put forward geospatial data Provenance-Ontology concepts system and the formalization method for constructing geospatial data Provenance-Ontology. Finally, we take the data materials in “special work of the science and technology basic work” as an example. Based on Provenance-Ontology library, using RDF to link geospatial data and D3.js to achieve the data provenance visualization. The result shows that data linking based on Provenance-Ontology can effectively solve the problem of the nonstandardization in the description of data provenance information. It can support geospatial data semantic retrieval, intelligent recommendation and other applications. It also provides new ideas for geodata sharing and data linking.
Key words: geospatial data; provenance; ontology; data linking
Tab. 1 The advantages and disadvantages between provenance models表1 来源模型间的优缺点对比 |
模型名称 | 模型描述 | 优点 | 缺点 |
---|---|---|---|
W7 | 由7个相互关联的要素组成,即what、where、why、how、which、when、who,详细地描述了它们之间的相互关系 | 来源要素完整 | 通用模型,难以应用于具体领域 |
PROV | W3C标准,计算机可以读取和处理的来源框架,支持owl、XML等多种格式,定义了如何获取、利用以及验证来源信息 | 完整定义了人、机构以及活动之间的关系 | 通用模型,难以应用于具体领域 |
OPM | 由Artifact、Process、Agent 3个要素组成,定义某个对象在不同状态时的因果关系 | 完整定义了某个对象在不同状态时的因果关系 | 缺少时间、空间等重要来源要素 |
Provenior | 一种描述工作流的来源模型,由data,agent,process3个要素组成 | 完整的工作流过程 | 缺少数据间关系的描述 |
Fig. 1 The model of provenance-ontology of geospatial data图1 地理空间数据来源本体模型 |
Fig. 2 The concept system of geospatial data provenance图2 地理空间数据来源概念体系 |
Tab. 2 The core relations between provenance entities表2 来源本体概念间的核心关系 |
关系 | 关系简述 | 图示 |
---|---|---|
引用 | 多个数据源合并成一个新数据,侧重于数据的复制,新的数据中存在旧的数据源 | |
更新 | 在已有数据上添加新的信息 | |
融合 | 多个数据源合成一个新数据,新数据中不存在旧的数据源 | |
修订 | 修复数据中的某些错误 | |
衍生 | 单个数据经过加工后生产新的数据,侧重于数据一对一的形成 | |
使用 | 利用已有数据源进行数据活动,利用数据前,数据活动不会被数据源所影响 | |
生成 | 通过数据活动完成新数据的生产,生产之前不存在,生产之后可供使用,主要针对原始数据的产生 | |
共生 | 数据生产过程中,涉及多个数据活动,相互之间缺一不可 | |
授权 | 数据责任者A委托数据责任者B进行数据活动 | |
属于 | 数据责任者对数据具有所有权 | |
负责 | 数据责任者在数据活动中承担任务或者责任 | |
贡献 | 数据责任者参与数据活动,对数据的生成起有利作用 |
Tab. 3 The core properties of provenance ontology表3 来源本体中的核心属性示例 |
实体名 | 属性类名 | 属性名 |
---|---|---|
工具 | 采集仪器 | 型号唯一标识 |
标称精度 | ||
应用领域 工作范围 采集对象 | ||
加工工具 | 运行环境 | |
工具版本 | ||
加工精度 | ||
模型提出者 模型提出时间 | ||
模型版本 | ||
数据责任者 | 个人 | 职务入职时间 |
联系方式 | ||
联系地址 员工编号 所在部门 | ||
机构 | 单位法人 | |
成立时间 | ||
单位类型 | ||
单位规模 | ||
业务范围 | ||
服务时间 |
Fig. 3 Geospatial data provenance-ontology visualization图3 地理空间数据来源本体可视化 |
Fig. 4 Geospatial data linking network based on provenance information图4 基于来源信息的地理空间数据关联网络 |
Tab. 4 Data linking rules表4 数据关联规则 |
数据 | 关联的数据 | 关联规则 |
---|---|---|
A | B、C | B、C是A的数据源 |
F | D、E、G | F是D、E、G的数据源 |
H | I、J | I、J是H的数据源 |
K | L | K是L的数据源 |
A | K | 同一加工工具 |
A | D | 来自同一个项目 |
H | D、N、G、K | 产权归属单位相同 |
N | S、M | 产权归属单位相同 |
G | P、Q、R | 依托单位相同 |
K | M | 依托单位相同 |
N | O | 依托单位相同 |
P | Q | P和Q的采集方法相同 |
M | U、V | M和U、V的采集方法相同 |
The authors have declared that no competing interests exist.
[1] |
|
[2] |
ISO19115-2-2009,
|
[3] |
|
[4] |
[
|
[5] |
[
|
[6] |
[
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
[
|
[17] |
|
[18] |
|
[19] |
|
[20] |
[
|
[21] |
|
/
〈 | 〉 |