地球信息科学学报 ›› 2017, Vol. 19 ›› Issue (10): 1261-1269.doi: 10.3724/SP.J.1047.2017.01261
• 地球信息科学与应用技术 • 下一篇
李威蓉1(), 诸云强2,4,5, 宋佳2,4,5,*(
), 孙凯2,3, 杨杰2,3
收稿日期:
2017-06-12
修回日期:
2017-08-11
出版日期:
2017-10-20
发布日期:
2017-10-20
作者简介:
作者简介:李威蓉(1991-),男,江西萍乡人,硕士生,研究方向为地学数据来源及数据关联。E-mail:
联系方式
基金资助:
LI Weirong1(), ZHU Yunqiang2,4,5, SONG Jia2,4,5,*(
), SUN Kai2,3, YANG Jie2,3
Received:
2017-06-12
Revised:
2017-08-11
Online:
2017-10-20
Published:
2017-10-20
Contact:
SONG Jia
摘要:
数据来源是数据可靠性评价的重要参考因素,是地理空间数据本体的重要研究内容。本文针对来源这一重要的地理空间数据研究对象,系统地分析了地理空间数据来源的涵义,建立了地理空间数据来源本体模型,在此基础上,提出了地理空间数据来源本体的概念体系和来源本体概念间关系及其属性的形式化表达方法,并构建出地理空间数据来源本体。最后,以“科技基础性工作专项”项目数据资料为例,基于来源本体库,利用RDF从来源角度实现数据的语义关联,通过web前端框架D3.js技术实现数据与其来源信息的可视化。结果表明,基于来源本体的数据关联可以有效解决数据来源信息描述不规范的问题以及能够支持地学数据语义检索、智能推荐等应用,为促进地学数据共享和数据关联应用提供了一种新方法和新思路。
李威蓉, 诸云强, 宋佳, 孙凯, 杨杰. 地理空间数据来源本体及其在数据关联中的应用[J]. 地球信息科学学报, 2017, 19(10): 1261-1269.DOI:10.3724/SP.J.1047.2017.01261
LI Weirong,ZHU Yunqiang,SONG Jia,SUN Kai,YANG Jie. Geospatial Data Provenance-Ontology and Its Application in Data Linking[J]. Journal of Geo-information Science, 2017, 19(10): 1261-1269.DOI:10.3724/SP.J.1047.2017.01261
表1
来源模型间的优缺点对比
模型名称 | 模型描述 | 优点 | 缺点 |
---|---|---|---|
W7 | 由7个相互关联的要素组成,即what、where、why、how、which、when、who,详细地描述了它们之间的相互关系 | 来源要素完整 | 通用模型,难以应用于具体领域 |
PROV | W3C标准,计算机可以读取和处理的来源框架,支持owl、XML等多种格式,定义了如何获取、利用以及验证来源信息 | 完整定义了人、机构以及活动之间的关系 | 通用模型,难以应用于具体领域 |
OPM | 由Artifact、Process、Agent 3个要素组成,定义某个对象在不同状态时的因果关系 | 完整定义了某个对象在不同状态时的因果关系 | 缺少时间、空间等重要来源要素 |
Provenior | 一种描述工作流的来源模型,由data,agent,process3个要素组成 | 完整的工作流过程 | 缺少数据间关系的描述 |
表2
来源本体概念间的核心关系
关系 | 关系简述 | 图示 |
---|---|---|
引用 | 多个数据源合并成一个新数据,侧重于数据的复制,新的数据中存在旧的数据源 | |
更新 | 在已有数据上添加新的信息 | |
融合 | 多个数据源合成一个新数据,新数据中不存在旧的数据源 | |
修订 | 修复数据中的某些错误 | |
衍生 | 单个数据经过加工后生产新的数据,侧重于数据一对一的形成 | |
使用 | 利用已有数据源进行数据活动,利用数据前,数据活动不会被数据源所影响 | |
生成 | 通过数据活动完成新数据的生产,生产之前不存在,生产之后可供使用,主要针对原始数据的产生 | |
共生 | 数据生产过程中,涉及多个数据活动,相互之间缺一不可 | |
授权 | 数据责任者A委托数据责任者B进行数据活动 | |
属于 | 数据责任者对数据具有所有权 | |
负责 | 数据责任者在数据活动中承担任务或者责任 | |
贡献 | 数据责任者参与数据活动,对数据的生成起有利作用 | |
[1] | Studer R, Benjamins V R, Fensel D.Knowledge engineering: Principles and methods[J]. Data & Knowledge Engineering, 1998,25(1-2):161-197. |
[2] | ISO19115-2-2009, Geographic Information-Metadata[S].2009 |
[3] | Di L, Yue P, Ramapriyan, et al. Geoscience data provenance: An overview[J]. IEEE Transactions on Geoscience & Remote Sensing, 2013,51(11):5065-5072. |
[4] |
戴超凡,王涛,张鹏程.数据起源技术发展研究综述[J].计算机应用研究,2010,27(9):3215-3221.
doi: 10.3969/j.issn.1001-3695.2010.09.004 |
[ Dai C F, Wang T, Zhang P C.Survey of data provenance technique[J]. Application Research of Computers, 2010,27(9):3215-3221. ]
doi: 10.3969/j.issn.1001-3695.2010.09.004 |
|
[5] |
陈颖. 一种基于DNA双螺旋结构的数据起源模型[J].现代图书情报技术,2008,24(10):11-15.
doi: 10.3969/j.issn.1003-3513.2008.10.003 |
[ Chen Y.A data provenance model based on the double-helical structure of DNA[J]. Data Analysis and Knowledge Discovery, 2008,24(10):11-15. ]
doi: 10.3969/j.issn.1003-3513.2008.10.003 |
|
[6] | 李文燕,吴振新.起源信息模型及标准PROV的研究分析[J].情报理论与实践,2015,38(4):23-29. |
[ Li W Y, Wu Z X.Research and analysis of provenance information model and standard PROV[J]. Information Studies: Theory & Application, 2015,38(4):23-29. ] | |
[7] | Moreau L, Freire J, Futrelle J, et al.The open provenance model: An overview. proceedings of the provenance and annotation of data and processes, F[C]. 2008. |
[8] | Sahoo S S, Sheth A P.Provenir ontology: Towards a framework for eScience provenance management. proceedings of the Knoesis Publications, F[C]. 2009 |
[9] | Doerr M, Theodoridou M.CRMdig: A generic digital provenance model for scientific observation; proceedings of the TaPP, F[C]. 2011. |
[10] |
LEBO T.PROV-O: The PROV ontology:W3C recommendation 30 April 2013[J]. Journal of Surgical Research, 2013,147(2):194-199.
doi: 10.1016/j.jss.2008.02.005 |
[11] | Foster I, Vockler J, Wlide M, et al.Chimera: a virtual data system for representing, querying, and automating data derivation; proceedings of the International Conference on Scientific and Statistical Database Management, 2002 Proceedings, F[C]. 2002. |
[12] | Myers J D, Pancerella C, Lansing C, et al.Multi-scale science: supporting emerging practice with semantically derived provenance[C]. Proceedings of the ISWC 2003 Workshop on Semantic Web Technologies for Searching and Retrieving Science Data, Sanibel Island, Florida, October 2003. |
[13] | Stevens R D, Robinson A J, Goble C A. MyGrid: Personalised bioinformatics on the information grid[J]. Bioinformatics, 2003,19Suppl 1(suppl_1): i302-4. |
[14] | Miles S, Groth P, Branco M, et al.The requirements of using provenance in e-Science experiments[J]. Journal of Grid Computing, 2007,5(1):10-1007. |
[15] | Bowers S, Mcphitips T, Riddle S, et al.Kepler/pPOD: Scientific workflow and provenance support for assembling the tree of life. Proceedings of the provenance and annotation of data and processes, second international provenance and annotation workshop, IPAW 2008, Salt Lake City, UT, USA, June 17-18, 2008 Revised Selected Papers, F[C]. 2008. |
[16] |
贾君枝,寇蕾蕾.基于W7模型的数据起源本体语义分析[J].情报理论与实践,2016,39(3):118-121.
doi: 10.16353/j.cnki.1000-7490.2016.03.023 |
[ Jia J Z, Kou L L.Semantics analysis of data provenance ontology based on W7 model[J]. Information Studies:Theory & Application, 2016,39(3):118-121. ]
doi: 10.16353/j.cnki.1000-7490.2016.03.023 |
|
[17] | Ram S, Liu J.A new perspective on semantics of data provenance. Proceedings of the international workshop on the role of semantic web in provenance management, F [C].2009. |
[18] | Hartig O.Provenance information in the web of data. Proceedings of the Linked Data on the Web Ldow Workshop at WWW, F[C]. 2011 |
[19] |
Hunter J, Cheung K.Provenance explorer: A graphical interface for constructing scientific publication packages from provenance trails[J]. International Journal on Digital Libraries, 2007,7(1):99-107.
doi: 10.1007/s00799-007-0018-5 |
[20] | 乐鹏,彭飞飞,龚健雅.基于SOA的空间数据起源研究[J].地理与地理信息科学,2010,26(3):6-10. |
[ Yue P, Peng F F, Gong J Y.Research on SOA-based geospatial data provenance[J]. Geography and Geo-Information Science, 2010,26(3):6-10. ] | |
[21] | Benjamins V R, Gómez A.Overview of knowledge sharing and reuse components: Ontologies and problem-solving methods[J]. Pérez, 1999,8(1):11-1. |
[1] | 桂志鹏, 胡晓辉, 刘欣婕, 凌志鹏, 姜屿涵, 吴华意. 顾及地理语义的地图检索意图形式化表达与识别[J]. 地球信息科学学报, 2023, 25(6): 1186-1201. |
[2] | 杨玉莹, 赵学胜, 刘会园, 彭舒, 吕源鑫. 基于地表覆盖数据的湿地知识图谱构建[J]. 地球信息科学学报, 2023, 25(6): 1240-1251. |
[3] | 诸云强, 孙凯, 胡修棉, 闾海荣, 王新兵, 杨杰, 王曙, 李威蓉, 宋佳, 苏娜, 牟兴林. 大规模地球科学知识图谱构建与共享应用框架研究与实践[J]. 地球信息科学学报, 2023, 25(6): 1215-1227. |
[4] | 吴子豪, 刘耀林, 冯向阳, 陈奕云, 闫庆武. 基于多尺度地理加权回归的土壤镉污染局部影响因子分析[J]. 地球信息科学学报, 2023, 25(3): 573-587. |
[5] | 李可欣, 郭健, 王宇君, 李宗明, 缪坤, 陈辉. 基于SAR和AIS的角度最近邻数据关联方法[J]. 地球信息科学学报, 2023, 25(1): 131-141. |
[6] | 卢万杰, 刘伟, 牛朝阳, 谢丽敏, 吕亮. 服务于空天协同对地观测的语义信息模型构建[J]. 地球信息科学学报, 2022, 24(8): 1421-1431. |
[7] | 吴柏燕, 戴千一, 彭煜玮, 王伟. 矢量地图同态加密域鲁棒水印算法[J]. 地球信息科学学报, 2022, 24(6): 1120-1129. |
[8] | 王迪, 钱海忠, 赵钰哲. 综述与展望:地理空间数据的管理、多尺度变换与表达[J]. 地球信息科学学报, 2022, 24(12): 2265-2281. |
[9] | 沈镭, 郑新奇, 陶建格. 自然资源大数据应用技术框架与学科前沿进展[J]. 地球信息科学学报, 2021, 23(8): 1351-1361. |
[10] | 张小东, 韩昊英, 陈宇. 2003—2018年中国地级城市土地出让交易状况及时空动态特征[J]. 地球信息科学学报, 2020, 22(9): 1823-1836. |
[11] | 刘俊楠, 刘海砚, 陈晓慧, 郭漩, 郭文月, 朱新铭, 赵清波. 面向多源地理空间数据的知识图谱构建[J]. 地球信息科学学报, 2020, 22(7): 1476-1486. |
[12] | 高旺旺, 冯建中, 白林燕, 杨建华, 郭雷风, 李华林, 崔梦瑞. 海南岛气溶胶时空变化及来源追溯[J]. 地球信息科学学报, 2020, 22(7): 1532-1543. |
[13] | 赵斌, 韩晶晶, 史覃覃, 吉根林, 刘信陶, 俞肇元. 语义轨迹建模与挖掘研究进展[J]. 地球信息科学学报, 2020, 22(4): 842-856. |
[14] | 贾梦姝, 张宇, 潘婷婷, 吴文周, 苏奋振. 面向互联网信息抽取的海洋环境灾害链本体构建——以台风灾害为例[J]. 地球信息科学学报, 2020, 22(12): 2289-2303. |
[15] | 鹿强, 吴琳, 陈昭, 王琪, 徐勇军, 阚荣才. 海上目标多源轨迹数据关联综述[J]. 地球信息科学学报, 2018, 20(5): 571-581. |
|