时间本体及其在地学数据检索中的应用
作者简介:侯志伟(1989-),男,湖南永兴人,硕士生,研究方向为地学数据共享和地理信息技术与应用。E-mail:houzw.13s@igsnrr.ac.cn
收稿日期: 2014-12-02
要求修回日期: 2015-01-04
网络出版日期: 2015-04-10
基金资助
国家自然科学基金项目“基于元数据语义的地理空间数据关联方法研究”(41371381)
科技基础性工作专项重点项目“科技基础性工作数据资料集成与规范化整编”(2013FY110900)
国家科技基础条件平台-地球系统科学数据共享平台(2005DKA32300)
Time-Ontology and its Application in Geodata Retrieval
Received date: 2014-12-02
Request revised date: 2015-01-04
Online published: 2015-04-10
Copyright
高效、准确地获取目标数据及其关联数据,是决定大数据共享与挖掘分析能否实现的关键因素。传统的数据检索方法无法利用地学数据间的显性或隐含关系,已不能满足日益增长的对检索结果质和量的需求,而本体理论和技术的语义检索成为当前的研究热点。本文针对时间这一地学数据的本质属性,在系统研究地学数据时间概念与特征的基础上,建立了地学数据时间本体模型,并深入论述了模型中的时间关系、时间坐标系等内容,提出了时间位置和时间距离的描述函数,同时研究了二者的本体表达方式。构建了包括地质年代等在内的地学数据时间本体库,并以语义网开发框架Jena为基础,经本体解析、元数据时间信息抽取与标注等过程,将时间本体应用于地球系统科学数据共享平台的元数据检索之中。结果表明,以时间本体的地学数据语义检索查全率约为关键字方法的1倍,检索结果排序,以及关联数据推荐方面也有更好的效果,为促进地学数据共享与关联发现提供了一种有效的方法。
侯志伟 , 诸云强 , 高星 , 潘鹏 , 罗侃 , 王东旭 . 时间本体及其在地学数据检索中的应用[J]. 地球信息科学学报, 2015 , 17(4) : 379 -390 . DOI: 10.3724/SP.J.1047.2015.00379
The way to obtain the target data and relevant data efficiently and accurately has been a critical factor in data sharing and data mining during the era of BigData. The retrieval techniques which are currently in use could no more meet the increasing demands on quality and quantity for retrieving data, due to the unavailable usage of explicit and implicit relations among geodata. Current researches mainly focus on semantic retrieval, which is based on the theories and technologies of ontology. Taking consideration of time, an essential attribute of geodata, this paper constructed a geodata time-ontology model founded on the researches about the concepts and characteristics of temporal geodata. In addition, this article presented information about the temporal relations and time coordinate system, analyzed the functions for time position and time distance, and studied their formalization. In the end, a time-ontology base had been built up according to the time-ontology model, and an application had been developed using Apache Jena, a free and open source Java framework for building semantic web and linked data applications. After parsing the ontologis, extracting and annotating the time expressions from the metadata, the time ontology had been further applied to the retrieval of metadata from the data sharing infrastructure of earth system science. Results of these experiments show that the semantic geodata retrieval based on time-ontology has doubled the recall ratio, and it also performs much better than traditional information retrieval methods from the perspective of linked data recommendation and result sorting, which provides an effective approach for sharing geodata and finding linked data.
Key words: geodata; time-ontology; semantic retrieval; temporal characteristics
Fig. 1 The time-ontology model of geodata图1 地学数据时间本体模型 |
Tab. 1 Temporal topological relations between time entities表1 时间实体的时间拓扑关系 |
时间实体 | 时间关系 | ||||
---|---|---|---|---|---|
相接 | 相离 | 相交 | 相等 | 包含 | |
时间点-时间点 | √ | √ | |||
时间点-时间段 | √ | √ | √ | √ | |
时间段-时间段 | √ | √ | √ | √ | √ |
复合时间实体 | √ | √ | √ | √ | √ |
Tab. 2 Topological relations between temporal entities表2 时间实体关系 |
关系谓词 | 英文 | 逆关系 | 继承父关系 | 表达式 | 图示 |
---|---|---|---|---|---|
早于 | Before | 晚于 | 相离 | Before(T1º, T2º) | |
晚于 | After | 早于 | 相离 | After(T2º, T1º) | |
在...之间 | Between | - | 相离 | Between (T1º, T2º, T3º) |
Tab. 3 Topological relations between intervals表3 时间段拓扑关系 |
关系谓词 | 英文 | 逆关系 | 继承父关系 | 表达式 | 图示 |
---|---|---|---|---|---|
早于 | intBefore | 晚于 | 相离 | intBefore(T1,T2) | |
晚于 | intAfter | 早于 | 相离 | intAfter(T2, T1) | |
包含 | intContains | 在…期间 | 包含 | intContains(T1,T2) | |
在…期间 | intDuring | 包含 | 包含 | intDuring (T2, T1) | |
结束于 | intFinishs | 以…结束 | 包含 | intFinishs(T1,T2) | |
以…结束 | intFinishedBy | 结束 | 包含 | intFinishedBy(T2, T1) | |
相接 | intMeets | 被相接 | 相接 | intMeets(T1,T2) | |
被相接 | intMetBy | 相接 | 相接 | intMetBy(T2, T1) | |
相交 | intOverlaps | 被相交 | 相交 | intOverlaps (T1,T2) | |
被相交 | intOverlapedBy | 相交 | 相交 | intOverlapedBy(T2, T1) | |
开始于 | intStarts | 以…开始 | 包含 | intStarts(T1,T2) | |
以…开始 | intStartedBy | 开始 | 包含 | intStartedBy(T2, T1) | |
不相交 | intNonOverlap | — | 相离 | intNonOverlap(T1,T2) | |
相等 | intEquals | — | 相等 | intEquals(T1,T2) |
Tab. 4 Topological relation between instances表4 时间点拓扑关系 |
关系谓词 | 英文 | 逆关系 | 继承父关系 | 表达式 | 图示 |
---|---|---|---|---|---|
相等/重合 | insEquals | — | 相等 | insEquals (t1,t2) |
Tab. 5 Topological relations between instance and interval表5 时间点与时间段关系 |
关系谓词 | 英文 | 逆关系 | 继承父关系 | 表达式 | 图示 |
---|---|---|---|---|---|
包含 | insIntContains | 在…之内 | 包含 | insIntContains (T, t) | |
在…之内 | insIntInside | 包含 | 包含 | insIntInside (t, T) | |
开始时间 | timeStarts | 结束时间 | 包含 | timeStarts(t1, T) | |
结束时间 | timeFinishs | 开始时间 | 包含 | timeFinishs(t2, T) |
Fig. 2 Time position formalization of geodata图2 地学数据时间位置表达 |
Fig. 3 Calendar time description图3 日历时间描述 |
Fig. 4 Definitions of temporal distance图4 时间距离 |
Tab. 6 Conversion sequence of time granularity in the Gregorian Calendar表6 公历时间粒度转换序列 |
时间粒度 | 亿年 | 百万年 | 万年 | 世纪 | 年代 | 年 | 月 | 日 | 小时 | 分 | 秒 |
---|---|---|---|---|---|---|---|---|---|---|---|
粒度序号 | -5 | -4 | -3 | -2 | -1 | 0 | 1 | 2 | 3 | 4 | 5 |
转换系数 | 1 | 12 | 365 | 8.76 | 5.256 | 3.1536 |
Fig. 5 Time distance description图5 时间距离描述 |
Fig. 6 Time-ontology structure of geodata图6 地学数据时间本体框架 |
Tab. 7 Major built-ups for time-ontologies表7 已构建的主要时间本体 |
本体名称 | 主要概念 | 主要实例 | 主要属性 | 主要关系 |
---|---|---|---|---|
基本时间概念本体 | 时间实体、时间方向、时间状态、历法、纪年 | 正向、完成态、阳历、公历纪年 | 时间波动频率、时间周期、时间分辨率、时间单位序列 | 有时间波动性描述、时间分辨率为 |
日历时间本体 | 年、月、日、星期等 | 1年、1月、1日、星期一等 | 时间单位、值 | 包含、相接、早于、晚于 |
钟表时间本体 | 时、分、秒等 | 0时,1分,1秒等 | 时间单位、值 | 包含、相接、早于、晚于 |
节气本体 | 节气 | 春分、夏至、秋分、冬至等 | 黄经度数、农事活动 | 日期为、黄经度数为 |
时间单位本体 | 时间单位、单位符号 | 百万年、世纪、年、月等 | 符号、下级换算系数 | 有下级单位 |
地质年代本体 | 宙、代、纪、世、期 | 元古宙、元古代、侏罗纪 | 开始时间、地质年龄 | 有地质年龄 |
年代地层本体 | 宇、界、系、统、阶 | 元古宇、元古界、侏罗系 | 岩层特征 | 有典型化石 |
年号本体 | 年号 | 贞观、康熙 | 帝王、开始时间 | 属于 |
历史朝代本体 | 历史朝代 | 秦朝、唐朝 | 都城、建立时间 | 有都城、建立时间为 |
时区与标准时间本体 | 时区、标准时间 | 东八区、北京时间 | 偏移小时数、偏移方向、中央经线 | 偏移小时数为、使用国家 |
节日纪念日本体 | 节日、纪念日 | 春节、“九一八”纪念日 | 日期 | 日期为、是否法定假日 |
重要历史事件本体 | 历史事件 | 西安事变 | 日期、主要人物 | 发生时间、代表人物 |
Fig. 7 The application procedure of time-ontology in geodata retrieval图7 时间本体在地学数据检索中的应用过程 |
Fig. 8 Application of time ontology in intelligence geodata schematic discovery图8 基于时间本体的地学数据语义检索应用 |
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
Stanford University KSL. KSL-Time[DB/OL]. 2008-01-22.
|
[21] |
HP Labs. Time Ontology in KIF[DB/OL]. 1994.
|
[22] |
Cycorp. Times and dates in Cyc[DB/OL]. 2002.
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
/
〈 | 〉 |