地球信息科学学报 ›› 2023, Vol. 25 ›› Issue (6): 1240-1251.doi: 10.12082/dqxxkx.2023.210585
• 专刊:地理时空知识图谱理论方法与应用 • 上一篇 下一篇
杨玉莹1(), 赵学胜1,*(
), 刘会园1, 彭舒2, 吕源鑫1
收稿日期:
2021-09-27
修回日期:
2021-11-15
出版日期:
2023-06-25
发布日期:
2023-06-02
通讯作者:
*赵学胜(1967— ),男,山东曹县人,教授,主要从事数字地球空间建模研究。E-mail: zxs@cumtb.edu.cn作者简介:
杨玉莹(1997— ),女,山东滨州人,硕士生,主要从事地表覆盖领域知识表达与知识图谱相关研究。E-mail: yangyuying9711@163.com
基金资助:
YANG Yuying1(), ZHAO Xuesheng1,*(
), LIU Huiyuan1, PENG Shu2, LV Yuanxin1
Received:
2021-09-27
Revised:
2021-11-15
Online:
2023-06-25
Published:
2023-06-02
Contact:
*ZHAO Xuesheng, E-mail: Supported by:
摘要:
湿地作为地表覆盖类型的一种,对于生物多样性与气候变化有着重要的意义,也是人类的基本生存环境之一。为更好地理解和表达湿地知识及分类间关系,本文提出了一种基于本体的湿地知识图谱构建方法。首先,利用GlobeLand30数据、生态地理分区数据,围绕湿地类型、特征分布等要素分析湿地领域知识,提取知识间的语义关系,通过本体建模形成湿地知识图谱的概念框架;其次,融合百度百科数据等进行湿地实体的提取、属性信息抽取,丰富湿地知识图谱的数据层;最后,使用图数据库Neo4j存储实体关系和实体属性,实现了湿地知识图谱构建。本文构建的知识图谱扩充了湿地实体的概念描述信息,探索了顾及时空特征的湿地知识表示方法,为地表覆盖领域的知识图谱构建提供了一个应用范例。
杨玉莹, 赵学胜, 刘会园, 彭舒, 吕源鑫. 基于地表覆盖数据的湿地知识图谱构建[J]. 地球信息科学学报, 2023, 25(6): 1240-1251.DOI:10.12082/dqxxkx.2023.210585
YANG Yuying, ZHAO Xuesheng, LIU Huiyuan, PENG Shu, LV Yuanxin. Building a Knowledge Graph for Wetlands based on Landcover Data[J]. Journal of Geo-information Science, 2023, 25(6): 1240-1251.DOI:10.12082/dqxxkx.2023.210585
表3
文本中所含依存关系类型
关系类型 | 标签 | 描述 | 例子 |
---|---|---|---|
主谓关系 | SBV | subject-verb | 全球红树林数据比较准确地标识了红树林的分布状况 (全球红树林数据标识) |
动宾关系 | VOB | 直接宾语,verb-object | 全球红树林数据比较准确地标识了红树林的分布状况(标识➝分布情况) |
间宾关系 | IOB | 间接宾语,indirect-object | 全球红树林数据比较准确地标识了红树林的分布状况(标识➝红树林) |
介宾关系 | POB | preposition-object | 森林/灌木地湿地在河流或湖泊周围(在➝周围) |
并列关系 | COO | coordinate | 由喜湿草本植物和草本植物覆盖高于20%的水面组成的沼泽和滨海草滩(和草本植物) |
独立结构 | IS | independent structure | 2个单句在结构上彼此独立 |
核心关系 | HED | head | 指整个句子的核心 |
…… | …… | …… | …… |
表4
模式层关系统计
排序 | 关系名称 | 数量/个 | 占比/% | 排序 | 关系名称 | 数量/个 | 占比/% |
---|---|---|---|---|---|---|---|
1 | 中文名 | 44 | 13.25 | 33 | 协同物质 | 1 | 0.30 |
2 | 外文名 | 40 | 12.05 | 34 | 作用机理 | 1 | 0.30 |
3 | 子类 | 35 | 10.54 | 35 | 界 | 1 | 0.30 |
4 | 别名(含简称) | 19 | 5.72 | 36 | 亚目 | 1 | 0.30 |
5 | 分布于 | 19 | 5.72 | 37 | 水深 | 1 | 0.30 |
6 | 面积 | 18 | 5.42 | 38 | 外形 | 1 | 0.30 |
7 | 学科 | 16 | 4.82 | 39 | 应用 | 1 | 0.30 |
8 | 波段影像特征 | 13 | 3.92 | 40 | 定义 | 1 | 0.30 |
9 | 人口数量 | 11 | 3.31 | 41 | 常见海域 | 1 | 0.30 |
10 | 分布特征 | 10 | 3.01 | 42 | 基本种类 | 1 | 0.30 |
11 | 公布时间 | 9 | 2.71 | 43 | 词性 | 1 | 0.30 |
12 | 植被特征 | 9 | 2.71 | 44 | 特征 | 1 | 0.30 |
13 | 类型 | 8 | 2.41 | 45 | 分布地区 | 1 | 0.30 |
14 | 气候条件 | 6 | 1.81 | 46 | 生物特点 | 1 | 0.30 |
15 | 经纬度 | 4 | 1.20 | 47 | 所属类别 | 1 | 0.30 |
16 | 位置 | 4 | 1.20 | 48 | 植被特点 | 1 | 0.30 |
17 | 语种 | 3 | 0.90 | 49 | 形成方式 | 1 | 0.30 |
18 | 地形 | 3 | 0.90 | 50 | 属性 | 1 | 0.30 |
19 | 释义 | 3 | 0.90 | 51 | 特点 | 1 | 0.30 |
20 | 气候类型 | 3 | 0.90 | 52 | 国家总数 | 1 | 0.30 |
21 | 纬度 | 3 | 0.90 | 53 | 经纬度 | 1 | 0.30 |
22 | 下辖地区 | 3 | 0.90 | 54 | 国家数量 | 1 | 0.30 |
23 | 纹理特征 | 3 | 0.90 | 55 | 包含 | 1 | 0.30 |
24 | 纹理特征 | 3 | 0.90 | 56 | 濒临大洋 | 1 | 0.30 |
25 | 范围 | 2 | 0.60 | 57 | 海岸线长度 | 1 | 0.30 |
26 | 结构 | 2 | 0.60 | 58 | 最高点 | 1 | 0.30 |
27 | 功能 | 2 | 0.60 | 59 | 最低点 | 1 | 0.30 |
28 | 经度 | 2 | 0.60 | 60 | 陆地平均海拔 | 1 | 0.30 |
29 | 行政区类别 | 2 | 0.60 | 61 | 冰层平均厚度 | 1 | 0.30 |
30 | 性质 | 1 | 0.30 | 62 | 深度 | 1 | 0.30 |
31 | 美誉 | 1 | 0.30 | 63 | 区域组织 | 1 | 0.30 |
32 | 下限 | 1 | 0.30 | ||||
模式层关系数目/个 | 332 | 模式层关系占比/% | 100 |
表5
数据层属性关系统计
数据层属性关系 | |||||||
---|---|---|---|---|---|---|---|
排序 | 关系名称 | 数量/个 | 占比/% | 排序 | 关系名称 | 数量/个 | 占比/% |
1 | 中文名称 | 649 | 13.51 | 23 | 政府驻地 | 30 | 0.62 |
2 | 面积 | 635 | 13.22 | 24 | 人口数量 | 30 | 0.62 |
3 | 地理位置 | 632 | 13.15 | 25 | 火车站 | 30 | 0.62 |
4 | 级别(含森林公园级别) | 590 | 12.28 | 26 | 车牌代码 | 30 | 0.62 |
5 | 批准时间 | 505 | 10.51 | 27 | 地区生产总值 | 30 | 0.62 |
6 | 管理单位 | 376 | 7.83 | 28 | 邮政区码 | 29 | 0.60 |
7 | 气候带 | 183 | 3.81 | 29 | 门票价格 | 26 | 0.54 |
8 | 湿地类型 | 107 | 2.23 | 30 | 邻接 | 23 | 0.48 |
9 | 地理区域 | 93 | 1.94 | 31 | 保护对象 | 23 | 0.48 |
10 | 类型 | 73 | 1.52 | 32 | 行政区划代码 | 22 | 0.46 |
11 | 著名景点 | 46 | 0.96 | 33 | 电话区号 | 17 | 0.35 |
12 | 外文名 | 45 | 0.94 | 34 | 省委书记 | 16 | 0.33 |
13 | 气候条件 | 43 | 0.89 | 35 | 省长 | 16 | 0.33 |
14 | 开放时间 | 41 | 0.85 | 36 | 气候类型 | 16 | 0.33 |
15 | 经纬度 | 41 | 0.85 | 37 | 所属国家 | 15 | 0.31 |
16 | 别名 | 35 | 0.73 | 38 | 方言 | 8 | 0.17 |
17 | 所属地区 | 34 | 0.71 | 39 | 适宜游玩季节 | 8 | 0.17 |
18 | 行政区类别 | 31 | 0.65 | 40 | 建议游玩时长 | 7 | 0.15 |
19 | 植被类型 | 31 | 0.65 | 41 | 建议游玩时长 | 7 | 0.15 |
20 | 植被类型 | 31 | 0.65 | 42 | 所属城市 | 6 | 0.12 |
21 | 机场 | 31 | 0.65 | 43 | 高等学府 | 5 | 0.10 |
22 | 下辖地区 | 30 | 0.62 | ||||
属性关系数目合计/个 | 4805 | 属性关系占比/% | 100 |
[1] |
Jonathan A, Foley. Global consequences of land use[J]. Science, 2005, 309(5734):570-574. DOI:10.1126/science.1111772
doi: 10.1126/science.1111772 pmid: 16040698 |
[2] |
Weise K, Höfer R, Franke J, et al. Wetland extent tools for SDG 6.6.1 reporting from the Satellite-based Wetland Observation Service (SWOS)[J]. Remote Sensing Environment, 2020, 247:111892. DOI:10.1016/j.rse.2020.111892
doi: 10.1016/j.rse.2020.111892 |
[3] |
陆锋, 余丽, 仇培元. 论地理知识图谱[J]. 地球信息科学学报, 2017, 19(6):723-734.
doi: 10.3724/SP.J.1047.2017.00723 |
[ Lu F, Yu L, Qiu P Y. On geographical knowledge graph[J]. Journal of Geo-information Science, 2017, 19(6):723-734. ] DOI:10.3724/SP.J.1047.2017.00723
doi: 10.3724/SP.J.1047.2017.00723 |
|
[4] | Sowaj F. Principles of semantic networks: Exploration in the representation of knowledge[M]. SanMateo Calif: Morgan Kaufmann, 1991:135-157. |
[5] | Singhal A. Official google blog: Introducing the knowledge graph: things, not strings[J]. Northwestern University: Evanston, IL,USA, 2012. |
[6] | 刘峤, 李杨, 段宏, 等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3):582-600. |
[ Liu Q, Li Y, Duan H, et al. Overview of knowledge graph construction technology[J]. Computer Research and Development, 2016, 53(3):582-600. ] DOI:10.7544/issn1000-1239.2016.20148228
doi: 10.7544/issn1000-1239.2016.20148228 |
|
[7] | 张雪英, 张春菊, 吴明光, 等. 顾及时空特征的地理知识图谱构建方法[J]. 中国科学:信息科学, 2020, 50(7):1019-1032. |
[ Zhang X Y, Zhang C J, Wu M G, et al. Spatio-temporal features based geographical knowledge graph construction[J]. Science in China: Information Science, 2020, 50(7):1019-1032. ] DOI:10.1360/SSI-2019-0269
doi: 10.1360/SSI-2019-0269 |
|
[8] |
Vrandeč ic D, Krötzsch M. Wikidata: A free collaborative knowledgebase[J]. Communications of the Acm, 2014, 57(10):78-85. DOI:10.1145/2629489
doi: 10.1145/2629489 |
[9] |
Suchanek F M, Kasneci G, Weikum G. Yago: A core of semantic knowledge[C]. Proceedings of the 16th international conference on World Wide Web. ACM, 2007:697-706. DOI:10.1145/1242572.1242667
doi: 10.1145/1242572.1242667 |
[10] | 赵毓诚, 陈建军. 人工智能领域知识图谱构建与分析[J]. 计算机与数字工程, 2021, 49(3):514-520. |
[ Zhao Y C, Chen J J. Construction and analysis of knowledge graphs in the field of artificial intelligence[J]. Computer and Digital Engineering, 2021, 49(3):514-520. ] DOI:10.3969/j.issn.1672-9722.2021.03.019
doi: 10.3969/j.issn.1672-9722.2021.03.019 |
|
[11] | 孙敏敏, 毛雪岷. 基于Neo4j的肺部疾病知识图谱构建[A].中国管理现代化研究会、复旦管理学奖励基金会. 第十五届(2020)中国管理学年会论文集[C]. 中国管理现代化研究会、复旦管理学奖励基金会: 中国管理现代化研究会, 2020. |
[ Sun M M, Mao X M. Construction of knowledge graph of lung diseases based on Neo4j[A]. China Management Modernization Research Association, Fudan Management Award Foundation. Proceedings of the 15th (2020) China Management Conference[C]. China Management Modernization Research Association, Fudan Management Award Foundation: China Management Modernization Research Association, 2020. ] | |
[12] | 马雷雷. 空间关系本体描述与推理机制研究[D]. 郑州: 解放军信息工程大学, 2012. |
[ Ma L L. Research on spatial relation ontology description and reasoning mechanism[D]. Zhengzhou: Information Engineering University, 2012. ] | |
[13] | 刘鎏. 基于地理本体的吉林地域知识图谱的构建[D]. 北京: 北京交通大学, 2017. |
[ Liu L. Construction of Jilin region knowledge graph based on geographic ontology[D]. Beijing: Beijing JiaoTong University, 2017. ] | |
[14] | 蒋秉川, 万刚, 许剑, 等. 多源异构数据的大规模地理知识图谱构建[J]. 测绘学报, 2018, 47(8):1051-1061. |
[ Jiang B C, Wan G, Xu J, et al. Geographic knowledge graph building extracted from multi-sourced Heterogeneous data[J]. Journal of Surveying and Mapping, 2018, 47(8):1051-1061. ] DOI:10.11947/j.AGCS.2018.20180113
doi: 10.11947/j.AGCS.2018.20180113 |
|
[15] |
Jiang B C, Tan L, Ren Y, et al. Intelligent interaction with virtual geographical environments based on geographic knowledge graph[J]. ISPRS International Journal Geo-Information, 2019, 8(10):428. DOI:10.3390/ijgi8100428
doi: 10.3390/ijgi8100428 |
[16] |
刘俊楠, 刘海砚, 陈晓慧, 等. 面向多源地理空间数据的知识图谱构建[J]. 地球信息科学学报, 2020, 22(7):1476-1486.
doi: 10.12082/dqxxkx.2020.190565 |
[ Liu J N, Liu H Y, Chen X H, et al. The Construction of knowledge graph towards multi-source geospatial data[J]. Journal of Geo-information Science, 2020, 22(7):1476-1486. ] DOI:10.12082/dqxxkx.2020.190565
doi: 10.12082/dqxxkx.2020.190565 |
|
[17] |
Shu W, Wang X Y, Ye P, et al. Geographic Knowledge Graph (GeoKG): A formalized geographic knowledge representation[J]. ISPRS International Journal of Geo-information, 2019, 8(4):184. DOI:10.3390/ijgi8040184
doi: 10.3390/ijgi8040184 |
[18] |
Wang X L, Wu X L. A novel knowledge representation method based on ontology for natural disaster decision-making[C]. 2012 IEEE International Conference on Computer Science and Automation Engineering(CSAE), Zhangjiajie, China, 2012. DOI:10.1109/CSAE.2012.6272947
doi: 10.1109/CSAE.2012.6272947 |
[19] | 杜志强, 李钰, 张叶廷, 等. 自然灾害应急知识图谱构建方法研究[J]. 武汉大学学报·信息科学版, 2020, 45(9):1344-1355. |
[ Du Z Q, Li Y, Zhang Y T, et al. Research on the construction method of natural disaster emergency knowledge graph[J]. Journal of Wuhan University (Information Science Edition), 2020, 45(9):1344-1355. ] DOI:10.13203/j.whugis20200047
doi: 10.13203/j.whugis20200047 |
|
[20] |
Liu P C, Huang Y L, Wang P, et al. Construction of typhoon disaster knowledge graph based on graph database Neo4j[C]. Proceedings of the 32nd China Control and Decision Conference, 2020. ] DOI:10.1109/CCDC49329.2020.9164384
doi: 10.1109/CCDC49329.2020.9164384 |
[21] | 陈军, 刘万增, 武昊, 等. 基础地理知识服务的基本问题与研究方向[J]. 武汉大学学报·信息科学版, 2019, 44(1):38-47. |
[ Chen J, Liu W Z, Wu H, et al. Basic problems and research directions of basic geographic knowledge services[J]. Journal of Wuhan University (Information Science Edition), 2019, 44(1):38-47. ] DOI:10.13203/j.whugis20180441
doi: 10.13203/j.whugis20180441 |
|
[22] | 陈军, 陈晋, 廖安平, 等. 全球30 m地表覆盖遥感制图的总体技术[J]. 测绘学报, 2014, 43(6):551-557. |
[ Chen J, Chen J, Liao A P, et al. General technology of remote sensing mapping of global 30m land cover[J]. Journal of Surveying and Mapping, 2014, 43(6):551-557. ] DOI:10.13485/j.cnki.11-2089.2014.0089
doi: 10.13485/j.cnki.11-2089.2014.0089 |
|
[23] | 郭剑毅, 李真, 余正涛, 等. 领域本体概念实例、属性和属性值的抽取及关系预测[J]. 南京大学学报:自然科学版, 2012, 48(4):383-389. |
[ Guo J Y, Li Z, Yu Z T, et al. Domain ontology concept instance, attribute and attribute value extraction and relationship prediction[J]. Journal of Nanjing University: Natural Science Edition, 2012, 48(4):383-389. ] DOI:10.13232/j.cnki.jnju.2012.04.015
doi: 10.13232/j.cnki.jnju.2012.04.015 |
|
[24] |
王东旭, 诸云强, 潘鹏, 等. 地理数据空间本体构建及其在数据检索中的应用[J]. 地球信息科学学报, 2016, 18(4):443-452.
doi: 10.3724/SP.J.1047.2016.00443 |
[ Wang D X, Zhu Y q, Pan P, et al. Construction of geodata spatial ontology and its application in data retrieval[J]. Journal of Geo-information Science, 2016, 18(4):443-452. ] DOI:10.3724/SP.J.1047.2016.00443
doi: 10.3724/SP.J.1047.2016.00443 |
|
[25] | Art C L. The Ramsar Convention Manual: A guide to the convention on wetlands (Ramsar, Iran, 1971)[J]. Ramsar Convention Secretariat Gland Switzerland, 2006, 21(84):691-693. |
[26] |
Olson D M, Dinerstein E, Wikramanayake E D, et al. Terrestrial ecoregions of the world: a new map of life on Earth[C]// 2001:933-938. DOI:10.1641/0006-3568(2001)051
doi: 10.1641/0006-3568(2001)051 |
[27] |
Allen J F. Towards a general theory of action and time[J]. Artif Intell, 1984, 23:123-154. DOI:10.1016/0004-3702(84)90008-0
doi: 10.1016/0004-3702(84)90008-0 |
[28] | 陆锋, 张恒才. 大数据与广义GIS[J]. 武汉大学学报·信息科学版, 2014, 39(6):645-654. |
[ Lu F, Zhang H C. Big data and generalized GIS[J]. Journal of Wuhan University (Information Science Edition), 2014, 39(6):645-654. ] DOI:10.13203/j.whugis20140148
doi: 10.13203/j.whugis20140148 |
|
[29] | Mihalcea R, Tarau R. TextRank: Bringing order into texts[C]. Proceedings of 2004 Conference on Empirical Methods in Natural Language Processing. Barcelona, Spain, 2004:404-411. |
[1] | 张春菊, 刘文聪, 张雪英, 叶鹏, 汪陈, 朱少楠, 张达玉. 基于本体的金矿知识图谱构建方法[J]. 地球信息科学学报, 2023, 25(7): 1269-1281. |
[2] | 罗秋雨, 乐阳, 谷岩岩. 城市地铁出行知识图谱嵌入表达的超参数选择[J]. 地球信息科学学报, 2023, 25(6): 1164-1175. |
[3] | 桂志鹏, 胡晓辉, 刘欣婕, 凌志鹏, 姜屿涵, 吴华意. 顾及地理语义的地图检索意图形式化表达与识别[J]. 地球信息科学学报, 2023, 25(6): 1186-1201. |
[4] | 唐曾杨, 艾廷华, 徐海江. 地理知识图谱下的建筑群空间分布模式推理[J]. 地球信息科学学报, 2023, 25(6): 1202-1214. |
[5] | 王益鹏, 张雪英, 党玉龙, 叶鹏. 顾及时空过程的台风灾害事件知识图谱表示方法[J]. 地球信息科学学报, 2023, 25(6): 1228-1239. |
[6] | 刘建湘, 陈晓慧, 刘海砚, 张兵, 徐立, 刘涛, 付雨萌. 基于轨迹语义的船舶活动知识图谱构建[J]. 地球信息科学学报, 2023, 25(6): 1252-1266. |
[7] | 陆锋, 诸云强, 张雪英. 时空知识图谱研究进展与展望[J]. 地球信息科学学报, 2023, 25(6): 1091-1105. |
[8] | 蒋秉川, 黄梓航, 任琰, 孙勇, 范爱民. 基于时序超图模型的战场环境多层次知识建模方法[J]. 地球信息科学学报, 2023, 25(6): 1148-1163. |
[9] | 陈晖萱, 郭旦怀, 葛世寅, 王婧, 王彦棡, 陈峰, 杨微石. M2T多源知识图谱融合的空间场景描述文本自动生成框架[J]. 地球信息科学学报, 2023, 25(6): 1176-1185. |
[10] | 诸云强, 孙凯, 胡修棉, 闾海荣, 王新兵, 杨杰, 王曙, 李威蓉, 宋佳, 苏娜, 牟兴林. 大规模地球科学知识图谱构建与共享应用框架研究与实践[J]. 地球信息科学学报, 2023, 25(6): 1215-1227. |
[11] | 段艳慧, 赵学胜, 彭舒. 基于信息熵的GlobeLand 30和WorldCover耕地破碎区一致性分析[J]. 地球信息科学学报, 2023, 25(5): 1027-1036. |
[12] | 刘宇, 李勇. 面向城市可持续发展的城市商圈/街区知识图谱构建方法与应用展望[J]. 地球信息科学学报, 2023, 25(12): 2374-2386. |
[13] | 卢万杰, 刘伟, 牛朝阳, 谢丽敏, 吕亮. 服务于空天协同对地观测的语义信息模型构建[J]. 地球信息科学学报, 2022, 24(8): 1421-1431. |
[14] | 徐召华, 诸云强, 宋佳, 孙凯, 王曙. 基于词嵌入的地理知识库实体类别对齐方法研究[J]. 地球信息科学学报, 2021, 23(8): 1372-1381. |
[15] | 陈晓玲, 唐丽玉, 胡颖, 江锋, 彭巍, 冯先超. 基于ALBERT模型的园林植物知识实体与关系抽取方法[J]. 地球信息科学学报, 2021, 23(7): 1208-1220. |
|