全息地球数据立方体模型研究

  • 罗斌 , 1, 6 ,
  • 任丽秋 , 2, * ,
  • 毛悦 3, 4 ,
  • 史瑞鹏 5 ,
  • 诸云强 1 ,
  • 吴超伟 6
展开
  • 1.中国科学院地理科学与资源研究所 资源与环境信息系统国家重点实验室,北京 100101
  • 2.61206部队,北京 100042
  • 3.地理信息工程国家重点实验室,西安 710054
  • 4.西安测绘研究所,西安 710054
  • 5.西安测绘总站,西安 710054
  • 6.北京星球时空科技有限公司,北京 100083
*任丽秋(1976— ),女,硕士,高级工程师,主要研究方向为摄影测量与遥感。E-mail:

罗 斌(1982— ),男,硕士,湖南邵阳人,主要从事全息地图与数字地球平台技术研究。E-mail:

收稿日期: 2023-03-03

  修回日期: 2023-04-27

  网络出版日期: 2023-06-30

基金资助

国家重点研发计划项目(2018YFE0204203)

Research on the Digital Holographic Earth Data Cube Model

  • LUO Bin , 1, 6 ,
  • REN Liqiu , 2, * ,
  • MAO Yue 3, 4 ,
  • SHI Ruipeng 5 ,
  • ZHU Yunqiang 1 ,
  • WU Chaowei 6
Expand
  • 1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Acadmay of Science, Beijing 100101, China
  • 2. 61206 Troops, Beijing 100042, China
  • 3. State Key Laboratory of Geo-Information Engineering, Xi'an 710054, China
  • 4. Research Institute of Surveying and Mapping, Xi'an 710054, China
  • 5. The Surveying and Mapping Geospatial Center, Xi'an 710054, China
  • 6. Beijing StarEarth Technology Co., Ltd., Beijing 100083, China
*REN Liqiu, E-mail:

Received date: 2023-03-03

  Revised date: 2023-04-27

  Online published: 2023-06-30

Supported by

National Key Research and Development Program of China(2018YFE0204203)

摘要

进入地球大数据与地球人工智能时代,数字地球建模要求也从地表扩展到全域全时全息,而当前数字地球的数据模型还基本停留在瓦片或地球网格剖分数据模型阶段,严重制约了场景化、智能化数字地球应用。本文提出了全息地球概念以及相应的地球数据立方体组织模型,采用全球多级格网参考系统来描述和表达多尺度空间,用平面或立体格元来表达空间位置,将传统“经度、纬度、高程、时间”时空表达发展至“时间粒度、时间覆盖、网格位置、格网尺度”新时空表达体系,并设计了按照“时间—空间—尺度—属性”一致性描述的全息地球数据建模方案,将矢量、栅格、格网、时序阵列、三维模型等多模态数据归纳至一个统一模型中,使得任何引用特定地球数据立方体中的数据值在时间、空间、尺度都是对齐的,解决了全息地球跨专业、多维时空动态场景数据时空融合集成难题,并结合深时数字地球国际大科学计划全球数字化科研平台需求,开发了深时古地形时空动态可视化模拟系统,完成对模型的验证。

本文引用格式

罗斌 , 任丽秋 , 毛悦 , 史瑞鹏 , 诸云强 , 吴超伟 . 全息地球数据立方体模型研究[J]. 地球信息科学学报, 2023 , 25(7) : 1282 -1296 . DOI: 10.12082/dqxxkx.2023.230105

Abstract

With the development of big data and artificial intelligence, the scope of digital earth modeling has extended to full-time holography beyond the earth surface. However, the current data model of digital earth still remains in the data modelling of earth tile or grid subdivision. This model severely limits the application of scenario-based and intelligent digital earth development. This paper proposes the concept of digital holographic earth and a corresponding data organization model of earth data cube. By using global multi-level grid reference system to describe and express multi-scale space and using two or three-dimensional grid cells to describe spatial positions, the traditional spatiotemporal description of "longitude, latitude, elevation, and time" is transformed to a new spatiotemporal description system of "time granularity, time coverage, grid position, and grid scale". The proposed model is characterized by the dimensions of "time-space-scale-attribute" based on spatiotemporal big data in the digital earth. The model encapsulates vectors, rasters, grids, time series arrays, and 3D models into an unified system. This unified system ensures that any data value of a specific earth data cube is aligned perfectly in time, space, and scale, which solves the problem of multi-dimensional or spatiotemporal dynamic fusion of big earth data. Finally, this paper develops a deep-time and spatiotemporal dynamic visualization simulation system to verify the data model based on the requirements of the Deep-time Digital Earth International Science Program.

1 引言

1998年戈尔首次提出“数字地球”的概念。它是一个以地理坐标(经纬网)为依据的、具有多分辨率海量数据、三维显示地球的技术系统,以计算机技术、多媒体技术、卫星遥感技术、空间信息技术和大规模存储技术为基础,以高速宽带网络为纽带,用数字的方法将地球、地球上的活动及整个地球环境的时空变化装入电脑中,实现在网络上的流通和可视化[1-2]。本质上数字地球就是信息化地球的虚拟对照体,数字地球将有关地球上每一点的全部信息,按地球的地理坐标加以整理,然后构成一个全球的信息模型。
随着大数据时代的到来,数字地球作为利用海量、多分辨率、多时相、多类型对地观测数据和社会经济数据及其分析算法和模型构建的虚拟地球,充分体现了大数据的4V特性[3],特别是地球大数据与人工智能结合,2022年2月,美国宇航局地球科学数据系统工作组指出指数级积累的科学数据集与地球人工智能理论结合将把地球科学带入下一个阶段,数字地球研究迎来新的热潮,如英国量化并理解地球系统计划(QUEST),美国地球透镜计划(Earth Scope),国际科学理事会的未来地球计划(Future Earth),以及由我国科学家发起并主导的首个国际大科学计划:深时数字地球(Deep-time Digital Earth, DDE);相应地数字地球研究也出现了一系列新概念,如行星地球概念[4]的提出,指出数字地球建模从地表空间扩展到地球全域空间,涵盖固体地球、地球表层(陆、海、低层大气)、中高层大气、电离层、磁层及行星际,数字地球进入多圈层耦合的地球系统[5]研究阶段;我国地调局面向“透明国土”以及新型基础设施建设提出了“全息数字地球基础框架”,通过整合固体地球各类三维地质模型数据并搭建平台,为国家能源资源安全保障、生态文明建设、自然资源精细化管理、地球生命共同体构建等需求服务。本文正是在这一背景下,研究新一代数字地球概念体系以及应对地球大数据治理的有效解决方案,即主要面向新一代数字地球建模呈现出的“全域空间、多时空尺度、全要素整合”的全息信息特征[6],提出新一代数字地球数据模型,设计地球大数据组织方案,并在应用中进行验证。

2 全息地球与地球大数据

根据地球系统科学理论,地球是一个复杂的四维动态演化系统,它既包括现代地球的三维空间系统(如深空、深海和深地),也包括46亿年地球演化的一维时间系统(深时),新一代数字地球建模需要对传统数字地球在2个方向上进行拓展和延伸,一是横向拓展,实现陆海统筹的全球;二是纵向延伸,实现空天地海的全球,这样就形成一个以地球表层为核心陆海融合,上接大气圈及外太空,下联固体地球及深地空间的广义化现代数字地球模型;同时结合岩石对地球历史记录以及地球系统运行演化规律,重建过去的古地球并预测地球未来发展,从而在建模空间中形成以观测数据为主构建的现代地球、以实验分析模拟数据为主构建的古地球与未来地球,并通过建模转换将物理空间的地球系统映射到赛博空间,构建一个时间与空间对准、尺度对齐、属性语义表达一致的四维时空融合的全息数字地球,即陆海空天地一体化全要素、全空间、多尺度时空融合的全息地球(图1),支撑地球系统科学研究场景化建模与表达、地球系统仿真模拟、时空大数据分析计算、时空知识发现等。
图1 全息地球概念框架

Fig. 1 The conceptual framework of the digital holographic earth

全息地球数据既包括地形、地质、气象、水文等自然条件数据,也包括人口、民族、交通、建筑物、生产、社会等人文条件数据,以及信息、网络、空天目标、电磁状况以及实验模拟数据,涵盖测绘地理、导航时频、气象水文、地质与地球物理、太空环境等多个专业,这些数据除了具备显著的空间性特征、以及空间对象动态演变的时间性特征之外,还具备传统大数据4V特征,以及“位置、时间、属性、尺度、多源异构、多维”时空大数据典型特征[7],并呈现“全息可视化”应用特征(图2)。
图2 全息地球数据特征

Fig. 2 The characteristic of the digital holographic earth spatio-temporal data

综上,全息地球数据是一种典型的地球大数据,需要解决当前数字地球平台在应对全域全时全息地球大数据组织管理难题,所以本文以全息论[6]为指导,借鉴全息位置地图[8]数据组织模型,研究基于精确统一的时空基准、全球网格剖分、地球全域多圈层叠加融合的时空数据集成融合方法[9-14],并按照多尺度可视化、时间序列分析、主题关联分析等要求,对全息地球建模各组成要素的时空特性进行归纳与抽象,构建横向分块、纵向分层、时空场景统一描述的数据模型,实现以时空位置为基础进行全信息的整合[8],即对地球表面上的任意一点,垂直方向上,将包括地上、地表和地下空间的数字地球相关信息;在水平方向上,将包括局部区域和广域空间特征信息;在尺度涵盖上,将包括全球宏观尺度、国家区域尺度、目标精细尺度等;在时间方向上,将包括过去、现在以及可能的将来的信息。

3 地球数据立方体概念模型

3.1 问题分析

由于数据整合的跨专业性,数据产生方式的多样性,数据应用的场景化,全息地球数据集成已然面临时间、空间、尺度、语义等数据异构问题,并且呈现异构数据在统一时空框架下整合难,跨结构化时空数据统一存储组织难,缺乏时空多维地球大数据集成的统一数据模型。国际上以谷歌地球为代表的数字地球产品,当前基本还停留在地表数据为主阶段,适当扩充了一些气象领域数据,固体地球、太空环境等领域数据尚未接入,其数据组织方式(图3),在继承了传统GIS矢栅要素模型基础上发展了瓦片数据组织模型[15-16],前端采用“资源目录树”的方式对矢栅要素数据进行集成。澳大利亚“数据立方体”实现了可供快速分析应用的时空多维、空间配准的像素堆列[16-18],但主要针对遥感影像栅格数据并不能很好的处理矢量、格网等数据类型。在空间数据集成方面,国外研究者探讨由空间维、非空间维和度量构成的空间数据立方体模型,研究其计算方法和分析过程,提出目标选择视图算法[19];解析空间数据立方体高效操作的原理,提出基于最佳空间粒度的空间索引分类分层算法,以处理任意的概括性数据聚集[20];将地图数据立方体当作空间数据仓库的可视化工具,探讨地图数据立方体的上钻、下翻及其他分析操作[21];国内学者继承发展了国际上空间数据立方体研究成果,提出了非空间维、空间维、数字度量以及空间度量的概念和结构,并给出空间数据立方体的定义[22-23]。瓦片数据模型、影像数据立方体等解决了全球大规模空间数据组织管理问题、时序影像数据统一组织问题[16,18],空间数据立方体采用维度建模解决了多元异构空间数据集成应用问题,但这些数据模型并不能适应新一代数字地球“陆地到海洋、地面到空天、地球表层到地质地下、有形到无形、相对静态到实时动态”全域全时全息场景化建模的要求,比如如何建立矢栅统一的数据模型,在最小区域单元上实现要素级的矢栅数据精准匹配,进而在全球范围解决这一问题[24];如何选取合适的方法将不同尺度数据进行融合,解决跨尺度应用时数据的一致性问题;如何对空间对象产生和演化的时空过程数据进行融合,解决现有建模方法对连续过程表达能力不足问题;如何对场景建模的时空定位、几何结构、时空关系、时空过程等时空数据归一化到一个概念模型并指导全球数据一体化组织管理,解决高并发访问时数据检索的精度和效率问题[25-32]
图3 谷歌地球数据模型

Fig. 3 Data model of Google Earth

3.2 维度建模框架设计

针对以上问题,本文采用数据立方体维度建模方法,按照“时间、空间、尺度、属性”维度对全息地球数据进行组织,支撑地球科学各圈层、不同学科领域,不同模态和类型数据的整合集成与高效利用。数据立方体是二维表格的多维扩展,能够支持多个角度探索和分析数据的多维矩阵,一般可将三维的数据立方体看作是一组类似的相互叠加的二维表格,全息地球表达的每一类要素都可看成是具有空间字段的二维表格,即空间数据立方体[22-23,33],从数据堆叠角度立方体可以理解为不同要素数据集二维表格数据的相互堆叠。在堆叠的过程中区分纵向上不同尺度的数据分层,以及横向上全球数据组织网格分块[34],且对不同要素数据在时间维度上进行融合集成区分不同时间粒度数据分层。另外由于每类要素数据二维表格中又包括多个属性字段,各类要素数据融合到一个立方体中将包括属性n维变量,这样全息地球数据组织维度建模就是一个包含时空四维并区分时空尺度、属性n维的数据立方体。
时间维指随时间变化,具有时态性,需要有一个精确的时间基准,时间尺度信息一般内含于时间维中,并未显性作为特定维度参与数据建模。空间维指具有精确的空间位置或空间分布特征,具有可量测性,需要一个精确的空间基准,空间尺度信息一般也内含于空间维中,并未显性作为特定维度参与数据建模,因此传统GIS时空四维建模不能显性表达数字地球多时空尺度一体化场景建模的要求。通过将内含于时间与空间维度中尺度信息显性提取出来,即将时间维分解为时间粒度与时间覆盖2个维度,空间维采用多级格网参考系统[12-13]下的空间及尺度描述,分解为格网尺度与格网位置2个维度,将传统的数字地球四维时空(xyzt) 建模[7],发展至时空六维(xyz,空间尺度s,时间粒度ts,时间覆盖tc),并采用地球网格剖分的方法聚合空间(xyz)三维,表达成格元(或体元)一维,形成支撑地球数据立方体模型的新四维时空(格元或体元g,空间尺度s,时间粒度ts,时间覆盖tc)维度建模框架(图4)。
图4 全息地球数据立方体组织的时空维度扩展

Fig. 4 The spatio-temporal dimension extension for the digital holographic earth data cube organization

3.3 数据网格剖分组织

空间数据建模主要有4种基本方式,即以矢量格式建模离散的特征群、以单元格网建模的光谱或属性数据、以一系列三角点建模的一个表面、以连接特征建模的一个网络。以矢量数据建模时,几何数据采用点、线、面的方式来表达,描述具有精确形状和边界的离散对象,属性数据采用特征描述的方式来表达;以栅格数据建模时,采用栅格数据来表达影像数据或连续数据,栅格中的每一个像元作为可量测的单元;以三角网数据建模时,采用不规则三角网的方式来表达地形表面。每种模型以不同的数据形式来表达反映客观世界,具有不同的数据组织、存储、管理和处理方法。本文将全息地球数据建模形式分为矢量方式、栅格方式、格网方式、三维模型方式,对这些数据在统一的时空框架下进行融合集成时,设计中间的“统一数据模型”,将场空间数据模型(栅格模型、格网模型、三维模型)、矢量空间数据模型转化到该“统一数据模型”,即网格剖分数据模型。具体实现方式是在规定全球多级格网参考系统的地理空间坐标系、网格结构、地理编码、量化策略的基础上,设计网格剖分的数据空间裁切、要素属性重组的规则,将矢量、栅格、格网、三维模型数据源采样或分割重组的数据值或要素集,分配给全球多级格网参考系统格元,从而实现通过格网统筹空间、时间和属性,基于多级格网参考系统这样一个映射基准,将传统空间、时间、属性维组织的时空数据,处理映射到空间对准、尺度对齐的全球统一空间框架中(图5)。
图5 网格剖分数据模型及其作用

Fig. 5 The function of the mesh division data model

3.4 时空融合集成

区别于传统空间对象经纬度坐标或地名空间位置描述的区位标识,对依附在不同空间范围,缺乏共同空间框架,不同尺度无法整合集成和共享的空间数据,采用网格位置进行空间数据的融合集成是一种有效的方法[9,13],即将数据剖分组织粒度上分为全球区域、局部区域、空间对象集合、空间对象、格元5个不同层次,自上而下是一个从宏观到微观不断剖分细化的过程。针对不同的应用场景,采取不同层次粒度的数据组织方法,将矢量、像素、格网、时序、三维模型空间数据重新剖分产生一套面向数据集成需求的剖分数据,使得不同粒度的空间数据都具备网格位置这一属性特征,并通过这些网格位置,采取尺度匹配和网格镶嵌的方法,将剖分数据整合至全球多级格网参考系统中,从而实现全球范围多元异构空间数据基于网格位置的集成,如图6所示。
图6 基于网格位置的空间数据集成

Fig. 6 The integration of spatial data based on grid location

在全球多级格网参考系统下,网格空间上的时间序列集采用二维格网坐标轴来表示现实世界中的平面位置空间。用一维的时间轴表示平面格网位置随时间的变化,这样由二维的平面空间和一维的时间就组成了一个三维的时空立方体。任意指定一个时刻,都可从三维的时空立方体中得到相应的截面,即现实世界的平面几何形态。立方体结构将具有行、列和时间步长。如果将行数乘以列数和时间步长数,则将得到立方体中的条柱总数。行和列可确定立方体的空间范围,而时间步长则可确定时态范围,时间维度集成示意如图7所示。
图7 时间维度融合集成

Fig. 7 The data fusion and integration in the time dimension

3.5 地球数据立方体模型的提出

地球数据立方体定义为,按照数据立方体维度建模理念,在统一时空基准与全球网格框架下,将时空多维、空间配准、网格剖分、尺度对齐的像素、矢量、格网、时序阵列、三维模型数据堆列,基于“时间—空间—尺度—属性”一致性描述的数据立方体维度组织模型,实现不同专业来源、多时相、多尺度地球大数据按照一定主题分层叠加、融合集成为一个有机体。具体从数据组织的角度,选取“时间粒度维、时间覆盖维、网格位置维、格网尺度维、要素属性维”5个维度的数据组织框架,维之间相互垂直(图8)。
图8 地球数据立方体模型

Fig. 8 The data cube model of the digital holographic earth

考虑到时间序列分析一般诸如按年—季度—月—日、也可以是时—分—秒统一时间尺度进行分析,所以将时间维度拆分成时间粒度与时间覆盖两个维度;属性维的维成员是其树状指标中所有节点的组合,亦根据不同的分析需求而定;网格位置维的维成员是其特定级别格网格元空间填充曲线的整数编码;格网尺度维的度量是一个分级整数,表征格元所在格网的级别。

4 地球数据立方体物化组织模型

通过地球网格剖分的方法将全球的矢量、栅格、格网、三维模型、时序阵列数据组织到全球多级格网参考系统的统一信息媒介中,并按照“时间粒度—时间覆盖—网格位置—格网尺度—要素属性”立方体维度建模,将不同专业来源、多时相、多尺度的全息地球数据组织成为一个有机体,这实际上是一个高阶的逻辑层次数据组织方案,在具体的应用时需要将立方体物化操作派生低阶数据模型,如金字塔、主题关联集、时间序列集等。

4.1 时间-空间参考系统建立

时间参考系统是支撑多源时空数据融合集成的时间原点(起始历元)和时间单位(尺度)等时间信息参考规定,是描述全息地球多元时空数据时间维度的标尺。一般包括数据集时间描述所采用的时间坐标系统、时间粒度、时间覆盖3个方面的信息,以确保不同时间描述的多元数据集、数据子集、数据表等数据要素在同一的时间参考系统下进行融合集成。例如,采用北京时间UTC/GMT +8.00与ISO8601 interval标准建立时间参考系统。
从全球的空间参考系统角度,通过采用尺度分层级的、能够完整镶嵌地球表面的格网单元,对全球进行划分并描述其地址信息,为多元时空数据融合集成提供空间固定参考位置[10-11],即全球多级格网参考系统,由地理空间坐标系、网格结构、地理编码、量化策略四部分组成。全球多级格网参考系统将地球表面无限细分成子区域的过程实际上是地理区域的剖分表达过程,这些子区域构成了格网的最基本单元,即格元[9]。多级格网参考系统基于预定义的地理空间坐标系描述规定格元空间位置和相互关系,采用2种投影平面进行格网划分: ①经纬度等分弧秒投影下的平面格网划分; ②球体墨卡托投影下的平面格网划分;二维平面网格结构为标准四叉树正方形规则格网,三维立体网格为标准八叉树立方体规则格网,格元位置编码采用行号、列号和级别组合编码方式,三维立体扩充高程或深度码;时空数据集成,核心要实现将从其他数据源采样或分割重组的数据值或要素集分配给全球多级格网参考系统格元,即格元量化的过程;为了确保多元数据集成时空语义保持一致,制定要素集分解聚合、空间几何数据分割、要素属性数据重组等数据网格剖分策略与规则。

4.2 支撑时空融合的格元量化

在考虑地球大数据空间参考、比例尺、格式、类型、频率或时间影响的前提下,通过规定的量化策略可以支撑从任何数据源采样、切割重组获取地球离散数字模型的离散数据值。从这个角度说,全球多级格网参考系统不仅具备时空参考系功能,同时也是一种低阶空间数据模型。采用特定的方法进行地球表面的同构离散化,基于规律性的离散间隔或网格划分对位置信息(如信号值)进行采样(格元量化),使得分配给每个网格的值中保持原始数据的准确度,并以分辨率逐层提高的离散化网格来模拟地球。该方法提供了一种无缝无叠的多尺度的全球格网结构,从而支持构建一个地球的离散数字模型。
按照区域多种要素聚合、特定类别空间对象集合、单个空间对象、格元不同层次数据剖分组织要求,空间数据网格组织包括3种量化方法与策略, ①数值格元量化,主要针对空间对象以格元的几何图形(格点、格边)来控制采样操作,为格元分配从特征采样/映射得到的数据; ②数据块格元量化,主要针对空间对象集合将空间对象特征值聚合并剪裁到格元边界,并存储为块,而不将单个特征值重新采样或映射到单个格元; ③栅格图像格元量化,主要是由渲染过程产生的图像数据裁切到格元,用于传递到显示系统。格元量化数据也称为瓦片数据,分为栅格瓦片、矢量瓦片、格网瓦片、时序阵列瓦片、三维模型瓦片等类型。

4.3 时空场景数据立方体物化

区别于传统空间数据立方体的概括分析、局部分析、全局分析和旋转分析,地球数据立方体分析应用强调的是在全球统一的时空框架下融合集成多元时空数据,开展多主题、多时相、多尺度的分析。实现途径上主要基于立方体维度模型构建全要素数据堆叠虚拟视图,按照研究空间对象的空间分布、区域差异、尺度变换、时空演变等需求,特别是地球系统多圈层多要素关联的多时空尺度分析应用场景要求,对各类虚拟视图进行物化操作。如,针对全球范围高精度时空数据网格分治和基于网格位置高效检索的应用要求,对立方体固定4个维度进行切块即可构建网格分区立方体。针对多尺度转换、分析及可视化的应用要求,需要对立方体完成维上钻操作,继而在非空间维(时间维/要素属性维)上进行切片,形成金字塔;类似地,还可以形成主题关联集或时间序列集,如图9所示。
图9 矢量数据与时序阵列数据格元量化示意

Fig. 9 The grid cell quantization of the vector data and time series array data

对立方体进行不同的局部分析操作,实际上就得到了不同视角下虚拟视图,即金字塔、专题关联集、以及时间序列集。通过对这些虚拟视图实施物化处理,构建瓦片数据包,实现基于瓦片数据包的金字塔物化组织,进一步从多个主题金字塔瓦片数据包中抽取同一尺度、同一时间的瓦片数据层,实现专题关联集物化组织。从多个时间序列金字塔瓦片数据包中抽取同一尺度、同一主题的瓦片数据层,实现时间序列集物化组织,地球数据立方体的物化过程如图10所示。地球数据立方体物化组织模型包括如下几种类型:
图10 地球数据立方体的物化过程

Fig. 10 The process of the earth data cube materialization

(1)网格分区立方体
网格分区立方体就是通过对立方体固定4个维度进行切块构建,也就是对格网尺度维选取特定的尺度区间、在时间维上选取特定的时间序列、在要素属性维上选取特定的主题集合、在网格位置维上选取一定的网格分区进行切块获得子立方体虚拟视图,如图11所示。
图11 网格分区立方体

Fig. 11 The grid partition cube

(2)金字塔
对立方体进行维上钻操作,聚集时间维和属性维,形成由网格位置维、格网尺度维、时间/要素属性维构成的三维立方体,进一步固定时间/属性维进行切片,从而构建形成金字塔。金字塔是全息地球时空场景立方体物化组织的基本形式,主要是基于全球多级格网参考系统,对多源时空数据通过格元量化方式产生多尺度的栅格瓦片数据集、矢量瓦片数据集、格网瓦片数据集、时序阵列瓦片数据集、三维模型瓦片数据集,并基于金字塔数据组织方式[35],构建出的横向分块、纵向分层的多个层次的行列状结构数据组织结构(图12),其物化组织模型如图13所示。
图12 瓦片金字塔的组织结构

Fig. 12 The organizational and structure of the tile pyramid

图13 地球数据立方体物化组织模型

Fig. 13 The organization model of the earth data cube materialization

(3)主题关联集
对立方体进行维上钻操作,聚集时间维和格网尺度维,形成由网格位置维、格网尺度/时间维、属性维构成的三维立方体,进一步固定格网尺度/时间维进行切片,从而构建形成主题关联集,其物化组织模型同见图13所示。
(4)时间序列集
对立方体进行维上钻操作,聚集要素属性维和格网尺度维,形成由网格位置维、格网尺度/属性维、时间维构成的三维立方体,进一步固定格网尺度/属性维进行切片,从而构建形成时间序列集,其物化组织模型同见图13所示。

5 深时古地形时空动态可视化应用

深时数字地球(Deep-time Digital Earth, DDE)国际大科学计划[36]对标“地学谷歌”提出了“深时地球”的概念,以现代地球为框架整合固体地球领域数据和知识,重建地球46亿年演化史,是对全息地球概念的一个具体实现。深时地球除了需要可视化表达现代地球三维空间之外,还需要能表达古地球地形地貌特征,并且通过地质时间系统结合现代时间系统形成一个四维时空动态可视化模拟系统。古地球地形地貌特征一般采用古地理图来表达,以“古地理要素”为对象,以各地质历史时期大地构造图为基础,在统一时空基准下叠加古地形、岩相、板块等要素数据,形成多尺度、多时相、多要素时空融合场景产品,并在全息地球时空动态可视化认知环境下,开展古地形演化可视化分析,支撑固体地球科学的跨学科研究。针对这一需求本文设计深时地球数据立方体,包括现代地球基础地理框架数据子立方体和深时古地形数据子立方体,分别支撑实现全球大体量、高精度基础地理数据构建现代地球三维场景,以及多个地质时间断面深时古地形数据构建古地球演化场景,具体实现过程包括3个步骤:
(1)数据准备
收集整理现代地球基础地理框架数据,包括全球遥感影像数据(最高分辨率0.5 m,数据量300 TB),全球陆海融合矢量地图数据(包含100亿个点,10亿条线),全球陆海数字高程模型数据(陆地分辨率30 m,海洋分辨率90 m),目标区域高精度倾斜摄影三维模型数据;另外通过文献大数据挖掘、互联网固体地球领域大数据整编以及古地形重建模型计算生成等途径,获取深时古地形数据,包括构造和岩相矢量数据、古地形纹理与古地理图栅格数据、古地形数字高程模型格网数据、板块演化时序数据,时间尺度为百万年,时间覆盖三叠纪-古近纪时期(时间区间为250 ~55 Ma),最大比例尺 1:100万。
(2)模型构建
首先假设现代地球与古地球空间坐标系统保持不变,采用同一多级格网参考系统,对收集的现代地球与古地球多元数据按照“数据集、要素层、空间分辨率/比例尺、时间粒度、时间覆盖、空间覆盖”进行统一梳理,形成所有要素数据集二维表格数据相互堆叠虚拟视图,即深时地球数据立方体虚拟视图。
在此基础上,基于立方体物化操作流程,按照现代地球与古地球两个场景构建要求,分别设置2个网格分区立方体“时间粒度维、时间覆盖维、网格位置维、格网尺度维、要素属性维”度量取值,形成2个子立方体描述的元数据文件;进而采用经纬度等分弧秒投影下的平面网格剖分方法对各要素层数据进行网格剖分与格元量化操作,构建矢量、栅格、格网、三维模型数据金字塔,形成2个物化的瓦片金字塔数据包文件;至此,类似谷歌地球三维场景数据组织模型构建完成,能够实现现代地球全球数据统一组织与尺度推进式按需调用;最后按照深时古地形时间序列分析、专题关联分析的需求,对古地球子立方体物化形成的瓦片金字塔数据,按照时间与主题进行抽取与逻辑重组,进一步形成时间序列集与专题关联集的配置文件,数据组织过程如图14所示。
图14 基于地球数据立方体模型的时空场景数据组织过程

Fig. 14 The spatio-temporal scene data organization based on the earth data cube model

(3)系统开发
基于地球数据立方体模型开发实现了深时古地形时空动态可视化模拟系统,通过装载前述构建的深时地球数据立方体,实现了深时地球多时间断面、多尺度、多要素时空数据一体化整合,并能构建多种模式的时空动态可视化应用场景,支撑数字地球多尺度推进式阅读、多主题关联分析以及地球演化时间序列分析,为固体地球研究提供了一个可视化认知分析环境。
主要功能与实现效果包括:① 现代地球全球陆海融合一张图矢栅一体化组织,二三维一体化尺度推进式阅读,并支持叠加深时古地形数据(图15(a));② 古地球场景基于地质时间轴的古地理图动态时序播放(图15(b)),可在任意时间点暂停、并能实现地质图多尺度推进式浏览数据;③ 古地形场景对象化可交互时空播放,每个板块都是单独的对象,可单独标记和查看,也可在任意时间点暂停浏览空间对象多时序数据(图15(c)); ④ 基于古地形数字高程模型数据的三维立体可视化,既可形象地表达各个地质时期的地形地貌情况,同时也可查看某一区域时序演变情况,支撑地球演化研究(图15(d))。
图15 深时古地形时空动态可视化应用场景示意

Fig. 15 The application case of the deep-time ancient terrain spatio-temporal dynamic visualization

6 结论与展望

数字地球的研究从传统单一圈层扩展到地球系统研究、从第一代可视型数字地球发展到地球系统定量分析,并融合人工智能技术,进入地球人工智能发展阶段,新一代数字地球的内涵、技术架构等发生了深刻变化,而支撑新一代数字地球的数据模型还基本停留在瓦片或地球网格剖分数据模型阶段,严重制约了场景化、智能化数字地球应用。本文提出的全息地球的概念,以及相应的地球数据立方体模型,对于应对地球大数据治理,推动全域、全时、全息数字地球构建提供了解决方案:
一方面,本文采用全球多级格网参考系统来描述和表达多尺度空间,用平面或立体格元来表达空间位置,将传统“经度、纬度、高程、时间”时空表达发展至“时间粒度、时间覆盖、网格位置、格网尺度”新时空表达体系,突出通过格网统筹空间、时间和属性,能够实现基于多级格网参考系统这样一个映射基准,将传统空间、时间、属性维组织的时空数据,处理映射到“时间粒度维、时间覆盖维、网格位置维、格网尺度维、要素属性维”组织的地球数据立方体中,相比于传统栅格或矢量空间数据立方体而言,除了兼容传统非空间维、空间维、数字度量、空间度量的概念和结构之外,拓展了时间尺度、空间尺度维度描述及度量,实现空间配准、尺度对齐、时空有序、语义一致的地球大数据的精准集成和场景建模的深度融合。立方体内含的时间-空间参考系统、格元量化策略等可以提供各类时空数据集所需的地理参考、索引和离散化,特别是层次结构、唯一性、空间分辨率的一致性以及时空语义一致性表示,使它们优于任何单一的替代方案。
另外,以网格位置为核心的空间数据融合集成方案甚至可以被用于取代传统矢量几何的无损编码,使网格及其整数寻址可预测地收敛到每个观测值的实数坐标对,并能进行逐层细化高精度逼近,解决了传统数字地球空间数据矢栅分离、一体化融合集成难的问题。这样一个统一的全息地球数据模型可以集成、聚合和可视化矢量、栅格、格网、时序阵列、三维模型等多模态数据,为解决跨专业地球大数据时空融合集成难的问题提供了解决方案,能够实现诸如测绘地理与地质领域的矢栅要素与三维模型数据,导航与位置服务领域的定位与轨迹数据、气象水文站点实况与数值预报时序阵列数据、太空环境空间目标轨道实时数据等混合多态模型归纳至一个统一模型中,形成跨专业数据在全息地球时空动态应用场景下概念体系与逻辑组织体系统一表述,且能无损兼容已有数据,任何引用特定地球数据立方体中的数据值在时间、空间、尺度都是对齐的,消除复杂数据融合的过程,减少对中间集成商或分析师的依赖,因此大大降低了在传统系统中集成数据的高成本。
当然,基于地球数据立方体解决以上问题本文尚停留在概念模型和逻辑模型阶段,下一步研究将结合具体应用场景设计物理模型,并结合当前GIS软件强大的数据处理功能,开发传统数据向立方体模型转换工具,实现传统数字地球数据到地球数据立方体的无缝转换。除此之外,本文在立方体数据集成语义方面的研究还比较初步,仅描述了统一时空语义框架,关于多尺度空间下地理要素/实体多时序演变语义关联与一致性表达方面尚未进一步进行研究阐述,后续将在地球数据立方体模型中扩展知识图谱表达时空语义的方案,形成全息地球统一时空基准和语义表达的完整建模体系。
未来数字孪生、元宇宙应用离不开时空场景建模,各类时空信息系统建设可以受益于地球数据立方体的发展,特别是近年来发展的全空间智能系统,地球数据立方体将能够为多粒度时空对象建模提供归一化的数据底座;进一步通过地球数据立方体实现与物联网实时数据对接,形成大到地质百万年时间尺度(如DDE的数据)、小到毫秒微秒等精细时间尺度(如自动驾驶物联感知数据)统一时空信息建模能力,为数字孪生地球构建、智慧地球空间智能能力的形成提供强有力的支撑。
[1]
承继成, 郭华东, 薛勇. 数字地球导论[M]. 2版. 北京: 科学出版社, 2007.

[ Cheng J C, Guo H D, Xue Y. Introduction to digital earth[M]. 2nd ed. Beijing: Science Press, 2007.]

[2]
李德仁, 龚健雅, 邵振峰. 从数字地球到智慧地球[J]. 武汉大学学报·信息科学版, 2010, 35(2):127-132,253.

[Li D R, Gong J Y, Shao Z F. From digital earth to smart earth[J]. Geomatics and Information Science of Wuhan University, 2010, 35(2):127-132,253.] DOI:10.13203/j.whugis2010.02.018

DOI

[3]
郭华东, 王力哲, 陈方, 等. 科学大数据与数字地球[J]. 科学通报, 2014, 59(12):1047-1054.

[Guo H D, Wang L Z, Chen F, et al. Scientific big data and digital Earth[J]. Chinese Science Bulletin, 2014, 59(12):1047-1054.] DOI:10.1360/972013-1054

DOI

[4]
Gorelick N, Hancher M, Dixon M, et al. Google earth engine: Planetary-scale geospatial analysis for everyone[J]. Remote Sensing of Environment, 2017, 202:18-27. DOI:10.1016/j.rse.2017.06.031

DOI

[5]
诸云强. 地球系统科学数据共享关键技术研究[M]. 北京: 科学出版社, 2009.

[ Zhu Y Q. Research on key technologies of earth system scientific data sharing[M]. Beijing: Science Press, 2009.]

[6]
马自坤, 黄体杨. 情报学研究中的全息论[J]. 情报科学, 2009, 27(9):1301-1304,1310.

[ Ma Z K, Huang T Y. Holography research in information science[J]. Information Science, 2009, 27(9):1301-1304,1310.]

[7]
王家耀, 武芳, 郭建忠, 成毅, 陈科. 测绘科学[J]. 时空大数据面临的挑战与机遇, 2017, 42(7):1-7.

[ Wang J Y, Wu F, Guo J Z, et al. Science of surveying and mapping[J]. Challenges and opportunities of spatio-temporal big data, 2017, 42(7):1-7.]

[8]
周成虎, 朱欣焰, 王蒙, 等. 全息位置地图研究[J]. 地理科学进展, 2011, 30(11):1331-1335.

DOI

[Zhou C H, Zhu X Y, Wang M, et al. Panoramic location-based map[J]. Progress in Geography, 2011, 30(11):1331-1335.] DOI:10.11820/dlkxjz.2011.11.001

DOI

[9]
周成虎, 欧阳, 马廷. 地理格网模型研究进展[J]. 地理科学进展, 2009, 28(5):657-662.

[ Zhou C H, Ou Y, Ma T. Progresses of geographical grid systems researches[J]. Progress in Geography, 2009, 28(5):657-662.]

DOI

[10]
李德仁, 朱欣焰, 龚健雅. 从数字地图到空间信息网格——空间信息多级网格理论思考[J]. 武汉大学学报·信息科学版, 2003, 28(6):642-650.

[Li D R, Zhu X Y, Gong J Y. From digital map to spatial information multi-grid—a thought of spatial information multi-grid theory[J]. Geomatics and Information Science of Wuhan University, 2003, 28(6):642-650.] DOI:10.3321/j.issn:1671-8860.2003.06.004

DOI

[11]
程承旗, 任伏虎, 濮国梁. 空间信息剖分组织导论[M]. 北京: 科学出版社, 2012.

[ Cheng C Q, Ren F H, Pu G L. Introduction to spatial information division and organization[M]. Beijing: Science Press, 2012.]

[12]
童晓冲. 空间信息剖分组织的全球离散格网理论与方法[J]. 测绘学报, 2011, 40(4):536.

[ Tong X C. The principles and methods of discrete global grid systems for geospatial information subdivision organization[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(4):536.]

[13]
李德仁, 肖志峰, 朱欣焰, 等. 空间信息多级网格的划分方法及编码研究[J]. 测绘学报, 2006, 35(1):52-56,70.

[Li D R, Xiao Z F, Zhu X Y, et al. Research on grid division and encoding of spatial information multi-grids[J]. Acta Geodaetica et Cartographica Sinica, 2006, 35(1):52-56,70.] DOI:10.3321/j.issn:1001-1595.2006.01.011

DOI

[14]
马晓霞. 地理格网参照下的空间数据集成方法研究[D]. 西安: 长安大学.

[ Ma X X. Research on spatial data integration method based on geographical grid reference[D]. Xi'an: Changan University.]

[15]
Moore R, Hansen M. Google Earth Engine: A new cloud-computing platform for global-scale earth observation data and analysis. In, AGU Fall Meeting Abstracts, 2021

[16]
Tamiminia H, Salehi B, Mahdianpari M, et al. Google Earth Engine for geo-big data applications: A meta-analysis and systematic review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 164:152-170. DOI:10.1016/j.isprsjprs.2020.04.001

DOI

[17]
Lewis A, Oliver S, Lymburner L, et al. The Australian Geoscience Data Cube—Foundations and lessons learned[J]. Remote Sensing of Environment, 2017, 202:276-292. DOI:10.1016/j.rse.2017.03.015

DOI

[18]
Battle L, Chang R, Stonebraker M. Dynamic prefetching of data tiles for interactive visualization[C]// Proceedings of the 2016 International Conference on Management of Data. New York: ACM, 2016:1363-1375. DOI:10.1145/2882903.2882919

DOI

[19]
Stefanovic N, Han J W, Koperski K. Object-based selective materialization for efficient implementation of spatial data cubes[J]. IEEE Transactions on Knowledge and Data Engineering, 2000, 12(6):938-958. DOI:10.1109/69.895803

DOI

[20]
Papadias D, Kalnis P, Zhang J, et al. Efficient OLAP operations in spatial data warehouses[M]//Advances in Spatial and Temporal Databases. Berlin, Heidelberg: Springer Berlin Heidelberg, 2001:443-459. DOI:10.1007/3-540-47724-1_23

DOI

[21]
Shekhar S, Tan X. Map Cube: A Visualization Tool for Spatial Data Warehouses. http://www.cs.umn.edu/research/shashigroup/.

[22]
邹逸江. 多维空间分析的关键技术——空间数据立方体[J]. 地理与地理信息科学, 2006, 22(1):12-16.

[Zou Y J. The key technology of multi-dimension spatial analyses: Spatial data cube[J]. Geography and Geo-Information Science, 2006, 22(1):12-16.] DOI:10.3969/j.issn.1672-0504.2006.01.003

DOI

[23]
邹逸江, 李德仁, 王任享. 空间数据立方体分析操作原理[J]. 武汉大学学报·信息科学版, 2004, 29(9):822-826.

[Zou Y J, Li D R, Wang R X. Principle of analytical operation of spatial data cube[J]. Geomatics and Information Science of Wuhan University, 2004, 29(9):822-826.] DOI:10.3321/j.issn:1671-8860.2004.09.017

DOI

[24]
赵春宇. 高性能并行GIS中矢量空间数据存取与处理关键技术研究[D]. 武汉: 武汉大学.

[ Zhao C Y. Research on key technologies of vector spatial data access and processing in high performance parallel GIS[D]. Wuhan: Wuhan University.]

[25]
Nemani R, Votava P, Michaelis A, et al. NASA Earth Exchange: A Collaborative Earth Science Platform. In, AGU Fall Meeting Abstracts, 2010.

[26]
Prasad S K, Aghajarian D, McDermott M, et al. Parallel processing over spatial-temporal datasets from geo, bio, climate and social science communities: A research roadmap[C]// 2017 IEEE International Congress on Big Data (BigData Congress). IEEE, 2017:232-250. DOI:10.1109/BigDataCongress.2017.39

DOI

[27]
Patel J, Ellmann C, Kupsch J, et al. Building a scaleable geo-spatial DBMS: Technology, implementation, and evaluation[C]// Proceedings of the 1997 ACM SIGMOD international conference on Management of data - SIGMOD '97. New York: ACM Press, 1997:336-347. DOI: 10.1145/253260.253342

DOI

[28]
Pekel J F, Cottam A, Gorelick N, et al. High-resolution mapping of global surface water and its long-term changes[J]. Nature, 2016, 540(7633):418-422. DOI:10.1038/nature20584.

DOI

[29]
Stonebraker M, Brown P, Zhang D H, et al. SciDB: A database management system for applications with complex analytics[J]. Computing in Science & Engineering, 2013, 15(3):54-62. DOI:10.1109/MCSE.2013.19

DOI

[30]
Baumann P, Dehmel A, Furtado P, et al. The multidimensional database system RasDaMan[C]// Proceedings of the 1998 ACM SIGMOD international conference on Management of data. New York: ACM, 1998:575-577. DOI:10.1145/276304.276386

DOI

[31]
Fox A, Eichelberger C, Hughes J, et al. Spatio-temporal indexing in non-relational distributed databases[C]// 2013 IEEE International Conference on Big Data. IEEE, 2013:291-299. DOI:10.1109/BigData.2013.6691586

DOI

[32]
Laskin D N, McDermid G J, Nielsen S E, et al. Advances in phenology are conserved across scale in present and future climates[J]. Nature Climate Change, 2019, 9(5):419-425. DOI:10.1038/s41558-019-0454-4

DOI

[33]
张威. 多源空间数据集成方法研究[D]. 郑州: 解放军信息工程大学.

[ Zhang W. Research on integration method of multi-source spatial data[D]. Zhengzhou: PLA Information Engineering University.]

[34]
贾文珏, 安琼. 基于“分治网格”的空间大数据快速分析方法[J]. 计算机工程与设计, 2015, 36(8):2317-2321.

[Jia W J, An Q. Fast method for analysis of big spatial data using divide and conquer grids[J]. Computer Engineering and Design, 2015, 36(8):2317-2321.] DOI:10.16208/j.issn1000-7024.2015.08.060

DOI

[35]
程承旗, 张恩东, 万元嵬, 等. 遥感影像剖分金字塔研究[J]. 地理与地理信息科学, 2010, 26(1):19-23.

[ Cheng C Q, Zhang E D, Wan Y W, et al. Research on remote sensing image subdivision pyramid[J]. Geography and Geo-Information Science, 2010, 26(1):19-23.]

[36]
Wang C S, Hazen R M, Cheng Q M, et al. The Deep-Time Digital Earth program: Data-driven discovery in geosciences[J]. National Science Review, 2021, 8(9): nwab027. DOI:10.1093/nsr/nwab027

DOI

文章导航

/