Orginal Article

Design of Multi-level Grid System for Integrated Scientific Investigation of Resources and Environment

  • BEN Jin , 1, 2, * ,
  • ZHOU Chenghu 2 ,
  • TONG Xiaochong 1 ,
  • ZHANG Yong 1 ,
  • KANG Ning 3 ,
  • WANG Juanle 2
Expand
  • 1. Institute of Surveying and Mapping, Information Engineering University, Zhengzhou 450001, China
  • 2. State Key Laboratory of Resource and Environmental Information System, Institute of Geographic Science and Nature Resource Research, CAS, Beijing 100101, China
  • 3. 61683 Troops, Beijing 100094, China
*Corresponding author: BEN Jin, E-mail:

Received date: 2015-01-04

  Request revised date: 2015-01-28

  Online published: 2015-07-08

Copyright

《地球信息科学学报》编辑部 所有

Abstract

Geographic grid system is a set of related global grids at various scales which tessellate the earth into a hierarchy of areal cells and associated cell points. As a frontier research of geographic information science, geographic grid system is not only a geospatial framework, but also a model for geographical feature expression. According to the needs of data management and sharing in integrated scientific investigation of resources and environment, this paper presents a detailed analysis on Chinese national standard of geographic grid. We discover that according to the standard, the apertures of grids are sometimes too large and incongruous, when they are used in multi-resolution applications. In order to making up the inadequacies, the paper extends the radix between one degree (minute) and one minute (second) from 60 to 64 in logical space, where a formal quadtree-like recursive subdivision can be implemented until the one second grid is reached. Grids finer than one second can also be subdivided in a similar manner and be expressed by taking the negative exponentials of 2 as the interval. The paper also designs the extension encoding scheme for quadtree-like grids, so that it could be compatible with the existing national standard of geographic grid. A prototype of multi-level grid generation and management named GridVis 1.01 is developed to validate the feasibility of the proposed schema. Experiments on the real-time 3D visualization of various resources and environmental data are designed to examine the frame refresh rate of the scenes in GridVis. When the 1-degree-grid is used to organize the national 1:250,000 county administrative region data of China, the GTOPO 30 digital elevation model of China, and the 1 km spacing national vegetation cover data of China respectively, the frame refresh rate is 33~52 frames/second (FPS). When the 10-minutes-grid is used to organize the 1 km spacing national land use data, the average frame refresh rate is 30 FPS. When the 1 km grid is used to match the 1 km spacing population data of Ansai county (which locates within Yanan city of Shanxi province), the average frame refresh rate is 50 FPS. All the experimental results suggest that the proposed schema could satisfy the demands of real-time applications.

Cite this article

BEN Jin , ZHOU Chenghu , TONG Xiaochong , ZHANG Yong , KANG Ning , WANG Juanle . Design of Multi-level Grid System for Integrated Scientific Investigation of Resources and Environment[J]. Journal of Geo-information Science, 2015 , 17(7) : 765 -773 . DOI: 10.3724/SP.J.1047.2015.00765

1 引言

我国幅员辽阔,资源、环境空间分布格局复杂多样。为了掌握资源环境本底及其变化状况,国家已组织开展了一系列大规模的综合科学考察与调查工作,如青藏高原科学考察[1]、黄土高原科学考察[2]等。然而,由于每次科学考察与调查在时间周期、空间范围、调查内容与技术规程等方面存在极大的差异,没有统一的规范指导,很难将外业获取的珍贵资料综合集成,形成时间连续、空间完整、内容一致的系统科学数据,也很难基于不同时期的数据进行区域资源与环境动态变化分析,不能发挥这些科学考察与调查成果的综合优势与长期效应[3]。因此,为了满足综合科学调查数据持续积累与利用的需求,迫切需要建立合适的数据集成管理框架。
地理格网系统借助特定方法将地球表面均匀剖分,形成无缝无叠的多分辨率格网层次结构,是能“容纳”自然和人文数据的“第三边界”。地理格网系统既是一个空间框架,也是地理特征表达的一种模型[4],为不同尺度多源资源环境数据的集成和分析提供了有效途径。
目前,地理格网系统大致划分为地理坐标的格网系统、自适应格网系统和多面体剖分的格网系统3类[5],具体内容涉及剖分方案设计、格网互操作、误差分析、编码与索引、空间分析等。(1)地理坐标的格网系统采用规则的经纬线将地表递归剖分成若干格网单元,是目前许多数据集、算法的基础。其主要不足表现在:两极地区单元退化严重,不利于数据存储和表达;矩形格网邻近关系定义不严格,不利于空间分析[6]。(2)自适应格网系统是以地表实体要素为基础,按照实体的某种特征构建不规则格网,其特性导致这类格网只适合单一应用,很难进行空间数据的多尺度关联及其他操作[7]。(3)多面体剖分的格网系统在正多面体表面进行层次递归剖分后,借助特定方法映射到地表,形成全球连续、近似均匀的多分辨率球面层次格网。这类格网系统既有效避免了经纬度格网表达全球数据时出现的冗余,又克服了自适应格网无法进行层次关联的缺陷,具有处理全球多分辨率海量空间数据的潜力[5]。其主要不足是格网结构与现有空间数据组织方法不完全兼容,需要进行适当转换[8]
对于格网剖分组织框架,国内外已有较多研究成果。Goodchild、Kimerling等提出了评价格网系统的一系列指标,如格网无缝无叠地覆盖全球、单元面积(形状)相同等[9-10]。但由于地球(参考椭球)具有特殊几何属性,任何一个格网系统都不可能同时满足所有指标。而在实际应用中,对各种指标的要求也不一样,合适的格网系统应根据需要在各种指标之间取得平衡。
鉴此,本文结合资源环境综合科学考察数据管理与共享的需求,设计了地理坐标的格网系统,其可兼容现有规范,且能形成四叉树的层次格网结构,便于计算机处理。

2 多级格网规范的设计

在资源环境综合科学调查中引入格网系统的主要目的是为了规范、统一各类资源环境科学调查数据的空间基准,从而保证各类数据采集、存储、统计、分析和共享的一致性,并提供多源、多尺度地理空间信息整合的规范和定位框架,因此格网系统设计需考虑与数据管理和应用相关的因素多级格网规范设计的主要原则,可概括为4个方面:
(1)有利于资源环境科学调查数据存储。格网系统应以常用坐标系统为空间参考基准,最大限度地兼容现有各种数据和成果;不同层级的格网能易与现有资源环境调查相关的标准、规范兼容,避免不同格网体系之间的频繁转换。
(2)有利于资源环境科学调查数据表达。格网系统中同一层级单元的形状和结构应存在对应关系,可按单元最大/最小面积比、最大/最小边长比、单元形状变形率等指标定量评价某一种格网系统的变形。由于当前地形图分幅、遥感影像均采用矩形格网组织数据,因此,格网单元的形状应为矩形,便于现有成果的继承和数据多尺度表达。
(3)有利于资源环境科学调查数据索引。格网系统应具有严密的多分辨率层次结构,大到全球小到厘米级单元都有编码。在数据检索时,可根据应用尺度确定对应的剖分层级,计算被检索区域包含的所有格网单元,再以编码查找存储的实体数据。
(4)有利于资源环境科学调查数据服务。格网系统与地理坐标之间的转换关系应尽量简单,便于完成位置服务的数据检索与分发应用等。不同尺度的格网单元应与现有地球空间信息服务标准或规范兼容。

2.1 国家地理格网现有标准分析

目前,美国、英国、加拿大等国家都建立了自己的国家地理格网。我国于20世纪80年代开始这方面的研究,2009年相关部门更新发布了推荐性国家标准“地理格网”(GB/T 12409-2009,以下简称为“国标”)[11-12]。国标的颁布,为我国地理空间数据的生产和共享提供了统一的规范,促进了多源、多尺度地理空间信息的整合与应用,在第二次全国土地调查、地理国情监测等多个重大工程发挥了重要作用[13-14]。尽管如此,在实际应用中,国标仍暴露出一些不足。例如,它只规定了“经纬坐标格网”的基本层级( 1 ° 1 0 1 1 1 0 )和“直角坐标格网”的基本层级(100 km、10 km、1 km、100 m、10 m、1 m),而对相邻层级之间的层次隶属关系,不同层级格网之间的过渡等涉及多分辨率应用的问题则采用隐含(默认)方案,缺乏必要的说明。
资源环境综合科学调查获取的数据种类繁多,主要包括自然地理背景要素(水文、土壤、地形地貌、气候、交通、居民地等)、自然资源与环境要素(水资源、水环境、土地资源、土地利用/覆盖、气候资源、生物资源等)、社会经济与人居环境要素(人口、社会经济、人居环境等)[15]。这些多源、异构数据的空间尺度差别较大,数据分布粒度与基本层级格网匹配的情况极少,绝大多数的粒度在相邻两层级之间。直接采用国标所面临的突出问题主要概括为2方面:
(1)基本层级格网的孔径较大,数据匹配困难。“孔径”(aperture)是定量描述格网系统分辨率渐变速率的指标,定义为相邻层次格网单元的面积比[6]。在多分辨率应用中,小孔径格网系统的分辨率过渡比大孔径格网系统更平滑,这一特性有助于空间数据的多分辨率表达和处理[6]。对于四边形格网系统,可能的孔径是 n 2 ( n Z * , n 2 Z * 是正整数集合 ) ,最小孔径为4。而国标中由基本层级格网隐含构成的格网系统的孔径较大。如图1所示,从 1 ° 1 0 格网的孔径是36,即一个 1 ° × 1 ° 的格网细分为36个 1 0 × 1 0 的格网;从 1 0 1 格网的孔径是100,即一个 1 0 × 1 0 的格网细分为100个 1 × 1 的格网。在 1 0 1 的格网上也存在同样的规律。较大的孔径极易导致数据与格网匹配时出现“上层格网过粗、下层格网过密”的情况。
虽然国标中也规定在基本层级格网的基础上可进一步剖分,扩展出更小间隔的格网,但为了保证“细分格网间隔与相邻基本层级格网间隔成倍数关系”[11],仍不可避免地会出现孔径过大的情况。为了保证剖分后的格网与 1 0 构成整数关系, 1 ° 格网只能进行孔径为4或9的剖分,产生的 3 0 2 0 格网继续进行孔径为9或4的剖分,得到 1 0 基本层级格网(图2)。同理,为了保证剖分后的格网与 1 ° 构成整数关系, 1 0 格网只能进行孔径为4或25的剖分,产生的 5 2 格网继续进行孔径为25或4剖分,得到 1 基本层级格网。在从 1 ° 1 格网的扩展过程中,均会出现孔径为25的剖分。
Fig. 1 Apertures for basic levels in national standard of geographic grid

图1 国标基本层级格网孔径示意图

(2)基本层级格网的孔径不一致,层次关系复杂。多分辨率层次格网可用一颗规则的“树”结构表示[16]。低分辨率(大尺度)的格网单元是树上的“父”节点,其下又派生出若干高分辨率(小尺度)的格网单元,即“子”节点。一个父节点派生出子节点的数目与格网系统的孔径一致,例如,常见的孔径为4的格网系统,与应用最广泛的“四叉树”结构对应。因此,格网单元的编码、运算、索引等操作,不仅能和四叉数的相关算法结合,还能采用效率极高的二进制运算实现。
在国标中,由于不同层级格网之间的孔径不同,故对应树结构的层次关系不一致。以图2为例, 1 ° 格网与 3 0 格网是1:4的层次关系, 3 0 格网与 1 0 格网是1:9, 1 0 格网与 5 格网是1:4, 5 格网与 1 格网是1:25。因此, 1 ° 格网与 1 格网的层次关系是一颗1:4:9:4:25的不规则树结构。如果格网剖分至 1 ,层次结构更加复杂,这必然会增加格网操作的复杂度,从而降低数据处理效率。
Fig. 2 Extension scheme for national standard of geographic grid

图2 国标扩展示意图

2.2 国标的扩展

国标从人的认知习惯出发,将全球细分为整数度、整数分、整数秒间隔的格网。但由于度、分、秒之间是六十进制,而基本格网中包含了十进制的 1 0 1 0 的格网,在建立格网层次关系过程中,必然出现孔径过大且不一致的问题。
(1)剖分方案的扩展。北京大学程承旗研究团队提出了 2 n 一维整型数组的全球经纬剖分格网GeoSOT(Geographic coordinate Subdividing grid with One dimension integral coding on 2 n Tree)[8,17-18],为解决上述问题提供了可供借鉴的思路。为便于格网进行四叉树剖分,可将国标中 1 ° 基本格网的间隔从 6 0 扩展到 6 4 作为“ ' ”级格网的第0层(根节点),如图3所示。其中, [ 0 , 6 0 1 ° 物理度量空间的 6 0 对应, 6 0 , 6 4 ] 则是逻辑上的“虚拟”扩展区间,仅用于支持递归剖分编码,不与物理度量空间对应。在根节点的基础上进行四叉树剖分,得到第1层4个大小为 3 2 × 3 2 的格网。第2层格网剖分原则依此类推,到第6层得到 1 × 1 的格网,与国标中的基本格网一致。类似地,将国标中 1 基本格网的间隔从 6 0 扩展到 6 4 作为“ ”级格网的第0层(根节点)。这样,从 1 ° 1 的基本格网之间的层次关系均扩展为规则的四叉树,便于计算处 理。各层级单元总数及在赤道附近的边长如表2 所示。
Fig. 3 Extension scheme of 1° grid cell

图3 1°格网扩展示意图

Tab. 2 Statistical results of edge lengths for different grid cells

表2 扩展格网的边长统计表

层级 ' ”级格网 ”级格网
格网间隔 赤道附近边长(km) 格网间隔 赤道附近边长(m)
1 32 64 32 1000
2 16 32 16 512
3 8 16 8 256
4 4 8 4 128
5 2 4 2 64
6 1 2 1 32
对于国标中的直角坐标格网,可采用类似的扩展方案。将国标中100 km基本格网的间隔扩展到160 km作为第0层(根节点),如图4所示。其中,[0, 100]与100 km的物理度量空间对应,(100, 160]则是逻辑上的虚拟扩展空间,不与物理度量空间对应。在根节点的基础上进行四叉树剖分,得到第1层4个大小为80 km×80 km的格网。第2层剖分依此类推,到第4层得到国标中10 km×10 km的基本格网。其他10 km、1 km、100 m、10 m的基本格网都可按照上述方案进行扩展。
Fig. 4 Extension scheme of the 100 km grid cell

图4 100 km格网扩展示意图

(2)编码方案的扩展。对上述四叉树剖分格网,最简便的方法是采用4个码元按层次标识每个单元,形成一维“四位码元”编码;也可采用2个码元标识每个单元的南北或东西位置,形成二维“二位码元”编码[19]。需要注意的是,由于(60, 64]是虚拟区间,不应承载数据,编码过程中需要判断单元有效性。上述2种方案充分利用了四叉树的特点,产生的编码便于计算机高效处理[20]。因此,在软件系统内部采用这些编码有助于提高计算效率。但对于最终成果,为了和用户交换、共享数据,则必须与国标编码方案最大限度地保持兼容。
间隔大于 1 的格网,尽管剖分方案发生了变化,但国标的编码思想依然适用,采用“象限码+格网间隔码+间隔单位码+经纬度码”的组合进行扩展即可。更小间隔(更高分辨率,小于 1 )格网的编码,无法通过现有国标的方案扩展。为了满足资源环境调查数据多尺度管理的要求,必须加以完善。考虑到格网是严格按照四叉树向下剖分,秒级以下格网的间距必定是 1 2 n = 2 - n ,因此,规定“格网间隔代码”可为负数,表示秒级以下格网的层次( - n )。根据资源调查数据管理和处理的精度要求,规定 n 6 ,对应的格网间距约为0.5 m。例如,某点位于 ( 75 4 1 15.123 4 N , 143 0 2 35.567 8 E ,其秒级以下格网的编码如图5所示。这一扩展方案融合了GeoSOT编码的思想,且简单、直观,更适合人的解读。
Fig. 5 Extension scheme for encoding cells which is finer than 1

图5 秒级以下格网编码扩展示意图

3 多级格网软件原型系统

为了验证上述剖分、编码扩展方案的可行性和正确性,作者设计了“资源环境综合科学调查多级格网原型系统”GridVis 1.01,软件结构如图6所示。其中,大地测量与地图投影计算模块实现椭球面几何及高斯-克吕格投影计算功能;格网单元剖分与编码模块依据扩展方案实现经纬度的全球四叉树剖分并计算每个格网单元的编码;格网索引与空间分析模块实现编码的层次空间索引和一些基本的空间分析功能;格网生成与多尺度转换模块根据指定区域和层级查找并生成局部格网数据;数据I/O接口负责导入资源环境科学考察与调查数据,输出处理结果等;格网单元剪裁与调度模块,根据用户的请求快速查找兴趣范围内的单元集合,并访问其中包含的数据。与各项功能相关的算法封装在各个功能模块中,便于维护。软件系统通过组件服务的形式支持各类典型应用,目前具备数据预处理、格网生成、数据实时浏览等功能。
Fig. 6 Framework of prototype

图6 原型系统结构示意图

格网数据三维实时浏览主要用来验证格网编码和索引效率,格网单元剪裁与调度模块,借助四叉树剖分建立不同层次单元的细节层次(Level of Detail,LOD)模型,在场景绘制中根据视点位置和视锥体,以及地球遮挡情况动态调度和更新单元数据。场景绘制模块采用多线程机制,将数据调度线程和数据绘制线程分开,尽可能减少共享数据操作,降低同步锁的粒度。目前,处理器中多计算单元即多核CPU已经成为主流,为了利用多核的硬件优势,对数据调度线程中单元数据的处理(如DEM顶点插值、遥感影像的重采样等)采用异步计算和线程池的模式,提高计算效率,其原理如图7所示[21]
Fig. 7 Scheme of 3D scene rendering

图7 场景绘制原理示意图

借助GridVis,采用不同尺度矢量数据生成的各类格网见图8-10。经测试,分别采用 1 ° 格网组织全国1:25万县级行政区矢量数据、全国GTOPO 30 DEM数据、全国1 km栅格植被覆盖数据,三维场景刷新率为33~52 FPS采用 1 0 格网组织全国1 km栅格土地利用数据,三维场景平均刷新率约为30 FPS;采用1 km格网与安塞县1 km栅格人口数据匹配,三维场景平均刷新率约为50 FPS。以上实验说明,本文的设计方案能完全满足实时应用的需求(部分结果如图11所示)。
Fig. 8 Geographical grids of basic levels generated from 1:4 000 000 boundary data of China

图8 全国1:400万矢量国界基本格网

Fig. 9 Geographical grids of 1 and 2 generated from 1:250 000 vector data of Ansai county

图9 安塞县1:25万矢量行政区分级、秒级格网

Fig. 10 Rectangular grids (6° Gauss-Krüger projection) generated from 1:250 000 vector data of Ansai county

图10 基于安塞县1:25万矢量数据生成的直角坐标格网(高斯-克吕格6°带投影)

Fig. 11 Real-time three dimensional browsing of resources and environment data based on multi-level grids

图11 基于多级格网的资源环境数据三维实时浏览

4 结语

资源环境综合科学调查数据格网化管理是一项复杂的系统工程,需数据主管、生产、应用部门突破传统思维,从全新的角度认识、了解这项工作。本文结合资源环境综合科学调查数据管理和共享的需求,设计了虚拟剖分扩展方案,使格网能完全按照四叉树结构进行剖分和编码。通过软件系统的研制,验证了剖分编码方案的可行性,实现了多级格网可视化表达。在这一数据组织框架下,以多级剖分地理格网为基础,有效地表达自然资源、环境、人口与社会经济等综合科学调查数据资源是下一步研究的重点。

The authors have declared that no competing interests exist.

[1]
张荣祖,郑度,杨勤业.西藏自然地理[M].北京:科学出版社,1982:1-6.

[2]
李锐. 中国黄土高原研究与展望[M].北京:科学出版社,2008:1-2.

[3]
王卷乐,朱立君,孙崇亮.资源环境综合科学考察中的多维数据集成管理模式研究与实践——以中国北方及其毗邻地区综合科学考察为例[J].自然科学学报,2011,26(7):1129-1137.

[4]
周成虎,欧阳,马廷.地理格网模型研究进展[J].地理科学进展,2009,28(5):657-662.

[5]
张永生,贲进,童晓冲.地球空间信息球面离散网格——理论、算法及应用[M].北京:科学出版社,2007:1-10.

[6]
Sahr K, White D, Kimerling J.Geodesic discrete global grid systems[J]. Cartography and Geographic Information Science, 2003,30(2):121-134.

[7]
赵学胜,侯妙乐,白建军.全球离散格网的空间数字建模[M].北京:测绘出版社,2007:5-6.

[8]
程承旗等. 空间信息剖分组织导论[M].北京:科学出版社,2012:56-67.

[9]
Goodchild M.Geographical grid models for environmental monitoring and analysis across the globe[C]. Proceedings of GIS/LIS’ 94 Conference, Arizona: Phoenix, 1994.

[10]
Kimerling A, Sahr K, White D, et al.Comparing geometrical properties of global grids[J]. Cartography and Geographic Information Systems, 1999,26(4):271-288.

[11]
中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.地理格网(GB/T 12409-2009)[M].北京:中国标准出版社,2009:1-24.

[12]
白凤文,许华燕.国家地理格网在数字城市建设中的应用[J].测绘通报,2012(4):92-94.

[13]
中华人民共和国国土资源部.第二次全国土地调查主要数据成果[EB/OL].

[14]
张静,兀伟,吴家付.基于地理格网的地理国情信息统计分析初探[J].测绘技术装备,2014(1):74-76.

[15]
中国科学院资源环境科学数据中心.数据产品[EB/OL].2014.

[16]
Samet H.Foundations of Multidimensional and Metric Data Structures[M]. California: Morgan Kaufmann, 2006:28-38.

[17]
宋树华,程承旗,濮国梁,等.全球遥感数据剖分组织的GeoSOT网格应用[J].测绘学报,2014,43(8):869-876.

[18]
程承旗,郑承迅.一种基于经纬度的地理网格剖分及聚合方法[P].中华人民共和国:2012100309336,2014.04.16.

[19]
周明亚. 地球空间剖分编码代数模型及应用初探[D].北京:北京大学,2013.

[20]
金安,程承旗.基于全球剖分网格的空间数据编码方法[J].测绘科学技术学报,2013,30(3):284-287.

[21]
康宁,基于GPU的全球地形实时绘制技术[D].郑州:解放军信息工程大学,2007.

Outlines

/